[5] Graph R-CNN for Scene Graph Generation

2023. 3. 7. 21:25·Paper Review/Image Scene Graph Generation
728x90
반응형

논문 링크 : https://openaccess.thecvf.com/content_ECCV_2018/papers/Jianwei_Yang_Graph_R-CNN_for_ECCV_2018_paper.pdf

​

Github : https://github.com/jwyang/graph-rcnn.pytorch

 

<Introduction>

이 논문은 그래프 신경망(Graph Neural Network)을 이용하여 장면 그래프를 생성하는 Graph r-cnn모델에 대한 논문입니다. 기존 대부분의 논문에서는 Message Passing을 위해 주로 RNN계열의 신경망에 의존하고 했습니다. 본 논문에서는 Graph Convolutional Network(GCN)을 이용해 이미지에 등장하는 물체와 관계 사이에 맥락 정보를 교환하고 추론합니다.

추가로 Relational Proposal Network(RePN)이라는 네트워크도 제안합니다. 기존의 연구들은 물체 영역 n개가 주어지면 가능한 모든 물체 쌍들(약 n^2)에 대해 관계를 판별하였습니다. 때문에 제안되는 영역의 수가 많으면 학습이 오래 걸리게 되고 성능 저하의 원인이 될 수 있습니다. 본 논문에서는 이를 해결하기위해 수 많은 물체 쌍들 중에서 의미있는 물체 쌍들만 골라내주는 Relational Proposal Network를 제안합니다. 아래 그림은 제안하는 모델의 간단한 순서도입니다.

​

​

<Model>

전체 구조도

1) Object Proposal

Faster R-CNN을 이용하여 등장하는 물체들의 영역 제안

​

2) Relational Proposal Network

약 n^2개의 물체 쌍들 중에서 의미있는 물체쌍들만 제안

=> 각 물체 영역의 추정 클래스 분포를 이용하여 물체 쌍들 간의 연관성을 추론("자전거-바퀴"의 연관성은 "바퀴-나무"의 연관성보다 클 것)

=> 주어 물체와 목적어 물체 영역의 클래스 분포를 서로 다른 MLP를 거친 후 score를 계산

=> score를 내림차순으로 정렬하여 상위 k 선택

그 후 남은 물체 쌍들끼리 NMS연산을 하여 겹침 정도가 큰 물체 쌍들은 같은 물체 쌍이라 보고 제거

=> 최종적으로 남은 물체 쌍들끼리 그래프 생성(물체 노드와 관계 노드 생성)

​

3) Attentional GCN

- Attentional GCN을 이용해 이웃 물체, 관계들과 맥락 정보 교환

=> edge에 attention을 적용해 이웃 노드들 간의 정보를 차등적으로 반영

​

=> 물체 노드는 주어 물체 노드 ↔ 목적어 물체 노드(skip-connection), 주어 물체 노드 ↔ 관계 노드, 목적어 물체 노드 ↔ 관계 노드사이에서 맥락 정보 교환

=> 관계 노드는 주어 물체 노드 ↔ 관계 노드, 목적어 물체 노드 ↔ 관계 노드사이에서 맥락 정보 교환

이러한 GCN을 이용한 추론 과정을 총 2번 거침

=> 첫번째는 visual feature만을 이용하여 추론(visual aGCN)

=> 두번째는 visual aGCN의 각 노드의 최종 특징 값을 분류기를 거친 후 얻은 클래스 분포값을 이용하여 추론한(semantic aGCN)

​

​

<Result>

- Visual Genome 데이터 집합 이용

- 이전 논문들과 동일한 평가 지표를 사용하나 SGGen+라는 새로운 평가지표 제안

(기존 SGGen : <object, relationship, subject>세가지 모두 맞아야 정답으로 인정

SGGen+ : 맞게 예측한 object + 맞게 예측한 predicate + 옳은 <triplet> )

​

다른 모델들과 비교하였을 때 가장 높은 성능을 보이는 것을 확인할 수 있습니다.

​

​

<결론>

- 그래프 신경망을 이용하는 Graph R-CNN이라는 새로운 장면 그래프 생성 모델 제안

- 과도하게 많은 물체 쌍들을 걸러내기 위해 MLP로 구성된 Relational Proposal Network(RePN) 제안

- 기존 평가 지표중 하나인 SGGen을 개선하여 좀 더 포괄적인 SGGen+라는 평가 지표 제안

​

 
728x90
반응형
저작자표시 (새창열림)

'Paper Review > Image Scene Graph Generation' 카테고리의 다른 글

[7] Scene Graph Generation with External Knowledge and Image Reconstruction  (0) 2023.03.07
[6] Exploring the Semantics for Visual Relationship Detection  (0) 2023.03.07
[4] Factorizable Net: An Ecient Subgraph-based Framework for Scene Graph Generation  (0) 2023.03.07
[3] Scene Graph Generation from Objects, Phrases and Region Captions  (0) 2023.03.06
[2] Neural Motifs: Scene Graph Parsing with Global Context  (0) 2023.03.06
'Paper Review/Image Scene Graph Generation' 카테고리의 다른 글
  • [7] Scene Graph Generation with External Knowledge and Image Reconstruction
  • [6] Exploring the Semantics for Visual Relationship Detection
  • [4] Factorizable Net: An Ecient Subgraph-based Framework for Scene Graph Generation
  • [3] Scene Graph Generation from Objects, Phrases and Region Captions
ga.0_0.ga
ga.0_0.ga
    반응형
    250x250
  • ga.0_0.ga
    ##뚝딱뚝딱 딥러닝##
    ga.0_0.ga
  • 전체
    오늘
    어제
    • 분류 전체보기 (181)
      • Paper Review (51)
        • Video Scene Graph Generation (6)
        • Image Scene Graph Generation (18)
        • Graph Model (5)
        • Key Information Extraction (4)
        • Fake Detection (2)
        • Text to Image (1)
        • Diffusion Personalization (4)
        • etc (11)
      • AI Research (49)
        • Deep Learning (30)
        • Artificial Intelligence (15)
        • Data Analysis (4)
      • Pytorch (10)
      • ONNX (5)
      • OpenCV (2)
      • Error Note (34)
      • Linux (2)
      • Docker (3)
      • Etc (7)
      • My Study (16)
        • Algorithm (10)
        • Project (4)
        • Interview (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    linear regression
    나이브 베이즈 분류
    JNI
    정규화
    GCN
    pytorch
    contiguous
    tensorflow
    3dinput
    RuntimeError
    i3d
    차원의 저주
    torch.nn
    transformer
    Activation Function
    오차 역전파
    ONNX
    fine tuning
    TypeError
    Logistic regression
    pandas
    permute
    HRNet
    dataloader
    forch.nn.functional
    그래프신경망
    Inductive bias
    dataset
    알고리즘
    활성화 함수
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
ga.0_0.ga
[5] Graph R-CNN for Scene Graph Generation
상단으로

티스토리툴바