[4] Factorizable Net: An Ecient Subgraph-based Framework for Scene Graph Generation

2023. 3. 7. 21:24·Paper Review/Image Scene Graph Generation
728x90
반응형

논문 링크 : https://www.ecva.net/papers/eccv_2018/papers_ECCV/papers/Yikang_LI_Factorizable_Net_An_ECCV_2018_paper.pdf

​

Github : https://github.com/yikang-li/FactorizableNet

 

 

<Introduction>

이 논문에서는 장면 그래프를 간결하게 표현하는 subgraph를 생성 한 후 전체 장면 그래프를 생성하는 방법을 제안합니다. 전체 그래프를 여러개의 하위 그래프로 분할함으로써 방대한 relationship을 적은 수의 subgraph로 표현하고 계산량 감소, 속도 향상등의 효과를 얻을 수 있습니다.

이전 연구들은 각 트리플마다 영역을 따로 생성하였습니다. 그러나 이런 방식은 그림에서 보듯이 상당히 많은 부분 영역이 중복되었고 이는 물체와 관계수가 증가하면 feature수 증가하고 그로 인해 연산 속도와 성능 감소하는 결과를 가져왔습니다. 따라서 본 논문에서는 중첩된 영역을 찾아 표현법을 공유하였으며, 이로 인해 feature수가 감소하고 연산 속도를 증가 시킬 수 있었습니다.​​

추가로, Spatial-weighted Message Passing(SMP)라는 Object feature와 subgraph feature사이의 message passing 모듈과 Spatial-sensitive Relation Interface(SRI)라는 Relationship을 인식하기 위한 모듈을 설계 하였습니다.

​

​

<Model>

전체 구조도

1) Image and RPN proposals

물체 영역 제안을 위해 Region Proposal Network(RPN)이용

​

2) Fully-connected Graph

가능한 모든 물체 쌍들을 연결하여 완전 연결 그래프 생성

모든 물체 쌍들을 연결하기 때문에 물체 영역들이 많이 제안될수록 계산이 느려지고 성능이 저하되게됨

=> 이를 해결하기 위해 다음 단계에 Subgraph생성

​

3) Subgraph-based Representation

서론의 그림에서 볼 수 있듯이 많은 영역이 중복됨 => 중복되는 영역은 공유

중복되는 영역 중 가장 대표 영역을 정하기 위해 아래와 같은 과정 수행

1. Confidence score와 Object의 union box이용

2. Confidence score: object제안 점수의 곱

3. Union box들 간의 NMS를 적용하여 최적의 union box를 구함

=>완전 연결된 subgraph생성

​

4) ROI-pooling and Feature Preparation

subgraph와 object에 해당하는 feature를 찾기 위해 ROI-Pooling 수행

=> subgraph의 공간적 정보 유지를 위해 2차원 feature-map 사용

=> subgraph의 feature가 여러 관계 추론에 의해 공유되어 사용되기 때문에 2차원 feature-map은 영역을 보다 일반적인 표현을 학습할 수 있게됨.

​

5) Spatial - weighted Message Passing

Spatial-weighted Message Passing(SMP)

Obj feature와 subgraph feature사이의 message passing 모듈

- Obj feature: Subgraph feature와 target object feature를 이용해 업데이트

- Subgraph feature: obj feature와 subgraph feature이용해 업데이트

Spatial-sensitive Relation Interface(SRI)

Relationship을 인식하기 위한 모듈

​

6) Object and Relation Recognition

물체와 관계 인식

​

​

<Result>

Visual Relationship Detection(VRD)와 Visual Genome 두 가지 사용

Visual Genome dataset에는 많은 노이즈 포함 = > cleansing하여 사용

성능 또한 개선되었고 속도면에서도 다른 모델들에 비해 향상된 것을 알 수 있습니다.

​

​

<결론>

- subgraph를 사용하는 장면 그래프 생성 모델인 F-Net(Factorizable Network)제안

=> 추론하는 동안 중복되는 영역의 표현수를 줄이기 위해 간결한 subgraph 사용

- subgraph의 정보를 유지하기 위해 2차원 feature-map사용

- 추가로 이 feature-map을 사용하는 Spatial-weighted Message Passing(SMP) 모듈과 Spatial-sensitive Relation Interface(SRI)라는 모듈을 설계

 
728x90
반응형
저작자표시 (새창열림)

'Paper Review > Image Scene Graph Generation' 카테고리의 다른 글

[6] Exploring the Semantics for Visual Relationship Detection  (0) 2023.03.07
[5] Graph R-CNN for Scene Graph Generation  (0) 2023.03.07
[3] Scene Graph Generation from Objects, Phrases and Region Captions  (0) 2023.03.06
[2] Neural Motifs: Scene Graph Parsing with Global Context  (0) 2023.03.06
[1] Scene Graph Generation by Iterative Message Passing  (0) 2023.03.06
'Paper Review/Image Scene Graph Generation' 카테고리의 다른 글
  • [6] Exploring the Semantics for Visual Relationship Detection
  • [5] Graph R-CNN for Scene Graph Generation
  • [3] Scene Graph Generation from Objects, Phrases and Region Captions
  • [2] Neural Motifs: Scene Graph Parsing with Global Context
ga.0_0.ga
ga.0_0.ga
    반응형
    250x250
  • ga.0_0.ga
    ##뚝딱뚝딱 딥러닝##
    ga.0_0.ga
  • 전체
    오늘
    어제
    • 분류 전체보기 (181)
      • Paper Review (51)
        • Video Scene Graph Generation (6)
        • Image Scene Graph Generation (18)
        • Graph Model (5)
        • Key Information Extraction (4)
        • Fake Detection (2)
        • Text to Image (1)
        • Diffusion Personalization (4)
        • etc (11)
      • AI Research (49)
        • Deep Learning (30)
        • Artificial Intelligence (15)
        • Data Analysis (4)
      • Pytorch (10)
      • ONNX (5)
      • OpenCV (2)
      • Error Note (34)
      • Linux (2)
      • Docker (3)
      • Etc (7)
      • My Study (16)
        • Algorithm (10)
        • Project (4)
        • Interview (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    fine tuning
    Activation Function
    HRNet
    permute
    오차 역전파
    알고리즘
    나이브 베이즈 분류
    linear regression
    pytorch
    forch.nn.functional
    활성화 함수
    dataset
    ONNX
    i3d
    TypeError
    JNI
    RuntimeError
    3dinput
    Logistic regression
    transformer
    차원의 저주
    tensorflow
    GCN
    contiguous
    torch.nn
    dataloader
    정규화
    그래프신경망
    Inductive bias
    pandas
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
ga.0_0.ga
[4] Factorizable Net: An Ecient Subgraph-based Framework for Scene Graph Generation
상단으로

티스토리툴바