[16] Deep Variation-structured Reinforcement Learning for Visual Relationship Detection

2023. 3. 8. 22:56·Paper Review/Image Scene Graph Generation
728x90
반응형

논문 링크 : https://openaccess.thecvf.com/content_cvpr_2017/papers/Liang_Deep_Variation-Structured_Reinforcement_CVPR_2017_paper.pdf

​

Github : https://github.com/nexusapoorvacus/DeepVariationStructuredRL

 

 

<Introduction>

이 논문은 강화학습을 이용하여 scene graph 생성하는 모델인 "Deep variation-structured Reinforcement Learning(VRL)"를 제안한 논문입니다. 또한, 관계만 예측하던 다른 연구들과는 다르게 물체의 속성도 함께 예측합니다.

▶강화학습 알고리즘 중 하나인 Deep Q-Learning을 사용하여 장면 그래프를 생성합니다.

=> 주어 물체의 속성 예측(color, shape, pose)

=> 목적어 물체 예측 (people, places, parts of objects.)

=> 주어 물체와 목적어 물체의 관계 예측 (spatial,compositional, action)

▶효과적인 state vector추출법 제안

​

​

​

<Model>

전체 구조도

1) Object Detection

- Faster R-CNN 이용

- S: object instance

-각 object의 confidence score-> 초기 정보들을 바탕으로 relation과 attribute 분류

​

2) Directed Semantic Action Graph

데이터 집합으로 부터 가능한 물체의 클래스, 집합, 관계들을 미리 사전에 저장하여 그래프로 생성한 것

​

3) Variation-structured RL

-Variation-structured action space.

- Q-Learning 사용

앞서 추출된 attribute, relation, object를 이용해 Q-learning

​

​

<Result>

Dataset

- Visual Genome

- VRD

​

Metrics

- Predicate detection: relation만 예측

- Phrase detection: object class와 relation예측

- Attribute detection

VRD 데이터 집합을 이용한 실험 결과
VG 데이터 집합을 이용한 실험 결과

​

 

<결론>

- 강화 학습을 이용한 장면 그래프 생성 방법 제안

- 물체, 관계 뿐만 아니라 속성까지 함께 탐지하는 모델 제안

​

 
728x90
반응형
저작자표시 (새창열림)

'Paper Review > Image Scene Graph Generation' 카테고리의 다른 글

[18] Dynamic Gated Graph Neural Networks for Scene Graph Generation  (0) 2023.03.08
[17] Deep Generative Probabilistic Graph Neural Networks for Scene Graph Generation  (0) 2023.03.08
[15] Improving visual relationship detection using linguistic and spatial cues  (0) 2023.03.08
[14] Natural Language Guided Visual Relationship Detection  (0) 2023.03.08
[13] Memory-Based Network for Scene Graph with Unbalanced Relations  (0) 2023.03.08
'Paper Review/Image Scene Graph Generation' 카테고리의 다른 글
  • [18] Dynamic Gated Graph Neural Networks for Scene Graph Generation
  • [17] Deep Generative Probabilistic Graph Neural Networks for Scene Graph Generation
  • [15] Improving visual relationship detection using linguistic and spatial cues
  • [14] Natural Language Guided Visual Relationship Detection
ga.0_0.ga
ga.0_0.ga
    반응형
    250x250
  • ga.0_0.ga
    ##뚝딱뚝딱 딥러닝##
    ga.0_0.ga
  • 전체
    오늘
    어제
    • 분류 전체보기 (181)
      • Paper Review (51)
        • Video Scene Graph Generation (6)
        • Image Scene Graph Generation (18)
        • Graph Model (5)
        • Key Information Extraction (4)
        • Fake Detection (2)
        • Text to Image (1)
        • Diffusion Personalization (4)
        • etc (11)
      • AI Research (49)
        • Deep Learning (30)
        • Artificial Intelligence (15)
        • Data Analysis (4)
      • Pytorch (10)
      • ONNX (5)
      • OpenCV (2)
      • Error Note (34)
      • Linux (2)
      • Docker (3)
      • Etc (7)
      • My Study (16)
        • Algorithm (10)
        • Project (4)
        • Interview (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    그래프신경망
    RuntimeError
    linear regression
    dataset
    tensorflow
    ONNX
    TypeError
    활성화 함수
    forch.nn.functional
    contiguous
    torch.nn
    GCN
    HRNet
    Inductive bias
    permute
    정규화
    i3d
    알고리즘
    fine tuning
    pytorch
    Logistic regression
    dataloader
    오차 역전파
    3dinput
    JNI
    차원의 저주
    Activation Function
    transformer
    pandas
    나이브 베이즈 분류
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
ga.0_0.ga
[16] Deep Variation-structured Reinforcement Learning for Visual Relationship Detection
상단으로

티스토리툴바