본문 바로가기
728x90
반응형

Paper Review/Video Scene Graph Generation6

[6] Video Relation Detection via Multiple Hypothesis Association 논문 링크 : https://dl.acm.org/doi/10.1145/3394171.3413764 ​ ​ 주어지는 비디오에 대해 등장 물체와 그들 사이의 관계를 탐지하는 논문입니다. [1]-[4] 논문과 동일하게 segment 접근 법을 사용하고 있습니다. ▶새로운 Relation association 방법 제안 => Multiple Hypothesis Association => 짧은 비디오에만 효과가 있던 기존의 방법 개선 (a) Triplet의 클래스가 같고 가까울 때도 association가능 (b) 중간에 관계가 탐지되지 않은 경우에도 association가능 Relation association 방법에 대해서만 제안하며 물체 tracklet생성 및 관계 탐지는 기존의 다른 모델들을 사용하여 비교.. 2023. 3. 6.
[5] Beyond Short-Term Snippet: Video Relation Detection with Spatio-Temporal Global Context 논문 링크 : https://openaccess.thecvf.com/content_CVPR_2020/papers/Liu_Beyond_Short-Term_Snippet_Video_Relation_Detection_With_Spatio-Temporal_Global_Context_CVPR_2020_paper.pdf 기존의 논문들[1-4]은 비디오를 일정한 크기로 분할한 후 분할된 비디오에서 각각 물체와 관계를 탐지한 다음 별도의 association알고리즘을 이용하여 하나로 합쳐주는 방식을 사용하였습니다(segment 접근법). 이 논문에서는 이러한 접근 법의 문제점을 지적하고 새로운 sliding-window접근 방법을 제안합니다. ​ segment 접근법의 문제점 - 길이가 긴 관계는 탐지가 힘듦 : 여러.. 2023. 3. 6.
[4] Video Visual Relation Detection via Multi-modal Feature Fusion 논문 링크: https://dl.acm.org/doi/pdf/10.1145/3343031.3356076?casa_token=LjNHlyyGyH0AAAAA:b_rt89X9KYzbXFbLlNYGEKsS7qzL283c_st__SmuQb9Gy9PhGgHtbHpnkKmNiWCqL8Kjnm2Y_hMV4w 이 논문은 이전 논문에 이어서 비디오 관계 탐지에 관한 논문입니다. 이전 논문들은 VidVRD 데이터 집합을 사용하였지만 본 논문부터는 VidOR이라는 새로운 데이터 집합을 중점적으로 사용합니다. ​ ​ 비디오에서의 관계 탐지를 위해 다양한 유형의 multi modal feature들을 사용한 논문입니다. 이전 논문들은 비디오내에 등장하는 물체들의 visual feature에 의존하던 것을 개선하여 visual f.. 2023. 3. 6.
[3] Video Relationship Reasoning using Gated Spatio-Temporal Energy Graph 논문 링크: https://openaccess.thecvf.com/content_CVPR_2019/papers/Tsai_Video_Relationship_Reasoning_Using_Gated_Spatio-Temporal_Energy_Graph_CVPR_2019_paper.pdf ​ Github: https://github.com/yaohungt/Gated-Spatio-Temporal-Energy-Graph GitHub - yaohungt/Gated-Spatio-Temporal-Energy-Graph: [CVPR'19] [PyTorch] Gated Spatio Temporal Energy Graph [CVPR'19] [PyTorch] Gated Spatio Temporal Energy Graph - Gi.. 2023. 3. 6.
728x90
반응형