728x90 반응형 Paper Review/Video Scene Graph Generation6 [6] Video Relation Detection via Multiple Hypothesis Association 논문 링크 : https://dl.acm.org/doi/10.1145/3394171.3413764 주어지는 비디오에 대해 등장 물체와 그들 사이의 관계를 탐지하는 논문입니다. [1]-[4] 논문과 동일하게 segment 접근 법을 사용하고 있습니다. ▶새로운 Relation association 방법 제안 => Multiple Hypothesis Association => 짧은 비디오에만 효과가 있던 기존의 방법 개선 (a) Triplet의 클래스가 같고 가까울 때도 association가능 (b) 중간에 관계가 탐지되지 않은 경우에도 association가능 Relation association 방법에 대해서만 제안하며 물체 tracklet생성 및 관계 탐지는 기존의 다른 모델들을 사용하여 비교.. 2023. 3. 6. [5] Beyond Short-Term Snippet: Video Relation Detection with Spatio-Temporal Global Context 논문 링크 : https://openaccess.thecvf.com/content_CVPR_2020/papers/Liu_Beyond_Short-Term_Snippet_Video_Relation_Detection_With_Spatio-Temporal_Global_Context_CVPR_2020_paper.pdf 기존의 논문들[1-4]은 비디오를 일정한 크기로 분할한 후 분할된 비디오에서 각각 물체와 관계를 탐지한 다음 별도의 association알고리즘을 이용하여 하나로 합쳐주는 방식을 사용하였습니다(segment 접근법). 이 논문에서는 이러한 접근 법의 문제점을 지적하고 새로운 sliding-window접근 방법을 제안합니다. segment 접근법의 문제점 - 길이가 긴 관계는 탐지가 힘듦 : 여러.. 2023. 3. 6. [4] Video Visual Relation Detection via Multi-modal Feature Fusion 논문 링크: https://dl.acm.org/doi/pdf/10.1145/3343031.3356076?casa_token=LjNHlyyGyH0AAAAA:b_rt89X9KYzbXFbLlNYGEKsS7qzL283c_st__SmuQb9Gy9PhGgHtbHpnkKmNiWCqL8Kjnm2Y_hMV4w 이 논문은 이전 논문에 이어서 비디오 관계 탐지에 관한 논문입니다. 이전 논문들은 VidVRD 데이터 집합을 사용하였지만 본 논문부터는 VidOR이라는 새로운 데이터 집합을 중점적으로 사용합니다. 비디오에서의 관계 탐지를 위해 다양한 유형의 multi modal feature들을 사용한 논문입니다. 이전 논문들은 비디오내에 등장하는 물체들의 visual feature에 의존하던 것을 개선하여 visual f.. 2023. 3. 6. [3] Video Relationship Reasoning using Gated Spatio-Temporal Energy Graph 논문 링크: https://openaccess.thecvf.com/content_CVPR_2019/papers/Tsai_Video_Relationship_Reasoning_Using_Gated_Spatio-Temporal_Energy_Graph_CVPR_2019_paper.pdf Github: https://github.com/yaohungt/Gated-Spatio-Temporal-Energy-Graph GitHub - yaohungt/Gated-Spatio-Temporal-Energy-Graph: [CVPR'19] [PyTorch] Gated Spatio Temporal Energy Graph [CVPR'19] [PyTorch] Gated Spatio Temporal Energy Graph - Gi.. 2023. 3. 6. 이전 1 2 다음 728x90 반응형