본문 바로가기

Study/Paper Review44

[paper review] UCMCTrack 논문 리뷰 이번 포스팅은  Multi-Object Tracking with Uniform Camera Motion Compensation 이라는 MOT논문을 포스팅하겠습니다.UCMCTrack은 카메라 움직임이 큰 환경에서도 robust하게 MOT하기위한 새로운 motion tracking method를 제안합니다. 기존의 CMC는 프레임마다 카메라 보정을 계산해야했는데 UCMCTrack은 영상 시퀀스 전체에 동일한 compensation parameter를 적용합니다. Method위의 그림은 overview입니다. 입력영상에서 bbox를 graound plane으로 매핑합니다. 2D image상의 x,y를 ground상의 u,v로 변환하기 위해 Homography Transfomation행렬 H를 사용합니다. 카메.. 2025. 3. 27.
[paper review] ByteTrack 논문리뷰 이번에 리뷰할 논문은 ByteTrack입니다. Bytetrack은 22 ECCV 논문으로 나온지는 꽤 되었지만 아직도 많이 사용하는 MIT 라이센스의 MOT모델입니다. MOT의 방법은 크게 TBD(tracking by Detection)으로 detection후의 결과를 가지고 tracking하는 방법과 end-to-end로 detection과 tracking까지 한번에 학습하는 방법이 있고, TBD에서 association하는 부분을 filter기반의 방법과 learnable방법(i.e. GNN, attention)으로 나뉩니다. ByteTrack은 TBD에 filter기반의 association method를 사용하는 논문입니다. 기존의 filter기반의 MOT방법들은 low confidence det.. 2025. 3. 27.
[paper review] Unifying Short and Long-Term Tracking with Graph Hierarchies 논문 리뷰 안녕하세요. 이번 포스팅은 Unifying Short and Long-Term Tracking with Graph Hierarchies, 줄여서 SUSHI라는 tracking 모듈을 리뷰하겠습니다.보통 tracking에서 long-term association, short-term association으로 나뉘는데 본 논문은 두가지의 시나리오를 모두 tackle하였습니다. short-term association이라함은 말그대로 짧은 시간에서 하는 association으로 position을 보통활용하기 때문에 motion model을 만들어서 filter기반으로 association을 수행합니다. (i.e. bytetrack). long-term association의 경우 occlude심할때 꽤 오랜 .. 2025. 3. 26.
[paper review] EMMA: End-to-End Multimodal Model for Autonomous Driving 논문리뷰 이번 포스팅은 '24년 waymo에서 발표된 EMMA논문 리뷰 포스팅하겠습니다.제목에서 알 수 있듯이 Multi modal LLM을 autonomous driving에 적용한 autonomous 필드에서는 의미있는 논문입니다. 기존의 approach는 perception, prediction, planning, control등이 따로 묘듈로 분리되어서 pipeline을 통해 autonomous mission이 수행되었습니다. 그렇다보니  target environment가 익숙하지 못한 상황에서 예기치 못한 output이 발생하는 문제가 있습니다.이런 문제를 해결하기 위해서는 저자는 End-to-End 접근을 해야한다고 말합니다. sensor input으로부터 직접적으로 최종 control input까지.. 2025. 2. 17.
[paper review] MonoDGP: Monocular 3D Object Detection with Decoupled-Query and Geometry-Error Priors 논문리뷰 이번 포스팅은 mono camera 3D detection model인 MonoDGP모델입니다.해당 모델은 MonoDETR이라는 모델을 baseline으로하여 발전시킨 모델로 아래 포스팅 참고하세요.  [paper review] MonoDETR : Depth-guided Transformer for Monocular 3D Object Detection 논문 리뷰안녕하세요. 이번에는 monocular 3D detector인 MonoDETR 이라는 논문에 대해서 리뷰하겠습니다.MMlab으로 유명한 CUHK의 mmlab에서 나온 논문으로 ICCV '23 에 publish되었습니다. 기존의 방법들은 보통 2D detectojaehoon-daddy.tistory.comIntro대부분의 multi-camera 3D.. 2025. 1. 21.
[paper review] PTv2, PTv3 (Point Transformer) 논문리뷰 안녕하세요. 이번 포스트는 lidar segmentation에서 높은 성능을 보이고 있는 Point Transformer관련 논문리뷰 진행하겠습니다. 간략하게 trasnformer관련 task들을 살펴보면 image 도메인에서는 ViT가 대표적입니다. 문제는 ViT는 이미지 전체에 대해 global attention을 수행하기에 메모리를 많이 잡아먹는 단점이 있어 Swin-Transformer에서 이를 해결하기 위해 grid base의 local attention을 수행하여 이를 해결합니다.Pointcloud도메인에서는 크게 prjection, voxel, point 방법들이 있는데 projection방법은 다양한 방법으로 image plane으로 projection한 후에 2D CNN기반의 model을.. 2024. 12. 12.