본문 바로가기

Study85

[paper review] MonoDETR : Depth-guided Transformer for Monocular 3D Object Detection 논문 리뷰 안녕하세요. 이번에는 monocular 3D detector인 MonoDETR 이라는 논문에 대해서 리뷰하겠습니다.MMlab으로 유명한 CUHK의 mmlab에서 나온 논문으로 ICCV '23 에 publish되었습니다. 기존의 방법들은 보통 2D detector를 통해 대략적인 object center를 파악하고 3D feature를 예측하지만 본 논문은 local visual feature에 국한되지 않고 depth-guided 통해 3D feature를 estimation합니다. Comparison of DETR-based MethodDETR은 2D detector로 NMS, anchor가 필요없이 높은 성능을 자랑합니다. 이를 이용한 3D detector로 여러가지 모델이 있는데 우선 PETR이 있.. 2024. 8. 28.
[paper review] omni3D 논문 리뷰 오늘 리뷰할 논문은 omni3D입니다.메타에서 발표한 mono 3D detection 으로 huge dataset을 활용하는 이름하여 zero-shot monocular camera 3D detection입니다. 최근 3D object detection은 크게 두개의 domain으로 나뉩니다. 하나는 outdoor(autonomous field)이고 다른하나는 indoor입니다. outdoor의 정통한 모델들은 보통 BEV라는 개념을 통해 ground plane을 이용하는 것이 보통입니다. indoor는 물체들의 ground위에 있지 않기에 BEV를 이용하기보다는 다른 transformer등의 아키텍쳐를 사용합니다.본 논문에서는 cubercnn이라는 단일 모델을 제안하고 해당 모델 한가지로 두개의 dom.. 2024. 8. 15.
[paper review]NeuRAD: Neural Rendering for Autonomous Driving 논문리뷰 안녕하세요. 오늘은 NeuRAD라는 논문에 대해 리뷰하겠습니다.최근 NeRF를 이용한 AD(autonomous driving)분야에 많은 발전을 이끈 논문들이 많이 나오고 있습니다. 보통 NeRF를 사용하여 training augmentation을 수행하거나 test dataset으로 활용을 많이하고 있습니다. 그러나 기존의 방법들은 몇 가지 문제가 존재하는데, 긴 training 시간, 힘든 generalization, dense semantic정보가 필요하다는 것 이였습니다. 논문에서는 이러는 문제점들을 해결하기 위해 여러 방법론을 제시하였는데 자세한건 아래에 살펴보겠습니다.Relative workssynthetic data는 AD에서 매우 유용합니다. harsh breaking상황(corner ea.. 2024. 8. 5.
[paper review] Far3D : Expanding the Horizon for Surround-view 3D Object Detection 논문 리뷰 안녕햐세요. 이번 포스팅은 multi-view를 이용한 3D detector인 Far3D를 리뷰하겠습니다.Far3D는 AAAI 24에 publish되었고 현재 nuscenes camera 3D detection 리더보드에서 sota이고, megvii라는 회사에서 나왔는데 이 megvii라는 곳에서 최근에 camera 3D detector를 발표하고 있습니다. 최근 camera 3d detector는 크게 두가지 타입으로 나뉩니다. query-baes 방법과 BEV-base 방법입니다. 위 논문은 query-base방법을 사용하였고 long range에서도 뛰어난 성능을 보이기 위한 아키텍쳐입니다.   [paper review] PETR 논문리뷰 (3D detection w Cam)안녕하세요 이번에는 PE.. 2024. 7. 8.
[paper review] PETR 논문리뷰 (3D detection w Cam) 안녕하세요 이번에는 PETR 이라는 camera기반의 3D detection 논문을 살펴보겠습니다.최근 camera를 기반으로하는 3D detection 논문들이 많이 나오고 있습니다. 현재 multi-cam 3D detection분야는 BEV 방법론과 perspective 방법론으로 나눠져 있는데, 오늘 리뷰할 논문은 후자의 방법론을 사용하였습니다. 위의 벤치마크 순위에는 없지만 perspective 방법론은 해당 논문을 기반으로 설계되었습니다.   [paper review] BEVFusion 논문 리뷰이번 논문리뷰는 BEVFusion이라는 논문으로 3D Detection에서 multi-modal 그 중에서도 camera-lidar에 관련된 논문입니다. ICRA 23에 publish되고 현재기준으로 m.. 2024. 6. 4.
[Optimization] 모델 경량화 실습 (ONNX, TensorRT of DSVT) 안녕하세요. 이번 포스팅은 딥러닝 모델 경량화 실습이라는 제목으로 이전 포스팅에 이어서 경량화 예제코드를 분석해 볼 생각입니다. 경량화에 대한 이론은 아래 포스팅 참고하세요. [Optimization] 모델 경량화 이론 (ONNX, TensorRT) 안녕하세요. 이번에는 모델 경량화 관련하여 포스팅하도록 하겠습니다. 경량화의 목적 경량화를 하는 이유는 보통 edge device에서 딥러닝 모델을 inference하고 싶은데 보통의 edge device의 리소스가 jaehoon-daddy.tistory.com 실습할 모델은 DSVT라는 모델입니다. pointcloud detection model인데 기존의 pointcloud model은 3D backbone에서 3D convolution을 이용합니다. 그.. 2024. 4. 15.