본문 바로가기

LLM3

[paper review] EMMA: End-to-End Multimodal Model for Autonomous Driving 논문리뷰 이번 포스팅은 '24년 waymo에서 발표된 EMMA논문 리뷰 포스팅하겠습니다.제목에서 알 수 있듯이 Multi modal LLM을 autonomous driving에 적용한 autonomous 필드에서는 의미있는 논문입니다. 기존의 approach는 perception, prediction, planning, control등이 따로 묘듈로 분리되어서 pipeline을 통해 autonomous mission이 수행되었습니다. 그렇다보니  target environment가 익숙하지 못한 상황에서 예기치 못한 output이 발생하는 문제가 있습니다.이런 문제를 해결하기 위해서는 저자는 End-to-End 접근을 해야한다고 말합니다. sensor input으로부터 직접적으로 최종 control input까지.. 2025. 2. 17.
LLM 훑어보기 LLM (Larget Language Model)의 약자로 그대로 해석하면 대형 언어 모델입니다. NLP에서는 이전의 처리했던 output이 현재의 input을 처리할때 사용이 되어야하기 때문에(문맥파악) RNN, LSTM, GRU 같은 recursive 모델을 사용했었습니다. 하지만 이 operator들을 사용한 모델은 Long-term Dependency, Vanishing Gradients 등의 한계가 존재했습니다.  Transformer의 등장이후에 이 문제점들이 어느정도 개선되면서 LLM이 본격적으로 등장하게 되었습니다.   [Transformer] Transformer & Vision안녕하세요. 이번 ML관련 포스팅에서는 Transformer관련하여 포스팅하겠습니다. 이미 나온지 꽤 오래되었고.. 2025. 1. 3.
[NLP] LLM모델이란? (1) - fine-tune, token, language model vision에서의 foundation model, diffusion model등의 유래는 사실상 자연어 처리분야(NLP)에서 시작되었습니다. 자연어 처리 모델들이 점점 커지면서 최근에는 BERT, GPT, LLAMA, GERME, SOLAR 등의 여러 LLM모델들이 출시되고 있습니다. LLM의 시작부터 최근이야기까지 포스팅해보겠습니다. 자연어 처리 모델은 보통 document classification, sentence pair classification, named entity recongnition, question answering, sentence generation등의 과제가 있고 입력으로 자연어를 받아 임베딩과정을 거쳐 최종적으로 어떤 범주 혹은 어떤 단어일지 확률을 return하는 방식입니다.. 2024. 2. 15.