본문 바로가기
728x90
반응형
SMALL

AI Paper Review11

[논문 리뷰] Computer Vision - YOLO(You Only Look Once:Unified, Real-Time Object Detection) 📃 논문 https://arxiv.org/pdf/1506.02640.pdf 2-stage detector는 localization과 classification을 수행하는 network 혹은 컴포넌트가 분리되어 있음(ex. Fast R-CNN) 각 task가 순차적으로 진행되는 것을 의미하며, 이러한 과정에서 병목현상이 발생하여 detection 속도가 느림 1-stage detector는 하나의 통합된 네트워크가 두 task를 동시에 진행 YOLO v1은 대표적인 1-stage detector로, FPS를 개선하여 real-time에 가까운 detection 속도를 보임(실시간에 적용하기 유리) Preview YOLO v1은 localization과 classification을 하나의 문제로 정의하여 n.. 2023. 9. 7.
[논문 리뷰] Computer Vision - Faster R-CNN 📃 논문 https://arxiv.org/pdf/1506.01497.pdf 기존 Fast R-CNN 모델은 여전히 Selective search 알고리즘을 통해 region proposals 추출하기 때문에 학습 및 detection 속도를 향상시키는데 한계가 있음 Selective search 알고리즘 이미지 픽셀의 컬러, 무늬, 크기, 형태에 따라 유사한 Region을 계층적 그룹핑 방법으로 계산하는 방식 객체가 들어있을 만한 여러개의 바운딩박스를 만들고 반복적으로 Selective Search 알고리즘을 이용하여 최적의 바운딩 박스를 선정해 Region Proposal Preview 후보 영역 추출을 위해 사용되는 Selective search 알고리즘은 CPU 상에서 동작하고 이로 인해 네트워크에.. 2023. 9. 6.
[논문 리뷰] Computer Vision - Fast R-CNN 📃 [논문] https://arxiv.org/pdf/1504.08083.pdf 기존 R-CNN 모델은 학습 시간이 매우 오래 걸리며, detection 속도 역시, 이미지 한 장당 47초나 걸려 매우 느린 추론 속도 3가지의 모델(AlexNet, linear SVM, Bounding box regressor)을 독립적으로 학습시켜, 연산을 공유하거나 가중치값을 update하는 것이 불가능하다는 문제 기존 R-CNN 모델보다 속도면에서의 큰 개선을 보인 모델 Preview Fast R-CNN은 단 1장의 이미지를 입력받으며, region proposals의 크기를 warp시킬 필요 없이 RoI(Region of Interest) pooling을 통해 고정된 크기의 feature vector를 fully c.. 2023. 9. 6.
728x90
반응형
LIST