COCO API를 통해서 json 파일을 분해하는데 어떻게 쓰는지 알아봤다! -> 정보공유노션
기훈 train/val 데이터셋 나누는거 작성했다
기훈 kFold하도록 파일 생성하고 불러오는거 했다
반환값이 로스임 이걸 어쩌지? 로스까지 계산해서 나옴 알아둬라
rpn이 어려워서 헤맸다
설명 시작~
오리지널에서 백본을통해 피처맵이 추출되면
피처맵에 픽셀이 주르륵있겠지?
이 픽셀 하나당 9개의 앵커박스를 만드는거야
피처맵의 H* W 512개()의 채널로 만들어둿자나
이거를 이제
1192를해서(0인지1인지,0인지1인지) 클래시피케이션을 하고 (roi를 함)
119*4를해서(xywh) 박스에 리그레션을 함
얘네를 학습함
패스터rcn에서 rpn에 대한 설명이 이렇다.
영역을 선택하는 과정이 ss가 잇고 rpn이 잇고 그런 것임