Boostcamp AI Tech (Day 037)

1. 강의

2. 피어세션

뭐하고있나요? 실습코드작성중, 과제하는중
COCO API를 통해서 json 파일을 분해하는데 어떻게 쓰는지 알아봤다! -> 정보공유노션
기훈 train/val 데이터셋 나누는거 작성했다
기훈 kFold하도록 파일 생성하고 불러오는거 했다
반환값이 로스임 이걸 어쩌지? 로스까지 계산해서 나옴 알아둬라
rpn이 어려워서 헤맸다
설명 시작~ 오리지널에서 백본을통해 피처맵이 추출되면 피처맵에 픽셀이 주르륵있겠지? 이 픽셀 하나당 9개의 앵커박스를 만드는거야 피처맵의 H* W 512개()의 채널로 만들어둿자나 이거를 이제 1192를해서(0인지1인지,0인지1인지) 클래시피케이션을 하고 (roi를 함) 119*4를해서(xywh) 박스에 리그레션을 함 얘네를 학습함 패스터rcn에서 rpn에 대한 설명이 이렇다. 영역을 선택하는 과정이 ss가 잇고 rpn이 잇고 그런 것임
convolution network 커널 개수 늘리면 좋다? 오버피팅되지않을까 계산도 많아지고
spp도 설명 부탁 왜 굳이 피라미드로 하나요? 바운더리 박스의 크기가 다 다르잖아 예전 rcnn은 강제로 줄이거나 늘렷음 정보의 손실발생! 풀링을 통해 얘넬 다 같은 사이즈로 맞춤 와우 굳~!!
근데 왜 피라미드냐니까? 왜 11도하고 22도하고 4*4도 하냐고 왜 연산에 얘넬 같이써야 효과가 있는가 각 특징얘네가 갖고있는 정보가 다 다르잖아! 다 써 얘넬 이제 정보가 많아지는것 아 오키오키 굳
스트림릿 코드 pr 올렸다 테스트 보여드림
팀미팅데이 신청

3. 회고

실습 1을 하루종일 했다. coco 데이터셋 파악하는 게 어려웠다
조금 더 빨리 이해하고 조금 더 잘 이해하면 좋겠다
시간을 효율적으로 사용하지 못하는 것 같다
혼자 뒤처지는 것 같다