본문 바로가기

분류 전체보기

(3)

Class Activation Map (CAM) 논문 요약/리뷰 [Learning Deep Features for Discriminative Localization] 1. Introduction 보통 CNN의 구조를 생각해보면, Input - Conv Layers - FC Layers 으로 이루어졌다. 즉, CNN은 마지막 컨벌루션 레이어를 FC-Layer 들로 바꾸고, Softmax 함수를 통해 특정 이미지를 특정 클라스로 분류하는 데 매우 뛰어난 성능을 보여준다. 하지만 이렇게 CNN 의 마지막 레이어를 FC-Layer 로 Flatten 시킬때 우리는 그 Convolution 이 가지고 있던 각 픽셀들의 위치 정보를 잃게 된다. 따라서 Classifying 정확도가 아무리 뛰어날지라도, 우리는 그 CNN 이 무엇을 보고 그 클라스를 그 클라스라고 판별했는지 알 수..

ResNet 논문 요약/리뷰 [Deep Residual Learning for Image Recognition] Introduction VGGNet 논문에서 CNN 의 레이어가 깊어질수록 성능이 더 좋다는 것을 확인할 수 있었다. 하지만 레이어가 너무 깊어지면 Vanishing/Exploding gradient, 그리고 degradation problem, 크게 이 두 가지 문제점에 봉착하게 된다. 우선 Vanishing/Exploding gradient 같은 경우에는 레이어 중간중간에 batchNorm 을 적용해주면 해결할 수 있다. Degradation Problem 이란 정확도가 어느 순간부터 정체되고 레이어가 더 깊어질수록 성능이 더 나빠지는 현상을 의미한다. 이 논문에서는 Residual Learning 을 통해 Degra..

VGGNet 논문 요약/리뷰 Introduction 딥러닝에 입문하고 관련 논문을 찾아볼 때 가장 먼저 보게 되는 논문이 VGGNet 이다. 정확한 논문 이름은 Very Deep Convolutional Networks for Large-Scale Image Recognition 이다. 이름에서 유추할 수 있듯이 Image Recognition 에서 CNN 의 성능이 깊이에 따라서 어떻게 달라지는지를 살펴보는 논문이다. Convnet Configuration 우선 ConvNet 의 인풋은 224x224 RGB 이미지로 동일하다. 이 이미지는 ConvNet 안에서 주로 3x3 필터들을 통과하게 되고, 총 다섯 번의 2x2 max-pool 를 통해서 사이즈를 줄여나간다. 그리고 마지막엔 총 3개의 FC-Layer 로 구성돼있는데, 40..

티스토리툴바