파이톨치

[BoostCamp AI Tech] DilatedNet 본문

AI&ML/BoostCamp AI Tech

[BoostCamp AI Tech] DilatedNet

파이톨치 2024. 11. 15. 14:35
728x90

1. FCN의 한계점

1. 객체의 크기가 크거나 작은 경우 예측을 잘 하지 못하는 문제

큰 Object의 경우 지역적인 정보만으로 예측 • 버스의 앞 부분 범퍼는 버스로 예측하지만, 유리창에 비친 자전거를 보고 자전거로 인식하는 문제 발생하기도 함 • 같은 Object여도 다르게 labeling • 작은 Object가 무시되는 문제가 있음

2. Object의 디테일한 모습이 사라지는 문제 발생

Deconvolution 절차가 간단해 경계를 학습하기 어려움

 

DilatedNet

Architecture – DilatedNet (Only Front-End Module)

 

DilatedNet(또는 확장 합성곱 신경망)의 주요 특징과 이점을 설명하겠습니다:

 

  • 수용 영역(Receptive Field) 확장

 

 

 

  • 일반 CNN은 pooling layer를 통해 수용 영역을 넓히지만, 이는 해상도 손실을 가져옵니다

 

 

 

  • Dilated convolution은 필터 내부에 간격(dilation)을 둠으로써:

 

 

 

  • 해상도 손실 없이 수용 영역을 넓힐 수 있음

 

 

 

  •  적은 파라미터로 더 넓은 문맥 정보를 캡처할 수 있음

 

기존 CNN의 문제점:

     Input -> Conv -> Pool -> Conv -> Pool -> ...
     (해상도가 계속 감소)

DilatedNet의 장점:

     Input -> Conv -> Dilated Conv -> Dilated Conv -> ...
     (해상도 유지하면서 receptive field 확장)

728x90