250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 1101
- Retrieval
- video retireval
- 백준
- 9020
- 가상환경
- 파이썬
- BOJ
- pyenv
- 1002
- n과 m
- 손실함수
- 4948
- 백트래킹
- 티스토리챌린지
- 밑바닥부터 시작하는 딥러닝
- 재귀
- REST API
- streamlit
- 15649
- 기계학습
- 경사하강법
- 오블완
- N-Queen
- Python
- 신경망 학습
- 개발환경
- end to end
- 파이싼
- 그리디 알고리즘
Archives
- Today
- Total
파이톨치
[BoostCamp AI Tech] DilatedNet 본문
728x90
1. FCN의 한계점
1. 객체의 크기가 크거나 작은 경우 예측을 잘 하지 못하는 문제
큰 Object의 경우 지역적인 정보만으로 예측 • 버스의 앞 부분 범퍼는 버스로 예측하지만, 유리창에 비친 자전거를 보고 자전거로 인식하는 문제 발생하기도 함 • 같은 Object여도 다르게 labeling • 작은 Object가 무시되는 문제가 있음
2. Object의 디테일한 모습이 사라지는 문제 발생
Deconvolution 절차가 간단해 경계를 학습하기 어려움
DilatedNet
Architecture – DilatedNet (Only Front-End Module)
DilatedNet(또는 확장 합성곱 신경망)의 주요 특징과 이점을 설명하겠습니다:
- 수용 영역(Receptive Field) 확장
- 일반 CNN은 pooling layer를 통해 수용 영역을 넓히지만, 이는 해상도 손실을 가져옵니다
- Dilated convolution은 필터 내부에 간격(dilation)을 둠으로써:
- 해상도 손실 없이 수용 영역을 넓힐 수 있음
- 더 적은 파라미터로 더 넓은 문맥 정보를 캡처할 수 있음
기존 CNN의 문제점:
Input -> Conv -> Pool -> Conv -> Pool -> ...
(해상도가 계속 감소)
DilatedNet의 장점:
Input -> Conv -> Dilated Conv -> Dilated Conv -> ...
(해상도 유지하면서 receptive field 확장)
728x90
'AI&ML > BoostCamp AI Tech' 카테고리의 다른 글
[BoostCamp AI Tech] U-Net (1) | 2024.11.18 |
---|---|
[BoostCamp AI Tech] Semantic Segmentation (0) | 2024.11.17 |
[BoostCamp AI Tech] Hand Bone Image EDA (0) | 2024.11.13 |
[BoostCamp AI Tech] Fully Convolutional Network (0) | 2024.11.11 |
[BoostCamp AI Tech] 2-stage Detectors (0) | 2024.10.18 |