일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 재귀
- streamlit
- REST API
- 손실함수
- 경사하강법
- 실버
- 백준
- 9020
- end to end
- Python
- 그리디 알고리즘
- 가상환경
- 밑바닥부터 시작하는 딥러닝
- 오블완
- 백트래킹
- pyenv
- 4948
- 개발환경
- BOJ
- 1101
- N-Queen
- n과 m
- 신경망 학습
- 파이썬
- 15649
- 기계학습
- 티스토리챌린지
- REST
- 파이싼
- 1002
- Today
- Total
목록오블완 (8)
파이톨치

Segmentation 오답노트Pixel-Wise Classification이는 이미지를 픽셀 단위로 분류하는 작업이다. 한 픽셀이 어떤 클래스에 들어가는지 예측하는 것이다. 대표적으로 세그멘테이션이 이러한 Pixel-wise classification으로 볼 수 있다. 대표적으로 FCN 모델이나 U-NET 모델이 있다. CNN 파라미터 계산 및 Stride의 영향생각보다 계산을 하는 상황이 있을 수도 있고, 전문가라고 한다면 이 정도는 가볍게 계산할 수 있어야 한다. output의 size는 kernel_size, stride, padding으로 계산이 된다. kernel_size는 빼주고, padding은 2곱해서 더해준다. stride로 나누어 주고 1을 더해주면 된다. Run-Length-Enc..
모델 학습에서 일관된 실험 관리와 성능 향상을 위해 고려해야 할 중요한 요소들을 정리했습니다. 이 글에서는 seed 고정, 실험 기록, k-fold와 augmentation, 그리고 TTA 활용법 등 효과적인 실험 관리와 모델 최적화 전략을 다룹니다. 1. Seed 고정: 실험의 재현성을 보장머신러닝 실험에서 가장 중요한 원칙 중 하나는 **재현성(reproducibility)**입니다. 모델 학습에서 발생할 수 있는 난수를 제어하기 위해 seed 값을 고정해야 합니다. 이를 통해 학습 과정에서 동일한 초기값으로 시작하여 결과를 비교 분석할 수 있습니다.import torchimport numpy as npimport randomdef set_seed(seed: int): torch.manual_s..

U-Net생긴 것부터 U자 모양으로 생긴 모델이다. 이름은 u-net이라고 하며 데이터를 축소시켰다가 up-sampling하면서 키운다. 의료 분야에서 효과적이라고 알려져있을뿐만 아니라, 일반적인 segmentation에서도 효과적이라고 한다. 인코더의 층을 디코더의 층에 concatenate 해주게 된다. 일종의 skip-connection이다. resolution 크기가 안 맞는 경우에는 crop을 해서 맞추어준다. 단순화된 구조를 보면 다음과 같다. 중간에 있는 Conv 블록은 다음과 같이 구성된다.def CBR2d(in_channels, out_channels, kernel_size=3, stride=1, padding=1, bias = True): return nn.Sequential(..

Semantic Segmentation Overviewsegmantic segmentaion이란 의미론적인 분할로 직역된다. 이는 픽셀 단위로 이 픽셀이 어떤 클래스에 속할지 판단하는 문제이다. 예시는 아래 그림과 같다. 이미지가 픽셀로 들어가면 그 픽셀이 어떤 클래스에 속할지 예측한다. 클래스만 예측하면 Semantic Segmantation 이라 하고, 클래스 별 객체까지 구분하면 Instance Segmentation이라고 한다. 우리가 다루어 볼 것은 클래스만 예측하는 task이다. 이러한 의미론적인 분할은 많은 분야에서 활용될 수 있고, 우리가 집중적으로 볼 것은 이것을 의료분야에 어떻게 활용하는가이다. 다음과 같은 사람 손에 대한 x-ray 이미지가 있을 떄, 각각의 뼈를 예측하는 모델을 만들..

1. FCN의 한계점1. 객체의 크기가 크거나 작은 경우 예측을 잘 하지 못하는 문제큰 Object의 경우 지역적인 정보만으로 예측 • 버스의 앞 부분 범퍼는 버스로 예측하지만, 유리창에 비친 자전거를 보고 자전거로 인식하는 문제 발생하기도 함 • 같은 Object여도 다르게 labeling • 작은 Object가 무시되는 문제가 있음2. Object의 디테일한 모습이 사라지는 문제 발생Deconvolution 절차가 간단해 경계를 학습하기 어려움 DilatedNetArchitecture – DilatedNet (Only Front-End Module) DilatedNet(또는 확장 합성곱 신경망)의 주요 특징과 이점을 설명하겠습니다: 수용 영역(Receptive Field) 확장 일반 CNN은 po..

단순 시각화 겹치는 영역 확인 흑백 반전 후 외곽선 추출 이미지 이진화 (th: 100) 이미지 이진화 (th: 170)

FCN 8FCN 8의 특징:업샘플링(Deconvolution): FCN 8은 업샘플링 기법을 사용해 다운샘플링된 이미지를 원래의 해상도로 되돌립니다. 이를 위해 deconvolution(또는 transposed convolution) 레이어를 사용하여 이미지 크기를 점진적으로 복원하며, 이 과정에서 각 픽셀의 클래스 정보를 예측합니다.Skip Connection: FCN 8은 중간 레이어의 정보를 결합하는 스킵 연결(skip connection)을 사용합니다. 예를 들어, 네트워크의 더 깊은 레이어와 얕은 레이어에서 나온 특징 맵을 결합하여 세밀한 공간 정보를 보존하면서 높은 수준의 추상화된 특징을 반영합니다. 이렇게 하면 더 정확한 경계와 세밀한 예측이 가능합니다.8배 업샘플링: FCN 8이라는 이름은..

Transposed Convolution(Transpose Convolution)는 일반적인 Convolution과 반대 방향으로 동작하는 연산으로, 이미지 또는 피처 맵을 업샘플링하여 크기를 증가시키는 데 사용됩니다. 이 방식은 세그멘테이션과 같은 작업에서 저해상도 특징 맵을 원본 크기로 복원해야 할 때 유용합니다. Transposed Convolution은 주로 ConvNet에서 다운샘플링된 특징 맵을 입력 이미지와 동일한 해상도로 복원하는 데 활용됩니다.Transposed Convolution의 동작 방식Transposed Convolution은 기존 Convolution의 역방향 연산을 통해 이미지나 피처 맵을 확대하는 방식입니다. 필터를 피처 맵의 각 위치에 겹치지 않게 적용하는 대신, 각 픽셀..