'오블완' 태그의 글 목록

250x250

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록오블완 (8)

파이톨치

[BoostCamp AI Tech] Segmentation 오답노트

Segmentation 오답노트Pixel-Wise Classification이는 이미지를 픽셀 단위로 분류하는 작업이다. 한 픽셀이 어떤 클래스에 들어가는지 예측하는 것이다. 대표적으로 세그멘테이션이 이러한 Pixel-wise classification으로 볼 수 있다. 대표적으로 FCN 모델이나 U-NET 모델이 있다. CNN 파라미터 계산 및 Stride의 영향생각보다 계산을 하는 상황이 있을 수도 있고, 전문가라고 한다면 이 정도는 가볍게 계산할 수 있어야 한다. output의 size는 kernel_size, stride, padding으로 계산이 된다. kernel_size는 빼주고, padding은 2곱해서 더해준다. stride로 나누어 주고 1을 더해주면 된다. Run-Length-Enc..

AI&ML/BoostCamp AI Tech 2024. 11. 21. 11:36

[BoostCamp AI Tech] 학습 시 고려 사항

모델 학습에서 일관된 실험 관리와 성능 향상을 위해 고려해야 할 중요한 요소들을 정리했습니다. 이 글에서는 seed 고정, 실험 기록, k-fold와 augmentation, 그리고 TTA 활용법 등 효과적인 실험 관리와 모델 최적화 전략을 다룹니다. 1. Seed 고정: 실험의 재현성을 보장머신러닝 실험에서 가장 중요한 원칙 중 하나는 **재현성(reproducibility)**입니다. 모델 학습에서 발생할 수 있는 난수를 제어하기 위해 seed 값을 고정해야 합니다. 이를 통해 학습 과정에서 동일한 초기값으로 시작하여 결과를 비교 분석할 수 있습니다.import torchimport numpy as npimport randomdef set_seed(seed: int): torch.manual_s..

AI&ML/BoostCamp AI Tech 2024. 11. 20. 14:09

[BoostCamp AI Tech] U-Net

U-Net생긴 것부터 U자 모양으로 생긴 모델이다. 이름은 u-net이라고 하며 데이터를 축소시켰다가 up-sampling하면서 키운다. 의료 분야에서 효과적이라고 알려져있을뿐만 아니라, 일반적인 segmentation에서도 효과적이라고 한다. 인코더의 층을 디코더의 층에 concatenate 해주게 된다. 일종의 skip-connection이다. resolution 크기가 안 맞는 경우에는 crop을 해서 맞추어준다. 단순화된 구조를 보면 다음과 같다. 중간에 있는 Conv 블록은 다음과 같이 구성된다.def CBR2d(in_channels, out_channels, kernel_size=3, stride=1, padding=1, bias = True): return nn.Sequential(..

AI&ML/BoostCamp AI Tech 2024. 11. 18. 19:25

[BoostCamp AI Tech] Semantic Segmentation

Semantic Segmentation Overviewsegmantic segmentaion이란 의미론적인 분할로 직역된다. 이는 픽셀 단위로 이 픽셀이 어떤 클래스에 속할지 판단하는 문제이다. 예시는 아래 그림과 같다. 이미지가 픽셀로 들어가면 그 픽셀이 어떤 클래스에 속할지 예측한다. 클래스만 예측하면 Semantic Segmantation 이라 하고, 클래스 별 객체까지 구분하면 Instance Segmentation이라고 한다. 우리가 다루어 볼 것은 클래스만 예측하는 task이다. 이러한 의미론적인 분할은 많은 분야에서 활용될 수 있고, 우리가 집중적으로 볼 것은 이것을 의료분야에 어떻게 활용하는가이다. 다음과 같은 사람 손에 대한 x-ray 이미지가 있을 떄, 각각의 뼈를 예측하는 모델을 만들..

AI&ML/BoostCamp AI Tech 2024. 11. 17. 18:26

[BoostCamp AI Tech] DilatedNet

1. FCN의 한계점1. 객체의 크기가 크거나 작은 경우 예측을 잘 하지 못하는 문제큰 Object의 경우 지역적인 정보만으로 예측 • 버스의 앞 부분 범퍼는 버스로 예측하지만, 유리창에 비친 자전거를 보고 자전거로 인식하는 문제 발생하기도 함 • 같은 Object여도 다르게 labeling • 작은 Object가 무시되는 문제가 있음2. Object의 디테일한 모습이 사라지는 문제 발생Deconvolution 절차가 간단해 경계를 학습하기 어려움 DilatedNetArchitecture – DilatedNet (Only Front-End Module) DilatedNet(또는 확장 합성곱 신경망)의 주요 특징과 이점을 설명하겠습니다: 수용 영역(Receptive Field) 확장 일반 CNN은 po..

AI&ML/BoostCamp AI Tech 2024. 11. 15. 14:35

[BoostCamp AI Tech] Hand Bone Image EDA

단순 시각화 겹치는 영역 확인 흑백 반전 후 외곽선 추출 이미지 이진화 (th: 100) 이미지 이진화 (th: 170)

AI&ML/BoostCamp AI Tech 2024. 11. 13. 14:50

[BoostCamp AI Tech] FCN 과제

FCN 8FCN 8의 특징:업샘플링(Deconvolution): FCN 8은 업샘플링 기법을 사용해 다운샘플링된 이미지를 원래의 해상도로 되돌립니다. 이를 위해 deconvolution(또는 transposed convolution) 레이어를 사용하여 이미지 크기를 점진적으로 복원하며, 이 과정에서 각 픽셀의 클래스 정보를 예측합니다.Skip Connection: FCN 8은 중간 레이어의 정보를 결합하는 스킵 연결(skip connection)을 사용합니다. 예를 들어, 네트워크의 더 깊은 레이어와 얕은 레이어에서 나온 특징 맵을 결합하여 세밀한 공간 정보를 보존하면서 높은 수준의 추상화된 특징을 반영합니다. 이렇게 하면 더 정확한 경계와 세밀한 예측이 가능합니다.8배 업샘플링: FCN 8이라는 이름은..

카테고리 없음 2024. 11. 12. 19:25

[BoostCamp AI Tech] Transposed Convolution

Transposed Convolution(Transpose Convolution)는 일반적인 Convolution과 반대 방향으로 동작하는 연산으로, 이미지 또는 피처 맵을 업샘플링하여 크기를 증가시키는 데 사용됩니다. 이 방식은 세그멘테이션과 같은 작업에서 저해상도 특징 맵을 원본 크기로 복원해야 할 때 유용합니다. Transposed Convolution은 주로 ConvNet에서 다운샘플링된 특징 맵을 입력 이미지와 동일한 해상도로 복원하는 데 활용됩니다.Transposed Convolution의 동작 방식Transposed Convolution은 기존 Convolution의 역방향 연산을 통해 이미지나 피처 맵을 확대하는 방식입니다. 필터를 피처 맵의 각 위치에 겹치지 않게 적용하는 대신, 각 픽셀..

카테고리 없음 2024. 11. 11. 14:55

이전 Prev 1 Next 다음

목록오블완 (8)

파이톨치

티스토리툴바