일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 1101
- 9020
- end to end
- 밑바닥부터 시작하는 딥러닝
- 백준
- 손실함수
- 4948
- 백트래킹
- 실버
- 그리디 알고리즘
- 신경망 학습
- BOJ
- 개발환경
- 파이싼
- 재귀
- 설정
- 1002
- 가상환경
- 기계학습
- 파이썬
- 경사하강법
- Mac
- n과 m
- streamlit
- Python
- 15649
- pyenv
- N-Queen
- Today
- Total
목록분류 전체보기 (181)
파이톨치
# Evaluation mAP(mean Average Precision)는 객체 검출(Object Detection) 성능 평가에서 많이 사용되는 지표로, 각 클래스에 대한 AP(Average Precision) 값을 평균낸 값입니다. 이를 계산하기 위해 필요한 개념들을 하나씩 설명하겠습니다.## Confusion MatrixConfusion Matrix는 분류 모델의 성능을 평가하기 위해 사용됩니다. 객체 탐지에서도 각 예측이 실제로 맞는지 틀린지를 나타내는 표입니다. 객체 검출에서 다음과 같은 경우로 구성됩니다:True Positive (TP): 객체가 존재하는 위치에 정확하게 검출한 경우False Positive (FP): 객체가 없는데도 검출한 경우 (잘못된 검출)False Negative (F..
모델 학습이 완료되었으면 이제 검증 데이터로 성능을 평가하여 그 결과를 확인할 차례입니다. 여러 실험을 통해 만들어진 모델 중 어떤 것이 가장 적절하게 문제를 해결하는지 확인하는 것이 중요합니다. 모델의 성능을 검증하는 지표는 다음과 같습니다.1. Classification Metrics모델 개발 및 테스트에 있어서 방향을 제시해주는 나침반 같은 역할을 하는 것이 분류 지표입니다. 또한, 다른 모델과의 성능을 비교할 기준이 되며, 문제 정의에 따라 올바른 지표를 선택하는 것이 중요합니다. 대표적인 지표로는 True Positive (TP), True Negative (TN), False Positive (FP), False Negative (FN) 등이 있습니다.Precision & Recall이 두 가..
1. 데이터 캐싱이란?데이터 캐싱은 반복적으로 사용되는 데이터를 미리 처리해 저장하거나 메모리에 일시적으로 보관해두어 재사용하는 기술입니다. 이를 통해 데이터 처리 속도를 높이고 학습에 필요한 데이터를 빠르게 불러올 수 있습니다. 2. 캐싱의 필요성반복적인 데이터 로딩 시간을 줄이고 I/O 병목 현상을 해소해 전체 학습 시간을 단축합니다.3. 캐싱이 필요한 부분반복적인 처리 과정을 찾아내고, 매번 에폭마다 동일한 이미지 파일을 벡터화하는 과정을 미리 진행해두는 것이 중요합니다.예를 들어, 1장의 이미지를 처리하는 시간이 8ms라면, 전체 이미지 수와 에폭 수에 비례하여 처리 시간이 증가합니다.4. 캐싱 적용 방법전체 이미지를 미리 벡터화 후 .npy 파일로 저장: 모든 이미지를 벡터화해 .npy 파일로 ..
학습 파이프라인의 전체적인 개요는 데이터 준비부터 모델 학습까지 일련의 단계를 효율적으로 연결하는 것을 목적으로 한다. 각각의 단계는 학습 과정에서 중요한 역할을 담당한다.학습 반복 루프 (전체)먼저, 어떤 작업(Task)을 수행할지 결정해야 한다. 이 작업에 적합한 데이터를 구성하고, Dataset 클래스와 DataLoader를 선언하여 모델을 학습시킬 준비를 한다. 이후 모델을 선택하고 학습을 진행하는 전체적인 과정을 반복하게 된다.Dataset과 DataLoader학습 과정에서 데이터를 처리하고 모델 학습에 사용하는 핵심 클래스이다. Dataset과 DataLoader를 활용하면 데이터를 불러오고 전처리하며 배치(Batch)로 나누어 학습에 적합한 형태로 제공할 수 있다.왜 사용하는가?데이터를 단순..
데이터의 표현 이해데이터는 모델이나 관점에 따라 처리할 수 있는 형태로 변환되며, 어떤 관점에서 데이터를 바라보느냐에 따라 기대하는 표현 방식(Representation)이 달라집니다. (모델이 데이터를 어떻게 바라보는가를 loss 식 등을 통해서 학습하는 것이다) 단 하나의 의미만 가진 개체가 있을까?같은 이미지라도 해석하는 관점이나 관심 있게 보는 영역에 따라 그 의미는 다양해질 수 있습니다. 따라서 어떤 개체를 표현하는 방법 역시 다양해질 수 있습니다. 지도 학습의 한계모든 새로운 작업에 대해 주석(Annotation)을 추가해야 하는데, 이 과정은 시간과 비용이 많이 소모됩니다. 특히 바운딩 박스나 마스크와 같은 복잡한 주석은 더욱 비용이 높습니다. 따라서 적은 주석으로도 학습할 수 있는 모델은..
모델이 복잡한 데이터를 이해하고 처리하는 방식은 여러 가지가 있습니다.모델은 일반적으로 객체, 사람, 또는 시스템에 대한 정보적인 표현을 제공합니다.CNNCNN(합성곱 신경망)은 다음과 같은 방식으로 데이터를 처리합니다:Locality & Translation Invariance: 이미지의 어느 위치에서나 나타나는 지역 패턴에 집중하여 이미지의 특정 부분에서만 동작하지 않고 전체 이미지에 걸쳐 패턴을 학습합니다.Hierarchical Feature Learning: 단순한 특징에서 시작하여 점점 더 복잡한 특징을 학습합니다. 이는 이미지의 낮은 레벨에서 높은 레벨의 정보를 추출하는 것을 의미합니다.Weight Sharing: 동일한 필터를 이미지 전체에 사용하여 연산 효율성을 높이고 학습을 개선합니다.T..
현재 대회를 진행하면서 감을 못 잡겠는 부분 중 하나이다. 현재는 단순히 모델만을 사용했고 전처리를 건들지도 못했다. 어떻게 해야 모델을 성능을 높일 수 있을지 생각해보면 이미지 전처리를 해야 한다. 하지만 아직 잘 못하고 있다는 생각이 든다. 어떻게 해야할지 내용정리를 하면서 감을 잡아보려고 한다. 이미지 처리(Image Processing)는 컴퓨터 비전 파이프라인에서 중요한 단계이다. 이 과정은 모델의 성능과 일반화에 직접적인 영향을 미치며, 이미지로부터 의미 있는 특징(feature)과 표현(representation)을 추출하는 데 도움을 준다. 따라서 효과적인 이미지 처리를 통해 더 나은 모델 성능을 기대할 수 있다. Geometric Transformation은 이미지 처리에서 중요한 역할..
파이썬 환경 설정과 디버깅1. 파이썬 환경 설정1.1 파이썬의 버저닝파이썬을 설치할 때, 다양한 버전 중 적합한 버전을 선택하는 것이 중요합니다.파이썬 공식 홈페이지에는 여러 버전이 제공되는데, 각 버전 번호는 중요한 의미를 가지고 있습니다. 예를 들어, 3.8, 3.9, 3.10 등 버전 번호는 파이썬의 기능 추가, 성능 개선, 그리고 보안 업데이트 등을 나타냅니다.사용하려는 라이브러리가 특정 파이썬 버전과 호환되는지 확인하는 것이 매우 중요하며, 이 정보는 PyPI(Python Package Index)에서 라이브러리를 검색하여 확인할 수 있습니다. 파이썬을 설치하는 방법에는 여러 가지가 있습니다:파이썬 공식 홈페이지에서 설치 파일을 다운로드하여 설치conda를 사용해 설치Docker를 이용해 파이썬..