일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 가상환경
- 파이썬
- pyenv
- Mac
- 백트래킹
- 기계학습
- 그리디 알고리즘
- n과 m
- 손실함수
- 재귀
- 신경망 학습
- 실버
- 백준
- 1101
- streamlit
- 경사하강법
- 설정
- 9020
- end to end
- 개발환경
- 밑바닥부터 시작하는 딥러닝
- 4948
- N-Queen
- Python
- 파이싼
- 15649
- 1002
- BOJ
- Today
- Total
목록2024/08/20 (2)
파이톨치
# train 상위 10% 데이터 분석 강의에서 배운 2D 히스토 그램을 써보았음. 단순 scatter 하는 것보다 밀집도를 보기 편함. x_8 데이터가 중요하지 않다고 생각했는데, x_8 값이 0.60보다 작을 때 밀집도가 높은 것을 볼 수 있음. 때문에 해당 데이터가 test에서 중요한 영향을 끼칠 것 같음. 그래서 x_8 데이터에서 x_8값이 0.58보다 작을 때 가중치를 부여하거나 오버샘플링하는 방식으로 학습을 해야 할 것이라는 생각이 들었음. 그러면 오버 샘플링을 해야하는게 아닐까? 하는 생각이 든다. 그래서 데이터를 더 이어 붙여주었더니, 데이터 분포가 비슷해졌다!! 아 이거다!! # train 상위 5% 데이터 분석 5퍼센트일 때는 그 경향성이 더 두드러진다. 이때, 경계가 더욱 명확해..
데이터 분석# 고전 통계과거 통계적 데이터 분석의 핵심은 추론이었다. 표본 데이터(수집된 데이터)를 통해서 모집단(전체 데이터)의 특징을 아는 것이었다. 예를 들어, 대푯값, 분포와 밀도, 상관관계, 가설 검정 등이 있다. 현대에서는 데이터에 대해 해석, 의사 결정, 예측이 필요하다.의사 결정의 보조 지표로 활용하기도 한다. 다양한 장애물들이 있는데,명확한 목적이 없고, 잘못된 목적이 있을 수 있고,데이터와 리소스의 부재가 있고,데이터에 # 데이터 문해력데이터 문해력이 중요하다. 이는 데이터를 건전한 목적과 윤리적인 방법으로 사용한다는 전제 하에,현실 세상의 문제에 대한 끊임없는 탐구를 통해 질문하고 답하는 능력이다. 1. 좋은 질문을 할 수 있는 역량 (나는 이게 굉장히 중요하지만, 어렵다고 생..