250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 그리디 알고리즘
- 1101
- 4948
- 백트래킹
- Python
- 재귀
- 백준
- 1002
- BOJ
- 밑바닥부터 시작하는 딥러닝
- 파이싼
- Mac
- 경사하강법
- 9020
- 신경망 학습
- 가상환경
- 파이썬
- n과 m
- 개발환경
- 실버
- pyenv
- 손실함수
- N-Queen
- 기계학습
- end to end
- 설정
- 15649
- streamlit
Archives
- Today
- Total
파이톨치
[확률과 통계] 기술 통계 본문
728x90
# 기술통계
descriptive : 서술하는, 기술적인 이라는 뜻을 가짐
결국 샘플 데이터 셋을 관측해서 분석, 통계적인 추론을 해서 발생하는 현상의 특성을 추청하는 것이다.
동전 던지기를 관측한다거나 과자 한 봉지의 양을 세보는 것이 샘플의 관측이다.
이러한 데이터들은 우리가 알지 못하는 어떤 확률에 의해서 결정된다.
예를 들어 동전 던지깅는 1/2에 가까운 확률이다.
샘플 데이터의 질은 모집단이 중요한 역할을 한다. 이게 무슨 말인지 생각해보자.
## 모집단
우리가 관심 있는 대상의 전체 집합을 말한다.
예를 들어서 전국 마트에서 팔고 있는 홈런볼의 과자 수이다.
하지만 전체 모집단은 너무나 크다 그걸 언제 세고 있겠냐... 그래서 표본을 모으는 샘플링을 한다.
참고로, 전체를 모두 조사하는 것을 전수조사라고 한다.
## Sampling 방법
다양한 방법이 있다.
무작위 추출 / 계통 추출 / 층화 추출법 / 집락 추출법
계통 추출은 하나를 고리고 k번씩 건너뛰어 고르는 방법이다.
층화 추출법은 계층을 나누어 계층별로 추출하는 것이다.
집락 추출법은 집단을 일단 구분하고 집단마다 샘플링을 하는 것이다.
## 변수의 종류
위와 같이 명확하게 종류가 구분되는 것을 범주형 변수라고 한다.
연속적 변수 / 불연속적 변수 / 범주형 변수가 있다.
# ## 데이터를 보여주는 방법으로는,
Bar 차트, 파레토 차트, 파이차트, 히스토 그램 등이 있다.
# 평균과 분산
평균 -> 산술평균, 기하평균, 조화 평균
트림드는 상하위 5퍼센트 잘라낸 것임
n-1인 이유는 비편향 추정치 때문이라는데...
# 확률분포
728x90
'대학수업' 카테고리의 다른 글
[시스템 프로그래밍] Exceptional Control Flow (0) | 2022.11.13 |
---|---|
[JavaScript] 연산자 (0) | 2022.11.04 |
[웹 프로그래밍] 자바 스크립트 (0) | 2022.11.04 |
[웹 프로그래밍] HTML ~ CSS (0) | 2022.10.11 |
[시스템 프로그래밍] 컴퓨터의 정수와 실수 (0) | 2022.10.10 |