250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- end to end
- 설정
- 손실함수
- 그리디 알고리즘
- 경사하강법
- 백트래킹
- 파이썬
- 파이싼
- 실버
- BOJ
- 4948
- 9020
- 백준
- 밑바닥부터 시작하는 딥러닝
- N-Queen
- 신경망 학습
- streamlit
- 기계학습
- pyenv
- 1002
- Mac
- 1101
- n과 m
- 재귀
- 개발환경
- 15649
- Python
- 가상환경
Archives
- Today
- Total
파이톨치
[데이터 수집] AI 허브 이용하기 본문
728x90
감정 분류를 하고 싶을 때, 어떻게 해야할까?
라벨링이 된 데이터를 사용해서 모델을 학습시켜야 한다. 하지만 데이터를 어디서 가져올지 모른다.
대회를 하는 경우 데이터를 주지만 그렇지 않은 경우에는 내가 데이터를 수집해야 한다.
그럴경우 공공데이터와 같은 데이터를 사용할 수 있다.
나는 AI Hub 라는 사이트를 이용하였다.
사이트에 들어가 감성 대화 말뭉치라는 데이터를 사용할 것이다.
3.7 기가라고 되어있지만 내가 사용할 데이터는 20메가도 되지 않는다.
데이터는 다음과 같은 형태로 되어있다.
나는 여기서 감정_대분류 열을 사용해서 감정 분류를 할 생각이다.
데이터를 살펴보면 사람문장과 시스템응답으로 되어있다.
사람문장에 감정이 있다. 시스템응답은 챗봇을 만들 상황을 생각해서 들어있는 것 같다.
728x90
'프로젝트' 카테고리의 다른 글
[Dacon] Samsung AI Challenge 2024 (0) | 2024.08.20 |
---|---|
[데이터 전처리] Mecab 을 사용하여 단어를 토큰화하기 (3) | 2022.09.03 |
[Mecab 오류] Exception: Install MeCab in order to use it: http://konlpy.org/en/latest/install/ (0) | 2022.09.03 |
[오류 해결] ImportError: Missing optional dependency 'openpyxl'. (0) | 2022.09.03 |
[프로젝트] 가상환경 설정하기 (0) | 2022.09.03 |