파이톨치

[데이터 수집] AI 허브 이용하기 본문

프로젝트

[데이터 수집] AI 허브 이용하기

파이톨치 2022. 9. 3. 14:13
728x90

감정 분류를 하고 싶을 때, 어떻게 해야할까? 

 

라벨링이 된 데이터를 사용해서 모델을 학습시켜야 한다. 하지만 데이터를 어디서 가져올지 모른다.

대회를 하는 경우 데이터를 주지만 그렇지 않은 경우에는 내가 데이터를 수집해야 한다.

 

그럴경우 공공데이터와 같은 데이터를 사용할 수 있다.

 

나는 AI Hub 라는  사이트를 이용하였다.

 

https://www.aihub.or.kr/

사이트에 들어가 감성 대화 말뭉치라는 데이터를 사용할 것이다.

 

3.7 기가라고 되어있지만 내가 사용할 데이터는 20메가도 되지 않는다. 

 

데이터는 다음과 같은 형태로 되어있다. 

 

나는 여기서 감정_대분류 열을 사용해서 감정 분류를 할 생각이다. 

 

데이터를 살펴보면 사람문장과 시스템응답으로 되어있다.

 

사람문장에 감정이 있다. 시스템응답은 챗봇을 만들 상황을 생각해서 들어있는 것 같다.

 

 

 

 

 

728x90