일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 4948
- 1101
- 기계학습
- 백준
- 파이썬
- 1002
- 개발환경
- 15649
- 그리디 알고리즘
- 티스토리챌린지
- 파이싼
- N-Queen
- n과 m
- 손실함수
- 9020
- 오블완
- pyenv
- 백트래킹
- 밑바닥부터 시작하는 딥러닝
- 신경망 학습
- 가상환경
- 실버
- REST
- REST API
- BOJ
- Python
- 재귀
- end to end
- 경사하강법
- streamlit
- Today
- Total
목록프로젝트 (9)
파이톨치

1. 다국어 CLIP 기반 대조학습 프레임워크처음에 자대 연구실에 들어가서 했던 연구이다. 2023년도 6월에 KCC에 제출했던 논문이다. (사실 이때는 연구실 처음 들어갔을 때라, 발표용 포스터 제작과 논문 일부만 작성했다.) 학습은 대조학습을 기반으로 하고 있고, 이미지에 대한 변경은 없고 텍스트를 바꾼다. 마스크드 언어 모델을 통해서, 윤 대통령을 문 대통령으로 바꾸는 식이다. 이때 형태소 분석 & 객체명 인식을 통해서 '누가', '무엇을' 했는지 등을 바꾸게 된다. 변경된 텍스트는 negative sample로 사용하여 clip 모델을 학습시킨다. 데이터는 인터넷 뉴스의 텍스트와 썸네일이다. 2. 언어모델의 소수 추론 능력 평가처음으로, 스스로 쓴 논문이다. 연구하게 된 배경은 연구실 세미나 시간..
auto GPU warning Program Python 코드에서 Discord Webhook을 사용해 GPU 메모리 상태를 Discord 채널로 알릴 수 있습니다. 이 방법을 사용하면 GPU 메모리 사용량이 일정 이상일 때 Discord 채널에 경고 메시지를 자동으로 전송할 수 있습니다.우선, Discord 채널에 Webhook을 설정하고 URL을 확보해야 합니다. 이후 Python 코드에서 requests 라이브러리를 사용해 Webhook URL로 메시지를 전송할 수 있습니다.단계 1: Discord Webhook 설정Discord에서 메시지를 전송할 채널로 이동합니다.채널 설정 → "앱 통합" → "웹훅"으로 이동합니다."새 웹훅"을 클릭하고 원하는 이름과 채널을 선택한 후 "웹훅 URL 복사" 버..

first, open vscode and select clone git repo insert your git repo url then you can see thate repo cloned your computer. if you change your file, you can see that mark. setting git config git config --global user.name ~~~ git config --global user.email ~~~ git branch -M main but if you committed, github remote repo doesn't changed. if you sync changes... or push your commit you can see..

# train 상위 10% 데이터 분석 강의에서 배운 2D 히스토 그램을 써보았음. 단순 scatter 하는 것보다 밀집도를 보기 편함. x_8 데이터가 중요하지 않다고 생각했는데, x_8 값이 0.60보다 작을 때 밀집도가 높은 것을 볼 수 있음. 때문에 해당 데이터가 test에서 중요한 영향을 끼칠 것 같음. 그래서 x_8 데이터에서 x_8값이 0.58보다 작을 때 가중치를 부여하거나 오버샘플링하는 방식으로 학습을 해야 할 것이라는 생각이 들었음. 그러면 오버 샘플링을 해야하는게 아닐까? 하는 생각이 든다. 그래서 데이터를 더 이어 붙여주었더니, 데이터 분포가 비슷해졌다!! 아 이거다!! # train 상위 5% 데이터 분석 5퍼센트일 때는 그 경향성이 더 두드러진다. 이때, 경계가 더욱 명확해..

기본 전처리 사용 데이터는 AI 허브의 감성 대화 말뭉치이다. df_train = pd.read_excel('train.xlsx', engine='openpyxl') df_test = pd.read_excel('test.xlsx', engine='openpyxl') df_train.replace(np.nan, '', inplace=True) ls = {} df = pd.DataFrame(ls) df['문장'] = df_train[['사람문장1', '사람문장2', '사람문장3', '사람문장4']].apply(' '.join, axis =1) df['감정'] = df_train['감정_대분류'] df['문장'].replace('', np.nan, inplace=True) print(df.isnull().va..
Mecab 오류 : Exception: Install MeCab in order to use it: http://konlpy.org/en/latest/install/ 오류를 해결하기 위해서 저 링크를 타고 들어갔다. bash

감정 분류를 하고 싶을 때, 어떻게 해야할까? 라벨링이 된 데이터를 사용해서 모델을 학습시켜야 한다. 하지만 데이터를 어디서 가져올지 모른다. 대회를 하는 경우 데이터를 주지만 그렇지 않은 경우에는 내가 데이터를 수집해야 한다. 그럴경우 공공데이터와 같은 데이터를 사용할 수 있다. 나는 AI Hub 라는 사이트를 이용하였다. https://www.aihub.or.kr/ 사이트에 들어가 감성 대화 말뭉치라는 데이터를 사용할 것이다. 3.7 기가라고 되어있지만 내가 사용할 데이터는 20메가도 되지 않는다. 데이터는 다음과 같은 형태로 되어있다. 나는 여기서 감정_대분류 열을 사용해서 감정 분류를 할 생각이다. 데이터를 살펴보면 사람문장과 시스템응답으로 되어있다. 사람문장에 감정이 있다. 시스템응답은 챗봇을 ..

df_train = pd.read_excel('train.xlsx', engine='openpyxl') df_test = pd.read_excel('test.xlsx', engine='openpyxl') 다음과 같은 코드를 돌리려고 했을 때 ImportError: Missing optional dependency 'openpyxl'. Use pip or conda to install openpyxl. 라는 오류가 떴다. 해결법은 간단했다. openpyxl 라이브러리를 설치해주면 된다. conda install openpyxl 만 해주면 문제 해결이다.