일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- N-Queen
- 파이썬
- end to end
- 신경망 학습
- 기계학습
- 가상환경
- 백준
- 4948
- 실버
- 경사하강법
- 1101
- 손실함수
- Mac
- pyenv
- 파이싼
- 밑바닥부터 시작하는 딥러닝
- 그리디 알고리즘
- streamlit
- Python
- 1002
- 9020
- n과 m
- BOJ
- 설정
- 재귀
- 개발환경
- 백트래킹
- 15649
- Today
- Total
목록분류 전체보기 (181)
파이톨치
Mecab 오류 : Exception: Install MeCab in order to use it: http://konlpy.org/en/latest/install/ 오류를 해결하기 위해서 저 링크를 타고 들어갔다. bash
감정 분류를 하고 싶을 때, 어떻게 해야할까? 라벨링이 된 데이터를 사용해서 모델을 학습시켜야 한다. 하지만 데이터를 어디서 가져올지 모른다. 대회를 하는 경우 데이터를 주지만 그렇지 않은 경우에는 내가 데이터를 수집해야 한다. 그럴경우 공공데이터와 같은 데이터를 사용할 수 있다. 나는 AI Hub 라는 사이트를 이용하였다. https://www.aihub.or.kr/ 사이트에 들어가 감성 대화 말뭉치라는 데이터를 사용할 것이다. 3.7 기가라고 되어있지만 내가 사용할 데이터는 20메가도 되지 않는다. 데이터는 다음과 같은 형태로 되어있다. 나는 여기서 감정_대분류 열을 사용해서 감정 분류를 할 생각이다. 데이터를 살펴보면 사람문장과 시스템응답으로 되어있다. 사람문장에 감정이 있다. 시스템응답은 챗봇을 ..
df_train = pd.read_excel('train.xlsx', engine='openpyxl') df_test = pd.read_excel('test.xlsx', engine='openpyxl') 다음과 같은 코드를 돌리려고 했을 때 ImportError: Missing optional dependency 'openpyxl'. Use pip or conda to install openpyxl. 라는 오류가 떴다. 해결법은 간단했다. openpyxl 라이브러리를 설치해주면 된다. conda install openpyxl 만 해주면 문제 해결이다.
프로젝트를 시작할 때 가상환경 만들기 가상환경 만들기 conda create -n 가상환경 conda create -n 가상환경 python == 버전 가상환경 활성화 conda activate 가상환경 가상환경 삭제 conda env remove -n 가상환경 가상환경에 필요한 라이브러리 설치 나에게 필요한 라이브러리 정리 numpy matplotlib pandas tensorflow konlpy sklearn conda install 라이브러리 sklearn 라이브러리는 conda install scikit-learn 으로 입력해야 문제가 없음. 기타 오류 The Kernel crashed while executing code in the the current cell or a previous cel..
Greedy Algorithm 그리디 알고리즘은 알고리즘의 한 종류이다. 그리디 알고리즘에서 Greedy 는 탐욕을 뜻한다. 이 알고리즘은 미래의 상황을 따지지 않는다. 그 상황에서 가장 좋은 선택을 한다. 위키백과에는 다음과 같이 정의되어 있다. A greedy algorithm is any algorithm that follows the problem-solving heuristic of making the locally optimal choice at each stage 하지만 여기서 알고리즘을 푸는 우리가 생각할 것은 현재 상태에서 무엇이 최선의 선택인가일 것이다. 매번 좋은 선택을 하면 최고이겠지만 매번 멍청한 선택을 하면 나락이다. 수리공 상승 문제 문제를 보면서 이해를 해보자. 문제 링크는 ..
Statistical thinking for programmers https://greenteapress.com/thinkstats/thinkstats.pdf 이 글은 위 책을 기반으로 작성되었다. 무료로 배포 되어 있으니 참고하길 바란다. 서론 이 책은 데이터를 다루는 방법에 대해 알려주고 있다. 프로그래머들이 일하면서 데이터를 다룰 일이 많고 데이터 사이언티스트는 더욱 더 많다. 때문에 우리는 어떻게 해야 데이터로 가치를 생산할지를 고민해보아야 한다. 저자는 3가지 키워드를 던진다. 확률 / 통계 / 계산 이다. 확률은 무작위 사건에 대한 연구이다. 대부분의 사람들은 확률에 대한 직관적인 이해를 가지고 있다. 우리가 "아마도" 라는 단어를 쓰는 것은 이 때문일 것이다. 하지만 우리는 직관적인 이해보다..
[문제 출처] https://www.acmicpc.net/problem/18258 18258번: 큐 2 첫째 줄에 주어지는 명령의 수 N (1 ≤ N ≤ 2,000,000)이 주어진다. 둘째 줄부터 N개의 줄에는 명령이 하나씩 주어진다. 주어지는 정수는 1보다 크거나 같고, 100,000보다 작거나 같다. 문제에 나와있지 www.acmicpc.net [어떻게 풀까?] 처음엔 굉장히 간단하게 생각했다. 문제 구현이 복잡한 것도 아니고 어려운 알고리즘을 구성하는 것도 아니었기 때문이다. 하지만 당연하게도 시간초과가 뜨고 말았다. 왜 그런가 생각해 봤다. 이 문제는 큐에 관한 문제이다. 하지만 큐도 사용하지 않고 문제를 풀려고 했기 때문에 시간초과가 뜬 것은 어찌보면 당연한 일이다. 파이썬에서 큐에 대해 사용..
[문제 및 출처] https://www.acmicpc.net/problem/11399 11399번: ATM 첫째 줄에 사람의 수 N(1 ≤ N ≤ 1,000)이 주어진다. 둘째 줄에는 각 사람이 돈을 인출하는데 걸리는 시간 Pi가 주어진다. (1 ≤ Pi ≤ 1,000) www.acmicpc.net [내용] 이건 그냥 하면 된다. 순서대로 정렬하고 더해주기. [코드] n = int(input()) array = list(map(int, input().split())) array.sort() result = 0 for i in range(n): result += (array[i] * (n-i)) print(result)