일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- N-Queen
- 밑바닥부터 시작하는 딥러닝
- 9020
- 1002
- 실버
- 경사하강법
- 설정
- 파이싼
- n과 m
- streamlit
- 신경망 학습
- 1101
- Mac
- 파이썬
- BOJ
- 개발환경
- 재귀
- Python
- 15649
- 기계학습
- 백트래킹
- 백준
- 가상환경
- 그리디 알고리즘
- 4948
- end to end
- pyenv
- 손실함수
- Today
- Total
목록전체 글 (181)
파이톨치
소프트웨어 엔지니어링전통적인 소프트웨어 엔지니어링은 소프트웨어 개발 과정에서 체계적이고 효율적인 방법을 사용하여 소프트웨어의 품질과 유지 보수성을 보장하는 학문이다. AI 역시 소프트웨어의 일종이며, 집중하는 문제가 다를 뿐 본질적으로는 소프트웨어 개발의 원칙에서 크게 벗어나지 않는다.좋은 소프트웨어는 모듈화가 잘 되어 있어야 하며, 코드 간의 의존성이 낮아야 한다. 각 기능이 독립적으로 동작해야 하며, 필요에 따라 쉽게 재사용될 수 있어야 한다. 코드를 레고 블록에 비유할 수 있는데, 각 블록을 잘 조립하면 멋진 결과물이 나오듯, 소프트웨어도 잘 설계된 모듈을 적절히 조합할 때 완성도가 높아진다. 또한, 소프트웨어는 철저히 테스트되어야 한다. 실제 환경에서 코드가 문제없이 작동하는지, 예기치 않은 변수..
2D 이미지를 이용해서 3D 형태를 만들 수 있을까? 이 질문에서 시작되는 분야라고 생각된다. 사진 한번 찍고, 90도 돌아가서 한번 더 찍으면 될거 같다. 우리가 세상을 인식하는 방식도 사실 비슷하다. 명암을 보고, 이리저리 둘러보고 사물을 파악한다. 우리의 머리 속에 세상을 이해하는 모델이 있고, 그 모델대로 세상을 이해한다. 그렇기에 사람마다 세상을 이해하는 방식이 제각각 다르다. 컴퓨터도 동일하다. 하지만 인간과의 차이점은 융통성이 없다는 점이다. 그래서 수식적으로 세상을 계산한다. Structure from Motion(SfM)이라고 하는 방식인 모양인데, 잘 모르겠으니 chatgpt한테 물어보자. Structure from Motion (SfM)은 컴퓨터 비전과 포토그래메트리 분야에서 사용되..
Diffusion 모델Diffusion 모델은 수식이 좀 나온다. 사실, 이론은 재미 없다. 하지만 알아야 한다. 하지만 이론부터 배우기엔 내 뇌는 참을성이 없다. 그러니 결과부터 보자. 대박이다. 진짜. 그림을 좋아하는 입장에서 저런 고퀄리티의 그림을 빠른 시간에 뽑아낼 수 있는 기술은 놀랍다. 단순히 텍스트만 넣어주면 고퀄리티의 그림이 나오는 것이다. 사실 사용만 하는 입장에서는 몰라도 되는 것이다. 하지만, 원리를 알면 더 재밌지 않을까? (아니 사실 원리 노잼이다.) Denoising Diffusion Probabilistic ModelsDiffusion은 확산을 의미한다. 여기서 확산은 노이즈가 추가되는 것을 의미하는 모양이다.이미지가 노이즈에서 시작해서 원래 이미지로 복구된다. 그 과정에서 ..
CLIPMulti Modal Model 최근 LLM에 이어서 LMM이 유행이다. 이것은 Large Multimodal Model의 약자이다. 하지만, 사람들은 아직 LMM에 대해 잘 알지 못한다. 멀티 모달이라고 하는 것은 하나의 인지분야만 사용하는 것이 아니다. 예를 들어, 시각, 청각, text에 대한 이해는 모두 하나에 대한 모달리티이다. 우리의 목적은 이것들을 여러개 사용하겠다는 것이다. 이러한 적용은 대표적으로 text to image 모델들이 있다. 텍스트를 넣으면 그에 맞는 이미지가 나오는 디퓨전 모델이다. 이러한 멀티 모달 분야에는 Maching, Translating, Referencing 방식의 학습이 있다.CLIP 모델의 경우 Matching 형태로 학습이 된다. (플라밍고 모델..
https://www.techspot.com/downloads/downloadnow/1969/?evp=aeae0304eece96beff922bd24ecbb849&file=2171 VMware PlayerRun virtual machines created by VMware Workstation, GSX Server or ESX Server.www.techspot.com https://leirbag.tistory.com/145 Windows에서 VMware를 이용하여 Ubuntu 설치 및 설정하기 (+ 프론트엔드 기본 설정)최근 맥과 윈도우를 왔다갔다 하면서 개발을 하다보니 여러가지 문제를 겪었습니다. 집에 있을 때에는 윈도우 환경에서 개발을 하고, 밖에서는 맥을 사용해왔는데요, 사실 대부분의 상황에서는le..
최근 Grad-CAM에 대해 공부하면서 의문점이 생긴 것이 있어 정리한다. CNN 같은 경우에 역전파가 어떻게 진행되는지이다. 생각해보면 cnn의 경우 가중치를 공유하는 형태가 될 것이다. 스트라이드가 진행되면서 커널을 공유한다. 그렇다면 학습은 어떻게 할까? PyTorch의 CNN(Convolutional Neural Network)에서 커널(kernel)도 학습 가능한 파라미터입니다.커널의 값은 네트워크의 학습 과정에서 업데이트되는 가중치로 간주됩니다. 따라서 커널 자체가 학습의 대상입니다. 커널과 연결된 "가중치"만 학습되는 것이 아니라, 커널의 값(필터 값)도 학습을 통해 최적화됩니다.CNN에서 커널의 역할커널(필터): CNN에서 커널은 필터로도 불리며, 이미지나 입력 데이터의 특정한 패턴을 감지..
지난 글과 바로 이어지는 내용이다. 참고하도록 하자. https://jung0228.tistory.com/205 [BoostCamp AI Tech] Computer Vison OverviewComputer Visoncv (computer vison)은 가장 수요가 높은 분야 중 하나이다. 네이버 부스트캠프에서도 인원이 가장 많다. 또 응용할 수 있는 부분이 많다. (채용 공고도 많은 거 같다.)그렇기 때문에, 여기jung0228.tistory.com 지난 글에서는 CNN에 대해 다루었다. 이번 시간에는 신경망을 시각화하는 방법에 대해 다루려 한다. 파라미터를 분석하는 필터 시각화, 특징을 분석하는 t-SNE, GradCAM, DeepLIFT 등이 있다. 이러한 방법론은 모델에 대해 잘 이해하기 위한 것이..
Computer Visoncv (computer vison)은 가장 수요가 높은 분야 중 하나이다. 네이버 부스트캠프에서도 인원이 가장 많다. 또 응용할 수 있는 부분이 많다. (채용 공고도 많은 거 같다.)그렇기 때문에, 여기부터는 조금 힘을 주어 정리해보려고 한다. 나에게 필요한 내용도 많고 재밌는 내용도 많다. 이번엔 Overview인 만큼, 코드를 빼고 간단하게 보자. 신경망 구조 바로, 본론으로 들어가보자. 현대의 인공지능은 신경망 구조를 통해 돌아간다. 이미지를 숫자로 해석하고 이를 행렬곱 연산한다. 이렇게 보면 굉장히 간단한 수학이다. 하지만 그 결과는 간단하지 않고 오히려 위대하다. 한가지 재밌는 점은 저러한 가중치 또한 하나의 이미지 형태를 뛰기도 한다는 점이다. 아래는 각각의 클래스에..