250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 파이싼
- 손실함수
- 그리디 알고리즘
- 9020
- 개발환경
- 오블완
- 실버
- 1002
- REST API
- 1101
- 티스토리챌린지
- REST
- 4948
- 밑바닥부터 시작하는 딥러닝
- 경사하강법
- 기계학습
- 백준
- 백트래킹
- 신경망 학습
- N-Queen
- Python
- BOJ
- n과 m
- 재귀
- end to end
- streamlit
- 가상환경
- 파이썬
- pyenv
- 15649
Archives
- Today
- Total
목록2025/04/07 (1)
파이톨치

INTERNVIDEO2요약InternVideo2는 최신 비디오 인식, 영상-텍스트 작업, 비디오 중심 대화(task)에서 최고 성능을 달성한 비디오 기반 기반 모델(Video Foundation Model, ViFM)입니다.✅ 핵심 구성점진적인 학습 전략 사용:Masked Video Modeling (비디오 마스킹 학습)Cross-modal Contrastive Learning (비디오-텍스트 간 대조 학습)Next Token Prediction (다음 토큰 예측)→ 이 세 가지를 통합하여 학습함.모델 크기: 최대 60억(6B) 파라미터로 확장됨.데이터 수준의 전략:비디오를 의미적으로 분할(semantic segmentation)비디오 + 오디오 + 음성 정보를 기반으로 자막 생성→ 이를 통해 비디오와 ..
논문
2025. 4. 7. 14:53