250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 밑바닥부터 시작하는 딥러닝
- 백준
- pyenv
- Python
- 티스토리챌린지
- video retireval
- Retrieval
- REST API
- 경사하강법
- 파이싼
- N-Queen
- 4948
- 재귀
- 기계학습
- 15649
- 백트래킹
- n과 m
- 그리디 알고리즘
- 개발환경
- 신경망 학습
- 손실함수
- streamlit
- end to end
- BOJ
- 1101
- 9020
- 오블완
- 1002
- 가상환경
- 파이썬
Archives
- Today
- Total
목록2025/06 (1)
파이톨치

✅ 왜 이렇게 접근했는가? (Motivation)기존의 Video QA 벤치마크(Video-MME, TempCompass 등)는 대부분 언어 지식이나 프레임 단위 추론에 의존하기 때문에, 실제 "시각 기반 복잡한 추론 능력"을 평가하기 어렵습니다.이 논문은 아래 두 가지 문제의식을 기반으로 새로운 벤치마크를 제안합니다:CoT(Chain of Thought) Reasoning은 텍스트/수학/코딩에서는 성능을 높이는 데 유효한데, 비디오 이해에서는 아직 충분히 검증되지 않았다.기존 벤치마크는 대부분 "간단한 기억"이나 "정적 장면 묘사" 수준의 문제만 다루고 있어서, 정교한 연산 추적, 상태 변화 추론, 미래 예측 등의 고차원적 reasoning을 측정하지 못함.🧠 어떻게 접근했는가? (Approach)1..
논문
2025. 6. 1. 15:13