[2025년 49째주] MetaX 주간 AI 동향 리포트

DeepSeek, Mistral, Gemini 등의 최신 LLM 성능 경쟁과 텍스트-투-비디오 모델의 발전
Google Workspace Studio, Anthropic Interviewer 등 AI 에이전트 및 워크플로우 통합 가속화와 모델 정밀화 전략

최신 모델 출시 및 성능 경쟁

DeepSeek은 V3.2 모델을 공개하며 GPT-5와 성능이 일치한다고 주장하며, 특히 계산 능력이 더 높은 V3.2-Speciale 변종은 Gemini-3.0-Pro와 경쟁하고 IMO, IOI, ICPC 2025에서 금메달을 획득했다. Mistral 또한 새로운 모델군인 Mistral 3를 출시했는데, 여기에는 3개의 덴스 모델(14B, 8B, 3B)과 41B의 활성 파라미터를 가진 스파스 MoE 모델인 Mistral Large 3가 포함된다. 이 모든 Mistral 3 모델들은 Apache 2.0 라이선스 하에 오픈 소스로 제공된다.

텍스트-투-비디오 생성 영역에서는 Runway Gen-4.5가 Artificial Analysis 벤치마크에서 Veo 3와 Sora를 능가하는 최고 성적을 기록했다. 이 모델은 사실적인 운동량, 유체 역학적 움직임, 재료 일관성 같은 물리적 정확성을 강조하지만, 객체 영속성(object permanence) 문제와 같은 지속적인 과제들이 있음을 인정하고 있다. 또한 STARFlow와 STARFlow-V는 트랜스포머 자기 회귀 흐름 아키텍처를 도입하여 고품질 이미지 및 비디오 생성을 위한 최신 기술을 선보였는데, 이는 자기 회귀 모델의 표현력과 정규화 흐름의 효율성을 결합한 것이다.

Google의 Gemini 3 Deep Think는 현재 Gemini 앱에서 사용할 수 있으며, 이는 병렬 추론을 사용하여 여러 가설을 동시에 탐색하는 기능을 제공한다. 이 모델은 국제 수학 올림피아드에서 금메달을 획득한 Gemini 2.5 Deep Think 변종을 기반으로 개발되었다. 한편, OpenAI는 GPT-5.1-Codex-Max에서 최적의 결과를 얻는 방법을 제시했는데, 이는 더 빠른 토큰 효율성, 장기간의 자율성 및 확장된 추론을 위한 향상된 압축 능력을 특징으로 한다.

[2025년 49째주] MetaX 주간 AI 동향 리포트

최신 모델 출시 및 성능 경쟁

관련 기사

바다는 알고 있었을 것이다

자리에 맞는 태도

정체성은 변하는가, 드러나는가