구글이 새로운 인공지능 모델인 Gemini 3.1 Flash Lite를 출시했습니다. 이 모델은 더 빠른 응답 속도와 더 낮은 가격을 제공하기 위해 설계되었습니다. Gemini 3 시리즈에 속하는 이 모델은 개발자와 기업이 AI 애플리케이션을 구축할 때 가장 비용 효율적이고 속도 최적화된 선택으로 자리매김했습니다.
Gemini 3.1 Flash Lite는 Google AI Studio의 Gemini API와 기업 고객을 위한 Vertex AI를 통해 미리 볼 수 있습니다.
Gemini 3.1 Flash Lite의 가격은 어떻게 되나요?
구글이 설정한 가격은 다음과 같습니다:
- 입력 토큰 100만 개당 0.25달러
- 출력 토큰 100만 개당 1.50달러
이러한 낮은 가격 구조는 번역, 챗봇 시스템 및 콘텐츠 모더레이션과 같은 높은 처리량 작업에 적합하며, 각 쿼리의 운영 비용이 중요한 경우에 이상적입니다.
이전 Gemini 모델과 비교하면 어떤가요?
구글이 인용한 벤치마크 결과에 따르면, Gemini 3.1 Flash Lite는:
- Gemini 2.5 Flash에 비해 "첫 번째 응답 토큰 시간"이 2.5배 빠릅니다.
- 출력 속도가 45% 더 빠릅니다.
- Arena.ai 순위표에서 1432의 Elo 점수를 획득했습니다.
- GPQA Diamond에서 86.9%, MMMU Pro에서 76.8%의 점수를 기록했습니다.
구글은 이 모델이 추론 및 텍스트와 이미지 처리와 같은 멀티모달 이해에서 일부 대규모 이전 세대 Gemini 모델을 능가한다고 밝혔습니다.
주요 기능은 무엇인가요?
주목할 만한 기능은 동적 사고로, 개발자가 특정 작업에 사용할 처리량을 제어할 수 있게 합니다. 이러한 유연성은 다음과 같은 작업을 지원합니다:
- 자동 번역과 같은 고빈도 AI 작업
- 실시간 콘텐츠 모더레이션
- 사용자 인터페이스 생성
- 시뮬레이션 생성
계산 강도를 조정함으로써 조직은 속도, 비용 및 출력 품질 사이의 균형을 맞출 수 있습니다.
누가 이 모델을 사용하나요?
초기 사용자로는 Latitude, Cartwheel 및 Whering과 같은 회사가 있습니다. 테스터들은 이 모델이 더 큰 AI 모델과 비슷한 정확도로 복잡한 입력을 처리하면서도 강력한 명령 수행 능력을 유지한다고 보고했습니다.
AI 개발에 어떤 의미가 있나요?
이번 출시는 인공지능 분야에서 점점 더 치열해지는 경쟁을 반영하며, 속도, 확장성 및 비용 효율성이 점점 더 중요해지고 있습니다. 기업들이 고객 서비스, 기업 자동화 및 창의적인 워크플로우에 AI를 통합함에 따라, Gemini 3.1 Flash Lite와 같은 경량 모델은 실용적인 배포 이점을 제공합니다.
결론
Gemini 3.1 Flash Lite는 더 낮은 가격과 더 빠른 응답 속도로 구글의 AI 포트폴리오를 확장했습니다. 동적 처리 및 멀티모달 작업에 대한 지원을 통해, 성능과 운영 비용 사이의 균형을 찾는 확장 가능한 AI 솔루션을 원하는 개발자와 기업을 위해 설계되었습니다.



















