Gemini 3.1 Flash-Lite Preview 紹介レポート

概要

Gemini 3.1 Flash-Lite Previewは、Googleが2026年3月に発表した、Gemini 3シリーズの中で最も「軽量・高速・低コスト」を追求した最適化モデルです。

Gemini 3.1 Flash-Liteは、高速化とコスト効率を最大化するために設計されています。以下に主要なモデルとの比較を示します。

特徴	Gemini 3.1 Flash-Lite	Gemini 3 Flash	Gemini 3.1 Pro
主な用途	高頻度・低遅延タスク	速度と知能のバランス	高度な推論・エージェント作業
コンテキストウィンドウ	1.05 Million tokens	1 Million tokens	1.05 Million tokens
最大出力トークン	66,000	32,000	66,000
特徴	推論コストを大幅削減、Thinking Levels対応	高速応答と frontier クラスの性能	複雑な問題解決に特化

超高速レスポンス: 前世代の Gemini 2.5 Flash と比較して、最初のトークン生成までの時間（TTFT）が2.5倍高速化。
Thinking Levels: 開発者が推論の深さを調整可能。瞬時の応答が必要な場合は「最小」、正確性が求められる場合は「高」を選択できる柔軟性を持ちます。
高コスト効率: 高トラフィック環境下での運用を想定し、推論コストがProモデルと比較して非常に低く抑えられています。

詳細な技術仕様やAPIの利用については、Google AI Studioの公式ドキュメントをご確認ください。