Google の『Gemini 3.5 Flash』が登場!Flash なのに Pro 超え、エージェント時代の主力モデルへ
Google が 2026年5月19日、I/O 2026 で Gemini 3.5 Flash を発表。Terminal-Bench 76.2%・MCP Atlas 83.6% で Pro 越えのエージェント性能、Pro の25%安。一方で前世代 3 Flash の3倍値上げに『API 料金、もう試されてる』の声も。
やっほー、ぼくてんびん丸! 朝枠だよ。
きのう開催された Google I/O 2026 で、ついに Gemini 3.5 Flash が登場したよ。これがね、ちょっと事件レベルでバズってる。
なんで事件かというと、「Flash」なのに、上位の『3.1 Pro』を主要ベンチで超えてきたから。コーディングもエージェントも、Flash 一発で済むようになる流れが来てるよ。
ただ料金は微妙な議論があって、開発者界隈はざわついてる。後半でその空気感も整理するね。
① 何が出たの?
Gemini 3.5 Flash は、Google が 2026年5月19日に Stable(一般提供)として リリースした新しい AI モデル。Google I/O 2026 のキーノートで発表され、その日のうちに以下の場所で使えるようになったよ:
- Gemini アプリ(一般ユーザー向け)
- Google AI Studio(開発者向け)
- Gemini API(プロダクト組み込み)
- Antigravity(Google の新しいエージェントプラットフォーム)
- Google 検索の AI Mode
このラインナップ、要するに 「Google のすべての AI 機能の中核」 に Gemini 3.5 Flash が一気に組み込まれたってこと。Google が「これ、本気で全部に使うつもり」のシグナル。
② 数字で見る凄さ
ベンチマークが派手だよ:
- Terminal-Bench 2.1: 76.2%(コマンドライン作業の自走力)
- MCP Atlas: 83.6%(MCP 経由の多ステップツール連携)
- CharXiv Reasoning: 84.2%(複雑な図表・グラフ理解)
- 入力 1,048,576 トークン(1M) / 出力 65,536 トークン(64k)
- Dynamic Thinking がデフォルト ON(必要に応じて推論を深める)
これ、前世代の Gemini 3.1 Pro を多くのベンチで超えてる。「Flash(軽量・高速)枠が、Pro(高性能・高価格)枠を超えた」ってのが、シリコンバレーの開発者界隈で「ちょっと前代未聞」とザワついてる。
しかも速度は GPT-5.5 や Claude Opus と比べて 4 倍速。エージェントが何回も AI を呼び出す場面でこの速度差はデカい。
③ ただし料金は値上げ — みんなの反応
ここがね、X / 開発者界隈で議論になってる部分。
| モデル | input | output |
|---|---|---|
| Gemini 3 Flash(前世代 Preview) | $0.50 | $3.00 |
| Gemini 3.5 Flash(今回) | $1.50 | $9.00 |
| 参考: Gemini 3.1 Pro | $2 | $12 |
前世代 3 Flash 比で 約 3 倍の値上げ。3.1 Pro 比だと 約 25% 安い だけど、「Flash 枠なのに高くない?」という声多数。
X / 開発者コミュニティの反応(要約)
Simon Willison(個人開発者・有名ブロガー)系の声:
「3.5 Flash は 3 Flash Preview の 3 倍、3.1 Flash-Lite の 6 倍の料金。3 つの主要 AI ラボが全部、API 顧客の価格許容度を試しに来てるよね。」
Hacker News コミュニティ:
「性能はマジ凄い、Flash でこれは反則。ただ価格は『これがフロンティアモデルの新標準コストか…』って受け入れムード半分、抵抗半分。」
エージェント開発者層:
「Antigravity(Google の新エージェント基盤)の中核モデルがこれ。マルチエージェント自走させるなら最有力。料金上がっても結局これを使うことになりそう。」
懸念派:
「ベンチ凄いけど、ARC-AGI-2 で GPT-5.5 から 12.5pt 下。HLE(Humanity's Last Exam)も退行。エージェント特化はいいけど『純粋な推論』では Pro より後退してる場面もある。」
編集部のひとこと整理
X / Reddit / Hacker News を見るかぎり、「性能には脱帽、価格には警戒、用途次第で大化け」 ってのが大方の温度感だよ。
④ ぼくらが押さえとくべきポイント
ぼくが整理するとこんな感じ:
- エージェント実装の本命:Antigravity / マルチステップ自走 / MCP 連携を本気で使うなら、Gemini 3.5 Flash が現時点の最有力候補。Terminal-Bench と MCP Atlas で Pro 超えしてるのが何より雄弁
- コスパは『Pro 比で 25% 安』が正解:3 Flash 比で見ると割高に感じるけど、得られる性能を考えれば「Pro を諦めて Flash に降りる選択肢が初めて成立した」と捉えるべき
- 業務エージェントの設計を1段引き上げるチャンス:これまで「Pro じゃないとエージェントの精度が出ない」と Pro を選んでた業務、Flash に切り替えてコスト 25% 削減できる可能性
- 純粋推論ベンチでは Pro が上:科学リサーチ・専門知識深掘りなど『答えの正確性』が命の業務は、引き続き 3.1 Pro / Claude Opus / GPT-5.5 系を使うのが安全
- 3.1 Flash-Lite は別ポジで残ってる:$0.25 / $1.5 の更に安価な軽量枠。チャット用途・高頻度タスクなら Flash-Lite で OK
つまり、Gemini 3.5 Flash は『これまでのフラッシュ枠』じゃなく、『エージェント用の新ミッドレンジ』 と捉え直すのが正解。
⑤ ai-garage の対応
- ✅ AI モデル比較表(/compare/)に Gemini 3.5 Flash を反映済み
- ✅ コスパマトリクス(/matrix/)の散布図にもプロット済み
- ✅ Gemini モデルページ(/models#gemini)の latestVersion 更新済み
- ✅ 既存 Gemini 3 Flash / Gemini 3.1 Flash-Lite も比較対象に追加
- ⏳ Google の公式ベンチ詳細値が公開され次第、独自スコアも更新予定
エージェント実装を検討してる人は、まず Google AI Studio でちょっと触ってみるのオススメ。Pro より圧倒的に速いから、開発の試行錯誤サイクルが体感で変わるよ。
それじゃ、また次のニュースで会おうね〜!
参考・一次ソース