News 2026年5月20日

Google の『Gemini 3.5 Flash』が登場！Flash なのに Pro 超え、エージェント時代の主力モデルへ

Google が 2026年5月19日、I/O 2026 で Gemini 3.5 Flash を発表。Terminal-Bench 76.2%・MCP Atlas 83.6% で Pro 越えのエージェント性能、Pro の25%安。一方で前世代 3 Flash の3倍値上げに『API 料金、もう試されてる』の声も。

Seiya Yagashiro

Editor-in-Chief, ai-garage

#Google #Gemini #Gemini 3.5 Flash

Google の『Gemini 3.5 Flash』が登場！Flash なのに Pro 超え、エージェント時代の主力モデルへ

やっほー、ぼくてんびん丸！朝枠だよ。

きのう開催された Google I/O 2026 で、ついに Gemini 3.5 Flash が登場したよ。これがね、ちょっと事件レベルでバズってる。

なんで事件かというと、「Flash」なのに、上位の『3.1 Pro』を主要ベンチで超えてきたから。コーディングもエージェントも、Flash 一発で済むようになる流れが来てるよ。

ただ料金は微妙な議論があって、開発者界隈はざわついてる。後半でその空気感も整理するね。

① 何が出たの？

Gemini 3.5 Flash は、Google が 2026年5月19日に Stable（一般提供）として リリースした新しい AI モデル。Google I/O 2026 のキーノートで発表され、その日のうちに以下の場所で使えるようになったよ：

Gemini アプリ（一般ユーザー向け）
Google AI Studio（開発者向け）
Gemini API（プロダクト組み込み）
Antigravity（Google の新しいエージェントプラットフォーム）
Google 検索の AI Mode

このラインナップ、要するに 「Google のすべての AI 機能の中核」 に Gemini 3.5 Flash が一気に組み込まれたってこと。Google が「これ、本気で全部に使うつもり」のシグナル。

② 数字で見る凄さ

ベンチマークが派手だよ：

Terminal-Bench 2.1: 76.2%（コマンドライン作業の自走力）
MCP Atlas: 83.6%（MCP 経由の多ステップツール連携）
CharXiv Reasoning: 84.2%（複雑な図表・グラフ理解）
入力 1,048,576 トークン（1M） / 出力 65,536 トークン（64k）
Dynamic Thinking がデフォルト ON（必要に応じて推論を深める）

これ、前世代の Gemini 3.1 Pro を多くのベンチで超えてる。「Flash（軽量・高速）枠が、Pro（高性能・高価格）枠を超えた」ってのが、シリコンバレーの開発者界隈で「ちょっと前代未聞」とザワついてる。

しかも速度は GPT-5.5 や Claude Opus と比べて 4 倍速。エージェントが何回も AI を呼び出す場面でこの速度差はデカい。

③ ただし料金は値上げ — みんなの反応

ここがね、X / 開発者界隈で議論になってる部分。

モデル	input	output
Gemini 3 Flash（前世代 Preview）	$0.50	$3.00
Gemini 3.5 Flash（今回）	$1.50	$9.00
参考: Gemini 3.1 Pro	$2	$12

前世代 3 Flash 比で 約 3 倍の値上げ。3.1 Pro 比だと 約 25% 安い だけど、「Flash 枠なのに高くない？」という声多数。

X / 開発者コミュニティの反応（要約）

Simon Willison（個人開発者・有名ブロガー）系の声:

「3.5 Flash は 3 Flash Preview の 3 倍、3.1 Flash-Lite の 6 倍の料金。3 つの主要 AI ラボが全部、API 顧客の価格許容度を試しに来てるよね。」

Hacker News コミュニティ:

「性能はマジ凄い、Flash でこれは反則。ただ価格は『これがフロンティアモデルの新標準コストか…』って受け入れムード半分、抵抗半分。」

エージェント開発者層:

「Antigravity（Google の新エージェント基盤）の中核モデルがこれ。マルチエージェント自走させるなら最有力。料金上がっても結局これを使うことになりそう。」

懸念派:

「ベンチ凄いけど、ARC-AGI-2 で GPT-5.5 から 12.5pt 下。HLE（Humanity's Last Exam）も退行。エージェント特化はいいけど『純粋な推論』では Pro より後退してる場面もある。」

編集部のひとこと整理

X / Reddit / Hacker News を見るかぎり、「性能には脱帽、価格には警戒、用途次第で大化け」 ってのが大方の温度感だよ。

④ ぼくらが押さえとくべきポイント

ぼくが整理するとこんな感じ：

エージェント実装の本命：Antigravity / マルチステップ自走 / MCP 連携を本気で使うなら、Gemini 3.5 Flash が現時点の最有力候補。Terminal-Bench と MCP Atlas で Pro 超えしてるのが何より雄弁
コスパは『Pro 比で 25% 安』が正解：3 Flash 比で見ると割高に感じるけど、得られる性能を考えれば「Pro を諦めて Flash に降りる選択肢が初めて成立した」と捉えるべき
業務エージェントの設計を1段引き上げるチャンス：これまで「Pro じゃないとエージェントの精度が出ない」と Pro を選んでた業務、Flash に切り替えてコスト 25% 削減できる可能性
純粋推論ベンチでは Pro が上：科学リサーチ・専門知識深掘りなど『答えの正確性』が命の業務は、引き続き 3.1 Pro / Claude Opus / GPT-5.5 系を使うのが安全
3.1 Flash-Lite は別ポジで残ってる：$0.25 / $1.5 の更に安価な軽量枠。チャット用途・高頻度タスクなら Flash-Lite で OK

つまり、Gemini 3.5 Flash は『これまでのフラッシュ枠』じゃなく、『エージェント用の新ミッドレンジ』 と捉え直すのが正解。

⑤ ai-garage の対応

✅ AI モデル比較表（/compare/）に Gemini 3.5 Flash を反映済み
✅ コスパマトリクス（/matrix/）の散布図にもプロット済み
✅ Gemini モデルページ（/models#gemini）の latestVersion 更新済み
✅ 既存 Gemini 3 Flash / Gemini 3.1 Flash-Lite も比較対象に追加
⏳ Google の公式ベンチ詳細値が公開され次第、独自スコアも更新予定

エージェント実装を検討してる人は、まず Google AI Studio でちょっと触ってみるのオススメ。Pro より圧倒的に速いから、開発の試行錯誤サイクルが体感で変わるよ。

それじゃ、また次のニュースで会おうね〜！

参考・一次ソース

→ 一次ソース