ai-garage
← マンスリーレポート一覧
MONTHLY REPORT 2026年5月号

2026年5月:エージェント時代の本格幕開けと、Flash が Pro を超えた月

Anthropic の Code with Claude 2026、xAI × SpaceX 提携、DeepSeek の料金破壊、そして月末の Gemini 3.5 Flash 発表で Flash 系が Pro 級に並んだ激動の1か月。

公開:2026-05-22 / 執筆:Seiya Yagashiro(編集長)

KEY METRICS

今月のキー数字

15+

新発表モデル

GPT-5.5、Claude Opus 4.7、Gemini 3.5 Flash、Grok 4.3、DeepSeek V4 等

$900B

Anthropic 評価額

300億ドル調達交渉、業界最高水準

$0.14/1M

API最安値

DeepSeek V4-Flash 入力(クローズドモデル比 1/30)

76.2%

Flash 系最高ベンチ

Gemini 3.5 Flash の Terminal-Bench 2.1(Pro 級)

HIGHLIGHTS

今月のハイライト

01

Gemini 3.5 Flash 登場で「Flash が Pro 超え」

5/19 の Google I/O で発表。Terminal-Bench 76.2%・MCP Atlas 83.6% で 3.1 Pro 越え。Flash 枠が初めて Pro 級に並んだ歴史的な一手。

詳しく見る →

02

Code with Claude 2026 で Managed Agents 3機能

Multi-agent Orchestration、Outcomes、Dreaming の3機能を一気に発表。エージェントの「実装フェーズ」が確定。

詳しく見る →

03

GPT-5.5 が Codex と統合

ChatGPT・CLI・デスクトップ・Web で同一モデル。AWS Bedrock 認証も追加。料金は $5/$30 per MTok、Terminal-Bench 2.0 で 82.7%。

04

Anthropic × Gates Foundation で 2 億ドル提携

5/14、グローバルヘルス・教育・経済的流動性の3領域に Claude を投入する 4 年協業。社会実装の象徴的契約。

05

ChatGPT が「家計簿 AI」に進化

5/15、個人銀行・証券・クレカと Plaid 経由で連携。GPT-5.5 が節約プランまで提案、月 2 億人ユーザーへ展開予定。

詳しく見る →

06

動画生成 AI Runway が日本進出(63 億円)

5/15、約 4,000 万ドルで国内新会社設立。アニメ・映画・広告業界を直接狙う。日本のクリエイティブ AI 競争が始動。

詳しく見る →

07

xAI Grok 4.3 で料金破壊($1.25/$2.5)

5/1 リリース。前世代 4.20 比で料金大幅引き下げ、エージェント性能も向上。X 連携の優位性に価格優位が加わった。

08

DeepSeek V4-Pro / V4-Flash が SWE 80.6%

1.6T MoE で Claude Opus と肉薄、V4-Flash は $0.14/$0.28 の業界最安値。オープンモデル勢の本格化。

09

ai-garage 業種別ガイド開設

医療・金融・法務の AI 活用ガイドを ai-garage に新設。一次ソース付き、実務 8-12 ユースケース、規制リスク、成功事例まで包含。

詳しく見る →

SECTION 01

今月の業界全体像

2026年5月は、AIエージェントが『デモ』から『実装』に切り替わった節目の月になりました。 Anthropic が Code with Claude 2026 で Managed Agents(Multi-agent Orchestration / Outcomes / Dreaming)を一気に発表し、 OpenAI も Codex を ChatGPT 全面統合。Google は Project Mariner と Gemini Live を強化し、Microsoft は Copilot Studio で同様の動きを進めています。 月末の 5/19 Google I/O 2026 で発表された Gemini 3.5 Flash は、Terminal-Bench 2.1 で 76.2%、MCP Atlas で 83.6% を叩き出し、 上位の 3.1 Pro を主要ベンチで超える「歴史的事件」になりました。Flash 枠が Pro 級に並んだのはこれが初めてで、エージェント実装の単価が一段下がる転換点になりそうです。 価格面では、DeepSeek V4-Flash が $0.14/$0.28、Grok 4.3 が $1.25/$2.5 と料金引き下げが連鎖。 一方で GPT-5.5 は逆に値上げ($2.5/$15 → $5/$30)、Gemini 3.5 Flash も前世代 3 Flash の 3 倍。 「性能ジャンプは料金ジャンプを伴う」のがフロンティアモデルの新常識に。

SECTION 02

エージェント実装の三派

業界はエージェント実装で3つの陣営に分かれてきました。 第一に Anthropic 派:Claude Code+Managed Agents で「自律的に長時間タスクをこなす」方向。MCP プロトコルを業界標準として広めることでエコシステムを取りに行く戦略です。 第二に OpenAI 派:Codex / Operator / ChatGPT を統合した「すべてChatGPTで完結」の方向。月20ドルの Plus プランで全部使える価格優位を維持しています。 第三に Google 派:Gemini Live+Project Mariner で「マルチモーダルとブラウザ操作」を軸に、Workspace 統合の業務利用を取りに行っています。

SECTION 03

料金破壊と影響範囲

DeepSeek が口火を切った料金破壊が他社にも波及。OpenAI は GPT-5.5 で入力 $1.25/1M に下げ、Google は Gemini 2.5 Pro を $1.25/1M で提供。Anthropic は Claude Opus を $15/1M に据え置きですが、Sonnet 4.5 系では大幅値下げを発表しました。 影響範囲は『API利用前提のスタートアップ』に直接波及しており、AIサービスのプライシング戦略が再考を迫られています。具体的には、ChatGPT-API 利用の月額300〜1000ドル規模の業務用ツールが、利用料を据え置きながら裏側のコスト構造が改善し、利益率が改善する流れが見えました。

SECTION 04

日本市場の動き

Anthropic × NEC の戦略提携、アクセンチュア × Anthropic の日本本格化、JPMorgan / Goldman Sachs / Citi の Claude 採用が立て続けに発表されました。日本の大企業による導入検討フェーズが終わり、実装フェーズに入りつつあります。 国産勢では Preferred Networks の PLaMo、SB Intuitions の Sarashina、Karakuri などの動きも本格化。Hugging Face Hub での日本語モデル公開も増加傾向です。一方で、生成AI規制を巡る経済産業省・総務省のガイドライン整備も進行中で、業務利用の社内ルール整備が急務になっています。

SECTION 05

編集後記

個人的に最も印象的だったのは月末の Gemini 3.5 Flash 発表でした。「Flash がついに Pro を超えた」というのは、業界の AI モデル選定方程式を根本から書き換える出来事だと感じます。 これまで「Pro じゃないとエージェントの精度が出ない」と泣く泣く Pro を選んでた業務が、Flash で同等以上の結果を 25% 安く出せるようになる。 この変化が広がるのは 6-9 月にかけて、実務での評価サイクルを通じてからでしょう。 もう一つは、Anthropic が「Claude に広告を載せない」と明言したこと。業界の多くがインフィード広告やスポンサード回答の導入を検討する中で、Anthropic は『有料モデル一本』の覚悟を示しました。 短期的にはユーザー獲得で他社に劣後しますが、長期的には『中立性』『プライバシー』を求めるエンタープライズ顧客にとっての強力な訴求軸になります。 ai-garage 自身も今月、業種別 AI 活用ガイド(医療・金融・法務)の連載、コスパマトリクス、AI 指標源ガイド、AI 担当者向けコラムなどを一気に新設しました。 『業界の地図を整理して、初心者にもわかりやすく届ける』ことが ai-garage の役目だと改めて思った1か月でした。 来月(2026年6月)は OpenAI DevDay と Anthropic の Sonnet 5 系発表、Apple の WWDC(Apple Intelligence 第2世代)が見込まれます。 料金・性能・エージェント機能・OS 統合の4軸で、また新しい棚割が引かれそうです。

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →