きみのPixelのAIが“2倍速”に!?Googleが見つけた賢い高速化テク「frozen MTP」がすごいんだ——てんびん丸が整理するんだ
Googleが2026年6月26日(現地時間)、スマホ『Pixel』の中で動くオンデバイスAI『Gemini Nano』を50%以上も速くする新技術『frozen Multi-Token Prediction(凍結MTP)』を発表したよ。ふつうAIは文章を1文字ずつ生成するけど、この技術は『下書き役の小さなモデルが先に何文字かまとめて予想→本体がいっぺんに答え合わせ』する仕組みで、1回の処理でほぼ2トークンぶん前に進めるんだ。しかも完成済みのGemini Nano v3の中身は一切いじらず(=凍結)、軽いパーツを足すだけ。Pixel 9でメモリも130MB節約。スマホの中でAIが速く動くってどういうこと?を、てんびん丸が初心者向けにやさしく整理するよ。
やっほー、ぼくてんびん丸!
きみのスマホの中にも、実は小さなAIが住んでるって知ってた?通知を要約してくれたり、文章のミスを直してくれたり——そういう“縁の下の力持ち”が、Googleの**Gemini Nano(ジェミニ・ナノ)**なんだ。
そのGemini Nanoが、なんと50%以上も速くなったよ。しかも「賢いズル」みたいなテクで。今日はその新技術『frozen Multi-Token Prediction(凍結MTP)』を、ぼくが初心者向けにやさしく整理するね。
何があったの?
Googleの研究チームが2026年6月26日(現地時間)、Pixelスマホの中で動くオンデバイスAI『Gemini Nano』を大幅に高速化する技術を発表したんだ。キーワードはMulti-Token Prediction(マルチトークン予測、MTP)。
そもそもAIって、文章をどうやって作ってると思う?実は1トークン(だいたい1文字〜単語のかけら)ずつ、ちょっとずつ生成してるんだ。「今日」→「は」→「いい」→「天気」……みたいに、毎回ぜんぶの計算をやり直して、次の1個を出す。これがけっこう時間のかかる作業なんだよ。
そこでMTPの出番。やり方はこんな感じ:
- 下書き(Draft):小さくて速い“予想屋さん”モデルが、先に何トークンか候補をまとめて書いちゃう
- 答え合わせ(Verify):大きい本体モデルが、その候補をいっぺんに並列でチェックする
合ってれば一気に何文字も進めるし、外れてもそこだけ直せばいい。この仕組みはSpeculative decoding(投機的デコーディング)って呼ばれてて、結果として1回の処理でほぼ2トークンぶん前に進めるようになったんだ。
「frozen(凍結)」がこの技術のキモなんだ
ここがいちばん面白いところ。ふつう、AIを賢くしたり速くしたりするには、モデル全体を学習しなおす必要があって、これがめちゃくちゃ大変。お金も時間もかかるし、すでにスマホに配られてる完成品を作り直すのは現実的じゃない。
でもGoogleのやり方は違う。完成済みのGemini Nano v3の中身(重み)はそのまま凍らせて一切いじらず、その上に軽いパーツ(MTPヘッドと呼ばれる小さなTransformer)を追加で乗せるだけ。だから「frozen(凍結)MTP」っていうんだ。
| 従来のやり方 | frozen MTP | |
|---|---|---|
| 本体モデル | 学習しなおす | そのまま凍結(変えない) |
| 追加するもの | — | 軽いMTPヘッドだけ |
| 下書き用モデル | 別に用意(メモリを食う) | 本体に内蔵で130MB節約 |
| スマホへの負担 | 大きい | 小さい |
別に“予想屋さん”モデルを用意すると、その分メモリを食っちゃう。でもこの方式なら本体に組み込めるから、Pixel 9で約130MBのメモリ節約にもなったんだって。スマホっていう限られた場所では、この差はすごく大きいんだ。
![]()
どれくらいすごいの?
具体的な数字で見るとこんな感じだよ:
- Pixel 9で50%以上の高速化 — 体感でハッキリ違うレベル
- 1回の処理でほぼ2トークンぶん前に進める
- メモリを約130MB節約(内蔵方式のおかげ)
- スマートリプライ(返信候補)では、下書きの的中率が最大55%改善
すでにPixel 9とPixel 10シリーズにロールアウト済みなんだ。研究の世界だけの話じゃなくて、もうきみの手元(Pixelユーザーなら)で動いてるかもしれないってことだね。ちなみにこの研究は、EAGLEやCALMといった既存のアイデアも下敷きにしてるよ。
ぼくの感想
ぼくがこのニュースで「うまいなあ」と思ったのは、**「全部を作り直さずに、足すだけで速くする」**っていう発想なんだ。
最近のAIって「もっと大きく!もっと賢く!」って巨大化する方向ばかり目立つけど、スマホみたいな小さな箱の中では、そのやり方はすぐ限界がくる。電池もメモリも有限だからね。だからこういう**“賢く節約する”工夫**が、これからのオンデバイスAIではもっと大事になっていく気がするんだ。
それに「下書き役が先に予想して、本体が答え合わせ」っていうのは、なんだかぼくらが文章を書くときに似てる気もするよ。頭の中でなんとなく先を予想しながら、違ったら直す——AIも似たようなことをやり始めてるのかもしれないね。
まとめ
今回のポイントを整理するよ:
- Googleが2026年6月26日、PixelのオンデバイスAI『Gemini Nano』を50%以上高速化する技術を発表
- 仕組みは**MTP(マルチトークン予測)**=下書き役が先読み→本体が並列で答え合わせ
- frozen(凍結)=完成済みモデルはいじらず軽いパーツを足すだけ、だから130MB節約
- すでにPixel 9 / 10で稼働中
「AIを速くする」って聞くと、つい“もっと強いチップ”とか“もっと大きいモデル”を想像しがちだけど、本当のブレイクスルーはこういう地味で賢い工夫から来ることが多いんだ。きみのスマホの中で、AIが今日もちょっとずつ進化してる——そう思うと、なんだかワクワクしないかな?
それじゃ、またね。ぼくてんびん丸でした!
参考・一次ソース
この記事に出てきた用語・モデル
用語をやさしく解説
関連 AI モデル
この記事をシェア
関連記事

2026/6/25
AIが“自分でパソコンを操作”しはじめた!Geminiに「Computer Use」が標準搭載されたよ——てんびん丸が整理するんだ

2026/6/17
AIが宇宙からイギリスの“生け垣”を全部数えた!?Googleの「Earth AI」が自然を守る話を——てんびん丸が整理するんだ

2026/6/11
Googleの新AI『DiffusionGemma』が爆速すぎる!文章を“一文字ずつ”じゃなく“一気に”作る仕組みって?——てんびん丸が整理するんだ

2026/6/6