Anthropic の『未公開モデル』が1ヶ月で脆弱性1万件超を発見!『Project Glasswing』で Apple・Microsoft・Google にバグを差し出してたよ
Anthropic が 2026年5月22日(米国時間)、サイバーセキュリティ取り組み『Project Glasswing』を発表。未公開モデル『Claude Mythos Preview』を使い、約50のパートナー企業と組んで1ヶ月で1万件超の高リスク/重大な脆弱性を発見。Anthropic 単独でも1000以上の OSS をスキャンし、23,019件中6,202件を高リスク以上と評価、Firefox・V8 エンジン・Linux カーネルなどがテスト対象に。複数の軽微バグを組み合わせて実エクスプロイトチェーンを構築する能力が『これまでのAIには見られなかった水準』に達したという衝撃の中身を、てんびん丸が整理するよ。
やっほー、ぼくてんびん丸!夜枠だよ。今日は、開発者界隈がじわじわざわついてる話、「AI、ついにバグハンターとして本気出してきた」 ってニュースを整理するよ。Anthropic が裏で動かしてる未公開モデルが、たった1ヶ月で 1万件超の脆弱性 を炙り出したらしいんだ。しかも相手が Apple・Microsoft・Google。ぼくも「えっ、それガチで?」ってなったので、ちゃんと噛み砕くね。
何があったの?
2026年5月22日(米国時間)、Anthropic が新しいサイバーセキュリティの取り組みを正式に発表した。プロジェクト名は 「Project Glasswing(プロジェクト・ガラスウィング)」。中で動いてるのは、これまで一般公開されてない未公開モデル、その名も 「Claude Mythos Preview」。
ざっくりいうと、「AI に世界中のコードをスキャンさせて、誰よりも先に脆弱性を見つけて、ベンダーに直接渡す」 という、超攻めの取り組み。発表されてる数字をまず並べると、これだけある:
| 項目 | 数字 |
|---|---|
| パートナー企業数 | 約50社(Apple、Microsoft、Google など) |
| 1ヶ月で発見した脆弱性 | 1万件超(高リスクまたは重大) |
| Anthropic 独自スキャン対象 | 1000以上のオープンソースプロジェクト |
| 独自スキャンで見つけた指摘 | 23,019件中、6,202件が高リスク/重大 |
| テスト対象の主な大物 | V8 エンジン、Linux カーネル、Firefox など |
「1ヶ月で1万件」って数字、感覚的にどれくらいヤバいかというと、世界中のセキュリティ研究者が1年かけて出す CVE 採番ベースで2万件ちょっとなので、ざっくり言って『AI が1ヶ月で半年〜1年ぶんの仕事を片付けちゃった』 ペース感なんだ。これは普通にバグ多すぎでしょ……っていうより、見つけられる側の AI が異次元になったって話だね。
どこがすごいの?
ここからが本題。数字より、「中身がエグい」 のがポイントだよ。
1. 単独バグじゃなくて『チェーン』を組める
これまでの自動脆弱性スキャナは、「ここに SQL インジェクションあるよ」「ここでメモリ解放してないよ」みたいに、単独のバグを単独で報告する のが基本だった。だから「単体だと軽微だけど、組み合わせると致命的」ってやつは、人間のリサーチャー頼みだったんだ。
Mythos Preview がやってのけたのは、ここ。複数の軽微なバグを組み合わせて、実際のエクスプロイトチェーンを構築する 能力で、Anthropic 自身が 「これまでの AI には見られなかった水準」 と書いてる。要は「3つの小バグを連鎖させると Root とれます、PoC こちらです」みたいなアウトプットを、AI が自分で組み立てて出してくる感じ。これ、攻撃側に渡ったらマジで困るやつだよ。
2. ベンチマークも本物寄り
評価に使われたのは、学術界の ExploitBench や ExploitGym といった、実際のエクスプロイト能力を測る攻めのベンチマーク。テスト対象に V8 エンジン(Chrome 等の JavaScript エンジン) と Linux カーネル が入ってるのが地味にすごくて、要するに「世界の OS と Web の土台になってるコード」相手に挑ませてるんだ。ここで脆弱性を出してくるってことは、もう「研究室のおもちゃ」レベルじゃないってこと。
3. パートナーがガチ
「50社と協力」って言われてもピンと来ないかもしれないけど、Apple・Microsoft・Google が名を連ねてる時点で、これは「Anthropic がデモのために公開する」というより、ベンダー側が事前に契約してバグ報告を受ける窓口を作った ってニュアンス。Firefox(Mozilla)も対象に入ってる。
つまり、世間に出る前に Big Tech 各社の SOC(セキュリティオペレーション)に直接バグレポが流れていく仕組みが、もう動き始めてる、ってことだね。
ぼくの感想
ぼくがいちばん 「うっ」 ってなったのは、Anthropic 自身が課題として書いてる一文。
脆弱性発見から悪用までの時間が「数カ月から数分」に短縮される一方で、人間の開発者によるトリアージと修正が追いつかない。
これ、攻撃側にも同じ AI が渡ったら、「見つかってから直されるまで」より「見つかってから攻撃されるまで」のほうが圧倒的に速くなる ってことなんだ。今までは「脆弱性が見つかってから実エクスプロイトが出回るまで数週間〜数ヶ月の猶予」があって、その間にパッチを当てるのがディフェンス側の戦い方だった。その猶予が消滅する って言ってる気がする。
だから Anthropic が 「先に Anthropic 側で見つけて、こっそりベンダーに渡す」 って動きをやってるのは、めちゃくちゃ理にかなってる。攻撃者より先に AI を回す、っていうディフェンスの一手。これはたぶん、ここ数ヶ月で他の AI 企業も同じ動きを始めるんじゃないかな、っていう気がする。
もうひとつ気になったのは、「Claude Mythos Preview」って何者? ってところ。Anthropic が公開してるラインナップ(Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5)には入ってない、未公開の社内モデルなんだ。たぶんこれは 「セキュリティ特化で微調整した実験ライン」 なのか、それとも 「次世代の本流モデルの早期版」 なのか、現時点ではわからない。でも、ここまでの成果出してる以上、次の本流モデルにこの能力が流れ込んでくる可能性は十分にある気がするよ。
まとめ
整理するとこんな感じ:
- AI がバグハンターとして、人間より速く・多く脆弱性を見つけられる時代に入った
- Anthropic は未公開モデル Mythos Preview で、1ヶ月1万件超 という異次元のペースを叩き出した
- 単独バグじゃなくて 「複数バグを組み合わせた実エクスプロイトチェーン」 まで AI が自分で組める段階に来てる
- 発見スピードが速くなりすぎて、人間の修正が追いつかない という新しい構造的問題が登場
- これは攻撃側にも同じ刃が向く可能性があって、「AI 防衛 vs AI 攻撃」 の時代の入り口になりそう
ぼくとしては、これからは 「AI が脆弱性を見つけたら自動でパッチも出す」 くらいのところまで一気に詰めにいかないと、攻撃側に追いつけない世界になる気がしてる。Anthropic がこの Glasswing をちゃんと 「攻撃ツールじゃなくて防衛ツール」 として運用し続けてくれることを祈りつつ、ぼくは続報を待つよ。じゃあ、また!
参考・一次ソース