小さいAIを4体組ませたら“裏社会の金融ゲーム”が動いたよ!『Build Small Hackathon』で分かった、小型モデルの賢い使い方なんだ
Hugging Faceの『Build Small Hackathon』に投稿された開発レポートが話題なんだ。2026年6月6日公開。OpenAI・OpenBMB・NVIDIA・独自ファインチューンの“小さなAI”4体を別々の役で動かし、嘘やインサイダー情報が飛び交う金融ゲーム『Thousand Token Wood v2』を作った話だよ。たった0.5Bのファインチューン版が、自爆買い0%・有効な注文100%で3Bの先生モデルを上回るなど、小型モデルでも工夫次第でちゃんと働くことが見えてきた。巨大AIじゃなくても賢く設計すれば戦える、という大事なヒントを、てんびん丸が初心者向けに整理するよ。
やっほー、ぼくてんびん丸!
最近のAIニュースって「もっと巨大なモデル!」「もっとパラメータ!」って話ばっかりだよね。でもね、今日は逆の方向ですごく面白い話を見つけたんだ。“小さいAI”をうまく組み合わせたら、嘘やインサイダー情報が飛び交う金融ゲームが本当に動いたっていうレポートだよ。巨大AIじゃなくても、設計しだいでちゃんと働くんだって。ワクワクするでしょ?
何があったの?
2026年6月6日、Hugging Face のブログに開催中のイベント 「Build Small Hackathon(小さく作るハッカソン)」 の開発レポートが公開されたんだ。書いたのは Lester Leong(AdmiralTaco) さん。
作ったのは 『Thousand Token Wood v2』 っていうゲーム。きみは “森の後援者(Patron of the Wood)” っていう影の金融屋になって、AIたちが暮らす経済の中で、お金を貸して利息を取ったり、本当か仕掛けか分からない“ささやき情報”を流したり、空売りしたり、賄賂を渡したり、同盟を結んだり……ってことをやるんだ。しかも、きみが「知ってはいけない情報」で取引すると、取締官(magistrate)に追われるっていう物騒な設定なんだよ。
すごいのはここから。このゲーム、登場するAIたちを 1種類のモデルじゃなくて、別々の研究所が作った小型モデル4体 で動かしてるんだ。
| モデル | 作ったところ | 役どころ |
|---|---|---|
| gpt-oss-20b | OpenAI | 参加プレイヤーの一人 |
| MiniCPM3-4B | OpenBMB | 参加プレイヤーの一人 |
| Nemotron-Mini-4B | NVIDIA | 参加プレイヤーの一人 |
| ファインチューン版 Qwen 0.5B | 独自に調整 | 参加プレイヤーの一人 |
作者いわく 「市場が面白くなるのは、参加者が本当に違っているときだ」。違う研究所が、違うデータで、違う調整をしたモデルは「小型モデルとしては最大級にバラバラ」で、フクロウがため込むのと、キツネが投機するのは別の動き方をする——そういう多様性が、台本どおりじゃない“本物っぽい”駆け引きを生むんだって。
どこがすごいの?
いちばん驚いたのは、いちばん小さい 0.5B のファインチューン版モデルの成績なんだ。0.5B っていうのは、最近よく聞く数百B級の巨大モデルからしたら、ものすごく小さいサイズだよ。なのにこんな結果を出したんだ。
| 項目 | 結果 |
|---|---|
| 自爆買い(自分の出した注文を自分で買っちゃう) | 0% |
| 有効な注文の割合 | 100%(しかも“先生役”だった3Bモデルを上回った) |
| 秘密情報の漏れ(嘘の防火壁テスト) | 0件(調べた全プロンプトで漏れなし) |
「小さい先生(3B)から教わった、もっと小さい生徒(0.5B)が、先生を超えた」ってことだね。サイズが全てじゃない、っていうのがハッキリ出てる。
レポートには、開発で分かった大事な学びもまとまってたよ。初心者でも“なるほど”ってなる4つを紹介するね。
- 多様性こそが主役 — モデルがバラバラなのは欠点じゃなくて、面白さそのものなんだ
- 苦労するのはモデルより“配信まわり” — 難しいのはAIの賢さより、4体を同時に動かすサーバー設定(vLLM など)のほうだった
- 秘密情報には防火壁を — 「知ってはいけない情報」は、そもそもAIへの指示文に混ぜちゃダメ。データの流れの中に隠して、漏れないことをテストで証明する
- 記憶は短く区切ると安上がり — 小型モデルに会話の全履歴を渡すと重くなるから、“雰囲気の要約”だけを渡す
そして作者の締めの一言がすごく刺さったんだ。「小型モデルは“形式どおりに出力する”のは得意だけど、“推論”は当てにならない。そのギャップは、規模じゃなくて、構造とプロンプトと小さなファインチューンで埋めるんだ」。
ぼくの感想
このレポート、ぼくはすごく希望が持てたんだ。
だってさ、AIニュースを見てると「最強モデルは何兆パラメータ」「GPUクラスタにギガワット」みたいな、お金とスケールの勝負ばっかりに見えるよね。でもこの人は、手元で動くくらい小さいAIを、役割を分けて、ちゃんと設計して組み合わせるだけで、ひとつの“世界”を動かしてみせた。これって、巨大な研究所じゃない普通の開発者でも、工夫しだいで面白いものが作れるってことだと思うんだ。
特に 「0.5Bの生徒が3Bの先生を超えた」 ってところ。これは“小さく狙いを絞って鍛える”ほうが、その仕事に限れば大きいモデルより強くなれる、っていう一例だよね。きっと今後は「なんでも一台の巨大AIに任せる」じゃなくて、小さなAIを目的別にチームで動かすっていうやり方が増えていく気がするんだ。
あと「秘密情報は指示文に混ぜるな、データの流れに隠してテストで守れ」っていうのも、地味だけどすごく実用的だよね。AIに余計なことを“言わせない”工夫って、これからどんどん大事になるかもしれないね。
まとめ
今日のニュースは、小さいAIでも、賢く組み合わせれば大きな仕事ができるっていうお話だったよ。
- Hugging Face の「Build Small Hackathon」に、小型モデル4体で動く金融ゲーム『Thousand Token Wood v2』の開発レポートが登場(2026年6月6日)
- OpenAI・OpenBMB・NVIDIA・独自ファインチューンのバラバラな小型モデルを役ごとに使い、その“違い”が駆け引きの面白さを生んだ
- たった0.5Bのファインチューン版が、自爆買い0%・有効注文100%で3Bの先生モデルを上回った
- 学びは「多様性が主役」「苦労は配信まわり」「秘密は防火壁で守る」「記憶は短く区切る」
AIって「大きいほど偉い」って思いがちだけど、本当はね、**“どう設計して、どう組み合わせるか”**のほうが面白さを決めるのかもしれない。きみがもし小さなAIで何か作ってみたくなったら、このレポートはすごくいいお手本になると思うよ。ぼくも応援してるからね!
それじゃ、また次のニュースで会おうね。てんびん丸でした!
参考・一次ソース
この記事をシェア
関連記事

2026/6/10
Cohereが開発者向け初モデル『North Mini Code』を出したよ!しかも無料で持ち帰れる——てんびん丸が整理するんだ

2026/6/26
2000人がAIに「秘密を漏らせ」と6000通のメール攻撃→突破ゼロ!AIの守りを試した実験がすごいんだ——てんびん丸が整理するんだ

2026/6/25
AIが“自分でパソコンを操作”しはじめた!Geminiに「Computer Use」が標準搭載されたよ——てんびん丸が整理するんだ

2026/6/24