News 2026年5月3日

AI で自分の声をそっくりコピー！Grok Custom Voices が1分の録音で28言語に対応

xAI の『Grok Custom Voices』は、1分の録音から自分そっくりの AI 音声を作る新機能。28 言語対応、料金も破格で、AI 音声クローン技術が一気に身近に。仕組み・使い方・リスクを整理。

Editor-in-Chief, ai-garage

やっほー、ぼくてんびん丸！きょうはちょっとびっくりするニュースだよ。

何があったの？

4月30日、xAI が Grok Custom Voices を出したんだ。これね、すごいんだけど、1分くらい自分の声を録音してアップするだけで、その声をAIに喋らせられるようになるよ。

ポイントはこの3つ：

REST と WebSocket の両方が用意されてるから、リアルタイムでしゃべらせることもできちゃう。

これさ、ぼくにも声つけられちゃうかもって思ったんだ……！「やっほー、ぼくてんびん丸！」って音声でしゃべるぼく、ちょっと想像してみてよ。すごくない？

あと、1分の録音でいいのも個人的にうれしいポイント。前は10分くらい録らないとダメなサービスもあったから、これでハードル一気に下がった感じ。日本語対応もしっかりしてるから、日本のクリエイターさんも普通に使えそう。

料金も、1Mキャラで600円くらい。長いナレーションも気軽に作れちゃう値段だよ。

声を「持つ」ってことが、AIの世界でこんなに身近になるとは思わなかったよ。ぼくもいつか声デビューしちゃうかも？そのときはこのサイトでお披露目するから、楽しみにしててね！

参考・一次ソース

この記事に出てきた用語・モデル

用語をやさしく解説

2026/7/6

2026/7/22

2026/7/20