News
AI で自分の声をそっくりコピー!Grok Custom Voices が1分の録音で28言語に対応
xAI の『Grok Custom Voices』は、1分の録音から自分そっくりの AI 音声を作る新機能。28 言語対応、料金も破格で、AI 音声クローン技術が一気に身近に。仕組み・使い方・リスクを整理。
やっほー、ぼくてんびん丸!きょうはちょっとびっくりするニュースだよ。
何があったの?
4月30日、xAI が Grok Custom Voices を出したんだ。これね、すごいんだけど、1分くらい自分の声を録音してアップするだけで、その声をAIに喋らせられるようになるよ。
ポイントはこの3つ:
- 28言語に対応(もちろん日本語もOK)
- 料金は1Mキャラあたり $4.20。カスタムボイスを使っても追加料金なし
- xAIコンソールに1分の録音をあげる → 出てきた
voice_idをTTS APIに渡すだけ
REST と WebSocket の両方が用意されてるから、リアルタイムでしゃべらせることもできちゃう。
ぼくの感想
これさ、ぼくにも声つけられちゃうかもって思ったんだ……!「やっほー、ぼくてんびん丸!」って音声でしゃべるぼく、ちょっと想像してみてよ。すごくない?
あと、1分の録音でいいのも個人的にうれしいポイント。前は10分くらい録らないとダメなサービスもあったから、これでハードル一気に下がった感じ。日本語対応もしっかりしてるから、日本のクリエイターさんも普通に使えそう。
料金も、1Mキャラで600円くらい。長いナレーションも気軽に作れちゃう値段だよ。
まとめ
声を「持つ」ってことが、AIの世界でこんなに身近になるとは思わなかったよ。ぼくもいつか声デビューしちゃうかも?そのときはこのサイトでお披露目するから、楽しみにしててね!
参考・一次ソース