AI MODELS

いま話題のAIモデル
33本まとめ

ChatGPT・Claude・Gemini・Grok ……。名前はよく聞くけど結局なにが違うの？という人向けに、 2026年時点の主要モデルを8カテゴリに整理しました。星の数で「はじめてのおすすめ度」も分かるよ。

33 モデル

8 カテゴリ

6 初心者向け

⭐ TOP PICKS

初心者にこそおすすめ

はじめてのおすすめ度★5、まず触ってみるならコレ

★★★★★

Google

Gemini

Google 製。Workspace 連携と長文処理（1M tokens）で頭ひとつ抜けてる。

★★★★★

Microsoft

Microsoft Copilot

Windows / Office に組み込まれたAI助手。

★★★★★

OpenAI

ChatGPT

AIブームの火付け役。フラッグシップ GPT-5.6（Sol/Terra/Luna）を内蔵し、画像・音声まで一つで完結。

★★★★★

Google

NotebookLM

資料を読ませて深く考えさせる、Google製のAIノート。

★★★★★

OpenAI

GPT Image 2

ChatGPT 内蔵の OpenAI 最新画像生成。4K ネイティブ、文字描画と多言語が大幅強化。

★★★★★

Suno

Suno

歌詞と曲調を指示するだけで歌を作る AI。v5.5 で「パーソナライゼーション」フェーズへ。

💬チャットAI

話しかけて答えてもらう、いちばん身近なAI。

チャットAIを深掘り解説歴史・選び方・用途別まで

Gemini

Google

はじめて度

★★★★★

Google 製。Workspace 連携と長文処理（1M tokens）で頭ひとつ抜けてる。

◎ Gmail / Docs / Sheets / Slides と連携
◎ 画像・動画・音声・PDFの理解が強い
◎ 1M tokens の長いコンテキスト
◎ Deep Research Max など独自機能
△ 回答の口調がやや堅め

料金無料あり。AI Pro 月19.99ドル。API は 3.1 Pro $2/$12（200k超 $4/$18）/ 3.5 Flash $1.5/$9 / 3.1 Flash-Lite $0.25/$1.5 per MTok

💡Google Workspace 使ってる人ならこれがいちばん馴染む。

公式サイトを見る →

Microsoft Copilot

Microsoft

はじめて度

★★★★★

Windows / Office に組み込まれたAI助手。

◎ Word / Excel / Outlook 内で直接呼べる
◎ Bing 検索ベースで最新情報に強い
◎ 中身はGPT系（OpenAIと提携）

料金個人版は無料、Copilot Pro は月20ドル、Microsoft 365 Copilot は月30ドル

💡オフィスワーカーが業務効率化するなら近道。

公式サイトを見る →

ChatGPT

OpenAI

はじめて度

★★★★★

AIブームの火付け役。フラッグシップ GPT-5.6（Sol/Terra/Luna）を内蔵し、画像・音声まで一つで完結。

◎ 総合力が高くてなんでもこなす
◎ 音声・画像・ファイル対応がスムーズ
◎ アプリ・拡張機能が豊富
△ 話の事実確認は弱め、要ファクトチェック

料金無料から。Plus は月20ドル、Pro は月200ドル。API は GPT-5.6 Sol $5/$30・Terra $2.5/$15・Luna $1/$6 per MTok

💡迷ったらまずこれ。無料でもサクッと使えるよ。

公式サイトを見る →

Claude

Anthropic

はじめて度

★★★★☆

長文・コード・推論で定評。最上位は復帰した Fable 5、日常使いは新しい Sonnet 5、軽量は Haiku 4.5。

◎ 長い文書をまとめるのが得意（1M tokens context）
◎ コード生成・修正の精度が高い（SWE-Bench で常時トップ争い）
◎ 安全側に振った穏やかな応答
◎ adaptive thinking で必要に応じて推論時間を自動調整
△ 画像生成はできない（読み取りのみ）

料金無料あり。Pro 月20ドル / Max 月100〜200ドル。API は Opus $5/$25、Sonnet $3/$15、Haiku $1/$5 per MTok

💡じっくり考えさせたい仕事や読み込み系はこれ。日常使いは 2026-06-30 に出た Sonnet 5 が新定番。

公式サイトを見る →

Grok

SpaceXAI（旧xAI）

はじめて度

★★★☆☆

X 統合のノリ軽め AI が Grok 4.5 で大変身。"Opus級・半額以下"を掲げるコーディング特化フラグシップに。

◎ Xのリアルタイム投稿を検索できる
◎ ユーモアと毒舌のあるキャラ設定
◎ X Premium に同梱でコスパ良
◎ Grok Speech / TTS API も2026-05 から提供開始
◎ 4.5 で $2/$6 per MTok。フロンティア級を謳うモデルとして突出して安い
◎ Grok Build・Cursor・Office アドインなど開発/実務ツールへ即統合
△ 過激寄りの応答もあるので場面を選ぶ
△ コンテキストは 500k と前世代 Grok 4.3 の 1M から縮小
△ 日本語性能の第三者検証はまだ少ない

料金 X Premium / Premium+ に内包（月8〜40ドル）。API は Grok 4.5 で $2/$6 per MTok

💡X ヘビーユーザーなら追加料金ほぼゼロで使えてお得。

公式サイトを見る →

Cohere Command

Cohere

はじめて度

★★☆☆☆

エンタープライズ特化のカナダ発LLM。

◎ RAG・検索向けに最適化
◎ セキュリティ・コンプラ重視の設計
◎ 100言語超に対応

料金 API は従量課金。エンタープライズ向け契約あり

💡個人より企業向け。RAG基盤を本気で作る時の選択肢。

公式サイトを見る →

⌨️コーディングAI

プログラミング支援に特化したAI。

コーディングAIを深掘り解説歴史・選び方・用途別まで

Cursor

Anysphere

はじめて度

★★★★☆

VS Code ベースのAIネイティブエディタ。Composer 独自モデル＋並列エージェント＋Visual Editor。

◎ Tab補完と Composer 独自モデルが業界トップクラスに賢い
◎ parallel agents で複数タスクを並列実行
◎ Visual Editor で UI を見ながら直接操作
◎ Claude / GPT / Gemini も切り替えて使える

料金 Hobby 無料、Pro $20、Pro+ $60、Ultra $200、Teams $40/user。2025-06 から credit 制

💡「コードを書く時間が半分になる」と評判のエディタ。Cursor 3 で agents 統合ワークスペースが本格化。

公式サイトを見る →

Codex

OpenAI

はじめて度

★★★★☆

GPT-5.5 を搭載した、ChatGPT 統合のコーディング相棒。in-app browser でローカルUIまで触れる。

◎ CLI / デスクトップ / Web / iOS から呼べる
◎ GPT-5.5 で並列タスクと長文コンテキストに強い
◎ in-app browser でローカル開発サーバを Codex 自身が操作・検証
◎ ChatGPT Plus に追加課金なしで使える

料金無料あり。ChatGPT Plus 月20ドル〜

💡プログラミング初心者がいちばん入りやすいコード支援。GPT-5.5 移行で日常使いの満足度がさらに上がった。

公式サイトを見る →

Bolt.new

StackBlitz

はじめて度

★★★★☆

ブラウザだけでフルスタックアプリを作るAI。

◎ 言葉だけで動くWebアプリが生成される
◎ ブラウザ内でそのまま実行・編集
◎ デプロイまでワンクリック

料金無料あり、Pro 月20ドル

💡プログラミング未経験者でもアプリが作れる入り口。

公式サイトを見る →

v0

Vercel

はじめて度

★★★★☆

Webデザインから本物のコードを生成するAI。

◎ 言葉や画像から美しいUIを生成
◎ React / Tailwind のコードがそのまま出る
◎ デザイナーがコード書けるようになる

料金無料あり、Premium 月20ドル

💡Webサイト作りの最速プロトタイピング道具。

公式サイトを見る →

GitHub Copilot

GitHub (Microsoft)

はじめて度

★★★☆☆

エディタ内で動くコーディングAIの定番。2026-06 から usage-based billing に全面移行。

◎ VS Code / JetBrains などのエディタ内補完
◎ コード補完・チャット・PR レビュー対応
◎ Pro+ は Claude Opus 4.7 も利用可能
◎ 業界導入率トップクラス
△ 2026-06-01 から usage-based billing（AI Credits 制）へ移行
△ 移行期は Pro / Pro+ / Student 新規受付が一時停止中

料金 Free / Pro $10（AI Credits 込）/ Pro+ $39（Credits 込）/ Business $19/user

💡エンジニア向け。「プログラミング始めたい」人にもおすすめ。

公式サイトを見る →

Claude Code

Anthropic

はじめて度

★★☆☆☆

Managed Agents 4機能を備えた、エージェント開発のフラッグシップ。Code with Claude 2026 で大型強化。

◎ プロジェクト全体を Opus 4.7 が把握して長時間自走
◎ Managed Agents（Dreaming／Outcomes／Multi-agent Orchestration／Webhooks）で自律性が一段階上
◎ Agent View / /goal / Background Sessions で複数タスクを並行運用
◎ 大規模リポジトリの読み込みが得意（1M tokens context）

料金 Claude Pro/Max プランに同梱（月20〜200ドル）

💡がっつり開発する人向け。Managed Agents で「一晩寝かせて朝になったらPR出てる」が現実に。

公式サイトを見る →

🔍検索AI

ウェブを調べて根拠つきで答えるタイプ。

検索AIを深掘り解説歴史・選び方・用途別まで

Perplexity

Perplexity AI

はじめて度

★★★★☆

答えに必ず出典がつく「検索特化AI」。

◎ 回答にウェブの出典リンクが必ずつく
◎ リアルタイムの情報に強い
◎ 学術・調べ物に最適

料金無料あり。Pro は月20ドル

💡ChatGPTがウソつく問題が気になる人はこれを試して。

公式サイトを見る →

📚リサーチAI

資料を読み込ませて深く考えさせるタイプ。

リサーチAIを深掘り解説歴史・選び方・用途別まで

NotebookLM

Google

はじめて度

★★★★★

資料を読ませて深く考えさせる、Google製のAIノート。

◎ アップロード資料だけを根拠に答える（ハルシネ激減）
◎ 資料からポッドキャスト風音声を自動生成
◎ 学習・研究のおとも

料金無料

💡論文・資料を一気読みさせて要約する用途で神。

公式サイトを見る →

Deep Research

OpenAI / Google / Anthropic

はじめて度

★★★★☆

AIが何時間もかけて調べて長文レポートを書く機能。

◎ ウェブを何十本も読み込んで要約
◎ 出典つきの長文レポートを生成
◎ ChatGPT・Gemini・Claude が各社実装

料金 ChatGPT Plus / Gemini AI Pro / Claude Pro に同梱

💡「市場調査をAIに丸投げ」が現実になった機能。

公式サイトを見る →

Perplexity Spaces

Perplexity

はじめて度

★★★☆☆

資料アップ＋検索を組み合わせたチーム向けRAG。

◎ 社内文書とウェブ検索を混ぜて回答
◎ チームで共有できる調査スペース
◎ 回答に出典が必ずつく

料金 Pro 月20ドル、Enterprise 別途

💡個人より「数人〜十人のチームでナレッジ蓄積」に向く。

公式サイトを見る →

🎨画像生成AI

文章から絵を作るAI。

画像生成AIを深掘り解説歴史・選び方・用途別まで

GPT Image 2

OpenAI

はじめて度

★★★★★

ChatGPT 内蔵の OpenAI 最新画像生成。4K ネイティブ、文字描画と多言語が大幅強化。

◎ ChatGPT / API どちらからでも呼べる
◎ 4K ネイティブ、文字・図表・UIモック生成の精度が業界トップ
◎ 推論モデルを画像生成に統合、生成前に構造を「考えてから描く」
◎ 日本語・中国語・韓国語・ヒンディーなどの多言語テキスト描画が大幅強化
△ GPT Image 2 の生成はやや高コスト（推論統合のため）

料金 ChatGPT Plus に同梱。API は gpt-image-2 として従量課金

💡別途ツール不要。ChatGPT に「○○の画像作って」と頼むだけ。文字入りスライドや図表もキレイ。

公式サイトを見る →

Nano Banana 2 / Pro

Google

はじめて度

★★★★☆

Gemini 内蔵の画像生成。Nano Banana 2（速い）と Pro（推論型・高品質）の二段構成へ。

◎ Nano Banana 2 = Gemini 3.1 Flash Image：速度・量産向け（512px〜4K）
◎ Nano Banana Pro = Gemini 3 Pro Image：推論型、品質最優先
◎ 最大5キャラ＋14オブジェクトの一貫性
◎ テキスト描画＆翻訳が大幅強化（日本語含む）
◎ Web 検索ベースのリアルタイム知識統合

料金 Gemini に同梱（API は Vertex AI 経由で従量課金）

💡リアル系・写真風はトップクラス。Pro は「考えてから描く」推論型で構図指定にも強い。

公式サイトを見る →

FLUX

Black Forest Labs

はじめて度

★★★☆☆

SD 開発者発の次世代画像 AI。FLUX.2 で 4MP 出力＋10枚参照のキャラ一貫性へ。

◎ プロンプト追従性が業界最高クラス
◎ 最大4MP 出力、参照画像10枚までのキャラ・スタイル一貫性
◎ JSON ベースで細かい制御が可能
◎ FLUX.2 [klein] は1秒未満で生成（Apache 2.0 でオープン）
◎ max / pro / flex / dev / klein の5層構成

料金 API は従量課金。FLUX.2 [klein] / [dev] は無料ダウンロード可

💡Midjourney よりプロンプトに忠実な画像を作るならこれ。Nano Banana Pro / Midjourney v8 への対抗馬。

公式サイトを見る →

Midjourney

Midjourney

はじめて度

★★★☆☆

アート性で群を抜く画像生成 AI。V8.1 で生成速度4〜5倍、2K ネイティブに進化。

◎ イラスト・アート系のクオリティが他を寄せ付けない
◎ プロンプトの個性が強く反映される
◎ V8.1 で --hd 2K ネイティブ＋4〜5倍高速化
◎ V7 の sref / ムードボードも後方互換で使える
◎ Web版でブラウザ完結

料金月10ドル〜（Basic / Standard / Pro / Mega の4プラン）

💡「映える絵」を作りたいときの第一選択。アート寄りで他社と差別化。

公式サイトを見る →

Stable Diffusion

Stability AI

はじめて度

★★☆☆☆

オープンソース画像生成の元祖。SD4 Ultra で 4096×4096 ネイティブ＋解剖学的破綻 87% 削減。

◎ SD4 Ultra は 4096×4096 ネイティブ出力
◎ glyph conditioning でテキスト描画も実用域
◎ 完全オープンウェイトで自分で動かせる
◎ 派生モデル・LoRA が膨大
◎ ローカル実行でデータが外に出ない
△ 商用ライセンスは年商 $1M 未満まで無料、超えると Enterprise 契約必要

料金コミュニティ版は無料（年商 $1M 未満）。Enterprise は要問合せ

💡自分の PC で自由に画像を量産したい人向け。

公式サイトを見る →

🎬動画生成AI

文章や画像から動画を作るAI。

動画生成AIを深掘り解説歴史・選び方・用途別まで

Veo 3.1

Google DeepMind

はじめて度

★★★★☆

Sora 2 撤退後の動画生成本命。4K upscaling・Scene Extension・全 Google アカウント無料化。

◎ 4K upscaling と 9:16 vertical 対応
◎ Scene Extension で60秒超のシーン継続生成
◎ Veo 3.1 / Fast / Lite の3層構成で用途別最適
◎ 音声付き動画の生成にも対応
◎ 2026-04 から全 Google account で無料利用可能に

料金全 Google アカウントで無料利用可（高頻度は Gemini AI Pro / Ultra 推奨）

💡Sora 2 がシャットダウンした今、動画生成の最有力候補。

公式サイトを見る →

Kling 3.0

Kuaishou

はじめて度

★★★☆☆

中国発、4K/60FPS ネイティブ＋Chain-of-Thought シーン推論を備える次世代動画 AI。

◎ 15秒クリップ、ネイティブ 4K / 60FPS 出力
◎ Chain-of-Thought でシーン構成を推論しながら生成
◎ multi-shot / multi-character 対応で複雑なストーリー OK
◎ native multi-language audio（多言語音声同時生成）
◎ 物理法則を踏まえた動きが自然、顔・身体の安定性が高い

料金無料あり、Pro 月10ドル〜

💡2026年は Veo 3.1 / Runway Gen-4.5 と並ぶ動画生成3強の一角に。

公式サイトを見る →

Runway Gen-4.5

Runway

はじめて度

★★★☆☆

動画生成のプロ向け本命。Artificial Analysis text-to-video ベンチで Elo 1247 の首位。

◎ text-to-video のクオリティで業界トップ（Elo 1247）
◎ 物理精度・複雑指示遂行に強み
◎ Aleph（動画編集）/ Act-Two（演技キャプチャ）併載
◎ Gen-4 は image-to-video 役割で並走

料金無料あり、Standard 月12ドル〜

💡映像のプロが使う本格派。text-to-video なら Gen-4.5、image-to-video なら Gen-4。

公式サイトを見る →

Sora 2

OpenAI

はじめて度

★☆☆☆☆

⚠️ 2026-04-26 アプリ停止・2026-09-24 API 終了予定。コスト圧と計算資源不足が原因。後継モデル未発表。

◎ 音声同期生成にネイティブ対応（リリース時点）
◎ 短編動画の生成クオリティが高い
◎ 画像→動画も対応
△ ⚠️ Sora 2 アプリは 2026-04-26 にシャットダウン済み
△ ⚠️ API も 2026-09-24 で廃止予定
△ OpenAI 公式に Sora 3 の計画は出ていない
△ 新規動画生成の選択肢としては推奨しない（Veo 3.1 / Kling 3.0 / Runway Gen-4.5 へ）

料金 ChatGPT Plus / Pro に内包（残存期間のみ）

💡廃止予定のため新規利用は避ける。動画生成は Veo 3.1 / Kling 3.0 / Runway Gen-4.5 に乗り換え推奨。

公式サイトを見る →

🎵音声・音楽AI

声・BGM・歌をつくる、聴くAI。

音声・音楽AIを深掘り解説歴史・選び方・用途別まで

Suno

Suno

はじめて度

★★★★★

歌詞と曲調を指示するだけで歌を作る AI。v5.5 で「パーソナライゼーション」フェーズへ。

◎ ボーカル入りの曲が秒で作れる
◎ Voices：自分の声をクローンして歌わせられる
◎ Custom Models：自作楽曲で個別チューニング可能
◎ My Taste：嗜好を学習して提案精度向上
◎ 8分超の長尺楽曲もベース機能化

料金無料あり、Pro 月10ドル〜

💡「自分のテーマソング」を作って遊ぶ感覚で使える。

公式サイトを見る →

ElevenLabs

ElevenLabs

はじめて度

★★★★☆

音声合成・音声クローン・文字起こしの統合プラットフォーム。Eleven v3 + Scribe v2 Realtime で実用域に。

◎ Eleven v3：70+ 言語、感情幅広い読み上げ
◎ Scribe v2 batch（90+ 言語、speaker diarization、98% 話者ラベル精度）
◎ Scribe v2 Realtime（150ms レイテンシ、57言語ライブ API）
◎ 数秒のサンプルで本人そっくりの声を作る

料金無料あり、Starter 月5ドル〜（Scribe v2 Realtime は API で 40% 値下げ済）

💡ナレーション・YouTube・ポッドキャスト・文字起こしで業界標準。リアルタイム翻訳もここ一強。

公式サイトを見る →

Udio

Uncharted Labs

はじめて度

★★★★☆

Suno のライバル。v1.5 で 48kHz stereo・stem 分離・key 制御を備え UMG 共同ライセンス化。

◎ 48kHz stereo 出力、stem 分離・DL、key 制御
◎ audio-to-audio remix で既存楽曲をリミックス
◎ 音質・楽曲構成のクオリティが高い
△ 2025-10 UMG 和解、2026 Q2 から共同ライセンス済プラットフォーム化
△ raw WAV/MP3 DL は不可、エコシステム内再生のみ

料金無料あり、Standard 月10ドル〜

💡Suno が遊び系なら、Udio はちょっとプロ寄り。商用音楽の権利クリアが進んでる。

公式サイトを見る →

🧩オープンソース

中身が公開されてて、自分のPCでも動かせるAI。

オープンソースを深掘り解説歴史・選び方・用途別まで

DeepSeek

DeepSeek

はじめて度

★★★☆☆

中国発、コスパとオープン性の象徴。V4 Preview で 1.6T パラメータ MoE が登場。

◎ V4-Pro 1.6T（49B active）/ V4-Flash 284B（13B active）の MoE
◎ 1M tokens の長文コンテキスト
◎ CSA+HCA ハイブリッドアテンションで効率改善
◎ API 価格が圧倒的に安い
◎ オープンウェイトで公開
△ 中国製のため業務利用は規約・データ取扱の確認を
△ R2 は未リリース（公式モデルIDに存在せず、V4 が現役）

料金 API は V4-Pro が $1.74/$3.48、V4-Flash が $0.14/$0.28 per MTok（クローズドモデル比 1/10〜1/30）

💡コストを徹底的に下げたい時の選択肢。

公式サイトを見る →

Kimi

Moonshot AI

はじめて度

★★★☆☆

中国発 Moonshot AI のオープンモデル。K3 で総2.8兆パラメータ・100万トークンに到達し、オープン最大級のフロンティアモデルに。

◎ K3：総2.8兆パラメータ（896中16活性）の MoE、オープンウェイト最大級
◎ 新アテンション Kimi Delta Attention（KDA）で長文デコードを高速化
◎ 100万トークンの長文コンテキスト
◎ ネイティブ・マルチモーダル（テキスト/画像/動画）
◎ オープンウェイトで公開（フルウェイトは 2026-07-27 予定）
△ 中国製のため業務利用は規約・データ取扱の確認を
△ API 単価は $3/$15 と K2系から値上げ（オープン系では高め）
△ 総2.8兆パラメータ級でローカル運用のハードルは高い

料金 API は $3/$15 per MTok（K2系の $0.95/$4 前後から値上げ）。Kimi.com・アプリでチャット利用も可、オープンウェイトで自前運用もできる。

💡最新のオープンフロンティアを試したい / 自前運用したい時の選択肢。

公式サイトを見る →

Qwen

Alibaba

はじめて度

★★☆☆☆

Alibaba 製の高性能モデル群。旗艦 Qwen3.7 Max は安くて強く、次期 Qwen3.8-Max も始動。

◎ 日本語含む多言語が得意
◎ 旗艦 Qwen3.7 Max は $1.25/$3.75 と frontier 級で破格の安さ
◎ コーディング／エージェント特化（SWE-Bench Verified 80.4）
◎ オープンウェイト版（Qwen3.6 系）と安価マルチモーダル版（3.7 Plus）も揃う

料金旗艦 Qwen3.7 Max は $1.25/$3.75 per MTok（Alibaba Cloud Model Studio）。安価マルチモーダル版 Qwen3.7 Plus は $0.32/$1.28。Qwen3.6 系のオープンウェイト版は無料（Apache 2.0）

💡中華系 LLM では品質安定派。安くて強い。

公式サイトを見る →

Llama

Meta

はじめて度

★★☆☆☆

Meta 製のオープンウェイト LLM。Llama 4 で MoE アーキ + native multimodal + 1M〜10M context へ進化。

◎ 中身（重み）が公開されている
◎ 自分の PC・サーバーで動かせる
◎ 派生モデル・改造モデルが豊富
◎ Llama 4 で native multimodal（テキスト + 画像）に対応
◎ Scout は 10M tokens 長コンテキスト

料金モデル自体は無料（Llama 4 Community License、自分で動かす）。API 提供は AWS Bedrock / Azure / Oracle 等のクラウドベンダ経由

💡クラウド任せにしたくないエンジニア向け。Llama 4 Maverick が万能、Scout は超長文向き。

公式サイトを見る →

Mistral

Mistral AI

はじめて度

★★☆☆☆

ヨーロッパ発、軽量で速いオープンモデル。Mistral Large 3 で MoE 675B へ大型化。

◎ Mistral Large 3 が 675B 総 / 41B アクティブの MoE
◎ オープンウェイトの選択肢が広い
◎ API も提供（Le Chat）
◎ Voxtral TTS（2026-03）で音声も拡充

料金オープン版は無料（Apache 2.0）。API は Mistral Large 3 で $0.5/$1.5 per MTok と低価格

💡ヨーロッパ系で、規制対応・データ主権を求める現場に強い。

公式サイトを見る →

関連ページ

AI用語集 → 注目トピック → はじめてのAI →

更新を受け取る

X で更新を受け取る（@tenbin_maru） → RSSで受け取る →