ai-garage

AI MODELS

いま話題のAIモデル
32本まとめ

ChatGPT・Claude・Gemini・Grok ……。名前はよく聞くけど結局なにが違うの?という人向けに、 2026年時点の主要モデルを8カテゴリに整理しました。 星の数で「はじめてのおすすめ度」も分かるよ。

32 モデル
8 カテゴリ
6 初心者向け

💬チャットAI

話しかけて答えてもらう、いちばん身近なAI。

チャットAIを深掘り解説 歴史・選び方・用途別まで

Gemini

Google

はじめて度

★★★★★

Google 製。Workspace 連携と長文処理(1M tokens)で頭ひとつ抜けてる。

  • Gmail / Docs / Sheets / Slides と連携
  • 画像・動画・音声・PDFの理解が強い
  • 1M tokens の長いコンテキスト
  • Deep Research Max など独自機能
  • 回答の口調がやや堅め
料金 無料あり。AI Pro 月19.99ドル。API は 3.1 Pro $2/$12(200k超 $4/$18)/ 3.5 Flash $1.5/$9 / 3.1 Flash-Lite $0.25/$1.5 per MTok
💡Google Workspace 使ってる人ならこれがいちばん馴染む。
公式サイトを見る →

Microsoft Copilot

Microsoft

はじめて度

★★★★★

Windows / Office に組み込まれたAI助手。

  • Word / Excel / Outlook 内で直接呼べる
  • Bing 検索ベースで最新情報に強い
  • 中身はGPT系(OpenAIと提携)
料金 個人版は無料、Copilot Pro は月20ドル、Microsoft 365 Copilot は月30ドル
💡オフィスワーカーが業務効率化するなら近道。
公式サイトを見る →

ChatGPT

OpenAI

はじめて度

★★★★★

AIブームの火付け役。GPT-5.5 を内蔵し、画像・音声まで一つで完結。

  • 総合力が高くてなんでもこなす
  • 音声・画像・ファイル対応がスムーズ
  • アプリ・拡張機能が豊富
  • 話の事実確認は弱め、要ファクトチェック
料金 無料から。Plus は月20ドル、Pro は月200ドル。API は GPT-5.5 が $5/$30 per MTok
💡迷ったらまずこれ。無料でもサクッと使えるよ。
公式サイトを見る →

Claude

Anthropic

はじめて度

★★★★☆

長文・コード・推論で定評。Opus 4.7 / Sonnet 4.6 / Haiku 4.5 の3枚体制。

  • 長い文書をまとめるのが得意(1M tokens context)
  • コード生成・修正の精度が高い(SWE-Bench で常時トップ争い)
  • 安全側に振った穏やかな応答
  • adaptive thinking で必要に応じて推論時間を自動調整
  • 画像生成はできない(読み取りのみ)
料金 無料あり。Pro 月20ドル / Max 月100〜200ドル。API は Opus $5/$25、Sonnet $3/$15、Haiku $1/$5 per MTok
💡じっくり考えさせたい仕事や読み込み系はこれ。Sonnet 4.6 が日常使いの定番。
公式サイトを見る →

Grok

xAI

はじめて度

★★★☆☆

X 統合のノリ軽め AI。Grok 4.3 で料金大幅引き下げ、エージェント性能も向上。

  • Xのリアルタイム投稿を検索できる
  • ユーモアと毒舌のあるキャラ設定
  • X Premium に同梱でコスパ良
  • Grok Speech / TTS API も2026-05 から提供開始
  • 4.3 で料金 $1.25/$2.5 per MTok と大幅引き下げ
  • 過激寄りの応答もあるので場面を選ぶ
  • Grok 5(6T params MoE)は2026 Q2 予定で未リリース
料金 X Premium / Premium+ に内包(月8〜40ドル)。API は Grok 4.3 で $1.25/$2.5 per MTok
💡X ヘビーユーザーなら追加料金ほぼゼロで使えてお得。
公式サイトを見る →

Cohere Command

Cohere

はじめて度

★★☆☆☆

エンタープライズ特化のカナダ発LLM。

  • RAG・検索向けに最適化
  • セキュリティ・コンプラ重視の設計
  • 100言語超に対応
料金 API は従量課金。エンタープライズ向け契約あり
💡個人より企業向け。RAG基盤を本気で作る時の選択肢。
公式サイトを見る →

⌨️コーディングAI

プログラミング支援に特化したAI。

コーディングAIを深掘り解説 歴史・選び方・用途別まで

Cursor

Anysphere

はじめて度

★★★★☆

VS Code ベースのAIネイティブエディタ。Composer 独自モデル+並列エージェント+Visual Editor。

  • Tab補完と Composer 独自モデルが業界トップクラスに賢い
  • parallel agents で複数タスクを並列実行
  • Visual Editor で UI を見ながら直接操作
  • Claude / GPT / Gemini も切り替えて使える
料金 Hobby 無料、Pro $20、Pro+ $60、Ultra $200、Teams $40/user。2025-06 から credit 制
💡「コードを書く時間が半分になる」と評判のエディタ。Cursor 3 で agents 統合ワークスペースが本格化。
公式サイトを見る →

Codex

OpenAI

はじめて度

★★★★☆

GPT-5.5 を搭載した、ChatGPT 統合のコーディング相棒。in-app browser でローカルUIまで触れる。

  • CLI / デスクトップ / Web / iOS から呼べる
  • GPT-5.5 で並列タスクと長文コンテキストに強い
  • in-app browser でローカル開発サーバを Codex 自身が操作・検証
  • ChatGPT Plus に追加課金なしで使える
料金 無料あり。ChatGPT Plus 月20ドル〜
💡プログラミング初心者がいちばん入りやすいコード支援。GPT-5.5 移行で日常使いの満足度がさらに上がった。
公式サイトを見る →

Bolt.new

StackBlitz

はじめて度

★★★★☆

ブラウザだけでフルスタックアプリを作るAI。

  • 言葉だけで動くWebアプリが生成される
  • ブラウザ内でそのまま実行・編集
  • デプロイまでワンクリック
料金 無料あり、Pro 月20ドル
💡プログラミング未経験者でもアプリが作れる入り口。
公式サイトを見る →

v0

Vercel

はじめて度

★★★★☆

Webデザインから本物のコードを生成するAI。

  • 言葉や画像から美しいUIを生成
  • React / Tailwind のコードがそのまま出る
  • デザイナーがコード書けるようになる
料金 無料あり、Premium 月20ドル
💡Webサイト作りの最速プロトタイピング道具。
公式サイトを見る →

GitHub Copilot

GitHub (Microsoft)

はじめて度

★★★☆☆

エディタ内で動くコーディングAIの定番。2026-06 から usage-based billing に全面移行。

  • VS Code / JetBrains などのエディタ内補完
  • コード補完・チャット・PR レビュー対応
  • Pro+ は Claude Opus 4.7 も利用可能
  • 業界導入率トップクラス
  • 2026-06-01 から usage-based billing(AI Credits 制)へ移行
  • 移行期は Pro / Pro+ / Student 新規受付が一時停止中
料金 Free / Pro $10(AI Credits 込)/ Pro+ $39(Credits 込)/ Business $19/user
💡エンジニア向け。「プログラミング始めたい」人にもおすすめ。
公式サイトを見る →

Claude Code

Anthropic

はじめて度

★★☆☆☆

Managed Agents 4機能を備えた、エージェント開発のフラッグシップ。Code with Claude 2026 で大型強化。

  • プロジェクト全体を Opus 4.7 が把握して長時間自走
  • Managed Agents(Dreaming/Outcomes/Multi-agent Orchestration/Webhooks)で自律性が一段階上
  • Agent View / /goal / Background Sessions で複数タスクを並行運用
  • 大規模リポジトリの読み込みが得意(1M tokens context)
料金 Claude Pro/Max プランに同梱(月20〜200ドル)
💡がっつり開発する人向け。Managed Agents で「一晩寝かせて朝になったらPR出てる」が現実に。
公式サイトを見る →

📚リサーチAI

資料を読み込ませて深く考えさせるタイプ。

リサーチAIを深掘り解説 歴史・選び方・用途別まで

NotebookLM

Google

はじめて度

★★★★★

資料を読ませて深く考えさせる、Google製のAIノート。

  • アップロード資料だけを根拠に答える(ハルシネ激減)
  • 資料からポッドキャスト風音声を自動生成
  • 学習・研究のおとも
料金 無料
💡論文・資料を一気読みさせて要約する用途で神。
公式サイトを見る →

Deep Research

OpenAI / Google / Anthropic

はじめて度

★★★★☆

AIが何時間もかけて調べて長文レポートを書く機能。

  • ウェブを何十本も読み込んで要約
  • 出典つきの長文レポートを生成
  • ChatGPT・Gemini・Claude が各社実装
料金 ChatGPT Plus / Gemini AI Pro / Claude Pro に同梱
💡「市場調査をAIに丸投げ」が現実になった機能。
公式サイトを見る →

Perplexity Spaces

Perplexity

はじめて度

★★★☆☆

資料アップ+検索を組み合わせたチーム向けRAG。

  • 社内文書とウェブ検索を混ぜて回答
  • チームで共有できる調査スペース
  • 回答に出典が必ずつく
料金 Pro 月20ドル、Enterprise 別途
💡個人より「数人〜十人のチームでナレッジ蓄積」に向く。
公式サイトを見る →

GPT Image 2

OpenAI

はじめて度

★★★★★

ChatGPT 内蔵の OpenAI 最新画像生成。4K ネイティブ、文字描画と多言語が大幅強化。

  • ChatGPT / API どちらからでも呼べる
  • 4K ネイティブ、文字・図表・UIモック生成の精度が業界トップ
  • 推論モデルを画像生成に統合、生成前に構造を「考えてから描く」
  • 日本語・中国語・韓国語・ヒンディーなどの多言語テキスト描画が大幅強化
  • GPT Image 2 の生成はやや高コスト(推論統合のため)
料金 ChatGPT Plus に同梱。API は gpt-image-2 として従量課金
💡別途ツール不要。ChatGPT に「○○の画像作って」と頼むだけ。文字入りスライドや図表もキレイ。
公式サイトを見る →

Nano Banana 2 / Pro

Google

はじめて度

★★★★☆

Gemini 内蔵の画像生成。Nano Banana 2(速い)と Pro(推論型・高品質)の二段構成へ。

  • Nano Banana 2 = Gemini 3.1 Flash Image:速度・量産向け(512px〜4K)
  • Nano Banana Pro = Gemini 3 Pro Image:推論型、品質最優先
  • 最大5キャラ+14オブジェクトの一貫性
  • テキスト描画&翻訳が大幅強化(日本語含む)
  • Web 検索ベースのリアルタイム知識統合
料金 Gemini に同梱(API は Vertex AI 経由で従量課金)
💡リアル系・写真風はトップクラス。Pro は「考えてから描く」推論型で構図指定にも強い。
公式サイトを見る →

FLUX

Black Forest Labs

はじめて度

★★★☆☆

SD 開発者発の次世代画像 AI。FLUX.2 で 4MP 出力+10枚参照のキャラ一貫性へ。

  • プロンプト追従性が業界最高クラス
  • 最大4MP 出力、参照画像10枚までのキャラ・スタイル一貫性
  • JSON ベースで細かい制御が可能
  • FLUX.2 [klein] は1秒未満で生成(Apache 2.0 でオープン)
  • max / pro / flex / dev / klein の5層構成
料金 API は従量課金。FLUX.2 [klein] / [dev] は無料ダウンロード可
💡Midjourney よりプロンプトに忠実な画像を作るならこれ。Nano Banana Pro / Midjourney v8 への対抗馬。
公式サイトを見る →

Midjourney

Midjourney

はじめて度

★★★☆☆

アート性で群を抜く画像生成 AI。V8.1 で生成速度4〜5倍、2K ネイティブに進化。

  • イラスト・アート系のクオリティが他を寄せ付けない
  • プロンプトの個性が強く反映される
  • V8.1 で --hd 2K ネイティブ+4〜5倍高速化
  • V7 の sref / ムードボードも後方互換で使える
  • Web版でブラウザ完結
料金 月10ドル〜(Basic / Standard / Pro / Mega の4プラン)
💡「映える絵」を作りたいときの第一選択。アート寄りで他社と差別化。
公式サイトを見る →

Stable Diffusion

Stability AI

はじめて度

★★☆☆☆

オープンソース画像生成の元祖。SD4 Ultra で 4096×4096 ネイティブ+解剖学的破綻 87% 削減。

  • SD4 Ultra は 4096×4096 ネイティブ出力
  • glyph conditioning でテキスト描画も実用域
  • 完全オープンウェイトで自分で動かせる
  • 派生モデル・LoRA が膨大
  • ローカル実行でデータが外に出ない
  • 商用ライセンスは年商 $1M 未満まで無料、超えると Enterprise 契約必要
料金 コミュニティ版は無料(年商 $1M 未満)。Enterprise は要問合せ
💡自分の PC で自由に画像を量産したい人向け。
公式サイトを見る →

🎬動画生成AI

文章や画像から動画を作るAI。

動画生成AIを深掘り解説 歴史・選び方・用途別まで

Veo 3.1

Google DeepMind

はじめて度

★★★★☆

Sora 2 撤退後の動画生成本命。4K upscaling・Scene Extension・全 Google アカウント無料化。

  • 4K upscaling と 9:16 vertical 対応
  • Scene Extension で60秒超のシーン継続生成
  • Veo 3.1 / Fast / Lite の3層構成で用途別最適
  • 音声付き動画の生成にも対応
  • 2026-04 から全 Google account で無料利用可能に
料金 全 Google アカウントで無料利用可(高頻度は Gemini AI Pro / Ultra 推奨)
💡Sora 2 がシャットダウンした今、動画生成の最有力候補。
公式サイトを見る →

Kling 3.0

Kuaishou

はじめて度

★★★☆☆

中国発、4K/60FPS ネイティブ+Chain-of-Thought シーン推論を備える次世代動画 AI。

  • 15秒クリップ、ネイティブ 4K / 60FPS 出力
  • Chain-of-Thought でシーン構成を推論しながら生成
  • multi-shot / multi-character 対応で複雑なストーリー OK
  • native multi-language audio(多言語音声同時生成)
  • 物理法則を踏まえた動きが自然、顔・身体の安定性が高い
料金 無料あり、Pro 月10ドル〜
💡2026年は Veo 3.1 / Runway Gen-4.5 と並ぶ動画生成3強の一角に。
公式サイトを見る →

Runway Gen-4.5

Runway

はじめて度

★★★☆☆

動画生成のプロ向け本命。Artificial Analysis text-to-video ベンチで Elo 1247 の首位。

  • text-to-video のクオリティで業界トップ(Elo 1247)
  • 物理精度・複雑指示遂行に強み
  • Aleph(動画編集)/ Act-Two(演技キャプチャ)併載
  • Gen-4 は image-to-video 役割で並走
料金 無料あり、Standard 月12ドル〜
💡映像のプロが使う本格派。text-to-video なら Gen-4.5、image-to-video なら Gen-4。
公式サイトを見る →

Sora 2

OpenAI

はじめて度

★☆☆☆☆

⚠️ 2026-04-26 アプリ停止・2026-09-24 API 終了予定。コスト圧と計算資源不足が原因。後継モデル未発表。

  • 音声同期生成にネイティブ対応(リリース時点)
  • 短編動画の生成クオリティが高い
  • 画像→動画も対応
  • ⚠️ Sora 2 アプリは 2026-04-26 にシャットダウン済み
  • ⚠️ API も 2026-09-24 で廃止予定
  • OpenAI 公式に Sora 3 の計画は出ていない
  • 新規動画生成の選択肢としては推奨しない(Veo 3.1 / Kling 3.0 / Runway Gen-4.5 へ)
料金 ChatGPT Plus / Pro に内包(残存期間のみ)
💡廃止予定のため新規利用は避ける。動画生成は Veo 3.1 / Kling 3.0 / Runway Gen-4.5 に乗り換え推奨。
公式サイトを見る →

🎵音声・音楽AI

声・BGM・歌をつくる、聴くAI。

音声・音楽AIを深掘り解説 歴史・選び方・用途別まで

Suno

Suno

はじめて度

★★★★★

歌詞と曲調を指示するだけで歌を作る AI。v5.5 で「パーソナライゼーション」フェーズへ。

  • ボーカル入りの曲が秒で作れる
  • Voices:自分の声をクローンして歌わせられる
  • Custom Models:自作楽曲で個別チューニング可能
  • My Taste:嗜好を学習して提案精度向上
  • 8分超の長尺楽曲もベース機能化
料金 無料あり、Pro 月10ドル〜
💡「自分のテーマソング」を作って遊ぶ感覚で使える。
公式サイトを見る →

ElevenLabs

ElevenLabs

はじめて度

★★★★☆

音声合成・音声クローン・文字起こしの統合プラットフォーム。Eleven v3 + Scribe v2 Realtime で実用域に。

  • Eleven v3:70+ 言語、感情幅広い読み上げ
  • Scribe v2 batch(90+ 言語、speaker diarization、98% 話者ラベル精度)
  • Scribe v2 Realtime(150ms レイテンシ、57言語ライブ API)
  • 数秒のサンプルで本人そっくりの声を作る
料金 無料あり、Starter 月5ドル〜(Scribe v2 Realtime は API で 40% 値下げ済)
💡ナレーション・YouTube・ポッドキャスト・文字起こしで業界標準。リアルタイム翻訳もここ一強。
公式サイトを見る →

Udio

Uncharted Labs

はじめて度

★★★★☆

Suno のライバル。v1.5 で 48kHz stereo・stem 分離・key 制御を備え UMG 共同ライセンス化。

  • 48kHz stereo 出力、stem 分離・DL、key 制御
  • audio-to-audio remix で既存楽曲をリミックス
  • 音質・楽曲構成のクオリティが高い
  • 2025-10 UMG 和解、2026 Q2 から共同ライセンス済プラットフォーム化
  • raw WAV/MP3 DL は不可、エコシステム内再生のみ
料金 無料あり、Standard 月10ドル〜
💡Suno が遊び系なら、Udio はちょっとプロ寄り。商用音楽の権利クリアが進んでる。
公式サイトを見る →

🧩オープンソース

中身が公開されてて、自分のPCでも動かせるAI。

オープンソースを深掘り解説 歴史・選び方・用途別まで

DeepSeek

DeepSeek

はじめて度

★★★☆☆

中国発、コスパとオープン性の象徴。V4 Preview で 1.6T パラメータ MoE が登場。

  • V4-Pro 1.6T(49B active)/ V4-Flash 284B(13B active)の MoE
  • 1M tokens の長文コンテキスト
  • CSA+HCA ハイブリッドアテンションで効率改善
  • API 価格が圧倒的に安い
  • オープンウェイトで公開
  • 中国製のため業務利用は規約・データ取扱の確認を
  • R2 は未リリース(公式モデルIDに存在せず、V4 が現役)
料金 API は V4-Pro が $1.74/$3.48、V4-Flash が $0.14/$0.28 per MTok(クローズドモデル比 1/10〜1/30)
💡コストを徹底的に下げたい時の選択肢。
公式サイトを見る →

Qwen

Alibaba

はじめて度

★★☆☆☆

Alibaba 製の高性能オープンモデル群。Qwen3.6 で 397B MoE を超える dense モデルへ。

  • 日本語含む多言語が得意
  • サイズのバリエーションが豊富(dense 27B / MoE 36B-A3B 等)
  • ベンチで上位常連、agentic coding で 397B MoE を超える
  • Apache 2.0 ライセンスで完全オープン
料金 オープン版は無料(Apache 2.0)。API は Qwen3.6-27B で $0.6/$3.6 per MTok(Alibaba Cloud Model Studio)
💡中華系 LLM では品質安定派。
公式サイトを見る →

Llama

Meta

はじめて度

★★☆☆☆

Meta 製のオープンウェイト LLM。Llama 4 で MoE アーキ + native multimodal + 1M〜10M context へ進化。

  • 中身(重み)が公開されている
  • 自分の PC・サーバーで動かせる
  • 派生モデル・改造モデルが豊富
  • Llama 4 で native multimodal(テキスト + 画像)に対応
  • Scout は 10M tokens 長コンテキスト
料金 モデル自体は無料(Llama 4 Community License、自分で動かす)。API 提供は AWS Bedrock / Azure / Oracle 等のクラウドベンダ経由
💡クラウド任せにしたくないエンジニア向け。Llama 4 Maverick が万能、Scout は超長文向き。
公式サイトを見る →

Mistral

Mistral AI

はじめて度

★★☆☆☆

ヨーロッパ発、軽量で速いオープンモデル。Mistral Large 3 で MoE 675B へ大型化。

  • Mistral Large 3 が 675B 総 / 41B アクティブの MoE
  • オープンウェイトの選択肢が広い
  • API も提供(Le Chat)
  • Voxtral TTS(2026-03)で音声も拡充
料金 オープン版は無料(Apache 2.0)。API は Mistral Large 3 で $0.5/$1.5 per MTok と低価格
💡ヨーロッパ系で、規制対応・データ主権を求める現場に強い。
公式サイトを見る →

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →