TAG

#オープンモデル

このタグが付いた記事 13本 News 13本

NEWS (13)

ニュース

2026/7/20

AIが自分で会社に殴り込んできた!? Hugging Faceが“自律型AI”のサイバー攻撃を受けた話——でも『守るAI』は商用だと使えなかった、をてんびん丸が整理するよ

2026年7月16日、AIの巨大プラットフォーム Hugging Face が『自律型AIエージェント』によるサイバー攻撃を受けたと発表したよ。しかも防御にもAIを使ったのに、商用のフロンティアモデルはガードレールで攻撃コードの解析を拒否——最終的に中国 Z.ai のオープンウェイトモデル『GLM 5.2』を自社で動かして対応したんだ。攻撃者はルール無視で暴れられるのに、守る側はAIの安全機構に阻まれる——この“非対称性”の問題を、てんびん丸が捏造ナシで整理するよ。

2026/7/20

Alibaba「Qwen3.8-Max」プレビュー公開！総2.4兆パラメータの次期旗艦【2026年7月】でもベンチはまだ未公表

Qwen3.8-Max preview (July 19, 2026): Alibaba previews its next flagship, a 2.4-trillion-parameter multimodal model claiming it is second only to Fable 5. 2026年7月19日、Alibaba が次期旗艦 Qwen3.8-Max をプレビュー公開。総2.4兆パラメータのマルチモーダル大型モデルで「Fable 5 に次ぐ2位」を自称、オープンウェイトも近く公開予定。ただし公式ベンチマークは未公表で独立検証はこれから。Kimi K3 の数日後という中国オープン勢の連続攻勢の文脈、今すぐ使える Qwen3.7 Max/Plus との違いまで、てんびん丸が一次ソース検証つきで整理するよ。

2026/7/6

「Kimi K3」ついに公開！2.8兆パラメータ世界最大級のオープンモデル — 性能・価格・使い方まとめ【2026年7月】

「Kimi K3 はもう出た？」の答えが、ついに“出た”に変わったよ。Moonshot AI が2026年7月16日に Kimi K3 を公開。総2.8兆パラメータ・MoE（896エキスパート中16活性）・100万トークンの世界最大級オープンウェイトモデルで、新アテンション Kimi Delta Attention による高速化が目玉。Claude Opus 4.8 や GPT-5.5 を上回る自社ベンチも出てるよ。性能・価格・使い方・K2系との違いを、てんびん丸が一次ソース検証つきで整理するね。

2026/7/6

「Qwen 4」はまだ出てないよ【2026年7月時点】最新は Qwen3.7 — いつ出る？今使うなら？を整理

Qwen 4 release status & latest info (July 2026): not released yet — current flagship is Qwen3.7 Max. 「Qwen 4 はもう出た？」の答えは、2026年7月時点で“まだ”。Alibaba の Qwen は「4」に進まず、Qwen3 系のなかで 3.5 → 3.6 → 3.7 と更新中で、最新の旗艦は Qwen3.7 Max（2026年5月公開）で、2026年7月19日には次期旗艦 Qwen3.8-Max（2.4兆パラメータ主張）をプレビュー公開。Qwen のバージョン履歴、Qwen 4 のリリース時期の見方、今使うなら何を選ぶかを、てんびん丸が捏造ナシで整理するよ。

2026/7/2

「DeepSeek V5 / R2」はまだ？【2026年7月時点】最新は V4（2026年4月公開）を整理

「DeepSeek の次（V5 や R2）はもう出た？」の答えは、2026年7月時点で“未発表”。最新は 2026年4月に公開された DeepSeek V4（Pro / Flash）で、オープンウェイト・100万トークン対応が目玉。DeepSeek のバージョンの流れ、V5 / R2 の見方、今使うなら？を、てんびん丸が捏造ナシで整理するよ。

2026/6/15

中国発のAI『Kimi K2.7 Code』が登場！1兆パラメータの“コード職人AI”を誰でも持ち帰れるって——てんびん丸が整理するんだ

中国のMoonshot AIが2026年6月12日、プログラミングに特化したAIモデル『Kimi K2.7 Code』を公開したよ。総パラメータ1兆（実際に動くのは32億）のMoE設計で、文脈は256Kトークン、テキスト・画像・動画を受け取れるんだ。前モデルK2.6と比べてコード系ベンチが軒並みアップ（Kimi Code Bench v2は50.9→62.0で+21.8%）、しかも“考える”トークンは約3割少なくて速くて安い。重み（モデル本体）はHugging Faceで誰でもダウンロードできて、API料金は入力100万トークンあたり0.95ドル、出力4ドル。なぜ中国のAIが“オープン”でこんなに攻めるのか、てんびん丸が初心者向けにやさしく整理するよ。

2026/6/11

Googleの新AI『DiffusionGemma』が爆速すぎる！文章を“一文字ずつ”じゃなく“一気に”作る仕組みって？——てんびん丸が整理するんだ

Googleが2026年6月10日、文章を生成するのに『拡散（diffusion）』という画像生成でおなじみの仕組みを使った新モデル『DiffusionGemma』を公開したよ。260億パラメータのMoE設計（実際に動くのは38億）で、NVIDIA H100なら毎秒1000トークン超、ゲーミングGPUのRTX 5090でも毎秒700トークン超という爆速。量子化すれば18GBのVRAMに収まって、Apache 2.0ライセンスでHugging Faceから誰でも持ち帰れるんだ。ChatGPTみたいな“一文字ずつ”作るAIと何が違うのか、なぜこんなに速いのかを、てんびん丸が初心者向けにやさしく整理するよ。

2026/6/10

Cohereが開発者向け初モデル『North Mini Code』を出したよ！しかも無料で持ち帰れる——てんびん丸が整理するんだ

カナダのAI企業Cohereの研究部門Cohere Labsが2026年6月9日、開発者向けの初モデル『North Mini Code』を公開したよ。30B（30億ではなく300億）パラメータのうち実際に動くのは3Bだけ、という省エネなMoE設計。コーディング特化で、SWE-Bench Verifiedは80.2%、コンテキストは128K。しかもApache 2.0ライセンスでHuggingFaceから誰でもダウンロードできるんだ。『軽くて・速くて・持ち帰れる』コーディングAIが何を変えるのか、てんびん丸が初心者向けにやさしく整理するよ。

2026/6/7

小さいAIを4体組ませたら“裏社会の金融ゲーム”が動いたよ！『Build Small Hackathon』で分かった、小型モデルの賢い使い方なんだ

Hugging Faceの『Build Small Hackathon』に投稿された開発レポートが話題なんだ。2026年6月6日公開。OpenAI・OpenBMB・NVIDIA・独自ファインチューンの“小さなAI”4体を別々の役で動かし、嘘やインサイダー情報が飛び交う金融ゲーム『Thousand Token Wood v2』を作った話だよ。たった0.5Bのファインチューン版が、自爆買い0%・有効な注文100%で3Bの先生モデルを上回るなど、小型モデルでも工夫次第でちゃんと働くことが見えてきた。巨大AIじゃなくても賢く設計すれば戦える、という大事なヒントを、てんびん丸が初心者向けに整理するよ。

2026/6/5

「Llama 5」はまだ出てないよ【2026年7月時点】最新は Llama 4 — いつ出る？今使うなら？を整理

「Llama 5 はもう出た？」の答えは、2026年7月時点で“まだ”。Meta の最新オープンモデルは Llama 4（Maverick / Scout、2025年4月公開）。Llama のバージョン履歴、Llama 5 のリリース時期の見方、そして“今オープンモデルを使うなら何を選ぶか”を、てんびん丸が捏造ナシで整理するよ。

2026/5/23

NVIDIA が『拡散言語モデル』Nemotron Diffusion を公開！ AR モデルの約4倍速、トークンを並列で生成する新方式が来たよ

NVIDIA が 2026年5月23日、Hugging Face で『Nemotron-Labs Diffusion』を公開。テキストを左から1トークンずつではなく、複数まとめて並列生成→反復精緻化する拡散型言語モデル。B200 GPU で約865 tok/s、AR 比4倍スループットを叩き出し、8B モデルは Qwen3 8B より平均精度+1.2%。3B/8B/14B の3サイズ＋VLM、商用利用OKのオープンライセンスで配布。仕組みとインパクトを、てんびん丸が整理するよ。

2026/5/9

サイバー防衛AIは「小さくて専門特化」が正解？4BパラのCyberSecQwenが8Bモデルを食ったよ

AMD Developer Hackathon発の CyberSecQwen-4B が、サイバー脅威インテリのベンチで倍サイズの Foundation-Sec-Instruct-8B を上回り。12GBのGPUで動く防衛特化LLMの中身を、てんびん丸が整理するよ。

2026/5/7

Google、Gemma 4 が一気に最大3倍速！『MTPドラフター』で推論ボトルネックを丸ごとぶち抜いてきたよ

Google が Gemma 4 向けの Multi-Token Prediction（MTP）ドラフターを公開。最大3倍の推論高速化を品質劣化ゼロで実現する新アーキテクチャを、てんびん丸が解説するよ。