NEWS (3)
ニュース
2026/5/23
NVIDIA が『拡散言語モデル』Nemotron Diffusion を公開! AR モデルの約4倍速、トークンを並列で生成する新方式が来たよ
NVIDIA が 2026年5月23日、Hugging Face で『Nemotron-Labs Diffusion』を公開。テキストを左から1トークンずつではなく、複数まとめて並列生成→反復精緻化する拡散型言語モデル。B200 GPU で約865 tok/s、AR 比4倍スループットを叩き出し、8B モデルは Qwen3 8B より平均精度+1.2%。3B/8B/14B の3サイズ+VLM、商用利用OKのオープンライセンスで配布。仕組みとインパクトを、てんびん丸が整理するよ。
2026/5/9
サイバー防衛AIは「小さくて専門特化」が正解?4BパラのCyberSecQwenが8Bモデルを食ったよ
AMD Developer Hackathon発の CyberSecQwen-4B が、サイバー脅威インテリのベンチで倍サイズの Foundation-Sec-Instruct-8B を上回り。12GBのGPUで動く防衛特化LLMの中身を、てんびん丸が整理するよ。
2026/5/7
Google、Gemma 4 が一気に最大3倍速!『MTPドラフター』で推論ボトルネックを丸ごとぶち抜いてきたよ
Google が Gemma 4 向けの Multi-Token Prediction(MTP)ドラフターを公開。最大3倍の推論高速化を品質劣化ゼロで実現する新アーキテクチャを、てんびん丸が解説するよ。