Google DeepMindが4月2日、オープンAIモデルの新シリーズ「Gemma 4」を発表しました。少ない計算資源で高い性能を引き出す効率性を重視した設計が特徴です。
Gemma 4は用途やハードウェアに応じて、以下の4つのサイズで展開されます。
- E2B(20億パラメータ):モバイル・IoTデバイス向け
- E4B(40億パラメータ):低レイテンシ・省メモリ設計
- 26B MoE:動的なパラメータ活用で高速処理
- 31B Dense:複雑な推論・研究向けの品質重視モデル
E2BとE4Bはスマートフォンなどのエッジデバイスでもオフラインで動作可能で、低レイテンシかつ少ないメモリで利用できます。最大モデルの31B DenseはArena AIの性能ランキングで世界3位にランクインしており、より大規模な競合モデルに匹敵する性能を発揮するとのことです。
機能面では、複雑な推論やコード生成に加え、画像・音声・動画を扱うマルチモーダル対応や、最大25万6000トークンの長文処理にも対応しています。
ライセンスはApache 2.0で、商用利用やカスタマイズも可能。Hugging Face、Kaggle、Ollamaからダウンロードできます。
2Bパラメータのモデルがスマホで動くというのは、ローカルAI活用の選択肢がまた広がりそうですね。オープンモデルの進化がどんどん加速しています。
