はじめに
Google DeepMindが公開したGemma 4は、Gemini 3の研究と技術を基に構築された最先端のオープンモデルです。この記事では、スマートフォンなどのエッジデバイスで簡単に利用できるように解説していきます。

Gemma 4とは?
Gemma 4は、Google DeepMindが開発したオープンなマルチモーダル言語モデルです。テキストと画像入力を処理し、テキスト出力を生成できます。
主な特徴
| 特徴 | 説明 |
|---|---|
| 推論能力 | 高度な推論を行うThinkingモードを搭載 |
| マルチモーダル | テキスト、画像、音声に対応(エッジモデル) |
| 多言語対応 | 140言語をサポート |
| 長コンテキスト | 最大256Kトークンのコンテキストウィンドウ |
| エージェント機能 | ネイティブの関数呼び出しサポート |
モデルラインナップ
Gemma 4は用途に応じて複数のサイズで提供されています:
エッジモデル(モバイル・IoT向け)
| モデル | 有効パラメータ | コンテキスト |
|---|---|---|
| E2B | 2B(実質5.1B) | 128K |
| E4B | 4B(実質8B) | 128K |
ワークステーションモデル(PC向け)
| モデル | パラメータ | コンテキスト |
|---|---|---|
| 26B A4B | 25.2B(アクティブ3.8B) | 256K |
| 31B Dense | 30.7B | 256K |
Google AI Edge Galleryのインストール
ご利用のデバイスで対応したストアで以下のアプリケーションをインストールしてください
- iPhone/iPad

Google AI Edge Galleryアプリ - App Store
Googleの「Google AI Edge Gallery」をApp Storeでダウンロードしてください。スクリーンショット、評価とレビュー、ユーザのヒント、「Google AI Edge Gallery」に似たゲームを見ることなどがで...

- Android

Google AI Edge Gallery - Google Play のアプリ
Gemmaやその他のオープンソースLLMをローカルで実行:プライベート、高速、オフラインAI
Google AI Edge Gallery
起動するとサービルポリシーの許可を求められるので「」をタップします

起動すると以下の画面が表示されます。赤枠の「AI Chat」をタップします

利用できるモデル一覧が表示されます。まずは、Gemma-4-E2B をダウンロードするので 赤枠のをタップします

ダウンロードが始まります

ダウンロードが完了すると「」が表示されるのでタップします

チャット画面が表示されました

下の入力画面でAIに聞きたいことを入力して「>」マークをタップすることでAIに入力内容が送信されます
629msで回答が返ってきてるのでめちゃくちゃ速いです

オフラインで利用可能
以下のように本システムは機内モード(オフライン状態)でも回答が可能です。これは、外部サーバーと通信せず、スマートフォンの内蔵CPUおよびGPUのみで推論処理を行う「ローカルLLM(オンデバイスAI)」の仕組みを採用しているためです。
データが外部に送信されないため、以下のようなシーンでも安心してご利用いただけます。
- プライバシーに関わる個人的な相談
- 社外秘情報や機密事項を含む業務上の壁打ち



コメント