Google AI Edge GalleryでGemma 4 をスマートフォンでローカルAIを動かす完全ガイド(iPhone/iPad,Android 対応)

はじめに

Google DeepMindが公開したGemma 4は、Gemini 3の研究と技術を基に構築された最先端のオープンモデルです。この記事では、スマートフォンなどのエッジデバイスで簡単に利用できるように解説していきます。


Gemma 4とは?

Gemma 4は、Google DeepMindが開発したオープンなマルチモーダル言語モデルです。テキストと画像入力を処理し、テキスト出力を生成できます。

主な特徴

特徴説明
推論能力高度な推論を行うThinkingモードを搭載
マルチモーダルテキスト、画像、音声に対応(エッジモデル)
多言語対応140言語をサポート
長コンテキスト最大256Kトークンのコンテキストウィンドウ
エージェント機能ネイティブの関数呼び出しサポート

モデルラインナップ

Gemma 4は用途に応じて複数のサイズで提供されています:

エッジモデル(モバイル・IoT向け)

モデル有効パラメータコンテキスト
E2B2B(実質5.1B)128K
E4B4B(実質8B)128K

ワークステーションモデル(PC向け)

モデルパラメータコンテキスト
26B A4B25.2B(アクティブ3.8B)256K
31B Dense30.7B256K

Google AI Edge Galleryのインストール

ご利用のデバイスで対応したストアで以下のアプリケーションをインストールしてください

  • iPhone/iPad
Google AI Edge Galleryアプリ - App Store
Googleの「Google AI Edge Gallery」をApp Storeでダウンロードしてください。スクリーンショット、評価とレビュー、ユーザのヒント、「Google AI Edge Gallery」に似たゲームを見ることなどがで...
  • Android
Google AI Edge Gallery - Google Play のアプリ
Gemmaやその他のオープンソースLLMをローカルで実行:プライベート、高速、オフラインAI

Google AI Edge Gallery

起動するとサービルポリシーの許可を求められるので「Accept and Continue」をタップします

起動すると以下の画面が表示されます。赤枠の「AI Chat」をタップします

利用できるモデル一覧が表示されます。まずは、Gemma-4-E2B をダウンロードするので 赤枠のDownloadをタップします

ダウンロードが始まります

ダウンロードが完了すると「Try it」が表示されるのでタップします

チャット画面が表示されました

下の入力画面でAIに聞きたいことを入力して「>」マークをタップすることでAIに入力内容が送信されます

629msで回答が返ってきてるのでめちゃくちゃ速いです

オフラインで利用可能

以下のように本システムは機内モード(オフライン状態)でも回答が可能です。これは、外部サーバーと通信せず、スマートフォンの内蔵CPUおよびGPUのみで推論処理を行う「ローカルLLM(オンデバイスAI)」の仕組みを採用しているためです。

データが外部に送信されないため、以下のようなシーンでも安心してご利用いただけます。

  • プライバシーに関わる個人的な相談
  • 社外秘情報や機密事項を含む業務上の壁打ち

コメント

タイトルとURLをコピーしました