Qwen3.6-35B-A3B + Ollama でローカルAIを動かす完全ガイド

Qwen3.6の概要

Qwen3.6は、Alibaba CloudのQwenチームが2026年4月にリリースした最新の大規模言語モデル(LLM)シリーズです。Qwen3.5シリーズの好評を受けて、コミュニティからのフィードバックを基に開発され、安定性と実用性を重視したモデルとなっています。

主な特徴

特徴詳細
アーキテクチャGated DeltaNet + Mixture of Experts (MoE)
総パラメータ数35B(アクティブ: 3B)
コンテキスト長262,144トークン(ネイティブ)、最大1,010,000トークンまで拡張可能
多言語対応日本語を含む多言語サポート
マルチモーダルテキスト、画像、動画入力に対応
推論モードデフォルトでThinking(推論)モード
ライセンスApache 2.0(商用利用可)

Qwen3.5からの主な進化

1. エージェントコーディング能力の強化

Qwen3.6はフロントエンドワークフローリポジトリレベルの推論をより流暢かつ正確に処理できるようになりました。SWE-bench Verifiedで73.4%、Terminal-Bench 2.0で51.5%という高いスコアを記録しています。

2. Thinking Preservation(思考保存)

新しいオプションとして、履歴メッセージからの推論コンテキストを保持する機能が追加されました。これにより、反復的な開発作業が効率化され、オーバーヘッドが削減されます。

3. アーキテクチャの革新

Qwen3.6はGated DeltaNet(GDN)レイヤーを採用した新しいアーキテクチャを使用しています:

  • 40層のレイヤー構成
  • 256のエキスパート(MoE)、そのうち8つがルーティング済み + 1つが共有
  • 線形注意機構(Gated DeltaNet)と従来の注意機構(Gated Attention)のハイブリッド

ベンチマーク結果

コーディング・エージェント性能

ベンチマークQwen3.5-27BGemma4-31BQwen3.5-35B-A3BQwen3.6-35B-A3B
SWE-bench Verified75.052.070.073.4
SWE-bench Multilingual69.351.760.367.2
Terminal-Bench 2.041.642.940.551.5
LiveCodeBench v680.780.074.680.4

知識・推論性能

ベンチマークQwen3.5-27BGemma4-31BQwen3.5-35B-A3BQwen3.6-35B-A3B
MMLU-Pro86.185.285.385.2
GPQA85.584.384.286.0
AIME 202692.689.291.092.7
HLE24.319.522.421.4

ビジョン・マルチモーダル性能

ベンチマークQwen3.5-27BGemma4-31BQwen3.5-35B-A3BQwen3.6-35B-A3B
MMMU82.380.481.481.7
MathVista (mini)87.879.386.286.4
RealWorldQA83.772.384.185.3
VideoMME (w/ sub.)87.086.686.6

モデルバリアント

Qwen3.6-35B-A3Bは現在唯一の公開バリアントです。今後さらに多くのサイズが追加される予定です。

アーキテクチャ詳細

項目
総パラメータ数35B
アクティブパラメータ数3B
レイヤー数40
隠れ層次元2048
語彙サイズ248,320
コンテキスト長262,144(ネイティブ)
MoEエキスパート数256(8ルーティング + 1共有)
エキスパート中間次元512

リリースの経緯

  • 2026年4月 – Qwen3.6-35B-A3B(最初のオープンウェイトバリアント)を公開

Qwen3.5シリーズからわずか2ヶ月後のリリースとなり、コミュニティからのフィードバックを反映した改良版となっています。

主な用途

用途説明
コーディングエージェントSWE-benchやTerminal-Benchでの高スコアが示す通り、コード生成・修正に最適
リポジトリレベル推論大規模コードベースの理解と操作に優れている
マルチモーダル処理テキスト・画像・動画の統合理解が可能
長文コンテキスト処理最大100万トークンまでの長文処理に対応
多言語対応日本語を含む多言語での対話が可能

Ollamaのインストール方法

macOS

必要OS: macOS 14 Sonoma 以降

  1. https://ollama.com/download/mac からDMGファイルをダウンロード
  2. DMGをマウントし、Ollamaアプリを Applications フォルダにドラッグ&ドロップ
  3. アプリを起動するとメニューバーにアイコンが表示される
Versionの確認方法

アプリケーションからターミナルをクリックします

以下のコマンドを実行してバージョンが表示されれば正しくインストールされています

# インストール確認
ollama --version

Windows

必要OS: Windows 10 以降

  1. https://ollama.com/download からEXEインストーラーをダウンロード
  2. ダウンロードした .exe ファイルをダブルクリックして「install」ボタンをクリック
  1. 画面の指示に従いインストールを完了
  2. スタートメニューからOllamaを起動

Version確認方法

以下のコマンドを実行するとOllamaのバージョンが確認できます

ollama --version

Linux

ターミナルで以下の1コマンドを実行するだけです:

curl -fsSL https://ollama.com/install.sh | sh

Linuxにインストールすると、ollama.service というsystemdサービスが自動作成され、OS起動時に自動的にOllamaが起動します。

# サービスの状態確認
sudo systemctl status ollama

# サービスの手動起動
sudo systemctl start ollama

# インストール確認
ollama --version

5. Qwen3.6のインストールと起動

Ollamaをインストールしたら、以下のコマンドでQwen3.5を利用できます。

モデルの取得と実行(ollama run)

ollama run コマンドはモデルが未取得の場合は自動的にダウンロードし、そのままチャットを開始します。

ollama run qwen3.6

チャット画面が起動したら、プロンプトに質問を入力して Enter で送信できます。終了するには /bye と入力します。

インストールの例

以下はqwen3.6のインストールを実行している状態です

インストールが完了すると「Send a message (/? for help)」と表示されます

>>>」と表示されている場合、ここにメッセージを入力することができます

以下は「こんにちは」と入力した例です

/bye」と入力して「Enter」キーを押すとOllamaが終了します

モデルのダウンロードのみ(ollama pull)

runはモデルを実行するコマンドでモデルがダウンロードされていない場合、ダウンロードを同時に実行するコマンドでした。

モデルだけダウンロードしたい場合は以下のコマンドを実行するとモデルだけダウンロードできます

# モデルを事前ダウンロードしておく
ollama pull qwen3.6

以下はコマンドの実行です

モデル一覧の確認

ダウンロードしたモデルは以下のコマンドを実行すると表示できます

# ダウンロード済みモデルを一覧表示
ollama list

以下はコマンドの実行です

モデルの削除

モデルの容量が多いため不要なモデルは以下のコマンドで削除することができます

# 不要なモデルを削除してストレージを解放
ollama rm qwen3.6

以下はコマンドの実行です

コメント

タイトルとURLをコピーしました