Qwen3.6-35B-A3B + Ollama でローカルAIを動かす完全ガイド

Qwen3.6の概要

Qwen3.6は、Alibaba CloudのQwenチームが2026年4月にリリースした最新の大規模言語モデル（LLM）シリーズです。Qwen3.5シリーズの好評を受けて、コミュニティからのフィードバックを基に開発され、安定性と実用性を重視したモデルとなっています。

主な特徴

特徴	詳細
アーキテクチャ	Gated DeltaNet + Mixture of Experts (MoE)
総パラメータ数	35B（アクティブ: 3B）
コンテキスト長	262,144トークン（ネイティブ）、最大1,010,000トークンまで拡張可能
多言語対応	日本語を含む多言語サポート
マルチモーダル	テキスト、画像、動画入力に対応
推論モード	デフォルトでThinking（推論）モード
ライセンス	Apache 2.0（商用利用可）

Qwen3.5からの主な進化

1. エージェントコーディング能力の強化

Qwen3.6はフロントエンドワークフローとリポジトリレベルの推論をより流暢かつ正確に処理できるようになりました。SWE-bench Verifiedで73.4%、Terminal-Bench 2.0で51.5%という高いスコアを記録しています。

2. Thinking Preservation（思考保存）

新しいオプションとして、履歴メッセージからの推論コンテキストを保持する機能が追加されました。これにより、反復的な開発作業が効率化され、オーバーヘッドが削減されます。

3. アーキテクチャの革新

Qwen3.6はGated DeltaNet（GDN）レイヤーを採用した新しいアーキテクチャを使用しています：

40層のレイヤー構成
256のエキスパート（MoE）、そのうち8つがルーティング済み + 1つが共有
線形注意機構（Gated DeltaNet）と従来の注意機構（Gated Attention）のハイブリッド

ベンチマーク結果

コーディング・エージェント性能

ベンチマーク	Qwen3.5-27B	Gemma4-31B	Qwen3.5-35B-A3B	Qwen3.6-35B-A3B
SWE-bench Verified	75.0	52.0	70.0	73.4
SWE-bench Multilingual	69.3	51.7	60.3	67.2
Terminal-Bench 2.0	41.6	42.9	40.5	51.5
LiveCodeBench v6	80.7	80.0	74.6	80.4

知識・推論性能

ベンチマーク	Qwen3.5-27B	Gemma4-31B	Qwen3.5-35B-A3B	Qwen3.6-35B-A3B
MMLU-Pro	86.1	85.2	85.3	85.2
GPQA	85.5	84.3	84.2	86.0
AIME 2026	92.6	89.2	91.0	92.7
HLE	24.3	19.5	22.4	21.4

ビジョン・マルチモーダル性能

ベンチマーク	Qwen3.5-27B	Gemma4-31B	Qwen3.5-35B-A3B	Qwen3.6-35B-A3B
MMMU	82.3	80.4	81.4	81.7
MathVista (mini)	87.8	79.3	86.2	86.4
RealWorldQA	83.7	72.3	84.1	85.3
VideoMME (w/ sub.)	87.0	—	86.6	86.6

モデルバリアント

Qwen3.6-35B-A3Bは現在唯一の公開バリアントです。今後さらに多くのサイズが追加される予定です。

アーキテクチャ詳細

項目	値
総パラメータ数	35B
アクティブパラメータ数	3B
レイヤー数	40
隠れ層次元	2048
語彙サイズ	248,320
コンテキスト長	262,144（ネイティブ）
MoEエキスパート数	256（8ルーティング + 1共有）
エキスパート中間次元	512

リリースの経緯

2026年4月 – Qwen3.6-35B-A3B（最初のオープンウェイトバリアント）を公開

Qwen3.5シリーズからわずか2ヶ月後のリリースとなり、コミュニティからのフィードバックを反映した改良版となっています。

主な用途

用途	説明
コーディングエージェント	SWE-benchやTerminal-Benchでの高スコアが示す通り、コード生成・修正に最適
リポジトリレベル推論	大規模コードベースの理解と操作に優れている
マルチモーダル処理	テキスト・画像・動画の統合理解が可能
長文コンテキスト処理	最大100万トークンまでの長文処理に対応
多言語対応	日本語を含む多言語での対話が可能

Ollamaのインストール方法

macOS

必要OS: macOS 14 Sonoma 以降

https://ollama.com/download/mac からDMGファイルをダウンロード
DMGをマウントし、Ollamaアプリを Applications フォルダにドラッグ＆ドロップ
アプリを起動するとメニューバーにアイコンが表示される

Versionの確認方法

アプリケーションからターミナルをクリックします

以下のコマンドを実行してバージョンが表示されれば正しくインストールされています

# インストール確認
ollama --version

Windows

必要OS: Windows 10 以降

https://ollama.com/download からEXEインストーラーをダウンロード
ダウンロードした .exe ファイルをダブルクリックして「install」ボタンをクリック

画面の指示に従いインストールを完了
スタートメニューからOllamaを起動

Version確認方法

以下のコマンドを実行するとOllamaのバージョンが確認できます

ollama --version

Linux

ターミナルで以下の1コマンドを実行するだけです：

curl -fsSL https://ollama.com/install.sh | sh

Linuxにインストールすると、ollama.service というsystemdサービスが自動作成され、OS起動時に自動的にOllamaが起動します。

# サービスの状態確認
sudo systemctl status ollama

# サービスの手動起動
sudo systemctl start ollama

# インストール確認
ollama --version

5. Qwen3.6のインストールと起動

Ollamaをインストールしたら、以下のコマンドでQwen3.5を利用できます。

モデルの取得と実行（ollama run）

ollama run コマンドはモデルが未取得の場合は自動的にダウンロードし、そのままチャットを開始します。

ollama run qwen3.6

チャット画面が起動したら、プロンプトに質問を入力して Enter で送信できます。終了するには /bye と入力します。

インストールの例

以下はqwen3.6のインストールを実行している状態です

インストールが完了すると「Send a message (/? for help)」と表示されます

「>>>」と表示されている場合、ここにメッセージを入力することができます

以下は「こんにちは」と入力した例です

「/bye」と入力して「Enter」キーを押すとOllamaが終了します

モデルのダウンロードのみ（ollama pull）

runはモデルを実行するコマンドでモデルがダウンロードされていない場合、ダウンロードを同時に実行するコマンドでした。

モデルだけダウンロードしたい場合は以下のコマンドを実行するとモデルだけダウンロードできます

# モデルを事前ダウンロードしておく
ollama pull qwen3.6

以下はコマンドの実行です

モデル一覧の確認

ダウンロードしたモデルは以下のコマンドを実行すると表示できます

# ダウンロード済みモデルを一覧表示
ollama list

以下はコマンドの実行です

モデルの削除

モデルの容量が多いため不要なモデルは以下のコマンドで削除することができます

# 不要なモデルを削除してストレージを解放
ollama rm qwen3.6

以下はコマンドの実行です