AMDのGPUでStable Diffusion Web UIを動かしたくなったのでインストールの仕方を紹介します
前提条件としては、
が入っていることが前提です
stable diffusionダウンロード
コマンドプロンプトを立ち上げます
以下のコマンドを実行してください
git clone https://github.com/lshqqytiger/stable-diffusion-webui-directml && cd stable-diffusion-webui-directml && git submodule init && git submodule update
実行結果
C:\Users\ユーザ名\Documents>git clone https://github.com/lshqqytiger/stable-diffusion-webui-directml
Cloning into 'stable-diffusion-webui-directml'...
remote: Enumerating objects: 34560, done.
remote: Counting objects: 100% (24/24), done.
remote: Compressing objects: 100% (12/12), done.
remote: Total 34560 (delta 12), reused 23 (delta 12), pack-reused 34536
Receiving objects: 100% (34560/34560), 35.65 MiB | 6.42 MiB/s, done.
stable diffusion 起動
以下のコマンドを実行するとPythonのパッケージダウンロードとモデルのダウンロードが始まります
webui-user.bat
実行結果
C:\Users\ユーザ名\Documents\stable-diffusion-webui-directml>webui-user.bat
Creating venv in directory C:\Users\ユーザ名\Documents\stable-diffusion-webui-directml\venv using python "C:\Users\ユーザ名\AppData\Local\Programs\Python\Python310\python.exe"
webui-user.batのエラー(RuntimeError: Torch is not able to use GPU; add –skip-torch-cuda-test to COMMANDLINE_ARGS variable to disable this check)
webui-user.bat
を実行すると以下のエラーが出てくる可能性があります
RuntimeError: Torch is not able to use GPU; add --skip-torch-cuda-test to COMMANDLINE_ARGS variable to disable this check
webui-user.bat
をテキストで開き以下のように修正してください
@echo off
set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--use-directml --update-all-extensions --medvram --opt-sub-quad-attention --opt-split-attention --no-half --upcast-sampling --update-check
call webui.bat
そしたら再び、webui-user.bat
を実行してください
1. DirectMLの使用
Windows環境でRadeon GPUを利用する場合、DirectML(Direct Machine Learning)を使ってGPUを最適化することができます。DirectMLは、AMD GPUやIntel GPUを含む様々なハードウェアに対応したMicrosoftの機械学習APIです。これにより、Radeon GPUでもStable Diffusionを効率的に動作させることができます。
設定方法:
--use-directml
オプションを有効にすることで、DirectMLを使用して処理を行うことができます。
2. VRAMの設定(--medvram)
Radeon GPUは、NVIDIAのRTXシリーズに比べてVRAMが少ないことが多いです。そのため、メモリ使用量を抑えるためのオプションを活用すると良いです。
--medvram
オプションを使うことで、メモリ使用量を中程度に抑えつつ、効率よく動作させることができます。
3. 半精度(FP16)の無効化
Radeon GPUは、NVIDIAのRTXカードと比べて、半精度(FP16)の計算が苦手な場合があります。特に、NaNエラー(Not a Number)や精度の問題が発生することがあるため、半精度を無効にすることが推奨されます。
--no-half
オプションを有効にすることで、計算精度をフル精度(FP32)に設定し、安定性を向上させることができます。
4. OpenCLのサポート
Radeon GPUがOpenCLをサポートしている場合、OpenCLを使って計算を行う設定を選択することができます。現在のStable Diffusionでは、OpenCLで動作するような公式サポートは限られていますが、いくつかの非公式な方法で利用できることもあります。
- 特定のカスタムビルドやOpenCLバックエンドがサポートされている場合、
--use-opencl
のようなオプションを指定することで、OpenCLを利用できる場合があります。
5. メモリ最適化
もしメモリ不足が発生した場合、さらにメモリを最適化するオプションを使用できます。--opt-split-attention
や --opt-sub-quad-attention
など、メモリ消費を抑えるためのオプションを有効にすると、パフォーマンスが向上する場合があります。
--opt-split-attention
:処理中のアテンション機構を効率的に分割することで、メモリ使用量を削減します。--opt-sub-quad-attention
:メモリ使用量をさらに削減するための最適化オプションです。
結果
webui-user.batのエラー(ModuleNotFoundError: No module named ‘torch_directml’)
webui-user.bat
を実行すると以下のエラーが出てくる可能性があります
ModuleNotFoundError: No module named 'torch_directml'
以下のコマンドを実行します
venv\Scripts\activate
以下のように`(venv)`がつくようになります
(venv)がついた状態で以下のコマンドを実行します
pip install torch_directml
再び、「webui-user.bat」を実行すると
ブラウザが自動で立ち上がり、画像が生成できるようになりました
コメント