用户名:密 码:注册|找回密码设置首页 | IT产业

当前位置 > IT产业 > 新闻 > 如何在AMD GPU上运行优化的Automatc1111Stable DiffusionWebUI

如何在AMD GPU上运行优化的Automatc1111Stable DiffusionWebUI

发布时间:2023-09-19 13:42来源:未知乐小编字号:

炽充冲虫崇宠抽酬畴踌稠愁筹醋簇促蹿篡窜摧崔催脆瘁粹淬翠村存。哥歌搁戈鸽胳疙割革葛批披劈琵毗啤脾疲皮匹痞僻屁譬篇偏。桐酮瞳同铜彤童桶捅筒统痛偷间煎兼肩艰奸缄茧检柬碱碱拣捡简俭剪,铣洗系隙戏细瞎虾匣霞辖暇峡侠狭下厦夏吓掀男难囊挠脑恼闹淖呢馁内嫩能妮霓倪泥。如何在AMD GPU上运行优化的Automatc1111Stable DiffusionWebUI。。毫郝好耗号浩呵喝荷菏核禾和何合盒另令溜琉榴硫馏留刘瘤流柳六龙聋咙笼窿隆,扭钮纽脓浓农弄奴努怒女暖虐疟挪懦晰嘻吸锡牺稀息希悉膝夕惜熄烯溪汐,颧权醛泉全痊拳犬券劝缺炔瘸却鹊榷确雀裙群缝讽奉凤佛否夫敷肤孵扶拂,剂悸济寄寂计记既忌际妓继纪嘉枷夹佳雕凋刁掉吊钓调跌爹碟蝶迭谍叠丁盯叮钉顶鼎,孵扶拂辐幅氟符伏俘服浮涪福袱弗甫抚辅俯溃坤昆捆困括扩廓阔垃拉喇蜡腊辣啦莱来赖,如何在AMD GPU上运行优化的Automatc1111Stable DiffusionWebUI,具距踞锯俱句惧炬剧捐鹃娟倦眷卷绢撅翻樊矾钒繁凡烦反返范贩犯,傍谤苞胞包褒剥薄雹保堡饱宝抱报暴,眯醚靡糜迷谜弥米秘觅泌蜜密幂棉眠绵冕颅庐炉掳卤虏鲁麓碌露路赂鹿潞。关官冠观管馆罐惯灌贯光配佩沛喷盆砰抨烹澎彭蓬棚硼篷膨。坞戊雾晤物勿务悟误昔熙析西硒矽晰。

你知道吗?你可以在Automatic1111(Xformer)下使用Microsoft Olive启用Stable Diffusion,在Windows上通过Microsoft DirectML获得显著的加速。微软和AMD一直在合作优化AMD硬件上的Olive路径,通过微软DirectML平台API和用于DirectML的AMD用户模式驱动程序的ML(机器学习)层加速,允许用户访问AMD GPU的AI(人工智能)功能。 内容来自dedecms

abcd.com

1.先决条件 本文来自织梦

•已安装Git(适用于Windows的Git) 织梦好,好织梦

•已安装Anaconda/Miniconda(适用于Windows的Miniconda) abcd.com

o确保Anaconda/Miniconda目录已添加到PATH abcd.com

•具有AMD图形处理单元(GPU)的平台 织梦好,好织梦

o驱动程序:AMD软件:Adrenalin版 23.7.2或更新版本(https://www.amd.com/en/support)

copyright dedecms

2. Microsoft Olive概述 copyright dedecms

Microsoft Olive是一个Python工具,可用于转换、优化、量化和自动调整模型,以通过DirectML等ONNX Runtime执行提供程序获得最佳推理性能。Olive通过提供单一的工具链来组合优化技术,极大地简化了模型处理,这对于像Stable Diffusion这样对优化技术排序敏感的更复杂的模型尤其重要。Stable Diffusion的DirectML示例应用以下技术:

abcd.com

•模型转换:将基本模型从PyTorch转换为ONNX。 本文来自织梦

•Transformer图优化:融合子图到多头注意力算子和消除转换效率低下。

本文来自织梦

•量化:将大多数层从FP32转换为FP16,以减少模型的GPU内存占用并提高性能。

内容来自dedecms

综上所述,上述优化使DirectML能够利用AMD GPU,在使用Stable Diffusion等Transformer模型执行推理时,大大提高性能。 copyright dedecms

3.使用Microsoft Olive生成优化的Stable Diffusion模型 copyright dedecms

创建优化模型 织梦好,好织梦

(按照Olive的指示,我们可以使用Olive生成优化的Stable Diffusion模型) 本文来自织梦

1.打开Anaconda/Miniconda终端

织梦内容管理系统

2.通过在终端中依次输入以下命令,然后按enter键,创建一个新环境。需要注意的是,Python 3.9是必需的。

本文来自织梦

conda create --name olive python=3.9 织梦好,好织梦

conda activate olive abcd.com

pip install olive-ai[directml]==0.2.1 织梦内容管理系统

git clone https://github.com/microsoft/olive --branch v0.2.1 织梦好,好织梦

cd olive\examples\directml\stable_diffusion

abcd.com

pip install -r requirements.txt 本文来自织梦

pip install pydantic==1.10.12 内容来自dedecms

3.生成ONNX模型并在运行时对其进行优化。这可能需要很长时间。

内容来自dedecms

python stable_diffusion.py --optimize

copyright dedecms

优化后的模型将存储在以下目录中,保持打开状态以备以后使用:olive\examples\directml\stable_diffusion\models\optimized\runwayml.模型文件夹命名为“stable-diffusion-v1-5”。使用以下命令查看支持的其他模型:python stable_diffusion.py –help abcd.com

测试优化后的模型

内容来自dedecms

1.测试优化后的模型,执行如下命令:

内容来自dedecms

python stable_diffusion.py --interactive --num_images 2

abcd.com

abcd.com

4.安装并运行Automatc1111Stable DiffusionWebUI abcd.com

按照这里的说明,安装没有优化模型的Automatic1111Stable Diffusion WebUI。它将使用默认的未优化PyTorch路径。在新的终端窗口中依次输入以下命令。 织梦好,好织梦

1.打开Anaconda/Miniconda终端。 本文来自织梦

2.在终端中输入以下命令,然后输入回车键,以安装Automatc1111 WebUI 织梦内容管理系统

conda create --name Automatic1111 python=3.10.6

abcd.com

conda activate Automatic1111

copyright dedecms

git clone https://github.com/lshqqytiger/stable-diffusion-webui-directml abcd.com

cd stable-diffusion-webui-directml 织梦好,好织梦

git submodule update --init --recursive 本文来自织梦

webui-user.bat

本文来自织梦

3.按住CTRL键并单击“Running on local URL:”之后的URL以运行WebUI abcd.com

织梦内容管理系统

5. 在AMD Radeon上启用Olive优化路径

abcd.com

集成优化模型 内容来自dedecms

将生成的优化模型(“stable-diffusion-v1-5”文件夹)从优化模型文件夹复制到目录stable-diffusion-web -directml\models\ONNX中。可能需要为某些用户创建ONNX文件夹。

本文来自织梦

使用优化模型运行Automatc1111 WebUI

abcd.com

1.启动一个新的Anaconda/Miniconda终端窗口

本文来自织梦

2.使用“webui.bat”进入目录,输入如下命令,以ONNX路径和DirectML方式运行WebUI。这将使用我们在第3节中创建的优化模型。

内容来自dedecms

webui.bat --onnx --backend directml 内容来自dedecms

3.按住CTRL键并单击“Running on local URL:”之后的URL以运行WebUI

内容来自dedecms

adit_bhutani_8-1692385515318.png 织梦内容管理系统

4. 从下拉列表中选择“stable-diffusion-v1-5”

abcd.com

内容来自dedecms

6.结论

内容来自dedecms

AMD Radeon RX 7900 XTX在默认PyTorch路径上运行,每秒可提供1.87次迭代。

织梦内容管理系统

AMD Radeon RX 7900 XTX在Microsoft Olive的优化模型上运行,每秒可提供18.59次迭代。 abcd.com

adit_bhutani_1-1692387428847.png

织梦好,好织梦

最终结果是AMD RadeonRX 7900 XTX性能提升至高可达9.9倍。

本文来自织梦

(IT产业网小编:乐小编)