海外AI应用部署实战:在香港GPU服务器上运行Stable Diffusion与ComfyUI完整教程
Stable Diffusion 和 ComfyUI 已成为 AI 绘图、图像处理、商业设计自动化的核心工具。在本地跑模型受限于显卡性能,在大陆服务器部署又面临备案和网络限制,香港 GPU 服务器提供了最优解:免备案、国际模型下载快、CN2 GIA 回国延迟低,非常适合面向大陆用户提供 AI 绘图服务或搭建团队内部使用的 AI 工作台。
一、GPU 服务器配置选型
| 使用场景 | 推荐GPU | 显存 | 估算月费 |
|---|---|---|---|
| 个人/小团队 SD 使用 | RTX 4090 / A40 | 24G | ¥1500~2500 |
| 商业 API 服务(并发 <10) | A100 40G | 40G | ¥3000~5000 |
| 高并发推理服务 | A100 80G / H100 | 80G | ¥6000+ |
| FLUX / SDXL 模型 | RTX 4090 或更高 | ≥24G | ¥1500+ |
系统推荐:Ubuntu 22.04 LTS + CUDA 12.x(最新驱动兼容性最好)
二、CUDA 环境安装
<code"># 1. 安装 NVIDIA 驱动 apt install -y ubuntu-drivers-common ubuntu-drivers install # 或指定版本:apt install nvidia-driver-550 # 重启使驱动生效 reboot # 验证 GPU 识别 nvidia-smi
<code"># 2. 安装 CUDA Toolkit 12.4 wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb dpkg -i cuda-keyring_1.1-1_all.deb apt update apt install -y cuda-toolkit-12-4 # 配置环境变量 echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc source ~/.bashrc # 验证 nvcc --version
<code"># 3. 安装 Python 3.11 + pip apt install -y python3.11 python3.11-venv python3-pip python3.11 --version
三、部署 AUTOMATIC1111 Stable Diffusion WebUI
<code"># 安装依赖 apt install -y git wget libgoogle-perftools-dev # 克隆仓库 cd /opt git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui # 下载基础模型(以 SDXL 1.0 为例) mkdir -p models/Stable-diffusion wget -O models/Stable-diffusion/sd_xl_base_1.0.safetensors \ "https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0.safetensors"
启动脚本(服务器模式,开放 API)
<code">cat > webui-server.sh << 'EOF' #!/bin/bash cd /opt/stable-diffusion-webui python3.11 launch.py \ --xformers \ # xFormers 加速,显存占用减少 ~30% --listen \ # 监听所有网络接口 --port 7860 \ --api \ # 开放 REST API(供程序调用) --api-auth user:password \ # API 认证(必须设置!) --no-gradio-queue \ --opt-sdp-attention \ # 优化 SDXL 推理速度 --medvram # 中等显存模式(<24G 时使用) EOF chmod +x webui-server.sh
systemd 服务配置
<code">[Unit] Description=Stable Diffusion WebUI After=network.target [Service] Type=simple User=root WorkingDirectory=/opt/stable-diffusion-webui ExecStart=/opt/stable-diffusion-webui/webui-server.sh Restart=on-failure Environment=COMMANDLINE_ARGS="--xformers --listen --api" [Install] WantedBy=multi-user.target
四、部署 ComfyUI(工作流式 AI 绘图)
ComfyUI 采用节点式工作流设计,适合构建复杂的图像处理管线,是更适合开发者和高级用户的选择。
<code"># 安装 ComfyUI cd /opt git clone https://github.com/comfyanonymous/ComfyUI.git cd ComfyUI # 创建虚拟环境并安装依赖 python3.11 -m venv venv source venv/bin/activate pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124 pip install -r requirements.txt # 安装 ComfyUI Manager(插件管理器) cd custom_nodes git clone https://github.com/ltdrdata/ComfyUI-Manager.git cd ..
<code"># 启动 ComfyUI(监听所有接口) python main.py \ --listen 0.0.0.0 \ --port 8188 \ --preview-method auto \ --cuda-device 0
五、Nginx 反向代理 + SSL(对外提供服务)
<code"># /etc/nginx/sites-available/ai.yourdomain.com
server {
listen 443 ssl;
server_name ai.yourdomain.com;
ssl_certificate /etc/letsencrypt/live/ai.yourdomain.com/fullchain.pem;
ssl_certificate_key /etc/letsencrypt/live/ai.yourdomain.com/privkey.pem;
# WebUI(AUTOMATIC1111)
location /sd/ {
proxy_pass http://127.0.0.1:7860/;
proxy_set_header Host $host;
proxy_http_version 1.1;
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection "upgrade";
proxy_read_timeout 300s; # AI 生图需要较长超时
client_max_body_size 50M;
}
# ComfyUI
location /comfy/ {
proxy_pass http://127.0.0.1:8188/;
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection "upgrade";
proxy_read_timeout 600s;
}
}六、API 调用示例(程序化调用 SD)
<code">import requests, base64, json
# 调用 Stable Diffusion API 生成图片
response = requests.post(
"https://ai.yourdomain.com/sd/sdapi/v1/txt2img",
auth=("user", "password"),
json={
"prompt": "a beautiful landscape, ultra HD, 8k",
"negative_prompt": "blurry, low quality, watermark",
"steps": 20,
"cfg_scale": 7,
"width": 1024,
"height": 1024,
"sampler_name": "DPM++ 2M Karras",
}
)
result = response.json()
image_data = base64.b64decode(result["images"][0])
with open("output.png", "wb") as f:
f.write(image_data)七、性能基准参考(A100 40G)
| 模型 | 分辨率 | Steps | 生成耗时 |
|---|---|---|---|
| SD 1.5 | 512×512 | 20 | ~1.2s |
| SDXL 1.0 | 1024×1024 | 20 | ~3.8s |
| FLUX.1-dev | 1024×1024 | 20 | ~8.5s |
| SD 1.5(批量×4) | 512×512 | 20 | ~3.1s |
八、总结
香港 GPU 服务器 + Stable Diffusion/ComfyUI 是目前面向大陆用户提供 AI 绘图服务的最优架构:模型下载走国际带宽快、API 服务回国走 CN2 GIA 延迟低、免备案即开即用。如需了解 IDC.Net 香港 GPU 服务器配置和报价,请访问 idc.net/hk 或提交工单咨询定制方案。