海外AI应用部署实战：在香港GPU服务器上运行Stable Diffusion与ComfyUI完整教程

Stable Diffusion 和 ComfyUI 已成为 AI 绘图、图像处理、商业设计自动化的核心工具。在本地跑模型受限于显卡性能，在大陆服务器部署又面临备案和网络限制，香港 GPU 服务器提供了最优解：免备案、国际模型下载快、CN2 GIA 回国延迟低，非常适合面向大陆用户提供 AI 绘图服务或搭建团队内部使用的 AI 工作台。

一、GPU 服务器配置选型

使用场景	推荐GPU	显存	估算月费
个人/小团队 SD 使用	RTX 4090 / A40	24G	¥1500～2500
商业 API 服务（并发 <10）	A100 40G	40G	¥3000～5000
高并发推理服务	A100 80G / H100	80G	¥6000+
FLUX / SDXL 模型	RTX 4090 或更高	≥24G	¥1500+

系统推荐：Ubuntu 22.04 LTS + CUDA 12.x（最新驱动兼容性最好）

二、CUDA 环境安装

<code"># 1. 安装 NVIDIA 驱动
apt install -y ubuntu-drivers-common
ubuntu-drivers install
# 或指定版本：apt install nvidia-driver-550

# 重启使驱动生效
reboot

# 验证 GPU 识别
nvidia-smi

<code"># 2. 安装 CUDA Toolkit 12.4
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
dpkg -i cuda-keyring_1.1-1_all.deb
apt update
apt install -y cuda-toolkit-12-4

# 配置环境变量
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

# 验证
nvcc --version

<code"># 3. 安装 Python 3.11 + pip
apt install -y python3.11 python3.11-venv python3-pip
python3.11 --version

三、部署 AUTOMATIC1111 Stable Diffusion WebUI

<code"># 安装依赖
apt install -y git wget libgoogle-perftools-dev

# 克隆仓库
cd /opt
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

# 下载基础模型（以 SDXL 1.0 为例）
mkdir -p models/Stable-diffusion
wget -O models/Stable-diffusion/sd_xl_base_1.0.safetensors \
  "https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0.safetensors"

启动脚本（服务器模式，开放 API）

<code">cat > webui-server.sh << 'EOF'
#!/bin/bash
cd /opt/stable-diffusion-webui

python3.11 launch.py \
  --xformers \           # xFormers 加速，显存占用减少 ~30%
  --listen \             # 监听所有网络接口
  --port 7860 \
  --api \                # 开放 REST API（供程序调用）
  --api-auth user:password \  # API 认证（必须设置！）
  --no-gradio-queue \
  --opt-sdp-attention \  # 优化 SDXL 推理速度
  --medvram              # 中等显存模式（<24G 时使用）
EOF
chmod +x webui-server.sh

systemd 服务配置

<code">[Unit]
Description=Stable Diffusion WebUI
After=network.target

[Service]
Type=simple
User=root
WorkingDirectory=/opt/stable-diffusion-webui
ExecStart=/opt/stable-diffusion-webui/webui-server.sh
Restart=on-failure
Environment=COMMANDLINE_ARGS="--xformers --listen --api"

[Install]
WantedBy=multi-user.target

四、部署 ComfyUI（工作流式 AI 绘图）

ComfyUI 采用节点式工作流设计，适合构建复杂的图像处理管线，是更适合开发者和高级用户的选择。

<code"># 安装 ComfyUI
cd /opt
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

# 创建虚拟环境并安装依赖
python3.11 -m venv venv
source venv/bin/activate
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

# 安装 ComfyUI Manager（插件管理器）
cd custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager.git
cd ..

<code"># 启动 ComfyUI（监听所有接口）
python main.py \
  --listen 0.0.0.0 \
  --port 8188 \
  --preview-method auto \
  --cuda-device 0

五、Nginx 反向代理 + SSL（对外提供服务）

<code"># /etc/nginx/sites-available/ai.yourdomain.com
server {
    listen 443 ssl;
    server_name ai.yourdomain.com;

    ssl_certificate /etc/letsencrypt/live/ai.yourdomain.com/fullchain.pem;
    ssl_certificate_key /etc/letsencrypt/live/ai.yourdomain.com/privkey.pem;

    # WebUI（AUTOMATIC1111）
    location /sd/ {
        proxy_pass http://127.0.0.1:7860/;
        proxy_set_header Host $host;
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_read_timeout 300s;     # AI 生图需要较长超时
        client_max_body_size 50M;
    }

    # ComfyUI
    location /comfy/ {
        proxy_pass http://127.0.0.1:8188/;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_read_timeout 600s;
    }
}

六、API 调用示例（程序化调用 SD）

<code">import requests, base64, json

# 调用 Stable Diffusion API 生成图片
response = requests.post(
    "https://ai.yourdomain.com/sd/sdapi/v1/txt2img",
    auth=("user", "password"),
    json={
        "prompt": "a beautiful landscape, ultra HD, 8k",
        "negative_prompt": "blurry, low quality, watermark",
        "steps": 20,
        "cfg_scale": 7,
        "width": 1024,
        "height": 1024,
        "sampler_name": "DPM++ 2M Karras",
    }
)

result = response.json()
image_data = base64.b64decode(result["images"][0])
with open("output.png", "wb") as f:
    f.write(image_data)

七、性能基准参考（A100 40G）

模型	分辨率	Steps	生成耗时
SD 1.5	512×512	20	~1.2s
SDXL 1.0	1024×1024	20	~3.8s
FLUX.1-dev	1024×1024	20	~8.5s
SD 1.5（批量×4）	512×512	20	~3.1s

八、总结

香港 GPU 服务器 + Stable Diffusion/ComfyUI 是目前面向大陆用户提供 AI 绘图服务的最优架构：模型下载走国际带宽快、API 服务回国走 CN2 GIA 延迟低、免备案即开即用。如需了解 IDC.Net 香港 GPU 服务器配置和报价，请访问 idc.net/hk 或提交工单咨询定制方案。

海外AI应用部署实战：在香港GPU服务器上运行Stable Diffusion与ComfyUI完整教程

海外AI应用部署实战：在香港GPU服务器上运行Stable Diffusion与ComfyUI完整教程

一、GPU 服务器配置选型

二、CUDA 环境安装

三、部署 AUTOMATIC1111 Stable Diffusion WebUI

启动脚本（服务器模式，开放 API）

systemd 服务配置

四、部署 ComfyUI（工作流式 AI 绘图）

五、Nginx 反向代理 + SSL（对外提供服务）

六、API 调用示例（程序化调用 SD）

七、性能基准参考（A100 40G）

八、总结

云服务器

独立服务器

域名主机

资源

关于我们