海外AI应用部署实战:在香港GPU服务器上运行Stable Diffusion与ComfyUI完整教程

海外AI应用部署实战:在香港GPU服务器上运行Stable Diffusion与ComfyUI完整教程

Stable Diffusion 和 ComfyUI 已成为 AI 绘图、图像处理、商业设计自动化的核心工具。在本地跑模型受限于显卡性能,在大陆服务器部署又面临备案和网络限制,香港 GPU 服务器提供了最优解:免备案、国际模型下载快、CN2 GIA 回国延迟低,非常适合面向大陆用户提供 AI 绘图服务或搭建团队内部使用的 AI 工作台。


一、GPU 服务器配置选型

使用场景推荐GPU显存估算月费
个人/小团队 SD 使用RTX 4090 / A4024G¥1500~2500
商业 API 服务(并发 <10)A100 40G40G¥3000~5000
高并发推理服务A100 80G / H10080G¥6000+
FLUX / SDXL 模型RTX 4090 或更高≥24G¥1500+

系统推荐:Ubuntu 22.04 LTS + CUDA 12.x(最新驱动兼容性最好)

二、CUDA 环境安装

<code"># 1. 安装 NVIDIA 驱动
apt install -y ubuntu-drivers-common
ubuntu-drivers install
# 或指定版本:apt install nvidia-driver-550

# 重启使驱动生效
reboot

# 验证 GPU 识别
nvidia-smi
<code"># 2. 安装 CUDA Toolkit 12.4
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
dpkg -i cuda-keyring_1.1-1_all.deb
apt update
apt install -y cuda-toolkit-12-4

# 配置环境变量
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

# 验证
nvcc --version
<code"># 3. 安装 Python 3.11 + pip
apt install -y python3.11 python3.11-venv python3-pip
python3.11 --version

三、部署 AUTOMATIC1111 Stable Diffusion WebUI

<code"># 安装依赖
apt install -y git wget libgoogle-perftools-dev

# 克隆仓库
cd /opt
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

# 下载基础模型(以 SDXL 1.0 为例)
mkdir -p models/Stable-diffusion
wget -O models/Stable-diffusion/sd_xl_base_1.0.safetensors \
  "https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0.safetensors"

启动脚本(服务器模式,开放 API)

<code">cat > webui-server.sh << 'EOF'
#!/bin/bash
cd /opt/stable-diffusion-webui

python3.11 launch.py \
  --xformers \           # xFormers 加速,显存占用减少 ~30%
  --listen \             # 监听所有网络接口
  --port 7860 \
  --api \                # 开放 REST API(供程序调用)
  --api-auth user:password \  # API 认证(必须设置!)
  --no-gradio-queue \
  --opt-sdp-attention \  # 优化 SDXL 推理速度
  --medvram              # 中等显存模式(<24G 时使用)
EOF
chmod +x webui-server.sh

systemd 服务配置

<code">[Unit]
Description=Stable Diffusion WebUI
After=network.target

[Service]
Type=simple
User=root
WorkingDirectory=/opt/stable-diffusion-webui
ExecStart=/opt/stable-diffusion-webui/webui-server.sh
Restart=on-failure
Environment=COMMANDLINE_ARGS="--xformers --listen --api"

[Install]
WantedBy=multi-user.target

四、部署 ComfyUI(工作流式 AI 绘图)

ComfyUI 采用节点式工作流设计,适合构建复杂的图像处理管线,是更适合开发者和高级用户的选择。

<code"># 安装 ComfyUI
cd /opt
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

# 创建虚拟环境并安装依赖
python3.11 -m venv venv
source venv/bin/activate
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

# 安装 ComfyUI Manager(插件管理器)
cd custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager.git
cd ..
<code"># 启动 ComfyUI(监听所有接口)
python main.py \
  --listen 0.0.0.0 \
  --port 8188 \
  --preview-method auto \
  --cuda-device 0

五、Nginx 反向代理 + SSL(对外提供服务)

<code"># /etc/nginx/sites-available/ai.yourdomain.com
server {
    listen 443 ssl;
    server_name ai.yourdomain.com;

    ssl_certificate /etc/letsencrypt/live/ai.yourdomain.com/fullchain.pem;
    ssl_certificate_key /etc/letsencrypt/live/ai.yourdomain.com/privkey.pem;

    # WebUI(AUTOMATIC1111)
    location /sd/ {
        proxy_pass http://127.0.0.1:7860/;
        proxy_set_header Host $host;
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_read_timeout 300s;     # AI 生图需要较长超时
        client_max_body_size 50M;
    }

    # ComfyUI
    location /comfy/ {
        proxy_pass http://127.0.0.1:8188/;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_read_timeout 600s;
    }
}

六、API 调用示例(程序化调用 SD)

<code">import requests, base64, json

# 调用 Stable Diffusion API 生成图片
response = requests.post(
    "https://ai.yourdomain.com/sd/sdapi/v1/txt2img",
    auth=("user", "password"),
    json={
        "prompt": "a beautiful landscape, ultra HD, 8k",
        "negative_prompt": "blurry, low quality, watermark",
        "steps": 20,
        "cfg_scale": 7,
        "width": 1024,
        "height": 1024,
        "sampler_name": "DPM++ 2M Karras",
    }
)

result = response.json()
image_data = base64.b64decode(result["images"][0])
with open("output.png", "wb") as f:
    f.write(image_data)

七、性能基准参考(A100 40G)

模型分辨率Steps生成耗时
SD 1.5512×51220~1.2s
SDXL 1.01024×102420~3.8s
FLUX.1-dev1024×102420~8.5s
SD 1.5(批量×4)512×51220~3.1s

八、总结

香港 GPU 服务器 + Stable Diffusion/ComfyUI 是目前面向大陆用户提供 AI 绘图服务的最优架构:模型下载走国际带宽快、API 服务回国走 CN2 GIA 延迟低、免备案即开即用。如需了解 IDC.Net 香港 GPU 服务器配置和报价,请访问 idc.net/hk 或提交工单咨询定制方案。

Telegram