Xinference v1.11.0.post1 更新日志

✅ 本次亮点

🧠

⚙️

🖼️

可直接兼容 images/edits 接口，提升图像编辑与生成类模型的兼容性。

pip pip install 'xinference==1.11.0.post1'

Docker 拉取最新版镜像或在容器中使用 pip 更新

Instruct / Thinking 版本

视觉语言模型

OpenAI image edit API 支持

VLLM 支持多模型加载（含 Omni、图像、视频、音频模型）

VLLM 支持 AWQ 8bit 量化

CUDA 12.8 镜像升级 VLLM 至 0.10.2

修复 UI 中 n_gpu_layers=-1 时按钮失效的问题

修复 CI 构建及 CUDA 12.8 Dockerfile 问题

同步多模态模型 JSON（音频、图像、视频、LLM）

支持模型副本自动调度与生命周期管理，为集群化推理提供统一接口

修复了一些已知问题，整体运行更加稳定可靠