AMD开源Lemonade 10.7版首发原生支持NVIDIA GPU本地AI推理-中关村在线

AMD开源Lemonade 10.7版首发原生支持NVIDIA GPU本地AI推理

散落的星星沙

原创

06-11

2026年6月11日，AMD主导开发的开源本地AI服务器解决方案Lemonade正式发布10.7版本。该版本首次完成对NVIDIA GPU的完整本地AI推理支持，通过集成Llama.cpp的CUDA后端，在Windows与Linux双平台实现原生适配，并内置NVIDIA GPU自动识别功能，使用户在NVIDIA硬件上获得与AMD平台一致的本地AI运行体验。

此前，Lemonade已全面支持AMD Ryzen AI NPU、Radeon及Instinct系列GPU、x86_64架构CPU，以及Apple Metal GPU，唯独尚未提供针对NVIDIA GPU的深度优化。本次更新填补了这一关键空白，并同步在Linux平台引入stable-diffusion.cpp的CUDA后端，同时新增跨厂商Vulkan扩展支持，显著扩展了可兼容的图形处理器范围。

为提升开发效率与评估精度，本版本正式推出性能基准测试工具lemonade bench。该工具支持在Llama.cpp、FastFlowLM、vLLM及Ryzen AI等多个推理后端之间开展端到端的大语言模型推理性能对比，大幅降低开发者在不同硬件与框架间进行横向验证的技术门槛。

此外，新版本还新增对LMX-Omni模型的原生支持，并集成Prometheus实时监控接口，便于运维人员对服务状态进行可视化追踪与指标采集。这些改进共同推动Lemonade向通用型、全场景本地AI引擎持续演进。

值得注意的是，本次CUDA后端的整合由社区外部开发者贡献，经AMD团队审核后正式合并至主干分支。此举体现了项目开放协作的发展理念，也标志着AMD在构建跨厂商AI生态方面迈出实质性步伐。

Lemonade作为完全开源的本地AI基础设施项目，持续在GitHub平台更新发布。当前10.7版本已开放下载，开发者可根据自身硬件配置灵活选用适配后端，平稳实现从云端调用到本地部署的迁移过渡。

展开全文