2026年6月11日,AMD主导开发的开源本地AI服务器解决方案Lemonade正式发布10.7版本。该版本首次完成对NVIDIA GPU的完整本地AI推理支持,通过集成Llama.cpp的CUDA后端,在Windows与Linux双平台实现原生适配,并内置NVIDIA GPU自动识别功能,使用户在NVIDIA硬件上获得与AMD平台一致的本地AI运行体验。
此前,Lemonade已全面支持AMD Ryzen AI NPU、Radeon及Instinct系列GPU、x86_64架构CPU,以及Apple Metal GPU,唯独尚未提供针对NVIDIA GPU的深度优化。本次更新填补了这一关键空白,并同步在Linux平台引入stable-diffusion.cpp的CUDA后端,同时新增跨厂商Vulkan扩展支持,显著扩展了可兼容的图形处理器范围。
为提升开发效率与评估精度,本版本正式推出性能基准测试工具lemonade bench。该工具支持在Llama.cpp、FastFlowLM、vLLM及Ryzen AI等多个推理后端之间开展端到端的大语言模型推理性能对比,大幅降低开发者在不同硬件与框架间进行横向验证的技术门槛。
此外,新版本还新增对LMX-Omni模型的原生支持,并集成Prometheus实时监控接口,便于运维人员对服务状态进行可视化追踪与指标采集。这些改进共同推动Lemonade向通用型、全场景本地AI引擎持续演进。
值得注意的是,本次CUDA后端的整合由社区外部开发者贡献,经AMD团队审核后正式合并至主干分支。此举体现了项目开放协作的发展理念,也标志着AMD在构建跨厂商AI生态方面迈出实质性步伐。
Lemonade作为完全开源的本地AI基础设施项目,持续在GitHub平台更新发布。当前10.7版本已开放下载,开发者可根据自身硬件配置灵活选用适配后端,平稳实现从云端调用到本地部署的迁移过渡。

评论
更多评论