2026年4月29日消息,AMD正为其AMDXDNA加速器驱动程序开发一项名为“硬件调度器时间片”的新功能,旨在避免单一应用程序长期独占锐龙AI NPU全部计算资源。
该功能聚焦于NPU在多任务、多用户环境下的关键挑战:当某个AI推理任务持续运行时,可能长期占用全部NPU资源,致使其他并发任务无法及时获得服务响应。
其技术路径是依托NPU内置硬件调度器,在多个并发执行上下文之间实施严格的时间片轮转机制。默认时间片长度设定为30毫秒,这一数值兼顾了任务响应实时性与整体吞吐效率。
目前,相关代码补丁已提交至Linux内核邮件列表接受审核。按常规开发节奏推算,该功能有望在Linux内核7.2版本发布周期内被正式纳入主线。
值得注意的是,在保障NPU资源共享公平性方面,AMD并非首家采取技术手段的厂商。此前,Intel已在Linux内核7.1版本中为其IVPU加速器驱动引入了资源约束机制,限制非root用户空间程序对酷睿Ultra平台NPU资源的过度调用——具体设定为最多使用64个上下文和127个门铃,约占全部可用资源的一半。
相较而言,AMD未采用静态资源配额方式,而是通过硬件级时间片调度实现动态资源分配,将调度决策权交由NPU自身完成。
尽管实现路径不同,两家厂商的核心目标高度一致:确保AI加速单元在真实多任务、多用户场景下,能够稳定、公平地服务于各类工作负载,杜绝因单个高负载应用导致的资源垄断现象。

评论
更多评论