微软的DirectX 12规范(以下简称DX12)还没有全部完工,不过DX12带来的新特性以及A/N混合交火的秘密武器已经让人期待不已了,其中最重要的当属游戏性能优化,DX12大幅提升了底层硬件效率,改善了CPU多线程性能,这对低端平台来说更有意义。
Anandtech网站之前在微软、AMD及NVIDIA的帮助下使用《Starsworm》游戏做了两次DX12游戏性能预览——一次是AMD、NVIDIA独显的,第二次测试了AMD的APU处理器,现在第三波也来了,这次测试的是Intel的处理器,性能更弱的Intel核显能在DX12中受益多少呢?
之前说过,DX12需要显卡支持新一代的WDDM 2.0规范,现在Intel也给他们提供了编号10.18.15.4098的驱动,支持Gen 7.5代的Haswell核显及更新GPU。
Intel的核显通常有不同的等级,这次Anandtech网站会分别测试GT1、GT2及GT3e这几种不同的核显,并与之前的APU处理器做对比,详细测试平台如下:
测试平台配置
首先来看中等及低画质下的整体并行能力测试。
中等画质下的并行能力测试
低画质下的并行能力测试
StarSworm主要面向独显开发,所以集显的性能不会很好看。至于DX12给Intel核显带来了什么,AMD的APU性能倒是大幅提升了,但Intel核显显然就没有这么好的表现了,比相对值的话可能还有10%-20%多的提升,但与之前测试过的独显以及APU相比,Intel核显太不给力了。
Intel GPU性能为何不给力?
这里测试的Intel核显有GT1、G2及GT3e三个级别,他们的规格相差很大,而且GT3e还有128MB的eDRAM缓存,按说性能应该远胜GT1/2的,但这里的测试中三者并没有拉开差距,Anandtech基于Haswell处理器的GPU架构做了分析。
Intel Haswell处理器GPU架构
Intel核显的渲染架构
详细的技术解释不提了,Anandtech的解释是说他们认为Intel的核显在DX12中是技术上的GPU受限,这不同于传统的GPU首先——不是渲染性能不行,也不是带宽问题,也不是ROP单元性能,这意味着Intel的iGPU核显不能从DX12中受益良多,不像AMD的APU或者独显。
不过随后的更新中,Intel也发来了他们的解释,认为GT3e核显性能不行是因为Oxide的游戏代码太旧了,还是去年10月份的,最新的代码中整体性能好多了,与GT3e应有的表现一致。
批处理时间,越短越好
从批处理时间的指标上可以更容易地看出DX12下的CPU占用,在DX11下Intel核显的批处理时间比APU差得多,Core i7-4770R甚至接近200ms,而在DX12下,这一时间缩短到了不足20ms。虽然还是比AMD的APU要差,在这一点上我们依然是严重受限于GPU性能,Intel还有很多需要改进的。
基于以上数据,我们可以更好地理解这次的测试结果了。与AMD及NVIDIA的显卡一样,Intel的核显在DX12下也能大幅降低批处理时间(batch submission time),不过在Starsworm游戏中,批处理数量对GT2及GT3e这样的核显来说还是太多了,他们的性能依然不足,导致最终的性能并没有明显提升。
低画质横向数据对比
中画质横向数据对比
最终的测试显示,在DX12规范下,Intel核显从原来的CPU受限变成了GPU受限。相比AMD的APU来说,Intel的GPU性能更弱,更快地在DX12中达到了极限。不过需要指出的是,Intel的桌面处理器更强调CPU性能,GPU配置比较弱,而在移动平台则反过来了(GT3e这样的核显大多用于移动平台处理器),所以在移动平台上,Intel的处理器要比桌面处理器更能从DX12中受益。
总结:根据Anandtech的官方评测,Intel核显在DX12中的表现非常不尽人意,不仅没有质变的性能飞跃。甚至本身几乎毫无提高,而AMD的APU方面则有巨大幅度提高,虽然AMD在之前的评测中,DX12显卡效率一直不如NVIDIA,但对比英特尔方面。AMD几乎完全通过APU集成的庞大规模GPU部分得到了巨大的性能飞跃。而原本的英特尔处理器则遇到了GPU不够的瓶颈,
而AMD的APU之所以提高很大的主要原因,无外乎是因为DX12极大的提高了APU的多线程利用率,导致AMD多核心很容易发挥高性能。同时CPU的负载率提高直接导致AMD的显卡性能不再被CPU拖累,直接大幅度提高了APU的总成绩。看来英特尔在GPU的弱点也在DX12新API中暴露的越来越多了。
评论