1月6日,英伟达发布最新技术更新,为搭载RTX GPU的个人计算设备带来全面的免费性能升级。此次更新重点引入对NVFP4与NVFP8格式的原生支持,显著提升本地运行人工智能应用时的效率与兼容性,尤其在大语言模型推理和生成式AI任务中表现突出。
配备NVIDIA GeForce RTX系列显卡(包括30、40及50系列)的设备,均能受益于本次优化。这些显卡内置专用AI张量核心,可为游戏、内容创作以及日常办公等多场景提供更强的智能计算能力。在大语言模型方面,诸如GPT-OSS和Nemotron Nano V2等主流模型的执行速度最高提升达40%,大幅缩短响应时间,增强交互体验。
创意生产工具同样获得显著加成。以ComfyUI Flux.1为例,新增的原生NVFP4支持使处理性能实现高达4.6倍的跃升,显著加快图像生成流程。这一改进得益于新型低精度浮点格式的应用,在保持计算精度的同时极大压缩数据占用空间。
NVFP4全称为NVIDIA浮点4位格式,相较传统的BF16格式,其数据体积最多可缩减至原来的四分之一。这意味着相同显存容量下,能够加载更大规模的模型。结合NVFP8的支持,整体模型存储需求最高可降低60%。此外,系统现在可将部分运算负载转移至主机内存,有效缓解独立显卡在高负载下的显存压力,让更多中端配置设备也能顺畅运行复杂AI任务。
在视频生成领域,基于RTX平台的新一代LTX-2音频转视频模型正式亮相。作为当前开放权重体系中领先的视频生成架构,它可在20秒内完成一段4K分辨率视频的生成任务。配合NVFP8格式优化,整体推理速度相较此前提升两倍。
与此同时,RTX视频超分辨率技术也即将于2月接入主流创作环境,支持将720p输入内容智能增强至4K输出。实测数据显示,一段10秒的4K视频从生成到超分的全流程耗时仅需3分钟,相较以往方法节省约80%的时间。
为进一步提升本地内容管理效率,全新的AI驱动视频搜索功能已集成至Nexa Hyperlink平台。借助RTX加速的私有化检索机制,用户可快速定位本地存储中的视频片段、图像文件及相关文档,实现高效的信息提取与再利用。

评论
更多评论