中关村在线

企业存储

迎接智能时代的数据洪流 是时候刷新你的存储认知了

“到2025年,中国将拥有全球最大数据圈。”这是希捷科技与IDC共同的预判。届时,中国数据圈的规模将增至48.6ZB,占全球数据圈的27.8%,其背后的主要推动力将来自物联网设备信号、元数据、娱乐相关数据、云计算和边缘计算的演进,越来越多的物联网设备在数据的创建位置处理并分析原始数据,基础设施也将变得更加智能化,而驱使这一切产生变革的核心就是数据。

在“数能怒放—从边缘到核心—全球数据圈暨中国区白皮书发布会”上,希捷科技全球副总裁暨中国区总裁孙丹表示:“数据已然成为了不可或缺的关键生产力,而科学合理地获取、存储、分析以及利用数据成为抓住商机的最有效途径。毋庸置疑,中国的数据圈在全球占据着非常重要的地位,并将在2025年高居榜首。”可以看到,企业正在依靠数据优化客户体验、开拓新市场、提高员工和流程效率,以打造面向数字化未来的核心竞争力。

希捷科技全球副总裁暨中国区总裁孙丹

那么什么是“数据圈”?IDC高级副总裁David Reinsel给出了解释:“数据可以分为原始数据和复制数据,我们认为在全球数据圈中只有15%的数据是原始数据,有85%是复制数据,或者复制的复制。我们有很多原因复制数据,例如法规的原因、数据保护的原因、性能的原因等等。如果把原始和复制数据进行整合,就会构成全球数据圈。全球数据圈能够告诉我们,到底每年会产生多少新的数据。”

IDC高级副总裁David Reinsel

全球数据圈正发生变化

每一天,工业、金融、医疗、娱乐、媒体等行业都在产生PB级的信息量,而ML/DL、VR/AR等新兴技术的应用让数据曲线呈现了指数级的增长趋势。随着数据融入人们的业务工作流程和个人生活轨迹,到2025年将有近30%的全球数据圈变为实时。如果想要提供优质的客户体验并扩大市场份额,企业的数据基础设施必须能够满足实时数据的这种增长。

根据由希捷科技赞助、IDC发布的《数字化世界——从边缘到核心》白皮书(下称“白皮书”),当前每天有超过50亿消费者与数据发生互动,到2025年这一数字将上升到60亿,相当于全球人口的75%。2025年,每个联网的人每隔18秒就会有至少1次数据交互。这种交互多数源自于全球各地联网的数十亿台物联网设备,预计在2025年将产生超过90ZB数据。

变化的不止是数据的规模,其产生的形式和性质也在悄然改变。在David Reinsel看来,数据变化的趋势主要体现在四个方面:第一,从娱乐驱动的数据向生产力和效率驱动数据的转变,通信设备、IoT终端,以及各类的传感器在全天候对周围的环境进行着监测和分析,这种实时产生的数据量是非常大的。第二,到2020年会有越来越多的数据在公有云存储,超过消费者自己设备的数据量,而到2022年存储在公有云数据量也将超过存储在企业系统内的数据量。企业开始越来越信任云服务以存储并管理数据。

第三,在中国数据圈边缘创建和复制的数据所占比例将从数据总量的13%增加到23%,即边缘IT将变得日益重要,这也呼应了此次调研的关键词——“从边缘到核心”。David Reinsel认为,企业需要把越来越多数据部署在边缘环境,相关的投资也要持续加大,“到2025年全球总的数据量会达到175ZB,其中22%是边缘产生,28%是核心产生,50%是终端产品。”

由此引伸的第四个趋势就是,企业存储的重要性随之提升。到2025年,企业将存储全球超过85%的数据。“这就是企业存储的复兴。”David Reinsel说,“很多消费者把数据存储在自己的终端,不过将来我们会看到越来越多的消费者会更愿意把自己的数据存储在企业云中,对企业来说这是一项巨大的责任。”

让数据存储行之有效

与此同时,人们对于数据的理解也要更深一层,首先就是要知道,创建的数据并不代表存储的数据,事实上存储数据只占到创建数据的1%,很多创建的数据都是暂时的,很快就会消失。举例来说,飞机航行过程中对引擎的工作状况会进行监控,只有当出现异常时的数据信息会被标记出来,而正常工作时的数据就会一直被存放在那里。再如视频监控摄像头亦是如此,多数的数据隔一段时间就会被清理掉。David Reinsel透露,在产生的这些数据中,使用率可能只有60%,剩余40%的空间可以腾出来存储更有用的数据,“企业存储数据的时候是存储必要的数据,不会关注不必要的数据。”

IDC预计到2025年,所有介质类型的存储容量出货量会超过22ZB,其中近59%的容量来自HDD产业,26%来自闪存技术,只有光存储显露颓势,原因是消费者会继续放弃 DVD,转而使用视频和音频流播放。

这一过程中,端点和边缘存储的增长将有利于固态设备,而核心对于HDD和磁带提供的经济型存储容量依然具有极大需求。企业会采用HDD、SSD、闪存和磁带的组合来满足所面临的性能、管理和归档需求。《白皮书》指出,到2025年末超过80%的企业数据将转移到核心,而与SSD和其他NVM技术相比,边缘的数据仍将以HDD为主。对此,希捷科技一直都在研发新技术以持续提升HDD的性能容量并降低成本,HAMR就被视为是“下一个重要的存储技术创新”。

其实早在20世纪90年代末,希捷就在潜心研发HAMR这项技术,并在去年底向核心客户提供了首批采用HAMR的硬盘产品,并且在实验室中实现了HAMR读写磁头可靠性测试超过了客户要求20倍(单个HAMR读/写磁头可靠传输数据6000小时,相当于单个头上传输的3.2 PB数据)。作为一项应用在磁盘上的新的介质磁技术,HAMR允许数据位或颗粒变得比以往更小、更密集,同时保持了稳定性。由此来提高数据密度已成为业界趋势,而所带来的产品也将是16TB或者更大容量的设备。

考虑到数据密度的复合年增长率为30%,到2023年会升至40TB或更高,对于确保数据中心从硬盘驱动器持续降低的TCO至关重要。此外,配合支持数据流并行的MACH.2也可让单个硬盘的IOPS性能翻倍。早在去年的OCP峰会上,希捷科技就公布了与合作伙伴在HAMR和MACH.2上的集成开发项目。

激发云和边缘的数据潜能

可以看到的一个趋势是,企业级数据圈的增速要超过消费者,这也从侧面印证了“云存储”的必然性。像笔者曾经采访过的一家国内知名的大型工业企业,其在上云之初并不容易。对于传统制造型企业而言,把业务迁移到公有云颇有挑战。工业互联网时代产生的数据量比传统的信息化要多数千倍甚至数万倍,并且是实时采集、高频度、高密度的,动态数据模型随时可变,这么大规模且复杂的数据上传到公有云,能够给出恰当处理办法和合理价格的云服务商并不多。因此,他们更多是选择了混合云部署。

IDC在一份报告中指出,超过80%的中国企业承认将在2020年前拥有多云战略,引入混合云基础架构的比例同样在提升,而这一过程不会是一帆风顺的。“对存储肯定有挑战,因为是碎片化的。”孙丹对笔者说。以三一重工为例,其部分业务部署在私有云上,一些中间件则是运行在公有云平台,再加上前端产生的数据,使得云、边、端之间的数据交互产生了阻隔。此时,就需要希捷科技这样的厂商进行有效的存储管理。

“我们在数据中心管理方面有着非常成熟的解决方案,基本上与包括BAT在内的云厂商都有合作。不仅如此,我们与海康、大华等安全厂商,以及做存储或服务器的企业,也长久的合作,帮助他们找到有效的办法管理存储。”孙丹表示,“比如基础的工具就是硬盘健康管理、预警、提前告知等等,有了预知就能做好数据备份,同时,我们还可以辨别什么是假报警,这些举措都可以帮助客户节省成本。最为关键的是,我们能够为企业提供定制化的解决方案,帮忙他们更智能的管理存储。”

通过与希捷科技在高密度磁盘等产品上的联合研发,腾讯云在确保数据可靠性、可用性、降低成本方面取得了长足的进步,未来双方还将在多读写臂技术、HAMR等技术层面展开更为深入的合作。腾讯云存储产品中心研发副总经理陈峥谈到,从边缘到云,再到核心的数据采集和存储对云环境有着很大挑战,“我们要满足不同场景下客户对于性能的要求,这方面我们和希捷会有更多的讨论。随着数据量呈现指数级增长,数据的架构要不断革新才能应对未来数据的爆发。”

2019年,希捷科技的IT4.0战略将更进一步,继续深耕5G、IoT、无人驾驶等领域,结合人工智能对网络边缘侧的物联网数据进行主动预测,让更多的数据在产生的源头就能被实时处理并加以利用。正如孙丹所说:“作为数据生态产业链中至关重要的一环,存储对于企业实现其数据价值的重要性不言而喻。40年来,希捷一直聚焦于技术的研发和创新,专注数据创建、物理设备、数据安全以及数据流等四大研发支柱,以独特的技术满足数据爆炸产生的存储需求,助力企业挖掘数据星球的潜力,获取更多的价值。”

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具