中国计算机学会(CCF)主办的第二届 CCF 夜莺开发者创新论坛于近日在京召开,聚焦可观测性数据治理、标准化、可扩展性、eBPF、AI提效和故障诊断等领域。作业帮作为一家领先的教育科技公司,在数据治理方面有着丰富的实践经验。
在论坛上,作业帮运维负责人聂安从技术运营的角度分享了监控数据治理的实践。他指出,观测数据的生命周期能够通过全生命周期管理和透明化管理来提升数据资产的价值,并确保数据质量和合规性。
聂安以作业帮观测数据Metric为例,介绍了数据生命周期治理的要点。他认为,观察数据的生命周期应覆盖建模、生产、收集、处理、存储和使用等环节,以确保数据的准确性、一致性、安全性和合规性。同时,他强调了数据生命周期治理是一个持续的过程,需要企业从数据提取到安全保障等各个环节进行精心设计和规划。
对于如何进行各环节的数据治理,聂安提出了几点建议。首先是策略制定,需要明确指标定义和权限管理;其次是数据分类,在收集阶段引入统一规范化指标命名的pipeline;然后是数据处理,在此过程中可以考虑标签enrichment和流式聚合等技术;最后是存储使用阶段,可以参考数据分析领域的实践思路进行操作。
聂安还提到,在观察数据生命周期中,观察只是数据分析的一个子领域,它正在不断演化和完善。为了充分发挥数据观测的价值,企业需要通盘考虑整个数据资产管理流程。
作业帮技术团队拥有超过200项高精尖技术专利,在语音识别、自然语言处理、图像和OCR识别以及大数据等领域具备丰富经验。他们将为作业帮所有业务提供技术支持,并不断提升自身在相关技术领域的水平。
评论