根据马斯克和其他人工智能专家的分析,我们目前所拥有的用于训练AI模型的数据已经接近耗尽。这一现象在去年开始逐渐显现出来,因为他们认为我们已经消耗掉了所有人类知识的积累。未来缺乏足够的训练数据将迫使AI模型的开发方式发生改变。
目前,许多科技公司已经开始使用合成数据来解决这个问题。Gartner估计到2024年,用于人工智能和数据分析项目的60%数据将是通过合成方式生成的。与现实世界中的真实数据相比,这种方法能够降低成本并且更加高效。
然而,虽然使用合成数据可以解决问题的一部分困难,但也存在一些风险和挑战。研究表明,在使用合成数据进行训练时,可能会导致模型性能下降、输出结果缺乏创新性和偏差等问题,并最终严重影响其功能性。因此,在进一步推进人工智能发展之前,我们需要更好地考虑如何解决这些问题并确保良好的结果。
评论