互联网高质量数据将枯竭

青年说

#互联网高质量数据将枯竭##AI公司将耗尽大部分互联网数据# 近日,有媒体发布题为《AI公司很快将耗尽大部分互联网数据》的文章,指出随着互联网高质量数据的枯竭,AI领域面临“数据墙”。对于AI大模型公司来说,现在的挑战是找到新的数据源或可持续的替代品。


该篇文章援引研究公司Epoch AI的预测,到2028年互联网上所有高质量的文本数据都将被使用完毕,机器学习数据集可能会在2026年前耗尽所有“高质量语言数据”。这种现象在业内被称为“数据墙”。如何应对“数据墙”是当下AI公司面临的重大问题之一,可能也是最有可能减缓其训练进展的问题。(澎湃新闻)@澎湃新闻

标签:

发表评论

评论列表

{{item.updateTime}}

{{item.comment}}

{{item2.updateTime}}

{{item2.comment}}