【#互联网高质量数据将枯竭#】#AI公司将耗尽大部分互联网数据# 近日,有媒体发布题为《AI公司很快将耗尽大部分互联网数据》的文章,指出随着互联网高质量数据的枯竭,AI领域面临“数据墙”。对于AI大模型公司来说,现在的挑战是找到新的数据源或可持续的替代品。
该篇文章援引研究公司Epoch AI的预测,到2028年互联网上所有高质量的文本数据都将被使用完毕,机器学习数据集可能会在2026年前耗尽所有“高质量语言数据”。这种现象在业内被称为“数据墙”。如何应对“数据墙”是当下AI公司面临的重大问题之一,可能也是最有可能减缓其训练进展的问题。(澎湃新闻)@澎湃新闻
标签:
评论列表
{{item.comment}}
{{item2.comment}}