大多数国内模型都使用中国数据进行培训,并使用超过60%
国家数据管理局的记者发现,中国数据在改善培训国内大型模型的实践中起着重要作用。在国内模型中,大多数培训中使用的中国数据比例超过60%,有些模型达到80%。高质量中国数据的发展能力和供应将继续增加,从而促进我国人工智能模型的绩效的迅速提高。在人工智能时代,令牌(通常称为单词元素)是处理文本的最小数据单元。国家数据局局长刘·列和州(Liu Liehong)提出,2024年初,我国家的平均日期消费量为1000亿。到今年6月底,代币的平均太阳消耗超过300万亿,一年半内增加了300次,这反映了我国人工智能的人为应用的迅速增长。