帮助中心 广告联系

苏州地铁最新线路图-路线图-时刻表-运营时间-规划全图-交通图-苏州地铁网

热门关键词:

哈佛大学和Google将发布100万本书籍到公共领域用作AI训练数据集

来源:原创/投稿/转载 发布时间:2025-02-20

  人工智能训练数据价格不菲,最适合财大气粗的科技公司使用。 这也是哈佛大学计划发布一个公开数据集的原因,该数据集包含约 100 万本公共领域的书籍,涵盖各种类型、语言和作者,其中包括

  新数据集尚未发布,也不清楚何时或如何发布,它所包含的书籍来自Google的长期书籍扫描项目Google Books,因此Google将参与发布这个宝库的广泛应用。

  哈佛大学早在 3 月份就首次预告了机构数据倡议(IDI),概述了其创建人工智能法律数据可信渠道的计划。 然而,直到今天正式启动之前,该计划一直鲜有消息,IDI 得到了微软和 OpenAI 的资金支持。

  IDI 的执行董事Greg Leppert表示,该数据集旨在公平竞争,向希望训练大型语言模型 (LLM) 的任何人(从研究实验室到 AI 初创公司)开放如此庞大的数据集。

本网转载作品的目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。如涉及作品内容、版权等问题,请联系我们进行修改或删除!