【盘中宝】里程碑合作OpenAI将付费使用出版巨头的内容这一行业具有丰富数字资源或将成为AI训练重要语料库这家企业拥有众多科技图书和期刊内容资源emc易倍首页

时间：2023-12-15 05:09 来源：网络

　　emc易倍官网 emc易倍官网emc易倍官网财联社资讯获悉，据媒体报道，新闻出版巨头施普林格出版集团（AxelSpringer）与ChatGPT开发机构OpenAI签署协议，成为全球第一家与OpenAI合作将新闻业与人工智能技术进行更深入整合的出版机构。这是媒体为在人工智能工具中使用其内容而争取资金补偿的一个重要里程碑。

　　根据协议，OpenAI将付费使用施普林格旗下出版物的内容，以填充ChatGPT的答案并训练其人工智能工具，内容来源包括美国媒体Politico和“商业内幕（BusinessInsider）”以及欧洲媒体《图片报（Bild）》和《世界报（Welt）》。

　　近期，北京、上海、成都等各地政府密集出台促进AI发展的政策文件，多个文件中均强调了要打造“高质量数据集”。例如，今年5月30日，北京市人民政府发布的《北京市促进通用人工智能创新发展的若干措施》中，强调要“提升高质量数据要素供给能力”，并要求“归集高质量基础训练数据集”。随即次日，深圳市也印发了《深圳市加快推动人工智能高质量发展水平应用行动方案（2023—2024年）》，其中提出要“培育高质量数据要素市场”,打造“高质量中文语料数据”等要求。这足以见得各地政府对于构建高质量数据集的重视程度。

　　在训练数据版权问题上，国内方面，由国家网信办等七部门联合发布的《生成式人工智能服务管理暂行办法》于8月15日正式施行，这是我国首个针对生成式人工智能产业的规范性政策。其中emc易倍首页，《办法》强调了训练数据来源的合法性和质量，规定生成式AI服务提供者不得侵害他人知识产权，需采取有效措施提高训练数据质量emc易倍首页。国外方面，6月14日，欧洲议会投票通过《人工智能法案（AIAct）》，其中，《法案》对于“基础模型”或是经过大量数据训练的强大AI系统增加透明度和风险评估要求，基础模型的供应商被要求披露是否使用受版权保护的材料训练AI模型。东莞证券认为，国内积极推动构建高质量数据集，训练数据版权问题得到重视，优质语料库产业链价值凸显。

　　东莞证券表示，图书出版公司具有丰富高质量中文数据资源，行业有望迎来价值重估。目前用于大模型训练的数据来源包括网页文本、书籍、百科等，书籍在其中占据较大的比重。由于国内出版行业历史悠久、受众群体庞大，且出版过程中需要经过严格的“三审三校”，因此国内出版公司积累了大量成体系、高质量的中文数据资源。

　　浙商证券进一步分析指出，出版业语料资源丰富，出版公司通过书籍电子化形成的图文资源库是AI模型训练的重要数据集，辅以出版公司在版权、IP等方面的资源优势，或将成为AI模型研发的关键基石。叠加AI+教育场景，看好AI技术发展下出版业供给+应用双效价值提升。

　　山东出版出版业务主要包括教材教辅、一般图书、期刊和电子音像产品、数字出版。2022年公司共出版图书12,956种、音像电子出版物323种、期刊8种。

　　果麦文化拥有诸多可NFT化的优质内容和独有素材，将持续放大出版优势，加快科技赋能步伐。

　　中国科传是目前国内拥有科技图书和期刊内容资源最多的出版单位之一，主营业务是高质量图书的出版和海外出版公司、学会、协会的图书、期刊及相关数字出版物引进售卖。

上一篇：【行业资讯】市场观察｜基础油利好难寻再生油市场如emc易倍官网预期下滑 下一篇：刚刚！俞emc易倍官网敏洪向董宇辉致歉称小编的做法严重缺乏职业精神东方甄选5天已掉粉近26万【附直播电商行业趋势分析】

EMC易倍·体育(中国)首页网站

【盘中宝】里程碑合作OpenAI将付费使用出版巨头的内容这一行业具有丰富数字资源或将成为AI训练重要语料库这家企业拥有众多科技图书和期刊内容资源emc易倍首页