新闻行业 大规模预训练模型 研发数据要求 (T/CAPT 012-2024) 团体名称为中国新闻技术工作者联合会
主要起草人:路海燕、王宇琦、张丹、王建利、刘万福、王楠、王建平、贾珣、赵伟东、朱迅、王京、王付生、佘泽鹏、区可明、罗毅、林波、成鹏、王仲豪、郑创伟、瞿曦、邓海滢、刘琼、张鹏洲、曹娟、王志民、殷圣忠、王峰、熊立波、王熠、王慕维、付蓉、孙心桐、黄菁。
起草单位:新华通讯社通信技术局、北京北大方正电子有限公司、杭州前方信息技术有限公司、江苏联著实业股份有限公司、北京星震同源数字系统股份有限公司、中国互联网新闻中心、华为云科技有限公司、中科闻歌科技股份有限公司、中联超清(北京)科技有限公司、拓尔思信息技术股份有限公司、新华社媒体融合生产技术与系统国家重点实验室(新华融合媒体科技发展(北京)有限公司)、中国传媒大学、深圳市创意智慧港科技有限责任公司(深圳报业集团技术公司)、中国新闻社、福建理工大学。
内容简要 《新闻行业 大规模预训练模型 研发数据要求》针对用于训练、微调和评估预训练模型的所有数据,提出了技术要求。该标准确保了在预训练模型研发过程中,数据的质量和规范性,从而提升模型的…