首页山东省山东省工业和信息化厅关于组织开展2025年工业领域重点行业产业数据仓和知识语料库征集工作的通知

关于组织开展2025年工业领域重点行业产业数据仓和知识语料库征集工作的通知

时间1970-01-01 08:00:00分类山东省工业和信息化厅浏览4

各市工业和信息化局,相关单位:

为贯彻落实《山东省“十四五”数字强省建设规划》《山东省“十四五”大数据产业发展规划》《山东省关于加快大模型产业高质量发展的指导意见》等文件要求,加快推动工业领域重点行业数据汇聚流通和创新应用,以“产业大数据+行业大模型”赋能特色优势行业数智化转型,现组织开展2025年工业领域重点行业产业数据仓和知识语料库征集工作。有关事项通知如下:

一、申报方向

(一)产业数据仓

申报单位面向全省高端装备制造、新材料、新能源、新一代电子信息、绿色化工、生物医药、智能家电、食品加工等重点工业行业,选择其中一个或多个细分行业,以产业数智转型场景为驱动,通过采集、合成、治理等数据处理过程,汇聚公共数据、产业数据和企业数据,形成行业高质量数据集,包括行业通识和行业专识数据集。数据集类型包括结构化数据、文本、视频、音频、图形图像等多模态形式。

(二)知识语料库

申报单位聚焦工业研发、设计、生产、管理、服务等关键环节和特定场景,通过收集生产流程描述、设备运行数据、工艺参数、质量检测报告、故障诊断记录、供应链信息、企业管理文档等语料资源,对语料进行清洗、去噪和统一格式,并对整理后的语料进行标注,形成直接用于行业大模型或场景大模型开发、训练和微调的高质量语料库。语料库类型包括各类文本、表格、图像、音频、视频等格式。

二、申报条件

(一)申报单位为依法设立并具有独立承担民事责任能力的企事业单位,联合申报单位应包含大模型开发重点企业、传统行业龙头企业、科研实力雄厚的高校院所等。

(二)申报单位经营状态正常,符合产业发展方向;近三年内未发生过较大以上安全生产事故,无严重失信记录,未被列入经营异常名录;符合财政涉企资金“绿色门槛”制度要求。

(三)产业数据仓申报单位应具备行业核心数据积累,包括生产制造、供应链、市场消费、技术创新等全链条数据,数据规模、质量及标准化程度较高,应用区块链、隐私计算、数据沙箱等安全可信技术实现数据确权、分级分类管理和安全共享。

(四)知识语料库申报单位应具备较强的工业领域专业知识和技术实力,熟悉工业生产流程和数据处理方法,具备语料收集、整理、标注所需的软硬件设施和专业团队。申报的大模型语料库应具有较高应用价值,能够支持业务应用场景落地,支撑人工智能大模型开发和训练,并具备定期更新机制,符合国家数据安全与合规相关要求。

三、工作流程

(一)组织申报。各市工信局统筹辖区内项目申报工作,组织有关单位填报《项目申报书》(附件1),并于3月20日前将推荐汇总表及项目申报书材料word版和盖章扫描件各一份报送至邮箱cytjc@shandong.cn

(二)评审公布。省工业和信息化厅将组织专家或第三方专业机构对申报项目进行评审,重点评估产业数据仓和知识语料库的完整性、可用性和应用价值等,确定符合条件的申报项目及承担单位,经公示无异议后予以公布。

(三)动态跟踪。申报单位按照数据仓和语料库更新要求,定期提交更新进展。省工业和信息化厅将建立项目库,对未覆盖的细分行业和领域,滚动开放补报通道。

(四)成果推广。省工业和信息化厅联合行业协会、产业联盟等举办“人工智能应用专场对接会”系列活动,将符合推广条件的数据仓和语料库面向大模型企业进行全省推广,并择优推荐申报国家级示范项目。

四、联系方式  

联系人:陈倩倩  0531-51782725

邮  箱:cytjc@shandong.cn


     附件:申报表.docx




山东省工业和信息化厅  

2025年2月19日 


商务喇叭版权声明:以上内容均转发自互联网,信息形式为公开信息、不含涉密信息、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

关于印发《河北省劳动人事争议仲裁有关规则指导意见》的通知

游客 回复需填写必要信息