INTRODUCE赛题介绍

1.数据基础设施促进科学数据汇聚共享(数据验证赛

数据基础设施作为面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的新型基础设施,在数据要素价值释放中起到重要作用。北京市政府、在京各企事业单位、科研院所已经建设可信数据空间、数据流通利用增值协作网络等不同类型的数据基础设施,正在持续发挥作用,促进科技创新领域数据的有效汇聚和有序开放共享。本赛题的答题目标包括:(1)依托数据基础设施的可信管控、资源交互等一系列基础能力,实现科学数据跨机构互联互通和多源数据的安全高效汇聚,更好满足科学研究工作的用数需求。(2)通过构建或者使用各类型数据基础设施,实现重大科技基础设施、重大科技项目等产生的科学数据的安全共享,推动开展更加广泛的科研合作,取得更多研究成果。(3)基于数据基础设施平台,实现高等院校、科研院所等研发机构的研究能力供给与政府、企业等数据持有方的数据研究需求的对接,促进数据要素价值挖掘与释放。

2.高质量科学数据集促进人工智能大模型开发(数据验证赛)

高质量科学数据集和语料库是科技创新领域人工智能大模型的预训练、微调的重要基础。建设高质量科学数据集需要对多种来源、多种领域、多种类型的数据开展数据治理、标注、分类,并实现科学知识准确抽取和多源知识融合。本赛题的答题目标包括:(1)通过对科学数据的挖掘采集、清洗、标注、分类、多源数据融合、数据集质量评价等系列工作,建成可用于人工智能大模型训练的高质量科学数据集和语料库。(2)依托高质量科学数据集推动科技领域人工智能模型训练和微调等工作,提升科技领域人工智能模型能力和可解释性,促进具有更强科技创新思维的通用人工智能大模型的研发。(3)持续探索人工智能技术在高质量科学数据集构建各环节中的应用,有效提升科学数据集质量和科学数据集建设效率。

3.语义理解与接口调度的决策引擎构建(专业数据赛)

在政务服务大厅智能问答、企业尽调服务等场景中,用户常需通过多源API接口获取跨领域数据,但面临自然语言查询意图识别偏差、复杂数据检索响应时效性与结果准确性差、多步骤API调度逻辑的自动化编排难等问题。需要利用大语言模型驱动智能API调度技术,构建语义理解与接口调度的决策引擎。本赛题需要针对API调度场景中的语义理解、逻辑推理与执行优化需求开展研发,具体包括:(1)构建多模态语义解析模型:实现用户查询中的实体识别、意图分类及API调用参数映射。(2)设计多API协同调度策略:开发支持条件判断、循环调用等复杂逻辑的自动化编排算法。(3)优化响应质量与性能平衡:在保证结果准确性的前提下,通过缓存机制、接口优先级调度等方式提升系统响应速度。

4.科学数据推动技术进步与管理创新(数据验证赛)

为充分发挥科技创新对经济社会发展支撑作用,需要持续释放科学数据要素价值,以科学数据成果赋能技术创新,推动产业升级,加快新质生产力形成。并且在管理方面,需要利用科学数据成果持续优化资源配置利用效率,改进提升管理效能。本赛题的答题目标包括:(1)通过融合不同领域科学数据及人工智能大模型等新技术,赋能实现生物、医药、新材料、新能源、航空航天、新一代信息技术、具身智能等产业的技术创新。(2)利用多领域科学数据提升人工智能大模型复杂场景决策能力,实现科学数据与人工智能技术对城市治理、企业管理等场景的赋能,有效提升管理活动的科学性和精细化、智慧化水平。

5.科学数据助力科学研究(数据验证赛)

科学数据和科学文献的快速增长,AI for Science成为促进科技创新的重要途径。研究人员依托科学数据及人工智能等新技术实现研究方法与工具的持续改进,推动科学研究不断深入,促进跨学科、跨领域的协同创新。本赛题的答题目标包括:(1)利用“数据+AI/AI Agent”开展前沿科学研究,持续发现科学新规律、新知识,形成创新性、突破性科学研究成果。(2)利用机器学习、深度学习、大模型等人工智能前沿技术,对科学研究中的关键环节给出可行的解决方案,在科学数据筛选、分析与推理等过程中形成新研究方法,加速不同学科科学研究范式变革。

6.食品安全风险智能预测预警建模(专业数据赛)

食品供应链管理涉及多品类、多环节、多部门、多角色。食品安全数据的应用目前主要集中在事后追溯和处罚上,缺乏对数据的深度挖掘和智能研判。需要围绕食品安全风险预判难、动态研判模型缺乏等痛点问题,通过海量的食品安全监督抽检数据分析,发现潜在的食品安全风险,实现食品安全形势智能预测预警,提升食品安全监管的预见性和靶向性。本赛题只在通过“海量基础数据-指征数据-专项指标-食品安全指数”数据抽取能力,形成食品安全风险预测预警模型,具体包括:(1)开展食品安全数据全息画像。(2)构建基于风险矩阵分析的食品安全风险预测预警模型。(3)优化模型解释性与可部署性,输出可应用于食品供应链风险智能监控的算法成果。

7.基于专利信息的产业链智能分类与行业图谱动态更新及商机挖掘(专业数据赛)

专利信息作为产业技术布局的核心载体,传统静态分类体系难以适配技术快速迭代需求,导致产业链图谱更新滞后,制约战略性新兴产业发展。现有粗粒度分类方法无法精准识别跨领域技术融合趋势,致使技术协同效率低下,影响国产化替代进程中的资源优化配置。本赛题的答题目标包括:(1)构建专利语义驱动的产业链多维分类模型,实现10大国民经济领域技术-产业准确映射。(2)研发动态图谱自适应更新算法,压缩行业关联网络响应时间。(3)设计商机深度挖掘引擎,通过跨领域技术耦合分析识别供应链优化机会。(4)构建可解释性AI模型,实现百GB级数据实时处理。

8.基于可信数据空间支撑的科研数据流通应用(专业数据赛)

随着跨领域科研协作需求激增,科研数据流通利用的合规需求迫切。科研领域可信数据空间建设面临诸多痛点,核心技术有待突破,跨机构协作困难等。本赛题聚焦科研可信数据空间建设,为科研数据流通及国际化科研数据空间互联互通建设奠定基础。本赛题的答题目标包括:(1)科研可信数据空间功能设计:设计数据运营门户、可信基础平台、可信管理平台和可信应用系统等核心功能模块,实现资源交互、价值共创、可信管控。(2)业务协同机制与流程设计:包括数据采集与存储管理、审核与授权、分析开发与流通、安全与产品加工、开放共享与价值释放等环节。(3)在推理引擎性能、调度优化、数据分级分类和安全计算技术适配、大模型嵌入可信数据空间等方面具有先进性和创新性,并通过科研数据应用场景验证。

9.基于机器学习的细菌耐药性集群行为分析(专业数据赛)

细菌耐药性是全球面临的重大公共卫生问题。随着抗生素的广泛使用,耐药菌株的出现和传播速度加快,许多曾经有效的抗生素逐渐失效。本赛题旨在通过对不同抗生素浓度下的细菌集群行为进行分析,探究细菌在抗生素压力下的适应性行为,为优化抗生素治疗方案和开发新型抗菌策略提供科学依据。本赛题围绕不同浓度的抗生素可能会诱导细菌表现出不同的集群行为,例如生物膜的形成、群体感应(QS)的激活或抑制等。通过分析这些行为,揭示细菌在受到抗生素压力时的生存策略。具体包括:(1)分析不同抗生素浓度下细菌集群行为随时间变化的规律。(2)构建机器学习算法,能够在较低抗生素浓度以及较短的时间作用条件下,快速将细菌的行为变化趋势识别出来。(3)优化模型解释性与可部署性。

10.化学分子结构的端到端视觉识别(专业数据赛)

在化学信息学领域,大量分子数据仍以非结构化形式存在于文献中,包括标准结构图、手绘图及含有缩写的简化表示等。面对这些图示内容,如含有立体异构信息的分子图或复杂缩写的专利结构,传统OCR技术往往难以准确识别。因此,将这些非结构化信息准确转换为标准化、机器可读的SMILES格式,是构建化学大语言模型的重要工作。端到端的解决方案开发将提升模型对科学文献中分子结构的理解与提取能力,进而推动药物发现、专利审查和化学数据检索等领域应用。本赛题要求构建融合视觉识别与化学语义理解的分子识别引擎,实现从分子图像到标准SMILES的智能转换,具体包括:(1)构建端至端分子认知引擎。(2)将复杂的分子结构转换为标准SMILES字符串。

11.拓展类赛题

符合国家数据局发布的《2025年“数据要素×”大赛赛题指南》(详见https://www.nda.gov.cn/sjj/zwgk/tzgg/0403/20250403183838064686506_pc.html)内容要求,但北京分赛未列出的赛题。

UNIT组织架构

承办单位:北京市海淀区人民政府、北京市昌平区人民政府、北京市怀柔区人民政府

主办单位北京市科学技术委员会、中关村科技园区管理管委会、北京市科学技术协会、北京市科学技术研究院

协办单位北京软件和信息服务业协会、北京科学智能研究院

PROCESS赛事流程

1.启动阶段:

      5月28日启动北京分赛,发布北京分赛赛道赛题等赛事信息。

2.初赛阶段:

      竞赛启动后,参赛团队可通过官网报名和提交材料,初赛报名和比赛分阶段进行,预计8月下旬开展初赛评审,审核获奖材料,确定晋级北京分赛区决赛单位。

3.决赛阶段:

      公布决赛评审时间和评审安排,预计8月底左右开展北京分赛区决赛,围绕初赛评选产生的优秀项目,采取路演答辩等方式进行决赛评选,计划9月底前提交参加全国总决赛名单。


AWARD奖项设置

各赛道设置一、二、三等奖、优秀奖等奖项,并提供以下权益:

1.数据流通

鼓励优秀项目数据资源和成果加入北京市数据流通利用增值协作网络,组织北京国际大数据交易所与参赛单位开展“所商合作”,促进数据要素流通,通过市场化实现价值化。

2.产融对接

持续组织国家级、市级和区级投融资机构举办产融对接活动,提供的产融合作资源支持。

3.展示推广

组织数据应用方与参赛单位开展业务合作,举办论坛沙龙、座谈交流、线下推展等赛事活动,制作获奖项目案例汇编,促进数据产品的服务推广与供需对接。

4.企业发展

符合条件的获奖团队可享受相关市级部门和属地政府提供的产业支持、人才招引等政策。

5.跟踪服务

北京分赛组委会建立竞赛项目库、主体库,推动全市产业支持政策触达参赛单位,加强常态化跟踪与沟通服务。

6.交流学习

获奖团队有机会参与大赛组委会举办的政策宣贯、调研走访、成果转化等活动。

每个赛道的奖项数量、大赛权益详情将在后续进行通知,敬请持续关注。

收起列表

京公网安备110401200236号