中国科技云门户

中心在科学数据智能与智能运维研究中取得系列进展

2026-06-16

人工智能技术的快速发展为科学数据资源的高效利用以及大规模智能计算基础设施的稳定运行等带来新的机遇。中心科学数据智能与创新实验室与科技云运行与技术发展部智能运维团队围绕AI4Science技术研发，取得新进展。
其中，针对科学数据资源专业性强、资源量庞大，尚缺乏系统化智能评价方法等现实问题，中心科学数据智能与创新实验室研发了ScienceDB AI科学数据智能推荐系统和SciHorizon-DataEVA科学数据人工智能就绪度评估系统，实现了科研需求与科学数据的智能匹配及异构科学数据的自动化评估。面向生命科学、路线规划和生物信息学等场景，研究团队还构建了SciHorizon-Gene、MobilityBench和BioFlowBench等评测基准，为大语言模型和智能体专业能力的系统化评价提供了新工具。相关成果在科学数据推荐、自动化评估和专业场景覆盖等方面取得良好效果。
针对大规模人工智能训练集群故障预测、异常识别和故障节点定位等问题，中心科技云运行与技术发展部提出了自监督故障节点定位框架TSLoc和图形处理器节点健康风险排序框架HeaRank，有效提升了复杂故障定位和高风险节点识别能力。此外，针对运维时间序列数据检索缺少统一评测体系、传统方法难于精准识别复杂异常等问题，研究团队构建了时间序列检索评测基准TSRBench，提出了“时间—频率—曲率”融合异常检测框架TFC，在公开数据集和实际生产环境中取得良好效果。
上述9项成果已被第32届国际知识发现与数据挖掘大会（KDD 2026）录用，分列应用数据科学、科学研究、科学智能、数据集与基准等赛道。
据悉，KDD是数据挖掘领域最具权威性和影响力的顶级国际学术会议，也是中国计算机学会（CCF）推荐A类会议，重点关注应用数据科学、大规模数据挖掘、跨领域知识发现、机器学习及大模型应用等方向的最新研究成果、技术创新及系统应用。此系列研究成果发布，是中心AI4Science在科学数据治理、科技网络智能化运维方面研究实践的阶段性成果展示。