登录
微信登录
打开手机微信,扫描二维码
扫描成功
请勿刷新本页面,按手机提示操作
中科曙光不会以任何理由要求您转账汇款,谨防诈骗
您的微信还未注册
中科曙光不会以任何理由要求您转账汇款,谨防诈骗
您可以同时关注中科曙光微信公众号
使用微信扫一扫即可登录! 查阅资料更方便、 快捷!
您已经注册账号和
关注微信公众号
2025年1月
服务热线:400-810-0466
发布时间: 2025-04-30
近年来,以大规模预训练模型为代表的人工智能技术迅猛发展,为科研创新提供了全新范式。中科院高能物理研究所依托正负电子对撞机等大科学装置,积累了海量高价值实验数据,如何高效利用数据、加速成果产出,成为研究所面临的核心课题。
经过多方评估,中科院高能物理研究所选用曙光 AI 解决方案作为算力支撑,联合 DeepAI 深算智能引擎,自主研发出高能物理领域首款聚焦知识挖掘与发现的 L2 级大模型 —— 溪悟 (Xiwu)。
在项目推进中,研究所面临多重挑战:大模型训练所需的庞大算力资源存在行业性短缺;高价值科学数据需在安全可控的环境下实现内部深度挖掘;基座模型种类繁多,需精准适配领域需求。
借助DeepAI深算智能引擎,中科院高能物理研究所快速完成基座模型的适配优化与训练框架(如LlamaFactory、Xtuner、vLLM等)的精准选型,在两方面实现价值突破:
经过微调训练,溪悟(Xiwu)-130 亿语言模型在100 个高能物理领域问答测试集上,采用人工评估的方法,与基准模型Vicuna-130亿相比,回答更加准确或持平的概率达到95%,性能明显优于基准模型。
中科曙光将持续携手中科院高能物理研究所,不断提升溪悟(Xiwu)大模型在Tokens限制解除、思维能力进化、图像处理优化等一系列能力,探索大模型在更多复杂科学问题中的应用潜力,推动科研范式智能化转型。