产品展示
【48812】全面开源 浪潮信息发布千亿参数根底大模型“源20”

发布于:2024-08-10 05:41:32  来源:产品展示  点击量:14次

  11月27日,浪潮电子信息产业股份有限公司在京发布“源2.0”根底大模型,并宣告全面开源。“源2.0”包含102B(1026亿)、51B(518亿)、2B(21亿)三种参数规划的模型,在编程、推理、逻辑等方面展现出了先进的才能。

  根底大模型的要害才能是大模型职业和运用落地才能体现的中心支撑。在算法、数据和算力等方面,“源2.0”提出了新的改善办法并取得了才能的提高。

  如在算法方面,“源2.0”提出并选用了一种新式的注意力算法结构“部分注意力过滤增强机制”,让大模型在运用更少的练习算力、更小的模型参数的情况下,相同能取得更高的模型精度和出现才能;数据方面,降低了互联网语料内容占比,运用中英文书本、百科、论文等材料,结合高效的数据清洗流程,为大模型练习供给了高质量的学科专业数据集和逻辑推理数据集。

  作为千亿级根底大模型,“源2.0”在业界揭露的评测进步行了代码生成、数学问题求解、现实问答方面的才能测验,测验成果为,“源2.0”在多项模型评测中展现出了较为先进的才能体现。

  “源2.0”选用全面开源战略,全系列模型参数和代码均可免费下载运用。“大模型的开源敞开可以使不同模型之间同享底层数据、算法和代码,有利于打破大模型孤岛,促进模型之间协作和更新迭代;一起,有利于以更丰厚的高质量职业数据反哺模型,打造更强的技能产品,加快商业化进程。现在,业界仍没有彻底开源可商用的千亿大模型,咱们我们都期望‘源2.0’能够为国内外开发者、研究机构、科技公司供给坚实的底座和生长的土壤。”浪潮信息高档副总裁刘军说。

  浪潮信息长时间致力于人工智能算力根底设施产品的研制,2021年在业界首先推出了中文AI巨量模型“源1.0”,参数规划达2457亿,落地南京智算中心。此次发布的“源2.0”较前一版别完成了才能的全面提高。(记者温竞华)