的逆袭 ,国征程产推理大模算力封闭下型的兴起与

国产大模型深水区 ,算力登顶之后的封闭算力、生态与规划新应战。下的型的兴起 。逆袭

作者 | 辰纹 。国产

来历 | 洞见新研社。推理

本年年初,大模DeepSeek横空出世  ,征程让国际从头认识了我国大模型 。算力

几乎在DeepSeek爆红的封闭同一时刻 ,科大讯飞发布了全国产算力渠道上首个深度推理大模型——讯飞星火X1,下的型的兴起其绝无仅有的逆袭标签是“仅有根据全国产算力练习的深度推理模型” 。

1万张华为昇腾910B国产算力卡,国产练习出的推理星火X1在模型参数比业界同类小一个数量级的情况下 ,全体作用却能对标OpenAI o1和DeepSeek R1 。大模

在长年累月的科技赛跑中 ,科大讯飞用实践行动走出了一条自主可控,尽管艰苦 ,但更值得夸奖大模型开展道路 。

01 技能包围,国产算力的极限应战  。

从表面上看,科大讯飞挑选“全栈自主可控”道路是出于中美竞赛的地缘环境,两次被美国列入实体清单 ,无法获得英伟达芯片算力的“另辟蹊径” ,但是更深层次的内中,人工智能竞赛的本质现已算法与模型的功能好坏 ,演化成算力/算法/使用这一整条链接归纳才能的检测。

因此科大讯飞从一开端就确认了“全栈自主可控”的方向,算力国产化,算法自研  。

2023年5月,讯飞星火大模型发布 ,5个月后 ,首个支撑万亿参数大模型练习的万卡国产算力渠道“飞星一号”也宣告正式启用 。

2024年,在“飞星一号”算力渠道的支撑下 ,讯飞星火大模型不断晋级,从V3.5到V4.0再到V4.0 Turbo,中心才能全面临标GPT-4 Turbo  。

获得上述成果的背面是科大讯飞与华为一起霸占的技能无人区 。自2023年5月起 ,两边团队在万卡高速互联组网、核算通讯躲藏、练习推理强交互等要害范畴获得打破 ,将昇腾910B的练习功率从开始相当于英伟达A100的30%-50%提高至85%-95%。

本年1月 ,科大讯飞又发布了国内首个根据全国产算力练习的具有深度考虑和推理才能的大模型——讯飞星火X1。

这个仅130亿参数的“小模型”实力“惊人” ,在高考题、AIME竞赛题和高中奥赛题回答中,不只答案精确 ,还能供给挨近人类“慢考虑”的详细解题过程 。

3个月后 ,科大讯飞与生态企业组成的联合团队经过多种优化手法提高“飞星一号”渠道上 MoE 模型集群推理的功能上限,并完成大规划专家并行集群推理功能翻番,讯飞星火X1也由此迎来了全新晋级,在数学 、代码、逻辑推理 、文本生成 、言语了解  、常识问答等通用使命上作用显著提高。

科大讯飞的实践充沛证明了根据国产算力练习的全栈自主可控大模型具有登顶业界最高水平的实力和继续立异的潜力,与此同时,也在“自主可控”语境下,为我国的大模型职业供给了一条可供学习的破局之路。

02 使用为王,从教育医疗到央国企的全面浸透  。

研制完成了“全栈自主可控”,其价值终究要体现在落地使用上,科大讯飞的战略是以“1+N”的方式进职事务系统布局, “1”是指通用底座大模型 ,“N”是指以底座大模型赋能教育 、医疗、轿车、工作、工业、智能硬件等多个职业范畴 ,并构成独具优势的职业大模型。

比方,讯飞星火X1在教育场景中落地时,联合我国教育科学研究院发布根据“问题链”的高中数学智能教师帮手 ,在全国百个试点区域布置,与上千名优异教研员打造了上万个优异事例 。

在实践教育中 ,教师们发现X1在一题多解、教育常识相关 、拓宽学生高阶思想等方面表现出色 。相关技能的融入,科大讯飞AI学习机的学习引荐和确诊也变得愈加精准 ,解题思路和常识链条愈加明晰 。

在医疗范畴 ,X1的模型战略已使专科辅佐确诊和杂乱病历内在质控精确率达90% 。科大讯飞还表明将在年内发布根据X1的医疗大模型晋级版 ,保证其深层次确诊推理作用业界抢先。

更令人瞩目的是在央国企商场的攻城略地,科大讯飞为央企打造的专业大模型已成为职业标杆。

与我国石油共建的昆仑大模型使代码开发功率提高73% ,职业常识问答采用率超95%;为国家动力集团开发的智能评标帮手获国资委点名表彰;与中海油协作的 “海能”人工智能模型已在投标采办 、职工健康等范畴使用 ,并正在研制海上油田稳产增产等专业场景模型。

科大讯飞之所以可以在IDC的陈述中拿下上一年央国企大模型解决计划商场份额榜首 ,其中心原因在于满意了工业使用“既要又要还要”的需求 ,即工程才能与技能才能双向驱动。

在详细实践中 ,科大讯飞经过“通专结合 、端云联动与软硬一体”(通用大模型与专业大模型结合 、端侧大模型与云端大模型联动 、软硬件一体化)来完成布置本钱与用户体会的平衡,提出“建算力 、理数据 、训模型 ,到落场景 、保安全 、精运营”的全链路办法,从场景动身,给客户供给人工智能的解决计划。

在东西层面上 ,科大讯飞进一步晋级了模型定制优化东西链 ,支撑监督微调 、强化学习两种模型定制优化计划,继续简化定制过程和本钱。

03 燎原之火后的硬仗与新征程  。

从上文的剖析不难看出,科大讯飞不只证明了国产算力登顶技能巅峰的实力 ,更为我国大模型职业拓荒了一条可学习的破局途径  。但是,大模型职业的竞逐正步入深水区 ,讯飞面临的检测更为杂乱  。

其一,全球大模型正加快向多模态 、强推理、高能效演进。昇腾910B功率虽追至A100的85%-95% ,但面临英伟达H200等新一代芯片及集群功率的继续跃升,坚持算力底座竞赛力仍需在芯片互联、练习结构、集群调度等“硬骨头”上继续攻坚 。

其二 ,大模型之争终将演化为生态之争 ,科大讯飞“1+N”战略虽已铺开,但比较互联网巨子在消费端的海量触达和开发者生态号召力  ,其仍需在招引广阔开发者  、构建昌盛的东西链与社区生态上倾泻更多资源与敞开诚心,防止成为“孤勇者”。

其三 ,职业落地已从“能用”迈向“好用且经济” ,科大讯飞在央企、教育 、医疗的标杆事例虽亮眼,但需将“通专结合、端云联动”办法论沉积为可快速仿制的规划化才能 ,在保证“自主可控”前提下继续优化布置本钱与用户体会 ,完成商业价值的可继续闭环 。

本年4月份的成绩阐明会上 ,科大讯飞官方以为,“现在底座大模型还有很大的增加空间 ,经过预练习和强化练习两种办法,大模型的自主进化在未来2-3年内还有巨大的提高空间,天花板十分高。”。

科大讯飞董事长刘庆峰也表明,会继续加大“1+N”的投入 ,抢抓通用人工智能的根盈余。“在彻底自主可控的基础上 ,咱们的通用底座大模型要做到榜首队伍 ,永争职业榜首  ,不只仅是跟从  ,并推进更多算法研制和立异。”。

很明显 ,科大讯飞的应战首要来历于继续不断的立异与投入和长盈余周期的平衡 ,好就好在 ,科大讯飞以白手起家的实践点着了期望之火,至少在当时这个时刻节点 ,科大讯飞仍处于领跑的方位 。

科大讯飞的未来怎么,既取决于其在技能深水区继续攻坚的硬实力 ,也检测其构建敞开生态 、完成规划落地的软才智。

特别声明 :本文为协作媒体授权专栏转载  ,文章版权归原作者及原出处一切 。文章系作者个人观点 ,不代表专栏的态度,转载请联络原作者及原出处获取授权 。(有任何疑问都请联络idonewsdonews.com) 。

赞(44281)
未经允许不得转载:/redian/

评论 抢沙发