众人皆知算力、算法、数据是人工智能年夜模子的三驾马车,驱动AI奔向新纪元。于这幅图景里,拉车的是“三马”,疾走的是AI年夜模子,那末“车”是谁? 好问题。但先不急揭晓答案,咱们先来看一条不久前的新闻。 套“三马”的车:AI呆板进修平台 本年5月,腾讯混元年夜模子星脉收集技能团队针对于DeepSeek开源的DeepEP通讯框架举行深度优化,使其于RoCE、IB等多种收集情况下均实现显著机能晋升。对于此,DeepSeek公然称谢,称这是一次“huge speedup”(巨年夜的加快)代码孝敬。以后,腾讯团队也将这一技能开源。 这是开源社区一次友爱的开放共建、互动同享。从这件事可以看到腾讯团队于年夜模子技能方面的两点对峙:一是立异,二是存眷技能的场景运用。 这两点,也偏偏及咱们的答案有瓜葛。星脉收集是腾讯Angel呆板进修平台这个“超等流水线”上要害一环,它的任务是让练习模子的成千上万张算力卡可以或许“集团作战”,以便算力集群可以或许更好地协作,高效处置惩罚海量数据,撑持算法落地。 看到这里,已经经有人找到了前面问题的谜底:这辆“马车”,就是AI呆板进修平台,它包罗了模子练习及推理一整套流程。从开发者的角度来看,可以或许同时把算力、算法、数据这三匹“骏马”整合于一路的,也只有AI呆板进修平台这一年夜模子“工场”。 如今,于算力、算法及数据以外,AI呆板进修平台正于成为各基础年夜模子“年夜厂”愈来愈器重的新基建。 AI工业化时代的焦点“新基建” 作为年夜模子训推的“工场”,AI呆板进修平台于年夜模子呈现以前,人们习气称之为“深度进修框架”;此刻,人们更愿意叫它“呆板进修平台”或者“练习/推理平台”。就其功效性而言,AI呆板进修平台更像是一片膏壤及工场,脱离了它,开发者将“难为无米之炊”。 以英伟达DGX1计较体系为例,它不仅是一台高机能计较机,更是集成GPU 集群与深度进修框架的软硬一体平台。假如不是预安装了颠末深度优化的CUDA 8.0、cuDNN 5.一、TensorFlow/PyTorch 框架以和 DIGITS 可视化练习东西,生怕它也不会云云“引无数英雄竞折腰”。 也正是以,呆板进修平台险些成为了基础年夜模子厂商的标配。可以看到于海内,阿里通义有PAI,baidu文心有飞桨,腾讯有Angel,等等。 呆板进修平台为什么云云受青睐?腾讯呆板进修平台部总司理陈鹏说,晋升营业效率、促成团队协作、优化资源治理等等,均可以成为“年夜厂”蓄力发育呆板进修平台的理由,但它最主要的脚色,“我认为是AI‘工业化’的焦点基础举措措施”。 陈鹏以腾讯Angel呆板进修平台为例谈道,作为AI工业化的基础举措措施,Angel呆板进修平台对于内驱动全系列混元年夜模子(从0.5B至万亿参数)的迭代进级,涵盖语言模子、多模态天生模子等,支撑其运用在微信、告白保举等营业场景;对于外,Angel呆板进修平台支撑各型号混元年夜模子经由过程腾讯云办事30万企业客户,笼罩金融风控、告白投放、工业质检等场景。同时,Angel平台撑持异构芯片混淆计较,可矫捷调理差别芯片算力,鞭策自立可控技能落地。 ? 陈鹏先容说,于年夜模子练习使命中,呆板进修平台就是“工场超等流水线”。于这条流水线上,共性技能被提炼、流程要素被整合;模子从练习到部署,质量可控、效率翻倍,真正从“试验室研发”转化为财产出产力。 腾讯Angel平台的技能价值不仅表现在混元年夜模子的乐成落地,更经由过程开源生态与云计较输出,鞭策千行百业智能化进级,成为AI工业化时代的焦点“新基建”。 开发者配合发展的“数字家园” “年夜厂”器重AI练习平台的设置装备摆设,固然还有有打造开发者生态的欲望于此中。陈鹏说,呆板进修平台对于会聚开发者、打造开源社区的价值很年夜,其作用远超技能东西自己。 开发者生态对于在年夜模子技能落地而言,比呆板进修平台自己更主要,此中原理很简朴:呆板进修平台可以用一支百人量级的步队来构建,但生态需要几万、几十万以致上百万的人介入才可以。对于在年夜模子等AI技能运用而言,市场只会为解决运用问题买单,不会为练习平台买单。 作为海内首个从LF AI基金会(系Linux基金会旗下面向AI范畴的顶级基金会)卒业的开源项目,腾讯Angel平台的技能文档及 API 设计遵照国际尺度,吸引华为、小米等百余家企业及机构介入生态设置装备摆设,今朝累计孝敬者已经超1.8万人,此中跨越 20% 的社区孝敬者来自非中文地域。 AI呆板进修平台为数据工程师、算法工程师、营业研发工程师等差别脚色提供了同一的事情平台及流程。各方可以于平台上协作,实现数据、模子、代码等资源的同享及治理,提高团队协作效率。同时,呆板进修平台还有提供可视化界面及同一接口,利便差别专业配景的职员理解及利用,降低沟通成本。 陈鹏暗示,将来跟着A三木SEO-I 工业化加快,AI呆板学平台将进一步成为技能平易近主化的基础举措措施,鞭策全世界开发者共建普惠的AI落地及运用。 “第一梯队”的战略苦守 于方才落下帷幕不久的世界人工智能年夜会(WAIC)上,腾讯向世界展示了其加快鞭策AI从技能冲破迈向场景落地、打造真正“好用的AI”的实践与愿景。 于AWAIC腾讯论坛上的信息显示,腾讯混元年夜模子已经实现图象、视频、3D、文本等于内的全模态开源,图象、视频衍生模子数目到达3000+个,混元3D系列模子社区下载量跨越230万,成为“最受接待的3D开源模子”。而面向端侧的0.5B到7B系列小模子也于近期陆续开源,助力开发者高效构建AI原生运用。 ? 自2025年以来,腾讯混元年夜模子连续迭代、小步快跑,混元家族不停拓展,端到端语音模子Voice、多模态理解模子Vision等接踵推出。特别于多模态理解上,腾讯本年持续发布多款模子,于LMArenaVision全世界年夜模子权势巨子榜单中跃居海内榜首,中文能力稳居全世界第一梯队。 而对于在AI成长态势,腾讯相干卖力人暗示,AI是一场工业革命级的技能立异,对于小我私家及财产成长都将孕育发生史无前例的价值。但相对于在一个完备的技能周期,当前AI还有处在成长的低级阶段。 是以,腾讯的技能战略,仍旧是夯实地基、咬定“平台能力”不放松。现成的例子是,WAIC年夜会上,面向当前火热的智能体(Agent)运用开发,腾讯云推出了全新进级的智能体开发平台,帮忙企业一站式完成从数据处置惩罚、模子练习、常识交融到部署上线的完备流程,降低智能体开发门坎。 “腾讯将连续缭绕模子、平台、运用等维度发力,联合腾讯富厚的运用生态上风,全方位鞭策AI从技能冲破走向场景实践,让好用的AI呈现于离用户及财产更近之处。”陈鹏说。
混元系列小模子陆续开源。