送外卖的美团,跑出万亿参数大模型,靠的是全国产算力

送外卖的美团	,跑出万亿参数大模型,靠的是全国产算力-第1张图片

  做外卖、打车 、团购的美团,在AI战场上亮出一张新牌。

  就在最近,美团LongCat-2.0大模型正式发布 ,在业内掀起波澜 。若单看技术实力,它并非比较优秀 的那个——有评价认为,在工具调用 、复杂指令执行等Agent(智能体)核心能力方面 ,LongCat-2.0-Preview接近Claude Opus 4.6,落后于最新的Claude Opus 4.8 。

  但在头部玩家动辄刷榜的今天,这样一款不算最优的模型 ,却获得了颇高的关注度。原因在于——LongCat-2.0是业界首个基于国产算力完成训练、推理全流程的万亿参数大模型。

训练、推理全程依靠国产算力

  说到国产“模芯协同”,很多人会联想到DeepSeek与华为的合作 。

  4月24日,DeepSeek正式对外发布DeepSeek-V4预览版 ,华为同步宣布昇腾超节点全系列产品及华为云已实现对DeepSeek-V4的全面支持。

  之后,新的消息传来。深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳) 、深圳市大数据研究院、华为相关团队,在昇腾910C国产算力集群上 ,完成了DeepSeek-V4-Pro的全参数后训练 。

  所谓后训练 ,是在预训练基座模型完成基础上做微调、对齐优化,好比建好毛坯房后再完成精装修,与打地基 、盖框架的从头训练还是有很大的不同。

  LongCat-2.0从零开始 ,用全国产算力训练万亿参数模型,覆盖预训练、后训练到推理的全流程,证明了国产算力能独立、完整地支撑万亿模型从0到1的全生命周期。

  据悉 ,该模型采用MoE(混合专家)架构,总参数规模1.6万亿,每个Token激活参数约480亿 ,原生支持1M超长上下文,可一次处理百万字级输入,模型适配Claude Code 、OpenClaw、Hermes等主流Harness(智能体工程框架) 。

  今年4月底 ,美团曾发布LongCat-2.0-Preview版本,并以匿名方式接入全球最大的大模型API路由平台OpenRouter。OpenRouter数据显示,截至6月底 ,LongCat-2.0-Preview的总调用量已跻身全球前三。在Hermes、Claude Code 、OpenClaw等Agent(智能体)场景下 ,LongCat-2.0-Preview的月调用量分列全球第〖One〗、 第二和第三位,在Claude Code上的调用量仅次于Claude Opus 4.8 。

OpenRouter数据显示,截至6月底 ,LongCat-2.0-Preview在Claude Code上的调用量仅次于Claude Opus 4.8。

  业内人士分析,这一表现既源于该模型本身的性能,也离不开当前的定价策略——公测期输入Token促销价为0.30美元/百万Token ,且提供大额免费调用额度。行业通用玩法是上线初期靠低价和免费额度冲榜、攒口碑,再逐步涨价 。一旦进入收费阶段,现在的成绩还能保持多久 ,才是真正面临的考题 。

  但至少,这件事验证了一个判断:近来 国产算力卡的单卡性能虽与全球顶尖水平仍有差距,但计算正确性和精度已经可以支撑前沿模型的全流程训练。对于激活存量国产芯片而言 ,这是一个重要突破。

让大模型学会“偷懒 ”

  大模型技术本身,依然是业界关注的焦点 。

  根据公开消息,LongCat-2.0全程在国产算力上完成训练 ,峰值规模超过5万张国产算力卡 ,是迄今为止国产算力上完成的最大训练任务。

LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡。

  国产算力集群究竟出自哪家?据业内人士推测,该集群大概率基于华为昇腾架构搭建 。不过 ,美团方面并未对此作出明确回应。

  另一个值得关注的维度,是模型层面的设计。相关技术报告显示,LongCat-2.0引入零计算专家机制等设计 。“零计算专家 ”机制关联的是大模型的经济性问题 ,当总参数突破万亿级别后,单纯堆叠参数带来的性能增益已显著放缓。一个更务实的命题是——如何让大模型用得更省 、跑得更快?

  在当前主流的MoE架构下,大模型每次推理只调动一小部分“专家”参与计算。这样既保留了海量知识 ,又将单次推理的计算开销控制在合理范围内 。DeepSeek-V3/V〖肆〗 、 Mixtral等头部模型均采用此架构。

  不过,该架构下每个Token激活的“专家”数量通常是固定的,无论输入文本简单或复杂 ,都调用同等规模的计算资源。

  LongCat系列引入“零计算专家 ”机制,即在传统“计算专家”之外,设置了一类特殊的“专家”——它不做任何矩阵运算 ,只做一件事:把输入原样传递到下一层 。

  模型会动态判断每个Token的复杂度 ,简单的Token直接分配给“零计算专家 ”走快速通道,复杂的Token才调动真正的“计算专家”深度处理 。用更通俗的话说:让大模型学会在简单问题上“偷懒”,把算力留给真正需要深思的环节。

AI业务的进攻

  回到一个现实问题:烧钱做大模型 ,美团到底图什么?

  在2025年3月的业绩电话会上,美团CEO王兴明确了战略定位——对AI的策略是进攻,不是防守。今年3月 ,他进一步透露,自2023年初以来,美团在资本支出和AI人才上进行了大规模投入 。“除有云计算业务的企业外 ,美团在AI上的投入规模,大概率是国内企业里最大的,且已经坚持布局三年多。 ”

  此后 ,美团核心本地商业(CLC)完成组织架构调整,正式成立AI Transformation部门,与外卖、闪购等部门平行 ,由前大众点评总经理牧遥负责 ,直接向CLC CEO王莆中汇报。

  美团的野心,是成为未来本地生活需求的 “AI超级入口”  。这要求AI能精准理解用户需求并高效执行任务。王兴多次表示,要争取把美团App率先升级成“AI-powered App”。

  做万亿参数大模型 ,是战略的一部分 。王兴曾用一个比喻说明问题:“虽然大模型越来越聪明。但我们可以想象,就算爱因斯坦当秘书,让他订一个餐厅 ,他依然不知道那个餐厅有没有座位。这不是智力问题,而是信息问题 。 ”

  基于本地生活场景的复杂性,通用AI近来 还无法可靠地管理和保障现实世界中的服务体验。美团多年积累的结构性数据优势——覆盖全品类的本地服务、实时信息 、海量用户评价 ,以及履约基础设施,恰恰可以成为大模型训练的基础。

  这也关乎一笔“经济账” 。随着业务对AI依赖加深,API调用费将成为不小的投入 。通过打造“技术闭环” ,也有助于增强业务的灵活性与安全性。

  LongCat-2.0的价值,在于为美团的AI战略提供了底层能力支撑,帮助形成“基座模型+本地生活Agent+AI生态投资 ”的三层体系。

  下面  ,就要看AI能力到底多大程度与业务肌理融合 。毕竟 ,大模型的价值从来不在于它本身有多大,而在于它最终解决了什么实际问题。

(文章来源:上观新闻)

标签:

相关推荐

  • 【阿勒泰地区有关疫情法律,阿勒泰地区新冠肺炎疫情防控工作指挥部】

    【阿勒泰地区有关疫情法律,阿勒泰地区新冠肺炎疫情防控工作指挥部】

    出行提示!新疆多地通行政策有调整乌鲁木齐市隔离政策:近14天内有广东省广州市、深圳市、茂名市、佛山、湛江市、浙江温州市旅居史的游客落地后需隔离。喀纳斯景区内的白哈巴村需单独办理边境通行证,港澳台游客则需通过旅行社代办。交通出行最新注意事项:独库公路限行政策调整,北段6月1日至9月30日禁止7座以上车辆通行,并新增夜间禁行(22:00-6:00)。独库公路中...

  • 涿州限号不今天限行/涿州限号2021

    涿州限号不今天限行/涿州限号2021

    涿州今天限什么号限什么车号涿州市实行车牌尾号每天限行两个号码的政策。工作日星期一到星期五的限行尾号分别为:周一限行3和8,周二限行4和9,周三限行5和0,周四限行1和6,周五限行2和7。周末及法定节假日不限号。限行时间每个工作日的7:00至20:00限行,其余时间不限行。涿州市实行车牌尾号每天限行两个号码的政策,这一政策同样适用于外地车辆。限行时间为每个...

  • 【疫情地区国家扶持多少钱,疫情时期国家补贴多少人民币】

    【疫情地区国家扶持多少钱,疫情时期国家补贴多少人民币】

    大学生疫情补助金每人补助多少明治学院大学:4月21日在官方网站发布新型肺炎对策,以奖学金补助形式,为每名学生发放5万日元。东京农工大学:4月20日发布消息,对不同学生进行不同额度的补助奖学金,学部学生和修士学生可以拿到5万日元,博士学生可以拿到10万日元。立教大学:4月25日发布消息,将以“学修环境整备奖学金”的名义,为所有学生发放5万日元的补助。补助标准...

  • 深圳限牌限号时间(深圳限牌限号时间表)

    深圳限牌限号时间(深圳限牌限号时间表)

    深圳限外地车牌时间段最新2024深圳限外地车牌时间段最新为2024年工作日7:009:00、17:3019:30。以下是关于深圳限外地车牌的详细规定:限行区域:深圳全市范围道路,但部分高速公路及进出深圳口岸路段除外。不限行的市内高速公路包括S3广深沿江高速、G4广深高速、G15机荷高速等多条高速。深圳限外地车牌时间段为工作日7:00-9:00、17:30-...

  • 西安今日限行限号吗/西安今日限行吗?限行尾数是几?

    西安今日限行限号吗/西安今日限行吗?限行尾数是几?

    西安今天限号吗?〖壹〗、周五限行0,周周日不限号。限行时间为工作日7:00-20:00,限行区域为:西安市行政区域内(含西咸新区),以西安绕城高速以内区域为中心,向南扩展至终南大道、堰渡路、三星快速干道连线(不含)以北,西汉高速以东、西柞高速以西围合区域;向北扩展至西咸北环线(不含)以南、延西高速以东、西禹高速以西围合区域。〖贰〗、西安限号不限字母。西安限...

  • 【摩托限号成都限行吗现在,摩托车限号吗成都】

    【摩托限号成都限行吗现在,摩托车限号吗成都】

    成都限号外地车能开吗成都限号时外地车在限行区域和时间内不能开,但在其他时间和区域可以正常行驶。成都限行的汽车类型包括外地燃油车等外地籍号牌汽车,本地车牌和外地车牌限行规则一视同仁。申请临时通行许可:如果你确实需要开车进城,并且符合相关条件,可以尝试申请临时通行许可。不过要注意,这个许可是有条件的,需要提前了解并准备好所需材料。租车或共享汽车:现在成都有很多...

  • 从化疫情高风险地区/从化区最新疫情

    从化疫情高风险地区/从化区最新疫情

    广州从化区关于进一步加强社会面疫情防控措施的通告〖壹〗、广州市从化区新型冠状病毒肺炎疫情防控指挥部办公室关于进一步加强社会面疫情防控措施的通告当前,我区疫情社会面传播风险持续加大,防控形势严峻复杂。为快速有效阻断疫情传播扩散风险和降低区外疫情外溢波及我区风险,切实保障广大人民群众生命安全和身体健康,现就进一步加强社会面疫情防控措施通告如下:进一步强化主动报...

  • 吉林蛟河是疫情风险地区(吉林蛟河疫情风险等级)

    吉林蛟河是疫情风险地区(吉林蛟河疫情风险等级)

    吉林市回蛟河需要隔离吗不需要。吉林市去蛟河不需要隔离的,持有48小时内核酸检测阴性证明还有“三天两检”核酸检测措施,并且还需要提前报备。吉林市一般指吉林。吉林市,别称“北国江城”,吉林省辖地级市,国家批复确定的中国重要的工业城市、吉林省重要的中心城市和新型工业基地、具有中国北方特色的旅游城市。不需要隔离。吉林市位于吉林省中部偏东,蛟河市位于吉林省东部,低风...

  • 关于江宁区属于疫情地区吗的信息

    关于江宁区属于疫情地区吗的信息

    南京属于什么风险等级〖壹〗、南京为低风险地区时一般情况:若南京处于低风险地区,且个人不属于高风险岗位人员、未被赋“红(黄)码”,同时未前往中高风险地区所在城市的其他区域,按照上海当时的防疫政策,一般不需要隔离。但需做好个人防护,抵沪后开展7天的自主健康监测,其间每天早晚两次自测体温,减少不必要的人群聚集活动,规范佩戴口罩。〖贰〗、中风险地区出行要求:南京若...

  • 疫情赤峰周边地区地图/疫情赤峰周边地区地图最新

    疫情赤峰周边地区地图/疫情赤峰周边地区地图最新

    赤峰在中国地图的中部还是西部赤峰在中国地图的东部偏北地区,具体位于内蒙古东南部。以下是关于赤峰地理位置的详细解地理位置概述赤峰市是内蒙古自治区下辖的地级市,它并不位于中国的中部或西部,而是地处内蒙古自治区的东南部。这一地理位置使得赤峰成为蒙冀辽三省区(内蒙古自治区、河北省、辽宁省)的接壤处,具有重要的区域战略地位。综上所述,赤峰在中国地图上的位置是偏东部...

返回顶部