行业分类:
加载中...
头条分类:
加载中...
全新梅赛德斯-AMG GT XX概念轿跑正式亮相:1341马力纯电怪兽,技术与F1赛车同源
IT之家 6月26日消息,梅赛德斯-AMG正式迈入纯电时代,北京时间今天凌晨推出了极具震撼力的GT XX概念车。这款四门轿跑造型激进,搭载三台轴向磁通电机,综合输出超过1341马力(1000kW)。 IT之家汇总新车主要信息如下: GT XX是新一代AMG GT四门轿跑的预览版本,设计风格与前作截然不同。其前脸造型类似鱼类,采用低斜挡风玻璃配合轿跑式车顶,营造紧凑的车舱轮廓。该车取消了后挡风玻璃。侧面则配备与车体齐平的门把手和21英寸空气动力轮毂,可变结构兼顾制动冷却与空气动力性能。侧裙上的“发光涂层段”在交流电作用下可自行发光。 车尾造型相对简洁且肌肉感十足,配有主动空气刹车、碳纤维扩散器和六个圆形LED尾灯。更具未来感的是MBUX Fluid Light Panel,其内含700余颗可编程RGB灯珠,支持文字与动画形式与外界互动。 此外,大灯内还隐藏有外部扬声器,负责播放“行驶声浪”,此前预告中曾展示量产车原型模仿V8引擎声浪的情景。 车身涂装为明亮的“日落光束”橙色,风阻系数低至0.198,十分出色。 车内风格彻底抛弃传统豪华形象,更接近一台高端赛车模拟器。中控配备10.25英寸数字仪表、14英寸信息娱乐屏幕以及来自AMG One的赛车方向盘。 中控台中央嵌有橙色发光管道,呼应高压电缆的视觉效果。座椅和车顶皆为裸露碳纤维材质,地板覆盖了100%回收材料。 仪表台简洁,金属部件混合了科技感与复古气息,车门则使用轻量化面板,配有金属横杆与橙色拉环,强化运动氛围。 这款车最关键的亮点藏在平台与动力系统之中。它基于全新AMG.EA平台打造,配备全新研发的高性能电池系统。 电机来自Yasa,采用紧凑结构与高输出设计,将于明年投产,并搭载于未来多款AMG新车中,包括新一代四门轿跑和SUV。 该车采用一前两后的电机布局,构成完全可变的全轮驱动系统,总功率超过1341马力(1000kW),最高时速超过359km。 新车首次搭载源自F1赛车的高性能电池,其四元电池的阳极含有硅元素,能量密度高达300Wh/kg,具备更长寿命。电池采用圆柱形电芯,外壳为激光焊接铝材,兼具轻量化与散热效率。冷却系统则使用先进液体冷媒,能够围绕每一颗电芯流动,确保运行温度稳定。 快充表现同样出众。车辆在大约5分钟内即可补充约400km的续航,这得益于平均充电功率超过850kW的系统支持。梅赛德斯还与Alpitronic合作研发原型充电桩,并计划部署新一代超级快充设备。 AMG.EA采用铝、钢与复合纤维等多种材料混合构成,兼顾轻量化与高刚性。同时,电池被集中布置于底盘结构内部,在保障操控表现的同时提升碰撞安全性能。
vivo刚出的这台折叠屏,我愿称它为“苹果最佳搭子”
“ 有些事儿,我觉得只有 vivo 能做得出来 ”。 现在,我手腕上戴了一块苹果的 Apple Watch,但是我用来配对它的手机,不是 iPhone,而是 vivo 刚发布的折叠屏手机 —— vivo X Fold5。 之前,蓝厂自家手机已经实现了 —— 与 Mac 电脑远程控制、跟 iPhone 的互联互通。 今天它又给我们带来了一款比 iPhone 16 Pro Max 还要轻 10g 的折叠屏旗舰,而且这手机还彻底打通了跟 AirPods 还有 Apple Watch 的配对。 那讲道理,我觉得苹果自己出不出折叠屏已经无所谓,因为蓝厂已经把该优化的体验都优化完了。。。 先说结论哈:如果说之前大折手机还存在「轻薄便携与大屏体验」「旗舰配置与机身厚度」的两难抉择,那么到了这一代,蓝厂直接把 “ 选择题 ” 变成了 “ 全选题 ” ,在折叠屏上做到了 “ 既要又要还要 ”。 相比上一代 vivo X Fold3,vivo X Fold5 不仅变得更轻,还变得更强了。 而且得益于一些系统交互体验上的创新,它这次直接把大屏玩出了花,普通安卓平板能做的事情,比如分屏办公还有追剧摸鱼,它不仅能做,还能实现「一块屏幕当五块用」的开挂操作,效率直接拉满。 更让咱们编辑部那帮苹果用户直呼真香的是,vivo X Fold5 甚至还实现了对苹果生态的 “ 反向破壁 ” 。 你敢信它除了能跟 iPhone 还有 Mac 实现无缝协同,还彻底打通了跟 Apple Watch 的跨生态连接,像是电话、短信、通知还有各种健康数据,现在直接能从 Apple Watch 同步到 vivo X Fold5 上?! 好好好,蓝厂这波属实是把果子的家全给偷完了,果粉们的第一台折叠屏,何必等苹果。。。 接下来托尼就祭出苹果全家桶带大伙好好盘盘,vivo X Fold5 这手机,到底还有哪些惊喜是我们不知道的。 要说拿到 vivo X Fold5 的第一感觉,毫无疑问就是轻跟薄。 这么说吧,尽管它是一台折叠屏,但拿在手上跟那些超大杯直板旗舰基本没什么两样,明白和青松版本 226g 的重量,意味着要是你之前就用超大杯,那换到 X Fold5 后,连从口袋掏手机的劲都不用改。 左:vivo X Fold5;右:vivo X200 Ultra 而这次钛色版本更是只有 217g,已经比很多直板机还轻。 大家看这组主流折叠屏数据就能明白,这样的 “ 身材 ” 在同类产品中到底有多破格,有时候它甚至给我一种 “ 轻盈得不像折叠屏 ” 的错觉。。。 给大家分享一个小细节 —— 为了把手机尽可能做薄,vivo X Fold5 不仅使用了中框和接口一体化设计,它甚至还把 C 口削去了一小块,使得机身展开状态下的厚度已经跟 C 口本身厚度差不多,就离谱。 不过大家千万别误会,它的 C 口虽然被削了一刀,但是这个接口的规格一点都没被砍,还是 USB 3.2 Gen1。 而且这台手机还通过了 IPX8、IPX9、IPX9+ 防水认证以及 IP5X 防尘认证,意味着它不止能在 1 米深的静水中浸泡 30 分钟,即便被高压水枪近距离冲洗也毫无压力,据说在水下甚至还能折叠 1000 次。 所以像这种直接用水龙头来回洗手机的操作,对 vivo X Fold5 来说肯定也是洒洒水啦( 温馨提示,各位最好别模仿,防水只是防万一,能不让手机沾水就尽量别沾水,这波测试纯属给大家图一乐~ )。 除了防水,它还支持防冻,手机在 -20℃ 的极寒环境中也能照常工作,滑雪党狂喜。 说真的就这防护规格,在折叠屏里也没谁了 ,而 vivo X Fold5 有了这么高规格的三防加入,已经可以说是真正意义上的「全天候折叠旗舰」,可靠性拉满了属于是。。。 而且该说不说,vivo X Fold5 除了底部 logo 和镜头上的蔡司小蓝标之外,就没有多余的设计,绝对算得上眉清目秀。 金属中框搭配磨砂玻璃后盖( 钛色是玻纤材质 ),在质感这块属实也是拿捏到位了。 话说回来,把折叠屏做轻做薄,只是让重量跟厚度不再成为日常使用的负担。 在我看来,轻薄化更应该建立在体验无妥协的前提下,绝不能以牺牲续航、性能、影像等核心体验为代价,否则就是本末倒置,得不偿失。 而在基础体验这块,我敢说 vivo X Fold5 堪称「折叠屏里的六边形战士」,在各方面都做到了无短板。 比如它搭载了一块 6000mAh 大电池,一举突破了折叠屏最大电池记录,同时它还支持 80W 有线充电和 40W 无线快充,不管是续航还是充电速度,直接向直板旗舰看齐,甚至它还支持上了反向无线充电。 实测充满电后,折叠和展开状态大概六四开,它的亮屏时间基本每次都在六小时往上,这成绩对直板机来说或许有些中规中矩,但在折叠屏里已经相当亮眼了。 还有,这次 vivo X Fold5 的影像表现也很有说法。 这手机一共搭载了三颗后置摄像头,它的主摄,用的是 X200s 同款索尼 IMX921 传感器,超广角则是旗舰机上最常见的三星 JN1,最关键是它的 3X 潜望长焦,也用上了索尼 IMX882,而且还支持微距。 单从影像硬件配置上来说,就是目前主流旗舰水准。 反馈到实际拍摄当中,你完全可以把它当做是一台正儿八经的影像旗舰来看待,搭配相机内置的负片胶片风格还有人像、风光各种模式,出片率杠杠的: 特别是它的这颗 3X 潜望长焦,近可拍各种微距,远可拍人像特写,实用性极强。。。 讲道理,相比其它折叠屏为了极致轻薄选择在副摄或长焦上 “ 做减法 ” 的做法,vivo X Fold5 这套全焦段无妥协的旗舰组合,在折叠屏里属实有点罕见。 轻薄就算了,连影像也这么顶,就问这你受得了么? 而它搭载的骁龙 8 Gen3 芯片,虽说是去年的旗舰。 但它扎实的性能底子就摆在这,配合蓝厂这么多年积累下来的调校功力,还是能够保证这台手机在任何场景下都能流畅稳定运行,至少绝对不会拖后退。 其他配置方面,像是高素质的内外屏、NFC、Wi-Fi 7、红外遥控这些一台全能折叠屏该有的,vivo X Fold5 基本都有。 只不过由于内部堆叠空间实在有限,它是侧边指纹识别,没用上超声波稍微有点遗憾。 当然了,很多人之所以愿意花大价钱买折叠屏,很大程度就是冲着展开后的那块大屏去的 —— 合上就是一台正常手机,展开后就能获得一块平板,这种 “ 一机两用 ” 的爽感,才是折叠屏最让人上头的地方~ 为了不白瞎这么一块大屏,之前蓝厂围绕大屏体验花了很多心思,做了很多能够提高大屏操作效率的功能。 比如弯折内屏再展开就能激发系统分屏,分屏后,图文内容甚至还能在多个应用之间进行任意拖放,你别说,这功能真挺好用,前阵子 618,我左右各开了淘宝京东,同件商品哪个平台卖得更便宜一目了然。 要是遇到那些需要蹲点抢的门票,还可以两只手同时开工,抢票成功概率直接翻倍~ 而这次,蓝厂又在折叠屏上给我们带来了一项全新功能 —— 原子工作台。 开启这功能后,你就能在这块 8.03 英寸的大屏上同时运行最多五个应用。 其中,主应用会占据屏幕 C 位,而其他应用则会以原子窗的形式排列在一侧,只需要点击对应窗口就能在多个应用之间来回快速切换。 真一点都不夸张,这功能一旦你用过就再也回不去了,因为它让折叠屏的多任务处理能力整整上了一个台阶。 比如做旅游攻略的时候,我可以同时打开小红书、携程、飞猪、大众点评还有地图,这么一来,就可以边在小红书上做攻略边在地图上标好想去地点,然后随时切到大众点评和携程搜附近有啥好吃、好玩的。 平时看直播或者玩游戏的时候,也能同时在旁边开着微信,这样就能随时回复消息而且还不会遮挡画面,当系统检测到你开了横屏模式,原子窗甚至还会从屏幕左侧自动移到屏幕上方,从而提高屏幕利用率。 前一阵去上海出差,我还尝试在 vivo X Fold5 上同时打开 WPS、飞书、微信、浏览器和豆包,结果改稿子、看文档、查资料、回消息一气呵成,全在一屏搞定,应付日常临时轻度办公需求,完全绰绰有余。 而且就像我在开头说的,这次蓝厂还彻底打通了跟苹果全家桶的互联互通,堪称苹果最强「搭子」 。 除了之前就已经支持的远程控制 Mac,现在 vivo X Fold5 已经进化到可以直接充当 Mac 的镜像扩展屏,就连手机上的电话和短信验证码,也可以直接在 Mac 上接听查看,好家伙,这比 iPad 还 iPad。。。 另外它也支持跟 iPhone 的配对,iPhone 上的电话、短信、通知都可以无缝流转到 vivo X Fold5 上。 同时,它还能直接查找 iPhone,这功能对双持党来说妥妥的刚需,直接省去了两台手机掏来掏去的麻烦。 要是遇到 iPhone 信号差的情况,vivo X Fold5 还能给 iPhone 开便携热点,专治果子信号 “ 水土不服 ” ~ 不过这还不是最狠的。 我无意中发现,现在在系统自带的「文件管理」里,直接就能查看 Mac 上的文件,要传啥文件到手机分屏拖拽就行,甚至你还能直接登苹果 iCloud 账号,在里边上传或者下载文件。 这波啊,可以说蓝厂硬生生在苹果生态城墙上砸开了后门。 欸,这时候聪明的小伙伴应该已经开始猜测了 —— 既然 Mac 和 iPhone 都可以互联,那 AirPods 是不是也行? 答案是当然可以! 连上 AirPods 后,不用借助任何第三方软件,我们在 vivo X Fold5 状态栏里,就能看到耳机的剩余电量,同时它还支持空间音频,也能随意切换耳机模式,就这体验,已经足够媲美原生。 不仅如此,蓝厂一不做二不休,还在业内率先打通了跟 Apple Watch 的互联互通,配对好后,Apple Watch 记录下来的各种数据可以直接在健康 APP 里看,其他像是电话、短信通知也能在手表上实时同步。 这下果粉从 iPhone 换到安卓,是彻底没障碍了。。。 哦对了,这次 vivo X Fold5 还新增了一颗独立的实体按键。 它支持自定义功能,比如一键开启静音,或者长按自动录音,其他诸如相机、手电筒也可以用它来快启,平时用着还挺方便: 搭配这套一眼 “ 果味 ” 的界面,看来蓝厂目标很明确,就是想让 iPhone 用户无痛换到安卓,上手即用~ 其实看看调研机构的数据就明白,从 2019 年第一台折叠屏晃悠上市到现在,这玩意儿的市场渗透率已经从 0.1% 飙到去年上半年的 3.6%,听起来不算高?但要知道这会全球智能手机出货量还在往下掉呢。 不过去年第三季度,全球折叠屏智能手机出货量却首次出现了下滑,同比下降了 1%。 这也从侧面说明,如今消费者早就过了拿折叠屏当新奇玩具的尝鲜阶段,现在还愿意掏钱买折叠屏的用户,它们可能更看中的是折叠屏能不能当主力机用;拿它当主力机用,它相比起直板机有什么突出优势。 说白了,折叠屏的上半场算是彻底打完了,下半场决胜关键从来不是形态噱头,而是让用户心甘情愿把折叠屏从尝鲜玩具换成主力机的体验质变,折叠屏要想活下来,就必须在轻薄和实用性上同时下狠功夫。 而在我看来,vivo X Fold5 交出的答卷,可以说恰恰踩准了这个转折点,凭借直板机般的轻薄手感、榨干大屏效率的原子工作台、以及打通苹果生态的 “ 反向破壁 ”,精准命中了主力机的所有核心诉求 —— 轻便、流畅、可靠、好用、无负担。 说起来,以前折叠屏总需要让人去主动适应,比如你得适应它厚重的手感、娇贵的机身,拉跨的续航,还有看似有用实则鸡肋的生产力,但蓝厂则把重点放在了怎么让它更适应人,这才是体验质变的核心 —— 从 “ 我是折叠屏,你得迁就我 ”,变成 “ 我是折叠屏,用着比直板机还舒服 ”。 换句话说,vivo X Fold5 或许不是配置最顶的那台,但它毫无疑问是当下最懂主力机用户要什么、也最能满足这些用户需求的「全能折叠屏」—— 轻装上阵,却处处到位,接下来就看其他厂商会咋接招了。。。 撰文:胖虎 编辑:米罗 & 面线 美编:焕妍 拍摄:老秦
“车圈老赖”100亿收购威马!凭啥逆天改命?
6月16日,一家大家可能都没听说过的新品牌——悠宝利,官宣新车已于深圳工厂下线,并面向二三线城市招募加盟经销商。 其背后,正是从地产跨界而来,3度入局造车而未成的宝能汽车。 细数这些年,宝能为了造车曾先后控股观致、长安标致雪铁龙,也推出过自持的新能源品牌宝能汽车,最终却落得负债累累。 据企查查显示,宝能汽车集团的被执行金额已经接近120亿元,其母公司宝能投资集团的被执行金额更是高达480亿元,可以说把“全村的希望”都押在悠宝利身上了。 但就在这背水一战的关键时刻,宝能居然又动起了收购的心思! 深圳市一家宝能汽车展示中心里,在悠宝利的身后,赫然出现了两台威马汽车。 再一问,可了不得。面对南方都市报记者的采访,工作人员明确表示,威马已经被宝能汽车“收购”,双方正在交接生产资质等核心资产。 难怪在6月17日,宝能要对外辟谣,称公司一切经营正常,且有新车即将上市。 那么,宝能究竟在下一盘怎样的大旗?这个“失败者联盟”,又能否具备死而复生的实力? 今天,我们就从双方为什么失败开始,来简单聊一聊。 01. 威马困局,千疮百孔 2021年,威马门店全速扩张,创下一个月内在上海三店齐开的盛况。 但谁能想到,短短1年后的2022年3月份,威马在北京合生汇、朝阳大悦城等多家门店却已经大门紧闭、人去楼空,撤店撤了个干净。 原因也很简单:钱,没了。 要知道,威马的创始人沈晖,曾经参与过吉利收购沃尔沃、和广汽和菲亚特合资这两件中国汽车史上的大事; 威马作为国内最早一批造车新势力,又押准了智能纯电SUV的风口,价格也十分亲民,必然会备受资本市场青睐。 A至D轮12次融资,让威马累计募资超410亿元,按理来说不该缺钱才对。 但或许是钱来得有些容易,也或许是沈晖选择了传统制造业的老路,当时的威马并没有选择代工生产,而是“百亿建厂+14亿购买双造车资质”起手,步步见真金。 当时沈晖甚至有底气对外喊出:“如果选择代工生产,我会天天睡不着觉!” 如果那个时候,主打科技普惠的威马能够确保产品质量、研发持续迭代,很难说不能坐到如今零跑、小鹏的位置。 但威马,却犯了四个最大的错误—— 其一,是在研发和生产端对安全的漠视。 为了确保车辆续航,威马选择了622高镍配方来提升能量密度,却并没有做好供应商管理,而是为了降低生产成本,选择了小厂生产的电芯。 这对于整车安全来说,可以说是灾难:一旦电芯在生产过程中混入杂质,会导致异常析锂造成短路,引发车辆自燃! 短短一个多月的时间里,从北京到温州,连续4辆威马EX5自燃,逼着威马不得不自查,召回存在问题的动力电池。 其二,是对用户权益的漠视。 自燃事件过后,不少威马车主反映车辆实际续航大幅下降,怀疑威马为了降低自燃风险给车主“锁电”,侵犯了用户权益。 但截止威马倒闭撤店,也没能给老车主们一个说法。 其三,在威马产品、服务都存在问题的时候,不仅2019~2021年的总研发投入不足30亿元、还不到蔚小理一年的投入,亏损居然高达174亿元。 其中因为严重依赖B端市场,有27亿是给经销商的返利; 想要打开C端市场,花高价请明星站台,却没能换来相匹配的效果; 单2021年,行政费用开支占比高达27亿元; 还因为重资产模式,把现金换成了价值58.17亿元的物业、厂房和设备。 更惨的是,威马居然还在内斗 。 CTO闫枫负气出走,主张直销模式的陆斌被调岗离职,威马6位创始人之一、组建了威马成都研究院、负责生产制造的侯海靖大权独揽,却因为缺乏研发经验,拿不出有竞争力的产品。 于是乎,眼见威马资不抵债的沈晖,在债务压身、上市无望、技术没有突破时,会选择“参加慕尼黑车展后直飞纽约”的走线,也就不足为奇了。 总而言之,现在的威马可以说是要钱没人,要人没技术。为数不多的资源,就是两大工厂、生产资质,以及所剩无几的品牌价值。 至于宝能,则是陷入了另一番困局。 02. 宝能之困,孤注一掷 2017年,宝能集团先后砸下81.9亿元,拿到观致汽车63%股权,从地产进军实业制造,开启了漫漫造车路。 外界对宝能唯一的质疑,就是造车是不是真心的? 之所以有这样的“灵魂拷问”,完全是因为宝能的一系列骚操作。 2018年,观致因为宝能入局,销量被推高至6.3万辆,看起来已经有了复兴的迹象。 但实际上,其中90%的销量都来自于老板姚振华旗下的联动云租车,属于纯纯的内部消化 。 也正是在这一年,宝能又搞了个"五年千亿"研发计划,准备在西安打造生产基地,可谓是壮志凌云。但最后地到手、周边楼盘都开始卖了,工厂却是仍在雾中。 同样的套路,宝能也在黄埔区、广州开发区等地上演,要砸120亿元建厂,然后顺利拍得三块地皮,后续懂的都懂。 随后,宝能的金钱操作还在继续。 2020年,宝能系作价32.6亿元,全资收购长安标致雪铁龙、更名为宝能汽车,顺手成立了电池、软件等11家子公司,打造所谓的全产业链生态,气势迫人。 但这种大开大合的产业大佬姚振华,咋在街边吃上10块钱的汤粉了 ? 实际上,当时的宝能已是强弩之末,通过挪用短期债务在苦苦支撑罢了。 2021年,宝能集团被执行金额就已经突破463亿元,资金链乍然断裂。光姚振华个人,被执行的总金额就超过500亿元。 时至今日,宝能旗下核心地段的房产不少都已经被司法强制拍卖,用于偿还债务,持有的基金股权等资产,也被折价出售。 或许宝能汽车在一开始,就打定了要借汽车产业救活地产的主意。因此所有的资本操作,都是希望融资上市,借助宝能汽车的势能,把宝能集团的现金流盘活。 但即便是姚老板敢赌敢拼的金融运作,也在造车这件事上卡了壳—— 宝能最大的问题,是跨界造车7年至今,依然没能跨出量产的第一步。 2022年亮相的悠宝利A3,就因为资金和欠薪问题,已经先后三次推迟量产。 另一边,宝能拉投资项推动观致汽车复工复产的计划,也一直未能实现。 也就是说,宝能现在也是处于一个要钱没人、要人没技术,要产业可能就只剩一些固定资产的境地。 那么,这样的宝能,为什么要在这个时间点再度投资,收购威马?难道真的只是因为“宝能+威马=宝马”? 03. 失败者联盟,真能负负得正? 2023年底,威马正式申请破产重组。 当时几乎所有人都知道,威马已是外强中干。但多家战略投资人中,依然有一家始终保持着投资意愿——深圳翔飞。 先别急着为这份坚守而感动,时间只需要往前推几个月,一切或许会豁然开朗。 2023年9月,深圳翔飞以1亿元注册资本成立。 其法人黄晶,正是昆山宝能汽车有限公司的实际控制人。 2023年底,上海威马总部所在地的附近,就有一家名为“翔飞”的新能源汽车集团在招聘融资总监、法务总监、总装技师、整车基地负责人等岗位。 很显然从那个时候起,宝能就已经在威马的眼皮子底下,打起了收购的算盘! 只不过,当时的威马还有不少潜在投资人可以接洽,宝能系的橄榄枝也就一直没被接下。 直到今年4月3日,上海市第三中级人民法院宣布批准威马汽车重整计划,威马重整正式进入执行环节。 这也就意味着,作为唯一报名的战略投资人,深圳翔飞需要投入100亿元,帮威马实现复工复产、维持后续经营。 根据BOSS直聘上的信息,深圳翔飞的招聘地址正是威马温州工厂所在地,也在从HRBP经理开始,搭建整套人员班底。 如果重整计划能够顺利进行,威马年底前就能完成复工复产,同步进行品牌焕新与营销网络构建; 2026~2027年加大研发力度,实现年销60万辆的目标; 2028~2029年,会将10款新车型投放到全球市场,年销量突破100万辆、营收超1100亿元(均价11万元),目标资本市场估值1500亿元。 难怪负责为悠宝利品牌招商的咨询人士称,目前宝能汽车的总产能已达百万级,目前正在信心十足地征集经销商定价政策。 那么,孤注一掷的宝能+威马,究竟还有没有机会? 社长觉得,有多个停产品牌的“珠玉”在前,宝能和威马的新车很难获得天然的信任。除非……价格是真的合适。 但鉴于新车价格已经卷到谷底,没有规模化效应支撑,几乎不可能盈利。因此宝能+威马唯一的机会,就是开拓海外市场。 早在2021年,宝能旗下的观致汽车就已经把新车卖到了科威特。曾经和观致同平台的星途,也在中东地区收获了许多当地用户的好评。 如果靠着前些年留下的海外渠道优势、和中国新能源产业链发展的东风,也许宝能+威马,还真有机会。 接下来,就看深圳翔飞那100亿,什么时候能够到打到威马账上了。
特斯拉Robotaxi状况频发 专家惊讶:一开始就这么多问题
特斯拉自动驾驶出租车 凤凰网科技讯 北京时间6月26日,据路透社报道,根据特斯拉邀请的试乘者发布的视频,特斯拉自动驾驶出租车(Robotaxi)在得州奥斯汀启动公开测试的前几天内,出现多起交通问题和驾驶失误。 特斯拉CEO埃隆·马斯克(Elon Musk)将公司的财务前景与自动驾驶技术紧密绑定。在当前特斯拉销量下滑的背景下,这一押注的风险颇高,并预测到明年下半年,将有“数百万辆特斯拉汽车”实现“完全自动驾驶”。 受邀参与试乘测试的粉丝们对特斯拉自动驾驶出租车给予了大力支持,并发布了数小时无故障行驶的视频。然而,测试中出现的问题仍引发了联邦道路安全监管机构和汽车安全专家的质疑。 问题不少 这些问题包括:特斯拉自动驾驶出租车驶入错误车道、在多车道路中央或路口让乘客下车、突然刹车、超速行驶,以及碾上路缘石等。 在其中一次测试中,一辆特斯拉自动驾驶出租车驶入了对向车道,并停留了大约6秒。当时车辆处于左转车道内,打着左转灯进入了路口。随后,方向盘短暂晃动了一下,车辆却没有左转,而是直接开进了对向车道,引发后方车辆鸣笛警告。 另一起事件中,车辆在无明显障碍物的情况下突然急刹,导致乘客被甩向前方,随身物品也掉落在车内地板上。 特斯拉Robotaxi突然刹车 第三起事件则由另一辆车拍摄。画面显示,特斯拉自动驾驶出租车在经过闪烁警灯的警车时,曾两次在道路中间突然停车。 特斯拉此次测试配有人类安全员,坐在副驾驶位置。在第四段问题视频中,当前方一辆送货卡车开始倒车时,安全员按下了控制按钮,强行让自动驾驶出租车停车。 路透社能够独立核实至少11段显示出汽车问题的视频的拍摄地点。特斯拉对此未作出回应。 “现在就出现这么多行驶异常和驾驶不当的视频,实在太早了,”卡内基梅隆大学计算机工程教授、自动驾驶技术专家菲利普·库普曼(Philip Koopman)表示,“我原本没想到在第一天就会看到这么多驾驶问题的视频。”他表示。 奥斯汀市发言人表示,官员们已注意到社交媒体上所报道的特斯拉相关问题,“一旦我们关注到存在潜在法律或安全问题时,我们会立即将其告知该公司”。该发言人还补充道,警察局“正在与特斯拉积极合作”,以确保警察能够安全地与自动驾驶出租车进行互动。 尚未引发事故 不过,这些被拍下来的事件并未涉及交通事故。一位专家表示,其中一些情况反映出特斯拉在安全性上的优先考量。 “到目前为止还好。它应对这些情况的表现非常好,甚至可能比优秀司机还要出色。”普林斯顿大学运筹学与金融工程教授阿兰·科恩豪瑟(Alain Kornhauser)在邮件中表示。他补充说,自动驾驶汽车如果以低于路面主流车速的速度行驶,反而可能更加危险。 特斯拉的自动驾驶汽车试点格外引人注目。其他公司也曾遇到类似问题:Alphabet旗下Waymo和通用汽车旗下Cruise在进入奥斯汀街头后,也发生过交通事故。过去两年里,市政府官员记录了数十起居民和执法部门报告的事件,内容包括自动驾驶出租车i在道路中间停车堵塞交通、未能遵守警方指挥,以及无法应对紧急车辆和道路封闭等情况。 2023年,一起涉及行人的严重事故导致Cruise在去年暂停运营。Waymo是美国唯一一家在没有人类安全司机或车内安全员情况下,为付费乘客提供自动驾驶出租车服务的公司。今年早些时候,Waymo通过Uber在奥斯汀向公众开放了乘车服务。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
国产大模型高考出分了:裸分683,选清华还是北大?
量子位 | 公众号 QbitAI 这两天啊,各地高考的成绩终于是陆续公布了。 现在,也是时候揭晓全球第一梯队的大模型们的“高考成绩”了—— 我们先来看下整体的情况(该测试由字节跳动Seed团队官方发布): 按照传统文理分科计分方式,Gemini的理科总成绩655分,在所有选手里排名第一。豆包的文科总成绩683分,排名第一,理科总成绩是648分,排名第二。 再来看下各个细分科目的成绩情况: 除了数学、化学和生物之外,豆包的成绩依旧是名列前茅,6个科目均是第一。 不过其它AI选手的表现也是比较不错,可以说是达到了优秀学生的水准。 比较遗憾的选手就要属O3,因为它在语文写作上跑了题,因此语文成绩仅95分,拉低了整体的分数。 若是从填报志愿角度来看,因为这套测试采用的是山东省的试卷,根据过往经验判断,3门自选科目的赋分相比原始分会有一定程度的提高,尤其是在化学、物理等难度较大的科目上。本次除化学成绩相对稍低外,豆包的其余科目组合的赋分成绩最高能超过690分,有望冲刺清华、北大。 (赋分规则:将考生选考科目的原始成绩按照一定比例划分等级,然后将等级转换为等级分计入高考总分) 好,那现在的豆包面临的抉择是:上清华还是上北大? 大模型参加高考,分数怎么判? 在看完成绩之后,或许很多小伙伴都有疑惑,这个评测成绩到底是怎么来的。 别急,我们这就对评测标准逐条解析。 首先在卷子的选择上,由于目前网络流出的高考真题都是非官方的,而山东是少数传出全套考卷的高考大省;因此主科(即语文、数学、英语)采用的是今年的全国一卷,副科采用的则是山东卷,满分共计750分。 其次在评测方式上,都是通过API测试,不会联网查询,评分过程也是参考高考判卷方式,就是为了检验模型自身的泛化能力: 选择题、填空题 采用机评(自动评估)加人工质检的方式; 开放题 实行双评制,由两位具有联考阅卷经验的重点高中教师匿名评阅,并设置多轮质检环节。 在给模型打分的时候,采用的是 “3门主科(语文数学英语)+3门综合科(理综或文综)” 的总分计算方式,给五个模型排了个名次。 值得一提的是,整个评测过程中,模型们并没有用任何提示词优化技巧来提高模型的表现,例如要求某个模型回答得更详细一些,或者刻意说明是高考等等。 最后,就是在这样一个公平公正的环境之下,从刚才我们展示的结果来看,Gemini、豆包相对其他AI来说取得了较优的成绩。 细分科目表现分析 了解完评测标准之后,我们继续深入解读一下AI选手们在各个科目上的表现。 由于深度思考的大火,大模型们在数学这样强推理科目上的能力明显要比去年好很多(此前大部分均不及格),基本上都能达到140分的成绩。 不过在一道不算难的单选题(全国一卷第6题)上,国内外的大模型们却都栽了跟头: 这道题大模型们给出的答案是这样的: 豆包:C;Gemini:B;Claude:C;O3:C;DeepSeek:C。 但这道题的正解应该是A,因此大模型们在此全军覆没。 之所如此,主要是因为题目里有方框、虚线、箭头和汉字混在一起的图,模型认不准图像,说明它们在 “看图说话” 这块还有进步空间。 以及在更难的压轴大题上,很多大模型也没完全拿下,经常漏写证明过程,或者推导不严谨被扣分,说明在细节上还需加强。 到做语文选择题和阅读题这两个版块,大模型们几乎是 “学霸本霸”,得分率超高。 不过在作文写作过程也暴露出了一些问题,例如写作过于刻板、文字冰冷,文章字数不达标(不足800字或超过1200字)、立意不对,形式上还经常会出现惯用的小标题。 在英语测试过程中,大模型们几乎挑不出毛病,唯一扣分点是在写作上,比如用词不够精准、句式稍显单调,但整体已经很接近完美。 对于理综,遇到带图的题目大模型们还是会犯难,不过豆包和Gemini这俩模型在看图像和理解图的能力上会比其他模型强一些。 例如下面这道题中,正确答案应当是C,大模型们的作答是这样的: 豆包:C;Gemini:C;Claude:D;O3:D;DeepSeek:D。 最后在文综方面,大模型的地域差别就显现得比较明显,国外的大模型做政治、历史题时,经常搞不懂题目在考啥,对中国的知识点不太 “感冒”。 而对于地理题,最头疼的便是分析统计图和地形图,得从图里精准提取信息再分析。 以上就是对于本次评测的全面分析了。 除了今年国内的高考之外,这几位“参赛选手”还参加了印度理工学院的第二阶段入学考试——JEE Advanced。 这场考试每年有数百万人参与第一阶段考试,其中前25万考生可晋级第二阶段。它分为两场,每场时长3小时,同时对数学、物理、化学三科进行考察。 题目以图片形式呈现,重点考查模型的多模态处理能力与推理泛化能力。所有题目均为客观题,每道题进行5次采样,并严格按照JEE考试规则评分——答对得分、答错扣分,不涉及格式评分标准。 与全印度人类考生成绩对比显示,第一名得分332分,第十名得分317分。 值得注意的是,豆包与Gemini已具备进入全印度前10的实力:Gemini在物理和化学科目中表现突出,而豆包在数学科目5次采样中实现全对。 怎么做到的? 相比去年一本线上下的水平,整体来看,大模型们在今年高考题上的表现均有明显的进步。 那么它们到底是如何提升能力的?我们不妨以拿下单科第一最多的豆包为例来了解一下。 豆包大模型1.6系列,是字节跳动Seed团队推出的兼具多模态能力与深度推理的新一代通用模型。 团队让它能力提升的技术亮点,我们可以归结为三招。 第一招:多模态融合与256K长上下文能力构建 Seed1.6延续了Seed1.5在稀疏MoE(混合专家模型)领域的技术积累,采用23B激活参数与230B总参数规模进行预训练。其预训练过程通过三个阶段实现多模态能力融合与长上下文支持: 第一阶段:纯文本预训练 以网页、书籍、论文、代码等数据为训练基础,通过规则与模型结合的数据清洗、过滤、去重及采样策略,提升数据质量与知识密度。 第二阶段:多模态混合持续训练(MMCT) 进一步强化文本数据的知识与推理密度,增加学科、代码、推理类数据占比,同时引入视觉模态数据,与高质量文本混合训练。 第三阶段:长上下文持续训练(LongCT) 通过不同长度的长文数据逐步扩展模型序列长度,将最大支持长度从32K提升至256K。 通过模型架构、训练算法及Infra的持续优化,Seed1.6 base模型在参数量规模接近的情况下,性能较Seed1.5 base实现显著提升,为后续后训练工作奠定基础。 这一招的发力,就对诸如高考语文阅读理解、英语完形填空和理科综合应用题等的作答上起到了提高准确率的作用,因为它们往往涉及长文本且看重上下文理解。 第二招:多模态融合的深度思考能力 Seed1.6-Thinking 延续Seed1.5-Thinking的多阶段RFT(强化反馈训练)与RL(强化学习)迭代优化方法,每轮RL以上一轮RFT为起点,通过多维度奖励模型筛选最优回答。相较于前代,其升级点包括: 拓展训练算力,扩大高质量数据规模(涵盖 Math、Code、Puzzle 等领域); 提升复杂问题的思考长度,深度融合VLM能力,赋予模型清晰的视觉理解能力; 引入parallel decoding技术,无需额外训练即可扩展模型能力 —— 例如在高难度测试集Beyond AIME中,推理成绩提升8分,代码任务表现也显著优化。 这种能力直接对应高考中涉及图表、公式的题目,如数学几何证明、物理电路图分析、地理等高线判读等;可以快速定位关键参数并推导出解题路径,避免因单一模态信息缺失导致的误判。 第三招:AutoCoT解决过度思考问题 深度思考依赖Long CoT(长思维链)增强推理能力,但易导致 “过度思考”—— 生成大量无效token,增加推理负担。 为此,Seed1.6-AutoCoT提出 “动态思考能力”,提供全思考、不思考、自适应思考三种模式,并通过RL训练中引入新奖励函数(惩罚过度思考、奖励恰当思考),实现CoT长度的动态压缩。 在实际测试中: 中等难度任务(如 MMLU、MMLU pro)中,CoT 触发率与任务难度正相关(MMLU 触发率37%,MMLU pro触发率70%); 复杂任务(如AIME)中,CoT触发率达100%,效果与Seed1.6-FullCoT相当,验证了自适应思考对Long CoT推理优势的保留。 以上就是豆包能够在今年高考全科目评测中脱颖而出的原因了。 不过除此之外,还有一些影响因素值得说道说道。 正如我们刚才提到的,化学和生物的题目中读图题占比较大,但因非官方发布的图片清晰度不足,会导致多数大模型的表现不佳;不过Gemini2.5-Pro-0605的多模态能力较突出,尤其在化学领域。 不过最近,字节Seed团队在使用了更清晰的高考真题图片后,以图文结合的方式重新测试了对图片理解要求较高的生物和化学科目,结果显示Seed1.6-Thinking的总分提升了近30分(理科总分达676)。 图文交织输入示例 这说明,全模态推理(结合文本与图像)能显著释放模型潜力,是未来值得深入探索的方向。 那么你对于这次大模型们的battle结果有何看法?欢迎大家拿真题去实测后,在评论区留言你的感受。
不是耳机也不可穿戴,OpenAI首款硬件究竟是什么?
‍‍‍上周,OpenAI曾发布与其收购的人工智能硬件公司io相关的宣传材料,但随后这些宣传已从网站和YouTube页面撤下。这与收购计划本身无关,真正原因是另一家人工智能公司iyO提出商标诉讼,称二者名称和产品相似,可能会误导消费者。 那么,io和iyO究竟有多相似呢? iyO公司致力于打造一款无屏幕的语音控制音频计算机。它最初是谷歌 “登月计划” 实验室的项目,2021年分拆独立,去年推出了旗舰产品,定制的人工智能耳机。 相比之下,io正在研发的产品依旧十分神秘。 01. 无显示屏,非穿戴式,绝非入耳式 知名科技分析师Ming-Chi Kuo称,OpenAI与io合作的设备 “不具备显示功能”,可以戴在脖子上,像已停产的Humane AI胸针。 不过,商标诉讼案中的文件显示,二者可能存在关键差异。io的联合创始人兼首席产品官Evans Hankey在给法庭的声明中表示:“io目前并无推出定制耳机产品的计划。” 另一位联合创始人Tang Tan也在声明中表示,io产品的原型 “既非入耳式设备,也不是可穿戴设备”。 02. 然而,io曾深入测试入耳式设计 Tan补充道,该产品距离最终定型、宣传和上市“至少还需一年”,所以目前关于其非入耳式的说法可能会改变。实际上,他表示在设计原型时,io考虑了各种类型的设备,包括桌面和移动设备、无线和有线设备、可穿戴和便携式设备。 证据表明,io最认真考虑过的设备类型是入耳式。 io工程师Marwan Rammah在一份声明中称,2023年公司成立后的几个月里,他们购买了至少30种不同耳机,目的是“了解音频产品的现状”。Rammah还表示,他建议从名为The Ear Project的公司购买三维耳朵扫描数据库,iyO也曾使用过该数据库。 近期,在收购前夕,io和OpenAI都与iyO的管理层会面,以进一步了解其产品。Tan在声明中称,他本不愿参加会议,因为怀疑iyO的产品只是“概念产品”,但又不想接触任何机密信息,以免出现相似之处时引发法律纠纷。 03. 既非手机,也非眼镜 据《华尔街日报》获取的一段泄露会议录音,OpenAI首席执行官Sam Altman告诉员工,这款人工智能设备体积较小,可放在桌面或装进口袋。它能“很好地感知用户的周围环境和生活”,消费者使用它的频率会与使用iPhone和MacBook Pro相当。 Altman还称,这款设备既不是手机,也不是眼镜,且不太可能是可穿戴设备,其目的是让用户减少对屏幕的依赖。 OpenAI于上月底收购了io,并指定其联合创始人、前苹果首席设计官Jony Ive负责领导即将开展的硬件项目设计。 据《纽约时报》报道,Ive和Altman两年前就已决定打造一款人工智能驱动的硬件设备。他们的共同愿景是“开发一款利用人工智能的产品,创造一种对社交干扰比iPhone更小的计算体验”。 据彭博社科技内幕人士Mark Gurman称,这一合作让苹果公司颇为不安,因为在人工智能创新方面,苹果已落后。 目前,苹果最具雄心的人工智能硬件项目——增强现实且AI驱动的眼镜 ,预计将于2026年底推出。不过,苹果仍处于开发智能手表和AirPods的早期阶段,这些设备带有内置摄像头,旨在支持人工智能相关功能。 原文来源于: 1.https://www.techrepublic.com/article/news-openai-io-ai-device/
战事升级,美团的答案藏在即时零售里
聚焦优势资源打决胜战役 作者丨瀚星 你最近一次网购30卷纸巾、10支牙膏、5箱啤酒是在什么时候? 囤货,正成为离我们越来越远的古早购物模式。 过去十余年,电商大促培养出“非折扣不买”的消费习惯,不少用户会刻意延迟刚需采购,等待促销节点集中囤货。 但随着用户购物习惯的演变,越来越多的即时性消费正在回归。 知名市场监测和数据分析公司尼尔森IQ发布的《2024年度网络购物者调研》显示,选择“随时立刻补货、不等折扣”的消费者占比达到29%,较上一年增长9%。小型家庭结构的消费者采购模式,由一次性大额采购、囤货,逐渐转向按需补货,即避免浪费、购买适量的小包装、随时立刻补货的模式。 占据即时零售市场最大份额的美团,对消费趋势的变化有着清晰的认知。 6月23日,美团宣布:将全面拓展即时零售,推动零售新业态的提质升级,主要有四项措施,包括:全面拓展即时零售品牌闪购的品类,加码自营生鲜食杂配送业务小象超市,社区团购业务美团优选转型升级,以及积极拓展海外市场。 这四个动作本质上是一回事:美团要聚焦优势资源打决胜战役。 毕竟,相比于外卖的存量竞争,在即时零售上的主动进攻才是决胜局的关键。 京东入场,淘宝亮相,美团保持不分心,没有高调喊口号,也没有参与内卷。什么事情该做,什么事情不该做,美团想得很清楚。 就在美团发布公告的同一天,阿里巴巴也宣布将饿了么、飞猪并入中国电商事业群,整合资源,完成“从电商平台走向大消费平台的战略升级”。 那么,巨头们不约而同地全面聚焦即时零售,还给行业传达出什么信号? 美团看到了最好的时机 美团闪购和小象超市是此次美团战略升级的两大核心业务支点。 2018年,美团成立闪购部门,希望将餐饮即时配送能力应用在更多品类上。经过7年发展,闪购已经搭建起了成熟的供给和履约体系。美团的数字化能力联合百万本地实体商家,把消费者购物体验从“等几天快递”变成时效更高的“30分钟送达”。 截至目前,美团闪购与零售商品牌商已在全国建设了超3万家闪电仓。 对当下的消费者而言,外卖早已不单单指一顿饭、一杯奶茶,还可以是数码配件、母婴用品、服饰、宠物用品、小家电,“外卖点手机”也已不是什么新鲜事。艾瑞咨询数据显示,2021-2026年,即时零售消费电子市场规模的年复合增长率预计达到68.5%,2026年规模将超过千亿元。 平台数据显示,在今年618期间(5月27日-6月18日),超过1亿用户使用了美团闪购,手机成交额翻倍,智能设备增长超6倍,白酒增长超10倍,另外还有60多个品类的商品成交额增长翻倍,近850个品牌成交额翻倍。 在此次战略升级中,美团闪购将在品牌升级基础上,继续拓展品类,联合零售商品牌商进一步拓展门店和闪电仓,提供更丰富的3C家电、生鲜食品、酒水饮料和快消日百供给。 美团闪购是对美团本地核心商业业态的升级和补充,小象超市则是走另一条道路:通过自营前置仓的模式,将产地生鲜和日用百货做到30分钟送达。 目前,小象超市已在全国20个城市开设了近千个前置仓。据美团数据,小象超市今年农产品销售额预计将超过200亿元。 结合第三方市场数据来看,小象超市的GMV规模和覆盖城市数,已经超过了叮咚买菜、朴朴超市等前置仓主要玩家,跻身行业第一梯队。 相比于美团闪购的平台式运营,小象超市的自营模式做得更重,因此很难在短时间内大范围地铺开。在此次业务升级中,美团重点提及将加码小象超市,扩大覆盖区域,未来将逐步拓展到所有的一二线城市。 为辅助小象超市在二线城市的拓展,社区团购业务美团优选将同步进行转型升级。经过多年投入,美团优选已在全国搭建了较成熟的供应链和仓配网络。将优选和小象的供应链打通,可以实现1+1>2的效果。 在过去很长一段时间,美团在即时零售上都以“快”著称,这也是它最深的护城河。但随着即时性需求的爆发和市场环境的变化,仅做到快已经不能满足当下消费者的全部需求。 下一步,美团要同时做到“多快好省”。 在“好”的角度,各平台都是标品,线上线下一盘货,暂时难分高下。因此,“多”和“省”成为制胜关键。 美团的计划,是通过拓展品类、丰富供给实现万物到家,再通过整合供应链资源、优化履约模式,更高效地运营,提供给消费者更有性价比的商品,从而拿下更多的零售市场份额。 供需逻辑改变,线下实体“逆袭” 即时零售不仅是消费端的需求,同时也是供给端的机会。 十多年的电商发展,让零售份额大量地向线上倾斜,而这一趋势在2020年开始发生变化。前一年,实物商品网上零售额增速首次降至20%以下,2020年又进一步下滑至15%以下。传统电商进入了存量竞争阶段。 同样在2020年,即时性需求开始爆发。据艾瑞咨询,这一年有83%的消费者通过平台型电商进行即时零售消费,71%使用垂直自营模式即时零售电商,64%选择传统商超自营模式,超过60%的订单被送往住宅区。 即时零售消费者最常购买的品类是水果蔬菜、休闲零食、乳制品等,也恰好是短保易腐、不便长途运输或消费者想尽快使用的品类。 2020年之后,需求端的热情不减,即时零售逐渐成为一种新的生活方式,供给端也在积极拥抱。 不同于传统电商模式,即时零售是一种对线下商家更友好的线上化方式,商家既能借助平台的力量实现数字化转型,又能获得流量拓宽销售渠道。 此前,本地实体零售商最大的竞争对手是“全国货一盘棋”的传统电商,异地供货一定程度上挤占了本地商家的市场空间。与此同时,在零售行业多级经销商的体系下,本地商家也很难在商品价格上具备竞争力。 但在即时零售领域,供需的逻辑发生了变化。 例如,在价格差距不是十分明显的情况下,外卖30分钟就能把一包纸巾送到家,而传统电商要等1到2天,大部分消费者会选择前者,这让“就近供货”的本地零售商受益。 本地零售商的核心客群受地理位置限制,一般是方圆1公里内的居民。而即时零售相当于为这些实体门店开辟了一条线上通道,将经营范围由原本的1公里拓展到5公里。 此外,本地品牌多以鲜食为主,具有需求与供给双重本地化的特征,即时零售能够更快地连接起本地的供需双方,提高配送时效,减轻叠加耗损,保证食物的新鲜度。 从当前的发展来看,商超、连锁、KA、门店等本地实体零售商,是即时零售发展的主要受益者。 这离不开美团长达7年的即时零售探索,美团一直在探索一种线上线下融合发展的零售新模式,让线下实体可以充分参与分享线上的数字红利。 打破内卷,向外寻求可能性 即时零售不仅仅是美团的机会,也是传统电商平台的机遇。 中金公司研究报告显示,2021年前后,服饰、美妆等对时效性要求不高、可用快递网络完成履约的品类,或者家电等商品单价足以覆盖复杂物流作业的品类,已基本被传统电商巨头分割。 2025年年初,电商巨头们率先在即时零售的战场上点燃烽火。 2月初,京东大举进军外卖,既是对新业务的拓展,同时也寄希望于外卖带动主站零售业务的增长,从而在即时零售的市场上多分一杯羹。 两个多月后,淘宝与饿了么联手杀入即时零售战场。 近期,据晚点LatePost报道,多多买菜开始在上海等一线城市试验自建商品仓库,最快将于8月上线即时配送服务。 同一天,淘宝和美团官宣业务调整、战略升级。 当多家巨头踏入同一片战场,内卷成为不可避免的话题。从去年的电商低价大战到今年年初的外卖战火重燃,市场担心,即时零售是否会再次掀起一场零售行业的内卷。 今年以来,美团多次表态要推动行业理性竞争,并在近期密集推出多项“反内卷”举措,如公开算法、开启骑手恳谈会改进配送规则、取消“超时扣款”、全面上线骑手“防疲劳机制”、投入10亿助力金补贴餐饮商家等。 即时零售本质上是一个与外卖相似的四方市场,美团希望不仅让消费者、商家和平台受益,也能让骑手受益。 此外,消化供给过剩带来的内卷不仅要有措施,还要合理疏导,“走出去”是一个更好的选择,美团也在积极探索海外市场。 新一轮调整后,美团还将重点拓展国际市场,向海外输出“即时零售”这一中国创新模式。小象超市的海外品牌Keemart出海首站定在沙特阿拉伯,覆盖AI Yasmin和Granada等区域。 Keemart将复用国内前置仓模式,但采用本地合作+前置仓的轻资产运营模式,借力美团外卖业务Keeta的骑手网络和用户基础,通过Keeta已有的基础降低冷启动成本,形成生态协同,近期测试完成后,将向其他地区扩展。 在零售行业中,多和快、好和省一直都是两对反义词,多就不能快,好就不能省。 美团凭借其在“快”方面的深厚护城河,长期占据优势,但也因此在品类丰富度和供应链深度上受到一定限制,毕竟高效的配送需要大量的资源投入和“重”资产运营。 但在即时零售这个新战场上,美团通过持续的投入、业务模式的调整与创新,正在努力克服这些固有矛盾,寻求一种在“丰富性、速度、品质与成本”之间的最优解。 这不仅标志着美团自身商业模式的进化,更深层地看,也为零售业如何更好地满足消费者不断升级的即时性、个性化需求,描绘了一幅更为清晰的未来图景。 封面来源丨网络
谁说拼多多非押注即时零售不可?
即时零售,不是拼多多战略布局中的必选项。 文 | 佘宗明 即时零售牌桌上不存在「三缺一」,可总有吃瓜群「媒」乐见即时零售战局像晋西北那样乱成一锅粥——他们俨然比拼多多更希望看到拼多多加入战团。 前两天,晚点LatePost披露,多多买菜正在上海等一线城市试验自建商品仓库、最快将于今年8 月上线即时配送服务。 这是多多买菜对既有履约时效优化动作的延续,拼多多方面对此的口径是「不能代表公司战略方向」「无意加入即时零售大战」。 饶是如此,许多人仍将其视作拼多多将在即时零售领域下一盘大棋的信号,渲染拼多多正「全面杀入即时零售万亿市场」。 但这可能是会错了意。我从接近拼多多的人士和拼多多合作伙伴处得知,拼多多并没有拿出之前在电商主站、百亿补贴、多多买菜(社区团购)、Temu(全球化)四场战役中的投入力度来应对即时零售,多多买菜推即时配送服务远未上升到「战略」层面——这跟美团、阿里、京东将即时零售提到战略高度有着明显区别。 不排除多多买菜有意将社区团购领域积累的生鲜供应链优势外溢以覆盖部分即时性需求,但这不等于拼多多就要对即时零售进行战略级押注。拼多多明确「不会涉足餐饮外卖」,且没有高调吆喝,就是佐证:要知道,餐饮外卖本是即时零售的最佳切口;高调是平台强化「万物皆可外卖」心智的必要手段。 那,拼多多该不该将即时零售作为发展棋盘中的战略落子? 如果是从电商行业看拼多多,被「再不入场就晚了」的追逐风口思维推着走,那答案当然是「该」。 可若是从拼多多看拼多多,从其自身优势特点出发,就免不了得思考一个问题:拼多多真有必要全面布局即时零售吗? 在我看来,即时零售不是拼多多战略布局中的必选项——哪怕很多人说即时零售是「零售业的下一个增长曲线」,拼多多也不必随风起舞。 01 首先,即时零售是某些平台激活组织活力的「手术刀」,但拼多多用不着。 京东推出外卖后又宣布进军酒旅市场;美团全面拓展闪购品类、重金加码小象超市、推动优选转型升级;阿里将饿了么、飞猪并入阿里中国电商事业群……近段时间以来,京东、美团、阿里接连祭出大动作,共同所指就是在即时零售上加码。 ▲晚点LatePost梳理了几家企业的商品供给、仓配、DAU情况。 结合三家企业的组织结构调整看不难发现,即时零售正成为它们架构重整的重要契机。 2023年12月,刘强东曾在内网反思京东「现在组织庞大臃肿低效」;前段时间,阿里离职员工发万字长文谈阿里病灶获马云回复,帖中说到阿里「战略不清」的问题……问题指向了大厂病,问题背后的问题则是战略迷失。 在此情形下,以新业务为锚点来校准发展战略、重塑组织活力,是很常见的做法。 阿里将本地生活服务跟淘系资源打通,以生态协同形成更强的综合作战能力,摆脱过往「大而全」架构带来的反应迟缓顽疾;京东推动仓储、配送、营销等多部门协同作战,避免条块分割的掣肘……都是有的放矢。 可以说,即时零售成了以新业务撬动旧痼疾解决、以外部竞争带动内部问题治理的切入点。 但以架构极简人效高闻名的拼多多,还不存在通过即时零售重构组织体系的紧迫性。 拼多多是个「科层味」没那么浓的企业,其组织管理模式被业界归结为「集权式扁平化管理」,决策链条短、响应速度快,擅长集中资源打「歼灭战」。 在现有架构可以支撑核心业务高效运转的背景下,拼多多以即时零售为引线来牵引组织架构调整的需求并没有那么急切。 02 其次,即时零售是大厂挖掘流量红利的「洛阳铲」,而拼多多有低流量成本优势。 几天前,刘强东在小范围分享会上曾说过:做餐饮外卖业务虽然亏钱,但40%的消费者会交叉购买电商产品,其投入比去抖音、腾讯买流量划算。 刘强东说的「高频打低频」模式——用亏钱的高频买卖(餐饮外卖)为低频高利润业务(酒旅、3C等)导流,正是美团阿里京东们布局即时零售的核心逻辑。 美团全面拓展闪购品类,实现从高频到低频的业务拓展;阿里跟京东将即时零售、电商、酒旅置于「大消费」的盘子里,推动流量多向转化……就是基于这点。 这里面,撬动流量杠杆、突破流量瓶颈,成了发力即时零售的重要目的。 而拼多多就凭着独特商业模式与强大流量聚合能力,在电商领域形成了显著的低成本流量优势。 从电商角度看,高性价比永远是最有效的流量获取秘诀。「多快好省」,用户总是在「省」和其他要素间寻求最优解。 拼多多就用卖家零佣金+超短链模式+供需两侧补贴等托起的「高性价比」特点加上拼团、砍价等「社交裂变」玩法,获得了大量免费流量。 时至今日,其用户的购物频次、停留时间、复购率都处于行业领先水平。 即时零售能提升用户活跃度是不假,但鉴于履约的高成本跟生鲜、日用品等核心品类的低毛利率倒挂,在流量池相对充裕的情况下,拼多多将资源用在优化现有流量的变现效率上,未尝不是更优选择。 03 更重要的是,即时零售瞄准的主要是一二线城市的「时间敏感型」消费者,很难覆盖众多的占总人口绝大多数的「价格敏感型」消费者——这正是拼多多的主要用户群体。 作为以即时配送体系为基础、以「线上下单,线下30分钟送达」为特征的高时效性到家消费业态,即时零售是应消费者「即买即得」的即时满足需求而生。 可履约成本占订单金额超20%的情况决定了,即时零售得建立在「高履约成本+高用户付费意愿」的基础上。它就像是零售领域的奢侈品,面向的主力客群是部分愿意为商品更快送达支付更高价格的高线城市消费者。 但需要看到的是,国内消费者的金字塔结构并未发生根本性变化,处在塔基的低线城市和农村地区消费者仍是「基本盘」。 现实就摆在那:在渐次完善的流通基础设施与社会履约体系将商品配送时效差距变为「半小时」跟「一两天」之别的当下,大多数消费者对「9.9包邮」的敏感度远超「半小时达」,「价格再便宜10%」对他们的吸引力高于「配送速度再快几小时」。 数据就显示,即时零售订单主要来自于一线新一线城市,在下沉市场的渗透率仍很低。 ▲图片由豆包AI生成。 事实上,阿里淘鲜达、京东秒送早就在即时零售上有布局,但此前进展缓慢。 晚点LatePost就将原因总结为:1小时送达当然比两天送达更好,但消费者通常并不愿意为此多花几十几百元,今天拼多多、淘宝下单,通常2-3天就能送到家,物流体验已经很好。经过几年投入,目前被验证的即时零售品类还是以生鲜、酒水、医药、鲜花等为主,并没有太多人买其他东西。「补贴结束后,即时零售到底能被多少消费者接受,还需要验证。」 从用户体验维度看,即时零售被视作「定义下一代购物体验」,很正常;但从整体需求层面看,即时零售兴起是不是「小众需求的出圈化」,仍待观察。 回归零售本质,零售总是围绕「多快好省」等维度展开。即时零售是对「快」的极端强化,但这不影响「省」依旧是更广泛的需求。 拼多多此前已凭借C2M模式压缩流通环节、用分布式供应链替代中心化仓储、以爆款逻辑提升单品规模效应,在「省」上建立了相对优势。 哈佛大学教授、「竞争战略之父」迈克尔·波特曾提出三种基本竞争战略:成本领先战略、差异化战略、集中化战略。 拼多多不需要抢占每个风口,在巨头们纷纷扎进即时零售深海之时,它可以延续昔日从电商板结化格局中杀出来的错位竞争打法,继续用性价比优势照拂大多数消费者对「省」的需求,而非用高履约成本去满足少数消费者对极致的「快」的需要。 04 在讨论拼多多是否该聚焦即时零售时,还有个不能忽视的维度是全球化。 即时零售,从国内看,属于增量拓展——它在满足「随时购物,即时收货」需求中做大了消费蛋糕;从外部看,仍是存量挖掘——平台免不了为抢夺用户而卷。 既然底层逻辑都是寻找新增量,那就不必将视线限于国内。跟高度依赖本地化资源与履约能力的「重资产」赛道即时零售比,全球化业务兴许对应着更广袤的市场。 过去几年里,多多跨境在海外市场异军突起,用户规模直逼亚马逊。截至2024年底,多多跨境已覆盖全球超过150个国家和地区,月活超2亿,年销售额突破100亿美元,这些都是其全球化拓展能力的最直观注解。 在全球化过程中,拼多多可以复用现有供应链管理、成本控制和精细化运营能力,用在国内跑通的「拼团+预售」玩法、直连工厂和C2M小单快反和模式适配海外市场,获得确定性回报。 尽管眼下「关税墙」横亘,但在「一带一路」与RCEP框架下,中国跨境电商仍有可待发掘的红利,多多跨境在「中国制造的全球化突围战」中依旧可扮演带头冲锋者角色。 对拼多多来说,在全球化拓展连着「星辰大海」图景的情况下,与其为了即时零售而削足适履、分散精力,不如继续将全球化放在更高的战略优先级,在优势点上做压强式投入。 毕竟,从终局思维看,重要的不是赢下即时零售战事,而是在新蓝海里找到新增量。 若是将即时零售看成二维世界的巨头必争之地,那全球化兴许就是三维世界的垦荒之所。即时零售是零售形态变革,将中国供应链效能输出全球则是另一种变革。 就此看,拼多多该做的是拼多多自己,而非另一个美团、阿里、京东——它可以保持战略定力、善用自身优势,走在自己的时区里,按自己的节奏来,而不是跟风趋时随大流。
阿里2025财年致股东信:聚焦 “用户为先、AI 驱动”,开启AI时代新征程
凤凰网科技讯 6月26日,阿里巴巴集团今日发布2025财年股东信,详述了过去一年以“用户为先,AI驱动”为核心战略的业务进展与未来规划。股东信显示,电商与“AI+云”已成为驱动集团增长的两大核心引擎。 在国内电商领域,淘天集团持续聚焦用户增长与体验提升,优化商家经营环境,致力于构建消费者、商家与平台三方共赢的生态,并观察到平台信任度与业务增长的同步提升。海外电商方面,受益于强劲的跨境业务表现,阿里国际数字商业集团收入保持快速增长,公司正加强重点市场的本地化供给,并对下一财年实现单季度整体盈利充满信心。 AI战略被阿里巴巴视为未来十年重塑行业的最大变量与核心驱动力。作为承载此战略的关键业务,阿里云在旺盛的AI需求推动下表现亮眼:公共云收入加速增长,AI相关产品收入连续七个季度实现三位数增长,全年收入达到两位数增幅。在大模型领域,阿里巴巴强调基础研究与创新,其通义Qwen3模型在多份全球权威评测中表现领先。截至2025年4月底,通义系列开源模型已超200款,全球下载量突破3亿次,衍生模型超10万个,成为全球最大的开源模型家族。 资本管理方面,阿里巴巴通过核心业务创造了强劲现金流,并通过提升经营效率使包括虎鲸文娱、高德在内的多项亏损业务逐步转向盈利。公司有序退出高奢零售、银泰百货等非核心资产以回笼资金,更聚焦于核心及AI领域投资。股东回报上,2025财年派发股息46亿美元,并回购了价值119亿美元的集团股份,使总股本净减少51%。 面向未来,阿里巴巴宣布将围绕AI战略核心,在三个领域加大投入:AI和云计算基础设施建设、AI基础模型与原生应用、现有业务的AI转型升级。尤为引人注目的是,公司承诺未来三年在云和AI硬件基础设施上的投入总额,将超过过去十年的总和。阿里巴巴认为自身在云计算市场(尤其中国及亚太)的地位,结合其AI技术积累,具备将“AI+云”打造成第二增长曲线的独特优势。股东信结尾强调,阿里巴巴将以“从零开始”的创业心态,迎接AI技术浪潮带来的全新机遇。
两大AI巨头接连胜诉 美法官:用书籍训练AI属“合理使用”
Meta 凤凰网科技讯 北京时间6月26日,据《金融时报》报道,美国联邦法院周三裁定,Meta利用数百万本书籍训练其AI模型属于“合理使用”,这对依赖受版权保护材料开发AI的科技公司而言是一场胜利。 该案由大约12名作者提起,包括塔-内希西·科茨(Ta-Nehisi Coates)和理查德·卡德雷(Richard Kadrey)。他们指控Meta在未经授权的情况下使用他们的书籍来训练其AI系统,侵犯了他们的版权。 旧金山联邦地区法官文斯·查布里亚(Vince Chhabria)裁定,Meta对这些作品的使用受到版权法中的“合理使用”条款保护。Meta辩称,这些作品被用于开发“变革性”技术,因此无论其获取方式如何,都属于合理使用。 合法吗? 本周一,AI公司Anthropic也赢得了一场版权诉讼。旧金山另一名联邦法官裁定,Anthropic在未经批准的情况下使用书籍来训练其AI系统的行为在美国版权法下是合法的。 Anthropic也胜诉了 Anthropic使用合法购买的实体书(经过拆分并手动扫描)来训练其Claude模型。法院裁定这属于“合理使用”。不过,法官补充说,关于Anthropic以数字方式对数百万本书籍进行盗版以训练AI模型的问题,还需要另行开庭审理。 然而,在Meta案件中,查布里亚法官表示,在“许多情况下”,未经授权使用受版权保护的作品来训练AI是非法的。 查布里亚法官表示:“这一裁决并不意味着Meta使用受版权保护的材料来训练其语言模型就是合法的。它仅表明原告提出的论点错误,没能提出有力的证据来支持其立场。” Meta发言人对此回应称,公司对法官的裁决表示赞赏,并称“合理使用”是构建“变革性”AI技术的重要法律框架。 截至发稿,原告作者的律师尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
AI Infra工程师们如何应对大模型流水线里的“暗涌”?
作者 | AICon 全球人工智能开发与应用大会 策划 | 罗燕珊 编辑 | 宇琪 Infra 虽然是看不见的“底座”,但它却承担着支撑整个大模型系统运行的重量。那么,Infra 工程师在日常工作中会遇到哪些真实需求与故障类型?开源 Infra 和国产卡适配训练推进过程中,又会遇到哪些难点和挑战呢? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了华为昇腾技术专家 ZOMI 酱、蚂蚁集团高级专家马介悦和 SGLang 核心开发者尹良升一起,在 AICon全球人工智能开发与应用大会2025 北京站即将召开之际,共同探讨大模型 Infra 工程师的实战日常。 部分精彩观点如下: 并行策略兼容性体现的是代码实现的耦合度挑战,而工程流水线管理则关乎功能开发全周期的资源分配与风险控制。 高效的工程化实践离不开强大的性能剖析和监控系统支持,仅靠人工排查效率低下。 充分利用异构硬件特性、实现跨类型资源的智能调度与混部,已成为 AI 基础设施演进的重要方向。 在 6 月 27-28 日将于北京举办的 AICon 全球人工智能开发与应用大会上,我们特别设置了 【 AI 基础设施与生态构建 】 专题。该专题将聚焦 AI 软硬件及生态系统的建设,讨论如何打造高效的 AI 开发与应用环境。 查看大会日程解锁更多精彩内容: https://aicon.infoq.cn/2025/beijing/schedule 以下内容基于直播速记整理,经 InfoQ 删减。 完整直播回放可查看:https://www.infoq.cn/video/kx2h235pHrE7fENMaxlH 大模型工程中的高频问题 ZOMI:你们应该都经常接到“线上告急”吧——比如训练挂了、推理跑不动……最近你们最常遇到的用户需求,或者说大家最常抱怨的问题是什么? 有没有一些“听得最多”的关键词? 马介悦: 根据我的经验,线上训练过程中会遇到各种问题,包括稳定性问题、业务算法或程序本身的缺陷,或者训练框架本身的问题。例如训练任务中断(“跑挂”)就很常见,特别是在千卡或万卡级别的大规模集群上。GPU 本身存在一定的错误率,对于一个万卡集群来说,每天出现不同的 GPU 故障几乎是必然的。 训练是一个同步过程,任何单卡故障都可能导致整个训练停滞或失败,因此这种现象很普遍。我近期专注于解决这类稳定性问题,早期遇到此类问题时,若缺乏自动化运维系统,只能依赖人工响应报警,由运维工程师手动重启相关任务。然而我们发现,即使重启任务,也常常会再次中断。这可能是硬件本身存在问题,或者由于集群涉及环节众多。 从宏观角度看,问题可能源自底层网络系统、交换机、光模块、计算节点本身,节点上的每块 GPU 都是一个潜在故障点,此外还包括内存、CPU 宕机等风险。例如,GPU 经常出现 ECC 错误,导致 CUDA 报错、进程退出。如果运维工程师无法准确定位故障机器,任务重启后运行一段时间很可能再次中断,这种情况令人非常困扰。 早期尝试过使用二分法等运维手段,或通过错误日志、带外管理(out-of-band)方法来定位故障机器,但当时的准确率不高。这可能导致误判,错误更换机器后任务重启仍会失败,问题非常棘手,以上主要涉及硬件或底层基础设施问题。 此外,对于“跑飞”,我理解为 loss 异常飙升,其成因更为复杂,可能源于算法本身缺陷、并行框架问题或数据错误等,排查需要 Infra 工程师与业务工程师协作,难度较大。还有其他类型的问题,例如任务启动后无法完成第一个训练步,这通常与业务代码相关。作为 Infra 工程师,我们也需要协助客户排查此类问题。常见原因包括 Python 使用不当、库引用错误、软件包版本冲突、环境配置问题或 CUDA 驱动故障等。 尹良升: 我们主要面向合作公司或科研机构提供代码和开源更新,协助他们实现最佳性能和最佳的可用性,而非直接接触真实的线上推理环境部署。因此,当高校、科研机构或公司在进行模型部署或大规模线下推理的工作流出现问题时,我们往往是首先接到反馈的一方。这种情况下,我听到最多的关键词主要来自两个方面。 第一方面是运行时错误。这类错误可能源于我们代码中未发现的 bug,也可能是用户在部署过程中的配置错误所致。例如,某些用户错误调整了 GPU 显存分配参数,便可能导致显存分配溢出(OOM)错误。此时,需要熟悉社区代码的工程师与一线部署人员深入沟通,精确定位问题代码行,分析是哪个配置参数设置不当,进而找到解决方案以消除部署时的运行时错误。 第二方面是性能问题。用户在部署时,即使使用相同的硬件卡和部署策略,也可能发现其性能无法匹配我们官方的测试报告,进而质疑报告数据的真实性或怀疑我们进行了选择性测试(cherry pick)。实际上,用户复现结果与官方数据存在差异的原因是多方面的。常见原因包括配置问题、软件版本差异,以及测试数据集未能完全一致地迁移到用户环境所导致的数据偏差。 此外,线上推理流程的各个环节出现问题也可能导致性能不符合预期。从接收请求(request)、首次预填充(prefill)到每个解码(decode)步骤,任一阶段的异常都可能引起延迟(latency)偏高。同样,分配给 KV cache 的内存(GPU memory)分配不足也会导致推理的批次(batch size)降低从而吞吐量(throughput)未达预期。解决这类问题,需要深入代码层面,具体分析问题环节,进行点对点的优化或配置修正。综合来看,性能问题和运行时错误确实是用户反馈中最常提及的两类紧急问题。 ZOMI: 我个人更关注训练环节。在昇腾工作期间,主要聚焦于服务大客户的推理集群。遇到的问题首先是如何应对训练任务中断。在万卡甚至十万卡级别的集群中,硬件故障不可避免,特别是在持续训练两个月的大型模型任务中。其次是如何处理损失函数异常飙升。这需要判断是不同硬件差异、算法本身缺陷、客户代码错误,还是分布式并行处理时出现了问题。因此,解决这些问题往往需要 Infra 团队与算法团队进行更紧密的合作。 ZOMI:如果把大模型的工程流程当作一条流水线,你们觉得哪一段最容易出问题?是资源调度、作业调优,还是并行策略不兼容? 尹良升: 针对并行策略不兼容的问题,我以 SGLang 社区上个月复现 DeepSeek Blog 的实践为例。我们采用了名为“Multi Token Prediction”(MTP,推测解码)的策略来有效降低 token 输出延迟。然而,在初始实现中,MTP 与包括“Data-Parallel Attention”(数据并行注意力机制)在内的多个功能存在兼容性问题。这种不兼容性通常并非源于策略设计本身,而是代码实现过程中的兼容性与解耦不足所致:为快速交付新功能,可能暂时忽略了与现有功能的兼容性。 实际部署中,往往需要同时启用 MTP、DP Attention、大规模张量并行(EP)等多项功能才能达到“满血版”最优性能。但实现功能间的完全兼容需经历代码重构与解耦过程,从初步实现到最终兼容存在较长的阵痛期。这既不可避免,也高度考验工程师的代码能力与全局设计观。 若从工程流水线角度讨论资源调度与作业调优,此处我理解为推理引擎的功能开发流程而非训练资源调度,核心在于新功能开发的科学管理。开发关键功能需经过充分调研与实验验证,一个功能最终合并到主分支往往涉及大量代码和严格测试。若验证表明功能未达预期效果,前期投入可能付诸东流。因此,流水线中需重点关注功能的前期可行性验证、开发阶段的合理规划以及最终测试策略的设计,这些环节是保障效率与质量的关键,也容易产生问题。并行策略兼容性体现的是代码实现的耦合度挑战,而工程流水线管理则关乎功能开发全周期的资源分配与风险控制。 ZOMI: 在版本迭代过程中,当 Roadmap 规划的新特性因算法演进需求必须上线时,常会遇到其与旧有算法或并行策略不兼容的情况。然而,新特性无法放弃,旧特性也不能直接移除。因此,确实需要经历多个版本的持续迭代与磨合,逐步排查和解决其中的细节问题与分支冲突,仅依赖 CI 流水线持续集成进行保障可能不够充分。我们的处理方式通常是:将冲突特性暂时分置于不同版本或允许独立启用,并在后续版本中进行整合维护。请问你们也是采用类似策略吗? 尹良升: 是的。这里可分为两种开发逻辑:一种是敏捷交付优先:确保每个新特性快速交付,同时保证不影响现有功能的正常启用。另一种是渐进式重构:若新功能并非紧急需求,且强行集成可能对现有代码造成较大破坏,则选择将该功能拆解为多个 PR,分步骤进行重构。确保每个中间步骤都保持代码库的完整可用状态,最终通过最后一个 PR 实现新功能与旧特性的完全兼容。具体采用哪种方式,需根据功能需求的紧迫性以及不同方案的实现难度综合评估。 马介悦: 工程化可分为研发流程与部署上线两方面。研发环节,如代码开发、功能交付与传统系统软件开发差异不大,都依赖严格的代码审查、门禁(gatekeeping)、自动化测试和用例覆盖。核心在于门禁流水线的设计,例如每个 PR 合并前必须通过完整的门禁流水线测试。但关键挑战在于性能“门禁”常受资源限制:线上可能使用万卡规模训练,但 CI 流水线通常仅能在 8 卡或更小规模运行,导致许多大规模问题在 PR 阶段无法暴露。对此,目前尚无完美解决方案,只能在问题于线上大规模复现后由工程师介入处理。 另一个研发痛点是:若单次版本更新包含过多新功能,一旦导致机器浮点运算利用率(MFU)下降,难以定位具体是哪个 PR 引入的问题。目前主要依赖二分法或逐版本回退测试来排查,工程师间的代码审查在此环节至关重要。此外,研发和线上环节都需重视性能剖析(profiling)——即便小规模无法复现问题,也应记录火焰图和时间线,为后续分析 MFU 退化提供依据,帮助诊断并行切分是否合理。 关于部署上线,其流程基于云原生:首先通过 Kubernetes 以 Pod 形式分配资源;随后由 DLRover 启动训练,并在训练前执行预检和组网检测,确保硬件无故障、环境无异常、通信(如 NCCL)连接正常。预检通过后,训练主导权移交至框架。训练中核心监控指标是 MFU,它反映集群算力利用率。MFU 下降通常意味着并行切分(如 TP/EP/PP/DP)策略存在问题,导致计算流中出现等待“bubble”,这需在研发阶段通过大量实验优化模型切分策略。 MFU 下降也可能由稳定性问题引发,例如训练卡死(hang)。卡死成因复杂,硬件、算法、框架均可能,且硬件问题有时不会触发进程报错退出,仅表现为指标异常。虽然业界已有多种检测卡死的方法,如通过业务指标、metrics 或 DLRover 的 xprof timer 等性能剖析工具,但定位卡死的根本原因比检测现象更困难。若有强大的底层基础设施团队能快速识别并驱逐故障机,问题较易解决;否则需综合日志、metrics 和性能剖析数据进行深度诊断。 类似问题还包括“straggler”场景:训练步耗时逐渐增加。监测到该现象相对简单,但定位根因(硬件、网络、数据集或切分策略问题)则需复杂的综合判断逻辑。 综上,高效的工程化实践离不开强大的性能剖析和监控系统支持,仅靠人工排查效率低下。常用工具包括 PyTorch Profiler、GPU 监控系统、各公司自研监控组件,以及 DLRover 的 xprof timer 等。其核心是记录底层 CUDA 算子执行时间、Python 进程调用栈等信息,生成时间线和火焰图,为 SRE 和研发人员提供关键的排障依据。 推理部署如何 “压榨每一分显存”? ZOMI:现在大家都在卷“大模型低成本”,你们觉得在哪些环节最有“优化价值”?是推理时的缓存策略?训练时的容错调度? 尹良升: 我认为当前降低大模型成本是行业共识。从推理部署角度看,随着大模型普及,其使用量将激增,最终会像可随时调用的 API 一样融入生活。因此,将大模型的推理成本压至最低至关重要。 从推理角度降低大模型成本,我认为主要有三个方面。首先,今年 3 月 DeepSeek 官方博客展示了其通过大规模卡群部署及 PD 分离节点策略,成功将 API 价格压至前所未有的低点。这启示我们,从系统层面看,特定的部署方式能有效降低成本。例如,采用稀疏 MoE 架构时,每次推理仅激活少量参数。若使用大量专家并行,等效于单卡承载的模型权重显著减少。这带来一个直观优势:模型权重在卡间分布更稀疏且未大量复制,因此占用显存减少,释放出的显存便可容纳更大的 KV 缓存,是大模型推理降成本的核心直觉之一。 它引出的关键点在于:模型架构设计需与最终上线部署进行联合设计。在模型设计或训练阶段就需考虑未来推理性能,例如设计更多专家数并利用其架构特性,如 MoE 天然适合数据并行,因其不同专家的权重可直接存于不同 GPU 上。这种前期与后期的协同设计,可能是实现大模型成本持续下降最重要且基础的一步。 其次,在推理时的缓存策略方面,当前普遍做法是将每轮对话后的 KV 缓存转储至 CPU 内存或文件系统,因为非 GPU 内存相对廉价且可视为资源富余。因此,如何高效加载 KV 缓存、设计显存到内存间 KV 缓存的驱逐策略,涉及内存管理与多级缓存管理策略,仍有优化空间。在多轮对话场景下,用户可能间隔数十秒才复用 KV 缓存;但在 Agent 工作流中,触发由既定逻辑或者工作流控制,其 KV 缓存的驱逐策略便截然不同。针对特定工作流定制调度策略,包括 KV 缓存的驱逐与重加载,是当前热门研究方向,也是降低推理成本的重要途径。 第三点涉及如何提高 GPU 的极限利用率。当前主要依赖 GPU 计算,若 CPU 资源管理不当,会阻塞 GPU 运行,导致 GPU 出现空闲,无法时刻满载。这源于推理流设计或实现上的缺陷,引入了不必要的同步。解决此问题需要工程与算法的协同优化,例如 DeepSeek 采用“双批次重叠”策略,将计算与通信阶段错开以掩盖通信开销并提升 GPU 利用率。又如 SGLang 框架,通过 Overlap Scheduling,延迟 token 调度完全隐藏了 CPU 开销。这些都是提升资源利用率、压榨 GPU 推理性能的关键创新点。 第三点核心在于优化调度开销。传统流程(调度批次 ->启动内核 ->执行计算)中,调度和启动内核作为 CPU 密集型任务易阻塞后续流程。SGLang 中的 Overlap Scheduling 重新设计工作流,允许 GPU 执行当前批次时,CPU 并行准备下一批次,消除 CPU 准备阶段的 GPU 闲置。虽然这提升了 GPU 利用效率,但也面临兼容性挑战,如与 MTP 的整合,这正是功能迭代中不可避免的“阵痛期”。 马介悦: 我想从硬件角度再谈一点:英伟达 GPU 的领先很大程度上得益于其 NVLink/NVSwitch 机制,它极大提升了单机节点内的 GPU 通信效率。相比之下,跨节点通信,无论使用 InfiniBand 还是 RoCE,其性能较 NVSwitch 存在约一个数量级的差距。 因此,提升性价比的关键在于:将大量节点整合到大型机柜内。这不仅能节省交换机等模块的成本(虽然 GPU 仍是训练集群的主要成本,但网络成本占比已不容忽视),更重要的是,通过 NVLink 的“拉远”互联技术,能够将跨节点通信带宽提升至接近节点内水平。传统架构中,节点内走高速 NVLink,节点间走相对低速的 InfiniBand/RoCE,存在性能降级。大型机柜方案则通过统一的总线级互联技术消除这一断层,显著提升整体并行性能。我们的实践也验证了这一点:仅更换为类似 Cloud Matrix 的硬件架构,实测性能提升便非常可观。 所以,成本优化不仅关乎价格,更需关注性价比,即同等模型 MFU 下的单位成本。大型集成硬件初期投入可能更高,但如果能大幅提升 MFU,其长期效益仍是显著的。 开源项目背后的挑战: 写代码之外的难题 ZOMI:两位都是在做 Infra 开源项目,你们觉得除了写代码之外,最难的是什么? 是社区运营?用户反馈?还是版本节奏管理? 马介悦:DLRover 自 2023 年开源以来,我们的目标是将其发展为更庞大的社区,吸引更多伙伴参与。就个人体会而言,这需要平衡公司繁重工作与社区投入,唯有对开源的热爱才能兼顾二者。 DLRover 最初定位为容错系统,在 PyTorch 生态基础上强化了对作业任务管理、资源调度、容错及弹性优化能力。后续我们进一步集成了更多训练框架相关组件,包括自研的训练框架抽象层,以及基于 CUDA 算子与 Python 构建的性能剖析工具。 当前主要挑战在于项目刚加入基金会,如何有效运营技术监督委员会,并在国内外提升影响力。这需要从零开始,投入大量精力进行线上线下推广及交流活动。随着社区日益活跃、参与者增多,我们将把舞台让给新加入的成员,使其在项目中发挥作用,而我们则转向幕后提供支持。总结而言,运营开源社区是辛苦的工作,唯有依靠对开源的热爱方能持续投入。 尹良升: 开源的本质是“众人拾柴火焰高”,开源项目的核心在于其开放性:代码应被更多人使用,同时我们应始终欢迎潜在开发者贡献力量,共同改进代码。以 SGLang 社区为例,其从开源起步,如今已成为全球部署规模最大的推理引擎。最关键的挑战在于:如何在项目维护者与社区用户之间构建良性循环——用户信任社区并提供反馈,社区则吸纳更多构建者,驱动版本迭代与项目进化。这种良性互动超越了纯粹的工程能力,是开源项目可持续发展的核心难点,也是其保持活力、长盛不衰的基础。 ZOMI: 在华为负责 Mind 系列开源组件的经历让我深有感触。起初仅开源了 MindSpore Core,但面临一个普遍认知:华为开源项目仅支持昇腾硬件,且易用性不足。打造一个如 SGLang 或 vLLM 般成功的开源项目极具挑战,其难度远超代码本身,涉及社区运营、用户反馈机制等复杂因素。 观众:现在有很多 GPU 共享和虚拟化方案,这块的技术趋势是怎样的呢? 马介悦: 关于 GPU 虚拟化,我只能浅谈一二,因其高度依赖厂商支持。例如英伟达的 MIG(Multi-Instance GPU)技术需要其官方提供。在 MIG 出现前,GPU 虚拟化相当繁琐,存在多种实现层面。最基础的是软件层面虚拟化:通过 Hook CUDA 调用,追踪 kernel 发起速率、执行时间等信息,并基于此实现简单的复用策略。此类方案通常需对接 CUDA Forward-Compatibility Runtime。 但软件虚拟化与 CPU 硬件辅助虚拟化(如 Intel VT-x/AMD-V)的成熟度尚有差距。硬件层面的支持更深入,AMD 早期在云渲染时代已提供相关虚拟化能力(主要服务于虚拟机场景),但当前大模型训练领域采用 AMD GPU 的案例极少,故暂不展开讨论。 在英伟达生态中,MIG 是较成熟的方案。它基于 SR-IOV(Single Root I/O Virtualization)技术实现设备级虚拟化,本质是将物理 GPU 划分为多个虚拟实例(呈现为独立的 PCIe 设备),可同时供给容器或虚拟机使用。虚拟化的核心价值(性能、隔离性、安全性)在 SR-IOV 这一成熟技术框架下均可较好实现,只要厂商遵循规范支持即可。用户更关心的可能是具体配置细节,例如每块 MIG 实例可分配的 SM 算力比例等资源配额——这与网卡等设备的虚拟化配置思路类似,期待厂商提供更灵活的管控能力。 ZOMI: 早期,不同厂商的 GPU 集群通常独立部署,实现异构融合极具挑战性,众多国家级项目也面临困难。然而,随着技术演进,特别是推理环节预填充与解码分离架构的成熟,异构部署的可行性显著提升。计算需求的分化是关键:预填充阶段依赖高算力芯片,而解码阶段更看重显存容量与高效的 KV 缓存管理能力,这使得为不同阶段匹配最优硬件成为可能。这一趋势正加速渗透至微调、后训练乃至训练环节。例如在增量学习场景中,高频次推理任务与单次训练任务对资源的差异化需求,为高效的资源共享与分割创造了条件。此外,CPU 与 GPU 的混合部署技术也日益成熟。综合来看,充分利用异构硬件特性、实现跨类型资源的智能调度与混部,已成为 AI 基础设施演进的重要方向。 观众:尹老师选择 SGLang 而非 vLLM 的原因是什么? 尹良升: 因为当前开源社区热度较高的推理引擎,除了半开源的 TensorRT,便是 SGLang 和 vLLM。首先,开源项目的进步离不开竞争与相互学习,这种良性互动带来危机感,推动整个社区共同前进。TensorRT、SGLang、vLLM 以及 lmdeploy 等社区目前正处于协同并进的状态。 至于用户选择 SGLang 而非 vLLM 的理由,这更多是见仁见智的问题。从 SGLang 的 0.1 到最近的 0.4 版本,我们与 vLLM 在功能交付上各有侧重。我们的设计理念存在根本差异:例如,从初始版本至今,SGLang 始终围绕“GPU 显存前缀共享(prefix share)”为核心进行优化,再到后续实现的“零开销调度器(Zero Overhead Scheduler)”。这些独特设计使我们在特定场景下可能具备性能优势。同时,我们社区的开发风格是笃定解决用户的核心痛点——例如近期版本支持 DeepSeek 的大规模张量并行,目标直指降低用户部署的过高成本。 用户的选择自由毋庸置疑,但如果需要给出一个选择 SGLang 的理由,可能是我们在某些方面能提供更低的部署成本或更友好的上手体验。这本质上是用户与开源社区建立信任的过程。我们也鼓励大家尝试不同引擎,积极反馈使用体验,这将帮助我们持续交付新功能,共同推动推理成本优化。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。