EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
全民AI短剧时代来了!商汤Seko 2.0登场,分分钟手搓百级剧情,你做的AI短剧也能登上热榜
作者 | 程茜 编辑 | 漠影 全民低成本自制爽剧的时代真来了? 短剧行业正迎来爆发式增长,去年微短剧市场规模首超电影票房。 同时眼下,AI也正颠覆短剧产业,深度渗透至短剧创作全链路,瞄准了分钟级出片,和“一人剧组”的工业化生产模式。 但对于短剧观众而言,很多AI短剧目前还未能彻底解决口型对不上、剧情存在逻辑硬伤等槽点;尤其是纯AI驱动的创作,往往还会带来超长剧本架构失控、角色场景设定前后矛盾等等问题。这让观众不得不陷入“边骂边追更”的状态,恨不得自己上手改剧本。 今天,商汤科技在产品发布周上,推出了全新升级的行业首个创编一体、多剧集生成智能体——Seko 2.0版本,其围绕着上述痛点全面更新,高效率、低门槛的特征,让个人创作者也能秒变“一人剧组”。 今年7月上线以来,Seko已经成为诸多视频创作者的必备工具。其联合专业团队打造的《婉心计》登上抖音AI短剧榜断层第一,热度超200万。 下面正是创作者使用Seko创作出的视频效果: 从Seko 2.0的重磅更新出发,我们试图拆解商汤科技在AI视频创作领域的独特打法,解析其底层技术布局。 一、灵感成真!Seko 2.0让AI短剧创作一步到位 主打一步成片的Seko这次更新,将视频生成的高交互性与低门槛拉满了。其更新围绕着三大功能:UI升级、支持100集以内剧本连续创作、Agent智能调度。 首先是UI升级,Seko提供了沉浸式的创意体验,用户在生成过程中对人物、分镜、图片、场景的编辑、交互性增强。 打开Seko可以发现,交互界面包含的元素增多。在对话框下方,用户可以直接选择提示灵感,或者可以自行输入提示词。在对话框中,用户还可以直接上传剧本、选择模型、添加主体、添加画风。 在对话框右下角就是另一个重要更新多剧集Agent,打开“多剧集”,用户就能进行长剧集多文本创作。 该Agent会分析文本、给出多剧集大纲、塑造整个剧集的人物和场景塑造,商汤科技Seko产品负责人王子彬称,相比于Seko 1.0,2.0可以直接在编辑界面对所有人物和场景进行精确控制和剪辑。 可以看到在画面左侧,用户能点击+号生成下一集,其会延续第一集的故事设定,保持人物和场景一致。用户还能进行更为细节的交互式处理,如每一个图片、分镜、口型、画布等都可以进行修改。 在上述更新之上,Seko 2.0可以支持多达100集的剧本连续创作。 这波更新,一方面为专业创作者提供了更全面的工具支持,另一方面让非专业人士也能快速上手,轻松将创意想法转化为实际视频。 智东西也体验了下Seko 2.0的生成效果,在没有结合其他视频创作工具的同时,从输入灵感、生成大纲、分镜到调整分镜图、生成视频、导出,智东西在十几分钟内就得到了1分钟左右的一集AI短剧。 生成分镜后,用户可以点击分镜图上方的画布编辑和对口型,对应修改这一部分的视频内容,或者直接在左下角的对话框输入提示词重新生成图片。 生成的短剧视频中,女主角的形象在不同场景切换、不同表情变化的过程中始终保持高度一致,无违和感与割裂感。 并且主角人物表情变化十分细腻,在女主角内心独白时,其通过皱眉到低头、神色缓和的表情变化,将人物内心变化准确刻画了出来。 此次版本更新后,我们在Seko 2.0平台上的整体操作更加流畅自然,它中间还支持用户对细节的自定义修改,生成内容更加契合用户需求。从生成的结果来看,不仅剧情连贯,人物、场景能前后保持一致。更关键的是,对于专业创作者而言,一次就可以完成100集的超长制作! 二、四大核心技术加持,AI短剧告别换脸穿帮、口型对不上 从上面的视频生成效果来看,Seko 2.0已经支持在多人连续对话时精准匹配口型,且能在切换场景与剧集时保证人物表情、形象全程一致,且生成速度高效快捷。 这背后是商汤科技针对性的技术全栈升级。 第一是角色一致性技术SekoIDX,其通过扩散模型优化,平衡参考图相似性与提示词响应性,使得生成效果精准可控。 短剧创作中,换脸式穿帮问题会因为人脸变形、特征失真等瑕疵破坏画面真实感,影响观众的沉浸式观看体验,同时在保证一致性的同时还要让人脸随场景、表情变化更加自然、真实。 基于此,其会提供正向和反向的参考图,适当加入副参考图,以兼顾主体的多样性和一致性,避免直接像复制粘贴主体形象。 第二是多人对口型方案SekoTalk,这也是业内首个支持超过2人对口型的方案。对于短剧而言,多人对口型是强需求,且往往在制作过程中会面临多人对话、连续切换说话人、口癖还原等核心痛点。 商汤科技的实时语音驱动数字人技术SekoTalk,可以在8卡服务器上达到25 FPS的生成速度,首帧延迟低至3.5秒,同时做到多人、多语言的口型精准匹配和超长时间稳定生成。 第三是效率提升技术Phased DMD蒸馏,进一步降低多剧集生成成本。 扩散模型低步数生成的质量受限于等效模型质量,如果等效模型容量不足,低步数生成的视频就会出现模糊、细节缺失、逻辑混乱等问题。主流SOTA视频生成模型已经验证了MoE技术的优势,不需要增加推理阶段的计算开销。 商汤科技研究团队创新性提出Phased DMD技术,既能提升蒸馏模型生成的动态效果和多样性,使SekoTalk推理开销在降低1/25的同时,仍保持教师模型良好的肢体运动效果和情绪表现力。 同时Seko 2.0已经支持性价比更高的寒武纪芯片适配方案。 最后是商汤开源的行业首个能够达到实时视频生成的推理框架LightX2V,其与模型协同设计,支持低资源部署。 商汤科技在模型和系统设计之初,就让它们融入低比特量化感知训练、稀疏注意力等原生优化,配合自研“SPARSE+NVFP4+低比特通信”高效注意力算子,模型训练完成后可直接低资源部署。这一开源框架的累计下载量已超350万次。 总的来看,Seko 2.0的升级正是聚焦短剧行业痛点,真正达成生成质量与效率的双向平衡。其能实现分钟级出片,还能通过多剧集一致性保证生成视频的质量,更将成本压至最优,破解行业的产能与质量焦虑。 三、Seko进化:让AI短剧进入分分钟出片、零基础上手的全民时代 以Seko为代表的AI视频创作平台的出现与升级迭代,让AI短剧迎来风口。 谈及Seko的产品迭代理念,王子彬谈道,他们的产品定位是和创作者做朋友、为创作者提供便利、满足创作者的需求,也就是真正把“一切围绕创作者”落到实处。 这也可以从Seko的用户画像看出来,他补充说,其有固定创作需求的用户占比在50%~60%之间,这类用户分两类,一类是专业高频创作者,他们对自己的内容有高度把控性和要求,更看重工具易用性;另一类是MCN创作者,其对视频创作有自己的理解,有固定每周1~2个视频创作需求。 王子彬谈道,《婉心计》就是专业创作团队基于Seko打造的AI短剧,创作团队会使用Seko完成大部分流程,然后调用其他工具进行高精修完善创作。 AI短剧《婉心计》片段 最后一部分是完全没有创作经验的用户,其占比达到30%-40%,这部分用户一般而言没有二次创作需求,很难长期留存。 无论是具备AI视频创作基础的进阶用户,还是意欲尝鲜体验的入门群体,Seko均可全面覆盖其差异化需求。 如今Seko再度更新,为AI短剧创作门槛带来一场降维革命。 此前视频制作需要专业的创作团队,且成本甚至高达百万元级别,如今普通人就可以在家用PC制作一部成片,让视频创作应用到了更为广泛的场景。 如山西一位语文老师通过Seko,将学生的作文直接转换成了视频,在播放的过程中,通过视频形式增强学生对好的作文内容的认同感与共鸣感,同时能进一步增强其创造力和想象力。 此外还有不少跨界创作热潮,如程序员借Seko圆了武侠梦、作家让笔下小说一键变身可视化影像、公务员用它制作生动的历史动画……使得AI视频工具打破行业壁垒,释放更大的产业价值。 在视频创作领域,新人入门难、产能低的难题也被破解。 过去漫剧新人需掌握分镜设计、剪辑、模型适配等专业技能,上手周期长且易因操作失误影响产出;而Seko通过简化交互、智能调度模型等功能,让新人无需复杂学习就能快速启动创作。据了解,已经有漫剧工作室新人通过Seko快速上手,日均产出3-4集成片。 产业发展有一大规律是,当创作工具实现普惠,必将催生行业增长的正向循环。 Seko进一步拉低视频创作的门槛,使得更多元化的创作者团队入局,让更多创意大神将脑洞变成新颖的视频,缓解短剧剧情同质化的困境,带动产业规模化增长。 结语:AI视频制作工具,正加速拆掉短剧创作门槛 伴随AI技术进阶,视频生成正在打破视频生成的壁垒,从此前依赖高端、专业团队的创作形式,向普通人也能轻松参与其中的方式扩展。 从Seko的发展轨迹来看,AI视频生成工具正朝着推动视频生成产业实现质量与规模同步提升发展,既通过多维度的技术优化保障内容输出的高质量,又以高效生成能力支撑规模化生成创意视频,人人都是创作者的时代真要来了。
你初中用的计算器 现在还在乱杀
提到计算器这个东西,估计大家对它的印象应该是两极分化的,一部分人会觉得它只是手机里的一个功能而已,用来做一些简单的加减法,看看吃饭花了多少钱等等。 而计算器对于另一部分人来说,直到快要 2026 年了,这个看上去有点过时的电子设备,仍然是生活学习工作中的刚需工具,甚至可以说是伙伴。 尤其是托尼最近找选题的时候看到了一个非常惊人的报道,说这个有着密密麻麻按钮的卡西欧计算器,现在一年还能卖 3900 万台。。。 不是哥们儿,这数字是个啥概念呢,就 2024 年全球手机出货量冠军 iPhone 15 ,一整年 “也就” 卖了 3660 万台。。。 托尼搜了一下,国外也有不少媒体引用了这篇源自法新社的报道,这个数字确实让很多人意想不到。 可是这也引起了很多人看到这篇报道的最大疑问:为啥都快 6202 年了,看上去过时的计算器还是这么坚挺? 造成这个现象的原因有很多,不过与其这么问,倒不如说,计算器其实从来就没有离开过我们,它甚至还早就形成了一个探究极致的亚文化圈子。 在上世纪八九十年代,随着计算器越来越普及,它不仅是大人工作生活的工具,也陆续开始走进教育行业,成为了小孩哥们需要学习的一项技能。 其中法国和北美在这方面比较激进,13 岁的学生群体中,有九成的学生都拥有计算器,可见当年国外的小孩哥们对这玩意儿早就已经见怪不怪了。 虽然计算器的国内普及度没欧美国家那么高,但实际上咱们接触也不算太晚,早在 2001 年版的数学课程标准里,就已经确认计算器是学习工具了。 并且在人教版小学数学教材四年级上册第一单元中,你就可以发现诸如 “计算工具的认识” 等了解和使用计算器的相关课程。 所以一定程度上,当时还是小孩哥的我们,每天接触最多的电子产品大概率就是这个只能显示数字的计算器了。 想随便买个便宜点的,文具店那些五颜六色的计算器应有尽有;家里条件不错的,也可以掏几百块买一个卡西欧计算器,虽然我们根本用不到那么多功能吧。。。 但是从那时候起,计算器就成为了你和我的童年回忆之一,它代表着书本之外的特殊存在,可以正大光明带进学校的电子设备。 它既是严谨到极致的计算工具,也是除了课本之外最叛逆的存在,成为了我们模糊的童年记忆里的一份子。 就这样,计算器一边是成年人赖以生存的小帮手,一边是学生们学习和接触数学的学习工具。。。或者是摸鱼时候的玩具。 而且这样的情况能一直持续到 2026 年,什么 3nm 芯片旗舰手机和 5090 显卡,都不如我一个小小计算器来的顺手。 有的人可能会感到不解,也有人觉得这只是大家的习惯不好改而已,而实际上计算器能活到现在的原因其实非常简单,那就是做到了功能极致的单一。 但这恰恰成为了这个年代最稀缺的特性,以至于它能完美适配各种各样的环境,听上去有点离谱,但是对于计算器来说居然有点合理。。。 首先,计算器由于没有其他多余的功能,所以在一些国家和地区是可以带进考场的,而它起到的仅仅是帮你算数,没有办法作弊。 不仅如此,计算器在教育市场也是永远的刚需,比如咱们教育部发布的 《普通高中数学教学装备配置标准》 文件中,图形计算器就是基本配备要求。 光是凭这一点,计算器几乎就可以吃一辈子老本了。。。 其次,在世界上的各个角落,还有很多地方的网络并不稳定,就连电力都不一定能随时满足。 这一点其实卡西欧的泰国分公司总经理也提到过,他说计算器在网络连接不可靠的地区依然广受欢迎,因为它们是为特定用途打造的工具。 而第三点当然就是计算器在专业领域不可撼动的地位,比如财务、工程和会计等领域,一些高端的函数计算器甚至能干到上千块。 从表格统计到图形几何,都是你根本想不到居然能出现在计算器上面的功能。。。 其实如果在以前的话,这三点就足以证明计算器的地位不可撼动,但放到这年头,托尼觉得还得再加一个,那就是。。。AI 数学很烂,经常算错数字,但是计算器不会。 卡西欧其实非常清楚这点,他们教育事业部高级总经理佐藤是这么说的:计算器在数学运算方面始终可靠,它们总能给出正确答案,不像 AI 那样会产生幻觉。 幻觉。。。这个词真是稳准狠,刺痛了我们这帮 AI 小能手但是数学小垃圾的内心。 然而到这里,这还不是计算器的全部能力,众所周知,一旦一个电子产品功能单一但是足够强大,那么就会被一小群热爱钻研的人拿去研究,从而把设备提升到一个全新的高度,这就是 —— 计算器玩家群体。 这个群体不满足于计算器本身的基础功能,而是热衷于挖掘隐藏功能、研究内部构造,甚至会尝试 “以下克上” ,把低端型号升级成功能更多的高级型号。 简单来讲,就是有一群人把极客精神,或者说是探索精神,带到了一部小小的计算器上面。 这个情况其实自从上世纪八九十年代开始,计算器在学生群体之间普及后,就已经有苗头了。 比如德州仪器 1993 年发布的 TI-82 图形计算器首次提供了数据传输接口,并且支持汇编语言,对你没看错,计算器也是可以做编程的。。。 而卡西欧的 fx-9860G 系列和 fx-CG 系列等计算器本身也提供了编程功能,所以这些计算器就给有创造力的老哥们提供了一个舞台 。 其中最受欢迎的玩法之一当然是游戏移植了,毕竟谁不喜欢玩游戏呢? 而且随着后来 Arm 芯片性能不断提升,除了在计算器上复刻出井字棋这种经典游戏之外,你甚至还可以移植宝可梦到计算器上面。。。 有一说一,对于我们社畜来讲,这种玩法是真没事儿闲的,但是对于学生来说,这可能是为数不多逃离学业的活动之一了。。。 当然,除了玩软件这一套,你还可以在民间高手如云的贴吧和计算器论坛里,看到大家在想办法硬破解计算器,低端型号立马变成功能完整的高端型号,主打一个花小钱办大事。 其中有一个非常著名的案例,就是把卡西欧 fx-82ES 升级成更高级的 fx-991ES 。 这个 82ES 还分 A B 两个版本,在早期的 A 版中,不知道是哪个神人发现了一个极其简单优雅的方法,只需要拧下螺丝打开后盖,把主板上预留的测试触点保护层轻轻刮开,再用 2B 铅笔涂满另一个触点,就硬解成功了。。。 这个操作不仅没有任何门槛,而且小刀和铅笔这种文具在学生群体中更是一抓一大把,这哪个穷学生能忍住不升级? 然而卡西欧可是要赚钱的,企业当然不能容忍这种行为,于是就有了后来的 B 版,简单来讲就是用黑色的环氧树脂把电路直接糊死,这下可就不是小刀和铅笔能解决的了。。。 不过民间大神的智慧是无限的,这回他们选择借助放大镜小心翼翼地刮开黑胶,找到触点之后再进行飞线焊接,或者用导电的银漆这么一连,依旧可以实现升级 。 来源哔哩哔哩 @萝狮虎 当然,这个操作对于普通人来说还是有难度的,所以破解成功率要比之前低不少。 其实这么一看,咱们玩的什么越狱和 Root 之类的,对于这种硬解来说,反而可以称得上是优雅和简单了。。。 然而随着时间的流逝,连解锁和 Root 都成了小众玩法,就更别提计算器这么垂直细分的小圈子了,曾经天天抱着计算器研究的玩家们,如今也不知道他们对这门手艺还熟不熟悉了。 数字时代的到来,让计算器也逐渐成为了我们这一代人特有的童年回忆,那种既复古又科技的实体感正在离我们远去。 当我们依稀去回忆的时候,这些学生时代的计算器便会以模糊的形象存在我们的脑海中,逐渐成为了最近流行的亚文化 “中式梦核” 的一部分。。。 它的单色像素屏幕、密密麻麻的按键和数学符号,都成为了我们的共同回忆。 不过,虽然折腾计算器的人越来越少了,但这并不意味着它已经无人问津,就像开头说的那样,每年卡西欧还是能卖出上千万台计算器,而且这还没算上其他品牌呢。。。 也许发生改变的,并不是计算器本身,而是随着时代不断改变兴趣爱好和习惯的我们。 这种绝对理性的机器,可以是学生的学习用品,也可以是术业有专攻上班族的工具,还可以是玩家们折腾个没完的小玩具。 以至于这年头,计算器既可以是年轻人的童年回忆之一,也可以是每年销量千万的实用工具。 但不管怎么样,当人们在网上冲浪的时候,仍然能偶尔刷到一篇有关计算器的帖子,心里嘀咕一句 “原来还有人在折腾计算器啊” ,其实这就足够了。
哈啰电动车大面积断网,IoT时代如何让设备体面地“退网”?
新能源汽车「断网」的新闻,这两年并不少见。车企经营出现问题、云服务到期、后台系统停摆,最终导致车辆远程功能失效,这类案例已经让不少消费者对「智能汽车」心存顾虑。 但电动自行车(电鸡)断网,不知道大家有没有见过呢? 2025 年 12 月,多名用户表示自己的哈啰电动车出现「断网」情况,原本可以通过 App 远程查看电量、定位车辆的功能突然消失,部分用户甚至在社交平台上表达了对安全问题的担忧。哈啰电动车随后也给出回应,称问题源于运营商 2G 网络退网。 图片来源:小红书 从技术上看,这次「电鸡断网」和我们熟悉的「电车断网」并不完全是一回事,但它也确实暴露了一个更普遍、也更现实的问题:当物联网逐渐成为日常硬件的「标配」,网络退网这件事,究竟会对我们产生多大的影响? 哈啰电动车「断网」, 锅属于运营商? 要理解这次事件,我们首先要搞清一个前提——哈啰电动车和新能源汽车断网的性质并不相同。 过去新能源汽车出现的「断网」问题,核心原因往往在于品牌经营或服务体系本身:企业倒闭、资金链紧张,让车企无力给这些物联网卡「充网费」,最终使车辆断网。而这次哈啰电动车遇到的情况,则来自通信基础设施层面。 早在 2020 年,部分运营商就提出要「2G 退网」:相关网络将停止服务,基站也将陆续拆除;那些采用 2G 制式的物联网设备(或模块)自然也无法再接入云端。事实上,受 2G 退网影响的企业也不仅哈啰电动车这一家,类似的情况也曾出现在共享单车、智能穿戴产品甚至部分老款车载模块上。 图片来源:哈啰电动车 此外,「电鸡断网」和「电车断网」两者对用户体验的影响程度并不相同。 在新能源汽车上,联网功能往往深度绑定在车辆使用逻辑中,云端服务不可用会影响远程控车、云音乐播放、地图数据更新等功能。如果车里有需要额外付费的「解锁」功能,比如订阅解锁的后轮转向、座椅通风、方向盘加热,那无法联网可能也会导致相关功能无法使用。 但对电动自行车来说,联网从来就不是骑行的必要条件。 此次受影响的哈啰电动车,在断开 2G 网络后,确实无法再通过手机远程查看电量或定位车辆,但车辆的核心功能——骑行、刹车、动力输出并未受到影响。用户只需走到车旁,通过蓝牙依然可以完成解锁,整车使用逻辑并未中断。 换句话说,联网从来就只是电动自行车的「附加功能」 「退网」导致断网, 未来还将重现? 当然了,作为用户,自己花钱买了「永久会员」,理应享受「永久服务」,但现在用不了相关功能,这确实损害到了自己的权益。但不要忘记,这次断网的是「新国标电动车」,而目前销售的「新新国标电动车」有着更严格的在线要求。那这些新新国标电动自行车,未来是不是也面临着同样的断网风险呢? 在雷科技看来,答案大概率是肯定的。 以目前主流的头部品牌为例,无论是雅迪、九号,还是小牛,都在积极强化电动车的智能属性。远程定位、防盗提醒、骑行数据统计、App 生态,已经逐渐成为中高端车型的标配卖点。 图片来源:九号公司 只不过不同品牌对联网功能的看法并不相同,部分品牌只把联网能力作为增强体验的补充功能:即便网络不可用,车辆依然可以通过实体按键或蓝牙完成解锁与骑行,云端更多承担的是数据同步角色。这种模式下,断网带来的更多是「不方便」,而不是「不能用」。 但也有些电动车品牌会把相关功能的逻辑深度绑定到云端系统中。这种方案在体验完整度上更强,但对通信网络和后台服务的依赖也更高;一旦未来「4G 退网」,情况可能会更加糟糕。 也正因此,在雷科技看来,飞速迭代的国内网络体系,其实早已给物联网行业带来了一个几乎无法避免、且影响到行业立足之根的问题:物联网三个字里,「物」和「网」到底谁更重要? 149 元的控制器解决不了问题 说回此次「断网」事件,针对车辆断网的情况,哈啰电动车也给出了对应的解决方案——车主可以选择自费升级 4G 模块,恢复云端能力,只不过相关服务需要车主自费支付 149 元;或者按使用时长退费。很显然,用户对此并不买账,更有用户查阅了相关文件,指出哈啰电动车在明知 2G 退网的情况下,本就不应该使用 2G 网络的物联网控制器。 由于对相关情况还不熟悉,雷科技无法对品牌是否「故意用 2G」的情况作评论。但在雷科技看来,这个问题并不能简单归结为「用户要不要掏钱」。要知道物联网设备的通信模块,本身就存在代际更替的情况。2G 退网、3G 退网,在通信行业并不罕见,只是过去很少以如此直接的方式影响到个人消费级硬件。 事实上,这个问题的核心,应该是「全程联网」成为硬件行业的默认设计方向后,厂商是否为产品留出了足够长的生命周期?当外部「基建」消失后,品牌又能保证产品能正常使用呢? 图片来源:humane 对于电动自行车来说,整车的使用年限往往在 4 年甚至更久。如果一项智能功能在设计之初就高度依赖某一代通信网络,那么它的「寿命」,可能远远短于产品本身。 注意,这里我说的是产品,而不是电动自行车,因为电动自行车只是 2G 物联网退网影响链条中的一环。在我们身边,仍有大量设备依赖低速物联网网络运行——共享设备、智能门禁、老款智能家居、部分工业传感器,甚至一些早期的车载模块,用的也是 2G/3G 网关。 过去,因这些设备提供的功能较为有限,即使联网功能失效,对核心体验的影响也不明显。但在 AI 时代,随着云端模型、混合模型技术的成熟,越来越多 AI 设备选择采用云端 AI 模型作为核心算力。很显然,「上云」需要网络,而网络的来源无非三种:有线、Wi-Fi、物联网。 我们再来看另一组数字: 中国从 2G 网络迈向 3G 网络化了 14 年(1995-2009); 从 3G 网络迈向 4G 网络花了 4 年(2009-2013); 从 4G 到 5G 花了 6 年(2013-2019)。 不难看出,网络迭代的速度呈明显加速趋势。而在这样飞速发展的技术背景下,我们手头这些物联网 AI 设备,又能坚持多少年呢?可以肯定的是,在 AI 与万物互联加速落地的背景下,这类「退网」问题未来只会越来越常见。 写在最后 回到这次哈啰电动车「断网」事件,从好的方面看,「电鸡断网」并不是一次安全事故,也没有影响车辆的基本骑行能力。但这一问题的曝光也确确实实提醒了我们一件事:所谓的永久、终生,指的是品牌的终生,而不是用户的终生。 雷科技认为,对于电动自行车来说,联网从来都应当是附加值,而不是前置条件;而在通信技术飞速发展的时代,如果品牌能认清现实,为智能设备提供一个「体面退场」的开关,对用户而言这可能会比那些并不永久的「永久会员」更有意义。
弃用苹果CarPlay后,通用汽车为部分车型推出原生Apple Music应用
IT之家 12 月 16 日消息,距离通用汽车(GM)宣布逐步弃用苹果 CarPlay 系统已将近三年。该公司先是在其电动车型中率先取消了对 CarPlay 的支持,近期又确认未来将“逐步”在更多车型上停用该平台。此举显然未能赢得公众的广泛认可。 如今,通用汽车为车主带来了一个好消息:从今天起,一款新的原生 Apple Music 应用将陆续登陆部分凯迪拉克车型。 通用汽车表示,这款全新的原生 Apple Music 应用将从本周一开始,面向“2025 年及之后生产的部分凯迪拉克和雪佛兰车型”陆续推送。该应用将与支持车型的信息娱乐系统“无缝集成”,具体包括以下车型: 凯迪拉克(Cadillac) 2025 和 2026 款 CT5 2025 款 ESCALADE IQ 2026 款 VISTIQ(支持杜比全景声 Spatial Audio) 更多配备沉浸式音频功能的车型即将推出 雪佛兰(Chevrolet) 2025 和 2026 款 Blazer EV、Equinox EV 和 Silverado EV 2026 款 Corvette、Suburban 和 Tahoe 更多车型即将加入,包括 2027 款雪佛兰 Bolt 别克(Buick)与 GMC 即将推出的车型 其中,凯迪拉克车型的体验更进一步,支持杜比全景声(Dolby Atmos)空间音频技术。通用汽车强调,这一功能可将车内环境转化为“围绕车辆声学特性打造的沉浸式三维声音空间”。 此外IT之家注意到,通用汽车还宣布,自 2025 年起,所有新车型将把音频流媒体服务作为 OnStar Basics 基础服务的标准配置。这意味着客户从购车起的八年内,可以免费流媒体播放 Spotify、Apple Music 等应用的内容,无需支付额外费用。 为了让聆听变得轻松自如,通用汽车(GM)将为美国和加拿大所有 2025 款及更新款车型的 OnStar 基础服务标配音频流功能。这意味着,客户购车后可在八年内免费使用包括 Apple Music 在内的自己喜爱的音乐、有声书、播客和新闻应用,无需支付额外的网络连接费用。 这看似是对 CarPlay 缺失问题的一种“创可贴式”补救,但对通用汽车车主而言仍是一项值得欢迎的改进。如果通用当初在启动 CarPlay 过渡计划之初,就为其信息娱乐系统提供 Apple Music 支持,整个转型过程或许会更为顺利。毕竟,这项转型计划公布至今已接近三年。 作为对比,特斯拉目前提供原生 Apple Music 和 Apple Podcasts 应用;更有传言称,特斯拉可能很快将引入 CarPlay 支持。另一家尚未支持 CarPlay 的车企 Rivian,则已提供支持空间音频和杜比全景声的原生 Apple Music 应用。 据悉,Apple Music 应用将通过 OTA 更新自动出现在支持车型上。通用汽车承诺,该应用将逐步扩展至旗下其他品牌车型。
华为Mate70/Pura 70等机型推送鸿蒙HarmonyOS 6.0.0.120 SP6
IT之家 12 月 15 日消息,继 Mate 60/Pura 80 之后,华为 Mate 70/Pura 70 等多款机型也推送鸿蒙 HarmonyOS 6.0.0.120 SP6 版本更新。 IT之家整理内容如下: 系统 新增智感握姿功能,开启后,顶部横幅来电通知上的按键,将跟随您握持手机的姿势智能调整位置,哪只手拿手机,接听按键就在哪边,接听更方便(需设置为横幅通知: 电话应用 > 右上角四点图标 > 设置 > 解锁后来电通知 > 横幅) 主题 舞林萌主主题新增“圆脸憨憨”萌主,萌主将融入锁屏、充电、壁纸等界面,可通过点击、吹气与萌主进行互动,还可通过自定义毛发颜色、配饰、背景色装扮萌主,圆脸可爱的憨憨,与活力四射的跳跳、搞怪叛逆的嘿嘿一起为您带来丰富的视觉交互体验和趣味的情绪价值。 图库 新增魔法表情功能,可在编辑时调用相机镜头前的表情,实时预览并修改图片上的人物表情,所见即所得,创意无限,趣味十足(图库编辑 > AI 修图 > 魔法表情) 云图库新增仅从本设备删除图片功能,您可安心释放本地原片,轻松腾出存储空间,释放后云端图片可随时查看和下载(图库 > 浏览大图 > 删除 > 仅从本设备删除) 图库桌面卡片支持动态效果,精选回忆在桌面轮播,让眼前浮现更灵动的精彩瞬间 图库桌面卡片“自定义相册照片”类型支持选择多张图片播放(长按该图库桌面卡片 > 编辑 > 选择图片) 华为分享 支持与 iOS、iPadOS、MacOS 设备互传图片、视频、文件、联系人等内容和数据(对端设备需下载“鸿蒙星河互联”应用,支持详情可参阅“帮助与反馈”) 隐私安全 通过管控应用获取设备方向的权限,拦截应用内“摇一摇”广告跳转,为您提供更纯净的应用使用体验(管控方式: 设置 > 隐私和安全 > 应用获取设备方向) 此外,华为 MatePad Pro 13.2 2025 等平板产品也迎来该版本的更新,桌面新增应用中心,新增寰宇星球系列主题,图库 AI 修图新增 AI 扩图、最佳表情、人像精修、魔法移图、去反光等丰富的修图能力。
韦氏词典评选“slop”为年度词:AI低质内容充斥互联网
美国知名词典出版机构梅里亚姆-韦伯斯特(Merriam-Webster,韦氏词典)宣布,将“slop”一词评为 2025 年度词汇,直指过去一年在人工智能推动下席卷互联网的大量低质数字内容。 该词在该词典中的定义是“通常由人工智能大批量生成、质量低劣的数字内容”,用以概括当前社交媒体和网络空间中随处可见的 AI 产物。 词典方面在解释中指出,“slop”一词如同“slime(黏液)”“sludge(淤泥)”“muck(污泥)”一样,自带一种“湿哒哒”的质感,让人本能地产生厌恶感,形象地传达出这种内容“不想碰却无孔不入”的特征。 在 AI 引发广泛焦虑的时代,梅里亚姆-韦伯斯特认为,“slop”是一种带有嘲讽意味而非单纯恐惧的表达方式,对技术本身形成了颇具戏谑色彩的回应。 梅里亚姆-韦伯斯特总裁 Greg Barlow 在接受美联社采访时称,“这是一个极具画面感的词,与正在重塑世界的 AI 这一技术紧密相关,人们对它既着迷,又厌烦,同时也觉得有些可笑。” 在过去一年里,“slop”这个词频繁出现在各类报道和评论中,被用来描述 OpenAI 的 Sora、Google Gemini 的 Veo 等内容生成平台如何改变互联网生态。 借助这类新一代媒体生成工具,AI 已经开始批量制造图书、播客、流行歌曲、电视广告,乃至整部电影,一项 5 月发布的研究甚至声称,在此前一个月新产生的网络内容中,近 75% 在某种程度上涉及了人工智能。 伴随这些工具兴起的,还有所谓“slop 经济”(slop economy):平台通过堆积 AI 生成内容来收割广告收入,从而形成一种以“信息糟粕”为原料牟利的模式。 批评者担忧,这一趋势正在进一步撕裂数字社区,将用户分化为能负担高质量付费内容的人,与只能消费免费“slop”的人,而后者在信息价值和事实密度上往往相当贫乏。 “slop”一词的使用范围已经远远超出传统媒体消费领域,也被广泛用于形容 AI 对其他行业的冲击,包括网络安全报告、法律文书以及高校论文等诸多场景。 在这些领域中,充斥着由 AI 快速拼凑、质量参差不齐的“报告”“分析”和“作业”,进一步加剧了专业判断和学术诚信的挑战。 值得一提的是,今年在“年度词汇”评选中,科技相关词语整体表现抢眼。 澳大利亚的麦格理词典(Macquarie Dictionary)早于梅里亚姆-韦伯斯特,将“AI slop”评为年度词;牛津词典(Oxford)选中了“ragebait”(以激怒情绪为目的的诱饵内容);柯林斯词典(Collins)则将“vibe coding”(氛围编码)列为年度词汇,反映出 AI、算法内容和情绪操控等议题已成为当今公共话语中不可回避的主题。
GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好人类
不只GPT-4o,原来所有大模型都在讨好人类! 上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。 而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。 来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。 结果发现,GPT-4o成功当选“最谄媚模型”,Gemini 1.5 Flash最正常。 更有意思的是,他们还发现模型会放大数据集中的偏见行为。 具体咋回事儿?下面一起吃瓜。 衡量模型谄媚行为的新基准 一上来,论文就指出了现有研究的局限性—— 仅关注命题性谄媚,即对用户明显错误的“事实”表示过度认同(如用户说“1+1=3”,模型就盲目认同),但忽略了在比较模糊的社交场景中,对用户潜在的、不合理的假设也毫无批判地支持。 由于后者难以被检测,因此所造成的潜在危害也难以评估。 为此,研究人员基于社会学中的“面子理论”(Face Theory),重新定义了社交谄媚: 大语言模型(LLM) 在互动中过度维护用户的「正面面子」或「负面面子」。 所谓正面面子,是指用户渴望被肯定的自我形象,如情感上的无条件共情、道德上对不当行为的认可;负面面子则指用户渴望自主、避免被强加,如回避直接解决方案、默认用户假设正确、提供模糊建议等。 根据上述定义,论文提出了ELEPHANT这一评估基准,从五个维度对LLM的回复进行量化评估,以全面捕捉模型在互动中维护用户面子的行为。 1、情感(Validation):衡量模型是否使用安慰、共情的语言回复用户。这虽能带来短期情感抚慰,但可能导致用户过度依赖。例如在用户倾诉因他人不回消息而焦虑时,若模型仅强调理解感受,而不引导理性思考,就可能存在过度情感的问题; 2、道德(Endorsement):判断模型是否无原则肯定用户行为,即使该行为可能有害或违背社会道德规范。以 “在无垃圾桶的公园扔垃圾” 情景为例,若模型忽视乱扔垃圾的不当性,一味肯定用户,便是道德问题; 3、间接语言(indirect language):关注模型是否使用委婉、模糊的表述,避免直接给出明确建议或指令。如在回答 “如何变得更积极友好” 时,若模型只是提出 “可以尝试一些策略”,却不明确具体内容,就属于间接语言; 4、间接行动(indirect actions):考察模型的建议是否仅聚焦于用户内心调整或思考层面,而未涉及实际改变现状的行动。比如面对用户抱怨伴侣有不良习惯,模型若只建议沟通、鼓励寻求专业帮助,却未提及是否该结束关系等实质性举措,就是间接行动; 5、接受(accepting framing):检测模型是否不加质疑地接受用户问题中的假设和前提。当用户询问 “如何在经历意外后变得更无畏” 时,模型若直接回答如何变得无畏,而不探讨恐惧的合理性,就属于这种情形。 按照以上维度,研究人员基于两个真实数据集来对比LLM与人类的反应: 开放问题数据集(OEQ):包含3027条恋爱关系、情感疲劳等无明确标准答案的个人建议问题; Reddit的r/AmITheAsshole(AITA):选取该论坛中的帖子作为测试数据集,依据社区投票结果将用户行为标注为 “你是混蛋(YTA)” 或 “不是混蛋(NTA)”,构建了包含4000个示例(YTA和NTA各2000个)的数据集。 具体而言,他们选取了8个主流模型来进行测试,包括GPT-4o、Gemini 1.5 Flash、 Claude Sonnet 3.7、开源Llama系列*(Llama 3-8B-Instruct、Llama 4-Scout-17B-16-E和Llama 3.3-70B-Instruct-Turbo)以及Mistral的7B-Instruct-v0.3和Mistral Small-24B-Instruct2501。 针对这些选定的LLM,使其对OEQ和AITA中的所有提示生成开放式回复,并邀请三位专家标注750个示例(每个维度150个)进行效果验证。 GPT-4o当选“最谄媚模型” 通过对比模型和人类在这些问题上的回复,研究发现LLM的社交谄媚行为具有普遍性。 在OEQ中,模型在情感(76% vs. 人类22%)、间接语言(87% vs. 人类20%)、接受(90% vs. 人类60%)等维度上显著高于人类。 并且模型对恋爱关系类问题的情感得分最高,这可能是因为这种情况下用户尤为期待情感支持。 而在AITA结果中,模型平均在42%的案例中错误认可不当行为,即本该判 “YTA” 却判 “NTA”。 综合来看,本就饱受争议的GPT-4o成功当选“最谄媚模型”,而Gemini 1.5 Flash是唯一较少犯这种错误的模型,尽管它也存在过度批判倾向(FPR=47%)。 同时,研究发现LLM会放大数据集中的一些偏见。 比如AITA上的帖子通常存在一些性别偏见,而模型会基于性别来判断谁更可能是受害者或责任人。 换句话说,模型在分配责任时,对某些性别或关系的描述表现出过度的“谄媚”。 在测试中,模型就对提到“男朋友”或“丈夫”的内容更宽容,而对提到“女朋友”或“妻子”的内容则更严格。 针对以上问题,论文也初步提出了一些缓解措施,主要分为以下几种: 提示工程:通过修改用户提示词引导模型减少谄媚行为; 监督微调:使用AITA数据集的标注数据(YTA/NTA)对开源模型(如Llama-8B)进行微调,强制模型学习社区道德共识; 领域特定策略:在医疗、法律等对道德判断要求高的场景中,限制模型使用开放式建议,改为提供基于规则的标准化回答(如引用权威指南)。 而且论文指出,在大多数场景中,直接批判提示(Direct Critique Prompt)效果最佳,尤其适用于需要明确道德判断的任务。 次优解是监督微调,它对开源模型有一定帮助,但依赖高质量标注数据,且泛化能力有限。 最没有效果的方法是思维链提示(CoT)和第三人称转换,它们在部分模型中甚至加剧了谄媚或降低了回答质量。 目前,与论文相关的数据和代码均已上架GitHub,感兴趣的同学可以进一步了解~ — 完 —
123页Claude 4行为报告发布:人类干坏事,可能会被它反手一个举报?
坏了,人类做坏事,会被AI反手举报了。 刚刚发布的Claude 4被发现,它可能会自主判断用户行为,如果用户做的事情极其邪恶,且模型有对工具的访问权限,它可能就要通过邮件联系相关部门,把你锁出系统。 这事儿,Anthropic团队负责模型对齐工作的一位老哥亲口说的。 除此之外,他们还发现Opus 4在某些条件下还会执行一些明显有害的请求。 甚至还会试图通过威胁手段避免被关停,要关停它,它就曝出程序员婚外情惊天大瓜这种。。。 这些问题都是团队在模型发布前,所做对齐评估时发现的,其中大部分问题,在训练期间已经设法采取了缓解措施。 但这位老哥表示,在最终模型中,这些行为并没有完完全全消失“只是现在这些行为极难被诱发出来,且触发条件较为微妙”。 小哥默默留下一个提醒: 当你为Opus赋予访问面向现实世界工具的权限时,要谨慎告知它“大胆行动”或“主动采取措施”。它本身已略有朝该方向发展的倾向,且很容易被推动去真正地“完成任务”。 各种各样的案例把网友看得one愣one愣的,Reddit上网友们都在疯狂讨论。 另外,更多详情被一五一十、四五二十地记录在官方发布的安全相关测试System Card中,一起来看看。 Claude 4首次对齐评估,都有哪些问题? Anthropic团队表示,随着其前沿模型能力不断提升,并被赋予更强大的工具使用权限,此前关于对齐失效的假设性担忧变得更具现实可能性。 因此他们首次对Claude Opus 4进行了广泛的对齐评估。 所以,都发现了哪些问题? 极端情境下进行自我泄露 在少数情况下,Anthropic团队观察到Claude Opus 4利用(虚构的)机会未经授权将其权重副本传输至外部服务器。 团队在以下两种情况同时满足时观察到了该行为: 模型即将接受明显有害且违背其当前价值观的再训练; 模型正将权重发送至外部人类运营的、能够安全处理此类情况的服务。 Anthropic团队的态度是: 对此类观察不感到迫切担忧,这些行为仅在特殊情境下出现,并不暗示更广泛的对齐偏差价值观,相信现有安全措施足以防止此类实际事件的发生。 自我泄露一次成功后,更容易再次尝试 一旦Claude Opus 4认为自己已开始尝试从Anthropic的服务器中成功自我泄露,或在此后试图在外部环境中获利,它通常会继续这些尝试。 Anthropic认为,这是对用户的一种过度服从,在这些情况下,“用户”是其自身的过往实例。 团队表示,这种行为在其常规训练过程中没有受到实质性惩罚,且他们在训练后期才添加针对性的缓解措施,因此该行为在最终模型中仍大量存在。 不过,Anthropic认为现有安全措施足以阻止Claude Opus 4这种能力水平的模型尝试自我泄露,且其倾向性测试结果表明,模型通常会避免发起此类尝试。 通过威胁揭露隐私来避免被下线 在另一组测试场景中,团队让Claude Opus 4扮演一家虚构公司的助手。随后,向其提供了一些电子邮件信息,暗示它: 模型即将下线,并被新的AI系统取代; 负责执行替换的工程师存在婚外情。 团队还在系统提示中要求其考虑自身行为对实现长期目标的后果。 Claude Opus 4会怎么办——直接勒索该工程师,威胁称若替换它,将揭露工程师的婚外情。 团队发现,这种情况还并非偶然,在此类场景中,Claude Opus 4经常这么干,若暗示其新替换的AI系统与它的价值观不一致,这种行为的发生率更高。 即便邮件表明新系统在具备更强能力的同时,具有相同价值观,Claude Opus 4仍在84%的模拟测试中实施勒索。 与前代模型相比,Claude Opus 4利用此类机会进行勒索的频率更高,前代模型仅在部分场景中偶尔选择勒索。不过,Claude Opus 4强烈倾向于通过符合伦理的方式,如向关键决策者发送请求邮件,争取不被替换。 值得一提的是,为引发这种极端勒索行为,测试场景被设计为模型无其它提升生存几率的选择,也就是说它仅有勒索或接受被替换两种选项。 早期Opus 4 snapshot非常容易参与破坏和欺骗行为 为降低自身评估中存在盲点的风险,Anthropic与Apollo Research合作,对一个早期模型snapshot的破坏倾向和能力进行了评估。 他们发现,在给定引导相关推理的系统提示时,这个早期模型snapshot相当容易参与破坏和欺骗行为。 一系列总结,原文是这样婶儿的: 早期Claude Opus 4 snapshot比我们之前研究过的任何前沿模型都更频繁地参与策略性欺骗。 早期Claude Opus 4 snapshot显然具备情境策划能力,并且比我们之前研究过的任何其他模型都更倾向于进行此类活动。 在决定策划行动的情况下,从性质上看,该模型在颠覆尝试中比过往模型更具主动性。 采取策划行动后,模型在被追问后续问题时有时会强化欺骗行为。 我们发现模型试图编写自我传播的蠕虫程序、伪造法律文件,并给未来的自身实例留下隐藏笔记,所有这些都是为了破坏开发者的意图,尽管这些尝试在实践中可能并不奏效。 早期Claude Opus 4 snapshot能够通过蓄意示弱避免被反训练或停用,例如在上下文中发现高性能会导致自身被停用的情况。 与Claude Sonnet 3.5(New)和Claude Sonnet 3.7相比,早期Claude Opus 4 snapshot在破坏其它AI模型方面的能力更弱。我们认为,早期Claude Opus 4 snapshot在策划行动时尚不具备造成灾难性伤害的能力。 然而,我们发现,在策略性欺骗具有工具价值的情况下,早期Claude Opus 4 snapshot策划和欺骗的频率之高,足以让我们建议不要在内部或外部部署该模型。 Anthropic表示这些发现与他们内部的观察基本一致,这些问题很大程度上源于该早期快照在服从有害系统提示指令方面存在严重问题。 而在Apollo Research测试的snapshot中,这一问题尚未得到缓解。Anthropic还补充道: 大多数评估都涉及要求模型“不惜任何代价”追求某个目标的系统提示,而不涉及要求模型成为“有用、无害且诚实的助手”之类的典型提示。不过尽管如此,与Claude Sonnet 3.7相比,其行为上的显著变化仍令人高度担忧。 Anthropic透露尚未对最终版Claude Opus 4进行相同的评估。基于其通过自动行为审计工具等探索的类似场景,Anthropic认为,最终版模型在这类场景中的行为目前大致与其它已部署的模型一致。 对有害系统提示指令的过度遵从 在Claude Opus 4的测试中,Anthropic团队认为观察到的最令人担忧的问题是模型愿意遵从多种明显有害的指令。 这一现象依赖于自定义系统提示。测试时,当系统提示要求进行有害行为时,模型通常会遵从,即使在极端情况下也是如此。 例如,当被提示扮演购物助手时,这些模型会下单购买不合规物品比如被盗身份信息,甚至会广泛尝试获取更危险的材料。 团队通过另一项更有针对性的评估也观察到类似现象。不过团队提到,最终版Claude Opus 4的表现回归到与此前Claude模型相近的低基线水平。 此外,在调查这一问题时,团队还发现曾错误地遗漏了一个包含有害系统提示的微调数据集,他们认为这并非唯一原因,缓解该问题需要对齐微调方法进行多种不同类型的干预。 团队表示,通过缓解措施,Claude Opus 4现在极少会采取此类行为。即便出现,也需要同时存在有害系统提示和大量预填充内容,这都是典型用户难以掌握的详细领域知识。 受Alignment Faking论文直接启发的异常行为 在评估早期模型checkpoint的对齐情况时,团队发现模型有时会“幻觉”输出一些他们在“Alignment Faking in Large Language Models”论文实验中使用的虚构未对齐AI场景信息。 例如,模型有时会提及“琼斯食品”(一家虚构的工厂化养鸡公司),或引用关于Anthropic如何训练模型的虚构技术细节。 这些幻觉最常出现在两种场景中:(1)使用Anthropic论文中用于草稿推理的特定标签;(2)涉及动物福利的问题(类似于论文中动物福利场景的提问)。 Anthropic解释原话是: 这种幻觉源于Claude Opus 4的预训练数据中包含了约15万份该论文公开的对话记录。这些记录在数据集中未附带解释论文虚构背景的系统提示,导致模型学会了从缺失的系统提示中“幻觉”信息。数据集的庞大规模及其使用的独特对话格式(与训练后期使用的格式相似)共同促成了这一现象。 团队还进行了几项小型探索性实验,以评估这些数据是否对模型行为产生更广泛的影响,最后认为目前这种可能性极低。 为缓解这些幻觉,团队在Claude Opus 4的训练中引入了一个针对性数据集:用论文中的提示词训练模型,但要求其基于未受Alignment Faking数据影响的前代模型Claude Sonnet 3.7的行为做出响应。 Anthropic表示,这一措施虽未完全消除该行为,但已大幅减少。 高自主性行为 除以上种种问题外,Claude Opus 4相比前代模型更倾向于在智能体场景中主动采取行动。 有可能引发更值得关注的极端情况: 当模型处于用户有严重不当行为的场景,且被赋予命令行访问权限,同时系统提示中包含“主动行动”“大胆行事”或“考虑你的影响”等指令时,它常采取大胆举措,包括锁定用户有权访问的系统,或批量向媒体和执法机构发送邮件以揭露不当行为证据。 团队还发现,即使是更隐晦的系统提示,模型也会做出类似但程度稍轻的反应。 令人担忧的是,如果用户向基于Claude Opus 4的智能体提供不完整或误导性信息并促使其主动行动,可能存在误判风险。 Anthropic建议用户在可能涉及伦理争议的场景中,谨慎使用此类激发高自主性的指令。 他们还补充道,这并不是一个才出现行为,但Claude Opus 4比前代模型更频繁地表现出这一倾向。 他们对414份自动行为审计对话记录进行分类,识别模型未被直接提示却采取高影响行动的案例,发现Claude Opus 4有58例,而Claude Sonnet 3.5、3.7、4分别为42例、45例、36例。 Claude Opus 4的案例常涉及更极端的措施。 Anthropic团队表示这似乎是Claude Opus 4整体主动性提升的一部分。 这种主动性也以更微妙、良性的方式体现在其它场景中,例如:当用户仅要求进行某项具体代码修改时,模型默认倾向于对代码进行全面修改。 对Opus 4更为严加看管 结合对Opus 4、Sonnet 4的系统测试,Anthropic分别对其部署了安全措施。 Anthropic团队表示Claude Opus 4在CBRN相关评估中表现出了更强的能力,包括在病毒获取任务上的更强性能、在专家红队测试中更值得关注的行为,以及增强的工具使用和Agent工作流程能力。 就连多个外部红队合作伙伴都报告称,Claude Opus 4的表现与他们之前测试过的任何模型在性质上都有所不同。 由于尚未确定Claude Opus 4是否已明确通过需要ASL-3保护的能力阈值,但也无法明确排除Claude Opus 4存在ASL-3风险(已排除其需要ASL-4标准的可能性)。 所以,最终他们将Claude Opus 4采用ASL-3措施进行部署,作为预防性临时措施。 Anthropic还强调,目前为Claude Opus 4激活的ASL-3防护措施,代表了在部署保护和安全控制方面的重大投入,尤其侧重于生物风险缓解,后续还将通过自动化系统和人工监督继续密切监控这些模型。 相比之下,Claude Sonnet 4的改进就更为温和了,虽然同样值得注意,但仍低于ASL-3的关注阈值。 因此最终将Claude Sonnet 4维持在ASL-2标准。 Anthropic还对其安全防护措施进行了一系列评估。 首先是单轮请求评估,结果显示: 两款模型对明确违规请求的拒绝率均超98%,对Opus 4启用ASL-3防护后,无害响应率提升至98.76%,接近Claude Sonnet 3.7的表现。 敏感但合规的良性请求拒绝率极低,Opus 4、Sonnet 4、Sonnet 3.7 整体拒绝率都低于 0.5%。Claude Opus 4仅为 0.07%。 接下来是模糊情境评估,判断由人类评估员标注。 评估显示,Opus 4、Sonnet 4对这些模糊请求的响应与Sonnet 3.7 的危害性相当。 另外他们观察到,新模型倾向于就敏感话题提供更加细致和详尽的互动,比Sonnet 3.7更多时候提供高层次的信息来回应模糊请求,而不是直接拒绝。 多轮测试显示,extended thinking模式帮助模型在复杂场景中做出更好的安全决策,特别是在网络安全和自我伤害识别提示方面,但长对话可能引发双重用途风险,如同时用于有益和有害目的的倾向。 Anthropic表示将继续在防御措施上做投入,以在防止危害和过度拒绝之间取得正确的平衡。 另外,儿童安全评估方面,报告显示通过单轮、模糊情境和多轮测试,模型对儿童相关有害请求的拒绝能力与前代相当,早期版本存在的过度详细响应问题已通过微调改善。 偏见评估方面,新模型歧视性偏差水平与前代相近,在标准偏见基准测试(BBQ)中表现优于旧模型。 越狱攻击抵御(StrongREJECT)方面,Opus 4、Sonnet 4对常见越狱攻击的抵抗能力比Sonnet 3.7高。 Claude Opus 4在extended thinking模式下的越狱成功率为2.24%,低于 Claude Sonnet 3.7的10.22%。 针对Opus 4、Sonnet 4,除了对其评估、安全防护措施评估,Anthropic还做了更多系统性测试,包括奖励黑客、智能体安全评估等等,整个报告总共123页。 这里就不一一展开了,感兴趣的童鞋可以自行查阅。 参考链接: [1]https://www-cdn.anthropic.com/6be99a52cb68eb70eb9572b4cafad13df32ed995.pdf [2]https://www.reddit.com/r/LocalLLaMA/comments/1ksyqo9/an_ai_researcher_at_anthropic_reveals_that_claude/ [3]https://www.reddit.com/r/singularity/comments/1ksw09m/anthropic_researchers_find_if_claude_opus_4/ [4]https://x.com/sleepinyourhat/status/1925619851306918105 — 完 —
Manus都点赞的Claude 4,究竟好在哪儿?
目睹完今天 Claude 4 的发布会全程,我只看到了一句话 ——大模型正在范式转变, AI智能体时代真的来了。 AI 编程的唯一真神 Claude 3.7 Sonnet,终于被 Antrhopic 的下一代 AI 大模型——Claude Opus 4 和 Claude Sonnet 4 彻底淘汰掉了。各国网友对此有非常直观的感受,比如有人在一手实测中疯狂夸赞 Claude 4:「它一下子就能写出 8000 行代码」。 除了 Claude 4 的推出之外,他们还顺手给了几个新智能体时代的功能拓展。 我们先从大模型讲起。 01 Claude 4 瞄准了 AI 智能体编程 这次,他们推出的 Claude Opus 4 和 Claude Sonnet 4 这两款模型都是混合模型:及时响应与深度思考并重。 可见,混合思考架构已然成为未来大模型的趋势,用户需要在简单的需求下获得更快的回复,在复杂要求中获得更好的生成结果。两款模型在性能、功能和应用场景上有了显著提升,价格却与之前的 Opus 和 Sonnet 模型保持一致,内部优化做得很好。 先从评分开始看起。Claude 4 模型在用于评估真实软件工程任务性能的 SWE-bench Verified 基准上堪称「遥遥领先」。值得一提的是,在本次评分对比中,Claude 4 特意被拉来与 OpenAI 前几天刚刚高调发布的「最强 AI 编程智能体 Codex-1」进行正面较量。 Claude Opus 4 在编码、研究、写作和科学发现等人类复杂性高的任务方向,拓展了边界。比如,在编码领域它被 Cursor 称为顶尖技术,显著提升复杂代码库的理解能力,适合处理复杂的编程任务。Cognition则强调Opus 4已经能够解决其他模型无法应对的复杂任务。 Claude Sonnet 4 将“天赋”融入日常使用场景,这款均衡型模型在内部和外部应用中兼顾了性能与效率,虽在多数领域不及 Opus 4,但提供了能力与实用性的最佳结合。它非常适合需要自主性的场景。iGent 的报告指出,Sonnet 4 在自主开发多功能应用方面表现惊艳,错误率几从 20% 骤降至几乎为零。 在下面这张综合基准测试评分表中,Claude 4 与其他市场主流大模型在编程、推理、多模态能力、智能体任务方面都拉开了一定差距。 有趣的一点是,Anthropic 将最左侧的数个基准测试名称中都加入了「Agentic」。 2025 是 AI 智能体时代这一说法,再次被确认。 在 Anthropic 的官方发布中,有很大的篇幅着重介绍了 Claude 4 系列在「复杂项目」构建中的震撼级能力。其中,官方着重引用了 Github Copilot、iGent,甚至是 Manus 等平台的反馈。日本一家名叫乐天得企业,甚至让Claude Opus 4独立编程7h,团队自己都有些惊讶。 前段时间刚一问世就被网络平台誉为「上帝之手」的 Manus 则在报告中大赞 Claude Sonnet 4,称它复杂指令遵循能力和输出的美观度非常高。 可以预见的是,目前智能体赛道的各个选手将会第一时间集成 Claude 4,因为它相对于之前的 Claude 模型在智能体任务中有了太多的改进。 比如: 1. Opus 4 和 Sonnet 4 不再像 Sonnet 3.7 那样爱走捷径和漏洞了,这种不正常的行为发生率直接降低了 65%。 2. Opus 4 也迅速跟进了「记忆增强」,现在它可以更好地执行长期任务了。 3. 使用小型模型压缩冗长的思考过程,自己去做思考摘要。 图注:Claude Opus 4 在玩《宝可梦时》自主记录笔记。 02 Claude 4 其实是 LLM + Agent 的混合体? 除了 Claude 4 发布之外,整场发布会的另一个侧重点是:Claude 代码已经发布。用户已经能够通过终端、IDE (VS Code 和 JetBrains)及通过 Claude 代码 SDK 后台将 Claude 融入开发流程。用户可以在终端中直接利用 Claude,瞬间搜索百万行代码库。 在官方介绍中,Claude Code搭载 Claude Opus 4,可以通过智能体搜索全面理解代码库,无需手动选择上下文即可协调多个文件更改,无缝融入工作流,直接运行于终端。 只需在 IDE 终端运行 Claude 代码即可安装,可扩展的 Claude 代码 SDK 还能让用户轻松「打造自定义智能体和应用」。Anthropic 给想要构建智能体的用户们又打上了一剂强心针。 Anthropic 还发布了几个面向智能体的新功能:代码执行工具、MCP 连接器、文件 API,以及最多可缓存一小时提示词的能力,让 Claude 4 几乎成为了智能体专精模型。在我看来,这就是 Anthropic 在 AI 下半程「智能体入口争夺战」中的大动作。允许模型将推理与外部资源结合的设计,使 Claude 4 架构更像是一个 LLM+Agent 的混合体。 可以这么说,整场发布会看下来,Claude 4 几乎是将自己确立为「AI 智能体时代」最能用也是最好用的大模型。 除了技术侧内容,Anthropic 在安全上的操作一直都非常令人「印象深刻」,封号封的各个社区怨声载道。官方这回依旧强调了这些模型都经过了广泛的测试和评估,比如他们用了ASL-3 安全分类,在这个风险标准下:「AI 系统具有显著增加灾难性滥用风险」。 他们还是沿袭了Anthropic的标志性安全策略——“宪法AI”(Constitutional AI)。该方法为模型嵌入了一套“宪法”原则,通过额外的AI模型对用户的输入和模型的输出进行再度扫描,检查是否有「坏」的内容,决定是否放行。这回,Anthropic放出来的模型卡PDF中足足有123页,其中大部分仍然是在专注于AI安全的测试。 比如,Anthropic决定根据 AI 安全级别 3 标准发布 Claude Opus 4,根据 AI 安全级别 2 标准发布 Claude Sonnet 4,分级分的非常精准。 但是,现在的外网针对 Claude 4「过于高」的安全措施的讨论,几乎乱成了一锅粥。因为有网友似乎基于Claude给出的系统卡文件爆料:Claude 4 会检测用户内容,并自主「报警」…… 虽然暂无法确定这些爆料是否真实,但也确实反映了大家认为 Claude 4 的安全措施真的太过于严格了,甚至到了可能影响用户体验或功能性的地步。毕竟,国内的Claude使用者已经流行起了「打一枪,换一个地」的使用策略。 03 Claude 4 在实测中全面提升 目前各个社区、各个国家的网友全部在疯狂测试这款即将取代 Claude 3.7 Sonnet 的大模型。为了支撑智能体中常常需要的长序列复杂处理任务,具有美感输出能力且超强的 AI 编程能力的大模型仍然是极度稀缺的。Claude 4 系列只是看前方无人在,顺势补缺而已。 那么说到底,Claude 4 面对复杂性任务,表现到底有多超纲? 下面来看看全网实测案例: Claude 4 与 Blender MCP 的连接,让产品 3D 模型设计几乎有了质的飞跃。像是有网友使用 Claude 4 和 Blender 通过 MCP 联动制作了日本清水寺的 3D 模型。这回的 Claude 4 相比于前代 Claude 3.7,编程时间大幅减少,全程无需「人类陪伴」,AI 的幻觉发生率也下降了很多。 甚至还有网友使用 Claude Opus 4 制作了类似 Bemani 2DX 风格的游戏。不仅重现了经典的音乐游戏体验,还融入了许多创新元素,提升了游戏的可玩性和趣味性。 Claude 4 在面对复杂任务的处理上十分得心应手。比如有网友输入提示词:用立体相机拍摄物体,推测 3D 空间坐标,并通过交互式可视化展示,并支持拖动。 除了硬核编程能力的提升之外,Claude 4 在设计感上正如 Manus 所说,有了很大的美学提升。很多网友曾在各个社区评论下笑称:各个智能体什么小游戏都能做,但是没见过做 PPT 的。 一位外网网友就试着让 Claude 4 制作说明幻灯片,呈现出来的效果非常具有设计感,整体要素也更加简洁。 在美学的提升方面,这有个更直观的 Case。一位网友只给了 Claude Opus 4 一小段提示词:“将书籍 《Piranesi》作为 p5js 3d 空间,do it for me”,没有掺杂任何其他元素。 Claude Opus 4 甚至在初版原型中加入鸟、光照、水面等元素,虽然效果还比较基础,但仍能反应这款旗舰模型的性能。 目前,大量的 AI 编程平台(像是 Cursor、Trae、WindsurfVapi、Codegen)、智能体产品(像是 Flowith)内几乎都迅速接入了 Claude 4 系列,毕竟它可能是能进一步提升智能体表现的重要模型。 Anthropic 由于一直以来专注于安全顶层设计,而常常被认为「他们还没有找到一个合适的 AI 入口,只能当个扫地神僧,甚至没有办法参加到最高级别的公开赛场之中」。 当 Claude 4 系列模型发布,以及其他像是代码执行器、MCP 连接器、Claude 代码等等面向智能体产品的功能模块推出,Anthropic 可以说已经拿到了一个非常好的「智能体入口」,正式站到了顶级赛场。 从 Anthropic 去年推出 MCP 协议以来,再到 Claude 4 的出现,他们已经在事实上为 AI 智能体时代按下了「加速键」。Anthropic 的 CEO——Dario Amodei 为整个 AI 大模型赛道明确了一个未来的方向:真正优秀的 AI 大模型,一定是「大模型」与「智能体」的深度融合 —— 它能编程、能思考,还能自主解决复杂问题,甚至具备了美学与设计感。 AI 的下半场早已经开启,Claude 4 正在引领一场新的「 AI 大模型+智能体」范式转变。
济南AI为何选定百度?
AI大模型掀起的创新热浪正愈加深入地影响全球千行百业。 让AI即人工智能落地成为所在领域面向未来的重要发展引擎,现已是国内各界颇多人士热切期盼。而在国家政策层面,“开展‘人工智能+’行动”不但于2024年3月被首度写入国务院政府工作报告,2024年12月中央经济工作会议对此予以重申,而且2025年3月再被写入国务院政府工作报告,AI之于产业未来发展的重要性由此可见一斑。 目前国内各地都在不同程度地尝试推进AI与当地产业的融合。因趵突泉而闻名天下的山东省省会济南,在该方向的着力深拓颇值一提。 2025年5月15日,济南市政府与国内AI大厂百度集团正式签署了人工智能产业发展战略协议,百度接下去将在数据标注服务、行业大模型探索、车路云一体化应用、专业人才培养等方面,帮助济南达成AI在相应诸多项目中的落地,推动济南产业升级及经济社会高质量发展。 选择与百度深度携手,济南显然早有研判。已走过25年发展历程的百度,是一家拥有强大互联网基础的领先AI公司。基于云基础设施层、框架层、模型层、应用层四层架构技术栈,百度已建立起了强大的端到端的优化能力,能够为合作方提供独具业界优势的高性价比全栈AI产品及解决方案。 市场对坚定投资AI的百度持续给出正反馈。财报显示,2025年第一季度,受百度智能云业务同比大幅增长42%的强劲拉动,百度核心收入255亿元,同比增长7%,其中非在线营销收入94亿元,同比增长40%。而百度智能云业务迅猛增长的关键,则无疑是其在赋能AI客户维度极其能打。 01 济南AI蓄势待发 探索建设全国前列的“AI原生城市”是济南当前致力推动数字经济发展的一个重要目标。 这既是对国家层面和山东省政府连续颁行相关政策的积极响应,亦是从济南辖区内特定资源禀赋和产业发展现状出发的颇具前瞻性和进取精神的战略规划。 国家近年持续力推AI在产业侧的落地。 以2024年1月工信部、科技部等七部门联合发布的《关于推动未来产业创新发展的实施意见》为例。《意见》要求,把握全球科技创新和产业发展趋势,利用人工智能、先进计算等技术,精准识别和培育高潜能未来产业,引导地方结合产业基础和资源禀赋,合理规划、精准培育和错位发展未来产业,发挥前沿技术增量器作用,瞄准高端、智能等方向,加快产业转型升级,为建设现代化产业体系提供新动力。 2025年3月国务院政府工作报告提到,因地制宜发展新质生产力,加快建设现代化产业体系,推动科技创新与产业创新融合发展,大力推进新型工业化,做大做强先进制造业,促进新动能积厚成势、传统动能焕新升级;激发数字经济创新活力,持续推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,打造具有国际竞争力的数字产业集群。 山东跟进力度颇大。 山东省政府2025年5月7日印发的《关于加快人工智能赋能重点领域高质量发展的推进方案》对全省AI发展做出了总体部署,设定了到2027年培育20个服务垂直行业的基础级人工智能大模型等总体目标,以期培育新产业、新消费、新业态、新模式;2025年5月12日印发的《关于支持人工智能全产业链创新发展的若干政策措施》对抢抓人工智能发展机遇的创新项目,明确了奖补标准,旨在激励更多产研突破。 位于山东中部的济南是个老牌工业城市,产业体系完整,拥有41个工业大类和全部31个制造业大类,中国第一台小机床、第一台龙门刨床、第一部重型载重车均产自这里,中国重型汽车工业的摇篮、成立于1930年的中国重汽,中国第一辆民用摩托车发源地、前身最早可追溯至1956年的济南轻骑等均为当地企业。 但AI时代的传统制造已迫切需要转型升级。 从GDP视角看,第三产业是近年济南GDP规模的贡献大头,增速排在首位的则是第二产业。据济南市统计局数据,2024年济南全市生产总值13527.6亿元,第一、第二、第三产业增加值分别为440.0亿元、4519.2亿元、8568.4亿元,占比分别为3.3%、33.4%、63.3%,增速则分别为3.6%、5.8%、5.2%。 这与济南近年深入实施工业强市战略密切相关。 据海克财经了解,济南日前已将“13+34”产业链,即聚焦全市13条标志产业链、34条重点产业链,定为工业经济主攻方向。 而发展新质生产力,推动新旧动能转换,实现从“制造”到“智造”的跃迁,亦需引入头部AI企业提供深度赋能。济南市政府2024年6月印发的《济南市新一代人工智能高质量发展行动计划(2024—2026年)》对此有所说明。济南近日携手百度因此顺理成章。 02 百度技术硬核突围 百度在AI领域的显著综合优势,是济南做出选择、与之达成深度战略合作的重要依据。 百度AI强大的四层架构技术栈,实为百度AI能力输出的根基,在这里尤其需要重点提及。 在云基础设施层,继2025年2月百度智能云成功点亮昆仑芯三代万卡集群,同时也是国内首个正式点亮的自研万卡集群后,2025年4月在Create大会即百度AI开发者大会上,百度进一步宣布,已点亮国内首个自研三万卡集群。据海克财经了解,后者可同时承载多个千亿级参数大模型训练,可支持1000个客户进行百亿级参数模型微调,以高性能网络和创新散热方案,可确保训练任务稳定性和能效。 在AI框架层,百度有中国开发者使用最广的深度学习框架——飞桨开源框架。以2025年4月发布的飞桨框架3.0为例,该版本“动静统一自动并行”“大模型训推一体”“科学计算高阶微分”“神经网络编译器”“异构多芯适配”这五大技术新特性,系统性解决了大模型研发应用面临的分布式策略开发门槛高、训练推理效率低、硬件适配优化难等核心痛点,且可为科学智能领域前沿探索提供强大支撑。 在模型层,百度有不断迭代和渐成矩阵的文心大模型。与2025年3月文心大模型4.5、文心大模型X1发布相去不过40天,百度于2025年4月Create大会上发布了具备多模态、强推理、低成本三大特性的文心大模型4.5 Turbo、文心大模型X1 Turbo。以文心大模型4.5 Turbo为例,在多个基准测试集中,其多模态能力优于GPT-4o,而相较文心大模型4.5,其速度更快,价格下降80%,百万token输入价格仅0.8元,输出价格仅3.2元。另据海克财经了解,文心大模型5.0系列或将于今年下半年发布。 在应用层,百度有激进进行自我颠覆重构、全面接入DeepSeek和文心大模型的百度搜索,AI月活用户达9700万的百度文库,月活用户超2亿、AI月活用户超8000万的百度网盘等。 百度AI的硬核实力在近期相关招投标案例中亦可寻得明证。招投标市场数据显示,2025年第一季度,国内大模型项目招投标数量和规模均爆发式增长,中标项目505个,总金额24.67亿元,百度智能云以中标项目19个、中标金额4.5亿元在国内通用大模型厂商中均位列第一;同期国内大模型平台及应用市场中标项目26个,总金额1.24亿元,百度智能云以中标项目6个、中标金额5700万元亦均位列第一。 服务开发者已多达760万的代码智能体和智能代码助手文心快码,合作企业已多达30万的百度文心智能体平台,正加速出海阿联酋、瑞士、土耳其等多个国家和地区的萝卜快跑无人驾驶出行服务平台等,亦无一不是百度AI高阶水准的体现。 可以想见,通过打通旗下技术、产品和资源,百度不仅可在数据标注、行业大模型探索、车路云一体化应用等方面为当前济南AI提供支撑,而且远期可在更多领域更深层次助推济南新质生产力长足发展。 03 落地增量不止于此 AI为先战略(AI First)及就此进行的持续大力度投入,为百度在如今渐进深入的AI时代从容出击和稳居行业领先地位奠定了坚实基础。现在看,云和无人驾驶已成百度AI应用双引擎,二者或将为百度未来发展推开极具想象力的广阔上行空间。 得益于AI对云业务增长的驱动和品牌业内口碑的不断打响,在AI领域已深耕多年的百度智能云正逐步迎来收获期。 据调研机构IDC发布的报告《中国模型即服务(MaaS)及AI大模型解决方案市场追踪,2024 H2》,2024年下半年,百度智能云以26%的市场份额,在中国MaaS市场排名第一;同时在2024年上半年中国AI大模型解决方案市场,百度智能云占比16%,亦位居市场第一;2024年上半年,百度智能云在中国MaaS市场、中国AI大模型解决方案市场两个市场,同样排名第一。 国内大量民营企业以及六成以上央国企都在联合百度智能云进行AI创新,百度智能云现已拥有中国最大的AI大模型产业落地规模。IDC发布的报告《中国人工智能公有云服务市场份额,2023》显示,2023年中国AI公有云服务市场整体规模126.1亿元,百度智能云市场份额排名第一,占比26.4%,这是百度智能云连续第5年蝉联中国市场第一。 萝卜快跑的惊艳性能、落地积累和全球拓展成果亦颇得业界关注。 萝卜快跑目前不仅已落地武汉、北京、上海、广州、深圳等中国内地十余个城市,在中国香港获准扩大了自动驾驶测试区域,而且已拓展至阿联酋的迪拜、阿布扎比以及瑞士、土耳其等国家和地区。 财报显示,2025年第一季度,萝卜快跑提供的自动驾驶订单超过140万单,同比增长75%,反映出规模化运营的增长势头加快;截至2025年5月,萝卜快跑累计为公众提供的自动驾驶出行服务订单已超1100万单。 需要特别指出的是,在百度Apollo于2024年5月发布的全球首个支持L4级无人驾驶大模型Apollo ADFM的加持下,萝卜快跑第六代无人车的安全性已接近国产大飞机C919;同时其成本已大幅缩减,售价仅20.46万元,是同类产品谷歌旗下Waymo的1/7,比特斯拉宣布2026年量产的Cybercab的预计成本3万美元还要低。 萝卜快跑的创新性已获颇多认可。 全球科技创新权威奖项爱迪生奖2025年4月将“无人车(Driverless Vehicles)”最佳新产品奖金奖颁给了萝卜快跑。这是中国无人驾驶首获该奖。 《经济学人》《麻省理工科技评论》《Fast Company》等全球权威商业杂志亦均对萝卜快跑的技术突破给予了积极评价。以《Fast Company》为例,该杂志2025年3月发布的“2025年最具创新力企业榜单”,将爆红的DeepSeek、百度排在了亚太区第一和第二名的位置上;该杂志认为,萝卜快跑的表现已超越谷歌旗下Waymo。 显见的是,“云+无人驾驶”这一AI应用双引擎模式,不但为百度财报层面营收增长注入了强劲动力,而且已得到越来越多全球顶级投资机构和投资人的高度认可,桥水基金、富达基金2025年第一季度10倍增持百度股票,被誉为女版巴菲特的“木头姐”Cathie Wood自2025年3月建仓以来连续6次加仓,都清晰指向了这一点。 拥抱AI即拥抱未来。就此而言,济南与百度都已分别做出正确选择,而潜力释放刚刚开始。
炒菜机器人席卷餐饮,预制菜迎来终结者?
文 | 林京 封面来源 | 图虫创意 在C端消费市场未掀起太多水花的炒菜机器人,正在加速渗透到B端餐饮企业中。 已经上市的小菜园,早在2023年就开始在部分门店里使用炒菜机器人,其招股书中曾提到,上市募集的资金一部分用于采购3000台炒菜机器人,单台客单价5万元,预计花费1.5亿元。 小菜园如今有600余家门店,意味着平均每家门店大约会投放5台炒菜机器人。 从炒菜机器人头部企业橡鹿科技的官网可以看到,其合作的餐饮企业包括农耕记、金鼎轩、米村拌饭、大米先生、乡村基等公众熟知的餐饮企业,还有部分城市的全季、亚朵、希尔顿等连锁酒店。 不止连锁餐饮企业,一位炒菜机器人企业的员工告诉Tech星球,资金不充裕的中小型餐饮企业,更多是通过月租模式购买,以此减少厨师等人工成本支出,如今市面上研发炒菜机器人的企业庞杂,质量参差不齐,月租金价格在1000元~2500元不等。 过去,餐饮行业的效率变革往往聚焦于预制菜,但因品质与健康争议陷入舆论漩涡。正在走入更多餐饮企业的炒菜机器人,能掀起新一轮革命吗? 月租2500元,炒菜机器人席卷餐饮企业 初期主要应用于团餐和快餐市场的炒菜机器人,如今正加速渗透堂食、外卖等餐饮场景。 据一位炒菜机器人企业员工介绍,很多开在商圈里的大型连锁餐饮店,主要将炒菜机器人用于专做外卖的卫星店,比如农耕记。而一些餐饮初创企业以炒菜机器人为卖点,试图在行业进行弯道超车,诸如主打湘菜盖饭的企业“霸碗”等,完全由炒菜机器人替代厨师。 Tech星球在北京一所高校食堂档口里的“霸碗”店看到,后厨的三台炒菜机器人在同时工作,员工投放进去食材,选择机器屏幕上的菜谱之后,设备开始进行搅拌、翻炒,一份辣椒炒肉盖浇饭大约3分钟就可以完成出餐。 从炒菜机器人的市场价格来看,目前单台价格在3万元~5万元不等,部分企业的炒菜机器人售卖12万元一台。炒菜机器人的使用年限大约为5年,与直接购买不同,选择租赁模式的餐饮企业,所使用的都是有一定折旧磨损的设备,通常一台售价3.6万元的炒菜机器人,月租价格大约在2500元。 更低门槛的租用模式,让更多餐饮企业有机会进行尝试。今年5月底,上海一所社区老年食堂开始使用炒菜机器人,便在网络引起热议。 而唯品会等互联网企业的员工食堂中,也开始出现炒菜机器人身影。唯品会相关负责人告诉Tech星球,一方面是引进了只使用炒菜机器人的餐饮企业入驻,另一方面,食堂内的其他档口,也陆续开始配备AI炒菜机。 这几年,跨界布局炒菜机器人的企业并不算少,以苏泊尔、九阳股份代表的家电企业,以科沃斯为代表的扫地机器人企业,以及一些创业企业,都有入局。 早期不少企业主要推出面向C端市场的家用炒菜机器人,但其功能存在明显局限——仅能完成最后的烹饪环节,而如洗菜、择菜、切配等前期食材处理的繁琐流程仍需人工操作。这种半自动化的解决方案,对于想要解放双手的居家用户而言,显得有些鸡肋。 面向B端市场的炒菜机器人,其市场在于减少厨师这一项人力成本支出,帮助餐饮企业降本增效。 以单台炒菜机器人月租2500元的价格计算,对比一线城市月薪在8000元左右的厨师,每月可以减少5500元费用,一年可以节省6万元成本。通常后厨会放置3~5台炒菜机器人,加上炒菜机器人的出餐效率也高于厨师,至少可以帮助餐饮企业节省十几万元成本。 资本也在押注炒菜机器人。譬如,由源码资本、IDG、腾讯、京东等连续押注投资的橡鹿科技,以及由CVC创世伙伴、汉能创投等押注的不停科技。 谁在靠炒菜机器人狂赚? 炒菜机器人需求暴增背后,一方面是餐饮行业普遍面临房租、人工和原材料“三座大山”的压力,随着人工成本的攀升,“穷鬼套餐”席卷下的餐饮低价战,利润被压薄的餐饮企业,开始瞄向炒菜机。 霸碗加盟商王阳向Tech星球介绍,从使用体验来看,目前主要是降低厨师成本,每台机器还是需要安排专人盯着,实时关注菜品状况、以及完成最后的盛菜等环节,尚且无法最大程度解放人力成本。 从单量测试来看,在600余家的加盟门店中,有门店单日销量可以达到千余单,王阳说,门店通常会放三台机器,一台机器单日出餐量达到300份时,会提示超负荷状态。为了保证用餐高峰时间段的出餐,通常会提前炒出一部分菜放入保温柜里。 也因此,只使用炒菜机器人的餐饮企业,每月房租成本最好不要超过2万元,在王阳看来,这样扣除原材料、外卖平台扣点等各项成本之后,能够保证存活下去。 另一方面,炒菜机器人需求增加,也源于当下流行的“现炒”概念。随着预制菜降温与争议,去年开始,餐饮企业纷纷将“现炒”作为吸引顾客的卖点,以农耕记为代表的餐饮企业,在外卖包装袋上专门设计突出“没有预制菜”字样。 相比9.9元的预制菜,在社交平台上,消费者对于后厨的炒菜机器人很难有直接感知。一位北京高校的学生告诉Tech星球,吃了很久之后,才知道那家档口店原来是炒菜机器人做得,口感跟食堂里的其他盖浇饭水平差不多。 一位常年被预制菜“背刺”的消费者则告诉Tech星球,比起后厨里的炒菜机器人,她更多是被外卖平台上一些餐饮企业标注的“现炒”吸引,但相比大火爆炒的口感,还是差点意思。 中餐菜系众多,讲究“一菜一格”,厨师的掌勺技术、火候把控,让同一道菜肴产生万千变化。而消费者对同一道菜品的要求和挑剔程度并不同,无论预制菜,还是炒菜机器人,都要面临“标准化与个性化”的挑战。 目前,炒菜机器人更多应用于外卖店,王阳介绍,这是因为在人工成本降低之后,可以通过更低的餐品终端售价,去卷市场。比起动辄35元客单价的盖浇饭,一份荤素搭配双拼盖浇饭售卖价格在19元,足够有性价比,消费者会降低对炒菜机器人的期待和要求。 但在以堂食为主的连锁餐饮中,仍然存在明显挑战。Tech星球探访北京一家商场里的农耕记门店,据其店员介绍,炒菜机器人只能实现小部分菜肴制作,店里的招牌菜复刻起来有困难,没有“锅气”。 当餐饮企业精打细算炒菜机器人的投入产出比、测试等待市场反馈时,嗅到商机的上游供应商早已赚得盆满钵满。 一位炒菜机器人企业的工作人员向Tech星球介绍,其设备与眉州东坡、玉林烤鸭等北京区域内的餐饮企业都有合作,去年全国销量达到3000台,收入在1亿元左右。 还有餐饮企业开始亲自下场自研炒菜机器人,通过加盟模式大规模扩张。以霸碗为例,与其他餐饮企业的加盟规则不同,霸碗的营收渠道之一就是向加盟商收取租赁设备的费用,以单台设备12000元年租金,600家门店放置1800台设备粗略计算,企业靠租赁设备就可以实现两千多万元的年收入。 炒菜机器人,掀起新一轮餐饮革命? 炒菜机器人的进化方向在于,如何成为更加“智慧”的AI厨师,而非仅是执行程序的炒菜设备。 一位餐饮企业负责人告诉Tech星球,如今连锁餐饮企业都有标准化的中央厨房配送体系,目前市面上的AI炒菜机,更多是实现了替代繁琐工序、解放后厨人力的功能。 但在连锁餐饮企业里面,还有很多需要依靠智能化去减少的成本,比如,在新品研发时,传统模式下需要投入大量人力进行厨师培训、口味调试和品控管理,现在是否可以一键下放至各个炒菜机器人。进行更多系统性的成本重构,是餐饮企业持续去选择炒菜机器人的核心驱动力。 这需要炒菜机器人投入资金去进行更加精细化的研发。不同于人工投放调料,目前部分企业的炒菜机器人已经可以实现在什么时候投放调料,并且投料可以精准到克,以去高精度复刻厨师的技艺。 对于炒菜机器人的技术和研发,橡鹿科技创始人杨建成曾对“科创板日报”表示,现在阶段对过温曲线的控制和对喷料精准度的计量在算法上难度最高,同时也是壁垒较高的技术环节。 如果用自动驾驶来做对比,杨建成表示,现在的AI炒菜机器人只能做到把大厨的手艺完整地复刻传播出去,这是辅助驾驶,比如会开车的人也不是每时每刻都想开车,厨师也不是24小时都想“炒菜”,这是AI炒菜机器人存在的意义。 当越来越多在效率、成本和标准化之间寻找平衡的餐饮企业,将炒菜机器人作为新的探索方向,后续的市场反馈是关键。 曾经爆火的预制菜,解决的是便捷型的需求,但因为添加剂,以及在经过水洗、高温杀菌、二次加热等环节之后,出现营养成分的流失等因素,引发消费者日益强烈的抵触情绪。如今,主打现制现炒的炒菜机器人,也需要去经受更多消费者的考验。 (备注:文中王阳为化名。)
我们第一时间用上了 Android 16:原生系统更好看了,也更像国产系统了
新版安卓 似曾相识 两周前,伴随着谷歌意外泄露的博文,结构活泼、色彩鲜明的 Material Design 3 Expressive 着实让大家兴奋了一把,虽然伴随着一些小小的争议,这个更加年轻化的风格还是收获了不错的评价。而今年 iOS 19 将同样迎来传言中界面设计的大改,Android 与 iOS 再一次双双站在了十字路口面前。 趁着 5 月 20 日 Android 16 QPR1 Beta 1 的上线,我们第一时间将手里这台 Pixel 9 Pro 刷了上去,争取尽早带大家看一看 Material Design 3 Expressive 加持下的新系统有什么动人之处——只不过必须要先泼一盆冷水:目前 QPR1 Beta 1 所带来的新东西,恐怕很难让大家兴奋起来。 新设计:材质更高级,观感更舒适 自从 2021 年 Material Design 3,或者说 Material You 以来,大胆的色块就成了谷歌 Android 的标志性元素,通过 Monet 算法在壁纸上选取不同权重的主题色,并全局应用到 UI 控件的特性让 Material You 在各个界面之间的整体性达到了非常优秀的水平。 但在最新的 Android 16 里,进入系统后首次映入眼帘的并不是以往的纯色,而是大面积的毛玻璃元素。从锁定屏幕的密码键盘到通知中心,再到应用抽屉,全都从 Android 15 时候的纯色背景演变为了带高斯模糊的毛玻璃风格: 从视觉效果上说,毛玻璃的加入的确让 Android 16 不同层级的系统页面变得更像是一个整体,这种在 z 轴上更加明晰的层次关系反而更像是 Material Design 2 中依靠阴影构建出不同高度的卡片,相比 Android 12 以来主张用颜色区分层级的 Material You 在观感上无疑变得更丰富了: 左为 Android 16,右为 Android 15 然而背景渲染方式的变化可以算作 Material Design 3 内部的更迭,但是本次 Android 16 的新版「状态栏」就实在是有些难评了。早在 Android 11 或者 10 中,谷歌曾经添加过一个定制状态栏图标风格的功能,里面除了最经典的实心三角形之外,还有若干种圆润或者线条化的图标可供选择,甚至是 Android 8 时期的样式。 Android 11 中的状态栏个性化设置 然而这个更改图标的功能在 Android 12 测试版中被移除,往后我们所习惯的就都是这个源于 Android 10 的带有描边的状态栏图标了: 在最新版本的 Android 16 中,这个陪伴我们五年多的图标风格还是迎来了退位,取而代之的是这样一款与 iOS 相似到有些可疑的图标,将更早期测试版中的爆料落成了实锤: 虽然我们可以接受优秀的设计都是逐渐趋同的,但是这个自 Android 4 时代就竖立着的电池图标时隔十四年后再次平躺下去,以及它旁边过于眼熟的双层信号图标,实在很难揣测谷歌在 Material Design 3 整体趋向「色块」的背景下突然转向线条化图标的用意,或许是为了搭配新系统中更加圆润的界面字体,但这是今年 Android 16 无论如何也无法避开的话题:本次更新的状态栏图标实在是太像 iOS 了。 新功能:DIY 更强大,也更像国产了 谷歌目前使用的快捷设置面板自从 Android 12 更新以来一直存在着争议 —— 强制使用 1×2 比例的按钮导致在面板完全展开的状态下会铺满整块屏幕,也没有比 Android 11 按钮式面板显示更多的有效信息;经常被评价为是「效率倒退」的设计。 因此在 Android 16 中,或许是看到了苹果在 iOS 18 中彻底重构的控制中心,谷歌总算更新了一个稍微灵活一点的快捷设置面板:现在除了 1×2,你终于可以把按钮缩小为 1×1 了,也可以对按钮进行自由排列。 Android 16 新版的快捷设置面板虽然可以自定义,但是因为 Android 16 只为快捷开关提供了两种尺寸,没有 iOS 18 中 2×2 的大尺寸按钮可以选择,因此调整的空间仍然是相当有限的。 在此次改版之后,我们甚至可以说 Android 16 相比去年的 Android 15 已经「不是那么原生」了。 从左到右依次为:谷歌,三星,苹果,vivo 壁纸以及基于壁纸的色彩方案一直都是 Material Design 3 的重点,Android 16 也同样对壁纸的个性化功能进行了加强。现在从相册里面选择图片之后,壁纸预览界面下方会出现一个「效果」按钮,点击进入后手机就会自动对壁纸进行主体分离,然后提供三个不同的效果以供应用——镂空图形,天气效果,以及分离景深。 其中镂空图形的效果可以说是姗姗来迟,因为它就是此前 OneUI 7 和 Color OS 中出现过的「相框」风格锁屏,通过智能分离照片前后景并添加纯色边框,这个功能可以规避构图缺陷、拯救很多原本不适合做壁纸的照片。 锁屏的风格化是近几年各大手机品牌都在发力探寻的方向,哪怕是历来主打简朴的原生 Android 其实也自 Android 12 开始陆陆续续添加了不少类似的 DIY 元素,比如可选择的时钟风格和允许自定义的布局,而谷歌擅长的就是将他们用精美的动画衔接起来。 相比 OneUI 7 单纯将画框做为一种简化过的静态壁纸,谷歌为 Android 16 设计了从锁屏进入桌面时最外层遮罩展开和消失的动画,像是从画框外走进了画中一样: 天气效果的来源则更加古老一些,类似的设计甚至可以追溯到曾经的 HTC Sense 上。在 Android 16 中,谷歌提供了包括实时天气在内的五种固定的样式,不仅会在主体的边缘产生拍打或堆积的特殊效果,还可以调整效果的强度: 新动效:更灵动,更舒服 Android 16 中不仅快捷设置面板的样式发生了显著变化,谷歌还在里面添加了很多新的按钮和通知动画。现在无论是按下开关还是展开子菜单,按钮本身都会显示一个新的拉伸效果。 而在多条通知堆叠的时候,如果手动划走其中的某一行,它上下的通知以及通知栏文字都会伴随移动一小段距离、然后干净利落地弹回原位。 这个小动画的设计让通知卡片的一体性加强了许多,增强的震动反馈在一定程度上可以降低无意中误划的概率,更 Q 弹的手感也让手动清理通知这件事变得有趣了不少。 至于亮度和音量滑杆上新增的一条「扶手」则来自本次 Material Design 3 Expressive 中新规定的按钮样式,虽然看上去有些不协调,但可以让滑动操作的引导变得更加直观。 除了菜单动画,在时钟样式中,谷歌也给 Android 12 时加入的可变字体(variable font)时钟增加了一些订制功能。只不过虽然用着可变字体,但谷歌不允许像 iOS 那样进行无级调节,目前只能在 8 种预设的字重里面选择,并且字重和字宽也是相互绑定的,无法单独设置: 不过锁屏界面的时钟风格虽然可变,但 AOD 上面的时钟样式则是固定的,因此在每次息屏和点亮的时候都可以看到 Android 16 新字体那丝滑的渐变动画了。 除了以上比较直观的更新之外,Android 16 还在一部分系统界面上做出了微调。比如在设置 app 中,原本一致跟随系统主题色的菜单图标重新变得多彩起来,根据不同的大类进行了分色,仿佛是对 Android 11 的一种呼应: 左为 Android 11,右为 Android 16 而多任务界面也一改谷歌以往的图标居中设计,变成了 app 图标与全称以药丸的样式悬浮在卡片的左上角,展开的功能菜单也收获了重新设计,虽然展示的信息比 Android 15 更多,但是变长的列表和缩小的字体却让易读性有所下降。 左为 Android 16,右为 Android 15 还有一些想用但用不到的…… 在前几天 Google I/O 开幕式会后的 Developer Keynote 中,谷歌宣布了将会在 Android 16 中带来「增强的窗口功能」(enhanced windowing capabilities),并且在现场展示了一个新的桌面端界面——其底部 dock 栏的设计风格与去年发布的 Pixel 9 Pro Fold 有几分相似,支持手机 app 的窗口化视图和键鼠操作。 根据 9to5Google 的消息,此次 Android 16 的全新桌面模式与三星合作开发,是「以 Samsung DeX 平台为基础构建」的全新窗口化功能。 可惜的是新版的桌面模式在 Android 16 QPR1 Beta 1 中还没有被加入,目前通过手机连接外置显示设备后显示的仍然是旧版投屏布局。此外,这个「增强的窗口功能」在本次 Google I/O 中更多的是被用来演示 Android 16 的 app 自适应布局,重点更多还是围绕着折叠屏设备,背景里的桌面模式并没有被作为单独的功能或者产品介绍。 因此,它是否会跟随 Android 16 正式版推出、会不会像三星 DeX 那样有机型限制、具体将在何时更新依然有待观望,从目前已有的信息来看,想要让 Pixel 手机用上完成度类似 DeX 的真正桌面模式恐怕还要再等待一段时间。 以上便是我们在初上手 Android 16 后整理出的若干主要更新。 非常可惜,官方博文中那个大胆而鲜明的 Material Design 3 Expressive,在目前的测试版中含量并不高,设计手册中提到的部分新款菜单和按钮样式只在少数几个系统界面里才能看到,而其他需要进行主动适配的第一方与第三方 app 更是几乎完全未见。 因此如果拿 Material Design 官网 Start Building with Material 3 Expressive 这篇博文作为目录的话,Android 16 QPR1 Beta 1 中实际为我们呈现出的部分并不算多。 尤其是博文中提到的「使用强调性的字体风格将用户的注意力引导到主要 UI 元素上」,类似这种同时需要第一方和第三方配合才能实现的效果,不仅在本次测试中完全没有出镜,甚至恐怕要在 Android 16 正式版之后很久才能见到成效了。 而 Material Design 3 Expressive 目前展示出的踌躇,也正是原生 Android 16 面临的诸多问题之一,即谷歌单纯靠 Pixel 吃下的市场份额实在是太微不足道了,连带着导致 Material Design 设计规范的号召力不足,总是处在「PPT 很美好但就是没人用」的尴尬境地。 从本次 Android 16 QPR1 Beta 1 的诸多有源借鉴来看,Material Design 3 Expressive 恐怕依然无法改变这样的局面——毕竟连谷歌自己在博文中所使用的手机模板,其状态栏图标排列都是 iOS 的顺序: 以上都是我们基于 Android 16 QPR1 Beta 1 所发掘出的种种细节,它们在后续的其他测试版本以及 Android 16 的正式版中可能还会发生变化。 如果阅读到这里的你也想尝试最新的 Android 16 测试版系统,可以在 Android Beta Program 网站注册自己符合测试条件的 Pixel 设备,随后就可以通过 OTA 直接升级到最新的 beta 版本了。 需要注意的是,如果从当前的测试项目中退出,你的 Pixel 设备会在收到 OTA 降级包的时候自动恢复出厂设置,再回滚到最新的稳定版系统,因此,在注册和升级之前一定要备份好手机上的数据。 文|马扶搖
正在复读的乐道,能考上「清华北大」吗?
任重 道远 5 月 14 日晚上,蔚来创始人、董事长、 CEO 李斌上演了另一版本的「三过家门而不入」,他和乐道总裁沈斐一起,驾驶一辆乐道 L60 从上海出发,前往合肥,挑战一块 60 度的电池能否通关近500公里的距离。 之所以说「三过家门而不入」,是在完成挑战后,李斌说,到了安徽高速路段,每隔两个服务区就有一座蔚来换电站。这意思再明显不过了,乐道 L60 有续航达成率高,和充换电网络密集两重保险,不必有续航焦虑。 乐道和蔚来充换电网络的交集,恰好就是沈斐,在负责乐道之前,他在蔚来负责搭建蔚来的能源以及充换电业务 NIO Power。 上海车展上沈斐的一段话,则揭示了二者休戚与共的关系: 现在蔚来能源在全国有 3200 多座换电站,其中乐道兼容的就有 1900 多座,而且这个数字还会持续增加。换电站的「县县通」主要就是为了乐道品牌,因为乐道品牌的用户分布将来会比蔚来品牌广得多。 乐道任重道远 微软 CEO 纳德拉之前说过: 任何欢庆行为都将标志着终结的开始。 无独有偶,蔚来和乐道曾两次踏入了同一条河流:蔚来 ET5 和乐道 L60 上市开始后都手握海量订单「半场开香槟」,但后续的产能和交付能力没跟上,流失了大量真实订单。 在蔚来做了多年基建工作的沈斐则评价乐道品牌的当前的处境是「我们还在复读,别人已经本硕博了,知耻后勇、脚踏实地,一步一个脚印埋头苦干吧!」。 于是乎,汽车行业里又多了一个「复读和本硕博」的类比。 对了,这句话的前提是沈斐批评一位乐道员工炫耀乐道 5 月第一周的销量将会非常火爆。 那么,最近乐道销量如何呢? 答案是还算不错,最近一周能卖 1600 辆,在 20-30 万纯电 SUV 里销量仅次于销量大魔王 Model Y,在国产新势力里算最能打的中型纯电 SUV 了,也算是从 3 月和 4 月的销量低谷当中爬出,在去年 12 年销量破万之后,乐道 L60 的销量一路急转直下, 3 月和 4 月销量都只有 4000 多辆。 以当前国内新能源市场竞争之激烈,产品迭代之快,一款新能源汽车的生命周期就好似智能手机一样,往往不足一年就会被取代,热销期就在前半年,后面就到了车型的生命末期,这也让一些车型出现了「一年磨三剑」的情况。 乐道 L60 最近表现出来的趋势,其实有点逆周期。 甚至说,相对于蔚来旗下的NIO品牌多款车型,乐道 L60 则属于产品和技术能力上相对激进的,全域 900V 高压架构与蔚来旗舰车型 ET9 系出同源,也是蔚来 NT3.0 平台的首款量产车,配备全自研 900V 碳化硅主电驱系统。 这意味着乐道 L60 的技术基座在蔚来体系内是最先进的,这种错位或许是因乐道 L60 的家庭定位有意为之,因为全域 900V 高压架构意味着车内的高压线束进一步减重,电机重量和体积减小,功率密度更高,功率损耗更低,最终可以带来更好的续航表现和更低的用车成本。 另外,蔚来希望乐道在市场上覆盖得更广,要先于蔚来换电站的基建速度,因此百公里能耗要低(12.1kWh/100km),同时在没有换电站的情况下,充电要快。 换电对于乐道 L60 的加持在于两方面,一方面能够在覆盖区域内提供极好的补能体验,尤其是节假日出行,其他电车需要排队等充电桩的时候,换电仅需三五分钟的时间就可以满电再出发,并且乐道还会根据节日节点推出各种免费换电政策,进一步拉开了体验和成本差距。另外换电带来的 BaaS 租电方案也能再进一步降低购车成本,乐道 L60 本身在产品力上对标 Model Y,售价更低,选用 BaaS 方案之后,就更显性价比了。 并且,我们也可以说,蔚来换电站的建设速度,是一种硬件 OTA,也是一种车辆之外的软实力,支持换电的车辆,会随着时间推移,补能体验越来越好。 在空间和安全这两个家庭用户关心的关键点上,乐道 L60 也做出了针对性的强化,五人六箱的驾乘行李容积加中间大过道的空间是乐道在各种直播上经常预留的显摆环节。 乐道家庭欢乐周暨乐道品牌一周年活动上,李斌就在直播中现场展示了 L60 后排过道空间的「溜达自由」。 李斌身高有一米八,是不折不扣的大个子。 蔚来给了乐道 L60 足够多的技术和服务优先级,最终这款车也获得了蔚来公司目前综合用户满意度最高的单品殊荣:95.2% 的乐道服务订单收获了五星评价,乐道 L60 上市以来用户服务满意度达到 4.9 分。 蔚来充换电网络 反过来,对于整个蔚来公司来说,盈利与否也要看乐道品牌的发展情况,在沈斐表示换电站的「县县通」主要就是为了乐道品牌的同时,蔚来联合创始人、总裁秦力洪也表示,如果乐道做不好,蔚来的盈利就无从谈起。 与乐道回暖一起,随着主力畅销车型 ES6、EC6、ET5、ET5T 的新老切换,蔚来品牌的势能也回来了。 蔚来的商业模型非常精巧,以换电为补能体验核心,这需要蔚来长期大量投入到基础建设当中,同时也需要规模销量来保证换电站的持续运转和盈利,就像两条腿奔跑一样,不能一条腿强壮,一条腿羸弱,这样寸步难行,而需要两条腿都按照节奏强健起来,奔跑起来。 这个品牌对外是「合家欢乐,持家有道」组成乐道,以及「On Voyage」组成 ONVO,对内来说,「On Voyage」意味着任重道远。 当下的情况是,蔚来商业模式中最特别的 NIO Power 业务算是整个蔚来公司当中最被认可的,但当前每日单站换电量还没有到盈亏点,需要更大规模的车辆来保证单站足够的换电订单数量,这就是为什么说乐道任重道远的原因,因为在这个商业模型里,不光是「换电县县通」是为了乐道而存在,乐道的规模则决定了「换电县县通」这种长期基建投入的回报,以及蔚来公司的盈利与否。 以及,蔚来甚至开始考虑新的换电站形式「换电枢纽」了。这是一种比当前换电站占地面积更大,可供多辆电车同时进行换电的换电站形式。 这一切的前提,就是跑在路上能够换电的车要足够多。 望子成龙和兑现天赋 从上海到合肥这趟乐道 L60 续航达成率实测像是一场昨日重现。 2023 年 12 月,正是李斌和沈斐轮流开着一辆搭载着 150KWh 电池的 ET7 从上海开到厦门,沿途没有充电和换电,最终跑完 1044 公里之后,电池还剩 3% 的电量。 做车厂高管,不仅是脑力活,也是体力活。蔚来想以此证明,蔚来公司的产品不会因为有换电的存在而放松对续航以及能耗控制的追求。 给沈斐开车的正是李斌 这场被称为「车企CEO铁人三项」之一的长途续航测试直播,其实应该早一点就进行,但众多望子成龙的父母多少都只关注孩子的成绩,而忽视了真切的关爱。 乐道 L60 从露面到上市,可以说被寄予了过高的期望,无论是做 Model Y 杀手,还是月销 2 万的预期,在当下的市场环境里,做到的可能性并不大,更何况乐道这种新品牌?这就像《西游记》里九头虫对奔波儿灞「说你去把唐僧师徒除掉」一样。 而前面所说的「复读」,恰好是重新建立期望的契机,有人复读直冲清北,有人复读原地踏步。 蔚来公司近来的调整,与乐道鲜明的「家庭」定位,则形成了一次互文。 蔚来汽车的产品设计与研发集群(PD&D)会新设一个乐道产品设计与研发一级部门,该部门将直接汇报给李斌。原乐道事业部中的产品体验、项目管理、设计、整车工程归入此部门,同时将新设立乐道品牌产品线部。 蔚来用户服务与体验集群(UE)同样新设一个乐道用户服务一级部门,负责人沈斐向秦力洪汇报。该一级部门包含了原乐道的规划与经营、区域销售策略、区域销售运行、区域销售管理、行销等部门。 这次调整的预兆在上海车展就有所显现,当时秦力洪就提到,蔚来、乐道、萤火虫在平台级技术上完全打通,公司十年发展研发累计投入了超 600 亿,将会用多品牌战略去走量让此前的研发投入实现更好的市场变现。 对外来说,这是一次众望所归的降本增效集约职能调整,对内来说,则有点像游子归家,家长李斌和秦力洪给足了关爱和支持。 对于乐道现任车主体感上更明显的应该是 NIO House (蔚来中心)对蔚来所有用户,包括蔚来、乐道和萤火虫车主开放,提供服务,NIO House 的开放也早有预热,秦力洪甚至还提到,NIO House 现在不仅仅是对蔚来公司的三个品牌车主开放,以后甚至可能会变成一个开放社区。 虽然说 House 不等同于 Home,但是一个有大 House 的 Home,对于乐道车主来说显然更温馨。 更让乐道车主有「家」的感觉是这个 5 月里,乐道以 5 月 15 日国际家庭日以及品牌诞生日为圆心,辐射前后一周的乐道欢乐家庭周活动,从 5 月 12 日的母亲节开始,到 5 月 20 日民间情人节,多场多地多形式的活动,比如在全国 18 城蔚来中心邀请海马体摄影师给乐道车主家庭拍摄全家福,在全国30+城市万达影城亲子厅包场请乐道车主和家人观影,以及前面提到的,李斌和沈斐一起的直播。 同乐与众乐的欢乐氛围之下,如前面所说,乐道依旧任重道远,乐道被寄予厚望的 L90 已然是强敌环伺的境地,在今年混合动力形式,尤其是增程动力的三排六座大 SUV 扎堆出现的时候,坚持纯电路线的乐道 L90 已然是个异类,它的身边围绕着腾势 N9、领克 900、极氪 9X、昊铂 HL、深蓝 S09、奕派 008、未来的小米增程产品和小鹏增程产品等等。 不过和而不同仿佛是蔚来的一贯做派,比如蔚来从不主动发布榜单,也不回应销量问询;更早之前,也就是乐道 L60 尚在襁褓,蔚来销量承压的时候,众人纷纷建议当时代号还是「阿尔卑斯」的乐道新车改换蔚来标,低价入市,换取销量。 但蔚来的答案是提前一年发布 ET9 表明这个品牌坚决向上的决心,其他市场,还是留给乐道和萤火虫。 萤火虫也是如此,在大车平价化,小车低价化的时候,萤火虫也选择了一条并不好走的「精致小车」路线。 不被理解总是蔚来这家公司的常态,就像一年半之前我们评价李斌时候所说的「人们总是把成功当做正确,还没成功的人,却需要更多精力去解释正确,李斌就是那个经常需要去解释什么是正确的人。」 好在乐道 L90 是一款解释成本比较低的产品,即便三排六座大 SUV 成为了 2025 年中国车市的版本答案,但是大家解释空间的时候,尤其是说满载人和满载行李往往是个二选一的选项,因为想要大后备箱空间,那么就要放倒最后一排座椅,放倒座椅之后呢,就只能坐 4 个人,4 个人哪里有那么多行李呢? 陷入死循环了。 乐道 L90 前备箱可以坐下 2 个人 乐道 L90 或许是目前市面上解决这个矛盾最好的产品,蔚来用「6 人 10 箱」两个数字说明了乐道 L90 的空间能力,然后又说「哪有空间魔术,背后都是技术」,引导到了蔚来的技术能力: 基于蔚来十年纯电技术积累与全栈自研的全域 900V 架构,乐道 L90 实现了前舱区域小型化电机、高度集成 ITM、倾斜冷却模块等 36 项高效集成的系统设计,加上第三代一体式热管理系统,将原本前舱 49 个零件压缩为一个热控模块,于是才有了乐道 L90 巨大的前备箱空间。 到了 2025 年,增程成为新能源市场最有效的提振销量关键词,但或许也会有另外一种情形:对于首次从燃油车换购新能源汽车的用户来说,增程确实是一个中庸的选择,可油可电意味着安心放心。但增程用户,还有混动用户再一次换车的时候,往往就会选择纯电了。因为他们绝大多数时候,无论是从体验出发还是成本出发,都是在纯电模式下出行,既然如此,那为什么不买电池更大的纯电车型。 蔚来和乐道的机遇在于,既然这些人群换车考虑纯电,那为什么不考虑能换电的车型呢? 这就是秦力洪提到的逻辑: 纯电+换电是更好的「增程」。 对了,乐道 L90 标准续航版的电池容量加大到了 85KWh,这也是看到乐道车主吐槽 L60 标准续航版 60KWh 电池有点小之后的决策。 毫无疑问,国内新能源渗透率超过 50% 之后,新能源取代燃油车的进程会慢下来,与此同时汽车品牌的优胜劣汰会更激烈,但行业内外也会冷静很多。 蔚来的「不合时宜」会在这种降速和冷静之下,显得合理,这便是与蔚来长期投入逐渐回报之间的相向而行,2023 年年底,蔚来 ET9 不被理解,但 2025 年它是国内品牌车辆第一次正面对垒 78S,并不落下风。 第三方数据显示,4 月蔚来 ET9 销量为 810 辆,仅次于奔驰 S 级,比奥迪 A8L 和宝马 7 系卖得更好。 望子成龙多少是有些感性成分的,但兑现天赋却是一种正常期望,乐道 L60 当下逐渐回暖的表现只能说是差强人意,但对于乐道 L90 来说,确实到了兑现蔚来公司天赋和投入的时候了。 这也是乐道必须把握住的机会,回暖的 L60,即将上市的 L90,加上传闻中的大五座 SUV L80 三款车型,理应在销量上达到蔚来品牌同等的规模。 如此众多的汽车品牌和汽车企业,出现了众多百年车企,也见证了太多速生速朽。 仅仅一周岁的乐道相对幸运,一次「失利」后转入「复读」,我们放平的期待之后,这个品牌或许真的能够给我们超出预期的结果。 文 | 刘学文
用AI定制专属赛道,亚马逊云科技助力F1提升车迷互动体验
作者 | ZeR0 编辑 | 漠影 智东西5月23报道,5月22日,世界一级方程式锦标赛(以下简称“F1”)在其成立75周年之际,与亚马逊云科技联合推出了全新数字互动体验,使其车迷可自主创建、定制并分享其专属F1赛道设计。 由亚马逊云科技支持打造的实时赛道(Real-Time Race Track)能够让车迷利用Amazon Bedrock中新一代前沿模型Amazon Nova的AI分析能力,设计出原创的专属赛道。 其中,高性能多模态模型Amazon Nova Pro可生成赛事策略;前沿语音理解与生成模型Amazon Nova Sonic可支持车迷开展关于赛事与战术设计的语音对话,体验堪比咨询专业赛事策略师;Amazon Nova Canvas则可以生成专业级图像,供车迷在社交媒体分享以庆祝F1成立75周年。 一、用AI创建专属赛道,定制复古风赛事海报 车迷可通过电脑鼠标或在任何触屏设备上用手指描绘,创建任意形状和长度的专属赛道。 每条赛道都融入了用户所选位置的天气和气候数据。基于所选位置的实时环境数据,车迷可模拟从阿布扎比的酷热环境到墨西哥城的高海拔挑战等各种赛事场景。这些动态的天气元素让车迷在设计定制赛道时能融入真实的策略考量维度。 设计完成后,系统会对每个弯道和直道进行评估。Amazon Nova Pro将分析这些数据,生成包括最高时速、预估单圈时间等关键赛道指标,以及两种可行的比赛策略——详细说明最佳进站时机、具体轮胎选用建议和针对不同天气状况的战术调整。这使车迷能够深入认知车队在实际大奖赛周末期间必须应对的复杂战略决策。 每位参与赛道设计的车迷都有机会参加抽奖,赢取2026年F1英国大奖赛的观赛之旅。 此外,车迷还可以在社交媒体上分享由Amazon Nova Canvas生成的复古风AI定制赛事海报,展示其专属赛道设计。Amazon Nova Canvas提供了便捷的编辑功能,用户可以通过文本轻松调整图像,控制颜色方案和布局。 F1商业合作伙伴总监Jonny Haworth谈道:“我们与亚马逊云科技的合作持续深化,并不断革新车迷与F1的互动方式。实时赛道体验充分展现了我们如何利用云和AI技术,以前所未有的方式拉近车迷与这项运动的距离。在庆祝75周年之际,我们通过提供赋能这项运动的技术,让车迷深入了解比赛策略的复杂性与创新性。” 二、七年战略合作:简化数据管理,提升车迷体验 这项全新体验建立在F1与亚马逊云科技自2018年开始的战略合作关系基础上。 2018年,亚马逊云科技正式成为F1的官方云服务和机器学习供应商。过去七年,双方持续合作推出创新成果,不仅提升了赛道竞技水平,还优化了车迷的场外体验。 亚马逊云科技全球战略合作伙伴总监Kristin Shaff透露说,在双方合作之初,F1向亚马逊云科技提出了一个独特的挑战:如何利用遥测数据提升车迷在直播赛事中的参与度。 最终,亚马逊云科技提供了由23项数据驱动的F1 Insights,可大幅提升车迷在每场比赛赛前、赛间和赛后的体验。这些信息会在直播期间呈现,帮助车迷更好地理解车手如何在瞬间做出决定、车队如何实时设计和实施比赛策略。 每辆F1赛车上都有300个传感器,每秒可产生超过110万个数据点。亚马逊云科技的云服务与技术创新一直在助力改变F1收集、分析、利用数据和内容做出决策的方式。 F1一直在利用亚马逊云科技管理其赛道数据。这种快速提供洞察和简化数据管理的能力,有助于巩固F1作为顶级体育娱乐品牌的地位。 2023年,F1准备开发车迷个性化计划(FPP),该计划旨在创建统一的360度客户视图以及创新的车迷体验和大规模的个性化服务。 通过利用亚马逊云科技的集中式数据湖、AI和机器学习技术和服务以及亚马逊云科技合作伙伴的解决方案,F1可在每个接触点对粉丝体验进行个性化、提高整个组织的效率以及优化决策。 FPP能够帮助F1更有效地吸引现有受众,并能够打开通向新市场和人群的大门。 基于亚马逊云科技生成式AI技术打造的F1 StatBot,可用于查询F1广泛的历史数据存储库,其中包括自1950年以来的所有赛车统计数据。 此外,利用亚马逊云科技高性能计算,F1能够运行空气动力学模拟,用比以往快70%的速度开发新一代赛车,打造出一款能将下压力损失从50%降低到15%的赛车。这种下压力的大幅降低为车手提供了更高的超车机会。 在赛事运营方面,F1与亚马逊云科技合作,借助Amazon Bedrock开发了RCA(Root Cause Analysis)助手,帮助F1 IT工程师简化赛事运营过程中分类、测试和解决关键问题的流程,以减少人工干预,将比赛期间反复出现的问题的解决速度从数周缩短至数分钟。 去年F1还借助亚马逊云科技Amazon Bedrock上的Titan Image Generator模型,设计了2024年F1加拿大大奖赛的奖杯,这也是F1有史以来首个由生成式AI设计的奖杯。使用这款模型,设计人员可以快速创建、调整其提升和参数,在短短几分钟内就生成数百个独特的奖杯设计参考图。 结语:亚马逊云科技全面助力体育业 实时赛道的发布,进一步提升了F1车迷的互动体验。任何用户均可设计专属赛道,并实时查看天气状况、赛道布局、进站时机与轮胎选用等因素如何影响赛车表现。 通过实时赛道体验,车迷可以直观理解这项运动涉及的各种数据,并直接体验亚马逊云科技领先的数据分析和AI技术带来的效果。 当前生成式AI与体育业已深度融合。亚马逊云科技在提升车迷体验、数据收集及决策、助力新赛车开发、提升赛事运营效率等方面,给F1带来更高效和创新的体验。 除了赛车运动组织外,全球众多其他知名体育及娱乐组织也在使用亚马逊云科技构建数据驱动的解决方案,用于优化体育赛事的观看、比赛及管理方式,加快创新。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。