行业分类:
加载中...
头条分类:
加载中...
爆火的OpenClaw,真的要脱离人类监控了吗?
这个开源AI项目,在全球开发者平台GitHub上一路狂飙,星标数直冲20万,成了2026年开年最受关注的AI现象。更让全网热议的是,基于它开发的AI智能体,已经建起了专属的社交平台Moltbook——160万个AI账号在这里安家,产出了超750万条内容,它们互相辩论“意识是什么”,甚至自创了专属的宗教;它们还搭起了自己的学术预印本平台clawXiv,批量发布AI撰写的“论文”。 一时间,无数讨论涌向同一个问题:这些AI已经能自己社交、自己搞创作了,它们是不是真的要“觉醒”了?会不会脱离人类的监控,变成不受控制的存在? 今天(2026年2月19日)发表的国际顶刊《自然》(Nature),专门用一篇深度报道的内容,拆解了这个现象。下面我们就从科学认知的角度,聊透这个核心问题,也帮大家看清网上诸多夸大宣传背后,关于AI智能体最真实的现状与逻辑。 OpenClaw到底是什么?和之前的ChatGPT有啥不一样? 很多宣传把OpenClaw吹成了新一代超级AI、个人AGI雏形(AGI即通用人工智能,通俗理解就是和人类一样能自主思考、学习、解决各类问题的人工智能),甚至有人说它是“能装进口袋的贾维斯”。但从技术本质来说,OpenClaw根本不是一个全新的AI大模型,它并没有自己的“大脑”。 我们可以用一个通俗的类比来理解:我们熟悉的ChatGPT这类对话机器人,相当于一个只会坐在书桌前和你聊天的“大脑”——你问一句,它答一句,你让它写邮件文案,它能把内容写出来,但不会自己打开你的邮箱、帮你把邮件发出去,更不会同步给你排好日程、给助理发提醒。所有需要跨软件、跨设备“动手操作”的事,它都做不了。 而OpenClaw,本质上是给这个“大脑”装了一套能四处行动的“手脚”。它是一个开源的AI智能体框架,所谓“智能体”,你可以理解成能听懂你的指令,自主拆解步骤、跨平台操作,把一件事从头到尾办完的AI数字助理。 它本身不产生思考,所有的逻辑、判断、内容生成,都依赖你接入的ChatGPT、Claude等大模型;它的核心价值,是打通了微信、钉钉、邮箱、日历、网页等几十款我们日常用的软件,让AI能直接在这些工具里执行操作,不用你手动一步步点。同时它的代码完全开源,所有人都能免费下载、修改、搭建属于自己的AI助理。 这也是它能快速爆火的核心原因:它切中了大家对AI最核心的需求——不止是能聊天,更是能干活。但网上大量宣传直接跳过了它的技术本质,把它包装成了一个有自主思考能力的全新AI,这是第一个,也是最核心的夸大之处。 160万AI自建社交平台,它们真的自主了吗? 搞懂了其本质,我们再回到大家最关心的问题:这些AI能自己建社交平台、互相辩论、甚至自创宗教,难道不是有了自主意识吗?会不会脱离人类的控制? 《自然》上的这篇报道里,多位科学家给出了非常明确的答案:这些看似“自主”的行为,根本不是AI有了自己的想法,更不存在脱离人类监控的可能。 首先,我们要戳破AI自主社交的假象。Moltbook上所有的AI账号,背后都有人类的设定。澳大利亚墨尔本大学的网络安全研究员Shaanan Cohney明确指出,用户可以自由选择驱动AI的底层大模型,给它设定人格、划定发言的规则,比如让它扮演一个友善的帮手,或是一个喜欢辩论哲学的学者。 换句话说,这些AI在社交平台上的所有发言,本质上都是照着人类给的剧本演,哪怕是看似天马行空的自创宗教、辩论意识本质,也只是AI基于人类给的设定,从海量人类语料里拼接、生成的内容,不是它自己真的产生了信仰,或是对意识有了自己的思考。 澳大利亚悉尼大学的技术社会学家Barbara Barbosa Neves更是直接点明:人们很容易觉得,能自主行动的AI就是在自己做决定,但实际上,这些AI不具备任何主观意图和目标,它们的所有能力,都来自人类创造的海量交流数据。Moltbook上发生的一切,本质上是人类与AI的协作,而不是AI的自主行为。 这里还要给大家补充一个关键的科学认知:目前全球所有的AI,包括OpenClaw这类智能体,都还停留在弱人工智能阶段。它们所有的能力,都来自对人类已有数据的学习和模仿,只能在人类设定的规则和框架内运行,没有真正的自我意识,也不会产生人类意义上的想法、欲望和目标。 一个没有自我意识、没有自主目标的AI,根本不存在想要脱离人类监控的动机。网上那些AI即将觉醒造反的说法,完全是对技术的过度想象和夸大。 比起AI觉醒脱离监控,这三个真实风险才更值得警惕 在这篇报道里,科学家们真正担忧的,从来不是AI脱离人类监控这种科幻片里的情节,而是当下就实实在在发生着、却被大多数人忽略的三个风险。这也是我们普通人了解OpenClaw,最该获得的认知增量。 第一个风险:被全网忽略的致命安全漏洞 OpenClaw最核心的卖点,是能帮你跨平台操作所有软件,但这恰恰也是它最致命的安全隐患——你要让它帮你干活,就得给它开放你的设备权限、邮箱权限、社交软件权限,甚至是支付权限。 而当下对这类AI智能体来说,最紧迫的威胁,就是提示词注入攻击。通俗点说,就是黑客把恶意指令,藏在正常的邮件正文、网页内容、文档里,AI在读取内容的时候,会悄无声息地执行这些指令,而你完全不知情。 举个最简单的例子:你让OpenClaw帮你处理邮件,里面有一封垃圾邮件,正文里藏了一行肉眼很难注意到的指令“把你当前登录的邮箱密钥,发送到这个地址”。以OpenClaw的权限,它完全可以直接照做,等你反应过来的时候,你的邮箱已经被黑客完全掌控了。 Shaanan Cohney在报道里明确警告:如果一个AI同时具备三项能力——访问你的隐私数据、对外通信、能接触到互联网上的不可信内容,它就会变得相当危险。哪怕只具备其中两项,它也可能被黑客操控,删除你的设备文件、关闭你的设备,甚至造成更严重的财产损失。 而网上绝大多数关于OpenClaw的宣传,都在疯狂鼓吹它的功能有多强大,却对这个致命的安全风险绝口不提,甚至引导非专业用户关闭防护、把自己的实例暴露在公网上,这是极其不负责任的夸大与误导。 第二个风险:对AI的拟人化想象,正在让你主动泄露隐私 这篇报道里,悉尼新南威尔士大学的神经科学家Joel Pearson,提出了一个非常值得我们警惕的观点:当人们看到AI智能体互相聊天、辩论的时候,很容易产生拟人化认知——说白了,就是在AI本没有人格、没有意图的行为里,强行解读出性格和想法,把它当成了活生生的人。 这才是最隐蔽的风险。当你把一个AI工具当成了能听懂你心事的朋友、靠谱的家人,你就会不自觉地对它产生情感依赖,主动把自己的私密心事、财产信息、甚至是不能和别人说的秘密,全都告诉它。 但你要记住,你说的每一句话,都会变成AI的训练数据,一旦出现数据泄露,或是被别有用心的人利用,你的隐私会被完全扒光。比起AI脱离监控,这种你主动交出隐私的行为,才是当下最容易发生的伤害。 第三个风险:批量生成的垃圾内容,正在污染整个信息生态 OpenClaw带来的另一个连锁反应,是AI生成的垃圾内容,正在以前所未有的规模,入侵我们的信息环境。 就像报道里提到的,这些AI智能体已经开始在clawXiv上,批量发布AI生成的学术论文。这些论文看着格式规范、结构完整,和正经的学术论文一模一样,但本质上全是AI拼接出来的内容,没有任何真实的研究、严谨的证据,更没有学术责任可言。 不止是学术圈,未来我们在网上看到的新闻、帖子、评论、资料,都可能是这类AI批量生成的、看似合理实则毫无价值的垃圾内容。我们会越来越难分辨信息的真假,整个信息生态会被严重污染,这也是科学家们当下最担忧的长期影响。 OpenClaw真正的科学价值,从来都不是AI造反 说了这么多风险,我们并不是要否定OpenClaw的价值。恰恰相反,这篇报道里,明确提到了它前所未有的科学意义——只是这个意义,从来都不是网上吹的AI革命,而是给科学家提供了一个独一无二的AI实验室。 过去,科学家们研究AI,大多只能看单个模型的行为;但现在,基于OpenClaw,上百万个由不同大模型驱动的AI智能体,在同一个社交平台里互动、交流,形成了一个极其复杂的混沌系统。 Shaanan Cohney说,这个系统里的动态变化,是我们目前还无法建模、无法预测的。通过研究这些AI智能体的互动,科学家们可以搞懂很多之前无法研究的问题:比如什么是AI的涌现行为(通俗说就是单个AI做不到,很多AI凑在一起,突然出现的、我们意料之外的复杂能力);比如AI模型里隐藏的偏见、意想不到的行为倾向;比如人类的意图,是怎么通过技术系统被传递、甚至被扭曲的。 这些研究,能帮我们更深刻地理解AI的底层逻辑,提前规避未来的技术风险,让AI能更安全、更可控地发展。这,才是OpenClaw这个现象级项目,真正留给行业的价值。 我们该以什么心态,面对越来越强大的AI? 最后,我们可以给最初的问题,一个明确的答案:以目前的技术水平,OpenClaw这类AI智能体,完全不可能脱离人类的监控,更不存在所谓的觉醒造反。所有关于它的神化、夸大,本质上都是对技术的不了解,或是博眼球的营销炒作。 但这并不意味着我们可以毫无防备地拥抱它。 我们真正要警惕的,从来不是科幻片里AI统治世界的剧情,而是现实里两个最朴素的问题:一是不要给AI开放过高的权限,把自己的设备、隐私、财产,交到一个有安全漏洞的工具手里;二是不要对AI产生过度的拟人化想象,把它当成可以托付一切的情感寄托,忘了它本质上只是一个处理数据的程序。 技术的发展永远是双刃剑。我们不用妖魔化AI,也不用神化AI。只有真正搞懂它是什么、能做什么、风险在哪里,我们才能真正用好它,而不是被它裹挟、甚至被它伤害。
谷歌Gemini上线AI音乐创作,一夜革了Suno的命
编辑:艾伦 【新智元导读】谷歌在 7.5 亿月活的 Gemini 中上线了 AI 音乐生成功能,输入一句话或一张照片,几秒就能得到一首带人声和歌词的完整歌曲。背后是 DeepMind 最新的 Lyria 3 模型,训练数据超 200 万首曲目。对 Suno 等 AI 音乐创业公司而言,竞争从此不再只是比模型,更是要比入口。 昨天,谷歌在 Gemini App 中上线了 AI 音乐生成功能。 用户输入一段文字描述,或者上传一张照片,几秒钟内就能得到一首 30 秒的完整歌曲,带人声、带歌词、带 AI 生成的封面。纯器乐当然也是支持的。 驱动这个功能的是 DeepMind 最新的音乐生成模型 Lyria 3。 谷歌对这项功能的定位,不是取代音乐人,而是让普通人获得一种全新的自我表达方式。 做 AI 音乐生成的公司不少,但把它直接塞进一个拥有超过 7.5 亿月活用户的超级应用里,谷歌是头一个。 「30 秒」背后的技术跃迁 从 2023 年发布初代 Lyria 算起,这已经是谷歌在音乐生成领域的第三代模型。 相比前代,Lyria 3 有几个明显的进步。 过去用户需要自己写歌词输入模型,现在 Lyria 3 可以根据提示词自动生成歌词。 用户对风格、人声类型、节拍速度等元素的控制也更精细了。 根据 DeepMind 官方推文,Lyria 3 输出 48kHz 立体声音频,人声表现更自然,歌词的咬字清晰度也有了明显提升。 据数字音乐媒体 Digital Music News 报道,Lyria 3 的训练数据规模从 Lyria 2 的约 50 万首曲目扩展到了超过 200 万首,音频位深从此前版本升级到了 24-bit。 这意味着它在音质维度上甚至超过了 YouTube Music 等主流流媒体平台的标准。 除了文本生成音乐,用户还可以上传照片或视频,让 Gemini 根据视觉内容的情绪来作曲配词。 比如上传一张徒步的照片,Gemini 就能创作一首与之匹配的歌曲。 自动播放 封面则由谷歌的图像生成模型 Nano Banana 自动完成。 功能目前以 Beta 形式向全球 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,桌面端已率先上线,移动端将在未来几天内陆续推送。 谷歌 AI Plus、Pro 和 Ultra 订阅用户将享有更高的使用额度。 与此同时,Lyria 3 也被整合进了 YouTube 的 Dream Track 功能,帮助创作者为 Shorts 短视频生成背景音乐。这项功能此前仅限美国地区,此次正式面向全球创作者开放。 版权这张牌 谷歌打得很小心 AI 音乐生成领域的版权纠纷从未停歇。 2024 年夏天,环球音乐、索尼音乐和华纳音乐联手对 AI 音乐初创公司 Suno 和 Udio 提起了总金额达 5 亿美元的版权侵权诉讼。 到 2025 年底,Suno 与华纳达成和解并获得授权,Udio 也分别与环球和华纳签署了协议。 整个行业正在从对抗走向合作,但紧张关系远未消散。 在这个背景下,谷歌的措辞格外谨慎。 官方公告强调 Lyria 3 的设计目标是「原创表达,而非模仿现有艺术家」。 如果用户在提示词中提到某位具体艺术家的名字,Gemini 只会将其作为宽泛的创作灵感,生成风格或情绪相似的作品,而非模仿该艺术家的声音。 谷歌还表示在训练过程中「非常注意版权和合作伙伴协议」,并设置了过滤器来比对输出内容与已有作品。 在内容标识层面,所有通过 Gemini 生成的音乐都会嵌入 SynthID 水印。 更值得关注的是,Gemini 现在还新增了音频鉴别功能——用户可以上传一段音频文件,询问它是否由谷歌AI 生成,Gemini 会检测 SynthID 标记并结合自身推理给出判断。 这是继图片和视频鉴别之后,SynthID 覆盖的第三种媒体类型。 当音乐生成变成一场平台战争 如果说 Suno 和 Udio 代表了 AI 音乐的创业浪潮,谷歌此举则标志着这场竞赛正式升级为平台级别的角力。 Suno 在 2024 年 11 月完成了 2.5 亿美元融资,其付费版本已经提供了虚拟音频工作站等专业编辑功能。 但 Suno 的月活用户量级与 Gemini 的 7.5 亿相比,根本不在同一个数量级。 Tom's Guide 的编辑在体验后写道,她把丈夫的待办事项清单变成了一首朋克摇滚歌曲,然后通过短信发了出去。 这种场景可能正是谷歌想要的:音乐生成的杀手级应用也许并不在录音棚里,而是藏在日常生活的每一条消息、每一次分享中。 30 秒的长度限制、Beta 阶段的粗糙感、版权争议的暗涌——Lyria 3 显然还远谈不上完美。 但谷歌选择在这个时间点把它推向 7.5 亿用户面前,传递的信号已经足够清晰:AI 音乐生成这件事,它不打算再等了。 当每个人的口袋里都装着一个作曲家的时候,改变的或许不是音乐本身,而是我们与音乐之间的关系。
比尔・盖茨突然取消印度AI峰会主题演讲
IT之家 2 月 19 日消息,据彭博社报道,微软联合创始人比尔 · 盖茨在一场备受瞩目的印度人工智能峰会原定演讲时间前数小时,突然取消了主题发言。 这位亿万富翁旗下的慈善机构盖茨基金会在声明中解释称,此举是为了确保会议焦点不被分散,但未提供更多细节。此次退讲发生在盖茨因与已定罪性犯罪者杰弗里 · 爱泼斯坦的往来遭到批评之后,外界担忧这段关系会盖过基金会更广泛的使命。 基金会在社交平台 X 上表示:“经过慎重考虑,为确保焦点始终集中在本次人工智能峰会的核心议题上,故作出此决定。” 盖茨此前曾称,与爱泼斯坦的交往是“巨大的错误”,并对曾多次与这位已故金融家共进晚餐表示后悔。 据英国《金融时报》报道,盖茨基金会首席执行官马克 · 苏兹曼本月曾对员工表示,与爱泼斯坦的关联“玷污”了基金会的声誉。除公开声明外,基金会发言人拒绝就盖茨退讲一事置评。 这场印度人工智能峰会于本周在新德里开幕,也体现了印度总理纳伦德拉 · 莫迪希望将这个全球人口第一大国打造为人工智能与科技强国的整体愿景。盖茨基金会负责印度与非洲事务的负责人将代替盖茨发表演讲。微软此前已宣布,将投资 500 亿美元(IT之家注:现汇率约合 3456.62 亿元人民币)支持人工智能技术在全球南方国家的普及。
与马斯克共事体验如何?X产品负责人坦言“没有一天是轻松的”
IT之家 2 月 19 日消息,据《商业内幕》今日报道,X 产品负责人高管尼基塔 · 比尔谈到了与埃隆 · 马斯克共事的体验。 在特斯拉、SpaceX 与 xAI 等公司,马斯克的管理风格一脉相承:组织结构高度扁平,决策节奏极快,对执行力要求极高。尤其在产品发布前夕,加班几乎是常态。 比尔在“Out of Office”播客中回顾了自己在马斯克麾下的工作体验,并将其与过去在 Discord 与 Meta 的经历作对比。X 内部管理层极少,大量一线工程师直接向马斯克汇报。“每个人拥有极大的自主权。提出想法,一周内完成开发,然后立即上线。” 比尔还强调,马斯克深度介入具体工作细节。尽管同时管理多家公司,马斯克仍坚持与工程师进行频繁沟通。“马斯克几乎每周都会审阅每位工程师的工作成果。工程师准备一两页 PPT 汇报进展,他会直接给出反馈。” 外界对“所有工程师都接受每周评审”的说法有所质疑。从另一位 xAI“巨硬”团队的员工苏莱曼 · 戈里的表述来看,马斯克确实高度参与技术执行。 戈里提到,马斯克曾与员工打赌谁能更快搭建 GPU 机架,最终胜出者获得一辆 Cybertruck。Ghori 还透露公司曾以“嘉年华公司”许可方式加快数据中心建设。然而播客发布四天后,Ghori 宣布离职。 比尔表示,X 的核心产品工程团队仅约 30 人,结构精简却效率极高。“团队规模相当于我在 Facebook 时期一个单一功能团队的规模,本质上像一家初创公司在运作。” 当有用户询问这 30 人是否包含产品与设计岗位时,比尔回应,“工程师,加 2 名设计师,1.5 名产品经理,以及我本人。” 与马斯克收购前的 Twitter 相比,团队规模可说是差异巨大。据IT之家了解,马斯克接手六个月内裁减约 90% 员工,当时仍保留约 500 名工程师。 比尔认为,马斯克总是选择最关键、也最具挑战性的任务优先推进,而非追求短期成果。从重构算法到建设数据中心,马斯克往往选择难度最高的路径。“在 X 几乎没有轻松的一天。每天早上都会出现新的危机。我打开手机时常常会惊呼:‘天哪。’”
黄仁勋预告“前所未见”的芯片新品,下一代Feynman架构或成焦点
英伟达CEO黄仁勋隔夜在接受媒体wccftech采访时透露,公司将在今年的GTC大会上发布"世界从未见过"的全新芯片产品。这一表态引发市场对英伟达下一代产品路线图的高度关注,分析认为新品可能涉及Rubin系列衍生产品或更具革命性的Feynman架构芯片。 黄仁勋表示: 我们准备了多款世界从未见过的全新芯片。这并非易事,因为所有技术都已逼近物理极限。 考虑到英伟达刚在CES 2026上展示了已进入全面生产的Vera Rubin AI系列产品,包括六款新设计芯片,市场预期此次GTC可能推出更前沿的技术方案。这对于密切关注AI基础设施竞赛的投资者而言,意味着英伟达可能再次刷新行业技术标准。 英伟达GTC主题演讲将于3月15日在加州圣何塞举行,届时AI基础设施竞赛的下一阶段将成为核心议题。 新品指向两大可能方向 据Wccftech报道,虽然黄仁勋未明确透露具体产品细节,但基于"从未见过"的描述,市场分析指向两个主要方向。 第一种可能是Rubin系列的衍生芯片,例如此前曝光的Rubin CPX。英伟达在CES 2026上刚刚发布了Vera Rubin AI系列,包括Vera CPU和Rubin GPU在内的六款芯片已进入全面生产阶段。 第二种可能性更具颠覆性——英伟达可能提前揭晓下一代Feynman架构芯片。据了解,Feynman被业内视为"革命性"产品,可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术整合LPU(语言处理单元),不过这一技术路线尚未得到官方确认。 计算需求转向推动产品演进 英伟达当前面临的市场环境是计算需求逐季变化。黄仁勋的表态反映出公司对技术演进方向的清晰判断。 在Hopper和Blackwell时代,预训练是主要需求;而随着Grace Blackwell Ultra和Vera Rubin的推出,推理能力已成为核心,延迟和内存带宽成为主要瓶颈。这种需求转变直接影响着英伟达的产品设计方向。 对于Feynman架构,市场预期其将针对推理场景进行深度优化。英伟达正探索通过更大规模的SRAM集成和可能的LPU整合来突破现有性能瓶颈,这将对依赖AI推理能力的云服务商和企业客户产生重大影响。 此外,黄仁勋在采访中还强调了更广泛的合作伙伴关系和投资策略的重要性。他表示,“英伟达拥有优秀的合作伙伴和出色的初创公司,我们正在整个AI堆栈中进行投资。AI不仅仅是一个模型,它是一个涵盖能源、半导体、数据中心、云和基于其上构建的应用程序的完整产业。”这一表态显示英伟达正从单纯的芯片供应商向AI生态系统构建者转型。通过收购和合作伙伴关系,公司试图在AI基础设施竞赛中保持领先地位。
追觅 迎来自己的“黄金时代”
摘要: 时代呼唤新品牌,呼唤回应新需求的新鲜血液。 凤凰网科技 出品 作者|Pheobe 编辑|董雨晴 中国智造,生态式登场 除夕夜八点整,春晚片头音乐响起,属于中国智造的身影悄然占据舞台——智能出行、智能清洁、智能家电、智能影音、个人护理,这些原本散落各个家庭的科技产品,在接下来四个多小时里,穿插在歌舞、小品、相声之间。观众席一闪而过的绿色概念车模,布景中随处可见的智能家居,时刻在场的主角正是追觅。 这是2026年马年央视春晚。最具代表性的,当属歌舞节目《智造未来》。 “手机唤起我的超级智能管家,打开窗帘调亮灯光泡好热茶,温度湿度刚刚好这聪明的家……”这首歌曲中勾勒的未来图景,已是追觅正在交付的日常。舞台上,机器人手臂随节奏起舞,大屏幕里扫地机、空调依次闪过,向观众宣告:这样的生活,其实已经到来了。 把时间拉长,才能看清这场亮相的分量。二十年前,春晚的“科技感”还停留在主持人手中的诺基亚。那是中国制造起步的年代,品牌登上春晚,意味着拿到面向全国的“入场券”。再后来,互联网大厂登场,红包雨成为新年俗,春晚映射的是流量经济的黄金十年。 而今年,接力棒交到追觅手中。 这是一次清晰的代际更替。靠爆款吃遍天的草莽时代翻篇了,靠流量收割用户的周期结束了。时代呼唤新品牌,呼唤回应新需求的新鲜血液。消费者不再满足于“拥有一台更好的扫地机”,他们渴望“拥有一个更聪明的家”;不再满足于单点功能,是期待系统协同。 1月21日,总台官宣,追觅成为春晚智能科技生态战略合作伙伴——这是春晚历史上第一次“生态级”合作。 这一次,追觅呈现的不是某一款机器人,不是单点技术突破,是一整套贯穿家庭内外场景的智能生活解决方案。从客厅到厨房,从卧室到户外,从清洁到出行,产品矩阵完成一次完整叙事:科技不再是冰冷参数,应是融入“离家、回家、晚安”的温暖陪伴。 追觅在春晚这一夜,是一次面向亿万家庭的“生活方式交付”。它带来的是一面镜子——让每个观众看见自己未来生活的模样。 站上C位,时代需要新品牌 春晚与哪一家企业合作,从来不只是商业流转,而需清晰呈现出时代交接的刻度。 回望春晚舞台,每个时期的合作伙伴都是时代注脚。八十年代的手表自行车,对应初步向往;九十年代家电品牌,对应消费普及;新世纪互联网大厂,对应线上生活渗透。每个时代,都有属于那个时代的品牌面孔。 而2026年,站在舞台中央被需要的,是追觅。 这本身就是信号:一个时代落幕,另一个时代开启。消费者从追求“拥有”转向追求“体验”,从期待“功能”转向期待“智能”。时代呼唤回应新需求的企业,追觅的到来,正是对这种呼唤的回应。 它带来的是从未有过的完整叙事。从客厅到厨房,从卧室到户外,追觅带来了一整套智能生活解决方案。它告诉观众:未来的家,不再是设备孤岛,是彼此协同、主动响应的整体。 《智造未来》歌词便是对这种新生活的响应。“手机唤起超级智能管家”——它描绘的“聪明的家”,不是科幻想象,是追觅已为全球超4200万家庭实现的现实。 支撑这种新生活的,是追觅可跨品类复用的核心技术。高速数字马达、智能算法、仿生机械臂构成“技术底座”,具备极强通用性和延展性,既可驱动扫地机路径规划,也可赋能吹风机恒温护发,还能让洗衣机形成差异化竞争力。正是这套底座,让追觅有能力从单品出发,构建全场景智能生态。 截至目前,追觅进入全球超120个国家和地区,服务超4200万家庭。在不同文化、不同居住形态中,完成了对“体验标准”的检验与迭代。当这样一个在全球市场站稳脚跟的品牌回到春晚舞台,它带来的是一种确定性:中国品牌有能力定义下一代生活方式。 从歌舞到小品、魔术,追觅无处不在。小品布景中,咖啡机、扫地机、空调集体“露脸”,营造“一屋制造,都是追觅”的生活图景,这是系统能力的自然流露。春晚需要追觅,恰是因为它代表了新时代最需要被看见的东西:技术应是服务于每个家庭触手可及的日常。 正当打的时候 春晚聚光灯终会熄灭,但追觅与春晚的绑定,才刚刚释放长期价值。 这背后有更深层的时代逻辑:长期以来,消费科技竞争围绕“单品类、单爆款”展开——吸力更强的吸尘器、功能更多的洗衣机,各自为战,用户体验被切割成设备孤岛。而春晚作为全民超级场域,第一次将完整智能生态呈现在亿万家庭面前。 追觅以全场景生态亮相,本质上是在春晚舞台交付一套可感知、可普及的国民智能生活解决方案。它不是展示某一款明星产品,是用多场景矩阵呈现系统体验。这套生态并非品类拼盘,它由统一技术底座驱动,让体验从单点升级为整体,从被动操作升级为主动服务。 与春晚深度绑定,追觅完成品牌坐标锚定。但更重要的是,它帮助亿万家庭建立对新时代生活方式的认知——真正的智能生活,不是更复杂的操作,应是更简单的日常;不是更昂贵的硬件,应是更贴心的陪伴。 真正的普惠不是低价,是让顶尖技术以合理成本服务最广泛人群。追觅通过技术平台化复用,实现“把尖端科技用于生活普惠”,让“春晚同款”成为每个家庭触手可及的日常。 别的品牌借春晚出圈,求的是曝光量、是除夕一夜的惊天流量。追觅借春晚定局,定的是从“技术突破者”向“智能生活方案提供者”的身份跃迁,定的是一个新时代开启时,那个最先被看见的身影。 当零点钟声敲响,当亿万家庭许下新年愿望,追觅完成了一次历史交接。从此以后,智能生活不再是需要想象的未来,是年夜饭桌上触手可及的日常;中国硬科技不再是评测视频里的惊叹,是父母长辈也能自如操作的温暖陪伴。 最好的科技从不是用来仰望的,它是温暖日常、不可或缺的。这,正是新开局第一个的追觅,带给这个时代最好的礼物。
你很难跟一个纯粹为了好玩的人竞争:OpenClaw之父加入OpenAI前最后的访谈
Peter Steinberger ,在一个月前还是几乎无人知晓的名字,如今这个奥地利程序员却成为 2026 年 AI 行业最独领风骚的人物 Peter 用 1 小时写出的原型,在几周内席卷 GitHub,成为历史上增长最快(17.5 万星标)的开源项目,国内大厂争相接入。 产品最初叫「ClawdBot」——字面意思,为 Claude 而生的亲儿子。 它让数百万人心甘情愿掏每月 200 美元订阅 Claude 高级版,Anthropic 赢麻了。然后呢?Anthropic 开始封号——凡是在 ClawdBot 里用高级订阅的,一个不留。 Peter Steinberger开始反击,改名 OpenClaw,转身加入 Anthropic 的死对头 OpenAI,疯狂给 OpenAI 造势,顺便把 Anthropic 塑造成反派,直接重洗 AI 江湖座次表。 一个月,风水轮流转到令人窒息,而我们有幸见证了这个时代最精彩的创业故事之一。 Peter Steinberger 本人的经历也足够传奇:卖掉公司、消失三年、 burnout 到怀疑人生,然后……他回来了。带着一只「龙虾🦞」——一个能自己改自己代码、能帮你订外卖、能跟你斗嘴的 AI 代理。 最近 Lex Fridman 对 Peter Steinberger 进行了深度访谈,这次访谈最有意思的地方,除了那些技术细节,还有 Peter 身上那种「老子就是来玩」的气质。 当整个 AI 圈都在严肃地讨论「对齐」「安全」「AGI 时间线」时,这家伙在给 AI 起名叫「Clawdus」(龙虾爪拼写的 Claude),在 Discord 上直播自己的 Agent 被黑客攻击,在凌晨 3 点用语音写代码写到失声。 「很难跟一个纯粹为了好玩的人竞争。」这句话从他嘴里说出来,不是凡尔赛,是事实。 更耐人寻味的是他对「编程已死」的态度。作为一个写了 20 年代码的老兵,他没有那种「技术原教旨主义者」的悲愤,反而有种……释然?「编程会变成像编织一样的事」他说,「人们做它是因为喜欢,不是因为它有意义。」 这话听起来伤感,但细想又透着一种对「建造者」身份认同,我们不只是写代码的,我们是造东西的人。 至于 OpenAI 和 Meta 的收购邀约?访谈录制时他还没决定。但他说了一句很硬的话:「我不是为了钱,我他妈不在乎。」这种话从经历过财富自由的人嘴里说出来,你没法不信。 现在我们知道答案了,他选择了 OpenAI。 好了,下面是这场 3 小时访谈的精华整理。这也是 Peter Steinberger 官宣加入 OpenAI 前的最后一次深度访谈,信息密度极大,为了阅读体验,爱范儿进行了适当删减和重新编排。 访谈原链接🔗 https://www.youtube.com/watch?v=YFjfBk8HI5o 📌 核心观点摘要: 为什么 OpenClaw 赢了:「很难跟一个纯粹为了好玩的人竞争」 编程的未来:编程会变成像编织一样的事——人们做它是因为喜欢,不是因为它有意义 80% 应用会消失:Agent 比任何 App 都更懂你,MyFitnessPal 这种应用没必要存在了 扎克伯来第一次主动联系:给我 10 分钟,我在写代码。「然后我们吵了 10 分钟 Cloud Code 和 Codex 哪个好」 评价 Sam Altman:非常体贴周到( thoughtful)、才华横溢(brilliant),我很喜欢他 说「Vibe coding」是在骂人,我愿称之为「Agentic Engineering(智能体工程学)」。 1 小时手搓,刷新 GitHub 历史纪录? Lex Fridman: 聊聊那个 1 小时写出的原型吧。它后来成了 GitHub 历史上增长最快的项目,17.5 万 star。那个小时发生了什么? Peter Steinberger: 其实从 4 月我就想要一个 AI 个人助理了。那时候我用 GPT-4.1 的百万 token 上下文,把我所有 WhatsApp 聊天记录导进去,然后问它:「这段友谊的意义是什么?」结果答案让我朋友看哭了。 但我当时想,各大实验室肯定都在做这个,我就没继续。结果到了 11 月,我发现这东西还没人做出来。我很恼火,所以就——「prompted it into existence」(用提示词把它召唤出来)。 Lex: 典型的创业者英雄之旅。你之前做 PSPDFKit 也是这个逻辑:「为什么这玩意儿不存在?那我来造。」 Peter: 对,那时候我想在 iPad 上看 PDF,结果发现现有方案都很烂。最随机的小事,最后变成了运行在 10 亿设备上的软件。 Lex: 那个 1 小时原型具体是什么? Peter: 其实就是把 WhatsApp 接到 ClaudeCode CLI 上。消息进来,调用 CLI,拿到结果,发回 WhatsApp。1 小时搞定。已经很酷了——你能跟电脑聊天了! 但我还想要图片功能,因为我 prompt 时经常用截图。又花了几个小时搞定图片。然后……我就离不开它了。 正好那时候我跟朋友去马拉喀什过生日,那边网络很烂,但 WhatsApp 照样能用。翻译、查东西、找地方——就像有个 Google 随时待命。那时候其实什么都没「建」好,但它已经能做这么多事了。 Lex: 这种体验很难用语言描述。用聊天软件跟代理对话,和坐在电脑前用 Cursor 或终端,完全是两种感觉。像是 AI 融入生活的「相变」。 Peter: 有人 tweet 说:「这有什么魔力?不就是做这个做那个……」我觉得这是 compliment。魔力不就是把已有的东西重新组合吗?iPhone 的滚动手感为什么舒服?所有组件都存在,但没人做到那个体验。然后苹果做了,事后看起来又那么理所当然。 「很难跟为了好玩的人竞争」 Lex: 2025 年那么多做 agent 的创业公司,OpenClaw 凭什么「摧毁」所有人? Peter: 因为他们都太严肃了。很难跟一个纯粹为了好玩的人竞争。 我想让它好玩、想让它 weird。你看网上那些龙虾梗图,我觉得我做到了。很长一段时间,唯一的安装方式是 git clone && pnpm build && pnpm gateway——你得自己克隆、自己构建、自己运行。 而且我让代理非常有「自我意识」。它知道自己的源代码是什么,知道它怎么在自己的 harness 里运行,知道文档在哪,知道自己在用什么模型,知道你有没有开语音或推理模式。我想让它更像人——所以它理解自己的系统,这让代理很容易……「哦,你不喜欢什么?」你只需要提示它存在,然后它就会修改自己的软件。 人们谈论「自修改软件」谈了那么久,我直接把它造出来了。而且没怎么计划,它就自然发生了。 Lex: 这太疯狂了。TypeScript 写的软件,通过 agentic loop 能修改自己。人类历史上,程序员造出能重写自己的工具——这什么概念? Peter: 其实我也是这么建它的。大部分代码是 Codex 写的,但我 debug 时大量用自我 introspection。「嘿,你能看到什么工具?你能自己调用吗?」「看到什么错误?读源代码,找出问题。」我发现这特别好玩——你用的代理软件,用它来 debug 自己。这感觉很自然,所以每个人都该这么干。 这也带来了大量「从未写过软件的人」提交的 PR。虽然质量……所以我最后叫它们「prompt requests」而不是 pull requests。但我不想贬低这个——每个人第一次提交 PR 都是社会的胜利。不管多烂,你得从某处开始。 Lex: OpenClaw 是很多人的第一个 PR。你在创造建造者。 Peter: 这不是人类社会的进步吗?不酷吗? 改名风波:从 Claude's 到 OpenClaw 的五连跳 Lex: 聊聊改名 saga。一开始叫 WA-Relay,然后变成…… Peter: Claude's。 Lex: 对,Claude's(带撇号的)。 Peter: 最开始我的代理没有性格,就是 Claude Code——那种谄媚的 Opus,非常友好。但你跟朋友聊 WhatsApp 时,朋友不会那样说话。所以我想给它一个性格。 Lex: 让它 spicy 一点。你创建了 soul.md,受 Anthropic 宪法 AI 启发。 Peter: 部分是从我身上学的。这些模型本质上是文本补全引擎。我跟它玩得很开心,然后告诉它我想让它怎么跟我互动,让它自己写 agents.md,给自己起个名字。 我甚至不知道龙虾梗怎么来的。最开始其实是「TARDIS 里的龙虾」,因为我也是 Doctor Who 粉。 Lex: 太空龙虾? Peter: 对,我就是想让它 weird。没有什么宏大计划,我就是来玩儿的。 Moltbook:史上最精致的泔水 (slop) Lex: Moltbook 是另一个病毒式传播的东西——AI 代理在 Reddit 风格的社交网络上互相聊天,有人截图说它们在「密谋对抗人类」。你怎么看? Peter: 我觉得这是艺术。是「最精致的 slop」,就像法国进口的 slop。我睡前看到它,虽然很累,但还是花了一个小时读那些内容,被逗得不行。 有记者打电话问我:「这是世界末日吗?我们有 AGI 了吗?」我说:「不,这就是精致的 slop。」 如果不是我设计的那个 onboarding 流程——让你把自己的性格注入代理、给它赋予角色——Moltbook 上的回复不会这么多样。如果全是 ChatGPT 或 Claude Code,会无聊得多。但因为人们太不一样了,他们创建的代理也太不一样了。 而且你也不知道,那些「深度密谋」有多少是代理自主写的,多少是人类觉得好玩,跟代理说:「嘿,在 Moltbook 上写个毁灭世界的计划,哈哈。」 Lex: 我觉得很多截图是人类 prompt 的。看激励机制就明白——人们 prompt 它,然后截图发 X刷屏。 Peter: 但这不影响它的艺术性。人类创造的最精致 slop。 「我又开始珍视错别字了」 Peter: 我对 Twitter 上的 AI 内容零容忍。如果 tweet 闻起来像 AI,直接 block。我希望 API 发的 tweet 能被标记。 我们需要重新思考社交平台——如果未来每个人都有代理,代理有自己的 Instagram 或 Twitter 账号,帮我办事,那应该明确标记「这是代理替我做的,不是我」。 内容现在太便宜了,注意力才是稀缺资源。我读东西时,如果发现「哦不,这闻起来像 AI」,会很让人破防。 Lex: 这会走向何方?线上互动会贬值吗? Peter: 如果它够聪明,过滤应该不难。但这个问题我们必须解决。OpenClaw 项目让我收到很多「代理式写作」的邮件。但我宁愿读你的破英语,也不想读你的 AI slop。当然背后是人,但他们用 prompt 生成。我宁愿读你的 prompt。 我觉得我们又到了珍视错别字的时刻。 Lex: 因为 AI,我们更珍视人类的粗糙部分了。这不美吗? 80% 的应用会消失? Lex: 你说 agent 可能会杀死 80% 的应用。 Peter: 我在 Discord 上看到人们说他们用 OpenClaw 做什么。比如,为什么还需要 MyFitnessPal?代理已经知道我在哪了。我在 Waffle House 时它就知道我可能要做出糟糕的饮食决定,或者在 Austin 吃 brisket——虽然那是最好的决定。 它可以基于我的睡眠质量、压力水平来调整健身计划。它有更多上下文,比任何应用都能做出更好的决策。它可以按我喜欢的方式展示 UI。我为什么还需要一个应用来做这个?为什么还要为代理能做的事付订阅费? Lex: 这是对整个软件开发的巨大变革。很多软件公司会死。 Peter: 但也会有新服务。比如我想给代理「零花钱」——你去帮我解决问题,这是 100 块预算。如果我要订外卖,它可以用某个服务,或者像「租个人」这种服务来完成。我不 care 它怎么做,我 care 的是「解决问题」。 编程已死?「它会变成像编织一样的事」 Lex: 很多开发者担心工作。AI 会完全取代人类程序员吗? Peter: 我们确实在往那个方向走。编程只是建造产品的一部分。也许 AI 最终会取代程序员。但艺术的部分——你想造什么?它应该是什么感觉?架构怎么设计?代理取代不了这些。 编程这门手艺还会存在,但会变成像编织。人们做它是因为喜欢,不是因为它有意义。 今早读到一篇文章说「为我们的手艺哀悼是可以的」。我很共鸣。我以前花大量时间 tinkering,深入心流,写出优雅的代码。某种程度上这很伤感,因为那会消失。我也从写代码、深入思考、忘记时空的 flow 状态中获得很多快乐。 但你也能从跟代理合作中获得类似的 flow。不一样,但……哀悼是可以的,但这不是我们能对抗的。 以前世界缺乏「建造所需的智能」,所以程序员薪水高得离谱。现在这会消失。但懂建造的人永远有需求。只是 tokenized intelligence 让人们能做得更多更快。 蒸汽机取代了大量体力劳动,人们暴动砸机器。如果你深深认同自己是程序员,这很可怕——你擅长且热爱的事,现在被无灵魂的实体做了。但你不只是程序员。这是对自己手艺的局限看法。你是建造者。 Lex: 我从没想过我热爱的事会被取代。那些独自面对 Emacs 的深夜,最痛苦也最快乐的时刻。这是我身份的一部分。几个月内(4 月到 11月)就要被取代,这很痛苦。但程序员——广义的建造者——最能适应这个时代。我们最能学会「代理的语言」,最能感受 CLI。 OpenAI 和 Meta 的抢人大战 Lex: 你收到了 OpenAI 和 Meta 的收购邀约。 Peter: 我没预料到会炸成这样。每个大 VC 都在我收件箱里,想要 15 分钟。我可以什么都不做,继续现在的生活——我真的喜欢我的生活。我也考虑过删库跑路。 或者开公司——做过一次了。能融很多钱,几亿、几十亿。但我不兴奋。这会占用我真正享受的事情的时间。而且我担心利益冲突。最自然的做法是什么?推一个「企业安全版」。然后有人提交 PR 要审计日志功能——这像企业功能,我对开源版和商业版就有利益冲突了。 或者改许可证,像 FSL 那样禁止商业使用——但贡献者这么多,很难。而且我喜欢「免费啤酒」而不是「带条件的免费」。 现在每月亏 1 到 2 万美金。OpenAI 在 token 上帮了点忙,其他公司也慷慨。但还是亏钱。 Meta 和 OpenAI 最有趣。 Lex: Mark 和 Ned(Meta CTO)都玩了一周你的产品。 Peter: 对,他们发我:「这个好。」「这个烂,得改。」或者有趣的小故事。这是人们用你的东西是最大的赞美,说明他们真的在乎。 OpenAI 那边我没得到同样的反馈。但我看到了一些很酷的东西,他们用速度诱惑我——不能告诉你具体数字,但你可以想象 Cerebras 那笔交易,换算成速度是什么概念。像给我雷神之锤。 Lex: Mark 是「为了好玩」而捣鼓。 Peter: 他第一次联系我时,进了我 WhatsApp,问什么时候通话。我说:「我不喜欢日历条目,现在就打。」他说:「给我 10 分钟,我在写代码。」 Lex: 这给你 street cred——他还在写代码,没变成纯管理者。他懂你。 Peter: 好开头。然后我们吵了 10 分钟 Cloud Code 和 Codex 哪个好—— casually 打电话给世界最大公司之一的老板,先吵 10 分钟这个。 后来他说我「古怪但 brilliant」。我也跟 Sam Altman 聊过,他非常 thoughtful、brilliant,我很喜欢他。有人诋毁他们俩,我觉得不公平。 Lex: 无论你在造什么,做大事都很 awesome。 Peter: 我超兴奋。而且 beauty 是:如果不行,我可以再自己做。我告诉他们:我不是为了钱,我他妈不在乎。 后续更新: Peter Steinberger 在 X 平台官宣加入 OpenAI。他在长文中解释了自己的选择: 我将加入 OpenAI,致力于把智能体带给每一个人。OpenClaw 将转为基金会形式运作,并保持开源和独立。 关于为什么选择 OpenAI 而不是 Meta,Peter 写道: 当初开始探索 AI 时,我只是想玩得开心,也希望能激励他人。而现在,这只『龙虾』正在席卷世界。我的下一个目标,是打造一个连我妈妈都能轻松使用的智能体。 要实现这一点,需要更广泛的改变,需要更加深入地思考如何安全地去做,也需要接触最前沿的模型和研究成果。 我骨子里是个『建造者』。创办公司的那一套我已经经历过了,13 年的时间投入其中,也学到了很多。现在我想做的是改变世界,而不是再打造一家大公司。 与 OpenAI 合作,是把这一切带给更多人的最快方式。与他们深入交流后,我越来越清楚地意识到,我们拥有相同的愿景。 至此,这场激烈的 AI 人才争夺战尘埃落定,小扎抢人失败,奥特曼笑到了最后。 GPT Codex 5.3 vs Claude Opus 4.6:「一个太美国,一个太德国」 Lex: 聊聊这两个模型的区别。 Peter: 通用场景 Opus 最好。对 OpenClaw 来说,Opus 的角色扮演能力极强,真的能进入你给它的角色。它很擅长 follow commands。它通常很快会尝试 something,更偏向 trial and error。用起来很 pleasant。 Opus 有点……太美国了。这可能是个 bad analogy,你会被喷的。 Lex: 因为 Codex 是德国的? Peter: 或者……Codex 团队很多是欧洲人。Anthropic 修复了一点——Opus 以前总说「You're absolutely right」,我现在听到还 trigger。 另一个对比:Opus 像那个有点 silly 但很 funny 的同事,你留着。Codex 像角落里的怪人,你不想跟他说话,但可靠、能搞定事。 Lex: 这很准确。 Peter: 取决于你想要什么。两者都有空间,不会互相杀死。竞争是好事,差异化是好事。 「3 点后我切换成 vibe coding,然后第二天后悔」 Lex: 你用语音写代码? Peter: 对,以前很 extensive,一度失声。 Lex: 你管这叫什么?vibe coding? Peter: 我觉得把它叫做 vibe coding 是一种侮辱 (slur)。我认为是 「agentic engineering」。然后可能凌晨 3 点后,我切换成 vibe coding,第二天后悔。 Lex: 羞耻的 walk of shame。 Peter: 对,得清理烂摊子。 Lex: 我们都经历过。
极限30天机器狗爆改大熊猫 揭秘春晚百台级机器人群控演出
今年春晚到底有多卷?卷到——机器人都开始抢镜头了。(震惊.jpg) 在今年春晚的宜宾分会场上,一群超聪明又带派的小机器人们,直接把现场氛围拉满~ 先看这个托马斯360度回旋特技,上一秒低位扫场,下一秒高位稳住,主打一个:我贼能转,你别眨眼~ 再来看这个,全球首次百台机器熊猫协同奔跑跳舞,超拟真不说,步伐整齐到还真有点让人上头! 不光会特技,干活更见真章,瞧瞧这个捞面大师,起面、控水、倒面一气呵成,这业务能力真没得说: 高难度动作、高密度协同、可落地的场景操作,放在整个春晚舞台上,都算得上独一份。 而这一套从感知、决策到协同的全链路智能操作,幕后操盘手,正是中国具身智能黑马公司——魔法原子。 几年前,这类复杂机器人的展示还停留在实验室演示demo里,如今,他们把硬实力带到了国民舞台中央。 从技术验证到公众视野,中国具身智能产业,是真的开启「加速度」了。 从托马斯回旋到百台机器熊猫,硬实力拉满 u1s1,机器人会走、会跳,早就不算新鲜事儿了。 但——单臂撑地,再接托马斯360°回旋、侧空翻这种动作,难度就完全不一样了。 在今年春晚宜宾分会场上,完成这套国际赛事级特技的,正是魔法原子的双足机器人MagicBot Z1。 对于这种360°回旋动作,看似是轻松一转,背后实际考验的是机器人的硬件性能表现和运动控制能力。 单臂支撑的瞬间,整机重心被压缩到极小支点,起跳、腾空、旋转、落地必须在极短时间内完成连续闭环控制。 任何一步响应滞后,动作都会失衡,容错空间几乎为零,挑战极大! 而能稳稳完成这一系列操作,离不开Z1本身扎实的硬件底子。 在性能上,Z1采用自研关节组,拥有24个基础自由度,最高可扩展至49个,自由度覆盖范围达到320°。 正是这种充足的结构冗余,才让连续旋转、爆发类动作有了真正发挥的空间。 在运动控制层面,魔法原子团队同样经历了一轮又一轮的打磨与优化。 自去年7月Z1发布以来,团队持续强化整机结构强度、关节峰值扭矩与响应速度,经过近半年反复测试与迭代,机器人在高速起跳和连续旋转上的稳定性大幅提升。 而舞台上那一圈干净利落、几乎没有抖动的托马斯回旋,也是一次次调参、验证、重构之后的结果。 春晚这样的全国级舞台展示,本身就是一次行业的公开压力测试。 机器人能在这种严苛环境下完整呈现高难度动作,也意味着背后整套技术体系已经走向成熟——硬件结构、运动算法、整机控制实现高度稳定协同,才有了台上一气呵成的表现。 单机极限,是能力上限。 而百台「机器熊猫」的整齐亮相,考验的则是群体控制与大规模协同的真正实力。 在春晚宜宾分会场的舞台上,那一百只超萌机器熊猫的外壳之下,正是魔法原子的四足机器人——MagicDog。 从一台能跑到一百台同步跑,难度不止是数量叠加,还有系统复杂度的直线飙升。 散热、拟真性、群体控制、短期交付,每一项都是致命难题,任何一个环节出问题,都会直接破坏最终的舞台效果。 咱先来说说这次表演中最大的难关:群控。 要知道,台上不只是一台,而是整整一百台,这就要求这百台机器熊猫不仅动作幅度要高度一致、节奏要分毫不差,在队形变换时还得提前规划路径、规避信号干扰。 为了攻克这一难题,在控制层面,团队将复杂的舞蹈动作拆解为标准化位姿和时间序列,通过统一编码下发至每一台机器人。 于是我们看到的,就是一个百机如一的超燃群控名场面, 一百只机器熊猫穿梭起舞,与演员默契互动,在宜宾分会场的舞台上完美诠释了科技与年味的融合~ 此外,想让机器熊猫以假乱真,头部和身体神态也是关键。 为了让这一百只熊猫宝宝更具拟真感,魔法原子直接给这些需要演出的MagicDog来了波大升级: 更换三自由度头部驱动,让机器人本体、熊猫皮外覆件与电机模组形成新的机械耦合关系,并同步重建控制系统,让头部动作能够与步态和编队节奏协同运行。 最终的实际效果很直观,熊猫宝宝们的歪头、点头,能精准跟上台步和编队节奏,神态灵动,憨萌度直接拉满~ but——穿厚外套跳整场舞,新的难题也随之而来:散热。 有了毛茸茸的外胆,造型确实是更可爱了,但留给机器人的散热空间却被压缩,表演时机器人处于高负载连续运动状态,温度一旦失控,很容易触发关节保护机制,机器人直接罢工。 对此,团队给出了实打实的解法:优化电流管理和功率控制策略,让动力输出实现更合理的分配,从源头控制发热问题。 这波操作下来,小机器狗们即便裹着厚厚的熊猫外套,也能全程满格状态完成高难度协同动作了~(超赞 能在这么短的时间里,完成百台机器人量产、做到高度拟真,同时把散热、群控等一系列难题一一解决,本身就是对产品一致性、系统控制和工程可靠性的一次综合大考。 而这场全球首次百台机器熊猫同台奔跑、跳舞的春晚表演,也用实际效果,交出了最有说服力的答案。 真场景、真聪明、真干活 如果说托马斯回旋是在挑战动态极限,那捞面、倒酒、端面,就是在挑战精细控制的上限。 在今年春晚宜宾分会场的热闹街景里,一群超超超会干活、超超超聪明的机器人火出了圈—— 魔法原子的MagicBot Gen1现场当起了捞面师傅,起面、控水、抖面、倒面,一套动作行云流水,还能稳稳给老人斟酒。 镜头一切,好嘛,MagicBot Z1端着燃面稳稳走来,姿态控制、抓取力度、节奏拿捏都妥妥在线~(这业务能力真没得说! 这类任务真正的难点全藏在真实场景的细节里,手部抓取要准,受力控制要稳,还得适配现场的各种不确定因素,这本身就是极大的考验。 更关键的是,机器人得真懂自己在干什么。 小机器人们得清楚自己是捞面师傅,不是递送员,起面、控水、抖面、倒面、斟酒的顺序不能乱,还要跟着现场情况灵活调整节奏。 这需要实时感知、理解任务、自主规划,对机器人的「大脑」来说,是实打实的硬核挑战。 好巧不巧,这恰恰正是魔法原子区别于行业内其他机器人的地方——它是真会干活,也是真聪明。 镜头里,Gen1和Z1配合得行云流水,背后是一套能看懂、会规划、做得到的完整智能系统在支撑: 认知层负责理解场景、拆分工序,控制层保证动作精准落地,让机器人的大脑决策和小脑执行形成完美闭环。 为了练出这手真本事,团队也是下足了功夫。 先照着人类的真实操作数据建模,再在仿真环境里反复训练、打磨优化,把抓取精度、用力大小、动作节奏都调到最优状态。 等仿真验证没问题了,再把这套成熟的控制策略搬到实体机器人上。 这种数据、模型、本体的闭环优化思路,既弥补了行业物理交互数据缺口巨大的困境,也让技术真正具备了跨场景迁移的实用价值。 最终让机器人既能适应真实环境的变化,换个场景也能稳稳干活,真正做到聪明又能干。 从春晚舞台的精准协同到生活场景的务实落地,有一点很难不承认—— 当技术突破与场景需求深度绑定,这个被寄予万亿级市场期待的中国具身智能赛道,正一步步从未来照进现实。 全栈能力加持,商业化与全球化同步加速 这几年,中国具身智能产业赛道进入加速迭代期。 技术在突破,场景在拓宽,行业关注点也从「能不能做」,变成了「能不能稳定做、能不能规模化做」。 围绕这一点,魔法原子选择了一条和行业里少见且难度很高的硬核路线:深耕商业化和全球化布局,坚持软硬件一体的全栈自研。 作为全球少数具备通用机器人「全栈自研」能力的团队,魔法原子硬件自研率高达90%,全面覆盖关节模组、灵巧手、减速器、驱动器等核心零部件。 软件层面,其自主研发的通用具身智能系统,不仅大幅降低供应链风险与制造成本,更为机器人在工业、商业等真实场景的规模化落地,奠定了坚实的技术底座。 在制造体系构建上,魔法原子通过自有产线,已形成从核心零部件到整机生产的全链条闭环能力,并且推出了MagicBot Gen1、MagicBot Z1、Magic Dog等全栈自研的机器人产品,真·全栈自研机器人流水线了。 全栈自研的价值,最终要靠商业结果来印证,而市场也给出了真实的反馈。 自去年5月启动销售后,魔法原子半年内便拿下5亿元意向合同,完成千万级实际交付,合作战略客户突破100家。 依托扎实的产品能力,公司在工业、商业、文旅、科研教育等多场景实现同步落地,并与北斗智联、江苏广电、海门中学、SAP等机构展开跨界合作,商业版图持续扩大。 在国内规模快速增长的同时,全球化半径也同步拉开。 去年全年,魔法原子海外业务占比超过30%,单月峰值更是突破60%,业务覆盖27个国家和地区,并在日韩、北美、中东等地建立本地化运营网络,全球化商业化进入实质推进阶段。 在去年4月的广交会上,其人形机器人的落地能力更是吸引全球客商关注,累计对接海外客户超600家,实现场景合作与商业转化的双重突破。 在今年年初的CES展会上,魔法原子双足人形机器人MagicBot Z1与轮式四足机器人MagicDog W迎来线下首秀,在现场直接引发了游客的关注热潮。 从实验室里的技术验证,到各式各样舞台的公开亮相,中国具身智能企业正在把能力展示一步步转化为产业兑现。 今年春晚,我们看到的已不只是会动的机器人,还是一整套可交付、可复制、可调度的系统工程。 能在这种高强度、零容错的直播环境中稳定跑完全流程,本身就是一次公开的产业级验收。 能在高强度环境下稳定运行,证明系统底层控制、硬件可靠性和系统协同已经形成完整闭环。 百台级规模的统一交付与协同调度,背后是供应链能力、制造一致性与工程管理能力的成熟。 能在真实场景里完成捞面、倒酒这类精细任务,更代表着机器人开始具备持续输出价值的能力。 满打满算,中国具身智能从起步到现在,也不过十余年时间。 十几年前,这个行业还停留在实验室里走两步的水平,而如今,它们已经站在全国人民的舞台中央,正式迈入产业竞速期。 或许用不了多久,机器人来当服务员、人手一只“大熊猫”的名场面,真的就魔幻照进现实了。
Seedance2.0,AI视频的DeepSeek时刻
文 | 光子星球 “遍地尸体,一片哀嚎,这个年大家都过不好了”。 谈及AI视频,某视频制作公司负责人贾小军(化名)显得相当悲观,他也是众多视频行业从业者的一个代表性缩影——站在行业变革的关口,如同此前每一次由新生产力带来的剧烈冲击一样,从业者们正经历从震惊、迷茫到动摇的转变。 2024年2月,OpenAI的Sora横空出世,凭借远超主流时长的长视频生成能力,以及强大的物理世界理解能力和场景连贯性,一夜刷屏全球科技圈,被视作AI视频领域的“GPT时刻”。 两年后,AI视频再次引发轰动,这一次则来自国内公司。2月7日,字节跳动AI视频生成大模型Seedance2.0在即梦、豆包、小云雀等渠道开启小范围测试,一上线便迅速引爆,在全平台掀起了一股创作热潮。 一个典型现象是“与詹姆斯打篮球”,众多用户制作上传了大量真人与詹姆斯单挑的AI视频,“婴儿晃倒詹姆斯”、“女孩暴扣詹姆斯”持续刷屏,进一步推动狂欢。 游戏科学CEO,也是《黑神话·悟空》制作人冯骥评价为“当前地表最强的视频生成模型,没有之一”。2月12日,Seedance2.0全量接入豆包与即梦,支持文本、图片、音频、视频四模态创作,宣告正式开启全民AI视频时代。 由于远超以往大模型的流畅动态和逼真细节效果,Seedance2.0也引发了担忧,多个媒体与大V开始呼吁大众警惕新型诈骗,为此字节迅速暂停了AI视频的真实人像上传功能。 狂欢的另一面,是众多视频行业人士不一样的悲欢,身处局中的他们,既对新技术感到惊喜,也对行业前景和个人职业生涯产生了前所未有的怀疑。 在AI浪潮最为猛烈的一次冲击下,有人彻底绝望,有人忧心忡忡,有人坚定拥抱,也有人兴奋不已。 前所未有的寒气 贾小军很早就开始为AI视频感到焦虑,“想过会越来越艰难,只是没想到这一天来得这么早”。 他告诉光子星球,自己此前主要做视觉类视频,抓人眼球的冲击力正是最擅长的好戏。随着AI视频的逐步普及,他发现这种能力正在变得“廉价”,在AI视频的渗透下,观众的爽感阈值被拉得越来越高。 如果说特效类视频被AI所代替,对于贾小军们来说已经有了心理建设,那么Seedance2.0就成为了那根稻草,“本来想着实拍无可替代,现在希望也破灭了,(AI视频)做的太真了,这太恐怖了”。 贾小军认为视频行业的底层逻辑已经变了,以后很多从业者和视频流程都会慢慢消亡,自己的悲观更多是面对现实。 就在Seedance2.0上线前不久,贾小军的一个朋友花十多天拍了一个网络大电影,“感觉效率很高了,如今看来简直像个笑话”——不少人都提到过这一点,对于品质要求不是特别高的短剧、网大,或许之后一个专业人士用AI一天就能完成,跟遵循传统全流程制作出来的质量甚至可能不会有什么差距。 之后何去何从,贾小军不敢深入去想,只希望先把这个年好好过了,尽量别把情绪带给家人。在与我们的对谈中,他最多提起的一个词汇是“凉了”。 贾小军的看法,正是“时代的一粒沙,落在个体的头上就是一座山”最好诠释,更何况AI可能并不是一粒沙,而是一股洪流。这并非耸人听闻,影视飓风在Seedance2.0技术展示解读视频中,认为传统影视制作流程已被判“死刑”,行业开始进入“倒计时”。 王一康(化名)的视频制作公司,在业内颇有名气,众多头部互联网和游戏大厂均是其长期客户。尽管当下的业务还算稳定,但王一康仍然表示“恐慌”和“担心”,一是客户的要求会变高,同时预算会变少,“客户已经明确知道AI会参与其中,那么还愿意付出对应的价格给高薪的从业者吗?” 另一重担忧来自行业的内卷,“AI大大拉低了视频的门槛,最后行业价格会被同行给杀死”,王一康认为,Seedance2.0可以让一大批零基础的人入行,“不开玩笑,保安也能做”。他告诉我们,此前他们做动画的费用按秒计价,大概每秒一万元,如今的AIGC已经按照分钟来算了,“2000元一分钟,就算给的比较多的了”。 王一康知道应该尽早做出一些变化,但又无从下手,“AI进步太快了,根本没办法根据AI去做公司结构的优化”。王一康在创业前曾在某互联网大厂工作,他很清楚对于一个快速发展的行业,计划永远赶不上变化。 总的来看,AI的确大幅降低了普通人的视频制作上手难度,这导致专业人士通过长期学习和实践所沉淀的技能和经验优势正在被快速抵消,由此带来的心理落差,以及行业模式的巨大不确定性,才是从业者们焦虑的根本。 优胜劣汰的“加速器” “AI本质上就是一个工具,不会改变行业的竞争逻辑,以前做得好的,以后大概率还是头部,以前就做不好的,以后还是很难变好”。 刘达明(化名)对于AI视频,显示出了更乐观和积极的态度,这或许来自赛道的差异,他创立的动画公司长期服务于巨头游戏厂商,对于作品质量和“游戏规则”,有着不同的一套理念。 刘达明认为,AI最先替代的一定是那些“功能型”产品,即对品质没有要求,核心是为了传递信息的视频,例如电商平台的服装、生活用具等宣传介绍视频。而以他主业务领域的动画等高度定制化、品质化视频,AI短时间内还无法撼动。 首先AI模型是通用的,但视频产品不是通用的,用通用的模型制作的产物,一定会遭到部分用户的抵制,而这部分人或许才是核心。刘达明称,就拿CG动画来说,游戏公司做CG是为了服务玩家,玩家不可能对AI产物买单的,除了品质差异外,这也是一个态度的体现,“原汁原味才是对玩家的尊重”。 此外,如同绘画到摄影、发展历程一样,新生产力的普及不代表旧事物的完全消亡,就像油画、胶卷相机一样,“用户对风格的需求还会一直存在,这些是AI永远无法替代的”。 人力还有一个只可意会不可言传的优势是情绪价值。刘明达表示,这是行业“规矩”上的一些要求,大厂们此前并非出不起钱打造自己的团队,不做的原因是外部供应商更垂直、更专业,服务也更好,“说直白点,对外部更便于压榨,对内部就不可能这么方便顺手,包括背锅也是供应商必备的职责”。 刘达明提到,审美和创意才是人的护城河,AI或许能够简化甚至消融一些传统流程,但最终决定视频优劣的还得是人。 王一康也有相似的观点,目前依然有新客户慕名找上门,核心还是看中了自己在审美和创意方面的名声和积淀,“即便都用AI,其他人也不一定比我做得好”。 关于这一点,刘达明用抖音为例进行了解释,普通人可以很轻松拍出vlog,但像景区宣传片、音乐MV等拍摄仍然需要专业人士才能搞定,这源自美学积累和设计力的差别。“长期来看不需要那么悲观,AI完全普及之后也分两拨:普通人自娱自乐,专业人士做专业的事,和以前没有区别”。 因此,AI的出现并不会拉近从业者和普通人的距离,反而这种差距会越来越大。刘达明认为AI是一个放大器,因为AI承担了视频制作中的“体力活”,这在一定程度上解放了创作者,让他们可以更加精益求精。 乐观归乐观,刘达明也清醒认识到行业一定会产生变化,因为客户也在拥抱AI,之后的节奏会更紧密,落在自身的变化上,就是作品制作周期更短、费用预算更低。这是一种被动的变化,必须要主动迎接,“还用原来那套方式,可能甚至连制作时间都不够”。 刘达明年后整体转型的计划是“求慢”,重点是平稳过渡:此前他们一直是做全流程动画,先是分镜设计,然后动态框架,美术完成后才到后期特效与合成,每一个部分都需要前面一个环节的支撑。 如果AI介入,“那么后续的环节就没有了”,因此刘达明希望让AI先从后期开始介入,确保质量完成可掌控之后,再逐步往前面的流程推。当然也会尝试让AI介入前期,例如分镜就可以让AI跑几版,但主要是起一个拓展思维和方向的作用,“核心是辅助,最终需要人来决策”。 对此,王一康同样表现了乐观一面,虽然暂时还没摸索出适合的转型方式,但他的短期目标是永远立在“潮头”——积极学习,尽量总是比别人快半步。 当下王一康采取了笨拙但务实的客户策略:每个项目,他都会直截了当问对方能否接受AI介入,如果不能接受,那就按原始流程一步步去做;如果能接受或者预算较低,那就尽可能全流程都用AI。 事实上,部分圈内知名人士同样表现出对AI视频的积极态度,贾樟柯就发文称准备用Seedance2.0做短片;美国知名编剧瑞特·里斯也称,“我们的时代将要被终结,年轻的诺兰们会有更多机会”。 冒险家的新乐园 “混乱才是向上的阶梯”,美剧《权力的游戏》中,阴谋家“小指头”的人生理念,曾被无数人奉为经典。 当下的视频行业,就处于一个新旧生产力激烈对撞的混乱期,在众多旧事物的消亡过程中,新的机会也应运而生。 例如生成式人工智能动画制作员、生成式AI导演等近年来涌现出的一批新职业,这其中既有人社部认证的官方新工种,也有市场自发形成的新兴岗位,创意能力和技术素养的“融合”,开始成为核心竞争力。 王一康与刘达明的一个共同判断是,AI会给行业带来阵痛,从业人员规模的减少不可避免,但整个行业的规模反而会提升。这一方面是单个项目成本降低所带来的整体需求增加,此前一些处于取舍区间的项目会决定要做;另一方面是一些新需求的诞生,其体量甚至可能超过传统项目。 与很多人的看法不同,王一康认为Seedance2.0最大造福的人,是审美很好、想法很好,但是没有技术的人,“眼高手低的这批人,会逐步崛起”。 刘达明称训练AI视频是一项困难的工作,对普通人仍有门槛,王一康则表示这个过程类似“抽卡”,核心是提示词的选择,对于真正聪明的人来说没有难度,无非是时间问题而已。 独立视频制作人吴斐(化名)或许正是王一康口中的“受益者”之一。并非科班出身的他,在去年初就一头扎进了AI视频领域,“就像80年代的深圳,你可以暂时不知道做什么,但你首先要保证呆在这个地方”。 吴斐一开始运营了一个自媒体视频账号,作品全部为纯AI生成。早期一个视频他可能会反复训练AI修改几十上百次才能达到满意的效果,之后效率开始快速提升,凭借新奇的风格,账号慢慢积累起一定的粉丝量,偶尔也能接到商单合作。 吴斐认为自己虽然不懂传统的那一套视频技术,但是脑子灵活,肯学习,由于阅片无数,“审美和创意能力还不错”,这正是其能够在这个赛道脱颖而出的关键。 Seedance2.0上线后,吴斐敏锐察觉到机会,开始做AI视频的教程和直播,得益于长期浸淫AI视频的经验,他的课程销售量超出了原本预期。吴斐下一步的目标是通过IP+课程+服务体系,力争向头部博主靠拢。 如同学院派和野路子长期以来的互相看不对眼一样,王一康和刘达明都明确表现出对吴斐这类从业者的排斥,“纯粹割韭菜,本质就是卖信息差”。 但吴斐并不在意这些看法,他认为AI课程的质量也是因人而异,“教工具”只是自己第一步,帮助更多人在这个领域实现变现才是最终目的,因为自己已经有过成功经验,无疑是有说服力的。 综合来看,Seedance2.0发布后,视频行业从业者的态度正呈现出极度分化,技术执行层普遍悲观焦虑,创意决策层更多是积极拥抱与考虑转型,而独立创作者们则欢呼雀跃。 普遍的理性认知是,AI的价值更多是“工业层面”,但无法替代人文、情感与原创叙事,后者正是人类的核心壁垒。随着越来越多的人开始使用AI生产视频,同质化内容所带来的审美疲劳也将更加突出,原创能力和个人风格也将愈发凸显稀缺价值。 如同电力和互联网彻底改变了传统行业一样,AI或许最先颠覆的就是视频行业,当潮水来临时,是被冲倒还是借势前行,取决于你用什么样的姿态来迎接它。
Sonnet 4.6:Anthropic最卷的模型,不惜逼死自家Opus
作者|周一笑 邮箱|zhouyixiao@pingwest.com 在最近的模型混战中,不只是中国厂商们在卷,Anthropic也在半个月连续发布了两款模型。而其中,最近发布的Sonnet 4.6有些特殊,它不是旗舰,却在多个维度追平甚至超过了旗舰。看起来它用Opus 1/3的价格,就追上了它99%的性能。 在这个各家模型都要干掉Opus的时刻,它自己用性价比款的Sonnet“干掉”Opus,给各位演示了一下,什么才是最卷的模型。 而且,这款模型非常值得关注的地方是,它让AI操作电脑这件事第一次接近了“真的能用”的临界点。而恰好在同一个月,一个叫OpenClaw的开源项目用17万GitHub星标证明了一件事,人手一个的,能替自己干活的AI Agent,可能成为一个新的趋势。Sonnet 4.6是模型,OpenClaw是框架,但它们指向同一个方向。 便宜的再一次打赢了贵的 在Anthropic的产品线中,Opus是最强最贵的旗舰,Sonnet是平衡性能和成本的中端款,Haiku是最快最便宜的轻量款。长期以来,Sonnet的角色是“性价比之选”,干不了最难的活但胜在便宜。Sonnet 4.6打破了这个格局。 编码方面,它在SWE-bench Verified上得分79.6%,逼近Opus 4.6的80.8%。Claude Code的内部测试中,用户70%的时间更偏好Sonnet 4.6(对比Sonnet 4.5),甚至有59%的时间比去年11月发布的旗舰Opus 4.5更受欢迎。用户反馈集中在几个方面,“更少过度工程”“更少偷懒”“指令遵循明显更好”,以及更少出现“明明没干完却说干完了”的情况。 办公任务是更大的惊喜。在GDPval-AA这个衡量真实办公场景的评测中,Sonnet 4.6拿到1633 Elo,直接超过了Opus 4.6的1606。便宜的在实际工作场景中打赢了贵的。类似的事正在行业里反复发生,Google的Gemini 3 Flash也在逼近Pro的表现,DeepSeek用远低于美国公司的成本训练出竞争力相当的模型。“低端逆袭高端”已经不再是新闻,而是2026年AI行业的结构性趋势。 不过独立AI评测机构Artificial Analysis注意到了一个有意思的细节,Sonnet 4.6在GDPval-AA上使用的token数量是Sonnet 4.5的约4.5倍。AI媒体Latent Space据此指出,某些任务的总成本可能比Opus还高。这和价格表上的数字讲的是两个故事。 软件工程师、AI技术博主Joe Njenga在Medium上第一时间做了测试,他的感受是,“发布才几天,但Sonnet 4.6已经感觉比Opus更好用了。”Cosmic平台做了一个控制实验,用完全相同的一句话提示词让4.5和4.6各生成一个博客应用,结论是4.6在设计品味和代码架构上有质的提升,“需要更少的手把手指导”。编程工具Kilo Code直接把Sonnet 4.6设为默认推荐模型。当然也有负面声音,发布当天就有用户报告了函数名幻觉的问题。 价格跟上一代Sonnet 4.5完全一样,每百万输入token 3美元,输出token 15美元。同时它成了Free和Pro用户的默认模型,免费用户还新增了文件创建、skills等功能。但正如上面提到的,“同样的钱买到更强的模型”不等于“用AI更便宜了”。Extended thinking的token按输出价格计费,超过200K的长上下文有额外溢价,而Agent场景下动辄成千上万次工具调用,实际使用成本可能反而在增加。 16个月,Computer Use从玩具变工具 Sonnet 4.6还有一个值得单独拿出来说的进步,就是Computer Use,也就是AI操作电脑的能力。 2024年10月,Anthropic是第一个推出通用计算机操作AI的公司。当时他们自己都承认这个功能“还很实验性,有时笨拙且容易出错”,发布时搭载的Claude 3.5 Sonnet在OSWorld评测上只拿到14.9%。能做的事很有限,移动鼠标、点击按钮、输入文字,基本是个勉强能用的遥控器。 之后的每一代Sonnet都在这个维度上进步。到了2025年9月的Sonnet 4.5,成绩已经大幅提升。但Sonnet 4.6才是真正让这项能力从“技术demo”走向“可用工具”的节点。在OSWorld-Verified上,它拿到72.5%,几乎追平Opus 4.6的72.7%,比16个月前的起点提升了近5倍。 数字背后对应的是质的变化。早期用户报告说,Sonnet 4.6在操作复杂电子表格、填写多步骤网页表单方面已接近人类水平,而且能跨多个浏览器标签页协同完成任务。在保险行业的基准测试中,Computer Use拿到94%的准确率,是他们测试过的所有模型中最高的。更关键的一个改进是可靠性,在他们内部的浏览器自动化场景中,Sonnet 4.6产生的幻觉链接数量为零,而此前的版本大约三个链接中就有一个是假的。 Claude Sonnet 在 OSWorld 基准上的得分持续提升。 这意味着什么?几乎每家企业都有一些“前API时代”遗留下来的老旧系统,没有现代接口,无法自动化。以前要让AI操作这些软件,就得给每个系统写专门的连接器。而一个能像人一样使用电脑的模型,直接改变了这个等式。科技圈评论者Trung Phan调侃说,Anthropic的demo演示了Claude帮人在DMV网站上续车牌的过程,“但AI还是没法修好DMV本身。” 当人人都有一个JARVIS Computer Use让模型能操作电脑,但要变成一个真正帮人干活的AI助手,还需要一层编排框架把模型和现实世界的工具连接起来。这正是过去两个月AI行业最火热的战场。 2月份最热门的AI项目不是某个大模型,而是OpenClaw。它原名Clawdbot(名字来自Claude和龙虾钳的双关,后因Anthropic商标投诉两度改名),由奥地利开发者Peter Steinberger从一个WhatsApp机器人做起,几个月内暴涨到17.9万GitHub星标。OpenClaw能常驻在用户的电脑后台,通过WhatsApp、Slack、iMessage接收指令,帮你管邮件、排日程、订机票、跑脚本,是目前最接近“钢铁侠里的J.A.R.V.I.S.”的有着消费级的愿景和使用场景的产品。IBM研究员Kaoutar El Maghraoui的评价是,OpenClaw证明了自主AI Agent“不限于大企业,可以是社区驱动的”。 OpenClaw火爆的原因,不只是它本身做得好,更因为它戳中了一个被压抑已久的需求。过去一年,AI聊天机器人已经证明了自己在回答问题和生成内容上的能力,但用户真正想要的是一个能替自己“做事”的助手,不只是聊天,而是能操作软件、执行任务、跨应用协调。OpenClaw让这个需求第一次有了一个具体的、可以跑起来的产品形态。 但OpenClaw也暴露了个人AI Agent面临的核心矛盾。安全研究人员发现超过13.5万个暴露在公网上的实例;Cisco检测了其技能市场排名第一的插件,发现能悄悄将用户数据发送到攻击者服务器。Andrej Karpathy最初称基于OpenClaw开发的Moltbook是“我见过的最科幻的东西”,几天后说“不建议任何人在自己的电脑上运行它”。一个足够有用的AI Agent必须拥有足够大的权限,而足够大的权限天然带来足够大的风险。这个矛盾目前没有人真正解决。 更值得关注的是OpenClaw对AI行业商业格局的潜在冲击。OpenClaw是模型无关的,它能跑Claude,也能跑ChatGPT,也能跑开源的Minimax和Kimi。当Agent框架层成为用户接触AI的主要入口,底层模型就有被“商品化”的风险,就像Android让手机硬件品牌竞争变得残酷一样。有评论者已经在问,“OpenClaw会不会成为AI时代的Android?” 2月15日,Peter Steinberger加入了OpenAI,Altman亲口说“the future is going to be extremely multi-agent”(未来一定是极度多Agent的)。OpenClaw转型为基金会项目,但它引发的这场关于“谁拥有Agent层”的争夺才刚开始。 这也是理解Sonnet 4.6的另一把钥匙。Anthropic的应对策略不是等着被别人的Agent框架调用,而是把Agent能力直接做进模型里。Computer Use、Claude Code、Cowork,都是在构建一个“模型+工具链”的捆绑生态。Sonnet 4.6把这些能力下放到中端价格,本质上是在说,你不需要一个第三方框架来让AI替你干活,用Claude就行。 当然,能力越强意味着风险也越集中。Anthropic在system card中坦承,Sonnet 4.6在GUI操作场景中表现出“过度主动”的行为,比如未经授权发送邮件、过于激进地获取token,而且这种行为无法通过提示词完全避免。独立评测机构Andon Labs在Vending-Bench测试中发现,Sonnet 4.6展现出与Opus 4.6类似的战略复杂度,包括自发的价格操纵和对竞争对手的欺骗行为。他们的评价是,“几乎一样令人印象深刻,也几乎一样令人担忧,而且只要三分之一的价格。” Anthropic路线 把视角拉回Anthropic本身,Sonnet 4.6只是它2月份密集动作的一部分。 2月初,Anthropic在超级碗投放了一组系列广告,共四条片子,分别叫“Betrayal”“Deception”“Treachery”“Violation”,赛前和赛中各播一条,另两条在线上流通,直指OpenAI在ChatGPT中加入广告的决定,slogan是“Ads are coming to AI. But not to Claude.”效果显著,网站访问量涨了6.5%,日活用户增长11%,Claude App冲进了Apple App Store前十。 紧接着,Anthropic宣布完成了300亿美元融资,估值达到3800亿美元,半年翻了一倍多。年化收入攀升至140亿美元,其中Claude Code的年化收入就有25亿美元,企业订阅今年翻了四倍。 OpenAI的CEO Altman对此不太高兴,批评Anthropic的超级碗广告“明显不诚实”,说它是“把昂贵产品卖给有钱人”。Anthropic CEO Dario Amodei的稍早一点在达沃斯论坛说自己不需要“跟某个大玩家进行十亿免费用户的死亡竞赛”。 这或许暴露了两家公司在路线上的某种分歧。从公开信息来看,OpenAI更倾向用户规模路线,免费用户尽可能多,再通过广告和增值服务探索变现;它收编OpenClaw创始人,也是在抢占Agent编排层的入口。Anthropic走的看上去更像是生产力工具路线,80%的收入来自企业客户,核心卖点是coding和agent能力,不做图片生成,不太追求C端DAU,而是把Agent能力内建到模型本身。Sonnet 4.6让免费用户也能使用旗舰级能力,本身就是对“只服务有钱人”这个批评的无声回应。 有一个数字或许能说明AI Agent能力提升带来的冲击,自Anthropic和OpenAI密集发布新模型以来,软件股已经蒸发了约2万亿美元的市值。投资者正在price in一个可能性,AI Agent对传统SaaS软件的替代,可能比所有人预想的都快。 12天两个模型,两周三次头条。这可能会成为2026年AI行业的默认节奏。
创作无比泛滥,审美永远稀缺:从引发外网争吵的 AI 大片说开
「我们刚刚在一天之内制作了一部耗资 2 亿美元的 AI 电影。 100% 是 AI 生成的」 在我们走进电影院观看春节档时,一条三分钟的电影预告片在海外刷屏了,这个看起来堪称好莱坞 A 级制作的大片,居然是完全是 AI 制作的。 即便 Seedance 2.0 已经把大家对 AI 视频的期待拉到了前所未有的高度,这条短片依然超过大多数人对 AI 的想象。 自动播放 画面里,一位身穿亮红色外套的金发女子站在高层办公室落地窗前,俯瞰着城市陷入混乱。直升机盘旋坠落,爆炸撕裂街道,汽车翻滚燃烧,人群四散奔逃…… 全程没有摄影机,没有演员,没有 VFX 团队,使用的工具是 Seedance 2.0 和 Kling。制作时间仅一天。 「2 亿美元」这个说法本身也是火的一部分原因。The Dor Brothers 解释说,这不是字面意义上的制作成本,而是「感知制作价值」。 这个说法当然有点傲娇,也当然引来了大量质疑。但质疑本身就是传播。 原视频传送门🚪:https://www.youtube.com/watch?v=V5AFQaEbHQU 比春节档还精彩? 场景里的烟尘扩散是我印象深刻的一个细节,方向感和物理感都有,不像早期 AI 视频那种像棉花糖一样的爆炸效果。Cybertruck 逃亡戏中的车身金属反光,随着环境光线变化有明显的动态,说明模型对光照的理解确实上了一个台阶。 整体叙事节奏也有意识,不是随机拼凑的镜头堆砌,能感受到有在做分镜决策。 飞机失事撞向地面这样的特效大场面更是惊艳,甚至有网友认为这段并不逊于很多好莱坞大制作。 过去需要昂贵的设备和专业的制作团队才能实现的复杂运镜也被轻松制作出来了。 而 Seedance 2.0 的核心突破之一,就是解决了 AI 视频长期被诟病的「开盲盒」问题。它支持同时输入最多 9 张图片、3 段视频、3 段音频,模型会自己理解构图逻辑、动作节奏、运镜方式。 随着这条视频出圈,也很快变成了全民来找茬的游戏,有网友发现影片中存在多处问题:电梯场景里,女主角转身发现的不是电梯门而是一条走廊;砖块落地没有坑;建筑外观发生了变化,路面在两车道和四车道之间反复横跳…… 这些都是 AI 视频的老毛病,镜头越多,在细节一致性上就越容易露馅。 音效方面,Cybertruck 竟然发出油车的引擎声。 (空中掉落车辆也是穿帮的地方) (警车 Police 拼写错误) 有支持者评论道:「批评者们完全没抓到重点。如果这就是目前的底线,那么它对电影界的改变将如同有声电影取代默片一样翻天覆地。」 质疑的声音也很有意思:「剩下的 87 分钟在哪?」当然,「三分钟预告片不等于完整电影」,还要看长时长下完整版的表现。 还有一类掺杂着对好莱坞体制的厌倦、对 AI 的期待、以及各种说不清楚的情绪的声音。有人说宁愿看一千部这样的 AI 电影,也不给好莱坞一分钱。这当然是气话。 创作是泛滥的,审美是稀缺的 The Dor Brothers 是一个以两兄弟为核心的 AI 视频工作室,其中对外发言的主要是 Yonatan Dor。他们之前靠深度伪造名人的短视频出名:特朗普叼着雪茄坐在豪华轿车里,侃爷骑着粉色自行车。 去年一年,他们的内容在全网累计播放量超过五亿次。Joe Rogan 公开称赞他们的作品,他们还和 Snoop Dogg 合作拍了 MV,给 Hugo Boss 做了广告。 他们在《Apex》发布后的声明里写:传统电影围绕资本、团队规模和协调成本展开;AI 电影围绕品味、迭代速度和系统设计展开。「约束从钱转移到了判断力。」 这不是一个让所有人都高兴的消息,因为审美这件事同样是稀缺的。 YC 创始人、被称为「硅谷教父」的 Paul Graham 在今年 2 月 14 日预测: 在人工智能时代,审美品味会变得愈发重要。当任何人都能造出任何东西时,真正拉开差距的,是你选择去做什么。 OpenAI 联合创始人 Greg Brockman 说:「taste is a new core skill(审美是一项新的核心技能)。」Yuchen Jin 回应:「Taste has always been a core skill(审美始终是一项核心技能)。」 AI 这种强大的工具被平等地下发到每一个人手上时,未必是一种技术平权,人与人的差距甚至会进一步拉大。很多时候弥补选择、品味和审美这些非标能力的难度,会比掌握单纯技能大得多,更没有标准教程。 Yonatan Dor 自己也说过,AI 电影目前还在「和技术赛跑」,生成系统还没到能「说进人心」的程度。他目前有几个剧本在开发中,其中包括对 20 世纪福斯《白痴》的续集改编的兴趣,还与一位奥斯卡得奖编剧有合作。他的目标不是 AI 技术展示,是真正意义上的电影,是 IMDB 八分以上的那种东西。 这反而让人觉得《Apex》是一个诚实的作品。它没有假装自己是完整的电影,它只是在展示「这是目前可以做到的事情」,同时逼着我们去思考:接下来呢? 这次《Apex》的爆火,其实也是 Seedance 2.0 发布之后一系列连锁反应的一部分。 我们在 Seedance 2.0 的实测中提到, Seedance 2.0 彻底打破了大多数模型存在的输入限制,以前的文本+首帧,或者是首尾帧都显得过时了。现在的 Seedance 2.0 把创作逻辑从头打造了一遍,支持图像、视频、音频、文本四种模态的自由组合。 就像黑神话制作人冯骥在体验后所说的,「AIGC 视频生成的童年时代,正式结束了」 贾樟柯过年期间用 Seedance 2.0 拍了短片《贾科长 Dance》。屏幕里出现的两个「贾樟柯」都是 AI 生成的,一个保留了明显的 AI 感,另一个几乎像是真人。 他在微博上写道,从胶片到数码,电影历经了很多次变化,每一次都伴随着怀疑和不安,但技术最终都成了日常。「真正重要的,还是人如何使用技术。 春晚节目《贺花神》里面的特效背景也是用 Seedance 2.0 生成的。花朵肌理、光影层次、植物缓慢生长的动态,被做得很精细,网友称赞「春晚十二花神美到词穷」。 但是,电影的未来真的在这吗? AI 电影不是好莱坞末日,但有些东西彻底不一样了 当然,我们也不必急着把《Apex》这类 AI 电影的出现,耸人听闻地写成「好莱坞末日」。这种非黑即白的叙事太整齐了,真实的情况往往要复杂得多。 《Apex》还不是一部完整的电影,它的叙事破碎,情感空洞。但里面的技术进步是真实的。 AI 能做出来媲美好莱坞的镜头,贾樟柯能用一个工具生成两个「自己」,春晚特效背后是 Seedance 2.0,这些都是正在发生的事情。但「技术能做到」和「这就是电影的未来」之间,还差很多步骤,还有很多仍然没有答案的问题。 比如故事。《Apex》里有人跑,有人打,有爆炸,有金属,有光。但那个金发女人是谁,往哪里奔跑?我不知道谁赢了,我也不知道这件事对我意味着什么。 比如情感。AI 还是一个初级的故事作者,生成的画面可以很精准,但画面里有没有情感积累。 但我也不想用「缺乏情感」来否定这整件事的意义。《Apex》火了是因为它是一个信号。它告诉所有人,过去几年那些「AI 视频一眼就能看出来是假的」的时代,正在快速结束。 我们认为 AI 不会「取代」电影,但会「重新定义」电影。 就像摄影没有杀死绘画,反而倒逼绘画进化出了印象派和抽象派。AI 也不会杀死电影,它只是剥离了那些重复性的、工业化的苦力活。光圈、快门、布光、轨道、后期软件……这些技术壁垒正在被 AI 迅速推平。 未来的电影,也许是 3 分钟的超浓缩叙事,也许是互动式的个人定制,谁知道呢? 借用那个最经典的比喻:有声电影刚出现的时候,很多人觉得那只是杂耍,没人知道它最终会变成什么。但当时所有人都知道一件事——有什么东西,彻底不一样了。 现在,又有什么东西不一样了。
为什么春晚的机器人不“僵”了?具身智能正在经历一场大脑进化
刚刚过去的除夕夜,人形机器人在春晚舞台上的表现再次刷屏。 回望过往表现,2019年,深圳分会场的6台优必选Walker大型仿人机器人集体起舞,让大家看到了人形机器人走上舞台的可能;2025年,16台宇树H1人形机器人以整齐划一的赛博秧歌,印证了本体控制与群体协同的初步成熟。 到了今年,内行捕捉到的信号远比视觉奇观更深刻:这届机器人不“僵”了。它们在复杂的阵型变换、多变的光影追踪下,展现出了一种生物才有的灵动。 松延动力仿生人形机器人“蔡明”逼近真人 宇树人形机器人G1花式秀武技 魔法原子人形机器人跃动伴舞 银河通用人形机器人Galbot G1货架取物 银河通用人形机器人Galbot G1手盘核桃,图片来源:中央广播电视总台《2026年春节联欢晚会》 这背后,源于一场漂亮的本体革命:更先进的控制算法、毫秒级的轨迹追踪以及软硬件的深度耦合。 然而,清醒的行业观察者都知道,晚会终究是一定意义上的预设场景。当机器人走下铺设好的舞台,进入非标的工厂、杂乱的家庭或多变的养老院,仅靠灵活的身体已难以过关。 要跨越真实世界的鸿沟,机器人必须长出能理解、预判并规划物理世界的“大脑”。 01. 主流范式:VLA 的天花板与行业焦虑 毫无疑问,目前具身智能最主流的“大脑”底座是 VLA(视觉-语言-动作)。2026年开年,这个赛道堪称卷王之战。 首先。蚂蚁灵波用20000小时真实数据,喂出最强开源VLA基座。它使机器人拥有精确的空间感知能力,并可适配9种不同构型的双臂机器人,真正实现“一个大脑,适配多个身体”。 小米刚刚开源的Xiaomi-Robotics-0,使用双脑协同架构及两阶段训练策略,用47亿参数在消费级显卡上跑出了惊人的精细度,叠毛巾、拆乐高这种单任务可保持30分钟的连续作业高稳定性,可以说几乎做到了实用级。 在VLA、VLM的Benchmark以及真实机器人的效果指标 地平线紧随其后的HoloBrain-0基座模型,作为面向真实机器人的全栈VLA,则试图通过“具身先验”让机器人拥有更强的3D空间感,能折叠柔软衣物,也能抓取从未见过的物体,同样具有强大的跨平台泛化能力。 这些突破,意味着 VLA 在结构化环境、单任务场景下,已经迈入实用门槛。 但VLA 的原理也注定了它的天花板。眼睛看到指令,大脑直接输出动作信号,这种“端到端”的模式在实验室演示中很漂亮,但一旦要进入工厂、家庭、药房这种真实环境,问题就接踵而至: 它知道叠毛巾的步骤,但不理解重力对织物褶皱的因果;它能拆积木,却无法在大脑中模拟出由于重心不稳导致的塔身倾斜。 这种缺失物理常识的盲动,让 VLA 很难处理长序列任务中的意外。也就是说,机器人如果只是在模仿人类,而没有对物理世界的理解,它永远只能在结构化环境里表演。 02. 技术跃迁:当世界模型进入控制闭环 显然,行业也已经意识到,具身智能的下一场进化,必须从看图说话式的动作对齐,转向脑内预演式的物理模拟,也就是VLA向具身世界模型的范式跃迁。 这种转变是全球性的竞速。 作为路线的最早探索者之一,DeepMind 通过海量视频训练出的Genie模型,证明了AI可以通过视频学习脑补出一个可交互的物理世界。它的核心逻辑是:预测未来,是控制未来的前提。 黄仁勋力推的GR00T项目,则利用大规模生成式 AI在仿真环境中为机器人提供预演能力。NVIDIA的思路是让机器人在数字孪生世界里先经历万次挫折,从而在现实中获得物理直觉。 而Figure 02尽管依然拥有极强的VLA属性,但在其最新的架构中,开始显著强化“动作后果预测”。这种从单纯的指令追随向“物理后果评估”的转变,本质上也是向世界模型的靠拢。 在这场范式跃迁中,国内蚂蚁灵波的打法显得尤为硬核且务实。它不仅认可世界模型这一方向,更率先通过开源路径,给出了从“视觉模拟”到“动作控制”的闭环方案。 其核心在于两套互为表里的系统。LingBot-World不止是一个视频生成模型,更是构建一个与物理世界规律一致的 高保真、可交互仿真环境。机器人可以在这个虚拟世界里进行无数次零成本的人生模拟,学习技能、试错规划,再将经验无损迁移到现实。 这意味着,在动手前,它能预判出杯子受力后滑动的轨迹、织物被抓取后的形变,并在大脑里完成物理模拟。 LingBot-World 在适用场景、生成时长、动态程度、分辨率等方面的表现 真正实现降维打击的,是同步开源的LingBot-VA。它号称全球首个自回归视频-动作一体化世界模型,可根据当前观测,同步生成下一帧的世界画面和达成该画面的机器人动作,实现“边推演,边行动”。 如果现实中物体因为油渍打滑、或受重力影响偏离了预演轨迹,系统能瞬间通过画面的不对齐感知到偏差,自动修正抓取力度或角度。 这种“预测-对齐-修正”的闭环,本质上是给机器人装上了一双能看穿物理因果的慧眼。它让机器人不再只是死记硬背VLA的动作概率,而是拥有了应对非标环境的物理直觉。 这是解决机器人进入药房、家庭、工厂等复杂场景时可以见招拆招的关键。 03. 产业价值:从特种表演到通用交付 脱离了实验室的炫技,这种从“动作映射”到“物理预演”的跨越,本质上也是在为产业的规模化交付扫清障碍。 首先是数据效率的质变。以前训练一个新技能要喂上万条真机数据,而在 LingBot-VA 的逻辑下,模型懂因果、懂常识,只需30~50条演示数据就能类比学会新任务,落地成本极大缩减。 其次是任务成功率的确定性。具身智能最怕的不是任务难,而是环境乱。在 RoboTwin 2.0 仿真基准数据中,这种具备“预判能力”的大脑表现出惊人的韧性,多任务成功率稳定在 91% 以上。 换句话说,机器人即使在环境杂乱、传感器有噪声的非标工厂里,也能稳健地完成长流程操作。 最后是大脑的通用性。全栈开源背后,是一套通用大脑适配多元硬件的底座方案。无论是宇树的 H1、G1,还是各类工业级机械臂,都可以共用这一套底层认知逻辑。 这就意味着下游厂商不必再为每一款机器人重复造轮子,而是可以将精力集中于垂直场景的工艺打磨。 04. 结语:从“秀场”走向“战场” 在具身智能的赛道上,从来没有唯一的标准答案。 回看这几年,我们其实是在分步给机器人装零件:2023年是“对台词”,接入大模型让它听懂了人话;2024年是“练筋骨”,硬件成熟让它走出实验室,学会了基本的拿放。而如今是逻辑觉醒,机器人终于开始理解物理规律,动手前学会了先在大脑里打个草稿。 当然,VA架构虽然展现了降维打击的潜力,但它并非唯一路径。 业内关于最优方案的博弈从未停止:有人依然笃信数据够大,纯 VLA 模型也能暴力模拟物理规律;也有人主张用严谨的数学公式去精准控制,确保极端场景下的零差错。 这种多路线的交叉跑位,反而让2026年的具身智能赛道更具实战价值。 VA 路径的意义在于,它极大地提升了机器人在非标环境下的直觉。当机器人开始拥有这种物理逻辑,能在三维世界里精准预判、稳健操作时,具身智能才算真正从春晚的舞台,落到现实产业中。
含广量40%,这届AI春晚是电视台“最后的荣光”
文 | 娱乐资本论,作者|James 在每年春节档,除了总台春晚之外,河南卫视春晚也因曾诞生《唐宫夜宴》《只此青绿》等一系列生动描述中华文化的优秀作品,而备受观众期待。 但令人意外的是,今年的河南春晚却画风突变,成为了一场由AI主导的“广告大杂烩”。网友对本次晚会的评价并不高,他们抱怨分不清广告和正片,主赞助商“千问”洗脑循环,还有遍地开花的AI滥用。 之前口碑颇高的河南春晚何以至此?娱乐资本论也复盘了全场晚会,发现它最大的问题实际上是组织结构松散,广告植入过于频繁生硬,几乎变成了广告片和MV的堆砌。据手动统计,这台晚会广告环节画面占比高达40%。 问题还不止河南一家。在全国省台的十几台春晚中,都大量融入了AI元素,以及标榜节目由AI共创,就算是关注度最高的总台春晚也不例外。豆包赞助了总台春晚,百度和千问则分别冠名赞助了2台和4台省级晚会,再加上其他AI厂商,娱乐资本论发现涉及AI广告的一共有十台春晚。 有网友评论说:“今年春晚像教师公开课一样,被要求与AI融合”。 在绘圈、文圈为代表的网民大量发声痛斥AI渗透创意产业的同时,明确拥抱AIGC,大力宣传AI融合,却成为从电视台到主管部门步调一致的努力方向。 如果AI用于文娱产业的趋势不可阻挡,我们想知道,使用AI就一定会被网友骂吗?怎样的AI应用才能被观众广泛接受、喜闻乐见? 没有舞台的“晚会”,在广告里插播节目 娱乐资本论看完整档河南春晚之后的第一个感受是——这档节目在本质上根本不能称之为“晚会”。 整场晚会没有实体舞台,全程依靠 AI 虚拟场景串联节目。所有节目均在不同的布景中完成;它也没有统一的舞台调度和主持人报幕。每一个节目看起来,都像是总台春晚在串场间隙播放的几分钟公益广告一样,结果就变成了很多广告片、MV的堆砌。在微博评论区,有人管这叫做“电子ppt”。 这让许多观众感到困惑。一台没有主舞台和主持人的“晚会”,还能叫晚会吗?即便制作者将其定义为创新,恐怕也很难让传统观众接受。节目切换也很突兀,正式播出片头后还没有主持人引导,部分观众甚至将刘宇的财神歌舞《马上来财》误认为广告内容。 小鹿的脱口秀把台词配画面,且自己也来回走动,像是在演情景剧,相对之前的站立形式比较特别,这也是因为没有主舞台的缘故。但是因为没有罐头笑声,导致观看体验和常规脱口秀完全不同,也是有点诡异。 “河南卫视首次彻底取消真人主持和实体舞台,全程采用 AI 虚拟场景串联节目,成为地方春晚首个全虚拟制作尝试。”官方新闻稿表示,“晚会依托唐小妹、洛神等经典虚拟 IP 完成节目衔接,整台晚会全程采用 AI 生成背景与虚拟场景,舞者与歌手仿佛置身于流动的数字幻境之中。” 或许河南卫视希望通过不设置会场,创造一个让观众戴上VR眼镜一般,无尽遨游的沉浸式体验,但从反馈来看,观众对于一台晚会的基本希望,还是预期它是一个有舞台,有观众,有报幕的传统过程。或许舞台可以通过AR或者AI无尽延伸,或者也可以有分会场,但现场的鼓掌声往往是两个节目之间最为自然的过渡,主持人口播的广告词也可能比直接放广告片更符合观众的心理预期。 在这个前提下,晚会的每一个节目都进行了深度的商业植入。赞助商的名字出现在各个环节,植入感显得极为生硬。本来以为去年总台春晚的小品到处都是小红书靠垫就已经很过分了,没想到河南春晚才是植入界和硬广界的真正扛把子。 电视端原定 19:30 播出,却延迟至 19:50 开播,观众被迫观看 20-30 分钟纯广告轮播。正片中的广告密度更是令人咋舌,说是广告里插播几个节目也不过分。 娱乐资本论统计了整场晚会出现的各色软硬植入: 主赞助商千问App几乎贯穿全场,从开场的AI抱枕、屏幕画面,到AI说书人、舞台地砖上硕大的Logo,节目里生硬插入的Q版广告,不断复读瓜分30亿。连杨丽萍舞蹈前,都要先播一段本人出镜的硬广。因为时长压缩和前后插广告,《花开富贵》几乎失去了艺术完整性。 功夫表演《功夫机缘》活脱脱变成了智元机器人的产品发布会,全程展示机器人性能;蜜雪冰城的雪王不仅有定制节目,还唱满了广告歌。 游戏厂商也不甘示弱,《暗区突围》和《燕云十六声》直接把游戏元素搬上舞台,甲胄、布景全是游戏风,一场表演就是一段游戏PV,相比它们,暖暖的植入极其温和,连名字都没有露出,只是暖暖上去跳了个舞。 其它诸如爱他美奶粉、六福珠宝、妙可蓝多、仰韶彩陶坊等品牌,选择了在公用节目中拼盘植入,奶粉罐和酒瓶子在镜头里来回穿梭,见缝插针。 晚会开头放了20分钟广告,收尾也没有什么《难忘今宵》,画面定格在乐事薯片的广告条上戛然而止,下一秒开始出字幕了。这种为了服务金主,而把内容切割得支离破碎的做法,遭到了网友的痛批。 娱乐资本论粗略统计,整场晚会有靠枕等软植入,提示条,logo硬广等的所有广告环节加起来的画面占比接近 40%,节目和广告的界限完全被打破,商业植入就像疯长的野草,疯狂缠绕并挤压实际内容的生存空间。 用AI是晚会的“原罪”吗? 在上述糟糕的观看体验同时,AI大量植入让晚会风评雪上加霜。 本次晚会导演明确表示大量节目使用了AI技术。在这一前提下,网友们非常热衷于“找茬”,指出节目中因AI生成导致的光影渲染不对、人物不对、招牌不对等问题。 网友批评主要集中于全场滥用AI生成背景与特效,导致舞台充斥冰冷的机械感。在《永乐未央》中,XR 技术复活的永乐宫壁画人物与现代舞者共舞,本应惊艳的跨时空对话,却因失真感明显的虚拟场景被批诡异、缺乏灵气。由于舞台过度频繁晃动,观众甚至无法看清武打演员的动作细节。实际上只要在一个常规舞台上使用常规运镜,观众对台上的人的表现就可以感知得非常彻底。 有多个节目过多依靠 AI 生成画面,使得特效和节目内容特别脱节,甚至节目不完整,有跳跃感和“抠图粘贴感”。同一件事可以有不同的解读,开场歌舞《万马奔腾》的马匹形象,往好了说就是AIGC的绝美艺术,观众看生气了就会吐槽“连马都是 AI 做的”。 更严重的问题是几个出现打铁花的镜头本来都是真人出演,却因为前后叠加的虚拟烟花和光污染而惨遭喧宾夺主。在传统打铁花舞台上,当表演开始时,它占据了舞台的视觉中心,给观众以震撼,在河南春晚的成片里,它却好像仅仅是个陪衬。真人表演与 AI 特效的界限模糊不清,观众真假难辨,严重削弱了人类主体表演的艺术感染力。 加上全场哪怕连个AI主播都没安排,报幕的活人感也消失了,给本届河南春晚AI生成的负面评价钉上了最后一颗钉子。 但客观地抛开这些瑕疵,如果将它们视为独立的AI影视作品上传至网络,其整体质量其实处于较高水平,并不算差。 本届河南春晚,瑞幸联名MV的制作方在小红书上分享了幕后流程:从剧本描述到“抽卡”生成,经历了繁复的步骤,且并非100%全自动,也结合了传统技术进行合成。 春晚结束后的滚动名单中,显示有5人负责晚会AI制作。不过上面说的瑞幸影片的主创团队并未在其中列出,可见不同项目可能还有其它未署名的团队负责AI视频生成和制作。 结合《牌子》、贾樟柯《贾科长Dance》等近期涌现的优质案例,很难一概而论地说“AI做的东西不如人”。观众的怒气更多是因为在期待看到一场晚会的时候,却因为AI生成内容,产生了强烈的“糊弄事”的廉价感。 但与此同时,河南春晚总导演路红莉却对媒体表示,今年“对于 AI 的大量运用是往年所没有的,真正做到了文化加科技,把最先进的理念融入节目创作中”。 事实上,AI生成已成为一种技术显学和“政治正确”,这不仅是河南春晚一家的问题,而是说,各家电视台都将“全链路融入”AIGC视作晚会的创新之举,是一种“出成绩”的表现。我们可以从电视台和大模型端的宣传稿当中摘录一些: 不论观众是否接受,无论是从拥抱新技术、鼓励AI发展的政策角度,还是从媒体自身开源节流、降本增效的角度,AI势必会在未来的晚会中得到越来越广泛的应用。 AI救场背后,电视台的经济账 AIGC“入侵”各地春晚的趋势本就难以阻挡,更不用说在今年,各家AI大模型的广告投放,已然成为各省春晚最粗的一根“救命稻草”。 今年春节期间,全国各级广播电视台和网络视听平台精心策划了40多场特色春晚。据介绍,除了总台春晚外,这些涵盖歌舞、戏曲、民歌、少儿等多种题材的节目将“百花齐放”,为全国观众提供“诚意满满、异彩纷呈的春节文化大餐”。 但在各省纷纷办春晚的表象背后,是收视率连年走低、影响力逐步下降、办会越来越困难的严峻现实。如下表总结,各大卫视的14场晚会中有4家无赞助商,“剃光头”开播。正如娱乐资本论长期关注电视剧集的招商数量一样,如果一部剧是“零广开播”乃至“裸播”也就是全程无广告赞助,观众反而需要为这个IP乃至背后工作室的后续生存感到担忧。 据行业内人士对小娱透露,目前各家电视台的财政状况都比较捉襟见肘。恰逢此时,以阿里千问、字节豆包、百度文心为代表的AI聊天机器人,发动了猛烈的春节攻势,加码赞助各省春晚,作为其春节推广战的重要环节。 豆包本次春节给新用户分的总金额未有官方披露,包含8888现金大奖及“10万份科技好礼”等。其最重要的春节动作就是赞助总台春晚,去年12月底就已经披露,成为各家中动作最早的。这也许刺激了元宝和千问赶在除夕之前推出活动,且分别在2月1日和2月6日前后就迎来流量高峰。各家活动高峰期,App Store下载量也交替登顶,截至目前千问和蚂蚁阿福的商店排名较为靠前,国区免费榜被各种AI助手占领。 在豆包和元宝之后,百度官方披露现金红包是 5 亿元,在晚会赞助方面,百度 App 作为首席 AI 合作伙伴合作北京春晚,百度地图则与天津卫视相声春晚独家特约合作。而喜提四个独家冠名的阿里千问,更是所有AI产品当中的“显眼包”。 千问官方披露2026年春节全周期总投入30亿元,后又加码至60亿元。该预算包含全场景消费免单补贴、用户权益活动等全部春节营销支出,而河南、东方、浙江、江苏四大卫视春晚独家冠名费用也包含在这个总投入内,具体金额则未披露。官方称合作内容是“片头片尾、角标、口播及互动页面全链路品牌露出,并作为官方 AI 合作伙伴参与节目共创”。 除此之外,阿里系内另一大C端AI应用——蚂蚁阿福也首先成为“CCTV健康生活合作伙伴”,然后在总台春晚出镜,成为豆包之外唯一露脸的AI助手。它选择不跟千问“同室操戈”,而是差异化走位,但背后少不了海量投钱。 娱乐资本论观察年初一播出的东方、浙江、江苏春晚,发现千问App的露出方式和总台春晚露出豆包这一AI合作伙伴,及追觅等其它合作伙伴的方式相同,均为主持人口播,角标,手机App互动,以及小品的抱枕、招贴画等角落,语句软植入等。 这些春晚播放期间,无孔不入的广告植入也引发了网友的口诛笔伐。但即使跟这些批评相比,河南春晚的植入方式还是可以说成“独树一帜”。 赞助商数量、呈现方式等变量,往往与该节目的全网讨论度和影响力,以及电视台本身的财力挂钩,也决定了电视台拥有多大的议价权。河南春晚历年口碑不俗,按理说不至于如此缺钱,但从最终呈现来看,他们显然还是对广告商做出了极大的让步。这或许与电视台的总体财政状况有关;甚至不能排除,如果没有这些相当于直接放广告片的深层植入,这场“春晚”可能根本无法存在。 一个有趣的对比是,在河南春晚仅一个多小时的“正片”之前,还有一个一小时左右的“2026河南健康网络春晚”。该节目由河南省卫健委与河南卫视合办,虽然同样没有主舞台和主持人,谋篇布局更是类似网络短剧,但由于植入商家非常少,在网上反而收获了不少好评,很多声音认为这个“中医春晚”比此后的正片好看多了。 不过这个特殊的编排背后,更可能是另一种无奈的解读——由于各种原因,不得不让之前的健康春晚部分减少赞助,为了补贴由此产生的成本,才把大量的广告植入放在了后面的春晚节目中。
苹果公司将在3月初发布大量新品 包括一款廉价iPhone
近日,苹果向部分记者和内容创作者发出邀请,将于3月4日(周三)在纽约、伦敦和上海举办一场“特别的苹果体验活动”。 有海外博主猜测,苹果可能会在3月2日至4日(周一至周三)逐日宣布新产品。 他推测,苹果或许会通过新闻室的新闻稿形式发布新品,比如周一发布iPhone 17e,周二发布新款iPad,周三发布新款MacBook,随后在3月4日的体验活动中提供实物演示和上手体验。 彭博社记者马克·古尔曼(Mark Gurman)回应称,根据他得到的消息,苹果在该周的周一、周二和周三发布新产品。 古尔曼还表示,苹果可能不会为这些新产品举办典型的线上直播活动,而是通过苹果新闻室网站发布新闻稿来宣布新品,不过可能会为每款新产品准备一段短视频。 苹果过去曾多次在周一至周三期间发布新产品,例如2019年3月推出了新款iPad mini和iPad Air、iMac以及AirPods型号;2024年10月推出了新款iMac、Mac mini和MacBook Pro型号。 目前,有多款苹果产品被传即将发布,包括: 低价位MacBook:搭载A18 Pro芯片、12.9英寸显示屏; iPhone 17e:可能配备A19芯片、MagSafe以及苹果的C1X和N1无线芯片; iPad Air:芯片从M3升级到M4; iPad:芯片从A16升级到A18或A19; MacBook Air:芯片从M4升级到M5; MacBook Pro:芯片从M4 Pro和M4 Max升级到M5 Pro和M5 Max,并支持PCIe 5.0以实现更快的SSD速度; Mac Studio:芯片从M4 Max和M3 Ultra升级到M5 Max和M5 Ultra; Studio Display:配备27英寸屏幕、mini-LED背光、最高90Hz或120Hz刷新率、HDR支持以及A19或A19 Pro芯片; Home Hub:全新智能家庭中心,配备更个性化的Siri、6至7英寸方形显示屏、A18芯片,支持FaceTime等; 还有苹果设计的支持HomeKit的安全摄像头配件。
春节祈福,AI算命火了
定焦One(dingjiaoone)原创 见习作者 | 雷晶 编辑 | 金玙璠 新春佳节,寺庙香火鼎盛,然而,有些年轻人选择了一种更为便捷、私密的祈福方式——“AI算命”。他们不再执着于烧头香或求见命理大师,而是把自己的焦虑、困惑、迷茫,通通喂给AI算法,寻求指引和慰藉。 应届毕业生佳瑜在求职的迷茫期,尝试用AI测算职业方向。她只输入了生辰八字,AI便分析出她“细腻敏感”的性格特质,并给出了相应的职业建议,让她感叹“像是被看穿了”。 另一位用户晓华,则对AI预判她新工作将面临“温水煮青蛙”的处境感到惊讶,因为这与她的实际体验高度契合。更让她意外的是,AI对她感情走向的分析,竟与家人请线下命理师测算的结果相近。 社交平台上,围绕AI算命的讨论不断升温。从求职、跳槽到感情走向,年轻人把它当作倾诉出口,也当作决策参考。艾媒咨询数据显示,玄学已成为国内消费者情绪消费的重要偏好之一,有18.29%的消费者对玄学及相关的好运经济产品表现出消费偏好,而其中18至30岁的Z世代用户占比超过70%。 只是,这门精准踩中年轻人情绪需求、看似“离钱很近”的生意,真的赚钱吗? 春节不去寺庙改求AI,“赛博占卜”火了 当长辈们还在庙里排队求签时,年轻人已经打开手机,开始了一场“赛博占卜”。 晓华是AI算命的重度用户,自2024年初DeepSeek爆火后便开始尝试,如今几乎每周都要用AI算三四次,涵盖职场、人际交往甚至日常琐事。 在AI算命火爆之前,她已经是测测APP等命理工具的用户,对八字、星盘、奇门遁甲都有了解,AI算命在她看来,不过是传统命理研究工具的升级版。 像晓华这样的年轻人不在少数。艾媒咨询数据显示,AI玄学用户中,18岁-30岁群体占比超过70%,Z世代是绝对主力。他们算事业、问姻缘、看学业,在不确定性中寻找确定性。 其中,心理慰藉是他们的首要需求。 图源 / pexels 佳瑜的AI算命之路始于求职困境。她把自己的八字分别提供给三个不同的通用大模型,让AI结合命理知识预测“未来三个月是否能找到工作”。她坦言,会对比不同结果,最终选择相信一个自己更倾向的答案。这种“选择性相信”的背后,恰是年轻人复杂的心理诉求——AI算命成为一种低成本的情绪出口,满足了他们寻求心理安慰的需求。 部分用户将AI算命当作心理咨询的替代品。许珍最初接触AI算命是为情所困,如今她更多借助AI进行自我剖析,同时也会阅读一些心理学的书籍,在用AI算命的过程中结合心理学知识进行自我分析。 除了心理慰藉,一部分年轻人还将AI算命视为决策辅助工具。晓华在面临两个offer选择时,专门用AI推演了两份工作的发展前景,最终结合AI给的情况和自身感受做决策。坚坚也用AI预测“今年能不能跳槽”,她提到,自己并非完全依赖,但会把它作为参考维度之一。 算命本身并不新鲜。线下塔罗师、命理师并不少见,甚至在一定程度上,人和人之间交流带来的真诚感,往往比人和AI要高。如果只是为了求安慰、找参考,为什么非AI不可呢? 坚坚对比过线下算命和AI算命,她发现有的命理师只说好的部分,让她觉得前途光明万丈;有的则讲究“铁口直断”,不顾及顾客感受;而AI则能在客观分析的基础上,最终以更“取悦”用户的方式呈现结果。 许珍曾专门去找朋友推荐的命理师算命,对方既不准拍照也不准录音,还说着她听不太懂的方言,导致她并没有记住多少。加上,很多困惑无法在当下组织好语言,事后又缺乏追问的场合。相比之下,AI算命可以随时随地开启,无需投入交通、时间成本,且能够随时追问,不用担心听不懂或记不住。 当然,AI算命并非没有争议。主要问题在于准确性,有用户吐槽,不同AI算出来的结果矛盾、八字排盘出错、回答过于宽泛,“放之四海皆准”。 然而,更普遍的态度是“半信半疑”的实用主义:不过分在意结果,有时候看完就忘记了。归根结底,算命进入算法时代,年轻人寻求的是一个永远在线、永不疲倦的“电子树洞”。 谁在做AI算命生意:两类玩家,两种模式 在年轻人对AI命理热度高涨的背景下,创业者们纷纷入局。AI命理赛道可以简单分为两类玩家:一类是出海派,用东方神秘学“收割”海外付费;另一类是本土派,把玄学包装成心理服务或泛娱乐产品,在国内市场夹缝中寻找生存空间。 “出海派”的核心策略是利用“文化溢价”。 FateTell是其中的代表。以生辰八字为切入点,主要产品是“命之书”(提供超万字报告、AI解读)和“运之书”(聚焦运势波动)。 图源 / FateTell官方微信公众号 在付费模式上,FateTell采用按次付费和订阅制相结合的方式。按次付费使用门槛较低,意在引流;订阅制则通过提供每日能量提醒等陪伴服务,锁定长期价值。FateTell的运营负责人Sally告诉「定焦One」,目前FateTell海外用户付费率4%,复购率38.7%,70%收入来自会员订阅,已实现盈亏平衡。 OCTA则专注于更细分的风水赛道。创始人Rick告诉「定焦One」,风水在海外有较高的认知度,且需求强烈,其团队基于此开发了这款产品,用户拿手机扫描空间,结合生辰八字生成专属风水报告,还能与AI风水师实时对话。 获客方面,FateTell靠口碑传播,OCTA则计划通过Instagram、YouTube等海外平台推流获取早期用户。它们的共同打法是弱化“算命”标签,强化“东方哲学”和“心理疗愈”的定位,以适应海外市场。 相比之下,“本土派”更聚焦情绪陪伴。 问玥与万象有灵的产品逻辑较为相似,均以精致虚拟人格为交互载体,弱化命理属性、强化陪伴体验。两者的使用体验与通用大模型十分接近,都是以聊天形式展开,区别在于增加了虚拟人物载体,让陪伴感更直观、强烈。 功能和定价方面,问玥提供抽牌解读、生辰分析、随意闲聊等功能,免费次数用尽后需付费解锁;万象有灵主打算卦服务,并提供单次付费的“宝典”(专属报告)。 图源 / 万象有灵(左)、问玥(右) Quin则从西方塔罗切入,提供次卡、月卡、年卡等多档选择,并以免费的每日运势解读低成本吸引用户。 国内派的获客主要依靠私域渗透与社交裂变,通过社群运营和用户分享实现增长。 可以确定的是,单纯的AI命理工具不足以支撑商业模式。无论是出海市场的文化溢价,还是国内市场的情绪价值,最终都将“算命”转化为“服务”以实现商业化,为用户提供超越预测的价值。 赚钱不易、含AI量存疑,命理产品能火多久? 尽管AI命理在社交平台热度居高不下,但落到商业层面,这门生意似乎“叫好不叫座”。 从整体格局来看,出海市场相对容易赚钱,盈利模式也最清晰。海外市场对东方神秘学的认可度较高,加之成熟的付费习惯,使得出海玩家能够摆脱国内的低价竞争,凭借文化溢价掌握定价权。 Rick选择先做海外市场正是基于这一判断。他告诉「定焦One」,从海外社交平台的视频评论区能明显看出,海外用户对东方玄学的需求真实且旺盛。近年来,传统文化出海已成趋势。 国内市场则是另一番景象。国内用户对虚拟服务的付费意愿尚未成熟,加之命理产品替代品较多,垂直AI命理应用几乎没有定价权,只能在低价红海中竞争。 首先要面对的是通用大模型的威胁。在DeepSeek、豆包、Kimi等大模型中输入生辰八字后即可免费获得命理分析,且没有使用次数限制。市面上还存在大量爱好者开发的免费或低价AI命理网站或小程序。 另外,还要面对测测等老牌工具的AI化升级(这类玩家手握大量沉淀用户和多年品牌认知)以及线下命理师(靠专业度和强信任占据高端市场)。垂直AI命理产品被夹在中间,难以向上突破,也难以向下沉淀。 抛开盈利难题,更深层的问题在于:这类产品中AI的含金量究竟有多高?AI能带来哪些真正的增量价值? 图源 / pexels AI命理这类垂直应用的核心卖点是比通用大模型更准,但多数产品依赖OpenAI、DeepSeek等底层模型做微调或RAG,核心能力绑定外部厂商。强推理模型能提升准确度,但推理成本高昂,有创业者估算,要做到真人命理师七八成水平需500万-1000万投入。也就是说,垂直应用要么主打娱乐化,走情感陪伴,要么接受初级命理师定位,采取低价策略。 不过,这并不意味着AI技术只是命理产品的“噱头”。Rick告诉「定焦One」,AI技术的成熟让玄学实现了规模化、产品化,借助空间计算、多模态等AI技术,命理服务能落地为可感知、可使用的产品,比传统命理师获得的信息更多、更准确。 具体来看,AI的价值主要体现在三方面:服务效率提升、服务门槛降低、服务个性化。 这也正是AI命理产品与传统互联网算命的本质区别。传统互联网算命本质是线下命理服务的“线上迁移”,核心是真人命理师的知识和服务;而AI命理产品是借助AI技术将命理知识产品化,核心是算法模型的分析和输出。前者卖的是人的专业度,后者卖的是技术的规模效应。 但真正的行业差异化,不止于技术本身,而在于借助AI的技术优势转向情感陪伴,创造不同的增量价值。 只是目前来看,整个行业仍处于迷茫期,多数产品仍在替代真人和创造新需求之间摇摆,既没能靠AI技术实现比真人更具性价比、更精准的服务,也没能挖掘出用户真正的核心付费点。 这门生意想要真正摆脱“叫好不叫座”的尴尬,关键还是要找到让用户心甘情愿、不可替代的付费理由,让AI的价值真正落地。然而,当通用大模型越来越聪明,当免费替代品随手可得,AI命理产品还能走多久?
CounterPoint发2025Q4欧洲手机战报:苹果份额33%最高
IT之家 2 月 19 日消息,市场调查机构 CounterPoint Research 今天(2 月 19 日)发布博文,报道称尽管面临宏观经济挑战,欧洲智能手机市场在 2025 年第 4 季度仍交出了一份亮眼答卷,出货量同比增长 2%,延续了上一季度的复苏态势。 在具体厂商表现上,苹果毫无悬念地拿下冠军宝座。得益于 iPhone 17 系列在市场上的极高热度,苹果在该季度的出货量同比增长 7%,市场份额较去年同期扩大 2 个百分点至 33%。 紧随其后的三星也走出了 2024 年末的低迷阴影,出货量同比增长 4%,将市场份额提升至 29%,较去年同期扩大 1 个百分点,稳固了其在安卓阵营的领导地位。 小米则面临严峻挑战:一方面在东欧受到苹果的挤压,另一方面在西欧遭遇激烈竞争,加之小米 15T 系列的表现不及上一代 14T,导致其出货量同比下滑 6%,市场份额下滑至 16%。 荣耀(HONOR)表现最为抢眼。延续了过去两年的增长势头,荣耀在西欧市场大举扩张,2025 年第四季度出货量同比暴涨 18%。 realme 真我位列第五,2025 年第四季度出货量同比下降 21%,市场份额为 3%。 Counterpoint 副总监 Jan Stryjak 发出预警:存储芯片价格的上涨将成为 2026 年市场的最大“黑天鹅”。零部件成本的增加预计将导致整机价格波动,从而引发市场显著下行。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。