EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
饿了么“橙了” 即时零售的博弈才真正开始
来源|半佛仙人 编辑|Ray 这段时间饿了么改名淘宝闪购的消息大家都看了吧。 身边的很多朋友都看到自己手机上的饿了么APP更新成淘宝闪购了,我的还没更新,估计很快也要灰度测试到了,毕竟我连新战袍都穿上了。 我觉得这次改名是非常好的事情,真的,从消费者角度,这个改名实在太好了太妙了太棒了。 为啥? 因为这代表阿里要玩儿大的了,要使劲儿发券了。 作为消费者,最开心的就是平台之间打起来,狂卷,只有这样消费者才有实惠。 最担心的是平台之间打文明礼貌拳,都想着爆消费者金币,整什么乱七八糟的默契,那就坏事儿了,成联合收割机了。 这次改名说明了起码阿里是玩儿真的,决心更坚定也更强了,那当然券也更多更猛了,毕竟改个名这么大的事儿多少得来点利是嘛。 没开玩笑,这个改名的性质就是这么重要,因为不是饿了么改名叫饱了么,而是冠以【淘宝】二字。 这代表阿里已经押上了自己的脸面,是没有留退路的。 再说一遍,你没看错,冠以淘宝二字,就没有退路了。 之前叫饿了么,说白了只是阿里的生态公司,这个业务重要,但其实也没那么重要,因为从命名上就比其他对手要低一级。 这就代表可以输,之前当行业第二当了那么多年也没见怎么样。 毕竟是【饿了么】嘛,对手都是师傅亲自挂名,自己只是业务里的小弟。 但,改名之后,性质直接就变了。 饿了么可以躺,【淘宝闪购】不可以。 因为这个名字已经是把级别提上去了,一旦不成功,立马就要成梗。 哇这想想太难受了。 这个级别的公司,不怕赔钱,但真的很怕很怕丢脸,尤其是如此大张旗鼓的改名,最后如果从结果来看不够好,那可太严重了。 所以只能赢,不能输。 所以,必须加大发券和补贴的力度,押上一切。 当脸面都押上去的时候,那真就是既分高下也决生死了。 当然,还有发券。 那么问题来了,本来叫饿了么叫得好好的,为什么突然要押上脸面玩儿这么大?外卖有这么大魔力吗? 当然没有,外卖不值得玩儿这么大,只是外卖的话,其他家也不会参与进来,不够费劲儿的,大家也不是钱多烧的。 这次根本不是外卖战争,是【即时零售】战争,送餐只是其中的一环而已。 大家真正要争的是,之后需要任何东西快速送达的时候,第一个想到谁,下意识在谁那里下单。 这本质是【电商模式】之战,过去的电商模式在面对【即时零售】带来的变局时,自己要怎么办。 这场大战的意义,要比外卖重要得多。 这直接牵涉了电商的本质规则。 电商本质是什么? 表面业务上,是【多】,【快】,【好】,【省】的综合博弈。 但从本质上,电商是【物质与时空】的对应关系。 别笑,真的是【物质与时空】,我没写错。 你想,电商业务真的拨开,说白了不就是在一定【时间】内把一个【物体】运送出一定的【距离】到你手里最终占据了你家里的【空间】吗。 这里面的每一个环节,都牵涉了大量的成本与效率。 以及巨大的变量。 当你从这个角度来思考的时候,你会发现,这场仗必须打,不打不行,阿里必须玩命。 玩命,才是真的清醒。 因为即时零售对当前的电商模式,是一次重构和洗牌。 过去大家在电商上买东西,【多】,【好】,【省】,其实都可以满足,能卷的都卷完了,价格都做到极限了,数量都多到眼花缭乱了,工厂都标准化了。 唯有【快】上,是还有提升空间的。 过去的电商再快,你起码要等个一天,哪怕是当日达,也要半天。 这一切在【即时零售】的快速送达面前,都太慢了。 当你发现你需要的东西几十分钟就能送到你的手里时,这带来的确定性会重构你生活以及购物的决策。 举个例子,就像是现在的人冬天不会再囤积萝卜土豆和大白菜了,因为现在什么菜都有了,买菜太方便了。 电商也一样。 即时零售下,你会发现你再也不需要囤东西了,因为过去为了【省】而囤的东西,现在成了你【空间】上的束缚,你如此努力的工作加班买了房子,不是给这堆杂物居住的,尤其是它们的价格跟这个空间你付出的价格比,你想想都要流泪。 这时候,你大部分的需求,都会被即时零售所替代。 同时被替代掉的,还有你的耐心。 你会发现你的很多需求都是临时的,立马就得要,等不了。 家里的猫砂,小孩的尿布,粘东西的胶带,公司活动要的道具,想吃的雪糕水果,朋友聚会时候突然想吃的火锅菜。 这种需求只有两种途径,要么立马满足,要么就不需要在你这里要了。 当你的需求变化的时候,整个市场的逻辑就变了。 这甚至不存在竞争,就是【送得到就要】和【送不到就不要】的区别。 已经不存在扣扣索索地博弈了,只有正面对攻,碾压或者被碾压。 这时候你是电商平台,这部分需求绝对是你要倾其所有去满足的。 不是简单的这里面多少销售额的问题,而是整个【盘子】的运转。 就像膝盖这东西占人体的比重很低,但一旦这个节点出问题,整个运动表现都会变。 所以必须进,不进甚至都没有退的机会。 不进,则死。 到这里,只解释了为啥阿里必须玩命,没有解释为什么他们敢玩儿这么大。 因为,阿里在这个战场里有巨大的优势,在自己有巨大优势的时候,不抓紧时间下重注玩大的扩大优势,那才是失了智。 什么优势? 用户心智。 用户心智不是虚的,而是这个时代最有价值的东西之一,因为这个时代商业的困局不是供给不足而是供给过剩,消费者面对的问题不是选择太少而是选择太多。 说白了,底层问题是当大家东西都差不多,价格都差不多,甚至速度都差不多的时候,我作为消费者选谁? 答案是,想起来谁,就选谁,日常的习惯选谁,就选谁。 淘宝,就是这个选择。 所以为什么一定要改名? 不止是不给自己留后路,押上面子,也是需要【淘宝】这个词带来的用户认可与用户记忆。 你是做别的的,想做电商,说服用户,属于从低打高,很难。 因为用户对你的定义就不是买万物,只是买吃的。 你不可能说服用户的,用户是轻易不会改变固有印象的。 而你本来就是万能的淘宝,现在只是增加了“马上送到”这个新选择,属于从高打低,很简单。 因为用户没有被说服,他们甚至不需要有任何变化,本来用你就是要买东西,现在只是增加了新的功能,更快送达的机制。 由于淘宝这个品牌过于有影响力,很多时候用户甚至都没有意识到的时候已经选择了你。 这,才是改名+押上面子的底气。 看似疯狂,实则清醒。 看到这,知道为啥我说是对消费者是大好事儿了吧。 因为从战略上来看,这次的大战,会持续很久很久,电商新模式之战,对各家都不容有失。 只要打起来,作为消费者就有利好。 另外客观上,当饿了么改名为淘宝闪购的时候,在集团内拿到的资源和预算规模都不一样了,过去虽然也是一家人,但不是直系亲属,定预算的时候总是有点放不开。 而现在,已经是冠以淘宝之名的关系了,整个集团的资源都可以调动过来开打,因为这不是一块儿业务的事情了,是大家所有人的事情了。 而淘宝闪购刚更名,又想借势淘宝,必然要力度加大加大再加大,不然怎么对得起自己的脸和冒的险? 趁着关注度最高的这一刻,砸重注,彻底影响大家的心智,砸到骇人的程度,才是利益最大化的选择。 越疯狂,反而代表越清醒。 他们砸,我们爽。 这才是,对消费者最大的好。
智谱GLM-4.6V系列多模态AI大模型发布并开源,API降价50%
IT之家 12 月 8 日消息,智谱 AI 今日官宣发布并开源 GLM-4.6V 系列多模态大模型,包括: GLM-4.6V(106B-A12B):面向云端与高性能集群场景的基础版; GLM-4.6V-Flash(9B):面向本地部署与低延迟应用的轻量版。 作为 GLM 系列在多模态方向上的一次重要迭代,GLM-4.6V 将训练时上下文窗口提升到 128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。 在性能优化之外,GLM-4.6V 系列相较于 GLM-4.5V 降价 50%,API 调用价格低至输入 1 元 / 百万 tokens,输出 3 元 / 百万 tokens。 同时,GLM-4.6V-Flash 免费开放使用。 GLM-4.6V 即日起融入 GLM Coding Plan,针对用户 8 大类场景定向开发了专用 MCP 工具,模型可自主调用最匹配的接口。 智谱 AI 介绍称,传统工具调用大多基于纯文本,在面对图像、视频、复杂文档等多模态内容时,需要多次中间转换,带来信息损失和工程复杂度。GLM-4.6V 从设计之初就围绕「图像即参数,结果即上下文」,构建了原生多模态工具调用能力: 输入多模态:图像、截图、文档页面等可以直接作为工具参数,无需先转为文字描述再解析,减少链路损耗。 输出多模态:对于工具返回的统计图表、渲染后网页截图、检索到的商品图片等结果,模型能够再次进行视觉理解,将其纳入后续推理链路。 模型原生支持基于视觉输入的工具调用,完整打通从感知到理解到执行的闭环。这使得 GLM-4.6V 能够应对图文混排输出、商品识别与好价推荐、以及辅助型 Agent 场景等更复杂的视觉任务。 GLM-4.6V 在 MMBench、MathVista、OCRBench 等 30+ 主流多模态评测基准上进行了验证,较上一代模型取得显著提升。在同等参数规模下,模型在多模态交互、逻辑推理和长上下文等关键能力上取得SOTA表现。其中,9B 版本的 GLM-4.6V-Flash 整体表现超过 Qwen3-VL-8B,106B 参数 12B 激活的 GLM-4.6V 表现比肩 2 倍参数量的 Qwen3-VL-235B。 智谱 AI 开放了 GLM-4.6V 的模型权重、推理代码与示例工程,IT之家附开源地址如下: GitHub:https://github.com/zai-org/GLM-V Hugging Face:https://huggingface.co/collections/zai-org/glm-46v 魔搭社区:https://modelscope.cn/collections/GLM-46V-37fabc27818446
宇树王兴兴谈把机器人做得像人:老百姓喜欢 更愿意买单
快科技12月8日消息,据媒体报道,在2025腾冲科学家论坛上,宇树科技创始人王兴兴深入阐释了人形机器人研发背后的“拟人化”逻辑与现实挑战。 王兴兴表示:“老百姓喜欢长得像人的。”现实就是,机器人长得越好看、越像人,消费者就更愿意买单。 他同时提到,当前AI技术高度依赖数据驱动,数据质量直接决定AI能力上限。而就人形机器人而言,高质量、大规模的动作与行为数据仍处于稀缺状态。 王兴兴向与会者展示了宇树科技在该领域的进展:通过预先采集真人运动数据,并在AI环境中进行训练,机器人已能够复现人类的多样化动作,实现“人怎么动,机器人就怎么动”。 王兴兴也坦言,当前具身智能领域的AI模型仍显不足,“目前阶段类似ChatGPT问世前一至三年的状态——方向已清晰,但突破性成果尚未完全显现。” 他认为,若机器人能在日常生活中80%的陌生场景中,通过语言或文字指令完成约80%的任务,便可视为具身智能领域的“GPT时刻”。目前机器人在单一任务中表现出色,但一旦物体或环境发生变化,尤其是面对多任务叠加时,成功率会显著下降,这反映出机器人在泛化与推理能力上的短板。 最后,王兴兴透露:“明年的腾冲科学家论坛,或许我不必亲自到场,可以派遣机器人代表我参会。我可以在杭州远程操控,让它同步我的语言和动作,实现实时交互。这项技术已经具备可行性,预计明年可投入实际应用。”
何小鹏解读人形机器人设计逻辑:世界按人类需求构建
IT之家 12 月 8 日消息,在上周末的极客公园创新大会 2026 上,小鹏汽车董事长何小鹏谈到了为何把机器人做成人形。 何小鹏表示,小鹏的机器人,我们希望能够真正走入到商业、工业、家庭,在未来的时间。所以我们一直都觉得它需要拟人,一个拟人的机器人需要有人的形态、人的长相、人的肌肉、人的皮肤,我们这一次做的机器人里面,第一次发现了以前我们自己研发机器人七年,自己不愿意碰、拥抱这个机器人。因为你看到这个机器人是个钢铁,你会担心它有电,你会担心它有威胁,担心它摸起来不舒服。一旦当机器人有肌肤、皮肤、血肉的时候,你会感觉到它是真正可能是你未来的伙伴。 从具体条件来看,何小鹏解释称: 首先,环境适配性。下一个二十年、三十年全球有很多种机器人,一定有非常多的专有机器人。但我们相信人形机器人是最普遍的,因为这个世界是按照人去设计的。如果你想让一个机器人更容易适应于这个社会,人形是非常重要的,因为这个社会都是为了我们人去思考、设计、使用的。 何小鹏提到一个案例:如果一个人走到床头柜旁,可以轻松原地转身;但对于四足机器人而言,在狭窄空间内原地掉头的难度非常高。 第二点是数据获取。只有把机器人做成人形,才能直接利用海量的人类行为数据,来对机器人进行训练。如果做一个专有机器人,要获得海量数据是非常困难的。 第三点是工具使用。很多人说可以把机器人做成跟一个工具的嵌入合体,它当然更好,我同意。但是这个世界上有 100 万种工具为人而设计去使用的,人形机器人可以最大程度适应这些工具。这跟机器人只有一个工具或者少数几种工具的使用权利相比,有非常大的不同。 IT之家注意到,小鹏 11 月 5 日晚在科技日活动上发布全新一代人形机器人 IRON,猫步走得像人一样轻柔,还拥有像人一样思考“大脑”。IRON 作为最拟人的人形机器人,拥有「骨骼-肌肉-皮肤」:仿人脊椎、仿生肌肉、全包覆柔性皮肤、头部 3D 曲面显示、仿生灵动双肩、实现 22 个自由度的灵巧手。 全新一代人形机器人 IRON 搭载物理世界大模型,拥有 3 颗图灵 AI 芯片,构建 VLT+VLA+VLM 高阶大小脑能力组合,可实现对话、行走、交互等高阶智能。 何小鹏表示,小鹏汽车将在明年底率先规模量产高阶的人形机器人,期待在 2030 年小鹏机器人的年销量超过 100 万台。
豆包手机的“生死劫”:权限、边界与生态
豆包碰了谁的奶酪? 文/郭佳哿 编辑/张晓 发布仅一周时间,豆包手机助手就已经引来舆论层面的几轮冲击。 12月5日,豆包团队发布公告,称为了让技术发展与行业接受度良性适配,将对AI操作手机的能力进行“规范化调整”。其中包括限制金融类应用和部分游戏的使用。 图/豆包手机助手官微 此前12月1日,字节跳动豆包团队发布豆包手机助手技术预览版,是在豆包大模型基础上和手机厂商在操作系统层面合作的AI助手软件,并官宣率先落地中兴旗下的努比亚M153,这款真正接近“AI手机”的产品,3499元的价格一度在二级市场炒至万元高价。 随后不少业内人士抨击,豆包拥有的跨应用操作能力,是因为获取了一项操作系统高危权限INJECT_EVENTS,直接引来抖音副总裁李亮的公开发声:“只要是用户许可就不存在侵犯隐私的行为。豆包手机助手是经过用户授权,才能完成操作手机的任务”。 图/@抖音集团李亮个人微博 短短一周,这一系列喧嚣不仅将系统级AI推上风口,也让外界看清了AI Agent在终端上的潜力与局限——让每个用户真正拥有自己的“贾维斯”,远比想象中要难。 01 一个无限接近AI Agent的产品 豆包手机助手的直观功能并不复杂。 除了基础的多模态能力和本地工具调用,它最核心的能力其实是跨应用自动执行和全局记忆功能。 在豆包最早发布的演示视频中,在不同电商平台比价下单、调取用户放进微信、小红书、大众点评等App收藏夹的地点,并在地图上进行标注,都是典型案例。 类似早期单个AI搜索软件中的上下文感知能力,豆包手机助手的全局记忆相当于把这种记忆能力扩展到用户平时对手机的所有操作上:你保存的某个日程、关注的某家餐厅、记录的某人生日,全局记忆让助手能够把分散在不同应用或时间点的任务整合在一起,实现跨应用的连续操作,比如通过唤醒记忆帮你订餐厅、订机票等。 如果说早期的豆包像个聪明的语音助手,如今却更接近直接把你的秘书塞进了系统里。它能理解屏幕内容、判断界面状态、自己寻找任务路径,而非依赖某个插件或API。以往的语音助手只是替你发出指令,豆包开始替你实际“动手”。 某种程度来说,它其实是一个无限接近AI Agent的产品。 但从技术层面来看,豆包手机助手的核心功能逻辑不外乎两部分:读取屏幕+模拟用户操作。 即它可以通过操作系统提供的无障碍接口获取当前屏幕的界面结构和元素信息,换句话说,它能“看到”屏幕上每个可交互元素的位置、属性和文本信息。 图/豆包手机助手官网 事实上,这种功能并不新鲜,大多数安卓手机早期的无障碍功能就已经可以读屏并控制应用了——一种最初设计给视障用户的系统权限。区别在于豆包手机助手本质是把AI大模型做成系统级的手机助手,预装在手机里,以最高权限直接插进系统,让操作不再只是机械执行,而是可以根据上下文和任务目标自主判断和规划,从而完成更复杂、跨应用的自动化任务。 这种产品模式看起来确实性感,如果是过去的手机是“你点”,语音助手是“你说,我帮你打开”;那现在就是“你说,我整个事情全部做好”。 说到底,这从用户体验上是质变,但从技术底座上,只是量变的叠加,并没有颠覆性的底层技术突破。 那问题来了:这套能力为什么现在才出现? 一方面,大模型的多模态理解能力在这两年提升明显,另一方面,推理成本下降,让模型常驻后台变得现实,不再像过去那样昂贵、卡顿甚至不稳定。 这个节点落在2024年底,模型能力、算力成本与用户需求共同逼近阈值,用户场景开始成为AI大模型们的共同目标。豆包踩中了这样一个窗口,它与其他AI产品的关键区别并不在算力水平,而在于其把锚点瞄准更与用户息息相关的移动终端——手机。 豆包手机助手的出现,显然不是为了证明技术实力,而是为了占据这个潜在的超级入口。在应用增长见顶、内容平台竞争白热化的当下,“入口”比“功能”重要得多。一旦模型能稳当地承担跨应用执行任务,它就拥有了重新分配移动生态流量的可能性。 同时随着App越做越复杂、生态越来越臃肿,用户被挤压的耐心反而催生了对“简单直接快速”的渴望,整个手机行业给AI让出了一个可被替换的链路。 这也解释了为什么豆包手机助手在短时间内激起如此多讨论:它触碰的不只是产品,而是互联网大厂们多年构建起的底层生态。而下一步能否走下去,要看它如何穿越更复杂的生态摩擦。 02 核心应用们的集体围剿 舆论的导火索始于微信对豆包手机助手的突然“隔离”。 仅正式发布一天,就陆续有用户发现,在使用这台搭载了豆包手机助手的手机操作微信时,直接触发了微信“登录环境异常”提示,导致微信被强制下线且无法正常登录。 紧接着阿里系也紧跟其后,有用户反馈在登录淘宝、闲鱼、大麦等App时,也遭到了强弹窗提醒,被强制推出并显示登陆环境异常,要求更换设备重新登陆。与此同时,该手机上的农业银行、建设银行等App也被直接拒绝登陆。 这些核心应用的罢工,让这台在二手市场溢价已经高达近4倍的努比亚工程机,短短几天内直接变成一块“砖头”。 虽然对此微信方的公开回复是,“没有什么特别的动作,可能是触发了本来就有的安全风控措施”,但如果把视角拉回到豆包手机助手本身,它所依赖的系统级权限正是这些风控敏感的关键所在。 要实现“像人一样操作其他应用”,AI助手必须获得较高权限或厂商级接入,尤其是连续跨应用调用会触及大量第三方数据,包括聊天记录、联系人、支付信息等等,这些个人信息都需要非常明确的用户授权、最小权限原则、以及本地化数据保护。 而AI Agent在真实环境中面对App版本迭代、网络波动等复杂情况,一旦出现执行失败或误操作,尤其涉及支付等重要设置时,用户容错成本极高。 这不仅关乎用户数据安全,也关系到产品的稳定性和风控体系完整性。对微信而言,每一次消息发送、每一个操作流程,都嵌入了复杂的反作弊、反滥用和数据监控逻辑,一旦被外部工具绕开,就可能打乱系统设计,增加异常事件和责任归属风险。 值得注意的是,今年4月,微信刚发布公告提醒用户切勿使用第三方工具管理微信聊天记录。此后,包括Siri、小爱同学、华为小艺等手机语音助手均无法再通过语音直接调用微信功能。 图/微信安全中心官微 这也能解释为何此次微信动作跟进得如此迅速的原因,这个窗口一旦打开,便意味着潜在的滥用可能。对于微信等核心应用,它们必须重新评估每一个外部调用行为的安全性与可信度,这也是为何会选择直接阻断的原因。 这种担心并非微信独有。对整个App生态而言,当外部助手掌握了系统级操作能力,就意味着任何应用的控制权都有可能被分流或代替。 这也是豆包手机助手面临的行业级矛盾:入口之争必然带来动作边界之争。 用户想象中的“便利”,对应用开发者而言可能是潜在的安全漏洞或者运营风险。无论是社交、支付还是电商应用,每一次操作都可能牵扯到账户安全、交易完整性、用户体验等多重考量。 从市场角度看,这类限制也揭示了决策权的归属——无论系统权限多么高,最终能否执行任务,取决于App是否允许。 即使系统层的AI助手具备多高的系统权限,最终能否真正执行任务,仍要看各个App是否在业务链路、相应接口与风控体系上给予“可被自动化”的空间。如果没有应用方的配合,AI助手的“全局执行”就会遇到天花板。 更广义地说,这种冲突反映了整个行业在系统级AI入口上的博弈。大厂都希望保留对用户操作链路的掌控权,因为这是流量、数据、风控与用户体验的根基。 一个简单的例子,如果豆包这类系统层智能体能够“代替用户”在多个应用之间直接执行操作,意味着用户不再需要进入各个平台完成这些动作。原本打开ABC平台→搜索关键词→浏览、比价商品→完成下单的传统路径,变成只需要说一句“帮我买一包50元以内、销量高、明天能送达的猫粮”,AI助手就会自动去各电商平台比价、选品并完成下单。 用户不再进入平台首页,平台就会失去搜索入口的流量;AI抽取内容后,平台本身的“推荐流”不再是用户入口,内容价值链被上游截断;而用户浏览时间下降,广告曝光就会减少;平台的“货架逻辑”和推荐流量分发也会失效。 当AI助手尝试跨越应用边界,它实际上挑战的是现有App生态的权力分布。豆包手机助手的尝试虽然显示了技术可行性,但真正能否长期运行,取决于能否在在系统权限与App生态之间找到商业操作上的平衡点。 03 软硬一体才是真正入口 AI发展了近3年,从算力到多模态能力,再到AI硬件落地,产业格局逐渐回到可持续性商业模式的考量上。 正如豆包明知跨应用自动执行存在隐私合规与平台关系的多重风险,却仍要执意往前推进,原因非常直接:跑马圈地之后,入口之争进入了新的阶段,AI 厂商和手机厂商都意识到,未来真正能沉淀商业价值的,不是一个个独立的 AI 服务,而是真正与用户场景相关的超级入口。 AI Agent的发展初期,豆包、元宝、Kimi、通义千问等产品都曾试图通过嵌入应用内功能占据用户场景。 豆包初期曾嵌入到抖音、今日头条等应用内,提供智能推荐、内容生成等功能;今年初腾讯甚至在微信里几乎能放广告的所有地方,都给元宝上了广告位…… 而AI搜索软件和手机厂商上一次深度合作还是Deepseek爆火后,华为、荣耀、小米等主流国产手机厂商都先后宣布在其原有的语音助手中接入DeepSeek。 事实上,系统级AI也并非豆包“首发”。 早在今年6月华为开发者大会上,鸿蒙系统6展示的AI智能体验,就已出现系统级AI的雏形,但当时华为强调的仍是调度多个智能体协同完成任务。 苹果方面,Siri正在向系统层执行能力升级,未来的Apple Intelligence同样瞄准跨App协作和操作路径重构。小米、华为、OPPO等厂商也在持续改进语音助手的全局操作能力,逐步向中心化、一体化方向靠拢。 硬件端同样在布局未来入口,从早前的网红AI穿戴设备Humane的AI Pin,到阿里在11月最新发布的夸克AI眼镜,都曾被视作可能的替代入口。但至少目前尚未获得用户心智占领,手机仍是最稳定、使用频次最高的终端。因此,大部分厂商仍将手机作为核心入口下注。 这也是为什么各大厂在AI生态布局中,软硬件同步推进:软件确保系统级操作能力落地,硬件探索未来交互形态,二者结合才可能形成对用户行为路径的长期控制。 AI的洪流滚滚向前,当技术变得愈加通用,企业要么上车,要么被抛弃。 头图/豆包AI生成
谁在赢得最后的红利
“今年双11,核心目标就一个:续命。” 一位国产美妆品牌的电商负责人半开玩笑地说。这句话,道出了2025年中国企业普遍的焦虑底色。 刚刚落幕的双11,表面依旧喧嚣:促销周期拉长至38天,创下历史之最;平台补贴总额突破千亿元;数万个品牌轮番降价,试图用“最低价”撬动最后一点消费意愿。 但热闹之下,增长引擎已然失速。 据国家邮政局与星图数据联合测算,2025年双11全网GMV同比增长仅14.2%,远低于2024年的26.6%;快递包裹量增速更是从20%以上骤降至6.2%,创近十年新低。 更令人不安的是消费者的“冷漠”。 北京白领王岚从去年618盯到今年双11,始终没下单那台心仪笔记本。“价格一天三变,大促也就便宜一两百,不值得折腾。”她坦言。某头部3C品牌电商运营总监则苦笑:“从年初到现在,我和平台小二‘两天一小吵,三天一大吵’,全在争定价权。” 降价,曾是万能解药。如今却像饮鸩止渴——利润被压薄,用户忠诚度未升反降。 然而,并非所有玩家都在泥潭中挣扎。 一款标价980元的克奥妮斯仙人掌眼膜,双11期间天猫旗舰店GMV同比增长246%;自清洁智能马桶成为“懒人经济”的新宠,销量同比激增46倍。 全民疯抢同一个标品的时代已经终结,市场的机会藏在细分需求的缝隙里。 一个问题随之浮现:当经济转型深入、渠道高度同质,产品的“红利”究竟来自哪里? 中国经济正从高速增长转向高质量发展,这场转型正在重写竞争规则。 十年前,谁能铺满商超货架、掌控工厂产能,谁就掌握话语权。如今,这些“护城河”已沦为行业标配。 直播电商能让一个五人团队一夜触达百万用户;柔性供应链使广东、浙江的代工厂能同时为十几个品牌生产几乎相同的保温杯——“除了Logo,其他零件通用”,一位东莞代工厂主坦言。 结果呢?流量集中反而加剧了同质化。 打开任意直播间,十位主播用相似话术推销功能雷同的筋膜枪、空气炸锅或胶原蛋白饮,唯一变量只剩价格。 正如克里斯坦森在《创新者的窘境》中所揭示的悖论:当所有企业都掌握了同样的技术和渠道,竞争优势便不复存在。 贝恩公司《2025年中国消费者报告》印证了这一点:去年快消品市场销量增长4.4%,但平均售价下降3.4%。在追踪的27个品类中,超过半数的前五大品牌丢失市场份额,品牌竞争进入白热化阶段。 而与供给端趋同形成鲜明对比的,是需求端的“个性化裂变”。 以年轻人最常消费的数码产品为例,尼尔森调研显示,68%的消费者最近一次购买数码产品是出于“好玩”,而非传统的“好用”或“好看”。情绪价值与个性化体验,正成为决策的关键权重。 每一个未被满足的特定需求,都可能孕育一个新品类。 这并非一句空谈——当消费者的潜在诉求逐渐浮出水面,却没有一个品牌能专门承接这份需求、成为品类代名词时,一个全新的赛道就已悄然打开。 简醇0蔗糖酸奶,正是精准踩中这一机遇的典型案例。 在低温酸奶赛道,消费者对“低负担”的需求早已显现,无糖、低糖品类正处于高速增长期。但彼时,消费者心智中仍缺乏一个专注“0蔗糖酸奶”的专家品牌——这一空白,恰好为简醇提供了破局契机。 于是,“0蔗糖酸奶”新品类应运而生。简醇顺势成为该领域的品类开创者,率先占据用户心智中的健康标签。2023年上半年,简醇在低温酸奶领域拿下市场份额第一,打破伊利、蒙牛、光明长期主导的格局。 君乐宝董事长魏立华说:“利用新的科技和新的技术,满足不同人群的消费者的需求,就能把握机会。谁能够抓住机会、谁能发现机会、谁能创新机会,谁就能迅速发展,就有机会战胜以前可能认为很难战胜的对手。” 当渠道和生产不再具备差异化优势,产品竞争力便回归“用户价值”——用户对“获得感”的追求,正是当下产品最核心的红利。 但这种获得感从何而来? 用户的“获得感”,并非源于产品本身,也不是一时的情绪爆发,而来自心智中的认知锚点。 2002年诺贝尔经济学奖得主丹尼尔·卡尼曼,在与里斯战略咨询全球CEO张云的对话中,揭示了这一认知规律的底层逻辑。 里斯是全球最负盛名的战略定位咨询公司之一,其创始人艾·里斯与杰克·特劳特在1972年提出“定位理论”,被美国营销协会评为“有史以来对美国营销影响最大的观念”。如今大家所熟知的“品类创新”概念就是里斯在20年前率先提出了。 卡尼曼认为,人类大脑通过“分类”简化世界——先记住品类,再从中选择品牌。更重要的是,每个品类在心智中仅能容纳少数几个名字,且最先占据位置者具有压倒性优势。 这一洞见,正是战略定位理论的基石。 “传统的创新理念强调创造发明一种新事物,但这种发明往往没能影响消费者的认知。真正创新的目标应该是在心智竞争里率先胜出。”张云解释说。 小鹏汽车的逆袭,是最新例证。 2023年,小鹏交付量仅14万辆,同比下滑50%,股价跌至历史低点。尽管其在智能驾驶领域持续高投入,技术精度已处国内领先,但市场反响却迟迟未起——领先的智驾能力为何未能有效转化为品牌动能? 里斯作为小鹏的战略顾问,调研后发现:普通用户难以感知技术参数的差异。大众对“智能”的理解,更接近于“像人一样思考”的直观体验。 基于此,里斯协助小鹏将“AI智驾”确立为核心品类标签,推动品牌跳出参数竞赛,转向可感知的认知战场。 随后,小鹏果断押注端到端AI大模型技术,并在18万元级的P7+车型上实现全系标配,率先提出“AI汽车”概念,并在巴黎车展高调发布全球首款AI汽车P7+。 外界并不知晓的是,这一决策曾在内部引发激烈争议,也有团队成员担忧技术尚未完全成熟。但CEO何小鹏坚决推动:“我们必须打造真正的差异化,否则只会陷入无止境的价格战消耗。” 转变在市场中迅速得到验证:2024年小鹏交付量回升至19万辆,首次实现全年盈利;2025年前10个月,交付量同比暴涨190%;P7+上市12分钟即收获万台大定,强势重回造车新势力第一梯队。 开创品类,即起步就是第一。这是里斯战略咨询在这十多年中提出的新模式和方法。 当你定义了一个新类别,你就占据了用户心智中那个“第一时间浮现的位置”——这才是真正可持续的“获得感”。 近五年,消费市场彻底进入存量厮杀阶段——企业想再从红海里抠出增长空间,难度越来越大,但里斯的品类创新理念,却持续成了各类企业破局的“增长钥匙”。 就像建材行业,整体行情持续下滑,瓷砖品牌扎堆陷入同质化内耗,大角鹿偏偏跳出内卷,用“超耐磨大理石瓷砖”重新定义产品价值,靠实打实的差异化优势逆势突围。 再看零食赛道,卫龙精准挖掘魔芋爽这一健康趋势下的超级食材,成功重回高速增长快车道,营收和利润双双实现双位数增长。 补钙市场同样深陷同质化泥潭,迪巧直接打破固体药片的传统形态,创新推出小黄条、小粉条单条装液体钙,开创“液体钙条”新品类,用便捷食用体验精准戳中消费者痛点,最终让企业体量直接翻倍。 为何品类创新在承压的大环境下依然有效? 因为中国消费已走过“有没有”的阶段,进入“好不好”“值不值”的深水区。 当产能过剩、渠道平权,企业竞争的焦点必然回归用户价值——而将价值转化为清晰、可感知的品类标签,是赢得心智的最高效方式。而这,就是“获得感”的力量。 当然,品类创新绝非万能灵药。 如果无扎实的产品力、供应链效率与服务体系支撑,再精准的定位也终成空中楼阁。 王老吉守住凉茶领导地位,靠的不仅是“怕上火”定位,更是渠道深度与品质稳定性;老板电器“大吸力”油烟机能连续六年全球销量第一,背后是每年超5%的研发投入。 从食品到汽车,从建材到健康,里斯所服务的中国企业案例揭示了一条共通路径:真正的红利,不在流量池,不在生产线,而在用户心智中那个被你率先点亮的认知坐标。 回到最初的问题:在经济转型、渠道趋同的今天,企业要把握的产品的红利究竟是什么? 答案已经清晰—— 红利不在渠道,不在生产,而在用户心智中的“认知认同”。 当你开创一个新品类,给用户一个明确的“获得感”,你就抓住了这个时代最核心的产品红利。 价格战终将熄火,但定义需求的能力,才是穿越周期的终极护城河。
“AI版剪映”拿下近亿元种子轮融资,600万MAU,已实现盈利
作者|江宇 编辑|漠影 智东西12月8日报道,上周四,AI视频生成平台Pollo AI宣布完成1400万美元(约合人民币9897万元)种子轮融资。本轮融资由高成资本领投,真格基金跟投,这是Pollo AI自2024年9月上线以来的首轮机构融资。 本轮资金将主要用于模型聚合平台建设、产品化升级以及全球市场拓展,以加速一站式创作平台的规模化落地。 目前,Pollo AI已集成Kling AI、Runway、Veo系列、Stable Diffusion等多款主流前沿模型,覆盖文本转视频、图像转视频、视频风格转换、角色一致性、AI 动画生成以及图像生成与转换等能力,同时支持最高 8K 输出及分钟级视频生成,平台正持续完善从内容生成到编辑增强的完整工作流程。 图源Pollo AI官网 在运营数据方面,Pollo AI上线7个月内月活跃用户突破400万。截至2025年12月,平台注册用户已超过2000万,月活跃用户超过600万,年化收入超过2000万美元(约合人民币1.4亿元),并于今年5月实现盈亏平衡。 Pollo AI创始人朱陈彪毕业于中山大学,具备长期的全球化产品增长经验。在万兴科技任职期间积累了海外市场相关经验,并于2018年离开万兴科技开始新的创业尝试。朱陈彪于2021年创办深圳九瓴科技,先后参与打造二十余款出海应用,覆盖工具类、内容类与多媒体服务等多个方向。其中,Pollo AI为目前的主营方向。 朱陈彪称,团队将在三到六个月内完成新一轮产品化重构,并明确Pollo AI在竞争格局中的差异化定位:“我希望Pollo AI 最终能成为AI版的剪映,或者是视频版的Canva。”
这个全网爆款 AI 吊坠突然卖身 Meta,大批网友喊退款
Limitless,一个号称世界上最小的 AI 可穿戴硬件,只用了一年多时间,就走完了 AI 硬件初创公司的标准流程: 发布——全网爆火——被收购 上周,Meta 宣布已经正式收购可穿戴 AI 设备制造商 Limitless。公司 CEO Dan Siroker 在社交媒体上发文称: Meta 最近宣布了一项新的愿景,旨在让每个人都能拥有个人超级智能,而其中的关键部分就是打造强大的 AI 可穿戴设备。我们与 Meta 拥有相同的愿景,并将携手合作,将这一目标变为现实。 在完整声明中,Siroker 解释了做出这一决定的背景: 五年前我们创立 Limitless 时,世界还完全不同。那时,人工智能在很多人眼中只是空想,硬件创业公司往往难以获得资金,而同时做 AI 和硬件的企业,更是被认为不切实际。但如今,时代已经变了。我们不再在探索一条『边缘』的道路,而是在建设一个看似必然到来的未来。 此次收购意味着 Limitless 将停止销售其许多现有产品。其中包括一款能够记录会议和对话内容的爆火可穿戴 AI 设备 Pendant(吊坠)。不过, Limitless 将继续为现有 Pendant 用户提供至少一年的技术支持。 此外,官方还宣布了针对现有用户的一系列调整措施。 现有用户无需再支付订阅费用,并可免费获得 Unlimited(无限服务)计划。与此同时,用户将无法再使用 Limitless Desktop 应用或 Limitless Web 应用录制会议,公司还计划逐步停止 Rewind 应用的服务。 针对数据隐私问题,Limitless 强调,无论用户是否选择继续使用 Pendant,都需要同意更新后的隐私政策和服务条款,用户可以轻松导出所有个人数据。如果用户希望删除所有数据,也可以在应用程序中方便地完成。 在 Siroker 的评论区,虽然有不少祝福的声音,但考虑到 Meta 在隐私方面的「有口皆碑」,不少用户的第一反应则是退款和担忧。 实时打字员,加了 AI 的那种 回顾 Limitless 的诞生,它与猛玛曾推出的 LARK MIX 纽扣麦克风有着相似的外观。LARK MIX 重 9 克,采样率为 48kHz 24Bit,是户外拍摄的优质搭档。 虽然都是围绕「声音」做的产品,但这两个长相和尺寸相似的设备,却代表着不同的领域和时代: 前者在兼顾拾音效果的同时,将 MOMA 传统设备的体积与重量提到了新的高度。后者内置 LLM,能全天候记录机主和他人的对话内容,并具有记忆总结功能。 去年发布后不久,Siroker 就宣布这款 AI 吊坠销量突破 2 万台,其中大部分用户来自中国和美国。 不加掩饰地说,Limitless Pendant 就是一款简易版的 Ai Pin。 它没有 Ai Pin 的激光墨水屏,没有录像拍照的镜头,也没有可更换的电池背夹,唯一剩下的功能就是,录音。 不过和以往传统的录音设备不同,内置了大模型,多了许多功能:你可以通过问询和对话让它访问在线的 App,比如 Mac 和 Windows 上的,相当于把众多应用程序用「无图」的方式整合进了这个可穿戴的小东西里。 在 LimitlessAI 创始人 Dan Siroker 的官宣介绍里可以得知,Limitless 创立的初衷是: 通过人工智能来增强人类智能,而并非取代。 Limitless Pendant 拥有实时记录的功能,因此它可以算得上一个语音备忘录,以此来克服大脑在记忆和注意力方面的局限性。 这里的局限性并不是指人类脑容量的开发已经到达边际,而是通过可穿戴 AI,帮我们把生活中的所见所闻最多一个备份,以防不时之需。 比如你正在开会,但接下来的 4 个工作活动总会让你分神,Pendant 的存在能让你 100% 投入当下的工作,一次专注一件事,接下来那些怕被遗忘的细节、流程,Pendant 都已经做好了准备,可以把它当作你的私人助理。 而且,你此时的讲话,也会被 Pendant 实时记录,并生成摘要。 以上就是 Pendant 的三个核心功能「Transcript」「Notes」「Summary」。 三者分别对应文字的转录直译、重点加粗和要点总结。 Transcript 转写在 AI 大模型爆发的近一年里已经不是什么新鲜话题,甚至已是 AI 设备的「必修课」。 Pendant 在演示中的转写速度与准确度都不差,可以说达到了「AI 人均水平」。 但 Notes 和 Summary 的笔记总结功能,才能真正考验 AI 的功底。 一是总结要点是否准确,二是全文要素是否齐全,三是分点逻辑是否通畅。 Dan Siroker 曾在发布视频的结尾,展示了 Limitless 的总结概括能力,内容就是这段将近十分钟的视频。 Pendant 准确地将视频分为了行动项目、关键更新、优先事项和当前挑战,这些都是线上发布会中的重点内容。 另外,Pendant 也能把一些细节且重点的内容单独列出,比如摘要中明确提到了该产品的设计理念是增强人类智能而不是取代。这样意味着数学课上捡起一支笔的功夫就听不懂课的情况,感觉会越来越少。 「智能极简主义」 除了软件端做到了较高的集成化,Pendant 的硬件形态也是一大亮点:它极其简单。 U 型夹子结构,能让 Pendant 成为挂在脖子上的吊坠,或者直接用磁吸口固定在衣服上。 发布初期,Dan Siroker 称 Limitless Pendant 是世界上最容易穿戴的 AI(硬件)。 首先,它的尺寸只有有 31.9mm 宽,16mm 薄,比 AirPods 第一代(44.3mm x 21.3mm x 53.5mm) 还要小巧。 在这样秀珍的体积里,Pendant 放进了一个续航可达 100h 的电池(电池容量没有提到),续航焦虑因此大大降低。 这一点和 Ai Pin 有着天壤之别,在第一批拿到 Ai Pin 用户的评测反馈中,续航是许多人都提到的一个痛点,即使有能更换的电池组,但总共加起来不到 8 小时的轻度使用续航,还是不能满足多数人的需求。 其次,没有屏幕的 Pendant 其实保留了大部分电子设备零部件,比如它支持 Wi-Fi 和蓝牙连接,即使在没有手机,Limitless 也能单独使用。 另外,Pendant 保留了两个实体按键,一次来开启「对话」和「录音」功能。 录音键位于机身侧面,开启录音功能后,提示灯会亮起,提醒自己和它人「设备正在录音」,和 Ai Pin 上的信任指示灯类似。 对话键和机身正面融为一体,按下后即可开始对 Pendant 的问询。 在机身主体正上方的弧形是一排麦克风拾音口,Dan Siroker 没有在视频中给出任何关于麦克风的参数,只是很场景化地描述了 Pendant 的录音效果: 即使在拥挤的咖啡馆也能确保水晶般清晰的音频质量。 在介绍 Pendant 时,「个性化」是被反复提及的一个词。 一方面,Pendant 在功能上做到了个性化。设备可以根据你即将要做的事情,根据你先前的背景和经历,给出专属于你的行动建议。 Dan Siroker 曾亲自示范了这项功能。 Pendant 根据「录制声明视频」的提示,结合 Dan Siroker 的以往经历和习惯,做出了如下反馈: 和摄像机要有延伸交流 偶尔眨眨眼 语速不要太快 继续保持个人风格,但避免使用不好的双关语和愚蠢的口音 另一方面,Pendant 的产品颜色也充满着个性化: 无需多言,但如此熟悉。 有什么用?是行业需要面对的争议 隐私保护,是 AI 设备走向市场的一大难题。 它们需要更多的数据变聪明,但不加截止和约束的收集,只会让这些新兴事物更难走进我们的生活。 Pendant 为此提供了三重保障。 第一重是上面提过的「凡录音必亮灯」。 第二重是「同意选项」:未经他人允许,就不会以任何形式记录第三方的说话内容。 除非得到「可以录制」等明确的答复,才会以此为起点,多加一个发言人的录制窗口。 第三重是「隐私云」。传统的 App 在隐私和功能的权衡上,往往会走向两个极端。 传统的云服务,例如 Slack、G-Mail,能够为用户提供很多便利云端便利,接收实时建议、无线存储空间和最好的 AI 模型更新,但开放的服务却忽略了用户、软件服务商和公共单位的隐私保障。 Limitless 首发的隐私云,则能做到平衡二者关系,在保证云端服务的前提下,把所有个人资料的查看、揭秘全都留在了本地,只有个人认证后,私人数据才能被浏览。 Dan Siroker 对 Limitless 隐私保障的思路很明确,对其未来规划的发展,也很清晰。 除了这些已经能体验到的功能,Limitless 还将在不久后加入许多重大更新。 和 Ai Pin 相比,Limitless Pendant 的定位非常准确,这也是在而这当中,我更看好后者的原因。它没有什么都想要,而是抓住「声音」一个点,并做深做细。 而且,Pendant 并不排斥手机的存在,甚至在规划中,为 iPhone 和 Android 提供原生应用。 当 AI 小工具开始涌现,在手机依然是人们生活中的绝对主力设备、市场仍在探索除手机外的最佳 AI 终端这样的交汇点,拥抱手机,或者承认自身「附属品」的地位,并不是一件丢人的事情。 反而过于激进的改革和「独立主义」,只会让不成熟的硬件成为笑柄,Ai Pin 就是其中的一员。 甚至在 Dan Siroker 当初公布 Pendant 99 美元(约合人民币 699 元)时,也不忘嘲讽一下 699 美元的 Ai Pin。 这就是 Pendant。一个曾专注声音的 AI 工具。功能不够完整,也不够全面,但从定位和定价来看,它曾是更容易满足用户预期的产品。 但当巨头们纷纷押注 AI 可穿戴设备,小步快跑的创业公司或许能赢得掌声,面对着硬件研发成本高昂、供应链管理复杂、市场教育周期漫长的多重挑战,也很难赢得最终的独立。 是的,Limitless 最终步上了 Ai Pin 的后尘。 Meta 从元宇宙的废墟中找到了新方向,而这些落寞的 AI 硬件创业公司,也再次验证了那个残酷的行业规律:要么成为巨头,要么被巨头吃掉。 没有第三条路。
豆包手机助手让海外炸锅,歪果仁:这是第一款真正意义上的智能手机
没想到在华为 Mate 80 系列、三星首款三折叠接连发布的一周里,最火的会是搭载豆包手机助手技术预览版的中兴 nubia M153。 发售即售罄就不说了,首批工程机在二手平台上普遍加价数百元转卖。相比官方 3499 元的定价,市场需求确实旺盛。 尽管豆包手机助手官方多次强调,目前的技术预览版并不面向普通的消费者。其定位更像是一个技术展示和生态探索的实验田,吸引开发者和技术发烧友参与体验。 但这根本挡不住大众体验的热情。除了点外卖发帖子这些基操,还有网友用它 10 分钟投了 30 份简历。 不过争议也随之而来,微信、淘宝等一众 App,开始通过「环境异常检测」等门槛把豆包手机助手拦在门外。 官方目前也调整部分 AI 操作手机的能力,官方表示希望「推动形成更清晰、可预期的规则」,避免一刀切否定用户合理使用 AI 的权利。 罗永浩则发文力挺,称这是谁都拦不住的技术革命,将来人们会记住这历史性的一天。荣耀表态欢迎,而魅族厂商则表示期待深入合作,打造更繁荣的生态。 而在国内出圈后,豆包手机助手甚至火到了海外,在 X 平台上,一堆老外都在疯狂讨论这事,甚至有人直接给它冠上了「另一个 DeepSeek 时刻」的称号。 海外网友:第一款真正意义上的智能手机 这评价,可不是随便给的。 雪牛资本(Snow Bull Capital)CEO 泰勒·奥根(Taylor Ogan)直接在平台上发了一长串体验报告,兴奋劲儿都快从屏幕里溢出来了。 他的评价很直白:这是全球第一款真正意义上的智能手机。 在豆包手机助手的协助下,AI 能完全控制手机——能「看懂」界面、自己选应用或下载 App、点击按钮、输入文字、拨打电话,甚至还能执行一整串多步骤任务链。 拿到手机后,他整了不少花活儿。比如随手拍张蔚来换电站问「这是啥」,AI 秒答。 拍个酒店门口,豆包不仅能识别出是哪家酒店,还能根据 Ogan 的需求预定房间,并查询宠物政策。 打辆无人驾驶出租车去公园,豆包能够规划好路线,用最近的上车点完成预约。Ogan 全程只需要用语言表达意图,其它都交给豆包。 用它下单两杯饮料后,外卖无人机很快就把订单飞送到附近储物柜。 走在街上, Ogan 拍了家新开的店,问它是不是本地的品牌,豆包也能查询工商和商标信息,然后果断回答:「是的」。 全程 AI 自己干活,人就负责躺平。 一顿丝滑操作下来,海外网友们大为震惊。 随便翻翻评论区,清一色的点赞声。有网友感慨:「此刻,操作系统变成了管家,手机变成了执行者,而不再只是工具。」有网友猝不及防地表白:「我本来就喜欢豆包,现在更爱它了。」 还有网友直接化身「哇塞哥」: 这是下一级别的东西。我在企业级见过类似的东西,Agent 控制你的 PC 并执行任务,但在手机上有这种技术真的很有意思。想象一下,当谷歌开始在 Pixel 设备和几乎所有 Android 手机上这样做时会发生什么…… Pixel 内心 belike,不对劲,怎么感觉有人在点我? 当然,质疑声也有。有人问:「但它真的智能吗?这模型能在设备上本地运行吗?」Taylor Ogan 的回应是:「它太智能了。你可以选择在设备端运行或云端运行。」 在 Reddit 平台上,讨论同样火热。 有网友表示:「只要这些功能是设备本地的(不使用云服务),并且使用是可选的,我就支持这个。」还有网友一针见血地点出了 AI 的真正意义:「这就是 AI 应该做的事情,为个人节省时间,而不是试图消除个人的价值。」 有一说一,在豆包手机助手发布之后,网友分享在 X 平台上的玩法,也是一个比一个「邪修」。有用豆包点咖啡,也有让豆包 AI 操作安卓机,模拟人手滑页面,主打一个全流程自动化。 还有网友用豆包手机助手下单买了个椰子,由于没够起送价,豆包贴心地帮博主选了一个 1.99 元的一包食用盐来凑单。 APPSO 在之前对豆包手机助手的体验提到,我最直观的感受是,手机变「薄」了,它把各个 App 的能力都「拍扁」了,交互更加自然、直观和高效。 问题来了,这是怎么做到的?这和「phone use」智能体又有什么不同? 在用了一周豆包手机助手后,APPSO 也扒出了背后更多的技术细节。 我扒出了豆包手机助手操作手机的秘密 在豆包手机助手发布之前,手机行业其实已经折腾 AI+ 好一阵子了。 手机硬件厂商试图通过系统层级的 AI 能力,打破应用间的壁垒,实现「一句话办事」。比如华为、小米、vivo、荣耀等主流手机厂商的 AI 智能体,都曾在不同场合展示过自动发送消息、执行多步骤任务等功能。 这些演示虽然在具体场景和实现方式上略有不同,但核心逻辑都是一致的:通过 AI 大模型理解用户意图,并结合模拟用户操作,从而实现跨应用的自动化任务执行。 听着挺玄乎,但实际体验嘛……咳咳,还是有不小的提升空间。 而豆包手机助手的下场,进一步掀起了全网的讨论。更重要的是,根据我之前的体验,豆包手机助手的确是真正意义上把 AI 操作手机这件事做到了可用级别,不局限于几个场景,而是能够流畅自然地通过图形界面操作完成长任务、复杂任务。 APPSO 在知名预印本平台 ArXiv 发现了一篇由字节团队发布的技术报告,里面的信息或许能解释其中的关键原理。 附上地址:https://arxiv.org/abs/2509.02544 豆包手机助手的图形界面操作能力,来自字节跳动 Seed 团队开发的 UI-TARS 模型。它把屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,其开源版本是目前最受欢迎的开源多模态智能体模型。 根据 UI-TARS 2.0 技术报告,这个模型的厉害之处在于,它不是简单的模块化拼凑,而是采用了端到端的学习方式,将感知、推理、行动和记忆整合在一起。 数据不会骗人,在 GUI 基准测试中,UI-TARS-2 的成绩相当能打: Online-Mind2Web 得分 88.2, OSWorld 得分 47.5, WindowsAgentArena 得分 50.6, AndroidWorld 得分 73.3 这些成绩不仅明显优于前一代模型,还在多个场景中超越了 Claude 和 OpenAI 等强劲基线模型。其中 AndroidWorld 的 73.3 分更是比 OpenAI CUA-o3 模型高出 20 多分,展现出强大的竞争力。 在游戏环境中,UI-TARS-2 在 15 款游戏组成的测试集中取得了平均标准化得分 59.8,约为人类水平的 60%。相比 OpenAI CUA 和 Claude Computer Use,UI-TARS-2 的表现分别提升了 2.4 倍和 2.8 倍。 这是什么概念?就是 AI 打游戏已经快接近普通人类玩家水平了。 在 LMGame-Bench 中,它依然能与当前最前沿的闭源模型掰手腕,进一步证明其在长时序游戏推理中的稳健性。 更厉害的是,UI-TARS-2 不仅能处理 GUI 任务,还能通过 GUI-SDK 扩展能力,与系统级资源(如终端和外部工具)集成。在信息检索任务(BrowseComp 29.6 分)、软件工程任务(Terminal Bench 45.3 分、SWE-Bench Verified 68.7 分)上都有竞争力。 一个模型走天下,这就是通用性的体现。 值得一提的是,通过接近豆包团队的人士透露,豆包手机助手用的 UI-TARS 是私有模型版本,性能比开源版更强,还针对手机场景做了专门优化。这或许也解释了为啥豆包手机助手实际体验这么丝滑。 豆包手机助手,确实有点技能在身上的。 写在最后:科技产品的「异类」可以多一些 作为一个长期关注科技产品的编辑,今年令我十分感慨,在这个恨不得把「万物皆塞入手机」的行业,却出现两个异类,分别在设计与交互的维度上,走向了极致。 一个是 iPhone Air,当 Pro 系列不可避免地走向堆料的终局,这种对轻薄的偏执,在参数党眼中或许别无他用,甚至让人一时分不清这是倒退还是进化,直到你把它握在手里,原来,轻盈本身就是一种功能。 而豆包手机助手则站到了交互界面的另一个极端,它不要你去找服务,而是让服务来找你。甚至要掀了 GUI (图形用户界面)的桌子,有一天那块屏幕可能都不是必需的。 一个是硬件,一个是软件,但它们殊途同归。iPhone Air 削减了物理上的累赘,豆包手机助手剥离了交互上的繁琐。 你会发现,当 AI 公司参与到硬件的设计中,他们对交互设计的思路都和传统硬件厂商有所不同。 OpenAI 也正在和前苹果传奇设计师 Jony Ive 打造 AI 硬件,Sam Altman 就曾透露这块设备希望重新定义交互:不需要一堆 app,而是 AI 作为主界面与操作层。 当然,历史告诉我们这类新技术落地必然面临阵痛:适配、隐私、生态……还有各方利益的博弈。先进技术和广泛应用的「双向奔赴」尚需时日,但也是大势所趋。 OpenAI 联创 Andrej Karpathy 前段时间也表达了自己对交互未来的预判: 人机深度协作的时代,那些用户界面(UI)极其复杂(有大量滑块、开关、菜单)、不支持脚本、并且建立在不透明的、自定义的二进制格式上的产品,注定是死路一条(ngmi)。 未来,AI 在理解和操作人类图形界面(UI/UX)方面会越来越强(比如像 Operator 这样的前沿项目),但我怀疑,那些只想坐等这一未来实现,而不主动与当前技术发展水平「双向奔赴」、做出改变的产品,它们的下场不会太好。 敢于吃螃蟹这件事本身,就已经算是值得瑞思拜了,我们也希望看到更多「异类」出现在科技行业。
小米智能门锁销量连续5年中国第一!出货量突破800万
【CNMO科技消息】12月8日,小米智能生态官方宣布,小米智能门锁销量连续5年中国第一,出货量突破800万台。 CNMO注意到,根据市场研究机构洛图科技(RUNTO)发布的多份市场报告,2025年上半年,小米在中国智能门锁市场的全渠道出货量位居第一,市场份额超过20%;2025年618大促期间,小米智能门锁位居线上全渠道销量第一;2025年第三季度,小米智能门锁夺得线上全渠道销量榜首,市场份额为18.0%,从全渠道销售情况来看,小米、德施曼、凯迪仕、华为、萤石、海尔六大品牌出货总量接近400万套,合计市场份额超过40%。 据了解,小米智能门锁的持续领先,得益于其覆盖广泛价格区间的产品策略。在500元-999元的核心价位段,E30等型号是重要的销量支柱。同时,小米在高端市场也取得了显著突破:在2500元以上市场,其M30 Pro曾位列销量第一;2025年8月推出的新品智能门锁4 Pro,则成功带动了品牌在2000元-2499元价位段的快速增长,9月该价位段销额同比增幅突破190%。 值得一提的是,小米集团将研发视为立身之本,2024年研发投入超240亿元,并计划未来5年研发投入超2000亿元。在制造端,小米已建成包括智能家电工厂在内的多座智能工厂,并通过自研的“澎湃智能制造平台”赋能超过200家制造企业,提升整个产业链的品控与效率。这种对底层技术和制造能力的深耕,为小米智能门锁等产品的长期竞争力提供了坚实保障。
特斯拉Optimus人形机器人演示时摔倒,手忙脚乱“摘头显”露了馅
IT之家 12 月 8 日消息,上周末,在特斯拉于迈阿密举办的一场演示活动中流出的一段新视频显示,其 Optimus 人形机器人重重摔倒在地。然而,真正引发外界关注的并非摔倒本身,而是机器人在倒下过程中做出的特定手部动作,该动作强烈暗示其正在模仿一名远程操作员在慌乱中摘下 VR 头显的动作。 当前,人形机器人正成为科技界炙手可热的话题。数十亿美元的投资正涌入该领域,而埃隆・马斯克更是宣称,Optimus 将成为特斯拉一项价值万亿美元的产品,足以支撑公司当前极高的估值。 这一愿景的核心在于:随着通用人工智能(AGI)的发展,人形机器人将能够利用新一代 AI 技术,在越来越多的任务中取代人类。 然而,无论是在伦理层面还是技术层面,这项努力仍面临诸多严峻挑战。 从技术角度看,目前大多数人形机器人的演示仍严重依赖人类操作员的远程操控,这暴露出软件与硬件之间仍存在显著差距。早在一年多前,在特斯拉举办的“We, Robot”活动上,其机器人实际上就高度依赖远程操控(teleoperation),尽管特斯拉并未向公众明确披露这一事实。 据IT之家了解,上周末,特斯拉在其迈阿密门店举办了一场名为“Autonomy Visualized”(可视化自主性)的活动,旨在展示其“自动驾驶技术与 Optimus 机器人”。 现场许多特斯拉粉丝拍摄并上传了 Optimus 机器人分发瓶装水、摆姿势合影甚至跳舞的视频。但随后,一段由 Reddit 用户发布的视频揭示了另一幕:视频显示,Optimus 在递水过程中手部动作过快,导致几瓶水掉落在地。随后,机器人失去平衡,开始向后倾倒。 最引人注目的是,在即将倒地前的一瞬间,它的双手迅速抬至“面部”,做出一个清晰的抓握动作,仿佛在从头上摘下某物。然而,该机器人头部并未佩戴任何设备。 对于熟悉 VR 或远程操控系统的人来说,这一动作极为眼熟,几乎可以确定是后台或远程操控员在操控过程中突然摘下 VR 头显所致。而 Optimus 忠实地复现了这一“摘下不存在头显”的动作,并随之摔倒在地。 事实上,特斯拉此前就曾在其实验室中使用 VR 头显训练 Optimus 机器人: 外媒 Electrek 称,这次事件令人尴尬,但原因并非机器人摔倒本身,机器人跌倒本就是研发过程中的常态。真正的问题在于,那个“摘下空气头显”的特定动作,彻底打破了特斯拉精心营造的“自主性”幻觉。 就在不久前,马斯克还曾激烈反驳外界关于 Optimus 演示依赖远程操控的说法。他特别强调,一段 Optimus 表演功夫的最新演示“完全由 AI 驱动,非远程操控”: “Optimus 出现在《创:战纪》(Tron)首映礼上,当着杰瑞德・莱托(Jared Leto)的面公开表演功夫。没人操控它。你可以在网上看到视频。有趣的是,很多人路过时还以为那只是个真人。” 马斯克不断向股东承诺,Optimus 将成为“史上最大规模的产品”,并称“数百万台 Optimus 很快将在工厂中投入使用”。但如果特斯拉至今仍需依靠 1:1 的远程操控来完成分发瓶装水这样简单的任务,那么距离实现真正具备通用能力的 Optimus 机器人,恐怕还有很长的路要走。
谷歌Android系统NFC碰一碰联系人共享功能现身,类似苹果NameDrop
IT之家 12 月 8 日消息,据科技媒体 Android Authority 今天报道,谷歌意图为 Android 系统打造一套类似苹果 NameDrop 的联系人共享功能,只需互相触碰两台手机的 NFC 区域就能分享名片信息。 作为参考,苹果 iOS 系统的 NameDrop 是一种名片交换系统,两台 iPhone 互相靠近顶部就能触发,整个过程完全无感,无需扫描二维码或手动输入配对码,触发后还会出现一段独特的动画提示功能正在运行。 结合IT之家此前援引 Android Authority,这家媒体在上个月拆解了谷歌 Play 服务测试版应用的 APK 文件,显示谷歌正在为 Android 系统开发一项新功能,可让用户通过手势近距离交换联系人信息,包括照片、电话和邮箱,并支持设置为“仅接收”模式。 不过谷歌好像还没有给这项功能一个明确的命名,APK 拆解显示该功能有“Gesture Exchange(手势交换)”和 “Contact Exchange(联系人交换)”两个称号。 在将谷歌 Play 服务更新到最新版本后(v25.49.31 Beta),Android Authority 成功让这项功能在小米 POCO F6 和谷歌 Pixel 9 之间运行,不过目前只能触发动画,真正的名片交换环节并未实现,因此不会弹出任何对话框或进度条。 同时,目前我们只能确认这项功能会用 NFC 检测设备互相靠近,但无法确认这项功能本身使用 NFC 传输名片数据,还是说 NFC 只用于握手环节,然后交由蓝牙 / Wi-Fi Direct 传输。 不过可以确认的是,这项功能的体验可能没法达到苹果的水平,毕竟世界上有成千上万种 Android 设备,每台设备的 NFC 天线位置各不相同,而苹果这边就很简单,所有机型的天线都在机身顶部,所以未来正式推送时,有些用户可能需要摸索位置才能互相交换名片。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。