注册 登录
EN
中文
APP下载
logo
icon
数字孪生
icon
大数据获客
icon
人工智能
分类目录
行业分类:
IT/通信
金融财经
市场/营销
交通/物流
节能环保
休闲旅游
农林渔牧
日化用品
数码家电
房产/建材
企业/管理
家具/家居
医疗/保健
新零售
机械/工业
餐饮/食品
其它行业
头条分类:
行业前景
行业动态
行业资讯
行业活动
小米龙虾AI一发布就杀疯了:不用动手 手机自己搞定所有事
小米又搞大动作!国内首个手机端类OpenClaw(昵称“龙虾”)Agent应用——Xiaomi miclaw正式发布,直接打破手机AI“只会聊天不会干活”的魔咒。 先说说它的颠覆性有多离谱!和普通AI助手不同,Xiaomi miclaw是基于小米MiMo大模型打造的系统级智能体,不是简单陪聊,而是能真正“替你干活”。它能调用小米全生态设备和系统应用,封装了50+系统能力,连续执行20步复杂操作都不脱节,还能记住你的使用习惯,越用越懂你。比如自动读取短信、识别重复扣费的视频会员,年底给你推退订建议,每年能省近400元,联动米家设备更是不在话下。 最受关注的就是它和OpenClaw的关系,小米直言理念同源,但比后者更接地气——不用复杂操作,普通用户也能快速上手,还不会用模拟点击,被判定为“外挂”的概率几乎为零。安全方面小米也反复强调,核心隐私本地存储,高敏操作每次都要确认,没有用户授权绝不能付款、发敏感消息,甚至雷军都亲自表态,全程守住隐私底线。 但争议也随之而来!首先是小范围邀请制封测,仅支持小米17系列5款机型。其次,小米也坦诚,这款产品还在优化,稳定性不足、复杂任务可能失败,高强度使用会耗电发热,甚至不推荐普通用户在主力机上安装,让不少人吐槽“半成品就敢拿出来测”。更有人质疑,断网就用不了,端侧能力不足,根本配不上“颠覆性AI”的噱头。 不过客观来说,Xiaomi miclaw确实迈出了关键一步,把AI从“摆设”变成了真正的助手,尤其是联动小米人车家全生态的能力,放眼国内手机圈确实独一份。目前首月使用免费,后续优化后能否开放公测、解决现有槽点,才是关键。
林俊旸离职风波始末:AI技术负责人与大公司的成长与分歧
既要、又要、还要的 AI 管理难题。 文丨 陈佳惠 管艺雯 贺乾明 程曼祺 编辑丨程曼祺 林俊旸提交离职引发一系列后续:阿里数名管理层连夜紧急讨论;第二天(3 月 4 日) Qwen 召开全员会;昨天(3 月 5 日)上午,吴泳铭给 Qwen 全员发邮件,称已批准林俊旸辞职;昨天下午,林俊旸回到阿里北京办公区,给部分团队成员做 1on1。 《晚点 LatePost》独家了解到,3 月 4 日凌晨,阿里管理层主要讨论了两个内容:怎么解决问题?林俊旸的离开会给公司带来哪些影响? 他们达成了共识:这样的行为不可接受,公司组织制度必须得到维护。 据我们了解,林俊旸发出离职状态时,阿里并未回应他的离职请求。 一位阿里人士称,“制度是不能碰的,而他在挑战公司制度。” 这里的 “制度” 指 —— 在阿里,所有人都是公司员工,升和降都由公司决定,如果不满可以正常沟通,但不能没沟通就到社交媒体公开发声,不能开这样的先例。 林俊旸在阿里工作了 7 年,这是他的第一份工作。林俊旸意料之外的骤然离职,背后是每一个深度参与 AI 竞争的大公司都会面临的管理难题。 一边是推动 AI 发展的开拓精神、超级个体和极致效率,一边是大公司的整体目标和对业务协同的强调,二者之间的张力在此时的阿里集中爆发。 林俊旸提交离职的 48 小时,对阿里、对他本人都是一个意外 “无颜再带领大家。” 林俊旸 3 月 3 日下午在有 100 多名 Qwen 成员的钉钉群中发出消息。 这之前不到 24 小时,林俊旸还在继续他作为 Qwen 负责人和 “最强开源布道师” 的日常活动:加班加点发布 Qwen 的新模型和技术报告,凌晨在社交媒体上推广刚上线的 Qwen 3.5 小模型系列,转发马斯克的相关评论。 而 3 月 3 日下午的一场沟通改变了林俊旸的轨迹。突如其来的强烈离职意愿,可能对他本人来说都是一个意外。 据了解,当天下午,阿里云 CTO 周靖人和林俊旸连线开会,向他传达了可能发生的 Qwen 的调整。每年 3 月底,阿里传统上会做绩效年度考核和架构调整,这场沟通很可能是为 1 个月后的变化做铺垫。 当时提到的调整方向是将 Qwen 团队重组,从涵盖不同训练流程和模态的垂直整合体系,变成预训练、后训练、文本、图像、语音等一个个分开的水平团队。 “下午开会的时候,林俊旸的情绪已经很激烈。” 接近此事的人士称。 当天下午,还发生了另一件事。3 月 3 日刚好是 Qwen 原后训练负责人郁博文的最后一个工作日,在 HR 召集的后训练团队 “欢送会” 上,该团队第一次得知,2026 年 1 月新加入阿里的周浩将参与管理 Qwen 的后训练成员。周浩此前是 DeepMind 高级资深研究员,曾领导针对 Gemini 3.0 的多步骤强化学习。 据我们了解,林俊旸在本周之前并不知晓周浩已入职,周浩汇报给阿里云 CTO 和通义实验室负责人周靖人。 阿里相关人士称,之所以周浩入职一事之前没有同步 Qwen 团队,是因为引入海外人才有一定敏感性,保密等级较高。 当天下午稍晚,在周靖人和林俊旸的沟通后不久,林俊旸在 Qwen 钉钉群里发出了 “无颜再带领大家” 的信息,表示自己只能离开了。 到这一步,整个事件还在阿里公司内部。而 3 月 4 日凌晨林俊旸的那条社交媒体动态则直接向外界宣告了他的离职意向。 13 小时后,3 月 4 日下午 1 点。阿里召开 Qwen 团队的全员会,阿里 CEO 吴泳铭、CPO 蒋芳、阿里云 CTO 周靖人出席。在杭州的团队集中在线下参会,北京和上海团队接入视频会议参会。 “这个会本来也是要和大家开的,只不过现在稍提前了一些。” 阿里 CEO 吴泳铭说。全员会持续约 1 个半小时,吴泳铭在会议开头重申了在集团战略上会全力支持 AI,此后大部分时间留给团队提问、答疑。 Qwen 团队成员关心的核心问题有: - 林俊旸的离开是否有转圜余地? 蒋芳说:集团会挽留林俊旸。在数个 Qwen 成员表达了林俊旸的重要性后,蒋芳又回应,不能神化个人,不能不计代价和不理性地挽留。她随后问团队:那么大家期待以什么代价来挽留俊旸呢?没有人回答这个问题。 - 团队是否会调整?周浩加入为什么没有提前告诉大家? 周靖人回应,周浩加入并不是要替代谁。周浩加入这件事没有提前告诉大家,是因为当时团队在忙着训练 Qwen 3.5,所以暂时没沟通。 - 关于 Qwen 团队缺少资源 吴泳铭说,他是中国最激进寻找算力的 CEO,可能一些问题没有及时反馈到他这里。 团队也反映,Qwen 3 的 Coding 能力欠佳,与没有得到足够的训练环境等资源有关,这需要 CPU 资源和 Infra 人才支持。周靖人回应,资源问题和 Infra 支持不到位有 “历史原因”。 全员会上,吴泳铭还承诺,之后每半个月到 1 个月,他会和 Qwen 团队或 Qwen 核心人员开会,及时了解需求或问题。蒋芳说大家可以直接在钉钉上私信吴泳铭、蒋芳、周靖人,反馈问题。 当天下午 2 点,林俊旸发布朋友圈:“qwen 的兄弟们,按照原来安排继续干,没问题的”。 全员会第二天,3 月 5 日上午。吴泳铭给 Qwen 全员发送邮件,称已接受林俊旸离职。邮件还提及,阿里会继续坚持开源模型策略;周靖人会继续带领通义实验室;吴泳铭、周靖人和阿里集团 CTO 吴泽明(范禹)会共同协调集团资源,支持基础模型建设。 林俊旸的离职引起一连串外部反应。Google DeepMind 的开发者体验负责人在社交媒体上邀请 Qwen 成员加入:“如果你想找到构建好模型和贡献开源社区的新家”。 Omar Sanseviero 曾任职于 Hugging Face,现任 Google DeepMind 开发者体验主管。 有其它公司高招人员在林俊旸宣布离职的那晚整夜没睡,挨个给认识的 Qwen 团队成员发工作邀请;有猎头想联系林俊旸,列出了具体哪些公司有岗位找他。 不少投资人在寻求 Qwen 核心人员的联系方式,他们认为可能有更多离职发生,可能有人会创业。 当小团队开始承担更大的组织目标 2023 年以来,AI 成为阿里的战略重点。新上任的掌舵者吴泳铭当年 11 月第一次作为 CEO 参加财报会,提了 40 次 AI。阿里集团内一度有多个团队尝试 AI,如淘天就曾有 20 个 AI 团队。2022 年底到 2023 年初,达摩院多数团队重组为通义实验室,也是要整合各种力量来做 AI。 在这个大环境下,Qwen 是一个相对独立的小团队,它脱胎于这轮 AI 热潮之前的达摩院智能计算实验室的 M6 项目。当时周靖人是智能计算实验室负责人,而 2019 年入职阿里的林俊旸是 21 年 3 月发布的大模型 M6 的一作。 到 2023 年初,同在通义实验室的 M6 团队和 NLP 团队一度在赛马做大模型,起步时都有约 500~1000 张 GPU 算力资源。同年年中,通义实验室以 M6 团队为主聚集了人员和算力资源,Qwen 在此次变动前的核心成员——林俊旸、刘大一恒、郁博文、惠彬原等人在此时组队,其中刘大一恒、郁博文、惠彬原原本在 NLP 团队。 周靖人作为通义实验室整体负责人,给了 Qwen 团队相对独立的空间。多位曾在 Qwen 工作的人士告诉我们,“感谢靖人给我们充分发挥的空间”。 同时,吴泳铭和周靖人都支持 Qwen 团队的开源想法。这是一个重大的战略决策,必须得到自上而下的认可。 Qwen 目前有 100 多名成员,整个通义实验室有 600 多人。字节模型研发团队 Seed 目前则有超过 1500 人。 相对独立的另一面是,整个阿里云和阿里集团的 AI 布局并没有完全押在自研基础模型上。阿里当时的思路是做 AI 基础设施:提供 AI 云、MaaS(Model as a Service)服务,建设魔搭模型社区等生态。 阿里投资了中国多家大模型公司,为它们提供算力。这一定程度引发了内部团队的不满:算力如此珍贵,为什么还要大量供应给外部? 字节跳动则在 2024 年年中明确决定,不对外投资任何大模型创业公司,集中资源到 Seed 团队,自研大模型豆包,并支持字节自己的豆包等 AI 产品。 资源相对有限,但空间足够时,团队能力和闯劲成为关键变量。Qwen 的两任负责人周畅、林俊旸都有 “自驱的高强度工作状态”。 2024 年以来,阿里开源的 Qwen 系列大模型在全球的影响力持续提升。当年 10 月,其衍生模型数量达到 8 万多个,超过更早开源的 Meta Llama 系列。 Qwen 以丰富的尺寸受到中小创业公司和研究机构的喜爱,不少知名公司,如 Cursor 等都会基于 Qwen 系列模型做微调和后训练;Qwen 的多模态开源系列也是一众中国具身智能公司选择的基模。DeepSeek、字节跳动也会在部分研究项目中使用 Qwen 的小尺寸模型。 周靖人在 2025 年成为阿里合伙人,进入阿里最高集体决策机构;林俊旸在 25 年成为阿里最年轻的 P10 级高管。阿里管理层认为,通义实验室努力保证了 Qwen 模型的领先地位,“这非常不容易”。 但也是 2025 年,有了更大影响力的 Qwen 开始承载更多期待,小团队原本的目标和整个阿里集团的 AI 战略开始分叉。 阿里集团看中 AI 云的商业化增长和 25 年下半年逐渐白热化的 AI 超级 App 卡位战。 2024 到 2025 年,阿里云的收入增速不断提升,但和基模的协同并不直接:增长主要来自阿里投资的多家大模型公司的算力采购,和更多行业 AI 应用带动的云服务消耗。 2025 年 9 月,阿里集团决定重点推进千问 App,这需要基础模型团队与应用团队更紧密地协作。我们了解到,Qwen 团队并没有把支持千问 App 放在高优先级。而负责千问 App 的智能信息事业群也有自己的模型研究团队。有阿里人士认为,Qwen 团队对云的其它业务、对千问 App 的支持不够。 Qwen 则希望持续训练出更强、更高效的模型。 Qwen 扩展了语言之外的更多模态,以顺应原生混合多模态的技术趋势,陆续发布 Qwen-image、Qwen-audio。这与同属通义实验室的通义万相(主要做多模态生成)和百聆(主要做语音模型)有重合。 从 25 年年中起,Qwen 也开始招聘一些 Infra 人才。有 Qwen 团队成员称,当时 Qwen 在训练新一代核心模型的大尺寸版本时发现,阿里云 PAI 团队已很难提供足够的 Infra 支持。这让为阿里云带来收入的 PAI 团队处境尴尬,如果内部业务都不用他们,在竞争激烈的市场中会更难自证实力。 同期,2025 年至今发布的 Qwen 3 系列和 Qwen 3.5 系列的训练过程都遇到波折,部分核心能力指标不突出。 原本计划在节前发布的 Qwen 3.5 Max(每一代 Qwen 中尺寸最大的旗舰版)没能准备就绪。Qwen 在除夕当天开源的 Qwen 3.5 Plus 模型,也被一位阿里高层视作 “半成品”。 小团队的特立独行和对技术领先的追求,集团期待更多战略成果,竞争升级的外部环境,叠加模型训练眼下的波折,出乎意料的人事震荡在此刻掀起风暴。 林俊旸其人:一个 “非典型” 大模型团队负责人 在中国几家大公司基础模型团队的负责人里,林俊旸是特别的存在。他并非典型意义上的 “科班” 出身:本科是文科,硕士转入更偏技术的交叉学科方向。 林俊旸的硕士导师、北京大学外国语学院副教授苏祺曾评价他:“人文社科的学生也能从事,而且很好地从事跨学科研究工作。” 林俊旸生于 1993 年,本科就读于国际关系学院英语文学专业,并同时学习日语、俄语、德语和法语,被同学称为 “多语言学霸”。 本科期间,他担任国关的模拟联合国大会负责人。在当年的校园媒体访谈中,他说自己带社团的核心是,不论社员负责什么工作,“idea 才最重要”。他还把紧凑的活动场地设计视为特色,认为这有利于模联各团队的沟通,既能提高协作效率,也能减少不必要的劳力。 本科毕业后,林俊旸考入北京大学外国语学院,师从苏祺和北京大学计算语言学研究所副教授孙栩,攻读计算语言学硕士。读研期间,他总共发表了 11 篇第一作者或共同一作论文,还担任一个研究项目的负责人。 计算语言学是用可计算的方法,建模语言结构和语言使用方式。它要求研究者理解语言本身,又要求他们掌握算法、数据和建模能力。到了大语言模型时代,这个方向成为重要的研究人才来源之一。我们在 2025 年初分析 DeepSeek 数十位研究人员履历时就发现,其中有 8 位出自北大计算语言学研究所。 2019 年硕士毕业后,林俊旸加入成立仅两年的阿里达摩院,担任高级算法工程师,研究自然语言处理。那时大模型技术路线正加速成形:Transformer 架构提出已两年,OpenAI 的 GPT 系列模型开始展现超出预期的能力。 一年后,达摩院内有两个团队开始研究大语言模型。一个是由资深自然语言处理专家黄非负责的 AliceMind 项目;另一个则是由杨红霞、周畅、林俊旸等人参与的 M6 项目,向周靖人汇报。最终,M6 的性能更强,也成为通义实验室 Qwen 系列模型的基础。 杨红霞在 2022 年从阿里达摩院离职。通义实验室成立后,林俊旸负责 Qwen 模型开源工作,向周畅汇报。也正是在这个阶段,他逐渐从一个更偏研究和内部协作的角色,走向更容易被外部看见的位置。他开始频繁活跃在海内外社交媒体,推广 Qwen 系列模型,解释模型更新,回应开发者反馈,推动社区认知。 随着 Qwen 系列模型持续进步、影响力不断扩大,以及周畅离职后他接替更核心的位置,林俊旸逐渐成了 Qwen 在技术社区鲜活和有说服力的推广者。 “他不是那种苦大仇深的负责人。” 一位接近林俊旸的人士说。多位不同公司的大模型研究者,都用这个词向我们形容过自己的部门负责人。 上述人士告诉我们,在条件有限的情况下,林俊旸认为首要任务不是追求完美,而是确保事情能落地,先把结果做出来,再谈优化和迭代。 他并不认为负责人必须精通软件编写的每个细节;在他看来,更重要的是理解底层的 “物理逻辑”——知道事情为什么这样运转,知道如何抓大放小。 正因为如此,林俊旸更倾向于设定明确的 “靶子”,让一个团队尽可能把事情都做了,尽可能减少不确定性,“不能让团队 ‘陷入虚无’。” 既要、又要、还要的 AI 管理难题 公司强调组织、流程、集体目标、指哪儿打哪儿的战略执行力;而 AI 一线研究员是这个时代最聪明、自驱、有创造力和野心的个体。 公司要在多大程度上包容个人意志,AI 研发团队是否要自建全栈闭环,以研发为核心的团队要如何支持扑面而来的商业化阶段和产品竞争,这些难解的题目没有标准答案。 OpenAI 元老杰瑞·特沃雷克(Jerry Tworek)近期离职后说:OpenAI 已没有做高风险研究的空间,“所有主要 AI 公司都面临多重压力,既要驱动用户增长,又要承担昂贵的 GPU 成本,还要拼模型的第一。” 风波之后,有管理层后来在内部提议,公司以后要加强管控高管们的个人社交媒体账号,减少 “造神” 行为。一位接近阿里的人士对我们说,“原来是开放的时代,但管理层发现,真出事了怎么办?” “组织要往前走,事情要发展,不能做调整了么?经历一些调整,就用这种方式,放在任何地方都说不过去吧。” 一位阿里人士称。 极端情况下,阿里亮出了底线:个人意志要服从组织需求。 曾经,林俊旸拥有的是阿里为其主动留出的表达空间,带有 “阿里最年轻 P10” 的标签,他在境内外社交媒体上频频发声,既开拓了 Qwen 基础模型的开源影响力,又能作为已成立 27 年的阿里年轻化的最佳代表。阿里在研发人才心中的印象为之一变。这个组织也为开源精神和技术理想留出了足够的弹性。 而林俊旸从提出离职到在公开社交媒体上发声只有半天,没有给阿里管理层继续沟通和反应的空间。他对 Qwen 要自建闭环的想法,他希望集中有限资源做模型,Qwen 团队暂难支持 AI 产品的事实,也被阿里其它团队认为合作意识不足。 如果没有这份执念和对核心目标的聚焦,可能 Qwen 一开始就难以自证;但当团队更大,阿里集团需要基础模型团队承担更多角色,AI 竞争也进入新阶段后,Qwen 团队不得不重校目标,调整与公司、与其它团队的关系。 这是公司组织和年轻的 AI 技术负责人共同面临的成长课题。 以往,阿里常常处于过于严厉和过于宽松的两端。一位接近阿里技术高层的人士说:“Qwen 不能算阿里的边缘业务,而是早期就得到重点投入,甚至优先级高于部分阿里云业务。后期 Qwen 忽视业务,同时展示出 ‘自建一切’ 的倾向,恰恰是因为早期重点投入带来的特权意识和大厂政治。如果前期就更加平衡纯研究、工程和业务之间的协作,事不至此。” 某种程度上,这几天的剧烈冲突剧目,是阿里自己按下的启动键。一直以来,对一家大公司,可控永远是红线。 题图来源:Severance
a16z最新访谈:说SaaS已死为时尚早,AI会让这类软件更有价值
作者|林易 编辑|重点君 在AI冲击下,SaaS行业正经历一场前所未有的信任危机。过去这段时间,市场中关于SaaS末日的恐慌情绪不断蔓延,许多老牌软件公司的股价遭遇重挫。投资者们集体陷入焦虑:如果AI能够自动完成所有的企业任务,那些以高昂订阅费为生的SaaS公司,是否会彻底走向消亡? 3月6日,知名投资机构a16z与软件公司Atlassian的CEO Mike对此进行了深度探讨。他们核心观点是:如果SaaS企业无法适应新的定价模型和人机交互范式,确实会被淘汰;但那些掌握了企业核心业务逻辑的系统,反而会借助AI构筑起更深的护城河。 我们梳理了这场访谈的重点信息: 1.软件的本质正在发生十年来的最大跃迁:从静态文件柜变成主动执行者 纵观1960年到2022年的软件发展史,从早期的IBM Saber航空预订系统,到后来的CRM和ERP,本质都只是在做一件事:把现实世界中的实体文件柜变成了数字化的数据库。过去的软件是被动的,无论界面多么精美,依然需要人类员工去检索文件、阅读信息并执行操作。 但在AI时代,这些文件柜第一次具备了自主思考和执行任务的能力。未来的软件不再仅仅是记录数据的容器。例如,过去的QuickBooks只是让财务人员从中提取收据来做账,而现在的AI加持下,QuickBooks可以直接自主完成对账和催款任务。从被动存储向主动执行的跨越,是这一轮软件革命的真正核心所在。 2.SaaS行业并没有迎来末日,生存概率取决于定价模式和业务逻辑的深度 市场之所以无差别地抛售SaaS股票,是因为投资者没有看透SaaS公司之间的底层差异。Alex指出,面对AI的冲击,SaaS公司将出现严重的两极分化: 许多SaaS是按账号座席(Seats)收费的,且这些座席直接与工作产出挂钩。例如一旦企业部署了AI客服,大部分终端问题能被直接解决,企业对人工客服账号的需求就会趋近于零。这类SaaS极度危险,如果不改变商业模式,其现有的订阅收入将面临毁灭性打击。 而像Workday等人事财务核心系统的处境就比较安全。它们虽然也按员工人数收费,但并不与具体的工作产出直接挂钩。更重要的是,它们不仅仅是一个数据库,更是企业数十年复杂业务流程、合规要求和隐性规则的集合体。AI不仅无法摧毁它们,反而会让它们更有价值。比如,当企业要在Workday录入一名新员工时,AI可以直接调用Workday里的数据去自动完成背景调查和前雇主电话核实。AI成为了这些核心系统的放大器。 3.Vibe Coding只会是核心系统的补充,绝非替代品 目前行业内有一种声音认为:既然普通人可以通过向AI下达自然语言指令来自己写代码,那企业为什么还要花大价钱买SaaS?大家自己写一个管理系统不就好了吗? Mike认为,这种想法完全脱离了真实的商业环境。真实的商业世界充满了无数极其复杂的边缘场景和特殊法则。例如,你可以轻易用AI写一个员工请假应用,但当你的印第安纳州分公司有员工休产假时,当地特殊的法律法规、税法差异该如何处理?这些隐性知识深深嵌入在大型SaaS的底层代码中,是普通人无法通过几句提示词就能复刻的。 因此,Vibe Coding的真正价值,绝不是去颠覆核心的SaaS软件,而是降低长尾需求的开发门槛。比如,行政人员可以利用Vibe Coding,基于Workday的底层数据和规则,低成本地为自己的小团队开发一个会议室预订小工具。这不但不会取代核心SaaS,反而会使其在企业内部的粘性变得空前强大。 4.当前AI落地的最大瓶颈已经不是模型智商,而是产品设计与人机信任 技术界往往对大模型的参数和跑分极其狂热,但Mike指出:现在AI大模型的能力,已经远远超出了实际被用户利用的价值。 开发者如果只给用户一个无所不能的空白聊天框,只会导致用户陷入选择瘫痪。要让AI真正融入工作流,需要类似于从PC端到移动端那样的革命性UI/UX设计。 而企业级AI落地的最大阻碍是员工的不信任。AI Agent在一秒钟内自动处理了15封邮件和审批,用户的本能反应并不是开心,而是恐慌:“它到底发了什么?有没有出错?”。因此,优秀的AI产品必须设计合理的断点与回路,它需要允许用户在工作流中实时提问“你正在做什么”,并在关键决策前停下来询问人类的意见。只有在不打扰用户的前提下,建立起透明的信任机制,AI才能真正成为生产力工具。 面对这一轮技术更迭,我们无需为SaaS行业的阵痛而过度悲观。AI在商业软件中的终局,不是建立一座全知全能、彻底淘汰人类和现有系统的神殿,而是像基础设施一样,深深融入到现有的工作流与核心业务中。在这场变革中,懂得利用AI重构交互、深挖业务逻辑壁垒的软件公司,将迎来比过去十年更加辉煌的黄金时代。 以下为a16z访谈实录: 1.SaaS风险水平已上升 Alex:从1960年到2022年,软件的全部历史就是把文件柜变成数据库。第一个例子是1960年IBM与美国航空合作开发的SABRE系统。它取代了以前由众多秘书管理、存放在保险柜里的纸质预约系统,将这些数据存入了早期的数据库中。要知道,在那个年代,10MB的硬盘可能要花费数亿美元。电子健康档案的发展也是如此,马萨诸塞州综合医院(Mass General Hospital)开发了最早的系统MUMPS。同样地,Salesforce以及1987年成立的第一家CRM公司也是如此,它们本质上都是把文件柜变成了数据库。 这种做法确实有好处,但并没有让世界变得多高效。以前如果要找Eric的资料,你会让专人去人力资源部的文件柜里调取。现在虽然数据都在Workday里了,但你必须设立首席信息安全官以防系统被黑,还需要IT人员在单点登录系统中为你配置账号(seats)。只有在跨地区协作时效率才有所体现,人们现在可以协同工作,并在数据库上执行复杂的连接查询,这在纸质文档时代要困难得多。但本质上,从1960年到2022年的软件依然只是静态的,因为文件柜本身无法思考。 而如今AI领域正在发生的最酷的事情,就是文件柜可以自己干活了。比如QuickBooks现在实际上可以独立完成某项任务,而不再仅仅依赖人类从系统里检索文件,这就像彻底告别了16世纪老派会计部门去档案柜翻找资料的时代,非常有趣。 Erik:这确实是个很好的切入点。大家现在都在讨论“SaaS末日”甚至“SaaS大灾难”,这显然是指公开市场上正在发生的事情。关于它的重大意义,很多人都有不同的观点。我想听听你们两位是如何解读的?到底发生了什么?更重要的是,我们该如何理解这一切?为什么大家对此感到如此恐惧? Mike:我认为,全世界目前都在试图弄清楚,在这个高度颠覆性的阶段,该如何对软件业务进行评级或估值。每个人对未来会是什么样子都有自己犀利的见解。不同的观点描绘出了两种极端的未来:对整个软件行业、某些特定公司或类别而言,要么极好,要么极坏。毫无疑问,目前的风险水平已经上升了。 从投资者的角度来看,SaaS曾经是一个非常稳定的类别,现在由于风险变高,人们会选择退后一步保持观望。正如我经常说的,投资者并不一定是在试图通过现金流折现模型来计算一家公司历史上所有的利润,他们其实是在揣摩其他投资者会怎么做,或者说,他们押注的是别人眼中的未来走向。 目前的恐慌其实有些脱离现实。大家总是在想:“如果AI在两三年内就能实现某个功能,那意味着什么?”我认为这种担忧源于一种非常静态的思维方式,仿佛人们不会去适应、世界不会改变,就好像只有AI这一项技术在变,而其他所有事情都将保持静止。所以现在的局面很有趣:像我们这样的企业依然表现出色,已经连续三个季度业绩优异。尽管我们不是在这里为整个软件行业辩护,但就我们自己的业务而言,我们对当前的机会感到非常乐观,这也是我们不断展示出的数据和结果所证明的。 当然,这并不意味着我们不需要去适应。我们正在像过去几年一样,彻底、迅速地改变我们的工作方式。许多人误以为我们无法改变或应对,这显然是不对的,虽然前路确实有许多战略上的变数。现实情况是,并非每一家SaaS公司都能在未来十年中繁荣发展。就像从Windows时代跨越到互联网时代,有一大批公司未能成功转型云端一样,不可能100家SaaS公司都能挺过难关并继续壮大。也有人认为软件在某种程度上会消亡,或者最终只沦为一种现金收入流。但我可以代表我们公司发言:这是我们业务中发生过的最好的事情。我们身处一个知识的世界,拥有利用知识进行探索和行动的工具,以此来完成客户雇佣我们去解决的任务。这在逻辑上是非常完美的,但我们必须在转型过程中将其付诸实践向人们证明,毕竟让市场保持耐心是很困难的。 2.三类SaaS公司 Erik:Alex,你呢?你对最近发生的事情有什么反应,或者你如何理解正在发生的事情? Alex:我希望从长远来看我的判断是正确的,因为现在发生的一切实在太疯狂了。几周前我就此发过一条推文,我初步观察发现,目前市面上大概有三种不同类型的SaaS公司,但公开市场无法区分它们。其中一种公司的账号(seats)权限是与产出挂钩的,账号(seats)由真正使用系统的人占据,这就好比又回到了刚才那个文件柜的比喻。 在深入探讨之前,我想先退一步回答你的问题。丹·艾瑞里(Dan Ariely)写过一本非常棒的书叫《怪诞行为学》。我以前常把这本书发给公司的所有产品经理,让他们通过学习这本书来搞清楚我们该如何向用户收费。书中有一个很经典的例子:想象一下,半夜12点你被锁在公寓外面,你叫了一名锁匠。他1分钟就赶到了,花了30秒帮你开了门,然后向你收费500美元。你心里肯定会想:“就干了90秒的活,居然收我500美元?搞什么鬼!”于是你会在Yelp上给他留个一星差评,不给小费,甚至可能向信用卡公司申请撤销这笔扣款。 现在想象一下另一个平行时空:锁匠来了,花了9个小时尝试帮你开门。他中途回办公室拿了更多工具,折腾到早上9点半,终于让你进了家门。此时你会对他花了九个半小时帮你开门感激涕零,不仅给了他200美元的小费,还在Yelp上留了五星好评。 这个例子基本上说明了,人类在某种程度上能够并且愿意为“无能”买单。很多定价策略其实关乎心理上的公平性。我们觉得给那个折腾了一晚上的人多付钱是公平的,哪怕他完全不称职;而面对那个能力极强的同行,我们却因为觉得他收费过高而感到极其愤怒。这在逻辑上毫无道理,但在情感上却让人感觉很公平。 如果你回想一下我们是如何演变成SaaS模式的,比如按人头每月计费这种。当你免费提供时,很多情况下的数字化配置成本几乎趋近于零。这并非针对所有事物,大家只是觉得这样才公平。比如你有500个账号(seats),你支付的费用自然比只有一个账号(seats)时更多,尽管后台运行的机制其实大同小异。 所以我认为SaaS公司可以大致分为三类。第一类是你原本需要账号(seats)来产出某些工作要素,但现在不再需要了。Zendesk就是这里的“一号病人”。如果Zendesk客户现在使用Sierra、Decagon或者选择自研方案,他们需要的账号(seats)可能就是零。因此对于Zendesk来说,我们谈论的是未来现金流的现值。他们正处于危险之中,因为如果只针对现有产品按每月每账号(seats)收费,永远不对代码或定价做出任何改变,那项收入流百分之百会归零。但另一方面,如果他们转向基于结果的定价并放弃原有模式,收入也可能会翻三倍或四倍。这仍然受制于公平法则和可预测的非理性。像Zendesk这样的产品可能上涨也可能下跌,但除非发生改变,否则默认路径就是走向归零。 第二类是按账号(seats)付费的定价,这感觉很公平,但账号(seats)并没有绑定到某个结果上。比如Workday有这样一个很棒的定价模型,由于你有34万名员工,我就按每人每月向你收费。为什么收费?我不知道,只是觉得这样公平。但是GE的那些员工并不是在使用Workday来产出成果。我觉得Workday挺好的,这其实涉及到你可以用AI工具做什么。比如在GE招聘员工时,HR必须去查看Workday中的文件并致电那三家前司来进行背景调查,确保候选人的履历真实。但AI工具完全可以做到致电公司这一点,前提是你必须是核心业务系统。目前IT领域下跌了45%,但没有人会弃用QuickBooks。这两个支柱就是按账号(seats)计费且与某种工作量挂钩,账号(seats)只是一种聪明的定价策略。 第三类是处于中间状态的产品,比如Adobe。你可能需要更多或更少的账号(seats),但情况既不像Zendesk那样极端,也不像Workday那样脱节。 在这些情况之外还存在一种认为用AI能编写所有代码的潜流,作为一名资深软件开发人员,我认为这简直荒谬。我想引用经济学家大卫·李嘉图在1817年提出的比较优势理论。比如你可以自己种粮食或焊接铝材,但即使是这些简单的例子也不恰当。这就好比在和你一起录制播客这件事上我拥有比较优势,我做这个能赚得更多,即使我可能比水管工更有生产力,我还是应该专心做播客。 更重要的是那些隐藏在底层的边缘情况。理论上我可以通过AI自动编程搞定一些Workday的流程,但如果印第安纳州的那个员工离职了且当时正在休产假呢?除非你亲身遇到过,否则你根本无从知晓这些边缘情况。 许多软件其实是一套经过数十年学习积累而成的确定性规则,这些规则并未公开且内嵌其中,你无法直接复制,需要通过经验来复现。如果这是一个非常简单且没有边缘情况的子任务,AI确实可以胜任。 但我认为真正的核心业务系统、具有粘性、人们所依赖且内置了所有边缘情况的软件将会大有作为。它们将开始增加由AI完成工作的功能,比如询问你是否需要进行背景调查或催收逾期的应收账款。你不需要雇佣人工,雇佣你的软件即可完成这些任务。当这一切真正发生时,未来的现金流将会大幅增长,这令我震惊。 许多公开市场投资者无法区分这些不同的范畴,他们对AI非常兴奋,却不知道必须通过作为核心业务系统的软件来部署AI。我认为现在正是每个人回归商业本质第一性原理的迷人时刻。 Mike:我个人很讨厌“核心业务系统”这个说法,因为它听起来就像是一个静态的数据库,把东西放进去再取出来。这种将业务视为文件柜归档系统的观点,是处于一种非常工业化的时代背景下,与前工业时代的商业模式截然不同。 我明白为什么会有这个术语,但这感觉有点像我们还在用实体软盘图标作为保存按钮。孩子们根本没见过实体软盘,却一直用着这个图标。我质疑这一点是因为对我来说,业务是一套基于流程的系统,而不是记录系统。 Alex刚才所说的一切完全正确,企业中存在诸如背景调查或其他类似流程。你能以尽可能低廉、高效且快速的方式协调一系列流程发生,这实际上是知识型业务的核心。在知识时代的业务中,我有上万名每天走进大楼带着大脑工作的员工,下班离开时又带走大脑。我没有任何原子资产、钻头或钢材,甚至连文件柜都没有。我所做的一切都是关于协调那一套套的流程,我认为大多数现代企业可能都是如此。 谈到这一点与Alex的评论有什么关系?我认为这完全正确。我们在业务中有不同类型的流程,我喜欢将其称为输入受限型和输出受限型流程。以Zendesk的客户服务为例,那就是输入受限。你的客户会提出一定数量的问题,你处理这些问题的速度关系到运行该队列的效率、成本、速度和质量。如果你处理的速度快了10倍,你并不会因此得到10倍数量的问题,因为客户数量是固定的。你面临的问题是该如何让他们减少提问,或者更快地处理问题。实际上,企业中有很多流程都属于输入受限型。 我总是拿我们的法务团队举例,他们的工作不是去主动创造法务工作,而是去响应和处理这些工作。比如我们有多少份租赁合同?有多少份NDA保密协议?有多少份常规合同?这就像是一个固定的总量。为了完成那项工作,我正试着尽可能高效地进行,这部分属于有着完整执行进程的输入受限工作。但随后我也会面临某种输出受限的工作,比如创意、营销甚至是软件开发和技术领域,在这些领域理论上我可以完成无限的任务。 我的瓶颈在于我的创造力,或者说取决于我能想到多少可以做的事情,以及我能为客户交付多少价值。这些才是我获取效率提升并且产出更多内容的地方,而不是仅仅在范围内限制输入来让公司盈利。 关于印第安纳州的说法完全正确,因为有些流程必然受到外部规则的约束,比如法律、治理和合规性要求。在印第安纳州我必须为员工履行某些特定程序,这些流程既是我希望业务运行的方式,也是它必须运行的方式,企业实际上就是所有这些流程组合在一起的集合。从某种角度来看,我们拥有记录系统和执行系统。我的想法是大多数企业的实际运作方式并非如此,但我们通常是这么理解它的。 Alex:我完全同意,我认为这是一个非常棒的框架。我很喜欢Intuit就像TurboTax那样,既然税法是公开出版的你完全可以去下载所有规则,它具有高度的确定性,你可以让报税和那些乱糟糟的下载文件夹同时处理。在这种情况下一切规则都是透明的,但我认为边缘案例被公开发布出来其实是一种相当罕见的情况。 企业是有价值的,理论上有很多偏向知识经济的企业,他们所有的资产每天晚上都会乘电梯下楼回家,但这些业务确实具有核心价值。比如McKinsey在脱离所有员工之后是否还具有价值?因为那是一家靠知识经济产出成果的业务,它与劳动力深度挂钩而不像实体产品那样。尽管如此,他们可能拥有一本绝密的内部手册,规定了如何运作、如何招聘解雇员工以及如何为客户带来成果。我还没见过这种手册,正因为没见过所以也无法复制,而它可能已经建立并延续了一百多年。 非数字、非软件公司的产品是什么?他们的产品可能就是长达几个世纪或几十年的知识积累。我喜欢去日本,你会看到有些面馆大约从1587年就开了,能传承这么久肯定是有名堂的。这是一种长期积累而成的文化、知识和技能诀窍,当然也会有一份制作面条的食谱清单。做面条可能稍微简单些没有那么多边缘情况,但也可能会遇到极端情况。比如如果面粉用完了你会怎么做?面馆是如何在1623年的大面粉饥荒中幸存下来的?他们必然采取了某些措施,而这些经验就这样积累在那本秘而不宣的诀窍之书中,而不是去复制那些已经向公众公开的东西。 Mike:这就是我认为它如此迷人的地方,它迫使我们重新思考自己的业务。真的是Intuit在为你填写税法吗?还是说Intuit对税法的了解程度已经达到了无人能及的地步?。他们所提供的核心价值是帮助你处理生活数据并梳理你的理解,向你提出正确的问题,从这点来看Intuit现在更像是一家McKinsey。这是他们的特殊能力,即如何向你提出正确的问题来填写税务表格,而不是单纯地去填表。 现在所有企业都不得不重新审视自己,也许我内部有50个流程曾被我认为是独一无二的核心秘诀,但实际上只有20个是真正的核心。我现在必须认真考虑在这些流程中哪些确实是独特的而哪些不是,因为我们以前从未需要以这种方式进行思考。 Alex:我认为这在某种程度上是一个关于如何平衡的问题。关于这是否值得亲力亲为,如果你采用第三方工具,它不是不可触碰的红线而更像是一种独立的变量。我现在应该用Claude Code自己写代码吗?如果某家公司对软件收费过高甚至会导致我的业务失败,且自己开发已经能完成99%的需求并覆盖成本,那么自己写代码就是有意义的。但如果那个软件每年只需一美元那自己开发就没有意义了。 而且并非所有的记录系统价值都是相等的。我倾向于将记录系统看作是某种业务的原子单位。比如日历是时间的记录系统,ERP是库存的记录系统,你拥有所有这些不同维度的记录系统。我给别人举过一个例子,比如我在迈阿密有一个不经常去的办公室,那里有一套像Google Calendar一样的会议室登记系统,我是否愿意花精力去更改那个系统?显然愿意,因为那个办公室一年才去一次谁在乎它稳不稳定呢? 相比之下有些系统可是会直接影响我收入的,而且它们本身并不昂贵。我真的要为了吃饭自己去种粮食吗?采用农业隐喻的话去餐厅吃饭其实要便宜得多。如果我只是想要一个汉堡,肯定没必要自己去买一头牛然后喂养等待,由于比较优势和规模经济的作用在餐厅消费大量的食物实际上成本更低。 所以存在一些记录系统更容易受到影响,仅仅是因为它们的定价过高,或者就其存储和记录的内容而言它们的价值并没有那么高。Carta为很多公司追踪管理股权结构表,你多久查看一次股权结构表?虽然不怎么频繁但它非常重要绝对不能搞砸。所以我很可能愿意继续使用Carta因为他们收费并不高,而且它不是那种日常高频使用的产品,所以它甚至不在被替代的考虑维度上。 3.Vibe Coding替代论难实现 Mike:我觉得vibe coding这件事太迷人了,作为软件圈子里的人,感觉人们以后直接靠氛围写代码vibe code就能把那些传统工具全替换掉。但转念一想如果我靠氛围写代码来搞定一整天的工作然后直接运行它,那简直太可怕了。这背后依然得有一些真正聪明的工程师兜底才行,首先我有其他更重要的事情要让他们去做,其次我觉得彻底依赖这种方式目前对我来说弊大于利。然而这就是所谓的替代论趋势。 不可否认的是,我们看到内部在软件的可扩展性方面通过使用AI coding等方式获得了巨大的提升。大多数此类应用程序都具有高度的可配置性和可定制性,在我们的案例中甚至实现了真正的可扩展性。你可以编写运行在平台之上的、涵盖各种不同领域的软件应用程序片段,许多客户也确实是这么做的,但以前他们需要投入一支庞大的技术团队来完成这项工作。 现在他们利用vibe code的能力,就可以针对特定用例去扩展和高度定制应用程序。比如我想要一个为迈阿密Miami团队开发的会议室预订App,由于迈阿密有一些奇怪的HR政策,所以那个供20人使用的App需要随时查看Workday以及其他各种系统。过去我肯定负担不起让内部团队投入IT资源构建它的成本,因为账单金额会太高,但现在我也许可以轻松构建它。这个App在底层使用了Workday在全球的数据和规则,但它给了我一个非常定制化的interface,去为迈阿密前台完成一些非常针对他们需求的特定工作。这非常强大,但它并不能完全取代人类的工作。 说起来可怜的Workday,我觉得Aneel就像是这些概念性示例中经常被调侃的对象。但这其实真的很强大,它实际上让Workday在企业级市场中更具粘性也更有价值,因为你可以基于它构建所有这些定制应用程序,这就是AI、Vibe Coding和创造力的力量,使底层系统能更贴合我的具体需求。 但我们必须非常谨慎地处理稳定性、规则流程与高度定制化之间的平衡。你甚至可以认为像openclaw之类的例子就是为了给个人量身定制非常私人化的App。构建这些应用的人大多数并不是软件开发人员,他们只是在Gmail之上构建仅供自己使用的App或者其他小工具。但这仍然是将Gmail作为轨道,他们依然需要去Gmail阅读和处理邮件,只不过他们为自己构建了一些特定的东西来解决只有自己才会遇到的问题。其中有几个项目可能会演变成公司,但大多数仅仅是在解决他们自己需要处理的事情,这确实非常强大。 4.定价的公平性 Alex:这就是为什么我对前端与后端不一致带来的定价公平性感到好奇。以Salesforce为例他们是按许可证收费的,我想我们公司大概有600人,可能就买了600个Salesforce许可证。我其实从没登录过Salesforce但我敢打赌公司也为我付了费,然而我有时确实会使用它的输出,因为它实际上是我们的记录系统。不想过度使用这个词但它确实存储了我们所有的业务关系,而我就像是关系型数据库表table里的一部分,比如我是422号userid。 每当我与一家公司对接时就像在另一个数据库中匹配上了,但我们其实只想为一个底层数据库付费。现在就像是在一个前端与后端逐渐分离的世界里,事实就是这样。我觉得Workday想出了一个非常聪明的定价策略,这是一种强大且让人感觉公平的定价范式。你的员工越多付费就越多,为什么那样才公平?因为GE的利润显然比一家10人的公司要多,GE理应为此支付更多的费用,而这笔钱对他们来说仍然只是九牛一毛。它的定价完全处于最理想的黄金区间,我认为没有人会对此产生异议。他们未来将增加大量AI营收,但最重要的是他们的底座定价让人感觉很公平。 然而对于这些前端与后端在某种程度上已经分离的产品,我不知道什么是公平的定价模式,也不确定未来的软件定价会发生什么变化。显而易见如果没有人愿意买账,大家都去编写自己的代码而不再有任何竞争,那么定价逻辑将保持不变,但你可以想象未来人们都在定制化的前端上构建东西然后直接从底层数据库中读取数据。因为所有的记录系统都有一个数据库代表了底层的一切抽象层,那么这些类别中的任何一个是否会面临价格压力? 对我来说如果前端不再等同于后端,它会比紧密交织在一起的情况面临更大的易感性和冲击。比如QuickBooks是由小微企业使用的,他们没有账号(seats)概念,企业主直接登录QuickBooks即可,所以它的前端在某种程度上就是后端。相反就像Salesforce你可以想象虽然没有人会彻底弃用它,但他们可能会大幅减少账号(seats)数量,因为底层的后端依然必不可少但对昂贵前端的需求减少了。他们不会消除或者对后端做任何改动,只会优化前端的成本。 Mike:我一直认为定价的公平性和客户观感非常重要,人们需要理解他们为何付费,并觉得他们所支付的费用在某种程度上与其真实的使用情况相关联。一家拥有1万名员工的公司在购买Workday时很可能要支付两倍以上的费用,外加一些批量折扣,因为他们购买的量更大且业务具有两倍的复杂度,他们自己也认为这很公平。这里看起来合理的原则就是:我愿意按员工人数为我的HR系统付费。 我认为这类事情的核心问题在于它不仅仅是一个数据库,它是一个数据库加上一组复杂的进程,在我成长的那个年代我们管这叫业务逻辑。这些业务逻辑绝非无关紧要,为什么企业会有这些逻辑?因为企业本身就是作为一系列流程的集合来运行的,而且管理者追求标准化以在某种程度上实现流程化。这是为了让不同的团队以同样的方式工作,以便有人可以管理、理解他们并精准追踪输出。 就像如果我拥有一堆汽车工厂,我想要持续跨越它们去追踪进出的汽车总数,业务逻辑被嵌入其中的地方在某种程度上就是护城河和价值所在。就传统方式而言那里的销售额实际上非常巨大,你为销售团队制定的那些流程对你来说极具价值,而且你会认为这是一种公平的付费方式。但问题在于你的销售协作团队即那些协作者而非核心用户,他们究竟有多大程度需要这些流程又在多大程度上不需要? 我假设Salesforce Sales Cloud有一个MCP server,那个MCP server并不直接访问数据库,它主要涉及你的业务流程以及执行过程中的规则。现在的争议点是某些销售相关人员如果在市场部门或客户成功职能,他们是否需要那些沉重的流程、治理、控制和规则。比如系统规定我们在日本只为客户提供X服务、为该地区的客户提供Y服务之类的事情,甚至连他们的MCP server都需要专门开一个账号(seats)。至于客户是否认为这种捆绑收费公平,那就是另一个悬而未决的问题了。 没错,挑战在于这该如何定价。我想告诉你,在讨论消费型定价或按需计费定价时,基于结果的定价在很多领域都是合理的,但我绝对不认为它会成为主流的软件定价方式,或者说不适用于所有的SaaS软件。 因为当你与客户交流时,你会发现他们非常讨厌这种方式,他们真的很反感星号附加条款。这与他们认为自己投入的价值无关。比如我对Splunk采用的是按量计费,如果我发送给他们的日志量翻倍,我就得付更多的钱。我明白这个逻辑,但日志记录是由我决定的。我可以多记一些,也可以少记一些。我可以对团队说,你们为什么记录这么多日志,这太贵了,而且你们真的在用这些日志吗?我是可以控制我投入的数据量的。这与存储和S3或其他典型服务的模式相同。我存入1GB或2GB都没问题。问题在于,这些对于我作为客户来说是相对可转移且可控的。 但人们给出的许多关于基于结果或基于消耗定价的例子,作为客户我是无法控制的,而且它们也是不可兑换的。所以AI Token的世界和AI积分的世界,对客户来说真的非常困难。他们会觉得不明白你给我的这种代币或筹码到底是什么。 我可以从AWS获取1GB的存储空间并将其部署到Azure,而且我知道他们会收我多少钱,因为每GB的费用基本上是固定的。但当我拥有这些AI额度时,我不知道你的额度是否和别人的一样。供应商一直在增加新功能,我的用户在使用这些功能,所以消耗了我的额度。但我不知道他们用这些额度做了什么。 这并不是公司主动选择去使用它们,而是供应商在添加那些让软件变得更好的功能,而这些改进似乎是自然而然发生的。我可以让我客户的额度消耗在一夜之间翻十倍,仅仅通过添加一大堆类似为你生成很棒的摘要这样的功能。客户会觉得我并没有要求做那个。 所以我觉得在谈论基于成果的使用计费时,当你和客户沟通,他们还是想要按账号(seats)计费。这可能是因为他们现在更理解这种模式,并且他们被很多按量计费模式坑过,这种模式会导致账单金额大幅飙升,他们会不知道该如何控制。 是的,这需要一些时间来适应。它肯定会出现在很多类别中。我们在Atlassian的业务涵盖了很多领域,你可以称之为基于用量的定价,或者字面意义上的按需计费。但我们尽量专注于那些客户业务量翻倍时,他们能获得两倍的价值同时也支付两倍费用的领域,而且这一切都在他们的控制之下。许多其他定价模式并不在客户的控制范围内。 基于结果定价的最后一个例子是,这些结果也是动态的。比如在客户服务方面,我为你节省了成本。你过去在客服上花20块,使用我们的工具你只需要花10块。在第一年这是一个非常棒的销售说辞。但到了第二年,客户会说我只花了10块,现在我想花5块,否则你没有提供任何价值。而供应商回答说如果把我踢出局,你得花20块。客户就会觉得但我现在只花10块。所以每年能为客户省钱的能力从结果的角度来看很难衡量,即使我正在消除一些繁琐的任务。 Alex:我认为从销售的角度来看也是如此。我创办过两家支付公司。我非常羡慕Workday,我常会和我的销售团队谈起Workday,因为他们对外部情况了如指掌。他们知道能从GE赚多少钱。他们会说GE有33万名员工,也许我们每个月向他们收取每位员工5美元,这就是能从该账户中赚到的钱。 如果你在销售一款软件产品,这样去规模化组建销售团队要容易得多。因为你知道那家公司会付给我们300万美元。相比之下,当我们刚创办公司时,签约了1800个公司,我们完全不知道能从他们身上赚多少钱。结果真正让业务运转起来的是Casper这家床垫公司。你根本无法预测。你以为拿下了沃尔玛这样的大客户,但刚开始进展得并不顺利,反而是签下Casper后业绩惊人。 Workday具有这种双向的可预测性,对于出资方的客户而言是可预测的,对于管理团队来说也是可预测的。你能明确应该把时间花在争取签下GE这样的客户上,而不是签约一家10人的公司,因为GE规模更大。但在互联网世界里情况却非常疯狂,Stripe从一家10人公司赚到的钱可能比从GE赚到的还要多。在那种模式下你可以获得更高水平的可预测性。 但采用基于结果的定价或者基于消耗的定价,虽然基于消耗的定价本身并不坏,但如果你无法从外部了解一个账号(seats)能赚多少钱,扩展销售和营销团队就会变得呈指数级困难。 5.为什么在AI时代,客户信任如此艰难 Eric:作为一名企业家,我想回到的一点是,在这个时代,你能分享一下这对你来说最主要的体现方式是什么吗?以及它是如何让你改变业务的? Mike:我们的看法是,我们销售的是解决人类协作问题的协作工具。在许多不同的领域,包括服务团队、广泛的业务团队、人力资源、财务、软件团队等,许多不同类型的团队通过我们购买不同的应用套件和组合。从根本上说这些都是涉及大量文本的协作问题。这对我们非常有利。那些人在做什么才是最重要的部分。 技术世界往往趋向于重塑一切,并认为这是未来的方向。从中长期的视角来看这通常是正确的。但我们面临的挑战始终是,我们拥有大量以现有方式工作的客户,如今各种App中的工作流其实并不怎么智能。他们想要迈向未来,但同时也必须带动大量的用户。所以当我们构建AI功能时,首先考虑的是我们需要理解这项技术是什么,以及它能如何帮助我们。其次,我们需要构建什么样的基础平台组件来应对未来的变化,因为这些技术的发展速度实在太快了。 这就是我们开发AI Gateway、团队协作图谱以及企业级合规性与控制功能的初衷。你必须将这些内容与你在特定App中为客户构建的功能区分开来。那么你把这些功能放在哪里?这些功能具体是什么?其中很大一部分存在于现有的工作流中,旨在帮助客户更快、更好、更高质量、更高效地完成现有的工作流。这些功能往往非常平淡无奇,这就像X平台上那段30秒的动画GIF走红一样。但这对于客户来说非常令人兴奋,因为他们现在就可以使用,他们现有的工作方式变得更出色了,他们会觉得这太棒了。在AI世界里我却觉得那其实挺简单的,而且这在今天确实能给他们带来巨大的帮助。 我常对内部人员说,光举一个服务方面的例子还不够,你需要利用他们现有的工作流程,结合新应用或者查看新的工作流来处理问题。所以我们必须完成所有这些。如果你看Jira这个典型的例子,在我们的HR和IT服务管理产品的服务集合中,正在进行工单总结。这是我们可以做得比以往任何时候都好得多的事情。 内部大概有四五个人在处理同一个工单,试图解决一个问题。当第四个人介入时,已经有了大量的附件和对话记录。通常情况下他们可能需要花费30分钟才能读完所有内容并理解到底发生了什么,这样才能发挥专业知识来解决问题。总结并不只是简单地将内容输入到LLM中然后获取摘要。上下文对模型来说非常强大,但客户的工作流程却没发生哪怕一点点改变。它仍然是Alex对Eric说你能来帮我处理一下这张工单吗?Eric走过来必须先将大脑中所有的相关信息进行加载。这就像是一个现有的工作流,我们可以利用LLM让客户体验变得更好,而且他们非常喜欢,对这类功能赞不绝口。但这些功能通常不具备智能体特性。 那么我们可以说,对于那个服务工作流,我们需要在各个环节中加入智能体。大多数人正在处理一个工作流,然后发现这一步经常让人栽跟头,耗费大量时间。我们能让这一步变得更快吗?这绝对是我们必须亲自为智能体框架提供的功能。 我们有一个非常棒的智能体框架供整个团队使用,结合图谱和你已经拥有的所有上下文。这非常简单,价格也非常亲民。或者你也可以自带智能体框架。我认为大多数企业内部都会运行三到五个大型智能体平台。他们可能会说我用Agentforce来处理这个,或者我用Gemini来处理那个。把那个智能体带过来,我们会把它放入工作流中让它运行起来。我们必须能够做到这一点。 但你仍然完全处于现有的工作流世界中,只是在现有的工作流中执行一种新的高效的任务。接着你会遇到这样的人,他们会问如果服务工单根本不存在会怎样?所以你正在重新构思整类软件到新的工作流。我们必须帮助客户跨越这一鸿沟,因为他们通常不只有一个服务团队,他们有数百个。如果他们运行着数百个不同的服务台,他们可能会说这20个将以新方式工作,但他们必须对所有这些进行管理。所以我们正尝试将团队协作图谱中的数据与此结合起来,并且是从客户驱动的角度出发。这一点经常被忽略,我们正试图带他们走向5年后的未来,但我们的职责是切实带他们走向1年后、2年后以及5年后的未来。 最后我想说的是,我们在设计方面投入了大量精力。在任何对话中这一点总是被忽略,因为在它的运作机制中有很多基础性的设计工作要做。如果回顾移动互联网时代,第一批应用基本上只是将桌面端或网页端的内容直接搬到手机上,然后我们才演进出了新的交互模式和体验。 不仅仅是视觉层面的演进,还包括我们该如何使用这些东西。推送通知最初是用来做什么的?下拉刷新是一个非常显而易见且简单的例子,它是一个非常经典的设计模式。整个过程就像是我该如何让移动端和桌面端协同工作,该如何来回切换。我们有如此多的设计挑战需要解决。这实际上是帮助普通用户理解其中的内容。他们并不想深究,如果AI对他们来说不存在也无所谓,他们想要的是AI带来的结果,不需要了解所有的技术细节。我们的工作就是隐藏这些细节,直接把结果交给他们,或者使任务更有效、更高效。在技术领域,有时我们太痴迷于模型质量之类的东西了。 现在说模型已经远远领先于实际交付的价值几乎成了陈词滥调。未被充分利用的潜能是如此巨大。这其中的一部分实际上在于设计和体验。我该如何获得这个?给人们一个拥有无限能力的聊天框,他们却只会说给我讲个冷笑话。这就像是拥有无限的力量,但很难帮助他们利用这种力量。这也是我们面临巨大挑战的地方,即如何将智能体及其所有能力引入工作流和协作循环中,并让人类与智能体协同工作。 Alex:我喜欢拟物化设计(skeuomorphic)。早期Web的形态就像你拥有几张实体纸一样,这也是它被称为网页(web page)的原因,就好比一张8.5x11英寸的纸。后来到了移动端,大家最初的设想只是做一个微缩版的网页。但事实证明,如果你不局限于拟物化思维,而是基于第一性原理进行思考并充分利用设备的性能,你就能创造出全新的交互方式。比如下拉刷新,这就是伴随移动端诞生的新概念。我前几天还在琢磨这件事。你试过Nano Banana 2吗? Mike:试过。 Alex:没错。我的一位同事刚跟我说,他用它为去日本旅游的美国游客做了一份关于注意事项的信息图表。那种一键生成(one-shot)的效果简直令人惊叹。但这引出了一个问题:你该如何编辑这些输出结果?现在的编辑方式感觉非常拟物化,依然是那种经典的GUI操作逻辑,比如点一下这里,再修改一下那里。所以我想问你,关于编辑AI输出的内容,你认为目前业界的最高水是什么样的?或者说理想状态应该是什么样的?既然你提到了设计,最近你在这方面有什么深层思考? Mike:这是一个非常棒的问题,我想先退两步来回答它。首先,在AI领域建立客户信任是非常困难的。我们在做用户调研时发现,人们害怕AI并不是因为它的能力有多强,而是因为它的运作像个黑盒。比如你的AI助手瞬间清理了收件箱、发了十几封邮件,用户的第一反应往往是:“我怎么知道它做对了没有?”为了赢得信任,AI必须向用户及时反馈它的意图并请求确认,但同时又不能频繁到让人觉得烦躁,否则用户会觉得还不如自己动手。所以交互频率和信任机制本身就是一个完整的系统设计问题。 其次,AI的训练和应用离不开大量数据与不断的迭代。现在社交媒体上充斥着关于神级提示词的炒作,仿佛念一句哈利波特的咒语就能让AI自动帮你经营一家十亿美元的公司,这太离谱了。一键到位固然有用,但在现实业务中,你通常需要不断去修改输入和输出。比如你让大语言模型(LLM)写篇论文,生成后你发现方向不对,这就需要通过改变输入来进行迭代。但如果你曾尝试通过纯聊天的方式来迭代编辑图像,你会发现体验非常令人沮丧,因为你很难精准控制AI不擅自改动其他部分。这本质上也是一个关于输入的体验设计问题。 以我们公司的产品为例,我们的团队协作图谱拥有海量的组织知识和极高的准确度,甚至能记住我十几年前写过的代码。但如果因为AI知道我有计算机科学背景,就自动用极其硬核的技术语言回答我的所有问题,这其实是没用的。如果我们在界面上设置一堆勾选框,让用户自己决定“是否搜索网络”或“是否搜索组织数据”,这也完全违背了设计初衷。 AI应该具备主动预判的能力。你在Deep Research等工具中能看到一些这类尝试,但有时也很让人沮丧。这就好比你手下有50个实习生,虽然能干很多活,但他们每分钟会问你50个问题,导致你整天什么也干不成,全在回答问题了。 此外,在企业环境中实现工作流的迭代要困难得多。比如头脑风暴通常需要团队协作,在我们的Whiteboard和Confluence中,你可以引入智能体来辅助。它们非常擅长从组织内部提取知识并生成优秀的方案。但如果没有任何人工干预直接让AI包办一切,就会失去团队的信任。正常的流程应该是我们先开会收集想法,加入人类的直觉判断,筛选出有用的部分,然后再把这些反馈给另一个智能循环。因为AI的输出质量具有很强的非确定性,这就注定了系统必须包含一个人工介入循环。没错,如何把握这个人工介入的度是个极大的设计考验。循环确认的步骤太多会让人感到沮丧,步骤太少又会失去用户的信任。 我们刚在Jira中发布了Agent功能。当你把任务分配给Agent时,它就会去执行。但用户往往会问:“它现在到底在干什么?”如果你给他们展示上千个底层执行步骤,他们又会觉得你在给他们塞废话。所以仅仅是将AI引入工作流,就面临着海量的设计挑战。 回到实际的业务审批流程上来,比如一项交易需要经过安全、会计、财务和销售等多个部门的审核,你该如何用AI优化这个工作流?当你将任务分配给Agent时,你需要非常小心地设计用户体验:它什么时候返回结果?以什么方式返回?用户能否在它工作时主动询问进度? 我们相信,允许用户随时查看进度有助于在短期内建立信任感。但从长期来看,如果这个Agent连续二十次都出色地完成了任务,用户最终会选择完全放权。这些全都是根本性的基础设计与体验问题,而不是纯粹的技术问题。核心挑战在于如何让每天使用App的数百万用户对产品产生信任,并消除那种黑盒感。盲目承诺“我可以为你做任何事”,只会让用户无所适从。 Alex:这确实还是一个悬而未决的问题。因为未来的理想交互方式显然既不像过去那样单纯地点击鼠标,也不像现在这样只是不断地重新输入提示词,它更像是两者的结合。 只要工具是为人类服务的,就一定离不开人类的参与。你需要让用户能够直观地深入理解模型内部的运作逻辑,无论是出于建立信任的目的,还是为了方便后续的修改迭代。这本质上是一个设计问题,而且我认为目前业界可能还没有人完美解决它,我们正处于这一探索过程的最早期阶段,大家都在为如何更好地调整和编辑那些一键生成的内容寻找最优的设计方案。 Mike:我想举一个文档编写的例子。知识工作者几十年来都习惯了以固定的模式写文档:打开一个空白页面,输入标题、打字、列出符号或者插入表格。现在我们推出了Create with Rovo功能,你完全可以从一个提示词开始,让AI根据模板生成内容,甚至让它先去调研各个维度的信息并整合带回。 但要改变用户根深蒂固的习惯是非常困难的。现在界面变成了左右两部分,左边是文档实体,右边是聊天窗口。想象一下这是一个没有任何工具栏、只能通过对话来排版的Word。我们需要鼓励用户:“你可以直接在左边修改任何文本,也可以在右边输入指令,比如让它添加一个新章节、去研究其他资料并补充到摘要后面。” 当我们观察那些高级用户时,发现他们非常享受这种模式,他们能熟练地在两种操作间来回切换,领会了这种全新的范式。他们可以下达贯穿整篇文档的全局指令,比如“把所有标题变成蓝色”,这在传统编辑器里是很难一键做到的。他们甚至可以要求AI从董事会成员的视角来重新评估并精简这份文档。 但对于普通的商务用户来说,他们的第一反应往往是困惑:“所以我只需要在左边打字就行了?”这实际上是一场深刻的范式转移。我怀疑随着AI工具的普及,就像移动互联网时代刚到来时那样,大概两到五年后,这种全新的交互方式会变得非常普遍。这就好比大家第一次看到Excel时,也会茫然地问“我该在哪里输入段落”,但现在所有人都知道Excel是怎么运作的了。 我们面临的最大挑战,就是如何将所有这些强大的AI能力自然地融入到极简的界面中,去协助人们真正调用整个组织的知识来生成文档。我知道这在底层算法和数学逻辑上是完全可行的,但要通过优秀的体验设计来引导用户接受并掌握它,依然充满挑战,同时也令人无比兴奋。我们需要花费大量时间来不断完善这些体验。 Eric:这是一个非常适合作为结尾的话题。Mike,非常感谢你参加我们的播客,这是一次非常精彩的讨论。 Mike:好的,没问题,伙计们。希望这些分享能对大家有所帮助。
OpenAI再次推迟ChatGPT“成人模式”:优先提升智能与个性化
IT之家 3 月 8 日消息,当地时间周六,OpenAI 在接受 Sources.news 采访时表示将再次推迟“成人模式的上线”,以便“专注于当前对更多用户来说更重要的工作”。 OpenAI 发言人对 Axios 解释称,目前公司优先推进的工作包括“提升智能水平、改善对话个性、增强个性化体验,以及让交互变得更加主动”。不过,他同时强调,公司“依然相信应当在原则上把成年人当作成年人看待,但要把整体体验打磨到位,需要更多时间”。 图源:Pexels 这已是 OpenAI 第二次推迟该功能的发布。2025 年 10 月,OpenAI CEO 萨姆 · 奥尔特曼(Sam Altman)首次透露,公司将在更全面地推出年龄分级机制的同时,基于“把成年人当成年人对待”的原则,向经过验证的成年用户开放更多内容,包括“情色内容”。当时奥尔特曼表示这一功能将在 2025 年 12 月上线。 然而,这一计划在内部被紧急叫停。据知情人士透露,奥尔特曼要求团队将资源优先集中到 ChatGPT 核心体验上。随后在 2025 年 12 月的一次简报会上,OpenAI 应用部门 CEO 菲吉 · 西莫(Fidji Simo)向媒体确认,成人模式将推迟至 2026 年第一季度推出。 如今第一季度即将结束,OpenAI 再次按下暂停键,且未给出新的时间表。 值得注意的是,OpenAI 已于今年 1 月开始逐步推广其年龄预测工具,这可能与未来的成人模式密切相关。IT之家注意到,该工具通过分析账户活跃时长、使用时段、使用模式等多种因素,自动判断用户是否可能未满 18 岁。如果系统判定用户可能为未成年人,将自动应用针对性的安全防护措施。被误判的用户可以通过第三方身份验证服务 Persona 提交自拍照完成年龄核验,从而恢复完整访问权限。 本月初,科技媒体 Android Authority 对 ChatGPT v1.2026.055 解包发现了名为“Naughty Chats”的字符串。代码描述显示,“该设置允许 ChatGPT 在您提出请求时使用更辛辣、成人主题的语言”,并确认该功能仅面向 18 岁以上用户开放。这进一步印证了 OpenAI 仍在持续推进相关功能的开发。 奥尔特曼此前曾强调,成人模式不会默认开启,只有在用户主动请求时才会提供相关内容。这意味着用户需要手动启用该开关,并主动要求 AI 聊天机器人进行成人主题对话。
不满与美军方合作 OpenAI机器人业务负责人辞职
卡利诺夫斯基 凤凰网科技讯 北京时间3月8日,据彭博社报道,OpenAI机器人团队负责人凯特琳·卡利诺夫斯基(Caitlin Kalinowski)在周六宣布辞职,原因是该公司达成了一项协议,将其AI模型部署到美国军方的机密网络中。 卡利诺夫斯基在X上发帖称:“做出这个决定并不容易。AI在国家安全中扮演着重要角色。但是,在未经司法监督的情况下监控美国人,以及在没有人类授权的情况下让AI拥有自主致命攻击能力,这些都是未经充分商议就触碰的红线。” OpenAI在一份邮件声明中证实了卡利诺夫斯基的离职,并表示公司相信与美国国防部达成的协议“为在国家安全领域负责任地使用AI开辟了一条可行之路,同时明确了我们的红线:不进行国内监控,不用于自主武器。” “我们认识到,人们对这些问题有着强烈的不同看法。我们将继续与员工、政府、民间社会以及全球各界进行讨论。”OpenAI表示。 根据卡利诺夫斯基的领英资料,她在2024年11月加入OpenAI,担任公司机器人技术团队的成员,此前她曾领导Meta的增强现实眼镜开发工作。 在特朗普政府与AI公司Anthropic的谈判破裂后,OpenAI在2月底与五角大楼达成了协议。Anthropic此前一直争取获得保证,即其技术不会被用于对美国民众进行大规模监控,也不会用于研发完全自主的武器。OpenAI尚未说明其向五角大楼提供的服务是否会取代此前由Anthropic负责的工作。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
ASML CEO:中国正尝试抛弃我们的光刻机,还可能拿稀土卡我们脖子
封锁加码本土突围 ASML在芯片设备领域那可是响当当的角色,主要生产光刻机,帮助全球厂家刻出那些细小电路。从2023年起,美国就开始推动出口管制,不让先进EUV光刻机卖到中国大陆。 荷兰政府也跟着行动,2024年1月吊销了NXT:2050i和2100i型号的许可证,9月又撤销了更多DUV设备的出口许可。中国企业只能拿到一些老款机器,用来维持成熟工艺的生产线。 这种管制其实是步步紧逼,每当中国技术有点起色,美国那边就加码。结果呢,中国大陆市场成了ASML的最大客户,2025年第三季度交付量占总数的42%,比第二季度27%还高出不少。 这些设备大多去了三星和SK海力士在大陆的合资厂,帮着生产传统芯片,保持全球供应链运转。ASML前任CEO彼得·温宁克早就在电视节目上说过,完全隔离中国没戏,他们会自己钻研出路。 台积电前高管林本坚也提过类似观点,中国团队面临压力时,总能找出新办法绕过封锁。实际情况就是这样,中微半导体已经在刻蚀机上拿下5nm工艺,进了台积电生产线。 北方华创、盛美半导体这些本土企业,也在沉积设备和清洗机等领域发力,集中资源攻克卡脖子环节。上海微电子的分支芯上微装,更是专注光刻机研发,早早就开始布局。 美国的策略其实是“你封锁我突破,我突破你再封”,形成一种循环。中国企业没闲着,投入大量资金和技术人才,目标就是实现设备国产化。 ASML的财报显示,2024年中国销售占29%,但管制让交易越来越复杂。大家都知道,这场拉锯战会推动中国创新加速,谁也挡不住。 稀土反击供应链警 2025年10月15日,ASML的财报电话会议上,CEO 直言不讳,中国市场风险大,虽然现在需求还旺,但企业已经在开发自家光刻机,准备逐步替换他们的产品。 订单数据亮眼,5.4亿欧元,包括EUV部分,但中国部分让大家捏把汗。Fouquet说,2026年中国销售会明显下滑,比2024和2025年弱得多。 他还提到,中国加强稀土供应链出口控制,现在还没直接影响ASML,但如果持续下去,会严重冲击业务。稀土是光刻机磁铁和激光部件的关键,中国产占全球90%以上。 CFO 补充,公司有库存,能撑几个月,供应链有准备。不过,这种管制更多是警告信号,一旦美方继续加压,中国就会用稀土反制。 实际情况看,中国商务部2025年10月9日宣布收紧稀土出口规则,包括某些元素和技术审批。ASML团队紧急评估,短期无碍,因为有备用来源。但全球反应快,美国那边呼吁更严管制,股价波动大。 中国企业像SMEE,已经交付步进扫描机,本土设备采用率2025年达35%,订单421台,总值8.5亿人民币。 Fouquet在访谈中承认,中国创新能力强,不会接受被切断AI芯片供应。他们建成EUV原型,目标2028年产芯片,虽然专家说需要很多年,但进展超预期。这让ASML警觉,中国囤积设备应对管制,但长远转向本土,会削弱他们的市场份额。 博弈升级创新不止 中国企业集中资源,针对光刻机弱点投入,SMEE原型测试已完成,逆向工程部件推进中。2025年底,本土替代加速,订单纪录高。设备商如拓荆科技扩展生产线,攻关沉积设备。中微半导体5nm刻蚀机工艺,直接影响芯片良率,尹志尧视察时强调这点。 稀土管制暂停,美中协议延期实施,ASML供应链松口气。预计2026年销售平或微增,EUV拉动平衡中国下降。中国创新强,找出路,ASML需应对。全球芯片链调整,拉锯持久。 美方管制层层加码,其实是逼中国企业自强。结果呢,本土设备商崛起,中微等公司在三大关键设备上夺高点。稀土作为王牌,起到震慑作用,没直接出手,但随时能反击。ASML承认,这会削弱自身位置,但也推动全球技术进步。 中国手中稀土资源,占全球主导,管制一出,供应链就警铃大作。ASML有长周期库存,短期稳住,但长期需多元来源。 实际情况,中国已建成EUV原型,招募前ASML工程师,签约奖金高。目标虽是2028年,但可能延到2030年。说到底,这场博弈,谁也说不准,但中国坚持发展道路,集中力量办大事,成效明显。
硅谷最危险战争!Anthropic死扛封杀,营收狂飙190亿
编辑:元宇 一份备忘录将Amodei推上风暴中心,Anthropic与国防部原本可能达成的解决方案彻底告吹。Amodei公开声明:我们除了诉讼,别无选择。 3月的硅谷,火药味十足。 就在美国政府为Anthropic贴上「供应链风险」标签后,OpenAI几乎在同一时间签下军方协议。 一向冷静克制的Anthropic CEO Dario Amodei突然情绪爆发。 他在一份内部备忘录严厉指责了他的老对手、OpenAI CEO奥特曼,并质疑他关于OpenAI与五角大楼协议相关表述的真实性。 不仅如此,Amodei还指责OpenAI员工太容易轻信别人。 Anthropic CEO Dario Amodei 该备忘录经媒体曝光后,引起轩然大波,Amodei罕见公开道歉,但在原则上却丝毫不让。 他在最近的一份官方声明中表态,美国政府对Anthropic的决定在法律上并不成立,「我们别无选择,只能通过法院提出诉讼。」 在这份声明中,Amodei提到,绝大多数客户不会受到这次供应链风险认定的影响。 即便对「国防部」的承包商来说,供应链风险认定也不会、而且依法也不能限制他们使用Claude,或限制他们与Anthropic的业务关系,只要这些事项与其具体的「国防部」合同无关。 在声明中,Amodei还就公司内部帖子被泄露给媒体一事表示歉意。 那一天对公司来说非常艰难,我为那篇帖子的语气道歉。它并不代表我经过认真斟酌后的观点。而且,那篇帖子也是六天前写的,已经不能反映当前局势。 Amodei坦言,Anthropic没有泄露这篇帖子,也没有指使任何人这样做,因为升级这一局势,并不符合他们的利益。 备忘录外泄,Amodei被推上风暴中心 这份备忘录的外泄,让Anthropic与国防部原本可能达成的解决方案彻底告吹。 上周五,在得知国防部要对Anthropic痛下杀手,而竞争对手OpenAI却转身就和军方签下涉密系统协议后,Dario Amodei向Anthropic员工发送了一份措辞激烈、长达1600字的备忘录。 在这封备忘录里,Amodei谈到了Anthropic与国防部的冲突,还措辞严厉地批评了OpenAI及其CEO奥特曼,并质疑OpenAI与五角大楼协议相关表述的真实性与一致性。 在备忘录结尾,Amodei还嘲讽OpenAI员工是「一群有点容易轻信别人的人」。 事后,Amodei就这份备忘录出面道歉。 自动播放 他特意强调了他发出这篇备忘录的背景—— 是在特朗普总统于Truth Social发文宣布Anthropic将被移出所有联邦系统、国防部长在X上发文宣布供应链风险认定,以及五角大楼与OpenAI达成协议的消息公布后几小时内写成的。 这是Anthropic历史上最令人困惑的时期之一。我在Anthropic内部会发很多贴,有些人把这个描述为备忘录,我不会这么描述它……所以,这不是我经过反思后会说的话。 按照五角大楼高级官员Emil Michael的说法,在这篇内部备忘录曝光之前,双方一直在讨论如何缓和关系,而备忘录事件的出现终结了相关谈判。 此前,Emil Michael曾在X上炮轰Amodei是个「骗子」,还说他有「上帝情结」。 尽管在公开声明中,Amodei对备忘录的事件道歉,但他道歉的仅仅是自己当天的「情绪和语气」,对于原则底线,却丝毫没退让。 他仍然坚持Anthropic的两道红线:绝不参与作战决策与完全自主武器,绝不参与国内大规模监控。 在声明最后,Amodei还表示:Anthropic愿意以象征性收费继续提供模型和工程师支持,确保军方平稳过渡。 从「安全路线」之争到宿怨重燃 这场冲突,也让Dario Amodei和奥特曼的宿怨再次被点燃。 2016年,Dario Amodei加入OpenAI,很快升任研究副总裁,站在这家年轻实验室最核心的位置上。 可随着OpenAI的一路狂奔,二人之间的矛盾也随之爆发了。 2019年,Amodei及其团队对奥特曼推动的激进商业化不满,认为这可能背离OpenAI最初的「安全开发AI、造福人类」的使命。 Amodei试图在内部推动更注重安全的步伐,这更加剧了他同奥特曼以及OpenAI董事会的分歧。 2020年12月29日,OpenAI 正式宣布Dario Amodei和一部分同事离开。后来,Amodei在解释离开原因时说,「试图争论别人的愿景是极度低效的」。 Dario Amodei(左)与Daniela Amodei(右) Daniela Amodei(Dario的妹妹,时任OpenAI安全与政策副总裁)也一同离开,他们和另外五名OpenAI关键研究人员在2021年初创立了Anthropic。 作为对奥特曼的一种反击,这家初创公司把安全列为最高优先事项之一。 两家公司之间的竞争很快就从理念分歧升级成一场商业军备竞赛,双方的较量随处可见。 上个月在印度的一场A峰会上,两人并排站立合影时,宁肯尴尬也拒绝互相牵手。 奥特曼(左)与Dario Amodei(右) 投资人Joshua Kushner都忍不住吐槽,说Amodei想恨OpenAI的劲头,简直比他坚持公司价值观的劲头还大。 在商业战场上,Anthropic更是处处和OpenAI「较劲儿」。 2024年10月,在OpenAI出现一系列离职潮之后,Anthropic直接在旧金山机场投放Claude广告,影射「那个并没有那么多狗血剧情的」。 前不久,Anthropic又为Claude投放了超级碗广告,借机讽刺OpenAI开始在 ChatGPT中测试广告的决定。 双方的分歧,还体现在不同的政治立场上。 特朗普重新上台后,奥特曼迅速靠近新政府,并在白宫与特朗普共同宣布「Stargate」项目,OpenAI总裁Greg Brockman和妻子更是大手笔捐赠支持特朗普阵营。 反观Anthropic,Amodei本人曾公开反对特朗普提出的「大而美法案」(Big Beautiful Bill)草案中的一项条款,该条款拟禁止各州监管AI。 这些做法,显然无助于Anthropic赢得白宫的好感。 巨头力挺与营收狂飙 Anthropic的「反杀时刻」 被美国政府突然贴上「供应链风险」的标签,对一家估值3800亿美元的初创公司来说,本来应该是毁灭级的生存威胁。 不只是军方项目受到影响,连云服务、合作伙伴、外部客户关系都可能受到牵连。 所有投资人都生怕客户与合作伙伴会因此而切断与Anthropic的合作。 但令人想不到的是,后来局势的发展意外变成了Anthropic的一次「反杀」。 首先站出来力挺Anthropic的,是微软。 微软发言人明确表示,他们的律师已经研究过了,除了国防部相关的项目,微软将继续通过M365、GitHub等平台向客户提供Claude。 谷歌和亚马逊也双双表态,只要不涉及国防部,合作照旧。 这等于告诉市场:五角大楼的施压,暂时还改写不了整个行业的供应链。 巨头撑腰,民意支持下,Anthropic业绩也在封杀之下迎来了逆势爆发性增长。 在摩根士丹利科技会议上,Anthropic的年化营收已经突破190亿美元,比去年年底直接翻倍,随后更是又猛增了36%。 虽然OpenAI的年化收入达到了250亿美元,较去年年底增幅约17%,但Anthropic的增速已经实现了反超。 更让OpenAI高管压力巨大的是,Cursor等关键编程工具,2024年就默认切换到Anthropic的Claude模型。 其中,还有一个极富戏剧性的画面:就在奥特曼宣布OpenAI与五角大楼达成协议、将模型部署到涉密环境,并在随后补充相关限制条款后的那个周末,Claude一举冲上了美国苹果App Store免费下载应用榜的第一名。 外部封杀,本想要把Anthropic「按下去」,结果却把它顶到了更高的位置,这场封杀,最终却意外成了一次帮Anthropic做大的全民曝光。 Anthropic并不孤单 其实,就在这次封杀之前,Anthropic与五角大楼的关系并不疏远。 2024年,Anthropic就与美国国防部重要软件供应商Palantir签署了合作协议。去年,五角大楼又向Anthropic提供了一份价值2亿美元的AI试点合同。 更重要的是,Anthropic一度是第一家、也是直到最近几周前唯一一家获准部署在涉密系统中的AI实验室。 所以,就像Amodei这次在公开声明中提到的那样,Anthropic与国防部的共同点远多于分歧。 双方冲突的核心,仍回到了两条安全红线上。 五角大楼想要的是可以在「任何合法用途」使用Claude,而Anthropic则是要坚持两条红线:不能用于大规模国内监控和完全自主的致命武器。 Anthropic的抗争,也在硅谷激起了回响。 就在过去这一周,数百名谷歌和OpenAI的员工签署公开信,呼吁自己的雇主效仿Anthropic的底线。 代表了亚马逊、谷歌和微软超过70万名员工的工会组织也站了出来,敦促巨头们抵制大规模国内监控和完全自主致命武器。 这意味着,Anthropic在与五角大楼之间的这场对峙中并不孤单,它所提出的两条安全红线得到了大部分硅谷科技圈和网友们的广泛支持。 在这场复杂的博弈中,技术早已不再是唯一的变量。
中东一场无人机轰炸 把全球智力干倒退了?
北京时间 3 月 1 日晚八点半,亚马逊 AWS 位于阿联酋的服务器,遭到了伊朗的无人机袭击,导致 mec1-az2 服务器集群受到影响。 极度依赖 AWS 云服务的 Claude,随后就来了个全球大宕机。 事情到这里还不算完,Claude 宕机,大伙儿总得找个替代品。而在这 AI 御三家里,OpenAI 刚和美国国防部签了单子,引发众人的一致差评,强烈抵制。 于是,一大批人集中涌入 Gemini,又把 Gemini 的服务器给挤爆了。 一个数据中心被炸,引发层层连锁效应。不少人直接慌了,回归纯粹的碳基生产?AI 写不了代码,难道要我们自己写吗? 甚至还有编辑部同事在 AI 宕机期间表示,“ 一觉醒来,全球写作和 coding 能力下降 10 倍。” 要说以前停电只是停工,现在停 AI,引发的是全球智力下降的大危机。。。炸毁一个数据中心,简直和在 20 世纪炸了一个炼油厂差不多。 更要命的是,中东这片纷争不断的地区,有钱有地有能源,在打仗前恰恰是搞超大规模 AI 基建的理想地区。 不知道各位差友有没有印象,咱们之前讲过美国缺电,数据中心服务器有显卡却用不上的故事。比起显卡,能源可能是未来又一个掣肘 AI 的关键因素。 而中东的电,真是便宜又大碗。 像是沙特的电价,每千瓦时只需要 0.02 到 0.05 美元,远低于北美和欧洲动辄超过 0.1 美元每千瓦时的电价。 那么,是什么让中东土豪心甘情愿把地盘拱手相让,甚至在背后推波助澜,大力欢迎大伙儿去他们那搞 AI 基建呢? 卖电很显然不是核心,他们真正想做的,是用能源换算力。 根据 《 金融时报 》 的一篇报道,中东国家押注 AI 的力度相当狠。沙特阿拉伯财政大臣穆罕默德 · 贾丹在去年年初就曾经表示:“ 我们将不再出口石油,而是出口数据。” 过去一百年,中东靠石油掌握全球能源定价权。而现在,他们想把这种模式复制到 AI 时代,建上 AI 的炼油厂,炼出未来的核心资源 token,卖到世界各地,继续掌握 AI 时代的能源定价权。 美国咨询公司 Arizton 去年九月的报告显示,目前中东地区共有包括亚马逊、微软等 71 家运营商,在 175 个数据中心设施中运营,其中主要为 AI 和云提供服务的三级数据中心,约有 90 个。 数据中心的建设主要分布在阿联酋的迪拜、阿布扎比,沙特的达曼、利雅得等城市。中东特殊的地理位置,让它们同时辐射着亚非欧三片地区。 尽管目前中东的数据中心不管是数量,还是算力容量,在全球占比其实只有不足 5%,并不算太高。 但根据普华永道的一篇研报:“ 中东正迅速崛起为数据中心强区,预计该地区的数据中心容量将增长三倍,从 2025 年的 1GW 增至未来五年的 3.3GW。” 这里面最典型的,还数特朗普亲手拍板的 “ 星际之门 ” 了。 这个由阿联酋国企 G42 联手 OpenAI 搞的大项目,原本是奔着美国境外最大的 AI 数据中心去的。按最早的说法,2026 马上就要开张,用上最先进的 B300 显卡,连接最先进的 AI 模型。 但现在看这架势,只能说,战争的回旋镖还在飞。以后想建 AI 炼油厂,恐怕不得不在价格和安全上做个选择了。 过去大伙儿觉得 AI 也就是个好用的工具,跟滴滴、美团没啥区别,大不了就是 APP 崩了,换一家用。但现在看,这玩意儿的性质彻底变了。 不管是中东数据中心出事引发的连环宕机,还是 OpenAI 转身跟政府签下的军事协议,都在说明,AI 正在变成像电网、卫星、核电站一样的硬核基建。 这种东西一旦卡壳,丢的可不只是几个用户,而是整个国家的战略资源储备。 所以,那些动辄几百上千亿美金的投资,以后要不要再往地缘不稳的地方放,谁都得掂量掂量。 这么一来,情况很可能变成,大多数国家宁可在本土多烧几倍的电费,忍受更高的 token 成本,也得把这块数字命脉攥在自己手里。 可问题是,现在的 AI 公司本来就在亏本赚吆喝,全是靠烧钱撑着。如果算力成本,再因为这种数据中心建设回流往上涨,那以后咱们用的 Claude、GPT、Gemini,可能真要告别白嫖,迎来大涨价了。 这次 AI 大宕机,其实还让世超意识到一件更重要的事。 以前世超一直不理解,为啥有人非要在自己的电脑服务器上,花那么大力气折腾一个效果更差的本地模型。 但这回看来,不属于自己的云端大模型一炸,大伙儿的生产力瞬间清零,这等于是把脑子外包给别人。 所以,在未来,也许本地模型可以不用,但不能没有。就像学校医院都有备用发电机一样,一个自己的家用服务器,可能就是我们的 “ 备用发电机 ”。 最后说到底,这事儿其实也挺无奈的。 AI 本来是人类最聪明的工具之一,很多人都在想象它怎么帮我们治病、搞科研,解决各种人类生存的难题。 但现实是,过去一百年,人类已经见过太多类似的剧情。石油、铁路、电厂,只要变成关键资源、关键基础设施,很难不被战争盯上。 现在,AI 也慢慢走到了这个位置。 也许在 AI 时代,除了电力和显卡,我们需要的,还有一个和平没有爆炸的世界。。。
别嘲笑那个养龙虾的人
美国福特汽车博物馆,起初开车会被嘲讽 昨天,深圳腾讯楼下,数百人排队,等待腾讯的程序员,给他们安装近期火爆的AI工具OpenClaw(小龙虾)。大家一般调侃使用过程是“养小龙虾”。这引来一片群嘲:“装了也不会用”、“不懂瞎跟风”、“赛博鸡蛋”。 有趣的是,很多人一边嘲笑那些想体验新技术的人,一边感慨为什么每次技术创新都是来自硅谷等地。要知道嘲笑的土壤,是长不出创新的鲜花的。 1962年,美国社会学家Everett Rogers出版了一本后来极具影响力的书:《Diffusion of Innovations》(创新的扩散)。他解释了一个非常有意思的现象:为什么新技术总是先被少数人尝试,然后在不解和嘲笑中,才慢慢被整个社会接受。 Rogers出生在1930年代出生于美国爱荷华州的农村,当时大多农民用马耕地,而第一批购买拖拉机的人,经常被邻居嘲笑。原因很简单:“拖拉机很贵,容易坏,马更聪明更可靠。”使用拖拉机的农民,被嘲笑称为“show-off farmers”,意思是“爱炫耀的农民”。 Rogers得出了一个著名的结论:接受新技术的人,分成五类: 第一类,创新者(Innovators),大约占人口的2.5%。这群人最早尝试新技术,他们好奇心强、愿意冒险,被周围人看成“爱折腾新东西的人”。 第二类,早期采用者(Early Adopters),大约13.5%。他们会观察创新者的尝试,一旦觉得有价值就会跟进。这些人往往是意见领袖。 第三类,早期大众(Early Majority),大约34%。当技术开始被证明有效时,就会逐渐加入。 第四类,晚期大众(Late Majority),也是34%。等到技术已经非常普遍之后才接受。 最后一类,落后者(Laggards),约16%。他们对新技术非常谨慎,往往要等到最后才开始用。 换句话说,每一次技术革命,最早2.5%的人,一定会显得有点奇怪,有点卖弄之嫌。当新技术不成熟,用途不清晰,尝试得太早,很容易被周围人嘲笑。 类似的事情也发生在AI发展史中。 1956年,美国达特茅斯学院的一间教室里,一群年轻的数学家和科学家提出了一个听起来像科幻的想法:“能不能让机器像人一样思考?”这场会议后来被称为“达特茅斯会议”,也是“人工智能”这个词第一次被正式提出。 当时的计算机非常笨重,算力甚至不如今天的一块手表。很多人听到这个想法的第一反应是怀疑,有人嘲笑这是科学幻想,也有人讽刺这是学者的空谈。 1965年,美国哲学家Hubert Dreyfus批评说,“人工智能就像炼金术一样,是一种伪科学。”他后来还出版了一本著名的书《What Computers Can't Do》,嘲讽AI研究者的乐观预测,认为机器永远不可能真正理解世界。 从1956年的达特茅斯会议,到2012年深度学习突破,再到2023年大模型爆发,人工智能整整走了70年。中间经历了嘲笑、质疑、资金断裂等各种寒冬。今天我们看到的ChatGPT、自动驾驶、AI医疗、AI编程、AlphaGo,都不是突然出现的奇迹,而是无数人长期尝试和坚持的结果。 几乎每一个新兴行业的技术和早期用户,都是在群嘲中长大的。没有人天生精通AI,也没有人刚接触一项新技术就能发挥全部的价值。面对新生事物,从一知半解到浅尝辄止,到熟练运用,本来就是最正常的成长路径。 我们不必苛求自己,更不必苛求别人,一开始就能用到50%甚至100%。哪怕只懂1%、2%,那也是推开新世界大门的了不起的一步。这1%的尝试,是认知和行动的转折点。纸上得来终觉浅,刷一百条AI科普短视频,也不如亲手安装操作一次。虚拟世界的观望,永远替代不了现实中的实操体验。 所有新技术的精通,都始于笨拙的开始。所有的高手,都曾是入门的小白。 回看过去几十年,每一次技术浪潮真正形成规模,都不是因为少数技术专家,而是因为普通大众开始使用。互联网最早只是查资料和发邮件;智能手机最初只是打电话、发短信;短视频刚开始也只是记录生活。但当越来越多的人参与进来,新的行业、新的商业模式、新的文化形态就慢慢出现了。 技术真正改变世界,往往不是因为最复杂的应用,而是因为最普通的人开始使用它。AI也正在走向这个阶段。当越来越多的人愿意尝试新的工具,新的用法就会不断出现。有人刚开始学,有人已经走得很远,两种人同时存在,整个技术生态才会欣欣向荣。 所以,不要嘲笑那个养龙虾的人。
OpenClaw爆火,央视提醒AI养龙虾也要警惕安全风险
IT之家 3 月 8 日消息,OpenClaw(曾用名 Clawdbot、Moltbot)是一个近期爆火的 AI 智能体,核心竞争力在于“主动自动化”能力,该 AI 智能体无需用户发出指令,即可自主清理收件箱、预订服务、管理日历及处理其他事务。目前,网上已新增大批养龙虾人。 据央视新闻今日报道,工业和信息化部网络安全威胁和漏洞信息共享平台监测发现,OpenClaw(俗称“龙虾”)开源 AI 智能体部分实例在默认或不当配置情况下存在较高安全风险,极易引发网络攻击、信息泄露等安全问题。 另外,由于 OpenClaw 在部署时“信任边界模糊”,且具备自身持续运行、自主决策、调用系统和外部资源等特性,在缺乏有效权限控制、审计机制和安全加固的情况下,可能因指令诱导、配置缺陷或被恶意接管,执行越权操作,造成信息泄露、系统受控等一系列安全风险。 建议相关单位和用户在部署和应用 OpenClaw 时,充分核查公网暴露情况、权限配置及凭证管理情况,关闭不必要的公网访问,完善身份认证、访问控制、数据加密和安全审计等安全机制,并持续关注官方安全公告和加固建议,防范潜在网络安全风险。 据IT之家此前报道,密码管理工具 1Password 于今年 2 月 2 日发布博文,其安全团队发现有攻击者利用 OpenClaw 向 macOS 用户散播和植入恶意软件。攻击者利用了 OpenClaw 的“技能”(Skills)文件,这些通常为 Markdown 格式的文件本用于指导 AI 学习新任务,却被黑客伪装成合法的集成教程。
特斯拉史上最大超级充电站今年开建:超400个V4充电桩
IT之家 3 月 7 日消息,据外媒 Teslarati 今日报道,特斯拉正准备建设迄今规模最大的超级充电站。 特斯拉已在加州提交规划,计划建设一座拥有超过 400 个 V4 充电桩的超级充电站。新项目将扩建位于加州 Yermo 的 Eddie World 超级充电站,并分阶段推进。据悉,现有 Eddie World 站点目前只有 22 个 V2 和 V3 充电桩,最高充电功率为 150kW。扩建计划将分六个阶段实施。 第一阶段将在今年晚些时候启动,新增 72 个 V4 充电桩。随后几个阶段会继续增加大量充电桩,最终规模将超过 400 个。第 1 至第 5 阶段将在 Calico Boulevard 沿线建设大型停车和充电区域,第 6 阶段的设计仍未确定。 据IT之家了解,该站点位于 15 号州际公路沿线,处在洛杉矶和拉斯维加斯之间的交通要道,是电动汽车流量极大的路线之一。 在该区域约 32km 范围内,分布着超过 200 个高功率充电桩,其中包含了 250kW 和 325kW 规格的站点。附近的 Baker 还拥有 96 个充电桩,不过在节假日和出行高峰时段,这些充电站仍然经常出现排队状况。 建成后,Eddie World 2 的规模将远超现有任何特斯拉超级充电站。目前最大的是加州 Lost Hills 的“Project Oasis”,拥有 168 个充电桩,并配备太阳能和 Megapack 储能系统。相比之下,Eddie World 2 的规模将超过其两倍。 该项目不仅是充电站,还将建设大型商业设施。规划图显示,该地将设有 Cracker Barrel 餐厅、麦当劳门店、便利店、其他餐厅、汽车穿梭取餐通道、户外用餐区以及商业租赁空间。 同时,站点还将专门为电动汽车设计设施。具体来看,其中包括为 Cybertruck 和拖挂车辆提供贯通式车位,以方便大型车辆以及未来的 Semi 电动卡车使用。
把爱泼斯坦邮件做成Gmail的00后硅谷小丑,被OpenAI“招安”了
当所有人都将目光聚焦于庞若鸣跳槽 OpenAI 时,在无人在意的角落里,硅谷最让人头疼的赛博街溜子,也被 OpenAI 正式「招安」了。 这位年仅 24 岁的哥们叫 Riley Walz,被《连线》和《纽约时报》等媒体冠以「硅谷小丑(Jester of Silicon Valley)」称号。别人写代码是为了改变世界,他写代码纯粹是为了给现实世界找点乐子。 本人也在 X 上亲自确认了这件事。 有意思的是,同样刚加入 OpenAI 的龙虾之父 Peter Steinberger,也跑到评论区凑热度,主打一个新同事贴贴。 被称为硅谷小丑的 Riley Walz,到底是何方神圣 很少有人会在毕业临门一脚时选择彻底改变人生轨迹,而 Riley Walz 就是其中一个。 Walz 出生于 2002 年,在华盛顿州长大,后来去纽约巴鲁克学院读商科。 眼看还差两门课就毕业,他直接退学,拎包搬到旧金山创业。原因很简单,他和朋友 Mehran Jalali 一起搞的 AI 项目,被业内知名加速器 HF0 看中了。 Riley Walz HF0 在业内被称为「黑客修道院」,就在旧金山一栋维多利亚式的老房子里。这个加速器用 25 万美元换取 2.5% 的股权作为条件,给创业者提供吃住和洗衣服务,要求他们全力写代码,为期 12 周。 在此期间,Walz 与 Mehran 将一款 GPT-3 Google Sheets 插件发展为正经产品 Numerous.ai。这款产品能让企业用户直接在表格里调用大语言模型,上线没多久就实现正向现金流,商业转化能力直接拉满。 但让 Walz 真正出圈的,是他过去几年搞的那些恶作剧项目。 其中最具代表性的,便是他近期推出的 Jmail—— 这个项目能让用户像浏览普通 Gmail 收件箱一样,搜索杰弗里・爱泼斯坦的邮件。Jmail 上线后在美国引发了巨大震动。截至 2026 年 2 月,页面浏览量已突破 4.5 亿次。 而他和室友在 Google 地图上 「凭空造餐厅」 的操作,更是堪称经典。 2021 年,他和室友 Mehran 在 Google Maps 上虚构了一家叫「迈赫兰牛排馆」的餐厅,地址就是他俩住的联排别墅。朋友们疯狂刷离谱好评,算法被带偏,越推越猛,这家压根不存在的餐厅,居然攒了近 3000 人的等位预约名单。 图片来自:纽约时报 直到 2023 年 9 月,他们决定兑现这个谎言:在纽约东村租场地、办酒牌、招志愿者当服务员,门口还安排朋友举着 Drake 的海报假装顶级明星正在店内就餐,140 名纽约精英食客一无所知地吃完了整顿饭。 杀伤力不大,但贴脸嘲讽的侮辱性极强。 除了虚构餐厅,Walz 还曾盯上美国旧金山的停车罚单系统。旧金山的停车罚单有多贵,懂的都懂。他室友收到一张罚单后,Walz 没吐槽,反而钻起了 SFMTA(旧金山交通局)罚单支付系统的空子。 他发现罚单编号是可预测的连续序列,输入特定格式,系统就会泄露车辆被处罚的精确位置、时间和原因。更关键的是,旧金山 300 多名停车执法人员的设备,会以每批 100 张的速度同步上传罚单。 于是他写了个爬虫,每隔几秒检验一次数据库里最新的序列号,以极低的 API 请求频率近乎实时抓取每一张新罚单,然后套上苹果地图 API,做成了叫「Find My Parking Cops」的网页应用,这就导致旧金山市民都能在地图上实时看到每位停车警察最后一次开罚单的精确坐标。 除了玩转市政系统后,Walz 还曾将目标对准了 Waymo 的自动驾驶系统。 2025 年 7 月, Walz 摇了 50 个朋友,聚集在一条长长的死胡同里,然后让他们同时掏出手机,疯狂呼叫 Waymo 的无人驾驶出租车。结果由于算法瞬间过载,拥堵不堪的死胡同让 Waymo 的后台调度系统彻底宕机。 后续 Waymo 官方被迫紧急介入,直接禁用了该区域两个街区内的全部叫车服务。每个人付出的代价,仅仅是 5 美元的违约金,就把造价高昂的顶尖自动驾驶技术的系统给整瘫痪了。 而在巴鲁克学院读书期间,他同时还是 NCAA D3 级别越野跑运动员,成绩 28 分 56 秒,还在哈佛教授的气候创新课上用数据可视化分析纽约外卖 App 的配送区域和电动自行车碳排放。只能说,每个爱搞事的天才,精力都旺盛到离谱。 OpenAI 为什么要招安一个「刺头」? 看到这里,你也许会好奇,OpenAI 为什么要招这样一个随时可能捅娄子的「刺头」?这一切,都要从 OpenAI 最近经历的一场内部架构大地震说起。 据连线杂志报道,Walz 此次加入的,是一个名为 OAI Labs 的新部门。这个部门的负责人叫 Joanne Jang。 她之前掌管 OpenAI 的模型行为团队,负责起草《模型规范》(被视为 AI 行为准则),处理模型偏见,还主导过关于「AI 系统是否具有意识」的哲学评估。 Joanne Jang 但这个团队过去两年,没少翻车:GPT-4o 更新后模型过度讨好用户,Sam Altman 公开道歉并紧急回滚;内部安全评估结论也引发争议,口碑一路下滑。 于是 OpenAI 高层果断打散原团队,并入后训练部门。Joanne Jang 临危受命,另起炉灶组建 OAI Labs。这个新实验室的目标正是号称「发明并原型化人与 AI 协作的新型交互界面」。 Joanne Jang 曾经在采访中如此表示: 我非常期待探索能让我们彻底超越聊天范式的模式。我正在重新构想这些 AI 系统,它们应当成为人类的乐器与工具,用于辅助人类思考、创造、娱乐、行动、学习以及建立连接。 简单来说,就是打造下一代更直觉、更自然的 AI 入口,让普通人也能轻松用上 AI。 而 Walz,恰好十分契合这个团队。抛却过去的整活项目,他也曾在旧金山策划过融合 12 家本地商户、千人参与的线下解谜游戏,组织过金门公园的百人快闪行为艺术。OAI Labs 要做「AI 服务于娱乐和连接」,这些经历简直完美契合。 更重要的一点或许是,最懂哪里有漏洞的人,往往最懂怎么做出更流畅、更抗造的交互。把这种人塞进实验室去搞交互架构,就相当于花重金请最强外挂作者来写反作弊系统。 过去几年,整个 AI 行业都在死磕一件事,把模型做得更聪明。ChatGPT 成功了,它让 8 亿人每周都在用 AI,但它的交互方式,一个输入框+一个回复,既是 AI 史上最成功的设计,也可能是最失败的设计。 说它成功,是因为它让普通人第一次触碰到 AI 的魅力,门槛低到几乎为零。 说它失败,是因为 2026 年的今天,我们和 AI 的交互,和 2022 年几乎没有本质区别。8 亿周活用户,每周都在重复打字、等回复、复制、粘贴的循环,枯燥又低效。 OpenAI 之所以招募 Walz,与其说是看中他那些脑洞大开的整活项目,不如说是看中了他骨子里的特质:打破固有框架、让技术变得有趣、可感、可互动的,把复杂的技术变成普通人能参与、能乐在其中的体验。
罗永浩怒怼算命大V!称没了胆也不惯着,网友:踢到钢板了
3月7日消息,今天小雷刷微博的时候被罗永浩的硬气给帅到了。因为他直接怒怼了一个微博算命大V。 这事说起来不算复杂,一个几十万粉丝的算命大V,靠着解读罗永浩的“八字”蹭流量,把老罗的人生轨迹说得头头是道,结果被罗永浩直接点名回怼。 图源:微博 这个算命大V网名叫乌拉拉,在社交平台上有几十万粉丝,靠着一套 “模糊预测+事后圆场” 的套路,收获了不少迷信的粉丝。 而他盯上罗永浩,说白了就是看中了老罗的热度。众所周知罗永浩自带话题BUFF,随便算一卦就能蹭一波流量。 这个大V到底给罗永浩算过些什么? 第一次是去年9月,当时罗永浩早已还清6亿债务,重新开启创业之路,这个大V就翻出老罗的八字分析,说罗永浩早几年应该遭遇重大危机,只是消息爆出来晚了。 小雷实话说,罗永浩早年欠债6亿是公开事实,创业之人压力大更是常态,说两年内可能惹官非,这种模糊的预测,放在任何一个公众人物身上都能蒙对几分。 第二次是今年年初罗永浩现身B站颁奖晚会,领取年度新人奖时,奖杯不小心断成了两半,这事在网上小火了一把,这个算命大V又跳出来补刀。 图源:微博 他说,奖杯断裂是不祥之兆,正好印证了他之前的预测,罗永浩未来两年容易有官非、是非,2026、2027年尤其明显,轻则禁言,重则封号,甚至还有“被伤害”之意,让罗永浩务必谨慎。 但熟悉老罗的人都知道,他年初因为和贾国龙隔空对骂被禁言,这事发生在这个大V预测之前,说白了就是拿已发生的事包装成自己的“预言”,典型的马后炮。 然而真正让罗永浩忍无可忍的,是他做完胆囊切除手术后,这个大V又来蹭热度。 3月5日,罗永浩因为胆结石和胆囊腺肌症,在医院做了胆囊切除手术,第二天发文报平安。结果这个算命大V立马发文,说自己去年就预测罗永浩未来两年有“被伤害”之意,现在老罗切了胆,正好印证了他的预测。 这波操作直接把老罗惹毛了。 3月7日,罗永浩直接发文硬核回怼:“公然宣传封建迷信骗人,‘八字,奇门,风水,命理’,竟然还有几十万粉丝,这种怎么举报?” 图源:微博 而这一怼,也直接把这事推上了热搜,网友们瞬间炸开了锅。 力挺罗永浩的网友占了大多数,网友们表示“老罗干得漂亮”,“两年内谁不会遇到点事?感冒发烧也算被伤害?纯属耍流氓”,还有网友吐槽,“这种封建迷信账号居然有几十万粉丝,平台真该管管了”。 还有部分网友说,“老罗刚做完手术,犯不着跟这种人搭话,不值得”,还有人表示,“拿别人的病痛蹭流量太过分了”。 其实明眼人都能看出来,他的所有“预测”,要么是已经发生的事,要么是很模糊,怎么说都对的套话,没有任何实际依据。这操作,说白了就是利用网友的焦虑和迷信,收割流量罢了。 说到这里,最近罗永浩还分享了自己确诊ADHD的经历。他说自己44岁的时候,在儿科确诊了ADHD,也就是我们常说的“多动症”。 图源:微博 他坦言,这些年能撑下来,全靠体力、经验和时灵时不灵的药物支撑,吃了十几年的专注达,现在吃到最大剂量也没什么效果,体力更是大不如前,连续熬两三天不睡觉,心脏就会明显不适,脑子也无法正常工作。 小雷觉得,罗永浩这段时间确实过得挺难。但即便如此,他该硬刚的时候绝不手软,哪怕刚做完手术,也不惯着这些蹭流量的牛鬼蛇神,这大概就是罗永浩的魅力所在吧。 说到最后,你如何看待社交平台上所谓的算命大V?欢迎在评论区留言讨论。
17e还没开卖 iPhone 18e已敲定
快科技3月7日消息,iPhone 17e将于3月11日正式开启销售。这款新机的起售价定为4499元,而在享受国家补贴政策后,到手价仅需3999元起,进一步降低了入手的门槛。 尽管iPhone 17e还未正式开卖,但关于下一代产品iPhone 18e的消息已经接踵而至。据数码博主爆料,iPhone 18e的产品研发规划已经正式敲定。 按照目前的路线图,iPhone 18e预计将在明年上半年揭开面纱。与今年的发布节奏有所不同,明年上半年苹果会采取双机齐发的策略,同时发布iPhone 18标准版与iPhone 18e两款机型。 对于这款还在路上的新品,不少网友在社交平台的评论区表达了担忧。大家最关心的问题在于,苹果是否会继续在入门级机型上固执地沿用60Hz刷新率的刘海屏设计。 在iPhone 17e发布之际,该机就因屏幕配置引发了巨大的争议。主要原因在于,虽然苹果大方地为其配备了性能极其强悍的A19芯片,但在屏幕这一核心体验上,依然维持了多年前的60Hz刘海屏方案。 这种配置组合让iPhone 17e显得有些格格不入,在如今竞争激烈的手机市场中,它几乎成了同档位唯一一款依然坚持60Hz刷新率的机型,这与安卓阵营全面普及高刷屏的现状形成了鲜明对比。 不少用户吐槽认为,这种过于保守的硬件策略极大地削弱了产品的竞争力。尽管A19芯片的算力冠绝同级,但由于屏幕刷新率和刘海设计的限制,用户很难在日常滑动与视觉交互中感受到实质性的进步。 如果iPhone 18e依然延续这种唯处理器论的硬件组合,可能会面临更严峻的市场考验。毕竟对于当下的消费者而言,一块高素质的全面屏所带来的体验提升,往往比单纯的性能过剩更加直观且实用。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。