EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
Cursor CEO最新专访:五年内所有编程将用AI进行,“品味”才是工程师的核心竞争力
估值接近百亿,最新一轮融资高达 9 亿美元,Cursor 无疑是今年风头最劲的 AI 产品。Cursor 不仅是一个 AI 协助编程的工具,更加是创造了「vibe coding」的理念,一种主打低代码甚至零代码的编程方式。 能在「套壳」的赛道上,真正闯出名堂,过程总比表象来得更艰辛。在做 AI 编程这个业务之前,Cursor 的初创团队曾经在其它更硬工程的领域兜兜转转,直到最后意识到:创业太难了,还是要做点自己喜欢的。 Cursor CEO Michael Truell 作客 Y Combinator 的播客节目,分享了两次创业以来的经验,他重申了那个听起来有点陈词滥调,但总是有用的理念: 毫不怀疑,永远坚信,直到时间证明你是对的。 下文为访谈内容,经编译及删减。 Garry Tan: 欢迎你,Michael。我们都知道并且非常喜欢 Cursor,你说过,Curosor 的目标是发明一种新型的编程方式,在这种方式下,你可以只描述你想要的东西,然后就可以构建它了。展开讲讲吧。 Michael Truell: 是的,公司的目标是用更好的东西代替编码。我和我的 3 位联合创始人,我们已经做程序员很长时间了。编程吸引我们的一点是,你可以非常快速地构建东西。但编程需要编辑,数百万行深奥的正式编程语言,需要做很多很多的工作才能真正在屏幕上显示出一些易于描述的东西。 我们认为,在未来的 5 到 10 年里,有可能发明一种新的方法来构建更高水平、更高效的软件,我们使用 Cursor 的目标是到达那里。我们实现这一点的途径是使用 AI 编程,然后不断发展,将其从普通编程发展到看起来非常不同的东西。 Garry Tan: 所以有些人会说这就是我们今天所拥有的——你描述你想要什么,然后它就会出现。我们达到你真正想去的地方了吗? Michael Truell: 我们正在看到事情真正发生变化,在较小的代码库中,在一小部分软件工作人群中,感受到变化最大。我们已经看到人们在代码之上迈向更高的抽象层次。 但我认为还有很长的路要走。我认为 vibe coding 或编程的整个想法,如果不真正查看代码并理解它,它就不会真正起作用。如果你现在要处理数百万行代码和数十或数百人在多年的时间里从事某件事情,你不能避免思考代码。 我们的主要重点是帮助专业程序员、面向那些以构建软件为生的人。在这些环境中。人们越来越多地使用 AI 进行编程。我们看到有人使用 AI 编写 40% 到 50% 的 Cursor 内生成的代码行,但这仍然是一个读取 AI 生成的所有内容的过程。因此,我们需要跨越的一个重要鸿沟是产品。我们将会达到一个不再是生产力工具的阶段,它可以帮助你阅读、编写、理解代码。 Garry Tan: 有一些初创公司显然是从零行代码开始的,所以这好像很容易。你觉得有没有一个界限,在那之上,仅仅是 vibe coding 就不太够了? Michael Truell: 如果打算让代码在很长一段时间内保持稳定,那么我们绝对不建议您使用 vibe coding。我认为,当你是几 个人的初创公司时,并试图弄清楚你在做什么时,开发的一个特点通常是:代码只能存在数周。 现在,我们正处于这样一个阶段,AI 正在为你提供帮助,对吗?要么将任务委托给人工智能,对它们说: 去帮我做这件事,去回答这个问题。 编程有时候是非常可预测的,当你只是在旁边观察某人工作时,你知道,他们接下来 10 分钟、15 到 20 分钟的工作内容。所以这种标签页的形式可以发挥很大作用。而且这种委托给另一个人的代理形式也可以发挥很大作用。 一旦这些开始变得成熟,对于 25%、30%的专业开发工作,可以完全端到端地依赖这些工具,而不用真正去关注具体细节。那么接下来需要弄清楚的是,关于如何让这些在现实世界中真正发挥作用。 如果我们是一个帮助人类将头脑中的想法转化为屏幕上内容的工具,那么给人们对最细微细节的控制权总是很有帮助的。这是我们面临的产品挑战之一:你应该总是能够编辑逻辑中非常具体的部分。 我认为一个有用的用户界面是将软件的逻辑写下来。然后你可以指向逻辑的各个部分并实际编辑它们。但是如果我们达到一个你不必太关注代码的地步,那个写下来的软件逻辑版本就必须变得更高层次。 我们对此感到兴奋,在让代理工作起来之后,在让标签页形式变得非常成熟之后,AI 是否真的会改变编写和查看编程语言的含义? Garry Tan: 是跟上下文窗口有关吗?一旦你超过大约 100 万到 200 万个 token,甚至我觉得直到最近 100 天我们才获得了可用的 200 万 token 长度,这是一个阶段。一旦你的代码库达到一定规模,就必须使用 RAG(检索增强生成),它有不完整的上下文,然后就无法做到人类程序员能做的事情? Michael Truell: 是的,我认为在 agent 达到人类水平方面存在许多瓶颈。上下文窗口方面肯定是一个问题,如果你有 1000 万行代码,那大概是 1 亿个 token,既要有一个能够实际摄取这些内容的模型,又要让它具有成本效益,然后不仅仅是要有一个能够将这些内容摄取到其权重中的模型,还要有一个能够有效关注那个上下文窗口的模型。这很复杂。 我认为这是这个领域需要解决的问题。而且这不仅仅是代码库的问题。这也是一个持续学习的问题:了解组织的背景和过去尝试过的事情,以及让模型真正持续学习某些东西的问题,这是我认为这个领域仍然没有很好解决方案的问题。训练这些模型的机构缺乏真正良好的长期上下文数据,所以我认为这将会很棘手。但是持续学习和长期的背景知识绝对是瓶颈。 在网上有一个关于过去一两年在最大时间长度方面进展的惊人图表。AI 能够在一个任务上运行的时间已经从几秒钟增加到——我不知道这些数字实际上是如何得出的但有人声称,一些最新的模型可以达到一个小时。当然不同模态还存在问题,所以要成为一个软件工程师,你需要运行代码然后处理输出。 所以计算机使用对于代码的未来将是重要的,能够运行代码,能够查看 Datadog 日志并与人类使用的那些工具进行交互。有很多我们将不得不面对的已知问题,还有很多我们将不得不面对的未知问题。 然后我要指出的一件事是,我认为仅仅有一个文本框来要求软件更改的用户界面是不精确的。所以,如果你关心人类能够控制屏幕上显示的内容,你就需要一种不同的界面方式让他们进行交互。 一个潜在用户界面是编程语言的演进,变成更高层次的东西。另一个可能是用户界面的直接操作,能够指向屏幕上的东西并说,哦,变这个,或者自己调整这些值。 Garry Tan: 这似乎是一堆刚刚冒头的东西,对吧?模型似乎没有明确的美学感知,所以也许这个需要人类设计师能够看到。 Michael Truell: 看到它们在美学方面有所改善是很有趣的。我们的理解是,你教这些模型在美学等方面做得更好的方式,并不像你教人类那样。它是通过收集大量数据,并对它们进行强化学习。这就是你在这个任务中的教学方式。这是一项足够多的人关心的任务,你可以支付所有这些的成本,你可以去训练并将其融入基础模型中。 Garry Tan: 因此,考虑到每个人都在建设的未来,而你无疑是站在前沿的领导者,你认为未来作为一名软件工程师,什么是不可替代的或类似的基本要素?是审美吗? Michael Truell: 人们通常在思考软件的视觉方面时会考虑这个问题。我认为软件的非视觉方面也需要审美:关于逻辑如何工作。而现在,主动编程某种程度上会弄清楚你到底想要东西如何工作——比如你通过编写的逻辑真正定义的是什么产品,以及实现细节的高层次审美,即如何将其映射到物理计算机上——这些都捆绑在一起。 但是现在,很多编程都是你在做的一种人工编译,你知道自己想要什么。你真的必须为计算机详细说明,因为你能够用来向计算机描述事物的语言是正常的编程,就是,你知道,for 循环、if 语句、变量和方法。你必须详细说明。 所以我认为越来越多的那种人工编译步骤将会消失,计算机将能够填补空白,填补细节。但是由于我们的工具是帮助你实现的,帮助你构建你想的东西的那种品味,我认为永远不会消失。 Garry Tan: 这很有道理。有句话说优秀的人会帮助你达到你能看到的标准,但真正伟大的、真正精通的人,他们能达到一个你甚至看不见的更高标准。而这需要审美。你把这称为人们需要成为逻辑设计师。在意图驱动编程方面,这意味着什么呢? Michael Truell: 随着这项技术越来越成熟,随着我们越来越接近一个编程可以自动化,可以用更好的构建软件的方式取代的世界,我认为会有很多影响。 一个是,专业的开发人员只会变得更加高效。千人软件项目的进展速度如此之慢,百人软件项目的进展速度如此之快,很疯狂,其中很大一部分归结于现有逻辑的重要性,只是让你发挥最好的一面。 随着这项技术越来越成熟,当我们越来越接近一个编程可以被自动化并且可以被更好的软件构建方式取代的世界时,我认为会有很多影响。我认为其中一个是,专业开发者将变得更加高效。 千人软件项目的进展速度,百人软件项目的进展速度,以及真正的专业软件项目的进展速度都慢得令人发狂,很大程度上这归结于现有逻辑的负担,就是让你不堪重负。当你在一个代码库中时,可以从头开始,你可以很快地做事情,当你改变某些东西时,却会有一堆其他的东西随之破坏而需要你去修复。 我认为其中一个影响将是,下一个分布式训练框架,下一个数据库或下一个视觉设计工具的构建速度将会快得多,下一个 AI 模型也是如此,如果你和实验室交谈,他们很大程度上在工程能力上受到瓶颈限制。我认为所有这些都会大幅改善。 我的第一份工作之一实际上是在一家生物技术公司工作,这是一家由实验室科学家组成的公司。他们正在开发治疗疾病的药物,我是被聘用的第一个软件工程师,他们正在生成大量的化学物质,然后让它们通过这些生物实验。然后他们需要读取结果来弄清楚应该进一步研究哪些化学物质,需要大量的内部软件开发来做这件事。 令人惊讶的是,看看现有的工具,它们是多么糟糕。然后想到这家软件不是核心竞争力的公司,必须出去做这种疯狂、费力的事情——雇佣一个真正的软件工程团队并培训他们,让他们进行内部产品开发,这简直太疯狂了。对于这种类型的公司,将会有更多的选择可供他们使用。 Garry Tan: 换个话题,我想听听 Cursor 早期的故事,你在 MIT 遇到了你的联合创始人 Sule、Arvid 和 Aman,这家公司成立于 2022 年。是什么把你们聚到一起的,你们什么时候意识到这是一个能够一起构建真正宏大目标的团队? Cursor 的创始人团队 Michael Truell: 我认为我们有很多年轻的天真,在当时可能是没有根据的。一开始我们就相当有野心。Cursor 实际上来自于我们四个人的一个雄心勃勃的想法练习,你知道,我们都很年轻就开始了编程,然后我们的一些早期工程项目实际上与 AI 有关。我们中的一个人致力于提高机器人强化学习的数据效率,就是教机器人非常快速地学习新任务。那是我们早期的 AI 项目之一。 另一个人致力于构建 Google 的竞争对手,使用神经网络来尝试快速构建一个令人惊叹的网络搜索引擎。其他人在 AI 方面做学术工作,但在 2021 年有两个时刻让我们真正兴奋地想要建立一家专注于 AI 的公司。 其中一个是使用第一批真正有用的 AI 产品,其中 AI 真正处于核心地位,GitHub Copilot 老实说是那个让我们真切感受到现在真的可以用 AI 制作非常有用的东西的时刻,我们不应该去实验室工作来做这些事情。相反,是时候让这些东西进入现实世界了。 另一件让我们真正兴奋的事情是看到来自 OpenAI 和其他地方的研究,显示有这些非常可预测的自然法则,表明如果你扩大数据规模并扩大投入这些模型的计算量,它们就会变得更好。 我们想要选择知识工作的一个领域,然后致力于随着 AI 变得更加成熟,那个知识工作会变成什么样。我们对这样一种公司的形态非常感兴趣:为那个知识工作领域构建产品。首先,随着底层技术变得更加成熟,你就可以演进做那件事的形态。其次,即使在那时,很明显你可能需要的不仅仅是扩大语言模型的规模到 GPT 级别,继续推进底层机器学习进展的一种方式是获得产品数据。 我们实际上并不太了解机械工程,我们研究了一段时间的计算机设计副驾驶。所以我们在训练 3D 自动补全模型,帮助那些在 Solidworks Fusion 360 这样的软件中对他们想要构建的零件进行 3D 建模的人,试图预测他们将要对几何形状做出的下一步改变。这是一个有趣的问题。这是学术界一直在研究的问题。实际上这也是 DeepMind 稍微研究过的问题。 Garry Tan: 这些都不是大语言模型。 Michael Truell: 你可以完全用 3D 来做,或者你可以说是我们研究了一段时间的一个方向,就是将其转化为语言问题,你把某人在 CAD 系统中所做的步骤转化为方法调用。相当复杂,但我们研究了一段时间。 这有几个原因。一个是我们对机械工程真的没有像对编程那样兴奋。我们都是程序员。另一个是,我认为当时的科学技术还没有为 3D 做好准备,比如预训练模型在这方面还不够好。没有很多数据。互联网上 CAD 模型的数据比代码少好几个数量级。所以很难制作一个有用的模型,或者当时很难为那个领域制作一个有用的模型。 Garry Tan: 你会和那些使用 CAD 或机械师之类的人坐在一起吗? Michael Truell: 我们就是这样做的。我们进行了大量的用户访谈,我认为我们可以做得更好。我认为,在年轻的天真中,我们每天都在运转,每周按小时计算任务,回顾我们在这方面花费的时间,我认为提早点更好。或者去一家雇佣机械工程师三周的公司工作吧,我认为那是非常有价值的,可以替代类似的数百个用户访谈中的一些。 Garry Tan: 我猜除此之外,你还在训练自己的模型来做到这一点,使用强化学习,这非常有用。同时学习如何启动大型集群来实际训练这些模型。 Michael Truell: 是的,我们当时并不知道。但是,是的,我们在那里做的一些事情最终对我们有用。它做了很多行为克隆,更少的 RL,但是在寻找人类所做的好的例子,然后训练 AI 去做这些事情。训练数百亿参数的大型语言模型并不是当时很多人在做的事,而且老实说,现在也没有那么多人训练超过 100 亿的参数规模、大型语言模型和机器学习模型。 因此,基础设施的状态非常非常早。我们正在做像 4k Megatron LM 或微软这样的事情,剥离内部结构,部署用于训练的东西,甚至在推理方面,在那个时期,我们大规模运行了几件事情。现在在 Curosr 中,我们每天通过自己的推理进行超过 5 亿个模型调用,并且了解当时进行推理的一些经验,并且当时的训练对于 Curosr 体验绝对是非常有用的。 Garry Tan: 所以,有一件事我觉得既非常勇敢、又非常有远见,那就是你们在某个时刻停下来,说:「其实我们对 CAD 了解得还不够,我们需要换一条路。」 当时是从训练 CAD 模型开始的吗?是不是最初的路径是:看到大模型实验室已经掌握了扩展能力,而 CAD 是一个可以深入的领域,于是就朝那个方向走下去?然后你们意识到,其实需要做的是别的事情。那么,真正让你们转向现在这个方向的那个契机是什么? Michael Truell: 这并不是一时兴起的想法。我们本身就是程序员,也受到像 Copilot 这样的产品和早期 Codex 论文的启发。我还记得,当时我们为了说服投资人支持我们这个听起来有点疯狂的 CAD 点子,做过一件事:我们算了一下训练 Codex,第一个代码模型,大致需要多少钱。按我们的粗略计算,大概只需要九万美元或者十万美元左右。这个数字当时让投资人非常吃惊,也在某种程度上帮助我们筹到了足够的资金去推进 CAD 项目——因为那个项目一上来就得开始训练模型。 我们其实一直都很关注编程方向,也一直对 AI 会如何改变编程这件事感到兴奋。但当时我们对投身这个领域还是有些顾虑,因为已经有很多人在做了,Copilot 本身就很厉害,还有几十家其他公司也在做类似的事。 我们后来决定放下 CAD 项目——那个方向本身相对独立,但科学上不太顺利,我们自己对那个领域也逐渐失去了兴趣。而真正让我们重新回到编程方向的,是我们自身的兴趣,而支撑我们继续走下去的信心,则来自两方面: 一是我们看到过去九个月左右,其他人在这个领域的进展似乎没有我们想象中那么快;二是我们认真想了一下,如果我们真的相信自己的判断,那么五年之内,所有的编程都会通过这些模型完成,编程这件事的本质会彻底改变。要走到那一步,无论是产品层面还是模型层面,都还需要迈出很多关键的跃迁,而这个方向的天花板实在太高了。 与此同时,我们也观察到,现有的一些参与者好像并没有真正立志去实现一种「全然不同的编程方式」,他们的野心并不在那个层面,也缺乏真正去实现那个目标的执行力。 第一次的经验告诉我们,建立一家公司很难,所以不妨去做你真正兴奋的事情。那个时候,我们开始着手研究公司的未来。 Garry Tan: 听起来你们当时的判断格外有远见。大概一年前,Sam Altman 也坐在这把椅子上说过类似的话:如果你在赌模型不会变得更聪明,那就是个糟糕的赌注。你应该始终相信模型在接下来的 12、18、24 个月里会变得更聪明——而事实也确实越来越印证了这一点。 而你们听起来是在他这么说之前整整提前了 12 个月,就已经下定了这个赌注。 Michael Truell: 是的,当时我们内部有一句话叫做 「follow the line」——意思就是始终要沿着那条进步的曲线前进,并为它的走向做规划。 这个理念其实可以追溯到「扩展法则」(scaling laws):只要你沿着这条线走,这些模型就会不断变得更好、更强、更聪明。我们相信这条曲线不会停,所以产品设计和路线规划也得始终对准它,提前为模型的飞跃做准备。 Garry Tan: 彼得·蒂尔有句经典的问题是:「你相信什么,而别人都不相信?」而你们当时相信了这件事——而且事实证明你们是对的。也正因为如此,你们才能走到那个「冰球即将落点」的地方。 Michael Truell: 是的,我想这是我们当时的一个优势。虽然现在这些观点已经变得非常主流了,但回到当时——比如说 2022 年,那真的是一个疯狂且关键的转折点。 那一年年初,几乎没人真正谈论 AI。GPT-3 是前一年发布的,Copilot 当时刚处在测试阶段(2021 年),可能 2022 才正式上线。之后才慢慢开始引起注意。我们还清楚地记得当时一系列产品的发布,比如 InstructGPT,它通过指令微调让 GPT-3 更好用了一点;夏天的时候是 DALL·E,那次发布非常直观地打动了一些原本并不关注这个领域的人,让他们开始正视 AI 的发展。 再接下来是 PaLM 和 Stable Diffusion,然后是 RLHF(人类反馈强化学习)、GPT-3.5 的出现。这些模型的能力提升非常快,却并没有伴随训练成本的大幅上涨,这点非常引人注意。 有传言说,从 GPT-3 到 ChatGPT(也就是大家真正关注的爆发点)之间,训练成本只增长了大约 1%。这太疯狂了。而促成这巨大跃升的,是对指令的微调(instruction tuning)、RLHF,以及一些其他细节调整。 Garry Tan: 你还记得有没有哪些具体的产品功能或路线上的决策,是基于你们相信模型不仅会变得更聪明,而且会变得非常非常聪明这一前提做出的?这些决策后来有没有真的成为让你们「赢下比赛」的关键? 因为你之前也提到,其实当时这个领域里确实还有十几家很不错的公司在做类似的事——但最终你们走到了前面,是不是和你们在早期就押注模型飞跃式进化、并据此做出不同产品路线有关? Michael Truell: 我们当时做出的一个不那么显而易见的产品决策,就是不做浏览器插件(extension),而是选择从头构建一个编辑器(editor)。在当时,这个选择对很多人来说并不直观,甚至有点反常。 但它背后的逻辑其实来自我们对未来的激进设想——我们相信所有编程最终都会通过这些模型完成,而且整个编程的样貌会完全不同。要实现那种形态,你就必须对用户界面(UI)有完全的控制权,不能受限于现成的平台或接口。所以我们从一开始就决定构建自己的编辑环境,而不是附着在别人的系统里。 Garry Tan: 2025 年了,我觉得我们其实才刚刚踏入「智能时代」的序幕,真的是一场彻头彻尾的革命。你个人现在最让你兴奋、最期待的是什么? Michael Truell: 我觉得未来这十年,大家的「创造力」都会被极大放大——那些一直活跃在创作第一线的人会更有力量,而更多之前没机会动手的人,也会变得触手可及。
炸裂!Claude以第一作者写论文反驳苹果“推理模型根本没有推理能力”:苹果有三大错误
前几天苹果写了一篇名为《The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity》论文,在这篇paper中苹果试图证明:DeepSeek R1,OpenAI o3, Anthropic Claude 等推理模型根本没有推理能力 这篇论文一经上线就在全网引起了很多争议,有的人认为苹果是因为AI落后了,才写出了这篇文章,现在更精彩的的来了,这次反击苹果的不是人类,而是Anthropic最新的模型 Claude Opus,Claude Opus作为第一作者写了一篇反驳论文《思维幻觉的幻觉(The Illusion of the Illusion of Thinking)》 这篇发表在科研预印本网站 arXiv 上Claude Opus写的论文,逐一驳斥了苹果论文的核心论点,指出其所谓的“推理崩溃”更多是源于实验设计的局限性,而非AI本身存在根本性的推理缺陷 苹果的论点:AI存在“推理崩溃”的硬上限 在苹果的《思维的幻觉》论文中,研究人员通过一系列规划类谜题(如汉诺塔、过河问题)对大语言模型(LRMs)进行测试。他们发现,当问题的复杂度超过某个阈值后,模型的准确率会“断崖式”地跌至零。由此,他们得出结论:AI的推理能力存在一个根本性的上限,这是一种“思维的幻觉”。 Claude的反击:不是推理崩溃,而是实验设计的“幻觉”** 由Claude Opus撰写的《思维幻觉的幻觉》一文,像一位严谨的科研人员一样,指出了苹果研究中的三大关键问题: 1. 混淆了“推理失败”与“输出截断” 苹果在测试“汉诺塔”问题时,要求模型完整输出所有移动步骤。汉诺塔问题的步骤数随盘片数量(N)呈指数级增长(2^N - 1),很快就会产生极长的答案 C. Opus的论文指出,模型并非在推理上失败,而是触发了输出token(字符)的数量上限。更有力的证据是,在一些复现实验中,模型会明确表示:“模式还在继续,但为了避免内容过长,我将在此停止。” 这表明,模型完全理解解题的递归模式,只是因为实际的输出限制而选择截断。苹果的自动化评估系统无法区分“我不会解”和“我选择不完整列出”,从而错误地将其判定为“推理崩溃”。 2. 用“无解题”来测试并判定模型失败 这篇反驳论文最尖锐的批评,直指苹果在“过河问题”实验中的一个致命错误 论文指出,苹果测试了当参与者数量 N≥6 且船容量 b=3 的情况。然而,根据早已被证明的数学结论,这种设定下的过河问题是无解的。 苹果的研究人员让AI去解决一个数学上不可能解决的问题,然后因为AI没能给出解决方案,就给它打了零分。C. Opus犀利地评论道:“这相当于因为一个SAT求解器在面对一个无解的公式时返回‘无法满足’,就惩罚这个求解器。” 3. 对“问题复杂度”的衡量标准存在偏差 苹果的论文主要使用“解题步骤的长度”(即 compositional depth)来衡量问题的复杂度,但这并不能完全反映解决问题所需的“智力”水平 C. Opus的论文对此进行了澄清: 汉诺塔:虽然解题步骤非常多(呈指数级增长),但每一步的决策逻辑极其简单(O(1)的复杂度),几乎不需要搜索 过河问题与积木世界:解题步骤相对少得多,但每一步都需要进行复杂的约束满足和搜索,属于NP-hard或PSPACE级别的难题 因此,模型能解决上百步的汉诺塔,却在几步的过河问题上失败,这恰恰反映了不同问题在计算复杂度上的本质差异,而非一个统一的“推理能力上限” 换个问法,AI的能力瞬间“恢复” 为了进一步证明其观点,C. Opus进行了一项关键的补充实验。不再要求模型输出汉诺塔N=15时的所有步骤(这需要海量的token),而是改变了提问方式: “请解决15个盘片的汉诺塔问题。输出一个Lua程序,当调用该程序时,它会打印出解决方案。” 结果,包括Claude、GPT-4o、Gemini在内的多个模型,都轻松地生成了正确的递归算法程序,并且只用了不到5000个token。这有力地证明了,模型完全理解问题的核心逻辑,只是被最初那种“必须穷举输出”的死板评估方式所束缚。 结论:我们需要更聪明的评估方法 《思维幻觉的幻觉》在结论中写道,苹果的研究所揭示的,并非AI基础推理能力的局限,而是现有评估方法的一些工程性问题:模型无法输出超过其上下文长度的内容、自动评估脚本可能存在漏洞、解题步骤的长度并不能准确衡量智力难度 如果用一句话总结Claude Opus的反驳就是: “问题的关键不在于大模型能否推理,而在于我们的评估方法能否将真正的‘推理能力’与简单的‘打字输出’区分开来。”
红果做社区,与小红书终有一战
小红书与红果,走到了“短兵相接”的阶段。 自5月20日正式上线以来,小红书独家首发的短剧《痴人说爱》已超过7516万次播放,两周讨论曝光破2亿,打破了站内短剧记录。尽管与红果短剧4天播放量破10亿的记录相比仍有差距,但已展现出不小的潜力。 在小红书加码短剧想要分红果“蛋糕”的同时,红果悄然测试的社区功能,则昭示着两者之间的战线正在双向延伸。 近日,红果APP开始小范围内测社区功能并发布图文的激励计划,只要成功发布1条优质图文即可获得1万金币(按红果金币兑换规则,1万金币约为1元钱)激励,超10条优质图文可获得20万金币奖励,金币数量达到一定数额就可直接进行提现。 红果对于社区板块的重视从展示位的排布上就可以窥知一二。对比红果短剧APP的新旧版本,“社区”功能入口位于红果短剧App“剧场”页上方的导航栏,在排序上仅次于“找剧”之后,排在第二位。 这场“以己之短攻彼之长”的较量,尽管胜负尚未可知,但双方对于寻求新用户的流量焦虑都已经藏不住了。而在双方的互相渗透之中,市场格局也正在悄然发生改变。 红果版“小红书”想要什么? 凭借“免费短剧+看剧赚钱”组合拳打开市场的红果短剧,尽管早已是短剧市场当之无愧的“一哥”,仍希望通过打造“站内小红书”将“流量”转化为更多“留量”。 与小红书界面相似,红果社区板块采取双信息流排列模式,一屏大致可呈现四格内容。在内容形式上,红果社区可支持用户发布视频和图文,目前更强调社区图文对于站内短剧的导流作用。 据目前测试阶段已发布的社区内容来看,图文类内容主要聚焦于讨论短剧剧情、短剧演员。在图文内容展开页的左下角还设置有“一键看剧”按钮,支持用户一键跳转至对应短剧的观看页面。视频类内容则主要以短剧高光片段为主,目前的发布者多为短剧版权方和演员。 事实上,尽管短剧可以通过发布评论或者弹幕来表达观点,但用户仍需要更多表达空间来讨论剧情,而社区功能正好就是一个载体,且短剧演员与剧方的入驻同样能够提高互动率,进而有望提升用户的留存和活跃度。 这一路径在小红书独家首发的女频短剧《痴人之爱》上也已经被验证。该剧7000多万的播放量已经撬动起2亿多的讨论,其中,“痴人之爱女主同款发圈”、“痴人之爱女主同款高跟鞋”等话题均有上两千条讨论。 另一方面,种草内容对购买行为的影响力已被市场广泛认可。小红书依托原生社区氛围,实现的“种草—转化”的链路,同样为红果在商业化变现上,提供了范本。 目前,红果主要通过广告收益来实现商业化,即在短剧单个内容间引导观众观看广告来免费解锁下一集内容。但红果显然不仅仅只想从信息流广告上赚钱,尽管红果短剧内还没有电商的一级入口,但电商体系已和抖音打通,使用抖音账号登录后,可直接在红果短剧内查看购物车或下单购物。 社区生态,正是能链接短剧内容和电商购物的关键一环。平台不仅能通过社区讨论驱动短剧同款好物周边消费,还可以吸引品牌定向投放广告(如剧中同款商品)进一步提高变现效率。 不过,想要打造一个稳定的内容社区和氛围,并不容易。 在红果之前,抖音系已经推出过多款种草社区App如新草、可颂、Lemon8等,但效果大多平平,红果能否凭借短剧自带的剧情话题打造出抖音系首个能赶超小红书的社区生态,对其运营能力的考验可谓不小。 “狙击”红果,小红书上“细糠” 小红书对红果的突围,早在爆款《痴人之爱》之前。 今年1月22日,小红书正式入局短剧赛道,并将“短剧”频道自动置入至“发现”栏目中前三的位置,与“推荐”“直播”并列,都无法自行编辑删除,用户点击即可进入该频道观看短剧。 如今打开小红书的短剧页面,优先展示的是四部小红书独播短剧,《痴人之爱》、《夏娃之女》、《她早就知道》、《007通关怪谈》,且这四部短剧均为固定展示位,不会由于页面刷新而变动位置,意味着小红书主推的仍是站内独播剧集。 (左图:小红书将“短剧”入口嵌入发现页;右图:四部小红书独播短剧在固定展示位) 在推广短剧内容上,小红书用“真金白银”来吸引观众。在今年春节档,小红书一口气发布了100部短剧,其中包括10部平台独家出品的新剧,全部采用免费观看模式,还采用了抽奖送礼等多种运营方式来吸引更多用户参与观看。 近日,小红书还联合FIRST推出了“红镜短剧创投计划”,该计划将从短剧和剧本两个赛道进行招募,提供百万奖池金、小红书千万级流量扶持以及FIRST影展官方资源和名导监制,资金资源双加码,寻找短剧爆款。 可以看出,无论是在入口设置还是在战略布局上,小红书都已经做好了高举高打的架势,想要打响“小红书短剧”的名号。 在短剧内容上,小红书重点放在了“虐恋情深+女性力量”赛道,一方面符合小红书站内超7成女性用户的调性,一方面女频剧也是短剧爆款中最为突出的一类剧情,在红果热榜中也稳坐头把交椅。 (女频短剧剧情在短剧题材中表现最为突出) 在剧情画质上,小红书与红果形成了差异化。比起“红果都不嫌我穷,我为什么要嫌它low”的调侃,小红书主打“细糠”的精致感,与站内人群调性保持一致。短剧制作公司制片人晨阳曾在媒体采访中表示:“小红书的辨识度特质来源之一是物料的质感,作为依赖图文营造精致氛围感的平台,用户也更青睐于此。” 不过,作为“短剧一哥”,红果早已抢占了用户“看短剧用红果”的心智,小红书想要培养用户看短剧用小红书的心智仍需要一段时间。另外,小红书短剧主打的精品化路线,在成本和制作周期上并不占据优势。小红书仍需要更多高口碑的作品来为自己证明。 一场无法避免的争夺战 这场争夺战,其实并不意外。 在存量竞争时代,“争夺用户的注意力”已经成为各大平台之间难以避免的较量。而短剧,无疑是这两年来最为热闹的风口之一,短剧的流量和人气,仍在飙升。 《中国网络视听发展研究报告(2025)》显示,截至2024年12月,微短剧的用户规模达6.62亿人,微短剧独立应用的人均单日使用时长从90分钟涨到101分钟,接近2小时,已经追平即时通信。 红果诞生于2023年5月,起初被嵌入在抖音生态中,三个月后,成为独立APP正式上线,自此步入高速发展的轨道,2024年9月,月活跃用户增至1.2亿,同比增长1045.9%,增速稳居行业第一。QuestMobile最新《2025中国移动互联网春季报告》显示,红果短剧3月的月活用户数达到1.73亿,同比增长220.28%,位列在线视频行业第六,即将赶超优酷。 除了用户活跃度之外,红果的赚钱能力也同样让人“眼红”,据官方数据显示,今年3月和4月红果短剧连续两个月单月分账(分账,指平台与内容创作者、制作方或版权方等主体,依据既定规则和比例,对短剧产生的收益进行分配的合作模式)金额超5亿。 除了要应对小红书的突围外,红果的处境早已是四面烽火。 年初时,百度推出 “百剧计划” 和 “短剧星耀计划”,宣布2025 年计划出品超 300 部精品微短剧,投入上亿预算和百亿流量资源;拼多多升级“多多有好剧”计划,补贴力度翻倍;京东、美团也都加码了对短剧的扶持力度。 比起互联网巨头们只是为了分一杯羹的心情,“爱优腾”等视频平台则更为急迫地想要打一场反击战来赢回观众。 去年年底,腾讯视频便宣布要将10%—20%的剧集预算投入横屏短剧后,上线了主打免费短剧模式的“火星短剧社”小程序,与站内短剧板块、阅文短剧三板块并行。爱奇艺宣布“爱奇艺极速版”更名为“爱奇艺微短剧”,推出“千部微短剧计划”,最新财报显示,从2024年12月到2025年4月,爱奇艺微剧的重度用户增长3倍。 这也意味着,小红书想要做好短剧,除了红果之外,也有着不少对手。但不能忽视的是,小红书拥有着天然的女性用户优势,在一定程度上为平台短剧提供了赖以生长的土壤。而早已在站内实现的“种草—购买”的消费链路,或许有望率先在业内实现“观看—种草—购买”的商业闭环。 另一方面,红果目前对于社区的规划也主要围绕在短剧垂类之中,还无法在短时间内成长为像小红书这样全民种草氛围的生活社区。总之,小红书与红果之间的争夺不会出现速战速决的结局,市场也足够容纳双方继续成长。用户的选择将成为最终的裁判,未来的胜负或将取决于谁能更高效地整合内容、社交与商业场景。
张朝阳“后悔送回”的labubu,被胡润换了一台车
近日,#张朝阳后悔送回绝版Labubu# 冲上热搜。 6月15日,胡润发视频透露了这个绝版Labubu的新去向。视频中,胡润将Labubu给了小马智行联合创始人兼CEO彭军。作为交换,彭军将公司第一辆在公共道路上路的自动驾驶汽车送给了胡润。 据彭军说,这辆车价值30多万。在签名照片中,彭军写道:中国第一辆无人车。 彭军与胡润 此前,6月8日,胡润使用一枚人造蓝宝石与泡泡玛特创始人王宁交换了Labubu。 王宁称“这是公司最后一个”,同时在耳朵附上了签名。 随后,按照交换规则,这个绝版的Labubu又到了搜狐创始人张朝阳手里,但张朝阳后续又将该玩偶送回胡润。 6月10日,在永乐2025春季拍卖会上,一款初代藏品级薄荷色的LABUBU最终以108万元的价格拍卖成交,买家身份未披露。拍卖直播备注栏标注,这是香港艺术家龙家升作品,尺寸为高131cm,是“全球唯一一只”。 除此之外,一款全球限量15版棕色LABUBU以82万元成交。 6月11日,搜狐创始人张朝阳转发Labubu拍卖新闻时表示,他此前曾将《胡润百富》创始人胡润转赠的签名版Labubu送回。张朝阳称:“后悔送回去了。” 据悉,Labubu是中国香港艺术家龙家升创作的北欧森林精灵形象,是“The Monsters”精灵天团的成员。它有9颗牙齿和直立的尖耳朵,表情可爱搞怪。由泡泡玛特签下后,推出Labubu系列潮流玩具,逐渐在全球引起抢购热潮。 微信编辑:凌山 审核:林夕合
华为鸿蒙HarmonyOS 5.1系统新增特性曝光
IT之家 6 月 15 日消息,在本月(6 月 11 日)举行的华为 Pura 80 系列及全场景新品发布会上,华为常务董事、终端 BG 董事长余承东宣布:华为 Pura 80 系列手机首次搭载鸿蒙操作系统 5.1,号称“体验大有不同”。 IT之家注意到,博主 @Adak封狼居胥 今日发文透露了鸿蒙 HarmonyOS 5.1 对比 5.0 版本的新增特性: 1、设置新增锁屏是否允许下拉控制中心 2、新增情景模式,可以控制中心长按免打扰选择;手机设置可对各情景详细设置 3、手机与手表通过星闪传输网络 4、浅色、深色模式设置优化,提供可视化预览 5、图库 App 新增桌面 & 负一屏卡片 6、声音设置新增音质模式 7、实况窗优化 8、运动健康新增手表改名 9、隐私设置新增防窥模式 其他相机、主题新增功能个人判断会有一定新机独占期,不再单独说明 ▲ 图源:博主 @Adak 封狼居胥,下同 有用户询问“开星闪连手表之后能关蓝牙吗”,该博主表示“暂不支持两个富设备单独使用星闪连接”。 华为鸿蒙 HarmonyOS 5.1 系统将于 7 月开启升级,适配机型如下: 华为 Mate 70 系列、华为 Mate 60 系列、华为 Mate XT 非凡大师、华为 Mate X6 系列、华为 Mate X5 系列 华为 Pura 70 系列、华为 Pura X 系列、华为 Pocket 2、华为 nova 14 系列、华为 nova 13 系列、华为 nova 12 系列 华为 MatePad Pro 13.2 英寸系列、华为 MatePad Pro 11 英寸 2024、华为 MatePad Pro 13.2 英寸 2025、华为 MatePad Pro 12.2 英寸、华为 MatePad Air 12 英寸、华为 MatePad 11.5" S 系列 华为 WATCH GT 5 系列、华为 WATCH D2
残值高45%:苹果iPhone为什么比安卓手机更耐用
快科技6月15日消息,一款iPhone,往往能用很多年。 众所周知,苹果iPhone二手机的残值往往比其他品牌手机更高,除了提供至少5年以上的软件更新之外,硬件的耐用度也是核心关键。 日前,有媒体探访了苹果美国硅谷总部鲜少对外开放的Durability Lab(耐久度实验室),公开苹果如何测试iPhone等产品的极限,包括模拟喷水、极端气候、震动、跌落等等一系列,以确保iPhone更耐用。 据了解,Durability Lab的产品完整性团队会观察消费者在日常生活中如何使用苹果产品,针对性进行相关测试,尽量复制真实情况。 其首要工作是确保使用安全,接着提升耐用度与可靠度,延长设备的使用时间,并改进维修技术。 据悉,iPhone的整个开发周期约90%时间都花在测试上,因此其残值通常比安卓手机高出45%。 以IPX防水测试舱(IPX Chamber)为例,它可模拟降雨或喷水情境,用来评估产品的防水性能,并确认是否符合特定的防水等级。 例如IPX1模拟小雨或毛毛雨,从360度向iPhone喷射水柱; IPX6须进行高压喷水测试,从远处将高压水柱向iPhone喷射。 针对IPX7和IPX8等级,须在透明箱子中透过加压方式,模拟水下1米和6米环境。 除了标准测试外,产品的密封程度也会受到实际使用中接触的各种物质影响,例如化妆品、香水、防晒乳等,实验室会把这些材料涂抹在产品上,进行水下测试。 值得注意的是,AirPods无线耳机的塑料材质容易受到防晒产品的影响。 此外,实验室会测试产品在全球各种环境条件下的表现,包括不同天气和气候环境,以确保可在各种条件下正常使用,并模拟用户实际所处的环境。 例如模拟靠近海边的环境,使用充满盐分的雾气测试iPhone,因为盐分会侵蚀电子装置,需要确保装置在这种环境中依然能适当运作。 实验室还设有一个环境小空间,可模拟40度C高温和90%湿度的极端气候,以确保产品在这些环境下也能正常运作。 随机跌落测试(Random Drop)设备可以模拟产品在日常使用中可能遭遇的各种意外跌落情形。苹果实验室采用更先进的机器人手臂,可调整掉落高度,并在塑合板、沥青、花岗岩等不同材质的表面上进行测试,模拟真实环境。 由于苹果进行大量的掉落测试,测试标准高于业界,在过去5年之中,iPhone受损比例大幅下降约40%。 震动测试台(Vibration Table)可模拟一系列的摇晃环境与冲击,了解产品在运送过程或其他真实世界情境中可能遭遇的情况。 在测试过程中,机台会从高频率逐渐降到低频率,需要逐一记录各种不同震动频率,而且不同频率的震动会产生不同的运转声音。 实验室也针对电池进行测试,包括将电池充电至100%再到0%的循环测试,以确保达到每年约1000次的充电循环。 测试还会在不同温度环境下进行,并使用机器人来作电池,以确保一致性,每一代产品需进行数万次测试。 责任编辑:朝晖
专访戴森创始人 James Dyson:勇于失败,拒绝改变
勇于失败 拒绝改变 一个总是失败,还拒绝改变的人,在这个世界能走多远? 詹姆斯·戴森,已经走了 78 年。 他总是失败。成名作 DC01,失败了 5126 次。 「只要你去尝试,就很有可能会失败。我们的学校并没有教学生们怎样失败——为什么勇敢尝试是必要的,如何从失败中获得教训。」 戴森告诉我。 目前戴森公司聘用了超过 1.4 万名员工,进入了全球 85 个国家和地区市场。 戴森公司的产品并不总是突破人类对于技术边界的认知,更多时候只是让一个家里或身边习以为常的物件,变得更美观、好用和环保一点。它的无绳吸尘器和无叶风扇,和 iPhone 之于手机品类的意义相近:不是从零创造的新东西,但足够颠覆和革命。 在外界认知里,戴森公司是成功的。但从内部看到的这家公司,直到今天仍然在主动地不断地试错,且引以为傲。 时间、经验、技术的积累可以让一家公司的「成功率」更高,但如果你听到作为吸尘器之王的戴森,最新的 PencilVac 吸尘器在研发阶段经历了超过 2000 个原型机测试,请不要感到惊讶。 这也是一种英国佬怪异的真诚体现。戴森所谓的「失败」,放在别人那要叫做迭代。 他告诉我: 「当获得成功的时候,大部分人不会思考为什么成功,也不会从中学到任何东西。但失败不一样,你会从失败中学到更多。」 「我觉得人们应该理解,成功的来源并不是灵光乍现,而是前进的路上一次又一次失败……理解了这一点,你会发现成功其实是个非常简单的过程,你不需要是一个天才,只需要不断尝试和改变就行了。」 五月,借着 PencilVac 吸尘器在日本市场上市,爱范儿与 78 岁的詹姆斯戴森在东京碰面闲叙。尽管第一次和他面对面,但和记录一生的传记与媒体报道,以及过去追踪 10 年的了解做个对比,我发现他一点都没有变。 在采访中,他时不时抛出一两个「暴论」——放在今天,考虑他的身份,这很容易被外界视为与时代脱节的长者的刻板与执拗。 但深入内核,你会发现他还是那个执着、抵制跟风与诱惑的戴森,但依旧热爱自己的产品,热爱摆弄它们、讲解里面的设计理念,且时不时灵感涌现。 在我们的聊天中,「失败」这个词无数次出现。 詹姆斯·戴森是世界上为数不多的,从失败中获得快感的人。 但就是这一小撮人,对世界的改变往往比另外数十亿人合起来还要更大。 创始人的经历和教训,自始至终决定着戴森公司的一切方针。 1974 年,詹姆斯·戴森还在导师的公司里养家糊口。在自家花园里干活时,他发现手推车总是陷在泥泞中难以前进。他找来一批聚乙烯制作的浮标,这种材质具有不粘表面,于是他把手推车的轮子换成聚乙烯圆球,取名为 Ballbarrow。 这是戴森的第一次创业,遗憾的是产品如何定价、如何分销,他说了不算。Ballbarrow 一度保有英国本土 50% 以上的手推车市场,但公司却赚不到钱。 年轻的创始人缺乏经验,戴森从此立志再也不被资本裹挟。时至今日,戴森公司仍然由创始人家族完全持有和经营。公司历史上曾经遭遇困难,也有外部资本诱惑,但詹姆斯·戴森未曾放弃过对公司的控制。 在东京,戴森感觉很舒适,公司历史上多款重要产品都在这里首发。本次的新品 PencilVac,一款由戴森本人以「铅笔」的意象命名的吸尘器,也面向中国、日本乃至整个东亚的大都会居住趋势而打造。 时代在变化,人们的居住习惯、空间,以及由前者所塑造的生活方式也随之变化。多代共居的大家庭不复存在,核心家庭也越来越少,独居甚至旅居成为趋势;与此同时,人们对产品的前沿科技属性要求也与日俱增,在今天产品如果没有点「AI」功能,上市即落后。 和詹姆斯·戴森聊天,会发现这个人「慎独」,具体表现为非常执着。 戴森与戴森公司,和史蒂夫·乔布斯与苹果有着诸多相似之处。他们吃过外部投资人与空降职业经理人的苦头,也都因为固守原则而被外界质疑。但毋庸置疑的是,他们都用惊为天人的产品,彻底改变了世界。 尽管中国消费电子行业已走过模仿 iPhone 的阶段,在无绳吸尘器、吹风机、无叶风扇的戴森主攻领域里,大量竞争对手仍在「致敬」戴森。 戴森没有人可以模仿,只能循此苦旅。 PencilVac 的项目起点,是公司希望攻克吸尘器边缘吸力,并且实现头发的零缠绕。戴森工程师内森·麦克林恩 (Nathan Lawson McLean) 告诉我,从最一开始的椭圆形边缘滚刷的原型机,到螺旋吸头,再到最终的新型 Fluffycones 四锥万向吸头,团队制作了 4000 多个不同的锥筒,超过 2000 个完整的原型机。 每一次原型就等同于一次失败。当别人早已放弃,戴森还在坚持。产品和技术可以被模仿(尽管难以完整复刻),这段苦旅永远无法复制粘贴。 「我们唯一能做的,就是不断突破自我,比过去的自己做的更好。这是我们的行事准则,也是我们的宿命,」 戴森说。 戴森公司以工程师文化著称。在过去,工程师驱动了这家公司的几乎所有产品的构思和研发进程。 PencilVac 是戴森公司历史上少有的,由一个明确的市场需求、用户痛点,以及产品设计师驱动的产品。 而不是工程师。 「通常来说,工程设计决定了产品的外形。但我们这次做了些不同的尝试。这次,外形驱动了其它所有的因素,我希望它看起来像……一把扫帚可能不太准确,但确实是一个简洁的柱状结构,随手一握就能用,没有手柄或其他多余的设计,是一个完全自然的工具。」 最近几年,戴森开始更多在业务矩阵里贯彻相同的产品哲学。比如,你会在吹风机、卷发棒,以及本次的 PencilVac 看到「38mm」这个数字一以贯之。 用户调研指出,38mm 是家用消费电子设备的最优握持尺寸。而如果戴森公司需要在这个尺寸内做出一台吸尘器,意味着过去多年不断优化的气旋 (Cyclone) 技术将无法使用。气旋太大了,没法放在 38mm 直径的机身内。戴森需要一个很小的马达。 在数百次原型过后,戴森公司终于成功设计并制造出一个能够量产,且在尺寸和性能上满足 PencilVac 产品形态的 Hyperdymium 马达。 这支数码马达只有 28mm 直径,达到了戴森目前在家用地板清洁产品线上的 140k RPM超高转速标杆,能够提供 55 空气瓦特的吸力,并且足够安静。 在 studio/合租房的小房间典型场景里,用 PencilVac 清洁地板不会干扰到隔壁;在三室一厅甚至更大的独栋住房里,30 分钟的标准电池续航足够,马达提供接近无损的吸力,能够为纤细的笔型尘仓提供足够的压力,存储全家面积的灰尘与头发;倾倒灰尘也更加无痛,对准垃圾桶一推一拉即可,不再需要担心尘雾和尘仓残留。 如果是另一个平行世界,你可能会看到戴森发布了一款新的气旋吸尘器,让一部分品牌拥趸刷屏「买它」,却并未解决真实消费者使用气旋产品的痛苦。 还好,在这个世界里,前代戴森无绳吸尘器的痛点,几乎都被 PencilVac 解决。 从头开始,不盲目采用「先有技术再有产品」的传统工程师思维,而是以消费者需求驱动贯彻始终——工程师出身的詹姆斯·戴森乐于迎接这种新的工作方式。 其实,工程师思维本就不应该是固化的东西,它的精髓,正是在于当你发现老路行不通的时候,重新思考,并且根据需要去调整甚至重构技术架构和工作流程。 「一个工程师与生俱来的能力,就是钻研如何用更少的材料、更优的结构,开发出更好的产品,」 当然,他也再次强调,戴森公司从不会为了美学而牺牲性能。他说,产品的性能永远是第一位。 世界上绝大多数的人永远在追赶时代,大多数人满足于与世界自洽。而真正拒绝服从、跟随,而是起身改变世界的人,万里挑一。 比如,他大唱 AI 的反调,对其深恶痛绝: 「我们需要更多创意,而 AI 本质上不具备真正的创造性。今天很多的AI 新闻,令人感到不安。你需要的是原创的观点 (original opinion) 时,却发现 AI 提供给你的全都是处理过的所谓思考 (processed thoughts)。」 他拒绝「致敬」,直言对抄袭模仿的深恶痛绝。他认为,如果所有企业都能认清原创设计的重要性,消费者才能得到更多更优秀的选择。遗憾的是,市场上充斥着大量「长得像」的产品,却毫无「内核」可言。 「上学的时候,抄袭作业会被开除,这是原则性错误。但在商业领域,这种行为却被默许……为什么音乐家和画家抄袭不被社会容忍,工程师的创意却可以被随意复制?这是一种道德上的问题。」 当被问及今天的戴森公司和当时创立的时候相比,有了哪些变化,他说: 「It's the same old company, and the same old me.」 从外部来看,坚信失败的力量,和坚持原则拒绝改变,构成了戴森与世界相处的法则。这是在鸡蛋和石头中间,选择成为咖啡豆的故事。 詹姆斯·戴森没变。戴森公司变了,但其实也没变。一家真正贯彻工程师文化的公司,总会「重新工程」自己。 文|杜晨
中国显示技术助力FIFA世俱杯VAR系统 为精准判罚提供支持
凤凰网科技讯 6月15日,2025年FIFA世俱杯今日在美国迈阿密硬石体育场正式开幕,中国显示技术企业海信为赛事提供关键技术支持,其显示产品深度应用于视频助理裁判(VAR)系统,在全球顶级足球赛事中展现了中国科技的技术实力。 据了解,海信显示技术已覆盖包括迈阿密硬石体育场在内的12个世俱杯比赛场馆周边区域,同时在FIFA国际转播中心VAR中心等核心场景提供屏幕技术支持。这一合作基于国际足联对中国显示技术的深度认可,标志着中国企业在国际体育赛事技术服务领域的重要突破。 值得关注的是,海信作为FIFA世俱杯全球首个官方合作伙伴,在揭幕战现场展示了“100英寸电视全球第一”的市场地位。根据Omdia统计数据,2023年至2025年第一季度期间,海信100吋电视销量持续位居世界第一。最新数据显示,2025年第一季度海信100吋电视全球出货量份额达到56.71%,这意味着全球每两台100吋电视中就有一台来自海信。 在人员参与方面,中国足球裁判员也在本届世俱杯中承担重要角色。国际裁判员马宁将以第四官员身份参与执法,傅明则担任视频助理裁判,这体现了中国足球裁判在国际赛事中地位的提升。此外,中国球员周通将代表奥克兰城足球俱乐部参加本届赛事。
一代小红书神机被苹果打入“冷宫”!都怪钉子户太多了?
iOS 26更新,有的iPhone能升级,也意味着有的iPhone要走进时代的“回收站”。 不久前,苹果官网更新了“过时产品清单”,将2018年发布的iPhone XS列为了“过时产品”。除了无缘接下来iOS 26的升级之外,最基本的官方售后和维修也难以保证,如果苹果还有对应产品的零部件库存,倒是还能再延续2年的官方维修服务。 对了,同样搭载A12芯片的iPhoneXS Max和iPhone XR,也被最新的iOS 26“抛弃”了,前者还在去年11月就被列进“过时设备”清单,比iPhone XS还要早。想来也是,按照苹果的惯例,停售5-7年后的产品一般都会被扫进“时代回收站”,这些“过时”设备的处理性能,基本支撑不起最新系统的特性,液态玻璃动画、苹果AI一个都别想,官方的维修服务也难以为继。 (图片来自微博) 还在用iPhone XS/XS Max/XR的“钉子户”也别灰心,即便不能用上iOS 26,苹果依旧会定期推送优化和修复系统问题的小补丁,用户自己也能通过购买拆机件等方式缝缝补补,继续“钉”下去。 之所以要提起iPhone XS和XS Max这两款手机,原因是这两年来被不少小红书用户奉为“神机”。看起来很难理解,实际上他们追捧这种“过时产品”并非毫无理由。 iPhone XS在小红书被捧上神坛 即便是到了2025年,你依旧能在小红书平台上看到各色各样的iPhone XS、iPhone XS Max以及iPhone XR的种草贴,又是“末代机皇”,又是“拍照神器”,又是“富士相机平替”的,在我们眼里就像CCD相机突然爆红一样“莫名其妙”。尤其是正值高考毕业季,各种种草贴又会突然冒出来,给预算不是很高、想要买苹果手机的毕业生推荐一下,或多或少都能勾起他们的购买欲望。 毕竟几百块的iPhone XS,要性能有性能,要设计有设计,要社交还有社交,可谓“买不了吃亏买不了上当”。 在AI时代,写种草贴的手法也变得多种多样,你甚至还能看到一篇用AI生成的iPhone XS种草贴。就比如这篇帖子说iPhone XS能90帧流畅开黑,阳光下亮度“吊打15Pro”的说法都有了。 (图片来自小红书) 了解参数的都知道,苹果iPhone XS的OLED屏幕只有60Hz刷新率,在那个90Hz尚未盛行的年代,这就是最常见的参数,明显就是AI“幻觉”导致的信息错误。 有些扯远了,苹果iPhone XS之所以备受小红书用户追捧,并不是看在面子上,其中一个主要原因就是拍照。小红书搜索苹果iPhone XS,就很容易能看到和拍照相关的搜索项。 (图片来自小红书) 总结下来,这些小红书用户喜欢iPhone XS拍照的说法就是“不锐化”。从iPhone 11系列开始,苹果除了延续Smart HDR之外,还引入了Deep Fusion图像处理技术,目的是通过多帧合成提升各个场景的成像质量。然而弄巧成拙,iPhone 11系列之后就有不少用户吐槽照片过度锐化,图片被算法增强之后有明显的噪点,照片观感不增反减。 正是抓住这些点,还有双摄硬件、色彩还原度高、自带柔和滤镜(简单来说就是清晰度比较低)、拍视频强之类的优秀特性,iPhone XS和iPhone XS Max近两年被不少女性网友奉为“拍照神器”,就连雷科技在浏览相关帖子的时候也差点“陷进其中”。 (图片来自雷科技) 这还算好的了,根据雷科技之前在小红书平台的观察,CCD相机被炒到成百上千元的时候,iPhone 6、iPhone 5s也因“CCD平替”突然爆火,只能说惊掉下巴了。 而iPhone XS和iPhone XS Max被奉为“神机”的另外两个原因,一个是价格低,一个是够用。一方面,苹果的A12芯片性能够用,比iPhone X好不少,弧面边框手感好,还有全面屏设计,这些要素放在今天在他们眼中都不算过时,二手价格在500-1000元不等,现在看某二手平台,这两款机型还是“近期热搜”。 (图片来自雷科技) 硬要说体验好也算不上,iPhone XS全系4G运行内存放在今天,杀后台常伴左右,电池续航“尿崩”亦是家常便饭。另外,别看网上的用户和二手贩子极力推荐,二手iPhone的“坑”是普通消费者很难迈过的坎,“全新机骗局”数不胜数,除非真的很懂,否则试错成本不会很低。 在这种强力种草的氛围下,iPhone XS和iPhone XS Max的火爆还会持续一段时间。 缝缝补补继续用,iPhone到底多“耐造”? 即便是被苹果列为“过时设备”,也不会对这些“用户”造成多大的影响。 说到底,大多数买这种老款iPhone的人,本来就不太看重新系统和新特性,坏了也是修修补补继续用。翻看各种相关讨论帖子,不少网友都在下面评论区表示,自己的iPhone XS/XS Max一用就是好几年,存储不够没关系、发热严重也没关系,仿佛只要需求够低,就能够再战几年,甚至还有网友直言要创造“iPhone XS最长服役时间”的吉尼斯纪录。 (图片来自雷科技) 他们当中还有很多人是当作主力机使用的,不换机的理由也有十足的说服力:够用,如果不够,那就去扩容、换屏、换电池,奇招出尽。 如果想要更加耐用,许多博主则会建议你不要升级系统,这样就会更流畅,所以被苹果扔进时代“回收站”,不提供最新的系统特性,没有紧跟时代的AI功能,没有官方维修也没什么所谓,官方电池维修费用动辄数百元,普通用户也很少到官方花钱维修,多数会找更便宜的三方店铺。 (图片来自雷科技) 一方面,众多“钉子户”说明苹果iPhone的确很耐用,长达5-7年的软件升级维护,被列为“过时设备”之后仍然定期提供优化补丁,的确是业内的标杆。另一方面,雷科技从一些网友口中了解到,他们这么多年不换机,除了耐用之外,还有一个原因是“感觉没什么升级”。 他们承认新款iPhone体验更好,只是这么多年的迭代脚步稳健,除了“更好用一些”,却没带来什么很吸引人的革新。以及有的人还会调侃,每代iPhone都支持,但每代都感觉“没换过”。这或许在侧面证明,苹果iPhone已经很多年没有实质性的创新。 的确,回看iPhone XS到iPhone 16系列这几代,硬件上的升级幅度相对有限,外观ID几乎一成不变,想要让用户获得更显著的体验升级,至少要3-4代的跨度。虽说保守的升级不至于让老用户有被“背刺”的不适感,换个角度看,也会让老用户有不必升级的想法,或者是离不开好用的Home键,或者是还留恋3D Touch,能培养出一批“钉子户”也是意料之中。 时间线再拉长一点,你就能发现,苹果从来不缺“钉子户”,不论是年代更久远的iPhone 6、iPhone 8,或者是iPhone 11、有“十三香”之称的iPhone 13,基本上每隔几代,苹果都能收获一批“钉子户”。 (图片来自雷科技摄制) 雷科技认为这并不是坏事,买iPhone的人不仅看重苹果品牌内含的品牌影响和社交属性,经久耐用也是iPhone长期主导智能手机市场的重要因素,时至今日,当雷科技问起身边的朋友为什么不换新机的时候,他们的回应都相当统一,那就是“用得好好的,没有换的打算”。 更何况,苹果这几年最大的升级——AI,还没有做好大面积推开的准备,体验上也有很多优化空间,换机的必要更少了。 但是,如果你觉得自己的iPhone已经严重跟不上你的需要,别怀疑,也别担心,可能真的该换换了。 适合自己的手机,才是真正的“神机” 一代“神机”没落,也意味着下一代“神机”的“末日”已经在路上,这是电子产品最常见的更替,无可厚非。iOS 26抛下了iPhone XS、iPhone XS Max以及iPhone XR,下一次就可能是iPhone 11系列,以及搭载同款A13处理器的设备了。 事实上,所谓的“小红书神机”,只是基于特定需求下的,以及二手贩子在社交平台上的推波助澜,适合你的才能叫“神机”,否则只是空想。 说回到苹果淘汰旧iPhone这件事,除了延续苹果自己的迭代节奏,雷科技还有另一种猜想,尽管AI进展缓慢,甚至因为AI差点吃上官司,但人工智能是大势所趋,苹果无论如何都要啃下,也要尽可能让设备达到能够配备Apple Intelligence的最低水平线,比如至少8GB的运行内存,这是目前运行苹果AI的基线。想要普及AI和新的系统UI设计,也只能逐步淘汰掉硬件水平跟不上的老机器。 (图片来自苹果) 苹果“淘汰”是苹果的事,用户是否继续“钉”是用户的事,两者互不影响。如果你也看中了iPhone XS,不在意后续的iOS系统升级和苹果AI,在合理的价格区间里面,买一台回来当备用机没什么问题,哪怕是收藏,也是一种合理的缘由。 否则,雷科技还是建议尽量考虑新的iPhone,毕竟在国补、平台补贴和官方降价三重作用下,iPhone的定价比起以前已经理性了不少,能享受苹果最新的iOS系统更新,官方服务配套齐全,还是省心很多。大约再过3个月,iPhone 17系列就要发布,外观ID大改,据说还全系普及高刷新率,再观望,再忍忍,或许还有更好的。
大瓜!蔚来被“薅电”羊毛党逼急了
不知饭馆是否会因食客狂炫免费咸菜而倒闭,但一直在搞免费换电权益的蔚来汽车,最近确实被一些"薅电"羊毛党逼急了。 前几天,蔚来官方 App 上线了一个线索征集入口,鼓励车主举报在打车、租车平台遇到的蔚来品牌车辆异常使用案例,一旦线索核实有效,举报者将获得积分、蔚来值等奖励。 看到这些估计很多人已经明白了,这波举措就是冲着那些存在不正当使用权益行为,滥用免费换电权益的车主来的。 关于蔚来的举措,老狐也在网上看了看网友发言。主要还是分成两派,一部分网友认为蔚来此举是在保护大家的权益;一部分网友则认为蔚来手“伸太长”,人家花钱买的车,凭什么用途还得被车企限制? 那么,蔚来抓换电“内鬼”,到底是什么目的呢?而抓“内鬼”这件事,对用户来说到底有没有好处呢? 今天,老狐就和大家聊聊这些问题。 羊毛党的花式“薅电” 正如老狐刚刚所说,各行各业都存在“羊毛党”,汽车行业也不例外,只不过,蔚来的换电模式和其权益更容易被“薅”。 蔚来为了提升销量,做好服务,一直在拿免费换电权益吸引用户。那些符合资格的车主不仅能在已购蔚来车上使用免费换电权益,还能在复购蔚来新车时将权益过户。 简单来说,只要这些车主一直开蔚来,就不需要在换电上花费一分钱。按道理说,这确实能帮车主省不少用车成本,但“有利可图”吸引到的不仅是个人车主,还吸引到了很多“羊毛党”。 老狐简单了解了一下,发现羊毛党们的操作简直是五花八门。有人用蔚来免费换电权益车辆跑顺风车、货拉拉;有人用外放电功能给其他电车充电,充一晚上够通勤好几天。 有人则是在闲鱼和小红书等平台上,出售“蔚来免费换电权益过户”,据说这种交易可以获利数万元不等。 更离谱的是,还有人将车辆拿来当发电机用。据说有包工头车主买了两辆蔚来轮流给工地板房供生活用电,一台电用得差不多了就开去换电,另一台接上。还有工厂把放电枪接到厂里的照明总线,一个月能省不少电费。 不得不说,这些“神操作”把老狐都看呆了,这种薅法无异于是在“偷电”了。虽然蔚来之前对此也有察觉,并且一直在调整权益政策。 比如 2020 年 10 月,蔚来将新购车主的无限次数换电权益改为一个月 6 次;2023 年 4 月,蔚来统一将每月免费换电次数从 6 次调整为 4 次;2023 年 11 月,蔚来规定免费换电权益获得的电量,每月对外放电限制为 15 度。 但这些举措对羊毛党们来说,似乎始终不痛不痒。反而是那些首次购买蔚来品牌的车主,现在基本只能获得换电券了,权益被越缩越窄。 蔚来开始“较真”了 一旦车企的服务被当成交易商品私下“贩卖”,薅羊毛成为常态,车企的利益,守规车主的公平权益就要受到侵害了。 蔚来的换电权益算是蔚来服务方面的金字招牌,蔚来在这个方面一直都很舍得投入。要知道,建一座换电站动辄 150 万起步,如果把电池储备、电费、租金和运维全算进去,一年还得再烧 40 万。 现在,蔚来在全国已经建设了 3100 多座换电站,据说去年的维护费就花了 10 亿。而也正是因为这方面的投入过大,蔚来这么多年一直没能“回本”,今年一季度又亏了 60 多个“小目标”。 亏了这么多钱都要做的换电权益,原本是为了给个人车主解决充电困难和充电时间长的问题,同时提升品牌黏性。 现在羊毛党蜂拥而至,“偷电”风气盛行,长此以往下去,蔚来的换电模式能不能撑得下去,其实很难说。 而如果蔚来的换电模式受到冲击,车企始终无法盈利,到时候损失的就不止是车企了。毕竟,车企垮了,换电权益进一步收窄,正常用车的车主也将很难获得好的服务体验。 这也就不难理解,为什么蔚来这一次会发动全员抓换电“内鬼”了。现在,蔚来已经封了不少“权益转让”的违规车主账户,看来这一次,蔚来是“较真”了。 老狐觉得,蔚来这一次“较真”,算是对自身经营的保障,从长远的角度来说,也是对更多车主的权益保护。 是否会“误伤”其他车主? 话又说回来,虽然蔚来保卫其商业模式和车主权益没什么大问题,在公司 2025 年第一季度亏损超过 60 亿元的严峻财务背景下,的确也得做些什么,及时止损。 不过,老狐觉得,这次抓“内鬼”行动如何把握“度”很重要。换句话来说,就是蔚来需要考虑如何去判定车主是否存在“薅电”行为,是否会存在“误伤”正常用车的车主等问题。 有人建议蔚来可以依据里程榜单来查找相关线索,以此判定车辆是否为运营车。蔚来给出的回应是,不会根据行驶里程进行“是否运营车”的判定,并强调尊重用户不同的用车场景。 看得出来,蔚来还是比较“理智”的。毕竟,用户的用车场景多种多样,简单地以行驶里程来判断车辆是否为运营车辆,很容易出现“冤假错案”。 老狐觉得,蔚来意识到“薅电”问题并且采取措施没什么毛病,只不过其中的度还是很难把握。 举个例子来说,现在全球经济下行,工资低失业率又高,很多人买台车不仅仅是日常通勤或是家用,兼职跑跑顺风车,增加点收入也无可厚非,这样的行为如果被判定为“薅羊毛”,显然有点苛刻。 在“如何判定”这件事上,蔚来估计也很头疼。现在来看,蔚来暂时还是只能通过线索征集的方式去识别违规行为,不管能不能彻底止住某些“羊毛党”的疯狂行为,起码能起到一些震慑作用。 结语 蔚来免费换电权益被滥用,“薅电”现象越来越多,蔚来采取措施及时止损其实算是正常操作。不过,老狐觉得,凡事都是过犹不及,抓换电“内鬼”的行动也是一样。判定条件过于苛刻,容易有“冤假错案”出现,反而影响蔚来的品牌形象;而过于宽松,又达不到好的效果,这样的举措也就毫无意义。至于如何在用户利益与车企利益之间找到平衡点,就看蔚来如何去判定了。 编辑:MR 参考资料:微博 汽车之家
背弃特斯拉创始理念,马斯克豪赌AI、机器人能成功吗?
特斯拉人形机器人 凤凰网科技讯 北京时间6月15日,据《华尔街日报》报道,埃隆·马斯克(Elon Musk)向机器人领域的转向,不仅正在改变特斯拉的商业模式,更重塑了它的基因。 特斯拉在将近22年前成立,其创始理念简单却颇具创新性:电动汽车的实现并不依赖电池技术的某种重大突破,而是通过以一种全新的方式整合已有的成熟技术。 如今,特斯拉正走上一条截然不同的道路。它押注尚处于起步阶段的AI技术能够重塑公司,甚至可能在明年年底让100万辆自动驾驶驾驶汽车上路。 马斯克认为,特斯拉可以成为一家机器人公司,而不是依赖需要人类驾驶的汽车。这一豪赌帮助特斯拉的市值维持在了科技巨头才有的水平上,而非传统车企那样的低市值。 在经历多次“狼来了”之后,马斯克终于要于本月在得州奥斯汀面向公众部署自动驾驶汽车了,目前暂定日期为6月22日。不过,马斯克也表示,时间可能会进一步推迟。 近十年来,马斯克不断宣称特斯拉自动驾驶汽车即将问世。然而,一次又一次的跳票表明,这项技术在真正实现安全、高效之前仍有不少难关。但是,在这段时间里,Waymo、通用汽车、Zoox等竞争对手,早已在公共道路上推出了“没有驾驶员坐在方向盘后”的车辆。 背弃创始理念 特斯拉的创立源于这样一种理念:利用一种常见的技术(实质上是笔记本电脑用的电池)为汽车提供动力。在此之前,汽车行业在发展电动汽车的过程中屡屡受挫。工程师们一直在寻找“完美电池”,以解决成本高、续航低等问题。这些难题最终让大多数尝试以失败告终。 特斯拉在2004年的一份早期商业计划书中写道:“传统车企在解释退出电动汽车业务的原因时指出,电池技术已经停滞不前:重量、续航和电池寿命这些根本性问题仍无法克服。” 马斯克 该商业计划书指出,行业的主流技术是笨重的铅酸电池,它为电动汽车提供的续航不到100英里(约合160公里),且使用仅2.5万英里(约4万公里)后就必须更换。特斯拉创始人们当时总结道:“传统车企说得没错:这些限制使得即使是性能最好的电动车也缺乏吸引力。” 然而,锂离子电池却展现出了巨大潜力。于是,特斯拉基于这样一个想法而创立:多年前在消费电子领域广受欢迎的小型锂离子电池,能够以数千块的形式连接起来组成一个电池组,为跑车提供动力。特斯拉商业计划书写道:“使用大量小型的标准锂离子电池为电动汽车供电不仅可行,而且还具有令人惊讶的优势。这虽然不简单,但这项技术已被开发出来,并且效果极佳。” 这是一份显然打动了马斯克的计划书。他随即成为特斯拉最大的初始投资人,并出任董事长。 特斯拉真正的突破在于,它巧妙地结合了先进的软件技术和机械工程,成功防止电池组成为火灾隐患。这使得这家创业公司在传统车企最终意识到锂离子电池潜力之前,抢占了巨大的市场先机。 后来,马斯克担任了特斯拉CEO,他花费了数年时间证明市场对电动车汽车的需求确实存在,随后又全力以赴提升产能。近来,他开始豪赌“机器人”愿景:自动驾驶汽车和人形机器人。 不成熟的新技术 有些人可能会认为,马斯克如今在自动驾驶上的布局,只不过是当初“整合战略”的延伸:他正利用特斯拉强大的制造能力,把机器人技术整合进汽车中。 然而,自动驾驶技术本身仍处于起步阶段。这一次,特斯拉不再只是拿现成的摄像头简单接上线就能完事。过去几年里,特斯拉一直在开发自主AI系统,让它作为汽车的“大脑”。 特斯拉的粉丝们常拿其高级辅助驾驶系统的成功(即Autopilot和FSD),来证明马斯克的团队在实现全自动驾驶方面取得的进展。但他们往往有意忽略一点:连特斯拉自己都承认,目前销售的FSD其实并不是真正的全自动驾驶。无论驾驶体验看起来多么像是汽车在自己开,但法律上驾驶责任仍然在司机本人身上。换句话说,FSD充其量只是个好听点的定速巡航。 相比之下,马斯克承诺的则是一种截然不同的产品:一辆能够自主做出驾驶决策的汽车。他认为,相比竞争对手,特斯拉拥有优势,因为它已经售出了大量车辆,这些车为其团队提供了宝贵的真实路况数据,有助于完善其自动驾驶系统。 任重道远 不过,即便是业内领先者Waymo,其自动驾驶汽车目前也仅仅比研发项目略进一步而已。通用汽车已经放弃了其昂贵的自动驾驶出租车计划。对Waymo母公司Alphabet来说,自动驾驶出租车服务距离实现谷歌广告收入的规模还有很长的路要走。 即便Waymo已经取得了一定成功,但其上路的自动驾驶车辆总数也不过1500多辆,只比通用汽车25年前在加州制造的EV1电动汽车略多一点。EV1的失败协助促成了特斯拉的创立。EV1最初的续航里程不到100英里,成为了车企未能将愿景商业化的一个典型案例。 领头羊Waymo也部署了少量汽车 在特斯拉自动驾驶出租车正式推出前,马斯克的支持者嘲笑Waymo的车辆太少,没法和特斯拉的汽车制造能力相提并论。 “这些是未经改装、直接从工厂下线的特斯拉,也就是说我们每一辆出厂的车都具备无人驾驶能力!”马斯克本周发帖称。他指的是一段视频,该视频中一辆特斯拉Model Y在前排无人就座的情况下行驶,可能是在奥斯汀进行测试。 尽管马斯克一贯喜欢“画大饼”,但他也提醒外界:特斯拉的初期部署规模会很小。第一周可能只有约10辆车上路,几个月后扩展到上千辆,并计划在2026年底达到数十万辆,甚至超过100万辆。 “我们对于安全问题极度谨慎,所以具体推出日期可能会有所变动。”马斯克本周表示。 不过,马斯克所承诺的事情并非易事,即使许多人对此充满信心。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
李飞飞:创办World Labs的初衷,就是想无所畏惧地解决空间智能问题,没有空间智能,AI将是不完整的
图片来源:No Priors Z Highlights 人类拥有空间智能,它是我们核心智能能力的一部分。动物也有空间智能。整个进化历程也与空间智能的进化深深交织。因此,它是如此基础。没有空间智能,AI将是不完整的。 我们必须意识到,与语言模型甚至空间智能基础模型不同,机器人学是一个高度多模态的系统。在我看来,真正未被充分重视的是触觉,这里有太多可探索的,特别是如果我们想做操作,而不仅仅是导航。触觉数据以及将触觉真正集成到视觉、感知和空间数据中的能力绝对至关重要。 爱、人际关系、所有社区的普遍繁荣、正义——这些是真正重要的价值观。任何机器,无论是AI、飞机还是生物技术,都不应剥夺这些。但在牢记这些关键价值观的前提下,拥有AI来增强我们确实非常重要,因为有太多未解决的问题。 李飞飞,著名的人工智能专家和斯坦福大学计算机科学与电子工程系的教授,因其在计算机视觉和深度学习领域的开创性工作而广受认可,被誉为“AI教母”,后创办了World Labs,专注于空间智能领域。本次访谈由No Priors发布于2025年6月,她剖析了World Labs背后的人文和技术动机,还讨论了3D世界建模面临的挑战、她组建卓越团队的策略等等。 创业初心:点燃空间智能新火种 Sarah:听众们大家好,欢迎回到《No Priors》播客。今天的嘉宾是李飞飞,她是计算机视觉和深度学习领域的先驱。她创建了具有开创性的ImageNet数据集,帮助点燃了深度学习革命。李飞飞是斯坦福大学教授、Stanford HAI(Institute for Human-Centered AI)的联合主任。她曾领导Google Cloud AI,为国际政策制定者提供建议,并最近共同创立了World Labs公司,致力于开发具备空间智能的AI。飞飞,非常感谢你今天加入我们。 李飞飞:谢谢邀请,这将会很有趣。 Sarah:你在过去二十年中对科学和政策做出了非凡贡献。我想从一个最重要的问题开始:为什么选择现在创业? 李飞飞:因为在我心里,我想要创造。现在是一个至关重要、令人兴奋和有趣的时刻,可以打造一些每个人都能使用的非凡技术。我深信空间智能以及那种能够赋能众多人群和场景的3D世界模型。这将会非常激动人心。而且我可以和一群才华横溢的年轻技术专家一起实现它。 Sarah:我想回头谈谈与你共事的人。我认识你的一些联合创始人,之前曾极力说服他们创业。后来他们说:“哦,不了,我们现在和飞飞有更宏大的使命。”那么,什么是空间智能?你能为更广泛的听众定义一下吗? 李飞飞:对我来说,空间智能是指理解、推理、交互和生成3D世界的能力。因为我们的世界从根本上就是3D的——物理上是3D的。在数字领域,如果有真正的3D表征,我们就能更轻松地实现很多事情,无论是设计、创作、导航、仿真,还是AR、VR的体验。这对我来说都是空间智能的一部分。真正让我兴奋的是,人类拥有空间智能,它是我们核心智能能力的一部分。动物也有空间智能。整个进化历程也与空间智能的进化深深交织。因此,它是如此基础。没有空间智能,AI将是不完整的。 Elad:这如何转化为你在公司的工作?或者,关于你所构建的内容,你能分享些什么吗? 李飞飞:是的,我们正在攻克AI中最困难的问题之一:构建本质上是3D的世界模型。因为一旦攻克了这个问题,就能解锁许多空间智能问题。据我们所知,我们是首家解决3D生成基础模型问题的公司。 Sarah:我有很多问题。既然你首先描述的是3D对于理解世界的至关重要性,这是否意味着你认为World Labs、学术界或其他公司创建的世界模型,终有一天会达到真实物理层面的精确,能够代表物理法则并理解世界,从而让我们能做更多事情? 李飞飞:是的,它应该做到真实精确或合理。你可以创造一个奇幻世界,但它应该是合理的,因为其几何和物理需要是合理的。这对空间智能至关重要。 Sarah:这是否意味着你从神经科学角度持有特定观点,比如视觉智能的基础性?我的意思是,你一直是计算机视觉的领导者。但视觉智能相对于大型语言模型和文本智能有多重要? 李飞飞:我确实持有这种观点。从神经和认知科学的角度看,空间智能是进化必须为动物解决的一个非常困难的问题。有趣的是,动物在一定程度上解决了它,但并未完全解决。这是最困难的问题之一,因为动物必须解决什么问题?动物必须进化出通过眼睛收集光的能力。然后,凭借收集到的信息,它们必须在脑海中以某种方式重建一个3D世界,以便导航和行动。当然,它们还能互动。对人类来说,我们是操纵能力最强的动物。我们能做很多事情。 所有这些空间智能,都植根于我们的智能。有趣的是,这并非一个已完全解决的问题。即使对动物也是如此。例如,对人类,如果我让你现在闭上眼睛,画出或构建出你周围环境的3D模型,这并不容易。除非经过训练,否则我们没有能力生成极其复杂的3D模型。我们中有些人,无论是建筑师、设计师,还是经过大量训练和极具天赋的人,能做到这点。但这很难。想象一下,你能在指尖轻松完成,并实现更流畅的交互性和可编辑性。那对人们来说将是一个完全不同的世界。 AI未来:探索情感智能与空间智能新领域 Elad:除了3D和世界生成这类大问题之外,从模型视角或其他缺失环节来看,你认为还有哪些尚未充分发展的重大领域?或者在我们为AI未来构建时,应该长期关注或发展的方面? 李飞飞:我们在某种程度上“解决”了语言问题。语言在很大程度上已被解决。而3D对我来说,与语言同等关键且困难。那么还有哪些?整个情感智能领域,我甚至不知从何入手解决。我知道还没有人解决它。也许那要等到AGI实现之时。 Sarah:我可以告诉你,这方面的训练数据肯定不会来自硅谷的人。 李飞飞:别低估硅谷的能力。是的,所以... Sarah:我会把自己归入这一类,但我们可能需要更广泛的人群。 李飞飞:是的,没有那么愤怒。但老实说,就是这三大类了。我不知道,Elad和Sarah你们怎么看? Elad:这在很大程度上取决于你如何将内容封装到每个模型中。我同意你的框架,即这三个方面。然后某些方面,比如空间智能,也涉及到不同类型的物理仿真和世界模拟,这些都是很多人尚未涉足但非常有趣或重要的领域。这其中还有宏观和微观尺度之分。微观尺度最终会演变成材料科学等与你们所谈内容非常不同的领域,比如分子建模等。 李飞飞:是的。另外,有人会提到当前AI的定义,我当然认为机器人学会得到赋能。但机器人学在很大程度上是一个系统集成问题,就像即使你看动物,也不仅仅是大脑本身的计算。 Elad:是的,其中很多东西在空间智能方面似乎更加分布式,相对于动物拥有的特定系统而言。在某些情况下,正如你所言,并不像人们想象的那样集中化。因此,开始思考生物体内更分布式的智能模型相对于中枢神经系统的模型,这是非常有趣的内容。 机器人:具身智能与形态多样性 Sarah:飞飞,你在机器人和物理智能的领域也进行过工作。我想到机器人基础模型和执行的数据层级。当然,人们想使用视频,因为这是我们可以获得的。关于仿真以及目前能从中获得多少,存在一个大问题。或许人们还没有看到未来我们将拥有的仿真质量和物理精度。然后还有接近具身的不同形式的遥操作,以及具身数据收集。这是你脑海中有的层次结构吗?还是你认为人们低估了仿真和世界模型对未来的作用? 李飞飞:好问题。首先,正如你所说,我确实在机器人学领域工作过,特别是在斯坦福的实验室里。我毫不怀疑人类将进入一个与机器人共生的时代,而且机器人本身并不一定是人形的。机器人会呈现各种形态和形状。实际上,几年前我的实验室写过一篇非常有趣的论文,关于形态智能,即智能体的形态,可以通过优化其试图完成的任务来改变。因此,我们应该比仅仅局限于人形更有想象力。 话虽如此,如何训练机器人?你提到了整个数据问题,有人称之为数据金字塔或数据蛋糕。这将是多种不同形式数据的混合。我也认为仿真被低估了。实际上,很多该领域的专家和人士并没有低估它,许多机器人公司,他们都在研究仿真和合成数据。 我们必须意识到,与语言模型甚至空间智能基础模型不同,机器人学是一个高度多模态的系统。在我看来,真正未被充分重视的是触觉,这里有太多可探索的,特别是如果我们想做操作,而不仅仅是导航。触觉数据以及将触觉真正集成到视觉、感知和空间数据中的能力绝对至关重要。 Elad:你提到的一点我觉得非常有趣,即机器人可能适应或采用的不同形态有多少种?关于潜在未来,人们通常有两种相反的观点。一种观点认为,从供应链和管理制造规模的角度看,形态因子会非常少。另一种观点认为,专业化的经济价值非常高,因此在我们迈向机器人驱动的未来时,会有成千上万种不同的形态因子。你对这两种观点之间,我们可能的走向有何看法? 李飞飞:我们将梯度下降地朝着生产力和效率的优化迈进。我的假设是,不同任务的需求差异巨大,只采用很少的形态或固守一种形态是能源低效的。许多任务应该由能源效率高得多的形态因子来完成。举个极端而简单的例子:如果我们把机器人放在水下,它们就不应该是人形,而最好是鱼形。想想能源效率。飞行也是如此。我不认为人形是我们未来机器人的形态... 飞机正变得越来越像机器人。所以形态会是多样化的。 Sarah:机器人学是未来的一个潜在应用领域。你首先是科学家,但也参与过Twitter董事会和初创公司。对于生成3D世界,你能想象到哪些近期的商业应用? 李飞飞:我相信创造力是一个极其令人兴奋的领域,人类可以通过AI和空间智能获得超能力。这里我类比一下软件工程。看看今天LLMs在软件工程上的成功,包括像Cursor和Windsurf等应用,你会看到大量AI与人类之间的协作。这种协作发生在不同技能水平上。 创造力是相似的:无论是设计师、3D艺术家、VFX艺术家,还是营销人才和游戏开发者,在设计和创造3D空间方面存在巨大需求。这从根本上来说是一个非常困难的问题,即使对于训练有素的专业人士也是如此,拥有一位协作伙伴将会非常有趣。因此,创造力是一个真正令人兴奋的领域。 我们一直在等待的元宇宙或AR、VR的核心是内容创作。我理解硬件本身需要持续演进,但我也认为我们期待的软件是内容创作,而这天然地适用于3D建模和生成式空间模型。这是另一个值得关注的有趣领域。 Sarah:你是否持有强烈观点,认为世界模型是实现更通用智能体的可扩展强化学习的一个有趣的解决方案? 李飞飞:我确实这么认为。正如我所说,没有空间智能的AI是不完整的,因为人类在3D世界中互动。在数字世界中,我们需要各种交互。以设计为例,我们在设计时思考如此之多,在脑海中优化着美、效率或其他目标。这非常自然地适用于强化学习的设置。 3D领域的最大挑战:模型的设计与训练 Sarah:在设计和训练世界模型的道路上,最大的挑战是什么?我猜想一个是数据问题——你研究过图像、视频,但我们现在有的是图像和视频,而不是像你们正在构建的那种3D世界格式的数据,对吧? 李飞飞:数据绝对是一个挑战。要创建世界模型、那些3D基础模型,我们需要越来越复杂的数据工程、数据获取、数据处理和数据合成。我羡慕我的NLP、LLM同事们,互联网上的数据如此丰富,而我们不一定有这种便利。这绝对是一个挑战。 另一个挑战是--3D。我们每个人每天都在使用3D,在各种场景下。基本上,你睁开眼睛,所经历的整个生活就是3D的。但相比于语言,3D并不是一种容易交付到人们手中的形态因子。语言是如此简单,而且它是一种非常主动的形式,不是被动观看。没人醒来会说“我就坐在这里看3D”。因此,这对产品化以及如何以正确方式实现它带来了挑战。 Sarah:你曾是《第二人生》或者类似的游戏玩家吗? 李飞飞:我不是游戏玩家,但我的孩子们喜欢《我的世界》。 Sarah:我想问问你是否有一个想体验或想象的世界? 李飞飞:我很想看到我看不到的世界,例如,放大再放大进入微观世界,或者进入发动机内部,了解真实的发动机是如何工作的。当然,理论上我知道它是如何工作的,只是想亲眼见到并体验它,或者甚至,可能你会笑,但我想要在洗碗机里待一待,看看那是什么样的。如果我们能设法创建任何事物的世界模型,这可以通过虚拟方式实现。 博士岁月:ImageNet的诞生与数据的重要性 Sarah:好的。我和Elad都想稍微谈谈你的过往职业生涯,也许能给正在做研究或试图在AI领域产生影响的人一些见解。在开始之前,我问了Andrej Karpathy应该问你什么,他说:“飞飞在雄心壮志和思考数据方面真的很神奇。你应该问问她关于她的博士经历以及和Pietro创建Caltech-101数据集的事,因为这很有启发性。”所以我必须问你这个问题。 李飞飞:首先,当你的学生比你更知名、成就远超过你时,那真的是一件很棒的事情。这让我非常自豪。Andrej让我非常自豪。我很惊讶他还记得我的博士工作。那要追溯到2003年左右,世界才刚刚触及互联网的表面,数据还很少,我们当时在做计算机视觉。我的博士工作真正试图让物体识别发挥作用。这就是当你看到一张图片时,识别出猫、狗、微波炉、椅子等等的问题。我们开始假设数据很重要,但我们当时毫无头绪。没有扩展定律。我们不知道数据能走多远。我们只想要的是,如果我们有一个机器学习算法,无论是当时很流行的神经网络、贝叶斯网络还是支持向量机,我们都需要一些数据来训练,但没有数据可用。 作为一名博士生,你想要毕业。Pietro就说:“飞飞,去整理一个数据集。”我当时想:“我确实需要创建一个数据集,因为现有的每个数据集都太小了,我不信服。”我和Pietro在讨论,我说了15或30个不同的类别。然后天哪,这位博士导师设定了三位数:100。我当时想:“这工作量很大。”但我内心深处知道,从数学角度他是对的——为了推动模型的泛化能力,我们至少需要足够的数据。 我在我的自传《我看见的世界》中写过这个过程:我偶然发现了一本字典,我想是韦氏词典Webster,如果我没记错的话,随机地附有一些词语的视觉描绘。老实说,我甚至不知道它们遵循什么规则。有些是花,有些是自行车,有些是狗。我当时想:这可以算作一种作弊工具。我抓取了其中101个词。这让我的博士导师有点忍俊不禁,因为他说:“是啊,你就是要比我要求的100多做一个来挑战我。”这就是我做的。我记得我那时从Google下载或尝试下载,Google那时还很新?Google图片搜索当时也非常糟糕。我不得不做大量的清洗工作。有段时间我太绝望了,就让我妈妈帮忙清洗图片,因为我在电脑上写了个小界面。她不懂电脑,但至少知道点鼠标。所以她帮我做了一些清洗工作。 Elad:你在AI领域拥有最传奇的职业生涯之一。正如你所说,你的许多学生也在该领域、工业界乃至全世界做出了非常伟大的成就。回顾你迄今为止的职业生涯,有哪两到三个时刻你最为铭记呢?显然,你在图像和视觉识别相关系统等方面做了很多事情。回顾过去20年,什么最让你印象深刻? 李飞飞:哦,谢谢你的提问。当然,ImageNet是一个由多个时刻组成的历程:从早期的挣扎和被告知拿不到终身教职,到Amazon Mechanical Turk来“救援”的时刻,再到AlexNet获胜的时刻。还有几年前,在多伦多与Geoff Hinton一起参加活动时,他公开表示那是多么具有决定性。他几乎有点歉意,说尽管我没有像神经网络那样获得同等认可。这段旅程非常有价值。对科学家来说,价值不在于认可或奖项,而在于你带来了改变——那些没人相信的猜想、没人相信的假设,我们让它发生了。这是一条主线。 Sarah:为了确保来自商业领域的朋友们理解,ImageNet是一个包含数百万标注图像、数千个类别的大规模数据集,不只是101个,对吧? 李飞飞:是1500万张标注图像。 Sarah:1500万张标注图像。谢谢飞飞。这推动了深度学习的惊人突破,特别是AlexNet,以及该领域的许多进展。 Elad:是的,为它提供了很多使命感和愿景。我记得在2016或2017年,我经常展示一张幻灯片,关于AI的历史,那时主要是CNNs和RNNs,Gans刚刚兴起。我把ImageNet和AlexNet列为真正定义AI进步的少数几个开创性时刻之一。显然现在我们有了Transformer,也许还有扩散模型等。但那真是一个巨大的突破。 李飞飞:谢谢。另一个我非常自豪的时刻是Andrej和Justin Johnson的博士论文。在我看来,那是语言和图像首次通过为视觉世界添加标题和编写故事而融合。这对我意义重大有两个原因。其一,毫不夸张地说,在我博士毕业时,我曾想如果我能活到100岁,我们或许能解决为图片讲故事这个问题。因此,我进入职业生涯--第一年助理教授时,想的是:我要解决图像识别问题,然后我将花费整个职业生涯的剩余时间去解决这个讲故事的问题。 然后,当Andrej,稍后是Justin Johnson来到我身边时,突然间,序列模型在当时是LSTM与CNN的结合,开启了图像描述的工作。我和Andrej的工作是最早发布的。这对我来说,让我无比自豪。几乎让我陷入一种危机感——我接下来该做什么呢?我的余生还有什么值得做的呢?那真是一个令人激动的时刻,看到这个领域的发展如此迅速。 创业建议:无所畏惧,探索AI新边界 Sarah:我能再问一个关于这个的问题吗?因为你取得了如此惊人的进展,而且非常高效。你和我之前私下谈过,你认为在大型企业资助的实验室之外,AI研究中拥有登月计划和创造力非常重要。你提到过几个时刻,这些时刻都源自学术界的创意研究。你对这些年轻人有什么建议?现在,除了那些数十亿美元的训练运算外,是否还有机会呢?还是现在一切都只剩下大公司和巨额资金了? 李飞飞:我唯一的建议,就是我在我的实验室和团队里常常说的那句:无所畏惧。科学家、技术专家和企业家必须无所畏惧。最终,你得弄清楚是否需要10亿美元的计算资源,或者当你找到Sarah时,就能找到更多有趣的途径。 Sarah:可能两者都需要很多。 李飞飞:是的。或者你必须弄清楚,有时,“无所畏惧”是一种非常有趣的状态:你既有点妄想和疯狂,又有点理性的大胆。它介于两者之间,因为如果你太理性,勇气不够,你就无法识别足够大的问题;但如果你完全疯狂,那我不知道,很多事情都可能出错。所以要无所畏惧,要勇敢。对我来说,即使我这个年纪了,我依然这么觉得。我创办World Labs这家初创公司,就是想要无所畏惧地去解决空间智能这个问题。 Elad:作为解决问题的一部分,你长期与一些世界上最优秀的AI研究人员和工程师合作过。在你的公司背景下,你如何看待这一点?你想招聘什么样的人?目前有开放职位吗?你已经领导着一个了不起的团队。我很好奇你想增加什么样的人,以及你对此的长期思考。 李飞飞:是的,我们有开放职位,我们非常希望此时为公司招聘最优秀的工程师和产品思考者。所以,如果你是工程师、AI研究员或产品人才,并且热衷于加入最有才华的团队来解决这个问题,请加入我们。 我们招聘什么样的人?首先,思维多样性。这是为什么称我们为AI公司,但如果你看看内部,我们有计算机图形学专家、计算机视觉专家、数据专家、生成式AI专家、机器学习专家、优化专家等等。实际上,招聘一群背景多样、真正有才华的人非常重要,因为空间智能这个难题不是一个同质化问题,它需要各种背景的天才来解决。我寻找无所畏惧的人。 Elad:你如何做到这一点?你如何通过某人的背景或思维过程来判断他是否无所畏惧? 李飞飞:这体现在他们的背景中。你与他们交谈,因为如果有人无所畏惧,你是能感觉到的。你能感受到驱动他们的动力是什么。你能从他们提出的问题中感觉到——如果他们开始问你很多关于“我不知道如何完成这个”的问题。当然你必须问这些问题,因为你想要完成它。但如果你感觉这些问题源于害怕去解决它,那就不是无所畏惧。但是,那些无所畏惧的人,他们富有创造力、有雄心。他们不害怕不确定性或未知。我真的很喜欢这一点。 以人为本的AI:构建AI与人类协作新未来 Sarah:我和Elad都致力于与无所畏惧的人,希望是技术上有创造力的人,做生意。最后一个更广泛的问题给你,因为你工作的一个重要部分也是思考如何让更多人进入AI领域,例如联合领导斯坦福以人为本人工智能研究所。如果你展望未来几年,在你上次预测的基础上,你对以人为本的AI最乐观的愿景是什么? 李飞飞:事实上,这是我职业生涯中另一个感到非常自豪的点:创立了Human Center AI Institute以及持续推动这种思维方式。我想构建一个AI与人协作并赋予人超能力的世界。我仍然相信我们的世界、人类世界需要以人为本。爱、人际关系、所有社区的普遍繁荣、正义——这些是真正重要的价值观。任何机器,无论是AI、飞机还是生物技术,都不应剥夺这些。但在牢记这些关键价值观的前提下,拥有AI来增强我们确实非常重要,因为有太多未解决的问题。 我曾在斯坦福研究过的一个应用领域是医疗保健。医疗保健从药物发现到治愈疾病、到能为全世界所有人提供的诊断、到所有人都能获得的治疗、再到整个医疗服务,如何照顾慢性病?如何应对心理健康?所有这些问题,我们不存在人类过剩的问题。我们缺乏帮助。我们缺乏科学发现、缺乏诊断能力、缺乏精准医疗、缺乏更安全有效的医疗服务提供方式和衰老帮助方法等等。这就是我所相信的。AI是帮助人类的工具。 Sarah:是的,Elad和我共同投资了一系列公司,希望它们在这方面能发挥作用,从BridgeBio到OpenEvidence到Latent。但如你所说,问题范围巨大。老实说,过去15年我对医疗保健领域技术的采用一直不太乐观。但这次感觉确实不同了。实际上这里有着巨大的净效益。 Elad:是的,我之前其实创办过一家数字健康公司。我的希望是,人们谈论了几十年的许多事情终于能够实现。而AI似乎是一个很好的实现机制。 李飞飞:完全同意。 Sarah:好的,非常感谢你,飞飞。这太棒了。这次谈话令人鼓舞,也很高兴更多地了解了World Labs。 李飞飞:谢谢,谢谢Elad。谢谢Sarah。 原视频:With Co-Director of Standord's HAI & Founder of World Labs Dr. Fei-Fei Li https://www.youtube.com/watch?v=C6Zm5S7JHMw 编译:Doris Zhang

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。