行业分类:
加载中...
头条分类:
加载中...
彭博:AI质疑声笼罩英伟达股价低迷,爆炸性业绩恐于事无补
英伟达芯片 凤凰网科技讯 北京时间2月23日,据彭博社报道,多年来,英伟达公司一直是推动股市屡创新高的关键力量。但随着市场对AI的质疑声渐起,华尔街越来越担心,无论这家芯片巨头本周公布的财报结果如何,其股价都可能承压下行。 英伟达股价数月来一直在横盘震荡,自去年第四季度初至今仅微涨1.7%,略逊于同期标普500指数3.3%的涨幅。今年以来,该股勉强维持了增长,在标普500成分股表现中排名处于后半段。对于这家不久前还在该指数中领跑、年涨幅曾达三位数的企业而言,这样的表现可谓明显回落。 “从基本面来看,英伟达的表现依然强劲,问题在于市场情绪是否也能继续保持高涨,”西北互助财富管理公司首席股票投资组合经理马特·斯图基(Matt Stucky)表示,“围绕这轮AI行情的焦虑情绪正在多个不同领域持续升温。” 风险叠加 英伟达近期表现不佳,很大程度上是因为投资者对于各大企业投入数千亿美元研发AI的担忧加剧,开始从巨型科技股中撤资。不过,股市还面临诸多外部风险,这些风险同样困扰着英伟达的股价表现。 地缘政治局势紧张,特朗普政府威胁要攻击伊朗。上周五公布的数据显示,美国经济增长放缓而通胀依然顽固。劳动力市场在经历了2025年的疲软后似乎趋于稳定,这使得交易员们押注美联储将对进一步降息持谨慎态度。此外,美国最高法院刚刚驳回了特朗普的关税政策,这被认为对美国公司有利,但随着白宫考虑如何处理这一裁决并维护特朗普标志性的经济政策,这也带来了另一层不确定性。 英伟达股价开年疲软 所有这些因素都让即将于周三发布第四季度及全年财报的英伟达处境微妙。投资者期望其业绩能远超华尔街预期,并提高未来几个季度的展望。但英伟达无论做什么或说什么,可能都难以推动股价大幅上涨。英伟达股价在其最近两份季报公布后均出现下跌。 “这将是一次重要的财报发布,但我认为英伟达股价可能会因财报而下跌,因为表现可能不够好。从我们掌握的信息来看,盈利和预测应该还行,但可能达不到市场的预期。”Wayve资本管理公司首席策略师里斯·威廉姆斯(Rhys Williams)表示。 科技巨头表现都不行 陷入这种困境的并非只有英伟达。作为过去几年股市上涨的最大贡献者,“科技七巨头”数月来也一直停滞不前。彭博一个追踪这些公司的指数自第四季度初以来已下跌近1%,表现逊于同期标普500指数。 大型科技公司喜忧参半的财报加剧了市场对AI的谨慎情绪,华尔街尤其关注其庞大的AI相关资本支出。例如,微软公司在公布强劲的整体业绩后,股价依然下跌,原因是投资者聚焦于其Azure云计算业务增长的放缓以及创纪录的支出预期。 话虽如此,英伟达股价徘徊不前也有其积极的一面:其市值已大幅回落。目前,英伟达预期市盈率低于24倍,接近五年来的最低水平,远低于过去五年大约38倍的平均值。如果投资者对财报结果感到满意,并能从CEO黄仁勋(Jensen Huang)那里听到令人鼓舞的言论,那么相对低廉的股价可能会成为买入的催化剂。 “英伟达在某种程度上一直是市场的救世主。人们希望英伟达能拿出一份出色的财报,让市场稍微平静一些。”MFA Wealth首席股票策略师威尔·麦克马洪(Will McMahon)表示。 然而,即便股价上涨,由于华尔街整体上对AI以及英伟达的业绩表现仍持怀疑态度,该公司的市盈率也很有可能保持平稳。 如果财报结果未能安抚投资者的紧张情绪,这可能会给AI相关股票乃至更广泛的市场带来更多波动。 “如果英伟达打个喷嚏,所有人都会感冒。”Equity Armor Investments CEO卢克·拉赫巴里(Luke Rahbari)表示。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
奥特曼:训练一个人需要20年+1000亿人进化,训练AI更划算
OpenAI的CEO奥特曼这两天在印度刚刚参加完AI论坛,又来到了《印度快报》举办的Express Ada系列谈话活动中,接受了一场长达60分钟的访谈。 这场对话涵盖了从AI发展速度、大厂竞争、AI就业,甚至还包括奥特曼本人私生活的一些碎碎念。 AGI(通用人工智能)和ASI(超级人工智能)一直是AI行业最具争议的话题,不少人认为,AGI至少还需要几十年才能实现,ASI更是遥不可及。 但在此次对谈中,奥特曼却表示,AGI已经相当接近,ASI也不是那么遥远,他说“技术发展的速度,比我最初预想的更快”。 奥特曼解释道,六年前,大多数人都无法想象AI能自主完成新的研究、编写复杂的计算机程序,更无法想象AI能在数学、物理学等领域推动人类知识的边界。 他认为,当前的AI已经具备了一定的通用性“一个能充当AI医生、律师、计算机科学家,能完成各种复杂知识工作的系统,其实已经相当接近通用智能了。我们只是习惯了现有的技术,才会觉得AGI还很遥远”。 同时奥特曼也警告称,“鉴于当前技术加速发展的趋势,我认为超级智能的到来,会比很多人预想的更快,这也是我们必须重视AI安全的原因”。 可奥特曼认为AGI和ASI的到来并非全是好事,他补充到,“我们必须提前做好安全防护,确保技术不会被滥用,同时让权力广泛分布,避免单一主体掌控超级智能”。 除此之外,访谈还聊到太空建造数据中心的事情,许多人将其视为解决AI算力需求的未来方案。谷歌,以及奥特曼的死对头之一的马斯克,都在部署自己的太空数据中心。 但奥特曼对此毫不客气地表示:“老实说,我认为在当前形势下把数据中心放在太空的想法是荒谬的。” 他的理由非常实际,通过粗略的数学计算,发射成本相对于地球上的电力成本,根本不划算。而且太空中GPU坏了还没法修理。 奥特曼承认,总有一天太空数据中心会有意义,但“轨道数据中心不是这十年会大规模重要的东西”。 奥特曼强调,世界上不应该有任何单一的ASI,不应该有任何一个人、任何一个国家或任何一家公司掌管ASI,包括美国。 奥特曼对此表达了自己的看法,“事情远比这复杂,AI将成为全球最重要的政治问题之一,地缘政治的紧张与合作会交织在一起,联盟也会随着技术发展不断变化,不会是固定的对抗关系。” “权力广泛分布才是最好的局面,任何国家,都应该拥有话语权,这样才能避免权力滥用,让AI真正造福全人类”。奥特曼如是说道。 主持人还借此机会问奥特曼一个谣言,“每次ChatGPT进行查询,都需要耗17加仑水”。坊间传闻,每次查询耗掉10个iPhone电池电量,为了降低耗电所产生的热量,OpenAI需要17加仑水来冷却GPU。 奥特曼笑了笑说“完全不真实,与现实没有任何联系”。 他说“这曾经是真的,我们过去在数据中心使用蒸发冷却技术,确实会消耗一定量的水,但现在我们已经淘汰了这种技术。网上流传的‘每次查询耗17加仑水’的说法,完全是疯狂的谣言,没有任何科学依据。” AI的能源消耗确实是一个需要关注的问题,但并非“每次查询都消耗大量能源”,奥特曼解释到。 访谈中主持人也提起了印度的现状。2025年,印度约8%的GDP来自IT企业服务,但OpenAI的codex等AI编程工具的出现,让这个行业面临前难题。原因很简单,当人们都可以用AI写代码的时候,软件开发的成本就会骤降。 奥特曼没有回避这个问题,他坦言:“我确实认为这将会改变很多,会有很大的影响。” 但他同时也表达了对未来的乐观。 在他眼里,就像计算机编程的每一次进步一样,人们将在更高的抽象层次上操作,能够做更多的事情。生产的产品和代码的数量将大大增加,期望会提高。 奥特曼说“只要国家和从事这项工作的公司快速适应这个新世界,就会有很多新事情要做。” 奥特曼从来不觉得AI会取代人类工作,更不是AI末日论者。他指出,每一次技术革命都对工作消失感到恐慌,但每一次都会诞生新的机会。 他给出的建议是:熟练使用AI工具,弄清楚人们想要什么以及如何对他们有用,以及如何与其他人合作。 访谈长达一个小时,奥特曼难免会被问及一些个人问题。 主持人问奥特曼,他为什么决定不在OpenAI持有任何股权时在想什么,他的回答出人意料:“那真的是我做过的最愚蠢的事情之一。作为一个做过很多愚蠢决定的人。” 他解释说,当时的想法是作为非营利组织的董事会成员,必须保持无利益关联。 然而也由此让奥特曼惹祸上身,比如有人说他做这一切只是为了权力,而不是真心想为世界做些有益的事等等。 当主持人问如果今天有人找到方法让他进入股权结构,他会接受吗? 奥特曼显得疲惫:“我是说在这一点上,我感觉对整个对话如此疲惫,如此被困,我不确定该怎么办。对我来说这就像一个双输的事情。” 奥特曼很无奈,因为无论他做什么选择,都会被质疑。 随后主持人问奥特曼,他觉得以下两件事,哪件是不可能发生的:是TSMC失去对世界芯片制造的垄断,还是马斯克和他再次成为朋友。 奥特曼的回答干脆利落:“我认为我不可能和马斯克再次成为朋友。” 然而当被要求说出钦佩马斯克的一点时,奥特曼思考了一分钟后还是给出了答案:“他在实体工程方面非常出色,在让人们在工作中表现得非常好方面也非常出色。” 可见,奥特曼虽然非常痛恨马斯克,可是依然能用客观的视角去审视这位全球首富。 接下来主持人又聊到网上的一个论调,那就是“AI让孩子变笨”。 奥特曼承认:“对某些孩子来说是真的。”他听到一些孩子说:“这太好了。我在整个高中都作弊。我从来没做过任何作业。”这些孩子假设以后仍然可以用ChatGPT做工作,这“非常糟糕”。 不过他强调,这不是大多数孩子的情况。大多数孩子说的是:“我不敢相信我现在能完成什么。看看我刚做的这个东西。我建立了这些令人难以置信的新工作流程。” 就像他们那一代人,在高中时使用谷歌做作业一样,现在的孩子只不过是有了新的工具。 奥特曼回忆起他上中学时,老师说谷歌是“有史以来最糟糕的事情”,认为教学没有意义了。但他认为记住历史日期完全是浪费时间,如果需要可以随时查找。 他非常确定:“今天出生的孩子在他们18岁高中毕业时,将能够做一些前无古人的事情。我认为这很棒。” 访谈也问到了一些关于企业的问题。主持人说,OpenAI从非营利转向有上限的营利,再到几乎接受任何收入包括广告,这个转变引发了许多质疑。 奥特曼给出的理由很直接:“推动AI技术的普惠化,需要和保持在研究前沿的需要。这两者都需要巨额资本。” 他说OpenAI仍然是研究优先的公司。 “AI最酷的事情是,制作一个好产品的绝大部分工作是做好研究。ChatGPT的早期版本几乎没有任何产品设计,就像一个文本框,输入到模型中,然后把输出放在屏幕上。研究继续推动模型能做什么,这使一切成为可能。” 奥特曼还分享了一个案例,他前一天与一家大公司开会,他们计划在2026年制定战略,2027年让公司准备好,2028 年部署。 他直言:“对AI这样做将是一个灾难性的错误。” 他指出,这种时间线可能适用于其他类型的技术,比如巨大的ERP迁移。但AI所需的敏捷、落地速度和资源投入力度,是完全不同的。 企业如果不能快速适应和部署AI技术,将失去竞争力。 接下来是一个很有趣的话题,和AI谈恋爱。奥特曼透露,的确会有一些人爱上AI,或者让AI为他们在约会应用上发送消息。 这就导致一些人开始唱衰整个人类文明,他们的观点是,既然可以用AI来抒发自己的感情,那势必会导致人们沉浸其中,不再和真实的人类往来。 奥特曼反驳了这个观点,“在未来我们反而会更加重视人际关系。” 他认为人类天生就是这样,在一个更富足的世界里,在一个可以拥有任何东西的世界里,人际联系、人的关注、人的温暖将是最有价值的商品之一。 “我打赌我们在有AI的世界里会更加关心这一点。” 随后,主持人问奥特曼,永远不会问ChatGPT什么问题?奥特曼的回答很耐人询问:“我想我永远不会问它如何快乐。我宁愿问一个有智慧的人。” 这个回答引发了现场掌声。随着近几年AI的火速发展,大模型已经能在各个领域生成专业且准确的解答。但是对于生活哲学,奥特曼仍然表示不会认真对待AI的答案。 奥特曼相信某些领域是机器无法替代人类的。 全文翻译: 主持人:非常热烈地欢迎来到Express Ada。各位,今天对我们来说是非常特别的一天。福布斯杂志称OpenAI是世界上最重要的公司之一。如果我们从现在起20年后回顾今天,我想我先等观众安静一下。 好的,大家都安静了吗?好的。 如果我们从现在起20年后回顾今天,我认为说我面前的这位先生可能是那个引发了这场颠覆性的结构性变革的人,这并不夸张。如果有什么能与工业革命相提并论的话,那可能就是我面前的这位先生,一切可能都是从他开始的。这样说公平吗,奥特曼? 奥特曼:不。你知道,我认为这对许多公司来说都是普遍现象。经营公司的人相对于其他所有人所做的工作,获得了过多的赞誉。但在我们的情况下尤其如此,这实际上是一个科学发现的故事。有少数几位研究人员创造了奇迹,弄清楚了世界运作方式中非常深刻的东西。 深度学习如此特别的原因,使其如此通用的原因是,我们——这一小群研究人员——发现了这个可以学习任何东西的算法,而且规模越大就越好。然后一大批人非常努力地在这些模型上实现了这种规模,然后全世界都弄清楚了如何围绕它构建令人难以置信的产品和服务。但最重要的是,这是科学家们的故事。 主持人:是的。从你上次来印度到现在,世界发生了很多变化,但你认为印度在AI方面发生了什么变化? 奥特曼:我上次来这里是一年多前,在谈论印度发生了什么变化之前,我认为值得谈谈AI发生了什么变化,因为这会奠定基础。一年前,AI刚刚能够做高中数学。 这是不可思议的。AI可以做高中数学,做得非常好,虽然不是优秀但是非常好,人们简直不敢相信。我当时在印度,在像这样的活动上演讲,我在谈论这个,人们——这刚刚发生——人们真的感到惊奇。他们说,你知道,这能做 11 年级学生能做的事。这太神奇了,因为就在几年前,AI根本做不了任何数学。它做不了小学数学,它在那方面很吃力。 到去年夏天,它在我们世界上最难的数学竞赛中竞争,表现还不错。上周,有一个叫做“first proof”的新东西,数学家们提出了10个研究问题,这些问题的解决方案是未知的,需要我们最好的数学家、研究的前沿、新知识来解决,因为它还没有被分享。我相信我们最新的AI正确解决了其中7个问题。 所以AI已经从做高中数学还行,到能够做新的研究级数学,找出新知识,这在物理学中也在发生。这是一年内令人惊讶的变化。我们已经从AI能做我们期望一个非常聪明的高中生做的事情,到推动人类知识的边界。另一个变化是,AI已经从能写一点编程代码,到完全改变了成为计算机程序员的意义。 上次我来这里时,人们对这些代码自动补全工具感到惊讶。现在,一年后,如果你在类似codex的东西中输入一个想法,你可以创建一个完整的应用程序。我认为在过去一年里,程序员的工作改变的程度超过了我成年以来任何一年的变化。 codex是我们的——印度是我们codex增长最快的市场。所以特别是这里正在发生的事情,回到问题的下一部分,真的很了不起。 我感觉到的最大变化是,上次我来这里时,感觉印度是AI的消费者。人们在使用这些服务,人们在做其他事情。现在,印度的开发者创业活力彻底爆发。 主持人:你实际上上次说了一些有点争议的话。现在它有争议是因为当时你说,你知道,你描绘了一幅绝望的画面,说1000 万美元的基金不足以在印度建立一个有意义的大语言模型。而现在昨天我们在谈论印度将推出全栈,印度实际上可以引领 AI。是的。 奥特曼:那个评论,我是说那被断章取义了。那是几年前的事了。但那个评论不是说印度不能用1000万美元的公司和1000万美元的模型做出令人惊叹的工作。我认为这显然是可以的。问题是你能用1000万美元做一个非常前沿的模型吗?我认为当时不能。我认为现在更加不能。 主持人:现在更加不能。 奥特曼:做一个前沿模型要1000万美元。是的,没错。 主持人:它们变得非常昂贵了。 奥特曼:但如果印度有足够的资金,印度公司肯定可以做到,而且印度正在做的较小的窄领域模型是令人难以置信的。 主持人:那么这让你惊讶吗?在你上次旅行和这次旅行之间,关于印度和AI,有什么让你意外的吗? 奥特曼:我几分钟前提到的那个统计数据,这是世界上codex增长最快的市场。我非常高兴。我想我不应该感到惊讶,但看到这一点真是太好了。我今天早上在 IIT 德里,人们建立这新一代创业公司的能量。我期待印度在这方面给世界带来惊喜。 主持人:显然,硬币的另一面是就业的破坏,特别是在 IT 企业服务部门,我们大约8%的 GDP 来自那个领域。在过去 10 天里,关于这个话题说了很多,因为codex,在codex之前是另一个claude,它展示了软件发展得有多快。我知道上周说了很多,但我还是想让你反思一下,这对印度来说有多大威胁,印度应该如何看待这个问题。 奥特曼:我确实认为这将会改变很多,会有很大的影响。我认为假装不是这样从来都没有帮助。然而,我期望发生的事情,就像计算机编程的每一次进步一样,人们将在更高的抽象层次上操作。他们将能够做更多的事情。仍然会有广泛的需求。生产的产品和代码的数量将大大增加。期望会提高。 但我认为只要国家和从事这项工作的公司快速适应这个新世界,就会有很多新事情要做。我不是就业末日论者,我不认为未来不会有工作。我认为会有很多工作。每一次技术革命都对工作消失感到恐慌,每一次技术革命都在另一边找到了新工作。承诺的休闲从未发生过。 你知道,我们都去永久度假的想法,那从未真正实现过。我不认为会实现。我希望我们能在那个方向上走得更远,但我们对彼此有用的渴望,我们对更多更好东西的渴望,我们表达创造力的渴望,我们从未达到那个终点。我认为那没有自然限制。如果我们能弄清楚太空旅行或其他什么,那里有一个巨大的宇宙等待我们去探索。我不知道会去哪里。 但我确实认为事情显然会快速演变,你必须站在正确的一边。你知道,关于就业的声明在印度是一个非常严肃的声明,因为你知道有5亿30岁以下的人。 你理解就业的严重性,以及印度的那种焦虑。当你会见总理时,当你会见政策方面的重要人物时,你会讨论这个吗?这个话题出现了多少,你对那种焦虑有什么答案? 奥特曼:是的,与政治领导人讨论时出现的主要问题是基础设施、就业、利益的公平分配和广义的安全。这些问题的比例在不同国家是不同的,而且对上行空间与潜在下行空间的关注程度在不同国家也是不同的。 我们经常讨论就业影响。这个问题的一个版本几乎在我每次社交对话中都会出现,那就是我的孩子应该为未来学习什么? 主持人:它会是什么样子?这是在问那个问题的一个版本。你知道,经济会走向哪里? 奥特曼:如果你研究历史,真的很难具体回答这个问题。我喜欢做的一件事是阅读技术史,如果你看一下经历工业革命的人们的原始资料,有很多关于就业的恐慌。 有很多关于工作将会是什么的预测。很多对不会有工作的恐惧,以及很多关于新工作将会是什么的预测。他们错得令人震惊。他们中没有人说,我要成为一家AI公司的CEO。当然也没有人说,我要成为网红。所以我认为这很难预测,但无论如何都会有用的技能。 主持人:是的。 奥特曼:熟练使用AI工具、韧性、适应能力、弄清楚人们想要什么以及如何对他们有用。如何与其他人合作。这些都是非常好的学习内容。 是的,我认为假装不会有大变化是没用的。变化不会像AI行业的一些人预测的那么快,因为社会总是有更多的惯性,总是需要更长的时间。但最终变化将是巨大的,我们会找到各种新事情要做。 主持人:我想稍后回到这个话题,关于你认为那种阻力会来自哪里,社会的惯性是来自发达经济体还是来自欠发达经济体。但在那之前,再多谈一点印度和 AI。Jensen 谈到的那个五层蛋糕,整个AI堆栈——能源、数据中心、芯片、模型和应用程序——整个五层蛋糕,你认为印度有能力和权利在哪些领域获胜,哪些领域你认为对印度来说是非常冒险的赌注? 奥特曼:我认为印度应该——你知道,无论你是赞同五层蛋糕还是七层蛋糕,人们对它的定义略有不同——但我认为印度应该在所有这些层面上发挥作用。我认为垂直整合有重要的优势,能够在所有这些层面上工作,对于印度这样规模和重要性的经济体来说是一件好事。是的,我刚才来这里之前和总理谈过,他肯定有动力在所有这些层面上发挥作用,我认为这很重要。 主持人:如果我们确实在所有这些层面上发挥作用,你知道你说的超过70%的人口已经上网了,我不知道你估计其中有多少比例在做人工智能,但假设我们希望其中很多人进入AI领域,这是一个很大的变化。上次你来这里时,对AI有很多恐惧和焦虑。现在我们都在说让我们拥抱它,让我们与它一起前进。世界有印度成为AI优先社会所需的计算能力吗? 奥特曼:还没有。但世界将不得不迅速合作解决这个问题。我想问人们的一个问题是,你希望有多少GPU一直为你工作?你个人希望有多少GPU思考你的问题,帮助你工作,实现你的想法,编写你想要的软件,操作你家里和花园里的人形机器人以及其他一切,为你建造新房子,等等。 你想要多少?人们给出不同的答案。没有人说少于一个。有些人说一千个。我想要一千个。 如果你把这个乘以全世界有80亿人,我们没有办法在短期内提供 8 万亿个GPU。我的意思是,这看起来很荒谬。 主持人:是的。 奥特曼:我们不会那样做,要明确一点。至少不会在地球上那样做。 但我确实认为这表明了我们需要有多大的雄心来建设多少计算能力。这将是世界有史以来为了我们所有人的福祉而集体承担的最昂贵、最复杂的基础设施项目。所以我们需要大量的计算能力。好消息是,用老式方法建设这个是不可能的,但我们会有AI和机器人帮助我们做这件事。你知道,我们会解决的。 主持人:这就是为什么现在太空不断被提起吗?有另一场太空竞赛,但我一直听说。老实说,我认为在当前形势下把数据中心放在太空的想法是荒谬的。 奥特曼:总有一天会有意义的。 但如果你只是做一下粗略的数学计算,发射成本相对于我们在地球上可以做的电力成本,更不用说你如何修复太空中坏掉的GPU了,不幸的是它们仍然经常坏。我们还没到那一步。会有那么一天,太空对很多事情都很好。轨道数据中心不是这十年会大规模重要的东西。 主持人:但是所有这些基础设施建设,奥特曼,感觉它有点迫使像你们这样的组织与政府有非常密切的关系。这是AI正在改变的东西吗?整个权力结构,你知道,曾经有一段时间大科技是一个非常私有化的力量,与政府有非常复杂的关系。现在似乎你需要与政府有良好的关系,无论是印度公司与印度政府,还是像你们这样的公司与美国政府。政府是一个大的推动者吗? 奥特曼:是的,我认为这将非常重要,不仅仅是为了建设基础设施,而且考虑到这将对社会产生的影响程度,以及真正民主化这项技术的需要。政府将不得不参与,像我们这样的公司将不得不与政府合作。 主持人:那是什么样的?我是说,你有没有停下来想过大科技和政府之间那种关系的演变?顺便说一句,我能叫你大科技吗,还是不太合适? 奥特曼:我不觉得自己是大科技。 主持人:好的。 奥特曼:我认为我们还没到那一步。 主持人:好的。好吧。但是像你们这样的科技公司和政府 奥特曼:我认为科技行业开始时是极端自由主义的,你知道,我们不需要政府,政府也不需要我们这种观点。这已经改变了很多。甚至在AI之前,就像过去几十年,随着公司变得越来越大,对经济和整个世界运作方式越来越核心,这已经发生了显著变化。 但也许从未像现在这样重要,考虑到需要发生的基础设施规模。 主持人:你对此有何感受?因为我们,你知道,我们一直听到的理论之一,我们一直听到的事情之一是,这届白宫与硅谷非常亲近。硅谷是JD·万斯的非常亲密的赞助商。那整个关系是非常亲密的。这是真的吗?这是好事还是坏事? 奥特曼:我会说在某些方面很亲近,在其他方面不太亲近。你知道,有一些紧密的联系,然后这届政府也对科技有一些重大批评。 这是好事还是坏事?我认为科技公司和政府之间的密切合作随着时间的推移将变得越来越重要。显然这不会是一个完全顺利的关系,但它越好,我认为对我们所有人越好。 奥特曼:在某种意义上,我认为这是我们现在面临的最重要的问题之一。你完全可以想象一个AI大规模集中权力的世界,比如说一家公司或一个国家能够掌握AI并用它来积累世界上巨大的权力和财富。你可以想象另一个极端,地球上每个人都有一个没有任何规则的ASI,你知道,会发生一些相当可怕的事情和混乱。 你可以想象中间的许多世界。我个人认为更倾向于民主化版本的东西是好的。我们当然需要一些监管。我们当然需要一些护栏。但我认为把这项技术放在很多人手中是可能的。这将是经济权力的去中心化。你可以看到的最清楚的例子是在过去六个月,特别是三个月里,一个或两个或三个人的公司可以拥有的权力。 这在几年前根本不会发生。这是不可能的。 在这个新世界里,有了像codex和通用知识工作代理这样的东西,我们将不得不非常快速地习惯拥有巨大成功的一人创业公司,或两人、三人创业公司。我认为这很棒。 主持人:是的。从你的角度来看,这一切有多竞争?我是说,你知道,我们昨天在舞台上看到了一个有点尴尬的时刻。有好几个关于它的表情包在流传,但—— 奥特曼:你得给互联网一些东西让它笑。 它确实很有竞争性,但我要说的是,我认为—— 主持人:它也非常近亲繁殖。我是说,你们这些人,因为你们所有人,很多人在某个时候都在和你一起建设东西或与你合作,每个人都认识每个人,每个人都像 Nvidia 在投资你。你在买 Nvidia 芯片,然后就是这样。 奥特曼:确实是。这确实是一个奇怪的小世界。 我认为它在商业上非常有竞争性,但几乎所有拥有非常先进模型的努力,我认为,都感受到了正在发生的事情的严重性,他们非常致力于把安全和对齐做对,并愿意在那方面合作。 主持人:如果你想分享的话,再多说一点昨天发生的事情。这是一个好机会。 奥特曼:我真的没有太多要补充的。 主持人:我不会追问了。好的。你知道,有太多要涵盖的,奥特曼,我学到了很多。我非常感激你,因为我为准备这次对话学到了很多。我花了大概 3 天时间深入研究。所以,我想我就把它变成一个游戏。 奥特曼:太好了。 主持人:我们可以,你知道,我可以尝试涵盖更多更多的东西,而不是进行对话。而且我们会看看我们能做什么。所以,这不是快速问答,因为它太长了,不能算快速问答,我试图让它更短,但我做不到。 关于谷歌在AI竞赛中的追赶,有什么你钦佩的吗?因为10年前他们遥遥领先。 奥特曼:嗯,10年前,10年前,谷歌是唯一认真的AI努力。 主持人:也许是5年前。 奥特曼:也许是3年前,当我们推出 ChatGPT 时,他们当时远远落后了。但我钦佩谷歌的第一件事是哈萨比斯和谷歌团队在现代时代比任何人都早开始研究 AI,有很多信念,你知道,我认为没有他们的启发,我们肯定不会在这里。 所以这是我钦佩的一件事,然后第二件事,更近期的,是他们在相当落后之后,极致的专注和执行力以及真正扩展模型的能力,这是相当令人印象深刻的。 主持人:好的。当苹果与谷歌合作Siri时,你惊讶吗? 奥特曼:不是特别惊讶。 主持人:好的。在AI监管方面走在正确道路上的一个国家。 奥特曼:我认为我们中没有人知道答案。我很高兴的一件事是各国正在尝试不同的方法,我认为这是世界上许多主权国家的好处。我们将在未来几年观察到非常不同的方法,看看什么有效,什么无效,我相信世界会很快转向更多有效的方法。但我感激这种实验和不同国家尝试不同的东西。 主持人:好的。那么简短的游戏,我会给你一些对AI的批评,你给我对每个批评的简短辩护。所以第一个—— 奥特曼:有些我可能没有辩护。没关系。而且有这么多问题,你总是可以回避或跳过。权力过度集中。 奥特曼:公平的批评,除非我们超级努力地民主化,我认为世界上每个人都需要让国家和公司达到这个门槛:你不能以安全的名义说权力集中,我们不想要那种交易,它必须被民主化。 主持人:好的。进入数据中心的自然资源量,水的量—— 奥特曼:关于AI消耗水这块是假的。它曾经是真的。我们过去在数据中心做蒸发冷却,但现在我们不这样做了,你知道,你在互联网上看到这些东西,说不要使用ChatGPT,每次查询要17加仑水或什么的。这完全不真实。完全疯狂。不,与现实没有联系。但公平的是能源消耗,不是每次查询,而是总体上,因为世界现在使用这么多AI是真实的,我们需要非常快速地转向核能或风能和太阳能。 主持人:去年我们请了比尔·盖茨,我问了他这个问题,他给了一个非常有趣的统计数据。当时我们显然计算出每次ChatGPT查询要用掉10 个 iPhone的电池,现在已经降到了一个或一个半 iPhone 电池寿命的能量。这是对的吗? 奥特曼:不可能接近那么多。 主持人:要少得多。 奥特曼:少得多得多。 主持人:好的。好吧。但他的理论是AI会从人类进化中学习,在它们消耗多少能量方面变得更高效。 奥特曼:在这个比较中总是不公平的一件事是,人们谈论训练一个AI模型需要多少能量,相对于人类做一次推理查询需要多少成本。但训练一个人也需要很多能量。它需要大约20年的生命和你在那段时间吃的所有食物,然后你才变聪明。 不仅如此,它还需要曾经生活过的1000亿人的非常广泛的进化,学会不被捕食者吃掉,学会弄清楚科学和其他东西来产生你,然后你花了——你知道你花了(多长时间)。所以公平的比较是,如果你问ChatGPT一个问题,一旦它的模型被训练好,回答那个问题需要多少能量,相对于一个人?可能AI在能源效率基础上已经赶上了。以那种方式衡量。 主持人:哇。好的。太棒了。AI让我的孩子变笨了。 奥特曼:对某些孩子来说是真的。 看,当我听到孩子们谈论AI时,肯定有一些孩子说,“这太好了。我在整个高中都作弊。我从来没做过任何作业。谢谢。”我就想,“你对余生的计划是什么?”他们说,“嗯,我假设我仍然可以用 ChatGPT 做我的工作。”这非常糟糕。 我们绝对必须仍然教我们的孩子学习、思考、有创造力和使用这些工具。但这不是大多数孩子说的。大多数孩子说,我不敢相信我现在能完成什么。看看我刚做的这个东西。我建立了这些令人难以置信的新工作流程。你知道,当然,就像我可能使用 ChatGPT 的方式,就像你在高中时使用谷歌帮助你做作业一样。 但现在我有了这个新工具,我在做这些了不起的事情。我认为我们需要找到新的方法在学校教学和评估,以确保每个孩子都不会掉队。但这项技术的潜力,学习更多、做更多的能力,我对此毫不怀疑。当我在学校时,谷歌刚刚出现,我的中学老师说,“这是有史以来最糟糕的事情。” 你知道,教学没有意义了。如果你可以在谷歌上查找,为什么还要记住历史上某人出生的日期?我的答案是,我认为记住某人出生的年份完全是浪费时间。如果我再次需要知道,我会在谷歌上查找,通常你不会那么经常需要。然后我在接下来的几年里看到,教师接受了这一点,教育系统进化了。就像新工具总是发生的那样,潜力上升了,期望上升了,我们必须教人们更努力地思考,创造更多。你知道,我非常确定,今天出生的孩子在他们 18 岁高中毕业时,将能够做今天没有人能做的事情。我认为这很棒。 主持人:另一个批评是它不够民主,因为想要暂停AI的人没有发言权。我想双击这个问题,你认为阻力会来自哪里?它是来自那些在最高水平体验过技术的人,然后他们说我们很紧张,我们想暂停,还是你看到阻力来自那些从未体验过并且紧张地想要体验,然后他们感到脆弱的人? 奥特曼:我是说它有点来自各个部分。虽然随着更多人使用这项技术,我认为完全暂停它的想法越来越少。人们喜欢它,更多的是这将意味着什么?我们能有更多发言权吗?这能慢一点吗? 主持人:好的。硅谷应该从中国技术中学习的一件事。 奥特曼:快速行动。 主持人:好的。硅谷可以从印度技术中学习的一件事。 奥特曼:更快地行动。 主持人:是的。好的。你急需查找一些东西。你的手机没电了。你借了我的手机。我的触摸板上的字母 T 不起作用。所以你只能输入 Grok、Claude、Gemini 或 DeepSeek。 奥特曼:我想如果我必须查找什么东西,我选 Gemini。 主持人:好的。好吧。 奥特曼:对于其他事情,我会选其他模型。 主持人:好的。你从非营利转向有上限的营利,再到几乎任何收入,包括广告,最令人信服的原因是什么。 奥特曼:推动AI技术的普惠化,需要和保持在研究前沿的需要。这两者都需要巨额资本。 主持人:你认为你是研究优先的公司还是产品优先的公司? 奥特曼:研究优先的公司。我认为AI最酷的事情是,制作一个好产品的绝大部分工作是做好研究。我们做一个很棒的模型,产品已经相当不错了。ChatGPT 的早期版本几乎没有任何产品。它就像一个文本框,输入到一个模型中,然后把输出放在屏幕上。所以研究继续推动模型能做什么,这使一切成为可能。 主持人:好的。当你听到关于你的一个批评时,困扰你的是什么。 奥特曼:是的,我基本上听过所有可能的批评,在某个时候它们都不再困扰你了,因为你就像这变得如此疯狂,如此脱离真相。 最让我难过的,是有人说我做这一切只是为了权力,根本不是真心想为世界做些有益的事。 主持人:当你决定不在OpenAI持有任何股权时,你在想什么?当时你脑子里在想什么? 奥特曼:那真的是我做过的最愚蠢的事情之一。作为一个做过很多愚蠢决定的人。由此带来的阴谋论,就像我刚才提到的那个,完全不值得。我们就像一个非营利组织。你知道,有一个怪癖,要成为非营利组织的董事会成员,你要成为非营利组织的董事会成员,必须保持无利益关联。我很幸运有一个成功的职业生涯,我就想,我在这里真的不在乎,但这是一个非常愚蠢的事情。 主持人:如果今天有人提出并找到一种方法让你进入公司股权结构表,获得优先股,你会接受吗? 奥特曼:我是说在这一点上,我感觉对整个对话如此疲惫,如此被困,我不确定该怎么办。 主持人:好的。 奥特曼:对我来说这就像一个双输的事情。 主持人:好的。尽管你与 Elon马斯克有所有的分歧,你钦佩他的一件事是什么?有什么你可以抛开所有分歧的吗? 奥特曼:不,我要想一些东西,但给我一分钟。 他在实体工程方面非常出色,在让人们在工作中表现得非常好方面也非常出色。 主持人:好的,太棒了。好的。ChatGPT 不以观点闻名。它以给出事实和真实答案而闻名。所以,我要问你对新闻的看法。上周新闻里有很多东西。所以,我们想要你对政府下令禁止 16 岁以下儿童使用社交媒体的看法。 奥特曼:我不知道完全禁止是否正确。也许是的。我认为至少严格限制会是好的。我有一个小孩。我更关注的是无限下滑刷新带来的严重负面影响。我不希望我的孩子只是那些一直这样的 iPad 孩子之一。所以这似乎非常重要。但是,是的,儿童社交媒体可能是我们必须非常小心的事情。 主持人:好的,似乎战争的阴云再次笼罩我们。关于伊朗有很多讨论。如果政府要求使用像你们这样的AI公司来帮助弄清楚如何参战,你会如何回应?五角大楼对你来说只是另一个客户吗?你知道,他们是客户,你做他们要求的,还是你在某个地方划一条线? 奥特曼:我不认为AI系统应该被用来做战争决策。我不认为它们处于这样的复杂性和可靠性水平,这是一个好主意。话虽如此,我们当然想支持政府,我们已经可以做很多事情了。总有一天我认为会有这方面真正重要的应用。但现在模型有明显的局限性。 主持人:我相信它被用于玛杜罗的抓捕。这是真的吗? 奥特曼:我不知道,我只是不知道。我确信它在某些方面被使用了。有些事情AI今天可以做得很好。比如我认为使用AI分析大量情报报告可能是AI的一个很好的用途,也许它就是以那种方式被使用的。 主持人:是的。你对 Claude 安全主管戏剧性辞职的看法。我不知道你是否关注了,但它引起了很多新闻。 奥特曼:我听说了一些。 主持人:好的。 奥特曼:就像他们辞职了,说一切都没用或什么的。 主持人:是的。世界要完蛋了。我想去写诗。就是那个方向。 奥特曼:很多很多安全人员我认为正在变得不堪重负。我是说这是我想让你反思的真正部分。 奥特曼:我同意的部分是在公司内部看到将要发生什么的内部视角,世界还没有准备好。我们很快就会有极其强大的模型。技术的发展速度会比我最初预想的更快,这是有压力和引起焦虑的。 主持人:好的。反思一下未来,爱情和关系的未来。我们一直听说人们使用AI代理在约会应用上开启对话。我们在爱情和关系中失去了多少真实性,或者它有多少影响? 奥特曼:我的赌注是,在未来我们会更加重视人际关系。我认为我们天生就是这样。会有一些人会爱上AI,或者谈论他们的AI男友或女友,或者让AI为他们在约会应用上发送消息,会有一小部分世界这样做,会有无数危言耸听的文章唱衰社会。 但我认为对于几乎所有人来说,在一个更富足的世界里,在一个你可以拥有任何东西的世界里,人际联系、人的关注、人的温暖将是最有价值的商品之一,我们——我打赌我们在有AI的世界里会更加关心这一点。 主持人:好的。你投资了400多家公司。这准确吗? 奥特曼:我是说算上Y Combinator 的话,有3000家。 主持人:哇。好的。好吧,如果你算上所有Y Combinator的投资,公平。但鉴于AI增长和破坏的速度,你会建议这个房间里的人今天投资哪里?有一个你认为他们应该投资的地方吗? 奥特曼:在这样一个行业格局彻底重塑、充满变数的时代,所有赛道都充满机会,一切都尚未定局。事情会变化得如此之快,事情正在变化得如此之快。 正如我们之前谈到的,你可以有这些一人公司做过去需要更大公司才能做的事情,但他们可以更快地移动,更高效。所以会有所有把现有的事情做得更好,然后还有一整套我们以前无法想象的新事情。感觉投资格局比我成年以来的任何时候都更开放。以前有很多次感觉只有一件事可以投资。只有一个前沿,现在感觉你可以做任何你想做的事情。 主持人:好的。我们离ASI 有多远?你说 AGI 还有几年。我们离ASI 有多远? 奥特曼:不,我说的是离ASI 还有几年。 主持人:那么 AGI 有多远?我是说,AGI 在这一点上感觉相当接近了。 奥特曼:好的。 主持人:就像,如果你问我—— 奥特曼:我认为如果你六年前问大多数人,如果我们有可以自己做新研究的系统,你会怎么想?如果我们有可以自己制作整个复杂计算机程序的系统,可以在所有这些不同领域做相当复杂的知识工作,你知道,你可以有一个系统可以充当AI医生、律师、计算机科学家,会说,“好的,这听起来相当智能。” 我们习惯了我们拥有的任何东西。但只是看着我们已经拥有的技术在内部加速我们多少,我会说它相当接近了。而且鉴于我现在预期会有更快的起飞,我认为ASI不是那么遥远。 主持人:你永远不会问ChatGPT的一件事。 奥特曼:我想我永远不会问它如何快乐。我宁愿问一个有智慧的人。 主持人:这真的很有趣,因为这真的很有趣,因为AI最常见的用途之一是陪伴。 奥特曼:我认为对于治疗或生活建议之类的事情,它可以相当不错。我认为对于生活哲学,我仍然不会认真对待它。 主持人:好的。不。很好。好的。很好。那么哪个更不可能发生?TSMC失去对世界芯片制造的垄断,还是马斯克和你再次成为朋友?哪个更不可能? 奥特曼:还是更可能? 主持人:我认为马斯克和我再次成为朋友更不可能。我觉得我对那个有更多控制权,但两者都是非常不可能的事情。 主持人:TSMC有什么特别之处? 奥特曼:他们只是对把他们所做的事情做得更好有这种无情的专注。这是一个极其复杂的过程,他们在如何优化、变得更好和在各个层面学习方面就是一台机器。 主持人:好的。你能与我们分享的关于你与强尼·伊芙合作的最新进展是什么?你在谈论这些很酷的新设备。它将改变手机的形态因素,你如何与机器互动。你能与我们分享什么吗? 奥特曼:我们基本上以同样的方式使用计算机大约 50 年了。你知道,我认为施乐帕克研究中心发明了视窗界面、指针设备等所有我们如今习以为常的计算机交互概念,这是很了不起的。把它放在手机上并添加多点触控也很了不起。但从根本上说,你知道,这是一种类似的想法。 然后AI出现了,AI却被禁锢在同样的产品形态里。但AI是一个完全不同的东西。AI,你现在可以用自然语言与计算机交谈,它可以为你做极其复杂的事情。它可以理解大量的上下文,而计算机的形态因素对此不太适用。 你知道,我想使用一种观察我整个生活、拥有所有上下文、对我最大有用、对我的妨碍最小、不仅可以开或关而且可以处于这些微妙的中间状态的技术。 我们可能会失败。这非常困难。但我认为我们有机会制造一种新型产品,一个真正围绕AI设计的新产品系列,它们有点参与你的生活而不是妨碍它。 主持人:所以这是一个理论,但产品是什么? 奥特曼:你必须等着看。 主持人:我们什么时候能看到这个?因为它听起来非常革命性。 奥特曼:我是说我们希望能在今年晚些时候谈论它。 主持人:好的。当然。硬件很难。 主持人:好的。政府应该监管的一件事和应该避免监管的一件事。 奥特曼:这不是一个有能力的答案。一般来说,我认为政府专注于监管真正潜在的灾难性问题,对不太重要的问题更宽松,直到我们更好地理解它们,这可能是一个好主意。 主持人:好的。从你与任何联合创始人的职业分歧中有什么内省或学习吗? 奥特曼:很难把它简化为一个简短的声音片段。 多年来 Greg 和我在很多方面有分歧的一件事是公司应该多专注还是做很多事情。我认为我在试图做这么多事情方面是错的。我真的从他那里学到了极其狭窄深度专注的重要性。 主持人:好的。有趣。一个错误,你看到企业在采用AI时犯的最大错误。 奥特曼:我昨天在与一家大公司开会,他们计划在2026年制定战略,2027年让公司准备好,2028年部署。 这可能适用于其他类型的技术。显然,如果你做一个巨大的ERP迁移,那就是需要的时间线类型。对AI这样做将是一个灾难性的错误。所需的敏捷、落地速度和资源投入力度,是完全不同的 主持人:好的。好的。到最后一部分了。以下国家元首想要你对他们需要为人民在这个新AI背景下的未来做的一件事的意见。纳伦德拉·莫迪、普京、特朗普。你会告诉他们每个人应该做什么? 奥特曼:我会对每个人说同样的话,那就是你必须民主化这项技术并把它放在人们手中。显然他们不会都听。 主持人:所以,这是一个公平的答案,当然,但这是一个安全的答案。但是一个年轻的国家应该做的事情与一个老国家从国家元首的角度来看是不同的吗? 奥特曼:我是说我在这一点上感觉越来越激进。我不认为任何其他策略会奏效。 主持人:好的,公平。如果我可以请你描述你与纳德拉的关系,因为他称你——他称OpenAI是我的朋友。 奥特曼:我只会说朋友。 主持人:好的,酷。你有史以来最昂贵的招聘。你不必告诉我是谁,但花了多少钱? 奥特曼:我们在这方面无法与Meta相比。 主持人:好的。好的。现在是我的最后一个问题,你做过并且现在已经升级或修改的这四个陈述中,你后悔哪一个?陈述一,印度用1000万美元建立基础模型是没有希望的。陈述二,你将保持非营利。你澄清了。是的,我说的是任何人用1000万美元建立基础模型。 主持人:好的,那是陈述一。陈述二,你将保持非营利。陈述三,过多的AI监管会扼杀创新。陈述四,OpenAI不会接受广告。 奥特曼:我不认为我曾经说过我们不会接受广告。 主持人:抱歉。 奥特曼:我不认为我曾经说过我们不会接受广告。我想也许我说过我有顾虑。我想我会选非营利那个。 主持人:好的。好吧。太好了。这已经很多了。 奥特曼:这已经很多了。 主持人:你只给了我一个小时,伙计。我本来想要更多。 我们会从观众那里接受几个问题。是的。好的。我能看看有多少人在这里? 奥特曼:我很想要另一个表情包。所以,如果有人想问我关于印度基础模型的问题,让我们再来一次。
内存降价别梦了!存储巨头最新发声:今年涨价将贯穿全年
快科技2月23日消息,近日,全球存储三巨头之一的SK海力士在高盛电话会议上明确表态,全球存储器产业已彻底转向卖方市场,2026年存储芯片价格涨势将贯穿全年。 “今年我们无法满足所有客户的需求,价格持续上涨已成定局。”该公司表示。 该公司披露,目前DRAM及NAND主流存储产品库存仅约4周,处于历史低位,且无一家客户能获得充足供应。此外,2026年高带宽存储器(HBM)产能已提前售罄,标准型DRAM短缺推高供应商议价权,产业链已启动长期合约谈判锁定供应。 SK海力士指出,供需失衡核心有两点:一是AI大模型、高效能运算对存储器的需求持续井喷,远超行业预期;二是存储器晶片制造依赖的无尘室扩张缓慢,产能爬坡受限,形成难以弥合的供需缺口。 行业景气度直接体现在SK海力士业绩中。1月28日,该公司发布2025财年财报,全年营业收入97.1467万亿韩元,营业利润47.2063万亿韩元(利润率49%),净利润42.9479万亿韩元(利润率44%),营收同比增逾30万亿韩元,营业利润翻倍,刷新历史最高业绩。 存储涨价已引发产业链连锁反应。群联电子CEO潘健成受访时警告,内存产能向AI基础设施倾斜,令消费类OEM厂商承压,至少有一家代工厂要求客户预付三年现金锁定产能,令中小设备制造商承压。集邦咨询预测,2026年全球手机产量或降10%至11.35亿台,涨价持续则衰退幅度可能超15%,最低至10.61亿台。 据测算,主流8GB内存+256GB存储配置的合约价较2025年同期涨近200%,存储器在智能手机成本中的占比从10%-15%升至30%-40%,终端成本压力凸显。
阿里千问春节期间“一句话下单”近2亿次
IT之家 2 月 23 日消息,阿里千问 App 今日发布报告,春节期间,千问帮大家“一句话下单”近 2 亿次,全国平均每 10 人就有 1 人让千问下单,“千问帮我”买餐饮奶茶、订机票酒店、买电影票和景点门票正在成为马年春节的新民俗。 相比传统点选式下单,“千问帮我”2-3 轮对话即可完成,操作步骤少一半,这种便捷让超过 400 万名 60 岁以上用户成功用千问“一句话下单”。 千问帮大家“一句话下单”了超 3000 吨鸡蛋,相当于一个中等县城居民,一年的鸡蛋消耗量。除了 5520 万杯奶茶、3516 万杯果茶,千问帮大家下单最多的饮料还有 1138 万杯咖啡。此外,用千问订酒店订单最高城市 TOP5 为杭州、上海、重庆、武汉、郑州。 IT之家注意到,千问 App 于 2 月 6 日开启第一波“春节 30 亿大免单”活动,所有用户只需要将千问 App 更新到最新版,打开就能领取 25 元无门槛免单卡,能够免费喝奶茶,也能够通过淘宝闪购买年货、点外卖,并且 App 还能够“一句话免单点奶茶”,只需输入“千问帮我点奶茶”提示词就行。 由于下单人数较多,千问 App 后续宣布免单卡活动可持续用到 2 月 28 日,用户可以先集满 21 张卡,采取错峰下单的策略。另外,千问将免单范围扩展至盒马、天猫超市等,用户可以购买酒水零食、米面粮油、家居日用、生鲜水果等。 2 月 14 日起,千问“春节大免单”再加 3 天,每人可领 10 张 25 元超级免单卡。此外,千问还将接入大麦、飞猪,用户可体验 AI 买电影票、门票等新功能。
奥特曼和阿莫迪拒绝手拉手 纯血中国机器狗被印度一大学拿去当自己的展示
不知道大家这个假期过得怎么样。 春节不放假的老外忙了一周,还闹了点笑话。 印度AI峰会上的魔性一幕出圈了——舞台合照环节,一众大佬上台排成一排,不知道哪个大聪明起的头,和旁边的人手牵手高举起来。于是一个传一个,大家都开始拉手。 结果有两个人陷入踌躇,他们明显不想牵手,那就是OpenAI的山姆·奥特曼(Sam Altman)以及Anthropic的达里奥·阿莫迪(Dario Amodei)。 人在尴尬的时候就会假装很忙,他们东张西望了好一阵。精彩的来了:最后,他们居然企图不牵手但混入其中,于是双双握起拳头举了起来…… 这能混得过去吗?! 可惜马斯克不在,要是让奥特曼左手阿莫迪、右手马斯克,他可能已经东张西望到变成直升机飞走了。 还有网友干脆求助AI复原奥特曼和阿莫迪的内心戏,那当然是大打出手啦。 Anthropic创始人本来就是前OpenAI员工,就在前不久,Anthropic还在超级碗投广告讽刺OpenAI想在AI里投广告的举措。 总之,Anthropic和OpenAI素来不合,这里就不展开说了。 要说这个印度AI峰会,本身也搞出不少闹剧。 比如印度加尔戈蒂亚斯大学展示“自主研发成果”,却被发现这个所谓的“猎户座”机器人,竟然疑似中国宇树的机器狗。 那不就是买了纯血中国机器人,然后谎称是印度血统吗?离了个大谱。 后来相关方还真的出来承认了这件事,但表示没有说这是“自主研发”的,本来就只是作为教学工具引入了中国企业的机器人做展示。 也就是说,这是个误会,源于“沟通不畅”。 好吧,你说误会就误会吧,反正主办方在争议发生后火速切断了这所大学展示位的电源。 造假这件事吧,就得苟着造,选哪里的机器人冒充自己的不好,选中国的,还是宇树的,这也太容易被发现了。 要知道,机器人含量极高的春晚才刚刚落幕,又给了全球亿点点震撼。 别说老外了,中国人自己何尝不震惊。 大家都知道今年春晚一定会有AI、机器人,但谁也没想到含量这么高、力度这么大。 就拿宇树科技的春晚节目来说,去年是《秧Bot》,大家已经觉得很惊艳了↓ 今年,节目叫《武Bot》,机器人一个接一个的后空翻,给人都翻麻了,居然还会打醉拳↓ 去年机器人穿上衣服,感觉是在“拟人”,今年机器人穿衣服,你会觉得头和四肢是被刻意露出来的,不然真以为是真人演员混入其中。 大年初二——春晚过去两天后——英国《经济学人》的一篇分析指出,据研究机构奥姆迪亚公司估算,去年全球交付超过14500台人形机器人,几乎全部产自中国。 其中智元机器人和宇树科技合计贡献超过1万台出货量;而生产“擎天柱”机器人的特斯拉仅交付150台。 说回Anthropic和OpenAI,这两家公司在过去的一周除了“(不)牵手风波”之外,也发生了一些大事。 比如OpenAI一直以来心心念念的“硬件梦”,有新动静了。 据The Information的爆料,OpenAI正在研发的硬件不是一个,而是一串,包括智能眼镜、智能台灯、智能音箱。 其中预计最先上市的是智能音箱,可能在马年就可以和消费者见面。 不过,折腾半天,搞出来个大家都很熟悉的“智能音箱”,未免也太无聊了吧? 还真不一定。 OpenAI这智能音箱,据说是带摄像头的,而且是持续监听周围的声音——从这个角度看,比起之前那些用“小X小X”才能唤起的对话机器人类智能音箱,OpenAI想做的是一个真正融入你生活的多模态小硬件。 这听起来确实挺有想象力的,也挺……侵犯隐私的?且看OpenAI能不能打开局面吧。 至于Anthropic,过去一周发生了一件头疼事,那就是安全主管头子辞职了。 这个人叫 Mrinank Sharma,Anthropic安全部门主管。 他的辞职信很长,很关键的一句是,他说在组织内部看到了“在压力之下,我们不断被推着放下最重要之事。” 这话放Anthropic身上格外刺耳,毕竟这家公司一直强调“AI安全”,甚至号称构建大模型都要“符合道德”。 Sharma倒不是说Anthropic伪善,他表达的是一种深深的无奈。 也就是说,在当下,在这个社会环境中,即便是Anthropic,也无法牢牢将“艰难但正确”的事时时刻刻作为第一优先级去考虑和处理。 最有意思的是,Sharma这次不是跳槽去别的AI公司,也不是要自己去创业,而是表示,他将隐居英国,攻读诗歌学位。 “我感到自己被召唤去写作,去回应并深入参与我们所身处的时代,将诗性的真实与科学的真实并置为同样重要的认知方式。” 弃科从文,实在是一个颇有深意的选择。 他还在辞职信末尾引用了一首诗,是美国诗人、和平主义者威廉·斯塔福德(William Stafford)的。 我们也用这首诗,结束本次《AI八卦周刊》吧: 《事情的真相》(The Way It Is) 有一条线索你一直在追寻。它穿行于 不断变化的事物之中。但它本身从未改变。 人们对你追寻的对象感到好奇。 你必须向他们解释这条线。 但他人难以看清它的真貌。 只要你紧握着它,就不会迷失方向。 悲剧发生;人们受伤 或死去;而你承受痛苦并逐渐衰老。 你所做的一切都无法阻止时间的流逝。 你永远不会放掉那条线索。
AI支付暗战:Google带60家盟友,Stripe自己建了整条路
钱已经住在代码里了。 半年前AI支付还只是发布会上的PPT。如今的AI,都正在成为「收银台」。 现在在打开ChatGPT,搜任何一件商品,你会看到一个蓝色的Buy按钮。填地址,付款,发货。全程不跳转,不打开任何网页。 上周谷歌也跟上了,在搜索和Gemini里接入了Etsy和Wayfair的商品,直接在对话里结账。微软的Copilot同步上线了购物结算功能。Meta的扎克伯格刚宣布全面转向AI代理商务。 但更暗战的商业故事也在悄然上演,AI支付的过路费之争,要从2025年秋天的两大AI支付阵营说起。 9月16日,Google拉了60多家公司,发布了一份「AI Agent支付协议」。 名单上全是传统金融的老面孔:Mastercard、PayPal、American Express,再加几个科技圈的盟友。 同月29日,Stripe联合OpenAI发了另一套协议Agentic Commerce Protocol,简称ACP。Stripe同时宣布,它正在和Microsoft Copilot、Anthropic、Perplexity等AI公司测试基于ACP的代理商务解决方案,全是AI原生玩家。 两份名单,交集极少。Coinbase同时出现在Google的AP2生态里,也是Stripe的长期合作伙伴。 这两个阵营争的,是一个听起来平平无奇但价值万亿的问题:AI替人类花钱的时候,钱从谁的管子里流过去? 你可能觉得这事离你很远。但想想看:你现在让ChatGPT帮你订机票、让AI助手帮你比价买东西、让Agent自动采购办公用品,这些场景正在肉眼可见地变成现实。每一笔交易,都需要一根管子把钱从你的口袋运到商家那里。 谁修了这根管子,谁就能向每一笔交易收过路费。 这就是这场战争的本质。 Kite是首个面向AI智能体支付的Layer 1区块链,这一底层基础设施使自主AI智能体能够在具备可验证身份、可编程治理以及原生稳定币结算的环境中运行。 Kite由来自Databricks、Uber和UC Berkeley的AI与数据基建资深专家创立,已完成3500万美元融资,投资方包括PayPal、General Catalyst、Coinbase Ventures、8VC以及多家顶级投资基金会。 一场圆桌改变的12个月 故事要从一场饭局讲起。 2024年夏天,Stripe在旧金山总部接待了时任美国财政部副部长Wally Adeyemo,搞了一场金融科技圆桌会。 一群支付公司的老板坐在一起聊天,其中有两个人之前从没见过面:Stripe的CEO Patrick Collison,和一个叫Zach Abrams的年轻人。 Abrams的来头不小。他和搭档Sean Yu是连续创业者,2013年把第一家公司Evenly(做P2P转账的,类似美国版的Venmo)卖给了Square(现在叫Block)。 后来Abrams去Coinbase做了消费者产品负责人,还担任过Brex的首席产品官;Yu则先后在DoorDash和Airbnb做过工程师。2022年,两人重新组队创办了Bridge,帮企业接入稳定币支付。客户包括Coinbase和SpaceX。 那天圆桌会的话题本来很宽泛,但Abrams后来回忆说,他被吓到了:全场90%以上的时间都在聊稳定币,尽管他是在座唯一一家稳定币公司。 在那之前,Bridge一直在追Stripe当客户,想把自己的技术接进Stripe的支付体系。但那场圆桌之后,事情的方向变了。Collison开始频繁约Abrams见面,不是聊合作,是聊收购。 2024年10月,Stripe宣布以11亿美元收购Bridge。Bridge在2024年3月刚融完4000万美元的A轮(第一轮机构融资),估值2亿美金。 收购价是估值的5.5倍,按收入倍数算可能超过100倍。红杉资本在投后感言里说,他们相信Bridge会加入Instagram、YouTube、PayPal和WhatsApp的行列,成为「那种被收购后反而实现了全部潜力的公司」。 2025年2月,交易正式交割。Bridge的60人团队搬进Stripe旧金山总部,参加了Stripe每两周一期的新员工培训营。 这只是第一步。 接下来的事情发生得很快。2025年5月,Stripe推出稳定币金融账户,让101个国家的企业可以直接持有稳定币余额,在全球范围内用稳定币收付款。 同月,ChatGPT上线了购物推荐功能,用户可以在对话框里搜索商品、比较选项,然后跳转到商家网站下单。 6月,收购钱包公司Privy。 Privy干的事情很简单:让任何App都能内置一个数字钱包,用户不需要去下载什么额外的加密货币钱包软件就能完成链上支付。当时已经有超过7500万个账户在用它。 Patrick Collison发推说了一句很直白的话:「钱总要住在某个地方,Privy造的就是世界上最好的可编程金库。」 9月,和加密投资巨头Paradigm联合孵化了Tempo链,一条专门为支付设计的全新区块链。Paradigm的联合创始人Matt Huang(同时也是Stripe的董事会成员)亲自带队。 加入Tempo设计阵营的公司名单读起来像一场支付行业的全明星赛:OpenAI、Anthropic、德意志银行、Visa、Shopify、渣打银行、巴西最大数字银行Nubank、DoorDash、Revolut、韩国电商巨头Coupang。 Stripe CEO Patrick Collison表示,Tempo可以实现每秒处理数万笔交易、亚秒级确认,每笔手续费不到0.1美分,且交易费用以美元稳定币计价,不需要持有波动性极大的原生代币。 同月,Stripe和OpenAI正式发布ACP协议,同步上线了ChatGPT的Instant Checkout功能——用户在对话框里看到推荐的商品后,可以直接一键下单、付款,不跳转、不刷卡。 第一批支持的是Etsy商家,Shopify的百万商户随后跟进。 10月,Tempo完成5亿美元首轮融资,由Greenoaks和Thrive Capital领投,Sequoia、Ribbit Capital和SV Angel参投,估值50亿美元。一个刚成立不到两个月的区块链项目,50亿估值。Stripe和Paradigm本身没有参与这轮融资。 12月,Tempo开放公测。瑞银集团(UBS)、万事达(Mastercard)、欧洲先买后付巨头Klarna加入合作伙伴名单。 Bridge的Zach Abrams同时宣布,Bridge已经向美国申请了国家银行信托牌照(national bank trust charter),以符合2025年7月签署生效的稳定币监管法案,《GENIUS Act》的要求。 把这些事件串起来看:11亿买发币能力、做稳定币金融账户、收购钱包公司、孵化专属区块链、申请银行牌照。 从发币到建链到做钱包到定协议到拿牌照,Stripe把每一层都自己做了。 反观Google,60多家联盟、一份开放协议、一个代码仓库。Google什么都有,唯独没有自己的链、自己的稳定币、自己的钱包。 联盟是一群人坐下来开会的产物。Stripe做的是一个人拍板就能上线的系统。 Google发布AP2那个月,Tempo已经在测试了。 不管谁赢,Circle都稳赢 这场战争里有一个角色,比Stripe还聪明。 它不站队,不打仗,甚至不怎么说话。但不管谁赢,它都稳赢。 这个角色叫Circle。 Circle发行了一种叫USDC的稳定币,是目前全球合规程度最高的数字美元。 另一家公司Tether发行的USDT规模更大,但储备金够不够、审计靠不靠谱,监管机构吵了好几年也没个定论。 散户可能不在乎这些,但在AI的世界里,每天可能有十万笔自动交易,每一笔都需要经得起审计。没有一家正经公司敢把自己的AI交易建在一个合规存疑的稳定币上。 Circle呢?纽交所上市公司。美国证监会看过账本,每个季度披露财报,储备金有多少美国国债、有多少现金,全世界都看得到。 所以你看到了一个有趣的局面:Stripe的稳定币金融账户支持USDC。OpenAI通过Stripe用USDC。Google阵营里Coinbase接的也是USDC。 两个阵营打得头破血流,争的是「入口」,谁控制AI花钱的那个界面、那套协议。但不管入口在谁手里,钱最终都要换成稳定币在链上跑。而在合规稳定币市场里,USDC几乎没有对手。 两个阵营争入口,Circle拿结算量。 来看一组数据。2024年,全球稳定币转账总额达到15.6万亿美元。这个数字什么概念?和Visa全年的交易总额差不多。 一个诞生不到十年的东西,已经追平了Visa六十年建起来的网络。 而AI交易才刚刚开始。咨询机构Edgar Dunn&Co.预测,到2030年,AI驱动的交易将达到1.7万亿美元。这1.7万亿的每一笔,大概率都要经过稳定币这根管子。 美国财政部长Scott Bessent在2025年6月的参议院听证会上公开说过,稳定币市值达到2万亿美元是「非常合理的预期」。 Patrick Collison自己也说:美国银行存款的平均利率只有0.40%,4万亿美元的银行存款甚至是零利率。 他认为这种对消费者不友好的做法是一个「输家策略」,年轻人迟早会把钱换成收益更高的稳定币。 他说的是趋势。而Circle,正好站在趋势的正中间。 尾声 最后,让我们把镜头拉远一点。 这场AI支付的标准之争,表面上是两个商业阵营在抢地盘。但它背后折射出的,是一个更深层的问题:当AI开始独立地参与经济活动,我们为人类设计的金融体系还够用吗? Patrick Collison看到了一个未来,在那个未来里,AI Agent是经济活动的主要参与者。它们比价、采购、支付、结算,整个流程不需要人类按任何一个按钮。这是效率的极致,也是风险的边界。 Google和传统金融的联盟看到的是另一个未来:AI应该嫁接在人类已有的金融基础设施上,受人类已有的监管规则约束,在人类已有的信任框架里运行。 两个未来,两套逻辑,两个阵营。 但不管哪个未来到来,有一件事是确定的:AI要花钱,钱要在链上跑,链上的结算需要稳定币。 所以Circle继续赢。Stripe和Google继续打。监管继续追。商户继续接。消费者继续不知道自己的钱到底从哪根管子里流过去的。 直到有一天,AI帮你买的东西出了问题,而你发现没有人,也没有AI,知道该找谁退钱。 到那一天,所有人都会突然想起今天没有人回答的那些问题。 但到那一天,管子已经修好了,过路费也已经开始收了。 历史总是这样:先上车,后补票。 只是这一次,车开得太快了。
微信2026春节报告出炉:广东人最爱发红包,微信运动总步数达13.5万亿
凤凰网科技讯 2月23日,微信官方今日发布2026春节数据报告,通过平台交易、出行、社交等多维度数据,全景呈现了丙午马年春节期间国人的生活方式变迁与消费市场新特征。报告显示,新春消费与文化出行需求双向爆发,“仪式感”消费、跨境生活服务、县域文旅经济成为今年春节的核心亮点。 今年春节,“去‘马’地欢度‘马’年”成为出境游新风尚,带动境外线下消费迎来大幅增长。数据显示,春节期间马来西亚线下交易消费金额同比增长131%,马尔代夫线下交易消费金额同比增长186%。从地域来看,中国香港、中国澳门、泰国、韩国、马来西亚位列境外线下交易笔数最多的国家或地区TOP5,其中马来西亚小程序春节相关期间交易额同比增长超140%,罗马尼亚、巴拿马等国的中国游客也广泛使用微信支付,彰显出中国支付方式的全球渗透率持续提升。与此同时,冬奥热度为欧洲旅游注入活力,意大利成为线下交易笔数同比增速最快的国家。 境内出行与文旅消费同样呈现出“马力全开”的态势,超长假效应带动旅游、生活娱乐类交易笔数涨幅均超过20%。县域城市成为文旅消费的新增长点,通辽、鞍山、沧州、赤峰、周口位列下沉市场支付笔数增速最快的TOP5城市。景区消费方面,开封、黄山、苏州等传统文旅目的地热度不减,交易笔数同比分别增长超五成、超三成,“湛江”凭借年味游与非遗游的升温,成为春节期间搜索量增速TOP1的城市,黄山、湛江、香港、澳门、汕头则位列微信搜索旅游目的地同比增幅TOP5。值得关注的是,海南凭借“封关后首个长假”的独特优势,相关交易金额同比增长81%,成为新春消费的热门目的地。 消费市场的细分领域同样亮点纷呈,健康与新能源相关消费需求持续攀升。在港人网购年货的热潮中,医疗美容相关消费增速最快,喜茶、瑞幸、霸王茶姬为热销茶饮品牌TOP3,电商平台相关订单同比增长近430%,港人私家/民营医院诊所的消费笔数也同步增长。新能源出行成为春节返乡与出游的主流方式,小程序端新能源车充电量同比提升34%。此外,春节期间微信运动用户总步数达13.5万亿,绿色出行理念深度融入新春生活。 传统民俗在数字时代焕发全新活力,社交场景的数字化创新成为今年春节的鲜明特征。春节期间,用户发送封面红包的次数超过6亿次,轻量化的发红包方式让年味传递更高效。拜年形式也愈发多元,超921万条和春节有关的内容在视频号发布,同比增幅达59%,“热气腾腾中国年”视频号话题活动播放量超3.2亿次,“除夕吃大年夜”“春节好快乐”成为最热门的特效模板。 广东人延续了“最爱发红包”的传统,微信小店日均订单数较平日增长两倍,带动超42%的小店热门商品成交。此外,AI技术也融入新春互动,“AI拜年”相关搜索热度攀升,小游戏“春节打擂台”吸引玩家参与,共发放超260万份品牌奖品,数字技术让传统年味有了全新表达。
韩国“唯一保持领先的技术”被中国反超
据韩联社22日报道,数据显示,在韩国重点布局的11大领域、136项核心科学技术中,2022至2024年间,韩中两国技术水平差距进一步拉大。韩国在战略技术领域中唯一保持领先的二次电池技术水平也被中国反超。 报道称,韩国科学技术信息通信部近期向国家科学技术咨询会议提交的《2024年度技术水平评估结果(草案)》显示,以全球最高技术水平国家美国为基准,2024年韩国与美国的技术差距为2.8年,中国与美国的差距为2.1年,韩国与中国的差距为0.7年。具体来说,韩国与美国之间的技术差距由3.2年缩小至2.8年,减少0.4年;而在对华比较中,韩国自2022年首次被中国超越,当时差距为0.2年,2024年又扩大0.5年。 报道介绍,本次评估围绕11个领域136项国家核心技术,对韩、中、日、欧、美5个国家和地区的论文与专利进行定量分析,并结合1180名专家问卷调查的定性评价综合形成。在整体技术水平方面,以美国为100%计,欧盟为93.8%,中国为86.8%,日本为86.2%,韩国为82.8%。 报道说,针对136项技术中的50项国家战略技术的评估显示,与美国相比,韩国的技术差距为2.6年,中国为1.4年,中国追赶势头尤为明显。具体来说,韩国与美国的技术差距从2022年的3年缩小到2024年的2.6年,缩小幅度为0.4年,而中国同期缩小幅度为0.8年,战略技术差距加速收窄。 韩联社还提到,2022年韩国在二次电池领域曾独居第一,当时领先0.9年。但2024年的评估显示,中国已跃居第一,韩国与中国之间形成0.2年的技术差距。同样,在2022年韩国位居第二的半导体与显示领域,2024年技术差距方面,韩国落后美国0.7年、中国落后美国0.8年;在技术水平占比上,韩国为91.2%,中国为91.5%,中国实现反超。
微信否认抢红包有“手气最佳攻略”:纯靠运气和手速
凤凰网科技讯 2月14日,“微信派”新一期播客节目披露了红包功能的多项设计逻辑。针对“第二个抢红包最容易手气最佳”“网速越快,抢到的金额就越大”等传闻,微信支付产品经理“飞哥”表示,微信红包相比于线下,很重要的一个特点是随机性,而随机性也是微信红包趣味感的重要来源。对于网上流传的“手气最佳攻略”,“飞哥”澄清说,每个红包的金额都是由服务器在生成时随机分配的,不存在任何预设的规则或技巧。“最重要的其实是手速快一点,确保自己能够抢到红包,这才是最实在的。” “飞哥”介绍,微信红包单个金额上限设定为200元,初衷是将其定位为“能给人带来快乐的游戏”,避免给用户带来心理压力和门槛,200元在我们的感知上已经可以表达情谊的一个数,但也没有多到让人非常有压力。 针对特定节日红包上限临时调整至520元的机制,“飞哥”称这是顺应情人节、七夕等节点的用户需求,这些节日是红包功能的自然使用高峰,用户发的金额代表一些了特殊情谊和含义,发现确实有用户发“13.14” “5.2”,所以“520”红包是一个顺水推舟,成人之美的事情。 他还在节目里提到一个有趣的信息:情人节当天单个用户最多收到200多个520元红包,单个用户最多发出150余个520元红包。 关于红包为何不支持撤回,“飞哥”表示,用户对此并无明显诉求,且撤回功能会增加产品复杂度与发红包者的心理负担。他认为红包本质上是游戏功能,即便误发也可能带来“意想不到的连接”。 微信团队此前公布数据显示,今年春节期间微信红包发出次数超40亿次,红包功能上线至今已12年。
中国宇树机器人春晚炸场引外国网民破防,美国制裁宇树机器人,美媒一句话让特朗普下不来台
除夕夜的央视春晚舞台,灯光聚焦处,一群特殊的“武者”静立如松。 鼓点骤起,二十多台宇树科技的人形机器人阵列排开,与河南塔沟武术学校的少年们同台而立。 下一秒,机械臂划出刚劲的弧线,马步、冲拳、腾跃,动作整齐划一,力道精准。 这还不是高潮。 节目中段,领头的机器人一个助跑,蹬墙借力,身体在空中完成两周半的翻转,随后稳稳落地,厘米不差。 紧接着是连续的花式翻桌跑酷,机器人在高低错落的障碍间穿梭跳跃,最快跑位速度达到每秒4米。 节目尾声,身高近1.8米的H2型号机器人以“剑宗大师”形象压轴,手持长剑完成一套张弛有度的剑法,最后牵起少年武者的手,共同抱拳行礼。 这场名为《武BOT》的表演,在2026年2月16日晚上8点,通过直播信号传遍了全球。 海外社交媒体瞬间被点燃。 YouTube上的直播切片在几小时内播放量突破30万,推特相关话题下挤满了各种语言的惊叹。 “来自未来的功夫”、“这确定不是CG特效? ”、“中国机器人已经进化到这个程度了? ”类似的评论刷满了屏幕。 一些科技博主开始逐帧分析机器人的动作细节:空翻高度超过3米,落地时躯干有极细微的起伏模拟呼吸收势,多机协同变阵时几乎看不到延迟。 更让业内震惊的是,宇树科技事后证实,这场包含高难度武术动作和复杂队形变换的表演,全程没有外部遥控,依靠的是机器人自带的3D激光雷达和AI融合定位算法自主完成。 也就是说,几十台机器人在舞台上自己“看”路,自己“想”怎么走位,自己调整动作。 大洋彼岸的反应,比网友的惊叹要复杂得多,也迅速得多。 就在这场全球瞩目的春晚表演进入最后彩排阶段时,当地时间2026年2月13日,美国国防部官网悄然更新了所谓的“1260H中国军事企业清单”。 这份清单新增了包括宇树科技、阿里巴巴、百度、比亚迪等在内的78家中国企业。 戏剧性的是,清单发布后不到一小时就被紧急撤回,官方未作任何解释。 次日,2月14日,五角大楼原封不动地重新发布了这份清单。 这一“闪现撤回”的操作,被外界解读为美国内部激烈博弈的缩影。 清单的制裁核心很明确:禁止美国联邦政府及其承包商采购这些企业的产品与服务;禁止美国投资者买卖或持有这些企业的证券;并通过“污名化”效应,迫使全球供应链企业减少与它们的合作。 美国国防部给出的理由,并非宇树科技直接生产军用装备,而是其作为国家级“专精特新小巨人”企业,接受了政府产业支持,且其机器人技术“具备军民两用潜力”。 五角大楼的报告中,将春晚机器人表演的每一个技术点,都对应到了潜在的军事应用上:集群控制技术可用于构建战场“蜂群”无人机编队;高动态运动能力和精准落点控制,能让机器人在崎岖地形执行侦察或物资运输;AI环境感知与实时避障,则适用于城市巷战等复杂环境。 报告特别指出,节目中机器人展示的“醉拳摔倒后自主起身”能力,背后是先进的模型预测控制算法,这能保障单兵机器人在炮火覆盖等极端条件下的稳定运行。 一边是春晚舞台上自信满满的科技汇演,另一边是紧随其后的紧急制裁清单。 这种时间上的紧密衔接,很难用巧合来解释。 它更像是一种基于技术焦虑的“条件反射”。 而真正刺痛美国神经的,或许还不是那场武术表演,而是摆在桌面上的、冷冰冰的全球产业数据。 这里有一组让很多人感到意外的数字:在刚刚过去的2025年,全球人形机器人出货量接近1.8万台,同比暴涨超过500%。 其中,中国厂商的出货量占比达到了惊人的约90%。 也就是说,全球每卖出10台人形机器人,有9台产自中国。 更具体的头部格局是:中国的宇树科技和智元机器人两家企业,各自的出货量都达到了约5000台,两家合计就拿下了全球接近60%的市场份额。 相比之下,国际厂商大多仍停留在试点测试阶段。 备受瞩目的特斯拉Optimus人形机器人,在2025年正式启动了量产,但同期的实际交付量,根据多家市场机构的观测,仅在150台左右。 这个三位数与五千台的对比,清晰地勾勒出当前赛道产业化落地的真实图景:中国公司不仅在技术上实现了突破,更在规模化量产和商业交付上,取得了显著的领先。 这种领先并非一日之功。 宇树科技成立于2016年,从浙大校园起步,最初以消费级四足机器狗打开市场。 其Go1、Go2系列产品凭借高性价比,迅速在全球市场占据超60%的份额,累计销量超过15万台。 正是通过在消费级市场积累的技术和资金,宇树得以向更高端、更复杂的人形机器人领域迭代。 #烟火赴新年#其核心策略是“全栈自研”:高扭矩关节电机、行星减速器、力控传感器、运动控制器,整机国产化率超过90%。 自研的M107电机,单关节最大扭矩达到360牛·米,功率密度对标国际顶尖水平。 这意味着,从最核心的“关节”开始,宇树就不依赖海外供应链。 这也正是面对美国制裁时,宇树被认为“卡不住”的底气所在。 它的主要市场在国内和欧洲、东南亚,美国市场营收占比不足5%,政府采购禁令的影响微乎其微。 美国的制裁,在某种意义上,成了中国机器人技术实力的一个“反向认证”。 它标志着美国对华科技打压进入了新阶段:从“实体清单”式的技术封锁,转向“军事清单”式的身份污名化与资本切断;从针对“已涉军”技术,转向遏制“可涉军”的民用前沿技术。 人形机器人,作为具身智能的终极形态之一,被普遍认为是继个人电脑、智能手机之后的下一代通用计算平台,是AI从虚拟世界走向物理世界的关键入口。 谁掌握了它的核心技术和量产能力,谁就可能在未来的制造业、服务业乃至更广泛的领域掌握话语权。 显然,美国不愿拱手相让。 在将宇树科技列入清单的同时,特朗普政府正在积极酝酿一项国家级的机器人战略。多方信息显示,一项名为“机器人行政令”的政策可能在2026年正式推出。 该行政令的核心框架被预测包括:为工厂部署人形机器人提供设备成本30%的税收抵免;设立数十亿美元的“物理AI研发基金”,重点攻克高扭矩电机、固态电池等核心部件;以及对来自中国等“享受政府补贴”的机器人产品加征25%至35%的关税,以保护本土市场。 其战略目标直指2030年:通过机器人自动化让美国制造业成本降低20%,本土工厂产能提升30%,并占据全球人形机器人市场份额的40%以上。 特斯拉的Optimus被寄予厚望,计划在2026年底启动年产100万台的生产线。 这就形成了一个清晰的竞争闭环。 中国通过企业在消费市场和研发上的快速迭代,在产品和成本上建立了优势,并通过春晚这样的顶级舞台展示了技术肌肉。 美国则试图通过国家力量和政策杠杆,扭转在产业化进度上的落后,并直接制裁最具威胁的竞争对手,试图延缓其发展速度。 制裁宇树,只是这场漫长竞赛中的一个战术动作。 回过头看春晚的《武BOT》节目,它的意义早已超越了一场单纯的文艺表演。从2025年11月启动筹备,到除夕夜直播,三个多月里,宇树团队拆解了无数技术模块:升级群控平台、优化定位算法、测试新型运动控制算法、与武术演员团队线下磨合、在实景场地反复联排。 他们要解决高速运动中的精准定位问题,防止机器人在空翻后“跑飞”;要确保几十台机器在复杂灯光和声场下,依然能保持毫秒级的协同误差;还要让机械动作体现出武术的“劲力”与“神韵”,而非僵硬的程序摆动。 最终呈现的,是一场零失误的直播。 这无异于一次在极端复杂环境下的高规格技术压力测试,并且通过了。 当机器人在舞台上流畅地打出一套醉拳,甚至故意设计出踉跄摔倒再自主起身的桥段时,它所展示的,不仅是平衡与控制算法,更是一种应对不确定性的“鲁棒性”。 这种能力,正是未来智能体融入真实世界所必需的。 无论是工厂里应对突发状况的巡检机器人,还是家庭中提供服务的陪伴机器人,乃至更多我们尚未想象到的场景,都需要这种坚实的底层技术支撑。 2026年2月,从杭州的春晚排练厅到华盛顿的五角大楼,一场关于机器人未来的隔空对话已经完成。 对话的载体,是二十多台翻腾跳跃的钢铁之躯,和一份写满企业名字的制裁清单。 对话的内容,无关表演是否精彩,而关乎下一个时代的产业主导权,将握在谁的手中。 全球的观众,在惊叹于科技之美的同时,也亲眼目睹了大国科技竞争进入深水区的一个标志性切面。 技术本身没有国籍,但技术的开发者和竞赛的跑道,却有清晰的来处与方向。 当机器的“拳风”掠过春晚的舞台,它所搅动的,远不止是除夕夜的欢声笑语。
开年,深圳首个百亿独角兽诞生
作者/杨继云 报道/投资界PEdaily 马年首个百亿具身独角兽诞生了。 投资界获悉,今日(2月23日),生产力型通用智能机器人公司智平方(AI² Robotics)宣布完成超10亿元B轮系列融资,投资方颇为豪华:中车资本、百度战投、沄柏资本、国泰海通、多家特斯拉生态链龙头企业及地方基金等。 至此,智平方在一年内累计完成12轮融资,估值超百亿人民币,也成为这一波深圳首个百亿具身智能独角兽。如此节奏背后,是投资人之间难得的共识:某种程度上,智平方是当前“最像特斯拉”的中国机器人创业公司,正如本轮融资罕见地集体出现了特斯拉生态伙伴的身影。 这番盛况,无疑是中国具身智能爆发最生动的写照。中国机器人正在走向历史更深处,诸神之战,悄然打响。 80后博士,缔造百亿估值 “最像特斯拉机器人” 智平方的故事,始于80后博士郭彦东。 早年他在北京邮电大学完成本科和硕士学业,2013年从美国普渡大学电子与计算机工程学院博士毕业,师从美国工程院院士Jan Allebach和Charles Bouman教授。后来,郭彦东入选国家级创新领军人才,同时也是香港科技大学(广州)的兼职教授。 智平方创始人兼CEO郭彦东 创业之前,郭彦东的职业履历亮眼——曾在微软西雅图总部担任研究员,回国后担任小鹏汽车和OPPO的首席科学家与研发高管,主导的各式智能系统在数十万台智能汽车、数亿台消费电子终端、机器人、微软MaaS投入使用。这样的经历,让他更倾向于“技术创新与产业落地的双向兼顾”,是行业稀缺的“AI+智能硬件”专家。 时间来到2023年初,郭彦东在深圳南山区创办了智平方,要做拥有“具身智能大脑”的新一代机器人。 过往多年的研发与管理实践让他意识到,通用人工智能的未来不在于单纯的算法突破,而在于让智能机器人真正走进真实场景,承担“人类不愿从事、不能从事”的工作。而具身智能的核心竞争,在于大模型的原创能力与持续迭代效率。 因此,智平方定位为AGI原生的通用智能机器人企业,与特斯拉相同,是行业稀缺的生产力型通用智能机器人研发、生产与服务提供商,聚焦生产力型通用智能机器人(非表演)这一颠覆性的智能终端品类。 当多数具身企业仍停留在实验室原型研发,要么偏重算法,要么主攻硬件落地时,郭彦东则带领团队跳出“单一维度突破”的误区,确立了“全栈自研、算法驱动硬件”的技术路线,自成立就坚持端到端大模型的技术范式——2023年时,全球创业团队仅有特斯拉机器人与智平方选择了这条鲜有人走的技术路线。这一幕,投资人看在眼里。 此后,在行业尚未形成共识前率先布局VLA架构(而非套用开源),智平方原创研发全球首个全域全身VLA大模型GOVLA,实现从桌面到开放环境、从单臂到全身协同、从简单执行到长程推理的跨越式突破,并不断迭代—— GOVLA 0.0(RoboMamba),在模型规模仅为谷歌同类模型1/20的情况下,性能提升超过80%,获得图灵奖得主Yann LeCun关注; 进一步推出的快慢系统深度融合的最强开源模型GOVLA 0.5(FiS-VLA),成为业内首个“异构输入+异步频率”双系统VLA模型,并开创性地提出“双系统感知协同训练策略”, 重新定义了机器人“又快又聪明”的可能性; 目前,智平方已研发出更为强大的 GOVLA 1.0 版本,夯实“全球基础模型龙头”地位。 这背后离不开长期高压投入。投资界获悉,智平方自成立即搭建千卡级算力集群,并构建自有训练加速体系——更高效的数据利用率,意味着更快的模型进化速度,也意味着更难被追赶的技术代差。 仅仅在2025年,团队有数十篇论文被顶级会议收录,仅NeurIPS就达6篇,在世界模型、多模态理解与VLA方向持续获得国际认可。摩根斯坦利也在同年的机器人产业深度报告中,将智平方列为具身基础模型的代表企业。 外界可能不知道,智平方创办至今吸引众多来自微软、谷歌、OPPO、小鹏、Momenta等行业头部企业,以及清华、北大、中科院、CMU、伯克利等顶尖学府的科学家与工程专家加入,目前拥有5位斯坦福全球前2%科学家加盟,堪称科学家密度最高的机器人创业团队之一。 凶猛融资背后 他们拿下超级订单 乘着具身智能的东风,智平方留给创投圈深刻印象。 2023年8月的天使轮融资中,SEE Fund、清智资本、国投创盈联手出资。2025年,智平方迎来融资爆发期,短短半年完成多轮数亿级融资——先是1月宣布完成数亿元Pre-A轮战略融资,由达晨财智与敦鸿资产联合领投,基石资本跟投;随后3月完成新一轮过亿元Pre A+轮融资,投资方包括敦鸿资产、云启资本和国投创盈等财务与产业基金等。 行至2025下半年,智平方先后完成由国中资本领投和普华资本领投两轮融资,达晨财智、基石资本、南山战新投等身影浮现;后来,公司完成由深创投领投的新一轮A系列融资,其中深创投押注超过亿元,老股东敦鸿资产、国投创盈持续加码,同时吸引了华熙生物和一家大型零售企业以产业资本身份加入。 而马年开年,B轮系列融资正式出炉,投资方涵盖了互联网和AI巨头、头部央企、特斯拉生态链龙头、头部PE与券商系等顶级资本——一种声音认为,持续加注、融资火爆的背后,是投资人在智平方身上看到的鲜明“特斯拉基因”,以及让通用智能机器人提供真实服务的“生产力”型稀缺产品路线 如此迅猛的融资速度,离不开商业场景落地和真实交付。 据了解,智平方围绕GOVLA打造的AlphaBot(爱宝)系列机器人,已在两年内完成三代迭代,最新AlphaBot 2采用轮式双臂结构,核心部件无故障运行时间超5万小时,达到工业级可靠性标准。 2025年9月,智平方自有产线启用,随后完成产能爬坡,已具备年产千台级的能力。依托自建产线,智平方去年12月已实现单月百台级AlphaBot 2的真实交付。据悉,公司将在2026年将产能规划至万台规模。 积累了业内稀缺的硬件量产经验后,智平方够像特斯拉一样深刻理解供应链与生态体系,重视量产与工艺——在最恰当的时间构建自有生产体系,为规模化交付的一致性和时效性提供了保障。 商业化路径逐渐清晰。目前,在工业柔性制造领域,爱宝已进入汽车制造、半导体、生物科技与半导体显示面板(惠科)等高端场景,承担分拣、转运、贴标与辅助装配任务。 智平方爱宝作为“干活”机器人代表登上《新闻联播》 值得一提的是,智平方与全球第三大面板厂商惠科签订的3年1000台订单,因交付计划与场景清晰,被摩根士丹利认定为全球生产力型机器人最大的单一订单。 而在公共服务领域,爱宝已在复杂开放环境运行,例如在核心交通枢纽等为乘客提供贴心服务。 此外,智平方在新零售领域推出全球首个模块化具身智能服务空间“智魔方”,已陆续在北京、深圳、上海、无锡、常州等城市常态化运营,机器人每日持续工作10小时以上,日均制作咖啡与冰淇淋数百杯,稳定制作0失误。 正是这些海量而丰富的数据,能让大模型能够直接从复杂的真实世界中高效学习,从而显著提升其泛化能力。由此,中国具身智能商业化一幕席卷而来。 分水岭 有人开始出局 此时此刻,中国具身智能正迎来最好时代。 这里融资火爆,竞相斗艳。正如刚刚过去的马年春晚,多家机器人公司相继亮相,他们合作身份各不相同,却暗自较量着——不再只是跳舞、表演,还要比“脑子”、比协作、比落地。这场春晚,成为中国具身智能行业的一场正面卡位战。 而在春晚开播两小时里,京东机器人搜索量环比增长超300%,订单量暴涨150%。 另一边,我们正在目睹具身智能排队IPO,宇树科技、智元机器人、银河通用等身影浮现。 这些热闹只是表象,另一场竞赛已经打响——真正的头部玩家需要有跳出资本“输血”支撑的能力,最终走向机器人公司存活的核心命脉,订单。 资本层面乐于见到更高层面对产业的支持,但这些公司也需要更努力地做出商业化,匹配市场给予的估值。 虽然中国机器人军团开始横扫全球,但依旧是那个朴素的道理:谁能真正商业化落地,获得稳定的订单,谁才有可能笑到最后。 分水岭即将到来。
智谱GLM-5技术全公开!完全适配华为等国产芯片 美国网友酸了
GLM-5是怎么炼成的? 现在,它背后的论文终于完全公开了。 论文的名字也很直接:告别Vibe Coding,迈入智能体工程(Agentic Engineering)。 也正如我们之前实测的那般,它可以自己连续跑代码超过24小时、700次工具调用、800次上下文切换,从零直接手搓一个Game Boy Advance(GBA)模拟器。 一言蔽之,GLM-5把开源AI拽进了长任务时代。 外国网友直呼“GLM-5是最好的开源模型”: 并且还认为“极大拉小了和Claude Opus 4.6之间的距离”: 除此之外,资本市场的表现也是可以从侧面印证一家大模型公司的实力。 毕竟春节期间,智谱股价飙升的程度,毋庸置疑,大家有目共睹。 现如今,这份长达40页的论文,彻底揭开了它背后的一切技术秘密。亮点如下: 架构方面: 在上一代经过验证的ARC(智能体、推理与编程)能力和MoE之上,引入DeepSeek同款稀疏注意力(DSA);成本大幅打下来了的同时,长上下文能力却一点没丢。 后训练方面: 全新构建的异步强化学习基础设施,把生成和训练解耦,加上独创的异步智能体RL算法,让效率大幅提升。 芯片适配方面: GLM-5完成了与华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、沐曦以及燧原等国产芯片的全栈适配。 这也让不少网友在看完论文之后直呼: 在成本效率方面,美国的AI赶不上中国。 接下来,就让我们一起深入扒一扒这篇让外国网友羡慕的技术论文。 GLM-5的三大关键技术 在深入技术之前,我们需要先理解GLM-5在技术发展当下所面临的难题,即大模型需要真正开始干复杂的难活儿了。 因为在GLM-4.5时代,智谱已经证明了将ARC能力融合进单一MoE架构是完全可行的。 但当模型真正投入到复杂的软件工程、长周期多轮对话的真实业务中时,算力成本和真实环境适应性成为了老大难的问题。 △GLM-5 的整体训练流程 GLM-5要解决的就是这些瓶颈。因此,它在核心技术方面祭出了三把板斧。 第一板斧:引入DeepSeek同款稀疏注意力机制 在Transformer架构中,传统的密集注意力计算复杂度是随着上下文长度呈平方级(O(N2))增长的。 当上下文窗口扩展至200K甚至更长时,计算成本将变得极其昂贵,这成为限制智能体处理复杂任务的主要瓶颈。 GLM-5的解法是引入DSA这个动态稀疏注意力机制,它的核心理念是用动态的细粒度选择机制替换传统的密集注意力。与固定的滑动窗口模式不同,DSA 会“审视”内容,动态决定哪些Token是重要的。 然而,直接训练一个基于DSA的超大模型无异于走钢丝,很容易因为稀疏化带来的信息丢失而导致梯度爆炸或模型崩塌。 因此,GLM-5团队采取了一种极其巧妙的继续预训练策略,主要包含两个步骤: 稠密预热(Dense Warm-up):模型并非一上来就搞稀疏。在预训练的初始阶段,模型依然使用相对稠密的注意力机制(类似于MLA的变体),让模型先看全所有的信息,建立起全局的、稳固的语义表征能力。这就好比一个人在学习速读之前,必须先扎扎实实地精读。 平滑过渡与稀疏训练(Sparse Training):当模型具备了良好的基础后,开始逐步提高稀疏度。DSA的核心逻辑是:在计算当前Token的注意力时,不再关注历史上的所有Token,而是通过一个动态的路由机制(Routing Mechanism),只挑选出与之最相关的Top-K个Token进行计算。 △MLA与DSA训练的SFT损失曲线对比 根据技术报告披露的数据,这一板斧砍下去,效果是立竿见影的: KV Cache开销骤降75%:这意味着同样的显卡,现在可以支撑4倍以上的并发请求,或者处理长达4倍的上下文。推理速度提升3倍:注意力计算的FLOPS被大幅削减,首字响应时间(TTFT)和每秒生成Token数(TPS)都达到了行业顶尖水平。长文本能力几乎无损:这是最令人不可思议的一点。在著名的大海捞针以及诸如RULER等长文本复杂推理评测中,引入DSA的GLM-5与全稠密模型相比,性能下降微乎其微(小于0.5%)。第二板斧:异步多任务强化学习 如果说DSA解决的是推理成本问题,那么GLM-5的第二板斧,解决的就是训练效率问题,尤其是决定模型最终智商的后训练阶段。 当前业界主流的强化学习对齐算法依然是PPO(近端策略优化)。 标准的PPO是一个高度同步的过程,涉及到四个模型,即Actor生成模型、Reference参考模型、Critic评论家模型、Reward奖励模型在多台GPU上的协同。 这种“走一步,停一下”的同步机制,导致整个集群的GPU利用率经常徘徊在20%-30%左右,大部分算力都浪费在等待网络通信和进程同步上了。 为了打破这个瓶颈,智谱基于4.5时代的Slime框架,为GLM-5从底层重写了一套异步强化学习基础设施(Asynchronous RL Infrastructure)。 它的核心设计是将训练引擎和推理引擎解耦到不同的GPU设备上。推理引擎持续生成轨迹,一旦生成数量达到预定阈值,这批数据就被发送到训练引擎更新模型。为减少策略滞后并保持训练的近似同策略性,推理引擎的模型权重会定期与训练侧同步。 这种完全异步的训练范式,通过减少Agent rollout期间的“气泡”时间,显著提升了GPU利用率和训练效率。 但要支撑这种异步架构,还有几个关键技术难题需要解决: 第一,Token-in-Token-out(TITO)代替Text-in-Text-out。 在RL rollout设置中,TITO意味着训练流程直接消费推理引擎生成的精确tokenization和解码token流来构建学习轨迹。相比之下,Text-in-Text-out将rollout引擎视为返回最终文本的黑箱,训练器需要重新tokenization重建轨迹。 这个看似微小的选择实际上影响巨大:重新tokenization可能在token边界、空白处理、截断或特殊token放置上引入细微不匹配,从而影响对单个token采样概率的估计。GLM-5实现了一个TITO网关,拦截rollout任务的所有生成请求并记录每个轨迹的tokenID和元数据,将繁琐的tokenID处理从下游Agent rollout逻辑中隔离出来。 第二,直接双侧重要性采样解决离策略偏差。 在异步设置中,rollout引擎可能在单个轨迹生成过程中经历多次更新,这使得追踪历史训练侧模型的精确行为概率在计算上不可行——维护多个历史模型权重显然不现实。 研究团队采用简化方案:将rollout期间生成的对数概率作为直接行为代理,通过计算重要性采样比rt(θ) = πθ/πrollout,丢弃传统的πθ_old,消除单独旧策略推理的计算开销。同时采用双侧校准token级掩码策略,将信任域限制在[1-ε_l, 1+ε_h],对落在此区间之外的token完全屏蔽梯度计算。 第三,DP感知路由加速长上下文推理。 在多轮Agent工作负载中,来自相同rollout的顺序请求共享相同前缀。研究团队提出通过一致性哈希将每个rollout ID映射到固定数据并行(DP)rank,并结合哈希空间上的轻量级动态负载重新平衡。这避免了冗余的预填充计算,无需跨DP rank的KV同步,随着rollout长度增加,预填充成本仍与增量token成正比。 这套异步RL基础设施支撑了GLM-5在多领域的混合RL训练:数学、科学、代码和工具集成推理(TIR)。数据来源包括开源数据集、与外部标注供应商共同构建的STEM问题、Codeforces及TACO等代表性数据集。训练中为各领域分配专属裁判模型或评估系统生成二元结果奖励,四个领域的整体混合大致保持平衡。 第三板斧:投喂真实世界数据 传统SFT数据往往依赖标准答案,但真实世界是复杂多变的。 为了让模型具备真正的工程能力,GLM-5的第三板斧,就是构建大量可验证的真实世界环境数据。 整个SFT语料库涵盖三大类别:通用对话、推理、编程与Agent。 值得注意的是,GLM-5在SFT阶段将最大上下文长度扩展至202752个token,并支持三种不同的思考特征: 交错思考:模型在每次响应和工具调用前进行思考,提升指令遵循和生成质量;保留思考:在Coding Agent场景中,模型自动在多轮对话中保留所有思考块,复用已有推理而非重新推导,减少信息丢失和不一致性;轮级思考:支持在会话中对每轮推理进行精细控制,轻量级请求可禁用思考降低延迟,复杂任务可启用思考提升精度和稳定性。 为了支持Agent RL,研究团队还构建了大规模的、可验证的可执行环境: 软件工程环境:基于真实世界的Issue-PR对,采用RepoLaunch框架自动分析仓库安装和依赖设置,构建可执行环境并生成测试命令。最终跨数千个仓库、涵盖9种编程语言(Python、Java、Go、C、C++、JavaScript、TypeScript、PHP、Ruby),构建了超过10000个可验证环境。 终端环境:采用三阶段Agent数据合成流程——任务草稿生成、具体任务实现、迭代任务优化。从种子任务出发,利用LLM生成可验证的终端任务草稿,由构建Agent在Harbor格式中实例化为具体任务(结构化任务描述、Docker化执行环境、测试脚本),再由精炼Agent迭代优化。整体流程产出数千个多样化终端环境,Docker构建精度超过90%。 搜索任务:构建Web知识图谱,以低至中频实体为种子节点扩展多跳邻域,将每个子图转化为隐式编码多实体关系链的问题。再经过三阶段过滤(删除无工具推理模型能答对的、过滤早期Agent能几步解决的、双向验证拒绝非唯一答案或不一致证据的),最终获得高质量、高难度的多跳问答对。 PPT生成:采用多层级奖励机制——第1级关注静态标记属性(定位、间距、颜色、字体等),第2级评估运行时渲染属性(元素宽高、边界框等),第3级引入视觉感知特征(异常空白模式等)。最终生成的页面中严格符合16:9宽高比的比例从40%提升至92%,页面溢出显著减少。 大模型的测试也更难了 技术的进步最终需要经受评测的检验。 GLM-5的论文不仅展示了其在传统榜单上的成绩,更揭示了一个趋势:大模型的测试正在变得更难、更贴近真实。 在Humanity’s Last Exam(HLE)、SWE-bench Verified、BrowseComp等关键榜单上,数据显示,GLM-5在SWE-bench Verified上得分77.8%,在开源模型中达到SOTA,优于Gemini 3 Pro,并与Claude Opus 4.5相当。 在HLE(含工具)测试中,GLM-5得分50.4,优于Claude Opus 4.5和Gemini 3 Pro。 在Artificial Analysis Intelligence Index v4.0中,GLM-5得到50分,成为新的开源SOTA模型,这是开放权重模型首次在该指数中达到50分。 然而,智谱团队认为,传统的SWE-bench已经不够看了。 因为它是一个静态、公开且发布超过2年的测试集,模型可能存在记忆效应。 为此,GLM-5团队推出了CC-Bench-V2,一个完全自动化的、模拟真实软件开发的评测集,涵盖前端、后端和长程任务。 在前端评估中,团队引入了Agent-as-a-Judge技术,通过GUI Agent模拟用户交互,验证生成项目的功能正确性。 结果显示,GLM-5的构建成功率(BSR)达到98.0%,在检查项成功率(CSR)上与Claude Opus 4.5具备竞争力。 在后端评估中,GLM-5在真实开源项目上的Pass@1达到25.8%,与Claude Opus 4.5相当,显著领先于GLM-4.7。 更值得一提的是长程任务评估。CC-Bench-V2通过挖掘已合并的Pull Request构建多步链式任务,评估模型在增量开发中的上下文跟踪与规划能力。 虽然GLM-5在此项上较GLM-4.7有显著提升,但与Claude Opus 4.5仍有差距。团队坦言,这是因为链式任务中错误会累积放大,缩小这一差距需要在长上下文一致性和长程自纠错方面继续突破。 这一系列评测结果释放了两个明确信号: 第一,GLM-5 是开源界的第一个“全站工程师”,让 AI 能自主执行超长、超复杂的任务; 第二,通过单体MoE架构统一Agent、推理与代码能力的可行性得到了验证,同时证明了RL在复杂代码生成中的巨大潜力。这对闭源模型而言,无疑是一种巨大的冲击。 One More Thing 在论文的最后,团队透露了一个有趣的彩蛋——Pony Alpha实验。 在论文公开前,GLM-5曾以Pony Alpha为代号,匿名发布在OpenRouter平台上。隐去品牌信息后,模型凭借卓越的性能在社区引发轰动。 初步统计显示,25%的用户推测它是Claude Sonnet 5,20%认为是Grok的新版本,仅有部分用户猜中了GLM-5。 这次匿名测试打破了先入为主的地缘偏见,让社区的认可回归到了“好用与否”这一最纯粹的技术本质。 最终确认Pony Alpha真身即是GLM-5,这对团队是一次巨大的鼓舞,也有力回击了长期以来外界对中国本土模型技术水准的质疑。 不仅如此,这次GLM-5论文公布之后,在海外已经有不少人当教程来学习了。
中国也有了世界第一的模型,他的名字叫Seedance 2.0
Seedance2.0的火,已经烧了好几天了。 抖音b站到处都是二创视频,微博科技榜一下子上了四个热搜。 就连我前天随手写了一篇关于Seedance 2.0的纯文字,都10万+了。 我的偶像冯骥更是发微博说,AIGC的童年时代,结束了。 (这里我必须得小小的秀一下,我跟偶像的微博互关嘿嘿嘿。。。) 而回到这篇稿子,我说实话,我写的也是踉踉跄跄。 刚写完一半,啪的一下,真人被ban掉了,所有的case都要重新换,重新跑的时候,啪的一下,又是因为太火,字节服务器直接爆炸,现在已经平均20分钟出一个视频了。 而今天,豆包上的Seedance 2.0也开始内测。 我都不敢想,正式放开的时候,以豆包的用户量级,字节的服务器会烧成啥样。 太火了,真的太火了,有一种去年DeepSeek R1无限重试的感觉了。。 去年DS,今年SD,真的,每年春节,都不让我们好好休息。 但总算,在一片狼藉中,花了2天多的时间,把这篇稿子写完了。 这次我就不评测模型能力了,因为没啥必要,这就是全世界的No.1,无可争议的No.1,很多老外现在都在X上疯狂求魔法,求Seedance 2.0的使用权限。 现在我单纯去评测能力,什么一致性是不是更强了、输出是不是更高清了,就像三体人打来了,我们还在评测他们的智子是不是不锈钢的、有没有声控能力一样,非常荒谬。 其实我也挺焦虑的,很多人可能不知道,我除了是AI媒体博主之外,我还有另一份工作,就是做AI影视工业化,做的不是那种AI短剧或者AI漫剧之类的,是电影和电视剧。 昨天我发了一条感想,我说: “周六晚上,我把它发给了一些影视圈的朋友和剧组,我说这次可能是真的变天了。我也很焦虑,因为我们所谓的AI影视工业化,在顷刻间,灰飞烟灭。 ” 然后有朋友评论说: "工业化灰飞烟灭"可能说早了。 我是这么回复的: 回头看这一年半的时间,认识了很多很好的伙伴,但是回头看,看我们这一路技术更迭,真的就是一声叹息。 只有你亲身被干过被替代过,看着自己拼命搭建的一切化为泡影,那种感觉你才懂。 就像一个国家正在进行一场浩大的战争,皇帝将他手下所有的士兵将卒都派遣到了这场战争之中,前线,无数精神饱满满腔热血的重装盔甲士兵,骑着战马,手持长矛,全副武装开始前进,所有人,都想努力的打赢这场战争。 他们一路所向披靡,踏进了对方的城墙,却发现没有一兵一卒,城市中心,只有一个巨大的金属铁球,它叫,核弹。 那一瞬间,核弹,被引爆了。 那一瞬间,以整个城市为中点,这个由几百万人口后期所供给的精锐部队,在原来的大陆上所向披靡的部队,在万分之一秒之间,被瞬间气化,消失的无影无踪。 你问我是什么感觉?我就是那个被气化的部队中的一员,我能有什么感觉呢,我知道,我消失的那一瞬间,我可能都不知道到底发生了什么。 时代的列车滚滚向前,它不会等待任何人。 面对此情此景我也只能说,既然前路不可逆,就走下去。 所以,我的心情是复杂的,兴奋又焦虑,真的还挺矛盾的。 这篇文章,我也不做评测了,我就想,抛砖引玉,给大家看一下,在现在,Seedance 2.0,还可以玩的有趣的玩法。 希望大家搭上新时代的列车,好好享受沿途风景。 坐稳扶好,我们现在,发车。 01 导演思维 这次其实Seedance 2.0爆掉,有一个很大的原因,是因为它的导演思维。 过去我们玩的AI视频,其实很多时候,卡点有两个,一个是故事,一个是分镜。 这两个东西,让普通人做出来的AI视频,跟专业的人做出来的AI视频,差距非常的大。 剧本是编剧意志的体现,而分镜,就是把剧本视觉化的最核心的要素。 比如剧本里写了一句话:"小明推开门,看到屋里一片狼藉,他愣住了。" 这句话,导演可以有无数种拍法。 你可以先给一个小明推门的中景,然后切一个屋里的全景展示狼藉,再切回小明的特写表情。 你也可以用一个长镜头,跟着小明的视角推进去,让观众跟小明一起发现屋里的情况。 你还可以先给屋里的狼藉,再给门把手转动的特写,再给小明的脚步,最后才给小明的脸。 过去,AI视频,几乎是没有办法帮你解决分镜难题的,我们几乎用的都是图生视频的工作流,也就是一张图,对应着一个4s的片段,然后把各种片段剪辑在一起,成为一个片子。 这是2024年初做的一个AI片子当时的协同文档,真就是这样的。 你会看到,AI最核心的能力,其实是把你的分镜图,给动态化,仅此而已。 而后来,Sora2把分镜这个事给彻底下放,你只需要一张图,一段话,AI可以帮你把分镜补足,成为一个还不错的小故事,但是那个分镜,其实也是一通乱切,没有章法。 但是Seedance 2.0,却几乎解决了分镜的问题,在镜头的美感上,领先了Sora一个世代,而且能直出声音和BGM,虽然我经常会手动用Prompt把BGM给关掉。 比如这个case: 主要就是写了些剧情和对话,分镜全部是它自己解决的。 视频长这样。 自动播放 说实话,这个质量,在电视剧领域,已经可以以假乱真了,甚至比一些垃垃圾古装拍的还要好。 人物极其自然,台词功底也够,每一次切镜,都有意义。 而另一个故事,更是能让你完美的感受到,什么叫导演思维。 我的Prompt只有一个简简单单的小故事: 他苦练二十年,终于站上了世界武术大赛的决赛舞台。面对泰国拳王,全场屏息。裁判一声令下,他气沉丹田,使出毕生绝学—— 跪下来喊了一声"爸"。拳王愣住了。一拳,他赢了。 而让我们看看,Seedance 2.0的最终视频,和它给出来的分镜。 实在是太离谱了。 自动播放 这玩意,它真的懂戏。。。 它知道什么时候该给特写来强调情绪,什么时候该拉镜头来交代环境,什么时候该用慢一点来制造张力,什么时候该快切来加速节奏。 这些东西,以前是需要专业导演才能把控的。 现在,AI能做了。 而且它还能直出声音和BGM。 连剪辑的活都干了,太离谱了。 02 分镜复刻 在影视行业里,因为分镜特别重要,所以一直有一个学习方法,叫做拉片。 也就是让大家学习镜头调度、学习排布、学习情绪用户的。 所以,学习优秀大师、优秀作品的镜头调度,很重要。 而在过去,我们想模仿一个这个类型的作品,很难。 但是现在,因为Seedance 2.0支持了视频参考,所以这事,他就变得非常简单了起来。 比如这个《天气之子》的这一段分镜,我很喜欢。 而我们现在,只需要把这段视频扔进去,让他进行参考,给我生成一段新的故事,就非常的方便。 而且不止是剧情和故事的分镜,甚至你在广告片里,也可以用上,比如我直接用一段车的分镜和运镜,再加上大疆的一张图,来给它复刻一个。 现在,人人都能一张图,拍出百万大片了。。。 这块单独说一下,如果你用的豆包内测版,现在还不支持上传视频参考,估计豆包用户量级实在太大了,还得在等等。 03 经典二创 人类对于自己IP爱的最深的情感,那就是给他们做二创。 在以往,我们想做二创,还挺难的,比如你想给《姬霓太美》做一个二创,那可能真的得手搓一个MV,或者从0开始,做一个视频。 所以,过去的二创,往往集中于本子、图片上。 但现在不一样了。 我这两天刷抖音和B站,发现二创已经彻底疯了。 抽象和高燃并存。 比如我在X上看到的这个,燃爆了。 自动播放 而且全是我的菜。 这些东西,放在一年前,你想都不敢想,那时候的AI虽然也挺牛逼的,但是还是做不出来这种级别的运镜。 而且如果你对一个你喜欢的故事的结局不满意的话,你也可以,自己修改。 比如《怪奇物语》第五季的最后,我真的很希望很希望小十一能回来。 那,我们就可以自己,复刻一个。 她真的,就回来了。 自动播放 真的,不仅可以搞温情,而且,抽象的东西满天飞。 比如这个男人,他可以进入到鬼灭之刃的世界里,来一场酣畅淋漓的战斗 自动播放 感觉比鬼灭本刃会好看。。。 一句话直出,真就创意无限。 04 编辑现实 既然可以参考视频了,那自然,还有一个很特别的功能,就是编辑现实。 对影视后期来说,究极有用。 在过去,我们都听过一句话,甚至可以说是一句真理。 视频是没办法P的。 但是现在,谁说视频不能P? 比如,我就随手拍了一个10秒钟的挥手的视频,再在seedance里,加一点Prompt: 一个非常现实的宝可梦召唤的视频,就做好了。 自动播放 真的,各种物理规律啥的,还真的相当的酷。 然后我还拍了我们凌晨1点的公司过道。 直接用Prompt换下风格,瞬间变成里世界。 这个视频后面有高能预警,点开的时候一定注意。 自动播放 这效果,稳定到爆炸,还做个鬼的后期特效。 05 素材生成vlog 一个非常神奇的玩法,甚至对剪映,感觉都能有一点冲击。 就是我们日常不是拍了很多的素材吗,那比如,我就想把这些素材,非常简单的生成一个vlog,按照过去,你可能就得套模板了。 但是在AI的世界里,你真的,直接说就行。 就比如我们前几天团队,我们的一个小朋友就拍了点照片,我们直接扔给Seedance 2.0。 然后就能直出一个还挺好玩的vlog,所有的图片都会动起来,还会自动识别图片是什么,给加上小装饰,还挺有意思的。 06 带货广告 这个玩法,可能是最能直接变现的。 做过电商的朋友应该都知道,拍产品视频是一件很麻烦的事情。 你需要找场地、找模特、找摄影师、找灯光师,折腾一天可能就拍几十秒的素材,还不一定能用。 而且每个产品都要单独拍,成本非常高。 但现在,Seedance 2.0给了一个新的可能。 你可以用AI来生成产品展示视频。 我试了一下,效果出乎意料的好。 就比如这个产品,一个非常神奇的面霜。 我们就可以,让一个AI模特来讲解。 自动播放 我真的觉得,比很多真人要自然、要好看、要舒服。 还要个鬼的真人啊。 甚至,你还可以让伏地魔,在美国超级碗,代言鼻炎特效药。 自动播放 最后一幕,我就问你神圣不神圣吧。 07 主体迁移 这个功能,说实话,是让我觉得最效果最离谱的一个功能。 但也确实是对于影视行业非常有用的一个功能。 你可以把你自己的照片,迁移到另一个视频的某个主体身上,完成一模一样的动作和口型复刻。 也就是我们传言中的,动作捕捉。 只不过现在动捕不需要穿戴那么多复杂的设备了,直接一个视频,一个照片,迁移一切。 比如最近因为Seedance 2.0而爆掉的一个运镜视频。 真的就是完美复刻,给你还原的一模一样,甚至遮挡关系给你还原了。 说真的,我从来没见过如此之离谱的,动作迁移。 在整个迁移和复刻能力上,应该就是全球目前最好的了。 08 写在最后 写到这里,这篇文章差不多该收尾了。 这些差不多就是Seedacne 2.0的部分玩法,抛砖引玉。 在真人出镜需要验证的背景下,应该短期内都不会放开真人参考了,都会用类似于豆包分身视频的这种方式,可能是C端用户很长一段时间的主流玩法。 等到大年三十当年,豆包在春晚上,给大家秀一下Seedance 2.0的效果,当所有人涌入豆包,开始试一试创作,试一试AI视频。 整个社会对于AI视频的认知,又可能会被往前加速一大截。 回头看几年,真的是太魔幻了。 这个视频,应该能很好的诠释,AI进化的速度。 自动播放 我自己的心情也很复杂。 作为一个AI媒体博主,我当然兴奋,这是一个划时代的产品,它给了我无数的选题,无数的内容可以写。 但作为一个做AI影视工业化的人,我又很焦虑。 我们这一年半在剧组里花了很多心血搭建的工作流、积累的经验,可能在这一次更新里,付诸东流。 这种感觉很难形容。 就像你辛辛苦苦爬了一座山,快要到山顶了,突然发现有人开了一条缆车直达山顶,而且票价还特别便宜。 你会觉得自己之前的努力很傻吗? 会的。 但你能怎么办呢? 只能调整心态,接受现实,然后想办法利用这条缆车去更高的地方。 我前天的短文里说,时代的列车滚滚向前,它不会等待任何人。 这句话听起来有点丧,但我觉得它也是一种激励。 既然列车不等人,那就赶紧跑,赶紧跳上去。 不管你之前是做什么的,不管你之前积累了什么,现在都要重新开始学习,重新适应新的工具和新的规则。 这是这个时代给所有人的挑战,也是机会。 我看到有人在评论区说,感觉自己要失业了。 我想说,不要这么悲观。 每一次技术革命,都会消灭一些工作,也会创造一些新的工作。 汽车消灭了马车夫,但创造了司机、汽车修理工、加油站员工。 电脑消灭了打字员,但创造了程序员、设计师、自媒体人。 AI会消灭一些工作,但也一定会创造一些新的工作。 关键是,你要成为那个能抓住新机会的人,而不是被淘汰的那个。 保持好奇心,保持学习,保持对新事物的敏感。 Seedance 2.0发布了,你就去玩它,去研究它,去思考它能用来做什么。 不要等着别人教你,不要等着市场成熟,不要等着一切都清晰了再行动。 等你想清楚的时候,已经不会再有机会了。 希望这篇文章,这几个玩法,能给大家一些启发。 也希望大家能在这个疯狂的时代里,找到自己的位置。 最后,借用冯骥老师的那句话作为结尾吧: AIGC的童年时代,结束了。 欢迎来到。 AIGC的,青年时代。
总理座谈会上的年轻人,春节暴涨超千亿
去年底因为参加总理座谈会而备受瞩目的闫俊杰,真正是度过了一个马上暴富的春节: 腊月25至正月初五,他创立的上海稀宇极智科技有限公司(MiniMax),股价从500多元飙升至近千元,市值也拉升到超过3000亿港元。 一个春节,暴涨超千亿。 闫俊杰和大多数AI创业者一样,是天才,也是超级学霸。 1989年出生于河南一座小县城的他,在中国科学院自动化所完成博士学业,之后又在清华大学计算机系从事博士后研究。 2015年,闫俊杰加入了当时的AI领军企业商汤科技,并快速晋升为公司副总裁、研究院副院长及智慧城市事业群CTO,参与和主导了商汤深度学习工具链及通用智能技术体系搭建,并发表顶级会议和期刊论文100余篇,成为业内公认的顶级专家。 ▲图源:2021世界人工智能大会 2021年底,已是商汤副总裁的闫俊杰决定辞职,创业成立MiniMax。 彼时的商汤科技即将港股上市,以闫俊杰的职级,如果不辞职很可能成为亿万富翁。 放弃既得的大好钱程,冒险重新开始,是因为闫俊杰对AI的发展有了新的思考。 当时的AI炒得火热,大量资金涌入,发展却远不及预期。也就应用于人脸识别、语音识别领域,创造的社会价值不高,甚至被调侃为人工智障。 核心问题在于AI不够通用。当时行业用虚拟模型解决客户的问题,每做一个模型就要训练一次。 一旦客户有多个问题,就得训练多个模型,直接导致成本高、周期长、效率低。 能否摆脱这种为每个任务专门定制模型的路径,面向更广泛人群的需求,开发一个通用的模型,让AI像水电一样普及,融入并改变人们的生活呢? 比如,一款能回答大家各种问题的模型,一款能帮助大家写作的模型……闫俊杰认为,这是有可能的。 更进一步思考后,他开始为这种可能性感到兴奋,感到时不我待,希望自己可以亲手将它做出来。 于是,他做出让很多人意外的决定,于2021年底成立了MiniMax‌,毅然决然地希望做出自己的通用大模型。 现在回头看,他的这一时间选择可谓是相当美妙: 就在2022年底,OpenAI发布的ChatGPT爆火全球,也让通用大模型成为全球科技浪潮的暴风口。 MiniMax的创立顺应了大势,但其发展,相当程度上却都是逆行业而行。 当大模型爆火后,大多数AI公司都集中资源先精一项。MiniMax却从一开始就无视文本、语音、视频的界限,坚持全模态自研,想实现全精通。 这种“不聚焦”的战略,很可能贪多嚼不烂,让许多投资者忧心忡忡。但闫俊杰认为,只有全模态才能逼近人类智能交互能力。 在目标用户上,大多数AI公司深耕面向企业或组织的B端。MiniMax却双拳出击,不仅深抓B端,更发布了众多面向个人消费者的C端产品,诸如Talkie、海螺AI、MiniMax Agent等。 而且从创业伊始,闫俊杰就将主要精力侧重到具备付费习惯的海外市场。一些产品甚至是“海外先行,国内跟进”,比如2023年6月,AI社交应用Talkie登陆欧美市场,火了之后才推出国内版“星野”。 在技术路线上,闫俊杰更是孤注一掷,豪赌未来。 2023年下半年,他力排众议,坚持从行业常用的Dense架构,转向混合专家系统的MoE架构。而且不是小幅调整,是全力转向,几乎投入了公司所有的算力资源。 Dense架构的核心特征是每次计算都‌全员参与,这种方式效率低且‌资源消耗大,但也有结构简单、训练稳定的优点。 MoE架构的预训练难度更高,但能显著降低算力消耗和使用成本,实现更高的效率。 当时,大多数公司都选择了更简单、稳定的Dense架构。但闫俊杰认为,未来的发展会对算力和资源消耗提出更大要求。只有在算力和消耗上省下成本,才会更有竞争力。 “不管有钱的大厂,还是没有钱的创业公司,(中国公司)在算力层面的投入可能要比美国公司小1-2个数量级。这是接下来两三年内非常确定的事情。” 如何用更少的资金和算力追上美国,成为了最迫切的事情,闫俊杰反复思考后的答案就是,转向MoE架构。 “你会发现这不是选择,而是你能够想到的唯一一条路,只有那一条路可以通向你的目标。当时只能这样,如果做不出来就完了。” 这是一场豪赌,失败了就会出局。后来的经历也是相当艰险,连续两次转型,结果都失败了,如果第三次继续失败,公司很可能走向终局。 好在第三次成功了,公司不但活了下来,而且提前走到了正确的道路上,赢得了先机。 如闫俊杰所料,AI大爆发之后,MoE架构的技术路线逐渐成为行业主流。 抢先布局的MiniMax,在2024年1月上线了国内首个MoE大模型abab,不但引领了国内行业,而且仅以累计5亿美元的投资,约行业龙头OpenAI花销的百分之一,就跻身世界AI的第一梯队。 闫俊杰另两个反向而行——C端产品和“全模态”,也都获得了成功。 如今,MiniMax已经跑出了多个畅销全球的C端产品,拥有超2亿个人用户,覆盖200多个国家及地区。 其中,主打视频生成的海螺AI,全球用户数突破4000万,其生成的高质量视频连马斯克都点赞过。专注于AI角色陪伴与虚拟社交的Talkie,更是在全球爆火,用户数达到惊人的1.47亿名。 ▲图源:海螺AI 而且这些应用的用户大多来自海外,尤其是美国,堪称真正的“国际明星”。 在MiniMax的营收中,已有超过70%为海外市场贡献。 多模态的坚持,则让MiniMax成为“全球唯四全模态进入第一梯队”的大模型企业。它的语音模型Speech-02、视频模型Hailuo-02、文本模型MiniMax M2,都在权威评测中达到全球顶尖水平。 这也就意味着,它可以最大限度地争取用户。无论是语音、视频、文本,甚至是音乐,它都能够满足需求。更关键的是,多模态可以融合,成就全能AI。 这些综合起来,共同筑成了MiniMax的王座。 2024年,仅仅成立三年的MiniMax,年营收达到2.14亿元,同比增长782.2%。 卓越的表现,不仅让MiniMax与月之暗面、智谱AI、阶跃星辰、百川智能、零一万物并称为中国大模型“六小虎”,而且还是估值最高的小虎,受到了腾讯、IDG、高瓴创投、米哈游等资本的狂热追捧。 2025年初,MiniMax满怀信心,上线了拥有4560亿参数的开源大模型MiniMax-01,期望以此巩固技术领先优势。 然而,一个巨大的挑战席卷而来。 MiniMax-01上线没几天,整个国内乃至世界AI圈都迎来了一件王炸级事件: DeepSeek-R1横空出世,凭借推理模型的革命性技术爆火出圈,而且完全开源。 几乎是一夜之间,全球AI都在讨论,甚至畏惧着DeepSeek这家此前堪称默默无闻的公司,腾讯、百度等巨头,乃至各行各业也都纷纷接入其模型。 对于国家来说,这是国运级的科技成果。但对于很多大模型初创企业来说,这就是天塌了。 王者已现且气势如虹的压力之下,一众还在为大模型准备的初创公司,要么弃赛,要么接入,要么转行,继续坚持做自己的模型被认为是最危险的选择。 但闫俊杰选择了继续坚持做自己的模型。 很多人以为MiniMax会就此坠入深谷,闫俊杰也感觉大山压肩,但他化压力为动力,最困难时刻最大力度爆发,集中一切力量,继续孤注一掷,研发新一代的推理模型。 半年之后,格局再次被扭转了。 当年6月17日,MiniMax上线了自主研发的MiniMax-M1,不但赢得了“全球首个开源大规模混合架构的推理模型”的占位,还凭借支持100万Tokens的上下文输入(8倍于DeepSeek-R1),以及卓越的长文本理解等关键能力,在DeepSeek-R1之外,打出了自己的优势,也赢得不少赞誉。 虎口脱险般的闫俊杰,还发了一条意味深长的朋友圈: “第一次感觉到大山不是不能翻越。” 而这还不是全部。之后的4天,MiniMax以“日更”的方式,陆续发布了全新视频生成大模型Hailuo 02、通用智能体产品MiniMax Agent、视频创作智能体Hailuo Video Agent、音色设计产品Voice Design。 5天时间,5款重磅模型和产品,MiniMax不仅重新坐上了牌桌,还吸引了“教主”黄仁勋的注意。 ▲图源:腾讯科技 当年7月,英伟达CEO黄仁勋在北京链博会上公开称赞MiniMax,将其与阿里巴巴、百度等企业并称为“世界级”产品开发者。 链博会结束不久,黄仁勋又单独和闫俊杰会面,深入交谈了约两个小时。 此后的MiniMax,开始好消息连连,并在2026年1月9日,于港交所正式挂牌上市,上市首日股价大幅上涨近110%,市值超1000亿港元。 如今更是突破了3000亿港元,远高于老东家商汤科技,与另一家公司智谱AI并称为“大模型双雄”。 闫俊杰的身上,有一个巨大的反差点。 他总是满脸笑容,说话慢条斯理,但内心杀伐果断。当整个AI圈都在追逐 DAU(日活跃用户数)时,他依然信奉技术驱动,专注在大模型的研发上。 2025年前三季度,MiniMax实现营业收入3.75亿元,但研发投入高达12.63亿元,是同期营收的3倍多。这种专注,不仅让他们挺过了DeepSeek的冲击,还找到了引领世界的创新点。 在去年10月发布的文本大模型MiniMax-M2中,他们首创了“交错思维”机制,让推理模型在做事前,先停下来思考一下。 这种“行动—停下来思考—再行动”的循环,显著提升了推理模型的可靠性。在全球权威测评榜单Artificial Analysis 中,MiniMax-M2的总分位列开源第一,国内外的大模型都迅速学习,补齐了类似能力。 对比DeepSeek用极致的工程优化榨干每一分算力,MiniMax更加剑走偏锋,以算法突破和机制创新撬动无限可能。 而让人震惊的是,这个世界级的AI新贵,员工总数才385人(截至2025年9月)。而且团队中没有“硅谷天才”坐镇,很多人都是第一份工作。 ▲闫俊杰参加《罗永浩的十字路口》 AI圈不都在高薪挖天才吗?为什么闫俊杰不挖呢? 因为他坚信AI不是玄学,完全可以用第一性原理拆解成若干个明确的工程,诸如算法的设计、训练效率的优化、数据链路的搭建。 只要找到正确的科学方法,根本就不用所谓的天才,普通人也能创造出非凡价值。这种人才观念,又为公司省下了一大笔资金。 与此同时,闫俊杰也陷入了恐惧。因为当大模型可以被量化,也就意味着它会不断进步,最终必然超越人类。当做出成功的模型时,他会感到不安。 而战胜恐惧的,是公司会议室墙上的一行字——Intelligence with Everyone。这是闫俊杰创业的初衷,让尖端AI“为人所用、与人同行”。 早期投资人黄明明评价,“闫俊杰是一个‘狠人’,在资源等方方面面有限的情况下,他还是专注在模型研发上。只有这样的企业家可能才能走得更远,走到终局。” AI是中国不能输掉的一场比赛。 面对美国的算力优势,这个出生在河南小县城,在资源匮乏的环境中成长起来的俊杰,正在用有限的资源打造世界顶尖的AI公司。 “如果未来全球只有五家AI公司,至少有两家中国公司,至少第二名是中国公司。” 这是闫俊杰的希望,更是他的长期目标。 [1]《总理今年首场座谈会,这9人成为“座上宾”!继梁文锋之后,他作为AI大模型企业代表参会》华夏时报 [2]《85后河南小伙闫俊杰,参加总理座谈会的三大看点》河南省教育厅 [3]《上海AI独角兽,连放大招》财经天下weekly [4]《对话MiniMax闫俊杰:AGI不是大杀器,是普通人每天用的产品》晚点LatePost [5]《“狠人”闫俊杰,闯关IPO》中国企业家杂志 [6]《最“佛系”的创始人,最“凶猛”的上市:MiniMax为何被资本市场选中?》凤凰网财经 [7]《MiniMax闫俊杰对话黄明明:AGI,只有一条最难但唯一的道路》中国

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。