EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
HBM内存便宜了 三星被曝降价抢单NVIDIA:2大优势
快科技8月3日消息,内存一哥三星在HBM技术栽了跟头,输给了SK海力士,错失几万亿美元的AI市场,但是三星现在要杀回来了。 无论是游戏卡还是AI卡,HBM性能凭借超高的性能成为高端必选,在这方面韩国的SK海力士公司占据优势,NVIDIA、AMD以及Intel的AI显卡正在或者即将使用他们的HBM芯片,包括最新的HBM3E内存,要知道192GB、288GB容量的HBM3E价值不菲。 事实上三星不是没有领先的机会,2018年NVIDIA创始人黄仁勋就提议合作开发HBM甚至使用三星芯片代工的机会,结果三星拒绝了,黄仁勋很失望,而这也给了SK海力士赶超的机会。 当年HBM内存只用于少数显卡上,市场空间不算大,但是现在AI市场价值万亿,HBM内内存成为关键,价值不输高性能GPU本身,SK海力士业绩大涨也主要靠HBM翻身,市占率达到70%,三星现在也要眼馋这个机会了。 最新消息显示,三星希望年底前扭转HBM市场的颓势,他们的杀手锏就是最新的HBM3E内存,希望用三星的产品拉拢NVIDIA这个大客户。 三星给出的条件主要涉及2方面,一个是他们会提升良率来降价,另一个则是承诺稳定供应HBM3E内存,这对NVIDIA这样的厂商来说极具吸引力,不仅有助于降低AI卡的成本,更重要的是还能大量供应,抢占更多AI市场份额。 目前还不确定三星为了拉拢NVIDIA会在价格上做出多大的妥协,这也是能否拉拢到大客户的关键,最终要看双方的博弈了,NVIDIA显然也不希望SK海力士在HBM内存上一家独大。 HBM(High Bandwidth Memory)是一种高带宽内存标准,主要用于满足日益增长的计算需求。相比传统内存,HBM可以提供更高的数据传输速率和更低的延迟。 HBM最新标准已经到了HBM4,但市场上当前的主力还是HBM3E,堆栈层数正在从8层提升到12层,单颗容量轻松达到36GB,而SK海力士凭借技术优势可以做到16层堆栈,容量48GB,今年就能供货。 三星年初就宣布HBM3E获得了NVIDIA的认证,但是出货消息一直没有,现在即便跟NVIDIA达成正式合作,出货也要从Q4季度开始。
GPU的替代者,LPU是什么?
Moonshot 的 Kimi K2 最近在GroqCloud上发布了预览版,开发人员不断问我们:Groq 如何如此快速地运行 1 万亿参数模型? 传统硬件迫使人们做出选择:要么更快的推理速度,但质量会下降;要么更精确的推理速度,但延迟令人无法接受。这种权衡之所以存在,是因为 GPU 架构会针对训练工作负载进行优化。而 LPU——专为推理而设计的硬件——在保持质量的同时,消除了造成延迟的架构瓶颈。 无需权衡的准确性:TruePoint Numerics 传统加速器通过激进的量化来实现速度,迫使模型进入 INT8 或更低精度的数值,这会在整个计算管道中引入累积误差并导致质量损失。 我们使用 TruePoint 数值技术,改变了这一现状。TruePoint 是一种仅在不降低准确度的区域降低精度的方法。结合我们的 LPU 架构,这种方法能够在保持高精度数值的同时保持质量。TruePoint 格式存储 100 位中间累积——足够的范围和精度,无论输入位宽如何,都能保证无损累积。这意味着我们可以以较低的精度存储权重和激活函数,同时以全精度执行所有矩阵运算,然后根据下游误差敏感度选择性地量化输出。 我们的编译器策略性地应用精度: FP32 用于 1 位错误传播的注意逻辑 混合专家 (MoE) 权重的块浮点,其中稳健性研究表明没有可测量的退化 容错层中激活的 FP8 存储 这种控制水平使速度比 BF16 提升了 2-4 倍,并且在 MMLU 和 HumanEval 等基准测试中准确率没有明显损失。随着 AI 推理和硬件需求的指数级增长,业界正在效仿 MXfp4 等格式,以减少模型占用空间。我们并非为了速度而牺牲质量,而是消除了导致这种权衡的架构限制。 内存架构:SRAM 作为主存储器 传统加速器沿用了专为训练设计的内存层级结构:DRAM 和 HBM 作为主存储,并配备复杂的缓存系统。DRAM 和 HBM 都会在每次权重提取时引入显著的延迟——每次访问数百纳秒。这适用于时间局部性可预测且运算强度较高的高批量训练,但推理需要按顺序执行层,运算强度要低得多,这暴露了 DRAM 和 HBM 带来的延迟损失。 LPU 集成了数百兆片上 SRAM 作为主权重存储器(而非缓存),从而显著降低了访问延迟。这种设计允许计算单元全速加载权重,通过将单层拆分到多个芯片上来实现张量并行。这对于快速、可扩展的推理而言,具有实际优势。 执行模型:静态调度 GPU 架构依赖于动态调度——硬件队列、运行时仲裁以及引入非确定性延迟的软件内核。在集体运算过程中,数百个核心必须同步激活张量,任何延迟都会影响整个系统。 我们的编译器预先计算整个执行图,包括芯片间通信模式,直至单个时钟周期。这种静态调度可以消除: 缓存一致性协议 重新排序缓冲区 推测执行开销 运行时协调延迟 确定性执行可以实现动态调度系统上无法实现的两项关键优化: 无尾延迟的张量并行:每一层分布在多个芯片上,保证同步,消除困扰 GPU 集体操作的延迟。 张量并行之上的流水线并行:第 N+1 层开始处理输入,而第 N 层继续计算,这是 GPU 难以实现的,因为存在动态调度和无法有效平衡流水线阶段的问题。 并行策略:延迟优化分布 数据并行通过运行多个模型实例来扩展吞吐量。GPU 可以通过数据并行实现良好的扩展性——在不同的输入上运行同一模型的多个副本。这可以提高吞吐量,但如果您正在等待单个响应,则无济于事。 张量并行通过将单个操作分布在多个处理器上来降低延迟。对于实时应用来说,张量并行是关键的优化。我们的 LPU 架构专为张量并行而构建。我们将每一层划分到多个 LPU 上,这样单次前向传递就能更快完成,而无需并行处理更多请求。正是这种架构选择,让 Moonshot AI 的 Kimi K2 尽管拥有数万亿的参数,却依然能够实时生成令牌。 推测解码:在张量并行硬件上执行 推测解码是一种使用较小、较快的“草稿”模型来预测未来令牌序列的技术,然后在较大的目标模型的单次批量前向传递中验证这些令牌。虽然这种方法可以提高速度,但在 GPU 等传统硬件上,验证步骤通常会受到内存带宽的限制,从而限制性能提升。 我们的 LPU 采用独特的架构设计,能够通过流水线并行更高效地处理推测性 token 批次的验证,从而加快这些验证步骤的处理速度,并支持每个流水线阶段接受多个 token(通常为 2-4 个)。结合利用张量并行的快速草稿模型,这为推理带来了复合性能提升。 软件调度网络:RealScale芯片到芯片互连 Groq 使用准同步芯片间协议来消除自然时钟漂移,并将数百个逻辑处理器 (LPU) 对齐,使其充当单个核心。这样,软件编译器就可以准确预测数据到达时间,以便开发人员进行时序推理。周期性软件同步可以调整基于晶体的漂移,不仅支持计算调度,还支持网络调度。这使得 Groq 能够像单核超级集群一样运行,从编译器开始,从而避免了传统架构中存在的复杂协调问题。 基准测试:Groq 的表现如何 我们非常重视模型质量。昨天,我们发布了 OpenBench——一个与提供商无关的、面向 LLM 的开放评估框架。我们在 Groq 和基于 GPU 的 API 提供商上,在 Kimi-K2-Instruct 上运行了 OpenBench 0.1.1 的 MMLU 实现,您可以看到准确率得分很高——这充分展现了 Groq 堆栈的强大功能。了解更多关于 OpenBench 的信息,并亲自复现这些基准测试。 底线 Groq 绝不敷衍了事。我们从零开始构建推理,力求速度、规模、可靠性和成本效益。正因如此,我们才能在短短 72 小时内让 Kimi K2 的性能提升 40 倍。我们于 2019 年推出的第一代 LPU,采用 14nm 制程工艺,实现了如此优异的运行效果。我们高度重视开发者的反馈和实际性能,并结合行业领先的设计和严格的技术基准,致力于提供极致的 AI 推理体验。我们将继续加速硬件和软件的开发,使开发者能够专注于他们最擅长的事情:快速构建。
曝NVIDIA H20对中国出口卡关,美国出口审查瘫痪 积压情况创30多年来最惨
快科技8月3日消息,两位消息人士透露,美国公司向全球(包括中国)出口商品与技术所申请的数千种许可证正陷入停滞,因为负责审核的机构陷入内部动荡,几乎呈现瘫痪。 报导指出,最受明显的例子是NVIDIA向中国出口AI芯片的许可尚未通过。 该公司于7月14日表示,美国政府已承诺将核发H20芯片的出口许可证,且希望能尽快出货。 然而,消息人士本周指出,美方至今仍未发出任何许可,涉及的AI芯片订单价值高达数十亿美元。 一名美国官员表示,目前的出口许可申请积压情况是三十多年来最严重的一次。 对此,美国商务部发言人表示,BIS(美国商务部工业和安全局)将不再对任何涉及重大国安疑虑的申请案照单全收。 该单位正透过强力的规则与积极执法,推动特朗普总统的政策议程。 此前央视报道称,近日,英伟达算力芯片被曝出存在严重安全问题。此前,美议员呼吁要求美出口的先进芯片必须配备“追踪定位”功能。 美人工智能领域专家透露,英伟达算力芯片“追踪定位”“远程关闭”技术已成熟。 为维护中国用户网络安全、数据安全,依据《网络安全法》《数据安全法》《个人信息保护法》有关规定,国家互联网信息办公室于2025年7月31日约谈了英伟达公司,要求英伟达公司就对华销售的H20算力芯片漏洞后门安全风险问题进行说明并提交相关证明材料。 随后,英伟达昨天深夜回应:“网络安全对我们至关重要。NVIDIA的芯片不存在‘后门’,并不会让任何人有远程访问或控制这些芯片的途径。” 人民日报紧接评论称“英伟达 让我怎么相信你”,并表示回应归回应,对于H20芯片存在的“追踪定位”和“远程关闭”风险质疑,企业唯有按照约谈要求,拿出令人信服的安全证明,才能消除中国用户的后顾之忧,重新赢得市场信任。 毕竟网络安全关系到企业命脉,甚至是国家安全。
国产GPU对比NVIDIA显卡:数据有惊喜
快科技8月3日消息,国产GPU近年来不断取得突破,前不久砺算科技的7G01芯片性能达到了RTX 4060级别,更早之前摩尔线程也推出过高性能GPU,不仅在游戏方面可圈可点,AI也是一大重点。 在AI领域当前最强的GPU是NVIDIA推出的,硬件架构及CUDA生态构筑了几乎难以逾越的壁垒,那国产GPU在这方面到底差距多大?这事引发了很多争议,知乎用户@菽陌松囿作为业内人员,有过实际测试,公布了一些数据值得参考。 根据他的说法,(摩尔线程的GPU)kernel launch做到5us,nv大概是几十us(有点忘记了),gemm mfu做到98%,nv大概85%,FA mfu做到95%,nv是68%。 此外,他还提到了N卡的一些不足,比如通信offload ace,nv根本就没考虑,是DeepSeek帮他们做的sm隔离,15%的sm是浪费的。 当然,摩尔线程的GPU也不是没有问题,比如支持Link但带宽受限于硬件还有些差距,但这不是障碍。 他强调这些数据是经过研发同事确认的,不会糊弄同仁,意味着这些数据结果相当靠谱,反正这番对比下来还是有些让人惊喜的,也颇为意外。 总体来说,他认为摩尔线程的GPU从硬件、kmd、umd算子库全部都是重写的,反击了那些认为摩尔线程没有东西的人的说法。 他援引的数据详细信息可以参考摩尔线程官号公布的文章,里面有更全面的技术解析,只不过是没有nv数据对比的,菽陌松囿提供的数据对比可以观察下两者在AI上的表现,虽然这并不是说国产的GPU可以全面超越N卡,但也不是部分网友认为的只是使用了国外IP套壳的说法。
牛人很多,为啥都不愿回印度?
“印度是我的一部分,无论走到哪里,我都带着它”,来自南印度泰米尔纳德邦的桑达尔·皮查伊曾动情地说。53岁的皮查伊出身于工薪家庭,在他12岁那年,身为电气工程师的父亲在家中安装了第一部固定电话。这台旋转拨号电话机激发了他对技术的热爱,激励他后来考入印度理工学院(IIT)。 大学毕业后,父亲用一年的积蓄,为皮查伊买下飞往美国的机票。这个在斯坦福大学攻读硕士学位的青年,如今已是科技精英。2015年,皮查伊成为谷歌公司首席执行官(CEO),现任谷歌母公司“字母表”公司(Alphabet)CEO。 像皮查伊这样的顶尖印度人才很多选择留在海外,他的IIT校友中就至少有2万人在美国打拼。印度最需要的科技精英大部分没能留在国内,这显然不利于“2047年发达印度”这一宏大目标的实现。 这些年来,莫迪政府为吸引人才回流制定了多项“引凤还巢”计划,虽取得了一定成效,但并未从根本上扭转人才外流的趋势。而当下,美国重启特殊专业人员/临时工作签证(H-1B签证)限制,并出台学术干预政策,搅动了全球人才流动漩涡,印度的“引凤还巢”计划或将迎来收获季。 顶尖的印度裔人才 从硅谷的科技丛林到巴黎的时尚殿堂,印度裔精英的身影无处不在。据《印度时报》,截至2024年,共有14位印度裔CEO掌舵《财富》世界500强企业。不仅美国和欧洲在争夺印度人才,就连阿联酋也在以高薪吸纳印度精英。 眼下,硅谷依然是印度裔高端人才传统上的聚集地。谷歌、微软、IBM、Adobe这些科技巨头都由印度裔掌舵。印度《经济时报》数据显示,2024年,印度裔占硅谷工程师的三分之一、高科技公司CEO的10%、H-1B签证持有者的72.3%。 印度裔美国人在创业生态系统中的表现同样突出。截至2024年,美国约600家独角兽企业(估值超10亿美元)中有72家为印度裔创办。在学术界,美国高校的STEM(科学、技术、工程、数学)学科有多达2.2万名印度裔学者。 2025年,印度裔学者、美国国家工程院院士加内什·塔库尔当选得克萨斯医学、工程、科学与技术学院(TAMEST)院长,领导这一汇聚了350位院士和8位诺贝尔奖得主的机构。塔库尔所擅长的石油工程创新代表了印度裔学者的顶尖水平。 印度裔人才的影响已渗透至科技、金融、零售、奢侈品等多个领域:现任世界银行行长阿贾伊·邦加(中文名:彭安杰)曾担任万事达卡总裁兼首席执行官十多年;印度裔美籍高管维韦克·桑卡兰则管理着美国第二大连锁超市艾伯森(Albertsons)。 印度裔人才的足迹还从美国扩展到欧洲,除了利娜·奈尔成为首位领导香奈儿的印度裔女性外,诺华集团、拔佳集团(Bata)、联合利华等也在印度裔CEO的领导之下。印度《第一邮报》评论说,印度裔的成功得益于IIT和印度管理学院(IIM)的精英教育及多元文化适应力。 人才流失之痛 印度裔在全球大放异彩,背后却是印度本土日益加剧的人才流失之痛。以人工智能(AI)领域为例,全球8%的顶尖AI研究人员来自印度,留在印度国内的仅有1%;医疗领域的情况则更为严峻,印度作为全球最大移民医生来源国,约有7万名印度培训的医生在美、英等发达国家执业,而印度本土医生配比却远低于世界卫生组织标准。 32岁的拉维(化名)原是印度班加罗尔一家公立医院的内科医生,2024年,他递交了美国H-1B签证申请。《展望》杂志记录了他内心的挣扎:“在印度,我每天出诊要看50个病人,一次轮班36小时,薪水却只有美国的1/10。美国的医院提供先进设备和尊重,我别无选择。” 27岁的支付平台数据分析师苏雷什(化名)也买好了飞往美国的单程票。在北卡罗来纳州立大学攻读AI硕士后,他计划留在美国从事前沿技术研究工作。“印度的薪酬和创新环境无法与美国相比。”他坦言,“我爱我的国家,但暂时不会回去。” 地缘战略分析师卡利德在印度《支点》杂志指出:“印度十分重视H-1B签证为国家带来的好处,2023年,印度海外工人汇款占GDP的3.3%。美国从中受益,印度却承担了高昂的培训成本。” 更令人担忧的是“伪回流”现象:越来越多类似谷歌、微软的国际巨头在班加罗尔等地设办公室,吸引不少杰出印度裔海归,然而,他们多为跨国公司服务,而非进行本土创新。卡内基梅隆大学工程学院印度裔兼职教授维维科·瓦德瓦对此评论道,“这些‘伪回流’者虽身在印度,却没能为印度经济创造核心价值。” 召唤金领精英 面对严重的人才流失现状,莫迪政府出台多项政策,试图将“孔雀东南飞”扭转为“凤还巢”。“让人才外流转为脑力增益”,这是莫迪自2014年上台以来就打出的口号。为实现“2047年发达印度”(GDP达30万亿美元,人均GDP达到1.8万到2万美元)的愿景,政府推出多项政策,打造全球创新中心,召唤科技、医疗、生物、金融等各领域的印度裔海外英才回国效力。 比如,通过“印度制造”“数字印度”“创业印度”等计划吸引科技人才参与印度创新经济;推出“国家量子使命”“半导体使命”“人工智能使命”等科学任务加大对前沿科技的投入,鼓励具备前沿知识的海外印裔专家参与。“印度的AI创新使命会让一些才华横溢的工程师选择返回印度工作”,印度信息技术部部长瓦伊什瑙颇有信心地表示。 此外,印度还通过推动海外公民身份(OCI)计划,为海外印度裔提供免签入境和投资便利,通过税收优惠、赠款等支持政策鼓励印度侨民重新融入印度经济。 印度政府还在搭建“印度人才之桥”,让海外印度精英成为连通祖国的“金色纽带”。印度科技部、教育部等部委推出数项奖学金计划,为居住在海外的印度裔科学家、工程师、技术专家以及医务人员等专业人士提供有吸引力的归国工作途径和机会。 其中,2023年启动的VAIBHAV奖学金计划已经促成数十位科学家与印度机构合作。另外,科技部生物技术司设立了“重返印度奖学金项目”,为有志于返回印度建立独立实验室的专家打开机遇之门。 为了让归国专家能够安心从事研究工作,印度还在努力创造良好的人才环境。印度科学与工业研究理事会(CSIR)实施的“高级研究助理(SRA)”计划,为高素质专业海归人士提供为期三年的临时职位。CSIR还为印度裔科学家和技术专家设立了50个科学家/技术专家职位,入选者将被认定为杰出科学家。 曾在印度教育部高等教育司工作的教育专家沙姆苏对此评价说,莫迪政府正在不遗余力地为这些金领精英打造一个创新创业的“温室”,希望他们能在家乡的土地上开花结果。 这是5月5日在印度孟买拍摄的城市景色 新一代精英人才回流 一系列的引才措施带来了一定成效,近年来,越来越多印度专业人士正返回故土,其中不仅有企业家,也包括软件工程师、科学家、医生等。 据印度《商业旗帜报》报道,约20%的印度独角兽企业和许多初创企业的联合创始人曾在美国接受高等教育。2015年,从硅谷返回印度的拉胡尔·查里与两位合作者联手创立了PhonePe,该公司目前已跻身印度顶级金融科技公司之列。现任CEO查里在接受印度记者采访时表示,“莫迪总理的‘数字印度’为我们提供了创业的沃土”。 毕业于美国麻省理工学院的弦理论物理学家拉古·马哈詹,也在2024年选择返回班加罗尔。在美国研修16年后,他说,“印度的弦理论水平仅次于美国,这主要得益于在海外接受培训的几代研究人员的传承,我希望自己也能够像前辈一样,在印度继续推动本土研究和教育。” 临床微生物学家克里希玛·考什克在得克萨斯大学奥斯汀分校获得博士学位后,于2018年通过“重返印度奖学金项目”返回印度,在浦那大学启动了伤口感染研究项目。“印度有大量传染性病原体,在印度完全可以进行世界级研究。我经历过‘美国梦’,现在是塑造新兴的印度梦想的时候了”。 跨洋“抢人大战”能否胜出 虽然人才回流现象正不断涌现,但并不能掩盖印度所面临的人才外流挑战。 挑战中也有一些有利因素,比如美国总统特朗普的移民政策“急刹车”,科研经费“断崖式削减”,这些都促使不少美国高端人才不得不重新寻求海外发展机会。这对一直在试图“引凤还巢”的印度来说,无疑是个历史性机遇。 维维科·瓦德瓦不仅在美国从事学术研究,也是一家生物科学公司的创始人。受制于美国的签证政策和招聘时遇到的挑战,瓦德瓦已决定将研发业务转移到印度。 他最近在《印度时报》上发表文章说,印度完全有能力转接美国正在流失的人才和能量。但是,抓住机遇仅仅是第一步。印度需要投资科研基础设施,改善监管环境,激励公私合作,为海外的印度裔科学家创造回国的途径。最重要的是,印度不能将科研视为奢侈品,而应将其视为国家优先事项。 不少印度专家指出,印度的人才回流机遇之窗不会持续太久,因此必须从以往的历史中吸取教训,果断采取行动,确保把最好的STEM人才带回印度。 班加罗尔印度管理学院战略问题教授克里希南等甚至为印度如何赢得这场STEM人才争夺战列出了具体指南: 政府需关注工业和学术界的侨民,特别是高级研究人员和学术领袖;外交部需建立单一窗口,让印度侨民办理定居手续更为简化和顺利;印度工业联合会(CII)等机构建立专门的人才发现办公室,与潜在人才接触;印度一流的STEM高等教育机构为有兴趣返回印度的校友建立专门小组。 虽然打赢这场人才争夺战并不容易,但印度当年也有通过在美国吸引人才,实现汽车行业成功转型的成功案例。1991年,印度实行经济开放后,工业曾面临产品开发技能严重短缺问题,当时,汽车行业抓住底特律衰落的契机,成功说服几个在通用汽车公司做研发的印度裔工程师返回印度,这些人利用他们在美国积累的经验,最终推动了印度汽车工业的创新发展。 或许是因为亲历过,曾担任印度汽车制造商协会主席的瑟沙萨伊在《印度教徒报》强调,高层政治人物招引和私营部门行动的成效,将决定印度在这场人才争夺战中表现的成色。 一位身在硅谷的印度裔工程师打趣道:眼下大家都在用显微镜盯着印度的机会,但最后是留是走,还得看莫迪政府能不能把“美好蓝图”变成“真金白银”。 作者:唐璐,编辑:张海鑫,责任编辑:乐艳娜
288亿,复旦女学霸3年干出一个独角兽
如果要说,最快诞生独角兽的地方,恐怕要数AI创业圈了。 近日,据外媒报道,Fireworks AI——一家新兴的云服务提供商,正在寻求以40亿美元(约合288亿元)估值(包含融资金额)进行新一轮融资。 知名风险投资机构Lightspeed Venture Partners(美国光速)和Index Ventures等正就领投事宜,进行深入讨论。一旦融资成功,Fireworks AI创始人将创造1年估值增长7年,3年干出一个288亿元独角兽的奇迹。 华人女性创业,年化营收突破2亿美元 这是一位华人女性在加州创业的故事。 2022年,Meta前高级工程总监乔琳(Lin Qiao)与6位联合创始人,一起在美国加州雷德伍德市成立了Fireworks AI。联合创始人兼首席执行官的乔琳(Lin Qiao),本硕毕业于复旦大学计算机科学专业,之后在美国加州大学圣巴巴拉分校(UC Santa Barbara)获得计算机科学博士学位。 在创业前,乔琳(Lin Qiao)拥有24年的行业经验,可谓是一名资深技术专家。 她的最早一份工作是在IBM担任研究职位,专注于数据基础设施和数据库技术。之后,又在LinkedIn担任技术主管。Meta时期,乔琳(Lin Qiao)最大的成就是领导PyTorch在Meta数据中心、移动设备和AR/VR设备上的开发和部署,为Meta系列的应用程序提供支持。 此外,她还构建了AI框架和开发人员平台,通过专为PyTorch构建的强大生态系统和平台,推动创新以提高模型探索的速度和生产时间。截至目前,PyTorch已成为全球最主流的开源机器学习框架之一。 在乔琳(Lin Qiao)看来,PyTorch的成功,源于其为研究人员提供了简便性,这种简便性延伸到生产环境。带着这份经验,乔琳(Lin Qiao)和团队创立了Fireworks AI,他们从头搭建体系,从底层做起。 “我们必须思考如何高效地获取数据、如何高效地进行分布式推理、如何高效地进行大规模训练。”乔琳(Lin Qiao)说道,Fireworks AI要做的就是压缩训练和推理的时间,使超大规模企业之外的更多人能够使用通用人工智能(GenAI)。 最终,乔琳(Lin Qiao)和团队将小型、可定制的模型能力,以及开源和闭源人工智能能力融合在一起,为开发人员提供了一个简单、高性能、低成本的API。“这种方法能使客户能够专注于创新和产品设计,而不是努力解决复杂的技术问题,让他们在短时间内高效地部署AI模型。” 在更高性能、更低成本两个关键词下,Fireworks AI拥有了100多个模型,年化营收突破2亿美元,即每月营收近1700万美元。公司对投资者表示,预计今年年底前年化营收将增长至3亿美元。 而其竞争对手Together,截至今年3月,年化营收达1.5亿美元,即每月约1250万美元,估值为30亿美元。 图源:Fireworks 3年估值冲刺288亿元,或与英伟达形成竞争 由于相比传统云服务商,Fireworks AI提供的是更低成本、更高性能、且定制化开源的大模型。这一差异化思路下,公司估值也迅速上涨。 融资数据显示,诞生于2022年的Fireworks AI,当年完成种子轮融资;2023年,又完成A轮融资,估值达到5.52亿美元,投资方包括红杉资本、Benchmark等顶级风投,以及英伟达、AMD、Databricks Ventures和MongoDB Ventures等产业资本。 近日,与Lightspeed Venture Partners(美国光速)、Index Ventures等知名风投机构的洽谈,不仅使其冲向40亿美元估值,跻身行业独角兽,也让Fireworks AI估值1年增长7倍。 对于A轮投资者——英伟达的出手,Fireworks AI在官网上曾表示,不仅是资金层面的支持,也有技术层面上的深度合作。简单来说,就是互为客户。 Fireworks AI称,其提供的平台能够高效运行和微调开源AI模型,如DeepSeek和Llama,这些模型在英伟达GPU上表现出色。此外,Fireworks AI还支持英伟达的NIM微服务,这些微服务提供了广泛的AI模型,涵盖文本生成、图像处理、视频处理、3D模拟等多个领域。 不过,有意思的是,英伟达可能与Fireworks AI形成竞争关系。 在一段访谈节目中,乔琳(Lin Qiao)表示,在任何一个有利可图的市场上,英伟达都有兴趣进入,并引发竞争。但从行业角度来看,市场不喜欢垄断。所以,这是一个经济问题。至于这种竞争何时会来,乔琳(Lin Qiao)说,应该很快就到了。 实际上,在业务版图的扩张上,英伟达已通过投资,实现了多个场景的业务落地。 比如在人工智能与云计算领域,于2023年投资的CoreWeave,已成为英伟达直系云算力供应商;参与投资的Hugging Face,英伟达与其建立合作伙伴关系,为开发者提供生成式AI超级计算服务,帮助他们构建大语言模型。 在医疗健康领域,英伟达更是投资了多家公司,通过算力提供,为AI药物研发提供支持;还有量子计算等行业,英伟达与谷歌、甲骨文合作,分别共同打造量子芯片,以及为企业客户测试和开发混合量子计算服务。 因此,有分析认为,在这种既合作又存在潜在竞争关系的背景下,后续英伟达是否收购Fireworks AI值得关注。 值得一提的是,新投资方Index Ventures才从Scale AI的收购案中获得了高额投资回报,这使得Fireworks AI等初创企业在老牌风投机构中,具有潜力。 华人成AI创业圈“吸金王” 复旦女学霸乔琳(Lin Qiao)的创业成功,并非偶然。 在AI创业圈,华人表现活跃,涵盖了从模型层的算法创新,到应用层的垂直行业解决方案等多个方面。比如,Scale AI由华人少年Alexandr Wang(汪涛)和Lucy Guo(郭如意)于2016年创立,专注于数据标注服务,之后迅速成长为独角兽企业,估值已达290亿美元。 再者,斯坦福大学教授李飞飞创办“空间智能”公司World Labs,专注于让AI具备高级的视觉推理能力;还有视频生成AI公司Pika,由郭文景和孟晨琳联合创立,已完成8000万美元的B轮融资。 在吸金能力方面,华人创业者更是表现强劲。据不完全统计,华人创业的AI公司估值总额至少超300亿美元(约合2100亿元),已经跑出了Scale AI、Cognition AI、Imbue、Cresta等独角兽。 除了Scale AI,Cognition AI由华裔青年Scott Wu打造,其开发的AI程序员Devin,上线几周即获融资,母公司估值半年内翻6倍达20亿美元。截至目前,Cognition AI已完成3轮融资,最近一轮融资由8VC领投,估值达40亿美元。 最新消息显示,Cognition AI正在商谈一轮超过3亿美元的融资,这将使该公司的估值达到100亿美元。 此外,Imbue获得了融资总额达2.2亿美元的资金,估值超10亿美元;由华人参与创办的Cresta融资总额也超2.7亿美元,估值达16亿美元。 对于华人在AI领域的创业成功,有人认为,他们普遍拥有顶尖的教育背景和丰富的行业经验。 仍以Scale AI的创始人Alexandr Wang为例,他曾是麻省理工学院的优秀学生,而Pika的创始人之一郭文景,在哈佛、斯坦福深造;Cognition AI、Imbue、Cresta背后的华人创业者,也有不俗的教育背景。 “这些创业者不仅在技术上具有深厚造诣,还对市场有着敏锐的洞察力。比如,Alexandr Wang凭借其在机器学习领域的深厚技术积累,敏锐地发现了数据标注在人工智能发展中的关键作用,从而开创了高效、高质量的数据标注服务模式,推动了AI行业的快速发展。”一位投资人评价道。 更重要的是,华人在创业过程中展现出的坚韧与创新精神,令人钦佩。特别是面对技术难题、市场竞争以及资金压力等诸多挑战,始终保持着对目标的执着追求。 总之,在这个“创新与机遇”的时代,华人正在创造奇迹。
AI时代搜索格局生变:微软Bing市场份额过去两年增长2%-3%,谷歌小幅下滑
IT之家 8 月 3 日消息,在搜索引擎市场长期被谷歌主导的格局下,如今随着人工智能时代的到来,谷歌的地位正受到一些挑战。微软的 Bing 搜索引擎逐渐崭露头角,据最新数据显示,Bing 在过去两年间实现了市场份额的增长,而谷歌则出现了轻微的下滑。 IT之家注意到,微软搜索业务负责人 Jordi Ribas 近日在社交媒体上援引了来自 ComScore 和 StatCounter 的数据,揭示了 Bing 自 2023 年初以来相较于谷歌的增长态势。根据 ComScore 的数据,Bing 的市场份额增长了约 2%,而 StatCounter 的数据显示其增长了约 3%。与此同时,谷歌的市场份额则分别下降了 1% 和 6%。 对于 Bing 的增长,Ribas 将其归因于微软在搜索引擎功能上的持续创新与拓展。例如,Bing 推出的 Copilot Search 功能为用户带来了更智能的搜索体验。此外,Bing 还为一些人工智能聊天机器人(如 ChatGPT 和 Meta AI)提供部分后端搜索支持,这一合作也为 Bing 的市场份额增长提供了助力。 Ribas 表示:“在过去一个财年中,我们很高兴为用户带来了 Bing 中的 Copilot Search 等诸多创新功能。同时,我们还通过为 ChatGPT 和 Meta AI 等领先的第三方聊天机器人提供网络基础支持实现了增长。感谢整个团队在推动这一增长以及为搜索行业带来竞争中的努力与创新。我们期待在下一个财年继续这种发展势头,持续构建基于人工智能的搜索和答案体验。” 这一趋势反映出搜索引擎市场的格局正在发生变化。尽管谷歌仍然占据着绝对主导地位,但如今越来越多的人愿意尝试新的工具,尤其是人工智能工具,这也为 Bing 等其他搜索引擎提供了发展机遇。
清华教授朱恒源:AI与创新,7个大问题
当下,全球创新趋势疲软,以信息技术为主导的旧产业范式渐趋乏力,已经走到了尽头,以AI为代表的新通用目的技术尚未落地,导致从创新到增长都陷入青黄不接的疲软期。 清华经管学院教授、清华大学产业创新MBA学术主任朱恒源认为,新产业范式是一系列相互耦合的创新成果,需依托原有产业基础并嵌入社会结构。同时,成功的产业创新必须闯过技术可实现、商业可持续、社会能接受三道关卡,而在范式转换期,企业家能否创造新需求,成为破解技术相对过剩的关键。 朱恒源也特别指出,技术上过度“重硬轻软”也是一种认知误区,软硬结合才有商业未来。目前中国被卡脖子的技术,在全球早已过了从0-1的阶段,而中国在1-100的发展阶段又具备独特优势,所以,真正的问题在于技术能不能商业化,能不能解决实际需求。 以下是朱教授的分享全文。正和岛经授权首发。 作 者:朱恒源 清华经管学院教授、清华大学产业创新MBA学术主任 来 源:正和岛(zhenghedao) 本文系作者近期参加的一个内部研讨发言整理,内容经作者审定、授权,原标题为《全球创新趋势与七个迷思》 创新在全球范围内,都走向了一个尽头 现在谈创新很热门,政府、学者、企业家都在拼命谈创新。为什么?因为不创新不行了。从1970年代左右开始,基于信息、通讯和计算机技术的产业范式逐渐从新兴到勃发,孕育了许多产品、技术、业务模式乃至社会组织方式的创新,这一系列的创新在全球范围内扩散,创造了大量的商业机会,也为全球提供了经济增长和社会发展的无竭动力。中国也顺应这一轮技术革命的大势,完成了产业上的现代化——其本质特征是,利用已有技术和商业创新的成果,迅速完成产业扩散,实现经济增长。 在这个过程中,创新并不是最主要的动力,因为作为后发国家,你可以利用已有的创新成果,通过产业上的扩散来推动经济增长。以前我们老说中国的发展模式是C2C(Copy to China),因为把前沿的技术和创新运用到中国这样一个巨量市场,就会有极大的发展机会。用通俗的话说,以前我们不需要根本创新,把已有的创新拿来、用好,就能赚钱、产业就会发展,经济就会增长,社会就会进步。 现在,这一套不行了。在全球范围内,基于信息技术的产业发展范式已经走到了一个尽头,不仅仅是中国的尽头,全球也到头了——在个人端,上一轮根本之产业创新(如智能手机)的发明距今已经十八九年,基于智能手机的移动互联网应用也已经渗透到衣食住行娱乐等各个领域,几乎无处不在了。下一代的通用技术是啥,巨量的应用在哪,全球有很多试探,但目前为止在产业上并未达成全面共识。一个可以佐证的现象,是在全球范围内,不断有各种新概念冒出来,被热议、被爆炒,但一段时间以后,就湮灭了。 可以说,整个全球的产业创新都进入了“无人区”,全球经济增长也因此进入了一个相对疲软、青黄不接的时期。大家都在探索基于一些通用目的技术的可能产业应用和可能发展方向:新技术革命和产业变革在加速演进,但目前并未找到大家都认可的方向。这是目前业界的焦虑所在,也是未来的机会所在。 新产业范式是一系列相互耦合的创新成果 我们讨论中国创新以及中美之间关于创新的竞争,都需要放在产业范式变迁这样一个大背景下去判断,就是说,原有产业范式的发展潜力已近尽头,大家竞逐的,不是单一的技术或者产品,而是面向未来经济和社会发展的产业范式。 什么是产业范式?从人类历史上看,从工业革命开始每隔一段时间,人类社会会爆发生产力上的革命性进步,整个社会围绕一两个底层技术(被称为通用目的技术),在各个可能的领域里去寻找可能的商业应用,在这个过程中创造出了新的产品、新的交易方式、新的社会知识、新的产业、新的行当,甚至新的生活形态、新的社会组织结构。 这些创新,在发展演进的过程中相互耦合、彼此配合,从而通过产业革命的形式完成经济上增长模式的更新和社会上的组织进步。 未来商业上的组织形态是怎样的?现在看来还未可知。但历史经验启示我们,它的形成至少有两个要点:第一是要充分利用原有范式下产业进步成果;第二是要部分利用新技术的优势,并高度嵌入现有的社会结构并与之配套。比如:大型平台型组织,极有可能发展成原有政府—企业两分组织之外的新型组织体系,它既是市场经济中赢利的传统商业组织,也会承担提供公共品并进行一部分公共治理的社会职能。 从这几年的实践看,大的互联网平台,如腾讯、阿里等,因为有巨量的个人用户规模,一方面在推动新的技术扩散中扮演了无可替代的作用。另一方面,这些平台在后端,连接了大量的企业用户,因而可以推动新技术如AI、云计算等嵌入到企业端,推动特定场景下的产品和服务创新,如中国在医疗、教育、商业、工业等领域,新技术运用得最广泛、最深入,这其中互联网平台的作用功不可没。 以此推之,在Deepseek等新的智能化技术出来之后,这些积极拥抱新技术的企业,因为海量的个人用户和深入了垂直应用,会催生大量从技术供给到场景应用再到商业闭环的产业创新探索,促进新的通用目的技术与社会需求的适配,从而助力新产业范式的探索,并为技术的大规模扩散提供土壤和环境条件。 产业上的创新要获得成功,必须闯过三关 在产业范式变迁的当口,社会上围绕新技术会有许多创新试探,绝大多数试探最后就湮灭了,并不会形成产业。只有极少数创新,最后会形成产业的闭环。一般说来,这些成功的产业创新,需要经过三重检验: 第一个,技术上可实现。创新要针对特定的应用场景,在技术上达到一定的基础条件,才能获得实际的应用(比如照相要有一定的清晰度、智能翻译要有一定的准确率等等)。技术上不能实现一定的性能,用户是不会用的,特别在技术范式变迁中,还存在技术上的代际竞争,必须至少在某个维度上,比已有的解决方案在性能上更加优越性才行。 第二,商业上可持续。产业创新在商业里运行,技术的研发、产品的验证、用户的推广,都需要钱。你要么把产品卖给用户来获得资金,要么靠投资人给你输血来完成商业化。总之,不管用谁的钱,你都需要维持完整的商业循环。商业上能否持续、如何持续,它由产业结构和用户需求决定,这又跟创新者的选择有关,不是简单的技术开发行为,而是一个相对复杂的企业家活动。 第三,社会上能接受。技术条件和商业条件都满足后,创新要获得社会认同与接受才行。由于创新本质是反共识的,因此,创新刚出现时,社会观念不一定能接受,甚至还存在阻碍创新应用上的社会规则、规范乃至社会文化。历史上,汽车、飞机,甚至电脑,都经历过很长、严格的社会讨论,并需要通过改革,才逐渐被社会广泛接受。创新从小众人把玩,到普惠大众人人用的过程,就是产业创新的过程。关键的问题在于,你必须熬过这一过程,幸存下来,才能赢。 社会上每天都有一大堆人,在整天做各式各样的创新,这些大量涌现的创新的绝大部分通不过上面三个检验,昙花一现之后,消失了。只有完整通过上述三个检验的创新幸存下来,才形成了新的产业。 任何技术要跑出来,都要找新的需求才行 任何一个新兴的技术,我们常说的战略新兴产业也好,未来产业也罢,它刚开始的时候都是极度不完善的,具体体现在: 第一,技术上性能不好; 第二,需求不足,甚至需求本身就不存在——当你去问一位十九世纪的英国绅士他需要什么交通工具,他不会告诉你,他想要辆叫“汽车”的东西。 第三,供应链不完善; 第四,投资人缺乏投入意愿。 新兴产业的魅力恰在于此:由最先的爹不疼、娘不爱,发展到最后,人人在谈、个个在用,这就是产业创新过程。穿过技术突围、社会障碍,最终形成产业。这其中关键一点就是需求的创造:不管你创造的是真需求,还是“假”需求,反正得先有需求才能创新。即使是“假”需求,你最终也促进演化成真需求才行,因为没有需求,创新不可能形成商业上的循环,终究不可持续。 最近,具身机器人很热门,但谁会在这个阶段需要一个人形机器人?你会发现大部分需求来自两个方面: 第一个是所谓的展演场景,比如人形机器人马拉松大赛,或者酒店、展会、接待等等。这并不奇怪,早期汽车、飞机都是展演式需求推动发展的。 第二个需求是研发,当社会上很多人认为具身机器人是未来发展方向的时候,会有很多机构会投入进行研发,这本身就创造出一波需求,许多高校、研究机构、甚至公司都在投入机器人的研发,很多相关零部件和系统公司都围绕这一需求去进行商业活动。 一个研发需求,一个展演需求,在新兴产业早期扮演了重要角色。但这并不代表那些针对这两类需求进行商业运营的企业,最终能够抵达大规模商业化的终点,最终形成未来的产业。但许多人、许多组织在这个领域进行大规模地“试错”和探索,最后冒出少数一两个方向形成大规模商用,就会形成新的产业,甚至未来的支柱产业。 在范式转换的当口,相对于需求,技术往往过剩 需要强调的是,在范式转换期间,相对于已形成并被社会广泛接受的“已有需求”而言,技术是相对过剩的。因此,产业创新的主要挑战,是为现在暂时没有需求的技术供给,去创造和寻找新的应用场景,创造新的需求。 任何基于新兴技术创新推出的产品,要推向社会,需要和社会的各利益相关方进行复杂的互动,从而让社会逐渐接受。在这个过程中,关于产品的用户价值、使用范围、定价机制和交易规则也逐渐显现,并被广泛采用,于是关于这一产品的需求就被“创造”出来了。 自工业革命以后,人类世界所有的物品,都不是社会天然存在的,都是企业家基于新的技术开发出来的产品,在与社会互动过程中形成共识,最终被社会广泛采用的结果。 从这个意义上来说,产业创新的过程,本质上是把技术与一定社会条件相结合而创造出需求的过程,而创造需求是企业家的核心使命之一。 需求本质上是企业创造的,需求的形成是创新在社会中扩散并被接受过程,在这过程中,不同利益相关方有不同的诉求,扮演不同的角色。为企业的创新活动,为新技术的社会扩散,创造良好的环境和条件,是一个社会经济是否有活力的重要试金石。 技术不分软硬,关键要能解决实际商业问题 我们很多时候容易走极端,比如某一时期强调硬科技,大家都看不上软件企业了。但实际上,所有的硬科技,在一个智能化产业范式创新中,如果不与软的科技结合,就根本不可能形成商业价值的创新。 比如我们现在看汽车行业,硬件的创新,电机、电池等非常少,软件领域的创新也非常多,比如智能驾驶。更重要的是,软硬件的结合后,创造了全新的用户体验和产品功能。在电池领域,光有电芯的创新远远不够,电源管理系统也非常重要。作为行业观察者,我尽量不去越俎代庖、评头论足,而是要对企业家的创新保持足够宽容,由他们决定哪些东西可以怎样去结合,能更好地满足他们创造出来的用户需求。 对于那些有共识的未来技术,不管软硬,则都要推进其广泛扩散、多方应用。比如,现在,最广泛移动互联网人群,AI技术在年轻人群体中非常普及,这是我们面向未来智能化产业革命的优势之一。我们的互联网企业,以腾讯为例,把DeepSeek和元宝结合,把AI当作工具,在自己用户群体中广泛推广,为AI技术的社会接受创造了友好的环境条件,也为后续的“杀手级应用”创新打下了良好的基础。 技术被卡脖子,不构成当前的核心挑战 在产业范式变迁的当口,既然技术并不是稀缺资源,因此,技术上被卡脖子,即或在上一代范式的核心技术上被卡脖子,只会对新产业范式的创新带来运营上的困难,这一困难是可以通过技术学习追赶来克服,只是需要时间和耐心。 前一段时间,我们因为在一些技术、工具、设备上被卡脖子,因此社会有焦虑,所以特别强调要有0-1的创新。这固然有一定道理,但事实上,卡我们脖子的那些东西,在全球范围内早就过了0-1阶段,真正的挑战,是能不能创造出1-100,开发出新的市场需求。 从这个意义上说,技术在社会系统中广泛扩散、形成市场需求,才能完成产业化,才能催生新的产业范式。 中国是一个大国,在1-100的需求发展阶段,具有其他经济体不可比拟的优势。以AI应用为例,针对已有成熟的算法、框架,中国有足够海量应用场景,如电商、支付、制造业等,也有用户习惯上快速迭代能力,再加上大量领先的互联网企业在B端、C端对AI的应用推广,AI技术嵌入社会结构中会更快,在此基础上探索出新的业态、新的产业,会更容易形成商业闭环。电商如此,新能源领域也是如此。 范式创新真正的核心挑战在于,基于大国的优势,我们的企业家能不能不断持续创造出新的需求,构建足够大规模的市场,从而形成新一代的战略产业,甚至下一阶段经济发展的主导产业和支柱产业。完成这一探索,经济增长方式和社会结构的转型才能够有源头,才能巩固得住。
AI教父Hinton,重新能坐下了
AI教父Geoffrey Hinton来上海了。 他腰杆挺直,神情专注。这一坐,就是很久。 对于77岁高龄的诺贝尔奖+图灵奖双奖得主来说,这个再平常不过的动作,却是他人生中最奢侈的体验。因为过去有近18年,他几乎无法坐下—— 一次坐下的代价,可能是数周的卧床不起。 △图源:“上海发布”公众号 那些改变AI历史的关键时刻:把自家公司拍卖给谷歌时、代表谷歌收购DeepMind时、参加图灵奖颁奖典礼时……他都没有坐下。 他更习惯的其实是:站着办公、跪着吃饭、躺着开会、睡着旅行。 但在上海,他坐下了。安然地,从容地,就像一个普通的老人,跟身旁的人没什么两样。 这个简单的动作背后,藏着一个关于坚持、突破与回归的故事。对Hinton而言,坐、站、躺,从来不只是一种姿态,而是人生状态的隐喻。 “坐”了几十年冷板凳 痛苦的源头,始于一次微小的善意。 1947年12月Hinton出生在英国伦敦西南部的温布尔顿小镇。19岁时,他为母亲搬取暖器时伤到背部,腰椎间盘从此落下病根。 反复的腰痛如影随形,但还不足以让青壮年时期的他彻底告别坐姿。 比起身体上的折磨,更让人绝望的是选择了一条几乎没人相信的路。 1972年,当Hinton踏进爱丁堡大学攻读人工智能博士时,符号人工智能正如日中天,而他选择的神经网络,在当时不过是个“死胡同”——让计算机像人脑一样通过分析大量数据来学习,这在同行眼中是“纯属无稽之谈”、“已经被证明是错误的”。 现在来看,ChatGPT就是建立在神经网络上的大语言模型,其最底层架构就是一种特殊的神经网络——Transformer架构。 “人们都觉得我疯了!”他后来回忆道。 为此,博导几乎每周都要劝劝这个固执的学生“迷途知返”,免得毁掉学术前途。但这头“倔驴”每每斩钉截铁地回答: 再给我六个月,我会证明这种方法可行! 六个月又六个月,一坚持就是六年。 即便拿到博士学位,前路依然迷茫。英国当时对神经网络研究的支持寥寥无几,1978年博士毕业后,Hinton只能远渡重洋前往北美寻求更多机会,先后在加州大学圣地亚哥分校、卡内基梅隆大学、多伦多大学工作。 △右为33岁的Hinton,左为Terry Sejnowski,他俩正在讨论视觉网络模型,图源:reddit社区 后来,Hinton短暂迎来了学术生涯的高光时刻。 他与搭档相继提出玻尔兹曼机、反向传播算法,点燃了神经网络的小规模复兴。 这两项看似属于不同的贡献——一个是生成模型结构,一个是训练算法,实则都在攻克同一个核心难题:如何从数据中自动提炼出内部表征,也就是“让机器自己看懂世界”的能力。这正是Hinton自80年代以来一以贯之的研究核心。 然而,这束微光很快又黯淡下去。到90年代末、甚至2000年前后,神经网络仍徘徊在学术界的边缘地带。 “数据集太小、计算机速度太慢,我们的神经网络老是被噪声困扰”。Hinton后来坦言,90年代是他研究生涯最灰暗的一段时期。 “神经网络”一度还成了学术禁忌词,Hinton不得不在论文中打哑谜——用含糊委婉的术语包装自己的研究,以免被期刊评审直接拒收。 △图源:多伦多大学 屋漏偏逢连夜雨,伴随着研究遇冷,他的背伤也在恶化。年过半百后,弯腰或坐下已经成为一种冒险——腰椎间盘随时可能滑脱,一旦发作,疼痛会让他卧床数周。 但Hinton仍在坚持那个“疯狂”的想法。彼时没人知道,这份近乎偏执的坚持,将在不久后撬动整个世界。 站着说话不腰疼 “我上一次坐下来是在2005年,那是一个错误。”Hinton常说。 58岁那年,成了他人生的分水岭。那一次尝试坐下的代价太过惨痛,疼痛如潮水般涌来,让他发誓再也不犯同样的错误。 自此,他用身体丈量世界的方式大多数时候表现为:站着,或躺着。2005年过后的近18年里,即便偶尔需要坐下,时间也绝不超过一小时。 △图源:多伦多大学 谁能想到,正是在这样的身体状况下,Hinton却迎来了人生中最辉煌的时刻。 站着完成4400万美元的拍卖 2012年秋天,65岁的Hinton带着两个学生——Ilya Sutskever(OpenAI前首席科学家、联合创始人)和Alex Krizhevsky,在ImageNet大规模视觉识别挑战赛中一举夺魁,将错误率降到惊人的15.3%。 这不仅仅是一次技术突破,更是一个时代的开端,标志着深度学习(特指基于深层神经网络模型和方法的机器学习)在图像分类领域取得了重大突破。 他们自信地向世界展示出:神经网络可以通过分析大量的数据,来学习这种非常人性化的技能。 Hinton和学生一起改变了机器看待世界的方式,让它以前所未有的准确度识别花朵、小狗和汽车等常见物体。 事实上,深度学习能够大展身手的两个前提条件——强大的计算能力和高质量的大数据,都是在2010年前后逐渐步入成熟的。 △Hinton和他的学生,左为Ilya Sutskever,中间为Alex Krizhevsky,图源:多伦多大学 从边缘到中心,为了这一刻,Hinton等了40年。 于是才有了后来那场史上最昂贵最轰动的人才争夺战。 为了参加拍卖,Hinton的旅程堪称“取经”。他先躺在公交车后座上颠簸到纽约,再坐火车一路摇晃到加州,最后在出租车后排伸直双腿,才抵达太浩湖。 更有趣的是拍卖现场。在酒店房间里,Hinton想出了一个绝妙的办法:把垃圾桶倒扣在两张床之间的桌子上,笔记本电脑就架在垃圾桶上,这样他就能站着打字了。 △AI创作,非Hinton本人 谷歌、微软、百度、DeepMind四家公司通过Gmail邮箱远程出价竞购Hinton临时攒的公司——DNNResearch,每轮加价至少100万美元。 当竞价从1200万一路飙升到4400万美元时,连Hinton都觉得不真实:“感觉像是在拍电影。” 最终谷歌胜出。 以这次事件为分界线,之前深度学习还是躺在象牙塔里的纯学术研究。 而在这之后,它迅速成为全球科技巨头争相押注的战略核心,从搜索引擎到语音助手,从图像识别到自动驾驶,几乎所有AI相关业务都开始围绕深度学习重构。 被“绑”在飞机上的收购之旅 拿下Hinton只是前菜,要想尽可能多包揽深度学习方面的人才,谷歌瞄上了DeepMind。 这家2010年在伦敦成立的AI公司,有着比所有人都更疯狂的野心——打造通用人工智能,让机器做到人类大脑能做的任何事情,并且做得更好。 DeepMind创始人戴密斯·哈萨比斯从四岁起就是国际象棋神童,他的公司从教AI玩七八十年代的老游戏开始启程,目标却是星辰大海。 △DeepMind创始人戴密斯·哈萨比斯,图源:哈萨比斯本人领英主页 关于这场谈判,谷歌工程主管阿兰·尤斯塔斯希望Hinton能够一同前往,毕竟这位深度学习之父的眼光和判断力无人能及,谷歌看起来势在必得。 但Hinton礼貌地拒绝了,说自己腰背的状况不允许他出行。他说,航空公司会要求他在飞机起飞和降落时坐下,但他已决定不再坐下了。 尤斯塔斯没有放弃,他想出了一个大胆的解决方案:租私人飞机,坐不了那就“绑”起来。 2013年12月的最后几天,一幅奇特的画面出现在横跨大西洋的私人湾流飞机上:Hinton躺在两个座位折叠成的临时床上,两条带子把他牢牢固定住。 △AI创作,非Hinton本人 抵达DeepMind的伦敦办公室后,当其他人西装革履地围坐在会议桌旁听取介绍时,筋疲力尽的Hinton只能躺在地板上。 每当他想提问,就艰难地举起手来——AI教父躺在地上参与收购谈判,这个画面既滑稽又心酸。 这笔6.5亿美元(一说是4亿美元)的收购,后来被证明是谷歌史上最值得的投资之一。 被谷歌收购后,2016年3月,DeepMind的AlphaGo(阿尔法围棋)以4比1击败围棋世界冠军、职业九段棋手李世石,震惊全球。 △图源:谷歌官网 而这,只是这个实验室传奇故事的开始。 大家今天看到的Google DeepMind,就是由DeepMind与谷歌大脑部门合并而来。AlphaFold、Gemini、Veo——这些响当当的AI产品,全部出自这个实验室。 图灵奖,他站着接过 终于,皇天不负有心人。Hinton曾经孤注一掷、呕心沥血的坚持,也换来了学术界迟到的认可。 2019年3月,Hinton和另两位“深度学习巨头”LeCun、Bengio共同获得了计算领域的最高荣誉——图灵奖。 因为他们三个人的努力,在21世纪第一个十年的中期让神经网络的研究得以复兴,并将其推向科技产业的核心地带。 △中间四位男士从左至右分别为:LeCun、Hinton、Bengio、Jeff Dean,图源:美国计算机协会(ACM) 两个月后,颁奖典礼在旧金山皇宫酒店举行,500多位嘉宾身着正装,围坐在铺着白色桌布的圆桌旁享用晚餐。谷歌高级研究员Jeff Dean打着黑领结出席,气氛庄重而隆重。 而Hinton呢?他依然没有坐下来吃饭,而是看似不合群地站在会场一侧,低头看着手中的小卡片,上面写有演讲要点。 轮到Hinton上台时,他抖了个机灵: 我做一点儿计算,我相当肯定,我比前面发言的两人(指Bengio和LeCun)加起来要年轻。 台下一阵哄笑。事实上,当时Bengio55岁,LeCun59岁,两人加起来114岁,确实比72岁的Hinton“老”。 在这样重要的时刻,Hinton还真诚感谢了刚因胰腺癌去世不久的妻子杰基,“她知道我有多想拿到这个奖,她一定也想今天能出现在这里。” 重新落座 但荣耀的巅峰,往往也是反思的开始。接下来的几年里,AI的发展速度远超所有人预期,包括Hinton自己,也开始感到不安。 2023年5月,一个震撼硅谷的消息传来:Hinton宣布从谷歌辞职。 他给出的理由让所有人都措手不及:“我想自由地谈论人工智能的风险。”并补充说,他现在内心深处对自己毕生从事的工作感到后悔。 曾经拼命推动AI发展的人,怎么突然开始反对起来了? 就在这时,一个更奇妙的变化正在悄悄发生。 他能坐下了。 2023年11月的媒体报道这样描述,“最近,Hinton已经能一次坐上15分钟了,所以在我们长达两个小时的谈话中,他一会儿在桌子周围踱步,一会儿又坐在椅子上的鞋盒上。” 还能坐得更久了。 Hinton从2024年10月获得诺贝尔物理学奖之后,人们惊讶发现:这个18年几乎无法坐下的老人,竟然坐着接受了各种访谈——有40分钟的,还有长达1个半小时的,全程都没有站起来过。 △今年2月,Hinton全程坐了40分钟,图源:油管博主GrokVerse 甚至有商业航班空乘人员在飞机上兴奋地广播:“Hinton就在我们的飞机上!” 这引发了一系列猜测:他的腰痛是不是好转了? Hinton没有公开谈论过这一转变背后的原因,不过据相关资料介绍,绝大多数的腰椎间盘突出患者经保守治疗是完全可以治愈的,真正最后需要手术治疗的患者约占总数的百分之五。 △今年6月,Hinton全程坐了1.5小时,图源:油管博主The Diary of A CEO 重新拥有了坐下的能力,Hinton的主要任务就是:警告人们AI有多么危险。 在一次次访谈中,这位年事已高的老人坐得很稳,说得更狠: “在未来30年内AI导致人类灭绝的概率为10-20%。” “AI假以时日将会有自我意识和知觉。” “AI可能会变得比人类更聪明,我以前以为还需要30年到50年、甚至更长时间……现在,我认为或许只要5年。” “人们滥用AI会带来风险……而AI变得超级聪明并决定不再需要我们,也会带来风险。” 当有人问他哪些行业会被AI颠覆时,Hinton的回答简单粗暴:所有行业。 几分钟后,他修正了答案:“水管工这个职业目前还安全,尤其是在老房子里做,因为你需要非常有创造力和敏捷性。” △今年6月Hinton参加多伦多科技周,图源:多伦多大学 在诺贝尔奖晚宴上,他的警告更严肃——“当我们创造出比我们自身更聪明的数字生物时,还会产生一个更长期的生存威胁。不知道我们是否能够掌控这一切。” 而在上海WAIC,他用了更贴近中国文化的类比: 人类和AI的现状,就好比养了一只非常可爱的小虎崽,当它长大后,可以轻易干掉你。为了生存,要么摆脱这只小虎崽,要么找到一种方法可以永远保护自己。 在中国文化里,成语养虎为患,深入人心,老少皆知。 Hinton用老虎来比喻AI,而且他还是那个把老虎带出深山的人。 △图源:WAIC官方 Hinton自己都承认自己已经老了,现在唯一能做的,就是让更多人意识到AI的“觉醒”,他甚至多次表达了后悔——后悔把这支“老虎”带到了人间。 他又开始不被理解,开始显得特立独行,然后……他就又能坐下了。回望他过去77年的人生,身体状况仿佛有某种神秘的力量在控制—— 坐着开始,站着辉煌,重新坐下。 站着是狂飙突进、积极昂扬、抛头露面,坐着则是埋头思索、潜心修炼、沉稳低调。 这条轨迹,恰好与AI的发展史重合:从无人问津到万众瞩目,再到需要审慎反思。 然而,就在我们以为他完全摆脱了腰疾可以自如坐下时,他似乎又无法100%坐下—— △图源:上海期智研究院 他在上海和多位重磅科学家签署了“上海共识”,希望联合更多力量善治AI。 但就在签署后的留影合照中,他又站着了,独自一人站在所有人身后,显得特别又孤独。 或许这就是Hinton被始终交织缠绕着的荣耀与黑暗: 他注定没办法松弛地坐下——漫漫长夜里他是举火把的人,烈日当空后他又奔跑着提醒所有人: 万一这太阳,失控了呢? — 完 —
AI狂飙,“股王”腾讯归来
7月24日,腾讯控股(00700.HK)的股价一度触及560港元/股,创下近4年来最高,市值一度重新登上五万亿港元以上。8月1日,腾讯股价略有回落,但依然是港股市值最高的公司。 腾讯上一次触及五万亿港元以上的市值,是在2021年,当时微信、游戏和云服务的业务增量让市场对其充满信心。 如今,腾讯再登上一个台阶的关键拉动力,或许是AI。 在刚刚落幕的WAIC2025上,腾讯的AI野心进一步显山露水。 这场大会上,腾讯的“AI全家桶”全面亮相,覆盖基础设施、模型层、平台层和应用层的AI图景全面铺开;公司还明确了在具身智能业务上的发展方向——建平台。 腾讯喜欢将企业的发展与树木成长类比。 比如,公司将旗下有一定生命周期且仍能保持较好流水的游戏产品称作长青游戏。 又比如,2014年,在互联网潮起的时候,张小龙曾经谈到,微信要搭建动态的生态系统,培育一个服务的“森林”,让所有“生物”都更好地成长起来。 而如今,在AI的黎明,马化腾或许想要再造一片森林。 01 慢与快 在2025年之前,相比其他大厂,腾讯在AI上的动作似乎比较慢。 在被视作“大模型元年”的2024年,百模大战的硝烟仍在,AI应用已经开始抢夺用户,但腾讯当时没有太多参战的激情。 虽然也“按部就班”地发布混元大模型的更新、推出旗下C端应用元宝。但是腾讯没有纠结如何推动元宝冲击月活,也没有太多令人惊艳的新品出现,一度被认为在AI上“慢了半拍”。 如果从现在往回看,腾讯可能已经做好了准备,只是在等待一个“DeepSeek时刻”。 相比之前的慢,今年腾讯的反应却非常快。 在2月的DeepSeek接入潮中,腾讯云在2月2日首先实现一键部署接入DeepSeek。 AI应用腾讯元宝在2月13日就接入DeepSeek-R1满血版,同时支持混元和DeepSeek两大模型。腾讯也成为首个在C端应用接入第三方大模型的互联网大厂。2月18日,元宝开始支持微信搜索;2月19日,元宝全量上线深度思考模型“混元T1”。2月22日,腾讯元宝超越豆包,升至中国区苹果免费APP下载排行榜第二,仅次于DeepSeek。 而一向在更新上保持克制的微信,也逐步向AI开放。3月中,微信搜一搜上线了AI搜索功能;4月中旬,微信用户可以加上元宝的好友,直接在好友列表内完成AI问答。 几个月后的WAIC,腾讯已经带着贯穿模型层、平台层、应用层的“1+3+N”的AI全景体系亮相。 在模型层,腾讯3D世界模型首次亮相,这个面向游戏从业者及3D爱好者的模型支持文生/图生3D世界,可360°沉浸式漫游,也可一键导出兼容主流建模软件的3Dmesh的可用场景资产。 在平台层,腾讯B、C端同时发力,推出了面向C端的“腾讯元器”和面向B端的“腾讯云智能体开发平台”,以及最新发布的面向机器人领域的具身智能开放平台“Tairos”。其中,面向B端的腾讯云智能体平台全新升级,在对接了主流数据库和腾讯文档等更全面的数据源的同时,以零代码方式轻松创建多个智能体并实现协同交互,复杂场景配置更简单、对话更精准;腾讯元器则进一步整合公众号、腾讯文档、微信支付MCP等资源,同时为优质智能体提供流量扶持。 具身智能软件平台Tairos(“钛螺丝”)为机器人开发者提供包括规划、多模态感知、感知行动联合等大模型,并支持在云端快速通过仿真环境进行模型的验证。 在应用方面,除了C端应用的元宝,腾讯还带来了知识管理应用ima,其专业知识库,覆盖金融、科研、法律、政务、教育、医疗等专业、日常领域。腾讯还开发了10多个Agent,覆盖企业服务、生活、办公等场景下的高频需求。 02 拆与建 腾讯能这么快地交出一份完整的答卷,得益于此前的投入和积累。 2018年,腾讯就确定了在AI领域的三大核心战略:攻坚“通用人工智能”;成立机器人实验室“Robotics X”,探索虚拟世界和真实世界的连接;继续重点关注AI+医疗的发展。 2023年3月,公司在年度业绩说明会上表示AI和大模型对腾讯而言是“增长的加速器”,公司所采取的战略就是“在资源上进一步去投资”。当年9月,混元大模型正式亮相,并通过腾讯云对外开放。 而今年上半年,腾讯与AI相关的架构在也快速完成了一波拆分与重建。 素来以投入大、基建大、回报周期长著称的云与智慧产业事业群(CSIG)和负责基础技术能力建设、腾讯混元大模型开发的技术工程事业群(TEG)可以说是这场变革的中心。 2月,腾讯元宝从TEG转入CSIG。同月月底,腾讯宣布QQ浏览器、搜狗输入法、ima等更多产品和应用也将从PCG(平台与内容事业群)汇入CSIG。自此,元宝、ima、QQ浏览器、搜狗输入法四大AI产品线合龙,成为腾讯面向大模型时代打出的全新产品组合。 4月底,TEG围绕算力、算法和数据三大核心板块进行了组织架构调整。 当时,TEG成立了两个新的部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术,持续迭代基础模型。 同时,腾讯还明确了数据平台部和机器学习平台部的职能,进一步加强大模型数据能力和平台底座建设,共同支撑腾讯混元大模型技术研发。 当时,腾讯相关人士表示,这次调整有利于整合资源,优化研发流程,进一步提升腾讯在AI领域的长期技术作战能力。 在年初的2024年年会上,腾讯CEO马化腾曾表示对CSIG的未来发展抱有很高的期待。“在2025年,我相信CSIG有很大机会能够稳定浮出水面,形成一片大陆。”马化腾如是说。而对于TEG,马化腾提到腾讯会持续投入资源进行算力的储备,希望各个BG都能拥抱大模型的产品化落地场景。 技术积累之外,时代财经注意到,早在DeepSeek之前,腾讯的AI就已经悄然进入到重投入阶段。2024年全年,腾讯资本开支767.6亿元,创历史新高,占总营收的11.6%,研发投入达706.9亿元。 “不管在技术还是落地上,我们都在做持续的、大量的投入。”腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声在接受时代财经采访时表示。 腾讯投入不局限在内部,也在通过“买买买”等方式重构腾讯生态。 根据IT桔子数据,2014年至今,腾讯系公司在人工智能行业一共投资了84家企业,数量仅次于文娱、游戏和企业服务。 (图源:IT桔子) 2018年到2021年是一个密集出手期,腾讯平均每年会出手18家公司。 2022年开始,每年投资的公司数量又收缩到10以内。但回头看,腾讯的出手还是相当精准的。 在AI六小龙中,除了零一万物,腾讯都投了个遍。除此之外,今年先后开始上市的“国产英伟达”中,腾讯也投中了燧原科技、摩尔线程。其中,前者从Pre-A轮开始,有6轮融资背后都有腾讯的影子。 具身智能领域亦然,腾讯在2017年、2019年投资乐聚,2018年投资优必选之后,今年3月和6月又分别投了智元机器人和宇树科技。 03 生态革命 在1999年、2011年用QQ、微信颠覆社交生态的腾讯,希望在2025年掀起一场AI生态革命。 如今,加速的腾讯在广纳盟友。 在WAIC2025的论坛上,腾讯宣布,要面向企业、高校、及个人开发者发起首届腾讯云黑客松-Agent应用创新挑战赛,旨在推动AI智能体技术应用创新、及场景探索落地,并促进智能体生态人才培育。 4月,腾讯宣布启动史上最大就业计划——三年内将新增28000个实习岗位并加大转化录用。在大模型加速落地的背景下,腾讯加大了人工智能、大数据、云计算、游戏引擎、数字内容等技术类岗位的招聘力度,技术类岗位迎来“扩招”,占比超60%。 “我们举办腾讯云黑客松Agent应用创新挑战赛,就是一种对生态的推动,让更多人能够参与到智能体生态的建设中。”吴运声表示。 而面对市场,腾讯同样试图成为一个生态“攒局者”。 在平台端,腾讯元器平台聚焦公众号智能体构建和生态拓展,致力于为所有C端客户打通智能体变现最后一公里。 具身智能平台Tairos的首批合作伙伴包括越疆科技、乐聚、宇树、擎朗智能、众擎机器人等。已经与多家机器人企业在工业、汽车、家电等多行业进行场景落地实践。 在应用端,而ima已经和钱江海关、珠海金湾区等部门展开合作,提供法律咨询、政策通查等方面的服务。在WAIC展台,时代财经还注意到,腾讯正尝试让AI Agent“上车”。WAIC上展出的智能座舱服务Agent打通了车载微信小程序生态,覆盖餐饮点单、日程会议、取号订座、机酒预定、听书观影等场景。 在接受时代财经等媒体采访时,腾讯首席科学家、腾讯Robotics X实验室主任、福田实验室主任张正友提到,具身智能行业尚处在初级阶段,关键是如何运用现有能力及额外科研能力,支持行业完善与发展,推动生态建设。 对于腾讯在新一轮AI竞争下的定位,“腾讯努力的方向,就是在整个平台或者整个的生态链上,让更多的人参与进来,大家一起去满足前沿技术落地的需求。” 吴运声向时代财经表示。 “腾讯将通过扎实的底层模型、好用的平台工具、广泛的应用生态,让AI建得起、跑得稳、用得好,让每个人、每个企业,都能用上真正好用的AI。”他说。
美国AI投资新高潮,是最后引领工业革命的机会吗
下半年刚开始,美国AI达到了一个新的高潮。继英伟达的市值超过4万亿美元之后,微软的市值也一度突破了4万亿美元。美国四大AI巨头的资本支出,各自都将达到每年上千亿美元。美国的AI独角兽企业的估值,达到数千亿美元。AI原生企业的年化收入突破百亿美元。硅谷挖一个AI顶级人才,价码飙到了10亿美元。 这一轮AI革命,是从2022年底到2023年3月,OpenAI接连发布的ChatGPT和GPT-4引爆的。人们以为,接下来每过一两年左右,就会有GPT-5,-6……这样下去,通用人工智能就会实现(AGI)。 但GPT-5的推出,比人们预想得要更难、也更晚。大模型正在向多模态和推理、向物理世界的智能体演变。一场真正的技术革命,远比技术最初所展示的样子要波折和变态得多,但它的总体方向并不会改变,直至在新构建的基础设施之上结合原有技术,形成完整的生产力解决方案。 美国在刚刚公布的《AI行动计划》中开宗明义地提出,AI将会带来一场产业革命和一场新的信息革命,甚至出现“文艺复兴”式的效应。 这些趋势是否意味着美国的AI正在变成更大的泡沫?还是AI正在迎来一场应用的爆发,通过创新驱动更多产业向智能化升级,提升劳动生产率,带来经济结构的深刻变革,甚至实现能源和计算的终极变革? 在AGI和ASI等旗号下,我们可以继续期待硅谷推动AI技术边界持续扩大,成本持续下降,普惠经济与社会吗? 要想回答上述问题,应该从以下六个方面观察: AI投资新高潮 基础设施投资与迁移 刺激制造业 Token经济 “医治“鲍莫尔病 最后一次工业革命 AI投资新高潮 进入2025年下半年,硅谷巨头发起了新一轮算力军备竞赛。谷歌、微软、亚马逊与Meta纷纷投入规模空前的资本支出,已经普遍逼近千亿美元大关。 微软已经结束了自己的2025财年,对下一季度资本支出的指引达到了300亿美元,为2026财年全年超过1200亿美元定了基调。Meta上调了2025财年资本开支的下限,整体相较上一财年增长了300亿美元,既然这次承诺2026财年将“同样显著增长”,也就意味着开支将超越1000亿美元。亚马逊此前就承诺。今年资本开支将达千亿美元。 Big 4季度资本开支近千亿美元 硅谷巨头的资本支出正在拉动美国经济增长。2025年,围绕AI算力的相关资本支出,整体将占美国GDP的2%左右,对GDP增长的贡献达到了0.7个百分点。AI投资的规模,足以对美国经济增长起到刺激作用。 基础设施投资与迁移 这些天量投资的去向,决定了AI是否能从技术突破走向应用革命。而目前最重要的落点,就是AI基础设施。在那里,越来越多新生产要素token被生产出来。 微软与谷歌此前掐得厉害,但谁也没想到,AI还没来得及颠覆谷歌的搜索,已经开始颠覆亚马逊的云服务。二季度,亚马逊AWS收入增长仅为17%,不及竞争对手微软的39%和谷歌的37%。如果AWS再不振作起来,到明年年底,它全球第一大云巨头的宝座就要让位给微软了。在财报电话会议上,微软CEO纳德拉霸气宣布,“微软已在AI基建上领先”,过去一年新增建成规模2GW,超过任何其他云服务提供商。 在新架构芯片的采纳速度上,AWS也慢于其主要竞争对手。在今年5月的微软Build大会上,微软副总裁斯科特·格思里(Scott Guthrie)在他的主题演讲中说,“有些云提供商,比如AWS,仍然没有推出基于GB200的服务。” 亚马逊云服务走弱,与它对AI的垂直一体化布局不成体系有关。相对谷歌的视频与搜索、Meta的社交网络,以及微软的企业应用,亚马逊的核心是电商业务,其目前AI落地的广度与深度要略低一点。它也缺乏自研的前沿大模型。 据纳德拉所说,微软凭借对OpenAI的神奇投资与合作模式,在这场AI革命中一度领先了2年左右,虽然从年初开始,OpenAI不再绑定微软Azure,但微软Copilot仍然受益于GPT;Gemini已经让谷歌走出创新者的窘境。正由于自身业务与大模型对云业务的确定性不及其他云巨头,AWS的资本开支强度及增速在硅谷云巨头中是最低的,也不及Meta。而且,亚马逊原本就是一家重资产的科技巨头,很大一部分资本支出要用于物流与仓储。 竞争会在下半年加剧,即使资本开支侵蚀着巨头们短期的利润率与自由现金流。微软和亚马逊都相信AI驱动的云服务仍将高速增长。 它们也都提到,全球IT存量仍在往云端迁移,这一趋势与AI工作负载增长相互驱动。亚马逊给出的数字是,全球85%到90%的IT支出目前仍然在本地部署(on-premises),但到了10年或15年后,这一比例将会反转;甚至可能会出于AI等原因,迁移得更快。微软的说法则是“我们距离终点线还很远”。 刺激制造业 对数据中心的投资,直接催化了对建筑业与制造业的需求,也为制造业投资本身及升级提供了动力。 美国的AI行动计划,寄希望于AI能带来一场工业革命。它明确提出,要在技术扩张的同时“赋能美国工人”,“支持下一代制造业”,同时,美国提出要发展能与AI创新速度相匹配的电网与半导体制造技术,并大规模培养服务于AI基建的熟练技术工人。 芯片、无人机、机器人、自动驾驶等是美国最为关注的、具有战略意义的制造领域。硅谷“黑帮”目前已经与五角大楼结合愈发紧密,掀起了国防装备智能化的热潮。 这些基础设施扩张带来的不只是计算能力的跃升,更是对新一代蓝领工人和工程师队伍的系统性再激活。每一个数据中心项目都需要大量训练有素的建筑工、电工、电子和电气工程师等人才。 OpenAI在德克萨斯州的数据中心达到了1.2GW,xAI在田纳西州的目前也是1.2GW,Meta在路易斯安那州的是2GW,亚马逊在印第安纳州的则高达2.2GW。过去一年,巨头们都达成了具有里程碑意义的核电协议。尤其是微软的三哩岛核电站,它的“重启”颇具象征意义。 这套技能可以复制与迁移。弗吉尼亚州(Virginia)被美国人称为“全球数据中心之都”,数据中心密度惊人。区域性的制造与工程技能飞轮效应已经成型,已溢出至邻近的马里兰州等。在美国铁锈地带,当年的钢铁厂正在被改造成数据中心。 不仅是核电。数据中心还将引发一场能源革命,数据中心需要制冷设备和系统。新增的电力将主要来自天然气,尽管特朗普政府不喜欢可再生能源,但在德克萨斯州等地,由于价格有竞争力,风光可再生能源的比重已经超过40%。此外,美国还将进行大规模的电网投资,扩容和改造需要大量的电力和电气设备制造。 Token经济 在AI数据中心,伴随着电力持续消耗,token正在不断产出,其将充满数字空间,深刻改变软件产品和服务行业。 大模型的训练还在继续扩展,推理才刚刚开始,算力焦虑并没有消失,它既来自总量的保障,也来自算力成本的迅速下降,以实现AI的商业闭环。Meta刚刚斥巨资组建AI“梦之队”,野心勃勃要打造个人超级智能,算力管够是他挖人时的保证,据说,这个目前仅有50人的团队,可以支配3万张GPU卡。 每一家巨头的旗下业务都受益于AI,微软所有产品AI功能的月活用户已经超过8亿。亚马逊CEO安迪·贾西(Andy Jassy)承认,AI算力需求超过了供给,AWS的订单积压(backlog)超过了1950亿美元,同比增长25%;微软CTO艾米·胡德(Amy Hood)披露的这一数字达到了3680亿美元,同比增长37%。 强化学习技术和推理模型让我们迎来的智能代理的时代,而Agentic的应用,将导致token的消耗量将呈指数级增长。单智能体消耗的token数量是模型对话的4倍,而到了多智能体,要从15倍算起!目前,在终端侧和具身智能应用中,最卡脖子的地方正是用tokens/焦耳定义的计算效率。 市场对token的消耗正在呈指数级暴涨。谷歌的每月token处理数量,从5月I/O大会的480万亿,增长到6月份的980万亿,短短一个月,翻倍有余。事实上,微软也不慢。上一个季度,它披露季度处理量为100万亿,这次披露全年为500万亿,相当于这一季度增长了4倍。但谷歌在表述时,更侧重公司口径,微软披露的则是Azure Foundry API的口径,不包括自身业务消耗的token总量。年初以来,OpenAI也不再锁定必须只能调用Azure服务了。 价值已经开始从基础设施向AI应用转移。截至今年前7个月,OpenAI的月收入约为10亿美元,相比年初的约5亿美元翻了一倍。也有报道直接将其称为年化收入120亿美元,差不多是去年的3倍。它的主要竞争对手Anthropic在新近融资中被曝出年化收入达到了40亿美元,较年初飙升3倍,其已经以10倍的增长速度连续增长3年。硅谷风险投资机构MenloVentures推算,Anthropic年化收入实际已经突破了45亿美元,在企业服务市场反超了OpenAI。 这场价值转移的速度也越来越快。年初,支付巨头Stripe透露,收入排名前100的AI公司能够在24个月内触及年化收入500万美元的门槛,这要比SaaS的37个月快得多。而那些最近三年内成立的AI原生初创公司,平均用时才9个月。 “医治“鲍莫尔病 更重要的是,这场发生在数字世界的价值转移,事实上正在推动美国经济增长范式的转变,它的影响将进一步直接或间接地渗透到物理世界和实体经济。 美国经济长期受困于结构性的“鲍莫尔病”,即那些生产率增长低于经济整体平均水平的行业(可称为“停滞部门”)往往会经历高于平均水平的成本上升。由此产生的“成本病”(cost disease)可能导致这些停滞部门出现价格上涨快于平均水平、服务质量下降,面临财务压力等问题。 此外,由于停滞部门的拖累,整个经济的生产率增长率和实际产出增长率也可能下降。这一理论表明,如果消费者偏好那些本质上生产率难以提升的劳动密集型服务,这可能会导致经济出现长期性停滞以及实际收入增长放缓。 开创这一研究的美国经济学家鲍默尔(William Baumol)等人,用这一理论解释多个服务行业的成本-价格病,典型的包括高等教育、城市服务、医疗保健与医院、表演艺术等。而AI这一次可能会在上述几个服务领域真正引发一场生产率的革命。 最近,微软一项实证的研究,初步得出了与之大体吻合的结论。大型语言模型已经具备了在知识型工作与信息传递型工作等服务性任务中释放生产率的潜力。 这项研究的数据集之一是Copilot-Uniform,基于用户与微软Copilot之间匿名脱敏后的20万次互动;它还有一个辅助数据集Copilot-Thumbs,是用户对AI结果的反馈。 微软研究了互动中的用户目标与AI行为,以及AI行为在该职业工作活动中的使用频率、覆盖广度、成功率,以此评估不同职业的AI适用性得分(AI applicability score),得分越高,受AI影响的可能性越大。 结果显示,销售及相关职业、计算机和数学,以及办公室和行政支持类职业的得分最高,而且,它们往往也是就业人数最多的职业。需要较多沟通任务的职业,包括社区和社会服务以及教育指导类职业,它们的得分也较高。它们正是美国经济“鲍莫尔病”的典型所在。 在这项研究中,微软还发现,在40%的互动中,用户请求的任务与AI实际执行的任务完全不重叠(disjoint),即AI并不是在“代替人类完成任务”,而是在“帮助人类理解与推进任务”。而且,任务的影响广度(scope)始终是预测用户使用率(activity share)的最佳指标,而非完成率(completion rate)或满意度(positive feedback)。这意味着,用户的动机不是寻找最好的结果,而是节省大量重复劳动。 值得注意的是,微软最新研发的诊断智能体,在测试中的平均诊断正确率已经超过了人类医生的平均水平,在复杂病症的诊断中,其准确率甚至已经超过了顶尖的医生。 可见,AI正在以“任务”级别的颗粒度,嵌入与重构传统服务业,压缩低附加值、高频率的“任务的边际成本”。当下,它对经济的影响,主要不在于“可替代性”,而在于它是否改变了某类任务的供需平衡、边际成本和流程效率。 最后一次工业革命 美国这场由私营部门的巨头主导的AI投资,在很大程度上是一场决定美国“国运”的下注。投资的强度和总量已经超过了互联网泡沫时期的通信和网络投资,是美国自19世纪铁路投资以来最大规模的基础设施投资,而且可能还没有见顶。 人类正在由此通往最后一次工业革命,对算力与能源的需求将没有穷尽,量子计算与核聚变等或是它的终极解决方案,也是当前全球科技竞争的最前沿。 AI技术与应用与产业和经济的结合,将在提升劳动生产率的同时,带来经济结构的变化。即使服务业效率显著提升,劳动力也并不可能从服务业大规模“回流”到制造业体系中。机器人正日益取代一线从事简单重复工作的操作工人,如那些“拧螺丝”、凭人眼鉴别质量的多数质量检测工,最终还有驾车运输的司机。 大量目前听起来“高级”、高学历的脑力劳动,可能将是首先被替代和压缩的。尽管微软的研究更倾向于认为,目前AI对劳动力的增强效应往往大于替代效应,但是,它仅仅分析了用户与Copilot的互动,软件编程用户与智能体用户的样本不足。而后两者又恰恰是大模型落地最快的两个方向。 在Anthropic对自家Claude模型的用户研究中,编程用户的需求及效果反馈远远高于其他领域。目前在硅谷主要的科技公司中,软件代码的自动化率“及格线”已经在30%,并且还在以更快的速度提升比重。 没有哪家企业比微软更懂电脑和软件了。上个月,它又裁员了,这也是微软今年第四次裁员。这一次是9000人,仅次于2023年初的1万人裁员规模,当时,短短一个季度,整个美国科技界就裁掉了超过16万人。目前在美国,因为AI的普及,计算机专业的毕业生,在很多行业的需求已经下降,而硅谷也在轮番裁员,但美国的制造业工人和工程师缺口很大。 如果说AI在吃掉软件,软件在吃掉世界,美国巨头动辄千亿美元的资本支出,不仅在软件和服务业层面提升生产率,也在硬件和实体经济中也牵引着美国劳动力结构的变革。短期内,这些在美国各地拔地而起的AI基础设施,不仅是硅谷巨头的算力中心,加上配套的能源、电力电气设备的投资,也是美国制造业的再培训中心。 在更长的经济周期中,劳动力结构的再配置也将重新启动。如果AI技术可以改变效率低和成本高的部门,如教育、医疗以及政府等需要繁复的审批和行政管理部门,让这部分劳动力重新流向新兴的制造业和相关的研发和服务业,将可能是美国就业市场进入所谓“后工业社会”和信息社会之后的又一次重大转型。 莫拉维克悖论告诉我们,人类的感知与行动结合的学习能力和技能,是AI和机器人最难以替代的,这些相关的经济领域,包括大量的服务型体力技能、技术型蓝领、AI维护工种、现场判断及操作、服务和技术融合的技能、个性化定制的手艺、人机之间精妙的结合,以及人类借助AI拓展创新前沿,将成为人类劳动力捍卫和创造价值所在。如果说AI在通关“人类最终测试”,美国的AI投资狂热和面对中国的竞争,也在测试它最后引领工业革命的机会。
苹果的 ChatGPT 要来了?取代 Google 百度
信誓旦旦说不搞聊天机器人的苹果,也已经按捺不住了。 彭博社最新爆料,苹果在今年早些时候成立了一个名为「答案、知识和信息」的团队,简称「AKI」(Answers、Knowledge and Information),目标就是打造一种类似 ChatGPT 的全新搜索体验。 这个团队正在构建一种「答案引擎」,能够爬取网络数据来回答常识性问题,目前还处于研发的早期阶段。「答案引擎」不仅会有一个独立的 app,还会作为基础技术,为未来的 Siri、Spotlight 聚焦搜索以及 Safari 浏览器提供搜索的功能。 据悉,这个团队由「AI Siri」的前负责人高级总监 Robby Walker 领导,向 AI 主管 John Giannandrea 汇报工作。苹果也已经开始了针对该团队的招聘活动,提到了搜索算法和搜索引擎方面的经验需求,信息中还提到了 Siri、Spotlight、Safari 产品。 对于苹果来说,做 AI 搜索更多是一种被动的应对策略。随着 Google 反垄断案的持续进行,苹果很可能将被迫终止与 Google 搜索的多年合作,这会导致其失去 200 亿一年的授权费。苹果自己的 Apple 智能进度缓慢,AI Siri 持续跳票,因此需要一些新的更有吸引力的 AI 功能。 虽然此前苹果内部对聊天机器人之类的 AI 应用持有保留态度,但在今年已经发生了 180 度转弯。苹果服务高管 Eddy Cue 在甚至公开表示,基于人工智能的搜索是未来的发展方向,并证实了苹果正在探索和 AI 搜索公司 Perplexity 等团队的合作关系。 在上周的财报电话会议上,CEO 蒂姆 · 库克强调了苹果对 AI 技术的重视,也明确表达了收购 AI 公司的开放态度。此前有不少消息称,苹果内部已经讨论过收购 Perplexity 的合理性,也约见过其领导团队。 AI Siri 这块烫手山芋还没解决,又分出资源去做 AI 搜索,苹果能不能同时应对这么多挑战,不免让人担忧。比起从头构建一个 AI 功能,似乎直接收购现成的产品和团队更适合苹果,而 Perplexity 就是一个合适的选择。
普通拍照模式15X以上可触发AI超级长焦,荣耀Magic V5折叠屏手机获MagicOS 9.0.1.133升级
IT之家 8 月 3 日消息,荣耀 Magic V5 折叠屏手机已开启 MagicOS 9.0.1.133 版本升级,系统包大小约 1.15GB。本次更新 YOYO 助理新增一语分享、一语打印以及 YOYO 实时对话功能,同时 AI 超级长焦支持普通拍照模式在 15X 以上变焦触发。 ▲ IT之家评测室:荣耀 Magic V5 体验评测 IT之家附荣耀 Magic V5 折叠屏手机此次更新内容如下: 智慧 YOYO 助理 新增一语分享功能。文件跨端分享,一句话就搞定(仅支持荣耀品牌手机 / 平板 / PC 设备)。 新增一语打印功能。一语操控,让打印更便捷。 新增 YOYO 实时对话功能。支持和 YOYO 语音或视频通话,如电话闲聊、英语陪练、角色扮演、识物等功能,时时陪伴您的每一刻。 注:以上功能请将 YOYO 助理更新到 90.10.15.034 及以上版本体验。 媒体 相机 AI 超级长焦能力升级,普通拍照模式下变焦到 15X 以上即可生效。 修复部分场景下 AI 超清人像成片偏暗问题。 音频 优化免提通话场景音频效果,让通话更清晰。 系统 续航 优化部分场景续航体验,让您的系统续航更持久。 稳定性 优化部分场景系统使用稳定性,让您的系统运行更稳定。 作为参考,荣耀 Magic V5 折叠屏手机发布于今年 7 月 2 日,搭载骁龙 8 至尊版处理器,配备满血潜望长焦;支持满血出境体验,拥有 GMS 谷歌移动服务、折叠屏最多 5G 频段;满血卫星通讯,全版本北斗卫星通信;满血高亮双屏,峰值 5000nits 亮度、4320Hz 超高频 PWM 调光、杜比视界高动态范围;满血坚固外屏,新一代金刚巨犀玻璃;满血防尘抗水;满血快充生态,50W 无线车充覆盖 230+ 车型。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。