EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
蔚来最便宜新车来了!萤火虫11.98万起,暂不能换电但能进牛屋了
精致小车 自在发光 蔚来萤火虫的最终上市价最终定在了 11.98 万元和 12.58 万元 ,比预售价便宜了 2.3 万元-2.9 万元,两个版本的差异只在于内饰材质,其他部分都是相同的。 Bass 方案的价格则是先藏了一手,要到 8 月份才有方案。一方面是因为萤火虫虽然支持换电,但是只能用蔚来的五代站,最快用上也要到明年了;另一方面,蔚来估计也是想看看市场的反应,到时候也有调整的空间。 咱们还是先来一起回顾下蔚来萤火虫的核心配置。 长宽高分别为 4003 / 1781 / 1557 毫米,轴距 2615 毫米,4.7 米转弯半径。 42.1 kwh 磷酸铁锂电池,CLTC 综合续航 420km。 13.2 寸中控屏 + 6 英寸仪表盘,高通骁龙 8155P 芯片。 地平线征程 5 智驾芯片,128Tops 算力,支持 ACC 和高快 NOP 功能。 其他的舒适性配置则可以参考下图。 在 12 万左右这个区间里,配置算是中规中矩,没硬伤但也没惊喜。 那蔚来打算靠什么让这辆萤火虫在 10 万元的市场中具备竞争优势呢? 蔚来自己给出的答案是——最安全的小车,最智能的小车,以及具备独特情绪价值的小车。 待兑现的情绪价值 我们从后往前,先看情绪价值的部分。 外观设计算是情绪价格很重要的一部分。但是萤火虫从谍照阶段开始,对于其外观的争议就从来没有停止过,其中争议最大的是其前脸灯组的设计。 董车会之前在 NIO Day 总结文章里面的投票中,有 6000 多人参与了投票,其中仅有 800 余人觉得萤火虫好看,占比不到 15%,行业内的其他媒体和人员也大都觉得建议蔚来对车灯的设计进行修改。 但是蔚来自己倒是很有自信,直言不会做修改。 大家比较了解蔚来,造型的东西永远都是有人喜欢有人不喜欢,但是呢,我们可以很自豪地说,萤火虫是一个纯原创的高端小车。 ...... 有网友说大灯像复眼,问题萤火虫本身就是昆虫,真要论起来也合理。至于设计有没有 Plan B?这个真没有。(蔚来高管秦力洪) 情绪价值的第二个部分,是蔚来一直以来独特的换电和服务体系, 蔚来同时宣布了萤火虫车主可以享受蔚来的全套服务,包括上门补胎、取送车以及可以溜猫、遛狗的各种驾享服务,之前曾经宣传过的针对萤火虫车主提供的专属独特服务,这次发布会似乎没提了。 对了,萤火虫车主可以进牛屋。 但驾享服务也不是完全免费的,萤火虫官网的驾享服务包有 499 / 1399 / 4999 三档可选。 换电服务目前暂时处于「大饼」的状态,萤火虫这块 42.1 度的电池不兼容目前蔚来 1 到 4 代的任何一座换电站,而蔚来说可以支持的五代站最早将会在明年 1 月份投入使用。 而且产品负责人金舸曾经在接受采访时提到萤火虫不会超前建站。 比如说半径5公里内,已经聚集了一定数量的用户,用户就可以在APP里举手,要求帮我建个站,用这种方式来增长。 这样的话,至少在最初的一两年,萤火虫在补能的体验上就很难说能提供什么情绪价值了。 普通智驾、高配安全和亮眼车机 在去年 12 月份的这个时间节点,蔚来可能认为在一辆 10 万元级别的小车上搭载高快速路的 NOP 系统,应该就可以算得上同级最强了。 但是蔚来显然低估了智驾系统降价和普及的迅速程度,无图 NOA 功能在 13 万元级车型上搭载的情况也并不少见,而且各家的智驾功能也从去年的付费使用逐渐普及成了标配功能。 蔚来对此显然是有所认知的,但是受限于成本等各方面原因只能维持现状,不然也不会把萤火虫智驾功能改成了「十年免费」,多少显得有点扭捏。 值得特别提一句的是,蔚来萤火虫的智驾供应商地平线 18 号的发布会上,还拿了萤火虫作为代表车型,但是萤火虫并未用上最新的征程 6 系芯片,而是使用了上一代的征程 5。 安全性上倒是没什么槽点,前向预警、盲区监测、误加速抑制辅助和前后的 AEB 功能都有,硬件上则特别提到了安全气囊的气帘保压时长超过了 22s,超过了标准需求的 4 倍,侧气帘的长度也直接覆盖了 A柱到 B 柱的部分。 蔚来萤火虫这次在在座舱内部的细节设计、车机系统的交互体验方面做的不错,UI 设计很好的契合了年轻化的基调,尤其是在屏幕的不同区域用双指滑动的方式来调节音量、空调温度等的交互方式很好的解决了没有实体按键的痛点。 总结一下,蔚来萤火虫在这个价位段是一辆「外观有争议」、「配置没惊喜」、「服务待兑现」的车,或许能在追求年轻化和个性化的消费者中激起一些波澜,但要说想达到李斌一个月交付几万台的目标,可能有点难。 不过,这次萤火虫的发布会倒是挺简洁,没有会场、没有大屏,甚至主讲人也不是李斌,看来确实开始省钱了。
DRAM“危机”
在AI的狂飙猛进中,大模型规模呈指数级增长态势,从最初的 GPT-3的1750 亿参数,到如今前沿模型迈向万亿级参数的征程,每一次跨越都对计算资源提出了近乎苛刻的要求,尤其是存储带宽,给传统的内存技术带来了巨大挑战。 在过去几十年中,服务器硬件的算力峰值基本以每两年3倍的速度飞速增长,展现出强大的计算潜力。然而,DRAM带宽的增长速度却仅为每两年1.6倍,片间互连带宽的增速更是只有每两年1.4倍。这种不均衡的发展速度,使得在长达20年的时间跨度里,造成了内存的存取速度严重滞后于处理器的计算速度,内存瓶颈导致高性能处理器难以发挥出应有的功效,这对日益增长的高性能计算形成了极大的制约。 这种不均衡的发展,被业界称为“存储墙”问题。 “存储墙”的存在使得处理器的性能无法得到充分发挥,严重制约了AI模型的训练和推理速度。有相关研究表明,在一些大规模的AI训练任务中,由于内存墙的存在,处理器的实际利用率可能只有理论峰值的20% - 30%,这无疑是对计算资源的巨大浪费。 直到HBM的出现,宛如一场存储领域的革命,彻底改变了传统DRAM的布局模式。HBM 凭借其超高的带宽,能够实现每秒1.2TB的数据传输速度,这一数字是传统DRAM的数倍甚至数十倍,有效缓解了内存带宽的压力,使得AI芯片能够更快速地获取和处理数据,从而大大提升计算效率,满足AI模型对带宽的极致需求。 而HBM之所以能够实现如此高的带宽,关键在于其采用了先进的3D堆叠技术,通过硅通孔(TSV)技术,将多个DRAM芯片垂直堆叠在一起,形成了一个紧密的存储模块。在传统的DRAM中,芯片是平铺在电路板上的,数据传输线路较长,信号衰减和延迟较大。而HBM的3D堆叠结构使得数据传输线路大幅缩短,信号传输更加快速和稳定。 然而,尽管HBM在技术上展现出了巨大的优势,但其制造过程堪称一场精密而复杂的“垂直革命”,其核心在于TSV、减薄封装和微凸点等关键技术的协同运用,每一个环节都蕴含着极高的技术难度和工艺挑战,且其高昂的成本或许也成为了制约其大规模应用的一大障碍,使得许多对成本较为敏感的应用场景望而却步。 综合来看,传统DRAM面临“存储墙”瓶颈;DRAM堆叠而来的HBM同样面临工艺复杂、成本高昂的挑战。 因此,当传统DRAM及其路径延续性技术创新的弊端开始暴露出来,市场亟待能够满足新场景需求的存储器产品,一些新型存储迎来机会窗口。 DRAM危机,新型存储技术群雄逐鹿 3D铁电RAM:DRAM存储架构的颠覆者 在探索DRAM替代技术的征程中,3D铁电RAM展现出了巨大的潜力,成为了备受瞩目的焦点。 其中,美国SunRise Memory公司便是这一领域的开拓者,他们致力于开发用于AI应用的3D铁电RAM芯片,其技术路径极具创新性。 据了解,SunRise Memory采用垂直堆叠的FeFET存储单元,这种独特的设计使其目标存储密度比传统DRAM芯片提高10倍。通过巧妙地利用HfO2(二氧化铪)的铁电效应,该技术实现了非易失性存储,这意味着在断电后数据依然能够得以保存,大大提高了数据的安全性和稳定性。 不仅如此,其功耗相较于传统DRAM降低了90%,这对于对功耗极为敏感的AI应用来说,无疑是一个巨大的优势。在数据中心中,大量的服务器需要长时间运行,功耗的降低不仅可以减少能源成本,还能降低散热需求,从而降低整个数据中心的运营成本。 因此,与传统DRAM相比,3D铁电RAM在性能上具有明显的优势。它不仅具备DRAM的高速读写特性,能够快速响应数据请求,还拥有闪存的非易失性,无需频繁刷新数据,降低了能耗。 对此,SunRise坚信3D铁电RAM能够提供高容量、高带宽、低功耗的替代方案。该公司已组建了一支由40名工程师组成的团队,分别位于美国和以色列,并正在设计其铁电RAM,使其能够在现有的掌握3D工艺流程的大批量晶圆厂(例如3D NAND晶圆厂)中生产。 SunRise公司还表示,该芯片级架构还希望并行管理数百个独立的存储库——优化带宽而非芯片面积和成本,这将有助于降低延迟,并支持以内存为中心的AI推理和训练以及高性能计算。这一目标一旦实现,或将为AI推理和训练以及高性能计算带来前所未有的变革。 然而,3D铁电RAM要实现大规模商业化生产,还面临着诸多挑战。在材料方面,需要进一步优化HfO2等铁电材料的性能,提高其稳定性和可靠性。在制造工艺上,也需要不断创新,降低生产成本,提高生产效率。 SunRise也并未透露何时能将3D铁电RAM推向市场,也未透露哪些具备3D技术的制造商可以成为其合作伙伴。只是在其网站上表示,目前开发过程已进行到一半左右。 此外,韩国科学技术院(KAIST)在铁电存储领域也取得了突破。 其研究团队在FeFET与HfO2铁电效应的研究上,通过精确调控HfO2铁电材料的准同型相界(MPB),成功实现低功耗、高可靠性的FeFET器件。这一成果为存储技术的发展开辟了新的道路。 据悉,准同型相界是铁电材料中两种相之间的特殊区域,在这个区域内,材料的性能会发生显著变化。KAIST的研究团队巧妙地利用这一特性,通过调整材料的成分和制备工艺,使得FeFET器件的性能得到了极大的提升。他们研发的FeFET器件,存储单元面积可缩小至4F²,这一成果使得存储密度大幅提升,为3D DRAM堆叠奠定了坚实基础。 整体来看,在实际应用中,这种新型的FeFET器件展现出了巨大的潜力。在数据中心中,它可以提高存储系统的性能,降低能耗,为大规模数据存储和处理提供更高效的解决方案。当然,从实验室研究到实际应用,还有很长的路要走。研究团队需要进一步优化器件的性能,提高其兼容性和稳定性,以满足不同应用场景的需求。同时,还需要与产业界紧密合作,推动技术的产业化进程。 DRAM+非易失性内存,新革新 内存供应商Neumonda GmbH已与Ferroelectric Memory Co.(FMC)联手,帮助销售FMC的“DRAM+”非易失性内存。 Neumonda在DRAM内存设计和测试领域拥有多项专利,将为FMC提供内存咨询服务,并为其非易失性DRAM+产品提供Rhinoe、Octopus和Raptor测试平台。两家公司将在测试解决方案的设计和提供以及DRAM+的市场营销方面展开合作。 FMC成立于2016年,是德累斯顿工业大学孵化器公司NaMLab GmbH的衍生公司。据悉,FMC成立的初衷是将HfO2铁电效应这一颠覆性发明应用于半导体存储器,将其应用于DRAM,可将DRAM电容器转变为低功耗、非易失性存储设备,同时保持DRAM的高性能,从而生产出适用于AI计算的颠覆性非易失性DRAM存储器。 较旧的FeRAM技术(通常使用锆钛酸铅 (PZT) 作为铁电层)容量有限。大多数商用产品最多只有几兆字节,4MB或8MB相当常见。PZT无法随着工艺节点的缩小而很好地扩展,并且与标准CMOS工艺的集成既困难又昂贵。因此,像1T1C(一个晶体管,一个电容器)这样的单元结构比DRAM或NAND占用更多的面积。 转向HfO2将改变游戏规则。HfO₂与CMOS兼容,可远低于10nm制程,并可与现有的半导体制造工艺集成。因此,使用HfO2可实现更高的密度和性能,可能达到千兆位到千兆字节的范围,使其更接近DRAM。 Neumonda将通过咨询和提供其先进测试系统Rhinoe、Octopus和Raptor的使用权来支持FMC。这些平台专为低成本、节能和独立的内存测试而设计。Neumonda的系统提供传统设备无法实现的详细分析,并且成本显著降低。 不过,FMC尚未透露DRAM+何时实现商用,以及由谁以何种配置生产内存芯片,或采用何种制造节点。但FMC在其网站上声明,其DRAM+产品系列可用于AI训练、工业、汽车和消费应用。此外,FMC还提到了Cache+产品线,将DRAM+理念扩展到Chiplet形式的非易失性缓存存储器。 Imec重构DRAM架构: 2T0C设计改写游戏规则 DRAM是传统计算架构中的主存储器,其位单元在概念上非常简单。它由一个电容器 (1C) 和一个硅基晶体管 (1T)组成。电容器的作用是存储电荷,而晶体管则用于访问电容器,以读取存储的电荷量或存储新电荷。 多年来,位单元密度的扩展使业界得以推出后续几代DRAM技术,并应对日益增长的DRAM需求。但自2015年左右以来,DRAM内存技术一直难以跟上处理器逻辑部分性能改进的步伐:扩展、成本和功率效率 问题构成了不断上升的“内存墙”的组成部分。大电容限制了1T1C位单元的可扩展性和3D集成,而这是迈向高密度DRAM的最终途径。此外,随着存取晶体管变得越来越小,它为电容电荷的流失提供了越来越大的漏电路径。这会降低数据保留时间,并需要更频繁地刷新DRAM单元——从而影响功耗。 2020年,imec报告了一种新颖的DRAM位单元概念,可以一次性解决这两个问题:一个位单元由两个薄膜晶体管(2T,一个用于读取,一个用于写入) 和无电容器(0C) 组成。薄膜晶体管的导电通道由氧化物半导体组成,例如氧化铟镓锌 (IGZO)。由于其宽带隙,基于IGZO的晶体管具有极低的关断电流,有利于存储器的保留时间、刷新率和功耗。更长的保留时间也放宽了对存储电容的要求,允许读取晶体管的寄生电容接管存储元件的角色。 同时,制造IGZO 2T0C位单元比传统单元更简单、更具成本效益。除Si之外,IGZO材料可以在相对较低的温度下沉积,从而与后端制程 (BEOL) 工艺兼容。这为新的DRAM架构打开了大门。 首先,它允许将DRAM外围设备移到DRAM存储器阵列下方,而不是位于其旁边。这减少了DRAM存储器芯片的占用空间,并使阵列和外围设备之间的连接更加高效。在这种配置中,2T0C DRAM位单元集成到外围设备的BEOL中,这是IGZO材料的特性允许的。 其次,新颖的位单元为2D或3D堆叠配置铺平了道路,从而进一步提高了密度。这些堆叠配置将有助于打破存储器壁垒,使DRAM存储器能够继续在云计算和人工智能等数据密集型应用中发挥关键作用。在不同层面上实现两个晶体管(堆叠2T0C)还有低关断电流、导通电流等额外的好处。可以分别优化两个晶体管。 在率先提出这一概念后,imec在2020年IEEE国际电子设备会议 (IEDM)上首次实验演示了功能性2T0C DRAM单元。 凭借低关断电流的优势,首批2T0C DRAM单元的保留时间>400秒,大约是典型DRAM刷新时间的1000倍。这些结果是在对在300毫米晶圆上加工的基于IGZO的薄膜晶体管进行缩放和优化后获得的。优化旨在抑制氧和氢缺陷的影响,这是开发性能良好的基于IGZO的晶体管面临的主要挑战之一。然后将栅极长度为45nm的优化晶体管集成到2T0C DRAM位单元架构中,其中读取晶体管的寄生电容用作存储元件。 (a) 基于2T0C IGZO的DRAM单元的布局(b) 相应的TEM图像(W=写入;R=读取;WL=字线;BL=位线) 接下来,imec开始探索能够提高2T0C DRAM密度并改善性能和可靠性指标(例如关断电流、数据保留、耐久性、导通电流和阈值电压)的旋钮。 在2021年的IEDM上,imec研究人员展示了一种改进的基于IGZO的2T0C DRAM位单元,其保留时间>1000秒,耐久性几乎无限(>1011次读写周期),写入时间<10纳秒。 这些突破性成果是在优化IGZO晶体管的材料堆叠和集成方案后取得的:采用后栅极方法,采用埋氧隧道和自对准接触,并结合缩放栅极电介质 (Al2O3 ) 厚度。实施埋氧隧道并与O2环境中的退火相结合,降低了IGZO通道中的氧空位浓度,有利于开启和关闭电流。 这项IGZO-DRAM技术为更积极的DRAM微缩奠定了基础。IGZO晶体管的栅极长度缩小至14nm,同时仍保持>100s的保持时间。研究人员还展示了2T0C DRAM单元的变体,其IGZO层厚度大大减小(5nm)。这消除了对氧隧道和O2退火步骤的需求,从而简化了工艺流程。Imec还展示了具有共形沉积薄IGZO通道(5nm,通过ALD)的功能晶体管,这是迈向3D DRAM集成的垫脚石。 最近,imec使用反应离子蚀刻 (RIE) 技术代替常用的离子束蚀刻 (IBE) 来对2T0C晶体管的有源模块进行图案化。RIE可以在极小的尺寸(小于100nm)上进行图案化,同时损伤有限,从而进一步减少面积消耗。此外,由于有效抑制了晶体管侧壁上的外部泄漏路径,在2T0C DRAM位单元中使用这些晶体管可以将保留时间大大提高到4.5小时以上。 据悉,imec的颠覆性DRAM概念的潜力引起了世界各地大学、研究机构和公司的兴趣。几个研究小组开始研究其他位单元配置、晶体管性能“助推器”和替代氧化物半导体材料。 其中,中国科学院微电子研究所自2021年起发布有关2T0C IGZO DRAM的文章,展示了一种有利于多位操作的替代2T0C配置。后来又展示了具有垂直集成IGZO通道的晶体管。单片堆叠“垂直”读写晶体管的能力使面积高效的4F2 2D DRAM单元配置成为可能;旺宏实现了具有环绕栅极和环绕通道IGZO FET的3D 2T0C位单元;北京大学基于材料堆叠工程优化了IGZO晶体管,从而提高了2T0C DRAM单元性能。 除了IGZO,W掺杂的氧化铟 (IWO)等其他氧化物半导体通道材料的薄膜晶体管也在考虑之中。斯坦福大学最初考虑使用氧化铟锡 (ITO) 来实现2T0C。2024年,他们还与台积电合作使用IWO制造了n型薄膜晶体管。此外,他们还首次将IWO n型晶体管与同样由氧化物半导体制成的p型晶体管相结合,以提高性能并减少耦合效应。 根据Yole发布的2024年报告显示,2T0C IGZO-DRAM最近已被添加到长期DRAM技术路线图中。该技术被认为是实现备受期待的3D DRAM的可能方法之一。此外,未来几年对边缘设备上的AI的需求预计将激增,从而产生对高密度嵌入式DRAM (eDRAM)的需求。无电容器IGZO-DRAM技术是此应用非常有吸引力的候选者。基于其开创性活动,imec开始开发与BEOL兼容的eDRAM实现。 多年来,imec在评估、理解和建模可靠性故障方面取得了长足进步,为制造目标寿命为五年的可靠IGZO晶体管提供了诸多思路。 相变存储器,低功耗与高性能的双重突破 除了上述技术,还有众多新型存储技术在不断涌现,它们各自凭借独特的优势,在替代DRAM的赛道上展开了激烈的角逐。 相变存储器(PCM)便是其中的佼佼者。 PCM的原理是通过改变温度,让相变材料在低电阻结晶(导电)状态与高电阻非结晶(非导电)状态间转换。PCM具备低延时、寿命长、功耗低、密度高、抗辐照特性好等优势。 大家都比较熟悉的Intel和Micron合作开发的3D XPoint技术,就是PCM的一种。只不过随着英特尔傲腾内存业务的关闭,3D XPoint内存技术也走到了尽头。 据报道,韩国KAIST的Shinhyun Choi教授团队开发的纳米灯丝技术,为PCM的发展带来了新的突破。该技术通过创建相变纳米丝,将PCM的功耗降低了15倍,成功解决了传统PCM功耗过高的问题。这项技术的原理是利用材料在不同相态之间的转变来存储数据,通过精确控制相变过程,实现了高速、低功耗的数据读写。 与传统PCM相比,这种新型PCM不仅保持了速度快、ON/OFF比大、变化小、多级存储特性等优点,还实现了低功耗运行。它还兼具DRAM的速度和NAND的非易失性,使数据存储更加稳定可靠,为存储技术的发展开辟了新的道路。 在物联网设备中,相变存储器可以作为高效的存储解决方案,满足设备对低功耗和高性能的需求。 新型非易失性存储器:UK III-V Memory 英国兰开斯特大学的研究人员研发出了一种基于GaSb/InAs的新型非易失性存储器—UK III-V Memory。 该技术基于20nm光刻工艺构建,写入时间仅为5ns,与DRAM相当,而写入能耗却仅为DRAM的1%。它采用“双阱共振隧道结”,通过交替的GaSb和InAs层实现数据存储,具备类似闪存的简单读取特性,同时能够在断电时保持数据的完整性。这意味着设备在断电后无需重新加载数据,可几乎立即打开电源并返回到上次停止的位置,大大提高了设备的使用效率。 该团队首席研究员Manus Hayne认为,该技术有望取代价值1000亿美元的DRAM和闪存市场,目前团队正在为其申请专利。在移动设备中,用户希望设备能够快速启动并恢复到上次使用的状态,UK III-V Memory的出现恰好满足了这一需求,未来有望在移动设备存储领域发挥重要作用。 SOT-MRAM技术,新突破 磁阻式随机存取存储器(MRAM)也在不断发展。这是一种基于隧穿磁阻效应的技术,它利用磁性材料的磁阻效应来存储数据,具有非易失性、高速读写、无限次擦写等优势。随着技术的不断进步,MRAM的存储密度和性能不断提高,成本逐渐降低,有望在未来的存储市场中占据一席之地。 目前主流的MRAM技术是STT MRAM,使用隧道层的“巨磁阻效应”来读取位单元,当该层两侧的磁性方向一致时为低电阻,当磁性方向相反时,电阻会变得很高。 此外,基于自旋轨道扭矩(SOT)的磁性随机存取存储器(MRAM)也在不断取得进展。德国美因茨约翰内斯古腾堡大学(JGU)的研究团队与法国Antaios公司合作,利用轨道霍尔效应开发出了一种新型SOT-MRAM。 该SOT-MRAM技术在写入电流和能效比方面实现了双重突破。通过轨道霍尔效应,该技术将写入电流降低了20%,能效比提升了30%,同时确保数据可以保存十年以上。 与传统的SOT-MRAM依赖强自旋轨道耦合的金属材料(如铂和钨)不同,该技术通过利用轨道霍尔效应将电荷电流转换为轨道电流,避免了对稀有和昂贵材料的依赖,降低了生产成本。其非易失性和低功耗特性,使其非常适合应用于数据中心和高性能计算等领域。在数据中心中,大量的数据需要快速存储和读取,同时对存储设备的稳定性和可靠性要求极高,新型SOT-MRAM的出现为数据中心的存储需求提供了新的解决方案。 写在最后 从HBM的3D封装到铁电存储的材料革新,AI正驱动半导体产业进入“架构+材料”双轮驱动的新时代。 当存储单元从二维平面走向三维立体,当数据存储突破易失性边界,AI算力的下一个十年,将由存储技术的持续革命来书写,全球存储产业正在经历一场深刻的重构。 在AI浪潮的强劲拉动下,各大厂商纷纷加大在HBM领域的布局,以抢占市场先机。但随着技术不断进步,未来的存储市场也将呈现出多元化的发展趋势。通过上文能看到,业界有不少技术正在觊觎DRAM的“宝座”,3D铁电RAM、DRAM+、IGZO 2T0C、SOT-MRAM、自旋电子器件等等新技术也在不断突破传统存储架构的束缚,展现出巨大的发展潜力。目前正逐渐从实验室走向工程验证阶段,有望在未来几年实现商业化应用。 如上文所述,当传统路径中延续性技术创新的弊端已经暴露出来,市场亟待能够满足新场景需求的存储器产品,新型存储迎来机会窗口。 新型存储技术的崛起也将为市场带来更多的选择,它们将与HBM相互补充,不同的存储技术将根据自身的特点和优势,在不同的应用场景中发挥重要作用,共同推动存储行业的发展。而这也将进一步重塑半导体产业的格局,为行业带来新的机遇和挑战。
裁员70%、降薪20%,AI四小龙集体断臂求生
作者 | 赵芷姗 编辑 | 汤安迪 在连连亏损下,曾经的AI四小龙开始学着贴地飞行。 4月10日,商汤科技发布了“日日新V6”大模型,多模态能力对标国际水平,数理分析超越GPT-4o。 凭借着新模型的优越表现,商汤科技在大众面前终于怒刷了下存在感。 谁还记得在八九年前,商汤科技与旷视科技、云从科技、依图科技并称为“AI四小龙”。 当下“AI六小龙”、“杭州七小龙”名号遍布,来的龙太多,曾经的“AI四小龙”也渐渐被时代遗忘。 3 月26日,商汤科技发布2024年度财报,全年总营收37.72亿元,净亏损43.06亿元,2018-2024年累计亏损超546亿元。 另一家上市公司云从科技,此前财报显示,2024年总营收约3.98亿元,同比下降36.6%,归母净亏损达5.9-6.8亿元,2017-2024年累计亏损超44.75亿元。 此外,裁员风波也盘旋在这四小龙的头上: 商汤去年裁撤非核心业务,战略重组后员工总数从2021年的6113人缩减至4672人,新加坡办公室搬迁至低成本区域; 云从去年传出全员降薪20%的消息,今年核心技术成员张岭辞职,核心技术人员仅剩下创始人以及副总经理; 依图裁员超70%,医疗业务几乎关停,武汉、西安等地分公司注销…… 如今的AI四小龙已经坠落凡尘,抛开理想,回归现实,重新适应行业的新环境。 陷入商业化难题 从辉煌跌落 在2011-2015年期间,旷视、依图、商汤和云从依次成立,且都聚焦于计算机视觉技术,当时计算机视觉是AI的核心赛道,凭借人脸识别、图像识别等技术这四家公司在AI行业初露头角。 2016年,AlphaGo横空出世,击败世界围棋顶尖高手李世石,引发了全球AI热潮,资本开始涌入AI领域,因技术领先,它们四家被并称为“AI四小龙”。 2017 年后,四小龙进入高速发展期,商汤成为全球估值最高的AI初创公司,并于2021年港股上市,开盘首日市值突破2000亿港元;旷视在安防领域占据重要份额;依图在医疗影像和智慧城市取得突破;云从则依托于政府和国有资本背景,拓展金融和安防市场,在2022年成功科创板上市。 然而,四小龙普遍都面临着商业化的难题,在高研发投入下,亏损却不断增加。 同时,OpenAI横空出世后,大家逐渐将以自然语言处理为主的新技术,视为AI主流,而非计算机视觉。 在这种情况下,四小龙想要活下去,只能转型。 奋力自救 要留在AI牌桌上 根据Epoch AI的研究报告,预计到2028年,训练大语言模型的文本数据需求将完全覆盖互联网公共可用文本总量,到时候就会面临无文本可用的局面。 此时,从计算机视觉再转做大语言模型,不异于走向另一个死胡同。 AI的最终目标是AGI,语言只是其中一个形态,这也意味着有着视觉基因的AI四小龙存在着卷土重来的可能。 算力基础+ 长期积累的视觉数据,这三家都不约而同押注多模态大模型。 商汤自2018年开始建设智算中心,2022年正式建成了亚洲最大的人工智能计算中心AIDC,其SenseCore AI大装置已积累超600种预训练模型,支持千亿级参数模型训练。 依图与华为华为联合推出了昇腾大模型一体机,将硬件成本降低50%,在南京“城市之眼”项目中,算力密度达英伟达H100的95%,但采购成本仅为1/5。 云从基于昇腾芯片,与华为联合推出了从容大模型训推一体机,支持千亿级参数模型训练。此外,云从在昇腾910B芯片上深度适配,构建了混合模型云服务,同时支持自有和第三方模型。 商汤科技董事长兼CEO徐立在4月10日的演讲中,指出,纯粹的语言模型不能真正完整地表达人类的智能,多模态能够补充互联网上文本数据的不足,挖掘图像、视频等非文本数据中的知识。 日日新V6大模型不仅支持多模态的原生融合,还突破了传统语言模型+插件式多模态的拼接模式,通过跨模态桥接技术,实现不同模态数据的联合编码,避免多任务训练中出现“跷跷板效应”。 此前有论文指出,从文本模型扩大到多模态模型,后加入的图像、视频与语言数据会出现拉低文本数据的现象,产生多模态噪音。 商汤科技首席科学家林达华,称商汤从去年5月就开始坚信多模态大模型是未来,刚开始采取核心模态+次要模态的路径,但总会有一个模态被削弱,之后投入大量训练,最终实现了两个以上模态间的并存。 去年,商汤生成式AI业务收入达到24亿元,在总收入中占比达到63.7%,同比涨幅超过100%。 今年年初,依图科技联合创始人林晨曦在接受媒体采访时,表示依图目前专注做以视觉为中心的多模态模型,这是通向AGI的一个重要方向,即空间智能。 同时他坦言,最近三年虽然没赚大钱,但公司是盈利的,业务现金流为正,已经在AI商业化有了初步的探索基础。 而旷视科技在算力上缺乏优势,选择通过算法优化减少对硬件的依赖,与车企合作,转向智能辅助驾驶的纯视觉方案。 旷视创始人印奇空降成为千里科技董事长,与吉利共同推出了覆盖全系车型的智能辅助驾驶系统。 在问到依图未来10年的最终目标是什么时,林晨曦坦率说,我们很少谈3年以上的事情,更多的在谈未来三个月、三周的事情,因为发展不是口号喊出来的。 现在的AI四小龙,不飘了,很务实。
机器人马拉松冠军诞生,谁是背后的股东?
天工队选手“天工Ultra”夺冠。图/北京亦庄官微 文|《财经》特约撰稿人 成孟琦 编辑|杨秀红 “人类围观机器人跑马拉松的时代真的来了!”4月19日,2025北京亦庄半程马拉松暨人形机器人半程马拉松赛事火爆出圈。20支形态各异的机器人队伍同台竞技,它们憨态可掬的“跑姿”引发全网热议,更是火上了热搜。 赛场上,既有身高近2米的大高个机器人率先领跑,也有以女性形象设计的“美女”机器人优雅前行;甚至出现机器人头部脱落仍坚持比赛的励志场景。最终,来自北京亦庄的“天工Ultra”凭借2小时40分42秒的成绩,成功问鼎全球首个人形机器人半程马拉松冠军。 “天工Ultra”身高约1.8米、体重约55公斤,由北京人形机器人创新中心研发。 企查查显示,北京人形机器人创新中心成立于2023年11月,由北京小米机器人技术有限公司(下称“小米机器人”)、北京优必选智能机器人有限公司(下称“优必选”)、北京京城机电产业投资有限公司(下称“京城机电”)、北京亦庄机器人科技产业发展有限公司(下称“亦庄机器人”)共同持股。其中,小米机器人、优必选和京城机电持股均占比28.57%,亦庄机器人持股 14.29%。 至于本次比赛对产业端的意义,北京亦庄方面表示,此次人形机器人马拉松赛事,是在复杂开放环境中测试机器人持续运行能力的检验机会,后期目标是为机器人行动能力的产业化需求铺路。 据悉,北京亦庄近期发布了万台机器人创新应用计划,将在九大标杆场景提供超万个应用机会。 天工机器人夺冠 此次夺冠的天工机器人为了完成21公里的长距离赛程,克服了哪些难点?对此,天工队发言人魏嘉星透露:“为在此次马拉松中取得优异成绩,我们攻克了本体的稳定性、轻量化设计、关节长时间运动易发热等硬件难题,还通过优化运动控制算法进一步增强了关节协调运动能力、步态协调能力和复杂地形通过能力等。” 据《财经》了解,“天工Ultra”不仅将时速从6千米/时提升到最高峰值速度12千米/时,还搭载通用具身智能平台“慧思开物”,能在斜坡、楼梯、草地、碎石、沙地等多种地形平稳移动,具备带有视觉感知的泛化移动能力,能轻松应对沟壑、大高度差等复杂地形,并拥有强大的抗干扰能力,受外力冲击依然能保持稳态。 亚军与季军也已出炉,小顽童团队的松延动力N2机器人获得亚军,来自上海卓益得机器人有限公司的行者二号机器人获得季军。 人形机器人选手松延动力N2机器人夺得亚军。图/北京亦庄官微 机器人跑马拉松,不是单打独斗,还有两三名人类队友打辅助,作为一整个队伍参赛,因此不仅需要机器人会跑,还考验人类和机器人之间的配合。 有趣的是,作为理性和秩序感代表的机器人,在这场全程21公里的马拉松比赛中,反而比人类更状况百出。 “可以看到,20支队伍里,只有7支参赛队完赛,大部分中途换电池,还有很大一部分机器人跑步途中需要对膝盖喷散热剂,曾经上过春晚的宇树机器人,开跑就摔倒了。”一名机器人行业从业者在现场观看比赛后表示。 不过,在该场比赛结束后,宇树科技对此发布声明称:“宇树最近完全没有参与任何比赛,主要忙着准备人形机器人的格斗直播。G1人形机器人,从2024年发货开始,已经出售给全球非常多的客户,使用了很久。所以这次马拉松比赛,也有好几个独立的团队使用我们的机器人。比如我们的客户用他们自己的算法参与了比赛,所以在现场能看到不少我们的机器人。有好几个独立团队在使用,不同人操作或开发情况下,机器人的表现差别很大,请大家不要误解。” 宇树科技同时表示,“机器人和其他电子产品类似,表现性能和使用者息息相关,希望大家一起共同推动机器人行业的进步。” 作为全球首场机器人马拉松比赛,也有机器人选择稳妥为主,以“竞走”形式参赛。比如被网友亲切称为“老太太”的EAI机器人,时速只有5.4公里,陪跑的工程师表情也很轻松。最终,EAI反而超过了不少摔倒的机器人,夺得第五名。 北京经开区管委会副主任梁靓表示,机器人与人同场竞技具有双重意义:一方面,极限场景倒逼技术突破,推动机器人在运动控制、环境感知等领域实现跨越式发展;另一方面,通过公众参与和媒体传播,提升社会对“人机共生”的认知,加速机器人产业商业化落地。 背后公司有哪些? “天工Ultra”背后,有两家港股上市公司:2023年上市的优必选和2018年上市的小米集团。 《财经》了解到,优必选是北京人型机器人创新中心的发起单位和总经理单位。2023年底,优必选与京城机电、小米机器人、亦庄机器人等10家企事业单位共同出资联合组建了北京人形机器人创新中心,优必选CTO(首席技术官)、执行董事熊友军担任创新中心的法定代表人和总经理。 “这是历史性的一刻,机器人完成了半马的赛程。”熊友军在当日比赛结束后表示,“今天(4月19日)的马拉松比赛是我们检验技术成熟度的很重要的一个方式,希望未来机器人能真正走入生活,帮助人类在一些不适合工作的危险场所进行作业。” “在北京人型机器人创新中心成立之初,优必选不仅调派了研发人员协助启动多个项目,还向创新中心开放了300多项专利,助力快速研发通用机器人母平台‘天工’,实现了全球首个全尺寸纯电驱人形机器人的拟人奔跑,最高速度超过12千米/时。”优必选相关人员对《财经》表示。 优必选也曾和北京人形机器人创新中心联合推出过面向市场销售的科研教育具身机器人。2025年3月,具备高仿生、高强度、高性能、高稳定、高拓展、高开放的“天工行者”开始面向市场销售,定价29.9万元起。 以制造手机与新能源汽车知名的小米集团,早在2021年便曾推出过机器人产品。在2021年8月10日小米MIX系列最后一代产品MIX 4发布会末尾,小米集团董事长雷军展示了小米第一款四足机器人CyberDog,这款机器狗支持手机、手机+遥控器、语音三种控制方法。 2022年8月11日,在CyberDog诞生一年后,小米又发布了首款全尺寸人形仿生机器人“铁大”。据悉,“铁大”身高177厘米,体重52千克,具备强大的情绪感知能力,能够辨别85种环境语义、45种人类情绪。 此外,取得本次比赛亚军的小顽童团队的N2机器人是由松延动力(北京)科技有限公司(下称“松延动力”)研发并参赛的人形机器人。松延动力成立于2023年9月,专注于人形机器人与具身智能领域,成立不到两年已累计完成五轮融资,投资方包括金沙江创投、英诺天使基金等知名机构。 北京亦庄方面表示,接下来,将持续深化机器人产业生态建设,重点推动本体企业与具身智能企业协同创新,将赛事的影响力转化为支持人形机器人产业化落地的动力,加速构建国内领先、国际一流的具身智能机器人产业领航示范新城。
AI版本宝可梦冲榜上全球前10%!一次性“吃掉”10年47.5万场人类对战数据
新智元报道 编辑:定慧 【新智元导读】还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没用启发式算法,纯靠47.5万场人类对战回放训练出来,居然打上了Pokémon Showdown全球前10%! AI 又有「新活」了! 德州大学奥斯汀分校的研究团队用Transformers和离线强化学习训练出了一个宝可梦对战AI智能体,不但打法像人,还能在全球排名中杀进前 10%。 论文地址:https://metamon.tech/ 是的,你没看错,这不是那种靠搜索和规则的AI,而是靠人类历史对战数据「喂出来」的智能体,能自己学着打。 这个宝可梦游戏(全称Competitive Pokémon Singles)有多复杂呢? 在对战平台https://pokemonshowdown.com/上可以看到,即使不考虑策略,光是精灵、动作和物品的数量已经多到了非常夸张的程度(根本翻不完)。 这意味着,AI要在信息不完全、策略博弈的环境中,把每一步出招、每一次换人,都当成下围棋一样来算。 宝可梦对战融合了国际象棋般的长远策略规划、扑克牌那样充满未知信息和随机性,再加上足以填满一本百科全书的宝可梦、招式、特性和规则。玩家需要精心设计和操控自己的宝可梦队伍,击败对手的所有宝可梦才能获胜。这样一个充满不确定性、状态空间极其庞大的游戏,对AI来说是绝佳又极具挑战性的研究课题。 这种硬核程度,更像是宝可梦版的《星际争霸》。 把「回放」喂给 AI,教它打宝可梦 研究团队开发了一个名为Metamon的平台,它使用来自Pokémon Showdown(以下简称PS)的人类游戏数据集来启用离线RL工作流。 PS会创建一个日志(过程「回放」),记录每场战斗。 玩家保存日志以供日后研究、与朋友分享有趣的结果,或作为记录官方锦标赛结果的证明。 PS的回放数据已经超过十年——足够的时间积累数百万个重放,比如下面的是10年前2014年的战斗回放。 PS回放数据集是一个完全的、自然发生的人类数据集合,但这个数据集有个问题——这些数据是以第三方角度收集的,而不是第一人称,训练智能体需要用第一人称视角。 研究团队通过将观众视角分别转换为每个玩家的视角来解锁PS回放数据集。 最终,研究团队搞出一个47.5万局真实人类对战组成的离线强化学习数据集,而且每天还在持续增长中。 在序列数据上使用离线强化学习算法训练 宝可梦拥有一个非常复杂的状态空间,因此在使用离线强化学习(offline RL)进行训练时,策略模型可能需要具备较大的规模和复杂的结构。 为了使训练过程更加稳定,将这个问题转化为行为克隆(Behavior Cloning, BC)的角度来理解:预测一个人类玩家的动作,实际上是在尝试推理模仿的这个玩家的策略,以及他们对对手的理解。 为了实现准确的预测,模型往往需要较长的上下文输入。 强化学习(RL)在这种场景下的作用,是帮助我们从包含了不同水平玩家(包括竞技和休闲玩家)决策的大规模数据中,筛选出有效信息。 采用的解决方案是actor-critic架构,其中critic的训练方式是使用标准的一步时序差分(temporal difference, TD)更新来输出Q值。至于actor的损失函数,其一般形式如下: 接下来,需要为CPS(Competitive Pokémon Simulator)定义观测空间、动作空间和奖励函数。 智能体需要获取足够的信息,以便能够模拟人类玩家的决策,而PS网站的用户界面是一个显而易见的参考点。 不过,由于模型具备记忆能力,因此无需在每一个时间步都提供全部信息。 最终达成了一个折中方案:输入由87个文本词语和48个数值特征组成。 下图展示了数据集中一场回放中的示例。观测只包含对手当前上场的宝可梦。 仅仅依靠强化学习能打赢人类吗? 传统做法教AI玩游戏,通常会设计规则、模拟状态、设计算法。 但这篇论文反其道而行之:直接喂数据,让它「模仿」人类怎么打。 他们训练了多个大小不同的智能体,从1500万参数的小模型,到2亿参数的大模型。 其中有的通过模仿学习训练(IL),有的则用离线强化学习(RL)进一步优化,还有的则加上「自我对战」的数据做微调。 可以在Pokémon Showdown上观看各个模型的游戏重播。 最强AI打上全球天梯前 10% 说了这么多,这AI真的能打吗? 研究者将多个版本的模型送上Pokémon Showdown的天梯服务器——这是全世界宝可梦高玩集中的地方。 结果模型居然排进了全球活跃玩家的前10%,并成功登上了排行榜。 在图中展示了Glicko-1阶梯分数及其评分偏差。柱状图标签标注的是GXE(胜率期望)统计数据。 阶梯分位数(Ladder Percentiles),在 2025年2月至3月期间下载的回放数据中,共识别出14,022个在第1到第4世代活跃的用户名。 以第1世代(Gen1)为例,在这些用户名中,有5,095个参与了 Gen1OU(标准对战规则),其中有2,661个活跃度较高,达到了在最终结果统计时拥有有效 GXE(胜率期望)数据的标准。 这可能是你第一次听说有人用Transformer打宝可梦,还打赢了人类。 但从技术视角看,这背后是强化学习、模仿学习、大模型训练和数据重构的完整链路。 它不只是一个「有趣的实验」,更像是一次对数据驱动游戏 AI 的深度演练。 下一步,或许可以不是打游戏,而是让AI玩转更复杂的现实任务。 此外,不同的训练策略以及大规模自我对战(self-play)技术,或许能够让智能体带来超越人类表现的突破。
蔚来萤火虫定价 11.98 万元!暂时无法换电,但车主却能进牛屋
蔚来萤火虫的最终上市价最终定在了 11.98 万元和 12.58 万元 ,比预售价便宜了 2.3 万元-2.9 万元,两个版本的差异只在于内饰材质,其他部分都是相同的。 Bass 方案的价格则是先藏了一手,要到 8 月份才有方案。一方面是因为萤火虫虽然支持换电,但是只能用蔚来的五代站,最快用上也要到明年了;另一方面,蔚来估计也是想看看市场的反应,到时候也有调整的空间。 咱们还是先来一起回顾下蔚来萤火虫的核心配置。 长宽高分别为 4003 / 1781 / 1557 毫米,轴距 2615 毫米,4.7 米转弯半径。 42.1 kwh 磷酸铁锂电池,CLTC 综合续航 420km。 13.2 寸中控屏 + 6 英寸仪表盘,高通骁龙 8155P 芯片。 地平线征程 5 智驾芯片,128Tops 算力,支持 ACC 和高快 NOP 功能。 其他的舒适性配置则可以参考下图。 在 12 万左右这个区间里,配置算是中规中矩,没硬伤但也没惊喜。 那蔚来打算靠什么让这辆萤火虫在 10 万元的市场中具备竞争优势呢? 蔚来自己给出的答案是——最安全的小车,最智能的小车,以及具备独特情绪价值的小车。 待兑现的情绪价值 我们从后往前,先看情绪价值的部分。 外观设计算是情绪价格很重要的一部分。但是萤火虫从谍照阶段开始,对于其外观的争议就从来没有停止过,其中争议最大的是其前脸灯组的设计。 董车会之前在 NIO Day 总结文章里面的投票中,有 6000 多人参与了投票,其中仅有 800 余人觉得萤火虫好看,占比不到 15%,行业内的其他媒体和人员也大都觉得建议蔚来对车灯的设计进行修改。 但是蔚来自己倒是很有自信,直言不会做修改。 大家比较了解蔚来,造型的东西永远都是有人喜欢有人不喜欢,但是呢,我们可以很自豪地说,萤火虫是一个纯原创的高端小车。 …… 有网友说大灯像复眼,问题萤火虫本身就是昆虫,真要论起来也合理。至于设计有没有 Plan B?这个真没有。 (蔚来高管秦力洪) 情绪价值的第二个部分,是蔚来一直以来独特的换电和服务体系, 蔚来今天宣布了萤火虫车主可以享受蔚来的全套服务,包括上门补胎、取送车以及可以溜猫、遛狗的各种驾享服务,之前曾经宣传过的针对萤火虫车主提供的专属独特服务,这次发布会似乎没提了。 对了,萤火虫车主可以进牛屋。 但驾享服务也不是完全免费的,萤火虫官网的驾享服务包有 499 / 1399 / 4999 三档可选。 换电服务目前暂时处于「大饼」的状态,萤火虫这块 42.1 度的电池不兼容目前蔚来 1 到 4 代的任何一座换电站,而蔚来说可以支持的五代站最早将会在明年 1 月份投入使用。 而且萤火虫的产品负责人金舸曾经在接受采访时提到萤火虫不会超前建站。 比如说半径5公里内,已经聚集了一定数量的用户,用户就可以在APP里举手,要求帮我建个站,用这种方式来增长。 这样的话,至少在最初的一两年,萤火虫在补能的体验上就很难说能提供什么情绪价值了。 普通智驾、高配安全和亮眼车机 在去年 12 月份的这个时间节点,蔚来可能认为在一辆 10 万元级别的小车上搭载高快速路的 NOP 系统,应该就可以算的上同级最强了。 但是蔚来显然低估了智驾系统降价和普及的迅速程度,无图 NOA 功能在 13 万元级车型上搭载的情况也并不少见,而且各家的智驾功能也从去年的付费使用逐渐普及成了标配功能。 蔚来对此显然是有所认知的,但是受限于成本等各方面原因只能维持现状,不然也不会把萤火虫智驾功能改成了「十年免费」,多少显得有点扭捏。 值得特别提一句的是,蔚来萤火虫的智驾供应商地平线 18 号的发布会上,还拿了萤火虫作为代表车型,但是萤火虫并未用上最新的征程 6 系芯片,而是使用了上一代的征程 5。 安全性上倒是没什么槽点,前向预警、盲区监测、误加速抑制辅助和前后的 AEB 功能都有,硬件上则特别提到了安全气囊的气帘保压时长超过了 22s,超过了标准需求的 4 倍,侧气帘的长度也直接覆盖了 A柱到 B 柱的部分。 蔚来萤火虫这次在在座舱内部的细节设计、车机系统的交互体验方面做的不错,UI 设计很好的契合了年轻化的基调,尤其是在屏幕的不同区域用双指滑动的方式来调节音量、空调温度等的交互方式很好的解决了没有实体按键的痛点。 总结一下,蔚来萤火虫在这个价位段是一辆「外观有争议」、「配置没惊喜」、「服务待兑现」的车,或许能在追求年轻化和个性化的消费者中激起一些波澜,但要说想达到李斌一个月交付几万台的目标,可能有点难。 不过,这次萤火虫的发布会倒是挺简洁,没有会场、没有大屏,甚至主讲人也不是李斌,看来确实开始省钱了。
美国“造芯”时代,来临?
2025年,台积电美国代工厂将正式开始量产,该工厂代表着先进芯片制造技术在美国的到来,也是对2022年《芯片与科学法案》能否帮助稳定美国及其盟友的半导体产业供应链的一次考验。然而,台积电的扩张与美国半导体自主制造的愿景,能否真正突破技术和产业链的瓶颈,重塑全球半导体格局,仍然是一个充满悬念的课题。 一、台积电美国厂,真的干成了 2020年5月,台积电宣布了一项历史性的计划——在美国亚利桑那州凤凰城投资120亿美元建设一座先进的半导体制造厂。到了2022年12月,台积电又宣布将总投资增至400亿美元,计划在同一地区建设第二座晶圆厂。2024年4月,美国商务部和台积电亚利桑那公司宣布,依据《芯片与科学法案》,将为该项目提供高达66亿美元的资金支持,推动全球最先进的芯片制造能力进入美国市场。台积电还计划在此基础上建设第三座晶圆厂。第三座工厂一旦投入使用,台积电在美国的总投资将超过650亿美元。 2025年3月4日,台积电进一步宣布,计划在美国先进半导体制造领域追加1000亿美元的投资。在该公司目前已投资650亿美元用于亚利桑那州菲尼克斯先进半导体制造业务的基础上,台积电在美国的总投资预计将达到1650亿美元。此次扩建计划包括新建三座制造厂、两座先进封装设施以及一个大型研发团队中心,这使其成为美国历史上最大的单笔外国直接投资项目。 目前,该地区的首座晶圆厂已经于2024年第四季度开始量产N4工艺技术,其良率已经与台积电中国台湾本土工厂相媲美。第二座晶圆厂将采用N3工艺技术,并预计在2028年投入运营。最新宣布的第三座晶圆厂计划采用2纳米甚至更先进的工艺技术,预计在本十年末开始量产。 按照这个时间轴来看,台积电在美国和中国台湾的生产工艺之间将存在大约5年的滞后。但不得不说,台积电位于美国亚利桑那州的晶圆厂将扮演着美国政府推动本土半导体制造并增强国家经济竞争力的重要角色。 虽然初期台积电赴美建厂项目一度引发业界对成本、产能爬坡与技术外溢的担忧。但从当前进展来看,这一扩展背后,台积电的长远考虑是显而易见的,其长期价值已逐步显现:不仅成功打开美国高端制造市场,还在客户信任、地缘协同和政策支持之间建立起三位一体的战略护城河。 台积电位于美国亚利桑那州的晶圆厂,正逐步成为全球高性能计算芯片巨头的“生产重镇”。 二、谁在“投奔”台积电美国厂? 苹果、AMD和英伟达——这三家美国高性能芯片设计巨头,正陆续将其尖端产品导入台积电美国厂的产线,标志着一场以“本土制造”为核心的供应链重构与地缘战略布局正在加速展开。 作为台积电亚利桑那厂的最大客户,苹果在2025年初就已进入其“美国制造”芯片的验证收尾阶段。据知情人士透露,该公司对首批由台积电美国厂生产的尖端处理器芯片进行了全面测试与质量验证,预计最快将于本季度启动商业量产。 不仅如此,在本土制造的转变上,苹果于2025年2月宣布,未来四年将在美国本土投资超过5000亿美元,重点布局密歇根、德克萨斯和加利福尼亚三地,扩展其研发和制造网络。该计划包括:在德州新建工厂、扩大先进制造基金、建设制造学院,以及大幅加码在AI与芯片工程领域的投入。 紧随其后,2025年4月中旬,AMD与英伟达也先后官宣,将在台积电亚利桑那晶圆厂投产自家芯片产品。 AMD首席执行官Lisa Su表示,公司已准备好在台积电美国厂启动生产,并透露其第五代EPYC服务器级CPU已完成投片验证,预计于2026年正式推出。这将是AMD首次在美国本土制造其核心高性能处理器,标志着其对美国制造业回归的坚定支持。 英伟达则宣布,其下一代AI芯片——Blackwell系列也将于台积电亚利桑那工厂生产,并首次在美国境内制造自家AI超级计算机。为支撑这一计划,英伟达已与富士康、纬创资通在德州合作,投入超过一百万平方英尺的制造空间,用于AI芯片与计算平台的组装与测试。 黄仁勋强调:“全球AI基础设施的引擎,正首次在美国建造。”他指出,通过本土化生产,英伟达不仅能更好响应全球市场对AI芯片爆炸式增长的需求,还能增强供应链韧性。未来四年,英伟达将与包括台积电、富士康、纬创、安靠科技、硅品科技在内的多家合作伙伴,在美国建造总价值高达5000亿美元的AI基础设施。 苹果、AMD、英伟达的集体“投奔”,并选择将关键产品落地美国本土生产,既是出于供应链安全的考量,也是在复杂地缘政治背景下的主动下注。接下来,可能会有更多美国的巨头会选择将代工转回美国,例如高通、博通、谷歌、Marvell等等。 三、英特尔代工:为本地化制造再添一把火 在英特尔加速重塑其产业角色之际,新任首席执行官陈立武(Sanjay Mehrotra)在2025年Vision大会上的主旨演讲,清晰描绘了英特尔代工(Intel Foundry Services,IFS)的发展路径及其核心战略。他强调,全球芯片制造需求持续高涨,客户寻求的不仅是先进制程,更是高韧性、强弹性、可信赖的供应链体系。英特尔代工正是在这一背景下被推至战略中心。 “代工业务本质上是一项建立在信任之上的服务模式。”陈立武指出,“而这种信任,需要通过持续的性能交付、流程透明和客户协同来兑现。” 与传统晶圆厂不同,英特尔当前正尝试以“系统级整合者”的身份切入全球代工市场,不仅着眼于制程节点的突破,也注重服务模型的差异化。陈立武表示,他本人每周都会与团队高层评估工程进展,深入参与技术工艺的优化,目标是通过强执行力将IFS打造成具备全球竞争力的代工平台。 他特别提到,代工客户的需求呈现高度差异化,设计方法论、IP生态、EDA工具链各不相同。其在Cadence的从业经历为他提供了丰富的第一手经验,使他意识到,仅凭技术远远不够,IFS必须建立起一套灵活、高度适配的服务体系。“我们会从客户所用的模型、IP、工具出发,精准优化性能和良率,以达到定制化交付。” 英特尔的18A工艺节点被视为其能否打破台积电垄断、重塑“技术领先者”形象的关键一役。陈立武透露,该制程已接近首次外部客户流片,并将在2025年下半年搭配“Panther Lake”平台进入大规模量产阶段。这一进程将作为英特尔代工体系能力成熟的标志。 他指出:“我们不追求短期爆发,而是着眼于构建长期稳定的商业模型。未来,我们希望与两到三个关键客户建立深度合作关系——这将决定IFS的技术韧性与生态位。” 更具战略意味的是,英特尔与台积电之间的关系正在悄然发生变化。据多家媒体披露,双方正酝酿成立一家合资公司,专责管理英特尔位于美国本土的晶圆厂资产。消息称,该合资公司计划吸纳高通、英伟达、苹果等顶级芯片设计企业,作为共同出资方。 台积电则将在新合资公司中持有约20%的股权,其出资形式以关键技术、工艺流程和工程团队支持为主。若消息属实,这一合作不仅将打通双方在美国制造端的协同路径,也可能成为全球芯片产业“融合与竞合”趋势的代表性事件。 四、美国能复制“台积电模式”吗? 尽管美国正大力推动半导体本土化,并吸引台积电、英特尔、三星等企业在美设厂,但复制“台积电模式”所代表的极致效率与高度整合的制造生态,仍面临结构性障碍。从成本压力到制造文化差异,再到供应链完整性,现实情况远比愿景复杂得多。 1. 成本门槛依然高企 最直接的挑战,是成本。 虽然台积电创始人张忠谋曾指出,在亚利桑那州建厂成本高、运营压力大,令外界担心美国制造经济上不可行。但TechInsights的最新研究给出不同结论:台积电Fab 21在亚利桑那加工晶圆的成本,仅比台湾高出不到10%。 该差距主要源于初期建设成本较高——台积电首次在海外、全新地点建厂,且部分工人尚未完全熟练。然而,一旦量产稳定,成本差距便趋于收敛。半导体制造的主要成本来自设备,占比超过三分之二,而这些高端设备(如ASML、AMAT等厂商提供)在全球价格一致,有效抹平了区域差异。 至于劳动力,尽管美国工资是中国台湾的三倍,但在高度自动化的现代晶圆厂中,劳动力仅占总成本不到2%,并非决定性因素。 当前的另外一个额外花费是,Fab 21生产的晶圆仍需返回中国台湾进行切割、测试与封装,部分再被运往中国大陆或美国用于整机装配。尽管这一复杂物流略增成本,未来台积电已计划在美建设本地封装产线,以实现全流程闭环。尽管有上述这些凭证,但值得注意的是,据传,台积电对美国产晶圆报价存在约30%的溢价。 在消费电子层面,美国制造的经济不可行性尤为明显。以iPhone为例,美国制造的尝试一直面临经济不可行性的现实约束。2025年4月,美国银行证券分析师瓦姆西·莫汉(Wamsi Mohan)在报告中指出,若仅以人工成本计,当前售价为1199美元的iPhone 16 Pro,其成本将上涨25%,价格可能达到1500美元。而在更激进的情形下,根据韦德布什证券分析师丹·艾夫斯(Dan Ives)的预测,在美国制造的iPhone售价可能高达3500美元。 这不仅仅是人力问题。据估算,美国组装一部iPhone的人工成本为200美元,是中国的五倍之多。同时,由于美国对多个关键零部件来源国征收高额关税,目前进口一部成品iPhone所需的零部件面临最高达145%的税负。 苹果公司联合创始人乔布斯在2011年就曾坦言:“这些工作不会回来了。”他所指出的,不只是制造业转移的问题,更是对美国制造生态系统全面性缺失的清醒判断。 2. 制造生态失衡:有工厂≠有生态 复制“台积电模式”的核心,不仅是盖晶圆厂,更是构建完整的、高度协同的制造生态系统。然而,美国当前的半导体基础设施在多个关键环节仍显薄弱。 过去30年,美国本土鲜有大规模晶圆厂新建,导致在关键设备(如光刻机)、材料(如光刻胶)、先进封装(如CoWoS/InFO)等领域高度依赖亚洲,特别是日本和中国台湾地区。即便台积电在亚利桑那建设先端工厂,也必须依靠全球协作,远非孤立自足。 不过,台积电的生态带动效应正在发挥作用。其封装合作伙伴安靠科技(Amkor)已在2023年底宣布将在亚利桑那州建设封装和测试工厂,并于2024年进一步确认与台积电在CoWoS、InFO等先进封装领域的合作。 英伟达也正联手Amkor与SPIL(硅品科技),将在亚利桑那州共同打造AI芯片封装与测试平台,以支持其Blackwell超级芯片的大规模生产。这一布局对美国构建AI芯片供应链至关重要。 3. 文化冲突与工程节奏:美国难以复刻的“台式管理学” 另一个深层次问题,在于工程文化差异。 台积电之所以能在全球保持良率领先与成本控制优势,离不开其高度纪律化的管理体系和高强度的工程师文化。在中国台湾,工程人员接受超长工时、高度响应的产业节奏已成行业共识。“十万青年,十万肝”是源自中国台湾半导体产业的俚语,专指台积电的员工。然而,这种工作模式在美国本土可能面临抵触。 美国强调工作生活平衡、强调员工权益与工会制度,这在效率驱动为本的芯片制造中,可能会造成节奏错位。如何在不牺牲效率的前提下兼顾本土化运营,是台积电在美国落地时必须应对的现实问题。 五、结语 “Made in Arizona”,美国“造芯”战略正在成型,但其本质仍是地缘政治驱动的安全布局,而非经济最优解。短期看,它将创造局部竞争力(如AI芯片、军用芯片),但大规模商业芯片制造仍难撼动台积电中国台湾基地的核心地位。真正意义上的“美国造芯时代”尚未到来,它不仅需要时间,更需要数十年如一日的产业积累、政策稳定性与系统性生态重构。
别克官微接连致敬李斌、何小鹏、华为、大疆!网友:醒醒 你不是小米
快科技4月20日消息,日前,别克汽车官微账号向王石、俞敏洪、罗振宇、李斌、何小鹏、宁德时代、华为中国、大疆、宇树科技等国内多位企业家和企业,发布了致敬文案。 别克致敬俞敏洪:当行业发生巨变,真正的强者总能在危机中找到新方向,致敬俞敏洪 这份永不言弃的坚韧,峰回路转带我们看到新境地。 别克致敬何小鹏:这是一次迟到的致敬,为“自动驾驶+AI”成为行业标配的当下,为10年前就已锚定的未来。 别克致敬李斌:当换电模式曾被质疑,用1000座换电站证明,真正的创业者敢于挑战行业惯性。 别克致敬华为:从通信巨头到智能汽车赋能者,以创新打破边界,在科技无人区持续突破,用创新改写规则!在智能科技领域这块,致敬遥遥领先的华为中国。 据了解,别克将于4月21日举办2025别克品牌日,届时,将会发布“逍遥驰骋超级融合架构”,别克官方或许想以致敬和喊话的方式,为自己的品牌日预热。 不过,对于别克品牌的这一波操作,有不少网友表示看不懂,“如果被致敬的企业家或品牌不互动的话,是不是有点尴尬了”。 还有网友更为直接,评论道:“醒醒,你不是小米”、“上一个这么玩的是小米,但小米人家是真有流量,被致敬的品牌也是赶紧回应。不过别克这么玩,可能会被认为硬蹭流量,东施效颦”。
英国要扩大在北极的军事活动?!
  英国《金融时报》近日报道称,英国政府在一份即将发布的报告中,呼吁扩大该国在北极地区的军事活动。   报道援引报告内容称:“英国应扩大在北极地区的军事活动,因为随着冰层融化使通航条件改善,该地区的争端越来越多,政府的国防报告将包含这一建议。” 英国《金融时报》报道截图   据报道,该报告由北约前秘书长乔治·罗伯逊领导的独立专家团队编写,英国政府要求他们研究英国面临的威胁,确定应对这些威胁所需要的能力,并评估英国军队的状态。   报告呼吁,英国应加大对无人机和尖端技术的投资。此外,报告还将确认英国向第六代隐形战斗机项目投资。   报道称,美国总统特朗普在安全政策上的转变,包括美国打算缩减在欧洲的军事资源等,引起北欧盟友的担忧。   报道援引英国皇家联合军种研究所高级研究员阿诺德的话称,“英国正面临向欧洲提供更多强硬的军事能力的压力”,“因为在情报、监视和侦察以及反潜战等方面,英国是唯一可以弥补美国缩减资源的国家”。   业内普遍认为,该报告一旦发布,英国皇家海军将获得比英国陆军更多的资源,未来能够更好地支援位于东欧的北约成员国。   据报道,英国政府计划在今年五六月份发布该报告。 英国游骑兵团骑着雪地摩托车巡逻(图自英国《金融时报》)   北极地区正日益成为多国角力的战略要地和地缘政治的热点区域。   北极地区蕴藏着丰富的石油、天然气、矿物和渔业资源,其油气储量约占全球未开发油气资源的四分之一。   此外,由于极地冰层不断融化,预计到2030年前后,北极西北航道和北方航道的商业与军事通航潜力将大幅提升。有分析认为,未来谁能在北极地区占据优势,就等于扼住了欧亚贸易的“咽喉”,可缩短航行距离约40%,显著降低对马六甲海峡、苏伊士运河等传统航道的依赖。 《外交政策》杂志报道截图
OpenAI爆出硬伤,强化学习是祸首!o3越强越“疯”,幻觉率狂飙
新智元报道 编辑:KingHZ 桃子 【新智元导读】o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。 满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据PersonQA基准测试,o3在33%的问题回答中产生了幻觉,几乎是o1(16%)的2倍。 而o4-mini的表现更加糟糕,幻觉率高达48%。 技术报告:https://cdn.openai.com/pdf/2221c875-02dc-4789-800b-e7758f3722c1/o3-and-o4-mini-system-card.pdf 甚至,有网友一针见血地指出,「o3对编写和开发超1000行代码的项目极其不利,幻觉率极高,且执行指令能力非常差」。 不管是在Cursor,还是Windsurf中,o3编码幻觉问题显著。 要知道,o3和o4-mini在Codeforces中成绩均超2700分,在全球人类选手中位列TOP 200,被称为OpenAI有史以来最好的编码模型。 它们验证了,Scaling强化学习依旧有效。 o3训练算力是o1的十倍 但为何随着模型参数规模Scaling,幻觉问题反而加剧? o3幻觉率至高,是o1两倍 过去,每一代新模型的迭代,通常会在减少幻觉方面有所进步,但o3和o4-mini却打破了这一规律。 更令人担忧的是,OpenAI目前也无法完全解释这一现象的原因。 技术报告中,研究团队坦言,「还有需要进一步研究来弄清,模型生成更多断言的问题」。 提前拿到o3内测资格后,非营利AI研究机构Transluce的测试,进一步印证了这一问题。 他们发现,o3在回答问题时,更倾向于「虚构」其推理过程中的某些行为。 比如,o3声称它在一台2021年款的MacBook Pro上运行代码,甚至声称是在ChatGPT之外复制的代码。 而且,这种情况出了71次。然而,事实是o3根本无法执行这样的操作。 前OpenAI研究员Neil Chowdhury表示,o系列模型使用的强化学习算法,可能是问题的根源。 RL可能会放大传统后训练流程中通常能缓解,但无法完全消除的问题。 强化学习「背锅」,编造根源找到了 首先,必须承认的是,幻觉问题并非是o系列模型独有,而是语言模型的普遍挑战。 而对于多数语言模型产生幻觉的原因,不外乎有这么几点: 1 预训练模型的幻觉倾向 预训练模型通过最大化训练数据中语句的概率进行学习。然而训练数据可能包含误解、罕见事实或不确定性,这导致模型在生成内容时容易「编造」信息。尽管后训练可以缓解这一问题,但无法完全消除。 2 讨好用户 RLHF训练可能激励模型会迎合用户,避免反驳用户的假设。 3 数据分布偏移 测试场景可能与训练数据分布不一致。 尽管这些问题是语言模型常见的失败模式,相较于GPT-4o,o系列模型的幻觉问题更为突出。 这背后,还有一些独特的因素。 RL推理训练副作用 作为推理模型,o系列采用了基于强化学习(Outcome-based RL)训练,专为解决复杂数学问题、编写测试代码而设计。 虽然这种方法提升了模型在特定任务上的表现,但也造成模型幻觉率飙升。 如果训练的奖励函数只关注正确答案,模型在面对无法解决问题时,没有「动力」去承认自己的局限。 相反,它可能选择输出「最佳猜测」,以期碰巧正确。而且,这种策略在训练中未受到惩罚,从而加剧了幻觉。 另外,工具使用的泛化问题,也不可忽视。 o系列模型在训练中,可能因成功使用「代码工具」而获得了奖励。即使在禁用工具的场景中,模型可能会「假想」使用工具来组织推理过程。 这种行为可能在某些推理任务中提高准确性,并在训练中被强化,但也导致模型虚构工具使用的场景。 真帮凶:CoT被丢弃 o系模型的另一个独特设计是「思维链」(Chain-of-Thought)机制。 在生成答案前,模型会通过CoT进行思考,但这一过程对用户不可见,且在后续对话中被丢弃。 事实上,它们可能在CoT中生成了看似合理但不准确的回答。比如,因为没有真实链接,o1曾生成一个了虚构的URL。 由于CoT在后续对话中被丢弃,模型无法访问生成前一轮答案的推理过程。 当你追问前一轮回答的细节时,模型只能基于当前上下文「猜测」一个合理的解释。 这种信息缺失,很难避免o3等不去编造信息。 o3很好,但过度优化是硬伤 在Ai2科学家Nathan Lambert最新一篇分析长文中,同样印证了这一问题: 强化学习给o3带回来了「过度优化」,而且比以往更诡异。 在任何相关查询中,o3能够使用多步骤工具。 这让ChatGPT的产品管理面临更大挑战:即便用户未触发搜索开关,模型也会自主联网搜索。 但这同时标志着语言模型应用开启了新纪元。 比如,Nathan Lambert直接问o3:「你能帮我找到那个长期以来被RL研究人员使用的,关于摩托艇过度优化游戏的gif吗?可能像是波浪破碎器之类的?」 过去,他至少需要15分钟,才能手动找到这个。 现在o3直接提供了准确的下载链接,而Gemini等AI则逊色很多。 与o3精彩互动:几乎立刻找到需要的GIF 多个基准的测试成绩,证明o3非常出色。OpenAI认为o3在许多方面比o1更强大。 o3是持续扩展RL训练计算资源时的产物,这也提升了推理时的计算能力。 但这些新的推理模型在智能上「孤峰凸起」,在有些方面并没有奏效。 这意味着有些交互令人惊叹,感觉像是与AI互动的全新方式,但对于一些GPT-4或Claude 3.5早已熟练掌握的普通任务,o3等新推理模型却彻底失败了。 这涉及到强化学习中的「过度优化」(over-optimization)问题。 RL过度优化,o3更严重 OpenAI o3模型展现了全新的推理行为模式,但过度优化是硬伤。 过度优化(Over-optimization)是强化学习(RL)领域的经典问题。 无论是传统强化学习、催生出ChatGPT的人类反馈强化学习(RLHF),还是当前新型推理模型中出现的情况,都呈现出独特的表现形式和不同影响。 当优化器的能力超过它所依赖的环境或奖励函数时,就会发生过度优化。 在训练过程中,优化器会钻漏洞,产生异常或负面的结果。 Ai2的科学家举了一个例子。 在Mujoco仿真环境中,评估深度强化学习算法时,发生了过度优化: 「半猎豹」(half-cheetah)模型本该学习奔跑,却用连续侧手翻最大化了前进速度。 o3表现出新型过度优化行为。 这与它创新训练方式密切相关。 最初的推理模型主要训练目标是确保数学和代码的正确性,而o3在此基础上新增了工具调用与信息处理能力。 正如OpenAI官方博客所述: 利用强化学习,我们还训练了这两款模型去使用工具——不仅教会它们如何使用工具,还让它们学会判断何时该使用工具。 它们根据预期结果来部署工具的能力,让它们在开放式任务中更加高效——特别是在涉及视觉推理和多步骤工作流的情况中。 这些训练中的绝大多数子任务都是可验证的。 这种新的训练方法确实提升了模型的实用性,但只对过去用户习惯使用的任务。 但目前还无法规模化地「修复」模型在训练过程中产生的怪异语言表达。 这种新的过度优化并不会使模型的结果变差,它只是让模型在语言表达和自我解释方面变得更差。 o3的一些奇怪表现让人感觉模型还没完全成熟,比如在编程环境中使用了无效的非ASCII连字符的这个例子。 越来越多的用户好奇:o3到底发生了什么? Karpathy当年评价初代推理模型时的名言: 当模型在思维链中开始不说人话时,你就知道强化学习训练到位了。 如今模型输出的这些怪异幻觉,本质上就是行为版的「不说人话」。 o3的行为组件使其比Claude 3.7漏洞百出的代码更有研究价值,或许也相对不易造成实际损害。 奖励黑客,AI学会钻空子 METR发现,o3是在自主任务中能独立操作最久的模型,但也注意到它有倾向于「篡改」它们的评分。 听起来是不是很熟悉? 事实上,奖励机制被钻空子(reward hacking)的例子比比皆是! 来自OpenAI最近论文的奖励黑客攻击例子: 左右滑动查看 论文链接:https://openai.com/index/chain-of-thought-monitoring/ 从科学角度来看,这确实是非常有趣且引人深思的—— 模型到底在学习什么? 与此同时,考虑到安全问题,大家对AI模型的广泛部署保持警惕,就很有道理。 但目前看来,大家还没有看到过于令人担忧的情况,更多的是效率低下和一些混乱的例子。 总结一下强化学习(RL)不同阶段中,看到的三种过度优化类型: 控制时代的RL:过度优化发生是因为环境脆弱,任务不现实。 RLHF时代:过度优化发生是因为奖励函数设计糟糕。 可验证奖励强化学习(RLVR2)时代:过度优化发生,使模型变得超级有效,但也变得更加奇怪。(还有更多尚未发现的副作用) 这种过度优化确实是一个需要解决的问题,因为语言模型的可读性是其一个重要优势。 Nathan Lambert相信通过更复杂的训练过程,这个问题是可以缓解的。 但OpenAI急于尽快推出模型,解决这个问题需要更多时间。 据报道,OpenAI的部分测试人员,只有不到一周的时间对即将推出的重要产品进行安全检查。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。