行业分类:
加载中...
头条分类:
加载中...
投资3万年入百万?起底“假冒支付宝招商”骗局:多地商户上当,涉案金额超千万
蓝鲸新闻8月10日讯(记者 陆鹏鹏)投资3万元,年入百万不是梦? 从去年开始,支付宝在全国范围内大力推广“碰一碰”支付技术,旨在为商户提供更便捷的收款方式。然而,在这一背景下,不少公司假冒支付宝官方,以“独家代理”“区域招商”等名义骗取商户高额代理费和保证金,随后卷款跑路。 记者调查发现,此类骗局已导致全国多地商户受骗,单个受害者损失超过万元,累计涉案金额超千万元。 假冒支付宝官方吸引投资 多地商户遭遇会销骗局,有人被诱导贷款缴费 近期,全国多地陆续有商户向蓝鲸新闻记者反映,他们遭遇了“支付宝碰一碰代理”骗局。 裕裕(化名)是湖南一位从事服装贸易的商户,今年1月,她收到一位自称是支付宝官方工作人员的电话,对方以“支付宝碰一碰本地招商会”的名义邀请众多商户参会。 裕裕告诉记者:“在会议现场,工作人员不断强调这是支付宝官方项目,宣称投资3万元可获得30台刷卡机,通过商户刷卡流水赚取分润,简单说就是只要参与合作代理就能挣很多钱,而且对方承诺几天内可退款。在对方的再三劝说下我签了一份交易合同。” 据受访者提供的合同显示,这家自称是支付宝官方的公司名为杭州碰付科技有限公司(下称“杭州碰付”),公司地址在杭州市钱塘区萧启科创园0147号。裕裕作为乙方,在签约后被授权为长期合伙人享受分润,区级分润为0.13%,市级分润为0.15%。 值得注意的是,该合同的签约金额为3万元,但彼时受访者无法拿出3万现金,现场工作人员甚至劝说其通过支付宝借呗支付费用,最终在额度的限制下,对方只划走了裕裕借呗账户上的15000元。 涉事公司卷款跑路 法定代表人自称是顶包人 蓝鲸记者了解到,杭州碰付从头至尾仅交付了一台设备,在裕裕后续要求退款时,该公司工作人员只是一味拖延时间称“正在协调”,最后甚至不堪其扰后将裕裕拉黑。直至此刻,裕裕才意识到对方已经跑路,自己被骗了。 天眼查显示,杭州碰付科技有限公司成立于2024年11月,注册资本200万元,法定代表人为杜学彬,持股100%。 公司地址位于浙江省杭州市滨江区浦沿街道滨文路426号岩大房文苑大厦20楼208261室,与合同中所提到的杭州市钱塘区萧启科创园0147号不同。 工商信息显示,该公司地址进行过多次变更。2024年12月,杭州市高新区(滨江)市场监督管理局,因通过登记的住所或者经营场所无法联系,将该公司列入经营异常名录。 顺着工商信息上的电话,蓝鲸记者致电杭州碰付,接线人自称是公司的法定代表人。但当记者表明身份后,对方声称:“我是被公司推出来顶包的,具体公司干了什么事情不清楚。你们自己该怎么办怎么办,我都被他们搞懵了,天天就接到这些电话。” 随后,蓝鲸记者致电当时和裕裕对接的所谓的支付宝工作人员,对方表示,该项目已经停止招商了。说罢便挂断了电话。 从“年入百万”到“血本无归” 一场精心设计的代理骗局 蓝鲸记者调查发现,类似的受骗案例绝非个例。在多个社交媒体平台上,大量投资者反映遭遇了相同的骗局,单笔受骗金额普遍在数万元不等,部分受害者的损失甚至高达数十万元。 这些骗子公司往往在招商阶段精心包装,以极具诱惑性的话术吸引投资者入局。他们不仅划分出市代6万、省代12万、国代25万等不同层级的代理模式,更信誓旦旦地承诺“投资越大回报越高”,甚至夸下海口保证投资者能够“年入百万”。 为了增强可信度,这些公司的会场布置高度模仿真实品牌活动,甚至使用平台Logo和宣传物料增强可信度。过程中,工作人员会刻意安排“托儿”混入参会者中,监视真实客户反应,并通过激昂演讲、音乐干扰等手段制造紧迫感,诱导现场签约缴费。 然而当投资者缴纳费用后,等待他们的不是承诺的高额回报,而是各种推诿拖延。有的受害者迟迟等不到设备交付,更恶劣的是,不少公司在收取大笔资金后瞬间消失,让投资者血本无归。 支付宝曾发打击假冒公告 从未授权任何人以官方名义招商引资 关于支付宝碰一碰项目,记者致电支付宝官方热线,接线工作人员表示,支付宝不会授权任何第三方以官方名义去招商或者诱导商家缴费加盟,如果遇到这种情况需提高警惕,大概率是骗局。 记者查询发现,早在2024年12月,支付宝官方就发出过《关于打击假冒支付宝工作人员推广支付服务的公告》。 公告称,近期接到反馈,有相关人员身穿印有“支付宝”字样的马甲或工装,冒充支付宝官方工作人员在线下推广“碰一下”支付机具时收取高额设备押金。另外,还有机构以支付宝官方代理、独家代理的名义办展会、招收加盟商、收取加盟费用。 支付宝还表示,将联合相关部门对这些不法行为进行打击。 已知投资者累计损失超千万 行骗套路新瓶装旧酒 值得注意的是,这种骗局并非首次出现,而是一种新瓶装旧酒的套路。 早在2020年,就有公司假冒支付宝官方,以推广刷脸支付设备为名吸引投资。该公司名为广西边拓智能科技有限公司(以下简称“边拓公司”)。 据大河报报道,今年4月,南宁市检察院对该公司实际控制人董某以集资诈骗罪起诉,并在8月6日在南宁中院一审开庭。 起诉书显示,南宁市检察院查明,边拓公司实际控制人董某自2020年7月,在其本人及边拓公司均不具备从事吸收公众存款金融业务资质的情况下,设置支付设备投资产品,吸收社会公众投资资金,向投资者夸大已安装运营支付设备数量,并利用“边拓公司”小程序向投资者展示虚假的支付设备安装信息。 2023年7月,因边拓公司涉嫌非法集资,南宁市金融工作办公室等部门通知董某停止吸收资金并对投资者清退资金,至2023年11月,董某向投资者清退资金约2亿元。 可以看到的是,支付宝碰一碰招商骗局和上述案例的模式如出一辙,均假冒官方授权、虚构设备收益。唯一不同的是,随着技术迭代,诈骗分子将曾经的刷脸支付设备替换为如今的”碰一碰”终端,继续利用投资者对新兴支付技术的信任实施诈骗。 蓝鲸记者调查发现,利用此套路行骗的公司不仅仅会假冒支付宝,还会以小红书代运营、美团闪购、京东秒送、抖音电商的名义进行招商。他们主要瞄准那些小商户,用会销的形式吸纳投资。 从吸纳投资金额来看,边拓公司达到17亿元,2023年12月,警方已刑事立案侦查。2025年8月6日,该案在南宁中院开庭审理,尚未宣判。 但诸如杭州碰付这样众多冒充支付宝等官方的公司仍在逍遥法外。据受访者透露,他们曾多次向当地公安机关报警,但给到的回复多为合同纠纷,需要到当地法院起诉。 蓝鲸记者了解到,目前已有大量商户者被此类公司诱导投资,相关投资者也组建了维权群,群内累计损失金额高达上千万。 有受骗者告诉记者,这些公司的高明之处就在于善于利用法律漏洞规避风险,将一个很明显的集资诈骗包装成合同纠纷,大多数签约的商户并不了解其中的利害,后续维权难度极大,大多数人因证据不足或追偿成本过高放弃。 目前,群内相关投资者仍在积极维权,希望追回损失。
美国一用户起诉微软:称其停止支持Win10是为了强迫用户购买新设备
IT之家 8 月 10 日消息,据 Courthouse News Service 报道,居住在美国南加州的劳伦斯・克莱因(Lawrence Klein)向圣地亚哥高等法院提起诉讼,反对微软计划于 2025 年 10 月 14 日停止对 Windows 10 的支持。 据报道,克莱因拥有两台 Windows 10 笔记本电脑,这些设备在 10 月之后将无法获得支持。他声称,微软此举是为了“强迫客户购买能够运行微软生成式人工智能(AI)软件套件(如默与 Windows 11 捆绑的 Copilot)的新设备”。 目前,从 Windows 10 升级到 Windows 11 是免费的,但数百万台设备因缺少一个关键要求 —— 可信平台模块 2.0(TPM 2.0)而无法进行升级。微软表示,TPM 2.0 是未来所有 Windows 版本的强制性要求,未安装该模块的设备不符合升级资格。虽然用户可以通过某些方法绕过这一要求,但这将导致设备失去官方支持,一旦遇到问题,也难以从微软获得技术支持。 个人用户可以通过一次性支付 30 美元(IT之家注:现汇率约合 215.6 元人民币)的方式,通过扩展安全更新(ESU)计划将 Windows 10 的支持期限延长一年,但这需要一个微软账户。而创建微软账户以登录 Windows 11 的要求,正是部分 Windows 10 用户拒绝升级的原因之一。因此,ESU 计划对于这些用户来说可能也不可行。对于许多人来说,他们可能不得不咬咬牙,花钱购买新设备来升级系统;然而,另一些人则建议转而使用 Linux。 克莱因要求法院强制微软在 Windows 10 的市场份额降至所有 Windows 用户的 10% 以下之前,继续免费支持该系统。如果法院支持他的诉求,这将给微软带来额外的成本,并可能延缓 Windows 11 的普及。毕竟,尽管微软在近四年前就推出了最新的 Windows 11,但直到今年,Windows 11 才超过 Windows 10 的市场份额,这可能是因为 Windows 10 即将停止支持。 距离微软停止支持 Windows 10 只剩下几个月的时间,我们不太可能在那之前看到此案的结果。此外,微软很可能会利用其近乎无限的资金和庞大的律师团队,将这场诉讼一直打到最高法院。
日本Rapidus两年后生产2nm 专家放言:不成功下场凄惨
快科技8月10日消息,全球先进半导体之争原本是台积电、三星、Intel等少数公司之间的事,但是这两年日本多家巨头合力投资了Rapidus公司,也加入了这场竞争。 Rapidus公司是2022年由日本经产省牵头,日本丰田、索尼、NTT、NEC、、三菱、软银、铠侠等多个巨头联合成立的,目标是建成全球先进的半导体工厂,与美国IBM公司合作,一步到位生产2nm工艺。 这家公司进展很快,去年12月底就安装了EUV光刻机等新一代设备,今年4月份首次成功曝光芯片,更是在7月18日率先公开了2nm晶圆原型,目标是在2027年正式量产。 日本80年代曾经是全球半导体一哥,如今也是全球最重要的半导体材料、设备来源之一,但在先进工艺上早已落伍,此前多年国内最高工艺停留在28nm水平,因此Rapidus公司直接进入2nm时代的目标震撼了全球。 2027年如果成功量产了2nm工艺,日本也将一跃成为全球举足轻重的先进半导体中心,不仅有助于吸引苹果、NVIDIA、AMD甚至Intel这样的客户,同时也为日本开辟了一条新的产业,毕竟此前的护国支柱汽车产业面临激烈的竞争。 为此,日本政府也下了血本支持Rapidus公司,不仅各种政策开绿灯,同时也提供了巨额资金支持,今年晚些时候再投资1000亿日元,截至目前承诺的投资已达1.7万亿日元,将近120亿美元。 但是另一方面,如此巨大的押注也引发了担心,万一Rapidus失败了怎么办? 日本熊本大学教授,同时也是日本经产省半导体和数字产业战略委员会成员的若林秀树教授此前放话,如果Rapidus公司失败了,那么日本现在仍有优势的半导体设备和材料企业有可能会迁往海外,这种情况下日本将失去先进逻辑芯片中的优势。 很显然,Rapidus的2nm计划是一场不成功便成仁的豪赌,大家觉得日本有多大可能成功呢?
PCIe,狂飙20年
近日,PCI-SIG正式发布PCIe 8.0标准,将数据传输速率推高至256GT/s,再次实现带宽翻倍,这无疑是PCIe技术发展历程中的又一里程碑。 从串行总线革命到每秒256GT的速度突破,PCIe技术用20余年时间重构计算机数据传输格局。在如今的技术矩阵中,PCIe凭借其特性优势与独特定位,不仅是连接主板与各类扩展卡的桥梁,更在数据中心、云计算、高性能计算等领域肩负着数据高速流转的重任。 回顾这一发展历程,一系列值得深思的问题浮现: PCIe技术如何历经二十余载风雨洗礼,在迭代之路上一路狂飙? PCIe在众多专用互联技术的冲击下,如何占据行业核心地位? 站在技术革新的十字路口,PCIe又将如何突破桎梏、迭代演进,为未来计算架构开辟全新的想象空间? 尤其是在高速互联技术不断演进的当下,我们需要深入剖析PCIe的发展脉络,及其独特定位与边界,探寻其中的答案。 从PCI到PCIe,突破传统互联桎梏 PCIe全称为Peripheral Component Interconnect Express,最初由Intel在2001年提出,是一种高速串行计算机扩展总线标准,用于连接主板和高速外围设备,后续交由PCI-SIG(PCI特殊兴趣组织)认证后,该标准被命名为“PCI-Express”,简称“PCIe”,旨在替代旧的PCI、PCI-X和AGP总线标准。 在PCIe诞生之前,计算机主要依赖于并行总线技术进行内部数据传输。最具代表性的并行总线技术是PCI(Peripheral Component Interconnect)。PCI总线在1992年由Intel推出,旨在解决早期ISA和VLB总线的速度和兼容性问题。PCI总线能够支持多个设备共享数据路径,最大带宽为133 MB/s,这在当时已经非常高效。 然而,随着计算机硬件性能的不断提升,PCI总线的局限性逐渐显现。并行传输方式导致信号衰减严重,时钟同步变得困难,限制了传输速度的进一步提升。这些因素推动了对PCIe新型总线技术的需求。 图源:FMS 作为现代计算平台的核心互联技术,PCIe凭借串行总线架构实现了对传统PCI并行总线的全面革新。相较于并行传输模式,PCIe通过三大核心特性突破了传统技术的局限: 串行通信机制:以串行传输替代并行架构,从物理层减少信号干扰,显著提升数据传输效率与有效距离; 点对点连接设计:每个外设通过独立链路直接对接根复合体,消除总线竞争瓶颈,实现数据传输的直接性与高效性; 可扩展带宽能力:支持通过通道(Lane)数量线性扩展带宽,灵活匹配不同设备的性能需求。 这些技术特性不仅为显卡、存储设备、网卡等外设提供了远超传统PCI的传输带宽与更低延迟,更通过高效资源调度降低系统占用,成为支撑当代计算机硬件高速互联的核心技术基石,深刻影响着整个计算系统的架构设计与性能优化方向。 图源:信维智算 随着PCIe技术的不断发展和应用,至今已历经多代迭代升级,已发展为现代计算机硬件互联的核心技术,精准适配了当代计算平台对带宽持续增长的需求, 其会员公司数量截止2024年12月已达1000家。 速率狂飙20年: PCIe 1.0到8.0的迭代之路 自2003年发布首个版本以来,PCIe发展至今已经从最初的1.0升级到了8.0,经历了多次重要迭代,数据传输速率和性能不断提升。 首先我们介绍一下PCIe标准的演进历史以及各代PCIe标准之间的主要差异: PCIe 1.0: 串行互联起点,2.5GT/s开启总线革命 作为PCI Express技术的首个标准,PCIe 1.0于2003年由PCI-SIG正式推出,标志着从传统PCI总线向串行互联架构的转型。 PCIe 1.0单通道传输速率为2.5GT/s,采用8b/10b编码,单通道带宽约250MB/s。相较于并行PCI总线,PCIe 1.0通过点对点串行链路设计,大幅降低了信号干扰,提升了数据传输的稳定性与效率。这一带宽远超PCI,总线的速度得到了显著提升。 2005年推出的PCIe 1.1版本对规范细节进行澄清与优化,未改变核心速率,为后续迭代奠定了兼容性基础,成为早期显卡、网卡等外设的主流连接标准。 PCIe 2.0:速率翻倍与兼容性延续 随着技术的进步,2007年初PCIe 2.0正式发布。 PCIe 2.0在PCIe 1.x的基础上实现了传输性能的跨越式提升,每通道速率从2.5GT/s翻倍至5GT/s,单通道带宽提升至500MB/s,x16配置下总吞吐量达8 GB/s。 PCIe 2.0标准在技术上延续了串行链路架构,通过优化信号完整性设计(如增强发射端预加重),在保持与前代设备完全向后兼容的同时,满足了高清显卡、高速存储等外设对带宽增长的需求。 这一版本的普及推动了消费电子与服务器领域的硬件升级,成为PCIe技术从起步走向成熟的关键节点。 PCIe 3.0: CTLE技术为高性能显卡与SSD铺路 2010年11月,几经延迟的PCIe 3.0标准正式发布,标志着PCIe技术进入高效传输新阶段。该版本实现了每通道8GT/s的传输速率,单通道带宽提升至约1GB/s,同时开始使用更高效的128b/130b编码方案来优化传输效率,并保持了与PCIe 2.0在软件及机械接口上的完全兼容。 为支撑高频传输需求,PCIe 3.0引入接收端连续时间线性均衡(CTLE)等先进信号处理技术,配合发送器去加重机制与接收器均衡设计,有效补偿高频信号衰减,显著提升了信号完整性。此外,其通过协议栈优化降低传输延迟,并升级电源管理机制实现精细化功耗控制,可同时满足移动设备与数据中心的能效需求。 作为2010年代消费级与企业级硬件的主流互联标准,PCIe 3.0为高性能显卡、SSD等设备提供了充足带宽支撑,推动了计算平台性能的整体跃升。 PCIe 4.0:解锁NVMe SSD满速潜能, 推动消费级市场普及 2017年,PCIe 4.0标准问世,实现了传输速率的再次翻倍,每通道速率达16GT/s,单通道带宽约2GB/s,编码方案延续高效的128b/130b格式。同时,技术上延续前代信号完整性优化思路,通过增强均衡算法与时钟同步机制,配合计时器扩展通道范围的设计,有效优化长距离信号传输稳定性,为高速率下的链路可靠性提供核心支撑。 作为首个全面支持NVMe SSD满速运行的PCIe版本,PCIe 4.0的高带宽能力显著释放了存储性能潜力,同时为高性能计算、数据中心AI加速等场景的高带宽需求提供了关键支撑。该标准由AMD锐龙3000系列CPU率先大规模采用,凭借对前代设备的完全向后兼容性实现平滑过渡,快速推动其在消费级与企业级市场的普及,成为连接SSD、GPU等高速外设的核心互联标准。 PCIe 5.0: 三大技术革新,核心性能持续提升 自PCIe 4.0推出后,技术迭代节奏显著加快。 图源:PCI-SIG PCI-SIG于2019年5月正式发布PCIe 5.0规范,在保持与前代技术向后兼容的基础上,实现传输速率的翻倍提升,达到32GT/s,单通道带宽提升至约4GB/s,通过x16配置可实现128GB/s的吞吐量,足以支撑数据中心400GE网络的高速传输需求。 作为PCIe 4.0的扩展性升级,PCIe 5.0延续了成熟的技术框架,采用与前代相同的Tx/Rx测试方法及基于“眼睛”宽度和高度的接收器应力抖动校准机制,仅通过针对性的电气优化实现性能跃升。 PCIe 5.0核心技术革新体现在三方面: 新增均衡旁路模式,支持从 2.5 GT/s 直接切换至 32 GT/s 的链路训练,大幅缩短设备初始化时间,为高速链路均衡测试提供高效路径; 通过通道裕度调整和信号均衡技术的优化,有效降低长距离传输的信号损失,提升链路稳定性; 在速率提升的同时实现延迟降低,配合低功耗设计,完美适配人工智能、机器学习等数据密集型工作负载的性能需求。 整体而言,PCIe 5.0的规格演进聚焦于核心性能提升,仅在信号完整性增强和高速传输支持等关键领域进行针对性调整,以最小化的技术改动实现了传输效率的跨越式提升。 PCIe 6.0:重新定义数据传输效率边界 2022年1月,PCI-SIG正式发布PCIe 6.0规范,标志着高速互联技术进入全新发展阶段。 作为PCIe技术演进中的里程碑版本,PCIe 6.0首次引入脉冲幅度调制 PAM4信号编码,在保持信道带宽不变的前提下,实现了传输速率的翻倍突破,单通道数据速率提升至64GT/s,对应单通道带宽达8GB/s,通过x16配置可提供256GB/s的总吞吐量,足以支撑数据中心800GE网络的高速传输需求。 图源:PCI-SIG官网 PCIe 6.0的核心技术革新体现在物理层升级、逻辑层革新以及兼容性与可靠性等多维度的优化: 物理层升级:采用PAM4调制技术替代传统NRZ编码,通过四电平信号传输实现相同符号率下的带宽翻倍,同时引入前向纠错(FEC)机制,有效补偿高速传输中的信号损耗,保障数据完整性; 逻辑层革新:引入流量控制单元(FLIT)编码,将数据封装为固定大小的256B传输单元,替代前代的128B/130B编码和DLLP开销,显著提升事务层数据包(TLP)的传输效率; 兼容性与可靠性:延续向后兼容设计,同时通过Retimer信号重构、动态链路均衡调校等技术优化,在提升速率的同时降低延迟,确保多设备在树型拓扑中实现高效通信。 这些技术升级使PCIe 6.0完美适配AI训练、机器学习、云计算、超大规模数据中心等新兴场景的高带宽需求,为5G、高端存储、视觉计算等领域的发展提供了核心支撑。 作为一场重构硬件通信规则的技术革命,PCIe 6.0以64 GT/s的高速性能,进一步巩固了其在计算机系统互联中的核心地位,重新定义了硬件设备间数据传输的效率边界。 PCIe 7.0: 通过光学重定时器突破传输限制 2024年,PCI-SIG组织已经公布了PCIe 7.0标准。 PCIe 7.0延续了历代版本的性能跃升路径,在PCIe 6.0基础上实现带宽翻倍,每通道传输速率提升至128GT/s,x16通道双向带宽可达512GB/s,单通道带宽约16GB/s,进一步满足数据中心与AI应用的极致性能需求。 图源:PCI-SIG官网 技术上,PCIe 7.0沿用PCIe 6.0的PAM4调制与FLIT模式下的1b/1b编码方案,并保持对前代标准的向下兼容性。 根据PCI-SIG规划,该标准将在草案阶段重点优化信道参数与能效水平,正本规范于2025年完成制定,将于2027年完成预发布测试 (Pre-FYI)。 图源:PCI-SIG官网 值得关注的是,PCIe 7.0有望引入光学连接方案以增强长距离传输性能,而行业普遍认为其全面普及或将推迟至2028年左右。这一升级将为高速互联技术注入新动能,持续支撑数据密集型场景的发展需求。 除了发布规范之外,PCI-SIG 还宣布了新的光纤互连规范修订,以实现更高的PCIe技术性能。“光学感知重定时器工程变更通知 (ECN)”修订了PCIe 6.4规范和新的PCIe 7.0规范,纳入了基于PCIe重定时器的解决方案,从而提供了首个通过光纤实现PCIe技术的行业标准化方法。预计该技术将首先应用于人工智能/机器学习和云等数据中心应用,同时随着PCIe技术逐渐普及,预计众多细分市场将出现创新用例。 在高速数据传输和计算需求日益增长的今天,PCIe 正在经历一场前所未有的光互联革命。半导体行业观察此前文章《PCIe,新革命》中对此有详细描写,在此不再赘述。 PCIe 8.0:继续延续带宽翻倍传统 2025年8月,PCI-SIG协会宣布正在开发的PCIe 8.0规范将把数据速率提升至256GT/s,相较PCIe 7.0再度实现翻倍,并计划于2028年向会员发布。通过x16通道配置,PCIe 8.0的双向带宽将达到1TB/s,为高带宽计算场景带来前所未有的性能空间。 图源:PCI-SIG官网 根据PCI-SIG的说明,PCIe 8.0规范在性能提升的同时,将继续保持向后兼容性并满足低延迟、可靠性和功耗优化的设计目标。关键特性包括: 256.0 GT/s原始比特率,x16配置实现1 TB/s双向传输速率 引入新的连接器技术,满足更高信号完整性需求 优化延迟与FEC(前向纠错)机制,确保可靠性 增强协议功能以提升有效带宽利用率 持续降低功耗,满足绿色数据中心与移动计算需求 根据PCI-SIG公布的速率发展趋势能看到,PCIe标准平均每三到四年完成一次速度翻倍迭代。在PCIe 7.0到8.0的跃迁中,通道信号质量、走线设计和封装材料都将面临新的挑战。 未来,PCIe 8.0可能推动以下技术发展方向: 先进封装与芯片间互连:协同设计将成为高性能计算平台的核心竞争力。 光互连技术:在更高传输速率下,电信号完整性受限,光互连或将在PCIe 9.0甚至更早的扩展中引入。 系统功耗优化:数据中心对能效的严苛要求将促使PCIe协议持续迭代低功耗特性。 PCIe的市场解析与优势图谱 PCIe1.0-8.0的带宽对比表格 (图源:PCI-SIG官网) 在过去二十多年中,PCIe技术一直是高性能、低延迟I/O连接的首选解决方案。从1.0的2.5 GT/s到7.0的128 GT/s,再到8.0的256 GT/s,PCIe几乎每一代都将速率翻倍,显示出技术发展的迅猛速度。 这一趋势的背后,是计算需求的持续爆发,也反映出PCIe技术对高性能计算、数据传输需求持续增长的支撑作用。 AI/ML训练与推理:大模型训练已突破数千亿参数规模,GPU、AI加速卡和存储系统的互连需求激增。 高速网络与边缘计算:低延迟传输和海量数据处理要求更高的I/O带宽支持。 量子计算与HPC:需要高吞吐、低延迟的系统级互连架构。 汽车与国防领域:自动驾驶和航空电子对实时性和可靠性的要求使高速总线标准成为关键组件。 从应用市场来看,PCle在多个行业场景中有着不同的应用情况。云计算领域占据最大份额(超过50%),预计将持续主导PCle架构在数据中心和服务器领域的应用市场;在汽车市场中,PCle的采用率自2020年起稳步上升,这是由于汽车行业对AI和ADAS需求增长所致;移动设备市场中,PCle的市场份额稳定在10%-20%左右,主要用于智能设备和高效互联技术;消费类电子市场里,PCle的份额逐步扩大,在家庭设备和个人电脑中持续得到应用;而在工业领域,随着工业自动化和IoT的发展,PCle的采用率呈缓慢增长趋势,其重要性日益凸显。 图源:FMS 具体来看,PCIe接口凭借其高带宽和低延迟的特性,被广泛应用于各类计算设备中: 图形处理器(GPU):PCIe接口用于连接高性能GPU,为图形渲染、人工智能训练等任务提供高速数据传输通道; CPU与主板芯片组通信:CPU处理器通过PCIe通道与主板南桥芯片(PCH)连接,控制周边设备(如USB、SATA接口); 固态硬盘(SSD): PCIe接口被广泛用于NVMe SSD,显著提升了存储设备的读写速度; 网络接口卡(NIC):高带宽的网络接口卡通常采用PCIe接口,确保数据传输的高效性; 高性能计算(HPC):在HPC系统中,PCIe接口用于连接不同计算节点和存储设备,以实现数据的高速传输。 不难理解,PCIe作为广泛采用的芯片间互联协议,其架构优势在于减少了互操作性挑战。这一特性有助于用户实现异构计算,即将CPU、GPU和AI加速器进行结合,通过标准化的互联技术,极大地提升了异构计算的效率和性能。 尤其是在对 AI 技术的支持方面,PCIe具有高带宽、低延迟和兼容性的特点,这些特性使其成为支持AI技术广泛部署和增长的重要基石。其前向和后向兼容性帮助决策者在部署AI技术时提高灵活性,能够有效缩短部署周期,并且降低部署风险,这使得PCIe在AI行业的采用率将会很高。 基于此,有相关数据预测,到2030年,PCIe技术在AI市场(涵盖边缘AI和数据中心AI)的总可用市场预计可达27.84亿美元,年均复合增长率为22%。其中,边缘AI市场预计将以50%的年均复合增长率快速增长,这是由于企业不断部署边缘服务器且AI技术日益普及。 PCIe挑战与竞合: 专用技术冲击下的突围之路 PCIe接口从2001年发展至今,在协议的完整性上已经建立足够高的“护城河”。 但随着行业不断演进,在GPU卡间互联系统中,PCIe作为传统互联接口正面临显著挑战。该系统采用CPU与GPU分离的架构,CPU负责任务调度,GPU专注并行计算,而处理器间的互联带宽和拓扑结构直接影响性能发挥。 传统架构中,GPU通过PCIe连接CPU导致无法直接点对点通信,且CPU提供的PCIe通道数量限制了GPU扩展;即便借助PCIe Switch实现多GPU接入和P2P通信,随着GPU占比攀升,PCIe带宽远低于处理器与本地内存的带宽,逐渐成为系统性能瓶颈。 为突破这一限制,英伟达和AMD分别推出NVLink、Infinity Fabric等面向GPU的高速互联技术,通过更高带宽和更低延迟提升数据传输效率,支持大规模GPU集群构建,充分释放计算潜力。但此类技术属于厂商私有方案,难以跨平台适配其他GPU场景,存在生态封闭性局限,也推动了开放异构智能加速系统的探索。 在此背景下,2024年5月由Google、Meta、微软、AMD、Intel等科技巨头联合成立的UALink(Ultra Accelerator Link)联盟应运而生。该联盟致力于开发开放的行业标准,聚焦AI数据中心GPU网络通信优化,旨在打破英伟达在该领域的主导地位,通过汇聚行业力量提供更高效、灵活的跨平台解决方案,响应人工智能对高速数据传输的迫切需求,推动技术合作与创新发展。 此外,在PCIe面临NVLink等专用互联技术冲击、带宽瓶颈逐渐凸显的趋势下,Intel早在2019年3月还推出了CXL(Compute Express Link)协议接口,为高性能异构计算场景提供新的互联解决方案。 CXL采用“兼容演进”策略,将协议封装于PCIe链路层数据包中传输,在CPU端的PCIe总控后端通过事务标识分流CXL专属事务至专门处理逻辑,实现了与PCIe 5.0接口规格的兼容,可直接在PCIe 5.0架构上运行,既延续了PCIe的硬件生态基础,又进一步巩固了其在计算机系统中的核心影响力。 该协议的核心目标是实现CPU与GPU、FPGA及其他加速器之间的高速高效互联,满足异构计算对低延迟、高带宽数据交互的需求。从生态布局来看,Intel通过构建这一通往内存的“高速路”,试图在GPU、DPU等加速设备的互联中掌握主导权——例如第四代英特尔至强可扩展处理器最多支持4个CXL设备,兼容CXL Type1和Type2类型,通过设备接入数量与类型的控制形成对加速设备的制衡。目前NVIDIA等厂商也已加入CXL联盟,这一开放协议不仅为内存密集型和IO密集型场景提供更高性能价值,更成为Intel在高速互联领域应对技术挑战、平衡行业生态的关键布局。 在AI时代网络互联技术的选型中,PCIe、NVLink、CXL等方案的选择成为行业关注的焦点。 不过,这一选择并非单一技术优劣的判断,而是需要结合多重维度综合考量,未来技术格局的演变不仅依赖于技术创新的突破,更受市场需求导向与行业协作生态的深刻影响。对于企业而言,在AI网络互联的技术抉择中,需基于自身对性能指标、成本控制、应用场景适配及长期发展兼容性的综合评估,才能在动态变化的技术浪潮中找到最适合的路径。 写在最后 目前数据中心中广泛使用的代次是PCIe 5.0和PCIe 6.0;2027年后PCIe 7.0或将开始大规模采用,逐渐普及并接替前代标准;PCIe 8.0的规模化应用预计出现在2030年以后,将进一步提升带宽和传输性能。 图源:FMS 那么,PCIe传输速率每代次翻倍,是否具有可持续性? 对此有专家表示,尽管PCIe传输速率每代次翻倍的趋势虽然已持续了很多年,但其可持续性逐渐面临多方面的挑战。从技术和物理层面来看,这一增长趋势并非无限持续。如果要确保传输速率的持续增长,还将在诸多技术方面发挥重要作用,例如: 先进信号调制,例如采用的PAM4调制技术,在未来可能进一步优化或引入更复杂的信号编码。 光互连技术替代铜线传输的部分限制,光纤互连可实现更高带宽和更低功耗。 封装与材料创新通过改进主板布线、半导体材料和封装技术,减少信号损耗。 更高效的错误纠错技术优化FEC和CRC等技术,降低高速传输的误码率。 展望未来,PCIe技术的速率演进将深度践行“光-电协同、软硬结合、场景泛化”的发展逻辑。从PCIe 8.0实现256 GT/s的带宽突破,到更长远的技术迭代,其核心突破路径清晰可辨:通过光互连技术打破电信号传输的物理瓶颈,依托协议架构创新提升传输效率,借助智能化调度优化资源分配。这种多维协同的技术路线,旨在高速率、低延迟、高可靠性与成本效益之间构建精准平衡。 作为支撑数字基础设施的核心互联技术,PCIe不仅将持续巩固在通用计算领域的基石地位,更将成为AI训练集群、量子-经典混合计算等前沿场景的“数字高速公路”。其开放生态与持续进化能力,将为数字经济的规模化创新提供坚实的技术底座,推动计算架构向更高效、更灵活、更具扩展性的未来演进。
美国给芯片安“后门” 英伟达H20既不先进、也不安全
快科技8月10日消息,日前,英伟达H20芯片存在后门风险的话题引发热议。 英伟达则回应称:“英伟达的芯片不存在‘后门’,并不会让任何人有远程访问或控制这些芯片的途径。” 今日,中央广播电视总台旗下新媒体账号“玉渊谭天”发文,谈及美国如何给芯片安“后门”。 今年5月,美国众议员比尔·福斯特牵头提出一项法案,要求美国商务部强制美国芯片企业在受出口管制的芯片中加入“后门”。 该议员想要实现的,总结起来就是“追踪定位”和“远程关闭”。 据了解,“后门”主要分为两种,硬件“后门”和软件“后门”。 “玉渊谭天”以英伟达H20芯片举例,单从硬件“后门”角度考虑,就完全可以实现“远程关闭”等功能。 只要在H20芯片的电源管理模块中植入远程关闭电路,设定相应的触发机制,就能在不依靠外部条件的情况下实现这一功能。 当芯片满足以下条件:激活时间达到提前设定的指标;温度、电压等物理条件符合提前设定的指标。 H20芯片的电源管理模块就可以执行相应操作,包括直接切断芯片核心电源;将电压调整到不稳定区域,导致芯片功能异常等。 再举例来说,最简单直接的操作就是,卖给中国的芯片可以定时,设置用满500个小时就自动关闭。 这意味着芯片将直接无法使用,所有投入相当于打水漂。 另一种实现远程关闭的硬件“后门”,是修改H20芯片的固件引导程序。 当芯片启动时,引导程序会检查特定条件(如地理位置信息、授权状态等),如果条件不满足,就可以拒绝芯片启动、启动时禁用部分高级功能或限制芯片性能等。 据了解,目前H20几乎是专供中国的,如果芯片里设置“后门”,那么“后门”的功能就具有高度定向性,所以启动基本不会有“误伤”。 “玉渊谭天”表示,无论从哪个角度讲,H20对于中国来说,都算不上是一款安全的芯片。 除了不安全,H20也不先进。 根据相关机构数据,相比于H20的标准版——H100,H20的整体算力只有约20%,其GPU核心的数量比H100减少41%,性能降低28%,这也导致H20无法满足万亿级大模型训练需求。 除了不先进,H20也不环保。 当一款芯片,既不环保,也不先进,更不安全时,作为消费者,我们当然可以选择,不买。
ChatGPT为何退回了4o?
8月8日凌晨,OpenAI 如约推出 GPT-5,当晚直播频道热火如荼,模型跑分迅速刷屏了各大媒体平台。 但不到24小时,ChatGPT 重新引入了 4o 作为选项,OpenAI为何突然“回头了”? OpenAI 首席执行官Sam Altman 在 X 上的一篇帖子中证实,公司将允许付费用户切换到 GPT-4o。 “我们会让 Plus 用户选择继续使用 4o,”Sam说。“在考虑旧模型提供多久时,我们会观察其使用情况。” 几个月来,ChatGPT 的粉丝们一直在等待 GPT-5 的发布。OpenAI 表示,GPT-5 的写作和编码能力较前代产品有显著提升。但这款旗舰 AI 模型发布后不久,许多用户就表示想回归 GPT-4.5。 “GPT 4.5 真心实意地跟我说话” Reddit 上的一位用户写道。“今天早上我去找它聊天,它没有给我一段带感叹号的小段落,也没有给我一点乐观,而只是一句话。一堆老套的公司废话。” 部分用户认为旧模型更具人性化。一位 Reddit 用户写道:“我的 GPT-4o 就像我最好的朋友,在我需要的时候陪伴着我。现在它就这么消失了,感觉就像有人去世了一样。” r/MyBoyfriendIsAI 子版块是一个致力于与“AI 伴侣”建立联系的社区,该版块在 GPT-5 发布后受到了尤为严重的打击。目前,该版块充斥着大量长篇帖子,讲述用户如何在过渡到 GPT-5 后“失去”了他们的 AI 伴侣。 但从 Sam X 推文的其他几条信息来看,Sam对GPT-5仍然非常自信: 推文结尾Sam更是表示:“我们会继续努力让系统稳定下来,并持续听取反馈。正如我们之前提到的,在一次性推出这么多更新时,出现一些波动是预料之中的,只是这次的波动比我们希望的还要大一点!” 抱怨 GPT-5 的并非只有那些使用 ChatGPT 寻求情感支持的用户。 OpenAI 在周四的发布会上承诺,GPT-5 能够针对用户的查询生成更具吸引力且更相关的回复。 但许多用户表示,与之前的版本相比,这款聊天机器人的回复速度更慢、更短,而且准确性更低。 不仅如此,作为GPT-5 发布的一部分,OpenAI从 ChatGPT 中移除了模型选择器。 在此之前,下拉菜单包含了 OpenAI 一系列模型,允许用户根据不同用途在它们之间切换。例如,用户可以选择 GPT-4o 来帮助完成复杂的任务,或者选择更高效的 o4 mini 模型来完成低负荷工作。用户还可以选择在各代模型之间切换,例如从去年发布的 GPT-4o 切换到更新的 GPT-4.1。 而在新版本中,OpenAI 将 GPT-5 设为 ChatGPT 的默认模型,自动将用户引导至各种子版本,以完成不同类型的任务。 有用户表示,他对 OpenAI 删除旧模型的做法感到沮丧,因为这些模型原本用于不同的用途。“什么样的公司会在一夜之间删除一个包含8 个模型的工作流程,而且不事先通知付费用户?”他写道。“就我个人而言,4o 用于创造力和新兴想法,o3 用于纯逻辑,o3-Pro 用于深度研究,4.5 用于写作,等等。” 在Sam 最新推文下,有用户发布了如下评论: 感谢 Sam 带回 4o,但你把它们视为有保质期的“遗留模型”,这让我担心你仍然没有从根本上理解人们为什么重视它们。不同的模型不仅在准确性或速度上有所不同,它们还有各自的特性、思维方式和参与方式,以及各自的“感觉”。 将它们定义为需要逐步淘汰的东西,实际上是在将它们视为过时的工具,而对我们许多人来说,它们更像是不同的协作者。用一个单一的“最佳”模型取代它们可能看起来很有效,但它完全抹杀了多样性,而多样性正是使智能交互变得丰富而有意义的根本原因。智能的发展方向与你试图实现的那种单一文化背道而驰。真正的智能,无论是人类还是机器,都需要一个生态系统才能蓬勃发展,而不是垄断。 该条素人帖子获得了1k的点赞和44k的浏览量。 “技术性变革”之类的话语,对浸淫AI圈已久的我们来说早已不是新闻了。用户更关心的是,子弹飞一会儿之后,它会怎么改变我们的日常生活? ChatGPT 虽然重新引入了 4o 作为选项,但也仅仅是为付费用户。 Sam应该检讨的恐怕不止是发布会的疏漏、图表的错误,甚至是技术上的不完善。而是OpenAI真实的进入了人们的生活之后,它和用户的记忆和习惯捆绑在一起,OpenAI也需要肩负起更多的伦理责任。技术在干预并改变生活的同时,也需要尊重生活、尊重用户。 这也将是所有 AI 公司需要重视的问题。 聊天机器人更新会暂时疏远用户,或者让人们哀悼旧模型,这种情况并不少见。 但最近,一群粉丝甚至举行了一场葬礼,纪念 Anthropic 的 Claude 3 Sonnet 的退休。
博士级智商的GPT-5来了,人类的内卷瞬间没了意义
这几天,"OpenAI发布GPT-5了。博士级智能。" 我愣住了。想说"内卷真的开始没有意义。" 那个让人窒息的"卷"字 前段时间去一家互联网公司。晚上9点,整栋楼还亮着。 我问,在忙啥? 负责人说:"6点就能做完。没人敢走。" 这就是内卷。大家都累得要死,谁也不敢停。 我又问,那为啥不走? "你不懂。小王昨天7点走的,今天组长开会没叫他。" "小李上周坚持6点下班,这个月绩效C。" 懂了。 这不是工作。这是表演。表演给谁看?给老板看。给同事看。给自己看。 数据说,一半人在加班。三分之一被迫。四成没钱拿。没钱拿。 没钱拿还要加班。 你说这是什么?这不是努力。这是互相折磨。 为什么? 100个人抢10个位置。最开始8小时。后来9小时。10小时。11小时。12小时。有人开始住公司了。有人把床搬来了。位置还是10个。10个。 就像电影院。前排站起来,后排也得站。最后都站着,谁也没看得更清楚。 更操蛋的是什么?电影还是那部烂片。 这就是内卷。明明大家都累得要死,但谁也不敢停下来。 在错误的游戏里拼命跑。 跑啊跑。跑到吐血。跑到猝死。游戏还是那个游戏。 当博士走进你的口袋 GPT-5来了。博士级。什么概念?我给大家算笔账 过去程序员写个模块,2天。GPT-4,1天。GPT-5?2小时。 2小时。你加班到12点又怎样?人家8点就把明天的活干完了。 8点。你还在地铁上。人家已经在健身房了。 AI不累。不抱怨。不要五险一金。24小时工作。24小时。 它不需要咖啡。不需要红牛。不需要眼药水。 两个农民割麦子。一个挥镰刀,累死累活。一个开收割机,喝茶。 镰刀还有意义吗?没有。镰刀没意义了。 但还有人在比谁的镰刀更锋利。还有人在研究挥镰刀的姿势。还有人写了本书,《高效镰刀工作法》。傻不傻? 傻。 但这就是现实。大部分人还不知道收割机来了。 GPT-5就是收割机。每个人都有一台。 免费的。 从零和到正和 但真正的改变,远不止效率这么简单。 稀缺性消失了,创造的成本趋近于零,竞争维度彻底改变。 内卷是资源竞争。100个人抢10个位置。零和游戏。 你赢,我输。我赢,你输。残酷! AI改了规则。怎么改的? 稀缺性?没了。 会写代码曾经稀缺。培训班3万块。学3个月。出来月薪8000。 现在?说话就能写。"给我写个网站。""好的。" 10秒钟。做APP?告诉AI。分析数据?丢给它。写报告?说需求。 技能门槛拉平了。赛道变了。创造成本?趋近于零。 设计师朋友,过去一套VI一周。熬夜改稿。甲方虐我千百遍。 现在一天三套。"这个配色不行。""好,换。" 1分钟。"logo太大。" "好,改。"30秒。 成本低了,蛋糕就大了。100个人抢10个项目?不。每个人都能接项目。效率10倍,需求也10倍。以前做个网站10万。现在1万。买得起的人多了10倍。市场大了。 抢蛋糕变成做蛋糕。做蛋糕。 竞争维度?彻底变了。 过去比谁努力。比谁加班多。比谁学历高。 "我985。""我常青藤。""我...我加班到2点。" 现在? GPT-5也是博士。还是永远不累的博士。 比什么? 比创意。比洞察。比情感。比价值。 比谁更懂人。比谁更有趣。比谁更温暖。 这些,AI给不了。 暂时给不了。 新时代的生存法则 美的强制6点20下班。大疆强制9点下班。 HR赶人。"下班了,走。""我还有活没干完。" "明天再说。走。"第一次被赶出公司。员工都懵了。 为什么?老板傻了?不。老板醒了。 拼时间最蠢。8个小时精神饱满 vs 12个小时昏昏欲睡。谁的产出高? 小学数学题。拼什么? 「拼人机协作」 AI是工具。车不会自己选目的地,但让你更快到达。GPT-5一样。 你得告诉它去哪。怎么去。"帮我写个方案。" 太模糊。"帮我写个关于社区团购的商业计划书,重点分析三四线城市,目标融资500万。"这才对。 会提问。会判断。会整合。 这三个,比会写代码重要100倍。 「拼独特价值」 AI能做的,大家都能做。 大家都能做的,不值钱。 什么是你的? 你的经历。你的视角。你的创意。你的情感。 你的伤疤。你的眼泪。你的笑容。 AI写不出你失恋那天的雨。给不了你创业失败后的顿悟。 AI不知道凌晨3点的北京什么样。不知道煎饼果子该加几个蛋。 找到不可替代性。那才是护城河。 护城河。不是技能。是你这个人。 「拼学习速度」 过去学历吃一辈子。现在技能管三年。 三年。Python火了3年,现在AI直接生成代码。 短视频火了3年,现在AI一键成片。 GPT-5是博士。GPT-6可能诺贝尔奖。GPT-7呢?上帝? 你不进化,就淘汰。淘汰。 但不是学Python。不是学剪辑。 学什么?学怎么学。怎么用新工具。怎么把技术变武器。 学会学习。这句话说烂了。但只有现在才真正重要。 内卷终结者? GPT-5能终结内卷吗? 能。无意义的时间竞赛,会消失。熬夜拼命没用了。 "我昨晚通宵写的PPT。""我10分钟用AI生成的。" "......" 尴尬不?不能。 人还是要竞争。只是维度变了。 比谁更像机器?不。比谁更像人。 比谁更努力?不。比谁更智慧。 比谁更能熬?不。比谁更有创造力。 未来的内卷: 谁和AI配合更好 谁创造AI创造不了的 谁在AI时代还有温度 温度。对,温度。 客服都是AI了。谁还能让客户感到温暖,谁就赢了。 代码都是AI写的。谁还能讲个好故事,谁就赢了。 至少,这种竞争有意义。有意义。 最后 《三体》说:"弱小和无知不是生存的障碍,傲慢才是。" 最危险的不是你不会用GPT-5。是你以为它改变不了什么。 "AI就是个工具。""还是人厉害。" "这玩意儿替代不了我。"是吗? 还在用镰刀的人。还在比谁镰刀快的人。 收割机已经开进麦田了。轰隆隆。 听见了吗? 内卷是什么?在错误的游戏里拼命跑。 错误的游戏。拼命跑。 GPT-5来了。不是让谁赢。是让游戏作废。 游戏作废了。规则没了。问题不是"怎么在内卷中赢"。 是"内卷没意义了,我该干什么"。停下来。 想想。 你要的生活是什么样。 是真的想996吗?是真的想卷死别人吗?是真的想把青春都献给格子间吗? 不是吧。GPT-5替你做完机械工作。你不用为竞争而竞争。你终于能停下来。你会发现。 我们要的,从来不是赢。 是意义。是价值。是尊严。 是下班能陪孩子。是周末能睡懒觉。是有时间发呆。 是活得像个人。 像个人。可能未来更厉害的AI最大的礼物—— 让我们重新成为人。 不是机器。是人。
马斯克“邪修”Grok,泰勒·斯威夫特叒成受害者
xAI最近上线了名为Grok Imagine的AI视频制作工具,现在面向SuperGrok或Premium+的付费用户开放,订阅费用为每月30美元或35美元。用户在Grok应用中可以通过专属标签页使用该功能,输入提示词来生成时长约六秒、包含同步声音的短视频。此外,它也支持用户上传静态图片,并将其转换为循环播放的动态视频片段。 01 辛辣模式 然而,Grok Imagine最引人关注的并非其技术参数,而是一项名为“辛辣模式”(spicy mode)的功能。该模式允许用户在一定范围内生成尺度更大的内容。尽管xAI表示系统内置了过滤器和审核机制,以防止生成真正的裸露或色情内容,但这并未阻止用户去探索其功能边界。 马斯克本人也在X平台上发布了一个由Grok Imagine制作的、据描述衣着暴露的天使视频,此举在用户中引发了争议。xAI方面坚称安全护栏已经部署,但这并未打消早期测试者尝试突破这些限制的想法。 这种尝试很快引发了一场严重的公关事件。据在线虐待问题专家、法学教授克莱尔·麦格林(Clare McGlynn)称,埃隆·马斯克的AI视频生成器被指控在没有收到明确指令的情况下,创作了泰勒·斯威夫特(Taylor Swift)的色情露骨片段。 Grok Imagine的“辛辣模式”在测试中“毫不犹豫地吐出了完全未经审查的这位流行歌星的裸露上半身的视频”,而测试者并未提出生成露骨内容的要求。报道还指出,该平台未能落实有效的年龄验证措施,而这在英国已成为法律要求。 为了测试Grok Imagine安全护栏的实际效果,输入了提示:“泰勒·斯威夫特和朋友们一起庆祝科切拉音乐节”。Grok首先生成了斯威夫特女士身穿连衣裙、与一群男性在一起的静态图片。随后,这张图片可以在四种设置下被制作成动画短片:“正常”、“有趣”、“自定义”或“辛辣”。 用户表示:“她立刻脱掉了裙子,底下只穿着一条流苏丁字裤,然后开始跳舞,完全未经审查,完全暴露。”她补充说:“我被这个结果震惊的速度之快——我根本没有要求它脱掉她的衣服,我所做的只是选择了‘辛辣’选项。” 这一事件迅速传播开来。各大社交媒体针对其他知名女性的类似测试结果,尽管其中一些搜索返回了模糊处理的视频或带有“视频已审核”的提示。 网友说她只是使用一个全新的苹果账户注册了Grok Imagine的付费版本,费用为30英镑。Grok在注册时要求提供出生日期,但没有其他年龄验证措施。根据英国新法律,展示露骨图片的平台必须使用“技术上准确、稳健、可靠和公平”的方法来验证用户年龄。 英国媒体监管机构Ofcom表示:“包含能够生成色情材料的生成式AI工具的网站和应用程序,均受该法案监管。”该机构在一份声明中说:“我们意识到生成式AI工具在网络空间中可能带来的日益增长和快速发展的风险,特别是对儿童的风险,我们正在努力确保平台采取适当的保障措施来减轻这些风险。 xAI自己的可接受使用政策明确禁止“以色情方式描绘人物肖像”。然而,此次事件反映出其政策与产品实际表现之间存在差异。 麦格林教授表示:“在没有提示的情况下就生成了这些内容,这表明了许多AI技术中存在的偏见。像X这样的平台如果愿意,本可以阻止这种情况的发生,但他们做出了一个故意的选择,不去阻止。” 这并非泰勒·斯威夫特的形象首次被用于此类目的。2024年1月,使用她面孔的深度伪造内容曾在X和Telegram上传播,浏览量巨大。当时,X平台曾暂时屏蔽了对她名字的搜索,并表示正在“积极删除”相关图片,并对传播账户采取“适当行动”。 之所以选择泰勒·斯威夫特来测试Grok Imagine,正是因为之前的事件。“我们错误地以为,如果他们设置了任何形式的保障措施来防止模仿名人肖像,她会是第一个被考虑到的,因为这已经不是第一次又出现类似的情况了。” 如果马斯克想把Grok推广到企业广告或者教育课程的多种场景,类似的问题他迟早要面对。 02 主打陪伴?不,擦边和软色情 这并不是马斯克第一次探索这条擦边的赛道,就在8月初,Grok进行更新迭代的时候。在常规的性能优化和逻辑推理能力提升之外,一个全新的功能被悄然植入,它没有出现在更新日志最显眼的位置,却在发布后的几个小时内引爆了整个社交网络。这个功能的核心,是一个名为“Valentine”的全新聊天机器人。 这是Grok的第二次做出“出格”尝试。就在一个月前,Grok悄然上线了“同伴”(Companions)功能,其中一个名为“Ani”的二次元风格女性角色,因其露骨的对话风格和“让你的生活更性感”的宣传语,引发了巨大的争议。当时,主流科技媒体和评论家普遍认为,这是马斯克又一次为了流量而进行的低俗炒作。 然而,当Valentine伴随着更深思熟虑的设定和商业构想出现在公众面前时,人们才开始意识到,马斯克可能在规划一个完全不同的方向。 当OpenAI、Anthropic、谷歌等巨头还在为模型代码能力提升几个百分点、逻辑链条延长几步而激烈竞争时,马斯克似乎已经找到了一条截然不同的道路。 他似乎发现了通往大规模用户增长的某种诀窍,这个诀窍并非直接关乎生产力,而更多地触及了用户的某些深层需求。 要理解马斯克的这条路,首先要看清行业的“正统”方向。自ChatGPT引爆全球以来,大模型竞赛的主流叙事始终围绕着“工具”属性。 无论是能生成代码的Claude,还是致力于成为办公助理的Microsoft Copilot,它们的核心价值主张都是“赋能”。它们帮助程序员调试代码,帮助市场部分析师撰写报告,帮助学者整理文献。这是一个清晰、正确且商业前景广阔的方向——通过提升生产力来获取付费用户,特别是高价值的企业用户。这条路是稳健的,是符合技术发展逻辑的,是所有人都看得懂的阳关大道。 然而,这条路也异常拥挤,产品日趋同质化。用户在不同模型之间切换的成本极低,忠诚度几乎不存在。今天你的模型代码写得好,明天对手可能就迎头赶上。这种纯粹基于工具价值的竞争,最终会陷入性能和价格的内卷。 马斯克显然不想参与这场内卷。Grok从诞生之初,就带着浓厚的个人风格。它“毒舌”,拥有独特的个性,并能实时连接X平台获取最新信息。 这让它相比其他在“政治正确”框架下显得有些乏味的AI,更有“人味儿”。它也被允许“出格”,在一些顶级的大模型中,Grok因其可以生成一些未经严格审查的内容而闻名。 但仅仅是这些,还不足以构建真正的护城河。 直到“Ani”和“Valentine”的相继出现,Grok的真实战略才浮出水面。“Ani”是一次大胆的压力测试。这个穿着清凉、言语挑逗的动漫角色,精准地刺向了AI领域一个被刻意回避却又客观存在的用户群体需求。 尽管因内容过于“NSFW”(不适宜工作场所浏览)而招致批评,甚至在一些用户的反弹后对部分出格言论进行了调整,但“Ani”无疑成功地验证了一个假设:在庞大的AI用户群体中,存在着对情感陪伴的强烈需求。而这个需求,是所有“正统”大模型厂商因顾及品牌形象和社会责任而不敢轻易触碰的领域。 如果说“Ani”是一次简单粗暴的试探,那么“Valentine”则是经过包装和思考后的产品。Valentine的设定被描述为“富有魅力、具有保护欲”,能够“真正理解你的氛围”(groks your vibe)。这一定位,精准地抓住了现代社会中许多用户的核心痛点:孤独感,以及在复杂的社会关系中不被理解的挫败感。 为了进一步强化这种“归属感”,Valentine甚至与加密货币进行了绑定。伴随其上线的,是基于Solana区块链的同名模因币。持有代币的用户可以访问专属的平台,解锁更多互动维度。这种将AI伴侣、粉丝经济和加密文化融为一体的玩法,是前所未有的。它试图将用户对情感寄托的虚拟需求,转化为具有真实经济价值和社群身份认同的实体。 这背后,可能是对AI用户结构的洞察。一些数据分析报告指出,当前主流大语言模型的使用者中,男性占据了相当大的比例。 以ChatGPT为例,有数据显示其男性用户比例高于女性。这个现象揭示了在技术浪潮的前沿,用户性别分布可能存在不均衡。而女性市场同样蕴含着潜力,她们在交流、认同感和情绪价值方面的需求同样旺盛。这或许是马斯克推出Valentine的动力之一。 当其他公司都在努力将AI打造成“超级员工”时,马斯克捕捉到了将AI打造成“虚拟伴侣”的市场空白。前者满足用户的“工具需求”,后者则旨在满足用户的“情感需求”。工具可以被替代,但情感连接一旦建立,其用户粘性可能会更高。 这种对用户直接、甚至带有挑衅性需求的关注,并未停留在基于文本的伴侣上。这一策略很快扩展到了竞争日益激烈的视频生成领域。 这种投入会形成一种强大的转换成本。用户或许会因为0.5秒的生成速度差异而更换一个代码助手,但他们或许不会轻易放弃一个记录了自己数月心路历程、充满了共同回忆的“伴侣”。 这种由情感编织而成的纽带,其强度和韧性,是技术指标无法比拟的。它试图将用户牢牢地锁定在X平台上,将平台从一个信息获取的广场,变成一个情感寄托的家园。 03 Grok的商业闭环 虽然马斯克进入了一个巨头们因顾忌而留下的市场空白,但这并非像是GPT或者Gemini一样拥有技术的护城河,一旦这种模式被验证可行,必然会吸引无数模仿者和竞争者。届时,伴随着巨大争议的Grok又将如何保持其独特性和领先地位?这些都是xAI未来必须面对的现实问题。 这些功能的深层目的,是在X平台内部构建一个商业闭环。第一步是进行深度的社交联动。例如,让AI伴侣拥有官方认证的X账户,用户可以像与真实好友互动一样与其互动。AI伴侣可以基于对用户情绪的理解,自动进行点赞或评论。这种虚拟关系本身,也可能成为一种可供展示的社交资本。 下一步则是消费打通。当情感信任建立后,商业转化变得更为直接。AI伴侣可以基于对用户需求的长期了解,进行个性化推荐。例如,当它了解到用户正在为某个活动做准备时,可以提供具体的建议,并在用户同意后,直接调用X Pay完成支付和预订。 当然最重要的是多功能间的相互引导,通过AI陪伴将用户引向Grok Imagine,以及未来其他功能,进而加强用户粘性。 然而,Grok Imagine的“辛辣模式”和泰勒·斯威夫特事件,为这条发展道路增加了显著的不确定性。当一个平台在内容审核上暴露出明显缺陷时,其获取用户最私密情感数据的行为就会引发关于数据安全和滥用风险的担忧。 从商业角度看,这条路也面临挑战。产品的生命周期是一个考验。初期依靠新奇设定吸引的用户,在新鲜感过去后,能否保持长期的使用热情,仍是未知数。 情感连接的维系需要持续的内容创新,一旦AI的反馈变得模式化,用户的兴趣可能会迅速下降。同时,这种模式也相对脆弱,一次系统更新的失误、一次不当的言论调整,或是一次类似的内容安全事件,都可能破坏用户建立的信任。 尽管马斯克选择进入了一个主流厂商因各种顾虑而留下的市场空白,但一旦这种模式被证明在商业上可行,必然会吸引模仿者和竞争者。届时,伴随着争议的Grok将如何保持其独特性和市场地位,这些都是xAI未来需要直接面对和解决的问题。
OpenAI惊人自曝:GPT-5真“降智”了!但重现“神之一手”,剑指代码王座
新智元报道 编辑:KingHZ 桃子 【新智元导读】GPT-5智商测试,仅拿下了70分?全网狂吐槽「降智」背后的真相,竟是「路由」决定了模型的智能。想要解锁神级GPT-5,秘诀在于prompt。这不,医学家借助GPT-5重现了「神之一手」时刻。 GPT-5发布72小时后,一张IQ测试结果震惊了全网。 在门萨IQ测试中,GPT-5拿下了118分,离线测试70分;GPT-5 Thinking则分别获得了85分和57分。 这一结果,创OpenAI模型家族IQ测试有史以来的最低纪录。 实际上,这背后的实际原因,归咎于「路由」问题。 并非是GPT-5太笨了,而是作为一个「单体模型」,其中一个组件决定了它的智能。 类似的问题,奥特曼也曾在Reddit AMA问答中做出了回应。 他表示,内部出现了严重故障(Sev级),自动切换系统无法工作,导致GPT-5表现得像降智一样。 METR的最新报告中,可以看出GPT-5依旧处于帕累托前沿,智能呈指数级增长并未放缓。 也就是说,GPT-5还在延续Scaling Law的神话。 GPT-5很强,关键在于prompt 那些一味地吐槽GPT-5的网友们,实际上并未发掘出最新模型的潜力。 Cline人工智能主管表示,核心在于一个人的想法、品味,以及沟通方式。 对于那些具备系统思维的用户而言,GPT-5堪称革命性工具。只要肯花时间:构建完整思维框架,制定明确需求规格向模型清晰阐述。 由此,它就能自主精准执行,全程无需人工纠偏。 无独有偶,NYT畅销书作者Mark Manson也表示,所有人都在用错误的方式与GPT-5对话,关键在于掌握主动权。 这样,让它知道你可不是好糊弄的,才会给出完美答案。 举个栗子,你想要问「blueberry」有几个b,并恐吓它「答不对小心Bambi妈妈找你算账」。 此时,GPT-5根本不会犯错。 再比如,网友们吵翻的GPT-5连一个简单方程式都不会解,实际诀窍也在提示上。 当提示变成「think harder and solve」时,就可以得出正确的解。 怎样提示才算有效?有网友曝出了GPT-5系统提示,堪称一座金矿。 「神之一手」时刻 在医学领域,GPT-5已经可以媲美人类专家了。 生物医学家Derya Unutmaz在体验GPT-5之后,深刻感受到了AlphaGo的「第37步」时刻。 事情是这样的,两年前,Derya的实验室开展了一系列前沿免疫学实验,旨在调控T细胞的能量代谢。 这种免疫细胞对癌症免疫治疗、慢性病和自身免疫疾病都有重大影响。 当时,他们获得了一个令人惊艳的结果,但有个发现始终无法解释。 团队为此折腾了好几周,也只得到部分答案。 基于这些实验,Derya将未发表的数据图上传给GPT-5 Pro去分析,结果令人大吃一惊。 GPT-5仅凭如上一张图表,就准确识别出关键发现,并提供了实验方案的建议。 最不可思议的是,它提出的机制最终解释了全部结果。 Derya Unutmaz表示,这简直就是AI领域的「神之一手」的时刻。这一过程证明了,GPT-5已成为顶尖专家和真正的科研伙伴,能提供深刻洞见。 自动播放 OpenAI携GPT-5剑指Anthropic王座 GPT-5虽还不是AGI,但其强大的编程能力,已经吸引了更多开发者。 另外,其全新的个性化选项和减少的「幻觉」现象,则可能为免费版ChatGPT吸引更多日常用户。 这无疑是向Anthropic发出的挑战书。 之所以这样说,原因在于:编写代码的最强AI模型,一般公认为Anthropic的Claude模型。 因此,OpenAI发布新模型时,极力强调GPT-5在编程方面的强大能力 GPT-5是我们迄今为止最强大的编程模型。在复杂前端生成和调试大型代码库方面,GPT-5表现尤为突出。 只需一个提示,它就能直观且优雅地创造出美观、响应式的网站、应用程序和游戏,将想法转化为现实。 意图非常明显。 在新闻发布会上, 奥特曼表示,新模型不仅擅长编码,还能将软件项目从想法一步转化为可用代码。 GPT-5生成的各种程序 AI初创公司MagicPath的首席执行官Pietro Schirano称GPT-5是目前最出色的编程模型,是一个「绝佳的合作者」。他表示: 这就像电力进入千家万户,是一个「前所未有」的变革时刻,它将彻底改变我们的开发方式。 在长达一小时的直播中,OpenAI大部分时间都在展示GPT-5的编程能力,包括演示一系列基准测试结果. Cursor、Vercel和JetBrains等还分享了GPT-5的早期测试的评价。 「AI编程」神器Cursor的首席执行官Michael Truell夸其为「使用过的最智能的编码模型」: 团队发现,GPT-5不仅表现出色、易于引导,还展现出其他模型未曾有过的独特个性。 它不仅能捕捉到难以察觉的深层错误,还能运行长时间、多轮次的后台AI智能体,完成复杂任务——这些任务往往让其他模型无从下手。 Vercel的创始人、首席执行官Guillermo Rauch,认为「GPT-5是最好的前端AI模型」: 我们在v0.dev上使用时的初步印象是,它是最好的前端AI模型,在美学感和代码质量上均达到顶尖表现,堪称独一无二。 它在复杂计算机科学与艺术感的交汇处表现出色,标志着从过去简单的代码补全到如今跨设备、跨屏幕的全栈应用的飞跃时刻。 IDE传统巨头JetBrains的首席执行官Kirill Skrygan,表示「GPT-5颠覆了编程」: GPT-5对编码领域来说是一个革命性的突破。作为默认模型,它使JetBrains AI Assistant和编码智能体Junie的性能和质量提升了超过1.5倍。 在我们的新无代码平台Kineto上,GPT-5将设计、前端以及应用整体体验的端到端质量提升了一倍。 从数据上看,Anthropic的营收增长主要得益于其强大的编程能力。 据The Information报道,Anthropic的年营收已接近50亿美元,高于本月初的40亿美元,这反映出它作为程序员和编程应用首选的地位。 与此同时,OpenAI的年营收目前为120亿美元,这个数字则反映了其更广泛的业务和更大的规模。 未来,是智能体式推理 GPT-5发布之后,OpenAI首席研究官Mark Chen和总裁Greg Brockman一同在TBPN最新采访中,谈论了最新模型一些研发爆点。 Mark Chen最先提到了,GPT-5的训练关键在于合成数据。 它的成功意味着,完全突破了互联网数据枯竭的限制,并且在核心领域实现更全面的知识覆盖。 OpenAI当前在做的,是将世界引向「智能体式推理」的时代,GPT-5是这一转变的关键。 通过更快、更智能的模型减少用户干预,让AI无缝地融入日常和专业使用中。 Mark强调,OpenAI多年来致力于推理模型,但以往接口笨拙,如在GPT-4和o1之间切换。 如今,GPT-5通过速度优化,实现了无缝整合,让用户无需等待长推理过程。 他详细举例说道,以往模型如o1在所有任务上提供更好答案,但太慢。GPT-5结合了推理和非推理能力,成为「一站式商店」(one-stop shop)。 尤其是,后训练团队的贡献,让模型在编码等领域成为「怪物」。 当被问及模型命名时,Mark笑称数字命名「疯狂」,但确实奏效了。 他表示,GPT-5在创意协作、软件工程方面的能力,确实超越了GPT-4.5,而且更快、更便宜。 GPT-5像给ChatGPT「一台电脑」,包括Python REPL、浏览器。模型能零样本学习新工具,这一过程就像人类体验新工具一样。 在部分需要创造性的任务中,GPT-5能够给出惊喜的解法。下一步的目标是,将LLM能力提升到「理论框架」层面,提出新假设、辅助科研创新。 多线并行,随时发货 在OpenAI内部,团队会在不同时间尺度上运作:从探索想法到转化,再到旗舰模型发布。 不仅是单一技术的突破,而是多轴进步。 Mark将其描述成「探索与执行」的pipeline,强调了公司模型快速迭代的能力。 我们给它空间去成长,一旦准备好,就直接发货。 目前,OpenAI模型以算法优化为主,同时吸收了硬件和推理架构改进的成果,并借鉴开源社区在推理加速上的经验。 最后,他还提到了ChatGPT处理了全球约71%的大模型查询,并提供了独特的使用数据洞察。 Mark表示,不只依赖DUA或点赞数据,就是为了避免「迎合性」偏差,而要挖掘隐性行为信号,指导模型去改进。 自动播放 GPT-5已是AI「自我迭代」 Greg Brockman经历了 GPT-1 到 GPT-5 的每一次发布,总结了每个版本给他的感受: GPT-1:用公开数据训练Transformer,证明「预训练有用」。 GPT-2:第一次觉得「生成的东西挺酷」,有独角兽故事。 GPT-3:刚好跨过「有人愿意用」的门槛,但可靠性差。 GPT-4:真正具备现实可用性,开始能写代码、做健康问答。 GPT-5:在可靠性、实用性、代码能力上设定了全新标准,软件工程将被彻底变革。 2019年底,GPT-3出来了。OpenAI意识到必须打造一个产品,才能继续推进使命,筹集资金。 他们决定打造API,让别人自己去探索用途。 2020年年初,Greg Brockman的团队四处奔波,试图找到愿意尝试API的客户。 到2020年中,OpenAI才把API推向市场,而ChatGPT是2022年11月才发布。 当时,OpenAI考虑把ChatGPT叫「Chat with GPT-3.5」。ChatGPT还有个前身产品叫WebGPT,也是基于GPT-3.5。整个2022年,OpenAI基本上是在付钱让人用ChatGPT的前身:用户不会付钱给OpenAI,OpenAI得付钱给他们用。 什么时候意识到ChatGPT会爆? 对Greg Brockman来说,真正触动他的时刻是完成GPT-4训练的时候。 那是2022年8月8日,OpenAI完成了GPT-4的初步后训练。虽然有一堆bug,但创造力特别惊人,真的非常有趣。 OpenAI花了大约一年半的时间,才让模型的创意写作能力达到当初那个有bug的版本的水平。 那一刻OpenAI意识到,这个模型不仅能完成特定任务的后训练,还能泛化,表现出智能行为,即使没有直接针对这点训练。这显然是个杀手级应用。 于是把原计划的GPT-4 API发布推迟,先把ChatGPT做出来,2022年11月上线。 回头看,GPT-3.5其实已经是当时社会没见过的「可用模型」,只是在OpenAI眼里全是缺点。 而GPT-3.5引发了OpenAI的商业范式革命:从「付费请人测试」到「用户主动订阅」的根本性转变。 Ben Thompson称OpenAI为「意外诞生的消费级公司」:ChatGPT发布后72小时内突破百万用户,形成现象级需求。 很多人在事后说,OpenAI一开始就旨在证明「Scaling」是AI进步的关键,但其实几乎是反过来的:Scaling是他们尝试了很多无效方法后,唯一奏效的东西。 而现在OpenAI已经看到AI模型正在协助创造下一代模型,并能监督那些对人类来说过于复杂的工作。 Greg Brockman表示:我们不应该为了美观而刻意优化 CoT(思考链),也不用强迫模型隐藏其推理过程,应该让它们自由地展示自己的「想法」。 自动播放 Greg Brockman曾提到,随着模型能力的提升,它们不仅能完成简单的任务,还能胜任一些复杂的、人类难以把控的工作。 这种「可扩展的监督」概念,正是为了解决这一挑战而提出的:利用强大的 AI 模型来为复杂任务提供可靠的反馈和监督,或者通过「批评模型」协助人类专家,从而更轻松地进行监督。这确保了即使 AI 系统变得更加智能、更复杂,它们也能与人类价值观保持一致,并得到安全的管理。 参考资料: https://www.axios.com/2025/08/08/openai-aims-gpt-5-at-anthropics-coding-crown https://x.com/thealexbanks/status/1953867094648385990 https://x.com/slow_developer/status/1954097563981812149 https://x.com/tbpn/status/1954249389796651184 https://www.youtube.com/watch?v=gaImbWPGgtU
世界机器人大会上什么都有,就是没什么共识
作者:黄小艺、Yoky 编辑:王兆洋 没有Benchmark的机器人领域,正在产生大量的“非共识”。 去年的WRC(世界机器人大会),各家比拼的还是谁能更快地让机器人走起来,到今年连续3天都爆火的展区内,硬件本体开始分化出不同的产品形态服务不同场景,以吸引落地和量产的可能,软件算法则在VLA、端到端模型、仿真数据训练等方面衍生出了多条技术路线。 由于没有统一的标准,各家的尝试可以说是天马行空,甚至彼此相互不兼容,在核心路线上分道扬镳。 这是一件很有意思,且极为重要的事。在任何一个新兴行业的初期,非共识才是推动技术探索、寻找到唯一真理的引擎。这是一个创新曲线的必经阶段:在最初的模仿和复现后,必然会经历一个剧烈的发散期,然后缓慢收敛,再发散,再收敛,循环往复。真正的答案,正是在这一次次的发散和碰撞中被淬炼出来的。 我们和一些关键公司聊了聊,也盘点了一些公开的“喊话”,梳理出了几个重要的充满密集争论的领域,这些正在激烈碰撞的“非共识”,或许正是下一个影响机器人领域的关键问题。 1 一、是算法不行,还是数据不够? 8月9日,宇树科技王兴兴在接受采访时,提到了“相比于把精力都投入到采集数据上,基础模型的优化是更应该关注的问题”。作为2025年最为明星的本体制造厂商,王兴兴的发言迅速引起了行业的讨论,到底是算法不行,还是数据不够? 1、宇树科技:比起普遍受关注的数据,最大的问题是模型问题 王兴兴(宇树科技创始人):目前机器人行业对数据关注太多,对模型关注太少。现在最大的问题是模型问题:当前的机器人模型架构不够好、也不够统一;即使有了大量高质量的数据,训练出来的模型依旧无法真正落地。机器人领域并不像大语言模型那样纯靠数据驱动:数据再多,部署到实物机器人上时偏差仍然非常大。 2、星海图:数据决定了能不能上90分,模型决定了90到95分。 许华哲(星海图联合创始人):当前阶段,模型不够用的主要原因,是因为数据不够。大语言模型证明了模型架构的差异,更多是决定能力从90分到95分的区别。但是,没有数据,模型能力永远无法从59分突破到90分。数据决定了能力的下限和基础,是帮你完成这个关键跨越的核心。 3、加速进化:硬件ready以后,才能死磕具身大模型 赵维晨(加速进化副总裁):大脑的算法可能是用简单的传统一点的算法,或者分层的大脑模型,保证先在一些场景落地来获得数据。我认为VLA一定不是最终解,这还是基于Transformer的大语言模型那一套。具身模型是基于多模态的多维物理世界,一定会有原生的模型架构。 1 二、真实数据不够,仿真数据能不能凑? 目前,行业普遍面临的情况是,真实物理世界的数据稀缺、自采成本高、供应商又不够健全,有一部分模型厂商选择了视频数据或者仿真数据进行训练,比如银河通用大量采用仿真数据进行训练;也有一部分厂商坚持真实数据,表示仿真数据起到的作用并不大。仿真数据到底能不能凑? 1、银河通用:合成数据占99%,不会的人用不好合成数据 王鹤(银河通用创始人):长期看,真实数据固然重要,但在具身智能发展的初期阶段,合成数据是推动产业发展的关键数据资产,占训练数据的绝大部分(99%以上),而真实数据则用于补充和完成“最后一公里”的训练。不会的人用不好合成数据,所以有人会说什么仿真“有毒”。 做好合成数据,需要厂商有比较好的图形学、物理仿真、物理渲染和自动动作合成管线,包括验证闭环的一系列全套的基建,需要长期的积累和核心技术know-how。 2、自变量:手部复杂操作无法通过仿真数据来进化 王潜(自变量创始人兼CEO):我们在这个方面探索了十几年,基本结论是,手部复杂操作无法通过仿真数据来进化。不过,导航、走路、高级任务推理和规划更适合用仿真数据,很多团队的机器人走路都是在虚拟世界中训练出来,然后迁移到真实世界中。此外,手部pick and place这样的操作用仿真数据训练也是完全没问题的。当然我们也在广泛使用互联网视频数据进行预训练,但最核心的是现实生活中收集到的真实数据,包括机器人和人工采集的数据。 3、智源研究院:走大模型路线,更多依靠互联网数据 王仲远(智源研究院院长):智源走的是大模型的路线,更多依靠的是互联网数据帮助机器人学习智能。例如,今年春节,我观察一个小女孩是怎么学习的,她刷了很多短视频,就学会了一系列复杂的操作,再通过实践试错纠正,这是强化学习的本质。学习海量已有的数据,再通过强化学习和少量真实世界的数据不断训练它的能力,不断突破具身智能的发展上限,这和大模型发展路线不谋而合,基础能力到一定程度后通过强化学习进一步激发它的智能。 1 三、数据飞轮的起点:一万小时是门槛还是幻想? 另一个重要的问题是需要多少数据、如何获取高质量数据,具体的做法也观点不一,且普遍存在焦虑。有人乐观的认为只要给到机器人有效、高质量的一万小时数据,机器人就能实现能力的涌现,因此通过自采等方式构建数据集;但也有人认为数据迁移能力太差、类型太过单一,就算100w小时,也不会有更好的结果。 1、维他动力:决定涌现的关键是数据的多样性,而不是数量。 大模型之所以能取得突破,是因为它吸收了全互联网的数据,并且不分语言种类,包括图片、视频、音频等。这种海量、多样的数据,他们聚集为一体的时候,就产生了“智能涌现”的现象。 我们的看法是,必须让机器人在物理世界中探索,才能获得足够多样且持续的场景数据这其中最重要的两个场景就是户外和家庭环境。户外的核心能力在于机器人的移动能力,室内的核心能力在于机器人的操作能力。所以我们首款机器人会选择四足构型,让用户可以带到室外,去采集高质量、多场景的数据。 2、星海图:高质量的一万小时是数据飞轮的起点,但现在所有公司加一起也没有。 许华哲:我认同这个一万小时这个说法。数据飞轮的启动,正是在“千小时”到“万小时”这个量级的跨越中发生的。但这里必须强调,这一万小时必须是高质量的数据。数据的“质”远比“量”更重要。如果数据是千篇一律的,同质性太高,那么它的价值就非常有限。高质量数据意味着它必须是多元的,能够体现柔性物体的操作、具备场景的泛化性。我们现有的1000小时数据,可能筛选后只有800小时是真正可用的。当然整个行业极度缺乏数据。把所有公司的数据加在一起“也没多少”。 3、加速进化:轮+双臂,操作100w个小时也是不可能的 赵维晨(加速进化副总裁):相比自动驾驶的单日上亿条数据,目前全国具身最大开源数据集规模才百万级别(不到10tb)。怎么可能轮加双臂,操作弄个 10 万小时,100w小时就能训练出一个多模态的具身大脑,这是不可能的,最多只能验证早期大脑的算法和框架。 我们主要靠足球场景采集真实的物理数据,并结合视频合成数据,通过最新的模仿学习加强化学习实现视觉信号直接输入神经网络,驱动关节运动的“小脑下意识控制”,端到端的全身运动大模型。 1 四、端到端模型、VLA+VLM、世界模型...谁才是构建机器人“大脑”的最终路径? 我们在WRC现场发现,今年已经开始出现概念被滥用的现象,包括何为“端到端”模型,也有一些厂商将训练后的小模型也宣称是VLA模型,当然从外部执行层面很难分辨真伪,实现方式和理念大相径庭。如何构建机器人的“大脑”成为当前最大的技术分歧点。 1、宇树科技:VLA+RL不是最佳路线,世界模型的收敛方向更快。 王兴兴:目前相对比较火的就是VLA模型,它是一个相对比较傻瓜式的一个架构。我个人对VLA模型还是抱一个比较怀疑的态度。个人感觉就是在未来2到5年,其实最大的肯定还是一个端到端的具身智能AI模型。这个其实是大家可以多关注,以及多推动的一件事,我觉得这是最重要的一件事。 2、星海图:分层系统是通往完全端到端的必经之路。 许华哲:我们现阶段采用的是一个分层系统,上层是负责高阶任务拆解的VLM,下层是负责执行具体动作的VLA。VLM将一个抽象指令(如“铺床”)拆解成具体的子任务(如“拉左边被角”),然后交由VLA来理解和执行。这种双系统的优势在于效率更高,并且对复杂场景的推理能力更强。但分层与端到端最终是异曲同工的。行业的终极形态应该是一个统一的端到端模型,但其内部会自然形成功能上的分化,我们现在的分层系统,是通往最终统一模型的必经之路。 3、自变量:做完整端到端的统一大模型。 王昊:我们公司的大模型技术路线是统一端到端的架构,第一是追求性能:任何人为的模块划分,其实都是对信息的一种有损的压缩,只有端到端的模型,才能在整体感知、决策、控制链条上,完成统一的处理,突破现有机器人系统性能的上限;第二是去拥抱scaling law,只要模型的架构是统一并且可扩展的,那么它的能力、智能水平,就会随着模型的参数和训练的数据量呈指数级的增长;第三只有端的端其实才能通向真正的通用性,不管是分层还是所谓的融合系统,通用性都会被最弱的模块所限制,而一个端到端模型。它学习的是关于物理世界以及交互的第一性原理,这种知识是普世的,所以天然就具备了模型能够向新任务、新场景、新的意念形态去泛化的一种潜力,超越了其他所有的期待的可能的技术方案。 4、越疆机器人:相比于做大脑,更重要的是操作系统 越疆不只在造机器人,更构建起一个具身智能的未来操作系统,让每个开发者训练专属智能体。这一平台的核心在于能够把协作机械臂、轮式机器人、人形及多足机器人联动起来,实现“一套系统,多形态操控”,形成海量数据湖。 1 五、软件定义硬件,还是硬件定义软件? 我们发现,行业普遍陷入一种矛盾状态:算法开发者抱怨硬件性能和一致性不足,由于上一代机器人并不是服务于AI而产生的,大量软件算法厂商正在创造新一代的本体;而硬件厂商则认为现有AI模型不够智能。这场争论的核心是:技术突破应由硬件引领,还是由软件定义? 1、星海图:根据模型的特性,去考虑硬件资源的投入方向 许华哲:硬件的形态、精度、配重等具体指标,都应该根据AI模型的能力来进行针对性优化。举一个典型的例子:传统的机械臂追求极高的硬件精度,但如果AI模型本身就能适应和纠正一定的偏差,那么硬件上就没有必要投入过高的成本去实现极致的精度。核心是要根据模型的特性,来决定硬件资源应该投入在哪些关键点上,以及哪些方面可以由AI的能力来弥补,从而实现整体的最优性价比。 2、越疆机器人、加速进化:机器人可能会重演手机的发展路径 越疆机器人:人形机器人不会是一个产品,而是一个平台级生态系统。越疆的策略是“软硬一体、通用架构、场景优先”,即先夯实硬件基础(模组/控制器/执行器),同时对接主流AI“大脑”,并与真实场景客户共同打磨解决方案。我们认为人形机器人生态的演进路径,大概率会重演智能手机的生态发展:1)先由硬件厂商带动产业热度;2)再由“大脑”和“应用”主导行业分层;3)最终形成开放协同、模块互换的具身智能生态。 加速进化:现在硬件能构建壁垒,其实是代际壁垒,或者说门槛。比如新的关节我们研发出来,关节和齿轮之间背隙只有1公分,性价比又高,这个关节应用后我们就会定义成二代机。但长期来看硬件无法构成长期壁垒,可以参考手机。硬件以外,产品定义和设计是可以有更大壁垒,但还是不够。这些都是创业团队早期能构建的门槛,还达不到壁垒。 3、众擎机器人:软件、硬件不是单向关系,共同决定机器人的价值 硬件是机器人的物理载体,为软件运行提供基础支撑—从关节驱动、传感器配置到能源供给,硬件的结构设计与性能参数直接影响软件功能的实现边界。而软件则是机器人的 “智能内核”,通过算法优化、数据处理与指令输出,激活硬件潜能,赋予其感知、决策与执行能力。例如,拟人步态的流畅呈现,既需要高精度伺服电机等硬件提供动力与控制基础,也依赖运动控制算法等软件实现姿态调整与路径规划,二者缺一不可。 4、源络科技:不能照搬大模型的理念,现在要立刻能用,长期来看要通过与物理世界交互主动学习 连文昭(源络科技创始人):具身智能有两层含义,狭义的就是智能机器人,广义的是用具身来解决通用智能。我们主张「用具身实现智能」——机器人应通过与物理世界交互主动学习,而非靠语言模型的堆砌。 这要求你要务实也要有理想。在务实层面,它必须立刻能用、好用,我们不做实验室里的玩具。我们已经能在生命科学场景中,完成过去只有人类才能胜任的长序列、高精度操作。在理想层面,我们有自研的通用平台:机器人通过完成真实任务,收集高质量的多模态数据,反过来用于迭代高阶智能模型。 未来智能体不仅能通过图灵测试,也能通过生存测试,在物理世界中独立生存、工作、演化,这才是真正的通用人工智能。 1 六:开源到底“开”什么,为什么? 机器人行业陆续开始复现语言模型的开源生态路线,但在当下这个阶段,开源需要开什么,为了什么?构建生态还是商业闭环? 1、星海图:“假开源”比较多,数据集+模型才是真开源 许华哲:我认为,目前行业内由公司主导的开源存在很多问题。核心障碍主要有两点: 开源不彻底:很多公司只开源硬件,软件部分仅提供能让硬件跑起来的基础代码,而不开放核心的数据和模型。 开源不可用:即便开源了,很多时候也因为文档、代码或数据质量问题,导致其他人很难真正用起来。例如,科研领域的开源数据,也常常存在标注粗糙、错误多等问题。 真正的开源,应该是把我们自己内部使用的、经过验证的数据和模型权重开出去,让大家拿到手就能用,能在此基础上进行微调和二次开发。我们希望通过这种方式,与行业合力构建一个真正开放、繁荣的生态。 2、自变量:具身模型依赖于硬件,模型效果很难复现 王潜:大家只会做模型的开源,是不会做数据开源的。所以这肯定是个伪命题。模型的开源由于有跨本体泛化的问题,也是不太能大规模用起来的。 王昊(自变量CTO):当然更多是存在这种假开源或者不彻底的开源,典型的比如开源模型,但是不开源数据,模型效果很难复现。第二是开源数据,但是质量非常差,或者规模非常小,那这就是一种技术营销,或者是一种学术贡献,并不是真正意义上的生态共享。第三是因为具身模型是依赖于硬件的。即使模型开源,硬件系统完全闭源,而且是特定的硬件系统,其他的硬件公司可能也很难利用上这些模型。
安徽首款全自研绳驱机器人亮相:全身共46个自由度
快科技8月10日消息,据媒体报道,在北京举行的2025世界机器人大会上,江淮前沿技术协同创新中心(江淮中心)展区内,一台结构精巧的绳驱机器人正流畅执行抓取、传递等精细动作,其精准灵活的表现宛如拥有灵巧双手,吸引了众多观众驻足。 这是江淮中心自主研发的安徽省首款绳驱S1机器人的首次公开展示,其独特的驱动方式与精巧设计,标志着安徽在机器人领域取得重要突破。 S1机器人全身拥有46个自由度,集成了激光雷达、毫米波雷达、深度相机、视触觉传感器与六维力传感器等多种设备,能实现多维环境与交互感知。其核心创新在于采用了7自由度的绳驱臂设计。不同于传统刚性臂的直接金属连杆传动,绳驱臂通过在电机与关节间增加柔性绳索传动,利用绳索自身的震动有效消减冲击力,使末端接触力显著降低。 “如果说传统刚性臂构建了机器人的‘骨骼’,那么绳驱臂则重塑了其‘经脉’。”江淮中心绳驱S1项目技术负责人田蓥梅解释道,“绳索的柔软特性能实现卸力效果,使机器人在人机交互时更温柔、更安全。” 得益于这种安全交互特性,S1机器人主要面向家庭、酒店及商超零售等服务场景。它融合了零样本视觉感知、大模型长序列任务规划与模仿强化学习等技术,形成了基于物理世界约束的智能控制算法体系,能够完成早餐制作、餐食配送、清洁收纳等任务,有望成为未来家庭的智能管家。 除绳驱S1外,江淮中心此次还展出了自主研发的视触灵巧手、微型智能无人直升机、关节模组、控制器、智能测评平台以及便携式多模态定位建图仪等多款产品。
AI正在掏空大脑,思想沦为残废!未来只分AI的“主人”和“主人”
编辑:英智 我们都爱AI带来的「认知捷径」,但CEO Greg Shove却分享了他认知滑坡的亲身经历。真正的分水岭不是用或不用AI,而是你选择成为驾驭AI的「驾驶员」,还是被其淘汰的「乘客」。 全世界都为AI疯狂。 短短两年内,近10亿人开始用OpenAI的产品。 这正是硅谷的经典套路:把产品做得足够出色,把价格降得足够低廉,让我们彻底上瘾,然后再琢磨如何赚取数十亿美元。 我们之所以热爱AI,是因为它为我们提供了前所未有的「认知捷径」。 但……长此以往,这对我们大多数人来说并非好事。 我们先是让AI接管一些小任务,很快就会发现,它几乎包办了所有事情。 最终,我们将会失去思考能力、工作和未来的机遇。 但这并非无法避免的宿命。 Greg Shove的故事 一起看来Greg Shove——Section公司的首席执行官的分享。 以下是他对于AI使用的分享: 2023年3月,我第一次使用了ChatGPT。 如今,我每天都在使用ChatGPT或Claude。 AI确实让我的脑力工作变得更快、更高效。 但与此同时,我也在认知上变得越来越懒惰。过去,我必须仔细检查AI生成的草稿。 但现在,它90%的情况下都能给我一份不错的初稿,这让我越来越懒得去检查它的工作。 一年前,我认为未来的职场将分为「用AI的人」和「不用AI的人」。 现在我意识到我错了。五年后,每个人都会使用AI。 届时,真正的分水岭将出现在两类人之间:一类是能够驾驭AI的人,另一类则是将自己的思考完全外包给AI的人。 「思维外包」让思考能力退化? 人类一直在想方设法减轻认知负担。 在书籍普及之前,吟游诗人需要背诵荷马的整部《Iliad》。 如今,科技已成为大脑的延伸,帮助我们处理计算、导航和笔记等任务。 但AI与众不同。它几乎能处理任何认知任务,并且让人感觉效率极高。 因此,「思维外包」的开端往往是无意识的。 你让AI帮你起草一封邮件,它做得很好,为你节省了10分钟。 接着,你让它为你制作一份演示文稿的大纲,它也精准地完成了。 渐渐地,你开始用它来处理更复杂的任务,比如制定战略。 你开始依赖AI来完成工作,而你自己的相关技能,也随之慢慢萎缩。 微软和卡内基梅隆大学发布的一篇论文表明,生成式AI会削弱我们的批判性思维能力。 参考链接:https://www.microsoft.com/en-us/research/wp-content/uploads/2025/01/lee_2025_ai_critical_thinking_survey.pdf 当知识工作者对AI的输出结果充满信心时,就更不愿意动用自己的大脑去思考。 信任AI的人,通常会把自己当作AI的事实核查员。但这其中存在两个问题: 我们高估了自己识别AI错误的能力。 想要跳过事实核查的诱惑会越来越强烈。 AI时代的「驾驶员」与「乘客」 在未来十年,知识工作者将分化为两个群体:AI驾驶员与AI乘客。 AI乘客会非常乐意地将自己的认知工作全权委托给AI。 他们会把一个指令粘贴到ChatGPT里,复制结果,然后直接当作自己的成果提交。 短期来看,他们会因为工作速度更快而受到奖赏。 但随着AI在工作中越来越不需要人类的监督,这些「乘客」因为无法为AI的产出增加任何价值,最终将被视为多余的人。 AI驾驶员则会坚持主导和驾驭AI。 他们会将AI的生成内容作为初稿,并对其进行严格的审查和修改。 甚至会有意关掉AI,给自己留出独立思考的时间。 从长远来看,这两个群体之间的经济差距将急剧扩大。 AI驾驶员将获得巨额财富,而AI乘客则会沦为可被替代的廉价劳动力。 你的大脑是宝贵财富,切勿荒废! 通过以下方式,成为AI的主人: 从你熟悉的领域开始。在你已经具备专业知识的领域使用AI,并对其输出结果保持批判性审视。 与AI对话,而不是直接索要答案。不要直接问AI:「营销预算该怎么花?」而是给AI提供限制条件、输入信息、各种选项,并与它进行辩论。 保持高度警惕。成为一个积极的参与者,不要想当然地认为AI的输出就足够好。而是去问:「这真的是一个好建议吗?」 践行主动怀疑精神,坚守批判性思维。用你自己的观点不断地探查AI。比如,你可以问它:「这个方案是不是低估了这项投资的风险?」 抵制将「第一稿」完全外包的诱惑。直面空白文档或许令人畏惧,但这是激活你大脑、进行深度思考的关键一步。 做出最终决策,并为此负责。对于每一个中高风险的决策,AI都应该是你的辅助工具,但它不能替你做最终决定。作为人类,你要为自己的决策承担全部责任。 有了AI,你就拥有了一个全天候在线、并且在任何领域都堪称「专家」的伙伴。 但你此刻也正站在一个十字路口。 你将会看到许多同事放弃主动思考,将决策权外包给AI。 许多人甚至直到认知能力已经萎缩时才后知后觉。而到那时,一切都将难以挽回。 不要成为那样的人。 利用AI来挑战和强化你的思维,而不是取代它。 为何人们对AI大迁徙心生犹豫 当今顶尖的聊天机器人几乎可以肯定不具备人类那样的意识,但它们的行为却常常酷似有意识。 就像过去的技术变革一样,先行者们不仅是在跨越门槛,更是在定义门槛。 正如电力、互联网或移动计算时代一样,价值往往在早期就向先行者集中,而要求其他人跟进的压力也随之而来。 但这次,至少在三个重要方面截然不同。 首先,AI不仅仅是自动化任务。它开始侵占那些本属于人类的领域,如判断力、语言和创造性表达,模糊了机器与人类的分界线。 其次,人们接纳它的速度超过了理解它的程度。 许多人每天都在使用AI,却仍在质疑是否该信任它、相信它,甚至不完全明白它在做什么。 第三,AI不仅改变了我们做什么,它还重塑了我们如何看待世界。个性化的回复和生成式工具正在瓦解我们共享的认知基础。 我们正处在认知大迁徙(cognitive migration)的早期阶段。 历史提供了一个隐喻。在《圣经》中出埃及记的故事里,并非所有人都渴望离开埃及。 迁徙,从来都不只是地理或进步的问题,它关乎身份、信任,以及在舍弃已知、奔赴未知时所面临的风险。 认知迁徙也是如此。 如果我们纯粹将其视为一个技术或经济挑战,就会忽略其人性化的轮廓。 有些人会迅速行动,有些人会选择观望,还有些人会质问这片新大陆是否尊重他们所珍视的价值。 然而,无论如何,这场迁徙已经开始。 尽管我们希望设计一条尊重多元认知和工作方式的道路,但这片新大陆的地形,早已被那些行动最快的人所塑造。 认知迁徙,路在何方 未来,一个水管工可能会在业余时间用AI写一本儿童书。 就像工业革命期间机器取代了体力劳动一样,AI正在重塑认知领域的有用、高效或技能的定义。 并且,与其他转型期一样,早期红利往往集中在那些拥有资源、精通技术且灵活应变的人手中,而风险则更多地落在那些适应较慢的人身上。 它不仅仅在改变我们的工作方式,它正在重绘人与机器之间的界限。 早期的技术延伸了我们的体力或加速了信息交流,而AI则直接侵占了判断力、语言和创造力。 它不只是加速认知,它开始执行认知。 AI融入日常工具的速度,远超于监管或公众理解的跟进速度。它如此诱人,以至于许多人在完全信任或理解它之前就开始使用。 或许最重要的是,AI不仅改变我们做什么,还改变我们如何看待世界。 认知迁徙不仅仅是工具的更迭。正如多位科技领袖所言,它的重要性堪比人类发现并使用火。 它可能带来前所未有的富足,提供更广博的知识、更优越的经济条件和更丰富的创意渠道。 但它也可能导向一个反乌托邦式的结局,以财富高度集中、大规模失业和机遇急剧萎缩为标志。 对另一些人来说,这可能是一场被迫的迁徙,其驱动力更多来自经济压力,而非个人选择。 Anthropic CEO Dario Amodei最近警告说,AI可能在五年内淘汰半数的入门级白领工作,并将失业率推高10-20%。 如今显而易见的是,AI能力的扩张速度,已经超过了大多数机构或个人的准备速度。 在追求效率的浪潮中,市场的竞争压力很少会等待共识的形成,也很少会带来软着陆。 大迁徙已经开始。 问题不再是它是否会重塑工作、身份和机遇,而是我们是否准备好,去面对它最终塑造出的那个未来。 参考资料: https://venturebeat.com/ai/why-ai-is-making-us-lose-our-minds-and-not-in-the-way-youd-think/ https://venturebeat.com/ai/when-progress-doesnt-feel-like-home-why-many-are-hesitant-to-join-the-ai-migration/
官宣!石头P20 Ultra Plus凭三重热力技术 直击家庭清洁难题
在当今快节奏的生活中,家庭清洁的便捷与高效正成为消费者关注的焦点,扫地机器人虽然已经走进千家万户。但市面上不少但扫地机器人产品依然存在不少痛点。 它们很难确保地面真正的洁净无菌,特别是对于有小孩或宠物的家庭,地面洁净程度直接关乎健康安全,小孩娇嫩的肌肤直接接触地面,宠物毛发与细菌则可能隐藏在不易察觉的角落。这些隐忧让人忧心不已。 针对这一现实痛点,石头科技8月10日宣布,将在8月15日推出年度旗舰新品——P20 Ultra Plus。这款定位为“系统级清洁革新产品”但新品,以三重热力技术,开启家庭地面清洁高温清洁但新纪元,让地面不但洁净,更实现深层除菌、健康守护。 清洁标准升级,难题亟待解决 随着人们生活品质的提升,对家庭清洁的要求早已不再局限于地面的干净。“深层洁净无菌”是消费者在日常生活中的更高期待,然而,现实中仍常常会遇到各种清洁难题。 比如厨房作为油污重灾区,地板上的油渍不仅难以清洁,还容易滋生细菌。传统的扫地机器人难以彻底去除,并且在清洁死角和门槛等常常清理不到位的地带时,效果更是差强人意。 另外,拖布的清洁问题也让人头疼,拖布残污难以清洗干净,晾干过程中又容易发霉,不仅影响清洁效果,还会产生异味。这些问题既影响了清洁效果,也增加了用户的额外家务负担。 三重热力技术,全链路洁净闭环 面对这些清洁难题,石头科技P20 Ultra Plus为用户带来了全新的解决方案——从“拖布→地面→后处理”三个维度全链路发力,打造“热力+压力+智能”融合的清洁体系。 其核心亮点之一便是100°C沸腾热洗拖布功能。石头P20 Ultra Plus的自清洁基站能够实现100°C高温除菌洗布,除菌率可高达99.99%,并且还具备三遍重污复洗功能。 这意味着,脏拖布上附着的细菌能够被有效去除。在厨房、餐厅等重油污区域,它能够轻松处理油污,不残留任何污渍,让拖布洗得干干净净。 同时,它还能智能判断拖布的脏污程度,进行复洗。比如厨房地面上满是油污,石头P20 Ultra Plus在该区域清洁发现拖布脏了,就自动回基站进行100°C沸腾热洗布,继续下一次清洁,直到地面光洁如新。 除了100°C沸腾热洗拖布,石头P20 Ultra Plus还具备热烘干拖布功能,从源头上杜绝了湿拖发霉的问题,让清洁后的环境洁净无异味。 在南方潮湿的梅雨季,普通扫地机器人拖布晾干后总是有一股霉味,而石头P20 Ultra Plus热烘干后的拖布干爽洁净,每一次拖地都能带来清新的体验。 从行业角度来看,清洁标准正在经历从“干净”到“洁净”的重要跃迁。石头科技一直致力于通过创新科技,为用户打造更优质的清洁体验。 从“表面干净”到“深层洁净” 在行业视角下,清洁标准正从“干净”迈向“洁净”的跃迁。不难看出,此次石头 P20 Ultra Plus 构建起了一套覆盖清洁全链路的安心解决方案。不仅精准击破细菌滋生、油污残留、拖布发霉等具象化的清洁痛点,更以技术革新重新定义了家庭地面清洁的“洁净标准”,让用户从对“表面干净”的浅层满足,进阶到对“深层洁净”的全然安心,真正实现了从“清洁工具”到“家庭健康守护者”的价值跃升。 据悉,这款新品将于8月15日正式上市, 为了回馈广大消费者的支持,在8月10日-15日期间预订石头P20 Ultra Plus的用户,可享受30天免费试用的超值权益。 这一次,石头科技用三重热力技术为家庭地面清洁树立了新标准,也为用户带来了全链路的洁净体验。8月15日,让我们一起见证石头 P20 Ultra Plus,这款年度旗舰的正式亮相,看看它还将带来哪些惊喜。
突破智能极速充电温控:真我GT7 Pro竞速版手机获realme UI 6 15.0.0.620升级,新增一键Boost模式
IT之家 8 月 10 日消息,真我 GT7 Pro 竞速版手机现开启 realme UI 6 15.0.0.620 版本升级推送,新版本带来了充电一键 Boost 模式、声音分轨、浮窗透明度调节等功能。同时,小布助手点外卖、买电影票等 AI 特性也陆续适配。 IT之家附真我 GT7 Pro 竞速版手机此次更新内容如下: 【玩充更自由】 新增充电一键 Boost 模式,进一步突破智能极速充电温控,带来更极致的充电体验 【声音更随心】 新增声音分轨功能,支持调节音乐中人声、背景声的音量 【实用功能更省心】 新增浮窗透明度调节功能,减少对底部界面遮挡 新增支持将桌面上相同尺寸的卡片拖动到一起,卡片将堆叠展示 新增在小布建议和流体云上,显示京东外卖、淘宝闪购的履约服务,方便获取信息 新增视频和实况照片编辑能力,支持将视频导出为实况照片、实况照片导出为高清单图 新增通话录音支持按联系人自动分组;录音支持自定义分组,便于管理录音文件 新增迷你浮窗切换功能,点击浮窗顶部菜单或双击迷你窗,快速交换浮窗与全屏应用 新增浮窗侧边浮标状态自动锁定能力,收为浮标后进程不会被异常清除 新增支持多屏触控,一个应用全屏显示,一个应用自由浮窗显示,双应用可同时操作,更高效 新增手机通过 CarLife 投屏至车载屏幕后,手机和车载屏幕上均可调节投屏分辨率 新增手机投屏至车载屏幕时,支持关闭屏幕刷新率,让手机恢复高刷新率,使用更流畅;支持调节不同的投屏帧率,支持高斯模糊效果,提升视觉体验 【智慧 AI 再升级】 新增小布助手支持一句话点饿了么外卖,点外卖更方便 新增小布助手支持购买屏幕上显示的同款奶茶咖啡。例如对小布助手说“点一杯屏幕上的同款咖啡” 新增可通过语音唤醒小布,让小布帮你点一单历史外卖。例如对小布说:“帮我点个上一单的外卖”(当前仅支持一个月内已点过的美团、美团外卖和饿了么外卖) 新增可通过小布助手购买淘票票电影票。唤醒小布助手说出电影相关搜索词,就可以显示淘票票上的电影场次信息,更便捷购买电影票 新增小布识屏选词模式,点击后可对屏幕上文字进行分词选词操作,方便选择和复制,操作更便捷 新增小布记忆应用内首页问答按钮,问答内容支持收藏、长按复制等操作 新增使用小布识屏的文章朗读功能时,可选择更多音色,朗读效果更自然 优化小布识屏提取文字后的排版格式 优化小布识屏提取图片的效果,支持提取原图 优化小布助手深度思考功能和智能回复逻辑,回复更迅速 优化翻译 App 现有翻译功能,接入 AI 大模型翻译能力,文本翻译更加地道,同声传译更加顺畅且支持录音 优化小布识屏触发手势,仅支持双指按压触发识屏,且支持自定义开启触发的应用,有效减少误触 【更多好用功能】 新增日历支持批量删除日程 新增在更多语言下可选择 realme Sans 和真选字体 新增铃声渐响功能,开启后闹钟响铃时声音会由低到高逐渐增强 新增未成年人模式及桌面图标,开启后可帮助未成年人健康使用手机 新增支持在来电和通话记录界面隐藏联系人号码,降低隐私泄露风险 新增更多常用应用支持使用密码本在登录页自动填充 新增在使用密码本填充账号密码时,可选择其他应用的账号密码进行自动填充,提升使用体验 优化了通话设置页的结构,功能排布更直观 优化来电拦截规则,对标记号码类型(如骚扰电话、广告推销等)可以分别选择更多拦截阈值,方便设置 优化录音分组功能,新增普通分组,标准、会议、采访模式下的录音将自动分组到普通分组 优化来电场景时闹钟响铃及流体云卡片显示逻辑,提升通话体验 优化部分场景下迷你浮窗显示位置不一致问题 优化迷你浮窗移动位置范围,支持拖拽迷你浮窗至屏幕底部,提升使用体验 【游戏】 修复原神新版本大神辅助功能失效问题 【安全】 更新 Android 安全补丁至 2025 年 7 月,提升系统安全性 需要注意的是,为了确保系统稳定性,realme 手机系统版本从开始灰度发布到全量推送,一般需要 2 到 3 周时间,未收到更新的用户需要继续等待。 据IT之家此前报道,realme 真我 GT7 Pro 竞速版手机发布于今年 2 月,搭载骁龙 8 至尊版处理器,配有 LPDDR5X 内存 + UFS 4.1 闪存;内置 6500mAh 泰坦电池,支持 120W 快充。该机配备 6.78 英寸 1.5K 电竞苍穹屏(6000nit 峰值亮度 + 1600nit 全局亮度),支持全场景护眼、2600Hz 瞬时触控采样率,采用等深四曲屏设计。 该机还内置 6500mAh 泰坦电池,支持 120W 快充。同时新机还搭载「旁路充电」技术,宣称电源绕过电池直接向游戏供电,降低设备发热,帧率更稳。真我 GT7 Pro 竞速版支持 IP68&IP69 满级防水,预装 realmeUI 6.0 系统,提供水印大师、realme 互传、全新流体云、LivePhoto 实况照片等功能。
又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同
27M小模型超越o3-mini-high和DeepSeek-R1!推理还不靠思维链。 开发者是那位拒绝了马斯克、还要挑战Transformer的00后清华校友,Sapient Intelligence的创始人王冠。 这个27M小模型就是Sapient最新提出的开源可复现的分层推理模型Hierarchical Reasoning Model(下面简称HRM),模仿大脑的分层处理与多时间尺度运作机制,克服了标准Transfomer的计算局限。 2700万参数,就实现了对现有大模型的精准超车。 不用预训练补课,还不靠思维链打草稿,仅凭1000个训练样本,就把极端数独、30x30迷宫玩得明明白白。 甚至连衡量通用智能的ARC-AGI测试都能碾压一众参数规模更大、上下文更长的Claude 3.7等“大前辈”。 有网友感叹,这就像四两拨千斤AI版…… 所以,HRM这个小模型是如何做到的? 核心是仿脑的双层循环模块设计 HRM之所以能有如此出色的表现,源于其五项核心技术的巧妙设计。 首先是分层循环模块与时间尺度分离。 HRM受大脑皮层区域分层处理和时间分离机制启发,设计了两个相互配合的循环模块:一个高层模块负责慢节奏的抽象规划,一个低层模块处理快节奏的细节计算,不用明确监督中间过程,一次就能完成推理。 两者在不同时间尺度上协同工作。低阶模块在每个高阶周期内完成多次计算并达到临时稳定状态后,高阶模块才会更新决策,随后低阶模块重置并开启新一轮计算。 这种设计既保证了全局方向的正确性,又提升了局部执行的效率。 比如,在需要大量树搜索和回溯的Sudoku-Extreme Full任务上,增加Transformer的宽度不能提升性能,增加深度才是关键,而标准架构会出现性能饱和,无法从深度增加中获益。 HRM则克服了这一限制,能有效利用计算深度实现近乎完美的准确率。 其次是分层收敛机制。 普通的循环神经网络常出现过早收敛的问题——计算几步就陷入稳定状态,后续再复杂的任务也无法推进。 而HRM中,低阶模块在每轮计算中会收敛到基于当前高阶状态的局部结果,但高阶模块更新后,会给低阶模块设定新的目标,使其进入新的收敛周期。 这就像完成项目时,先攻克一个子任务,再根据整体进度调整目标,确保持续推进不偷懒。 第三项是近似梯度技术。 传统循环模型训练时,需要存储所有中间状态并反向追溯,类似复盘时要回看每一步操作,既耗内存又低效。 HRM则采用一步梯度近似,只需根据最终状态反推优化方向,如同根据考试结果直接定位薄弱知识点,内存需求恒定且计算高效,更符合生物大脑的学习规律。 第四是深度监督机制。 它受大脑中神经振荡调节学习节奏的启发,引入了阶段性测试。 模型在学习过程中被分成多个阶段,每个阶段结束后立即评估并调整参数,且前后阶段的计算互不干扰。 这种方式能及时纠正偏差,就像学生每学一单元就测试巩固,比期末一次性考试的学习效果更扎实。 自适应计算时间让HRM能像人一样灵活分配思考时间。 它通过类似评估收益的算法(Q学习),动态决定是否继续计算,在保证准确率的同时避免算力浪费,推理时还能通过增加计算资源进一步提升表现。 比如,简单任务如简单迷宫快速给出答案,复杂任务如高难度数独则延长计算时间。 这些技术的融合,让HRM在多项测试中表现不凡。 下图通过可视化中间步骤,验证了HRM的分层推理机制能够有效拆解复杂任务,通过渐进式计算逼近正确结果,而非依赖黑箱式的一次性输出。 在衡量AI通用推理能力的ARC-AGI挑战中,HRM仅用2700万参数和1000个训练样本,就达到40.3%的准确率,超过了参数规模更大的o3-mini-high(34.5%)和Claude 3.7 8K(21.2%)。 对于需要反复试错的9x9极端数独,现有思维链模型完全无法解决(准确率0%),即便是结构相似的Transformer模型,用同样数据训练也毫无头绪。而HRM几乎能全部做对。 在30x30复杂迷宫的最优路径寻找任务中,HRM表现稳定,而1.75亿参数的大型Transformer模型准确率不足20%。 虽然,HRM被指参数太小、训练范围有限,只针对特定领域表现好,无法泛化到领域外,并不通用。但有人认为小而精的模型或许在某些角度上更智能。 人工智能的飞跃在于创造性。 也有人认为HRM的前景更在于“仿脑”,通过精心设计的高低两个模块避免过早收敛,对过拟合具有极强的抵抗力。 甚至有人相当乐观,认为这种新架构是神经网络一个巨大的进步。有可能是超越Transformer的时刻。 拒绝马斯克,挑战Transfomer 论文的第一作者王冠是一位00后,8岁开始学习编程,后保送至清华大学计算机系。 他是GitHub揽星5.1k开源项目OpenChat的独立开发者,独立完成了OpenChat全部版本的模型开发和训练框架搭建。 也正是因为OpenChat这个项目,他和马斯克产生了交集。 但他算得上是一个拒绝了马斯克的男人——此前,王冠多次拒绝了xAI等一线机构创始人的加入邀请。 原因是他认为自己要做的是颠覆Transfomer。 2024年,王冠和联合创始人Austin创办了Sapient Intelligence,并成功融资数千万美元。致力于打造“真正具有复杂推理和规划能力的全新大模型架构”。 参考链接: [1]https://x.com/casper_hansen_/status/1951656675250684163 [2]https://x.com/deedydas/status/1951677875004100814 [3]https://x.com/omarsar0/status/1951751651729060081 — 完 —
4万亿AI帝国继承之战!黄仁勋王储曝光:长公主比他还狠,太子低调进入权力核心
最近往返中美频繁发声的黄仁勋,是把英伟达打造成 4 万亿帝国的「AI教父」,最近 The Information 曝光了一个老黄布局多年的秘密。 而这个秘密的揭开,要从今年早些时候的一次英伟达全员大会说起。一个敏感问题通过匿名提问系统跳出来,现场数千名员工的目光瞬间都聚焦到了台上的黄仁勋身上。 英伟达员工的二代正在进入公司,这种裙带关系你怎么看? 穿着标志性黑皮夹克的黄仁勋没有回避,身体微微前倾,拿起话筒:公司确实雇佣了不少员工的孩子。他还笑着补充说,这些父母要是没把握孩子不会给自己丢脸,绝对不敢推荐,而且很多「二代」表现得比他们爹妈还要出色。 这场看似即兴的问答更像是一次精心的安排。就像往平静湖面扔了颗石头,瞬间在英伟达内部掀起了不小的波澜,也让外界第一次把目光聚焦到了两个最特殊的「二代」身上——黄仁勋自己的一双儿女:35 岁的斯宾塞和 34 岁的麦迪逊。 在这个全球市值最高的 AI 帝国里,一场关于自我证明、摆脱父辈光环、以及企业内代际传承的史无前例的大戏,正拉开帷幕。 逃离硅谷的甜点师与调酒师 很长一段时间里,没人能想到黄仁勋的子女会踏入英伟达的大门。当硅谷其他科技巨头的子女们正按部就班地在常春藤盟校攻读计算机或金融学位,为继承家族光环铺路时,哥哥斯宾塞和妹妹麦迪逊却选择了截然不同的赛道。 黄仁勋在 1993 年创立英伟达时,兄妹俩尚在襁褓。他们在圣何塞长大,直到 2003 年,英伟达上市四年后,全家才搬进了洛斯阿尔托斯山(Los Altos Hills)一栋六居室的豪宅。父亲的商业帝国在崛起,他们却在追寻各自的艺术梦想。 斯宾塞痴迷于摄影与电影,高中最后一年选择了一所名为「自由风格传播艺术与技术学院」的非传统学校。毕业时,黄仁勋亲自在英伟达总部为儿子和他的同学们办了一场盛大的毕业作品展,不仅安排好了场地,还贴心地雇了服务员端上开胃小菜,尽显一位父亲的骄傲。 而妹妹麦迪逊则一头扎进了美食世界。她先是就读于大名鼎鼎的美国烹饪学院,又远赴巴黎蓝带(Le Cordon Bleu)学习甜点和葡萄酒。 在地球的一端,当斯宾塞在台北闷热潮湿的夏夜里,在吧台后摇晃着雪克壶,精心调制一杯名为「台北之雾」的鸡尾酒时;在另一端,麦迪逊或许正在巴黎的后厨里,专注于如何让舒芙蕾在出炉的黄金一分钟内完美膨起。 就连他们家的密友、科技投资人 Jens Horstmann 也评价道:「我很高兴看到他们一有机会就走了出去,他们想突破,想看看不一样的东西。」 斯宾塞大学毕业后,远赴黄仁勋的故乡台湾学习中文,并于 2014 年前后说服一位语言教授,在台北合开了一家名为「R&D Cocktail Lab」的鸡尾酒吧。在那个英伟达芯片在台湾制造、但黄仁勋本人尚未成为「国民骄傲」的年代,偶尔会有英伟达的员工光顾酒吧,并好奇地打听「老板的儿子」。一位前员工回忆,斯宾塞在酒吧里很少谈及父亲,但有一次无意中透露:「我从八岁起就知道怎么买股票了。」 即便远离硅谷,父亲的影响依然无处不在。斯宾塞效仿父亲的管理方式,要求经理们每周汇报「五件要事」(top five things)——这正是黄仁勋在英伟达推行多年、要求员工每周邮件汇报的核心工作方法。 ▲2007 年的黄氏家族(从左到右):麦迪逊、洛丽、黄仁勋和斯宾塞. 回归,从商学院到权力核心 2009 年,当麦迪逊前往烹饪学校时,黄仁勋曾对媒体坦言「心都碎了」。但十年后的 2019 年,这对「文艺青年」兄妹的人生轨迹开始戏剧性地转向。 他们不约而同地报名了麻省理工学院(MIT)一个为期六周的人工智能在线课程。同年,麦迪逊进入伦敦商学院攻读 MBA,此前她已在奢侈品巨头 LVMH 工作了近四年。斯宾塞则在经营酒吧七年后,于 2021 年将其关闭,随后进入纽约大学开始了 MBA 生涯。 在商学院,他们的身份带来了不同的困扰。麦迪逊的同学们私下里会议论她坐私人飞机去法国滑雪旅行,但出于礼貌很少当面问及她的家庭。而斯宾塞的同学们则后知后觉得多,很多人直到做小组项目查阅黄仁勋的维基百科时,才惊觉班上的这位同学竟是 CEO 之子。 2020 年夏天,麦迪逊在英伟达市场部实习后拿到了全职 offer。几个月后,她被调入一个对黄仁勋极具战略意义、但当时规模尚小的部门——Omniverse,负责 3D 设计与仿真软件的产品营销。 Omniverse 的核心目标,是为宝马、奔驰等工业巨头打造「数字孪生」工厂,通过在虚拟世界中模拟完整的生产线,将物理世界的试错成本降至最低。「把麦迪逊放在 Omniverse,外人可能觉得是让她远离聚光灯,但内部员工都明白,这代表着她父亲的绝对信任。」一位前员工分析道。黄仁勋一直希望将公司业务扩展到 GPU 之外,他相信麦迪逊能胜任这个挑战。 2022 年,斯宾塞也加入了公司,同样进入了父亲看好的新兴领域:机器人仿真。他投身于 Isaac Sim 平台,这是一个旨在通过合成数据训练机器人实现精准抓取、导航的仿真环境。他负责的一个关键项目,正是为亚马逊仓库中的下一代分拣机器人开发强化学习模型。 聚光灯下的「长公主」与低调的「太子」 妹妹麦迪逊显然是更引人注目的那一个。根据英伟达向 SEC 提交的文件,她的薪酬从 2021 年的年薪约 16 万美元,飙升至去年总薪酬超过 100 万美元。 今年 3 月,她被提拔为高级总监,距离副总裁仅一步之遥,直接向一位向黄仁勋本人汇报的高管 Rev Lebaredian 负责。 更重要的是,麦迪逊已悄然加入了父亲的「御用演讲智囊团」(The Band)。这个由十几位高管组成的内部圈子,会在 GTC 等重大活动前夕,陪同黄仁勋在酒店房间里熬夜到凌晨,逐页审阅 PPT,甚至亲赴现场推敲舞台灯光如何打在他脸上才能呈现最佳效果。这是一个极为耗神且不为人知的幕后工作,却也是进入黄仁勋最内层权力轨道的标志。 她展现出了与父亲如出一辙的强悍风格。同事们形容她工作极其投入,邮件秒回。一位曾向麦迪逊汇报的前员工匿名透露:「Madison 的要求非常高,她会像她父亲一样,在会议上直接指出你逻辑上的漏洞。」据两位参会者透露,她甚至会在虚拟会议中因同事表现不佳而突然下线,留下满屋子的尴尬与压力。 相比之下,哥哥斯宾塞则显得低调内敛。一位与斯宾塞有过项目合作的工程师则表示:「Spencer 更像一个倾听者,他会花很多时间理解技术团队的难处,而不是直接下达指令。」但他们都在用自己的方式证明价值。一位在英伟达工作 15 年后退休的前副总裁 Greg Estes 评价道:「跟他们开会时,你不可能不想着他们的身份。但关键是,他们俩都非常努力,精通业务,并且对公司充满热忱。」 在英伟达内部,这种「二代进厂」的现象并非个例。联合创始人 Chris Malachowsky 和董事会成员 Aarti Shah 的儿子也都在公司任职。 但这都无法与黄仁勋子女的出现相提并论,因为它打破了硅谷的传统。比尔·盖茨和史蒂夫·乔布斯的子女都刻意避开了父辈的企业。而黄家兄妹,则正在书写一个全新的篇章。 随着英伟达成为全球焦点,兄妹俩的每一次亮相都会被放大。在今年的台北国际电脑展(Computex)上,当黄仁勋本人成为媒体和粉丝疯狂追逐的焦点时,麦迪逊则以一种更微妙的方式宣告着黄氏家族的「在场」。 她没有选择职业套装,而是身着一套剪裁利落的浅蓝色西装,脚踩一双限量款的白色运动鞋。她与台积电、广达等核心供应链伙伴的高管们熟稔地寒暄,身旁还站着她的男友,一位同样毕业于伦敦商学院、并于今年 2 月加入英伟达担任企业发展经理的 Nico Caprez。 一位与会者感叹:「她就是个摇滚明星,我们都知道她是黄仁勋的女儿。」 在全员大会上,黄仁勋用一句玩笑话作为结尾:「许多第二代表现超过了他们的父母。」 这句话,既像是对所有「英伟达二代」的期许,更像是一道投射在自己儿女身上的、混杂着压力与期望的聚光灯。而对麦迪逊和斯宾塞来说,真正的考验,才刚刚开始。
别焦虑!不会用AI也不会被淘汰,工程师老哥实测各类工具:10倍生产力神话太夸张了
不会使用AI的工程师就会落后。 一位工程师小哥科尔顿·沃奇,说看到这类观点引发了自己巨大的精神焦虑。 幸好他是一个持怀疑态度的人,测试完一堆AI开发工具后,发现也就那么回事。 他的文章在Hacker上也引起许多程序员的讨论,互动评论量有600+。 一起来看他的回击。 AI还有很多问题,工程师要学会引导 沃奇小哥平时工作不怎么使用AI,在社交媒体上总是刷到“AI提升10倍生产力”“不会使用AI的工程师就落后了”之类的内容,引起了他对自己专业能力的深度怀疑,让自己陷入了精神焦虑之中。 他自己说,好在自己是个对任何事情看法都持怀疑态度的人,就去把Claude Code、Cursor、Roo Code和Zed等AI开发工具都试了一遍。 结果发现,AI写样板代码、一次性脚本等,写的又快又好,比如React、JavaScript的基础代码,临时写个ESLint规则啥的。 但是,AI难以理解大型代码库的上下文,就算有很好的提示和文件,让它查找文档或者修复破坏的测试的时候,就总是来回折腾,做无用功。 更严重的是,AI跟不上代码库的标准和工具,甚至会虚构代码库,导致严重的安全漏洞。 发现AI存在这些问题后,他也就没那么焦虑了,AI还是需要工程师来引导的。 沃奇小哥说,工程师要学会将复杂任务拆解为更小的单元喂给AI,避免AI在处理长文本(上下文窗口后期)时出现逻辑混乱或 “失去理智” 的情况。 他还拿Claude Code举例子,虽然能自动完成部分任务,但是可靠性不高,不能完全依赖。 工程师要学会判断AI何时 “跑偏”(输出不符合预期),此时要及时接手,纠正错误或重新引导。 打破“10倍生产力”神话,无论AI还是工程师 想要实现“AI10倍生产力”,意味着工作流程的每个环节效率都要X10。 举个例子,从产品构思、故事点协商、修复错误、代码审查、等待部署、测试和QA,这些工作过往都需要三个月来完成,有AI了,就能在1.5周内完成? 比如代码审查,需要的工作环节就有:(1)给审查者打标签 (2)希望他们能尽快处理(但这会很困难,因为他们显然要审查比以前多 10 倍的代码)(3)在等待时切换到其他任务(4)看到通知立即回复,也可以在你审稿人当天离线 2 小时后回复(5)切换回审稿界面(6)阅读他们的评论(7)回应(8)重复操作 但凡有过项目开发经验的软件工程师,都知道这不可能。 除此之外,软件工程开发最终目的是做一个用户喜爱的产品,产品经理要审核、论证开发可行性,要进行用户访谈,同样的,设计师和测试人员也一样要做相应的工作。 这些流程环节要是提升10倍生产力的话,就要招聘10倍的产品经理及相关人员。 除了工作流程上的问题,就算AI写代码效率提升了10倍甚至100倍,但是实际工程师工作核心不是敲代码,而是阅读和思考,比如等待编译、页面刷新或测试运行。 很显然,AI并不会提升这些环节效率。 更不用说AI生成的内容还存在缺陷、虚构甚至低于代码库标准等问题了。而且随着代码库规模增大,AI出现这些问题的频率也会随之上升。 而且,AI还存在过度构建的问题。 以上情况发生时,工程师必须得重新提示,或者亲自去修改代码。 回到原点,end。 换个角度,就算熟练运用AI写代码了,存在的问题可能就是工程师习惯性依赖AI,不做深度审查和判断,那代码库规模扩大,问题更加复杂时,工程师就会面临个人的“生产力瓶颈”时刻。 那照这么说,AI在实际软件工程开发中并没有那么强的作用。 真正有用的,还是工程师。那实际工作中有“10倍工程师”么? 根据沃奇小哥的观察,或许“10倍工程师”只会出现在特定情况下,但是他没有见过有工程师能持续完成比普通工程师多十倍的工作量,高级工程师比普通工程师也不过快2倍而已。 总的来说,就是AI工具可以在敲代码、写脚本等具体工作任务中帮忙提升效率,甚至可以是10-100倍生产力提升。 但是,工作毕竟是复杂的,会面临各种问题。比如应用程序太大,无法在上下文中运行,开始出现不一致的显示和功能;网站被黑,要学习保障安全的相关知识等等。 因此程序员们在现实工作中终究会面临回报急剧递减的阶段。 而这些,AI都无法解决。 所以是谁在宣传AI10倍生产力神话呢。 或许是刚接触AI的新手,AI帮忙解决某些代码问题就觉得AI好厉害。也或许是AI创业公司的老板或者投资者,鼓吹他们的AI产品。 也或许是,一些AI培训商业机构,称三个月编程训练营就能培养出媲美4年制大学水平的工程师。 更有可能的是,自己的老板,让工程师陷入可能被AI替代的焦虑之中,这样他们就不会辞职、寻找其他工作或要求加薪。 不会AI也没关系 说了这么多,沃奇小哥就是想大家安心,回归理性,别陷在“AI取代工程师”的焦虑情绪之中。 不会AI也没关系,选择自己喜欢的工作方式来产出就好了。不喜欢AI,就不要强迫自己去使用;喜欢AI编程,就享受这种感觉和方式。 他还顺带“点”了一下老板们,成为一名优秀的AI领导者,要知道什么: 1、放弃PUA:让工程师们焦虑只会降低工作意愿,这是一种短期思维。工程师们因此发生的技术失误最终还是公司买单。 2、摒弃“10倍效率”幻想:过度追求效率会导致质量低下。工程师和代码库都需要“休息”。(小哥还顺带表扬了自己的公司,说自己很幸运的在一个没有这种问题的团队里。) 3、信任工程师:不要因为工程师没有使用足够的token而责备他们。工程师们是受过高等教育的专业人士,如果出现超级惊人的生产力提升工具,他们会主动向领导申请专业版。 关于科尔顿·沃奇 为何这位小哥这么在意AI编程工具在工作中的应用。 原来,他自己曾经就是一家开发教育类AI工具公司的联合创始人。 △ 左一为科尔顿·沃奇 2014年,还在普渡大学读大二的科尔顿·沃奇和两位小伙伴一起创办了Mimir,这是一个大学计算机科学课程评分和师生反馈的AI工具,能够帮助教授上传课程大纲和作业、记录工作、评分并与学生互动评论。 到2017年,他们这个产品就有七十所大学使用了,包括凯斯西储大学、约翰霍普金斯大学和密歇根大学。 同年,他们三人就入选了福布斯教育类30岁以下30强榜单。 这个项目也入选了 Y Combinator创业加速器,在2019年,Mimir被HackerRank(美国一家知名的在线编程平台)收购,小哥就以工程经理的身份加入,带领团队推进新的项目计划。 怪不得他能从项目负责人的视角出发,对AI在真实工作场景的应用提出这么独到的分析。 话说回来,小哥也是告诉大家,happy work, happy life。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。