行业分类:
加载中...
头条分类:
加载中...
速腾聚创造出了“机器人之眼”,还开源了算法
作者 | 许丽思 编辑 | 漠影 机器人前瞻3月28日报道,今天,RoboSense速腾聚创发布机器人视觉全新品类Active Camera的首款产品AC1及AI-Ready生态,为行业提供机器人感知开发一站式解决方案。 在机器人、产业爆发的背景下,不仅人形机器人、机器狗快速发展,各类专用设备也迎来大规模的智能化升级,这一切对感知系统提出了更高的要求。传统的传感器堆叠造成的开发和量产难题仍待解决,此外,在AI驱动成为主流的时代,大量机器人开发者仍需要在基础软件的开发中“重复造轮子”,对开发周期带来了挑战。 AC1作为Active Camera系列的首款产品,将激光雷达、摄像头与IMU三大核心传感器进行时空同步融合,实现深度信息、视觉语义与运动姿态的硬件级数据整合,让机器人感知构型摆脱堆叠传感器的传统方法,进化为简洁高效、便于大规模量产的商用方案。 AC1还具备120°x60°融合感知视场(较传统3D相机提升70%)、70米超远测距能力(反射率10%低反物体20米精准检测),以及3cm@1sigma的稳定测距精度,可精准还原远近物体形状大小,帮助机器人实现准确的路径规划,使单设备即可满足机器人避障、建图、定位等全场景需求。 AI-Ready生态可以为开发者提供基础软件工具与开源算法,具体包括AC Studio、WIKI、数据集等板块,从而提升开发效率,缩短开发周期。 AC Studio一站式工具套件,提供包括驱动程序、节点数据采集、数据标定、数据融合、交叉编译在内的开源SDK,帮助开发者快速完成方案部署。 在开源算法方面,AC Studio提供定位、SLAM、3D高斯溅射、目标检测与识别、语义分割、点云与视觉融合、高阶多模态感知等核心算法,让开发者跳过基础算法开发,直接开展场景化功能化的二次开发。 同时,WIKI以开发者文档方式全面收录Active Camera与AI-Ready生态的信息;数据集提供多种场景下的训练数据,将在后续逐步上线,供开发者免费使用。AI-Ready生态帮助行业升级机器人项目流程,让软件快速迭代的开发模式驱动机器人产品化商业化落地。 开发者不仅可以使用AC1来满足人形机器人、无人机等机器人的感知需求,也可以用Active Camera输出的信息来构建数字孪生环境,完成3D扫描建模、环境监测、堆体监测等任务。在自动驾驶、工业机器人、家庭机器人等产品上,Active Camera也有巨大的开发潜能。 目前,Active Camera在内测阶段已与国家地方共建人形机器人创新中心、新加坡ARC实验室、灵宝CASBOT、华中科技大学、北京理工大学机构建立合作关系。
美媒:特斯拉、英伟达豪赌人形机器人 但中国已领先
宇树科技的G1人形机器人 凤凰网科技讯 北京时间3月28日,据CNBC报道,特斯拉、英伟达等美国科技巨头正竞相研发人形机器人,并不断强调它对未来经济的重要性。不过,分析师警告称,他们已经面临输给中国的风险。 所谓人形机器人就是外观和动作上像人类、由人工智能驱动的机器,它预计将在多个领域发挥作用,例如填补工业和服务业岗位的空缺。 随着英伟达CEO黄仁勋等科技领袖越来越多地提及这一概念,投资者对人形机器人的热情持续升温。本月早些时候,黄仁勋发布了一系列用于人形机器人开发的新技术,并宣告“通用机器人时代”的到来。 在机器人制造方面,特斯拉的人形机器人项目“擎天柱”(Optimus)似乎在美国领先,其CEO埃隆·马斯克(Elon Musk)宣布计划今年生产大约5000台。 电动汽车一幕再次上演? 不过,尽管马斯克雄心勃勃的计划可能会让其在Apptronik、波士顿动力等美国竞争对手尚未进入大众市场的情况下占得先机,但他将面临一个熟悉的竞争对手:中国。 上个月,杭州宇树科技曾通过电商平台京东短暂向消费者销售过两款人形机器人。上海公司智元机器人计划在今年生产5000台机器人,和特斯拉的目标一致。 黄仁勋在CES上宣传人形机器人 专家指出,就像比亚迪等中国电动汽车公司开始在年收入上超越特斯拉,利用价格优势冲击对手一样,类似的局面也可能在人形机器人领域上演。 独立研究与分析公司SemiAnalysis的分析师雷克·克努特森(Reyk Knuhtsen)表示:“中国有可能在人形机器人领域复制其在电动汽车行业所制造的颠覆性影响。然而,这一次,这种颠覆可能不仅仅局限于单一行业,可能会彻底改变劳动力本身。”SemiAnalysis专注于半导体和人工智能领域的研究与分析。 价格优势 摩根士丹利在2月份的研报中估计,根据配置和下游应用需求的不同,人形机器人当前的制造成本可能介于每台1万美元到30万美元之间。 然而,克努特森表示,凭借更强大的规模经济和制造能力,中国公司已经在价格上削弱了美国对手的竞争力。 例如,宇树科技在5月发布了面向消费者的G1人形机器人,起售价为1.6万美元。相比之下,摩根士丹利估计,特斯拉的Optimus Gen2人形机器人销售成本可能约为2万美元,而且前提还得是特斯拉能够扩大生产、缩短研发周期,并使用来自中国的高性价比组件。 今年1月,宇树科技在机器人领域引起了轰动。当时,该公司16台性能最为出色的H1人形机器人在春晚上与一群人类舞者一起庆祝春节。 技术进展快 有迹象表明,中国在人形机器人领域的进展远不止于此。摩根士丹利在2月份的研报中指出,过去五年,中国在涉及“人形机器人”的专利申请方面位居全球首位,共申请了5688项专利,远高于美国的1483项。 而且,小米等大型公司以及比亚迪、奇瑞和小鹏这样的电动汽车制造商也在涉足人形机器人领域。 “我们的研究表明,中国在人形机器人领域继续展现出最令人印象深刻的进展,创业公司受益于成熟的供应链、本地应用机会以及强有力的政策支持。”摩根士丹利在研报中称。 美银全球研究部大中华区汽车和工业研究主管李明勋(Ming Hsun Lee)指出,中国将人形机器人视为一个重要行业,因为它们有潜力缓解劳动力短缺问题。 “我认为在短期内,也就是三到四年的时间里,我们会看到人形机器人首先应用于生产线上,以替代部分工人;从中期来看,我们会看到它们逐渐渗透到服务业当中。”他表示。 马斯克曾预测,2025年,将有超过1000台或几千台擎天柱机器人在特斯拉工作。然而,比亚迪、吉利等中国电动汽车制造商已经在其工厂部署了一些宇树科技的人形机器人。 李明勋表示,随着人形机器人的普及,组件成本将下降得“非常快”。他还指出,中国在这类组件的供应链中占据大约70%的份额。 美国全面落后 根据SemiAnalysis在本月早些时候发布的报告,宇树机器人G1是“当前市面上唯一可用的人形机器人,完全不含美国组件。 报告警告称,中国是唯一一个有望从智能机器人系统(包括人形机器人)中获取经济利益的国家,这“对美国构成了生存威胁,因为美国在各个方面都落后了”。 “为了迎头赶上,美国公司必须迅速调动强大的制造和工业基础,无论是在国内还是通过盟国……对于特斯拉和类似公司来说,开始将组件采购和制造重新迁回本土或友岸外包可能是明智的选择,这样能减少对中国的依赖。”SemiAnalysis分析师克努特森表示。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
软硬件全栈自研率超高,魔法原子让人形机器人从“练兵场”走向通用
作者 | 许丽思 编辑 | 漠影 2025年,人形机器人产业正迎来历史性转折点。据摩根士丹利报告,全球人形机器人百强企业中中国占据63%份额,产业生态加速形成,政策红利持续释放——深圳、北京等地明确2027年量产万台目标,行业市场规模预计2035年突破万亿。 技术革新成为破局关键,而大模型与具身智能的融合,正推动机器人从专用功能向场景化智能演进。 3月26日,魔法原子在场景战略发布会上推出行业首创的端到端“原子万象大模型”,独家创建快慢双模协同架构模拟人类认知模式,融合多模态感知、自主导航与运动控制,让人形机器人能够在垂类场景中进行自主规划、自主作业。 软硬件全栈自研,是魔法原子自成立以来就一直坚定践行的发展线路。目前,其已经实现了人形机器人小麦90%以上零部件自研,特别是灵巧手和关节模组这两大核心部件,有分析机构预测,其有望使得产品成本降低60%到70%。魔法原子也成为了少数同时自研人形机器人本体和灵巧手的企业。 技术革新的背后,是魔法原子由需求驱动创新、由场景定义价值的核心研发逻辑。这种对场景的深刻洞察,使其已将人形机器人小麦应用到工厂、商场、会展、新闻传媒等多个领域,后续还将拓展1000个合作伙伴,打造1000个人形机器人落地应用场景。今年,魔法原子预计将有400台人形机器人进入工业、商业场景。 一、实现本体90%以上硬件自研,独创快慢双模协同架构大模型 早些年,波士顿动力Atlas凭借液压驱动的空翻动作惊艳世界,显示出其在动态平衡、复杂地形行走上的巨大优势时,让不少人对人形机器人进入真实场景充满期待。 但后来由于高功耗、高噪音、高维护成本等问题,使其难以进入大规模商业化应用。曾经风光无限的波士顿动力,最后也难逃几经转手后被现代汽车收购的命运。 人形机器人的根本技术路线变革,出现在2020年前后。随着电机技术逐渐成熟,以及功率限制和关节动力输出等难点被攻克,电驱人形机器人迎来了全新的机会,国内的新一波人形机器人浪潮也蓄势待发了。 正是在这个时候,魔法原子开始了自己在机器人领域的研发布局:魔法原子CEO吴长征是中国最早一批参与到四足机器狗研发的人,团队还在全球首次实现了单批次千台量产;后来开始自研人形机器人,并且将关节模组峰值扭矩做到了超过了500Nm,出色的爆发力使其成功实现了全球首个电驱人形机器人空翻。 除此之外,魔法原子采用高强度轻量化材料设计机器人本体,从而降低机器人整体重量,并且不断优化能量管理系统,提升机器人的续航能力。 今年年初,魔法原子发布第一代自研灵巧手产品MagicHand S01,可实现抓、握、双指操作等复杂动作,并支持20公斤以上的负载能力。 数年来在本体研发上的沉淀,让魔法原子的人形机器人小麦的成长速度越来越快:不仅能够实现仿人行走、跑步,还可以在奔跑状态下适应马路、跑道、草地、山坡等多种环境,走路速度从0.3m/s逐渐提升,目前跑步速度可以达到2m/s。值得一提的是,小麦已经实现了90%以上零部件自研。 但要让人形机器人能够在跨场景中处理各种需求、具备泛化操作能力,还需要配备强大的大脑。 吴长征强调,大模型是人形机器人实现能力进化的“智能引擎”,大模型结合机器人,未来机器人的智能化能力存在百倍、千倍、万倍增长的机会。因此,魔法原子坚持研发原子万象大模型,目标就是要构建具备环境适应能力的人形机器人。 原子万象大模型,融合了多模态感知、自主导航、操作抓取、运动控制等功能模块,在端到端框架中实现人形机器人在空间智能、语言智能和行为智能的有机统一。该模型通过模拟人类认知模式,让人形机器人具备了多维思考路径、持续学习机制与类人行为范式,能够在垂类场景中进行自主规划、自主作业。 更特别的是,该模型独家构建了快慢双模协同架构,这种架构理念源自自动驾驶领域的应用验证。具体来说,基于动作专家模型的“快系统”结合了端到端模型和经典控制方案,能够响应环境变化,保障机器人各个部位动作的精准性;基于多模态大模型的“慢系统”负责理解复杂环节,并规划长期任务。 快慢系统的协同,让人形机器人具备深度场景理解能力,可以精准处理语言逻辑、视觉信息及动态环境参数,同步实时运动。魔法原子副总裁陈春玉进一步解释,之前采取明确的指令传递的形式,但人类穷举的指令是有限的,所以现在采取的是特征的向量形式,让模型在任务执行过程中,通过特征向量对小脑运动技能进行规划。这种特征向量虽不可直接表达,但通过训练系统形成了端到端的闭环架构,实现大小脑系统协同,支持复杂任务的动态规划。 二、打造软硬一体的系统性交付,核心部件成本有望降低60%到70% 对人形机器人来说,硬件决定了物理能力的边界,软件则定义了智能的上限。回看魔法原子数年来对硬件与软件全栈自研的坚持,背后是对技术创新和行业本质的深刻洞察。 在吴长征看来,人形机器人的终局,一定是“软硬一体的系统性交付”。不同于智能手机依赖外部软件应用生态来拓展功能、实现“通用”,人形机器人如果要成为全能的物理世界执行者,必须要有一套统一的系统,能使其在多种场景中完成环境感知、理解指令、动作执行。这种深度整合的系统,本身就包含了硬件控制与软件智能。 而从行业发展逻辑来看,软硬件融合也是必然趋势。如果一家公司只做硬件本体,另一家只做系统软件,那么两者在交互效率、功能协同上必然存在鸿沟——就像让不同厂商的大脑和身体配合,短期难以实现真正的无缝高效协作。 尤其是当人形机器人发展到后期,技术路线收敛,可能还会存在一些没有软件能力的本体公司,但这类公司对纯粹系统软件的需求,很难形成规模优势。 因此,企业要想让人形机器人实现通用性,自身必须同时掌控硬件设计与系统开发,软硬件深度耦合,才能让机器人的每一个关节、每一个传感器都能被系统高效调度。 在人形机器人价格居高不下的情况下,坚持全栈自研也是企业推动降本的必然举措。陈春玉提到,特别是灵巧手和关节模组,这两个核心部件据人形机器人接近一半的成本。有分析机构预测,魔法原子通过自研灵巧手和关节模组,有望使得产品成本降低60%到70%。 在智能手机行业中,苹果的成功源于其打造的硬件、系统与生态的闭环,但手机的“通用”是通过外部应用实现的。陈春玉认为,人形机器人行业未来也可能形成类似的“苹果+开发者生态”模式——一边是人形机器人公司打造软硬件一体的整机产品,一边是开发者基于通用本体开发垂类技能,使用者可按需选择。 三、深化场景应用,从工具替代走向人机共生 今年以来,多家人形机器人厂商凭借以极具视觉冲击力的表演、极致运动能力触发公众传播情绪,火爆全球。但也引发不少对人形机器人何时能够实现商业化的疑问,行业的分水岭逐渐到来:到底是追求突破物理极限的运动控制能力,还是在真实场景深耕、技术回归现实需求更为重要? 具身智能的发展是为了让机器人具备高度智能,能自主理解环境、规划任务并执行操作,在这个过程中,机器人的环境适应能力和灵巧操作能力可以说是是重中之重。 越来越厂商开始让人形机器人去到汽车车间、3C制造工厂、物流工厂等实训、应用,例如不久前Figure推出首个VLA模型Helix,并将其应用到Figure 02人形机器人上,让机器人进物流工厂分拣快递。可以看出,当前机器人技术的突破方向呈现出朝着操作能力倾斜的趋势。 吴长征提到,“人形机器人行业的竞争终将回归到‘能否真正创造价值’”。魔法原子一直坚持从场景出发推动创新、让技术回归真实需求,造出来的机器人必须是“有用、易用、有人用”。研发团队一方面通过深入理解工业、商业服务等高需求场景中的实际情况,另一方面不断增强自身供应链的全环节能力,从而推动人形机器人小麦在多个场景中的实践应用。 从去年11月开始,小麦进驻家电制造工厂,在零部件上下料、物料搬运、点胶、产品检测等岗位实训,多个人形机器人还可以实现有序协同作业。从最初的视觉识别、位姿估计和轨迹规划的经典技术路线,进化到快慢双系统的技术路线,小麦已经成长为工厂中的“熟练工”。经过三个月的训练,小麦在高速数字马达上下料工序中的成功率和效率实现了多倍提升,比如在参与点胶工作时,成功率提升了3倍,超过了85%,展现出强大的工业应用潜力。 谈及为什么选择家电制造领域切入,吴长征解释道,家电制造存在“品种多、产线柔性需求高”的特性,既有简单场景,又有复杂场景。人形机器人需要大规模、群体性工序场景做数据采集、训练学习与能力验证,有利于加快人形机器人的落地时间。 在追觅的家电制造工厂中,通过持续采集生产环境中的真实数据,魔法原子已经累计形成数百万条高价值训练样本,这些数据还原了真实物理交互,真正让人形机器人从“能理解”进化到“能行动”。 以家电行业为起点,在家电制造的多样性场景中训练,小麦未来有望能够无缝切换覆盖到各行各业,成为更通用的人形机器人。 而在商业场景中,小麦的身影也出现得越来越频繁,展现了出色的视觉识别、理解和人机交互能力。 在3月的全国两会期间,小麦以特邀记者的身份在演播室与网友进行互动,在街头对路人进行随机采访;在汽车门店,小麦担任机器人导购,主动识别进店用户需求,再通过自然语言向用户介绍车辆参数、功能配置及优惠政策;在多场展会活动上,小麦还负责了迎宾接待、讲解等工作;在美容美发场景里,小麦还会根据用户的发质情况选择吹风机的不同模式。 陈春玉谈道,在大量场景实践的过程中,发现人形机器人存在交互延时、操作技能级有限等问题,团队后续会着重在人机交互流畅性、技能级、决策能力等方面进行优化。另外,为进一步加快人形机器人场景应用步伐,发布会上,魔法原子还宣布将启动“千景共创计划”,将拓展1000个合作伙伴,打造1000个人形机器人落地应用场景。 今年,魔法原子预计量产400台人形机器人。在陈春玉看来,人形机器人迈向量产的路上,还存在两大挑战:一方面是技术工程化问题,从样机过渡到批量生产,需要解决一致性、稳定性和可靠性问题。尽管人形机器人领域缺乏成熟经验,但可借鉴工业机器人、协作机器人及汽车行业的质量管理体系。另一方面,是应用场景拓展,量产后需验证场景需求的真实规模,这依赖于行业整体的技术突破情况。 当人形机器人从人类手里结果越来越多的活,人类又该如何看待与它之间的关系?吴长征觉得,双方从来就不是人形机器人替代人类的关系,人形机器人本质是工具,它的存在是替代现有的工具,比如工业场景中一些柔性作业能力差的工业机器人,帮助人类完成任务。 之后,人形机器人的能力不断延伸,能够解决技工人才短缺的问题。下一个阶段,随着智能化与泛化能力提升,它们将成为人类社会中的新角色——“硅基生命”,人类社会会逐渐进入“双生时代”。到那个时候,人形机器人不只是进工厂,而是可以帮助人类探索未知世界,能够去到深海、太空等极端环境,帮助人类拓展生存边界。 四、结语:技术自研加速通用化的飞轮效应 对魔法原子来说,自研的硬件性能突破、垂直场景的数据积累、软硬一体的系统耦合,三者相互叠加,形成加速通用化的飞轮效应,进一步构建起生态壁垒,也让机器人有望渗透至更广泛的场景。 当行业逐渐迈向规模商业化与量产,这种长期主义的自研积累,会让技术优势如“滚雪球”效应一样放大,加快人形机器人的应用,而应用又会反过来反哺人形机器人,助力人形机器人真正从专用设备变成通用的“硅基生命”。
大模型入门超全指南来了!人大团队力作,内附一线开发经验
作者 | 陈骏达 编辑 | 漠影 2025年,DeepSeek-R1的发布在国内AI领域掀起了一场前所未有的开源风暴。作为一款性能卓越的开源大模型,它不仅开放了模型的获取权限,还主动分享算法细节以及优化策略,激发了整个行业的开放共享热潮。 与此同时,科研论文、技术博客和开源社区的讨论如雨后春笋般涌现,这种开放透明的氛围极大地推动了AI科研知识的共享与传播,吸引了更多研究者和开发者参与到大模型的创新与应用中。 不过,对于刚刚入门大模型的初学者而言,这些论文、研究中涉及的诸多高阶概念或许意味着较高的认知挑战。 一方面,国内外主流AI教科书的成书或更新时间,大多早于本轮生成式AI浪潮,对新近AI技术的发展缺乏全面覆盖。 另一方面,许多大模型“Know How”只能从一线实践中获取,且需要大量算力的投入,但像DeepSeek这样愿意分享此类知识的AI企业,依旧是少数。 令人庆幸的是,已经有一批一线AI研究者在从事大模型基础知识和应用经验的普及工作。 在国内,中国人民大学的科研团队于2023年3月底发布A Survey of Large Language Models论文,全面综述了大模型界的最新研究成果,此后,这篇综述持续更新,截至2025年3月,已有整整16个版本,最新一版文章达144页,引用了1000余篇论文。 去年年底,由上述文章整理而来的《大语言模型》一书,在历经数月的编辑之后,由高等教育出版社正式出版。与英文综述文章的定位不同,修订后的中文版更关注为大模型学习者供整体的技术讲解,对内容上进行了大范围的更新与重组,力图展现一个系统的大模型技术框架和路线图。 《大语言模型》一书由中国人民大学高瓴人工智能学院赵鑫教授和文继荣教授领衔主编,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。 编者团队认为,大模型研发的众多训练细节无法从已有的科学文献中直接获取,通常需要开展实验进行摸索。但实际上,很多研究人员并没有充足的算力资源去完成一次完整的大规模预训练实验,无法获取一手经验,极大限制了学术界在此次AI技术发展中所起到的作用。 然而,学术界在AI研究中的独特价值依然不可替代,且需要在多个领域持续发声并贡献力量。学术界更为长远和多元的研究视角,可以在大模型的基础理论研究中发挥重要作用,或是深入探索如AI安全、AI治理这样短期内难以变现,但对人类未来至关重要的议题。 本书前言中有这么一句话:“人类社会的技术发展从不会因为某个公司或某个国家的技术封锁而停滞不前。”《大语言模型》一书的出版,恰好为学术界提供了获取一线大模型知识和实践经验的渠道。这本书全面覆盖了大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助读者全面掌握大语言模型的核心技术。 在核心算法技术的基础之上,编者团队还提供了大量的代码实战与讲解,同时搭配相关的开发工具包LLMBox与YuLan大模型,供读者深入阅读理解相关技术。 书中大量的可视化内容可帮助读者更好地理解相关概念,下方这张图表就呈现了基于LLaMA模型的各类衍生工作,通过继续预训练、指令微调等方法,LLaMA可以适配到不同的语言、多样的领域。 发布之际,《大语言模型》一书也得到了多位知名AI学者的推荐。北京智源人工智能研究院学术顾问委员会主任、美国国家工程院外籍院士张宏江称:“本书内容深入结合了编者在研发大模型过程中的第一手经验,……,可以作为深入学习大模型技术的参考书籍。”北京大学讲席教授、中国科学院院士鄂维南、清华大学智能科学讲席教授、中国工程院外籍院士张亚勤也为本书撰写了推荐语。 在AI技术飞速发展的当下,《大语言模型》的出版恰逢其时,相信无论是普通读者还是专业读者,都能从此书中获得关于AI前沿技术的最新见解。
国产算力的进击:百度智能云将上线三万卡昆仑芯集群
3月26日,在博鳌亚洲论坛2025年年会上,百度集团执行副总裁、百度智能云事业群总裁沈抖透露,百度智能云即将上线三万卡自研国产芯片昆仑芯集群,同时还在继续迭代模型。去年,百度已点亮了万卡的自研芯片昆仑芯P800。这标志着中国企业在人工智能算力领域,取得了新的重大突破。 而国产三万卡集群的启动和投入生产,为今年初以来,大模型应用的爆发和技术的进一步训练,提供了重要的算力保障。 与此同时,在当天的论坛上,沈抖呼吁,要把人工智能真正用起来。现在已有六成以上的央国企和百度合作,基于大模型做行业创新,但更多的企业并没有把大模型用起来。沈抖认为,中国最大优势就在于拥有丰富的应用场景,应该抓住这些应用场景,加速大模型的迭代和发展,真正让中国、让亚洲、让更多的人能用上领先的大模型。 01 大模型应用爆发,算力保障成关键 数智前线获悉,百度智能云即将投产的昆仑芯3万卡集群,一方面通过稳定的算力资源供应,避免因外部因素导致的断供风险,支撑了企业研发和生产的连续性;另一方面,也实现了更低的采购和维护成本,使更多企业,能够以更低的成本获得高性能计算资源。 三万卡大型集群的出现,也避免了计算资源闲置问题。利用云厂商的优势,通过大型集群,为众多企业提供服务,根据不同企业的需求,动态分配计算资源,实现多元算力支撑,企业即开即用。这不仅提高了资源利用率,也降低了企业使用云服务的成本。 这在当下尤为关键。去年以来,人工智能在深度推理、多模态等方面取得明显突破。业内的共识是,AI已成为全球产业变革的核心引擎,今年开年后,正在加速进入千家万户和千行百业,推动AI迈入全民普惠时代。AI推理迎来爆发式增长。 在这种情况下,大模型的应用落地和技术演进,都对可持续的算力保障提出更迫切的需求。 例如,今年开年后,政务在AI上动作极快。深圳福田提出“数智员工”,首批上线70名“数智员工”,“AI招商助手”将企业筛选分析时间缩至分钟级;福建漳州计划陆续推出30个“AI公务员”,聚焦教育、医疗、应急、环保、文旅等领域;北京市监局通过百度智能云千帆接 入DeepSeek,为企业登记注册提供全天候“咨询”。 业内人士告诉数智前线,更多城市看到AI对北京、杭州等地的产业带动后,在统筹政务系统建设中,将AI作为抓手。未来两三个月,不少城市的“一网通办”,将提供更多AI服务。 “在这一过程中,算力面临挑战。虽然DeepSeek等模型,对训练的算力要求降低了,但对推理的需求却增加了,因为满血模型的参数量不小,而且深度推理的‘自言自语’过程,相较于只给出一个答案,会消耗更多token。”资深人士告诉数智前线,“尤其是过去算力建设以训练为主,今年将转向推理为主,政务领域算力将面临一波升级。” 在教育领域,去年秋季以来,高校已成为智算采购大户。在AI for science领域,人工智能在提高科研的质量和产出,像上海交大与百度合作推进AI for science,在新材料发现等上有很大促进作用。 今年以来,不少高校快速接入DeepSeek,在尝鲜后,又将学校里的业务系统对接大模型,结果用户量迅速攀升,并发越来越大。一些高校在教学的实操环节,甚至提出“要为每一间教室分配一些算力”。同时,长尾需求也在暴增,一些双非院校或职校,包括学校的院系甚至教研组,都提出算力需求。 除了大语言模型落地带来的算力激增,今年各行业对多模态的需求,也在拉动算力基础设施的建设。 如宁德时代持续引入多种人工智能技术,展开数智化建设,通过AI技术,保证产线的良率与效率。国家电网联合百度等公司,推出千亿级多模态行业大模型,深入电网安全、新能源消纳及供电服务等核心场景。百度不久前推出的原生多模态大模型文心4.5,已迅速被引入各行业,它支撑的视频捕捉与智能分析,正在帮助连锁行业优化服务和食安管理。这都对算力提出大量多元化要求。 伴随大模型的应用深入,智能体也呈现爆发势头。今年Manus让大家看到了多智能体调用,个人和企业都展现出极大热情。百度近日全量上线国内首个对话式应用开发平台百度秒哒,上线24小时就吸引了超过2万用户体验,创建应用数量突破3万个,相当于每3秒就诞生1个应用。 一些业界人士预言,2025年不仅是智能体“元年”,或许也是智能体的爆发之年。智能体的普及,也正在推升算力需求。 但与激增的算力需求相比,当下国内AI算力供应紧缺。在中国市场,由于美国禁令,国外芯片的供应受到限制,并且由于全球人工智能需求旺盛,芯片交货缓慢、价格上涨。美国还在不断推出新政,进一步限制中国获取先进芯片技术。在这种情况下,中国亟需可持续供应的自主AI算力。 这也促使国产算力的脚步越走越快。在百度智能云三万卡集群月底点亮之外,昆仑芯服务器近日中标招商银行项目,将围绕多个核心业务场景,全面支持招商银行落地大模型应用。而这些多元化算力,将为互联网、金融、能源、工业、教育等众多领域,加速智能化转型,提供坚实的算力保障和支撑。 02 构建三万卡集群的拦路虎,如何击破? 三万卡集群建设,从硬件到软件,技术挑战是全方位的。结合昆仑芯以及百舸4.0的创新技术,在集群点亮过程中,解决了当下人工智能大规模集群面临的关键问题。 例如,包括DeepSeek在内的不少模型,采用了MoE(混合专家模型)架构,通过多专家并行和集群互联技术,降低了对高算力单卡的依赖,并在有限的算力和训练Token资源下,开发能耗更低、推理和训练效果更优的大模型。 根据介绍,昆仑芯P800基于新一代自研架构XPU-P,显存规格比同类主流GPU高出20%-50%,这对MoE架构更加友好。同时,支持了8bit推理、MLA(多头潜在注意力机制)、多专家并行等特性,这些特性实现更大的吞吐、更低时延,进一步降低集群训练及推理成本。 与此同时,百度百舸AI异构计算平台4.0,在3万卡集群建设中,围绕落地大模型全旅程的算力需求,发挥了至关重要的作用。 为了解决大模型训练时高通信带宽的需求,百舸4.0已构建了超大规模HPN高性能网络,将带宽有效性提升到90%以上。 3万卡集群能耗极高,常规的散热方案能耗可达十兆瓦或更高。为此,百舸采用了创新性散热方案,可以有效降低能耗,为企业的模型训练,进一步降低成本。 为了提升GPU 的有效利用率(通常用MFU来表示GPU的有效利用率),百舸不断优化并完善模型的分布式训练策略,将训练主流开源模型的集群MFU提升至58%。 大规模集群执行训练任务的稳定性非常关键。百舸可快速自动侦测到导致训练任务异常的节点故障。同时,通过百度自研的BCCL(百度集合通信库),能快速定位故障并自动化重新调度任务到健康节点,继续完成训练,目前已将故障恢复时间从小时级降低到分钟级,保障集群有效训练率达到98%。 这些技术最终确保了昆仑芯集群的“多、快、稳、省”。 在2025年两会期间,人工智能成为核心议题之一,政府工作报告明确提出“持续推进‘人工智能+’行动”,强调将数字技术与制造业实体经济深度融合,支持大模型广泛应用。这表明,以场景为核心,落地产业,已成为实现人工智能价值的关键路径。 不过,业界认为,大模型落地行业,还有很长的路要走。不少行业和企业在探索场景、治理数据,尝试多元的算力支撑,探讨AI落地价值,并进行人才储备。 在这样的形势下,大模型业界及生态,也在从底层算力、模型、工具链和应用,逐步构建起可持续、全方位的方案。而此次百度即将点亮的三万卡集群,为产业注入了强大动力,将进一步助推企业迎接新一轮科技和产业变革。
GPT-4o的多模态生图,让整个设计圈都开始emo了
GPT4o的多模态生图前天上线之后。 经过两天的发酵,含金量还在不断提升。 在我的群里,已经能看到越来越多的,进入到实际生产环节的例子。 比如@银海的直接做商品图的翻译和合成,这是原来的算法,很难做的效果,但是现在,有手就行。 非常复杂的电商流程,一张原始图,换产品换脸换衣服。 比如@歸藏的直接把UI图放样机里面的例子,如果做过UI或者产品设计的朋友肯定都知道,以前我们在做做展示,或者做汇报的时候,经常做样机做的挺痛苦的。 比如给他头像,画的两套表情包,是可以直接上架到微信表情商店的那种。 来自设计大佬@付遥,用GPT-4o来直接做之前非常流行的3D品牌海报。 比如我一个很喜欢的小红书AI博主@Rico有三猫,用GPT-4o给她做小红书封面。 也用GPT-4o直接做商品图翻译出海。 群友@默月佥在用GPT-4o出蜜蜂的解剖科普图。 一个很专业的公众号AI博主@阿真lrene,不仅用GPT-4o生成复杂的漫画,还能抠图,一键直出透明通道的PNG图。 干死各种抠图软件的不是更牛逼的抠图软件,而是大模型。。。 还有朋友@不知名网友虎子哥,用GPT-4o给他自己家的房子装修。。。 还有一些我确实不知道源头的但是被传播的蛮广的例子(如有作者,欢迎评论区认领)。 给几个家具做一个展示图,这个场景在电商领域无敌。 之前我写可灵的AI模特的时候,很多人问,能不能让模特带首饰?现在,可以了。 还用它,直接P图,消除人物。 老照片一键修复+上色。 甚至,还可以模仿字体做自体设计。 在GPT-4o的冲击下,N多的设计师和创业者,都有点emo了。 比如就有大佬在X上感叹道: 朋友圈里还看到了一张图,是glif的老板,在X上发的。 纪念ComfyUI,纪念一切的AI图像工作流。 OpenAI的一次更新,又屠杀了一堆公司。 又一次深刻的阐明了那句《三体》中的经典台词: 我消灭你,与你无关。 GPT-4o的冲击当然是有,但是,他的上限在哪?能做到什么地步?真的能彻底替代ComfyUI的AI图像工作流吗? 我想弄清楚这个答案。 首先我觉得我还是要跟大家非常简单的用一两句话解释一下ComfyUI,让大家知道这玩意是个啥,我们才好继续往下聊。 ComfyUI是一个非常专业的工作流工具,不局限于AI绘图,AI视频啥的也都可以往里面接。他的界面大概是这样的,很像电路板。 这个就是在Liblib上搭的ComfyUI工作流。 它是以节点方式,把各个工具、各个模型给串起来,形成一整套的工作流,比如一张图进去,经过各种节点和插件,输出一个完全风格不同的AI视频,这都是OK的。 坦率的讲,我不是ComfyUI的专家的,做过的工作流也不多,我觉得在这个领域,我并没有那么强的发言权,所以。 我去请教了一下我的1个好朋友,AI绘图大神@炼丹师忠忠。 我想听听,他的看法。 首先是,GPT-4o对电商设计的冲击到底有多大? 我跟忠忠聊了很久。 最后得到的结论,跟我自己在设计行业里感受到的水温差不多。 对于普通水平的电商设计师,肯定是有打击的,他们原有的技能水平也就只能产出跟gpt4o差不多的图,相对来说意义不大了。 上游的运营专员可以自己操作工具来生产一样质量的图。跟被冲击的插画师类似,可能会变为帮忙修补gpt4o产出的图的bug,还有叠加原图部分细节上去加强细节还原(类似于高低频修复流程)。 生产成本降低后,需求量会变大,原本用不起各种华丽背景图包装的商家,现在也用的起了。 从效果上极简操作就能生图的工具有美图设计室等一堆工具,GPT4o只是在某些效果方面更进一步而已,对于专业级的实际商业生产的影响可能没有那么大。 而从视觉设计角度,对现有的整个开源生态,反而是利好作用。 忠忠举了自己设计的公司IP的例子。 现在,可以一句话把IP的3D模型,直出到品牌海报上,不需要走以前的3D建模+渲染了,大大节省了时间。 同时,更有趣的一点是,GPT-4o可以根据一张IP草图,来生成这个IP的各角度视图。 而这些图,会进一步推动flux等开源模型的微调版本的效果。 你可能会问,都有GPT-4o了,为什么还要去微调flux,在ComfyUI搭工作流用呢?这不是脱裤子放屁多此一举呢? 其实有两个原因。 数据隐私性和精准性。 数据隐私很好解释,就是GPT-4o是一个闭源的模型,后面最多最多也就是开放一个API,让大家接到ComfyUI里面去用,但是,就OpenAI这个尿性,我们给过去的东西,大概率就成他后续的训练素材了。 举个例子,《流浪地球3》2027年上映,要是现在美术组把核心概念图或者设定图直接灌给GPT-4o做一些处理,到时候,《流浪地球3》电影还没上映,设定图你可以直接在GPT-5o里面让它画出来,这特么就炸了。。。 所以,数据隐私性至关重要,在真正的生产环境里,特别是一些大厂里,必须只能用本地的ComfyUI搭,真正的输出,必须是本地环境,用开源的模型。 所以,这个时候,我们就可以用一些不敏感的信息,扔给GPT-4o,来辅助生成数据集,反过来微调自己的flux模型,这个点,真的很有用。 精准性其实也很简单,我们回过头来看忠忠用GPT-4o输出的自己家IP的海报。 先不说其他的细节了,这几处,你是能发现一些明显的BUG的。 这其实在生产环境里,这种BUG是品牌方觉得不可能接受的,就想你给一个手机产品做广告,你把人手机弄变形了,你跟人说不行AI出得就是这样的,你看对面会不会把你挂在电风扇上转着打。 而这个时候,用Flux专门微调的Lora,是可以完美的解决这种精准性和一致性的问题的。 这其实就是普通设计场景和专业设计场景的区别。 GPT-4o当然可以替代大部分的普通工作流,会让ComfyUI里一大批的工作流失去价值,但是这就不代表,ComfyUI失去价值了。 很简单的一点是,在专业的设计工作里,纯对话式的简单界面满足不了复杂专业的需求的。 就像你问一个专业设计师,为什么设计是用PS做设计,而不用美图秀秀来做设计,对方只会把你当傻子。 在真正的专业的AI设计工作里,可控性,很多时候非常的重要。 需要精确的规定重绘区域,需要精确的调节风格效果,出图尺寸比例等,所以在专业生产中需要精确调节的细节,不能指望OpenAI全做成功能。 还有前后处理流程,比如说前置的裁剪,抠图,语义识别,后置的比如对图片的放大,贴回原图细节(高低频修复),再接入其他工作流继续处理等。 自动化一键完成的效率要比多轮对话高很多。 包括在一些精准度要求高的产品和场景上,GPT-4o目前还达不到专业级的水准。 看个例子。 比如我们要把问界M9这款车,换到另一个场景里。车这种产品,跟笔、戒指、香水等等要求的精细度,完全不一样。 这是GPT-4o出的图。 而如果我们用大佬的牛逼工作流呢? 生成出来的效果在整体比例和质感上,是更好的。 对比应该非常直观了。 这里我要给自己叠个甲,我并不是在这里鼓吹,GPT-4o不行,ComfyUI的效果可以吊打GPT-4o。 如果是这样的话,我也不会连更两篇,来给大家看一看,GPT-4o,有多酷,有多强。 我想说的是,GPT-4o,跟当年的SD、Midjorney、Runway、可灵等等AI工具是一样的。 会无差别替代所有这个行业里面的初级执行职位。 屠杀所有曾经在工程层面对大模型进行的一些优化。 然后,一点一点侵蚀更上层的建筑。 它更像是一层层汹涌上涨的潮水,将整个AI图像领域原有的边界打得支离破碎。 都说做AI产品,要看到大模型的边界,在边界之外的安全地带做。 但是现在,你根本不知道边界在何方。 那些看似高耸的技术壁垒与工作流程,如果只是基于简单组装或者初级执行的逻辑,正在被GPT-4o以近乎暴力的方式消解。 绝大多数机械式的制作工作,一旦被强大的多模态理解与生成替代,就会像那些轰然倒塌的围墙一样,被历史的风尘轻易覆盖。 有没有一种第一次工业革命时候,机器代替手工劳动的即视感? 历史总是在不断的重复。 可一如上文所言,这绝不代表ComfyUI之流就会被完全淘汰。 在工业级、专业级的深度工作流里,人们对数据安全、设计精度、可控度的需求不可能凭空消失。 那种图像与视频的多次处理、分层输出、版本管理、脚本化批量运行、自动化节点衔接,只要是大型企业或核心团队,都会很在意。 GPT-4o会在C端和中小B端市场里摧枯拉朽,取代了大量低端或者重复性工作。 而ComfyUI、Flux、ControlNet等开源生态则在更专业的领域继续进化,利用它们精细、可控、可离线部署的特性,为高端客户或机密项目提供服务。 这气势就像云端办公与本地办公的关系一样,前者无限便捷,后者安全可控。 也如同家用轿车与顶级跑车的分别,各自目标用户并不冲突。 GPT-4o也一定会不断进化,去扩大自己的边界蚕食更多的场景。 开源生态也会有各种可以复刻效果的模型、产品出来,从而进行私有化。 没什么能够阻止浪潮向前。 要么成为浪潮的追随者,要么成为浪潮的推手。 这二者,都肯定比做一块沉在海底的礁石,要精彩得多。 你说是吗。
999元!小米这新机,太狠了
前段时间,小雷自购了一副雷鸟V3智能眼镜,开启了关于智能眼镜的「新世界」。但在购买雷鸟V3之前,小雷其实还有一个备选——由小米在2024年3月推出的音频智能眼镜MIJIA智能音频眼镜悦享版。 当然,最后小雷还是选择了拥有拍摄功能的雷鸟V3。但错过米家智能眼镜也不完全是一件坏事——3月24日,小米正式上线了全新的米家智能音频眼镜2。 其实从功能上看,米家智能音频眼镜2较上一代的升级并不大,同样是音频方案的智能眼镜。但在设计上,米家智能音频眼镜2在上一代的基础上,做出了不少的改进。 图片来源:小米 首先,米家智能音频眼镜2「瘦身」效果堪称显著:眼镜整机重量打破了智能眼镜「30g」大关,只有27.9g。要知道小雷自己使用的非智能眼镜都有31g。光是在重量控制上,米家智能音频眼镜2就甩来了雷鸟V3、Meta、拍拍镜等产品一大截;即使和同属音频眼镜品类的界环相比,米家智能音频眼镜2也丝毫不落下风。 至于智能眼镜容易损坏的铰链部分,米家智能音频眼镜2也改用了「钢琴超弹铰链」,可以有效降低眼镜「夹头」的不适感。镜腿也经过了重新设计,最薄处只有5毫米,不会出现传统智能眼镜那种「卡耳朵」的情况。 图片来源:小米 至于功能方面的改进,米家智能音频眼镜2并没有带来太多的惊喜——除了新增的录音模式外,其余功能都和上一代产品保持一致,比如语音播报、小爱唤醒。售价方面,米家智能音频眼镜2定价1199元,众筹优惠价999元。 音频才是智能眼镜最「安全」的路线? 虽然米家智能音频眼镜2目前还处于众筹阶段,但从产品页面的细节中我们不难看出,米家智能音频眼镜2依旧出自国内知名的智能眼镜企业——蜂巢科技之手。事实上,小米上一代米家智能音频眼镜同样来自蜂巢科技。 而在为米家代工智能眼镜之外,蜂巢科技还经营着自己的「自营」智能眼镜品牌——界环。可以肯定的是,米家智能音频眼镜2这个设计,在不久后还会出现在界环的产品上,掀起音频智能眼镜的「换代」潮。 图片来源:小米 但问题也随之而来,界环发力音频方案智能眼镜,是因为蜂巢在该领域亦有丰富的技术积累。但对小米而言,智能眼镜本身就是挂在米家(MIJIA)而不是小米品牌下的产品,米家并没有界环这么重的「偶像包袱」,为什么小米依旧选择在音频智能眼镜领域发力,而不是像闪极一样,用「拍摄智能眼镜」为自己的智能眼镜产品试水呢? 在我看来,原因大致可以分为三点。 首先是技术难度的挑战。即使依靠供应商「贴牌」,做一副好的智能眼镜依旧是一件有难度的事情。根据小雷在CES 2025上的观察来看,尽管智能眼镜终端品牌有很多,但背后提供技术方案的品牌来来去去都只有那么几个,而他们的产品在完成度方面都只能算是「得过且过」。 去年年底仓促上线,结果在年初就收到大量差评的闪极拍拍镜就是最好的例子——即使市面上拥有成熟的射频供应商,但闪极仍有办法交出一款根本「没法用」的产品。 对闪极来说,智能眼镜只是玩玩看的试水项目,「黄了就黄了」,并不影响其在充电领域的品牌口碑。但小米和闪极不同,即使有米家这个生态链品牌作为缓冲,其在智能眼镜领域的用户评价也会直接影响到小米自己品牌的用户风评。更不用说小米自己也在准备做「小米智能眼镜」了。 对小米来说,米家智能音频眼镜2其实更像一个填补生态位的产品。对于这种「占位」产品来说,不出错,不把口碑搞坏,才是最重要的事情。 图片来源:小米 其次是价格方面的因素。在之前文章中,小雷已经介绍过智能眼镜的三个功能阶段(音频智能眼镜、拍摄智能眼镜、可视智能眼镜)了。就目前市面上的产品来说,拍摄智能眼镜的价格普遍在2000-3000元的区间内;而音频智能眼镜的价格要低得多,基本都在1000元以下,部份界环产品更是来到了700元的超低价位。 而界环在国内智能眼镜领域“断档”的销量也可以证明,在可视、拍摄智能眼镜功能参差不齐的大环境下,功能更简单、价格更低的音频智能眼镜才是大多数用户的首先。 最后是功能方面的考虑。除了剑走偏锋的闪极外,目前市面上成熟的智能眼镜平台只有高通骁龙AR1这一个,而根据高通的产品节奏,下一代AR芯片高概率会在今年上半年定型,于10月的骁龙峰会正式发布。在这一时间点,小米也不可能发布一款半年后就过时的产品——根据艾瑞的调查报告,国内用户更换眼镜的周期普遍为18个月。 在这一尴尬的时间点,将智能眼镜看作下一个风口的小米必然会将重头戏放在下半年的AR2眼镜上。至于上半年的米家音频眼镜,只要能保持住品类热度、不带来负面消息就行。在这种情况下,音频眼镜显然是最保险的路线。 小米会成为智能眼镜的价格屠夫吗? 当然了,即使小米真的在下半年拿出AR2智能眼镜的新品,其成功之路上还有许多问题需要解决。而其中最核心的问题,自然是未来「小米眼镜」的价格。 自从创立以来,小米一直以「价格屠夫」的形象示人,依靠极致性价比和扎实的供应链优势迅速打开市场。但小米价格屠夫的特性更多的还是体现在成熟市场环境下,对于智能眼镜这个完全新的、供应链与消费群体都还未成熟的新品类,小米还能延续价格屠夫的称号吗? 就小雷个人来看,至少在第二代产品出现之前,小米「价格屠夫」的路线都难以打通。 首先,骁龙AR2代表了当下AR/VR方向最前沿的技术路线,芯片模组成本较此前的骁龙XR2或AR1必然更高。即使小米不采用显示方案,只搭载最基本的摄像头,整机成本都不会比Meta RayBan、雷鸟V3等产品低。 另一方面,小米智能眼镜要面对的是一个不成熟的AR市场,因市面选择较少,所有产品都会被用户「集中火力」,用放大镜一点点审视,容错率却相对较低。这意味着小米难以缩减成本、用「性价比」的方式打开市场,必须先在核心技术和供应链方面投入巨大的资金与精力。 图片来源:小米 其次是供应链的问题。尽管小米背靠庞大的手机产品线,已在可穿戴市场积累了相当规模的出货量,对上游模组供应商拥有较强的话语权。但AR智能眼镜与手机、音频眼镜不同,产品形态和生产工艺都更加复杂。即便小米能把硬件成本降到相对可观的水平,仍需投入大量资源在软件算法和互动交互上,而这些又是短期内难以速成的环节。 在理想情况下,小米可以凭借雄厚的供应链和资金实力拿到更具优势的BOM价格,进而实现相对亲民的定价,撬动更广泛的消费者需求。但若技术、成本和市场培育出现任何一环的短板,最终呈现在消费者面前的产品体验就可能不达预期,进而折损小米的品牌口碑。 而从整个智能眼镜行业的角度看,目前行业推广的痛点仍是「功能跟不上预期、价格远超预算」。对有望改变智能眼镜行业的小米来说,只有当产品体验与性价比都不再仅仅是噱头后,智能眼镜才可能迎来真正的大众市场,这场「大佬分羹」的市场争夺战才会真正开始。
无线耳机成为电子配饰了,科技产品本该这么酷
1929 年,一位美国空军上尉和医疗设备公司博士伦合作,开发了一款镜片墨绿色的眼镜,作为抵挡高空眩光和紫外线的护目镜,提供给了飞行员。随后二战爆发,身穿皮夹克、戴着太阳眼镜的美国飞行员形象出现在世界各地,给世人带去了极其深刻的印象。 后来,博士伦墨镜演变成了现在知名的雷朋眼镜,开始面向大众推出配饰用的墨镜产品,并成就了奥黛丽·赫本在《蒂芙尼的早餐》中的经典形象,成为至今经久不衰的时尚潮流。 这样的演变在人类历史上时常发生:原本出于某种目的才穿戴在身上的「工具」,逐渐变成时尚界的宠儿。眼镜如此,戴在头上的耳机也是如此,已经成为了日常穿搭(OOTD)的一个重要元素。 所以,当我看到华为FreeBuds 6 这个流线型设计,还带有一颗大「水滴」的外观和配色,久违地有种眼前一亮的感觉。 美学和实用主义并举的外观 和市面上真无线耳机普遍采用耳机包+直线形耳机柄+黑白纯色塑料设计相比,华为FreeBuds 6 的外观可以用「出众」形容:总体流线型的设计,有点另类的「水滴形」耳机柄,特别的机身材质泛着金属光泽。 除了比较常规的「星空黑」和「天际白」配色,华为FreeBuds 6 水滴耳机还紧跟时下潮流,推出「极光紫」配色。 流线型的外观,加上金属的质感,也很容易让人想起这两年大热的「酸性设计」。这种融合了迷幻艺术和复古科技感的视觉风格,以高光的金属质感作为标志元素,常常用在潮流和数字艺术领域,是一种富含未来感和科技感的反主流美学。 曲线设计加上这个泛着银色光辉的「极光紫」配色,和《三体》中象征着外星高科技的「水滴」也颇有几分神似,更增添了一种当下无线耳机鲜少的科幻感。 对比以细长耳机柄和光滑塑料感为主的传统无线耳机设计,华为FreeBuds 6 水滴耳机确实称得上「反主流」,但对于华为来说,反倒是一种「家族基因」。 通过不同定位的产品成为不少用户心中的「无线耳机大厂」后,华为并没有止步,而是开始了耳机形态的全新探索,因此诞生了颇为异类的「水滴耳机」和 FreeClip「耳夹耳机」。 ▲ 华为FreeClip 耳机 华为FreeBuds 6 水滴耳机特别的形态,首先在外观设计层面就能给人带来一点不同,曲线流畅的耳机柄,加上金属质感的外观,远远看上去,仿佛佩戴了一对颇具潮流感的耳饰。 但在产品设计领域,没有人能突破「形式追随功能」的金科玉律。华为FreeBuds 6 水滴耳机这种「异形」设计的底层逻辑,同样是为了更好的佩戴体验和功能服务。 传统的半入耳式无线耳机,为了防止掉落,通常只能将上端的耳机包尽可能做大,卡在耳朵之中,虽然有效,但侵入的感觉更强,而且耳机重心也集中在上端,进一步影响佩戴体验。 由于采用圆润的水滴形设计,华为FreeBuds 6 水滴耳机的耳柄和耳机包能更好贴合耳道以及耳廓的曲线,也就是说,耳机两头双管齐下,让耳机能更好固定在耳朵之中,所以用「半开放式」而不是「半入耳式」来形容华为FreeBuds 6 要更加合适。 对比上一代,华为FreeBuds 6 的水滴耳杆要更小更薄,体积缩小 12%,耳机重量减少 9%,进一步让佩戴体验更舒适无感。 同时,水滴形的耳机包也能避免传统设计「头重脚轻」的情况,佩戴感受上更加均衡。 除了提升用户的佩戴体验,水滴这个外形设计也为华为FreeBuds 6 带来了更优化的机身空间,意味着配置和性能上的提升。 中看,也更中用 得益于更充裕的内部空间,华为FreeBuds 6 采用了「声学系统、控制系统、电池系统」独立拆分的设计,因此成为业界首个搭载双单元的半开放式耳机。自研的高音单元,叠加低音 Turbo 2.0 技术,让华为FreeBuds 6 在哪个频段都能有不错的体验。 用华为FreeBuds 6 的来听「煲机金曲」《渡口》时,从开头的鼓点就能感受到饱满的低频表现,人声也足够清晰,比较让我惊喜的是全新高音单元带来的高频听感,让编曲中的吉他声音更显清脆动听。 另一首「耳机试金石」《Blank Space》的表现也可圈可点:鼓点回弹细节丰富,高频部分的电子合成器不会太刺耳,偏中低频的人声也没有发糊的情况。 有好的硬件,自然要能播放更好的音乐。借助自研麒麟 A2 芯片,以及星闪连接核心技术加持,华为FreeBuds 6 可以实现最高 2.3Mbps 的无损传输。 FreeBuds 6 也是华为首款支持头部追踪空间音频的半开放式耳机,能够捕捉头部即使只是微小幅度的转动角度,实现「声随头动」的空间听感。 作为一款半开放式耳机,华为FreeBuds 6 的主动降噪表现让人惊喜。在办公室、咖啡厅、公园等不算非常嘈杂的环境中,FreeBuds 6 都能很好消除外界杂音和风噪,丝毫不逊色一些入耳式耳机。 更重要的是,开启主动降噪后,FreeBuds6 几乎不会带来很强的压迫感,因此长期佩戴也不会有太多不适。 除了听音降噪能力,FreeBuds 6 也继承了华为耳机在通话降噪方面的优秀基因。能消除 95dB 的环境噪音的双向静谧通话,实测在车水马龙的大街上通话,能够将人声清晰还原传输。 FreeBuds 6 作为华为首款半开放式悦彰耳机,音质表现和佩戴体验一样,都主打一个「舒服」,是适合大部分手机用户的好耳机。 为什么好耳机需要一个好外观? 兼顾科技和质感,一直以来都是华为可穿戴设备的重要路线:从将奢华融入智能的非凡大师蓝金表,到今天我们在谈的时尚和智能碰撞的耳机。 在上个月,华为FreeClip 耳夹耳机就携手中国设计师品牌 Sara Wong,一同登上米兰时装周的秀场,耳机与钻扣珠联璧合,为这场时尚盛会注入了前沿的科技潮流。 永远有人为品牌效应和时尚价值买单,耳机作为佩戴在最显眼的位置的设备,它的价值已经不止停留在单纯的功能方面,更成为穿着搭配之中的重要环节。 所以,单纯用「耳机」来形容华为FreeBuds 6,似乎不是那么准确,我更愿称之为「电子配饰」。华为发布会现场,也提供了一些电子配饰的 DIY 思路,陈列了和耳机一起搭配使用的配饰套装「心芒系列」「蝴蝶系列」「爱之刃系列」,进一步加强耳机的时尚属性。 ▲ 华为FreeBuds 6 「星空黑」配色和「爱之刃」耳饰 近日,人气偶像希林娜依·高佩戴华为FreeBuds 6 的时尚芭莎硬照上线,更加夯实了这款产品潮流单品的定位。 在真无线耳机兴起之初,就已经不只是一种「后 3.5 接口」时代的替代方案,和传统的有线耳机相比,使用方式更简洁、可能性更多的无线耳机,就已经是一种未来生活方式的象征,除了功能还有情绪价值。 九年过去,真无线耳机洗去科幻感,成为大部分人都司空见惯的普通产品,如何重赋其魅力,成为了厂商除了音质和功能探索的下一步。 华为的答案,就是 FreeBuds 6——舒适的聆听体验和时尚潮流的设计,用「电子配饰」的潮流提醒我们,科技产品本就该这么酷。
阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用
作者 | 程茜 编辑 | 心缘 智东西3月28日报道,阿里大模型表情包军团再添猛将!今日凌晨,大模型“劳模”阿里云通义团队发布其首款视觉推理模型QVQ-Max。 在数学问题、生活常识、编程代码、艺术创作等场景,该模型可以看懂图片和视频里的内容,还能结合这些信息进行分析、推理,并给出解决方案。 例如,QVQ-Max可以协助用户在工作中完成数据分析、信息整理、编程写代码等任务,帮助学生解答配有图表的数学、物理等科目的难题,并通过直观的方式讲解复杂概念,在生活中根据衣柜照片推荐穿搭方案、基于食谱图片指导用户烹饪。 用户只需上传任何图像或视频然后提出问题,点击 “思考 ”按钮,即可查看它如何逐步处理视觉信息。 多模态数学问题的数据集MathVision可以用来评估模型解决复杂数学问题的能力,研究人员发现,模型思考的token数越长,其MathVision的准确度就会越高。 博客中提到,他们设计QVQ-Max的目标,就是让它成为一个既“眼尖”又“脑快”的助手,帮助用户解决各种实际问题。 体验地址:https://chat.qwen.ai/ 一、秀多图识别、数学推理、看视频学习编程技能 阿里通义团队在博客中放出了几个新鲜的QVQ-Max演示案例。 首先是多图识别,QVQ-Max可以描述图片中的景色,并且通过分析图片信息找到这两张图片的相关之处。 其次是数学推理,这道难题需要模型从图片中找问题和答案,QVQ-Max通过分析其余8个数字之间的关系,得出了最后一格的数字应该是10的正确答案。 第三个是让QVQ-Max看手相,感情线、生命线、事业线分析得头头是道。 第四个考验了模型的视频理解能力,演示中模型对一个简笔画的蜗牛视频进行了分析,然后为这条视频创建了贴合的字幕。 最后一个是让QVQ-Max看视频自学编程,在观看了一个类似贪吃蛇的小游戏视频后,QVQ-Max很快就复刻了一个类似游戏,给出了完整的代码。 二、观察细致入微、深入分析,还能灵活创作 QVQ-Max的能力可以总结为三个方面:细致观察、深入推理和灵活应用。 细致观察方面,QVQ-Max能快速识别出复杂图表、日常随手拍照片中的关键元素,例如它可以找到图片中有哪些物品、有什么文字标识等。 深入推理就是让模型基于看到的内容进行分析,然后结合背景知识得出结论。例如,在一道几何题中,它可以根据题目附带的图形推导出答案;在一段视频里,它能根据画面内容推测出接下来可能发生的情节。 除了分析和推理,QVQ-Max还可以灵活应用这些能力进行创作,例如帮助用户设计插画、生成短视频脚本、创作角色扮演的内容,或者化身评论家、占卜师。 这使得其在用户工作、学习、生活中的应用场景增多。 一般而言,大模型在回答问题、写文章、生成代码时主要依赖文字输入。 但现实生活中,很多信息并不只是用文字表达,而是图片、图表、视频、文字交互出现,并且图片中包含的信息会比文字更直观、更复杂,如其中的颜色、形状、位置关系等。例如用户分析建筑图纸时,仅靠文字描述是无法判断其合理性的,需要结合图纸以及专业知识分析,这也是阿里通用团队研究视觉推理模型的原因。 结语:视觉推理模型的演进方向:更准确观察、视觉Agent、交互多元 目前发布的QVQ-Max是阿里通义视觉推理模型的第一版,未来,研究人员会重点关注以下几个方向:通过视觉内容的校验来检查观察内容的准确性提高识别能力;通过视觉Agent提升模型在处理多步和更复杂的任务,如手机电脑操控,玩游戏;让模型在思考和交互中不局限于文字,还可以涵盖更多的模态,比如工具校验,视觉生成等。 作为一款能看懂又能深度推理的视觉模型,QVQ-Max已经展现出了完成创造性任务的应用潜力。
安卓系统开源时代终结,影响几何?
3 月 27 日,谷歌宣布将逐步停止维护安卓开源项目(AOSP),这一决定标志着安卓(Android)系统长达 17 年的开源时代正式终结。作为全球超 30 亿台智能设备的底层框架,AOSP 曾为小米 HyperOS、vivo OriginOS 等国产定制系统提供核心支持,更成为开发者自由创新的基石。如今,谷歌将所有开发工作转向内部闭源分支,仅向签署 GMS 协议的厂商开放代码,这一转变引发行业震动。 谷歌闭源决策的背后 成本控制与资源再分配是谷歌决策的直接动因。据内部文件显示,AOSP 维护涉及超 3000 万行代码、200 多个并行开发分支及全球数千名开发者协作,仅 2024 年运维成本即达 8.3 亿美元。2025 年初安卓部门裁员 15% 后,闭源策略可大幅简化开发流程,将资源转向 AI 大模型等新兴领域。东吴证券分析师李跃指出,在 AI 研发投入激增的背景下,安卓部门需要通过缩减开支提升利润率,闭源是必然选择。 晟云磐盾信息技术有限公司总裁郝峻晟在接受《中国电子报》记者采访时分析称:“谷歌有自己的手机品牌(Nexus和Pixel系列),但市占率并不高。停止开源,向苹果学习构建封闭生态,一方面可以让其自有手机品牌得到更大程度的保护,另一方面也能有效降低维护操作系统的成本。” 另有观点指出,随着AI大模型与操作系统的深度整合,闭源策略使谷歌能更灵活地部署Gemini AI助手、隐私计算框架等核心技术,避免开源带来的技术泄露风险。未来安卓或将演变为“AI操作系统即服务”的订阅模式。 从更深层次的商业逻辑来看,谷歌此举或许意在抢夺生态控制权。通过要求厂商签署 GMS 协议(含 Google Play 服务捆绑条款),谷歌可将广告分成比例从 15% 提升至 30%,预计每年增收 50 亿美元。目前全球 37% 的非认证安卓设备(如廉价手机、智能家居、车载系统)将被迫回归谷歌生态,成为新的“现金牛”。过去,这些厂商可以免费使用开源安卓项目去开发产品,而无需预装谷歌服务或者通过谷歌的兼容性测试。但是现在,他们要么被迫与谷歌签订协议,接受更高的成本和更严格的控制,要么继续使用旧代码,冒着产品性能和安全性落后的风险,还可能面临推送机制、界面交互、AI 功能等全方位割裂。 此外,记者了解到,美国司法部正推动拆分谷歌业务(如 Chrome),闭源安卓可降低欧盟《数字市场法案》强制开放应用侧载等条款的影响,巩固对移动生态的控制。欧盟竞争委员会前官员玛丽亚・加西亚表示:“谷歌通过技术壁垒强化生态粘性,既降低合规成本,又能维持服务垄断地位。” 带来哪些影响? 尽管谷歌动作激进,但主流手机厂商反应却相当平静。小米、三星、OPPO 等头部品牌凭借既有 GMS 协议仍可获取闭源代码,系统更新与 GMS 预装不受影响。某国内厂商向记者表示:“合作照旧,现有协议已覆盖后续开发支持。” 真正受冲击的是未签约的中小厂商和第三方开发者。 “安卓停止开源对那些开发能力比较弱的手机厂商会带来比较大的影响。”郝峻晟表示。由于Android 已经存在相当程度的碎片化情况,开发者为了适配各版本系统、各品牌机型,需要获得不同厂商的系统代码,以及设备作为测试机。这对于中小型厂商而言是一笔不小的成本,他们大概率只能被迫接受谷歌条款或支付授权费。比如印度低价手机品牌 Lava,一直凭借基于 AOSP 开发的廉价手机在印度市场占据一定份额,如今却因无法获取系统更新,面临着被迫退出市场的困境。 与此同时,LineageOS、Pixel Experience 等依赖 AOSP 实时代码更新的知名开源项目,未来只能基于旧版本维护,无法获取最新安全补丁,功能迭代将面临停滞的风险。北京某开发者论坛调研显示,86% 的受访者认为闭源将导致系统漏洞修复延迟,XDA 社区热帖涌现 “安卓已死”的悲观论调。 知名开发者Evan Blass 直言:“这相当于给开源社区戴上了 GPS 脚环,我们能看到路线图却无权修改导航路径。”开源倡议组织 OSI 执行董事西蒙・菲尔德批评道:“谷歌违背了开源精神,但我们将分叉代码打造独立系统,证明开放生态仍有生命力。” 对于普通消费者而言,短期体验无虞,长期面临同质化风险。业内人士分析认为,短期内,普通用户不会感受到系统更新或应用商店的变化,但第三方应用市场(如 F-Droid)可能消亡,低价机型涨价,设备选择减少。 值得关注的是,谷歌的闭源决策也可能成为国产操作系统的“催化剂”。华为鸿蒙已脱离安卓生态独立发展,其开源版 OpenHarmony 在智能家居、车机领域加速布局。东吴证券预测,2026 年鸿蒙设备装机量有望突破 5 亿台,占据全球市场 15% 份额。小米、OPPO 等厂商虽未明确转向,但已加强自研系统投入,试图构建新操作系统生态。统信软件的 UOS 操作系统、麒麟软件的麒麟操作系统等,也在政府、金融、教育等关键领域得到了广泛应用。 可以说,此次谷歌的决策是开源理想与商业利益的终极碰撞,短期内看似巩固了谷歌的控制权,但从长远看,可能倒逼全球科技企业加速实现技术突破,重塑移动操作系统格局。在这场变革中,伴随开源、闭源之间的博弈加剧,全球移动操作系统市场可能会逐渐形成一个更加多元化的竞争格局。
蚂蚁数科CTO王维:可信智能体是产业AI规模化落地“必选项”
作者 | ZeR0 编辑 | 漠影 智东西3月28日报道,今日,在中关村论坛“未来产业创新发展论坛”上,蚂蚁数科CTO王维谈道:“在产业化场景中,任何一个小错误都可能导致巨大的损失。因此,通过可信技术搭建可靠、可控、可优化的智能体应用,将会成为产业规模化应用AI必需的基础设施。” 王维认为,随着智能体时代的到来,企业服务产品的底层逻辑即将发生根本性改变。企业需要的产品正从工具属性的SaaS(Software-as-a-Service软件即服务)快速走向能独立完成工作交付的SaS(Service-as-Software服务即软件)。如何有效地搭建起AI生产力,是产业AI应用破局的关键。 但智能体真正落地企业场景仍存在极大挑战。由于企业场景的的复杂性和低容错特点,智能体落地除了复杂知识工程问题,还要解决大模型在场景中的“水土不服”,且即便在智能体投入使用后,还需要完成自我优化,以匹配不断变化的市场需求。 而解题的关键,在于可信可靠的智能体技术基础设施。 “底座的可信才能确保企业可以更容易地开发和部署智能体,真正在企业内打造一个由智能体组成的‘行业专家团队’。” 王维强调。 据王维透露,可信智能体技术是蚂蚁数科为产业量身定制的智能体技术底座,该技术在大模型侧、智能体供给侧、智能体执行侧及场景评测和归因环节发挥作用,确保知识工程可信、行业推理可信、知识库可信、交互可信及评测归因可信。 在可信智能体技术支撑下,蚂蚁数科已经推出一套贯通算力-数据-模型-应用全链条的一站式企业级智能体开发平台,支持企业零代码、低代码、高代码灵活开发,按需部署并实现开箱即用。该平台在严谨行业复杂场景进行了大规模验证。 据悉,在金融领域,该平台已经与多个金融核心企业达成合作,年内将批量部署交付。 去年蚂蚁数科正式从蚂蚁集团独立运营以来,其CEO赵闻飙在内外部多次透露未来对AI to B业务的布局信心,他指出,ToB智能体应用将进入爆发期,80%的应用将基于AI开发,智能体将直接进入生产力环节提升效率创造价值。 蚂蚁数科正在推进AI大模型业务的发展,日前刚刚发布了能源电力时序大模型EnergyTS,在光伏场景发电量预测中,准确率超越谷歌、亚马逊等行业主流的通用时序模型。其CEO赵闻飙则有深厚的技术背景,其曾获得及申报技术专利一百三十余项,还荣获过“吴文俊人工智能自然科学奖一等奖”、“浙江省科技进步一等奖”等多项有影响力的科技奖项。
苹果小米华为旗舰“信号”大PK:地铁、电梯都能胜任?
对今天的生活而言,智能手机有多么重要,已经是一个不言自明的问题。 我们用它联系远方的亲朋好友,支付生活中的一切,组队玩游戏刷视频获得快乐。毋庸置疑,手机成为了我们身体的延伸,某种意义上的“器官”。 它的重要,在所有的移动终端里,没有之一。 然而,凡事最怕“卡壳”。 前段时间出差,我在深圳站里头,和身在老家的母亲视频通话的时候,就遇到了画面卡住、声音断断续续的问题,一看手机顶栏的信号图标就发现:信号又不行了。 这样的场景显然不是个例,尽管随着城市化的进程,日常生活中已经很少有真正意义上的信号盲区,但受限于各种复杂环境、个体因素的影响,绝大部分用户还是会遇到信号差甚至无信号的问题,这样的场景或许并不真的“要命”,但却足以令人感到焦虑无比。 而在制造这些焦虑的产品中,被人们吐槽最多的可能就是 iPhone,如果把几台旗舰手机摆在一起,信号最好的可能还有些争议,但信号最差的大家似乎已经不言自明了。 不过,今年这个情况可能迎来一些改观。 (图源:苹果) 在经历了数年的爆料后,iPhone 16e直到今年二月才姗姗来迟,与其同时落地的,还有那颗让人望眼欲穿的苹果自研基带C1,号称接盘英特尔、狂烧几十亿,投入千人团队、历时七年开发的实验性芯片。 别的不说,苹果打磨了这么久才有第一代产品,小雷个人对这颗基带的期待还是挺高的 于是乎,为了探究这颗基带的真实实力,也为了搞清楚现在苹果、安卓和鸿蒙手机在信号上究竟还有多少差距,我精心选出了三款近期发布的代表性产品,想是时候给你们一个最真实的旗舰新品信号横评了! 2025年,那我们自然得测今年发布的旗舰产品,再考虑到苹果、安卓和鸿蒙三大阵营的独特性,最终选出来的横评机型就是下面这三款产品: 2025年2月19日发布的iPhone 16e,采用A18仿生芯片和自研C1基带,售价4499元起。 (图源:雷科技) 2025年2月27日发布的小米15 Ultra,采用骁龙8至尊版芯片和X80 5G基带,售价6499元起。 (图源:雷科技) 最后是2025年3月20日发布的华为Pura X,采用麒麟9020芯片和自研基带,售价7499元起。 (图源:雷科技) iPhone 16e、小米15 Ultra、华为Pura X,25年新春三大旗舰机,谁的信号表现最拉胯,最的表现最亮眼?看PK。 搭载联通5G卡,挑战广州3号线 为了控制变量,我们让三款手机都插入中国联通的5G手机卡,而且它们用的都是5G套餐,不会出现人为限速的状况,三款手机的蜂窝网络保持默认设置,自动连接最高速率的网络。 测试场景的话,这次我们找了四个场景,分别是代表多人室内的“办公室”,代表信号死角的“地下停车场”,堪比密闭铁笼的“老旧货梯”以及很多人的信号恶梦——“广州三号线”。 针对这些场景,我们设置了四个测试项目: 基础测速,首先,我们读取三款手机在对应场景的信号强度,然后我们选择中国信通院开发的“全球网测”作为测速软件,服务器选择的是“广州电信”,为了更直观地呈现真实网速,速率单位小雷改成了更好理解的“MB/s”,而非默认的“Mbps”。 (图源:雷科技) 之所以不用更知名的SpeedTest,一方面是因为它暂时无法选择小雷所在的广州本地服务器,测试出的速率可能会打折扣,另一方面是因为HarmonyOS 5目前支持的正经测速软件也就“全球网测”这一款,横评肯定是要控制常量的。 拨号通话,这个比较基础,在同样的位置试着拨打电话半分钟,确保对方在一个网络良好的环境下通话,主要看是否接通、是否有中断,再保证通话质量,根据双方体验给予评分。 刷短视频,使用抖音视频流来测试,加载出一条就滑走一条,看看在一分钟内能加载出几条短视频。 观看直播,打开哔哩哔哩的英雄联盟赛事直播,切换到原画画质,然后观看一分半钟,看看三款手机切换到原画画质后要多久才能完成缓冲,然后记录过程中出现缓冲的次数和总耗时。 公平起见,每台机子测试前还是老样子,都会开关一遍飞行模式来手动初始化网络,确保手机自动连接上最好的基站;且每一项都用录屏(或截屏)来记录存档,也方便后面的数据复验。 确定了测什么、怎么测,那接下来春季旗舰新品网络信号横评,这就启动! “人多机杂”的办公室:有无遮挡很关键 老样子,我们还是“就地取材”,直接从我们办公室所处的网络环境开始测。 别看室内场景好像没啥特别的,我们办公室位处广州市天河区,周围几乎全部都是高层办公园区,甚至还有一个人口密度拉满的城中村,尽管基站覆盖率高,信号常年显示满格,但是由于网络较为拥挤、室内信号环境复杂且遮挡情况较为严重,实际体验还挺有压力的。 开始进行测试,我们先看看信号强度,这里主要看RSRP(参考信号接收功率),它是一个负数,单位是dBm,绝对值越小,信号越好。 (图源:雷科技) 根据中国移动测试要求,RSRP>-80dBm,代表手机信号很好;RSRP=-80~-89dBm,说明手机信号好;RSRP=-90~-99dBm,表示手机信号一般;RSRP=-100~-109dBm,可将手机信号判断为差;RSRP<-110dBm,手机基本上处于无信号状态。 实测,在我的工位上,iPhone 16e测得信号为-92dBM、小米15 Ultra为-82dBM,而华为Pura X则为-80dBM,三台机子的信号强度都比较接近,属于是手机信号正常的水平,但苹果偶尔会突然跳到-114dBM的样子,体验不太稳定。 三款手机的测速表现都比较一般,其中华为表现最好,下载速率能够达到27.87MB/s,小米时延表现最佳,而苹果的速度、时延都中规中矩,所有机子似乎都无法达到37.5MB/s的标准5G网络水平。 (图源:雷科技) 因为信号稳定,在这种情况下拨号通话肯定是没问题的,那么短视频的体验又如何呢? 小雷在这里无脑刷了整整一分钟短视频,除了华为Pura X偶尔会出现一次加载缓冲以外,另外两款机子在体验上都没啥问题,只要我能保证手指不停刷新,基本都能刷个45-50条的样子,这个数值在后面可以作为参考。 (图源:雷科技) 值得一提的是,这些都是我在工位上测试出来的结果,如果愿意挪动脚步,来到相对宽敞、没有遮挡、更没有各种无线信号干扰的园区里,那三款产品的网络速率都能做到接近37.5MB/s的5G标准水平。 只能说,有无遮挡,还真是决定网速快慢的关键。 死角密布的地下停车场:比预期中好不少 离开办公室,接着是“地下停车场”的场景。 正好,我们所在的园区附近就有个地下车库,上班停在那边的哥们说,那里的信号基本上是个断断续续的情况,正好可以试一下。 结果令人比较惊讶,三款产品在地下车库的信号强度居然都还不错,也没有出现过断联或者是突然切换到4G网络的情况,只能说旗舰手机在信号这块确实都是有一点保障的。 (图源:雷科技) 但是信号好不代表网速就一定高,从测速看,这里三台机子的下行速率最多也就能跑到10MB/s,华为Pura X要比小米、iPhone快一点,但是小米的时延和上行速率表现都是相对最佳的。 (图源:雷科技) 实际体验的话,拨号电话、网络信号都没啥问题,肯定不影响基础体验。 其他方面的话...我想,也不会真的有人蹲在地下车库就为了刷个短视频吧。 说实话,现在大城市地下信号网络覆盖其实也已经很成熟了,想在广州商场车库这找到一个真正的断联地带,其实并不容易,要是大伙有什么好地方推荐,也欢迎在留言里告诉我们。 信号被屏蔽的老旧货梯:偶有间歇断联 要说信号差的地方,还有个地方不得不提,那就是“升降电梯”。 那些比较新的大厦电梯还不行,一般来说几家运营商都会针对性地在里面覆盖室内天线,比如小雷所在的园区里,几个正常电梯都可以保证全程不断网,信号覆盖还是挺不错的。 真要评测,就得找那种墙特别厚的货梯来试一下。 你别说,像这样的金属外壳升降梯,本身就是个法拉第笼,无线电波很难穿透金属的电梯厢体,在踏入电梯的一瞬间,三台手机的信号都收到了不同程度的影响,没法像之前一样维持信号稳定的表象。 (图源:雷科技) 打开网速测试,你会发现三款手机的网速都迅速降了下来,下行速率都只有20MB/s左右,尽管小米15 Ultra信号栏还亮着“5G”的图标,但这明显已经是4G的网络速率了,可以说是纯粹的众生平等。 (图源:雷科技) 幸好,拨号电话依然没啥问题,即便在打电话的情况下进入货梯,三款手机也不会出现断联的现象。 有趣的是,即便是在这样的网速下,依然有两款机子可以正常看B站原画直播,就是刷短视频的时候会出现时不时卡一下的现象。 高度拥堵的地铁站:稳定比强度更重要 在地铁上刷手机,是无数上班族在通勤路上最常见的消磨时光的方式,也是对旗舰手机信号能力的一场大考。 相信我,我曾住在距离公司有一个小时以上车程的地方,个中心酸我最清楚。 要说广州地铁开通运营的十多条线路里,哪一条最拥挤的话,可能一号线和三号线还会有一点争议的声音,但要是问哪一条线的网络口碑最差,那还得是三号线最有含金量。 为此,小雷踏进了广州三号线的始发站天河客运站。 (图源:雷科技) 列车尚未启动时,网络肉眼可见的流畅,打开测试软件,华为Pura X的下行速率一下子飙升到72.42MB/s,上行速率也超过了15.25MB/s,让小雷不禁怀疑方圆两米之内就有一台5G基站。 在地铁这个场景下,小米15 Ultra的下行速率可以跑到49.81MB/s,iPhone 16e的下行速率可以跑到49.60MB/s,基本都是顶着5G网络理论速度去跑的,只是和华为Pura X间仍有一定差距罢了。 (图源:雷科技) 列车启动后,三款手机信号立刻锐减,4G信号很快就跳了出来。 在列车行进的状态下,华为Pura X的下行速率最低来到了8.35MB/s,另外两款机子也在伯仲之间。 (图源:雷科技) 在这种情况下,反而是小米出了一点状况,在进出隧道的时候,网络测速居然失败了一次,但是拨打电话并没有出现什么问题,也没怎么影响看在线直播和刷短视频的体验。 不禁感慨现今的5G建设力度,即便是地铁上也能愉快地刷视频了。 总结:苹果表现不差,外部因素影响最大 好,所有测试场景的数据看完。 事实上,你很难说这四款机型哪个绝对更好,毕竟大家都有在测试里翻车的情况,而且在日常使用的场景里表现也都比较稳定。 (图源:雷科技) 在这三款产品里头,iPhone 16e的表现确实并不算突出,主要的问题在于基站切换并没有国产旗舰那么积极,而且信号强度也会稍逊一筹,胜在它是这里最国际化的机型,网络频段支持是这里最丰富的,基本能做到走遍全球都能用。 或许因为都是旗舰产品,华为Pura X在这次测试中的表现属于“稍好一些”,但也没有到高人一档的那种水平,当然了,从三者之中最稳定的信号强度和最快的网络测速上,我们还是可以看出他们在网络方面的技术积淀和深厚的软硬件优化功力。 最后是小米这边,虽然在一些网络测速中似乎不占什么优势,但是在每个场景都有几乎如一的体验,在整体稳定性上还是稳超苹果的,再加上它6499元的起售价,本身就是挺有性价比的Ultra旗舰。 值得一提的是,在测试过程中我们发现,比起手机本身,用户所处的环境同样值得关注。 举个例子,如果遇到下雨天气,由于空气中水的密度变大,信号的穿透力会变弱,手机信号自然就会变差;当你在室内、高楼、地下车库,或是在人群密集的地方,由于信号拥堵和遮挡屏障的存在,手机能够接收到的信号也会变少;至于一些信号盲区或是存在电磁干扰的地方,那更是手机信号能力有多强也无能为力。 在排除上述外界因素的情况下,信号已经很难成为影响用户选购手机的关键因素了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。