行业分类:
加载中...
头条分类:
加载中...
官方回应泰山机器狗将取代挑山工:取代不了 只是运送垃圾
快科技3月26日消息,据报道,以往,泰山之上的货物搬运工作,主要依赖人力完成。挑山工们肩负着沉重的担子,在那蜿蜒曲折、崎岖难行的山路上艰难跋涉。 如今,机器狗的加入,打破了原有的搬运格局。这一智能机器装备展现出了非凡的适应能力,能够在复杂多变的山地地形中灵活穿梭。 其爬坡速度令人惊叹,相较于人工搬运,足足快了一倍之多,并且可以适应泰山上80%的山道路段。凭借这些优势,机器狗极大地提升了货物的运输效率。 随着泰山机器狗受到越来越多的关注,一个颇具争议性的话题也随之浮出水面:机器狗是否会全面取代挑山工呢? 事实上,机器狗的逐渐普及,确实让挑山工这一群体陷入了严峻的困境之中。挑山工们大多年龄偏大,长期从事体力搬运工作,导致他们技能较为单一。在科技飞速发展的当下,这样的技能结构使得他们在就业市场中缺乏竞争力,难以适应新兴的就业环境。更为现实的是,机器狗的出现,直接导致了他们的收入明显减少,甚至部分挑山工面临着失业的风险。 对此,泰山文旅工作人员及时作出了回应。工作人员明确表示,机器狗虽然在货物搬运方面展现出一定的优势,但从实际工作情况来看,它根本无法完全替代人工。 目前,机器狗的主要工作范畴仅仅局限于转运垃圾。而且,在机器狗执行任务的过程中,必须要有专人在一旁进行遥控操作,这意味着人工在整个流程中依然扮演着不可或缺的关键角色 。
人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛
注意看,机器人像人一样从容地走出大门了! 甚至,还有一整支机器人队伍迎面走来。 人形机器人独角兽Figure,再次带来他们的新成果——利用强化学习实现自然人形行走。 跟之前版本的机器人相比,确实更像人了许多,而且步态更加轻盈,速度也更快。 网友们纷纷表示被惊艳到,甚至觉得像是太空行走。 有一说一,自从与OpenAI取消合作后,这成果输出确实又快又多。 机器人像人一样自然行走 此次推出的,是经过强化学习训练的端到端神经网络。 根据官方介绍,主要分成三个部分: 强化学习:强化学习利用模拟试验和错误,教Figure 02 人形机器人如何像人一样行走。 模拟训练:通过高保真物理模拟器学习如何像人类一样行走,结果只需几个小时就能模拟出多年的数据。 Sim-to-Real:通过将仿真中的域随机化与机器人上的高频扭矩反馈相结合,模拟训练无需额外调整即可直接转换为真实硬件。 具体来看。 首先,利用强化学习技术,在GPU加速物理仿真中对新的行走控制器进行了全面训练,并在几个小时内收集了数年的仿真演示数据。 在模拟器中,数以千计的Figure 02机器人被并行模拟,每个机器人都有独特的物理参数。 然后,这些机器人将暴露在它们可能遇到的各种场景中,并通过单一神经网络策略学习如何操作它们。这包括遇到各种地形、致动器动态变化以及对绊倒、滑倒和推搡的反应。 使用强化学习学习到的策略可能会趋近于次优控制策略,无法捕捉到人类行走的风格属性。这包括以类似人类的步态行走,脚跟着地、脚尖离开、手臂摆动与腿部运动同步。 于是他们通过奖励机器人模仿人类的行走参考轨迹,将这种偏好注入到学习框架。这些轨迹为策略允许产生的行走方式建立了先验,而额外的奖励条款则优化了速度跟踪、功耗以及对外部扰动和地形变化的鲁棒性。 最后一步是将策略从模拟中提取出来,应用到真正的仿人机器人中。仿真机器人充其量只是高维机电系统的近似值,在仿真中训练的策略只能保证在这些仿真机器人上有效。 为了弥补这一 “模拟到现实的差距”,他们在模拟中结合使用了域随机化和机器人上的kHz-速率扭矩反馈控制。 域随机化通过随机化每个机器人的物理属性,模拟策略可能需要运行的各种系统,从而弥合模拟与现实之间的差距。这有助于该策略在不进行任何额外微调的情况下,实现与物理机器人的 “零接触”。 用kHz速率闭环扭矩控制来运行策略输出,以补偿执行器建模中的误差。该策略对机器人与机器人之间的变化、表面摩擦力和外部推动力的变化都很稳健,在整个Figure 02 机器人群中实现了可重复的仿人行走。 于是乎,就看到了10个机器人同一步态行走,没有任何调整或变化。 接下来,他们计划将这一技术扩展到数千个 Figure 机器人。 人形机器人越来越像人了 之所以这次选择对机器人步态的改善,Figure创始人也说了,这并非是他们的首要任务,只是之前网友吐槽得多了,他们最终目标是商业运送机器人。 By the way,今年伊始海内外的人形机器人都密集亮相,诸多大厂企业开始投身机器人的布局当中,这不今天同一天,vivo宣布成立机器人Lab。 在这些机器人持续整活之中,能够看到他们举手投足之间着实越来越像人了。 且不说跟大爷一样在公园遛弯、跑步、二人转之类。 还学会了人类的一些空翻、托马斯全旋等等杂技。 你还期待人形机器人哪些地方可以像人的?
英特尔前CEO帕特・基辛格力挺继任者陈立武,抨击华尔街“短视”
IT之家 3月26日消息,英特尔前CEO帕特・基辛格表达了对英特尔的坚定支持,并希望自己的继任者陈立武能够完成他所开启的工作。 基辛格在接受CNBC采访中表示:“我始终致力于英特尔的复兴,也希望亲自完成这一任务。现在,公司董事会、团队以及陈立武正在继续推进,我当然全力支持他们,因为英特尔对整个半导体行业,甚至对美国来说都至关重要。因此,我对他们完成这项重要使命寄予厚望。” 英特尔的转型面临重重挑战,尤其是资金压力和市场预期的影响,使得变革难上加难。基辛格指出,其中最大的难题之一是建设下一代晶圆厂所需的巨额资金。他强调,自己提出的“IDM 2.0”战略(IT之家注:继续生产自家芯片同时承接外部客户的代工业务)仍然是正确的方向。但他也承认,这一模式对任何公司而言都极具挑战,因为资金需求庞大,资本回报周期漫长。 随着英特尔的核心业务下滑速度超出预期,公司不得不依赖外部资金来推动转型。基辛格坦言,要建立下一代晶圆厂,资金需求极为庞大,投资回报周期漫长,这对任何公司来说都是沉重的负担。而英特尔的核心业务恶化速度比很多人预期的更快,因此,公司迫切需要外部资金支持。 基辛格还批评了资本市场的短视,认为这与英特尔的长期转型目标存在冲突。他指出,在推进一项长达数年的战略变革的同时,还要满足季度财报的市场预期,这种平衡极为困难,而这正是陈立武在未来几个季度必须面对的挑战。 “华尔街的短期导向让这项任务变得更加艰巨,所以我衷心祝愿英特尔和陈立武能够完成这场至关重要的转型。作为一家处于变革中的上市公司CEO,必须在长达五年的战略规划和每个季度的财务考核之间找到平衡,同时还要面对资本市场的压力 —— 这无疑是世界上最具挑战性的工作之一。” 尽管已经离开英特尔,基辛格仍然希望这家自己奉献了数十年的公司能够成功,并相信其当前的发展方向是正确的。他重申,将全力支持董事会和陈立武继续推进IDM 2.0计划。
爆火的大模型一体机,炒作or真需求?
大模型,正在重塑“一体机”这个原本小众的服务器产品。 “之前行业对一体机的需求非常少。”科大讯飞智算业务部副总经理许昀对光锥智能说道,“而现在的需求远超预期。” 自开年以来,随着DeepSeek大模型的爆火,也点燃了大模型一体机市场的爆发。 据IDC统计,市场上已迅速有接近百家厂商推出AI一体机产品,包括新华三等服务器厂商、京东云、百度智能云等云服务提供商、科大讯飞等行业应用开发商及大模型技术供应商等各路玩家。 一体机厂商在机场打广告 大模型一体机是一个专为人工智能大模型应用和部署而设计的集成计算设备,通常包含中央处理器(CPU)、图形处理器(GPU)、存储器、操作系统、AI平台软件及各类模型算法等软硬组件,可以理解为一个小型独立的服务器,既能够让大模型开箱即用,还能够保证数据安全。 这些玩家推出各种集成DeepSeek大模型为主的大模型一体机,并以各自不同的竞争优势切入不同的行业场景应用之中。 从产品类型上看,市场上目前爆火的大模型一体机,更多是以集成DeepSeek大模型为主,包括32B、70B以及671B满血版等,整体售价大概在十几万元到百万元之间不等。 “华为四卡机器售价15万多,底层硬件是鲲鹏CPU+昇腾,内置DeepSeek-70B大模型,集成问答助手、知识库等功能,可同时支持30个人并发。”一位大模型一体机销售商对光锥智能表示,“而搭配DeepSeek-671B大模型的一体机售价则超过200万元。” 事实上,在IT基础设施中,一体机并不是一个全新产品,此前也存在着数据库一体机等产品,但整体市场需求却始终是不温不火。 而这一波大模型一体机爆发背后,则是受DeepSeek影响,及大模型小型化和算力小型化的发展趋势,通过“软硬协同、开箱即用”的特性,能够满足企业在专一的业务场景中,低成本使用大模型的需求,解决了企业AI部署中的数据安全、算力成本和场景适配三大痛点。 不过,尽管大模型一体机供给方的市场热度颇高,“但实际上在行业落地还需要时间。”许昀说道,“毕竟现阶段大多数企业还处于试点阶段,行业适配还需要时间,预计半年左右时间,真实的市场需求才会爆发出来。” Gartner研究总监张吟铃也表示:“很多企业并未算清楚部署大模型一体机的投资回报比,也因此很多对大模型使用场景经过研究的大型企业对大模型一体机的投资并不多,整体行业还处在一个前期。” 那么,本质上仍属于AI服务器类型的大模型一体机,还能够持续火多久?各类玩家在其中又将以什么样的角色进行争夺战? 一体机需求暴增, 众多玩家开抢市场 2025年,被看作是大模型落地应用暴发的一年,一体机作为底层算力支持的服务器,也成为众多企业拓展大模型落地应用的关键一环。 据浙商证券最新测算,预计2025年至2027年,一体机的需求量将分别达到15万台、39万台和72万台,在央国企的市场空间有望达到1236亿元、2937亿元和5208亿元。 而为了抢夺更多的大模型市场,包括AI服务器厂商、云计算厂商,以及行业应用和大模型技术公司,纷纷开始布局大模型一体机市场,发布相关系列产品。 硬件厂商中,大致可以分为两大类型,一个是以新华三为例的AI服务器厂商,一个则是以华为为例的国产芯片厂商,前者可以提供集成化的产品,而后者更多是提供底层芯片支持。 以新华三为例,其截至目前已经发布了多种大模型一体机产品: 一种是集成DeepSeek大模型的一体机,包括覆盖14B至671B规模的灵犀Cube大模型一体机,搭载DeepSeek V3、R1模型,支持671B大模型单机推理及训推一体服务UniCube; 另外一种则是为特定行业定制的大模型一体机,如与数字政通合作的城市治理大模型一体机,与泛微合作的协同办公大模型一体机,以及与百度健康合作的医疗大模型一体机等。 相比较来说,新华三作为服务器厂商,硬件优势明显,自主研发的服务器如 H3C UniServer R5330 G7和R5500,能够支持高性能GPU,提供灵活的拓扑架构,兼容多种模型,并且,硬件厂商也会注重软硬件集成,优化了性能和兼容性,减少用户的配置成本。 另外,硬件层面可以很明显地看到,国产化则成为大模型一体机的重要趋势,而以华为昇腾、海光、寒武纪等为主的国产芯片,也成为了众多行业客户打造大模型一体机的底层硬件配置首选。 在华为中国合作伙伴大会2025上,华为董事、ICT BG CEO杨超斌表示,目前已有超80家伙伴基于昇腾打造开箱即用的大模型一体机,并通过极简部署和灵活配置,满足企业多样化的需求。 除硬件厂商外,云厂商可以说是布局Deepseek大模型一体机最激进的玩家。 据不完全统计,包括三大运营商云、百度智能云、京东云、火山引擎、浪潮云、阿里云等众多云厂商,都已经推出了大模型一体机产品。 目前云厂商们的大模型一体机基本可以分为两大类型,一是适配DeepSeek标准版(蒸馏版,32B或70B),一个则是适配DeepSeek满血版(671B),并以此为基础适配不同行业场景。 如京东云针对金融场景,银行、券商行业建议适配满血版,保险和基金则建议适配基础版。 而百度智能云则是按照千帆和百舸两大平台细分大模型一体机,百舸一体机以算力效率和成本控制为核心,而千帆一体机则侧重模型开发的便捷性与应用生态的丰富性。 一方面,云厂商可以针对不同场景推出各种细分的大模型一体机,能够覆盖更多细分场景的用户需求,同时,云厂商还可以结合自身的云服务生态、弹性算力等,为用户提供更多支持。 事实上,云厂商如此积极地抢占大模型一体机市场,这背后归根结底,则是因为“国内云厂商很难放弃私有化部署这块蛋糕,这是其非常重要的营收之一。”张吟铃对光锥智能说道。 毕竟,在当前中国市场中,即使公有云发展这么多年,企业私有化部署的需求仍始终存在。 此前一位头部云厂商战略规划人士认为,公共云是未来5年-10年的发展方向。但在未来3年,中国云市场核心增长点是私有云、混合云。 也正因此,对于大多数云厂商来说,企业私有化部署市场是一块还没有“啃”下来的蛋糕,而大模型一体机市场的爆发,则给云厂商们提供了机会。 在大模型一体机市场中,还有一类玩家,就是以科大讯飞为例的行业应用及大模型技术厂商,相比于硬件厂商的硬件优势、云厂商的生态优势,其核心竞争力则聚焦在技术和行业理解上。 这些厂商不仅有自己的基座大模型能力,还能够根据行业特定,对开源大模型进行微调,并以此沉淀出了很多细分场景的行业大模型。 比如近期科大讯飞的星火深度推理模型X1的全面升级,并基于星火X1首发星火医疗大模型X1,其大模型一体机也推出了针对政务、警务、司法、医疗、高教等五个应用场景的一体机产品。 “(一体机)需要与行业软件做深度结合。”许昀说道,“而对于同类型的大模型厂商,则看谁能够具有更深的行业理解,实现差异化竞争优势。” 从硬件厂商,到云厂商,再到大模型厂商,大模型一体机市场的爆火,政企客户爆发式的需求,仿佛是开启了一场抢夺大模型落地应用的“盛宴”。 但从市场需求方来看,更多企业还处于前期试点阶段,真正的市场需要远未真正爆发出来。而对于大多数企业来说,大模型一体机的应用,真的能够带来更高的商业价值吗? 超细分场景应用,一体机商业价值待验证 一体机市场的突然爆火,主要得益于DeepSeek这一波热度的带动。 一方面,DeepSeek爆火之后,让更多政企客户自上而下了解大模型的能力,更愿意尝试进行大模型的落地应用,这也使得“大模型的整个需求池子变大了,需求面变广了。”许昀说道。 另一方面,更为重要的一点是,此前很多企业的业务场景都需要对数据隐私安全负责,而受限于数据安全合规等因素影响,都未轻易尝试将大模型与业务结合。 可以说,DeepSeek刺激了企业对大模型“轻量级”的私有化部署需求,让预算有限的小场景小需求,都能用上大模型。 因此,综合市场信息也可以看到,目前大模型一体机的市场需求,更多地来自金融、政企、医疗、教育等对数据安全要求较高和工业等对延时较为敏感的应用场景,尤其是金融、政务等领域的客户对大模型一体机的需求尤为旺盛。 但大模型一体机所能够提供的大模型能力和算力支持是有限的,也正因此,目前在各行业场景中,真正能够应用一体机的,都是在某一个行业中特别细分的场景。 “一体机的应用可能是在一些非常细的领域,因为在大的行业中,每一个细分领域里针对模型的参数量的要求和需求都不一样。”许昀说道,“所以我们会从具体的行业场景中再筛选出不同细分的场景进行一体机适配。” 如在大企业之下会存在很多小部门,其中财务部对数据隐私安全要求较高,就可以使用一体机进行大模型的私有化部署,而通过小部门的试点,企业最后可以再决定是否要建设大型算力中心。 还有一些企业的IT部门部署一台一体机,做企业内部知识库的检索,或者是做一些对话的操作系统等,以及利用大模型来提升员工的工作效率等。 “现阶段接触的客户中,对满血版一体机的需求冲动也非常大,但在落地的过程中也会存在疑问——部署一体机的应用场景是什么?”许昀说道,“因此,不同的场景对一体机的诉求都不同,要根据行业场景进行因地制宜。” 从一体机客户来说,大多数对隐私不敏感的中小企业,更多地还是使用便宜弹性的公有云,而对于一些存在长期需求,比如需要使用大模型的总结归纳能力来读取其他家公司的财报,且并不想将其放在公有云场景下的,则可以部署一体机。 对于大型企业,一般会构建自己独立的智算平台,而想要在细分的场景中部署一体机,还需要考虑与自身其他智能算力平台如何协同管理的难题。 如果说智算中心是一个满汉全席,那一体机更像是地方小吃。所以,大模型一体机真的能够撑起一个独立的市场吗? “现阶段,企业部署DeepSeek一体机后,可以用作增长业务的场景其实非常少,更多用于效能提升”张吟铃说道,“目前企业处于一个内部从上到下尝试部署的过程中。” 张吟铃直言对未来一体机赛道保持谨慎态度:“一体机的底层逻辑还是服务器硬件加软件,上层搭载的大模型开发部署平台能够让企业部署AI更便利,但当企业在使用大模型进入到成熟期后,需要扩展资源用作更多场景部署,企业则需要面对使用同一软件平台去纳管不同种类一体机的挑战,若企业已经选择了一套软件平台,则需要增加更多服务器即可。” 不过,从商业化逻辑来看,对于像科大讯飞这样的厂商来看,其与硬件厂商的本质区别,就是不依靠硬件挣钱,而是赚取软件服务费用,以及带动客户从细分市场向其他项目转换的营收。 从具体使用来看,行业客户目前对一体机也存在两极分化的评价:一方面认为一体机能够满足自己在某一个细分行业上的需求,整体实现的效果也还不错;另一方面则因为没有找到与行业能够深度结合的点,且部署一体机的价格也并不是很便宜,觉得一体机效果不好。 当前大模型一体机的应用主要聚焦在细分行业中的细场景下,而其是否真的能够给企业带来真正的降本增效,以及未来市场潜力如何,都还存疑。 而大模型一体机从能用,到好用,再到真正解决企业实际问题,还需要一段时间。 走,去行业深处! 事实上,行业中对大模型一体机是否能够真正发挥大模型性能也存在诸多讨论。 有位业内人士表示:“目前,大部分卖单机的都没有考虑并行策略、跨节点通信开销优化,就好比江南七怪一起上也是战五渣,但是全真七子一个很弱,七个摆阵就能跟黄药师不分上下,因为天罡北斗阵做集群优化。” 但尽管如此,当前DeepSeek一体机仍是满天飞。不过,一体机现阶段更多地还是满足客户的情绪价值:本地化、开箱即用、专属性,并做更多的场景尝试,尤其是政企市场。 而围绕着DeepSeek一体机的上下游也变得火热起来,很多做算力服务器的销售商,也开始大力推销一体机,但最终真的签单落地的,却并不多。 且真实现状是,有大多数官宣部署了DeepSeek大模型的企业,实际上却只是进行了前期测试。 许昀也对光锥智能直言:“我们现在只是看到了市场需求,但很多都还在做一体机的试点,行业适配还需要时间,所以现阶段一体机实际订货量暂时还没有明确的数据。” 但许昀却也坚定地看好大模型一体机赛道。 在他看来,随着当前越来越多小版本大模型的推出,会更适合以一体机的形式进行部署,毕竟其性价比非常有优势,“现在软件和硬件都在不停地进步,所以未来一定会在某一个时间点,有一些非常好用的垂类模型,能够放在专用的一体机上。” 而一体机的未来,一定是在行业上纵深发展,毕竟,只有这样才能够降低模型尺寸的同时,还能够把效果做到最优。
员工两年减少4.5万,被逼上楼顶的孕妇,揭开阿里大瘦身另一面
阿里正全力聚焦电商与AI两大主业,战略调整的背后是收缩、裁减。孕妇维权事件,折射出大公司转型中的个体困境。战略的一粒灰,落在员工身上就是一座山。 3月24日,一位孕妇坐到了广州市海珠区阿里中心大厦顶楼。 事件发酵后,淘宝买菜做出回应称,广州区域业务调整,部分岗位变化,其中涉及服务公司“仁励窝人力资源服务(广州)有限公司”的一位生态员工(待产期)。 阿里方面明确表示,该员工并未被辞退,并根据相关法律规定,照常发放在岗工资。 如果不是被逼无奈,没有人会走到这一步。而选择阿里作为目标,可以放大关注度,为自己谋求更多的权益。 阿里是躺枪的一方,但这起事件却与阿里最近两年的战略有关联。 2024年二季度到四季度,阿里已经实现1176亿净利润,几乎达到了疫情期间的水准。这个数字,是阿里连续两年大瘦身的结果。 1 战略撤退,“派遣”首当其冲 这次“阿里被裁孕妇顶楼维权”事件,有两个关键的信息点。 一个是,该员工并非阿里正式员工,而是“阿里巴巴生态员工”,评论区将其称为劳务派遣员工。一般是通过外包公司或灵活用工平台与阿里巴巴建立合作关系,为阿里巴巴提供服务。 劳务派遣员工可以说是整个工种的“底层”,工作多、收入少、工作不稳定。按照规定,用工单位应当严格控制劳务派遣用工数量,使用的被派遣劳动者数量不得超过其用工总量的10%。 这位孕妇本身的权益就缺少保障,在遇到集团层面的调整时,自然不会得到足够的重视。 而第二个信息正是淘宝买菜的业务调整。淘宝买菜的前身是“淘菜菜”,2023年5月底,次日自提业务淘菜菜与小时到家业务淘鲜达整合升级为淘宝买菜。是阿里进行即时零售大战时的重要战略布局。 但面对拼多多、美团等强敌,淘宝买菜没能取得理想的效果。如今,在阿里聚焦主业的大战略下,淘宝买菜不得不做出调整。 据报道,淘宝买菜已将次日自提服务模式调整为快递到家模式。有网友表示,成都、沈阳、青岛等多地的淘菜菜自提点关闭。 不只是淘宝买菜,整个本地零售业务,阿里都进行了调整。去年年底到今年1月,阿里在半个月内敲定两笔出售。 12月17日,阿里将银泰100%的股权向由雅戈尔集团和银泰管理团队成员组成的购买方财团出售。所得款项总额约为74亿元,预计在银泰身上亏掉93亿元。 1月1日,阿里宣布以最高约131.38亿港元出售所持高鑫零售全部股权。 此外,从2023年下半年开始,饿了么、盒马也频繁传出卖身的消息。 2016年,马云曾在高调提出“五新”战略:新零售、新技术、新制造、新金融、新能源。新零售放到了第一位,而如今,外部环境变化剧烈,阿里不得不进行战略层面的调整,这个词已经走到了边缘。 2 马云的千字长文 2024年4月,阿里对荡气回肠的战略转型进行了阶段性的回应。 蔡崇信站到镜头前,坦然说出了“阿里落后了,因为我们忘记了我们真正的客户是谁”。马云随后在内部长文中表示,“阿里会改,阿里会变”。这是马云在退休5年后首次发布如此长篇幅的内容。虽然名义上淡出了管理,但在关键的战略转型期,需要马云稳定军心。 阿里这两位灵魂人物的表态,宣告了阿里进入聚焦主业、大瘦身的关键阶段。 吴泳铭确立了“用户为先、AI驱动”两大重心,电商与AI业务成为阿里发力的重点,与这两部分关联度弱的投资和业务板块,都面临着生死抉择。 美年健康、分众传媒、居然之家、千方科技一夜之间完成了股权转让,圆通速递、红星美凯龙、丽人丽妆也先后发生权益变动,几天内,阿里完成了持股层面的瘦身。 在港美股,阿里先后减持小鹏汽车、快狗打车、B站的股权,非核心资产相继被出售。 阿里缩减了对外投资的频次,根据IT桔子的数据,阿里2021年进行了50次对外投资,到2023年降至19次,2024年进一步降至17次。 在内部,阿里巴巴曾重金投入打造“元境”团队,遭遇了裁员,阿里对元宇宙战略上进行了重大调整。再加上对银泰和高鑫零售的剥离,阿里快速处理了边缘业务。 聚焦主业的动作下,阿里的费用开支有明显变化。研发费用比率从2022财年的6.5%降至2024财年前三财季的5.6%;一般及行政费用比率从4.9%进一步降至4.5%。虽然只有几个百分点的变动,但背后却是几十亿级别的调整。 瘦身的成效很明显,第四季度,阿里净利润达到491亿,这是2020年第三季度以来的新高。阿里的毛利率罕见地达到了42%。净利润率达到了16.6%,连续两个季度达到两位数。 被牺牲的业务、被收缩的费用开支、亮眼的利润表现背后,是数万员工的无奈。 截至2024年12月31日,阿里的员工总数194320人,一个季度减少3671人,粗略看每个月都有上千人离开。而在2022年员工总数为239740人,转型两年,员工减少45420人。正式员工尚且减少了这么多,劳务派遣更是如此。 马云在长文中说,改革和创新是痛苦的,因为改革要付出代价,组织的改变和重组涉及到每一位员工。 战略调整的一粒灰,落到身处其中的员工身上都是一座山。孕妇维权事件,只是将这种现状暴露出来。 3 阿里的新宠儿 阿里的战略聚焦并没有结束。 去年11月21日,阿里成立电商事业群,蒋凡担任CEO,一口气掌管淘宝、天猫、国际业务、1688、闲鱼等业务。在喊话张大奕事件后,蒋凡被“发配”到国际业务。在蒋凡的带领下,国际业务保持高速增长。2024年第四季度,国际业务实现营收377.6亿,同比增长32%,是阿里六大板块中增速最快的业务。将淘天、国际、1688和闲鱼交给蒋凡,阿里在业务集中的同时,实现了决策的集中。 现阶段,零售和AI两大核心中,零售需要遏制住被蚕食的命运,这需要国内尽可能与新型平台寸土必争,也需要国际业务与另外三大平台抢地盘。 阿里的零售业务依然困难重重。2024年第四季度,淘天集团营收增长了5%,在国补的大背景下,阿里淘天的增速甚至不如京东,后者增速达到了13%。整个2024年,电商平台的常态依然是拼抖快围剿两大平台。 拼多多四季度并没有交出很亮眼的数据,但也实现了24%的增长,如果只看零售,拼多多营收已经达到阿里的64%、淘天的81%。 2024年,抖音电商的GMV达到3.5万亿,同比增幅30%,2025年目标为4.2万亿,增速还将达到20%。 快手处在一个稳定增长的状态,2024年GMV约1.4万亿,同比增长17%。 这三家平台的GMV增量,很大程度还是来自淘天和京东,阿里需要集中力量应对。 AI是进入2025年后阿里最大的亮点。2月,蔡崇信承认了苹果与阿里的合作。“苹果在中国需要一个本地化的合作伙伴,为他们的手机服务。苹果与中国的多家公司进行了交谈。最终,他们选择与我们做生意。” 因为DeepSeek的出现,阿里的Qwen2.5-Max并没有引起太大的波澜。但阿里并不需要超越DeepSeek,只需要超过其他巨头,就足以凭借更强大的基础实力拿下订单。 苹果的橄榄枝,侧面成了Qwen系列大模型的背书,阿里在AI大模型领域事实上已经做到了行业的第一梯队。 AI成为了阿里的新宠。根据IT桔子,过去一年阿里在AI上的对外投资金额仅次于电商零售。智谱AI、零一万物、百川智能、MiniMax和月之暗面,这几家估值10亿美元以上的大模型初创公司,都出现了阿里的身影。 战略聚焦后,阿里迅速坐上了牌桌,但这个牌桌上,既有新贵DeepSeek,又有老对手腾、抖,阿里有了好的身位,也并不意味着像电商一样有了阶段性护城河。如马云所说“AI时代刚刚到来,一切才刚开始”。 从这里可以看出,阿里的瘦身仍在继续,电商与AI的竞争也远未结束。对巨头而言,战略调整是生存必需;但对普通员工来说,每一次转身都可能意味着突然的人生变故。人员调整的过渡期,阿里已经做得非常平稳,只是身处其中的员工,要远比马云在长文中所说的“痛苦”更甚。
百川精简医疗团队,AI医疗的金矿不好挖
3月4日,继裁撤金融、教育团队,全力主攻最重要的医疗项目后,在不到半个月的时间内,百川再度调整团队。 3月18日,有百川员工告诉光锥智能,目前百川智能医疗团队正在裁员,预计会将团队人数规模精简在一定范围内。 对此,百川智能回复光锥智能,百川智能会集中资源、聚焦核心业务,加速实现“造医生、改路径、促医学”的愿景。此前,在与北京儿童医院的深度合作中,百川智能共同研发的AI儿科医生已在疑难病例的顶级专家会诊中正式“上岗”,作为全球医疗领域AI医生的首次应用,获得了专家组的高度评价与认可。未来,百川将以更高效的团队和更丰富的资源,持续推动优质医疗服务的普及与普惠。 就在当日,百川智能的两位联合创始人也被曝出走。据蓝鲸新闻消息,联合创始人焦可已经离职,另外一位联合创始人陈炜鹏也正在走离职手续。 在基模之战白热化的当下,商业化成了“六小虎”的关键问题。缩减AI医疗团队的百川,正在调整寻找更适合当下的路。 商业化难 AI医疗的金矿不好挖 2024年,百川开始明确地打出了“AI+医疗”的旗帜。 谈及为何在一年后才作出转变,王小川给出的回应是,“第一是钱融到了,第二是团队也意识到,除了模型外,要有很好的场景,否则就是红海竞争。” 但在基础大模型之战愈演愈烈,商业化成为大模型公司能否实现自己造血活下去的关键阶段,AI医疗对于百川来说,还不是一个能够在短期看到回报的项目。 “医疗to B目前都是做标杆,或是基于医院的数据做共创,很难商业化。”有百川员工告诉光锥智能。 目前,通过和北京多家医院达成合作,百川拥有大量医疗数据,这些数据都进入了百川的实验室,成了其训练医疗大模型的关键。 但拿到数据只是第一步,在训练医疗大模型的基础之上,AI医疗的落地还是个问题。 在2024年底,百川智能和官方达成的战略合作中披露,其将通过“1+2+N”方案(1个多模态医疗大模型,2个AI 医生:AI全科医生、AI儿科医生,N个不同场景),共建“AI医生-真人医生双医协同”的医疗服务新模式。 目前,百川智能围绕儿科发布了相应大模型和应用产品。3月20日,百川智能与北京儿童医院、小儿方健康共同发布全球首个儿科大模型——“福棠·百川”儿科大模型,同时共同打造了“福棠·百川” AI儿科医生专家版和基层版两款应用。 但在场景构建上,或许百川还没有想好更适合的落地模式。 “To B的核心是利益链的上下游都能兼顾,但百川还没有摸清楚,没有考虑到医院端的收益。”上述员工向光锥智能表示。 从当下来看,AI+医疗也不是一块好啃的骨头。在这个领域,科大讯飞旗下的讯飞医疗已经做了八年,虽然营收在逐年增长,但整体业务仍然处于亏损状态。讯飞医疗招股书显示,讯飞医疗在2021年至2024年上半年的营业收入分别为人民币3.72亿、4.72亿、5.56亿和 2.29亿元,但其净亏损分别为人民币0.89亿、2.09亿、1.54亿和1.34亿元,其营收完全不够覆盖高额的研发成本。 同时,回款账期长也成了一个问题。翻看科大讯飞的财报,截至2024年上半年,讯飞医疗应收账款达5.79亿元,逾期比例接近八成。 不做超级应用,选择做医疗的王小川,一心想要逃出大厂的射程。 但AI医疗,也开始进入了大厂的视线范围内。在前景不够明朗的情况下,还有更加强有力的对手准备入局。 3月8日,据悉,华为正式组建医疗卫生军团,将重点构建AI辅助诊断解决方案体系,推动医疗大模型在临床场景的应用。 而在今年的华为专家委员会上,曾提及今年多家三甲医院将会增加在AI方面的预算。而在AI医疗领域,华为也早有布局。此前,华为曾和瑞金医院合作开发瑞智病理大模型RuiPath,在病理诊断、医学影像、药物研发等方向均有成果积累。背靠华为昇腾算力和华为云,加上此前积累的合作经验,华为入局的优势不言而喻。 在内忧外患中,下决心深耕医疗的百川,需要在尽可能地开拓客户的同时,继续探索AI在医疗上的落地可能性,这对于此前B端经验薄弱的王小川来说,是一道难题。 调整团队、改变策略 “六小虎”加速洗牌 从2025年开始,以“六小虎”为首的AI大模型公司们都在积极调整自身战略,裁撤业务、模型训练策略调整,每一家都有自己的想法。 当MaaS逐渐被印证为一项不适合赚钱的业务,对于需要靠融资和造血讲出新故事的“六小虎”来说,寻找商业化模式成了更加迫切的任务。 而在DeepSeek横空出世的当下,架在六小虎面前的形势变得更加严峻。不光是科技大厂、垂直企业纷纷将橄榄枝抛给DeepSeek,快速达成合作,DeepSeek也用新的模型威胁着“六小虎”的地位。 “六小虎”们需要大量资金持续投入在模型研发上,这也是其中一些公司放弃万亿以上规模模型训练的原因。而在打造超级应用上,字节豆包、腾讯元宝和阿里夸克成了绕不过的三座大山。和自带流量、场景生态优势的大厂相比,六小虎的胜算不高。 在战局白热化的当下,每家公司都开始把手中有限的资源尽可能押注在自己当下更擅长、更具备优势的细分领域。 零一万物是最早调转船头的一家。李开复选择不再训练万亿参数以上的超大规模模型,认为这是“大厂的游戏”。在昨日的发布会上,零一万物也围绕DeepSeek提供了一系列服务企业的合作方案,在现实面前,这家公司开始全面转向思考PMF、深耕技术落地的方向。 百川智能在半个月前砍掉了教育和金融的B端团队,此次精简医疗团队,其也表示是希望更专注于在医疗业务上的探索,MiniMax也开始收缩B端团队,将精力更多放在了已经明确盈利、发展良好的Talkie和星野两款AI社交产品上。 在基模战争被预测即将在今年结束的2025,摆在六小虎面前的问题简单而又严峻——谁能在商业化上成功转舵,找到有前景的方向继续耕耘,才能拥有继续留在牌桌上的机会。
AI牌局上,快手打出一张王
2025年前三个月,全球资本市场“东升西降”。外界担忧美国经济将陷入衰退,华尔街投行纷纷看多中国资产、重估中国公司,资金从西半球向东半球涌动。 在国际资本活跃的中国香港股市,全球资金大举布局,驱动股价普涨。 今年1月初,恒生指数徘徊在2万点下方,如今已升至23300点以上,累计涨幅接近20%。囊括多家互联网科技公司的恒生科技指数,从4500点升至5500点以上,涨幅达22%。 同一时期,纳斯达克指数从19000点上方跌至18000点左右,下跌约5%。 本轮涨幅居前的港股权重股,分别是阿里、小米和快手。截至3月20日港股收盘,小米今年以来累计上涨66%,阿里上73%,快手上涨逾60%。作为对比,同期特斯拉累计下跌约1/3。 上述三家公司的共同特点是,都把握住了时代航向、找到了新增长点——阿里和快手积极拥抱AI大模型,小米则大举押注新能源汽车。 新能源汽车的发展潜力早已被证明。相比之下,全球AI大模型仍处于巨额投入阶段,尽管长期价值毋庸置疑,但中短期能带来多少回报,能够建立哪些经得起市场检验的商业模式,尚未得到彻底解答。 从快手最新发布的财报来看,AI大模型的商业价值“天问”在一定程度上得到解答: AI大模型不仅极具长期价值,也能够在中短期带来丰沛回报,缓解大公司的增长饥渴。 3月26日,快手发布2024年第四季度及全年业绩。上一财年,快手营收同比增长11.8%至1269亿元人民币;全年经调整净利润177亿元,同比增长72.5%;全年经调整净利润率14%,继续提升。 经营数据方面,去年第四季度,快手日活跃用户(DAU)为4.01亿,月活跃用户(MAU)为7.36亿,分别同比增长4.8%和5.0%。快手APP日活跃用户日均使用时长达125.6分钟,用户总使用时长同比增长5.8%。 快手AI是外界关注的重点。在财报电话会议上,快手CEO程一笑表示,快手正站在 AI 技术与视频大模型重塑产业格局的关键节点,AI不仅是效率提升工具,更是驱动平台在流量增长的同时,创造更多商业生态价值的核心引擎。 与其他大厂相比,快手布局AI大模型时,并不具备一上来就把摊子铺得很大、直接挑战OpenAI等全球领跑者的条件,而是必须结合自身特点做文章,让AI大模型服务于业务和生态。 过去一两年,快手AI大模型业务主要围绕内容理解应用、推荐大模型和视频生成大模型三个方向展开,尝试在算法、应用和商业模式等方面做出新意;在模型训练和投入上,倾向和公司已有业务打配合,形成正循环。 去年6月上线的视频生成大模型“可灵”,是快手最知名的AI产品。在国内外一系列评测中,可灵均处于第一梯队,在专业用户中口碑颇佳。今年1月,可灵全球月访问用户总数环比增长113%。同时,可灵给快手带来的C端和B端收入也在持续增长。 长期来看,快手希望可灵扮演“AI创作破壁人”的角色——通过联手专业机构推出AI短剧、AI微电影等PGC内容,作为示范和引导,吸引PUGC和UGC创作者加入AI创作。 图注:由可灵AI提供技术支持的短剧《山海奇镜之劈波斩浪》 “我们相信,可灵正在成为AI时代视频创作的新基础设施。”程一笑说。 他认为,可灵作为面向PGC或PUGC创作者的图像及视频素材工具,赋能创作者高效创作内容;之后,可灵将朝着“面向普通创作者的视频叙事工具”演化,以真实影像级的视频生成能力,助力普通人讲好视觉故事,并激发AIGC内容的生产、消费与互动,实现商业化场景的大规模应用。 为此,快手将在未来3年甚至更长时间进行更大规模的资本和研发投入,希望能通过可灵AI的赋能,改造升级现有业务的同时,创造AI视频内容生产的新赛道,进一步保持和升级快手作为短视频生产和消费社区的领先地位。 相比而言,快手AI的另外两块拼图——语言大模型“快意”和推荐大模型ACT,更侧重技术创新与业务场景做紧密的结合。 据了解,快意和ACT已被广泛用于快手内容生态的效率提升,包括推荐、搜索、广告、垂类运营、生态分析、内容安全等各种场景。 同时,两个大模型也在帮助快手商家降本增效,带动订单和收入增长。比如,商家可以使用快手AI大模型,批量生成推广素材,或是训练数字人主播、数字员工等,以更低成本、更高效率融入快手内容和商业生态。 在巨头挥金似土的AI大模型赛道,快手并不是投入最大、关注最高的玩家,却也在一番衔枚疾进后,讲出了逻辑自洽、适合自身体质的新故事,并让AI大模型的潜力得到了更精准和清晰的验证。 这也表明,AI大模型的竞赛并不意味着必须争夺王冠。找到AI大模型与自身业务和生态的结合点,实现公司层面的PMF(产品市场契合),反而可以跳出烧钱竞争,更快实现AI大模型价值变现。 过去几年,国内主要互联网公司都在快马加鞭做AI大模型,但对于这块业务要怎么做、战略目标是什么,各家有各家的想法。 整体来看,阿里、腾讯、字节等都希望打造AI大模型时代的超级APP。 阿里除了通义APP,还在培育以网盘和浏览器起家、如今火速转型AI APP的夸克。腾讯元宝第一时间接入DeepSeek,还获得微信的入口级支持。字节的豆包则成为2024年投放最凶猛、用户最多的AI APP,直到今年初被DeepSeek逆袭。 相比之下,快手能够用于AI大模型的资金比不上新BAT,走了一条差异化竞争的策略,在行业里大多还在卷语言大模型的阶段,就已经把算力集中在了视频大模型上,从而抢到了视频生成大模型这条细分赛道的领先身位。 AI生成视频的魔力,最早由OpenAI的Sora展现在世人面前。但Sora长时间“难产”,给了可灵等竞品填补空白、吸纳用户的空间。 去年6月上线后,可灵以大约每两周上线一个新版本的速度进行更新,每隔一段时间就会迭代模型、更新功能,并完成在网页端和APP端的布局。 在快手的构想中,可灵的长期打法依然是:以技术和产品树立口碑,联合专业创作者做出示范,吸引更多用户使用,并在B端和C端获得回报。 可灵起步比Sora晚了两个月,但经过十几次迭代后,不少指标已经反超Sora。 以视频时长为例,可灵能够生成最长2分钟的1080p视频,并可以续写至3分钟左右;Sora只能支持20秒。此外,在物理世界模拟、真实运动规律、多种镜头运用等方面,可灵同样建立了一定优势。 根据第三方评测,去年9月上线的可灵1.5模型强于Sora,仅弱于谷歌veo2,排名全球第二。12月,可灵升级至1.6模型,在语义遵循、画面美感及动态质量上均有显著提升,尤其在“图生视频”场景下,内部评测显示其综合效果较1.5版本提升近200%。程一笑表示,通过行业调研,有信心认为目前可灵AI图生视频的综合效果位列全球第一。 除了得到专业机构和圈内人士的认可,可灵也引起了特斯拉创始人马斯克的兴趣。在评论一则由可灵生成的视频时,马斯克表示:“AI娱乐产业正在发生飞速变化”。 马斯克等名人和专业机构的背书,让可灵在拓展用户规模时,有了不依赖投流、主要靠自然增长的机会。 尽管也会投流,但可灵的营销力度远远低于豆包、Kimi、元宝等APP。与买流量相比,快手更希望依靠PGC(专业制作内容)作品的示范效应,展示AI创作视频的潜力,吸引更多人加入。 去年7月,可灵刚刚上线一个月,就推出了AI短剧《山海奇境之劈波斩浪》,播放量超5300万次,全网曝光超4.3亿。此外,导演陈坤表示,在AI技术加持下,短剧制作成本至少降低1/4。 这部短剧成为可灵起步阶段反复提及的案例。去年下半年起,尝试AI创作的PUGC(专业用户制作内容)和UGC(用户制作内容)用户越来越多。 随着用户和使用次数的增长,可灵的商业价值初步释放,变现方式包括面向C端的用户会员订阅,以及面向B端商家的API接入。去年第三季度,可灵商业化单月流水超千万元。 根据最新财报,自可灵开始商业化变现至2025年2月,可灵的累计营业收入已经超过人民币1亿元。快手预计,2025年可灵将实现收入的跨越式增长。 除了C端用户规模和内容生态扩大,可灵在B端也取得突破。目前,可灵已与包括小米、亚马逊云科技、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。 进入2025年,试水AI视频的大品牌进一步增多,vivo、周大福、玛氏箭牌、青岛啤酒等公司使用可灵制作广告短片、主题视频,或是定制联名产品。 在资本市场上,高盛、瑞银、中信建投等态度积极,不少机构认为可灵将成为快手市值进一步上扬的驱动力。其中,中信建投评论称,若按照访问量规模估值,可灵估值有望达40~60亿美元。 除了推出豆包、元宝、通义、可灵这样的AI APP,互联网大厂也在更多业务场景下推动AI to B,尝试撬动B端市场。 将AI大模型全面应用于自家业务,是互联网公司早已形成的共识。比如,阿里此前提出,“所有产品都值得用AI重做一遍”;腾讯、字节、快手等也都在业务中广泛落地自行研发的AI技术和工具。 不过,对于如何吸引其他企业使用自家AI产品,大厂的看法并不相同。 大多数公司希望成为AI时代的模型和算力基础设施。例如,阿里此前官宣与苹果合作,将为国行版iPhone提供AI大模型功能。字节旗下的火山引擎则打响了AI大模型价格战。 但这类客户大都是对于AI大模型有着明确需求的企业,比如从事AI应用开发的中小公司等。那些主业并非AI,却需要利用AI降本增效的企业,此前并未被大厂密集关注和开发。 快手较早注意到这块AI to B的蓝海,并尝试以自家平台的商家为切入点,帮助企业以合理成本在业务中运用AI技术。具体做法是,平台通过拆解站内商家的经营流程,寻找AI大模型与生意的结合点,并推出一系列专用工具和平台。 例如,商家在快手卖货,离不开短视频创作。商家此前需要制作大量脚本和素材,反复测试后才能找到效果最好的一条,再重点投流。这意味着每条广告都有不菲的沉没成本,且耗时耗力。 为此,快手推出AI广告投放工具“磁力开创”,通过AI技术简化视频创意生产流程,包括对话式交互、可灵成片、剪同款和一键成片等,商家短时间内可以生成数百条适合在快手发布的素材。 程一笑表示,根据快手内部测算,AI大模型预计可以把客户的短视频营销素材制作成本降低60~70%甚至更高。 除了做短视频,开直播也是商家的必选动作。但许多中小商家并不具备招聘专业主播的条件和预算;快手上线“女娲数字人直播”,根据脚本完成演绎,可支持2200个以上的数字人24小时同时开播,转化率接近真人水平。 在销售转化环节,"智能讲品”工具可以智能推荐商品、智能生成话术等,帮助商家更精细地运营流量、获取订单;数字员工产品“智能Bot”能够自动识别用户问题,调用相关答案生成音频、文字或直接展示相关素材和表单,减少用户等待时间,并提升转化率。目前,这些数字员工每天服务约22万用户。 售后服务上,快手电商客服平台升级为“快语客服工作台”,具备客户接待、智能服务、数据服务等功能,可以更高效地处理买家售前售后问题,提高用户满意度和店铺经营效率。 与新BAT向B端用户兜售自家大模型不同,快手把AI to B的重心放在了站内商家,尽可能帮商家省钱、省人力,并获得更多订单和销售额。2024年第四季度,快手平台上的AIGC短视频营销素材和虚拟数字人直播解决方案的日均消耗超过3000万元。 大厂AI to B路径不同,对业绩产生的拉动作用也存在差异。 做AI大模型和算力基础设施,赚的是API调用、定制专属大模型之类的钱。这些业务能够立竿见影地带来收入,进而转化为公司估值。近期阿里股价大幅上涨,字节估值回升至高位,与其AI To B业务取得进展关系很大。 相比之下,快手当前的AI to B动作短时间内较难量化对收入的具体贡献——“磁力开创”等功能往往免费提供给中小商家,或者作为服务包的一部分。这些动作发挥“助推剂”作用,帮助站内商家赚钱,进而带动快手业绩增长。 程一笑表示,AI技术发展并逐步成熟的进程中,市场必然会有冷热周期的变化。对于快手来说,最好的选择就是依托AI对现有业务进行升级,迅速形成研发投入和收益的正循环,这样才能让快手AI真正具有穿越市场周期的能力。 为此,快手一方面会不断升级以可灵为代表的AI商业化变现模式,力争可灵AI早日成为营收规模全球第一的视频生成AI应用。另一方面,也会继续加强AI技术对于快手原有商业生态的升级,为快手线上营销服务和电商业务带来新的增量。 各大互联网公司做AI大模型的定位不同、路径不同、赚钱方式不同,却很可能踏入同一条河流——低线市场。 在AI大模型的旋风刮了三年后,主要玩家都意识到,县城乡镇、田间地头,蕴藏着巨大的增量市场。比如腾讯,已经把元宝的广告标语刷到了农村的砖墙上。 但争夺县城农村的C端用户,并不是AI大模型渗透下沉市场的全部内涵。另一条充满想象空间的路径是,品牌和商家渴望开辟新线城市(三线以下城市)市场,而互联网公司的AI大模型技术可以帮他们降本增效。 近些年,新线城市的消费能力迅速提升。根据《2025 新春团购节老铁消费报告》,今年春节期间,新线城市日均支付用户数环比节前增长 234%,GMV 同比增速是一二线城市的近两倍。唐山力压北上广深,成为消费热度最高的国内城市。 麦肯锡此前预测,到2030年,中国个人消费规模将增长至65.3万亿元,超66%的增长来自于新线城市。这块市场的消费者更有钱、更愿意花钱,吸引大大小小的品牌商家纷纷打出“下沉”旗号。 大品牌实力雄厚、经验丰富,开辟新线市场相对简单。比如阿迪达斯、lululemon等国际一线品牌,在进入新线城市时,无论是自营开店还是开放加盟,均能够短时间内搭建销售渠道,并启动运营。 但对于广大中小商家而言,受限于资金、资源和能力,想要触达遍布大江南北的新线城市并不容易。找到合适的用户场域,借助AI大模型,降低拓展新线城市的成本、提高市场开发效率,也就成为中小商家的刚需。 快手目前月活跃用户超7亿,其中新线城市用户占比60.9%,天然适合中小商家进行业务“下沉”。快手管理层也曾表示,谁能更快布局新线市场,谁就有机会拿到最大的增量。 中小商家在快手做生意,可以在相对去中心化的平台机制中,获得更多免费流量,同时也可以借助快手用户生态的信任氛围,提高转化率和留存、复购。过去一年间,在向新线城市拓展时,他们又获得了新的平台红利——AI大模型能力。 以流量获取为例,以往商家除了自行经营内容、免费引流外,也需要搭配精准高效的广告投放,而这往往是中小商家的能力短板。 为此,快手基于自研AI大模型,推出一系列智能托管工具,包括全站推广、直播托管、全品智投等,简化广告操作难度。在AI加持下,快手商业化全站推广的全自动投放占比已达55%,商家广告投放成本显著降低。 另一方面,有了AI大模型技术,新线城市的本地中小商家可以更方便地接入快手商业生态,从超7亿月活的巨型流量池中淘金。 在新线城市,中小商家植根于社区、街道,擅长经营熟人生意、近邻生意,在小圈子里如鱼得水,但终归体量有限。要想突破天花板,他们需要把生意搬到线上,尤其是短视频平台,触达全国各地的消费者。 在此过程中,这些商家面临不知道怎么开店、不懂如何引流、不会做视频开直播等一系列难题,需要长时间摸索和试错。 针对这一普遍难题,快手的AI to B工具箱能够“对症下药”:AIGC技术可以帮商家设计脚本、生成素材,数字人帮商家全天候开播,数字员工、智能客服等帮助商家补齐售前售后能力。中小商家无需增加多少成本,就能迅速接入快手内容生态和商业生态,从中捕捉新客户、新订单。 在各大品牌、中小商家纷纷探索三至五线城市为主的新线市场过程中,快手正在成为最有力的合作方之一。AI大模型让快手找到通往新线城市的钥匙,让整个生态的商业更简单、更有效率,补齐了这块曾经的竞争短板。 不过,面对新线市场的巨大蛋糕,AI大厂们的竞争才刚刚开始,任何互联网公司都不能“半场开香槟”。以AI大模型服务万千中小商家,将是一场漫长而艰难的地面战争,比高举高打的AI to C要复杂得多。 与此同时,推动AI大模型走向新线城市、田间地头的中国互联网公司们,也将获得更宽阔而肥沃的商业土壤,并在“东升西降”的全球资本流动中,吸纳更多投资者的“投票”。
美团“安心学”落地南京 市民选购教培课程享一课一销、随时退款
南京家长给孩子报班,终于不用担心退款难了!3月26日,美团安心学项目正式落地南京,参与合作的南京教培机构,将在美团推出“一课一销、随时退款”的短期课次卡团购,给消费者提供更加灵活、可靠的消费保障。 ▲美团安心学南京首发仪式启动,摄影:徐杰 据了解,“安心学”是美团面向教育培训领域,创新推出的履约交易保障新模式。日前,美团联合校宝在线以及多家教培机构成立“安心学”联盟,消费者购买平台上带有“安心学”标识的短期课团购,即可实现“上一次课,核销一次款项”。同时,消费者还能享受安心退款服务保障,如遇商家闭店无法提供服务,消费者可向平台申请退回剩余未使用的部分费用,大大减轻了顾虑。 美团数据显示,全国已有100多城上万家教培机构报名参与“安心学”,课程数量超20000门。从苏州到常州,此次安心学项目又走进南京,是安心学履约保障深化区域服务的关键一步,有望进一步加速项目在江苏地区的覆盖。截至目前,南京安心学合作机构数量已超过500家,为消费者提供多样化的教培选择参考。 来自江宁区的市民王女士表示,自去年底经历了编程机构跑路后,现在报班特别谨慎。“安心学”的模式,其实给家长提供了更多试错机会,尤其是可以结合孩子兴趣和学习效果灵活选择课程周期,而不用再因为优惠活动,被迫去购买100多节课的长期课,无论是对家长的钱包还是对孩子的学习,都很有价值。 近年来,部分教培机构“跑路”“退费”带来的大额预付式消费纠纷层出不穷,最直接挫伤的是消费者信心。“实际上,在经营中我们也会受到此类事件的波及,很多家长看到那么多的‘跑路’案例,就会产生担心犹豫心理。”安心学联盟机构跃动运动馆副总裁李杨表示。 “安心学项目是平台发挥市场力量,创新消费模式,保障消费者权益的一次重要尝试,对于预防教育市场‘退费难’‘卷钱跑路’等老大难问题,提供了新解法。” 盘古智库高级研究员江瀚介绍。 南京市江宁区文旅局相关负责人表示,希望通过政企联动的模式,搭建双向赋能平台,借助美团安心学项目,既为家长提供灵活的消费选择,又通过流量倾斜、佣金优惠等政策助力培训机构健康发展,让家长“预付无忧”、机构“经营有信”。“将以‘安心学’为突破口,加强文旅预付费领域服务管理,推动资金监管、信用评价、纠纷化解等机制建设。”上述负责人表示。 南京本地机构汇武功夫会馆率先尝试美团安心学合作。自2025年2月安心学课程推出以来,门店在平台上的流量环比前一个月增长38%。汇武功夫会馆全国运营总监万雪冬表示,安心学产品是机构和消费者之间的信任桥梁,在提升家长满意度的同时,也帮助机构提升了经营效率,让机构可以聚焦打磨更好的教培服务,真正实现多方共赢。 ▲美团安心学 “从调研来看,家长对教培服务的确定性、专业性要求在不断提高,安心学已联动教培领域SaaS服务商,努力提升机构和消费者的次卡消费体验,真正用数字化为家长和机构‘减负’。”美团易生活业务部负责人程志表示,希望通过平台的创新产品和多种扶持政策,让更多有序经营的机构获得生意增长,更好保障消费者的资金安全。据了解,运动培训、书法、科学探索、棋艺、美术、国学、音乐等非学科类培训品类,是参与安心学项目的主力,南京、苏州、常州等江苏各大城市相关机构的参与热情持续上涨中。
DENON AH-C840NCW 体验:传统稳定,老派音响厂商的水桶型真无线耳机
3 月 26 日,DENON 天龙推出两款真无线耳机,分别是 AH-C500W 和 AH-C840NCW。 AH-C500W 和 AH-C840NCW 均采用附带耳柄的真无线设计模式,AH-C500W 是常规的真无线耳机,而我们手上这款 AH-C840NCW,是 WH-C830NCW 的升级版,定位更高、自带主动降噪的版本。 包装设计是标准的天龙模式,白色外盒印有耳机造型图片和 LOGO,侧面有机身重点参数。 内盒分两层,顶部放 AH-C840NCW 本体,下层有个小盒子装上了替换用的大小号耳帽以及一条 USB-C to C 的充电短线。 外观方面,AH-C840NCW 充电盒改用了全新设计,从前代 AH-C830NCW 椭圆形圆通的直立设计变成了现在更大众的鹅卵石造型,里面的耳机从立式收纳变成了平躺收纳。和上一代都是 43g 重,这一代设计更加圆润,耳机平躺之后盒子能做得更薄,能够更轻易地塞进窄口袋里面。 产品配色依旧有黑白可选,黑色版的充电盒表面加入磨砂哑光处理,并用不同的亮面黑处理顶部的「DENON」字样。上手感觉顺滑,会有那么一点点磨砂效果来丰富触感。 这样的表面处理比较容易显现实用痕迹,建议日常使用还是佩戴一下保护壳。 充电盒的接口和实体按键都放到转轴的下侧,保证了机身外观的一体性。实体按键方便用户快速启动配对模式,同时也是最直观的操控设计。 AH-C840NCW 新增了无线充电支持,盒子底部很平整,方便平稳地放在各种形态的无线充电盒上面。放好等响应完成后,正面状态灯亮起就正式开始充电。 耳机设计变化并不大,AH-C840NCW 还是那个 5.3g 的耳柄机身。外侧做了光滑的亮面处理,耳柄顶部有一个斜向下的光滑斜面做触控板,用户将手递到耳机的时候就能刚好放到触控板一样,操控更自然。 哪怕在走动的时候要快速操控耳机,用户也不需要花时间摸耳机在哪里,抬手就能够盲操作。 耳机佩戴起来还算舒服,5.3g 的重量和支持主动降噪的 AirPods 4 差不多,两款同时上耳的重量感差异不大。 AH-C840NCW 外壳做得足够饱满圆润,佩戴时刚好放入耳甲腔的位置,并完全嵌入耳屏和对耳屏之间中间的空隙。透过这两结构的包裹和入耳结构相结合,耳机能够安全固定在耳朵上,实现贴合佩戴。 耳机用了传统长度的耳柄,佩戴完成后耳柄向内贴合,进一步提升佩戴稳定性。这样的设计不像穿透「豆式」设计会把佩戴压力集中在耳朵内,时间长了也会比完全塞进耳朵的豆式深入耳耳机要舒服些。 耳帽的部分,DENON 选用的是较为宽和扁平的款式。材质柔软,戴上就能够紧贴耳朵。在只有空调风机等噪声相对简单的环境里,戴上耳机就能够感受到物理隔音的变化,效果很明显。 耳帽内侧加了滤声网,除了为声学服务还起到阻隔耳垢的作用,对佩戴深入的入耳降噪来说还是很必要的。 配置方面,AH-C840NCW 从上一代的蓝牙 5.0 升级到蓝牙 5.3,支持 SBC、AAC 和 通过后续更新支持 LC3 这三款传输编码,在未来可以通过升级支持 LE Audio。 升级到蓝牙 5.3 后,耳机稳定性没有问题。在无线环境复杂的办公室、咖啡厅,AH-C840NCW 没有出现明显的断连情况,只要不是在射击游戏中追求超低延迟,用它来看视频和玩王者荣耀、原神、明日方舟这种对声音要求不是特别高的游戏都没有问题。 但只有 SBC 和 AAC 编码的话有点可惜,要是能支持基础款 aptX 或有 LDAC 等高规格的无损编码会更好。 降噪的部分,AH-C840NCW 表现属于同价位的常规水平。 效果不算强势,不是那种戴久了很容易累的类型。配合隔音耳帽,耳机能在人多并自带 BGM 的周末咖啡店中给你创作一个安静独处的环境,不容易被周围的交谈声、环境音乐打扰。这个时候听歌和看剧,沉浸感会更强。 续航的话,AH-C840NCW 单机身播放时间为开启降噪 7 小时和关闭降噪 10 小时,配合充电盒能实现开启降噪 24 小时和关闭降噪 35 小时播放,是旗舰真无线降噪的标准续航模式。 有线模式下,充电盒 0-100 完全充满大概要 2 小时,同时附带了「充电五分钟播放一小时」的快充模式,方便用户出门快速补电。平时充电,放在无线充上完成即可。 最后,来说说 AH-C840NCW 最重要的部分——声音。 AH-C840NCW 搭载一颗 12mm FreeEdge Hi-Fi 动圈单元,FreeEdge Hi-Fi 动圈单元可以说是 DENON 的招牌,不只是木碗头戴旗舰 AH-D9200 以及相关系列,Music Maniac 系列的 AH-MM400 也在用类似技术的单元。 AH-C840NCW 的调声也很舒服,声音速度不快不赶,质感入口顺滑,各频段的衔接流畅不断层,整体听起来是一种传统丰满的动圈味道。 低频的表现优秀,AH-C840NCW 的鼓点饱满细致,处理鼓点敲击回弹的时候,你能够清晰听到鼓面回弹的细节。音效清晰分明,而不会太刺激,听着舒服不容易累。 耳机很容易驱动,低音量播放时声音扎实,日常开着降噪和小音量播放 BGM 工作和学习也很合适。 总的来说,DENON AH-C840NCW 是一款很平实很传统的真无线入耳式降噪耳机,也可以说 DENON 真无线耳机里面的水桶机新标杆。 规矩的耳机设计搭配轻量化机身和耳柄结构,AH-C840NCW 能给人一种能佩戴很久的舒适感。贴合度高的耳帽给降噪表现输出提供了辅助,加上机身有 IPX4 防护,日常通勤和办公环境都能满足。 耳机的功能应有尽有,像是主要的降噪、无线充电、双设备连接和未来会更新的 LE Audio 和 LC3 编码,耳机连接的稳定性也不错,是做好做全的类型。 声音有自身特点,DENON 传统音频技术投入是这款水桶机的核心竞争力。新单元的加入让它的声音有一点辨识度,听起来更有味道,比起更大更全但也更平淡的 AirPods 4 系列更具吸引力。 如果你只是想要一款佩戴舒服,各方面表现都平实稳定的真无线耳机,希望在声音方面不那么像白开水一样沉闷,那听感方面更有特色、声音质感上也更有优势的 DENON AH-C840NCW 也很值得尝试。
苹果全球副总裁访问爱范儿,他说从没见过这样的公司
Keep Patching 昨天早上,爱范儿迎来一位重量级访客——苹果全球产品营销副总裁 Bob Borchers。 这位参与初代 iPhone 研发的苹果元老,拥有斯坦福大学的机械工程学士学位和麻省理工学院的硕士学位,出演过初代 iPhone 官方教学视频,在硬件整合、软件生态构建和市场营销策略上发挥了关键作用。 站在广州海珠区 T.I.T 创意园的红砖路上,Bob Borchers 轻触着 1956 年纺织机械厂遗留的鼓风机。一如苹果英国总部所在的巴特西发电站,爱范儿所在的 T.I.T 创意园,既是城市工业历史的见证者,也是数字时代的创新策源地。 30 年前我来过广州,但眼前的创造力超乎想象。 当 Bob 得知爱范儿和微信比邻而居时,他笑着掏出手机拍下这「科技和人文的交叉路口」。 步入爱范儿三栋办公楼构成的办公群落,Bob 被琳琅满目的苹果生态所吸引。打开 AirDrop,20 多台 Mac 瞬间浮现。 爱范儿每一位入职员工都标配 Mac。我们的交互式图文、制糖工厂的产品设计都出自于 Mac。 爱范儿创始人 Wilson 说。 得知团队涵盖导演、机械、化学、艺术等跨学科人才,Bob 频频点头: 科技本就应该打破边界,拧成一股绳(Technology needs to be integrated all together.) 作为一家数字潮牌,我们也为 Bob 展示了一些「不务正业」的东西: 在爱范儿明日实验室,我们展示了《明日产品年鉴》,这本精致的小册子记录着爱范儿对每一年「明日产品」的选择,我们希望它在若干年后能成为科技史的草稿。 Bob 很喜欢这本散着墨香的 catalog,他指着 AirPods Pro 助听器更新的一页,说他很喜欢这个功能。 他还惊讶地发现了初代 iPhone,并小心翼翼地拿起来它,用衣角将屏幕擦拭干净。 当我们提出能否留下签名时,他说用只能签在边上: 它的(背后)太美了,不能破坏。 在特别准备的体验环节,Bob Borchers 戴上 AirPods Max,聆听了爱范儿「数字国粹」单曲《口技:三声万物》,惊艳的音效令他眉飞色舞。 作为爱范儿的实验性作品,《口技:三声万物》把中国传统非遗口技与苹果空间音频技术结合,还原出百鸟争鸣、风雨交加的自然声场。 这波文化输出直接冲上 Apple Music 首页,经过新华社、China Daily、华尔街日报的报道,作品被传播至全球超过 165 个国家和地区。 在制糖工厂展区,Bob Borchers 快速掌握了「贴贴线」的磁吸收纳技巧,更对「AI 小电拼」的 App 功率调节功能眼前一亮,他说这很符合苹果软硬结合 Holistic 的方式。 对于制糖工厂在环保实践的创新,Bob 竖起了大拇指——此前,我们在中国多个高校发起了免费「以旧换新」的活动,凭任意废弃数据线即可免费兑换贴贴线,并将回收的数据线改造成艺术饰品,将可持续性转化为创造力的延伸。 Bob 还探访了爱范儿的线下社区空间——未来社 House。这座形如橙色糖果盒的建筑,集合咖啡馆、美术馆与露天剧场,曾举办「Shot on iPhone」街头拓印影展等活动。 就像 Apple Store 不仅是零售空间,更是灵感枢纽, 爱范儿创始人 Wilson 说, 我们认为任何可以交流的载体都是媒体,社区本身就是内容的生产者与传播者。 在未来社 House 二楼的天台美术馆,Bob Borchers 还与爱范儿首席内容官何宗丞围绕 Mac 展开了一场对话。Bob Borchers 提到,自己在广州与大家探讨 AI 应用场景时,着实被震撼到了: 人们正在发掘整个 Mac 产品线的惊人潜力,你可以在 M3 Ultra 上本地运行最大的模型,或者也可以使用 MacBook Air 进行 AI 任务。所以,Mac 真的是 AI 的最佳平台。 早在 40 年前,乔布斯曾把计算机比作一辆「思维的自行车」,Bob 说这个比喻依然成立——技术应如自行车般拓展创造力边界。Mac 的使命始终如一:打造最佳工具,让创造者塑造未来。正如自行车延伸出行范围,技术应该放大人类潜能。
谷歌史上最强推理模型全面屠榜!击败DeepSeek断层第一,“人类最后考试”暴碾OpenAI,免费可用
作者 | 陈骏达 编辑 | 心缘 智东西3月26日报道,今天,谷歌发布了Gemini 2.5思考模型家族的第一个成员——Gemini 2.5 Pro实验版本。这一模型在多项基准测试中全面超越OpenAI o3-mini,Claude 3.7 Sonnet、Grok-3和DeepSeek-R1,一经亮相便在大模型竞技场获得1443分,凭借39分的大幅优势,获得断层第一。 不过,谷歌并未放出Gemini 2.5 Pro与OpenAI o1、OpenAI o1-Pro和OpenAI o3等模型在基准测试中的对比。此外,在智能体编程评估基准SWE-bench verified上,其得分要低于Claude 3.7 Sonnet。 Gemini 2.5 Pro除了在衡量人类偏好的大模型竞技场领先之外,还在常见的编程、数学和科学基准测试中处于领先地位,包括Humanity’s Last Exam(人类最后考试)这一难度超高的基准测试,与OpenAI o3-mini相比,其得分提升了近5%,提升比例达34%。这款模型现已支持100万tokens上下文窗口,并将很快拓展至200万tokens。 目前,Gemini 2.5 Pro已上线面向开发者的谷歌AI Studio平台,并很快会在谷歌的在线AI开发平台Vertex AI上线。普通用户若要体验这款新模型,需要具备Gemini Advanced订阅账号。 未来几周,谷歌还将推出模型的定价,允许用户使用具有更高速率的2.5 Pro进行大规模商用。 博客地址:https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-pro 体验链接:https://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25 一、谷歌大秀新模型编程能力,一句话生成互动式图表 Gemini 2.5 Pro发布后,谷歌DeepMind在其YouTube账号上发布了多个演示视频,主要展现了其编程能力与其他领域能力的结合。 例如,Gemini 2.5 Pro可以根据用户提出的简单指令,在p5.js中探索曼德博集合。这要求大模型具备较好的数学、编程和可视化能力。最终,较好的可视化效果应包括清晰的边缘、平滑的颜色过渡等。 Gemini 2.5 Pro还能根据提示词,创建互动式的图表。下方案例中,它便将过去几十年的人均GDP数据与健康数据结合,在一张图表内呈现了数百个国家过去几十年的变化,从而揭示财富与健康之间的关系。 对于一些更为日常的任务,如游戏开发,Gemini 2.5 Pro也能在指定特定编程语言的情况下,给出兼具审美和可玩性的游戏。下方的这一恐龙小游戏与Chrome内自带的游戏画风颇为接近。 二、获得多项SOTA成绩,将支持200万tokens长上下文 谷歌称,Gemini 2.5 Pro在一系列需要高级推理能力的基准测试中获得了最佳表现,包括GPQA和AIME 2025。参与测试时,Gemini 2.5 Pro没有使用多数投票等token消耗量巨大的测试时计算技巧。 Gemini 2.5 Pro在Humanity’s Last Exam中获得了18.8%的最佳得分,且并未调用工具。这一测试集由数百位人类专家设计,包含了人类最前沿深奥的知识和推理。 高级编程能力方面,Gemini 2.5 Pro在2.0版本的基础上实现了较大提升,新模型擅长创建美观的Web应用和智能体编程方面表现突出,同时擅长代码转换与编辑任务。 在行业标准的智能体编程评估基准SWE-bench verified上,Gemini 2.5 Pro采用定制智能体配置取得了63.8%的得分,不过这一得分仍然低于Claude 3.7 Sonnet。 与Gemini模型家族的其他成员一样,Gemini 2.5 Pro具备原生多模态处理能力和超长上下文窗口。目前,其支持100万tokens的上下文窗口,并很快将升级至200万tokens,让该模型能够解析海量数据集,处理来自文本、音频、图像、视频乃至完整代码库等多元信息源的复杂问题。 结语:编程成为AI玩家角力新前线 本次Gemini 2.5 Pro的发布,与昨日DeepSeek-V3新版本的发布相隔不到30个小时。与DeepSeek-V3一样,谷歌也选择提升了Gemini在编程、审美、数学等方面的能力,并将其作为模型的亮点重点展示,放出的6个演示视频均为AI编程相关。 AI编程能力的提升,既能给普通用户带来直观的感知变化,也有望在生产场景中带来明显的效益提升。这一领域或将在未来很长一段时间内,成为大模型厂商们竞相角力的方向。
超8亿!国内具身智能最大天使轮诞生,前华为自动驾驶CTO、天才少年创业
作者 | 许丽思 编辑 | 漠影 机器人前瞻3月26日报道,刚刚,具身智能初创公司它石智航(TARS)宣布完成天使轮1.2亿美元(约合人民币8.6亿元)融资,本轮融资由蓝驰创投、启明创投共同领投,线性资本、恒旭资本、洪泰基金、联想创投、襄禾资本、高瓴创投跟投,这笔融资还创下中国具身智能行业天使轮最大融资额纪录。本轮融资将主要用于公司的产品和技术研发、模型训练、场景拓展等方向。 它石智航正式成立于今年2月,是行业内独有的同时具备具身智能大模型能力、本体研发能力和软硬一体产品量产能力的公司。技术路线方面,该公司打造了全新具身智能技术发展新范式,在行业开创了Human-Centric具身数据引擎,可实现真实世界具身数据获取能力。 同时,它石智航还在行业首创空间感知与推理决策一体化具身大模型,通过打造数据驱动、可泛化的通用物理世界智能系统,加速具身智能技术发展的GPT时刻。 它石智航创始人兼CEO陈亦伦谈道,它石智航的使命是以物理世界AI和通用机器人技术为核心,构建可信赖的超级具身智能系统,让高性能AI规模化地融入人类社会的生产与生活中。在他看来,未来十年,具身智能将成为全球产业升级的关键引擎。它石智航将持续突破物理世界的智能化边界,探索具身智能无限潜力。 团队方面,它石智航CEO陈亦伦是国内具身智能、自动驾驶领域技术及产业的领军人,曾任清华大学智能产业研究院智能机器人方向首席科学家,华为自动驾驶CTO,大疆机器视觉总工程师。 ▲它石智航创始人兼CEO陈亦伦 首席科学家丁文超,原华为“天才少年”,是具身智能领域青年科学家、复旦大学机器人研究院研究员,曾从0到1主导华为智驾端到端决策网络,打造复旦大学首个人形机器人。 首席架构师陈同庆是清华大学博士,国家重大专项首席科学家,原华为ADS智能导航部部长,空间感知首席技术专家,深耕工业制造、AI、自动驾驶、机器人等产业,引领多个产品成功商用。 首席战略官Vincent,是多模态学习领域专家、持续创业者,曾任华为、百度关键技术岗位负责人。 董事长李震宇曾任百度智能驾驶事业群总裁,牵头打造了阿波罗自动驾驶开放平台和当前全球最大的无人驾驶出行服务平台“萝卜快跑”。 ▲它石智航董事长李震宇 目前,它石智航核心团队已组建完毕,员工已正式入驻上海办公区。公司正在密集开展研发岗位的招聘工作。
这机子,华为又爆了
OPPO Find X8 系列发布会又要来了,但之前说的那款耳夹式开放耳机,还要再等等。3 月 24 日,有网友在 OPPO Find 系列产品负责人周意保的微博评论区中,询问了 OPPO 耳夹式开放耳机的发布时间,周意保当场表示: 「耳夹下个月发,量产来不及,不过这次也有一个新耳机。」 图/微博 说得很好,但我还是更关心下个月的那款耳夹式开放耳机。 过去一年多,耳夹式开放耳机完全称得上「异军突起」,2023 年年底华为 FreeClip 率先在国内开启这股风潮,Bose Ultra 开放式耳机紧跟其后,在 2024 年年初带来了更好的声音表现,共同推动大量厂商跟进耳夹式开放耳机这个品类。 如果说过去一年耳机行业这两年还有什么新品类能被反复提起、频频登上热搜,那基本就是耳夹式开放耳机了。 而在 AWE 2025 前夕,知名运动耳机品牌韶音也带来了首款耳夹式开放耳机 OpenDots One,同时小米也被曝出今年会推出首款耳夹式开放耳机,再加上已经预告的 OPPO,耳夹式开放耳机的崛起和流行已经成为一个毫无争议的事实。 图/雷科技 某种程度上,耳夹式耳机正处在一个「风口刚起」的时间点——技术刚好成熟、用户需求逐渐明朗,而品牌也终于嗅到了趋势拐点。更重要的是在 AI 大模型的技术冲击之下,耳夹式开放耳机可能不再是一个「新奇特」的小众耳机品类,而是可能改变人们日常佩戴习惯的主流选项之一。 1 降噪和音质并非最强,耳夹式耳机为何火了? 要理解耳夹式开放耳机为什么能在过去一年迅速崛起,绕不开两款产品:一款是 2023 年 12 月底发布的华为 FreeClip,一款是 2024 年 2 月中登场的 Bose Ultra 开放式耳机。它们几乎从两个完全不同的品牌语境出发,却殊途同归,共同指向了一个新的耳机形态答案: 既要听得舒适,也要戴得自然。 首先是华为 FreeClip。这款耳机发布之初,最吸引眼球的是它极具辨识度的「C 形桥」外观设计——像耳饰一样夹在耳廓边缘,不入耳、不封闭,却能稳定贴合。相比传统 TWS 的入耳结构,FreeClip 提供了一种更接近「无感佩戴」的方式,尤其适合那些对入耳式耳机存在排斥的用户。 即便运动跳跃也不易掉落,且不干扰妆容、不压迫耳道,这些细节上的优势很快让它在女性用户与日常生活场景中走红。 图/雷科技 更重要的是,FreeClip 不是简单换了个「佩戴方式」,而是在声学设计上做出了适配开放佩戴的系统性调整。它采用了定向传音技术,能够将声音集中“投射”至耳道方向,在保证环境音通透感的同时,尽量控制音漏和声音外泄。 结合 AI 通话降噪、智能佩戴识别、36 小时续航等功能,FreeClip 将「轻量化日常使用」这一场景彻底打透,也让耳夹式开放耳机不再只是「耳机界的新奇玩具」,而是一个可以成为主力设备的选项。 而在 FreeClip 打开市场认知的 1 个多月后,Bose 则给出了耳夹式开放耳机的「音质」解法。Bose Ultra 开放式耳机同样采用夹耳式设计,但将重点放在开放式耳机最被诟病的「音质」上。 图/雷科技 通过搭载 Bose OpenAudio 技术,Bose Ultra 开放式耳机强化低频表现,同时在定向发声结构中提升中高频清晰度,试图打破「开放式=音质差」的刻板印象。与 FreeClip 的时尚+全场景定位不同,Bose Ultra 更偏向音乐体验和声学突破,本质上指向了一个「耳夹式开放耳机」的共识: 耳夹式开放耳机,不只是可以轻巧便携,也可以「好戴又好听」。 这两款产品的接连发布,并非巧合,而是「技术成熟」背景下的自然产物。定向传音技术、低泄音设计、轻质材质加工工艺的进步,叠加蓝牙音频编解码(如 aptX)、算法的改进和音频芯片算力的提升,才使得这样一种「不入耳却能听得清、戴得稳、不扰人」的耳机形态成为可能。 而在过去,即便想要做耳夹式这种形态的真无线耳机,几乎不现实,要么音质差、要么易掉落、要么漏音严重。也就是这两年技术的演进,让厂商终于可以跨过了产品可用性的门槛。 正因如此,从 FreeClip 到 Bose Ultra,耳夹式开放耳机不仅建立了形态认知,更完成了市场教育——它不是骨传导耳机的「升级版」,也不是其他真无线耳机的「替代品」,而是一个独立的新耳机品类。 2 耳机形态大革命,耳夹式耳机成了理想形态? 如果说过去几年的真无线耳机是围绕「降噪、音质、空间音频」做文章,那么眼下正在发生的变化,更像是一次对耳机佩戴形态本身的重新思考。这个问题并不只是「谁更舒适」或「谁音质更好」那么简单,而是: 谁更有可能成为下一代大众消费者真正愿意每天佩戴、长时间佩戴、甚至忘记摘下的耳机形态? 从市场来看,目前主流的真无线 TWS 耳机形态大致可以分为四类:入耳式(降噪)耳机、半入耳式耳机、耳挂式开放耳机,以及最近爆红的耳夹式开放耳机。每一种形态都曾在某个阶段代表过「最好的选择」,但也都面临着自己的物理极限。 入耳式耳机拥有 TWS 中可能最好的音质和降噪能力,是今天地铁通勤、长途飞行场景中最强力的解决方案。然而,它也始终绕不开「耳道压迫」「久戴疲劳」这些用户感知最强烈的痛点。而且降噪越强、隔音越好,反而让耳机与外界的交互能力越弱,天然不适合全天候佩戴。 图/雷科技 半入耳式是一个相对折中的选择,苹果推出的 AirPods 4 降噪版更是在舒适度与便捷性之间找到了一个比较巧妙平衡点。但这种形态在音质、降噪和佩戴稳定性上始终不算出众,尤其是易掉、适配性较低的问题,都让它离「全天佩戴」的要求还有距离。 至于耳挂式开放耳机,它的出现主要为了解决运动场景的需求,强调稳固、防水、开放听感。这类产品在日常佩戴中客观存在一些问题,典型就是挂耳结构与眼镜存在冲突,长时间佩戴也还是容易产生耳部压迫感,同时在外观设计上侵入感和专业感更强,对很多普通消费者来说存在接受上的门槛。 图/雷科技 耳夹式开放耳机则更像是一次从佩戴出发的思考逆转:不入耳、不挂耳,轻到几乎无感,同时通过定向声波把声音送入耳道。而且,耳夹式开放耳机不干扰妆容、不挤压耳廓、支持全天佩戴,再加上定向发声带来的基本私密性与通透感,让它成为第一个真正能做到「全天候耳机」的形态。 当然,耳夹式天生不密封,降噪方面存在必然的技术短板。 定向发声可以一定程度减弱环境干扰,却无法真正屏蔽城市噪声,也不足以应对高噪场景中的通勤刚需。如何解决主动降噪与开放佩戴的兼容问题,也是一道必须正面面对的技术门槛。 不过 AI 大模型的技术演进以及 AI 助手的「上耳」应用,已经给了耳夹式开放耳机一个新方向——它不仅是耳机,更可能是耳上「AI 终端」的承载平台。 某种意义上,耳夹式开放耳机正在成为一块「技术刚好能实现、用户刚好愿意接受」的理想中点。它不会取代所有形态,但它可能是那个未来最适合大多数人、最多使用场景、最容易每天都戴的耳机形态。 3 或许,耳夹式耳机的真正对手是 AI 眼镜 当我们回看耳夹式开放耳机这股热潮,最终绕回来的,其实还是那个最朴素的问题:人们到底需要一副怎样的耳机? 是听得清楚,更要戴得舒服;是好用好听,更要不打扰生活。从第一代 AirPods 发售算起,过去八年多,TWS 耳机在音质、降噪、算法、续航上卷了个遍,但很少有人认真思考过「佩戴」这件事本身。而耳夹式开放耳机之所以能在一众「功能派」耳机中跑出来,很可能正是因为它没有试图比谁更强,而是选了一个 TWS 最成功、也最被忽略的方向: 更容易被用户戴着。 但如果从未来的角度看,耳夹式开放耳机的终极对手,或许根本不是入耳式、也不是半入耳,而是那些还没真正普及的 AI 眼镜。它们同样具备音频播放、语音交互、信息提示、环境感知等功能,也在试图成为「日常佩戴的 AI 入口」。 Rokid Glasses,图/ Rokid 所以问题来了——当我们真正需要一个能全天候陪伴、随时响应的智能终端时,你是更愿意戴上一副 AI 眼镜,还是一副耳夹式 AI 耳机?这个问题,可能要在接下来的两三年,用实际的产品体验和销量来回答。
用ChatGPT新功能修了张图发朋友圈,结果私信全在问怎么做到的?
在今天凌晨 OpenAI 发布新一代文生图功能的时候,大家还不是很清楚它的实力,还以为是跟在 Gemini 后头,带来一些迟到的升级。 GPT 不语,只是一昧地让用户案例震惊全场。 在最新的迭代中,OpenAI 带来了文生图功能上,突破性的指令遵循和一致性表现。只需最简单的文字 prompt,就可以实现高精度的图片细部微调——一切修改只需要在会话当中进行,无需任何按钮、笔刷等额外操作。 魔法不用笔刷,只用咒语 和 Gemini 类似,这次 OpenAI 的更新,重点不在于能做多写实、多复杂的图片,而在于指令遵循和一致性,并且是在只使用自然语言指令的前提下。 先来看一组比较入门级的食物照片,prompt 也非常简单:generate an image of coffee and bread。 随后,在原图的基础上要求改成冰咖啡、涂果酱。 除了杯柄之外,该加的加,该留的留,指令遵循非常出色。 涉及到人像的图片,也有稳定的表现。 仔细看的话,还是有一些小地方是在变动的,但最关键的人体动作、衣服皱褶、表情,都没有瑕疵。 在这组图的时候,碰到了内容风控,报错称不符合政策要求。不过,它理解到了原指令的意图,提出了修改方案。 这最后一张,也是生成效果最好最自然的一张。 画面内容简单的任务自然是手拿把掐,那么复杂一点的呢? 之前在 Gemini 的生图测试中,我们出过一张城市街头景象,效果非常惊人,再看一遍: 同样的 prompt,给 ChatGPT 执行,在画面效果上稍微差了一点,尤其是到夜晚这张,几乎已经看不到人群细节了。 当然这个问题比较偏向于是审美不同,在对关键元素的识别上是没问题的,甚至能捕捉到「茑屋书店」这样小的细节,字体生成也挺稳的。 除了直接用文字生成,还可以上传图片进行修改——这里,最震撼的一集来了。 在上传了 png 格式的 APPSO 标志之后,第一步简单的变个 3D 立体。 效果还可以,阴影方向不一致,但符合光线本身即可。接下来再做点调整。 震撼!这两次调整的 prompt,不过是二十来个字而已。 (甚至默认数码产品都是 Apple 的,一些没有说的属性真是偷偷藏不住呀。) 随后的小角度微调也很准确。 ▲ Prompt:调整角度,使红色logo变成正面,其余保持不动 细节微调是这次更新非常大的亮点,能够准确将指令与相对应的细部关联起来,从而完成精确的局部修改。 ▲ Prompt:调整角度,镜头从右前方拍摄,整体光线变暗,一束强光从右侧打亮机器的一部分,旁边搭配咖啡豆 指令中包含了光效、镜头角度、元素增补等关键内容,模型能够准确识别,而且整体性地进行调整。指哪改哪四个字,都已经说倦了。 这次的更新中,最意外的应该是在同一个会话中,生图和生文迅速切换的能力。 比如在下面这张图中,最早的指令是生成一个礼物包装指南。 首先给出来的是一个图文版——不算是错,我没有指明是要做图文版,还是文字版,指令是很模糊的。 在生成文字版之后,ChatGPT 主动询问是不是要做图文版,在收到确认的答复之后,给出了图文并茂的版本。 这意味着模型的准确反应,不仅体现在理解单一指令上,也体现在领悟用户潜在意图上,比用户「多想一步」。 实际上,这也是此前 Deep Research 发布时就展现出来的能力。OpenAI 的深度检索,是少数会主动向用户询问、明确任务执行细节的模型。 类似的能力,这次迁移到了生图当中,从使用感受而言,比在 Deep Research 上的更直观可感。 例如可以用来制作日常的告示说明,图文一锅都「端」了。 整体来看,这次最惊人的肯定要属一致性和指令遵循的同步到位。 按照惯例,每次测评都应该有一些「使用指南」——这次真的没有发现什么注意事项,一切只要按照自己的想法,敲击键盘,输入文字,就行了。没有什么「技巧」或者「窍门」。 通过 prompt 生图及改图的一致性,是文生图非常关键的问题,它既跟模型能力相关,又和工程能力相关。在指令遵循和一致性有这么大的进步之前,主要是通过 prompting 来解决的,压力是在用户这一边。 所以会有各种各样的 prompt 模版、攻略,教大家怎么「跟模型打交道」。但那不是自然语言交互应该有的状态,模型在面对人的时候,接受的就是用户最直接的指令——让人先学一通怎么写 prompt,着实很劝退。 Gemini 和 OpenAI 近期的更新,让热度有所降低的生图赛道又重新热闹了起来。它们也展示出了同一个共同点:一些修图改图产品,通过增加按钮、入口,来增加生图的可操控性,以此来对抗模型幻觉的日子,已经远去了。 一致性的问题解决的并不仅仅只是图片生成的问题,更加是「使用图片生成功能」过程中的小麻烦。某种意义上,也是一种工程层面的优化。 修改、生成都是可以用模型对文字指令的准确理解来实现——在这个层面上,「模型即产品」仍然成立。
路透:对AI支出巨大却无回报,投资者或将对欧洲公司失去耐心
欧洲AI 凤凰网科技讯 3月26日,路透社报道,在生成式AI领域投入巨额资金的欧洲企业,明年必须开始展现其回报,否则在投资者可能会失去耐心。 最近几周,随着经济衰退担忧加剧,与生成式AI相关的股票和整体股市一样陷入下跌行情。自今年1月DeepSeek推出引发科技股抛售以来,该行业承受的压力进一步增大。 在硬件制造商中,芯片设备制造商ASML和贝思半导体自1月24日以来,股价分别下跌了25%和20%。为数据中心提供电气设备的法国施耐德电气股价下跌了14%。 与此同时,在人工智能应用企业中,数据集团伦敦证券交易所集团股价下跌了5.5%,而 RELX下跌1.6%。德国商业软件集团SAP股价下跌2.9%。 富达1月份公布的一项对100多名分析师的内部调查显示,近72%的分析师预计人工智能在2025年不会对他们所关注公司的盈利能力产生影响。 接受调查的富达分析师中,有更多人认为人工智能在未来五年会产生积极影响。然而,几位欧洲投资组合经理向路透社表示,他们的投资时间框架要短于五年。 美盛资产管理公司全球主题股票团队首席投资组合经理史蒂夫・雷福德表示:“除非开始看到投资最终产生一些回报,否则市场将对在人工智能领域无节制的投资失去耐心。” 雷福德称,如果采用人工智能的公司在2025年没有太多成果,可能会被市场容忍,因为这一年它们可能在进行beta测试和试验,但到2026年,投资者需要开始看到这些公司的营收受到显著影响。 与人工智能相关股票的估值相对较高。根据伦敦证券交易所集团的数据,斯托克600指数的平均市盈率为17倍,而像SAP这样的人工智能应用企业,市盈率在90倍以上。 瑞银奥康纳对冲基金首席投资官伯尼・阿孔表示,如果一些公司到2025年底仍未取得成果,投资者将开始质疑它们的市盈率。 他说:“在这一年里,管理层总是可以找借口,说别担心,下季度就会有成果……对于一个持续多年的主题来说,情况往往如此。但到了第四季度,如果还没有成果,那么……人们就不会再有耐心了。”(作者/陈俊熹) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
OpenAI深夜紧急直播狙击谷歌!新GPT-4o图像生成免费用,文本控制更准,Altman自制AGI梗图
作者 | 程茜 编辑 | 心缘 智东西3月26日报道,今日凌晨1点,谷歌发布Gemini 2.5思考模型家族首个Gemini 2.5 Pro实验版本,大约一小时后,OpenAI创始人兼CEO萨姆·阿尔特曼就开直播发布了迄今为止最先进的图像生成器GPT-4o图像生成技术。 这是ChatGPT生成功能一年多后的首次重大升级,更新点在于其可以生成更准确呈现文本、遵循指令,OpenAI还为其挂载了固有知识库,其可以根据知识库或上下文帮用户生成、编辑图像。 阿尔特曼在直播里现场自拍生成了一张AGI梗图,最右侧的就是阿尔特曼。 阿尔特曼还发了一篇小长文谈了自己的感想,第一点他谈到看到这个模型产生的第一批图像,“很难理解它们真的是由AI制作的”,第二点他提到了这一模型的风险,其拉高了创作自由的水平线,OpenAI将知识自由和控制权交到用户手中,他们认为尊重社会最终会选择为AI设定的非常宽泛的界限是正确的做法。 今天起,GPT-4o图像生成已经作为ChatGPT中的默认图像生成器向Plus、Pro、Team和免费用户推出,企业和教育用户将很快允许访问。这项功能也可以在Sora中使用、或者通过专用的DALL·E GPT访问。开发人员很快将能够通过API使用GPT-4o生成图像,并在未来几周内推出访问权限。 与作为扩散模型运行的DALL·E根本区别是,GPT-4o图像生成是原生嵌入在ChatGPT中的自回归模型。OpenAI根据在线图像和文本的联合分发来训练模型,使得模型可以学习图像与语言的关系,使其生成有用、一致且具备上下文感知的图像。 不过,OpenAI的博客提到,因为这个模型会创建更详细的图片,所以图像需要更长的渲染时间,通常会达到一分钟。 一、可生成手写体文字、图像编辑、照片级质感,还能利用知识库做海报 OpenAI在官方博客中发出了不少GPT-4o的生图案例。 其中一个提示词是“用手机拍摄的玻璃白板的广角图像,位于俯瞰海湾大桥的房间里。视野显示一名女性正在写作,她穿着一件带有大型OpenAI标志的T恤。笔迹看起来很自然,有点凌乱,我们看到了摄影师的倒影”,提示词后文还附上了需要在白板上出现的文字。 GPT-4o生成的图像考虑到了每个细节:白板上的文字、主角的衣服、背影的海湾大桥、摄影师。 第二个提示词是:“摄影师的自拍照片,她转身与他击掌。”图像中,两位主角的动作发生变化后,白板上的人物倒影也对应发生变化,其余文字、海湾大桥的倒影没变。 下一个提示词中主要生成的内容是“两个20多岁的女巫阅读路标的照片级实感图像”。并附上了上下文对图像中路牌上的内容、周围环境的信息进行了补充,并给出了从背景到前景的人物与其他物体位置关系。在生成的结果中, 女巫形象、周边环境等的信息都基本符合需求。 还有更为实用的场景是,让GPT-4o生成菜单,提示词中除了需要包含的菜品、价格及简介外,还需要生成的图像中包含这家餐厅的名称、主要亮点以及菜单风格。 此外,用户还可以通过自然对话进一步优化图像。 例如设计以一只猫为原型的电子游戏。可以先创建主要角色,上传一只猫的图片并为其添加侦探帽和单片眼镜,然后通过生成以这只猫为主的游戏界面、场景、用户界面等。 其次是贴纸,生成极简主义小浣熊吃草莓的贴纸,粗白色边框和透明背景,然后换风格改灰色浣熊、添加小浣熊正在吃草莓的细节。 GPT-4o的图像可以遵循详细的提示,如处理多达10-20个不同的对象。下面给出了16个对象,GPT-4o生成了对应的图像。 GPT-4o可以分析和学习用户上传的图像,将其详细信息无缝集成到其上下文中,为图像生成提供信息。 例如下面的提示词是基于一些参考图,生成三角形车轮的车辆绘制设计图,其生成图像的风格与参考图类似,且附上了提示词中的重要部件、专利等信息。第二轮提示词将其放到纽约市的场景中,基本信息也并没有丢失,并与周围环境进行了融合。 GPT-4o还可以将其知识与文本、图像联系起来。如给出包含4种最受欢迎的鸡尾酒的手写卡片、制作视觉信息图说明为什么旧金山雾气大等。 二、自回归模型为生成模型引入新风险,编辑一致性、幻觉、多概念呈现仍需改进 因为GPT-4o图像生成是原生嵌入在ChatGPT中的自回归模型,这引入了一些不同于以前生成模型的新功能,并带来了新的风险: 图像到图像转换:此功能允许GPT-4o图像生成将一个或多个图像作为输入,并生成相关或修改的图像; 照片真实感:GPT-4o图像生成的高级照片级真实感功能意味着其输出在某些情况下可以具有照片的外观; 指令遵循:GPT-4o图像生成可以按照详细的说明,并呈现文本和指令图,引入与早期模型不同的实用性和风险。 目前,OpenAI研究人员已经发现其生成图像方面的局限性: 图像方面,GPT-4o有时会对海报等较长的图片裁剪得过于紧凑;模型难以保持对用户上传的人脸的编辑一致性;用户编辑图像生成的如拼写错误的特定部分的请求并不总是有效的,并且还可能以未请求的方式更改图像的其他部分或引入更多错误;GPT-4o难以依赖于知识库的一次准确呈现10-20多个不同的概念,例如完整的元素周期表。 此外,其在生成图像方面也会存在幻觉,在上下文信息较少的提示情况下,图像生成功能可能会编造信息,以及在复杂度高的情况下,模型难以渲染菲拉丁语言,并产生错误的字符。 其博客提到,对用户上传的人脸的编辑一致性的错误将在一周内得到修复。 在研究过程中,为了解决GPT-4o图像生成带来的独特安全挑战,OpenAI使用了多种缓解策略: 聊天模型拒绝:在ChatGPT和API中,主要聊天模型充当第一道防线,防止生成违反相关政策的内容。根据其训练后的安全措施,聊天模型可以根据用户的提示拒绝触发图像生成过程。 提示阻止:此策略在调用GPT-4o图像生成工具后发生,包括在文本或图像分类器将提示标记为违反我们的策略时阻止该工具生成图像。通过先发制人地识别和阻止提示,此措施有助于防止生成不允许的内容。 输出屏蔽:此方法在生成图片后应用,它结合使用多种控制措施,包括儿童性虐待材料(CSAM)分类器和以安全为中心的推理监控器,以屏蔽违反政策的图片输出。该监控器是一个多模态推理模型,经过自定义训练,可以对内容政策进行推理。通过评估生成后的输出,从而提供额外的保护措施,防止用户创建不允许的内容。 加强对未成年人的保护措施:OpenAI使用上面列出的所有缓解措施为未满18岁的用户创造更安全的体验,并设法限制这些用户创建某些类别可能不适合年龄的内容。目前禁止13岁以下的用户使用OpenAI的任何产品或服务。 结语:图像生成模型再进化 图像生成模型此前在文字生成、对需求的准确理解上都有一定局限性,这也是当前多模态模型企业们重点突破的方向。此次,GPT-4o的图像生成能更精确地遵循指示、渲染文字,还支持多轮迭代优化图像时保持角色形象一致,在图像生成的质量上实现了提升。 不过,从目前的生成结果来看,GPT-4o的图像生成还存在幻觉、裁剪不当、编辑无法保持一致性等问题,这也是OpenAI后续研发的方向。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。