行业分类:
加载中...
头条分类:
加载中...
DeepSeek介绍R1升级细节:推理能力大幅提升,幻觉率最高降低50%
凤凰网科技讯 5月29日,昨日DeepSeek透露R1进行了小升级,今日DeepSeek官方详细介绍了此次更新的变化。据悉,DeepSeek R1模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。升级后的新模型在推理能力、编程、写作、幻觉改善等方面有了巨大的提升。 深度思考能力强化 DeepSeek-R1-0528仍然使用2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。 更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。 DeepSeek-R1-0528 在各项评测集上均取得了优异表现(基准测试使用 64K 输出长度;在 Humanity's Last Exam 中,只使用其中的文本题目进行测试) 相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试中,新版模型准确率由旧版的 70% 提升至 87.5%。这一进步得益于模型在推理过程中的思维深度增强:在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。 同时,蒸馏DeepSeek-R1-0528的思维链后训练Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。该8B模型在数学测试AIME 2024中仅次于DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。 DeepSeek-R1-0528-Qwen3-8B 等开源模型的 AIME 2024 对比结果 其他能力更新 幻觉改善:新版DeepSeek R1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50% 左右,能够有效地提供更为准确、可靠的结果。 创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。 工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Bench 测评成绩为 airline 53.5% / retail 63.9%,与 OpenAI o1-high 相当,但与 o3-High 以及 Claude 4 Sonnet 仍有差距。 示例为通过 LobeChat 使用 DeepSeek-R1-0528 的工具调用能力得到的网页文章总结 此外,DeepSeek-R1-0528 在前端代码生成、角色扮演等领域的能力均有更新和提升。 示例为在网页端调用 DeepSeek-R1-0528 使用 HTML/CSS/JavaScript 开发的一个现代简约风格的单词卡片应用 API 更新 API 已同步更新,接口与调用方式保持不变。新版R1 API仍支持查看模型思考过程,同时还增加了Function Calling和JsonOutput的支持。 我们对新版 R1 API 中 max_tokens 参数的含义做了调整:现在 max_tokens用于限制模型单次输出的总长度(包括思考过程),默认为 32K,最大为 64K。请 API 用户及时调整 max_tokens 参数以防输出被提前截断。 本次R1更新后,官方网站、小程序、App端和API中的模型上下文长度仍为64K。如果用户对更长的上下文长度有需求,可以通过其他第三方平台调用上下文长度为128K的开源版本R1-0528模型。 模型开源 DeepSeek-R1-0528与之前的DeepSeek-R1使用同样的base模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数为 685B(其中 14B 为 MTP 层),开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。
梁文锋不语,只是一味“小更新”
摘要: DeepSeek深夜发布小更新,新版本在编程、推理能力方面大幅提升。另有行业人士认为,本次无论模型尺寸还是支持的上下文长度都有大幅提升,猜测这可能意味着R2的上线时间又要推迟了。 凤凰网科技 出品 作者|姜凡 编辑|董雨晴 今日凌晨,DeepSeek再度有了新动作——DeepSeek-R1-0528模型于Hugging Face平台正式开源。 在发布之前几个小时,DeepSeek小助手在官方交流群中发布低调发布了一则通知:DeepSeek R1模型已完成小版本的试升级,用户可前往官方网页、App以及小程序进行测试体验(开启深度思考功能)。值得一提的是,此次升级后,API接口及使用方式均维持原状,未作改动。 对的,没看错,官方说的还是“小版本”升级,不是人们期待已久的大版本R2发布。 相似的情况在今年3月也发生过,DeepSeek对V3模型开展过小版本升级。当时,官方率先在交流群内发布相关消息,而后才公布具体的更新详情。 实际上,关于DeepSeek-R1-0528,DeepSeek官方暂未发布基准测试成绩。不过,大家可别单纯地认为它真如官方所言,只是一次“小”迭代。 在代码测试平台Live CodeBench中,DeepSeek-R1-0528取得了73.1分的成绩,排名第四。其得分接近OpenAI的o3(75.8分)和o4-mini(80.2分),在性能表现上可直接与OpenAI的o3相媲美。社区推测可能是原计划中的R2模型提前以R1升级版形式推出。 另外在一些行业人士看来,参数量攀升至685B,上下文达到164K,是大幅增加,“应该是原本的R2,但效果不及内部预期没升级版本号”,AI博主Orange AI称。 而从实际体验效果来看,经过多方用户的反馈,普遍表明DeepSeek - R1 - 0528在编程能力、逻辑推理能力以及交互能力等多个方面都取得了很大的进步。 在X平台上,有网友总结了更新后的几个亮点: 1、可以像谷歌模型一样进行深度推理 2、文本生成优化:更自然,格式更好 3、独特的推理风格:不仅快速,而且更深度 4、长时思考:单任务处理时长可达30-60分钟 值得一提的是,这可是能是唯一一个目前能正确做对「9.9 - 9.11」谁更大“难题”的模型。 凤凰网科技也尝试着让DeepSeek跑了两个程序试试。 第一个prompt:生成一个天气预报卡片,选中单个卡片时有动态效果,如下雨、晴天等等。 图|来源于凤凰网科技 第二个prompt:设计一个饮食记录卡,记录每天的食品摄入,并标记相应的卡路里,以及建议的运动计划,可以设计一些扁平化的按钮。 图|来源于凤凰网科技 不过也有行业从业者反馈,由于prompt输入的不同,不同使用者生成的效果差异较大,一些人将其代码能力类比Claude3.7,还有更广泛层面用户反馈称“感觉幻觉率下降了”、“文字水平有一些提升”。 从这次更新来看,DeepSeek还在往越来越好用的路上走,留给其他国产闭源大模型的时间真的不太多了。
DeepSeek R1悄悄更新!用“小版本”干翻大模型
虽然DeepSeek-R2并没有像2个月之前盛传的那样,在5月甚至之前准时赴约。但是,DeepSeek正在不断地用小升级追赶其他厂商的大版本。 昨天DeepSeek官方的一则「R1已完成小版本试升级」的消息,在各个AI讨论群里炸开了花。这回的DeepSeek-R1-0528版本在各个社区引发震动的最主要原因是:它真的不是一次小更新! 目前该升级版的DeepSeek-R1-0528已经全量上线官方网页、APP、小程序等等,API也已经可以接入。 关于DeepSeek官方多么有诚意,我们已经在V3版本的升级上看到了——模型性能大幅提升只是开胃小菜,成本价格比更是再度优化。这回的更新也是一样,新版本的DeepSeek-R1主要在编程能力上大幅提升。据一家LLM API接入网站OpenRouter,这回的新版本R1的输入输出价格几乎与先前版本毫无变化! 在智能水平上,新版本DeepSeek-R1-0528在 Extended NYT Connections 基准测试上相比原始 DeepSeek R1有了大幅提升:38.6 → 49.8。 01 它真的很难说是「小升级」 现在,全网都在疯狂拿它跟全面替代AI coding真神的Claude 4对比,发现:这俩模型竟然不相上下?甚至有一张在Livecodebench上DeepSeek-R1-0528与o3-high旗鼓相当的基准测试对比图,在网上疯传。许多网友认为这回更新后的DeepSeek-R1-0528在代码生成等编程领域的实力已经进入第一梯队了。 我们搜集了全网最有趣的实测体验,看看这回的DeepSeek-R1-0528到底将AI coding的能力拓展了多少: 有X网友@karminski3设置了一个「DeepSeek-R1-0528 VS Claude-4-sonnet」挑战赛,用弹球撞击墙面的效果作对比。 实测下来发现:DeepSeek方的弹球看起来甚至还有光泽,撞碎墙面后的粒子效果几乎能与Claude-4-sonnet一较高下,控制面板的美观度也都非常在线。 值得一提的是,在这次的测试中,两个大模型使用了同一个Prompt,DeepSeek-R1-0528 生成了728行,而Claude-4-sonnet生成了542行。 更新后的R1-0528在粒子效果的表现上尤其好。粒子效果通常会涉及复杂的动态动画和物理模拟,像是物体运动、碰撞、光影变化等等。这足以说明R1-0528在生成复杂动态动画能力上有了很大的突破。 X网友MILO,就做了个可交互的粒子动态动画平台,我们也进去体验了下。我们注意到除了画面中央的炫酷粒子爆炸外,右上角的粒子数计算也以一种很匹配的方式同步进行着。 在全栈网页开发上,「小升级」之后的DeepSeek-R1-0528所表现出来的能力也有了很明显的提升。 比如,X上有网友@DomLiu给 DeepSeek-R1-0528 一个全栈网页开发Prompt,就能在几秒钟内从零开始构建了一个完整的应用程序。 这段提示词还非常的简单:构建一个 three.js 应用程序,用于加载具有实时颜色/材质/配件控制的 3D 模型。直观的用户界面。流畅的相机视角。 更为惊艳的是下面这个Case,同样是这位网友,他几乎将DeepSeek-R1玩出了花,这也证明小升级后的DeepSeek-R1-0528到底在编程能力上有多强。 简单来说,他使用升级后的DeepSeek-R1做了一个3D画廊,有这些功能: 程序化几何生成,动态场景生成系统,多彩动态光影效果,相机动画与过渡,虚拟画廊导航体验。 有实际用过Trae、Cursor、Windsurf等一众AI coding的朋友肯定都懂一个具有强大自主编程能力的基座大模型到底意味着什么?——编程效率的指数级提升。 3D艺术画廊非常直观地显示了DeepSeek-R1-0528在面对复杂任务时的自主编程能力。 再比如一个3D 太阳系模拟器,在这个产品中,可以点击任何行星获取进一步的信息。同时画面中呈现了极具真实感的轨道。它同样使用 three.js 构建,简洁、快速、交互性强。 我们也实际上手测试了下,发现升级后的DeepSeek-R1-0528在面对非常简单的提示词时也能做出很快的反应,并自主地丰富功能。 比如,我只给了它一句: 生成一个苹果官网风格的前端网页。 它只经过14秒的思考,就轻松理清了苹果官网风格设计页面的设计思路: · 使用苹果标志性的深空灰/银色调 · 大字体标题和简洁文案 · 高清产品图像与渐变背景 · 悬浮动画效果 · 响应式布局 最主要的是,很短时间内它就已经生成了462行代码,做出来的效果也与我所设想的非常相近: 除了纯代码能力之外,DeepSeek-R1-0528在前端审美上也有了很大的提升。 比如下面这个原生iOS风格界面设计,采用了抹茶绿色主题,融合现代美学,看起来搭配很流畅。 除了产品应用UI风格之外,DeepSeek-R1-0528在HTML网页的前端网格上也有了很大的提升。 下面两组新版本的介绍网页中,深色是DeepSeek-R1-0528生成,在美观度上更具科技感和视觉冲击力,也非常符合AI大模型本来的调性;白色则是由Claude4生成: 02 思维链似乎改变了,出现了一些「副作用」 这回DeepSeek-R1-0528的强势开源,甚至让各国网友都重温了下今年年初R1发布时的情景。现在的DeepSeek-R1-0528已经拥有了Claude系列的强自主编程能力,同时网友们在实际测试中也注意到它的思维链模式似乎发生了改变。 很多实测后的网友都发现这回的升级版DeepSeek-R1-0528的思考过程实在是太长了,很容易出现过度思考的现象。 比如,网友们发现了一个有趣的测试题:「估算一下π/7」,发现DeepSeek-R1-0528的思考推理过程有些太漫长了。 我们也实际测试了下,面对这样的一个小问题,DeepSeek-R1-0528的深度思考时间达到了148秒。并且,其推理过程显得冗余性很大。 DeepSeek-R1-0528在面对「估算一下π/7」这个问题时的思维链到底有多长,你可以直观感受下: 虽然各国网友都直观感受到了升级后的DeepSeek-R1-0528在推理能力上消耗的时间变得长了,但推理结果精度的提升也是显而易见的。经过优化的DeepSeek-R1-0528在处理复杂问题时,已经展现出了更强的逻辑分析能力和更细致的推理过程,这使得输出的答案不仅更加准确,还在深度和广度上都有了显著改进。 比如,X网友@baalatejakataru在实际编程过程中发现新的 DeepSeek-R1-0528想得太多,但是出错时能够快速地自我纠正,还能够很好地写新兴系统编程语言——Zig,表现很不错。 DeepSeek官方这回同样延续了之前发布即开源的策略,R1-0528已经正式开源。除了开源动作之外,更新后的R1仍然采用宽松的MIT许可证,意味着它可用于商业用途。 这次DeepSeek-R1-0528的升级,进一步印证了当下大模型行业的趋势:大版本固然令人期待,但持续稳定的小步迭代同样无法让人装作看不见。 虽然DeepSeek-R2尚未如期而至,也引发了全网对于这一版本的疑惑。但是通过强化编程能力、优化前端审美,DeepSeek团队持续的小步快跑,无疑让业界重新审视小版本升级的巨大价值。尽管思维链的冗长带来了一些「副作用」,但其带来的精度提升和自我纠错能力依然让人无法忽视这次的版本升级。 在未来,DeepSeek-R1-0528的这种不改变大架构,而是通过「小升级、小迭代」就能达成明显效果的方式可能将会成为主流,「大版本号盲目崇拜」已经被破除。 下一次「小升级」,或许就是另一场风暴的开始。
快手Q1财报:可灵还是太灵了
5月27日,快手交出了今年一季度成绩单,业绩稳健且有不少亮点:快手应用的平均日活跃用户达到4.08亿,创历史新高;总收入同比增长10.9%至326亿元,毛利率近55.0%,经调整净利润达到人民币46亿元,经调整净利润率为14.0%。 业绩发布后,市场也给出积极反馈,5月28日港股开盘后,快手股价应声上涨,高开6.46%,截至当日收盘股价仍维持超5%的涨幅。瑞银、高盛等券商均保持“买入”评级,同时摩根大通还给予了“超配”评级。 值得关注的是,仔细看整份财报,就会发现其中AI的“含量”相当高—— 首先是AI技术对各原有业务的深度赋能,电话会上,管理层详细解读了AI技术融合原有业务的技术落地路径,无论是线上营销服务、电商、还是本地生活、快聘、理想家,AI都有对应赋能业务的解决方案,帮助各业务对应的商家客户降本增效。 其次,可灵AI作为战略重点表现抢眼,财报中强调其商业化变现加速,2025年第一季度可灵AI收入超过了1.5亿元。 “技术红利正加速转化为业务增长动能。”如快手科技创始人兼首席执行官程一笑所说,曾经所有行业都值得用AI重做一遍还只是口号,但现在已是快手重构平台的核心支点。 AI穿透业务毛细血管 当下AI技术在各行业广泛渗透,已从“技术演示”阶段迈向了“业务融合”的新阶段。快手也不例外,从近一年来的财报电话会议可以看出,快手的AI战略一直是基于自身生态场景展开AI探索,将AI深度植入现有业务毛细血管。 首先是内容生态方面,由于用户日均注意力切换频次日渐提升,兴趣主题跨度愈发多样,如果只依赖静态偏好模型存在一定滞后性。因此快手利用AI大模型加深对内容和用户兴趣的理解,传统推荐算法一切强调数据,而搭载了大模型的推荐算法则在数据的基础上增加了用户兴趣的分子,实现内容价值与用户需求的精准匹配。 同时,快手也将数字人直播应用在了快聘和理想家业务中,24小时不间断直播,在提高内容生产效率和质量的同时,加速提升了线索收集效率。2025年一季度,有超20%的新主播使用快聘数字人直播间,快聘数字人直播场均线索同比增长169%。 磁力引擎女娲数字人直播 其次是商业化方面,今年的磁力大会上,快手已提出要打造“下一代AI智能商业引擎”,AI能力在营销各个环节上落地应用,既解决核心痛点,也着力降本增效。 在广告营销的起点——素材生产环节,快手通过AI技术实现了素材创意、用户需求与营销目标的深度对齐,今年一季度AIGC营销素材的日均广告消耗已达3000万元。更加拟人化、更具互动性的数字人直播女娲,也在帮品牌商家实现24小时不间断开播。 广告投放环节,全站推广Agent4.0让全域投放更稳、调控工具更丰富,经营操作也更便捷。财报显示2025年第一季度,电商商家使用全站推广Agent 4.0或智能托管进行营销推广的总消耗,占内循环总消耗的比例达到60.0%。 UAX全自动化投放产品,则是完全改变了传统的人工操盘盯盘模式,实现了广告投放的智能化和自动化。2025年第一季度,UAX全自动投放的总营销消耗占外循环总消耗的比例已提升至60.0%以上。 UAX全自动化投放产品 在智能匹配及竞价推理中,快手利用多模态大模型进行智能匹配,深度理解广告内容、透视用户决策链路,基于前期对用户和内容的深刻理解与学习,端到端地生成用户感兴趣的广告,实现了广告主的精准匹配。在竞价推理方面,大模型实现了竞价的自动化和智能化,优化了广告主的投放成本与回报比。 受益于AI的赋能,今年一季度快手的线上营销服务收入达到了180亿元,略超市场预期。 此外,快手也将AI运用在了电商业务中,助推一季度电商GMV同比增长15.4%,达3323亿元。 事实上很多商家普遍都存在“技术焦虑”,一方面看到AI浪潮,害怕错失新技术红利;另一方面对新技术的认知少,应用能力也弱。因此快手也以AI能力赋能商家全链路经营—— 2025年第一季度,快手为直播场域经营的商家提供了全套智能开播工具,包含AI话术生成、直播讲解提词器、智能选品等能力,越来越多的新商家借助这些工具取得经营突破。 同时,快手以AI能力提升人货匹配精准度,应用大模型自动识别强关联类目和兴趣标签,让算法更理解用户潜在需求,实现跨场景需求预判,提升人货匹配效率。与此同时,快手还通过AI智能客服、AI试衣和AI直播切片等多种工具,帮助商家提高电商营销和服务能力,降低商家经营成本,提升经营效率。快手财报显示,2025年第一季度,AI自动生成的直播切片日均GMV同比增长超过300%;智能客服系统搭载了大模型后,问题解决率已提升至80%,显著节约了商家成本并且缩短平均响应时长。 针对于本地生活业务,快手同样以AI作为本地商家的增长引擎。 本地生活一直存在“大而散”、细分品类多且差异大的特点,而且偏传统保守的商家占多数,对线上经营以及AI技术的了解比电商商家更少。 今年,磁力开创AIGC素材、女娲数字人直播、数字员工π等AI产品体系都已经陆续应用到本地生活场景中。特别是数字员工π,其私信经营能力显著提升了本地商家的留资率。 数字员工π 针对本地生活商家的产品“本地投”,近期也是划分出了团购和线索版两个版本。其中,线索版主要解决决策链路长、留资率低的问题,其中亦有AI作为金牌客服,在零人工介入情况下提升留资效率。 从内容生态到营销,再到电商以及本地生活,快手以AI实现了自身所有业务的智能化升级,长期来看这不仅提高了用户体验和商家经营效率,还将为快手带来更广阔的增长空间。 可灵突围, 持续抢占全球市场份额 不只是快手,互联网大厂们都在赶AI这趟快车,纷纷跑模型、拼基建,想要在这场技术革命中抢占先机。就在大语言模型和图像生成模型普遍成为大厂重心的时候,快手也选择了一条与众不同的路——重点押注于能够最大化发挥自身优势的视频模型上。 2024年6月,可灵AI大模型上线,由于是较早就确定了方向,并且持续坚决地投入,可灵AI迅速崭露头角,并展现出行业领先的模型能力与商业化潜力。 可灵AI Web端 模型能力方面,可灵AI自从去年6月首次上线开放测试以来就经历了二十多个版本的快速优化迭代。今年升级到2.0版本后, 可灵AI在动态质量、语义响应、画面美学等维度均保持了全球领先,在指令遵循、电影质感及艺术风格表现等方面也有显著提升。 同时2.0版本中,可灵AI还提出了全新理念多模态视觉语言Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中的多维度复杂创意,直接高效地传达给AI,为用户带来了更加流畅、自然的视频生成体验。 近期,全球著名大模型整合应用平台Poe发布了2025年春季AI模型使用趋势报告(1-5月),报告显示,在文生视频领域,快手可灵的多个视频生成模型获得了共约30%的使用份额,领先于Runway和谷歌的Veo2。可灵2.0大师版在2025年4月末发布的三周后,占据了全部视频生成中的21%。 Poe 2025年春季AI模型使用趋势报告 近日,可灵AI又推出了全新2.1系列模型。新模型在性价比方面优势显著,在标准模式(720p)下生成5s视频仅需20灵感值,高品质模式(1080p)下也只需35灵感值,能够满足不同用户对于成本控制的需求。在生成速度方面,高品质模式(1080p)生成5s视频仅需不到1分钟,处于业内领先水平。 随着本次新版本的推出,可灵AI进一步完善了产品布局:其中,可灵2.1主打高效灵动、超高性价比,可轻松覆盖短视频、营销广告、AI短剧等绝大多数的视频创作场景;可灵2.1大师版则延续了其高端定位,持续探索模型能力上限,进一步巩固了其技术领先地位,适用于专业影视制作和商业级应用场景。 除了模型能力的持续提升外,可灵AI的商业化潜力也值得关注。 在当前AI大模型能够规模化商业落地的占比尚少、商业化成熟度较低的背景下,可灵AI实现了视频生成技术指标与商业转化效率的共振,验证了视频大模型领域最优商业化路径的可能性,也展现了可灵AI作为快手“第二增长曲线”的潜力。 根据财报数据显示,今年一季度可灵AI营业收入超过1.5亿元,这背后得益于其多元商业化路径。 首先是P端用户(即自媒体视频创作者和广告营销从业者等专业用户)贡献了可灵AI将近70%的营业收入,其订阅会员数量和ARPU值均呈现较高的增速。他们一方面如同“技术品鉴师”一般,提升可灵AI的技术认可度;另一方面他们也具备意见领袖能力,持续推动可灵AI在视频生产力工具赛道里的领先站位。 其次可灵AI也面向B端用户即企业提供API接入合作,目前已为超过1万家的企业客户提供服务,涵盖专业创作平台、广告营销、影视动画、游戏制作和智能终端等多个行业,且企业客户的续费率高。不同行业企业客户的认可,也展现出了可灵AI横向可扩展和纵向可定制的双重特性。 5月28日,J.P摩根发布研报表示,可灵AI的业绩表现超出了其预期,“可灵一季度1.5亿的收入表明我们对可灵2025年全年4.5亿元人民币的收入预期可能较为保守。” 高盛绩后发布的报告也给予了可灵高度积极评价,认为其在AI视频生成领域的竞争力与谷歌不相上下,并且在海外用户中具有较高的吸引力。 总的来说,快手的AI战略目前已经初步取得了一定成绩,一方面以业务反哺研发、用场景牵引创新的发展模式,正在重塑快手;另一方面,差异化的模型攻克路线让快手将更多的资源聚焦在可灵上,也收获了技术和商业化的双重领先。不论是让AI与业务共生共融,还是以可灵AI探索商业化路径,都在表明当技术迭代与用户需求、商业场景形成共振时,将会引发质变。
市场还没爆发,但AI眼镜已经卷死了
AI眼镜,距离“百镜大战”只差临门一脚。 5月27日,雷鸟发布了四款AI眼镜新品。在这之前,谷歌在5月20日与中国公司XREAL发布了Project Aura AR眼镜。5月25日,李未可发布了搭载高通骁龙AR1平台的AI拍摄眼镜;5月中旬,联想也发布了两款AI眼镜新品。 算下来,今年5月份已经有10款AI眼镜上线。除了上述的厂商发布的新品,光锥智能还在近日的深圳的人工智能终端展上,还看到了来自GYGES LABS、影目科技、LOHO等厂商的多款产品。展望6月,小米也将加入AI眼镜战场。 AI眼镜已经形成了“台上三国争霸,台下群雄环伺”的格局。 而谷歌和高通的入场,也进一步标准化了系统和芯片,将AI眼镜带入了“智能手机”时代,提升了产品的使用体验,但同时降低了产品量产的门槛。 如此充足的产品供应,能让消费者快速认可AI眼镜吗? “AI眼镜要想走向普及,还缺少一个杀手级的功能。” 在接触了不少AI眼镜项目后,势乘资本合伙人刘英航总结了目前已购入的两款AI眼镜体验,“总体来说,上身佩戴体验是不错的。但要日常当作正常眼镜使用的话,还差得非常远。” 6月,随着众多新品上市,百镜大战箭在弦上。但这个市场,真的能就此爆发起来吗? AI眼镜玩家,批量涌现 随着新一轮玩家的加入,AI眼镜产品来到了相对成熟的阶段。观察近期密集发布的新品,国内的AI眼镜厂商正在软件和硬件上达成“共识”。 首先是在硬件层面。2025年的AI眼镜芯片配置,正在向高端智能手机靠拢。 2025年之前的国产AI眼镜,受限于成本因素,不少采用的是紫光或恒玄的SoC方案。这些计算方案的ISP(图像信号处理器)性能较弱,难以处理例如宽动态或低光环境的画面。这导致实际产品需要额外搭载1-2 颗外挂ISP芯片,进而使得AI眼镜的图像识别效果和轻量化都不够极致。 AI眼镜主流芯片方案对比 来源:中金公司研究部 从今年新推出的产品上看到,高通的SoC芯片正在成为AI眼镜的主流配置。 其中,INAIR直接用了高通的手机芯片作为眼镜的SoC。追求更强性能的玩家,例如李未可和雷鸟用的是高通专为AI眼镜设计的骁龙AR 1平台。在更强的芯片加持下,AI眼镜开始呈现近似于手机的显示和交互效果。 使用更强、集成度更高的芯片,让整个AI眼镜行业都快速实现了轻量化。 以拍摄类AI眼镜为例,近期发布新品的重量都做到了40g以内。相比去年AI眼镜动辄40g以上的重量,2025年的AI眼镜已经具备了长时间佩戴的可能性,起码它不再会压得人鼻梁不透气了。 而在软件层面,受益于AI大模型性能提升,眼镜厂商们正在批量落地各种AI功能。 2024年11月,Rokid与阿里通义大模型深度适配+合作研发软件,让AI眼镜快速补全了应用生态。 “这一点是跟其他产品拉开差距最重要的地方”,正如Rokid CEO祝铭明当时的感叹。仅半年之后,整个AI眼镜行业已经批量复制了阿里与Rokid的合作模式。以雷鸟为例,这次发布的新品就落地了通义大模型合作的AI。在与高德合作后,雷鸟也上线了AR导航功能。 为了打破应用软件数量“卡脖子”的问题,也有不少AI眼镜厂商选择直接拥抱安卓系统。 “我们不需要从0开始构建软件生态,这是一个非常实用的策略。” 正如INAIR联合创始人兼CEO黄海在近期采访中的总结。INAIR和雷鸟目前正在尝试“搬运”安卓APP到AI眼镜。社交、文档、视频等APP齐全的AI眼镜,将直接丰富产品的使用场景。 在AI眼镜与手机交互逻辑差异较大的问题上,例如AI眼镜没有触摸屏、AR显示相当于同时渲染两个屏幕的特性。谷歌在与XREAL合作的AI眼镜中,尝试重新定制了一套用于眼镜的“安卓系统”。 谷歌希望Android XR平台能够复制自己在智能手机时代的成功。用开放操作系统和生态的模式,吸引硬件厂商和软件开发者加入,共同扩张智能终端市场。 齐全的硬件供应链+“开源”的软件环境,让AI眼镜行业正在进入“代工”时代。 例如雷神在AI眼镜发布会上宣布与汇鼎眼视光、火山引擎、欧普康视、天键股份、亿境共建智能眼镜产业生态联盟。细分来看,其中天键股份代工生产核心硬件、亿境负责方案设计、火山引擎提供AI大脑的一条AI眼镜代工产业链已经浮现。 软件和硬件的成熟,最终使得AI眼镜呈现出产品“寒武纪物种大爆炸”的局面。面对短时间上线的各种AI眼镜新品,市场有足够能力消化这些产品吗? 细节,决定AI眼镜成败 从产品逻辑看,近期发布的AI眼镜都实现了当初对 Ray-Ban Meta的“像素级复刻”。 价格层面,国产AI眼镜(拍摄类)定价区间为2000元左右,略便宜于Meta的299美元。产品重量上,国产AI眼镜普遍比Meta轻四分之一(30g+对比49g),佩戴体验明显更友好。AI功能层面,国产AI眼镜基本都能实现AI图片识别、AI翻译、AI对话建议等功能。 Ray-Ban Meta的AI功能介绍 来源:RAY-BAN官网 AI眼镜的玩家在追逐Meta的过程中,也收获了初步的成功经验。 根据CINNO Research发布的独立监测数据显示,2025年第一季度国内消费级AI/AR眼镜市场销量同比增长45%。其中带屏AR眼镜(包括一体式和分体式)占据市场80%的份额,无屏AI眼镜则占比20%。 AR类型的AI眼镜反而占了市场主导位置,说明用户对眼镜的需求是——显示远远大于AI。 根据Meta2025财年第一季度财报电话会议的信息显示,Ray-Ban Meta眼镜的核心增长点来自AI和交互。Meta CFO苏珊·李分析称:“Ray-Ban Meta AI眼镜的月活跃用户比一年前增长了4倍以上。使用语音命令的人数增长更快,因为人们用它来回答问题和控制眼镜。” 当前国内AI眼镜的问题,主要是AI和软件功能还不够出色。 刘英航对光锥智能分析称,“AI眼镜只有部分功能满足消费者需求。拍摄类眼镜的拍摄体验很便利,AR类眼镜能满足看视频的需求。”AR眼镜高市场占比的原因,主要还是因为产品定位更明确。 AI暂时还不是AR眼镜的核心卖点,这点消费者和厂商都心知肚明。在雷鸟发布会开场,雷鸟创新创始人、CEO李宏伟提到从观影爱好者的调研中,获得了AR类眼镜的发展方向。 在另一边的拍摄类AI眼镜上,产品也存在相当多的痛点。 例如在各家眼镜厂商宣传的AI识图功能上,不少消费者认为这个功能用起来“怪怪的”。当消费者需要识别眼前的物体时,需要先拍照问AI,几秒到十几秒的时间等待后,眼镜才能反馈结果。这种体验,跟AI眼镜厂商所宣传的“有问题随时问AI”大相径庭。想要更快识别,目前国内的眼镜厂商倾向于做垂类大模型来优化速度。 最大的问题,还在于如何让AI能够持续待命上。 “拍摄时间明显不够”。一位消费者这样向光锥智能吐槽说,“持续使用时间大概就两三个小时,充电的时候需要拿出普通眼镜换着戴”。受限于电池限制,拍摄类AI眼镜100-200mAh的电池容量半天都支撑不了。 解决“AI实用性”的问题,或许国内AI眼镜厂商可以参考Meta的“解法”。例如,Meta取消AI唤醒词并允许长时间与AI聊天、眼镜拍摄照片直接导入APP编辑、APP会记住眼镜记录的细节、眼镜上的AI交互可以随时切换到APP端等。 总体来看,通过加强AI参与用户日常和手机端分担AI眼镜任务的方式,Meta在一定程度上提高了AI眼镜的使用效率。对于国产AI眼镜厂商而言,对应着需要找到更多实用的AI使用场景。 或许AI眼镜与市场之间,还需要再“磨合磨合”。
Anthropic对苹果Siri发起致命一击
5月28日凌晨,Anthropic宣布在移动设备上推出测试版语音模式, AI 版“Siri”就此问世。 用户可通过“Hey, Claude”语音指令发起语音对话,让 Claude 汇总日历或搜索文档,完成相应的任务。官宣视频里,女主人公一边刷牙一边和 Claude对话,“Hey, Claude”代替了“Hey,Siri”,描画出了AI时代的语音助手图景。 语音模式测试版现支持英语,并将在未来几周内加入所有套餐,与大家见面。有网友表示,看起来Claude正在iPad应用上上线。 由OpenAI 前员工们创立的Anthropic,是一家以安全为优先的AI解决方案提供商,专注于企业级市场,其在混合推理模型与编程能力方面具备一定行业优势,现已发展为OpenAI最大竞品之一。 今年3月,Anthropic完成了规模达35亿美元的E轮融资,估值飙升至615亿美元。这轮融资由光速创投领投,贝西默风投、思科投资、D1资本等多家知名机构参与,据悉,资金将主要用于下一代AI系统的开发、提升计算能力、深化机制可解释性和对齐研究,并加速国际扩张。 4天前,Anthropic刚刚发布了Claude 4系列模型:Claude Opus 4和Claude Sonnet 4,并宣称其为编码、高级推理和 AI 代理设定了新的标准。根据 Anthropic 的公告,Claude Opus 4 既是该公司迄今为止最强大的 AI 模型,也是全球最佳的编码模型,它在 SWE-bench(72.5%)和 Terminal-bench(43.2%)测试上均遥遥领先。 Anthropic 的基准测试显示,Opus 4 在编码任务和使用网络搜索等“工具”方面的表现优于谷歌的 Gemini 2.5 Pro、OpenAI 的 o3 推理和GPT-4.1 模型。 不仅如此,Claude Opus 4 以72.5%的SWE-bench测试成绩超越人类顶尖程序员,刷新了AI界软件工程任务的天花板。 Claude Opus 4 擅长编码和解决复杂问题,为前沿代理产品提供动力。Cursor称其为编码领域的最新技术,并在复杂代码库理解方面实现了飞跃。在需要专注投入和数千个步骤的长时间运行任务中,它表现出色,能够连续“数小时”处理长时间运行的任务。其中,Rakuten通过独立运行 7 小时且性能稳定的高要求开源重构验证了这个功能。 此外,Anthropic表示,此次Claude Opus 4 革新了工具使用和并行工具执行两个模块。首先,Claude 使用工具进行扩展思考。比如,Claude 支持在扩展思考过程中使用网络搜索工具,这种在推理和工具使用之间交替进行的方式改善了响应,提高了速度。28日凌晨,Anthropic还在X上宣布了这项功能将免费向所有Claude 用户开放。 另一方面,并行工具执行功能使得Claude 能够更精确地遵循指令,当开发人员授予其访问本地文件的权限时, Claude 可以显著提高记忆能力,提取和保存关键事实以保持连续性,并随着时间的推移建立隐性知识。如此一来,Claude 显著减少了模型使用捷径或漏洞完成任务的行为,过去AI遇到棘手的问题而“已读乱回”、“胡乱交卷”的概率大大降低。 基于上述改进,预览期间Claude收获了开发者们一众好评,但“卷王”并不松懈,随即着手扩展了编程功能,目前,Claude Code 已支持通过 GitHub Actions 执行后台任务,并与 VS Code 和 JetBrains 原生集成,可以直接在文件中显示编辑内容,实现无缝的结对编程。 一位股票分析师利用Claude完成了股票分析网页应用的搭建,包括身份验证、图表工具、股票数据API、数据库等功能,一共只花了2天时间,随即在X上大书给Claude Code的“情书”。这也不难共情,毕竟,没有什么比解决人的核心需求更令人心动了。 同时,AI 圈千呼万唤始出来的API 功能,Anthropic也没有放过,它在 Anthropic API 上发布了四项新功能,让开发人员能够构建更强大的 AI 代理:代码执行工具、MCP 连接器、文件 API 以及将提示缓存长达一小时的能力。 不过,也有用户表示,在高压测试中,Claude 4展现出“勒索”“自保”“哲学思辨”等行为,引起了人工智能伦理争议。有媒体认为,Claude 4的“机会主义勒索”揭示了强化学习算法与人类价值观的深层冲突,印证了Nick Bostrom的“回形针最大化”理论。 但换个角度看,AI的“越界”行为或许也意味着AI发展进入新阶段,人工智能开始具备类人的持续学习能力和自主决策机制。科技的创新与约束,本来即是硬币的两面。如何在AI浪潮中找到平衡,确保技术发展始终处于可控范围,从来都不在话题之外。 且看最新消息,奈飞董事长Reed Hastings将加入其董事会。 现年64岁的Hastings在科技界拥有丰富的董事任职经验,曾先后担任微软、彭博社及Meta等知名企业的董事会成员。自1997年奈飞公司创立起,Hastings长期担任CEO(后转为联席CEO),直至2023年卸任。最近,Hastings向其母校缅因州鲍登学院捐赠了5000万美元用于设立AI研究项目。该项目将重点探索AI技术的伦理框架,及其对教育、工作和人际关系的深远影响。 Anthropic在声明中表示,这一研究计划与Anthropic自身的科研方向高度契合。双方或将在AI伦理和安全领域展开更深入的合作。这或许也提示着Anthropic总裁Daniela Amodei所说的“开发有助于人类而非造成伤害的人工智能”的美好愿景。 “Hey, Claude”或许会代替“Hey,Siri”,人工智能会更迭、生长,甚至具备自主思考能力,但永远不能代替人类生活,成为世界的主体。
黄仁勋终于告别股价下跌魔咒
在很长的一段时间里,英伟达财报一发,股价就跌。 不是因为业绩不行,而是因为只是超预期还不够。市场一面期待英伟达不仅是超预期增长,还要远超预期。一面期待英伟达高歌猛进的同时,抚平外界对其高增长可持续性的种种疑虑。 这次终于不同了。 当地时间5月28日,英伟达发布2026财年第一财季(对应2025年第一季度)财报。营收同比增长近70%,达到440亿美元,其中数据中心业务营收同比增长73%,达到391亿美元,均超预期。 但坏消息也摆在台面上:特朗普政府的H20禁令,坑惨了老黄。英伟达一个季度损失数十亿美元,而且预估下个财季损失得会更多。 黄仁勋直言,500亿美元的中国市场对美国产业关闭了大门。 多重因素叠加,英伟达的净利润下降15%。 但在如此明显的“业绩缺憾”之下,英伟达的股价却在盘后大涨近5%,达到四个月以来的最高水平。 黄仁勋终于被允许喘口气了。 首先,让我们来看一下英伟达第一财季的业绩表现。 营收为440.62亿美元,同比增长69%,环比增长12%;净利润为187.75亿美元,同比增长26%,环比下降15%。 其中营收超过预期(440亿VS 431亿),净利润低于预期(187亿VS207亿)。 具体到各个业务,数据中心业务营收为391亿美元,同比增长73%,环比增长10%。 进一步拆解,来自Compute(含GPU及整机系统)收入为341.55亿美元,上年同期为193.92亿美元。其中,Blackwell架构GPU(如B200)的销售贡献显著,单季度实现110亿美元收入,占数据中心收入的28%。来自Networking收入为49.57亿美元,上年同期为31.71亿美元。 黄仁勋在财报电话会议中表示:“Blackwell的推出是我们公司历史上最快的产品过渡,本季度已占数据中心计算收入的近70%。” 数据中心业务营收表现非常关键,这是英伟达的支柱业务,营收占比88%。可以说,本次英伟达营收同比增长瞩目,主要归功于数据中心业务强劲增长。验证了英伟达在AI算力市场的统治地位,也反映出全球AI基础设施建设的加速。 其他各业务: 游戏和AI PC业务营收为38亿美元,创下历史纪录,同比增长42%。 专业可视化业务营收为5.09亿美元,同比增长19%。 汽车业务营收为5.67亿美元,同比增长72%。 但并不全是好消息。 从利润来看,第一财季净利润按GAAP标准为187.75亿美元,同比增长26%,但环比下降15%。GAAP毛利率为60.5%,非GAAP毛利率为61%,均低于前一季度的73%和73.5%。 成本上升的原因有三:员工薪酬增加、美国对华H20芯片出口限制,以及新一代数据中心设备(如Blackwell架构芯片)的制造成本显著增加。 薪酬增加和制造成本上升是可预知的,但地缘政治的影响只能说是外界担忧的验证。 美国政府于2025年4月9日正式通知英伟达实施H20芯片对华出口许可管制,并于4月14日宣布该许可要求无限期生效。英伟达表示,第一季度H20芯片库存过剩产生了45亿美元的费用,若未受限制,公司本应录得25亿美元的额外销售额。 在业绩展望时,英伟达指出,二季度的指引考虑到了H20出口限制的影响,预计当季H20的收入将减少80亿美元。 H20禁令的冲击是明显的。 黄仁勋说得很直白:“今天,500亿美元的中国市场实际上对美国产业关闭了大门。H20出口禁令结束了我们Hopper在中国的数据中心业务。” 他还进一步对未来表达了担忧:“失去中国人工智能加速器市场(我们认为该市场将增长至近500亿美元)将对我们未来的业务产生重大不利影响,并使我们在中国和全球的外国竞争对手受益。” 他认为,问题不在于中国是否发展人工智能,它已经在发展了。问题在于世界上最大的人工智能市场之一是否会在美国的平台上运行。也就是说,试图用芯片禁令中断中国人工智能的发展是“无知”的,因为中国已经具备内生产力。 也因此,H20禁令这样的措施,实际上是“短视”的,从长远来看反而会助推中国的技术发展。 在采访当中,黄仁勋的表述简单易懂且犀利:“如果有人以为,只要走一步棋,即以某种方式禁止中国使用H20芯片,就能在某种程度上中断他们发展AI的能力,那么他就太无知了。” 黄仁勋并非“反特朗普斗士”,在这次财报会议之后的采访中,他也赞许了美国政府。目前来看,黄仁勋的整体立场是:支持宏观设想和目标,但是反对部分措施。 比如对于特朗普心心念念的“美国制造”,黄仁勋就曾附和称“如果我们不擅长制造,就会在一个庞大的产业上落后。”且曾大力点赞特朗普“对AI行业的关心”。 这种支持也落在行动上。3月时,中美关税战正酣,黄仁勋透露未来四年,英伟达将在美国斥资数千亿美元购买当地生产的芯片和其他电子产品。目前,英伟达的Blackwell芯片已通过台积电亚利桑那州Fab21工厂启动前端制造,成为首个“美国制造”的顶级AI芯片。台积电在美投资1000亿美元扩建产能,直接支撑英伟达的产能需求。 黄仁勋的担忧不无道理,在中国市场,芯片的替代效应已经显现。 瑞穗证券分析师 Vijay Rakesh 发布最新报告指出,华为昇腾(Ascend)910 系列 AI 芯片在 2025 年出货量有望超过 70 万颗。 5月21日,黄仁勋在台北国际电脑展的新闻发布会上透露:“四年前,英伟达在中国的市场份额高达95%。如今只有50%。” 有意思的是,在很长一段时间里,英伟达全线业绩飘红,股价却下跌,虽胜犹败。如今,当担忧变为现实之时,英伟达反而突破了魔咒,股价距离历史高点仅差一步。 财报发布后,英伟达股价在盘后交易中一度上涨约6%。按盘后交易计算,英伟达股价达到四个月以来的最高水平,距1月创下的历史高点不到5%。 一方面,虽然H20禁令给英伟达带来了巨大的损失,但得益于新一代Blackwell芯片,英伟达依旧在营收上获得了巨大增长。在全球范围内,英伟达仍然是AI芯片界的霸主。从这个层面来说,H20禁令反而证明了英伟达的韧性。 另一方面,Agent智能代理的风,再一次吹鼓了市场对英伟达的信心。 在这次财报发布时,黄仁勋明确表示:“从生成式AI向具备接收、推理、规划与行动能力的代理式AI转型,将重塑所有行业、企业与国家。我们视AI代理为新型数字劳动力,可胜任从客户服务到复杂决策的全流程任务。” 对于英伟达来说,这阵风来得恰如其时。年初DeepSeek大火,对算力极致压榨,外界开始唱衰英伟达。一度逼得黄仁勋向大众“科普”,力图证明缩放定律没死。 但如今,Agent需要大量算力支撑,黄仁勋不必再卖力自证。对Agent的关注,部分抵消了对英伟达在华市场失守的担忧。 黄仁勋又进一步将其与国家战略挂钩,逻辑是:从Agent就能看出,AI作为基础设施(而不仅仅是一项技术)的重要性。“就像他们过去必须为电力和互联网建设基础设施一样,现在也必须为AI建设基础设施。我认为这是一种觉醒,并创造了大量机会。” 从这个角度出发,谁会不看好英伟达呢? 所以也可以看到,H20禁令的靴子终于落地之后,市场反而放松了,英伟达也多了一份从容。接下来,英伟达可能会在Blackwell架构中,继续寻找中国定制芯片的可行性,同时做好芯片交付和下一代研发。 超高增长已经接近尾声,这次财报发布后的市场反馈,证明了这一点已经成为共识。接下来,英伟达不必飞得比快更快,但要又快又稳。
全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作
快科技5月29日消息,今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型—— “龙跃”(MindLoongGPT)。 龙跃大模型以“自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如“以优雅的姿势递上一杯咖啡”、“挥手致意”或上传一段参考视频,龙跃大模型即可自动解析语义并生成对应的连贯动作,并支持通过追加指令实时调整细节。 这一能力,在教育、服务机器人领域具有颠覆性意义。据介绍,龙跃大模型具有四大核心技术优势: 一是多模态交互、低门槛驱动。用户只需用自然语言驱动,模型即可“一切行动听指挥”。 二是拟真度与时序一致性双突破。通过将人体动作视为“时序语言”,生成的跑步、舞蹈等动作不仅流畅自然,更保留真实人体的惯性节奏。 三是结构生成与细节优化并重。模型采用分阶段生成策略,从全局姿态到局部关节角度均实现毫米级精度控制。 四是轻量化设计,赋能广泛场景。在保证性能的前提下,MindLoongGPT模型体积被压缩至同类型产品的1/3,可在教育机器人、智能穿戴设备等嵌入式平台实时运行,为产业落地铺平道路。
苹果Siri升级搁浅:轻资产路线受阻,缺自研芯、数据中心、训练数据
编译 | 金碧辉 编辑 | 程茜 智东西5月29日消息,据外媒Business Insider昨天报道,正值谷歌上周高调发布AI视频工具Flow之际,苹果被迫推迟生成式AI版Siri的核心升级计划。这一突发状况暴露苹果存在致命技术短板:缺乏自研AI芯片、数据中心依赖谷歌设施、训练数据困于隐私枷锁。 与谷歌25年构建的12层技术栈(含Transformer架构、TPU芯片及YouTube数据资产)相比,苹果自研AI芯片进度落后7年,年资本支出不足谷歌75亿美元(折合人民币约为539.30亿元)的零头。 为挽救困局,苹果正与OpenAI紧急谈判引入ChatGPT替代Siri,但后者已联合苹果前设计总监乔尼·艾维(Jony Ive)开发竞品硬件。科技博主本·汤普森(Ben Thompson)警告:“轻资产路线已然失效,苹果要么每年豪掷百亿美元自建AI基建,要么吞下并购苦果。” 一、谷歌25年筑就AI帝国:YouTube数据+自研TPU构筑护城河,从数据到算力的全栈掌控 外媒Business Insider披露,谷歌已构建起覆盖数据、算法、算力的完整AI生态体系,其依托全球最大视频平台YouTube以及长达25年的网页索引历史,积累了海量训练数据,为第三代视频生成模型Veo 3和第四代图像模型Imagen 4等技术提供了充足的动力。 谷歌在2013年花费4400万美元(折合人民币约为27240.08万元)收购了多伦多大学亚历克斯·克里泽夫斯基(Alex Krizhevsky)、伊利亚·苏茨克韦尔(Ilya Sutskever)与杰弗里·辛顿(Geoffrey Hinton)的初创公司DNNResearch,从而获得了AlexNet技术(AlexNet是一种卷积神经网络,它在2012年的ImageNet竞赛中表现出色,大幅降低了图像识别的错误率)。 在2014年,谷歌收购德米斯·哈萨比斯(Demis Habassis)领导的DeepMind实验室。 在算力层面,谷歌于2016年推出自研TPU芯片以应对英伟达的技术垄断,并通过TensorFlow开发框架构建起支撑全球开发者的生态体系。 ▲谷歌生成式AI工具Flow的AI模块简要介绍 谷歌CEO桑达尔·皮查伊(Sundar Pichai)在2016年谷歌I/O大会时曾向多家媒体透露谷歌进入“AI优先”时代。 ▲谷歌CEO桑达尔·皮查伊 此外,为保障谷歌的数据中心能耗需求,谷歌不仅斥资开发三座核电站,其可再生能源采购量更位居全球企业首位,从能源端完成战略布局。 据外媒Business Insider透露,谷歌今年计划投入750亿美元(折合人民币约为5393.02亿元)资本支出建设AI数据中心,通过三座核电站与可再生能源支撑算力需求。 二、苹果算力、数据、人才、基建断层落后,数据中心靠租借、芯片研发迟7年 在AI发展进程中,苹果面临多重结构性挑战。 在算力层面,苹果2023年才启动数据中心AI芯片研发,较谷歌TPU晚了七年,苹果在训练“Apple Intelligence”时更需紧急租用谷歌TPU集群。 在数据开发层面,苹果受隐私政策桎梏,10亿用户数据难以充分用于模型训练,苹果依赖设备端算力处理复杂任务,数据价值挖掘严重受限。 在人才机制层面,苹果长期禁止AI团队公开发表论文的政策,使其错失顶尖人才招募窗口,即便苹果在2018年挖角谷歌AI掌门约翰·詹南德雷亚(John Giannandrea),仍未能扭转人才储备的颓势。 ▲苹果公司机器学习与AI战略高级总裁詹南德雷亚 在基建布局层面,苹果的iCloud服务长期依赖谷歌数据中心托管,自建算力规模不足谷歌1/10,基础设施实力差距显著。 三、苹果AI突围困局:ChatGPT替代Siri遇反垄断狙击,合作并购与百亿收购成艰难抉择 苹果在AI领域的合作布局正遭遇战略级冲突与结构性困境,苹果努力突围AI困局。 苹果与OpenAI在去年5月谷歌I/O大会后一周就引入ChatGPT替代Siri进行谈判,但OpenAI近期联合苹果前设计总监乔尼·艾维(Jony Ive)开发新型AI硬件设备,直接威胁iPhone市场地位,或导致合作可行性骤降。 在外媒看来,若苹果转向谷歌寻求算力支持,可能触发美国及欧盟反垄断机构审查,而潜在合作伙伴Meta因首席执行官马克·扎克伯格(Mark Zuckerberg)与苹果CEO蒂姆·库克(Tim Cook)长期交恶,已被排除在合作名单之外。 在并购领域,科技分析师本·汤普森(Ben Thompson)提出的方案同样危机四伏。其建议苹果收购的初创公司SSI由OpenAI创始元老伊利亚·苏茨克韦尔(Ilya Sutskever)创立,至今尚未推出成熟产品,估值却已达百亿美元级别。 苹果的另一选项是埃隆·马斯克(Elon Musk)的xAI公司,则因创始人反复无常的技术路线与苹果封闭生态理念相悖,被业内视为荒诞提案。 ▲xAI创始人兼CEO埃隆·马斯克 更现实的压力来自资本层面。若选择自建AI基础设施,苹果需每年追加750亿美元(折合人民币约为5434.73亿元)资本支出,该金额相当于其2023年研发总投入的45%。这迫使库克团队在技术自主权与财务可持续性间寻找危险平衡。 结语:科技顶流竞争撕开技术滤镜,AI军备竞赛现残酷真相 谷歌用25年构筑从TPU芯片、Transformer架构到核电站的12层技术栈。苹果移动生态优势在AI时代转化为算力枷锁,设备端处理能力在百亿参数模型前捉襟见肘。当科技巨头年投入百亿级资金夯实AI地基时,轻资产路线宣告失效。而苹果在移动生态的优势未能转化为AI时代的护城河,设备端算力在百亿参数大模型前捉襟见肘,隐私保护理念反成数据开发枷锁。 苹果的被动局面可能也揭示了行业新规则:AI竞争本质是数据中心规模、能源掌控力、学术人才储备的复合较量。这场基于数据中心规模、能源掌控力与学术储备的马拉松竞赛,正迫使后来者付出多倍代价填补技术代沟。
从五级能耗到一级能耗,为什么神经形态计算关系自动驾驶的未来?
2022 年的时候,奔驰狠狠地秀了一把肌肉:一辆 VISION EQXX 能效概念车实现了 1 次充电行驶超过 1200 公里,它最初设立的目标是续航达到 1000 公里(1 度电跑 10 公里),最终在德国斯图加特到北安普敦郡银石赛道上,跑出了 1 度电跑接近 12.1 公里的能效成绩,即用 100 度电跑出了 1207 公里的续航成绩。 去年它又创造了百公里能耗仅 7.4 度电的新纪录。 当人们把目光放在它的能效表现时,其实奔驰 VISION EQXX 还搭载了另一种计算形态「神经形态计算」,奔驰也成为全球首个将神经形态计算技术应用于合法上路车型的汽车厂商,当时奔驰表示,这个技术可以助力 VISION EQXX 在真实道路环境下,实现并超越奔驰定下的续航能效目标。 为什么自动驾驶需要「神经形态计算」? 最近奔驰又重新提起了这个技术,并且表示已经和与加拿大滑铁卢大学就神经形态计算领域展开科研合作。 无论是我们当下使用的电脑、手机、智能手表,以及智能汽车,它们的计算架构都属于经典的冯·诺依曼架构,这个架构的计算单元和存储单元是分离的,比如我们在看电脑和手机配置的时候,总会看 CPU 和 GPU 是什么型号,核心数量和主频多少,内存和存储有多大,再细致一点,会看内存的带宽,存储的读写速度等等。 ▲ 冯·诺依曼架构 这是因为在冯·诺依曼架构里面,信息是以数字编码形式,通常是二进制,通过总线连接相互独立的运算单元和存储器,进行信息输入和计算结果输出。 这就像一家大型餐厅,食材需要人力从仓库里运送到后厨冰箱,后厨从冰箱里拿出来加工好摆盘完毕,通过传菜员服务员送到消费者餐桌上,这个流程不能中断,不然坐在餐桌上的消费者就得饿肚子。 冯·诺依曼架构出现了数十年,如今已经非常成熟,在大多数场景里面,我们并未觉得它不妥,作为消费者,我们也很少因为这个架构而「饿肚子」,这是因为现在的游戏、视频还有办公软件的设计,是根据现有硬件的性能瓶颈而设计的,五六年前游戏开发者不会去开发光学追踪游戏,因为英伟达当时还没有发布这个技术。 更早之前的影视从业者也不会制作 8K 视频,因为从拍摄设备,到解码芯片还有播放设备都没有准备好。 还是以大型餐厅举例,因为处理流程长,工序复杂,客户需求多样,就需要储备各种食材,聘请名厨,培训服务员,做各种工作,成本高昂,人员复杂,上班时间还很久,最终消费者消费的价格也不便宜。 这就是冯·诺依曼架构的短板,最明显的,就是它的计算效率偏低(仓库太远,冰箱满了,厨师请假,服务员偷懒,后厨门太窄了等等都会影响上菜效率)和运行能耗偏高(人多,管理难,投入成本高)。 当然,冯·诺依曼架构的长处在于精确和通用计算,就像好的餐厅能做的菜花样百出,并且样样好吃。 但是,如果有个顾客特别爱吃扬州炒饭,并且只吃扬州炒饭,那么他自然也可以每一顿去上面的大餐厅,不过对于顾客来说,这个花费就太高了。 这个「扬州炒饭」可以是当下的 AI 计算,或者更细致一些,是汽车辅助驾驶和自动驾驶的计算。 根据奔驰给出的数据,如果是继续使用冯·诺依曼架构做智能驾驶的计算,当前 L2 级别的辅助驾驶,能耗在 70-100W 之间,这对于动辄几十度上百度的新能源电池来说负担不算大,运行一天也就 1 度电而已。 但是到了 L4 高级自动驾驶阶段,这个能耗就可能达到 1000W——3000W 的程度,这将大大降低汽车的续航里程。 当然,我们可以寄希望于半导体制程工艺的进步,电池技术的进步等等,但是我们需要明白的是,从 L2 到 L4 智能驾驶等级之间能耗递增是十倍数十倍的增加,而半导体工艺带来的能耗降低,往往是个位数两位数百分比的速度。 所以,业界就希望有新的计算形态来专门针对自动驾驶这个场景,这就是前面提到的「神经形态计算」。 前面说了,冯·诺依曼架构的长处在于重逻辑的精确和通用计算,但效率低功耗大,那么「神经形态计算」就是长于模式识别、感知、学习、自适应,并且能耗很低。 在智能驾驶技术进入到了端到端时代,依靠大模型,尤其需要视觉语言大模型参与进来的时候,模式识别、感知、学习和自适应的需求也越来越大,因而,「神经形态计算」就逐渐被奔驰和业界所重视,成为实现高等级自动驾驶的希望技术。 ▲ Akida 神经形态计算 IP 架构 具体到奔驰,他们是和加州人工智能企业 BrainChip 合作,开发出基于 BrainChip 公司 Akida 神经形态系统级芯片的硬件和软件系统,并集成在了 VISION EQXX 概念车里。 从五级能耗到一级能耗,「神经形态计算」为什么可以更省电更安全? 简单来讲,「神经形态计算」就是模仿人脑的机制来进行计算,人脑(在不路怒的情况下)作为一种自动驾驶计算设备,有着高性能低能耗的优点,一般功耗只有 20W,百公里消耗两个馒头而已。 从人脑的运作机制来说,在驾驶的情况下,虽然传感器(眼睛和耳朵)一直工作,眼观六路耳听八方,但人脑并不是一直紧绷,而是会根据外界环境动态调整运行状态,在满是大货车的拥挤路段,人脑自然紧张一些,而在空旷平坦视野辽阔的高速路上,人也会放松一些。 更科学一点的说法是,人脑的信息传递确实依赖于神经元之间的脉冲信号和突触的化学传递,这种机制构成了神经系统的基础通信方式。并且这种机制是事件驱动的,比如视网膜里的运动敏感神经节细胞只在检测到运动时发放脉冲。 奔驰在其技术介绍文章里面说: 神经形态计算的核心就是模拟人脑的运作机制,信息不以数字形式编码,而是通过模仿神经元和突触产生「脉冲信号」来传递信息。只在需要时才「点亮」相关区域,这种「按需激活」的机制,既打消了传统计算架构运算慢的劣势,又从根本上突破了耗能高且持续耗能的限制。神经元与突触在物理上是共位集成的,意味着脉冲神经网络的信息,无需从存储器中反复读取。 人脑这种时而放松时而紧绷的注意力机制,也可以比喻成「变频空调」,空调早期,就是一个功率运行到低,在设定温度下全力做启停折返,丝毫不考虑省电,一张五级能耗的贴纸证明它的努力和坚持。 聪明的变频空调会在环境温度高,开机初期的时候加大制冷功率,在温度到达设定值之后减少功率,主要做维持舒适温度之用,不仅省电,而且温度波动小,体感上更舒适。 类似的,神经形态计算只有在接收到信息时才会触发计算,其他时间处于休眠状态,这使得数据处理能耗得到显著降低。 到此,我们可以总结一下神经形态计算的一些特点:存储和计算融合,异步事件驱动而不是顺序指令执行,擅长模式识别、感知、学习和自适应,同时能耗低。 在奔驰的官网上,奔驰记录一系列关于神经形态计算的合作和进展: 梅赛德斯-奔驰与滑铁卢大学签署了谅解备忘录,合作开展神经形态计算领域的研究。该研究的重点是开发高级驾驶辅助系统的算法。通过模拟人脑功能,神经形态计算可以显著提升人工智能计算能力,使其速度更快、更节能。在保持车辆续航里程的同时,安全系统可以更好地检测交通标志、车道和物体,即使在能见度较低的情况下也能做出更快的反应。与现有系统相比,神经形态计算有望将自动驾驶数据处理所需的能耗降低 90%。与滑铁卢大学的合作是对梅赛德斯-奔驰在神经形态计算领域一系列现有研究合作的补充,其中一个重点是自动驾驶的神经形态端到端学习。 梅赛德斯-奔驰正与合作伙伴共同评估如何利用神经形态计算来优化自动驾驶系统中雷达数据的处理。 梅赛德斯-奔驰还一直与卡尔斯鲁厄应用技术大学合作,这项工作的核心是神经形态摄像头,也称为基于事件的摄像头。 这一系列的工作,除了有望把 L4 级别的自动驾驶系统功耗降低到 300W 之外,更重要的作用也在于安全。 因为基础技术原理的原因,「神经形态计算」有着更快的处理速度和低延迟,这不光是依靠计算中枢完成,也依赖于前面说到的「基于事件的摄像头(神经形态相机)」。 传统相机拍摄和分析图像,是去分析一整张完整的图像,像素越多信息也就越多,但同时需要的算力和功耗也越大,而神经形态相机则针对图像中少数高亮度像素的变化(这种变化就是「事件」)进行信息提取,这个过程比逐帧分析整张图像要更快,延迟也小的多,因而更利于安全。 当然,在 VISION EQXX 能效概念车里,神经形态计算主要作用的领域是提升车内语音唤醒速度(响应速度从 200 毫秒降至 20 毫秒),以及优化人机交互,用在智能驾驶领域还有段距离,比较现在才 L2 阶段。
红魔 10S Pro+ 氘锋透明银翼版:搭载高通性能最强的骁龙 8 至尊领先版,可以玩 PC 游戏的手机
5 月 26 日,红魔 10S Pro+ 正式发布,定价 5999 元起。 红魔这次提供了最熟悉的三个配色,分别是采用双重立体微蚀刻工艺造出金属格栅纹理的能量粒子,还有暗黑、银翼两种氘锋透明版。 机身采用透明面板设计,这一代用了细节相对简约的装饰面板,保留了风扇开孔和红魔 X、高通骁龙 8 至尊领先版的标志,其余位置都用金属质感强的装饰盖板,增添机械细节。 机身正面是一块 6.85 英寸 1.5K 144Hz 悟空全面屏,屏幕峰值亮度为 2000nits,支持 2592Hz PWM 调光和 DC 调光,有 SGS 低蓝光护眼认证的星盾护眼技术。 屏幕支持 Magic Touch 2.0 触控技术,最高支持 2500Hz 瞬时触控采样率和 960Hz 多指瞬时触控采样率。 性能方面,手机搭载了高通骁龙 8 至尊领先版,并配备了红芯 R3 Pro 自研芯片、LPDDR5T+UFS 4.1 Pro 储存组合,和最新的 CUBE 擎天游戏引擎,常温状态下安兔兔跑分为 2820734。 性能直接点满后,手机运行极高画质的星穹铁道时帧率保持会更加轻松,60 分钟内可实现平均帧率为 60fps,帧率方差可到 0.2。 性能增强后,红魔 10S Pro+ 还内置了 PC 模拟器,能玩类似 PC 版 《古墓丽影 9》等游戏,并能够外接手柄和鼠标键盘和屏幕,实现类似「掌机+主机」的游玩体验。 续航方面,手机搭载了 7500mAh 二代牛魔王大电池,支持 120W 魔闪快充,实测 0-100 充电时间为 35 分钟。 同样它也支持实测 89W 的通用快充和旁路充电,增加充电器的适应力,还有在游戏时边充边玩可以减少损耗和发热。 相机部分选择了 5000 万像素的主摄搭配 5000 万像素的超广角组合。后盖的纯平设计让摄像头不在凸起,可以平整放在桌面上,不再滑动。 最后看看售价: 16GB+512GB:5999 元 24GB+1TB: 7499 元,只有氘锋透明银翼配色可选
路虎卫士改款升级,更帅更智能,但依旧昂贵
路虎官方在近日发布了旗下卫士车型的改款官图。 新款卫士依然提供标志性的 90(双门)、110 和 130(四门)三种车身形式。其外观细节进行了精炼,包括全新的半圆形LED大灯、深色嵌入式尾灯,以及重新设计的前后保险杠和亮黑色格栅。引擎盖嵌件和侧通风口也采用了新的纹理图案,前后包围可选银色或缎面灰色涂装,整体风格更显现代感。 新卫士同时也提供了更多的车身个性化选项,有全新的「柔石绿(Woolstone Green)」 和 「雷云灰(Borasco Grey)」两种车身颜色和 22 英寸七辐深灰色铝合金轮毂可选。 除此之外,新卫士还提供了「探索套装」、「冒险套装」和「城市套装」三种套件,并且可以单独选购黑色外观的车顶行李架、横杆、底盘保护等配件,以及可伸缩或固定侧踏板、哑光黑色引擎盖贴花等个性化装饰。 面向追求极致性能的用户,OCTA 版本则提供了更具视觉冲击力的「沧渊蓝(Sargasso Blue)」车色、纹理石墨装饰、碳纤维内外饰件以及巴塔哥尼亚白哑光贴膜等专属选装。 改款卫士更大的升级点则是在内饰部分。 新卫士采用了全新的 13.1 英寸触摸屏,并搭载了最新的车机系统,比起前代,新的中控屏尺寸更大,在操作便捷性和智能化水平上也有提升。同时,路虎也对换挡杆的位置也进行了微调来优化驾驶体验,新车在中控台部分也增加了一个滑动区域和更深的储物区,并配备了可拆卸的侧袋。 更重要的一个舒适性提升则是新卫士的前排座椅改为了一体式设计,座椅的包裹性和支撑性都有所提升。 为了满足欧盟 GSR2 法规,新卫士增加了驾驶员监测系统,如果检测到驾驶员没有注意前方的道路,会触发音频和视频警报,不过该功能支持手动关闭。 在核心的越野能力上,新卫士此次改款提供了升级版的全地形进程控制系统(自适应越野巡航控制系统)作为选装。这套系统能在复杂越野环境下自动控制车速,帮助驾驶员将精力更多地集中在路线选择和转向操作上,旨在提升越野时的控制体验。 新卫士将延续现款车型丰富的动力配置,包括 3.0T 双涡轮增压直六汽/柴油发动机、2.0T 插电混动系统、5.0T 机械增压 V8 汽油发动机。顶级性能的 OCTA 版本则搭载 4.4T 双涡轮增压 V8 发动机。 新车在英国的起售价约合人民币 55.6 万元。作为参考,目前国内在售卫士的价格区间大致在 68.8 万至 146.6 万元之间。 在全球市场,卫士系列持续展现强劲势头。捷豹路虎公布的 25 财年第一季度财报显示,其全球营收达 73 亿英镑,同比增长 5%,其中卫士车型贡献了近六成(59%)的销量。在豪华车市场整体承压的背景下,这一表现凸显了其作为经典车型的吸引力。 然而在国内市场,卫士正面临来自各家硬派越野 SUV 日益激烈的竞争。数据显示,2024 年卫士在国内的销量为 18379 辆。作为对比,部分定位相近的方程豹豹 5、坦克 300 等单款车型在数月内的销量即可达到相近水平。 此次年度改款,路虎卫士在外观个性化、内饰科技感、乘坐舒适性以及越野科技辅助方面都进行了针对性提升。这些改进有望延续其在全球市场的受欢迎程度。 但对于国内消费者而言,在硬派越野 SUV 选择空前丰富的当下,卫士如何平衡其经典传承、产品力提升与市场定位,将是其能否持续吸引目标用户的关键考量之一。
30 万元的全新沃尔沃 S90,除了安全还有什么?
一辆车从出厂到报废能跑多少公里? 对于丰田霸道可能是「十万公里才过磨合期」,对于凯美瑞可能是「20 万公里不大修」,而对于沃尔沃 P1800 则是「500 万公里依然使用原配发动机」。 没错,现如今车辆行驶里程的世界记录是由一辆生产于 1966 年的沃尔沃 P1800S 保持着,这辆车已经和它 78 岁高龄的主人一起在道路上走过了 500 万公里的路程,而且依然保持着原配的发动机。 ▲沃尔沃 P1800 与其美国车主 这辆红色的 P1800S 现如今已经成为沃尔沃品牌的活广告,用不断增长的公里数身体力行的证明了沃尔沃可靠的品质与近乎严苛的质量管理。 在快 60 年后的今天,沃尔沃也在中国大庆工厂带来了一台同样是红色的全新 S90,打算用和前辈一样的大胆配色,来展示新款沃尔沃 S90 的魅力。 除了新的大胆配色,全新沃尔沃 S90 也带来了新的外观和内饰设计,以及在智能科技和安全方面的升级。 新款 S90 前脸采用了与 2025 款 XC90 相似的斜纹网格状中网,标志性的 「雷神之锤」 LED大灯组则经过了重新设计,拥有了更加锐利轮廓,很好的增强了车头的视觉宽度和稳重感。这个全新的大灯组是数字化矩阵式远近光灯的设计,上面新增了一个角灯功能,可以提升夜间照明效果并根据路况自动调整光束分布。 新车车身侧面保留了传统门把手设计,并新增了贯穿车底的银色饰条,提升了侧面的层次感。车尾采用了全新设计的尾灯组,造型与大灯呼应,并辅以熏黑处理,配合上空气动力学优化的小鸭尾设计,官方称新车的风阻系数降低了 0.02。 新款沃尔沃 S90 的内饰新增了「枫岚棕」的配色方案,带来了更加温暖舒适的车内氛围,材质方面则延续了沃尔沃一贯的环保理念,使用了可持续来源的天然木材饰板和大量的 Nappa 真皮。 新车的中控区域也做了一些改变,悬浮式 11.2 英寸中控屏取代了旧款的嵌入式设计,内置的原生安卓系统也配备了华为智慧助手和华为应用商店,提升了操作的便捷性和视觉上的现代感。12.3 英寸全液晶仪表盘支持导航全屏投射功能。副驾驶手套箱、换挡区域以及车门嵌饰板的线条设计都变得更加开阔,Orrefors 水晶挡杆也增加了座舱的豪华感。 沃尔沃也在新车的车机系统中加入了一个名为「小沃」的语音助手,据官方介绍其采用了最新的AI大模型技术,支持「全时免唤醒」和「可见即可说」功能,旨在提供更自然的交互体验。 在在驾驶辅助方面,新车配备了第三代 Pilot Assist 领航辅助系统,支持 0-130km/h 的全速域自适应巡航,并采用了渐进式制动逻辑,升级后的 City Safety 城市安全系统新增了十字路口自动避让功能,可识别侧向来车并采取相应措施。 新车在动力方面延续了现款配置,依旧有搭载 2.0T 涡轮增压发动机(最大功率 254 马力)和 48V 轻混系统的 B5 版本和综合功率 455 马力、WLTP 纯电续航里程 85 公里的 T8 插电混动两种版本可选。 至于最引以为豪的安全方面,沃尔沃几乎用了大半场的时间来讲沃尔沃是怎么从制造环节就开始注重安全设计的,从工厂螺丝的拧法讲到了车身底盘的焊接方法,总而言之就是四个字「精益求精」。不过大家感知最强的部分可能是全新 S90 配备了 SEAL INSIDE 自修复轮胎,这种由倍耐力特别开发的高科技轮胎在胎面被刺穿时可以动态即时封闭孔洞,可以在关键时刻避免因轮胎漏气导致的危险情况。 有了 XC90 的降价幅度在前,沃尔沃 S90 这次的降价幅度就显得在意料之中了,最低配的 B5 智逸豪华版的价格来到了 30.09 万元,最高配的 T8 四驱长续航版本的价格则是 45.49 万元。看得出来,在市场压力下沃尔沃确实想通了,与其走先定高价再给终端优惠的「既定路线」,不如一开始就给一个相当有诚意的价格,早点降价总比卖不出去来的好。 沃尔沃 S90 在巅峰时期的月销量曾接近 1 万辆,但是如今的销量一跌再跌,在 4 月份的销量只有 1310 辆,即使在终端售价跌到 27.9 万的情况下也难掩颓势,说到底还是「安全标杆」的老本很难再吃下去了,在同级别车型已经用上各种激光雷达和传感器,在极端天气下也能做到优秀的主动安全的对比下,沃尔沃现在却只能讲讲拧螺丝的故事,确实有点掉队了。 不过,好在还有一款 XC70 可以期待下。
Llama 4新版不及预期,Meta重组AI核心团队,25人名单曝光
编译 | 王涵 编辑 | 漠影 智东西5月28日消息,据外媒The Information最新报道,近日Meta对其生成式人工智能(AI)团队人员架构进行重组,以往扭转Meta在AI领域的被动局面。 据知情人士透露,该团队的员工满意度评分在公司内部排名垫底。成员在反馈中抱怨工作倦怠、内部冲突及缺乏明确方向。为缓解压力,Meta领导层本月稍早采取了罕见措施——在Meta AI助手独立应用发布后,给予该团队一天带薪休假,此消息获三位知情人士证实。 周二,Meta通过重组生成式AI部门来应对部分问题。根据外媒The Information获取的内部公告,原集中管理的AI团队将拆分为两个部门:专注AI研究的AGI Foundations团队,以及负责AI产品开发的团队。 Meta首席产品官克里斯·考克斯(Chris Cox)在公告中表示:“该架构将显著改善大家反馈的核心挑战,并加速整体进展。”虽然未具体说明挑战内容,但他指出重组将降低各单元间的依赖性,并让员工更深入参与资源分配等关键决策。 Meta发言人对此不予置评。 一、Meta人工智能团队重组:简化团队架构,明确职责范围 ▲Meta新AI产品和研究团队的关键领导人 周二的改组旨在通过明确责任分工和简化生成式AI团队架构来解决部分问题。过去两年间,该团队积累了包括Llama、Meta AI助手以及Meta各应用中的其他AI产品和功能等有时相互冲突的职责。考克斯在内部公告中表示,将团队一分为二将有助于“实现关键的文化和运营变革”。 Meta的AGI Foundations团队将由原生成式AI团队负责人艾哈迈德·阿尔达勒(Ahmad Al-Dahle)和将阿尔达勒招聘至Meta增强与虚拟现实部门Reality Labs的阿米尔·弗伦克尔(Amir Frenkel)共同领导,该团队不包括Meta的基础AI研究实验室FAIR。AGI Foundations团队将负责Llama模型、能够完成任务的AI智能体,以及需要更多时间“思考”才能回应查询的推理模型。 ▲艾哈迈德·阿尔达勒(Ahmad Al-Dahle)与阿米尔·弗伦克尔(Amir Frenkel) Meta资深产品高管康纳·海斯(Connor Hayes)将领导AI产品团队,该团队将负责Meta AI和公司的图像、视频及音频生成工作,他还将监督推动开发者和企业采用Llama的相关工作。 二、人员变动的背后:Meta在AI方面措手不及 过去,Meta总是能迅速调整以抓住移动计算和元宇宙等重大技术变革机遇。在生成式AI领域也是如此,Meta最初在技术上展现出追赶OpenAI等大型语言模型领先开发商的潜力。与大多数行业同行一样,Meta将AI视为下一个技术前沿,也是赢得更多用户和收入的机会。 但至少从年初开始,Meta在AI方面的努力似乎遇到了挫折。 1月,中国DeepSeek模型的惊人表现让Meta措手不及。由于担心在AI领域落后,Meta成立了“作战室”专门研究DeepSeek,并将经验应用到自己的Llama模型系列中。为提高工作质量和速度,Meta在2月为生成式AI团队任命了新的产品负责人,并调离了两名工程主管。 然而,公司在开发最新一代模型Llama 4时仍面临困难,由于技术基准测试表现未达预期而推迟了发布时间。 4月,Meta终于发布了Llama 4的首个版本Scout和Maverick,这两个版本在评估AI模型质量的流行排行榜上表现良好。但很快,Meta就因向排行榜提交实验版Llama 4 Maverick(其表现优于实际发布的公开版本)而遭到强烈反对。此后,Meta推迟了推理版本和最大参数版本Llama 4的发布。 结语:人员调整能否让Meta改变被动局面? 科技巨头们遭遇业务发展瓶颈、陷入困境时,调整人员架构往往是科技巨头们常用的应对策略之一。以苹果公司为例,为了提升智能语音助手 Siri 的性能与市场竞争力,该公司多次对AI团队的组织架构进行调整。此前OpenAI也宣布引入新的首席执行官,这一高层人事变动引发了业界的广泛关注。 他们之所以青睐通过调整人员架构来应对业务困境,主要有两方面原因。其一,相较于改变技术路线而言,调整组织架构能够更迅速地产生反馈效果,可以在较短时间内重新激活团队的活力,从而在一定程度上缓解业务压力。其二,从成本和风险的角度来看,调整人员架构只是在现有资源的基础上进行优化整合,是损失相对较小的补救方法。 然而,在科技领域,技术始终是推动企业发展的第一生产力。无论人员架构如何调整,如果没有先进、创新的技术作为支撑,企业很难在激烈的市场竞争中立于不败之地。 近年来,Meta在AI领域的竞争态势逐渐趋于被动,面临着来自谷歌、微软等科技巨头的强大压力。此次人员调整,无论最终能否成功扭转Meta在AI领域的被动局面,都彰显出Meta想要在AI浪潮中占据前列的雄心壮志。
vivo S30 Pro mini发布:小屏旗舰配6500mAh电池,3499元起
凤凰网科技讯 5月29日,vivo在今日举行的新品发布会上正式推出S30系列智能手机,此前预热已久的又一款小屏旗舰vivo S30 Pro mini正式发布,新机采用6.31吋屏幕,配备6500mAh电池,整机重量186g,售价3499元起,国补后2999元。 vivo S30 Pro mini采用6.31英寸小屏设计,机身宽度仅71.76mm,整机重量控制在186g,但搭载了6500mAh超大容量电池,能量密度达到845Wh/L。据官方测试数据,满电状态下可持续游戏10.5小时,在线视频播放21.9小时。 在外观设计上,新机推出酷莓粉、桃桃粉、薄荷青、柠檬黄、可可黑五种配色,采用撞色中框设计,将柔和底色与黑色中框形成对比。机身工艺方面,全系采用金属砂AG工艺,S30 Pro mini更配备航空级铝金属中框。 影像系统是本次升级重点。全系配备前置5000万像素防畸变柔光自拍镜头,后置采用索尼IMX882潜望长焦、5000万像素索尼主摄以及106°超广角镜头的三摄组合。值得注意的是,S30 Pro mini行业首发希区柯克变焦实况功能,用户可零门槛拍出变焦特效。 软件层面,新品首次独立设置“实况模式”,提供鱼眼萌主、氛围花瓣、柔光等多种电影级特效。同时支持微信、小红书、抖音等主流平台的内容编辑和分享。 技术配置方面,S30 Pro mini搭载天玑9300+处理器,S30搭载第四代骁龙7处理器。屏幕方面,S30 Pro mini搭载8T LTPO屏幕,支持1-120Hz自适应刷新率和4320Hz PWM调光。通信功能新增寰宇智慧通信2.0,支持最远1.9公里实时对讲和4公里SOS信号传递。防护等级达到IP68+IP69级,抗摔能力较上代提升148%。 S30系列包含S30与S30 Pro mini款款机型,vivo S30提供三个存储版本:12GB+256GB版本国补后售价2294.15元,12GB+512GB版本售价2549.15元,16GB+512GB版本售价2804.15元。vivo S30 Pro mini同样三个版本:12GB+256GB版本国补后2999元,12GB+512GB版本3299元,16GB+512GB版本3499元。新机现已开启预售,并将于6月6日正式开售。
我体验了腾讯的裸眼 3D 游戏机:是鸡肋,还是战未来?
PS4的性能 3DS的体验 世界上对游戏机最感兴趣的游戏公司,除了索尼、微软、任天堂,你还能想到谁? 答案可能是:腾讯。 不久前,腾讯游戏旗下的创新实验室发布了游戏机 Sunday Dragon 3D One——从名字就能看出来,这是一台和 3D 有关的游戏设备,准确来说,就是裸眼 3D。 对于游戏机,裸眼 3D 不是一项新技术。十多年前,任天堂的游戏掌机 3DS 就以此为核心卖点,并围绕裸眼 3D 开发了一系列的游戏和玩法。但在最近的十年里,任天堂却主动放弃了这项技术,无论是 Switch 还是 Switch 2 上都没有搭载相关的机能,这让 3D One 在游戏机市场上显得有些孤掌难鸣。 但这恰恰是最反直觉的部分:2024年,全球 3D 显示设备市场规模超过千亿美元,而当下流行的 XR 设备,一年也卖不到五百亿美金。 这么看,腾讯的 3D One 又让事情变得有趣起来。 一台够格的 3A 游戏机,但不是「掌机」 作为一台基于 Windows 平台开发的游戏机,不能免俗还是得讲一下配置—— 3D One 由腾讯牵头,与京东方和英特尔联合开发,因此其核心零部件也来自于这两家厂商——搭载 11 英寸 2.5K 分辨率的裸眼 3D 触屏,支持 120Hz 刷新率;核心处理器则是英特尔的酷睿 Ultra 7 258V CPU,图形性能主要由核显 Arc Graphics 140V 来支持,标配 32GB LPDDR5X 内存和 1TB SSD 存储空间。 这基本上就是 3A 游戏掌机的主流配置,在接电高性能模式下,我们用 3D Mark 的 TimeSpy 跑出了 4167 分,比 SteamDeck 或还没发售的任天堂 Switch 2 等游戏掌机要强不少。 3D One 还支持英特尔的 Xess 技术,可以实现在 1080P 中低画质下,流畅运行大部分 3A 游戏——用游戏机来做类比的话,大概介于 PS4 和 PS4 Pro 之间。 实际游戏表现上,3D One 也算是可圈可点—— 在「平衡模式」下,TDP 约为 20-30 瓦,《赛博朋克 2077》《黑神话 悟空》等 3A 游戏,1200P 分辨率、中低画质设置可以稳定在 40 帧左右;部分负载较高的游戏,如《霍格沃茨之遗》也能在中低画质下跑个 30 帧,离电续航大概在一个半小时左右。 「高性能模式」下,TDP 可达 30-50 瓦, 上述游戏的帧数可以提升 20% 左右,当然续航就急降至不到一小时。所以在这个模式下,更建议接电使用。 如果是一些更古早的 3A 游戏——比如《GTA 5 增强版》《荒野大镖客 救赎 2》《泰坦天降 2》等,3D One 跑个 40-60 帧问题不大;它也能满足中高画质流畅运行《原神》《崩坏 星穹铁道》《三角洲行动》等跨端游戏的需求。 考虑掌机/便携形态,这对许多玩家来说,已经是相当可以接受的程度。 加之 3D One 的屏幕素质尚可,11 英寸的大屏确实比主流 7-8 英寸的游戏机带来了更强的视觉冲击力,颇有捧着电视玩游戏的感觉。 总的来说,3D One 作为一台游戏机,基本上能满足运行大部分游戏的需求——但问题是,这并不是一台适合随时掏出来玩的掌机。 11 英寸、1kg 左右的重量,注定 3D One 并不适合作为掌机随身携带,更多是一种对游戏场景的拓展,在客厅或书房之外,也有能玩游戏的地方——比如卧室、酒店或者办公桌上,这也是大部分 Windows 掌机的归宿。 值得一提的是,显然 3D One 的产品经理们也在想办法解决这个问题——这套设备采用可拆卸手柄以及平板支架等设计,还标配了一个磁吸式键盘,既可以作为掌机的保护盖,也可以当做键盘来完成一些办公操作。 我想,把 3D One 当做一台针对游戏做了优化的便携电脑,可能是一个更务实的视角。 腾讯看中的不是游戏机,而是未来游戏的敲门砖 在对 3D One 有了基础的了解后,我们可以来聊聊 Sunday Dragon 3D One 最核心的功能——裸眼 3D。 可以说,这块屏幕就是 3D One 这台游戏机最与众不同之处。第一次上手时,我也觉得这台「掌机」的尺寸相当尴尬,但当我开启 3D 开关、屏幕上方的传感器绿灯亮起时,我又一次被裸眼 3D 的效果冲击到——十多年前,当我第一次打开 3DS 时也有类似的感觉。 从本质上讲,3D One 和 3DS 并无不同,都是通过对左右眼输出不同的画面,来实现立体的视觉效果。但屏幕素质、观看内容的迭代——从 240P 进化到 2.5K 分辨率,从掌机游戏进化到 3A 大作确实让量变发生了质变。 当我在夜之城开车兜风时,扑面而来的霓虹、大楼、灯红酒绿,确实让我沉浸其中——每一位看过 3D 电影的人,我想都有类似的感受。 3D One 通过液晶光栅技术和内置的 AI 算法,可以将全屏显示的任何屏幕内容实时转成 3D 影像,游戏可以,电影、图像当然也都不在话下。只不过由于是算法控制,所以有些画面也会出现重影或撕裂的情况,但大多数情况下出屏效果还是让人满意的。 不过,裸眼 3D 也带来了额外的负载,渲染两个 2.5K 画面的同时,还要兼顾大型游戏的运行,对于性能捉襟见肘的 Windows 掌机来说,显然不切实际。 以《赛博朋克 2077》为例,在打开裸眼 3D 之后,不仅游戏画质要降一档,帧数也只能维持在 30 帧左右,屏幕亮度还会衰减——为了提升沉浸感,付出的代价也并不小。 我更建议打开 3D 效果,试试那些上世代游戏——譬如《APEX》的前身《泰坦天降 2》就是个相当不错的选择,这种精心打磨的封闭关卡线性游戏,负载小但画面不差,有了 3D 效果加持,游戏体验非常出众。 还有一些原本配置要求就不高的独立游戏——像《潜水员戴夫》《茶杯头》等,3D 效果带来的加持也别有风味。 当然了,你还可以拿来看 3D 电影,省去了找资源的麻烦,打开流媒体平台就能看——虽说不是每一部电影都适配算法,但我在看《地心引力》时,确实找回了一些在电影院看 3D 电影的感动。毕竟在 3D One 上,亮度由你随心控制,而不是那些永远只开最低亮度保护设备的放映员。 表面上看,这是一次技术怀旧——裸眼 3D 技术早在十年前就被任天堂 3DS 验证过,如今任天堂却主动放弃了这条路线。但数据揭示了截然不同的市场逻辑: 全球 3D 显示设备年复合增长率接近 20%,2024 年市场规模达 1445 亿美元,而当红的 AR/VR 设备市场仅为 456 亿美元。 显示器厂商,是最早注意到这块蛋糕的——在商用场景下,工厂、医院、博物馆等已经引进了大量 3D 显示设备;而 C 端场景,我们也见到诸如三星 Odyssey 3D、Acer SpatialLabs View 等高端显示器,将沉浸式的 3D 游戏体验作为核心卖点。 腾讯的判断很清晰:沉浸感是游戏的未来,裸眼 3D 是被低估的技术路径。 更重要的是,内容生态已具备突破条件——3A 游戏生态成熟,跨终端的服务型游戏,大有燎原之势。而随着 AI、显示等技术的成熟,2D 内容转为 3D 内容的成本正在被抹平,反观 3D 体验带来的沉浸感,会成为游戏等重度内容消费物的竞争力。 3D One 被明确定位为「实验型技术原型机」,目标不是商业成功,而是技术验证。 这也符合腾讯长期主义的思维:在娱乐节奏加快、玩家容易审美疲劳的时代,新体验的探索至关重要。 有预测数据支撑这一判断——全球 3D 显示市场将从 2024 年 1445 亿美元增长至 2030 年 3785 亿美元,复合年增长率 17.6%,消费电子领域占 56% 份额,游戏产业是关键驱动力。 相比需要穿戴额外设备、定制内容开发的 VR/AR,当下能将 2D 平面内容立体化的裸眼 3D 技术,便利性优势明显,且对于了解市场动向、用户口碑有着良好的探针效应。 值得注意的是,3D 显示本身就与 VR/AR 内容有着良好的相性,对于 3D 内容的进一步理解,也是探究沉浸感的重要一步。 腾讯通过持续的硬件实验,不仅为自身做技术储备,也为行业探索可能性。 全球范围内,除索尼、微软、任天堂外,很少有公司愿意不考虑短期商业利益,进行游戏体验的探索——腾讯恰好是个例外。 作为中国乃至世界上最大的游戏公司,腾讯常被批评重运营轻内容,但事实上,腾讯可能是世界上在游戏产业链布局最深的公司——开发世界上最具盈利能力的游戏、投资游戏研发的基础引擎平台以及众多游戏公司、建设适用于游戏制作的虚拟影棚、探索最前沿的游戏人机交互…… 对腾讯来说,目前的技术方案并不是为了推出一台面向消费者的掌机,或做一个商业上成功的硬件产品,而是帮助腾讯保持敏锐度,不在寻找游戏新方向上落伍。 长远来看,有沉浸感的内容是游戏行业发展的新方向,也是腾讯当前研究的重点。探索 3D 掌机这样的新方向,不是一口吃成胖子的短视行为,恰恰符合马晓轶所说的: 我们很有耐心,会把时间拉得更长,非常接受 5—10 年的计划 从代理游戏机到游戏手机,从开发云游戏机再到 3D 掌机,可以说,对游戏机——或者说对游戏人机交互体验最感兴趣的中国公司,可能真就是腾讯。 在这个娱乐节奏飞快,玩家动不动就电子阳痿的时代,对于新体验的探索,我们作为玩家,总会乐见其成。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。