EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
英伟达巧用8B模型秒掉GPT-5,开源了
英伟达端着一个8B小模型对GPT-5说: 不好意思,你还得练(bushi)。 何出此言?——英伟达携手香港大学开源的Orchestrator-8B,人类终极考试HLE分数更高、花钱更少、跑起来速度还更快。 哦对了,还在HuggingFace被狂赞,冲到了热门模型前五。 而它超越GPT-5的打法是不当推理者,而是“工具主理人”,协调使用各路工具。 如何吊打GPT-5? 人在解决问题时会找各种帮手,比如搜索引擎、计算器 ,那这个工作能不能由模型代劳? Orchestrator干的就是这事儿。 虽然自己只有8B参数,但手下管着一整个工具团队。 既有GPT-5、Claude Opus 4.1这样的顶级大模型,也有Qwen2.5-Math这样的专业数学工具,还有网页搜索、本地检索、代码解释器这些实用小帮手。 它并不是自己解题,而是判断现在该用哪个工具、控制工具的顺序和使用次数、还能兼顾效果、成本、用户偏好,工作日常如下: 拿到难题先分析:这题需要算数学?那就调用Qwen2.5-Math; 过程中动态调整:搜完资料发现需要验证?那就先用代码解释器跑一遍; 全程把控用户偏好:用户说要省钱,那GPT-5能不用就不用,优先用本地工具。 简单说,大模型是一个人干所有活,而Orchestrator-8B是带着团队干专业活。 能让小模型精准协调这么多工具,全靠英伟达的ToolOrchestra训练大法。 核心有两个,一个是有奖有罚的强化学习,一个是量身定制的ToolScale数据集。 训练时给Orchestrator立了三条奖惩规则: 效果奖:让GPT-5判对错,解题对了加分,错了扣分; 效率奖:用的钱少、耗时短加分,反之扣分; 偏好奖:听用户的话加分,比如用户要隐私保护,多用本地搜索就加分。 研究者建了个包含金融、医疗、电商、旅游等10个领域的训练素材库,里面全是“怎么用工具解题”的案例,让模型充分接触各类场景。 Orchestrator-8B也在权威测试中交出了令人满意的答卷。 HLE测试里它拿下37.1%的得分,超过GPT-5的35.1%,成本却仅为后者的1/2.5; FRAMES、τ²-Bench测试中也拿下SOTA成绩,降低了开支,运行速度更是快了一倍多。 小模型的逆袭 实际上,在AI领域工具编排和小模型驱动复合系统的赛道上,英伟达ToolOrchestra训练的Orchestrator-8B并非孤例。 最早探索让小模型学会调用工具的代表性研究,是谷歌DeepMind在2023年提出的Toolformer,通过监督学习+自生成数据,让12B参数的模型学会调用计算器、翻译API、搜索引擎等基础工具; 但当时,Toolformer仅聚焦基础工具,并没有把大模型纳入工具库。 MIT和CMU联合团队的ToolRL,提出以奖励为核心的工具学习框架,训练小模型通过强化学习动态选择工具,主要是解决“传统工具学习过度依赖人工标注数据” 的问题,通过自动生成工具交互轨迹训练模型。 虽然也是奖励机制,但ToolRL的奖励函数更侧重于任务的正确性和工具调用效率,并没有明确纳入用户偏好,且工具库以基础工具和专业API为主。 今年,香港大学和微软提出的Optimal Tool Calls(OCT),也是专门针对“工具调用成本优化”的小模型训练方法。 越来越多的团队在做相关研究,也有越来越多的人关注该领域的进展。 就拿Orchestrator-8B来说,为什么它能获得HuggingFace高赞? 最明显的原因就是实用。大模型虽强,但太贵、太慢,而Orchestrator-8B参数量小,还能实现「强+省钱」,直接解决了落地时的成本难题。 用低成本实现高智能,这么一看,AI的未来还真不一定是超级大模型单打独斗了。 作者简介 Orchestrator-8B这篇论文的一作是香港大学博士苏弘锦,主要研究方向是数据科学和自然语言处理,现在英伟达实习。 共一是英伟达研究院的研究科学家Shizhe Diao,主要进行大型基础模型的预训练、高效调优和对齐方面的研究,曾与字节跳动人工智能实验室的李航博士合作。
豆包打响第一枪,超级Agent和超级APP开战了
豆包手机助手上线后的第三天,在销售渠道“火爆”的同时,字节在舆论环节已经两度跑出来“灭火”。 这两天,第一批体验用户在使用字节与中兴合作开发的NubiaM153时发现,用豆包手机助手代替用户操作APP时,先是遇到了“微信登录环境异常”,随后又传出包括淘宝下单被拦截、银行APP无法完成支付等情况。 在最新发布的声明里,字节方面解释称,已紧急下线操作微信以及金融、游戏类APP的相关能力,并表示将积极与厂商沟通,制定清晰、安全的AI操作准则。 此前,字节方面曾强调,NubiaM153只是一个面向开发者和爱好者的“技术预览版”,目前没有做手机的计划,并且正在和多家厂商洽谈助手合作。 从行业视角看,这是一次Agent“新物种”与“现时代”超级APP的碰撞:中兴向豆包开放了INJECT_EVENTS等系统权限,让AIAgent用“模拟点击”的方式去“接管手机”;而一些平台选择筑高安全栅栏,将豆包的操作在系统中识别为风险行为并拦下。 把视角从豆包身上拉远一点,就会发现这件事更像是一次行业未来变革的当下“预演”:AI厂商试图借助手机厂商的系统能力、在用户全局视角集中地试图穿透APP的边界。 尽管豆包手机助手的能力,目前还不足撼动手机产业格局。但字节在争议中的“后撤”,还是传递出了一些信号。 Agent在手机上打响“入口革命”的第一发子弹,已经飞向了构成过去和现在互联网经济基础的超级APP们,但这发子弹何时命中,还是个未知数。 过去一年里,手机原生AI的节奏明显加快,系统级Agent正成为手机行业共同发力的方向。 这条赛道两边,一边是大模型公司和手机厂商,希望用原生AI和超级Agent重新定义手机——让用户不必再自己打开一个个APP,直接把任务交给系统层的Agent。 另一边,是已经牢牢占据用户时间和支付入口的超级APP。对这些平台而言,APP不只是一个功能容器,更是时间、交易和数据的入口。 换言之,在手机端原生AI的赛道上,要被重新定义的不只是手机,甚至是整个移动互联网的入口生态。 只不过,和头部手机厂商不同,中兴做了一个“违背祖制的决定”,选择在拉入字节作为第三方外援,将手机OS部分权限向豆包开放。由此诞生的豆包手机助手,驶入了一片规则尚不明晰、边界尚未划定的“无人区”。 从平台安全视角看,豆包手机助手执行的这种能力和自动化脚本、外挂、批量操作工具一样,在微信、淘宝、银行等涉及金融/支付环节的APP中,都有可能被识别为一种风险特征。当然,也可以解读为是对Agent跨APP操作的一种防备。 而针对数据安全问题,字节方面也同步发布了安全白皮书,明确记忆数据优先本地处理并加密存储,不用于模型训练,所有敏感调用需用户授权并保持可见。 对于模拟点击的权限问题,字节方面表示,该权限调用必须经用户主动授权,全程可见且可中断;涉及支付、身份验证等敏感环节时任务会暂停,由用户手动确认。 不过,在没有明确新的规则体系之前,这一套方案的稳定性、合规性,以及是否能够被主流APP接纳,都还充满变数。 另一方面,几乎所有头部手机品牌都在加速打造自己的AI系统路线:华为在HarmonyOS中把小艺升级为系统级智能体,支持全局唤起和部分跨应用任务链;vivo用蓝心小V叠加自研大模型,在OriginOS5里承担意图理解和多场景调度;OPPO、小米则通过端云结合、本地+云混合的大模型和系统级开放接口,把更多AI能力下沉到OS层。 这样的背景下,其他头部手机厂商是否愿意把同样的权限共享给豆包,这背后的障碍显然不仅仅是一个技术问题。 不过,对于字节和豆包团队而言,这是一场有预期的“激进试水”。字节方面对外表述一直非常克制:目前展示的只是豆包手机助手的技术预览版,主要面向开发者和行业伙伴体验,不承诺上市时间。 据《蓝鲸新闻》报道披露,NubiaM153也许不会真正量产,研发中的量产机型要等到2026年底之后。这意味着,中兴和字节选择在这个时间节点,把一个尚在“实验室阶段”的产品提前搬上了真实用户的牌桌,在小范围试水过程中观察边界、收集反馈。 这也解释了为什么整场发布显得异常克制:字节方面反复强调“不会造手机”,似乎也并不想通过这台工程机传递出太多野心。至于中兴,则在这场合作里扮演了一个“愿意押注OS开放性”的伙伴角色,只不过,其他手机厂商是否愿意加入这一合作生态仍是未知。 过去一年,中兴手机在公开场合鲜少提及整体出货和市占排名,行业榜单上基本稳定在Top10之外,在一些公开披露的出货量排名中都被归为“Others”。 此前,曾有媒体披露,NubiaM153这次首销备货大约50万台,不过,字节方面随后回应称这是不实消息。据一些接近字节方面的人士透露,中兴和字节本次合作的KPI预期在3万台左右。这一数字放在整个手机市场里,只能算是一个非常小样本的测试产品。 不过,发布第一周,豆包手机助手已经用“系统级智能体”的形式,把“AI能不能替代人操作”的问题提前抛给了整个行业。未来数年内,这场围绕大模型厂商和移动互联网生态之间交锋,仍将是行业内持续争论的系统性议题。 如果把争议先放在一边,回到这台努比亚M153本身,豆包手机助手确实展示出了一些前卫的交互模式,但要想在产品层面改变行业格局仍有一段距离。 NubiaM153上这套“原生AI”的基本逻辑,是由中兴在系统层面向豆包APP开放部分底层权限,包括模拟点击、前台调度、跨APP读写等能力;大部分推理和决策仍由豆包APP在后台执行,同时在UI上做了一层深度适配。 换言之,豆包手机助手一只脚踏进了系统层,另一只脚还踩在APP层。 在实机体验里,这种交互逻辑偶尔也会暴露“不那么跟手”的一面。最直观的一点是任务无法并行:当豆包正在执行一个链路较长的自动化流程时,如果你尝试中断或插入新的任务,系统会弹出“是否终止当前任务”的提示,让用户在继续等待和手动接管之间二选一。 效率也是这套机制的一个现实约束。以点外卖为例,在一些实机演示中,用户对手机说“帮我点平时那家店的晚餐,照旧就行”,豆包手机助手会自动打开外卖APP、进入历史订单、重新下单、确认地址,整个过程并不卡顿,但也需要耗时一分钟以上。 从理解意图到执行指令,豆包执行这个任务的效率算不上慢。但当用户自己上手点单时,以上操作只需不到30秒。在这一场景下,在Z时代习惯用手机碎片化解决问题的用户眼中,豆包给予的体验也许有些新奇,但是短时间内还难以转化为“刚需”。 但从产业端来看,AI手机已经是一条没有回头路的轨迹。根据OPPO与IDC发布的《AI手机白皮书》,智能手机产业正演化为“混合算力为基座、大模型生态在上、智能体和原生AI服务构筑应用”的新生态。 未来的智能手机中,OS和硬件更像是承载大模型和智能体的“壳”,而非单纯的任务调度器。Counterpoint的此前报告显示:2025年,具备GenAI能力的手机SoC将占出货量的约35%,且高阶平台的峰值AI算力将突破100TOPS。 而不甘于在“Others“阵营的中兴,自然也乐于借助豆包的力量加速驶入这个赛道,成为把原生Agent跑到实机上的厂商之一。 在手机之外,原生AI助手出现,也让字节的硬件生态布局看到了新前景。豆包手机助手官网上,专门提到支持自家OlaFriend耳机进行交互。某种程度上来看,这类“脱手感”在可穿戴场景里,AI助手的便捷性会被进一步放大。 所以,眼下的豆包手机助手,不管是实机演示的效果,还是合作厂商中兴的出货实力,短期内都难以成为行业威胁。但在过去一周中,豆包和努比亚已经证明了一件事:如果智能体和OS走得足够近,手机(原生手机助手)确实有变成下一代超级入口的可能。 友商们真正值得紧张的,也许不是这台工程机本身,而是由它开启的这场关于“入口”的重新洗牌。 如果把豆包手机助手拉回到更大的坐标里,它所代表的意义已然十分清晰:这是一次把“AI智能体”往“下一代入口”方向推的试探,试图撼动整个眼下由超级APP牢牢占据的移动互联网格局。 先看今天的互联网用户结构。QuestMobile年度报告显示,截至2024年底,中国移动互联网全网月活用户规模达到12.57亿人,整体月人均使用时长已经攀升至171.7小时。 其中短视频、即时通讯、综合资讯三大类应用占去了最大的时间份额——短视频月人均使用时长62.9小时,即时通讯40.2小时,综合资讯24.4小时,同比仍在增长。 换句话说,大部分人的手机时间,已经被“KillTime”型内容彻底锁死。微信在其中扮演的是一种“操作系统式”的角色:既承担即时通讯,又承载支付、小程序、公众号、视频号等服务,构成了一个从社交到服务的复合入口。 腾讯2025年一季度财报显示,微信的月活跃账户数已达到约14亿。这个体量,意味着任何试图在系统层“代替用户操作微信”的方案,都会被当作对现有秩序的潜在冲击。 另一方面,进入AI时代后,过去10年的互联网方法论似乎出现了变量,原生AI APP能交互、能搜索信息、能完成文字/代码层面的任务、还能借助多模态能力渗透到更多场景。 在豆包“上机“之前,豆包APP已经是中国原生AI最火爆的产品,8月以来反超DeepSeek占据行业榜首。腾讯一边推进混元大模型和元宝APP,一边在微信视频号、电商和轻量AI助手之间寻找新的平衡。就在最近,阿里也赶在2026年之前推出“千问”APP、公测一周下载量过千万,同时发布全模态通用助手“灵光”。 不过,APP形态本身也成为了AI能力的封印,使其很难真正贴近用户的高频交互和真实场景。想要让Agent介入生活运行的每一个细枝末节,它最终必须与物理终端深度结合,更主动的拥抱用户响应需求。 这也解释了为何在打造原生AI超级APP的同时,字节选择了与手机厂商合作。当豆包的同一套能力变成系统级助手,用户可以在使用手机时随时调用AI能力,在决策层就让Agent介入自动跑通处理。 对超级APP而言,这种变化的危险之处,一方面在于支付等场景的合规风险,同时也在于它可能把平台辛苦建立的用户生态,丢给了一个站在系统层之上的智能体。 以微信为例,AI赋能提效是大势所趋,但前提是不能打乱囊括了视频号、公众号、小程序、企业微信、支付、理财的庞大生态矩阵。对于微信而言,最理想的形态是依托自家元宝针对微信场景定制的AIAgent能力,而不是把入口交给一个来自竞争对手体系的豆包。 与此同时,腾讯也在用自己的方式布局这条赛道。一方面,混元大模型持续升级,并通过微信小程序、企业微信、C端AI助手元宝等产品渗透到不同场景;另一方面,微信自己也在尝试把AI嵌入搜索、内容分发和广告系统中,让AI能力成为“增强入口”的工具,而不是替代入口的新层级。 这一系列头部企业新老业态间的交锋,在过去几天中被进一步放大:一边是字节希望把豆包从APP里“抬”到更高的入口层级,另一边则是微信、银行APP用现有风控体系给这只“新手”画条边界线。 从更长周期看,随着手机产业硬件和算力的演进,这一类交锋已然不可避免。Counterpoint等机构预测,到2027年具备生成式AI能力的手机渗透率有望达到40%–45%,前提是SoC的NPU性能和端侧大模型能力持续提升。 在这样的轨迹上,原生手机助手的迭代仍会持续加速,NubiaM153和它上面的豆包手机助手,更像是Agent时代起点处的一个可能很快就会杂草淹没或者被路人踩倒的小标示牌,它的价值,需要等待时间的再发掘,毕竟,就像开头所说,子弹何时射中眉心,谁也不知道。
全新旗鱼手机Jolla Phone现身:可更换电池设计
IT之家 12 月 6 日消息,Jolla 官方今天在 X 平台发文,官宣全新一代旗鱼手机 Jolla Phone 即将发布,这台手机拥有三种配色可选,相比现有的 Jolla C2 更加现代。 据介绍,这台手机问世的目的并不是为了在红海市场中杀出天地,而是为了打造 iOS、Android 之外的“替代方案”,拥有黑色、白色、橙色三种“北欧自然风光”配色可选,后盖采用可拆卸设计,电池自然也是可以拆卸、自由更换的。 硬件方面,这台手机支持 5G 网络,拥有两个实体 nano-SIM 卡槽,配备 12GB 内存和 256GB 存储空间,支持插入 microSD 卡,最高可扩展 2TB 存储空间。 软件方面,这台手机搭载旗鱼系统 Sailfish OS 5,号称是“唯一商业成功的欧洲移动操作系统”,内部没有任何追踪器、回传手段、隐私分析器,也没有谷歌 Play 服务悄悄窃取数据,但非常“务实”地兼容了安卓应用,机身左侧还拥有一个可隐私开关,只需要拨动即可关闭麦克风、摄像头、蓝牙等功能。 Jolla 表示,他们在过去 12 年间一直坚持不懈,在塞班、MeeGo、FireFox OS、Windows Phone 等系统相继入殓的情况下,靠着社区支持让旗鱼系统一直存活,目前世界上只剩下四个商业上成功的移动操作系统,而旗鱼是其中“唯一来自欧洲的”。 目前该手机已在 Jolla 官网开启预售,定金 99 欧元,发布后售价大约在 599-699 欧元,预计在明年上半年末期出货,预购用户可享 499 欧元折扣价,最终收到的手机还拥有特别版包装盒。
苹果2026年初新品前瞻:M5 Pro/Max MacBook Pro、A18芯片标准版iPad等有望登场
IT之家 12 月 6 日消息,科技媒体 9To5Mac 今天发布博文,对苹果 2026 年初即将发布的新品进行前瞻。 IT之家附前瞻详情如下: 14 英寸 / 16 英寸 MacBook Pro(M5 Pro/M5 Max 芯片): 苹果在今年秋季推出了 Vision Pro、iPad Pro、MacBook Pro 三款 M5 芯片新品,不过当时只发布了 M5 标准版,并没有推出 Pro 或 Max 版本,且唯一获得更新的机型的 14 英寸版 MacBook Pro。 目前已有消息传出,苹果将在 2026 年初推出 M5 Pro / Max 芯片的 MacBook Pro,可选 14 英寸或 16 英寸,预计将在 CPU / GPU 核心数、最大可选内存等方面做提升。 回顾苹果过往的新品发布节奏,这家公司曾在 2023 年 1 月发布了 M2 Pro 和 M2 Max 芯片的 MacBook Pro,明年的 M5 机型也可能遵循类似节奏。 平价 MacBook: 这款笔记本预计将对标 Chrome 等低端 PC 产品,有望在 2026 年初问世。 结合古尔曼等分析师此前透露,这款笔记本将搭载一款 12.9 英寸屏幕,整体的尺寸小于 13 英寸 MacBook Air,有望搭载 A18 Pro 芯片,性能看齐 iPhone 16 Pro 系列机型,可以胜任常规的办公、学习操作,但游玩 3A 游戏还是有些吃力。 此外,这款笔记本将拥有类似 iMac 的多彩外壳,契合定位,定价预计在 599-699 美元(IT之家注:现汇率约合 4240 - 4948 元人民币)之间,有望在 2026 年第一季度中期出货,很有可能在明年 1 月底正式发布。 A18 芯片标准版 iPad: 苹果在今年年初对标准 iPad 产品线进行更新,将原本的 A14 芯片换成 A16,并将原本的 4GB 内存升级至 6GB,整体还是“换汤不换药”老套路。 苹果有望在 2026 年初对现有标准版 iPad 产品线进行常规更新,预计搭载 A18 芯片,为低价位段产品带来 Apple 智能,外界普遍预测其外观设计保持不变,依旧使用非全贴合 LCD 屏幕,主要更新还是换个芯片。 iPhone 17e: 这款产品预计将在 2026 年初发布,有望搭载 iPhone 17 同款的 A19 芯片,升级全新 Center Stage 前摄,不过目前各路分析师、消息人士对这台手机所搭载的屏幕还有分歧,但整体来说,屏幕边框将变得更窄,符合现代审美。 该机预计将定价 599 美元(现汇率约合 4240 元人民币)起,与 iPhone 16e 持平。
阿里系App已封禁“豆包手机”:淘宝、闲鱼、大麦等App无法登陆
快科技12月6日消息,近期“豆包手机”引发很多关注,其系统深度内嵌了豆包AI,可以实现更深层次的自动化操作,比如自动多电商平台比价/下单,甚至系统自己刷游戏资源。 因权限过高带来一些隐患,很多主流App开始禁用“豆包手机”,比如微信、多个手机银行App都已经禁止登录。 根据媒体实测,阿里系多款应用也已经开始拒绝“豆包手机”登录,覆盖淘宝、淘宝闪购、闲鱼、大麦等。 不光是AI比价等功能无法使用,甚至连手动操作打开上述App都会触发安全机制,弹出登录受阻提示。 此外,《王者荣耀》等游戏类App也开启了AI控制检测,目前仅支持手动打开,AI助手无法对其进行开启或控制,否则会被踢下线。 鉴于各类App目前的反应情况,豆包官方也第一时间进行了调整,日前发布了一份《关于调整AI操作手机能力的说明》,其中表示,将限制刷分、刷激励的使用场景;进一步限制金融类应用的使用;限制部分游戏类使用场景。 原文如下: 各位关注豆包手机助手的朋友们: 大家好!豆包手机助手是把AI技术和手机系统深度结合的一次全新探索,虽然只是少量搭载技术预览版的工程样机,社会的关注度却远远超过我们的预期,“AI操作手机”更是引发了不少讨论。 为了让技术发展、行业接受度和用户体验多方都能形成良性适配,我们计划在接下来的一段时间,在部分场景,对AI操作手机的能力做一些规范化调整。这是为了让技术走得更稳、更远的必要铺垫,希望能得到大家的理解。 具体包括,但不限于: 1、限制刷分、刷激励的使用场景:部分App厂商推出激励机制的初衷,是鼓励真实用户的主动交互行为,不希望此类设计被AI领取。这一诉求我们充分理解,因此会对这部分能力进行限制。 2、进一步限制金融类应用的使用:银行、互联网支付等金融场景,直接关联用户的资金安全,虽然手机助手在敏感操作时都需要用户授权,但审慎起见,豆包手机助手也将暂时下线操作这类APP的能力。我们也会积极与相关厂商沟通,希望共同制定清晰、安全的AI操作行为准则。 3、限制部分游戏类使用场景:考虑到部分游戏场景涉及到竞技排名,为了保证公平,暂时下线部分游戏场景的AI使用能力。 目前,我们也在积极寻求与各应用厂商的深度沟通,希望推动形成更加清晰、可预期的规则,避免用一刀切的方式否定用户合理使用AI的权利。 若您是相关领域的合作方,并有意向共建规范,欢迎联系DevRel[at]mail.doubao.com (请将[at]替换为@)
细节待完善,消息称Meta“Phoenix”新型MR眼镜跳票至2027年
IT之家 12 月 6 日消息,据《商业内幕》今天报道,Meta 正在推迟发布原定 2026 年下半年现身、代号为“Phoenix”的新型 MR(IT之家注:混合现实)眼镜。 据报道,该消息源自 Meta 现实实验室部门副总裁 Maher Saba 周四发给员工的备忘录。而在另一份备忘录中,Meta 元宇宙部门负责人 Gabriel Aul 与 Ryan Cairns 表示,推迟发布的理由是“我们需要更多缓冲时间,把细节做好”。 目前公司已决定将这款眼镜推迟至 2027 年上半年发布,这两名负责人还在备忘录中写道:“目前仍有大量工作在极其紧张的状态下推进,核心用户体验也有重大变化。我们不会在最终交付体验上妥协,必须打磨到完美、可靠状态”。 两名见过原型机但未获授权的匿名员工表示,这款 MR 眼镜的外观与苹果 Vision Pro 类似,外形类似护目镜,采用分体式“Puck”供电方案,尽管公司内部一直质疑外置电源方案,但最终在权衡重量、佩戴舒适度、过热风险等因素后决定保留这一设计。 Saba 还在备忘录中提到,他最近和公司 CEO 马克・扎克伯格展开会谈,两人对 2026 年计划展开了谈论,重点在于“确保业务可持续性,并花更多时间以交付更高品质体验”,基于这些反馈,现实实验室的许多团队需要调整计划表和未来路线图,这次跳票并不是为了让眼镜增添功能或承担额外工作。 Saba 还透露,Meta 计划在 2026 年发布一款限量版可穿戴设备,代号“Malibu 2”。新一代 Quest 头显也在路上,新升级的 Quest 头显将专注于沉浸式游戏,相比现有款式“功能升级重大”,并且将“显著改进单位经济效益”。
腾讯自研AI大模型混元2.0发布:总参数406B,激活参数32B
IT之家 12 月 5 日消息,腾讯自研 AI 大模型混元 2.0(Tencent HY 2.0)今日正式发布,包括 Tencent HY 2.0 Think 和 Tencent HY 2.0 Instruct。 腾讯表示,HY 2.0 采用混合专家(MoE)架构,总参数 406B,激活参数 32B,支持 256K 上下文窗口,推理能力与效率“居国内顶尖行列”,且在文本创作与复杂指令遵循等实用场景上表现突出。 相比上一版本(Hunyuan-T1-20250822)模型,HY 2.0 Think 显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现“稳居国内第一梯队”,泛化性大幅提升。 数学科学知识推理:腾讯混元使用高质量数据进行 Large Rollout 强化学习,使得 HY 2.0 Think 推理能力大幅增强,在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛 MIT 数学竞赛(HMMT2025)等权威测试中取得一流成绩。结合预训练数据的进步,模型在极度考验知识水平的 Humanity's Last Exam(HLE)和泛化性的 ARC AGI 等任务上也大幅进步。 指令遵循与长文多轮能力:腾讯混元通过重要性采样修正缓解了训练和推理不一致问题,实现了长窗口 RL 的高效稳定训练。同时,腾讯混元通过多样化可验证的任务沙盒,以及基于打分准则的强化学习,显著提升了 HY 2.0 Think 在 Multi Challenge 等指令遵循和多轮任务的效果。 代码与智能体能力:腾讯混元构建了规模化的可验证环境及高质量合成数据,极大增强了模型在 Agentic Coding 及复杂工具调用场景下的落地能力,在 SWE-bench Verified 及 Tau2-Bench 等面向真实应用场景的智能体任务上实现了跃升。 效率方面,HY 2.0 Think 引入了精细的长度惩罚策略,平衡思维链的效率和效果,避免模型堆砌废话,实现了计算资源的更有效分配。对照各模型在 IMO-AnswerBench、HMMT2025、ARC-AGI、HLE 这四个权威推理任务上的表现及其 token 消耗,可以看到 HY 2.0 Think 在取得类似的准确率下消耗更少的 tokens,单位 token 的智能密度处于“业界领先水平”。 基于 RLVR+RLHF 双阶段的强化学习策略,HY 2.0 的输出“质感”显著进步,在文本创作、前端开发、指令遵循等实用场景上展现了差异化优势。 与上一个版本的模型相比,HY 2.0 在指令遵循方面准确率提升明显: IT之家从腾讯混元公告获悉,作为腾讯自研的通用大模型,HY 2.0 仍在持续进化中,接下来会在代码、智能体、个性化风格、长程记忆等方向迭代,全面提升模型在实际应用场景中的表现,相关技术和模型也将会通过开源的形式向社区开放。 目前,HY 2.0 已经率先在元宝和 ima 等腾讯原生 AI 应用接入,并在腾讯云上线 API,用户可直接体验或接入部署。
苹果 2025 年度 App 发布:AI 存在感明显,中国独立开发者拿大奖
AI 应用 是未来 本周,苹果发布了 App Store Awards 2025 榜单,表彰过去一年优秀的应用。 今年的总榜单包括了 17 个应用和游戏,既有大家耳熟能详的明星 IP,也有出自独立开发者的精美制作,取向依旧兼具科技和人文气质。 值得一提的是,今年苹果专门为中国大陆区颁发了一个年度应用和年度游戏。 2025 App Store Award 榜单 年度应用: · 年度 iPhone 应用:Tiimo ❇️ · 中国大陆区年度应用:CapWords ❇️ · 年度 iPad 应用:Detail ❇️ · 年度 Mac 应用:Essayist ❇️ · 年度 Vision Pro 应用:Explore POV❇️ · 年度 Apple Watch 应用:Strava · 年度 Apple TV 应用:HBO Max 年度游戏: · 年度 iPhone 游戏:Pokémon TCG Pocket · 中国大陆区年度游戏:无畏契约:源能行动❇️ · 年度 iPad 游戏:DREDGE · 年度 Mac 游戏:赛博朋克 2077:终极版 · 年度 Vision Pro 游戏:Porta Nubi · 年度 Apple Arcade 游戏:WHAT THE CLASH? 文化影响力: · Art of Fauna · Chants of Sennaar · despelote · Be My Eyes ❇️ · Focus Friend ❇️ · StoryGraph ❇️ *❇️ 按照惯例,标星即为大陆区可以体验的应用 我们已经帮你打包好本次榜单的全部应用和游戏,在爱范儿后台回复「2025」即可获取下载链接。 年度应用:AI 都能帮你干什么? 今年的年度应用,延续以往聚焦于专业工具的基础上,更强调「AI」——这些获奖者都利用 AI 技术,赋能我们日常的生活工作场景,包括不仅限于规划、学单词、视频剪辑、写论文…… 中国大陆区年度应用:CapWords CapWords 想必大家已经很熟悉了,爱范儿此前也多次报道了这款精致可爱的外语学习 App,今年年中才拿下了苹果设计大奖,年底又获得了年度应用大奖。 用户可以拍下日常生活中遇到的物品,并通过 AI 识图的方式,生成相应的外语词汇,帮助用户记忆单词,有一种手机日常生活「图鉴」的感觉。 Capwords 近乎直觉般的设计背后,是一个简单却深刻的理念:语言的学习回归生活,它可以从一次指认、一次散步、一次「这个怎么说」的好奇心开始。 围绕这次获奖,爱范儿也顺势简单采访了 CapWords 的开发团队。 爱范儿:今年 CapWords 拿到了 Apple 两个大奖,团队现在心情如何? CapWords:现在还是有点懵。我们本来只是想做一个给自己孩子用、很小很小的工具,没想到能在一年内拿到 Apple Design Award 和 App of the Year,有些不可思议。 爱范儿:有什么话想对其他中小型的独立开发者说吗? CapWords:目前没什么建议,大家跟随自己的内心做自己追求的产品哈哈 爱范儿:明年我们能看到哪些惊喜?例如 CapWords 的新玩法,或者新的 App? CapWords:我们会继续迭代 CapWords,让它更像一个「AI语言学习朋友」,不只是识别单词。目前还没别的新 App 想法😆 年度 iPhone 应用:Tiimo Tiimo 是一款 AI 规划工具,利用可视化的时间轴、AI 任务解决和各种工具,将待办事项转化为可执行的计划,帮助用户理清思路,摆脱混乱。 具体来说,Tiimo 会用 AI 接收用户杂乱的任务和意图,智能拆分出细化的任务步骤,推算每个任务需要的时间,排出每个任务的优先级,应用自带类似番茄钟的计时器,非常适合日程安排无从做起的用户。 Tiimo 团队认为,市面上大部分规划工具希望用户能完全集中注意力、每个任务无缝衔接,并能严格遵循严格的流程,并没有照顾到 ADHD、多动症、焦虑症人群的特殊需要。 而 Tiimo 就是想改变这个现状,让应用直观、灵活,绝大多数人群都能使用。 Tiimo 项目开始于十年前,探索科技如何帮助神经多样性青少年,创始人之一的 Melissa Würtz Azari 也被诊断出 ADHD 和阅读障碍,因此应用的开发更能贴近自身。 我的注意力缺陷多动症和阅读障碍让我意识到,这个世界并非为像我这样的大脑而设计。我们创建 Tiimo 的目的就是为了改变这种现状,让计划安排变得更轻松,真正为你服务。 年度 iPad 应用:Detail Detail 是一款 AI 视频制作应用,用 AI 的方式,帮助视频小白快速上手制作短视频、Vlog、视频播客等等。 不止 AI 编辑,Detail 囊括创作、拍摄、制作全链路,可以用 AI 生成脚本、AI 导演和提词器引导拍摄,最后让 AI 自动剪辑,十几秒就能将拍摄的视频素材转化为 TikTok 视频。 用 App Store 一条评价来说,Detail 让用户距离专业视频制作者,只差一个好的麦克风和 iPhone 三脚架。 在这个全民短视频的时代,每个人手上已经有了足够好的创作工具——iPhone,Detail 则补齐了大部分人都缺失的一点创作技巧。 年度 Mac 应用:Essayist Essayist 同样是 AI 加持的工具应用,它是一个智能学术编辑器。 想必写过毕业论文的朋友都知道,论文的学术格式相当繁琐,Essayist 则利用 AI 智能处理文章格式,用户可以专注于写作本身。 除了论文格式的简便管理,Essayist 还内置了一个参考文献管理器,可以收集、存储、整理参考文献,添加文献后 Essayist 会自动生成格式完美的参考文献列表,文内引用也更方便。 Essayist 还支持 Google 学术一键添加列表、四种常见论文格式、多种参考文献类型等等能力。临近开题和论文写作的时间点,如果大家有学术写作的需求,Essayist 值得一试。 年度 Vision Pro 应用:Explore POV 作为一个第三方的 Vision Pro 应用,Explore POV 是一个 16K 清晰度 3D 沉浸式视频集合,为用户带来身临其境的沉浸感。 目前 Explore POV 提供 20 多个国家超 100 条沉浸式视频,每周更新。 2020 年大封锁时期,开发者 James Hustler 正在驾驶着房车游览新西兰,他被当地的风景所惊艳,萌生了用沉浸式的方式记录风光,让无论身处何地的人们都能体验的想法。 随着 Vision Pro 的发布,Explore POV 获得了一个非常理想的展示平台,成功将世界之美带入用户的家中。 自发布以来,Explore POV 用户反响热烈,下载量超过 8 万次 , App Store 评论超过 2000 条,是 Vision Pro 平台最受欢迎和好评的应用之一。 年度 Apple Watch 应用:Strava Strava 是这几年在运动圈里大火的 App,集运动追踪 + 社媒传播一体。 这款应用能追踪、分析 50 多种运动类型,用 AI 洞察运动数据、规划训练计划,提供锻炼的智能支持。 但更重要的是,它还是一个庞大的运动爱好者社群,拥有来自 185 个国家和地区超过 1.8 亿用户——今年一年,Strava 用户彼此送出了 140 亿个点赞。 年度 Apple TV 应用:HBO Max 今年的 Apple TV 应用颁发给了老牌电视提供商 HBO 流媒体平台 HBO Max。 HBO Max 上既有《超人》《瑞克和莫蒂》《最后生还者》《龙之家族》这些这两年大火的电影剧集,还有《哈利波特》《老友记》《绯闻女孩》等等经典 IP,确实是最值得订阅的流媒体之一。 作为大热平台,HBO Max 在 App Store 不仅收获了 440 万个评分,平均分还高达 4.9 分,是 App Store 上声量和口碑最好的 App 之一。 年度游戏:大牌光环明显 游戏作为苹果应用生态的重要部分,一直以来都在评选中有着举足轻重的地位。比起往年,今年几款年度游戏 IP 名声更如雷贯耳:宝可梦、赛博朋克 2077、无畏契约…..也有着 DREDGE 这种小而美的独立口碑佳作。 年度 iPhone 游戏:Pokémon TCG Pocket 世界第一 IP 宝可梦,做出了今年最热门的手机游戏,同时抱走了今年苹果和 Google 的年度手机游戏大奖。 Pokémon TCG Pocket(下文简称 PTCG Pocket)脱胎于传统的宝可梦卡牌游戏,并针对手机形态进行了精简,保留并放大了集换式卡牌游戏两大魅力:开包和战斗。 如果你是单纯的收集党,PTCG Pocket 将「开包」这个上瘾的行为做得相当精致,音效和手感贴近线下开包,卡片精美绚丽的动画特效则让人更有满足感。 想用自己漂亮的卡片收藏战斗,PTCG Pocket 也保留了宝可梦卡牌体系,不过节奏更快、上手更简单,锦标赛和排位系统能同时满足休闲和重度玩家的需要。 根据多方数据,PTCG Pocket 上线一年,收入超过 10 亿美元,今年 2 月推出的「时空激斗」扩展包系列,单日收入超 1120 万美元。 这几年实体的集换式卡牌游戏都开始深耕「数字化」,PTCG Pocket 无疑摸索出了一个相当成功的模式。 中国大陆区年度游戏:《无畏契约:源能行动》 今年的国区手游大奖,则属于腾讯天游出品的「瓦手游」——《无畏契约:源能行动》 手游版本延续了端游《无畏契约》的核心玩法和角色体系,针对手游进行了优化,操作更加贴合小屏触控,游戏画面丰富细腻。 前段时间公布的腾讯第三季度财报提到,《无畏契约:源能行动》是今年中国市场最成功的手游新品,移动端的转型对公司游戏业务贡献明显,游戏月活用户总数突破 5000 万。 年度 iPad 游戏:DREDGE 今年从桌面移植到移动端的 DREDGE,也同样拿下了苹果设计大奖和 App Awards,苹果认为它在 iPhone 、iPad 和 Mac 平台上都有着出色流畅的交互操作体验。 DREDGE 也是一款风格和玩法独特的游戏,将休闲娱乐的钓鱼小游戏,和惊悚的恐怖游戏,用一种巧妙的方式结合在一起。玩家将化身渔夫,在一片小型的开放海域和岛屿中探索。白天休闲捕鱼看海景,而一到晚上,克苏鲁式的怪物将现身海域,带来迷人又刺激的心理恐怖元素。 这种平静放松和恐怖氛围的微妙平衡让 DREDGE 赚足了口碑,拿下多项游戏大奖。 年度 Mac 游戏:《赛博朋克 2077:终极版》 今年的年度 Mac 游戏同样也是一盘冷饭新炒——今年移植到 Mac 平台的《赛博朋克 2077》。 比起 5 年前发布之初的「半成品」,Mac 版本的《赛博朋克 2077》已经打磨得相当完善,虽然是冷饭,确实也是今年 Mac 平台新游戏中的天花板。 游戏发布当天,爱范儿也第一时间上手给大家体验了一番。 这几年苹果有意发力 Mac 平台的游戏,拉来多款经典大作站台,目前看来依旧任重道远——至少,年度游戏得是一盘新鲜出炉的「热菜」。 年度 Vision Pro 游戏:Porta Nubi Porta Nubi 是一款专门为 Vision Pro 开发的沉浸式 XR 解谜游戏。这款游戏利用空间计算技术,将用户的周围环境转化为一个鲜活的互动谜题,逻辑、时机把握和创造力在其中至关重要。 这款游戏很好运用了空间计算的特性,用户要动用双手去推动机关,极其考验用户的空间感知能力。 年度 Apple Arcade 游戏:WHAT THE CLASH? WHAT THE CLASH? 属于今年 Apple Arcade 中最出圈的游戏之一,是一个包含数百个简单又有趣的游戏,涵盖乒乓球、赛车这些经典款,也有类似「给鱼挤奶」这种创新的滑稽游戏,适合单人游玩,更是团建神器。 App 的人文价值 这部分的应用不一定在形式和技术上很创新,但苹果认为它们具有深远的意义,为社会带来积极影响。 Art of Fauna 这是一个精美的拼图游戏,打开它就像翻阅一本 18、19 世纪的动物画册,玩家需要拼出动物的图片,或者介绍的原文。 Art of Fauna 同样获得了今年的苹果设计大奖。苹果肯定了应用对无障碍体验的支持,包含了恐惧症过滤选项、更简洁易懂的文字版本,且完整支持 VoiceOver,让视障用户也能顺利游玩,为易于上手的游戏设计树立新标准。 另外,开发者还会把收入的 20% 捐给野生动物保护组织。 Chants of Sennaar 这是一款叙事驱动的解谜冒险游戏,玩家将扮演旅行者,踏上重聚高塔中分散各处的人民的征程。 游戏具有相当浓厚的文化气息,以巴别塔神话为背景,玩家要在其中发现已消失的字形和语法,并与基于语言的谜题互动,苹果称其「颂扬了语言文字的力量」。 despelote despelote 是一个不寻常的足球游戏,玩家扮演一个八岁男孩,在厄瓜多尔首都基多的街头巷尾和公园踢球。 这是一个苦乐参半、如梦似幻的半自传体青春故事,融入了大量厄瓜多尔拍摄的照片和音频,展现了这个在动荡中的国家,如何因为对足球的热爱而团结起来。 Be My Eyes Be My Eyes 是一个专为视障人士打造的平台。 当用户需要得到视觉描述时,可以通过这个 App 与 700 多万名志愿者建立联系,也能使用最新的 AI 图像识别器,或与企业的专职代表联系,获得产品的使用帮助。 Be My Eyes 的志愿者会说 185 种语言,每周 7 天每天 24 小时免费提供帮助。 Focus Friend Focus Friend 是一个游戏化的番茄钟应用,通过可爱的风格和各种游戏挑战,帮助用户进行专注。 每次完成专注挑战,可爱的豆豆人会给你奖励,购买装饰品来布置他们的房间。 在隔壁 Google Play Store,这款应用斩获了「最佳应用」大奖。 Story Graph Story Graph 是一个阅读追踪器应用,用户可以在上面记录、了解自己的阅读习惯和进度,应用也会根据用户的喜好推荐更多新书,或者帮助用户去挑选下一本读物。 有一个好玩的功能:用户可以和好友一起阅读,留下特定章节的实时感想。 苹果的榜单,和 Google 有点像 比苹果早了半个月,Google 在 11 月中旬公布了自己的年度应用榜单。 有趣的是,两个「最佳」应用也在本周获得了 App Store Award 大奖: 最佳应用:Focus Friend 最佳游戏:Pokémon TCG Pocket 其他值得一提的应用如下: 最佳多设备应用:Luminar 这是一个强大的 AI 工具套件,摄影新手到经验丰富的专业人士都能创作出高质量图像。 最佳多设备游戏:Disney Speedstorm 一款令人肾上腺素飙升的竞速游戏,玩家可以在迪士尼世界的标志性地点间尽情驰骋。游戏的一切都针对 PC、平板电脑和手机进行了优化。 最佳娱乐应用:Edits,Instagram 视频剪辑应用 最佳个人成长应用:Focus Friend 最佳日常必备应用: Wiser——15 分钟有声读物 最佳隐藏宝藏应用:Pingo AI 语言学习 最佳家庭应用:ABCmouse 2:儿童学习游戏 最佳手表应用: SleepisolBio:睡眠、闹钟 最佳大屏应用:Goodnotes:笔记、文档、PDF 最佳车载应用:SoundCloud:你喜爱的音乐 最佳 XR 头显应用: Calm - 睡眠、冥想、放松 和往年一样,App Store Award 的得奖应用都兼具设计美感和实用价值,人文感和科技感并存,作者性也很强烈。 不管是苹果还是 Google,一个共同的趋势是,得奖者中「AI」的存在感越来越明显了:不仅帮助用户,特别是障碍人群更好生活,也赋能更多生产力工具,让更多人以更简单的方式创作。 这既是苹果顺应技术浪潮的取向,其实也说明了,未来所有优秀的 App,都离不开和 AI 的结合。
17.3%超高缺陷率 德国人:特斯拉可靠性最差
两极反转,全球销冠Model Y在德国又拿了个“第一”。 不过这回的“第一”属实不光彩——在2026 年德国《 TÜV 报告》中被列为2-3年车龄车型中的“可靠性最差车型”。 Model Y以17.3%的超高缺陷率,位列倒数第一,而且创下了TÜV 过去十年所有测试车型的最差纪录,这也是Model Y车型第一次参加这类检验测试, TÜV 协会可能也没想到,一下就捞了条大的。 更有意思的是,在Model Y没加入之前,垫底的车型则是Model 3.... 这次有了Model Y的“托举”,Model 3的名次得以上升,以13.1%的缺陷率位列倒数第二,形成“双车垫底”的尴尬局面。 01、 双双垫底 Model Y虽然是历史上第一款登顶全球年度销量冠军的纯电动汽车,但德国人这次给出的结果可能真有点权威。 给出这份年度报告的结构,不是什么拿钱办事的野鸡机构,TÜV 协会的全称为Technischer ?berwachungsverein(德国技术监督协会)是负责德国机动车强制安全检查的机构。 而且这个组织也并非单一机构,而是由TÜV 莱茵、TÜV 南德等七家权威独立机构共同组成的全球顶尖检测认证网络,总部位于德国科隆,拥有近150年发展史 ,号称全球范围内的安全质量标尺。 他们的业务覆盖汽车、能源、医疗、IT等几乎所有重要领域,认证标志是全球公认的安全与质量象征,持有该标志的产品甚至能直接转换多国认证资质 ,平时常常听说的莱茵认证就是他家的。 以汽车为例,每辆车都必须经过TÜV 的定期机械性能检测,以确保其具备合法上路的资格,检测也并非主观调查,而是需要提供3台样车、历经6-9个月,覆盖200余项指标的硬核技术评估,误差率控制在±1.5%以内,才能在德国上路。 像这次的《TÜV 报告 2026》,就是通过950万辆车的检测数据而总结出来的。 这份报告评估了车龄在2到3年之间的216款畅销车型,其中纯电车型有9款,报告显示,有17.3%的Model Y因“严重”或“危险”缺陷未能通过检验。 也就是说每6辆接受检测的特斯拉Model Y里,就有一辆检测不合格,不仅不合格,这个数据直接创下了他们十年来记录的同年龄段车型的最高缺陷值,可以说是“历史最差”表现了。 作为对比,该车龄段车型的平均不合格率只有6.5%,超过了一倍的水平,成绩最好的纯电车型,Mini Cooper SE缺陷率仅3.5%,排名第二的是奥迪Q4 e-tron为4.0%。 而总榜单的第一名,大家可能都想不到,是马自达的小车马自达 2,缺陷率仅为2.9%。 特斯拉Model 3的表现也好不哪去,以13.1%的缺陷率位列总榜单倒数第三名,而福特 Mondeo(蒙迪欧)以14.3%的故障率位列总榜单倒数第二,如果单独拉出纯电车型的分类,Model 3就是排名倒数第二。 其实,在去年的TÜV 报告中,Model 3已经在可靠性方面排名倒数第一,缺陷率为14.2%,而去年也没有Model Y参与检验,万万没想到,首次检验就直接“登顶”。 值得注意的是,TÜV 协会报告,所依据的检查方向,更侧重的是道路适应性,而非车辆的智能化程度,简单来说就是,只看机械素质。 02、 硬件机械素质问题 Model Y具体都栽在哪些地方了?TÜV 协会报告给出了三个重灾区,悬挂系统、刹车系统和灯光。 首先是悬挂系统,特斯拉悬挂部件频繁出现问题,近五分之一的汽车在首次强制检查中不合格,特别是长期困扰特斯拉车主的“控制臂衬套”问题。 此前,针对特斯拉原厂悬挂因频发异响问题而饱受诟病这一情况,德国汽车售后配件巨头迈勒(Meyle)还专门研发出了加固型配件,用以解决这一烦人的悬挂异响问题。 TÜV 协会的负责人约阿希姆?布勒博士还表示,这一现象算是电动车总普遍存在的一些“通病”。 因为电动车普遍比较重,尤其是底盘那块大电池,分量实在不轻,这无疑给悬架系统带来了持续的高负荷,天长日久,出问题的概率自然就比普通燃油车大一些,不过特斯拉Model Y的这一现象更明显。 至于刹车盘方面,也是吃了电动车特性的亏,约阿希姆布勒博士直言:“动能回收系统虽然提升能效,但传统刹车盘长时间‘吃灰’,极易锈蚀与性能衰减。”Model Y的刹车盘问题也在我们的长测中暴露无遗。 这也不难理解,电动车因为依赖能量回收制动,很多时候减速光靠松电门就行了,导致物理刹车使用频次低,叠加德国潮湿气候,刹车盘易生锈腐蚀,即便机械功能正常,也会因锈蚀无法通过安全检测。 不过,话又说回来,同样是电动车,像Mini Cooper SE、奥迪Q4 E-Tron就能把缺陷率控制在相当低的水平,这就意味着,问题可能不尽然是“电动车”这个身份带来的,特斯拉自身在质量控制、零部件供应链或者装配工艺上,大概率还是有需要补课的地方。 最后就是,车辆照明系统问题,部分Model Y的前大灯存在照射角度偏移、亮度衰减等问题,遇到紧急情况反应距离大打折扣,另外倒车灯在挂入倒挡时可能无法正常点亮,这一细节问题进一步推高了未通过率。 特斯拉在电动化、智能化方面确实是行业的领头羊,这点毋庸置疑,但在“软件定义汽车”趋势下,不能光为科技功能与加速性能买单,车辆的长期可靠性、售后成本等都是影响购车的关键因素。 03、欧洲市场基本沦陷 这份报告,也可能点出了为什么特斯拉在德国卖得相当差的原因。 今年11月份,根据德国联邦运输管理局(KBA)数据,特斯拉的市场注册量仅为1763辆,比去年同期下降五分之一多。 与之对应的,11月份德国新注册的纯电动汽车(BEV)超过55740辆,比去年同期增长58.5%。纯电动汽车占所有新注册车辆的22%以上。 如果将视线放的更远,截至10月份,德国新能源汽车总销量达 434627 辆,同比增长近 40%;而其中特斯拉仅售出15595 辆,同比暴跌 50%,平均月销1550辆。 虽然可以将销量下滑部分归因于马斯克煽动性的政治言论,让不少欧洲消费者不舒服,但产品本身的品控问题经过用户口口相传,也是一个不容忽视的原因。 此前,德国T-Online网站还做过一次调查,有超过10万的德国人参与,其中94%的德国人表示不会购买特斯拉,只有3%愿意考虑。 不仅如此,特斯拉11月在欧洲多个主要市场的新车注册量都是同比大幅下滑,比如在法国下跌58%,至1593辆;在瑞典下滑59%,至1466辆;在丹麦减少49%,至534辆;在荷兰下滑44%,至1627辆;在葡萄牙下跌47%,至425辆。 与此同时,在首次进军印度市场后,特斯拉交出的成绩单同样糟心——自7月开放订单以来,两个月仅卖出100多辆。 这份报告也揭示了,消费者是为炫酷的创新买单,还是用脚投票转向更可靠的产品,市场最终会给出答案,对于特斯拉来说,补上机械素质这一课,或许比发布任何新功能都更紧迫。
宾利首款纯电SUV纽北测试:定位低于添越,共享保时捷卡宴纯电版零件
IT之家 12 月 6 日消息,科技媒体 CarScoops 昨日(12 月 5 日)发布博文,报道称在添越(Bentayga)问世十年并成为品牌销量支柱后,宾利终于着手研发第二款 SUV 车型,也是其首款纯电动 SUV,项目代号“Urban SUV”,定位低于添越(Bentayga)。 该媒体在最新博文中,分享了一组在德国纽博格林北环赛道抓拍到的照片,展示了这款 SUV 新车,与提供燃油和混动选项的添越不同,新车将仅作为纯电动车型(EV)销售。 谍照显示,测试车辆覆盖着厚重的伪装和车身覆层,使用了形状类似现款添越的假圆形大灯进行掩饰,这与此前发布的 EXP15 概念车的垂直大灯设计并不相符。从轮廓判断,新车尺寸小于添越,车顶线条更低,整体体量预计与保时捷新款卡宴纯电版相当。 虽然官方尚未确认具体动力参数,但业界普遍认为该车将与保时捷卡宴纯电版共享大量零部件,意味着新车极有可能搭载 113 千瓦时的电池组和 800 伏电气架构,考虑到宾利车型通常更重,其 WLTP 工况下的续航里程可能会略低于卡宴纯电版预计的 350 英里(约 560 公里)。 根据早前提交的商标文件,新车可能被命名为“Mayon”(源自菲律宾的一座火山名)或“Barnato”(致敬宾利传奇赛车手),延续了宾利以地标或传奇人物命名的传统。 在动力输出方面,参考卡宴纯电版的配置(标准版 402 马力,Turbo 版峰值功率可达 1139 马力),宾利新车的动力参数预计将介于这两者之间。此外,谍照摄影师捕捉到的内饰信息显示,宾利将不会追随当前电动车普遍采用的“平板仪表 + 巨型中控屏”的设计潮流,而是有望保留更具品牌特色的豪华内饰风格。 IT之家附上相关图片如下:
估值560亿!OpenAI谷歌看中的AI独角兽,又获新融资
编译 | 王欣逸 编辑 | 程茜 智东西12月5日消息,昨天,美国AI法律科技公司Harvey宣布筹集了1.6亿美元(约合人民币11.31亿元)F轮融资,估值达到80亿美元(约合人民币565.73亿元)。 此次融资距离上一轮融资仅过去5个月,彼时该公司的估值为50亿美元(约合人民币353.58亿元)。该公司声称其年度经常性收入在今年8月份已经达到了1亿美元(约合人民币7.07亿元)。 本轮融资由风投机构a16z领投,红杉资本、凯鹏华盈、WndrCo、Conviction Partners等参投。 截至目前,Harvey已获得了7轮融资,总融资额超9.6亿美元(约合人民币67.9亿元),OpenAI创业基金、谷歌风投等多次参与投资。 Harvey由前谷歌DeepMind研究员和前顶级律所律师于2022年创办,专注用“AI+法律”解决垂直行业问题,推出了包含AI助理、文档库、数据库、工作流的法律AI平台,已和美国百强律师事务所中的50家达成合作关系。 一、谷歌大佬联合法学博士创办、已签约美国百强律所中的50家 Harvey成立于2022年,由联合创始人温斯顿·温伯格(Winston Weinberg)和盖布·佩雷拉(Gabe Pereyra)创立。 温伯格是Harvey的首席执行官,博士毕业于南加州大学古尔德法学院,毕业后,他曾在奥梅尔维尼与迈尔斯律师事务所工作了一年,随后联合创立了Harvey。 温斯顿·温伯格(Winston Weinberg) 另一位联合创始人佩雷拉目前担任Harvey的主席,在和温伯格联合创立这家公司之前,他曾先后在谷歌DeepMind、Meta从事研究科学家工作。 盖布·佩雷拉(Gabe Pereyra) Harvey专注为律所、企业法务部门等提供AI解决方案,主要产品是其法律AI平台,它包含AI助理、文档安全储存库、知识数据库和工作流等多种功能,能优化合同分析、尽职调查、合规性和诉讼等工作流程。 Harvey的AI助理功能(图源:Harvey) 该公司的客户涵盖了700家律师事务所和企业。官方数据显示,Harvey已和美国百强律师事务所中的50家签约,并服务了超过7.4万名律师用户,还和全球四大会计师事务所之一普华永道、美国电信巨头康卡斯特等知名企业建立了合作关系。 Harvey部分合作企业(图源:Harvey) 二、OpenAI、谷歌追着投,资本助推Harvey登上行业领先地位 除了谷歌大佬联手法学博士的背景外,Harvey还拥有其他优势:它在2022年就已入局,比OpenAI推出ChatGPT还要早,在技术、客户积累和合作经验方面,该公司处于AI法律领域的领先地位。 与此同时,资本成了Harvey的最大推手。 在TechCrunch上个月的采访中,温伯格称,他在处理一个房东-租客纠纷案时受佩雷拉的启发,利用GPT-3协助处理案子。他们共同研发了一个思维链,其生成的AI结果几乎得到了专业律师的完全验证。随后,他们给OpenAI的首席执行官萨姆·奥特曼(Sam Altman)和OpenAI的总法律顾问贾森·权(Jason Kwon)发了封冷邮件。 正是受这封邮件的影响,Harvey成为OpenAI创业基金的首批投资项目,此后,OpenAI几乎没有缺席过Harvey的每一轮融资,Harvey也始终备受顶级风投资本青睐。 截至目前,Harvey已获得了7轮融资,总融资额超9.6亿美元(约合人民币67.9亿元),公司估值达到80亿美元(约合人民币565.73亿元)。此前,Harvey获得OpenAI创业基金、谷歌风投和红杉资本的多次投资,具体融资情况如下: 2022年12月,获得OpenAI创业基金、Elad Gil等投资的500万美元(约合人民币3535.8万元)种子轮融资; 2023年11月,获得红杉资本领投的2100万美元(约合人民币1.49亿元)的A轮融资,OpenAI创业基金参投; 2023年12月,获得Elad Gil和Kleiner Perkins领投的8000万美元(约合人民币5.65亿元)B轮融资,OpenAI创业基金参投; 2024年7月,获得谷歌风投领投的1亿美元(约合人民币7.07亿元)C轮融资,OpenAI等参投; 今年2月,获得红杉资本领投的3亿美元(约合人民币21.2亿元)D轮融资,谷歌风投、OpenAI创业基金等参投,估值达到30亿美元(约合人民币212.1亿元); 今年6月,获得Kleiner Perkins和Coatue领投的3亿美元(约合人民币21.2亿元)E轮融资,谷歌风投、OpenAI创业基金、红杉资本等参投,估值达到50亿美元(约合人民币353.58亿元)。 结语:资本押注“AI+垂直行业”热情高涨 Harvey的长期投资方埃拉德·吉尔(Elad Gil)称:“Harvey凭借其技术实力与市场定位的精准匹配,已成为市场的领导者之一。” 除了Harvey拥有一系列顶级客户、几乎垄断性的行业影响力的自身优势外,它也是当前风险投资“造神运动”的又一范例。 以OpenAI、谷歌、红杉资本为代表的顶级风投狂撒钱,助推Harvey实现“顶级风投-顶级客户”的向上循环。对于押注AI应用专业领域的企业,资本依然兴致勃勃。
CounterPoint报告2025Q3全球手机畅销榜:iPhone 16夺冠
IT之家 12 月 6 日消息,市场调查机构 CounterPoint Research 昨日(12 月 5 日)发布博文,公布 2025 年第 3 季度全球最畅销智能手机榜单,被苹果与三星瓜分,两家品牌各占五席,这十款机型的总销量占据了当季全球智能手机总销量的 20%。 在具体机型方面,iPhone 16 以 4% 的市场份额稳居全球销量冠军,这也是该机型连续第三个季度领跑市场。这一成绩主要得益于印度节日促销的推动以及日本市场的持续复苏,有效抵消了因 iPhone 17 系列发布带来的季节性销量下滑。 与此同时,iPhone 17 系列在发布首月即展现出强劲势头,其 Pro Max 机型尽管在该季度末才上市,仍迅速冲至榜单第十位。不过,这也导致 iPhone 16 Pro 机型在美国、英国和中国等核心市场的销量出现明显下滑,更多消费者转而选择了新一代产品。 新入榜的 iPhone 17 Pro 系列在硬件配置上实现了重大突破。为满足专业创作需求,该系列搭载了全新的 A19 Pro 芯片,并引入了均热板冷却系统(Vapor Chamber)以提升持续性能。 影像方面,新机配备了专业级 4800 万像素传感器,支持 ProRes RAW 和 GenLock 等高级功能,并提供 8 倍光学品质的长焦变焦。这些升级吸引了大量持有旧款机型的用户进行换机,尤其是在疫情期间购机的用户群中引发了换机潮。 三星在本季度的表现同样亮眼,其上榜的五款机型全部来自 Galaxy A 系列。其中,Galaxy A16 5G 表现最为突出,不仅超越了其前代产品,还取代了 4G 版本成为全球最畅销的安卓手机。 针对中端市场,三星在 Galaxy A36 和 A56 机型中下放了原本旗舰机才有的 AI 功能,这套被称为“Awesome Intelligence”的系统包含了“最佳面孔”(Best Face)和“夜景摄影”(Nightography)等功能,配合更快的充电速度和更长的系统支持周期,这些中端机型在市场上展现出了极强的竞争力。 在 5G 网络方面,随着 5G 技术成为各地区的标准配置,5G 手机首次在第三季度包揽了榜单的前五名,不过 Galaxy A16 4G 和 Galaxy A06 等 LTE 机型在拉美、中东及非洲等新兴市场仍保有重要地位。 IT之家注:本次报告中的销量指 Sell-Through(销售流通),在供应链中指产品从总代理商逐级批发给下级分销商,最终到达终端零售商的全过程,衡量渠道效率。 和相关概念的区分如下: Sell-In:产品从生产商卖给一级总代理商或大区代理商的过程(进货)。 Sell-Out:产品从终端零售商直接销售给最终消费者(实销)的过程。 Sell-Through:介于 Sell-In 和 Sell-Out 之间,是批发环节的销售,也可指代售罄率指标。 例如一个电子产品品牌,先从厂家向总代(Sell-In),总代再分销到各地市级代理商,市级代理商卖给各区域的零售店(这就是 Sell-Through),最后零售店卖给顾客(Sell-Out)。如果零售店某个季度的 Sell-Through 很高,说明渠道消化能力强,商品卖得快。
马斯克:希望下个月毫无保留地开源X平台全部代码
IT之家 12 月 6 日消息,北京时间今天凌晨,马斯克在 X 平台发文透露,X 在向人们展示“引人入胜的内容”这一方面进展迅速,希望下个月就能开源 X 的全部代码,毫无保留。 马斯克此次回复的帖子来自博主 Robert Scoble,IT之家附原文大意如下: X 上的氛围正在发生变化。 我和 xAI 内部的一些人聊过。据我听说,全新的“完全体”算法还需要几周时间才会推出,由新(版)的 Grok 来运行,而下面这份报告让我对未来感到兴奋。 随着新系统陆续上线,这里的氛围已经改变。有人在受益,有人有损失。不过过去一年,科技行业的帖子明显上升,而且随着新算法开始逐步投入使用,我的“For You”信息流质量比一年前明显提升。 如果使用没有算法、实时更新的 X Pro(只要你把列表放进去)来观察整个科技行业,你会看到事情确实在改变。 其中一个亮点是 Grok 的快速进步。 今天的 Grok 已经具备记忆功能,非常好玩,而且在观看视频的能力方面,比我在社交领域见过的任何平台都要强。 因此,我对这里的未来感到兴奋。 在经历转型的过程中,氛围可能有些奇怪,但明年会出现一个全新的 X,而在另一端它将变得更有用。 最后一点:氛围之所以变化,是因为 AI 在全球的重要性不断提升,而 X 已经成为 AI 行业的核心阵地。 我认为明年即将到来的变化会把这一趋势进一步强化。 不仅因为 xAI 在做什么,也因为其他团队的贡献。我正与 @blevlabs 合作,把他的认知架构接入我的列表,看起来未来一个月会看到成果,我预计 Grok 也会如此。 此前,马斯克今年已陆续开源了 Grok 2.5 模型及自家的百科平台 Grokpedia。
720亿大收购背后:Netflix如何击败大热门派拉蒙抢走华纳兄弟?
Netflix意外胜出 凤凰网科技讯 北京时间12月6日,流媒体巨头Netflix周五宣布,将以720亿美元收购华纳兄弟,包括电影电视制片厂、HBO以及HBO Max流媒体业务。《金融时报》对此发表内幕文章,披露了之前不被看好的Netflix为何能击败大热门派拉蒙 ,意外拿下华纳兄弟。 Netflix的胜出对华纳兄弟母公司华纳兄弟探索(WBD) CEO大卫·扎斯拉夫(David Zaslav)来说也是一次惊人的胜利。就在几周前,他还看起来将被雄心勃勃、年仅42岁的大卫·埃里森(David Ellison)取代。但是,扎斯拉夫成功激起了多方竞购战,不仅提振了公司低迷的股价,更是找到了愿意让他继续担任WBD制片业务负责人的买家。 今年夏天,埃里森刚刚以80亿美元收购了派拉蒙。合同墨迹还未干,他就在9月把目光投向了WBD ,开始发起竞购攻势。 竞购开始 扎斯拉夫对于埃里森的收购接触感到恼火。他早已公布拆分WBD的计划:由自己继续执掌公司更光鲜、增长更快的制片厂、流媒体与HBO业务,同时剥离拖累股价的传统电视频道业务。 但据知情人士透露,WBD董事会意识到必须迅速行动,否则可能失去对事态的控制权。于是,WBD在10月正式启动竞购程序,扎斯拉夫开始积极寻找其他买家。“派拉蒙显然不会善罢甘休。”一位参与出售交易的人士表示。 埃里森对华纳兄弟志在必得 在WBD内部,此次出售计划的代号为“斯特林计划”。竞购方均被赋予代称:Netflix代号“贵族”(Noble),WBD自身代号“奇迹”(Wonder),派拉蒙代号“王子”(Prince),康卡斯特代号“魅力”(Charm)。 由于埃里森十分渴望收购WBD,再加上其父、全球顶级富豪拉里·埃里森(Larry Ellison)的充沛资金支持,以及阿波罗全球管理公司与沙特的额外投资背书,WBD几乎已成为埃里森的囊中之物。美国总统特朗普似乎公开支持让华纳兄弟被派拉蒙收购,他向媒体表示“埃里森家族是我的朋友”。 Netflix低调出击 与此同时,Netflix似乎在淡化其收购意向。今年10月,该公司联席CEO格雷格·彼得斯(Greg Peters )月在一场彭博社会议上表示:“我们秉承的是建设者基因,而非收购者传统。大型媒体并购历来成绩平平。” 为维持竞购势头,WBD设定了异常紧迫的时间表,要求竞标方在数日内修改通常需耗时数周的条款。一位接近WBD CEO的人士表示:“这件事太重大,影响了太多人,我们必须赶快推进,不能拖拖拉拉。” 在六周时间里,WBD董事会成员几乎每日都参加紧急会议,通宵达旦地起草条款,并在感恩节周末展开艰难谈判。 本周,这场竞购进入白热化阶段,最终报价截止时间为周一上午。Netflix、派拉蒙与康卡斯特分别提交了截然不同的方案。经过周四晚数小时辩论,WBD董事会召开闭门会议并达成一致:接受Netflix的报价。 Netflix原本并非这场竞购的明显领跑者,该公司从未尝试过如此规模的交易。但在WBD董事会内部,一项因素压过了价格考量:Netflix提交了完整成熟的收购提案。 “在所有实质性层面,Netflix都已经做好执行这笔交易的准备。”一位参与出售谈判的人士透露。Netflix团队连续十天逐项回应所有要求,收紧条款,并同意支付58亿美元分手费,这将是史上最高解约金之一。 立即签署 WBD董事会想要的是一份能够立即签署的方案。那天晚上,只有Netflix的方案是完全可以执行的。“投票结束后的几分钟内,合同就签好了,”一位参与交易的人士表示。 Netflix的报价满足了WBD董事会的所有要求。为了促成交易,他们也愿意接受对方提出的修改。相比之下,据知情人士透露,派拉蒙和康卡斯特当时仍在试图谈判某些条款。 WBD CEO扎斯拉夫 就连Netflix内部人士也表示,直到近期他们都自视为这场交易的边缘参与者。“我们始终认为胜算渺茫,毕竟派拉蒙介入既早又猛,”一位高管透露,“尽管我们自认方案与战略更优。” 一位知情人士表示,即便在Netflix完成接管后,扎斯拉夫也可能继续保留对制片业务的运营控制权,尽管正式协议尚未签署。而在派拉蒙的交易方案下,他则无法享受这样的待遇,因为他需要与埃里森共享CEO职位。 反垄断障碍 Netflix表示,预计这笔交易将在12到18个月内完成。但接近美国监管机构的人士称,流程可能会更久,因为该交易预计将面临严重的反垄断障碍。接近特朗普政府监管官员的一位人士表示,美国两大流媒体平台合并很可能被视为反竞争行为。 Netflix高管表示,他们对克服任何反垄断疑虑充满信心,理由是娱乐市场庞大而多元,观众正转向YouTube等数字平台。 研究公司Forrester分析师迈克·普鲁克斯(Mike Proulx)表示,如果交易达成,它将使Netflix成为“流媒体服务领域的巨无霸” ,引发“娱乐行业的剧变”。 然而,Netflix的股价在周五开盘时下跌了4%,显示投资者对这笔收购持怀疑态度。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。