EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
金句媲美雷军!罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队
智东西 作者 | 云鹏 编辑 | 李水青 罗福莉加入小米后的首次公开演讲,来了! 智东西12月17日北京现场报道,刚刚,小米举办了年度“人车家全生态”合作伙伴大会,现场人头攒动座无虚席,展区不少展台都已被围观人群挤满,讨论热度颇高。 小米创始人兼CEO雷军此次并未来到现场,小米集团合伙人、集团总裁卢伟冰率先登台演讲,今天第三位演讲的是当前备受关注的原DeepSeek核心成员、被业内称为“天才少女”的罗福莉,她现在的职位是小米MiMo大模型负责人。 罗福莉在演讲过程中虽然稍显紧张,但她抛出的海量金句却句句令人印象深刻: ·AI正以非线性的方式重演人类大脑6亿年的进化史; ·语言是人类思维和物理世界在符号空间的“投影”; ·下一代智能体系统不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”; ·相比生物演化的稳固根基,AI的发展是“空中楼阁”; ·AI进化的下个起点,一定是有一个能跟物理世界交互的模型; ·算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力; ·开源的价值本质上是一种分布式的技术加速主义; ·开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径; 在演讲中,罗福莉首次明确解读了小米打造Agent语言基座模型的三个核心方向,解读了新模型背后的多项关键技术突破。对小米如何通向AGI,罗福莉也明确了小米的路径。 除了AI大礼包,今天会上,卢伟冰也分享了小米整体业务的诸多亮点。 卢伟冰说,2025年是小米“大发展”的一年,今年前三季度,小米收入同比增长32.5%,超过了3400亿元,经调整利润同比增长73.5%,其中手机销量中国市场1-10月排名第二。 未来五年,小米集团研发投入预计将超过2000亿元,2026年预计研发投入在400亿左右。 小米人车家生态究竟包括什么?卢伟冰这次给出详细拆解: 产品包括个人设备、出行设备、家庭设备; 核心技术包括芯片、OS、AI; 智能制造包括手机、汽车、大家电工厂; 什么是小米当前聚焦的核心,一目了然。 在大家最关心的AI方面,小米自研MiMo系列大模型家族赫然呈现:推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型。 一个月前的11月12日,罗福莉在朋友圈正式官宣加入小米Xiaomi MiMo团队。就在昨晚,小米刚刚发布了最新的MiMo大模型MiMo-V2-Flash,性能媲美DeepSeek-V3.2,这也是罗福莉加入后MiMo团队亮出的首个新成果。 一、罗福莉首次解读小米大模型三个重点方向,算力和数据并非最终护城河 罗福莉一上台就回到了“6亿年前”,她说,AI正以非线性的方式重演人类大脑6亿年的进化史。 为什么大模型“智能”起源于语言?在罗福莉看来,语言是人类思维和物理世界在符号空间的“投影”,而大模型成功解码了人类思维在文本空间的投影。 小米从“语言”出发,构建了面向Agent时代的语言基座模型MiMo-V2-Flash。 在小米看来,超强的代码和工具调用能力是Agent沟通的高效“语言”,围绕极致推理效率设计的模型结构是“高带宽”的Agent协作的关键,全新后训练范式则能够保证高效稳定的扩展强化学习训练。 这三个方面是小米聚焦的重点。 罗福莉特别提到,MiMo-V2-Flash模型并不大,但在代码和Agent测评基准测试中已经达到全球开源模型TOP2。 MiMo-V2-Flash的推理效率是其突出优势,在全球大致相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash实现了低成本和高速度优势。 具体来看,小米围绕极致推理效率来设计模型结构,采用了Hybrid SWA架构,固定KV Cache,增强长文推理,此外,团队采用3层MTP推理加速并行Token验证,实现推理速度2-2.6倍的提升。 在全新后训练范式方面,团队采用了Dense&Token-Level的强化学习。 当前MiMo-V2-Flash已经初步具备了模拟世界的能力,比如通过HTML写操作系统、模拟太阳系、画一颗圣诞树。 今天发布会现场,罗福莉宣布MiMo-V2-Flash发布即开源,模型权重、技术报告都开源,API限时免费。 对于未来的Agent发展,罗福莉提到,下一代智能体系统,不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”。 Agent执行从“回答问题”到“完成任务”,具有记忆、推理、自主规划、决策、执行的能力。 Omni感知统一多模态感知,为AI理解物理世界打下基础,嵌入眼镜等智能终端、融入日常工作流。 在通往AGI的路上,罗福莉团队希望补全缺失的演化拼图,单纯Scaling UP参数量不够,他们要让LLM回到“演化课堂”,补上它跳过的关键学习步骤。 简单来说,他们非常看重AI与真实世界的交互,强调多模态。 罗福莉特别提到,相比生物演化的稳固根基,AI的发展有些像“空中楼阁”。在她看来,AI进化的下个起点,一定是有一个能跟物理世界交互的模型。 AI不仅要看懂画面,还要理解背后的物理规律;AI不仅要推理文本,而是理解世界的运作逻辑。 罗福莉说,这一观点并非共识,行业中也有不少人认为语言就可以实现最终的AGI,比如Ilya。 在她看来,算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力。 罗福莉现场也开启了“招聘会”,她提到,小米大模型Core团队是研究、产品与工程深度耦合的年轻团队,“小而美”却充满创业精神,他们极度好奇、追求真理。 罗福莉提到,在她刚刚开始研究时,开源模型与顶尖模型的代差有三年,而今天这一差距已经缩短到了“数月”。 他们相信开源的价值,开源的价值本质上是一种分布式的技术的加速的主义。在罗福莉看来,开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径。 未来,从数据的极致压缩,到算法的范式创新,再到与物理空间的深度链接,小米与全球AI共同定义未来。 95后罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。她曾在阿里巴巴达摩院主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作,2022年入职DeepSeek,参与了MoE大模型DeepSeek-V2的研发。 集诸多光环于一身,来到小米的罗福莉,其动向一直是业内关注的焦点。 结语:猛攻Agent基座模型,小米人车家生态全力冲刺AI AI,显然是整场小米生态大会围绕的核心关键词。 面向AI未来,小米的机会点显然不止于AI手机,手机、PC、穿戴、IoT、汽车,小米人车家全生态均能与AI深度融合,小米在大模型方面的AI基础能力提升则进一步加速了这一进程。 卢伟冰近日曾提到,小米AI大模型业务过去投入持续增长,“AI与现实世界深度融合”已被列为小米未来十年核心战略。显然,面对AI这场硬仗,小米已经做好准备All in,“兵马和粮草”都在加码筹备。
小米突然发布新模型:媲美 DeepSeek-V3.2,把手机的性价比卷到 AI
开源模型再次迎来一位重磅选手,就在刚刚,小米正式发布并开源新模型 MiMo-V2-Flash。 MiMo-V2-Flash 总参数 3090 亿,活跃参数 150 亿,采用专家混合架构 (MoE),性能还能和 DeepSeek-V3.2、Kimi-K2 这些头部开源模型掰掰手腕。 此外,MiMo-V2-Flash 采用 MIT 开源协议,基础版权重也已经在 Hugging Face 上发布,除了开源,新模型真正的杀手锏在于架构设计上的激进创新,把推理速度拉到了 150 tokens/秒,成本压到了每百万 token 输入 0.1 美元、输出 0.3 美元,主打一个超绝性价比。 从官方提供的页面来看,MiMo-V2-Flash 支持深度思考和联网搜索功能,这意味着它不仅能写代码、解数学题,还能实时获取最新信息。 附上AI Studio 体验地址: http://aistudio.xiaomimimo.com 开源模型新标杆,SWE-Bench 霸榜开源第一 老规矩,咱们先来看看 MiMo-V2-Flash 的跑分环节。 在数学推理方面,AIME 2025 数学竞赛和 GPQA-Diamond 科学知识测试中,MiMo-V2-Flash 都排在开源模型前两名。 编程能力更是亮眼,SWE-bench Verified 得分 73.4%,超越所有开源模型,直逼 GPT-5-High。做个简单科普,这个测试是让 AI 去修真实世界的软件 bug,73.4% 的成功率意味着它能搞定大部分实际编程问题。 多语言编程基准测试 SWE-Bench Multilingual 解决率 71.7%,智能体任务上,MiMo-V2-Flash 在τ²-Bench 分类得分中,通信类 95.3 分,零售类 79.5 分,航空类 66.0 分。 BrowseComp 搜索代理得分 45.4,启用上下文管理后直接飙到 58.3。 这些数据说明,MiMo-V2-Flash 不仅会写代码,还能真正理解复杂任务逻辑,执行多轮智能体交互。长文本能力也没拉胯,实测表现甚至超越了体量更大的 Kimi-K2 Thinking,证明混合滑动窗口注意力架构的长程建模能力确实强悍。 写作质量也接近顶级闭源模型,这意味着 MiMo-V2-Flash 不只是个工具,还能当个靠谱的日常助手。 长文本性能不打折,成本降 6 倍的秘密 MiMo-V2-Flash 最核心的创新是混合滑动窗口注意力。 传统大模型处理长文本时,全局注意力机制会导致计算量二次爆炸,存储中间结果的 KV 缓存也跟着飙升。小米这次采用了 5 比 1 的激进比例,5 层滑动窗口注意力搭配 1 层全局注意力交替使用,滑动窗口只看 128 个 token。 (考虑到有朋友不太了解 AI,简单科普一下:「token」(中文常译作「词元」)在大模型/自然语言处理里,指的是模型读入和输出文字时使用的最小计数单位。模型并不是按「一个汉字=1、一个英文单词=1」这样固定地数,而是把文本切成一段段 token 来处理。) 简单说就是,模型不用每次都看全部内容,只看最近 128 个 token,偶尔看一次全局,这样计算量和存储都能大幅下降。这种设计让 KV 缓存存储量直接减少了近 6 倍,但长文本能力却没打折扣,最长支持 256k 上下文窗口。 关键是小米还整了个「可学习的注意力汇入偏置」,其的用是让模型即使在这么激进的窗口设置下,照样能稳住长文本性能。 罗福莉在社交平台上特别强调,窗口大小 128 被证明是「最佳数值」,而 512 反而会导致性能下降。这个发现挺反直觉的,你会觉得窗口越大越好,但实际测下来 128 才是甜点。另外,sink 值(attention sink values)必不可少,绝对不要省略它们。 另一个黑科技是轻量级多 Token 预测 (MTP)。 传统模型生成文本时一次只能吐一个 token,就像打字员一个字一个字敲。MiMo-V2-Flash 通过原生集成的 MTP 模块,能并行预测多个 token,一次性猜出接下来好几个 token。 实测平均能接受 2.8 到 3.6 个 token,推理速度直接提升 2 到 2.6 倍,不仅在推理时管用,训练阶段也能加速采样,减少 GPU 空转,属于一箭双雕。 罗福莉提到,在三层 MTP 设置下,他们观察到平均接受长度超过 3,编码任务速度提升约 2.5 倍。它有效解决了小批量 On-Policy 强化学习中「长尾样本」带来的 GPU 空闲时间浪费问题。 啥叫长尾样本?就是那些特别难、特别慢的任务,拖着其他任务一起等,GPU 就在那干瞪眼。MTP 把这个问题给解了,效率直接起飞。 不过罗福莉也坦诚,这次因为时间紧迫没能把 MTP 完整集成进 RL 训练循环,但它与该流程高度契合。小米已经把三层 MTP 开源了,方便大家在自己的项目中使用与开发。 算力只用 1/50,性能如何不打折? 预训练阶段,新模型使用 FP8 混合精度,在 27 万亿 token 数据上完成训练,原生支持 32k 序列长度。 FP8 混合精度是一种压缩数值表示的技术,能在保持精度的同时减少显存占用和加速训练。这种训练方式在业界并不常见,需要对底层框架进行深度优化。 而在后训练阶段,小米整了个大活,提出了多教师在线策略蒸馏 (MOPD)。 传统的监督微调加强化学习管线,不仅训练不稳定,算力消耗还贼高。MOPD 的思路是让学生模型在自己的策略分布上采样,然后由多个专家教师在每个 token 位置提供密集的奖励信号。 通俗点说就是,学生模型自己写作业,老师在每个字上都给评分,不用等写完整篇才打分。这样一来,学生模型能快速从教师那里学到精髓,而且训练过程稳定得多。 最夸张的是效率提升,MOPD 只需要传统方法 1/50 的算力,就能让学生模型达到教师性能峰值。这意味着小米能用更少的资源,更快地迭代模型。 而且 MOPD 支持灵活接入新教师,学生模型成长后还能反过来当教师,形成「教与学」的闭环自我进化。今天的学生,明天的老师,后天又能教出更强的学生,套娃玩法属实有点东西。 用罗福莉的话来说,他们借鉴 Thinking Machine 的 On-Policy Distillation 方法,将多个强化学习模型进行融合,结果带来了惊人的效率提升。这为构建一个自我强化循环系统奠定了基础,学生模型可以逐步进化,最终成为更强的教师模型。 在智能体强化学习扩展上,小米 MiMo-V2-Flash 研究团队基于真实 GitHub issue 构建了超过 10 万个可验证任务,自动化流水线跑在 Kubernetes 集群上,并发能开 10000 多个 Pod,环境部署成功率 70%。 针对网页开发任务,还专门搞了个多模态验证器,通过录制视频而非静态截图来验证代码执行结果,直接减少视觉幻觉,确保功能正确。 对于开发者而言,MiMo-V2-Flash 能与 Claude Code、Cursor、Cline 等主流开发环境无缝配合,256k 的超长上下文窗口支持数百轮智能体交互与工具调用。 256k 是什么概念? 大概相当于一本中等篇幅的小说,或者几十页技术文档。这意味着开发者可以把 MiMo-V2-Flash 直接融入现有工作流,不需要额外适配,拿来就用。 小米还把所有推理代码贡献给了 SGLang,并在 LMSYS 博客分享了推理优化经验。 技术报告公开了完整模型细节,模型权重 (包括 MiMo-V2-Flash-Base) 在 Hugging Face 上以 MIT 许可协议发布。这种全面开源的态度,在国内大厂里属实少见。 目前 MiMo-V2-Flash 已经在 API Platform 限时免费开放,开发者可以直接上手体验。 小米的 AI 野心,不止于手机助手 MiMo-V2-Flash 的发布,标志着小米在 AI 赛道上的全面发力。 罗福莉在社交平台上透露了更多信息,「MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。」第二步就已经这么猛了,那后面还有啥大招?想想就有点期待。 当然,小米在技术报告中也坦诚,MiMo-V2-Flash 与最强的闭源模型相比仍有差距。但他们的计划很明确,通过扩大模型规模与训练算力来缩小差距,同时继续探索更稳健、更高效的智能体架构。 MOPD 框架下教师模型与学生模型的迭代共进化,也为未来的能力提升留足了空间。 把视角拉高来看,背后是小米对整个 AI 生态的一次战略押注。手机、IoT、汽车,小米的硬件生态需要一个强大的 AI 底座,MiMo-V2-Flash 显然就是小米为全硬件生态准备的那块基石。 就像十年前小米手机用 1999 元重新定义了旗舰机的价格标准,如今 MiMo-V2-Flash 正在用 0.1 美元/百万 token 的成本、73.4% 的 SWE-Bench 得分,重新定义开源大模型的性能标准。 这一次,属于开源模型的「小米时刻」真的来了。
冲上苹果应用榜第三!为什么蚂蚁阿福有望成为国民级AI App
作者 | 江宇 编辑 | 漠影 你有没有过这样的经历:深夜头痛,却不知道该不该就医;看完体检报告,一堆缩写让人一头雾水;想减肥、戒烟、养生,却总是三分钟热度。 面对这些细碎却真实的健康困扰,很多人都曾试图在搜索引擎或社交平台上寻找答案,但结果不仅真假难辨,稍有不慎还会被“吓一跳”。 现在,有一个更靠谱的“AI健康搭子”正在悄悄流行开来。 每晚睡前测个心率、第二天记下饮食和体重波动,“他”会像个不唠叨的朋友,把这些数据记录在册给你随时查看,还能按时提醒你别忘了锻炼、按时吃饭。甚至连你爸妈的血糖记录,它也能一并帮你管理,还能解读每一份体检报告。 这款由蚂蚁集团推出的AI健康应用——“阿福”正式推出新版本,全面强化了健康陪伴和健康问答功能。 目前,蚂蚁阿福App月活已超1500万,成为中国首个跻身AI App前五的健康类AI。 根据研究机构QuestMobile数据,蚂蚁阿福月活复合增长率83.4%,远超行业13.5%的平均增速。 新版本发布次日,也火速登上苹果应用商店免费APP下载榜TOP 3。 苹果应用商店免费APP下载榜 一、1500万月活背后,健康AI走对了第一步 蚂蚁阿福的崛起速度不算慢。2024年6月上线,4个月月活破千万,成为豆包、DeepSeek等通用型应用之后,第一个进入“AI App第一梯队”的垂直类产品。 如今,月活跃用户已超1500万,用户来源中有55%来自三线及以下城市,展现出很强的普惠属性 。 而在年轻人之间,“赛博养生”的流行,恰恰反映出对健康管理长期存在疑问与困扰,却始终缺乏有效解决方式。 普通人面对身体的不适、体检报告上的数据、家庭成员的健康变化,往往很难快速获得专业、可信的建议。而蚂蚁阿福切入的正是这些“在生活与医院之间”的空白地带。 这款产品一经发布,便以“AI健康问答”为起点,通过文字、语音、图像三种形式,让用户可以拍皮肤、拍药盒、拍体检报告来提问。 更关键的是,面对很多人“不会问”的困扰,它还能通过“AI诊室”模式模拟医生追问,引导用户补充关键信息,提高理解的准确率。 这背后是蚂蚁自研医疗大模型对图文和多模态数据的解析能力,该模型能解读99%的报告类型,皮肤识别准确率超95%。 除了技术本身,更重要的,是“阿福”将专业知识和通用AI之间的鸿沟变成了产品能力。 它能通过“分析”、“解释”和“参考建议”等方式,帮用户了解身体信号,并引导其做出更科学的决策。这种对边界感的把握,也让健康AI在“辅助决策”这条路上更靠谱。 二、不只是问答,“健康陪伴”切中当代生活刚需 如果说“健康问答”是让用户第一次感受到AI的专业性,那么此次的新版本,则进一步显露出“陪伴型AI”的产品形态,也让用户开始更直观感受到它的长期价值。 新版蚂蚁阿福上线“健康小日记”、“健康小目标”和“健康小提醒”等功能,从记录到提醒,帮助用户养成规律生活与行为习惯。 用户可以设置减重、睡眠、戒烟等目标,系统根据个人状况定制计划,并每日推送提醒。 数据可接入华为、苹果、欧姆龙等九大品牌的智能设备,也可上传图片和报告归档整理,还支持为家人建立健康档案,实现全家共享的健康管理。 相比“有问题时才会打开”的通用型AI工具使用方式,健康日记、目标提醒等功能正在慢慢融入用户的日常节奏。 在AI产品强调“持续陪伴”的今天,蚂蚁阿福更像是一种既贴合生活节奏、又具备专业支撑的健康类AI新形态,不仅能融入日常,也足够好用、让人愿意持续使用和信任。 而健康这个方向,天然带有长期性与实用价值的特征,有望成为最早验证AI陪伴产品路径的场景之一。 三、“健康+医疗”的“硬实力”打底,阿福有望成为国民级AI App 为什么是蚂蚁?因为做AI健康不止是搞个模型、接个API,而是要能同时在服务与信任上做好支撑。 蚂蚁阿福之所以有成为国民级AI App的潜力,一方面是因为健康服务具备广泛需求,覆盖了从农村到城市、从年轻人到老年人的多样化人群。 另一方面,蚂蚁集团在医疗合作网络上积累多年,也为阿福构建起完整的服务体系。从日常健康管理,到线上问诊、挂号购药、医保支付,正在逐步形成“健康+医疗”的一条龙服务。 数据显示,目前已有30万名医生、5000多家医院接入平台,六位国家院士与500多位名医在App中开设“AI分身”,为用户提供健康科普型咨询服务。 此外,多地卫健委将其引入作为“家庭医生”签约服务,形成与线下医疗的协同联动。 而在AI大模型方面,阿福背后的蚂蚁医疗大模型已通过信通院“双领域可信评估”,在HealthBench和MedBench等榜单中多次夺得中文医疗类模型的领先成绩。 在图文识别、推理能力、个性化回答方面具备稳定表现,也形成了医生团队深度共建、模型调教机制的技术优势。 这让“阿福”不仅能解答问题,还能作为“AI前哨”,在医生前介入用户健康行为,承担“预问诊”与分流功能,缓解线下医疗系统压力。这在资源分布不均、基层医生紧缺的中国,具备显著现实意义。 结语:从支付到健康,第三款“全民应用”浮现中 过去20年,蚂蚁推动了移动支付和数字金融的普及,如今阿福则有可能成为第三个国民级产品。 这次,它靠一点一滴的陪伴与专业积累,慢慢走进人们的生活。更是对那些“虽然不必上医院、但也不能忽视”的健康需求的一次系统回应。 “健康不是一朝一夕的事。”这句话放在蚂蚁阿福身上,恰如其分。 它不再让你焦虑,还能帮你一点点管理健康。这或许才是值得期待的AI。
谁在捧杀豆包手机?
豆包手机发布之后,大众为它编写了一套脚踢腾讯、拳打阿里的剧本。 有人说字节要掀桌子,有人断言微信要被豆包手机干成流量管道。微信、阿里、银行等应用拒绝被豆包手机助手调用,则被广泛理解成:大厂抱团抵制创新。 豆包手机,真值得大厂如此忌惮吗? 对于见证了智能体手机从无到有、一路迭代至今的从业者来说,豆包手机并不是什么石破天惊的发明。 从产品上看,智能体手机的技术趋势已经酝酿一年多了,荣耀、OPPO、vivo这些厂商早就在这条路上摸爬滚打,豆包手机的逻辑和主要功能都沿用了行业里已有的探索,并没有什么从0到1的突破。 从战略上看,作为躯壳的努比亚,市场销量排不进国产手机TOP5,作为灵魂的豆包手机助手,功能也并不难复制(真正的卡点是系统级授权),两者联手的产物,压根没能力撼动现有的手机格局。对于字节这样体量的大厂,豆包手机顶多算是内部众多技术探索中的一个小分支,算不上战略级动作。 靠这么一款产品去挑战根基深厚的BAT互联网大厂,几个菜能给字节喝成这样? 所以问题来了:豆包手机既算不上关键的技术突破,也没那么夸张的行业影响力,为何能在舆论场掀起这么大的风浪?它是如何被强行加戏,陷入漩涡中心的?可能比手机本身,更值得我们好好琢磨琢磨。 这场舆论风波的主流声音,可以被概括成以下剧情。 吃瓜群众:豆包手机,哪怕你与BAT为敌,我都会站在你这边。 豆包手机:我为啥要与它们为敌啊? 吃瓜群众:那你别管。 绝大多数看客眼中,豆包手机是对抗互联网旧秩序的创新英雄,也是字节跳动射向其他巨头应用的一颗“银弹”。 银弹是科技行业的经典说法,指的是一击必杀的解决方案。图灵奖得主Fred Brooks曾在《没有银弹》一书中提出,软件工程没有银弹,其复杂性决定了没有任何单一技术可以实现一劳永逸的突破。 豆包手机,也并非一颗真正撼动现有格局的银弹。 首先,豆包手机助手是在现有技术路径上进行的渐进式演进,并没有从0到1地颠覆什么,自然也谈不上撼动行业。 以大模型为基础的智能体,自动、闭环地实现手机交互与复杂任务,这一技术路径早在2024年就开始被荣耀、OPPO、vivo等厂商广泛探索。一篇2024年华为与哈工大(深圳)联合发表的论文显示,当时手机智能体已经可以完成340个多类型任务,其中就涵盖了豆包手机广为流传的高复杂度任务与跨应用协作。 根据2024年12月信通院发布《终端智能化分级研究报告》的标准来判断,豆包手机助手的能力,停留在L3或不足L3的“智能助理级”水平,能识别用户明确意图并完成既定任务,但并未达到L4、L5级别。而L3级别的手机自动驾驶能力,荣耀等厂商也早已实现。 此外,豆包手机也并未能破解智能体手机长期存在的核心难题,没有为行业困局提出新解法。 智能体手机普遍存在的痛点,是仅在部分场景实现了AI-ready,其中的比价、跨APP搜索等,是手机厂商反复试错、筛选出的特例场景。而在日常操作中的大多数场景,自然语言交互都有明显的局限,不如触控点击、滑动来得高效,用户普遍都有“让智能体干还不如自己干更快”的感觉。 豆包手机的差异,主要是站在行业经验的肩膀上,而且胆子更大: 其一,它采用了更深的系统级权限调用,而非荣耀、vivo等厂商普遍采用的视觉识屏方案,让大家感觉能力更强大,实际是权限范围不同; 其二,豆包手机的发布时间更晚,大模型的能力比之前提高,所以豆包手机助手有了更优的意图理解和任务拆解能力; 其三,作为小众实验产品,它敢于触碰银行APP等高敏场景,而主流厂商为规避商业红线,普遍选择避开此类领域,并不是真的做不到。 此前由北邮、中国联合通信、天翼安全、联想、虎牙科技、广东省标准化协会等单位共同起草的《智能体任务执行安全要求》团体标准,就明确提出,智能体不得利用无障碍权限或操作系统技术优势操作第三方App,必须通过标准化接口调用的方式协作。智能体在进行用户意图识别、通过第三方App执行任务时,应先通过第三方App授权,并在获得用户授权后执行,且第三方App有权拒绝不合理操作,以保护用户权益。 而伴随着公众对数据安全、隐私保护的担忧,豆包手机助手也主动取消了一系列敏感功能的操作。恰恰说明,它从来不是一颗针对互联网大厂的银弹,遇阻之后主动收缩能力触角,正与主流智能体手机变得趋同。 豆包手机之所以被大众当作互联网大厂的对手,一个主要原因是,背后站着字节跳动。 公众对字节的过往战绩很熟悉,自然联想到,在AI手机这件事上,或许也将上演出抖音在短视频赛道碾压其他大厂的故事。 不过,如果豆包手机真的承载了颠覆互联网格局、挑战BAT巨头的野心,绝不会选择目前这样的方式推进。 作为集团的战略级产品,必然会有全链路的资源倾斜,像短视频大战、外卖大战、AI chatbot应用那样,拼杀得刺刀见红,无论是硬件研发、供应链搭建,还是市场推广,都会拿出大厂该有的阵仗。而豆包手机应对舆论风波和应用限制,并没有硬刚,迅速收敛相关权限,这种退让态度,恰恰说明它并不想在手机助手上主动激化矛盾、挑起冲突。 而且,字节旗下拥有抖音、今日头条、飞书等众多核心产品,如果豆包手机真是其颠覆战略的重要一环,这些核心产品理应率先与之联动,形成协同效应,但事实上,抖音也拒绝了豆包手机助手的部分功能调用,足以看出在内部也并未上升到核心战略。 至少目前,豆包手机并没有展现出猎杀大厂应用的具体行动。那么,它又是如何被大众想象成了与大厂对抗的创新英雄呢? 到底是谁编写出了“豆包手机助手猎杀大厂应用”的屠狼剧本? 执笔者之一,是“苦大厂久矣”的普通大众。近年来,平台经济的弊端逐渐暴露,比如通过算法延长劳动时间,个体在强大平台面前显得被动无力,很多劳动者和消费者对平台独大的局面积累起了不满,早就渴望出现一个屠狼者,能与这些巨头平台正面抗衡。豆包手机的问世与大胆,恰好能满足这种情绪,于是就被塞进了屠狼剧本,承载了打破旧秩序的想象,哪怕这个载体本身并未具备颠覆格局的实力。 另一个执笔者就是伪专家们。有影响力的大V、KOL,让大众对豆包手机的误解和滤镜又加深了一层。那些慢创新、长创新,比如模型的一次次版本微调,芯片的一代代迭代优化,这些技术成果又慢又枯燥,讲不了性感的故事,也没什么看头,平时压根入不了他们的法眼。一有技术热点冒头,这些influencer就跳出来高谈阔论,给热点套上国、巨头博弈这种石破天惊的话术,让大家以为“这次狼真的来了”。识别这类砖家,就看他们是不是平时对技术基建漠不关心,对渐进式创新视而不见,只在有流量可赚的时候才现身发声。 内容平台对剧本的推波助澜,则触发了网络的回音壁效应,让豆包手机的神话被反复强调和强化。 在碎片化、注意力资源有限的当下,大众更倾向于接收简单直接的信息,这种阅读习惯,叠加了平台对高互动内容的流量倾斜,就形成了舆论的回音壁,“字节挑战BAT”“微信封杀豆包助手”这类戏剧冲突更强、更情绪化的讨论,更容易占据主流,被放大、被传播,客观的技术探讨却逐渐被淹没。 应对这类非理性、极化的单一声音,近年来已经成为科技企业常面临的舆论处境与挑战。 但正如Fred Brooks在《没有银弹》中的观点,技术世界里的复杂难题,并没有一劳永逸的解决方案。真正的技术突破,是渐进式、钟摆式的,不仅需要长期积累和点滴改进,还可能推倒重来。 举个例子,Transformer架构2017年便已提出,直到2023年才通过ChatGPT引爆市场,而我们当时预判,中国一定会有自己的ChatGPT,也并不是盲目乐观,是基于长期追踪中国在预训练大模型领域的实践,做出的逻辑推演。 一边渴望掀桌子的技术进步,一边又拒绝接受试错的枯燥与漫长,这是对创新最深的误解。 高喊“掀桌子”的人,往往不是日拱一卒做桌子的人。下次再遇到所谓的颠覆神话,不妨先看看故事内核,是否足够扎实。 · ·
消息称苹果iPhone 18 Pro/ Max摒弃药丸状挖孔 改用左上角单打孔+屏下Face ID
IT之家 12 月 17 日消息,科技媒体 The Information 昨日(12 月 16 日)发布博文,爆料称苹果 iPhone 18 Pro 和 iPhone 18 Pro Max 将迎来重大外观变革,计划彻底摒弃“灵动岛”药丸形挖孔,转而采用左上角单打孔前置镜头与屏下 Face ID 技术。 网友制作的渲染图,仅供参考,图源:X 平台 该信息和 @数码闲聊站 今年 11 月爆料内容相符,当时消息称:“iPhone 18 Pro 系列一些前瞻信息,之前说过屏幕形态会有变化,测试特殊 HIAA 挖孔方案,似乎是更小型化设计;主摄测试可变光圈;横向大 Deco 不变,后盖有透明设计,PM 首次采用钢壳电池。” IT之家注:HIAA 全称为 Hole-In-Active-Area,是一项关键的屏幕制造技术,主要用于实现更极致的前置摄像头“挖孔屏”方案,通过激光微钻孔工艺,在 OLED 屏幕的有效像素显示区(Active Area)内精确打孔。 相比于完全隐藏但会导致画质受损的屏下摄像头(CUP / UPC)方案,HIAA 作为“打孔屏”的终极形态,被认为是在 2027 年实现完美全屏前最稳妥的高画质自拍方案。 在硬件规格上,iPhone 18 Pro 系列预计将搭载 A20 Pro 处理器。该芯片将采用台积电最先进的 2nm 工艺节点,并结合 CoWoS 封装技术,实现紧密集成处理器、统一内存与神经引擎。 通信方面,新机将启用苹果自研的 C1X 或 C2 调制解调器,并搭配 N1 网络芯片。为确保高性能持续输出,Pro 系列还可能配备不锈钢均热板散热系统。 相机控制按钮方面,消息称新方案将移除原有的电容感应层(即取消滑动变焦等触控功能),仅保留压力感应层。 影像方面,Pro 系列有望搭载三层堆叠式图像传感器以提升拍摄质量。此外,苹果目前正在测试棕色、紫色及勃艮第红三种新配色,最终量产版或将从中择一推出。
“上机”难?曝华为、苹果手机近期不会采用3D堆叠工艺
【CNMO科技消息】12月17日,数码博主“定焦数码”爆料称,华为和苹果在下一代手机芯片中均不会采用前沿的3D封装工艺。该博主指出,苹果iPhone即便使用台积电的CoW(Chip on Wafer)技术,也属于2.5D范畴,而真正的3D堆叠封装工艺暂时并不适合放在手机等空间和功耗限制严格的移动设备上。 华为手机 据CNMO了解,3D封装技术通过垂直堆叠芯片,能在不增加芯片面积的前提下大幅提升晶体管密度和互联带宽,被视为延续摩尔定律的关键路径之一。目前,该技术已在AMD的服务器CPU(3D V-Cache)和英特尔的高性能处理器(3D Foveros)上成功应用。然而,将多颗芯片在三维空间紧密堆叠,会带来显著的发热问题,且需要极其复杂的内部布线,这增加了封装过程的难度和成本,其性能提升也并非简单的线性叠加。对于追求轻薄、长续航且对成本敏感的智能手机而言,这些挑战显得尤为突出。 尽管面临挑战,但华为在先进封装领域早有布局。早在2019年,华为就在技术大会上提出过通过3D SRAM提升芯片性能的构想。有行业报告曾推测,华为未来的昇腾AI芯片和终端麒麟芯片有望采用3D封装技术。 苹果方面,此前有消息称其计划在M5芯片上采用台积电的SoIC(3D堆叠)技术。但另有报道指出,M5芯片将先采用LMC封装技术,为未来可能采用更复杂的CoWoS封装奠定基础,暗示完整的3D堆叠方案可能不会立即在移动平台落地。苹果对供应链技术的要求极高,任何新工艺的大规模导入都需经过严格的可靠性与成本验证。
宝马新世代iX1谍照曝光:全新设计语言,五边形中控屏上车
IT之家 12 月 17 日消息,宝马正在为 iX1 准备一次彻底的技术与设计换代,基于 Neue Klasse(新世代)打造的新版本已进入开发阶段,定位将明显向新一代纯电产品靠拢,并延续 iX3 的核心技术路线。 外媒 Carscoops 今天曝光了一组测试车的谍照。新款 iX1 采用全新前脸造型,细长的双肾格栅与 iX3 风格接近,灯组设计也高度统一。前保险杠取消纵向装饰元素,改用更宽的进气口布局,并通过更圆润的曲面改善风阻表现。 车侧设计更强调力量感与流线感的结合,外扩轮拱、隐藏式门把手等元素共同构成更现代的视觉效果。车尾被严密伪装,却可以明显看到尾门结构和牌照位置得到重新调整,扰流板造型更平直,整体轮廓更加圆润。 座舱部分完全向 Neue Klasse 靠拢,新车配备全景式 iDrive 系统,显示带横贯挡风玻璃下沿,并搭配一块独立式中控屏,采用了曾在 Neue Klasse 概念车上亮相的独特五边形设计,尺寸预计约为 17.9 英寸。中控台布局与 iX3 高度一致,沿用后者的换挡机构和控制方式,后视镜处还集成了摄像头模块。 现有信息显示,新一代 iX1 将作为独立开发的纯电车型登场,并与燃油版形成设计和技术路径的分离,模式与 X3 和 iX3 相同。 IT之家从报道中获悉,在技术层面,新款 iX1 预计与 iX3 实现“深度共享”,包括 800V 高压平台、圆柱电池以及高效率电驱系统。参考已发布的 iX3 50 xDrive 版本,其双电机四驱系统可输出 345kW 功率和 645Nm 扭矩,搭载 108.7kWh 电池后,WLTP 续航最高达到 805km。
“一体式压铸”维修性差?理想汽车负责人回应
凤凰网科技讯 12月17日,理想汽车材料技术负责人“吉超超有材”发文回应“一体式压铸”维修性差:他表示,在正面碰撞和尾部碰撞工况下,一体式压铸结构其实并不直接处于碰撞第一线,至少有3层的保护设计。防撞梁第一道先扛,吸能盒第二道压溃吸能,纵梁第三道压溃吸能。这些碰撞设计,都是为了更好地抵抗变形,同时在合适的变形范围内最大效率吸收能量。当然,这还没算外面的塑料保险杠、泡沫吸能块。 一般低速碰撞,可能也就最多损伤到防撞梁,可以直接更换。如果碰撞能量较高,损伤了吸能盒和纵梁,也是可以整体更换的。所以正常的碰撞,主机厂都设计了保护,可以有比较好的维修经济性,完全不存在“轻轻一碰、马上换车”的说法。 如果真的车速特别特别高,碰撞能量特别特别高,这时候,不管是压铸结构还是钣金冲焊,都将是大手术。当然,这种情况,钣金是相对更好修的,一体压铸确实维修困难。但不管如何,这种情况哪怕是钣金修复后,对汽车来说也是伤筋动骨、元气大伤。 他还介绍,国外车企不是不用一体压铸,比如沃尔沃EX90就是一体压铸后车体。越来越多的欧美品牌在使用这个技术,早就不稀奇了。在国内目前来说,作为从业者大家都清楚真实情况。绝大多数情况下,不用一体压铸的原因是“成本”,而不是“维修性”。所以,一般成本很低的车是不太用一体压铸的,钢车身更实惠。当然,也有不少国内品牌20-40万的车,也不用一体化压铸,这个会是“隐藏的成本优势”。
比亚迪拥抱鸿蒙生态,申请加入全球智慧物联网联盟
IT之家 12 月 17 日消息,比亚迪汽车工业有限公司今日申请加入全球智慧物联网联盟(GIIC),并申请成为联盟理事单位。 IT之家注:GIIC 于 2024 年 6 月成立,是由物联网和鸿蒙生态伙伴共同发起、产业共建的国际产业组织,旨在构建万物智联的产业新生态。作为首个聚焦“物联网 + 鸿蒙”的国际化产业平台,GIIC 汇聚了中国信通院、华为、海尔、中国移动等 350 余家海内外企业与机构,致力于打造物联网核心数字底座,推动鸿蒙生态产业标准化、规模化发展。 依托比亚迪在智能汽车领域的产业实践与 GIIC 的联盟资源,双方将牵头推进“人-车-家”全场景互联标准的制定与完善。重点聚焦 AI 智能体(Agent)层面的协同创新,推动车规级鸿蒙设备与家用智能终端的技术接口、数据协议标准化,从底层打破“车”与“家”的物理和数据边界,解决行业内接口不统一、协议不兼容的“碎片化”困境。未来,无论是比亚迪全品牌车型,还是联盟内的智能家居、个人穿戴设备,都将实现无感互联,为用户打造统一、流畅的跨场景交互体验。 聚焦用户出行、居家、娱乐等核心需求,双方将共同打造“人-车-家”协同标杆案例: 一方面,深化“车控家”“家控车”双向互联:用户驾车归家时,可通过车机语音指令提前开启家中空调、灯光、热水器,享受“人未到,家已暖”的主动关怀;居家时,通过智能中控屏即可完成车辆预热、导航规划、电量查询等操作,从容应对出行需求。 另一方面,推动车家安全联动,家居安全告警与车辆状态预警双向互通,为用户构建全场景防护网。 同时,双方还将联动联盟内资源,试点共建“人-车-家”智慧生活体验空间,让用户在购车、选购家电时能沉浸式感受全场景智能,实现“所见即所得”的消费升级。
余承东“路上睡觉”的梦想,快要实现了
头图来源 | 网络 作者 | 孙雅楠 编辑 | 苏鹏 (为保证阅读流畅性,本文将“L2级辅助驾驶”简称为“L2”,“L3级有条件自动驾驶”简称为“L3”,“L4级高度自动驾驶”简称为“L4”) 在智能驾驶跨越式前进的恢弘叙事下,L2终于有了向L3实质性跃迁的动向。 12月15日,长安牌SC7000AAARBEV型纯电动轿车(长安深蓝SL03)、极狐牌BJ7001A61NBEV型纯电动轿车(北汽极狐阿尔法S6)成为首批入选L3级有条件自动驾驶准入许可的产品。 图片来源:公告截图 其中,长安深蓝SL03的智驾系统由长安自研,北汽极狐阿尔法S6搭载了华为乾崑智驾。 这也被视为L3级落地在即的关键信号。 “L3 is coming!”华为智能汽车解决方案BU CEO靳玉志高呼。 而华为智能驾驶的另一位关键人物,华为常务董事、终端BG 董事长余承东虽未发声,但其激动程度似乎并不亚于靳玉志。 “我欢呼、拥抱、期待着L3的到来。这样大家就真能在路上睡觉了。”在今年9月,谈及智能驾驶后续发展时,余承东直言不讳道。 但其也补充,“当然了,我们真具备了L3的能力。" 当L3智能驾驶有了实质性的进展动作,智驾行业也旋即迎来狂欢。消息公布次日,智能驾驶概念板块早盘大面积高开,北汽蓝谷、浙江世宝竞价涨停。 但在此时更应该关注的问题是:为什么最先走到这一步的是长安、北汽蓝谷,而不是智能辅助驾驶领域更具存在感的“蔚小理”,亦或是鸿蒙四界之首的赛力斯? 换言之,首批获得试点许可的长安、北汽蓝谷的水平是否可以“代表”L3级监管标准? 不妨从二者入选过程一探究竟。 图片来源:深蓝汽车 为什么是长安和北汽? 根据2023年《关于开展智能网联汽车准入和上路通行试点工作的通知》(以下简称《通知》)及后续文件解读,试点工作必须经过试点申报、产品准入试点、上路通行试点、试点暂停与退出、评估调整五个阶段。 试点申报阶段侧重从研发角度说明汽车生产企业及产品、使用主体、车辆运行所在城市等条件的满足情况。 从智能驾驶的研发数据来看,论研发时间,小鹏2014年开始自动驾驶研发,长安2018年才发布“北斗天枢”计划。论投入资金,动辄百亿的年投入金额也是常事。论团队人数,千人规模近乎是门槛。 图片来源:未来汽车Daily制表 但最终并非所有车企都进入试点名单,也由此可见研发投入并非试点申请的唯一标准。 真正的原因或可从监管部门的问答中略窥一二。 根据工信部在2024年发布的《智能网联汽车准入和上路通行试点工作问答》(下称《问答》),此次试点的重要基础是“充分的产品研发测试验证”。 《问答》进一步解释,这种“充分的产品研发测试验证”是指产品应当通过模拟仿真、封闭场地、实际道路等测试验证,“其中,实际道路测试是产品自动驾驶系统安全测试验证的重要支柱之一”。 这意味着在监管体系下,自动驾驶的安全水平必须在现实世界中被反复验证过。 直接看实际道路测试:长安汽车具有超500万公里的道路实证,极限场景占比36%,场景要素超出国标49%。北汽蓝谷在《2024年环境、社会及公司治理(ESG)报告》说明累计测试里程达到278.4万公里,试验覆盖了18个省份。比亚迪在2024年每天新增训练里程 7200万公里。 图片来源:北汽集团 这些车企都用上路表现验证了自身实力。 值得注意的是,至少在市场印象中智能化领先、坚持路测的车企远不止这九家,比如首批获得L3测试资格的宝马、奔驰,以及标榜智能化的小鹏、赛力斯。但他们却并未出现在名单中。 由于此前《通知》中规定了试点申报要求由汽车生产企业与使用主体组成联合体,有观点将“使用主体”局限在出行平台资源,认为部分车企并不具备出行平台资源,无法满足申报主体资格的要求。 然而同样不以商业出行为业务的蔚来,其关联使用主体为“上海蔚来汽车有限公司”,仍顺利通过了试点申报。 因此更合理的解释是,在试点申报阶段,并非所有具备技术能力的车企都选择参与申报,或都准备好去参与申报。 同时,工信部在《问答》中也明确提到,确实存在“部分具备一定技术基础的汽车生产企业未参加此次集中申报”的情况。 在以上因素的共同影响下,最终仅有九家车企通过试点申报,分别是长安、比亚迪、广汽、上汽、北汽蓝谷、一汽、蔚来等七家乘用车企业,以及两家商用车企业上汽红岩、宇通。 图片来源:公告截图 真正的分水岭还在试点申报之后。 按照流程,第二阶段是产品准入试点,汽车生产企业“应当细化完善智能网联汽车产品的准入测试与安全评估方案”。 该方案也需层层审核:工信部及公安部确认、省级主管部门和车辆运行所在城市政府部门监督测试、技术服务机构评估通过后,再经由工信部审批才能获得准入许可。 也就是说,这一环节重点考核的是实际上路的安全兜底方案。 目前九家通过试点申报的车企中,只有长安、北汽蓝谷拿到准入许可。 图片来源:工信部关于《通知》的图解截图 也就是说,这一环节重点考核的是实际上路的安全兜底方案。 目前九家通过试点申报的车企中,只有长安、北汽蓝谷拿到准入许可。 尽管难以获知其他通过试点申报的车企是否提交了细化方案、获得许可的车企方案细节又是如何,但也可以通过入选车企公开的安全设计方案揣测通过标准。 根据长安汽车公开信息,其产品安全设计引入法规标准45项,执行企业标准39项。在架构方面,采用感知、控制、电源、转向等七重冗余架构。在功能安全与预期功能安全过程保障方面,依托ASIL D的管理开发流程,构建全域冗余架构。在网络安全和数据安全过程保障方面,构建了“9重纵深防御”体系+三端一体化态势感知平台。 北汽蓝谷申报的车型极狐阿尔法S(L3版)也同样注重安全,该车搭载了包含3颗激光雷达在内的34颗高性能传感器,实现对车辆周围360度全方位的环境感知覆盖。并且该版本借鉴了航空领域的安全设计理念,在感知、决策、转向、制动、通信、电源、定位等方面,实现了全链路安全冗余备份。 北汽集团表示,极狐阿尔法S(L3版)经历了“严苛的功能测试、交规符合性测试考验,实现了设计运行范围内场景的充分完整覆盖”。 由此可见,L3能否获得准入许可的决定性因素并不是激进的算法、前沿的路线,而是能否在现实场景中始终如一地贯彻安全标准,是否具有覆盖设计运行场景的稳定安全水平。 飞跃L2后,看见的一定是L3? 根据相关规定,长安、北汽蓝谷还要完成上路通行试点、试点暂停与退出、评估调整等流程才算完成试点工作。按照规划,北汽蓝谷将于2026年一季度以特定场景启动运营。 即使完成试点工作全流程,也不代表该车企具备L3级量产资格,但这至少让行业看到L3量产的曙光。 其他车企在L3上也有进展,继比亚迪、长安、广汽、上汽、北汽蓝谷、一汽、蔚来、极氪、赛力斯等后,小鹏、理想也获得了L3的测试牌照。 需要注意的是,近期小鹏、理想取得的L3级测试牌照并不等同于长安、北汽蓝谷拿到的产品准入许可。 工信部曾在《问答》对二者做出明确区分,测试牌照主要应用于产品研发过程,通过开展实际道路测试。而充分的道路测试不仅是后续产品量产应用的重要基础,也是“此次试点的重要基础”。 也就是说,车企获得L3测试牌照才能进行上路测试。在进行充分道路测试后,才符合试点申报的基本要求。 据悉,近期比亚迪、鸿蒙智行正在联合深圳市交通局开启L3级内测,积累经验。加上此前没有参与集中申报的车企还可以进行申报试点,明年或将有更多车企推进试点工作。 一些车企还公布了更具体的目标,广汽在3月宣布今年四季度推出L3级车型量产上市,华为预计2026年实现高速L3规模商用。 图片来源:微博@华为乾崑智能汽车解决方案 甚至有部分车型已经打出“L3预备军”的口号:搭载了华为的ADS 4 Ultra 旗舰版的车型具备高速L3的能力,极氪9X Hyper采用的千里浩瀚H9方案是具备量产能力的L3级方案,还未上市的昊铂A800获得全国首张可在120km/h情况下进行L3级路测的牌照。 行业集体向L3冲刺。但在这过程中,逐渐出现了一些“少数派”——他们希望从L2跨越L3,直接跳跃至L4。 11月,小鹏汽车CEO何小鹏在小鹏科技日群访中表示,未来没有L3,只有L2和L4。在试用特斯拉FSD后,何小鹏表示其是“准L4”的阶段,更坚定“每个人都可以跳过L3”的思考。 12月 ,地平线苏箐表示地平线未来将“打通L2到L4”,L3只是一个“短暂过渡”。 图片来源:地平线官方 更早之前,福特、沃尔沃也曾宣称放弃L3,直接迈入L4。 时任沃尔沃汽车中国区研发总监的顾剑民解释为:“虽然驾驶员可以撒手,但又要准备随时接管,也就是既希望驾驶员可以‘睁一只眼、闭一只眼’,同时又要求驾驶员全程随时全神贯注,这本身就自相矛盾。” 在很长一段时间里,有关L3的落地难点常被理解为“界限”问题。L3级代表车辆可以在特定场景下自动驾驶,但遇到复杂情况会提醒驾驶员接手。但L3级的责任主体由驾驶员变为车企。 由于难以定义何为“复杂情况”、驾驶过程涉及“人”的因素,L3级难以进行责任划分,相关法规也迟迟未完善。以至于L4已经商用,但L3却还存在界限难题。 但目前“渐进式”和“跨越式”玩家的分歧并不来源此。一方面,目前的试点工作能够为设立法规提供支持,有理由相信相关法规在一定时间内能够落地,届时责任划分不再受争议。另一方面,更重要的是,小鹏、地平线的“转向”主要是由于技术的更新。 在小鹏汽车目前的技术路线下,私享的Robo和商用的Robotaxi可以用同一个系统、同一个硬件体系实现。地平线则采用了全新的方法论,能够以统一的开发范式、统一的传感器配置、统一的ODD区域去打通L2到L4。 何小鹏及团队在硅谷试驾FSD V14.2 图片来源:微博@XP-何小鹏 不过,行业内的L4玩家给出截然不同的看法。在小马智行CEO彭军眼中,L2向L4转型相当于“另起炉灶”。 彭军表示,从数据的采集、传感器布置、安全性要求等,L2和L4的要求都不一样,基本上是要重做。以驾驶数据为例,L2、L4领域对数据密度的需求不一样,L2采集数据可能是加减法,转向L4要做乘法。 当然,即使想做“按部就班”从L2过渡向L3的渐进式玩家也并非易事。在文远知行CEO韩旭看来,L3是简化的L4,而不是简单的L2++的升级。L3到L4的距离更近,而离L2++很远,“距离远得超乎你想象”。 图片来源:汽车之家 所以在未来,L2之后看见的是L3还是L4,就犹如现在激光雷达和纯视觉之争,还没人给得出定论。更有可能的情况是共同存在。这是由车企的技术方案决定。 况且,智能驾驶发展飞快,技术路线摇摆也是常事。就在今年9月,地平线总裁陈黎明还表示“渐进式路线是实现L4的更优路径,地平线采用渐进式的L4路线”,今年年初,何小鹏也表示小鹏将投入L3。 而在近期,他们纷纷倒戈向“跨越”式。 不过可以肯定的是,随着今年前三季度具备L2级辅助驾驶功能的新车渗透率超60%,L3级上路通行试点即将开始,L4商业化渐成规模,未来的出行方式一定与自动驾驶息息相关。 尾声 2025年行将收官,终于有车企获得产品准入试点许可,这无疑给L3发展注入一针强心剂。 与之对比的是,早在2022年起,奔驰就先后在德国、美国的加利福尼亚州和内华达州部署L3级自动驾驶系统(Drive Pilot 系统),并承诺若驾驶员在使用该系统时发生车祸,责任由奔驰承担。 图片来源:奔驰星闻 表面上看,奔驰率先将L3代入个人消费市场,领先了众车企一大步。 但需要注意的是,奔驰的L3级使用条件有诸多限制:不能在晚上和恶劣天气使用;不能变道;不能在遇到道路施工、隧道或收费站时使用;必须在时速不超过40英里(约64公里)的情况下工作;只能在具备识别清晰标线的高速公路上工作;提醒驾驶员接管后,若10秒内驾驶员无反应,系统会驾驶车辆停在路边呼叫紧急服务,之后系统退出或降级,驾驶员将成为责任主体。 如果行驶条件一致,国内车企现有的高速NOA也能实现奔驰L3的驾驶体验。至少在技术层面,国内车企具备奔驰版本的L3级能力。 排除技术差距后,或许会有人简单粗暴的将国内L3未商业化归因于监管法规的缺失。 但这一问题并未触及核心,而且正在被解决。这次试点的预期之一便是加速形成系统完备、务实高效的法律法规、管理政策和标准体系。 真正的核心可以从试点工作要求看出,对于新兴技术的落地,我国监管部门高度强调现实世界中能够被反复验证的安全性。这需要时间去说明。 至于能否成为第一个“吃螃蟹的人”、能否“率先”实现落地,这至多算是追求,并不是重点。 另外,根据公告,长安、北汽蓝谷的联合体分别为重庆长安车联科技有限公司、北京出行汽车服务有限公司。由此可以推测即使L3真正进入商业化进程,或许也将由出行服务逐渐过渡至个人消费领域。 种种迹象解释了为什么中国车企在电动化、智能化浪潮中研发得如火如荼,落地却始终这么谨慎——在我国,安全是不可动摇的第一位。 而慢慢来,本身就是一种安全策略。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。