行业分类:
加载中...
头条分类:
加载中...
折叠屏玩法大升级!vivo X Fold6首发一屏四用:4个App同时抢票/比价
快科技6月9日消息,vivo将在本月推出全新一代大折叠屏旗舰vivo X Fold6,这款机型首发vivo全新打造的并行模式功能,实现一屏四用,单块大屏最多可以同时运行4个独立App,彻底打破了传统折叠屏的多任务上限。 vivo产品经理韩伯啸专门介绍了这个功能的核心逻辑,在vivo X Fold6的并行模式下,所有打开的应用窗口都平铺显示,不存在后台休眠的副窗口,四个应用全都是前台可直接操作的主角。 用户可以在大屏上同时打开4个不同的AI助手,让它们各自生成一套方案直接放在一起比稿,也可以同时用4个App抢票、4个购物App打开同一款商品实时比价,效率提升非常直观。 韩伯啸特别强调,想要做好这样的多任务体验难度远超外界想象,完全不是把四个窗口简单排布在屏幕上这么简单。这是四个可以同时操作的独立应用,全部要在前台流畅运行,不能出现任意一个后台暂停的情况。 这项能力需要从安卓底层框架重新做定制优化,完全跳出了安卓原生框架自带的多任务限制,硬件层面还要基于多任务和AI算力需求重新做芯片层面的调度优化。 既要满足多个App同时渲染的算力需求,还要兼顾多应用同时运行时的性能负载和功耗表现,对整个系统的底层能力挑战非常大。所有的研发投入,最终都是为了打造AI体验最优的移动终端产品。 最后来看核心硬件配置,vivo X Fold6配备8.02英寸内屏,外屏尺寸为6.51英寸,搭载天玑9500旗舰芯片,后置蔡司2亿像素三摄,。 之前不少折叠屏的多任务最多只能做到分屏双用,vivo这次直接把应用数量拉到了4个,对于经常需要多线并行处理工作的商务用户来说,这款机型的实用价值将会远超普通旗舰手机。
iPhone变成AiPhone,但还不是未来的AI手机
国行用户还是没有 Apple 智能。 更新到 iOS 27 的开发者测试版本后,对国行 iPhone 来说,最大的变化是可以设置调休闹钟,外版用户则迎来了一个独立的 Siri App。 这两年,我们一直在吐槽国行 iPhone 没有 AI。 但如果今天真的要买一台手机,AI 恐怕还不是大多数人的首要考虑因素。 虽然都在说 AI 手机,但大多数手机的卖点还是在相机和电池等方面,包括苹果在 17 Pro 上的主要亮点也是后置三摄 大家会比较影像、续航、性能、外观,甚至颜色,却很少有人因为「这个 AI 特别强」而下单。 一个有点矛盾的现实是,AI 手机已经喊了两年,但什么是 AI 手机,行业和用户都还没有形成共识。 就在这个背景下,苹果这次把新版 Siri 推到了系统层。 它有了独立入口,也支持连续对话、文件上传和上下文理解。 从功能看,这些能力并不新鲜,很多用户会觉得它只是补上了 ChatGPT 两三年前就已经实现的部分。 真正值得关注的是,苹果终于给出了自己对于 AI 手机的答案。 目前,对 AI 手机而言,行业里目前存在两种理解。 一方面是手机变聪明了,从智能到人工智能。相机能够识别物体,照片能自动扩图、修改视角,搜索框里换了大模型驱动的 AI 引擎,快捷指令用简单的自然语言就能搭出来。 这些改进确实让体验变得更好,可是我们跟手机的关系似乎并没改变。这一路线增强的是功能,而第二种路线改变的是交互。 我们不用自己的操作,对着手机把想做的事情说出来,系统级的助手,会像 Codex 一样,自动启用 Computer(Phone) Use、Chrome(App) Use 的能力, 调度不同的应用,把事情做好。 过去两年我们一直在讨论,也是所有厂商都难做好的,全在第二件事上。 四种 AI 手机 问题在于,当 AI 真正开始替用户操作手机,它立刻会碰到权限、应用生态和责任归属的问题。 谁有资格代替用户执行操作?App 愿不愿意开放能力?出了问题谁负责? 于是,不同厂商开始走向完全不同的路线。 「被限制」的豆包手机 豆包手机刚出来那会儿,确实收获了很多关注。它通过系统权限拿到的能力,可以直接模拟用户点击。 一个需要 50 步点击的任务,大概能跑出八成的成功率,能力边界是当时市面上,所有打着 AI 手机旗号的产品中最宽的一个。 但它也最容易踩雷,纯粹地依靠模拟点击,一边是效率的问题,更严重的是合规的问题。 效率上,通过识屏的方式找到应用的不同按钮,然后再操作系统进行点击,这种流程被拉得极长。即便可以预先录入一套常见应用的交互方式,但 App 一旦更新,界面重新排布,就又需要再来一次,还可能失效,需要重新学习训练。 合规上,豆包手机在去年年底被微信、支付宝集体风控。豆包手机也发布声明回复,所有的权限都在系统允许的范围内操作,后续也主动收缩了操作范围。 现在就连 Codex 上的 Computer Use,都无法正常操作电脑版微信,一旦检测到非人类的点击操作,微信就会自动退出。 豆包手机的正式版还在打磨,路线也正在从纯视觉操作向接口协同演进。 国民级的超级应用选择 AI,会成为手机的重要部分 微信,就在 WWDC 前,联合五大手机厂商推出了 A2A(Agent-to-Agent)助手能力。 手机系统 AI 助手解析出用户意图后,通过加密、受控的协议向微信发起「呼叫」,微信在自己的沙盒里原生执行「发消息、打电话」这两个基础动作,系统 AI 碰不到任何聊天记录。 这更像是一种停火协议,手机厂商承认,不能绕过超级 App 的边界;微信也承认,系统级 AI 助手正在成为新的用户入口,完全堵住并不现实。 更有意思的是,微信同一天还面向小程序开发者开放了微信 AI 生态接入指引。 开发者可以授权微信 AI 接入自己的小程序,其中有两种模式,「自动模式」让平台读取源码、分析页面、直接操作;「开发模式」让开发者自主声明能力,经审核后被微信 AI 调用。 两种模式可以同时开启。微信现有超过 400 万个小程序,如果大量接入,微信 AI 调度的能力范围将远超「发消息打电话」,点外卖、打车、订票、买东西,一整个小程序生态都有机会实现。 把这两件事放在一起看,微信的策略就很清楚了,手机厂商想把微信变成自己助手能调度的一个 App,微信想把自己变成一个更大的 Agent 平台。 双方都在开放能力,但都希望把入口掌握在自己手里。 Google 争夺的不止是一部手机 再看 Android 和 iPhone,方向其实一致:AI 不再是一个 App,而是在系统里流动。 Google 在 I/O 之前的 Android Show 上直接说,Android 正在从 operating system 变成 intelligence system。 Google 的优势很明显:它既有 Android,也有 Gemini,还有搜索、Gmail、Calendar、Chrome、Google Play 和车机、手表、眼镜。它完全可以做一个跨屏的 Gemini 操作层。 从这个角度看,Google 争夺的已经不仅是一部手机上的 AI 入口,Gemini 承担的是整个 Google 生态的交互层。 当用户发出一个需求,调用的可能是搜索、地图、邮箱、浏览器,也可能是电脑、手机、车机和眼镜上的能力。 AI 手机只是这张网络里的一个节点。 Siri AI 不会是一个「ChatGPT 式」的 App 苹果选了一条更慢的路。 Siri AI 的新能力强烈依靠 App Intents。开发者要把自己的内容和动作用结构化方式交给系统,比如「我能创建一笔费用」、「我能预约会议」、「我能编辑这张图」。Siri 再用自然语言理解用户意图,调用这些动作。 苹果还把 App 内容接进 Spotlight 的语义索引,让 Siri 能理解手机里的个人上下文。这套逻辑和微信小程序的「开发模式」很像,开发者声明能力,平台负责调度。 区别是,微信只在小程序生态里做,苹果要把它放到整个 iOS App 生态里。 Craig 在 WWDC 主题演讲结束后的媒体交流会上谈到 Siri AI 时说,「我们认为 Siri 不是一个独立的聊天机器人,一个你去那里闲聊的,不整合的地方,Siri 是一个集成的、对话式的工具。」 苹果的底层模型也补了一大块。第三代 Apple Foundation Models 包括端侧模型、私有云模型和图像模型,其中端侧 AFM 3 Core 是 30 亿参数,AFM 3 Core Advanced 是 200 亿参数的稀疏模型,按任务激活 10 亿到 40 亿参数。 更复杂的任务交给 Private Cloud Compute。苹果也提到新一代 AFM 是和 Google Gemini 合作定制的,最重的云端模型还用到了 Google Cloud 上的 NVIDIA GPU。 苹果昨天发布了第三代基础大模型| 苹果终于把过去两年欠下的 AI 账补到了系统层。 它的优势是整合最深,Siri、Spotlight、App Intents、照片、信息、Safari、快捷指令,这些东西都在系统里。一次系统升级,就能改变 iPhone 用户「找东西、办事情」的默认路径。 但它的限制也很清楚,App Intents 取决于开发者适配多少,Siri AI 真实可用性还要等 beta 之后验证。 国行用户还要面对地区限制,而部分端侧大模型的能力,支持的手机产品也只有 iPhone Air 和 iPhone 17 Pro 系列。 AI 手机的天花板,不在手机里 今天各家争的,还是手机和 App 之间那一层:谁能替用户办事,谁批准,谁执行,谁担责。 从豆包、微信、Google 到苹果,虽然它们给出的答案并不相同,有的选择模拟操作,有的选择开放协议,有的选择统一调度层,也有的选择让开发者声明能力。 共同点在于,AI 手机正在从「回答问题」走向「完成任务」。 再往后看,AI 手机的天花板可能不在手机里。 端侧模型正在变小,推理芯片正在变强。 1.58-bit、2-bit 这类低比特量化不断降低模型占用,手机上能跑的模型会越来越大。现在很多端侧能力还只是修图、听写、摘要和简单问答,几年后,手机本地模型处理个人上下文、隐私任务、轻量代理工作,会变得更自然。 更大的变化,是手机会变成调度算力的入口。 我们不一定要在手机上完成所有工作,但可以用手机发起任务:让电脑里的 Codex 写代码,让云端的 Claude 做研究,让家里的设备准备环境,让车机继续导航,让眼镜把现实世界变成输入。 Googlebook 已经把这个方向摆出来了:手机里的 Android App、文件和 Gemini 能力,可以延伸到笔记本。苹果如果把 Siri AI 做扎实,后面自然会接 AirPods、Apple Watch、Vision Pro,甚至传闻中的眼镜和桌面机器人。 手机要变成什么,现在还没人说得准,但它正在从「装 App 的地方」,变成我们「随时能调动算力的入口」。
iPhone 一夜变成 AiPhone,但 AI 手机的未来不在手机里
国行用户还是没有 Apple 智能。 更新到 iOS 27 的开发者测试版本后,对国行 iPhone 来说,最大的变化是可以设置调休闹钟,外版用户则迎来了一个独立的 Siri App。 这两年,我们一直在吐槽国行 iPhone 没有 AI。 但如果今天真的要买一台手机,AI 恐怕还不是大多数人的首要考虑因素。 ▲虽然都在说 AI 手机,但大多数手机的卖点还是在相机和电池等方面,包括苹果在 17 Pro 上的主要亮点也是后置三摄 大家会比较影像、续航、性能、外观,甚至颜色,却很少有人因为「这个 AI 特别强」而下单。 一个有点矛盾的现实是,AI 手机已经喊了两年,但什么是 AI 手机,行业和用户都还没有形成共识。 就在这个背景下,苹果这次把新版 Siri 推到了系统层。 它有了独立入口,也支持连续对话、文件上传和上下文理解。 从功能看,这些能力并不新鲜,很多用户会觉得它只是补上了 ChatGPT 两三年前就已经实现的部分。 真正值得关注的是,苹果终于给出了自己对于 AI 手机的答案。 目前,对 AI 手机而言,行业里目前存在两种理解。 一方面是手机变聪明了,从智能到人工智能。相机能够识别物体,照片能自动扩图、修改视角,搜索框里换了大模型驱动的 AI 引擎,快捷指令用简单的自然语言就能搭出来。 这些改进确实让体验变得更好,可是我们跟手机的关系似乎并没改变。这一路线增强的是功能,而第二种路线改变的是交互。 我们不用自己的操作,对着手机把想做的事情说出来,系统级的助手,会像 Codex 一样,自动启用 Computer(Phone) Use、Chrome(App) Use 的能力, 调度不同的应用,把事情做好。 过去两年我们一直在讨论,也是所有厂商都难做好的,全在第二件事上。 四种 AI 手机 问题在于,当 AI 真正开始替用户操作手机,它立刻会碰到权限、应用生态和责任归属的问题。 谁有资格代替用户执行操作?App 愿不愿意开放能力?出了问题谁负责? 于是,不同厂商开始走向完全不同的路线。 「被限制」的豆包手机 豆包手机刚出来那会儿,确实收获了很多关注。它通过系统权限拿到的能力,可以直接模拟用户点击。一个需要 50 步点击的任务,大概能跑出八成的成功率,能力边界是当时市面上,所有打着 AI 手机旗号的产品中最宽的一个。 但它也最容易踩雷,纯粹的依靠模拟点击,一边是效率的问题,更严重的是合规的问题。 效率上,通过识屏的方式找到应用的不同按钮,然后再操作系统进行点击,这种流程被拉得极长。即便可以预先录入一套常见应用的交互方式,但 App 一旦更新,界面重新排布,就又需要再来一次,还可能失效,需要重新学习训练。 合规上,豆包手机在去年年底被微信、支付宝集体风控。豆包手机也发布声明回复,所有的权限都在系统允许的范围内操作,后续也主动收缩了操作范围。 应用需要确保自己的用户信息安全,无可厚非。现在就连 Codex 上的 Computer Use,都无法正常操作电脑版微信,一旦检测到非人类的点击操作,微信就会自动退出。 豆包手机的正式版还在打磨,路线也正在从纯视觉操作向接口协同演进。 国民级的超级应用选择 AI,会成为手机的重要部分 微信,就在 WWDC 前,联合五大手机厂商推出了 A2A(Agent-to-Agent)助手能力。 手机系统 AI 助手解析出用户意图后,通过加密、受控的协议向微信发起「呼叫」,微信在自己的沙盒里原生执行「发消息、打电话」这两个基础动作,系统 AI 碰不到任何聊天记录。 这更像是一种停火协议,手机厂商承认,不能绕过超级 App 的边界;微信也承认,系统级 AI 助手正在成为新的用户入口,完全堵住并不现实。 更有意思的是,微信同一天还面向小程序开发者开放了微信 AI 生态接入指引。 开发者可以授权微信 AI 接入自己的小程序,其中有两种模式,「自动模式」让平台读取源码、分析页面、直接操作;「开发模式」让开发者自主声明能力,经审核后被微信 AI 调用。 两种模式可以同时开启。微信现有超过 400 万个小程序,如果大量接入,微信 AI 调度的能力范围将远超「发消息打电话」,点外卖、打车、订票、买东西,一整个小程序生态都有机会实现。 把这两件事放在一起看,微信的策略就很清楚了,手机厂商想把微信变成自己助手能调度的一个 App,微信想把自己变成一个更大的 Agent 平台。 双方都在开放能力,但都希望把入口掌握在自己手里。 XX Intelligence 和 XX 助手 再看 Android 和 iPhone,方向其实一致:AI 不再是一个 App,而是在系统里流动。 Google 在 I/O 之前的 Android Show 上直接说,Android 正在从 operating system 变成 intelligence system。 Google 的优势很明显:它既有 Android,也有 Gemini,还有搜索、Gmail、Calendar、Chrome、Google Play 和车机、手表、眼镜。它完全可以做一个跨屏的 Gemini 操作层。 从这个角度看,Google 争夺的已经不仅是一部手机上的 AI 入口,Gemini 承担的是整个 Google 生态的交互层。 当用户发出一个需求,调用的可能是搜索、地图、邮箱、浏览器,也可能是电脑、手机、车机和眼镜上的能力。 AI 手机只是这张网络里的一个节点。 Siri AI 不会是一个「ChatGPT 式」的 App 苹果选了一条更慢的路。 Siri AI 的新能力强烈依靠 App Intents。开发者要把自己的内容和动作用结构化方式交给系统,比如「我能创建一笔费用」、「我能预约会议」、「我能编辑这张图」。Siri 再用自然语言理解用户意图,调用这些动作。 苹果还把 App 内容接进 Spotlight 的语义索引,让 Siri 能理解手机里的个人上下文。这套逻辑和微信小程序的「开发模式」很像,开发者声明能力,平台负责调度。 区别是,微信只在小程序生态里做,苹果要把它放到整个 iOS App 生态里。 ▲ Craig 在 WWDC 主题演讲结束后的媒体交流会上谈到 Siri AI 时说,「我们认为 Siri 不是一个独立的聊天机器人,一个你去那里闲聊的,不整合的地方,Siri 是一个集成的、对话式的工具。」 苹果的底层模型也补了一大块。第三代 Apple Foundation Models 包括端侧模型、私有云模型和图像模型,其中端侧 AFM 3 Core 是 30 亿参数,AFM 3 Core Advanced 是 200 亿参数的稀疏模型,按任务激活 10 亿到 40 亿参数。 更复杂的任务交给 Private Cloud Compute。苹果也提到新一代 AFM 是和 Google Gemini 合作定制的,最重的云端模型还用到了 Google Cloud 上的 NVIDIA GPU。 ▲ 苹果昨天发布了第三代基础大模型|https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models 苹果终于把过去两年欠下的 AI 账补到了系统层。 它的优势是整合最深,Siri、Spotlight、App Intents、照片、信息、Safari、快捷指令,这些东西都在系统里。一次系统升级,就能改变 iPhone 用户「找东西、办事情」的默认路径。 但它的限制也很清楚,App Intents 取决于开发者适配多少,Siri AI 真实可用性还要等 beta 之后验证。 国行用户还要面对地区限制,而部分端侧大模型的能力,支持的手机产品也只有 iPhone Air 和 iPhone 17 Pro 系列。 AI 手机的天花板,不在手机里 今天各家争的,还是手机和 App 之间那一层:谁能替用户办事,谁批准,谁执行,谁担责。 从豆包、微信、Google 到苹果,虽然它们给出的答案并不相同,有的选择模拟操作,有的选择开放协议,有的选择统一调度层,也有的选择让开发者声明能力。 共同点在于,AI 手机正在从「回答问题」走向「完成任务」。 但再往后看,AI 手机的天花板可能不在手机里。 端侧模型正在变小,推理芯片正在变强。1.58-bit、2-bit 这类低比特量化不断降低模型占用,手机上能跑的模型会越来越大。现在很多端侧能力还只是修图、听写、摘要和简单问答,几年后,手机本地模型处理个人上下文、隐私任务、轻量代理工作,会变得更自然。 更大的变化,是手机会变成调度算力的入口。 我们不一定要在手机上完成所有工作,但可以用手机发起任务:让电脑里的 Codex 写代码,让云端的 Claude 做研究,让家里的设备准备环境,让车机继续导航,让眼镜把现实世界变成输入。 Googlebook 已经把这个方向摆出来了:手机里的 Android App、文件和 Gemini 能力,可以延伸到笔记本。苹果如果把 Siri AI 做扎实,后面自然会接 AirPods、Apple Watch、Vision Pro,甚至传闻中的眼镜和桌面机器人。 手机要变成什么,现在还没人说得准,但它正在从「装 App 的地方」,变成我们「随时能调动算力的入口」。
坏了,苹果 AI 真成了?|iOS 27 上手体验
几经波折之后,我们终于将手里的几台 iPhone 都更新到了 iOS 27,体验到了五年以来最重大的一次 Siri 更新。 更新之后第一眼能看到的,也是最明显的升级,就是 iOS 27 全面焕新的 app 图标: 图|YouTube @Apple 当然,说是完全焕新也不尽然—— 相比 iOS 26,新版本的图标更像是从「强调玻璃光影」进化到了「添加玻璃材质」: 除此之外,iOS 27 的整体透明度也变得更加可控了。 iOS 27 中,原本只有两级可调的 Liquid Glass 模糊程度变成了一根无级滑杆,自定义范围更大: 根据会上介绍,iOS 27 的设备支持范围最低从 7 年前的 iPhone 11 开始。 新增的玻璃调整效果对于旧处理器的性能压力如何,还要看后续的更新情况如何—— 图|YouTube @Apple 幸好 WWDC 上宣称的流畅度优化确实有效。 iOS 27 是最近几代少有的,手机降温之后就基本不会掉帧的开发者测试版了,在 iPhone Air 上的表现也称得上稳定: 说到功能性方面,iOS 27 是一个非常两极分化的版本—— 一方面,国际版 iPhone 迎来了堪称「量大管饱」的 Siri AI 更新。 全局检索、屏幕感知、连续对话等等功能给好给满,更不用提这个全新的 Siri UI 了: 另一方面,国行机型迎来了近年来字面意义上「最贫瘠」的一次更新。 除了新壁纸、透明度滑块、节假日闹钟之外,国行 iOS 27 几乎没迎来任何有实际意义的 Siri 更新。 除此之外,天气 app 在 iOS 27 中也迎来了一波卡片改版: 而在一嘴带过的 macOS 27 预览版中,我们还见到了可以随意调整比例的 iPhone 镜像: 图|X @aaronp613 至于这个宽幅布局是给谁准备的,不言自明。 总之如果你恰好使用着外版 iPhone、拥有外区 Apple ID 的话,就可以享受到这套「中间下滑 Siri,左边下滑通知,继续下滑又是 Siri」的超绝连招了。 更重要的是,新版本的 Siri 也拥有了一个属于自己的 app。 它的主界面与我们熟悉的聊天式 AI 比如豆包、千问等等如出一辙,也可以切换成类似「小 X 记忆」的画廊模式: 比较可惜的是,由于今晚尝鲜的人很多,苹果的 AI 服务器不太稳定。 这导致 Siri AI 的一些深层功能(屏幕识别、总结文章、多模态生成)成功率不高,经常会出现连接报错的情况。 然而在正常运作的时候,新 Siri AI 的端侧指令处理速度是我们体验过的最快的—— 可惜这个速度只有搭载了 A19 Pro 的 iPhone Air 与 iPhone 17 Pro 系列才能体验到。 图|YouTube @Apple 说到 iOS 27 的改版,相机是不得不看看的应用。 非常遗憾的是,iOS 27 的相机并没有像部分爆料所说那样进行专业化升级,只是在 iOS 26 的基础上小修小改—— 与拍摄相关的二级菜单收纳在快门右侧,成为一个单独的显眼图标。 顶部的常用参数则换成了居中摆放,视觉上更为平衡。 UI 设计方面的改变见仁见智,但在 iOS 27 上,UI 只是个引子—— 在相机底部的模式栏滑动,我们会发现系统相机中赫然出现了一个名为「SIRI」的模式。 切换到 SIRI 模式,就可以像之前 Visual Intelligence 那样调用 AI 识别、分析、理解和搜索画面。 由相机出发,iOS 27 上还有不少 AI 方面的更新与影像有关—— 随 iOS 26 发布的图乐园获得了更新的设计,并可借助 Private Cloud Compute 处理更复杂的生成请求。 同时,除了原有的卡通、可爱的风格外,这一代图乐园终于可以生成写实风格的图像了: 在更新到 iOS 27 后,我们第一时间上手了全新的图乐园,需要注意:它目前只能用英语描述想要生成的图片效果。 我们上传了一张实拍照片,并要求图乐园生成一张带有 90 年代胶片质感、颗粒和眩光效果的图片。 等待数十秒后,图乐园给出了一张高度贴合描述的结果:画面风格完整,质感也相当真实。 如果不是放大细看细节,甚至很难第一时间发现明显瑕疵—— 但由于前面提到的问题,图乐园生图偶尔也会失败报错。 推测也是因为短时间测试的用户太多,后续正式版的表现应该会更为顺畅。 影像的另一个 AI 大更新藏在相册中——作为每次拍完照后调整图片的第一环,相册的重要性不必多言。 这一次,苹果将升级的消除、扩图与重构集成到了 Apple Intelligence Tools 中,与风格、裁切等功能并列在一级菜单里: 其中的重头戏,还是「重构」Reframe ——苹果称它来自 Vision Pro 相关技术的积累。 原理上讲,iOS 27 的「重构」很像是 iOS 26 中 3D 照片的进阶版。 当系统能够更清楚地区分照片中的前景、主体和背景后,用户就可以用手指拖动画面的视角和景别,照片的透视关系也会随之变化。 实际体验下来,重构功能的前后其实分成了两步。 第一步是预览。iPhone 会先用端侧的空间模型理解照片层级,并生成一个可以快速拖动视角的预览版本。 这一步速度很快,几乎可以实时响应手指操作: 但预览阶段的可调整角度比较有限,如果拖动幅度稍大,画面里的主体和背景偶尔就会出现一些滑稽的拉伸。 真正的生成发生在第二步——确认视角后,iOS 就会调用云端模型补全因视角变化产生的画面空缺。 这一步目前偶尔也会出现连接失败报错的情况,但只要顺利生成,用 20 秒左右就能得到一张相当不错的新照片: 哦对了,以上所有与 AI 有关的影像功能,都暂时与国行无缘。 只能说首发体验下来,iOS 27 不愧是近十年来国行和外版割裂程度最大的一代。 毕竟我们也极少见到国行 iPhone 17 Pro Max 安装更新不到 20 分钟、美版却足足安装了快一个小时的巨大差异。 至于什么时候我们能用上满血的 Siri AI 功能,还得是克雷格的那句话—— 图|YouTube @Apple
海外机构:宇树在重走比亚迪和大疆的路
机器人前瞻(公众号:robot_pro) 编译 | 江宇 编辑 | 漠影 机器人前瞻6月9日消息,今日,海外研究机构SemiAnalysis发布长文断言,宇树科技正在复刻比亚迪与大疆曾走过的硬件打法,并将借此主导全球机器人行业。 据该机构分析,宇树的战略脉络极其清晰:通过掌握核心零部件,先以低价产品打开研究与爱好者市场,再利用规模化制造和中国本土供应链反哺产品迭代,最终逐步蚕食更大的商业场景。 此外,该机构获悉,宇树极有可能在未来几周内,迎来其第1万台人形机器人的交付里程碑。 在过去的2025年,宇树年度营收实现335.36%的同比增长,毛利率逼近60%,并正将更多制造环节纳入自有体系,计划投入近20.22亿元用于具身模型研发。 最关键的是,其定价已远低于市场上其他人形机器人产品。 据该机构测算,面向海外市场,在过去12至18个月内,宇树G1人形机器人的售价已从5万美元(约合人民币33.8万元)骤降至2.73万美元(约合人民币18.4万元),部分交易成交价甚至降至2万美元(约合人民币13.5万元)。 而即便在这一价位下,其测算毛利率依然维持在67%左右。 ▲G1 EDU ADVANCED 人形机器人(29自由度)BOM成本与毛利率测算表(图源:SemiAnalysis) 这种依托供应链生态的“降维打击”,拉开了宇树与海外竞品的差距。 仅仅在三年前,宇树仍被界定为一家四足机器人公司。 而如今,G1不仅已进入真正可用的部署阶段,宇树手中还握有三款在研新设计,其中一款将直接对标海外头部产品。 反观海外市场,尽管特斯拉早在2022年就展示了Optimus原型机,但迄今为止,它与其他海外同行的产品大多仍处于持续打磨的“半成品”状态。 ▲Optimus原型机 一、比亚迪和大疆的剧本,正在宇树身上重演 理解宇树的关键,要先看懂比亚迪和大疆。 比亚迪的核心打法是:掌握BOM(物料清单)中最昂贵、最复杂的核心部件,并围绕它建立起对手无法企及的复合成本优势。 比亚迪最早切入的是电池电芯。电池一度占电动车BOM的30%到40%,如今该占比因比亚迪的努力而下降。比亚迪1994年成立时,切入的正是日本厂商因毒性问题退出的电池电芯赛道,此后苦练近十年内功,2011年才进入电动车市场。 彼时,中国电动车市场几乎不存在。2011年10月比亚迪推出首款纯电车型e6时,全年全国电动车销量仅8159辆,占新车销量的0.04%。 此后,比亚迪不断将电芯、驱动、电机、IGBT和SiC功率模块、变速箱、底盘以及发动机等关键部件收归自研自制。其中,IGBT和SiC功率模块属于电动车电控系统中的核心功率器件,从设计到制造的门槛都很高,比亚迪也是全球少数能将这类功率器件纳入内部制造体系的车企。到2010年代末,电动车绝大多数核心部件都已产自比亚迪自家工厂。 这种正向循环让比亚迪能够用新产品打开新市场。 刀片电池是其中的一个经典案例。此前的磷酸铁锂电池(LFP)便宜、安全,但能量密度低,只适合不出远门的叉车或定点返回的公交。2020年,刀片电池通过新的封装结构,将电池包每公斤的空间利用率提升了50%,一举让磷酸铁锂电池进入乘用车主流市场。 成果立竿见影:2020年刀片电池推出前,比亚迪新能源车销量为18.9万辆;2021年直接跳到60万辆;到2025年,比亚迪不仅稳坐全球电动车头把交椅,更在纯电动车产量上超越了特斯拉。 ▲比亚迪刀片电池发布后,全球电动车销量五年(2010–2025年)增长7倍(图源:SemiAnalysis) 其成本结构几乎无法撼动,比如2023年推出的海鸥售价仅约1.1万美元(约合人民币7.4万元),其新款在国内已接近8000美元(约合人民币5.4万元)。 比亚迪还进一步向上游延伸,与华友钴业成立冶炼合资企业,并在巴西“锂谷”直接拿下锂矿开采权。 比亚迪的规模优势甚至倒逼欧美采取保护措施。 大众汽车宣布其德国工厂史上首次关闭,斯特兰蒂斯(Stellantis)下调业绩指标,都将压力归因于中国电动车。美国更是将对华电动车关税提高到100%。 如今,比亚迪已庞大到拥有自己的远洋船队,用来向全球输送其最便宜且最好的电动车。 大疆的剧本更贴近当前宇树的节奏。 2013年前后,“有用的消费级无人机”还不是一个品类。当时的领军产品Parrot AR.Drone在CES上被归入电子游戏硬件,没有防抖相机、没有GPS,只拍得出640×480像素的照片和视频。 ▲AR.Drone 2.0 想搞专业航拍,要么掏近2万美元(约合人民币13.5万元)买Draganflyer X6,要么自己到处拼凑机架、电机、飞控和云台,零件费最高超过1200美元(约合人民币8123元),还得花几十个小时组装调试,炸机是家常便饭。 大疆Phantom 1在2013年1月以679美元(约合人民币4596元)横空出世,它没内置相机、没云台、只能飞10分钟、也没有实时图传。今天看是个半成品,但当时,它把门槛降到了自组无人机的一半,还免去了组装之苦。这一下就引爆了研究者、爱好者和早期专业摄像师的市场。 ▲Phantom 1 大疆的营收从2011年的400万美元(约合人民币2707万元),飙升至2013年的1.3亿美元(约合人民币8.8亿元)。 随后,大疆开足马力,率先自研飞控这一成本高、技术难度大的核心部件。当时,即便是批量采购,第三方飞控价格仍高达200至400美元(约合人民币1353至2707元)。此后,大疆又陆续将云台、电机、电调纳入自有体系。 大疆的每一代新产品,都几乎打开了过去无法触及的市场:2014年Phantom 2 Vision+集成了三轴云台,让稳定航拍不再是好莱坞团队的特权,小公司也能用来拍房产、录婚礼、做新闻;2016年的Phantom 4带4K、28分钟续航和前向避障,又打开了巡检、测绘、应急等企业级市场。 ▲Phantom 4 从2016到2017年,大疆拿下全球消费级无人机约70%份额,竞争对手3DR、GoPro Karma、Parrot被悉数挤出局。 至此,这套打法可以归纳为:先掌控一个核心部件,用不完美但便宜的产品争取一批愿意尝鲜的早期用户,借助供应链生态快速迭代,让每一代硬件解锁并吞食下一个更大的市场。 二、宇树:先把四足机器人价格打下来,再让“它”站起来 宇树的成长路径与大疆高度相似。它选择的那个“核心部件”,是执行器。 ▲图源:Thomas Godden 2016年,前大疆员工王兴兴在硕士论文中开发出低成本四足机器人XDog,随后以此为基础创立了宇树。 ▲王兴兴硕士毕业论文 正如比亚迪看电池、大疆看飞控,宇树将目光锁定在执行器——这个驱动机器人肢体运动的集成关节,其在人形机器人BOM中占比可达50%至70%。 宇树最早也是从学术圈的四足机器人起步。 当时,大学实验室想要一个有腿的机器人平台,通常得花7万到10万美元(约合人民币47.3至67.7万元)以上。宇树2018年推出Laikago售价4.5万美元(约合人民币30.4万元);2020年A1降到1.5万美元(约合人民币10.1万元);2021年Go1 Air起售价直接杀到2700美元(约合人民币1.8万元);如今的Go2不同版本起售价约1600至2800美元(约合人民币1至1.9万元)。 ▲(图源:ZooMax) 六年时间,其入门级四足机器人价格断崖式下跌了94%到96%,这让宇树从高校走入消费者,更是进入工业部署。 更关键的是,四足机器人的规模化让宇树在人形机器人所需的执行器、控制、供应商和生产流程上,积累了多年的实战经验。 2024年宇树发布的H1人形机器人,售价约9万美元(约合人民币60.9万元)。有接近宇树的人士透露,H1本质上就是一台“用两条腿站立的四足机器人”,其弯曲膝盖和行走方式都能看到四足机器人时代技术积累的痕迹。 H1证明了四足时代的技术积累能走多远,而真正颠覆市场认知的,是接下来的G1。 ▲王兴兴与“安卓之父”安迪·鲁宾(Andy Rubin) 三、3万到5万美元的G1,开辟了人形机器人的“安卓时刻” 在2024年,市面上几乎买不到一台现成的、价格可接受的人形机器人。 Agility Robotics的Digit才刚开始向工厂部署零星几台;Apptronik的Apollo尚处商业化前夜;Figure与宝马的合作,发货量还是个位数。 ▲从左到右依次是Digit、Apollo与Figure 而特斯拉Optimus压根不对外发售。 ▲Optimus最新产品曝光 国内,优必选的Walker、傅利叶和智元的早期产品虽已出现,但在价格和规模上均未达到宇树G1的水平。 宇树G1以3万到5万美元(约合人民币20.3至33.8万元)的定价,实现了“开箱即用”,这在研究界带来了轰动性的可及性变革。任何一个研究者都能告诉你,这是一个多么巨大的跨越。此后,这一研究群体又扩散到英伟达、苹果、Meta等科技巨头,这些公司均采购了数百台G1。 ▲宇树在2025年机器人峰会上的演讲 宇树已然成为全球人形机器人AI研究的主导硬件平台。 四、中国供应链生态,是宇树疯狂迭代的“外挂” 宇树还继承了中国汽车和无人机产业极为成熟的供应链基础。 我国2024年生产了3130万辆汽车,其中40.9%是新能源车;同时,此前无人机爆发催生出的超3000家零部件供应商,已能把无刷直流电机、驱动器、编码器、电池等通用机器人所需部件的制造工艺做得非常成熟。 如今,围绕人形和四足机器人的本土供应链更是快速成形——几乎每个省都有多家适配机器人的减速器、高扭矩电机厂商,全国已有约200家人形机器人公司共同滋养并受益于这个生态系统。 当然,一切都要回归到宇树对执行器的长期投入。不过,第一代产品远非完美。 五、早期质疑:QDD执行器撑不住“真实工作” 2024年的H1和早期G1并不好用。用户一旦推进它们去做真实工作,电机就频繁过热。 早期G1在双臂完全伸展时,只能短暂承载约2公斤负载,几秒钟后就必须冷却;即便双臂弯曲,承载2至3公斤负载也只能维持约2到3分钟。之后,机器人需要冷却30分钟才能恢复功能,恢复做重活要等整整一小时。 工作5分钟、冷却1小时,显然不是合格的劳动力。 问题根源在于宇树选择了一套更激进的执行器方案:QDD,也就是准直驱。它通常由一个无刷直流电机搭配低减速比行星齿轮箱组成,减速比多在个位数到20:1之间。 ▲行星齿轮箱结构示意图(来源:Unitree电机与Power Electric齿轮箱) 传统上,工业机器人偏爱谐波减速器这类高精度、高减速比的方案,用小电机与大齿轮箱来放大扭矩。而QDD反过来,用大电机与小齿轮箱,齿轮箱放大作用很小,电机得足够强。 QDD的优势显而易见:效率更高,可达95%至98%,而谐波减速器方案通常约为85%至90%;成本也更低,最多可低80%;同时,对碰撞等外力的顺应性也更好。 但短板也很致命:电机要直接扛下大部分扭矩,导致电流大、发热剧增。因此早期不少人认为,宇树的电机根本不足以支撑真实工作的可靠性。 ▲高温运行状态 六、用两年时间,让QDD的执行器超出预期 早期的质疑很合理,但宇树赌对了,并持续迭代。 降低发热,核心是让电机所需的电流降下来。其中一个关键,是让电机每转一圈的扭矩输出更平滑。 就比如,车轮有点歪的自行车,骑起来更费劲,因为每圈你都在和额外的阻力较劲。电机也一样,齿槽转矩和扭矩波动会造成微观的抖动,额外消耗的电流全变成了热。 宇树通过优化磁体和槽形设计、斜置磁极等方式,减少了这些浪费。 另一手方案,则是提高铜线填充率,用更粗、更密的线圈降低电阻,宇树称之为“低铜耗线圈”。 有意思的是,宇树在散热上反而设计保守:大部分机身被动散热,仅主控板和髋关节有主动风冷,膝关节用均热板。在其2025年10月的一次更新中,宇树才在骨盆区域加了主动冷却。 ▲膝关节采用铜质VC均热板散热 据推测,这是宇树故意为之:与其堆散热增加成本和复杂度,不如集中精力从根源上把电流和发热降下来。 七、QDD的真正杀招:数周级别的迭代速度 选择QDD,不仅是为了省钱,更是为了极致的迭代速度。 低减速比行星齿轮箱是标准工业品,拿普通滚齿机就能造,供应商遍地都是。而谐波减速器制造工艺极其复杂,涉及多小时的金属晶粒热处理、微米级精密滚齿等,日本谐波减速器龙头哈默纳科(HarmonicDrive)花了数十年才磨透,国内龙头绿的谐波在可靠性上至今仍被认为有差距。 宇树选择QDD,绕开了这个长达数十年的工艺垂直整合大坑。结果就是,宇树搞一次新的QDD设计,几周内就能拿到执行器样品。 作为对比,一家海外人形机器人公司定制一套电机和齿轮箱子系统,因供应链环节冗长,通常要3个月以上:几周确定规格,等6到8周样品,再验证、再下单。 这带来了更低的成本和惊人的迭代速度,以至于像骨盆主动冷却这样的硬件改进,能在极短时间内上线,外界几乎未曾察觉。 八、从几分钟就“歇”到能正经干点轻活儿了 如今,迭代后的G1和执行器,已经能胜任一些轻量但实打实的工作了。 在双臂弯曲时,G1可以持续10到15分钟搬运5公斤负载,这相比早期数据,负载翻倍,持续时间是原来的5倍。哪怕双臂完全伸展,也能举起5公斤坚持约1分钟。 G1的手臂仍欠动力,自由度也不够完全拟人,重活依然会过热,但这只限制了它能做什么样的工作,而非“能不能工作”。 据估算,除研究/爱好者销售外,宇树在2025年可能已向产业试点或真实部署交付了约250台人形机器人。 有公司已部署了30台G1,多家公司部署了5到6台。这些部署大概率仍受限于具身模型能力,因此文章在测算中采用了最保守的假设:100%远程遥操作。 目前,宇树机器人主要干的就是从A点搬到B点的轻质物料搬运,比如电商领域处理小于3到5公斤的料箱,或者只是移动空箱。这些活儿并非24小时全自动,大多还是远程操控。 但搬箱子这事儿,在经济上已经快跑通了。 九、算笔账:在物流搬箱子场景,G1成本已低于人工 以Agility Robotics的一个典型物流任务为基准,可以为宇树G1算笔账。 在这个任务中,Agility的Digit机器人充当自动化系统间的“桥梁”,把自主移动机器人(AMR)上的料箱取下放到传送带。人工干这活,大部分时间在等机器到位,所以Agility公开演示的每小时66个料箱效率完全够用。 料箱重约2到4公斤,负载轻、节拍低、失败可重试、无需精细操作,简直是当前水平机器人的完美任务。 Agility采用2:1的充放电比,相当于有效利用率是人的三分之二。一些正在部署宇树机器人的现场操作人员反馈,G1在该任务上吞吐量能追平Digit。 不过G1可靠性差点意思,通常运行10到15分钟就需要冷却5到10分钟,利用率约50%到67%。 测算用了极保守的假设:完全远程操控、15%服务费(工业界通常5到10%)、2年寿命、残值为0、每天只开两班。即使这样,G1在特定任务中时薪成本也已低于30美元(约合人民币203元)的人类劳动力。 ▲G1单位小时成本vs人工成本(图源:SemiAnalysis) 当然,宇树还不是完整解决方案。相比Agility有成熟的仓库管理系统协同、功能安全体系和自主能力,宇树还有很多环节要补齐。但在合适的业务场景下,哪怕只是全遥操作,它也已经跨过了经济可行的门槛。 十、物料成本仅8976美元,制造优势筑起护城河 经过完整的设计审查,并与每个零部件的制造商逐一沟通、多方核实后,G1的BOM成本预计压至8976美元(约合人民币6.07万元)。 在我国,机器人公司的供应商坐高铁几小时就到,样品当天或次日可达,垂直迭代以周而非季度计,零部件成本仍比海外同类低20%到40%。绝大多数美国机器人初创公司也已把硬件团队放在中国,连特斯拉Optimus也从中国供应链采购。 而即使在这样一个竞争激烈的中国生态里,宇树的垂直整合程度也十分突出。 它自研自制无刷直流电机、行星减速器、激光雷达和深度相机——在不少国产人形机器人公司那里还是靠外采。其自产电机成本可低至海外同类的30%到40%,自研齿轮箱也是全球最便宜之一。 在其IPO问询回复中,宇树明确称,规模生产赋予了它上游议价权,形成了持续的成本优势。 其四足机器人毛利率就从42.36%提升至55.49%,同时成本近乎减半。 ▲(图源:SemiAnalysis) 相较之下,优必选和智元等国内竞争对手仍在制造和总装上更多依赖代工厂或设计方案供应商,据传智元还将欧洲生产外包给了塞尔维亚的敏实集团。 而宇树在招股书中计划,将齿形设计、仿真优化、材料验证和高精度加工等更多核心环节进一步内部化。即便人形机器人都还未真正进入大规模量产,宇树已凭借先发优势,建立起了结构性的成本护城河。 结语:人形机器人的“比亚迪与大疆时刻”正在到来 当许多海外厂商还在原型机阶段打磨时,宇树已经盈利地卖出了数万台四足机器人,一手创建了人形机器人市场,并开始摸到真实工作部署的门槛。 比亚迪始于电池,大疆始于飞控,而宇树抓住了执行器。 随着宇树在多机型形态上持续加速,并不断加固其制造和成本壁垒,它可能以同样的节奏,打开一个又一个此前难以想象的机器人市场。 对全球机器人产业而言,宇树的IPO或许将成为一个历史节点:人形机器人正式步入成本、供应链、规模化与劳动力替代的残酷商业竞争。 来源:SemiAnalysis
9月巅峰对决!华为Mate XT2首创U型折叠方案:对战iPhone Ultra
快科技6月9日消息,博主定焦数码透露,华为新一代三折叠屏机型Mate XT2非凡大师将在今年9月发布,上市节奏刚好和同期亮相的苹果折叠屏iPhone Ultra形成对垒。 这位博主同时爆料,华为Mate XT2将会搭载行业首创的U型折叠结构方案,和三星推出的Galaxy Z TriFold三折叠的设计逻辑有本质区别,完全走出了自己的技术路线。 据悉,三星Galaxy Z TriFold采用的是G型折叠设计,左右两块屏幕往中间方向折叠,机身外侧还额外搭配了一块外屏,这款三折叠还有非常强的操作限制。 使用的时候必须先从左侧的屏幕开始折叠,之后才能再把右侧的屏幕弯折收合。如果用户不按指定顺序,强行先弯折右侧的屏幕,设备会直接弹窗提示请展开手机,从另一侧开始折叠,机身还会持续振动提醒,用户体验的灵活度并不算高。 这次华为Mate XT 2推出的全新U型折叠设计,大概率可以实现左右两侧的屏幕同时向内弯折收合,日常使用的灵活度会高很多。 除了结构层面的创新,华为Mate XT 2还会首发搭载麒麟9050系列旗舰芯片,出厂预装最新的鸿蒙7操作系统,软硬件适配度拉满。 这次迭代的Mate XT 2在技术自由度上更进一步,刚好和苹果首款折叠屏在同一时间节点同台竞技,今年下半年的万元级旗舰市场注定会迎来前所未有的激烈碰撞,给消费者带来更多顶尖的选择。
手机市场集体大跳水!网友调侃买手机现在也和买黄金一样了
快科技6月9日消息,一年一度的618大促正在全平台火热推进,苹果等头部手机厂商接连加入降价让利的行列,各家拿出的优惠力度一个比一个有冲击力,直接把上半年购机的性价比拉到了近年新高。 不少网友调侃,现在买手机的行情都和买黄金一样价格波动剧烈,这波降价幅度大到,很多年初喊着早买早享受刚换了新机的用户,深夜刷到促销价都要忍不住失眠半宿。 拿苹果iPhone 17系列来说,官方直降千元还只是基础优惠门槛,把平台补贴、以旧换新抵扣、店铺满减这些权益全部叠满之后,iPhone 17标准版直接下探到5000元以内的价位段,原本定价更高的Pro版本,到手价也只要6000元左右就能拿下。 业内人士透露,今年上半年整个消费电子市场需求偏冷,手机行业整体出货量不及预期,不少厂商手上都积压了库存,靠降价拉动销量成了当下为数不多的能快速消化库存的选择。 除此之外,每年的9月都是各大手机品牌固定的旗舰新品发布季,赶在全新一代机型上市之前,厂商都要想方设法清空现有老款的库存,给下半年即将登场的新机型腾出足够的仓储和定价空间。 不过业内也有共识,短期的降价冲量只是大促节点的特殊营销动作,放在更长的时间周期里,手机全产业链的成本上涨趋势几乎是势不可挡的。 小米创办人雷军之前公开提到,近两年存储芯片的涨价幅度非常大,未来两年整个内存行业的供货价格还会持续走高,大家如果近期有换手机的需求,越早入手越划算。
微信发布Skill 文档,数百万小程序,一夜之间变成了 AI 的手和脚
微信的 AI,终于动了。 就在苹果 WWDC 的同一天,微信做了一件可能比苹果更重要的事,发布了一份朴实无华的公告:《关于开发者接入微信 AI 生态的指引》。 从今天起,小程序开发者可以给出授权,让微信 AI 完成读取、操作和调用小程序的功能。 微信给了两种接入方式,一「自动模式」,门槛几乎为零,开发者打开一个开关,平台自己读源码、分析页面、搞懂小程序能干什么,然后 AI 就能直接上手操作,一行代码不用写。 另一种叫「开发模式」,开发者自己开发定制化的 Skill,通过审核后被 AI 调用。两种可以同时开启。美团已经宣布接入。 这不能只是理解成又一个新功能上线,而是要看到,微信正在把它的整个生态——数百万小程序、微信支付、服务通知、公众号——变成 AI 的执行层。 扒一扒 Skill 文档,微信 AI 是怎么调小程序的 微信开放文档里公开了小程序接入 AI 的 Skill 技术规范,仔细看,里面藏着很多设计细节。 首先,架构本质上就是 MCP,做过 AI 开发的人会立刻认出来:mcp.json 声明每个原子接口的功能和参数,SKILL.md 描述整个业务流程怎么跑,这和 Claude、Cursor、VS Code 里的 MCP+Skills 架构几乎一模一样。微信没有另起炉灶,而是采用了行业正在收敛的标准。 其次,微信给了一套很清晰的「注意力权重」体系。AI 在决定调用哪个接口、生成什么参数的时候,最优先看的是接口返回的 content(五星),其次是 mcp.json 里的接口 description(四星)和参数 description(四星),SKILL.md 排最后(三星)。这意味着开发者写在哪里比写了什么更重要——同样的一条规则,写在接口返回里和写在 SKILL.md 里,AI 给的权重完全不同。 第三,接口返回有一条核心规范:「事实+动作」两段式。先告诉 AI「发生了什么」,再告诉它「下一步做什么」。如果只写动作不写事实,AI 可能把「展示卡片」理解成「准备调下一个接口」而跳过用户确认。这是一个踩过很多坑之后才会总结出来的规则。 第四,参数传递优先用 ID 而非自然语言。比如门店传 storeId 而非省市街道,饮品传 drinkId 而非饮品名称。这直接减少了 AI 的推理负担和参数歧义。 这套设计透露的信号是:微信已经在实战中跑过足够多的 case,知道 AI 调用外部服务的坑在哪里,并且把这些经验固化成了开发者规范。 实际上,如果对比同样以「生态」著称的微信小程序和苹果应用,微信对自家生态有一种「上帝视角」,这是一切实现的前提。 怎么比苹果 AI 还重要 今年苹果在 WWDC 上发布的新版 Siri AI,令人有些失望。尽管底层接入了 Google Gemini,Shortcuts 支持自然语言创建,却没有引起太多讨论。 细看就会发现差距:苹果做的是让 AI 在 iOS 系统内协调一些原生功能,一旦涉及到第三方应用、那些装在你手机上的 App,它就会捉襟见肘。 比如饿了么,它的代码跑在饿了么自己的服务器上,苹果读不了。Siri 想调用饿了么,必须饿了么的工程师主动来对接 App Intents 这套接口,一个一个谈、一个一个接,中间耗时耗力。 而微信做的是让 AI 直接操作数百万个第三方服务,因为小程序不一样。每一个小程序的代码,从开发者提交、到微信审核、到最后在用户手机上运行,全程都在微信的技术体系里。微信在审核阶段就能把代码扫一遍,自动分析「这个小程序有哪些页面,能干什么事,输入输出是什么」。 所以「自动模式」才能成立——开发者一行代码不用写,开个开关,微信自己就能把你的小程序翻译成 AI 可以调用的工具。微信的基础架构天然支持这样做,它拥有「上帝视角」,能够基于中心化实现调度。 这个架构优势,苹果没有,Google 也没有。 同样值得注意的,还有前阵子传出来,微信正在与华为、荣耀、小米、OPPO、vivo 合作推出 A2A(Agent-to-Agent)助手能力,用户可以通过手机语音助理直接发起微信音视频通话或发消息。 对内,微信 AI 可以调用数百万小程序;对外,手机厂商的 AI 助理可以调用微信。微信正在成为 AI 时代的超级连接器——不只是一个做了 AI 功能的 App,而是一个让所有 AI 都能接入的服务中枢。 「微信 OS」的旧预言 小程序推出的时候,很多人戏称微信要做「微信 OS」。当时这更像是一个修辞——小程序替代了一部分 App 的功能,但本质上还是一个「轻应用平台」。 更偶然的是,当时设计的中心化审核机制,是出于控制质量和安全。但九年后,这个当初被批评为「管控过度」的设计,意外地成了 AI 时代的基础设施优势。分布式的 App 生态(苹果/Android)当时看起来更「自由」,现在反而成了 AI 接入的障碍。 一个旧的预言,由于新时代的技术——AI——的出现,有了颠覆性的变化。 之前写 OpenClaw 和飞书的时候,我提过一个判断:IM 是 AI Agent 最天然的入口,因为对话本身就是人与 AI 最自然的交互方式,而 IM 自带的服务生态(机器人、支付、小程序)让 AI 不只能「聊」还能「做」。飞书已经在往这个方向走,上线了 Bot API 增强和 AI Agent 节点。 不过,飞书是企业协作工具,覆盖的是办公场景。微信有着截然不同的广度——14.32 亿月活,数百个细分领域的小程序,从点外卖到挂号到买机票到缴水电费,几乎覆盖了一个人日常生活的全部服务需求。 如果微信 AI 真的能流畅地调用这些小程序完成任务,那它就不再是一个聊天工具加了 AI 功能,而是一个用自然语言操作的操作系统。 用户说一句「帮我订明天下午三点从北京到上海的高铁」,AI 拆解意图,调用 12306 小程序查票、选座、微信支付完成下单,全程不出微信。这条链路理论上今天就可以跑通。 当然,理论和现实之间还有距离。AI 调用涉及支付场景的服务,容错率接近零——点错一杯咖啡是小事,买错一张机票就是大事。底层模型的准确性要求远高于对话场景。这也是全球 AI Agent 落地面临的共同瓶颈:从「能聊天」到「能办事」,中间隔的不是技术指标,是信任。 但微信至少做对了一件事:它没有从零搭建服务网络。这些年来,ChatGPT 在做的事是先有一个聪明的脑子,再一个一个去接 Shopify、DoorDash、Stripe,每一个都是从零建立的连接,到今天交易相关查询的占比还不到 3%。 真正将要发生的变化,对大多数用户来说,可能是悄无声息的。某一天你在微信里敲打一句「帮我订今晚九点去上海的票」,然后它就订好了,你甚至不知道背后调了哪个小程序,走了什么支付流程。 这种「无感知的完成」,才是AI Agent真正成熟的标志,微信离这一步,比任何人都近。
第一批 Agent 员工上岗,腾讯云想帮企业把它们安顿好
前几天,腾讯云与智慧产业事业群(CSIG)CEO 汤道生和腾讯首席 AI 科学家姚顺雨谈到「AI 下半场」时,姚顺雨提出一个判断: AI 方法论逐渐成熟后,更重要的是找到真实问题和真实场景。对企业而言,模型能力只是起点,最终买单的是场景、上下文和可运行的系统。 围绕这个判断,我们会发现它其实也是理解当下企业 AI 落地的切入点。而在这场对话之后,腾讯云也密集发布了一系列产品,恰好给企业级 AI 的进展提供了一个很好的样本。 过去企业采购云服务和 SaaS,本质是采购 IT 能力;到了 Agent 阶段,引入 AI 更像是在建设一套新的生产系统。换个偏企业管理的说法,腾讯云正在扮演企业 Agent 时代的总工程师。 它要做的,是把场景、模型、知识、安全、记忆、成本和运行体系放到同一套系统里。 沿着大会提出的三个能力看,腾讯云的思路就比较清晰了:场景连接力解决 Agent 如何真正嵌入业务流;工程驾驭力解决 Agent 如何安全、稳定、可靠地运行;模型驱动力解决模型能力、成本与规模化部署问题。 三者合在一起,构成了腾讯云推动 Agent 落地的三驾马车。 Agent 既是新入口,也是新工位 互联网历史上,技术真正改变行业,往往经历同一条路径:先出现新能力,再进入高频场景,最终融入商业系统。 Agent 也不例外。 所谓场景连接,关键不在于增加多少个 AI 入口,而在于 Agent 能否沿着企业原有业务流进入组织。 腾讯的优势在于,它既有微信、企业微信、元宝、腾讯会议这些高频触点,也有 WorkBuddy、CodeBuddy、ima.copilot 、WAND、腾讯 AI 原生营销云、腾讯云 Mall、天御风控 Agent、真人剧 Agent、DatabaseClaw 等通用和垂类 Agent 产品。 ·腾讯会议 举例而言,会议是很多企业最密集的信息入口。过去会议效率低,常常卡在三件事上:听不清、听不懂、效率低。腾讯会议这次讲的 AI 能力,正好围绕这三件事展开。 在声音层面,腾讯会议声链通过纯软件方案,让同一空间内多台电脑组成联合拾音系统,解决啸叫问题,为 AI 提供更完整的会议上下文。 跨语言沟通交给 AI 同传。它通过降低跨语言沟通成本,让参会者使用熟悉语言交流,同时兼顾音色保留和低延迟体验。 会议真正的价值,通常发生在会后。智能录制将录制、转写、纪要和待办串联起来,元宝纪要负责实时理解会议内容,「问元宝」支持会中会后自由联网追问。腾讯会议还开放 Skill、CLI、MCP 等能力,方便企业 Agent 调用会议上下文。 这意味着会议不再止于沟通,而成为后续工作的起点。课堂内容可以自动整理成学习资料,团队例会也能自动生成纪要、检查待办并发送邮件。Agent 进入沟通流,本质上是在把大量非结构化信息转化为可调用、可追踪、可复用的工作资产。 ·MAGIC AI 原生营销云 如果说沟通场景解决的是组织内部信息如何更顺畅地流动,那么增长场景面对的则是另一个更直接的问题:企业如何更高效地找到客户、理解客户,并持续创造增长。 MAGIC AI 原生营销云的核心,不是增加几个 AI 功能,而是让 Agent 贯穿营销全链路。从机会挖掘、内容生成到用户互动和数据分析。过去一个活动上线往往需要多角色协作和数周准备,如今则希望把重复沟通、配置和复盘纳入统一系统,实现从营销工具集合,到智能营销平台的系统性进化。发布会上将其概括为四大能力:知客户、懂运营、会决策、能执行。 知客户,是理解客户状态和互动历史;懂运营,是沉淀企业营销经验和规则;会决策,是针对人群、商品和渠道生成更优策略;能执行,则是在权限和审批框架下推动营销活动落地。 ·AI 原生云 Mall 营销之后,品牌和零售企业更要经营数字交易阵地,背后涉及商品管理、会员运营、活动配置、导购服务和售后经营等大量工作。AI 原生云 Mall 的强大之处,在于让 Agent 进入品牌经营过程。 云 Mall 2.0 的关键词是千亿底座、AI 原生和让经营自己跑起来。通过「千亿级交易底座+Agent 能力体系」双轮驱动,从「交易承载」全面跃迁至「智能经营」。 千亿底座强调交易稳定性和安全性,经过大规模交易场景验证;AI 原生则体现在 1+7 的 Agent 架构上:一个经营分析 Agent 负责洞察问题,七个执行 Agent 覆盖商品、内容、会员、营销、分销、门店和导购等环节,关键操作仍保留人工审批。 更值得关注的是 Agent 协作。比如发现商品滞销后,云 Mall 可以调用营销云完成策划、内容生成和投放,再将结果回流分析。未来电商运营不只是单个 Agent 工作,而是多个 Agent、多个系统之间的协同。 ·天御风控 Agent 天御风控 Agent 则对应风险控制场景,覆盖注册登录、营销活动、支付诈骗、黄牛刷单等业务,通过微信、企业微信、网页等入口接入,承担实时分析、风险判断和持续监控等工作。 ·腾讯云 WAND 此外,内容生产同样是场景连接力的重要部分。 腾讯云 WAND 面向电商、短剧、漫剧、短视频、赛事直播等场景,把生成、理解、处理和编码放进一套能力体系里。WAND-Create 负责电商图、短剧、漫剧等内容生成,强调业务可用性和风格可控;WAND-EraseVibe、WAND-Enhance、WAND-Codec 分别处理无痕擦除、画质增强和编码压缩。 赛事直播场景中,WAND 提供一站式 AI 制播方案 — 一场比赛进来,AI 自动完成解说生成、精彩集锦生成、横屏转竖屏、多语种字幕、画质增强和实时转码分发。 ·真人剧 Agent 真人剧 Agent,则推进到更复杂的叙事生产。 相比普通营销内容,真人剧涉及角色、剧情、场景、分镜、表演、后期和分发等完整链路。发布会上展示的「祝英台开着赛车来到发布会现场」Demo,全程无需演员、摄像机和实地取景,体现的是 AI 对真人内容生产成本的重构能力,而不只是视觉噱头。 短剧正在走向工业化生产。真人剧 Agent 面向短剧生产与出海、品牌营销和平台集成三类需求,覆盖剧本创作、选角定妆、场景生成、分镜脚本、拍摄剪辑和二创等环节。 它还能自动生成符合物理逻辑的一致性场景图,减少 AI 视频常见的场景跑偏问题,并通过人脸融合和口型驱动降低多语言翻译与角色本地化成本。 影视剧本质上是一套复杂协作系统。Agent 要做的不只是生成内容,还要理解角色关系、剧情走向、场景限制和制作流程,在创意表达与工业化生产之间建立连接。 早期电影从舞台记录走向镜头语言,经历了剪辑、特写、声音和特效等技术演进,最终形成完整工业体系。今天 AI 进入真人剧,也可能从加速单个环节开始,逐步影响剧本开发、素材管理和内容分发。 数字剪辑、CG、虚拟拍摄曾改变电影工业的生产方式。今天的 AI 也类似,它未必替代创作者,未必替代所有表达判断,却正在重塑内容生产效率。 把这些产品放在一起看,腾讯云的场景连接力就变得愈加具象化:会议连接组织上下文,营销云连接客户增长,云 Mall 连接交易经营,天御连接风险控制,WAND 和真人剧 Agent 连接内容生产等等。Agent 沿着这些高频业务流进入企业,才能获得真实反馈并创造价值。 想长期上岗的 Agent,得先学会守规矩 过去二十多年,视频、游戏、电商、移动办公等产业的发展,都离不开云计算提供的弹性资源和基础设施。 到了 AI 时代,云的角色进一步升级。企业部署 Agent,不只是调用模型,而是在搭建一套包含算力、上下文、工具调用、权限、记忆、监控和审计的运行体系。 Agent 时代总工程师最重要的工作,是把这些制度、边界和基础设施设计好。从这个角度看,工程驾驭力解决的不是单点功能问题,而是 Agent 能否进入生产环境、能否长期运行的问题。 首先是知识。企业知识通常分散在文档、会议、IM、制度、培训材料、业务系统和专家经验中。Agent 要真正服务企业,需要先把这些分散信息沉淀为可理解、可调用、可追溯的知识底座。 ·腾讯乐享 比如腾讯乐享强调 AI 原生的 Agentic 知识库,让企业知识从静态资料变成可执行的工作台。它可以统一纳管多格式、多来源知识,通过 AI 巡检、AI 评审和权限管理提升知识质量,并与 WorkBuddy 等工作空间连接,让知识可以直接进入任务执行。 ·ima 同步亮相的 ima 更偏向 Agent 时代的知识引擎。 ima 知识号能够让专业知识被 AI 搜索、引用和调用。知识号已经覆盖金融、法律、教育等 20 多个行业,相关信源累计应用次数超过 1.4 亿次,并已在海关、医疗等场景形成具体使用案例。 据悉,杭州萧山海关把 500 多篇海关法律法规、公告和旅客高频问答整理到知识号里,旅客通过二维码即可提问;医院药师则把用药指南、专家共识和诊疗方案放进知识库,医生和患者可以通过拍照、语音等方式获得参考信息。 ima 知识号不只面向人阅读,也面向 Agent 调用。知识可以被阅读、被对话,也可以被封装为 Skill。ima Skill 广场让创作者把方法论和工作流变成可被 Agent 调起的能力,比如合同审查 Skill、行情分析 Skill 等。未来 MCP、API 等 Agent 时代的知识产物,也可以成为知识分享的一部分。 最近 ima 还推出了专属知识Agent——copilot,具备长期记忆、全场景感知能力,基于用户使用 ima 所产生的数据自主扩充知识体系,沉淀并支持自定义拓展skills,自动完成复杂知识工作,从工具进化为越用越懂你的伙伴。 除了个人知识工作场景,没有记忆的 Agent 也很难成为企业工作系统的一部分。它可以完成一次任务,却难以理解历史任务、组织偏好和长期目标。企业需要的是能够持续积累经验的智能体。 ·腾讯云数据库 Agent Memory 腾讯云数据库推出的 Agent Memory 将记忆分为短期记忆压缩、长期记忆沉淀和团队记忆组织化。短期记忆管理上下文和任务状态;长期记忆沉淀用户习惯与方法;团队记忆支持组织级知识共享与传承。团队记忆进一步划分为员工私有域、部门协作区和组织全局库,既保护个人知识资产,也沉淀企业级 SOP 和组织经验,避免核心知识流失。 腾讯云数据库自研符号化压缩和上下文卸载能力,可以在长任务场景下帮助 Agent 提升 30% 的任务成功率,同时节省 30% 到 60% 的 Token 成本。并通过独创的四层渐进式记忆提取方案,显著提升了 OpenClaw 的长期记忆能力。在 PersonaMem 测评数据集上,OpenClaw 原生记忆评测得分从 48% 提升到 76%。 ·AICC 可信集群 而 AICC 可信集群通过 TEE 可信集群、端到端加密和可证明安全能力,将高性能推理、安全保障与运维优化整合为一站式服务,帮助企业以更低成本快速获得可用、可解释、可审计的安全推理环境。 这些变化也指向了企业级 AI 与消费级 AI 的差异。消费级 AI 追求像人,企业级 AI 更要像组织:懂分工、守边界、能协作、可复盘、有交付。企业最终需要的 AI,要能在权限、流程和成本约束下稳定工作。 跑得通、用得起,才是企业 Agent 的成人礼 企业 Agent 面临最重要的问题,是成本。很多企业并非不知道 Agent 有价值,但一旦进入规模化阶段,很快会遇到现实约束:Token 成本难控、部署门槛高、推理调用贵、数据检索慢。模型能力不再只看效果,还要看单位任务成本、响应速度和 ROI。 因此,模型驱动力关注的不只是模型本身,还包括多模型智能路由、按用量控制成本,以及训练、部署、推理和数据检索效率。 开源 Agent 框架虽然能力丰富,但安装部署门槛较高,长期运行不稳定,成本也不容易控制。尤其是 Agent 执行任务时需要调用模型,盲目调用大模型,会让 Token 成本快速上升。 ·Lighthouse Lighthouse 的角色,是个人云端助手的云端底座。 它本身是轻量服务器产品,过去主要降低用户上云门槛;到了 Agent 场景,它进一步变成 7×24 小时在线的云端工作空间。其产品设计强调轻体验、轻应用、轻投入和轻管理,希望把云端 Agent 的部署、运行和管理复杂度降下来。 如果说 Lighthouse 解决的是 Agent 怎么跑、怎么长期在线、怎么降低部署和调用门槛,那么 CFS Turbo 解决的是 Agent 规模化运行背后的数据底座问题。 Agent 的运行不仅依赖算力,也依赖数据。长上下文、知识检索、多模态处理、模型训练和推理缓存,都对存储性能和数据流转效率提出更高要求。 ·文件存储 CFS Turbo 文件存储 CFS Turbo 定位为高性能并行文件存储,面向大模型训练、推理和 Agent 场景。它提供统一的数据平台,支持从数据注入、训练到推理和归档的全流程,并通过标准文件接口和 S3 接口减少数据搬运成本。 同时,CFS Turbo 提供冷热数据分层和元数据检索能力,在降低存储成本的同时提升海量文件检索效率,为知识库、RAG、多模态生产和模型推理提供支撑。 换句话说,前者让 Agent 更容易落地,后者让 Agent 能够规模化运行。两者共同构成企业 Agent 时代的重要基础设施。 而结合开头姚顺雨的判断,腾讯云这次发布的重点,不只是推出一批 AI 产品,而是在尝试把 Agent 从工具变成企业系统的一部分。 沟通需要 AI 协作入口,增长需要 AI 原生营销云,交易需要 AI 原生云 Mall,风控需要天御风控 Agent,内容需要 WAND 和真人剧 Agent,企业级运行需要知识库、可信集群、Agent Memory、Lighthouse 和 CFS Turbo 等基础设施。 单独看,它们是不同产品;合在一起,则更接近企业所需的 AI 生产系统。 作为企业 Agent 时代的总工程师,腾讯云的价值也逐渐浮现:既要理解企业业务流程,也要提供模型、算力、安全、记忆和系统集成能力;既要让 Agent 进入沟通、营销、交易、内容和风控等高频场景,也要保证这些 Agent 能在权限、成本和安全边界内长期工作。 热知识,企业看重的并非 Agent 本身,而是最终能够带来的业务结果。Agent 能力再强,如果进不了业务流程、接不上企业知识、无法满足安全要求、成本又难以控制,最终仍然很难形成稳定价值。 AI 下半场的竞争,最终会落到具体业务流程中。很多技术进入企业都会经历同样的过程:从看起来聪明,变成用起来可靠;从替人做事,变成与组织一起工作。 历史上的每一次技术普惠,都是从走下神坛、卷起裤管开始的。今天企业级 AI 也只有在明确产出、安全边界和商业约束中反复验证,才算真正度过从草莽走向成熟的成人礼。
为什么你手机16GB内存还会卡 而华为的不会呢:余承东释疑
快科技6月9日消息,不少用户都有这样的疑惑,为什么自己手里标着16GB内存的手机用久了还是频繁卡顿,同内存规格的华为手机却能长时间保持流畅运行,近日华为相关负责人余承东专门针对这个大众关心的问题做了详细释疑。 华为常务董事、产品投资评审委员会主任、终端BG董事长余承东专门科普了市面上很多安卓手机越用越卡的核心原因,在他看来普通用户靠手动删除聊天记录、卸载闲置App这类操作,根本解决不了底层的卡顿问题,只是治标不治本。 自动播放 很多消费者选购手机的时候,都能在参数页看到类似XXGB+XXGB的组合标注,最常见的比如16GB+512GB,却有不少人根本没搞懂这两个数字分别对应的硬件功能是什么。 余承东以大家最熟悉的16GB+512GB内存组合为例做了拆解,后面的512GB对应手机的存储空间,用户日常拍摄的视频、照片还有各类安装文件都存在这个分区里。 前面的16GB才是真正的运行内存,专门给手机里运行的各类App提供实时运算空间,这块硬件的调度效率高低,才是决定手机日常会不会卡顿的核心要素。 他进一步举例说明,按照常规的调度逻辑,标准16GB运行内存的手机,想要保持流畅不卡顿,最多同时重度运行15个以上的大型应用,如果用户打开第16个App,新进程就会强行挤占已经打开的其他App的运行空间,这个时候手机就很容易出现明显的卡顿掉帧。 普通用户遇到这类情况最常用的解决办法就是手动杀后台,也就是动手关掉之前已经打开的闲置App,腾出新的运行空间给刚启动的新应用用。 虽然手动杀后台确实能暂时把流畅度拉回来,但也意味着之前运行到一半的游戏、正在播放的视频会被直接清理出内存,再次打开的时候需要全部重新加载,很多临时进度甚至会直接丢失。 和这类常规调度逻辑形成鲜明对比的是,搭载了HyperSpace Memory超空间内存技术的华为机型,完全不会出现这类频繁杀后台导致的卡顿问题。 此前余承东在公开活动现场展示过实测数据,在HyperSpace Memory技术的加持下,华为手机的内存压缩率相比普通方案大幅提升了69%。 表现更为亮眼的是全场景应用保活率直接实现了接近100%的翻倍提升,用户多任务来回切换的时候完全不需要等重新加载,操作体验可以做到随心所欲。
告别标志性药丸屏!iPhone Ultra跟进单挖孔屏:向安卓看齐
快科技6月9日消息,从2017年iPhone X拉开全面屏时代大幕开始,苹果手机就走出了一条完全区别于安卓阵营的产品路线。 从初代iPhone X一直到iPhone 13系列,高端iPhone全线都沿用辨识度极高的刘海屏形态,到了iPhone 14 Pro系列,苹果才把刘海屏进化为药丸形态的灵动岛设计。 苹果多年坚持在屏幕正面留出大块异形区域的核心原因,是要给独家的Face ID 3D人脸识别模组留出足够空间放置元器件,而同期安卓阵营的绝大多数机型,走的都是单挖孔搭配屏幕指纹识别的方案。 进入2026年,即将发布的折叠屏旗舰iPhone Ultra,直接砍掉了苹果沿用近十年的Face ID人脸识别系统。最新曝光的相关机模信息直接坐实,iPhone Ultra最终采用了类似安卓的单挖孔前置方案,这也是苹果史上第一款采用单孔屏设计的iPhone。 按照公开的细节设计来看,iPhone Ultra的外屏前摄挖孔居中放置,展开后的内屏前摄挖孔设置在屏幕左上角,解锁逻辑也换成了侧边指纹识别方案。 该机定位横向开合的阔折叠旗舰,配备5.3英寸的外屏以及7.8英寸的内屏,将会首发搭载苹果最新的A20 Pro旗舰芯片,后置4800万像素双摄,内置电池容量突破5000mAh,续航表现相比历代iPhone都有明显提升。 为了兼顾折叠屏的轻薄手感和近乎全屏的视觉体验,苹果主动放弃了坚持近十年的Face ID交互路线,这款iPhone Ultra也成了近十年来外观形态变化最大的iPhone。
赛豆科技发布AIVA品牌:概念车Origin Concept亮相,ME7年内上市
凤凰网科技讯 6月9日,赛豆科技在北京正式发布全新AI汽车品牌AIVA。品牌名称取自“Artificial Intelligence Voyage Ahead”,寓意AI陪伴用户一路向前。AIVA提出“AI定义汽车,先有AI,再有车”的造车路径,定位AI先锋生态出行品牌,全系车型将覆盖20万元以上主流市场。 发布会上,AIVA首款概念车Origin Concept亮相,官方称其以AI大模型为起点,采用生物力学重构整车形态,打造“看得见、摸得着、能感知、会回应”的具身AI生命体。首款量产车型AIVA ME7将于2026年年内亮相。AIVA品牌LOGO以AI大模型为大脑原点,象征具身智能与全生态生命体三层递进含义。 AIVA总裁兼产品经理李博表示,AI定义汽车的核心是从产品定义源头就让AI参与需求挖掘与趋势洞察,而非仅将AI作为功能叠加。火山引擎副总裁杨立伟指出,AI汽车将使交互从机械变为鲜活,智能从功能堆叠转向能力涌现。 AIVA已携手火山引擎,双方联合定义、联合设计、共同打造AI汽车体验,火山引擎提供豆包大模型、智能座舱等技术服务。此外,赛力斯作为重要股东方提供整车制造与供应链支持,宁德时代提供电池技术与能源解决方案,国资平台参与产业资源协同。AIVA以独立市场化主体运营,探索多方产业长板协同的AI汽车产业组织新范式。
iOS 27更新非常大,可惜我们只能用用调休闹钟
差友们乡亲们,一年一度的苹果 WWDC 开发者大会它又来了! 和往常一样,编辑部的小伙伴们依旧会熬夜冲稿,第一时间带大家看看果果的新系统又整了哪些活。 不过,今年的 WWDC 可以说是自从托尼入行以来,见到的最不一样的发布会。。。 因为这次大会并没有像以前那样,挨个介绍手机、平板、电脑的新系统。 这次苹果选择以 Apple Intelligence 为核心,按照不同 App 和 AI 的更新进行分类,为大家介绍新的 App 和 AI 功能。 换句话说,如今的苹果已经把各种形态的设备融合的差不多了,比如在介绍儿童保护功能的时候,有好几次都提到相关的功能从 iPhone 到 iPad 再到 Mac 其实都可以使用,跟系统和设备无关。 包括介绍 “全新” Siri AI 和 Apple Intelligence 的时候也是一样。 说到这儿,先跟大家说一个坏消息,这次新发布的 AI 功能咱们还是吃不上:“由于欧盟和中国大陆需要配合监管要求推进相关工作,因此暂不提供” 。。。 好了,本次报道就结束了,大家下次见! 开个玩笑,好消息是根据早前的爆料,苹果应该已经在推进 “苹果基础模型” 的备案工作了,国行 iPhone 用上苹果 AI 也只是时间问题了。 而且你们肯定想不到,苹果的时钟居然支持节假日和调休闹钟了!!! 这下不得不更了! 所以今天我们的内容依旧分成两个大部分:先聊 OS 27 新系统上的功能和改进,再聊推进中的 Apple Intelligence 以及 “新 Siri” 是个什么情况。 首先是 iOS 27 的 UI 改进,去年的 Liquid Glass 液态玻璃设计风靡全球,但也让用户们对苹果美学的评价前所未有的割裂 —— 有人觉得这玻璃真好看,有人觉得可读性一坨、属于为了设计而设计。 所以苹果今年老实了,直接把透明度选项交给用户了,喜欢毛玻璃还是透明玻璃都随你。 系统图标也重新设计了,从之前的纯平面玻璃,变成了立体堆叠玻璃,看上去更加精致。 托尼更新到 iPadOS 27 开发版看了一眼,大概就是一种给玻璃加了描边的感觉,变化其实不大 —— 要想更明显的看出来区别,得等常用的第三方 App 们都重新设计一下图标,但估计得且等了。。。 其次是优化了整体的性能,苹果举了几个例子: App 启动速度最高提升 30%,相册图片加载速度最高提升 70%,AirDrop 文件传输速度最高提升 80%,iPad 的文件浏览速度提升 5 倍,接近 MacOS 访达的水平。 此外,Wi-Fi 和数据网络的切换速度也提升了。 我看外媒 Engadget 提到了一些细节:苹果对 CPU 调度器进行了一些修改,因此实现了一些额外的提速。 更具体的资料我暂时没查到,但是结合 WWDC 开幕式上的资料,应该是 CPU 调度、文件索引等多个系统模块优化重构带来的结果。 而且,iOS 27 也确实会一直支持到 iPhone 11 这种 “上古” 机型 ,苹果对老设备的系统维护确实是有点强。。。 除此之外,苹果还针对儿童使用设备方面,做了更加细致的功能管理。 比如现在家长可以专门给孩子使用的手机限制 App 数量,孩子如果想使用别的 App ,家长也会收到请求许可。 或者你可以直接设置不同类型 App 的使用额度,游戏就少玩会儿,学习软件则可以多用用。 另外,如果孩子想要给陌生联系人打电话,也是需要经过家长同意的。。。 而且当孩子收到有可能是暴力色情相关内容时,图片也会模糊掉,进行一个查看的禁止。 嗯。。。听上去 iOS 27 这次针对儿童安全的更新还不错,不过对于国内的用户们来说,应该依旧是一个比较小众的功能。 Safari 浏览器这次也有了不少更新,如果你是那种喜欢同时开好几十个标签页都不关的人,现在 Safari 多了个自动创建标签组的功能,不用你手动分组了。 嗯,不过我们一般还是喜欢把所有网页都摊开,分组?不存在的。。。 另外,如果你想监测一个网页是否有更新,比如商品补货之类的,也不用一直开着页面傻等了。 因为现在即使你关掉页面,Safari 发现你关注的这个页面有更新了,也会及时通知你的。 好好好,这下人人都是黄牛了。。。 Safari 还增加了一个骚操作,就是如果有些账号密码有泄露风险,那么它就可以一键批量修改账号密码。。。 不过托尼觉得这次 Safari 最实用的更新,其实是 AI 生成自定义扩展组件,以后想要啥组件,自己生一个就完事儿了。 看得出来,Safari 团队应该是从如今 AI 圈子的 “Skill” 里面学到了点儿精髓。 总之,如果你是一个 Safari 浏览器爱好者,这些更新应该还是够你体验一阵子的了。 另一个更新了不少功能的常用系统软件,则是相册。 不过这个更新的东西嘛,其实国内厂商都已经做出来了,那就是系统级 AI 修图。。。 尤其是 AI 消除和扩图,这都是国产品牌早就更新的功能。。。 不过这次相册还多了另一个叫做 “空间构图” 的功能,简单来说就是先把图片识别成可以动的空间照片,然后你再选择喜欢的角度,并生成一张重新构图的照片。 嗯。。。听上去还不错,但是这跟摄影本身似乎已经没啥关系了,这不纯靠 AI 生成吗。。。 讲完了 UI 和一些系统功能的更新,接下来就是重头戏 —— 全新的 Siri 了。 众所周知,苹果前两年就开始吹 Apple Intelligence,但是发布会画的饼有不少都没能交付,因此还在北美吃了集体诉讼的官司。 上个月判决下来了,苹果因为夸大宣传要在北美赔掉 2.5 亿美元。 但是这两年里苹果并没闲着,比如今年一月份就有外媒爆料:苹果花大价钱找谷歌做了一个 AI 模型,参数 1.4T,但是一直没有得到证实。 不过今天算是实锤了,虽然没有公布具体参数规模,但是 Craig 老头亲自宣布,苹果基于谷歌 Gemini 大模型训练了全新的 “苹果基础模型家族”。 这个模型的所有权归苹果自己,既能部署在苹果的安全云端,也能部署在用户自己的端侧设备上。 虽然技术构造和谷歌 Gemini 同源,但是用户数据不会流向谷歌,能让 iPhone 用户们在享受便利的同时保护隐私。 众所周知,谷歌 Gemini 模型的视觉理解能力以及世界知识水平都很强,苹果显然也是看中了这两点,把谷歌的本领揉到了自己的模型里。 看了今年 WWDC 主旨演讲的差友们应该也发现了,苹果今年的演示几乎全是实拍,和 PPT 贯穿全程的 WWDC 24 完全不一样。 而这次苹果在 WWDC 26 上宣布的 “全新 Siri” 以及新的 Apple Intelligence,在我看来其实就是把 24 年的不少 PPT 做出来了。 那这个 Siri 具体有多新呢?嗯。。。其实跟咱们国产品牌的手机助手差不多。 比如发布会上现场演示的,就是长按锁屏键,然后问一位艺人在旧金山的演出是几号,怎么订票,开票了提醒我等等。 或者你也可以让 Siri 识别屏幕内容,问它这是哪里,然后导航去这里等等。 整体看下来,新 Siri 的连续对话能力和联想能力确实还不错,但是还远远没到惊艳的程度,这跟国内的手机品牌们几乎拉不开差距,只能说终于跟上了大部队的步伐。 另外就是让 Siri 随时随地生成文字内容,这个更是老生常谈,现在几乎是个国产手机就有这功能,就连平板都有了。。。 真正让托尼觉得有点意思的,是当你问 Siri 世界杯赛程的时候,Siri 不仅会展示赛程,还会进行专门的排版,而且下拉还可以进入完整赛程界面查看。 不仅如此,你还可以检索别人给你发的消息,也可以把消息发给别人。 这个听起来并不难,但要知道果果一直都是拿 iMessage 做示范,而咱们嘛。。。你先问问微信能不能开放接口吧。 其实跟 iPhone 相比,托尼觉得这次更新真正让果果的 AI 跟其他家拉开一点差距的,其实是 Mac 。 因为众所周知,Windows 11 摆烂也不是一天两天了,如果不是像荣耀、华硕和联想这样的厂商自己做配套设施,Windows 电脑上面的 AI 功能仍然是一坨。 但苹果这边不一样,由于都采用了 arm 架构,所以 Mac 电脑可以把很多东西都拿过来用,包括这次的新 Siri 。 也就是说,在手机领域没有那么惊艳的新 Siri ,放到电脑上可以爆杀 Windows PC 。 光是这个右键集成 Siri 栏并且可以实时对话的设计,就足以让友商汗流浃背了。。。 而且,这个新 Siri 依旧继承了苹果生态的优良传统,从 iPhone 到 iPad 再到 Mac ,你都可以和新 Siri 跨设备连续对话。 对了,这个新 Siri 也会适配 Apple Watch 和 Apple Vision Pro ,它还是没有忘记 Vision Pro ,我哭死。。。 而且由于 Vision Pro 是一个空间设备,所以你还可以用新 Siri 问诸如 “这双鞋子能不能放进我想买的这个背包里面” 的问题,空间识别加上新 Siri 确实是一个很独特的体验。 那么说了这多,多了这么多新功能的船新 Siri ,应该叫它什么好呢? 嗯。。。就叫 Siri AI 。 果果你们是真不知道起什么名字了吗,哪怕叫 New Siri 或者 Super Siri 也行啊。。。 到这里,这次 WWDC 能跟大家分享的内容,差不多就这些了。 说实话,托尼看完发布会后,虽然觉得没啥狠活吧,但也算是替苹果松了一口气。。。 因为这次的各种 AI 功能,一定程度上就是苹果几年前就一直在承诺要做的事情。 从最开始的 AI 承诺,到中途的磕磕绊绊,再到最后的终成正果,苹果这 AI 这次终于是画上句号了。。。 而且至少根据大会的实拍效果来看,用起来体验至少是有一定保障的。 但你要是问托尼印象最深刻的两个地方嘛,还真跟 AI 没啥关系,其中一个是闹钟终于支持调休了,而另一个。。。 就是发布会开头,一帮人坐着大众 T1 巴士,告诉大家新一代 macOS 系统的名字是 Golden Gate 金门大桥。 果然,整个加州的地名都快被苹果薅没了。。。
坏了,苹果AI真成了?
几经波折之后,我们终于将手里的几台 iPhone 都更新到了 iOS 27,体验到了五年以来最重大的一次 Siri 更新。 更新之后第一眼能看到的,也是最明显的升级,就是 iOS 27 全面焕新的 app 图标: 图|YouTube @Apple 当然,说是完全焕新也不尽然—— 相比 iOS 26,新版本的图标更像是从「强调玻璃光影」进化到了「添加玻璃材质」: 除此之外,iOS 27 的整体透明度也变得更加可控了。 iOS 27 中,原本只有两级可调的 Liquid Glass 模糊程度变成了一根无级滑杆,自定义范围更大: 根据会上介绍,iOS 27 的设备支持范围最低从 7 年前的 iPhone 11 开始。 新增的玻璃调整效果对于旧处理器的性能压力如何,还要看后续的更新情况如何—— 图|YouTube @Apple 幸好 WWDC 上宣称的流畅度优化确实有效。 iOS 27 是最近几代少有的,手机降温之后就基本不会掉帧的开发者测试版了,在 iPhone Air 上的表现也称得上稳定: 说到功能性方面,iOS 27 是一个非常两极分化的版本—— 一方面,国际版 iPhone 迎来了堪称「量大管饱」的 Siri AI 更新。 全局检索、屏幕感知、连续对话等等功能给好给满,更不用提这个全新的 Siri UI 了: 另一方面,国行机型迎来了近年来字面意义上「最贫瘠」的一次更新。 除了新壁纸、透明度滑块、节假日闹钟之外,国行 iOS 27 几乎没迎来任何有实际意义的 Siri 更新。 除此之外,天气 app 在 iOS 27 中也迎来了一波卡片改版: 此外,在 macOS 27 预览版中,我们还见到了可以随意调整比例的 iPhone 镜像: 图|X @aaronp613 至于这个宽幅布局是给谁准备的,不言自明。 总之如果你恰好使用着外版 iPhone、拥有外区 Apple ID 的话,就可以享受到这套「中间下滑 Siri,左边下滑通知,继续下滑又是 Siri」的超绝连招了。 更重要的是,新版本的 Siri 也拥有了一个属于自己的 app。 它的主界面与我们熟悉的聊天式 AI 比如豆包、千问等等如出一辙,也可以切换成类似「小 X 记忆」的画廊模式: 比较可惜的是,由于今晚尝鲜的人很多,苹果的 AI 服务器不太稳定。 这导致 Siri AI 的一些深层功能(屏幕识别、总结文章、多模态生成)成功率不高,经常会出现连接报错的情况。 然而在正常运作的时候,新 Siri AI 的端侧指令处理速度是我们体验过的最快的—— 可惜这个速度只有搭载了 A19 Pro 的 iPhone Air 与 iPhone 17 Pro 系列才能体验到。 图|YouTube @Apple 说到 iOS 27 的改版,相机是不得不看看的应用。 非常遗憾的是,iOS 27 的相机并没有像部分爆料所说那样进行专业化升级,只是在 iOS 26 的基础上小修小改—— 与拍摄相关的二级菜单收纳在快门右侧,成为一个单独的显眼图标。 顶部的常用参数则换成了居中摆放,视觉上更为平衡。 UI 设计方面的改变见仁见智,但在 iOS 27 上,UI 只是个引子—— 在相机底部的模式栏滑动,我们会发现系统相机中赫然出现了一个名为「SIRI」的模式。 切换到 SIRI 模式,就可以像之前 Visual Intelligence 那样调用 AI 识别、分析、理解和搜索画面。 由相机出发,iOS 27 上还有不少 AI 方面的更新与影像有关—— 随 iOS 26 发布的图乐园获得了更新的设计,并可借助 Private Cloud Compute 处理更复杂的生成请求。 同时,除了原有的卡通、可爱的风格外,这一代图乐园终于可以生成写实风格的图像了: 在更新到 iOS 27 后,我们第一时间上手了全新的图乐园,需要注意:它目前只能用英语描述想要生成的图片效果。 我们上传了一张实拍照片,并要求图乐园生成一张带有 90 年代胶片质感、颗粒和眩光效果的图片。 等待数十秒后,图乐园给出了一张高度贴合描述的结果:画面风格完整,质感也相当真实。 如果不是放大细看细节,甚至很难第一时间发现明显瑕疵—— 但由于前面提到的问题,图乐园生图偶尔也会失败报错。 推测也是因为短时间测试的用户太多,后续正式版的表现应该会更为顺畅。 影像的另一个 AI 大更新藏在相册中——作为每次拍完照后调整图片的第一环,相册的重要性不必多言。 这一次,苹果将升级的消除、扩图与重构集成到了 Apple Intelligence Tools 中,与风格、裁切等功能并列在一级菜单里: 其中的重头戏,还是「重构」Reframe ——苹果称它来自 Vision Pro 相关技术的积累。 原理上讲,iOS 27 的「重构」很像是 iOS 26 中 3D 照片的进阶版。 当系统能够更清楚地区分照片中的前景、主体和背景后,用户就可以用手指拖动画面的视角和景别,照片的透视关系也会随之变化。 实际体验下来,重构功能的前后其实分成了两步。 第一步是预览。iPhone 会先用端侧的空间模型理解照片层级,并生成一个可以快速拖动视角的预览版本。 这一步速度很快,几乎可以实时响应手指操作: 但预览阶段的可调整角度比较有限,如果拖动幅度稍大,画面里的主体和背景偶尔就会出现一些滑稽的拉伸。 真正的生成发生在第二步——确认视角后,iOS 就会调用云端模型补全因视角变化产生的画面空缺。 这一步目前偶尔也会出现连接失败报错的情况,但只要顺利生成,用 20 秒左右就能得到一张相当不错的新照片: 哦对了,以上所有与 AI 有关的影像功能,都暂时与国行无缘。 只能说首发体验下来,iOS 27 不愧是近十年来国行和外版割裂程度最大的一代。 毕竟我们也极少见到国行 iPhone 17 Pro Max 安装更新不到 20 分钟、美版却足足安装了快一个小时的巨大差异。 至于什么时候我们能用上满血的 Siri AI 功能,还得是克雷格的那句话—— 图|YouTube @Apple 作者|马扶摇,周奕旨 编辑|肖钦鹏
脱胎换骨,新Siri把iPhone变成了豆包手机
Siri终于要变成AI助手了? 情况是这样的,在苹果2026年WWDC上,发布了一系列Siri的更新,全部围绕AI功能,包括上下文、屏幕感知、跨App执行任务。 除此以外,苹果放出了更多Apple Intelligence的功能,包括图片编辑、密码、短信、Safari……等等等等。 可以说,现在只要是苹果原生的App,背后一定或多或少和Apple Intelligence有点关联。 并且,这次的WWDC,也是库克作为 CEO 的最后一次开发者大会。 但意外的是,作为下一任苹果CEO的约翰·特努斯(John Ternus)并没有上台演讲。 好了,接下来就让我们一起看看,这次WWDC上,苹果到底带来了哪些更新吧。 Siri Siri是整场WWDC 2026的主角。 软件工程高级副总裁克雷格·费德里吉(Craig Federighi),把Siri AI称为“完全新版本(entirely new version)”,由Apple Intelligence驱动的全新版本。 苹果官方新闻稿里是这么描述的:现在的Siri是一个能力更强、更会对话的助手,具备个人上下文理解、广泛的世界知识和屏幕感知能力。 翻译成人话就是,过去的Siri像一个只会执行指令的语音遥控器,这次苹果想把它变成一个真正理解你的系统级代理。 具体的更新分成了三层。 第一层是个人上下文。 Siri AI现在可以从你的邮件、短信、照片、备忘录、日历里提取信息。 你问它“朋友上周推荐的那家餐厅叫什么”,它会去翻你的Messages历史,找到那条对话,告诉你餐厅名字;你问它“我的酒店确认号是多少”,它会去Mail里找那封预订确认邮件,把号码提取出来;你问它“上个月度假拍的照片”,它会理解时间范围和照片内容,直接调出相册。 Siri现在不只是搜索升级了,它还能把这些孤立的数据串联起来,形成完整的记忆。 第二层是屏幕感知。 Siri AI可以看到你当前正在看的内容,理解屏幕上的信息,并基于这些信息采取行动。 你在Messages里收到一条“周六聚餐,你能带个菜吗”,你可以直接对Siri说“帮我想想带什么菜,然后把菜谱加到Notes里”。 Siri会理解这条短信的语境,给你建议,然后真的去Notes里创建一条新笔记。 你在Safari里看到一个地址,可以说“把这个地址加到联系人卡片里”,Siri会识别屏幕上的文本,找到对应的联系人,完成更新。 第三层是执行能力。 Siri AI现在可以跨App执行任务。 你可以让它“把这张照片调亮一点,然后发给Pedro”。它会打开照片编辑工具,调整曝光,保存,然后打开Messages,找到Pedro的对话,把照片发出去。整个过程你不需要手动切换App,不需要点击任何按钮。 你可以让它“提醒我明天下午三点给Vicki打电话”,它会创建提醒事项,设置时间,关联联系人。基于此,你可以让它“把这个活动加到日历里”,它就会开始解析活动信息,创建日程,填入地点和时间。 这三层能力加在一起,让Siri从一个只会回答单次问题的工具,变成了一个AI Agent。 最有画面感的场景,是iPhone相机里的Siri模式。 苹果把Visual Intelligence从去年的Camera Control按钮移到了相机App里,变成了一个独立模式,和照片、视频、人像、全景并列。 你切换到Siri模式,把镜头对准眼前的食物,可以直接问“这道菜有多少卡路里”。 Siri会识别食物,查询营养信息,给你详细的成分和热量数据。 你对着一个植物问“这是什么花”,它会告诉你品种、养护方法、花期。你对着一张海报问“这个活动什么时候开始”,它会识别文字,提取日期,甚至可以直接帮你加到日历里。 并且,在Mac和iPad上,Siri的入口也变多了。你可以从Spotlight直接唤起,可以右键菜单里选“Ask Siri”,可以在任何文本框里输入问题。 在Vision Pro里,Siri甚至可以作为一个3D虚拟对象出现在空间中,你看着它说话,它会理解你的视线焦点,知道你在看哪个物体,然后给出相关信息。 而且苹果还推出了独立的Siri App。 这个App可以保存和同步你的对话历史。你可以翻看之前问过的问题,继续之前的话题,让Siri记住你们聊过的内容。 早在2011年的时候,Siri伴随iPhone 4S登场,它的演示效果非常惊艳。 你可以问天气、设闹钟、发短信,语音交互在当时是科幻级体验。 但很快用户就发现,Siri听得懂指令,但理解不了上下文。你问它“附近有什么好吃的”,它能给你一串餐厅列表。但你接着问“哪家评分最高”,它就不知道你在说刚才那个列表。你得重新把完整问题说一遍。 2016年,苹果在WWDC上宣布向第三方开放SiriKit,开发者可以让自己的App接入Siri。 然而雷声大雨点小。SiriKit的能力域被严格限制在几个类别里,消息、支付、打车、健身、照片搜索,开发者能做的事情很少。 更关键的是,Siri本身的理解能力没有质变,第三方接入只是让它多了几个可以喊的App名字,本质上还是那个不能真正理解你意图的语音助手。 2024年WWDC上,苹果承诺要用Apple Intelligence重建Siri,让它具备个人上下文理解、屏幕感知和跨App行动能力。 然而这个承诺在2025年跳票了。整整一年时间里,Siri本身几乎没有变化。因此行业里不断有人质问,说“苹果是不是在AI时代掉队了?” 过去十五年里,Siri经历了太多次“这次真的不一样了”的时刻,但每次用户拿到手里,都会发现它还是那个听不懂复杂问题的语音助手。 所以2026年这场WWDC,对苹果来说其实压力还是很大的。他们需要证明自己不仅能做出AI,还能把AI做进Siri这个已经存在了十五年的产品里,让它真正变成一个能用的智能助手。 Apple Intelligence 之所以Siri能够有这么大的升级,关键在于Apple Intelligence。 早在2024年的WWDC上,Apple Intelligence就已经亮过相了。 苹果告诉开发者和用户,我们有了自己的AI框架,它可以做Writing Tools,可以生成图片,可以总结邮件。但那时候的Apple Intelligence,更多是作为一个独立功能存在,你需要主动去调用它,去点那个按钮,去打开那个菜单。 这一等就等到了现在。 克雷格在台上反复强调一个词,deeply integrated。深度集成。 他说Apple Intelligence现在不再是一个单独的聊天框,而是藏进了照片、Safari、密码、短信、电话、日历、家庭等日常场景里。用户不需要“打开AI”,AI会自动出现在你正在做的事情里。 过去两年AI产品的一个共同问题是,用户需要改变自己的使用习惯,去适应AI。 你得记得打开特定的App,然后把你想问的问题输进去,再把它给你的答案复制出来。 然而苹果想做的是反过来,让AI适应用户已有的使用习惯,让它自然地出现在你本来就会用的App里。 照片App是这次更新的重点之一。 苹果推出了Spatial Reframing功能,可以用AI和3D建模技术,从现有照片生成新的视角。 演示时,苹果的工程师展示了一张合影,原本构图有点紧。用Spatial Reframing之后,照片的视角变了,就像你当时往后退了一步重新拍了一张,构图变得更舒服。工程师说“It‘s like I was able to go back in time and adjust my camera in the moment”,就像回到过去调整了相机位置。 原图 Reframing Extend功能可以扩展照片边界,调整比例,扶正地平线。你拍了一张海景照片,地平线歪了,天空被裁掉了一部分。Extend可以帮你把天空补全,把地平线拉直,让照片看起来像是用更好的构图拍出来的。 Clean Up功能升级了,现在可以处理更复杂的场景。你拍了一张人像,背景里有路人、垃圾桶、电线杆。Clean Up可以把这些杂物移除,而且处理得很自然,不会留下明显的AI修图痕迹。 Image Playground现在支持生成照片级别的图像。过去Image Playground只能生成插画风格或动画风格的图片,这次苹果加入了photorealistic风格,可以生成看起来像真实照片的图像。你可以用它生成锁屏壁纸,生成联系人头像,甚至可以基于现有照片进行改图。 并且苹果还在WWDC上表示,所有用AI编辑过的照片,都会带上隐藏的SynthID水印。 这是苹果和谷歌合作开发的技术,可以在不影响图片质量的前提下,在像素层面嵌入不可见的标记,证明这张图片经过了AI处理。这是苹果对“AI图片真实性问题”的回应。 在一个AI可以生成以假乱真照片的时代,苹果选择给每张AI编辑的照片打上标记,让用户和平台可以识别哪些图片是原始拍摄,哪些经过了AI改动。 除了图片功能,Apple Intelligence的更新还体现在Safari上。 Safari现在可以自动整理标签页。 你打开了几十个网页,有购物的、有查资料的、有工作相关的,全都堆在标签栏里。 Safari的AI可以识别这些网页的内容,按照类别自动分组,把购物网站归到一起,把工作文档归到一起,把新闻文章归到一起。你也可以用自然语言描述你想要的分类方式,比如“把所有关于咖啡的网页放在一起”,Safari会理解你的意图,完成分类。 Notify Me功能可以监控网页变化。你在等一个商品补货,或者在等一个价格降到心理价位,或者在关注一个网站的条款更新。 你可以让Safari监控这个网页,当内容发生变化时,Safari会给你推送通知。 这个功能虽然看起来有点“简陋”,但它解决了一个真实的用户需求,尤其是当你买票、抢座的时候,你不需要反复刷新网页,不需要设置第三方监控工具,Safari会替你盯着。 你甚至可以用自然语言描述你想要的Safari扩展,AI会帮你生成。 不过这个功能还在早期阶段。 Passwords App也因为Apple Intelligence而得到了升级。 Passwords现在不仅可以告诉你哪些密码太弱、哪些密码已经泄露,它还可以自动帮你修复。 你点一下“Fix”,Passwords会调用Safari,自动访问那个网站,登录你的账号,找到修改密码的页面,生成一个强密码,完成修改,然后把新密码保存下来。 整个过程你不需要手动操作,Passwords会“agentically take action on your behalf”,代理式地替你行动。 Messages现在可以根据对话内容给出一键建议。你收到一条“别忘了明天下午两点开会”,Messages会在下面显示一个按钮“Add to Reminders”。你点一下,提醒事项就创建好了,时间、内容都自动填好。你收到一条“这是我家的新地址”,Messages会建议“Add to Notes”或者“Update Contact”。 Mail和Messages的Smart Reply功能,现在可以学习你的个人写作风格。过去的智能回复都是通用模板,“好的”、“收到”、“谢谢”。 而新的Smart Reply会分析你平时怎么写邮件,怎么回消息,然后生成符合你语气的回复建议。如果你平时写邮件比较正式,它会给你正式的建议。如果你平时用emoji比较多,它也会在建议里加emoji。 Phone App的Call Context功能,是个很实用的小创新。 比如你要给航空公司客服打电话,报预订号、航班号、身份信息。 现在Phone App可以在你打电话的时候,自动从Mail和Messages里找到相关信息,显示在屏幕上。你一边打电话,一边就能看到确认号、预订详情,直接念给客服听。 最容易被忽略的,是Shortcuts的更新。 Shortcuts一直是iOS上最强大但门槛最高的功能。它可以让你自动化几乎所有操作,但前提是你得学会怎么搭建流程,怎么设置触发条件,怎么调用API。 对大部分普通用户来说,Shortcuts就是个“看起来很厉害但我学不会怎么用”的工具。 现在苹果加入了“Describe a Shortcut”功能。你用自然语言描述你想自动化什么,比如“当我离开公司的时候,给Pedro发消息说我在路上,并附上预计到达时间”。 Shortcuts会理解你的需求,自动搭建这个流程,设置地理围栏触发,调用Messages API,获取导航数据,生成消息模板。你只需要确认一下,这个自动化就设置好了。 这个功能如果真的好用,可能会让Shortcuts从“极客玩具”变成普通人的自动化入口。因为它把门槛降到了最低,你不需要学习任何技术概念,只需要说清楚你想做什么。 库克谢幕 这一年里,苹果液态玻璃的设计引发了不小的争议。 很多用户觉得新的毛玻璃效果太重,界面元素不够清晰,视觉层次混乱。 这次WWDC上,苹果悄悄地做了调整。他们提供了更多透明度和视觉效果的调节选项,让用户可以根据自己的喜好,调整界面的对比度、清晰度、动效强度。 性能优化是每年WWDC的保留项目,但今年苹果讲得比往年更细。 他们说照片显示速度提升了,AirDrop传输更快了,CPU调度更高效了,多任务切换更流畅了。 由于这次苹果加入了大量的AI内容,而且还都是本地处理的,这就导致需要更强的算力。 所以苹果在讲AI的同时,也在讲性能,讲优化,讲基础体验。 与此同时,苹果还在WWDC上宣布,个人上下文能力可以延伸到第三方App,但前提是开发者接入Spotlight、App Intents等能力。 Siri AI可以理解第三方App里的内容,可以在第三方App里执行操作,但这一切必须要开发者主动适配。 其实苹果用户的大部分时间,都是花在第三方App里的,微信、抖音、淘宝、美团、Netflix、Spotify。 如果Siri AI不能理解这些App里的内容,不能在这些App里帮你做事,那它还是一个只能控制系统功能的助手,算不上真正的系统级代理。 苹果给开发者提供了Foundation Models框架、App Intents API、Writing Tools集成、Image Playground集成。他们说这些工具都是免费的,没有按请求收费,而且内置隐私保护,所有处理都可以在设备上完成。 但开发者会不会买账,还要看实际效果。 这是个鸡生蛋蛋生鸡的问题,用户觉得Siri AI不好用,是因为第三方App没接入。第三方App不接入,是因为用户还不怎么用Siri AI。 苹果需要在接下来几个月里,用实际数据证明Siri AI的使用率在增长,证明接入的开发者能获得用户增长或者使用时长的提升。只有这样,第三方生态才会真正动起来。 最后,是库克的谢幕。 库克将在2026年9月1日转任执行董事长,硬件工程高级副总裁特努斯接任CEO。这意味着,WWDC 2026是库克作为CEO的最后一次开发者大会。 库克在2011年接任CEO时,苹果刚刚失去乔布斯。当时外界普遍质疑,一个供应链专家能不能领导一家以创新著称的公司。 但库克用十五年时间,把苹果变成了全球市值最高的公司,营收从2011年的1082亿美元增长到2025年的超过4000亿美元,市值一度突破4万亿美元。 他把苹果从一家硬件公司,转型成了一家硬件加服务的公司。 Apple Music、Apple TV+、Apple Arcade、iCloud、Apple Pay,这些服务业务在库克任期内从无到有,现在已经是苹果营收的重要支柱。他推动了Apple Watch、AirPods、Vision Pro的诞生,把苹果的产品线从Mac和iPhone,扩展到了可穿戴设备和空间计算。 AI显然是库克任期末尾最头疼的地方。 苹果在2024年推出Apple Intelligence时,功能不够完整,Siri的承诺没有兑现,整个AI战略看起来仓促。2025年的延期,更是让外界质疑苹果是不是在AI时代掉队了。 所以2026年的WWDC,对库克来说,不仅是他最后一次以CEO身份主持的开发者大会,也是他需要证明苹果AI战略没有失败的关键时刻。 发布会结束时,库克说“It‘s been the honor of a lifetime”,这是我一生的荣幸。他感谢了开发者,感谢了团队,说“I truly believe the best is still ahead”,我真心相信最好的还在前面。他说苹果的北极星始终是创造服务人们需求的产品。 “北极星”是一个比喻,意思是长期不变的方向、判断标准、最高指引。放在这句话里,就是说苹果不管做硬件、软件、AI,最终都要回到一个问题:这个东西是不是对用户真的有用?是不是让人的生活和工作变得更好? 正如前文说到的,整场发布会上,作为即将接任的CEO,特努斯都没有发表演讲。 大家都以为这场WWDC上,库克会给他一个“传递火炬”的时刻,让他上台讲几句话,介绍一下未来的方向。但特努斯从头到尾都没有露面。 这可能是因为WWDC是一个软件为主的活动,而特努斯的背景是硬件工程。 他在2001年加入苹果,参与了iPhone、iPad、AirPods、Mac产品线的开发,主导了苹果向Apple Silicon的转型。但他不是一个软件人,也不是一个AI专家。让他在WWDC上讲AI战略,可能不是最合适的时机。 所以特努斯的首秀,很可能是9月的iPhone发布会。毕竟那才是他最擅长的领域。
父子接力棒!张正萍接父出任赛力斯汽车董事长:曾主导与华为合作
快科技6月9日消息,据报道,赛力斯汽车有限公司于6月5日发生工商变更,创始人张兴海卸任董事长,其子张正萍接任。 原监事会主席申薇、监事刘德林、胡佳及董事张艺泷退出,何利扬由董事升任副董事长,陈业君、王平、周林三位新董事进入。 据了解,张正萍是赛力斯与华为跨界合作的关键推手。2016年,他在美国硅谷创建专注于新能源汽车研发的SERES美国公司;2017年回国创建赛力斯汽车有限公司,主导业务重心转向国内。 2021年,他参与并主导了与华为的跨界业务合作,携手发布问界系列车型。 与华为合作之前,赛力斯长期处于亏损状态,品牌认知度有限,在新能源市场缺乏存在感。 2021年问界系列问世后,局面彻底扭转。2025年问界全年交付超42万辆,成为国内销量最高的中国豪华品牌,其中M9累计交付超26万辆,连续20个月稳居50万元级销冠; 2026年1月13日,AITO问界第100万辆整车下线,从40万到100万辆仅用18个月,成为国内高端豪华品牌的“最强黑马”。 2025年赛力斯营收1650.5亿元,净利润59.6亿元,连续两年盈利,新能源汽车毛利率达28.8%,远高于特斯拉同期的17.8%、理想的17.9%和比亚迪的20.5%。 得益于问界的大获成功,赛力斯与华为的“智选车”模式已成为行业标杆。 而张正萍从集团层面下沉至汽车业务子公司,意味着他将更直接地操盘问界品牌的日常运营与产品迭代。
10人买车6人选新能源!燃油车销量暴跌39% 真成小众了吗
快科技6月9日消息,据乘联分会发布的最新数据,5月全国乘用车零售销量约151万辆,同比下降22.1%,环比增长9.2%。 其中燃油乘用车零售约56万辆,同比暴跌39%,市场份额仅剩37.1%,同比减量占乘用车总减量的82%,拖累大盘走势。 与此同时,5月我国新能源乘用车零售渗透率达到62.9%,创历史新高,较去年同期提升9.9个百分点。 批发渗透率首次突破60%,达到61.1%,同比提升8个百分点。相当于每10个人买车,就有超过6人选择新能源。 新能源乘用车零售95万辆,同比下降7.5%,环比增长12.4%。 批发端,新能源乘用车批发135.2万辆,同比增长10.6%,其中纯电88.6万辆、插混37.2万辆、增程9.5万辆,增程式同比下滑24.9%是唯一负增长品类。 乘联分会秘书长崔东树表示,燃油乘用车开始成为小众群体,国内车市呈现"燃油冷、新能源热"的极致分化。 但新能源内部也在分化,B级电动车批发约27.3万辆,同比增长42%,占纯电份额31%;A00级电动车批发约8.7万辆,同比下降44%,份额仅10%,较去年同期下降11.6个百分点。 高端爆发、低端承压,乘联分会认为只有入门级电动车普及才能真正拉动可持续增量。 出口是5月最大亮点。乘用车出口78.4万辆,同比增长75.1%,其中新能源出口42.4万辆,同比增长112.6%,占出口总量的54.1%,连续第三个月突破50%。 纯电动占新能源出口的59.3%,插混占36.2%,增程占4.4%。燃油乘用车出口也同比增长46%,与新能源共同构成出海全面增长。 崔东树预判2026年中国汽车出口有望达到1200万辆,远超中汽协此前预测的740万辆。 乘联分会数据显示,1-5月乘用车累计零售709.9万辆,同比下降19.5%,乘联分会将全年零售增速预期从-1%下调至-11%。 崔东树预判,乘用车市场将在今年三季度得到逐步改善,四季度车市预计会恢复正增长。 “若全球局势趋于平稳,大宗商品与油价回归合理区间,物流运输成本随之回落,国内消费者购车信心将逐步修复,汽车零售市场也将迎来持续回暖。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。