行业分类:
加载中...
头条分类:
加载中...
地表最强编程AI诞生!Claude 4连续自动编程7小时,实测细节惊艳程序员
就这几天,AI 圈像是过年了。 就在刚刚,Anthropic 正式发布 Claude 4 系列模型:Claude Opus 4 和 Claude Sonnet 4。 没喊口号,没搞长篇论文,这次 Claude 升级的关键词只有一个:干活。 据 Anthropic 宣称,Opus 4 是目前全球最强的编程模型,能够稳定胜任复杂且持续时间长的任务和 Agent 工作流。而 Sonnet 4 则着重强化了编程和推理能力,能更精准地响应用户的指令。 此外,Anthropic 还同步推出了以下新功能: 工具辅助的延伸思考(测试版):Claude 模型在进行深入思考时,能够交替使用工具(如网页搜索),以优化推理过程和回复质量 新增模型能力:两款模型可并行使用工具,执行更精确的指令,并在开发者授权下,提升记忆能力,能提取并保存关键信息,保持上下文连贯 Claude Code 正式发布:Claude Code 现已支持 GitHub Actions、VS Code 和 JetBrains 新的 API 功能:Anthropic API 新增四项功能,包括代码执行工具、MCP 连接器、文件 API 和最长可缓存 1 小时的提示缓存功能 Claude 4 发布,最强编程 AI 又又双叒叕易主了? 作为 Anthropic 迄今为止最强大的模型,Opus 4 在编程基准测试 SWE-bench 上拿下了 72.5% 的高分,在 Terminal-bench 上也以 43.2% 领先同行,堪称最会写代码的模型。 Claude Opus 4 擅长编程和解决推理类问题。它可以像资深程序员那样拆解问题、修补逻辑、精准 debug,甚至连续执行需要数小时的复杂任务。 Anthropic 提前让部分客户试用了 Opus 4,在 Replit 的实测中,Opus 4 在多文件、大改动的项目中表现出更高准确率。 Block 表示在其代号为 Goose 的 Agent 中,该模型首次在编辑和调试代码过程中显著提升了代码质量,同时保持了稳定性和性能。 Rakuten 使用该模型进行了一项高要求的开源重构任务,连续稳定运行 7 小时,表现相当出色。Cognition 更直接地指出,Opus 4 能解决其他模型无法完成的复杂任务,成功处理了多个前代模型没法完成的关键操作。 我试着让 Opus 4 创建带有动画效果的天气卡片,要求必须展示四种不同的天气状态,每种都有独特的动画效果,结果只用了一次机会就成功生成,效果惊艳。 与 Opus 4 相比,Sonnet 4 不一定是最强,但可能是最合适绝大多数开发者的那个。 和前代 Sonnet 3.7 相比,它的编程能力、逻辑推理和响应可控性都有明显提升。SWE-bench 的成绩直接冲到了 72.7%,几乎与 Opus 4 持平。 虽然 Sonnet 4 在大多数基准测试不及 Opus 4,但它整体更轻巧,也更灵活,聚焦更明确。 我试着让 Sonnet 4 「创建一个红白机风格的『贪吃蛇』游戏,包含自动演示 AI 功能,使用纯 HTML/CSS/JavaScript 实现为单文件」第一次失败了,第二次成功交付,输出质量在线。 因此,也不难理解 GitHub 选择把它作为新一代 Github Copilot 的底座模型,Manus 说它在处理复杂指令时更清晰、输出格式也更优雅;Sourcegraph 指出它更能专注核心问题,写出更有结构的代码。 作为「混合推理模型」,Claude 4 系列支持两种模式:一种是接近即时的响应,另一种是深入思考,适用于更复杂的推理任务。 在无需延伸思考的 SWE-bench Verified 和 Terminal-bench 评测中,两款模型的表现已属上乘;但一旦启用长思考(最长支持 64K token 输入),其上限被进一步拉高。在 GPQA、MMMLU、AIME 等测试中,几乎没有对手: MMMLU 测试中,Opus 4 得分 87.4%,Sonnet 4 也有 85.4%; AIME 测试中,两者得分均超 33%,远超前代水平。 Anthropic 还针对 TAU-bench 设计了全新推理流程,允许模型执行长达 100 步的推理任务,模拟零售策略设计、航空调度优化等复杂思维过程。在这种模式下,Claude 被鼓励写出完整的思维链条,而不是一上来就直接给出结论。 与此同时,Anthropic 也在模型行为上做了进一步优化。 Opus 4 和 Sonnet 4 相较于前代,更不容易走「捷径」或利用逻辑漏洞,在容易诱发 AI 欺骗行为的测试中,相关问题的发生率下降了 65%。 一旦开发者授权模型访问本地文件,Claude 不只是看懂文档,还能记住、生成并维护「记忆文件」,把关键信息记下来,形成一个完整的工作记忆。 Anthropic 明确指出,未来优秀的 AI Agent 需要三种能力: 情境智能:不仅理解任务,更理解你是谁、在做什么,甚至为什么做。它能理解组织习惯与个性风格,持续自我优化。 长任务执行能力:能独立完成长流程、复杂结构的任务,甚至与其他人类或 AI 协作。 真实协作能力:能展开高质量对话、适配你的工作流,并为其行为提供清晰的推理解释。 比如 Opus 4 在玩《宝可梦》时创建了一份「导航指南」。 最后,在工具层面,Anthropic 还引入了一个名为「思维总结」的新功能。该机制会在模型思考路径过长时,自动调用一个更小的模型对思路进行压缩和归纳,使最终呈现的信息更简洁、更清晰。 据称,这项功能只在约 5% 的复杂任务中被触发,大多数场景中模型的推理链已足够高效,无需简化。 知名博主 Dan Shipper 也体验了 Claude 4 系列模型,并给出评价。 他认为 Opus 在编程中的表现尤为突出,尤其是在 Claude Code 中,它能够长时间独立完成编程任务,无需干预,且比 OpenAI 的 Codex 更强大。 比方说,它成功实现了一个无限滚动功能,尽管需要进一步优化,但效果已接近可发布版本。 写作方面,虽然 o3 在写作上更强,但 Opus 是一个出色的编辑工具,它能诚实地编辑文本,不会随便给「好评」,指出问题所在,还能帮忙发掘未曾发现的写作主题和模式。 不过,对于日常任务,Opus 的表现反而不如 o3。ChatGPT 的记忆功能在日常使用中更具粘性和有效性,而 Opus 仍需在智能性和速度上大幅提升,才能成为日常使用的首选工具。 目前,两款模型均已上线 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 平台,支持 Pro、Max、Team 和 Enterprise 各版本计划,Sonnet 4 甚至向免费用户开放。 价格与前代保持一致:Opus 4 每百万 token(输入/输出)分别为 $15/$75,Sonnet 4 为 $3/$15。 在 AI Agent 成为主流生产力工具的当下,Anthropic 这两款新模型为不同层级用户提供了明确选项:Opus 4 面向极致性能与科研突破,Sonnet 4 则面向主流落地与工程效率。 AI 模型不仅要聪明,还要耐用、稳健、可控。这也正是 Claude Opus 4 和 Sonnet 4 从基础能力到细节机制,从代码场景到长任务执行,所展现出来的一个明确的信号。 Claude Code 全面开放,开发者的新「AI 助理」值不值得信赖? 几个月前,Anthropic 曾以研究预览的形式上线了一款面向开发者的编程工具——Claude Code。如今,这款工具正式向所有开发者开放使用。 从今天起,无论是在命令行终端、常用的 IDE,还是你自建的应用后端中,Claude Code 将深入嵌入更多真实的开发场景,Anthropic 同步发布了 Claude Code SDK,帮助开发者基于这一 Agent 打造自定义工作流和自动化工具链。 其中一项重磅更新,是为 VS Code 和 JetBrains 系列 IDE 推出的测试版扩展。 借助该扩展,Claude 可以直接在代码编辑器中提供修改建议,开发者无需跳出熟悉的工作环境,即可快速审阅变更、追踪任务进度。只需在 IDE 的终端运行一条安装命令,即可启动 Claude Code。 除了 IDE 外,Anthropic 还发布了可扩展的 Claude Code SDK,方便用户基于 Claude Code 自行构建 Agent 和应用程序。 此外,Claude Code 也进入了 GitHub 的深度集成测试阶段。开发者现在可以在 Pull Request 中 @Claude Code,协助处理代码审阅意见、修复 CI 报错、提交修改等常见任务。只需通过 /install-github-app 命令即可安装 GitHub 插件,从此实现「提示即改动」的自动化协作。 在今天的直播环节,Anthropic CPO Mike Krieger 表示,随着 Claude Code 进入规模化应用阶段,「提示缓存」成为另一项被频繁提出的需求。现在,这项能力已正式落地:默认提示缓存 TTL 为 5 分钟,高级用户可以将其延长至 1 小时。 这项升级将显著降低长时间运行 Agent 任务的成本:最多可减少 90% 的 token 成本、缩短 85% 的响应延迟,使得 Claude 更适合处理持续交互、多轮推理的复杂任务链。 Claude Code 的产品经理在发布会上展示了一个真实的演示任务:使用 Claude Code 为 Excalidraw 添加表格组件。这个被「压箱底」很久的功能请求,如今通过 Claude,仅用一次提示就被完整实现。 在 VS Code 中打开项目后,开发者向 Claude Code 提交了一个清晰的需求描述:希望新增一个支持自定义尺寸、可拖动、风格兼容的表格组件。Claude Code 随即生成一份详细的任务清单,依照步骤开始逐步修改项目代码。 得益于 IDE 的深度集成,开发者可以一目了然地看到每次变更的代码差异(diff),并根据需要选择人工批准,或启用自动接受模式。在演示中,Claude Code 还承担了 Lint 检查、测试运行与 PR 提交等全部流程,整个实现周期不到 90 分钟。 最终成果包括新增完整的表格功能、自动生成并通过测试用例、与 Excalidraw UI 无缝集成、代码质量符合 Lint 要求,顺利通过构建,所有输出,未经手动编辑,完全由 Claude Code 独立完成。 例如,当用户在 Issue 中 @Claude,它不仅会回应请求,还能主动创建 PR,并持续通过评论更新进度,直到提交完成。这意味着,Claude Code 不再局限于本地环境,而成为你在 GitHub、Slack 或任何支持 API 的平台上都能调度的「云端代码同事」。 Anthropic 还提到,部分客户已用 Claude Code SDK 构建了更复杂的用例:包括并行运行多个实例来修复不稳定测试、自动提升覆盖率,甚至执行夜间值班时的紧急故障排查。 编程,是 AI Agent 最现实的落地场景。过去两周,OpenAI 推出了 Codex,Google 亮出了 Jules,Anthropic 则在凌晨宣布全面开放 Claude Code。 三家头部 AI 公司,几乎在同一时间选择了同一条路径:Agent,要开始上工位了。 这并非巧合。在所有需要「思考+执行」的任务中,编程是最天然适合 AI Agent 落地的场景:输入输出高度结构化,标准答案明确,工具调用接口丰富,还有大量可复用的开源语料和反馈数据。 更重要的是,它的用户就是最早接受 AI 的开发者群体。他们习惯自定义、愿意尝鲜、擅长集成,并且具备为好工具付费的能力与意愿。这是一个天然适配 Agent 产品迭代的应用场。 AI 能否替程序员「干活」,可能就是继 ChatGPT 改变内容创作后的又一次「生产力地震」。真正打响第一枪的,或许正是这次全面开放的 Claude Code。 只需要短短十分钟,它就完成了一个过去需要几天、甚至几个迭代周期才能推进的开发任务。这样的改变,也正在不断发生。下一代开发者将从学会写给 Agent 的第一条指令开始。 在发布会的最后,Anthropic CEO Dario Amodei 和 CPO Mike Krieger 展开了一场炉边谈话,APPSO 整理如下: Mike Krieger: 欢迎回到舞台,Dario,接下来我们将进行一对一的对话。欢迎回来,Dario。 Dario Amodei: 你好,又见面了,太好了。这就像是一场在全场观众面前的一对一交流,真不错。Claude 4 发布了,包括 Claude Sonnet 4 和 Claude Opus 4 也都上线了。你对 Claude 4 模型最兴奋的点是什么?它又如何改变了你对接下来 12 个月里可能实现的事情的看法? Dario Amodei: 是的,从抽象的角度来说,我最兴奋的一点是,每当有一个新的模型类别推出,你就能用它做更多的事情,对吧?我们会在 Claude 4 之后继续发布模型,可能会有 Claude 4.1,就像我们做过 Sonnet 3.5 一样。 我认为我们现在仅仅是刚开始探索新一代模型在任务方面的潜力。我觉得模型的「自治」能力会远远超出目前的水平,比如让模型在很长一段时间里自主执行任务,我们现在还只是刚刚起步。我越来越看好模型在网络安全任务中的应用,网络安全其实可以看作是编程任务的一种,但它通常更高阶。 所以我觉得我们可能终于达到了一个可以胜任这类任务的门槛。作为一名前生物学家,我对模型在生物医学和详细科研方面的应用也感到非常兴奋,我认为尤其是 Opus 会非常擅长这方面的工作。 Mike Krieger: 这让我联想到《Machines of Loving Grace》。你觉得 Claude 4 在整个发展路径中扮演什么角色?我喜欢开玩笑说大家把《Machines of Loving Grace》当作一篇随笔看,而我把它当作未来几年产品路线图。你觉得 Claude 4 是怎么融入这段旅程的? Dario Amodei: 是的,那篇文章其实有点像我写的产品路线图,但当时我其实并不知道该怎么实现它,然后就说,「好吧,各位,这就是你们要干的事了。」 我们现在越来越多地在生物学领域展开思考,而软件也是这其中的一部分,因为生物学正变得越来越数据驱动。十年前我做生物学时就已经涉及到数据,现在只会更多。我们拥有这些对生物学知识丰富的模型,它们可以帮助写代码。 所以如果你是一名计算生物学家,这些模型真的会加速你的研究进度。我们也有不少客户正在尝试将模型应用到这些任务中,我们稍后会聊到这个。 Mike Krieger: 是的,我记得在我们发布 MCP 后举行的第一次黑客马拉松中,有人把 MCP 连接到了一个可以作画的绘图仪上,于是 Claude 就能自由作画了。看它画的东西真的很有趣。这是我第一次意识到 MCP 不仅仅能连接数字系统,它还能连接现实世界。所以如果 MCP 能驱动实验设备,那真的很有意思。 Dario Amodei: 很快我们就能把 Claude 接入测谎仪来测试它了,我太喜欢这个点子了。 Mike Krieger: 既然有测谎仪,谁还需要可解释性?你之前提到,有一次你确信 Claude 写的内容是人类写的。还有没有其他类似的突破性时刻,让你意识到这个模型真的不一样? Dario Amodei: 其实当时我自己也不太明白技术细节,但在我们内部,有一次模型发布前几周,有人突然说:「天啊,这个模型居然一次性完成了一个非常复杂的性能优化任务,以前没有哪个模型能做到。」 我想说的是,模型开发过程中总有一种几近迷信的现象——最后关头总是会突然「开窍」。虽然训练过程都是精心规划的,但模型的某些能力就是在最后一刻才展现出来,也许是跟用户的互动方式变了,也许只是最后一点点调优特别关键,也可能是人们对模型的使用方式更熟悉了。 你会发现模型的早期版本大家都摸不着头脑,但到了某个时刻,人们突然说,「这个模型我用着太顺手了。」总有某种「炼金术」似的神奇,在最后时刻发生。 Mike Krieger: 《创造力公司》那本书里也讲到 Pixar 拍电影的过程几乎一模一样,电影在上映前两天都还是一团糟。我觉得我们做模型也是这种感觉,前期效果不佳,直到某个瞬间突然突破,我们迫不及待想让大家用上。 Dario Amodei: 这真的说不通,因为训练过程是均匀的,按理说不会是那种「突然成型」的情况。但现实就是这样——在 RL 曲线上找不到某个点,它就是在最后时刻集成成功了,我也不知道为什么。这是一个真实存在的现象。 Mike Krieger: 现场有很多开发者,我们内部也经常在讨论一个问题,那就是在 AI 快速发展的今天,软件工程这份工作中哪些部分会被 AI 接管?当我们拥有能执行大量开发工作的自主 Agent 时,什么会变得更加重要? Dario Amodei: 是的,可能在座很多人都读过 Steve Yegge 几个月前写的一篇关于初级开发者的博客文章。他还有几篇类似的文章,他甚至来我们公司拜访过。我觉得他对未来发展的描述甚至比我还清楚。他讲到我们正在逐步迈向模型更高的自治性。 我们经历了一个阶段,那时模型主要用于自动补全,现在大家说的是「vibe coding」,而我们正朝着可以派遣 Agent 执行任务的方向发展。我觉得有了 Claude Code,我们会更进一步,未来还会有其他产品界面支持这个方向。 我们正进入一个新世界,开发者可以像管理一支 Agent 团队一样工作:「你去做这个,你去做那个。」 但我认为人类的持续参与仍然很重要,特别是在质量把控方面,确保 Agent 执行的是正确的任务、细节也做到位。所以我们在模型本身和周边产品设计上都要关注这些细节,这是非常关键的。 Mike Krieger: 我也深有体会。模型让工程部分变得更高效,也让我对工作中那些低效部分更加敏感。比如,我们现在在跨团队协调和制定路线图上花了太多时间,其实应该花更多时间在真正的构建上。 随着开发速度加快,浪费时间的感觉也更加明显。 行业里有个永恒的争论:到底是更大的模型更强,还是更小更精致的架构更有前景?你因「扩展规律」论文而广为人知。你现在怎么看这种极端趋势?预训练是否已经「过时」?还是说它依然是核心?它和后训练之间的关系又是怎样的? Dario Amodei: 我不想讲得太细,但 Claude 4 系列模型在预训练和后训练方面都有显著进步。我们发现扩展规律在预训练阶段依然有效,同时后训练方面也持续有突破。这两者是互补的,我相信未来我们还会在这两个方向继续取得进展。 我们还会继续扩大模型规模,也就是说,多条技术路径正在同时指数级增长,而它们会相互叠加。 这也是为什么我觉得这个领域会发展得非常快。我喜欢 Steve Yegge 的那篇文章,是因为他说出了我经常说的话:再过一两年,这些模型可能就已经跟人类平起平坐了。 Mike Krieger: 难以置信,Claude 3.7 才是今年二月发布的,对吧? Dario Amodei: 是啊,但感觉像是一年前的事了。我知道,这听起来像个「过时的模型」,但其实才过去两个月多一点。时间的尺度正在被压缩。我常说,做 AI 就像是坐在一艘飞船上,以相对论的速度离开地球——你在飞船上过一天,地球上可能已经过去两天了。 Dario Amodei: 你得在一天里接收两天的新闻信息,然后是三天,再接着就是四天……就是这种感觉,我们都在这艘飞船上。 Mike Krieger: 这个比喻太贴切了,我之前没听过,但真的很贴切。回到后训练这个话题,我对 Claude 4 中一个重要的新特性非常感兴趣,那就是「记忆」。模型可以管理自己的记忆,能不能说说为什么这很重要?它让模型具备了哪些能力? 对了,重复一下问题:模型可以管理自己的记忆,并处理那些需要长期规划的任务。 Dario Amodei: 是的,这点非常有用。我们发现一个特别有趣的例子是在「宝可梦」任务中,模型可以记住自己的状态。当然,这不仅仅适用于宝可梦。 我觉得这很棒,因为模型现在也像人类一样:当我思考时,我会写笔记,然后以后再查看那些笔记;有时我还得做一些中间步骤。模型在推理时也会进行某种程度上的「中间演算」。 但不是所有的推理过程都能塞进一个草稿区里。比如我还会做演示文稿、写不同的文档。所以模型也一样:它需要创建文件、处理这些文件、加载数据,并且能够无缝地交错进行这些步骤。 我们现在的一个新功能就是「交错推理+执行行动」。其中一些行动可能包括存储数据、调用数据。 这些模型逐渐具备的能力,正在逐步接近人类拥有的操作能力,我认为这是一个非常正确的方向。 Mike Krieger: 在我使用 Claude 4 的过程中,有一个让我大为震撼的时刻。我们有一个「待办事项清单 + 草稿区 + Claude Code」的组合,看着它一步步处理 todo 列表,然后在思考过程中还会添加新的任务,把完成的打勾,把不相关的划掉—— 这真的模拟得非常像人类自己管理工作和思考的方式。 而且它还能交替进行推理和工具使用。 今天早上我在 MacStories 上看到一篇文章,说 Claude 被当作一个 MCP 使用,它在请求 VAC 和 MCP 服务器时碰到了速率限制,模型就推理出「我大概是触发了限速,不如试试别的方式」。它能一边推理,一边调整策略,这种工具使用能力非常强大。 我想聊聊「向上的竞赛」(race to the top)这个话题——通常人们认为安全和能力是矛盾的,但你的观点恰恰相反:这两者可以并行发展。这点让我很受启发。 Dario Amodei: 这是我加入这个团队的原因之一。我们讲的「向上的竞赛」不仅适用于日常的商业实践,也适用于 AI 的宏观发展方向。我们跟很多客户沟通过,他们非常关心模型行为的可预测性和可信性。 这也正是我们长期努力的目标之一:确保模型在更广义上能保持与人类意图一致。这两者是相辅相成的。我们也一直希望在合理、负责任的前提下,为社区提供一些工具。比如 MCP 就是个例子。 我自己也对 MCP 被大家迅速接受感到惊讶。我们是在去年 11 月发布的,一开始反响并不大。但三四个月之后,它已经成了事实上的标准。 又一次有那种「坐在太空船上」的感觉——高速离开地球,时间不断加速。你想想以前比如 USB 之类的标准,或者 90 年代、2000 年代的一些标准,要花几年时间才能被大家接受。但现在,跟其他用 MCP 的团队交流时,他们也表示不想拖慢这个进程。虽然希望有一些方向指引,但大家觉得「这就像瓶中闪电」,不想错过。 Mike Krieger: 我们要确保它成为新协议,成为各个Agent互操作的标准。说到「向上的竞赛」,我很喜欢你写的那篇关于「可解释性紧迫性」的文章。你有神经科学背景,能不能谈谈你怎么看可解释性和机器智能的共同演进? Dario Amodei: 是的,大约十年前,很多人都以为神经科学能指导 AI 的发展。事实上,现在这个领域有很多前神经科学家,我也不是唯一一个。有些实验室的负责人也有类似背景。 我发现从高层来看,神经科学确实能提供一些灵感。但我不能说,「啊,我们从下丘脑学到的某个机制可以直接用于构建 AI 模型。」大部分工作其实都是从零开始做的。 但有趣的是,趋势反而是反过来的:我们通过可解释性研究能「看清」模型内部的运作方式。虽然模型和人脑的结构显然不一样,但我们在模型中发现的一些概念模式,有时会在神经科学研究中被「复制」出来。比如 Chris Olah 团队中的一位研究人员通过模型可解释性发现了视觉系统中的高频和低频特征探测器。 然后过了几年,一位神经科学家在动物大脑中也发现了类似的机制。又比如视觉模型中,会有一条路径更偏向处理颜色,另一条路径则处理亮度或物体边界。这些区分看起来像是世界本身的「自然结构」。任何一种抽象学习系统,不管是人工的还是生物的,都可能得出类似的结论。 Mike Krieger: 真的很有趣。我很好奇你们那篇「电路论文」最终会如何影响神经科学领域。那我们来看看 5 到 10 年的时间范围,尽管在 AI 领域,可能「一年就等于五年」。你觉得第一家只有一个人却能创造十亿美元营收的公司,会在什么时候出现?2026 年? Dario Amodei: 我觉得没问题。我也想给在座各位一些建议,关于如何用 Claude 构建未来一年的产品——如何在前沿领域开展建设。 当然,你可以说很多关于模型使用的具体建议。但现在这个「时间加速」的时代,几乎所有建议都会被一句话淹没,甚至只需要两个词:大胆一点。构建一个超出你原本认为可能实现的东西。 即使它现在还无法完全实现,下一代模型就要来了——现在是三个月更新一次,很快可能两个月、一个月就有更新。到今年年底,我可能都要建议:「今天别建任何东西,我们今晚就有新模型发布了。」 Mike Krieger: 我之前和一位创业者聊过,他两年前就开始做自动化编程 Agent 的公司,他尝试过市面上所有模型,但产品始终不太行。直到 Claude 3.7 发布,他说,「现在我的创业项目终于能跑起来了。」 这说明,一些原本困难的任务,突然就能实现了。 Dario Amodei: 有时候「撞墙」也未必是坏事。你把其他部分都准备好了,只差模型这一块。当模型能力到位时,你的系统反而比所需更健壮,这反而是件好事。 所以我虽然总开玩笑说「等下一个模型」,但如果你正在做的事情「几乎」是可行的,而不是遥遥无期的那种,那么坚持撞墙其实是有价值的。 Mike Krieger: 我们在内部研究时也遇到类似的事。我们的「高级研究 + Claude 能力」团队做过一个原型,当时模型对工具使用还不太行。但到了 Claude 3.7,尤其是 Claude 4,我们发现它在高级研究任务中表现非常好。那是因为我们一路上在尝试、在失败。 Dario Amodei: 就像你要把自己的初创公司当成是对下一代模型的「投机性执行」。我非常喜欢这个说法。 Mike Krieger: 是的,说得太对了。最后一个问题:对我们这些不是 Dario 的人来说,很难想象 AI 在过去几年取得了多么惊人的进展。那么你对接下来一年、以及未来五年最期待的是什么? Dario Amodei: 在接下来一年里,我觉得「代码」这方面会出现很多令人惊艳的进展。 我们现在有了 Claude Code、有了编程模型,接下来就是构建「Agent 团队」。这会对世界产生很有意思的影响。 我觉得我们其实还没有认真思考过一件事:当「写软件的成本」大幅下降时,经济和商业结构会发生什么? 以前有个默认假设:只有几百万用户的软件才值得开发,或者至少也得有几万用户。你不会为某个活动单独开发一整套软件——最多凑合做个小工具。但如果写一个程序只需要 20 美分、几秒钟,你就可能说,「我们来做个工具,专门为这个活动服务,调整一下视觉效果。」 Dario Amodei: 当软件可以按需、低成本、一次性创建时,整个世界都会不同:开发者的角色、企业的角色、创业公司的角色,乃至用户的体验都会变得不同。而这一切我们现在还没有答案。 从五年时间维度看,我还是要回到生物学。我觉得生物医学不会在一年内彻底革新,因为这领域进展缓慢。但我希望,五年后我们能彻底战胜一些现在仍存在的疾病。 Mike Krieger: 我就把这作为今天的收尾吧。可惜我们得结束了,我感觉还可以再聊 40 分钟。首先感谢 Dario 今天和我们分享。谢谢你,Dario。也感谢现场和通过直播观看的所有人。 差点忘了,还有一件事。作为对今天所有 Code with Claude 线下参与者的特别感谢,我很高兴宣布:大家将免费获得高级订阅体验。请注意查收。 我尤其喜欢将 Max 与 Claude Code 一起使用,希望你们也能尽情发挥。 祝大家在接下来的环节中收获满满,欢迎来到 Code with Claude!感谢大家的到来。 Dario Amodei: 感谢大家的到来。
大芯片和小米YU7,雷军要用技术挽回人心
芯片已经上了手机,YU7 还得再等两个月。 作者|曹思颀 编辑|靖宇 84 天后,雷军再次出现在小米发布会现场。 上一次是在 2 月底的「双 Ultra 发布会」上。彼时的小米风头正盛,52.99 万元起售的小米 SU7 Ultra,两小时大订量便超过了全年目标。小米的市值也达到历史顶峰,接近 1.5 万亿港元。 三个月后,雷军和小米依然是科技圈的顶流,但潮水的方向不再一帆风顺。过去两个月里一系列的风波,让小米遭受了不少质疑。雷军个人微博也一度暂停更新,他在近期坦承度过了「创办小米以来最艰难的一段时间」。 过去几年,雷军的社媒账号成为了小米公司对外沟通和宣发的重要渠道,雷军的个人 IP 也和小米汽车的品牌形象形成了深度绑定。 但作为一家成立 15 年的科技公司,小米显然不仅仅等于雷军个人的企业家形象。产品和技术,是小米面向消费者可以打出的另一张牌,而且也许是现阶段回应质疑、树立硬科技品牌形象时最合适的一张。 去年 10 月,小米 SU7 Ultra Prototype 征服「绿色地狱」纽北赛道,成为最速四门车,展现了小米在电动汽车领域的技术积累,也继续助力了小米汽车的持续热销。 作为今晚的重头戏,小米历时 4 年自主研发的全新智能手机 SoC 芯片小米玄戒 O1 正式亮相。据雷军介绍,这款芯片采用第二代 3nm 先进制程,投入超过 135 亿元,代表着小米在 15 周岁时,以「后来者、追赶者」的姿态,向硬核科技领域发起全新的探索。而公布了多项配置、即将发布的小米 YU7,则是再次拉高了所有人的期待,现场有媒体同行感叹道,也许真正的「Model Y Killer」就要来了。 更重要的是,无论是造车还是造芯,都体现了小米在过去 4-5 年里两个显著的变化: 第一,不再满足于「性价比」的消费品牌标签,而是坚定地向高端化发起冲击;第二,从创业前 10 年的「商业模式创新」,逐渐过渡和切换到为产品、技术创新,也就是在更多过去未曾尝试的领域里尝试「从 0 到 1」的无人区创新。 01 造芯,小米必须攀登的高峰 发布会上半场的重头戏,是小米首款自主研发设计的旗舰 SoC 芯片:玄戒 O1。 根据官方介绍,这款芯片在 109m㎡的面积里放入了超过 190 亿个晶体管,采用的最新第二代 3nm 工艺制程。 小米玄戒 O1 芯片采用了十核四丛集的 CPU 架构,包含 2 颗 3.9Ghz X925 超大核、4 颗性能大核、2 颗能效大核、2 颗能效小。GPU 方面,采用了 16 核 G925。安兔兔跑分超 300 万,2 颗超大核的多核跑分超越了苹果的 A18 Pro 芯片。 采用 3nm 制程工艺的小米玄戒 O1 芯片 | 图片来源:小米 大芯片研发周期长、投入大。小米自 2021 年重启研发后,共投入了 135 亿元,目前团队规模超过 2500 人,雷军表示这是「在国内排在前三的水平」。2025 年,小米在芯片领域的投入预计就将超过 60 亿元。 只有少数厂商才能自研芯片,极少数才能达到先进制程。以苹果为例,它们自研的 A 系列和 M 系列芯片,对苹果手机、电脑长期占据高端市场的份额非常关键。 「造芯」风险与机遇共存,小米曾经的澎湃系列芯片也就遭遇挫折。最核心的难处在于,这是一个重投入+强规模效应的赛道。雷军在发布会上介绍,由于智能手机更新迭代速度快,大芯片业务的「生命周期」往往很短。这就要求需要很大的终端产品出货量,才能摊薄研发成本。「1-2 年内,卖到上千万台,才可以生存。」 并且,除设计外,芯片在制造、封测等环节往往还需要全产业链的共同配合。而这些环节在如今的全球多变的地缘环境下,也面临着多重不确定性的考验。 雷军表示,玄戒「大芯片」项目在 2021 年初立项,几乎和小米汽车同时立项。在启动研发支出,就定下了 3 个关键目标:要做高端芯片,要采用最先进的工艺制程、要拥有第一梯队的性能表现。 首批搭载玄戒芯片的,有 3 款终端产品,分别是:小米 15S Pro、小米平板 7 Ultra 以及小米 Watch4 eSIM。 其中,小米 15S Pro 除搭载玄戒 O1 芯片外,相机采用光影猎人 900+IMX858 潜望+JN1 超广徕卡三摄,小米第四代影像处理器,支持全焦段 4K 夜景视频。此外,还升级了 UWB 超宽带技术,支持轨道交通无感过闸机,以及 UWB 车手互联。小米 15S Pro 起售价为 5499 元(16GB+512GB),享受国补后 4999 元起步。 小米平板 7 Ultra 在玄戒 O1 芯片的加持上,提升了在 4K 视频剪辑、Raw 格式修图、重度游戏等专业场景下的表现,并且带来了更出色的画质表现。14 英寸的小米平板 7 Ultra 起售价为 5699 元(12GB+256GB),享受国补后起售价 5199 元。 小米 Watch 4 eSIM 带来了一些新的惊喜。因为它搭载的玄戒 T1 芯片,首次搭载了小米自主研发的 4G 通信基带,支持 4G eSIM 独立通信。通信基带是芯片研发里一个复杂的领域,iPhone 常年被吐槽「信号差」就和苹果搞不定通信基带有关。 据介绍,小米在通信基带上投入了 600+人的研发团队,做了大量复杂的实验室验证以及海量的现网适配。率先在手表芯片里验证这一技术。 芯片对于任何一家科技公司而言,几乎都代表着技术无人区。雷军表示,小米已经做好了长期投入的准备,10 年至少投入 500 亿元,因为「想成为一家伟大的硬科技公司,芯片是绕不开的硬仗,也是必须攀登的高峰」。 02 小米 YU7:96 度超大电池起步,量大管饱! 发布会的下半场,雷军带来了即将上市的小米首款纯电 SUV 车型 YU7 的更多信息。 小米 YU7 车身尺寸分别:长 4999mm、宽 1996mm、高 1600mm、轴距 3000mm,属于中大型 SUV。YU7 的中文读音为「御 7」,寓意「陆地战车,御风而行」。新车在设计上延续了小米 SU7 的风格,继续强调优雅造型与高性能。同时,作为一款 SUV 车型,也会对大空间及科技、豪华体验进行补强。 本次,小米带来了宝石绿、钛金属色和熔岩橙 3 种全新配色,加上此前发布的寒武岩灰,小米 YU7 目前已经公布了 4 种外观配色。雷军表示,「还有 5 个配色」等着大家。 内饰方面,最大的亮点在于小米天际屏全景显示 HyperVision。它的显示效果类似于 HUD(抬头显示技术),但又不完全相同。最核心的区别就是可以在前风挡最底部形成一个贯穿的 1.1 米超宽、超视网膜级高清显示,是智能电动汽车在「彩电」(显示)领域的一种全新产品形态。 小米 HyperVision | 图片来源:视频截图 通过这块超宽的「屏幕」,小米 YU7 可以支持更智能的交互体验。例如,主驾正前方显示时速等关键信息,起到传统实体时速表的功能;正中间显示导航地图等信息;副驾正前面则显示和音乐播放等相关的娱乐功能。值得一提的是,在转向时,主驾前方还可以调用车身两侧的补盲摄像头信息,显示后方画面。 同时,小米 YU7 带来了前排双零重力座椅的配置,为主驾在停车时带来更好的休息体验。后排座椅支持最高 35°的电动调节。 作为一款纯电车型,小米 YU7 这次在续航上为用户带来了不小的惊喜。最大的亮点在于:全系搭载 800V SiC 平台,全系搭载「超大电池」(96.3 度起步),全系超高续航。 具体来看,小米 YU7 三个版本的电池信息分别是: 小米 YU7(标准版):搭载 96.3kWh 磷酸铁锂电池,续航里程 835km,全中大型纯电 SUV 续航第一 小米 YU7 Pro:搭载 96.3kWh 磷酸铁锂电池,续航里程 770km 小米 YU7 Max:搭载 101.7kWh 三元锂电池,续航里程 760km。同时,Max 版本支持 5.2C 充电倍率,10%-80% 充电最快只需 12 分钟,15 分钟最多补能 620km。 辅助驾驶方面,小米 YU7 搭载英伟达全新 Thor 芯片,同时搭载了激光雷达、4D 毫米波雷达等一系列感知硬件,并且以上智能化硬件配置全系标配。 小米 YU7 一系列「量大管饱」的标配 | 图片来源:小米 小米 YU7 共分为标准版、Pro 和 Max 三个不同的版本,三个版本在电池容量、辅助驾驶硬件上差别不大,其他如 CDC 连续阻尼可变减震器、小米天际屏全景显示等舒适、智能化配置也都标准。三者更核心的区别体现在和「驾驶」有关的层面。具体来说,标准版为单电机后驱、Pro 版为双电机四驱、Max 版本则为双电机高性能四驱(拥有更高的零百加速)。 唯一遗憾的是,今晚雷军并没有公布具体价格,甚至连普通车企习惯的「预售价」也没有公布,把悬念留到了上市的最后一刻。从整个发布会流程上可以看出,YU7 仍然将特斯拉 Model Y 作为了重要的竞争对手。目前,特斯拉 Model Y 在国内的官方起售价为 26.35 万元。2024 年,Model Y 在国内市场销量超过 48 万辆,是所有能源形式里的销量第一。 其实,无论是造车还是造芯,都要经历长期的投入并穿越漫长的周期。用雷军的说话,15 岁的小米正在重新以「后来者」和「追赶者」的姿态,向硬核科技领域发起全新的探索。 *头图来源:直播截图
雷军宣布小米YU7全系标配激光雷达!强调了11次“安全”
一凡 发自 北京 智能车参考 | 公众号 AI4Auto 1场发布会,雷军强调了11次安全。 小米YU7有“四重制动安全机制”,“更安全的制动性能”,“进一步保证电池安全”,“50项被动安全性能开发测试”......为了安全,辅助驾驶套件更是全面强化: 全系标配激光雷达、4D毫米波雷达、英伟达Thor-U,更清晰的摄像头。雷总介绍,这就是为了让“驾驶更安全”。 其他方面,小米YU7在空间、续航和性能等关键参数上,全面对标Model Y,实现领先。 入门就是835km续航,参数比Model Y更亮眼,三个版本与Model Y全面对齐,小米YU7的价格区间呼之欲出。 小米耗资135亿,首款自主研发设计的SoC玄戒O1也同台亮相,出道即巅峰,性能表现追着苹果旗舰芯片A18 Pro打,结果出人意料。 YU7内饰,与SU7大不一样 小米YU7的外观早已曝光,5米车长,延续了SU7的设计风格,相比SU7多了宝石绿和钛金属等配色,一共有九种配色。 门把手则改成了电动内翻门把手,不再是半隐藏式,人一走近会自动弹开,上车后会关上: 全车搭载了10组贯穿式风道,这真风道: 车身强度也有所提升,雷军强调YU7全场景的被动安全的性能测试多达 50 多项。 然后进车看内饰,有三种颜色可选: 首先来到前排,可以看到中控台的风格和小米SU7大不一样,没有了那些实体按键,整体看着很有主流奶爸车的感觉。据雷军透露,底盘也会相对SU7软一些,会搭载闭式双腔空气弹簧。 前排座舱增加了“天际屏”,1.1米超宽显示,应用了全景全面投影技术,雷总介绍“不是简单地做了一块屏”。 当你开车时,主驾方位能显示关键状态信息,副驾则显示的是娱乐信息。 转向时还能给你补上盲区影像,这也是为了安全考虑: 座舱芯片不是高通骁龙8295,而是高通第三代SoC: 前排是双零重力座椅,支持123度调节,可以一键躺倒: 然后是后排,新增了控制屏幕,据说可以拆卸,像个小手机。 据雷总介绍,在1.88米假人测试下,YU7的前排和后排空间超过了Model Y和保时捷卡宴。 Model Y一上PPT,YU7的价格参考就有了。 小米YU7的三电表现和价格预测 这次没有发布具体价格,但雷总透露目前规划了三个版本,和老款Model Y设计的版本对齐,也就是有两款四驱车型: 标准续航版搭载了96.3度磷酸铁锂电池包,续航达835km,四驱版同规格磷酸铁锂电池包的续航为770km,三元锂电池包的续航为760km,雷军介绍标续和四驱版在中大型SUV中都排名第一。 YU7全系搭载了800V,15分钟补能620km。搭载的电机是小米超级电机V6s Plus,转速提升到了22000rpm。 百公里加速达到了3.23秒,超过了Model Y性能版。 性能强的同时,雷总还强调了YU7的刹车表现,全系标配了固定卡钳和四重冗余刹车安全系统,时速100km/h下的刹停距离为33.9米。 结合以上信息,最后根据Model Y的价格,推测下YU7的售价: Model Y今年刚刚焕新,后驱价格为26.35万元,长续四驱版价格为31.35万元,目前还没有上市Performance性能版,老款该版本的价格一度为35.49万元。 SU7当年上市的策略是比Model 3便宜3万,假设YU7延续该策略,预计价格区间很可能在23.35-32.49万元左右。 不过这不大可能,因为相比SU7,YU7仅辅助驾驶套件成本就提高了不少,全系标配激光雷达、4D毫米波雷达和英伟达Thor-U。所以,YU7的起售价预计可能会突破24万元。具体如何,要到7月份才会最终揭晓,也期待雷总连夜SHUI服高管,来个惊喜。 以上就是小米首款SUV YU7的主要亮点,这原本应该是小米此次最受瞩目的产品。 玄戒双芯上市,小米自研基带曝光 砸了135亿,低调研发4年后,玄戒O1正式发布,首发15S Pro。 玄戒O1是小米首款自主研发设计的旗舰SoC,采用了第二代3nm制程,集成190亿个晶体管,据介绍性能一举迈入国际领先水平,安兔兔综合跑分突破300万。 一颗SoC一般由CPU、GPU、ISP和基带等多个部分组成,首先来看玄戒O1在CPU方面的表现,单核跑分略逊于苹果目前最顶尖的A18 Pro芯片,多核跑分超越。 能耗方面,雷总分别在高性能(比如打游戏)和日常使用等不同场景下,对比玄戒O1和A18 Pro的表现,结果相差不大。 GPU方面,跑分超过了A18 Pro。 打主流MOBA游戏(王者荣耀等),发热控制的也更好。 此外,由于玄戒O1搭载了ISP v4影像处理器,小米15S Pro的拍照效果也有所提升。 玄戒O1这颗SoC的其他组成部分,雷总在发布会没有提及。只是在介绍另一颗小芯片玄戒T1时,提及目前小米自研了4G基带。 其他方面也是一笔带过,旗舰新机加旗舰芯片一共仅用时25分钟不到就讲完了,编辑部的小伙伴和大家一样疑惑: 最后来看下价格,同等内存规格下,16GB+512GB版本比15Pro最早的上市价便宜了300块,1TB版本则便宜了500块。 据雷总透露,玄戒O1装机量如果只有100万台,平摊下来,不算制造成本,平均每颗芯片的研发成本就高达1000美元,约合人民币7210元。 这种情况下,手机价格连芯片成本都覆盖不了。介绍完成本后,雷总就问大家: 你听懂了吗? 诶,你听懂雷总什么意思了吗?听懂的朋友请把答案打在评论区。 One More Thing 实际上,玄戒O1并不是小米第一次发布SoC,8年前小米曾发布过小米澎湃S1,制程为28nm。 此后由于种种原因,小米暂时转向研发小芯片,但把火种保留了下来,在2021年也就是小米宣布造车那年,同期低调重启了自研SoC,到今天石破天惊,一鸣惊人。 很多网友疑惑,小米手机还会继续用高通骁龙芯片吗? 根据高通官方消息,会。 据了解,双方在5月20日已经续签了下一阶段的合作,发布了联合公告,有三点值得关注: 小米旗舰机未来多代仍会搭载骁龙芯片 今年小米仍会首批搭载高通的旗舰产品 在雷总看来,今天的小米已是全球科技领军企业。
梁文锋的新想法,DeepSeek的新方向?
作者孙建楠 编辑袁畅 梁文锋,又有了新动向! 这个在几年前创立深度求索公司,推出DeepSeek大模型的年轻人,在2025年初震动了中国上下。 但在这前后,他都始终保持着低调,一如他率领的那个推出DeepSeek大模型的AI技术团队——除了偶尔崭露头角的论文,业界对他和他们的了解,并不比半年前多了多少。 但可以想见的是,这支团队一定在默默的发力,持续攀登新的高峰。 日前,一则不起眼的招聘信息,或许透露了这支年轻团队的一个新方向。 ——医疗。 DeepSeek招聘医疗实习生 资事堂注意到:DeepSeek的母公司深度求索公司日前在招聘平台持续发力人才引进。 除了常规的算法研究、程序设计等领域。2025年5月,在不少实习生招聘平台上都出现了“DeepSeek招聘数据百晓生(医疗方向)实习生”的需求。 按照相关招聘要求,这个实习生岗位,需求是医学背景的本科高年级和研究生。 一周工作四天以上,实习工资日薪超过500-580元每天。 以此累计,正常的“满勤”实习生,每月大概率收入过万元。 独特的“数据百晓生”岗位 “数据百晓生”是梁文锋团队长期招聘的一个岗位。 早年,他创立的量化投资团队“幻方量化”就长期招聘这个岗位,如今的AI公司深度求索(后简称,DeepSeek团队)也在招聘这个岗位。 在最新的招聘需求中,DeepSeek团队提到: “我们相信,AGI 是数据x算法x算力的完美实践,是科研+工程+组织的优雅艺术。 我们正在寻找并长期培养优秀的数据百晓生,与我们一起进行高水平的科学研究和工程实践。如果你对AGI有浓厚的兴趣,如果你想在一个充满挑战和机遇的初创环境中展现你的才华,那么请不要犹豫,加入DeepSeek,与我们共同在AGI征程上“深度求索”吧!” 来自对该岗位有所了解的人士的信息,所谓的数据百晓生岗位,其重要工作就是通过完成文本语料标注等工作,并与AI工程师进行合作提升大模型的能力和反馈质量。 这个岗位既是模型的tutor(导师),通过对涉及模型的能力解构建构、评估流程建设、训练数据准备等,教会模型在各个方面的能力,对齐人类的偏好。也是模型和产品的桥梁,更是AI原生世代的管培生,备受深度求索公司重视。 新的“方向” 无论是梁文锋早期的业务重心量化投资,还是如今的大模型,都包含着“机器学习”、“人工智能”的技术特征。因此,他对数据的重视可想而知。 而承担“模型和产品的桥梁”任务的数据百晓生岗位,正是处理数据的一线岗位。他们受到重视当然可以理解。 而这些岗位的下一步“微妙变化”,也某种程度透露出,DeepSeek团队下一步的发力方向。 资事堂查阅了相关岗位的招聘要求,直到一年前,深度求索招聘的“数据百晓生”,当时的招聘启事显示,应聘者“专业不限,实习经历不限,欢迎各个专业的同学”。 而显然,这次的“医疗方向”实习生,包含了不一样的设定和需求。 盯紧“医疗专才” 通过,深度求索公司最新招聘需求,外界可以发现,该团队对相关实习生的要求并不是以往的“泛泛而谈”,“热烈欢迎”。 在数据百晓生(医疗方向)的招聘需求里,相关实习生的招聘门槛,包括: 其一,医学专业背景,本科高年级或者研究生学历; 其二,对于语言模型有深入使用经历,对模型的回答质量有自己的审美; 其三,会写python代码,擅长撰写大模型Prompt; 显然,这个入选要求是医学专业+代码能力。 入职后,具体做什么呢? 深度求索在招聘信息中指出: 和研发人员一起,提升DeepSeek的医学方向的专业能力;包括但不限于:提升模型对医学知识的掌握,专业化医疗咨询问答,减少医学问答的幻觉,提升联网搜索体验等等。 AI医疗“方兴未艾” 另外一个关键信息值得注意:DeepSeek招聘的上述职位是医疗方向,并非医药方向。 通常,医药侧重药品,围绕“用什么治”,而医疗则侧重“怎么治”,涉及诊断、治疗、护理等医疗服务。换言之,在DeepSeek的发力方向上,医疗(治疗和服务)这块的投入优先级更高。 事实上,在年初DeepSeek爆火之后,确实有不少大型医药机构和主管部门开始积极将AI应用于医疗环节中。 中国科技部主管的中国科普网,在2025年3月发文称:据不完全统计,DeepSeek已经在全国范围内的超90家知名三甲医院实现部署。其中,“三甲医院”是中国医院等级评审中最高级别的医院,代表医疗水平、服务质量和管理能力均为最优。 此外,一篇题为《DeepSeek重塑中国三甲医院医疗体系》的英文分析文章,提及了多家知名医院的案例。 其中提及:上海瑞金医院实现病理组织切片自动分析,每日处理3000张切片,支持与影像/基因等多模态数据联合诊断。 又如:深圳华南医院则运用于泌尿科AI系统快速检索证据,并生成个性化治疗方案。 再如:柳州人民医院实现了自动化细胞识别与血象分析。 这些积极的运用案例,是否是DeepSeek未来会加强医疗方面人工智能研发的一个原因? 解决“医学问答幻觉” 此外,在DeepSeek此次招聘中,还提及一项总要的工作内容描述——“减少医学问答幻觉”。 这也非常令人关注。 实际上,人工智能工具出现后,通常用户会遇到“幻觉”问题,即AI生成虚假、误导或捏造的信息。 显然,由于事关大众健康,医学方面的幻觉,其副作用更大。 一些研究文章显示,医疗领域的“幻觉”表现通常包括: 用户咨询症状、药物、治疗方案时,AI虚构医学数据,并给出错误诊断建议等情形。 也就是:AI在问诊者面前“信口开河”,但又显得老神在在,另询问者无从分辨。 此前,华南一家都市报曾提及:一家医院的接诊医生遇到,被大模型幻觉耽误了救治的儿童父母。了解后发现,在孩子初发症状之时,其父母通过手机端AI问诊平台自行判断为“普通呼吸道感染”,并参考网络建议居家用药。结果导致孩童肺部炎症范围扩大的情形。 一些权威医疗杂志也提出过类似关注。《中国卫生杂志》在今年3月刊文提出:“医院借助AI看病,误诊了谁负责?”的疑问和讨论。 如果上述招聘信息背后确实是DeepSeek正在努力发力医疗方向的人工智能的话。那或许也是国内AI机构积极介入、有所作为,让科技更好服务社会和大众的一个尝试。
小米玄戒O1,十核3纳米,平平淡淡才是真
雷军说他交出了第一份芯片答卷:玄戒(XRing)O1,190亿晶体管,台积电二代 3nm 制程,ARM十核架构。 小米造芯,迈出了第一步,“力争跻身第一梯队旗舰体验”,玄戒O1将用于小米15S Pro手机和7ULtra平板。 雷军前两天在社交媒体上发文,讲述了小米研发芯片的经过:四年多时间,截止今年4月底,玄戒累计研发投入已经超过了 135亿人民币。目前,研发团队已经超过了2500人,今年预计的研发投入将超过60亿元。 雷军表示,“我们深知造芯之艰难,制定了长期持续投资的计划:至少投资十年,至少投资500亿,稳打稳扎,步步为营。” 那么,在真正实现自研SoC的道路上,小米目前处于什么位置。 在芯片领域,“自研”的定义存在不同层级。完全自研,是指CPU/GPU 架构自主设计(如苹果 A 系列、高通 Kryo/Adreno)。部分自研是基于 Arm 公版 CPU/GPU,但定制 NPU、ISP 或基带(如联发科天玑)。还有贴牌整合,直接套用 Arm 全套 IP(如早期国产手机芯片)。 玄戒O1 公布的信息显示: CPU:Arm Cortex-X925 + A725 + A520(全公版)。 GPU:Arm Immortalis-G925 MC16(公版)。 其他模块:暂未知(可能自研 NPU/ISP)。 从核心模块看,玄戒O1属于 “部分自研”,接近联发科模式。可以对比一下“自研度”: (1)高通骁龙:自研 CPU+GPU,但依赖 Arm指令集 CPU:Kryo 定制架构(基于 Arm 指令集,但微架构自主设计)。 GPU:Adreno(完全自研,源自收购的 ATI 技术)。 优势:性能与能效优化空间更大,如骁龙 8 Gen 3 的异构多核调度。 (2)华为麒麟:从公版走向完全自研 早期:麒麟 9000 采用 Arm Cortex-A77(公版 CPU)+ Mali-G78(公版 GPU)。 现在:麒麟 9010 使用自研“泰山 CPU”+ Maleoon GPU。 突破点:国产 7nm 工艺 + 自主 NPU(达芬奇架构)。 (3)联发科天玑:Arm 公版 + 自研 APU CPU/GPU:Cortex-X4 + Immortalis-G720(全公版)。 差异化:自研 AI 处理器(APU),优化能效比。 玄戒O1依赖Arm公版核心,需靠NPU/ISP等模块实现差异化。若未来推出自研CPU/GPU,才能对标高苹果/高通/华为。 所以,雷军说:“但面对同行在芯片方面的积累,我们只能算刚刚开始。” 尽管如此,玄戒O1还是取得了性能与能效上的一些突破:CPU采用独特的 “2+4+2+2”十核四丛集架构,包含2颗3.9GHz超大核、4颗3.4GHz大核、2颗1.89GHz中核和2颗1.8GHz小核,最高主频达3.9GHz,使其在多任务处理和复杂计算场景中表现卓越。 小米要走向更大的自主性,还面临着一系列挑战,CPU/GPU 设计需要长期投入(高通 Adreno 迭代 10 年,苹果 A 系列打磨 15 年)。Android 生态基于 Arm 指令集,脱离公版需重建软件兼容性(如华为麒麟 9010 仍兼容 Arm v8)。 自研架构流片成本极高(苹果 A 系列研发费用超百亿美元)。 小米的技术选择服务其产品策略,应该是短期内用Arm公版快速量产,在架构设计中寻求差异化,同时通过自研NPU(如澎湃P1/P2 系列技术下放)或ISP(提升影像算法)打造卖点。 厂商如何包装“自研”或“自主”的概念,行业里面有一些话术:华为早期称“自研麒麟”,实际用 Arm 公版,后期才推泰山架构;联发科强调“天玑旗舰”,但注明“Arm Cortex 核心”。小米可能强调“自研SoC”,实际上是“基于 Arm 架构”。 厂商能打出自研或自主的话术空间,关键在于普通消费者更关注“性能提升”而非架构来源,只有少数极客和竞品才会紧盯严谨的“自研”定义。 玄戒O1是小米芯片之路的 “必要过渡”,但只有推出自主 CPU/GPU 架构,才能真正称为“国产旗舰芯片”。雷军已经放话,未来10年至少投入500亿元,目标应该是决心推出真正自主的CPU/GPU架构。 不管怎么说,小米迈出了第一步,而且在朝着技术生态最完整的科技企业迈进:芯片、手机、汽车、制造。
“非洲手机之王”竺兆江,四年财富缩水百亿
雷达财经出品 文|孟帅 编|深海 在非洲“闷声发大财”的传音控股掌舵者竺兆江,正经历财富版图的剧烈震荡。 在胡润研究院发布的《2025胡润全球富豪榜》中,竺兆江以155亿元的财富位列第1796名。但相较2021年高达260亿元的财富巅峰,其身家在四年间缩水105亿元。 在国内鲜为人知的传音,其实是非洲家喻户晓的手机品牌。而传音在非洲能有今天的成绩,身为创始人的竺兆江功不可没。1996年,竺兆江以波导基层业务员身份开启职业生涯,凭借敏锐的市场洞察力与卓越销售才能迅速崭露头角。 2006年,因开拓非洲市场的提议未获支持,竺兆江毅然选择单飞,创立传音控股。通过一系列本土化的技术创新及精准的营销宣传,传音成功撬开这片潜力巨大的市场,一跃成为“非洲手机之王”。 然而,光环之下,竺兆江掌舵的传音控股正陷入业绩与资本的双重泥沼。2024年,公司营收与归母净利润增速显著放缓。2025年第一季度,这两项核心指标更是双双负增长,毛利率也持续承压。 尽管传音在全球及非洲市场仍占据重要地位,但在引以为傲的非洲市场,传音正面临小米、OPPO等品牌发起的猛烈攻势,其市场份额与毛利率因此受到一定的冲击。而在资本市场上,传音控股年内股价下跌超两成,较历史高点更是惨遭“腰斩”。 四年缩水105亿,竺兆江遭遇财富“滑铁卢” 作为财富领域的权威风向标,胡润研究院每年发布的《胡润全球富豪榜》,向来是外界观察全球富豪财富动态的重要窗口。在这张备受瞩目的榜单上,来自不同行业的富豪们命运各异,有人因财富暴涨风光无限,也有人因资产缩水陷入低谷,财富的起伏与时代浪潮相互激荡。 在不久前揭晓的《2025胡润全球富豪榜》中,52岁的传音控股掌舵人竺兆江以155亿元财富位列总榜第1796名的位次。 回看历年的《胡润全球富豪榜》,竺兆江的财富轨迹犹如过山车般跌宕起伏。2020年,竺兆江以100亿元财富首次跻身榜单,精准卡位第2000名,正式踏入全球亿万富豪之列。 次年,他的财富迎来爆发式增长,飙升至260亿元,较前一年增加160亿元。这一年,风头无两的传音控股化身“造富机器”,不仅让竺兆江站上财富新高峰,还将阿里夫・乔杜里、刘仰宏、严孟一同送上榜单(财富均为70亿元)。 然而,财富的浪潮从未停歇。此后几年,竺兆江的财富经历剧烈震荡。与2021年登上《胡润全球富豪榜》时的巅峰时刻相比,今年他的财富缩水105亿元。 雷达财经梳理发现,在今年的《胡润全球富豪榜》中,云集了多位来自消费电子行业的大佬。在这场财富较量中,竺兆江的155亿元虽与小米创始人雷军的2200亿元相差悬殊,但与OPPO陈明永的185亿元仅一步之遥,更是与vivo沈炜财富持平,甚至超越了华为创始人任正非的130亿元,在高手如林的行业中牢牢占据一席之地。 竺兆江能在富豪榜站稳脚跟,其财富密码在于他一手缔造的传音控股。这家在国内略显低调的企业,在海外市场却书写着传奇。据传音控股此前发布的财报显示,其控股股东为深圳市传音投资有限公司,实际控制人为竺兆江。 截至去年末,深圳市传音投资有限公司持有传音控股49.15%的股份。另据天眼查显示,竺兆江持有深圳市传音投资有限公司20.68%的股份。据此计算,竺兆江于传音控股的持股比例约为10.16%。 不过,据同花顺iFind显示,相比截至2019年3月29日时的11.73%,竺兆江的持股比例在近几年不断下调。 目前,竺兆江身兼传音控股董事长与总经理双重职务,且已取得其他国家或地区居留权。2024年,他从公司获得的税前报酬总额为784.31万元。 凭借传音控股实际控制人的身份,竺兆江不仅坐拥百亿财富,还可通过分红收获不菲的收益。同花顺iFind显示,自2019年上市以来,传音控股累计现金分红8次,累计现金分红数额高达123.18亿元,分红率超过54%。 竺兆江另辟蹊径,炼成“非洲手机之王” 在国内智能手机市场的喧嚣中,不少消费者可能未曾听说过传音的名字。但在远隔万里之外的非洲地区,传音可以算得上是家喻户晓的手机品牌。而站在传音背后的传奇人物,正是创始人竺兆江。 不过,竺兆江为人低调神秘,极少出现在公众视野。1973年,竺兆江在浙江宁波奉化出生。1996年,从南昌航空大学毕业的竺兆江,带着对未来的无限憧憬踏入职场。 彼时,国内手机行业刚刚萌芽,波导作为新兴手机制造商正广纳贤才。竺兆江果断抓住机遇,从销售传呼机的基层业务员做起,就此开启了他波澜壮阔的商业征程。 在波导工作期间,竺兆江的销售天赋与勤奋展露无遗。他深入市场一线,细致入微地了解消费者需求,并不断优化销售策略。凭借出色的表现,初出茅庐的他短短数月便登上公司销售冠军的宝座。此后,他更是仅用三年时间,便实现了从基层业务员到华北区首席销售代表的华丽转身。 2003年,年仅30岁的竺兆江升任波导销售公司常务副总经理,并主动请缨开拓海外市场。在他的带领下,波导手机在海外市场迅速打开局面:2005年前后,波导手机出口量高达600多万台,稳稳占据中国手机出口榜首的位置。 海外市场的开拓经历,让竺兆江将目光投向了充满无限潜力的非洲大陆。当时的非洲,虽然手机普及率较低,但庞大的人口基数、逐步发展的经济,使得手机市场需求呈现出迅猛增长的态势,蕴含着巨大的发展机遇。 经过深入的市场调研,竺兆江向波导高层提议加大对非洲市场的投入。然而,他的建议并未得到重视,波导高层认为非洲市场风险高、回报周期长,不愿轻易涉足。 提议被否定后,竺兆江陷入了深思。他坚信,非洲市场对于波导而言是一片极具潜力的蓝海,若不能把握这一机会,将会错失巨大的发展契机。于是,在2006年,竺兆江毅然决定离开波导踏上创业之路,传音控股由此诞生。 为了能在非洲市场站稳脚跟,竺兆江带领团队深入非洲各地,全面了解非洲消费者的需求。通过大量的市场调研,他们发现了非洲消费者在手机使用过程中的诸多痛点,而这些痛点恰恰成为了传音的市场突破口。 针对非洲消费者的需求,传音展开了一系列极具针对性的产品创新。比如,考虑到非洲人肤色较深,在传统手机拍照时难以呈现出理想效果,传音专门推出了黑人照相美颜功能,通过优化相机算法,让当地消费者也能拍出展现自身魅力的照片。 由于非洲部分地区电力供应不稳定,手机续航成为了消费者的一大困扰。为此,传音推出了多款具备超长待机功能的手机产品,并配备快速充电技术,有效解决了非洲消费者的充电难题。 而在通信方面,鉴于非洲地区运营商众多,消费者常常需要使用多张SIM卡,传音将国内的双卡双待技术引入非洲,并在此基础上进行创新,开发出四卡四待功能,极大地满足了当地消费者的使用需求。 除了产品上的创新,传音还采用了贴近非洲消费者生活方式的营销策略。凭借这些本土化的努力,传音迅速赢得了非洲消费者的喜爱。随着在非洲市场的不断深耕,传音的业务规模持续扩大。 2019年9月,传音控股成功在上交所科创板挂牌上市,这标志着公司迈入了全新的发展阶段。伴随着公司登陆资本市场的步伐,身为幕后掌舵者的竺兆江也成为了富豪榜上的常客。 如今,凭借卓越的产品性能和持续的本地化技术创新,传音在非洲市场拥有远超其他手机厂商的市场占有率和广泛的品牌影响力,被誉为“非洲手机之王”。在巩固非洲市场领先地位的同时,传音还积极开拓非洲以外的新兴市场。 经过多年发展,传音已成为全球新兴市场手机行业的重要力量,旗下拥有TECNO、itel、Infinix等多个知名品牌。2024年,传音手机整体出货量约达2.01亿部,产品覆盖非洲、南亚、东南亚、中东和拉美等全球多个新兴市场。 传音业绩承压,非洲大本营遭雷军们“偷袭” 竺兆江近年经历财富起伏的背后,其掌舵的传音控股当下正经受着业绩增长乏力与资本市场遇冷的双重考验。 财报显示,2024年,传音控股实现营收687.15亿元、归母净利润55.49亿元。两项指标虽仍保持增长态势,但增速大幅放缓。 其中,营收增速从上年的33.69%降至10.31%,归母净利润增速更是从上年的122.93%骤降至0.22%,增长近乎停滞。 而若具体至单季度,传音控股的业绩颓势则表现得更加明显。去年第三季度、第四季度,公司的营收同比分别减少7.22%、9.39%,归母净利润同比分别减少41.02%、0.44%。 进入2025年,传音控股的业绩仍未得到有效的改善。今年第一季度,公司营收同比减少约1/4降至130.04亿元,归母净利润更是暴跌近七成,仅剩4.9亿元。 与此同时,传音控股的毛利率近来也持续走低,从2023年的24.45%降至2024年的21.28%。今年第一季度,该指标进一步降至19.27%。 对于一季度交出的这份并不亮眼的成绩单,传音控股解释称,主要受市场竞争以及供应链成本综合影响,营业收入及毛利额减少所致。 尽管在国内知名度有限,但传音在全球市场占据颇为重要的地位。根据IDC数据统计,2024年传音在全球手机市场占有率达14%,位列第三;在全球智能机市场,传音以8.7%的份额排名第四。 而在非洲主战场,传音更是当之无愧的领军玩家。根据IDC数据统计,2024年,传音控股在非洲智能机市场的占有率超过40%,排名第一。 此外,在南亚市场,传音控股也有着不小的影响力。2024年,其在巴基斯坦智能机市场的占有率超过40%,排名第一;在孟加拉国智能机市场的占有率为29.2%,排名第一;在印度智能机市场的占有率为5.7%,排名第八。 不过,在非洲这片曾为传音带来辉煌的热土上,传音正遭到越来越多对手的“围攻”。在去年9月的中非企业家大会上,小米创始人雷军公开宣布加码对非洲市场的投入。 除了小米,华为、vivo、OPPO等国内手机巨头纷纷将目光投向这片潜力巨大的市场,一场针对传音“霸主地位”的挑战正愈演愈烈。 而这些竞争对手的快速布局已初见成效,传音在非洲市场的“蛋糕”正被逐步蚕食。据Canalys披露数据显示,2024年,小米在非洲智能手机市场的出货量同比飙升38%,以11%的市场份额高居第三。 而OPPO旗下的realme更是以89%的惊人出货量增速强势崛起,凭借5%的份额紧随其后,位列第四;OPPO也凭借4%的份额跻身第五。这些新晋竞争者的迅猛发展,已然对传音在非洲市场的主导地位构成一定的威胁。 在愈发激烈的竞争下,传音控股在非洲地区不仅市场份额遭到冲击,就连毛利率指标也受到影响。2024年,传音控股在非洲地区的营收增速从上年的6.74%降至2.97%,毛利率也从上年的30.97%降至28.59%,同比减少1.46个百分点。 面对困局,传音试图通过多元化战略寻求突破。传音控股在财报中提到,基于在新兴市场积累的领先优势,公司积极实施多元化战略布局,在新兴市场开展了数码配件、家用电器等扩品类业务以及提供移动互联网产品及服务。 不过,相比手机业务,传音控股其他业务的体量目前仍存在明显的差距。分产品来看,去年,公司来自手机板块的收入达631.97亿元,占总营收的比重超过九成,而同期公司来自其他板块的收入仅为42.59亿元。 业绩承压之际,传音控股在资本市场上也遭受“冷遇”。截至5月22日收盘,传音控股报74.5元/股,股价年内下跌21.58%,而较此前168.77元/股(前复权)的历史高点更是已跌去一半以上。 在雷军们的“围剿”下,曾经的“非洲手机之王”传音接下来将如何捍卫自己的领地?雷达财经将持续关注。
突发!美国新法案,10年内禁止监管AI
今天凌晨,TechPolicy消息,美国众议院通过了《HR1》法案,将禁止美国各州在未来10年内监管AI。 在禁止期间,任何州或其政治分支机构不得执行任何监管AI模型、AI系统或自动决策系统的法律或法规。 这个法案的对于微软、OpenAI、谷歌、亚马逊等科技巨头非常重要,彻底打开了枷锁,可以进行更多的AI技术创新尝试了。 其实这个法案通过的也挺玄的,215票赞成、214票反对差一点就没通过。 赞成者表示,该法案将终结美国全国范围内涌现的,很多令人困惑的各州AI法律拼凑局面,让国会有空间制定自己的AI立法,同时保持美国的领导地位。 而反对者认为,这是向科技公司的危险妥协,会让消费者,尤其是弱势群体和儿童失去保护,并废除一系列涉及从深度伪造到自动化招聘中的歧视等众多的州级法律。 「AIGC开放社区」查看了美国国会发布的HR1,内容非常非常多,下面就为大家解读一下关于AI监管部分。其实这个法案全名也挺有意思,HR1—一个伟大漂亮的法案。可以简称“大漂亮”法案~~ 为了构建美国未来十年AI监管的基本框架,其核心内容围绕“暂停州级监管”与“联邦资金引导”展开,通过政策松绑与资源倾斜快速提升美国的全球AI竞争力。 法案明确规定,自颁布之日起的10年内,美国各州及地方政府不得执行任何针对AI模型、AI系统或自动化决策系统的法律或法规。 这一禁令覆盖从算法设计到系统部署的全链条,致使各州现行AI相关监管措施如加州的算法透明度法案、纽约的面部识别禁令等暂时失效。 但法案也为政策留有余地,若州法规核心目的是促进AI部署如简化许可流程、提供税收优惠,或非歧视性适用于所有技术系统如通用数据安全标准则可继续实施,同时允许收取与非AI技术同等对待的合理成本费用如AI系统安全检测费以避免变相歧视。 为配合监管松绑,法案批准向商务部拨款5亿美元,资金从2025财年起可用并持续至2035年,主要用于三项核心任务:一是部署商业AI和自动化技术以替换过时的政府业务系统如税务、社保管理系统,提升数据处理效率与安全性; 二是推动AI与云计算、物联网等技术融合,探索智能政务场景如预测性公共服务、应急响应优化; 三是建立跨机构的AI治理框架,协调国防部、能源部等联邦部门的技术需求以避免重复建设,此举旨在通过联邦示范效应带动私营部门加大AI投资,形成“政策宽松+资金扶持”的产业生态。 但该法案对关键术语的定义为未来执行预留了空间,“AI模型”指通过机器学习、统计算法生成输出的软件组件如GPT类语言模型、图像识别算法。 “自动化决策系统”涵盖任何替代人类决策的AI工具如招聘算法、信贷审批模型但未明确是否包括嵌入式AI设备如智能家居。“州级监管”仅限制“执行”现有法规而未禁止州政府制定新政策。 同时执行细节中强调联邦优先原则,若州法规与联邦法律冲突则以联邦为准,例如,联邦若出台全国性AI隐私法,各州需直接适用而不得保留更严格监管条款。 这个法案也体现出美国为了提升全球AI的领导地位,选择了先发展、后治理”的AI监管策略,希望科技公司能利用好这10年的监管窗口期。 本文素材来源美国国会,如有侵权请联系删除
Claude 4不是大模型,它是第一个能连续上班7小时的AI
在OpenAI 和 Google 接连发布大模型后,Anthropic终于也亮出了底牌。 5月22日,Anthropic在其首届开发者大会上发布了全新一代的Claude 4系列模型,包括旗舰级的 Opus 4、高性价比的 Sonnet 4,以及效率优先的 Haiku 4,同时推出了 Claude Code 开发工具包。它们背后的目标不再只是“更强大”,而是让 AI 成为真正“能干事”的工作搭档。 而这一次,Claude 不再只是对话模型,它开始接近一个具备自主任务执行能力、跨模态推理能力和高安全保障的 AI 系统雏形。 Claude Opus 4:不仅是更强,而是更“能干” Claude Opus 4 是 Anthropic 目前能力最强的模型,甚至在多个维度上超越了 OpenAI Codex-1、o3 和 Gemini 2.5 Pro。 首先是推理深度和持续性。Anthropic 在内部测试中发现,Opus 4 可以在无需人类插手的情况下,连续执行一项编程任务超过 7小时,这对于构建长期自治智能体来说是里程碑式的进展。对比之下,GPT-4 通常只能持续几十分钟。 其次是编码能力。Opus 4 在代码基准测试 SWE-bench 中得分高达 72.5%,超过 OpenAI Codex-1(72.1%)和 Gemini 2.5 Pro(63.2%),成为目前已公开测试中 世界最强的代码大模型。不仅能写函数、改逻辑,它甚至可以理解跨文件结构,进行结构性重构,具备类似“工程意识”的表现。 图:Claude 4 模型在 SWE-bench Verified(真实软件工程任务性能基准测试)上领先 Claude Sonnet 4:高性价比版本,不输旗舰 如果说 Opus 4 是为了大企业和重度用户准备的,那 Sonnet 4 则是 Anthropic 为开发者和中小企业提供的“黄金版本”。 Sonnet 4 的 SWE-bench 编码得分达到 72.7%,甚至略高于 Opus。更重要的是,它在响应速度和成本上做了大量优化,非常适合用于部署到产品工作流中。对于大多数开发者来说,它几乎能满足你 90% 的需求。 图:Claude 4 模型在编码、推理、多模态能力和代理任务方面表现出色。 Claude 的模型也更加“听话”了。无论是长指令、结构化输入,还是格式化输出,Claude 4 系列在遵循复杂指令方面明显优于上一代模型,让它更像一个可靠的助理,而非只会答题的聊天机器人。 Claude Code 工具链:让 AI 真正进开发流程 为了配合 Claude 模型在工程场景的使用,Anthropic 还推出了完整的 Claude Code 工具链,包括 CLI 工具、VS Code 插件、GitHub 集成,未来还将开放 JetBrains 插件。 这意味着 Claude 不只是“能写代码”,更是“能和你一起工作”。它能识别项目结构、补全单元测试、改动多个文件并解释修改原因,逐步变成团队里那个永远在线的“万能实习生”。 引入 AI 安全等级制度,行业首次 当然,模型越强,安全挑战也越大。Anthropic 在发布会上宣布将 Claude Opus 4 定级为 AI 安全等级 3(ASL-3),是目前公开模型中最高的安全级别。 根据披露,Anthropic 在内部红队测试中发现 Opus 4 有能力生成复杂的合成生物设计方案,因而启动了公司级别的“责任扩展政策”,对模型能力进行限制、追踪与加密,并上线漏洞赏金计划与越狱检测机制。 这也是行业首次以“安全等级”形式管理大模型能力,或许预示着未来的 AI 发布流程会更接近“药品审查”或“飞行安全评估”。 结语:Claude 4 是 AI 工具进化的分水岭 过去一年,大模型一路狂飙。但 Claude 4 显示出一个新的方向:AI 不再是惊艳的 demo,而是可以真正做事、协助开发、承担部分责任的“工具合伙人”。 Claude 4 的能力不仅是一次迭代,更是对 AI 应用“落地性”的集中体现。它可以处理现实中复杂、多步骤、跨工具的任务,这意味着我们距离“可控、可靠的 AI 员工”又近了一步。 ChatGPT 还在对话,Claude 4 已经加班。
SpaceX星舰第九次试飞获批:安全区域扩大一倍,最早5月27日发射
凤凰网科技讯 5月23日,美国联邦航空管理局(FAA)正式批准SpaceX星舰第九次试飞,最早将于下周执行。这标志着经历3月份发射事故后,星舰项目重新获得监管部门认可。 FAA在5月22日发布声明称,已批准星舰恢复飞行操作。该机构表示:“FAA对SpaceX星舰第八次试飞事故进行了全面安全审查,确定该公司已充分解决了事故原因,因此星舰飞行器可以重新进行。”不过,FAA并未公开具体的事故原因或SpaceX采取的整改措施。 3月6日星舰第八次试飞,SpaceX官方称星舰上面级遭遇“高能量事件”,导致多台猛禽发动机失效,进而失去飞行器控制。该飞行器最终在加勒比海上空重返大气层。这次失败与今年1月飞行7号任务的情况极为相似。 值得注意的是,FAA采用了与第八次试飞相同的审批策略,即在前次事故调查尚未完全结束的情况下,基于安全风险评估做出“恢复飞行”决定。监管部门认为,SpaceX已满足所有严格的安全、环境和许可要求。 第九次试飞的一个重要变化是安全飞行区域的大幅扩展。FAA在5月15日更新的发射许可中提到,基于前两次发射失败的经验教训,失败概率评估有所上调,因此需要扩大飞机危险区域(AHA)。 新的安全区域从德克萨斯州星舰基地向东延伸约1600海里(2960公里),覆盖佛罗里达海峡、巴哈马群岛和特克斯和凯科斯群岛。相比之下,第八次试飞的安全区域仅为885海里(1640公里),扩大幅度接近一倍。 另一个促成安全区域扩大的因素是SpaceX计划在第九次试飞中首次重复使用此前已发射过的超重型助推器。FAA表示:“基于更新的飞行安全分析,以及SpaceX首次重复使用已发射的超重型助推器火箭的计划,FAA正在扩大美国和其他国家的危险区域范围。” 截至目前,SpaceX尚未公布飞行9号的确切发射时间。不过,FAA在宣布批准发射后随即发布的临时飞行限制显示,SpaceX正准备最早在5月27日执行发射任务。(作者/于雷) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
官方通报35款App违法收集个人信息:涉爱剪辑等多款剪辑App
快科技5月20日消息,今日,国家网络安全通报中心发布《公安部计算机信息系统安全产品质量监督检验中心检测发现35款违法违规收集使用个人信息的移动应用》,通报应用宝中35款移动应用存在违法违规收集使用个人信息情况,涉及爱剪辑等多款剪辑类App。 具体通报如下: 1、未以结构化清单的方式逐一列出收集、使用个人信息规则。涉及12款移动应用如下: 智慧 AI 聊天(版本 1.4.0)、虚拟恋爱 AI(版本 1.1.3)、轻抖(版本 V3.2.400)、剪辑软件(版本 1.1.2)、视频剪辑(版本 26.9.82)、爱剪(版本 V1.0.0)、视频编辑剪辑 cut(版本 1.0.2)、妙剪(版本 1.55)、智能出行(版本 1.0.2)、创游世界(版本 1.56.0)、AI音乐学园(版本 7.1.1)、台铃电动(版本 3.3.5)。 2、实际收集的个人信息超出用户授权范围。涉及18款移动应用如下: 智谱清言(版本 2.9.6)、Wink(版本 2.7.0)、剪印(版本 24.03.26)、抖影视频剪辑(版本 1.2.8)、Pr 视频剪辑(版本 2.7.5)、爱剪辑(版本 80.21.0)、免费剪辑视频(版本 v1.1.8)、剪辑软件(版本 1.1.2)、AI 视频成片(版本 3.2.0)、视频剪辑(版本 26.9.82)、妙剪(版本 1.55)、自律锁机(版本 24.08.10)、画世界(版本 2.9.8)、QCY(版本 4.0.8)、智能出行(版本 1.0.2)、创游世界(版本 1.56.0)、AVmini(版本 4.2.0.12)、小白学习打印(版本 4.17.4)。 3、个人信息保护政策中描述收集的个人信息与业务功能无直接关联。涉及2款移动应用如下: AI 智能秘书(版本 1.0.25)、抖影视频剪辑(版本 1.2.8)。 4、在配置文件中声明与移动应用的所有业务功能均没有直接关联的权限。涉及8款移动应用如下: AI 智能秘书(版本 1.0.25)、智慧 AI 聊天(版本 1.4.0)、AI 对话专家(版本 1.0.17)、QCY(版本 4.0.8)、来音吉他(版本 3.5.8)、台铃电动(版本 3.3.5)、Wow(版本 1.16.5)、猫箱(版本 1.57.0)。 5、申请的可收集个人信息的权限与业务功能没有直接关联。涉及1款移动应用如下: AVmini(版本 4.2.0.12)。 6、提前要求用户授权当前未使用的特定功能所需的权限。涉及2款移动应用如下: AI 剪辑(版本 20.5)、视频剪辑王(版本 1.2.3)。 7、提前要求用户填写当前未使用的特定功能需要的个人信息。涉及2款移动应用如下: 小白学习打印(版本 4.17.4)、台铃电动(版本 3.3.5)。 8、实际收集的个人信息与业务功能没有直接关联。涉及2款移动应用如下: Kimi(版本 2.0.8)、Wink(版本 2.7.0)。 9、实际收集个人信息的频率与业务功能没有直接关联。涉及10款移动应用如下: ChatGreat(版本 1.1.3)、虚拟恋爱 AI(版本 1.1.3)、轻抖(版本 V3.2.400)、免费剪辑视频(版本 v1.1.8)、剪辑软件(版本 1.1.2)、妙剪(版本 1.55)、创游世界(版本 1.56.0)、AVmini(版本 4.2.0.12)、台铃电动(版本 3.3.5)、Wow(版本 1.16.5)。 10、未向用户提供更正或补充其个人信息的具体途径。涉及1款移动应用如下: ChatGreat(版本 1.1.3)。 11、广告存在误导、欺骗用户行为。涉及5款移动应用如下: AI Genie(版本 2.9.0)、虚拟恋爱 AI(版本 1.1.3)、免费剪辑视频(版本 v1.1.8)、视频剪辑王(版本 1.2.3)、视频编辑剪辑 cut(版本 1.0.2)。
娃哈哈代工背后,宗馥莉的品牌与控制权博弈战
最近,关于娃哈哈饮用水代工的新闻在网上持续发酵,几次冲上热搜。 这件事情的起因是有网友发现,自己买到的娃哈哈饮用水其实是由今麦郎等多家企业代工生产的。有人算了一笔账,在某网购平台上,娃哈哈纯净水每瓶596毫升,一箱24瓶的价格为38.9元,统一麦郎纯净水每瓶550毫升,一箱24瓶的价格是27.9元。 对此,不少人质疑,娃哈哈的品牌溢价是不是太高了?还有网友说,都是同一个厂出来的,干嘛不直接买今麦郎? 面对质疑,娃哈哈官方回应因2024年瓶装水市场需求激增导致产能紧张,委托今麦郎代工生产纯净水,合作周期内今麦郎共完成12亿瓶产品交付,但因为质量问题,双方合作于2025年4月终止了。而在5月16日,今麦郎集团董事长范现国在接受新华网专访时表示,今麦郎在与娃哈哈合作代工业务中,始终坚守品质底线,每瓶蓝标水净利润仅为2分钱。 2024年2月娃哈哈创始人宗庆后去世后,女儿宗馥莉接班后,娃哈哈一直处于舆论的风口浪尖。有媒体曝出近半年,娃哈哈一边处于产能不足状态,另一边却在调整各地的工厂。 娃哈哈的代工风波背后,到底还有哪些隐情?代工事件又折射了快消品行业普遍面临的产能调配问题呢? 宗馥莉掌权下的娃哈哈: 停产、代工与股权迷局何解? 娃哈哈的声明中表示,未来将始终坚持自有生产模式。 众所周知,娃哈哈的爆火源于去年3月,有业内人士指出,当时娃哈哈的产能已经不能匹配整个发展。整体去看,从轻资产的角度去做代加工,符合了饮料行业未来轻资产的发展趋势。然而,持续的代工也需要一个稳定的代工体系和合作伙伴,目前看起来也不像。 在出现今麦郎代工风波之前,据《华商报》报道,娃哈哈的陕西公司的乳品车间从2025年2月16日停产。还有报道显示5月,娃哈哈关闭了十余家分厂的生产线,停产的名单中有天津武清工厂、河北高碑店工厂。 一边在委托代工,一边又在调整生产线,娃哈哈的各种操作又让人遐想连篇。 有部分自媒体报道最近连续关闭工厂的陕西娃哈哈,其第一股东并非宗馥莉,宗馥莉全资持股的浙江启力投资有限公司仅持股40%。 宗馥莉 结合这次的代工风波和去年宗馥莉的“主动辞职”,不少媒体猜测,现在的娃哈哈还处于母公司股权纠纷的阵痛期,企业还处于宗庆后家族式班底和传统股权模式向传统企业发展的过渡期。无论是关闭工厂还是找代工,或许都是新掌门宗馥莉和股东们相互博弈的一部分。 可以预见的是,这场代工风波只是宗馥莉改革风暴的冰山一角。自去年7月正式掌权以来,宗馥莉便开启了大刀阔斧的变革。 将人力、财务、供应、运输等13个部门的核心成员调整。接着,向大锅饭文化开刀,废除宗庆后不开除45岁以上员工的传统,将薪酬体系改为绩效四档制。把一部分经销商的签约主体,换到了宏胜系旗下。这位小宗总正在逐步用自己的节奏打造一个新的娃哈哈。 今年2月,387件娃哈哈商标也从集团转到了宗馥莉的控股公司。紧接着,宗馥莉又在5月悄悄注册了娃小宗商标,产品线不仅涵盖饮料,连啤酒和保健品都准备好了。 公开数据显示,2024年娃哈哈集团的营业收入约为700亿元。过去的一年时间里,在宗馥莉的带领下,娃哈哈再次攀上了700亿元的高峰,实现了业绩的大幅回升。受益于各种因素,娃哈哈的销量仍保持了一个不错的数字,然而,作为新掌门的宗馥莉,如何继续控制这家头部饮料的主动权,让品牌继续发展则是一个需要继续考虑的议题了。 饮料行业代工背后的商业秘密 无论娃哈哈的发展如何,代工却是一个在当下的饮料行业广泛存在的模式。根据2024年年报,公司将其约15%的纯净水产能外包给了今麦郎‌,其实很多知名品牌都采用过自主生产加代工混合模式。 娃哈哈饮料生产车间 数据显示,中国饮料行业代工比例已从2015年的8%激增至2024年的27%。2023年中国瓶装水整体代工比例则高达63.7%。 代工总是给人贴牌、质量差等刻板印象,其实仅对饮料行业而言,代工模式在商业上是有很多红利的。 首先是成本优势,依托代工模式可降低企业的投入,毕竟自己不用直接控制工厂和工人,大大节约了固定资产的支出,非常适合资金密集型企业。 其次就是效率问题,对很多行业来说,专业的代工厂分工更细致,可以缩短产品的生产周期,快速响应市场需求。 最后就是规模红利,一些大的头部代工企业,如奥瑞金、中粮包装等,通过集中采购、标准化流程,能将单位成本压低15%到20%。今麦郎本身也是一家大型的代工企业,在为娃哈哈代工纯净水的同时,还为三得利乌龙茶、蜜雪冰城“雪王爱喝水”等品牌生产饮品,代工业务涵盖饮用水、茶饮料、功能饮料等全品类。 在国内饮料行业内,最成功的品牌代工案例,当属元气森林。根据《华夏时报》报道,元气森林代工比例高达80%以上,凭借代工模式和品牌营销,只用了三年估值就突破了百亿。 当然,代工也存在不少隐患。最主要的就是质量和配方舆情风险。 代工厂为追求利润最大化,往往采用最低价中标策略,导致质量管控可能存在风险。 对于大部分品牌来说,代工模式也会使他们陷入研发代工质效的不良循环。2020年元气森林的代工厂“0糖0卡”配方泄露,一度还引发品牌信任危机,就凸显了代工模式的弊端。 除了容易造成品控危机之外,代工也会导致创新乏力,长期的代工模式会导致品牌与生产端脱节。 消费端的各种反馈很难直接作用于生产。从研发端来说,代工厂不愿投入柔性生产线,导致新品测试成本高;在生产端,代工厂为确保订单量,更倾向于推荐成熟配方而非创新配方。这些都会导致产品创新乏力,在饮料行业产品严重同质化,价格战导致利润持续下滑的困局的背后都有代工模式的影响。 情怀溢价疑云:品牌代工后的抉择 这次的舆论的焦点集中在了娃哈哈的情怀溢价是否真实上,实际上,娃哈哈的持续发展的关键在于构建起品牌代工和消费者的价值共生体。毕竟在消费的感情层面,选择一家企业的产品,往往会带着某种感情倾向,甚至是有立场的。 同时这次的代工风波,本质上是因为产品代工超出了消费者的认知,娃哈哈找行业内的知名品牌或竞品代工确实容易让人很尴尬的感觉。 在一个更宏观的行业层面,代工模式也会继续存在,快消品企业始终在规模扩张与质量把控、短期效益与长期价值之间寻求动态平衡。这种平衡的艺术,将深刻影响中国饮料行业的未来竞争格局。 对于娃哈哈和宗馥莉而言,除了厘清股权纠葛和企业经营理念之外,既然未来还是要坚持自有生产模式,那就扎扎实实地建好自有供应链,并将自有工厂的优势发挥到极致,为用户创造更多健康、受欢迎的饮品,这才是品牌成功的关键。 对于头部企业来说,在消费理性化、产品日趋内卷的今天,一个品牌不仅仅是符号和标签,有时候还要承担更多的情绪价值和产品信任感。
建设效率新纪录,京东方宣布国内首条第8.6代AMOLED生产线提前4个月设备搬入
IT之家 5 月 20 日消息,国内首条第 8.6 代 AMOLED 显示器件生产线 ——BOE(京东方)成都第 8.6 代 AMOLED 生产线项目提前 4 个月开始工艺设备搬入,创下全球同世代产线建设效率新纪录。 相较于同业其他尚处于建设规划阶段的 8.6 代线,京东方已率先由建设阶段开始向产线运营阶段转换,历时 183 天提前实现全面封顶,提前 4 个月开始设备搬入。 京东方表示,该项目建成后,将填补国内高世代 AMOLED 生产线的空白,同时,该生产线的产品将搭载京东方 OLED 显示技术领域最前沿研究成果,推动中国 OLED 产业迈向“技术引领”。 作为京东方投建的国内首条第 8.6 代 AMOLED 生产线,该生产线总投资 630 亿元,设计产能每月 3.2 万片玻璃基板(IT之家注:尺寸 2290mm×2620mm),是四川省迄今投资体量最大的单体工业项目,主要生产笔记本电脑、平板电脑等智能终端高端触控 OLED 显示屏。 京东方通过采用低温多晶硅氧化物(LTPO)背板技术与叠层发光器件制备工艺,使 OLED 屏幕实现更低的功耗和更长的使用寿命,也将带动下游笔记本及平板电脑产品的迭代升级。 目前,京东方已在成都、重庆、绵阳投建了三条第 6 代柔性 AMOLED 生产线,再加上国内首条第 8.6 代 AMOLED 生产线的投建,未来将运行 4 条 AMOLED 生产线。
基本物理任务,全球顶级AI均失败,普通零件加工,o3不如老师傅
在基本物理任务上,前沿AI模型仍会失败!ML研究院的测试案例显示白领将被Ai替代,而制造业等蓝领工作不受影响。未来已来,只是分布得不均匀。 基于AI研究、机器人以及实际制造等过往经验,Adam Karvonen在零件制造任务上,测评了顶尖模型的表现。 包括OpenAI o3、Gemini 2.5 Pro等顶尖LLM,全部失败,没有一个让他满意! 即便o3的智商高达136,超越GeminI 2.5 Pro和90%的人类,但在这次测试中,不如Gemini 2.5 Pro,更不要提经验丰富的工人老师傅了。 基于此,他认为,在未来一段时间内,AI将自动化大量白领工作,而蓝领工作不受影响。 也就是说,自动化在全行业里并不会均匀发生。 尽管还不知道这种不均衡会持续多久,但他认为局部自动化几乎已成定局。 Adam Karvonen 这与Anthropic的首席执行官Dario Amodei的预测截然不同。 Dario曾公开表示:几乎所有工作会同时被自动化,从而把每个人都「放在同一条船上」 但Adam Karvonen做过机械师,还从事过机器人相关工作。 此外,他从事过软件开发,现在是MATS学者项目的机器学习研究人员。 可以说,他是研究AI对蓝领工人影响的上佳人选。 零件制造:物理+视觉双重挑战 评估很简单:制定一个详细的计划,使用3轴CNC铣床和2轴CNC车床来加工一个零件,如下图所示。 测试中要加工的零件 尽管这并不简单,但在典型的原型制造或工作车间环境中,大多数技师会将执行这一任务视为常规工作,涉及标准的车削和铣削技术,但需要多个加工步骤。 CNC铣床和车床零件加工示意图 尽管这个零件很简单,即便是像o1-Pro或Gemini 2.5 Pro这样的前沿模型也经常犯下重大错误。 这些错误可以分为两类:视觉能力和物理推理能力。 视觉错误 大多数模型的视觉能力非常差:在过去的两年里,在视觉能力上,Anthropic和OpenAI的模型没有任何实质性的进步。 它们总是错过一些显而易见的特征。 哪怕只是这个零件做出合理的描述,Claude 3.5、Claude 3.7、GPT-4.5、GPT-4o或o1-Pro也做不到。 如果没有视觉能力,创建制造计划几乎是完全不可能的。 有趣的是,在像MMMU之类的视觉推理基准测试中,许多模型得分高于或接近人类专家的水平。 MMMU基准的测试科目和示例 然而,容易衡量的东西,往往与现实世界的实用性没有直接关联。 当看到Gemini 2.5在视觉能力上有了重大进展时,他感到非常惊讶。 在大约尝试四次,它能够识别出大多数主要特征,没有额外的虚构内容。 它能捕捉到的一些细节确实令人印象深刻。 然而,这种视觉改进主要揭示了更深层次的未解决问题。 Gemini 2.5 Pro能够识别大多数主要特征,而没有重大的虚构错误。 然而,它仍然会做出一致的、更微妙的视觉错误:漏过细节、偶尔的虚构/误解、特征识别不一致。 对比一下Adam Karvonen和Gemini 2.5 Pro对加工零件的描述 Adam Karvonen的描述 Gemini 2.5 Pro的描述 这是一根细长的黄铜圆柱体,两端带有不同直径的台阶和螺纹。该部件长2英寸,直径为0.187英寸,因此长度与直径的比例超过了10:1。 材料:黄铜(可能是C360自由切削黄铜,便于加工) 形状:主要为圆柱形,具有多个不同直径的部分,两端带有螺纹,中央部分有铣削平面,平面上有两个螺纹孔,且有一个横向穿过螺纹部分的孔。 大致尺寸:长度约为2英寸,最大直径约为3/16英寸(0.1875英寸)。螺纹看起来比较细(可能是#6-32或M4规格)。螺纹孔较小(可能是#2-56或M2.5规格)。横向孔较小(约1/16英寸或1.5mm)。确切的尺寸需要从图纸中获取,但我们可以根据这些估算的尺寸进行分析。 物理推理错误 以前,很难将视觉误解与更深层次的物理推理问题区分开来。 现在,即便从准确的视觉解释出发,Gemini 2.5仍然会产生充满实际错误的加工计划。 典型错误包括:忽视刚性和振动;物理上不可能的工件夹持。 忽视刚性和振动。 这个零件相对于其直径来说长而细。 如果用标准技术来加工它,这很可能导致零件在加工时发生变形,或在切削工具上快速振动(称为「振刀」现象)。 刚入行的技师都能立刻意识到,刚性对于像这样的长细零件至关重要。 当专门询问振刀问题时,Gemini错误地使用尾座等教科书解决方案,反而加剧了像在这根长细黄铜零件中弯曲问题。 尾座是机械加工中常用的装置 物理上不可能的工件夹持。 Gemini通常提出一些无法实现的工件夹持和操作顺序。 最常见的建议是将零件夹在夹具中(特别是卡盘块),加工一些特征,然后旋转夹具以加工其他特征。 然而,这在物理上是不可能的,因为夹具会挡住这些新特征。 CNC工件夹持方法 Adam Karvonen的总体印象是:「就像是在复述教科书知识,但根本不懂他们在说什么」。 这些模型非常乐于提供教科书上的知识,但在重要的实际细节上,完全错误。 这与他收到的制造业及建筑行业的反馈一致:目前的LLM,在他们工作的核心、动手操作部分,几乎完全无用。 这项评估仅仅是皮毛 生成文本计划,只是工作中最简单的部分。 实际的加工,涉及管理每个高层步骤背后的许多细节。 仅仅选择一个切削工具就需要考虑刀尖半径、刀柄碰撞间隙、刀具刚性、涂层、切削速度/进给速率等多个因素。 而且往往存在取舍与权衡,例如间隙与刚性之间的平衡。 许多因素,本质上是空间问题,而这些问题利用文本是无法完全评估的。 如果模型在这些可描述的方面表现如此糟糕,那么它们对基础物理现实的理解可能会更糟。 事实上,真正的关键是克服众多难题,每个难题都比前一个更加困难: 准确的视觉感知:基础步骤是从输入图像中,正确识别所有几何特征和它们的关系。这几乎不需要空间推理能力,但大多数模型在这方面表现依然非常差。 基本的物理合理性:不仅仅是看清零件,模型还必须提出物理上可行的操作和设置。这涉及基本的空间推理,以确保例如工具访问不会被夹具阻挡。 融入物理知识:成功的加工需要理解现实世界的物理和潜在知识。这通常要实操获得经验,但现有的数据集无法做到这一点。 工艺优化:在步骤1-3中处理细节是正确加工零件的前提。正如马斯克所说,高效制造比制造原型要困难10-100倍。这才是工作中真正具有挑战性的部分。 步骤2到4可能难以通过模拟生成的合成数据来解决。 与Adam Karvonen交流过的技师,几乎都认为:工程师理解教科书公式和CAD,但不理解现实制造中的约束。 而模拟环境,似乎很可能会创造出具有相同缺陷的AI。 为什么LLM表现不佳? 缺乏数据,是LLM在物理任务中表现不佳的最明显的原因。 像加工这样的问题,依赖于大量的隐性知识和通过经验学到的无数微妙细节。这些细节通常并不会被记录下来。 这并不是因为专家故意隐瞒秘密——而是因为记录这种细致入微的现实世界知识既不现实也不高效。 软件工程师,很少记录每一行代码背后的所有推理。 类似地,加工技师也不会记录每次设置零件时的所有考虑因素。 导师手把手教学,比通过教科书学习或死记硬背程序更加快捷高效。 这与软件工程或法律等领域有着显著的区别。 尽管软件工程师或律师可能不会明确记录每个推理步骤,但他们会生成像代码、版本控制历史和合同这样的制品,这些都包含了非常丰富详细的信息。 而在物理任务中,虽然同样存在相应的详细信息,但这些信息嵌入在3D世界,通常非常难以有效数字化。 因此,LLM在回顾某些教科书知识时表现出色,但这远远不够。 改进物理任务可能很困难 从经验来看,顶尖模型目前在这些任务上表现不佳。 这只是暂时的障碍,很快就能克服吗? 这很难确定,但Adam Karvonen有一些推测性的理由来解释为什么未来的进展可能会很困难,也可能比预期的更容易。 一个显然的解释是,LLM在物理任务上表现不佳,是因为目前没人投入足够的精力。 然而,改进对物理世界的理解可能非常难。 提升编码能力的路径依赖于大量的训练数据和清晰的奖励信号,支持强化学习和合成数据的使用。 然而,这种方法在物理任务中并不适用。 为什么改进可能很困难 缺乏可验证的奖励:为复杂物理任务定义奖励信号非常困难。 零件的缺陷可能表现为几年后稍微增加的故障率,或者是多年后错误应用防水涂层造成的腐烂。 注塑产品中的裂缝 反馈回路可能很长,而且结果很难通过自动化方式衡量。 缓慢、昂贵且危险的试错法:通过强化学习或生成合成数据的学习,可能非常困难。 一次错误很容易导致数十万甚至更多的损失。 与运行有漏洞的代码不同,使用重型机械或从事建筑施工时的错误可能带来严重后果。 制造业获得经验通常需要使用昂贵且有限的资源,而不仅仅是几个GPU小时。 为什么改进可能比预期容易 自动化AI研究员:AI在编码和AI研究方面正在取得重大进展。 人类可能很快就会迎来AI研究员。 也许这种自动化的AI研究员,能够通过创建更高效的算法或大量的模拟数据,轻松解决这些挑战。 合成数据:有些明显的方法还没有得到充分探索。 例如,模拟可以被用来创建大量数据,尽管模拟与现实之间会存在差距。 以特定的制造工艺(如CNC加工)为例,计算机辅助制造(CAM)软件可以准确地模拟大多数操作。 然而,制造过程中有很多多样化的工艺,许多工艺没有很好的模拟解决方案。 总体来说,虽然改进物理任务处理能力存在诸多挑战,但随着技术的发展,自动化AI研究员的出现以及合成数据的广泛使用,未来可能会取得意想不到的进展。 自动化不均衡的影响 如果这一趋势持续下去,人类将要面临新阶段,其中远程工作会经历显著的自动化,而熟练的体力工作则在很大程度上不受AI影响。 这一「自动化差距窗口」可能持续一段未知的时间,并带来潜在的影响: 加剧紧张局势 自动化与非自动化行业之间可能很容易出现重大阶级冲突,尤其是因为这两个群体之间还存在其他潜在的差异。 白领工人更有可能面临职位替代,而他们通常收入更高,并且拥有更为自由的政治信仰。 这些差异可能加剧紧张局势,并导致自动化行业群体的重大经济痛苦。 公众对AI的反对 这可能导致公众反对进一步的AI研究。 像蓝领工人这样的群体,现在已经有了自动化可以迅速发生的证据,他们可能不希望被AI取代。这可能会阻碍进一步的AI发展展,并延长不平衡的存在。 体力劳动瓶颈 如果大多数知识工作被自动化,像制造业这样的体力劳动能力可能会成为技术进步或国防的瓶颈。 像中国这样的国家,凭借其更强大的工业基础,可能会获得显著的战略优势。 但这存在许多不确定性。 参考资料: https://adamkarvonen.github.io/machine_learning/2025/04/13/llm-manufacturing-eval.html
谷歌Meet视频会议平台将引入Gemini AI同传:还原语调、情感及音色特征
凤凰网科技讯 5月21日,在Google I/O 2025开发者大会上,谷歌宣布将其实时语音翻译技术深度整合至Meet视频会议平台。基于Gemini大模型的实时翻译功能现已向Pro、Ultra订阅用户开放,企业版预计2025年晚些时候进行推广。该技术突破性实现了语音翻译过程中对原声语调、情感及音色特征的还原。 目前该功能支持英语与西班牙语双向互译,意大利语、德语、葡萄牙语版本将于未来几周上线。 在大会上,谷歌推出了一款名为Google Beam的全新平台,这一技术源自其此前备受关注的3D视频通话项目——Project Starline。Project Starline自2021年首次亮相以来,便以其突破性的3D全息视频通话技术吸引了广泛关注。这项技术通过多摄像头捕捉用户的不同视角,并利用人工智能实时渲染出逼真的三维影像,从而为远程沟通带来前所未有的沉浸式体验。 谷歌计划在今年晚些时候与惠普合作推出首批Google Beam设备。 谷歌还公布了一项名为“Project Mariner”的全新AI智能体项目,这一项目最初被称为“Jarvis”,并在去年年底进行了初步测试,如今迎来了新的进展。 Project Mariner能够理解和推理浏览器页面中的信息,包括像素、文本、代码、图像和表单等元素。用户只需通过简单的指令,Mariner就可以自动完成复杂的任务,为用户提供个性化的服务。此外,智能体模式即将上线Chrome、搜索和Gemini应用。
BEYOND大会创始人论坛嘉宾公布
在科技创新浪潮奔涌、产业边界持续演化的今天,创始人不仅是产品的第一推动者,更是行业价值的定义者。他们洞察变化,在混沌中寻找方向;他们坚持长期主义,在现实中落地理想;他们既仰望星空,也脚踏每一寸市场。 5月22日至23日,由BEYOND Expo倾力打造的「创始人论坛」即将在澳门威尼斯人金光会展盛大开启。本届论坛将聚焦前沿科技与商业创新,特别设置健康科技、人工智能(AI)、消费科技、气候科技四大专场,邀请来自全球的创业者代表进行主题演讲与深度分享。 这些演讲嘉宾不仅是各自赛道的引领者,更是新技术、新模式在全球落地的实践者。他们将从不同角度剖析行业痛点与突破路径,讲述创业背后的思维演化、产品迭代与市场洞察,展现科技驱动下的未来生活图景。 论坛看点 🚩全球创始人同台对话:与不同文化背景下的创业者深度交流,探讨技术驱动与本地化策略的兼容之道 🚩趋势直击与落地经验并重:洞察风口背后的底层逻辑,分享创业“从0到1”的心智框架与实战经验 🚩跨界资源融合平台:链接投资人、合作伙伴、媒体与潜在客户,让创始人观点被看见,也被支持 部分嘉宾 彭雷,NeuroXess创始人兼首席执行官 Joanne Zhou,In Lieu Premium Sustainable Water创始人兼首席执行 Terence Tai-Weng Sio医学博士、理学硕士,梅奥诊所亚利桑那州分院放射肿瘤科 赵家军教授,中华医学会内分泌学分会主任委员、山东第一医科大学省立医院教授 Michael Zhao,Klickl首席执行官 Zack Kass,人工智能未来学家、OpenAI前商业化负责人 贾奎,跨维智能创始人 张煜,清华大学智能产业研究院院长助理,清智资本创始合伙人 Nima Banai,Assemble Labs联合创始人兼首席执行官 Eric Guo,AI² Robotics创始人兼首席执行官 程乐帆Freddy Cheng,Intoken Technology联合创始人兼首席运营官 Sissi Chao,RePlasTerial首席执行官 Lola Woetzel,Global6 Limited首席执行官 Ian Chew,Greenie Web创始人兼首席执行官 Mark Bawtree,SEKAI联合创始人兼首席执行官 Tim Binnion,(better) labs创始人 Yan-Ping Wong,Gaiamesh创始人 Faye Dang党霏霏,汇充电联合创始人 胡适,费曼动力首席运营官 吴丹妮Denise Wu,ROOTIQUE LIMITED创始人兼首席执行官 Patrice Nordey,Trajectry创始人 Raphael Coelho,X-Sigma Partners管理合伙人 Minki Chang,MustardTek Inclusive Design Studio创始人兼董事总经理 David (Hye sung) Shin,Wadiz创始人兼首席执行官 Masaru IKEDA,Cohh首席内容官 更多嘉宾议程持续公布中.....

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。