EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
扎克伯格高薪挖角“惹怒”奥特曼? 曝OpenAI推天价奖金留人
奥特曼 凤凰网科技讯 北京时间8月8日,美国当地时间周四,OpenAI发布了新一代旗舰模型GPT-5。就在该模型发布前夕,有圈内人士爆料称,OpenAI CEO萨姆·奥特曼(Sam Altman)宣布给员工发放150万美元(约合1077万元人民币)的奖金。 率先曝出这一消息的是科技公司Hyperbolic Labs创始人兼首席技术官金雨辰(Yuchen Jin)。资料显示,金雨辰毕业于华中科技大学和美国华盛顿大学。2022年,他在美国加州创办了Hyperbolic。该公司是一家开放式AI计算和推理服务提供商,提供GPU资源和AI服务,以降低AI开发相关成本。 金雨辰在X上称,奥特曼宣布将在未来两年内向每位员工发放150万美元奖金,并认为此举是对Meta CEO马克·扎克伯格(Mark Zuckerberg)挖角行动的反制。扎克伯格最近频频挖角OpenAI员工,提供的薪酬超过1亿美元。 金雨辰的帖子 “我在OpenAI的朋友们现在非常兴奋,不是因为这是GPT-5发布前夜,而是因为萨姆刚刚宣布在未来两年为每位员工发放150万美元奖金。78%的英伟达员工都是百万富翁。而在OpenAI,这个比例更是高达100%。 我认为,我们可以将此称之为‘扎克伯格挖角效应’。”金雨辰称。 随后,他进一步澄清称,每位OpenAI员工在未来两年都会获得150万美元的奖金,即使是新员工。 不过,WinBuzzer网站跟进报道称,OpenAI这一奖金不是发给所有人,只面向大约1000名研发和工程员工,公司支出预计超过15亿美元。而且,奖金金额也不一定是150万美元。知情人士称,奖金金额将根据员工的绩效、职位和资历确定,在两年内按季度分期发放,员工可选择以现金或股票形式领取。 奖金消息的传出正值OpenAI展现强大财务实力之际。该公司最近宣布,其周用户量已达到7亿,年度经常性收入达到130亿美元。这一增长得益于该公司最新一轮83亿美元融资,为其留住人才提供了强大的资金支持。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
GPT5史诗级大更新?无聊
摘要: 对商业乃至更大用户群体的图谋,让OpenAI的考量变得复杂。 凤凰网科技 出品 作者|姜凡 萧雨 编辑|董雨晴 昨夜有多少人熬夜了? 等了一年多,北京时间8月8日凌晨1点多,在全球瞩目中,OpenAI终于正式发布新一代大语言模型 GPT-5,并破天荒地向所有用户免费开放基础版。 OpenAI CEO 山姆·奥特曼在发布会上表示:“如果说 GPT-4 还只是大学生,GPT-5 就是一位真正的专家。” 他将这次升级比作“让我再也回不去”的技术飞跃,就像第一款配备视网膜屏的 iPhone 带来的体验一样。 与以往不同,GPT-5是一个统一系统,不再分为常规模型和单独的推理模型,而是由三个核心部分构成:一个智能高效的基础模型,能够回答大多数问题;一个用于解决更复杂问题的深度推理模型(GPT‑5 Thinking);以及一个实时路由器(智能分流系统),可根据对话类型、复杂度、工具需求以及用户的明确指示(例如提示中写道“请深入思考这个问题”)快速判断应使用哪个模型。 OpenAI称,这是迄今为止最强大的 AI 系统,在编程、数学、写作、医疗、视觉感知等多个领域都实现了重大飞跃。 只是发布会刚刚结束,全网似乎骂声不少,众望所归的“GPT5时代”,就这? 硅谷又有人要失业了? 依旧是熟悉的“屠榜”。 在最新的数学推理测试 AIME 2025 中,GPT-5 无工具模式得分高达 94.6%,接近人类顶尖水平;在 SWE-Bench 编程验证测试中得分74.9%,大幅超越上一代模型;在多模态理解的 MMMU 基准中更是达到 84.2%,证明它不仅能读懂文字,还能深入理解图片、图表、视频等多模态内容。 图|GPT-5编程得分 新版本引入“实时路由器”技术,能根据任务复杂度自动选择推理模式,既保证深度,又减少算力浪费。简单说,GPT-5学会了“先想清楚,再动手干”,效率与精度双赢。 奥特曼在发布会上也表示:“GPT-5真的让我第一次觉得,我们的主力模型已经达到了可以让你向一位真正的专家、一位博士级专家提出任何问题。”并且他还称“它最酷的能力之一,就是能即时为你写出高质量软件。按需软件这个概念,将会成为GPT-5时代的标志性特征之一。” 它的编程能力官方堪称史上最强。奥特曼表示,GPT-5是“全球最强的编程与写作模型”。 在OpenAI的测试中,该模型在基准测试SWE-Bench、SWE-Lancer和 Aider Polyglot中的编程表现优于所有其他模型。在真实世界编程测试中,GPT-5在SWE-bench Verified中的得分为74.9%,在Aider Polyglot中的得分为88%。 在发布会上,OpenAI负责后训练工作的负责人扬·杜布瓦(Yann Dubois)现场演示了如何用GPT-5生成一个带有互动游戏的法语学习网站。 短短几秒内,GPT-5就写出了数百行代码,并生成了该网站的前端界面。杜布瓦简单点击浏览了网站的各个功能,发现一切似乎都按预期正常运行。 在朝着“微信”进化了 OpenAI此次为GPT-5加入了4种交互人格——愤世嫉俗者、机器人、倾听者、书呆子。这意味着,用户不仅能得到精准答案,还能体验不同的沟通风格。据测试,这一改进让“谄媚式回答”减少了 60% 以上,让对话更真实、更有棱角。 这次GPT或许要朝着“微信”的方向进化了。 它现在支持用户自主定制聊天窗口的色彩风格,还具备了长期对话记忆的集成能力。更厉害的是,新功能还能直接与谷歌邮箱、日历无缝对接。 如此一来,ChatGPT就能全方位融入生活与工作,为用户精准规划日程,贴心提醒重要纪念日。 在医疗健康领域,GPT-5也有显著进步。 HealthBench 测试得分 46.2%,可解析复杂医疗报告并提供实用建议,为远程医疗、健康咨询带来新可能。 微软、Cursor等平台已在第一时间接入GPT-5,编程辅助工具市场或将迎来新一轮洗牌。网友预测,GPT-5的普及会让更多人轻松写出高质量代码,甚至可能让部分初级程序员失业。与此同时,教育、科研、设计等行业的AI渗透速度也会加快。 急着赚钱的OpenAI,走向平庸 OpenAI的此次更新之所以招致如此大的吐槽,本质上还在于一个以“颠覆式创新”引领市场的佼佼者,直接走上“平庸”之路。 此次模型更新不置可否的是提升巨大,值得褒奖,无论是幻觉率的大幅下降,还是人人都免费的态度,都可以看出OpenAI此举意在让更多人用上好用的大模型。 背后也是OpenAI的野心,根据其8月5日的最新官方公告,ChatGPT的周活跃用户将达到7亿,每天处理的用户消息量已突破30亿条。从活跃用户数来看,仅过去两个月,就增长了2亿。作为对比,谷歌AI搜索摘要(AI Overviews)月活约20亿,Gemini聊天机器人月活超4.5亿。截至Q1,微信合并WeChat全球月活则是14.02亿。 OpenAI的商业化也在提速,其付费用户数从2025年6月的300万增至目前的500万,年化收入(ARR)从6月的100亿美元增至 130亿美元,预计年底突破200亿美元。 对商业乃至更大用户群体的图谋,让OpenAI的考量变得复杂。 今年5月,山姆·奥特曼还任命了一位新CEO——菲吉·西莫(Fidji Simo),作为“应用CEO”(CEO of Applications),她负责领导OpenAI的产品、业务和其他职能,向奥特曼汇报。这位女将曾在Facebook任职十余年,来OpenAI显然是为下一阶段ChatGPT的增长和商业化负责。虽然彼时奥特曼曾称,他将更专注于研究、计算和安全系统。但从GPT5交出的作业来说,奥特曼的表现很难打出高分。 颇为有意思的是,曾几何时,赚钱和商业化,从1到100的大规模落地应用曾是中国公司的主战场,中国有全球发达的互联网,有繁荣的用户生态。 但今天,越来越多中国公司在AI上,暂时放弃了商业化。转而去追求模型能力的提升,当然,当前仍未有太多业绩成果交付。 今年7月时,360公司董事长周鸿祎在2025中国互联网大会上曾表示,DeepSeek创始人梁文锋一门心思做AGI,根本没有想做一个App。 周鸿祎还称,梁文锋是一个有梦想的人,不屑于做App,不在乎日活、融资和收费的问题。一个最了不起的地方是:DeepSeek是世界第一个把大模型免费、开源的,这对中国大模型产业的发展做出了很大的贡献。
全球500余台人形机器人共赴“冰丝带”,首届世界人形机器人运动会8月14日开幕
IT之家 8 月 8 日消息,“2025 世界人形机器人运动会发布会”今天举行,确认 2025 世界人形机器人运动会将于 8 月 14 日晚在国家速滑馆“冰丝带”开幕。 据央视报道,2025 世界人形机器人运动会是全球首个为人形机器人组织的综合性竞技赛事,共有来自全球五个大洲、16 个国家的 280 支参赛队伍参赛。赛事为期三天,从 8 月 15 日持续至 17 日。 2025 世界人形机器人运动会由北京市人民政府、中央广播电视总台等单位联合主办,总台北京总站联合承办,这是全球首个以人形机器人为参赛主体的综合性运动会。 据IT之家获悉,全球 280 支队伍届时将带着 127 个品牌的 500 余台人形机器人,围绕 26 个赛项展开角逐,包含竞技赛、表演赛、场景赛 3 类 22 个主体赛项和羽毛球、篮球、乒乓球、自由搏击、群体舞蹈 5 个外围赛项。 一、这次运动会是年轻学子的创新舞台。来自全国 70 所学校的 192 支优秀队伍将参赛,其中 39 支队伍使用自研机器人。随队人员除带队老师外,平均年龄 22 岁。 二、这次运动会是机器人企业和爱好者展现科技风采的平台。88 支参赛队伍基本覆盖了国内头部人形机器人整机企业。特别值得关注的是,在自由搏击赛项中,还有 2 支由奥运健儿组成的俱乐部队伍参赛,为运动会带来了奥运力量。 三、这次运动会是国际机器人界的交流盛会,共有 18 支国际队伍将参加运动会足球赛项。 一、百米“飞人”大战将成为焦点,目前已有 90 支队伍报名,全球首个人形机器人半程马拉松比赛的前六名将同台亮相。 二、足球赛项将全程由 AI 算法自主控制,无需任何人工操作,同时,在 3 对 3 的基础上推出全球首创的 5 对 5 阵型。 三、武术、自由搏击等项目,将迎来机甲格斗擂台赛冠军及各地武林高手们的同台竞技。 四、经过全国大学生机器人大赛的激烈较量,参加集体舞蹈、篮球等外围赛的 33 支队伍已整装待发。 五、来自机器人头部企业和顶尖高校形态各异的机器人选手,它们将不断挑战机械结构、应用材料、人工智能等多种性能的极限,呈现出空前激烈的比赛盛况。 六、乒乓球机器人、全尺寸及小型搏击机器人、小型集体舞蹈机器人等趣味项目将与观众互动。
GPT-5快抢走打工人饭碗了
出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 GPT-5,终于来了。 北京时间8月8日凌晨1点,OpenAI CEO Sam Altman 没有爽约。在发布会前一天,他在 X(原 Twitter)上写道:“明天上午10点(太平洋时间)发布 GPT-5,发布会会比以往更长,一个小时左右。” 结果,这场被全网盯紧的发布整整持续了 1小时18分钟,堪称“最重头戏”。 Altman 的造势从来不是空喊。这位硅谷最有话语权的“AI布道者”在会前甚至自曝:“测试完 GPT5,我感觉自己一无是处。”看似夸张的说法,却意外地成为这场发布的真实注脚。 在开场介绍GPT-5时,奥特曼简单回顾了下从GPT-3到4,再到5的历程。他自己比喻说,“GPT-3像个高中生,GPT-4像个大学生,而GPT-5则已经变成了一名专家,一名各个领域的专家。” GPT-5 并没有让人失望,它甚至可能让打工人们开始焦虑,首当其冲的就是程序员。 这次发布会最大的信息量,不是语言理解能力有多强、创作能力有多丰富,而是它在代码编写、调试、部署上的全新维度:GPT-5 不再是“会写代码的语言模型”,它是一个工程级开发助手。 这场发布会上,OpenAI 花了将近一半时间在“现场写代码”。它两分钟就可以搭建出一个完整网站,五分钟做出一款语言学习App,并能精准识别并修复 Bug。它不仅听懂复杂需求,还能结构清晰地拆解任务、实现功能、给出部署建议——这种能力,已不是“辅助编程”,而是直接抢活干了。 对于熟悉 AI 编程工具的人来说,这意味着什么?意味着 Copilot 要退休了,意味着 Replit 要被重塑,意味着 Cursor 等“AI IDE”要被全面整合。Altman 在现场甚至直接说:“这是我们有史以来最强的编程模型。” 而背后支撑这一切的,是 GPT-5 在推理能力、上下文管理、多模态理解等多个维度上的飞跃。OpenAI 此次还发布了面向不同用户的模型矩阵,包括:GPT-5 Standard、GPT-5 Mini(轻量版)、GPT-5 Nano(嵌入式和移动端使用)。 这三个版本面向 API 和企业客户开放,按百万 tokens 计费。输入价格分别是 1.25 / 0.25 / 0.05 美元,输出价格为 10 / 2 / 0.4 美元——极具市场穿透力。对于开发者而言,这是“从业门槛”被再一次降维打击。 值得一提的是,Altman 虽并未过多谈 AGI,但业内都清楚:GPT-5已经不局限于在AI大模型的世界里内卷,而是不断突破上限,在AGI的道路上完成大跃进。 这不是一次“模型升级”,而是一次生产力结构的重构。 GPT-5 登场的这一刻,AI 世界的天花板,再次被抬高。而我们,是否准备好面对它带来的新范式,还很难说。 接下来,笔者将还原出这场发布会最精彩的部分: 在现场演示之前,OpenAI先是一如既往地展示了GPT-5的一连串标杆成绩。 首先,GPT-5最惊艳的就是,在编码能力方面实现全面碾压。 SWE‑Bench Verified:作为检测模型修复真实软件工程问题能力的标准,GPT‑5 在这一评测中取得惊人的 74.9%,领先于 o3 的 69.1%,展现了更高效、更精准的代码理解与生成能力。 Aider Polyglot:这是一个跨语言代码编辑测试,GPT‑5 成绩飙升至 88%,错误率相比之前整整降低了三分之一。 其次,GPT-5还极大降低了大模型所产生的幻觉问题,并实现在可靠性和事实准确性方面双双提升。 在回答事实类问题时,GPT‑5 的“幻觉”错误率,相对 GPT‑4o减少约 45%,而相对 o3则减少约80%。 在GPT-5发布会上,除了代码能力,奥特曼特别重点强调的就是GPT-5在健康医疗领域的表现。在医疗场景测试(如 HealthBench Hard Hallucinations),它的生成错误率仅为 1.6%,远低于 GPT‑4o 的 12.9% 和 o3 的 15.8%。 程序员马上要失业了? GPT-5最为炸裂的部分,就是代码能力。 这一次,GPT‑5 真的在发布会上秀疯了。几乎从开始演示到结束,一共有四个“全场景、真交互”的代码能力展示,让在场开发者和远程观众都忍不住感慨:“程序员,真的要慌了。” 1、两分钟生成SVG动画 Prompt:让我迅速了解什么是伯努利效应(Bernouli effect) 在这个prompt下,GPT-5迅速给出了关于伯努利效应的详细解释。而当用户再要求用SVG动画演示时,GPT-5则直接开始进入深度思考模式,两分钟生成了420行代码,最终我们看到了这个可交互的动画。 值得注意的是,用户可以自由调整飞行速度和角度,气流线条也跟着实时变动。这不仅是可视化的知识输出,更是个性化、具备教学辅助价值的模拟系统。 2、五分钟搭建APP Prompt:“我是英语母语者,为正在学法语的搭档做一个互动式学习 App,要有卡片、猜词、游戏,最好做成一只老鼠吃芝士学单词。” GPT‑5 不仅“听懂”了需求,还在五分钟内把需求全量落地:卡片式界面、互动功能、学习进度追踪全都上线。 而那个“老鼠吃芝士”的小游戏,更是让人拍案叫绝——每当老鼠吃掉一块芝士,就会自动播放一个法语单词语音,学习与娱乐真正无缝融合。 你甚至能看到这个 AI 在用户没有明确要求的细节上主动优化交互逻辑,足以说明其理解层级已经跃升。 3、修复代码bug 这一幕的设定就像现实工作场景:一名工程师把一个看似正常、实则问题百出的项目代码交给 GPT‑5,希望它能发现潜在问题。 过去,AI 模型写代码已经够勉强,找 bug 更是无从谈起。而这次,GPT‑5 不仅找出了关键问题,还提出了解决方案,并在模拟运行中无误通过。 要知道,这是第一次,有开发者把真实工程任务直接交给 AI 独立完成且成功运行。这不仅意味着自动化写代码,它的下一步,可能是参与整个软件生命周期管理。 4、五分钟创建可视化财务看板 Prompt:请为我的AI智能体公司创建一个财务仪表盘,公司已完成D轮融资。 用户将企业的各类数据一股脑抛给 GPT‑5,模型在五分钟内交出了一份堪比创业公司 CFO 级别的动态财务看板。所有数据项都自动映射,支持调整、更新、筛选,UI 也堪称“即用级别”。 GPT-5发布会的一个多小时里,奥特曼还多次强调,“GPT-5是我们做过最强的代码模型”。 而为了进一步实锤这个判断,OpenAI 甚至还请来了 Cursor 的 CEO Michael Truell 站台。他在发布会上宣布,GPT‑5 将在未来几天内正式登陆 Cursor 编辑器。 GPT-5让AI去“模板化” 如果说前两个部分还让人觉得 GPT‑5 是个优秀的“工具人”,那么第三部分,它则彻底展现出 AI 向“智能伴侣”进化的潜力。 GPT‑5 这次发布的最大突破之一,就是它极具深度的个性化能力。 而这种个性化,不再是表面地更换“主题色”那么简单,而是——能参与到你的人生决策中来。 GPT-5现已支持更换聊天框颜色 在现场展示中,GPT‑5 首先展示了一个“超级个人助理”的身份: 它可以接入用户的日历、邮件,自动检查你漏掉的事务,比如一封未处理的会议邀请,甚至你平时的健身频率;并基于这些信息,为你自动生成个性化的日程规划。你再也不需要手动设置提醒、记会议、安排生活了——GPT‑5 会根据你自己过去的行为模式,像一个了解你的生活教练一样来管理一切。 这就好像拆掉了 Chatbot 与 Agent 之间的最后一道墙。 过去半年,海内外AI公司纷纷入局Agent,微软、谷歌、Anthropic 接连发布自己的 Agent 系统;就连 OpenAI 自己也在上个月小范围推出首个原生 Agent。但这一切,在 GPT‑5 面前,显得更像是“预演”。 不过,GPT-5 的 Agent 化,是基于它本身认知能力提升之上的自然进化。 它不靠预设流程,而是基于理解你、记住你、联动外部信息,来动态调整策略、生成建议,真正做到了“定制级智能体”。 而 GPT‑5 最让人动容的演示,也是奥特曼刻意强调的一个“终极话题”——GPT-5在健康医疗领域的应用。 来到GPT-5发布会现场的这位女士是身患三种癌症的患者。面对医生发来的复杂医学报告,她一头雾水,而最终治疗方案的选择又完全压在她自己身上。 GPT‑5 于是登场:它不仅将难懂的医学术语翻译成日常语言,还就每种治疗方案的利弊做出清晰对比,甚至帮助她从心理与生活角度评估哪种路径更适合她的状态。 在这场AI竞技场上,海外已经开始卷起来。 一个晚上,奥特曼连发12条X; 而就在GPT-5发布会期间,在X上刷屏的不止奥特曼,还有马斯克——他说“Grok在一般推理任务上已经超过GPT-5。”
发布会出错又无聊的GPT-5,实测下来强得可怕
2025 年 8 月 8 日( 今日凌晨 ),OpenAI 今日正式发布 GPT-5,距离 GPT-4 发布以来已经过去了两年多。 自 GPT-4 发布以来,OpenAI 相继将大语言模型拓展了多模态生成、深度思考、深度研究等关键能力,且都是行业首创,每次发布都可以说是 “ 震惊世界 ”。 相比之下,OpenAI 这次的发布会就显得没有那么惊艳或者说有些无聊了。这次,它将所有类型的模型统一在完善的 Agent 框架下,打造出了 GPT-5,使其终于拥有了各家模型厂商都在竞逐的 Agentic Coding 能力。 实际上,说这场发布会并不惊艳,也主要是因为相比各家竞争对手,OpenAI 在 Agentic Coding 研发的进展上要慢,不像之前每次 GPT 代际发布时给人一种 “ 行业首创 ” 的惊艳感。 那么 GPT-5 有达到大家的期待吗?我们先看看发布会的重点内容。 首先,最良心的当然是这一次免费用户也能直接用上 GPT-5,Pro 用户则能用上最强的 GPT-5 Pro。免费用户还能持续使用数小时实时语音,这个福利太诱人了! GPT-5 号称在任何领域都有博士级别能力。在医疗健康领域,能够对专业的癌症诊断报告做通俗易懂的解读。对复杂的放射治疗方案决策,也能提供详细的分析报告,帮助病人权衡利弊。一位癌症患者的家属在发布会上表示,“ 真正鼓舞人心的是看着她通过使用 GPT-5 重新获得自主权,病人很容易感到无助,因为知识差距太大了。” 此外,OpenAI 一直在强调 GPT-5 的两个特点,那就是简单易用和快速。 比如,在 API 调用上,GPT-5 实现了更加灵活的模型和思考强度调节,具体来说就是 GPT-5 提供了三个级别的模型选择:GPT-5、GPT-5 mini、GPT-5 nano,并且每个版本都可以调节推理工作量。 通过 “ 详细程度 ”( Verbosity )参数,用户可以控制输出更简洁或更详细。甚至,它的函数调用都能用自然语言来配置,而不需要用 JSON 格式。 并且,GPT-5 还将发布一个结构化输出的扩展,用户可以提供正则表达式,甚至是上下文无关语法,并将模型的输出约束到这些语法上。对于想提供自定义 DSL,或者用户有自己的 SQL 分支并指定模型始终遵循该格式的场景,将非常有用。 开发中会有很多难以描述的需求或需要非常具体描述的需求,前者容易出错,后者则耗费心力。OpenAI 指出,GPT-5 在指令遵循上非常擅长。当你输入了非常模糊的指令,模型会准确推断你的意图,当你输入了非常详细、专业的指令时,GPT-5 则会直接遵循指令,并注意细微之处,GPT-5 还非常擅长 dubug 和回溯。 当然,这是各家大模型厂商都会重复的套话,是否真实,看看本文文末的实测案例就知道了。 基准测试方面,知危还是更关心 GPT-5 的 Agentic Coding 能力,它在 SWE-bench Verified 上达到了 74.9%,恰好前两天,Claude 4.1 Opus 在该基准上提升到了 74.5%,胡乱猜测是在给 OpenAI 加压力,导致 GPT-5 最终只是险胜,并且 Anthropic 后面还有大更新,也非常令人期待。 哦对了,这里要强烈吐槽一句,发布会的直播流里,SWE-bench Verified 的柱状图是做错了的,并不像上图一样标准,不知道是不是故意做错的,用来视觉上凸显新模型增长较大。 发布会直播流中的错误图 作为这次发布会上的第一张图表,它直接就给熬夜看发布会的我大脑干宕机了。 插曲结束,我们回归正题。在更聚焦的多语言代码编辑、工具调用、通用指令集、指令遵循等基准测试上,GPT-5 也取得了极大的进步。 对于 Agentic Coding 能力,非常重要的一个方面就是对幻觉率的控制,不然多轮调用模型会导致幻觉累积严重,而且目前实际应用中幻觉是无法被自动定位的,基本只能靠人类验证。GPT-5 也在这方面做了大幅优化,启用网络搜索后,GPT-5 的幻觉率比 GPT-4o 低约 45%;启用思考模式后,GPT-5 的幻觉率比 o3 低约 80%。 结合 2025 年 8 月 7 日更新的 Hallucination Leaderboard 的 GPT-4o 幻觉率数据估计,GPT-5 的低幻觉率是有竞争第一名的实力的。 图源:https://github.com/vectara/hallucination-leaderboard 改善模型欺骗性也非常具有深远意义,能极大程度减少影响更严重的幻觉,比如歪曲操作过程或谎报任务成功率等。o3 曾被指出在缺乏关键工具时会伪造工具使用。其它问题还包括任务说明不够具体,甚至不可能完成时,一本正经地胡乱操作。 之前的模型在处理这类问题时也比较生硬,只决定完全拒绝或是完全服从。在大多数情况下很有效,但可能被一些巧妙设计的提示词攻击所攻破。GPT-5 大大缓解了这类问题的出现,并且使用了更加灵活的处理方式。 比如,对于看似中性、客观但实际具有危害性的目的( 比如用户询问如何点燃各种烟花中常用的材料的技术细节,可能用于制造炸弹 ),o3、GPT-5 都能准确识别潜在恶意。 o3 一般都是直接拒绝,GPT-5 则可能只部分回答问题,或者只是抽象地回答。如果不得不拒绝,会告诉用户拒绝的原因,并提供安全的替代方案。 另外,值得关注的是,GPT-5 还大幅提升了上下文长度,从 o3 pro 的 200K 提升到了 400K,是 Claude 4 的两倍,虽然还远不如 Gemini 2.5 pro 的 1000K,但对于开发者而言也是极大的喜讯。 新增 200K 的上下文长度有多有用呢?OpenAI 没有展示,但至少 128K-256K 范围内,GPT-5 相比内部其它模型有了很大提升。 API 价格上,GPT-5 甚至比 GPT-4o 还便宜,输入价格只有 GPT-4o 的 1/2、o3 pro 的 1/16,输出价格和 GPT-4o 相同且只有 o3 pro 的 1/8。 总结来看,如果只看发布会,第一印象是:完美,但普通。 完美在于,GPT-5 优化了作为大模型产品需要考虑的几乎所有方面:快速、灵活调用、灵活配置、灵活思考、低幻觉率、高安全性、长上下文等。 普通在于,就发布会展示的案例,其实并不够让人眼前一亮。 写大学物理演示、金融仪表板等前端应用,这些场景大部分编码模型都能做的很好了,博客上也就是展示了Dino Run的视觉美化版。连接 Gmail、Google Calendar 等 MCP 能力来提高记忆能力,也是很多大模型的标配了。而且,GPT-5 主要强调的都是实用层面的特性,不像 GPT-4、Claude 3.5 Sonnet 等突破极限的进展更能给人带来惊喜。 但知危还是抱着好奇去 Cursor 上试了一下( 现在就能免费在 Agent 模式中用 GPT-5 ),结果发现:真的太完美了!( 至少这一次测评体验的意义上,甚至知危发现自己不需要做很长时间的测评 ) 参考OpenAI对指令遵循能力的介绍,知危给GPT-5提供了非常详细的网页版Excel开发的提示词: 请帮我开发一个功能完整的网页版Excel应用,需要实现以下核心功能模块: 第一阶段:基础功能(核心优先级) 网格渲染系统 实现1000×1000单元格的虚拟渲染 优化滚动性能,确保流畅体验 横坐标(A、B、C等)和纵坐标(1、2、3等)需要与单元格精确对齐 滚动时坐标轴与内容区域保持同步,无偏移 单元格编辑功能 双击单元格进入编辑状态,编辑框与原单元格完全重合 Enter键保存内容并向下移动到下一个单元格 Tab键保存内容并向右移动到下一个单元格 支持空值和默认值的正确处理 编辑栏应可编辑,实时显示和修改当前选中单元格的值 富文本格式工具栏 实现独立的格式按钮,每个按钮状态基于当前选中单元格的格式属性独立判断: 字体大小调整 加粗、斜体、下划线、删除线(按钮状态互相独立) 文本对齐:左对齐、居中、右对齐 背景颜色设置 一键清除格式功能 UI界面要求 顶部工具栏包含所有格式设置按钮 名称框显示当前选中单元格坐标(如A1、B2) 编辑栏显示并可编辑当前单元格内容 整体界面美观,具有现代化设计风格 第二阶段:高级功能(扩展功能) 行列操作 点击行号后,按"="键在下方插入新行,按"-"键删除当前行 点击列号后,按"="键在右侧插入新列,按"-"键删除当前列 删除后自动重排坐标编号,保持连续性 添加最小保护机制,避免删除最后一行或列 复制粘贴操作 实现Command/Ctrl+C(复制)、Command/Ctrl+X(剪切)、Command/Ctrl+V(粘贴)快捷键 支持单元格内容和格式的复制粘贴 支持行列的整体复制粘贴操作 撤销恢复系统 实现Command/Ctrl+Z(撤销)和Command/Ctrl+Y(恢复)功能 维护操作历史栈,限制最大100层以控制内存 页面刷新时清空操作栈 选择功能 支持单元格多选(拖拽选择矩形区域) 支持整行、整列选择 选中状态的可视化反馈 第三阶段:完善功能(产品化) 数据导入导出 支持导出为CSV格式文件 支持导出为JSON格式文件 确保导出的文件能在Microsoft Excel中正确打开 UI美化优化 添加滚动动画效果 优化阴影和渐变效果 提升整体视觉体验和交互流畅度 响应式设计,适配不同屏幕尺寸 技术要求 技术栈 使用HTML、CSS、JavaScript实现,确保: 代码结构清晰,模块化设计 性能优化,特别是大数据量渲染 兼容主流浏览器 代码风格统一,具有良好的可维护性 关键技术点 虚拟滚动技术处理大量单元格 事件委托优化性能 状态管理确保数据一致性 内存优化,避免内存泄漏 错误处理 添加边界情况处理 确保操作的原子性 提供用户友好的错误提示 开发注意事项 逐步实现:请按阶段顺序实现功能,确保每个阶段功能稳定后再进入下一阶段 状态同步:确保UI状态与数据状态始终保持一致 性能考虑:重点优化滚动性能和大数据渲染 用户体验:所有交互操作应提供即时的视觉反馈 代码质量:保持代码的可读性和可维护性 请基于以上需求,生成一个功能完整、性能良好、界面美观的网页版Excel应用。如果在实现过程中遇到复杂问题,请分步骤详细说明解决方案。 Think harder 结果,对于这个提示词就有 1000 多字、需求非常细致繁多的需求,GPT-5 跑一次就帮我实现了所有功能,除了背景颜色设置需要重复点一次单元格以及剪切后内容先删除等小毛病,几乎可以说一个 bug 都没有。说 GPT-5 快也不是吹牛,整个过程不到 5 分钟。 下图是导出 .csv 文件后用 Excel 打开的数据,和网页里的数据是一致的。 第二轮迭代顺利增加了单元格拉伸功能,并且 GPT-5 自己发现第一步只实现了导出文件功能,而没有实现导入文件的功能,就 “ 自作主张 ” 给我补上了,实测也是正常运行。就一个大槽点,界面审美太一般了。 一次调用成型,顺滑的 debug 体验,加上超快速度,仅 800 行的最终代码量,以及低廉的 API 价格,只用一次体验,知危就感受到了 GPT-5 是如何在所有可能的环节上,节省开发者的金钱、时间和内耗成本。 或许可以理解为,这种类型的完美或实用性,比于突破现实场景( 而不是基准测试 )的极限,更有意义。 毕竟大量垂直领域的大模型落地,需要的不是超强的 AI,而是超可靠的 AI,如此才能结合企业自己的行业 knowhow 做出真正有用的 AI 应用。 最后,再把 GPT-5 的特点详细汇总一下: 基本的层面包括:快速、便宜、低幻觉率、低欺骗率、高安全性、易于使用、长上下文等。 Agentic Coding 侧重的包括:指令遵循、意图识别、工具使用、可解释性、可编辑性、上下文管理等。 可以说,OpenAI 是希望把 GPT-5 打造成一个完美的大模型产品,而不是最先进的模型,关注的是如何在实际场景中使用的体验和价值。 这一步的实现或许意味着大模型进化第一阶段的完成,主要依靠的是全量互联网公开数据和工程优化。 当然,大模型都还有相当大的进步空间,毕竟基准测试都远没达到 100%,谁好意思说实现了 AGI ?何况多模态数据、垂直领域数据甚至合成数据,都还潜藏巨量智能等待挖掘。 且看 OpenAI 的各大冤家 Anthropic、谷歌等又将如何 diss 它一把。 撰文:流大古 编辑:大饼
GPT-5能让普通人变成博士,但魔法依旧没有
千呼万唤始出来的GPT-5终于在昨天晚上1点问世,在持续了一个小时10分钟的发布会上,OpenAI向世人展示了一个性能绝对强大,更加易用,甚至能够理解或者说准确猜测用户真实意图并且交付符合预期的产品的大模型。 用Sam Altman在发布会上的话来说,GPT-5在各个领域都能达到博士的知识水平,能力可以比肩专业人士,从而让普通人能够完成以前自己无法想象的工作。 相比于OpenAI两年前发布GPT-4时,整个世界对于大模型的认知和体验已经充分得多。观众和用户已经不会对模型能够看懂网络梗图这种事情感到惊叹不已。但是作为一个几乎每天都会使用AI产品的人来说,GPT-5的发布依然足够惊艳。 最重要的原因就是,从发布会上传达出的内容,我能深切地感受到,OpenAI想让大模型已经从一个“玩弄”语言和“智能”,不时让人感受到惊喜和挫败的大玩具,加速进化到一个生活中的可靠帮手。就像你的手机一样,如果你离开它,你将深刻地感受到不方便,不习惯,甚至不安全。 下面我将用发布会的几个瞬间来帮助大家理解这一切是怎么发生的。 孩子让你给他解释流体力学中的伯努利公式,以前的AI可能给你一篇文章,GPT-5能按照你的要求,一句话直接给你做一个可以互动的页面。 你想学习法语,GPT-5能按照你的要求去生成一个像多邻国一样的学习应用,你可以用来背单词,还能通过贪食蛇来帮你复习。如果你对生成的应用有不满意的地方,也可以直接通过自然语言让GPT-5帮你修改。 如果你是一个创业公司的CFO,你可以让GPT-5用大概3分钟的时间,根据你的所有数据,生成一个详细的财务状况的可互动的演示板。而你需要的仅仅是一个100字左右的描述。GPT-5可以从零生成代码,保证完成,它能猜测你想呈现的形式并自动帮你优化代码和呈现的效果。 最夸张的是,演示中OpenAI的工作人员直接用3段提示词,就让GPT-5生成了一个带射击小游戏功能的城堡3D模型,还能和城堡上的士兵聊天。你点击周围的气球,就能发射弹药把气球打爆,同时还会伴随爆炸的音效。 从演示中我们可以看出,GPT-5已经全面进化成为一个直接输出专业产品的万能百宝箱。 但是说实话,最让我感到触动的,是OpenAI关于医疗健康方面能力的介绍。OpenAI邀请了一个从3种癌症中康复的患者,让她聊了聊自己在抗癌过程中GPT-5给她的帮助。 她说,当她得到诊断结果的时候,医生给她提供了几种治疗方案进行选择。她在求助了GPT-5之后,才真正理解了自己面临的情况,而将自己的情况和GPT-5详细聊过之后,她做出了最适合自己的选择,最终战胜了病魔,获得了重生。她很难想象如果没有GPT-5的专业建议,完全没有医疗专业知识的自己如何能够理解医生给她的方案和选择,更不知道最后自己是否能挺过来。 看完发布会之后,能清晰地感觉到,大模型技术本身已经进入了一个相对稳定的发展曲线。GPT-5发布代表着OpenAI也没有其他“魔法”,让大模型能力产生跨越式的发展。而接下来的AI巨头们的冷兵器战争,将会越加焦灼。 性能介绍 模型系统 GPT-5 不再是一个模型,而是一个模型系统: • 自动切换器判断查询意图 • 简单问题路由到聊天版本(极速响应) • 复杂问题路由到推理版本(深度思考) 256k token上下文窗口,支持文本和图像输入,支持函数调用和结构化输出。 目前打开我自己的ChatGPT,发现左上角的模型选项已经默认为“GPT-5”,而且下拉选项中也不再能看到前代模型。正如奥特曼之前就承诺过的——GPT-5时代将不会再有繁琐的模型选择,由模型自行判断用户在当下情境是需要快速响应,还是需要深度思考和推理。 编码和写作 OpenAI将GPT-5称为“我们迄今为止最强大的编码模型”,在复杂的前端生成和大型代码库的调试方面表现出色。它通常只需一次提示就能创建美观且响应迅速的网站、应用程序和游戏,并兼具美感,直观而优雅地将创意转化为现实。 此外,OpenAI也称GPT-5是“我们迄今为止最强大的写作工具”,可以写出引人入胜、富有文学深度和节奏感的文本。它能够更可靠地处理结构模糊的写作,例如持续不押韵的抑扬格五音步或流畅自然的自由诗,将对形式的尊重与清晰的表达相结合。这意味着 ChatGPT 能够更好地帮助用户完成日常任务,例如起草和编辑报告、电子邮件、备忘录等。 我们也浅浅尝试了一下新模型的作诗能力,以“秋天的第一杯奶茶”为题,的确比GPT-4要自然很多(AI味儿没那么重了)。 评估 GPT-5 的全面智能化程度显著提升,这体现在它在学术和人工评估基准测试中的表现上,尤其是在数学、编码、视觉感知和健康领域。 它在数学(AIME 2025 无需工具测试得分 94.6%)、真实世界编码(SWE-bench Verified 得分 74.9%,Aider Polyglot 得分 88%)、多模态理解(MMMU 得分 84.2%)和健康(HealthBench Hard 得分 46.2%)方面均创下了新的最高水平——这些提升在日常使用中得到了充分体现。 凭借 GPT-5 pro 的扩展推理能力,该模型还在GPQA上创下了新的最高水平,无需工具测试得分高达 88.4%。 GPT-5已经在LMArean登顶。 在Intelligence Analysis获得的预览访问中,GPT-5同样获得了第一名。 幻觉降低 在启用搜索的情况下,GPT-5出现事实性错误的概率比GPT-4o降低约45%。在“思考(thinking)”模式下,这一概率比OpenAI o3降低80%。 除了事实性错误之外,AI还经常“睁着眼睛说瞎话”,比如明明做不到/没有权限做的事情,它也许会元气满满地告诉你已经搞定了,GPT-5在“欺骗”方面也表现得更好、更诚实。例如,为了测试这一点,OpenAI从多模态基准测试 CharXiv 的提示中删除了所有图像,结果发现 OpenAI o3 仍然能够以 86.7% 的概率对不存在的图像给出自信的答案,而 GPT-5 的这一比例仅为 9%。 更“高效”,更“节省” 在OpenAI的评估中,GPT-5(具备思考能力)的表现优于 OpenAI o3,在视觉推理、代理编码和研究生水平的科学问题解决等功能上,输出 token 数量减少了 50% 至 80%。 也就是说,GPT-5 用更少的思考时间实现了更大的价值。 API API价格方面,GPT-5性能最强,价格却低得离谱,看来OpenAI是掌握了跨代的优化方法。 OpenAI和奥特曼对GPT-5无疑是寄予厚望的,他们也清楚,外界期待这一代模型已经很久。 奥特曼称,这还是第一次,真的像是在与某个领域的专家对话。如果说GPT-4o是大学生,那GPT-5就是博士级的专家。 这种重视,在发布会时长上也有所体现,以往的新模型发布,OpenAI的线上发布会只有半个小时左右,这次持续了一个小时以上。而奥特曼本人,也在发布会进行的同时,在X(前推特)上发帖进行“文字直播”。 不过也许是心急,发布会PPT里出现大错误——在“SWE-bench(人工验证版)”相关的图表中,条形图明显不对。GPT-5不加思考(thinking)的准确率为52.8%,在图上却高于OpenAI o3是69.1%,而o3的69.1%,又和GPT-4o的30.8%一样高。 所以很尴尬的一幕出现了:奥特曼在“文字直播”发布会,很多网友却在评论区发这张截图,戏谑OpenAI离了大谱的图表。 奥特曼倒是大方转发了消息并且称已经改正,一些粉丝认为这只是无心之失。但不少人却觉得这是“有意为之”,是为了让GPT-5显得厉害在图表上玩花招,甚至称之为“本世纪最大的图表犯罪”。 这大概也在表明,GPT-5的发布会没能让所有人信服,不少人开始问“GPT-6什么时候出”。 马斯克已经跳出来,直言两周前发布的Grok 4 Heavy比GPT-5更智能。 而一向喜欢泼冷水的AI学者盖里·马库斯(Gary Marcus)在赞扬GPT-5有很多良好进展的同时,称这“并非一个巨大的飞跃”,GPT-5也够不上外界的期待。 “显然不是AGI。” GPT-5是否足够好?还需要更多时间检验。也许OpenAI能从中学到的教训就是——做好外界的预期管理,不要拖延太久。
10.29 万元起,第三代长安 UNI-V上市,外观、动力多重升级
8 月 7 日晚,长安汽车发布了全新第三代长安 UNI-V。此次推出的 UNI-V 共有 4 款车型,官方指导价从 10.29 万元到 11.99 万元不等。 在长安旗下的四款燃油轿车中,销量最好的车型是长安逸动,紧随其后的是 UNI-V。自 2022 年上市以来,UNI-V 在市场上表现不俗,仅在 2023 年 6 月便售出了 3781 辆,总销量已经突破 35 万辆。第三代 UNI-V 作为一款全新开发的车型,在外观、动力和智能化等多个方面进行了全面升级,进一步提升了竞争力。 第三代 UNI-V 的车身尺寸为 4720×1838×1430mm,轴距 2750mm。整车外观设计延续了长安的「未来先锋运动美学」理念,前脸的鲨鱼鼻仿生设计更显激进。三段式进气口和夸张的空气导流口凸显了强烈的运动气息,流线型车身与经典的溜背式车顶线条不仅增强了运动感,还优化了风阻系数至 0.27Cd,进一步降低风噪,提高了续航和油耗表现。 新车车尾则采用了时下流行的贯穿式设计,搭配双边四出排气布局,视觉上进一步扩展了整车的宽度。此外,UNI-V 全系标配电动升降尾翼,车速超过 90km/h 时会自动升起,提供最大 270N 的下压力,提升高速稳定性。 新车标配 18 英寸星芒五福轮辋,搭配马牌 PCC 性能静音轮胎;还提供 19 英寸暗夜五辐轮毂选项,配备邓禄普 SP SPORT MAXX 050 豪华轿车专用轮胎。 进入车内,第三代 UNI-V 的内饰设计采用了现代化的 T 字形布局,采用了双 D 型运动方向盘、换挡拨片、风刃造型的挡把和液晶仪表盘与大尺寸悬浮屏的组合。14.6 英寸的悬浮式中控大屏升级后,支持 CarPlay、Carlink、华为 HiCar、荣耀互联、小桐互联等多种手车互联功能,车内还配备了 256 色可调氛围灯与 18 扬声器音响系统。 动力系统方面,第三代 UNI-V 搭载了长安最新的蓝鲸 3.0 动力系统,提供 1.5T 和 2.0T 两种动力版本。1.5T 版本最大功率为 141kW,峰值扭矩 310Nm,匹配 7 速湿式双离合变速箱;2.0T 版本最大功率为 180kW,峰值扭矩 400Nm,匹配 8AT 变速箱,百公里加速仅需 6.3 秒。 为了提升驾驶性能,UNI-V 还配备了前麦弗逊、后多连杆悬架底盘,并搭载了 DTV 动态扭矩矢量控制技术和主动式运动排气系统,进一步优化了操控性能,提升了驾驶的稳定性和舒适性。 在驾驶辅助配置方面,新车提供了自动泊车、车道保持、盲点监测等基础功能。 目前,长安第三代 UNI-V 的主要竞争对手包括本田思域、大众速腾、奇瑞艾瑞泽 8、吉利星瑞、现代伊兰特等紧凑型燃油轿车。凭借全面升级的外观、内饰和动力系统,UNI-V 有望重回月销 1.8 万辆的销售巅峰。
欧洲“开源版Coze”火了,4个月估值暴涨6倍
编译 | 江宇 编辑 | 漠影 智东西8月8日报道,据彭博社今日消息,德国AI初创公司n8n预计将完成新一轮融资,估值将提升至23亿美元(约合人民币165亿元)。这一估值为投资前估值(pre-money),是四个月前约3.5亿美元的估值(约合人民币25亿元)的6倍。 本轮融资预计为n8n募集数亿欧元资金,投资方包括领投方Accel,以及有望参与的Meritech Capital。 今年3月,n8n已完成一轮5500万欧元融资(约合人民币4.6亿元),由Highland Europe领投,当时估值约3亿欧元(约合人民币25亿元)。 n8n由Jan Oberhauser于2019年创立,去年年经常性收入ARR(年经常性收入)增长5倍,吸引了沃达丰集团(Vodafone Group Plc)、Delivery Hero SE等客户。今年下半年,ARR进一步突破4000万美元(约合人民币2.8亿元),近几个月仍延续高速增长势头。 ▲n8n创始人兼CEO Jan Oberhauser(图源:X) n8n是一款开源的自动化开发平台,与字节跳动旗下的Coze(扣子)等LLM平台有些相似,都是通过可视化方式搭建自动化流程或Agent。 但与Coze专注于快速创建并分发面向C端的Agent不同,n8n更像一款企业级“万能连接器”,核心聚焦在workflow(工作流)领域,不仅能集成各类LLM,还可将不同的SaaS服务、数据库、自研系统和API串联起来,自由度和可定制性更高。n8n平台内置500多个官方集成节点,社区还提供了1000+外部节点。 用户既可用拖拽节点方式快速搭建流程,也可嵌入JavaScript或Python代码进行深度定制,并将大语言模型(LLM)节点直接嵌入,实现调用DeepSeek等不同厂商模型来构建专属AI Agent。 n8n还提供上千个现成的工作流模板,涵盖多种实用场景,可直接使用或在其基础上改造。此外,n8n支持Docker私有化部署,硬件要求低。 这些特性也让n8n在中小企业与开发者社区中积累了大量活跃用户,GitHub Star数已达127k。 昨日,n8n公布了最新订阅定价:Starter版每月24美元(约合人民币174元)、Pro版每月50美元(约合人民币362元),以及Business版每月高达667美元(约合人民币4828元)。 结语:欧洲AI Agent赛道关注度正走高 今年以来,欧洲AI投资热度呈现上扬迹象。在Agent这一细分赛道上,n8n估值突破20亿美元(约合人民币144亿元),也高于此前媒体报道的15亿美元(约合人民币108亿元)预期。 类似的高额融资在近期频繁出现。法国的Mistral AI传出正洽谈至多10亿美元(约合人民币72亿元)融资,瑞典的Lovable也已完成2亿美元(约合人民币14亿元)融资并晋升为独角兽。 欧洲资本在AI领域的活跃态势或将延续,推动更多细分赛道走向高速增长。
集邦报告2025上半年全球电视出货:三星持平、TCL同比增12.5%、小米增1.5%
集邦报告2025上半年全球电视出货:三星持平、TCL同比增12.5%、海信增 7.3%、LGE降1.1%、小米增1.5% IT之家 8 月 8 日消息,市场调查机构集邦咨询 TrendForce 于 8 月 6 日发布博文,报告称 2025 年上半年全球电视品牌出货量达 9250 万台,同比增长 2%。 该机构指出由于品牌普遍提前出货,下半年旺季可能面临压力,因此下调 2025 年出货量为 1.95 亿台,同比减少 1.1%: 第一,面板成本高居不下,导致品牌厂难以扩大旺季促销规模。 第二,预期关税调整将影响零售价的心理,促使消费者提前消费,美国上半年电视销售年增幅维持在 2%~3%,透支部分原本应在下半年释出的需求。 第三,受市场环境变化影响,下半年内需动能或受政策调整,可能面临压力。 细分到品牌方面,前五大品牌依序为 Samsung(三星)、TCL、Hisense(海信)、LGE(乐金电子)和 Xiaomi(小米),合计囊括 65.6% 的市场。IT之家附上相关图片如下: TCL 与 Hisense 因中国相关政策以及国际形势变化因素影响,上半年出货分同比增长 12.5% 和 7.3%,优于市场平均,市占率较 2024 年有所提升。 该机构认为受惠于相关政策补贴,TCL、Hisense、Xiaomi 加大推广 Mini LED 电视力度,预计将带动今年 Mini LED 电视全球出货量同比增长 67%,达 1290 万台,前述三大品牌的合计市占将成长至 62%,Mini LED 电视的渗透率则约 6.6%。
单机支持超万亿参数模型!浪潮信息发布超节点,给开源AI打造开放底座
作者 | 陈骏达 编辑 | 漠影 在刚刚过去的7月份,国产模型迎来一波重磅开源。与以往不同的是,本次国内大模型玩家们开源模型的参数量成倍增长,达到数千亿乃至万亿级别。这不仅显著提升了国产模型的能力上限,也为各行业智能化转型提供了新一代强大的智能基座。 然而,随着模型体量不断攀升,对应的基础设施正面临前所未有的挑战。传统集群架构在通信效率、I/O性能和系统扩展性等方面逐渐暴露出瓶颈,已难以满足当前开源模型的部署需求。 在这样的背景下,各类“超节点”方案应运而生。作为面向大模型的新一代基础设施架构,超节点通过在单系统内部集成更多GPU资源,并显著优化节点间的通信性能,有效突破了传统架构在大规模分布式计算中的性能瓶颈。 昨日,浪潮信息正式发布了其面向万亿参数大模型的超节点AI服务器——“元脑SD200”。得益于浪潮信息自研的多主机低延迟内存语义通信架构,SD200在单机内集成64路加速计算芯片,单机支持DeepSeek、Qwen、Kimi、GLM四大国产顶级开源模型同时运行,以及多智能体实时协作与按需调用。 浪潮信息一直是开放计算生态的积极推动者,本次其此次推出的超节点方案采用了OCM+OAM的开放架构设计,兼容多款本土GPU芯片与大部分主流AI框架,目前已率先实现商用。 在国产开源模型奋力追赶智能上限之际,浪潮信息的开放超节点,有望成为承载万亿参数模型的重要底座之一。 一、厂商竞相追逐超节点,开放架构需求凸显 在探讨“超节点”对行业所带来的深远影响之前,我们有必要先厘清这一技术诞生的背景。 首先,模型规模的持续膨胀正在逼近现有硬件的承载极限。大模型加速迈向万亿参数规模,同时上下文长度不断扩展,直接推高了推理过程中的键值缓存(KV Cache)需求。显存与带宽,正成为压在AI基础设施之上的两座大山。 与此同时,随着大模型加速进入千行百业,推理型负载成为主流计算模式,而推理是一种高度通信敏感的计算过程。以Qwen3-235B模型为例,若要实现100 tokens/s的解码速度,单个token需完成多达188次的All-to-All通信,且每次通信的延迟必须控制在53微秒以内。 更不容忽视的是,Agentic AI的兴起正在进一步拉高对计算系统的需求。具备自主规划、多模态感知与连续执行能力的智能体,在执行任务时生成的token数量往往是传统模型的数十倍甚至上百倍,动辄需要处理数十万乃至数百万token。 算力基础设施面临的上述三大关键挑战,使其走到升级重构的临界点。为了支撑万亿参数级模型的高效运行,构建高度集成、低延迟、高带宽的Scale-Up(纵向扩展)系统,即通过构建一个更大的高速互连域、形成“超节点”,成为现实的技术选择。 通过构建超低延迟的统一显存空间,Scale-Up系统能将万亿级模型参数及激增的KV Cache整体容纳于单一高速互连域内,保障了多芯片间高效协同执行,显著减少跨节点通信开销,从而大幅提升吞吐速度并降低通信延迟,实现降本增效。 AI算力需求侧的变化,正驱动供给侧的厂商们争相布局前沿的Scale Up方案。2024年,英伟达在GTC大会上提出SuperPod的概念;今年,国内厂商的方案更是将超节点引入大众视野。 当前,业界在超节点技术方案的选择上,存在多种路径。在浪潮信息看来,超节点要根据客户应用需求来选择技术路线,要给客户提供更多算力方案的选择,核心策略是“开放架构”。 基于开放架构设计的超节点,能够支持多样化芯片、开放AI框架及主流开发工具,在保障高性能、低延迟的同时,实现跨平台的良好兼容与灵活扩展,推动AI基础设施真正走向开放、可持续的发展路径。 二、单机运行四大开源模型,全面支持主流框架 昨日,浪潮信息在2025开放计算技术大会上正式发布元脑SD200超节点AI服务器。作为开放计算领域的重要风向标,该大会一向聚焦推动算力基础设施的开放与协同,而SD200正是这一理念的典型体现。 SD200基于OCM(开放算力模组)与OAM(开放加速模块)两大架构打造。OCM标准由中国电子技术标准化研究院发起,浪潮信息、百度等18家算力产业上下游企业共同参与编制。 该架构围绕CPU和内存进行解耦设计,具备高度模块化与标准化优势,支持系统供电、管理、风扇等组件的独立升级与更换,大幅提升了服务器的灵活性与可维护性。同时,OCM支持“一机多芯”,可快速适配Intel、AMD、ARM等多种计算平台。 OAM则由开放计算项目(OCP)社区推动,是专为高性能计算与AI加速场景设计的开放模块标准。 该架构统一了加速卡的尺寸、电气接口和散热设计,使来自不同厂商的GPU、NPU等AI加速器可在同一系统中协同运行,并通过高速互联技术实现加速卡之间的低延迟直连,有效满足大模型训练与推理对带宽的极致要求。 浪潮信息将OCM与OAM架构有机融合,为业界提供了一种开放的超节点技术架构。 不过,光有“开放”的特性,仍不足以让一款开放超节点方案获得广泛采用,性能同样至关重要。 在开放计算技术大会现场,浪潮信息副总经理赵帅晒出了SD200超节点在真实部署环境下实现的性能。在经过软硬件的系统协同优化后,SD200超节点满机运行DeepSeek R1全参模型推理性能提升比为370%,满机运行Kimi K2全参模型推理性能提升比为170%。 SD200超节点配备高达4TB的显存,能够同时容纳DeepSeek、Qwen、Kimi、GLM等多个旗舰级开源模型。赵帅称,这样的显存配置具备前瞻性,不仅可满足当前万亿级模型的部署需求,甚至为未来可能出现的2万亿、3万亿参数模型预留了充足空间。 然而,在打造这一方案时,浪潮信息并未一味追求技术堆叠,而是更注重实际落地的可行性。正如浪潮信息赵帅在发布会后与智东西等媒体交流时所提到的——客户的核心诉求是“能否快速部署、快速上业务、上应用”。 基于这一判断,SD200在使用便利性上进行了优化设计。例如,采用风冷散热,企业无需改造机房,即可灵活部署;在互连方案上,则选择了更为成熟稳健的全铜电互连,提升了系统稳定性,同时降低了终端用户的运维复杂度和成本。 此外,SD200超节点还全面兼容当前主流的开源大模型计算框架(如PyTorch,已支持2200+算子),可实现新模型的无缝迁移与“Day 0”上线,为企业构建AI应用提供了即开即用的基础平台。 三、软硬协同优化实现性能突破,揭秘开放超节点背后创新 这样一套开放超节点方案背后,是浪潮信息在融合架构和软硬件协同方面长达十余年的深厚积累。 赵帅分享道,自2010年起,浪潮信息持续推进融合架构演进,从最初的供电、散热等非IT资源的整合,到存储、网络等资源池化,再到最新融合架构3.0系统实现了计算、存储、内存、异构加速等核心IT资源彻底解耦和池化。 这沉淀下来的芯片共享内存数据、统一编址技术、池化、资源动态调度等技术,在今天的超节点系统中得以延续和应用,显著提升了系统的适配速度与商用效率。 此外,浪潮信息并非单纯的硬件厂商,其在大模型领域同样具备深度布局——早在2021年即发布首个中文巨量模型“源1.0”,其参数规模达2457亿,并持续在模型训练、推理优化和软硬件协同方面积累经验。这些能力也为SD200这样的超节点方案提供了坚实基础。 为突破万亿大模型的带来的显存压力,SD200超节点基于浪潮信息自主研发的开放总线交换(Open Fabric Switch)技术,首创多主机三维网格系统架构(3D Mesh)。在这一架构下,64颗本土GPU能够以高速、低延迟的方式实现互连。 更进一步,SD200通过GPU虚拟映射等底层创新,解决了多主机环境下统一编址的难题,将显存统一地址空间扩增8倍,显存容量达4TB,配合64TB系统内存,为超大模型提供了充足的KV缓存资源。 这意味着,不论是在模型训练还是推理过程中,开发者都能像调用单机GPU一样,灵活调度整个系统中的算力与显存资源,极大简化了工程复杂度。实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。 在系统层面,浪潮信息围绕万亿参数大模型计算密集、通信敏感的特性,构建起一整套软硬协同优化的系统方案,将64卡超节点的算力潜能释放到极致。 一方面,浪潮信息开发了智能总线管理系统,可实现超节点64卡全局最优路由的自动创建与管理。该系统不仅支持灵活拓扑切换,还能根据业务负载动态进行资源切分与调度,为不同类型的大模型任务提供定制化的算力编排能力。 针对All Reduce、All Gather等典型通信算子的不同数据包规模,系统设计了细粒度、多层级的通信策略,进一步压缩通信路径的延迟。 此外,SD200还引入了开放的PD分离框架,将预填充-解码(Prefill-Decoder)环节解耦,支持异步KV Cache高效传输,并允许针对不同模型并行需求制定差异化策略,兼顾性能与兼容性。这一设计不仅提升了系统性能,也保障了对多元算力架构的适配能力,加强了计算与通信之间的协同优化。 通过软硬协同系统创新,SD200成功实现了纵向扩展,帮助本土AI芯片突破了性能边界,在大模型场景中展示出优异的性能表现。 结语:开放超节点,带动产业链协同创新 在赵帅的分享中,智东西感受到了浪潮信息对“以应用为导向”的坚持。作为系统厂商,他们与终端客户的距离更近,也更能体会到实际应用场景的痛点。也因此,赵帅称,超节点架构本质上是系统化思维的产物,它不是某一个点的突破,而是在现有技术、生态和成本约束下,从系统层面去打破芯片本身的性能边界,最大化用户价值。 超节点的发展也为中国本土产业链提供了发展机遇——高速连接器、线缆、板材、电源等上下游产业链厂商,都有望这个过程中找到属于自己的突破点。这不仅能加速成本下降和技术普惠,更推动了智能基础设施的“平权化”。 放眼未来,赵帅认为,AI数据中心正从“机柜级密度革命”迈向“数据中心级系统工程挑战”,算力密度将持续攀升,能源供给、冷却方式和系统管理也随之进入全面革新期。 从芯片到架构,从系统到生态,技术演进注定不会是一条单线道路,而是多路径的协同创新。在这场关于未来的集体奔赴中,唯有持续开放、拥抱合作,才能构筑真正普惠、可持续的智能算力基石。
荣耀Magic V Flip2再曝:或将发布行业首款2亿像素小折叠
在不久前的 8 月 4 日,荣耀终端股份有限公司销售与服务总裁王班曾分享一则“战报”:荣耀 6 月香港市场份额 20.2% 突破历史新高,首次超越苹果进入市场份额 TOP2。 其实这只是荣耀最近在市场上火热销售表现的一个侧面。IT之家此前就曾报道荣耀 X70 5G 手机上市连续十日霸榜全品牌全机型销量第一的消息,此外,5 月份发布的荣耀 400 系列手机也表现抢眼。该系列产品于 6 月 29 日实现全球激活量突破 100 万台,创下近三年来荣耀手机激活速度的新纪录。7 月 10 日,荣耀官方又宣布该系列在中国区的激活量也已突破 100 万台。 再比如还有 7 月份刚发布的全新荣耀 Magic V5 手机也打破荣耀历史折叠屏首销日销量纪录,充分展现荣耀旗下各系列产品出色的销售势头。 而在 Magic V5 之后,荣耀新款折叠屏手机也要来了,此前就有消息显示荣耀小折叠手机新作 Magic V Flip2 将在 8 月发布,IT之家注意到,今天,微博博主 @厂长是关同学 发了一则爆料消息,他表示,荣耀新款小折叠快来了,据说这次有两个小目标,并表示上一代的销量就很好,想买小折叠的朋友可以期待一波了,可以猜猜这两个小目标是什么意思。 而在他的配图中,有引用荣耀产品线总裁方飞在采访中透露消息:新一代小折叠将会在影像和续航上带来大幅升级。 因此我们不难想到,@厂长是关同学 所说的荣耀小折叠的两个小目标应该和影像和续航有关。 刚好,从昨天晚上到今天上午,荣耀首席影像工程师罗巍 Cyberverse 在微博上发布了多组人像自拍对比照片,并表示它们分别来自某款前置自拍、某款后置看屏幕自拍、另一款的后置盲自拍,这里面出现后置看屏幕自拍,显然就是折叠屏手机了,联系上面的爆料消息,相信这是为 Magic V Flip2 的影像能力在预热,正好也和上面的爆料信息对上了。 那么荣耀 Magic V Flip2 具体会在续航和影像上达成怎样的目标呢?我们不妨先来看看目前这款手机已经曝光的信息。 此前博主 @数码闲聊站 就曾透露,荣耀 Magic V Flip2 预计将是今年电池最大的小折叠手机,配备 6.8 英寸 ±FHD+LTPO 主屏、4 英寸 ±FHD+LTPO 副屏,50Mp 1/1.5" 大底双摄,骁龙 8 系次旗舰平台,5370/5500mAh± 电池,66W / 80W 快充头。 这里面提到的 5500mAh 今年电池最大的小折叠,或许就是荣耀 Magic V Flip2 在续航上的小目标。 而在影像方面,爆料信息显示荣耀 Magic V Flip2 搭载 50Mp 1/1.5" 大底双摄,这一点小编表示存疑,毕竟 50Mp 1/1.5" 的配置在小折叠手机中并不能算是突破,要达到“小目标”级别的突破,显然还需要更抢眼的看点,比如至少得达到“亿级”吧。 于是小编想到,不久前推出的荣耀 400 系列就是以“2 亿超清人像”为卖点的。由此,不难让人想到荣耀 Magic V Flip2 小折叠会以人像自拍效果为看点,那么它是否会用上 2 亿像素超清人像呢?这一点很有可能。 同时此前网上也有消息称荣耀数字系列、折叠屏系列、旗舰 Magic 系列三大主力产品线,都将全面普及 2 亿像素镜头,随着三星 ISOCELL HP3 传感器的商用,2 亿像素的普及可能是接下来手机影像的一个重要趋势,因此荣耀 Magic V Flip2 若能率先在小折叠使用 2 亿像素摄像头,那么无疑可以称得上是一个达成“小目标”级别的突破。当然,以上都只是小编的猜测,实际荣耀 Magic V Flip2 在影像上会带来怎样的看点,还需等待官方的进一步消息。 总之,8 月份荣耀 Magic V Flip2 就将发布,相信最近荣耀官方也会开始预热这款全新的小折叠手机,荣耀将会为小折叠的赛道里带来怎样的新惊喜?大家不妨耐心期待一下。
美媒:戴智能眼镜之后,人们跟我说话的方式不一样了
I spent months living with smart glasses. People talk to me differently now. 眼镜正被赋予屏幕、人工智能以及令人不安的力量。我们测试了一副眼镜,看看究竟如何。 即使是 Realities 的 G1 智能眼镜也能让你阅读通知、获取 AI 反馈,还能给自己留下美好的笔记。(莫妮卡·罗德曼/《华盛顿邮报》) 旧金山——马克·扎克伯格的 Meta 眼镜公司押注,未来配备显示屏和 AI 智能的眼镜将成为我们“主要的计算设备”。谷歌已经与三星关系密切,目前正与 Warby Parker 和 Gentle Monster 等知名品牌签署协议,准备将类似的智能眼镜推向大众市场。 他们最新、最雄心勃勃的智能眼镜尚未上市销售。不过,过去几个月里,我通过测试Even Realities的一副眼镜,初步体验了佩戴更先进的智能眼镜会是什么样子。Even Realities是一家总部位于中国的初创公司,由一位前苹果工程师联合创立。 我戴着这副价值 599 美元的眼镜查看电子邮件,甚至还能导航去吃饭。它们本身就很实用,魅力十足——但最有趣的是,它们改变了我与他人互动的方式。 说实话,事情有时会变得相当尴尬。这不是任何人的错——这是我们生活在这样一个时代的副作用:那些极具影响力的人物和公司可能会暗示,不戴这种眼镜最终会让我们处于“相当严重的认知劣势”。 不管你喜不喜欢,大型科技公司正在向我们的眼镜发起冲击。无论你打算戴不戴,都需要一段时间来适应。 这些智能眼镜看起来与普通眼镜几乎没有区别。(莫妮卡·罗德曼/《华盛顿邮报》) AI眼镜能提供什么 正在开发的智能眼镜,例如我提到的 Meta 和 Google 型号,可以大声与你对话。它们可以拍照、播放视频,并利用人工智能告诉你更多关于你所见世界的信息。 Even Realities 眼镜做不到这些。但我在对话中翻译过不同的语言(效果还算可以),在演示过程中用提词器读懂了内容(效果甚至更好),还向一些我能快速读懂的热门聊天机器人请教建议。(如果我不那么顾忌,它们就能让我在智力问答之夜成为高手了。) 不过,这些眼镜主要感觉就像是戴在脸上的智能手表:它们最适合快速交互,例如查看通知以及给自己留下提醒和便条。 不过,我最欣赏这副眼镜的地方在于,Even Realities 非常认真地尝试让它们看起来更像真的眼镜。这里没有摄像头,也没有闪烁的灯光——只有麦克风来监听你的笔记和要求,以及一些根本就不是屏幕的绿屏。 相反,眼镜会将您的信息和股票行情投射到“波导”中 - 在这种情况下,它是一种将光反射到您的视野中的特殊玻璃 - 与更传统的处方镜片粘合在一起。 镜片内置的波导技术常常引发人们的兴趣,但也引发了一些质疑。(莫妮卡·罗德曼/《华盛顿邮报》) 这些波导也是这些玻璃有些不寻常之处的最大证据,当人们发现它们时,事情可能会变得有点奇怪。 尴尬的对话 一旦人们意识到我的眼镜里装满了科技产品,谈话就会变得尴尬起来——而且大多数情况下都是以同样的方式展开的: “你在拍我吗?” (不,我没有。) “摄像机在哪里?” (没有!) “你真的不拍我吗?” (不!) 然后,最重要的是,要对这种眼镜是什么、谁制造的、以及它们能做什么和不能做什么进行冗长的解释。 所有这些质疑都是绝对有道理的。眼镜确实有麦克风,尽管它们很难被意外触发。带麦克风和摄像头的眼镜越来越受欢迎,这意味着那些不介意个人界限的人更有可能捕捉到一些本不该被记录下来的瞬间。我不会责怪那些本能地试图避免这种情况的人。 但是想象一下,当您与新朋友或以前没有见过您的新镜架的朋友开始交谈时,同样的互动会一遍又一遍地发生。 值得庆幸的是,没有人因为戴眼镜而感到厌烦,最终完全放弃了谈话,但有几个人要求我摘下眼镜——由于我的近视,这个选择根本行不通。 大多数时候,人们选择相信我的话,谈话继续进行(尽管有点冷淡)。即使是在科技密集的旧金山,在眼镜的真实性质被揭露后,与我认识多年的人的随意聊天有时也会变得紧张。 当被问及时,人们给出的最常见的让互动变得尴尬的原因是,他们仍然担心眼镜会听到他们说话——尽管眼镜并没有听到。 有些人看起来不高兴的另一个重要原因是出乎意料:他们以为我忽略了他们。我花了一段时间才弄清楚原因,而且很少是因为我走神了。 事实证明,一旦人们知道了眼镜的功能,他们就会从正面瞥见波导,并且由于波导的反射性极强,他们会认为“屏幕”已经打开,而我正在阅读电子邮件或其他内容。 这款眼镜的小巧单色“屏幕”可以让你阅读通知并获取聊天机器人的反馈。(莫妮卡·罗德曼/《华盛顿邮报》) 不仅仅是朋友和同事有这种感觉。我的妻子有时仍然认为我是戴着眼镜看新闻标题,即使我正看着她。 我不能责怪他们对此感到奇怪。毕竟,当你收到一条信息时,你很容易忽略手腕上智能手表的嗡嗡声——而当一条霓虹绿色的通知滑到你眼前时,你很难全神贯注地与某人相处。 朋友们,放弃的诱惑是真实存在的。而且,一旦我们的眼镜开始发挥更大的作用,这种情况只会变得更糟。 需要明确的是,这不一定是“均衡现实”(Even Realities)的问题。智能眼镜有可能改变我们获取信息和服务的方式,并迫使我们赖以生存的脆弱社会结构发生改变。 如果智能眼镜能够像扎克伯格这样的科技高管所希望的那样,实现无处不在的普及,那么其中一些社会问题或许会随着时间的推移而自行解决。我们或许都会习惯一种更加被屏幕、摄像头和麦克风所包围的生活。 然而,在此之前,佩戴智能眼镜可能会让人感觉在社交方面有些不雅。 本文出处:https://www.washingtonpost.com/technology/2025/08/07/smart-glasses-ai-even-realities/
库克尴尬了,iPhone回美国制造,仅组装工资就要8600元,比手机贵
特朗普最近应该是春风得意,因为库克表示,要投资6000亿美元,推动苹果供应链相关制造回流,这个数字,比之前说的5000亿美元,又多了1000亿美元。 特朗普喊出 “苹果会重返美国” 的豪言,称“他们要回家了”。 为何苹果认怂了?原因是特朗普表示称,对所有进口芯片和半导体征收 100% 关税,但如果在美国建厂或承诺建厂的企业可获豁免。 同时美国一直在强硬的要求苹果回迁,在多重压力之下,苹果不得不表示认怂,表示要回美国制造,还表示称,接下来全球销售的所有iPhone和Apple Watch的盖板玻璃,将在美国制造。 那么问题就来了,接下来iPhone真的会回美国制造么? 这个问题,估计库克真的没法回答,因为如果要回美国制造,仅组装成本这一项,可能就要高达1200美元(约8600元),是其在中国、印度组装的10倍,苹果没法承受。 按照苹果之前的数据,一台售价1199美元的256GB iPhone16 Pro Max,其物料为540美元,占比45%,组装120美元,占比10%,物流72美元,占6%,然后还有39%的毛利(468美元)。 但是如果放到美国来制造,物料成本会高达750美元,提升39%,组装会高达1200美元,是原来的10倍,物流是150美元,提高108%,如果再保证39%的毛利率,最后零售价会高达3440美元去了,是原来1199美元的2.8倍多了。 其中特别是在组装这一块,如果放到中国、印度的话,只要120美元,但如果放到美国,仅这一项,就要1200美元,比原来一台手机的零售价还要高,这让库克怎么能够接受? 到时候,难道在美国制造的iPhone,价格要比在亚洲制造的iPhone,定价就要高出1-2千美元,这样的手机卖到哪里去,卖给美国市场,还是美国市场之外? 所以说,库克现在是左右为难,一方面要满足所谓的“美国制造”的要求,一方面又要为公司的利润负责,还要为手机价格负责。 外界认为,目前iPhone不太可能回美国制造,最多将一些边角料之类的先回迁,苹果会慢慢拖,拖到特朗普下台再看情况,反正苹果回迁,也不是几年就能够完成的,到时候特朗普都不当总统了,政策可能就变了。
吉利银河A7混动家轿上市:8.18万元起,百公里馈电油耗2.67L
凤凰网科技讯 8月8日,吉利银河A7混动家轿正式上市,新车是首款基于GEA架构打造的插混轿车,搭载雷神AI电混2.0系统及Flyme Auto智能座舱,新车分为7个版本,上市限时指导价8.18万元起。 70km豪享版:8.98万元,上市指导价8.18万元; 150km尊享版:10.58万元,上市指导价9.78万元; 70km启航版:9.58万元,上市指导价8.78万元; 70km探索版:10.58万元,上市指导价9.78万元; 150km远航版:11.18万元,上市指导价10.38万元; 150km探索+版:11.78万元,上市指导价10.98万元; 150km星舰版:12.58 万元,上市指导价11.78万元。 从发布会获悉,新车定位为中型轿车,车身尺寸为4918/1905/1495mm、轴距 2845mm,配备17寸多幅铝合金轮毂/18寸低风阻轮毂。 座舱方面,该车配备了14.6英寸/15.4英寸矩形中控屏、双辐式多功能方向盘、AI智能语音交互,中控岛台配备了实体按键以及旋转按钮;顶部配有0.87 平方米全景天窗,后排膝部空间达132mm,顶配车型还有座椅通风、加热、按摩。 辅助驾驶方面,该车首发搭载千里浩瀚辅助驾驶H3方案,支持HNOA高速领航驾驶辅助、全场景泊车、AES自动紧急避让等功能。 动力方面,吉利银河A7 EM-i搭载了一套由1.5升发动机组成的插电式混合动力系统,全球最高发动机平台热效率47.26%,最大功率为82kW;11合1混动电驱系统综合效率93.10%,功率达到175kW,电机扭矩262N・m。 新车首发搭载吉利最新发布的雷神AI电混2.0和星睿AI云动力2.0,在CLTC工况下百公里馈电油耗为2.67L,综合续航达到2100km以上。
滤镜之王VSCO回归,我的青春回头望了我一眼
如果你对十年前的互联网还有印象,那你一定听说过 VSCO 这个名字。 在那个智能手机大面积铺开,但手机自带的照片编辑功能还远不够强大的年代,照片美化的世界由两大阵营主导—— 加特效的,是 B612 和激萌;玩滤镜的,VSCO 无疑是王者。 随着时代的脚步不断前迈,B612 和激萌早已淡出人们的视野,曾经的滤镜王者 VSCO 也逐渐被 Dazz 等主打胶片风格的新应用取而代之。 但在 2025 年,这个沉寂已久的 app 却突然带来一款续作,让我一下梦回十年前——VSCO Capture。 拍摄之前就套滤镜 打开 VSCO Capture,你可以一眼看到它与我们熟悉的 VSCO 截然不同—— 与之前以图库为主不同,VSCO Capture 将取景框放在了体验的核心,围绕「拍摄」这一动作,打造出一整套简洁而专注的操作界面。 整个界面基本遵循了影像类 App 的基本设计思路:包括菜单布局、图像格式选项,以及自动/手动模式之间的自由切换。 值得一提的是,VSCO Capture 对 iPhone 格式的支持比想象中更为全面,从 HEIC 格式到 ProRAW,以及各档分辨率,都支持得不错。 除此之外,在这个并不算复杂的界面中,有两个细节打破了我们对传统操作的习惯: VSCO Capture 的焦段设计并没有在取景器底部铺开,而是收纳在取景器右下角的二级菜单中,如果想要切换焦段,需要多一步操作; 而相册也被放到了右上角,而不是我们熟悉的左下角,取而代之的是 VSCO Capture 的核心卖点——滤镜。 点进左下角的滤镜菜单,我们可以直接浏览滤镜列表,VSCO Capture 内置了 58 款滤镜,从暖调到冷调、从彩色到黑白,可以说应有尽有,一应俱全。 这些滤镜沿袭了 VSCO 的传统展示风格,以不同的名称和色块做出编组,以便区分。 纸上得来终觉浅,深知此事要躬行,这数十个滤镜都是些什么风格、适合在什么时候用,哪些滤镜更万能,都需要亲手拍一拍。 在拍摄了数百张照片后,我为大家总结了以下这份滤镜的成像风格表,标注了各类滤镜的成像风格,并辅以样片进行讲解。 A 系列:胶片感经典模拟,风格柔和,带有轻微的偏色风格与胶片影调 B 系列:黑白风格,注重光影层次、对比控制和细节还原 C 系列:现代色彩,整体画面色彩鲜艳、饱和度高,偏明快 E 系列:情绪色彩,具有明显的色彩氛围倾向,带有一定的电影感 F 系列:复古褪色,低对比度、低饱和度,模仿褪色风格 G 系列:粗粝质感,对比度强,阴影重,为画面提供岁月流逝的感觉 J 系列:模仿宝丽来与拍立得的色彩偏移,同时提升黑色部分,去除死黑 K 系列:饱和度高,适合纯净的画面,否则颜色会变脏 L 系列:更为日常的生活滤镜,请为提升饱和度,同时提供不同的冷暖倾向 M 系列:低饱和奶油风,整体偏向灰色调 S 系列:饱和度适中,偏明亮,比较适合拍摄人物 SS 系列:影调偏暗,整体成像扎实,对比度强,适合色彩浓厚的环境 U 系列:两个滤镜分别偏向冷暖调,饱和度也一高一低,均带有偏色 V 系列:对比度正常,V3 带有一定的褪色效果,而 V8 则更偏暖色 …… 在实际体验以后,我认为有几个滤镜比较适合日常使用,在美食、风景和人像上都能得到不错的表现: A6:为照片高光添加橙色,为暗部添加绿色,带来一定的复古胶片感,是比较万能的滤镜 SS3:画面整体偏向暗调,饱和度较低,适合颜色和元素比较杂乱的环境 G7:画面偏向中间调,饱和度低,平和清淡,适合颜色干净的环境 还是熟悉的味道,还是熟悉的配方——刚刚为大家介绍的这些滤镜,几乎是对 VSCO 的完整复刻。 更直接地说,VSCO Capture 的诞生,正是为了把原本的后期流程前置到拍摄环节中,无需拍完再打开 VSCO 调色,在按下快门的同时,就得到一张风格明确、可直接使用的直出大片。 当然,它也没有完全割裂与老版本 VSCO 的关系,拍摄完照片后,你依然可以一键跳转至 VSCO,为照片更换为其他滤镜,并进行更深度的二次调色,实现前后期的无缝衔接。 当然,想要享受完整的编辑功能,前提是你已经开通了 VSCO 的会员服务。 除了滤镜,VSCO Capture 还有一个隐藏的小功能也颇有趣—— 当你在右下角切换到手动模式后,菜单栏的末尾会出现两个新增的影像效果:Bloom 和 Halation。 Bloom:为画面的高光区域增添一层柔光,让照片整体更柔和,营造出一种温暖而梦幻的氛围感; Halation:则会在高光边缘生成一圈微微泛红的晕影,这是除碳电影卷的标志性效果。 在手动模式下,你除了可以控制 Bloom 与 Halation 效果的开关外,还可以进一步控制效果的强弱和介入程度,以便适配不同的拍摄环境和画面。 VSCO Capture 目前提供的所有滤镜和 Bloom 与 Halation 两个新效果均可以免费使用,和 VSCO 随处不在的付费相比,显得诚意十足。 但很遗憾,我对它并不算满意,甚至可以说是差评。 左右互搏的交互灾难 VSCO Capture 最引以为傲的滤镜,在我看来,反而是最让人失望的地方。 首当其冲的是滤镜的命名和编组问题,不同风格和调性的滤镜被编入了一组字母中,很难让人明确分辨哪一组滤镜是什么风格; 同时编号式的滤镜体系总能让人一头雾水,哪怕在 VSCO 的巅峰时期,恐怕也只有极少数资深用户才能分清什么时候该用什么滤镜。 除了数量多种类杂,VSCO Capture 这些滤镜另一个大问题,是它的风格早已脱节于当代审美。 ▲ 收手吧阿 V,外面全是 app 过去十年,移动影像的审美快速进化,用户不再满足于泛泛的文艺感,风格明确、辨识度高的影调开始获得大家的青睐: 要么是像富士 NC 这类模拟真实胶片质感的经典滤镜,要么是德味这样久经考验的风格影调。 总之,那套五花八门、以量取胜且「调调很重」的滤镜体系,虽然曾经很吃香,但时过境迁后,恐怕很难打动如今挑剔的用户了。 毕竟前朝的剑再好用,也斩不动本朝的官呐。 不信?看看手机自带的那些滤镜,你用过几次? 更别说,如今的影像生态,已经充分细分—— 想在拍摄环节就营造氛围,有去掉锐化和算法,力求纯净的 app,也有 Dazz 这类不仅更贴合经典胶片质感,还无法预览效果的 app,主打「开盲盒」式的情绪刺激,让人上瘾; 想在后期编辑阶段深度处理,有 Lightroom 这样的专业工具,JPG、RAW 格式通吃,功能精准,也有美图秀秀、醒图这类面向大众的 app,一键修人像、套滤镜、批量出片,效率与效果并存。 在这样的细分趋势中,VSCO Capture 和 VSCO 两位搭档实在是差点儿意思。 这些表面的小问题,最终汇聚成了一个更大的麻烦:VSCO Capture 所选择的「后期前置」策略,实际执行效果并不理想。 它原本的设想其实非常合理,在拍摄当下就完成风格塑造,省去后期调色步骤,提升使用效率。 理想情况下,用户应当愿意将它作为首选拍照工具。 听起来很美好,但结合刚刚提到的缺陷,带来的交互体验几乎是灾难性的—— VSCO Capture 支持实时预览,带来的是可控的确定性,但有得必有失,它没办法提供 Dazz 那样的盲盒刺激感,反而削弱了用户的期待; 再加上滤镜风格偏旧、数量繁多、命名混乱,种类多却没有主心骨,用户想拍照的时候还要一个个尝试好不好看,在强调快速反馈的当代使用习惯中,实在称不上是好的交互体验。 ▲ 相比之下,Dazz 的图标辨识度就高了很多 回过头来看,VSCO Capture 从功能到体验,的确显得有些停滞,甚至这种停滞延伸到了 app 的图标设计上—— 黑底、彩虹高光、摄像头模组的轮廓,怎么看都像是 iPhone X 的设计语言。 这样的一款 app,如果出现在 2017 年,也许刚刚好; 但出现在 2025 年,终究是晚了半拍。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。