行业分类:
加载中...
头条分类:
加载中...
代码大模型安全规范正式定稿:百度阿里小米vivo等参与,中国信通院启动首轮评估
IT之家 6 月 20 日消息,近年来,代码大模型已成为企业研发人员辅助编程必备助手,能够生成、翻译、补全代码,帮助定位和修复错误。然而,代码大模型背后隐藏的风险挑战还有待讨论。 中国信息通信研究院(以下简称“中国信通院”)依托中国人工智能产业发展联盟(AIIA),联合业内近 30 家单位共同编制了《代码大模型安全风险防范能力要求及评估方法》规范(简称“规范”),聚焦代码大模型的安全能力,从基础功能出发,评估代码大模型的基础能力和安全风险防范能力。 2024 年 6 月 18 日,规范第三次研讨会成功举办,对规范内容做出进一步的完善和修订,现已完成定稿。 IT之家附部分参编单位如下(排名不分先后): 中国信息通信研究院 北京百度网讯科技有限公司 科大讯飞股份有限公司 蚂蚁科技集团股份有限公司 中国邮储银行 中国民生银行 中债金科信息技术有限公司 交通银行 华夏银行 龙盈智达(北京)科技有限公司 北京市商汤科技开发有限公司 阿里云计算有限公司 北京大学 小米移动软件有限公司 维沃移动通信有限公司 海信视像科技股份有限公司 浪潮软件科技有限公司 北京云起无垠科技有限公司 浙江大学滨江研究院 广东拓思软件科学园有限公司 浙江御安信息技术有限公司 万商天勤(上海)律师事务所 深圳开源互联网安全技术有限公司 据介绍,规范的制定旨在全面评估代码大模型在安全风险防范方面的能力,通过分析和测试,确保模型在各个关键环节的安全性能。 本规范的评估不仅包括代码大模型的核心功能,也涵盖了与之相关的多个细分领域,如数据集、算法、模型、网络以及服务等。 ▲ 代码大模型安全风险防范能力评估框架 根据评估结果,规范将确定代码大模型的安全能力级别,为模型的进一步优化和安全加固提供指导,同时也为用户从安全性角度提供选型依据。 目前,中国信通院正式启动首轮代码大模型安全风险防范能力试评估工作,报名将于 8 月底截止,预计年底发布评估结果。
前OpenAI核心创始人Ilya出走记:SSI的超级安全革命
和OpenAI分道扬镳以后,Ilya“神秘而伟大”的事业终于揭开了面纱。 6月20日,前OpenAI核心创始人 Ilya Stuskever,在官宣离职一个月后,Ilya在社交媒体平台公开了最新的动向:将成立新的实验室Superintellgence(以下简称SSI),构建安全的超级智能。 ▲ 图源:社交媒体X截图 这个名,明眼人一看就知道是冲着OpenAI去的。 2023年12月,在OpenAI十年的Ilya官宣离职引起了整个AI圈的轩然大波。虽然离职的具体原因扑朔迷离,但在Ilya离职前后,OpenAI负责模型安全的由Ilya主导的超级对齐(Superalignment)实验室宣布解散,外界纷纷推测,Ilya一直以来的理念是谨慎地发展人工智能,与Altman大刀阔斧地推进技术的战略相左。 而SSI,首先坚持了OpenAI成为非营利组织独立实验室的初衷,其次践行了Ilya一直以来对模型安全的谨慎态度。并且Ilya还补充道:我们将以一个焦点、一个目标、一个产品,直接追求安全的超级智能。 ▲ 图源:社交媒体X截图 截至发稿前,Sam Altman并未回应,并没有让吃瓜群众们预想的“Altman假惺惺的表示祝福”成真。 而之所以业内如此重视Ilya在这个节点成立SSI,并不只是因为这个人,更是大模型的发展已经到了不得不重视模型安全的重要节点。 在刚刚过去的北京智源大会上,杨植麟、张鹏等一线创业者也曾讨论过这个问题,我们对模型安全的重视程度远远小于它的重要程度,而SSI的成立,或许会开辟一条与OpenAI完全相反的路。 01 用Ilya的眼睛,看AI的危险 似乎Ilya对模型安全是执拗的,甚至被人暗指“没必要”。“如果不是因为他是OpenAI的技术首脑,曾一手打造了GPT、DALLE-E等明星产品,SSI根本不会受到如此大的关注。” 但他们却忽略了,Ilya对人工智能技术的重要性,并不是从OpenAI开始的,而是从他的老师辛顿就奠定了他的话语权。 从80年代就开始战斗在人工智能最前线的辛顿,被誉为“深度学习之父”。作为教授的他桃李满天下(包括吴恩达),在他年轻一代的学生中,Ilya是最得意的门生之一。 ▲ 图源:辛顿和Ilya合影 2023年5月初,辛顿辞去他在谷歌担任了十多年的职位,表示作出这个决定是为了可以自由讨论“人工智能的危险”。此后,他频繁接受媒体采访,不遗余力地对人工智能可能操纵人类发出警报。 尽管人类可以赋予人工智能一些伦理原则,但辛顿仍然感到紧张,“因为到目前为止,我还想象不到更智能的事物被一些没它们智能的事物所控制的例子。打个比方,假设青蛙创造了人类,那么你认为现在谁会占据主动权,是人,还是青蛙?” 师从辛顿的Ilya,几乎完全继承了被辛顿“蒸馏”过的,对于人工智能的谨慎,以及在谨慎之下的小心翼翼。 Ilya之于OpenAI,许多网友都认为他的个人贡献要大于Sam Altman。如果说SamAltman是OpenAI的面子,那Ilya就是OpenAI的里子,或者说是技术灵魂。 私底下的Ilya很内向但却并不胆怯。他之所以如此,很多人好奇,他作为影响这个世界技术变革的人,一定看到了什么。 但却没有人知道。 Ilya在OpenAI打造的超级对齐实验室,目的就是为了通过可控的技术手段使得AI发展的路径可控,确保AGI的发展符合人类利益。 一些前OpenAI员工透露,Ilya对超级对齐实验室的工作非常重视,并亲自参与其中。他希望通过这一实验室的工作,为未来的AGI系统设计出可靠的对齐方案。 想要理解何为“超级对齐”,就要演示一下现在的对齐技术,通过RHLF注入,能够实现两种对齐:一种是价值观的对齐:比如不要建立男女的性别对立、不要歧视同性恋等等;另一种是话题层面的对齐:明确国家的边界、不让搞黄色、不能诈骗等等。但Ilya所谓的超级对齐,却并不是这么简单。 有人还记得人工智能的三原则么? 其中之一便是“无条件服从人类”,而价值观和话题的对齐是远远不足以完成这个目标的,Ilya他认为技术的本质类似于人类的生物进化,如果进化的开始,是一个没有“无条件对人类的爱”的 AI,那等它长成AGI以后,也一定不可控。 对应了他在X中发表的:直接追求安全的超级智能。 没错,超级对齐的本质其实是通过让大模型产生“对人类无条件的爱”。 这听起来似乎很扯淡,但或许SSI的本质就是如此。 02 人,AI安全的最后一道防线 那么问题来了,大部分人做不到。 是的,可能大部分公司都是OpenAI而非SSI。那么除了大模型公司在内部致力于构建一个安全、可信的大模型之外,这两年随着技术和应用的发展,社会各界也对AI和大模型的安全作出了许多努力。 2021年11月,联合国教科文组织就曾通过《人工智能伦理问题建议书》,希望为人工智能的发展,以及预防其潜在风险提供建议。 今年3月份,联合国教科文组织总干事奥德蕾·阿祖莱还在公开呼吁,希望各国尽快实施这项建议,为人工智能发展设立伦理标准。 而随着中国AI大模型的蓬勃发展,中国企业也越来越多地参与到了这类国际AI安全准则的制定中。 比如今年4月在日内瓦召开的联合国科技大会上,世界数字技术院(WDTA)发布了《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。 而这两项标准,由来自百度、腾讯、蚂蚁集团、科大讯飞等众多中国企业的专家学者共同参与编制而成。 在国际组织通过编制规范指导AI安全发展的同时,各地政府的法案也在相继落地。 5月21日,欧洲的《人工智能法案》正式获得了欧洲理事会的批准。这项法案最早由欧盟委员会在2021年提出,作为全球首个AI法案,它通过构建广泛适用的人工智能监管机制,为人工智能技术的发展提供了法律框架,为全球的AI监管提供了可借鉴的法律基础。 国内AI安全相关的政策则落地在2023年7月,国家网信办联合国家发改委、工信部等七部门,公布了《生成式人工智能服务管理暂行办法》,该办法就生成式人工智能可能面临的安全问题提出了一系列明确的约束规范。 当然,法律规定的社会的下限,大模型安全的上线仍然需要在产业界寻找答案。 我们前面提到,大模型在公司内部训练的过程中,需要通过数据、算法、学习框架等多个维度保证大模型的安全可靠。点击阅读《万字长文丨解构AI安全产业链条、解决方案和创业机遇》 但其实在公司外部,完成训练的大模型要推向市场,还存在一套由第三方完成的大模型安全测试评估框架,目前主流的安全性测评方法主要有固定数据集测评和红队模型测评两类。 2023年,OpenAI在GPT-4发布之前就曾对其进行了六个多月的评估、测试及改进。在这轮测试中,OpenAI就邀请了AI领域专家参与红队测试(Red Teaming)以识别安全风险。 固定数据集测评,则是由研究人员针对大模型的各类安全风险制定风险评估矩阵,类似绩效考核打分。 研究人员通过人类标注数据的方式采集安全性评估数据,然后以测试模型在这些数据集上的表现评估模型的安全程度。 2023年底,OpenAI在官网公布了名叫“Preparedness Framework”的安全评估框架,是这类固定数据集测评的范本之一。 ▲ OpenAI安全评估模型的计分卡,图源:OpenAI官网 在国内,清华大学计算机系的黄民烈研究团队在2023年3月就发布了大模型安全分类体系,该团队从系统层面和模型层面出发,打造更可控、可信的大模型安全框架,是国内较早参与到模型安全评估体系的团队之一。 除此之外,蚂蚁安全实验室也推出了大模型安全检测平台“蚁鉴2.0”和大模型风险防御平台“天鉴”两大产品。 在具体能力上,风险监测平台可以诊疗检测、定位问题;风险防御平台可以对风险进行防治。 比如在大模型生成可控问题上,蚂蚁安全实验室提出了如通过SFT、RLHF/RRHF、RLAIF等技术和高质量标注做人类对齐;在图像方面做风险抑制,进行可控调试;为大模型外挂千万级安全知识库生成和检索等等方式。 在模型层面的问题之外,使用模型带来的安全问题也同样重要。 6月11日,苹果在WWDC上推出了其全新的 AI 系统“Apple Intelligence”。为了保护用户隐私和数据安全,苹果将大模型的工作分为两类。 其中简单的任务在手机设备端执行,保证数据不离开手机。如果是需要调用云端算力的复杂任务,苹果打造了一套具备芯片级别隐私和安全保护的服务器——“Private Cloud Compute”。这套服务器可以实现加密传输,服务器只识别数据,不收集数据,且在任务完成后,该数据也会被立即删除。 其中关键的一点是,Apple Intelligence集成了GPT-4o作为第三方大模型支持。为了保证数据安全和用户的知情权,苹果设置Siri启用Chat GPT时会向用户提出申请。 也就是说,在苹果的安全框架里,虽然企业会做好一切前期准备,但用户自己才是安全防范的最后一道防火墙。 就像OpenAI一直都在官网提醒用户,“在使用 GPT-4 输出的内容时应格外小心,特别是在高风险场景下(如医学、化学等领域),需要人工核查事实准确性或者避免使用 AI 给出的答案。” 所以,虽然身处AI时代,工具已经如此强大,但在一切工具就绪之后,我们仍应记住,我们自己才是保护自己的最后一道防线。
TikTok,急着完成500亿KPI
2023年底,当刘易鑫看到同个园区交个朋友海外团队开始招人时,他没有想到,这家公司会在半年后,创下TikTok带货单场直播GMV突破100万美金的记录。 图/坐落在广州某园区内的交个朋友海外团队 来源/@TK快乐老头提供 2024年6月9日,在“山雨欲来”的美国市场,TikTok达人@iamstormisteele,凭借单场104.81万美元的GMV,成功引爆了TikTok美区带货直播的商家群。 作为2020年便入驻TikTok的MCN,易舟跨境创始人刘易鑫告诉字母榜,这场百万直播背后的操盘手正是交个朋友的海外团队(Befriends US)。而就在前一天,单场直播近70万美元的GMV记录,则由国内签下贾乃亮等头部主播的遥望科技操盘。 不过,不到一周时间,将TikTok美区单场直播GMV从66.5万美元提升至104.81万美元,完成“百万大场”的历史成就,在老外贸人张旭看来,并非是一个“自然的结果”,这样的突破性进展,“和达人以及操盘手有关系,但更多是着急完成500亿年营业额的TikTok,给商家打的兴奋剂。” 实际上,仅用一周打造出百万直播,作为最大推手,TikTok的焦虑无所遁藏。 根据36氪消息,TikTok电商2024年的GMV目标为500亿美金,对照2023年200亿美金的目标,翻了一倍多。根据公开资料,2024年年初,TikTok电商的一大任务是将美区的GMV规模扩大10倍。年初彭博社更爆料美区全年目标为175亿。 而“到了年中,美区GMV完成还没到一半。”张旭表示。根据数据分析网站Tabcut数据,2024年1-5月,TikTok在美区的全闭环GMV仅不到20亿美元。按照数据估测,2024年近半,TikTok的GMV目标只完成了11%。 直播成了TikTok冲刺GMV的稻草。“2023年11月,TikTok美区直播,粉丝量必须要万粉,后来降低到5000粉,这半年只需要1000粉,就能直播带货了。”刘易鑫表示。 2024年以来,TikTok脚步不停。刘易鑫告诉字母榜,TikTok“在洛杉矶等几个美国主要城市都要开直播工作室,邀请MCN多招人手。” 与此同时,TikTok也在紧锣密鼓地招商中。包括张旭在内的Etsy商家(美国某高客单价电商平台),也收到了TikTok邀请入驻的邮件。 就在百万直播达成后的第2天,凌晨1点,TikTok美区召开官方会议,宣布直播动向调整,TikTok商家的准入门槛,迎来断崖式下降。 此前,商家入驻TikTokshop需提供单店铺在美国年GMV超过200万美金的证明,而调整之后,商家只要在美国亚马逊、eBay、walmart任意平台或独立站有运营经验,且符合相关需求,即可入驻。 不过,百万直播过后,张旭等老外贸商家却更加冷静,“百万直播只是偶然,现在美区GMV能上5位数的直播间都少”。对于TikTok来说,造梦百万直播,只是完成500亿美元KPI的开始。 头部MCN操盘,加上TikTok的平台推流,百万直播似乎更像一场精心准备的造星活动。 根据FastMoss数据,6月9日,由交个朋友海外团队操盘的达人@iamstormisteele 商品销量暴涨至4.10万。而此前该达人直播频率并不高,在5月仅直播过4场,6月9日前,带货商品销量甚至不能破千。 即便是6月9日百万直播过后的6月10日与6月11日,该达人的两场直播,商品销量也分别仅有38件与205件。 图/达人带货数据 来源/FastMoss 字母榜截图 大力推流,且是给这场直播精准推流的TikTok或许才是百万直播真正的缔造者。对比来看,@iamstormisteele 6月9日直播观看人数是6月11日的6倍,但销售商品数却产生了4.1万和208件的巨大差距。 张旭亦表示,尽管Tiktok流量巨大,但商家在Tiktok购买的流量其实并不精准。对于Tiktok而言,在推进直播的初始期,用户体验至关重要,因此有能力消费,且有直播购物经验的每个用户都很重要。“精准的流量推荐才能提升商家的GMV”。 11周年全员会上,康泽宇表示,TikTok商城是2023年最大的增长点。2023年,TikTok电商美区80%的GMV来自短视频带货,这意味着其直播电商还有相当大的想象空间。 “一条爆款短视频,即使有百万播放量,动销的转化率也比不过2000人在线的直播间,可以说只要直播必然有动销”,在外贸商家张颖看来,不同内容形式对销量的拉动差异,是TikTok押注直播最直接的原因。而美国作为拥有1.7亿用户的TikTok重点市场,自然成为TikTok发力直播的第一站。 要吸引更多达人和商家到TikTok直播带货,TikTok首先就要打造一个样板间,这与2020年,抖音要用流量浇灌出罗永浩,走的是同一条路。@iamstormisteele成为被选中的那个人,而操盘的同样是罗永浩背后的交个朋友。 冲击500亿美元GMV的TikTok,和在国内遭遇直播增长天花板的MCN机构,一拍即合。 2024年1月,交个朋友海外CEO郝浠杰表示,品牌出海的变量或者机会点还是来自于TikTok。对于亚马逊大卖家,或者一些超头部品牌来说,核心市场仍是美国。同一时期,姚方所在的园区,经常能看到交个朋友海外团队招聘的人来来去去。2024年4月,有消息爆出,遥望科技已在东南亚和北美市场试水TikTok直播带货。 为了做直播,TikTok不仅将头部MCN机构收入囊中,也吸引了一批头部主播们。 薇娅夫妇控股的谦寻文化,瞄准Youtube 和TikTok两大平台,疯狂小杨哥则主攻东南亚市场,在TikTok上的直播场从新加坡、马来西亚,已经拓展向泰国。 随着头部MCN的入场,竞争加剧,2020年即入局的刘易鑫亦表示,为了压缩成本,他的公司仍设立在广东,而在踩过聘用外籍主播“不动销、难培训”的坑后,他选择聘用国内的主播,“月薪5000起,再加提成”。搭建起一个小型直播间,算上手机设备、灯光、场景布置、主播,成本也能控制在 1- 2万元。 如今,刘易鑫的团队每天会直播 2-3场,直播加带货的营收,一个月的营业额在50万美元。 TikTok的百万直播间也确实起到了样板间的作用。 就在TikTok出现百万直播间的前后,刘易鑫亦关注到,2023年提起直播带货都叫苦“一般般”的不少小商家,近期突然聊起要批量购买节点(跨境网络服务器),还要增加设备和人员,这些都向刘易鑫释放出了颇为明显的信号。 不过,面对野心勃勃做直播的Tik Tok,商家们的动作还相当谨慎。 一周内,单场直播GMV从60、70、到100万美元,到底是因为国内团队操盘,还是平台流量扶持,张旭觉得这并不好判断,“现在美区大部分的直播数据,还在5位数左右徘徊”。 根据FastMoss数据,在6月10日突破百万直播记录后,TikTok美区的带货达人榜,日带货GMV过万的主播不过10-15位,如张旭所说,“现在的直播,破万都难。”单独几个案例的出现,似乎并未带动美区整体直播GMV的大幅提升,而且这些单场GMV的数据,还未计入之后的退货、退款成本。 图/15位左右即单场直播无法破万的达人榜 来源/FastMoss 字母榜截图 毕竟,对于张旭、张颖这样的外贸商家而言,本土直播,需要在美区当地有成熟的的团队操盘,而这样的时间成本和预算,并不是普通外贸商家能够承担的。“在美国本土搞直播,只有国内的头部MCN,才有这个能力和资金,具体的费用那就是千万级了,不然熬不过这个周期。”张旭表示,作为小玩家如外贸商,目前最保本的合作方式,仍然是与成熟的达人直播间合作。 但有心入局的商家们,却面临达人太少的窘境。 “现在美区真正有结果的达人太少了。” 在TikTok达成百万直播记录之前,作为主营创意玩具的外贸商家,张颖既需要自己建联达人,“每天用工具给几百个达人私信,免费给达人寄送产品”,还需要和固定的达人直播间“敲定档期合作”。“被骗品,达人收了产品迟迟不拍视频,或者花钱上了直播或拍了视频,0动销的也有”,这些都成为了张颖的家常便饭。 而在TikTok出现百万直播场次之后,涌入商家增多,让张颖感到“更不好做了”。 由于有直播需求商家的增多,不少已经有直播经验的达人,后台经常是私信爆仓,供不应求之下,“现在不少达人都不回私信,或者开始漫天要价,配合度也并不高”。而且即便是已经有过不错直播成绩的达人,他们的数据也并不稳定。“有时一次直播单日销量能破千,有时动销几十单”,对于商家来说,去明确可合作的达人,越来越难。 能做直播,还能做出成绩的达人太少,已经成了TikTok发展直播电商,亟待解决的关键问题。 同时,尽管为了推直播电商,今年二季度以来,TikTok早已发布了针对商家自播的扶持政策,但这些补贴,似乎没有补到MCN和商家的心坎里。 张旭告诉字母榜,现在Tik Tok直播奖励主要和直播时长以及GMV挂钩,比如直播超过2小时,那么多出来的小时数,即有机会获得每小时10美元的补贴,而如果直播时每小时GMV超过100,当月日均时长大于4小时,每小时就能获得50美元补贴。 但是“想达到每小时GMV破100”,张旭直言,对于大多数没有经验,还需自掏腰包请主播、搭场景的商家而言,“并不容易”。 对于在亚马逊、Temu、SHEIN、TikTok都开了店的张旭来说,如今TikTok推动商家自播的补贴,还过于常态化。“前提还是GMV+时长,但如果只要内容达标,时长播够,不一定GMV达标,也能有部分补贴,起码达人的积极性会更高”。 不过,想要达成500亿美元的KPI,留给TikTok的时间确实不多了。 行至6月,TikTok电商在美区的业绩情况不容乐观。根据财联社,TikTok下半年美区GMV目标120亿-130亿美金,其中跨境业务贡献约五分之一。 为了完成500亿KPI,TikTok的姿态放的越来越低。从2022年11月只限本地商家开店,到推出美国跨境全闭环店(中国执照)、美国跨境品牌店(一对一定向邀请),再到2023年上线“全托管”以及“跨境商家自营”。 此前传出要在德国、意大利、法国、西班牙和爱尔兰等国招商的TikTok,在5月中旬的深圳闭门会提出,TikTok Shop2024年Q3-Q4原本计划新开的市场将搁置,2024年全力做好美区。直播带货将成为TikTok Shop美区的主推方向。 对TikTok而言,占据了1.7亿月活跃用户,消费能力更强的美国,无疑是块必争之地。根据Mckinsey&Company的市场研究报告,美国有43%的消费者已经经常参与直播购物,其中32%的人年收入超过10000美元。而有42%的美国消费者则将观看直播带货视为一种娱乐。 TikTok主播Jasmin则表示,美区开始习惯直播购物了。 此前在抖音商城“买盲盒”的玩法,即花1元钱购买盲盒,有机会开出价值100元的物品。在国内,由于用户早已习惯,直播总能保持抢购的刺激氛围。但在美区,点进直播间的用户,往往是一头雾水,Jasmin只能“一步步教用户怎么点小黄车,怎么找链接,”甚至细致到如何在页面填写地址,等手把手教学后,再开始直播。 而随着直播场次增多,“链接往往都能秒空,抢购的节奏就出来了”。 2020年即入局TikTok,刘易鑫熬过2023年,百万直播的出现,也让刘易鑫嗅到了新的机会。在其账号@TK快乐老头 中,刘易鑫表示,当前亚马逊卖家数量有100多万,但Tik Tok美区卖家仅有2-3万人,直播场景无疑是做大盘子的快车道。 但而随着如交个朋友海外团队、遥望科技等大机构下场,对出海找机会的MCN来说,野蛮增长的时代已经过去,做直播并不容易,“但本土化、精细化的直播会成为趋势”。 经历TikTok在美区走向全闭环,即跨境商家在平台能直接完成交易,不必导流到独立站的整个过程,TikTok主播Jasmin表示,“在Tik Tok做直播,不是爽文。” 对于首批试水的主播及商家而言,起步期在线人数个位数,对准国内抖音4-6小时单场次直播但销量惨淡,才是常态。“直到TikTok开放美区直播,一些还能坚持下来的商家才算回血,销量翻了几番。”在Jasmin看来,TiTok的直播电商从英区到美区,“英区更像是牺牲品,导致最早的一批商家亏得厉害。” 而经历过早期的蛮荒期,对于不少商家如张旭,百万直播的出现,更多的是一个偶然事件。寄希望于头部MCN与平台推流,对占Tik Tok主体生态70%以上的普通商家来说,并不是一个长久的破局方法。 (文中张旭、张颖为化名)
波音公司被指控犯下“美国最致命的企业犯罪”
美国当地时间周三(6月19日),在两起波音737 Max坠机事故中失去亲人的家庭表示,波音公司犯下了“美国历史上最致命的企业犯罪”,并要求司法部对该公司处以最高240亿美元的罚款。 这封信还要求波音公司董事会与遇难者家属会面,并要求公司高管面临刑事起诉,其中包括在两次坠机事故后辞职的前首席执行官米伦伯格(Dennis Muilenburg)。 2018年10月在印度尼西亚和2019年3月在埃塞俄比亚发生的两起波音坠机事故造成了346人死亡。坠机事件后的调查显示,两起事故都与波音公司的飞行控制系统故障有关。 美国司法部(DOJ)在2021年对波音公司提出起诉。在波音同意支付25亿美元罚款后,司法部推迟了起诉。但在今年1月份阿拉斯加航空公司的一架波音737 Max 9的客机门发生爆炸后,司法部上个月表示,波音公司违反了2021年的协议。因此,司法部将在7月7日之前决定是否推进起诉。 “波音飞机的门都能从天上掉下来” 周二(18日),波音公司首席执行官卡尔霍恩(Dave Calhoun)在参议院出席听证会时承认波音曾对提出安全问题的员工采取报复行动,并向在场的波音737 Max坠机受害者家属道歉。卡尔霍恩表示,波音公司“远非完美”。他还承认,该公司还有很多工作要做才能重新获得公众信任。 但是,当被要求承担个人责任时,卡尔霍恩没有作出正面回答。 “我坚信问责制。”卡尔霍恩称,但他没有向参议员提供有关公司政策和行动的细节,包括公司解雇了多少举报人,以及公司是否追究任何个人对安全失误的责任。 美国民主党参议员布卢门彻(Richard Blumenthal)和共和党参议员霍利(Josh Hawley)对卡尔霍恩提出了严厉的质疑。 布卢门彻将卡尔霍恩出席当天的听证会称为“清算”,并表示由于737 Max坠机后未兑现的承诺,可能有必要进行起诉。 霍利则指责卡尔霍恩将利润置于安全之上,并问卡尔霍恩:“你为什么还不辞职?” 霍利还就波音公司糟糕的财务业绩向卡尔霍恩施压,称去年他的年薪高达3280万美元,加薪了45%,而波音公司的机械师在八年里只加薪了1%。 卡尔霍恩反驳称,他为该公司的安全文化感到自豪。 当霍利追问卡尔霍恩如何为波音公司的安全文化感到自豪时,卡尔霍恩表示:“我为我们采取的每一项行动感到自豪。” “你们的飞机从天上直接掉下来了。此外,你们的飞机的机舱门都能从天上掉下来。”霍利反驳说,“你在偷工减料,你在取消安全程序,你把它强加给你的员工,你在裁员,因为你试图从这家公司榨取每一分利润。” 霍利说到这里提高了声音:“你正在对波音进行‘露天采矿’。” “不只是机舱门爆炸那么简单” 虽然周二听证会的直接原因是1月份波音公司生产的阿拉斯加航空的一架飞机的门板爆裂,但随后有关波音公司飞机的安全和维护,尤其是对其公司内部举报人的处理方式引发了人们对该公司文化的担忧。 “今年一月(门板爆裂事件)之后,波音公司向世界承诺的空心外壳实际上已经被拆除了。” 布卢门彻在声明中说,“一旦这个鸿沟暴露出来,我们就知道下面的虚空实际上是无底的。” 卡尔霍恩于2009年首次加入波音公司担任董事。今年3月,他宣布计划在年底前辞去CEO一职。他在周二告诉国会成员,尽管继任者尚未任命,他仍然计划最终离开波音。 在卡尔霍恩周二出现在国会前的几个小时,参议院小组委员会发布了一名波音质量检查员的新举报声明。该检查员指责波音公司对他进行报复,因为他举报波音可能在飞机上安装了损坏或不合适的零件,并在美国国家航空局检查期间隐藏了这些有问题的零件。 波音公司发言人表示,该公司在本周一晚上收到相关举报,其工作人员正在对其进行审查。 美国联邦航空局局长惠特克(Michael Whitaker)在3月份接受采访时表示,波音的首要任务“一直是生产,而不是安全和质量”。 第二位匿名举报人向国会委员会声称,波音公司试图取消独立的质量检查,而是让工人检查自己和同事的工作。 “这是一种继续优先考虑利润、突破限制并忽视工人的文化。”布卢门彻表示,“在这种文化中,那些敢于发声的人被边缘化,而责任则被推到工厂车间。” 今年四月,有举报人告诉国会委员会,对制造缺陷和质量控制问题提出担忧的员工遭到忽视或受到威胁。 波音公司否认了这些指控并为其飞机的安全辩护。“从一开始,我们就承担了责任,并与国家运输安全委员会和美国联邦航空局透明公开地合作。” 卡尔霍恩在提到波音公司的安全文化时称,“我们正在采取全面行动来加强安全和质量”。 微信编辑 | 高莉珊
AI新研究可用手机检测中风:准确率达82%,分析面部肌肉运动
IT之家 6 月 20 日消息,来自皇家墨尔本大学(RMIT)生物医学工程师团和圣保罗州立大学的博士生 Guilherme Camargo de Oliveira 共同开发了一款基于 AI 的面部筛查工具,医护人员只需要借助智能手机,在几秒钟内就可以确定患者是否中风。 上图为博士生 Guilherme Camargo de Oliveira 与 RMIT 大学客座副教授 Nemuel Daniel Pah(画面中人物)展示了面部筛查工具。 该工具在检测中风方面的准确率达到了 82%,但不会取代中风的综合临床诊断测试,仅用于帮助更快地识别需要治疗的人。RMIT 生物医学工程学院的 Kumar 教授表示,尽早发现中风并及时地治疗,可以显著提高恢复结果,降低长期残疾的风险。 该工具将 AI 与面部识别技术深度融合,通过分析面部对称性和特定的肌肉运动(称为动作单元)来检测中风。该工具使用的面部动作编码系统(FACS)最初于 1970 年代开发,通过面部肌肉的收缩或放松对面部运动进行分类,为分析面部表情提供了详细的框架。 团队成员 de Oliveira 表示,影响中风患者的关键参数之一是他们的面部肌肉通常会变成单侧运动,因此面部两侧的肌肉表现不同。该工具的核心在于检测面部在微笑时,其不对称性是否会有变化。该研究使用了 14 名中风后患者和 11 名健康对照者的面部表情检查视频。 该团队计划与医疗保健提供商合作,将该工具开发成一个手机应用,以便能够检测影响面部表情的其他神经系统疾病。
“超级智能几周,相当于人类几十亿年”!OpenAI被解雇员工惊人预警
2024年4月,前OpenAI超级对齐部门成员、利奥波德·阿申布伦纳(Leopold Aschenbrenner)被OpenAI以泄露公司机密为由解雇。6月初,阿申布伦纳在网站上发布了一份长达165页的PDF文件,文件汇总了他在OpenAI工作期间所了解的信息,深入探讨了当前AI技术的进展、从人工通用智能(AGI)到超级智能(Superintelligence)的发展路径等问题。 图片来源:X 6月初,利奥波德·阿申布伦纳在博客节目Dwarkesh Podcast中,透露他被开除的真实原因——他给几位董事会成员分享了一份OpenAI安全备忘录,结果导致OpenAI管理层不满。同日,阿申布伦纳在社交平台上,发布了一份长达165页的PDF文档。 图片来源:X 阿申布伦纳将他的这份文件命名为《态势感知》(Situational Awareness)。在文件的开头,他特别指出,虽然自己曾在OpenAI工作,但自己的预测都是基于公开信息、自己的想法、工作期间的八卦等。他还在这份文件的开头特别致敬了前OpenAI首席科学家伊尔亚·苏茨克维(Ilya Sutskever)和其他OpenAI超级对齐团队的成员。 他认为目前全世界只有仅仅几百人对AI的发展有真正意义上的感知,这些人大多集中在旧金山地区以及全球各地的AI实验室里,自己便是这几百人中的一员。而那些主流评论家们只看到了炒作和常规的商业模式,他们认为这不过是另一场互联网规模的技术变革。 图片来源:《态势感知》 阿申布伦纳在文章中指出,AI的进步不会止步于人类水平。例如,在最初学习了人类最好的棋局之后,AlphaGo开始与自己对弈,它很快实现了超越人类的水平,下出了人类永远无法想出的极具创意和复杂性的棋步。 在实现AGI后,人类将能够利用先进的AGI系统实现自动化的AI研究,将十年的算法进步压缩到一年内。这意味着我们将迅速从人类水平的AI系统过渡到远超人类的超级智能系统。这可能会将人类10年的算法进展压缩到不到1年的时间里。与现有领先的AI实验室的数百名研究人员和工程师相比,未来的AI实验室可能会拥有成千上万个AGI系统,夜以继日地努力实现算法突破,不断自我完善,加速算法进步的现有趋势。 图片来源:《态势感知》 他写道:“超级智能的力量和危险将是戏剧性的。”这种转变不仅会带来技术上的飞跃,还将引发一系列伦理和安全问题。 阿申布伦纳强调,通过一些新的创新,超级智能在几周内就能获得相当于人类数十亿年的经验。这种前所未有的学习速度将使超级智能在数量和质量上远超人类。他指出:“这些AI系统将能够以我们无法想象的速度进行思考和学习。” 阿申布伦纳预测,到本世纪末,我们将拥有数以亿计的超级智能,这些智能体将在数量和质量上远超人类。他写道:“在数以亿计的GPU上运行的超级智能,将能够比人类快几个数量级地‘思考’。”这种超级智能的涌现将带来巨大的技术进步,但也伴随着巨大的风险。 图片来源:《态势感知》 文章中最引人注目的观点之一是,十亿超级智能将能够将人类研究人员在下个世纪进行的研发工作压缩到几年内。这种压缩效应将极大地加速技术进步,但也可能带来难以预见的后果。 阿申布伦纳指出:“超级智能将是人类有史以来最强大的技术——也是最强大的武器。它将赋予军事上决定性的优势,或许只有核武器可以相比。” 阿申布伦纳强调,智能爆炸和其直接后果将带来人类历史上最为动荡和紧张的局面。他指出:“在这个初期阶段,人类的任务将不是制造酷炫的产品,而是要尽一切可能度过这一时期。”他呼吁建立一个能够严肃对待这些困难抉择的指挥链,以稳定国际局势并管理智能爆炸期间的风险。 他进一步提到,尽管对齐技术可能会被滥用,但我们仍需要更好的对齐技术来确保未来模型的基本限制,如遵循指令或遵守法律。这些技术不仅仅是为了防止滥用,更是为了确保AI能够在安全的框架内运行。 展望未来,阿申布伦纳认为,我们正处于一个前所未有的快速发展时期,预计在未来四年内,计算能力将再提升约10万倍,带来类似于GPT-2到GPT-4的质的飞跃。他指出,这不仅意味着更好的聊天机器人,更意味着从工具到代理的转变,从一个简单的工具到一个更像是远程助手的存在。 每日经济新闻综合自公开信息
阿里通义Qwen2成斯坦福大模型榜单最强开源模型
【环球网科技综合报道】6月20日消息,斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任Percy Liang发文表示,阿里通义千问Qwen2-72B模型成为排名最高的开源大模型,性能超越Llama3-70B模型。 MMLU(Massive Multitask Language Understanding,大规模多任务语言理解)是业界最有影响力的大模型测评基准之一,涵盖了基础数学、计算机科学、法律、历史等57项任务,用以测试大模型的世界知识和问题解决能力。但在现实测评中,不同参评模型的测评结果有时缺乏一致性、可比性,原因包括使用非标准提示词技术、没有统一采用开源评价框架等等。 斯坦福大学基础模型研究中心(CRFM,Center for Research on Foundation Models)提出的基础模型评估框架HELM(A holistic framework for evaluating foundation models),旨在创造一种透明、可复现的评估方法。该方法基于HELM框架,对不同模型在MMLU上的评估结果进行标准化和透明化处理,从而克服现有MMLU评估中存在的问题。比如,针对所有参评模型,都采用相同的提示词;针对每项测试主题,都给模型提供同样的5个示例进行情境学习,等等。 日前,斯坦福大学基础模型研究中心主任Percy Liang在社交平台发布了HELM MMLU最新榜单,阿里巴巴的通义千问开源模型Qwen2-72B排名第5,仅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro、GPT-4,是排名第一的开源大模型,也是排名最高的中国大模型。 据悉,通义千问Qwen2于6月初开源,包含5个尺寸的预训练和指令微调模型,目前Qwen系列模型下载量已经突破1600万。
联想集团董事长杨元庆:生成式人工智能来袭,全球产业经济格局面临着刷新和重塑
6月20日,世界智能产业博览会在国家会展中心(天津)开幕。联想集团董事长兼CEO杨元庆在大会开幕式上提出,生成式人工智能为行业数字化、智能化进程提速,全球产业经济格局面临着刷新和重塑。要发展新质生产力,必须充分发挥好人工智能的引擎作用,以“新”促新,以“智”提质。 联想集团董事长兼CEO杨元庆 图片来源:公司供图 所谓以“新”促新,就是要加快人工智能新技术、新产品、新业态的培育,创造新的增长机会,乃至新的经济增长极。“要让飘在云端的人工智能真正落地,首先应当加强端侧AI的创新,让人工智能普及的入口触手可及。”杨元庆表示。 他指出,现在大热的生成式人工智能或大语言模型,主要是运行在公有云上的公共大模型,是一种公共智能,其在数据安全和隐私安全方面存在的不足容易让人望而却步,因此公共智能与私域智能(包括个人人工智能和企业人工智能)共存、互补所构成的“混合式人工智能”,将成为大势所趋。 在杨元庆看来,要让“混合式人工智能”实现普及,最佳路径是打造人工智能个人终端设备。随着人工智能终端设备从电脑向手机、平板、AR/VR、手表等丰富品类的扩展,端侧AI的创新将重构智能终端产业链,形成全新的产业生态,带来新的巨大增长机遇。 此外,杨元庆还提到了AI PC的机遇。在他看来,AI PC的到来不是简单对个人电脑软硬件进行升级,而是继多媒体电脑、互联网电脑之后的又一次个人电脑的代际升级。值得关注的是,6月18日后,微软的首批Copilot+ PC,以及联想、华硕、惠普等厂商基于Windows 11推出的多款AI PC陆续上市开售。巨头介入,产品批量上线,AI PC新时代开启的同时,被寄予厚望的科技新品们能否通过消费者的检阅,仍有待观望。 每日经济新闻
英伟达为何力推“主权AI”
文|吴俊宇 顾翎羽 编辑|谢丽容 全球各国政府正在成为英伟达的最新目标客户。英伟达是全球AI芯片巨头,也是全球市值第三的科技企业。截至美国东部时间6月17日下午收盘时,英伟达市值3.22万亿美元,目前仅次于微软和苹果。 英伟达正在力推“主权AI”(Sovereign AI)战略。“主权AI”概念并非英伟达首创——2020年欧洲议会通过了有关如何更好地监管人工智能的提案,强调了在开发、部署和使用AI时应遵循的道德原则和法律义务。此外,欧盟也关注数据主权问题,并在2018年实施了《欧盟通用数据保护条例》,对所有在欧盟境内经营的企业做出规范。这可谓是“主权AI”概念的雏形。 但“主权AI”概念的火爆,是从英伟达创始人黄仁勋2024年世界政府峰会上的发言开始的。英伟达官网对“主权AI”有一个明确解释:主权AI涵盖物理和数据基础设施。后者包括自主基础模型,例如大型语言模型,由本地团队开发并在本地数据集上进行训练,以促进特定方言、文化和实践的包容性。 今年2月,英伟达创始人黄仁勋在迪拜世界政府峰会直言,每个国家都应该建立自己的“主权AI”。英伟达官网发布的新闻稿显示,黄仁勋已经分别与加拿大、法国、印度、日本、马来西亚、新加坡、越南等国领导人进行了会谈。英伟达“主权AI”客户包括新加坡、日本、法国、意大利、印度等国政府。 从市场客户分类的角度看,英伟达“主权AI”业务可理解为向各国政府出售AI芯片。英伟达该领域的收入增长正在迅猛增长。该公司管理层在2024年一季度财报电话会上披露,2024年“主权AI”业务将为英伟达带来近100亿美元营收。而在2023年,该业务收入为零。 2023年英伟达全年营收609亿美元,数据中心业务收入475亿美元。2024年一季度英伟达数据中心收入226亿美元,其中云计算厂商占比45%,即102亿美元。“主权AI”业务目前被归类在英伟达数据中心收入中。 2023年,英伟达业绩高速增长是科技公司资本支出高速增长的结果。但英伟达不能只依靠这一个增长引擎,科技公司不可能一直维持高增速的资本支出。一旦科技公司芯片够用了,或者芯片带来的业绩不如预期,英伟达长远业绩会受到影响。 多位行业人士认为,英伟达为向各国政府推销A100/H100/B100等先进AI芯片,制造了“主权AI”概念。利用“主权”焦虑,英伟达很容易敲开各国政府的大门。因为,政府为了数据安全、自主可控,天然倾向采购硬件,在本国部署私有云。英伟达可以借此销售更多AI芯片。 “主权AI”的市场空间 “主权AI”常见落地模式是——政府主导,国有电信运营商、公共事业公司采购英伟达AI芯片建立自主可控的数据中心,再用本国语言、数据训练自主可控的大模型。某中国云厂商技术人士解释,“主权AI”、“主权云”、“国家云”这些产品,本质都是私有云。它们需要在当地国家本地部署,使用、维护成本远高于公共云。 采购英伟达芯片国家政府有四个共性。其一,积极融入全球AI和半导体产业链,寻找产业升级机会;其二,欢迎海外投资,希望借此强化本国云和AI能力;其三,与国企和公共事业公司合作建设本国AI基础设施;其四,关键领域保留自主权,扶持本国初创AI公司,用本国语言开发符合本国价值观的大模型。 英伟达还在与Oracle等公司一起拓展客户。Oracle是全球知名软件公司,其数据库、云服务被用于政府、金融等政企机构的核心系统。一位Oracle人士向我们表示,英伟达与Oracle合作模式是,英伟达提供芯片等硬件,Oracle提供软件服务,联合拓展政府客户。 多年来,“数据不出境”,正在成为欧盟、中国等国家或地区数据监管的重要红线。某国内云厂商技术人士分析,为符合一些国家的数据监管规则,企业会在当地国家落地“主权AI”、“主权云”、“国家云”。它们都是私有云,数据中心建在本国,确保数据不出境。 大模型技术爆发后,AI能力进一步被突破,也引发了各国政府进一步监管AI的强大动力。AI主导权在政府手中,能有效管辖本国AI及其产出内容,避免他国AI在本国获取敏感数据。此外,全球AI供应链并不稳定,芯片、算法、模型均可能断供。“主权AI”能让供应链变得更稳定。 新加坡正在进行人工智能治理,确保大模型安全、负责。训练大模型的语料、数据会决定AI的价值取向。目前大模型普遍通过英文语料训练而成,反映了英文世界国家的价值、意志和偏好。东南亚有近7亿人口,新加坡由华人、马来人、印度人等多民族构成。因此,新加坡正在建立本国语言训练的大模型,让它更符合东南亚社会中立、多元的价值观。 新加坡计划未来五年投资超过10亿新元(约合7.3亿美元)发展AI战略。英伟达官网显示,新加坡电信正与英伟达合作建立“主权AI”。新加坡电信希望在本国数据中心安全地训练新加坡大型企业、创业公司、大学和政府数据,让新加坡大模型符合当地语言、文化和习俗。新加坡电信的“主权AI”计划还承担了新加坡国家人工智能战略——让本国公民掌握最新技术,扩展新加坡的计算基础设施和机器学习专家人才库。 算力和AI越来越成为国家竞争力的影响因素。建立自主可控的AI产业链成了多国诉求。有国资背景云厂商人士、地方城市人士曾同时表达一个观点,公共云虽然技术先进、跨境服务能力强,但无法为当地留下税收、就业。这是“主权云”等私有云容易被政府青睐的重要原因。 在欧盟,主流做法是对AI进行强监管,并培育欧洲本土云基础设施、AI初创公司。欧盟2020年出台《欧洲的数字主权》文件,第一条计划是2024年之前要建立欧洲自己的云计算和数据基础设施。一些欧洲本土AI公司也在兴起,其中包括法国的Mistral AI、德国的Aleph Alpha。 “主权AI”是英伟达未来支柱? 从财务角度看,英伟达此前收入增速和主要云厂商(微软、亚马逊、谷歌)的资本支出增速基本是正相关的。 科技公司采购英伟达的AI芯片,付出了高昂的资本支出。微软、谷歌每个季度都会在财报电话会议中披露资本支出情况,亚马逊没有披露相关数据。微软、谷歌近四个季度(2023年二季度-2024年一季度)资本支出平均增速分别是60%、37%。此前四个季度(2022年二季度-2023年一季度),两家公司资本支出平均增速分别仅为8%、4%。 目前,微软、亚马逊、谷歌管理层2024年一季度财报电话会议中的一致判断是,2024年资本支出将保持高速增长。微软管理层判断,微软在2025年上半年资本支出继续保持高速增长。但三家公司管理层未对此后的资本支出情况进行明确表态。当投资者问及资本支出能否带来明确的收入增长时,三家公司的管理层也没做出明确回应。 多位行业人士分析,科技公司的资本支出有周期性变化,不可能长期维持60%以上的资本支出增速,正常增速通常在20%以下。这意味着,云厂商的需求增长并不是无止境的。科技公司一旦资本支出下滑,英伟达也会随之面临业绩下滑的局面。 今年6月,黄仁勋在说服企业购买英伟达AI芯片时说,“你买得越多,就省得越多。”然而,科技公司的资本支出必须转化成收入增长。这轮AI浪潮中,英伟达是第一波赚到钱的“卖铲人”。近一年多个季度营收增速已超过100%甚至200%,同比提升100个-200个百分点。相比英伟达,作为“淘金人”的科技公司赚得还不够多、不够快。过去一年,微软、谷歌的云业务营收增速约为20%-30%,同比提升仅5个-10个百分点。 2023年之后,微软、谷歌均出现了资本支出增速远超云业务营收增速的情况。按照正常周期波动,科技公司进行高强度资本支出之后,通常会控制投资规模,让大模型技术尽快转化落地,进而实现业绩兑现。 英伟达的现实挑战是,如果科技公司无法在未来1年-2年通过大模型获得切实的业绩增长,那么英伟达的业绩增长也将缺乏坚实基础。 事实上,云厂商正在考虑通过技术手段控制资本支出。云的一大技术特征是,可以削峰填谷用有限的芯片向更多客户提供服务。一位中国头部云厂商人士解释,云厂商下一步要做调度优化、利用率优化,资本支出增速会逐步放缓,这和英伟达的增长诉求存在冲突。 为此,英伟达需要拓展新客户,确保业绩稳定增长,这也是各国政府成为英伟达的新客群的核心原因。 英伟达管理层2024年一季度财报电话会中披露,2024年一季度,云厂商在英伟达数据中心收入中占比45%,高达102亿元。2024年“主权AI”业务将带来接近100亿美元营收。“主权AI”的收入暂时占比不高,但收入增长明显,且是英伟达财报电话会议披露重点。 据不完全统计,和英伟达进行“主权AI”合作的国家包括新加坡、印度、印度尼西亚、马来西亚、日本、德国、法国、荷兰、阿联酋、沙特阿拉伯。“主权AI”通常分多期项目投资,投资起步5亿-10亿美元。日本政府为建立“主权AI”,向软银等三家日本电信运营商投资了7.4亿美元。软银计划2025年底前要投资9.6亿美元建立国家级智算中心。印度政府和几家大型企业正在进行多个超过10亿美元的英伟达AI芯片采购计划。 英伟达可以从中获得巨额收入。一枚英伟达H100芯片售价约为3万美元,一枚英伟达A100芯片售价约为1万美元。大模型训练通常要建设千卡规模算力集群。1000枚H100芯片的数据中心,仅芯片采购价格就超过3亿美元。英伟达通常不会单售芯片,还会搭售配套软件、服务器整机等产品服务。 一位芯片技术人士认为,目前各国政府能给英伟达带来的收入远低于科技公司。英伟达希望找到新的增长点,它短期内很难摆脱对大型科技公司的依赖。英伟达和微软、亚马逊、谷歌等科技云厂商本质是同一条产业链的上下游玩家。它们一荣俱荣,一损俱损。 “主权AI”涉及的政务数据高度敏感,英伟达作为商业公司无法完全确保数据安全。因此,在大多数合作项目中,通常所在国家的电信运营商、公共事业公司负责训练模型,英伟达只提供芯片等硬件设备。 中国不会是英伟达“主权AI”的使用者。因为中国是极少数能够实现AI全产业链自主可控的国家之一。目前中国的三大电信运营商、各地方城市均在采购国产AI芯片建设智算中心。 2023年10月,中国外交部发言人汪文斌在例行记者会曾表示,中方支持在联合国框架下讨论人工智能治理,增加发展中国家代表性和发言权,推动形成具有广泛共识的人工智能治理框架和标准规范。
日系车,量价齐跌只是开始
抽空看了下微博热搜汽车板块,前十里面有 2 个是讲日系降价的,曾经的全球销量第一车型,世界人民的首选丰田卡罗拉新车入手价格已经低到 7.98 万,优惠幅度 4.3 万元。 曾经还有人说世界上有三大硬通货:石油、黄金和丰田车。 在很长一段时间里确实如此,因为较好的燃油经济性和较低的养护成本,丰田品牌汽车不仅一直是全球范围内的整体销冠,卡罗拉和 RAV4 也一直是全球范围内的轿车和 SUV 品类的销冠,直到特斯拉 Model Y 的异军突起。 7.98 万的卡罗拉,真香?不香。 需要特别指出的是 7.98 万的卡罗拉,是一汽丰田在 618 期间特别推出的优惠价格,限时限量优惠 4.3 万元,活动时间仅有 6 月 15 日到 6 月 18 日。 虽然说时间短数量成谜,但是没有买到的人也不用后悔,因为经销商的报价,早已经低于 7.98 万元,报出了 7.68 万元乃至 7.38 万的价格。 如果在几年前,卡罗拉虽然不是加价车型,入门版本也得 12 万左右,几乎无优惠,落地基本上就接近 14 万了。短短几年,一代神车的入手门槛低出多数人的预想。 那么,这么便宜的卡罗拉,一定很好卖吧? 答案是,卖得不怎么样。 刚刚过去的 5 月,一汽丰田卡罗拉车型,总共卖出了 7693 辆,位居国内所有轿车销量排行榜的第 38 名,往前一名则是它的同胞兄弟广汽丰田雷凌,5 月卖了 7711 辆。 而在 4 月,卡罗拉的销量更是惨淡,仅有 4320 辆,和一汽丰田 bZ3 电动车销量相当,即便把卡罗拉和雷凌两款车合并计算,近几个月的销量也比不上竞品日产轩逸,大众朗逸和比亚迪秦 PLUS。 虽然丰田的品牌要强于日产,但是单就日系内战来说,卡罗拉最大的特点是「平庸」,在外观、空间、内饰、驾控和舒适性上都非常普通,虽然同为「马路三大妈」选手,但是起码轩逸的空间表现和乘坐舒适度上强上一大截。 再和国产新能源们对比之后,卡罗拉在产品上的更是毫无优势,引以为傲的燃油经济性也在比亚迪秦 PLUS 等混动车型面前落了下乘,更别说空间和内饰上的劣势了。 卡罗拉,成也平庸,败也平庸。 因为新车价格呈现雪崩之势,所以也带动了二手车价格的混乱。比如现在还能搜索到不少关于卡罗拉的二手车视频,称之为「保值界的常春藤」。就在去年还有二手车视频博主发视频说,卡罗拉 2019 款 1.2T S-CVT 精英版,2020 年上牌,14 万落地,里程 3 万公里,最后收车价格是 7 万,算下来每年贬值 2 万元。 不过按照 2024 年卡罗拉的新车价格,最后也没比 2020 年上牌的二手车价格贵多少,丰田车的保值神话,一夕破灭。 可以说,卡罗拉就是丰田乃至日系车在中国市场的缩影,从最初的加价提车,到原价提车,再到小优惠几千,接着是以价换量,到现在降价都换不动量了。这个过程也说明了,国内消费者对于合资车的品牌滤镜早已破碎,最早破掉的是韩系和法系车,接着是美系车,现在开始轮到日系车了,最后就剩下横亘在豪华车市场的德系车。 日系车的式微不是一日之事,苗头早已出现,但事实就是,它的坠落,要比想象中更猛烈,也更惨烈。 当比亚迪秦 Plus 和丰田卡罗拉齐聚 7 字头的时候,一张 1997 年汽车价格表也在微博热传。我们可以一览中国汽车工业初期时候的价格,本田雅阁售价 39.3 万元,丰田佳美(也就是丰田凯美瑞)售价 43.5 万元,奔驰宝马更是天价,奔驰 S 和宝马 7 系价格破百万,E 级和 5 系也在 80 多万。角落处的长安和解放等国产车,只能卖三五万。如果算上通货膨胀,1997 年的 10 万元购买力,约相当于现在的 70 万。当时全年企业职工年收入为 6580 元,以此计算,普通人存一辈子钱,也买不起一辆本田雅阁。 量价齐跌的日系车,止跌回升无望 一直以来,广东地区对日系车有着特别地偏爱,雷克萨斯 ES 和 B 级车王牌选手凯美瑞是每个老广心中购车的白月光,而广汽本田和广汽丰田,也是曾经广汽做大做强的最大助力。 但 2024 年以来,两田的低迷明显让广汽感到形势严峻了。 因为广汽菲克和广汽三菱等原本在中国市场有一席之地的合资品牌逐渐退出市场,现阶段广汽集团主要有四个品牌在销售:广汽本田,广汽丰田,埃安和广汽乘用车(广汽传祺)。 以 5 月为例,广汽本田销量 31931 辆,比去年同期的 54408 辆同比下降 41.31%,1-5 月累计销量 173580 辆,同比减少 24.30%。 广汽丰田 5 月销量 61088 辆,销量同比下降 17%,1-5 月累计销量 265928 辆,同比下降 27.26%。 同时,代表广汽新能源和高端化转型的广汽埃安在今年的情况也很不乐观,不过这和 B 端市场趋于饱和相关性更大。 曾经需要加价数万的雷克萨斯 ES,如今也开始优惠数万,一去一回,相当于曾代表广东人买车最高品位的雷克萨斯品牌价值不再,更别说丰田和本田了。 一言以蔽之,当广东人都不爱日系品牌,当广汽丰田和广汽本田的车销量接连暴跌之后,就真的证明日系车失去了最后的根据地和火种。 ▲ 现款本田雅阁内饰 销量下跌更多的广汽本田也开启了裁员,不过和一般企业裁员的愁云惨淡不同,广汽本田开启裁员之后,不少员工开始争相申请裁员名额,主要原因还是广汽裁员给到的补偿相当丰厚:N+2+1.8 个月工资。 其中 N 是工作年限,2 是额外两个月工资,1.8 是额外 1.8 个月工资的奖金,也就是说,广汽本田开出的赔偿条件比劳动法规定的 N+1 下限要高出不少,加上广汽本田本身的工资待遇也相当不错,所以这么一笔裁员补偿金相当诱人。 比如每人 Auto 就报道称,广汽本田生产第一线的正式员工,有些月薪高的人可以拿到 2.5 万元~3 万元,另外还有各种补贴。更资深的中层员工,月薪或能达到 5 万元~6 万元的水平,如果工作年限在 10 年,等于离职时可以拿到 13.8 个月的工资。 除了裁员赔偿金额较高之外,广汽本田员工争取裁员名额的原因还在于对于未来的预期,广汽本田的困境不是暂时性的,销量下跌现在看来是不可逆转的,与其在这里惴惴不安继续工作,不如在已经可以看到品牌销量趋势,趁厂里还有积蓄的时候拿钱走人,再寻找下家。 毕竟不少企业的前车之鉴是,先跑路的人拿到赔偿最多,坚守到最后的人只能劳动仲裁。 广汽本田员工争相被裁,只是日系车量价齐跌连环反应中的一环,也是最温和的一环。 前面提到了上牌 3 年,3 万里程的卡罗拉在去年的二手车价格,和今年卡罗拉新车价格差不太多,极速下降的新车价格意味着收旧车风险非常,一个月内卖出可以赚,两个月内卖出不亏,库存超两个月再卖就得亏钱了。 这不是一款车,一个品牌,或者一个地区的问题,而是整个行业的问题,二手车行业盈利的基础,建立在新车价格稳固的地基之上,现如今整个二手车行业都因为行业内卷,新车价格战而全线惨淡经营,周转周期稍长就马上亏损,日系车自然也不例外,甚至是重灾区。 ▲现款本田雅阁 比如和丰田凯美瑞齐名的本田雅阁,2023 款 260 TURBO 智享版贷款可以优惠 6 万元,全款优惠 5.5 万元,裸车价格来到了 14 万区间,落地 16 万左右,而丰田凯美瑞的价格走向也大差不差。 这意味着曾经手持 14 万预算想买卡罗拉的用户,如今再加一点点,就可以上凯美瑞或者雅阁了,就在前几年,这两款日系招牌 B 级车落地都还要 2 字头。如前面所说,更早之前的 1997 年,雅阁和凯美瑞,可是售价 40 万的豪车,如今 40 万已经可以拿下奥迪 A6L 乃至 A7L 了。 剧烈价格变化意味着前几年买了这两款车的消费者也很尴尬,要卖的话,就得迎接一大刀,而收车的人更是胆战心惊,谁也不知道新车还能怎么降。 可以说,二手车是汽车销售循环中的重要部分,不管是发达的美国,还是欠发达的南美和东南亚,日系车占主流地位的原因不仅是新车不愁卖,也因为二手车流通顺畅,随处可见都是老丰田老本田在路上跑,体量大,养护成本低,再出手也不麻烦,但二手车销售阻塞,意味着循环中断了。 即便是拉起价格战的比亚迪,也面临类似的二手车估值难题,但比亚迪不同的是,价格在降,销量在涨,渠道扩张快,一线销售不愁卖不出去新车。但日系车的渠道,也会跟着量价齐跌而萎缩。 最先受波及的是本田高端品牌讴歌,和日产高端品牌英菲尼迪,其中讴歌品牌已经几乎退出中国市场,查询不到销量,英菲尼迪销量近几个月的销量也仅有数十辆到两三百辆之间,经销渠道也仅残存数十家。而在 2017 年,英菲尼迪在中国年销量还有接近 5 万辆。 而从去年开始,已经开始有一些消费者开始投诉,比如有东风本田经销商退网,而此前购买的多次车辆保养服务得不到官方保障。 类似投诉背后的大环境,就是汽车经销商体系的崩坏,比如年初震惊汽车行业的「东莞永奥汽车集团」资金链断裂爆雷。 长期关注汽车销售和渠道的「车 fans」在年初聊日产奇骏销量时,就总结了日产渠道的现状: 销量下滑就会引发 4S 店的恶性循环,卖得不好,为了回笼资金就得降价,降价就会带崩行情,最后加大亏损,每家日产 4S 店都将面临这个问题:跟,扩大亏损面,死;不跟,资金链一断,立马暴毙,下场都一样。 其他日系渠道的情况也类似,销量下滑,价格下降,就会让渠道亏损,然后渠道萎缩,继续带动销量进一步下滑。 也同样是 2024 年,一位消费者从海口中升雷克萨斯汽车销售服务有限公司内以 93.19 万元价格订购了一辆雷克萨斯 GX550,紧接着门店又通知这位消费者需要额外缴纳服务费 10 万元,否则无法提车。 最终,该经销商被罚款 45 万元。 这大概是日系车最后的加价体验时刻了。
大模型价格战调查:有客户调用量增5000倍,大模型落地的逻辑变了
作者 | 李水青 编辑 | 心缘 对于很多AI应用厂商来说,今年5月的大模型降价潮就像一场梦。 “以为看错了,没想到会降这么快!”、“用大模型一下子就没有后顾之忧了”、“我们一口气把几家大模型都接了”、“价格一降,我们内部直接放量2~3倍”……来自教育、电商、招聘、金融、智能硬件等多个行业的人士,向智东西谈及对降价的体感——刺激。 5月中旬,超15家知名大模型厂商陆续降价、免费,动辄价格直降99%,百万tokens调用跌至白菜价,大模型产业掀起如火如荼的价格战。(《深扒大模型价格战:15家45款模型比拼,谁真便宜谁“打幌子”?》) 降价实不实?客户买不买单?订单量起来了吗? 时隔一个月,市场已经给出了初步答案。 从大模型的卖方来看,“泼天的富贵”在过去一个月里砸向了他们。 智东西调查获知,从阿里、百度、腾讯、字节等大模型厂家的后台数据来看,各家主力模型调用量过去一个月均大幅上扬——增长数倍到十几倍都有,甚至有个别客户调用量增长5000倍。智谱AI、科大讯飞、DeepSeek等大模型厂商虽未透露相关数据,但调用量可以预测也是水涨船高。 降价潮带来了技术激进派的狂欢。降价力度之大、下游活跃之罕见,使得不少看好AI+行业落地的人士称:“大模型自由”要来了。 与此同时,也有一些AI应用企业对所谓的“大模型自由”表现得波澜不惊。 在不买单的厂商中,一部分厂商的理由是已有模型运行稳定,不考虑替换;一部分则认为大模型能力会继续迭代,且价格会越来越低,于是做“等等党”;另一部分则认为降价是厂家的营销套路,产品已经同质化了,不心动。 无论源头是什么,由降价潮掀起的风暴已经卷向整个智能产业链,如水波一般层层传导到产业链下游、用户终端。 无论是面临洗牌的大模型厂商,还是处于抉择十字路口的行业公司,这场战役才刚刚拉开大幕。 价格战为大模型产业链不同环节的人带来了什么?身处这场产业剧变之中的玩家会走向何方?本文试图对此进行深入探讨。 一、AI应用厂商大放量:大模型落地更快了!也有等等党不买单 对大多数AI应用侧企业来说,大模型降价是一件纯好事。 来自多个行业的AI应用负责人告诉智东西,他们跟踪大模型超一年,这波全行业降价不是营销手段,而是实打实的tokens价格数倍降低,推动他们大力投入大模型落地。 头部招聘互联网公司猎聘CEO戴科彬告诉智东西:“降价直接使得我们的应用场景得到拓展,同时调度量也大幅上升了,从内部观察看,大模型调用量上涨了2~3倍。” 猎聘公司于今年初推出了基于大模型的HR数字人助理多面Doris,提供AI面试、组织人才诊断等服务。戴科彬称:“多面Doris并不是要做成一款付费的AI产品,我们只向客户收取了成本费用,此前考虑到成本不敢放量,降价使得我们敢于放量去服务更多客户。” 对于本次降价戴科彬认为是“情理之中,意料之外”。年初时,猎聘团队内部还有人担心,大规模使用大模型是否会使高额成本难以承担?但戴科彬相信年末价格会降下来。“没想到才两三个月价格就已经下降了很多。”戴科彬说。 ▲猎聘CEO戴科彬在讲解HR数字人助理多面Doris 杭州李未可科技公司的合伙人兼AI负责人古鉴告诉智东西:“这波降价为我们减少了后顾之忧,让大模型落地更快一些。”李未可科技是“天猫精灵之父”茹忆打造的AI硬件新锐公司,于今年5月推出了AI智能眼镜Chat。 “一开始,我们向客户推广产品时还会考虑成本,比如客户一年可能支出多少订阅费用。但降价以后,有不少成本我们自己就承担了,相对给用户提供的能力也会更强一些。”古鉴说。 降价后,客户有了更多的选择。古鉴谈道,比如团队可以给到用户更好的底座模型,比如从通义千问Plus升级为Max,体验效果也将大大提升。 另一位电商领域的AI负责人也告诉智东西,公司已经确定大规模使用大模型了,产品正在加速落地中。随着价格普遍下降,团队将更关注模型的能力边界和应用场景。 不过,也有一小部分受访AI应用厂商,对这波大模型降价“不动心”。 某知名AI数据分析厂商的相关负责人告诉智东西,由于自研大模型使用情况已经较稳定,本次大模型降价对其业务影响不是很大。 另外两位分别来自AIoT和教育行业的受访者也称,由于公司用的是开源模型,他们认为自身不属于价格战覆盖的赛道,因此大模型落地未受本次降价的影响。 同时,一些厂家期待大模型的价格降得更低,觉得可以再等等。有的厂家类比3G网到4G网的发展,认为大模型的费用会持续下降,甚至免费,才会普及。因为大语言模型的本质是要通向AGI的,并不只是一个少数人使用的技术。 总体来看,2024年初这波大模型大降价,成为很多AI应用厂商加速大模型落地的直接动力,他们的AI业务蓄势待发,似乎就在等这波降价。 与此同时,一些采用开源模型和自研模型的企业,将价格战视为另一个世界的“噪音”,主要因为已有模型满足了已有需求,或者觉得可以等到更大力度的优惠。 归根结底,不同厂商做出相反的判断决策,是其所处行业的属性和公司变革动力决定的。 二、互联网、智能硬件行业行动快,有厂商调用量涨5000倍 哪些行业的AI应用厂商接入大模型的行动力更强? 从大模型供应商端的后台情况,我们能得到更加全面和准确的认知。 在与来自阿里、百度及字节的多位业内人士交流后,我们发现,在众多行业中,互联网和智能终端两个大行业的客户,在这波降价潮后最为活跃,对大模型投入较大。 在互联网领域,在线教育、办公、电商、招聘、休闲娱乐等领域成为新增客户的集中区;在智能终端行业,智能手机、车载、可穿戴设备的厂商也纷纷增加大模型的调用量。 其中,与对话机器人、智能助手相关的应用场景放量较快,但数学、代码等涉及更复杂推理任务的场景,相对来说增长趋势还不太明显。 正是这些行业AI应用厂商的大力投入,推动大模型厂家业务量大幅上扬。 百度智能云AI平台副总经理李景秋告诉智东西,在免费之后,百度两款主力模型日调用量过去近一个月里大概翻了10倍。 一方面,从零开始调用的全新的企业及开发者增长几万个;另一方面,不少原有用户扩大了接入大模型的业务范围,比如不少企业原本仅有5%~10%业务做大模型探索,但免费政策使他们将整体业务都接入了文心大模型。 阿里云相关负责人告诉智东西,从近几周的数据来看,无论是调用次数还是tokens的调用量,复合增长率远超降价之前数倍,预计后续增长会更强劲。“没降价前就增长很快,降价了明显增长更快。”这位负责人说。 新老客户的大模型需求咨询量明显增加了,并且有两个方面的变化: 1、降价使得一部分新场景需求得以释放,之前受限于ROI的企业现在也将更多落地场景接入大模型;2、不少客户调整了大模型技术路线,降价使不少此前自研模型的客户转而在云环境上使用模型服务。 增长迅猛的还有字节。智东西同时从火山引擎内部人士获悉,降价两周内,他们有两个客户tokens调用量增长了5000倍,10个客户增长了200倍。 虽然智谱AI、科大讯飞、DeepSeek等大模型厂商未向智东西透露相关数据,但由于降价幅度不小,其模型调用量可以预测也是水涨船高。 三、大模型落地逻辑变了:多模组合,价格后置 在大模型供求双方的推动下,大模型落地逻辑悄然生变。 多模型组合部署成为时下的潮流,价格已经不再是首要考虑的因素。 此前,大多AI应用厂商受限于成本,只会将小部分业务试水接入大模型,仅选用一个或两个大模型;随着大模型进入“白菜价”阶段,AI应用厂商将大部分且功能复杂的业务接入大模型,往往会选择不同的模型接入不同的业务模块。 ▲国内宣布降价的大模型企业及其定价(智东西制表,统计于2024年5月24日) 以猎聘的AI面试官多面Doris为例,戴科彬提到:“在各家大模型都降价的基础上,哪些模型跟产品的应用场景更匹配成为企业选择大模型最重要的事情。需要根据不同厂商的模型特征去运用,一个简单的AI产品需要调用好几个大模型、做非常多的组合,同时也有一些(模块)需要用自研模型。” 李未可科技也选用不同的大模型来做不同的任务。比如其分发任务会用到一个模型,可能需要达到70B模型的回答质量;闲聊功能就需要通用的大模型;还有一些指令会给到一些执行层面上的Agent,就涉及到垂直类的用户,比如他们需要快速反馈周边旅游的知识,或者需要用到自己的数据库等,也会用到不同的大模型。 “就像你去买一辆车,背后的零部件有各种各样的厂商来提供的,找到对的组合,才会对前端用户更友好。”戴科彬说。 现在,降价让厂商对家价格因素不再纠结,而是侧重能力的匹配度。 价格降下来了,选择面更广,AI应用厂商则会考虑能力边界、易用性、云服务等多个方面能力是否匹配,决策模型将变得更加简单直接。 正如阿里云相关负责人向智东西所说,价格不是用户大模型选型的唯一因素,企业会选择模型能力、云技术能力持续领先的厂商合作。 百度智能云AI平台副总经理李景秋称,让企业及开发者不用特别在意价格,而是将注意力放到业务创新上,不管是百度还是友商,在这一波降价潮中这一初衷应该是类似的。 四、分叉路上:自研还是接入大厂模型?更多AI应用厂商的抉择时刻 当一些AI应用厂商尝到降价的甜头,更多厂商也开始调整大模型技术路线。 多位大模型厂家负责人告诉智东西,不少OpenAI/Azure的客户转向国产大模型。这也在AI应用厂家那里得到印证,“国内大模型在对话机器人等很多场景的工程化能力已经跟ChatGPT没什么差别,可以取消GPT订阅了。”一位文娱领域的AI应用厂商告诉智东西。 同时,不少企业改变了原有的自研路线。正如阿里云相关负责人所说,此前采用基于开源自研大模型+自建推理基础设施的技术路线,降价使不少客户转而在云环境上使用模型服务。 基于大厂的模型做微调,还是基于开源模型自研行业模型? 这是很多AI应用厂商绕不开的问题,两条路线各有优劣势。 简单来说,前者的特点是接入方便、应用成本低、技术迭代快,且有专业团队帮忙大模型模型;对于一些技术力不足或算力资源不多的公司来说,尤其是偏通用业务的公司,直接调用接口更可行、更快捷。但这一路线也有问题,那就是模型的进化较依赖外部。 后者的优点是更便于企业训练出自己的专有模型。基于开源模型自研更适合有一定技术实力和投入预算的AI应用公司。这一路径虽然不需要成百上千台服务器,但基于开源模型的微调也需要技术开发团队和服务器成本投入,负担不小。 降价使得一些厂商痛下决心,减少或不考虑自研大模型,转而更聚焦于AI应用。 毕竟大模型降价和能力迭代(变相降价)已成可预测的趋势。比如百度智能云AI平台副总经理李景秋就向智东西透露,大家可以进一步关注文心3.5及4.0的动向,将会有模型的升级、价格的降低等一系列计划。 一些厂家选择继续自研和大模型微调双线并行。比如猎聘公司一方面建立了自己的专业模型,同时也在对大厂模型做微调,对应用场景做更好地支持,公司计划在产业发展方向更清晰之后,再选择更加侧重的方向。 几乎所有的AI应用厂家都提到,当下市面上的大模型还不能满足所有的需求。 比如李未可科技公司已经不将价格作为最主要考虑因素,而是对模型的分发能力、反馈速度、回答质量都提出更高要求,类似GPT-4o这种结合语音交互的大模型是适合公司业务的,因此团队期待国内类似的大模型快速出来。 此外,本次降价的众多模型的能力更多聚焦在文本,在视觉生成及多模态方面,AI应用侧的厂商也期待会有更多的能力迭代和价格优惠。 “现在技术演进速度太快了,我们有专人不断地测试国内外的新模型。”李未可科技的合伙人兼AI负责人古鉴说。大模型的技术迭代仍在继续,AI应用厂商的需求缺口仍然不小。 结语:降价只是开始,“大模型自由”还要再等等 随着大模型降价潮来袭,我们看到AI应用市场已经出现明显的放量趋势,其中互联网、智能终端等科技基础较好的行业跑得更快。 与此同时,AI应用市场正在出现一些新的变化,包括企业AI应用场景正在扩充,AI应用厂商模型选择的决策逻辑也在发生变化,价格已经不是最首要考虑的因素,能力匹配和持续演进能力,成为被更加看重的因素。 更值得一提的是,不少AI应用厂商的技术路线发生转变。一方面,不少此前选择OpenAI及微软的厂商转而使用国产大模型;另一方面,也有不少此前采用自研大模型及自建基础设施的厂商,开始转向云上部署及接入大厂大模型。 本次降价潮本质上不是一次营销,而是技术驱动的产业升级,因此有望在之后在应用及市场侧看到更多的连锁效应,降低大模型落的门槛,扩充大模型落地的边界,加快大模型落地的进程。 但与此同时,当下大模型仍难以满足AI应用市场更丰富的需求。包括多模态、语音交互、Agent等多个领域,大模型的能力及价格都还有继续优化的空间。AI应用厂商们大多建立了专人监测最新模型,从而在下一次新的机会点上及时出手,抓住AGI时代的新机遇。 价格战威胁了大模型领域创业独角兽的生存空间,据《时代周报》报道,国内外已有不少AI独角兽出现了资金链断裂、团队主创流失等情况。但与此同时,还未被满足的大量市场需求缺口,以及大模型技术瓶颈,都预示着百模大战的胜负还远不能盖棺定论,云大厂和创企都有突围的机会,也有随时掉队的风险。 大模型产业的降价潮只是开始。不同于一些快消品和互联网行业,一旦打价格战就意味着行业进入中后期;大模型产业是高技术产业,技术的迭代和能撬动的传统行业体量更加可观,通往AGI的是一条长路,价格战后各家有哪些后招,值得产业持续关注。
揭秘Ilya新公司:背靠5吨GPU,做核能级安全
编译 | 陈骏达 编辑 | Panken 智东西6月20日消息,今天凌晨,一个多月前正式从OpenAI离职的OpenAI联合创始人兼前首席科学家Ilya Sutskever在社交平台X上官宣,自己将建立全世界第一个直接以安全超级智能为目标的AI实验室——Safe Superintelligence Inc.(SSI,安全超级智能)。 ▲Ilya官宣创业的推文(图源:X) SSI的官网上写道,SSI只有一个目标和一个产品:安全超级智能。公司将通过革命性的工程和科学突破,同时追求安全性与AI能力,并优先确保安全性。 由于SSI的目标清晰,他们不会因为管理费用或产品周期分心,也不会受到短期商业压力的影响。公司创始人有丰富的从业背景和极高的声誉,因此筹集资金不会成为SSI面临的挑战。 SSI强调公司目前正在组织一支精干的团队,都是由专注于实现安全超级智能的优秀的工程师和研究人员构成的。他们在美国帕洛阿尔托和以色列特拉维夫设立办事处,这是因为3位创始人在当地有大量的人脉积累。 与Ilya一同创办SSI的另外两位创始人是Daniel Gross和Daniel Levy。Daniel Gross是一名AI行业的老兵,十几岁的时候就创建了搜索引擎Greplin(后更名为Cue),他21岁时Cue被苹果收购,他也加入苹果领导AI和搜索部门。他在2017年离开苹果,到硅谷知名孵化器Y Combinator创建了专门负责投资AI的项目。另一位创始人Daniel Levy毕业于斯坦福大学,并在OpenAI与Ilya共事过一段时间。 ▲SSI公司的三位创始人(从左至右:Daniel Gross、Ilya Sutskever、Daniel Levy) 一、将实现“核能级别”的安全水平,一步到位直通超级智能 以“安全超级智能”直接命名公司展现了Ilya和其它两位创始人对AI安全问题的承诺。SSI在官网上写道,超级智能已经触手可及了,而构建安全超级智能是我们这个时代最重要的技术问题。 在昨日接受彭博社的独家专访时,Ilya透露,“这家公司的特别之处在于,它的第一个产品将是安全超级智能,在那之前它不会做任何其他事情”。实现安全超级智能是SSI的唯一使命,也是他们的整个产品路线图。 ▲网友对SSI愿景的生动阐释(图源:X) SSI的团队、投资者和商业模式都致力于实现SSI。Ilya称公司不会面临处理大型而复杂的产品的问题,也不会陷入激烈的竞争。 Ilya并没有清晰地分享SSI将如何安全地实现超级智能。但他向彭博社透露,公司将尝试通过AI系统内部的工程突破来实现安全性的提升,而非依赖系统外部的“护栏”技术。公司产品的安全水平将是核能级别的安全,而不是互联网公司常常挂在嘴边的信任与安全(Trust and Safety)中的那种安全。 AI安全一直是Ilya最关心的问题。去年7月份,他在OpenAI领导组建了一个超级对齐团队,旨在于4年内解决引导和控制超级智能系统的问题。不过随着OpenAI内部的人事动荡和权力斗争,这一部门目前基本已经处于解散的状态。 Ilya曾多次就AI安全问题公开发声。他在去年11月份进行了一场TED演讲,向公众普及了迈向AGI(通用人工智能)道路上可能存在的安全风险。 他还参与了一部关于AI的纪录片的拍摄,分享了自己的AGI世界观和担忧。他在这部纪录片中称,如果不加干涉,自然选择的规律将会偏向那些优先保障自身利益的AI系统,届时人类的利益也可能受到损害。 其实,Ilya在5月15日官宣从OpenAI离职时,就已经预告了自己接下来会有大动作。他当时在推文中写道,自己对未来将要发生的事情十分兴奋,这个项目对他个人来说很有意义。 二、不差钱不缺算力也不缺人才,创始人资金人脉雄厚 创始人的背景给了SSI充足的底气,让他们能在公司官网写出“我们不受短期商业压力的影响”的表述。Ilya作为目前AI行业的顶流人物,在宣布创业消息后就受到广泛关注,更有网友疾呼自己要给Ilya打钱支持。他一直以来都主张要优先考虑AI安全问题,因此也深受同样重视这一问题的技术人员的尊重,在AI行业声誉颇高。 ▲网友疾呼自己要给Ilya打钱(图源:X) 但Ilya大概率不需要网友众筹也能获得大笔资金,让他能心无旁骛地推动安全超级智能事业。虽然他在接彭博采访时拒绝透露SSI的投资者和目前筹集到的资金,但我们能从几位创始人的背景中找到些许端倪。 在Ilya还是OpenAI超级对齐部门的负责人时,OpenAI官宣了与谷歌前CEO Eric Schmidt的合作。OpenAI当时和Eric Schmidt共同拨款1000万美元,用于支持超级对齐技术的研究,具体包括可解释性、可扩展的监督等方面的探索。Eric Schmidt财力雄厚,目前净资产约有250亿美元,在世界财富榜上排名第74位,还曾考察过购买美国TikTok的可能性。 ▲OpenAI官宣与Eric Schmidt的合作(图源:X) Eric Schmidt十分关注AI安全问题,还曾在2023年英国举办首届全球AI安全峰会前,与DeepMind的联合创始人Mustafa Suleyman联合在英国《金融时报》上撰文呼吁加强AI监管,提升AI公司开发的透明度。 SSI的另一位创始人Daniel Gross可能也拥有大量财富。2013年,也就是Daniel Gross年仅21岁时,他的创业公司Cue就被苹果以4000万-6000万美元的价格(具体金额未披露)收购。此后他加入苹果,领导苹果的AI和搜索部门。 Daniel Gross还是一名活跃的天使投资人。他曾投资过打车平台Uber、代码托管平台GitHub还有在2022年被Adobe公司以200亿美金的高价收购的实时协作设计软件公司Figma。他目前已经投资过大约35家科技公司,并从中获得不菲的收益。 在2017年加入YC后,Daniel Gross发起了YC的AI投资项目。他自己也在一年后成立了创业加速器和基金Pioneer,专门寻找科技领域的早期投资机会。 ▲Daniel Gross创建YC AI投资项目时的博客文章(图源:YC) Daniel Gross还与硅谷知名投资人Nat Friedman有多次合作。Nat Friedman是一名连续创业者,在公司被微软收购后进入微软任职,官至微软副总裁一职。在微软收购GitHub后出任GitHub CEO。Daniel Gross和Nat Friedman一同参与了对Uber、GitHub以及Figma等公司的投资。 二人还在2023年斥资1亿美元,建立了一个名为Andromeda的AI算力集群,并用这些算力来换AI初创公司的股权。这一算力集群拥有包括近3000块英伟达H100 GPU在内的大量算力基础设施,光是GPU就重达近5吨。看来SSI公司的算力是不用愁了。 ▲Andromeda算力集群官网(图源:Andromeda) SSI公司在美国帕洛阿尔托和以色列列特拉维夫设有办事处,他们称公司在当地有着深厚的根基并有能力招募顶尖技术人才。 帕洛阿尔托是美国旧金山湾区的重要城市,位于硅谷中心地带,可谓是创业的风水宝地。这里曾是惠普总部所在地,乔布斯小时候就在这长大,特斯拉也在这里布局了他们的全球工程与AI总部。 ▲位于硅谷中心地带的帕洛阿尔托(图源:Google Maps) SSI创始人之一的Daniel Levy大学就读于斯坦福,而斯坦福的校园距离帕洛阿尔托的市中心只有几分钟的路程,这或许能让SSI享受到斯坦福强大的校友资源。 帕洛阿尔托离苹果公司在库比蒂诺的总部也只有十几公里。Daniel Gross在苹果公司任AI和搜索部门负责人时积累的人脉或许能在创建SSI时派上用场。 公司的两位创始人Ilya和Daniel Gross与以色列也颇有渊源。Daniel Gross出生在耶路撒冷,而Ilya是出生在俄罗斯的犹太人,5岁时随着家人移民到以色列。Ilya在以色列开放大学学习了两年,之后才移民到加拿大转学到多伦多大学。在Sam Altman进行全球巡讲活动时,Ilya还特别出席了在以色列特拉维夫大学的分享活动。 ▲Ilya与Altman在以色列特拉维夫大学(图源:路透社) 几位创始人也向有志于开发安全超级智能系统的工程师和研究人员发出了邀请,让他们加入这支精明强干的队伍,共同解决这个时代最重要的技术挑战。 结语:Ilya不忘初心,通往超级智能的道路或将更加安全 Ilya与他人一同创办的SSI的愿景其实和OpenAI一开始的愿景颇为相似。OpenAI从成立之初就将公司的使命定义为确保AGI造福全人类,并将安全视为核心任务,但随着公司规模的扩大和融资的需求,OpenAI逐渐转变了自己的运营风格和公司架构,将增长视为公司的主要任务之一。 而Ilya在接受彭博社独家采访时,强调自己希望新公司SSI开发的产品能成为一股向善的力量,并反映人类共同认可的价值观。Ilya认为未来将会出现能够自主开发AI技术的超级智能系统,SSI的目标便是提升这些系统的安全性,同时让这些系统发展出强大的能力,造福全人类。 在通往超级智能的路上,有这样一股重视安全和人类共同利益的力量,或许能让我们都安心不少。
第2024年Q1全球VR头显报告发布:出货量大跌 中国占据供应链主导
凤凰网科技讯(作者/周文浩)6月20日,知名统计机构Counterpoint Research发布了2024年Q1全球VR头显发展趋势报告根据报告显示,2024年第一季度,全球VR头显市场遭遇重创,出货量同比下降29%,环比下降51%。报告还提到,中国供应商占据主导地位,这一趋势将进一步发展。 尽管苹果推出了备受期待的Vision Pro头显,但整体市场仍显疲软。Meta的出货量减少,而索尼和Pico则面临着严重的库存压力。除此之外,季节性促销活动的结束,如北美的黑色星期五和中国的双十一,也是导致环比出货量的显著下降的重要原因。 不过,苹果Apple Vision Pro、Meta新品、三星和vivo计划在2025年发布的产品等,均将为市场带来更多增长。 相比之下,企业级VR市场相较于消费级市场表现出更强的韧性,企业对VR技术的应用需求在逐步增加。 与VR市场的疲软表现不同,AR智能眼镜市场在2024年第一季度表现出较好的增长势头,出货量同比增长40%。中国市场成为全球AR智能眼镜市场的主要驱动力,占据了大部分市场份额。 值得注意的是,VITURE在中国推出的VITURE One系列眼镜迅速崛起,成为市场第三名。这表明AR智能眼镜市场正在逐步扩展,并吸引更多企业和消费者的关注。尽管如此,AR市场目前仍然属于小众市场,但其未来增长潜力不容忽视。
宋紫薇谈苹果开发低配Vision Pro:浪费时间,千万不要
【CNMO科技消息】日前,有报道称苹果将暂停下一代高端头显Vision Pro的开发工作,转而将开发一款更亲民的产品,功能更少但价格更便宜。6月20日,原iQOO产品经理、现理想汽车产品策略主管宋紫薇发文评价此事。她表示:这是我非常不希望看到的。 宋紫薇 宋紫薇发文称,最近很多声音说苹果暂停了下一代Vision Pro的开发,可能会改做一款低配版。这是我非常不希望看到的,我之前也发了很条多微博,尽管第一代销量不佳,但我依然认为它是跨时代的产品。 宋紫薇发文 宋紫薇称,苹果Vision Pro最大的问题是体验有太多的不完美,比如:太重,长时间佩戴不舒适;续航,拉线的外置电池体验差;手势和眼球交互的误触问题;需要适配更多高清内容。这些问题必须要在下一代解决。“千万不要浪费时间去推出一款低价版的吃灰收割机,别糟蹋了一款好产品,也别消耗用户的尝鲜热情。” 除了宋紫薇,此前知名苹果分析师郭明錤也发表了自己的看法。他认为开发廉价版无法解决Vision Pro使用率偏低的问题。郭明錤认为,Vision Pro使用率低不是单纯做一个降规低价版就能解决的。郭明錤表示,Vision Pro销量不佳的原因,主要还是当前该设备的生态和使用场景非常有限,价格贵或许是一个原因,但还不是最主要原因。 据《The Information》此前报道,苹果已通知供应商,原本规划的高端Vision Pro迭代项目已暂停。同时,一款定位更亲民的Vision头戴设备仍在推进中。这款产品因功能简化、配置下调,有望在2025年底前问世,内部代号N109,预计售价或在1600美元(约合人民币1.16万元)左右。 作为参考,目前苹果Vision Pro已经在国内开启了预售,将于6月28日正式开售,起售价高达29999元。
Apple Intelligence 机型限制太多?苹果高管回应
今年的苹果 WWDC 大会上,伴随着新系统的推出,苹果正式发布 Apple Intelligence(下文简称 Apple 智能)。 苹果在发布会上演示了 Apple 智能的各种强大 AI 能力。它能通过 AI 直接生成文字、图片、表情包,可以跨 App 执行操作,还拥有个人情境感知等能力。 然而,在苹果的「精准刀法」下,并非所有升级到新系统的设备都能使用 Apple 智能。 在手机端,虽然 iPhone XR 以后的机型都可以升级至 iOS 18,但是 Apple 智能将仅支持 iPhone 15 Pro 与 iPhone 15 Pro Max。就连最新的 iPhone 15 和 iPhone 15 Plus 都无法使用。 对于平板和电脑,同样也是部分设备才可以使用。只有搭载 M1 或后续芯片的 iPad 和 Mac 设备,才能在未来使用 Apple 智能。 这样的兼容设备限制,不免让人感到疑惑。自从 Apple 智能发布以来,许多用户就一直在好奇苹果这样做的原因。 WWDC 2024 之后,苹果例行的「The Talk Show」脱口秀如期展开。在这个活动中,Craig Federighi、Greg Joswiak 和 John Giannandrea 三位苹果高管接受了一系列采访,他们也对这一问题做了回应。 对于 Apple 智能仅限 iPhone 15 Pro 系列的问题,苹果人工智能主管 John Giannandrea 表示,大型语言模型的推理计算需求「高得惊人」,这需要大量带宽、NPU,以及设备本身的强大性能才能正常工作。 理论上,Apple 智能可以在旧机型上使用,但是运行速度将会非常慢。 网络中也一直有一种声音,质疑着苹果限制 Apple 智能是为了催促老用户更换设备,吸引用户购买更新的产品。 在脱口秀上,苹果全球营销高级副总裁 Greg Joswiak 正面回答了这一问题,否认此举是鼓励用户购买新款 iPhone 的营销策略。 Joswiak 表示:「不,完全不是,这绝对不是一种营销策略。否则,像我们这般聪明,(Apple 智能)肯定也会只支持我们最新款 iPad 和 Mac,难道不是吗?」 苹果的软件工程高级副总裁 Craig Federighi 表示,苹果在探索尝试任何新功能时,都会尽可能地让新功能支持老旧设备。 但就 Apple 智能而言,Federighi 说:「这需要强大的硬件……在 iPhone 上运行这样的模型,是一件相当了不起的事情。」 Federighi 还暗示到,RAM 对新 AI 功能来说是非常重要的,这也是新系统所需的另一个方面。 简单观察后就能够发现,所有能够使用 Apple 智能的设备,都至少可以搭载 8GB 的 RAM。或许,这并非巧合。 在 WWDC 2024 结束之后,天风国际证券分析师郭明錤也推断出了类似的观点。郭明錤称,能否支持 Apple 智能的关键应该是 DRAM 大小,而非 AI 算力 (TOPS)。 郭明錤在 Medium 博客上分析到: M1 的 AI 算力约为 11 TOPS,低于 A16 的 17 TOPS。 但 A16 的 DRAM 为 6GB,低于 M1 的 8GB。 因此,目前的 Apple Intelligence 设备端 AI LLM 对 DRAM 的需求约为 2GB 或更低。 对 DRAM 的需求可以用另一种方式来验证。 Apple Intelligence 采用设备端 3B LLM(应为 FP16,M1 的 NPU/ANE 对 FP16 有很好的支持),经过压缩后(采用 2-bit 与 4-bit 的混合配置),随时需要预留约 0.7-1.5GB DRAM 来运作 Apple Intelligence 的设备端 LLM。 市面上所有在售的 iPhone 中,只有 iPhone 15 Pro 和 iPhone 15 Pro Max 是搭载 8GB DRAM 的机型。 而苹果设备通常提供的 DRAM 较少,大多不超过 6GB。对于 iPhone 13 等老款机型,DRAM 更是只有 4GB。 从这一角度看,Apple 智能在手机端仅支持 iPhone 15 Pro 系列,确实是有合理性的。 海通国际技术分析师 JeffPu 此前表示,iPhone 16 系列将全系配备 8GB 内存。虽然这可以踏入 Apple 智能的门槛,但这个数字仍然不够,在一定程度上会限制苹果的端侧大模型研发。 而这种情况可能将持续到 iPhone 17 系列才会得到改善。JeffPu 在另一份报告中称,苹果于 2025 年推出的 iPhone 17 Pro 和 iPhone 17 Pro Max 才将提供 12GB 内存。 国际市场调研机构 IDC 在《AI 手机白皮书》中指出,16GB RAM 将成为新一代 AI 手机的基础配置,SoC 以外的硬件需要一同配套升级。 虽然苹果拥有独特的内存管理机制,但大内存还是市场所趋。AI 模型端侧推理部署需要更大的内存空间,如此才能够实现更好的用户使用体验。 正如郭明錤所说: 三星 Galaxy S24 的 AI 功能有限,微软的 AI PC 目前仍让消费者感到困惑,但苹果成功定义了设备端 AI(至少消费者已清楚知道苹果的 AI 设备功能丰富且有哪些卖点),而这会加速竞争对手的模仿与追赶,并进而带动设备端 AI 相关行业的快速成长。 Apple 智能的出现,是苹果在软件上提交的一份精彩的答卷。 但实际体验是否如苹果宣称的那么美好,还需要等到正式上手后再做评价。未来,也希望苹果在硬件上能写下更好的答案。
按下“暂停键”的Vision Pro,在等下一次炒作
卖不动的Vision Pro,又传来一个坏消息:这边国行版本还没开售,第二代产品又要无限期推迟。 据The Information报道,苹果正在开发一款更便宜的非Pro版本Vision Pro头显,并暂停了下一代高端机型的开发。 这则消息来自多位参与Vision Pro供应链的相关人士,他们声称,苹果已经告诉至少一家供应商暂停下一代Vision Pro头显的生产。 虽然听起来很突然,其实在今年4月,彭博社记者Mark Gurman在一篇报道里,就已经预告了第二代产品推迟的消息。 按照当时的说法,第二代产品将在2026年底才会推出,主要原因是苹果尚未找到降低成本的有效方案。 也正是因为售价过贵的原因,不能普及大众,苹果决定暂停Vision Pro 2 的研发,将精力转向明年发布,一款更便宜的头显设备。 但价格昂贵只是外表原因,苹果过于冒险地提前推出头显,最终让第一代产品成为了消费市场的“牺牲品”。 停止开发下一代高端头显,苹果再次调整方向 根据供应链的消息,由于Vision Pro销量下滑,最终导致苹果决定暂停第二代产品生产。 这款头显的设备标识符为N109,内部代号为Project Alaska,在外观设计方面与初代产品基本类似,除了继续沿用初代产品的摄像头和传感器,配备两个micro-oled屏幕,并支持指南针、陀螺仪和磁力计等功能。 此外,第二代产品还会推出一款平价版本,物料成本将仅有初代产品的一半左右,通过配备更低端的芯片,并通过削减一些功能,从而控制产品成本。 至于这个平价版本,是否就是报道里提到的“2025年底推出的更便宜的MR头显”,目前还没有准确消息。 笔者猜测,由于苹果在控制成本上出现了问题,因此新头显很有可能会进行重新设计。 据悉,苹果希望这款更便宜的头显能够保留当前 Vision Pro所拥有的高分辨率显示屏,砍掉了摄像头、扬声器等一些功能,重量比Vision Pro轻三分之一。 作为一款入门级产品,低价款Vision的价格将与目前高端iPhone的价格接近(约 1600 美元),虽说这价格比目前的 Vision Pro(3299美元)便宜了不少,但仍比Meta Quest 3贵了不少,后者的最高端的型号售价才649美元。 不过毕竟成本和噱头摆在那里,10000元出头的低价款Vision肯定要比现在好卖的多。 相比之下,高昂定价的Vision Pro一代,或许会成了“牺牲品”。 错误的定位? 虽然普通消费者都在抱怨Vision Pro昂贵的价格,但部分研究机构和券商还是对这一代产品保持着乐观的态度。 这部分人认为,Vision Pro本来就是面向开发者,而不是C端。 首先,Vision Pro是在WWDC 2023上发布,这一直是苹果面向全球开发者的节日; 其次,目前购买和租赁的主力来自科技发烧友、果粉、开发者以及科学家们,C端普通大众并没有对MR产品有太大兴趣。 最后,苹果的初代产品一般都是靠开发者挖掘和丰富软件生态,最后才会把产品推向大众。 因此,就Vision Pro来说,苹果仍处于烧钱搭建生态阶段。 听上去这个逻辑很有道理,不过当我们翻出外媒对于库克的专访时就可以发现:这位CEO对于Vision Pro的期待,远不止是构建生态那么简单。 在《Vanity Fair(名利场)》的一篇文章里,通过库克的视角,讲述了这款昂贵设备的研发过程,并带上了知名导演卡梅隆等人的评论。 其中,库克对Vision Pro的评价是:这将是计算、娱乐、应用程序和内存的未来。 事实上,这篇文章通篇展示着库克对于Vision Pro未来的期待,但对于现实存在的问题,文章只是一笔带过。 “他知道苹果必须让这个产品成为苹果的下一个产品类别。” 这篇文章还提到不少细节,包括Vision Pro将两倍的像素压缩到了一个和眼球一样小的空间里,而不是直接使用4K显示屏——突出屏幕的显示效果; 另外, Vision Pro拥有过大的尺寸和重量,但研发团队认为不能再小、再轻——提到了头显存在的问题; 最后,文章还用大量篇幅提到了“空间计算”这个词——这也是Vision Pro的卖点之一。 目前来说,4K显示,强大的M2芯片、R1芯片,确实让Vision Pro成为了市面上最强的头显设备,对比Quset 3等竞争对手,苹果在显示真实世界的能力上,确实让清晰度、亮度、色彩等环节都能做到最真实的效果。 但也正是“真实”,成了生态开发者手里的“枷锁”——如何让软件用上眼球、手势的交互体验?如何降低使用者的上手门槛? 种种问题导致Vision Pro应用数量过少,就连Netflix、Youtube等主流网站都没能适配。 而由“真实”带来的另一个压力,来自设备本身。 为了给用户提供更好的显示效果,Vision Pro的重量远远超过了同类产品,加上Vision Pro的重量设置并不均衡,前端更重,这导致使用者难以承受长期佩戴设备的压力。还有一部分近视但不想戴隐形眼镜使用的消费者,也需要额外购买镜片。 当然,高额配置带来的价格,才是真正让人望而却步的原因。 可以说,库克对于Vision Pro的定位还是过高,现在只能靠“做减法”的方式一步一步减负。 如果当初在发布高端版的同时推出一款平价产品,不仅对于开发者,对于大众消费者和科研人员们,都是一款值得入手的终端设备。 结语 从公司的角度出发,苹果正面临着硬件上的销售挑战。 其中,苹果“当家老大”、占总收入六成的手机部门,自今年年初以来,销量持续下滑。显然高端策略已不再像过去那样玩得转了。 既然iPhone打不动,那么苹果就需要一个新的增长点。 是靠拥有“5000 项技术专利“、“20年来最冒险”的革命性产品——Vision Pro?还是靠成本更低、风险更小的AI? 从WWDC 24结束后的股价来看,确实是生成式AI赌赢了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。