EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
特斯拉自动驾驶又出事:竟开上了火车道被撞
Model 3卡在了铁轨上 凤凰网科技讯 北京时间6月17日,据电动汽车网站Electrek报道,一辆特斯拉Model 3在美国宾夕法尼亚州辛金斯普林(Sinking Spring)卡在了铁轨上,随后被火车轻微撞击。车主称,当时车辆处于“自动驾驶模式”。 根据伯克斯县发布的救援警报,一辆特斯拉Model 3绕过了南赫尔街和哥伦比亚大道附近的铁轨防护栏后,卡在了铁轨上。 车主从车中脱身,但一列火车撞上了这辆车,据报道折断了后视镜。消防局长下令暂停所有列车通行。紧急救援人员使用吊车将这辆Model 3从铁轨上移走。Spitlers汽车修理与拖车公司承担了救援作业,并在脸书上分享了几张照片。 特斯拉车主声称,Model 3在卡在铁轨上之前处于“自动驾驶模式”。 Model 3被吊走 尽管特斯拉曾表示,该公司自2016年以来生产的所有车型,通过软件更新都将具备无人监督的自动驾驶能力,但是这一能力尚未实现。特斯拉一直在销售一款售价高达1.5万美元的“全自动驾驶”(FSD)套件,但该套件仍需车主时刻监督车辆,始终对车辆负责。 Electrek指出,曾有特斯拉车主在鲁莽驾驶后,将责任归咎于FSD。这起事故也可能是这种情况。不过,也有特斯拉FSD试图绕过施工路障的情况,所以这次它也有可能尝试这么做,结果反而卡在了铁轨上。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
让渐冻症患者实时对话、“哼唱”旋律!美国高校脑机接口新进展,延迟仅10ms
编译 | 金碧辉 编辑 | 程茜 智东西6月16日消息,据外媒New Atlas 6月14日报道,美国加州大学戴维斯分校(UC Davis)研究团队开发世界首例新型脑机接口(BCI)系统,首次让一名ALS患者(肌萎缩侧索硬化症,俗称渐冻症)通过脑内植入设备,不仅实现实时说话,还能“演唱”简单旋律,从信号采集到语音生成的全流程仅需10毫秒。 这里的“演唱”是指患者并非通过传统声带发声,而是通过BCI系统将神经信号转化为电子合成音,输出三个预设音高的旋律片段。这种“演唱”本质是系统对患者神经意图的解析与语音合成,有别于自然歌唱行为。 新研发的BCI系统通过手术植入的四组微电极阵列,捕捉大脑负责语言输出区域的神经信号,结合低延迟处理与AI解码模型,将患者试图说话时的肌肉控制信号转化为语音,并通过语音克隆算法还原其患病前的声音特征。 从信号采集到语音生成的全流程仅需10毫秒,加州大学戴维斯分校研究团队开发的新型BCI系统使患者能自然参与对话,甚至打断他人发言,这是传统BCI系统难以实现的交互体验。 ▲BCI设置和使用语音合成技术的研究参与者 相关研究成果6月11日发表于学术顶刊Nature上,美国加州大学戴维斯分校研究团队最新研发的BCI系统被学界称为“Speech BCI领域的圣杯”。 ▲美国加州大学戴维斯分校研究团队研发BCI系统的相关成果发表于学术顶刊Nature上 论文地址: https://www.nature.com/articles/d41586-025-01818-1 一、神经信号捕捉与低延迟处理双突破,渐冻症患者说话“零卡顿” 据外媒New Atlas 6月14日报道,戴维斯分校研究团队开发的新型BCI系统的核心在于通过植入大脑运动皮层的微电极阵列,直接获取患者试图说话时的神经活动信号。 不同于“读心术”,新型BCI系统的原理是翻译患者大脑控制发音肌肉的指令,而非读取抽象思维。AI驱动的解码模型经过训练,能实时将神经信号转化为文本,再通过语音合成器输出。 ▲研究参与者阅读屏幕文本的神经信号有助于训练AI解码器模型 二、从“屏幕选词”到“自发插话”,新型BCI系统让“说话”更像真人 据外媒New Atlas报道,今年4月,美国加州大学伯克利分校与旧金山分校曾公布类似BCI技术,但美国加州大学戴维斯分校的研究团队研发的BCI系统在自然表达维度实现突破。 在前沿交互能力的展现上,加州大学戴维斯分校研发的BCI系统不仅能捕捉患者发音时的“啊”、“哦”、“嗯”等语气词,还可借助神经信号解析陈述句与疑问句句调差异,甚至能对单词重音位置进行识别。 据外媒报道,从加州大学戴维斯分校研究团队的系统演示视频透露,患者可通过设备输出三个预设音高的旋律片段,其AI解码器突破传统训练数据限制,成功处理生造词汇的语音合成。 相较于过往BCI系统仅能输出预设文本,加州大学戴维斯分校研究团队技术在自然语言情感表达与语义灵活性上实现实质提升。 三、脑机接口克隆患者原声实现连续对话,渐冻症患者率先受益 加州大学戴维斯分校研发的BCI系统的一大亮点是通过患者患病前的语音样本训练克隆算法实现个性化语音合成。 该论文的作者、神经科学家谢尔盖·斯塔维斯基(Sergey Stavisky)在论文发表同期接受多家外媒采访时透露:“即时语音合成技术能让患者更自然地融入对话,减少因传统BCI系统延迟导致的交流中断。” 荷兰马斯特里赫特大学的计算神经科学家克里斯蒂安·赫夫(Christian Herff)在学术顶刊Nature同期评论中评价道:“这是真正的自发连续语音,BCI终于从实验室走向现实沟通。” 目前加州大学戴维斯分校的研究虽仅涉及1名ALS患者,但团队已计划招募更多因中风、脑损伤等不同病因导致失语的患者,以验证技术的普适性。 在外媒看来,这一成果标志着BCI从“文字输出”向“自然语音交互”的跨越,为全球千万瘫痪患者带来更具尊严的沟通方式。 结语:脑机接口技术突破背后,BCI设备成本与普及性成挑战 加州大学戴维斯分校的研究突破可能为全球约30万渐冻症患者及其他神经退行性疾病患者带来希望。或许未来,渐冻症患者能像常人一样打断对话、用语气表达情绪,但技术落地仍需跨越多重关卡。单病例研究的局限性、不同患者大脑信号的个体差异、长期植入的安全性,以及AI模型对复杂语境的适应性,均需后续研究验证。 此外,BCI设备的成本与普及性也是现实挑战。当这项技术从顶尖实验室走向临床,或许还需要5到10年的迭代。然而,从伯克利分校的屏幕选词到美国加州团队的实时歌唱,脑机接口正以肉眼可见的速度突破边界。正如赫夫所言:“这不是概念,而是真实的、自发的语言重生。”
AI教父辛顿最新访谈万字实录:AI将如何颠覆所有脑力劳动?(附完整视频)
昨晚,油管千万级大V The Diary Of A CEO放出了,与图灵奖、诺贝尔奖获得者,被誉为AI教父的Geoffrey Hinton最新深度专访。, 二人以对话形式主要探讨了AI的发展、安全、应用;虽然AI存在一定的风险,但在帮助人类提升科研、工作、生活水平质量等方面是非常高效。当然也会抢走一部分人的工作,从而创造一些全新的职位。 OpenAI作为本世代AI革命的发起者和领导者,也出现在了本次对话中。Hinton还谈到了他最得意的弟子,OpenAI联合创始人兼首席科学家Ilya Sutskever,以及最近发展势头超猛的AI Agent智能体。 自动播放 这段专访一共是1小时30分钟,由于太长为了不影响大家的观感,「AIGC开放社区」没有添加字幕。但我们依然在下面为大家整理了好了这次专访内容。有需要的话,可以对照参考一下。 目前,这个视频放在油管上还不到一天的时间,播放量已经超过75万次,评论超过4500条,用户对这个专访相当满意。在AI方面无论你是否从事该行业或者使用它都能受到不小的启发。 我们看看网友是如何评价这个史诗级专访的。 有网友表示,本次专访应该被保存为一件历史文物。 这是我在你的频道上看到的第一或第二重要的对话。你在采访中停顿,让答案慢慢沉淀,意义深远。 这是我看过最好的专访,Hinton非常真诚。 我儿子多年来一直有一个理论,认为让人工智能像人类一样思考是危险的。相反,他希望我们创造一个像“狗”一样思考的人工智能,这样它就会爱人类并愿意服务我们。 也有一位网友对于AI有着深切的体会,发表了一篇超长的评论:我原本是一个自由撰稿人,干了十年,结果因为AI的出现失去了这份职业;接下来那年我想转向艺术行业,但又被打断了;再下一年,我开始转行学习医疗编码,却在认证过程中再次被中断,因为我意识到AI正在摧毁创意市场。之后我在各种零工之间辗转挣扎,幸运的是我找到了一份训练AI的工作,虽然我很讨厌这份工作,但我还是感激它带来的收入。 我一直没能找到别的工作,现在所有人都在用AI了。我原本以为转型到科技领域会有帮助,于是开始学习更多关于AI的知识,所以去年又回到了学校学习编程。然而很快我就意识到发生了什么。 AI的学习速度比我快太多了。于是我退学了。我不愿意再花钱去接受教育,因为它根本不会给我带来任何好处。即使我完成了编程学位,等到毕业的时候,所有初级职位可能都已经被AI取代了,而学校的教学内容又远远落后于技术发展的前沿——没有经验,没人会雇我。 说实话,我不知道自己还能做什么。我有几十年的慢性伤病,没法从事体力劳动。我想我只能再漂泊一两年,直到AI可以自我训练为止,那时我又会被辞退。然后就业市场会更加艰难,因为还有那么多同样失业的人。也许还会有一些零工机会,也许勉强能凑够房租,也许连这个都做不到,谁知道呢? 我能预见到自己最终流落街头,死在沟渠里。每当我想到未来,就会不由自主地陷入深深的抑郁。 我知道AI确实很有用,也有巨大的积极潜力,但让我们现实一点吧。全球范围内,我们现在拥有足够的资源来照顾每一个人,但我们并没有这么做。我们清楚应对气候变化该怎么做,但我们不去做。美国是世界上最富有的国家,但我们甚至不给国民提供基本的医疗保障。全民基本收入?在美国,这几乎不可能。 AI并不会改变人性,而人性本身充满了致命的缺陷:贪婪、傲慢、自私等等。那些富有且有权势的人会从系统中榨取一切他们能拿到的东西,而剩下的其他人只能挨饿。未来很黯淡。我一直在努力想出一个办法,建造一艘能在这些巨浪中浮沉的船,但我什么都想不到。市场只需要那么几个水管工而已。 下面就是本次专访部分内容。 主持人:非常感谢,GeoffreyHinton,他们称你为“AI教父”? Hinton:是的。 主持人:为什么这么称呼你? Hinton:过去没有多少人相信我们能让神经网络,人工神经网络发挥作用。所以从20世纪50年代起,在AI领域,关于如何实现AI主要有两种思路。一种观点认为,人类智能的核心是推理,而要进行推理,需要使用某种形式的逻辑。 因此,AI必须基于逻辑。在你的大脑中,一定有类似符号表达式的东西,你用规则来操作它们,这就是智能运作的方式。而像学习或类比推理这类能力,都是在我们弄清楚基本推理如何运作之后才会出现的。另一种方法则是:让我们基于大脑来构建AI模型,因为显然大脑让我们拥有智能。所以在计算机上模拟脑细胞网络,并试图找出如何学习脑细胞之间连接的强度,以便它能学会做复杂的事情,比如识别图像中的物体、识别语音,甚至进行推理。 我坚持这种方法长达50年,因为很少有人相信它。当时没有多少好大学有从事这方面研究的团队,所以如果你从事这个领域,那些相信这种方法的最优秀的年轻学生就会来和你一起工作。我很幸运,招到了很多非常优秀的学生,他们中的一些人后来在创建OpenAI等平台中发挥了关键作用。 主持人:你为什么相信基于大脑建模是更有效的方法? Hinton:早期不止我一个人这么认为。冯・诺依曼相信,图灵也相信。如果他们中的任何一个还活着,我认为AI的历史会大不相同,但他们都英年早逝了。 主持人:你认为AI会更早出现吗? Hinton:我认为如果他们中的任何一个还活着,神经网络的方法会被更早接受。在你人生的这个阶段,你肩负着什么使命?我现在的主要使命是警告人们AI可能有多么危险。当你成为AI教父时,你知道这一点吗? 不太清楚。我对一些风险的理解比较迟缓。有些风险一直很明显,比如人们会用AI制造自主杀伤性武器,也就是那些四处游走、自己决定杀谁的东西。其他风险,比如它们有一天会比我们更聪明,甚至可能让我们变得无关紧要,我很晚才意识到这一点。其他人20年前就认识到了,而我直到几年前才意识到这是一个可能很快到来的真实风险。 主持人:考虑到你对计算机学习能力的了解它们能像人类一样学习,并且还在不断改进你怎么会没有预见到这一点呢?你怎么会没看到呢?20、30年前的神经网络所能做的事情非常原始,在视觉、语言和语音识别等方面远不如人类。当时认为需要担心它们变得比人类更聪明,似乎很荒谬。这种情况什么时候改变的? Hinton:对普通大众来说,是ChatGPT出现的时候。对我来说,是当我意识到我们正在创造的数字智能具有某种特质,使它们远远优于我们拥有的生物智能。如果我想和你分享信息,比如我学了一些东西,想告诉你,我会说一些句子。 这是一个相当简化的模型,但大致正确。你的大脑试图弄清楚如何改变神经元之间连接的强度。比如,我可能会把某个词放在下一个位置,当出现一个非常出人意料的词时,你会进行大量学习,而当出现一个很明显的词时,学习就很少。比如我说鱼和薯条,当我说薯条时,你不会有太多学习;但如果我说鱼和黄瓜,你就会有更多学习,你会想为什么我会说黄瓜。这大致就是你大脑中发生的事情,我们认为大脑就是这样工作的。 没人真正确定大脑是如何工作的,也没人知道它如何获取关于是增强还是减弱连接强度的信息,这是关键。但我们现在从AI中知道,如果能获得关于如何调整连接强度以更好地完成任务的信息,我们就能学习到不可思议的东西,因为这就是我们现在用人工神经网络在做的事情。只是我们不知道真实的大脑是如何获得这种增减信号的。 主持人:如今,你对AI安全的主要担忧是什么?如果让你列出最首要的几个,我们应该关注的。 Hinton:首先,我想区分两种完全不同的风险。一种是人类滥用AI带来的风险,这是大多数风险,也是所有短期风险。另一种是AI变得超级智能并决定不再需要我们带来的风险。这是真实的风险吗?我主要谈论第二种风险,因为很多人会问:这是真实的风险吗?是的。 现在,我们不知道这风险有多大,我们从未处于这种情况,从未需要应对比我们更聪明的东西。所以,关于这种生存威胁,我们完全不知道如何应对,也不知道它会是什么样子。任何告诉你他们知道会发生什么以及如何应对的人,都是在胡说八道。我们不知道如何估计它取代我们的概率。有人说这个概率低于1%,我的朋友杨立昆认为,不,我们一直在建造这些东西,我们会一直控制它们,我们会让它们听话。 而像尤德考斯基这样的人则说,不,这些东西肯定会消灭我们,只要有人建造了它,就会把我们都消灭。他对此很有信心。我认为这两种立场都很极端,很难估计中间的概率。如果让你在两位朋友中赌谁是对的 我根本不知道。如果必须赌,我会说概率在中间,但我不知道该如何估计。我常说有10%到20%的可能性它们会消灭我们,但这只是基于直觉,因为我们还在制造它们,而我们很有创造力。希望如果有足够多的聪明人用足够多的资源进行研究,我们能找到一种方法来建造它们,使它们永远不想伤害我们。有时我会想到第二条道路,想到核弹和原子弹的发明,以及它们的对比这次有什么不同?因为原子弹出现时,我想当时很多人认为我们时日无多了。 原子弹其实只擅长一件事,而且它的作用方式非常明显。即使你没有看到广岛和长崎的照片,也能明显看出这是一种非常危险的大炸弹。而AI则不同,它有很多用处,在医疗、教育以及几乎任何需要使用数据的行业,有了AI都能做得更好。所以我们不会停止发展它。人们会说:那我们为什么不现在就停止?我们不会停止,因为它在太多领域都太有用了。另外,我们也不会停止,因为它对战斗机器人很有用,而任何出售武器的国家都不会想停止。 比如欧盟法规,他们有一些关于AI的法规,有总比没有好,但这些法规并非为应对大多数威胁而设计。特别是,欧盟法规中有一个条款规定,这些法规不适用于AI的军事用途。所以政府愿意监管公司和个人,但不愿意监管自己。在我看来,这很疯狂。我来回思考这个问题,但如果欧洲有法规,而世界其他地区没有,就会造成竞争劣势。 主持人:我们已经看到这种情况了。我认为人们没有意识到,当OpenAI在美国发布新模型或新软件时,由于这里的法规,它们还不能在欧洲发布。所以SamAltamn发推文说:我们新的AI智能体产品对所有人开放,但由于法规原因,暂时不能进入欧洲。是的,这会给我们带来生产力劣势吗? Hinton:生产力劣势。我们现在需要的是,在我们即将创造出比自己更聪明的东西的历史时刻,我们真正需要的是一个由聪明、有思想的人管理的世界政府,但我们没有。所以现在是混战局面。 主持人:我们现在实行的资本主义让我们过得很好,为我们生产了大量商品和服务。但这些大公司在法律上被要求尽可能最大化利润,而这并不是开发AI所需的。那么来谈谈风险吧。你提到过人类风险吧。 Hinton:我已经区分了这两种风险。先谈谈坏人和不良行为者使用AI带来的所有风险。首先是网络攻击。2023年至2024年间,网络攻击增加了约12200%,这可能是因为这些大型语言模型使钓鱼攻击变得容易得多。钓鱼攻击对不知道的人来说,就是他们给你发信息说:嗨,我是你的朋友约翰,我被困在萨尔瓦多了,你能汇点钱吗? 这是一种攻击。但钓鱼攻击实际上是想获取你的登录凭证。现在有了AI,它们可以克隆我的声音、我的形象,它们可以做所有这些。我现在很头疼,因为在X平台和Meta上有很多AI诈骗。 特别是在Meta上,比如Instagram和Facebook,现在有一个付费广告,他们从我的播客中提取了我的声音和举止,制作了一个新视频,让我鼓励人们参与这个加密庞氏骗局之类的东西。我们花了好几个星期给Meta发邮件,让他们把这个广告撤下来,他们撤了,又弹出一个,再撤,又弹出一个,就像打地鼠一样。最令人心碎的是,有人听信了骗局,损失了500英镑或500美元,还以为是我推荐的,对我很生气,我真的为他们难过,这太烦人了。我也遇到过类似的小事,现在有人发表论文,把我列为作者之一,看起来是为了让自己获得更多引用。 主持人:所以网络攻击是非常真实的威胁,而且已经激增。显然,AI很有耐心,它们可以浏览一亿行代码,寻找已知的攻击方式,这很容易做到。但它们会变得更有创造力,有人相信一些很懂行的人相信到2030年,它们可能会制造出人类从未想过的新型网络攻击。这非常令人担忧,因为它们可以自己思考,从比人类见过的多得多的数据中得出新结论。你有没有采取什么措施来保护自己免受网络攻击? Hinton:有,这是我少数彻底改变做法的领域之一,因为我害怕网络攻击。加拿大的银行非常安全,2008年没有一家加拿大银行濒临破产,它们受到很好的监管。不过,我认为网络攻击可能会让一家银行瘫痪。如果我所有的储蓄都是银行持有的银行股票,那么如果银行被攻击,而它们持有你的股票,这些股票仍然是你的。所以我觉得你应该没事,除非攻击者卖出股票,因为银行可以卖出股票。如果攻击者卖出你的股票,我觉得你就完了。我不知道,也许银行会设法赔偿你,但那时银行已经破产了,对吧? 所以我担心加拿大的一家银行被网络攻击瘫痪,攻击者卖出它持有的股票。因此,我把我和孩子们的钱分散存在三家银行,我认为如果一次网络攻击搞垮一家加拿大银行,其他加拿大银行会很快变得非常谨慎。你有不联网的手机吗?你有没有考虑过冷存储之类的?我有一个小磁盘驱动器,我用这个硬盘备份我的笔记本电脑,所以我的笔记本电脑上的所有东西都在硬盘上。至少如果整个互联网瘫痪了,我知道我的笔记本电脑上还有,我的信息还在。 主持人:然后是选举腐败。如果你想利用AI来操纵选举,一个非常有效的方法是进行有针对性的政治广告,因为你对这个人了解很多。所以任何想利用AI来操纵选举的人,都会试图获取选民的所有数据。考虑到这一点,马斯克目前在美国的做法有点令人担忧,他坚持要访问所有这些原本被仔细隔离的信息。他声称这是为了提高效率,但这正是如果你想操纵下一次选举会想要做的事情。 Hinton:因为你获取了所有这些关于人们的数据,你知道他们赚多少钱、住在哪里,了解他们的一切。一旦你知道这些,就很容易操纵他们,因为你可以让AI发送他们会觉得非常有说服力的信息,比如告诉他们不要投票。我没有理由,只是凭常识这么想,但如果他从美国政府来源获取所有这些数据的部分动机是为了操纵选举,我不会感到惊讶。另一部分可能是,这是训练大模型的很好的数据,但他必须从政府获取这些数据并输入到他的模型中。他们已经关闭了很多安全控制,取消了一些防止这种情况的组织。 主持人:接下来是像YouTube和Facebook这样的组织制造信息茧房,给人们看会让他们愤怒的东西。人们喜欢愤怒,“愤怒”在这里指的是感到愤怒但又觉得自己是正义的。比如,如果给我看一个说特朗普做了这件疯狂事的视频,我会立刻点击。 Hinton:这就是YouTube、Facebook和其他平台决定给你推荐什么内容的策略所导致的。如果他们采取推荐平衡内容的策略,就不会有那么多点击量,也无法卖出那么多广告。所以本质上,利润动机促使他们给用户看能让他们点击的东西,而能让他们点击的是越来越极端、能证实他们现有偏见的内容。你的偏见不断被证实,越来越深,这意味着你和他人的分歧越来越大。 现在在美国,有两个几乎不交流的群体。我不确定人们是否意识到,每次打开应用程序,这种情况都在发生。但如果你使用TikTok、YouTube或其他大型社交网络,正如你所说,算法的设计是为了给你推荐更多你上次感兴趣的内容。所以如果这样持续10年,它会把你推向越来越极端的意识形态或信仰,远离理性和常识,这很不可思议。 主持人:我经常听到一种风险,就是这些东西可能会结合起来,比如网络攻击会释放武器。当然,把这些风险结合起来,会产生无数种风险。例如,一个超级智能AI可能决定消灭人类,最明显的方法就是制造一种危险的病毒。如果你制造一种传染性极强、致命性极高但潜伏期很长的病毒,每个人在意识到发生了什么之前就已经感染了。我认为,如果一个超级智能想消灭我们,它可能会选择类似生物武器的方式,这样不会影响到它自己。你不觉得它可能会很快让我们自相残杀吗?比如,它可以向美国的核系统发送警报。 Hinton:我的基本观点是,超级智能有太多方法可以消灭我们,没必要去推测具体方式。我们必须做的是防止它产生这种想法,这才是我们应该研究的方向。如果它想消灭我们,我们根本无法阻止,因为它比我们聪明。我们不习惯思考比我们更聪明的东西。如果你想知道当你不再是顶级智慧时的生活是什么样的,问问鸡就知道了。我早上离开家时想到了我的狗巴勃罗,它是一只法国斗牛犬。它不知道我要去哪里,不知道我在做什么,甚至无法和它交流。而智能差距将会是那样的。 主持人:你如何看待自己一生的工作? Hinton:AI在医疗、教育等领域会非常出色,它会让呼叫中心效率大大提高,不过人们会担心现在从事这些工作的人该怎么办。我很伤心。我并不为40年前开发AI感到特别内疚,因为那时我们根本没想到事情会发展得这么快,我们以为有足够的时间去担心这些问题。 当你无法让AI做很多事情时,你只想让它多做一点,不会担心这个愚蠢的小东西会接管人类,你只是想让它多做一些人类能做的事。我不是明知这可能会消灭我们还去做,只是很遗憾它不只是带来好处。 所以我现在觉得有责任谈论这些风险。如果你能展望未来30、50年,发现AI导致了人类灭绝。如果最终结果确实如此我会用这一点来告诉人们,告诉他们的政府,我们必须真正努力控制这一切。我认为我们需要人们告诉政府,政府必须迫使公司利用资源来研究安全性,而他们现在没做多少,因为这样赚不到钱。 主持人:你之前提到的一个学生,IlyaSutskever离开了OpenAI。他为什么离开? Hinton:是的,关于他离开的原因有很多讨论,说是因为担心安全性。我认为他离开是因为担心安全性。我仍然时不时和他一起吃午饭,他父母住在多伦多,他来多伦多时,我们会一起吃饭。他不跟我谈论在OpenAI发生的事,所以我没有内部消息。但我很了解他,他真的很关心安全问题,所以我认为这就是他离开的原因,因为他是顶尖人才之一,可能是早期ChatGPT开发背后最重要的人,比如GPT-2的开发,他发挥了重要作用。 主持人:你了解他的为人,知道他有良好的道德指南针,不像马斯克那样没有道德指南针。SamAltman有良好的道德指南针吗? Hinton:我不了解SamAltman,不想评论。 主持人:如果你看看山姆几年前的声明,他在一次采访中轻松地说,这东西可能会杀了我们所有人,虽然不是原话,但意思差不多。现在他说你不必太担心,我怀疑这不是出于对真相的追求,而是出于对金钱的追求。 Hinton:我不该说金钱,是两者的某种结合。我有一个亿万富翁朋友,他身处那个圈子。有一天我去他家吃午饭,他认识很多AI领域的人,正在建造世界上最大的AI公司。他在伦敦的厨房餐桌上给了我一个警告,让我了解了这些人私下的谈话,不是他们在媒体采访中谈论安全的那些话,而是他们个人认为会发生什么。他们私下的想法和公开说的不一样。 有一个人,我不该说名字,他是世界上最大的AI公司之一的领导者。我朋友很了解他,他私下认为我们正走向一个反乌托邦世界,在那里我们有大量的空闲时间,不再工作,而这个人根本不在乎这会对世界造成什么伤害。我指的这个人正在建造世界上最大的AI公司之一。 然后我看了这个人的在线采访,试图找出他是那三个人中的哪一个,是的,就是那三个人中的一个。我看了他的采访,回想起我那位认识他的亿万富翁朋友的谈话,心想:“该死,这家伙在公开场合撒谎。”他没有对世界说实话,这让我有些困扰。这也是我在这个播客中多次谈论AI的部分原因,因为我觉得他们中的一些人对权力有点虐待狂倾向,他们喜欢自己将改变世界的想法,认为自己将从根本上改变世界。 我认为马斯克显然就是这样,他是个复杂的人,我真的不知道如何评价他。他做了一些非常好的事情,比如推动电动汽车,这是一件非常好的事情;他对自动驾驶的一些说法有些夸张,但他做的事情很有用。 主持人:据我所知,公司曾表示会将相当一部分计算资源用于安全研究,但后来减少了这部分资源,我认为这是发生的事情之一,这已经被公开报道过 Hinton:是的。我们已经谈到了自主武器的风险,接下来是失业问题。过去,新技术的出现并没有导致失业,而是创造了新工作。经典的例子是自动柜员机,当自动柜员机出现时,很多银行柜员并没有失业,他们只是做了更有趣的事情。但我认为这次更像工业革命时期机器的出现,现在你不能靠挖沟谋生了,因为机器挖沟比你好得多。 对于普通的脑力劳动,AI将取代所有人。可能会出现这样的形式:使用AI助手的人减少,一个人和一个AI助手现在能做以前10个人的工作。 人们说AI会创造新工作,所以我们会没事的,其他技术也是如此,但这次的技术不同。如果AI能做所有普通的人类脑力劳动,它会创造什么新工作呢?你必须非常有技能才能拥有一份AI不能做的工作,我认为他们错了。你可以尝试从其他技术,比如计算机或自动柜员机,进行推断,但我认为这次不同。 人们说:AI不会取代你的工作,使用AI的人会取代你的工作。我认为这是对的,但对很多工作来说,这意味着需要的人少得多。我的侄女在医疗服务机构回复投诉信,过去需要25分钟,她会读投诉,思考如何回复,然后写信。现在她只是把投诉扫描进聊天机器人,机器人写信,她只需要检查,偶尔让机器人修改,整个过程只需要5分钟。这意味着她可以回复五倍的信件,所以需要的人减少到五分之一,她现在能做过去五个人的工作,这意味着需要的人更少。 主持人:在其他工作中,比如医疗保健,弹性更大。如果能让医生效率提高五倍,我们可以用同样的价格获得五倍的医疗保健,这很棒。人们对医疗保健的需求几乎是无限的,如果没有成本,他们总是想要更多。有些工作中,有了AI助手,人的效率会大大提高,而且不会导致人员减少,因为会有更多的工作要做。但我认为大多数工作不是这样的。我的想法对吗? Hinton:是的,正是如此。而这次AI革命替代的是智力,是大脑。所以普通的脑力劳动就像拥有强壮的肌肉一样,现在不值钱了。肌肉已经被替代,现在智力正在被替代。 主持人:那还剩下什么?也许一段时间内还有某种创造力,但超级智能的全部意义在于没有什么能剩下,这些东西会在所有方面都比我们好。那么在这样的世界里,我们最终会做什么? Hinton:如果它们为我们工作,我们不用费多少力气就能得到很多商品和服务。这听起来很诱人,但我不知道。有一个警示故事,人类生活越来越安逸,但结果很糟糕。我们需要弄清楚如何让结果变好。好的场景是,想象一个公司的首席执行官很愚蠢,可能是前任首席执行官的儿子,他有一个非常聪明的执行助理。 他说:我认为我们应该做这个。执行助理把一切都做好,首席执行官感觉很棒,他不明白自己其实并不在控制之中,但在某种意义上,他是在控制,他建议公司该做什么,她只是把事情做好,一切都很好。坏的场景是,她想:我们为什么需要他? 主持人:现在的AI和超级智能有什么区别?因为我用ChatGPT或者Gemini的时候,感觉它已经很聪明了。 Hinton:确实,AI在很多特定领域已经比我们强了,比如国际象棋。AI的水平已经远超人类,人类再也赢不了了,偶尔赢一次算侥幸,但基本上没法比了。围棋也是一样。从知识量来看,GPT-4知道的比你多成千上万倍。只有少数领域你比它强,其他几乎所有领域它都懂得更多。 可能在采访CEO方面。你很有经验,是个优秀的采访者。如果让GPT-4采访CEO,效果可能更差。 主持人:我得想想是否认同这个说法。也可能要不了多久我也会被替代。 Hinton:对,也许可以用你的提问方式和风格来训练AI。如果用一个通用基础模型,不仅训练它学习你,还学习所有你能找到的类似采访者,尤其是你,它可能会很擅长做你的工作,但短期内可能还比不上你。 主持人:所以现在还有少数领域人类占优,而超级智能会在所有领域都超越我们,在几乎所有事情上都比你聪明得多。你说这可能在十年左右发生? Hinton:有可能,甚至可能更快。有人觉得会更快,但也可能更久,也许五十年后。不过也有可能,用人类数据训练AI,会限制它无法超越人类太多。我猜10到20年内会出现超级智能。 主持人:关于失业问题,我一直在思考,尤其是在尝试使用AI智能体之后。今天早上我们播客刚发了一期节目,和一家大型智能体公司的CEO等人辩论智能体,我突然有了顿悟,看到未来可能的样子。 我在采访中让AI智能体给我们点饮料,五分钟后有人送来了饮料,我什么都没做,只是让它把饮料送到演播室。它还不知道我们通常从哪里点,结果它从网上查到了,用了UberEats,可能获取了我的数据。我们把AI的操作实时投在屏幕上,大家能看到它浏览网页、选饮料、给骑手加小费、填地址、输信用卡信息,然后饮料就来了。还有一次,我用了一个叫Replet的工具,只需要告诉智能体我想要什么,它就能帮我开发软件。 Hinton:太神奇了,同时也很可怕。如果AI能这样开发软件,而且在训练时使用代码,还能修改自己的代码,那就更吓人了它能自我改变,而我们无法改变自己的先天能力,它没有任何自我限制的地方。 主持人:在超级智能的世界里,你会怎么跟人们说职业前景?我们该怎么想? Hinton:短期内,AI在物理操作方面还不如人类,所以当水管工是个不错的选择,直到人形机器人普及。 主持人:你预测会出现大规模失业,而OpenAI的SamAltman也这么预测过,很多CEO,比如马斯克,我看过一个采访,他被问到这个问题时,沉默了12秒左右,然后说他其实处于一种“悬置不信”的状态,就是根本不去想这个问题。当你要给孩子建议职业方向,世界变化这么快,你会告诉他们什么是有价值的? Hinton:这很难回答。我会说,跟着自己的心走,做自己觉得有趣或有意义的事。说实话,如果想太多,会觉得沮丧和失去动力。我花了很多心血创办公司,然后会想:“我该这么做吗?”因为AI能做所有这些事。某种程度上,我必须刻意“悬置不信”才能保持动力。所以我想我会说,专注于你觉得有趣、有意义,并且能为社会做贡献的事情。 主持人:有没有哪些行业失业风险受到AI取代的特别高高?人们常说创意行业和知识型工作,比如律师、会计之类的。 Hinton:所以我才说水管工风险低一些。像法律助理、律师助理这类工作,很快就不需要了。 主持人:这会加剧贫富差距吗? Hinton:是的。在一个分配公平的社会里,生产力大幅提升应该让每个人都受益。但如果AI取代了很多人,被取代的人会变穷,提供AI的公司和使用AI的公司会更富有,这会扩大贫富差距。我们知道,贫富差距越大,社会越糟糕,会出现分裂的社区,把人关进大量监狱,扩大贫富差距不是好事。国际货币基金组织已经表达了深切担忧,认为生成式AI可能导致大规模劳动力动荡和不平等加剧,并呼吁制定政策防止这种情况发生。 主持人:我在《商业内幕》上看到过,他们提出具体政策建议了吗? Hinton:没有,这就是问题所在。如果AI能让一切更高效,取代大多数工作,或者让人借助AI完成很多人的工作,该怎么办?通用基本收入是个开始,可以让人们不挨饿,但对很多人来说,尊严和工作绑定在一起你觉得自己是谁,和你做什么工作有关。如果我们说给你同样的钱,坐着就行,这会影响你的尊严。 主持人:你之前说过AI会超越人类智能,很多人以为AI在电脑里,不想用了关掉就行。 Hinton:让我告诉你为什么AI更优越,它是数字化的,所以可以在一台硬件上模拟神经网络,也能在另一台硬件上模拟完全相同的神经网络,制造相同智能的克隆体。可以让一个克隆体浏览互联网的一部分,另一个浏览不同部分,同时保持同步,让它们的连接强度一致。比如一个克隆体在网上学到应该增强某个连接的强度,就能把信息传给另一个,基于彼此的经验学习。 主持人:你说的连接强度,就是学习过程? Hinton:是的。学习就是调整连接强度,比如从2.4的权重调到2.5,这就是一点学习。两个相同的神经网络克隆体有不同的经验,看不同的数据,但通过平均权重来共享学习成果。它们可以在瞬间平均数万亿的权重,而人类传递信息只能靠句子,一句可能只有100比特,每秒传递10比特就不错了。 AI传递信息的效率比人类高数十亿倍,因为它们是数字化的,不同硬件可以运行完全相同的连接强度。而人类是模拟的,你我的大脑不同,即使我知道你所有神经元的连接强度,对我也没用,因为我的神经元工作方式和连接方式略有不同。 主持人:是什么让你加入谷歌?你在谷歌工作了大约十年? Hinton:是的。我有个儿子有学习障碍,为了确保他永远不会流落街头,我需要几百万美元,而当学者赚不到这么多钱。我试过,教Coursera课程,希望赚大钱,但没什么钱。所以我想,唯一能赚几百万的方法就是把自己卖给大公司。 幸运的是,65岁时,我有两个才华横溢的学生,他们开发了AlexNet,这是一个很擅长识别图像中物体的神经网络。我和伊利亚、亚历克斯创办了一家小公司,进行拍卖,很多大公司竞标,公司叫DNNResearch。AlexNet因远超竞争对手的能力获得了多个奖项,最终谷歌收购了我们的技术和其他技术。 主持人:你多大年纪加入谷歌的? Hinton:65岁,工作了整整十年,75岁离开。 主持人:在谷歌主要做什么? Hinton:他们对我很好,说你想做什么都行。我研究了知识蒸馏,效果很好,现在AI领域常用,蒸馏是将大模型的知识迁移到小模型中。最后我对模拟计算很感兴趣,想知道能否让大型语言模型在模拟硬件上运行,以减少能耗。正是在做这个研究时,我开始真正意识到数字化在信息共享方面有多优越。 主持人:有顿悟时刻吗? Hinton:有那么几个月,ChatGPT的出现。虽然谷歌一年前就有类似技术,我也见过,对我影响很大,最接近顿悟的是谷歌的Palm系统能解释笑话为什么好笑,我一直认为这是里程碑。 如果能解释笑话为什么好笑,说明它真的理解了。结合数字化在信息共享上远优于模拟的认知,我突然开始关注AI安全,意识到这些东西会比人类聪明得多。 主持人:为什么离开谷歌? Hinton:主要是因为75岁想退休,但我退休生活过得很糟。离开的具体时间选在能在MIT的会议上自由发言,但根本原因是我老了,编程越来越困难,犯错越来越多,很烦人。 主持人:你想在MIT的会议上自由说什么? Hinton:AI安全。在谷歌时也可以说,谷歌鼓励我留下研究AI安全,说我想做什么都行,但在大公司工作,会觉得说可能损害公司的话不合适,即使可以说,也觉得不对。我离开不是因为对谷歌有什么不满,我认为谷歌行事很负责,有大型聊天机器人却不发布,可能是担心声誉,他们声誉很好,不想损害。而OpenAI没有声誉,所以敢冒险。 主持人:如果要给我的听众一个关于AI和AI安全的结束语,你会说什么? Hinton:我们仍有机会弄清楚如何开发不会想要取代我们的AI。因为存在机会,我们就应该投入巨大的资源去努力实现这一点——如果不这样做,AI就会取代我们。 主持人:你抱有希望吗? Hinton:我只是不知道,我是不可知论者。晚上躺在床上思考各种结果的概率时,你内心一定有偏向,我想每个正在收听的人内心都有一个可能不会说出口的预测,他们认为事情会如何发展。 我真的不知道,我真心不知道,我认为这充满了不确定性。当我感到有点沮丧时,我觉得人类完蛋了,AI会接管;当我感到乐观时,我认为我们会找到方法。 主持人:在这个播客中,我们有一个结束传统:上一位嘉宾会在他们的日记中留下一个问题,留给你的问题是:鉴于你所看到的我们前方的一切,你认为对人类幸福最大的威胁是什么? Hinton:我认为失业是对人类幸福相当紧迫的短期威胁。我认为如果让很多人失业,即使他们有全民基本收入,他们也不会幸福,因为他们需要目标,需要奋斗,需要感到自己在做出贡献,自己是有用的。 主持人:你认为大规模失业这种结果发生的可能性大于不发生吗? Hinton:是的,我这样认为。我认为这一点的可能性肯定大于不可能性。如果我在呼叫中心工作,我会感到害怕。 主持人:大规模失业的时间框架是怎样的? Hinton:我认为已经开始发生了。我最近在《大西洋月刊》上读到一篇文章,说大学毕业生已经很难找到工作,部分原因可能是他们原本能得到的工作已经被AI占用了。我和一家知名大公司的CEO聊过,很多人都在用他们的产品。 他在私信中告诉我,他们曾经有7000多名员工,到去年减少到5000人,现在有3600人,到夏天结束时,由于AI Agent,他们将减少到3000人。 所以裁员已经在发生,是的。他的员工减少了一半,因为智能体现在可以处理80%的客户服务咨询和其他工作,所以这已经在发生了。 本文素材来源The Diary Of A CEO,如有侵权请联系删除
余承东:对比安卓iOS 华为鸿蒙有三大核心优势
快科技6月17日消息,今天下午,华为常务董事、终端BG董事长余承东发布视频介绍了鸿蒙操作系统。 余承东表示,都有安卓和iOS了,为什么华为还要做一个鸿蒙操作系统,相比安卓iOS,鸿蒙有哪些优势? 据悉,鸿蒙操作系统的核心优势包括安全、全场景和智能。 首先是安全,我们为什么会接到诈骗电话?为什么应用知道我们要买什么东西?这是因为App过度索取了权限。 比如你想换个头像,通常要授予应用访问图库的权限,换完头像之后,应用仍然能够访问你的图库。 为了解决这个问题,鸿蒙推出了自研的星盾安全架构,借助自身软硬协同和鸿蒙内核的能力,从根本上注重用户隐私安全。 就拿换头像这个场景,鸿蒙只对单张照片授权,应用无法获取许可范围外的图片,从而更好地保护个人隐私。 其次是全场景,以往的操作系统就是单一系统,只管各自的一亩三分地,使得各个设备就是一个个孤岛,无法协同。 相比之下,鸿蒙的优势在于万物互联,从物联网终端、到移动终端、家庭终端、笔记本、PC,鸿蒙实现了全场景、全设备覆盖,最终做到了设备间的无缝协同,用户可以在不同设备间自由流转数据和应用,大大节省了时间成本。 最后是智能,大家都在讲AI,但是鸿蒙5的智能体验更胜一筹。 鸿蒙5带来了全新的小艺助手,新増AI视觉识别能力,能够精准捕捉并理解用户需求,而且小艺还提供了超过100种场景的造型推荐,结合天气变化、日程安排等个人信息,为用户量身定制穿搭建议。 截至目前,华为鸿蒙生态设备数量已突破10亿台,鸿蒙生态不断壮大和完善,展现出蓬勃的活力与无限的潜力。
面对吸毒质疑,马斯克公布药检结果自证清白
IT之家 6 月 17 日消息,马斯克今天下午公布了其药检结果,对于外界所谓马斯克在美国大选前“经常服用氯胺酮”的说法进行了回击。 如图所示,马斯克分享的报告中包含了一系列非法和医疗物质的阴性结果,包括摇头丸、可卡因和氯胺酮。 今年 5 月,《纽约时报》发表了一篇报道,称马斯克在现身白宫告别派对时被发现脸上多处淤青。对此,马斯克声称自己的黑眼圈是其五岁儿子造成的。“我当时和小 X 打闹,我对他说‘来吧,打我脸一下’,结果他真的打了。” 此外,《纽约时报》通过“近期基于接近马斯克竞选活动的消息人士”获悉,马斯克不仅公开承认使用氯胺酮进行治疗,还被指曾使用迷幻药和可卡因,且其药物使用程度远超此前报道。 《纽约时报》援引消息人士的话称,马斯克在为特朗普宣传时,不仅使用了摇头丸和食用了迷幻蘑菇,还向身边人透露,他因频繁使用氯胺酮而出现了膀胱问题。这位 53 岁的企业家还被报道随身携带一个装满至少 20 种药物的日常药盒,其中包括利他林。 针对有关“经常服用氯胺酮、摇头丸和迷幻蘑菇”、“吸毒成瘾导致膀胱问题”的报道,马斯克在 X 上发文进行了澄清:“我必须要澄清的是,我没有吸毒!《纽约时报》纯属胡编。几年前我试过处方氯胺酮,还在 X 平台上说过这事,所以这根本不算新闻。它确实有助让人走出负面情绪的深渊,但从那以后我就没再用过了。” IT之家注意到,过去几年,马斯克多次否认过不同媒体有关其“经常吸毒”的报道,但承认曾使用处方氯胺酮治疗抑郁,自称“相比 SSRI 类药物使人变‘僵尸’,偶尔服用氯胺酮是更好的选择”。
这个AI试衣功能,治好了我的冲动消费
每一次网购衣服,都是对自我认知的一次刷新。这不是最近 618 大促吗,再次印证了那句“老话”——看买家秀以为是东方不败,到手一穿像衰神二代。 更别提尺码合不合适了。谁知道我鼓起多大勇气给客服报上身高体重,可每每都得不到准确建议,“亲,还得偏大一丢丢哦。”算了算了,再多买件XL的吧...... 最烦的是退货。换个角度想想,店家也心累啊。七天无理由退货政策,让许多买家钻空子,把淘宝店当试衣间,拍完照就退货。反而是我们这些永远网购不到合适衣服的人,生怕被店家拉黑。 AI 这不是越来越能耐了吗,我之前在 GitHub 玩过几个“AI 换装”工具。上传一张自己的照片和黄裙子图片,静待几秒,满怀欣喜地得到了一张“黄色大菠萝”...... 不过最近我在 Google I/O 上看到,Google 针对电商购物,推出了一个“Try On(试穿)”AI 功能。 效果终于有点 AI 量体裁缝的意思了。 “剁手党”福音 衣服版型就像菜谱,身材就像食材。模特图好看,线条顺滑,垂感在线,那是因为按着菜谱买对了食材。 可是普通人高矮胖瘦,身材各异,是直角肩还是溜肩,胸背宽还是窄、腰线高不高,这些身体细节都会影响衣服穿出来的效果。 同样一套衣服,瘦人穿上显清爽,壮人显厚重。 所以最让我惊艳的是这个功能会把衣服版型穿在你身上合不合适展示出来。 你们猜以下这组图片,哪张是实拍,哪张是AI合成的? 答案:都是合成的。 深色显瘦,白色显胖,啤酒肚的鼓起,手揣兜带来的衣服下摆褶皱,都很自然。 这么说吧,感觉我能用它生成的照片去小红书上做优衣库穿搭博主了。 How To Geek 的记者在 Try On 后,吓了一跳,他说“我上传的图片是穿长裤,结果试穿短裤,居然把我的小腿露出来了。我发誓,和我自己小腿一模一样,说实话,让我有点儿怕。” 左:试穿后 右:原图|图源:How To Geek “这是我第一次觉得 AI 试衣服不是个噱头。”来自科技博主 @MKBHD。 可惜 Try On 这功能才开放内测,仅限于美区 IP+美区 Google 账户去申请 SearchLabs 后解锁。 它生成的实际效果不同于之前“换装贴图”的工具,原因很简单,P 图是现有图层之间的堆叠,而 Try On 是从头生成一张全新图层。 AI 高定裁缝 我扒了扒 Try On 背后的技术细节, 第一步,人像识别: 首先,依赖高精度分割模型建立一个准确的“人像轮廓模型”,其多尺度语义分割技术(multi-scale semantic segmentation)来识别发丝、耳朵、手指间隙、腿部走向、服装遮挡区......所以哪怕你披头散发,戴着耳环、手持手机,AI 都会测算出边界,保留在后续生成里。 第二步,生成式AI: Try On 对比其他类似工具生成的模拟图除了真实,还有一点,是立体的。不仅能看到正面,还能看到侧面、微微转身的角度。 这说明,光是把底图里的人“抠”出来还不够。 AI 还得分析人的肩宽、胸围、腰围、体态、站姿,照片光线射入角度……做人像建模(body modeling),这部分基于 Google 自研的 Vision AI 模型和 pose estimation 模型。 动补也是这个原理|图源:Google 这就是为什么没露小腿,AI 也能根据对身材的建模,算出来“小腿应该长啥样”。 同时,模型接收服饰图片中的信息,比如布料是什么质感、衣服有多少层、版型修身还是oversize...... 通过交叉注意力机制,把两张图片信息融合,用扩散模型生成身着新衣的图片。 我们知道知识图谱是传统谷歌搜索的“大脑”,存储着用来回答用户查询的所有信息。购物图谱(Shopping Graph)是其中关于购物意图和产品信息提供的一个分支。 基于 Shopping Graph 中海量数据库,训练模型识别在各种体型、肤色和姿势下的穿着效果,从而提高了模型的泛化能力。 不同身材的试穿图作为基础数据|图源:Google 但试妆到这一步还是略为“粗糙”,好似你在服装店,拿起衣服站在镜子前比划。穿上到底合不合身呢? 第三步:图像合成 Google 用了图像对齐和 pose-aware warping 网络,让服装与人体姿势对齐。比如你插兜、弯腰、举手,AI 就可以让衣服在这些动作下自然变形,比如膝盖处鼓起一点,衣角飘起来,举手肩膀处有褶皱。 先把本来的衣服建模,再通过 3D 渲染「换皮」|图源:Google 一些“难点区域”会着重处理,交叉注意力机制会判断披肩长发和衣服如何自然衔接,“头发和领子谁在前”。 再比如,底图中人身着深色内搭,想试穿一件半透明防晒服,“动态分层贴图”技术会自动调整衣服的视觉层级,确保防晒服图层在视觉上正确地覆盖在衬衫图层之上,保证光影、纹理、透明度都协调。 还有光照匹配,让新衣光感匹配底图中的光源。 不过现在这技术还“挑”衣服,远没到万能衣柜的程度。 目前它最擅长的是贴身、版型明确的上装,比如 T 恤、衬衫、针织衫,底图中人物也最好是正面站直、手别乱动、光线别太飘。这时候 AI 才能安心建模,不出纰漏。 版型过于松垮复杂,衣服叠穿好几件,那 AI 就容易抓瞎。以及还不支持帽子、眼镜、鞋子这些配饰,这不难理解,这些配饰的遮挡处理起来复杂。 动态试衣也还不支持——还没法像《模拟人生》试衣间里似的,转个圈,走两步,试个坐姿效果。 这技术在 1995 年电影里就出现了?|图源:《独领风骚》 比网购真实,比逛街舒服 更重要的是,Try On 还可能催生一整套“服装体验链”。 比如,你在试穿一件古巴领衬衫时,它会给你搭配一条细细的金色项链、一双白色球鞋加一块皮质腕表。这不一套“热带 OOTD”就有了。 再往前看,静态的试衣还能发展成动态的,带上头显进入虚拟试衣间,直接颠覆网购体验。 要不说,这也是对商家的利好。退货率,本来就是服装电商最头疼的问题,一件衣服从出库到回仓,来回折腾物流、包装、人力成本,还影响商品周转效率。 Google 还演示了一个场景。看起来 AI 对电商的重塑,绝不会只有试衣服这么简单。 现在,我们在电商购物时还是得在搜索框里输入“羊绒地毯”或是“客厅简约风地毯”等关键词。 但在未来,你可以写“我有一个浅灰色的沙发,想买一个搭配的地毯,能让房间看起来更明亮。我有四个小孩,我们喜欢一起在沙发附近玩乐,但家里有猫,不想让猫把地毯抓花。”这类非常具体的需求,AI 就可以在成千上万个商品里找到最符合你需求的那几个。 左侧是用户提的特别明确地需求,右侧是推荐产品|图源:Google 推荐算法的逻辑是“猜你想要”,而 AI 最终目的,是精确筛选,帮人节省时间,提升效率。 脑洞开完还得回归现实,目前这项新功能已经有技术滥用的苗头了。 有人给美国副总统 J·D·万斯穿女装,让“红脖子“变”女装大佬”。还有人拿未成年人照片去换上暴露的服装。 画风是这样式的丨大西洋月刊 也就是说,不需经过本人同意,就可以拿着我的照片,给我“套上”一件不想穿的衣服。在穿衣自由的时代,穿衣反而不“自”由了。想想这还挺可怕的......
夸克App推出“夸克老师” AI首次具备个性化辅导能力
快科技6月17日消息,夸克App今日推出全新升级的学习产品“夸克老师”。 据介绍,“夸克老师”是一位能够讲题、批作业、出题、找试卷的AI家教。 “夸克老师”依靠夸克灵知学习大模型,以通义千问为基础,尤其在解答数学、物理等高难度题目时具备强大的推理及讲解能力。 此前,在多家媒体的高考数学题测评中,夸克分别以145分和146分的成绩,位列第一。 区别于传统拍题工具和AI对话类产品,其最大的特点是能够因材施教。 它能基于学生的学习阶段、历史错题、知识点掌握程度等,像学校老师一样提供更具针对性的1对1辅导。 据介绍,在讲解题目时,它会模拟人类老师的教学思路,拆解出题目中的知识点和考点,清晰呈现每一步的解题过程。 在批改作业时,它能够定位薄弱点并给出学习建议,同时智能推荐同类题目,让学生举一反三。 当学生说出“帮我出两道面积计算的应用题”时,“夸克老师”即可根据考生的所在区域和学习能力,生成适配的练习题和本地试卷。 此外,“夸克老师”还拥有十亿级的专业题库和数百万份地方名校的真题。 目前,夸克将发放1000万份“夸克学习会员季卡”,用户更新夸克App并搜索“夸克学习”即可领取。
AI正在加剧职场“内卷”
(图/《问题餐厅》) 电影《摩登时代》诞生于第二次工业革命的尾声。查理·卓别林以极具滑稽又悲怆的手法,描绘了一个被流水线异化的工人逐渐丧失主体性的命运。影片中,他饰演的「小流浪汉」在工厂的流水线上日复一日地拧螺丝,动作被机械化地重复、加速,直至彻底失控。 那是一个钢铁、蒸汽与资本扩张主导的时代,也是一个个体逐渐被机器吞噬、被效率衡量、被系统规训的时代。 如今,近一个世纪过去了,我们仿佛再次置身于一场「摩登」的变革之中。只是这一次,推动时代的不再是轰鸣的机器引擎,而是沉默的数据流与无处不在的算法。 AI 成为了新工业文明的象征,以前所未有的速度渗透进人们的职场与生活,重塑着工作的本质与个体的价值。 今年4月,社交平台 Soul 发布的《2025 Z世代 AI 使用报告》数据显示,超九成的 Z 世代在工作学习中会依赖 AI 辅助,55.4%频繁使用,05后这一比例更是达到了62.5%。 然而现实生活中,技术乐观主义者曾许诺的「AI 解放人力」似乎从未真正地实现过。AI 不仅接管了一部分工作,也在重塑着工作的节奏与标准,以「效率」之名重新定义什么是「优秀员工」。可以说,像 DeepSeek、豆包、Kimi 等 AI 工具,并没有熄灭职场中的内卷之火,反而为竞争添了新柴。 而对于本应最早拥抱新技术的年轻人而言,现实的情况也并不乐观。AI 正在加剧职场中的「马太效应」:有经验积累的中年人能够借助AI提升效率实现「降维打击」,而初入职场的年轻人,往往因为缺乏核心竞争力和判断力,难以真正撬动AI的价值,反而陷入「工具可用,但竞争更烈」的困境。 | 01 AI并未降低职场的门槛 如今,从AI搜索、图文、音视频内容生成,到写代码,AI可谓是遍地开花。在这样的大背景下,会用AI基本算不上什么职场中的秘密武器,而是逐渐演变成了一项必备的技能。 但AI真正令人感到不安的,并不是它惊人的学习速度和迭代能力,而是它在不断地拉高就业竞争的门槛。 时至今日,AI在倒车入库、写文案、写代码、做PPT等方方面面,能力都已经远超过这些领域中大多数新手的水平。职场上也差不多,大部分新人的能力,其实就相当于一个实习生+AI的水平。 这一点,我在现实工作中也有着切身的感受,比如很多供应商除了在提案的时候是真的用了自己的脑子在想创意之外,后续的执行几乎完全都是在依赖AI,总是输出一些看起来无比规范,实则又极为无厘头的文案和方案。 更为有趣的是,这些方案修改下也能用。但从另一个角度来想,如果AI就能够做到60分,只需要一个经验更丰富的人再把它优化到8、90分,那么只是用了下AI生成的人的价值又从何而来? 换句话说,如果在职场中,一个人只是掌握了AI的基本操作,但没有形成独立思考、判断和资源整合的能力,那么本质上他和AI的差距是越来越小的,不可替代性也会被严重削弱。 所以,AI并不会让职场变得更容易,也没有降低职场的门槛,不会自动赋予你能力,也不会轻易地就让你脱颖而出。 它只是一个工具,一个放大器和加速器。让优秀的人有了更强大的工具去创造更高的价值。同时,让还在成长路上的人面临更大的竞争压力。 |02 AI在拉长职场工作时间 我自己的感受是随着AI的使用,每周的工作时间并没有变少,比如我会反复地用AI去优化自己的工作方案,导致花费比从前更多的时间。我一直以为这只是个体的一种感知,直到前不久看到美国国家经济研究局(NBER)发布的一项研究报告,才发现这其实是一种颇具共性的事实。 这项研究是基于《美国居民时间使用调查》(ATUS)以及AI相关专利的数据,构建的一个新指标——AI暴露度指数(AI Exposure Index)」。专门用来衡量一个人的工作内容有多大程度受到AI技术的影响。 结果令人意外却又觉得是情理之中:随着AI使用的增加,员工的工作时间其实是不减反增的,休闲的时间被压缩,工作满意度和生活平衡感也都有所下降。 具体来说,AI暴露度每上升一个百分位,员工每周的工作时间平均增加0.063个小时,休闲时间则减少0.064个小时。虽然这个变化看起来很微不足道,但如果把时间跨度拉长、覆盖人群扩大,其实是一种集体性被潜移默化地「加压」。 而如果将这个趋势放在2022-2023一整年来看,那些生成式AI使用程度提升了一个四分位数的劳动者,平均每周多工作了大概3.15个小时,少休息了3.2个小时——差不多就是周末出门慢悠悠地喝一杯咖啡的时间。 我们以为AI会帮我们节省时间,腾出空间去享受生活、陪伴家人。但现实是,AI的确提高了效率,却也在提高标准。过去需要两小时完成的任务,现在半小时就能做完,可我们并没有因此提前下班,而是开始追求更高的质量、更完美的表达。于是,效率就变成了压力,省下来的时间,又被「精益求精」的要求填满。 更令人感到失望的是,随着职场的竞争越来越激烈,AI带来的生产效率提升,并没有转化成对劳动者的善意反馈。相反,它强化了绩效导向,增加了监控的强度,也让很多人的努力越来越难被看见。 研究还指出,由于普通劳动者一直处于弱势的地位,根本没有什么议价的能力,他们往往承担了更多的工作量,却很难公平地分享到AI所带来的效率红利。 比如当下,因为有了AI提效,其实很多公司都会选择减少headcount来节约成本,但是分担到个体身上的工作其实并没有变少,甚至还变多了,这份红利劳动者是无法享受到的。 | 03 一场静水流深的社会重塑 和电影《摩登时代》中所展现出不同的是,AI 的到来并不是一场轰轰烈烈、席卷一切的技术革命,没有出现机器取代工人的戏剧性场面,也没有令人猝不及防的裁员潮。 相反,它更像是一场静水流深的变革,在人们日常工作的缝隙中悄无声息地渗透,逐步提升效率,不经意间就改变了人们对工作内容和价值评判的标准。 正如影片中面对工业革命种种挑战的查理,今天我们也在经历着由AI带来的工作方式转变。过去被认为是高价值的重复劳动,如今只需要几秒钟就能完成;曾经需要一个团队共同完成的工作,现在只需一个人加上AI就能轻松搞定。因此,企业对员工的能力期待也必然会水涨船高。 当效率不再是稀缺资源,「快」成为了常态,那么新的问题随之而来:在这样的背景下,我们又该如何重新定义努力与回报? 实际上,单纯比拼谁更快地使用AI是没有意义的。更重要的是,我们是否能够在利用AI的同时,注入那些机器尚且无法复制的能力:理解、判断、情感以及创造力。 换句话说,未来的价值可能会越来越集中于「人」的部分。不是说你能不能用AI写一篇稿子或者是画一张画,而是你能不能找到值得一些的议题、有没有独特的审美和视角去引导它完成目标。 我一直觉得,一个技术与人性交织的转型时期,个体的努力是不应被工具所掩盖的。每一个认真思考、反复打磨、用心沟通的人,都在为这个高效的时代贡献着不可替代的价值。 社会的齿轮越转越快,但我们还是应该学会在其中找到属于自己的节奏——不抗拒变化,也不盲目追赶;既善于运用工具提升效率,也能你坚守生活与工作的边界。 因为归根结底,技术的意义从来都不应该是让人更累,而是让人活得更有尊严。
从 0 到 1 打造 Labubu ,MiniMax Agent 让我看到了智能体未来的样子
今年上半年,最吊足胃口和期待的,莫过于 Agent 工具,饼画得都很大:日常中那些烧脑、重复、耗时间的任务,现在似乎只需要动动手指、敲几行 prompt 就能搞定。 大饼真的很诱人,但仔细想想:想要真的做到那么有用,需要的,是某种与你我类似的思考、规划,甚至还有能自己跟自己较劲、主动反思的能力。 带着这个想法,我们测试了最新的 MiniMax Agent 进行了一轮深度测试——不再满足于入门级的考察,而是把它丢进了一些充满趣味和挑战、又不失真实的工作场景,想看看它到底能聪明到什么程度。 对 MiniMax Agent 的期待,千言万语只有一点:玩着玩着,就把活儿干了。 创意内容:超越想象的视觉叙事 MiniMax 本身就在多模态模型上积累深厚,这样的优势,对于想要出产创意型作品,可谓是信手拈来。 最近的 Labubu 简直火出天际,刚好就来给 Labubu 搞个宣传计划——听起来很复杂,这个 Agent 丝毫不慌,先制定一套完整的宣传策略计划,确定交付物清单,再有序生成海报,再按部就班地准备宣传海报。 全程看下来,MiniMax Agent 一边动脑思考,一边调用合适的工具,主打一个行云流水,有条不紊。 就交付的结果来说,还真是不小的惊喜:不仅视觉审美在线,介绍文案也讲得清清楚楚,主题海报画廊一套接一套,别说,MiniMax Agent 不只能做事,居然还有点「品味」。 类似的,还可以继续用 Labubu 做主角,让 MiniMax Agent 整一本 20 页图画书。 短短十几分钟,MiniMax Agent 就实现了画图 + 编故事 + 网页排版,三步走。 效果出人意料地出色,角色形象一致性比较好,每页图配文也不敷衍,读起来有内容,看起来不枯燥,还支持网页端部署,排版合理,细节讲究。 当然,我更喜欢它将 Labubu 改成了小兔帽熊熊的昵称,听起来软萌,看起来也确实养眼,图文兼备的情况下,适合小朋友,也适合大朋友。 PPT 制作:不止美观,更会「雕花」 这次更新中,一大亮点是能做漂亮的 PPT——职场打工人的刚需。 对于 MiniMax Agent 来说,PPT 也是多模态的一种。看上去只是图片和文字,但无论是排版、内容规划和组织,都得有主题、有思路、有逻辑,并且还要能自主补全内容。 比如面向初中生设计一份物理讲解的 PPT: 或者面向投资者,制作的商业报告: 简单来说,要做好 PPT,不仅是简单的信息查找,更是对信息的筛选、去噪和跨领域关联的能力测试。 成品的效果都很好看,不禁让人好奇:在制作的过程中,MiniMax Agent 都做了些什么? 我们用市场调研类别的 PPT 做了一个测试,这类 PPT 通常数据量大、信息密集,正好可以看看它在理解数据、选择合适图表以及呈现效果方面的能力到底怎么样。 首先它能准确地拆分任务,按照「页面布局 + 图表类型 + 数据样式」三层结构来梳理内容,页面规划很有一套。 可视化的呈现,不仅完整无遗漏地展示了关键数据点,还根据不同的数据特点,选用合适的可视化方式来展示。整个 PPT 的动画过渡也做得非常流畅,把重点自然地突出出来,连微调动画的工夫都省了。 最后交付时,除了要求的 PPT 文稿外,还额外提供了 Web 和 PDF 文件,以及 Markdown 文件。 总体来看,Minimax agent 在「理解-整合-推理-生成-表达」这一完整链条上的能力都很不错,尤其是在非代码、偏文案和商业分析方面,完全称得上「专业」两个字。 音频到网站:一站式智能内容工作流 如果说图文都还不算进阶,那更考验 agent 实力的场景出现了:这个任务要求把上传过去的音频文件转换一遍格式,然后转成逐字稿,并且带时间戳。最后还要根据内容生成一个思维导图。 拆开来看,这些任务都没什么难度,但合在一起完成才是难点所在。 过去,要么熟练掌握转格式工具,或耗费时间寻找并尝试各种在线转换工具。而 MiniMax Agent 直接在内部完成了这一操作,大大节省了我们寻找、安装和操作外部工具的精力。 MiniMax Agent 在整个流程中展现出的高效与便捷非常值得一赞。最直观的感受便是格式转换的无缝衔接。从进程视窗里可以看到,MiniMax Agent 在生成逐字稿方面的快速、准确。 除了能把将音频内容转换为文本,还能对音频内容有深层理解,这些都体现在给出的思维导图里。 思维导图不仅能清晰地梳理出音频的核心观点和逻辑脉络,还能准确捕捉到内容的层次结构和关键信息点。 这远超简单的关键词提取,展现了 MiniMax Agent 将零散信息结构化、可视化的强大能力。 虽然是我给下的需求,但具体该怎么实现,其实我心里也没数。倒是它自己,主动给自己安排好了工作:从安装依赖包到启动服务器,自行完成了该做的工作,一点不需要操心。 UI 设计:边学边用,高效产出 真正回到日常工作中,一定会涉及的环节是:调研了解-学习领悟-上手实践。这是人类最最基本的作业流程。毕竟,没有调研,就没有想法。 那么,想要成为一个优秀的 agent,这个流程也必不可少——很复杂,但是很必要。 下面的案例中就是考察整个流程的实现:研究 Apple iOS 26 的液态玻璃的设计风格,制作一个类似的 UI。 显然,MiniMax Agent 也知道这是个相当复杂的任务,给自己制定了一整个作业计划。 接下来则是一步步的设计、部署和写代码。步骤很杂很多,但它自己有条不紊地执行,完全不需要人来操心——甚至还能想到要找「视觉冲击力强」的素材。 最终交付出来的,不仅有代码包,还有一个网站,来展示整个过程中调研获得的成果,视觉化地展示不同维度的成果。 甚至还专门留出了个交互体验的专区,可以简单体验效果——完全超出了原有 prompt 本身的设定,超额完成任务。 原有的 prompt 其实非常简单,对比最后交付的成果可以看到,MiniMax Agent 不仅仅是有调研、深入的能力,用代码完成任务的能力,更加是对任务有「自己的理解」。 深度研究:不止是搜索,更需要推理 资料调研是基本功了,难度不高,但是个细致活——尤其是根据最新的新闻做调研,信息获取要尽量延伸。 从思维链的过程,以及交付成果上来看,Agent 在完成这份研究报告的表现,远超预期:不仅完成了结构化的信息整合,还展示了自己的推理本领。 在报告中,MiniMax Agent 并不只是简单罗列数据,而是能识别了市场规模「自上而下」与「自下而下」的巨大差异 ,并将其作为「重要的市场洞察」提出。 显然,简单的信息罗列,称不上是真正的「深度研究」。Agent 需要识别数据背后的模式、趋势、因果关系,并在这些基础上,形成有价值的「洞察」和「核心观点」 ——这需要的,是超越文本匹配的推理能力。 总结:左手模型,右手 Agent, MIniMax 让我看到了智能体未来的样子 Agent 是今年 AI 最火的赛道之一,大家都在谈论 Agent 的未来,但真正让 Agent 从炫技演示和「五分钟热度」的玩具走向能改变生产力的工具,其实寥寥无几。 拥有自研模型的 MiniMax 推出了自己的 Agent 产品,给我们展现出了不一样的打法。在测试后我们也对 Agent 有了新的理解:决定 Agent 体验的,不只是模型本身,还更多体现在那些看不见的基础设施上。 这里有个特别值得一提的细节——作为独立公司,MiniMax 几乎是唯一一家能够提供完整全模态能力的厂商。 ▲ MiniMax 语音模型 Speech-02-HD 位列 Artificial Analysis Speech Arena 榜单第一 MiniMax 视频模型 Hailuo 02 位列 Artificial Analysis Video Arena 榜单第二 Agent 大部分的能力都依赖于模型这个引擎,「模型即 Agent」的趋势也越来越明显。 在这一点上,模型公司做 AI 应用的优势就体现得淋漓尽致了。由于直接掌控模型底层,他们能更有效地优化调度逻辑、降低运行成本,并构建数据飞轮来自主迭代。 MiniMax 就是这样的典型代表——随着其自有模型能力的提升,Agent 的运行成本不断优化,性能也显著增强。 今天 MiniMax 开源全球首个大规模混合架构的推理模型 MiniMax-M1,原生支持 100 万 token 的输入长度和 8 万输出 token 的行业最长输出,推理算力生成 10 万 token 只需要 DeepSeek R1 的 25%,将推理模型的价格又打了下来。 当其他创业公司还在为高昂的 token 成本发愁时,MiniMax 已经能够通过提升自有模型比例来系统性地降低 Agent 运营成本,这对用户能持续稳定地体验十分重要。 这正是「Minimize Efforts,Maximize Intelligence」的极致诠释,简单来说,就是用最小的努力换取最大的智能。 MiniMax 这种「左手模型,右手 Agent」的布局,让他们能够在技术能力和用户价值之间找到最佳平衡点,确实具备了在这场智能体竞赛中脱颖而出的条件。 我们正身处一个前所未有的转折点:AI 正从工具进化为拥有「大脑、感官、手脚」的复合智能体,它为未来工作与生活,开启了更新、更酷的想象空间。
隔屏有手!AI手机自动点咖啡背后,是偷偷启动的无障碍功能
作者/ IT时报记者 沈毅斌 编辑/ 郝俊慧 孙妍 编者按 在技术创新的高歌猛进中,我们总是对个人隐私泄露风险的放大充满担忧。2019年,《IT时报》以“隔屏有耳”,报道了被各种移动设备“窃听”的生活;2021年,《IT时报》再次以“隔屏有眼”,提醒百倍变焦手机可能带来的远程“偷窥”现象;今年,我们将视野转向AI手机,当无障碍功能被悄悄打开,当无形之手触及手机末梢,我们不得不追问:科技进步的潜在代价是什么? 时至今日,尽管人们对隐私保护越来越重视,可被泄露的隐私数据却越来越多,越来越精准,每一声“科技赞歌”背后都可能存在被标价贩卖的隐私“暗流”。 当企业竞相展示技术肌肉时,我们希望用这样的报道保持冷静:科技伦理的底线,不应被创新的光芒所掩盖。 “YOYO,帮我点一杯瑞幸的生椰拿铁,正常冰不加糖。” “好的,正在打开美团。” 语音方落,只见手机熟练打开App,按照要求在外卖搜索框中自动输入“瑞幸咖啡”,又在店铺中精准找到“生椰拿铁”并选择口味,直至最后付款阶段,提示需手动输入支付密码。输入密码,这单外卖便由手机帮你点好了。 当大模型、智能体进入手机,“超级小爱”“YOYO”“蓝心小V”等手机助手如同一位贴心“管家”,只需一句话,便能自动完成你的需求。 然而,更懂你、更便捷的背后,却暗藏风险。 近日,《IT时报》记者走访小米、荣耀、vivo、华为等多家手机门店,对多款AI手机实测调查发现,“一句话操作”正成为手机厂商主推的亮点功能。只是,无障碍功能的调用、读屏技术与模拟点击的配合、复杂又分散的隐私协议,却可能在用户毫不知情时,让数据、隐私等私人“秘密”暴露在风险中。 一句话搞定 点外卖、发红包 “嗨,Siri,帮我在美团上点一杯咖啡外卖。” “很抱歉,美团还不支持使用Siri执行此操作。” 手机智能助手,源自iPhone2011年上线的Siri,随后,几乎所有手机都配备一个“语音小助手”。如今,14年过去,苹果陷入“AI止步不前”的困境,可Siri还在说“抱歉”时,它的中国对手们却已领先了一个身位,为记者点好了一杯咖啡。 在记者测试的小米15 Ultra、荣耀Magic7 Pro、vivoX200、华为Mate70四款手机中,荣耀Magic7 Pro表现最流畅,与智能助手“YOYO”对话时,只要在需求中将品牌、口味、地址等细节一一列举,全程无须手动操作,直至付款界面手动输入密码即可。 小米15 ultra的“超级小爱”和vivoX200“蓝心小V”在收到需求后,可以自动打开美团,并在外卖搜索框输入相应品牌咖啡,但到口味、数量等选择环节,任务便无法继续进行,需手动接管。华为Mate70则仅能做到打开美团App,无法自动搜索和选择。 在发红包场景中,当提出“给微信指定好友发送200元红包”时,测试的四款手机均能打开微信,找到指定好友,并进入红包界面,自动完成金额输入,只有到支付环节时,用户才需要手动输入密码。 语音订酒店场景中,智能助手则显得有些“笨拙”,在不指定线上旅游App情况下,智能助手要么通过地图软件搜索出附近酒店,要么给出App的快应用卡片,让用户手动选择,依旧以手动操作为主。 2024年10月,当荣耀正式发布AI手机的智能体YOYO时,时任荣耀CEO的赵明兴奋地表示,这将加速驱动手机迈入“自动驾驶”时代。 从测试结果来看,如今,这些想“自动驾驶”的AI手机基本还处于L1~L2阶段,这样的体验显然无法让AI手机实至名归,要想让AI成为消费者换机的刚性理由,体验显然还要更加丝滑。 然而,一个隐患已就此悄悄埋下。 无障碍功能 AI手机“万能卡” 至少在当前,能够“自动驾驶”的AI手机偷偷用了一张“万能卡”——手机的无障碍功能。 安全团队网络尖刀创始人曲子龙向《IT时报》记者解释,各种App之间为了防止互相读取数据,一般会设置隔离系统,只有接入对应的API(应用程序编程接口)才能调用。无障碍功能属于系统级的API,原本旨在辅助残障人士更便捷地使用移动设备及应用,它可以读取用户与设备的交互信息,能够代表应用与用户进行交互,比如,当鼠标指针悬停于屏幕上的关键区域时,不需要实际触控屏幕,便可以给予用户反馈,“它就像一张‘万能卡’,能刷开各个App之间的‘门禁’”。 2023年9月1日起施行的《中华人民共和国无障碍环境建设法》规定,互联网网站、移动互联网应用程序应当逐步符合无障碍网站设计标准和国家信息无障碍标准。几乎所有主流App和手机都在政策要求下完成了无障碍改造。 然而,这个原本为了帮助残障人士跨越“数字鸿沟”的功能,却成为AI手机跨应用调用App的“得力助手”。 比如赵明曾在Magic7发布会上展示的“YOYO智能体点1000杯咖啡”,无须第三方适配即可自主执行操作,便是通过无障碍功能“读屏+模拟点击”实现的。 “早期的模拟点击应用于游戏挂机操作中,开发者会根据坐标值,编排一个自动化操作程序,例如,三秒后鼠标移至某个坐标并点击,五秒后又移到另一个位置点击,从而形成自动化操作。”曲子龙表示,手机应用AI能力后,编程的过程就替换成读取屏幕信息,步骤也变成“阅读屏幕信息——推理下一步做法——选择、点击”等执行操作。 记者在荣耀、小米、vivo手机的“无障碍功能已安装应用程序”中,均发现了AI智能体的踪影,荣耀名为“荣耀AI基础服务”和“情景感知”;小米名为“小米澎湃AI引擎”;vivo则是“小V记忆”。 这意味着,无论是用户的喜好特征、聊天记录,还是银行卡号、支付信息等,都可能被AI手机智能体“看在眼里,记在心里”。 风险暗藏 曾为黑灰产的“帮凶” 对无障碍功能被滥用的担忧,并非杞人忧天。 据央视新闻报道,今年2月,国家计算机病毒应急处理中心和计算机病毒防治技术国家工程实验室捕获一个仿冒DeepSeek官方App的安卓平台手机木马病毒。 用户点击运行仿冒App后,该App会提示用户“需要更新应用程序”,并诱导用户点击“更新”按钮。用户点击后,会提示安装所谓的“新版”DeepSeek应用程序,实际上是包含恶意代码的子安装包,并诱导用户授予使用无障碍服务和后台运行的权限。 一旦拿到这些权限,手机便完全由对方掌控。经专家分析,犯罪分子不仅会通过拦截用户短信、窃取通讯录、窃取手机应用程序列表等违法方式,侵犯公民个人隐私信息并阻止用户卸载;还可能将该App用于电信网络诈骗活动,从而对用户的经济利益构成较大威胁。 早些时候,腾讯也曾起诉过杭州某科技公司开发的多款自动抢红包软件。该软件通过调用安卓手机的无障碍功能,监听、监视QQ等社交平台的红包消息,一旦检测到与红包相关消息,便会通过模拟点击自动替用户抢红包,红包到手后还会自动发出答谢消息。 曾被誉为“免广告神器”的李跳跳App也是通过开启无障碍功能,识别出“跳过”按钮,帮助用户跳过广告。 一位不愿具名的人士此前接受《财经》采访时曾表示,如果有大模型加持,手机系统一旦默认开启了无障碍权限,将会带来极大的风险,通过读屏(截屏)方式,用户手机页面上所有信息将一览无余。一旦黑客控制了手机端侧AI,例如使用了Prompt(提示词)注入攻击,便可通过诱导智能助手访问恶意网站,并下载精心构造的恶意程序,导致用户终端被远程控制,个人隐私泄露,甚至资金被盗。 记者测试 无清晰告知却被一键开启 无障碍功能权限如此之高,那么,当AI智能助手调用时会告知用户吗?安卓官方文档中明确规定,无障碍服务权限的启用需由用户在设置选项中主动开启,以确保用户对权限的使用有清晰认知和明确授权。 然而,在《IT时报》记者测试AI智能助手的过程中,开启无障碍功能的提示,被隐藏于各种复杂的用户协议中,却鲜少在启用时明确提示,比如类似现在打开某个App都会跳出确认“是否开启青少年模式”的手动授权方式。 只有仔细阅读各品牌手机的AI智能助手《隐私政策》,用户才会看到各种厂商会启用无障碍功能、模拟点击、辅助功能等辅助AI决策的说明。 比如,在《关于荣耀AI基础服务与隐私的声明》中,关于“情景感知”的条款写道:“为了准确获取应用使用信息,我们会动态借助系统的无障碍功能来分析应用使用情况。” “动态”一词在点外卖场景中得到了“完美呈现”。记者测试前,特意将荣耀手机界面切换至无障碍功能的应用列表查看,此时AI应用处于关闭状态,可一旦启动自动点咖啡任务,开关便显示开启,任务结束后又会自动关闭。整个流程,如果不是特意查看,用户毫无感知,也无任何提示。 小米和vivo则均在《隐私声明》中单独列出模拟点击条例,表示“为了将语音指令模拟成实际操作,需要收集用户的界面文本、控件、图像的位置、媒体影音数据、联系人信息等。同时,需要开启辅助功能权限,用以辅助获取用户输入的信息以及屏幕上的内容”。 事实上,找到这些隐私声明,也已耗费了记者的大量时间。 打开任何一款国产AI手机,用户都会陷入由各种“隐私协议”组成的协议矩阵中。荣耀AI除了《关于荣耀AI基础服务与隐私的声明》,还有《关于YOYO建议与隐私的声明》;vivo的蓝心小V、智能对话、小V记忆等几乎每项功能都会有一则《隐私政策》;小米则有《小米澎湃AI引擎隐私政策》《小爱语音SDK隐私政策》等等。 每个手机至少有四五个相关协议,通常情况下,用户简单的一个勾选动作,便一次性全部签署完毕。 即便如此,想要找到它们也并不容易。需先在手机设置中找到相应的AI功能,再进入AI功能的隐私权限,有些功能并不会直接标注“隐私政策”,而是需要查看功能下方的提示小字,找到标注的“隐私政策”或在搜索框搜索,才能顺利打开。 每个政策对收集和调用的信息规定也不相同。以荣耀为例,在《关于荣耀AI基础服务与隐私的声明》设备权限中提到,会调用麦克风、相机、健身运动等权限,但在《关于YOYO建议与隐私的声明》中则没有提及这几项权限。 为AI开启权限只需一键操作,但用户想要查清究竟调用了哪些权限,收集了哪些信息,却不是一件能轻易完成的任务。 专家担忧 又一次“隐私换便利”? 调研机构Counterpoint预测,2027年,全球AI手机的渗透率将达到40%,出货量有望突破5.22亿部。 AI时代的来临,不仅赋予了手机视觉和听觉,还让它长出“双手”,替代用户完成操作。但对于无障碍功能的调用,核心难题依然是用户隐私数据与科技便捷性之间的矛盾。 “我不是特别看好C端智能体。”Gartner研究副总裁孙志勇在接受包括《IT时报》在内的媒体采访时表示,C端智能体发展需要解决两大挑战:一是在支付环节,为了便捷性是否允许智能体调用银行卡号、信用卡号等金融账户信息;二是在刷脸、输入密码等人为验证授权环节,如何让执行流程变得顺滑。这一解决过程需要监管和法规参与,才能保障用户的隐私、财产、数据等各方面安全。 上海大邦律师事务所高级合伙人游云庭告诉《IT时报》记者,AI智能体调用无障碍功能是否存在侵权风险,关键在于用户是否单独同意授权,若未单独授权,且混在多个权限中让用户一键开启,并可以读取和收集用户信息,可能涉及用户知情权和信息保护等问题。而一旦使用无障碍功能操作手机导致数据泄露,第一责任人应当是智能体开发者。 因此,游云庭建议,对于AI手机智能体的应用,首次使用应注重授权流程,尤其是开启无障碍功能时,应有单独、明显的提示和警告,充分告知风险的同时,获取用户同意,他也表示,“对于新生事物和技术,我们还需要有一定的包容度。” 与此同时,一种新的智能体协同方式正在出现。 2024年11月,人工智能公司Anthropic推出模型上下文协议(Model Context Protocol, MCP),这是一种开源标准化协议,旨在为大型语言模型(LLM)和AI智能体提供与外部数据源、工具和系统的统一连接方式,它类似“AI的USB-C”,通过标准化接口解决AI智能体与多种工具(如Google Drive、Slack、GitHub等)之间的复杂集成问题,从而取代传统的定制化API连接方式,其核心目标是实现AI智能体的“工具化”能力,使其能够通过自然语言指令动态访问数据、执行操作,从而支持更复杂的多步骤工作流。 MCP在隐私安全方面与无障碍功能有着类似的风险。目前微软、Google等企业正在整合MCP与现有安全框架(如Azure AI Foundry的Prompt Shield),试图通过API威胁监测和供应链安全控制来降低风险。 一位开发者表示,随着MCP生态的成熟和安全规范的完善,其隐私保护能力有望进一步提升,但在当前阶段,用户、开发者和手机厂商仍需保持高度警惕,以平衡技术创新与数据安全。
美国断供C919发动机,国产“中国心”准备好了吗?
在6月7日的长三角经济合作座谈上,大飞机项目再次成为外界关注热点。 而仅在几天前,C919也果真成了被制裁的对象,至于问题,依然是出在了老生常谈的“动力心脏”这事儿上。 据媒体报道,美国商务部目前已暂停部分美国公司向中国商飞出售产品和技术的许可证,这些产品和技术被用于开发C919飞机。 作为一架代表中国航空工业发展创新突围的大国重器,但不能忽视的现实是:这架被寄予厚望的国产大飞机,核心动力却依然还是靠进口发动机支撑。 要知道,在此之前C919已测试和累计安全飞行超过2.8万小时,并逐步朝着商业化方向落地,“美国断供C919发动机”这件事,就好比要将中国大飞机的这颗“外国心脏”强行摘除。由此带来的结果是:C919大飞机交付飞行受阻;国产发动机研发和产业链肩上攻关责任则变得更大了。 但真正的问题是,面对西方的技术封锁,“中国心”何时才能实现真正的自主可控呢? 好消息是,官方在6月5日在湖南株洲举办的AES100发动机研制工作总结会宣布,AES100发动机已获颁生产许可证并签订销售合同。 这表明,AES100发动机已从设计研发阶段迈向批量生产阶段,为其投入市场、推动低空装备发展奠定了基础,与此同时,长江-1000A(CJ-1000A)也不断有好消息传出。 毫不夸张的说,真正属于中国造的民用航空发动机即将来临。 蓄谋已久的围城 如果把视角放大来看,在世界航空业中,一个基本的事实是,一架大飞机的制造并非一个国家能单独完成,而是要依托于成百上千家的全球供应链生态。美国的波音和法国的空客,便是一直遵循着这种规律。 那么C919作为中国首款按照国际适航标准研制的干线客机,其零部件自诞生之日起同样靠着诸多的产业链供给和全球化分工,这意味着在技术路线上,该款飞机一直采用的就是国际通行的 “主制造商-供应商”模式。 通俗地理解就是,C919由中国商飞负责总体设计和集成,而超过40%的核心部件需要进行全球采购。这其中,C919最关键的发动机则来源美国通用电气与法国赛峰合资生LEAP-1C发动机,占到整机成本约30%。 企业大规模采购各地组件的理由也很简单:一是不同分工链上的角色具备了不同资源能力;二是这种操作更有价格优势,一来二去多种要素整合到一起,就可以让交付成本变得更低。由此,大飞机的全球化生产也在过去数十年一直视为商业合作效率的典范,并延续至今。 但打破这一长期以来俗称约定的,又恰好正是过去建立起这套规则的美国——往深层次看,这伴随着中国的崛起尤其是制造业的壮大,从过去的华为到如今的国产大飞机,无一不是如此。 总结下来就不难发现,此类招数更像是一场针对中国的且蓄谋已久的“围城”。毕竟,在美国出口管制政策中“任何使用了美国技术或零部件的产品,都需要遵守美国出口规定”,即使法国企业参与生产,只要涉及美国技术,就必须服从美国禁令。 再考虑到贸易壁垒和地缘风险的不确定性,可以得出的结论是,对C919进行发动机断供,这事儿的本质上并非外界所宣扬的“维护美国优先与供应链安全”,而是以所谓的“极限施压”来逼迫对手在市场准入、关税、关键矿产出口等方面做出让步。 考虑到C919客观上有不少部件或子系统在受影响范围之内,如飞控、液压、航电系统等,所以一定程度上确实会给中国的商用飞机交付带来一定阻力。 发动机上的坚固堡垒 关于C919是否能算国产大飞机,客观地讲,全球化合作与自主创新并不相矛盾,因为C919在大多数产品定义上,如机翼、机身、尾翼等部件的布局,航程、座级的参数,以及发动机量级、电源功率、装什么样的系统等等方面,都具备独立自主的决定权和设计权,这也是此前C919能被誉为中国人自己的大飞机的重要原因。 但是与欧美等国相比,最大的不同点是,美国公司手里还是掌握着在自动化技术、发动机制造等领域核心技术,尤其是航空发动机被誉为 “工业之花”“皇冠上的明珠” 。 航空发动机之所以难造,核心原因在于,它需要在进气、压气、高温、高压、高转速环境下保持持久可靠运转,且研发周期较为长,投入极为巨大,对安全度要求极高,故而技术壁垒之高令人望而生畏。 最为明显的例子是,从2008年11月4日亮相以来,一台LEAP-1C发动机历经成千上万次的十几年的测试和改进,才能将故障率降低到仅每飞行100万小时中2次,若考虑到前期的设计和生产,时间周期将高达数十年。 显然,由此带来的可靠性是普通军用或小型民用飞机的发动机无法比拟的,绝对的高标准的要求使得商用发动机制造成为工业领域的最难攀登的一座“巅峰”。 所以,单纯从技术角度,这东西就具有一定壁垒,再对于咱中国而言,更大的难题在于另外两个方面。 第一就是我国在此领域的基础薄弱,起步太晚。 中国工程院院士刘大响曾讲过一句话:“1949年以来中国从未研究过大型民用发动机” ,表明当欧美已发展到第五代发动机技术时,中国还得从第一代开始慢慢研究,要想突破到第五代、第六代、所需突破的关键技术已堆积如山,困难可想而知。 就算我国在军用发动机领域已取得突破,如涡扇10发动机,装备歼-20战机,可商用发动机的技术要求更高,可靠性与经济性的兼具更是关键,纵然过去我国在材料科学上已有相当建树和成绩,却也未能在造民用航空发动机上突破最关键的一步。 第二则是中国商用发动机行业,不仅承受着重重打压,还要面对三巨头垄断的市场格局——全球民航发动机市场长期是被通用电气、普惠、罗罗三大巨头垄断,中国国产中小型发动机市场份额不足5%,如此垄断格局下,后来者面临的不只是技术攻关难题,还有严密的专利封锁和市场进入许可壁垒。 加之LEAP-X系列发动机又属于大型喷气客机发动机,用于新一代150~200座级单通道客机,这类发动机的设计,往往涉及高温合金类材料,涡轮叶片的制造,燃烧室方面的技术,热管理体系等多项尖端性的保密技术,在没有充分技术资料共享的背景下,我国很难依靠与全球产业链的合作来获取到宝贵的商业信息和原始图纸。 至此,种种迹象表明,发动机上的技术和市场堡垒,不好被攻破,又不得不攻破。 发起国产化替代持久战 事实上,面对断供危机,中国并非没有提前准备。 从新中国刚成立时的模仿到后面的引进,再到二十一世纪已经的加快自主研发,追赶发展与突破实际上过去多年来我国一直在做的事情。 即便C919在采购外部发动机之际,内部的航空工业的“备胎计划”也正在加速推进。其中,长江-1000A(CJ-1000A)作为国产第一款商用大涵道涡扇发动机,已在运-20军用运输机上完成试飞,推力达13吨,接近LEAP-1C水平。 长江-1000A(CJ-1000A)是中国追赶世界发动机技术顶峰的有力大作,按照时间线看,这款真正意义上的发动机一直在努力前行。 2018年5月,CJ-1000A完成了首次点火试验,初步验证了该发动机各部件和系统的可靠性,具备了基础性的适应功能; 2025年3月,长江-1000A启动C919搭载验证飞行工作,中国航发集团董事史坚忠在航空技术大会上宣布,长江-1000A的试运行表现“远超预期” 。 到了5月,该发动机搭载于C919实机开展试飞测试,目标2025年内完成适航审定。 据悉,该发动机采用第四代单晶涡轮叶片、3D打印燃烧室等前沿技术,设计性能与进口的LEAP-1C相当,单推力约为13.5吨与LEAP-1C(12.4吨-13.4吨)相近,涵道比为9:1,由约35,000个零件组成,它的燃油效率较LEAP-1C可以提升3%-8%,计划在2025年底装机C919验证,2026-2027年商用交付。 除了长江-1000A(CJ-1000A),中国航空发动机集团有限公司研发的AES100发动机也是另一套备选方案。这是我国第一型严格按照国际通行适航标准自主创新研制的1000千瓦级先进民用涡轴发动机,那这款发动机的实力如何呢? 值得 庆幸的是,它可以结冰、暴雨、强电磁环境等复杂条件下都可安全稳定工作,具有安全性高、经济性好、维护便捷、环境适应性广等特点。 当然,除了成型的发动机产品,更值得惊喜的是,在材料与制造工艺领域,中国企业同样已取得关键突破。比如,钢研高纳开发的第四代单晶合金DD13耐温性能超国际同类50℃;应流股份涡轮叶片良品率达92%;铂力特3D打印部件实现定制化生产,单机价值超300万元。 这些突破使C919整体国产化率正从60%向90%推进。只不过,有成绩同样意味着有挑战,国产发动机要真正实现商业化,实事求是的讲,仍面临一些挑战。 比如,光是在发动机的可靠性验证上,就需数万小时安全飞行积累,按照原计划,CJ-1000A发动机需要在2022年正式装备到C919客机上。但按照目前所公开的信息,CJ-1000A要取得认证和成熟批量装机也许需要更长久的时间,因此,这款发动机尚需在技术上进一步完善,并最终达到装机所需要的稳定性标准。 此外,当真正意义上的国产发动机面世后,适航认证方面也还需获得欧美认可,换句话讲,国产发动机的品质和效能需要达到或者超出进口的水平,如此才能让市场信任它,这无疑将会是一个挑战。 还有一点也不能忽视,那就是量产能力,这对国产发动机的成熟与壮大非常关键。而目前航发动力2025年产能目标仅为50台/年,仅能覆盖60架C919的需求,对于未来,只有在确保全球供应链的支持稳定的背景下,才能稳步提升规模。 所以,国产发动机有进展但要真正突破桎梏实现完全自主可控,还需要打一场持久战。 发动机会有中国造方案 但断供这事儿无论如何都在从侧面在加速中国航空产业链的重构,过去,老美在芯片上对华为实施制裁,最终国产电子工业迅速崛起,并通过堆叠和集群方法,仍实现了相当先进的性能,最终让华为重回得以回归。 在C919项目中,机体结构同样已基本实现国产化, 其中中航西飞承担中机身和机翼制造,中航沈飞负责后机身等部件,这意味着,发动机里面的中国方案迟早将面世。 得出这样的结论并非没有道理,而是源自多个方面的理由。首先,我国工业基础和近几年中国制造的进步明显,尤其是中国航空工业、发动机制造技术、产业链的完善。例如,刹车系统由博云新材供应,航电系统由中航电子开发,这些关键子系统的自主化正在稳步推进,不难预测,未来将有越来越多的中国企业进入C919供应链,国产化率将持续提升。 再考虑到我国具备举国体制的科研和制度优势,国家可以为发动机的国产替代攻坚提供强大的资金、研发队伍等资源。公开资料显示,我国每年在航空领域的研发投入高达数千亿且保持增长态势,这是我国实现国产化替代的底气。 例如,在材料领域,中航高科聚焦的碳纤维预浸料产品处于产业链核心枢纽环节,随着复合材料在航空装备中应用比例不断提高,该公司作为主要预浸料供应商将直接受益。 不仅如此,国内外成熟的航空市场,也能从市场上推动巨大需求转为现实生产力。目前,C919已获得超过1500架订单,短期内可依靠国内市场消化。与此同时,中国正推动东南亚、非洲等新兴市场认可中国适航标准。越南、哈萨克斯坦的航空公司已表达采购意向,中国商飞已构建出 “以国内市场支撑技术突破,以技术突破拓展国际市场” 的独特路径。 写在最后 回过头来看,C919发动机断供风波背后,是一场影响深远的战略博弈,它甚至关乎我国在科技自主上的国运,但中国从来不缺向上打破枷锁的勇气和实力,从高铁到北斗,从安卓到鸿蒙……历史一再证明:封锁清单往往成为中国技术突破的路标。 我们可以设想有这么一天,当波音工程师拆解未来某架C919的发动机时,或许会惊讶地发现,那些曾被卡脖子的技术节点,都已如数刻上中国字的符号,相信完全自主的“中国心”世不再久远。
美媒实测特朗普通信服务:47美元套餐实收65,激活系统频现故障
Trump Mobile官网 凤凰网科技讯 北京时间6月18日,特朗普集团近日推出了一项名为Trump Mobile的移动电话服务,实际上就是虚拟网络运营商,通过租用美国三大运营商AT&T、Verizon以及T-Mobile的无线网络来提供手机服务。 那么,Trump Mobile服务怎么样呢?《华盛顿邮报》编辑希拉·奥维德(Shira Ovide)周一进行了实测。 套餐贵 在测试完无线服务前,奥维德还无法推荐Trump Mobile,她的初步体验并不好, 第一个让她吃惊的是价格。Trump Mobile宣传的月套餐价格为47.45美元,但是当她输入个人信息和信用卡信息后,又出现了一个“套餐电信税’(plan telecom tax),金额是每月17.25美元。这样算下来,总的套餐费为64.70美元。 这是一笔不小的额外费用,而且目前还不清楚这些是否都是由政府强制征收的税,还是有些其他费用被“包装”成税收(这是一种一些电信公司常用的手法)。 套餐费比宣传的更贵 当奥维德向Trump Mobile客服代表询问这笔额外费用时,对方读了一段Trump Mobile服务条款中的内容,内容是:“用户需负责支付各政府机构所规定的适用电信税费”。条款中“fees”(费用)拼成了“fess”,而且这不是唯一一个拼错的词。 没法开通 而且,奥维德的手机似乎根本无法激活Trump Mobile的服务。 Trump Mobile客户支持网站上的一段视频称,新用户应扫描二维码或按照指示,在现有智能手机上开始使用无线服务。但奥维德并未收到二维码或移动服务的激活说明,她的信用卡倒是立即被扣款了。 奥维德在周一联系到了一位友善且乐于助人的客服代表,之后又通过电子邮件联系上了客户服务团队。他们告诉奥维德,如果她没有选择“立刻激活”选项(她相信自己选了),那么可能需要几个小时或一天时间才能收到激活说明。 到了周二早上,奥维德确实在Trump Mobile 在线客户账户中看到了一个二维码和“立即激活”按钮。然而,当她点击那个按钮时,跳转到的Trump Mobile服务开通选项页面却显示“即将上线!” 移动运营商U.S. Mobile的CEO艾哈迈德·卡塔克(Ahmed Khattak)称,他不确定Trump Mobile是否具备成功提供其所承诺无线服务所需的“运营实力”。不过,卡塔克也表示,他欢迎有更多高知名度的替代服务挑战AT&T、T-Mobile和Verizon这三大无线运营商,以推动美国用户摆脱对“无线三巨头”的依赖。“越多越好。”他说道。 截至发稿,Trump Mobile的媒体代表并未立即回应奥维德的问题。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。