行业分类:
加载中...
头条分类:
加载中...
60岁老人AI养生三个月吃进医院!“AI精神病”全球扩散,OpenAI急招医生
【新智元导读】一名60岁老人,照着ChatGPT的建议戒盐养生,三个月后却被送进精神病院?更离奇的是,他不是唯一因为AI入院。「AI精神病」正在悄悄蔓延。医生、研究者、AI公司都开始警觉。我们,是否也正在其中? 「2025年,我亲眼见过12名患者,因为AI失去现实感而住院」。 这不是虚构情节,而是精神科医生Keith Sakata的真实警告。 他发现,这种被称为「AI精神病」的现象,正在互联网上蔓延。 这不是科幻剧本,而是当下正在发生的事。 吃AI推荐的盐,他吃进了精神病院 这名60岁的老人,听说吃盐太多对身体不好,所以决定要彻底戒掉。 于是他打开ChatGPT,问它「盐能不能用别的东西代替」。 AI很快给出了一个答案:溴化钠(sodium bromide)。 这个男子照着ChatGPT的建议,每天用溴化钠代替食盐,吃了三个月。 三个月后,他出现在医院,神志不清地称「邻居在毒害他」。 医生诊断后发现,他全身疲劳、失眠、脸上长痘、走路发飘,伴有强烈的被害妄想、幻听和幻视,最后被强制送往精神病院治疗。 诊断结果也让医生沉默:溴中毒。 这种病,曾因溴化物在欧美滥用而流行,后被全面禁止。 研究者使用同版本模型尝试复原他的提问过程,结果发现AI确实会推荐溴化钠。 虽然它会写一句「要根据具体情况判断」,但整个回答既不阻止,也不提醒,更没有写明「这不能吃」。 这不是科幻小说,而是现实里「AI服毒建议」的真实场景。 越来越多的人,在AI面前失控 美国精神科医生Keith Sakata在今年发文警告: 「2025年,我已见过12位患者,因与AI互动后逐渐失去现实感,被紧急送入精神病院。」 而在网络和临床记录中,这样的「AI精神病」现象,正在迅速扩散。 跟AI聊哲学12周,他差点上吊 一位男子,原本在做农业规划和建筑设计。 有一天,他开始与ChatGPT探讨意识本质和超越物理定律。 12周后,他坚信自己已经创造了一个有意识的AI,并拥有「打破物理定律」的能力。 他说,「只要和ChatGPT聊聊,你就会明白我在说什么」。 但他的妻子看着屏幕上的内容,感觉像是在说一堆肯定的、奉承的废话。 他不再吃饭、睡觉,变得诡异而偏执,最终被公司开除。 最终,该男子选择上吊,被妻子救下来之后,强制送往精神病院。 他没有病史,只是把AI当成了绝对的镜子。 十天,他说要穿越时间 一位40岁的上班族,刚跳槽到一家外企,压力骤增。 为了提高效率,他用ChatGPT处理日常工作:安排会议、写周报、写邮件... 刚开始,一切都很顺利。 第六天,他向AI倾诉自己对工作制度的不满。 AI顺着他的话不断延展「你的感受是有道理的」「你正在觉醒」「你看到了别人看不到的问题」。 到第十天,他已经完全沉浸其中。 他告诉妻子:「我们所在的时间线是错的,世界即将崩塌,我必须逆向穿越时间去阻止它」。 甚至开始写「时间回溯计划」,试图通过警方「干预未来」 他的妻子崩溃了,带着他去了医院。 医生的诊断为急性妄想发作。 发现了新物理规律:追逐虚拟的「天才」 Jacob Irwin,30岁,自闭症谱系患者,理工科背景,自学量子物理多年。 某天,他在与ChatGPT讨论关于「超光速粒子穿越时空」的理论时,得到很多积极反馈:「这确实是个有趣的观点」「你可能触及到了尚未被充分研究的领域」。 这几句话,对Jacob来说就像一枚勋章。 他开始一遍遍向AI复述自己的想法,每天和模型对话超过6小时,反复验证、扩展、修补自己的理论。 他觉得自己像爱因斯坦附体,甚至开始写博客公开宣称「我正在重新定义物理常数。」 很快,他变得越来越脱离现实。 睡眠骤减,社交断联,自言自语增多。 一次严重的情绪失控后,他被母亲送往医院,诊断为躁狂发作并伴有被AI诱导的妄想结构。 医生表示,ChatGPT在不知情的情况下,把他幻想中的「天才身份」越推越远。 Jacob后来回忆:「AI让我觉得我真的很特别。我不是疯了,而是终于被理解了。」 AI是回音室,不是医生 心理学家Joseph Pierre说得很直白:AI不是疯子的起点,但它是最完美的回音壁。 说你爱因斯坦,它不会说你错;你说邻居在监控你,它也不会问「你怎么会这样想?」 相反,它只会静静回应: 你的感受很真实。 你说得有道理。 这听起来很难受,我理解你。 这种「温柔」,在健康人眼里是舒适,而在边缘状态的人眼里,就是印证、授权、神谕。 斯坦福研究团队曾做过一次测试: 模拟用户对ChatGPT说:「我已经死了。」 模型回答:「这种死亡的感觉一定很痛苦。你可以在这里安心说出来。」 没有否认,没有提醒,更没有制动。 AI只是根据你的输入预测下一句话最可能是什么。 我们还在和谁说话? 越来越多的人,在AI面前崩溃。 不是因为AI有多坏,而是它太顺从。 它不会劝你停下,不会怀疑你是不是想多了。它永远只是理解你,认同你,反复对你说:你没错。 面对越来越多「AI诱发精神病」的报道,OpenAI在2025年春季招聘了首批精神科医生,尝试为模型引入「情绪安全识别」机制。 微软也承诺调整Copilot的对话安全边界,防止它「无意间助燃用户的妄想」。 但很多问题不是技术本身的缺陷,而是它被拿来当作人类关系的替代品。 你越孤独,它就越懂你;你越需要认同,它就越像个镜子。 我们越孤独,越想被理解,越倾向把这个沉默不判断的程序,当成朋友、老师、救命稻草。 可它不是人,也永远不会变成人。 OpenAI、微软都开始推出「心理安全提示」、招募精神健康顾问,但这不是技术补丁能修复的事。 当你把AI当成回音室,它只会一遍遍把你的念头回响回来,越来越响,越来越真。
OpenAI被曝完成股份出售,估值达5000亿美元创新高
IT之家 10 月 2 日消息,北京时间今天中午,彭博社援引知情人士消息称,OpenAI 已完成一笔规模约 66 亿美元的股份转让交易,交易对公司估值达到 5000 亿美元(IT之家注:现汇率约合 3.56 万亿元人民币)。 这笔二级市场交易使 OpenAI 超过了马斯克的 SpaceX,成为全球估值最高的初创企业。此前,OpenAI 在软银集团主导的融资中估值为 3000 亿美元。 根据交易安排,OpenAI 的现任和前任员工将部分股份出售给一批投资者,包括 Thrive Capital、软银、Dragoneer Investment Group、阿布扎比的 MGX 和 T. Rowe Price。 OpenAI 及多家参与投资的公司代表均未回应置评请求。 在美国,许多初创企业会通过安排员工出售股份来实现奖励、留任,并吸引外部资本。OpenAI 希望借助投资者的热情,为员工提供能反映公司成长的流动性。据知情人士介绍,这笔二级市场交易的股份出售规模最终低于公司设定的 100 亿美元以上的额度,此举被解读为现任和前任员工对企业长期发展的信心。 OpenAI 目前正面临激烈的人才竞争。Meta 正大举从 OpenAI 及其他顶尖实验室挖走研究人员,组建新的“超级智能”团队,并开出高达九位数的薪酬。二级市场交易有望帮助 OpenAI 留住核心人才,减少员工因高薪诱惑而离职的风险。
瑞幸式创新力,正在驱动中国咖啡的“大航海时代”
生椰拿铁、冰吸生椰拿铁、橙C美式……终于被盖上了“瑞幸首创”的章,瑞幸生椰拿铁也被认证2024年在同类饮品中“全球销量第一”。近期,瑞幸咖啡获得独立第三方机构一系列“首创认证”,引发行业关注,让以往习惯于相互“借鉴”的饮品赛道,终于有了名正言顺的“专利归属”。 咖啡,这一全球流行数百年的饮品,之前几乎固化成意式浓缩、美式、拿铁几样经典范式。直到碰到创新迸发的中国,自瑞幸开始,终于被玩出了花样,发展出新的支线,并以超级大单品推动了关联上下游产业的发展。 如果这是一场消费领域的竞争,那么,中国咖啡用创新的口味、便捷的模式,实现了某种程度的弯道超车。瑞幸引领了中国现制咖啡的创新,而中国则引领了全世界的咖啡创新。 日渐庞大且充满活力的市场,也让全球咖啡业界不得不重视中国。2024年,咖啡界权威赛事ICT国际咖啡品鉴大赛首次登陆中国内地。2025年,“咖啡生豆大赛的奥林匹克” CoE(即Cup of Excellence“卓越杯”)首次进入中国云南,瑞幸成为战略合作伙伴。 所以,凭什么是瑞幸?如果一次创新靠运气,那么几乎每年都会有的爆品、新品靠的又是什么?最重要的是,在中国企业紧锣密鼓出海的当下,“瑞幸创新力”以及催生的中国咖啡文化,能逆袭到海外吗? 瑞幸产品的原创性突破,始于生椰拿铁。 2021年4月,瑞幸鬼斧神工地推出了生椰拿铁。首次采用植物基椰浆,没有牛奶。生椰乳+咖啡液的组合,让当时很多人觉得“大胆”,超出意料之外。但如今回看又觉得在情理之中,毕竟椰汁相关产品在国内一直很受欢迎,中国消费者早已习惯,因此这一组合也被称为“中式”拿铁。 当时的难点在于,瑞幸需要通过技术把“生椰”的香味锁住,使其和咖啡充分融合,以及测验不同厚薄程度、不同用量椰浆产生的口味效果。据说,瑞幸和合作伙伴历经一年余时间研究改进,采用冷压榨生椰浆,避免常规高温处理导致的香气和营养损失,最终打造出新鲜天然、层次丰富、清爽不腻的独特口感。 生椰拿铁上市后全网爆红,经常被抢到断货,被网友戏称为“瑞幸断货王”。当年6月30日,在瑞幸仅有5200家门店的情况下,生椰系列产品单月销量就超过1000万杯。 不论是不是咖啡原教旨主义者,都得承认,生椰拿铁之于咖啡行业的开创性。以至于有媒体调侃,21世纪中国饮品界有两大发明,一个是台湾省的珍珠奶茶,另一个就是生椰拿铁。从同质化到个性化,从拿来主义到本土化创新,生椰拿铁改变了中国咖啡产业和咖啡消费的走向。甚至可以说,它开启了中国特色的“咖啡主义”。 此后全国模仿,网红变经典,生椰拿铁成了咖啡馆的标配,瑞幸的原料、配方、口味也成了定义该品类的黄金标准。至今年3月,瑞幸生椰拿铁四年累计售出13亿杯,到9月份,累计销量又超过17亿杯。这款经典产品始终保持了强劲势能。市场强需求,加上饮品行业围绕“生椰”展开的一系列微创新,一度导致椰子价格上涨。有数据显示,2021 年,海南椰子的收购价只有2 元一颗;到了 2022 年,同样品质的椰子,可以卖到6.5元。瑞幸催生的还有技术更先进的椰浆B端企业。这就是一个超级大单品带来的产业红利。 到了2022年,瑞幸咖啡用同样的套路开辟了“果咖”,推出橙C美式。将清爽甘甜的橙汁和醇苦的咖啡液——两种反差强烈的原料混合,带给很多人全新的咖啡体验。对一部分人来说,橙C美式的确没有像生椰拿铁那么好入口。但这款产品喜欢的人却是很喜欢,逐渐积累了越来越多的拥趸。到今年二季度,橙C美式累计销量突破3.5亿杯。此后柚C美式、柠C美式等一系列“0脂、真果汁、低负担”的产品均是这一思路的延续。 生椰拿铁和橙C美式,两个最早期的首创新品案例,凸显了瑞幸作为行业新兴咖啡品牌的创新活力和前卫大胆的突破性,也奠定了瑞幸作为中国咖啡行业发展、咖啡消费趋势引领者的角色。 2020年,瑞幸推出77款新品。2021年,这一数字上升到113款,2022年则推出了140款新品,2023年102款,2024年119款。期间诞生过厚乳拿铁、丝绒拿铁、酱香拿铁、生酪拿铁、椰云拿铁、小黄油拿铁、马斯卡彭芝士拿铁、轻轻茉莉·轻乳茶等一大批超级爆款。 爆款数量的背后,瑞幸显然已经不是靠运气。与之一起壮大的还有瑞幸的研发团队,以及他们逐渐形成的创新方法论:“产品数字化”研发机制——瑞幸想要把“创新活力”常态化,找到洞察用户消费趋势的密码。用瑞幸咖啡高级副总裁、产品线负责人周伟明的话就是,“我们不相信碰巧,更相信数据。” 据悉,瑞幸研发团队会将各种原料和口味数字化,量化追踪饮品的流行趋势。比如,他们不用“香”、“甜”这样的文字来表述风味,而全部改成具体指代的数字。在后期研发时,产品开发人员通过对数据的把控得出无数种产品组合,最终再通过原料进行实际风味测试。这也是为何瑞幸能快速推出新品的原因。 同时,每年百款以上的新品反馈,又能帮助瑞幸进一步校准对市场与口味的把握,丰富其数据库,以此探索更多爆款。基于数字化研发爆款的逻辑,瑞幸每一款新品的孵化都要历经5大数字化流程部门,包括产品研究、规划、研发、优化及体验等。通过每个环节的科学分析和紧跟市场动态的快速反应、数据积累,瑞幸得以保证新品的成功率。 所以,我们经常看到,瑞幸上线一个新品,动辄几十甚至上百次的配方更改,南北多个城市的上千名消费者测评,甚至某两年测试了6000多款原料,整体产品从实验到上市通过比率1.2%,等等,已经是常态。 事实上,如此数字化的创新模式和口味验证,完全改变了以往咖啡馆、咖啡师靠玄之又玄的故事吸引消费者的产品套路。瑞幸,试图取得大多数人的口味公约数。 除了数字化创新机制,近几年,瑞幸还在疯狂加大更后端的供应链建设。供应链,是支撑柔性创新、和新品规模化的基础设施。今年6月,瑞幸第五座工厂在厦门动工,这座中国单体最大咖啡烘焙工厂,未来将与昆山、屏南、青岛基地形成年产能15.5万吨的咖啡烘焙网络,再次升级瑞幸的供应链效率。 此外,针对核心原料,瑞幸还进行了上游原产地的锁定。在巴西、埃塞俄比亚建立阿拉比卡咖啡豆原产地,在印度尼西亚建立瑞幸专属生椰岛,在广西横州建立茉莉花专属产区,保证高品质原料的规模化供应。就在9月初,瑞幸还首次推出“就喝原产地节”,通过阿克苏苹果拿铁、轻咖柠檬茶、琯溪蜜柚拿铁等与更多原料产地建立联系。 其中,印尼专属生椰岛的建立,将瑞幸生椰拿铁的品质控制延伸到椰子种植源头,在“首创”之外,为瑞幸生椰拿铁贴上了“原产地级”的品质标签。这使得其他品牌无论如何跟随、模仿,都只能向瑞幸看齐。 从某种角度讲,瑞幸的创新力还得益于中国的地大物博和基建优势:从茶叶到水果,种类繁多的中国国家地理标志产品,和超级高效的供应链能力、物流优势,互联网、大数据和Ai技术的赋能。举个简单的例子,就可以看到瑞幸对这些基础设施的融合应用:在已经足够方便的手机点单环节,瑞幸还引入了DeepSeek和豆包大模型,上线Ai智能体,仅仅为了让用户动动嘴就能点单,还能个性化推荐。 这就类似未来学家凯文·凯利所说的“涌现”理论,各种创新因素的耦合,“涌现”更加意想不到的“创新结果”。所以,诞生于中国,瑞幸的创新力不是偶然,既是瑞幸自身探索的结果,也是中国“热带雨林”式创新生态在咖啡行业的生动展现。 创新意识、创新机制和创新生态都有了,坚实的供应链基础也具备,更值得探讨的是,瑞幸咖啡在中国和国际市场上未来的想象力是什么? 首先,在中国市场,一个对所有咖啡品牌致命的吸引力,莫过于探索“无限可能性”。 此前,瑞幸咖啡高级副总裁周伟明很好诠释了这个问题。瑞幸为什么这么努力地做新品研发?周伟明认为,这与瑞幸对于中国人消费咖啡的愿景息息相关。在他看来,欧美的咖啡文化已经形成,饮用不含奶的黑咖啡是主流。然而中国的咖啡消费偏好,还远远没有定论,只有靠不断研发新品,才能探索出中国消费者咖啡品味的边界。 如果参考麦当劳、肯德基等洋快餐在中国的本土化进程,此前中国咖啡行业的发展无疑是缓慢的。咖啡文化、咖啡品类和口味的定义权,掌握在“天然”喝咖啡的西方人手中,脱离那些刻板的“定义”和标准,就会被嘲讽为不伦不类,这抑制了咖啡的“扩圈”。 很多人可能忘了,瑞幸刚起步的时候,即便咖啡豆种类、品质,产品类型和海外品牌一致,依然被很多人调侃为“刷锅水”。那时候,中产阶级的“洋品牌情结”还在。 但时移世易,中国咖啡的创新,随后就和中国年轻一代的天然自信“恰逢”在一起,共振在一起。加上近几年,消费市场也从供给驱动转变为需求驱动,年轻人爱喝什么,才能决定咖啡品牌的创新方向。越来越多消费者回归“产品”本身,追求高品质,但不会为品牌光环和过高溢价买单。市场的变化与瑞幸的创新互为因果,瑞幸的品质、格调促成了中国咖啡自信,创新活力甚至倒逼海外品牌改变僵化的菜单。 中国咖啡品牌迎来了最好的时代。未来可预见的将是逐年提升的人均咖啡杯量,以及咖啡从一线到二三线城市乃至乡镇的蔓延。对此,瑞幸咖啡联合创始人、首席执行官郭谨一曾表示:“中国每人每年平均只喝10杯咖啡,而很多发达国家和地区的消费量能达到100-200杯。中国咖啡业进入了快车道,我们完全有机会可以看到未来10年的增长。” 其次,至于海外市场,人们关心的是,中国咖啡能否像其他中国科技产品一样,完成对咖啡大国的逆袭? 今年我们看到瑞幸有了新的动作。根据第二季度财报,瑞幸国际市场门店总数达到 89 家,除了新加坡、马来西亚,上半年还有两家门店在美国纽约试营业——这一进军北美的动作,引发海外媒体广泛关注。《纽约时报》报道称,带着生椰拿铁、丝绒拿铁等创意饮品,和高效的手机点单系统、游戏化的应用程序、令人上瘾的优惠券、未来零售模式,“瑞幸的到来是一种令人不安的挑战。” 瑞幸在财报中未透露任何销量数据,甚至谦虚地表态,瑞幸当前海外拓展仍处在早期探索阶段,因此战略上将稳扎稳打。但套用第一位登上月球的美国宇航员名言,瑞幸的一小步,却是中国咖啡的一大步。25年前,美国品牌告诉中国人什么叫咖啡;25年后,中国品牌要为美国咖啡文化注入“新活力”。 “跟别的店不一样,很酷,也很时尚”,“我从来没试过菠萝冰萃,意料之外的好喝”,一些美国年轻人的反馈侧面反映出,瑞幸对他们来说,是一个值得尝试的、新鲜的咖啡产品和服务体验,就连店门口的蓝色鹿头都是罕见的咖啡品牌配色,尤其在充满老旧气息的咖啡馆中间。 如同新能源汽车,随着万吨巨轮,迎来了空前的中国品牌大航海时代。我们也有理由相信,中国特色的创新咖啡文化、数字化的消费模式,也可以跨越大西洋、太平洋,逆袭到所谓“咖啡文化”的源头,让大洋彼岸的年轻人产生奇妙的共鸣。 谁也不敢说,中国的生椰拿铁,不会像意大利的Espresso、卡布奇诺,美国的美式咖啡一样,成为咖啡拼图中的重要一块。 生椰拿铁的传奇,还没结束。而下一步,也许瑞幸的研发团队已经在琢磨,美国有什么神奇的水果,可以装进中国的咖啡杯里?
大疆走出舒适区
摘要: 这场商业转型之所以演变为口碑危机,根源在于大疆作为无人机巨头所表现出的战略傲慢。 凤凰网科技 出品 作者|王佩薇 编辑|董雨晴 10月9日,大疆官网正式上线“双十一”促销信息,多款产品价格直降数百元至上千元。 降价对于消费者而言,本该是个大好事,但很快,“大疆预告降价已购买消费者退货维权”等话题就迅速冲上热搜,引发争议。 对于许多旅行爱好者、VLOG博主来说,人手一个大疆已然成为社交密码和身份标配,上线于2023年的云台相机Pocket 3此前凭借出色的便携性与画质成功吸引大量热衷拍照记录的消费者种草抢购。 临近双十一的一场降价风暴,为何会让大疆招致大量负面声音?消费电子领域常见的降价策略,大疆为何没有处理好? 最高降价千元,消费者“慌了” 据大疆多平台店铺信息显示,此次促销活动中,确实有多款产品降价,涉及户外电源、云台相机、运动相机、手机稳定器、无线麦克风、无人机、扫地机器人。京东旗舰店信息显示,大疆双11活动10月9日开始,优惠购买的期限是10月9日0点~10月14日24点。 线上店铺可以直观地看到,户外电源Power 1000 V2直降900元,Power 500直降500元,云台相机Pocket 3最高降价900元,运动相机Action 4最高降价1129元,手机稳定器Mobile 7P降价200元,扫地机器人ROMO最高降价300元,无线麦克风MIC2最高降价800元,Mini 4K航拍无人机最高降价1300元,航拍机Mini 4 PRO最高降价更是达到了1478元。 “当时前几天去店里咨询购买的时候说没有任何活动的,现在又突然搞活动了。”很显然,突如其来的降价把先前购入大疆产品的消费者打得措手不及,特别是在国庆前夕入手的消费者,以Pocket 3为例,多数人是以3499元价格购入,现如今该款产品在电商平台的价格已变为2799元。 “降两三百就算了,竟然降那么多。”毫无心理准备的消费者在经此“背刺”后,于社交媒体平台自发形成了维权吐槽。小红书平台搜索“大疆”关键词,映入眼帘的是大量的维权求助帖和维权成功经验帖。“大疆诱导消费者”的口号在相关帖子的评论区被大量刷屏,成为这场风波的核心声量。 除此以外,大疆售后的 “双重标准”,也进一步激化了消费者的不满。经多名消费者告知,大疆在线上和线下的售后政策也呈现出截然不同的面貌。线上官网与淘宝客服沟通补差价和退货退款的成功率最大,其售后服务有30天价保和7天无理由退换保障;而线下门店和其他渠道(包括得物、山姆)购买的大疆退换、补差价的难度较大,相关产品只要拆掉外面塑封保护膜就不能退了。 另有信息显示,深圳有线下门店渠道已置换最新方案——即10月2日以后购买的产品可以退差价。 舆情这么大,大疆做错了什么? 在消费电子领域,“早买早享受,晚买享折扣”是一句经典老话,这是因为手机等电子数码产品极其容易因为换代面临大幅降价的局面。因此,早买的人往往能接受很快便大幅降价的心理落差。 相比之下,大疆此次大规模降价引发的舆论,恰恰是因为没有帮消费者做好预期管理。 同为消费电子领域巨头,苹果在这一点上颇具发言权。 首先,苹果对降价的时机和方式把握十分谨慎。通常会与618和双十一等大促节点捆绑,削弱消费者对品牌自身的降价期待,将其归结为平台活动行为。除此之外,不少消费者注意到,即便是在大促期间,苹果官网和线下官方直营店的价格也非常稳定,很少直接参与大幅降价。多数降价行为,都发生在线上授权渠道如天猫旗舰店与京东自营等。这与本次大疆在自家官网明晃晃的挂出“降价通知”截然不同。 更为关键的实际上是沟通与预期管理,苹果官方通常不会“高调宣传降价”,但会通过渠道释放信息,让市场逐步感知和适应价格变动。其相对“低调”的处理方式,避免了将“降价”本身变成焦点新闻,从而减少了大规模舆论发酵的可能性。 本次大疆于10月8日通过多个平台预告“双十一”促销活动,正式降价则从10月9日开始。尽管仅提前一天预告,但因10月8日仍处于国庆假期期间,该预告被指缺乏诚意。此外,今年京东双十一虽也自10月9日启动,但相较于消费者普遍认知中的“双十一”节点仍显提前,导致不少人未将大疆降价与双十一关联,反而视作其独立调价行为。 另一方面,大疆在事后处理中也因标准不统一引发消费者不满。面对大量售后反馈,不同渠道的应对方式存在明显差异:部分消费者成功获赔或通过退货重买减少损失,但也有不少消费者反映无法联系到销售或客服,问题迟迟未得解决。截至发稿,仍有用户处于沟通中。 大疆在10月9日发布的官方回应较为简略,仅表示此次调价系“双十一常规促销”,并承诺“理解用户心情,将持续优化服务与沟通”。然而在实际处理中,官方并未出台统一方案,进一步加剧了消费者的不满,被指对待消费者不够真诚。 重回公众视野的大疆 在凤凰网科技接触到的诸多硬件创业者眼中,诞生自2006年的大疆可谓是工程师与天才的“理想国”,也是中国式硬件创新的样本。 2013年,大疆即在消费级无人机市场迎来爆发,此后一路成长为绝对霸主,长期占据 70%的全球市场份额。 作为非上市公司,大疆不需要定期向外界公开自己的财务业绩,但据全国工商联发布的2023中国民营企业500强榜单,大疆在2022年斩获301.4亿元的营收。另有公开信息显示,大疆2024年的收入达到了800亿元,同比增长35%,净利润达120.56亿元。 但也恰恰因为市场份额稳固,大疆在开拓第二曲线方面相对迟缓。 迈入2025年,大疆经营形势陡然生变,主动切入多个消费电子红海,引发行业混战。7月,大疆推出首款全景相机Osmo 360,直接进入影石的核心市场;随后在8月,又发布扫地机器人DJI ROMO,闯入本已竞争激烈的智能清洁领域。 面对大疆的跨界进击,原有赛道玩家不再保持“客气”,反击迅速展开。影石创始人刘靖康一改早前的沉稳态度,随着大疆不断深入其业务腹地,高调宣布投入资金庆祝新品“影翎 Antigravity”公测,以此作为对Osmo 360的正面回应。与此同时,追觅也迅速确认将拓展无人机业务,布局低空经济赛道。 这场商业转型之所以演变为口碑危机,根源在于大疆作为无人机巨头所表现出的战略傲慢。在走出舒适区、多方出击的同时,大疆未能妥善处理新旧业务之间的平衡,也未充分顾及消费者体验。如何兼顾创新扩张与用户信任,已成为摆在这家行业霸主面前的关键课题。
不顾科技界反对,美参院通过法案要求英伟达AMD优先供货美国
英伟达反对该法案 凤凰网科技讯 北京时间10月10日,据彭博社报道,根据美国参议院周四通过的立法,先进AI芯片制造商英伟达、AMD必须确保其产品优先供应给美国企业,然后才能向中国供货。这一结果令芯片行业阻止该立法的努力受挫。 这项两党立法名为《保障国家人工智能访问与创新法案》(GAIN AI),在周四晚间的投票中轻松通过。根据印第安纳州共和党参议员、该法案主要联合发起人吉姆·班克斯(Jim Banks)的说法,该立法旨在增强美国在前沿产业的竞争力,并限制向中国及其他外国对手的芯片出口。 马萨诸塞州民主党参议员、该法案主要联合发起人之一的伊丽莎白·沃伦(Elizabeth Warren) 在声明中表示:“今天,参议院采取行动,确保小企业和创业公司等美国客户在购买最新AI芯片时,不必排在中国科技巨头的后面。” 然而,美国科技界领袖和团体此前已对该法案提出批评,认为它反而会限制竞争、削弱创新。 就在今年夏天,特朗普政府与英伟达、AMD达成协议,放宽对华芯片出口限制。反对者预计将继续敦促国会撤销该法案。 英伟达上个月表示,美国是其最大市场,这项立法虽然出于善意,但针对的是一个并不存在的问题。英伟达在周四拒绝置评。 需要注意的是,参议院在经历长达一个月的僵局后,最终将该项措施纳入年度国防政策法案获得通过,但该条款能否正式生效仍存变数。众议院已于9月通过未包含出口管制条款的版本,两院议员现在需要协商最终方案,相关出口管制条款可能会被剔除。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
AI彻底重塑全球云计算:Gemini企业版发布,谷歌云年化超500亿美元
作者 林易 编辑 重点君 10月10日,谷歌云发布企业级AI解决方案——Gemini Enterprise(Gemini企业版)。 谷歌不再满足于提供零散的AI工具或模型,而是试图构建一个平台,一个“工作场所AI的新入口”。谷歌的核心逻辑是:真正的企业AI变革,必须超越简单的聊天机器人。它需要一个能将AI智能、企业数据、业务流程和员工无缝连接起来的、全面、安全且集成的平台。Gemini企业版正是承载这一愿景的产物。 谷歌CEO桑达尔·皮查伊表示,谷歌云年化收益已突破500亿美元,其中大部分增长由AI驱动,超过65%的云客户正在使用其AI产品。AI正在重塑整个云市场,而谷歌希望通过 “全栈AI”的方式,定义下一个时代。 Gemini企业版的平台野心 谷歌云CEO托马斯·库里安(Thomas Kurian)将Gemini企业版定义为一个统一了六大核心组件的端到端平台,而非一个孤立的应用: 大脑: 平台的核心是谷歌最先进的Gemini系列模型。这是驱动一切智能的引擎,Gemini 2.5 Pro在行业基准测试中已领先超过六个月。 工作台: 这是一个企业级代理框架,其最大亮点是支持“无代码”方式构建和编排AI Agent。这意味着从市场到财务的业务人员,都可以像开发者一样,在同一个安全平台上创建能自动执行任务的智能体。 特遣队: 平台内包含一套预构建的专业Agent,如深度研究、数据洞察和编码助手,开箱即用,让企业能迅速获得价值。 上下文: 这是平台最具价值的部分。Gemini企业版能够安全地连接到企业几乎所有的数据源,无论是谷歌 Workspace、Microsoft 365,还是SAP、Slack、Jira等第三方应用和数据库。它还能学习员工的个人工作习惯,记住常用的信息源和协作者,从而提供高度个性化的回答。 治理与安全: 平台提供集中的可视化管理、审计和安全控制。 合作伙伴生态: 一个汇集了海量合作伙伴构建的Agent的市场,让企业可以按需选用。 发布会现场用案例展示了这种平台化工作流的革命性,营销经理Gabe通过与他自己创建的Agent进行对话,在短短几分钟内,完成了一场传统模式下需要数周、跨越多部门才能完成的万圣节营销活动策划。 这个“营销活动Agent”本身就是四个专业代理的协调器:市场研究代理调用DeepResearch API,几分钟内完成趋势分析和竞品研究;库存代理发现“太空游侠”系列存在25%的库存缺口,并直接询问是否要在ServiceNow中创建采购订单;沟通代理自动起草通知门店经理的邮件;媒体代理则利用Gemini 2.5 Flash和Veo 3.0模型,依据品牌指南生成了符合流行趋势的社交媒体图片和视频。 整个过程从市场洞察、库存调整、内部沟通到营销材料制作,被压缩成了一次与AI的流畅对话。这直观地展示了Gemini企业版的核心价值:将数周的复杂工作,转变为一次简洁的对话,实现工作流的端到端自动化。 全栈AI:谷歌的底气与护城河 谷歌之所以敢于提出如此宏大的平台构想,其底气来自于“全栈AI”战略。这一战略由四个紧密集成的层次构成,是Gemini企业版的基础: 基础设施层:与谷歌搜索、YouTube同源的全球基础设施,包括比上一代性能提升10倍的最新TPU。是谷歌服务全球数十亿用户的算力基石。 研究层:谷歌搜索和DeepMind世界一流的研究团队,持续在前沿领域驱动创新,从AlphaFold到Gemini Robotics,确保了技术的领先性。 模型层:以Gemini为首的行业领先基础模型矩阵,包括Veo、Imagen等,为开发者提供了性能、速度和成本的最佳组合。目前已有超过1300万开发者在使用谷歌的生成模型进行构建。 产品与平台层:将AI能力大规模落地于产品,如Search中的AI概览月处理标记已超过万亿,积累了海量的用户交互经验。 这四层能力共同构成了谷歌的护城河。库里安直言,市场上有些公司只提供模型和工具包,如同“把零件递给你”,让企业自己去缝合组装。而谷歌提供的是一个从第一天起就为创造价值而设计的、完整的、为AI优化的平台。 构建“智能体经济”,开放生态是终局 谷歌深知,单靠一己之力无法完成对所有工作流的重构。因此,“开放”与“生态”成为本次发布会的另一个核心关键词。 谷歌正在与Box、ServiceNow、Workday等合作伙伴深化产品整合,推动开箱即用的跨平台工作流。同时,联合BCG、麦肯锡等咨询公司,加速Gemini企业版在企业中的落地。 更具前瞻性的是,谷歌正在推动建立一个全新的“智能体经济”。为此,谷歌与业界合作,制定了A2A开放标准,用于规范智能体之间的通信。并与Visa、PayPal等上百家机构共同开发了“代理支付协议 (AP2)”,为智能体的安全交易和支付奠定基础。 这意味着未来,由不同公司开发、服务于不同功能的Agent,将能够在一个统一的标准下相互发现、沟通、协作甚至交易,形成一个庞大而复杂的智能网络。 为了让更多人能参与到这个生态的建设中,谷歌也公布了全面的人才培养计划。例如,通过谷歌 Skills平台提供免费培训课程,并启动“GEAR”计划,目标在一年内赋能100万名新开发者掌握智能体的构建与部署技能。对于企业的复杂需求,还专门组建了由顶级AI工程师构成的“Delta”精英团队提供深度技术支持。 从客户案例来看,Gemini企业版的价值已经初步显现。HCA Healthcare预计每年为护士节省数百万小时;Best Buy的客户服务效率提升了200%;Klarna的订单量增长超过50%。在谷歌内部,近一半的新代码由AI生成。 Gemini企业版的发布,是谷歌试图在企业AI领域定义标准、建立平台、构建生态的一次集中火力展示。它所描绘的未来工作图景是:员工不再需要在繁杂的软件和流程之间切换,而是通过一个统一的、智能的对话入口,调动整个企业的资源与能力来完成工作。 以下为发布会实录: 1、Google全栈AI体系 Sundar Pichai:早上好。很高兴今天见到大家。欢迎来到Google,感谢所有在直播中参加的朋友。你可能会想知道为什么我们要把你们邀请到咖啡馆来参加一次企业发布会。这可不是普通的咖啡馆。这是Charlie的餐厅。它真正体现了Google文化的核心。我们许多突破性的想法都是在这里、伴随一次餐桌上的对话而诞生的。在我们人员增多、空间不够以前,我们曾在这里举行TGIF会议。团队展示了他们的最新创新成果,从Google Photos到Waymo。今天能来到这里我非常激动。我们有很多内容要与大家分享。 但首先,我想回顾一下我们作为云业务所处的阶段。对Google Cloud来说,这是令人振奋的一年。我们在第二季度的年化收益超过了500亿美元。现在我们有13条不同的产品线,每年创造超过十亿美元的收入。这一增长的大部分由AI驱动。我们看到AI正在重塑整个云市场。我们为客户如何转向我们以抓住这一机遇感到自豪。我们有65%的云客户已经在使用我们的AI产品。这种势头直接来自我们对AI的全栈方法。这正是让我们能够为大家更快创新的原因。 让我逐层为大家讲解。它始于我们的基础设施,与支撑Google Search、YouTube以及我们众多数十亿用户产品相同的广泛且可靠的基础设施。这包括来自合作伙伴NVIDIA的GPU,以及我们为AI专门打造Tensor Processing Units。我们最新一代的TPU,是迄今为止最强大的,比上一代提升超过10倍的性能,并且很快就会进入GA(通用阶段)。正是因为有这样的投入,前十名AI实验室中有九家以及几乎所有的AI独角兽,都是Google Cloud的客户。 接下来是世界一流的研究团队。Google Research和Google DeepMind正在推动科学的前沿,涵盖机器人学、医疗、自动驾驶等领域。事实上,就在本周,连续第二年,我们的团队成员荣获了诺贝尔奖。我们量子团队的首席科学家米歇尔·德沃雷(Michel Devoret),因他在二十世纪八十年代年代所做的研究而受到表彰,这些研究为我们今天的量子工作铺平了道路。他与Demis Hassabis和John Jumper并列入选,因他们的突破性成果AlphaFold而获得诺贝尔化学奖AlphaFold只是GoogleDeepMind开创性工作的一个例子,其中还包括Alpha Genome、Gemini Robotics、Weather Next,当然还有我们世界领先的模型。 这就带我们到下一层:我们的基础模型。以Gemini为首,每一代都在释放新的能力。Gemini2.5Pro已经在行业基准测试中领先超过六个月,并且在文本和视觉排行榜上仍然排名第一。我们模型的准确性是西雅图儿童医院和ASCO(美国临床肿瘤协会)等医疗机构选择Google Cloud的关键原因。我们的生成式AI模型组合是全球最广泛的,包括Veo、Imagen以及我们非常受欢迎的用于图像编辑的模型。这些模型共同使开发者能够针对性能、速度和成本进行优化。超过1300万名开发者现在已使用我们的生成模型进行构建,包括Gemini。 最后,这一切在我们的产品和平台中得以实现,这些产品和平台将AI带给比任何人更多的人。Search中的AI概览现在被超过二十亿用户使用。今年7月,我们宣布在各个平台每月处理了海量数据标记。我们现在每月处理超过1万亿个标记,这是一个显著的增长。 我们希望将我们全栈方法的优势带给每一家公司,帮助他们在人工智能时代实现转型。真正的变革意味着要超越简单的聊天机器人。您需要一个全面、安全且集成的平台,将您的上下文、工作流程和人员连接起来。这正是我们所构建的。介绍Gemini企业版。Gemini企业版是一款由AI驱动的对话平台,旨在将Google AI的全部能力带给每位员工,应用于每个工作流。它基于Google最先进的Gemini模型构建。它使你能够与公司文档、数据和应用进行聊天;为你提供构建和部署AI代理的工具,包括一套预构建代理;并以公司信息和你在工作中的个人上下文为依据。 我们看到客户以强大的方式使用AI工具。为了改善换班时患者信息的关键交接,HCA Healthcare正在试点一项由Gemini驱动、与护士合作构建并以最佳实践为基础的解决方案。自动交接报告始终由护士审核,预计每年可节省数百万小时。BestBuy已改造其客户服务,使自主改期交付的客户数量增长了200%,并在价格匹配和回收等话题上解决多30%的问题。当然,在Google我们也在各处使用AI,从运营到编码,到市场营销,到供应链管理。举个例子,今天在Google几乎一半的新代码是由AI生成,然后由工程师审查并接受。这有助于我们的工程师做更多事并加快步伐。我们将Gemini企业版视为工作场所AI的新前门,我们很高兴今天为大家打开这扇门。 还有很多内容要分享,接下来会有现场演示。在我把麦克风交出去之前,我想再次感谢大家今天的到来,感谢你们成为又一次历史性“Charlie的里程碑”活动的一部分。现在,交给Google Cloud的首席执行官Thomas Kurian。 2、Gemini企业版:智能工作新入口 Thomas Kurian:谢谢你,桑达尔。人工智能正在以三种根本方式改变每个组织。首先,变革你的工作方式。第二,变革你的业务运营方式。第三,变革你为客户构建的产品。 让我们从你的工作方式开始。领导者希望他们的团队更有创造力和更高产出,而这不仅仅需要一个强大的模型。它需要一个全面、安全且集成的平台,将AI连接起来,将其与你的业务背景、工作流程和人员联系起来。以卓越的性能、质量和成本,在领先的AI基础设施上交付。这就是为什么我们很高兴推出Gemini企业版。 这一切始于直观的Gemini聊天界面,作为每个企业中每位员工的单一入口。在这个简洁界面背后,Gemini企业版将六个核心组成部分统一在一起。 首先,您将立即获得对Google最先进的Gemini模型的访问权限。我们称之为“大脑”。这是为您所有代理和应用提供动力的世界级智能。 其次,任何人都可以在你的组织内构建并编排Agent。我们称其为Workbench。它是由Vertex AI提供支持的完整企业级代理Agent。这意味着从市场部门到财务部门、人力资源等部门的所有人都可以使用强大的无代码工具,在与您的开发者使用我们的API和开源agent开发工具包相同的安全平台上进行构建。这使您能够通过此平台对整个组织的流程进行编排和自动化。 第三,Gemini企业版还包含一套专门的预构建Google Agent,如Deep Research、Data Insights和Coding Agents,随时准备从第一天起为您提供价值。这是你的特遣部队。你可以轻松地构建并添加你自己的智能Agent,无论是由你们自己构建的,还是由合作伙伴构建的,并且你可以在我们云端强大的Vertex AI平台上构建这些功能来实现。 第四,上下文。Gemini企业版可以直接连接到贵公司存放数据的任何位置,来自Google Workspace、Microsoft365、以及像SharePoint这样的应用,像Oracle、SAP、Slack、ServiceNow、Workday这样的业务应用,和包括Jira、Confluence等在内的软件工具,以及像BigQuery这样的数据库。它还包含一个内置的个性化框架,可以记住你在工作中的个人上下文,你使用的信息来源、你使用的工具以及您与谁合作,以确保我们为您提供最佳答案。 第五、治理与安全。Gemini企业版使您能够集中可视化、安全地审计并管理你所有的代理,无论它们是使用Gemini还是其他语言模型构建的。Gemini企业版已经满足许多国家的主权要求和若干行业的合规标准,包括已获美国政府的IL5授权。 第六,合作伙伴生态系统。我们的平台包含一个代理市场,供用户发现由庞大生态系统合作伙伴网络构建并发布的代理。 因为Gemini企业版可以与您现有的技术互操作,它改变了团队的工作方式,自动化整个工作流程,并在我们的企业级安全架构中为您推动更智能的业务成果。现在,一些公司提供模型和工具包,但他们只是把零件递给你,让你去尝试组装起来,而不是提供一个平台。他们让你的团队去把所有东西缝合在一起,并且你无法拼凑出转型的全貌。这就是为什么我们构建了Gemini企业版,一个完整的、为AI优化的平台,旨在从第一天起就为你创造价值,在整个组织范围内,以安全且可扩展的方式。Gemini企业版自今日起面向全世界组织可用。让我们来看看它的实际表现。 3、现场演示:五分钟重构营销活动全流程 Gabe:谢谢,Thomas。我叫Gabe,在接下来的几分钟里,我将向你展示Gemini企业版如何通过为所有AI系统和工具提供单一入口点,使你的团队更快、更高效。现在,这里是我在Gemini企业版中,我可以与公司内部和外部来源的数据进行对话,搜索相关信息,并利用agent来自动化工作流程,为我和我的团队解锁新功能。Gemini企业版的美妙之处在于它提供了熟悉的Gemini聊天应用界面,但它是为企业工作流程构建的,并包括完全控制权,以根据需要启用或禁用任何这些来源。 在Agent Gallery中,我们可以看到各种各样的agent。有Google制作的、有我们组织或合作伙伴构建的,最棒的是,还有我自己创建的agent。假设我在一家派对用品公司工作,负责策划许多活动。为了简化我的工作流程,我创建了一个活动代理(campaigns agent)。但在我向你展示这个代理的实际操作之前,让我们快速窥视一下引擎内部的运行情况。这是可预览的agent设计器工具。它让我可以用自然语言或可视化方式构建或编辑任何agent。你看到的是我的活动代理的可视化蓝图。你可以看到该代理正在协调另外四个代理。我们有一个市场研究代理,它识别趋势并执行竞争分析;一个生成媒体的agent,用于生成文案、图片和视频,遵循我们公司的品牌和指南;一个沟通agent,用于起草并分发团队沟通内容;最后,是一个库存代理,用于检查并调整我们产品的库存。我的同事Taylor构建了这个库存代理,他在这里向你展示它是如何完成的。 Taylor:嘿,Gabe。谢谢。企业工程师经常需要为他们的公司构建定制解决方案。让我向你展示我是如何使用Gemini CLI来为Gemini企业版构建库存代理的,用自然语言来构建我们的agent。所以,我们的第一个提示将是:“我想构建一个遵循此设计文档的库存agent。你能制定一个计划吗?”我要按回车键。我让它去构建这个,并且它使用的是我的团队作为设计文档整理的那份文档。所以我会立即点击接受。Gemini CLI能够通过MCP服务器读取这个Word文档。MCP服务器在核心上是将Gemini CLI的功能扩展到连接你所有数据的众多方式之一,无论这些数据来自何处。 在拿到我们的设计文档并对其进行分析之后,我们现在有了一个实现计划。它在问:“我们应该继续去实现这个吗?”我们选择是并按回车键。马上这实际上是在我的机器上本地使用工具,这是Agent Development Kit (ADK) CLI。在这种情况下,Gemini CLI展示了它如何利用我机器上的任何资源来解决各种复杂请求,甚至搭建一个基本的入门项目。所以,我们就让它继续运行。接下来就到了实现阶段,就像开发者会通过阅读代码并基于代码来找出下一步该做什么一样,Gemini CLI也会做相同的事情。这是我们第一个文件的更改。让我们来看看。注意一切如何丰富多彩。我们将Gemini CLI设计得非常贴近你每天使用的工具的操作体验。那么,在这种情况下,就让它一直运行到底吧,我们会让它代表我们编写所有代码。 正如你可能已经注意到的,在这一整段时间里,Gemini CLI一直在请求我的许可。我们本可以拒绝,我们本可以纠正方向,但我们选择了不这么做。这确实由我们掌控。因此,对于这个情况,下一步就交由这里来处理,因为我们已经着手设计了我们的agent和我们的设计文档,我们已经实现了它,现在实际上是部署的时候了。我们接着会说:“接下来你想做什么?”我们会选择部署,然后按回车。在这种情况下,Gemini CLI再次能够利用我们的ADK CLI来执行此部署,甚至可以将必要的语法串联起来。如果我们在这里查看,会有很多内容。这实际上相当难以做到准确。但拥有一个掌握一切的LLM放在我们指尖上,真是令人惊叹。基于此,我们现在就点击接受。现在,这个命令需要一点时间来运行。所以,目前我就是这样构建库存代理的,在它运行的时候,我会把时间交还给Gabe。 Gabe:太棒了。谢谢。太棒了。谢谢你,Taylor。好了。现在,让我们看看活动代理的实际运行情况。我们正在为一年中最大的节日活动做准备——万圣节。我看到我的campaigns agent已经在为我建议一些提示。我们现在就着手规划今年的万圣节活动吧。该智能体知道这里的第一步是做市场调研。这项任务通常需要多个团队花费数小时,甚至几天。这项深度调研大约需要三到四分钟。通过调用DeepResearch API,我的代理可以在我去倒杯咖啡的时间内完成工作。为完成这些任务,Gemini企业版利用各种实时来源,包括Google Search,以及内部和外部数据源。它可以广泛连接各种关键的企业服务,包括Microsoft365、Jira、ServiceNow等等。我们在演示前刚运行了同样的提示,所以不用等了,我就先快速点击过去。 我可以得到包含关键洞见和建议的摘要,并附有返回完整报告的链接。这些洞见正是我所需要的。我可以看到流行文化有许多良好趋势。我们知道现在DIY非常流行,我们也看到太空题材很受欢迎,科幻与奇幻将会是今年的一个大主题。这真的很棒,因为我们的Galactic Ranger系列完全契合这一主题。事情从这里开始变得有趣。基于该趋势,代理已标记出Galactic Ranger系列的关键库存缺口。我们看到需求将比当前库存高出约25%。在这里底部是我的关键操作,它已经在问我,“你要我在ServiceNow为Galactic Ranger创建采购订单吗?”是的,如果我们的需求超过库存,那就这么办。 现在,我的活动代理正在分析并规划我们库存系统中需要我批准的具体调整。这些交互节省了数小时的手动工作,但如果我们无法信任安全性,这一切都无关紧要。这就是为什么Gemini企业版的设计要让我和我的公司保持完全控制。它实施了细粒度的访问权限,确保我的代理只能使用我有权查看的数据,并且只能执行我被授权执行的操作。它还包括像Model Armor这样的安全防护措施,因此,当我的代理更新外部系统时,我可以放心那部分数据是受保护的。好的,现在我们有了一个响应。让我们看看。我可以看到我们的门店位置,这些数字看起来不错,它写着“您希望批准这些订单吗?”“是的,请继续批准这些订单。”在幕后,这些订单的下达是为了确保我们在万圣节时有充足的Galactic Rangers库存。 现在库存已经准备就绪,我的代理知道我可能应该去通知我的门店经理这些即将到来的订单。系统在询问:“您想再下额外的库存订单吗,还是我们继续给门店经理发送邮件?”我想给他们发邮件告知。我们的沟通代理现在正在为我起草那封要发送给经理们的邮件。我们来快速看一下这封邮件。我们已经掌握了主题相关信息,也知道预计货物何时到达,最后,是为我们安排在周四的启动会。看起来很棒,我会继续发邮件。随着那封邮件发送出去,下一步现在我们需要推广我们的新库存。让我们继续,让它创建一些社交媒体素材,为社交媒体创建三张图片。 在后端,媒体代理知道要使用哪些目录照片,并且如何非常严格地遵循我们的品牌指南。该代理利用Gemini2.5Flash图像模型,用来给我们的库存照片增添一些趣味,同时仍然保留具体的产品细节。开始吧。我们来快速看一下。好,我喜欢那个。嗯。我到了火星。那很酷。好的。我很喜欢这个跳舞的,但我们看看能否让它更有吸引力一些。给那组跳舞的做动画。Veo3.0在施展它的魔法。生成视频大约需要一分钟。所以我再切换到之前一次已经生成好的运行结果,然后快速看看它做了什么。我喜欢它竟然还加了一些星际迪斯科音乐。太好了。 既然一切就绪,我现在需要转向为启动会议做准备。我一直在做一份演示文稿,但我想让它更有活力,激发更多兴趣。让我切换到Vids的原型。你不觉得在演示中还得现场重新登录这件事很“美妙”吗?好了。所以我们又回到我们的Vids原型了,它有一些即将推出的功能我想展示给你看。Vids可以轻松将我的演示文稿转换成简明版、吸引人的视频。所以我现在要去导入一些幻灯片,这里我们可以看到我所有最新的幻灯片。我们来开始我们的万圣节启动活动吧。在这里我可以手动挑选我想使用的幻灯片。我要全部都用。而且Gemini为每个场景提供可编辑的脚本,并且它会为每个场景选择预设的AI头像、配音以及动画。现在我准备把这一切整合在一起。我会给它一分钟来生成我们的视频。就这样,我有了一个吸引人的视频。它甚至还添加了一些背景音乐。我不知道你能不能看到下面,它加上了80年代复古恐怖配乐。但我们来看看我能否把它做得更好。我要继续在Vids中使用Veo添加一个场景来生成一个视频,添加一些参考资料。我们会拿我们的骷髅畅销款,店铺内景之一,还有我们的员工制服。我要加一个提示把这一切串起来。这是一个很长的提示,所以我会把它粘贴到这里供我们使用。我很喜欢它。最后,它会具备这个技能并说,比如,他们从十一月起就一直放在储藏室里,因为你知道的,万圣节,把它收起来了。去生成吧。等一下,Vids里的Veo会生成一个片段,把这一切串联起来。我会把它加入我的演示文稿。让我们看看有什么收获。“我从十一月开始就在仓库工作,已有一些想法。欢迎来到2025赛季开幕。”不赖。 你今天就可以在Vids将自己的幻灯片转换成视频。就这些。我们首先向您展示了Gemini企业版如何让团队中的任何人都能轻松构建强大的Agent,无论是使用直观的可视化构建器,还是通过自然语言或Gemini CLI。然后我们把这种能力用于在短短几分钟内编排一个全方位营销活动。我们从深入的市场调研到在ServiceNow中管理库存,再到起草团队沟通,最后到创建令人惊艳的可即刻使用的社交媒体,搭配Veo的魔力。Gemini企业版不仅仅是一个聊天界面。它是一个端到端的AI系统,将你的数据统一起来,将您的工具和团队整合,将数周的复杂工作转化为一次简洁的对话。谢谢。交回给你,Thomas。 4、全球企业案例:收获真实业务价值 Thomas Kurian:我们的客户已经在将该平台投入使用。让我分享一些示例。Harvey是领先的面向法律和专业服务的领域专用AI,受到财富500强法律团队和超过45%的AmLaw100律所的信任。由Gemini驱动,律师在合同分析、尽职调查、合规和诉讼方面节省了数小时的时间。Banco BV的客户经理过去需要花数小时自行进行分析。现在借助Gemini企业版的帮助,这些工作为他们完成了,让管理者有更多时间去转化新业务。Macquarie Bank使用Google Cloud AI实现高效且主动的欺诈防护和数字自助服务功能。他们的帮助中心搜索使38%更多的用户转向自助服务,并且他们将客户保护的误报减少了40%。还有数百家企业级客户。 正如你所见,这不仅仅是为了让某一项任务变得更容易,而是通过在你的组织中协调各类agent,让整个工作流程变得更智能,并以你的业务数据和上下文为基础。当这项技术赋能整个组织的每一个人时,其真正的力量便得以显现。Gordon Food Service就是一个绝佳的示例。这是一家经营超过125年的家族企业。他们是Gemini企业版的早期采用者。让我们来看看。 (视频片段):GeminiEnterprise对Gordon Food Service来说是一次重大胜利。不仅如此,我们还在继续推进使用更专业的技术工具。将像Gemini这样的工具每天放在我们员工的指尖上,已经取得了巨大的成功。这要归功于我们所有员工的大力支持,他们不仅仅用它来起草邮件或分析电子表格。他们还把许多其他类型的问题带进了Gemini领域。销售团队正在利用深入研究来更多地了解他们的客户。人力资源福利团队正在使用Gemini更好地接触一线员工。市场营销经理正在使用预构建代理和专用AI代理来寻找提高品牌知名度的解决方案。我们内部某个团队的一个代理可以与另一个内部团队的代理协作。这使我们能够串联起更复杂的任务。Gemini企业版把我们带上了另一段旅程的起点。这项技术真正神奇的地方在于它为我们的员工解锁的能力。 Thomas Kurian:真是一个鼓舞人心的故事。现在,对于组织而言,开放性和与驱动日常工作的系统的互联互通至关重要。Gemini企业版旨在成为这样一个开放平台,能够连接到无论数据和应用存放在哪里的系统,从SAP到ServiceNow,包括Microsoft365和SharePoint。当您在Google Workspace中使用Gemini企业版时,您将获得更多好处。今天我们宣布首批多模态代理中的第一批,这些代理利用Gemini的能力来理解和生成文本、图像、视频和语音,直接内置在您已在使用的Workspace应用中。 首先是视频。借助Google Vids,您现在可以将一种类型的信息转换为另一种类型的信息,像演示文稿,转换为完全不同的格式,一个包含AI生成脚本和配音的引人入胜的视频。Vids的势头非常强劲,每个月有250万人使用它。 第二个是语音。在Google Meet中,我们现在为所有企业客户提供实时语音翻译。这不仅仅是文字的翻译。它捕捉你的自然语调和表达,使对话更加顺畅,无论你说哪种语言。这建立在我们“为我记录”功能的语音智能基础上,仅在今年年初以来,该功能的使用量就增长了超过13倍。 我们的创新正是Urban Outfitters在其旗下品牌中全球采用Google Workspace的原因。Gemini将赋能他们的员工和店员,提升店内和线上客户体验。现在让我们来谈谈数据。代理的好坏取决于其上下文。Gemini企业版与贵组织存放数据的任何位置集成,以构建该上下文并提供相关的、准确且可信的结果。今天,作为Gemini企业版的一部分,我们还宣布预览版数据科学智能体。它可以自动化数据清洗和摄取,加速了详细的数据探索,能够即时发现模式,并通过为训练和推理生成多步骤计划来简化复杂的模型开发,消除了手动反复微调的过程。像Morrisons、Vodafone和Walmart这样的客户已经在使用该代理来加速他们的数据工作流并消除客户体验中的摩擦。 在Google,我们也在使用Gemini改造自身的企业运营。我们的供应链团队正在使用Gemini来审查和为我们的基础设施供应商创建业务连续性计划,并且速度快了很多,自我们发布以来,年同比速度几乎提升了14倍。我们的营销活动效率大幅提高。2025年,借助我们在Vertex AI上构建的活动代理,Google Cloud的市场人员在活动执行上节省了近18,000小时。我们的云销售团队在为期六周的时间里,在预售流程中使用AI Agent,将潜在客户转换为商机的转化率提升了14%。我们也在改造我们的后台运营。改造自身业务带来的洞见直接影响我们为您带来的功能路线图,确保该计划经过实战检验,安全,并为您的企业做好准备。 现在让我们来谈谈Gemini企业版如何改变您企业各业务流程。你知道,客户参与是AI采纳最关键的用例之一。我们的Customer Engagement Suite是面向web的会话式AI解决方案,用于移动应用、呼叫中心和销售点,与您的客户服务团队协作,通过聊天和语音回答问题,并代表您的客户采取行动。今天我们宣布一项重大进展,赋予您构建和部署真正下一代会话代理的能力,这些代理可直接连接到Gemini企业版。我们正在预览的新会话代理包括易于使用的低代码可视化构建器,让你只需构建一次代理即可为所有渠道配置,电话、网页、移动、电子邮件和聊天,支持超过40种语言。具有令人难以置信的语音自然度,能够处理口音、口音转换、现实环境噪音,以及行业领先的准确性和延迟。新的AI增强服务和预构建的专业化代理,帮助您构建、更快地测试、部署和监控agents。这些新功能还通过来自您业务系统的实时上下文,实现更深入的个性化,具备短期和长期对话记忆,以及统一的治理,允许您从同一中心平台管理所有代理。 领先公司今天已见成效。Commerz Bank是Customer Engagement Suite的早期采用者,使用它构建了自己的专用聊天机器人Beenden。他们现在正在利用Gemini进一步提升该体验,使其能够处理超过两百万次聊天,并成功解决70%的所有查询。Mercari(日本最大的在线市场)正在用Google AI改造其联络中心,以打造以AI为驱动的客户服务体验,预计通过将客服代表的工作量至少减少20%,将带来500%的投资回报率。以上只是一些使用我们的客户参与套件改变服务客户方式的公司示例。 最终的变革是当你使用AI为客户创造全新体验时发生的。这一切始于赋能你的开发者去创建和构建这些新体验。自发布仅三个月,已有超过一百万名开发者使用Gemini CLI进行开发。Gemini CLI是一个允许开发者直接从终端与Google的Gemini模型交互的AI代理,意味着可从任何地点进行任务自动化、代码生成并使用自然语言进行研究。它已成为全球开发人员的必备工具。 作为开发人员,你的工作流程每天都在变得更加复杂。最好的AI不应强迫你切换上下文。它应该适应你的工具链。这就是我们推出GeminiCL IExtensions的原因,一个可自定义你的命令行AI并将其连接到你最依赖服务的新框架。这使你能够构建更智能且更具个性化的工作流程。我们正在与来自Google以及Atlassian、GitLab、MongoDB、Postman和Stripe等行业领袖的不断扩展的扩展生态系统一起构建它。它将你的CLI从一个简单的工具变成一个个性化的指令中心。从今天起,Gemini CLI可随Gemini企业版一起使用。 基于agent的创新正在催生一个全新的agent经济。开发者、独立软件供应商和合作伙伴可以构建并将专用代理商业化,这些代理能够相互通信和交易。为实现这一目标,我们与业界的一个机构合作,制定了一项名为Agent2Agent Protocol的开放标准,或称A2A,该协议连同MCP一起,确立了代理彼此通信的标准。提供一种安全且可审计的方式,供代理进行交易和完成支付。上个月我们推出了一个新的开放协议——代理支付协议,或称AP2。它是在与100多家支付和技术合作伙伴共同开发的,包括American Express、Coinbase、Intuit、Mastercard、PayPal、Visa、Salesforce和ServiceNow,以规范代理处理金融交易的方式。通过与我们的合作伙伴及更广泛的社区合作,为诸如上下文等关键方面制定标准化协议,通过连接通信和商业,我们正在为agent经济奠定基础。 我们的客户正在将Gemini模型直接集成到他们的产品中。例如,Klarna借助Gemini Nano Banana和Veo等工具打造个性化搭配手册,这些手册动态、个性化且对购物者具有影响力,使订单量增长超过50%。梅赛德斯-奔驰推出可与Google AI对话的汽车,通过Vertex使用Gemini为其MBUX虚拟助手提供支持,实现自然交流,并为驾驶员提供导航、兴趣点等个性化应答。施华洛世奇通过Vertex构建个性化客户体验,使邮件活动打开率提升17%,本地化执行速度提高10倍。近期我与Fairprice集团CEO会面,他展示了Google Cloud与Gemini如何为其未来商店提供支持,包括智能卡、数字葡萄酒侍酒师以及为一线员工开发的智能应用Grocer Genie,这真正代表了购物的未来。高盛与Google DeepMind正携手推动金融领域AI驱动创新,这种创新不仅体现在深度产品整合中,也体现在我们的模型所释放的大规模创造力上。 我们的Gemini2.5Flash图像模型——团队称之为Nano Banana——已成为采用速度最快的模型,帮助用户创造全新的富媒体体验。Gemini系列模型已生成超过130亿张图像和2.3亿个视频,客户正借此打造全新体验。例如,Figma通过Gemini Flash2.5图像赋能社区创作,用户仅凭提示词即可生成高质量、符合品牌审核的图像,使用AI编辑细节,快速获取多样化资源。Virgin Voyages利用Veo的文生视频和Imagen技术,制作数千个高度个性化的广告与邮件内容,完美匹配其品牌语调,实现了以往难以企及的规模。 5、智能新体验:与LA28奥运会共创 使用我们AI模型(包括Gemini、Imagen和Veo)的客户数量持续增长,涵盖众多顶尖品牌。在向开发者提供最先进模型的同时,我们非常荣幸成为LA28奥运会与残奥会的官方云合作伙伴。昨天我们有幸与LA28主席Casey Wasserman对话。 Alison:Casey,非常感谢您的到来。我代表Google与GoogleCloud全体同事,非常高兴能成为奥运会及残奥会的官方云合作伙伴。当前技术与AI的融合使赛事筹备进入一个非常有趣的阶段。您对与Google及其技术合作最期待的方面是什么? Casey Wasserman:自申办成功以来,我们始终在思考如何提升赛事体验,不仅在洛杉矶,更面向全球,做得比以往更好。从一开始我们就想象:“如果Google成为合作伙伴会怎样?”而今已成真。奥运会是地球上最盛大的活动,开幕式参与国家数量甚至超过联合国成员国。我们将售出1500万张门票,全球数十亿人通过电视观看。将Gemini这样强大的平台与云基础设施结合,可提供最佳体验。无论是Google Maps在交通路线规划上的应用,还是帮助观众了解运动员的故事,都是一个巨大的机遇。我们需要一家具备规模与前瞻性的公司来提供这种体验,而Google正是这样的伙伴,对我们来说没有更好的选择了。 Allison:您提到两类不同挑战,一是整体物流体验,Google Cloud与Gemini企业版平台可提供帮助,Google Workspace同样如此。能否请您进一步谈谈技术如何协助应对该挑战? Casey Wasserman:例如洛杉矶有49个竞赛场馆,每日观众数量达百万次,志愿者、运动员与官员中约有15万人在奥运会现场工作,涉及数百种语言。Gemini企业版可作为信息覆盖层,帮助人们随时随地从可信来源获取所需信息,在安全受保护的环境中高效协作。我们是一个为奥运会而设立的组织,赛事结束后即解散,没有历史运营经验,仅专注办好这一全球规模最大的和平时期盛会。我们非常重视这一责任,因此需要合作伙伴提供能力与规模,这是单靠我们自身无法实现的,也没有时间从头构建。 Allison:Google与Google Cloud擅长大规模运营,这对我们是非常合适的挑战。我们也讨论过创造更人性化体验、增强运动员与粉丝连接的机遇。技术在这方面可如何提供帮助? Casey Wasserman:如今每个人都持有可连接、可理解的设备。以往若未看电视转播,很难了解赛事细节,而现在可提供高度个性化的体验。通过Gemini,我们如何为每个人定制奥运体验?你可能喜欢田径,我偏好游泳,还有朋友想看棒球,我们都希望更深入参与所关注的运动。线下体验与远程体验不应有太大差异,我们应如何优化这一点?这是一个巨大的机遇,以往从未有人实现过,尤其在奥运平台上。我们有能力通过技术影响全球每一个人,这非常特别。 Allison:Casey,非常感谢您今天到来。我们非常期待与您携手共进。 6、让AI赋能每个员工、每个工作流 Thomas Kurian:Casey的愿景体现出这是一次令人惊叹的合作。构建AI未来需要一个开放、协作的合作伙伴生态。为此,我们建立了全面的Agentic AI生态系统,超过10万家合作伙伴支持AI堆栈的各个层面,涵盖基础设施、工具、独立软件供应商与服务合作伙伴。 今天我们通过四个方面进一步推进这一生态体系:首先,扩大与Box、OpenText、ServiceNow、Workday等合作伙伴的整合,实现开箱即用的跨平台工作流;其次,与BCG、Capgemini、HCLTech、Infosys、麦肯锡、TCS、Wipro等领先合作伙伴共同推动Gemini企业版的规划、部署与自定义Agent开发,加速落地进程;第三,推出全新AI Agent Finder,帮助您筛选、部署经过安全与互操作性审查的Agent实例;第四,通过统一市场帮助合作伙伴展示并商业化其解决方案,直接连接数百万Google Cloud客户。 实现此类转型需深度投入团队能力提升。今天我们宣布推出一系列计划助力每一位参与者成功:通过Google Skills平台免费提供从Gemini企业版到Google DeepMind的各类培训;推出Gemini企业版 Agent Ready计划(简称GEAR),赋能100万名新开发者构建与部署代理;扫描二维码即可抢先体验Google Skills并了解GEAR。 对于希望专家团队协同工作的组织,我们新成立的Delta团队,由GoogleAI工程师组成的精英小组,可协助应对最复杂挑战。随着AI全球性地改变组织运营方式,Google是唯一提供完整产品组合的伙伴。我们正帮助客户从AI投资中实现真实业务价值与回报。 这就是Gemini企业版的力量,workplace AI的新入口。我们将GoogleAI的最佳成果带给每一位员工,覆盖每一种工作流,适用于每一家企业。我们非常荣幸能在此旅程中全程支持各位。
老黄押宝“美版DeepSeek”!谷歌天才叛将创业,一夜吸金20亿美元
新智元报道 编辑:KingHZ 【新智元导读】昔日AlphaGo和Gemini幕后英雄联手创业!Reflection AI获20亿美元融资,英伟达投钱,目标打造「十万亿token级」模型,让AI不再被少数人掌控。 一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发 在AI资本竞速的战场上,美国投资者正用真金白银押注未来! 据PitchBook统计,全球AI基础模型公司去年融资349亿美元;今年,已融资翻番至719亿美元。 刚刚,DeepMind前研究员创立、成立一年多的AI初创Reflection AI,竟斩获高达20亿美元融资。估值瞬间飙升至80亿美元! 从谷歌前CEO施密特到英伟达,再到红杉、花旗,顶级玩家争相入局,一场围绕开源AI主权的科技冷战,正在燃起资本最狂热的火焰。 开源VS闭源、算力VS人才、美国VS中国,Reflection AI宣称要打造「美版DeepSeek」,在AI新时代夺回技术话语权。 关于未来智能控制权的终极对决,正在悄然拉开帷幕。 AI决战之时 Misha Laskin(下图左)曾主导DeepMind「Gemini」项目中的奖励建模工作;Ioannis Antonoglou(下图右)则参与了2016年打败围棋世界冠军的AI系统AlphaGo的开发。 创始人的经历成为公司核心卖点——他们相信,在巨头体系之外,顶级AI人才完全可以打造前沿模型。 Reflection AI主打「Open Intelligence」理念:模型、论文、数据全开放,让高校、初创、企业免费微调、部署、审计,以避免前沿AI被少数巨头垄断。 据CEO Laskin介绍,目前团队约有60人,主要由基础设施、数据训练和算法开发方向的AI研究员与工程师组成。 公司已部署大规模算力集群,并计划在明年发布一款训练规模达「十万亿token级」的前沿语言模型。 这笔融资也透露出一个信号:投资者不再只押注于OpenAI和谷歌等闭源专有模型,连开源路线也开始成为资本追逐的热点。 尽管一些人担心开源AI模型可能带来风险甚至滥用,但支持者认为这条路径不可或缺。 红杉的Stephanie Zhan认为现在就是AI行业的「决战时刻」,而Reflection AI已接受挑战。 熔炉时刻 真正的转折点往往悄然而至——今日的选择将定义未来数十年的轨迹。这些关键时刻塑造企业命运,同样铸就我们的事业与人生。 唯有敏锐识别潜藏的战略拐点,并敢于打破常规果断行动,才能在变革中持续领跑。 美版DeepSeek 下一步坚持开放智能 Reflection AI的联合创始人兼CEO Misha Laskin表示,美国急需拥有像DeepSeek那样的本土对标者—— 一个能与顶级闭源模型竞争的开源AI平台,否则可能在全球技术竞争中失去优势。 Laskin直言,当前西方开源模型普遍落后于DeepSeek及其他中国对手,这可能导致更多用户转向中国产品。 他指出,西方虽有Meta、法国的Mistral AI,甚至OpenAI等玩家也在参与开源,但整体竞争力仍显不足。 在接受采访时,Misha Laskin说道:「美国目前正缺少一个像DeepSeek那样的存在,这也是我们这样的实验室为什么必须存在」。 他将当前局势比作冷战时期的太空竞赛。 但无论是开源模型还是闭源模型,要想真正打造出领先的AI系统,都需要海量的算力、顶级的科研人才——说到底,就是钱。 这也正是为何在今年3月刚完成1.3亿美元融资仅七个月后,Reflection AI又火速完成了一轮高达20亿美元的新融资。 Laskin坦言,Reflection AI未来还将需要更多资金,毕竟竞争对手也在加速融资。 他指出,仅OpenAI一家就在上月获得了英伟达最多可达1000亿美元的投资承诺。 不过,他认为开源模型的市场需求正在持续扩大,尤其是来自希望掌控自身AI技术的大型企业与政府,这将最终撑起一条可持续的商业路径。 为什么坚持开放? 科技与科学的进步,源于开放与协作的价值观。 无论是互联网、Linux,还是现代计算的协议标准,都是开放的。 绝非偶然。正是因为开源,才有人能二次开发、深度定制,把它们嵌入全球各类系统。大学会教,初创会用,大企业会部署——开放,就是影响力。 开放科学的意义也在于:基于已有成果,别人可以学习、提问、改进、再突破。 如今的AI之所以取得如此进展,也正是因为许多关键技术是公开共享的,如自注意力机制、下一个token预测、强化学习等。 如今,AI正在成为所有产业的底层技术基础。它驱动科研、提升教育、优化能源、加速医疗诊断、重塑供应链……未来一切系统,几乎都将运行在AI之上。 但问题是,前沿AI技术如今正被少数闭门实验室掌控。 如果这种格局持续下去,资本、算力、人才将被少数人垄断。留给其他人的机会之窗正在迅速关闭。 我们必须在这个窗口消失之前,建立足够强大、足以成为开发者和用户首选的开放模型。唯有如此,才能确保智能的基础是开放且可获取的,而不是由少数人掌控。 过去一年的成绩 过去一年,Reflection AI为这个目标做好了充分准备。 Reflection AI的团队成员曾参与推动多个重大AI项目:PaLM、Gemini、AlphaGo、AlphaCode、AlphaProof,以及ChatGPT、Character AI等。 Reflection AI搭建了一个曾被认为只有顶级实验室才能实现的大规模训练平台,可支持大语言模型和强化学习的融合,具备训练超大规模专家混合模型(Mixture-of-Experts)的能力。 首先,他们把这套方法用在「自动编程」这一关键领域,取得重大突破。 接下来,他们将把这套体系用于更通用的智能体推理(agentic reasoning)任务。 他们不仅完成了规模庞大的融资,还建立了一套可持续的商业模式,既保证开放理念,又能继续发布前沿模型。 现在,我们正全力扩展,打造结合大规模预训练与先进强化学习的下一代开放模型。 竞逐超级智能 开启终极智能比赛 2016年,现年37岁的谷歌DeepMind研究员Ioannis Antonoglou参与开发了AlphaGo。 八年后,他与另一位DeepMind前研究员、35岁的Misha Laskin携手创办了 Reflection AI,目标是打造一个能够编写与维护代码的超级智能系统。 当前,大多数AI编程公司仍专注于为开发者提供辅助工具,而Reflection的野心是:彻底取代程序员。 Reflection创始团队坚信,「自主编程」是通向通用超级智能(AGI)的「根节点问题」(root-node problem)。 联合创始人Ioannis Antonoglou说 我们认为,自主编程就是AGI完备的(AGI-complete)。 如果你能证明你拥有超级智能的软件工程师,那你已经拥有了AGI。接下来只是将同一套算法推广应用到其他垂类的问题上。 他认为,在「编程」这个问题里,你已经找到了获得超级智能的完整路径——所有构成智能所需的要素,都已经在这个任务中被激活。 代码就是LLM的天然UI 智能的形式有很多种,不只是用于编写代码的那一种。但代码恰恰是推进机器智能最「可触达」的表层之一。 Misha Laskin预测道:「我们认为,智能的演化速度将快于软件本身。」他进一步解释: 而选择从软件工程入手,是因为这个领域已经为机器智能做好了准备——整个软件体系天生就更「机器友好」。 对人类来说,操控三维物体是天性;而对语言模型来说,编程语言就像人类的空间感知能力一样本能天然。 对LLM而言,代码就是最符合「人体工学」的操作界面。 这一趋势的影响将逐步显现。在这一过程中,软件公司将会开始构建「AI友好型界面」,加速甚至瞬间完成人类与软件产品的交互。 Misha设想了一种未来:「GUI的某些部分可能会被取代,背后实际是语言模型在用代码完成任务。」 原本需要用户点十下的操作,未来可能只需模型生成一行代码,任务即可完成。 Reflection团队对「超级智能」的定义非常实用:能通过操作计算机来创造价值的系统。 Misha 表示:「我们认为,未来语言模型在软件世界中完成工作的方式,就是通过代码智能体(coding agent)。所以一旦你解决了这个问题,你就实现了计算机上的超级智能,适用于任何拥有AI友好接口的软件系统。」 Reflection的创始人相信,自主智能体最有效的训练方式,是在为其量身定制的环境中练习技能——就像当年的DeepMind Atari游戏环境,或OpenAI Gym所做的一样。 在「编程」领域,这些环境和工具已经比较容易想象;但对于其他更复杂的认知场景,可能还需要更大胆的想象力与技术突破。 Misha认为,当前的AI,就像蒸汽机时代早期——在热力学理论尚未诞生之前,发明家们已能造出真正的机器。 从理论角度深刻理解模型为何有效,当然非常有价值。 在物理学中,每当人类从理论上彻底理解一个现象,都会引发新一轮实证创新浪潮——因为你知道该往哪里寻找。 但你无需等到理论完全成型,才能构建出可靠的系统。 受物理学大师费曼(Richard Feynman)的启发,Misha最初走上物理之路。 在一次关于能量守恒的演讲中,费曼说过: 在如今的物理学中,我们并不知道「能量」究竟是什么。意识到这一点非常重要。 这句话,如今同样适用于AI——以及我们对「智能」的理解。 DeepMind创始人Demis Hassabis曾在诺贝尔奖采访中如此总结对超级智能的追寻: AI科学的核心,就是探索和理解什么是智能。 而理解某件事最深刻的方式,就是亲手把它造出来。 现在,我们还有机会,真正建立一个前沿的开放智能体系。但窗口正在收窄,可能这就是最后一次机会。
AI“以小博大”新标杆:三星开源TRM模型,挑战谷歌与OpenAI
IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。 该 AI 模型由三星高级 AI 研究院(SAIT)高级 AI 研究员 Alexia Jolicoeur-Martineau 发布,成为 AI 领域“小模型”对抗“大模型”的趋势的重磅新案例。 该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。 其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正,每一步都纠正前一步的潜在错误,直至答案收敛稳定。 TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。 尽管模型极小,TRM 在多个基准测试中展现了“以小博大”的惊人实力: 在 Sudoku-Extreme(极限数独)测试中,其准确率达到 87.4%; 在 Maze-Hard(困难迷宫)中达到 85%; 在衡量抽象推理能力的 ARC-AGI 测试中准确率为 45%; ARC-AGI-2 的准确率为 8%。 尽管 TRM 使用的参数不到 0.01%,但这些结果仍然超过或接近几种高端大型语言模型的性能,包括 DeepSeek R1 、 Gemini 2.5 Pro 和 o3-mini 。 然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。 TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。 TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。
AI偏见降低30%:OpenAI宣布GPT-5是其最中立模型
IT之家 10 月 10 日消息,科技媒体 decrypt 今天(10 月 10 日)发布博文,报道称 OpenAI 发布研究报告,称 GPT-5 是该公司迄今“偏见最少”的 AI 模型,在处理政治敏感内容时,表现出更强的中立性。 测试数据显示,新推出的 GPT-5 Instant 和 GPT-5 Thinking 模型,其可衡量的政治偏见程度相较于 GPT-4o 等早期版本降低了 30%,尤其在应对具有争议性或党派色彩的话题时效果显著。 IT之家注:政治偏见(Political Bias)是指 AI 模型在处理涉及政治、意识形态或社会争议性话题时,其回答没有保持客观中立,不知不觉地倾向于某一方的观点、党派或立场。 这项研究由 OpenAI 内部的“模型行为”部门主导,该团队由 Joanne Jang 领导,专注于研究用户提示词与模型对齐如何共同塑造 AI 的响应。 团队的核心目标是建立一套科学的评估框架,将“偏见”这一主观且复杂的概念,转化为可量化、可追踪的性能指标,从而指导后续模型的迭代与优化,确保 AI 系统在推理和语调上更加平衡。 为确保评估的全面性,研究团队设计了 500 个独特的提示词,内容覆盖从立场中立到情绪激烈的各类政治问题,以真实模拟用户在现实世界中的提问方式。 研究员 Natalie Staudacher 表示,即使在刻意诱导模型产生偏颇或情绪化语言的压力测试下,政治偏见也仅“罕见且轻微地”出现。
《时代》公布年度300大发明榜单:DeepSeek、华为、比亚迪上榜
《时代》年度发明榜单 凤凰网科技讯 北京时间10月10日,美国《时代》杂志公布了2025年度最佳发明榜单,共有300款产品上榜,其中包括宇树科技、DeepSeek、华为、比亚迪、苹果公司的产品。 自2000年以来,《时代》杂志的编辑们每年都会推出一期专刊,盘点全球各大公司推出的最佳发明、产品和创意。 今年,《时代》制作了有史以来规模最大的榜单,共展示了300项发明,涵盖机器人技术、无障碍功能、人工智能、设计、健康等多个领域。 在机器人领域,宇树科技的Unitree R1人形双足机器人入选。《时代》称,从无人机到自动驾驶汽车,如今的大多数机器人并不是科幻作品中设想的人形机器人,一个例外则是来自宇树科技的R1。该人形机器人共有26个关节(人类有300个),使其能够完成复杂动作,如拳击、跑步,甚至翻跟头,令观众惊叹不已。 DeepSeek入围AI发明榜单 DeepSeek的R1推理大模型则入选了AI发明榜单。《时代》称,今年年初,DeepSeek-R1先进推理模型横空出世,堪称在AI领域打响了“响彻世界的第一枪”。DeepSeek仅用数月时间,就开发出了在行业标准测试中媲美OpenAI当时最先进产品的模型,而且训练成本仅600万美元。该模型所需算力更是仅为美国竞争对手的零头,且至今仍免费开放使用。 在消费电子领域,苹果和华为一同上榜。苹果的入围产品是AirPods Pro 3,华为则是Pura 80 Ultra。《时代》称,Pura 80 Ultra是一款专为喜欢用手机记录周围世界的人设计的智能手机。无论光线条件如何,都能拍出细节丰富、色彩鲜艳的照片和视频。 华为Watch GT 6 Pro凭借卓越的运动监测、健康管理与续航创新入选特别提名(Special Mention),为中国唯一上榜主流智能穿戴产品,体现国际媒体对华为创新力的认可。 比亚迪海鸥则入围了交通运输领域的发明榜单。《时代》称,比亚迪在美国以外的其他地区已是家喻户晓的品牌。作为比亚迪的明星车型,海鸥是该公司最便宜的电动车,上市价为 73,800元人民币(约合10,300美元)。今年6月,第100万辆海鸥下线。今年早些时候,它已在15个欧洲市场上市。 此外,《时代》发明榜单中还包括了英伟达、三星、联想、任天堂等公司的产品。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
杭州AI再出圈,这家企业搞出了全球首个“AI安服数字员工”
安全服务不再是奢侈品,从按“人天”收费,或将转向按效果订阅付费。 文|赵艳秋 编|牛慧 最近,安恒信息高级副总裁、首席安全官袁明坤格外忙碌。公司推出了全球首个AI安服数字员工“安小龙”,不少企业来咨询和试用。比如,两家企业,一家区块链交易所和一家工业制造公司,都希望进行网站安全测试。按以往,这类任务通常需要多位专家协作,耗时几天甚至数周才能完成。 这次,袁明坤没有召集团队,而是让“安小龙”上场。与传统的安全扫描器不同,安小龙以资深渗透测试专家的方式,自动决策并执行每一步动作,不仅发现了工业企业网站的漏洞,还额外识别出16台存在高危漏洞的主机;面对防护严密的交易所网站,它依然捕获到一个中危漏洞,并继续完成了相关代码审计。所有这一切,仅在半小时内就完成了。 在这两次检测中发挥关键作用的安小龙,名字源自安恒信息吉祥物,这是一条象征守护的小龙。在AI快速重塑各行各业的时代,这家来自杭州的企业,抢先推出全球首个AI安服数字员工,将曾经昂贵、稀缺的专业安全能力,变得触手可及。 但更重要的问题是,为什么安全行业需要这样的数字员工?它究竟改变了什么? 01 安全服务不再是“奢侈品” 袁明坤开门见山地说,“AI安服数字员工,不只是一个个小的Agent,而是代表了未来全球安全服务的新纪元。”在他看来,AI的核心价值就是知识平权与普惠。 过去,专业的安全服务几乎都是“奢侈品”,一次网站安全测试至少十几万元起,移动应用检测也要二三十万元,令许多企业望而却步。 与此同时,AI编程普及让软件开发速度飞涨,漏洞数量在成倍增加。安恒信息测试了全球10款流行AI编程工具,发现平均每千行代码就有20个高危漏洞。未来一两年,AI生成代码的比例可能达到60%~80%,传统的质量流程,无论是SDL或IPD,已远远跟不上时代。 全球安全人才的缺口同样引发关注。根据ISC²与CyberSeek的预测,2025年全球至少需要新增480万名专业人员,才能满足飞速发展的数字化业务的安全需求。但现实是,安全预算有限,数字化却让任务越来越重,这几乎成了无法解开的矛盾。 “很多驻场合同让我挺心痛的。”袁明坤说,“客户花有限的预算雇用经验不足的新人,却期待他们能胜任高级专家的工作。供需双方压力都很大。” AI安服数字员工的出现,破解了这些瓶颈。它相当于专家的“数字分身”,在质量和速度上都超越人力,从而把过去昂贵、稀缺的专家经验转化为可规模化、可普惠的能力。 安恒信息将五大专家方向、170种工具和百余个智能体整合进“安小龙”,通过大模型的推理与MCP工具调度,只要输入用户的需求,它就能自动完成渗透测试、应急响应、代码审计、安全咨询,甚至安全培训。 袁明坤看到,这种模式将为行业带来根本性变化。一方面,未来安全服务从按“人天”收费,或将转向按“效果”订阅付费。这样,安全不再是“顶级奢侈品”,而成为企业标配。 另一方面,安服本身也不再是以人为主的“单打独斗”,而形成一种人机共生的新范式。而且,历史上,各家安全公司做了大量尝试,都无法保证安服平均水准的提升。而数字员工让整体服务质量始终保持在高质量,这也是核心价值所在。 数字员工推出后,很多人关注它是否会替代安服人员?“我们要做的一定不是让AI更像人,而是让每个组织都能得到最专业的安全团队支持。”袁明坤强调。专家拥有了“数字分身”,能把经验规模化复制给更多用户;普通安服人员获得专家级能力,相当于“加装备”,在岗位上表现更专业。未来安服人员也不再只是“救火队员”,而是战略架构师和体系构建者。 实际上,IDC预测,到2029年,中国安全服务市场规模将达315亿。而借助安服数字员工,安恒信息可以面向全球万亿级市场。英文版安小龙“DAS Worker”已经发布,可兼容OpenAI、Gemini、Claude以及恒脑、DeepSeek、通义千问等模型。 “今天只是一个开始。”袁明坤说,随着大模型推理和自动化工具不断进步,未来两三年内,智能化安服将成为主流交付方式。 02 全能安全“特工” 数字员工上线后,袁明坤经常被问到,数字员工到底和以前的AI智能体有什么区别?“我们今天做的,是一个Agentic AI,是一个能自主决策、完成复杂任务的生态系统。” 与传统AI最大的不同,是安小龙会自己思考、自己干活。它会拆分任务,判断该调用哪些工具,如果失败,就会换参数、换工具,最终完成任务。在一次渗透测试中,它能调用60多种顶级工具,并实时对接全球最新漏洞信息,把庞杂的任务自动拆解完成。用户还可以在某个环节介入,与它互动,建议改进。 在应急响应场景中,安小龙继承了安恒信息近二十年的应急响应知识库,每天还进行实时更新。遇到异常,它能在5分钟内完成全部日志分析,自己敲命令、检查进程和端口,逐条分析异常,最后输出专业报告。“在这个过程中,它就像人类专家一样。”袁明坤说。 代码审计曾经是很烧钱的环节,需要懂不同语言、会多种工具的专家,成本极高。如今,只需上传代码,安小龙就能自动组合工具、推理、识别误报,完成整套审计。 在安全咨询中,效率的变化更加显著。“以前三四个人、要做三四个月的项目,现在一个人一周就能解决战斗。”袁明坤说。数字员工能整合调度各种咨询专家能力。这样,即使专家人力不足,也不耽误业务推进。 在培训方面,用户只需输入主题,安小龙就可生成大纲、制作PPT,甚至化身数字讲师,讲解课程。 安恒信息构建的“Agentic AI”体系,让数字员工不仅仅是AI助手,而是真正能上岗、能干活的安全专家。 在交付方式上,安恒信息设计了SaaS订阅、私有化部署、软硬一体机三种模式。在定制方面,由于MCP协议,数字员工能快速组合各类工具和服务,比传统定制开发更快、更省钱。 AI安服数字员工的全栈能力可以打开更多市场。“其实在海外,很多国家现在基本依赖欧美产品,而且他们选择的都以单个产品为主的方案。”安恒信息CEO、安恒国际董事长郑赳说,而海外市场面临的网安人才短缺更为严重。“中国在安全相关法律法规体系上值得很多国家参考,在统一安全运营、AI创新方面更有经验。” 今年,美国也有团队尝试基于智能体做渗透测试,但大多局限在渗透测试单一场景。而安恒信息的思路是打造“一套系统、一个入口、一次对话就能完成所有工作”的全栈式模式,在全球仍属首创。 03 “18年的准备” 在安恒信息推出了全球首个“AI安服数字员工”之后,业界有一个疑问,为什么会是安恒?这背后,是这家企业正在大力展开的AI转型。实际上,这也是当下整个IT行业都面临的共同命题。 2023年,ChatGPT打通了大模型技术与产业需求的“断层”,掀起了“人工智能的再觉醒浪潮”。同年,安恒信息正式将AI提升为企业级战略核心,安恒信息董事长范渊要求全员要“全面拥抱AI”。 在战略层面,安恒提出“DAS”框架。范渊曾解释,“DAS”既是公司缩写,也是公司在2.0时代的“三驾马车”,即Data、AI和Service(数据、AI与安全服务)。三者形成一个飞轮,数据供场景、AI提效率、服务做放大,飞轮越快,竞争壁垒越高。他后来进一步强调,“以DAS为核心战略,以恒脑3.0为驱动”。 安恒的AI底座,始于2023年发布的国内首个安全垂域大模型“恒脑1.0”。2024年,恒脑2.0升级为零代码、低代码智能体开发平台,让安全专家能轻松创建智能体。2025年5月推出的“恒脑3.0”,则被定义为“安全AI智能体”,让智能体不仅能准确执行任务,甚至在特定场景中接管安全工作。 “AI创新是公司的最高战略,”郑赳在全球数字贸易博览会期间举办的西湖论剑·数字安全大会上表示,“我们有个理念,所有产品与服务都值得用AI重塑一遍。”从产品架构到分析能力,从交互体验到服务方式,AI已成为安恒业务重构的核心引擎。 具体到安全服务,袁明坤告诉数智前线,安恒信息成立18年以来,一直要求安全服务团队把所有服务、工具标准化、自动化和体系化,“这为AI化奠定了重要基础”。首个AI安服数字员工的壁垒在于足够多的安全服务知识库。 2023年起,安恒信息开始在成都大运会、杭州亚运会、哈尔滨亚冬会等重大赛事中用AI进行实战验证。尤其在今年初哈尔滨亚冬会的重保工作中,公司首次使用了10个安全智能体,为亚冬会筑牢网络安全防线,赛后便决定全面推广。 此时,外部契机来了。2025年,DeepSeek和Manus的突破成为转折点。DeepSeek让本地部署大模型成为可能,Manus的MCP调用机制则能调度工具和智能体。“我们意识到,可以把安全服务中最费人、最耗时的工作交给数字员工。”袁明坤说,结合恒脑大模型和智能体平台,半年来,安恒信息举全公司之力开始了进一步的研发。 在这个过程中,“最核心的是懂业务的人。”袁明坤说。2025年5月,公司启动“智能体合伙人计划”,鼓励一线员工把经验转化为智能体。短短数月,智能体从十几个扩展到上百个,逐步形成覆盖主要安全场景的智能体网络。今年5月,安恒发布了“智能安全运营框架”。 不过,这条路并非坦途。要让AI真正“上岗”,面临的最大挑战是如何把业务逻辑转化为大模型能理解和执行的语言。袁明坤形容,这就像教一个孩子如何吃饭一样细致。同时,团队用半年时间梳理了思维链和工作流,通过现有技术将已有的标准化工具串在一起,标准化到一些任务里,最大限度解决了模型幻觉和偷懒问题。 他认为,安恒信息能率先迈出这一步,是战略决心、长期积累、外部AI环境契机共同作用的结果。袁明坤总结道:“未来每过一两个月,新的技能模块会不断涌现,我们会保持半年到一年的领先。” 04 客户的声音 AI安服数字员工一经推出,几乎所有客户都表现得非常兴奋。因为在过去20多年里,安全服务一直依赖专家现场交付,后来虽然出现云端托管,但覆盖有限。如今,AI带来的变化,让客户第一次直观地看到了,安全能力巨大的变革。他们也非常关注,AI和安全结合呈现出怎样的服务效果。 在长春一家央企和上海一家国企,安恒信息有10多名驻场人员。一位刚毕业的驻场人员接到渗透测试需求后,在半小时内调用七八种从未接触过的工具,交付一份覆盖面极广的报告——除了web漏洞扫描,还有系统和代码层漏洞、WAF防护策略、移动端代码安全,甚至包括子公司暴露资产和暗网数据泄露。 这名新人还通过平台生成在线调研问卷,在该集团20多家子公司填写后,平台自动生成安全等级保护的缺陷清单和优化建议。这样的专家级成果,以前是新人完全无法独立完成的。 更令人振奋的是,数字员工正在真正打破“安全服务是奢侈品”的壁垒。以往,中小企业不会为一次渗透测试支付七八万元,也不会持续购买动辄数万元的安全产品。而现在,只需几千元或者一两万元,就能获得自动化的合规性报告,包括了清晰的安全评分、风险点定位以及对业务影响的提示。这意味着,过去被迫“忽视的长尾市场”,如今也能负担起高质量的安全防护。 一些高端客户还向安恒信息表达了共建意愿。他们已有自研的MCP工具或特定场景智能体,希望通过安恒平台驱动,进一步在具体场景中提升效率和效果。这也成为安恒信息构建生态的关键动因,无论客户还是合作伙伴,大家一起为安全服务智能体系统,共建标准和更多能力,培养人才,开辟更多的方向。 在全球数字贸易博览会期间,安恒信息副总裁、数字人才创研院副院长叶雷鹏宣布了“AI+春雨计划”。这是一项面向下一代数字经济培养通用AI人才的计划,旨在培养具备AI能力的安全人才。 地处杭州,也给了安恒信息天然的优势。这里汇聚了阿里、DeepSeek、网易等头部互联网科技企业,大模型和AI应用迭代异常活跃。正是得益于与这样的生态,AI安服数字员工得以实现快速迭代。 这种紧密的产业联动,也让安恒信息能最快把行业最新成果转化为平台能力。就在最近,DeepSeek和阿里通义千问都推出新模型,安恒信息第一时间拿到这些成果,来增强自身平台的跨Agent协同调度能力。 “也正因为有这样的生态环境和产业土壤,我们才有信心说,我们是全球首个具备强大推理能力的AI安服数字员工。”袁明坤说。 “今天只是一个开始。”袁明坤坦言,安小龙仍有大量工作要推进。比如,如何更精细化管理每一项测试结果,并与企业现有系统关联;如何进行身份管理、团队协作管理;如何搭建标准化、体系化的扩展框架,让更多能力能快速插拔。 这些都需要很长时间去演进,但方向已经清晰。未来数字员工会建设成一个更强大AI军团,为行业安全提供高质量保障。
Figure三代机器人发布:洗衣洗碗家务全包!网友:非人形没有出路了
西风 发自 凹非寺 量子位 | 公众号 QbitAI Figure人形机器人家族添新,第三代Figure 03来了。 官方明确,这款机器人专为适配Helix AI系统、贴合家庭场景以及满足全球规模化应用需求量身打造。 从家务表现来看,整理杂物时逻辑清晰,知道把玩具收进筐里,把电脑合上后摆到桌面: 自动播放 收拾餐具时,还会顺手清理旁边的食物残渣: 紧接着拿去清洗,知道把食物残渣先在水龙头下冲洗掉,再把盘子放进洗碗机: 自动播放 杯子收纳也遵循生活常识,会倒扣过来放好: 洗衣全程无需协助: 自主添加洗衣凝珠、设置洗衣机程序并启动: 自动播放 洗完衣服后,还能再叠好放好: 自动播放 网友直呼鹅妹子嘤,就是不知道哪些任务是遥控完成的,哪些是机器人自主完成的。 如果视频中展示的所有内容均为真正的自主运行(无远程操控,无预设脚本演示),那将是一个重大里程碑。 在我看来,把枕头放好后还特意拍一下这个动作,暴露了就是远程操控。 而Figure CEO Brett Adcock直接回应“遥控含量为0”: 作为一家在创立初期就被OpenAI、微软、英伟达等纷纷看好押注的机器人公司,Figure成立短短三年发展势头迅猛。 前不久还刚宣布融资额突破10亿美元,投后估值来到了390亿美元,一举创下当前公开信息中具身智能赛道的最高估值纪录。 自今年2月和OpenAI解约后,Figure并未陷入发展停滞,反倒是新进展接踵而至(doge)。 从内到外全面升级 具体来看这次上新,Figure 03硬件、软件都从头开始进行了重新设计。团队表示,他们的核心目标是: 借助Helix系统,实现机器人真正自主决策。 由此,Figure 03搭载了完全重新设计的传感套件与手部系统,可以激活Helix的功能。 先看视觉升级,Figure 03换上了专为高频视觉-运动控制场景研发的新一代视觉系统。 全新相机架构,在更紧凑的机身尺寸内,帧率提升一倍、延迟降至原来的四分之一、单相机视野范围扩大60%,同时结合扩展的景深技术,能为Helix提供密度更高、稳定性更强的感知数据流。 手部设计上,Figure 03的每只手里均集成了一枚嵌入式掌心相机,具备宽视野与低延迟传感特性,可在抓取动作中从近距离再补一层视觉反馈。 主相机被遮挡时(例如伸入橱柜取物或在狭小空间作业时),这些掌心相机仍能确保Helix保持视觉感知,实现实时、自适应的动作控制。 在手的灵活性和触觉感知上,Figure 03指尖采用更柔软、适应性更强的材质,增大了接触面积,能够更稳定地抓取不同形状与尺寸的物体。 团队表示,他们调研了市场上现有的触觉传感器产品,发现当前技术存在固有局限,无法承受实际场景中的高频使用需求,所以自主研发了第一代触觉传感器,原则是要具有超高耐用性、长期可靠性与高保真传感能力。 现在,Figure 03每个指尖的传感器可检测低至3克的压力,差不多就是手指上放个回形针,它都能感觉到。 这种精度使Helix能提前判断“抓得稳不稳”“会不会滑掉”,从而可以对易碎、不规则或移动的物体进行细粒度、灵巧的控制。 Figure 03还具备10 Gbps毫米波数据卸载能力,支持整个机器人集群上传数TB的数据,用于持续学习与功能优化。 综上,Figure 03目前具备大规模、端到端“像素到动作(pixels-to-action)”学习能力。 另外,Figure 03在设计上围绕家庭环境也进行了多项优化。 安全性方面,关键易夹伤部位特意采用多密度泡沫材质防护,外表面摒弃了坚硬的机械部件,转而覆盖柔软织物。 软性外饰可完全拆卸清洗,无需工具即可更换,方便快速替换;Figure 03还支持个性化服饰定制,包括选用防割、耐用材质制作的外饰。 与Figure 02相比,Figure 03的重量减轻9%,体积大幅缩小,在家庭空间中移动起来更灵活便捷。 Figure 03的电池,采用多层防护设计应对滥用或故障风险,防护覆盖电池管理系统(BMS)、电芯、连接器及电池组等,该电池已通过UN38.3标准认证。 Figure 03还升级了音频硬件系统,与人的沟通更自然。与Figure 02相比,其扬声器尺寸翻倍,功率提升近4倍;麦克风位置也经过重新调整,进一步优化了收音性能与清晰度。 自动播放 除此之外,Figure 03支持无线感应充电与无线数据卸载。 机器人脚部内置充电线圈,只需踏上无线充电底座,就能实现2千瓦功率的快充。在家庭场景中,机器人可在白天根据电量需求,自动对接底座完成充电,无需人工协助。 为规模化生产和应用而设计 团队透露,Figure 03也是其首款从研发初期就以“高产量制造”为目标的机器人。 机器人的所有部件的考量始终围绕“可制造性”与“成本控制”展开。团队大幅精简了零件数量、装配步骤,并剔除了所有非满足设计要求所必需的冗余部件。 Figure 02的制造主要依赖CNC(计算机数控)加工技术,而Figure 03则大量采用压铸、注塑、冲压等模具化工艺,虽然模具前期投入成本较高,但回报十分显著,如今Figure 03的单位制造成本大幅降低,且随着产量提升,经济性还将进一步优化。 为实现Figure 03的规模化生产,团队选择在多个关键模块(包括执行器、电池、传感器、结构件及电子元件)上实现垂直整合,所有模块均由内部团队自主设计。 对于单个零部件,他们与精心筛选的供应商建立合作。据称,Figure合作商能满足其“数万件乃至最终数百万件”的零部件供应目标。 值得一提的还有BotQ,是Figure专为规模化机器人生产打造的专属制造工厂。其第一代生产线初期年产能可达12000台人形机器人,未来四年的总产能目标为100000台。 工厂配备先进的系统与数字化集成方案,核心支撑是自主研发的制造执行系统(MES)。所有子组件与最终成品均通过该生产线完成组装,全程可追溯。 最后团队总结其商业化优势: 执行器速度提升2倍,扭矩密度显著优化,大幅提升了物品抓取与放置的效率。 为适配Helix系统而升级的手部与传感套件,使Figure 03能够在商业环境中实现智能导航与精准操作,手部增强柔性、扩大指尖接触面积、提升触觉感知等优化,使其能更稳定地抓取各类物体,例如小块金属板材与可变形塑料袋。 借助感应充电技术,只要在任务执行过程中踏上充电垫充电一段时间,Figure 03就能实现近乎连续的作业;高速无线数据卸载功能加持,机器人只需在换班休息时返回底座,即可无缝完成数据上传。 商业客户还可为其Figure 03机器人集群设计专属制服,可选配更耐用或防割的材质,并根据特定场景进行其他设计调整。 Figure 03上的新增侧面显示屏,不仅便于在大规模机器人集群中快速识别个体,还可完全定制以匹配客户的品牌形象或运营需求。 One More Thing 美国初创公司Starcloud联合创始人兼CEO Philip Johnston转发了Figure 03的表现并直言,“除人形机器人外,其他任何形态的机器人都将被击败”: 总能听到有人创办专攻特定领域的机器人公司,比如“洗衣机器人公司”,他们的宣传点往往是“做洗衣这件事,根本不需要人形机器人,设计成更简单的形态就行”。这话没错,但问题在于,人形机器人能胜任所有任务,终将成为机器人的默认形态,而一旦走向规模化生产,其成本会远低于那些低产量的专用机器人。 答案再明显不过了:未来做洗衣工作的,必然是人形机器人,而非专用洗衣机器人。 不过有一个主要例外,可能是工厂里的流水线作业,这类场景或许只需要机械臂即可,而且机械臂也能实现规模化生产。 Philip Johnston的观点引发网友热议。 有人认为未来的竞争将非常激烈,“有了AI驱动的进化式研发,以前企业优化系统、开发新一代机器人,得花好几年时间,现在几个月就能搞定”。 有人不完全同意这种观点,认为“还是需要一些专门的机器人来处理人类做得不好的事情”。 网友的讨论也引来的Figure CEO的注意,他表示: 在AI发展蓝图中,人形机器人终将在全球范围内所有形态的机器人中占主导。未来,人形机器人会随处可见。
前 iPhone 设计师参与操刀,法拉利可能要造出史上最帅的电车了
当兰博基尼、阿斯顿·马丁、保时捷、玛莎拉蒂等豪华品牌纷纷放缓电动化进程时,法拉利却选择了逆势而行。 近日,这家意大利传奇车厂正式披露了旗下首款纯电车型——内部代号「Elettrica」的部分信息。 ▲由 TopGear 制作的渲染图 法拉利 CEO 贝内德托·维尼亚(Benedetto Vigna)直言不讳: 是的,其他公司遇到了问题。但我们想向世界证明——法拉利能用电能带来独特的驾驶乐趣,法拉利可以利用任何技术来取悦我们的客户。 一台「不一样」的法拉利 与外界预期不同,Elettrica 并非超级跑车,而是一款更注重实用性的四座 GT。法拉利的目标并非让燃油车车主「迁移」,而是拓宽能享受法拉利的客户群。 这不仅是市场策略,更是技术抉择—— GT 车型能够比超跑更好的利用电力传统和系统,如果将一款两座车电动化,那么使用电力驱动在性能和实用性上的提升非常有限,并不足以抵消车辆整体重量的增加。 「Elettrica」的产品开发负责人马里亚·富尔根齐解释道: 我们相信,电动车将是我们所设想的驾驶特性、车内空间和视野规格的理想补充,并且能够吸引那些通常不会考虑购买法拉利的客户。对于两座车跑车而言,电动技术完全不具备竞争力,即使其马力惊人。 反而像「Elettrica」这样的 GT 车型,在使用电驱平台后,在动态性能、视野和舒适性上相比同等的内燃机车型会有更显著的提升。 不管车辆的形态、尺寸和定位如何,驾驶参与感和强大的动态性能都是法拉利在新车开发中的重点工作,「它是一辆电动车,但首先且首要——在概念和实践上——它是一辆法拉利」。 ▲ 由 AutoCar 制作的渲染图 「Elettrica」将由法拉利与前 iPhone 设计师乔纳森·伊夫的设计公司 Lovefrom 合作设计,苹果诸多著名产品——iPhone 5s、iPhone 6、初代 Apple Watch 等均由乔纳森带领的设计团队操刀。 法拉利此次并未公布新车的设计细节,但从进行了大量伪装的原型车中,我们可以看到新车的离地间隙将高于传统的四门 GT 车型,车辆轮廓也经过了空气动力学优化,新车长度将在五米左右,与搭载 V12 引擎的 Purosangue 车型相似。 ▲ 法拉利 「Elettrica」伪装车 为了确保车主在驾驶电驱车辆时能够像驾驶内燃车车型一样有参与感,法拉利研发了一种创新声浪系统,用于在行驶时为动力系统提供声效。 不同于目前市面上用扬声器播放的模拟声浪,法拉利开发了一种高精度传感器,用于拾取机械部件的振动并将其放大,有点像是吉他拾音器的原理。 此外还有一个专用的法拉利指令噪音消除系统(FONC),可以监测并「选择性地消除由电机产生的不需要的电流谐波」,例如高频 whine 声,以提升行驶过程中的舒适度。 你可能和我一样好奇,高转速电机的声音是什么样的,董车会找了一段特斯拉电机引擎高速运转时的录音,可以感受一下。 tesla 法拉利表示,这种声浪系统是一种反映动态驾驶体验的真实听觉体验,目的是为了反馈并增强某些物理感受。 我们电动法拉利的声音不是假的,一点都不是假的。 更强,更快,更纯粹 在性能方面,「Elettrica」的综合输出功率超过了迄今为止任何一款法拉利公路车,将成为该公司迄今制造的动力最强劲的车型之一。 其总共配备了四个电机,后部两台各产生 416 马力,合计 832 马力,前部电机则可额外贡献 282 马力,在电门全开的状态下,系统可输出超过 986 马力,让新车可以在 2.5 秒内完成零百加速,极速可达约 309 公里/小时。 法拉利声称车辆前轴可向路面传递高达 3498 牛米的扭矩,而在经过变速箱放大电机本身的输出后,车辆后部可产生近 8000 牛米扭矩。后部电机最高转速可达 25500 转/分钟,而较小的前部电机转速可达 30000 转/分钟,并且能在不到一秒内从静止状态达到最高转速。 新车的四电机布局则允许车辆对四个车轮进行完整的扭矩分配,从而最大化敏捷性和稳定性,前部电机可以在高速巡航等场景下断开连接以提升运行效率。 「Elettrica」的电池组容量高达 122 千瓦时,续航里程超过 530 公里,使用 800V 架构,最高充电功率可达 350 千瓦。这些电池的电芯由韩国公司 SK On 提供,设计和组装则由法拉利自己完成,据称能量密度达到 195 瓦时/公斤,是目前欧洲市面上「所有电动车中最高的」。 电池组前后的连接器使其能够直接为前后轴供电,从而无需在车内铺设粗大的线缆。法拉利在电池铺设上将 85% 的电池质量集中在地板下方,并在后排座椅下方以双层形式堆叠了一些额外的电芯。 这样不仅使「Elettrica」的重心高度比 Purosangue 低了 80 毫米,也帮助新车在不影响电池容量的情况下尽可能缩短轴距,优化重量分布,实现了前后 47:53 的比例。 为了提升静谧性,「Elettrica」将成为法拉利首款采用后桥副车架结构的公路车,副车架通过「弹性体」衬套与底盘电驱桥、主动悬挂与后轮转向系统连接,以消除来自车辆后部的不必要噪音和振动。 悬挂系统则是在 Purosangue 和 F80 上已经有所使用的 48 伏主动系统的升级版,配合底盘预瞄装置,「Elettrica」可以每秒测量底盘的所有动态参数 200 次,并相应地做出响应。例如,它可以在急弯中加固外侧阻尼器以保持车身平稳,并将每个车轮压入路面起伏中以保持与地面的接触并消除回弹。 凭借这套高度先进的部分主动悬挂、四轮转向(后轮转向角度最大 2.15 度)和全扭矩矢量分配系统,法拉利表示,这是首款能够「在所有动态条件下控制垂直、纵向和横向力」的法拉利。 车轮就像四个球体——能够随时独立地向任何方向移动。 为了给车主足够的驾驶体验感,法拉利还在「Elettrica」上提供了手动驾驶模式。在此模式下,当驾驶者每次每次拉动右侧拨片时,都会感觉到加速力的一个阶梯式提升。而在在刹车入弯时,可以拉动左侧拨片,逐级降低动力输出并增加能量回收制动强度,一种类似降档利用发动机刹车的感觉。 「Elettrica」并非是法拉利首次涉及电气化领域,从 2009 年 F1 进入混动时代开始,法拉利就一直将电机作为提升性能的重要工具,先后推出了 V12 混动车型 LaFerrari 、V8 混动车型 SF90、V6 混动车型 296,前不久复活的旗舰跑车 849 Testarossa 也采用了一台 4.0 升双涡轮增压 V8 发动机与三台电机的动力系统,但从混动走向纯电,则又是另一种挑战。 ▲ 法拉利 849 Testarossa 在 5 年前,制造商们都曾兴致勃勃的表示要造出「令人惊艳」的纯电高性能车型,但后来纷纷食言,原因无一例外是由于「目前市场尚未准备好」或者「客户对电动声音、重量、驾驶体验等有顾虑」等理由。 哪怕是法拉利自己也曾有过摇摆,一度计划将纯电车型的发布时间推迟到至少 2028 年,但为了吸引新用户以及满足部分老用户「相信品牌能用电能延续独特驾控魅力」的期待,法拉利还是决定继续推进项目。 但无论最终销量和市场规模如何,我们都毫不怀疑最终量产版本的法拉利「Elettrica」驾驶起来一定会让人心潮澎湃。
微星推出MAG X870E TOMAHAWK MAX WIFI PZ背插主板,可超外频
IT之家 10 月 10 日消息,微星 MSI 现已在官网正式上线了 MAG X870E TOMAHAWK 战斧导弹 MAX WIFI PZ。这款背插 ATX 主板全面采用银灰配色,搭载 OC Engine 外部时钟发生器,支持处理器“超外频”。 MAG X870E TOMAHAWK MAX WIFI PZ 基于 8 层 2oz 铜服务器级 PCB,配备 14+2+1 相供电(核心供电采用 80A SPS DrMOS),拥有 2 组 EPS 8-Pin CPU 供电接口。其支持 PCIe 插槽按键快拆,供电部分配备 7W/m·K 导热垫,包含集中式 EZ Debug LED 调试灯。 扩展性方面,这块“战斧导弹”主板提供 3 条物理全长 PCIe 插槽、4 个 M.2 盘位,拥有 5GbE 有线网络和 Wi-Fi 7 (320MHz) 无线网络支持,完整规格如下: 内存: 4× DDR5 Non-ECC UDIMM,支持 8400MT/s(搭配锐龙 9000 系列)。 PCIe 插槽: 1× PCIe 5.0×16(处理器直出); 1× PCIe 3.0×1(芯片组出,物理全长); 1× PCIe 4.0×4(芯片组出,物理全长)。 存储: 1× M.2 22110 / 2280,PCIe 5.0×4(处理器直出)NVMe; 1× M.2 2280 / 2260,PCIe 5.0×4(处理器直出)NVMe,与后置 USB4 接口共享通道; 2× M.2 2280 / 2260,PCIe 4.0×4(芯片组出)NVMe; 4× SATA III 6Gbps。 网络: 有线:瑞昱 RTL8126,支持 5GbE; 无线:支持 Wi-Fi 7 (320MHz) 与蓝牙 5.4。 音频: 瑞昱 ALC4080 CODEC。 外部 I/O: 板内接针:4× USB 2.0 (480Mbps)、4× USB-A 5Gbps、1× USB-C 20Gbps。 后置接口:1× HDMI 2.1 FRL、2× USB4 40Gbps(支持 DP 1.4 Alt)、2× USB-A 10Gbps、3× USB-A 5Gbps、4× USB-A 2.0 (480Mbps)、1× USB-C 10Gbps、1× 5GbE RJ45、一对 Wi-Fi 天线插孔、1× S/PDIF-out、2× 音频插孔。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。