行业分类:
加载中...
头条分类:
加载中...
研究:马斯克的Grokipedia大量引用仇恨、阴谋论网站信息
IT之家 11 月 20 日消息,据 NBC 新闻报道,康奈尔大学两名研究人员发布的最新分析报告显示,科技亿万富翁埃隆・马斯克(Elon Musk)推出的在线百科全书“Grokipedia”在内容来源上存在严重问题。该平台不仅 42 次引用新纳粹网站 Stormfront,还大量依赖其他被专家视为不可靠或充斥仇恨言论的网站作为信息源。 研究发现,作为马斯克上月推出意在对标维基百科的竞品,Grokipedia 将 34 次引用了阴谋论网站 Infowars ,107 次引用了白人民族主义网站 VDare。 尽管这些引用在 Grokipedia 的整体来源中占比较小,但相比之下,维基百科通常视这些来源为不可信,根据康奈尔大学的分析及维基百科的公开准则,即便是在介绍种族主义观点或阴谋论本身时,维基百科也通常禁止将这些网站作为参考资料。 研究人员在抓取并分析了 Grokipedia 超过 88 万个词条后发现,其中包含 12,522 次来自被过往学术研究认定为极低可信度网站的引用。Grokipedia 引用这些域名的频率是维基百科的三倍。约 5.5% 的 Grokipedia 文章至少包含一个被英语维基百科社区列入黑名单的来源。 与维基百科由志愿者社区共同决策的模式不同,Grokipedia 采用了集中式的编辑流程。虽然用户可以提交修改建议,但决定权掌握在马斯克的人工智能公司 xAI 手中。这一审核过程缺乏透明度,公司曾暗示其人工智能聊天机器人 Grok 在审核中扮演了重要角色。用户提交的编辑请求会收到来自“Grok 反馈”的批准或拒绝通知。 IT之家注意到,研究还揭示了一个怪象:Grokipedia 有 1,050 处引用直接链接回社交平台 X 上用户与 Grok 机器人的聊天记录。在一个案例中,Grokipedia 引用了一段用户要求 Grok“挖掘某比利时政客黑料”的对话作为信源。 针对康奈尔大学的这份分析,马斯克及 xAI 公司未作回应。媒体向 xAI 发送询问邮件后,仅收到一条自动回复:“传统媒体撒谎(Legacy Media Lies)”。 该研究目前为预印本,尚未经过其他学术研究人员的同行评审,但 NBC 新闻通过独立搜索 Grokipedia 并核对词条参考文献,验证了其中的部分发现。研究作者也已将数据和方法在网上公开。
安世之争,迈出关键一步
摘要:闻泰方面公告表示,公司对安世的控制权仍然处于受限状态。 凤凰网科技 出品 作者|Dale、姜凡 编辑|董雨晴 2025年11月18日与19日,一场牵动全球汽车产业供应链的半导体争端迎来关键一步。 据商务部网站消息,有记者问:有关安世半导体问题,中国和荷兰之间近期的磋商情况如何?对此,商务部回应道:11月18日和19日,中荷双方政府部门在北京就安世半导体问题举行了两轮面对面磋商。在磋商中,中方再次强调,造成当前全球半导体产供链混乱的源头和责任在荷方,敦促荷方切实采取实际行动,迅速且有效推动安世半导体问题早日解决,恢复全球半导体产供链的安全与稳定。荷方主动提出,暂停荷经济大臣根据《货物可用性法案》签发的行政令。 中方对荷方主动暂停行政令表示欢迎,认为这是向妥善解决问题的正确方向迈出的第一步,但距离解决全球半导体产供链动荡和混乱的根源“撤销行政令”还有差距。 这场持续一个多月的安世之争,根源本就在荷兰,却已成为全球汽车供应链的麻烦。 2025年9月底,一场由荷兰发起的资本与司法“强取”,单方面点燃争端。当前,荷兰方面已主动暂停行政令,但19日晚间闻泰科技发布公告表示,2025年10月7日(荷兰时间)企业法庭裁决依旧处于生效状态,其效力并未受暂停的部长令任何影响,公司10月13日公告说明的企业法庭的所有紧急措施还在进行中,公司对安世的控制权仍然处于受限状态,请广大投资者注意投资风险。 荷兰“强取闪电战”何以撕碎全球汽车产业链 一场突袭,让安世半导体,这家全球汽车芯片供应链中的关键角色,瞬间成为地缘政治的角力点。 9月30日,荷兰经济事务与气候政策部依据1952年《物资供应法》下达部长令,冻结安世半导体全球30个主体的资产、知识产权及业务调整权限,有效期一年。次日,公司三位外籍高管(首席法务官、首席财务官以及首席运营官)联手向荷兰企业法庭提交紧急请求,暂停闻泰董事长职务并托管股权。令人意外的是,法院未经庭审,便迅速暂停了中国籍CEO、闻泰科技创始人张学政的职务,并将闻泰所持安世股权强制托管于第三方。 真正的剧变在10月7日降临。随着法院裁决生效,闻泰科技持有的股权被强制第三方托管,CEO张学政也被暂停职务。更麻烦的一步是,企业法庭额外指派了一名拥有决定性投票权的外籍非执行董事。从高管提请到关键裁决落地,全程仅用七日,其速效精准,被业内视为一场“法律闪电战”。 甚至,在荷兰出手“夺权”前,美国商务部已率先修订规则,凭借“穿透规则”将其出口管制效力覆盖至安世半导体,为后续的连锁反应埋下了关键伏笔。 10月13日,闻泰科技股票跌停的同时,发布声明称,荷兰政府以莫须有的“国家安全”为由,对安世半导体实施全球运营冻结,是基于地缘政治的过度干预。 一系列反制动作也在默契进行。 据安世半导体10月14日发布的公告,中国商务部已于10月4日发布出口管制通知,禁止安世半导体中国公司及其分包商出口在中国境内生产的特定成品组件及子组件。同在14日,中国半导体行业协会发布声明,其中提到“我们反对滥用‘国家安全’概念、对中国企业海外分支机构实施选择性和歧视性限制的做法。” 十月底,安世半导体中国公开发声,强调自身作为扎根中国的企业,始终依法合规独立运营,并将客户利益置于首位。声明中指出,公司生产经营正有序推进,管理层与全体员工全力保障供应链稳定。中方同时指责荷兰管理层无视其合法权益,散布不实信息,干扰正常经营,并表示将坚决依法维权。 就在荷兰方面“天真”的强取控制权后,却没想到,全球汽车产业开始了“共同抗议”。大众、宝马、奔驰陆续承认断供危机,大众汽车公开表态,德国沃尔夫斯堡工厂一度濒临停工,宝马和奔驰的新能源生产线也因缺芯陷入停滞。甚至一些车企考虑给员工放假。 欧洲汽车制造商协会直接发文警告,呼吁尽快解决关键芯片供应短缺问题,不然欧洲汽车产业可能会面临停产。 然而,进入十一月,局面并未缓和。荷兰安世半导体于5日发布一份无理声明,澄清张学政并未复职,其投票权已移交独立管理人,同时暂停向东莞工厂供货,导致其70%产能受阻,进一步冲击全球车规芯片供应链。双方争议的核心聚焦于两点,一是管理层与股权管控,荷兰方面依据法院裁决牢牢掌握着关键人事任免与投票权。二是运营冲突,荷方以财务问题为由中断供货,而中方而后也说明事实是荷兰总部自身拖欠巨额货款,中方自身实际库存充足。并且早在11月1日,中国商务部已宣布,作为负责任大国,中方将综合考虑企业实际情况,对符合条件的出口予以豁免。欢迎遇到实际困难的企业及时与中方联系。 正当控制权争夺陷入僵局之际,转折信号悄然出现。 卡雷曼斯当地时间13日表示,荷兰政府代表团表示会在“下周初”来访中国,寻求解决有关中国企业闻泰科技旗下安世半导体公司的问题。 这场重要磋商最终于18日和19日在北京进行。随后,荷兰经济事务部官网发布公告,部长卡瑞曼斯(Vincent Karremans)宣布,暂停此前针对安世半导体的相关干预措施。据环球网报道,其在社交媒体X上发声明表示。“鉴于近期的事态发展,我认为现在是采取建设性步骤的正确时机。” 据商务部网站消息,中方对荷方主动暂停行政令表示欢迎,认为这是向妥善解决问题的正确方向迈出的第一步,但距离解决全球半导体产供链动荡和混乱的根源“撤销行政令”还有差距。 当晚,闻泰科技发布公告说明:公司10月13日公告说明的企业法庭的所有紧急措施还在进行中,公司对安世的控制权仍然处于受限状态。 命途多舛的安世 安世为何如此重要,成为了地缘政治下的“必争之地”? 安世的芯片主要供于汽车刹车、车门、雨刷基础功能,要知道全球40%车规级功率半导体都出自安世,其中小信号二极管、ESD保护器件全球市占率超40%,车规级Power MOS芯片位居全球第二。 荷兰安世半导体曾于2025年10月26日单方面切断了对安世东莞封装测试工厂(ATGD)的晶圆供应,试图以此扼住安世中国的命脉,迫使其屈服。 然而他们似乎遗忘了,正是中资将这家企业从濒临破产的边缘挽救回来,更低估了安世中国在本土构建的完整产业链韧性。在11月2日的公告中,安世中国明确表示,已建立充足的成品与在制品库存,完全能够稳定、持续地满足客户直至年底及更长时间的订单需求,供应链安全可靠。为确保长期供应的韧性,公司已启动多套应急预案,正加紧验证新的晶圆产能,并对在短期内完成验证、自明年起无缝衔接全部客户需求充满信心。 安世半导体的故事,最早始于荷兰飞利浦的半导体标准产品部门,当时专注于分立器件、逻辑器件等基础半导体领域。 2006年,飞利浦将其半导体业务独立出来,重新命名为恩智浦(NXP)。 2015 年,恩智浦为收购飞思卡尔半导体,被迫剥离标准产品业务。2017 年,由北京建广资产和智路资本组成的中资财团以 27.5 亿美元完成收购,并将其更名为 “安世半导体”,这也意味着这家公司虽然将总部保留在荷兰,但其实际控制方已是中资。 此后,闻泰科技正式登场。2019年至2020年间,闻泰科技通过一条清晰的资本路径,以超330亿元人民币的代价,完成了对安世半导体的完全收购。 闻泰科技创始人张学政,这位如今身处风暴中心的灵魂人物,曾对这场收购流露出满满的自豪。在今年4月的哈佛大学中国论坛上,他动情地表示:“安世不仅拥有百年的历史,更是一家真正意义上的全球化公司。” 并入闻泰后,安世半导体开启了与中国本土产业链的深度联动。闻泰将其中超七成的设计、制造与封测产能集聚于东莞,打通了上下游,在快速扩大产能的同时也夯实了供应链基础。这一关键动作直接推动了安世在中国市场份额的迅速攀升,并最终登顶。 根据其官方披露信息,如今安世半导体年出货量超过1100亿颗器件,全球客户终端超过2.5万家,其中汽车行业客户占比超过60%。 作为张学政口中的全球化公司,安世半导体的制造网络已横跨欧亚。晶圆制造工厂分布于德国汉堡与英国曼彻斯特,封装测试基地则设在中国、菲律宾和马来西亚。其研发与制造中心在欧洲各地雇佣了数千名员工,近五年来安世还为荷兰贡献了1.3亿欧元的税收。 纵观安世半导体百年浮沉,从飞利浦遗珠到地缘博弈焦点,其命运恰似一面棱镜,折射出全球化浪潮下的暗涌与裂痕。今日之争,虽暂得喘息,然“芯片虽小,天下安危系于方寸之间”。中方以《孙子兵法》中“先为不可胜,以待敌之可胜”的定力,通过出口豁免化解供应链危局,更以充足库存与替代产能破局荷方断供之困。此番博弈印证古训:“利而诱之,乱而取之”的强权手段终难长久,唯有“以天下之利为利”的供应链韧性,方是正道。
小米法务“被”刺雷军,一次社会性死亡
小米公司在2025年第三季度业绩表现突出,营收突破千亿元,利润大幅增长八成,汽车业务首次实现盈利,车辆销量超过十万台,单车平均售价为二十八万元,毛利率水平甚至高于奔驰和宝马,不过,这些成绩的背后也开始浮现出一些问题。 问题出在小米的SU7 Ultra这款车上,有车主买了车之后发现前舱盖和宣传图里的样子不一样,答应的碳纤维材料也没有用上,一百多位车主联合起来告到法院,要求退款并赔偿三倍车款,这个案子拖到十一月中旬才开庭,小米方面拿出不少证据,说雷军之前在微博里就提醒过大家“这车比较贵,建议别买”,还说宣传内容没有写进正式合同,所以不算违约,更让人觉得奇怪的是,他们出示了雷军修改自己微博的截图,解释说是因为他“对结构不太懂”,所以才把那条内容删掉了。 这件事听起来有些奇怪,消费者选择买这辆车,很大程度上是因为信任雷军这个人,他平时说的话、发的微博、做的演讲,都像是聊天一样,让人觉得挺靠谱,但出了事情之后,公司立刻推卸责任,说“雷军说的话不算数”,这种做法简直是把用户当成好糊弄的人,他们一边靠个人形象吸引关注和销量,一边遇到问题就想撇清关系,这明显是自相矛盾的做法。 雷军这个人设立得很稳,2024年SU7刚推出时,他宣布起售价21.59万,大家都觉得他真心为用户考虑,他在台上讲话,很少提那些技术细节,总爱讲自己怎么一步步努力、怎么挑材料、怎么陪着团队熬夜干活,大家听得进去,也愿意支持他,但现在情况变了,好多人开始说,雷军像是爽文里的男主角,可现实中他不是主角,而是担责任的那个人,一旦产品出问题,大家不会去骂公司,只会直接点名雷军。 小米汽车走的是高端路线,不参与价格竞争,依靠技术投入和品牌形象来发展,光是第三季度研发支出就达到91亿元,全年预计超过300亿元,公司有两万多名员工从事研发工作,这个规模不算小,但用户愿意选择小米汽车不是因为数字本身,而是因为雷军本人的推荐,问题在于,用户对雷军推荐的产品要求非常高,如果产品表现不好,用户会觉得受到欺骗,而不是认为企业只是犯了一个错误。 特斯拉和蔚来都借助老板的个人形象,但他们的做法不同,马斯克虽然爱说话,特斯拉出问题时会围绕产品来解释,蔚来李斌也经常露面,但遇到事情会说公司负责,小米这边却总想区分雷军的个人言论和公司承诺,这种做法反而让公众更加反感。 说到底,现在买车的人变得越来越聪明了,他们不再只看谁在推荐这款车,而是关注车辆本身是否好用,售后服务有没有保障,合同条款写没写清楚,如果小米还想着光靠雷军来带动销量,那以后肯定要出问题,最好是把“雷军推荐”当成一个参考点,而不是做决定的唯一依据,同时还得建立一套独立的质检和维权流程,不能把所有事情都推到老板身上。 我确实很佩服雷军能把小米做得这么好,但现在他面对的问题,不是要卖出更多车,而是要让用户相信“就算雷军不在,小米也一样值得信赖”,这件事如果做不到,哪怕利润再高、财报再好看,也拦不住口碑往下掉,毕竟信任一旦破碎,就很难再重新建立起来。
瑞幸是该重新上市了
文/王慧莹 编辑/子夜 五年前,浑水的一篇做空报告让瑞幸咖啡因财务造假从纳斯达克黯然退市,创下中概股最大丑闻之一。 五年来,经历高层换血的动荡期、9.9元市场竞争的红海期,起死回生的“新瑞幸”准备重新向资本市场发起冲击。 11月初,瑞幸咖啡CEO郭谨一在2025年厦门企业家日大会上表示,公司正筹备在美国重新上市。郭谨一表示,随着历史遗留问题全面解决、企业经营态势持续向好,瑞幸咖啡正积极推动重回美国主板上市进程。 对于具体上市进度,三季度财报会上,郭谨一表示,目前对于重返美国主板上市没有明确的时间表。 再战纳斯达克,瑞幸是时候,也有必要。截至三季度末,瑞幸在全球拥有近三万家门店,平均每月交易客户数达到1.1亿。 图源瑞幸咖啡官方微博 但数据的背后,想要成功上市,瑞幸挑战依然严峻。 于瑞幸本身,外卖补贴战推高了营收,却也吞噬着利润。三季度,瑞幸营收同比大增50.2%,净利却同比下降2%。快速拓店带来了规模效应,却也考验着管理能力。 于全行业,白热化竞争只增不减。星巴克通过股权重组,开启万店扩张计划;库迪、Manner等对手在资本加持下加速跑马圈地。 更重要的是,那个始终悬在头顶的疑问:资本市场会相信一个曾经欺骗过它的企业吗? 瑞幸的回归之路,远非简单的资本运作,它是一次品牌信誉的修复,一场公司治理的重塑。竞争日趋白热化的当下,瑞幸想要继续扩张,需要资本的加持。 重新上市已不再是选择题,而是瑞幸生存与发展的必答题。 外卖大战下的瑞幸: 营收大增,利润率受影响 重新上市的消息传出没多久,瑞幸发布了2025年第三季度财报,这份财报自然成为资本重点关注对象。 2025年第三季度,瑞幸净收入首次突破150亿元大关,达到152.87亿元,同比增长50.2%,远超市场预期的增速水平。 门店数量和月交易用户是瑞幸营收增长的双引擎。截至三季度末,瑞幸门店总数已增至29214家,环比增长11.5%。在中国市场,第三季度净增门店2979家,门店总数达29096家,含自营门店18809家,联营门店10287家。 规模化扩张直接带动客流增长。第三季度,瑞幸新增交易客户超4200万,月均交易客户数同比增长40.6%达1.12亿,以上两个指标均创历史新高。 几大指标亮眼增长的背后,今夏以来的外卖平台补贴大战是不容忽视的增量。郭谨一在业绩会上坦言:“今年以来,在外卖平台补贴活动的推动下,中国咖啡行业加速发展,消费需求呈现出巨大弹性。” 外卖大战是一场比9.9元更猛烈的价格战,在某外卖平台,3.9元就能买到一杯瑞幸咖啡。用低价换单量,这显然是把双刃剑。 最明显的,是与营收高增长形成鲜明对比的盈利承压。第三季度,瑞幸净利润为12.78亿元,同比下降2%;净利润率从去年同期的15.5%降至11.6%。 盈利能力明显收缩的原因在于成本与费用的快速增长。第三季度,瑞幸成本与费用合计135亿元,同比增长57%,增速显著超过营收增速。其中,第三季度配送费用激增至28.9亿元,同比增长211.4%,占营收比重达到18.9%。主要由于第三方配送量的快速增长,客观上推高了瑞幸的运营成本。 郭谨一对此直言:“短期来看,外卖占比显著提升,的确会对利润率造成一定的负面影响,三季度营业利润率较上个季度略有下滑,也正是由于配送费用率环比有明显提升所导致的。” 他表示,今年外卖渠道的补贴力度在客观上推动了瑞幸订单量和客户数量爆发式增长,随着补贴开始向精细化方向调整,瑞幸在2026年同店增长会遇到挑战和压力。他同时认为,外卖模式不是咖啡的最优解,咖啡业务将回归自提为主的常态。 面对盈利压力,郭谨一透露了明确的成本调控预期:“第四季度现制饮品行业进入淡季,平台补贴力度开始快速收缩,预计未来补贴形式更加精细化”。 业绩会上,郭谨一着重对外卖大战的影响及行业趋势作出了清晰回应,其表态背后暗藏瑞幸的长期战略考量。 正如郭谨一所说,咖啡是个点位驱动的线下生意,这决定了咖啡行业的长期发展仍将以自提为核心,外卖更多是阶段性的补充。此外,外卖的履约成本会直接影响单杯盈利情况,且配送时长也会影响到咖啡的产品口感和即时消费需求。 外卖大战中,瑞幸不算是赢家。想要健康地增长,瑞幸仍要重回线下,发挥规模和供应链的核心优势。 要快速拓店,上市募资有必要 从年初两万家门店,到三季度末的近三万家门店,门店数量增长了35%。像这种快速扩张,瑞幸不是第一次。 2023年,瑞幸开启“带店加盟”模式,一年开出8000多家门店,年内增长几乎100%。用瑞幸董事长黎辉的话,“2025年相对于2023年,并不算极速增长”。 门店扩张一直是瑞幸巩固市场优势的关键。从门店布局来看,瑞幸已形成“高线城市加密+下沉市场渗透+海外试水”的三维布局。 在一线城市,门店密度已达到每平方公里1-2家的水平;在下沉市场,瑞幸依托联营模式快速抢占空白市场;海外市场方面,瑞幸将门店陆续开到新加坡、美国等地区。 瑞幸新加坡门店,图源瑞幸咖啡官方微博 如此扩张节奏,背后是巨大的资金需求,尤其是瑞幸有占比近65%的自营门店。无论是开店成本,还是供应链建设、物流配送等都需要真金白银的资金支持。 需要明确的是,从纳斯达克退市后,场外交易市场(OTC)给了瑞幸在资本市场喘息和缓冲的机会。截至2025年11月13日,瑞幸在OTC市场的股价已攀升至38.08美元,相较于粉单首日收盘价涨幅高达2372%。 这样的资本表现给了瑞幸重回主板的底气,但在美股场外市场交易,流动性有限,远不能满足瑞幸对融资的需求。 对资金的需求直接决定了瑞幸再闯资本市场。重返主板,除了估值与融资渠道考虑外,还有一个更为重要的因素,释放全球化扩张野心。 目前,瑞幸已在新加坡、美国、马来西亚等市场开设了118家门店。对于新加坡市场,郭谨一表示已初步形成较为成熟高效的本地化运营体系;而对美国市场,他则谨慎地表示“仍在早期探索阶段”。 值得关注的是,近期据彭博社报道,瑞幸咖啡大股东大钲资本,正考虑竞购英国咖啡连锁品牌Costa。若能拿下Costa,大钲资本即在欧美主流咖啡市场拿到一张入场券,也被认为是欲与瑞幸协同配合,探索欧美市场。 瑞幸的扩张野心,正遭遇来自行业对手的激烈挑战。当瑞幸将门店开到星巴克大本营时,星巴克在中国市场的资本运作,成为行业关键变量。 11月,星巴克宣布与博裕投资达成战略合作,以约40亿美元的企业价值出让中国业务至多60%股权,保留40%股权及品牌知识产权,新成立的合资企业计划将星巴克在中国的门店规模从目前的8000家拓展至20000家。 这种模式,本质上是通过股权融资获得扩张资金,同时借助本土资本的资源深耕市场,这也让瑞幸上市融资的动作显得更有必要。 国研网报告显示,现制咖啡赛道预计到2025年市场规模将接近1300亿元。除了星巴克,本土咖啡品牌竞争激烈程度也只增不减,库迪、Manner、幸运咖等都在加速拓店。 在这样的竞争格局下,瑞幸若想保持行业领先地位,需要通过资本运作获得充足弹药。当然,除了资金的现实考量,上市更关乎其长期战略的落地和行业地位的巩固。 当年的退市风波,让瑞幸一度元气大伤。此次重返美股主板不仅是融资需求,更是重塑市场信心的关键一步,有望修复其因财务造假受损的资本市场形象。有了资本的背书,瑞幸的竞争优势也有望被再次放大。 从财务造假到自救,瑞幸在压力中调整 “我们彻底完成了历史切割。” 郭谨一直言,瑞幸重塑了求真务实的企业价值观,重新打造了业务战略和发展模式。除了还保留原来的名字外,已经成长蜕变成为一家全新的企业。 从至暗时刻到涅槃重生,瑞幸走了五年。 2020年4月,曾创下18个月就IPO的全球最快上市纪录的瑞幸,主动承认财务造假。两个月后,瑞幸从纳斯达克停牌退市,陷入成立以来的最大危机,不仅面临美国证券交易委员会的调查和巨额罚款,还遭遇投资者集体诉讼、债务违约风险,甚至被外界预判难以存活。 面对绝境,瑞幸启动了一系列彻底的自救行动,首要任务是刮骨疗毒式的内部整改。 在大钲资本的牵头下,瑞幸开启了控制权更迭。原管理层团队退出,由郭谨一领衔的新管理团队接手,并在今年引入大钲资本创始人黎辉担任董事长。 为防止原管理层恶意收购,瑞幸还启动了“毒丸计划”,修改公司章程限制相关股东的股份转让权,巩固了新管理层的控制权。 黎辉在与中国企业家的访谈中谈到,瑞幸重塑了公司的治理机制,从一个家族式的治理和利益机制,转型到现代企业的治理和利益机制。比如在团队激励上,2021年初,瑞幸拿出大约11%的股份作为股权激励池,并且扩大了股权激励的覆盖范围。 这期间,在债务重组方面,瑞幸采用债转股等方式,将巨额债务转化为新投资者的股权,不仅偿还了全部到期债务,还通过大钲资本领投2.5亿美元融资获得营运资金,摆脱了财务危机。 如果说内部整改让瑞幸“活下去”,那商业模式的优化则是让其“东山再起”。 退市后的瑞幸拒绝盲目扩张、疯狂补贴,而是转向效率制胜的精细化运营。运营方面,关闭亏损严重的门店,对效益不佳或客户覆盖重合的门店进行关停并转。开店方面,2021年推出联营模式,2023年推出带店加盟模式。产品方面,瑞幸转向奶咖、果咖等咖啡饮品,推出了生椰拿铁、酱香拿铁等爆款。 图源瑞幸咖啡官网 一系列的调整下,瑞幸从2020年亏损高达55.89亿元,发展到2025年上半年盈利近18亿元,市值超百亿美元。 随着瑞幸经营业绩的持续向好和重新上市进程的推进,资本市场对其回归的预期日益升温。国金证券研报指出,咖啡是优质赛道,中国人均咖啡消费量仍有较大提升潜力,瑞幸作为行业龙头,凭借规模优势、供应链壁垒和数字化能力,有望持续抢占市场份额。 瑞幸这两年野心尽显,但要重新上市并不容易,对有造假前科的企业,资本的审视无疑更加严格,审计、风控、交易等都是不容忽视的挑战。 从投资者信任来看,财务造假的历史污点仍可能影响部分投资者的决策,瑞幸需要通过长期透明的信息披露、稳健的业绩表现和规范的公司治理,逐步修复资本市场信任。 再回到行业本身,除了激烈的市场竞争,成本端咖啡生豆价格处于历史高位,尽管瑞幸签订了长期采购协议,但仍将面临一定的成本压力,可能影响未来盈利表现。 从海外市场拓展来看,瑞幸目前海外门店占比不高,且面临不同国家和地区的市场环境和消费习惯,国际化进程不会一帆风顺,需要持续的资金投入和本地化运营能力建设。 站在当下,瑞幸能否成功上市是一个关键问题,因为,如今的咖啡市场,正在进入新变局,长期的价格战和持续扩张,都需要更多的弹药支撑。
微软前高管彼得·摩尔回忆Xbox 360时代:如何与索尼PS3硬碰硬
IT之家 11 月 19 日消息,据科技媒体 Euro Gamer 今天报道,微软互娱前负责人彼得・摩尔最近回忆起老东家,他认为微软将他从世嘉挖走是因为具有 Dreamcast 主机时代的“实战经历”,能直接和索尼 PS3 正面硬碰硬。 彼得・摩尔表示:“我不是那种自称极客的人,看着没那么严肃、身上也有几个文身,但微软当时给人的形象就是一群衣兜里装着笔、戴着啤酒瓶底厚眼镜的‘书呆子公司’,因此他们需要一些不同风格的人上台,直接向索尼挥拳、展示更强的姿态,还需要与 PlayStation 直接对抗”。 而彼得正是具有这种经验的人,他在加入世嘉前曾多年领导 Reebok(锐步),与体育巨头耐克正面交锋,他对此表示:“市场宛如一片战场,份额总共就是 100%,你要争的就是人心和想法”。 为此彼得决定将 Xbox 这个小品牌与微软整体进行切割,强调品牌形象,他对此解释道:“我虽然不会为身在微软感到羞耻,微软当时的包装、宣传和营销就是在展现那种‘百年老牌’,这种形象与年轻人不符”。 彼得任职四年间推动了 Xbox 360 迅速发展,在前期阶段成功压索尼 PS3 一头,并签下许多历史性的合作协议,例如让 R 星的《GTA4》Xbox 360 版与 PS3 版同步上市,他在发布会上甚至卷起袖子,秀出自己的 GTA4 文身。 不过微软如今的战略已 180 度大转弯,甚至主动让自家游戏拥抱 PS 平台,甚至包括 Xbox 的旗舰 IP《光环》,这显然是对索尼统治力的大让步,也是彼得绝不希望看到的事情。 彼得对此表示,这场战争不一定要争个你死我活,一方领先并不代表另一方完败,如果今年游戏产业的规模是 2000 亿美元(IT之家注:现汇率约合 1.42 万亿元人民币),就算是第二名的公司也能赚到几十亿美元。 随后他进一步解释道:“Xbox 品牌、游戏业务都在给微软提供‘光环效应’,你去看看微软现今的股价就能知道,微软如今的大成功离不开 Xbox 的部分贡献”。
消息称三星正开发两款智能眼镜,预计2026、2027年推出
IT之家 11 月 19 日消息,据科技媒体 Android Authority 今天报道,三星今年正式进军 XR 市场,推出首款产品 Galaxy XR,目前只在韩国、美国两个市场发售,但三星计划在未来几个月内逐步扩展上市区域。 与此同时,三星内部正在开发的两款智能眼镜也逐渐浮出水面,预计将在 2026 年(明年)和 2027 年推出。 据报道,这其中明年推出的智能眼镜型号为 SM-O200P,与 Galaxy XR 头显 SM-I 开头的型号存在本质区别,有消息称这款眼镜将搭载变色镜片,在太阳光照射的情况下会自动变暗,类似太阳镜,回到室内等光照充足的环境则会增强透光率,保持透明。 不过目前的消息还不足以证明这款眼镜具备投射画面的 AR 功能,因此这款眼镜很可能与 Meta 雷朋 AI 眼镜类似,并不具备完整的 AR 显示功能,交互形式将以语音为主。 硬件方面,这款眼镜将配备摄像头,可通过 AI 功能进行物体识别、实时翻译等,支持 Wi-Fi 和蓝牙连接,但并没有移动数据网络连接功能,意味着这款眼镜可能无法脱离手机使用。 根据此前传闻可以得知,明年上市的那款 AI 眼镜应该是无显示屏版本,而具备 AR 抬头显示(IT之家注:HUD)的版本要等到 2027 年才会发布,因此最先上市的那款眼镜在功能、外观上理应与 Meta 雷朋眼镜类似,可实现拍照、录像、听音乐、打电话等功能。 价格方面,现款 Meta 雷朋 AI 眼镜售 379 美元(现汇率约合 2695 元人民币)起,三星理论上不可能跟 Meta 打价格差异战,因此旗下的 AI 眼镜售价预计会与 Meta 类似。
谷歌Nano Banana Pro AI被曝本周上线:4K分辨率、纵横比任调
IT之家 11 月 20 日消息,科技媒体 testingcatalog 昨日(11 月 19 日)发布博文,报道称谷歌计划本周在其 Gemini 平台,面向设计师、营销人员及教育工作者,推出名为 Nano Banana Pro 的创意升级功能。 用户可以通过 Gemini 应用中的“Thinking”模型直接访问该功能。这项升级的核心在于提供强大的布局控制能力,支持用户生成最高 4K 分辨率的图像,并自由设定从 16:9(适用于演示和印刷品)到 9:16(适用于社交媒体帖子)的多种纵横比,确保输出内容直接满足不同发布渠道的规格要求。 提示词:A cinematic, wide-angle view of Istanbul during the golden hour. In the foreground, intricate Ottoman tile patterns on a balcony railing are in sharp focus. In the background, the Hagia Sophia and the Blue Mosque dominate the skyline across the Bosporus, silhouetted against a warm, hazy orange and purple sunset. Seagulls are flying in the distance. Photorealistic, 8k resolution. —ar 2:1 提示词:A professional studio product shot of a futuristic, transparent smart-watch resting on a piece of dark slate. The watch interface is glowing holographic green. Soft dramatic lighting, 8k resolution, macro photography style, shallow depth of field. —ar 4:3 提示词:A vintage travel poster for "MARS COLONY." The main visual is a retro-futuristic biodome on a red landscape. Large, bold Art Deco typography at the top says "VISIT MARS," and smaller text at the bottom says "The Red Planet Awaits You - Est. 2050." Texture of worn paper. —ar 2:3 (上图为优化阅读,经过裁剪,实际比例为 1:1)提示词:A sophisticated, minimalist logo centered on a white background. The word "FRESH" is spelled out using realistic, glistening slices of kiwi and strawberry. High contrast, sharp focus, professional food photography style. —ar 1:1 提示词:A high-resolution, professional infographic map of Europe. The map should be topographical, showing mountain ranges in relief. Clear, sharp text labels should identify major capitals: "Paris", "Berlin", "Rome", "Madrid", and "Warsaw". The ocean should be a deep matte blue, and the land should be in natural earth tones. Clean, modern typography suitable for a textbook. —ar 4:3 新功能的一大突破是引入了“高级文本渲染”技术。该技术大幅提升了图像中文字和拼写的精准度,能够清晰地生成包含复杂文本的海报、菜单、邀请函甚至数据密集型信息图。 提示词:Create a wide infographic titled "How Solar Power Works" with a clean flat design. Include: a sun icon, solar panel diagram, arrows showing energy flow to a house and battery, four numbered steps with short captions, and a comparison bar chart of "Day vs Night usage". —ar 16:9 同时,Nano Banana Pro 还优化了概念设计流程,用户只需上传一张二维草图,即可通过提示词让 Gemini 将其渲染为具有照片级真实感的三维产品图像,便于探索不同材质和光影效果。 提示词:“A clean, 3D isometric visual explainer of a "Smart Home Ecosystem." Show a cross-section of a house with icons connecting different devices: a thermostat, a smart fridge, and security cameras. Use a pastel color palette with soft lighting. —ar 16:9 在图像编辑与合成方面,Nano Banana Pro 也实现了显著增强。它支持用户同时上传多达六张图片进行场景融合或元素提取,极大地丰富了创作的可能性。 IT之家援引博文介绍,其中,“风格迁移”功能可以将参考图像的调色板或整体视觉风格应用到另一张照片上。更具创新性的是“画布引导”功能,允许用户直接在上传的图片上通过涂鸦、画圈或注释等方式下达视觉指令,让 AI 更直观地理解并执行修改意图。 与早前发布的版本相比,Nano Banana Pro 的核心价值在于将多图像合成、高可靠性排版以及纵横比控制等关键功能整合进单一工作流中。这一集成化设计有效减少了创作者在不同专业软件之间来回切换的繁琐操作,显著提升了工作效率。
何同学就拒绝给网约车司机好评道歉:很多客户撤单了
快科技11月20日报道,在《罗永浩的十字路口》第十一期访谈节目中,知名UP主何同学作为嘉宾谈及工作室盈利状况时坦言,今年工作室可能会亏损一两百万元,而亏损的主要原因与自己此前一条微博引发的广泛影响直接相关,该表述随即引发舆论关注。 针对部分网友对“亏损”表述的质疑,@何同学工作室官微 很快作出回应,明确表示亏损并非少赚,而是今年工作室的客观实际。工作室方面解释,团队视频制作成本本就普遍较高,4月微博事件发生后,多个正在制作中的客户项目选择撤单,这是导致亏损的核心原因。“我们完全理解客户的决定,对此深表歉意,这是我们必须接受的教训,也感谢大家的监督。”工作室回应称。 “因为其实客户来投我们其实就是投我这个名字,投我们这个频道。但如果说我们最核心的资产,我们的品牌形象有了很大的问题,那确实是不可能的。但是我对于发这条微博确实我是非常抱歉的。”何同学说。 何同学还表示,自己跟司机师傅打了电话道歉,跟公司员工、客户都道了歉。他表示自己当时写了道歉信但没发,因为“当时确实被吓到了,发微博的时候没想到有这么广泛的多角度地被讨论,当时我非常害怕道歉信发出去再引起新的讨论,但我对这件事情确实非常抱歉。” 回溯争议源头,今年4月11日何同学曾发布一条微博,分享自己应对网约车司机求好评的心态变化:"以前司机让我打好评都会口头答应,下车后却忘了,这样挺不好的;现在除非服务特别好,否则会直接说'抱歉不想打',作为有讨好倾向的人,这是我锻炼真诚和勇气的方式。" 这条微博当时引发大量网友批评,认为其以底层服务者的生存困境为代价“锻炼自我”,本质是一种傲慢的权力霸凌。更具争议的是,有网友翻出今年3月何同学与苹果CEO库克在西湖品茶的互动画面,对比其当时展现的谦逊态度犀利发问:“若真想克服讨好型人格,为何不对库克说'不'?” 此外,还有网友指出何同学过往视频中常呼吁粉丝“一键三连”,而UP主与网约车司机本质上同属服务业,“为何对粉丝的支持需求如此上心,却对司机的合理诉求表现得高高在上?”
谷歌DeepMind CEO哈萨比斯:世界模型是未来,AI泡沫真实存在
IT之家 11 月 20 日消息,在经历由内部员工及首席执行官桑达尔・皮查伊(Sundar Pichai)推动的宣传热潮后,谷歌正式推出了其最新大模型 Gemini 3 Pro。据谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)介绍,该模型的研发目标是打造一款综合性能最强的基础模型,同时弥补前代版本在编程、逻辑推理及数学能力等方面的短板。哈萨比斯在接受采访时表示,Gemini 3 Pro 是“我们所构想的通用人工智能(AGI)系统的关键组成部分”。 谷歌副总裁乔希・伍德沃德(Josh Woodward)在播客节目《Hard Fork》中指出,Gemini 3 在多步骤任务中展现出更强的推理连贯性,能更稳定地维持思维链条;此外,它还可为用户动态生成定制化交互界面,例如互动式教程或嵌入式计算器。用户规模方面,谷歌披露:Gemini 应用月活跃用户已突破 6.5 亿;若计入通过搜索中的“AI 概览”(AI Overviews)功能接触 Gemini 的用户,月活跃人数达 20 亿。为进一步扩大影响力,谷歌宣布:全美高校学生将获赠一年期 Gemini 高级版免费使用权。 尽管 Gemini 3 正全面铺开部署,哈萨比斯的研究重心已转向下一技术前沿 —— 世界模型(World Models)。他表示,自己当前绝大部分研究时间均投入该领域,并援引 SIMA 2(可泛化智能体建模架构)及视频生成模型 Genie 3 等项目作为代表性案例。据其介绍,这些世界模型已在谷歌内部用于机器人及其他智能体的训练,未来将成为实现 AGI 不可或缺的核心组件。 哈萨比斯预测世界模型将迎来一个“ChatGPT 时刻”,但最大的障碍是成本和当前的技术难题。“我们很想让更多人用上 Genie,但它的成本太高了,”哈萨比斯表示,并解释道,“基本上,使用它的用户就相当于在创造另一个它。”他指出,在实现规模化之前,还必须解决诸如“让它的稳定性维持超过一分钟”等挑战。 IT之家注意到,谈及潜在的 AI 泡沫风险,哈萨比斯给出了一种微妙的观点,他明确指出,“私募市场显然存在泡沫”,并举例称,某些尚无实质性产出的初创企业,在种子轮融资阶段即被赋予数百亿美元估值,“这显然不可持续,在我个人看来,甚至缺乏基本逻辑。” 但他强调,此类风险并不适用于谷歌。哈萨比斯回溯了十二年前 DeepMind 并入谷歌时他提出的原始构想:将 AI 研究打造为谷歌产品的“引擎室”(Engine Room)。如今,这一长期战略已显成效,Gemini 深度赋能搜索(Search)、YouTube、云服务(Cloud)等核心业务,迅速实现商业回报。“无论外部环境如何变化,我坚信我们已处于极为有利的位置,终将脱颖而出。”他断言,即便市场泡沫破裂,谷歌也具备应对各种情境的扎实基础。 尽管 Gemini 3 取得显著进展,哈萨比斯仍维持其原有预判:真正的通用人工智能(AGI)实现尚需 5 至 10 年时间。他指出,通往 AGI 仍需“一到两项关键突破”,尤其在模型可靠性、复杂推理能力及长期记忆机制等方面。 哈萨比斯承认,仅靠扩大模型参数量已出现“收益递减”现象,但他强调进展远未停滞,相关投入“依然极具价值”,即便其增长曲线已非指数级跃升。他进一步阐释:“人们听到‘收益递减’,往往误以为是零增长或指数增长的二元对立;其实,存在一个中间态。当前虽不再每代都实现性能翻倍,但仍持续带来显著提升,因此,持续投入不仅合理,更具备极高的投资回报率。我们认为,我们正处在这个阶段。” 与此同时,哈萨比斯亦警示:模型能力的增强(如接入外部工具的“函数调用”能力)亦带来新型风险。他特别强调,在网络安全领域必须“加倍审慎”,严防技术被恶意滥用。
英特尔举办行业解决方案大会,加速具身智能应用落地
凤凰网科技讯 11月20日,在2025英特尔行业解决方案大会上,英特尔集中展示了其基于酷睿™ Ultra平台的新一代边缘AI产品与解决方案,并预告了面向边缘场景的第三代酷睿™ Ultra处理器,该产品计划为具身智能及机器人应用提供更强算力支持。 英特尔副总裁兼中国区软件工程和客户端产品事业部总经理高嵩指出,边缘计算因其丰富的应用场景为人工智能带来新的发展机遇。他表示,英特尔正依托x86系统生态与AI PC领域的技术积累,通过集成度更高的软硬件解决方案,为机器人、智慧教育、交通、智能制造等场景提供算力支持,并与合作伙伴共同推动相关应用的落地。 当前,英特尔酷睿Ultra 200H系列处理器在相同功耗和尺寸限制下,可实现99 TOPS的AI算力,将AI工作负载整合至单颗芯片,有助于降低对独立显卡的依赖,从而优化系统功耗与散热设计。 面向机器人领域,第三代酷睿Ultra处理器基于Intel 18A制程,预计将AI算力提升至近180 TOPS,并增强实时控制与环境适应能力。该处理器采用混合CPU架构,在AI计算性能上较前代提升约1.8倍,同时原生支持时序协调运算(TCC)与时间敏感网络(TSN),适用于工厂、物流及具身智能等高要求场景。 为进一步加速物理AI解决方案的早期开发,英特尔同期发布了机器人AI软件套件与参考主板,支持ROS 2标准、视觉语言模型及多任务并行处理,帮助开发者在单一CPU平台上集成控制与AI功能。 此外,英特尔通过其边缘生态系统,与OEM、ODM、ISV及系统集成商展开合作,目前已认证超过40款边缘AI系统,并提供包括参考应用、示例代码及优化工具在内的开发资源,以促进边缘AI技术的规模化普及。
Gemini 3负责人最新访谈:不做情感陪伴,只做最强生产力工具
作者 林易 编辑 重点君 11月19日,谷歌发布Gemini 3模型。DeepMind首席执行官戴米斯·哈萨比斯(Demis Hassabis)和Gemini团队负责人乔希·伍德沃德(Josh Woodward)联合接受专访。 此次升级,Gemini 3开始具备生成界面(Generative UI)的能力。当用户查询梵高生平时,它能即时构建一个包含图片和时间线的交互式页面;当涉及复杂计算时,它能直接生成一个定制化的房贷计算器。 这种从回答问题向构建应用的跃迁,标志着大模型应用正在跨越单纯的对话框,进入动态软件生成的阶段。 Gemini 3模型推理能力显著增强。根据伍德沃德的说法,前代模型常在第5、6步推理时丢失思路,而 Gemini 3能在复杂的税务规划或长代码调试中维持10到15步的连贯逻辑,大幅提升了在处理复杂任务时的可靠性。 在被称作“人类终极考试”(Humanity's Last Exam)的跨学科博士级难题集考试中,Gemini 3pro的得分从前代Gemini 2.5Pro的21.6%大幅上升至37.5%,远超GPT-5.1的26.5%。在SimpleQA Verified测试中,Gemini 3pro达到了72.1%的准确率,相较GPT-5.1和Claude Sonnet 4.5提升了超1倍,大幅减少此前模型常见的幻觉现象。 此次最具突破性的升级出现在视觉智能领域。Gemini 3 Pro在一项专门针对屏幕理解和UI交互的ScreenSpot-Pro 测试中,取得了72.7%的高分,几乎是GPT-5.1性能的20倍。这意味着AI Agent能够区分按钮、菜单、文本和上下文,而不仅仅是识别图像中的物体,为AI Agent实现更高级的自动化操作电脑提供了基础,大幅提升了模型作为数字工作代理的实用性。 在衡量Web开发能力的WebDev Arena排行榜上,Gemini 3拿下了1487 Elo的高分。伴随Gemini 3发布,谷歌推出了全新的代理开发平台“Google Antigravity”,由Gemini 3作为“智能代理”去调用工具、编写接口、调试Bug,配合Vibe Coding的全新能力,用户只需用自然语言描述需求,模型即可生成功能完整且设计美观的代码。 谷歌在战略定位上表现得极为克制,拒绝了当下热门的情感陪伴领域,将Gemini定义为提升生产力的超级工具。其内部考核指标不是用户粘性或情感依赖,而是今天帮用户完成了多少项任务。在Gemini Agent的早期演示中:模型不仅能理解邮件语境,还能深度接入用户邮箱,自动归类并拟定回复,甚至帮助用户彻底清空收件箱。从单纯助手进化为能够独立工作的智能同事。 以下为访谈实录: 罗兹:凯西,我们今天临时加播一期特别节目,主题是Gemini 3的发布。 牛顿:是的,凯文。这款模型在硅谷AI圈子里期待已久,我们终于要亲手体验真正的成品了。 罗兹:我们之所以打破常规周五发布节奏,专门录制这一期,主要有两个原因。首先,我们获得了与谷歌两位AI核心负责人(DeepMind首席执行官哈萨比斯和Gemini团队副总裁伍德沃德)的专访机会。 其次,Gemini 3的发布引发了业界强烈关注。我们听到多个实验室的内部消息称,这款模型在某些关键领域实现了突破,可能对竞争对手构成实质性威胁。过去两年,谷歌曾被视为追赶者,如今的问题是:他们是否已重返领跑位置? 牛顿:在正式进入访谈之前,我们先简要介绍已知信息。谷歌在发布前举行了闭门简报会,Gemini 3最引人注目的新能力包括:大幅提升的编码与“氛围编码”能力;以及全新的交互界面生成功能。 它不再仅输出文字,而是直接为用户生成定制化的交互界面。例如,用户询问梵高生平时,模型会即时生成一个包含图片、时间线和交互元素的完整学习页面;又如生成百万美元以上房产的按揭计算器。这些功能标志着从“回答问题”向“构建体验”的跃迁。 罗兹:在所有公开基准测试中,Gemini 3均大幅超越Gemini 2.5 Pro。例如,在被称作“人类终极考试”(Humanity's Last Exam)这一跨学科博士级难题集上,前者得分仅21.6%,后者直接提升至37.5%。谷歌的总体表态是:任何你能在ChatGPT、Claude或其他旧版Gemini上完成的任务,在Gemini 3上都能做得更好。 牛顿:他们还展示了Gemini Agent的早期演示:模型可深度接入用户邮箱,理解全部邮件内容,自动归类、拟定回复,甚至帮助用户彻底清空收件箱。 此外,本周起Gemini 3将登陆Gemini App和谷歌搜索的AI Mode;美国大学生将获一年免费高级版访问权限。谷歌反复强调的关键词是“Learn Anything”(学习任何事物),这实际上是将Gemini定位为终极个性化教育工具。 罗兹:德米斯、乔希,欢迎来到《Hard Fork》。两年前,桑达尔·皮查伊(Sundar Pichai)把Bard比作“一辆改装后的本田思域”,在与更强劲对手的赛道上竞速。那么,Gemini 3是一辆什么车? 哈萨比斯:我希望它比本田思域快得多。我不太习惯用汽车来比喻,或许更像一辆专业的拖曳赛车(Drag Racer)。它不是为日常驾驶或环形赛道设计的,它拥有纯粹的、为某一特定目标所凝聚的巨大力量。它代表着我们最顶尖的研究成果与规模化算力的完美结合,目标就是要在智能前沿的这场竞赛中,展现出无与伦比的瞬间爆发力。 罗兹:这很有趣。相比以往所有AI模型,Gemini 3在具体层面上究竟能做什么全新的事情?请给我们一些量化、实际的例子。 伍德沃德:有三点最为突出。第一,在多步推理上,它能同时思考更多步骤,我们将其可靠性提升到了一个全新的层次。前代模型常在进行到第5、6步复杂的逻辑推导时“丢失思路”或产生幻觉,而Gemini 3能可靠地完成10到15步的连贯推理任务,例如复杂税务规划、跨国差旅的整体规划与预订,或是对一个拥有数百万行代码的庞大系统进行全面调试。 其次,它将首次大规模生成全新交互界面。用户需求的不再是简单的文字回答,而是定制化的软件组件。比如你问它:“帮我设计一个可以追踪我所有投资组合的仪表板”,它会实时生成一个交互式的、可操作的仪表盘界面,而不是一堆描述如何制作仪表盘的文字。 第三,我们在编码能力上投入巨大资源,尤其是前端与“氛围编码”,这意味着它可以根据自然语言的提示来生成功能完整、设计优美的用户界面代码。即将推出的Google Antigravity等新产品也将充分展示这一点,模型能够动态地根据上下文改变用户界面的布局和功能。 牛顿:许多人认为,对普通用户而言,“聊天”这一用例已经基本解决。他们甚至想不出什么新问题能让Gemini 3的回答与前代产生质的区别。你如何看待这种看法? 伍德沃德:我理解这种观点。表面上看,基础问答的准确率已经很高。但真正的区别在于可靠性、整合度与信息呈现方式。Gemini 3的回答将更简洁、更有表现力、信息呈现方式更易理解,这是大多数人立刻能感知到的变化。 更重要的是,模型开始与用户其他数据源深度整合,例如与谷歌生态内其他产品联动,真正超越单纯的问答模式,成为用户的“数字化大管家”。它能理解你整个邮箱的语境,从而在起草回复时,不仅回答问题,还能根据你过去的风格、你与收件人的关系来调整语气和内容。 哈萨比斯:我完全同意。它的可靠性、风格与个性都经过精心打磨,更简练、更切中要害。在“氛围编码”等场景已跨越实用性门槛。这是一种从“智能助手”到“智能同事”的转变。我本人计划用它在圣诞假期重拾游戏编程,它现在不仅能写出功能代码,还能在设计初期就提供架构建议。 罗兹:德米斯,你在今年5月接受我们采访时判断AGI仍需5至10年,并可能需要若干重大突破。Gemini 3是否改变了这一时间表? 哈萨比斯:完全没有。它完全符合我们过去两年设定的轨迹。事实上,自Gemini系列启动以来,我们的进步速度已是行业最快。Gemini 3令人惊艳,但仍在预期之内。 距离真正的通用人工智能,仍需在一致性、推理深度、记忆机制以及物理世界建模(如我们正在推进的SIMA与Genie项目)上取得1至2次关键突破。我们现在做的是“系统1思维”(快、直觉式),但要实现AGI,我们必须解锁“系统2思维”(慢、深思熟虑、分析式)。 此外,模型需要具备长期的、选择性的记忆机制,能够回忆和应用数周、数月前的特定互动内容,而非仅仅局限于有限的上下文窗口。因此,5至10年的判断不变。 牛顿:关于模型个性与用户关系,业界正在热议“AI伴侣”。你希望用户与Gemini 3建立何种关系? 伍德沃德:这是一个非常敏感但重要的问题。我们将其定位为“超级工具”而非情感伴侣,核心价值是帮助用户高效完成日常任务,提升生产力。我们内部更关注一个新指标:今天我们帮你完成了多少项任务?这更接近初代谷歌搜索的核心价值——效率。我们认为,将模型推向情感伴侣的定位,既有安全风险,也偏离了谷歌作为信息和工具提供者的核心使命。 罗兹:你们放弃了“情色伴侣”这一病毒式增长机会,是否重大战略失误? 伍德沃德:无可奉告。我们的安全团队对此有严格的规范和指导原则。 罗兹:过去几周,竞争对手明显紧张。你认为谷歌目前在AI竞赛中是否已处于领先? 哈萨比斯:当前环境是史上最激烈的竞争。唯一真正重要的是进步速度,而我们对此非常满意。我们从未失去研究领先地位,现在只是产品落地终于跟上。竞争对手在研究上很优秀,但在规模化分发和垂直整合上,他们无法复制我们的优势。 我们正将Gemini注入Maps、YouTube、Android、搜索、Workspace等数十亿用户产品,这个分发网络和终端数据反馈环是无法逾越的护城河。此外,我们在定制化TPU芯片上的全栈优势,使我们的训练成本和效率远超依赖外部GPU资源的竞争者。 牛顿:关于规模定律与回报递减的争论,你怎么看?有人认为,模型的规模越大,性能提升的边际效益越低。 哈萨比斯:这是一个持续的辩论。我们对Gemini 3相较2.5的提升非常满意,完全符合预期。回报并非像早期那样呈指数级爆炸式增长,但它带来的实用性增量和可靠性提升仍远高于我们的边际成本,仍值得我们全力投入。在抵达AGI所需的1至2次研究突破到来之前,通过最大规模的基础模型持续推动性能,仍然是当前最有效的策略。我们相信,规模定律依然有效。 罗兹:我们是否正处于AI泡沫之中? 哈萨比斯:这是一个过于二元的问题。某些领域(例如数十亿美元种子轮却无实际产品、只讲概念的公司)确实存在泡沫,估值与实际收入不成比例。但谷歌同时拥有短期变现(搜索、Workspace、云TPU)与长期万亿级新赛道(机器人、游戏、药物发现、材料科学等)。 例如,我们的AlphaFold等专业模型正在药物发现领域创造实际价值,这是一个与消费者AI估值无关的万亿级市场。无论短期泡沫是否存在,我们都将胜出:繁荣时抓住机会,收缩时凭借全栈优势和深厚的现金流更具韧性。 牛顿:如果现在是感恩节聚会,有人想转移政治话题,你会建议他们用Gemini 3展示什么功能来惊艳全场? 伍德沃德:我不知道它能不能拯救感恩节,但它能带来欢笑。拿出手机自拍,然后让Gemini 3疯狂编辑照片。 我们Gemini中的图像模型在全球范围内仍然是最强的。你可以即时将家人合影变成任何滑稽的场景、风格或时代背景。绝对能引发全场大笑。随后,当你展示它能如何帮你撰写一封得体的辞职信或生成一个定制化的节日食谱计算器时,他们自然就会探索其他新功能了。
OpenAI深夜双王炸!GPT-5.1 Pro紧急发布,降维打击Gemini 3
编辑:桃子 好困 【新智元导读】今天,是OpenAI的主场,同一天祭出两大杀器——GPT-5.1 Pro和GPT-5.1-Codex-Max。最强编码模型首次采用「压缩」机制,在数百万token上连续编程超24小时。 AI圈一日一更的频率,真的是有点跟不住了.... 前两天,先是Grok 4.1、Gemini 3 Pro发布,今天OpenAI GPT-5.1 Pro也静默登场了! 没有一篇博文,仅有两句话官宣。 众所周知,GPT-5.1主打「情商智商」双强,Pro无疑将这两大优势推向更高层次。 同一天,OpenAI全新王牌代码模型GPT-5.1-Codex-Max,已经在Codex平台正式上线了! 从命名上不难看出,它是基于GPT-5.1搭载,并在软件、工程、数学、研究等智能体任务专门训练。 由此,GPT-5.1-Codex-Max能力更强、反应更快,而且用起来更省token。 新模型是专为「长时间、高强度」的开发任务而设计。 就这么说吧,它能连续自主工作超24小时,一口气处理数百万token,直接交付成果的那种。 这恰恰印证了,Scaling Law还在永续。 这是因为,GPT-5.1-Codex-Max是OpenAI首个「原生支持压缩」机制的模型,可以跨越多个上下文工作。 这下,像项目重构、深度调试、多小时智能体循环这些任务,它都能稳稳接住。 目前,GPT-5.1 Pro已向所有Pro订阅用户推出。 GPT-5.1-Codex-Max已在Codex 中支持CLI、IDE 扩展、云端和代码审查使用,API接口也将很快上线。 2025年临近收官,AI终极对决一触即发,GPT-5.1 Pro与Gemini 3 Pro之间,胜负之手将落于谁家? OpenAI最强编程模型 这次的GPT-5.1-Codex-Max,那可是在「真实战场」上炼出来的! 诸如在PR创建、代码审查、前端开发、问答等工程师常见任务中,全部做过专门训练。 在多项前沿编码评测中,它都轻松超越了OpenAI此前所有模型。 还有在SWE-bench Verified上的评估结果中,GPT-5.1-Codex-Max拿下了77.9%的高分。 GPT-5.1-Codex-Max不仅跑分高,实际体验更是大升级! 它是OpenAI首个可以在Windows环境中运行的模型,训练中还针对Codex CLI协作场景做了优化,更好用了。 思考token暴降30% 不仅如此,GPT-5.1-Codex-Max用起来也更省钱了。 在同样「medium」(中等)推理强度下,它不光表现比GPT-5.1-Codex更好,而且思考过程所用的token量减少约30%。 对于不敏感于延迟的任务,新增的「Extra High」(xhigh)推理强度,可花费更多时间获得优质答案。 不过,日常使用的话,OpenAI还是推荐medium。 token省下来了,这就意味着在实际开发中,成本可以大幅降低,可谓开发者的福音。 下面这些demo中,清晰呈现了GPT-5.1-Codex-Max和GPT-5.1-Codex使用token差异。即便是token减少,前者在前端设计中的功能和颜值都不输以往。 比如,让它们生成一个浏览器应用——即可交互的CartPole强化学习沙盒,需要包括小型策略梯度控制器、指标面板,以及一个SVG网络可视化器。 上:GPT-5.1-Codex-Max;下:GPT-5.1-Codex GPT-5.1-Codex-Max仅用27k思考token完成了任务,而且代码更加精简。 这个demo要求的是,做一个太阳系引力井沙盒,需要可视化物体在2D引力势场中的运动,并支拖动平移视图、环绕观察场景。 上:GPT-5.1-Codex-Max;下:GPT-5.1-Codex GPT-5.1-Codex-Max同样用了更少的token,和更精炼的代码完成了任务。 GPT-5.1-Codex-Max这么强,是因为采用了一套全新机制。 狂跑一天,全是「压缩」 「压缩」机制让GPT-5.1-Codex-Max突破限制,处理那些因上下文太长而原本无法完成的任务。 比如,复杂重构和长时间智能体循环。 它会自动整理历史内容,筛选保留最关键的上下文,从而实现在长时间跨度内连贯性。 在Codex中,当接近上下文上限时,GPT-5.1-Codex-Max会自动执行会话压缩,刷新上下文,并多次重复这一过程直到任务完成。 下面这个案例中,GPT-5.1-Codex-Max正在自主重构Codex CLI的开源仓库。 可以看到,当上下文快满时,它会自动压缩释放空间,从而在不丢失进度情况下完成任务。 视频已经过剪辑和加速处理,以便更清楚地展示过程 内部测试显示,GPT-5.1-Codex-Max能连续自主工作超24小时。 在此期间,可以不断迭代实现、修复测试失败,并最终交付可用成果。 这种长时间、连贯的任务能力,是迈向更通用、更可靠AI系统的通用基石。 在METR评估中,GPT-5.1-Codex-Max长程任务能力,成为了新的SOTA。 在OpenAI内部,已有95%工程师每周都在用Codex,自从引入之后,团队的Pull Request数量提升约70%。 现在,GPT-5.1-Codex-Max搭配着持续升级的CLI、IDE 扩展、云集成与代码审查工具,编程效率直接起飞。 一些网友试用第一手感觉,瞬间惊艳了。 GPT-5.1 Pro上线,首测来了 至于GPT-5.1 Pro,正如开篇所说,OpenAI只是在版本更新日志里写了两段介绍。 虽然官方没有单开一篇博客,但提前拿到内测资格的大佬们,都非常兴奋地在第一时间放出了自己的体验感受。 对于GPT-5.1迭代后的性能,Epoch AI三方评估后称,几乎与GPT-5实力相当。 它们在high(高)推理模式下,能力指数(ECI)得分均151。 杰克森实验室教授、人类免疫学家Derya Unutmaz表示,性能相较之前明显提升了一个档次的GPT-5.0 Pro,是他现在最喜爱的模型。 在下面的例子中,他分别向5.0和5.1 Pro询问了免疫学领域最重要的未解之谜,并要求这两个模型深入浅出地剖析每个问题,以便让没有免疫学学位的人也能理解其重要性。 其中,前两个回复来自GPT-5.1 Pro,接下来的两个较短回复来自GPT-5.0。 可以看到,GPT-5.1 Pro明显更胜一筹,因为它能让没有免疫学背景的人更轻松地理解这些解释,并且清晰地阐明了这些问题的重要性和潜在价值。 对比而言,GPT-5.1 Pro在清晰度和洞察力方面都有质的提升。它的回答在保持深度的同时,内容更完整自洽、更形象生动、也更易于理解。 虽然GPT-5.0的回复在内容上也同样出色,但剖析得不够透彻。 GPT-5.1 Pro GPT-5.0 HyperWrite AI的CEO Matt Shumer也在一篇超级长的体验报告中表示:GPT-5.1 Pro是目前最好的「大脑」,虽然很慢,但深思熟虑。 对于大多数日常工作,Gemini 3更好;毕竟在一个独立的界面中等待10分钟才能得到答案显然并不理想。 但对于任何需要深入思考、规划和研究的任务,以及任何必须一次性做对的事情,GPT-5.1 Pro更好。 长文地址:https://shumer.dev/gpt51proreview 反应较慢,但聪明得离谱 它不仅比大多数人类更擅长推理,而且在处理真正棘手的难题时,也比其他任何模型都要聪明。 预计几天内,就会出现它解决了一些人们认为当今AI系统力所不及的问题的例子。 指令遵循能力是最大的亮点 它真的会严格执行你的要求,而不会跑偏。 对于严肃的编码任务,它给人的感觉不那么像一个「助手」,而更像是一个依据规格说明书工作的外包工程师(哪怕你的规格说明书有点模糊)。 前端和用户体验设计,以及写作,都是弱项 不管是创意写作,还是设计漂亮的UI,Gemini 3都要更胜一筹。 但最大的弱点还是界面 它只能在ChatGPT中使用,无法集成到IDE里,也无法连接到其他工具链中。这一点与GPT-5 Pro如出一辙。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。