EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
豆包“撕裂”AI手机
文 | 定焦One,作者 | 王璐,编辑 | 魏佳 短短十来天,一台仅仅停留在“技术预览版”的豆包手机,搅动了整个AI手机赛道。 在首批工程机上线即被抢空、带动中兴股价涨停之后,这款手机又因“AI外挂”争议、被多个超级APP限制登录、高管连续发声等事件数度反转,迅速成为行业焦点。 严格来说,它并非一款正式意义上的“豆包手机”,更准确的说法是豆包与中兴旗下努比亚联合开发的AI手机“努比亚M153技术预览版工程机”,豆包手机助手作为工具被深度嵌入到操作系统中。也正是因为这种深度接入方式,既让它在真实应用场景中展现出超越传统语音助手的连续操作能力,也引爆了后续的一系列争议。 与争议并行的是它在二手市场的价格不断攀升,原价3499元一台的手机一度被炒到3.6万元,显示出市场在质疑与兴奋之间的撕裂情绪。 它的确功能强大,可以替网友在B站答题、在多邻国打卡以及跨平台比价下单,被网友称赞“像人一样玩手机”。罗永浩评价豆包手机具有开创性意义,周鸿祎预言将冲垮互联网大厂护城河。但它问题也不少,频繁“死机”、任务中断以及隐私担忧等吐槽,让大量用户保持观望。 事实上,大众对于豆包手机的关注已经远超产品本身,它背后是两条AI手机路线的正面碰撞:一条由传统手机厂商为代表,以“软硬一体”为特点的渐进式AI升级;另一条则是由大模型公司主导,通过系统级AI Agent重构移动操作系统的跳跃式路径。豆包手机属于后者,它撕开了行业潜在矛盾,试图打破传统APP封闭边界,触及互联网平台风控逻辑,也对主流手机厂商的生态优势构成压力。 争议还在继续,豆包手机会是昙花一现,还是推动整个AI手机加速重构?在新一轮竞争中,谁最有希望胜出? 手机厂商没做出来的AI手机,豆包做出来了 “AI手机”的概念最早被大规模提及是在2023下半年,三星、谷歌、OPPO、vivo、小米、荣耀等主流手机厂商几乎都在强调“接入大模型”“系统升级为AI OS”,仿佛不提AI就落伍了。 这些AI手机主要包含实时通话翻译、生成会议纪要、AI修图等基础AI功能,以及一些有限的跨应用操作,比如完成点单任务、智能整理文件等。但在热闹背后,更像是给一些旧功能贴上新标签,一度被评价为“概念有余、创新不足”。 豆包手机更加激进,它的跨应用操作不局限于点单,还支持线上购物、订票、学习软件打卡等众多场景,并且它能在操作过程中自主处理弹窗、跳过广告、规避支付陷阱。这种连续自主行为的复杂度高于行业现有能力。 不同AI手机在智能化程度上的差异,主要源于其技术技术路线的不同。Agent领域从业者宵逝向「定焦One」介绍,当前AI手机的实现路线主要分两种。 在2025年前,行业普遍采用的是传统方案,即手机厂商与APP开发者通过SDK接口(软件开发工具包)对接,让AI助手借助开放接口执行任务。但该方案高度依赖APP开放接口,一旦接口变更或未开放,AI将无法执行相应指令。早期语音助手如Siri、小爱同学均属此类。 第二条路线是今年以来各大厂商采用的主要方案,基于GUI Agent(图形用户界面智能体),由大模型直接识别屏幕内容、理解界面结构并模拟人类手势进行点击、滑动和输入。也就是说,大模型不再需要“调用SDK接口”,而是转为“直接识别屏幕并操作”,像用户一样操作手机。但这类方案通常需要获取手机系统级权限,典型代表是豆包手机。 豆包手机在自主操作背单词工具(视频为5倍速) 受访者提供 需要强调的是,GUI Agent并非全新技术,部分AI手机早已使用。比如荣耀MagicOS 9.0的YOYO智能体,通过此路线便可自主完成从打开外卖APP到结算的买咖啡流程。 因此,有从业者认为,豆包手机的技术并未实现突破性创新。网络安全专家曲子龙向「定焦One」指出,豆包手机的技术原理并不复杂,是基于视觉语言模型的方案,通过读取屏幕的权限,利用视觉语言模型识别屏幕内容,再进行指令操作。该方案在行业中已有实践。 不过,尽管技术路径相似,豆包手机在通用任务能力上表现更为突出,显示出一定技术实力。 宵逝在使用豆包手机的过程中发现,它能主动进行信息检索与召回、调用在训练阶段从未见过的的陌生APP,这是其他AI手机难以做到的。 比如,在面对“会议延迟是否影响接孩子”的复杂任务时,豆包可定位公司与学校位置,通过地图类应用查询路程时间,从而给出判断,在这一过程中,用户并没有指定APP,但豆包能自主分析并规划用何种APP操作任务。 相比之下,多数AI手机仍局限于预设场景。以荣耀YOYO为例,它可以完成点咖啡,但面对陌生任务时,会提示无法执行。 简而言之,豆包手机试图构建一个不依赖预设场景的通用智能体,其能力不仅限于执行固定流程的任务(比如代点咖啡),还可应对开放目标(比如规划一次预算内的旅行),这要求它能自主进入不同APP进行浏览、比价与决策。而当前大多数手机厂商的AI功能仍围绕有限场景的自动化展开。 因此,尽管同样基于GUI Agent路线,豆包手机在对面对复杂、开放任务的理解与执行能力时,更接近“真正的智能”,这正是它引发行业震动的根本原因。 大厂“封杀”,AI手机的仗要打起来了 豆包手机的路线展示了技术的可能性,也让冲突走到台前。它的“跨应用连续操作”能力,本质上是在突破现有移动生态的隐性边界,于是很快撞上了互联网巨头的防线。如今,微信、支付宝、淘宝等APP均对其自动化操作采取了技术性“封堵”,有的可登录但不可通过AI操作,有的直接限制登录。 冲突的核心在于,双方对操作权限的判定标准存在差异。 站在APP端的立场,其风控机制会持续监测用户行为特征,一旦察觉非人为操作,便会启动禁止登录的保护机制。微信本次限制豆包AI操作,正是出于这一原因。 曲子龙表示,豆包手机助手调用微信执行任务时,利用的INJECT_EVENTS权限(Android上允许应用向系统模拟用户输入事件的权限),被微信识别到这是一个模拟用户输入的事件,怀疑这不是一个正常操作。检测到异常后,微信将账号的登录状态回收,让用户重新登录。 他表示,在刚买来的努比亚M153上登录微信,本身就是在“非常用设备”下进行敏感操作。微信根据账号信誉值以及敏感操作的风险值判断,无论是注销登录状态亦或者冻结账户,都是一个很正常的风控手段。 但事件的另一方,抖音高管曾公开解释,此类操作本质上是设备持有者授权AI助手代为执行任务,而非外部攻击。 双方的界定差异,正是此次争议的根源。换言之,现有的APP应用强调“真人操作”,而系统级AI助手强调“用户授权下的人机协同”。这种分歧不仅是一个技术判定问题,还可能带来深远影响。它将决定着未来AI手机能否真正具备“系统级智能”,还是会被迫退回到轻量工具。 对于所有试图重新定义AI手机操作系统的玩家而言,这是第一道难题。除权限冲突之外,基于GUI Agent的技术路径,用户体验层也面临三项核心挑战:隐私安全、结果“幻觉”与执行效率。 首先,隐私安全是用户最关心的问题。核心疑虑在于,豆包手机在处理任务时,手机屏幕上的用户信息是否被持续上传至云端?是否存在泄露风险? 图源 / 豆包AI官方微博截图 宵逝指出,AI手机在执行任务时,通常需将当前页面状态等必要信息上传至云端进行推理,但一般不会全程、全量上传屏幕数据。主要原因在于全部上传成本太高,大模型的上下文长度与云端计算开销限制了全程录屏分析的模式。 对于是否会“24小时窥屏”,宵逝通过手机功耗表现进行了侧面验证。 “如果视觉语言模型持续进行全屏分析,手机将迅速发烫、耗电剧增。”但他在使用过程中发现,实际情况并非如此,“在执行任务时,豆包手机会发热,但待机状态时基本正常。”因此他更倾向于“按需触发”,并对特定界面(如悬浮窗)设有访问过滤。 至于当豆包手机遭受外部攻击时,用户是否会面临账号盗用风险,宵逝觉得无需过度紧张。 “AI的每次操作实质是工具调用,开发者通常会在工具层设置风控,保证安全性。比如,在最终支付环节会中断自动流程,弹窗交由用户手动确认。虽然AI的决策或许不可全信,但执行支付等操作的授权代码是明确且受控的。”不过,他也补充,相较本地推理占比更高的传统AI手机方案,依赖云端推理的路径,安全性相对更低。 但这并不是一项无法解决的问题,曲子龙认为,平衡隐私安全的关键在于终端芯片的算力。“当手机芯片算力足够大,所有任务都在本地执行,隐私担忧将得到极大缓解。” 其次是“幻觉”问题,即AI错误理解用户意图或执行错误操作。 比如,有用户在使用豆包手机时发现,AI未能按照自身需求筛选出“热度数据最高”的歌曲。宵逝也有相同感受,他让豆包购买一支普通牙刷,豆包却将此前加购的电动牙刷一并勾选,导致支付环节的金额多了100元。 这类问题短期难以彻底解决,行业共识是,在现有技术条件下,追求大模型给到100%的准确率并不现实。 最后是执行效率。网友们普遍反映,豆包手机在完成跨应用比价、下单的复杂任务时,需要耗时数分钟、远慢于人工操作。 宵逝解释,这主要是因为AI需等待界面元素完全加载稳定后,才能进行识别与下一步操作,而人类用户可以凭经验进行预判和快速交互。 此外,由于主流应用的技术限制,豆包手机在许多高频场景中无法工作,这也极大地限制了其实际可用范围。 豆包手机所面临的这场“封杀”,不是单一产品的功能博弈,而是新旧规则的碰撞。下一步是行业对抗,还是规则重写,仍悬而未决。 AI手机会成为谁的机会? 尽管当前AI手机仍面临不少挑战,但可以肯定的是,这一赛道正成为科技公司争夺AI时代“超级入口”的核心战场。 所谓的“超级入口”,关系着企业在下一轮产业格局中的地位。在传统互联网时代,入口由浏览器、搜索引擎与超级APP主导;在大模型时代,入口将从“用户主动点开”转向让智能体自动代办,用户不再逐个打开应用,只用向智能体提出需求,由智能体实现跨应用操作。谁掌握入口,谁就掌握着用户注意力、数据流动的主导权。新的入口一旦形成,后来者将很难再获得主导权。 过去几年,AI硬件不断出现。例如,AI眼镜或AI耳机在便携和听觉交互上见长,智能汽车提供了独特的空间与算力载体,通用机器人代表着更远的未来,但无论是处理复杂任务、使用场景,还是技术成熟度,这些设备都存在局限,难以承担起入口的角色。 相比之下,手机拥有庞大的用户基数、极高的日常使用频次以及成熟的软硬件生态,具备独特的综合优势,成为AI时代最现实的超级入口载体。 尽管战略地位明确,但当前市场上大多数“AI手机”并未带来颠覆性体验,整体仍处于探索期。 仅靠视觉语言模型实时解析并可操作任意第三方App的GUI Agent路线,尚达不到消费级大规模落地的成熟度,主流厂商对此态度谨慎。豆包手机通过融合多模态大模型与系统级权限的技术路径,又面临技术创新与平台规则、生态兼容和安全边界的冲突。 但豆包手机的出现是一个标志,多位受访者认为,它不仅提升了讨论热度,也迫使各大科技公司重新审视AI手机布局。从各家的能力储备来看,可以划分成几个梯队。 第一梯队是垂直整合能力极强的系统级厂商,主要包括苹果、谷歌、华为、三星。 这四家的核心优势在于,控制着从芯片、操作系统到应用分发平台的完整全栈架构,有能力通过系统更新和开发规范,定义AI与应用交互的新标准,构建一个可控、安全且可持续的底层框架。但较大的组织体量和对生态安全的谨慎态度也使得它们推进步伐相对稳健,短期内不太可能走到最前沿。 第二梯队是拥有大模型与服务生态的软实力企业,比如微软、OpenAI、字节跳动等。 这一类公司在大模型能力和AI算法层面具备核心竞争力,其战略很可能是“以软赋硬”,通过和硬件厂商合作的方式,将自身模型和服务集成到各类设备中,而不是自己做手机。但一方面需要找到合适的合作伙伴,另一方面需要解决操作权限的问题。 第三梯队是具备规模优势与硬件经验的终端制造商,包括小米、OPPO、vivo、荣耀等。 它们在硬件设计、供应链管理和销售渠道上具备优势,最重要的是,对市场需求反应很快,可以快速将AI功能下沉到中端甚至入门级机型,吸引庞大的老用户群体,让AI手机快速普及。 从整个格局看,无论最终胜出者是谁,都必须在开放生态与安全控制之间寻找到新的平衡。这场博弈还远没有停止,手机厂商会继续加码,AI手机的演进速度也将进一步加快。
喜茶关店近700家,70亿聂云宸迎扩张“大考”
雷达财经出品 文|丁禹 编|孟帅 仅仅一年多的时间,曾经的“排队王”喜茶净关闭近700家门店。 据极海品牌监测数据,早在去年下半年,喜茶门店扩张的脚步就已放缓,开店速度明显不及此前。今年初,喜茶更是直接做出暂停加盟申请的决定。 回看喜茶一路走来的发展历程,喜茶曾长期坚持直营模式,公司创始人聂云宸希望以此保持品牌势能。 直到2022年11月,喜茶终于做出战略调整,向加盟商敞开了怀抱。放开加盟后,喜茶的门店数量迅猛增长,从最初的800多家一路飙升至4600余家。 不过,喜茶也不可避免地遭遇了加盟模式所带来的共性挑战。品控难度的加大、服务管理水平的参差不齐等问题逐渐浮现,给喜茶的品牌形象和市场口碑带来了一定的影响。 在如今快速迭代的茶饮市场,与蜜雪冰城、霸王茶姬、古茗等竞争对手相比,喜茶的成长速度已略显滞后。 有分析认为,喜茶未来若想从这个规模达数千亿的茶饮市场中突围,除了回归产品本质,不断提升产品品质和创新能力外,如何妥善处理加盟模式所带来的各种问题,攻下下沉市场,并积极抢占海外市场,都将成为喜茶需要解决的重要课题。 值得一提的是,在10月底公布的《2025胡润百富榜》上,喜茶创始人聂云宸虽然仍以70亿元的身家位列榜单第1022位,但与去年相比排名却下滑268位。 昔日“排队王”,净关店近700家 昔日在新茶饮市场叱咤风云的喜茶,正经历着一场持续的战略收缩。据极海品牌监测数据,截至12月10日,喜茶在全国的门店数量为3917家,较去年10月的4610家净关店693家。 据大河报,有加盟商透露,其早期在热门商圈投资的首家喜茶门店,单店投资总额(含房租、人员等各项成本)超百万,但门店营业额和利润非常可观,排队、代购的场景时时上演。 不过,前述加盟商坦言,其后期又投资开了数家喜茶门店,但其他店铺的投入产出比很差,“所有门店投资加起来,到现在还没有回本”。 回首三年前的2022年11月,长期坚持直营模式的喜茶宣布开放加盟。此后,其门店数量如雨后春笋般迅猛增长,最高时一个月能开店500余家。 仅用不到两年的时间,喜茶就将门店数量从800多家扩充至最高4600余家。 不过,雷达财经注意到,今年2月,喜茶曾发布一封题为《不参与数字游戏与规模内卷,回归用户与品牌》的全员内部信,正式宣布暂停接受事业合伙申请。 彼时,喜茶在内部信中表示,新茶饮行业仍处于早期阶段,行业的“数字游戏”已走到尽头,无意义的价格、营收、规模内卷严重消耗用户对新茶饮的喜爱。 喜茶希望在2025年更极致地执行差异化战略,继续坚持“不做低价内卷”,不玩“数字游戏”;拒绝无意义的门店规模内卷,暂时停止接受事业合伙申请。 同时,喜茶还表示,将以门店体验与品牌内容为核心,强化品牌与用户的深度连接。 而在喜茶宣布暂停加盟申请之前,其开店速度就已放缓。据极海品牌监测数据,2024年8月,喜茶每月新开门店数量仅有两位数。到了当年12月,其单月新开门店数量更是锐减至6家。 如今,喜茶在全国的门店布局正迎来新一轮的严峻“大考”。在近90天的时间里,喜茶仅新开9家门店,但同期关闭的门店数量却多达84家。 600亿喜茶,高端路遇阻 在新茶饮领域,喜茶算是名副其实的资深玩家。早在2012年,喜茶就以“皇茶”之名开始运营,后因无法注册商标,才全面升级为如今的喜茶。 品牌问世后,喜茶曾长期坚持直营模式。谈及早期不考虑加盟模式的原因,喜茶创始人聂云宸曾解释称,如果门店扩张速度超越了品牌的承载能力,会导致品牌势能下降,很多品牌不是死在扩张的速度上,而是死在最后势能不够。 而在早期的新茶饮市场格局中,与当时主打平价路线的CoCo、一点点等品牌有所不同,喜茶精准定位高端茶饮赛道。 根据沙利文发布的《中国新茶饮行业发展白皮书》,2020年,喜茶的平均客单价达到52-56元,远超行业35元的平均客单价水平。 尽管早年定价并不“亲民”,但喜茶仍凭借独特的魅力吸引了众多消费者。彼时,喜茶门店前队伍排长龙、黄牛泛滥是常态。 在消费者的竞相追捧下,资本也纷纷对喜茶进行押宝。天眼查显示,自2016年起,喜茶已连续完成5轮融资,吸引了包括IDG、美团龙珠、红杉资本、高瓴资本、腾讯等在内的众多知名投资机构。 在2021年完成规模达5亿美元的D轮融资后,喜茶的估值甚至飙升至600亿元。 不过,喜茶的高端新茶饮神话,并没能一直延续下去。2022年初,喜茶做出了一个令人意想不到的决策——开启全面价格下调,调价幅度在1至10元不等,单品调价最高达10元,“喜茶告别30元”的话题还一度登上热搜。 对于调价举措,喜茶方面表示,得益于喜茶的品牌势能和规模优势,以及在供应链上的不断积累和在上游的深耕,喜茶有能力在产品配方、用料和品质都不改变的前提下对部分产品的售价进行调整,降价后保持品质不变。 值得注意的是,当时新茶饮行业正在经历供应链涨价潮,喜茶却逆势降价,这让赛道竞争变得更加内卷。 当时,中国食品产业分析师朱丹蓬表示,喜茶依托自身的品牌效应和规模效应,能够在消化成本之后让茶饮更加亲民,消费群体也会更加广泛。“强者更强,弱者更弱的马太效应会进一步凸现。” 不过,时至今日,即便降价后的喜茶,在如今茶饮行业的一众“卷王”面前,价格优势也并不明显。 据极海品牌监测数据,喜茶的客单价高达29元,远高于同类竞品霸王茶姬的19元,更远超靠极致性价比闻名的蜜雪冰城的7元。 在门店规模方面,尽管喜茶此前曾开放加盟,但与在营门店超4万家的“雪王”相比,仍存在明显的差距。 同时,放开加盟模式所带来的品控下滑、服务欠佳等问题,也给喜茶带来一定的困扰。 截至发稿,在黑猫投诉平台上,与喜茶相关的投诉超2200条,其中不乏服务态度差、喝出异物等问题。 有观点认为,喜茶相对较高的客单价,或导致消费者对其的容忍度更低。在这种情况下,喜茶回归产品和品牌,或意在强化品牌形象,保留住现有的消费群体,这或许也是喜茶在年初为加盟模式按下暂停键的原因之一。 身处5000亿赛道,新茶饮玩家如何破局? 据中国新茶饮产业联盟和灼识咨询联合发布的《新茶饮行业白皮书》,受需求端和供给端增长协同驱动,中国现制茶饮全品类终端零售额预计在2028年可达5466亿元,较去年3037亿元的规模增长近八成。 在茶饮市场的细分赛道中,喜茶主要专注于鲜奶茶和其他水果两个细分品类,这也是时下诸多新茶饮品牌争相涌入的两个赛道。 而这两个品类在行业中的份额占比也呈现出积极上升的态势,预计到2028年,较去年将分别提升5个百分点和2个百分点。 有分析认为,新茶饮玩家若想在这片竞争激烈的“红海”中脱颖而出,必须做到内外兼修。 对于各茶饮品牌自身而言,产品始终是核心竞争力所在。唯有在产品上实现多维度创新,才能不断满足消费者日益多样化和个性化的需求,进而提高消费者的复购率。 同时,这种对产品的极致追求,还能倒逼上游原材料产业进行升级,推动整个产业链的协同发展。 在以“直采+高效履约”推动供应链升级后,各家茶饮品牌还需加强与加盟商的互利共赢,并通过标准化运营提升产品和服务稳定性,以数字化赋能产业,实现精细化运营与营销升级。 从外部因素来看,下沉市场和海外市场,有望为国内逐渐趋于饱和的茶饮玩家创造新的增长曲线。 《新茶饮行业白皮书》指出,尽管在茶饮市场中二线及以下城市的市场规模占比超过60%,但与一线城市相比其门店密度仍有较大差距。随着门店密度的提升,二线及以下城市是未来五年增速最快的城市线,预计净新增近30万家门店。 而在海外市场,东南亚等新兴市场的快速增长,已成为全球现制饮品行业加速发展的重要引擎。 在2023年至2028年间,东南亚市场预计在全球主要市场中增速最快,复合年增长率将达到19.8%,其与中国市场合计贡献同期全球现制饮品市场规模增量的近40%。 尽管暂时暂停接受加盟申请,但这并不意味着喜茶放弃了增长潜力巨大的海外市场。据大河财立方,截至8月,喜茶的海外门店总数突破百店大关,过去一年门店数量增长超过6倍。 具体来看,喜茶的海外布局已初具规模,其业务已成功拓展至新加坡、英国、加拿大、澳大利亚、马来西亚、美国、韩国、日本等多个国家。 如今,决心回归产品的喜茶站在了新的发展节点上。未来,它能否在加盟和直营这两种模式之间找到完美的平衡点,顺利开辟出新的增长曲线,重新找回昔日的巅峰状态?雷达财经将持续关注。
离开小冰后,李笛重回大模型牌桌
作者|宋思杭 编辑|苗正卿 虎嗅独家获悉,截至目前,小冰的所有创始团队成员已全部离开公司,而曾担任小冰 CEO 的李笛,也已悄然开启他的下一段创业旅程——一家名为 Nextie 明日新程的新公司。 据了解,Nextie 已于 12 月 7 日在奇绩创坛的支持下成立,并正在启动第二轮融资。对此,虎嗅了解到,最新一轮融资金额预计达到数千万美元,估值暂未确定。 同一天,他带着他的新成果,以第 54 号项目亮相在奇绩创坛 Demo Day 的路演现场。但他并未像多数创业者那样长篇展示产品,也没有给出完整叙述,整场亮相看上去更像一次提前放出的预告。 但就在奇绩路演的几天前,李笛非常激昂地对虎嗅谈及了他做大模型的梦想、初衷,以及在他设想中,大模型应该是什么样子。他对虎嗅呈现出来的是,他正在构建一个完全不同于当前行业叙事的 AI 体系。 外界普遍以为,在经历组织动荡和公司治理风波后,他会选择暂时离开 AI 舞台。但交流中的他并没有表现出任何疲态,反而像是回到了自己长期被搁置的原始命题前。 他提到,Nextie 想做的,不是把小冰继续做下去,而是走小冰没能走完的那条路。“未来也许有一天,会把小冰收回来。”他说得异常平静。 李笛的团队也再次聚拢,目前Nextie创始成员包括小冰联合创始人、前微软首席研发总监曾敏,小冰大模型与算法负责人、前英特尔架构师王文澜,都加入了 Nextie。 与当下的AI创业项目不同,Nextie 并不打算推出一个更大的大模型,也不希望再做一款对话式 AI。在李笛看来,Chatbot 已经成为一种误导:它的底层逻辑——依赖海量知识、依赖超长上下文、依赖单一模型的输出——从一开始就与“真正的智能”并无关联。大模型学习的是知识,但知识本身已经过载;上下文变长,噪音就会变多;让模型读更多文本,并不能让它学会决策。“智能不会来自某一个更大的模型。”他说。 他真正想构建的是一种“认知模型”。这套模型的核心不是知识,而是认知结构;不是让模型掌握更多信息,而是让不同认知体在有限信息下做出更清晰的推理。他将这套体系称之为“群体智能”。 这是一个在当前国内大模型语境下仍然相对陌生的概念:真正能解决复杂问题的,不是一个参数更大的模型,而是一群认知路径不同的智能体,在同一问题下协同工作。在 Nextie 的系统里,每个 agent 都拥有不同的思维方式和任务边界,不再是为了扮演角色,是为了提供真正异构的视角。他们会彼此挑战、互相复审、展示推理链路,最终共同构成一个“认知网络”。 李笛说:“我们做的不是一个更聪明的 AI,而是让一个人拥有一个决策团。毕竟每个人之所以会做错决策,根本上源于认知不够”。 这套理念最终落成了面向 C 端的产品“团子”。它不是一个聊天机器人。在李笛看来,聊天框这种表达方式天然受限,它将思考压缩成线性的问答,既无法容纳多视角,也无法展示推理过程。他认为,未来 AI 的界面应该更像白板、像思维导图,是一种能够并行呈现多种思考路径的空间。“团子”将围绕用户的问题,调动不同智能体共同构建答案。 这种做法在当前行业叙事下显得不合时宜。过去两年,行业几乎形成一个共识:更大参数的模型、更长的上下文、更强的知识覆盖,是通往“更智能”的唯一道路。但在与虎嗅的交流里,李笛明显站在另外一侧。他不断强调“知识背后的认知”,强调“答案背后的过程”和“群体结构”,这些反共识的表达几乎全部指向同一个判断:目前的大模型并没有触及智能的本质。 当前状态下的李笛,似乎并不急于证明什么。现在的他,正在构建的是一个未来可能与人类并行思考,而不是为人类回答问题的系统。而 Nextie,只是这件事的起点。 智能拐点未到达前,反共识路线出现了 如今的大模型行业正走到一个新的临界点。过去三年,情绪与节奏都经历了急转:2023 年是百模大战,企业比拼的是规模、速度与参数堆叠;到了 2024 年,资本开始收紧,模型公司从发布会和测试榜单退回到现实的交付现场;进入 2025 年,行业第一次出现明显的“断层”,有人悄然离场,有人依旧徘徊在商业化入口,而真正跑出稳定路径的公司寥寥无几。 但问题从来不只是商业模式有多难,或者说,与其探讨商业模式的不成功,还不如探讨更本质、更深层的矛盾,即技术本身。 目前行业内的现状是,大模型依靠知识规模获得“智力”,但知识规模与推理能力之间的张力正在被不断放大,即上下文越长,噪音越大;参数越多,模型越难解释;数据越丰富,系统越难以做出稳定决策。现在海内外已经有越来越多公司意识到,“能回答问题”已经不构成竞争力,真正的难关是“能否参与决策”“能否给出结构化推理”。当底层智能还处在半成熟阶段时,商业化自然会呈现反复。 也正因为行业还没完全对,不同的声音才显得格外必要。 共识有时会让赛道看上去整齐划一,但真正值得追问的是:我们是否在用错误的方式想象智能?是否误把知识规模当成能力本身?是否把“大模型的强大”误解为“智能已经足够强大”?这些问题在大模型最繁荣的阶段被忽略。但今天的行业已经开始反思。 在这样的背景下,李笛正在做的事情就显得格外“反共识”。他并未加入算力军备,也未执念于参数规模;在外界聚焦“对齐”“一致性”时,他讨论的是认知结构、视角差异和群体推理。他试图绕开“大模型 = 智能”的主流假设,重新回答一个更基础的问题:如果单体模型无法跨过智能拐点,能否通过另一种结构抵达? 当然,海外已经有团队在探讨另一种结构。而在国内,李笛希望能成为团队另一种结构可能的创业团队。 尽管技术仍处在早期阶段,也难以预见最终形态,但行业本身或许正需要这种“不那么一致”的探索。然而,对李笛来说,这条路并不容易。 他所说的“认知模型”在国内几乎没有先例,这也意味着他必须同时面对三道门槛: 其一是资本市场的接受度。在国内的资本市场环境下,投资人仍然习惯看参数、看速度、看短期可交付,那么是否会有人真正愿意押注一条未经验证的路线?其二是技术成熟度,因为群体智能的结构远比堆叠模型复杂,这也意味着它需要跨越多个尚未成形的技术段落; 第三是 C 端商业模式的压力。目前,国内破亿月活的C端应用仅有两个,都还没有实现成功的商业路径。那么一个全新范式到底如何以消费者能够理解的方式落地,并形成持续价值? 在这些挑战的缝隙里,反共识与坚持之间的张力,显得尤为突出。 野心在前,耐心在后 如果只从外部视角去理解李笛的选择,这条路径确实容易被贴上“折腾”的标签: 刚退出一家成熟体系,又迅速投入一个几乎没有行业共识的方向,没有现成做法,也没有明确参照物。但真正接触下来,我发现了一种与前者截然相反的气质,他非常清楚自己在寻找什么,甚至会让人觉得,他过去几年所有的停顿,都只是这次重新启程的铺垫。 在谈到“群体智能”时,他的表达没有任何渲染或鼓动,不试图把它包装成“下一代 AI”,也不刻意把它放到行业竞争框架中。更多时候,他像是在陈述一个被内部推演无数遍的基本前提:真正的复杂问题,从来不是靠单个模型解决的。和许多创业者热衷于讲“能力提升多少倍”、“推理速度更快”不同,他更在意的始终是三个问题:过程是否透明、认知是否独立、不同视角之间能否真正发生挑战。 当虎嗅问道,不同智能体之间互相debate(争论)的过程,用户能否看到?李笛回答说,这与现在大模型的推理链路不同,群体智能的所有推演、争论与协作都会以各自的方式被呈现,而不是被隐藏在系统内部。 他还举了两个例子,无论是此前引发广泛争议的俞敏洪公开信信、还是西贝的公关危机等等事件,未来当类似事件再次出现时,群体智能或许都能作为辅助系统,为个体和组织提供更清晰的判断依据,帮助人类做出更可控、更聪明的决策。 在他的构想里,这个系统更像一个被抽象后的组织:有人负责提出反驳,有人负责验证细节,有人做结构化整理。每个智能体都有自己的边界、偏置和认知方式,而不是统一模版下的角色扮演。他说这些时语气平静。 在笔者看来,他并不急于确定界面或形态,而是更专注于底层逻辑是否自洽、是否值得沿着这条路径继续往前推。 这种状态同时包含着野心与耐心。野心在于,他试图回答的不是“如何让模型更强”,而是“如何让一个普通用户获得一个团队的智能”;耐心在于,他几乎已经接受这件事不会在短时间内被理解,也不会立刻获得市场验证。有些技术路线确实需要慢慢长出生命力,而不是在商业压力下迅速定型。 在当下的大模型行业,这样的姿态并不常见。
甲骨文退出自研AI芯片赛道,董事长埃里森阐述背后原因
IT之家 12 月 13 日消息,科技媒体 CRN 于 12 月 11 日发布博文,报道称甲骨文(Oracle)董事长拉里・埃里森(Larry Ellison)宣布,公司已出售其持有的芯片设计公司 Ampere Computing 的股份,并从中获利约 27 亿美元(IT之家注:现汇率约合 190.73 亿元人民币)(税前)。 日本投资巨头软银集团(SoftBank Group)于上月斥资 65 亿美元全现金收购了芯片设计公司 Ampere Computing。作为 Ampere 的早期支持者,Oracle 在此次交易中出售了其持有的约 29% 股份,并因此获得了约 27 亿美元的税前收益。 这笔交易不仅让软银在 AI 基础设施领域(如美国的 Stargate 项目)获得了关键筹码,也标志着 Oracle 正式结束了其在通用服务器芯片设计领域的直接投资。 甲骨文(Oracle)董事长拉里・埃里森(Larry Ellison),图源:WikiMedia 在财报电话会议上,埃里森阐述了出售理由。他明确表示,公司不再认为在云数据中心设计、制造和使用自研芯片具有战略价值。 作为替代,Oracle 承诺实施“芯片中立”(Chip Neutrality)政策。Ellison 强调,为了在未来几年应对 AI 技术的剧烈变化,Oracle 必须保持敏捷,虽然公司将继续大规模采购英伟达的 GPU,但也需要具备部署客户所需的任何类型芯片的能力,而不是被绑定在自研架构上。 该媒体指出,Oracle 的这一举措与其主要竞争对手形成了鲜明对比。Microsoft、AWS 和 Google 等超大规模云厂商(Hyperscalers)均在大力组建内部团队,开发专用于自身的定制处理器,旨在降低计算成本并满足 AI 的高算力需求。 相比之下,Oracle 此前通过持有 Ampere 少数股权的方式参与芯片设计,本身就不同于竞争对手的完全自研模式。如今彻底退出股权投资,意味着 Oracle 选择了一条更纯粹的“集成商”路线。 在确立中立策略的同时,Oracle 正加速扩展其硬件合作伙伴网络。除了维持与英伟达的紧密合作外,Oracle 于 10 月宣布与 AMD 达成协议,将推出首个由 AMD Instinct MI450 GPU 驱动的公共 AI 超级集群。 该项目计划于明年第三季度上线,初期规模将达到 50000 个 GPU。这一动作表明,Oracle 正试图通过引入多元化的顶级芯片供应商,来构建更具韧性和性价比的云基础设施。
国家出手:卖车须明码标价 提前告知交付时间
快科技12月13日消息,昨日,国家市场监督管理总局就《汽车行业价格行为合规指南(征求意见稿)》(下称“意见稿”)公开征求意见,明确提出两大核心要求。 一、明码标价规则(第十四条) 核心要求:必须在经营场所显著位置公示完整价格信息,网络销售同样适用。 公示内容: 车辆基本信息:名称、销售价格、计价单位、型号、生产厂商、主要配置、标准参数。 选装配件:名称、价格、规格、产地(如有)。 所有费用明细:严格区分汽车产品价格与销售服务价格,严禁价外加价和收取未标明费用。 公示形式: 线下:标价签、标价牌、电子屏幕、实物展示等 线上:网页显著位置以文字、图像等方式展示,含配送方式、运输费用、支付方式 二、交付时间明确告知(第十四条) 核心要求:无法现场交付时,必须在交易前明确告知消费者确切交付时间,并写入合同。 将交付日期从“大概”“预计”升级为具有法律效力的具体日期。 交付时间必须在合同中明确约定,违反约定需承担违约责任。 此外,《意见稿》还提到了其他核心内容: 1、价格欺诈禁止 禁止误导性标价:不得使用虚假“市场价”、“厂商指导价”等进行宣传。 禁止虚假比较:促销活动必须有真实参照价格,不得虚构原价。 禁止不履行价格承诺:不得对同等交易条件经营者实施价格歧视。 2、促销行为规范 促销规则、期限、限制条件必须显著公示; 赠品信息必须如实标明,不得隐瞒附加条件; 积分、优惠券等抵扣方式必须明确计算方法; 补贴政策必须公示对象、方式、条件、时间。 3、服务收费规范 严禁只收费不服务、重复收费、转嫁收费等行为; 保险、装潢、延保等增值服务必须明码标价且消费者自愿选择。 4、“付费解锁”功能规定 必须明确告知免费期限和后续收费标准; 免费期自车辆交付起计算,结束前需再次提醒。 5、汽车生产企业价格行为规范 建立以生产成本为基础、市场供求为导向的定价策略; 对整车销售、金融服务等环节实行全链条价格管理; 禁止价格串通:不得通过固定价格、约定价格变动幅度等方式替代市场竞争 ; 禁止低价倾销(除清仓处理外,不得低于成本价销售)。 违规处罚 未明码标价:责令改正,处1-3万元罚款; 价外加价:没收违法所得,并处违法所得5倍以下罚款;情节严重的,责令停业整顿或吊销营业执照。 虚假宣传:依照《消费者权益保护法》《反不正当竞争法》处罚,最高可处200万元罚款。
存储疯涨下:戴尔打响PC涨价第一枪 128GB内存上涨1657元
快科技12月13日消息,全球存储疯狂涨价,这对终端厂商的利润挤压无疑是巨大的,而戴尔打响了PC涨价第一枪。 据国外媒体报道称,戴尔已在其内部通知员工,该公司即将对多种产品实施大幅涨价,原因是DRAM芯片短缺。 戴尔内部电子邮件称,预计“商业产品线”将全面涨价,其中包括该公司的笔记本电脑和预装台式电脑。 此次涨价幅度将是该公司有史以来最大的一次,据称,未来笔记本电脑和台式电脑的价格可能会上涨“数百美元”,而且涨价原因不仅限于内存短缺,增加存储容量的成本也将大幅提高。 邮件中显示,戴尔价格上涨情况如下: 配备32GB内存的戴尔 Pro 和 Pro Max 笔记本电脑和台式机价格上涨130美元至230美元; 配备128GB内存的系统价格上涨520美元至765美元(涨幅约合1657元); 配备1TB固态硬盘的配置价格上涨55美元至135美元; 戴尔Pro 55 Plus 4K显示器价格上涨150美元; 配备NVIDIA RTX PRO 500 Blackwell GPU(6GB)的AI笔记本电脑价格上涨66美元; 配备 NVIDIA RTX PRO 500 Blackwell GPU(24GB)的AI笔记本电脑价格上涨530美元; 值得注意的是,戴尔是最大的PC制造商之一,这意味着如果该公司大幅提高价格,联想、宏碁、华硕等其他竞争对手很可能会效仿。
SpaceX确认8000亿美元估值超越OpenAI 2026年IPO
SpaceX 凤凰网科技讯 北京时间12月13日,根据彭博社周五看到的一份公司信息,埃隆·马斯克(Elon Musk)旗下SpaceX已批准了一项内部人士股份出售交易,该交易对公司的估值约为8000亿美元。 SpaceX同时表示,正在为可能于2026年进行的首次公开招股(IPO)做准备。此次上市旨在为处于开发阶段的“星舰”火箭实现“疯狂发射频率”、太空AI数据中心及月球基地建设提供资金。 根据SpaceX CFO布雷特·约翰森(Bret Johnsen)在一份股东备忘录中的说明,此次内部人士股份出售交易在二级市场的交易价为每股421美元,较今年7月获得4000亿美元估值时确定的每股212美元价格增长近一倍。 这一估值超越了OpenAI今年10月创下的5000亿美元估值纪录,使得SpaceX再度成为全球价值最高的非上市公司。 彭博社本周早些时候报道称,SpaceX正在推进其IPO计划,拟通过此项交易筹集远超300亿美元的资金,这将使其成为有史以来规模最大的上市交易。SpaceX正寻求获得约1.5万亿美元的整体估值,接近沙特阿美在2019年创纪录的上市交易中所确立的水平。 约翰森在备忘录中表示,IPO的具体时间及相应估值尚不确定,公司也可能决定不推进该计划。 SpaceX每年进行两次要约收购,为包括员工在内的股东提供出售套现或增持股份的机会。此次SpaceX设定的公允市场估值,可视作明年IPO的前奏。 截至发稿,SpaceX尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
手握近3000亿现金,万亿“宁王”为何还要发百亿债券?
雷达财经出品 文|彭程 编|孟帅 近日,万亿动力电池龙头宁德时代宣布,公司拟注册发行不超过100亿元的债券,引发资本市场关注。 而此次抛出债券发行计划之际,宁德时代的现金储备较为雄厚。截至第三季度末,公司的现金及现金等价物余额达2971.84亿元。 为何手握巨额现金,宁德时代依然要大举发债?对此,公司解释称募集资金将主要用于项目建设、补充营运资金及偿还有息负债等。 有市场人士表示,晴天修屋才能提高安全边际,宁德时代作为重资本投入企业,在企业经营状况良好时融资,可以更低成本获取资金,也有利于提高企业经营安全。 值得注意的是,近来宁德时代动作不断,一方面,公司积极在海内外市场大力投资扩张产能,另一方面,公司与多个供应商签订大额订单。 不过,宁德时代也面临诸多挑战。今年前三季度,公司的综合毛利率有所下滑,从上年同期的28.19%降至25.31%。 另据中国汽车动力电池产业创新联盟数据,今年1-10月,宁德时代的装车量占比较去年同期下降2.61个百分点。 值得一提的是,不久前,宁德时代前“二当家”黄世霖,其拟通过询价转让方式出让1%股份。按11月17日初步确定的询价转让价格计算,此次转让涉及资金171.6亿元。 “宁王”抛大动作:拟发行百亿债券 12月10日晚间,动力电池龙头企业宁德时代发布公告称,公司拟注册发行不超过100亿元(含100亿元)的债券。 宁德时代此次拟发行债券,目的是为满足公司生产经营和业务发展需求,优化债务结构,降低融资成本。 根据公告内容,宁德时代本次发行的债券的期限不超过5年(含5年),可以是单一期限品种,也可以是多种期限品种的组合。 本次发行的方式为在全国银行间债券市场或交易所市场公开发行且由承销机构以余额包销的方式承销,根据公司实际资金需求以及市场环境在注册额度和有效期内可一次或分次择机发行。 发行对象为全国银行间债券市场或交易所市场的投资者(国家法律、法规禁止购买者除外);发行利率将根据发行时市场实际情况确定,以簿记建档的结果最终确定。 至于募集资金,将主要用于项目建设、补充营运资金、偿还有息负债等符合法律、法规及监管规定的用途,并按照发行文件约定使用。 为保证本次债券发行工作能够有序、高效地进行,适时把握发行时机,提高融资效率,宁德时代董事会提请股东会授权公司总经理或其授权人士负责全权办理与本次债券发行工作的相关事宜。 宁德时代董事会战略委员会表示,此次债券发行符合公司生产经营和业务发展需求,有利于优化债务结构,降低融资成本,促进公司各项业务稳健发展,不存在损害公司及全体股东利益的情形。 值得注意的是,此次拟发行百亿债券的背后,宁德时代的现金储备十分雄厚。截至第三季度末,公司的现金及现金等价物余额达2971.84亿元。 扩产能签采购单,“宁王”豪横“砸钱” 雷达财经注意到,宁德时代此前曾表示,为应对客户激增的订单需求,公司正全力推进全球产能建设。公司凭借前瞻性的需求预判,率先进行大规模产能扩建。 在海外产能扩张方面,宁德时代在10月的业绩说明会上透露,匈牙利工厂正按计划推进建设进度,其中一期规划超过30GWh,预计2025年底建成并完成安装调试,二期也在有序推进中。 11月26日,宁德时代和斯泰兰蒂斯集团在西班牙阿拉贡自治区共同投资建设的磷酸铁锂电池工厂举行奠基仪式。 据悉,该项目总投资达41亿欧元(约合人民币336.8亿元),是中国企业在西班牙最大规模的投资之一,并获得3亿欧元(约合人民币24.6亿元)欧盟基金的支持,预计将于2026年底投产,为Stellantis的汽车工厂提供电池。 在国内市场,宁德时代同样动作频频。比如,公司在山东济宁、广东瑞庆、江西宜春、福建厦门、青海、福建宁德等基地均进行扩产,其中山东济宁基地预计2026年新增储能产能超过100GWh。 11月,江苏时代新能源科技有限公司拟在江苏溧阳高新区,投资新建年产能60GWh新能源灯塔工厂产业基地三期项目(即LY9项目),计划总投资不超过100亿元。 天眼查显示,江苏时代新能源科技有限公司由宁德时代全资控股。 在大举进行产能扩张的同时,宁德时代年内还签下了多个采购订单,涉及订单总金额或超千亿。 年初,宁德时代与龙蟠科技签订正极材料年度采购协议,2025年度采购上限设为70亿元。 5月,宁德时代锁定万润新能约132.31万吨磷酸铁锂供应。若以当时市场均价估算,协议总价或超420亿元。 9月,宁德时代又与龙蟠科技控股孙公司锂源(亚太)签署磷酸铁锂正极材料采购合作协议,预计将自2026年第二季度至2031年间合计向宁德时代海外工厂销售15.75万吨符合双方约定规格的磷酸铁锂正极材料,合同总销售金额预计超60亿元。 11月,宁德时代与嘉元科技签订《合作框架协议》。根据协议,宁德时代将在2026年至2028年向嘉元科技采购不低于62.6万吨的负极集流体材料,涉及金额或超660亿元。 此外,宁德时代还在钠离子电池、固态电池、AIDC储能等前沿技术上持续投入。 财报显示,今年前三季度,宁德时代的研发费用为150.68亿元,同比增长15.26%。 值得一提的是,12月4日,宁德时代旗下宁德时代电船科技有限公司在上海海事展期间正式发布“船-岸-云”零碳航运及智慧港航一体化解决方案,并系统性展示了自2017年进入船舶领域以来的阶段性成果与未来布局。 据介绍,这一创新模式可以解决传统多供应商协作的痛点。在船端,集成电池系统、动力系统、智能航行系统等,确保船舶行稳致远。 在岸端,通过充换电网络与“船电分离”模式,彻底解决补能与成本焦虑。 在云端,通过智能管理平台“云帆”和智能航行系统“北辰”,实现船舶的远程监控、调度与优化。 据悉,截至目前,宁德时代已为近900艘各类船舶提供动力解决方案,在该领域的全球市占率约为40%。 毛利率下滑,市场份额微降 业绩层面,相较上年,宁德时代今年前三季度的营收重回正向增长轨道,但9.28%的营收增速与过往动辄两位数甚至三位数的迅猛增长态势相比有所放缓。 与此同时,宁德时代的毛利率指标也从上年同期的28.19%下滑至今年前三季度的25.31%。 从财务负债状况来看,截至第三季度末,宁德时代的资产负债率为61.27%。 截至第三季度末,公司的流动负债达3409.4亿元,其中短期借款为153.14亿元,一年内到期的非流动负债为250.05亿元。 同期,公司的非流动负债为2081.3亿元,其中长期借款784.42亿元、应付债券84.22亿元、长期应付款15.2亿元。 在市场份额方面,尽管宁德时代仍为行业龙头,但其也面临着一定的挑战。 根据中国汽车动力电池产业创新联盟数据,今年1-10月,宁德时代动力电池装车量达246.82GWh,装车量占比为42.79%,较去年同期下降2.61个百分点。 与之形成对比的是,第二梯队的多家电池企业市场份额有所提升。 例如,中创新航、国轩高科、亿纬锂能、欣旺达同期的动力电池装车量分别为40.65GWh、31.85GWh、23.87GWh、19.29GWh,装车量占比较上年分别提升0.15、1.23、0.71、0.29个百分点。 值得一提的是,在宁德时代此番宣布发行百亿债券前不久,公司前“二当家”黄世霖的百亿减持计划同样引发市场关注。 11月14日晚间,宁德时代发布公告称,黄世霖拟通过询价转让方式出让4563.24万股股份,占总股本的1%。 此次转让采用机构投资者定向询价方式,不通过二级市场减持,受让股份需锁定6个月。 根据11月17日询价申购情况,初步确定的本次询价转让价格为376.12元/股。据此计算,此次转让涉及资金171.6亿元。 公告显示,黄世霖此次转让股份,是为了满足自身资金需求。有市场分析认为,黄世霖此次转让股份,可能与其在储能领域的布局有关。 天眼查显示,黄世霖目前是多家公司的股东,其中包括福建集新光储充检技术有限公司、福建集智储能技术有限公司、福建时代星云科技有限公司等多家储能相关企业。 作为宁德时代的联合创始人,黄世霖在公司任职期间长期负责储能战略。 2022年8月黄世霖从公司辞职时,宁德时代方面表示,后续黄世霖将把个人事业放在光储充检的新兴领域,未来可能与公司形成战略协同,共同推动新能源产业的发展。
奥尔特曼:OpenAI GPT-5.2 API上线首日tokens超万亿,且增长迅速
IT之家 12 月 13 日消息,OpenAI 昨日正式发布了其迄今最先进的 AI 模型 GPT-5.2,面向开发者和专业用户,通过 API 向 ChatGPT 付费用户及第三方开发者提供。 今日,OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在 X 上宣布:“GPT-5.2 在上线首日就通过 API 实现了超万亿 Tokens 调用,并且增长迅速!” 这表明 GPT-5.2 在发布初期就获得了广泛的开发者与企业用户使用,反映出市场对新模型的关注程度和使用强度。 IT之家查询 OpenAI 官方资料获悉,GPT-5.2 相比前一版本在多个方面实现了提升,重点体现在: 更强的多步推理与长上下文理解能力,适合深度知识与复杂任务场景; 增强的生产力工具支持,包括更高效的代码生成、试算表制作、报告与演示文稿生成等工作流程; 更高的准确性,在多个专业领域基准测试中取得更好的表现。 OpenAI GPT-5.2 分为三大版本: Instant:强调速度与成本效益,适用于日常查询、基础写作与沟通; Thinking:侧重深度思考与复杂任务处理; Pro:为高级专业与企业级应用设计,提供更高的推理能力与稳定性。 这三大版本将在 ChatGPT 付费套餐(Plus、Pro、Business、Enterprise 等)中逐步推出,确保用户可根据需求选择最适合的模型版本。
迪士尼内部积极拥抱AI:员工能用DisneyGPT,还在开发“贾维斯”智能体
IT之家 12 月 13 日消息,据《商业内幕》今日报道,近几个月来,迪士尼正在内部加快引入 AI 工具,并主动推动员工使用。 一名在迪士尼任职多年的软件工程师表示,管理层已经明确看到了技术趋势。与今年夏天的“相当谨慎”相比,迪士尼对使用 AI 工具的态度发生了明显变化。 目前,迪士尼已向员工开放微软 Copilot 和亚马逊 Q Developer 等 AI 工具。迪士尼还确认,随着与 OpenAI 的合作推进,员工很快将获得企业版 ChatGPT 的使用权限。 在内部应用层面,迪士尼已经推出名为 DisneyGPT 的聊天机器人。多名员工表示,DisneyGPT 主要用于处理公司内部事务,例如提交 IT 工单、查询员工名录或分析项目财务数据。迪士尼在 10 月 2 日向员工介绍该工具时,将其定位为提升效率的“新伙伴”,并在 12 月更新中加入文件上传功能。 DisneyGPT 在设计上融入了浓厚的迪士尼风格,包括冒险式提示语和按想象力、毅力、领导力等主题进行分类的沃尔特・迪士尼语录。员工普遍认为,其核心功能仍接近常规 AI 聊天机器人。 与此同时,迪士尼还在研发一款代号为 Jarvis 的更高级 AI 工具。知情人士表示,Jarvis 以《钢铁侠》中的 J.A.R.V.I.S.为灵感,目标是作为具备智能体能力的助手,代替员工完成具体任务,但目前仍处于早期开发阶段。 IT之家从报道中获悉,一名迪士尼管理人员表示,公司希望员工在工作中更加积极地使用 AI。不过,并非所有员工都对此感到安心,有人担心 AI 可能取代人类岗位并冲击就业稳定。迪士尼内部高层也承认,尽管 AI 被列为重点方向,但 AI 既会出错,也无法替代人类的创造力与个性化判断。 迪士尼在内部文件中强调,公司采用以人为本的 AI 策略,明确将人类视为创意的核心。迪士尼表示,持续引入新技术的目的在于赋能创作者,而不是削弱创作者。 有员工表示,迪士尼押注 AI 并非盲目冒进,而是在试图掌握未来娱乐与技术融合的主动权。
甲骨文暴跌40%,AI过度基建会拖垮巨头吗?
手握巨额AI基建相关订单,已经不足以“保护”一家公司。 甲骨文手握5000亿美元订单,股价从9月巅峰已经一路下跌40%。博通目前积压的AI产品订单约为730亿美元,最新财报发布后股价由涨转跌。 人称“英伟达亲儿子”的CoreWave季度营收十几亿美元,却能在一周内拿下OpenAI和Meta超过360亿美元的订单。过去一个月,该公司股价累计下跌17%。 外界固然担忧它们是否有足够的能力(金钱)满足客户,但同时也担忧客户本身是不是真的“靠谱”。 AI基建的洋葱剥到最后就是那几家:Meta、谷歌母公司Alphabet、微软、亚马逊、苹果、英伟达等几家巨头,再加上OpenAI、Anthropic等明星AI初创公司。 明星创企还很稚嫩,搞基建几乎全得靠外部融资,风险明显。 巨头们本应是定海神针一样的存在——它们财务稳健、现金充沛,正在用数千亿美元的疯狂基建计划填满未来几年。 但站在支出C位的AI带给它们的回报仍属微小,用“老本”滋养新梦想会不会拖垮巨头,全看梦想的兑现够不够及时。 成则皆大欢喜,败则可能满盘皆输。 01 手握“未来”这张牌,甲骨文短短几个月经历了大喜与大悲。 大喜降临时,甲骨文股价单日飙升40%,创始人兼CEO拉里·埃里森短暂超过马斯克成为世界首富。 彼时埃里森高喊:“人工智能就是一切!” 人工智能的确是一切,对于甲骨文来说,是它这波大喜的一切缘由——OpenAI当时和甲骨文达成一笔为期五年、价值3000亿美元的算力采购协议,成为引爆甲骨文股价的火柴。 然而仅仅三个月之后,甲骨文手握更多订单,“魔力”却消失了。 甲骨文最新发布2026财年第二财季(对应2025年9月到11月)财报,营收同比增加14%,公司表示储备订单已经高达5230亿美元。 这个数字,比前一个财季增加了680亿美元。 财报一发,股价当日下跌11%,创下公司1月以来最大单日跌幅。如果从9月的巅峰来看,甲骨文的股价已经一路下跌了40%。 未来的订单,在如今“AI泡沫”的质疑声中,已经从一种美好的希望转变成了沉重的大山。 甲骨文显得颇有些吃力——财报显示,甲骨文的现金流为负100亿美元,季度资本支出(CapEx)高达120亿美元,比分析师的预测高出近37亿美元。 而甲骨文的CFO透露,公司财年支出也上调了150亿美元之多,达到了500亿美元的水平。 市场最大的恐惧就是:甲骨文到底有没有能力搞那么多钱,来支撑这种超大规模的AI基建? 有分析师预测甲骨文需要举债1000亿美元来完成建设。在第二财季,该公司筹集了180亿美元债务,创下科技企业有记录以来最大规模发债之一。 在电话会议上,甲骨文极力为自己辩护,明确反对“需要举债1000亿美元”的预测,称实际上融资额将大幅少于这个数字。玄机在于甲骨文正在采取“客户自带芯片”的合作方式。 也就是说,不是甲骨文买芯片再租给客户,而是客户自己带着芯片来,这在云服务行业简直史无前例。 此外,甲骨文也强调,还有的供应商愿意出租而不是出售芯片给自己,因此甲骨文可以付款、收款同步。 如果真如甲骨文所言,那么其确实能显著降低自身的前期投入,大大拉高回报率。 但是对市场来说,风险并没有消失,而是转移了:从甲骨文身上,转移到了甲骨文的客户身上。Meta或OpenAI等客户自己购买昂贵的GPU,安装在甲骨文的数据中心里。 甲骨文几千亿美元的未来能否兑现,固然取决于其能不能“交货”,但也取决于客户能不能 “交钱”。甲骨文近5000亿美元未交付订单中,约三分之二来自尚未盈利的OpenAI,已知的还有200亿美元来自和Meta的新协议。 相似地手握巨量订单却拿到市场负反馈的还有博通。 博通也发布了新财报,截至11月2日的2025财年第四季度实现核心业绩营收和利润双超预期,AI半导体相关营收同比增长74%。 电话会议上,博通CEO陈福阳表示公司目前积压的AI产品订单约为730亿美元,将在未来六个季度内交付完成。而且他强调这是“最低值”,随着新订单不断涌入,积压规模预计将进一步扩大。 然而,博通拒绝对2026全年AI收入提供明确指引,称客户部署节奏存在不确定性,可能出现季度间波动。 财报发布后,博通股价一度上涨约3%,但随后转跌,盘后跌幅超4%。 和甲骨文的大喜大悲相比,博通只能算是遇到了一点小颠簸,但背后的市场情绪是相似的——对那个大兴AI基建的“未来”,人们不再乐观。 博通的客户同样相对集中,其AI相关订单主要来自于OpenAI、Anthropic、谷歌母公司Alphabet以及Meta等。 02 AI基建这颗洋葱,剥到最后总会看到那几个熟悉的公司——美股七姐妹和OpenAI、Anthropic。 同样在今年备受关注的AI云基础设施初创公司CoreWave,CoreWeave 于今年 3 月上市,是自2021年以来规模最大的科技初创公司 IPO,其股价随后翻了一番多,甚至超过了“七大科技巨头”。 它的客户集中度也极高,基本上靠微软、OpenAI、英伟达和Meta的订单活着。 就在本周一(12月9日),CoreWave再发20亿美元可转换债券,而其此前截至9月底的债务总额已经高达140亿美元。市场担忧加剧,过去一个月其股价已经下跌17%。 还是那句话,市场对AI行业整体有了深层质疑,不仅限于这些AI基建相关的公司能否按照计划提供服务,也包括疯狂做交易的大客户们能否真的兑现账单。 而所有相关方之间复杂的循环交易已经形成了一张紧密又不透明的大网,让一切都更加看不分明。 如果我们按照客户的类型来看,OpenAI和Anthropic这样的初创公司最早引发人们的担忧。 原因很简单,二者都还没有稳定的造血能力,至少对于膨胀的基建计划来说远不足够,它们需要依靠外部融资,不确定性显而易见。 而巨头则更像是游戏场上的风向标与兜底方。 巨头们每年资本支出几千亿美元,其中相当大一部分用于扩建数据中心。它们在2026年的合计资本开支将是美国上市能源行业用于钻探勘探井、开采油气、向加油站运输汽油、运营大型化工厂的总支出的4倍以上。仅亚马逊一家公司,其资本开支就已经超过整个美国能源行业的总和。 和稚嫩的初创公司相比,巨头们显然财大气粗,它们财务稳健、现金流充沛。至少从目前来看,支出还没有超出自己的承受能力。 比如,微软、谷歌、亚马逊三家公司从2023年到今年总共将支出超过6000亿美元,收入预计有7500亿美元。 如果看看它们近期的业绩报告,会发现表现都蛮强劲的,“超预期”已经属于基操,看起来不需要担心,换句话说——大兴AI基建,它们玩得起。 但是细看之下,没有哪一家已经完成了收入结构的根本改变,AI固然已经开始产生回报,但是在总体收入中的占比却往往依旧是配角,却在支出时占据C位。 比如微软,7月底TheCUBE Research就其季度财报给出估算,Azure云的增长中,AI服务贡献了约19%,超过30亿美元,但这在微软总营收中贡献不到十分之一。 谷歌收入中超过一半仍然来自广告和搜索,而亚马逊的电商和广告在营收中的占比也仍超七成。 也就是说,巨头正在用成熟业务滋养AI的未来。 问题就在于,还能滋养多久? 03 巨头们已经开始掀起一场“借债狂潮”。 9月,Meta发行300亿美元债券。Alphabet近期也宣布计划在美国市场发行约175亿美元债券,并在欧洲市场发行价值约35亿美元的债券。 美国银行的数据显示,仅在9月和10月,专注于人工智能的大型科技公司就发行了750亿美元的美国投资级债券,是2015年至2024年间该行业平均每年发行量320亿美元的两倍多。 这些公司的收入增长目前应该能够支撑支出,但要跟上人工智能领域的步伐,最终也需要更多的债务。 《华尔街日报》在一篇分析中犀利地指出:AI正在让巨头变弱。 截至今年第三季度末,微软的现金和短期投资约占总资产的16%,低于2020年的约43%。Alphabet和亚马逊的现金储备也大幅减少。 Alphabet 和亚马逊今年的自由现金流预计将低于去年。虽然微软最近四个季度的自由现金流看起来较上年同期有所增长,但其披露的资本支出没有包括数据中心和计算设备的长期租赁方面的支出。如果将这些支出计入,其自由现金流也会下降。 这一趋势似乎注定会持续下去。 分析师估计,微软明年若计入租赁支出,预计将花费约1590亿美元;亚马逊预计将花费约1450亿美元;Alphabet预计将投入1120亿美元。如果预测成真,这些公司四年内将累计投入1万亿美元,其中大部分将用于人工智能领域。 综合来看,这些变化——现金余额减少、现金流减少、债务增加——正在从根本上改变科技公司的商业模式。 科技行业开始越来越像半导体制造等行业,在后者中,数百亿美元被投入到尖端工厂的建设里,这些工厂需要数年时间才能建成,但回报却需要更长的时间。 在数百个庞大的数据中心部署数千亿美元,AI基建仅仅从执行角度来看,已经有明确的巨大挑战。 数据中心耗电量极大——GPU需要大量电力进行计算——而目前的电网无法应对激增的需求。其次,冷却也是一个问题。GPU运行温度很高,需要大量的淡水来维持设备运转。一些社区已经开始反对建设数据中心,担心会影响供水。 英伟达今年和OpenAI共同公布了规模高达1000亿美元的新协议,OpenAI拟部署10吉瓦的英伟达系统。但是最近英伟达CFO承认,这个计划其实还在意向书阶段,尚未正式签署。 这一方面为热闹的AI基建交易的“可信度”蒙上一层阴影,另一方面也暗示着未来的不确定性。 协议迟迟未能签署的原因尚未公开,而英伟达递交给SEC的文件中“风险因素”的部分可以作为参考。 在文件中,英伟达警告如果客户缩减需求、延迟融资或改变方向,公司可能面临“库存过剩”“取消订单的罚金”或“计提存货跌价与减值”的风险。 此外,“数据中心容量、电力和资本”的可用性是AI系统能否部署的关键,文件称电力基础设施建设是一个“将耗时数年的过程”,会面临“监管、技术和施工方面的挑战”。 就算最终AI基建进展顺利,也不是“成功”的终点。 AI基建最终是服务于AI需求,如果基建已经落地,市场需求却未能实现,那么基础设施利用率不足将会造成巨大的损失。 当然,并不是所有人都紧锁眉头表示担忧,支持者认为这是一场值得一试的豪赌,因为AI需求会以指数级速度增长,而非线性。 分析师阿齐姆·阿扎尔(Azeem Azhar)计算,过去两年人工智能服务的直接收入增长了近九倍。 也就是说,如果这种增长速度持续下去,那么人工智能公司开始创造破纪录的利润只是时间问题。 “我认为那些纠结于这些投资具体融资方式的人思维陈旧。每个人都假设这项技术会以线性速度发展。但人工智能是一项指数级增长的技术。它完全是另一种模式。”阿扎尔说。 但问题就是,AI开始爆发式地带来“利润”的时刻到底会不会来、什么时候来。 说到底,AI基建是否会拖垮巨头,其实是AI市场需求对AI基建的一场追赶,追得上,AI基建“人间值得”,追不上,庞大的数据中心最终就会像一个个“鬼城”。那将是对巨头AI押注不正确的最好证明,也将造成灾难性的后果。
美国视频生成老炮儿,入局世界模型
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 世界模型赛道,又有老面孔新鲜入局! 就在刚刚,Runway发布旗下首个通用世界模型GWM-1。 不止于此,还打包发布了一系列世界模型变体: 模拟真实环境的GWM Worlds; 模拟人物对话的GWM Avatars; 模拟机器人操作的GWM Robotics。 …… 而这些通通都是基于最新版Gen-4.5建立的。 是的!Runway这次还把Gen-4.5来了个大升级。 看来年末大促销的不只有圣诞老人奥特曼,还有好莱坞名导Runway。 话不多说,上实机: 自动播放 世界模型全家桶发布 根据官方介绍,GWM-1是基于Gen-4.5构建的,这是Runway最新的视频生成模型。 但和Gen-4.5有所不同的是,GWM-1采用的是自回归架构,它可以根据之前的记忆内容,进行逐帧预测生成。 另外模型支持实时交互控制,包括调整相机姿态、修改机器人操作指令或音频。 它目前包含三个变体: 1、GWM Worlds:用于实时环境的模拟与探索。 GWM Worlds能够让用户在连贯、有反应的世界中自由移动,而无需手动设计每个空间。 具体来说,用户首先需要为模型提供一个可供参考的静态场景,然后它就会在用户移动过程中,实时生成一个沉浸式、无限且可探索的空间,其中包含几何图形、光照和物理效果。 相比于其它世界模型,普遍只能生成有限长度的帧序列,GWM Worlds不仅能够在智能体移动的同时实时生成新场景,还能保持这些场景元素在长序列移动过程中的空间一致性。 允许用户通过文本提示改变环境的物理规则,例如当提示词要求智能体骑自行车,场景就会被约束在地面上;反之如果提示飞行,模型就会解除重力约束,实现空中自由导航。 这将有助于训练智能体在真实物理世界的行动,GWM Worlds可以快速搭建出一个能让智能体自由探索、犯错和学习的环境。 此外GWM Worlds也可以通过实时生成虚拟环境,为VR沉浸式体验提供支持。 2、GWM Avatars:能够模拟人类对话。 这是一个由音频驱动的交互式视频生成模型,可以模拟自然的人类表情和动作,无论是写实还是风格化角色。 能够渲染出逼真的面部表情、眼部动作、口型与语音同步,以及自然的手势,在长时间交互中也能保持稳定质量。 自动播放 它可以作为生活中的个性化导师,用仿真的互动方式解释复杂概念;也能改变客户服务方式,生成一个永远耐心、随时在线、具有人类表情的数字人,帮助解决用户实际需求。 在面试、谈判等高压场景中,GWM Avatars模拟真实对话,让人们得以在安全环境中练习冲突沟通或演讲示范;而在游戏和互动娱乐领域,也能让NPC变得栩栩如生——做到能倾听、能思考、能对话。 而GWM Avatars即将正式上线,并提供API,供使用者自行集成到自己的产品或服务中。 3、GWM Robotics:用于机器人操作。 GWM Robotics本质上更偏向于学习型模拟器,并非基于固定规则编程,而是通过学习机器人相关数据形成模拟能力。 自动播放 换言之,它是一个在机器人数据上训练的世界模型,会根据机器人动作预测视频序列,主要承担两大任务: 用于策略训练的合成数据增强: 通过GWM Robotics生成合成训练数据,然后从新物体、任务指令和环境变化多个维度扩充现有的机器人数据集。 这些合成数据无需进行昂贵的真实世界数据收集,就能提升已训练策略的泛化能力和鲁棒性。 模拟中的策略评估: 在GWM Robotics里,可直接测试策略模型可行性(如OpenVLA、OpenPi等VLA模型),而无需部署到实体机器人上。 这种方法将比真实世界测试更快、重复性更高,且安全性显著提升,同时还能提供贴合实际的行为评估。 总的来说,GWM Robotics可以有效解决物理硬件的瓶颈问题(成本高、损耗快、场景难复现等),通过模拟环境替代实体硬件场景,可以让训练和评估更高效、更具性价比。 同时还发布了GWM Robotics的Python软件开发工具包(SDK),该SDK支持多视角视频生成和长上下文序列,旨在无缝集成到现代机器人策略模型中。 OMT 除了世界模型,Runway这次还对Gen-4.5进行了升级更新,新增支持原生音频生成和原生音频编辑。 自动播放 比如Gen-4.5现在可以生成逼真的对话、音效和背景音频,把原先的创作内容扩充到更广的故事类型。 在现有音频的编辑上,用户可以根据自己的特定需求以任何方式进行调整。 不仅能用音频生成新视频,还引入了多镜头编辑功能,可以在初始场景中进行任意长度的修改,并实现整段视频的一致变换。
GPT-5.2被曝作弊!偷袭谷歌竟靠拉爆token刷高分,不如Gemini 3
新智元报道 编辑:Aeneas 好困 【新智元导读】GPT-5.2打赢Gemini 3.0 Pro,竟是靠高推理与海量Token「作弊」?网友的这个发现,在AI社区一石激起千层浪。更多网友七嘴八舌表示:GPT-5.2,并没有那么好用! 太戏剧了。 OpenAI昨天刚放出大杀器GPT-5.2,今天就被曝疑似虚假营销? 凌晨的科技圈,被一则爆料点燃—— 一位用户通过精细计算发现了「华点」:OpenAI在最新发布的基准测试中,可能通过调整模型「推理力度」参数,让GPT-5.2在关键评测中使用了远超对手的算力资源。 一句话总结就是:在调整token使用后,GPT-5.2和Gemini 3 Pro在ARC AGI 2上的表现基本相当。 具体来说,问题就出在这几张图上。 可以看到,OpenAI在基准测试中使用了额外的token,至少是Gemini 3.0 Pro的两倍。 这就像两个棋手对弈,一方被允许思考一个小时,另一方却只有十分钟,然后宣布前者获胜。 在这种情况下,结果还公平吗? OpenAI胜过谷歌,其实靠作弊? 昨天的AI圈,都被GPT-5.2吊打Gemini 3.0 Pro的结论所震撼,而前者在ARC AGI 2的精彩表现,则尤为出圈,被AI社区大加赞赏。 但现在,这些结果很可能注了水? 比如在备受关注的ARC AGI 2测试中,GPT-5.2 xhigh版得分52.9%,每个任务消耗约13.5万个token。 按API定价计算,每个任务仅算力成本就高达1.9美元。 相比之下,谷歌Gemini 3.0 Pro以6.7万token取得相似成绩,效率高出整整一倍。 如果我们将算力投入标准化,就会发现两个模型的真实能力几乎并驾齐驱。 如果这一假设普遍成立,那么GPT 5.2在使用token数超过Gemini 3的两倍的情况下,仍然在HLE、MMMU-Pro、Video-MMMU和Frontier Math Tier 4中表现不佳。 在GPQA上,它们也才基本相当。而在Frontier Math Tier 3中,GPT 5.2 xhigh也就比Gemini 3 Pro高出2.7%的成绩。 唯一例外的是GDPVal——一个由OpenAI自己创建的测试集。既当裁判又当运动员,结果的客观性就有待考量了。 Ilya:我早说过了 其实,Ilya在之前的采访中就已经说过,现在的大模型基本都是为了榜单定向优化的,榜单结果的水分都大得很。 业内人士都知道,如今AI基准测试的「军备竞赛」早已超出单纯的技术竞争。各家厂商都在竞相推出自己的评测标准,而这些标准往往有意无意地偏向自家模型。 这么干的也绝不仅仅是OpenAI一家。 在谷歌推出的FACTS Benchmark中,Gemini 2.5 Pro超越GPT-5的结果,也同样得打个问号。 在SWE Bench(软件工程评测)中,情况就更加复杂了。 不同模型在不同编程任务上各有所长,但没有一个模型能在所有任务上全面领先。显然,真实世界的问题远比单一分数复杂。 所以,这次事件就反映出了AI评测的根本困境—— 如果GPT-5.2仅仅是通过消耗更多算力获得了性能提升,那真的能智能进步吗?还是仅仅是「暴力计算」的胜利呢? 对于这次OpenAI的「虚假营销」,网友们也是议论纷纷。 有人表示,如果用户得到的「推理力度」参数是一样的,也用的是同样的token,那OpenAI就不算虚假营销。 但如果测评的和用户使用的根本不是同样的版本,那就是欺骗了。 也有一些人是站在OpenAI这一边的。 他们觉得,即使增加Gemini 3的token数量,它也未必就能赶超GPT-5.2,这一点来说,前者的确落后了。 也有人说,既然模型的价格都是公开的,那就不构成欺骗。 巧了不是,紧接着我们就发现,「货不对板」这个问题的确有人提出来了。 在社区的另一篇帖子中,也有人指出了OpenAI的作弊问题—— 早在GPT-5.1发布时,所有基准测试中用的都是高推理力度(high),然而plus用户却只能使用中等的版本。 而现在的5.2版本中,OpenAI增加了更高的「xhigh」推理力度,所以基准测试中显示的性能,要远远超过ChatGPT付费用户的实际体验。 GPT-5.2的实际体验如何 不看榜单,我们就来看看用户的实际体验究竟如何。 一位网友发帖称,自己对GPT-5.2的第一印象并不是太好。 比如在检查代码时,它的幻觉现象非常严重。 网友本以为GPT-5.2会比5.1好得多,但实际用起来并非如此,它并不能理解他写的函数代码。 另一些网友反馈说,GPT-5.2似乎把成年人当学龄前儿童对待,感觉不像是升级,反而是倒退。 OpenAI的核心用户群体,仍然最想念GPT-4o。 总之,GPT-5.2的实际体验跟基准测试似乎相差很多,保不齐又是一个在红色警报状态下仓促拿出的产品。 被谷歌打得匆匆忙忙、连滚带爬的OpenAI变成今天这个样子,显然不是一朝一夕的事。 OpenAI,变了 毕竟,当一家机构既是「研究AI的人」,又是「靠AI卖故事的人」,它还能诚实地面对那些刺耳的真相吗? 根据Wired的最新调查,OpenAI内部正在经历一场关于「真话权」的剧烈地震。 在面对「AI是否会抢走你的饭碗」这类致命问题时,OpenAI的策略已悄然转变:闭上嘴,专心卖货。 这种为了商业利益而牺牲学术独立性的转向,直接「气跑」了自家的研究员。 「我们成了老板的喉舌」 回望2023年,OpenAI发布的重磅论文《GPTs Are GPTs》,直白地剖析了哪些行业最容易被AI颠覆,并在第二年登上了Science。 那时的他们,还敢于直视「技术性失业」的阴影。 论文地址:https://arxiv.org/abs/2303.10130 Science:https://www.science.org/doi/10.1126/science.adj0998 但到了今年9月,画风突变。 在新任首席经济学家Aaron Chatterji的带领下,OpenAI发布了一份名为《全球用户如何使用ChatGPT》的报告。 从学生写作业到职场人做表,报告事无巨细地描绘了AI的美好图景。 结论毫无悬念地一边倒:AI是生产力的引擎,是经济价值的创造者。 企业用户被引述称,ChatGPT每天能帮他们省下40到60分钟。 报告地址:https://www.nber.org/papers/w34255 对此,一位前员工吐槽道:「这简直是为『AI创造价值』这一命题量身定做的软广,充满了粉饰太平的味道。」 离职信里的「真相」 矛盾的爆发点,是报告作者之一、OpenAI经济研究骨干Tom Cunningham的离职。 过去一年,OpenAI对「负面研究」的审查愈发严苛。 那些探讨AI如何替代入门级白领(如客服、行政)的课题,要么被要求「软化措辞」,要么直接被束之高阁。 忍无可忍的Cunningham在Slack上留下了一封直白的告别信: 我们曾致力于严谨的学术研究,现在却沦为了公司的宣传部门。 他认为,团队不仅失去了研究AI负面影响的自由,反而被迫为公司「贴金」。 Cunningham并非个例。 前政策研究主管Miles Brundage离职时直言,公司「太高调、限制太多」,让他「无法发表真正重要的观点」。 超级对齐团队的William Saunders因不满公司「只顾推新产品、无视用户风险」而愤然出走。 前安全研究员Steven Adler更是公开炮轰ChatGPT可能诱发用户的「精神危机和妄想」。 价值一万亿美元的「沉默」 面对Cunningham的离职,OpenAI高层上演了一出教科书般的危机公关。 首席战略官Jason Kwon在备忘录中回应道: 既然是我们把AI推向了世界,我们就得负责构建解决方案,而不是光盯着问题看。 翻译一下就是:别再发论文论证AI会导致失业了,这不利于带货;多想想怎么夸我们的产品能提效吧。 OpenAI为什么要这么做?答案藏在账本里。 如今的OpenAI早已不是当年的非营利实验室,它正冲刺1万亿美元的惊人估值,并筹备着史上最大规模的IPO。 它拿了微软几百亿美元; 它需要芯片大佬们再投1000亿; 它承诺未来要付给微软2500亿美元买云服务。 在天文数字的利益面前,「诚实」成了最昂贵的奢侈品。 如果你正准备上市,正试图说服全世界拥抱AI,你绝不希望自家的研究员跳出来说:「嘿,根据数据,这波AI可能会让30%的白领失业。」 「岁月静好」的另一边 有趣的是,老对手Anthropic似乎拿到了完全相反的「剧本」。 他们的CEO Dario Amodei甚至公开「唱反调」,警告到2030年AI可能取代一半的入门级白领。 当然,这未必全是出于诚实——很多人解读,这不过是Anthropic为了换取监管红利而刻意贩卖的「焦虑」。 但回看OpenAI,情况更为微妙。 如今掌管其经济研究团队的,是前克林顿顾问、有着「灾难大师」之称的顶级危机公关专家——Chris Lehane。 在这个精心修订的新版本里,AI绝不可能是引发社会动荡的「怪物」,它只会是帮你「每天省下40分钟」的乖巧助手。 至于那些关于失业、动荡和泡沫的尴尬真相? 嘘,为了那1万亿的估值,请保持安静。
OpenAI揭秘:4人团队28天开发安卓版Sora,85%代码由Codex生成
IT之家 12 月 13 日消息,OpenAI 昨天在官网发布博文,揭秘安卓版 Sora 应用如何在 28 天内完成开发。 IT之家在此援引博文,回到 10 月,Sora iOS 版上线后使用量迅速爆发,人们立刻开始源源不断地生成视频,安卓版呼之欲出,但当时 OpenAI 内部只有安卓端 Sora 的原型版本,因此这项开发任务可谓是高风险、时间紧迫。 在这种场景下,一般的互联网公司往往会组建海量工程师组成的开发团队,花费数月时间进行打磨,但在 OpenAI 这种场合中,增加人力反而会无形生出沟通成本、任务切割和集成负担,显著拖慢开发速度。 OpenAI 为此决定组建一支只有 4 人的强力小队,他们从 10 月 8 日开始开发安卓版 Sora,11 月 5 日交付最终成果,全程用时 28 天,期间并没有使用什么“秘密模型”,而是 GPT-5.1-Codex 的早期版本,整个应用代码的 85% 由 Codex 编写,实现了 99.9% 的版本稳定率。 据介绍,Codex 更像是一名刚入职的高级工程师,能够将开发者的更多时间用于指挥和代码审查,不必亲自敲每一行代码。 不过,Codex 并不擅长自行推断未被明确告知的信息,如开发者偏好的架构模式、产品策略、真实用户行为等,并且这名虚拟工程师无法感受应用的实际运行状况,最终只能由真人来进行调试,告诉 AI 滑动是否顺滑、某个流程是否令人困惑。 同时与 Codex 的每一次新对话都像是重新做入职培训,你必须清晰地说出目标、约束条件以及“怎么做事”,这样 Codex 才能最高效地生成代码,而且它在深层架构推断方面也有局限,如果完全让它自己跑就会引入不必要的 ViewModel,或者把逻辑塞进本应属于 Repository 的 UI 层。 从这里可以看出,Codex 的本能是“让代码跑起来”,而非长期整洁性,为此 OpenAI 在整个代码库中大量使用 AGENT.md 文件,用于进行统一指导和实践,让 AI 始终遵循规范写代码。 优点方面,Codex 几乎熟悉所有主流编程语言,使得跨平台迁移变得异常轻松,而且对编写单元测试异常积极,尽管并非每个测试都很“深”,但广覆盖极大减少了回归问题,并且在 CI 失败时还可以直接把日志扔进 Prompt,让它自己给出修复方案。 所以我们可以得出结论:Codex 可以在明确边界的情况下实现高效工作,而人类工程师则可以专注于架构、体验、系统性决策,并负责监督最终质量。
宇树首发人形机器人App Store!复杂动作直接下载
快科技12月13日消息,宇树科技今天宣布了一项重磅功能——首发人形机器人App Store。 这个应用商店内包含用户广场、动作库等内容,用户可以在其中自行下载各项动作和预设,一键get复杂操作。 比如目前公测已经首发了搞笑动作、扭扭舞、李小龙三大预设。 以“李小龙”为例,官方介绍如下: 这个程序是专为发烧级机器人玩家打造的动作控制APP。通过独家的动力学算法与动作捕捉数据,我们将李小龙(Bruce Lee)经典的截拳道(Jeet Kune Do)动作库无缝移植到您的机器人硬件上。 本应用旨在利用宇树G1强大的运动控制能力,高精度还原李小龙的经典武术动作。用户可以轻松地在宇树走跑模式和武术状态之间切换,一键启动或停止武术动作。 根据上的商店页面显示,该动作适用于G1-Edu、G1-Edu+平台,对应机器人型号直接下载安装就能复刻一套复杂的武术动作。 整体来说,就像是大家日常在手机上安装App一样,人形机器人通过应用商店也能解锁各种技能,让大家体验更方便。 未来随着官方的开发,以及其他开发者、用户的分享,将会建立一个庞大的数据库,普通用户可以体验到的内容也能越来越丰富。 而且通过移动端APP就能操作安装,非常便捷。 安装体验流程如下: 打开APP-启动对应机器人型号的APP(Go2/B2/H1等) 连接机器人-确保手机与机器人在同一Wi-Fi网络下 进入动作库-点击「功能」>「动作库」 开始安装-找到已获取的动作,点击右侧「安装」按钮 等待完成-耐心等待下载和安装过程 查看动作-在「本地动作」中确认安装成功
小米17 Ultra下周一官宣!预计12月25日发布
快科技12月13日消息,据博主智慧皮卡丘透露,小米17 Ultra将会在周一正式官宣。 按照惯例,小米旗舰一般会选择周四发布,结合预热节奏来看,发布会可能会在12月25日。 这应该会是年前的第一台第五代骁龙8至尊版影像超大杯新机,也是同平台唯一的一英寸旗舰。 具体规格上,正面回归直屏设计,采用超级像素技术,用低于1.5K的功耗,能获得超越传统2K的清晰度,支持超声波屏幕指纹。 小米17 Ultra外观 内置接近7000mAh电池,支持100W有线快充+80W无线快充,保留IP68防尘防水与超声波指纹。 影像改为三摄,主摄是国产厂商豪威的全新旗舰传感器OV50X,1英寸超级大底,像素尺寸1.6μm,支持双模拟增益(DAG)HDR、动态范围达16EV,提供接近110db的单次曝光HDR。 此外还配备5000万像素超广角(OV50M或三星JN5,支持微距)+2亿像素潜望长焦(三星S5KHPE,推测支持5倍光学变焦)。 AI示意图 值得注意的是,这次的发布会除了小米17 Ultra之外,还有一款重磅产品有望同台登场——小米NAS。 此前曝光的真机显示,这款产品似乎采用了金属外壳、双盘位方案,体积比较小巧。 定位上不会太过极客,主要给消费者普及一下NAS的产品品类,目标是打造出最适合小米米家用户的家庭存储产品,将拉通手机、电视、平板、PC等各个团队,持续打磨手机扩容、AI相册等功能。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。