EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
嫦娥六号月壤中发现罕见陨石撞击残留物,为月球水来源提供新线索
IT之家 10 月 21 日消息,据科技日报报道,我国科研人员在嫦娥六号月壤样品中发现罕见陨石撞击残留物,不仅证实了小行星碎片能够从太阳系外围“长途跋涉”至内太阳系,也为解释月球上水的来源提供了全新线索。相关成果于 10 月 21 日发表在《美国国家科学院院刊》上。 据IT之家了解,陨石被誉为“太阳系的信使”,携带着行星诞生和演化的秘密。然而,由于地球有厚厚的大气层,陨石坠落时大多会被烧毁或磨损,加上地壳运动频繁,陨石留下的痕迹也很难保存。这使得一种富含水分与有机物的珍贵陨石 ——CI 型碳质球粒陨石,在地球上极为罕见。而月球没有大气和地质活动,就像一个完美的“天然档案馆”,能将亿万年来陨石撞击的痕迹清晰地保存下来。 在这项研究中,由中国科学院广州地球化学研究所徐义刚院士和林莽研究员领衔的团队,对嫦娥六号月壤样品进行了系统分析,成功识别出 CI 型碳质球粒陨石的撞击残留碎片。研究发现,这些碎片是该类陨石的母体撞击月表后熔融并快速冷却形成的产物。同时,研究人员还据此建立了一套有效识别地外样品中陨石物质的新方法。论文共同第一作者、中国科学院广州地球化学研究所副研究员王锦团表示,这一发现不仅证实了外太阳系物质可以向内迁移,刷新了以往对太阳系物质运动机制的认识,也为未来月球水资源分布和演化研究提供了新方向。 值得注意的是,CI 型陨石的母体小行星主要分布在外太阳系,通常富含水与有机质等挥发性成分。统计分析显示,这类陨石在月球表面的比例远高于地球,说明过去碳质陨石撞击地月系统的贡献可能被严重低估。研究人员提出,此前在月球样品中检测到的特定特征的水,很可能就源自这类陨石的撞击。
歌尔逃离果链,100亿还不够
逃离果链,歌尔股份是认真的。 10月17日晚间,歌尔股份发布公告称,终止筹划以约104亿港元(现汇率约合94.97亿元人民币)收购联丰商业集团旗下米亚精密科技与昌宏实业100%股权的事项。 公开信息显示,该预案于7月23日首次公布,旨在通过收购增强歌尔公司在精密结构件领域的竞争力,资金来源为自有或自筹资金。 米亚精密、昌宏实业均为苹果手机结构件核心制造商,此项交易一旦成功落地,会进一步巩固歌尔股份在果链中的地位。 纵观歌尔股份近期的一系列资本操作,包括与上海奥来“联姻”、收购英国Micro-LED巨头Plessey等运作,再结合本次“放弃”巩固果链地位的机会。歌尔股份似乎正以VR等光学技术之名,将更多的注意力放到了“逃离果链”的命题上。 只不过,随着苹果开始放弃头显,加大对AI眼镜的投入,会出现一个魔幻的未来场景,就是歌尔股份一通操作之下,在一两年之后,在VR代工等赛道上,自己又撞见了苹果。 曾经在绑定苹果上吃过大亏的歌尔股份,有些无奈。 苹果暴走 苹果,重回巅峰。 10月21日,苹果收涨3.94%,报262.24美元刷历史新高,总市值达3.89万亿美元,超越微软成为美国第二大市值公司,仅次于英伟达。 研究公司Counterpoint报告显示,iPhone 17系列在中国和美国市场的早期销售强劲,销量比iPhone 16系列高出14%,其中iPhone 17基本款在中国销量几乎翻了一番。 在iPhone 17系列正式发售之前,由于此前产品更新迭代幅度不大、AI等功能缺位等原因,舆论场更多还是看衰苹果。 这一次,苹果将iPhone 17的牙膏挤爆,功能拉满,即便iPhone 17基础款都拥有高刷等功能。 截图来源于苹果官网 分析师Mengmeng Zhang表示:iPhone 17基础款对消费者极具吸引力,性价比优势显著,它搭载了性能更强的芯片、升级后的显示屏、更大的存储容量,前置摄像头也有所提升,售价却与去年的iPhone 16保持一致。 一般来说,苹果的业绩暴走会带动整个果链的起飞,无论是股价上的直接刺激,还是加速果链内部的整合。 2020年,蓝思科技以99亿元收购可胜科技(泰州)和可利科技(泰州)100%股权。可胜/可利是苹果MacBook、iPad金属外壳主力供应商,拥有成熟的CNC加工和表面处理技术。 彼时,苹果风头正盛,据CINNO Research监测数据显示,2020年全年的中国市场智能机销量约3.05亿部,同比大幅下降21%,销量表现略低于预期,主要因国内疫情及多重市场因素叠加影响。但苹果销量实现了3870万部的销量,同比增长13%,销量在Top5品牌中同比唯一正增长,市场份额为12.7%,同比增长3.8个百分点。 就在那个时候,苹果开启了收割全球市场的模式。数据显示,2020年苹果利润574.11亿美元,2021年为946.8亿美元,2022年是998.03亿美元,2023年是969.95亿美元,均是全球第一。 有分析人士指出,类似苹果这种上游的大腿处于业绩暴涨的时刻,下游的供应商自然希望实现快速整合,抱团去拿到更大的订单,携手“做大做强”,极少出现“谈不拢”的情况。 故当歌尔股份宣布终止交易的时候,让外界颇感意外,自消息宣布后已经连续3个交易日下跌,区间累计跌幅8.98%,直到10月21日才有所回暖。 主动跳船? 关于绑定苹果,歌尔股份是有心理阴影的。 2022年,歌尔被踢出AirPods Pro 2供应链的事件,不仅让其股价蒸发数百亿元人民币,更是导致2023年的全年业绩不佳。 根据歌尔股份在2023年全年财报数据显示,在报告期内,公司实现营业收入985.74亿元,同比下降6.03%;归属于上市公司股东的净利润为10.88亿元,同比下降37.8%;扣非净利润8.6亿元,同比下降47.16%。 相比其他果链企业,歌尔股份在AR领域的积累,或许能缓解果链企业的焦虑。在上一波VR浪潮中,歌尔股份就是一款名为Oculus Quest 2的VR头显的核心供应商,随后,歌尔股份又成为索尼、Pico等众多VR龙头厂商的核心/独家代工厂,据中泰证券研报披露,截至2021年歌尔在高端VR/AR整机代工领域中市占率接近80%。 Oculus Quest 2产品宣传图 在某种程度上,正是歌尔股份在高端VR/AR整机代工领域的订单,才没有让踢出果链的事件进一步恶化。 后来,歌尔股份虽恢复了在果链中的地位,拿到了相应的订单,但降低对苹果的依赖,已经被公司提上了日程。 据2024年年报显示,歌尔股份正在推进的9个研发项目中,至少有4项与AR、AI眼镜相关。 今年9月,歌尔股份正推进子公司歌尔光学对上海奥来的股权收购。根据后续披露方案显示,歌尔光学拟通过定向增资扩股方式,以5.3亿元注册资本取得上海奥来100%股权。 交易完成后,歌尔光学将持有上海奥来100%股权,歌尔股份对歌尔光学的持股比例由56.6560%降至37.7707%。此举旨在补强晶圆级微纳光学器件领域竞争力,支持AI智能眼镜、AR增强现实等业务发展。 歌尔股份称,本次交易可实现歌尔光学与上海奥来优势互补,显著增强在光波导等领域的竞争优势,同时缓解资金压力,加快形成成熟产能,抢占市场先机。 8月8日晚间,歌尔股份以重金1亿美元(7.1842亿元人民币),透过子公司跨境投资英国Micro-LED巨头Plessey。Micro-LED,被普遍认为是下一代显示技术的终极方案,也是通往消费级AR眼镜必须攻克的技术高地。 几乎就在歌尔股份终止那项收购的同一时间点,上海市浦东新区人民政府官网发布了关于歌尔国际创新中心项目设计方案规划的公告。 公告明确,该项目由歌尔集团旗下上市公司歌尔股份的子公司——上海歌尔科技发展有限公司负责建设实施。 AR与苹果,这一进一退的操作。或许已经表明歌尔股份的真实态度。 又撞见苹果 2025年,几乎成了果链企业的“资本运作年”。 包括歌尔在内的众多果链巨头们,都在频频进行资本操作。 歌尔股份旗下歌尔微电子正在冲刺港股IPO。该公司于今年7月向港交所递交上市申请,为年内第二次递表,中金公司、中信建投国际、招银国际及瑞银集团担任联席保荐人。 招股说明书显示,2022年至2025年前三个月,歌尔微电子收入分别为31.21亿元、30.01亿元、45.36亿元、11.20亿元;同期年内利润为3.26亿元、2.89亿元、3.09亿元、1.16亿元。 8月18日,立讯精密正式向港交所递交上市申请,计划融资超过10亿美元。招股书中明确提到,募资的用途之一,是“投资上下游行业或相关产业的优质目标”。 就在递表之前,立讯已经展开了一系列令人眼花缭乱的并购:3月,以43.89亿元收购闻泰科技的ODM业务,从纯粹的“代工”向上游的产品集成拓展;更早前,还斥资5.25亿欧元,收购了德国百年汽车线束制造商莱尼。 7月9日,蓝思科技正式在香港挂牌交易,集资47.68亿港元。 上述果链企业都在利用香港这个国际资本平台,来寻找苹果之外的“第二曲线”,汽车电子、通信与数据中心、AR,但凡能想得到的领域,都是它们试图转型的新通路。 以立讯精密为例,至少在业务构成上,这家共计正在开拓与苹果关联度较低的领域。立讯精密的财报显示,其汽车电子、通信与数据中心业务线的收入,复合年增长率分别高达49.6%和19.6%。 相比之下,歌尔股份面子上是在加码AR等光学技术来远离苹果,但里子上存在又绕回果链的可能性。 跟踪报道苹果多年,且在苹果公司内部人脉甚广的彭博社马克・古尔曼在近期爆料称,苹果正将研发重心从Apple Vision Pro转移至智能眼镜赛道,甚至暂停了轻量版头显开发并调配核心团队资源,其首款产品Apple Glass计划于2026年发布、2027年正式发售。 兜兜转转之后,歌尔股份在AR的赛道上,又撞见了苹果。毕竟,苹果的头显产品,就是歌尔股份在代工。 况且,苹果实在是“给得太多”。 有苹果供应商高管曾透露,尽管苹果订单的利润不一定是最高的,但一定会给供应商提供合理的利润,不会出现压榨供应链导致产品品质降低的情况。同时,在业内看来,苹果订单是相对稳定的收入来源,其他“非果链”供应商压力更大。 此外,苹果对供应链的管理、创新能力,以及进入“果链”的行业标杆效应、资本市场认可等,都能带来订单以外的收获。 只不过,苹果很难接受供应商以“方案提供商”的身份介入其中,而歌尔股份的各类资本操作,就是奔着成为方案提供商去的。 一个不想被下游供应商裹挟,另一个不想继续被上游拿捏。VR/AR代工领域市占率超70%,AI眼镜代工份额预计达60%以上,这是歌尔股份未来与苹果博弈的底气。 但苹果向来擅长扶植供应商,在同一个环节,苹果通常找两家以上供应商合作,即使其中一家可能规模小,苹果在前期提供技术并给予一定量的订单,快速形成规模,从而对赛道内的龙头形成制衡。 在某种程度上,京东方在OLED面板的崛起,除了自身不断攻克技术难关,也跟苹果有意识地在遏制三星一家独大脱不了干系。 可以遇见,未来的AR供应链领域,少不了一场苹果与歌尔股份的博弈。
500亿光伏龙头遭高管减持,“博导富豪”身家较高点下跌近百亿
雷达财经出品 文|彭程 编|孟帅 光伏设备龙头企业晶盛机电,近期再现高管减持动作。 10月16日,晶盛机电发布公告称,公司多位董事或高管计划减持公司股份合计不超过277.62万股。以晶盛机电当天40.82元/股的收盘价估算,此次减持计划涉及金额高达约1.13亿元。 雷达财经梳理发现,此番并非是晶盛机电高管首次减持。早在2019年9月,晶盛机电就曾发布《关于部分董事、高级管理人员减持股份的预披露公告》。截至2020年4月28日,朱亮、张俊、傅林坚、陆晓雯、石刚合计减持公司股份241.68万股。 此番高管减持之际,晶盛机电的业绩正持续承压。继去年跌至2014年以来首次营收、归母净利润双降的业绩低谷后,公司业绩颓势仍未扭转。今年上半年,公司营收同比下降42.85%,归母净利润更是同比大幅下滑69.52%。 对于业绩下滑的原因,晶盛机电坦言,受光伏行业周期性调整影响,公司光伏设备和材料收入及盈利同比下滑。 在光伏业务承压的情况下,晶盛机电正积极布局半导体业务,以寻求新的增长突破口。10月16日,晶盛机电在投资者互动平台回应与半导体设备厂商新凯来的合作关系时表示,新凯来是公司全资子公司晶鸿精密的半导体精密零部件客户。 当前,在行业周期性调整的大背景下,作为国内光伏设备领域的龙头企业,晶盛机电正经历着转型阵痛。而这一困境也直接传导至公司实控人层面,邱敏秀与曹建伟的财富规模均受到显著冲击。 据《新财富杂志500创富榜》,2022年曾以166.1亿元财富登榜的邱敏秀家族,今年财富已缩水至76.1亿元;而2022年身家达140.4亿元的曹建伟,则直接在今年跌出了这一榜单。 晶盛机电抛减持计划,多位高管拟合计减持超亿元 10月16日,晶盛机电发布《关于董事及高级管理人员减持股份预披露公告》。 公告显示,公司董事及高管朱亮,高管傅林坚、张俊、陆晓雯、石刚计划在2025年11月8日至2026年2月7日期间,以集中竞价或大宗交易方式减持公司股份合计不超过277.62万股,占公司剔除回购专用账户股份后的总股本比例为0.21%。 根据公告披露,此次高管减持的股份来源为公司首次公开发行前已发行的股份及股权激励获得的股份,减持原因均为个人资金需求。 若按照公告发布当日40.82元/股的收盘价计算,此次减持计划涉及金额约1.13亿元。 值得注意的是,这并非晶盛机电高管首次减持。早在2019年9月30日,晶盛机电就曾发布公告称,公司实际控制人的一致行动人、董事、总裁何俊,董事、副总裁毛全林、朱亮,副总裁张俊、傅林坚、陆晓雯、石刚,计划自公告之日起十五个交易日后的六个月内以集中竞价交易、大宗交易方式减持公司股份合计不超过785.4万股,占公司总股本的0.61%。 时间转眼来到2020年4月,晶盛机电披露了前述减持计划的进展。截至2020年4月28日,本次减持计划期限已届满,何俊、毛全林未实施减持,朱亮、张俊、傅林坚、陆晓雯、石刚合计减持公司股份241.68万股。 此番高管减持动作引发关注之际,晶盛机电的业绩表现同样备受瞩目。 财报显示,2024年,晶盛机电实现营收175.77亿元,同比下降2.26%;归母净利润25.1亿元,同比下降44.93%。而这是自2014年以来,公司年度业绩首次出现营收、归母净利润双降的情况。 进入2025年,晶盛机电的业绩颓势并未得到扭转,反而延续了上一年的不佳态势。上半年,公司实现营收57.99亿元,同比下降42.85%;归母净利润6.39亿元,同比下降69.52%。 对于业绩下滑的原因,晶盛机电在特定对象调研活动上表示,受光伏行业周期性调整影响,公司光伏设备和材料收入及盈利同比下滑。 晶盛机电的这一解释,与整个光伏行业的发展状况相符。当前,光伏产业链各环节均呈现出“产能过剩”的情况。 中国光伏行业协会统计数据显示,截至2024年末,国内硅料、硅片、电池、组件四大主产业链产能均突破1100GW,而2025年全球光伏市场乐观需求量仅为600GW。 供需关系失衡,导致光伏产品价格持续承压,行业整体产能利用率处于低位,部分企业甚至被迫进入半停产状态。作为光伏设备领域的龙头企业,晶盛机电自然也不可避免地受到了行业周期性调整的影响。 晶盛机电光伏业务承压,大力推进半导体业务 在光伏业务承压的背景下,晶盛机电正积极布局半导体业务,以寻求新的增长点。 财报显示,截至上半年末,晶盛机电的产品涵盖半导体装备、半导体衬底材料、半导体耗材及零部件领域。 雷达财经了解到,在半导体装备板块,晶盛机电目前已取得重要进展。其中,在集成电路装备领域,公司自主研发的12英寸常压硅外延设备顺利交付国内头部客户,其电阻率、厚度均匀性等关键指标达到国际先进水平。 在化合物半导体装备领域,公司紧抓碳化硅产业链向8英寸转移的行业发展趋势,加强8英寸碳化硅外延设备以及6-8英寸碳化硅减薄设备的市场推广。 在新能源光伏装备领域,公司持续加强研发技术创新,在产品技术和工艺、自动化和智能化以及先进制造模式等领域持续进行创新,以创新产品为下游客户提效。 在半导体衬底材料领域,公司蓝宝石衬底材料技术和规模全球领先;6-8英寸碳化硅衬底材料技术及规模处于国内前列,量产的6-8英寸碳化硅衬底核心参数指标达到行业一流水平。 在半导体耗材及零部件领域,公司半导体用石英坩埚技术和规模国内领先,半导体大尺寸合成石英坩埚实现国产替代;光伏石英坩埚技术和规模全球领先;大型真空腔体、大型高精密框架、精密传动主轴、磁流体、真空阀门等半导体精密零部件加工能力与量产规模处于国内前列。 截至上半年,晶盛机电及下属子公司共拥有有效专利1158项,其中发明专利300项(含国际专利15项),研发实力雄厚。 半年报显示,截至上半年末,晶盛机电未完成集成电路及化合物半导体装备合同超37亿元(含税)。 虽然公司尚未在财报中披露半导体设备业务的具体营收数据,但据公司相关人员表示,近两年主营业务营收中,光伏业务的占比在下降,半导体业务的占比在提升。 对于晶盛机电上半年的业绩,中国银河发布题为《光伏承压,期待半导体贡献新动能》的研究报告。中国银河指出,公司半导体业务持续发展,主要受益于半导体行业持续发展和国产化进程加快。 值得关注的是,近期晶盛机电与半导体设备厂商新凯来的合作关系,引发市场关注。 10月16日,晶盛机电在投资者互动平台对此事回应称,新凯来是公司全资子公司晶鸿精密的半导体精密零部件客户。 据21世纪经济报道,其就双方的合作细节进一步询问晶盛机电,相关接线人员称,目前子公司与新凯来的合作规模暂不便透露,但表示“合作应该已有两三年了,在零部件业务里面(新凯来)是公司一个比较大的客户。” 学霸师生携手创业,财富较峰值大幅缩水 回看公司的发展历程,晶盛机电能够从众多同行中脱颖而出,成长为如今光伏设备领域的龙头企业,其背后离不开以创始人邱敏秀、曹建伟为代表的领导团队的高瞻远瞩与精心统筹。 翻阅邱敏秀的个人履历,可谓十分亮眼,她在机械设计、流体传动及控制领域深耕多年,积累了深厚的行业经验,尤其在电液控制技术研究领域成果斐然。 多年来,她凭借卓越的专业能力,承担并参与了电液控制技术领域的国家自然科学基金项目、863项目、国家重大科技专项课题以及省部级科技项目多达30余项,其科研成果不仅在学术界广受赞誉,还荣获了诸多重量级奖项。 据长江商报,1962年,年仅17岁的邱敏秀就读浙江大学机械系,毕业后被分配到浙江临安通用机械厂,做了8年的技术员。 1977年,时年32岁的邱敏秀回到了母校浙江大学,先后在液压教研室、流体传动及控制研究所、机械电子控制工程研究所工作,历任实验室主任、研究员、机电所副所长等职。 2006年,61岁的邱敏秀以技术入股的方式,参与创建上虞晶盛机电工程有限公司,这便是晶盛机电的前身。从此,她开启了一段充满传奇色彩的创业征程。 2012年5月,晶盛机电成功登陆深交所创业板。在邱敏秀的带领下,晶盛机电从一家小公司,发展成为市值超500亿元的光伏设备龙头。 如今的晶盛机电,已在多领域确立领先地位:全球光伏装备领域实现技术与规模双领先,国内集成电路级8-12英寸大硅片生长及加工设备领域处于领先梯队,大尺寸蓝宝石晶体生长工艺与技术更是达到国际领先水平,成为手握核心技术、兼具规模优势的行业标杆。 值得关注的是,邱敏秀的丈夫路甬祥履历同样亮眼。他不仅是中国科学院院士、工程院院士、第三世界科学院院士,还曾担任浙江大学原校长、中国科学院原院长。 2016年,71岁的邱敏秀做出了一个令外界颇感意外的决定。她没有将公司的管理权杖交给自己的儿女,而是将董事长这一重任交到了年仅38岁的学生曹建伟手中。 公开报道显示,曹建伟1978年出生于浙江余杭,从小就是一个学霸。他凭借着优异的成绩成功考入浙江大学,并顺利获得浙江大学机械电子工程博士学位。 2010年11月至2016年12月,曹建伟担任晶盛机电的董事、总经理职务。2016年12月至今,曹建伟任公司董事长一职,兼任研发中心主任。 晶盛机电在招股书中曾提到,邱敏秀和曹建伟是公司技术研发团队的带头人,掌握公司全自动单晶硅生长炉、多晶铸锭炉及单晶硅生长炉控制系统产品的核心技术,并是公司大多数专利技术的共同发明人。 据晶盛机电介绍,邱敏秀和曹建伟一直密切合作,对公司发展战略、重大经营决策、日常经营活动均有相同的意见,对公司的日常经营、重大经营决策及实施拥有决定性的影响。 天眼查显示,邱敏秀、曹建伟同为晶盛机电的实际控制人。另据公司2024年年报,邱敏秀的子女何俊、何洁为实际控制人的一致行动人。 值得一提的是,此次高管集体减持后,晶盛机电的股价在10月17日下跌7.62%。随后在10月20日、21日,晶盛机电的股价又分别回升3.55%、5.45%。 不过,雷达财经注意到,与此前82.35元/股(前复权)的历史最高点相比,晶盛机电最新股价41.18元/股已几近“腰斩”。 事实上,身为晶盛机电的实控人,邱敏秀与曹建伟的财富状况与公司股价深度绑定。 在《2022新财富杂志500创富榜》上,邱敏秀家族和曹建伟分别以166.1亿元、140.4亿元的财富荣耀登榜,且均创下了各自登榜以来的最高纪录,一时风光无限。 不过,在今年揭晓的《2025新财富杂志500创富榜》榜单中,情况却发生了巨大变化。邱敏秀家族的财富跌至76.1亿元,较巅峰时期大幅缩水90亿元,财富遭遇“腰斩”,曹建伟更是直接跌出该榜单。 未来,在曹建伟和邱敏秀的共同引领下,晶盛机电能否在光伏行业的转型期中稳住阵脚,实现逆势增长?雷达财经将持续关注。
DeepSeek昨天开源的新模型,有点邪门
DeepSeek 又整出新东西来了,只用到原本十分之一 token,就能存下几乎一样的文字信息,这压缩比,香农看了都要流泪,冯·诺伊曼看了都要沉默。 更是直接把一堆老外给钓成了翘嘴。 昨天,DeepSeek 发布了新模型 DeepSeek-OCR,OCR 这东西咱们都熟悉,就是把图片里的文字给识别出来。 经常用微信的差友应该知道,微信客户端里的图片,被咱们点开后,是可以直接复制文字的。 没错,这就是一种 OCR 技术的应用。 但是 DeepSeek 这次的 「技能 OCR」则是刚好相反,它可以把大量文字变成一张图片,作为 AI 的“记忆载体”。 是的,用文字来存储信息,已经不够满足它了。 过去的大模型,不管是什么 ChatGPT、Gemini、Llama、Qwen、还是 DeepSeek 过去的自己,在读取数据的用的都是一种方式:文字,也就是平时常说的 token。 我们写的 Prompt,会被转换成一大堆的 token 给大模型,我们提供的参考资料,会被转换成一大堆的 token 给大模型,就算是能识别图像的多模态的大模型,也是要先把图片转换成了一段文字描述,来交给大模型来做辨认才行。 但文字 token 真的就是大模型理解世界的唯一方式么? DeepSeek 决定试一试新的路子,毕竟,如果咱们把一张图片和一段文字放在一起,前者明显可以包含下更多的信息。 比如这个描述,就不够全面 既然如此,那我们能不能直接用图片来训练大模型? 于是 DeepSeek 就开始整,结果发现这个用图片训练出来的模型,既中看,又中用。 一方面,它可以用更少的 token,来记住更多的内容。 在测试文档理解能力的任务里,DeepSeek-OCR 只用了100 个视觉 token,就超过了需要 256 个 token 的 GOT-OCR 2.0。 再放狠点,它用不到 800 个视觉 token, 就吊打了平均要6000+ token的 MinerU 2.0。 这就意味着、当我们让大模型开始使用图像的这种方式来记住数据了之后,模型就有能力用更少的token资源,来取得更好的表达效果。 另外,DeepSeek-OCR 还支持多种分辨率和压缩模式,来适应不同复杂度的文档: 比如说一张只有图片背景和标题文案的 PPT,可能只需要 64 个 视觉token 就足够表示了。 如果这页的文字内容比较多,那就会自动切换到 Large 模式,用上最多 400 个 视觉token 来记录。 如果觉得还不够的话,DeepSeek-OCR 还能支持动态调整的 Gundam 模式来记忆图片,主打一个应记就记,分清轻重缓急的记。 而且比起过去只能识别文字的传统模型来说,DeepSeek-OCR 能记住的数据还会更多。 论文里的一张柱状体,DeepSeek-OCR 能够自动把它给识别成 Excel 格式给保存下来。 文章里出现的有机化合物的分子结构图片,也能自动转化为标准的 SMILES(简化分子线性输入规范)格式存储。 不但能记住图片本身,DeepSeek-OCR 还会同时记住这张图片的位置,记住图片附近的文字在写些什么东西。。。 过去很多看不到的二维信息,都会被 DeepSeek-OCR 给再次捕获。 这玩意的价值有多大,可能大家一下都还没意识到。 这两年做大模型,除了显卡不够之外的最大问题,就是没有训练的数据了。 常规的数据集之前都用过了,想要再搞点高质量的数据集,要么偷偷去网上爬,要么花大价钱去买,再要么就是想办法自己合成。 但现在,很多过去没采集到的数据,就可以在二维信息里被采集到了。 就比如说很多论文文件,过去,大模型只能学到里面的文字信息,但是里面的各种图表,插图那都是两眼一摸黑。 但用上了 DeepSeek-OCR 之后,就可以把之前缺的这部分给无痛补上了。 实际上 DeepSeek 也是这么想的,在论文里还特意提了一嘴,说这个新模型在一张 A100 上,一天可以给大模型采集出 20 万页以上的训练数据。 所以说,在有了 DeepSeek-OCR 之后,过去的所有数据都值得用它来再识别一遍。 毫无疑问,这些数据,又会成为下一个大模型的养料。 另一方面,用二维的方式来存储数据后,整个模型运行起来也变得更省资源了。 咱都知道,我们在用大模型的时候,聊天聊的越久、上下文越长,这个模型就越容易出 bug。 这是因为大模型在运行的时候,要处理每一个单词,和其他所有单词的关系。 你把对话的长度增加一倍,整个模型的计算量就增加了四倍,增加了两倍,那整个模型的计算量就变成了原本的九倍。 这也是为啥现在大模型厂商都在给你限制上下文长度的原因之一,你要是在一个对话里聊的太嗨了的话,成本要直接卷上天去了。 而在用上了图像记忆之后,DeepSeek 可以把 token 的数量,压缩到原本的十分之一。。。 同时,还不会让性能有太大的损失。 在论文里可以看到,初出茅庐的 DeepSeek-OCR,就能用原本 1/10 的token 数量,达到原模型 96.5%的准确率。 即使哥们再狠点,给它压缩个20倍,模型的准确率,也还能保持个六成左右。。。 同时,DeepSeek 的研究人员还发现了一件好玩的事情。 他们会感觉大模型通过不同的清晰度来存储图像的方式,其实和我们人类遗忘信息的方式很像。 对我们人类来说,遗忘是一个循序渐进的过程。 刚发生的事情,就有点像是 DeepSeek 用 Gundam 模式存下来的数据,最清晰。 而随着时间的推移,这件事的重要性也会逐渐降低,存储它的格式也会从最大的 Gundam 一路降级,从 Large 一路降到最小的 Tiny,占用的 token 数量也会越来越少。 把这个概念引入到大模型里的话,咱们就可以把最近的聊天记录,用“4K HDR蓝光” 的格式来存储,而那些早年不太重要的聊天记录,则是给压缩成 480P 的文件保存。 通过这种主动遗忘的方式,是否能让大模型的上下文能力变得更强呢? 这个想法很有意思,只不过目前就连 DeepSeek 自己也没能给出一个明确的答案。 不过好在 DeepSeek-OCR 还是和过去一样开源的,相信这个问题,要不了多久就会变成热门,整出不少新东西来。 最后,提到开源,我还注意到另外一件事。。。 这次研究不但是 DeepSeek 自己的成果,也是开源社区集体的胜利 比如训练数据里,用到了 华为的 Wukong 数据集,在生成样本文字时,借助了 百度的 PaddleOCR,而在图像特征提取部分,核心组件竟然是 Meta 开源的 SAM,在视觉语义理解层面,还整合了 OpenAI 的 CLIP 模型。 正是这些来自全球的开源成果,被 DeepSeek 重新编织成了一个能“用图片思考”的 AI。 所以,R2 什么时候会来呢。
AGI前夜重磅:RL突破模型“认知上限”,真·学习发生了
新智元报道 编辑:KingHZ 【新智元导读】UC Berkeley、UW、AI2 等机构联合团队最新工作提出:在恰当的训练范式下,强化学习(RL)不仅能「打磨」已有能力,更能逼出「全新算法」级的推理模式。他们构建了一个专门验证这一命题的测试框架 DELTA,并观察到从「零奖励」到接近100%突破式跃迁的「RL grokking」现象。 在AI研究圈,一个核心争论是:强化学习(RL)是否能够赋予模型超越其基础模型(base model)的推理能力。 怀疑派观点:早在四月份,清华的黄高团队[arXiv:2504.13837]指出,尽管经过 RLVR 训练的模型在较小的采样值 (k)(例如 (k=1))时能优于其基础模型,但当采样数较大时,基础模型往往能取得相同或更好的 pass@k 表现。 他们通过覆盖率(coverage)和困惑度(perplexity)分析推断,模型的推理能力最终受限于基础模型的支持范围。 类似地,斯坦福崔艺珍团队 [arXiv:2507.14843] 从理论上论证了 RLVR 无法突破基础模型的表征极限。 这种怀疑的直觉在于: 大多数面向推理的强化学习(如 GRPO、PPO 等变体)通过比较同一提示词(prompt)下多个采样的奖励来更新模型。 如果这些采样中没有一个成功解决任务(即 pass@K = 0),那么所有样本的奖励都是一样差的,此时梯度将会消失。 所以关键的问题在于,当基础模型(base model)在某类任务上完全无法解答(pass@K=0)时: RL是否还能突破零梯度瓶颈,真正学到新策略? 来自加州大学伯克利分校(UC Berkeley)与AI2、华盛顿大学等机构的研究团队,近日给出了一个令人振奋的答案: RL确实能让模型发现全新的推理模式——但前提是,需要不一样的训练方式。 他们的最新工作《RL Grokking Receipe: How Does RL Unlock and Transfer New Algorithms in LLMs?》提出了一个崭新的测试框架 DELTA,专门用来验证该观点。 这项研究为「RL是否能突破模型边界」这一争论,带来了新的实验依据。 论文:https://www.arxiv.org/abs/2509.21016 博客:https://rdi.berkeley.edu/blog/rl-grokking-recipe 相关资源清单(持续更新):https://github.com/rdi-berkeley/awesome-RLVR-boundary 从「打磨」到「顿悟」 RL真学到新算法了? 在主流观点中,RL似乎被困在「隐形的绳子」上 —— 模型的pass@1虽然提高,但在大规模采样下(如pass@128)性能并未扩展。 这意味着它可能只是重新分配已有策略的概率,而不是创造新的策略。 然而,伯克利团队在 DELTA 测试中发现了「顿悟式跃迁」: 在多个基础模型完全失败的任务族中,RL训练经历了一个长时间的「零奖励平台期」,随后突然出现了准确率接近100%的跃迁 (phase transition) 。 研究者将此描述为 「RL grokking」:那不是微调的延展,而是「想通了」的瞬间。 一个「分布外任务学习性」试炼场 很多工作声称「新任务」,但其实仍落在模型的知识范围内。 伯克利团队这次刻意设计的任务,却真正做到了脱离模型经验的外部分布 (Out-of-Distribution): 1. 全新的语言——互联网上从未出现过。 研究团队以经典2010 flash游戏Manufactoria为灵感,构建了一个全新的合成编程世界。 该游戏的解法仅以图片的形式存在,为了适配语言模型,作者引入了一种全新的程序描述语言,仅由两种原始指令组成: Puller:从左侧读取并移动符号; Painter:在右侧写入或标记符号,以此来完成输入输出匹配任务。 2. 全新的任务家族——不是重混关卡,而是全新打造。 研究者不是简单复刻原始的谜题,而是合成了一批全新问题族。这些问题族的难度有简单有困难,最难的问题使得GPT-5都只有0的正确率。 3. 全新的推理方式——与常规代码推理完全不同。 传统代码学习依赖控制流(if/for/while)和数据结构(stack/list/map)。 而在这个极简世界里,模型必须发明一种有限状态机式的推理方式:通过在带子两端不断搬运和标记颜色,完成路由、缓存、比较等操作。 换句话说,模型得在没有变量的环境中「自造算法」。这是一种人类都要重新思考的推理方式。 如果一个RL模型在这里能学会通用策略,那几乎可以排除掉「记忆已有代码模式」的可能,它确实在学习新的算法结构。 破解零梯度诅咒的关键 两阶段奖励调度 伯克利团队的突破在于,他们重新设计了奖励函数的结构。 阶段一:密集奖励(dense reward) 在每个测试用例上给部分分数,而非非黑即白的0/1。即使程序只通过了一半测试,也能获得部分奖励。这让模型从「全零」中获得一丝梯度信号,开始摸索。 问题是: 密集奖励虽然让模型「活了」,但它学会的往往是「投机解」——通过简单模式骗过部分测试。 结果是:平均分高了,完全通过率仍接近0。 阶段二:切换回二值奖励(binary reward) 研究者发现,关键在于时机的切换。当模型通过密集奖励阶段获得「半正确」策略后,再切换到「全对才算赢」的二值奖励,模型突然迎来那一刻——Grokking Phase Transition:从模糊到精确的飞跃。 在约450步后,模型突然学会了任务的核心算法,从此训练进入「强化收敛」阶段,成功率稳定在近100%。那一瞬间,你几乎能看到模型‘领悟’了规律。 在DELTA的多种任务族中,研究者观测到高度一致的学习曲线:前几百步内,奖励几乎为零;接着出现一次陡峭的提升;模型学会了任务核心逻辑,性能稳定在近乎100%。 这条曲线如同人类的学习历程——先是漫长摸索,然后灵光乍现。 顿悟后的技能能否迁移? 团队进一步设计了 BouncingSim 测试场景,让模型预测小球的弹跳轨迹。 这是一个涉及物理规律与组合推理的任务,是一个极具挑战性的编程任务。 结果显示: 模型能在训练后期出现相似的「顿悟曲线」; 对于可组合(Compositional)任务,它能复用学到的子技能; 但面对特殊的动力学规律,模型仍会失效。 这表明,RL 学习到的技能具备有限的迁移能力:它能重组技能,但尚未形成「概念跃迁」的能力。 深层启示1:RL的两种模式 该研究总结出RLVR在LLM中的两种模式: 压缩模式(Sharpening):重新分配概率,减少输出方差,提升单次采样的性能。 发现模式(Discovery):从完全不会(pass@K=0)到稳定解题,实现结构性突破。 而进入发现模式的关键在于:奖励函数设计;探索持续时间;数据混合策略;以及任务的复杂度边界等等。 深层启示2:提升「硬核任务」的而非平均分 研究团队指出,目前RLVR的评测往往在「混合任务池」上取平均,这掩盖了最关键的「硬核任务」突破。 在那些基础模型完全不会(pass@K=0)的任务上,才最有机会观察到RL的「创造性突破」。他们建议未来评估指标应显式报告该子集的表现,因为那才是衡量「模型是否能发现新策略」的真实信号。 为此,伯克利团队搜集并维护了一个在此方向上的代表性工作: 按「立场—方法—评测—数据/基准—讨论」分门别类的列表,便于研究者直接定位到 pass@k=0 等硬核子集上的最新证据与方法路径。 项目地址: https://github.com/sunblaze-ucb/awesome-RLVR-boundary 深层启示3:从编程迈向数学与科学:RL的新边疆 为何该工作选择编程作为突破口? 因为代码任务天然具备:可验证的单元测试;细粒度、可组合的反馈信号。 这些特性让RL能够精确调节奖励,形成探索路径。 研究者认为,这一思路完全可扩展到数学与科学推理领域: 通过自动评分(rubric scoring)、逐步检验(step checker)或物理仿真器(simulator feedback) 构建细粒度的奖励系统,从而让RL引导模型穿越「无梯度」地带 结语 模型「真正思考」那一刻 这项研究的意义不仅在于性能提升,而在于它展示了LLM真正的学习潜能: 强化学习不只是打磨,而是让模型学会「如何思考」。 在AGI前夜的诸多技术路径中,RLVR 可能是那条让模型从模仿走向洞察的路。 当模型在接近零反馈的黑暗中摸索,直到某一刻突然顿悟——或许这就是AI的「悟道」瞬间。
如果中国大模型不再开源
美国 AI 圈开始出现“担心中国开源断供”的苗头了吗?10 月 20 日,在专注于开源模型讨论、拥有 55 万成员的 Reddit 分论坛“r/LocalLLaMA”上,一位网友发布了一则“当中国公司停止提供开源模型时会发生什么?”的提问,并表达了假如中国模型逐渐闭源或开始收费该怎么办的担忧。 这一提问引起了众多讨论,在这则贴文之下有一则留言得到了目前最多的点赞,其写道:“中国受益于开源模式,因为中国经济更依赖于实体商品的生产,而美国经济则更依赖于软件和服务,美国经济在这方面要脆弱得多。” 10 月 4 日,曾帮助 Facebook 从数千万用户发展至数亿用户的 Meta 早期高管、Social Capital 公司创始人查马斯·帕里哈皮蒂亚(Chamath Palihapitiya)在知名科技播客“All-in”中直言,尽管他所创立的 Social Capital 公司已经是亚马逊 AI 托管平台 Bedrock 的 TOP 20 客户,但他已经开始将大量中国工作负载转向中国开源模型 Kimi K2,其表示理由很简单:“因为 K2 的性能确实足够强,而且说实话,比 OpenAI 和 Anthropic 便宜太多了。” 图 | 查马斯·帕里哈皮蒂亚(Chamath Palihapitiya)(来源:https://www.linkedin.com/in/chamath) 在美学者为何转向中国模型?研究开销从万美元骤降至 50 元 如果说帕里哈皮蒂亚的案例距离我们比较遥远,那么在美国的华人学者或中国留学生可能对此感受更加深刻。上海交通大学本科校友、美国西北大学博士生郁家豪在近期一项研究中,便经历了选美国模型还是选中国模型的抉择,但他最终通过使用中国模型将课题花费从上万美元压缩到 50 元人民币。 在上述研究中,他需要针对离线学习数据采集进行模型选择,最初他打算使用美国 AI 公司 Anthropic 的商业模型 Claude Sonnet 4 进行数据采集,采集一小部分之后发现开销竟然达到 500 多美元。 进一步评估之后他和同事发现,使用 Claude Sonnet 4 采集完所有数据可能需要高达上万美元的开销,这远远超出了课题组的预算。于是,他开始寻求替代模型,同时他所需要的替代模型必须具备较好的智能体代码生成能力。 在此期间,恰逢国产大模型出现了一波井喷式爆发。从 Kimi-K2 到 Qwen3-coder-480B、再到 GLM-4.5,这些国产大模型的价格都远比 Anthropic 的模型要便宜。 郁家豪进行了几次小样本采集实验,结果发现这三个国产大模型的性能都接近于 Claude Sonnet 4,完全可以作为替代模型。更巧的是,GLM-4.5 在发布之后,其背后公司智谱 AI 推出一个月内试用 1 万亿 tokens 的套餐,这正好与郁家豪的实验节奏相吻合。 于是,他使用 GLM-4.5 提供的套餐完成了离线数据采集,最终采集数据的开销从原本的上万美元压缩到 50 元人民币。“在后续的模型微调中,这些数据的质量也很高,并具体反映在微调之后的模型性能上。”郁家豪告诉 DeepTech。 与此同时,他所采用的用于微调的模型也是同为国产大模型的 Qwen3-coder-30B,并表示当前全球 AI 领域都在普遍采用最新 Qwen 模型来微调任务。“这些经历让我们感慨:在 2023 年,开源领域几乎只有 Llama,大家进行模型微调研究都只基于 Llama2 进行;在 2025 年,国产大模型已经完成了接力棒的交接,代替 Llama 成为了开源领域的主流,而且和闭源模型的差距也在不断缩小。”郁家豪表示。 最终,通过使用中国开源模型,他完成了相关研究。众所周知,本轮 AI 浪潮始于 2022 年末 ChatGPT 的发布,但是中国自 2023 年初奋起直追并做出了一定成绩。2024 年秋,智源研究院的 BGE 模型曾登顶 Hugging Face 月度下载榜首。 2024 年年末,Hugging Face 的数据显示,Qwen2.5-1.5B-Instruct 当年的下载量占比达到 26.6%,均超过 Llama 3 和 Gemma 这些明星开源模型,网友还为此制作了“扎克伯格看着你使用 Qwen 而非 LLaMA”的梗图。 (来源:X) (来源:Hugging Face) 同样是在 2024 年末,国际数学大牛陶哲轩也曾在 X 公开表达过对于 Qwen 模型的认可。 图 | 陶哲轩在 X 推文中提到 Qwen 模型(来源:X) 2025 年 7 月 30 日,在 Hugging Face 的开源模型榜单前 10 名中有 9 个来自于中国,这 9 个大模型分别属于智谱、阿里通义、腾讯混元、月之暗面;就这一榜单的前 5 名来说,当时除了第 4 名,其余几名全部是中国大模型。其中,智谱 AI 的开源模型 GLM-4.5 模型发布之后迅速冲上榜单前列,而这款模型正是前面提到的郁家豪所使用的国产大模型。 图 | 前 5 名中除了第 4 名其余几名全部是中国大模型(来源:Hugging Face) 同样是在 2025 年 7 月,美国硅谷风投公司 Benchmark 合伙人比尔·古尔利(Bill Gurley)在 X 写道,中国开源模型所产生的组合效应非常强大,模型之间可以互相学习,新模型的推出也更容易。 图 | 美国硅谷风投公司 Benchmark 合伙人比尔·古尔利(Bill Gurley)的 X 截图(来源:X) 而就在昨天,DeepSeek 发表了关于 OCR 的新论文,该论文得到了 OpenAI 联合创始成员之一、前特斯拉自动驾驶总监安德烈·卡帕西(Andrej Karpathy)的盛赞,他在 X 上写道:“我很喜欢 DeepSeek-OCR 的新论文,这是一个很好的 OCR 模型。” 图 | 美国硅谷风投公司 Benchmark 合伙人比尔·古尔利(Bill Gurley)的 X 截图(来源:X) 全球 AI 社区依赖“中国开源供给”有多深? 中国大模型目前并未得到所有知名 AI 人士的认可。然而,尽管 DeepMind 创始人戴米斯·哈萨比斯(Demis Hassabis)和 Meta 创始人扎克伯格都曾发表过不太认可中国大模型的言论,但这并不影响在美国的 AI 从业者对于中国模型的选择。除了郁家豪之外,多名在国外的 AI 学者均表示,他们正在使用中国开源大模型,同时他们也在使用美国大模型。 美国伦斯勒理工学院王革教授告诉 DeepTech:“我们团队在科研和教学中确实使用过来自中国和美国的开源模型。例如,DeepSeek 等模型具有高度的开放性,易于本地化部署,并且在强化学习驱动的推理方面为我们提供了启发,这让我们得以在多模态医学影像分析和合成生物智能方向上持续探索。”他指出,开源模型的最大价值在于,让研究者能够自由地进行实验、复现与改进算法,从而显著降低创新门槛。 新加坡南洋理工大学助理教授杜宇轩也告诉 DeepTech:“我经常会用到中国的开源大模型,比如 DeepSeek 和 Qwen。这些模型对我们构建面向特定领域的语言模型起到了关键作用。它们提供了灵活的访问权限,使我们能够基于具体科研任务采用多种策略进行优化,例如进行微调或基于强化学习的 GRPO 优化,从而让模型能够更好地适应特定的科研语境和知识体系。” 同时,开源模型降低了杜宇轩和团队的消融实验门槛,让其能够查看模型本身的能力对于下游任务到底有多大影响。这不仅让研究过程更透明,也让其能在有限的资源下找到性能和成本之间最佳平衡点。 美国南加利福尼亚大学博士生黄腾昊向 DeepTech 表示:“我经常使用 Qwen 模型用来作为后训练的基座模型,也使用了由中国开源社区贡献的 VeRL 框架。”(编者注:VeRL 是由字节跳动 Seed 团队与香港大学团队联合开发的强化学习训练框架,主要用于基于人类反馈的强化学习训练和智能体训练。)美国俄亥俄州立大学博士生郑博元告诉 DeepTech:“对于中国开源模型我用得还挺多的,特别是用 Qwen 和 DeepSeek 系列来做训练。 它们的优势主要是:首先,模型能力在开源模型中很强,并且有各种大小和类型的模型,可以满足各种训练和实验要求。以 Qwen 系列模型为例,从 text-only、QwenVL、reasoning model 都有,并且有 3B、7B 乃至更大的不同规格,此外还有 MOE 模型;其次,因为生态比较成熟,所以用起来特别方便,Qwen 在开源社区的支持做得非常好,一些开源框架也让我们可以非常快速地开展实验和验证想法。” 如果中国开源模型不再开源会怎样? 目前,全球 AI 社区对于这种“中国开源供给”的依赖程度只增不减。如果这一来源突然中断,最直接的后果会是什么? 对此,郑博元直言:“我觉得学术界对中国开源模型的依赖挺深的,特别是很多涉及到模型训练的工作都是在 Qwen、DeepSeek 之类的模型基础上的。 如果突然中断了,就是假设这些 model checkpoint 全都消失了,学术界的很多工作都会很受影响,特别是开源的工作都是相互依赖的,比如一些侧重于多模态模型的语言模型部分都会使用 Qwen、DeepSeek 之类的开源模型。” 王革也表示:“目前,全球 AI 开源生态的多样性在相当程度上依赖于中国研究团队和企业的贡献。中国的开源模型在参数规模、性能优化以及多语言适配等方面处于先进地位,并持续推动着整个社区的快速迭代与繁荣。 如果这一供给突然中断,短期内将导致开源模型的更新速度放缓,研究复现与创新实验的成本上升。从长远来看,闭源化趋势将削弱开放共享与科学协作的精神,造成生态失衡,使全球 AI 创新陷入失谐甚至失控的状态。” 杜宇轩认为,开源社区最核心的价值之一,就是避免整个行业过度依赖某一家模型或某个国家的技术体系。开源让研究者有自由去探索不同的路径,不会被技术封锁或商业垄断限制住。这种“百花齐放”的生态,其实才是推动 AI 长期进步的关键。 他继续说道,中国在全球开源 AI 社区里长期扮演着非常重要的中坚角色,很多中国团队贡献的模型、工具和数据集已经成为全球研究者的基础设施。 如果这部分供给突然中断,整个开源与闭源之间的平衡就会被打破,AI 研究可能重新回到被少数闭源体系主导的状态,而那样不仅不利于创新,也会拖慢人类在更长远目标上的探索步伐。 郑博元同时提出了一些其他看法,其表示:“如果中国开源供给真的断供,可能逐渐也会有新的开源模型出来补上这个生态位。一方面,工业界可能会开源一些较老版本或者蒸馏出来的模型,比如 OpenAI 在今年 8 月发布了 GPT-OSS。 另一方面,英伟达也放出来了很多开源模型,还有美国非营利性研究结构艾伦人工智能研究所也一直在积极推动包括模型数据在内的完全开源。” 而为了构建一个更具韧性、去中心化且真正全球化的 AI 开源未来,学术界、产业界和开源组织需要倡导或建立哪些新的协作机制与保障?王革认为,建立真正全球性的协作机制并非易事,但医疗健康领域可能是一个理想的起点。例如,通过建设共享算力与模型评测平台,可以避免资源被少数主体垄断,从而实现更加公平的科研生态。 他举例称,美国纽约州的 EmpireAI 项目就是一个值得借鉴的案例,该项目通过公共资金支持开放 AI 研究,为学术界提供算力基础设施。因此,科学界应持续推动开放科学政策,在保护知识产权与促进科研共享之间取得平衡,确保开源 AI 生态的长期可持续发展。 杜宇轩则补充说,AI 开源的未来需要产学研与开源机构之间形成一个相互支撑的协作模式:学术界可以发挥引领作用,推动开放标准、开放数据和可复现研究,把知识共享放在首位,并主动去挑战产业界的前沿问题,而非仅仅关注论文数量或模型性能;产业界则应持续加大对开源生态的投入,比如开放部分训练框架、算力平台或工具链,帮助学术界和开发者更高效地验证新想法;同时,开源组织需要推动跨国、跨机构的共治机制,确保模型和数据的开放是安全、透明且负责任的,并且要防止被滥用。 无论如何,可以预见的是,未来 AI 开源社区可能会形成“中美双引擎”的格局。那么,你认为中国开源模型会在全球 AI 领域扮演怎样的角色?如果有一天这些中国开源模型选择闭源,又会给你带来怎样的影响? 参考资料: https://www.reddit.com/r/LocalLLaMA/comments/1ob9vvk/what_happens_when_chinese_companies_stop/ https://www.pingwest.com/a/301327 https://www.youtube.com/watch?v=ddAwgZ6ietc&t=2983s https://peking.bjd.com.cn/content/s688b787ce4b0bd64e2e1b61d.html https://thechinaacademy.org/interview-with-deepseek-founder-were-done-following-its-time-to-lead/
每天赚2个亿,卖铲人宁王再封神
日均进账超2亿元,宁王的生钱之道友商真的羡慕不来。 昨天,宁德时代公布第三季度财报,营收1041.86亿元,同比增长12.90%,归属于上市公司股东的净利润185.49亿元,同比增长达41.21%,创下公司单季盈利历史新高。 我们把视线放到前三个季度,总营收为2830.72亿元,同比增长9.28%;归母净利润同比增长36.20%达490.34亿元。 这个盈利数字,是中国电动车企业想都不敢想的。 更关键的是,这为卖铲人的吸金能力还在狂飙,宁德时代去年全年净利润是507.45亿元,而今年宁德时代光前三个季度就与去年全年净利仅仅相差17亿元。 其前三季度经营活动产生的现金流量净额高达806.6亿元,同比增长19.6%,家底殷实的同事,也说明了其自我造血能力足够强。 都说“高处不胜寒”,随着自身体量越来越巨大,宁王反而更强了。 营收和净利齐飞 从整个前三季度的营收情况来看,刚刚过去的第三季度表现最好。 第三季度营收增长12.90%达1041.85亿元,净利润增长41.21%至185.49亿元,即便是扣非后,净利也来到了164.22亿元,同比增长35.47%。 利润增速远超营收增速,说明宁德时代不仅卖得多,赚得更多。 平均下来,相当于第三季度每天就能赚超2亿元,而在去年,宁德时代还是日均赚不到1.4亿元。 考虑到以往四季度大多是宁德时代收入最高的季度,如果不出现“黑天鹅”事件,宁德时代在2025年创下历史新高,已基本板上钉钉。 公司盈利能力提升的背后,在于毛利率的飙升,财报显示,宁德时代第三季度净利率达到19.1%,较上年同期增加4.1个百分点。 在最核心的指标表现良好的情况下,宁德时代的其他账面数据上,基本也是全线飘红。 截至2025年9月30日,公司现金储备充裕,期末货币资金及交易性金融资产合计超3600亿元。存货同比增长34.05%至802.1亿元,公司称主要系业务规模增加所致。 同时,体现客户预付款和订单情况的合同负债科目,也由年初的278.3亿元大幅增长46.14%至406.8亿元,说明宁德时代在手“余粮”充足。 进一步拆分宁德时代的利润来源,不难发现,超高的利润增速也不全是靠业务赚钱,这背后除了因为有不错的现金流,港股超400亿港元的融资也帮了不少忙。 今年5月份,宁德时代在香港联交所主板成功挂牌上市,全球发售股份总数为1.55亿股(行使超额配售权之后),发行价格为263.00港元/股,募集资金总额约410亿港元。 在现金流量表中,筹资活动产生的现金流量净额达到了42.77亿元,可见宁德时代在港股上市也是拿到了不少的资金。 还有个极易被忽视但很关键的细节是,财务费用的逆转,宁德时代前三季度财务费用为-70亿元,报告解释为外币汇率变动带来的汇兑收益及利息净收入增加。意味着公司不仅没付利息,反而靠资金运作赚了70亿。 体量如此巨大的前提下,还能出现持续的正向增长,也不单单是卖电池,背后的哪哪都能挣到钱的资本运作逻辑。 开始向大众市场发力 通过财报看到的是亮眼的业绩,但背后更多是市场份额保卫战。 而且不得不承认的是,宁德时代的市场份额已经出现了轻微的下滑。 根据SNE最新数据,截至今年前8个月,宁德时代全球电动汽车电池市场占有率为36.8%,虽然这一数据仍是断层式的第一,但去年的同期,宁德时代的这一数据为37.7%,下滑了近1%。 国内市场方面,这一下降更明显。根据中国汽车动力电池创新产业联盟数据,2025年第三季度,宁德时代虽然以210.67GWh装车量,42.75%的市场份额稳居榜首,但这一数据已同比下降3.1个百分点,为5年来的最低点。 在不少国内车企都是“苦宁王”久矣,纷纷逃离或提高“二供”的份额降低对其依赖的环境下,境外以及储能业务成了宁王接下来的重点方向。 这次的财报,虽未披露海外业务的具体情况,但在今年上半年,宁德时代境外收入就已经达到了612亿元,占总营收的34.22%,预计到2026年,海外产能占比将提升至40%。 虽然目前,国内电池业务仍是主力,但增速上已经开始仰仗海外扩张,而且值得一提的是,宁德时代今年在港股的募资也是为了海外的扩张,明确表示,其中90%的募集资金将用于海外产能建设,重点是匈牙利工厂的一期和二期项目。 从市场占有率来看,在欧洲市场装机量市场份额达35%,德国市场占有率突破40%;北美市场占有率达28%。 在业绩会上,有关海外业务的布局和储能业务成为被问询的重点。 从产能布局来看,2024年投产的德国工厂实现持续盈利,匈牙利工厂一期项目首条产线设备已进场调试,预计2025年底建成并完成安装调试,建成后100GWh的电池产能将位居欧洲第一。 西班牙工厂已完成前期审批手续,并正式成立合资公司,即将启动工厂筹建工作,印尼电池产业链项目产能规划15GWh,可适用于动力及储能,预计2026年上半年投产。 此外, 在刚过去的慕尼黑车展上,宁德时代首发了其NP3.0电池安全技术平台,并正式发布首款搭载该技术的磷酸铁锂电池产品——神行Pro,可见其对海外市场的重心偏移。 产能建设是宁德时代不变的主旋律,但储能电池的占比开始悄然上升。宁德时代表示,2025年以来,公司的产能利用率在不断提升,三季度出货量约为180GWH(确认收入的超165GWh)。其中,储能约占20%,动力电池约占80%,储能系统出货有所提升 宁德时代在业绩会上透露,国内山东济宁、广东瑞庆、江西宜春、福建厦门、青海、福建宁德等基地均有大幅扩产,仅山东济宁基地预计2026年新增储能产能就超过100GWh。同时,宁德时代还表示,“未来数据中心对储能的需求量会是蛮可观的”。 其还直言,“目前储能的出货受制于交付,今年产能利用率打得太满了。随着后续产能上来,交付会有进一步增长。产能会在未来一两个季度得到逐渐的缓解,交付不是最大的问题。” 除此之外,宁德时代还有一个推动业务增长的“潜力股”——巧克力换电,不久前,京东汽车、宁德时代和广汽集团共同推出“国民好车”一度登上热搜第一,正是宁德时代换电体系下首款面向C端的车型。 以往宁德时代在换电业务基本都是to B端,如今正式打入C端市场,换电的蓝海,也在宁德时代3年的布局下展开。 接下来的宁德时代,打算真正走向大众市场了。
又菜又爱玩的荷兰人 在安世半导体上翻车了
闻泰科技和安世半导体这事,大家都听说了吧? 没听说也不要紧,简单来说就是:美国压力荷兰,让它制裁闻泰这个中企; 然后荷兰很听话,不讲武德发动偷袭,对本地一家闻泰的全资子公司,也就是芯片巨头安世半导体下手,想把中国老板给踢出局,换本地人掌权。 结果中国呢,反手就把这家公司在中国的工厂仓库给锁了,一箱货都不让出。 于是荷兰就傻眼了,欧洲一票车企也跟着哭了,因为没芯片,生产线马上就得停,跑去压力荷兰人。 完事这几天他们又跑来连夜讨论,沟通解决这事。 一副小弟不识抬举没眼力见,大哥人美心善能不能通融通融的嘴脸。。。 看看这事整的,你说你早干啥去了,这不搬起石头砸自己脚嘛。 用网友的话说,荷兰这波纯属光着屁股推磨——转着圈地丢人。 说归说闹归闹,比起调侃,也有不少网友问的是,这闻泰和安世,到底啥来头?怎么就能让中美荷三国拿它当牌打,还能卡住欧洲一票车企的脖子? 这个嘛,就不得不说到安世的前世今生了。 首先,安世的祖上,则是正儿八经的欧洲豪门,飞利浦旗下的核心半导体部门。后来几经辗转,又成了恩智浦(NXP)旗下的一个事业部。 虽然它的显赫出身能追溯大几十年,但到了现在嘛,它就跟短剧男主角一样,成了豪门里的弃子。 原因是,恩智浦自己日子也过的可以,集团重心已经在物联网、汽车芯片这些高利润产业了,而安世搞的功率半导体这块,业务技术低、利润薄,食之无味弃之可惜,于是就把它给剥离了。 具体来说,安世这家荷兰公司搞的是功率半导体。虽然也算芯片,但是跟大家平时理解的CPU、GPU这些IC芯片不一样,说白了就是二极管、晶体管、MOS管啥的。 这玩意儿技术含量有,但你要说非常顶尖,那倒也谈不上,很多都是成熟工艺。 但安世这公司强就强在,辈分大资历久。深耕车规级芯片这个细分行业多年,积累下来的经验和客户众多。 要知道芯片这玩意有些都是要用几十年的,所以车厂经常是要经过长达数年的严苛验证,才给芯片厂认证,然后才加入采购名单,通常很久都不带变的。 所以凭借时间和人脉,口碑的积累,安世在很多细分领域都成了绝对的霸主。什么小信号二极管、ESD保护器件,常年全球第一;车规级的功率MOS管,全球第二。 尤其是电动车上最关键的逆变器芯片,安世一家就占了全球40%的份额。 欧洲那票车企,什么大众、宝马、奔驰,全指着它供货。要说欧洲汽车工业的芯片命脉捏在它手里,那有点夸张,但是离了他,车企短时间里还真就不行。 也正是因为看重它,2019年,中国的闻泰科技,花了340多亿把它全资收购了,整成了中资子公司。 这闻泰的老板张学政也是个狠人,清华金融出身,干过一阵投资,后来下海创业给华为小米这些大厂代工,把ODM(手机代工)这个行业给卷成了红海,做到了全球顶尖。 完事这人还上进,不想只在下游搞,一门心思想往上游半导体走,于是才有了收购安世这步大棋。而自打来了个中国老板以后,原本被恩智浦视为增长平平的安世,不但咸鱼翻身,还起飞了。 2024年10月,安世半导体就还清了所有前期债务,业绩更是爆表,数据显示,自收购至2025年,安世的营业收入增长了60%,净利润更是实现了数倍增长。 更关键的是,还搭上了中国新能源汽车这趟顺风车。安世现在有四成的出货,都是供给中国各大新能源车企的。 可以说,中国新能源车的崛起,安世吃到了最大的红利,连带着荷兰政府也赚麻了,闻泰收购这五年里,光企业所得税就缴了1.3亿欧元,在荷兰、德国等地的工厂还提供了5000个就业岗位,这哪是收购啊,这是干部下乡来了,纯扶贫。 图源:闻泰科技 这故事到这其实都还挺美好的,但坏就坏在,美国人来了。 去年12月,安世的中国爸爸闻泰科技,就被美国列入出口管制实体清单,那时候安世还回应说不受影响。 结果翻过年,到了今年6月,美国官员又跟荷兰人开会,透风说要扩大对闻泰科技的制裁,会影响安世半导体。 图源:安世半导体官网 到了9月29日,美国那边就出牌了,将管制措施扩大到实体清单企业的子公司,其中就包括安世半导体。也就是说以后安世也要被美国人出口管制了。 完事跟这个前后脚,第二天荷兰人也发了个公告,说根据 《货物可用性法》,“荷兰及欧洲本土关键技术知识与能力的连续性和安全性面临威胁”,所以要gank安世。 先是冻结了闻泰科技旗下包括安世半导体在内的全球30个关联主体,接着老板张学政停职了,换成他们的人,靠外籍董事全面接管公司的控制权。 不是哥们,那美国人让干啥你就干啥啊? 而且这事儿离谱到什么程度呢,这个法案是一项冷战时期的、从来没用过的法律,是应对战时物资短缺的法案。 荷兰你tm哪战了啊,根本就无中生有硬搞,突出一个“我就是看你赚钱不爽,想抢了”。 闻泰的高管在和投资者通话时都吐槽,说荷兰经济事务部就是跟在美国身后的绵羊。嘴上喊着是“防范供应风险”,心里打的算盘是想巧取豪夺,把中国人花钱盘活的优质资产私吞了,既讨好美国又捞好处,脸都不要了。 但荷兰早就不是大航海时代那个荷兰了。 于是就在荷兰政府夺权的几天后,中国商务部发布出口管制公告,直接禁止安世半导体中国公司,出口在中国生产的所有成品和半成品。 这一下就给荷兰人整不会了。因为安世虽然总部在荷兰,但它最大最重要的后端封装测试工厂,就在中国的东莞和惠州。欧洲工厂生产出来的晶圆,都得运到中国来,进行封装测试,变成成品芯片,再卖到全世界。 现在好了,中国一声令下,惠州那个8万平米的工厂,还有东莞的基地,所有生产线都“上四休三”了。价值数亿美元的晶圆和封装件,全卡在了保税区,一箱都运不出去,??不卖了! 就这还只是安世,像ASML这种巨头甚至是高度依赖中国市场的,中国还没动手呢。 结果反制以后,最先慌的还不是荷兰政府,欧洲那帮车企直接就炸锅了。 欧洲汽车制造商协会(ACEA)直接站出来警告,说大家的芯片库存可能几周内就耗尽,生产线随时可能停摆。大众、宝马、奔驰这些这帮车企估计这会儿正对着荷兰政府骂娘呢:哥们正忙着搞电动化转型,最缺的就是芯片,你们倒好,为了抱美国大腿,直接把大家饭碗给砸了? 更戏剧性的一幕,发生在安世公司内部。荷兰总部那边刚夺了权,安世中国这边,直接发了封公开信正义切割,总部发来的任何消息大家都当放p,工资福利由国内公司发。 好家伙,一个跨国公司,分部直接和总部斗起来,这在商业史上都少见。 总之,就像网友说的,荷兰人这回是自己给自己打脸。一边得跟美国人解释,一边又得跟中国人谈判,求着把仓库门打开。 最惨的其实还是安世自己。它不仅成了地缘政治的牺牲品,更可能失去未来最大的市场。 要知道,安世的车规级芯片技术壁垒,并没有高到不可替代。这次事件一出,国内的新能源车企,肯定会加速国产替代的进程。 说到底,供应链上的这些事,本该是商业问题,现在却被硬生生搞成了政治工具。但结果呢?对谁都没好处。 中国的这次坚决反击,反而更加展现了一种明确的姿态:那个靠一纸法令就能随意没收中企资产的时代,已经一去不复返了。 在全球化掉头的时代,想拿别人的资产当筹码之前,最好先掂量掂量,自己到底有几斤几两。
东华软件总经理吕波董事长薛向东竞相减持
图注:东华软件创始人 薛向东 雷达财经出品 文|周慧 编|深海 10月16日,东华软件发布公告称,公司董事兼总经理吕波由于个人资金需求,计划自减持公告披露之日起15个交易日后的3个月内(即2025年11月10日至2026年2月9日)通过集中竞价方式减持其所持公司股份不超过151.92万股,即不超过公司总股本的0.05%。减持原因为个人资金需求。 而在一个多月前的9月12日,东华软件发布公告称,公司实控人、董事长薛向东因个人资金需求,计划减持所持公司股份不超过4487.68万股,占公司总股本的1.4%。 公司董事长、总经理争相减持背后,近年来东华软件业绩面临瓶颈。2015年,东华软件净利润达到11.42亿元,而2024年,公司净利润仅剩下5亿元。进入2025年后,公司业绩也未好转,上半年出现营收净利润双降。 新财富杂志500创富榜显示,薛向东最新身家为84.5亿元,不足高点的一半。 值得关注的是,东华软件年内股价上涨近四成。有分析认为,公司高层争相减持,或是觉得股价高估,市值上涨无业绩支撑。 公司高管竞相减持 据前述10月16日公告,吕波所持股份来源为东华软件首次公开发行前取得的股份和股权激励(均含资本公积转增股本及送股而相应增加的股份)。 截至目前,吕波持有东华软件607.67万股,占总股本的比例为0.19%。吕波计划以集中竞价方式减持公司股份合计不超过151.92万股,即不超过公司总股本的0.05%。 相比吕波,公司董事长、实控人薛向东计划减持的股份更多。 9月12日晚间,东华软件发布公告称,薛向东计划于2025年10月14日至2026年1月13日期间,通过集中竞价或大宗交易的方式减持不超过4487.68万股,即不超过公司总股本的1.4%。 东华软件称,薛向东本次减持原因系个人资金需求,减持的股份来源为公司首次公开发行前所取得的股份、因实施权益分派而增加的股份以及通过集中竞价增持获得的股份。 本次减持并不是实控人薛向东及其家族年内首次减持。 今年5月8日,东华软件发布公告称,自本公告披露之日起15个交易日后的3个月内,薛向东及其一致行动人郭玉梅计划以集中竞价或大宗交易方式减持公司股份合计不超过3205.48万股,即不超过公司总股本的1%。 此外,公司董事兼副总经理李建国计划以集中竞价方式减持公司股份不超过65.71万股,即不超过公司总股本的0.02%;公司董事、董事会秘书兼副总经理林文平先生以集中竞价方式减持公司股份不超过8.74万股,即不超过公司总股本的0.0027%。 7月31日,东华软件披露减持进展。其中,薛向东减持了2440.28万股,套现金额达2.32亿元;郭玉梅减持了764.83万股,套现金额达7128.22万元;李建国减持了15万股,套现金额为143.25万元;林文平减持了8.74万股,套现近为80.39万元。 作为公司实控人,薛向东年内多次频繁减持,引发了一些股民质疑:“薛,你身为一个这么大公司的董事,这么着急用钱吗,这么不看好自己的公司吗?” 值得一提的是,东华软件股票年内上涨近四成。 有分析认为,公司高管或认为股价上涨,并无业绩支撑,故争相减持。 值得一提的是,自薛向东2010年首次减持公司股份以来,已累计减持公司股票超3000万股。 公司发展面临瓶颈,去年净利润不足十年前一半 高管争相减持背后,东华软件遇到了业绩瓶颈。 天眼查资料显示,东华软件成立于2001年,是一家以从事软件和信息技术服务业为主的企业。企业注册资本320548.24万元,超过了99%的北京市同行,于2006年成功登陆A股。 上市后,公司营业收入整体呈现上行趋势。 公司的销售毛利率比净利润早一年达到顶点,在2014年毛利率达35.29%。此后震荡下行,至2024年,销售毛利率仅剩下20.61%。 半年报显示,公司营业收入为56.22亿元,同比下降1.76%;归母净利润为2.44亿元,同比下降15.78%;此外,公司的销售毛利率也从去年同期的23.05%下降至20.21%。 分行业收入来看,东华软件在报告期内的金融健康收入为34.38亿元,占比61.15%,同比下降1.71%;政府及公共事业收入12.36亿元,占比21.98%,同比下降1.43%;互联网及计算机服务、通信等行业收入占比较小,均出现小幅下滑。 分产品收入来看:系统集成收入38.31亿元,占比68.15%,同比增长3.06%,为核心收入来源;软件收入7.92亿元,占比14.09%,同比增长0.33%;技术服务收入9.96亿元,占比17.71%,同比下降17.95%。 值得一提的是,天眼查资料显示,风险方面共发现东华软件有天眼风险信息超10万条,远高于一般企业。 实控人薛向东最新财富84.5亿元,不足高点一半 作为东华软件实控人,薛向东出生于1959年,山东泰安人。在大学毕业后,薛向东被分配到机械工业部外事局工作。 1986年,薛向东被调入国有企业——中国机械工业电脑应用技术开发公司工作,历任经营部(系统集成部)经理、总经理助理、高级工程师。 1993年,薛向东从国企辞职后,不久即“下海”创业,靠借钱注册起东华诚信电脑科技发展有限公司,立志做中国人自己的高新技术企业。 彼时,正值国内信息化建设起步阶段,他敏锐捕捉到行业应用软件开发与系统集成的市场机遇,将公司初期业务聚焦于政府、金融等关键领域,并逐步形成了如今“金融健康+政府及公共事业+互联网及计算机服务”的三元业务结构。 2006年,在薛向东的主导下,公司成功登陆深交所主板,成为行业内较早实现资本化的企业之一。 随后东华软件借助资本力量,进一步扩大业务规模,完善全国服务网络,为后续行业地位的提升奠定了资本与资源基础。 随着公司的发展,薛向东及其家族的财富也不断积累。新财富杂志500创富榜显示,2016年,薛向东家族财富达203亿元,创下家族财富顶点。 2025年,薛向东家族财富为84.5亿元,不足高点一半。
损失软银200亿,被宇树碾压,抢跑30年“机器人灯塔”陨落
发展多年,波士顿动力似乎始终没走出MIT校园。人形机器人之争,已经跳过了概念阶段,进入到全面商业化阶段,波士顿动力快要连网红都当不了了。 作者 | 卢 梭 编辑 | 王金晓 波士顿动力账号的最新一期视频,观看量只有67万次。 最近三个月,账号观看量最多也不过百万次。 而在7年前,黄色机器狗Spot的视频观看量高达1.7亿次,全网轰动。 “网红”陨落,这家人形机器人“灯塔”,起了个大早,赶了个晚集。 #1 “灯塔” 虽然人形机器人概念最近两年才火爆,但是行业早就发展了多年。 长期以来,波士顿动力都是这个领域的“灯塔”。 1983年,还在麻省理工的马克·雷伯特(Marc Raibert),创造了世界上第一款能单腿蹦跳的机器人。 凭借这个机器人,马克拿到了一笔25万美元的投资。 这位神秘的投资人,后来成为美国国防部高级研究计划局( DARPA)的主任。 彼时,互联网还不成熟,机器人更像是科幻片的产物,军方人员的参与,更加重了这个故事的科幻属性。 美国军方无意间的一粒种子,却在后来开花结果。 1992年,马克脱离麻省理工,创立波士顿动力。 最初的马克,打造出一款手术模拟器,用于指导外科医生手术,还凭借一个会跳舞的小型人形机器人受到索尼关注。但这些终究没有让波士顿动力找到方向。 转折发生在2005年,DARPA 开启了一项计划,想挑选几个科技公司为军方研发尖端产品。 波士顿动力的“大狗(BigDog)”在42个项目中脱颖而出。 这个略显粗糙的机器人,能够在相对复杂的路况上平稳行走,军方寄希望于其能够为士兵背负重物。 数千万美元的投资砸下,波士顿动力快速发展。 除了“大狗”,还相继推出阿尔法狗 LS3、四足机器人 Cheetah(猎豹)和可自由跳跃旋转的 Wildcat(野猫)等产品。 2009年,波士顿动力改进出人形双足机器人Petman,完全领跑行业,这是日后Atlas的原型。 看起来波士顿动力节节攀升,但最终没能如愿。 在路线选择上,马克选择液压驱动。通过压缩泵产生高压液体,通过压强产生巨大的推力,驱动机器人关节活动。这颇有些生物仿真的意味。 然而,液压驱动的问题也非常明显:压缩泵噪音巨大,且一旦遇到磕碰极易发生液体泄漏。加之其结构复杂、维护困难,最终导致军方失去了兴趣。 2013年,“大狗”项目终止。 #2 卖身 在那个人形机器人尚处萌芽期的阶段,波士顿动力极其超前,并不缺少关注度。 终止与军方合作后,谷歌递来橄榄枝,两家充满未来感的科技公司一拍即合。谷歌以30亿美元的价格高调收购波士顿动力。 这一年Petman 迭代而成的Altas原型机正式亮相。波士顿动力已经打造出了四足和人形机器人。 与军方合作,卖身谷歌,这一系列的举措为波士顿动力奠定了发展基调:学院派,是To G、To VC思维。 这种思维主导下,波士顿动力依然像搞学术研究一般,是申请经费模式。专心搞研发,专心做宣传拿“经费”,不顾及商业化。 2015年,Spot 的概念介绍视频走红。一年后正式问世。 这只黄色四足狗在此后多年一直是外网的“网红”。2018年,Spot开门的切片视频病毒式传播,再度火爆一时。 在社交媒体的经营方面,波士顿动力可谓颇有心得。 但投资人并不是慈善家,投资是为了回本,无法忍受一个持续亏损且看不到盈利希望的公司。谷歌最终放弃掉了波士顿动力。 孙正义成为新的买家。2017年,软银以当年的价格获得波士顿动力的控制权。 在软银的控制下,波士顿动力开始迅速商业化。 2019年,波士顿动力面向特定客户推出Spot租赁服务,每月租金最高2000 美元。 2020年,开启售卖服务,单机售价高达74500美元。 然而,波士顿动力似乎更擅长做网红,擅长做技术,却并没有去思考机器人的作用是什么。消费者不是买不起就是买不到,好不容易拿到手了还没有合适的使用场景。 Spot销量惨淡,只卖了不到400台。 彼时,软银面临巨额亏损,不得不甩卖资产自救,长期亏损的波士顿动力再次被卖身。 这一次的买家是韩国现代集团,收购价只有9.21亿美元,给到的估值是11亿。算下来,在这笔交易中,软银损失了约150亿人民币。不考虑通货膨胀因素,估值比当年谷歌收购时缩水了63%。 现代集团的这笔收购另有深意,因为此时,新能源汽车市场点燃,具身智能与新能源汽车开始融合。 机器人市场变天,波士顿动力的地位一落千丈。 #3 马斯克与Figure AI 2021年,马斯克宣布了特斯拉的人形机器人计划,一举推火了人形机器人市场。 一年后,马斯克的人形机器人Optimus问世。 到2024年,Optimus已经更新到了第三代。 马斯克用三年,走完了波士顿动力30年的路。 技术上,Optimus已经能与人共舞、分发酒水和伴手礼。马斯克畅想着未来能遛狗、修剪草坪、购物、照顾人类。 更重要的是,Optimus售价不到30000美元,是机器狗spot的不到一半。 原因也非常直接,马斯克的Optimus有物理层面的训练场景——特斯拉工厂,供应链与特斯拉高度复用,能够极限压缩成本。 当然,还有最关键的——AI能力。 Optimus开始,人形机器人开始向着通用人形机器人发展,除了具备常规的运动能力、避障能力,还在朝着具有自主能力演化。 Figure AI便是典型代表。这家2022年成立的初创公司,迅速成为创投圈的当红炸子鸡。 虽然是人形机器人公司,Figure AI更强大之处在于学习能力。 这家初创公司比马斯克更极致。仅仅1年,就推出了Figure 01,能够迅速自主执行物品抓取、搬运等任务;具有强大的学习思考能力,仅用10个小时的端到端训练,就可以自主完成煮咖啡的全流程。 不到一年,Figure 02问世,定制AI模型驱动,已经能与人类语音对话,具备自我修正的学习能力。 今年2月,Figure AI推出首个VLA模型Helix,支持双机器人同步运行;数据利用率提升,可以加速迭代。 10月,Figure 03发布,更适合应用于人工智能领域、家庭环境以及大规模生产。 Figure AI专门为工业生产服务,聚焦制造业、物流、仓储和零售等领域,从出生开始就具备商业化,很快就拥有客户。 2024年,公司就与宝马达成合作,在汽车工厂测试Figure 01。2025年,公司又签下了大客户,计划未来四年交付10万台人形机器人。 最新消息显示,Figure AI刚刚完成15亿美元融资,估值跃升至395亿美元,仅一年多时间,Figure AI估值获得了13倍的提升。 波士顿动力的机器狗和机器人,快要成为“过气网红”了。 #4 卷王 从马斯克与Figure AI开始,机器人的进化速度陡然加快。 市场已经进入商业化、AI能力、成本控制的全面比拼。 波士顿动力在自主进化能力、成本控制、商业化等方面都上有明显欠缺。 此时,中国企业开始如雨后春笋般出现,给波士顿动力身上的稻草又增加了一颗。 2021年12月,工信部等十五部门将人形机器人明确纳入未来产业重点发展方向,支持建设国家级创新平台,加速产业升级。 2023年10月,工信部印发《人形机器人创新发展指导意见》,提出“三步走”目标。 2025年央视春晚上,宇树科技的人形机器人“扭秧歌”,惊艳全球。揭开了中国企业在人形机器人市场的面纱。 中国企业虽然在AI能力上尚有差距,但是强大而完善的供应链能力却让成本控制的长板充分发挥。 当马斯克还在宣扬1万美元的价格时,宇树的第三款机器人已经做到了3.99万元。 更为关键的是,宇树已经做到了盈亏平衡,自2020年起持续盈利,媒体报道,2024年宇树净利润接近一个亿。这在全球范围内都是绝无仅有。 宇树正在进入技术与业绩的齐头前进,日前,宇树发布了新一代仿生人形机器人——Unitree H2。整体形态更加接近真人的状态,可以从容的进行舞蹈、武术展示,各关节的活动十分丝滑。 中国企业更加务实,从一开始就与产业紧密绑定。 优必选中标觅亿汽车9051万元订单,与居然之家签订500台仿真人形机器人采购协议,2025 年计划交付数百台,2026 年目标数千台。今年全年,优必选Walker人形机器人获超6.3亿元订单。 智元机器人和宇树科技中标中国移动1.24 亿元人形机器人代工订单,其中智元机器人中标7800万元的全尺寸人形标包。 除了上述企业,乐聚、傅利叶、普渡科技、银河通用、众擎机器人等企业登上舞台,这些企业有着清晰的使用场景,如工业制造、家庭服务、医疗、科研教育、配送等等。 目前,人形机器人之争,已经跳过了概念阶段,进入到全面商业化阶段。 与之相比,波士顿动力除了做网红,依然没有找到方向,商业化竟然依赖股东。今年4月,波士顿动力公司和现代汽车集团宣布深化合作计划,现代汽车集团在未来几年将购买“数万台”机器人。 去年,波士顿动力迎来了又一次重大更新。液压版Altas宣布退役,电驱版 Altas上线。 波士顿动力揭示了Atlas的六项重大技术更新。 这款机器人身价约为15万美元,折合人民币107万元。不但无法跟中国企业的性价比对比,连与Figure AI等美国企业都没有可比性。 发展多年,波士顿动力似乎始终没走出MIT校园。
首发M5芯片,2025款苹果14英寸MacBook Pro、iPad Pro今日发售
IT之家 10 月 22 日消息,苹果全新 14 英寸 MacBook Pro、iPad Pro 今日发售,两款新品均首发搭载 M5 芯片,售价分别为 12999 元起 / 8999 元起。 全新 14 英寸 MacBook Pro 和 iPad Pro 将在 10 月 17 日上午 9 点接受预购,并在 10 月 22 日发售。 据介绍,苹果 M5 芯片全方位提升,采用第三代 3 纳米工艺打造 + 新一代 10 核图形处理器架构,每颗核心皆配备神经网络加速器,图形处理器峰值计算性能较 M4 芯片提升 4 倍以上,可提升基于图形处理器的 AI 任务运行速度。 图形处理器还提供了增强的图形性能和第三代光线追踪技术,总体图形性能相比 M4 芯片提升最多 45%。M5 芯片搭载最多达 10 核的中央处理器,包括 6 颗能效核心和最多 4 颗性能核心。M5 芯片的多线程性能提速相比 M4 芯片最高可达 15%,同时还集成了 16 核神经网络引擎和媒体处理引擎,统一内存带宽提升近 30%,达 153GB/s。 全新 14 英寸 MacBook Pro 为 Apple 智能预备好,具备最长 24 小时续航能力,30 分钟可充至最高 50% 的电量,让用户能够随时随地处理专业工作流;配备 14 英寸 Liquid 视网膜 XDR 显示屏(ProMotion 自适应刷新率技术,可选配纳米纹理玻璃)、支持空间音频和杜比全景声高保真六扬声器系统、70W USB-C 电源适配器。 在连接性方面,全新 MacBook Pro 配备三个雷雳 4 端口,以及 HDMI 端口、SDXC 卡插槽、耳机插孔和 MagSafe 3 端口,可连接高速外设,驱动多台外接显示器。全新 MacBook Pro 还支持 H.264、HEVC、ProRes 和 ProRes RAW 硬件加速。 全新 MacBook Pro 搭载 1200 万像素 Center Stage 摄像头,可实现 1080p 高清视频拍摄,同时支持跟随用户移动,让其始终都在镜头画面中。用户还能借助桌上视角功能,将自己的工作台面展示给对方看。新机还拥有 3.5 毫米耳机插孔 + 录音棚级三麦克风阵列,其 HDMI 端口支持多声道音频输出。 全新 MacBook Pro 的机身采用 100% 再生铝金属,配备背光妙控键盘,78 个(ANSI)或 79 个(ISO)按键,包括 12 个全尺寸功能键和 4 个方向键(呈倒 T 形排列),支持触控 ID、环境光传感器,力度触控板可实现精准光标控制和压力感应功能。 全新 iPad Pro 搭载双层串联 OLED 超精视网膜 XDR 显示屏,支持 ProMotion 自适应刷新率技术,1TB 和 2TB 机型可选纳米纹理显示屏玻璃。新机后置 1200 万像素广角摄像头,支持 4K ProRes 视频拍摄;前置横向 1200 万像素 Center Stage 摄像头,支持人物居中、原深感摄像头系统。 全新 iPad Pro 搭载最高 10 核中央处理器的 M5 芯片(256GB 或 512GB 存储容量机型为 9 核),与 M1 芯片的 iPad Pro 相比,AI 性能最高提升 5.6 倍,其专为人工智能设计,能加速各类工作负载,为 Apple 智能预备好。新机 USB-C 接口支持雷雳 / USB 4,配备四扬声器系统、四个录音棚级麦克风。 新款 iPad Pro 支持适用于 iPad Pro 的妙控键盘,统一内存带宽超过 150GB/s,与上一代相比提升了近 30%,能帮助用户在更多应用间进行多任务处理、更快地运行人工智能模型、畅玩高要求的游戏等。新款 iPad Pro 的存储读写速度最高可达上一代的 2 倍,256GB 和 512GB 型号的起始统一内存为 12GB,比之前增加了 50%。 此外,借助 iPadOS 26 中的新窗口系统,iPad Pro 用户可体验到更流畅的多任务处理,进一步优化复杂的工作流程。IT之家注意到,iPad Pro 支持快速充电 —— 使用 40W 动态电源适配器 (最高 60W) 或者其他能提供 60 瓦或更大功率的 USBC 电源适配器约 30 分钟即可充电至 50%。 全新 iPad Pro 的蜂窝网络机型搭载 Apple 自研的蜂窝调制解调器 C1X,相比搭载 M4 芯片的 iPad Pro,能为用户带来最高 50% 的蜂窝数据性能提升,对于经常使用蜂窝网络的用户,还能减少最高 30% 的功耗。 iPad Pro 的蜂窝网络机型支持 GPS 和定位功能,用户还能享受 5G 蜂窝网络支持,借助 eSIM,用户可以快速添加新套餐。新款 iPad Pro 还搭载了 N1 芯片,这是一款由苹果设计的新型无线网络芯片,支持 Wi-Fi 7、蓝牙 6 和 Thread 协议。 IT之家附两款新品价格如下: 全新 14 英寸 MacBook Pro 16GB+512GB:12999 元起 16GB+1TB:14499 元起 24GB+1TB:15999 元起 纳米纹理显示屏 +1100 元 24GB 统一内存 +1500 元 32GB 统一内存 +3000 元 1TB 固态硬盘 +1500 元 2TB 固态硬盘 +4500 元 4TB 固态硬盘 +9000 元 96W USB-C 电源适配器 +135 元 预装 Final Cut Pro +1998 元 预装 Logic Pro +1298 元 全新 iPad Pro 11 英寸机型:8999 元起(12GB+256GB)/ 10699 元起(12GB+512GB)/ 14099 元起(16GB+1TB)/ 17499 元起(16GB+2TB) 13 英寸机型:11499 元起(12GB+256GB)/ 13199 元起(12GB+512GB)/ 16599 元起(16GB+1TB)/ 19999 元起(16GB+2TB) 每位顾客限购 6 部 11 英寸 iPad Pro 每位顾客限购 6 部 13 英寸 iPad Pro 1TB / 2TB 机型可选纳米纹理显示屏玻璃
MacBook Pro M5 首发评测:苹果最接近游戏本的一次?
在过去的很长时间里,「用 Mac 打游戏」一直是网络上一个长久不衰的梗。 但是伴随着近几年苹果深耕 macOS 软件生态、开始主动加大和游戏厂商的合作力度之后,我们得以在 Mac 上见到越来越多经典 IP,「用 Mac 打游戏」听起来似乎不是那么离谱了。 而这背后的一切,除了苹果难得的主动合作态度之外,更要归功于 Apple Silicon 自身在性能和功耗方面的提升。 这不,苹果又在前两天发布了使用 M5 处理器的三款新品:iPad Pro、MacBook Pro 以及 Vision Pro。 爱范儿收到的这台 14 寸 MacBook Pro 是 10+10 核心的 M5 标准版,内存规格为 M5 所支持的最大容量 32GB,以及 1TB 的硬盘,和一块纳米纹理玻璃的抗眩光屏幕: 和今年有抗眩光涂层的 iPhone 17 Pro 相比,MacBook Pro 上纳米纹理玻璃 + 抗反射涂层的组合,无论是在泛光的室外还是充满点光源的室内,消除反光的效果都相当出色。 但 M5 MacBook Pro 的外围硬件和前代其实没有区别,真正让它脱颖而出的,还得是机身里的这块 M5 处理器。 今年的 M5,是继 M3 和 M4 以来,苹果连续第三年推出 3nm 处理器了。M5 的制造工艺换成了 A19 Pro 同款的第三代台积电 3 纳米工艺(N3P)。 换句话说,和 A19 Pro 师出同门的新架构,让 M5 的能效比得到了进一步提升,也让 MacBook 原本就很强的离电续航更上一层楼,哪怕是 14 寸机型也能做到「电脑续航比人长」。 更重要的是,今年 M5 处理器的升级大部分集中在 GPU 上。N3P 工艺优秀的能效比,让这一次 MacBook Pro 的性能释放更加大胆。 就拿 macOS 平台上最主流的 3A 大作《赛博朋克 2077》来说,M5 的 MacBook Pro 使用游戏默认的「for this mac」配置时,能够在大部分画质选项为中或高的前提下实现离电 30 帧的表现。 而打开 FSR 和帧生成后,2077 则可以以接近游戏默认的「中画质」配置里跑到稳定 50-60 帧左右,同时维持你在星巴克的座位不变,不用接电源。 类似的情况也出现在 App Store 上的《控制:终极合辑》,以及爱范儿编辑部最近都在玩的《逃离鸭科夫》中。只需要一点点画质微调,M5 MacBook Pro 都可以稳在 60 帧以上: 换个角度看,这个体验其实已经接近了当年 GTX 1660 的表现。App Store 和 Steam 上越来越丰富的游戏库,满足了 Mac 用户在出差高铁上也能玩玩搜打撤的愿望。 另一方面,M5 最大的升级点还在于它为每颗 GPU 核心都内置了「新一代神经网络加速器」,相当于让 M5 有了个 10 核的 NPU。 这样一来,M5 的 AI 性能——尤其是本地 AI 性能,就有了相当坚实的基础。 以苹果在官方视频中演示过的 Msty Studio 为例,作为一款功能类似 Ollama 但模型库更丰富的「开源模型本地化部署工具」,Msty Studio 最主要的功能,就是可以让你的 Mac 在断网情况下跑语言模型。 我们以最体现性能的「首词元响应速度」表现为标准可以看到,纯本地运行的 DeepSeek-R1:8b 在 10 核心 GPU 的 M5 上运行时,对于相同的一段生成指令,它的速度追平了 24 核 GPU 的 M1 Max: 相当于 M5 用不到一半的核心数量,就可以获得与两三年前 Pro 甚至 Max 规格的 Apple Silicon 相当,同时发热量和功耗还控制在一个相当优秀的水平。 更重要的是,类似的表现也可以在其他本地化的 AI 场景中复现。 比如在纯本地运行的 AI 视频画质增强工具 VidHex 中,在进行视频细节增强时,10 核的 M5 同样出现了追平甚至反超 24 核 M1 Max 的现象。 但在测试过这么多本地 AI 工具之后,我们也不由得产生了一个疑惑: 开源的本地 AI 模型虽然免费,但部署起来比较麻烦,其中很多也没有非常直观的图形界面、必须在终端里面用 CLI(命令行界面)去微调—— 而那些收费的本地 AI 工具,实际上就是在卖一个打包好的 GUI(图形界面)。现在云端模型不仅性能更强,价格也逐渐亲民,你觉得「本地化部署和运行 AI 模型」能够对你的电脑购买决策产生影响吗? 总之,对于 M5 的端侧 AI 性能,爱范儿认为:苹果官网上宣传的「相比 M1 有四到六倍的提升」是比较贴切的,不仅是可以稳定的「10 核打 24 核」,同时还有更优秀的发热和功耗控制。 M5 这样一来,就很难不让人期待明年 M5 Pro 和 M5 Max 的表现了,或许可以催生另一批多台 Mac Studio 组网做超算的潮流。 不过就在前两个月,M4 家族的 MacBook Pro 刚刚经历过一轮国补,新的 M5 基础款并不能和 M4 Pro/Max 形成替代关系。 因此今年值得升级 M5 基础版 MacBook Pro 的,更多还是那些仍在坚守 M1 或 M2 系列的老用户,就比如爱范儿编辑部那位还在用 M1 Max 的编辑。 至于爆料中那个模具更新、去除刘海的新 MacBook,则至少要到明年的 M6 机型才有希望了。如果你是 M4 家族的用户,那么小挤一管牙膏的 M5 并不是具有说服力的换机理由。 总之,爱范儿今年对于 M5 MacBook Pro 的结论,依然与前两代相同: Mac 依然是一个「你必须非常明确自己的需求」才值得入手的优秀工具——如果你不确定自己需不需要一台 Mac,那么就是不需要。
国行iPhone Air正式上市!苹果提醒办理eSIM前完成这三步
7999元起 国行iPhone Air正式上市开售 苹果提醒办理eSIM前完成这三个步骤 快科技10月22日消息,今日,iPhone Air国行版正式上市开售,售价7999元起,这是中国大陆第一款完全取消实体SIM卡的手机,全面改用eSIM,开启无卡时代。 苹果官网还上线了办理iPhone Air eSIM服务的介绍,在中国大陆,iPhone Air支持中国移动、中国电信和中国联通的eSIM服务。 据介绍,在iPhone Air上激活eSIM,需前往运营商的线下营业厅办理,营业厅工作人员将协助用户完成必需的ID检查并激活eSIM。 苹果表示,用户去运营商的线下营业厅之前,请完成以下步骤: 1、设置好你的iPhone Air。 2、将当前iPhone中的数据传输到你的iPhone Air。如果你在前往运营商的线下营业厅之前无法传输你的数据,请按照以下方式通过iCloud备份你当前的iPhone: 在当前iPhone上,打开“设置”。 轻点你的姓名。 轻点“iCloud”。 轻点“iCloud 云备份”。 轻点“立即备份”。 3、携带政府签发的身份证件或护照;若适用的话,请同时带上现有的SIM卡。 在中国大陆购买的同一台iPhone Air上,用户最多可以拥有两个eSIM。 需要注意的是,在中国大陆只有型号为A3518的iPhone Air支持eSIM,所有其他iPhone机型都无法安装中国大陆运营商提供的eSIM描述文件,包括在中国大陆境外购买的iPhone机型。
告别VR卡顿:IEEE点云压缩标准P3366.1落地
IT之家 10 月 22 日消息,IEEE 官网于 10 月 16 日发布博文,正式发布了 P3366.1 点云压缩国际标准,这是其是面向体积数据压缩的 IEEE 3366 系列国际标准的第一个完成标准。该标准由腾讯多媒体实验室作为主要牵头方和核心技术贡献者,历时四年完成制定。 IT之家注:点云(Point Cloud)是在三维空间中一系列点的集合,这些点共同构成了物体的外形轮廓和表面信息。可以把它想象成用无数个微小的三维坐标点“画”出的一个 3D 模型,常用于自动驾驶汽车的环境感知、3D 扫描和虚拟现实建模。 P3366.1 标准的推出,旨在应对日益增长的现实需求。随着 3D 感知技术普及,海量的点云数据(包含复杂的几何与属性信息)对用户的设备性能及网络带宽提出了极高要求,其传输与存储成为制约技术发展的瓶颈。 通过建立一套高效、统一的压缩技术规范,P3366.1 能够大幅降低数据体量,从而为各系统和平台无缝集成点云数据扫清障碍,有效提升数据处理效率与可用性。 该标准的确立对于多个前沿科技领域具有至关重要的意义。在虚拟现实 / 增强现实(VR / AR)应用中,高效压缩能保证低延迟数据传输,为用户提供流畅、高质量的沉浸式体验。 在自动驾驶领域,实时、精准的环境感知依赖于海量点云数据的快速处理,而 P3366.1 为此提供了技术保障。此外,该标准还将在数字文化遗产保护、高端工业制造和智慧城市建设等场景中发挥核心作用。 P3366.1 不仅为行业提供了统一的压缩工具、语法和解码流程,更有助于催生点云技术在新兴行业的创新应用,如沉浸式通信和数字孪生城市。它将促进业界在数据收集、存储、传输和使用方式上形成统一的最佳实践,从而加速技术的商业化落地,为整个 3D 视觉产业链的成熟开辟新道路。
刚刚,OpenAI发布首个AI浏览器ChatGPT Atlas!谷歌最怕的来了
新智元报道 编辑:编辑部 【新智元导读】OpenAI发布AI浏览器ChatGPT Atlas:原生嵌入ChatGPT,提供侧边栏、浏览器记忆与智能体模式,可在页面内理解意图并自动完成填表、下单等任务。 OpenAI再次向谷歌发起冲锋! 就在刚刚,OpenAI发布了一款以ChatGPT为核心打造的全新浏览器——ChatGPT Atlas。 核心功能如下: 内置ChatGPT:可通过侧边栏在任意页面调用 浏览器记忆:搜索你的浏览记录 AI智能体:可在页面上执行操作 自动播放 手快的网友,已经用上ChatGPT Atlas发推了! 网友「swyx」表示,这是OpenAI在获取完整用户上下文、打造完全个性化通用人工智能方面,迈出的最关键一步—— 下一代操作系统,就是浏览器。 ChatGPT Atlas到底给谷歌Chrome带来了多大威胁? 产品刚一发布,谷歌母公司Alphabet的股价今日应声下挫超2%。 上手简单 但智能体模式要付费 上手非常简单:首次打开ChatGPT Atlas时,登录你的ChatGPT账户,并从当前浏览器导入书签、已保存的密码和浏览历史即可。 顺便一提,设成默认浏览器后还可获赠7天「会员」。 今天,全世界的macOS用户都可以下载ChatGPT Atlas使用,包括免费、Plus、Pro及Go用户。Windows、iOS和Android版本很快就会推出。 与此同时,Beta版已经提供给Business用户;开启相关权限后,Enterprise和Edu用户也能使用。 而最为关键的「智能体模式」,则会以预览版的形式向Plus、Pro和Business用户开放。(付费only) 看来,又有一波初创要被杀死了。 AI智能体正式「接管」浏览器 有了Atlas,ChatGPT可以在网络的任何角落与你同行: 在当前所在的窗口中,直接提供帮助,理解你的意图,帮你完成任务,全程无需复制粘贴或离开页面。 由于Atlas内置ChatGPT记忆功能,因此对话可以随时调用过往的聊天记录和细节,助你高效完成新任务。 使用Atlas越多,ChatGPT就会变得越智能、越得力。 浏览器记忆功能让ChatGPT能够记住你访问过网站的上下文,并在你需要时随时调用。 这意味着你可以向ChatGPT提问,例如:「找出我上周浏览过的所有职位招聘,并总结一下行业趋势,帮我为面试做准备。」 同时,浏览器中的记忆也完全由你掌控:在设置中,你可以随时查看或归档记忆,删除浏览历史也会一并删除所有相关的浏览器记忆。 通过智能体模式,ChatGPT还可以在Atlas中为你分担工作。 经过改进,它能更好地结合你的浏览上下文,运行速度更快、用途更广,如今更擅长研究分析、任务自动化,并能在你浏览网页的同时,帮你规划活动或预订约会。 当智能体控制浏览器时,光标的方向和我们常用的正好相反 对此,有网友在试用之后进行了总结: 智能体模式能帮忙搞定很多事,比如在浏览器里用保存的密码订咖啡、填TSA预检申请表。 当智能体所在的标签页处于后台时,会被内容拦截器干扰。 有些网站会阻止Atlas总结内容。 智能体操作起来非常像真人,比如它会通过点击弹窗旁边的空白区域来关闭弹窗。 UI很赞,新手引导也超级丝滑。它非常巧妙地利用了Mac的全屏空间,动画效果堪称炸裂。 顺便一提,Atlas依然是基于谷歌的Chromium内核打造。 就是看这满屏的广告,不知道能不能支持屏蔽插件。 工作流无缝衔接 新标签页是你在Atlas中的起点。无论是提问还是输入网址,都能在同一个地方获得更快、更有用的结果。 如果想探索聊天以外的特定结果类型,可以切换至搜索链接、图片、视频和新闻等标签页。 打开一个标签页 接下来,不管你是打开什么网页,点击「询问ChatGPT」即可打开ChatGPT侧边栏,无需离开当前窗口,就能进行内容总结、概念解释或处理各项任务。 ChatGPT能够理解您当前浏览的页面详情,因此它的回复会更贴切、更有帮助。 询问ChatGPT 当你在任意文本框中书写时,ChatGPT也能随时提供帮助,给出实时的编辑和修改建议。 使用光标 为你量身打造 ChatGPT能记住你探索过的内容,并为你建议下一步行动,无论是返回最近访问的页面、深入研究某个主题、发现相关灵感,还是将日常任务自动化。 个性化建议 当你有需要时,只需开口即可。 输入「重新打开我昨天看过的那些鞋子」或「整理一下标签页」,剩下的就放心交给ChatGPT吧。 随心所问 更强能力,更强掌控 在你浏览网页时,你能看到什么、记住什么,完全由你掌控。 你可以清除特定页面的记录,清空全部浏览历史,或者打开无痕窗口临时退出ChatGPT登录状态。 如果你开启了浏览器记忆,ChatGPT将会记住你浏览内容的关键细节,从而优化聊天回复并提供更智能的建议。 比如,根据你近期的活动创建待办事项清单,或基于你浏览过的商品继续研究节日礼物。 浏览器记忆属于你的ChatGPT账户隐私,并由你全权控制。 你可以在设置中查看所有记忆,归档不再需要的内容,或通过清除浏览历史来删除它们。 即使开启了浏览器记忆,你也可以随时通过地址栏的开关决定ChatGPT是否可以查看某个特定网站。 当页面可见性关闭时,ChatGPT将无法查看该页面内容,也不会从中创建任何记忆。 默认情况下,OpenAI不会使用你浏览的内容来训练模型,但你也可以选择开启。 家长控制功能同样适用,并且还添加了如关闭浏览器记忆和智能体模式等新的选项。 让AI帮你做事 在Atlas中,你现在可以直接让ChatGPT采取行动,就在你的浏览器里为你完成各种任务。 此前OpenAI推出的ChatGPT智能体,现已正式原生集成于Atlas中,并且运行速度更快。 想象一下,你正计划一场晚宴,心中已有一份食谱。你可以把食谱交给ChatGPT,让它帮你找到一家生鲜商店,将所有食材加入购物车,并下单送到你家。 在工作中,你可以让 ChatGPT 打开并阅读过去的团队文档,执行新的竞品调研,并将洞察汇总成一份团队简报。 当你提出请求时,ChatGPT可能会询问是否可以打开标签页并执行点击操作来完成任务。你也可以直接选择智能体模式按钮,让ChatGPT开始行动。 在构建Atlas中ChatGPT的智能体能力时,OpenAI增加了多重保障措施以应对新出现的风险,例如: 它无法在浏览器中运行代码、下载文件或安装扩展程序。 它无法访问你计算机上的其他应用程序或文件系统。 在金融机构等特定敏感网站上执行操作时,它会暂停,以确保你在监督其行为。 你可以在登出模式下使用智能体,以限制其对敏感数据的访问,并降低它以你的身份在网站上执行操作的风险。 ChatGPT的智能体能力依然存在风险。除了在代表你行动时可能犯错外,智能体还易受隐藏恶意指令的操纵。 这些指令可能被藏匿在网页或电子邮件等地方,意图覆盖ChatGPT智能体的正常行为,可能导致从你已登录的网站窃取数据,或执行你非预期的操作。 总的来说,此次发布标志着我们正迈向一个全新的未来: 在这里,大部分网络活动都将通过智能体系统完成,你可以把常规工作都交给它处理,从而专注于真正重要的事情。 氛围编程(vibe coding)是AI辅助的起点,而OpenAI想通过ChatGPT Atlas让所有人都能过上氛围生活(vibe lifing),享受AI伙伴随时介入带来的高效生活。 OpenAI表示,Atlas浏览器还在持续进化中,后续产品路线图中将包括: 支持多用户配置文件,满足不同使用场景; 提升开发者工具体验; 为使用Apps SDK的开发者提供更多方法,提升他们应用在Atlas中的可发现性。 隐藏在浏览器背后26年的男人 首先上场的是,Atlas项目工程负责人Ben Goodger,Atlas项目产品负责人Adam Fry,以及Atlas项目首席设计师Ryan O’Rouke。 随后做介绍的是,Atlas项目产品负责人Pranav Vishnu,Atlas团队工程师Justin Rushing,以及Agent功能研发负责人Will Ellsworth。 Ben Goodger是本场直播出席人员中最值得介绍的一位。 拓展阅读:隐藏在浏览器背后25年的男人,被奥特曼找到了!OpenAI剑指Chrome霸权 他是一位浏览器专家,从上世纪开始就开始专注浏览器开发工作。 从网景到火狐,再自2005年起加入谷歌开发Chrome,他是除了当时的领导、也是如今的CEO劈柴哥之外,最接近「Chrome之父」的一位对Chrome开发贡献最大的人员。 2024年,他以谷歌副总裁的身份离开谷歌转投OpenAI,全权负责ChatGPT Atlas的技术开发工作。 而如今ChatGPT Atlas经过一年半的孕育终于付梓,他难掩喜悦,招聘广告也接踵而至。 AI浏览器:群雄逐鹿 在OpenAI DevDay大会上,ChatGPT负责人Nick Turley接受媒体采访时表示,他的灵感来自「浏览器正在重新定义操作系统的样子」。 他指出,浏览器已经彻底改变了人们在线工作的方式,而ChatGPT也正在引发类似的变革。 早在2024年7月,OpenAI就低调发布过一款原型搜索引擎,名为SearchGPT。 但到了现在,AI浏览器已经成为AI技术角逐的新前线。 今年夏季,AI新锐公司Perplexity推出自家浏览器产品Comet,一度引发热议。 它主打「简化上网体验」,摒弃传统的谷歌搜索结果「长截图」,转而提供一个「答案引擎」:先给你几条相关链接,再直接用AI回答你的问题。 不仅如此,它还能: 扫描你所有打开的网页标签;总结视频内容;清理邮件收件箱;甚至能在Amazon上代你购物。 9月,谷歌宣布将把自家的Gemini AI助手更深度集成进Chrome浏览器。 自动播放 未来几个月,Gemini将在Chrome中升级各种功能: 不过,谷歌目前尚未透露确切的上线时间。 随着OpenAI的Atlas正式登场,AI浏览器之战正在升温。 当然,OpenAI能否真正撼动全球超30亿用户的Chrome浏览器,还未可知。 目前来看,AI浏览器在硅谷已成为炙手可热的风口,但它们在大众市场的影响力仍待检验。 参考资料:HJK https://openai.com/index/introducing-chatgpt-atlas/ https://www.youtube.com/watch?v=8UWKxJbjriY

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。