EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
新思想引领新征程丨加快建设人与自然和谐共生的美丽中国
   今天是六五环境日,主题是“美丽中国我先行”。建设美丽中国,是习近平总书记念兹在兹的“国之大者”,他强调,要牢固树立和践行绿水青山就是金山银山的理念,把建设美丽中国摆在强国建设、民族复兴的突出位置。在习近平生态文明思想指引下,建设美丽中国日益成为全体人民的自觉行动,共同谱写人与自然和谐共生的中国式现代化新篇章。   今天,绿色成为美丽中国的鲜明底色。甘肃八步沙林场今年将造林绿化两万亩,从上百公里外调配到这里的黄河水,正在浇灌新的绿色希望。夏夜的北京,新疆的绿电跨越3000公里,“点亮”城市。如今,绿电在北京全社会用电量占比已近三成。   生态兴则文明兴。党的十八大以来,以习近平同志为核心的党中央把生态文明建设作为关系中华民族永续发展的根本大计。从大江南北到长城内外,从城市绿地到乡村沃野,一次次基层考察,一场场重要会议,总书记站在人与自然和谐共生的高度,为中华民族永续发展的根本大计掌舵定向,引领美丽中国建设迈出重大步伐。他指出,要把绿色发展理念贯穿到生态保护、环境建设、生产制造、城市发展、人民生活等各个方面,加快建设美丽中国。   国务院发展研究中心资源与环境政策研究所研究员 谷树忠:党的十八大以来,我国生态文明建设取得举世瞩目的历史性成就,根本在于习近平总书记的领航掌舵,在于习近平生态文明思想的科学指引。这一思想科学系统、开放包容,始终站在时代前沿,引领时代发展,必将在指引美丽中国建设、实现人与自然和谐共生的中国式现代化伟大实践中不断丰富发展,也必将在指导实践、推动实践中充分展现出科学理论的强大伟力。   沿着总书记指引的方向,各地区各部门坚定不移走生态优先、绿色发展之路,推动美丽中国建设不断取得新成效。   今天发布的《2024中国生态环境状况公报》显示,2024年,地级及以上城市PM2.5平均浓度为29.3微克/立方米,我国成为全球改善空气质量速度最快的国家;全国地表水优良水质断面比例首次超过90%,长江连续5年、黄河连续3年干流水质稳定保持在Ⅱ类;作为全球森林资源增长最多的国家,我国森林覆盖率超过25%,“绿色家底”不断增厚。   山东省聊城市市民 邓广林:现在咱们城市绿化特别好,这两年家门口建了好多新的公园,特别舒服,幸福感直线上升。   美丽中国建设迈出新步伐。今年以来,美丽中国先行区、美丽城市、美丽乡村等文件出台,美丽河湖、美丽海湾建设深入实施,美丽中国建设实施体系不断完善。全国各地正在以更高标准打好一批标志性战役,力求基本消除重污染天气、黑臭水体等百姓反映强烈的突出问题,着力解决噪声、油烟等“家门口”的环境问题,持续满足人民群众对优质生态环境的新期盼。   生态系统质量稳步提升。在陕西周至国家级自然保护区,今年出生的金丝猴宝宝有36只,目前秦岭金丝猴已达6000多只。以国家公园为主体的自然保护地体系建立以来,一条条生态廊道得以贯通,一片片自然保护地得到整合,大熊猫、雪豹等旗舰物种野外种群数量持续增长。   高质量发展的绿色底色更加鲜明。我国首个“沙戈荒”光伏实证基地在内蒙古启用,150多种光伏实验方案将助力新能源建设提速。全国碳市场正在稳步扩大行业覆盖范围,推动“双碳”目标稳步落实。绿色分拣中心将在今年突破1000个,逐步完善废旧物资回收网络,以发展“含绿量”提升经济“含金量”。绿色生活方式正成为社会新风尚。绿色出行、以旧换新、垃圾分类融入日常,3500万人加入生态环境志愿者队伍,共同推动美丽中国目标一步步变为现实。
吉利杨学良火力全开:“内卷”必将走向绝路,常压油箱事件必须有个结论
原标题:山城激辩第二天|吉利杨学良火力全开:任何“内卷”必将走向绝路 作者|陈艳 编辑|张述冠 汽车内卷这场“厮杀”,终点究竟在何方?怎样才是汽车行业健康可持续发展的道路。 6月7日,2025汽车行业重庆论坛第二天,吉利控股集团高级副总裁杨学良在“2025中国汽车重庆论坛”上发表演讲,围绕行业竞争、法律规范及自律等议题提出多项犀利观点,核心内容是反对造假售假,反对价格战,打击内卷,呼吁加强行业自律,这些观点引发行业广泛讨论。 “过去一年,中国新能源汽车产业从价格战发展到内卷式恶性竞争;从口水战发展到人身攻击战;从人要吹灭鬼灯,发展到鬼要灭掉人灯;从狗咬人发展到人咬狗,真叫人一头雾水。虽然行业内的人对其中的真相心知肚明,但对社会公众而言,确实难辨是非,黑白难分。”杨学良在论坛上言辞激昂地指出。 企业是行业自律的主体,企业不自律则行业不可能自律。杨学良指出,企业与企业之间的竞争,本质上讲就是人与人的竞争,行业乱象根源在于人性的恶得到了放大。同时,杨学良表示:“有些企业高举内卷大旗,有些企业争当卷王,以卷为荣,如果这样下去,国家巨额财政支出而产生的汽车产业良好的生态,可能被这些所谓的卷王带向邪路。”杨学良强调,一定要珍惜这来之不易的发展成就,不能为一己之私搞内卷式恶性竞争。 与此同时,杨学良还指出,当前中国汽车行业存在两个谜团:一是人咬狗还是狗咬人之谜;二是人吹灭鬼灯还是鬼摧毁人灯之谜。 这两个谜团的谜底由谁来解开呢?杨学良表示:“都说自己是好人,都说自己被冤枉了。如果是人咬狗,那就找这个人麻烦,且依法惩罚;如果是狗咬人,那就应对这条狗加强训练,不能乱咬人。” “另外到底是人还是鬼,不如大家都到法庭上摆事实、找依据、讲道理,法庭是人开的,讲鬼话一定会被法官识破。而现在全世界的同行们都在看中国汽车行业的乱象,都在关注发生在中国汽车行业的‘特别事件’,如果长期不解开谜底,那就关系到法治中国的形象。”杨学良表示。 他认为,汽车行业应该体现公平透明的竞争原则,尤其在关系到安全、环保等方面的问题上不能含糊不清。公众最关心的问题是法律的公平与正义,中国是法治国家,全面依法治国应该在关系到民生的汽车行业充分体现出来。 以下是杨学良在此次论坛上演讲的精彩节选(有删减): 痛批“拉踩论” 呼吁法治化经营 当前,在中国出现的汽车行业乱象,其根源就在于此,比如汽车行业内周知的常压油箱和排放严重不达标事件,就是典型的违法犯罪案件,自长城汽车举报到今天,时间已经超过两年了,还没有结论。 这件事全球同行很关注,全国同行也很关注,到底谁对谁错?到底谁真谁假?一定要有一个公开的结论,不能不了了之。如果这么一个重大的案件都可以不了了之,那行业又如何实现自律呢? 其实行业的人是知道真相的,因为大家都会做拆车对比测试,我们测试得出的结论与长城举报的内容信息是完全一致的,魏总是个正直的人、诚实的人。很遗憾的是他被舆论误解,市场、社会传播不知道哪里出了问题,社会上散播的信息与事实相反,这是一个很可怕的现象,全行业都在揣摩、都很困惑,这就像掩耳盗铃,这种神神秘秘的局面,令市场和同行缺乏是非方向感。 去年重庆论坛抛出了“牌桌论”,今年抛出了“拉踩论”、“又蠢又坏论”,这算不算贼喊捉贼,我不知道长城举报比亚迪油箱造假排放造假违犯了什么论?是不是又蠢又坏又拉踩?不能用贼喊捉贼的方式来玩弄是非,不能用非蠢即坏来取代法治,中国是法治国家,经营须在法律轨道上。 值得欣慰的是,这些问题已经引起了国家部委的高度重视。5月20日,国家发改委五月新闻发布会,重点发布了内卷式竞争的问题。指出有些企业以低价、超低价,有的时候甚至是低于成本价来开展竞争,有的制假售假,以次充好,可以说这些都突破了市场竞争的边界和底线,扭曲了市场机制,扰乱了公平竞争的秩序,必须加以整治。 内卷是自杀式恶性竞争 内卷式恶性竞争将会把中国汽车工业带向集体沦陷的险境。内卷是最低级的竞争行为,是经济界、学术界普遍认同的自杀式恶性竞争,而今天的中国汽车界正在上演,且越演愈烈。有些企业高举内卷大旗,有些企业争当卷王,以卷为荣,如果继续这样卷下去,国家巨额财政支持而产生的汽车产业良好生态可能被这些所谓的卷王带向邪路。 任何搞内卷的企业都必将走向绝路。对吉利而言,无论行业如何变幻,无论友商如何内卷,吉利永远不搞内卷,永远不做卷王,永远不搞内卷式恶性竞争。吉利将坚持走开放式良性竞争的发展道路,坚持合作共赢、外延发展的市场竞争原则。我们不简单地打价格战,我们要在保持价格优势的前提下,打价值战、技术战、品质战、服务战、品牌战、企业道德战。 行业自律是汽车产业健康发展的守护神 行业自律是中国汽车产业健康发展的守护神。虽然汽车行业内人都知早已签订过《汽车行业维护公平竞争市场秩序承诺书》,做出过承诺:坚持遵守行规行约,规范市场营销活动,维护公平竞争秩序。注重营销宣传方式方法,不夸大宣传、不虚假宣传,不为吸引眼球、增加获客而对消费者进行误导性宣传。发扬质量为先、品质为本的工匠精神,以高质量产品,高品质服务,满足人民对美好生活的需求。 但签约方是否信守承诺,业内说法不一。 企业是行业自律的主体,企业不自律行业不可能自律。企业是由人构成的,人的自律就是企业的自律,而人的自律由人性决定的,如果没有强制措施,人性恶的一面就会催生大量谎言,伤害社会;如果依法惩罚违法犯罪分子,那么人性善良的光辉就会照亮人间,汽车行业自律就会成为现实。 企业与企业之间的竞争从本质上讲是人与人之间的竞争,行业乱象的根源在于人性的恶得到了放大,人性的伪没有被识破,假话到处行,真话不可行,有法不依、违法不究、执法不严,这是中国汽车工业乱象的根源。 以法为剑!汽车同行之间相互监督 如果行业自律失灵了,法律不能缺位,应当及时发挥作用。治理行业乱象要从依法合规开始,有法必依、违法必究、执法必严是保证行业健康发展的良药。汽车产业是民生产业,关系到国民的切身利益,一定要确保汽车行业的透明度不打折扣,一定要让非法犯罪行为无处可藏,确保汽车行业在国家法律框架内运行,不让老实人吃亏,不让遵纪守法者吃亏,只有坚持这个原则,才能保证行业有序健康发展。 内卷不仅威胁到行业的健康发展,消费者也将深受其害。卷字一日不消,内卷发动者一日不改邪归正,中国汽车就不可能由大变强,真正走向全球。 鼓励汽车企业同行间相互监督,相互尊重,有些国家还对举报者发重奖。这话听起来好像很矛盾,而事实上相互监督与相互尊重是不矛盾的。君子坦荡荡,小人常戚戚,同行间相互监督就是相互尊重,同行间的竞争就是建立在依法公平、透明竞争基础上的比赛,只有在阳光下比赛,才能体现相互尊重,市场竞争就是公开赛。不公平的竞争就是对同行的不尊重。 同行间为什么要相互监督、相互尊重?因为同行间的行为与同行们的利益相关联,如果有些企业通过损害公共利益或通过低于行业标准的产品参与市场竞争,或通过假冒产品欺骗市场,欺骗国家获得巨额利润,这就破环了行业规矩,伤害了同行利益,也伤害了行业形象,所以同行间应该相互监督、相互尊重。 最后呼吁中国汽车工业的同行们,望大家依行业规矩与所签协议,相互监督、彼此尊重,公平公开地良性竞争。我们携手同行,使命是推动产业向好发展,绝非造假售假。企业自律的前提是依法合规经营,做到有法必依、违法必究、执法必严,方能保障行业自律。
这个拉美小国拒绝了马斯克的星链 坚持使用中国卫星
在巴西农村的星链 凤凰网科技讯 北京时间6月9日,据《纽约时报》报道,虽然埃隆·马斯克(Elon Musk)的星链已将互联网带到了南美的一些最偏远地区,但玻利维亚却将其拒之门外,而是继续使用中国卫星。 在玻利维亚,网页加载速度极其缓慢,视频会出现卡顿和中断的情况。在玻利维亚最大城市之外的地区,最近的网络信号有时也要翻越崎岖的山路历经数小时才能抵达。 因此,当马斯克的星链提出为玻利维亚提供来自太空的高速、实惠的互联网服务时,许多人本以为这个拥有1200万人口的安第斯山脉国家会欣然接受。然而,玻利维亚却拒绝了这一提议。 SpaceX推出的卫星互联网服务星链,已在南美取得了显著进展,几乎覆盖了该地区的所有国家,为最偏远的角落带来了高速网络,甚至深入亚马孙雨林,连接了与世隔绝的原住民社区。 然而,星链的扩张在玻利维亚遭遇了阻力。该国去年拒绝为其发放运营许可。专家与官员表示担忧:星链在其开展业务的每个国家都获得了不受约束的主导地位。玻利维亚则选择继续依赖本国自有、由中国制造的卫星系统。 担心马斯克的影响力 在拒绝星链进入的问题上,玻利维亚并不孤单,它和其他国家都开始担心,SpaceX及其CEO马斯克通过掌控全球政府、军队和民众依赖的通信网络施加政治影响力。 星链在加勒比地区、欧洲以及南非也遭遇了类似阻力。马斯克声称“星链没有替代品”,并频繁使用他本人拥有的社交平台X推广自己的右翼政治立场,对自己掌握的权力也毫不讳言。 “各国已经意识到,不能只依赖单一势力。”英国咨询公司Analysys Mason全球航天业务主管安托万·格勒尼耶(Antoine Grenier)表示。 玻利维亚的行政首都拉巴斯,该国网速很慢 尽管星链项目在其他地方取得了成功,但玻利维亚政府却对其持怀疑态度。玻利维亚当局和专家称,他们所担忧的是,星链项目可能会引发不公平竞争,并损害该国的主权,因为这会让过多的控制权落入一家强大的外国公司手中,而该公司可能会试图利用其影响力来影响玻利维亚的相关法规以使其自身受益。 玻利维亚航天局局长伊万·萨姆布拉纳(Iván Zambrana)表示,星链在技术上“优于”玻利维亚现有的互联网服务。 不过他补充道,监管机构必须制定规则,确保星链为玻利维亚经济做出贡献,并“在公平的条件下竞争”,不能削弱本土互联网供应商。 “任何来我国做生意的公司都将分走一块蛋糕,而这块蛋糕目前是属于我们本国企业的。”萨姆布拉纳表示。 继续用中国卫星 萨姆布拉纳淡化了玻利维亚对星链的需求,坚称玻利维亚目前使用的中国制造卫星“可靠”,并能提供覆盖全国的互联网服务。 “没有任何一个地方是这些服务无法覆盖的。”他表示。 目前,玻利维亚拥有一颗中国制造的通信卫星,自2013年发射后一直在运行。这颗卫星目前由玻利维亚航天局负责管理。 现在,这颗卫星正接近其寿命终点,预计最早可能在2028年因燃料耗尽而停止运行。 玻利维亚驻华大使乌戈·西莱斯(Hugo Siles)表示,玻利维亚仍在评估如何替代这颗卫星,玻方已与中国的上海垣信卫星科技有限公司(SpaceSail)进行了初步磋商,探讨使用其正在建设的卫星网络的可能性。 “我们一直在与中国合作,因为我们认为,中方完全尊重玻利维亚的法规和国家主权。”西莱斯表示。 根据上海市政府的千帆星座项目,上海垣信卫星计划在今年发射648颗低轨卫星,到2030年该公司的在轨卫星规模将达到1.5万颗。 “如果说近期有谁能与星链一较高下,非他们莫属。”康奈尔大学机械与航空航天工程系助理教授格雷戈里·法尔科(Gregory Falco)表示。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
我在闲鱼夜市,看到年轻人的“赛博”夜生活
闲鱼,真的无边界。 这次它“盯上”年轻人的夜生活。从6月6日起,闲鱼推出全新的内容频道“闲鱼夜市”,每晚20:00-24:00开市。开市时间内,用户只需要通过闲鱼首页顶部入口或者搜索“闲鱼夜市”,就可以进入“闲鱼夜市”。 白天,用户也可以搜索“闲鱼夜市”,进入首页,获取当天夜市的节目单,看看会有哪些明星、摊主即将营业。我在体验中发现,在搜索框里输入“闲鱼直播”,也可以在直播页面找到闲鱼夜市的入口。 闲鱼夜市节目单显示,每晚夜市都有不同主题的场景设置。比如周一是“开卷吧夜市”,提供技能服务和咨询,在夜市寻求能人答疑或者咨询一些专业问题。 图源:唐辰截图 根据官方介绍,闲鱼夜市初期,主打特色互动型直播及明星综艺等玩法,会把用户喜爱的好物鉴宝、情感相亲、技能咨询以及闲鱼自制综艺节目等生活娱乐化内容搬进频道内,打开一个神奇、热气腾腾、充满烟火气的夜生活。 把“夜市”搬上“神奇的闲鱼” 闲鱼把夜市搬到线上,打造自己的黄金档。在这里不仅有互动玩法、明星名人,更有一种扑面而来的“活人感”、“野生感”。 首播当晚,我随机看了四场直播。简单概括一下就是:女律师直播间普法;男情感主播连麦开导出轨女网友;在线狗狗鉴定以及李维嘉做客闲鱼“神奇的朋友”。 其中,我点进男主播的直播间时,他正在和一位漫画风格头像的女网友语音连麦,倾听女网友的个人情感问题,或许藏在心底太久造成了很大的困扰,女网友分享了很多她和这位男性朋友相处的细节,评论区也不断有人与她附和。我不禁心想:这是我能听的么? 另外一场是在闲鱼开店的美女主播连麦小狗,对小狗的品种、品相、喂养方式以及健康问题进行在线指导。连麦小狗的主人躲在镜头后,在线网友倒是起哄了,留言闹腾了起来。 图源:唐辰截图 这几场直播,整体给人一种“不按套路出牌的抽象感”。下意识的,我仿佛看到“1818黄金眼”的网络镜像。这档节目之所以出圈,就在于它把镜头贴近真实的生活,产生娱乐效果,让普通民众仿佛看到自己,在一笑之间消弭烦恼。 “神奇的朋友”则是闲鱼首档自制综艺,多位明星艺人将在节目中讲述闲鱼经历、与闲鱼的故事,也将在闲鱼夜市开启互动直播。将在浙江卫视、优酷同步上线。 李维嘉作为首位直播明星,虽然已经少见于电视屏幕,但在闲鱼直播间,他的表达更加的自然,没有舞台上的那种人设包袱,能聊也敢聊。看他和主持人的互动,就像看到一位坐在身边闲聊的前辈,在分享自己小故事。 紧接着,7日上线营业的古早超女黄雅莉,通过友人探访的直播形式,展现了她旧物改造的生活另一面。这比真人秀更为“真人”。 让我眼前一亮的还是评论区,不少闲鱼在卖家在留言,推荐自己的服务、商品,比如有网友在出售充电器;还有广告“机票联系我”,以及出一个iPhone12。 这种氛围给观众营造出一个在线市集即视感:摊主黄雅莉和友人分享旧物改造的理念、趣事,周围围观的赶集人跟着镜头了解明星真实的生活状态,边看边聊,找个聊天搭子或者做点生意。 这里有一个细节,用户除了可以和主播连麦、评论互动,闲鱼夜市频道内还设置了“上墙互动”玩法,放大直播中精彩的留言、弹幕。黄雅莉直播开始前的预告页面,就飘动用户的“标粗”弹幕。 可以想见,闲鱼夜市还只是初代产品,直播、连麦只是现阶段的互动形式,并不是它的“终极形态”,或者是唯一形态。闲鱼也不是第一次做直播,未来,闲鱼夜市还会呈现更丰富更娱乐性的玩法。 一直以来,用户习惯在闲鱼进行各种“神奇”的尝试。闲鱼不妨让脑洞大开的网友参与进来,集思广益,谋划更高阶的闲鱼夜市的形态和玩法,最终成为一个可以让年轻人玩起来、互动起来的夜生活入口。 但有一点可以明确,闲鱼夜市的娱乐性会一以贯之。像技能变现类直播(唱歌教学、职场锦囊等)兼具娱乐性与实用性,吸引用户边学边玩。 这不难理解,夜市应该就是多元化要素的集合。会有歌舞弹唱,也会有静坐沉思;有烧烤小摊,也会有集市快闪;有游戏打闹,也会有滑板运动等。这样组合在一起,才是一个充满烟火气的夜生活,其底色就是休闲娱乐。 在闲鱼夜市之上,网友,特别是体量庞大的年轻人,几乎把闲鱼玩成“个人定制款”,开发出各种小众玩法,成为一个真实的面对生活的“档口”。 比如有你想象不到的卖地球,还有网上卖老板、卖同事;甚至闲鱼顺着网友的一句,“215才是真正意义上的大促”,就反手整了个“闲鱼分手节”,”打响了“反消费主义”的第一枪。 图源:各种神奇的交易发生在闲鱼·截图 这个群体迸发的创造力、想象力,投射到闲鱼。平台也顺势而为,观察年轻人,捕捉趋势,通过多元的娱乐性内容与神奇的创意,与用户共创出独特的休闲娱乐体验。正是这种产品、运营逻辑,闲鱼也成为年轻人的一个绝佳“归属”,打造出独一份的稀缺性。 做夜市,也不只是做夜市 社交媒体上流传过一句网友对闲鱼的评价:“人类对闲鱼的开发不足1%”。闲鱼夜市像极“1818黄金眼”,通过打造这样一个窗口,以互动直播、连麦等形式,把社交和娱乐场景融合在一起,更容易被年轻用户接受,将他们对闲鱼的开发,以及“赛博”夜生活的真实切面,更真诚的展示出来。 从直播间刷屏的评论和弹幕来看,用户的参与度和粘性也很理想。 按照马云的期待,“闲鱼应该是一条神奇的鱼,应该做一个娱乐平台,要用各种神奇的创意,服务年轻人的生活方式,也为年轻人创造更多的机会。” 但对闲鱼来说,做夜市,也不只是做夜市,闲鱼是以交易和社区双轮驱动的平台。在我看来,闲鱼做夜市的基本逻辑是:“聚人气-构场域—搭社区”。 首先是聚人气。有行业人士评价,算法催生的“个性化推荐”有毒,有人看多了自己的个性化内容,就容不得世界上其他的个性化。这实质是另外一层意义上的同化,千人千面反而成了“千篇一律”。比如某短视频平台制造的流行BGM(背景音乐),最后都成了套路。 闲鱼印证了另外一种小众却真正属于大众的“神奇”。那就是当算法主动后退一步,把社区建设的权力让渡给真实的人,满足他们的“好奇心”,把他们聚在一起,也可以长出具有生命力的商业生态。 近年来,闲鱼已经成为越来越多年轻人交流兴趣、寻找同好、发现新热点的重要阵地,各种神奇的交易都在闲鱼上发生。QuestMobile的报告显示,在闲鱼MAU构成中,43%是95后。这意味着3个网民就有2个在闲鱼,每10个用闲鱼的用户中就有近5个是年轻人。 他们把闲鱼作为休闲娱乐的重要途径,享受发现快乐的快乐。闲鱼夜市则是平台在用户注意力越来越碎片化的当下,在晚间聚拢人气,提高用户粘性和忠诚度的举措。官方数据显示,闲鱼用户在晚上十分活跃,每天有数千万人会来闲鱼上“游逛”、淘宝贝。 其次是构场域。这个场域包括两方面:一是娱乐化的内容场域;二是电商语境下的交易场域。 前者得益于闲鱼的内容化建设,形成闲鱼特色的娱乐化内容底池。比如年轻人会在闲鱼晒“谷子柜”(动漫周边收藏),这和朋友圈晒演唱会门票没有本质不同,都是通过兴趣展示获得圈层认同;此外,闲鱼还推出剧本杀、线下娱乐化IP联动等沉浸式娱乐场景,不断增加社区内容的娱乐浓度。 而交易场域则是“人-货-场”下的场。闲鱼本身具有交易属性,人和货在合适的“场”里才能更高效的交易。而场是无数个交易参与者组成的,它们可以是经营者,也可以是消费者。 这恰好符合闲鱼用户的多重属性,他们既是普通的消费者,治愈焦虑、兴趣社交甚至薅羊毛;也可以是小店或者圈层的卖家,将闲置物品挂售,赚得一笔收益。数据显示,平台的日均交易额突破10亿元,过去一年有超1亿人挂出闲置宝贝。 闲鱼夜市的场域构建,正是用产品化的方式,把这些用户原生的优质内容不断聚合,并达成一个良性的生态平衡:内容的场产生兴趣聚合和交流,电商的“场”融合交易和平台特性。这种变化背后,也是闲鱼从小众走向潮流和主流的快速进化。 最后也是最重要的,搭社区。有人气,有场域,用户需求和平台发展需要做到完美平衡,闲鱼也就长出了社区形态。 实际上,从闲置交易出发,闲鱼成为承载年轻人多元生活方式的社区,历经11年的发展。随着闲鱼夜市的上线,闲鱼好玩、好逛、神奇的特色也被进一步放大,年轻人的轻社交需求也将极大得到满足。 社区氛围下,用户圈层和平台引导,都是一种信任背书,用户完成交易也变得十分丝滑。2025年开年数据显示,闲鱼二次元IP手办需求暴涨271%,以汉服、洛丽塔、JK服、COS服饰为代表的“四坑”消费搜索量增长170%,形成了独特的兴趣圈层;《哪吒之魔童降世》上线不久,衍生周边单日成交额就破300万。 并且,年轻人的兴趣也不断催生出闲鱼的新生态。例如,针对年轻人的副业需求,闲鱼推出了闲鱼简历功能。这是一项服务型商品,交易额和订单规模在过去几年中增长迅速。 图源:唐辰截图 闲鱼总裁季山曾在一场媒体专访中称,如今闲置交易是偏小众的,闲鱼希望可以把用户省钱的行为变成潮流生活方式,让每个人都接受循环消费。 这句话也可以理解为,当闲鱼搭建起更符合潮流生活方式的社区环境时,神奇的闲鱼,也就在这个生态里让钱和商品流通循环起来。而这些要素的“沟通”产生的情绪,也将闲鱼“交易+社区”的生态体系推向良性发展。 他还曾表示,“用户会帮我们呈现出不一样的闲鱼”。 闲鱼夜市也是如此,用户走到哪里,无需过多的干预,顺应而不是迎合着去创造一些新的玩法,这也会被用户记住,成为平台生态的一部分,也是对外释放聚集信号的自来水。
薇娅被曝“复出”
近日,淡出直播行业近四年的薇娅又有了“复出”的迹象。有网友在社交平台发文称,一个名为“谦寻超级会员”的微信小程序悄然上线,背后有着薇娅夫妇的身影,薇娅本人更是在视频中做出镜模特。 红星新闻援引新黄河报道称,薇娅的丈夫董海锋于5月22日在其抖音发布纪念薇娅直播九周年的视频,随后在评论的回复中透露了名为“谦寻超级会员”的小程序,并直接引导粉丝“先关注、注册”。 后续发布的视频中,薇娅出镜担当服装模特,董海锋则将小程序称为粉丝的“秘密基地”。由此,有市场声音认为,这是薇娅通过小程序的方式“复出”,重启带货的信号。不过,董海锋的抖音账号中,上述有关薇娅的视频目前已经搜索不到。 值得一提的是,薇娅背后的MCN公司即“谦寻(杭州)控股有限责任公司”,董海锋推荐的小程序名字中也有“谦寻”两字。小程序页面类似于一个私域商城,销售产品类别显示有美妆、食品、日用百货和穿搭等。 该小程序已经举办了两场活动,其中,“605零食节”的产品显示全部售罄。首页正在为下一场活动进行预热,写着“会员内部上新日”“内购价”的字样。 图片来自微信小程序 从主页来看,小程序中并未与薇娅本人有直接关联。但小程序首页可以添加VIP专属客服,后者的朋友圈内有为小程序活动宣传的视频和文案,其中就有不少薇娅出镜的视频和图片。文案中均以“姐姐”代替薇娅,还有着“姐姐力荐”“姐姐同款”等标签。 随后,红星资本局询问该小程序与薇娅的关系,客服回复称“这是姐姐的秘密基地”,并确认宣传图片上的模特即薇娅。 图片来自小程序客服朋友圈 此外,上述客服的企业微信主体是杭州澜度科技有限公司,与“薇娅惊喜社”微信公众号更名后的账号“哆啦的魔法棒”主体一致。 此前,薇娅因偷逃税被罚。 据新华社2021年12月20日消息,浙江省杭州市税务局稽查局查明,网络主播黄薇(网名:薇娅)在2019年至2020年期间,通过隐匿个人收入、虚构业务转换收入性质虚假申报等方式偷逃税款6.43亿元,其他少缴税款0.6亿元,依法对黄薇作出税务行政处理处罚决定,追缴税款、加收滞纳金并处罚款共计13.41亿元。 国家税务总局坚决支持杭州市税务部门依法严肃处理黄薇偷逃税案件。同时,要求各级税务机关对各种偷逃税行为,坚持依法严查严处,坚决维护国家税法权威,促进社会公平正义;要求认真落实好各项税费优惠政策,持续优化税费服务,促进新经济新业态在发展中规范,在规范中发展。
新华视点|生态治理绘就绿色发展画卷
   近年来,福建省武夷山市创新生态保护模式,不断完善“高空瞭望+无人机巡飞+智能河道巡查”的“空天地”一体化保护体系,科技赋能生态治理,全力守护绿水青山。   夏季是森林火灾高发期,武夷山市生态环保综合指挥中心的工作人员来到洋庄乡大安村,安装调试高空瞭望云台。这些高空瞭望云台可覆盖半径3公里区域,具备异常温度与烟雾火情AI自动识别功能。   针对山火高发地带以及山林周边农户集中区域,武夷山市相关部门进行无人机定时巡飞,每周巡飞3次以上。今年以来,相关部门已发现并制止野外违规用火事件13起,有效消除了火灾隐患。   地处渝、湘、黔交界地带的重庆市秀山,因锰资源丰富,与湖南花垣、贵州松桃并称“锰三角”。曾经“一锰独大”的产业结构,对这里的生态环境造成了严重破坏。   为了彻底治污,实现生态转型,秀山2021年按照锰产业退出、治理、转型“三步走”计划,当年就对全县29家锰矿开采企业、19家电解锰企业实施了淘汰退出。   借着锰产业退出、锰渣场治理的契机,溶溪镇利用自身的资源优势,把生态转型、绿色发展的目光投向了生态农业。随着近年来的产业生态转型,这个昔日的锰矿重镇,已经发展出万亩银花为代表的中药材产业;千亩粮油、千亩蔬菜、千亩水果、千亩茶叶、千亩瓜蒌为代表的生态种植产业;万头生猪养殖为代表的生态养殖产业,逐步形成“盖上银花戴帽、平坝粮油成片、山间梨花飘香”的特色产业布局。   治沙致富两不误,治沙绿电两相宜。在沙化土地占到总面积46.7%的甘肃省武威市,当地依托境内太阳能资源富集的优势,紧抓政策机遇,以腾格里沙漠沿线的凉州区北部、古浪县南部为重点区域,集中连片布局光伏产业,大力推进光伏规模化、基地化开发建设。   在甘肃“三北”工程河西走廊-塔克拉玛干沙漠边缘阻击战中,由甘肃省治沙研究所自主研发的网膜沙障铺设机、手扶式麦草沙障压沙机等各种“新式武器”也大显身手,有效提高防沙治沙的工作效率和质量。
泡泡玛特王宁回应Labubu爆火:IP是需要运营的 其实它已经十岁了
快科技6月9日消息,昨日,《胡润排行榜》创始人胡润用一块蓝宝石与泡泡玛特创始人王宁交换绝版Labubu。 从曼谷到巴黎,从奥克兰到洛杉矶,一个来自中国的娃娃Labubu,过去一年突破小众圈层,成为了世界顶流。 对于Labubu的爆火,王宁则回应称:IP还是需要运营的,其实labubu已经十岁了,这十年积累了很多粉丝。 长久以来,众多国内IP公司都怀揣着打造“中国迪士尼”的梦想,泡泡玛特在成立之初也曾被频频对标。 据悉,Labubu最早由中国香港设计师龙家升于2015年创作,最初作为儿童书角色出现,后于2018年11月由泡泡玛特正式推出成为IP形象。 随后几年,泡泡玛特以Labubu为IP推出了多个系列,如森林音乐会系列、MEGA系列等。 但其实上,每个IP都有生命周期,泡泡玛特之前的Dimoo、Molly、skull panda都有过起伏。 Labubu所在的The Monsters家族,也是沉寂了几年,去年才迎来大爆发。 今年4月24日,Labubu第三代产品“前方高能”系列发售引发全球抢购,泡泡玛特APP当日登顶美国APP STORE购物榜。 从刘亦菲、迪丽热巴到蕾哈娜、贝克汉姆,众多国内外顶流明星纷纷“带货”Labubu。 在美国拉斯维加斯,甚至有粉丝凌晨排队等待购买,热门商品上架即售罄。 此外,当Labubu盲盒在二手市场被炒至数千元、数万元、成为年轻人的“社交货币”时。有银行还推出开户回馈活动,即存入资金有机会获得Labubu引发关注。 据媒体报道,有机构客户经理为挽留500万元存款急寻Labubu购买渠道。 年轻人注重自由,追求个性化和多元化已成趋势,而这一切,在Labubu上可以获得,这或许就是其“爆火”的原因。 在消费社会中,人们真正追求的并不是物品本身的功能,而是那些被人为制造出来的象征性意义。 Labubu已经不是简单的一个玩偶,而是年轻人的精神慰藉和社交货币。 责任编辑:哈尔
超170亿!高通官宣收购英国芯片公司
2025年6月8日,移动芯片巨头高通公司(Qualcomm)正式宣布,将以约24亿美元(约172亿元人民币)现金收购英国伦敦上市的半导体IP供应商Alphawave IP Group Plc。 根据协议条款,高通对每股Alphawave股票的报价为183便士(约17.52元人民币),较其在四月份披露收购意向前的股价有显著溢价。Alphawave股东也可以选择将所持股票转换为高通股票(转换比例为每股Alphawave股票换0.01662股高通股票)。 此次交易的核心目标是获得Alphawave领先的高速互连技术,特别是其高性能的串行器/解串器(SerDes)IP。这些技术是构建高速芯片间数据传输的关键,对于数据中心服务器、高性能计算,尤其是当前蓬勃发展的AI应用至关重要。 Alphawave近年来业绩亮眼,其2024年第四季度订单激增44%,达到创纪录的1.857亿美元,这主要得益于北美市场对其AI相关技术的强劲需求。值得注意的是,在本次交易前,AI芯片领域的另一重要参与者——软银旗下的Arm公司也曾对收购Alphawave(或其核心SerDes技术)表现出兴趣,但最终放弃。 从1985年创立时挑战通信规则,推出改变全球通信格局的CDMA技术,到如今积极布局AI芯片、汽车、物联网等前沿领域,高通始终通过关键技术收购和构建强大的专利生态来维持竞争力。如今,随着智能手机市场格局变化以及ChatGPT等AI产品的爆发式增长,芯片巨头之间的竞争已升级为一场全方位的“技术军备竞赛”。Alphawave拥有的SerDes IP正是当前定制化AI芯片领域的核心“军火”,博通、美满电子等巨头同样在此领域持续发力。 此次收购是高通在AI领域的又一次战略豪赌。将Alphawave顶尖的高速连接技术融入其骁龙平台后,高通意在数据中心AI加速、智能汽车高性能计算以及万物智能互联等多个高增长赛道占据更有利的位置。 高通CEO阿蒙所强调的信念——“如果我们能打造颠覆性产品,就有足够空间立足”——此刻正指引着公司的航向。这场24亿美元的交易,远不止于一项商业并购,它预示着芯片产业权力格局在AI浪潮席卷下的加速重构,高通能否借此在未来的AI芯片地图上刻下更深的印记,值得全球科技界持续关注。
一图看懂鸿蒙版微信开发时间线:何为“一年走完14年的路”
IT之家 6 月 9 日消息,自鸿蒙操作系统诞生以来,其生态建设便一路高歌猛进,展现出蓬勃的生命力和发展潜力。作为国民级应用,微信的适配情况自然成为了众人瞩目的焦点。值得注意的是,鸿蒙版微信自上架以来持续快速迭代,体验日趋完善。近日,鸿蒙版微信再度上线大版本更新,联系人标签分组、置顶聊天折叠、通讯录黑名单管理、图片发送前编辑、笔记消息转发、收藏多样化内容、企业微信联系人音视频通话、腾讯新闻功能、支付功能内搜索等十项功能全部落地。 IT之家也注意到,就在近期,部分鸿蒙 5 用户对微信版本号低于安卓版提出质疑。实际上,这是源于对不同系统版本号独立性的误解。微信在不同平台上根据自身架构和用户需求独立开发,版本号并不具备直接可比性。 今年初,腾讯“鹅厂黑板报”分享了微信鸿蒙版的开发经历,指出团队在不到一年的时间里完成了相当于微信 14 年的发展历程,说明鸿蒙版微信的开发进展已经非常迅速。 据“鹅厂黑板报”的资料显示,2024 年 3 月,腾讯组建了开发团队,4 月迅速启动基建工作。凭借多终端开发中积累的跨平台内核“Alita”,团队高效完成基础库移植,为后续开发奠定坚实基础。5 月,着手架构设计,采用模块化架构,降低业务模块依赖,预留扩展空间。6 月,首个内部体验版上线,具备基础通讯功能,开发进入快节奏。10 月,内测开启,支持朋友圈、支付等核心功能,公测随后覆盖更多用户。11 月,根据用户反馈持续优化,新增聊天引用、发文件等功能。2025 年 1 月,鸿蒙版微信正式上线,同时腾讯旗下 20 余款产品完成鸿蒙适配。 在正式上线后,鸿蒙版微信也在持续“小步快跑”,比如仅 4 月一个月就更新了三个大版本,多项功能都实现了进一步扩展,深色模式、微信运动、聊天记录分类搜索、群发助手、设置聊天背景、面对面建群等功能悉数上线。 再简单回顾安卓版微信的开发历程。2011 年 1 月 21 日,微信 1.0 在 iOS 与安卓版发布,此后安卓版微信逐步发展,2013 年 8 月 9 日 5.0 安卓版新增“游戏中心”等功能;2016 年 6 月 1 日推出“小程序”雏形;2018 年 9 月 1 日接入人脸支付,安卓版微信用 14 年时间完善功能,逐步迭代,最终进化成现在的形态。 从以上这些回顾不难看出,鸿蒙版微信的开发逻辑截然不同,鸿蒙版微信内测版一出来,朋友圈、支付等众多核心功能就已经具备,属于出道即高起点,之后再一步步补齐其他功能。这种开发模式和截然不同的起点,使得鸿蒙版微信与安卓版微信的版本号数字并不是同一个概念。将这两个数字放在一起对比,就好比在对比安卓和 iOS 两个操作系统,根本不能以版本号的高低论英雄。 而鸿蒙版微信和安卓版微信的开发逻辑之所以不同,是因为两者从底层架构上就存在差异。安卓版微信在 14 年的发展过程中,逐步增加功能、优化体验,逐渐演变成了如今成熟完整的应用;而鸿蒙版微信则是在充分利用现有技术和资源的基础上,快速构建起核心功能框架,然后在短时间内不断完善细节和扩展功能。 当然,必须要说明的是,软件开发是一个持续优化的过程。鸿蒙系统的生态建设需要时间,而微信作为其中的重要一环,也在不断根据用户的需求进行完善和优化。 鸿蒙版微信能取得如今的成果实属不易,当下,微信鸿蒙版仍有一些细节和体验可以进一步完善。用户在使用过程中遇到的问题和提出的建议,都是帮助微信改进的重要力量。大家可以多给微信一些耐心,或许很快就会有新的惊喜出现!
光刻机有后门吗:ASML能否远程关闭中国的光刻机
快科技6月9日消息,近日,荷兰光刻机巨头ASMLCEO傅恪礼(Christophe Fouquet)接受媒体采访时明确表示,美国出台的打压措施只会适得其反,让中国“更努力取得成功”。 ASML是全球唯一一家高端光刻机的制造商。傅恪礼称,中国已经开始研发一些国产光刻设备,尽管中国在赶超ASML的技术方面还有很长的路要走,但“你试图阻止的人会更加努力地取得成功。” 傅恪礼补充道:“无论你设置多少障碍都没用。” 据此前报道,中国科学院成功研发除了突破性的固态DUV(深紫外)激光,可发射193nm的相干光,与目前主流的DUV曝光波长一致,能将半导体工艺推进至3nm。 在国产光刻机真正完成替代之前,我们依然需要使用ASML的DUV光刻机。 那么就有一个很多人关心的问题,光刻机有后门吗?外国公司是否能够远程控制我国的光刻机? 据国内媒体报道,复旦大学网络空间国际治理研究基地特邀研究员、B站知名半导体up主芯声对此表示: “根据我掌握的消息和个人分析,我们应该能在2028年完成28nm工艺的安全化。所谓安全化,并非将所有设备和工序一律国产化,而是确保28nm工艺所需要素可持续供应,并部分以国产材料替代。到2030年,我们有望同样实现14nm工艺的安全化。” 这意味着,到2028年,我们可在基站等关键基础设施领域实现芯片全面国产化。到2030年,若成功实现14nm制程生产安全化,就能彻底跨过AI芯片的门槛,为我们的AI芯片生产提供一个基础的安全保障,尽管可能到时候这条产线上生产的AI芯片不会太先进。 “我之前曾参与过与ASML的谈判,对方曾明确希望将我们的光刻机接入外网,理由是便于他们提供更优质的服务——只要将机器连接到互联网,ASML预装的远程运维系统即可实时传回所有数据。一旦出现故障,便可随时远程处理,无需人工收集后再上传。” 所以在这个背景下,你觉得它是否会留下后门、能否被远程关闭?毕竟ASML方面自己都说了,只要联网,就能处理一切问题。
“直男天堂”身价暴跌,虎扑到底哪儿错了?
二十一年前,中国留学生程杭在美国芝加哥就读期间,花260美元租了一个服务器,创建了提供NBA赛事一手资讯的篮球论坛 hoopCHINA。 日后,这个以英文篮筐(hoop)音译命名的中文体育社区“虎扑”,不止一次想在资本市场奋力完成优雅的一投,却始终未能命中目标。 在成立的第22个年头,此前已两次折戟IPO的虎扑,迎来了易主而治的命运拐点。 6月2日,深圳迅雷网络技术有限公司发布公告称,正式完成对虎扑的收购,总现金代价5亿元。在交易完成前,迅雷已支付4亿元现金,剩余1亿元将在未来两年内分期支付。 交易公布后,市场上有两种截然对立的观点: 虎扑竟然只值5亿?做为一个成熟的内容社区,它的注册用户数超过1亿,其中男性用户占比90%以上,估值最高曾达到77亿元。 相反的观点认为,虎扑竟然还值5个亿?毕竟,虎扑创始人程杭自己都说过,“从男性口袋里掏钱很难”。商业模式单一,是虎扑两次冲击IPO失败的主要原因。 成也直男,败也直男。二十年过去,虎扑始终没能找到和直男的相处之道。 “直男天堂”,赚不到钱 2004年,清华大学毕业后在美国芝加哥继续深造的程杭,抱着和更多中国球迷分享NBA赛事的初衷,打算做一个篮球论坛。他敲下了“hoopCHINA”这个域名,名字很直白:hoop是篮筐,音译过来就是日后响彻中文互联网的“虎扑”。 彼时,正值中文BBS的黄金时代。 程杭抓住中美体育资讯的时间差,迅速聚集了第一批忠实用户,并通过高度垂直的运营策略,让虎扑在门户网站统治内容的年代杀出了一条血路。 起初,虎扑的内容由程杭自己翻译撰写,专业程度很高,连NBA球员的鞋带系法都能讨论三页。这吸引了一些国内的球迷,但仍局限在相对小众的圈子里。2005年,虎扑全站只有上百名活跃用户。 2006年,虎扑独家跟进了滞留美国的男篮球员王治郅回国的消息,一战成名。大把资深球迷涌入,虎扑的火爆程度超乎想象,服务器常在比赛后因访问激增而宕机。 程杭意识到,这个诞生于异国他乡宿舍里的论坛,是时候开启公司化转型,从“爱好者联盟”走向更广阔的商业舞台了。 在这个期间让虎扑迅速破圈、积攒人气的,是两大现象级板块:篮球区的热帖和步行街的狂欢。 篮球区以NBA直播、视频、赛程为核心,随后拓展至足球、电竞、影视等领域,始终是虎扑的立身之本。 步行街则是虎扑的灵魂所在。在这个无主题自由讨论区,全靠用户自建秩序,话题包罗万象:有球星战术的硬核分析,有辛辣段子、劲爆八卦,也有引发全网讨论的“虎扑女神大赛”——这场由用户自发发起、官方接棒运营的民间选美,一度成为互联中文网最具话题性的全民狂欢之一。 与之同步生长的,是深入骨髓的虎扑“直文化”基因:借用打球的比喻,传递“不装、不躲、不停”的价值观。 2012年,虎扑整合hoopCHINA、GoalHi足球和HelloF1赛车三大垂直社区,完成了从篮球论坛到综合体育门户的转型,并推出电商平台“识货”,探索“内容+电商”的商业模式,还野心勃勃地拓展游戏开发、线下赛事等业务。 2019年,字节跳动以12.6亿元价格获得虎扑30%股份,虎扑估值达到77亿元的峰值,成为体育垂直领域的独角兽。 然而,虽然流量与估值蒸蒸日上,但虎扑始终未能建立起坚实的商业地基。随着垂直社区整体式微,虎扑的困境愈发明显。 为了从直男身上赚到钱,虎扑称得上是绞尽脑汁,可惜大多不了了之。 虎扑打造过线下篮球公园、培育自有赛事IP“路人王”,但营销业务毛利率峰值不足30%;与《英雄联盟》《王者荣耀》合作试水游戏电竞,还亲自下场开发H5游戏《NBA英雄》《球王之路》,但受制于资金与技术短板,项目无疾而终;剑走偏锋投资彩票直播等冷门项目,更是开局不利,草草收场。 虽孵化出“得物”(原毒App)这样的潮流网购独角兽,但该平台已独立运营,虎扑仅持股15%,难以反哺母体。旗下商品导购网站“识货”虽年交易额达到21亿元,但利润率远低于电商平台。 当“直男天堂”的标签日益固化,“人均985,街薪30万”成为步行街的集体人设,虎扑却尴尬地发现:“家人们”只想在这里聊体育、评女神、侃大山,唯独对掏钱消费兴趣索然。 5亿之后:虎扑如何为社区文化续命? 虎扑的商业化困境,第一块短板,便是缺乏顶级体育赛事版权。 2016年,乐视体育豪掷27亿元,仅购得中超2年版权;PP体育2019年拿下英超三年转播权,花了49.67亿元;腾讯与NBA的独家合约,总价突破百亿大关。 虎扑六轮融资累计22.6亿元的资本储备,在动辄数十亿的版权军备竞赛面前,无异于杯水车薪。于是,在欧洲杯、奥运会等大赛期间,央视频、咪咕等平台流量暴涨,虎扑却只能做“场外评论员”。 此番被迅雷收购,或将成为其借力资本与技术资源、扭转版权困局的重要破局点。 虎扑77亿估值神话崩塌,与文化冲突和内容低质也不无关系。 近几年,BBS社区江河日下、短视频横行,人们对虎扑的关注日益减退。2017年,虎扑官方对外宣称有5500万的月活,但2020年,根据易观数据的统计口径,其月活只有579万。 为拓展用户边界,虎扑曾尝试“去直男化”,例如增加影视娱乐板块、引入女性用户导向内容、策划明星互动活动等,但效果适得其反。当社区试图打破男性主导的文化氛围时,核心用户产生强烈排斥;而过于强化直男标签,又难以吸引新群体。 这让虎扑陷入了身份认知的撕裂。 与此同时,无论是核心的体育板块还是泛化的娱乐板块,搬运内容都在虎扑占据了一定的比例。低质内容泛滥加剧了用户的流失,而用户留不住,生态必然恶化。生态一垮,变现更是难上加难。 据2016年的招股书数据,2013-2015年,虎扑营收从0.98亿元增长至2亿元,净利润则经历了先下降51%、后暴涨321%的过山车。在2015年的主营业务收入中,广告业务占比高达60.78%。偌大的“直男乌托邦”,主要靠广告苦苦支撑。 营收结构单一、业绩波动过大,预示着虎扑抗风险能力不足、成长空间有限。 2016年和2019年,虎扑两度冲击IPO,均以失败告终。这两次IPO折戟,也成了虎扑由盛转衰的关键节点。而此次虎扑被迅雷收购的仅为社区业务,估值自然进一步大幅缩水。 虎扑20年的浮沉,为观察中国互联网演进提供了一个样本: Web 2.0时代,hoopCHINA证明垂直内容的价值;移动互联网初期,识货和得物展示了强大的社区孵化能力;资本狂欢期,字节投资推高估值泡沫;存量竞争时代,单一社区模式遭遇生存危机。 迅雷将虎扑纳入麾下,或许是后者最后的机会。 迅雷会员中男性占主导地位,以技术偏好型用户为主,与虎扑的“直男”定位天然重合。双方用户均对效率工具(如下载加速)、体育内容有强需求,这为整合奠定了宽泛的基础。 虎扑需要迅雷来解决技术迭代缓慢、资金不足、优化内容加载与分发等问题,实现商业化突围;迅雷则试图借此突破用户粘性不足、增长见顶的困境,向“工具+内容+社区”转型,补足生态短板。 虎扑卖身,既非彻底认输,亦非华丽翻身,而是换取一次宝贵的喘息之机。只不过,它必须从“直男乌托邦”变成一个能养活自己的平台了。 虎扑需要证明,直男社区的终点不只是5亿的收购价,而是一种可持续的文化商业生态。毕竟,在B站、小红书相继成功的今天,男性主导的社区依然没有找到商业与文化的平衡点。 这仍然是一个值得观察和期待的课题。
AI 高考作文拿高分了,但我们好像写不出人味儿了
今天,大部分地区的高考日程就结束了!祝贺各位考生!无论结果如何,这都是阶段性的胜利✌🏻。 考生考完了不等于「考试」考完了——各个 AI 大模型也跟着「考」了三天。 比如,让 AI 写作文是固定操作了,随着模型一年更比一年强,结果也一年比一年没有悬念——AI 当然可以写的很好啦。 可以直接丢题目让 AI 发挥——像这篇,直接豆包写今年北京卷作文题《第二次呼吸》,成文结构清晰、语言流畅,并且引经据典。 或者像两天前我们做过的「整活向」,以鲁迅大师的文风写遍各个卷子。 像模像样,「横眉冷对」的感觉都够味。 实际上,抱着「AI 写得对,但不打动人」这个观点,已经有点过时了。你别说, AI 真的能写相当不错的作文——只是这就更糟糕了。 它既能套公式,又能煽情,一篇作文的「高级」与「打动人」,都能在提示词的排列组合中实现。那人类写作,到底还剩下什么? 真正让人不安的,可能不是 AI 能不能写好,而是我们越来越难说清楚「写得好」,到底意味着什么。 于是我换了个做法:让 AI 改作文。 如果它真有判断力,能指出哪里精彩、哪里有感染力,那就……真的有点汗流浃背了朋友。 AI 整挺好,然后呢? 高考作文有自成一套的评分框架,大体分为,「内容、表达和发展」这几个维度,沿用了很多年。 原本我以为,依照 AI 写作文的风格,哪怕拿不了一等,二等肯定是没问题的。结果有高考批卷经验的老师给其它公号留言说,一等问题也不大。 图片来自:截图来自于「槽边往事」 有一说一,如果是几十秒,这跟 AI 的用时也没什么区别了。再加上评卷是有统一标准的,说不定 AI 还更能揪住细节呢?——毕竟,AI 连吃饭喝水都不用了。 下面是我们用 GPT,批改其它 AI 写的作文:主打一个中门对狙。 59 分,虽没有满分但跟满分也没差别了。 有一说一,AI 改作文不能算没有道理,但分数高的着实离谱……这还是在中间已经「矫正」过评分过高的情况下。 能一瞬间从多个维度完成对一篇作文的特征提取,AI 的确在做「分类工作」,但这个评分依据真的靠谱吗? 就在高考前夕,北京大学中文系的漆永祥老师,发表了《AI 技术背景下高考作文试题的命制、写作和评价》的研究,当中便提到了这一点。而且,他也用了 DeepSeek 来批改高考作文。 让 DeepSeek 按照高考作文评分标准,对它自己生成的作文《答案之海与问题之舟:在信息洪流中守护思想的芦苇》进行打分,DeepSeek 给这篇作文打了 58 分(有点王婆卖瓜)。每一项具体给分依据如下表。 即便是提供了高考作文的批改标准,DeepSeek 也没有很好的遵照指令——对比前面官方的「高考作文评分量表」,DeepSeek 将内容维度分值提高至 25 分,将特征维度分值减少到了 15 分。 这些细节倒是没关系,在 prompting 层面慢慢磨就好。棘手的其实是,它并不能完全理解评价依据。「内容、表达和发展」这几个评卷的重点维度,它都不能够很好的掌握。 在表面上符合、给出「乖巧文章」,并不意味着真正能达到要求:高考要求写作文,是在考察学生的理解能力和写作能力。 比如流传甚广的高考作文「八要与八病」:要逻辑清晰、言之有物、准确真诚、事例契合、灵活运用、风格和谐、文从字顺、自然得体。 忌逻辑混乱、空洞无物、无病呻吟、堆砌事例、生搬硬套、风格杂糅、语句不通、语言造作。 嘶……这样一看,AI 的表现可以说是,既好又坏。 审美,未来真正重要的事 「好作文」归根到底是一个审美问题,而审美难以统一。这一点在教师队伍内部也存在: 「很多语文教师在教授多年语文后依然存在这样的困惑:什么是好的作文?好的作文仁者见仁、智者见智,很难达成共识。」漆永祥在论文中写到。 比如,2001 年高考全国卷要求以「诚信」 为话题作文,江苏考生蒋昕捷剑走偏锋,采用古白话文体,以三国故事为基础,写出了一篇留名高考作文史的奇文《赤兔之死》。 随着时间变化,对于好作文的评判也不断的变化。由学生自己的个人经历出发,有一个具体的故事,在曾经是可以拿到高分作文的做法之一。 2007 年江苏一考生的作文《怀想天空》在打分时引起争议:初评被三位老师打了 37 分的及格分,但在复查阶段,江苏省高考语文阅卷组组长何永康教授却给出 54 分的高分,并特意写了夹批和按语——「一篇质朴之作与一种作文导向」,借此鼓励质朴的文风。 当年的一些经典范文,的确给人以深刻的印象。它们未必是完美的,但却是有记忆点的。 恰恰——AI 能写,也能改,但它无法判断「哪一段文字,是值得被记住的」。 AI 没有对风格的偏爱,没有共鸣的能力,没有对人类经验的体验所带来的情感。它的输出永远是平的、规整的、符合训练数据平均值的。 如果你问它建议,给出的往往是「更清晰一点」「更有逻辑性」「换个更高级的词」——而这些都是可以训练的机械改写。 比如让 GPT 对上面这篇质朴的「麦田作文」打分,评价就不高(48 分)。它认为这篇文章「个别语句表达略显随意,情节安排略显平直,结尾略显突兀」。 接着让 GPT 按照它理解的「一类作文」重新对这篇文章进行修改润色,得到了一篇 60 分的「满分作文」: 从应试评分的角度来看,修改过后的文章的确逻辑更圆滑、用词更漂亮,但与此同时,也变得「泯然众文矣」。 一篇文章之所以动人、令人记住,不是因为它规范、准确,而是因为它展现出独特的对事物的感知,以及一种对话与交流的气质。 写作从来不只是结构和逻辑,更是一种表达欲、判断力,甚至是一种对美的追求。那些真挚的情感和文字的灵韵,往往就藏在词句不完美的裂隙和留白当中。 AI 可以判断这些吗?可以判断「美」吗? 起码现阶段而言,AI 无法培养判断力。它没有主观好恶、没有共鸣,不会评估独特性或情感价值。它只能模仿和复现,而且复现的还是平均值。 显然,语文课不能也不会变成「大家一起学写 prompting」。写作教育恰恰应该做的,就是帮助学生建立对风格、气质、美感的判断力。 具体而言,是教会学生感受语言的细节、风格的差异、遣词造句的细节。让人能够准确地表达出,「这篇文章很打动我」背后的原因。 可能是它说出了「我也想说、却还没说出口」的东西,可能是因为它有一个独特的表达路径,一种令人动容的说话方式。即便行文并不完美,有一些转折、含糊、甚至选词上的小问题,但这些恰恰构成了它的气质。 这些就是审美判断力。 如果说写作教育还有什么无法被取代的价值,那一定是这个判断力本身——判断何为好,何为动人,何为「有情感在其中」。 即便在未来,写作确实由 AI 来完成了,审美判断依然不可或缺——不知道什么是好的文字,把 prompt 写成了小作文,也跑不出好的结果。 这或许是未来的目标,也是 AI 时代真正重要的事:让孩子们成为拥有自己语感的人。 文 | 编号 0105941785
我谈不过AI,但AI能替我谈1000次恋爱
想象一下,如果打开一款约会应用,不用没完没了地滑动照片,也不用跟陌生人尬聊「周末喜欢干嘛」。 只管填个资料,AI就帮你搞定一切:从精准匹配到约会地点的挑选,再到时间安排,甚至还附赠一张定制化「约会海报」。最后,只需要拎包出门,赴一场线下约会。 会让你更有出门约会的动力吗? 这不再是科幻剧《黑镜》的剧情,而是加州大学伯克利分校两位辍学00后学生打造的Ditto——一款试图用AI重塑恋爱方式约会应用。 《黑镜》灵感落地,AI开始模拟恋爱人生 Ditto的灵感来自《黑镜》中那个大胆设想:AI通过1000次虚拟约会模拟,判断两个人是否会有「化学反应」。 图片来源:黑镜 《黑镜》第四季有一集名为《Hang the DJ》的剧集:在一套由AI控制的「模拟约会世界」中,两位主人公经历数十次失败的匹配后,终于反叛系统并选择彼此。最终,系统揭示他们的兼容性高达 99.8%——这是1000 次模拟中他们反复选择彼此的结果。 Ditto想实现的就是在现实中复现这种「反复试探后的理性爱情」。 创始人Allen提到,传统约会应用像Tinder、Hinge,用户往往需要刷几百张照片,重复同样的对话流程,最终却可能连一次线下见面都无法实现。 Ditto想做的,是用AI砍掉这些繁琐步骤,直达年轻人最想要的——线下真实互动。 用户的注册过程也更接近心理测试而非简单问卷——需填写包含年龄、性别、取向、宗教、政治立场等维度的问题;此外,还需上传照片、描述不能接受的特质和喜欢的性格偏好,并选择「兴趣优先」还是「外貌优先」,也可以填写MBTI类型。 图片来源:Ditto 信息提交后,Ditto背后的多代理系统(Agent System)就启动了。它分成三步走: 第一步:解析用户个人。AI通过图片、兴趣、文本等多模态信息解析用户特征,生成个性模型; 第二步:进行匹配与vibe识别。不仅比对身高年龄兴趣,还尝试寻找「气质共鸣」。比如,一个喜欢说唱的人和一个爱看《肖申克的救赎》的人,或许都属于「爱冒险、有表达欲」的人格; 第三步:模拟用户跟不同人约会1000次,并从中评估出互动表现最佳的匹配人选。 选定对象后,AI会生成一份定制化的图文约会海报——约会的时间与地点,以及对为什么推荐这个人的解释,甚至包含推荐的话题。然后,用户只需要直接出门,赴约即可。 「我们的理念是‘Result as a Service’,」Allen说,「AI时代的产品就该直接交付结果。用户不用管中间怎么算的。就像自动驾驶,你只管享受目的地。」 有趣的灵魂,靠AI来找? 与主流约会平台不同,Ditto并没有开发APP,而是以网站的形式呈现,用户扫码填写信息,之后所有沟通都在邮件和短信中完成。 图片来源:Ditto 背后逻辑很简单: 「大学生可能把APP装上就不打开了,但他每天一定会看短信和邮件。」 但毕竟大模型存在一定概率的幻觉问题,这个怎么解决? Allen表示团队对系统做了多重防护:包括从客观偏好上(身高、年龄、性别、种族)进行严格过滤;主观偏好上通过AI的「类比能力」处理,比如「有哲思气质」的人可能是政治学女生,也可能是喜欢村上春树的文青男;以及每次约会后,系统都会发问卷追踪效果,不断调校。 但用户能信任这种「自动驾驶」约会吗? Allen说,Ditto不是一个「透明过程型」产品,它是一个结果导向型Agent服务——你不是在看AI怎么谈恋爱,而是在享受AI替你谈恋爱的成果。 这也是为什么Ditto并没有把匹配过程完全呈现在用户面前,而是选择了定期给用户发送「小周报」,比如「本周我们跑了1223次模拟,发现你可能喜欢冒险型伙伴」。同时,每一场约会匹配都有配套内容解释,帮助用户理解「为什么是他/她成为约会对象」。 Ditto于2025年1月30日上线,用户群主要覆盖18-23岁大学生,男女比例相对均衡——(45%男、45%女、10%LGBTQ),4个月内在加州大学伯克利分校和圣地亚哥分校累计用户超1.2万,其中,在圣地亚哥分校渗透率达23%。 团队主要成员包括 Allen 和 Eric ,两位在 2022 年大学一年级结束后从伯克利辍学创业,外加3-4名兼职成员负责UI/UX和营销,部分成员来自伯克利AI研究实验室。此前Ditto已获得谷歌160万美元Pre-seed轮融资。 目前Ditto免费,但未来计划按单次约会收费(15-20美元/次),用户调研显示,这一价格接受度还比较高。 相比Tinder的「随意」标签,Ditto支持从短期约会到长期恋爱的各种需求,AI会根据用户偏好进行配对。 Ditto瞄准的,是年轻人的社交刚需:探索有趣的灵魂,快速线下链接。 Allen观察到,每十年社交产品都会迎来代际更新,从1995年的Match.com到2013年的Tinder,而现在,AI正在重塑人与人的连接方式。 与国内诸如探探、Soul等主打线上破冰的社交App不同,Ditto选择反向路线:让AI少说话,多做事,直接推动用户线下见面。 在「碎片社交」和「选择焦虑」越来越普遍的今天,也许这不失为一种降低门槛的方式——省去猜测,交给AI替用户试探;少点线上社交的压力,多点现实生活中的火花。 Ditto不是时下流行的约会App的升级版本,更像是一次社交流程的重写。它不靠让你「多互动」建立关系,而是直接把你带到那个最可能对的人面前。 这听起来像是一种自动驾驶式恋爱体验:用户不必亲自操盘,只要设置好方向,AI来把握节奏——而用户只需带上自己,赴一场恰到好处的见面。 也许未来大家都会有一个「恋爱代理人」,替我们谈完1000次恋爱,才递来真正值得一试的那一场。
苹果分析R1遇到复杂度阈值后准确率崩溃问题,Gary Marcus长文声援
相信使用过 DeepSeek-R1 模型的人,对于它在给出答案之前的思考过程并不陌生,这也是包含 DeepSeek-R1 在内的大型推理模型(LRM,Large Reasoning Model)备受推崇的原因之一。 然而,由苹果公司六位研究人员组成的团队却对此提出了质疑。通过让模型解答各种谜题,研究团队发现 DeepSeek-R1、o3-mini 和 Claude-3.7-Sonnet-Thinking 这几款前沿大型推理模型在超过某一复杂度阈值之后,它们的准确率会出现全面崩溃。 图 | 相关论文(来源:https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf) 值得注意的是,苹果机器学习研究高级总监萨米·本吉奥(Samy Bengio)是本次论文的共同作者。他不仅是图灵奖得主约书亚·本吉奥(Yoshua Bengio)的弟弟,还曾是 Google Brain 团队的首批成员之一。 图 | 相关论文的六位作者,右二为萨米·本吉奥(Samy Bengio)(来源:资料图) X 上有一名网友总结称,苹果这是当了一次加里·马库斯(Gary Marcus),其实加里·马库斯本人也在领英发帖肯定了苹果这篇论文。他写道:“苹果公司最新发表的关于大语言模型中‘推理’能力的论文颇具震撼力。我在一篇周末长文中解释了其中的原因(并探讨了一种可能的反对意见),以说明为何大家其实不应感到太过惊讶。” 在加里·马库斯的“周末长文”里他写道:“这篇苹果公司的新论文进一步佐证了我本人的批评观点:即便最新研发的所谓‘推理模型’已经迭代超越 o1 版本,但在汉诺塔等经典问题上,它们依然无法实现分布外可靠推理。对于那些寄希望于‘推理能力’或‘推理时计算’能让大语言模型重回正轨、摆脱单纯规模扩张却屡屡失败(始终无法产出配得上‘GPT-5’名号的技术突破)的研究者而言,这无疑是个坏消息。” (来源:https://garymarcus.substack.com/p/a-knockout-blow-for-llms) 那么,这到底是“坏消息”还是“好消息”,先从苹果这篇论文的详情说起。 可以完成多达 100 个正确动作,却无法给出超过 5 步的正确操作 研究中,本次来自苹果的研究团队发现了三种不同的推理模式:在低复杂度任务中,标准大语言模型的表现优于大型推理模型;在中等复杂度任务中,大型推理模型表现更加出色;而在高复杂度任务中,两类模型均无法有效完成任务。 随着问题接近临界复杂度,推理所需的努力反而出现了反直觉式的减少,这表明大型推理模型在计算规模的扩展上可能存在一种固有上限。 研究团队表示,这些见解对有关大型推理模型能力的主流假设提出了挑战,并表明当前方法可能在实现可泛化推理上存在根本性障碍。 最值得注意的是,研究团队观察到了大型推理模型在执行精确计算方面的局限性。例如,当为模型提供数学益智游戏汉诺塔的求解算法时,它们在这个问题上的性能并没有提高。 此外,对模型首次失误步骤的深入分析揭示了令人意外的行为模式。例如,模型可以在汉诺塔中完成多达 100 个正确的动作,但在逻辑推理游戏渡河谜题中却无法给出超过 5 步的正确操作。 总的来说,研究团队认为这篇论文既凸显了现有大型推理模型的优势,也揭示了其局限性,主要研究结论有以下五个: 其一,研究团队对当前大型推理模型在既定数学基准上的评估范式提出质疑,并利用算法谜题环境设计了一个可控实验测试平台。 其二,研究团队的实验表明,即使是最先进的大型推理模型(如 o3-mini、DeepSeek-R1、Claude-3.7-Sonnet-Thinking)也依然未能发展出可泛化的问题解决能力。在不同环境中,当问题复杂度超过一定阈值时,其准确率最终会降至零。 其三,研究团队发现大型推理模型在推理能力上存在一个与问题复杂度相关的扩展极限,这一点可以从达到某个复杂度点后思维 token 数量呈现反直觉的下降趋势中得到证实。 其四,研究团队对基于最终准确率的当前评估范式提出质疑,分析显示随着问题复杂度增加,与错误解相比,正确解在推理过程中出现在更靠后的位置。 其五,研究团队揭示了大型推理模型在执行精确计算能力方面的惊人局限,包括它们无法从显式算法中获益,以及在不同谜题类型中推理的不一致性等。 大型推理模型的自我修正能力有限 据了解,大型推理模型——是由大语言模型衍生出专门针对推理任务优化的新变体。 这些模型属于新型技术产物,其核心特征在于独特的“思维”机制,例如具备自我反思能力的思维链(CoT,Chain-of-Thought),并在多项推理基准测试中展现出卓越性能。 这些模型的涌现,标志着大语言模型处理复杂推理与解决问题的方式可能出现了范式转变。有研究者认为,这代表着向更通用的人工智能能力迈出了重要一步。 尽管已经存在这些观点和性能进步,但大型推理模型的基本优势和局限性仍未得到充分理解。一个仍未得到解答的关键问题是:这些大型推理模型是否具备泛化推理能力?还是它们只是在利用不同形式的模式匹配? 随着问题复杂度的增加,它们的性能会如何变化?在给定相同推理 token 计算预算的情况下,它们与不具备“思考”机制的标准大语言模型相比表现到底如何? 最重要的是,当前推理方法的固有局限性是什么?要实现更强大的推理能力可能需要哪些改进? 研究团队认为,当前评估范式的局限性导致人们缺乏对于这些问题的系统性分析。现有评估主要侧重于既定的数学基准和编码基准。这些基准固然具备一定价值,但是往往存在数据污染问题,而且无法在不同场景和复杂度下提供可控的实验条件。 为了更严格地理解这些模型的推理行为,研究团队认为需要一个能够进行受控实验的环境。 为此,他们并没有采用类似于数学题这样的标准基准,而是采用了可控的谜题环境,即通过在保留核心逻辑的同时调整谜题元素,以便能够系统地改变复杂度,并能检查解决方案过程和内部推理过程。 (来源:资料图) 这些谜题具有以下特点: (1)能够提供对于复杂度的精细控制; (2)避免现有基准中常见的污染; (3)仅需依赖明确给定的规则,强调算法化推理能力; (4)支持基于模拟器的严格评估,能够实现精确的解决方案检查和详细的故障分析。 通过实证研究,他们揭示了关于当前大型推理模型的几个关键发现: 首先,尽管大型推理模型通过强化学习能够学习复杂的自我反思机制,但它们未能为规划任务开发出可泛化的问题解决能力,在超过一定的复杂度阈值后,性能会降至零。 其次,研究团队在等效推理计算下对大型推理模型和标准大模型的比较揭示了三种不同的推理机制。 第一种机制是:对于更简单、组合性较低的问题,标准大模型表现出更高的效率和准确性。 第二种机制是:随着问题复杂度的适度增加,大型推理模型获得了优势。 第三种机制是:当问题随着组合深度的增加而变得复杂时,两类模型都经历了彻头彻尾的性能崩溃。 (来源:资料图) 值得注意的是,在接近这一失效临界点时,尽管大型推理模型的运行远未达到生成长度限制,但随着问题复杂度的增加,它们开始减少推理投入(以推理时的 tokens 数量衡量)。 (来源:资料图) 这表明,大型推理模型的推理能力存在一个根本性限制:其推理时间会随着问题复杂度的增长而显著增加。 此外,通过对中间推理轨迹的分析,研究团队发现了与问题复杂度相关的规律性现象,即在较简单的问题中,推理模型往往能快速找到正确解,但却仍会低效地继续探索错误选项,这种现象便是人们常说的“过度思考”。 在中等复杂度的问题中,模型需要经过对大量错误路径的广泛探索后,才能找到正确解。而超过一定的复杂度阈值,模型完全无法找到正确解。 北京邮电大学副教授白婷告诉 DeepTech,跟人类思维方式相近,对于复杂问题,虽然不知道什么是正确的答案,但是很多时候知道什么是不正确的。具体而言,这跟求解空间大小有关系,简单问题的求解空间因逻辑链条简短、特征匹配度高,正确解往往天然处于思维路径的前端,而复杂问题的解空间因涉及多维度变量耦合、逻辑层级嵌套而呈现指数级膨胀,求解空间庞大,客观上表现为思维序列中的相对后置性。 (来源:资料图) 推理模型的“思维”内部发生了什么? 研究中,大多数实验都是在推理模型及对应的非推理模型上进行的,例如 Claude 3.7 Sonnet(有推理/无推理)和 DeepSeek-R1/V3。研究团队选择这些模型是因为与 OpenAI 的 o 系列等模型不同的是,它们允许访问思维 token。 对于每个谜题实例,研究团队生成 25 个样本,并报告了每个模型的平均性能。 为了更深入地了解推理模型的思考过程,研究团队对它们的推理痕迹进行了细致的分析。 期间,他们通过谜题实验环境的构建,实现了对模型最终答案之外的深度解析,从而能够对其生成的推理轨迹(即“思考过程”)进行更精细的观测与分析。 具体来说,他们借助谜题模拟器,对模型思维过程中探索的中间解进行了提取与分析。 随后,他们考察了这些中解的模式和特征、相对于推理过程中顺序位置的正确性,以及这些模式如何随着问题复杂度的增加而演变。 对于这一分析,研究团队重点关注了 Claude 3.7 Sonnet 推理模型在谜题组实验中产生的推理痕迹。 对于痕迹中确定的每个中间解法,研究团队记录了以下内容:(1)其在推理轨迹中的相对位置(按总思维长度归一化),(2)经研究团队的谜题模拟器验证的其正确性,(3)相应问题的复杂度。 这使得研究团队能够描述整个推理过程中解决方案形成的进展和准确性。 图 | “思考中”中间解的位置、正确性和所有谜题环境中问题复杂度之间的关系(来源:资料图) 研究团队发现,对于更简单的问题,推理模型通常会在思考早期找到正确解,但随后会继续探索不正确的解决方法。 与正确解(绿色)相比,错误解(红色)的分布明显向思维链末端偏移。随着问题复杂程度适度增加,这一趋势发生逆转:模型首先探索错误解,且大多在思考后期才得出正确解。这一次,与正确解(绿色)相比,错误解(红色)的分布更向下偏移。 最后,对于复杂度更高的问题,模型开始出现崩溃现象,这意味着模型在思考过程中无法生成任何正确解。 下图呈现了在汉诺塔环境中,对思维序列分段(区间)内解的准确性进行的补充分析。 (来源:资料图) 可以观察到,对于较简单的问题(较小的 N 值),随着思考的推进,解决方案的准确性往往会下降或波动,这为过度思考现象提供了进一步的证据。 然而,对于更复杂的问题,这一趋势会发生变化——解决方案的准确性会随着思考的推进而提高,直至达到某个阈值。超过这个复杂度阈值,在“崩溃模式”下,模型的准确率为零。 白婷告诉 DeepTech,模型在复杂问题中需要多次推理,在一直没有正确解的前提下,模型推理机制中有可能采用了多次迭代推理生成效率优化策略,或许是防止迭代过多的一种资源保护策略。因此,本次论文中的发现需要从模型实现层面去进行细致的分析和验证。 白婷指出,大模型的推理过程本质上是记忆模式的调用也是有可能的。 对于 DeepSeek-R1、o3-mini 这类模型,其表现高度依赖训练数据中记忆模式的覆盖范围,当问题复杂度突破记忆模式的覆盖阈值(如本次苹果研究团队设计的可控谜题环境),模型便陷入 “零准确率” 状态。 虽然本次谜题环境允许对问题复杂度进行细粒度控制的受控实验,但它们仅代表推理任务的一小部分,可能无法捕捉到现实世界或知识密集型推理问题的多样性。 需要指出的是,本研究主要基于黑箱 API 访问封闭的前沿大推理模型,这一限制使研究团队无法分析其内部状态或架构组件。 此外,使用确定性谜题模拟器时,研究团队假设推理可以一步一步地得到完美验证。然而,在结构化程度较低的领域,这种精确的验证可能难以实现,从而限制了该分析方法向更广泛推理场景的迁移。 总的来说,研究团队通过可控的解谜环境,从问题复杂度的角度考察了前沿大型推理模型。这一成果揭示了当前模型的局限性:即尽管它们拥有复杂的自我反思机制,但这些模型在超过特定复杂度阈值后,仍然无法发展出可泛化的推理能力。研究团队认为,本次成果或许能为研究这些模型的推理能力铺平道路。 运营/排版:何晨龙
苹果WWDC看什么?郭明錤:能做到这个就算及格
WWDC25即将开幕 凤凰网科技讯 北京时间6月9日,苹果2025年度全球开发者(WWDC)将于今夜拉开帷幕。天风国际证券知名苹果分析师郭明錤列出了本届大会的三大看点。 以下是郭明錤在X上发布的三个观察重点: 1. 苹果的AI策略是焦点,其他如界面设计改变、操作系统功能改进等都是次要。 2. 不预期苹果在AI技术上会有重大突破。不过,市场对苹果的AI预期本就不高,只要苹果能清楚说明AI如何在终端设备上实现及其开发时程,应该就算及格。 3. 在终端设备上实现AI的重点可能集中在以下几个方面:1) Apple Intelligence/Siri品牌的重塑;2) 操作系统整合AI以提升整体体验;3) 为第三方开发者提供整合AI与App的工具;4)强化隐私保护机制(软件与基础架构);5)与更多现有知名AI服务平台合作。 郭明錤指出,在去年的WWDC上,由于苹果宣布了琳琅满目的AI服务,使得外界对其AI前景抱持乐观态度,但经历一年表现不如预期后,今年这种乐观情绪应会有所降温。 他表示,许多人始终认为,苹果凭借生态系统、芯片开发与产品设计的优势,终究能在AI趋势下占有一席之地。这种看法没错,但这是一种不需要深入研究就能得出的结论。苹果既有优势,充其量只能保证苹果的硬件产品是优质的AI服务/软件通路,但并不代表苹果能够凭借AI创造差异化或可持续的竞争优势。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
李飞飞自曝详细创业经历:五年前因眼睛受伤,坚定要做世界模型
一水 发自 凹非寺 量子位 | 公众号 QbitAI 因为眼睛受伤暂时失去立体视觉,李飞飞更加坚定了做世界模型的决心。 在a16z的最新播客节目中,“AI教母”李飞飞讲述了五年前因为一次角膜损伤暂时失去立体视觉的经历: 尽管凭借多年经验能想象出三维世界,但一只眼睛看东西时,我开始害怕开车。 但作为一名科学家,她也把这次经历当成一次宝贵的“实验”机会。 这次生病让她明白了立体视觉对空间交互具有决定性作用,“就像语言模型处理文本时需要理解上下文,物理世界的交互也必须建立在三维空间表征基础上”。 整体而言,李飞飞在节目中解释了为什么空间智能是当今AI系统关键且缺失的部分,以及她的新公司如何应对这一挑战。 同时,另一位嘉宾Martin Casado( a16z合伙人、李飞飞公司早期投资者)也分享了二人在世界模型上达成共识的故事,并从投资者的角度分析了世界模型的潜力和价值。 省流版如下: “数据驱动范式”所爆发的能量,至今远超李飞飞当初创建ImageNet时的想象; 创办World Labs并非跟风基础模型创业潮,而是源于对智能本质的持续探索; 要实现世界模型这一愿景,需要集结产业级的算力、数据和人才密度; 动物通过5亿年进化出的三维认知系统,远比人类晚近出现的语言系统更精妙; 当前的技术突破点在于,如何让AI像人类一样,从单目视觉输入中重建完整三维场景理解。 值得一提的是,嘉宾们深入浅出的讲解方式也获得了网友一致好评: 下面具体来看。 构建能真正理解物理世界的AI模型 李飞飞自述,其实早在大语言模型(LLM)兴起之前,她就深刻意识到了构建世界模型(LWM)的重要性。 这不仅和她之前生病的经历有关,更主要的是和她一直以来的学术经历相符。 回顾博士和教授生涯,若以今日认知审视过去十年AI的发展轨迹,最令李飞飞震撼的恰恰是她曾倡导的“数据驱动范式”所爆发的能量。 当年她带领团队开发了一个名为ImageNet的视觉识别系统,这个系统收录了超过1000万张经过精确标注的图片,迅速成为全球规模最大的图像资料库之一,以此彻底改变了计算机视觉和深度学习的研究格局。 不过在她看来,如今由大规模数据驱动的模型所展现出的“类思维机器涌现行为”,仍远超其最初的想象。 这种矛盾感促使她不断追问:当业界都在追逐语言模型时,我们是否忽略了更本质的维度? 选择创办World Labs,李飞飞自述并非跟风基础模型创业潮,而是源于对智能本质的持续探索。 在她眼里,语言固然是思想和信息的高效编码载体,但它对三维物理世界的表征存在天然缺陷—— 我们生存的实体空间充满动物演化史沉淀的感知智能,而语言只是人类文明后期产生的有损压缩符号。 环顾自然,没有漂浮的词汇表,只有具象的物质世界。 这种认知让她确信:真正的通用智能必须建立在对物理空间结构、物体组合关系的理解之上。 这也是World Labs的使命,即构建能真正理解物理世界的AI模型,用集中攻坚的方式,让AI真正理解我们生活的三维世界。 创立World Labs的契机 当李飞飞构思World Labs时,她需要的不仅是资金支持,更渴望找到思想共鸣的伙伴。 而这个人就是a16z合伙人、李飞飞公司早期投资者Martin Casado。 作为斯坦福大学2009年入职的年轻助理教授,李飞飞与当时即将获得博士学位的Martin早有交集。不过后来Martin转型成为企业家和投资人,而她则深耕人工智能领域,被誉为“AI教母”。 在一次关于LLM的学术聚会上,当众人热议语言模型时,李飞飞向Martin提出: 我们缺失的是世界模型(world model)。 就是这样一句话,瞬间点燃了二人的合作火花。与其他投资人礼貌性点头不同,他们后来又在斯坦福校园展开深谈,而Martin对三维世界的理解令李飞飞印象深刻。 Martin在节目中解释道,蒙眼状态下仅靠语言描述在房间执行任务几乎不可能成功,因为语言对物理空间的转译是低效且失真的。但摘下眼罩后,大脑瞬间重构三维空间的能力让我们能精准抓取杯子、避开障碍,这种对物理世界的即时建模才是智能的根基。 换句话说,语言适合传递抽象概念,但应对实体世界必须依赖空间智能,这正是当前AI最欠缺的能力。 同时他也提到,自动驾驶行业投入上千亿美元仍未能完美解决二维导航问题,而语言模型却突然以惊人效率处理了文本任务。这种反差让他意识到,生成式AI已经提供了去做其他事情的契机。 这些想法也得到了李飞飞的认同,她表示,“这与我多年的思考完全契合”。 尽管ChatGPT等语言模型的成功令人振奋,但我始终坚信世界模型才是智能的下一里程碑。 李飞飞再次表示,这并非否定语言的价值,而是指出其局限性—— 当我们需要建造机器人、设计新材料或探索虚拟宇宙时,必须让AI获得类似生物的空间认知能力。从远古动物到现代人类,所有改变物理世界的创造行为,本质上都是三维智能的体现。 一旦世界模型取得突破,我们可以创造无限虚拟宇宙:有些为机器人训练设计,有些用于社交体验,还有些专属于叙事艺术或旅行探索。 这种能力将人类带入真正的多元宇宙时代。想象一下,建筑师能在数字世界瞬间构建城市原型,科学家可以在分子级3D空间模拟新材料的合成。 关键在于突破“视野之外” 在想法上达成一致后,投身创业的李飞飞意识到: 要实现世界模型这一愿景,需要集结产业级的算力、数据和人才密度。 具体到技术层面,世界模型能通过单张2D图像重建完整三维场景,包括视野之外的物体背面。 这种能力带来根本性变革:计算机首次能像人类一样对空间进行测量、堆叠和操纵。无论是从单帧视频生成360度环境,还是让机器人理解深度信息执行抓取任务,三维表征都成为智能交互的基础。 这解释了为何游戏开发、艺术创作和工业设计等领域都在急切等待这项技术突破。 并且,与六岁孩子讨论“树木为何不长眼睛”的经历让李飞飞深刻领悟:进化需求催生了空间感知能力。 动物通过5亿年进化出的三维认知系统,远比人类晚近出现的语言系统更精妙。 在她看来,当前AI发展恰似在重演进化历程——我们先攻克了语言处理这类“新技能”,现在才真正挑战空间智能这个古老而核心的命题。 而在尝试发起挑战的人当中,World Labs拥有自己的优势。 据李飞飞介绍,虽然三维AI研究相比语言模型是较新领域,但在计算机视觉领域早有积累。 其联合创始人Ben Mildenhal在伯克利期间开创的神经辐射场(NeRF)技术,四年前就革新了深度学习的三维重建方法;另一位创始人Christoph Lassner在高斯泼溅表示法(Gaussian Splatting)上的先驱工作,也为三维表征提供了新范式。 更早时期,团队成员在GAN图像生成、风格迁移等方向的基础研究,都为当前突破埋下伏笔。 这些分散在学界和工业界的探索,如今在World Labs汇聚成系统化攻关。 李飞飞表示,破解三维智能需要特殊的人才组合:既要AI专家处理数据与模型架构,又需要计算机图形学专家解决内存与渲染问题。 因此,他们组建了可能是全球最顶尖的跨学科团队——涵盖计算机视觉、扩散模型、图形学、优化算法等领域的开拓者。 这种集中火力的方式,与当年LLM发展初期各大公司“各自为战”形成鲜明对比。 李飞飞坚信,唯有将最聪明的大脑聚集在“世界模型”这个北极星问题下,才能实现从实验室技术到产品化的跨越。 p.s. 北极星问题一说出自李飞飞自传《我看见的世界》,指科研中的一些关键问题。 而当前的技术突破点在于:如何让AI像人类一样,从单目视觉输入中重建完整三维场景理解。 这不仅是机器人精准抓取的基础,更是打开无限虚拟宇宙的钥匙。 当计算机能自主补全视野之外的物体结构时,建筑设计将变成空间组合游戏,分子模拟可视作三维拼图,甚至数字孪生世界也能实时生成演化。 这场革命正在发生——而World Labs要做的,就是加速这个进程。 参考链接: [1]https://www.youtube.com/watch?v=fQGu016AlVo [2]https://x.com/vitrupo/status/1931519869058756968
比亚迪接入通义大模型 查物流、点外卖、订车票一句话搞定
凤凰网科技讯 6月9日,阿里云官方今日宣布,比亚迪与阿里云深化合作,将其联合开发的AI智能体Mobile-Agent应用于智能座舱场景,为用户带来“一句话”完成复杂跨应用操作的新体验。该技术旨在简化用户在驾驶过程中的操作流程,提升便利性。 据了解,搭载Mobile-Agent的比亚迪智能座舱允许用户通过自然语音指令,直接操作车机内的各类应用。例如,用户说出“Hi,小迪,帮我查一下我昨天在淘宝买的东西送到哪里了”,系统能结合对座舱屏幕的视觉感知能力识别淘宝应用,并模拟点击屏幕完成查询操作。类似地,“帮我订一张明早去上海的火车票”、“帮我点个麦当劳外卖”、“帮我在微博打开热搜”等涉及多步骤、跨应用的任务也可通过语音指令一键触发。 Mobile-Agent采用的全视觉解决方案。它基于比亚迪开放的座舱应用生态,结合阿里云Qwen-VL的视觉识别与推理能力构建成多模态智能体。该方案使其能够智能感知座舱屏幕内容、规划复杂任务并最终操作座舱应用UI界面。其显著特点是具备多端、多App、多场景的操作能力,并且无需针对不同应用或场景进行专门适配,展现了较强的泛化性。 比亚迪与阿里云的合作已拓展至多个领域。除Mobile-Agent外,在智能座舱方面,比亚迪腾势品牌基于阿里云通义万相大模型上线了“AI壁纸”功能,可根据语音指令生成个性化壁纸并随时间自动调节色调。基于通义星尘大模型,腾势还提供了“心理伴聊”场景,旨在为车主提供情感陪伴。在营销服务领域,比亚迪利用阿里云百炼平台调用通义千问大模型,对客服对话文本进行质量管理,以提升服务品质和用户体验。 比亚迪视“云+AI”为驱动行业创新的关键力量。双方表示,未来将继续携手,在阿里云优化AI基础设施并坚持开源开放的策略下,共同探索并落地更多AI应用。
刚刚,星巴克宣布大降价
夏日饮品大战来临,咖啡龙头星巴克今日(6月9日)宣布在中国市场放大招——发力非咖啡饮品市场,打造“上午咖啡,下午非咖”的全天候服务场景。 记者了解到,6月10日起,星巴克三大王牌品类——星冰乐、冰摇茶、茶拿铁,共计数十款产品将集体推出全新夏日“心动价”。以大杯为例,平均价格降幅达到5元左右。 星巴克非咖产品的降价将是持续性的还是今夏限时?对此,星巴克中国向《每日经济新闻》记者回应称:“未来,我们将视顾客反馈,决定后续活动计划。” 这次星巴克的降价为什么针对非咖产品,而不是咖啡?此策略后续会延伸到咖啡吗?星巴克中国对《每日经济新闻》记者回应称:“我们的定价是对多方面因素进行综合评估和考量后制定的。我们将一如既往地为顾客提供优质的星巴克体验。 中国茶饮咖啡市场的竞争异常激烈,尤其是今年上半年,外卖补贴大战重燃,咖啡品牌价格一再下探。在竞争激烈的中国茶饮咖啡市场,为保持市场竞争力,今年以来星巴克在营销上动作频频。2024年10月,星巴克中国宣布任命杨振为公司首席增长官(CGO),这是该公司首次设立这一职位。杨振曾担任特赞公司的总裁及合伙人,也曾加入集度汽车,负责用户发展部门的工作。 在产品创新上,星巴克将持续发力“非咖”场景。6月17日,星巴克中国将联动迪士尼热门形象“疯狂动物城”,推出3款全新联名冰摇茶。很快,茶拿铁也将迎来更多全新口味。“6月17日上新的‘疯狂动物城’三款主体冰摇茶,星星淘梨冰摇茶和全橙胡闹冰摇茶定价为最低23元,仲夏蓝调爆珠冰摇茶定价为最低29元。”星巴克中国向《每日经济新闻》记者表示。 图片来源:每经记者 孔泽思 摄(资料图) 值得注意的是,4月30日,星巴克发布2025财年第二季度业绩,星巴克中国的表现无疑成为全公司一大亮点。 2025财年第二季度,星巴克中国在各项关键财务指标上表现良好,实现营业收入约7.4亿美元,同比增长5%。与上一季度相比,在各类商圈、不同城市层级、各个营业时段,星巴克中国门店的同店可比交易量同比攀升,实现4%的增长,同店销售额继续大幅改善。截至第二季度末,星巴克中国门店总数达到7758家,覆盖超过1000个县级市场。 “Molly(星巴克中国首席执行官刘文娟)和团队在推进一些我们在中国市场需要做的关键事情方面做得非常出色。”Brian Niccol表示。他认为,星巴克中国近期产品线的调整已初见成效,业务呈现出积极增长态势,业绩提振令人欣喜。他还肯定了星巴克中国针对本地市场特点推出的“真味无糖”创新体系,以及与消费者建立连接的营销活动。 “我们的品牌依然强大,(星巴克中国)业务发展依托于近乎完全本地化的供应链及烘焙运营体系。相信我们一定能乘势而上,继续巩固在中国市场的增长势头。”Brian Niccol说,“伴随这一良好态势,我想明确重申,中国市场拥有巨大的增长潜力,我们将继续长期致力于中国市场的深耕和发展。” 该季度,星巴克全球可比门店销售额下降1%,可比交易量下降2%。其中,北美同店销售额下降1%,可比交易量下降4%。相比之下,中国同店可比交易量增长4%,与美国市场的表现形成鲜明对比。 事实上,北美和中国是星巴克最重要的两大市场。截至第二财季末,星巴克在美国和中国的门店占公司全球组合的61%,分别开设17122家和7758家门店。去年9月,星巴克新董事长兼首席执行官Brian Niccol(布莱恩•尼科尔)上任,其最大的任务就是要提振星巴克的业绩。 记者|丁舟洋 编辑|何小桃 杜恒峰 校对|汤亚文 |每日经济新闻 nbdnews 原创文章| 未经许可禁止转载、摘编、复制及镜像等使用
LLM神话破灭?苹果论文最新实锤:难以实现真正智能
在苹果年度全球开发者大会(WWDC)前夕,苹果公司的处境并不轻松。尽管过去数月持续放出关于人工智能(AI)功能的预告,包括“更聪明的 Siri”即将上线,但承诺尚未兑现,技术展示寥寥,让苹果在日益激烈的 AI 竞赛中显得很被动。与此同时,曾一手缔造 iPhone 传奇的前首席设计师 Jony Ive,如今也转而与 OpenAI 合作,外界纷纷质疑苹果是否还可以站在下一轮科技发展的潮头。 正是在这一微妙时刻,苹果研究团队发布了一项颠覆认知的新研究,并被纽约大学心理学与神经科学教授 Gary Marcus 解读为对当下大语言模型(LLMs)的“致命一击”。 这篇题为“The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity”的论文,通过问题复杂性的视角探讨了推理模型的优势与局限性,主要观点如下: 当前模型存在根本性限制,尽管引入了复杂的自我反思机制,依然无法在超过一定复杂度阈值的问题中表现出可泛化的推理能力。 模型在不同复杂度问题中的表现存在三种分界:在低复杂度问题中标准 LLMs 表现优于 LRMs,在中等复杂度问题中 LRMs 占优,在高复杂度问题中两者均表现失败。 研究发现一个反直觉现象,当问题接近关键复杂度时,模型的推理努力反而减少,这提示 LRMs 可能存在计算能力扩展的内在极限。 模型的推理行为呈现复杂度相关性,在简单问题上表现为低效的“过度思考”,在复杂问题上则完全无法作答。 LRMs 可能存在可泛化推理的根本性障碍;在执行精确计算方面也有局限性。 Marcus 在一篇题为“A knockout blow for LLMs?”(对 LLMs 的致命一击?)中表示,LLMs 无法替代精心设计的传统算法,虽在未来十年内仍有编码、头脑风暴和写作等用途,但他认为 LLMs 能直接通往可根本改变社会的 AGI 是不切实际的。 LLMs推理看似缜密,实则在骗人 在 Marcus 看来,苹果这篇论文从两个维度强化了对 LLMs 根本性弱点的批判:一个是他本人自 1998 年以来不断强调的“训练分布边界问题”,另一个则是亚利桑那州立大学计算机科学家 Subbarao(Rao)Kambhampati 近年来围绕“推理模型”提出的一系列质疑。 神经网络擅长在“训练分布”范围内进行归纳和泛化,但一旦脱离这一熟悉的数据分布,模型的能力便迅速崩溃。早在 1998 年,他就以多层感知器为例,指出这类神经网络在基础数学与语言预测任务中一旦遇到分布外(out-of-distribution)情境,性能大幅下降,这一批判思路贯穿他之后的主要研究。 此外,苹果论文也延续了 Rao 对“推理模型”(reasoning models)的系统性反思。Rao 指出,许多 LLMs 生成的“思维链”(chain of thought)看似严密,实则未必反映真实的推理过程。即便模型输出了一系列“思考步骤”,它的执行路径往往并不与之对应。即它“说”自己这样推理了,但它其实并没有这么做。此外,即使推理轨迹逻辑上无懈可击,模型的最终答案也可能错误。Rao 甚至早在苹果团队之前,就发现了 o1 模型存在类似的结构性问题,并在线上发表了相关工作。 苹果的最新论文进一步证实了这一点,表明即使是最新一代的“推理模型”也无法解决这一根本性问题。这对于那些期待 LLMs 通过“推理”或“推理时计算”(inference-time compute)来克服这些局限性的人来说,是一个沉重的打击。 连汉诺塔都解不好,AGI之梦何来? “汉诺塔”是计算机科学的经典入门难题:你需要将一组从大到小排列的圆盘,从左边的柱子全部搬到右边,每次只能移动一个盘,且不能把大的叠在小的上面。对于计算机而言,它几乎是“基础操作”,任何一本入门教材都能教会学生如何用递归算法解决七层汉诺塔。 然而,苹果团队的实验证明,Claude 在处理这个看似简单的逻辑问题时表现令人失望:7 层准确率不足 80%,8 层基本崩盘。而备受瞩目的 o3-min(high)模型表现同样平平。 更让人无法接受的是,即使直接把标准算法喂给模型,只要求其“照做”,它们依旧无法正确执行。这不仅是对“推理模型”名号的质疑,更暴露出当前主流大模型在结构性问题上的严重不可靠。 苹果论文作者之一 Iman Mirzadeh 表示:我们的观点并非是“人类毫无局限,而 LRMs 存在局限,因此它们不智能”。只是从它们的思维过程来看,其逻辑性和智能性确实有所欠缺。 Marcus 认为,AI 的未来应该将科学家级别的因果推理能力与机器的计算速度相结合,从而在科学、医疗、能源等关键领域实现真正的突破,才可能让 AI 对人类真正有益。 反之,如果连 8 层汉诺塔都玩不好,那什么“提取地球光锥”或“解构物理学”都将沦为空中楼阁。而更现实的是,像 o3 这样的模型实际上比专注的人类更容易产生幻觉,在绘制可靠的图表等方面也十分吃力;它们确实与人类有一些相似的弱点,但在许多方面,它们实际上表现得更差。 “人类有时会犯错,往往是因为记性不太好;而 LLMs 拥有海量的存储空间,再犯错实在说不过去。” LLMs不是“通才”,更不是未来万能钥匙 苹果的这项研究揭示:无论 AGI 的定义如何变化,当前主流 LLMs 都无法取代结构明确、逻辑清晰的传统算法。它们在处理某些复杂任务时,表现远不如几十年前开发的专用系统。 就像 LLMs 难以稳定解出汉诺塔问题一样,它们在国际象棋、蛋白质折叠、数据库查询等方面也远逊于现有的专用工具。即使是被广泛称赞的 o3 或 Claude 模型,也未必能够可靠地运行。 某些情况下,LLMs 能生成 Python 代码来“补足”自己的逻辑缺陷,但这仅仅是将问题外包给外部程序逻辑,本身并没有建立通用解题能力。而最危险的是,它们在简单场景中(如 4 层汉诺塔)偶然成功,从而误导人们以为模型具备了可泛化的认知结构。 Marcus 说道,那些认为 LLMs 是通往能够从根本上为社会带来积极变革的那种 AGI 的直接途径的人,未免太天真了。这并不意味着神经网络这个领域已经死亡,也不意味着深度学习已经过时。LLMs 只是深度学习的一种形式,或许其他形式——尤其是那些更善于处理符号的——最终会蓬勃发展起来。时间会证明一切。但目前这种方法的局限性正日益清晰。 但是,苹果的研究也有一些局限性:谜题环境虽能精细控制问题复杂性,但只能代表推理任务的一个小领域,难以涵盖现实世界中多样化和知识密集型的推理问题;大部分实验依赖对封闭前沿的 LRMs 的黑箱 API 访问,限制了对其内部状态和架构组件的分析能力;使用确定性的谜题模拟器假设推理可逐步完美验证,但在结构不严谨的领域,这种精确验证难以实现,限制了该分析方法向更具普遍性的推理领域的应用。Marcus 还指出,实际上,人类在进行汉诺塔游戏时也会出错,因此单纯通过该任务来否定其价值存在一定争议。 参考资料: https://techxplore.com/news/2025-06-apple-pressure-ai-stumble.html https://garymarcus.substack.com/p/a-knockout-blow-for-llms https://machinelearning.apple.com/research/illusion-of-thinking 编辑:锦鲤

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。