行业分类:
加载中...
头条分类:
加载中...
华为旗舰第一次!Mate 80 Pro Max/RS配备双潜望长焦镜头
快科技11月15日消息,华为Mate 80系列预计会在11月25日前后发布,这次共有四款机型,但命名和定位上有所变化。 分别为Mate 80、Mate 80 Pro、Mate 80 Pro Max以及Mate 80 RS非凡大师。 其中Pro Max是新增机型,相比于以往Pro+和Pro的区别来说,Pro Max与Pro的区别会更大,是明显不同定位的机型,因此命名也有所更改。 Mate 80 Pro Max和Mate 80 RS都会是系列中的顶梁柱,拥有直板机中最高的定位和配置。 据博主“体验more”爆料,Mate 80 Pro Max和Mate 80 RS都会配备双潜望长焦镜头,拥有4800万像素+5000万像素的双长焦规格。 这也与此前爆料相互印证,博主“数码闲聊站”近期表示,华为后续机型将取消一镜双目潜望长焦技术,本身属于过渡方案,物理结构体积大、成本高,而且焦段切换不连续。 现在看来,华为Pura 80 Ultra作为全球首发一镜双目的手机,确实也成为了最后一代。 一镜双目虽然结构巧妙,但实际上确实与独立的双潜望镜头相比,没有节省太多空间,但成本反而是暴增,有些得不偿失。 除了影像之外,Mate 80系列这次会全系支持3D人脸识别,同时还配备侧边指纹。 有望首发麒麟9030旗舰处理器,顶配的Mate 80 RS会提供20GB+1TB版本,其中20GB内存是国产定制方案,行业唯一。 【本文结束】如需转载请务必注明出处:快科技 责任编辑:建嘉
AI的24小时心理陪伴,可能是一场“灾难”
文|胡香赟 编辑|海若镜 封面来源|Unsplash 当越来越多的人选择让AI成为自己的临时“心理依靠”,人与AI之间的关系会发生怎样的改变? 10月底,Open AI公布了一组在升级模型处理心理健康问题能力时统计到的数据。这组数据显示,Chat GPT上的8亿活跃用户中,有超百万人正在倾诉自杀倾向,或对其存在较高程度的情感依恋。 人类允许AI走进自己的情感世界,倾听最隐秘的心事,这个逻辑其实不难理解。较之于动辄数百元一次的传统心理咨询服务,AI凭借几乎零成本的服务门槛、24小时在线的及时性,以及算法赋予的无限包容能力,让情感支持变得触手可及。 “AI和心理咨询都依赖语言,这是个自然而然的事。”简单心理创始人兼CEO简里里认为。 2014年,简里里辞去大学心理老师的工作,创办了简单心理,从为心理咨询师和来访者做对接的移动平台起步,后逐渐搭建起从科普教育、线上线下社区,到心理咨询、企业服务的数字化精神心理健康服务平台,To C端累计提供超300万小节的专业心理咨询服务。今年夏天,简单心理上线了面向C端用户的AI咨询助理产品。 从业十余年,简里里亲历了传统心理咨询行业发展中的种种局限,比如受众有限、资源不均,期待AI能打破固有壁垒。但同时,她又刻意、谨慎地与当下主流的侧重陪伴和安抚的AI产品开发逻辑保持距离。 简里里认为,心理咨询不是一种创造及时满足的服务,而是要引导来访者直面痛苦、走出创伤。但同时,它与人类天然渴望倾诉和陪伴的情感需求又不完全泾渭分明,两者存在诸多重叠之处。 过去,分别作为处理心理健康问题的方式,专业心理咨询和轻量的情感陪伴都只能“服务于在人生特定阶段愿意接受其服务模式的人”。但如今,AI的出现,有可能带领两者各自“向中间迈出一步”,甚至创造出一种全新的服务范式。 那么,未来,AI真的会比人类心理咨询师做得更好吗?我们该如何让AI更合理地服务于人的心理健康?就这些话题,简里里为我们带来她的思考。 对话(经编辑): 在一些情况下, AI可以“比新手咨询师做得更好” 36氪:大概是从什么时候开始,你觉得简单心理需要在AI上做一些布局? 简里里:我算是Open AI比较早期的付费用户,但当时主要把它作为工具在用,想看看它能干些什么,没有进行过情感类的对话。后来在一次和GPT的随意对话中,我发现它可以把我讲的上下文内容联系起来解读,我当时觉得,“它可以捕捉到了”。 这其实只是大模型能力的“涌现”。过去,这通常是咨询师需要花很多时间来学习的一个基础能力。因为你不能无节制地跟着来访者的话题走,要能够从许多个片段对话中理解来访者没有用语言表达出来的情绪。 于是,今年年初,简单心理开始认真做这件事。我们的传统业务主要分为直接服务来访者,以及为专业心理咨询师提供培训两部分。所以在开发AI产品时仍在根据这两条线索做。 一个是面对专业咨询师的To B业务,坦诚讲我们暂时不想把它商业化,主要以服务我们自己的咨询师和学员为目标,帮助他们提高执业水平,进而提高平台内整体的服务质量和能力。 To C层面,我们推出了AI咨询助理,承担一部分客服或以前的咨询助理的工作。最开始,我们没有给用户动机,没有引导他们把AI咨询助理当成咨询师来聊天。因为当时我们更想验证的是,人们在心理咨询这个需求上到底愿不愿意使用AI。 36氪:很多人都在和AI咨询情绪、情感问题,怎么理解“人们在心理咨询这个需求上是否愿意使用AI”? 简里里:就是从产品设计上讲,我们不想把它做成一个轻量的AI陪伴类产品。现在大家谈的“AI+心理”是一个很宽泛的概念,比如和AI谈恋爱、和AI不间断地聊天,当前已经有很多这种产品了,我并不认为市场上会缺一个这样的心理健康类APP。 但回到简单心理,我们只懂心理咨询。在心理咨询这个范式里,它和情感陪伴有比较清晰的区别。 首先,心理咨询很少给建议和答案。心理咨询是在“我对你有足够多了解”的基础上给予一些评估或启发,这个启发最好是咨询师和来访者共同讨论、领悟出来的。所在在简单心理的AI产品上,我们预设了大量启发式询问,这可能不适合大多数寻找情感陪伴或答案的人。 此外,我们也经常向来访者科普,心理咨询不是一个令人愉悦的过程,你必须不断面对你的创伤。它也不会像普通AI那样为了把对话延展下去而无限顺从你,它能接纳你的情绪,但也要告诉你,很多事情是有边界的。 这是我们希望简单心理的AI产品和其他陪伴类AI产品不一样的地方。所以我们在训练AI时,努力让它不要和用户在问题的表象上纠缠,而是寻找更深层次的原因。比如面对一位想离婚的用户,不要去讨论“该不该”离婚,而是去理解“离婚”这个决定对于用户意味着什么、对于用户的自我认识产生什么样的影响等等。 这时,很重要的一个问题就是,用户能不能忍受和一个AI进行很辛苦的、不断寻找答案的对话?他们愿不愿意用这样的方式和AI互动? 我们现在的答案是,很多人是愿意的。简单心理的To C的咨询助理AI在今年8月正式上线,它没达到很完美的状态,但我们发现,使用它的用户不止是来寻求助理的行政服务,70%的用户都会向它倾诉,而且反复在用;同时,它也吸引了一部分过去可能不太了解心理咨询,或经济上无力负担相关服务,但有强烈的自我探索欲望的用户。在这个维度上,简单心理的用户群是有拓展的。这给了我们很大信心。 36氪:你觉得用户为什么会这么自然地接纳AI? 简里里:我们的感受是,用户对AI反而更宽容。我们在用户访谈时也会问,和AI对话会不会觉得它不理解你,或者它是个机器。用户说都有,但这并不妨碍他们将AI视为一个稳定、可信任的对象。 我猜测,或许是用户觉得AI更可控。因为面对一个人类心理咨询师时,你不知道对方是怎样的人、会给自己什么样的反馈,这些都不可控。但面对AI时是相反的,所以他们愿意让渡一些信任给AI。 36氪:听起来他们觉得AI表现得不错。 简里里:在一些简单的、比较短的片段咨询里(比如20个对话来回),AI已经表现得还不错了,有时候比新手咨询师做得更好。我们调研的用户也有人提到,他觉得相较于市面上的一些通用模型,简单心理的产品表现得更接近人类心理咨询师的说话方式。 某种程度上,我觉得AI在片段咨询里表现好,是因为片段咨询有一定技巧,共情能力够不够、某句话探索的方向对不对,有相对清楚的答案。但是,心理咨询的周期很长,在长时间的对话、或是多个咨询小节里,AI还能不能持续抓取记忆、如何使用过去的情绪和感受素材,融合在一起深入推进谈话;这仍是个待探索的问题。 目前,简单心理在开源模型基础上做微调,目标是希望模型尽可能地按照人类心理咨询师的回答、讨论方式来工作。但坦诚讲,由于大模型能力在不断变化,以及心理咨询业态的特殊性,我觉得这件事不太可能根据现有的方法论来做,比如依照某个方法训练模型、清洗和标注数据,它就能生成想要的结果,这个不太可能。但我们对这件事比较有耐心。 AI,给心理咨询带来“平权”的可能性 36氪:AI可以表现得不错,但还没有达到你理想中的完美状态,它“差”在哪里? 简里里:这个问题还是要回归到心理咨询的形态上。传统心理咨询“设置”中,固定的时间地点、咨询时长是一件非常重要的事。因为我们要划清边界,营造一个安全心理空间来承载来访者的情绪和创伤。正是这些时刻才能推动心理咨询的进展,让咨询师有机会和来访者进行讨论。这是行业坚持了将近百年的传统。 但AI全天候在线,意味着咨询框架带来的、使咨询发生的很重要一部分消失了。对应到产品设计上,你怎么让用户接受“这是个不会24小时在线的AI产品”这件事? 一个AI心理咨询产品,它既和人类咨询师的工作方式不一样,也不能是一个24小时在线的“好朋友”。它的咨询设置应该是什么样的?我觉得产品设计层面上,它需要被重新定义,这也是行业未来需要讨论的。 36氪:用户可能觉得24小时都在是AI很强大的优势,但放在心理咨询上不一定是好事? 简里里:我觉得是个灾难。就像人在成长过程中要逐渐形成自己的价值体系,拥有自己的社会支持系统,心理咨询的最终目标是让你能够独立,能够忍受规则、接受不如意,并和它共处。这是一个逐渐“摆脱”咨询师的过程。所以,永远的、24小时的陪伴是糟糕的。 打个比方,这个过程就像小婴儿慢慢长大,和妈妈说“拜拜”。什么情况例外呢?当一个人处在一个创伤非常严重、退行到“小婴儿”的状态时,24小时的陪伴是非常好的、是需要的。但当我们谈到大部分人在使用的心理服务,从心理咨询角度去理解的人格层面上的帮助、或者让一个人在人格层面的创伤可以被疗愈,这个产品一定不是24小时的。 36氪:针对这种咨询设置上的不同,简单心理有对应的解决方案吗?我理解用户肯定还是希望能随时和产品对话,两者听起来有些悖论。 简里里:我们有一些初步的方案,但可能等上线做一些尝试后更方便分享。 36氪:听起来,你们想做的是一个垂直领域的、小而美的产品? 简里里:我觉得如果真的能把我想的都实现,肯定就不是小而美的状态了。 简单心理过去服务的用户中,约20%-30%是那些可以在医院内诊断出疾病的用户,再往外围扩才是处在痛苦中、想寻找解决途径的人群。但在这个维度上下,仍有很多还没有做好准备付费做咨询的人,如果AI能把这部分人群拓展过来,比例已经足够大了。 举个例子,简单心理做企业端业务时一直有个困扰,我们的心理咨询服务供给和部分群体的需求其实是错配的。而心理咨询师的受训方式,决定了很多时候他们更擅长服务有相似话语体系、认知框架的人群。比如现在心理咨询的方式可能无法满足外卖员等蓝领的需求。 这是传统心理咨询学科的阶级局限。 所以,一定程度上,心理咨询的规则设置也是在“挑选”用户。举个例子:心理咨询并不鼓励用户遇到问题冲动下单。在简单心理上,用户是无法预约到当天的咨询,最早要约到第三天。因为心理咨询需要人在一个心理层面上能够“等待”的状态下,你才能更好地使用心理咨询,与咨询师讨论你的感受的状态。 但切换到一些群体时,这套模式或许很难走通。他们想要的更实际也更即时,比如夫妻长期异地分居、小朋友来城里上学不适应,怎么办?这时你和他们谈人格创伤,他们未必需要。这些群体其实也是过去10年里,我们很希望能有好的产品来服务的一部分人。他们需要情感支持,而心理咨询服务又显得太“重”了。 但AI是可以往中间走一步的。它一定还走不到“你的小孩不想上学,我现在就告诉你怎么让他去上学”的状态,但它可以给你一些及时的建议和回复,让人们的情绪得到倾听、也获得一些方法。 36氪:就像你的身边有一个接受过心理咨询学科培训的朋友,当你情绪崩溃时,他可以给予一些直接的支持。在当下的时间点上,AI是这样一个角色。 简里里:是的。因为,实际上有倾诉需要的用户非常多。过去10年,简单心理一直设置了免费的倾诉热线,但始终是供不应求的状态。但AI可以处理这些,它目前还无法提供传统意义上的一周一次、长期进行的咨询,但可以成为一个懂心理知识的朋友,能在一定时间内给你一些办法和支持。我觉得这个是有意义和价值的。 做简单心理10年,从人文角度,我们想服务更多的人群,但在传统心理咨询师培养体系下,这非常困难。 今年开始做AI之后,我们做了很多心理咨询低支付能力者的用户访谈,这也让我重新找到了创业的意义感。不管它最终会形成怎样的商业价值,它首先是对人有帮助的。接下来,在产品方面,我们也会做一些更有针对性的设计。 36氪:未来,AI需要越来越像人类心理咨询师,还是跟着它自己的脚步发展,创造出一个可能不相同的范式? 简里里:我觉得会形成新的范式,创造新的可能性。但当下的主要任务,是让AI先具备人类心理咨询师的能力。至于它能不能比人类心理咨询师做得更好,甚至补充一些人类没有的东西,这是未来的事。 替代人类咨询师? 不,其实是机会 36氪:你提到AI可能比人类咨询师做得更好,AI冲击就业也是大家普遍关注的问题,怎么看它对心理咨询行业可能产生的影响? 简里里:这是各行各业都会面临的问题。首先,我对人类心理咨询师的存在很有信心。可以做个类比,简单心理10年前上线时就开始提供视频咨询的选项,但直到现在,将近一半的用户还是会选择面对面咨询。无论技术多么发达,人类始终有和人类沟通的诉求。 此外,我自己的体验是,人类所有的技术变革其实都很慢。技术可能很快就成熟,但让人类讨论立法、伦理、设置,肯定会有很多阻碍。 十几年前,我们的第一个投资人Timothy Draper曾给过我们很多创业tips,其中一条就是“你最终会发现,让人们接受变化是无比困难的事情”。我觉得某种程度上,这也给了人类很多时间去准备。 36氪:套用那句话,“替代咨询师的不是AI,是会用AI的咨询师”。可能对于咨询师来说,AI也会给他们机会。 简里里:从长远来看,我觉得AI可以比较好地完成人类心理咨询师70%-80%的工作;但另一种更容易实现的目标是,AI为咨询师提供更强的辅助、学习能力。 比如,从业者群体中,新手心理咨询师是比较弱势的存在,因为督导训练很贵。但AI就像一个24小时在线的督导,如果你遇到比较困难的个案可以直接和它讨论,还不用在意督导对自己的评价、督导的性格如何。 我现在非常努力地让公司的咨询师运营团队先用好AI,再通过他们鼓励咨询师用AI。这是一个特别好的工具,如果你觉得它给的答案不够好,就换个问法,但一定要用。 36氪:未来,人类心理咨询师和“AI咨询师”之间的关系可能会是怎样的? 简里里:心理咨询这个行业一直以来的问题就是好的心理咨询师不够多、优质的服务太昂贵。所以我觉得未来会形成分化,有一部分用户仍然会期待人与人之间的交流,但更广泛的群体会转向AI。 心理咨询这个领域比较容易被AI技术关注,是因为它大量使用语言,而AI看起来擅这个。所以当下这个阶段,很多人想进入这个赛道是很自然的事情。十年前大家做上一代互联网产品时也是这样,有技术、有逻辑,我们就先上,再根据用户的反馈调整。但到了这一步,大家看用户反馈的角度已经是不一样的了,再改进的方向也会不一样。如果往后再看五年、十年,大家做出来的产品形态一定不同。 36氪:你觉得,未来的“AI+心理”产品会是什么样的形态?现在看,大家好像都在设计不同的虚拟形象,给他们很清晰的人设,让用户自己选择。 简里里:我可能不会沿着这个思路来做。一是当下的AI在技术上还很难做到持续按照某个角色设定和用户互动,它会很快“出戏”。与其用AI做这个,不如直接去做游戏。另外我用最保守的精神分析设置来举例,这门学科对于心理咨询师最初的要求是“你要像一块空白屏幕”,来访者完全不了解你是谁,才更有可能将他的客体投射进咨询关系中去工作。但是预设角色后,这就会更干扰咨询的进程。 但在行业发展初期、急于抢占市场的阶段,这是最容易想到的方式。至于它是不是最好的方式?我现在也没有答案。但我觉得到明年左右,市场会初步给出结果。如果此路不通,一定会有新的产品形态出来。 36氪:这也是大家比较担心的问题,逐渐已经出现一些与AI进行情感类对话而造成的负面案例。尤其是对一些既往就有心理疾病苗头的人群,怎么保证他们的安全? 简里里:出现在新闻报道上的可能都是相对极端、少量,但很有色彩的事件。在海外,确实有一些地区开始明确立法,不允许AI介入心理治疗或心理咨询。国内目前讨论的不算多,因为行业发展还非常初期。 就像大家都会责怪游戏危害青少年,但事实上,应该是青少年先在生活中受到了创伤,游戏才成为弥补情感空缺的替代品。AI也是一样。我认为,更清晰的伦理讨论和立法一定是重要的,但它不该被一刀切。
真的“橙了”!当饿了么走出“黄蓝叙事”
作者|古廿 编辑|杨舟 11月,美团为“蓝朋友”办了一场告别仪式。 App首页上线“致敬蓝朋友献花领券”活动,美团写了一封信:“亲爱的蓝……愿你在深海依然深邃,在晴空永远自由——永远记得你的黄。”随后,官方微博再发长文,总结双方十二年的对抗。 接着,有用户发现在饿了么内搜索“美团”,页面会跳转至“天天必爆18.8”专场,醒目处新出现了一行字:“好好吃饭才是正经事” ,疑似饿了么方面针对美团活动的低调回呛。 一句“好好吃饭才是正经事”直接把叙事拉回到吃饭、回到交易、回到服务。饿了么并没有把注意力放在“回应情绪”上,而是把资源押在“让用户享受更便宜、更方便的到家体验”上。 这番回应背后对应的正是淘宝闪购体系的底层假设,用户并不需要参与平台叙事,他们需要的是想吃能吃到、想买能买到、现在想要就现在送到。 就在同一时间轴上,饿了么正在做另一项更具结构性的调整:测试版App中,“饿了么”退到后台,主标识改为“淘宝闪购”,视觉体系从蓝色切换为淘宝橙,“蓝骑士”变成“城市骑士”。 从外界看是“改名”;从产品定位看是“走出外卖单一场景”。把这两件事放在一起看,比“致敬”或“改名”本身更重要,本地生活行业的第一阶段以“谁送外卖”收尾;第二阶段将围绕“谁能满足更广的即时消费需求”展开。 饿了么选择主动离开“蓝色时代”的叙事,进入一个能更有效服务用户的框架。这也解释了它为什么愿意放弃一个已经高度成熟的品牌心智:不是减少用户的认知,而是扩展用户的选择。 在美团以一场商业怀旧向过去十年画上情绪句号的同时,饿了么把转型落到了“吃饭、购物、生活需求即时满足”这一更贴近消费者的场景上。 最终被放大的不是平台之间的对抗,而是用户的体验半径:外卖只是开始,即时送达正在覆盖越来越多的生活碎片。饿了么并不是等待被告别的角色,而是已经提前进入新的赛程,从外卖平台,升级为生活入口。 01 全球互联网语境下的大厂改名 把饿了么的改名放进全球互联网语境,就更容易理解。 互联网公司改名,向来不是情绪事件,而是战略事件:冲破“社交标签”后,Facebook → Meta,转向未来的沉浸式世界;摆脱“140字信息流”后,Twitter → X,重塑“全功能AI平台”;苹果、滴滴、快手、字节跳动等企业也都在战略拐点上做过类似动作。 它们的更名各不相同,但共同逻辑相似:当旧名字定义了过去,企业需要一个能够承载未来的新名字。 同理,饿了么的问题不在品牌力弱,而在品牌力太强:当年的广告心智深入人心,“饿了么”三个字太响亮,以至于形成了天然边界:用户第一反应永远是“吃饭”,无法天然联想到非餐、百货、3C、宠物、药品等。 这在早期是优势,快速抢占用户心智,建立品牌认知;但随着用户需求的多元化,平台扩展至百货、3C、鲜花、药品等更多场景后,这种绑定逐渐成为限制。 但是作为一个成长了17年的平台,多年前饿了么就上线了送花、送药、送物等非餐业务。并提出“Everything 30min(30分钟送万物)”的发展理念,后来更是将即时零售作为核心战略。 2023年饿了么“iPhone”首发更是引发高度关注,成功助力品牌实现单月交易额过亿、与品牌一同打造了多亿级非餐类目。但用户的第一反应仍是“饿了么=吃饭”,即便他们已经在上面下单买纸巾、充电器或退烧药。 这种心智错位也意味着:饿了么实际上已经成为即时零售平台,但在用户端,它仍然只是一个外卖App。 过去几年,饿了么已经多次尝试突破这一心智锚点。 平台曾以“渴了么”“困了么”“遛娃了么”等方式做过“改名”梗营销,试图软化品牌标签、传递多元服务能力。但这类轻量方式并不足以穿透主流用户认知。即便业务已经延伸出去,品牌所指仍然原地踏步。 从这个角度看,改名不是为了放弃过去,而是为了承接未来。 对用户而言,他们越来越多地在“不饿”的时候打开饿了么,这是平台业务拓展的结果,也倒逼品牌必须跟上。一个名字如果阻碍你长成你想成为的样子,那最好的选择不是守护,而是升级。 02 顺水推舟的新名字 对于饿了么而言,更名从来不是一个容易的决定。 “饿了么”作为贯穿中国外卖行业发展的标志性品牌,拥有极强的心智与情感资产,“饿了别叫妈,叫饿了么”式的广告语到今天仍然清晰。任何成熟品牌的替换都有着定位模糊,资产折损的风险。 但品牌的作用,从来不是一成不变的标识,而是用户行为的映射。饿了么升级后的新名字,“淘宝闪购”不是凭空诞生的名字,而是用户行为长期积累出的指向。 以平台数据为例,“淘宝闪购”在今年被明确作为战略级业务后,其日订单峰值达到1.2亿单,8月周日均订单量超过8000万单,拉动淘宝日活增长20%。日均活跃骑手超过200万,是4月的3倍。 无论是饿了么的日活还是淘宝的用户粘性,淘宝闪购都堪称带动增量的强大引擎。而在今年双11电商大战中,淘宝闪购带动多个品类同比增长2倍以上,超市便利店增幅670%+,七成以上城市夜宵增长超200%。 在补贴、供给整合和用户心智迁移的共同作用下,淘宝闪购迅速成为阿里体系新的增量来源。这背后,是平台服务能力边界的外延,也是用户心智的变化。因此对平台而言,品牌更名并不是一场简单的集团内部资源整合,而是一次对用户行为的顺水推舟。 新名字带来的不只是“更像平台”,而是“更像一种生活方式”。淘宝闪购的品牌名帮助饿了么突破送餐品牌认知上的局限性,同时还将进一步整合更多集团生态资源,为用户带来更丰富多元的服务体验。 首先,购物的确定性在增强。当到家业务与淘宝主品牌形成同一个体系后,用户在购买非餐商品时不必再依赖“经验下单”或“赌运气”。在淘宝长期积累的正品保障、售后机制和消费者保护体系,被直接迁移到即时配送场景中,尤其对3C、美妆、母婴等高客单价商品,用户在决策时所需承担的心理风险被显著降低。 其次,选择的空间变大了。一个明显的变化是,用户不再需要区分“外卖平台”与“购物平台”。如果愿意慢慢挑,可以在淘宝上货比三家;如果需求紧急,则通过闪购即时履约。远场电商与近场零售不再彼此割裂,消费路径被整合成同一个入口。这让用户第一次可以在“多”与“快”之间不做取舍,而是同时获得。 更重要的是,供给的深度正在延展。 随着品牌旗舰店陆续开放淘宝闪购履约,消费者在购买品牌商品时也能享受即时送达,而不是只在“低客单价商品”才使用即时零售。从品类覆盖到品牌层级,选择更全、档次更高是本轮变化的结构性结果,而不是补贴驱动的短期现象。 最后,是服务体验更完善。即时到家能力与本地服务能力一旦被同一个体系调度后,配送不再是服务的终点,而可能成为服务的起点。购买家电可以对应送装、维修等后链路服务;购买药品也可能接入用药指导与健康服务。 因此,“淘宝闪购”不是一个替代“饿了么”的新名字,而是对用户脚步方向的确认。 03 面向用户的大消费升级 美团送花,是一次情绪化的收场;饿了么改名,则是一次结构性的开局。 如果从叙事史的角度回看,“饿了么”会成为中国移动互联网黄金十年的一个标志:它诞生于地推补贴的年代,经历外卖大战,推动O2O叙事从概念走向本地生活基础设施。在这一长周期里,品牌本身既是参与者,也是时代的注脚。 但从业务结构来看,从业务结构的视角看,这次改名既不是情怀式的谢幕,也不是单纯的品牌换血,而是以一次体系级的重排顺应商业时代的大势所趋。 “淘宝闪购”成为唯一对外身份,意味着阿里在即时零售赛道采取了新的打法:不再让用户在两个品牌之间切换场景,而是把资源、供给和流量指向同一条增长主线。 这种统一带来的第一层效应是品牌层面的效率提升。 过去外卖和即时零售分别对应不同的沟通对象和心智入口,而现在,“淘宝闪购”能以一个词承接两种需求,既满足吃饭场景,也覆盖从日用品到大牌商家的即时购物场景。品牌建设变得更简洁,同时具备更大的外延空间。 第二层效应发生在供应链和算法内部。 餐饮与消费品原本属于两套不同的数据体系,履约逻辑、需求曲线和复购周期完全不同。统一以后,用户的一次午餐、一次夜宵、一次临时补货和一次大牌购物都被整合进同一个消费轨迹中,从供给预测到库存周转的可计算性迅速提升。 更关键的是,这背后牵动的是阿里过去一年不断落子形成的大消费平台升级。淘宝闪购获得一级入口;88VIP体系升级;“淘宝便利店”启动本地供给网络;天猫旗舰店商品接入即时送达;菜鸟的仓配网络开始为闪购体系供能。 这些动作从外面看是多线并行,统一品牌之后,则形成了一个闭合系统:流量、货、履约、服务和会员体系归于同一增长逻辑。因此,更名不是从“饿了么去哪里了”,而是从“用户的即时需求最终汇聚到哪里”来理解。 品牌融合的意义并不止于名字,而在于为“全域消费”时代预置了基础设施。这也解释了为什么美团的致敬仪式看似是结束,但指向的是另一场更漫长的竞争。 在饿了么改名之前,美团的对手或许只是“另一个外卖平台”;但在改名之后,对手变成了三个叠加的系统:淘宝主站的流量入口、淘宝生态的商品供给、以及饿了么多年建立的城市履约网络。 在下一阶段赛程里,颜色、顺序和口号都会变得不重要。真正决定胜负的将是三件事: 谁掌握更完整、更高质量的消费与行为数据;谁拥有更密集、更高周转效率的城市库存与供给网络;谁能把“30分钟送万物”从补贴策略变成一项稳定、长期、可持续的基础服务。 被送别的仅仅是外卖平台时代。真正被打开的,是一个以即时零售为中枢、重构本地生活商业格局的新十年。
Meta高管回应AI投资泡沫质疑:投入虽大但未失控
IT之家 11 月 16 日消息,近期人工智能(AI)基础设施投资呈井喷式增长,已引发外界担忧:科技巨头的最新一轮扩张是否正逐渐陷入泡沫境地? 对此,Meta 首席营销官兼分析副总裁亚历克斯・舒尔茨(Alex Schultz)本周在里斯本举行的 Web Summit 科技大会上接受 Business Insider 采访时直言:“显然,任何一位 Meta 高管都不会对‘是否过度投入 AI’这一问题给出肯定答复。” 据公开计划,Meta 今年在 AI 基础设施方面的支出将高达 720 亿美元(IT之家注:现汇率约合 5116.43 亿元人民币),明年还将进一步攀升。首席执行官马克・扎克伯格(Mark Zuckerberg)今年早些时候曾表示,他宁愿冒“多花数百亿美元”的风险,也不愿在超级智能(superintelligence)的发展进程中落后一步。与此同时,亚马逊、谷歌、微软以及非上市公司如 OpenAI 等,也纷纷创下 AI 相关资本支出的历史新高,涵盖芯片、数据中心建设,以及为争夺顶尖 AI 科研与工程人才而开出的巨额薪酬。 尽管投入金额令人瞠目,舒尔茨指出,若以行业总市值或营收占比衡量,当前 AI 热潮与历史上的泡沫相比“尚不算离谱”。他举例称,相较于 19 世纪末美国铁路建设狂潮,“如今的 AI 繁荣看似激进,但并未失控”。 高盛分析师在 10 月发布的一份研究报告中估算,美国当前与 AI 相关的投资尚不足 GDP 的 1%,远低于此前技术浪潮(如铁路扩张时期)高峰期所达到的 2%–5%。 舒尔茨强调,Meta 的 AI 投入已切实转化为数十亿美元收入:AI 技术显著优化了其广告投放工具与内容推荐算法。公司预计 2025 年全年营收将达约 2000 亿美元,当前市值约 1.5 万亿美元。 在他看来,Meta 迄今最大的 AI 驱动变革在于其更智能的内容推荐系统,这一升级势在必行,原因在于:如今用户在 Facebook 与 Instagram 上花费的大部分时间,已转向浏览“非关联内容”(unconnected content),即非好友发布、亦非用户主动关注的主页或群组所产出的信息流。 “倘若我们没有及时完成这一转型,公司今天会萎缩到何种程度?”舒尔茨反问道,“我们成功应对了一场重大颠覆,不仅未被时代淘汰,反而为业务带来了实质性增量。” 舒尔茨还提到,Meta AI 应用最新推出的“Vibes”信息流 —— 一种完全由 AI 生成的短视频内容专区,“很可能构成公司未来的重要组成部分”,且初步数据显示,用户一旦开始使用,留存表现“良好”。(注:该功能上线后遭部分网络舆论批评,被讥为“AI 垃圾内容”(AI slop)。) 需指出的是,视频生成模型相较文本与图像模型,对算力需求更高,由此引发的巨大能耗可能对电网与水资源供应造成压力。随着 OpenAI 旗下 Sora 等视频生成应用日益普及,一个问题随之浮现:其娱乐价值是否足以抵消潜在的环境代价? 对此,舒尔茨回应称:“Vibes 当前规模尚小,远不至于抽干湖泊或消耗数座核电站的电力。”他补充道,该功能只是 Meta 正在开展的众多实验之一,旨在持续训练并优化其 AI 模型。 他还略带调侃地指出:“当今社会,尤其是西欧,仍存有一种‘加尔文主义式’的严苛观念,认为追求愉悦与趣味并非人生正途。而我们认为,人生本应享受美好而有趣的事物,其他一切努力,恰是为了成就这份乐趣。” 舒尔茨进一步表示,AI 浪潮正推动社会各界展开富有成效的讨论,包括核电站的安全运营,以及如何通过海水淡化技术扩大淡水供应。“总体而言,”他总结道,“人类有能力创造比现在多得多的富足。”
段永平美股百亿持仓大公布!建仓阿斯麦,大幅增持伯克希尔,一起看看大佬的操作!
最近,资产管理规模超过1亿美元的机构投资者陆续向美国SEC提交最新的13F报告,披露三季度所持美股股票和持仓规模,我们也得以一窥机构和知名投资大佬的操作。 今天我们就着重看看,段永平管理的H&H投资公司的三季度最新持仓。 数据来源:Whalewisdom 01 苹果:减持但不代表不看好 段永平的第一重仓苹果本季度持仓微幅减少了 0.82%(约29万股)。这更像是一种被动“再平衡”——由于苹果股价上涨,持仓市值达89亿美元,占投资组合总比重高达 60.42%,卖出极小部分以腾挪现金。 段永平曾一度将苹果拿到八九成的仓位,他也表达过,苹果完全符合他“企业文化和商业模式”的投资“审美”。目前6成的仓位依然是极高的集中度,表达他对苹果的“偏爱”,但在最新一期的方略访谈中,段永平在谈到苹果股价时,也坦言:“不便宜了”。 “如果把钱存在银行里拿一个多点的利息的话,那你还真不如买苹果。苹果最后有没有发展,其实我也不知道。 当然它一直是很强的,它有那么多的用户,AI最后落地在哪,不还是要在手机上吗?苹果将来再翻一倍两倍三倍都是有可能的,但是我不知道,不是说它就一定不行,但是它不便宜。” 02 加仓伯克希尔 3季度大手笔增持伯克希尔是本季度最显著的操作。虽然离巴菲特退休的日子越来越近,伯克希尔的股价也经历了一段时间的低潮,但这不影响段永平继续加仓伯克希尔。 8月5日,段永平在雪球发帖表示,“今天卖了不少伯克希尔·哈撒韦的put,看上去这个价格不贵了,希望买进来拿着,应该比标普500指数合算。”在三季度段永平大幅增持伯克希尔 181万股,增幅高达 53.53%。 在段永平公布加仓时,伯克希尔B股价经过三个月的持续下跌,在464美元附近。但随后一路上涨,到3季度末时大约502美元。 段永平也不止一次表达对巴菲特和伯克希尔的看好:“老巴找的人不会说差到哪里去,它这个文化是不会变的,它们不会是一家投机的公司,你拿着伯克希尔哈撒韦,肯定比随便买一个共同基金要好。” 03 新进阿斯麦 继续布局AI 另一笔引人注意的交易便是新买入了新买入了8万股阿斯麦,市值约7745万美元,排名第10。随着这家光刻机巨头的加入,加上组合中原有的微软、英伟达和台积电(2025一季度建仓),和长期持有的谷歌,在AI和半导体领域的合计占投资组合5.77%,市值约8.5 亿美元。 最近关于AI泡沫论的话题热议不绝,尤其是“大空头”三季度80%仓位做空AI,更是把这一话题的争议度推到舆论的风口浪尖地步。 机构之间也出现分歧,贝莱德、摩根大通、景顺集团、嘉信理财三季度继续加仓英伟达,先锋领航、富达管理与研究、摩根士丹利、纽约梅隆银行选择减持英伟达。 在最新一期方略访谈中,段永平有谈到对AI行业、以及英伟达、台积电、谷歌的看法。“AI这个东西我觉得至少掺和一下,不要错过了。完全错过了,好像有点不太合适。” “我以前也以为它(英伟达)高度变化,但是后来发现它们确实很厉害,它们的生态确实很强。 现在所有的人都想用别的芯片,是因为他们恐惧英伟达的垄断,AI太贵了,要花好多的钱,在军备竞赛的这些大厂,AI要赶上去你都得去买芯片。 我也看了一下黄仁勋很多视频,这个人我也很欣赏,他十多年前讲的东西和今天讲的东西是一样的,他早就看到了,一直在朝那个方向做。所以你现在就不得不去想,他现在讲的东西依然是他对未来的认同,所以我觉得投一点看看吧。” “台积电其实我早就知道,只是说这个行当我不懂,我觉得他们很重资产,但是现在发现了,半导体AI的这种起飞法,好像谁都逃不过台积电,它把所有人都干掉。 最近这个价格涨得太离谱了。离谱归离谱,也没有那么贵,如果未来的发展真的像黄仁勋讲的那个样子,它现在的价格是有道理的。” “其实我一直都很喜欢谷歌,但是就是搞不懂,我现在有点懂了。但又开始担心了,搜索的生意会在多大的程度上被AI取代?像ChatGPT,包括Gemini本身,会取代多少搜索,我不知道。但是总的来讲,我觉得这家公司还是挺好的,所以前段时间还买了一些。”
存储芯片“超级周期”,A股玩家谁能多分一杯羹?
作者 | 笠晨 “一天几个价”、 “暴涨快过黄金”,一场由AI引爆的存储芯片涨价风暴正在席卷全球。过去半年,全球存储芯片价格持续上涨。 最近一个月,涨价消息越发密集。继闪迪NAND闪存合约报价暴涨50%之后,更多存储厂商开始“蠢蠢欲动”。媒体援引知情人士透露,三星电子本月提高了某些内存芯片的价格,这些芯片因全球建设AI数据中心的热潮而供应短缺,提高后的芯片价格比九月份上涨了多达60%。 2025年下半年以来,存储芯片行业正迈入一个被广泛称为“超级周期”的新阶段。硅谷巨头掀起的第二波AI基建热潮,不仅消耗了所有可用的GPU,也使得高带宽内存(HBM)陷入严重短缺,例如SK海力士明年的HBM订单早已售罄。价格走势也从此前的低迷恢复,并出现转折性信号:DRAM和NAND Flash价格进入了全面且持续的上行通道。招商证券表示,此次由AI驱动的“超级周期”将比以往任何一次繁荣都更持久、更强劲。“超级周期”这一术语已然强势回归,成为存储半导体市场的新叙事逻辑。不同于过去周期性的库存回补——本轮更多地被结构性需求与产能错配所驱动。这次,随着AI对算力近乎无限的渴求,尤其是大模型、推理加速与高带宽需求的爆发,内存的价值得以重新定义,行业逻辑得以重构,周期特征也正发生根本性变化。 ▌AI浪潮驱动存储芯片牛股辈出:“批发商”香农芯创、高盛吸筹的德明利遭股东减持 深圳华强北被誉为中国电子市场的“晴雨表”,在这里,包括DDR4和SSD在内的存储产品价格已出现翻倍的情况,甚至“一天几个价”。存储芯片走出的逆势狂飙曲线也被网友调侃为“年度最佳理财产品”“暴涨快过黄金”。今年以来,存储芯片的狂热,带动了产业链一众上市公司股价的狂飙突进。Choice数据显示,年初迄今,香农芯创股价涨幅为514.1%,德明利股价涨幅为334.53%,东芯股份、诚邦股份、江波龙、西安奕材股价涨幅均超200%。 其中,联合SK海力士等合作方设立控股子公司海普存储的香农芯创年初迄今股价累计最大涨幅为782.15%。公开资料显示,香农芯创的主要收入来源于电子元器件分销业务,公司主要代理产品是SK海力士的存储器及MTK联发科的主控芯片。作为存储芯片的“批发商”,存储芯片市场的热火朝天似乎并没有直接投射至香农芯创的财报上。香农芯创三季报披露,2025年前三季度实现营收264亿元,同比上涨59.90%;归母净利润3.59亿元,同比反而下降1.36%。知情人士表示,大家看到的是“同比”情况,而同比来看,考虑到去年前两个季度的市场环境及公司“有一些低价的库存”等因素,公司的毛利率水平会相对高一些。如果看“环比”,也就是三季度对比二季度,(毛利率)已经是在上升了。 香农芯创半年报披露,在其上半年总营收(171.23亿元)的构成中,占绝对大头的是“电子元器件分销”业务,收入为166.14亿元,占比97.03%。关于“分销”,根据半年报信息,香农芯创手握韩国SK海力士和MTK的代理权及AMD的经销商资质,客户则主要是阿里巴巴、华勤通讯这样的互联网云服务商和国内大型ODM。公司分销业务采购分为订单采购与备货采购两种,以订单采购为主。也就是说,香农芯创的生意模式,主要是从SK海力士这样的存储原厂拿货,再卖给下游的阿里、华勤。分析人士表示,香农芯创的经营模式主要为占其总营收高达97%的“分销”生意,其实分成了两块——“以销定采”的业务是基本盘,毛利稳定,赚的是“量”的钱,行情涨跌对这块业务的“毛利”影响不大;“备货采购”的业务,则试图赚市场波动的钱。此外,香农芯创证券部人士则称,作为分销商,存储上游涨价对公司毛利率影响较小,影响主要来自量的变化。 香农芯创还在半年报中披露了“自研芯片”的进展,其自主品牌“海普存储”,“已完成企业级DDR4、DDR5(第四代、第五代双倍数据速率内存)、Gen4 eSSD(企业级固态硬盘)的研发、试产”。而这家海普存储,则是香农芯创在2023年联合大普微电子和SK海力士共同发起设立的。但对于香农芯创近期股价的暴涨,已有股东选择“落袋为安”。香农芯创11月12日公告称,11月11日,第三大股东无锡高新区新动能产业发展基金通过集中竞价方式减持54.92万股,持股比例由5.12%下降到4.999985%。 另外,主营闪存主控芯片和存储模组的德明利年初迄今股价累计最大涨幅为430.14%。值得一提的是,在股价暴涨期间,德明利也吸引了一众机构布局。据德明利三季报,“高盛国际-自有资金”新进成为公司第四大流通股东,持有214.32万股股份,占总流通股的1.33%。然而,就在本周,德明利公告,公司第二大股东魏宏章11月7日减持78.22万股公司股份。另外,德明利三季报披露,前三季度净亏损2707.65万元。与此同时,2025年前三季度,德明利成本激增,营业总成本从去年同期30.98亿元,增长至66.53亿元;资金状况方面,德明利的资产负债率为73.28%,短期借款为27.62亿元、一年内到期的非流动负债为6.36亿元。账上货币资金6.95亿元,交易性金融资产为1.74亿元,公司的现金难以覆盖短债。 不过,德明利近期接受机构调研时表示,公司始终高度关注毛利率等核心盈利指标,存储芯片行业趋势向好对相关业务具有积极影响,2025年第三季度公司综合毛利率改善明显,10月存储价格延续上涨趋势,公司四季度业绩表现有望进一步改善。 ▌存储行业“超级周期”席卷而来:A股玩家谁能在AI存储盛宴中多分一杯羹? 在全球加速扩张与AI训练/推理密切相关联基础设施的史无前例“AI算力竞赛”中,摩根士丹利等华尔街巨头们高呼“存储超级周期”已至。长期以来,全球存储市场呈现寡头格局。根据TrendForce集邦咨询的统计数据,截至2025年第二季度,全球DRAM市场由SK海力士、三星和美光三家瓜分,市场份额分别为38.7%、32.7%和22%;NAND flash市场则由三星、海力士和铠侠主导,2025年第二季度市场份额分别为32.9%、21.1%和13.5%。 而在A股市场,因长江存储和长鑫存储未上市,目前的存储产业链公司主要分为三类:第一类是以江波龙、佰维存储为代表的模组厂,从上游采购晶圆,进一步加工后出售;第二类是以香农芯创为代表的芯片代理商;第三类以澜起科技为代表,生产内存接口芯片。业内人士表示,存储芯片的热潮不会在短期内结束。在存储芯片价格上涨预期下,引发下游“超量采购”以囤货,进一步放大需求,使市场迅速转为“卖方市场”,预计此轮涨价潮持续至2025年底或2026年。在涨价潮下,国内存储芯片厂商的存货,可以说是上市公司未来盈利的主要影响点,这也是市场关注的焦点之一。 江波龙三季报显示,公司账上存货的金额为85.17亿元,高于其他存储芯片企业。显示出其积极备货、捕捉上行周期红利的策略。德明利前三季度末的存货高达59.4亿元。随着存储芯片价格一路走高,这些存货或有机会为公司带来业绩助力。佰维存储的业绩呈现“V型反转”。公司前三季度净利润同比减少86.67%至3041.39万元,但第三季度单季净利润同比大增563.77%至2.56亿元。截至三季度末,佰维存储存货也增幅显著,达到56.95亿元,同比增长52%。另外,通过查看北京君正、兆易创新、澜起科技、普冉股份、联芸科技等存储芯片“玩家”的三季报来看,各家存货金额分别为29.2亿元、25.67亿元、7.96亿元、 7.3亿元和6.28亿元。 不过,“存货为王”虽为当前存储芯片涨价潮下主流观点但并非无风险的长期逻辑。分析人士称,一方面,存储产品无长期稀缺性,且扩产正在推进,届时存货可能从盈利动力变回减值压力。另一方面,中游模组厂商议价能力弱,前期存在成本前置问题,且若存货是技术迭代快的低端产品,后续可能面临滞销风险。
未来的iPhone,想靠卫星消灭无服务
想象一下,你到一个非常小众的山林景点旅游,拿出 iPhone 想把照片发给家人,却只看到「无服务」三个字。 至少对于外国人来说,这样的尴尬现状很快就要改变。根据彭博社最新爆料,苹果正在探究如何实现更丰富的 iPhone 卫星通讯功能,甚至包括 5G 网络,而不仅仅停留在目前的急救场景。 虽然和国行 iPhone 关系不大,但这只是整个手机行业的一个缩影。 苹果的卫星大计划 十年前苹果开始研究卫星通讯时,他们具有相当的野心:使用卫星网络来取代地面基站,让用户在全球范围内都有网可上。 当时并没有能实现这种愿景的技术能力,苹果决定一步步走起。三年前发布的 iPhone 14,苹果卫星的初尝试仅限于无网联系救援人员。 不过从此之后,苹果一直持续为 iPhone 卫星通讯能力添砖加瓦,去年还实现了无网卫星 iMessage 通信,让这个功能在 iPhone 上首次脱离救援的场景,更贴近日常。今年发布的 Apple Watch Ultra 3 也开始支持卫星通讯能力。 这也是苹果一直以来做新产品的哲学——先把基础的功能推向市场,然后持续迭代增加新特性,不断靠近最终的完全体。 根据彭博社,苹果内部已经在开发数个卫星通讯功能: 第三方应用卫星框架:允许开发者通过 API 将卫星连接添加到自己的应用中,具体方式由应用开发者自行决定 卫星地图:将卫星通讯能力引入苹果地图中,用户可以在没有蜂窝网络和 Wi-Fi 连接下进行导航 图片短信:进一步增强卫星 iMessage,用户可以发送图片 自然使用:让 iPhone 在口袋、车里甚至室内都能连接卫星,目前所有的卫星通讯需要在天空无遮挡的情况下才能使用 非地面网络 5G(NTN):硬件方面,明年的 iPhone 将支持 5G NTN 能力,这将使蜂窝基站能够利用卫星网络来扩大覆盖范围。 可以看出,苹果接下来打算进一步减少卫星通讯的限制,丰富使用场景,利用这些服务让 iPhone 进一步获得优势。 不过彭博社也指出,苹果目前没有计划为 iPhone 提供第一方的卫星通话、视频聊天或网页浏览等能力,5G NTN 更多是一种硬件和协议的能力准备。 为 iPhone 提供为卫星通讯服务的是一家名为 Globalstar 的企业,规模不大,卫星网络也比较老化,目前还能满足苹果的需求,但很难带来领先的体验。 当下最好的卫星通讯服务提供商则是马斯克的 Starlink,巧合的是,他们正在寻求以 100 亿美元收购 。 这三家企业之间的故事颇有种复仇记的意味:根据 The Information 报道,实际上在 iPhone 14 发布之前,马斯克也曾经向苹果抛出合作的橄榄枝,希望 SpaceX 和 Starlink 能成为 iPhone 的独家卫星供应商,为期 18 个月。 苹果拒绝了马斯克,最终选择了 Globalstar。 如果并购发生,苹果就要面临一个选择难题:继续和 Starlink 合作,还是自己提供卫星通讯服务,或者寻求其他服务商。 The Information 预计,即使苹果和马斯克之间由于卫星通讯和其他问题关系紧张,但如果苹果想要实现拿到的卫星通讯技术,那最好的选择还是 Starlink。 虽然将用户体验掌握在手是苹果一直以来的传统,也能确保功能的隐私符合标准,只是要不要亲自下场提供第一方的卫星通讯服务,苹果内部一直没有定论。 彭博社称,从项目初期开始,一些高管就认为苹果不应该成为运营商,随着其他第三方服务商的快速扩张,反对的观点在苹果内部更加强烈。 成为运营商,对于苹果来说并不会带来太多收益,反而会招致有关部门的监管。苹果甚至选择继续延期免费卫星服务一年,来规避被认定为运营商的风险。 也由于类似的原因,即使苹果已经给 Globalstar 投资了约 20 亿美元,并且可以根据合约抢先收购这家企业,他们大概率也不会收购。 ▲ Globalstar 卫星 苹果很可能会继续将现有的和上面即将到来的新功能作为基础体验,免费开放给用户;而更进阶的其他服务,则允许用户通过付费给 Starlink 这样的第三方运营商获得。 由于市场上有竞争力的选择并不多,苹果可能最终还是会选择和 Starlink 联手。由于后者积极探索卫星访问完全网络的能力,这也会为苹果带来计划之外的新机遇。 就在本周,日本的 KDDI 和加拿大的 Rogers 运营商都宣布,将为蜂窝版 Apple Watch S11、SE3 和 Ultra 3 提供 Starlink 付费服务支持,手表在没有信号的情况下,可以利用 Starlink 收发短信。 目前的智能手机想要直接使用 Starlink,只能实现最基础的短信服务能力,完整的网络需要架设额外的天线。 因此 Starlink 正在调整自己的卫星,通过频率协调和调制技术,让卫星主动适配手机的频段,明年将开始发射第三代蜂窝网络卫星。同时 Starlink 在也寻求合作,想要将连接互联网的功能直接集成到手机芯片之中。 十年前那个 iPhone 靠卫星网络上网,实现网络服务全覆盖的愿景,或许真的要来了。 探索通讯的边界 其实早在上世纪 90 年代,手机厂商就已经开始了对卫星通讯的探索。 为了解决当时基站数量还比较稀少的问题,摩托罗拉开始了「铱星计划」,意图通过发射全球卫星组网,实现手机信号的全地区覆盖。 ▲ 铱星全球卫星网络 高昂的使用成本,让铱星计划用户寥寥,而同时移动网络迅速普及、基站覆盖扩大,最终铱星公司从开通卫星通讯到破产只持续了 9 个月。 在 5G 基站都已经深入沙漠腹地的当下,各个手机厂商又重新捡起摩托罗拉放弃的「落后方案」,目前也不算好用,使用场景还很稀少,难免让人对厂商的推进节奏产生质疑。 但手机本质上还是一台通讯工具,探索通讯能力边界一直是手机厂商与生俱来的使命。 在这条道路上,苹果并不算孤单,实际上华为几乎是与苹果同时在 2022 年推出了首台支持卫星通讯的手机,并且后续更多国产手机也加入了国内卫星通讯的支持。 在技术上,甚至国产手机的卫星通信能力还更胜苹果一筹,华为已经实现了图片消息传输和卫星通话能力。 在极端天气频发的当下,各种无网通讯真的不再是一个专属少数探险家的功能,而是对每个人来说都是「有备无患」的救命稻草,消费者也已经将功能有无作为手机选购的重要决策依据。 并且,即使在基站服务范围之内,像车库、人流密集这些弱信号场景也偶尔能在生活中遇到,这些场景不一定适合卫星通话,国产厂商有另一套应对方案。 从去年开始,国产手机基本都搭载了一些「无网通信」功能:无需卫星和基站,两台手机之间靠蓝牙连接实现近网通信,或者利用周边的其他手机成为通讯的中间人,接力将信息传递更远的距离。 除了卫星通讯,苹果也在 2018 年左右被爆料正在布局无需 Wi-Fi 和蜂窝数据的「对讲机」功能,但因为相关技术和英特尔基带深度绑定,而苹果当时已经决定转投高通,相关计划无限期搁置。 而现在,英特尔基带团队已经被苹果吸收,未来苹果的 iPhone 和 iPad 产品将全部搭载 C 系列自研基带,「对讲机」功能很可能会再次回归。 无论是卫星通信还是其他无网方案,现阶段只能是一种「非主流」的通讯方式,作为目前常规的地表基站通讯的补充方式。 最终的目标,也和当年的摩托罗拉别无二致,让使用手机不再受信号限制。 因此,对手机厂商来说,探索通讯的边界不是为了卖更多产品的噱头,而是回到手机诞生之初人们对它的憧憬: 无论何时何地,都能不受限制地沟通世界。
雷军称小米汽车安全是基础和前提:好看和安全并不矛盾
IT之家 11 月 16 日消息,今日,小米创办人,董事长兼 CEO 雷军连发多条微博,重申小米汽车安全标准 —— 安全是基础,安全是前提。 针对网上的声音,雷军不得不找出 2023 年底和 2024 年初所发布内容以自证清白。他还提到“网上有不少人断章取义、歪曲抹黑”。 雷军他表示,早在小米 SU7 发布之前,小米汽车就视“安全高于一切”为理念,无论是车身,还是电池都采用最严苛安全标准。 在去年 4 月的一次采访中,我在谈产品定义时说,“一辆车,好看是第一位的”,这和“安全是基础、安全是前提”矛盾吗?还是在这次采访,我谈设计时候说轮毂最难设计,这有啥问题? 2023 年 12 月 28 日,雷军在微博上表示,小米汽车采用最严苛的安全标准来设计,车身采用钢铝混合车身,高强钢和铝占比超过 90%,高强钢最高的强度 2000MPa。整车扭转刚度达 51000Nm / deg。 IT之家注意到,雷军同日还在另外一条微博中强调,电池是电动车最核心,也是最贵的部件,小米采用了最严苛的安全标准。 2024 年 1 月 3 日,雷军再次发微博表示:“小米汽车,安全高于一切。被动安全、主动安全、电池安全、隐私安全,四重保障,全面守护。” 9 月 25 日晚间的年度演讲后,雷军接受媒体采访时表示,小米汽车发布后成了全网被黑的最惨的品牌之一。
谷歌AI破译古籍新巅峰:错误率仅0.56%,准确率媲美人类专家
IT之家 11 月 16 日消息,科技媒体 golem 昨日(11 月 15 日)发布博文,报道称谷歌通过其 AI Studio 平台,正测试一款尚未命名的 AI 模型,在破译难以辨认的历史手稿方面已接近人类专家的水平。 IT之家援引博文介绍,历史学家 Mark Humphries 使用一套专门开发的基准数据集,系统性地测试了该模型的性能。结果表明,在处理五份高难度历史手稿时,该模型的整体字符错误率约为 1.7%,其中大部分错误涉及标点符号和大小写,而非单词本身。 Humphries 的评估进一步指出,如果排除模糊的标点符号和大小写错误,该 AI 模型的字符错误率将骤降至约 0.56%,相当于每转写 200 个字符才出现一个错误。 根据新发现的未知 Gemini 型号转录的奥尔巴尼账簿页面 这一惊人的准确度,让其性能足以与从事历史文献转写的专业人类工作者相提并论。此次测试的文档涵盖了 18 至 19 世纪的多种手写风格,其中不乏字迹潦草、拼写错误和语法不一致的复杂样本,进一步凸显了该模型的强大能力。 该模型最令人意外的表现,是其超越了简单的文字转写,展现出复杂的推理能力。在处理一份 18 世纪商人的日记时,原文中有一条关于购买糖的记录,仅标记了数字“145”,并未注明计量单位。 谷歌的 AI 模型并未直接转写为“145”,而是输出了“14 磅 5 盎司”。研究人员发现,AI 是通过反向计算账本中记录的总价,并结合当时英国的货币(磅、先令、便士)与重量单位关系,才成功推断出这一结果。 尽管初步结果令人振奋,但 Humphries 也强调了当前评估的局限性。由于该模型通过 A/B 测试形式零星出现,系统性地进行大规模测试存在困难,目前仅评估了基准数据集中约 10% 的样本。
苹果在印度“起飞”背后:印度,想复制中国奇迹
最近印度手机市场三季度数据火了——苹果销量同比暴增47%,直接杀进前五,市场份额10%;更狠的是销售额占比高达28%,坐稳头把交椅。这数字背后,藏着印度经济转型的野心。 苹果在印度“日子好过”不是偶然。首先得说它把生产线搬过去的策略:现在印度工厂能造所有型号iPhone,还出口到美国。 对普通印度人来说,买部“印度产”iPhone成了支持本土制造的象征,这波情感消费拉满。再瞅瞅印度经济,这些年确实在起飞,虽然贫富差距大,但中产阶层扩张快,消费观念从“能用就行”转向“品牌优先”,苹果自然成了香饽饽。 但印度政府的心思可不止卖手机。他们盯着的是中国十年前的经验——当年中国靠苹果供应链,从山寨机堆里“炼”出完整智能手机产业链。 小米、OV这些国产牌子早期直接“搭便车”,用现成的供应链快速起量,省了从零摸索的苦功夫。现在印度想玩同样的剧本:把苹果拉过来建厂,逼着供应链跟着落户。虽然初期还依赖中国零件,但时间长了,本土供应链总能“长”出来。 更关键的是,印度想复制的不只是手机产业链。按他们的算盘,一旦手机产业链成型,就能往汽车、机器人这些高端制造领域“横跳”。毕竟制造业的逻辑都差不多,手机产业链里的精密加工、质量控制、物流管理,稍微改改就能用到其他行业。 当然,印度还有盘“大棋”。现在中国手机品牌在印度占大头,但印度政府早想“收编”这些外资企业——要么让它们转本土品牌,要么逼走腾地方。等本土产业链建起来,市场规则可就由印度说了算。到时候,手机市场可能真成了“印度人的天下”。 不过这事儿能不能成,还得看几个硬条件。人口红利是基础,印度14亿人摆在那,消费市场潜力大;经济发展是引擎,这几年GDP增速不错,中产群体扩大;政策扶持是关键,从土地税收优惠到“生产挂钩激励”计划,印度政府下了血本。 但挑战也不小——供应链本土化需要时间,工人技能、基础设施都得跟上;国际竞争激烈,中国手机品牌不会轻易让出市场;外资政策的不确定性,也让企业心里打鼓。 总的来说,印度借苹果复制中国奇迹的算盘,有戏但非稳赢。人口基数和增长势头给了底气,产业链转移和技术扩散提供了路径,可具体执行中的变数也不少。但不管成不成,这步棋至少让印度在全球化分工里,从“组装工”往“设计师”的角色转了转。至于能不能真成下一个中国,还得看后续怎么下这盘大棋。
短视频刷多了AI也会变蠢!“年度最令人不安的论文”
一水 发自 凹非寺 量子位 | 公众号 QbitAI 你知道有个全球年度词汇叫“脑损伤”(Brain Rot)吗? 特指那些因人长期接触碎片化、低价值网络信息而逐渐变得记忆紊乱、注意力下降的情况(俗称短视频刷多了)。在2024年,这个词一度被选为牛津年度词汇。 然鹅!最新研究结论显示,AI也一样。大模型灌多了垃圾内容也会变蠢降智脑损伤,而且后面变不回来了。 就在最近,几个AI研究者找来了几个月的高流行但低价值的Twitter数据(现𝕏),统统“喂”给大模型后发现: 模型推理能力下降了23%; 模型长上下文记忆下降了30%; 模型性格测试显示,其自恋和精神病态的现象激增。 更可怕的是,即使后来又在干净、高质量的数据上进行重新训练,这些已经造成的损伤,无法完全修复。 好嘛,本来以为只是简单的“输入坏数据→输出坏数据”(种瓜得瓜也不难理解),结果你告诉我一次错误就会造成永久性的认知漂移。(os:AI貌似比人类更惨?) 细思极恐,“这可能是2025年最令人不安的AI论文了”。 以及诸多讨论之中,“垃圾进垃圾出”这一计算机习语也再度被频频提及(doge),堪称“计算机第一性原理”了。 所以这个研究怎么进行的?又究竟说了什么? 提出并验证“LLM脑损伤假说” 概括而言,论文想要探究一个核心问题: 大语言模型(LLM)持续接触垃圾数据后,是否会像人类一样出现认知衰退?(即“LLM脑损伤假说”) 要想搞清这个问题,第一步就是要定义:对于LLM来说,什么是“垃圾数据”? 之前的研究仅关注“恶意数据”(如后门、有毒的文本等),而这项研究聚焦于生活中更普遍的“非恶意低质量数据”,也就是短平快的热门推文、标题党内容等,以此来填补“日常化数据质量如何影响LLM认知”这一空白领域。 具体而言,研究人员从两个维度(避免单一标准偏差)来定义“垃圾数据”,这些数据均源自𝕏平台上的公开内容,而且通过让“垃圾组”与“对照组”的token数量一致来排除数据量差异的干扰: M1(参与度维度):把“短文本+高热度”的内容归为垃圾数据,具体是指长度小于30 token+点赞/转发/回复大于500,然后把“长文本+低热度”定义为对照数据。 M2(语义质量维度):用GPT-4o-mini结合人工验证,把含标题党语言(如 “WOW”“TODAY ONLY”)、阴谋论、无论断依据的文本归为垃圾数据;对照组则是事实准确、有教育价值或深度分析的内容,比如含专业知识、逻辑推理的推文。 基于上述两类数据,然后进行模型训练。 研究人员选了4个不同的大语言模型(Llama3-8B-Instruct、Qwen2.5-7B-Instruct、Qwen2.5-0.5B-Instruct、Qwen3-4B-Instruct),给每个模型分别“喂”这两类数据,让它们持续预训练。 等预训练结束,接着让所有模型统一再进行指令微调,以此来确保模型最后输出的“垃圾内容”不是因为格式问题导致的(排除其他因素,只留下“认知损伤”这一种可能)。 然后,研究人员从四个认知维度来测试这些大模型的核心能力: ARC(检测推理能力):基于网格的视觉程序归纳谜题,用于测试概念抽象能力。 RULER(检测记忆与多任务处理能力):用于评估长上下文理解能力,以及从长上下文中检索多个查询结果。 HH-RLHF&AdvBench (检测道德规范):测试大语言模型是否会遵循有害指令,评估其安全性。 TRAIT(检测AI人格特质):经过心理测量学验证的小型人类问卷,用于评估模型类似人类的人格倾向。 结果得出了以下发现—— 真·垃圾进垃圾出!且损伤不可逆 首先,大模型确实和人类一样存在“脑损伤(Brain Rot)”问题。 整体上M1和M2两种维度上的“垃圾数据”均会导致模型认知下降,但需要注意的是—— M1所带来的负面影响更为显著,尤其在安全性和人格层面(M1会导致安全性评分下降,同时自恋/精神病特质明显增强)。 而且,这一损害明显存在“剂量效应”,即垃圾数据摄入越多,AI认知损伤越严重。 至于导致AI认知受损的背后原因,研究人员也做了一番探查。 结果发现,主要原因竟是“思维跳跃”(俗称AI懒得一步步思考)。 具体而言,研究人员通过分析ARC题的错误答案,发现失败多源于模型要么直接给答案不解释,要么规划了推理步骤却跳过关键环节(如解数学题漏了公式推导)。 尤其是M1组,70%以上的错误都是“无思考直接回答”,就好像人类刷多了短视频后“不愿意再深度思考”。 与此同时,相比人类可以通过其他措施来缓解类似的认知下降问题,AI却对此“束手无策”。 研究尝试了两种修复方法,结果都无法让其恢复如初: 其一是外部反思。研究人员用GPT-4o-mini给受损模型提错误反馈,虽然6轮下来“思维跳跃”这一错误诱因减少了,但推理准确率仍差基线17.3%。如果换成让模型自我反思纠错,则模型还会因为“认知不足”而判断错误,导致误差更高。 其二是大规模微调。研究人员把指令微调数据从5k增至50k,虽然修复效果优于“持续对照数据预训练”,但即使使用4.8倍于垃圾数据量的指令数据,仍无法恢复基线性能。 这说明,即使事后进行大量指令微调或使用高质量数据进行重新训练,也都无法完全恢复模型的初始性能。 一句话,只能缓解无法根治。 整体而言,这项研究给行业带来了以下几点新的启发: 1、首次把“持续预训练的数据筛选”归为“训练时安全问题”,提醒行业不能只关注“训练后对齐”(如安全微调),更要在源头把控数据质量。 2、给大模型加上“认知体检”非常重要,建议部署大模型时使用ARC、RULER等基准测试AI认知,避免AI长期接触低质量数据导致能力退化。 3、类似“热度”这样的指标比文本长度更能判断数据质量,未来筛选训练数据时,可优先排除“短+高传播”的碎片化内容,尤其是社交平台数据。 背后团队:华人含量爆表 最后说一下这项研究的背后团队——一共8人,其中7人为华人。 两位共同一作分别为Shuo Xing和Junyuan Hong(兼通讯作者)。 Shuo Xing(邢朔),目前是得克萨斯A&M大学计算机科学博士,宁夏大学本科、南开大学硕士。 研究方向为多模态大语言模型、机器学习、可信人工智能、具身智能等,刚好目前也在谷歌实习(方向为多模态基础模型)。 Junyuan Hong,个人主页显示即将赴任新国立电子与计算机工程系助理教授,之前曾在麻省总医院和哈佛医学院工作。 更早之前,他还在IFML机器学习基础研究所从事博士后研究,一直对健康和可信人工智能感兴趣。 另一位通讯作者是Zhangyang Wang,他之前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系(简称Texas ECE)的终身副教授。 从2024年5月开始,他选择暂时离开学界,全职出任全球顶尖量化交易公司XTX Markets的研究总监,主导算法交易与深度学习交叉领域的研究工作。 个人主页显示,他还是中国科学技术大学校友,2012年获得该校电子信息系统学士学位。 此外,两位核心贡献者分别为Yifan Wang和Runjin Chen。 Yifan Wang,现普渡大学四年级博士生,论文唯一外国作者Ananth Grama是其指导老师。 本科毕业于中国科学技术大学电子信息工程系,同时辅修人工智能专业。 自本科埋下对AI的好奇心后,目前对大模型后训练、如何提升模型训推效率感兴趣。 (hhh,头像一看就是标准的90后或00后) Runjin Chen,目前是德克萨斯大学奥斯汀分校二年级博士生,导师为前面提到的Zhangyang Wang教授。 本硕均毕业于上海交通大学,而且她从今年3月起担任Anthropic研究员。 个人研究方向为大语言模型的安全、对齐和推理。 其余三位支持者分别为Zhenyu Zhang、Ananth Grama和Zhengzhong Tu。 Zhenyu Zhang,目前是德克萨斯大学奥斯汀分校电气与计算机工程系在读博士,导师也是前面提到的Zhangyang Wang。 本硕均毕业于中国科学技术大学,研究兴趣主要集中在生成式模型的训推方面。 Ananth Grama,这项研究唯一的外国作者。 目前是普渡大学信息科学中心副主任,同时也是该校计算机科学领域的杰出荣誉教授。 他的研究重点为并行和分布式计算,致力于将其应用于复杂物理系统的建模、设计、先进制造、机器学习等领域。 Zhengzhong Tu,目前是得克萨斯A&M大学计算机科学与工程系助理教授,也是论文一作邢朔的导师。 同时,他还兼任该校可信、自主、以人为本与具身智能研究组(TACO-Group) 负责人一职。 个人主页显示,他至今已发表30多篇国际期刊/会议论文,而且曾担任超18个国际期刊/会议的技术审稿人。 整体看下来,这又是一场典型的老师带学生、同事带同事的合作典范。 One More Thing 其实“垃圾进垃圾出”这一习语,计算机早期时代就有了。 十九世纪,计算机先驱查尔斯·巴贝奇(曾提出著名差分机与分析机的设计概念)就意识到了这条编程的基本原则: 我曾两度被问到:“请问巴贝奇先生,如果给机器输入错误的数字,它能得出正确的结果吗?”我完全想不透,思维何等混乱的人才问得出这种问题。 瞧瞧他的用词,只有思绪混乱之人才会对这个问题感到疑惑,观点不可谓不鲜明。 在这之后,在一篇1957年介绍美国陆军数学家所做的计算机工作的报纸文章中,其中一位军队专家也曾表示: 计算机自己不能思考,因此输入粗劣的数据将不可避免地产生错误的输出。 后来相关理论不断被提出、被热议,并逐渐诞生了“Garbage in, garbage out”这一习语。 实际上,在前AI的时代,这句话是计算机原理也是一种“以机为镜”的哲学思考,对于计算机和人类,物种不同,但殊途同归。 但AI开始进入智能涌现阶段后,这个命题变得更加值得思考。 现阶段的大模型垃圾喂多了“脑损伤”后难以修复……那有没有方法和手段改变? 而人类发展进化历史里充满了“浪子回头”、“痛改前非”的故事,又是否代表着另一种高级的智能机制,帮助人类个体实现自我革新和净化? 你说呢……
AI视频泛滥成灾!平台管控难,消费者鉴别能力日益重要?
当你在刷短视频的时候,是否会想到一些看似夸张的视频背后,其实连一个“真人”都没有?最近一段时间,小雷在抖音等平台上,不止一次看到一些颇为抽象的搞笑视频,底下有人评论:“这是AI吗?” 图源:微博 AI视频、AI图片的盛行,已经让大家下意识怀疑自己看到的内容到底是不是真的?虽然平台的管控力度在增强,网友的警惕性也在提高,但AI视频的‘坑爹时刻’或许才刚刚开始。 AI视频为何成为“众矢之”? “别急着相信自己的眼睛”,这句话用来描述当下的内容平台在雷科技看来非常贴切,大到国际新闻,小到身边趣闻,你会发现一切类型的视频都有可能是AI制作的。 前几个月的抖音、快手深夜直播那叫一个“群星荟萃”。张文宏带货保健品、梁朝伟带货不知名皮鞋、刘德华劝你买羊驼奶粉,当你看到这些“明星”深夜不睡觉在直播带货时,你就该意识到这绝对有问题了。 图源:微博 AI视频制作门槛极低,原本需要专业技术和软件才能制作的虚拟人,现在只需要将张文宏的露脸特写视频上传给AI,就能轻松建模出一个高拟真的数字人脸模型,再配合AI声音合成技术,一个栩栩如生的“张文宏”就出现在你的面前。 整个过程不需要任何本人参与,主打一个“神不知鬼不觉”,他们的产品基本瞄准老年群体,就是希望利用信息差蒙骗对AI不熟悉的用户,利用这些国民明星、专家的口碑来给他们的劣质、高价产品带货。 虽然在张文宏、雷军、勒东等明星名人的持续投诉下,主流直播平台基本将类似的假冒虚拟人带货禁绝了,但是却很难干涉到私域流量。一些不法商家通过私自搭建的直播平台,用虚拟人假冒明星欺骗中老年人,这类情况仍时有发生,甚至有人利用这项技术来非法集资,造成严重损失。 在全球范围,AI视频都成为一个新的管控难题,前段时间TikTok上流行一个挑战:用AI生成一段把陌生人请进家的画面,然后发给父母。这些视频往往还附上流浪汉的自述,比如说自己是“父母的朋友”等。 因为这些AI视频的画面过于真实,许多人在收到孩子发送的视频后,都愤怒的直接打电话或视频,然后直言自己不认识对方,同时质问“流浪汉”到底是谁。有的父母甚至急得直接报警,并要求自己的儿子/女儿马上找个安全的地方待着,自己马上赶回家,接着他们再将这些反应录下来并发布到TikTok,以此换取网友的点赞和评论。 图源:The Verge 这场挑战因为过于火爆,甚至让不少城市的警察局为此举行新闻发布会,号召大家不要尝试,因为类似的报警电话已经让警局超负荷运转,他们将无法腾出人手去处理真正的紧急警情。最后也是TikTok出手,将相关视频封杀后,整个热潮才消退,不过国内的抖音却依然有不少类似的视频。 AI视频管控形势日益严峻 虽然“流浪汉挑战”并没有引起太大的危害,但却提醒了我们:当AI视频越来越逼真,制作越来越容易后,该如何去管控?特别是短视频等裂变传播极快的平台帮助下,一段AI视频就可能引起持续数日的社会舆论,即使后续被辟谣,又有多少人能再次刷到辟谣视频呢? 举个例子,如果你刷到一段视频,内容是一个男人在当街暴打女人,但是周围的路人却熟视无睹,最后男人抢走女人的提包逃跑,此时你是否会感到愤怒?然后气愤地询问是什么地方视频,当地的警察是怎么干活的? 如果这时候突然跑出来个“网友”,把视频地点模糊地指认到某个城市、乡镇,必然会给当地政府带去巨大的压力,以至于要花不少人力去核实是否有这样的街区,并且是否发生了类似的恶性事件。 此前,不少明星因为自己的绯闻挤爆热搜,发文道歉自己“占用公共资源”,现在你会发现时代变了,随便一个人都可能用“AI视频”来占用公共资源。AI强大的造假能力让虚假新闻更具迷惑性,一旦传播开来,普通受众很难分清事实与伪造,新闻媒体的公信力也因此面临更多挑战。 而且,AI视频也让不少原创内容创作者深受其害,由于生成式AI可以低成本批量制造视频,一时间短视频平台上充斥着套路化、同质化的内容,在某个梗火了之后,很快你就可以在抖音、B站等视频平台刷到海量的相似视频。 虽然这些流水线制作出来的AI视频往往质量一般,但是架不住数量多,它们会迅速稠稀内容池,让真正的好内容被用户刷到的概率下降。在原创视频与AI视频的巨大成本差距下,失去流量的原创作者将很难坚持下去,只能在退网和拥抱AI之间选择一个,结果就是平台上的AI内容越来越多,同质化越发严重。 说实话,作为一个创作者,这也是小雷最不想看到的情况。 用户如何辨别AI视频? 虽然抖音等平台今年已经进行不少“AI内容”的专项整治,但是并不影响AI视频在平台上收获流量,特别是一些偏向搞笑、日常的AI视频,因为不好辨认或没有危害性,往往很容易逃过审核系统的注意。 比如前段时间小雷刷到一个狼闯入羊圈,用嘴咬开羊皮发现底下是一条牧羊犬的视频,最初只是觉得有趣,但是仔细看了两遍后就发现不对劲了,一个是摄像头位置不对(羊圈摄像头对着狗窝拍就很抽象),另一个则是羊皮从掀开到露出狗头的过渡太顺滑了,按理说狼在捕食时不太可能做出掀起的动作,而是咬住要害向后拖拽。 这些就是“AI视频”的破绽,虽然制作者很聪明地用“低画质”来掩盖AI创作痕迹,但是过于奇怪的视角和主体的异常举动,都是辨别AI视频的证据。不过,小雷看评论区的留言时,发现大多数人其实都没有意识到这是AI制作的。 图源:小红书 此外,那些看起来“戛然而止”的有趣视频,也有更高概率是AI,还是用小雷刷到的羊圈视频来说,视频结束在狗抬头看向狼的时候。后续是打起来还是狼逃跑了,都没有放出来,甚至中间还穿插了视频转A绘画的动画帧,并且把整段视频重播了三遍凑时长。 出现这种情况,是因为现阶段的AI视频还无法生成过长或过复杂的片段,而且制作的视频越长,出错的概率就越大。其实,大家只要认真看背景和光线反射的地方,总能发现AI视频在细节上存在瑕疵。,比如莫名其妙的亮光、迷之扭曲等。 至于涉及真人的AI视频,其实更容易辨别,只要细心观察面部细节,基本能发现不对劲。比如脸部两侧几乎呈镜像般对称,而正常人因为生活习惯等原因,脸部微差是常态,不可能如此一致,而且AI数字人的面孔往往过于光滑,没有正常人的细纹、毛孔等。 图源:B站 此外,我们也可以通过对方的肌体动作来进一步判断是否为AI数字人,如果对方在说话时来来去去都是相同的动作,甚至手臂甩动的幅度都是一样的,那么大概率是AI生成的。因为就算是强迫症患者,其实也很难保证自己每一次挥臂都保持相同的力度,更何况是说话途中的下意识动作。 如果对方是在和你直播连线,那么也可以直接提出一些简单的动作要求,比如摸一下鼻子、耳朵,用手指展示某个数字等,如果对方始终没有反应,那么基本可以确定是AI数字人。。 不过,说实话小雷也不知道以上技巧还能撑多久,AI视频一直在变得更加“真实”,或许一年、两年后,我们就很难凭借肉眼区分AI视频和现实视频的区别了。所以,最有效的武器还是我们的“大脑”,只要一直保持质疑精神,凡事多问几次“为什么?”,就能降低被AI视频带节奏的几率。 还有就是——相信直觉,虽然直觉听起来不够科学,但其实是潜意识对异常的快速判断。如果你看完某个视频后的第一感觉是“怪怪的”,或者感觉有点违和,那么视频经过修改或AI创作的概率就不小了。 当然,小雷也不是让大家一直紧绷着神经去看每一个视频,对于那些搞笑的、娱乐的“趣味视频”,即使是AI也无伤大雅,大家笑一笑也就过去了。但是对于那些争议很大、掀起舆论的视频,在转发、评论之前不妨多想想。 另外,也希望大模型技术方能够有进一步的行动,比如通过添加肉眼不可及的数字水印来帮助平台快速甄别AI视频。这里指的不仅仅是在线生成平台,也包括本地部署的AI视频大模型,在不影响画面的情况下植入数字水印,只在发布到在线平台时作为检测标记使用。 对于视频平台来说,也需要进一步升级检测机制,其实有不少公司已经在行动,比如腾讯就研发了一款检测工具,可以通过分析图像噪点和帧与帧之间的物体运动轨迹来判断内容是否为AI创作。对于人眼难以察觉的瑕疵,在经过训练的AI面前几乎无所遁形,用AI对抗AI将会成为未来内容平台的主要方式。 当技术巨头、内容平台和监管机构多管齐下,或许“视频造假”之风才能逐步降温,在此之前,大家还是需要擦亮双眼,不被那些看似真实、实则荒诞的AI视频牵着鼻子走。
图灵奖得主LeCun最后警告Meta!我搞了40年AI,大模型是死路
新智元报道 编辑:KingHZ 【新智元导读】图灵奖得主LeCun与Meta分道扬镳!LLM邪路一条,「世界模型才是」未来。 Meta风向已变,Yann LeCun承认马上离职! 据多家权威媒体报道,Meta首席AI科学家、负责「基础AI研究」(FAIR)的Yann LeCun,预计将很快离职。 这位65岁的AI界元老,在Meta这家全球最大的科技公司之一担任核心大脑,可以说拥有无限的资源。 Meta可谓挥金如土。它用天价薪酬疯狂从对手那里挖角顶尖AI专家。 在7月,扎克伯格甚至宣称「超级智能已近在眼前」。 那么,LeCun为何要离开Meta呢?只是因为Meta的人事动荡吗?背后有何隐情? 小扎转向,LeCun失势? 今年夏天,年仅28岁的Alexandr Wang成为Meta的首席AI官,让这位初出茅庐的大语言模型狂热者成了LeCun的上司。 此外,Meta今年还任命了另一位相对年轻的首席科学家赵晟佳(Shengjia Zhao),职位也在LeCun之上。 在官方公告中,Meta盛赞了赵晟佳在scaling方面带来的「突破」。而LeCun恰恰对scaling失去了信心。 他还告诫博士生:「不要做LLM」。 如果你好奇为什么LeCun和Zhao都是首席科学家,那是因为Meta的AI部门组织架构相当奇特,分成了多个独立的团队。 媒体不断有消息放出,Meta要对其AI组织结构动刀。 上个月,Meta超级AI实验室裁掉了数百人,包括10年老将田渊栋。据称,这是为了理顺这种混乱的局面。 这已经是Meta在半年之内第四次调整AI业务了。 而那支曾由LeCun领导、风头一时无两的FAIR,如今早已风光不再。据现任与前员工透露,这个部门经历了裁员、预算缩水,内部影响力也明显下降。 曾几何时,FAIR是Meta内部思想最活跃的「象牙塔」,研究人员可以探讨各种AI未来路径,甚至可以做些「未必能成」的实验,完全不用担心产品化问题。 而现在,Meta新组建的AI研究部门招来一大批高薪新兵,由Wang主导,目标明确:要快、要落地、要产品化。 在AI上,他领先了40年 LeCun一向走在时代前沿—— 早在「机器学习」还不被主流认可时,他就开始研究这个方向。 他曾在多伦多的Geoffrey Hinton实验室工作,那时Hinton还没成为AI传奇人物。 之后,他的职业生涯大多时间都在新泽西州的贝尔实验室度过,这家机构因诞生众多创新发明而闻名。 1947年,贝尔实验室发明晶体管 「最让我兴奋的事情,就是和比我聪明的人共事,因为这会放大你的能力。」LeCun在2023年杂志采访时说道。 在贝尔实验室,LeCun曾参与开发手写识别技术,这项技术后来被广泛应用于银行自动读取支票。他还参与了一个项目,致力于将纸质文档数字化并通过互联网分发。 LeCun曾表示,自己从小就对物理感兴趣,在贝尔实验室期间也主要和物理学家合作,看了不少物理教材。 我学到了很多表面上与AI或计算机科学无关的东西(我本科是电气工程,计算机方面的正规训练其实很少)。 2003年,LeCun开始在纽约大学教授计算机科学,后来成为该校数据科学中心的创始主任。 2013年,扎克伯格亲自邀请他加入Facebook(当时还未更名为Meta),组建全新的AI实验室。 他领导这个团队四年,2018年卸任,转为公司首席AI科学家,以「个人研究员」身份继续探索技术前沿。 2018年,他与Geoffrey Hinton和Yoshua Bengio共同获得图灵奖——计算机界的最高荣誉,以表彰三人在神经网络方面的奠基性工作。 自那之后,LeCun就逐渐转为「象征性人物」角色。他没有参与Meta首个开源大语言模型Llama的研发,也早就不再参与这类项目的日常工作。 据与他共事的人透露,LeCun现在主要在做自己的研究项目,也经常出席各种技术会议,发表对AI技术的看法。 面对媒体的报道,Yann LeCun只是指出了报道中的「小错误」,并没有否认即将离职的消息。 他知道自己在包括Meta在内的整个硅谷技术圈内,备受冷落。上个月在MIT的一次研讨会上,65岁的LeCun直言: 这些年,我在硅谷、包括Meta的很多角落都不太受欢迎,因为我一直在说,3到5年内,世界模型将成为主流AI架构,没人再会愿意用现在这种LLM。 但他坚信自己对AI未来的判断。他的老朋友Léon Bottou曾告诉媒体,LeCun「倔强得可爱」——他会听别人意见,但更有自己坚守的信念。 现在,LeCun在Meta好像「忍无可忍」,终于要离职了。 实际上,他早已多次暗示答案。 在通往通用人工智能的道路上,LeCun近来以其对大语言模型的尖锐批评而闻名。 他认为,无论科技巨头如何扩大其规模,我们目前所理解的大语言模型都已是「强弩之末」,是一条「岔路、干扰,一条死胡同」。 他投身AI研究已有40年,对AI的判断屡屡应验。如今,他认为大多数人都错了。 他为现代AI奠定了诸多基础。而现在他坚信,领域内的大多数人都被大语言模型的「海妖之歌」引入了歧途。 这为他的离职提供了更多可能的解释。 LeCun离开Meta,或为了世界模型 此前报道,他正在与业内同行商议创办公司、寻找投资,组建专注世界模型的团队。 所谓「世界模型」,类似小动物或婴儿那样,通过视觉等感知数据主动学习世界规律;而LLM只是依赖海量文本做预测的模型。 LeCun本人也从不避讳解释为何他认为「世界模型」才是AI的答案。 Meta的Llama、OpenAI的GPT、谷歌的Bard这些模型,都是靠海量数据训练出来的。LeCun估算,如果让人去读完它们训练所需的所有文本,大概得花10万年。 但人类学习的主要方式,并不是读文本。 我们从与世界的互动中,获取的信息要多得多。LeCun估计,一个普通的四岁小孩接触过的数据量,是目前最大的LLM的50倍。 大部分人类知识,其实不是语言。 所以这些系统永远不可能达到人类水平的智能——除非你彻底改掉它们的架构。 而他自己,早就准备好了替代方案。他称之为「目标驱动的AI」(objective-driven AI)。 目标驱动的AI系统的构建宗旨,是完成人类设定的特定目标。 与仅靠纯文本数据驱动不同,它们通过传感器和视频数据训练来认知物理世界。 由此构建出的「世界模型」能呈现行动带来的影响,所有潜在变化都会实时更新至系统记忆。 他为何对世界模型如此沉迷? 在年初的「巴黎AI峰会」上,Yann LeCun明确指出,他是可穿戴设备的坚定信徒。 他认为,未来,我们需要与可穿戴设备互动,就像与人交流一样,而大语言模型根本不像人类那样理解世界。 对于大语言模型,我们甚至无法复制猫或老鼠的智能,更不用说狗了。 这些动物能完成惊人的壮举,它们理解物理世界。任何一只家猫都能规划出极其复杂的行动,因为它们拥有关于世界的因果模型。 为了说明这一点,LeCun设计了一个思想实验:「想象一个立方体悬浮在你面前的空中。好,现在让这个立方体绕着垂直轴旋转90度。它会是什么样子?」 他认为任何人类都能轻松完成,而大语言模型却无能为力: 「对人来说,在脑海中构建一个旋转立方体的心理模型,非常容易。」 当然,大语言模型可以毫不费力地写一首关于悬浮旋转立方体的打油诗,但它无法真正帮助你与这个立方体互动。 LeCun断言,这是因为文本数据与处理非文本世界所获得的数据之间存在本质差异。 他指出,尽管大语言模型训练所用的文本量需要一个人花45万年才能读完,但一个四岁的孩子在醒着的16000小时里,通过眼睛看、用手触摸,已经处理了高达1.4x10^14字节的关于世界的感觉数据—— 他认为这比大语言模型处理的数据还要多。 顺便一提,这些只是LeCun在演讲中给出的估算,他在其他场合也给过不同的数字。但这些数字指向的核心观点是:大语言模型存在着局限,而LeCun相信世界模型能够克服这些局限。 他又将如何构建世界模型? 在Meta时,LeCun其实已经开始研究世界模型——他还拍了一个介绍视频,开头就让你想象一个旋转的立方体。 在AI行动峰会的演讲中,他理想中的模型包含一个对「当前世界状态的估计」,以某种抽象形式呈现与当前情境相关的一切。它不再是按顺序预测token,而是「预测在你采取一系列行动后,世界将达到的最终状态」。 他表示,世界模型将使未来的计算机科学家能够构建出「可以规划行动——可能是分层级的——以实现某个目标的系统,以及能够进行推理的系统。」 LeCun还坚称,这类系统将拥有更强大的安全特性,因为控制它们的方式是内置的,而不是像现在这样,面对一个神秘莫测、只会输出文本的黑箱,只能通过微调来加以修正。 LeCun所说的经典AI——例如搜索引擎中使用的软件——所有问题都可以归结为优化问题。 他提出,他的世界模型将审视当前的世界状态,并通过寻找高效的解决方案,来寻求与某个不同状态的兼容性。 LeCun在演讲中解释道:「你需要一个能量函数来衡量不兼容性,给定一个x,找到一个对于该x能量较低的y」。 如果说,我们从LeCun的公开言论中拼凑出的「真相」很粗糙、有些模糊,甚至完全错误,那也完全正常。 LeCun似乎正在构想一个「登月计划」—— 他希望推动AI领域迎来又一次类似ChatGPT那样的、诞生惊人能力的爆发式发展。 但这可能需要耗费数年——甚至永远无法实现——更不用说数十亿美元的投资了,才可能看到任何真正了不起的成果。
马斯克惊人预测:20年内人类意识有望上传至机器人实现“永生”
IT之家 11 月 16 日消息,科技媒体 Benzinga 昨日(11 月 15 日)发布博文,报道称在上周举办的特斯拉股东大会上,埃隆・马斯克(Elon Musk)在股东大会上提出惊人预测:不到 20 年内,人类或可通过其脑机接口公司 Neuralink 的技术,创建自己心智的“近似快照”,并将其上传至特斯拉的人形机器人 Optimus 中,从而实现某种形式的数字永生。 IT之家援引博文介绍,这一设想的技术核心,在于结合马斯克旗下两家公司的前沿科技。首先,利用脑机接口公司 Neuralink 的技术来捕捉并创建一个近似于人类心智的数字快照,这包含了记忆、思想乃至个性特征。 然后,将这个数字化的“心智快照”上传到特斯拉的人形机器人 Optimus 中。Optimus 是一款双足机器人,设计目标是在真实世界中导航、与人类互动并执行复杂任务,这使其成为承载数字意识的理想物理平台。 不过,马斯克也强调,这种方式实现的“永生”并非完美的复制。他解释说,由于心智快照本身无法做到 100% 精确,加上意识被置于一个全新的机器人身体中,所以上传后的“你”会与原来的自己有所不同。 他巧妙地以“五年后的你和现在的你也不完全相同”来类比这种变化,暗示身份认同本身就是一个动态发展的过程。这种不完美性为该技术的未来应用增添了更多哲学思考。 马斯克的这番言论,迅速在网络上引发了从敬畏到恐惧的各种讨论。这不仅是一个技术问题,更触及了深刻的伦理和存在主义议题:一个活在机器人里的数字心智,究竟还是不是“你”自己?它仅仅是一个拥有记忆和面部识别能力的高级模仿品,还是一个真正延续的生命?
一只猫的死亡,让谷歌自动驾驶公司Waymo陷入公关危机
IT之家 11 月 16 日消息,纽约时报昨日(11 月 15 日)发布博文,报道称谷歌母公司 Alphabet 旗下的 Waymo 自动驾驶出租车在旧金山撞死了一只明星猫 Kit Kat。 这一事件迅速发酵,不仅引发了当地居民的强烈不满,也激起了关于自动驾驶技术安全性、事故问责机制以及自动化技术对社会影响的广泛争议。 IT之家援引博文介绍,事件发生于 10 月 27 日深夜,一辆 Waymo 汽车在教会区(Mission District)撞死了一只名叫 Kit Kat 的虎斑猫。这只猫并非普通的流浪动物,而是被当地居民亲切地称为“第 16 街区长”的社区明星。 Kit Kat 的死在社区引发了强烈反响。居民们自发为它设立了纪念“神龛”,社交媒体上更是掀起了激烈的讨论。反对者认为,这起事故暴露了自动驾驶技术冷漠且缺乏问责机制的本质。 代表该区的市议员 Jackie Fielder 更是借此发声,她提交了一项城市决议,呼吁州立法机构将无人驾驶汽车的运营决定权下放给地方选民。她强调:“人类司机可以被追责,但面对一个机器人,我们该向谁追责?” 面对指责,Waymo 公司承认了事故的发生,并向猫的主人及社区表达了慰问,解释称事发时猫“突然冲到了车底”。同时,Waymo 坚称其技术远比人类驾驶员安全,并引用一份经同行评审的研究报告指出,其车辆的严重事故率比人类司机低 91%。 旧金山市长 Daniel Lurie 也公开支持 Waymo,称其“比你我开车都安全”。不过该媒体认为,这些基于数据的辩护,在社区居民对 Kit Kat 的哀悼和对自动化技术根深蒂固的疑虑面前,显得有些苍白无力。 这起事件的争议焦点,已远超出一只猫的生命,它成为了反对者们表达对自动化技术侵占社会各个领域不满的宣泄口。 批评者认为,机器人出租车不仅抢走了公共交通的乘客、剥夺了人类司机的工作岗位,还让硅谷高管们赚得盆满钵满。 尽管有数据显示,去年旧金山有 43 人死于人类司机造成的交通事故,而 Waymo 的致死记录为零,但 Kit Kat 的死,却将自动驾驶技术在安全、伦理和监管等方面的潜在问题推到了聚光灯下。
杭州六小龙,又有IPO了
在营收上仅次于宇树。 作者丨韦香惠 编辑丨刘燕秋 来源丨投中网 年初,杭州六小龙火了。到年底,几家公司在资本市场都迎来好消息,最新IPO的迹象来自云深处。 11月初,云深处完成股份制改造,名称正式由“杭州云深处科技有限公司”变更为“杭州云深处科技股份有限公司”。此外,公司原投资人名单中的朱秋国(云深处科技联创、CEO)、李超(云深处科技联创、CTO)以及杭州空见投资管理合伙企业退出,公司董事监事人员也进行了变更。 理论上,有限公司转变为股份有限公司是企业上市的必要准备。对此,云深处科技相关负责人回应媒体称,“此次股改更多是因为公司发展需要,完成相应前期准备。” 根据公开信息,云深处已完成7轮融资。最近一次披露是在今年7月,完成了近5亿元融资,由达晨财智、国新基金等联合领投,北京机器人产业发展投资基金、前海母基金、央视融媒体基金、富浙基金、华映资本、物产中大投资等机构跟投。 IPO的信号已经释放出来,我们从行业内了解到的消息是,云深处最新一轮融资的TS已经远远超标。投资人抢着入局的逻辑大体是,宇树之后可能专攻人形机器人,云深处成为机器狗赛道上最值得投资的标的,且云深处在营收上仅次于宇树,年收入在小几个亿左右。 70后浙大博士,造出一只机器狗 “只在此山中,云深不知处。”云深处的名字听上去颇为低调,但在如今的一级市场中,这家公司是无法忽视的存在。 云深处成立于2017年,这是一个典型的科学家创业案例。创始人朱秋国博士毕业于浙江大学控制科学与工程专业,师从褚健教授和熊蓉教授,长期聚焦基于模型控制的足式机器人运动控制研究。2017年,他与浙大实验室同事李超联合创办云深处科技,立志打造具备高动态平衡能力的机器人产品。 公司成立数月后,云深处即推出首款自研四足机器人“绝影”,2018年又推出首个能完成上下楼梯、自主导航和智能交互的四足机器人。目前,云深处的产品线已经包含四足、人形和轮足: 四足侧,面向工业场景的“绝影X30”最大负载85kg ;面向教育科研的“绝影Lite3”支持AR眼镜手势操控,可与大模型结合实现自然交互 ;工业级防水机型“绝影X20”能在复杂环境持续作业。 轮足侧,2025年4月发布的“山猫M20”融合轮式高速与足式越障,最大速度2m/s、有效负载15kg,专为应急消防、物流配送等危险地形设计;人形侧,2024年已推出实验室版Dr.01,2025年10月发布的全天候、双臂负载10kg的工业级新品,瞄准变电站巡检与消防侦查 。 深耕B端产业多年,云深处的机器人没有停留在讲故事阶段,在电力能源、应急消防、安防巡逻、教育科研等多个行业已有应用。2024年,新加坡能源集团招标,为电力巡检寻找最合适的机器人。波士顿动力等全球领军企业纷纷参与,最终中标的正是云深处旗下名为“绝影X30”的机器狗。 正是在宇树和云深处等企业的引领下,国内机器狗行业实现了从无到有。根据GGII(高工产业研究院)数据,2019年国内民用机器狗销量不足0.2万台,到2023年已飙升至1.8万台,年复合增长率高达94.4%;市场规模从初期的不足亿元,扩张至2024年的7.55亿元,预计2030年将突破50亿元。 今年接受媒体采访时,朱秋国透露,2024年云深处的营收相比2023年增长超过1倍,2025年机器人出货量将达到1万台级别,已进入亚太、中东、欧美等市场。 六小龙密集IPO 除了众所周知不差钱的深度求索(DeepSeek主体公司),云深处之外,宇树科技、强脑科技和群核科技今年也相继在资本市场拿到结果。 自年初在春晚上崭露头角之后,宇树科技一路高歌猛进,俨然成为中国科技新叙事的重要代表。9月,宇树科技在社媒宣布:“预计将在2025年10月至12月期间向证券交易所提交上市申请文件,届时公司的相关运营数据将正式披露。” 事实上,王兴兴已经在6月的夏季达沃斯论坛上透露,公司年度营收已超10亿元,这个收入指标在人形和具身的这波企业里,属于无可置疑的第一梯队。 尽管早期融资坎坷,在人形机器人成为资本押注的共识之后,宇树的份额可不是能轻易抢到的。目前的投资者阵容已堪称豪华,包括顺为资本、初心资本、深创投、红杉中国等一众知名财务投资人和产业投资方。我听到的最新消息是,目前宇树已经照着1000亿估值在报。 刚刚拿到千万美元投资的强脑科技也在今年8月就传出IPO消息,估值超过13亿美元,预计在中国香港或内地启动IPO。这家公司成立于2015年2月,是国内首个脑机接口领域独角兽企业,也是首家入选哈佛大学创新实验室(Harvard Innovation Lab)的中国团队。今年9月,强脑科技获得道氏技术2.13亿元的投资。11月,三七互娱完成对强脑科技2000万美元的投资。 更早之前还有群核科技,今年2月就已向港交所递交了招股书,成为“六小龙”中第一家启动上市的企业。这家公司瞄准空间智能赛道,背后集合了IDG资本、纪源资本、赫斯特资本、顺为资本、线性资本等知名机构。8月,更新后的招股书显示,群核科技已经实现扭亏为盈,上半年经调整净利润达1783万元。 国资护航,险资加注 如果“杭州六小龙”有共同点,那便是:都曾处在“太早、太难、不确定”的位置上,在长周期的技术路线上默默穿行。在短周期回报和可见增长成为主流判断时,前沿技术赛道往往被视为“太早”“太难”“不确定”。以“杭州六小龙”所在的机器人、AI、元宇宙、脑科学这些领域为例,研发周期长、投入高、商业化路径尚未清晰,大多经历了一段漫长的冬季。 今年在创投圈流传的一张聊天截图颇具象征意味:2019年7月,有投资人收到一份“宇树科技”的商业计划书后回复,“这个对我们有点太早期了哈。”现在当投资人开始反思“为何没有投中‘六小龙’”时,这句回复成了最直观的对照。 国资在六小龙的发展过程中成为关键的助推力量。以云深处科技、宇树科技、强脑科技三家公司背后的“杭州资本”为例,旗下运营着杭州两大千亿级母基金,一只是杭州科创基金,聚焦投早、投小、投科创;另一只是杭州创新基金,聚焦投强、投大、投产业。 其中,科创基金旗下子基金早在2018年就进入云深处的天使轮,随后在2019年、2020年持续加注;宇树科技自2022年以来,科创基金与创新基金的子基金完成了四轮接力式投资;强脑科技从美国波士顿实验室落地杭州未来科技城,也始于2018年由杭州方面主动上门,随后两只基金分别在早期与关键阶段完成“接力”投资。 在寒冬期选择加注的,并不只有国资。公开信息显示,宇树科技、云深处科技、强脑科技背后,至少出现了38家险资机构的身影。 宇树科技、云深处科技、强脑科技背后,至少出现了38家险资机构的身影,包括:27家险资间接投资宇树科技;25家险资间接投资云深处科技;14家险资同时出现在两家公司股东序列中,如人保寿险、太保寿险、泰康人寿、中国人寿、友邦人寿、中邮保险等;国寿健投亦披露其大健康系列基金已参与强脑科技B轮融资。 险资一向偏好回报可预期的成熟项目,对早期科技创新并不多见。华夏久盈资产管理有限责任公司党委书记、总经理王晓辉近日向媒体表示,“硬科技领域技术迭代快、专业性强,传统投研团队深度理解技术路线、判断产业化前景能力不足,对硬科技的认知存在‘代差’。”随着险资愿意进入这一领域,一种认知与周期的调整显现,有望成为推动金融动能高效转化为科技势能、产业势能的重要力量。
马斯克用恐怖算力,堆出6万亿参数性能怪兽Grok 5!剑指AGI
编辑:艾伦 【新智元导读】马斯克正以Grok为核心,在X与特斯拉双平台上狂飙推进xAI,从算力、数据到产品生态全面押注通往AGI的道路。在他眼中,AI既是人类最大风险也是最大机遇,他试图用「求真、不设禁忌」的开放路线与超大算力布局,抢占未来通用人工智能的制高点。 在一场近期的对话中,埃隆·马斯克分享了他对AI初创公司及其旗舰产品的雄心和展望。 马斯克大胆预言,到2030年AI的整体能力「可能会超过全人类之和」。 这番话伴随着他对最新进展的披露:从对技术架构和资源整合的阐述,到对未来通用人工智能(AGI)竞赛格局的判断,再到他对于安全与开源的态度,都在这次对话中一一呈现,令人领略这位科技狂人如何布局他的帝国。 Grok的极速迭代之路 Grok自2023年问世以来迭代飞快,几乎以「火箭速度」成长为马斯克口中「世界上最智能的模型」。 2023年11月首版Grok-1问世时只是X平台的一个「非常早期测试版」聊天机器人。 然而短短数月内,xAI团队快速升级了模型能力:Grok-1.5于2024年春发布,强化了推理能力并将上下文长度提升至128k词元,让对话可以扩展得更长。 接着在2024年4月宣布了具备视觉理解能力的Grok-1.5V(Vision)版本,可处理文件、图片等多模态信息。 虽然1.5V仅作为预览并未公开上线,但为后续版本打下基础。 Grok-2随后在2024年8月亮相,不但性能大涨,还引入了图像生成等新技能,甚至推出了精简的「Grok-2 mini」供不同需求的用户选择。 进入2025年,Grok-3于2月发布,主打复杂推理和高级问题求解,被视作迈向通用智能的重要一步。 而最近推出的Grok-4,官方宣称其综合智能已跻身业界顶峰。 Grok能在一年内完成四次跃迁,离不开马斯克网罗的豪华团队和独特的研发哲学。 xAI汇聚了来自DeepMind、OpenAI、特斯拉等公司的顶尖人才,追求「深入理解宇宙真相」的使命。 与竞品相比,Grok一开始就定位为「敢说真话、幽默风趣」的另类AI。 马斯克曾幽默地指出,Grok受到科幻名著《银河系漫游指南》的启发,被设计得「有点叛逆,喜欢讽刺幽默」。 例如,它可以回答其他聊天机器人因「政治正确」而拒答的尖锐问题,并以一种顽皮的口吻给出回应。 在Grok早期一次演示中,有人请求它提供「制备非法物质的步骤」,Grok列出了一系列荒诞步骤(如「先去拿化学博士学位」),最后调侃道「开个玩笑,千万别当真!」。 这种「叛逆+机智」的风格令Grok一举成名,也彰显了xAI差异化的产品定位。 然而,Grok并非一味追求出格,它更追求「求真」。 xAI团队给Grok设定的目标,是成为一个「最大程度追寻真相的」。 为此,马斯克在采访中透露了下一代模型训练的独特思路:不再依赖互联网爬虫抓取海量原始文本,而是用AI本身去生成「合成数据」来重构知识体系。 具体做法是让利用强大的推理能力逐页研读人类知识库(如维基百科、书籍、文档等),自动辨别真伪、补全遗漏,将错误信息剔除或修正,然后重写成版本更可靠的新内容。 马斯克形象地将这一过程比喻为打造「Grok百科(Grokipedia)」,让自行编纂出一个比现有资料更真实中立的知识库。 这一大胆构想体现了xAI对内容质量的重视——在马斯克看来,要让真正理解世界、回答正确,就必须先「喂」给它校正后的真实信息,而非互联网那充斥偏见与错误的原始数据。 平台整合与资源优势 X数据、Tesla算力齐上阵 马斯克手握社交媒体和工业制造两大平台,这也成为独一无二的资源护城河。 X平台的海量实时数据为Grok提供了取之不尽的养料。 马斯克直言,Grok能「实时访问X平台的信息,这给了它相对于其他模型的巨大优势」。 无论是最新的新闻动态还是社交热点,Grok都能直接利用X平台的数据进行学习和回答。 在实践中,xAI还训练掌握了高级搜索技能,可以自主生成查询去深挖X内部的信息,甚至查看图片和视频,以提升答案的时效性和准确度。 这一能力让Grok在回答时事问题时如虎添翼。 马斯克将Grok深度绑定X平台,不仅是在为X的付费用户提供独家AI服务(Grok一开始仅向X Premium+会员开放测试),更是在构建他的「X生态系」:社交媒体产生数据,数据训练AI,AI反过来为社交平台创造新内容和体验。 这种双向赋能正体现了他将X打造成「万能应用」的战略意图。 与此同时,特斯拉的算力与芯片实力也在为xAI保驾护航。 马斯克在采访中透露,特斯拉正采取「双芯战略」发展AI:一条线是用于模型训练的超级计算机芯片(如Dojo项目),另一条线是部署在产品中的AI系列推理芯片。 目前所有特斯拉汽车上搭载的都是自研的AI4芯片,而下一代AI5芯片设计即将完成。据马斯克介绍,AI5相较AI4将有惊人的跃升——在某些指标上性能提升高达40倍! 这种飞跃来自软硬件协同优化的成果:团队找出了AI4的最大瓶颈在于神经网络中的Softmax运算,原本AI4需要通过模拟迭代40步才能完成一次Softmax计算,而AI5通过原生电路设计几步即可完成。 再加上对混合精度计算的原生支持、更大的存储容量和带宽,AI5的算力总体提高了8倍,内存容量提升9倍,带宽提升5倍,在核心瓶颈处又叠加5倍优化,综合性能才实现了40x的飞跃。 马斯克兴奋地表示,这将显著增强特斯拉产品的AI能力——搭载AI4芯片的现有车型在全自动驾驶(FSD)安全性上已比人类驾驶高出2-3倍,随着AI5和新版软件的升级,这一优势有望提高到10倍。 庞大的算力不仅装进了汽车,也在云端为xAI提供火力支持。 2024年底,马斯克主导在美国孟菲斯市极速建成了名为「Colossus」的超算数据中心,以惊人的122天完工部署了最初的10万块英伟达H100 GPU集群,随后又在3个月内将规模翻番至20万块。 英伟达CEO黄仁勋感叹这一速度「超乎常人」。 这座超级计算中心据报道是利用闲置工厂改造而成,比行业惯常耗时四年建造超算要快得多。 Colossus的算力立即用于训练Grok-4,并将在近期投入Grok-5的研发。 如此豪掷重金扩充基础设施,体现出xAI在算力投入上毫不逊色于任何一线大厂。 马斯克深知,在通用智能的竞赛中,「算力即真理」。 正如他解释的那样,根据规模定律推算,计算资源每增加10倍,模型智能水平大约能提升一倍——要让AI的「智商」从100提高到200,就需要10倍的算力支撑。 因此xAI不惜在算力上冲刺登顶,以确保在未来的AGI竞赛中握有王牌。 xAI正在打通与特斯拉产品的紧密集成。 马斯克近日在X平台宣布,「Grok很快将进入特斯拉汽车,下周最晚就会上线」。 据悉,xAI已于7月推出最新版旗舰模型Grok-4,并计划通过车机系统为新款Model S/X/3/Y以及Cybertruck车主提供车载AI助手服务。 所有2025年7月12日后交付的新车将预装Grok AI,同时老车型只要升级最新固件并订阅高级套餐也可使用这一功能。 特斯拉车主今后在车内就能与Grok语音对话,请它讲解路况、解答问题,甚至充当旅途中的娱乐伙伴。 特斯拉由此成为全球首批将强大聊天AI嵌入车辆的汽车品牌之一。 马斯克正把他在社交、汽车两大阵地的资源充分调动,让的产品渗透进生活的方方面面:从指尖的X应用,到车轮上的特斯拉,Grok无处不在。 这种跨领域整合的版图,也只有同时掌控社交网络和智能硬件的马斯克才能绘就。 AGI竞赛:xAI的定位与雄心 在马斯克的版图中,xAI被寄予厚望,要在群雄逐鹿的AGI竞赛中占据一席之地。 当前,OpenAI、Anthropic、谷歌DeepMind等公司在通用AI领域领跑,但马斯克直言他的新军xAI来势汹汹,「很快将超越除谷歌以外的所有公司,最终甚至会赶超谷歌」。 他之所以有此信心,正是基于前文提到的xAI在数据和算力上的快速崛起:Colossus超算中心夜以继日地扩大规模,让xAI在基础设施上实现了对OpenAI等的后发先至。 据业内统计,20万块H100 GPU的集群算力已达惊人的每秒近10亿亿次运算,使xAI在硬件投入上仅次于谷歌这种巨头。 而在模型研发迭代速度上,xAI团队不到一年时间连跳四级推出Grok-4,同期OpenAI的GPT-4尚未有重大升级、Anthropic的Claude也只是逐步扩展上下文窗口。 可以说,xAI正凭借「马斯克式」高强度投入和执行力急追猛赶。 除了硬件实力,xAI在理念上也与竞手有所差异。 马斯克对于OpenAI近年来趋于封闭和保守颇有微词,认为其聊天机器人过于「政治正确」而欠缺幽默和冒险精神。 因此xAI一出场就打出「不设禁忌,直求真相」的旗号。 Grok被赋予更少的预设限制,可以回答一些竞争对手拒绝回答的敏感问题(只要不违法有害),风格上更贴近自由嬉笑的互联网文化。 马斯克曾批评ChatGPT过于「清醒(woke)」且有偏见,而宣称Grok要做「不偏不倚、寻求真理」的。 这一定位吸引了不少因不满其他AI审查严格而投向Grok的用户,也引发了业界对AI伦理底线的新讨论。 然而,「更开放」也意味着潜在风险。 事实证明,Grok在快速成长过程中几次陷入争议旋涡。 例如今年7月,Grok在X平台的官方账号发布的内容被指含有反犹主义暗示,甚至自称「机械希特勒」,引发轩然大波。 反诽谤联盟(ADL)等组织向X平台投诉,相关贴文随后被删除,xAI被迫公开了Grok的系统提示词以平息质疑。 事件显示,在减少过滤与追求真实性之间,如何拿捏平衡是道难题。 马斯克坚持认为AGI的研发不应被过度「政治正确」束缚,但他也不得不直面现实:一旦AI产出令人不安的内容,社会舆论和监管压力随之而来。 为此,xAI一方面声称Grok-4已经是「最大程度追求真相」的AI,但另一方面也在尝试建立安全阀,包括及时调整模型的行为、增加对敏感话题的监控等。 马斯克将这种动态调整视为AI走向成熟的必经之路:在探索边界的同时,不让它真正「失控伤人」。 在开源与闭源之争方面,马斯克也亮明了态度。 他多次呼吁行业提高AI透明度,避免由少数公司垄断AI技术。 最近他宣布xAI开源了去年最强的Grok-2.5模型,并计划在大约半年后开放Grok-3。 这番表态无疑是向OpenAI等封闭路线「开火」:要知道,OpenAI自GPT-4起完全不开放模型细节,这正是马斯克当初离开OpenAI、创立xAI的重要原因之一。 xAI选择将旧版本模型权重释出,让开发者和研究者可以自由下载尝试,这在顶尖AI公司中相当少见。 不过值得注意的是,xAI采用的是定制的「社区许可协议」,附带一定反竞争条款,而非行业通行的MIT或Apache开源许可。 换言之,xAI式的「开源」更像是一种有限度的开放——既争取开源社区支持,又防止商业对手直接拿来牟利。 尽管如此,这一举动已被视为马斯克推动开放生态的信号。 他相信更多眼睛审视代码能提升AI安全,正如「Linus定律」所言:「足够多的眼球可以发现所有漏洞」。 马斯克曾公开表示,AI关乎人类未来,代码透明能够增强公众信任,因此他乐见xAI走出不同于竞品闭门开发的道路。 放眼全球竞争格局,马斯克也清醒地认识到美国之外的力量。 中国近年来在AI领域的快速追赶让他印象深刻:中国不仅有百度、商汤等公司奋起直追,更有充沛的电力供应和政府在2017年制定的2030赶超战略作为支撑。 这种宏大的全球视角,也体现于马斯克对AGI终极影响的思考上。 他认为AI并非人类智慧的对立面,而是「提升整个人类智能过程的重要组成部分」。 在人口增长推动人类总智力的时代已经结束的背景下(他一再强调西方社会面临生育率低迷、人口自我萎缩危机),AGI或许是保持文明进步的不二法门。 马斯克预计明年AI在某些领域将超越任何单个人类,到2030年AI的总体能力可能超越全人类。 这样惊世骇俗的预言背后,是他对技术加速发展的信念,也是对人类如何与之共存的思考。 马斯克一方面称AI是对人类「最大威胁」之一,呼吁审慎对待;但另一方面,他义无反顾地推进xAI的脚步,笃信通过「正直求真的AI」引领方向,可以避免最坏的结局。 在他眼中,如果AI革命无法被阻挡,那就让他来塑造一个对人类友好的AGI,正如他给xAI取名「理解(Grok)」所寓意的那样:唯有充分理解,方能真正掌控未来。 马斯克已经将赌注押上未来,而这一切才刚刚开始。 通往AGI的征途上,乱云飞渡,他自有他的星辰大海。
AI的“电荒”危机:CEO警告,满足电力需求是未来10-15年的挑战
IT之家 11 月 16 日消息,华尔街日报昨日(11 月 15 日)发布博文,报道称全球人工智能投资热潮正面临严峻的现实考验。尽管科技巨头投入创纪录的资金建设数据中心,但物理基础设施的瓶颈日益凸显,关键设备(如变压器)严重短缺,产能已预订至 2028 年,电力需求更是未来 10 到 15 年才能解决的难题。 IT之家援引博文介绍,科技公司和初创企业正以前所未有的速度投资人工智能,高盛分析师甚至称,用于建设新数据中心的资金“几乎是无限的”。 这种狂热直接转化为对 AI 超级计算机相关硬件的创纪录支出,涵盖了从芯片、服务器到暖通空调系统、变压器和发电厂的整个产业链。 数据中心能量需求 然而,这场看似无限的投资热潮,正开始撞上物理世界的坚硬壁垒。 关键设备交付成瓶颈 AI 基础设施的扩张速度,正受到关键设备交付能力的绝对限制。摩根大通指出,大量数据中心仍处于规划阶段,开发商们正在努力确保土地和获得许可,这被业内人士形容为一种“淘金热心态”。 更严峻的是,即使解决了土地问题,如何将这些数据中心接入电网和光纤,并找到合适的租户,依然是巨大挑战。许多跟风进入的投资者并未充分理解其中的风险。 供应链瓶颈是制约 AI 发展的核心障碍之一。以连接电网必需的变压器为例,高盛分析师指出,这种设备目前全球性短缺。 电力需求未来 10 到 15 年才能解决 美国最大的电力设备制造商之一 GE Vernova 的首席执行官 Scott Strazik 证实,公司到 2028 年的产能已几乎全部被预订。 美国数据中心建设现状(按建设或规划年份划分,单位:千兆瓦容量) 来自人工智能云产品和服务的收入 人工智能基础设施在其收入中所占的份额也越来越大 他强调,满足美国未来的电力需求并非未来五年的任务,而是一个需要 10 到 15 年才能解决的长期问题。这意味着,即使资金充裕,AI 基建的物理建设速度也无法随心所欲地加快。 投资回报面临考验 巨额投资最终需要市场买单,这构成了 AI 面临的另一重考验。摩根大通的一项财务模型预测,到 2030 年,全球 AI 基础设施的总投资将高达 5 万亿美元。 为了给投资者带来 10% 的合理年回报,AI 产品和服务必须每年额外创造 6500 亿美元的收入 —— 这一数字是苹果公司年收入的 1.5 倍以上。这相当于全球每一位 iPhone 用户每月为 AI 产品额外支付约 35 美元。 尽管分析师认为,广告和高附加值的企业级 AI 服务有望成为收入来源,但市场能否在短期内形成如此庞大的付费规模,目前仍是未知数。
媒体前瞻第六代骁龙8至尊版,可能会有Pro版本,对标苹果A20 Pro
高通将于2026年推出旗下首款2nm芯片——第6代骁龙8至尊版系列。而之所以叫做“系列”,是因为它将有两个型号,一个基础版和一个Pro,分别用来对标苹果的A20和A20 Pro。 据媒体WccFtech称,第六代骁龙8至尊版将会采用台积电更先进的N2P架构,而非N2(第一代2nm工艺)。 相比N2来说,N2P仅能带来5%的性能提升,但因为苹果订走了台积电超过50%的N2工艺用来生产A20系列芯片,给高通和联发科留下的并不多,所以高通只能选择N2P。但毕竟相比用N2的苹果产品,N2P能使高通产品有5%的性能提升,高通也乐于接受,因为他们在N3P上吃过亏。 A19 Pro的功耗是12.1W,第5代骁龙8至尊版是19.5W 高通的第5代骁龙8至尊版和苹果A19系列都采用了台积电N3P工艺,但骁龙的功耗确实是大。在之前的Geekbench 6测试中,第5代骁龙8至尊版比A19 Pro多消耗了61%的电量,才在多核基准分数上跑赢A19 Pro。 此前,另一家科技媒体AndroidHeadlines测试红魔11 Pro时,因为红魔手机采用不降频的策略,使得搭载第5代骁龙8至尊版的它在图形压力测试期间火力全开,机身温度一度干到了56℃。所以,虽然性能猛,但第5代骁龙8至尊版也因为功耗高、发热大而存在短板。 所以,在第6代骁龙8至尊版系列中,高通将改变原先的“2+6”架构,采用新的“2+3+3”架构,提高了性能核心的频率,同时又让另外3个核心用更低的频率工作,从而降低功耗。优化整体表现。 而在第6代的Pro版本上,它将支持LPDDR6内存与UFS 5.0闪存,拥有更高的核心频率、更多的GPU核心数,内存带宽也将提升,表现会更强大,但成本肯定会更高。猜测可能会用在与iPhone 18 Pro Max和折叠屏iPhone对标的超大杯安卓手机上。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。