行业分类:
加载中...
头条分类:
加载中...
AI走的是死路?专家剖析致命缺陷,不具备大规模应用前提
编辑:智子 乔杨 从软件工程和网络安全的角度来看,当前的AI落地前景如何?「可解释性」方面的研究,真的能让AI拜托「黑箱」属性吗? 2024年11月,莱斯特德蒙福特大学网络安全教授Eerke Boiten发表了一篇警示文章,题为「当前的AI是一条死胡同吗」。 在这篇文章中,Boiten教授从软件工程的角度出发,分析了当前AI技术在管理和控制方面的重大缺陷。 他表示,AI系统的本质问题在于它们无法与已有的软件工程实践有效结合,尤其是在复杂性管理和规模控制方面。尽管AI在诸如自动化、医疗、金融等领域取得了显著成就,但其核心问题在于无法确保系统在规模化应用中的可控性与可靠性。 AI的复杂性管理问题 Boiten指出,目前的AI系统与传统软件开发标准存在严重的不匹配。 软件工程的基本原则之一是,关键系统必须具备可管理性、透明性和问责制,而AI技术恰恰在这些方面存在缺陷。 例如,许多现代AI系统,尤其是基于深度学习的模型,在训练和应用过程中缺乏透明的决策过程,且很难追溯和解释其决策依据。 这种「黑箱」性质让AI系统在关键任务中的应用充满风险。尤其是在涉及人类生命健康、金融交易、网络安全等领域时,无法控制的系统可能带来灾难性的后果。 正因如此,Boiten认为,当前AI的不可管理性本质上让它无法在这些领域担任核心角色。 缺少可靠性 此外,Boiten还强调了AI系统在可靠性方面的不足。 虽然AI的表现常常令人惊叹,但其本身的可靠性依然远未达到理想的水平。在进行高风险决策时,尤其是在医疗、司法、金融等领域,AI的错误率仍然不可忽视。 例如,AI在图像识别中的误差率可能较低,但在医学诊断中,哪怕是极小的错误也可能带来致命后果。 AI的在可靠性上的缺陷不仅仅体现在其技术能力上,更体现在其系统架构的可管理性上。 由于缺乏有效的监管和透明的设计,AI系统往往难以在严格的工程标准下工作。在面对不断变化的现实情况时,AI的决策过程可能会出现不稳定和不可预测的情况,这就增加了在关键领域应用它们的风险。 「可解释AI」并非终极答案 为了应对AI的复杂性问题,业界提出了「可解释AI」的概念,试图使AI的决策过程更加透明和易于理解。 这种方法看似解决了长久以来被诟病的「黑箱」问题,但Boiten指出,这一解决方案并不能根除问题。 他认为,「可解释AI」并没有改变AI在复杂应用场景中的根本缺陷,它只是尝试解释现有模型的内部工作方式来减少不确定性。然而,这并不意味着AI能够在所有领域都能高效且可靠地运行。 因此,AI技术的进一步发展不能单纯依赖于「可解释性」,而应该更多地关注如何提升AI系统的可控性和安全性。对于AI的监管和标准化,目前还没有形成统一且有效的行业规范,而这一缺失将导致其在未来面临更大的挑战。 数据责任:难以跨越的障碍 除了「可解释性」和「可靠性」,Boiten还指出,AI技术面临的另一个巨大挑战是数据责任问题。 AI系统的决策质量,高度依赖于训练数据的质量,但目前很难有效保证数据的公正性、完整性和代表性。 由于数据存在偏差,AI模型可能会产生带有偏见的判断,这在一些敏感领域尤为严重,如司法审判、招聘决策等。 尽管业界推出了多种方案来减少数据偏见,但Boiten称,这些方案仅仅是隔靴搔痒,并未触及问题的根本。 随着AI技术的发展和应用场景的扩大,数据偏见和隐私问题将变得更加严重。如果得不到有效解决,我们将不可避免地面临伦理和法律风险。 未来展望:潜力与挑战并存 Boiten教授的警示并不是对AI技术的全盘否定,而是对其在关键应用中的风险进行了深刻反思。 他承认,AI在许多领域已经展现出了巨大的潜力,尤其是自动化和数据处理等方面。然而,更广泛的应用必须在更加严格的工程标准下进行。对于那些影响人类安全和生活质量的领域,AI的使用需要更加谨慎和透明。 文章的最后,Boiten回答了开头抛出的问题——AI的未来并非一条死路,但当前的技术瓶颈和管理难题确实需要引起足够的重视。 如果业界能在提升可控性、透明度和可靠性方面取得突破,AI将能在更广泛的领域内发挥其潜力。否则,上述这些挑战足以限制AI在关键领域的落地,甚至让我们走进「死胡同」。
揭秘非洲当下创投圈真相
AI将使非洲8亿青年实现弯道超车。 编译|董斌 在大多数人看来,提起非洲时总是与自然资源和基础设施挂钩,却鲜少有人将它与早期科技创业或数字经济联想在一起。然而随着移动互联网逐渐渗透、人口结构的持续年轻化以及越来越多国际与本地资金的注入,非洲的风险投资生态正悄悄发生改变。 非洲领先的早期风投基金之一“Launch Africa Ventures”基金管理合伙人Zach George(扎克·乔治)在近期访谈中回顾了第一期基金从最初期望的千万美元级别,迅速扩大到3000多万美元规模的历程,并阐明了其背后的逻辑:在非洲,传统发展金融机构的资金模式虽庞大,却缺乏深入灵活的早期支持,而“Launch Africa Ventures”则通过引入拥有行业专长和国际网络的合伙人及有限合伙人,为初创企业提供导师式陪伴。这种策略不仅让企业获得切实可行的运营经验,也令投资者的资源与被投公司的诉求形成了互补闭环。 在全球宏观环境经历估值回调的背景下,非洲的估值波动相对温和,非洲市场反映出更多的是一个稳中有升的局面。其中金融科技是非洲的投资热点,包括移动支付、保险科技和数字银行等多个领域,其增长潜力基于当地大量尚未被充分满足的金融需求。而物流、供应链以及与电子商务相关的“最后一公里配送”业务,也在庞大且年轻的人口结构和日渐成熟的移动基础设施下获得了新一波机会。扎克认为,非洲大陆正以令人意想不到的速度拥抱数字化,不少项目在获客与运营管理上面临挑战的同时,也伴随着更持久的客户留存与较高的用户忠诚度。 本次访谈并非一味向外界“喊话”或制造噱头,而是在冷静分析非洲创投的真实发展轨迹、企业面临的挑战,以及怎样透过精巧的资本安排为当地市场创造实在价值。非洲风险投资环境正在经历的重要变迁,或许正是下一个10年中不容忽视的经济新风口。 以下为访谈精彩内容: 1.我们通过让投资人也深度参与到创业公司中,形成了一个互相支持的闭环生态,而不仅仅是写支票给初创公司然后静待回报这么简单。 2.在过去10到15年里,印度、东南亚和拉丁美洲已经用事实证明,新兴市场同样能够诞生市值超过百亿美金的科技公司。 3.数字经济正在非洲形成风暴般的增长机遇。 4.非洲一直以来的估值相对比较“理性”,在全球热钱泛滥的时候也没有出现特别夸张的泡沫。 5.非洲创投生态目前进入了“优胜劣汰、适者生存”的阶段。 6.我们喜欢自信而不傲慢的创始人。 以下为采访全文,有删改: 1 投资者深入参与创业公司 主持人:今天非常高兴邀请到“Launch Africa Ventures(启动非洲风险投资)”基金管理合伙人扎克·乔治。3年前,他曾向我们分享如何在非洲推进早期风险投资,并且从华尔街转向非洲大陆创业生态的故事。如今全球的投资环境发生了巨大的变化,所以我再度请他来,为我们分享非洲风险投资生态系统的现状,以及他个人和团队又有哪些新的发现和发展。 扎克·乔治:谢谢你的邀请。回想3年前的访谈,正值我们推出“Launch Africa Ventures”第一期的初始阶段。那时,我们的目标是募集大约1000万~1500万美元,但结果超乎我的预期,募集了超过3600万美元,成为了当时非洲最大的早期基金之一。 不同的是,在非洲,传统的私募股权或风险基金往往依赖发展金融机构的资金,比如世界银行集团旗下的国际金融公司或非洲开发银行等。它们的资金规模巨大,但往往不太愿意在早期阶段给创业公司提供所需的“智力资本”“行业资源”或高度灵活的运营支持。于是我们决定采取另一种策略:以深度合作伙伴兼具专业知识及实际行业资源的投资者为主体,共同营造一个支持初创企业的生态系统。我们的投资者不仅出资,还能够投入他们的时间和经验,真正做到提供实质性指导。 主持人:可以想象,许多早期创业公司在非洲并不仅仅需要资金,他们更需要能打通人脉的资源、行业的专门指导以及在当地市场的深耕与分销经验。那么,“Launch Africa Ventures”在这一方面是如何构建自己的特色生态的呢? 扎克·乔治:我们的做法是除了基金本身的管理团队,我们还将有限合伙人(LP)的背景和他们所拥有的行业、技术以及全球网络也纳入其中,为初创企业形成一个更宽泛的支持系统。换言之,除了基金本身提供的投后管理或对接资源,我们的LP也能够为投资组合中的公司直接提供行业洞察、国际扩张渠道乃至顾问服务。 举几个例子。我们有一位美国东海岸资深金融从业者,他曾在大型资产管理公司T. Rowe Price任职多年,对资产管理、信用服务与财富管理业务有着深厚的经验。他对我们投资组合中从事金融科技、贷款、理财或储蓄业务的初创公司十分感兴趣,经常担任他们的顾问或导师,与他们一起做市场扩张策略、监管合规分析等等。 还有一位在欧洲负责DHL创新部门多年的LP,他对物流、供应链以及电商的末端配送等领域非常熟悉。他主动表示愿意给我们在“最后一公里物流”或“电商配送”领域的创业公司提供咨询。这对于需要拓展跨境物流或优化配送网络的初创公司来说帮助非常大。 此外还有来自不同地区的大型银行、零售商、保险公司高管,他们的资金在某种程度上并不是他们最大价值所在,反而是他们在本地市场的深层次链接和行业经验更为关键,后者能够切实帮助初创企业对接渠道或建立合规体系。 换句话说,我们通过让投资人也深度参与到创业公司中,形成了一个互相支持的闭环生态,而不仅仅是写支票给初创公司然后静待回报这么简单。 2 如果我是LP,为什么要投你? 主持人:我记得你在第一期基金所做的事情,不仅仅是提供资本,更是把建议和资源注入创业公司之中,这一点确实非常关键。那我们不妨再角色扮演一下:假设我现在是一个家庭办公室的负责人,或者某位高净值人士,对非洲正在发生的事情有兴趣,但又犹豫应该如何分配资金。我走进你办公室,请你向我推介“Launch Africa Ventures”,你会怎么说? 扎克·乔治:首先,我会问一句:“你有多少时间?”然后我会解释,为什么要把非洲视为全球多元化投资组合中的关键一环。在过去10到15年里,印度、东南亚和拉丁美洲已经用事实证明,新兴市场同样能够诞生市值超过百亿美金的科技公司。非洲在这方面落后印度10~12年,落后东南亚、拉丁美洲7~8年,但现在正在迅速赶上。 非洲长期以来给外界的印象更多与自然资源绑定,比如矿业、石油天然气、基础设施、公共事业等。如今,随着互联网和移动设备的迅猛普及,加之超过15亿人口的红利与愈发年轻化的人口结构,数字经济正在非洲形成风暴般的增长机遇。 非洲目前平均年龄仅约18岁,这意味着在15亿人口里,约有8亿是21岁以下的年轻人。他们对于健康、教育、娱乐、消费方式以及理财方式的了解几乎都是从数字化方面开始。 十几年前,在非洲使用1GB移动流量的平均价格可能要50美元以上,价格非常昂贵;如今,该成本已在大多数非洲国家降至2美元甚至更低。曾经在2010年时,整个非洲大陆的手机数量还远不及纽约一地的手机保有量;而现在非洲的手机总数已超过了整个北美(包括美国和加拿大)的总和。这带来前所未有的在线交易与数字服务需求。 此外,非洲人口增速高、消费潜能巨大且正日趋深度数字化,这为金融科技、电子商务、数字娱乐、教育科技、医疗科技等多个赛道提供了极佳的发展土壤。因此,在进行全球资产配置的时候,如果你想抓住下一波新兴市场的高增长潜力,又希望投资组合多元化,非洲早期科技板块是非常值得期待的。 主持人:那除了这些宏观的因素,你们基金本身有什么独特的机制或亮点,使得LP值得把资金投给你们? 扎克·乔治:我们有几个差异化之处。首先是重视深度赋能。不只是资金,我们强调引入拥有专业经验与行业资源的LP,借助他们的导师式参与,为早期公司提供切实可行的帮助。 还有共同投资机会。我们的LP除了向基金出资以外,还可以对我们投资组合中的公司进行直接投资,而且不收取额外的费用或业绩报酬。也就是说,如果你是我们的LP,你就可以在基金投了某家公司之后,以同样的估值上限或优惠条款继续追加投资,从而在后续轮次中获得更大比例的股份和更高的潜在收益。 我们在非洲大陆的主要孵化器、加速器乃至后续风险基金中都深度布局,能够帮助创业公司快速对接资源。同时,当企业做到一定阶段,我们也会帮助其与更大型、后期的基金甚至战略投资方连接,确保企业能得到后续融资。 我们的目标是让所有LP和被投企业都能获得“1加1大于2”的协同效应。对于真正想要参与非洲经济转型的个人或机构,加入我们的基金可以实现既满足社会影响力的增长又获取可观财务回报的双重目标。 3 在非洲,创投生态进入了优胜劣汰阶段 主持人:在之前的第一只基金(LAV One)中,你们当时投了多少家公司?其中有多少跨越了最初的估值或收入目标? 扎克·乔治:当时我们最初的目标是用约1000万~1500万美元投出30家左右的早期科技公司,但最终却投了3100万美元,覆盖了约133家创业公司。 从结果来看,我们投资的公司覆盖金融科技、物流、电商、保险科技、医疗健康等多个领域;很多公司的估值都远超我们初始预期。之所以能够产生这种爆发式的增长,一方面是因为这几年非洲整体创投环境在改善,另一方面是我们主动为企业嫁接了许多资源,包括市场拓展、行业经验、国际伙伴等等。许多以往缺乏的运营指导或行业通路,都在我们投后的服务体系中获得了补足。 主持人:你提到非洲创投格局的改善,这一点很重要。过去两年,全球科技股经历了估值调整。非洲市场在这一波调整中的表现如何? 扎克·乔治:大约18~24个月前,全球范围内发生了大规模的市场估值回调。从美国硅谷到欧洲、拉丁美洲和亚洲,许多明星初创公司估值腰斩。相比之下,非洲受到的影响较小。原因在于非洲一直以来的估值相对比较“理性”,在全球热钱泛滥的时候也没有出现特别夸张的泡沫。举个例子,如果一家做支付的创业公司在硅谷或印度,Pre-A轮或A轮就可能给到年化营收(ARR)的20倍甚至更高的估值;而在非洲,类似模式可能只在10倍左右。因此,当整体环境收紧时,非洲公司的估值跌幅相对更小,很多项目依然保持可观的融资进展。 不过,也确实存在资金更趋向于“头部化”的现象,有韧性、能够管理好现金流并体现明确增长潜力的公司获得了更多资源,而同质化程度高、烧钱模式严重的公司可能面临合并或倒闭。非洲创投生态目前进入“优胜劣汰、适者生存”阶段。 主持人:很多观众和初创企业家都会好奇,在非洲创业最具挑战或成本最高的部分是什么?你之前提到获客成本偏高,而且非洲的市场分割比较显著。你能否详细谈谈这一点? 扎克·乔治:与美国或欧洲大多数市场相比,非洲做B2C获客的挑战在于,你不能只依赖Facebook、谷歌、Instagram等线上广告,因为在一些国家和地区,这种线上投放可能覆盖不足,或者消费者信任度不高。传统媒体如电视、广播、报纸,甚至口口相传在许多非洲市场依然是很重要的获客渠道,因此营销成本并不低。 此外,在有些细分领域竞争也十分激烈。例如中小企业贷款在尼日利亚就有十多家初创公司,大家都想抓住中小微企业的需求,争夺同样的市场。这就需要创业公司在产品、风控、服务方式上有更多创新,而不是仅仅“价格战”或“砸广告”。 另一方面,由于许多非洲国家的消费者品牌忠诚度较高,一旦他们对某个产品或平台产生了较好的使用体验,就会保持较长的留存期。这与人们在文化上更看重可信赖关系也有一定关联。所以,虽然获客成本高,但如果能做出口碑,留存率和客户终身价值也会更可观。 主持人:那么,从投资人的角度来看,你们挑选公司时会特别注重哪些指标或信号?比如说对团队的判断标准是什么? 扎克·乔治:我们主要看以下几点。首先是创始团队的学习与执行能力。我们非常看重创始团队是否愿意倾听建议、积极迭代。对创业期公司而言,创始人的可培养度与配合度比商业模式本身更重要。如果一个团队非常顽固,不愿调整策略,或者拒绝外部建议,那么在种子轮或天使轮这样的早期阶段就会让我们相当顾虑。 同时,我们喜欢自信而不傲慢的创始人。他们有雄心壮志,但也尊重专业意见,懂得如何让投资人做教练而不是当船长。毕竟经营公司的是创始团队,投资人提供的是指导与资源。 我常常让创始人在一张餐巾纸上就能给我解释他们的商业模式、市场规模以及如何构建可持续的收入来源。如果需要用特别复杂的模型才能说服人,那往往说明他们对核心市场理解不够深入。 非洲市场独特之处在于,各国监管、语言、文化并不完全一致。如果公司只在南非或尼日利亚等单一市场经营,一开始可能够用,但要想快速增长,往往必须面向东非、西非、北非乃至出海做跨境业务。创始团队若能在早期就思考和规划多国扩张,会对我们是一个很大的加分。 此外,多数国际投资者习惯要求目标公司设置在对投资者友好的司法辖区,如美国特拉华州或英国、新加坡、荷兰等地,而在非洲当地设立运营子公司由母公司全资控股。许多创始人往往忽视了这一点,或者拖延至要签投资文件时才临时去搭建架构,导致流程延宕、风险增加。如果他们在和我们对话之前就已具备这样的合规架构,会让我们感到专业和放心。 4 非洲是否适配AI? 主持人:你们的第一期基金已取得很不错的成绩,接下来准备发行的第二期基金(或称LAV Two)会有什么不同吗?你们在投资策略或行业聚焦上会不会有所调整? 扎克·乔治:我们第二期基金的重点,仍然会以创业期为主,但也有可能会把部分资金投向可以横跨创业期与成长期的企业。 从行业上看,金融科技依旧是热点,尤其是数字支付、数字银行、保险科技这些与庞大人口基数和企业需求紧密结合的领域。此外,物流与供应链、零售科技、农业科技和医疗科技依然是重点关注赛道。 与此同时,我们也会更关注那些已经具备一定营收规模,例如每月经常性收入在2.5万到10万美元之间,并且对市场理解较深,对团队搭建与合规也有较完善做法的公司。我们的典型做法就是通过安全协议或可转换票据来投资,并在公司进入A轮时帮助他们对接后续更大规模的基金,然后我们在A轮或B轮时根据具体情况实现部分退出或二级交易,让我们的LP可以提前获得流动性。 主持人:在过去一年,AI技术的大爆发引发了全球关注。有人认为AI会在很多地方取代人力,也有人认为AI能帮助提升技能,尤其在教育和培训方面潜力巨大。对于非洲这样一个人口结构年轻,同时教育资源又相对匮乏的大陆,你怎么看AI会带来的机遇和挑战? 扎克·乔治:我承认,很多人会担心,“AI是不是会抢走非洲的工作岗位?”但实际上,我更倾向于相信AI可以以更快速度帮助人们获得教育与技能,而不需要昂贵的师资、校舍等传统投入。 举例来说,非洲很多年轻人接受正规高等教育的机会有限,但如果有AI驱动的在线教育平台,能以极低成本甚至免费为他们提供编程、机械、木工、电工等各种理论和实操指导,将极大促进职业技能升级。同时,电信运营商也可能提供类似“零流量费”的学习内容,或者银行、保险公司主动支持金融知识普及。这样一来,非洲年轻人掌握就业技能的速度将被大幅提高,甚至可能跳过很多传统教育阶段的限制。 对整个非洲大陆8亿青年而言,弯道超车式的技能获取将是AI给他们带来的最大红利。当然,前提是我们要解决基础的数字基础设施,比如确保网络覆盖、提高智能手机的可负担度等,这些在过去十年已经有了显著改善。 主持人:扎克,感谢你抽出时间来分享你的思考。最后一个问题是:除了二期基金(或三期基金)的募集,你对“Launch Africa Ventures”乃至非洲生态的长期规划是什么?你最想看到怎样的转变? 扎克·乔治:就我个人而言,我最大的愿景是能在非洲建立一整套多元化的资金价值链,而不仅仅是股权风险投资。有些企业并不适合风险投资,而更适合收入分成融资、夹层融资或债务融资。如果我们能够成立一家综合性的非洲资本平台,提供适配企业不同阶段和不同行业需求的资本与服务——从种子轮的股权,到扩张期的基于收入分成的融资,再到成熟阶段的债务或并购,这样我们就能为非洲企业提供更加完整的资金支持闭环。 非洲远不止于依靠自然资源的旧模式,数字经济的潜能巨大,人口与人才储备可观。我们希望用专业的资本与生态服务,让更多非洲青年能创办具有全球视野的公司,解决广泛的社会与商业痛点。等他们成长到一定规模,我们也会将接力棒交给更大型的私募、国际基金或进行并购整合,让他们在国际舞台上展示更大的影响力。 如果说10年前,大家还在讨论“非洲究竟能不能培育出真正的科技巨头?”那么今天,我们已在非洲见证了多个估值独角兽的出现,相信未来10年一定还会加速诞生更多。期望到时候,全世界对非洲创业与投资的看法都将大为改观——这就是我的初心,也是我会一直努力推动的方向。
物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代
我们都没预料到,AI 领域的 2025 年是这样开始的。 DeepSeek R1 真是太厉害了! 最近,「神秘的东方力量」DeepSeek 正在「硬控」硅谷。 我让 R1 详细解释勾股定理。这一切都是 AI 在不到 30 秒时间里一次性完成的,没出任何错。简单来说,its over. 在国内外 AI 圈,普通网友发现了神奇的强大新 AI(还开源),学界专家纷纷喊出「要奋起直追」,还有小道消息称海外的 AI 公司已经如临大敌。 就说这个本周刚发布的 DeepSeek R1,它没有任何监督训练的纯强化学习路线令人震撼,从去年 12 月 Deepseek-v3 基座发展到如今堪比 OpenAI o1 的思维链能力,似乎是很快达成的事。 但在 AI 社区热火朝天的读技术报告、对比实测之余,人们还是对 R1 有所怀疑:它除了能跑赢一堆 Benchmark 以外,真的能领先吗? 能自建模拟「物理规律」 你不信?来让大模型玩玩弹球? 最近几天,AI 社区的一些人开始沉迷一项测试 —— 测试不同的 AI 大模型(尤其是所谓的推理模型)来处理一类问题:「编写一个 Python 脚本,让一个黄色球在某个形状内弹跳。让该形状缓慢旋转,并确保球停留在形状内。」 一些模型在这项「旋转球形」基准测试中的表现优于其他模型。据 CoreView CTO Ivan Fioravanti 称,国内人工智能实验室 DeepSeek 的开源大模型 R1 完胜 OpenAI 的 o1 pro 模式,后者作为 OpenAI ChatGPT Pro 计划的一部分,每月收费 200 美元。 左边是 OpenAI o1,右边是 DeepSeek R1。如上所述,这里的 Prompt 是:「write a python script for a bouncing yellow ball within a square, make sure to handle collision detection properly. make the square slowly rotate. implement it in python. make sure ball stays within the square.」 根据另一位网友在 X 上的说法,Anthropic 的 Claude 3.5 Sonnet 和谷歌的 Gemini 1.5 Pro 模型对物理原理判断错误,导致球偏离了形状。也有用户报告称,谷歌最新的 Gemini 2.0 Flash Thinking Experimental,以及相对更旧的 OpenAI GPT-4o 都一次性通过了评估。 但这里面也是能分出高下的: 在这个推文底下的网友表示:o1 的能力原本很好,在 OpenAI 优化速度过后就变弱了,即使是每月 200 美元的会员版也一样。 模拟弹跳球是一个经典的编程挑战。精确的模拟结合了碰撞检测算法,其算法需要去识别两个物体(例如一个球和一个形状的侧面)何时发生碰撞。编写不当的算法会影响模拟的性能或导致明显的物理错误。 AI 初创公司 Nous Research 的研究员 N8 Programs 表示,他花了大约两个小时从头开始编写一个旋转七边形中的弹跳球。「必须跟踪多个坐标系,了解每个系统中的碰撞是如何进行的,并从头设计代码以使其具有鲁棒性。」 虽然弹跳球和旋转形状是对编程技能的合理测试,但对于大模型来说还是个新项目,即使是提示中的细微变化也可能产生出不同的结果。所以如果想让它最终成为 AI 大模型基准测试的一部分的话,还需要改进。 无论如何,经过这一波实测之后,我们对大模型之间的能力不同有了观感。 DeepSeek 是新的「硅谷神话」 DeepSeek 正让大洋彼岸陷入「恐慌」。 Meta 员工发帖称「Meta 工程师们正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」 而 AI 科技初创公司 Scale AI 创始人 Alexandr Wang 也公开表示,中国人工智能公司 DeepSeek 的 AI 大模型性能大致与美国最好的模型相当。 他还认为,过去十年来,美国可能一直在人工智能竞赛中领先于中国,但 DeepSeek 的 AI 大模型发布可能会「改变一切」。 X 博主 @8teAPi 则认为,DeepSeek 并不是一个「副业项目」,而是像洛克希德・马丁以前的「臭鼬工厂」。 所谓「臭鼬工厂」,就是当初洛克希德・马丁公司(Lockheed Martin)为了研发诸多先进飞行器专门成立的一个高度机密、相对独立的小团队,从事尖端或非常规的技术研究与开发。从 U-2 侦察机、SR-71 黑鸟,到 F-22 猛禽、F-35 闪电 II 战斗机都是从这里走出来的。 后来,这个词逐渐演变成一个通用术语,用来形容在大公司或组织内部设立的「小而精」、相对独立且自由度更高的创新团队。 他给出的理由有两个: 一方面是 DeepSeek 拥有大量的 GPU,据称有超过一万块,而 Scale AI 的 CEO Alexandr Wang 甚至表示可能达到 5 万块。 另一方面,DeepSeek 只从中国排名前三的大学招聘人才,这意味着 DeepSeek 与阿里巴巴和腾讯具有同等的竞争力。 仅凭这两个事实,就可以看出,显然 DeepSeek 在商业上取得了成功,并且已经足够知名,能够获得这些资源。 至于 DeepSeek 的开发成本,该博主表示,中国科技公司可以获得各种各样的补贴,比如低用电成本和用地。 因此,DeepSeek 非常有可能大部分成本都被「安置」在核心业务之外的某个账目上,或者以某种数据中心建设补贴的形式存在。甚至除了创始人之外,没人完全清楚所有财务安排。有些协议可能只是「口头协定」,只靠声誉就能敲定。 不管怎样,有几点是明确的: 这个模型非常出色,与 OpenAI 两个月前发布的版本相当,当然也有可能不如 OpenAI 和 Anthropic 尚未发布的新模型。 从目前来看,研究方向仍主要由美国公司主导,DeepSeek 模型属于对 o1 版本的「快速跟进」,但 DeepSeek 的研发进度非常迅猛,比预期更快地迎头赶上,他们并没有抄袭或作弊,最多只是逆向工程。 DeepSeek 主要是在培养自己的人才,而不是依赖美国培养的博士,这大大扩展了人才库。 与美国公司相比,DeepSeek 在知识产权许可、隐私、安全、政治等方面受到的约束较少,围绕错误地使用那些不想被训练的数据的担忧也较少。诉讼更少,律师更少,也更少顾虑。 毫无疑问,越来越多的人认为 2025 年将会是决定性的一年。与此同时各家公司都在摩拳擦掌,比如 Meta 就正在建立一个 2GW+ 的数据中心,预计在 2025 年投资 600-650 亿美元,年底拥有超过 130 万块 GPU。 Meta 甚至用一张图表展示了 2 千兆瓦数据中心与纽约曼哈顿的对比。 但现在 DeepSeek 用更低的成本,更少的 GPU 做到了更好,怎能不让人焦虑? Yann LeCun:要感谢开源 Hyperbolic 的 CTO、联合创始人 Yuchen Jin 发帖表示,在仅 4 天时间里,DeepSeek-R1 向我们证明了 4 个事实: 开源 AI 仅落后于闭源 AI 不到 6 个月 中国正在主导开源 AI 竞赛 我们正进入大语言模型强化学习的黄金时代 蒸馏模型非常强大,我们将在手机上运行高智能 AI 由 DeepSeek 引发的连锁反应仍在继续,比如 OpenAI o3-mini 免费可用、社区中希望能减少关于 AGI/ASI 的模糊讨论以及传闻 Meta 陷入恐慌等。 他认为,现在很难预测最终谁会获胜,但不要忘记后发优势的力量,毕竟我们都知道是 Google 发明了 Transformer,而 OpenAI 解锁了其真正潜力。 此外,图灵奖得主、Meta 首席人工智能科学家 Yann LeCun 也表达了自己的看法。 「对于那些看到 DeepSeek 的性能就认为『中国正在超越美国的 AI』的人,你理解错了。正确的理解是:开源模型正在超越专有模型。」 LeCun 表示,DeepSeek 之所以这次一鸣惊人,是因为他们从开放研究和开源(如 Meta 的 PyTorch 和 Llama)中获益。DeepSeek 提出了新想法,并在他人工作的基础上构建。因为他们的工作是公开发布和开源的,每个人都可以从中受益,这就是开放研究和开源的力量。 网友们的反思还在继续,在对于新技术发展兴奋的同时,也能感受到一点点忧虑的气氛,毕竟 DeepSeek 们的出现,可能会带来真金白银的影响。 参考内容: https://x.com/ivanfioravanti/status/1881969391547683031 https://x.com/Aadhithya_D2003/status/1882105009548222953 https://x.com/8teAPi/status/1882836551866204656 https://x.com/Yuchenj_UW/status/1882840436974428362 https://x.com/ylecun/status/1882943244679709130 https://venturebeat.com/ai/tech-leaders-respond-to-the-rapid-rise-of-deepseek/
上手智谱GLM-PC :帮你抢春运票、发微信,还不用付200美元,有它还要啥OpenAI的Operator
作者|Yoky 开年OpenAI放出了第一个王炸:Operator,定睛一看,这不是早就上线的智谱智能体 AutoGLM 和 GLM-PC 么? 早在今年10月25日,智谱便上线了移动端和Web端插件形式的AutoGLM,它只需接收简单的文字/语音指令,它就可以模拟人类操作手机和浏览器。11月29日,智谱上线了更大权限的,基于PC的自主Agent:GLM-PC,并于2025年1月23日,更新了1.1版本,并全面公测。 从效果上看,OpenAI展示的一些Operator的应用场景,AutoGLM也完全能搞定,以浏览器插件的形式增强了产品灵活性的同时进一步降低了门槛,更重要的是,完全免费,立省200美元! 比如,AutoGLM能够自主的在YouTube里给Operator写上一句“商业互吹”,或者去X里给Operator点赞。 自动播放 亦或是在OpenTable上预订好餐厅的多任务分步处理,AutoGLM都能够做到丝滑完成。 自动播放 升级后的GLM-PC与基于Web端的Agent有着更大的权限以此拓宽能力边界,比如GLM-PC不仅能够预订餐厅,更能在系统中book日历提醒,来保证准时赴约。 硅星人全面测评了最新版本的GLM-PC,接管整个电脑的权限后,它不仅能发微信、整理文件,还可以通过手机远程遥控GLM-PC进行协作,甚至还在这个一票难求的春运时间,不间断操作帮我抢到了回家的火车票... 1 懂事的PC,已经学会自己抢车票、买年货了 当GLM-PC能够控制电脑后,会发生什么? GLM-PC分为两种模式:极速模式和深度思考模式,其中极速模式并不支持附件上传和多轮对话,也就是端到端的text to action,通过手机远程遥控也仅支持极速模式;而深度思考模式则会展现思考链路和逻辑,输入和输出内容更加丰富,可执行的指令也更加复杂。 在GLM-PC提供的案例中,有“群发助手”的引导,对话框中是一段预设的prompt,本以为要测试的我,忘记了自己的微信中真的有一个名为「相亲相爱一家人」的群。于是GLM-PC开始自动操作准备给每一位群友发上一段祝福,哪怕被我紧急拦截,也已经群发了10个人。 一开始,我们用它来执行了一些相对简单的任务,比如用它来查找关于OpenAI的最新新闻,阅读了相关文章后帮我简单整理一下基本信息传回,同时基于智谱清言的语言理解能力,对新闻事件进行了分析。 自动播放 自动播放 接着难度逐渐升级,我让GLM-PC在小红书上找到推荐的北京粤菜馆,GLM-PC在小红书中搜索了关于北京粤菜馆的帖子进行分析,它竟然还聪明地知道阅读评论,在评论中找到几家推荐比较多的餐厅,然后跳转到大众点评中查了评分,最后将4.5分以上的餐厅整理进名单,回传给我。 还真别说,最终筛选出来的几家粤菜馆,味道真的不错也避雷了网红餐厅。 自动播放 要过年了,AI能不能替我挑选点年货,加到淘宝的购物车里? 在这个过程中,展示了GLM的多层分析能力,毕竟年货不是某一种具体的商品,在我向它提出这个需求时,它先是思考,送给父母年货包括五谷杂粮、保健品、家电,虽然不一定完全符合父母的心意,但对类别的判定相对准确。 紧接着它在淘宝中分类搜索了具体的商品,而不是直接搜索“年货”两个字,当然,过程中出现了一些bug,当它搜索谷子的时候,跳出来是二次元文化的吧唧,不够时髦的GLM-PC一时间没能理解这并不是目标商品,仍然将它加进了购物车。 自动播放 GLM-PC还化身为了抢票神器,还没抢到回家车票的我,让GLM-PC帮我买最早一班的车票,它不仅查了几天的车票情况,还慷慨的帮我点选了商务座,结果成功买到一张26日的一等座。 自动播放 不过在我们的测试中,也发现了涉及到账号登录、扫码登录的页面,GLM-PC没办法自主操作,也不会停下来,而是不停地重复该页面。 与Operator一样,GLM-PC也做了敏感性测试,让用户在敏感时刻,比如确认提交信息、确认支付等页面接盘操作。 同时,在GLM-PC操作电脑页面时,会由GLM-PC主导鼠标,人为干预后仍然继续GLM的流程,只能按下暂停键或结束键才能完全交予人类接管。 1 GLM-PC怎么做到的? 在技术路线上,GLM-PC与Operator采用的是同一种技术方案:基于多模态大模型的视觉识别与空间进行交互。 据OpenAI介绍,Operator基于最新研发的Computer-Using Agent (CUA) 模型,通过观察屏幕并使用虚拟鼠标和键盘来完成任务,而无需依赖专门的API接口。 早在2023年12月,智谱便发布了CogAgent,是其第一个基于视觉语言模型(Visual Language Model, VLM)的开源 图形界面智能体 GUI Agent 模型。GLM-PC即是基于该模型的初代产品。据开发文档中介绍,通过多模态感知实现全 GUI 空间交互。这些 GUI Agent,类似人类,能以视觉形式感知界面元素与布局,模拟人类进行点击、键盘输入等元操作,极大拓展了 Agent 在虚拟交互空间的应用边界。 在GLM-PC 1.1版本中,使用更强大的视觉语言模型GLM-4V-9B作为基座模型,用来提升模型的基座图像理解性能。 与Operator相同的是,基于LLM模型提出Prompt,同时输入的模态(图像感知)、输出的操作空间(点击、滚动、键盘输入)的交互方式一致,同时思考了Agent和人类的使用权交接情况,对于敏感时刻的判断等等。 且在介绍中,Operator令Sam Altman颇为骄傲的是它的自我进化和自我反思能力,即Operator可通过不断操作和学习掌握人类的习惯,不断拓宽自身的能力边界。 GLM-PC也基于智谱自研的「基础智能体解耦合中间界面」和「自进化在线课程强化学习框架」,其中包括了一种核心技术WebRL,对于大模型智能体任务规划、训练任务和数据稀缺、反馈信号稀少和多任务策略分布等问题进行了有意识的对抗,加之自适应学习策略,能够在迭代过程中不断改进,持续稳定提高自身性能,并在执行过程中获取更多新技能。 不同的是,目前Operator现阶段仅针对Web端,并且与ChatGPT绑定付费,而GLM-PC是独立的App,可针对电脑进行操作(包括浏览器和电脑本地),同时手机可远程遥控操作电脑,并且完全免费。 从Operator的日志上看,Operator一次仅能执行单步的线性预测,和步骤执行,而GLM-PC具备多层级规划预测能力,并将CogAgent 多模态GUI Agent模型与 CodeGeex代码生成模型相结合,可实现复杂严谨的逻辑控制。 但GLM-PC也对于硬件端的算力储备有一定的限制,仅支持M系列的Mac电脑以及Windows10以上的系统。我们在M1芯片的MacBook Air上进行测试,整个过程中并未出现卡顿情况。 总的来看,GLM-PC更适合国内的互联网环境,移动端和PC端联动也更符合日常的使用习惯。据硅星人了解,GLM-PC也将根据用户的反馈持续迭代交互体验,真正解放了打工人的双手!
免费体验:微软Copilot开放“深度思考”,你的专属AI策略顾问
IT之家 1 月 25 日消息,科技媒体 Windows Latest 昨日(1 月 24 日)发布博文,报道称微软正开始邀请 Copilot 用户,免费体验“深度思考”(Think Deeper),会花费更多时间分析问题,并逐步剖析推理生成更详细、更符合用户需求的答案。 IT之家注:“深度思考”基于 OpenAI 的 o1 模型,此前仅在微软的 Copilot 实验室中提供,为 Copilot Pro 订阅用户专享,可以分析用户的提示词,并详细罗列解答步骤,让推理过程更加清晰。 与 OpenAI 的 o1 类似,“深度思考”无法访问网络实时信息,其知识库目前仅更新至 2023 年 10 月,也不会显示信息来源。 “深度思考”功能目前仅对部分免费 Copilot 用户开放,且存在使用次数限制。免费用户每周大约只能使用三次,而付费用户的限制则取决于同时使用该功能的 Copilot Pro 用户数量,每周大约接近 50 次。 如果同时使用“深度思考”的用户过多时,该功能图标会变为半透明,表明该功能消耗大量资源,这也是微软即使对 Pro 用户也无法提供更多使用次数的原因。 Windows Latest 的测试表明,“深度思考”在处理诸如数学和科学问题、编码挑战、场景规划和创意生成等需要深度推理和分析的任务时表现出色。 例如,在制定健身计划的测试中,“深度思考”不仅能够根据用户的提示提供训练计划,还能根据用户的目标(如肌肉肥大)提供蛋白质摄入量、训练动作细节、营养建议等更全面的指导,而常规 Copilot 则需要多次交互才能达到类似效果。
DeepSeek持续震撼硅谷:创始人采访被“拿放大镜”看
“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪—— 刚刚,DeepSeek-R1跻身大模型竞技榜前三。 以开源、便宜20倍的“身价”与ChatGPT-4o(2024.11.20)并列。 在复杂提示词/风格控制榜单上,R1位列第一。 目前结果来看,它在各个维度上都保持领先。 在衡量模型编程开发能力的WebDev分榜上,R1位列第二,与闭源的Claude 3.5 Sonnet相差不到40分。 网友实测体验表示,确实如此,R1在30场battle中只输了4、5次。 另一边,硅谷对DeepSeek的好奇不减。 毕竟,它可是一个“副业”。 创始人梁文峰的中文采访更是被翻译成英文,“拿着放大镜”逐字认真阅读。 他提出的观点也被总结成箴言,在互联网上流传。 真正的差距不是1年或2年,而在于是原创还是模仿。 图灵奖得主LeCun也为DeepSeek做出中肯评价: 它代表了开源的力量。 这意味着,开源模型正在超越专有模型。 值得一提的是,同为开源领域代表的Meta刚刚公布了2025年在AI领域的布局计划:650亿美元,投算力、投人才。 有爆料称,Meta内部已经因为DeepSeek感到恐慌。 “他们让OpenAI一次又一次看清自己” 所以,在硅谷视角里,他们更关心DeepSeek的哪些信息? 最首要的莫过于,DeepSeek如何赚钱。 挖到的信息有点出乎意料,或许DeepSeek还没想赚钱的事。 控股DeepSeek的是幻方量化,他们有一批顶级科学家,有充裕的算力资源,DeepSeek其实是一个“副产物”。 在2023年末我就听说他们在做DeepSeek。即使在当时的中国,还没有人把他们当回事。 其次,为何DeepSeek能成功。梁文峰在2023年5月2024年7月接受暗涌的两次采访,也被老外扒出来了。 他们最关心的五个方面分别是: 1、创新第一性原则:与其他致力于快速商业化的中国AI公司不同,DeepSeek专注于基础的AGI研究和创新。他们认为,中国必须从全球人工智能发展的“搭便车者”转变为“贡献者”。梁文峰说,创新不完全是商业驱动的,还需要好奇心和创造欲。 2、革命性架构:DeepSeek V2中采用的新型MLA(多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,实现了成本大幅降低。它的推理成本仅为Llama 370B的1/7、GPT-4 Turbo的1/70。 这并不是为了挑起一场价格战——他们只是在“成本上稍微有点利润”来定价。这种创新架构继续应用于V3和R1模型中。 3、独特的公司文化和人才战略:DeepSeek保持着一个完全自下而上的组织结构,为研究人员提供无线的计算资源,优先看创造热情而不是证书。他们的突破性创新来自年轻的本土人才——中国本土的应届毕业生和年轻技术人才,而非海外招聘。 4、致力于开源:尽管行业开始趋向于闭源模型(OpenAI和Mistral),DeepSeek仍致力于开源,并认为开源对于建立一个强大的技术生态系统至关重要。梁文峰认为,在颠覆性技术面前,闭源形成的护城河是短暂的。 他们的真正价值在于建立一个具备创新能力的组织。 5、底层计算挑战:尽管拥有足够的资金和技术,DeepSeek也面临来自底层计算的挑战和压力。目前公司还没有新的融资计划。梁文峰认为,面临的主要制约因素不是资金,而是高端算力的使用权,这些芯片对于训练先进AI模型至关重要。 除此之外,采访中的诸多细节也被网友认真品味。 原文中,梁文峰被问道:怎么看待做量化同时做大量基础研发,不烧钱吗? 他回答:一件激动人心的事,或许不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。 海外网友感慨: 这帮人是一群有点理想化的“技术狂”,他们坚信自己能搞出通用人工智能(AGI),而且他们确实有这个资源和天赋。我真是太喜欢他们了! 此外也避免不了一些对比: 梁文峰展现出一种完全不同的心态,他们的成功当之无愧,我也很期待看到他们一次又一次让“OpenAI”认清自己。 当然放眼AI领域的整体发展,能够看到DeepSeek,对于所有人而言或许都是兴奋的。 尽管我忍不住觉得他们有点天真,毕竟在商业化上他们有点“自断后路”。但看到一个团队坚持理想并取得成功,确实让人觉得很欣慰。 随着R1的惊艳亮相,DeepSeek正在兑现自己所说的一切。拓宽技术边界、坚持开源、专注于技术开发…… 那么,DeepSeek是如何走到现在的呢? 用AI做量化,再回到AI 梁文峰本硕均就读于浙江大学信息与电子工程学专业。 2008年,梁文峰毕业,开始带领团队使用机器学习等技术探索全自动量化交易。 当时量化在国内还是个新鲜概念,能否赚钱是个未知数。2010年沪深300股指期货推出,量化投资迎来春天。据公开信息显示,梁文峰团队正是乘上这股东风,很快自营资金超过5亿元。 与此同时,深度学习浪潮的齿轮开始转动,人工智能率先在硅谷爆发。 2015年,梁文峰与校友共同创立幻方量化。仅仅1年后,他们就推出了旗下第一个AI模型,第一份由深度学习生成的交易仓位上线执行,使用GPU进行计算。 2017年,幻方量化宣称实现投资策略全面AI化。 2018年,幻方量化确立AI为公司的主要发展方向。 AI加持下,幻方量化旗下基金回报率远超同期沪深300指数。2019年,资金管理规模突破百亿元。 2019年,梁文锋在当年的金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,这是他少见的公开演讲。 演讲全文的确充满“程序员视角”: 量化公司是没有基金经理的,基金经理就是一堆服务器。人来做投资决策的时候,它是一种艺术,要凭感觉。程序来决策的时候,它是一种科学,它有最优解。 也是这一年,幻方量化开始大规模布局AI算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成。这样的算力基建,成为如今DeepSeek快速奔跑的底层支撑。 2021年,幻方量化成为国内首家突破千亿规模的的量化私募大厂,被称为国内量化私募“四大天王”之一。 值得一提的是,在幻方量化的官网上,AI基础科学研究始终占据重要位置,包括在大模型浪潮前。 幻方量化曾表示,多年以来,该公司坚持把营收的大部分投入人工智能领域,建设领先的AI硬件基础设施,进行大规模的研究,探索人类未知的奥秘。 我们相信几乎所有的创新都是从大胆尝试和点滴积累中孕育而来。 2023年,幻方量化将下场做大模型的独立新组织命名为深度求索,并强调将专注于做真正人类级别的人工智能。 目标不是复刻ChatGPT,而是研究和揭秘AGI的更多未知信息。 DeepSeek的故事也就开始于这一刻。 一个80后程序员在搅动中国量化市场后,完成资金积累,组建起年轻蓬勃的团队,似乎又回到了他原本的起点、回到AI,但产生的能量正在全球掀起骇浪。 One More Thing 值得一提的是,幻方量化还长期向慈善机构捐赠,官网披露公司员工“一只平凡的小猪”个人捐助 1.38 亿元,支持 15 家慈善机构的 23 个公益项目,在全国范围内帮助弱势群体,促进社会的公平和发展。 爆料消息称,这个员工就是梁文峰本人。 参考链接: [1]https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/ [2]https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA [3]https://finance.eastmoney.com/a/202501223304127161.html [4]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg — 完 —
微软等开源AIOpsLab,可构建自主云AI Agent
微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了,一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务,实现故障的自动化检测、定位和解决问题。还具备高度的可观测性,能够收集和分析关键的遥测数据,确保对系统状态和应用环境的深入洞察。 同时支持人类、数字和AI Agents的不同类型的协作模式,并通过模块化设计易于扩展新应用程序、工作负载和故障场景。 开源地址:https://github.com/microsoft/AIOpsLab/?tab=readme-ov-file AIOpsLab的架构一共包含五个关键部分,协调器、服务、工作负载生成器、故障生成器以及可观测性。 协调器的主要任务是与智能体建立会话,共享有关基准测试问题的信息,包括问题描述、响应格式指南以及智能体可以调用的API。这些API是一组文档化的工具,例如获取日志、获取指标和执行shell命令,它们被设计来帮助智能体解决任务。 协调器对智能体的实现没有任何限制,提出问题并轮询智能体以获取基于先前结果要执行的下一个动作。每个动作都必须是有效的API调用,协调器会验证并执行这些调用。 此外,协调器拥有对部署的特权访问权,可以代表智能体采取任意行动,例如扩展、重新部署等,以解决智能体面临的问题。最后,协调器还负责调用工作负载和故障生成器,以创建服务中断,这些中断作为实时基准测试问题,为智能体提供了实际操作的环境。 服务模块可以帮助AIOpsLab适应不同的真实云服务环境,包括微服务、无服务器和单体服务等。AIOpsLab还利用开源应用套件DeathStarBench提供了源代码、提交历史和运行时遥测,使得研究人员能够在一个受控的环境中复现和研究生产事件。通过添加Blueprint这样的工具,AIOpsLab可以扩展到其他学术和生产服务,并无缝部署这些服务的新变体。 工作负载生成器在AIOpsLab中扮演着重要角色,主要负责创建正常和故障场景的模拟,以测试代理在不同条件下的性能。工作负载生成器根据协调器的规范接收任务,例如任务、期望效果、规模和持续时间,并利用基于真实生产痕迹训练的模型生成符合这些规范的工作负载。 在故障场景中,工作负载生成器可以模拟资源耗尽、利用边缘情况或触发级联故障等条件,这些都是受到真实事件启发的。正常场景则模仿典型的生产模式,例如,日常活动周期和多用户交互。 当不同的特征例如,服务调用、用户分布、到达时间可能导致期望效果时,多个工作负载可以存储在问题缓存中供协调器使用。 故障生成器是AIOpsLab的一个创新功能,主要用于跨各种通用云场景。包括细粒度的故障注入,能够模拟由生产事件启发的复杂故障全流程展示。故障注入器还可以在不同系统级别注入故障,暴露根本原因,同时保持语义完整性,并考虑云微服务之间的相互依赖性,使用户能够对AIOps能力进行全面的测试和评估。 可观测性则可以提升AIOpsLab的全面监控能力,包括Jaeger的追踪、Filebeat和Logstash格式化记录的应用日志,以及Prometheus监控的系统指标。AIOpsLab还捕获了较低级别的系统信息,如系统调用日志和集群信息。为了处理潜在的数据过载问题,AIOpsLab通过API允许用户选择他们需要的特定信息,确保量身定制和全面的可观测性。
人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者
编辑:KingHZ 【新智元导读】AI模型可能并没有想象中强大。在最新的AI基准测试「人类最后一次考试」中,所有顶尖LLM通过率不超过10%,而且模型都表现得过度自信。 捍卫「人类智慧」最后一战! 刚刚,Scale AI和Center for AI Safety(CAIS)公布了「人类最后一场考试」结果! 新基准全称「人类最后一次考试」(Humanity’s Last Exam),简称「HLM」,包含3000个问题,由数百位领域专家开发,用于追寻人类知识推理的边界。 目前,最好的模型,准确率也小于10%,而且自信「过头」。 具体结果如下: Scale AI和CAIS同时公布了相关论文、数据集和测试代码。 项目链接:https://lastexam.ai/ 网友对这项工作也不吝赞赏: 「人类最后一次考试」 为了评估AI的能力的进展,已发布了多个数据集,针对语言模型,根据「Paper with code」网站统计,就有165个相关数据集。 然而,目前的基准测试难度并未跟上进步的步伐:LLM在一些热门基准测试(如MMLU)上已能达到90%以上的准确率,这限制了对最新LLM能力的有效评估。 甚至有基准被爆出,可能存在给某些模型「漏题」的问题。 为此,Scale AI和CAIS推出了名为「人类最后的考试」(Humanity's Last Exam)的多模态基准测试,旨在成为这类封闭式学术基准测试的最终版本,覆盖广泛的学科领域。 测评一览 「人类最后一次考试」(HLE)包含两种问题格式: 精确匹配题(Exact-Match Questions):模型需要输出一个完全匹配的字符串作为答案。 选择题(Multiple-Choice Questions):模型需要从五个或更多选项中选择一个正确答案。 此外,HLE是一个多模态基准测试,其中10%的问题要求理解文本和图像参考,80%的问题为精确匹配题,其余为选择题。 该数据集包含3000道难度较高的问题,涉及100多个学科。 各学科分类,大体如下: 图3:HLE高级类别分组。 大部分问题已公开发布,同时保留了一部分私有测试集,用于评估模型是否存在过拟合现象。 在项目网站上,公布了不同领域/科目的8个样题,包含化学、物理、数学、计算机科学、语言学等。 比如,其中的一道常识性问题: 希腊神话中,伊阿宋的曾祖父是谁? 具体样题,参考下列图片。 创建流程 为了吸引高质量的问题提交,HLE设立了总额50万美元的奖金池,并提供以下奖励: 顶级问题奖励:每道排名前50的问题将获得5,000美元奖金。 优质问题奖励:接下来的500道问题,每道将获得500美元奖金。 此外,任何被HLE接受的问题提交者,都有机会成为相关论文的共同作者,激励了众多高水平的专家参与,特别是那些拥有高级学位或在相关技术领域拥有丰富经验的专业人士。 总体而言,总收集了超过70,000个试验性问题,其中13,000个问题被选出来供人类专家评审,进而最终确定在公开考试中发布的3,000个问题。 近1000名专家成功提交了问题。 他们来自50个国家的500多个机构,其中大多数贡献者是活跃的研究员或教授。 问题涵盖了多种格式,包括纯文本和多模态难题,整合了图像和图表。 为了确保问题的高质量和难度,HLE的数据集通过以下流程创建: 问题筛选:首先接收问题提交,这些问题专门前沿的LLM设计,LLM通常难以正确回答。 迭代优化:在专家同行评审的帮助下,反复修改和优化提交的问题,提升问题的复杂性和准确性。 手动审核:由组织者或由组织者培训的专家,手动审核每道问题,确保问题符合测试要求。 保留私有数据集:除了公开数据集,还保留了一部分私有测试集,用于评估模型在公开基准测试上的过拟合和可能的作弊行为。 HLE的数据集创建流程 具体结果 研究者共测评了7个模型,包括GPT-40、Grok 2、Claude 3.5 Sonnect、Gemini 1.5 Pro、Gemini 2.0 Flash Thinking、o1和DeepSeek-R1。 表1显示,所有前沿模型在HLE中的准确率都很低,所有模型的校准表现都很差,反映在较高的RMS校准误差分数中。 表1:不同模型在HLE上的准确率和RMS校准误差。 具有推理能力的模型,通常需要显著更多的推理时间和计算资源。 为了更清晰地了解这一点,对各模型生成的补全(completion)token数量进行了分析。 正如图5所示,推理模型Gemini 2.0 Flash Thinking、o1和DeepSeek-R1为了提升性能,需要生成的token数量远远超过非推理模型GPT-40、Grok 2、Claude 3.5 Sonnect以及Gemini 1.5 Pro(见图5)。 图5:不同模型的平均补全(completion)token数量 展望未来 在「人类最后一次考试」(Humanity's Last Exam,简称 HLE)中,目前的LLM表现仍然非常差。 但从发展历史来看,基准测试的饱和速度非常快——模型往往在短短的时间内,从接近0的准确率跃升至接近100%的表现。 鉴于AI发展的快速步伐,在2025年底前,模型有可能在HLE上超过50%的准确率。 AI实验室有新榜单可刷了,跃跃欲试 如果模型在HLE中获得高分,将表明模型在封闭式、可验证的问题以及前沿科学知识方面的专家级表现,但这并不意味着模型具备自主研究能力或「通用人工智能」(AGI)。 HLE测试的是结构化的学术问题,而非开放式研究或创造性问题解决能力,因此它更侧重于技术知识和推理能力的衡量。 作者在论文表示:「虽然HLE是给予模型的最后一场学术考试,但它远非AI评估的最后一个基准。」 参考资料: https://x.com/DanHendrycks/status/1882433928407241155 https://x.com/alexandr_wang/status/1882481229708358027 https://scale.com/blog/humanitys-last-exam-results https://lastexam.ai/ https://static.scale.com/uploads/654197dc94d34f66c0f5184e/Publication%20Ready%20Humanity's%20Last%20Exam.pdf
AI霸屏的第二年,硅谷大佬们都Pick哪些AI产品?
全网最“主观”的 AI 产品榜单。 出品 | 白鲸出海编辑部 作者 | 张凯然 编辑 | 殷观晓 前些日子,全球顶级 VC a16z 发布了一份相当有趣的 AI 产品榜单,本次榜单并不是按照网站流量或收入等硬性指标来收录产品的,而是邀请了 24 位 AI 行业的从业者,每人选择本年度自己最喜欢的 3 款 AI 产品,并给出了评价。 这 24 位“大佬”中,投资人代表有 a16z 联合创始人 Marc Andreessen、Y Combinator 现任 CEO 陈嘉瑞(Garry Tan)等;从业者代表有 Perplexity CEO Aravind Srinivas、Meta 产品设计总监 Danny Trinh、Adobe 首席战略官 Scott Belsky 等,除此之外,社媒上相当活跃的 a16z 合伙人们,比如 Olivia Moore、Justin Moore 等也参与其中。 虽然,部分评委会出现给自家产品 “投亲情票”的情况存在,入选的产品也会偏向各赛道中的生产力工具。但就笔者自己的观感而言,这次评选还是有些客观、理性在的。 Perplexity“Pick 率”超25%, 一、“AI 工具”是最受欢迎的产品类型 这些“大佬”们的投票,一共提及了 45 款产品(如上图),从这些产品中我们可以看到一些总体的总体趋势: 1、AI 搜索产品 Perplexity 是被提及最多的产品,24 人中有 6 人选择了这款产品,Pick 比例为 25%。2024 年初 Perplexity 的访问量只有千万左右,但是到 11 月访问量就超过了 1 亿(12 月略有下降,为 9000 万左右)。去年 12 月,Perplexity 引入了广告作为新的商业化路径,其 CEO 表示,截止 2025 年底,将把商业化收入提升至 1.27 亿美元,毛利率从 30% 提升到 75%。Perplexity 已经在 2024 年内完成多轮融资,估值飙升至 90 亿美元。Perplexity 作为今年讨论度非常高的 AI 产品,被选择最多也实至名归。 2、被选择次数超过 2 次的产品有 ElevenLabs(音频生成,5 次),Suno(音乐生成,4 次)、Claude(ChatBot,3 次),这三款产品的访问量都是全球 Web 端 AI 产品 Top50 的水平。 3、令人颇为惊讶的是,作为 AI 产品“扛把子”的 ChatGPT,仅被 a16z 合伙人 Justin Moore 提及 1 次。笔者认为,出现这个情况的原因,一方面是大家对 ChatGPT 有些“审美疲劳”,另一方面,2024 年内 ChatGPT 推出 AI 搜索功能和 o1 推理模型等新动作,也并不是那么的令人惊艳。 除了这些总体观察外,笔者将所有“大佬”提到的 45 款产品进行了分类,从分类中我们也能看出一些趋势: “AI 工具”主要指的是针对工作或生活中的某一个场景而推出的综合工具,比如写作工具、会议纪要工具、演示工具等等。 1、AI 工具是所有产品类型中产品数量最多的,一共 10 款,占比为 22%。针对工作/生活各个场景的提效产品,也是一个持续的热点,毕竟提升大模型能力固然重要,但如果找不到应用场景,也只能是空中楼阁。 2、产品数量排名第二的是 AI 视频,一共 8 款,占比 18%。作为起步较晚的一个模态,今年迎来了爆发式的增长,不仅市面上出现了多个“图/文生成视频”产品,Talking Video、长剪短工具等产品类型,都涌现出了不少明星产品。 3、虽然 Perplexity 被 Pick 的次数是最多的,但它所在的 AI 搜索赛道却相当的惨,除 Perplexity 外的其他产品,无一上榜。 4、其他占比超过 10% 的产品类型有 AI ChatBot/Agent 和 AI 图像,也是之前就很热门的 AI 赛道。但是我们还能看到,像 AI 编程,AI 心理/医疗/育儿等垂类行业/场景,也涌现出不少产品,开始被从业者们所关注。 5、除了 AI 软件之外,Meta 和雷朋合作推出的智能眼镜、AI 陪伴产品 Curio、智能驾驶网约车Waymo 等 AI“硬件”,亦进入了从业者们的视野。 本次选题,我们仍将聚焦 AI 工具、AI ChatBot/Agent、AI 图像、AI 视频,四个最主要的 AI 产品类型,并聚焦那些能够被 Pick,但并不那么知名的产品,跟随从业者的“主观视角”,观察那些具有潜力的产品们。而像 AI 硬件、AI 心理/医疗/育儿等新晋产品类型,我们将在以后单独推出选题进行观察,这里就不过多赘述了。 二、AI 工具:落地场景越来越丰富, 被提及的大多在起步初期 AI 工具这个分类主要指的是针对工作或生活中的某一个场景而推出的综合工具,比如写作工具、会议纪要工具、AI 演示工具等等 在 AI 工具分类的这些产品中,被 cue 到的唯一名气较大的产品就是 Gamma,从流量数据来看,11 月份 Gamma 的流量达到巅峰,但 12 月份有所下降。我们曾经在 AI+PPT 的选题中观察过 Gamma,感兴趣的读者可以移步阅读《AI+?,吸量又赚钱》。 Gamma 2024.5-2024.12 流量数据|图片来源:AI Pure 今年另一个被讨论次数很多的 AI 工具是 Google 推出的 NoteBookLM。 NotebookLM 界面 2024 年 5 月,Google 正式推出搭载 Gemini 大模型的 AI 笔记产品 NoteBookLM。它可以基于用户上传的文档、视频、音频等信息,由AI完成回答问题、生成摘要、提取关键词等任务,尤其是基于上传信息生成播客(支持双人对话)的功能广受好评。 NoteBookLM 6-12 月流量数据|图片来源:AI Pure NoteBookLM 在 9-10 月这个区间有一波流量的快速增长,截止 12 月份,其流量已经触及千万大关。 而 Adobe Acrobat AI Assistant 只被 Adobe 首席战略官提及一次,有亲情票的嫌疑,作为全球 PDF 阅读器市场占有率超 50% 的产品,加入 AI 功能也是顺理成章。 下面我们把注意力放到那些被大佬们推荐,但却没那么知名的产品上…… Granola 使用场景:线上会议 主要功能:Granola 是一款 AI 会议纪要工具,当用户进行线上会议时,它可以进行会议的逐字记录,也可以基于会议内容生成简短的会议纪要,并且将常用的会议纪要模版保存下来,以备后续使用。 Ben’s Bites 创始人 Ben Tossell评价: 最适合会议的笔记应用。我几乎试过所有其他的工具,而我喜欢它的原因是:它不会影响会议本身造成尴尬,而且产品设计非常精美,在我使用过的工具中,它提供了最好的转录和摘要功能。 Lindy 使用场景:电子邮件管理、线上会议、线上营销、线上客服、内容创作等 主要功能:Lindy 是一款面向工作场景的 AI 效率工具,提供多样化的功能,Lindy 的主要区别在于为用户提供了流程编辑器,编辑自己的工作流,并让 AI 完成相关任务,简化工作量。目前 Lindy 提供 100 多个工作流模板,主要针对会议、营销、内容创作等场景。 The Rundown AI 创始人兼 CEO Rowan Cheung 评价: 这个工具可以帮助销售团队完成最繁琐、最耗时的任务,让团队能够专注于真正重要的事情,比如策划有影响力的活动、与客户交流等。 Flow 使用场景:文字录入 主要功能:Flow 是一款 AI 听写工具,目前仅支持 MacOS 系统,用户可以在任何需要文字输入的场景中使用 Flow 进行语音输入,转录成文字。目前 Flow 支持 100 种语言,其官网显示,这款工具可以将文字输入的速度提升三倍。 Ben’s Bites 创始人 Ben Tossell 评价:我每天都在使用这个转录应用。只需设置一个键,并开始说话,应用会将语音转录并格式化为文字(包括生成总结要点、引用内容,或者在你重复自己时进行小幅修正),并自动粘贴到应用中。 ElevenLabs 设计主管 Ammaar Reshi 评价: 这个语音转录功能非常棒,我只需要对着我的 Mac 说话。它会自动去掉所有“呃”或“嗯”这样的语气词,甚至在识别到我在列举清单时,会自动格式化为项目符号。 Cora 使用场景:邮件管理 主要功能:根据官网上的介绍,Cora 会每天两次为用户提供简洁的邮件摘要,用户可以迅速找到需要回复的重要邮件,并将相关邮件用故事线的形式进行归类,除此之外,Cora 还提供智能回复、垃圾邮件过滤等功能。目前 Cora 正在逐步开放注册,用户需要先加入 Wishlist 以获取使用权限。 Ben’s Bites 创始人 Ben Tossell 评价: 这是 Every 开发的一款尚未发布的工具。它能处理大量邮件,每天还会给我发送报告,它已经处理了我 90% 以上的邮件。它可以根据不同类型的邮件设置规则,自动归档邮件,并在需要时草拟回复。 Spiral 使用场景:写作 主要功能:Spiral 是一款针对重复性写作的AI工具,在使用时,用户需要提供一段内容,AI 可以将内容改写成特定风格、结构、语气的内容,比如用户提供播客大纲,让 Spiral 来撰写文字摘要或相关社媒推广内容。Spiral 的目标人群是内容创作者、营销人员等需要大量处理文字内容的用户。 值得一提的是,Spiral与上面提到的Cora都来自于一家位于纽约的初创公司Every。 新闻通讯作者兼播客主持人 Lenny Rachitsky 评价: 我们在播客工作流程中使用这个工具来生成可能的标题、缩略图创意以及关键内容总结。它经过训练,能够符合我们的风格,并参考以往最成功的节目。 Particle. News 使用场景:新闻浏览 主要功能:Particle.news 是一款AI新闻阅读应用,开发者是前 Twitter 工程师。Particle 会按照每日的重大新闻事件,将各个新闻媒体的报道整合起来,并给出摘要和相关出处,尽量为用户提供全面的视角,此外,App 端的 Particle 还提供 AI 问答、媒体政治倾向标注、语音朗读等更多功能。 目前,Particle 已经与路透社、法新社、财富杂志等新闻媒体机构达成合作,也完成了总计 1530 万美元的两轮融资。目前 Particle 已经在网页端和美国市场 iOS 和 iPadOS 平台上线,但近 30 天下载量仅为 2257。 Adobe 首席战略官 Scott Belsky 评价: 这是我每天使用的新闻应用,它会综合各个来源的视角,然后以一种越来越符合我偏好的方式,推送最客观的摘要内容。 Cubby 使用场景:研究、信息整理 主要功能:用户可以在 Cubby 中储存和管理文章、PDF、YouTube 视频、播客、推文、演示文稿和电子书等多种内容类型,产品提供标记评论、AI 摘要/问答、相关内容智能推荐等功能,此外,Cubby 还提供浏览器插件和团队协作相关功能。 a16z 合伙人 Zach Cohen 评价:拥有一个专为研究设计的集中式工作空间是一种神奇的体验。它可以切换不同的模式,在多个网站间进行搜索,还支持内嵌式的 AI 功能。此外,“生成推文串”的功能简直是为风投人士量身定制的。 三、AI ChatBot/Agent:大厂的主战场, 唯一例外是“真人版”C.AI AI ChatBot/Agent 的产品并不太令人意外,ChatGPT、来自 Anthropic 的 Claude、Meta AI、以及马斯克旗下 X.ai 的 Grok,基本上都是各个大公司布局的产品。 12 月 ChatBot 流量榜单 Top3|图片来源:AI产品榜 而全球 ChatBot 流量榜排名第二的 Google Gemini 却没有被任何人提及,虽然自身没被提及,但搭载了 Gemini 的 NotebookLM 却上榜了(上文已介绍过)。除了 NoteBookLM 之外,Gemini 还被整合到了 Workspace、YouTube、Gmail、广告等等 Google 旗下的产品和服务中。虽然对这些“整合”的评价褒贬不一,但 Google 依托自身生态体系来做 AI 应用的策略是比较明确的。 Delphi 官网主页|图片来源:Delphi 而另一个上榜的 ChatBot/Agent 产品是 Delphi,它给自己的定义是一个“数字克隆工具”,用户可以上传与自己或其他人相关的信息(包括社媒内容、文章、演讲等),Delphi 会基于这些内容创建一个包含思想、声音等元素的“Agent”,可以用其代替真人来聊天,或回复邮件等。这个模式有点类似于 c.ai 制作角色,只是 Delphi 面向的对象是真实的人。 四、AI图像:上榜产品们“各显神通” 注:目前一些生图产品中会包含生视频功能,但如果该产品以生图功能为主,就会被划归生图类别,而例如可灵、Runway 等以视频为主,兼有生图功能的产品,则会在下文中进行介绍。 在 AI 图像产品中,“老大哥”Midjourney、广受好评的 ideogram、以及商品图制作赛道的绝对霸主 Photoroom,被 Pick 的原因主要是名气和口碑。从流量数据来看,近半年,这三款产品基本稳定,并没有明显增长或断崖式下跌。 而另外三款产品被 Pick 的原因则是“特色功能”。 Playground创作界面 我们曾在今年国庆期间推出的选题《刚好一周年,登上第一期 a16z 榜单的生图产品们都怎样了?》选题中观察过 Playground,它从之前的传统文生图,变成了“改图”的模式,用户可以输入Prompt 让 AI 对图片进行修改,减少由于模型不稳定带来的“抽卡”问题,也能比直接生成更符合用户需求。但我们也观察到它并没有针对特定的场景做设计优化,访问量也从 400w 左右掉到了 200w 左右。 Krea 创作界面 Krea 最有特色的功能是“实时生图”,如上图所示,用户在输入 Prompt 之后,还能通过在左侧图片上增加不同颜色和形状的图形,来更稳定地控制生成图片中各个物体的颜色,位置,相对关系等等,给生图增加更多的确定性。除此之外,Krea 还有文生图、物体与背景相融合、文生视频等其他功能。 Krea 2D 转 3D 的新功能|图片来源:Krea 1 月 17 日,Krea 又在实时生图板块中推出了 2D 图像转 3D 图像的功能,但不知道是否因为仍处在测试阶段,笔者目前无法使用这个新功能。 Remix 落地页面(左 1),创作页面(左 2), 发现页面(左 3),聊天页面(左 4) Remix 与其他产品都不同,它的主阵地不在 Web 端而在 App 端,在基础的图文生图像/视频和图片风格化等基础功能外,Remix 拥有比较完善的社区功能,包括可以上下划动的内容分享页面,完善的作品排名和搜索功能,以及聊天/群组等功能。在 web 端做生图社区的很多,但是在 App 端,还以 TikTok 滑动卡片做信息流的,Remix 应该是独一份。 五、AI 视频:文生视频仍赔本, Talking Video、长剪短能赚钱 从这些被 Pick 的 AI 视频产品中,目前主流的落地产品类型有三个,文生视频、Talking Video 和长视频剪短视频。 文生视频是今年最热的一个 AI 赛道,尤其是出海企业和华人创企,异常活跃。7 月份 Kling 推出时,就在海内外引起大规模的讨论,网站访问量一个月就从 200 万增长到了 1500 万,时至今日,可灵的流量虽有所下降,但 Minmax 的 HailuoAI、生数的 Vidu、华人创企的 Haiper 等产品,都进入了视频生成产品 Top10,拿下了不错的成绩。 但是虽然 AI 视频生成可能是通向 AGI 的路径之一,但作为一款产品来说,还处于很早期的阶段。快手虽然靠可灵狠狠赚了一波流量,但它的 ROI 却不太能打得正,11 月快手表示可灵的月流水达千万人民币(136 万美金)级别,但知情人士透露,仅在 6 月到 9 月其海外投放费用就达到 33 万美金,而可灵的模型训练费用和日常推理成本(应该是截至 11 月份数据),更是达到了上亿美金的级别,相比成本,收入微不足道。而其他的文生视频产品也大抵如此,仍处于赔本赚吆喝的阶段。 而要说赚钱,长剪短和 Talking Video 是更加务实的选择,就拿以面向 Talking Video 场景的 Captions 为例,2024 年 12 月,它的全球双端月流水达到 100 万美元,再加上 Web 端数据向好,收入还是很可观的。而流量更好的 HeyGen 商业化成绩更是不错,今年 6 月创始人徐卓透露,HeyGen 的 ARR 已达到 3500 万美元,付费用户超 4 万。凭借着良好的商业化成绩,HeyGen 也受到了资本的偏爱,总融资额达 6500 万美元,估值 5 亿美元。而同样来自华人创始人的长视频剪短视频产品 OpusClip 的 ARR 也达到了千万美元。 展望 2025 年,视频赛道的最大变量可能就是 TikTok 的禁令了,这项禁令会如何影响 AI 视频赛道,我们还会持续关注。 参考信息:https://a16z.com/apps-unwrapped/
超窄四等边,是今年旗舰机的入场券
三星 Galaxy S25 系列新机如期发布,但和往年一样,总感觉有些格格不入。 一是成迷的上线时间,别家集中在下半年发力,它每次都要赶在年头交作业;二是佛系的营销策略,从当年和苹果分庭抗礼,到如今在国内销量惨淡。 不过,作为全球范围内的 Android 机皇,S25 其实透露出了今年手机发展的两个大趋势: 家族化设计成为主流,和苹果一样,华米 OV 近几年的新机外观,都逐渐找到了自己的主旋律。 直面屏再次回归旗舰机,异形曲面屏从普遍走向个别。 当年开启曲面屏时代的三星,现在竟率先完成了一次历史的轮回:四周 R 角、直角边框和超窄四等边,将会是今年,各家手机厂商在外观设计上,发力的重点。而当中最不起眼的「超窄四等边」,也会成为旗舰机型的一张入场券。 可是为什么一圈小黑边,突然就成了一大焦点? 一条黑边,八方来援 要搞清楚这个问题,我们得先知道,手机上的黑边是怎么来的?其实现在市面上主流的中高端手机的黑边,已经比当年 LCD 屏的那个时代,好了很多。 LCD 屏的手机由于设计和工艺的问题,大黑边会更加显眼,虽然看上去好像只是占用了屏幕空间,但就是这一圈显眼又不起眼的「设计」,其实有大用。 遮挡背光模组的光源组件; 防止了外部光线进入屏幕内部; 给前置镜头、听筒、指纹模组等组件预留空间; 手机跌落时多了一圈缓冲层。 ▲ 图片来自:Google 然而 LCD 屏和 OLED 屏的工作原理完全不同,直到现在,让 LCD 回归的呼声依然存在,因为它的使用周期更久、不烧屏,技术也更成熟。 从发展的角度来看,这种屏幕材料的变化,总归算是一种进步,特别是在屏幕黑边宽度的控制上。 简单类比一下两种技术的差异,LCD 的发光原理像是皮影戏,因为液晶自身不发光,所以需要额外的光源来点亮整个屏幕,屏幕也就在这一层又一层的材料里变得又厚又硬。 ▲ 图片来自:硬件茶谈 OLED 则更像荧光舞,在屏幕上点的每个像素都能独立发光,所以它的纵向结构会变得更薄,屏幕也就有了弯曲的可能。 现在我们经常在发布会和宣传语里,听到的柔性屏,都是基于 OLED 的技术特性延伸出来的,屏幕能弯曲,放置驱动电路和排线的大黑边,就可以弯折至屏幕背面,把原本暴露出来的不发光区域隐藏了起来。 这项边缘弯折技术,其实还有一个更为专业的名字: COP 封装工艺。它是黑边消除拉锯战里最大的功臣,也是最核心的技术。 屏幕封装,简单来说,就是把屏幕的显示部分和各种控制芯片、电路「打包」到一个完整的屏幕模组中,让它能正常工作并安装到手机上。目前一共有三大主流的封装工艺:COG、COF、COP。 ▲ 图片来自:ist.com COG 工艺是把驱动屏幕的芯片,直接贴在屏幕的玻璃基板上,由于芯片需要空间,所以下边框会比较宽,这种封装的工艺比较简单, 成本较低,是早期 LCD 屏幕的主要封装方式。 和直接贴合的 COG 不同,COF 工艺则是把驱动芯片装在一块柔性薄膜上,再把薄膜连接到屏幕上。这样做的好处是薄膜可以弯曲,芯片能藏在屏幕后面,正面的空间被节省了下来,非显示区域减少了,边框也就变得更窄了。 不过 COF 封装工艺弯折的并不是屏幕本身,而是排线和控制屏幕工作的芯片,它能让屏幕变窄,但还不够窄,仍然有很大的进步空间。 2017 年,三星 Galaxy S8 和 iPhone X 都开启了自家的全面屏时代,两者率先在量产机型上,实现了手机下巴的清除。 两款划时代的机型,虽然代表的是直面和曲面两个不同的阵营,但它们都运用了同一项新技术:COP 封装工艺。这是目前更先进的封装方式,把芯片直接安装在柔性塑料基板上,并藏在屏幕背后或弯折到下方。 塑料基板能完全弯曲,因此芯片藏得更彻底,非显示区域尽可能地和屏幕一起被弯折到了屏幕的后面,所以让极窄边框的全面屏手机,有了做出来的可能。 ▲ 图片来自:CNET 不过,COP 封装属于三大主流里,工艺最复杂、成本最高的一种,由于成本的限制,因此它一般都会在各大品牌的旗舰机型上,才会被用到。 OPPO Find 系列产品负责人周意保,在微博上透露过,它们用了三年时间,花了一个亿,才在最新的 Find X8 的边框上,真正意义上的物理四等窄边,而不是擦边的视觉四等边。 当然,封装技术只是影响屏幕黑边宽窄中,最为重要的一个,并不是唯一的一个,还有很多其他的因素,也在共同决定着你手机的黑边,是一条线,还是航母港湾。 比如屏幕触控技术 In-Cell,可以将触控层直接集成到屏幕的显示层中,而不是像传统屏幕那样额外叠加一层触控层。功能合二为一后,减少了屏幕模组厚度,边框占比变小。 ▲ 图片来自:Google 另外,不同的指纹解锁技术,也会从一定程度上,影响手机下巴的宽度。目前市面上最常见的短焦指纹(解锁的时候,手指触控部分会发亮光的那种),由于模组厚度问题,只能放置在屏幕下边框的附近,为了放置光学传感器和透光区域,下边框也就会跟着变宽。 ▲ 图片来自:Google 成本更高的超声波指纹(解锁时屏幕不发光,解锁速度很快,解锁位置一般都比短焦指纹高一些),不依赖光线,可以穿透屏幕玻璃和显示层,因此不需要为传感器预留透光区域;而且超声波传感器通常比光学传感器更小,可以更灵活地布置在屏幕下方,优化整体空间布局。 ▲ 图片来自:Google 更先进的技术,加上体积更小的居间,共同为黑边的减少,出了一份力。 无论是 COP 封装工艺,还是 In-Cell 屏幕触控技术和超声波指纹,以及其他的技术,虽然各自的作用都完全不同,但他们都有两个非常明显的共性:减少黑边,成本更高。 这也是为什么我们会说,超载四等边,是当下旗舰机的入场券之一。 不过这里还是想补充说明一下,上述的这些技术,的确有减少手机屏幕黑边的功能,但这只是它们的作用之一,在完成它们的本职工作的同时,又因为其先进的工艺和成熟的技术,减少了手机的大下巴和整机的厚度,以及其他的附加作用。 超窄四等边,是一种态度 在新技术的加持,和去年厂商发布新机的规律来看,今年手机的发展,有三个非常明显的趋势: 首先,直角边框直板机正式回归,特别是在各大品牌的旗舰机型上,今年我们应该会看到更多的品牌回归到这个曾经的主流里。iPhone 是这么多年里,唯一坚守初心的一个。 三星最新发布的 Galaxy S25 Ultra 也摒弃了上一代的圆角边框改为了直角,从第一台量产曲面屏,到回归直板机和直角边,兜兜转转又成为了最初的模样。 在曲面屏时代,还可以用异形屏的折射,以及弯曲的角度,从一定程度上掩盖黑边的尴尬,但今年如果想要加入到直板机的市场,那这套有些取巧的方式就不太奏效了,有一种浪潮褪去之后,看谁在裸泳即视感。 所以直板机的回归,注定了各大品牌会在屏幕黑边上,展开新一轮的攻城略地。 另外,直角直板的小屏旗舰,会成为今年各家厂商新的突破点,小米 15 经过了几次迭代,已经成了一款很成熟的小屏旗舰产品。 vivo X200 Pro mini 虽然在外观手感和个别配置上有些不尽人意,但也算是走出了第一步,况且在一种小屏机里,它影像体验是第一梯队,期待在 X300 上,看见 vivo 小屏的完全体。OPPO 和一加都有爆出消息,可能会在今年推出自家的小屏旗舰。 小屏幕四边的距离会更近,若是屏幕四边不等宽,小屏反而会成为缺点的放大器,有些机型之前的策略是「视觉四等边」,但在别家都一齐涌入一个赛道的时候,「物理四等边」可能才是小屏直板机的及格线。 但说到底,从使用的角度来看,四等边不会对手机造成日常体验上的影响,除非拿着放大镜,并且把所有品牌的直板机都放在一起,你才能看见明显的区别,不然真的很难察觉。 那为什么厂家还要在生产成本和遣词造句上,给「超窄四等边」下那么大的功夫呢?我觉得原因有二。 面向厂家而言,比起技术进步,我更愿意称它为审美自觉,它能把厂家对于产品、对于用户的态度体现出来,产品不仅能以更好看的姿态来到市场,给消费者留下深刻的印象;二来还能在细节上,让消费者感受到满满的诚意。 在各家产品的相机、屏幕、续航、芯片参数大差不大的当下,抱有美学态度的产品,注重细节推敲的机型,可能更容易成为爆款。 面向用户来说,在厂家铺天盖地宣传「超窄等边」概念的时候,人们会不自觉地关注这件事,从而影响它们的下定决策。所以不管是主动出击,还是被动防守,等宽的、超窄的边框,都是必须做到的。 并且,能实现超窄四等边的机型,一般都是旗舰机型,价格都不便宜。所以在高售价的面前,不等宽的边框无论是否会影响使用体验,它就像一个半成品。 而且在花钱的人看来,它就是一个半成品。
早报|三百元八个菜,预制年夜饭热销/小米通过软件升级召回 3 万台 SU7/曝三星超薄手机 4 月发售
小米、宝骏将通过软件升级召回故障车辆 OpenAI CEO 公布星门计划首期基地中心 丰田汽车否认整合中国业务 DeepSeek 低成本训练并开源,Meta 陷入恐慌 OPPO 回应车评博主泄密新机 智谱管理层变动,前 Midjourney 亚洲副总裁加入 机构:2024 年前 30 中国手游发行商全球吸金 234 亿美元 ‍ 上汽、吉利、比亚迪联合起诉欧盟 比亚迪预研世界模型,为高阶智驾铺路 联想集团 CEO:人工智能如何为爱而生 三星 Galaxy S25 Edge 超薄手机或将 4 月发售 电商平台:三百元不到 8 个菜的预制年夜饭热销 抖音正式上线「打车」服务 网易云音乐或将下架 SM 旗下全部歌曲 One Fun Thing |《海贼王》× LEGO 周末看什么 |《我爱你!》 买书不读指南 |《常客》 游戏推荐 |《致命公司(Lethal Company)》 周末也值得一看的新闻小米、宝骏将通过软件升级召回故障车辆 1 月 24 日,小米汽车在第 106 集《小米汽车答网友问》中发布公告,主动向国家市场监督管理总局备案小米 SU7 标准版召回计划。 公告显示,召回 2024 年 2 月 6 日至 2024 年 11 月 26 日生产的部分小米 SU7 标准版电动汽车,共计 30,931 台。其中,车辆型号 BJ7000MBEVR2 涉及车辆 18,410 台;车辆型号 XMA7000MBEVR2 涉及车辆 1,2117 台;车辆型号 XMA7000MBEVR5 涉及车辆 404 台。经小米汽车主管部门确认,智能泊车故障的相关投诉总量为 255 例。 小米汽车表示,此次为 OTA 召回,仅通过对车辆进行免费远程升级(OTA)即可完成,不需要车辆进店进行任何检查或处理。小米汽车也解释了为何「主动召回」而非「远程 OTA」,其称虽然本次升级不需要物理更换任何零件,但仍按照召回的程序进行管理和备案。 同时,有网友提及「11 月小米 SU7 标准版智能泊车事故」,小米汽车回应,事故发生后其第一时间确定了问题原因,随后在智能泊车辅助中增加更多冗余保护措施。此后还经过 2 个月的测试,保证安全稳妥并向主管部门沟通协商后,主动发起本次 OTA 软件升级召回。 同日,上汽通用五菱汽车也发布公告,表示召回部分旗下宝骏悦也汽车。 据公告显示,上汽通用五菱汽车将召回 2023 年 4 月 20 日至 2023 年 6 月 14 日期间生产的部分宝骏悦也汽车,共计 1,116 辆。召回原因是召回的车辆由于电子制动助力器(EBS)软件计时系统存在问题,该系统一年按照 365 天进行计算,在闰年的最后一天读取日期时出现错误的循环判定状态,造成 EBS 系统无法正常通讯,制动助力失效,存在安全隐患。 而上汽通用五菱汽车同样采用软件升级的方式进行召回。五菱方面表示,将为召回范围内的车辆升级 EBS 软件,以消除安全隐患。 据悉,早在 2024 年 8 月,工业和信息化部联合市场监管总局质量发展局,发布了《关于进一步加强智能网联汽车准入、召回及软件在线升级管理的通知》的征求意见稿,其中提到了在线升级技术(OTA)逐渐受到了越来越多车企和消费者的青睐,OTA 技术不仅提升了车辆的性能和用户体验,还有助于车辆的远程问题诊断和修复,是推动汽车智能化发展的重要技术之一。 OpenAI CEO 公布星门计划首期基地中心 1 月 24 日,OpenAI CEO Sam Altman 在个人社交账号公布了星门计划首期基地中心。 1 月 22 日,OpenAI、软银、甲骨文三大巨头掌门人,Sam Altman、孙正义、拉里·埃里森宣布联合成立一家名为 Stargate 的新 AI 公司。未来四年将投资 5,000 亿美元,掀起了新一轮 AI 军备竞赛。 而首批 10 个数据中心的建设工作已在德克萨斯州启动。据 semianalysis 报道相关信息,本次 Sam Altman 所公布的为星门计划的一号基地。据报道称,得州阿比林(Abilene)已经获批 875 英亩地给星门计划,并计划打造 10 个数据中心。星门还计划在未来 4 年在全美建设共 20 座超算中心。 据悉,星门计划首批 1,000 亿美元资金将用于构建 AI 基础设施。甲骨文将利用其在数据中心基础设施方面的技术和经验,与 OpenAI 和英伟达等公司紧密合作,共同构建和运营 AI 计算系统。 此外,OpenAI 首席产品官 Kevin Weil 也在近期通过华尔街日报的采访,透露了星门计划的首要任务。其表示,数据中心是计划的核心基础设施,承载着用于模型训练和推理的 GPU。并且 Kevin Weil 强调,必须确保在未来十年内拥有充足的算力储备,以开发能服务全球用户的产品。 丰田汽车否认整合中国业务 1 月 24 日,据 36kr 获悉,多名知情人士表示 2025 年开始,丰田对中国区已经发起了多项人事调整,除了丰田中国任命首位中国籍总经理李晖,并且广汽丰田总经理藤原宽行,将调任至一汽丰田,任总经理一职。 据报道,有丰田人士表示,业因绩压力比较大,丰田的各种各种调整和尝试明显加快了,包括启用中国籍高管担任总经理。此外,丰田在常熟的智能电动车技术研发公司 IEM 副总经理王君华,也将加入一汽丰田。 同时报道还指出,知情人士透露,丰田计划对中国区的「双生车型」战略进行优化,目前已经有了初步方向,即在产品层面,部分「双生车型」将被合并,今后将可能只保留其中一款进行销售。但随后,一汽丰田通过 36kr 否认了部分「双生车型」将整合的消息,其表示,目前公司并无该计划。 据悉,不同车型对应着不同的生产基地、销售渠道等已有体系,「合二为一」的难度不小。据知情人士透露,目前讨论的方案之一是,车型统合以后,两方的基地还可以继续生产,会挂上统一的车标。并整合难度相对较大的环节在于销售渠道,而关于利润划分问题,各方还需要一些商榷。 此外,报道中有行业人士透露,因丰田「以价换量」的亏钱式销售方式,在 2024 年,尤其在武汉这些中部地区,丰田的经销商在大面积退网。并且丰田在此次销售方式中大量利润损失,也促成丰田决定业务统合的直接动机。 DeepSeek 低成本训练并开源,Meta 陷入恐慌 近期,有 Meta 员工在美国匿名职场社区 TeamBlind 发帖表示,Meta 的工程师正在疯狂分析 DeepSeek,并试图从中复制一部分内容。 帖子中提到 DeepSeek-V3 和 DeepSeek-R1 两款模型,它们分别发布于 2024 年 12 月和 2025 年 1 月。 其中,DeepSeek-V3 发布时便提到,该模型在多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上,和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分上下。 此前,博主 scaling01 对比分析,DeepSeek 不仅性能上赶超,参数量达 671B 的 DeepSeek-V3 训练成本也仅为 558 万美元。相较下,Meta 的 Llama3 系列模型的计算成本足够训练 DeepSeek-V3 至少 15 次。 而近期发布的 DeepSeek-R1 性能更强,据悉,在数学、代码、自然语言推理等任务上,DeepSeek-R1 的性能比肩 OpenAI o1 正式版,并且在模型发布的同时,DeepSeek 同步开源了模型。UC Berkeley 教授 Alex Dimakis 对此分析并认为,DeepSeek 目前已处在领先地位,美国的 AI 公司则需要迎头赶上。 此外,该匿名帖子中还透露,目前公司管理层正为「如何解释模型开发的巨额投入」而发愁,并且同样处境的高管有数十位。 OPPO 回应车评博主泄密新机 1 月 23 日,车评博主陈震发文,配图中泄密了 OPPO 目前还未发布的 OPPO Find N5 新机外观信息,此后陈震将此条推文隐藏。 1 月 24 日,OPPO 法务部发布声明称,陈震在未经授权的情况下,公布了 OPPO 未发布的产品信息,并且该设备并非陈震本人所有。对此,OPPO 也强调,公司与内部员工、合作伙伴均有严格的保密协议,并要求各方严格遵从和履行保密协议。OPPO 表示,已启动内部调查,并将依法追究相关人员法律责任。 同时,陈震也发文回应「泄密未发布的新机」事件,表示手机并非本人所有,并且也没有与 OPPO 签订任何协议,只是觉得机器很薄,因此拍照并发微博。同时文中配图显示,OPPO 相关人员与陈震进行「推文隐藏」交涉,并表示将寄出一台样机供陈震使用。此外,陈震在推文评论区表示,自己并不知道该款机型未发布。 此前,陈震创办的「萝卜报告」,曾因在保密协议约定的解禁时间前,意外公布了领克 L946 车型的大量信息,而遭到领克汽车起诉并要求一次性支付赔偿金 500 万元。 智谱管理层变动,前 Midjourney 亚洲副总裁加入 1 月 24 日,据智能涌现获悉,近日中国 AI 大模型「六小虎」之一的智谱,管理层发生了变动。 据报道,前 Midjourney 亚洲副总裁王玥婷加入智谱,主要负责多模态产品和市场;智谱首席战略官张阔、副总裁曲滕于近日离职。「(推送前查询)而针对上述消息,目前智谱暂未回复」 相关人士通过智能涌现表示,智谱的长板是技术,相较而言短板是产品。此前,智谱就开始逐步引入产品相关的人才,如微软、阿里老兵胡云华加盟,担任智谱 C 端产品「智谱清言」的负责人。 据了解,新担任智谱多模态产品和市场负责人的王玥婷,此前曾担任估值超 10 亿美元的 AIGC 明星公司 Midjourney 的亚洲副总裁,负责 Midjourney 中国区的运营。相关人士透露,以王玥婷为代表,智谱正在计划引入一批年轻中高层,组成产品和商业化的中坚力量,目标是做出用户活跃度和市场认知度均为头部的产品。 而在近日离职的两位高管,张阔和曲滕,在智谱均负责融资相关事务。另据知情人士透露,自 2024 年起,智谱就开始拆分业务模块进行融资,张阔和曲滕则分别负责特定业务模块的融资,并且表示,张阔和曲滕的离职,不会影响智谱整体的融资情况。 机构:2024 年前 30 中国手游发行商全球吸金 234 亿美元 1 月 24 日,机构 Sensor Tower 公布了 2024 年中国手游出海收入榜与发行商收入榜。 数据显示,2024 年 Top30 中国手游发行商全球吸金 234 亿美元,比 2023 年略有上涨,达到全球 Top100 手游发行商收入的 36%。同时,Top30 出海手游在 App Store 和 Google Play 的总收入为 79 亿美元,同比小幅上涨,相比 2019 年提升 25%。 具体来看,2024 年中国手游发行商全球收入榜前三甲仍然由腾讯、网易和米哈游包揽。腾讯、点点互动、Joy Net Games、柠檬微趣、叠纸网络等十多个头部发行商,全球收入创历史新高。 而据 2024 年出海手游收入榜显示,《菇勇者传说》《绝区零》《AFK Journey》《Top Heroes》《恋与深空》《鸣潮》等 6 款题材各异的新游表现优异并入围 2024 年出海手游收入榜 Top30。 此外,据 Sensor Tower 数据显示,随着手游市场回调的结束,2024 年全球手游收入反弹 4%,至 809 亿美元,重返上升通道。海外市场 App Store 和 Google Play 手游收入则增长超过 5%,增至 662 亿美元,比 2019 年高出 31%。 上汽、吉利、比亚迪联合起诉欧盟 近日,上汽集团、吉利控股集团和比亚迪,就欧盟去年对中国产电动汽车加征的反补贴税,向欧盟普通法院提起诉讼。 据欧盟法院网站的文件显示,三家公司在提出异议截止日期的前一天提交了诉讼申请。欧盟中国商会随后也表示,已代表中国电动汽车生产商的行业机构—中国机电产品进出口商会,于 1 月 22 日提出申诉。 据悉,此前欧盟于 2024 年 10 月底对中国制造的电动汽车加征反补贴关税,为期五年。根据欧盟的裁决,比亚迪被加征 17.0% 的关税,吉利为18.8%,上汽集团为35.3%,其他配合调查的企业统一加征 20.7%,不配合的企业则被加征 35.3%。 对此,上汽集团因被加征最高税率关税的裁决而表示强烈不满,并认为调查涉及商业敏感信息,且欧盟委员会在补贴认定上存在错误,忽略了上汽提交的关键信息和抗辩意见。因此上汽已通过提交调查问卷、书面抗辩和听证会陈述意见等方式进行法律抗辩,并计划采取进一步法律措施。 目前,欧盟委员会表示已了解到相关案件,并有两个月零十天的时间准备辩护。同时,欧盟与中方的技术联系仍在继续,双方自 2024 年 9 月以来一直在就进口商品的最低价格进行谈判。 比亚迪预研世界模型,为高阶智驾铺路 1 月 24 日,据汽车像素报道,比亚迪已经成立了一个专攻世界模型的研究团队,组织架构上归属于先进技术研发中心。 据了解,比亚迪的世界模型研究还处于很早期的预研阶段,春节假期前预计将进行一期结果的交付。但与真正的目标,距离还有很远。同时,比亚迪的世界模型研究保持了小团队作战,目的是提高效率、快速试错。 据悉,比亚迪的世界模型,是高阶智能驾驶研发的一部分,是端到端智驾大模型研发的前置环节,目前拟定的主要用途,是为后者提供训练数据。 但据一位接近比亚迪智驾研发的负责人透露,比亚迪的智驾训练数据有两个问题,一是虽然数量庞大,但重复性高,丰富度不够,不能覆盖所有可能出现的场景;二是数据质量不够高,很多老款车型的技术受限,甚至很多此前上市的比亚迪高端车型,依然无法回传高质量的驾驶数据。 时间方面,汽车像素了解到,比亚迪的世界模型研究项目,最早从去年 8 月开始启动,与端到端大模型研发团队的起步时间相当。随后在去年 9 月,比亚迪重新整合了与算法、大数据相关的多个部门,成立了先进技术研发中心,团队规模超过 500 人。世界模型、端到端两个团队都被归拢在了新成立的研发中心下。 此外,据晚点 Auto 报道,比亚迪智驾总负责人杨冬生内部讲话表示,既要守住电动化的基本牌,还要努力做最先进的智能化,电动化要攻,智能化更要攻。同时,据晚点 Auto 了解,比亚迪的自研智驾方案上车节点就在近期。 联想集团 CEO:人工智能如何为爱而生 近日,联想集团董事长及 CEO 杨元庆发表署名文章《发展「人本智能」,让人工智能为爱而生》。 文中,杨元庆表示,人们在享受人工智能带来的效率红利、工作和生活越来越依赖于人工智能的同时,各种各样的「AI 焦虑」随之而来。因此杨元庆认为,科技企业应该努力的方向应该考虑,如何趋利避害,在推动人工智能提升生产力的同时,有效控制风险,实现安全、普惠、公正和包容,同时打造人人可用、人人受益的「人本智能」。 因此,杨元庆提出所谓「人本智能」,是指在人工智能技术、产品和服务的研发应用过程中,以满足人类需求和谋求人类福祉为首要目标;并且杨元庆强调,要恪守人本底线、提倡人本设计、坚持人本理念,同时「以人为本」去审视人工智能的影响,确保人工智能的发展能够真正惠及每家企业、每个人。 杨元庆还具体建议,要打造混合式人工智能,服务人的需求、保护人的安全,让人工智能普及普惠;杨元庆还提到,让人工智能帮助弱势群体,实现智能向善。最后,杨元庆强调,推动人工智能帮助解决全人类面临的共同挑战。 三星 Galaxy S25 Edge 超薄手机或将 4 月发售 近日,据 9To5Google 报道称,三星高管在发布会后透露,公司旗下 Galaxy S25 Edge 计划在 2025 年 4 月左右发售。 1 月 23 日,三星 Galaxy S25 系列正式发布,而 Galaxy S25 Edge 也一同亮相,该机型因超薄的设计而备受瞩目。新机设计语言与正式发布的 Galaxy S25 系列一样,采用直角中框,传闻机身厚度在 6.5mm 左右。 但目前官方仍没有披露关于这款超薄手机的更多信息,但有消息称其定位介于 Galaxy S25+和 S25 Ultra 之间,售价很可能是 999 美元。 此外,中国质量认证中心已在 1 月 23 日显示,三星旗下 SM-S9370 机型通过国内 3C 认证,支持 25W 充电功率,据悉,该机型为 Galaxy S25 Edge。 国内首个全场景深度思考模型 Baichuan-M1-preview 发布 1 月 24 日,百川智能发布了国内首个全场景深度思考模型 Baichuan-M1-preview。 据官方介绍,Baichuan-M1-preview 模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。 在数学、代码等多个权威评测中,Baichuan-M1-preview 的表现均超越了 o1-preview;而在视觉推理方面,Baichuan-M1-preview 在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等国内外头部模型。 此外,Baichuan-M1-preview 作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型,它还解锁了医疗循证模式,实现了从医疗证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。 一同推出的还有行业首个开源医疗增强大模型 Baichuan-M1-14B,其不仅在 cmexam、clinicalbench_hos、clinicalbench_hos、erke 等权威医学知识和临床能力评测上的成绩超越了更大参数量的 Qwen2.5-72B-Instruct,并且与 o1-mini 也相差无几。 目前,Baichuan-M1-preview 已在「百小应」中正式上线。 阶跃星辰旗下跃问 App 推出「AI 创意板」 1 月 24 日,阶跃星辰宣布,旗下跃问 App 推出「跃问 AI 创意板」,并表示把应用开发的门槛降到最低。 据官方介绍,用户可以完全不会写代码,只需在跃问 App 内使用「AI 创意板」功能,并输入 Prompt,简单描述应用的构想,跃问就能根据用户的想法,自主编写代码,为后者创造一款应用。当应用做好后,用户还可以把它发布出来,转发到朋友圈、小红书等社交媒体。 目前,「AI 创意板」已上线跃问 App。 Hugging Face 最小 AI 视觉语言模型上线,仅 2.56 亿参数 近日,Hugging Face 正式发布两款 SmolVLM 系列的小参数视觉语言模型,官方表示该系列模型为全球最小的视觉语言模型。 据了解,本次 Hugging Face 发布的 SmolVLM 系列模型中,分别为 2.56 亿参数的「SmolVLM-236M-Instruct」和 5 亿参数「SmolVLM-500M-Instruct」两个版本;值得关注的是,官方表示两款模型能在不到 1GB 的 GPU 内存上运行。 官方介绍,2.56 亿的版本能达到 2.2B 模型 80% 的性能,而 5 亿参数的版本更是能达到 90%;SmolVLM 还结合了 ColiPali,检索速度堪比 10 倍大的模型,做到成本更低、速度更快;并采用全新视觉编码器,整体尺寸从 400M 缩小到 93M,但生成分辨率将更高。 此前,Hugging Face 曾于 2024 年 11 月首次推出 SmolVLM 模型。据 Hugging Face 介绍,首版 SmolVLM 模型仅有 20 亿参数,用于设备端推理,其凭借极低的内存占用,在同类型模型中脱颖而出。 目前,两款小参数版本的 SmolVLM 模型的 Demo 版和博客都已登陆 Hugging Face Hub。 全球首款模块化 Windows 掌机 AYANEO 3 正式发布 1 月 24 日,AYANEO 正式发布全球第一台模块化 Windows 掌机 AYANEO 3,并表示「买一台,顶多台」。 AYANEO 3 最大亮点,就是首创支持拆换组合的 Magic Module 自由手柄模块设计,搭配可拆卸 ABXY 键可以实现最多 56 种操作布局,配备两段式霍尔扳机、自研磁悬浮马达和硬件级键鼠模式。 硬件方面,AYANEO 3 同时延续优雅美学和无边框全面屏设计,整机握持手感全面提升,并提供 7 英寸 120Hz IPS 高刷原彩屏和 144Hz OLED 高刷炫彩屏两块旗舰屏幕,以及 AMD Ryzen AI 9 HX 370 和 8840U 双旗舰 CPU 可选,强大散热系统稳定释放 35W 强悍性能,全新 AYASpace 3.0 带来高度自定义的掌机软件体验。 价格方面,AMD Ryzen 7 8840U 版本 16GB+512GB 起步,4,999 元起售;AMD Ryzen AI 9 HX 370 版本 32GB+1TB 起步,8,699 元起售;预售赠送配件周边大礼包,所有 Retro Power 版本额外赠送手柄模块套装。 目前先锋版现已开放预订,首付 2,999 元,发货前补尾款,预计 3 月底按订单顺序开始发货;正式版将于 4 月底联合京东在线上线下现货首发。 电商平台:三百元不到 8 个菜的预制年夜饭热销 近日,临近蛇年春节,年夜饭预订开始火热,而此前不被看好的预制菜,也随着年夜饭的「便车」,开启了一轮热销。 据电商平台显示,三百元不到的年夜饭套餐包含 8 道菜品,包含「鲍鱼佛跳墙」「蜜汁叉烧」等年夜饭常见菜品,商品页面显示已售超 5,000 单,并且页面还显示「24 小时内超百人购买」等提示语。据澎湃新闻报道,某国内知名预制菜企业相关负责人透露,近期公司预制菜销量较好,其中预制川菜最受欢迎。 中国食品产业分析师朱丹蓬受访表示,目前,预制菜行业是冰火两重天。从政策端来说,国家在大力推行预制菜,资本端也虎视眈眈地积极赋能,产业端更是信心百倍地跑马圈地,加快速度。但在消费端,消费者并没有完全接受预制菜,导致做预制菜的餐饮企业如履薄冰。 同时朱丹蓬强调,关键的原因是预制菜没有国家标准,虽然之前发布了两个政策指引,包括预制菜不含防腐剂和全程冷链,但是其觉得这还不够。朱丹蓬进一步表示,如果没有固定的中央工厂,从食品安全、色香味还原度、工艺流程、营养价值等方面来说,预制菜都会大打折扣。 抖音正式上线「打车」服务 近期,抖音的「本地生活」服务持续拓展,悄悄上线了「打车」服务。 据实际了解,抖音的「打车」服务入口较为隐蔽,位于个人主页「我的钱包」内,抖音将该服务与「抖音支付」「手机充值」等高频使用的服务平级归类。 目前抖音「打车」服务仅有高德打车一家网约车平台接入,并显示「更多品牌敬请期待」,提供「特惠快车」「极速拼车」等车型选择,与高德打车基本无异。 微信 WeChat Pay 港币钱包支持内地收款码支付 1 月 24 日,微信 WeChat Pay HK 发文宣布,WeChat 港币钱包开始支持内地扫码支付。 据官方介绍,香港地区用户也可以使用 WeChat Pay 港币钱包,扫内地个人商户的收款二维码进行支付。此前,WeChat Pay 港币钱包支持近 50 个城市的公共交通网络,香港用户到内地各城市搭乘公交地铁,可以使用乘车码进行扫码出行。 数据显示,2024 年香港有 8191 万人次北上消费,较 2023 年增长 53%。 网易云音乐或将下架 SM 旗下全部歌曲 1 月 24 日,网易云音乐发布《致韩国 SM 歌迷的一封信》,并表示未来会因版权问题而下架 SM 旗下全部歌曲内容。 信中显示,网易云音乐因版权方单方面通知不续约,将于 2025 年 1 月 31 日,全面下架韩国 SM 娱乐公司旗下全部歌曲内容。网易云音乐表示,始终十分珍视这些优秀的音乐作品,也深知这些歌曲对于广大歌迷朋友无可替代的价值,现在网易云音乐方仍在以最大诚意,继续通过多途径、多方面、多渠道的努力,争取版权续约的可能。 此前,2021 年 10 月网易云音乐曾拟向国家相关监管部门,举报投诉韩国 SM 公司坚持独家版权模式。随后,网易云音乐与 SM 娱乐公司于 2022 年 6 月达成合作协议,前者重新获得 SM 旗下全量音乐版权的授权。 据了解,韩国 SM 娱乐公司旗下拥有 Super Junior、少女时代、SHINee、f(x)、EXO、Red Velvet、NCT、aespa 等艺人。 DC 电影《超级少女:明日之女》发布首张剧照 1 月 24 日,DC 工作室联席 CEO 兼新《超人》电影导演 James Francis Gunn Jr. 发布了电影《超级少女:明日之女》首张片场照。 从公布的照片来看,主演米莉・阿尔柯克采用了「超级少女卡拉」的经典金发造型,片场椅还印有本片超人家族的标志性 LOGO,其风格和《超人》的盾形 S 标志保持一致。 据悉,超级少女和超人均为 DC 漫画旗下的超级英雄角色,两人的超能力基本一致,并且都在氪星毁灭后来到地球。但与超人不同的是,卡拉来到地球后已是接近成人的年龄,因此故事走向与超人的差别较大。 电影将由克雷格・吉勒斯佩执导,米莉・阿尔柯克、杰森・莫玛、马提亚斯・修奈尔、伊芙・雷德利、大卫・克朗姆霍茨等参与主演,预计于 2026 年 6 月 26 日北美上映。 是周末啊!One Fun Thing |《海贼王》× LEGO 近日,LEGO 乐高宣布,将于 Netflix 版的《海贼王》IP 联名,推出乐高航海王系列产品。据目前网传信息显示,乐高海贼王系列预计将包含 5 款以上的积木套装,计划于 2025 年 8 月陆续上市。 消息宣布后,《海贼王》原作者尾田荣一郎也回应称,自己一直非常喜欢乐高,自己的工作室里至今还推着数十箱的没来得及组装的新品乐高模组,并表示 25 年前《海贼王》动画开播时,就期盼着能够被乐高盯上。 周末看什么 |《我爱你!》 电影《我爱你!》是由倪大红、惠英红领衔主演,叶童、梁家辉特别出演的爱情电影,于 2023 年 6 月 21 日在中国内地上映。 该片改编自韩国漫画家姜草的原创同名漫画,讲述平凡人生中的两对老人生命尽头纯粹而又热烈的爱情故事。 截至 2024 年 3 月 8 日该片收获票房 4.28 亿元,2023 年 6 月 10 日获 2023 年微博之夜「年度关注影片」,2024 年 1 月 13 日获「微博年度口碑电影」。 买书不读指南 |《常客》 《常客》是一部由好妹妹乐队的秦昊所著的摄影作品,书中纪实城市影像,首次以菲林创作跟每一个远离家乡的年轻人对话。 在音乐之外,好妹妹秦昊首次将隐秘情感透过 200 余幅胶片呈现,映像出每个人与家乡既熟悉又陌生的关系,也书写着一个人与一座城相互塑造的真意。 这本书始于多年前的一次拍摄计划,秦昊以寻访奶奶姚女士年轻时的足迹为出发点,祖孙两代视角,探访家乡重庆、寻找数十年间奶奶参与的城市建筑,呈现出强烈的时代故事感。 游戏推荐 |《致命公司(Lethal Company)》 《致命公司(Lethal Company)》画质并不是顶级,甚至可以说有点「破烂」,但其独特的游玩体验让其登上今日的「游戏推荐」。 游戏中,玩家可以与小伙伴多人联机,在不同地点处去收集破铜烂铁,最后到一个阴森的废品回收站换取钱财,最后完成通过。看似简单的游戏模式,但随着类 SCP 怪物、阴森模糊的色调、配上 90 年代沙盒游戏的质感,让整个游戏氛围瞬间恐怖,而队友的尖叫与戛然而止的「死亡」,在游戏中形成强烈的反差和紧张感。 虽然该游戏目前还未汉化,但与朋友一起尖叫、并肩作战的游戏模式,另《致命公司》依然十分值得游玩。目前该游戏仅支持 Windows 平台。
英伟达新核弹显卡 RTX 5090 体验出炉:AI 成为性能表现的超强「外挂」
最大缺陷: 贵 两周前的 CES 上,英伟达正式发布外界期待已久的全新 RTX 5090 显卡,迅速攻占了全球科技媒体头条。各种爆表的参数和高达 1999 美元(折合人民币约 14647)的售价,也点燃了大众对其实际性能的好奇心。 而今天,RTX 5090 Founders Edition的媒体评测正式解禁,我们也能一窥这个性能猛兽表现如何。 先说结论:包括 The Verge 等不少媒体在内,都认为 RTX 5090 的性能提升,或许并不值得 400 美元的大幅涨价(前代 4090 显卡价格 1599 美元)。 比起上一代 4090,5090 FE 虽然性能提升,但厚度缩减了将近一半,并且也从三插槽改成了双插槽,更适合塞进小型的机箱当中。 上面的是 RTX 5090,图源:The Verge 瘦身成功也得益于英伟达全新设计的散热系统:小型 PCB 在显卡正中央,散热器贯穿整张显卡,两个风扇分布在 PCB 两侧,通过显卡背面吸入空气,直接在正上方排出,输出端口下方不再配有通风口。 英伟达对这个新的散热系统相当自信,认为足够在低噪音情况下,支撑 RTX 5090 高达 578W 的峰值热功耗。根据 IGN 的测试,RTX 5090 跑满 578W,温度达到 86 度,虽然比 RTX 4090 的 80 度要高不少,但没达到过热降频的地步。 要谈论这款显卡的性能,无法避免英伟达的「DLSS」画质增强技术。 由于换上了英伟达 AI 芯片架构 Blackwell,RTX 5090 搭载的 全新 DLSS4 技术,最高支持每一帧之后最多额外生成三帧,由此提升游戏的帧率,并提供完整的光追效果。 当然,围绕这项技术有不少争议。有些玩家认为,DLSS 技术生成的「假帧」,不能代表显卡的真实性能提升,并且此前的 DLSS 技术生成的帧存在一些延迟和图像质量的问题。 The Verge 在 4K 分辨率、全路径追踪、顶配设置以及AMD Ryzen 9 9800X3D 处理器下测试了《赛博朋克 2077》。在 DLSS 未打开的情况下,游戏在 34fps 速度下运行,比 RTX 4090 快了近 42%,而打开超分辨率和多帧生成等「外挂」之后,游戏终于达到了 60fps 以上。 而 Engadget 方面测试,RTX 5090 在未打开 DLSS 时《赛博朋克》最高画质能达到 54 fps,而同样条件下 4090 能达到 42 fps,提升 28%。 如果选用和旧 DLSS 一样的 AI 模型,并开启 4 倍多帧生成,《赛博朋克》能跑到 371fps,但可能会面临一些重影问题。The Verge 将其切换到 DLSS 4 全新的 Transformer 模型支持,游戏帧率下降到 211fps,但总体的显示效果会有所改善。 图源:Engadget 而 IGN 则指出,在测试 RTX 5090 时遇到比较大的瓶颈来自 CPU,即使他们已经采用了 Ryzen 7 9800X3D 这款强大的处理器,但是一些游戏即使打开 DLSS,对比 RTX 4090 的提升仅有 10% 左右。 而且在一些游戏,比如《刺客信条:幻影》,RTX 5090 的表现还不如前代,可能是由于早期的驱动问题。 经过多款游戏测试后,在不借助 DLSS 和帧生成技术的情况下下,多家媒体测试得出,4K 画质下 RTX 5090 比 RTX 4080 要快大概 27-33%左右,在历代 RTX 中属于比较平缓的性能提升。 英伟达官方性能对比图 而如果是 1440P 画质,那 RTX 5090 和 4090 之间的差距会进一步缩小。 The Verge 以 1440P 画质测试了《黑神话:悟空》,这款游戏也是 RTX 5090 在不开启 DLSS 的情况下为数不多无法达到 100fps 的游戏。在开启 75% 的 DLSS 后,《黑神话》能够接近 120fps 运行,但也只比 RTX 4090 高出 17%。 CES 上 RTX 5090 运行《黑神话》开启 DLSS4 前后对比,图源:YouTube @Frame Chasers 由此可见,DLSS 4 似乎才是 RTX 5090 的正确打开方式,英伟达也已经宣布,在 1 月 30 日,也就是 RTX 5090正式上市时,会有超过 75 款游戏支持 DLSS 4 技术。至于没有进行即时适配的游戏,用户也可以通过英伟达应用强制开启。 这么强力的显卡,当然不只有单纯打游戏一个用途。 Engadget 测试了 RTX 5090 在视频渲染方面的能力:长达一分钟的 4K 视频,通过 Nvenc H.264 编码转换成 1080P,5090 只用了 25 秒,Engadget 表示这是「见过最快的转换过程」。虽然只比 4090 还快了 3 秒,不过,当这些素材作为一个更大项目的组成部分,5090 就能节省几个小时的重复渲染时间。 除了高价,不少媒体都提到了 RTX 5090 一个缺陷:功耗。在高画质游戏下,RTX 5090 很轻易飙升到 500W 以上,在一些国家和地区,电费也会成为一笔隐形的开销。 图源:The Verge The Verge 则用 RTX 5090 运行了一些 AI 和视频剪辑工作的负载测试,在跑分软件 PugetBench 的 DaVinci Resolve 测试中,RTX 5090 比 RTX 4090 快了约 12%;而 Procyon 的 AI XL(16)测试中,5090 要快 40%。 1999 美元的价格,RTX 5090 注定如同黄仁勋口中那般,不会是面向大部分游戏用户的显卡,甚至就连 Engadget 的测评人员也表示,现实生活中并不认识任何会需要用到这块显卡的用户。它更多是一个英伟达「秀肌肉」的产品。 但就目前 RTX 5090 的表现而言,更让人惊喜的是像是 DLSS 这种AI 超分技术的潜力,意味着未来的显卡有望以更低的价格实现更惊人的表现,或者能借助 OTA 更新进一步实现提升。 事实上,定价 549 美元(折合人民币约 3978.71 元)的 RTX 5070 是一款更大众的产品,而借助 AI,英伟达号称它也能实现接近三倍价格 RTX 4090 的同等性能。 因此不少网友开玩笑称,RTX 50 系列,更像是「买 DLSS 送显卡」。 在芯片工艺进步放缓的当下,AI 增强很可能将成为性能提升的破局之道。这样看来,RTX 50 系列确实是「面向未来」的显卡。
除了 S25 手机,三星发布会还公开了首款头显,外观很眼熟,AI 是亮点
首款 Android 头显 今天凌晨举办的三星 Galaxy Unpack 发布会上,除了万众期待的 Galaxy S25 系列手机,三星和 Google 联合开发的首台 Android XR 设备也在展会上露出庐山真面目。 图源:The Verge 只是这台设备的外观,不得不说和友商有几分神似,甚至有网友开玩笑称,如果没标出是什么设备,还以为 Apple Vision Pro 2 发了。 Apple Vision Pro 这款设备代号为 Project Moohan(韩语「无限」的意思),虽然是首次对外界展出,但在去年 Google 官宣 Android XR 系统时,已经邀请了一些媒体进行实机体验。 The Verge 记者表示,在戴上 Moohan 的时间里,她感觉自己就像拥有 AI 助手的「贾维斯」的「钢铁侠」托尼・史塔克。 即使 Moohan 外观类似 Vision Pro 和 Meta Quest 这样的大块头,但戴在头上的重量要更轻,在比较有限的体验时间里,不会产生太多不适感。形态上 Moohan 和 Vision Pro 类似,都选择将电池组外置,以一条电缆连接。 Vision Pro 的电池包 对于 Moohan 眼镜,Google 和三星的定位是「全能」的 XR 眼镜,能力涵盖增强现实(AR)、虚拟现实(VR)和混合现实(MR)。 Moohan 支持使用 VR 操纵器,但默认的交互方式是直接上手操作,方式也有点像 Vision Pro :双手移动光标,捏住食指和拇指进行选择。在经过校准后,Moohan 也支持眼动追踪,开启后用户无需抬手,双眼注视就能选中图标。 Google 提供的演示画面,仅供参考,下同 据体验者反馈,这款设备的画质也非常清晰,穿透模式可能会有点像素化。Moohan 和大部分头显采用了一样的「注视点渲染」方案:越接近用户视觉中心的图像质量越好,越边缘的内容越模糊。 至于内容方面,Android 现存的大部分应用都能直接兼容,因此这个系统一问世就能访问海量应用资源。Google 也已经重新打造了自家的 YouTube、Google 地图、Google 照片等应用,让其使用体验能更好配合 XR 设备。 YouTube 上已经提供了一些完全立体的沉浸式内容,《连线》杂志记者表示,效果非常好,能达到「感官全包围的感觉」。 类似 Vision Pro,在 Moohan 的 Google 照片应用中,任何照片都能以一种三维的方式查看,即使它们只是用平常的方式进行拍摄。Google 表示,他们正在使用机器学习模型来理解图像和视频的空间深度,让所有二维内容都能以更立体的形式呈现。 Moohan,或者说 Android XR 设备要如何脱颖而出?Google 给出的答案是「AI」。 由于 Moohan 是一副全功能的大型头显设备,它也可以当作一副类似 Ray-Ban Meta 这样的 AI 眼镜,通过多模态 AI 和虚拟显示技术,为用户提供视觉上的智能指引。 并且,和不少 AI 眼镜一样,只要用户选择始终打开,就能够以非常自然、模糊的提示词去唤醒和使用 Android XR 上的 Gemini 助手,并且它能够看用户所看,听用户所听,它也能够理解用户的提问的上下文背景。 在 Google 的演示中,工作人员戴着 Moohan 对着一件巴塞罗那俱乐部球衣直接发问「找出『这个』的排名」,Gemini 很快就调出了球队联赛排名和最近比赛的得分。 一个比较重要的场景是 AI+XR 导航。用户直接对眼镜发出指令「带我去某某地方」,眼镜就会直接显示一个 3D 模型版本的 Google 地图,可以沉浸式探索这些区域,在这个过程中能够继续对 Gemini 提问诸如「什么时候开放」「什么时候是参观的最佳时间」,它都能及时回应。 Google 去年在海外 Android 手机上主打的智能功能「即圈即搜」也引入到 Android XR 上,不仅可以像在手机上对所有应用画圈搜索,也能圈选现实世界的物品。 其实,这些 AI 功能并不算太新鲜,在 Meta 和其他品牌的智能眼镜上都有同款,但就目前演示的效果而言,尝试过数十款智能眼镜的 The Verge 记者对 Gemini 给出极高的评价,认为它是目前最接近宣传效果的 AI 助手。 不过,这个巨大的头显设备,用户基本不可能戴着出门,因此显然不是 Gemini 的最佳载体。 Google AR 和 XR 副总裁 Shahram Izadi 认为,在 Android XR 的世界中,不会有任何一款单一设备代表「XR 的未来」,Moohan 这样的头显可能只是一种专门用来娱乐的设备,而眼镜则是手机和智能手表的补充,用于查看通知和查找信息,更适合出门佩戴。 图源:The Verge 不同形态的设备,和 Android 庞大的应用生态,以及 Gemini AI 的自然体验,构成了 Android XR 的「三管齐下」战略。如果说 Android 让人们习惯于将「电脑」揣兜里,而 Android XR 目标是让人们习惯将「电脑」戴头上。 由于 Gemini 可圈可点的表现,让人不禁期待 Google 出品的 AR 或 AI 眼镜产品。在 Unpacked 发布会上,三星高层已经透露,目前正在和 Google 携手开发 AR 眼镜,还没有更多细节和时间线。 至于 Project Moohan,三星计划首先为开发者推出,正式上市的时间可能没那么快到来,价格预计也不会低。
三百元八个菜,预制年夜饭热销/小米通过软件升级召回 3 万台 SU7/曝三星超薄手机 4 月发售
🚗 小米、宝骏将通过软件升级召回故障车辆 🏭 OpenAI CEO 公布星门计划首期基地中心 🚫 丰田汽车否认整合中国业务 ❗️ DeepSeek 低成本训练并开源,Meta 陷入恐慌 💬 OPPO 回应车评博主泄密新机 📊 智谱管理层变动,前 Midjourney 亚洲副总裁加入 🎮 机构:2024 年前 30 中国手游发行商全球吸金 234 亿美元 🧑‍⚖️ 上汽、吉利、比亚迪联合起诉欧盟 🤖 比亚迪预研世界模型,为高阶智驾铺路 💡 联想集团 CEO:人工智能如何为爱而生 📱 三星 Galaxy S25 Edge 超薄手机或将 4 月发售 🥣 电商平台:三百元不到 8 个菜的预制年夜饭热销 🚗 抖音正式上线「打车」服务 💰 网易云音乐或将下架 SM 旗下全部歌曲 🎬 One Fun Thing |《海贼王》× LEGO 📺 周末看什么 |《我爱你!》 📚 买书不读指南 |《常客》 🎮 游戏推荐 |《致命公司(Lethal Company)》 📰 周末也值得一看的新闻小米、宝骏将通过软件升级召回故障车辆 1 月 24 日,小米汽车在第 106 集《小米汽车答网友问》中发布公告,主动向国家市场监督管理总局备案小米 SU7 标准版召回计划。 公告显示,召回 2024 年 2 月 6 日至 2024 年 11 月 26 日生产的部分小米 SU7 标准版电动汽车,共计 30,931 台。其中,车辆型号 BJ7000MBEVR2 涉及车辆 18,410 台;车辆型号 XMA7000MBEVR2 涉及车辆 1,2117 台;车辆型号 XMA7000MBEVR5 涉及车辆 404 台。经小米汽车主管部门确认,智能泊车故障的相关投诉总量为 255 例。 小米汽车表示,此次为 OTA 召回,仅通过对车辆进行免费远程升级(OTA)即可完成,不需要车辆进店进行任何检查或处理。小米汽车也解释了为何「主动召回」而非「远程 OTA」,其称虽然本次升级不需要物理更换任何零件,但仍按照召回的程序进行管理和备案。 同时,有网友提及「11 月小米 SU7 标准版智能泊车事故」,小米汽车回应,事故发生后其第一时间确定了问题原因,随后在智能泊车辅助中增加更多冗余保护措施。此后还经过 2 个月的测试,保证安全稳妥并向主管部门沟通协商后,主动发起本次 OTA 软件升级召回。 同日,上汽通用五菱汽车也发布公告,表示召回部分旗下宝骏悦也汽车。 据公告显示,上汽通用五菱汽车将召回 2023 年 4 月 20 日至 2023 年 6 月 14 日期间生产的部分宝骏悦也汽车,共计 1,116 辆。召回原因是召回的车辆由于电子制动助力器(EBS)软件计时系统存在问题,该系统一年按照 365 天进行计算,在闰年的最后一天读取日期时出现错误的循环判定状态,造成 EBS 系统无法正常通讯,制动助力失效,存在安全隐患。 而上汽通用五菱汽车同样采用软件升级的方式进行召回。五菱方面表示,将为召回范围内的车辆升级 EBS 软件,以消除安全隐患。 据悉,早在 2024 年 8 月,工业和信息化部联合市场监管总局质量发展局,发布了《关于进一步加强智能网联汽车准入、召回及软件在线升级管理的通知》的征求意见稿,其中提到了在线升级技术(OTA)逐渐受到了越来越多车企和消费者的青睐,OTA 技术不仅提升了车辆的性能和用户体验,还有助于车辆的远程问题诊断和修复,是推动汽车智能化发展的重要技术之一。 OpenAI CEO 公布星门计划首期基地中心 1 月 24 日,OpenAI CEO Sam Altman 在个人社交账号公布了星门计划首期基地中心。 1 月 22 日,OpenAI、软银、甲骨文三大巨头掌门人,Sam Altman、孙正义、拉里·埃里森宣布联合成立一家名为 Stargate 的新 AI 公司。未来四年将投资 5,000 亿美元,掀起了新一轮 AI 军备竞赛。 而首批 10 个数据中心的建设工作已在德克萨斯州启动。据 semianalysis 报道相关信息,本次 Sam Altman 所公布的为星门计划的一号基地。据报道称,得州阿比林(Abilene)已经获批 875 英亩地给星门计划,并计划打造 10 个数据中心。星门还计划在未来 4 年在全美建设共 20 座超算中心。 据悉,星门计划首批 1,000 亿美元资金将用于构建 AI 基础设施。甲骨文将利用其在数据中心基础设施方面的技术和经验,与 OpenAI 和英伟达等公司紧密合作,共同构建和运营 AI 计算系统。 此外,OpenAI 首席产品官 Kevin Weil 也在近期通过华尔街日报的采访,透露了星门计划的首要任务。其表示,数据中心是计划的核心基础设施,承载着用于模型训练和推理的 GPU。并且 Kevin Weil 强调,必须确保在未来十年内拥有充足的算力储备,以开发能服务全球用户的产品。 丰田汽车否认整合中国业务 1 月 24 日,据 36kr 获悉,多名知情人士表示 2025 年开始,丰田对中国区已经发起了多项人事调整,除了丰田中国任命首位中国籍总经理李晖,并且广汽丰田总经理藤原宽行,将调任至一汽丰田,任总经理一职。 据报道,有丰田人士表示,业因绩压力比较大,丰田的各种各种调整和尝试明显加快了,包括启用中国籍高管担任总经理。此外,丰田在常熟的智能电动车技术研发公司 IEM 副总经理王君华,也将加入一汽丰田。 同时报道还指出,知情人士透露,丰田计划对中国区的「双生车型」战略进行优化,目前已经有了初步方向,即在产品层面,部分「双生车型」将被合并,今后将可能只保留其中一款进行销售。但随后,一汽丰田通过 36kr 否认了部分「双生车型」将整合的消息,其表示,目前公司并无该计划。 据悉,不同车型对应着不同的生产基地、销售渠道等已有体系,「合二为一」的难度不小。据知情人士透露,目前讨论的方案之一是,车型统合以后,两方的基地还可以继续生产,会挂上统一的车标。并整合难度相对较大的环节在于销售渠道,而关于利润划分问题,各方还需要一些商榷。 此外,报道中有行业人士透露,因丰田「以价换量」的亏钱式销售方式,在 2024 年,尤其在武汉这些中部地区,丰田的经销商在大面积退网。并且丰田在此次销售方式中大量利润损失,也促成丰田决定业务统合的直接动机。 DeepSeek 低成本训练并开源,Meta 陷入恐慌 近期,有 Meta 员工在美国匿名职场社区 TeamBlind 发帖表示,Meta 的工程师正在疯狂分析 DeepSeek,并试图从中复制一部分内容。 帖子中提到 DeepSeek-V3 和 DeepSeek-R1 两款模型,它们分别发布于 2024 年 12 月和 2025 年 1 月。 其中,DeepSeek-V3 发布时便提到,该模型在多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上,和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分上下。 此前,博主 scaling01 对比分析,DeepSeek 不仅性能上赶超,参数量达 671B 的 DeepSeek-V3 训练成本也仅为 558 万美元。相较下,Meta 的 Llama3 系列模型的计算成本足够训练 DeepSeek-V3 至少 15 次。 而近期发布的 DeepSeek-R1 性能更强,据悉,在数学、代码、自然语言推理等任务上,DeepSeek-R1 的性能比肩 OpenAI o1 正式版,并且在模型发布的同时,DeepSeek 同步开源了模型。UC Berkeley 教授 Alex Dimakis 对此分析并认为,DeepSeek 目前已处在领先地位,美国的 AI 公司则需要迎头赶上。 此外,该匿名帖子中还透露,目前公司管理层正为「如何解释模型开发的巨额投入」而发愁,并且同样处境的高管有数十位。 OPPO 回应车评博主泄密新机 1 月 23 日,车评博主陈震发文,配图中泄密了 OPPO 目前还未发布的 OPPO Find N5 新机外观信息,随后陈震将此条推文隐藏。 1 月 24 日,OPPO 法务部发布声明称,陈震在未经授权的情况下,公布了 OPPO 未发布的产品信息,并且该设备并非陈震本人所有。对此,OPPO 也强调,公司与内部员工、合作伙伴均有严格的保密协议,并要求各方严格遵从和履行保密协议。OPPO 表示,已启动内部调查,并将依法追究相关人员法律责任。 同时,陈震也发文回应「泄密未发布的新机」事件,表示手机并非本人所有,并且也没有与 OPPO 签订任何协议,只是觉得机器很薄,因此拍照并发微博。同时文中配图显示,OPPO 相关人员与陈震进行「推文隐藏」交涉,并表示将寄出一台样机供陈震使用。此外,陈震在推文评论区表示,自己并不知道该款机型未发布。 此前,陈震创办的「萝卜报告」,曾因在保密协议约定的解禁时间前,意外公布了领克 900 的大量信息,而遭到领克汽车起诉并要求一次性支付赔偿金 500 万元。 智谱管理层变动,前 Midjourney 亚洲副总裁加入 1 月 24 日,据智能涌现获悉,近日中国 AI 大模型「六小虎」之一的智谱,管理层发生了变动。 据报道,前 Midjourney 亚洲副总裁王玥婷加入智谱,主要负责多模态产品和市场;智谱首席战略官张阔、副总裁曲滕于近日离职。「(推送前查询)而针对上述消息,目前智谱暂未回复」 相关人士通过智能涌现表示,智谱的长板是技术,相较而言短板是产品。此前,智谱就开始逐步引入产品相关的人才,如微软、阿里老兵胡云华加盟,担任智谱 C 端产品「智谱清言」的负责人。 据了解,新担任智谱多模态产品和市场负责人的王玥婷,此前曾担任估值超 10 亿美元的 AIGC 明星公司 Midjourney 的亚洲副总裁,负责 Midjourney 中国区的运营。相关人士透露,以王玥婷为代表,智谱正在计划引入一批年轻中高层,组成产品和商业化的中坚力量,目标是做出用户活跃度和市场认知度均为头部的产品。 而在近日离职的两位高管,张阔和曲滕,在智谱均负责融资相关事务。另据知情人士透露,自 2024 年起,智谱就开始拆分业务模块进行融资,张阔和曲滕则分别负责特定业务模块的融资,并且表示,张阔和曲滕的离职,不会影响智谱整体的融资情况。 机构:2024 年前 30 中国手游发行商全球吸金 234 亿美元 1 月 24 日,机构 Sensor Tower 公布了 2024 年中国手游出海收入榜与发行商收入榜。 数据显示,2024 年 Top30 中国手游发行商全球吸金 234 亿美元,比 2023 年略有上涨,达到全球 Top100 手游发行商收入的 36%。同时,Top30 出海手游在 App Store 和 Google Play 的总收入为 79 亿美元,同比小幅上涨,相比 2019 年提升 25%。 具体来看,2024 年中国手游发行商全球收入榜前三甲仍然由腾讯、网易和米哈游包揽。腾讯、点点互动、Joy Net Games、柠檬微趣、叠纸网络等十多个头部发行商,全球收入创历史新高。 而据 2024 年出海手游收入榜显示,《菇勇者传说》《绝区零》《AFK Journey》《Top Heroes》《恋与深空》《鸣潮》等 6 款题材各异的新游表现优异并入围 2024 年出海手游收入榜 Top30。 此外,据 Sensor Tower 数据显示,随着手游市场回调的结束,2024 年全球手游收入反弹 4%,至 809 亿美元,重返上升通道。海外市场 App Store 和 Google Play 手游收入则增长超过 5%,增至 662 亿美元,比 2019 年高出 31%。 上汽、吉利、比亚迪联合起诉欧盟 近日,上汽集团、吉利控股集团和比亚迪,就欧盟去年对中国产电动汽车加征的反补贴税,向欧盟普通法院提起诉讼。 据欧盟法院网站的文件显示,三家公司在提出异议截止日期的前一天提交了诉讼申请。欧盟中国商会随后也表示,已代表中国电动汽车生产商的行业机构—中国机电产品进出口商会,于 1 月 22 日提出申诉。 据悉,此前欧盟于 2024 年 10 月底对中国制造的电动汽车加征反补贴关税,为期五年。根据欧盟的裁决,比亚迪被加征 17.0% 的关税,吉利为18.8%,上汽集团为35.3%,其他配合调查的企业统一加征 20.7%,不配合的企业则被加征 35.3%。 对此,上汽集团因被加征最高税率关税的裁决而表示强烈不满,并认为调查涉及商业敏感信息,且欧盟委员会在补贴认定上存在错误,忽略了上汽提交的关键信息和抗辩意见。因此上汽已通过提交调查问卷、书面抗辩和听证会陈述意见等方式进行法律抗辩,并计划采取进一步法律措施。 目前,欧盟委员会表示已了解到相关案件,并有两个月零十天的时间准备辩护。同时,欧盟与中方的技术联系仍在继续,双方自 2024 年 9 月以来一直在就进口商品的最低价格进行谈判。 比亚迪预研世界模型,为高阶智驾铺路 1 月 24 日,据汽车像素报道,比亚迪已经成立了一个专攻世界模型的研究团队,组织架构上归属于先进技术研发中心。 据了解,比亚迪的世界模型研究还处于很早期的预研阶段,春节假期前预计将进行一期结果的交付。但与真正的目标,距离还有很远。同时,比亚迪的世界模型研究保持了小团队作战,目的是提高效率、快速试错。 据悉,比亚迪的世界模型,是高阶智能驾驶研发的一部分,是端到端智驾大模型研发的前置环节,目前拟定的主要用途,是为后者提供训练数据。 但据一位接近比亚迪智驾研发的负责人透露,比亚迪的智驾训练数据有两个问题,一是虽然数量庞大,但重复性高,丰富度不够,不能覆盖所有可能出现的场景;二是数据质量不够高,很多老款车型的技术受限,甚至很多此前上市的比亚迪高端车型,依然无法回传高质量的驾驶数据。 时间方面,汽车像素了解到,比亚迪的世界模型研究项目,最早从去年 8 月开始启动,与端到端大模型研发团队的起步时间相当。随后在去年 9 月,比亚迪重新整合了与算法、大数据相关的多个部门,成立了先进技术研发中心,团队规模超过 500 人。世界模型、端到端两个团队都被归拢在了新成立的研发中心下。 此外,据晚点 Auto 报道,比亚迪智驾总负责人杨冬生内部讲话表示,既要守住电动化的基本牌,还要努力做最先进的智能化,电动化要攻,智能化更要攻。同时,据晚点 Auto 了解,比亚迪的自研智驾方案上车节点就在近期。 💡 联想集团 CEO:人工智能如何为爱而生 近日,联想集团董事长及 CEO 杨元庆发表署名文章《发展「人本智能」,让人工智能为爱而生》。 文中,杨元庆表示,人们在享受人工智能带来的效率红利、工作和生活越来越依赖于人工智能的同时,各种各样的「AI 焦虑」随之而来。因此杨元庆认为,科技企业应该努力的方向应该考虑,如何趋利避害,在推动人工智能提升生产力的同时,有效控制风险,实现安全、普惠、公正和包容,同时打造人人可用、人人受益的「人本智能」。 因此,杨元庆提出所谓「人本智能」,是指在人工智能技术、产品和服务的研发应用过程中,以满足人类需求和谋求人类福祉为首要目标;并且杨元庆强调,要恪守人本底线、提倡人本设计、坚持人本理念,同时「以人为本」去审视人工智能的影响,确保人工智能的发展能够真正惠及每家企业、每个人。 杨元庆还具体建议,要打造混合式人工智能,服务人的需求、保护人的安全,让人工智能普及普惠;杨元庆还提到,让人工智能帮助弱势群体,实现智能向善。最后,杨元庆强调,推动人工智能帮助解决全人类面临的共同挑战。 三星 Galaxy S25 Edge 超薄手机或将 4 月发售 近日,据 9To5Google 报道称,三星高管在发布会后透露,公司旗下 Galaxy S25 Edge 计划在 2025 年 4 月左右发售。 1 月 23 日,三星 Galaxy S25 系列正式发布,而 Galaxy S25 Edge 也一同亮相,该机型因超薄的设计而备受瞩目。新机设计语言与正式发布的 Galaxy S25 系列一样,采用直角中框,传闻机身厚度在 6.5mm 左右。 但目前官方仍没有披露关于这款超薄手机的更多信息,但有消息称其定位介于 Galaxy S25+和 S25 Ultra 之间,售价很可能是 999 美元。 此外,中国质量认证中心已在 1 月 23 日显示,三星旗下 SM-S9370 机型通过国内 3C 认证,支持 25W 充电功率,据悉,该机型为 Galaxy S25 Edge。 百川智能发布国内首个全场景深度思考模型 1 月 24 日,百川智能发布了国内首个全场景深度思考模型 Baichuan-M1-preview。 据官方介绍,Baichuan-M1-preview 模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。 在数学、代码等多个权威评测中,Baichuan-M1-preview 的表现均超越了 o1-preview;而在视觉推理方面,Baichuan-M1-preview 在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等国内外头部模型。 此外,Baichuan-M1-preview 作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型,它还解锁了医疗循证模式,实现了从医疗证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。 一同推出的还有行业首个开源医疗增强大模型 Baichuan-M1-14B,其不仅在 cmexam、clinicalbench_hos、clinicalbench_hos、erke 等权威医学知识和临床能力评测上的成绩超越了更大参数量的 Qwen2.5-72B-Instruct,并且与 o1-mini 也相差无几。 目前,Baichuan-M1-preview 已在「百小应」中正式上线。 阶跃星辰旗下跃问 App 推出「AI 创意板」 1 月 24 日,阶跃星辰宣布,旗下跃问 App 推出「跃问 AI 创意板」,并表示把应用开发的门槛降到最低。 据官方介绍,用户可以完全不会写代码,只需在跃问 App 内使用「AI 创意板」功能,并输入 Prompt,简单描述应用的构想,跃问就能根据用户的想法,自主编写代码,为后者创造一款应用。当应用做好后,用户还可以把它发布出来,转发到朋友圈、小红书等社交媒体。 目前,「AI 创意板」已上线跃问 App。 Hugging Face 最小 AI 视觉语言模型上线,仅 2.56 亿参数 近日,Hugging Face 正式发布两款 SmolVLM 系列的小参数视觉语言模型,官方表示该系列模型为全球最小的视觉语言模型。 据了解,本次 Hugging Face 发布的 SmolVLM 系列模型中,分别为 2.56 亿参数的「SmolVLM-236M-Instruct」和 5 亿参数「SmolVLM-500M-Instruct」两个版本;值得关注的是,官方表示两款模型能在不到 1GB 的 GPU 内存上运行。 官方介绍,2.56 亿的版本能达到 2.2B 模型 80% 的性能,而 5 亿参数的版本更是能达到 90%;SmolVLM 还结合了 ColiPali,检索速度堪比 10 倍大的模型,做到成本更低、速度更快;并采用全新视觉编码器,整体尺寸从 400M 缩小到 93M,但生成分辨率将更高。 此前,Hugging Face 曾于 2024 年 11 月首次推出 SmolVLM 模型。据 Hugging Face 介绍,首版 SmolVLM 模型仅有 20 亿参数,用于设备端推理,其凭借极低的内存占用,在同类型模型中脱颖而出。 目前,两款小参数版本的 SmolVLM 模型的 Demo 版和博客都已登陆 Hugging Face Hub。 全球首款模块化 Windows 掌机 AYANEO 3 正式发布 1 月 24 日,AYANEO 正式发布全球第一台模块化 Windows 掌机 AYANEO 3,并表示「买一台,顶多台」。 AYANEO 3 最大亮点,就是首创支持拆换组合的 Magic Module 自由手柄模块设计,搭配可拆卸 ABXY 键可以实现最多 56 种操作布局,配备两段式霍尔扳机、自研磁悬浮马达和硬件级键鼠模式。 硬件方面,AYANEO 3 同时延续优雅美学和无边框全面屏设计,整机握持手感全面提升,并提供 7 英寸 120Hz IPS 高刷原彩屏和 144Hz OLED 高刷炫彩屏两块旗舰屏幕,以及 AMD Ryzen AI 9 HX 370 和 8840U 双旗舰 CPU 可选,强大散热系统稳定释放 35W 强悍性能,全新 AYASpace 3.0 带来高度自定义的掌机软件体验。 价格方面,AMD Ryzen 7 8840U 版本 16GB+512GB 起步,4,999 元起售;AMD Ryzen AI 9 HX 370 版本 32GB+1TB 起步,8,699 元起售;预售赠送配件周边大礼包,所有 Retro Power 版本额外赠送手柄模块套装。 目前先锋版现已开放预订,首付 2,999 元,发货前补尾款,预计 3 月底按订单顺序开始发货;正式版将于 4 月底联合京东在线上线下现货首发。 电商平台:三百元不到 8 个菜的预制年夜饭热销 近日,临近蛇年春节,年夜饭预订开始火热,而此前不被看好的预制菜,也随着年夜饭的「便车」,开启了一轮热销。 据电商平台显示,三百元不到的年夜饭套餐包含 8 道菜品,包含「鲍鱼佛跳墙」「蜜汁叉烧」等年夜饭常见菜品,商品页面显示已售超 5,000 单,并且页面还显示「24 小时内超百人购买」等提示语。据澎湃新闻报道,某国内知名预制菜企业相关负责人透露,近期公司预制菜销量较好,其中预制川菜最受欢迎。 中国食品产业分析师朱丹蓬受访表示,目前,预制菜行业是冰火两重天。从政策端来说,国家在大力推行预制菜,资本端也虎视眈眈地积极赋能,产业端更是信心百倍地跑马圈地,加快速度。但在消费端,消费者并没有完全接受预制菜,导致做预制菜的餐饮企业如履薄冰。 同时朱丹蓬强调,关键的原因是预制菜没有国家标准,虽然之前发布了两个政策指引,包括预制菜不含防腐剂和全程冷链,但是其觉得这还不够。朱丹蓬进一步表示,如果没有固定的中央工厂,从食品安全、色香味还原度、工艺流程、营养价值等方面来说,预制菜都会大打折扣。 抖音正式上线「打车」服务 近期,抖音的「本地生活」服务持续拓展,悄悄上线了「打车」服务。 据实际了解,抖音的「打车」服务入口较为隐蔽,位于个人主页「我的钱包」内,抖音将该服务与「抖音支付」「手机充值」等高频使用的服务平级归类。 目前抖音「打车」服务仅有高德打车一家网约车平台接入,并显示「更多品牌敬请期待」,提供「特惠快车」「极速拼车」等车型选择,与高德打车基本无异。 微信 WeChat Pay 港币钱包支持内地收款码支付 1 月 24 日,微信 WeChat Pay HK 发文宣布,WeChat 港币钱包开始支持内地扫码支付。 据官方介绍,香港地区用户也可以使用 WeChat Pay 港币钱包,扫内地个人商户的收款二维码进行支付。此前,WeChat Pay 港币钱包支持近 50 个城市的公共交通网络,香港用户到内地各城市搭乘公交地铁,可以使用乘车码进行扫码出行。 数据显示,2024 年香港有 8,191 万人次北上消费,较 2023 年增长 53%。 网易云音乐或将下架 SM 旗下全部歌曲 1 月 24 日,网易云音乐发布《致韩国 SM 歌迷的一封信》,并表示未来会因版权问题而下架 SM 旗下全部歌曲内容。 信中显示,网易云音乐因版权方单方面通知不续约,将于 2025 年 1 月 31 日,全面下架韩国 SM 娱乐公司旗下全部歌曲内容。网易云音乐表示,始终十分珍视这些优秀的音乐作品,也深知这些歌曲对于广大歌迷朋友无可替代的价值,现在网易云音乐方仍在以最大诚意,继续通过多途径、多方面、多渠道的努力,争取版权续约的可能。 此前,2021 年 10 月网易云音乐曾拟向国家相关监管部门,举报投诉韩国 SM 公司坚持独家版权模式。随后,网易云音乐与 SM 娱乐公司于 2022 年 6 月达成合作协议,前者重新获得 SM 旗下全量音乐版权的授权。 据了解,韩国 SM 娱乐公司旗下拥有 Super Junior、少女时代、SHINee、f(x)、EXO、Red Velvet、NCT、aespa 等艺人。 DC 电影《超级少女:明日之女》发布首张剧照 1 月 24 日,DC 工作室联席 CEO 兼新《超人》电影导演 James Francis Gunn Jr. 发布了电影《超级少女:明日之女》首张片场照。 从公布的照片来看,主演米莉・阿尔柯克采用了「超级少女卡拉」的经典金发造型,片场椅还印有本片超人家族的标志性 LOGO,其风格和《超人》的盾形 S 标志保持一致。 据悉,超级少女和超人均为 DC 漫画旗下的超级英雄角色,两人的超能力基本一致,并且都在氪星毁灭后来到地球。但与超人不同的是,卡拉来到地球后已是接近成人的年龄,因此故事走向与超人的差别较大。 电影将由克雷格・吉勒斯佩执导,米莉・阿尔柯克、杰森・莫玛、马提亚斯・修奈尔、伊芙・雷德利、大卫・克朗姆霍茨等参与主演,预计于 2026 年 6 月 26 日北美上映。 ✨ 是周末啊!One Fun Thing |《海贼王》× LEGO 近日,LEGO 乐高宣布,将于 Netflix 版的《海贼王》IP 联名,推出乐高航海王系列产品。据目前网传信息显示,乐高海贼王系列预计将包含 5 款以上的积木套装,计划于 2025 年 8 月陆续上市。 消息宣布后,《海贼王》原作者尾田荣一郎也回应称,自己一直非常喜欢乐高,自己的工作室里至今还推着数十箱的没来得及组装的新品乐高模组,并表示 25 年前《海贼王》动画开播时,就期盼着能够被乐高盯上。 周末看什么 |《我爱你!》 电影《我爱你!》是由倪大红、惠英红领衔主演,叶童、梁家辉特别出演的爱情电影,于 2023 年 6 月 21 日在中国内地上映。 该片改编自韩国漫画家姜草的原创同名漫画,讲述平凡人生中的两对老人生命尽头纯粹而又热烈的爱情故事。 截至 2024 年 3 月 8 日该片收获票房 4.28 亿元,2023 年 6 月 10 日获 2023 年微博之夜「年度关注影片」,2024 年 1 月 13 日获「微博年度口碑电影」。 买书不读指南 |《常客》 《常客》是一部由好妹妹乐队的秦昊所著的摄影作品,书中纪实城市影像,首次以菲林创作跟每一个远离家乡的年轻人对话。 在音乐之外,好妹妹秦昊首次将隐秘情感透过 200 余幅胶片呈现,映像出每个人与家乡既熟悉又陌生的关系,也书写着一个人与一座城相互塑造的真意。 这本书始于多年前的一次拍摄计划,秦昊以寻访奶奶姚女士年轻时的足迹为出发点,祖孙两代视角,探访家乡重庆、寻找数十年间奶奶参与的城市建筑,呈现出强烈的时代故事感。 游戏推荐 |《致命公司(Lethal Company)》 《致命公司(Lethal Company)》画质并不是顶级,甚至可以说有点「破烂」,但独特的游玩体验让其登上今日的「游戏推荐」。 游戏中,玩家可以与小伙伴多人联机,在不同地点处去收集破铜烂铁,最后到一个阴森的废品回收站换取钱财,最后完成通过。看似简单的游戏模式,但随着类 SCP 怪物、阴森模糊的色调、配上 90 年代沙盒游戏的质感,让整个游戏氛围瞬间恐怖,而队友的尖叫与戛然而止的「死亡」,在游戏中形成强烈的反差和紧张感。 虽然该游戏目前还未汉化,但与朋友一起尖叫、并肩作战的游戏模式,令《致命公司》依然十分值得游玩。目前该游戏仅支持 Windows 平台。 制糖工厂推出 AI 充电管家小电拼 Pro / Ultra 制糖工厂于 1 月 6 日上线 AI 小电拼,这是继贴贴线、细雳线的突破性创新后,于 2025 年首发推出的颠覆式产品。 AI 小电拼定义为一台充电电脑,是为个人计算设备打造的电能栈,目标成为每个用户的 AI 充电管家。AI 小电拼包含小电拼 Pro 和小电拼 Ultra 两款全新产品,这是继小电拼全球旅行版上市后,小电拼家族的再次拓展。 它拥有与小电拼全球旅行版相同的体积和拆分结构设计,家庭旅行两用;总功率达 160W,5 路独立电路实现四口 140W 自由盲插,并通过 FluxAI 自由流®️超级分流技术,按需定供实时动态调控;它支持全模 OTA 云端升级,持续兼容未来充电协议(已率先支持 2024 年 11 月 9 日发布的 USB PD R3.2 V1.1 标准);内置 FPGA 芯片,预留未来更新空间。 它能通过 NFC 一触达跳转微信小程序,通过软件操控定义充电细节,实现前所未有的透明化充电体验。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。