EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
从网线到人生攻击?项立刚批罗永浩“干啥啥不成”,网友吵翻了
最新消息: 罗永浩称电信网速问题已解决:现在网速快的让人有些惶恐 “本来只是怀疑这个人是智障,现在基本确定了” 罗永浩一句转发,让一条普通的宽带吐槽,彻底变了味。 12月20日晚,他怒怼通信大V项立刚的这句话,把两人推上了风口浪尖。 而就在今天下午一点,项立刚的一篇长文《我为什么要评论罗永浩?》,让这出戏码再度升级,从“网速之争”硬生生吵成了“人生成败”的价值观对决。 图源:小雷截图 谁也想不到,整件事情的起因,只是一根网线。 近日罗永浩在朋友圈吐槽,说搬到上海后办的独享千兆宽带,大半年实际网速常不到百兆,反复报修也只管三五天。 图源:网络 12月19日晚,上海电信回应称网速问题可能与户型、路由器等有关,可免费检测。小雷本也以为这事会以“技术原因”翻篇,没想到,真正的“正片”是项立刚的点评。 作为通信行业专家,他提出几个问题:怀疑罗永浩分不清MB和Mbps单位,质疑家庭用不可能有每月3万的独享千兆宽带,推测是路由器问题,还补了句“做过手机不该缺这常识”。 正是最后这句关于“常识”的补充,彻底惹毛了罗永浩,于是就有了开头的怒怼。争论瞬间从技术层面,跳到了人身攻击。 项立刚迅速长文反击,言辞激烈,直指罗永浩“折腾半辈子干啥啥不成”、“心比天高命比纸薄”,断言其除了直播带货外一事无成,甚至劝他“信命”。 他更扬言要把罗永浩作为“创业失败”的典型案例分析,列出了从“缺少爱国情怀”到“缺乏技术理解”等六条“罪状”。 图源:小雷截图 最后也是越说越激动,并认为老罗的激烈反应恰恰说明“到了半百的年纪,很难有作为了”的焦虑。 更绝的是,项立刚宣布要把罗永浩当作一个经典的“创业失败案例”放进自己的课程里,列了六条“失败原因”,从“缺少爱国情怀”到“缺乏技术理解”... 图源:小雷截图 有意思的是,正当双方互喷正酣时,罗永浩的宽带问题解决了。12月20日深夜,上海电信排查出是光纤故障,修复后速率达标。 如果故事停留在昨晚,那还只是一场常见的网络口水。但项立刚在12月21日,也就是今天下午的更新,把这次对喷的立意拔高了一个维度。 他发表了题为《我为什么要评论罗永浩?》的长文,多方面回应为何揪着罗永浩不放。 他说自己是行业的观察者,观察分析研究,在一定程度上他是绕不开的,所以评论罗永浩。 还强调自己2022年就预判罗永浩AR创业会失败,当时有行业大佬把文章转给他,可惜没被采纳。如今AR项目无下文,正好印证自己的判断,并且罗永浩绝对反驳不了。 图源:小雷截图 项立刚还吐槽罗永浩创业是“花投资人的钱博自己的名”,直言要站出来阻止罗永浩“污染了创业环境”。 图源:小雷截图 不过虽然项立刚的评论看起来很有逻辑,但立马就招来了网友质疑:“创业本就九死一生,项立刚自己又做出过什么了不起的产品?” 面对项立刚如此犀利的质控,罗永浩目前尚未回应,但博主科技新一站也站出来为罗永浩说话:“可以不喜欢老罗这个人,但嘲笑他做企业不成功真没资格,老罗已经很成功了。” 后面老罗转发评论也算变相回应:我几年就做出一个盈利的上市公司,只是现在志不在赚钱,现在居然有这么多人说我做企业不行,还要来教我赚钱。 图源:小雷截图 在小雷看来,现在这场骂战应该差不多结束了,毕竟两个没什么交集的人,再吵下去也争论不出个什么结果。现在都是网友在吃瓜,至于那个最初的导火索——宽带网速,早就没人在意了。 值得一提,近期罗永浩似开启“疯狂吐槽模式”,除了宽带,还刚吐槽过大金空调售后,称每年换滤网加清洗要15000元,连他这收入超99%中国人的都觉得有压力。 看来最近老罗的心情确实不太好,不过在月底就是他首次返回科技舞台——「罗永浩的十字路口」之年度科技创新分享大会(2025),希望他能调整好状态,打打那些看衰他的人的脸。 对于项立刚平均罗永浩创业的,大家有什么不同的看法吗?评论区聊聊~
熊孩子徒手掰断SSD,价值一个亿!今天这个瓜,全网吵疯了
这应该是最近吃到的,最扎心的瓜。 前几天有个开电脑维修店的越南网友发帖,分享了自家 10 岁儿子的战绩。 整箱三星 512GB SSD,一个不留神被小孩哥拿做耐久性测试了。 不是泡水,不是摔坏,而是徒手逐片掰断了整整 50 片硬盘。 楼主哭诉自己是「世界上最惨的爹」,还表示「不把这个逆子揍一顿都说不过去」。 网友评论:看来爸爸在儿子身上也做了耐久性测试。 从分享的照片来看,这批 SSD 型号是三星 PM991a 512GB M.2 2280。 因为不是面向普通消费者销售的版本,所以很难找到准确的价格。 从相关的测试数据来看,PM991a 的读速大约是 3500MB/s。 电商平台上找规格接近的,是三星 980。 官方店卖 699,还没货。 而第三方商家每片价格,大概在 600 左右。 换句话说,小孩哥啪啪一通操作,把价值约 3 万多人民币的硬盘全搞坏了。 换算回当地的价格,超过 1 亿越南盾。 啧啧,一个小目标就这样没了。 不过也有眼尖的机友发现,小孩哥的操作似乎没有伤及闪存颗粒。 那理论上,是不是拉直就没事儿了? 甚至直接插在电脑上也能用? 讲真,有点想法,但不多。 因为从图片来看,硬盘的 PCB 板全都严重变形弯折了,估计连带着内部的线路,也已经断裂了。 就算少部分可以抢救回来,估计放到二手市场也得打骨折。 比较合理的处理办法,可能是拆闪存颗粒回血了。 有一说一,要是以前,这就是普通的熊孩子捣蛋事件。 但放到现在这个时间点,这瓜真的有够扎心了。 给本就缺货的 NAND 市场雪上加霜了属于是。 更有网友评论,说小孩哥「凭一己之力加速了 NAND 闪存危机」。 前两天,金士顿 SSD 的业务经理就在一档播客里表示: 「未来NAND 闪存短缺将明显加剧,SSD 价格将在当前基础上进一步上涨。」 自 2025 年 Q1 以来,NAND 价格就已经飙升了 246%,其中有很大一部分上涨,还是在短短 60 天以内发生的。 他甚至直言:「在这行干了 29 年,没见过这么癫的涨价速度。」 至于咱们普通消费者,他的建议是: 「如果你有买存储类产品的需求,现在就入手,因为 30 天后会更贵,再过 30 天又会再涨一轮。」 NAND 颗粒缺货,现在也已经在手机、平板等设备的价格上体现出来了。 近半年发布的新机,全都在肉眼可见的涨价。 甚至有爆料称,一些已经发布的中端机,已经扛不住压力,后续可能会涨价。 比如前几天小米的小米平板 8、8 Pro,以及 REDMI Pad 2,都已经悄咪咪调了价,涨价幅度在 100~200 元的区间。 明年的一些新机,也会针对内存涨价做调整。 部分中端机可能会取消 1TB 版本,一些不打住打性能的终端机,或许会把入门版改回 8GB 内存。 那些什么 24GB 超大内存的,更是想都别想了。 今年这波内存和闪存涨价,其实主要是 AI 热潮导致的。 如今搞 AI 的公司越来越多,他们就得采购大量的企业级内存/闪存,来架设服务器。 关键是他们专门挑高性能的内存/闪存来买。 比如咱们一般人,都是买 2D DRAM 内存,TLC NAND 闪存,这些中端产品就能满足需求。 AI 厂商只买高端的 HBM、QLC NAND,价格也贵很多。 所以供应商在 AI 企业那里赚到的利润,也更大。 这简直是送上门的肥猪肉哇。 所以不少供应商的产能,基本都被 AI 企业包圆了。 比如英睿达就已经宣布退出消费级市场,专门给企业客户供货。 而留给普通消费者的内/闪存供应量,自然变少了,价格也被抬高。 手机厂商辛苦忙活一轮,最后发现钱都被内存供应商赚走。 更离谱的是,据说有些小厂,已经打算在库存机里拆内存,给新机用了。 目前大部分机构都预测,起码到 2027 下半年,AI 热潮散去,存储价格才会回归平稳。 想等降价,那更是 2028 年之后的事儿了。 可能有机友要说,既然面向消费者的内存供应这么缺,为什么没有厂商打逆风局,专门做消费者市场? 一方面,AI 客户那边给的确实太多了,需求也大,相当于躺平也能赚。 另一方面,加生产线也需要时间,起码 2 年后才能开始投产,到时候存储的价格都降下来了。 以前有几波内存降价,就有供应商吃过这样的苦头。 所以嘛……面对这波内存、闪存涨价,不管是手机厂商还是咱们普通消费者,大家都没招了。 只能说,假如不是刚需的话,这几年建议先忍忍。 真要买硬盘之类的,就且买且珍惜吧。 说不定,明年回过头来看,现在可能是内存最便宜的时候了…… 好猛的小孩哥
MacBook Pro明年重磅升级:首发全新OLED+M6芯片
快科技12月22日消息,最新消息指出,苹果将于明年对MacBook Pro进行全面改版,这款重新设计的MacBook Pro有五大关键升级点,具体如下: 1、OLED显示屏 2024年苹果在iPad Pro上引入了OLED屏,明年苹果将OLED应用到MacBook Pro上,带来更高的亮度、更好的对比度和更出色的色彩表现。 据悉,苹果全新MacBook Pro将采用与iPad Pro相同的串联式OLED显示技术。众所周知,单层OLED有一层红、绿、蓝色层,而双层串联OLED则有第二层RGB色层,两层串联堆叠可以提高屏幕亮度,同时延长使用寿命。 除了升级OLED,苹果可能会取消刘海设计,转而采用更小的挖孔屏形态。值得注意的是,该报告并未明确说明MacBook Pro屏幕是单挖孔还是说类似iPhone的灵动岛,但无论如何,改版后的MacBook Pro屏幕开孔都不会像现在这么大。 2、更轻薄的设计 苹果2026款MacBook Pro采用更轻薄的设计。 3、触摸屏 越来越多的证据表明苹果正朝着触摸屏方向发展,供应链分析师郭明錤认为,触摸屏功能很可能会在2026年MacBook Pro中成为现实。 4、支持蜂窝网络 预计苹果2026款MacBook Pro支持蜂窝网络,此前马克·古尔曼称苹果将于2026年为Mac配备自研调制解调器,这意味着MacBook Pro也将支持蜂窝网络连接。 5、M6芯片 全新改版的MacBook Pro首发M6系列芯片,预计M6将是苹果首批采用台积电2纳米技术的产品,同期的iPhone A20芯片也将采用该工艺。 可以确定的是,MacBook Pro将首发M6 Pro和M6 Max芯片,至于苹果是否会推出搭载M6芯片的基础款14英寸MacBook Pro,目前还无法确定。之前马克·古尔曼称此次改版仅限于M6 Pro和M6 Max机型。 6、发布日期 全新MacBook Pro最快会在2026年下半年亮相。
MiniMax PK智谱:港交所的正面交锋
国内大模型公司稀宇科技MiniMax(以下简称“MiniMax”)于2025年12月21日晚在港交所公示招股书,距离智谱披露招股书仅相隔48小时。 两家被外界普遍视为最具潜力的国内大模型公司,几乎同时走到资本市场门口。但至于究竟谁会是“全球大模型第一股”?答案暂未揭晓。 从MiniMax披露的招股书来看,前两年收入增长曲线尤为陡峭。2023 年和 2024 年,公司营收分别为 346 万美元(约合人民币 2436 万元)和 3052 万美元(约合人民币 2.1 亿元),同比增长 782.08%;截至 2025 年 9 月 30 日,MiniMax 实现营收 5344 万美元(约合人民币 3.77 亿元),同比增长174.76%。 需要注意的是,与智谱的招股书采用人民币口径不同,MiniMax以美元作为主要计量单位。这一差异更多反映的是,两家公司主要经济活动所在市场的不同。其中,MiniMax的收入以海外为主,据招股书披露,公司海外与国内营收占比约为7:3;相比之下,智谱的收入来源则主要集中在国内市场。 在几乎同一时间窗口,MiniMax与智谱将两套完全不同的大模型商业叙事交到港交所手中。 下文中,笔者将基于两家公司已公示的招股书,从营收、净亏损、毛利率与现金流四个核心维度,对二者进行对照分析,尝试厘清这场“正面交锋”背后的结构性差异。 四个数字,看清两家大模型公司分别站在什么位置? 从招股书披露的数据来看,MiniMax 与智谱在营收规模与增长速度上均呈现出高速扩张的特征。但由于智谱成立于 2019 年,而 MiniMax 成立于 2022 年 6 月,后者在招股书中并未披露 2022 年的实际营收数据,二者在时间基数上并不完全一致。 首先,从营收表现来看,两家公司在过去两年均实现了高速增长。 2024 年,MiniMax 的营收同比增长 782.08%;相比之下,智谱在 2023 年和 2024 年的营收同比增长率分别为 116.93% 和 150.85%,截至 2025 年 6 月 30 日,营收同比增长进一步扩大至 325.03%。 但仅从增速并不足以解释两家公司的真实位置。从营收来源结构看,二者所处的市场环境并不相同。 MiniMax 成立第二年便实现营收较上一年的 7.8 倍增长,主要得益于 AI 原生产品在 C 端的快速放量。根据其招股书披露,2024 年 AI 产品收入占比已达到 71.4%,而 2023 年这一比例仅为 21.9%;在 AI 产品中,Talkie/星野贡献了 63.9% 的收入。(虎嗅注:Talkie 为 MiniMax 旗下社交产品“星野”的海外版本) 相比之下,智谱在成立初期的收入主要来自 私有化部署,面向 ToG 与大型 ToB 客户。这也使得其在绝对收入规模上显著高于 MiniMax。 从营收角度看,MiniMax 更像是一家依赖模型能力和产品规模快速放量的公司,而智谱则更接近工程化与项目制驱动的模式。 其次,从亏损角度来看,在高速增长的同时,MiniMax 与智谱均处于明显亏损状态。这并非个案,而是当前大模型行业的普遍特征。 对于科技企业,尤其是基座模型公司而言,研发投入动辄以十亿元计;在算力资源与高端人才持续紧张的背景下,研发成本往往呈指数级增长。对志在成为“全球大模型第一股”的公司而言,资本市场的耐心几乎是前提条件。 MiniMax 披露,2023 年和 2024 年年内亏损分别为 2.69 亿美元(约合人民币 18.94 亿元)和 4.65 亿美元(约合人民币 32.74 亿元)。其中,2023 年亏损约为当年收入的 78 倍,2024 年降至 15 倍,净亏损同比下降 80.41%。 截至 2025 年 9 月 30 日,公司年内亏损进一步扩大至 5.12 亿美元(约合人民币 36.05 亿元),但亏损仅为收入的 9 倍,净亏损同比下降 63.26%。 智谱方面,2023 年和 2024 年年内亏损分别为 7.87 亿元和 29.58 亿元,对应当年收入的 6 倍和 9 倍,净亏损同比增长 49.6%;截至 2025 年 6 月 30 日,年内亏损为 23.58 亿元,亏损约为收入的 12 倍,净亏损同比下降 55.10%。 从绝对数值来看,两家公司亏损规模与收入体量并不完全可比;但从结构上看,这些亏损更多反映的是 对未来商业化路径的提前投入,而非单纯的经营失控。 值得注意的是,两家公司在组织效率上存在明显差异。MiniMax 截至 2025 年 9 月 30 日仅有 385 名员工,其中研发人员占比 73.8%;而智谱员工规模约为 1000 人,研发人员占比亦在 70% 以上。 第三,从毛利率的角度,相比营收与亏损,毛利率则更接近于判断商业模型是否成立的“底线指标”。 MiniMax 披露,其 2023 年和 2024 年毛利率分别为 -24.7% 和 12.2%;截至 2025 年 9 月 30 日,毛利率提升至 23.3%,呈现出持续改善趋势。 智谱方面,在报告期内毛利率始终维持在 50% 左右,并在不同年度保持相对稳定。 从结果看,两家公司并未出现长期的单位经济倒挂,但毛利率差异本身,清晰反映了其商业模式的结构性差异。 MiniMax 的毛利主要来自 AI 原生产品与“开放平台及其他基于 AI 的企业服务”。其中,AI 原生产品包括 MiniMax、海螺AI、MiniMax 语音及 Talkie/星野,主要面向 C 端用户;“开放平台及其他基于 AI 的企业服务”则对应按 API 接口收费的小 B 客户。 而在智谱的语境中,这一 API 收费模式更接近其 云端部署(MaaS);智谱的私有化部署,则主要指通过项目交付的方式,向 G 端及大型 B 端客户提供模型服务。 具体来看,MiniMax 更偏重 C 端产品规模化,而智谱更偏重 B 端与 G 端工程化。根据智谱招股书,截至 2025 年 6 月 30 日,其私有化部署收入占比约为 82%;而根据 MiniMax 招股书,截至 2025 年 9 月 30 日,其 AI 原生产品占比为 71.1%,“开放平台及其他基于 AI 的企业服务”占比为 28.9%。 最后,对于尚未盈利的大模型公司而言,现金流状况往往比短期利润更具现实意义。 MiniMax 在招股书中披露,公司自成立以来累计融资超过 15 亿美元,报告期末账上现金约为 11 亿美元。换言之,MiniMax 成立至今累计消耗资金约 5 亿美元。 相比之下,智谱并未在招股书中单独披露详细的现金流数据。 作为对照,OpenAI 这一全球大模型标杆企业,自成立以来累计投入约 400 亿至 550 亿美元。 总体来看,MiniMax 与智谱在几乎同一时间走向资本市场,但其财务结构所反映的市场定位与路径假设截然不同。二者并非简单意义上的竞争对手,而是代表了两种完全不同的大模型公司形态。 这当然不是“谁更好”的问题,是两家公司首次被放置在同一套公开市场框架下,接受并列比较与讨论。 港交所如何理解两类大模型公司? 两家公司的基因本就不同。 智谱创始人唐杰为清华大学教授,核心创始团队亦多出自清华体系。无论是在技术路线还是组织气质上,智谱都更偏向研究导向——从成立之初坚持开源策略,便可见一斑。相比之下,MiniMax 创始人闫俊杰出身于商汤科技,更强调产品落地与商业化效率,这在一定程度上也体现在其更高的人效与更集中的资源配置上。 但在大模型赛道上,两家公司都并未停留在各自的“舒适区”,而是完成了不同方向上的自我突破。 智谱在坚持开源研究的同时,逐步建立起商业化闭环;而 MiniMax 则明显区别于商汤过往以 B 端为主的路径,选择了一条更强调 C 端规模化收入 的路线。 基于当前的商业模式与收入结构,两家公司的发展轨迹,正在逐渐走向分化。 无论是营收来源、亏损结构,还是毛利率与现金流状况,两家公司都很难被简单归为同一类大模型公司。 这也意味着,当它们几乎同时站在港交所门口时,资本市场面对的不是一道简单的选择题,而是两种不同的大模型公司形态,如何被同时理解与定价的难题。 从财务结构来看,MiniMax更接近一套产品驱动的规模假设。 其收入快速放量,主要来自面向C端的 AI 原生产品。其中,Talkie/星野在海外市场的增长,使得 MiniMax 在成立第二年便实现了接近8倍的收入增长。据招股书显示,2023年公司AI原生产品的平均MAU约310万,到了2024年实现超六倍增长至1910万。截至2025年9月30日,其MAU已达2760万增长。 但值得注意的是,虽然整体趋势上是稳步增长,但从收入结构上看,2025年以前其MAU增长主要依赖于Talkie/星野,等到了2025年,由于海外政策法规调整原因,Talkie/星野收入和用户数骤然下降,但AI产品平均MAU稳步增长,则意味着包括MiniMax、海螺AI和MiniMax语音在内的应用均实现大幅上涨。 与此同时,随着收入基数扩大,其净亏损率在过去两个报告期内持续收敛,毛利率也逐步由负转正。 在这一模式下,模型更像是产品能力的一部分,商业化路径依赖的是用户规模、留存与持续付费能力。只要产品能够不断放大使用规模,模型能力的边际成本便有可能被摊薄。 但这一路径的约束同样明确:一方面,对算力成本的高度敏感,使得增长必须与成本控制同步发生,另一方面,一旦产品放量速度放缓,模型能力的高投入便可能重新放大亏损。 相比之下,智谱所呈现的,更接近一套工程化与基础设施并行演进的假设。 其收入主要来自 ToG 与大型 ToB 客户的私有化部署,毛利率长期维持在较高水平,显示出较强的定价能力与项目交付能力。但这一模式也天然意味着扩展性受限,收入增长节奏与项目周期高度相关。 从第一部分的数据可以看到,智谱的亏损并未像 MiniMax 那样快速收敛,而是仍处在高研发投入阶段。这意味着,其核心假设并非依赖短期规模放量,而是押注于模型能力成熟后,通过云端与 API 实现结构性转向。 换言之,私有化部署更像是智谱的现金流“地基”,而真正被寄予长期想象空间的,是其尚在放大的 MaaS 与 API 能力。 有接近智谱方面的知情人士向虎嗅透露,智谱计划在未来几年逐渐将私有化部署与云端部署的比例控制在50%-50%。 从港股的角度来看,这两种路径并不存在天然的优劣之分。 它们的差异,本质上是对不确定性来源的不同选择:MiniMax 承担的是产品规模是否可持续扩张的不确定性;智谱承担的是模型能力能否在未来实现平台化释放的不确定性。 资本市场并不擅长判断哪一种路径“必然成功”,但擅长为不确定性划定区间。在笔者看来,第一家上市的大模型公司,未必会成为最终的赢家,却会率先提供一套可被反复验证、修正甚至推翻的定价参照。 从这一意义上来讲,MiniMax与智谱几乎同时走向港交所,本身就具有标志性意义:大模型公司开始不再只是技术叙事或融资故事,而是被迫进入一套公开、透明、可对照的评价体系之中。 这场“正面交锋”的结果,或许不会立即给出答案,但它将决定,未来资本市场更愿意为哪一类不确定性买单。 尚未闭合的商业闭环,与2026大变局 需要指出的是,从目前披露的商业模式与收入结构来看,无论是智谱还是MiniMax,都尚未形成一个足够稳固、可长期复制的商业闭环。 对智谱而言,其当前仍高度依赖私有化部署作为主要收入来源,而寄予长期想象空间的,则是通过 MaaS 与 API 实现的规模化增长。但这一转向本身,也面临着两重现实约束。 一方面,大模型价格战正在持续拉低 token 的单位回报率。随着模型能力趋同、推理成本持续下降,API 定价的下行压力仍在放大,token 的规模增长,并不必然等同于收入质量的同步改善。 另一方面,云厂商全面下场推进 MaaS,正在改变整个 API 市场的竞争格局。尽管企业在选择 MaaS 平台时并非“非此即彼”,但头部云厂商在渠道、算力与客户触达层面的优势,仍可能在一定程度上分流 token 的调用量与消耗量。这意味着,智谱所押注的云端规模化路径,并非一条低竞争强度的赛道。 相比之下,MiniMax 在 C 端商业化上的进展,整体看起来要更为乐观。但这一模式同样建立在一组更为苛刻的前提之上。 C 端产品要实现真正的规模化增长,必须依赖持续扩大的用户基数与稳定的留存表现。而 MiniMax 当前约 70% 的收入来源于海外市场,这也意味着,其商业模型对外部环境的敏感度显著高于以国内市场为主的公司。无论是地缘政治、监管政策,还是海外平台规则的变化,都可能对其用户增长与收入节奏产生放大效应。 也正是在这一背景下,两家公司在招股书中所强调的核心指标,呈现出明显差异。 MiniMax 更强调 C 端产品的月活用户数与收入规模;而智谱则反复强调 token 的调用量与消耗量。这并非表述习惯的不同,而是其各自商业模式所能被量化、也最需要被资本市场理解的关键变量。 展望 2026 年,另一项不容忽视的行业变量,是 DeepSeek R2 的潜在影响。 对于智谱而言,R2 的发布,短期内可能会对其私有化部署形成直接冲击,尤其是在价格敏感型客户中,部分需求可能被更低成本的开源模型替代。 而对 MiniMax 来说,R2 的影响路径则更加直接:一旦高质量、低成本的开源大模型在 C 端形成规模效应,其核心大语言模型产品的月活增长,势必面临更激烈的竞争。 从更宏观的角度看,DeepSeek R2 并非针对某一家公司的对手,而更像是一次行业层面的压力测试: 它将迫使所有仍在坚持预训练的大模型公司,重新回答一个问题,当模型本身的稀缺性下降,价值究竟应当如何被重新定义?
阿斯麦EUV光刻机实现纳米孔全晶圆级制造,推动分子传感技术发展
IT之家 12 月 22 日消息,比利时微电子研究中心(IMEC)已成功利用阿斯麦(ASML)最先进的极紫外光刻(EUV)设备,实现了纳米孔的全晶圆级制造。阿斯麦公司公关负责人将此称作其公司设备“一项出人意料的卓越生物医学应用”。鉴于纳米孔为分子传感技术开辟的广阔前景,这项突破或将成为该领域的重要进展。 据IT之家了解,纳米孔的特性在生物医学领域极具研究价值。从名字不难推断,纳米孔本质上是一种微小的孔道,直径仅为数纳米。若用更通俗的表述解释:这类孔道的直径约为人类头发丝的万分之一。 如此微小的孔道有何用途?基于分子与纳米孔的相互作用原理,其可被应用于生物医学传感器。纳米孔检测技术的核心原理如下: 测量流经纳米孔的离子电流; 当分子穿过孔道时,会使电流产生波动,而波动特征可反映出分子的尺寸、结构、电荷属性及相互作用方式; 借助这种独特的电信号特征,就能以高灵敏度区分不同类型的分子。 通过这种方式,经极紫外光刻技术制备的纳米孔,可充当生物医学传感的“分子关卡”,实现对病毒、蛋白质、脱氧核糖核酸(DNA)等单个分子的检测与识别。这一特性对于分子的精准鉴定与分析至关重要。此外,比利时微电子研究中心指出,调整固态纳米孔的尺寸,还可拓展其在过滤技术与分子数据存储领域的应用场景。 为何要采用极紫外光刻设备?现有纳米孔制备方法存在速度慢、局限于实验室环境、成本高昂等缺陷。而比利时微电子研究中心的论文表明,其已成功在整片 300 毫米晶圆上,制备出直径低至约 10 纳米的高均匀性纳米孔。这项兼具量产化、高精度与可重复性的突破,有望终结纳米孔传感器技术迟迟难以落地的困局。
网易《逆水寒》手游迄今为止“最贵”版本12月26日上线
IT之家 12 月 21 日消息,网易《逆水寒》手游官宣将于 12 月 26 日迎来跨年版本,这是该游戏迄今为止“最贵”版本,玩家将踏入宏大西域,沉浸式感受敦煌文化。 在新地图【敦煌】中,玩家将沉浸感受“丝路风华与佛国秘韵交织的史诗画卷”。官方介绍称:“此地绝非太平之所 —— 西夏官兵盘查森严,党项商团垄断市井,玉门商会苦苦挣扎,而无相寺的钟声下,藏着无数未解的谜团。” 新正传剧情【风烟万里敦煌道】中,百姓赋税沉重,商路凋零,战火阴影下,唯有神佛可寄微愿。玩家的选择,不仅关乎个人使命,更牵动边关黎庶的命运。 12 月 26 日版本更新后,【风烟万里敦煌道】正传剧情全面开放。 《逆水寒》手游购买了经典纪录片《河西走廊》主题曲《河西走廊之梦》的版权,将其融入游戏世界。完成任务后,玩家将在游戏中获得这首歌曲。 完成任务,玩家还将获得独珍装备【天野盟・霜枫令】、外观配饰【寒月笼沙】【旋醉纱】、舞蹈特效【霓裳胡旋・特效礼盒】等奖励。 ▲ 配饰【寒月笼沙】 ▲ 配饰【旋醉纱】 ▲ 舞蹈特效【霓裳胡旋】 为迎接西域新篇章,《逆水寒》邀请了顶尖艺术家组建“国风天团”之西域主题特别阵容,IT之家附介绍如下: 首先,特别感谢敦煌研究院的悉心指导,让我们在艺术创作中,得以秉持严谨之心,无限贴近那座令人心驰神往的千年圣殿。 在跨年演唱会中,由佟睿睿、唐诗逸、杨峥等联袂,将敦煌飞天的千年神韵融入虚拟舞台的演出中,同时也是春节全新神秘流派的重磅预告; 音乐层面,作曲家陈致逸谱写多支敦煌主题乐章,勾勒大漠苍茫与西域神秘; 剧情方面,由北京舞蹈学院古典舞教授、中国知名敦煌古典舞大师史敏教授编创胡旋舞,由青年舞蹈家黄路霏进行动捕演绎,于新主线中再现古丝路胡旋舞的翩跹风华。 同时,我们又邀请到了曾参与过敦煌壁画修复工作的李晓洋老师担任壁画修复顾问,沉浸式展现修复工作的严谨与匠心。 在新主线中,一支由史敏教授编创、黄路霏演绎的胡旋舞,已被还原于剧情之中。这支胡旋舞的动作编排,溯源自敦煌莫高窟 112 窟反弹琵琶的壁画细节、220 窟《药师经变图》及白居易《胡旋女》《乐府杂录》等史料,结合了文献、壁画与丝路文化考据,还原了古籍中胡旋舞的形态与神韵。 12 月 25 日,由两位大师共同演绎的真人舞蹈 MV《霓裳胡旋》将正式上线,同时,由逆水长琴原创词曲、古风歌手小爱的妈演唱的同名宣传曲《霓裳胡旋》,也将全平台同步上线。 在《逆水寒》的敦煌探索与支线任务中,玩家将沉浸式体验宋朝时期这座丝路重镇独特的人文风貌。 在“水月梵音”支线里,玩家能看到百姓们几十年如一日地朝拜水月观音像,香火寄托着对平安归家的期盼。玩家将遇到传说中默默守护月牙镇百姓的歌乐天,携手以音破妄,守护这一方沙海。 在“照夜传薪”支线里,玩家将探访莫高窟,在壁画文卷之中,深入了解敦煌文化重要的传承者 —— 守窟人。他们以血肉之躯守护敦煌千年的呼吸,保护壁画不受风沙的侵蚀。玩家将深入他们的回忆,一起见证文物的保护与修复,以及敦煌文明的薪火相传。 在新版本寻找敦煌文物的支线剧情中,游戏官方邀请到了曾参与过敦煌壁画修复工作的李晓洋老师,来担任逆水寒壁画修复顾问。 此外,《逆水寒》2026 跨年演唱会 ——《最美的相逢 2026》虚拟演唱会也将于 12 月 26 日举行,官方今日宣布将以一首来自张韶涵的金曲《隐形的翅膀》作为压轴献礼。“当歌声响起,每一位玩家的力量会汇聚到舞台中央,化作歌者的星光羽翼。”
蚂蚁数科的AI深潜与RWA远航
2024年3月,蚂蚁集团科技商业化板块蚂蚁数科,开始独立面向市场运营。而蚂蚁数科独立之后的第一任CEO,则是蚂蚁技术老兵赵闻飙。 上任伊始,赵闻飙就对蚂蚁数科的核心战略和业务板块进行了梳理,明确要做企业数字化同路人。 独立运营一年后,蚂蚁数科发生了哪些变化? 光锥智能在梳理近一年的动作之后发现:今年的蚂蚁数科,持续向外找答案,探索科技toB服务的新商业模式,并聚焦在企业级AI服务领域和Web3(主要是RWA,真实世界资产通证化)。 落地层面,蚂蚁数科一方面“向外输出技术能力”:通过企业级AI服务,帮助企业突破内部效率瓶颈,实现“外部技术内化”的提效。 另一方面“向外激活资产交易效率”:借助RWA技术,将区块链能力向全球实体资产场景渗透,打破企业资产流通的地域与信任边界,让工厂设备、能源机组等“沉默资产”在全球链上市场流动。 在这套“双向外扩”的战术下,蚂蚁数科帮助企业告别内卷式升级,驶向数字化深水区。 伴随着AI+Web3两大业务板块的发展,蚂蚁数科也更加坚定地走向全球化,成为“向外找答案”的直观表达。 今年4月,蚂蚁数科海外总部落地香港,并相继在海外陆续上线Layer2区块链Jovay平台、智能体开发平台Agentar等。 未来,在蚂蚁数科的商业营收中,海外市场营收占比或将逐渐加大。 怎么做好企业级AI服务? 过去的2024年,AI行业“百模大战”,写诗作画,创意生产力尽显。面对AI行业的众多诱惑,蚂蚁数科决定重点押注AI to B,做好企业AI服务。 这也是CEO赵闻飙的决定。他自2016年加入蚂蚁集团,先后构建了支付宝和蚂蚁集团的智能风控体系,同时带领团队围绕可信AI、安全大模型等关键技术持续攻坚。 这些在集团淬炼的“技术基因”,如今正在蚂蚁数科的企业级AI服务中显现。 弱水三千,只取一瓢,需要的是战略定力。 此前,蚂蚁数科已经积累了众多技术,并逐渐形成了PaaS平台SOFAStack、应用开发平台mPaaS、隐私计算平台摩斯等多款产品。 这三款产品诞生初期,都是为满足蚂蚁集团内部业务的需求,尽管后续开始推向市场,但更多的是随着市场的需求进行单点的迭代升级。 如SOFAStack,其是蚂蚁集团2015年就推出的面向金融行业的云服务,经过多年发展,SOFAStack已经逐渐进入到能源电力、制造、交通等更多行业。其他两款产品,也都经历了同样的发展路径。 迈入AI时代,三款产品也进行了迭代升级。SOFAStack从云原生走向AI原生,mPaaS从交互智能化、端运营智能化、全终端智能化等方面实现mPaaS+AI,摩斯平台则推出“大模型隐私保护方案”,旨在解决大模型应用中的数据与模型隐私安全问题。 无疑,通过对三款产品的迭代升级和统一管理,蚂蚁数科已构建面向企业AI服务的体系化能力。 除了战略定力,坚持自己一直做得好,也更需要顺势而为。 今年,企业级智能体市场逐渐爆发。4月份,蚂蚁数科发布了智能体开发平台Agentar,提供一站式、全栈的智能体开发工具,助力金融机构高效打造能够自主决策、可信可靠的金融智能体应用。 相比于其他智能体搭建平台,Agentar有3大特色: 基于可信智能体技术打造的安全可信能力,能够让智能体更可信、可靠与可优化;亿级用户金融场景中锤炼的AI技术能力,及“投喂”的亿级高质量金融专业数据,让金融智能体更专业;而零代码和低代码开发能力,则为企业降低了搭建智能体的门槛。 据悉,目前Agentar平台正在内测推出国内首个金融 MCP 服务广场,集合了超百个高质量金融信息源及智能投研服务,非技术人员也能通过拖拽的方式快速构建智能体应用。 而Agentar背后,是一套贯穿“算力、数据、模型和应用”的全栈体系化工具能力。例如,在算力层面,蚂蚁数科的智算平台,能够实现多云、多芯、异构算力资源的统一纳管与调度。不仅提升了算力利用率,还为企业提供了灵活的适配和优化路径,帮助它们应对日益增长的智算规模与性能需求。 在数据层面,蚂蚁数科推出面向长思维链数据的特色服务,具备长思维链数据的合成改成、智能标注等核心能力,可以帮助企业构建行业推理模型,从而大幅提升智能体在工业级严肃场景的应用上限。 从独立的业务,到统一的产品矩阵,蚂蚁数科独立一年后,原本就是营收核心的企业级业务更加聚焦,更加融合,企业也进阶成为了AI全栈解决方案商。 RWA,数字时代的新石油 如果说企业AI服务,是蚂蚁数科在确定性的赛道上挖“金矿”。那么,聚焦RWA赛道,则是蚂蚁数科在无人区的沙漠中找“石油”。 区块链,可以说是伴随了蚂蚁数科的整个发展史。2015年,蚂蚁就启动设立了区块链实验室。 经过数年发展,蚂蚁数科早已经完成了对区块链的技术积累,并在一些场景里做了最早的商业化尝试,而赵闻飙最重要的任务,就是承袭一贯的商业化思路,把技术持续向外,走到产业深处。 赵闻飙的选择是,将新能源行业和新技术碰撞出化学反应,去年夏天,蚂蚁数科推出了面向新能源行业的RWA技术解决方案。 RWA即借助区块链技术,将实体资产上链,通过数字化和标准化的产品实现资产全球交易。在赵闻飙看来,RWA模式就像一次小型IPO,极大提升了实体企业融资的可能性。 在香港金管局“沙盒”下,蚂蚁数科已经先后帮助3家企业完成RWA业务落地,资产覆盖充电桩、光伏、二轮换电等。蚂蚁数科用技术,打通了实体资产到通证化资金的闭环。 自此之后,RWA赛道逐渐火热,包括华夏基金、京东等企业也开始进行相关业务布局。 这背后原因,一方面随着Web3的发展,聚集在区块链上的资金越来越多。而另一方面,Web3世界存在大量资金空转的现象,要把真实的、有价值的资产引入Web3世界,夯实Web3的价值面。 一方是钱,一方是资产需求,那只要保证实体资产可信、数据确权安全等问题,就可以实现实体资产的数字化流通。其中,最重要的就是底层区块链技术。 去年10月,蚂蚁数科首次公开了其为RWA业务打造的“两链一桥”平台;今年5月,蚂蚁数科推出面向海外市场,专为RWA交易打造的高性能Layer2区块链Jovay。此举意味着, RWA将步入“毫秒级可信交易”时代,全球流动性进一步增强。 据悉,截至目前,蚂蚁数科已将 1400万台新能源设备“搬上区块链”,形成全球最大的新能源链上资产平台,它实时映射和链接起了物理世界的绿色能源,为能源资产RWA 奠定了基础。 但RWA业务现还处于探索期,整个市场都是摸着石头过河。 不过,在区块链技术和实体经济结合的大方向上,蚂蚁数科的投入都始终坚定。 未来,随着监管框架的完善和技术成本的下降,RWA有望成为连接物理世界与数字经济的枢纽,让中国企业在Web3全球化竞争中占据“产业化”这一战略制高点。 全线出海,全球“结果” 从行业发展情况来看,如果说AI是现在时,那么RWA就是未来时,两者都充满了想象力。 这一想象力不仅仅出现在中国内地市场,事实上,赵闻飙也曾说过,“蚂蚁数科一直是一家立足全球化的企业。”我们不难看出,在业务上,蚂蚁数科的双引擎是企业AI服务和Web3;在市场上,蚂蚁数科发力全球化战略,也在加速海外市场的业务布局。 今年4月,蚂蚁数科正式在香港设立海外总部,作为蚂蚁数科链接海外业务的桥梁,立足香港,布局全球。 相比此前单一技术或业务的独立出海,今年蚂蚁数科可谓是要“火力全开”,让业务在全球区域全面开花结果,实现科技toB服务的规模化落地。 在日前举办的迪拜金融科技峰会2025上,蚂蚁数科宣布旗下企业级AI产品全线出海,包括智能体开发平台Agentar、多端开发产品mPaaS以及安全科技产品ZOLOZ等。 蚂蚁数科国际业务负责人陈逸石直言,“我们将加大海外本土化运营策略,助力更多海外机构能享受到技术创新带来的发展红利。” 目前,蚂蚁数科已经联合300多个合作伙伴,服务全球超过1.3万家企业客户,覆盖亚洲、中东、非洲、欧洲等24个国家和地区。 从另外一个层面来说,海外业务的“开花结果”,也意味着海外市场营收的增长。此前,赵闻飙也始终看好海外市场业务营收,并表示海外业务将占据总体业绩营收的20%。 蚂蚁数科发力海外市场,也是独立面向市场运营后,商业化大考之下的新市场增量。 赵闻飙上任一年来,蚂蚁数科通过技术向外、全球化拓展、RWA 深耕等举措,企业数字化能力,大步跨进。 做难而正确的事 从金融中来,到千行百业去。 蚂蚁数科起源于支付宝及金融行业的服务经验,底层的核心就是可信技术。 蚂蚁数科CTO王维说,可信智能体是产业AI规模化落地的“必选项”。而RWA的产品化、商业化,需要链上链下的可信闭环。 独立运营后的第一年,蚂蚁数科开启AI+Web 3的双线作战模式,逐鹿新征程。 其中最重要的意义在于,无论是可信AI,还是可信RWA,都是在帮助企业和行业寻找确定性发展路线。
如何辨别AI生成的图片文字声音:教你一招
5月19日消息,据媒体报道,数字化的今天,AI技术正在逐渐改变我们的生活方式和工作方式,它让生活更加舒适、工作更加高效。 然而,一些别有用心之人借助AI工具,生产发布仿真度高的虚假信息,迷惑大家的视线。如何有效辨别AI生成的图片、文字、声音?请掌握这些技巧,练就“火眼金睛”,不被AI谣言迷惑。 教你辨别AI图像: 1、光线矛盾要留意,真实图像光线自然,Al图像常现光线矛盾,如人物与背景光线方向不符,仔细观察。 2、像素断层有端倪,放大图像边缘,真实图像过渡平滑,Al图像可能出现像素断层、锯齿状,不放过细节。 3、反向搜索辨真假,利用各类识图等工具,上传图像,若源自AI绘图平台,那就是虚假图像。 教你辨别AI文本: 1、细节模糊有猫腻,真实文本细节丰富,Al文本常模糊,如“昨天某时发生某事”,无具体地点、人物等,需警惕。 2、逻辑断裂露马脚,逻辑连贯是真文,Al文本易断裂,像“事件发生,某人立刻采取行动”却无因果衔接,多斟酌。 3、重复语病藏破绽,Al生成易现重复语病,连续相同表述或用词不当,别轻信,遇到不确定文本,善用官方辟谣平台查询,让Al谣言无所遁形。 教你辨别AI音频 1、看波形辨真伪,真实语音波形自然带呼吸,AI语音机械平直、尾音常戛然而止。 2、转文字找漏洞,用各类专业工具转文本,AI语音易现字词错漏,如“停课”变“停棵”,语句不通秒穿帮。 3、听语气抓破绽,真人说话有情感起伏,AI语气生硬单一,一听便知,学会音频识别技巧,不被AI语音误导。
杨植麟找出路
“(Kimi)最核心的任务就是提升留存,或者把留存作为一个重要的衡量指标。”这是月之暗面创始人杨植麟去年11月回复“智能涌现”关于当下最核心任务时的答案。 彼时,正值Kimi chat全面上线一周年,当时的Kimi刚刚公布了月活3600万的数据,成为国内月活数仅次于字节旗下豆包的AI APP。 不过半年,Kimi在月活榜上已经从第二滑向了第四。根据QuestMobile数据,DeepSeek,字节豆包,腾讯元宝分别以1.94亿、1.16亿和4164万的月活用户数霸榜前三,Kimi以1820万的月活数位居第四(截止2025年3年)。 尽管看起来第四的位置并不算差,但Kimi的月活量不到DeepSeek和豆包的零头,相比起去年10月就已经达到的3600万月活,更是下降了一半。 而想完成杨植麟此前“提升存留”、追求用户规模的任务,曾经技术派的Kimi正开启新一轮的换道尝试。 作为2024年年初的当红炸子鸡,Kimi出圈正是凭借首个实现了“200万上下文”的技术突破,引来了阿里、字节等大厂的跟进模仿。杨植麟也在接受腾讯新闻的采访中表示,月之暗面“有概率”成为最快追平GPT 4的公司。 随着DeepSeek R1对GPT-4o的追平,吃过创新红利的Kimi,技术前沿探索的行业定位,正受到越来越多来自DeepSeek的冲击。 如今,短时间内难以复刻DeepSeek效应,靠技术突破实现用户留存的月之暗面,近期被爆出正布局AI医疗产品,用于提升旗下产品Kimi在专业领域的搜索质量,并且探索Agent等产品方向。 对此,有接近月之暗面的人士告诉字母榜(ID:wujicaijing),月之暗面并没有做医疗Agent,只是在加强医学的搜索信源质量,是针对医学类的专业用户需求。 Kimi近期频频切入垂类领域,目的正是寻找新的用户群。 此前,4月份,月之暗面与财新传媒达成合作,用户提问财经相关内容时,Kimi 将结合财新传媒旗下专业报道内容生成答案。5月12日,Kimi的官方账号在小红书平台发起“21天打卡挑战”,用户可以直接在小红书内和Kimi对话。 对机会的把握,杨植麟无疑是敏感的。 在接受腾讯新闻的采访中,杨植麟提到月之暗面紧锣密鼓在2023年2月集中做第一轮融资,“delay(延迟)到 4 月基本没机会了。但如果 2022 年 12 月或 2023 年 1 月做也没机会,当时有疫情,大家没反应过来——所以,真正窗口就是一个月。” 如今在月活下滑的当下,杨植麟找到的新出路,或是让原来作为通用大模型的Kimi,在更小的垂类领域里卷智能性、卷准确度。 这一次,会是月之暗面新的窗口期吗? 一面更垂直,一面更社交,Kimi的身段越来越灵活。 4 月 28 日,kimi宣布和财新传媒达成合作,用户使用Kimi提问财经相关内容时,Kimi将结合财新传媒旗下专业报道内容,即在回答问题时,提取财新的部分内容进行总结和加工,为专业领域的用户提供信源更可靠的的财经信息。 同时,月之暗面被爆出正布局AI+医疗,提升Kimi在医疗领域的搜索质量。 只是,瞄准财经和医疗两大领域,试图变得更专业、更垂直的月之暗面,似乎效果还未来得及显现出来。 字母榜尝试向Kimi提问“分析腾讯最新的财报”。收到指令后,Kimi虽然在搜索的信息源栏显示了财新网的logo,但对其生成内容所有的引用来源逐一查看,并没有发现来自财新网的页面。 随后,字母榜修改指令为“结合财新网内容,分析腾讯最新的财报”,才在生成内容的引用中看到了财新网页面,只是不少引用内容点击链接无法查看到原出处,如果想要查看完整内容,还需要下载财新APP登录查看。 “对我来说,Kimi这种对财新网内容的加工和总结,还不如直接看财新网的报道更简单直接。” 作为Kimi的老用户,财经编辑张旸(化名)向字母榜表示,财经内容需要信源准确、观点深刻,但如果无法直接点击链接核对,看到完整的内容,仅仅是提炼某个点,使用Kimi反而会增加他反复核对的工作量。 而至于医疗领域,字母榜尝试向Kimi提问,“布偶一直拉稀,怎么办?”尽管Kimi迅速分析了原因和处理方法,但信源并未显示有萌宠相关等国内专业平台或APP,可见在宠物医疗这样更为细分的领域,Kimi的信源储备还有待完善。 当问题切换到“吃火锅后一直拉稀,怎么办?”时,Kimi的回答信源就涵盖了丁香园、百度健康、好大夫在线等平台。在日常医疗领域,Kimi的信源储备显然更加丰富。 图注:布偶猫拉稀回复信源(左) 人拉稀回复信源(右) 图源:Kimi智能助手 字母榜还发现,在搜索“布偶一直拉稀,怎么办?”时,Kimi回答结束后提供了一些视频丰富了答案来源。点击打开后,所有的视频都来自B站。 尽管Kimi并未官方宣布与B站的合作,但显然,引入B站的视频内容,也是其在垂类领域卷专业度的重要一环。 除了B站之外,Kimi的好友圈还有小红书。 Kimi官方账号近期在小红书发起了“21天打卡挑战”,小红书用户不仅可以一键直接和Kimi对话,而且连续21天用Kimi完成小红书热门AI任务,比如生成旅行攻略、拆解复杂知识框架,还能兑换周边及算力奖励。 作为Kimi的金主,小红书不仅投资了Kimi,也凭借3亿的月活用户为Kimi打开了一扇触达C端用户的窗。只是效果如何,或许还留待观察。 “Manus的研究员每天都在小红书账号里更新产品进度,邀请内测,豆包的产品经理发帖手把手教大家捏智能体,Kimi这个21天挑战还是太保守了。” 现在TOP2大学攻读博士学位的张笑(化名)表示,在他所在的大模型爱好圈子里,论花式整活,Kimi的力度似乎还是不太够。 除此之外,“Kimi变了”也成为老用户如张旸们的共识。 随着Kimi迈向多模态,4月开始,Kimi的用户界面从单个对话框变成了多个任务提示页面,股票信息、代码块、表格、图片、视频等多模态功能出镜。 “现在越来越像豆包了。”张旸补充道。而正灰度测试的社区功能,用户可以将和Kimi的互动内容转到社区,其他用户可公开评论,“很像微博或者即刻。”张旸表示。 不再似从前模样的Kimi,其迅速“转身”的答案,或许正藏在杨植麟的身上。 杨植麟曾对腾讯新闻说,“我们不是为了竞争而建立的公司。”满足用户需求,而不是赢得一场比赛,这是杨植麟对月之暗面使命的一种解读。 而月之暗面最后一次传出融资消息已经是2024年8月,截止目前已近一年,不是为了赢得比赛的杨植麟,陷入困局。 “Kimi现在比较尴尬。” 某头部大厂资深AI员工告诉字母榜,“过去腾讯、阿里、美团等大厂押注跟投,或许还有借Kimi的高用户量制衡字节豆包的意思。但现在金主们都开始推自家的AI业务了,Kimi技术创新赶不上大厂的速度,月活也上不去,很难再给投资人讲故事了。” 近半年,大模型赛道的变化可以用激烈来形容。 曾经在采访中表示“开源落后于闭源”的杨植麟,面对的是DeepSeek横空出世,用极低成本,创新的深度思考彻底改写了AI格局。 回望Kimi的四次融资,作为AI六小龙们的“金主”,科技大厂们的态度变化一望即知。 Kimi A1轮融资时,由美团龙珠领投;A+轮融资时,阿里领投,红杉中国、美团、小红书等参与,彼时,阿里将AI六小龙投了个遍,自家的通义大模型瞄准B端,押注Kimi正是对C端流量的补足,美团、小红书彼时的AI大模型也专注于和原有业务的结合;截止2024年8月,腾讯领投Kimi,当时的腾讯闲庭信步并无入场之意,虽然已有了元宝却并未进行宣发推流。 彼时月活迅速跃过3000万门槛的Kimi,无疑是大厂们眼中完善AI战略的重要一块。 而随着DeepSeek唤醒了科技大厂们新一轮的AI热情,阿里,腾讯、美团都从观战位变成亲自下场。 在“510阿里日”,阿里董事会主席蔡崇信表态,AI技术将成为阿里所有业务的核心驱动力。5月14日,腾讯董事会主席马化腾明确表示要加码AI,提出要“加快对新人工智能机会的投资,如元宝应用和微信中的人工智能。” 就连一向在AI大模型领域步履缓缓的美团,创始人王兴也在3月公布了内部正在开发“龙猫”大语言模型平台,将与字节的豆包和阿里的Qwen等对手展开竞争。 被DeepSeek叫醒的大厂们开始为自家产品砸钱推流,Kimi们的处境变得更加困难。 ADX行业版数据显示,2025年3月,腾讯元宝、夸克、豆包、星野及通义位列AI素材投放榜TOP 5,5款APP占据了整个AI行业月投放素材量的71%。其中,腾讯元宝和阿里夸克的素材量占比分别为26%和24%,Kimi在大幅放缓投放后,已跌出素材月榜TOP 5名单,月素材量TOP 5 AI应用已成为腾讯、阿里、字节三家的角逐地。 半年内,国内外的AI投融资市场大变样,“去年投资人关注的是能不能做出产品,今年关注的就是投产比,有没有实际的落地场景。”某头部创投机构相关人员向字母榜表示。 除了大厂加入带来的金主出走、压力陡增,卷用户、卷技术、卷场景,无疑成了大模型下半场的新流行。 在美国,OpenAI用户数达到8亿,GPT-4o 的文生图功能更新后,引发全球“吉卜力”风潮,4月OpenAI宣布完成400亿美元的私募融资,估值达到3000亿美元,和字节一起跻身全球估值最高的私营公司之列。 Anthropic 3月推出Claude 3.7 Sonnet,以创新的“混合推理”在数学和编码等领域表现惊艳,新模型亮相当月,Anthropic 就完成了新一轮的35亿美元融资,投后估值为615亿美元。 在国内,同样作为“清华系”的大模型公司,智谱的日子似乎比月之暗面好过了不少。 瞄准To G(政府)和To B(企业)领域的智谱,去年以32个中标数量、1.3亿元的披露金额位列大模型招投标第三位,仅次于科大讯飞和百度(智能超参数统计)。自去年12月以来智谱共计完成了48亿元国资融资,并启动了IPO进程。 内忧外患之下,Kimi势必要另寻出路。从通用大模型走向垂类领域做用户挖掘,正是杨植麟为当下的Kimi找出的一条求生之路。 从通用到垂类领域,想要转身的杨植麟,也面临着不少的挑战。 医疗无疑是个具备发展潜力的好场景,王小川曾经提到中国一年就诊人次是 84 亿,百度一天的健康搜索请求是5000多万人、4亿多次。 AI六小龙中,智谱占据了政企市场,偏C端的MiniMax也押注视频生成领域,相较之下,医疗相对空白。 但仅就医疗领域而言,从通用大模型转向“all in 医疗”,王小川创立的百川智能比Kimi走的更早,近期又宣布与北京市海淀卫健委和宁波高新区等地方政府部门合作。 3月中旬,华为传出组建医疗卫生军团的消息,聚焦医疗大模型的临床落地。蚂蚁前不久收购了好大夫在线,要聚焦医疗AI服务。阿里通义千问大模型也已在金融、医疗等行业落地了47个解决方案。 Kimi在医疗垂类领域面对的竞争或许并不比通用场景更小。 此外,作为对专业性要求更高的垂类领域,医疗似乎也并不好做。 根据《智能涌现》统计,百川内部的评测显示,若是只基于现有文献和数据库,目前其AI病例的生成能达到70-80分,但相关项目落地的基准在90分。医疗的特殊性对信息的准确度要求更高。 而在财经这一垂类领域内,和财新的合作,或许未必能让Kimi得偿所愿。 作为Kimi的老用户,张旸习惯用Kimi搜索,在好几次看到财新的内容链接后,张旸忍不住下载了财新APP,充值了年度会员,“相比Kimi自己的内容,财新更深入,因为是媒体筛选过的,信源可信度也更高,省得每次自己再人工核验,效率提高不少。” 借助和财新的合作,Kimi虽然能够为一部分专业用户如张旸提供更专业、质量更高的回复,但也容易为“他人做嫁衣裳”。 同样和媒体合作,Kimi似乎没能复刻OpenAI的成功之路。 近年,OpenAI与多家主流媒体包括《金融时报》、美联社结盟,支付了数千万美元买断内容用于训练,而基于OpenAI的8亿用户量,这些内容的加成不仅让OpenAI成为继谷歌之后新的互联网信息入口,还通过高质量的内容交付极大提升了OpenAI的盈利能力。 去年OpenAI营收为37亿美元,今年预计将达到127亿美元,而去年营收中,其消费者订阅收入达到了总收入的75%。 归根结底,能否通过引入外部的高质量信息提升用户留存,不仅在于AI APP本身的用户体量,还和大模型公司自身的商业化路径分不开。 相较于OpenAI API、消费者订阅、Agent三条腿走路的清晰构思,Kimi在商业化上的尝试稍显单一。 此前Kimi的盈利来源主要是API,以及开盲盒式的对用户的打赏提醒。后者由于占比太低并未有更多信息披露,而前者更是受到了DeepSeek引发的价格战的残酷挤压。 随着DeepSeek R1 以数百万美元低成本平替OpenAI的热搜置顶,新一轮的“API”降价潮来袭。 阿里通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,即0.5厘/千tokens,直降97%。这意味着,1块钱可以买200万tokens,字节的豆包主力模型的定价为0.0008元/千Tokens,即0.8厘/千tokens。 如今,大模型API定价进入“厘时代”,即便月之暗面跟进降价,kimi-latest、moonshot-v1、moonshot-v1-vision-preview的输入价格从0.012/千tokens降至0.002元/千tokens,相比起科技大厂,Kimi仍然没有价格优势。 无论是引入外部合作切入垂类领域,还是自建社区,月之暗面都需要持续的资金投入。在如今尚未有新融资到账,且内部造血能力紧张的情况下,杨植麟正面对重重挑战。 “如果你今天拿到的钱是最后一笔钱,你会怎么花这笔钱?”去年3月,面对腾讯科技的提问,杨植麟曾经说,“我希望这个永远不会发生,因为我们未来还需要很多钱。” 曾经希望永不发生的未来已至,越来越关注垂类领域的杨植麟,还要做中国版OpenAI吗?答案或许是未知的。但无论如何,月之暗面要在这场战役中先活下来。
沃尔玛正打造AI购物助理:自主完成购买决策,无需真人干预
IT之家 5 月 19 日消息,沃尔玛正在打造 AI 购物助理,目标实现从商品搜索到结算付款的全流程自动化,完成几乎所有购买决策而无需用户干预。 沃尔玛的美国首席技术官 Hari Vasudev 预言,当类似 OpenAI Operator 一样的智能体能够无需用户访问商品页面,实现从搜索到结账的全自动操作时,电子商务将迎来根本性变革。 为保持竞争优势,沃尔玛正在开发内置于应用程序和网页端的智能助理,助理既能自动购买日常杂货,也能根据具体需求购买商品组合,例如筹备派对。通过深度运用沃尔玛第一方数据,即使交易过程趋于无形化,助理仍可保持与消费者的直接联系。 沃尔玛同时将为第三方购物机器人的普及做好准备。Hari Vasudev 预计行业将形成协议标准,允许外部智能体与沃尔玛的系统对接,交换用户偏好数据并获取结构化产品信息;对于自主爬取网站的购物机器人,沃尔玛的商品页面仍需保持机器可读性并提供有竞争力的价格。 算法采购将颠覆传统营销手段,与依靠视觉图像激发顾客的购买欲不同,AI 购物助理会更关注规格参数、库存状态和总成本。Gartner 分析师 Robert Hetu 认为,在未来,搜索引擎排名(无论付费还是自然流量)将主导购物机器人接触优惠信息的优先级,零售商或需要以近乎实时的速度更新产品描述和触发即时折扣。 IT之家发现,沃尔玛目前超 80% 的销售额仍来自于实体门店,但其电子商务 22% 的同比增幅,印证了用户消费习惯的数字化转型。
黄仁勋台北电脑展演讲:两英里铜线超算亮相、个人AI计算机数周内上市
凤凰网科技讯 5月19日,英伟达CEO黄仁勋今日在台北电脑展2025主题演讲上发布多项重磅计划,包括全新GB300 AI系统、突破性AI超级计算机及个人AI计算设备产品线。 黄仁勋在演讲中阐述了英伟达对机器人研发的独特视角,他表示在物理世界中直接训练机器人“不切实际”,必须在虚拟环境中进行训练。为解决这一难题,英伟达联合DeepMind与Disney Research共同研发了被称为“全球最先进”的物理引擎——Newton,并计划于七月实现开源。该引擎完全支持GPU加速,具备高度可微性及超实时操作能力,能够通过经验实现有效学习。值得注意的是,英伟达正将这一物理引擎整合进ISAAC模拟器,使虚拟机器人能以真实方式"活"起来。 在人工智能硬件领域,黄仁勋宣布“Grace Blackwell”系统,这一创新技术能将普通计算机转变为强大的超级计算机,显著提升计算能力。同时,他透露新一代超算采用了突破性核心技术,实现了每秒14.4TB的全连接带宽,通过NVLink Spine、定制盲插背板及5000条铜线,达到惊人的每秒130TB带宽。这一系统整合了72个Blackwell处理器(相当于144个GPU芯片),相互连接形成庞大GPU网络,配备长达两英里的铜线,总计拥有1.3万亿个晶体管。 黄仁勋还宣布,英伟达将联合台积电、富士康在中国台湾建设AI超级计算机。这一消息与他同时宣布的全新中国台湾办公总部计划相呼应——英伟达星宿(NVIDIA Constellation)将落户北投士林,采用类似宇宙飞船的未来感设计。黄仁勋表示,随着英伟达在台湾的工程师团队规模与合作伙伴关系不断扩大,此举将为未来发展奠定更坚实基础。 在个人AI计算设备方面,黄仁勋透露个人AI计算机DGX Spark已全面投产,将于数周内上市。该产品搭载英伟达GB10超级芯片及张量核心,体现了AI计算向个人领域普及的趋势。此外,英伟达还携手全球电脑制造商推出"AI优先"的DGX个人计算系统,并计划推出DGX Station工作站,预计华硕、戴尔、惠普等厂商将于今年晚些时候推出相关产品。 在自动驾驶领域,黄仁勋透露英伟达正将其AI模型应用于自动驾驶技术,并与梅赛德斯合作在全球范围内推出搭载端到端自动驾驶技术的车队,预计今年即可实现落地。此外,黄仁勋还公布了NVIDIA Isaac GROOT开放式人形机器人开发平台,包含多项开源基础模型,展现了英伟达在人工智能与机器人领域交叉融合的战略布局。
奥特曼逼梁文锋出大招
奥特曼“AI圈营销大师”的名头,正越坐越实。 在被梁文锋短暂抢走一段时间风头后,奥特曼正以几乎每周都上新产品的强度,强势霸榜AI热搜。仅在过去一周内,OpenAI就接连推出了新产品Codex——一款代码AI Agent,和新模型GPT-4.1。 新模型的上线,更是将奥特曼对AI热度的追逐,展现得淋漓尽致。原本可以一次上线的内容,硬是被奥特曼拆解成了对AI圈的两次“震撼发布”:一次是4月15日,GPT-4.1系列模型首次推出,当时只能通过API调用,无法供ChatGPT使用;另一次便是近期终于宣布GPT-4.1模型已正式登陆ChatGPT。 看似多此一举的背后,实则藏着奥特曼对OpenAI模型调用度规模的追求。全球最大的大模型整合应用平台Poe,在近期发布的《2025年春季人工智能模型使用趋势》报告中指出,OpenAI的GPT-4.1系列发布后几周内,份额迅速增加到了约10%,位列第一。对比DeepSeek,其R1模型使用率,已从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%。 不过,被奥特曼步步紧逼、抢夺份额的梁文锋,赶在OpenAI上新模型GPT4.1的同一天,也选择了出招。 每天“看论文,写代码,参与小组讨论”的梁文锋,又发了篇共同署名论文,但不是外界期待的新一代旗舰模型R2或V4的技术报告,而是一篇围绕V3 的新论文。 不同于去年12月V3亮相时发布的技术报告,梁文锋署名的新论文从硬件架构和模型设计的全新视角,探讨了V3模型在扩展过程中面临的硬件挑战,并展示了一系列硬件与模型协同设计带来的降本效果等。 但外界还在等待梁文锋的大招。早在2月份,路透社就曾爆料,DeepSeek内部正在加速推出R2模型,该模型原计划在5月初发布,但现在官方希望能尽早发布。 如今,距离5月结束不到半个月时间,梁文锋只是带领团队出着一些小招式,如DeepSeek V3模型完成小版本升级,上线新版本DeepSeek-V3-0324,随后又更新了以DeepSeek-V3为基础模型微调而来的DeepSeek-Prover-V2——一款数学定理证明模型。 根据字母榜(ID:wujicaijing)了解,自2023年5月DeepSeek成立以来,梁文锋带领团队先后推出了10余款模型,类型涵盖语言、代码、数学、视觉多模态等多个领域。 过去两年间,DeepSeek一般遵循先出语言基础模型,再基于语言基础模型微调其他垂类模型的节奏。 去年9月,在V2.5新版本中,DeepSeek完成了语言模型V2和代码模型Coder V2两个模型的合并,此后Coder模型便开始作为语言模型的一部分,不再单独更新。 值得注意的是,目前视觉多模态模型暂未与语言模型合并。这也意味着在外界期待的R2/V4等大招之外,梁文锋或许还在筹备一些小招式,如去年12月推出的DeepSeek-VL2视觉模型,还有望在V3的基础上,升级到VL3版本。 至于大众翘首以待的R2何时到来,按照DeepSeek以往的内部模型更新节奏,如果梁文锋希望在V4版本上训练R2,那么其推出时间或许会是今年8月份左右。 2023年10月,DeepSeek上线V1; 2024年5月,DeepSeek上线V2; 2024年12月,DeepSeek上线V3。 梁文锋带领下的团队基本保持着每7个月更新一次旗舰语言模型的频率。按此推算,新一代V4模型有望在今年7月份亮相。以R1与V3相隔1个月的推出时间差评估,R2最快便有望在8月份上线。 01 梁文锋激励奥特曼 梁文锋激活了大模型行业的上新速度,DeepSeek则化身为一众AI助手上新的加速器。 在被R1震撼的第一时间,想要从梁文锋手中争抢热度的奥特曼,就着手发布了首个智能体Operator,并开始对外剧透即将上线o3-mini的新消息。 自此之后,奥特曼几乎以每周都有新产品的更新频率,让OpenAI牢牢定在了AI热搜榜上:在模型侧推出了GPT 4.5、o3-mini/o4、GPT 4.1;在产品侧上线了Operator、Deep Research、Codex;在体验侧,学习DeepSeek开放思维链,并主导了吉卜力风格图片的流行。 这不能不说是梁文锋的功劳。在此前接受访谈时,奥特曼称DeepSeek给自己的一大教训就是,“当我们隐藏一个功能时(我们隐藏了‘思维链’),我们有充分的理由这样做,但这确实意味着,我们给其他人留下了获得病毒式传播的机会。” 如今,通过更加开放的产品体验更新,奥特曼正帮ChatGPT找回失去的热度。《2025年春季人工智能模型使用趋势》报告显示,OpenAI的GPT-4.1系列份额达到了约10%,位居第一。 相比被梁文锋倒逼着更加开放的奥特曼,动作寥寥的DeepSeek,正在迎来意料之中的流量和热度下滑。曾经一度在中美两地的苹果App Store 免费应用下载榜上夺冠的DeepSeek,如今已经分别再次被字节旗下豆包和OpenAI的ChatGPT赶超。 说到底,作为一款应用而言,DeepSeek暂时还难以持续对ChatGPT形成威胁,“因为前者更像是一个商品化的模型,而ChatGPT则是一个更趋完善的产品,从而具有更持久的竞争力。”国内头部大厂产品经理刘凯向字母榜解释道。 不同于奥特曼在产品应用侧的不断加码,梁文锋则将更多精力放在了模型本身。 此前接受采访中,梁文锋便曾提到英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果……很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。” 如今,在最新发布的署名论文中,梁文锋正在实践着自己的愿景,其结合DeepSeek在AI硬件上遇到的瓶颈,从低精度计算支持、扩展与扩展融合、网络拓扑优化、内存系统优化、鲁棒性与容错等多个方面,提出了对下一代AI硬件的设想。 02 奥特曼重应用,梁文锋重模型 放任DeepSeek流量和热度白白流失的背后,或许也体现出了奥特曼和梁文锋两人在AI商业化方面的不同策略。 做大应用的用户规模,从来都不是梁文锋的头等大事。哪怕在去年5月率先挑起大模型行业价格战,梁文锋给出的解释中,也明确说明其主要目的并不是为了争抢用户。 因为在梁文锋看来,当前阶段是技术创新的爆发期,而不是应用的爆发期。从长远来看,依托于开源、免费的商业策略,梁文锋追求的是打造一个基于DeepSeek模型的开源生态,自己只负责基础模型和前沿的创新,其他公司负责构建To B、To C应用。“如果能形成完整的产业上下游,我们就没必要自己做应用。” 相比轻应用而重模型的梁文锋,奥特曼则将应用放在了第一优先级。近期被问到五年后,是一个拥有10亿日活跃用户的网站更有价值,还是一个最先进模型更有价值时,奥特曼选择了前者,并将模型与历史上的晶体管做类似,“未来会有很多AGI,它会渗透到各个领域,会变得很便宜。它本身并不能成为一个差异化因素。” 且不同于梁文锋想要从开源生态中实现最终的商业回报,奥特曼更看重打造ChatGPT的订阅制度,并将其视为公司的主要收入来源。不同的商业选择,直接决定了两人对应用的不同态度。 这也更容易理解,为什么奥特曼如此热衷营销。毕竟,想要将ChatGPT打造成一款新的超级消费级应用,前提是拥有足够多的用户,并尽可能激发用户的使用热情。 束缚梁文锋无法像奥特曼一样,将产品更新玩出花样的另一重因素,则来自DeepSeek产品本身。 环比市面上主流的AI助手类应用,DeepSeek是唯一暂不支持多模态功能的产品。1月15日应用上线至今,4个月过去,如语音对话、图片生成、音乐生成、视频生成等,DeepSeek仍未提供支持服务。 多模态能力的缺失,直接限制着DeepSeek的产品更新节奏,更使得用户在体验完新鲜感过后,很难在DeepSeek中寻找到持续停留的乐趣所在。 作为最早接入DeepSeek的大厂C端应用,腾讯元宝便瞄准DeepSeek的产品短板,其功能更新主要体现在多模态能力的加持上,相继上新了图生文、文生图、语音对话等差异化功能。 03 多模态和性价比,藏着梁文锋的新大招? 当下的短板,也为梁文锋留下了未来储蓄大招的创新空间。 此前的采访中,梁文锋分享了团队规划的追逐AGI的三条路径:一是数学和代码,二是多模态,三是自然语言本身。 截至目前,在R1发布至今的100多天内,梁文锋已经带领团队在数学和代码,自然语言模型上有所动作,如DeepSeek-Prover-V2和DeepSeek-V3-0324的陆续亮相。 眼下,只剩多模态方面暂未有新的进展传出。考虑到上一次推出视觉多模态大模型DeepSeek-VL2,已经是去年12月的事情,多模态模型更新,或许会是梁文锋向外界展示的新大招之一。 在选择对外展示方式上,梁文锋面前也可能摆放着两条路径:一是遵循惯例,择机发布基于V3模型微调而来的DeepSeek-VL3;二是学习Coder,在V3.5模型中完成语言模型V3和视觉多模态模型VL3两个模型的合并。此后,VL模型便开始作为语言模型的一部分,不再单独更新。 作为通向AGI重要途径的多模态,其重要性正随着Agent生态的发展日益凸显。如果梁文锋再不向外界亮大招,其还将迎接更加现实的竞争挑战,即可能会将更多模型调用需求推向对手。 3月份,AI创业公司蝴蝶效应发布的应用产品Manus,以世界首款通用AI Agent的名头,震惊业内后,字节、百度等科技大厂,快速跟进推出了自己的产品。 晚点LatePost 爆料称,字节扣子团队开发扣子空间时,他们曾考虑优先使用DeepSeek-R1,但测试后发现其调用工具的能力不太理想,最终还是用了自家的豆包模型。 而且,多模态融合,正在成为大模型行业的一大共识。越来越多大模型厂商开始在“All in One”的理想产品形态中,迈出自己的探索步伐:Anthropic、阿里千问发布了各自的混合模型,谷歌内部正在尝试将视频生成融入语言模型。 发布完代码智能体Codex后,近期OpenAI高管在“有问必答”活动中更是直言,下一代基础模型GPT-5,计划将Codex、Operator、Deep Research和Memory等功能全部整合在一起。 多模态之外,留给梁文锋施放大招的另一重点,则是模型性价比。 一贯以性价比开道的DeepSeek,在过去一段时间,正在被阿里、字节、百度等科技大厂夺走自身的性价比标签,科技大厂纷纷推出了API价格更低的同类模型。 百度创始人李彦宏更是贴脸开大,吐槽DeepSeek除了没有多模态之外,使用起来还慢且贵,“中国市场上绝大多数的大模型API调用价格都比DeepSeek满血版要低,而且速度也更快。” 面对李彦宏们的挑衅,外界都在期待着梁文锋的新反击。 参考资料: 《OpenAI:GPT-5就是All in One,集成各种产品》量子位 《2025年春季人工智能模型使用趋势》Poe 《李彦宏开卷:“DeepSeek慢且贵”》直面AI 《复盘字节扣子空间开发历程:瞄准工作场景,做一个 Agent 系统》晚点LatePost 《Sam Altman :GPT-5 将免费开放,DeepSeek 教训了我们》APPSO
小米公布大模型最新研究成果 10篇论文入选计算语言学顶级会议
凤凰网科技讯 5月19日,据小米技术官方透露,近日,计算语言学和自然语言处理领域国际顶级会议——第63届国际计算语言学年会(ACL 2025)公布了论文录用结果,小米大模型团队共有10篇研究成果入选,包括9篇主会长文和1篇findings长文,成果涵盖大模型端侧高效推理、大模型GUI智能体、大模型基础结构创新等多个领域。 据了解,ACL是国际计算语言学协会主办的年度学术会议,在计算语言学和自然语言处理领域享有极高声誉,被中国计算机学会(CCF)列为A类会议。本届ACL将于今年7月27日至8月1日在奥地利维也纳举行,这也是该会议的第63届年会。 值得注意的是,小米本次入选的10篇论文中,有5篇获得了小米揭榜挂帅科研专项(Xiaomi Open-Competition Research Program)的支持,展示了小米在大模型领域的持续投入和技术积累。 从论文内容来看,小米大模型团队的研究成果聚焦在多个前沿技术方向,如:无长期衰减的新型位置编码,能够增强模型的上下文感知和外推能力;混合框架,通过定制化KV缓存优化实现长上下文推理;针对指令扩展过程中的“固定思维模式”问题提出了基于动态提示更新的新方法等。 此外,小米研究团队还在多图像场景的视觉语言模型、KV缓存压缩、Web智能体等方面取得了一系列进展。例如,以焦点为中心的视觉链范式,显著提升了视觉语言模型在多图像场景中的表现;维度级别和深浅层平衡的角度解决KV缓存优化问题;模拟了人类“快慢思考”的规划过程,提升Web智能体的导航能力。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。