行业分类:
加载中...
头条分类:
加载中...
小红书架构调整:孵化自己的“影视飓风”,还要能直播带货?
小红书打算怎么做社区?学 B 站?学抖音?还是做自己? 凡依靠 UGC 起家的内容平台,想要做大做强,总会在某个时刻放弃 UGC,这已经成了一条举世公认的真理。 知乎如此,B 站如此,抖音如此,如今小红书似乎也临近了这个时刻。 凤凰网科技的报道,小红书社区业务做了架构调整。社区保持原有架构不变,但内容运营不再由一人主导,而是由云帆和新岛各自负责一部分。云帆所负责的部分叫做 Live,直接向小红书 COO 柯南汇报,新岛负责 Village,依然向社区业务负责人帕鲁汇报。 小红书复兴 SOHO 广场工区 架构划分在十月底确定,不过双方的分工和目标依然在讨论当中。有小红书员工透露,最早的划分逻辑是,Village 做 UGC,而 Live 负责 PGC,之后进一步细化,Village 负责做「趋势」,Live 负责做优质中长视频——在小红书划分里,这是指超过两分钟的视频。 现在定下来的目标,Village 组负责提高普通用户的活跃度,Live 组要去孵化一些具备小红书特色的百万粉丝创作者,也就是小红书自己的「影视飓风」。 正如凤凰网科技的报道,云帆恰好便来自 B 站,这是她熟悉的路径。 柯南现在负责小红书的大商业板块,包括电商与商业化,Live 组也在加强与直播电商的合作,不少数十万粉丝的小红书创作者开始尝试直播带货,有员工说「加强创作者与大商业的连结」这也是现在很重要的工作之一,既能降低直播带货的成本,也能给创作者带来收入。 「不过谁也说不好,这些任务会不会有新的变化,可能得等到明年初共创完才知道。」上述员工说,「小红书变化太多了。」 先前小红书按照垂类来做运营,比如旅游、户外、运动、时尚等,每年各垂类负责人会基于小红书的发展方向和用户的调研来制定今年的运营规划。 架构调整后,小红书将逐渐「去垂类化」,不同类目之间不再有严格的划分,「但具体落地方式还没有明确,目前大家依然在按照原来熟悉的方式做事」。 调整之后,小红书社区开始沿着两条不同的路前进。 一条路依然类似推崇「圈层运营」与「自然生长」。2023 年,上一任社区负责人河童在「站在 1 亿看 3 亿」的项目共创上说,小红书如果想要达到 3 亿 DAU,单靠「有用性」是不够的,而需要满足人们「被看见」的需求,比如鼓励大家发布第一人称的内容,鼓励大家通过小红书建立直接的交流。 新近在小红书兴起的「AMA」(Ask Me Anything)便是如此,这原本是科技组的一个普通运营活动,让小红书普通用户有机会向 AI 创业者、投资人直接提问交流,最终不但 AI 领域的人参与其中,也扩展到了其他行业和人群,也有人借此达成了更深度的合作。 小红书 AMA 活动 另一条路则要满足小红书的「非线性增长」。2024 年初,小红书内部的共创达成一致,认为视频是唯一的非线性增长机会,但如何做视频依然在探索当中。小红书 CEO 星矢在四季度的内部会上再次强调了视频的重要性,他说先前已经探索了小红书是否应该做视频以及能不能做视频,也就是解决了生存问题,那么接下来的「视频 3.0」便是要打造有小红书特色的视频。 有内部员工透露,未来在流量划分上,也会更多向头部 KOL 和视频创作者倾斜,普通创作者主要根据热门话题和热点事件来做激励,「异军突起野蛮生长的低粉高赞笔记会越来越少。」 产品、流量与算法的调整也依然没有到达最终的落地方案,不过可以推测,大家熟悉的小红书将发生巨大的变化。 大家熟悉的小红书有三大业务,社区、商业化和电商。商业化负责广告业务,电商负责卖货业务,这二者为小红书带来营收,帮助小红书「活下去」和活得更好,不过社区业务依然是小红书的基石,是定义小红书「我是谁」的关键。 现在小红书会怎么介绍自己? 它可能会说,自己不仅是生活指南,也是生活兴趣社区。日活用户超过 1.2 亿,月活用户达到 3.5 亿,其中大多是年轻用户,而且以一二线城市为主。 它可能也会说,自己今年的估值接连上涨。员工期权价格涨了三次,三月调整为 13.5 美元/股,6 月提升至 18 美元/股,10 月进一步提升至 25 美元 / 股。 这些昂扬的数字,也给了资本信心。小红书在一级市场的估值已经超过 300 亿美元,而在一些可以代持未上市公司期权的特殊基金里,小红书的估值更是达到 500 亿美元,甚至能稳压百度、快手一头。 通常而言,公司的高估值会给员工带来归属感与荣耀感,不过当我把这些数据告诉依然在职的小红书资深员工时候,反应往往是:「不会吧?这么高?」而当你进一步追问为什么小红书能够做到这么高估值时,回答往往是:「可能因为运气好?」 「运气好」的说法并非最近才有。《晚点 Latepost》的报道:2019 年初,小红书的日活跃用户数突破千万,但在项目讨论会上,几乎没有人说得出自己过去一年做对了什么,他们清楚,上一波增长有多少取决他们自己,多少是运气使然,这样的「虚无」让团队略有不安。 外部的分析会把「运气好」进一步拆解,如潘乱在 2021 年说「小红书成功抓住了都市里一群对精致生活有追求的年轻女性……让今天的小红书变成了中国规模产品里审美和高级的代表。」小晚也会在去年感慨,说小红书选择的消费决策赛道真的很正确。 竞争者眼里有着不同的归因。一位抖音的资深运营会说抖音有着更好的算法,更努力的团队,沉淀下来更多的方法论,而我问他先前张楠问过的问题:「如果抖音都做好了,为什么小红书依然能够起来?」他想了想:「可能因为小红书坚持做图文,如果 2020 年就做视频可能已经被抖音吞没了。」 踢足球时候,一些进球看似是运气或者「捡漏」,但也是因为球员事先判断出了最有可能捡漏的地方并早做等待和准备,所以说小红书「运气好」或者「选择比努力重要」,这些当然也是称赞,比如选择背后代表的便是战略能力。 不过,倘若将成功归结于外部原因,总会在某些时刻面临自我怀疑,比如倘若外部环境变化了怎么办?比如要去开拓新的领域要怎么做?比如倘若成长到了新的发展阶段原先的选择是否依然有效?比如自己是否配得上如今的规模与地位?比如未来呢? 于是,用户数据与估值的上涨,没有安抚甚至反而加重了小红书的焦虑。 在《小红书的「赵露思」悖论》里,我提到曾经小红书并不着急增长,至少在 2022 年并不着急。 2022 年中,小红书 DAU 大约 8000 万,围绕「1 亿 DAU」发起了几个项目。在一个项目的 KO (Kick-off,启动)会议上,增长负责人说,这个项目主要是为了锻炼团队,能否完成 1 亿 DAU 倒不重要,不着急,因为一定能完成,只是时间问题,可能三个月后,也可能是春节时候。 这种不着急也能从组织架构上看出来。在字节,增长部门一直是最强势的部门之一,但在小红书只是社区部之下的二级部门,并在 2023 年由河童统一负责,其中的信号明显是不能让增长影响内容调性。 那时小红书相信「自然生长」,也就是发现一类生活趋势,之后慢慢养大,等待「破圈」,之后再去下一个圈层,养大,如此反复。河童说:「平台聚合内容,社区聚合人,只要合适的人来了小红书,那么内容自然会丰富起来。」 2023 年春节之后,小红书 DAU 稳定在 1 亿以上,不过之后的增长便明显放缓。媒体传言,河童在 2023 年底因为没能完成 1.4 亿的 DAU 增长目标而离职,但实际上,他从夏天开始已经长期请假,开始还会审批一些流程,之后他的节点也转移给了其他人。 小红书达成 1 亿 DAU 时的庆祝蛋糕 小红书内部的运营方式也变了。 早期的运营逻辑很朴素,核心指标是「生产」和「消费」,也就是新发笔记量和话题浏览量。至于心智,更多时候是一个模糊的概念,依赖主观判断和事后调研。 2023 年之后,星矢越来越频繁地提到增长,开始强调「发展第一」,并且在一些会议上质疑以内容带增长的决策是否有效。各类活动运营的重点也变成了「拉新」,看一个活动能够带来多少新增用户,并且开始设计算法,来算每个用户的拉新成本是多少。 有参与小红书高层经营会的人说,星矢对增长显得很执着,并试图用抖音的方式去做增长。 星矢开始到处物色人才。有在阿里的中高层频繁接到猎头电话,说小红书 CEO 想亲自来聊聊,看他有没有兴趣。当他表示可以聊聊之后,当天下午猎头又打来电话,说星矢已经在杭州了,现在就可以见面。物色的人才不仅包括内容运营,也包括市场、产品、增长等等。 最终有了 2024 年春晚前后的调整。那次调整几乎是换血似的:小红书的社区运营和市场部门分开,花钱有了更多的限制;空降了市场部负责人、社区负责人、产品负责人、直播负责人;各个垂类运营负责人也至少更换了一半。帕鲁、云帆也都是那时加入了小红书。 我之前说 2024 年春晚是小红书的转折,现在需要重新表达一下,并不是越过 2024 年春晚,小红书就变成了另一家公司,这个变化可能比所有人预料的都要久。 在 2023 年之前加入的小红书垂类负责人,大多离开了小红书,新岛是为数不多依然留下来的「老人」之一。不过新人也并不都落地成功。有中层自己统计了一下,和自己一起参加新人培训的人大约有 20 人,等到 2025 年 3 季度,只有七八个还留着。 业务上也有了新的变化。先前小红书擅长做各类有趣的线下活动,如在上海刚刚解封的时候,与上海的咖啡馆一起送咖啡;发起「骑行友好计划」,用骑行把城市里各个店铺联系起来。这些活动往往会拒绝商业团队的参与,以保持自身的调性。 2024 年开始,活动负责人可以自己选择,是否开放这一活动给商业团队,让他们可以对外售卖。及至 2024 年下半年,几乎所有的社区所建立起来的 IP,都出现在了商业化团队对外的售卖名单上。如小红书外人节便从一个户外组的运营活动,变成招商 PPT 中的 S 级项目。 小红书开始用产品来带动增长。帕鲁来自快手,曾是电商产品的一号位,来到小红书之后,也颇对产品做了很大的调整。 举几个例子,视频播放界面改得越来越像抖音,并且加了分享按钮——这在图文笔记里没有;话题页面改成了纯文字类似微博的模式,而不是像主页面一样是双列信息流;热点先前是基于「小红书调性」的编辑筛选,现在则优先考虑「更能吸引人的话题」,变成了真正的热点导向。 小红书 RedLand 活动现场图 小红书也投入更多的精力在大型活动中,如在复兴岛举办的「Redland 二次元活动」,便在商场、车站都投放了广告,这在以前的小红书极其少见。在八九月份,小红书也大张旗鼓邀请赵露思直播,和微博争夺「娱乐发声第一阵地」,两周的时间里,几乎每天都有关于她的话题登上热榜,把一批用户惹火了,以至于在一条「赵露思要注销微博」的热榜下面,排名靠前的评论问「啥时候注销小红书」。 这些改变,有的收到了成效,有的引起了吐槽,都是小红书探索新路是难以避免的学费,并最终导向这次的调整和选定的道路:Village 的原住民去制造依然具有小红书特色的热点、趋势与活动,Live 则与商业和增长走得更近,去探索另一条路。 这当然是一条难的路,未必是正确的路,但一定是更具确定性的路。 在架构调整后的一次会议上,星矢重新阐述了对社区业务的定位:come for utility, stay for community. 这与投资人 Chris Dixon 十年前所说的「come for the tool stay for the network」类似,最早用来解释为什么 Instagram 会成功:最初它是一套漂亮的滤镜,随后它变成了分享照片的社交网络,用户为了滤镜而来,但留下是为了看别人的生活和积累粉丝。 先前的小红书发展似乎也符合这句话:最初是作为查看海外购物心得的 PDF 攻略,后来演变为种草社区,用户留下是为了看真实的评价和社区互动。星矢也曾在内部信里说:「跟生活息息相关的事,小红书上一定拥有全世界最全的解答。」 小红书用了十多年的时间,成了最实用的生活指南,在很多用户手中甚至取代了百度。只是换个角度,这些都属于星矢所说的「utility」,也就是「有用」,是小红书过去的总结,也是小红书下阶段的起点,而还没能真正建立起 community。 小红书要怎么建立 community?或者说,小红书的终局是什么样子? 或许没人说得清,只是可以肯定,那不会是用户量或者股价构成的数字,而是依然应该与人有关。
华为+DeepSeek,推理性能创新高!技术报告也公布出来了
转载自:量子位 部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了—— 不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构! 而做到这一点的,正是华为昇腾;具体而言,共包含两个产品: CloudMatrix 384超节点部署DeepSeek V3/R1,在50ms时延约束下单卡Decode吞吐突破1920 Tokens/s Atlas 800I A2推理服务器部署DeepSeek V3/R1,在100ms时延约束下单卡吞吐达到808 Tokens/s,可支持灵活的分布式部署 之所以能够这般,是因为华为昇腾所采取的“以数学补物理”——这种通过数学理论、工具、算法和建模等方式,来弥补硬件和工艺的局限性,实现最大化发挥芯片和系统能力效果。 华为昇腾还不只是“官宣”一下而已,后面更会是全面开源。 不仅已经将昇腾在超大规模MoE模型推理部署的技术报告分享了出来,在一个月时间内,还会把实现这些核心技术的相关代码也都会陆续开源出来。 那么接下来,我们就来深入了解一下华为昇腾背后的技术实力。 在华为昇腾上推理DeepSeek 在深挖华为昇腾背后技术创新之前,我们且需了解一下为什么要这么做。 从2017年Google提出的Transformer架构,到2025年DeepSeek V3/R1的爆红,大语言模型的重心正在从训练开发转向推理应用落地。 推理能力不仅是大模型能力的“试金石”,各大企业已从 “拼模型参数” 转向 “拼推理效率”: 谁能让大模型在实际应用中跑得更快、更稳、更省资源,谁就能在商业化浪潮中抢占先机。 然而,以6710亿参数的DeepSeek V3为例,这类超大规模MoE模型虽然强大,却给硬件带来三大 “成长烦恼”: 内存压力山大一个模型包含257个专家,每个专家 “体重” 2.5G,普通64GB内存的AI硬件根本 “扛不动”,必须依赖集群协作。 通信开销爆炸专家分布在不同芯片上,数据传输耗时甚至超过计算时间,就像团队成员频繁开会沟通,效率大打折扣。 架构创新的 “甜蜜负担”例如 “多头隐式注意力机制(MLA)” 虽然压缩了数据空间,却导致中间变量激增,对芯片的计算能力提出更高要求。 面对这些挑战,华为团队从算子、模型和框架三方面入手,基于昇腾硬件特性,开发了一整套面向集群的大规模专家并行解决方案。 在硬件部署上,华为团队根据不同硬件配置——CloudMatrix 384超节点和Atlas 800I A2推理服务器,针对性地采取了不同的部署优化策略。为解耦Prefill和Decode阶段的时延约束,昇腾采用PD分离部署方式。 在框架侧,昇腾基于vLLM框架,适配DP和EP等多种并行策略,通过Prefill调度分桶、灵衢互联与分层传输等技术来降低调度开销,优化请求下发、调度策略等环节,提升系统性能。 在模型方面,昇腾采用A8W8C16量化策略,其中A8W8使用INT8,C16使用BF16,并针对不同机型进行差异化部署。 针对CloudMatrix 384超节点,其强大的组网能力大幅降低了通信耗时,释放了昇腾芯片的算力。 团队采用大规模EP并行部署,Prefill使用16卡,Decode使用144卡,其中128卡部署路由专家,16卡部署共享专家,MLA部分采用DP部署。 尽管存在时延约束、带宽抢占、调度开销、负载不均等因素影响,最终在50ms时延下,单卡decode吞吐达到1920 Token/s。 针对机群规模较小但部署更加灵活的Atlas 800I A2服务器,华为团队采用多节点互联的方式进行部署。 作为示例,华为团队使用2机16卡进行Prefill,4机32卡进行Decode,每卡部署8个路由专家和1个共享专家,MLA部分采用DP并行,并针对性地使用在真实负载下性能更优的AllGather/ReduceScatter的通信方案。 通过各种策略优化,在100ms时延下,单卡吞吐达到808 Tokens/s。 还有更多优化技术 在推理框架优化方面,针对高并发场景下单点API Server这一性能瓶颈,华为团队设计了API Server横向扩展方案,采用水平扩展技术提升框架的请求响应能力,显著降低用户请求延迟并提高整体服务吞吐量(QPS)。 针对MoE模型中的负载不均问题,基于动态调整专家部署与缩小通信域、热专家冗余部署、实时调度与动态监控机制等核心技术,降低显存占用的同时实现动态负载均衡。 在投机推理技术的工程化应用中,如何将其从小批量低时延场景扩展至高吞吐量场景,是行业面临的共性难题。 华为团队基于昇腾芯片高计算带宽比的硬件特性,提出FusionSpec投机推理引擎,针对性优化多Token预测(MTP)场景下的推理性能: 流程重构将投机模型后置於主体模型,直接复用主体模型的输出结果与控制参数,大幅减少框架耗时,完美适配参数-数据分离(PD 分离)的分布式部署架构; 轻量步间优化对投机推理场景中的框架和算子优化实现了轻量步间准备,适配多核并行的全异步框架。 在通信优化方面,华为昇腾也有三大妙招。 首先,针对主流张量并行(TP)方案中AllReduce通信的固有缺陷(通信次数多、数据量大、冗余计算显著),华为团队推出FlashComm通信方案,通过集合通信逻辑重构与算子位置编排,实现低比特、低维度数据通信,在降低通信时延的同时消除冗余计算,最终实现25%通信量的降低和10%推理性能的提升。 其次,在FlashComm基础上,团队进一步提出层内并行转换方案,针对Prefill阶段的MLA层,通过张量并行(TP)与数据并行(DP)的灵活转换,消除节点内卡间求和操作,并利用网络低维特性与量化技术压缩通信数据量,显著降低跨卡通信时延,为大模型分布式推理提供更高效的通信支撑。 第三,通信方面的优化还有一个并发机制的深度挖掘,包括: 计算通信并发通过Gate函数计算与AllGather通信的解耦,结合共享专家的数据并行(DP)策略,利用昇腾多流机制实现计算与通信的并发执行,最大化硬件利用率; 通信通信并发针对DeepSeek模型的量化场景,将激活值与scale的传输任务并行处理,在不增加带宽压力的前提下掩盖小数据量通信的启动开销; 通信和权重预并发利用通信阶段HBM带宽低占用特性,提前将后续算子权重预取至缓存,降低计算阶段的数据搬运开销,实测MLA层计算性能提升10%。 最后,就是在算子方面的优化了。华为团队通过以数学补物理,发展了一系列的优化技术。 针对MLA算子中间变量膨胀与计算量激增的挑战,团队开展硬件亲和性优化: 算法重构:提出AMLA算法,通过二进制编码与存内计算,将乘性计算转换为加性等价形式,直接在全局内存完成输出更新,减少数据搬运耗时; 缓存策略:通过L1/L2缓存精细化管理与K-buffer流水排布,提升缓存命中率与计算效率,实现张量计算与向量计算的相互掩盖; 前序算子融合:在Prefill与Decode阶段分别采用双流并发与算子融合技术,结合权重预取、分块策略及定制指令集优化,构建端到端高效计算链路。 MoE算子方面的优化则包括: 通算融合算子:针对EP部署模式下MoE专家的跨卡调度难题,设计MoeDistributeDispatch/Combine算子,通过 Token 粒度的流水排布与内存语义通信技术,将通信与计算并行化,减少卡间同步开销; SMTurbo-CPP技术:针对小数据量通信效率问题,通过读写混合、聚合流水等硬件并发技术,提升AllToAll(v)算子的吞吐能力,降低Dispatch/Combine场景时延; 细粒度分级流水算法:基于Atlas 800I A2组网特性,实现节点内/节点间的集合通信并发执行,大幅提升集群环境下的带宽利用率。 性能创新高 在Decode性能测试方面,Atlas 800I A2所采用的方式是: 序列长度为2K输入+2K输出和1K输入+2K输出两种情况 在使能MTP进行推理加速的情况下,由于不同测试数据集和业务场景的MTP接受率不同,性能测试结果会有比较大的偏差。因此在计算时延和吞吐的时候默认按照70%接受率来折算。 TPOT(Decode平均每Token时延)不超过100ms。 具体表现如下所示: 在Prefill上的测试方法是,单batch输入序列长度为2K/1K,通过拼batch的方式拼成一共16K序列。对于序列长度是2K,共8 batch拼成一共16K序列的场景,端到端耗时为631ms,卡均吞吐为1622 Tokens/s。 具体表现如下图所示: 在2025年4月,硅基流动联合华为云基于CloudMatrix 384超节点昇腾云服务和高性能推理框架SiliconLLM,用大规模专家并行最佳实践正式上线DeepSeek-R1。 该服务在保证单用户20 TPS(等效50ms时延约束) 水平前提下,单卡Decode吞吐突破1920 Tokens/s,可比肩H100部署性能。
小米豪赌造芯,能否复制华为奇迹?
小米的两大旗舰产品官宣,将于5月22日发布。一个是3纳米芯片,另一个就是小米首款纯电SUV:YU7。其中的重头戏,就非YU7莫属了。 这是小米最具市场穿透力的一款车,没有之一了,也是被无数友商盯住的一款车。如果没有安徽的那一场车祸,YU7几乎提前预定年度超级爆款。但车祸事件发生以后,小米口碑急转直下,小米SU7的订单量也从不可阻挡的增长中,出现回落。 在这场舆论风波中,既有小米自身的原因,但也离不开友商的推波助澜。因为在一个月前,小米YU7的市场期待值,确实太高了。车还没发,就已经提前爆红了。叠加中国人对SUV额外的偏好性,YU7的销量只会比SU7更猛。 然而,安徽的一场车祸,彻底打断了小米YU7的宣发节奏。本来,4月就要在上海车展首发亮相的,被推迟到了5月22日。为了确保YU7的发布成功,小米也抄了华为的作业。因为此时此刻,小米遭遇的困境,华为也遭遇过。 当时,华为联合赛力斯打造的第一款车SF5,因卖得太差了,被迫停产。而问界M7呢?在经过一个短暂的高峰以后,销量就跌入低谷,一度跌到2000来辆。华为汽车业务来到生死边缘,那它是怎么起死回生的呢?这源于一场特殊的发布会。 当时,美国商务部长雷蒙多访华,华为借势宣布,重返5G!但这时候,华为没有发布5G手机,而是趁势发布了全新问界M7!靠着这一波技术逆袭,把全新问界M7也一波带飞了。当然,不可忽视的是,全新问界M7技术大幅升级,而价格却更便宜了,性价比被拉得很高。 小米呢?也想借助芯片技术的突破,一举把小米YU7,推向另一个高潮。从发布会预热来看,小米要发布的将是国内第一颗3纳米芯片。而3纳米芯片,中芯国际是造不出来的。三星可以造,但良品率太低,会拉高成本。向来以性价比著称的小米,它的3纳米芯片基本就是台积电代工的了。为什么是台积电?有两个原因:一是,美国要求台积电拉黑华为,但并没有拉黑小米。二是,台积电技术最成熟,良品率最高,成本控制也能做到最好。 而这颗芯片,基本上就是国内最先进的一颗通用芯片了,没有之一了。所以,拿这颗芯片来打翻身仗,小米也是下足了血本。同时,小米也担心YU7发布失败,属于是拿3纳米芯片来为YU7的发布,保驾护航了。 那为什么小米要造芯呢?其实,小米不造芯已经不行了。所有的高端品牌,都有自己的芯片。像苹果有A系列,三星别说芯片了,连阿斯麦光刻机都买过去了,亲手打造了自己的芯片生产线,芯片量产技术仅次于台积电。华为呢?在没被封锁前,也设计出了全球第一款5G麒麟芯片。 所以,小米要冲击高端,芯片就绕不过去。而造芯呢?也有助于提升小米汽车的品牌力,属于是,一匹马拉两辆车,既能带动手机业务冲击高端,又能拉动汽车销量,还能拔高整个小米的品牌价值。小米早就跻身世界500强了,但它的硬核技术是短板。这个短板,是一定要补上来的。 因此,小米的这颗3纳米芯片,背负着小米品牌向上的历史使命。YU7能不能一扫阴霾,一炮而红?SU7能不能打赢这个翻身仗?小米汽车能不能复制华为的逆风奇迹?就看YU7能不能成为第二款问界新M7了
钉钉宣布上架鸿蒙电脑版:针对折叠电脑推出全屏视频会议功能
快科技5月19日消息,随着鸿蒙个人电脑的正式亮相,钉钉同步推出了专为鸿蒙PC平台打造的原生版本,成为首批在鸿蒙电脑端提供完整AI办公功能的应用之一。这一版本并非简单的移动端移植,而是基于PC用户特有的使用习惯全新开发,包括鼠标操作、键盘输入、大屏窗口交互等场景都进行了深度优化,确保用户在鸿蒙电脑上获得更流畅的办公体验。 针对鸿蒙折叠屏电脑的特性,钉钉即将推出适配各种折叠形态的全屏视频会议功能,为用户带来更沉浸式的会议体验。 在功能完整性方面,钉钉鸿蒙电脑版提供了包括音视频会议、智能文档、云盘等在内的全套办公工具,其办公效率完全媲美Windows和macOS平台。 性能方面,钉钉对鸿蒙桌面操作系统进行了底层优化,显著提升了应用启动速度、消息推送及时性和多任务处理能力。AI功能方面,除了内置钉钉AI助理外,还整合了闪记、多维表等AI应用,帮助用户提升工作效率。 在信息安全方面,钉钉鸿蒙电脑版结合鸿蒙系统的芯片级全盘加密技术,为政企用户提供了端到端的安全防护方案,全面满足用户对数据安全和隐私保护的核心需求。这一版本的推出,标志着钉钉在跨平台办公生态建设上迈出了重要一步。
苹果高管因作伪证遭刑事调查,科技巨头律师团队被指怂恿客户违法
IT之家 5 月 19 日消息,《华尔街日报》日前发表了一篇文章,对苹果、亚马逊、谷歌等大型科技公司的律师团队提出了质疑。文章指出,这些律师不仅未能为客户提供恰当的法律建议,甚至“积极怂恿”客户违反法律。 该文章指出,苹果公司在 Epic Games 诉讼案中遭到法官斥责的一个原因是,其律师怂恿公司滥用法律特权。 据IT之家了解,苹果在该案件中基本胜诉,但在唯一败诉的领域,苹果却拒绝履行法官的判决。苹果声称,即使允许用户在应用商店之外进行应用内购买,其仍会“在扣除支付处理费用后,要求获得相同的净佣金”。这完全背离了法官判决的初衷。苹果声称其这一决定的动机并非出于财务考虑,但法官对此表示怀疑,并要求苹果提交所有与该决定相关的内部文件。苹果声称无法在规定时间内提交,但第二位法官也认为苹果在撒谎。最终,主审法官认定一位苹果高管在法庭上作伪证,并已将此事移交刑事调查。 苹果最初以“特权”为由,拒绝提交数千份内部文件,声称这些文件涉及公司与律师之间的讨论,受到法律保护。然而,在法官要求更仔细审查这些文件的特权声明后,苹果不得不承认这些文件并非特权文件。 《华尔街日报》指出,苹果、谷歌和亚马逊等科技巨头都曾被指控过度利用法律特权,拒绝向政府或 Epic 的代理律师提交本应公开的内部文件。 迈阿密大学法学院教授、前联邦贸易委员会副主任约翰・纽曼(John Newman)表示:“律师本应在客户行为越界时说‘不’,但他们不仅没有履行这一职责,反而积极怂恿这种行为。”他认为这种行为“似乎已经形成了一种文化,如果不是这些公司被视为科技行业的‘明珠’,我们可能会将其称为一种‘无法无天’的文化”。 一位反垄断专家指出,这些律师之所以如此行事,是因为他们从客户那里获得了巨额报酬,因此不惜一切代价保护客户利益,即使被发现也几乎不会面临任何后果。 前联邦贸易委员会律师、反垄断律师梅根・格雷(Megan Gray)将这种滥用法律特权的行为归因于“特权阶层的傲慢”。她曾在谷歌竞争对手 DuckDuckGo 工作,她认为一些律师可能并不担心越界行为的后果,因为被抓到的后果似乎微不足道。
小米15周年发布会官宣:除了自研玄戒O1芯片,还有首款SUV
凤凰网科技讯(作者/于雷)5月19日,小米15周年战略新品发布会定档5月22日晚7点,届时将发布全新手机SoC 芯片“玄戒 O1”、全新旗舰小米15S Pro与小米平板7 Ultra及全新小米 YU7,小米首款SUV。 目前官宣的几款新品都有大量信息曝光。 据悉小米15S Pro首发搭载小米玄戒O1。相关曝光信息显示,玄戒O1的CPU采用10核架构,分别是2×3.9GHz超大核+4×3.4GHz大核+2×1.89GHz中核+2×1.8GHz小核;GPU则是Immortalis-G925。 据数码博主@肥威 发文爆料,小米玄戒O1在Geekbench 6.4.0版本测试中,单核成绩3017,多核成绩9264。作为对比,天玑9400+的单核成绩为2943,多核成绩为9185。 小米平板7 Ultra则是一款14英寸的大尺寸平板电脑,有望同步首发搭载玄戒O1,支持120W有线闪充,是小米史上最强平板。 小米YU7是小米第一款SUV,这款汽车早在去年就已现身工信部。 根据工信部公布的证件照,小米YU7拥有类似于小米SU7的前后灯组设计,前灯组可见米字图案,后灯组依然是熟悉的土星环,不过尺寸和形态都有调整,其尺寸为长4999毫米、宽1996毫米、高1600毫米。 根据申报显示,小米YU7提供单电机和双电机(高/低功率)车型。单电机车型最大功率为235千瓦;双电机车型(低功率)前电机最大功率为130千瓦,后电机最大功率为235 千瓦;双电机车型(高功率)前电机最大功率为220千瓦,后电机最大功率为288千瓦。 在电池配置方面,此前工信部数据显示,小米YU7将匹配容量为96.3千瓦时和101.7千瓦时的电池组。
腾讯AI下了一场“及时雨”
本月17 日,中国 AI 圈出现了一个“巧合”般的同日亮相。 这一天,两家头部科技公司,都把各自最重要的 AI 人物推到了台前——小米大模型核心负责人罗福莉公开亮相;腾讯则正式官宣前 OpenAI 科学家姚顺雨,出任“总裁办公室首席 AI 科学家”,并同时负责 AI Infra 与大语言模型相关团队。 关于两人加入对应公司的传闻,过去数月中行业内早有传闻。如果说罗福莉的亮相是和小米生态大会同步的节奏,姚顺雨的官宣的时间点则更加耐人寻味。 在此之前,中国AI 产业的C位,基本上由阿里和字节轮流坐庄,而腾讯除了在DeepSeek横空出世时发力了一波AI2C之后,似乎总是蓄势不发。 但以腾讯的地位和体量,必然难以接受长期远离舞台中央的局面,尤其是在两个老对手轮流发大招刺激下,鹅厂做出调整和回应势在必然。17 日这一天所做的人事任命和架构调整,显然是腾讯试图重返舞台中央的标志性一步。 伴随姚顺雨亮相的,是一整套围绕大模型研发重构的组织调整——AI Infra、AI Data、数据计算平台等部门被明确拆分与强化,原本分散在不同团队中的基础能力,被拉回到一个更集中的中枢。 不过,问题也随之而来,这场高调的人才引入,究竟意味着什么?在字节、阿里不断放大模型与应用声量的当下,姚顺雨会是腾讯 AI 当下的“及时雨”吗? A 姚顺雨与腾讯的交集,并非从官宣那一刻才开始进入公众视野。 最早的信号出现在 9 月。彼时,业内突然流传出“前 OpenAI 研究员姚顺雨已加入腾讯”的消息,并迅速被附加上“上亿年薪”“顶级科学家回国”等的标签。 腾讯随后通过官方渠道进行了辟谣,但辟谣的内容却有些偏离重点——只否认的是“上亿元薪酬”的说法,而并未就是否入职这件事作出正面回应。 几个月后,答案正式揭晓,姚顺雨的“空降”不仅仅是一次人才引进,而是直接引发了腾讯大模型业务的组织架构调整。 根据近期报道披露,腾讯对内部大模型相关业务进行了系统性的重组:原本相对分散的模型研发、数据与工程能力,被重新整合为三条更清晰的主线,分别聚焦 AI 基础设施建设、数据与评测体系,以及面向机器学习的数据智能融合平台。 在这一轮重组中,姚顺雨被赋予了核心位置。他以 CEO首席 AI 科学家的身份进入腾讯技术序列,同时兼任 AI Infra 与大语言模型部两个关键方向的负责人。这意味着其职责并不局限于单一模型或研究项目,而是直接覆盖算力基础设施、训练框架以及模型能力演进等多个关键环节,承担起跨团队的统筹责任。 值得注意的是,在正式官宣之前的数月里,姚顺雨已经在 X上发文:“如果你收到裁员影响,欢迎私信我。” 此举曾被一些业内人士解读为其正在为新团队搭建班底。顶尖研究者本身所具备的号召力,往往是人才战略中最有效的一张牌。 这样的案例,今年以来一直在腾讯的竞争对手身上上演,过去一年,中国头部科技公司几乎同步加大了对顶尖 AI 人才的争夺力度。字节跳动在年初引入前 DeepMind 副总裁吴永辉,并让他领导Seed团队,强化基础研究与模型能力建设;阿里则引入知名 AI 科学家许主洪,负责 AI To C 与 Agent 相关研究,试图在消费级智能体方向重新建立技术节奏。 从业务层面来看,腾讯选择在下半年引入姚顺雨并非心血来潮。过去一年,腾讯在大模型领域并非没有动作,其优势更多体现在视频生成、3D 建模、多模态内容理解等方向,并在部分评测榜单中取得过可观成绩。这些能力与腾讯长期积累的内容生态、游戏与社交业务高度相关。 根据腾讯官方披露的信息,混元已累计开源十余项模型与组件,覆盖文本、图像、视频与 3D 方向。其多模态能力已接入视频号、腾讯游戏与广告生产体系,逐渐形成规模化应用。 但在推理能力、长文本处理以及更具系统性的 Agent 化能力建设上,腾讯尚未成为塑造行业心智的那个角色。相较之下,这些恰恰是当前大模型竞争中,逐渐被视为“通用能力底座”的方向,尤其是在需要走量的C端市场。 结合姚顺雨的技术背景,不难发现与腾讯当前的“短板”形成了呼应。而与之同步发生的架构调整则表明,引入姚顺雨,一方面是腾讯有借助头部人才“树大招风”之意,针对AI人才进行补强,同时也是对AI战略调整的一次重要信号。 B 当前, AI 技术正处于从实验室走向产品级落地的关键拐点上,单靠“模型更大、数据更多、算力更强”的路径,正在显露出边际效用递减的迹象。这是姚顺雨此前在一档播客中表达的观点。 姚顺雨在其文章《The Second Half》中提出,AI 已经进入一个新的阶段:真正的分水岭不再是模型是否足够强,而是模型是否开始参与现实任务、是否能够在真实环境中被衡量、被纠错、被持续改进。他将这一变化概括为“从解决问题,转向定义问题”,并强调在这一阶段,评测的重要性正在超过训练本身。 这位前OpenAI科学家的观点,无疑是对当前AI产业竞赛规则的一次界定。 过去几年,AI行业的主要共识是“能力先行”——只要模型足够大、足够聪明,应用自然会随之出现;但进入所谓“下半场”后,问题开始反转:模型能力已不再稀缺,真正稀缺的是可被反复执行、可被量化评估、能够稳定交付结果的任务体系。 把这一逻辑放回腾讯的现实语境中,不难发现,过去一年,混元在多模态、开源等技术层面持续积累声量,也多次进入开源社区的讨论视野;但在更广泛的用户感知中,混元长期却有些“存在感不足”。 真正面向 C 端的窗口,更多落在元宝这一AI原生App上,但根据 QuestMobile 的 2025 年三季度 AI 应用行业报告,在原生 AI 应用的月活跃用户(MAU)排名中,豆包以约 1.72 亿领先、DeepSeek 约 1.45 亿,而腾讯元宝的 MAU 仅约 3,286 万,远落后于头部竞品。 而在微信上,腾讯也先后作出一些尝试。2025 年以来,微信开始对“搜一搜”进行 AI 化改造,多家媒体披露,AI 搜索正从二级入口被提到一级入口,用户点击顶部搜索框即可调用 AI 搜索能力。 但另一方面,腾讯对于通用Agent的态度也相对谨慎,反观护城河的另一边,字节方面已经尝试将豆包推进到手机OS层面,阿里在近期推出夸克AI眼镜,将模型能力的“有用”“可用”一面落地到更生活化的场景中。 这些尝试本身并不存在对错,但它们共同揭示了一点:当 Agent 走向执行层,技术问题会迅速转化为产品、平台与治理问题。 而在这一点上,腾讯面临的约束条件更为复杂。作为中国最重要的超级入口之一,微信本身既是 Agent 的潜在舞台,也是规则与边界的制定者之一,这决定了腾讯在推进通用 Agent 能力时,很难像创业公司或单一硬件厂商那样激进试错。 也正是在这样的背景下,姚顺雨的加入,似乎意味着腾讯出现了一个潜在的方向转移。腾讯总裁刘炽平曾经公开说过,“微信最终会推出Agent。但现在,AI市场仍然非常早期”。 作为Open AI Agent战略的重要人物,姚顺雨也许有望推动这一愿景更早实现。 但想要把Agent能力融入到现有的超级入口中,腾讯的问题还不只是模型侧。 C 回到腾讯的AI战略上,如果只把腾讯当前的处境,归因于“模型不够强”,显然过于简单。 过去一年,腾讯并非没有在 C 端下注。以“元宝”为代表的独立 AI 产品,在买量和投放层面并不保守:多份投放复盘显示,2025 年以来,元宝的素材投放量持续攀升,长期位于头部区间,但转化效率并未同步改善。 与之形成鲜明对比的是,在同一时间段内,豆包已经在用户规模上拉开明显身位差距——到 2025 年 10 月,二者的 DAU 量级相差接近一个数量级,中间还隔着一个DeepSeek。这意味着,即便在“肯花钱”的前提下,元宝依然难以追上对手,问题很难只用“起步晚”或“模型差距”来解释。 这一点,在腾讯对外的表述中同样可以找到侧证。在财报沟通与公开采访中,管理层多次强调 AI 投入会持续增加,但更强调“理性投入”和资源效率。官方的态度看起来像是,腾讯并不急于用一款 C 端 AI App 去“证明自己”,而是仍在寻找更符合自身体系的落点。 但 C 端竞争并不会因为一家公司的节奏选择而放慢。对元宝而言,压力并非只来自前方的豆包,还来自身后的快速追赶者。 随着阿里方面千问App近期发布,其投放和下载节奏明显加快:在公测首周累计下载突破 1000 万次,显示出强劲增长势头。 与此同时,腾讯元宝虽凭借生态投流维持在苹果下载榜前列,但在活跃体量上仍落后于豆包和 DeepSeek,而且在投放测有被千问反超的趋势。 这种“前堵后追”的局面,使元宝所处的位置愈发尴尬:向前看,豆包已经占据规模与心智优势;向后看,阿里拥有更完整的产品矩阵与入口资源,随时可能通过协同打法放大单点突破的效果。 这样的被动和腾讯长期的策略有关,而腾讯长期以来更偏向“赋能式 AI”——模型服务于既有业务,而非重构业务本身。这种策略在稳态时期有效,却在AI生态爆发的25年下半年却显得被动 。 这种“保守”甚至不是AI研发层面,而是产品层面本身。即便是在微信内部,AI 能力的释放依然谨慎,更多作为功能增强,一直没有迈出革命性的一步,姚顺雨的加入,无疑是腾讯AI的一场“及时雨”,但能否颠覆过往的AI战略思路,仍然有待观察。与其把姚顺雨视为腾讯 AI 的“答案”,不如把他视为一个信号:腾讯已经清楚地认识到,单靠渐进式改良,很难在 2026 年之后更加激烈的 AI 竞争中保持从容。 无论是元宝的追赶压力,还是微信在入口层面的抉择,都在倒逼这家互联网巨头重新思考一个问题——当 AI 从能力竞赛走向产品与入口竞赛,腾讯是否愿意、也是否准备好,追赶上对手的步伐。
租车行黑幕套路遭曝光!半夜有人偷偷划车 还车时被车行索赔
快科技12月18日消息,近日,有网友发帖爆料称,云南大理一租车行自导自演,员工半夜偷偷来划伤自己租的车,第二天还车时以此索赔600元。 这位网友表示,租车时没有买保险,然后根据定位找到车,晚上偷偷摸摸划车要赔偿,这已经属于诈骗行为了,数额巨大已可以坐牢了;就算你买了保险,但是轮毂不赔,他们还会划你的轮毂,太可恨了。 网友称,他觉得这不是员工一个人的事,背后肯定有人指使,遂报警处理,警方调取监控发现,划车男子竟是该租车行员工。 此事引起热议后,发帖网友的朋友向媒体透露,划车的员工已于12月11日,被公安机关处以12天行政拘留,并罚款800元。 租车行负责人联系他,退还此前600元赔偿,但要求我们不得再以任何理由,通过任何渠道追究责任,我认为这样的附加条件并不合理,暂时没有收下归还的钱。 而租车行的负责人称,划车男子在租车行兼职代驾,并表示划车是其(该代驾)个人行为。 对此,有网友在评论区称:“这已经是租车行的老套路了,如果是在小公司租车,停车尽量停在有监控的地方。” 还有网友提醒称,“租车可以选择神州、一嗨这类大平台,虽然价格可能会贵一点,但好处就是保险和协议完善,不会搞这种见不得光的小动作。”
挑战FFmpeg:谷歌Chrome浏览器多媒体引擎加速Rust化改造
IT之家 12 月 18 日消息,科技媒体 Windows Report 今天(12 月 18 日)发布博文,报道称谷歌 Chrome 浏览器正秘密测试一款名为 Symphonia 的音频解码器,该组件完全基于 Rust 语言编写,意在探索替代沿用已久的 FFmpeg 媒体引擎的可能性。 IT之家注:FFmpeg 是一套全球通用的开源计算机程序,用于记录、转换数字音频和视频,并能将其转化为流。它是数字媒体界的“瑞士军刀”,几乎所有视频播放器和浏览器都用它来把网上的视频和声音文件“翻译”成屏幕和扬声器能播放的信号。 FFmpeg 一直是 Chrome 处理音视频解码的核心引擎,虽功能强大但架构相对陈旧,而此次测试标志着浏览器底层技术栈可能迎来一次重大升级。 Symphonia 是一款开源音频解码库,其最大的亮点在于完全采用 Rust 编程语言编写。相比 FFmpeg 这种基于 C/C++ 的传统媒体引擎,Rust 语言在内存安全性上具有天然优势,能有效减少漏洞风险。 谷歌目前的策略是将 Symphonia 作为一个“可选的解码路径”集成到 Chromium 中。这意味着,在未来的浏览器版本中,Chrome 可能不再完全依赖 FFmpeg 处理所有音频任务,而是根据场景灵活调用更安全、更现代化的 Rust 组件。 Symphonia 源头可追溯至 2023 年开启的一个 Chromium 问题追踪帖。开发者们当时主要聚焦于“用 Rust 替代 FFmpeg 部分功能”的理论可行性,并未制定具体实施计划。 然而,进入 2025 年后,该项目明显提速,Chromium 代码库中开始密集出现相关代码提交(Commits)。开发团队不仅将 Symphonia 成功编译进浏览器构建版本,还着手在更多桌面平台及 Android 系统上启用该功能。 Symphonia 解码器已出现在 Chrome Canary(金丝雀版)等测试版本中,默认处于关闭状态,仅能通过特定的功能标记(Feature Flag)手动开启,且初期仅支持少部分音频格式。 对于普通用户而言,现有的音频体验不会发生任何改变,FFmpeg 依然是处理网页音频的绝对主力,谷歌方面尚未发布将 Rust 解码器作为默认选项的正式时间表。
AI接管输入法
作为AI技术触达C端用户最高频的入口之一,输入法赛道悄然掀起了一场由大模型主导的新浪潮。 其中,字节、百度、腾讯等科技巨头纷纷将各自核心大模型能力植入输入法产品,大厂的扎堆入局促使指尖上形成了些许“智能内卷”,这不仅让搜狗等传统输入法大厂感受到前所未有的压力,同步引发了行业对用户真实需求、产品核心价值的深度思考。 回到巨头们的商业化诉求和用户真实需求层面,在效率提升与功能冗余的平衡、智能体验与隐私安全的平衡中,输入法赛道的蛋糕红利并不如其他领域动辄千亿级那般大。 AI接管输入法,有人是为了在这场变革中赢得新的商业筹码,而有人也将在各方势力挑战下,艰难承压。 至于用户究竟对大模型输入法有多大的依赖,还是个疑问。 A 在豆包手机助手将智能能力,无缝渗透到手机终端的每一个场景之际,输入法这个看似基础的工具,其实同样也迎来了从功能实现到体验升级的转变。 换句话说,在模型能力卷到指尖的趋势下,原本有些古老的输入工具如今成为了一种智能助手。这是因为,过去的输入法的核心价值是精准输入,解决的是用户“怎么把字打出来”的问题。但大模型的加入,让输入法开始思考“用户想表达什么”,并主动提供解决方案。 其中的核心进步是:感官进化。 即大模型赋能技术突破体现在轻量化部署、多模态融合(语音、图像等输入)、端云协同上,进而赋予输入法更强的理解与生成能力,让用户在多场景实际中解决社交创作低效、跨语言沟通难等痛点。 具体而言,《2025年中国第三方输入法行业洞察报告》指出,AI 输入法使用场景以日常互动为主,占据了45.0%。功能偏好上,AI 语音输入(识别方言 、外语)使用率最高为40.9% ,AI 智能回复,例如高情商沟通等使用率为29.8% ,颇受用户欢迎。 输入效率层面,模型让输入法的实时纠错功能已能精准识别音近字、形近字错误,甚至纠正语法逻辑偏差。 我们考察了市面上的几款软件,大多支持方言识别(覆盖粤语、四川话等30余种方言),还能精准捕捉语气词、口头禅,甚至区分多人对话中的不同发言人。 另外一个趋势是多模态输入。例如,有的输入法支持图像识别输入(拍照提取文字并智能排版)、手势控制输入(滑动手势完成标点、换行),融合语音、图像、文字等多种输入方式,构建起全场景输入解决方案。从权威机构给出的评分看,多模态输入满意率还有待提升。 当然,上述种种变迁背后,有科技巨头密集布局以及差异化竞争的身影,行业 “马太效应” 显著。 我们曾在《豆包“输入”微信里》一文中指出,豆包输入法颇为“激进”,它把语音输入作为最大卖点,使用的是Seed - ASR2.0模型,而不是传统的机械转写语音。此外,豆包输入法还提供了150MB的离线语音模型,无网时也能实现0.8秒低延迟语音转换。 此外,字节跳动的大模型重点强化“内容生成”与“多模态交互”,其推出的“文案生成”功能,可根据用户需求生成朋友圈文案、工作汇报、营销话术等多风格内容。 百度输入法主要依托文心一言大模型,在”知识问答+场景化推荐”方面,在搜索、办公场景中,可直接基于输入关键词提供相关知识解读与内容模板。 相比之下,腾讯微信输入法则联动混元大模型,强化生态协同,在微信聊天、公众号编辑等场景中提供无缝衔接的智能输入服务,而讯飞搭载自研星火端侧模型,提升离线语音识别。 站在行业视角来看,当前大模型输入法仍处于0到1.0阶段的演变中,对用户而言,最直观的是聊天沟通时,输入法可以根据对方话语生成得体回复,但对行业来说,抬高的技术门槛正在加速市场洗牌。 随着巨头下场,并用核心技术重构赛道时,传统输入法里的玩家的生存空间不排除在未来会被大幅挤压。大模型带来的技术壁垒,开始改变了让输入法赛道过去的功能竞争格局,取而代之的是母公司的生态与模型技术竞争。 久而久之,市场集中度进一步便可能会向模型公司靠拢。 B 在业内,瞄准输入法的还有闪电说、Wisper Flow等只做语音输入的垂直创业公司,考虑它们市场份额有限,大模型引发的市场洗牌,首当其冲的自然会是传统输入法巨头,尤其是曾凭借拼音输入技术优势占据半壁江山的搜狗输入法。 搜狗的挑战又主要来自外部竞争与内部生态的双重挤压,其市场地位面临挑战。 具体看,不少外部竞争者依托大模型的输入法产品正在实现弯道超车,这对搜狗输入法而言不算好事。虽然在艾媒咨询《2025年中国输入法行业白皮书》中,搜狗输入法仍以42.3%的市场占有率保持领先地位。 可有两点值得警惕。 一方面是新的竞争者持续追赶。例如,百度输入法的市场份额已经达到31.5%,MAU(月活用户)为3.8亿,与搜狗的差距只有4000万;讯飞输入法则以12.8%的份额位居第三,并登顶了“大模型输入法”之首。而豆包本身是国内用户量最大的AI APP,MAU达1.7亿,刚上线的输入法亦在快速成长。 另外一方面,搜狗输入法相较于前几年独占超70%的市场份额,已经大幅度减少。 而用户流失的关键,多少与其功能差距有关。也就是说,搜狗输入法的核心优势集中在拼音输入、词库积累等传统功能上,在AI生成、多模态交互等新功能上相较于模型大厂商,略有距离。 根据QuestMobile 2025年年初公布的数据显示,搜狗输入法的AI搜索插件,目前渗透率低于4%,该数据从侧面佐证了上述观点。 客观而言,搜狗输入法靠接入的“腾讯混元”“DeepSeek” 等模型,还是能够提供一些辅助服务,比如输入“你为什么难过”,左下角会显示出“帮你写问候语”。 只是此类功能在业内不算什么新鲜特色。相比之下,讯飞、豆包、百度等输入法的智能功能可能更能吸引年轻用户,尤其是Z世代群体,他们对信息技术的接受度更高,更愿意尝试模型厂商提供的“AI辅助表达”的新方式。 MobTech 研究院在今年9 月发布的报告中,新装增量上,讯飞输入法以11.2%的增速与增量均居首,百度以4.5%排名第二,搜狗为3.4%,落得个第三名,与榜首差距较大, 而内部生态支持与博弈,以搜狗的处境显得有些尴尬。 多年前,腾讯完成对搜狗的全资收购后,搜狗输入法成为腾讯生态的一员,但随着微信输入法的崛起,腾讯的资源开始向自有产品倾斜。公开数据显示,微信的输入法最早发布于2022年,2023年更名为微信输入法,2024年6月它就推出了接入腾讯混元大模型的首个AI版本,2025年1月更是迭代到了4.0版本。 某种意义上,两者是同一体系内的直接竞品关系。 腾讯在微信生态内可以为微信输入法提供更多曝光入口(如聊天界面默认推荐、公众号编辑首选输入法等),而搜狗输入法面对这种“内部竞争”让搜狗陷入尴尬境地,既无法脱离腾讯生态独立发展,又需要与持续获得资源支持的微信输入法进行博弈。 面对内外市场压力,搜狗输入法并非毫无动作,于是转头就曾宣布与外部大模型厂商合作,推出“AI辅助输入”功能,但从实际体验来看,它的新装增量还待进一步提高。 搜狗本身不是科大讯飞、百度以及字节这些自研大模型的厂商,这是它与外界竞争者的最大区别。随着各方加快大模型功能的融合与创新,其市场份额可能面临新的挑战。比如,此前知名车评人韩路在微博公开发文指责搜狗输入法存在“流氓行为”,即使卸载软件后,桌面右下角仍持续弹出广告弹窗。 弹窗风波本质上也透露出搜狗输入法的变现焦虑与压力。 C 把视线拉回到行业本身,无论是搜狗还是其他,都需要在竞争中直面一个问题,输入法真的需要更智慧吗? 回答这个问题,一看厂商;二看使用群体。 从商业价值来看,与云计算、大模型等千亿级市场相比,输入法市场的商业变现空间有限,即便再智能,不大的“蛋糕”难以支撑大厂持续投入巨额资源,加之输入法市场规模与主要收入来源是小众市场的广告、批发付费、增值服务等,对大厂吸引力恐怕不够高。 偏偏就在这款应用上,输入法的火热却让行业陷入一种“智能焦虑”,有的大厂将输入法定位为AI战略中的关键落子,想试图借助虚拟键盘这一入口背后连接的数亿级用户。同时,输入法作为高频入口,能积累大量用户行为数据,反哺巨头们的模型优化。 由此也对中小厂商带来冲击,似乎不加入大模型功能的输入法厂商,就会被市场淘汰。 再看用户侧。光看技术,用户似乎照样避免不了受到大模型影响。假设往用户画像群体层面深挖,情况则不尽相同。MobTech在研究中提及,大模型的受众用户以中青年以及学生为主,年龄集中在 18-30岁,占比超过70%,其中学生群体占比最高。 调研的结论表明,30岁以上的群体,在智能功能与实际需求之间可能存在错位,这群用户对输入法的核心需求也许仍是“精准、快速输入”,过度复杂的智能功能反而可能成为负担。例如,一些上下文联想生成有时会误解用户意图,生成不符合语境的内容,反而降低用户体验。 况且输入法作为高频工具,涉及大量包括聊天记录、工作文档、个人隐私等敏感信息,智能功能的扩张与隐私保护之间的矛盾,让部分群体避而不及。 例如,启动豆包输入法时,它会明确告知用户,可能收集包括密码、信用卡号等敏感信息。无论是广告引起的隐私滥用,还是技术不成熟导致的信息泄露风险,隐私挑战始终是输入法长期未解的一道商业难题, AI 的出现也未必能完全改变这一困境。 回过头来看,大模型对输入法赛道的重构,属于AI技术赋能C端工具的一个缩影,它既展现了技术进步带来的无限可能,也暴露了行业发展过程中的矛盾与困惑。 技术的演进让输入法完成了从“输入工具”到“智能助手”的跨越,效率提升与体验升级成为不可逆转的趋势。传统输入法巨头在此背景下面临挤压,从用户需求来看,智能功能与实际需求的错位,以及隐私保护间的博弈,还会继续。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。