行业分类:
加载中...
头条分类:
加载中...
对话李开复:大模型应用爆发会带来推理芯片更大增长
《科创板日报》10月8日讯 (记者 毛明江 李佳怡) 李开复,不折不扣的计算机与人工智能领域的老兵。 早在1988年,李开复便在卡内基梅隆大学获计算机科学博士学位,博士论文开发出全球首个“非特定人连续语音识别系统”,该成果获《商业周刊》“年度最重要科学创新”奖。随后,他在苹果、微软和谷歌都曾任职,担任核心技术骨干与重要研究负责人。 他最知名的职业经历,是微软中国研究院(后更名为微软亚洲研究院)首任院长与谷歌(Google)全球副总裁兼大中华区总裁。在ChatGPT出圈带动全球人工智能产业大爆发后,2023年5月,李开复正式投身入局AI大模型领域,带队创立AI创新公司“零一万物”并担任CEO。 在日前上海举行的零一万物华东数智大会会后,《科创板日报》记者采访了李开复,就当前人工智能投资是否过热、AI智能体发展、中国具身智能产业机遇等话题进行了对话。 李开复向《科创板日报》表示,大模型应用的爆发会带来推理芯片需求的更大增长。推理芯片方面和训练芯片不同,没有英伟达那么高的门槛,所以这对中国芯片公司是利好。中国的芯片推理一定是越来越强的。 他还认为,具身智能是特别适合中国的一个业务,因为它把中国的供应链和硬件的优势能够结合进来。机器人和具身智能,这绝对是中国的优势。 “AI Agents不仅是超级员工,也是战略变革利器。”谈及AI智能体的发展,他认同OpenAI CEO 奥尔特曼的观点,未来会有一个人的独角兽出现。就是一个 CEO 来定制很多智能体来帮他做市场、产品、技术、公关、财务、法务等等。未来AI 超级员工占所有员工的比例会越来越大,形成“一个非常高效、超级聪明的人,管理着一大堆智能体”的局面。 《科创板日报》记者采访李开复 以下是《科创板日报》与李开复对话的节选: 记者:当前有关的AI大模型以及产业链等投资热度非常高,美国“星际之门”投资动辄以千亿美元计算。国内寒武纪等公司也获得了资本市场高度追捧。你认为当前AI领域是否存在投资过热现象? 李开复:大家都喜欢讨论什么星际之门、千亿美元投资,但是我们真的要看到的是:会不会GPU越卖越多?肯定会;国产跟美国的GPU会不会都变成很好的投资?也会。但是我们有一件事情要想清楚,AI真正爆发的是应用,对真正的ToB、ToC的用户,对他们产生价值的是应用。 我认为,越来越多的市场份额会进入推理芯片,所以就是我们讨论OpenAI、英伟达、甲骨文等动辄在AI上千亿美元投资的时候,有时候一些对外的公关稿会把(AI大模型的)推理跟训练并为一谈。 但是我们会认为,大模型应用的爆发,其实会带来推理芯片需求的更大增长。那基模(基础大模型)的竞争会继续发生,但是整个行业来看,从GPU花费或者数据中心花费的比例来说,训练芯片的比例肯定是会越变越小。 中国在推理芯片上,一定是越来越强的。推理芯片方面和训练芯片不同,没有英伟达那么高的门槛,所以这其实对中国的芯片公司也是利好。 记者:如何看待具身智能在中国的发展前景? 李开复: 具身智能是特别适合中国的一个业务。因为它把中国的供应链和硬件的优势能够结合进来。所以无论你对中美的AI的底层技术竞争是怎么看,那对于机器人和具身智能,这绝对是中国的优势。 而具身智能之所以“具身”,就是因为它能够把大模型的大脑融合进去。如果说大模型的大脑融进了企业级AI应用,就变成了智能体,那如果它融入了机器人场景,那就是具身智能。 所以大模型对具身智能是非常重要的。今天零一万物本身并没有在做具身智能的项目,但是如果有机器人行业愿意跟我们合作,我们来做智能体方面的探索,我们也非常乐见。 记者:你对国内大模型公司发展怎么看,尤其DeepSeek这样已经获得国际影响力的国内大模型企业? 李开复: 国内可能我们最认可的两个开源模型,是阿里通义千问和DeepSeek,所以我们经常关注,之前也看到其实DeepSeek做了不少升级的动作。我们也感觉到梁文锋比较务实,他没有大招的时候,可能不会把V4或R2推出来。非常期待在不久的将来可以看到,一旦发出来,我们一定会第一时间做适配。 记者:你认为AI将如何改变未来的企业组织形式? 李开复:OpenAI CEO 奥尔特曼曾经说过未来会有一个人的独角兽出现。这其实就是一个CEO来定制很多智能体来帮他做市场、产品、技术、公关、财务、法务等等。 所以,我认为未来真正有价值的,无论是改造一个已有的公司,或者创立一个新的公司,AI超级员工占所有员工的比例会越来越大,形成“一个非常高效、超级聪明的人,管理着一大堆智能体”的局面。AI Agent能够创造巨大的价值,这个价值是怎么去衡量?就是公司的营业额、利润等核心指标。 记者:零一万物的企业战略和定位是什么?在当前竞争环境中如何实现差异化? 李开复:我们不可能去参与打造万亿参数以上超大底座基础模型,这是千亿级别公司的“军备竞赛”。但是对行业来说,头部大模型公司愿意烧这个钱,会把整个行业带到更高的高度。这是第一点。 零一万物所推动的“一把手工程”,就是与目标客户和所服务的企业CEO共绘AI顶层蓝图,输出路线图、技术栈、产品矩阵和交付里程,以战略服务于场景,将战略落地于场景,并且基于场景中积累的实践经验反哺于战略迭代优化,从全局中找到最优解。 我们是能唯一能够放下心态说,什么模型都行,私有化也行,上云也行,然后你开发也行,我们一起开发也行,我们帮你开发也行,为企业提供定制化的AI服务,或者与传统公司在AI应用上进行共创。 记者:在当前ToB市场竞争激烈的情况下,零一万物如何保持竞争力? 李开复:确实ToB的这个领域从外部看来是很卷,但是你今天可能也注意到了零一万物是不再去卷的团队之一。在一个大家都卷的领域,我们有独特的打法。我们的独特打法就是在于深度了解一个公司,尤其是一把手他在乎什么,然后我们怎么能够拿下这样的案子,然后去创造巨大的价值,这个是我们去选择走的一条路。 这条路需要我们能提供一些独特的能力,一个就是和麦肯锡一样可以帮着去制定公司的战略。第二和Palantir和SAP早期一样,能够派人进去做前置工程师。当你自己公司内部的IT部门还没有这个能力的时候,我们不但帮你做出来,还帮你招团队,还帮你去执行,所以我们这个也是比较独特的。 智能体经济时代,AI Agent 是推动企业转型的关键执行者,而Agents 也将带来“基于结果”的商业模式再造。AI的价值正在从“工具”走向“服务”,再从“服务”走向“结果”。
苹果玩转材料魔法:iPhone 18 Fold中框曝光,钛铝CP组合出道
IT之家 10 月 9 日消息,科技媒体 Wccftech 昨日(10 月 8 日)发布博文,报道称在最新投资简报中,分析师蒲得宇(Jeff Pu)透露,苹果正研发首款折叠屏手机 iPhone 18 Fold,预计于 2026 年底发布。 材质方面,蒲得宇分析认为称 iPhone 18 Fold 为平衡强度、重量和散热管理,最大创新在于采用混合金属框架,利用钛金属的结构强度来保证设备的耐用性,同时借助铝金属的轻量化特性来控制整机重量。 钛合金中通常会使用少量铝,而且这两种金属也可以以更高的比例混合。由于钛比铝重,苹果可能计划在框架的承重部分使用钛,在其他部分使用铝,以减轻重量。 作为折叠屏设备的核心部件,铰链承受着巨大的机械应力。行业分析师郭明錤此前也曾透露,苹果将为铰链部件选用钛金属和不锈钢,以确保其在反复开合下的稳定性和对齐精度。 屏幕方面,综合多方消息,iPhone 18 Fold 在展开后将拥有一块 7.8 英寸的内屏,此外还有一块 5.5 英寸的外屏。彭博社的马克・古尔曼称其整体形态可能类似于将两台超薄的 iPhone Air 并排堆叠。 生产进度方面,蒲得宇透露 iPhone 18 Fold 交由富士康组装生产,目前已进入新产品导入(NPI)阶段,这意味着产品已从设计转向生产验证,预计大规模量产将于 2026 年下半年启动。 这一时间线与先前关于苹果首款折叠屏设备将于 2026 年底推出的传闻相符,具体发布时间点很可能在同年 9 月 iPhone 18 系列发布之后。 IT之家注:NPI 是制造业中的一个专业术语,指一个新产品在完成设计后、进入大规模量产前的关键验证阶段。在这个阶段,工厂会进行小规模试产,以测试和优化生产线、解决潜在的制造问题,确保产品能够被稳定、高效且符合质量标准地生产出来。
亚马逊贝索斯“蓝色起源”公司发射火箭送6名乘客亚轨道飞行
IT之家 10 月 8 日消息,据 Space.com 今天报道,亚马逊创始人杰夫・贝索斯创办的“蓝色起源”公司今天举行了其第 15 次太空飞行活动,将 6 名乘客短暂送上太空,其中有一名神秘乘客直到飞行结束才公开身份。 ▲ 图源蓝色起源官网,下同 蓝色起源公司的新谢泼德火箭在美东时间上午 9 点 40 分(北京时间晚上 9 点 40 分)点火发射,开启代号为 NS-36 的亚轨道飞行任务,进程一切顺利,发射约 8 分钟后一级火箭实现垂直动力着陆,飞船客舱随后顺利打开降落伞,顺利降落在美国德州的一处沙漠中。 本次座舱中乘坐着特许经营行业高管 Jeff Elgin、媒体从业者 Danna Karagussova、电器工程师 Clint Kelly III、软件创业者 Aaron Newman 及乌克兰商人兼投资者 Vitalii Ostrovsky,同时还载有一名希望在飞行结束前保持匿名的神秘乘客。 飞行结束后这名神秘旅客表示,他就是生物医疗公司 Insmed 的董事长 William H. Lewis。 目前新谢泼德火箭已经运行近十年,正如其代号所示,今天的飞行任务是这款可回收火箭执行的第 36 次飞行任务,但其中只有 15 次任务载有乘客,其余大多数任务都是无人科研飞行。 官方表示,本次飞行将 6 名乘客带到离地 66 英里(IT之家注:约 106.2 公里)外,略高于卡门线,整个任务耗时 10 分 21 秒,不过官方并未公布这种飞行的单人票价,作为参考,竞争对手 Virgin Galactic 公司的类似服务每人收费 60 万美元(现汇率约合 428.1 万元人民币)。
15年悬案告破:修复iPhone 4“天线门”,苹果只改了20字节代码
IT之家 10 月 9 日消息,科技媒体 9to5Mac 昨日(10 月 8 日)发布博文,报道称困扰业界 15 年之久的苹果 iPhone 4“天线门”事件谜底近日揭晓。软件工程师萨姆・亨利・戈尔德发现,当年导致信号格急剧下降的根本原因并非硬件缺陷,而是一个软件算法错误。 IT之家援引博文介绍,苹果在 2010 年推出的 iPhone 4,因其经典设计备受瞩目,但很快就被一场名为“天线门”(Antennagate)的争议事件抢走了风头。 大量用户发现,当以特定方式手持手机时,屏幕上显示的信号格会发生断崖式下跌。这一发现迅速引发了全球范围的关注和争议,成为苹果历史上一次重大的公关危机。 面对汹涌的舆论,苹果当时采取了多种应对措施,包括时任 CEO 史蒂夫・乔布斯曾公开表示“用户握持手机的方式不正确”。 不过,公司最终还是承认了问题的存在,并被迫向所有 iPhone 4 用户提供免费的保护套(Bumper Case),同时就一起集体诉讼达成和解,向受影响的用户支付了赔偿金。 苹果公司在当年的官方声明中指出,用于计算并显示信号格数的软件算法存在“完全错误”。该算法在许多情况下会错误地多显示 2 格信号,导致用户误以为自己所处区域的信号强度很好。 因此,当用户手持手机影响到天线接收后,他们看到的并非信号真实减弱,而是从一个虚高的、从未真实存在过的满格信号,瞬间回落到真实的微弱信号水平,从而造成了巨大的心理落差。 时隔 15 年,软件工程师萨姆・亨利・戈尔德通过对比固件代码,终于揭开了当年苹果修复该问题的具体技术细节。 他通过分析新旧两个版本的固件发现,苹果在 CoreTelephony 框架下的 CommCenter 安装文件中,修改了一个用于转换信号强度与显示格数之间对应关系的“查找表”(lookup table)。 这个修改仅涉及 20 个字节的数据。原有的查找表数值设定得“过于乐观”,导致大部分时间里手机都会显示 4 到 5 格信号。而新的数值则让信号格的显示曲线变得更加平滑和真实。 这一调整的结果是,用户虽然更难看到满格信号,但信号格也不会再出现断崖式下跌。戈尔德还发现一个有趣的细节:苹果在更新中还略微增加了前两格信号条的高度,这或许是一种心理学上的优化,从而让微弱信号看起来不那么糟糕。
“谷歌克星”杀入浏览器赛道!创始人万字揭秘
编译 | 陈骏达 编辑 | 李水青 当下最火的AI搜索引擎公司,为什么要做AI浏览器? 智东西7月15日消息,近日,在YC创业学校的分享会上,美国AI搜索引擎独角兽Perplexity创始人兼CEO Aravind Srinivas向外界深度分析了Perplexity入局AI搜索,又押注浏览器与智能体背后的转型逻辑。这家被外界誉为“谷歌克星”的创企,野心不止于AI搜索,还希望将其AI浏览器Comet打造为下一代“认知操作系统”,全面接管用户的上网体验。 Perplexity公司成立于2022年,创始人曾在OpenAI任职。其同名产品Perplexity以准确、快速、引用全面、无广告的搜索体验而获得用户喜爱,曾经多次被英伟达创始人黄仁勋点名推荐。 今年五月,Perplexity公司被曝即将完成新一轮5亿美元融资,投后估值达140亿美元(约合人民币1004亿元),这也是Perplexity在过去一年内的第五轮融资。另据彭博社爆料,苹果管理层对Perplexity已经产生了收购意向,以获取Perplexity的AI人才和技术。 尽管屡获融资,但作为一家创业公司,Perplexity没有海量计算资源,也没有庞大的用户基础。当谷歌等巨头入局AI搜索时,Aravind经常听到“Perplexity死定了”这样的言论。不过,Aravind认为,巨头和头部创企的入局属于正常现象:“某个领域有钱赚,自然会引来模仿”。 Aravind认为,浏览器与搜索并非两个孤立产品,而是自然演进的一体两面,正如谷歌凭借Chrome浏览器推动每日搜索查询从亿级增长到数十亿次,浏览器在Perplexity未来战略中也是至关重要的,是构建移动智能体(mobile agent)的关键途径。如果仅仅依赖MCP等第三方协议打造智能体,限制太多、无法灵活调用第三方应用,相比之下,浏览器提供了理想的方式,使这一愿景得以落地。 面对搜索引擎和浏览器领域的竞争对手谷歌,Aravind提出了尖锐的批评。他认为,AI搜索与谷歌搜索在获利机制上存在本质冲突,因此,谷歌一开始并未下定决心将AI能力集成至谷歌搜索上,这也导致谷歌无法充分利用其分发渠道。 在Aravind看来,谷歌的AI搜索产品只是“换个名字,换个副总裁和团队,功能本质上没什么不同”。在2023年-2024年期间,谷歌使用的内部模型在业内并不算领先,而Perplexity却可以自由使用OpenAI、Anthropic和其他企业的顶尖模型,这给Perplexity带来了以往难以想象的竞争优势。 Perplexity目前正在“用极限速度跑马拉松”,Aravind称他们“必须创新,必须比别人快”。入局AI浏览器赛道后,Perplexity希望将Comet打造成一款完美融合AI、网页导航和智能体体验的产品。 Aravind还回顾了Perplexity创业过程中的经验与收获,AI编程工具对公司日常运营的影响,以及AI搜索产品对互联网生态的影响。 以下是Aravind Srinivas今年6月在YC创业学校上分享会的完整编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改): 一、Perplexity面临冲击,押注浏览器和智能体 主持人:请你简单介绍一下Perplexity的近况。 Aravind Srinivas:不管你信不信,我每天都要处理基础设施的问题,确实有很多人在使用,甚至增长到了我们不知道该如何应对的程度。我们必须重建基础架构,以支持下一个10倍的增长。也要感谢在场的大家的支持。 接下来我们最关注的,是浏览器。我们把它视为公司未来发展的重要方向。 很多人会问,既然已经有搜索引擎和其他AI应用,为什么我还要用Perplexity?当然,ChatGPT的用户分布比我们广,其他AI应用也都在试图将搜索嵌入进去。它们都支持引用功能,也涵盖了我们在一些垂直领域投入的努力。当然,我们仍然会在这些方面做得比别人更好。 但我们认为,浏览器和智能体才是真正值得押注的方向。我们将浏览器视为一个助手,而不是一个完全自主的智能体。它是一个万能框(Omnibox),可以进行信息查询、分配智能体任务。 你的AI助手将驻留在新标签页和网页侧边栏,随时为你服务。这将使浏览器不再只是浏览器,而更像一个认知操作系统。 我们希望它像一个云端平台,可以并行运行多个异步任务,调用你的联系人、邮件、日历、亚马逊账号、社交媒体账号等所有个人数据资源。比如,你可以用它研究房地产或金融市场,它们在浏览器中运行,就像在你的计算环境中运行的多个进程。这在以前是做不到的。 Chrome令人兴奋的地方在于每个标签页都是一个独立的进程。我们设想未来,每一个查询、每一个指令,都可以成为一个进程。而这,就是我们正在打造的浏览器——Comet。我们正全力以赴投入其中。 二、大公司模仿难以避免,创业者靠速度取胜 主持人:其实我本来想把这个问题放在最后问你,但既然你已经提到了,我们就现在谈吧。 如果Sam Altman今天还在台上,他大概会说:“哦,对,这也是我们正在做的事。”谷歌的CEO Sundar Pichai大概也会说:“我们也在朝这个方向努力。”很多人手里都有充足的资金,都在朝着类似的方向前进。 你怎么看待这个趋势?你认为未来会出现多种细分用例,而你们可以主导其中一个?还是说这会是一场正面对决的大混战? Aravind Srinivas:如果某件事真的值得去做,那么自然会有资金充足的人来做。别人说Perplexity是个很棒的产品,现在每个公司都想做一个可以回答问题并附上来源的产品。 Cursor是一个很棒的产品,现在OpenAI想收购它的竞争对手,Anthropic推出了Claude Code,谷歌也有类似的工具。这很正常,某个领域有钱赚,自然会引来模仿。 但你不可能在所有领域都做到世界一流。不论是构建顶级模型,还是打造一两个真正优秀的产品,总得有所取舍。对我们来说,唯一重要的事情是答案的准确性、任务执行的准确性,以及工具的编排整合。而浏览器,比打造另一个聊天工具要难复制得多。 话虽如此,我也假设OpenAI、Anthropic会打造AI浏览器,而谷歌已经有Chrome了,他们做AI浏览器也是完全合理的。但我们唯一的模式依然是速度。你必须创新,必须比别人快。这就像是在用极限速度跑马拉松。 主持人:一个人最多只能专注做好一件事。我们刚才在后台的时候,你还在给我展示你们最近在开发的新功能,发现了一个Bug,你立刻停下手头的一切去调试。大公司的CEO可能早就交给别人处理了。但你亲自查找原因,说明你是真正在乎这件事。我觉得这是一个很有力的例证。 Aravind Srinivas:是的,我喜欢处理和修复Bug。听起来好像不重要,但我真的很喜欢。是不是CEO最该做的事?很多人会觉得不是。但最近我听说,有些人希望这种行为能“传染”给更多人,甚至连Sundar最近也在X平台做Bug支持。我觉得这也算是个正面榜样。 三、创业不必死守单一想法,也不能朝三暮四 主持人:现场很多人都是学生、应届毕业生或者研究生。你创业的故事,应该会让他们很有共鸣,因为他们现在正处在人生类似的阶段。你是怎么开始创业的? Aravind Srinivas:我们其实是在没有明确产品方向的情况下就创办了这家公司,这跟YC建议的路径相反。YC通常建议你从一个项目开始,把它打磨成一家公司。 但我觉得,在今天AI技术进步如此迅速的环境下,你不必一开始就死守一个想法。但同样重要的是,你也不能每周换一次想法,这样也不行。得从一个方向出发,认真思考,迅速动手做出来,然后尽快让用户用上。 我们曾经开发过一个工具,就是自然语言SQL,我们当时将其视为一个搜索工具,用于搜索关系型数据库。 我们最初做的是自然语言SQL,把它当作一种搜索工具,在关系型数据库中搜索。我喜欢Twitter搜索,也喜欢早期Facebook Graph Search。于是我想用语言模型把它重新做一遍。 我非常喜欢Twitter这个平台,但它的搜索体验很差,现在还是一样。我们把整个Twitter的数据组织成关系型表格,再把用户的自然语言查询转成SQL语句,查询数据库,效果特别好,这也是我们最初的起点。 后来我们意识到,想要将这种搜索扩展到整个互联网,这种方式行不通。你不可能把每个网站都转成表格,也无法用这种方法回答所有问题。 因此,我们转而押注语言模型,认为它们未来可以完成推理、解析和结构化。更重要的是,一开始就从非结构化内容入手。最终,这个方向就变成了Perplexity。 主持人:在真正创业之前,你是如何找到联合创始人的?又是怎么决定要专注于机器学习和AI的? Aravind Srinivas:因为那是我唯一擅长的领域。我对别的事情都不在行。既然如此,为什么要去创办一家外卖公司或者社交媒体公司?我根本就不合适。AI和机器学习是我唯一熟悉的东西。 其实挺有意思的,我们创立的是一家AI公司,但当时大家都笑话我们:连自己的模型都不训练,全都是用现成的大模型。其实我们也训练了很多不同的模型。 但这也说明,做事时需要有一种知己知彼的谦卑,你得清楚自己擅长什么,有哪些资源,哪些事情是你能力范围内可以做到的。 我的联合创始人是我研究生时期就认识的同学。我们一直在讨论各种想法,积累了很久的默契。我认为读研究生其实是认识创业伙伴的一个非常好的方式。 你并不是带着“将来要一起创业”的算计去和他们交流,而是因为他们是有趣的人,这就是YC网络的意义所在。即便你的第一个创业项目失败了,你也能接触到很多很棒的人,也许将来他们就会成为你的合作伙伴。对我来说,研究生阶段正是这样的经历。 四、项目始于推特搜索引擎,大模型+搜索展现独特魅力 主持人:初代Perplexity主要是为了有效地进行Twitter搜索。那么你们是什么时候决定继续探索这一方向的呢? Aravind Srinivas:我们为早期用户提供了访问权限,他们非常兴奋且反复使用。我们观察到:产品往往先给人一种新鲜感,然后要么用户完全不再使用,要么他们会持续用下去。如果只是短暂的兴趣,说明根本没有真正的留存。 当看到我们为Twitter、LinkedIn、GitHub做的关系数据库搜索,能够持续吸引用户使用,我们便意识到将大语言模型与搜索相结合有某种独特的魅力。 于是,我们开始思考:如果我们直接给用户答案,并附上引用来源呢?于是我们将这个功能以Discord机器人形式推出,同样获得了稳定的使用,不是那种“一天新鲜感后就被遗忘”的情况。 因此,我们下定决心正式推出产品。事实上,我们是在ChatGPT发布后七天上线的,那个时候ChatGPT还没有网络搜索功能,是个不错的切入时机。 很多现在成功的AI产品——包括Cursor在内——都是在2022年底或2023年初发布的,从AI时间尺度来看,它们都算是“老玩家”。对我而言,真正的“顿悟时刻”是在跨年夜,当时有接近70万次查询请求。 我心里想:“这个产品的名字对普通消费者来说非常糟糕,叫Perplexity,根本不好传播。而且速度极慢,每个查询要花7秒,准确率也不高,经常产生幻觉,背后还是一家无名公司,没有知名创始人,只有一两百万美元的种子轮融资。” 尽管如此,人们依然愿意去分享截图。在跨年夜那天,本可以看Netflix,而他们却选择在使用这个产品。那一刻我意识到,这确实是真实的需求,于是我开始坚定地投入到这个愿景中。 五、谷歌做AI搜索没有优势,产品换汤不换药 主持人:在那时,你是否已经在确信自己正在打造一个能与谷歌竞争、甚至有潜力取代谷歌所覆盖的巨大市场的产品? Aravind Srinivas:其实,我第一次萌生这种想法,是在Google发布Bard的博客文章时,Sundar亲自写了那篇博客。当时我们正在进行A轮融资,所有人都在说:“Bard要做你们正在做的事情。” 我当时在想:“为什么一定要专门去做一个Bard?干脆直接把它集成在谷歌搜索上不就好了?你们明明拥有全世界最强大的分发渠道,完全可以直接更新核心产品。” 可越想就越清楚:如果用户能够直接得到关于“旧金山有哪些能看到金门大桥景观的最佳酒店”或“纽约中央公园附近配套设施最好的住宿”这类问题的答案,还能立刻点链接预订,那么谷歌要如何从Booking、Expedia或Kayak这些广告主身上赚取广告费? 在购物领域也一样,如果给出直接的答案并提供购买链接,谷歌要怎么继续让亚马逊和沃尔玛等广告主竞价投放?从收入激励上来说,谷歌没有动力去给出最准确直接的答案。 正是这时我意识到,谷歌必须新建一个产品来做这件事,但他们永远无法在核心搜索里充分利用分发能力。2023年到2024年期间,谷歌在任何时间点拥有的模型,大概都只是排在第四或第五名。 作为一家创业公司,我们能使用比谷歌内部更强的AI模型,这在以前是完全无法想象的。如果早些年你想要做AI产品去和谷歌竞争,那几乎是没戏的。你根本得不到比谷歌更好的AI技术支持。可现在情况完全反转,这要感谢OpenAI、Anthropic以及开源模型的出现。 再加上创新者困境,以及我们可以容许自己犯很多错误都无妨,而谷歌犯一次错就会影响股价。当时Bard的演示失败,导致谷歌股价立刻下跌6%——我们清楚这是对我们有利的局面。 主持人:你最近也提到过,谷歌一直试图打造类似Perplexity的体验。你开玩笑说,他们每年都给同样的功能换个名字。 Aravind Srinivas:确实如此。他们每次I/O大会都会宣布相似的东西,换个名字,换个副总裁和团队,功能本质上没什么不同。也许产品能力在逐步改进,但始终没有面向所有用户全面发布。 主持人:我很佩服你对用户体验的专注。你曾告诉我,这也是你从拉里·佩奇写的那本关于谷歌的书中学到的。你觉得谷歌为什么失去了这种能力? Aravind Srinivas:最主要的原因是它已经是一家规模巨大的公司,不再由创始人亲自领导了。这样一来,承担风险变得非常困难。我并不认为他们没有优秀的人才,相反,我觉得他们有非常出色的工程师。问题更多在于激励结构:要为了长期正确的方向而愿意承担短期股价下跌,这本身就极其困难。 说实话,我很庆幸这种困境的存在,否则,初创公司又从哪里找到切入机会呢?如果创业公司没有机会胜出,最后就只会是垄断巨头愈发庞大,这对世界而言不是好事。现在我们能赢,同时谷歌也能不断推出新产品,用户可以真正地比较这些产品。 以前在信息获取领域,没人会认真考虑谷歌之外的替代品,那会被视作浪费时间。如今,至少大家会先去问问这些AI应用,比如ChatGPT、Perplexity、Gemini,再考虑是否还要去谷歌搜索。甚至很多人已经不再用谷歌,而是只在AI工具中搜索。 各大手机厂商未来也会在设备里集成多种AI助手,而不再只有一个默认搜索选项。我很高兴看到这样的竞争,让整个生态更加公平。 六、融合AI、网页导航和智能体,Comet要“接管”用户体验 主持人:你刚才在后台也和我聊到,现在你们面临来自各方的竞争压力,但如果看你们的数据,似乎并没有受到明显影响。 Aravind Srinivas:没错。我每次看Google I/O大会相关的Twitter评论,都是一模一样的场景重演。去年I/O大会推出了AI Overview,大家说“Perplexity死定了”。今年又推出AI Mode,还是说“Perplexity死定了”。 我也看到了这些评论,实际上我挺喜欢的,因为这些评论背后的潜台词是“Google会不会真的做这个?”或者是“他们的人会不会真的把这个功能完善?”而事实是,大多数用户根本接触不到这些功能。 当然,竞争确实是真实存在的。我们必须承认,OpenAI的资金实力极其雄厚,也没有什么创新者困境的包袱。他们确实在努力把搜索功能融入ChatGPT,而ChatGPT已经是目前最成功的面向消费者的AI产品了。 与这样一个对手竞争,难度很大。因此,我现在特别希望推动公司进一步发力浏览器方向。我认为Comet浏览器可以成为所有聊天机器人的“抽象层”。 如果你允许Comet浏览器接管你的体验,所有ChatGPT的对话内容都能输入到这个AI里,这样你就不用再为记忆或个性化等问题操心了。 Comet会做很多传统聊天机器人做不到的事情,比如访问你的其他浏览器标签页、调取浏览历史、帮你自动填写表单、支付信用卡账单、下单购物,甚至充当你的情报员,先帮你完成各种研究。对于那些周期性、重复性的任务,这才是浏览器能够赋予用户的真正魔力。 要把这种能力迁移到移动端,工程难度极大,至少需要几个月的开发,我并不担心有人很快抄袭这个方向。要让用户迁移到新的浏览器,本身就是个重大的决策。 主持人:在短期内,你觉得这个浏览器会在哪些方面做得比Chrome好得多,能立刻让用户愿意迁移? Aravind Srinivas:我们会提供一个完美结合AI、网页导航和智能体的体验。虽然这个回答听上去平淡无奇,但实际上至今没有人真正把这三者做到极致。如今全球已经有数亿人习惯使用AI,市场基础已经非常大了。 主持人:举个具体例子,如果我明天就能用上它,我可以怎么用? Aravind Srinivas:你可以用它来安排会议、回复一些你根本不想看的邮件。比如说,你在主办一个Y Combinator的活动,只想接受斯坦福退学的申请人,AI可以把所有报名的人资料过一遍,自动抓取LinkedIn链接,筛选出既是斯坦福校友又退学的人,然后自动审批入选。 当然,我并不是说这样的筛选条件是好主意,否则我自己都不会被选上了。希望你对招募标准更开放一些,我们也会考虑深度学习领域的研究人员。 七、强制使用AI编程工具,但也会带来新型Bug 主持人:接下来聊聊你如何管理公司。你现在大概有多少名员工? Aravind Srinivas:我们大约有200人。 主持人:公司规模已经不小了。现在有了代码生成类AI工具,你们是否全面采用它们?是不是所有人都在“Vibe Coding”? Aravind Srinivas:其实也不能所有事情都靠“Vibe Coding”来解决。我们经常遇到基础设施层面的复杂问题,在生产环境修Bug时肯定不能用“Vibe Coding”的方式。 那种情况下,我还是希望团队拥有扎实的软件工程、基础设施和分布式系统能力,这些技能是不能被完全取代的。不过在前端设计方面,我们看到了非常大的效率提升。Cursor基本上成了所有人都在用的工具。 我们已经规定,所有工程师必须至少使用一种AI编程工具。在Perplexity内部,最常用的是Cursor,以及Cursor和GitHub Copilot的结合。可以说,这已经成为强制性的标准。 机器学习工程师们用它的方式也非常高效:有时候他们读到一篇新论文,只需把代码截图上传给Cursor,就能自动编辑代码文件实现新算法,还能自己生成单元测试,再运行实验。以前要花三四天的工作,现在一小时就能完成。 有些同事不懂设计,假如我在iOS App里看一个界面,截图以后在上面画个箭头,说“这个按钮要移到这里”,他们就把这张截图上传给Cursor,要求它修改SwiftUI文件。这样的开发体验非常不可思议。修Bug、上线产品的速度远超以往。 当然,Bug总是比代码写作速度跑得更快。不过需要澄清一点,我非常喜欢这些AI工具,但它们确实也带来了新的Bug,而且很多人并不知道这些Bug是怎么产生的,更不清楚怎么去修复。 这个过程并不完美。我个人也很看好一些新工具,比如Claude Code在代码生成上的表现,已经比Cursor还要智能。我相信这是正确的未来方向,但当下也仍然存在不少问题。 八、现有AI产品没有强网络效应,品牌是生存通行证 主持人:大家经常提到一个问题:随着这些代码生成工具变得越来越强大,像你们这样的公司所做的事情将来会越来越容易被复制,那么在这种情况下,你们公司的持久价值到底在哪里? Aravind Srinivas:我认为,品牌本身确实具有巨大价值。市场上有Cursor的竞争对手,也有Perplexity的竞争对手。OpenAI未来也会推出他们自己的Cursor,实际上OpenAI在ChatGPT里也已经集成了类似Perplexity的功能,但这些并没有消灭掉任何一家相关公司。 当你的用户规模达到几百万、甚至是数百万付费用户时,品牌就会变成一张“生存通行证”,让你不至于很快被取代。你赢得了继续发展的权利。所以,品牌很重要。 “品牌叙事”对品牌而言也同样重要。你必须清楚地向用户说明:为什么你需要存在? 对我们来说,我们最在意的就是“准确性”。这个领域里已经存在100个聊天机器人,但我们是最注重让尽可能多的答案正确的那一个。 我们也非常重视速度——无论在App还是网页上,我们依然是“从提出问题到生成第一部分答案”最快的,即使我们在后台进行了搜索。我们也格外看重如何呈现答案。当你对某些事情有执念,那就会塑造你的叙事和品牌认同。 只要你能获得一定程度的分发渠道,我不是说非得拥有一亿用户,但如果你有几千万用户,那么无论别人发布什么产品,你都拥有继续“留在赛场”的资本。 在此之前,这确实是一个巨大的挑战,你必须时刻担心竞争。即便是现在,我们也保持高度警惕,唯一的解决办法就是:不断加快节奏,持续推出新功能。 主持人:除了品牌之外,你是否考虑过Perplexity会不会出现任何“网络效应”? 其实品牌本身就带有网络效应,人们会互相推荐、相互影响。但目前所有AI产品都没有那种应用内的强网络效应。 不像WhatsApp,虽然Meta这个公司品牌未必被所有人信任,但你也很难让用户迁移到新的聊天软件,因为他们所有的联系人、群组都已经沉淀在WhatsApp里了。 AI产品还没有形成这样的锁定。主要原因在于,你可以很轻松地导出你的ChatGPT历史记录,把数据迁移到别的应用里,所以不会像社交网络那样形成牢固的关系网络壁垒。 我认为,浏览器绝对会是一个可以着手解决这些问题的重要工具,因为它掌握了你的浏览历史。虽然你依然可以导出这些数据,但这跟直接获取一份CSV导出文件,包含你的密码、钱包、以及你的智能体记住的所有东西,是不一样的。 有许多你日常生活和工作中依赖的任务,都是在浏览器里运行的。这是一个让产品变得更加“黏性”、形成网络效应的好方法,尤其是当多人共享同一套任务时,你可以把它分享给他们。这也是把所有功能提升到新水平的路径之一。 九、MCP模式容错率低,浏览器拟人操作可破解困局 主持人:听起来,你想帮助用户解决的很多事情,其实都需要和其他公司整合或合作。如果你能把这些合作做好,就会形成某种网络效应:你的产品体验更好,而竞争对手要赶上,就得去重建同样的集成或谈成同样的合作。 你觉得未来会是什么样呢?Perplexity要和全球所有航空公司、酒店、电商平台去谈合作吗? Aravind Srinivas:其实我们已经和Southbook合作了,所有在Perplexity上完成的酒店预订都是由他们提供技术支持的。我们也和TripAdvisor合作,提供各类酒店和目的地的评论信息,还有地图的合作。我们和Yelp也有合作。 在购物领域,我们有许多商家直接通过平台销售商品。我们与Firmly合作,将预订转化为原生购买。Shopify也是我们的合作伙伴之一。 在金融领域,我们与FMP合作;在体育领域,我们与Stats Perform合作。各个垂直领域都有很多数据提供方在和我们合作,而且我们认为未来会进一步扩展。 当智能体开始真正“做事”时,一些公司会愿意成为MCP服务器,也有一些公司并不愿意。有些只希望保留自己的网站。我们构建的浏览器智能体将足够通用,去尊重第三方的各种选择。 归根结底,智能体是用户授权代表自己行动的。如果没有MCP服务器也没关系,依旧可以用这些标签页,就像用户亲自操作一样。这是浏览器的关键优势——如果你只专注于MCP模式,就会丧失这一点。 如果完全依赖MCP模式,你就得确保第三方服务器一直稳定可靠,数据协议必须完美无误,你的聊天机器人要能应对各种问题。而如果把它设计成模拟一个人如何使用网站的方式,你就拥有了完全的掌控,不必依赖他人把工程做好。 十、正探索多元变现渠道,未来或将按次计费 主持人:接下来我们聊聊商业模式。你的主要竞争对手谷歌,是通过广告盈利的,你提到这让他们无法做好你们在做的事情。那么Perplexity未来的商业模式会是什么?要如何实现与谷歌同量级的收入? Aravind Srinivas:坦白说,我不确定我们能否获得和谷歌同等量级的利润,而且我也不觉得必须如此。历史上,哪怕是谷歌自己,也从未再创造出跟它搜索广告同样利润率的第二个业务。就算我们做到比现有上市公司都好,依然可能远不如谷歌,这是完全合理的。 其次,订阅收入给了我们很大信心。我们从没想到会走到这一步。我们相信,光是订阅每年就可以增长到数十亿美元的规模,这本身就是一门很棒的生意。 还有按使用付费:人们为智能体完成某个任务付费,或者为持续的、周期性任务按次付费,费用对比请一个人来做同样的事情,可能会非常划算。 我不确定这会如何发展,也不确定利润率会怎么样。有可能比订阅更受欢迎,但毛利率低一些,因为每次使用都要支付成本。有的人订阅了一个AI产品,一个月里一次都没用,这对我们来说就是很高的毛利。 我现在也无法给出特别清晰的未来蓝图,但可以确定的是,订阅和按使用付费一定都会存在。如果人们开始通过AI完成更多购买,我们也会抽取交易佣金。不过历史上,按效果付费(CPA)的利润率一直低于按点击付费(CPC),所以谷歌一直没做成交易平台。 也正因为如此,我说这个市场会很大,但不一定能赚到谷歌那么多钱。谷歌的商业模式可能是人类历史上最成功的商业模式,或许正因为如此,也只有AI才能真正挑战它。 主持人:我想请你给在座的创业者一些建议。如果你回到四年前,处在他们的位置,你会建议他们怎么做? Aravind Srinivas:我会说,一定要非常努力工作,别无他法。不要自以为聪明,靠各种策略就能绕过竞争。 如果你的产品足够成功,可以做到上亿甚至几十亿的收入,那你就必须假设大型AI公司一定会模仿你。因为他们急需变现,筹了数百亿美元,必须给这些投入找回报,所以他们会去复制任何好的产品。 你要学会和这种压力共处,甚至拥抱它。你的护城河就是比别人更快、形成自己的独特定位。 最终,用户在乎的,是你能否满足他们的具体需求,就像找家政服务时,他们会想找一个具体的人,而不是随便去个大公司。每天醒来,都要怀着对产品的激情,这会成为你持续前行的动力。 主持人:你们是一个很好的例子,证明了挑战Google这样的大公司也是有可能的。 十一、浏览器与搜索一脉相承,打造移动智能体必须依赖浏览器 观众:你们最近和英伟达合作,把AI模型推向整个欧洲,还有传言说Perplexity会预装在所有三星手机上。据彭博社等消息,这可能会让你们的估值达到140亿美元。成为大众的默认搜索引擎,是一个沉重的责任。你觉得Perplexity最重要的事情是什么?怎样防止把虚假的信息或错误数据传播给大众? Aravind Srinivas:我们非常重视“幻觉”问题。我们内部在建立各种基准体系,实时监测和改进。最有效的办法,就是持续建设更好的搜索索引,不断捕捉网站上更精准的片段。 模型的推理速度也越来越快,现在已经能在不增加太多成本的情况下,对每个问题进行多步推理。这也是降低幻觉率的重要途径之一。 观众:我想问一下“创新者困境”。如果你是谷歌CEO,或者是谷歌联合创始人,你会怎么做?会不会考虑牺牲现在的商业模式去争取下一个产品?或者说,你会不会干脆把新产品分拆出来,单独运营,哪怕因此短期内丧失分发优势? Aravind Srinivas:我真的不羡慕那份工作。世界上没有人想接手那个位置,那是个非常艰难的角色。 要牺牲现有商业模式,去换下一代产品,还是把新产品拆分出来单独运营?说实话,我也不知道。我可以站在这里讲很多“如果我是他们”的假设,但他们才真正掌握着庞大的用户数据。 要知道,世界上其实有很多人讨厌AI。如果你硬把AI“强行塞到”这么大的用户群里,绝对不是件容易的事。至于我会怎么做,我真的无法回答,也不想身处那样的位置。 顺便说一句,如果未来AI回答里每条都插广告,你们也会讨厌它的。有像我们这样的替代方案,是件好事。 观众:有很多创业公司,会先找到一个基础模型的“酷炫应用”,做出产品。一旦有了规模,基础模型公司就会把这个能力内建到自己的平台里。 Perplexity其实也面临类似的问题,很多大模型都在整合搜索功能,比如ChatGPT、Gemini等。你怎么看待这种情况?是要转型?还是把现有事情做到极致? Aravind Srinivas:我的看法是:先选定一件事,努力成为这件事上被人记住的品牌。是的,很多人都在集成搜索,但我们依然想做到“最快、最准”。这不是嘴上说说就行。 我们也必须想出新的策略,创造出尚不存在的新产品。对我们来说,浏览器就是新的大项目。浏览器和搜索,其实不是两个完全独立的产品,而是一个自然的演进。就像谷歌当年从谷歌搜索到Chrome浏览器一样。Chrome正是他们能从几亿查询增长到每天上百亿查询的关键。当年谷歌上市时,还没有浏览器,查询量可能一亿级,现在已经是几十亿了。 浏览器对我们的未来非常重要,这也是我们坚定下注的原因。我非常确信,要想真正构建一个移动智能体(mobile agent),必须依赖浏览器。如果你完全依赖操作系统(苹果、谷歌)制定的规则,比如无法随意调用第三方应用、或要求每个应用都提供MCP服务器把数据接入,根本不现实。没人愿意被AI这么快地中介化。浏览器是把这一切构建起来的理想方式。 十二、创业受挫时,靠马斯克视频“打鸡血” 观众:我们在座的很多人都创业过,失败过,有些人更成功,有些人像我一样屡败屡战。当你处在一次次失败的深渊里,觉得一切都要塌了、功能没法上线、又冒出重大Bug时,作为CEO或者创业者,你会对自己说什么?是什么支撑你继续走下去? 又或者,在一开始还没起飞的时候,是靠什么让你不放弃,继续努力,而不是干脆回去OpenAI上班? Aravind Srinivas:我就是去看Elon Musk的YouTube视频。(全场笑)我是认真的。我可以告诉你哪一条视频:有一个采访,是他们火箭第三次连续失败,记者问他怎么想,他说:“我绝不会放弃,除非我死了或丧失行动能力。” 我希望能一直保持这样的心态。但说实话,这并不容易。他已经坚持了比我们更久,大家都敬佩他。这个世界上有很多伟大的创业者,都是在所有人都不看好的情况下,依然坚持了下去。你又有什么好失去的呢?只要继续干就行。 观众:我想问一个关于Perplexity“可持续性”的问题,不是商业模式,而是整个互联网生态。最近很多研究发现,像Perplexity这样的AI搜索引擎,给网站带来的流量比传统搜索少得多。 未来五到十年,当这些网站因为流量锐减被迫关闭,整个网络会变得更“安静”,内容创作也会减少。你怎么看待这种未来?Perplexity在其中扮演什么角色? Aravind Srinivas:我觉得,网络本来就有极度的“长尾效应”,是一个巨大的幂律分布。未来这个幂律只会更加陡峭,这是显而易见的。一些知名品牌仍会保留直接的自然访问流量,而那些通过SEO“蹭”流量的人,肯定会日子更难过。 观众:我想请教两个问题:第一,你们如何界定“摘要”和“抄袭”的边界?如何在报告生成时避免侵犯知识产权?第二,新闻和其他人类写作的内容里经常带有政治倾向和个人立场,你们如何处理这些偏见? Aravind Srinivas:确实,有些问题是有客观真相的,比如“NBA比赛的比分是多少”,“现在旧金山的实时天气”。在这类查询上,你必须始终保证正确。即便如此,你也依赖某些数据提供方——直播比赛的频道、气象服务商、苹果或谷歌提供的天气数据。 归根结底,一切都基于信任。信任是靠长期准确积累的。我们尽力去展示“值得被信任的数据来源”,这是我们对准确性的理解。但很多事情并没有单一真相。面对这种情况,我们最好的做法就是提供多元观点,而不是去判定孰对孰错。 观众:那你们会通过用户反馈来衡量这些答案的准确性吗? Aravind Srinivas:目前我们并没有建立这样的衡量体系,但确实应该去做。我们应该建立一套专门的评估集,专门针对那些没有标准答案的问题。 不过,要为这种问题建立自动化评估很难,因为“正确答案”是主观的。比如“新冠起源”这种议题,观点各不相同。如果只看维基百科,那人类评审可能会说:“它列举了维基百科说的所有内容,这是好答案。” 但或许用户希望看到维基没有的内容,这就需要更聪明的评审者。而这种评审者,不是“Scale AI”式廉价劳动力能胜任的。 观众:我想问你们市场策略的问题:你们做过面向学生的营销活动,我和很多大学生就是因此知道你们的。同时,你们还和Costco做了合作,那是完全不同的受众。你们是怎么决定要针对哪些群体的? Aravind Srinivas:在我看来,关键是要进入那些你通过传统渠道接触不到的用户分布。很多人根本不用Twitter或LinkedIn,但他们真实存在。只是我们生活在自己的信息茧房里罢了。 而有些企业在这些人群中有很强的渗透,比如Costco等传统企业。如果你想要触及这部分人群,就要调整策略去适配他们。 当然,增长也要有“邻接性”。你希望用户群体之间有部分交集,这样他们会成为你的口碑传播者,帮助你进入新的圈层。我认为,要有一些交集,但分发渠道要不断进化。
果粉期待五年新品终于有消息!苹果HomePod mini 2有望今年底发布
快科技7月15日消息,苹果于2020年10月推出了第一代HomePod mini,凭借其小巧的体积、出色的音质以及对Siri语音助手和HomeKit智能家居控制的支持,赢得了众多果粉的喜爱。 不过自发布以来,HomePod mini的核心硬件一直维持在五年前的水平,这让许多用户对其升级换代充满期待。 据Mark Gurman最新透露,苹果计划在今年底推出第二代HomePod mini,预计发布时间将在9月iPhone发布会之后至11月之间。 新一代产品将带来多项重大升级,满足用户对更快网络、更高音质和更强AI功能的需求。 HomePod mini 2将支持Wi-Fi 6E,相比第一代的Wi-Fi 4,这将大幅提升传输速度并减少延迟,在播放高音质音乐或同步多台设备时表现更为出色。 新一代产品预计将搭载苹果自研的无线通信芯片,整合Wi-Fi与蓝牙功能,取代目前的第三方方案,从而在低功耗与性能之间实现优化。 这颗芯片还可能支持未来苹果生态内的无缝串流功能,进一步提升与Vision Pro、Apple Watch或iPhone的互动效率。 此外,HomePod mini 2有望引入第二代超宽带芯片(UWB),这是一种短距离高精度定位技术,能够实现与其他苹果设备的精准距离感知与连接。 在音质方面,目前没有明确证据显示HomePod mini 2会更换全新音响模块,但苹果一直对音质要求严格,预计此次会针对声场效果和低频饱满度等进行优化。 最后,HomePod mini 2还将推出新的配色选项,除了现有的午夜色、蓝色、橘色、黄色和白色外,可能会新增粉色、绿色或其他更具潮流感的颜色。
黑客利用AI生成恶意软件,可绕过微软Defender安全防护
IT之家 7 月 15 日消息,随着生成式人工智能技术的广泛应用,安全问题也日益成为公众关注的焦点。2023 年,微软的一项研究揭示了一个令人担忧的趋势:黑客开始利用像微软 Copilot 和 OpenAI 的 ChatGPT 这样的人工智能工具,对毫无防备的用户实施网络钓鱼计划。 如今,网络攻击者变得更加狡猾,他们不断想出巧妙的方法来绕过复杂的安全系统,以获取未经授权的敏感数据。最近几周,就有用户精心策划骗局,试图降低 ChatGPT 的安全限制,诱使其生成有效的 Windows 10 激活密钥。 Windows 用户对微软 Defender 并不陌生,这是一个复杂的安全平台,旨在保护用户免受黑客的恶意攻击。然而据 Dark Reading 报道,安全研究公司 Outflank 的研究人员计划在 8 月的“黑帽 2025”网络安全大会上发布一种新型人工智能恶意软件,这种恶意软件能够绕过微软 Defender for Endpoint 的安全防护。 Outflank 的首席进攻专家负责人凯尔・艾弗里(Kyle Avery)在接受采访时表示,他花了大约 3 个月的时间开发这种人工智能恶意软件,并花费了 1500 至 1600 美元(IT之家注:现汇率约合 10759 至 11476 元人民币)用于训练 Qwen 2.5 大型语言模型(LLM),使其能够绕过微软 Defender 的安全防护。 有趣的是,这位专注于人工智能的研究人员还分享了他对 OpenAI 的 GPT 模型及其最新旗舰推理模型 o1 的见解。尽管他承认 GPT-4 相比 GPT-3.5 有了重大升级,但他指出,OpenAI 的 o1 推理模型具备了更复杂的功能,尤其擅长编程和数学。 艾弗里表示,DeepSeek 利用强化学习技术来提升其模型在广泛主题上的能力,包括编程。因此,他在开发能够绕过微软 Defender 安全解决方案的人工智能恶意软件时,也应用了这一理论。 研究人员承认,开发过程并非易事,因为大型语言模型主要通过互联网数据进行训练,这使得他难以获取传统恶意软件来训练人工智能驱动的等效产品。此时,强化学习发挥了关键作用。研究人员将 Qwen 2.5 LLM 置于一个安装了微软 Defender for Endpoint 的沙盒环境中,然后编写了一个程序来评估该人工智能模型输出规避工具的接近程度。 据艾弗里介绍:“它绝对不可能直接做到这一点。也许一千次中只有一次,它会偶然写出一些能够运行但无法规避任何检测的恶意软件。当它做到这一点时,你可以奖励它生成了能够运行的恶意软件。” “通过这种迭代过程,它会越来越稳定地生成能够运行的恶意软件,不是因为你向它展示了例子,而是因为它被更新得更有可能进行那种导致生成有效恶意软件的思维过程。” 最终,艾弗里接入了一个 API,使模型能够更方便地查询和检索由微软 Defender 生成的类似警报。这样一来,模型更容易开发出在绕过软件安全屏障时不太可能触发警报的恶意软件。 研究人员最终实现了他期望的结果,成功利用人工智能生成了能够绕过微软 Defender 复杂安全解决方案的恶意软件,其成功率约为 8%。相比之下,Anthropic 的 Claude 人工智能在类似测试中的成功率不到 1%,而 DeepSeek 的 R1 模型的成功率仅为 1.1%。 随着人工智能骗局和恶意软件变得越来越复杂,像微软这样的公司是否会加大其安全解决方案的力度,将是一个值得关注的问题。在当前形势下,他们似乎别无选择。
VC、大厂、国资争先下注具身智能:泡沫狂欢,还是人机共存的黎明前夜?
做2025年下半年和2026年上半年会是一个产业交卷的窗口期。 文丨李佳晅 编辑丨张睿 2025年,热钱持续涌向具身智能。 DeepSeek横空出世,宇树机器人登上春晚舞台,兼具软件层面大脑能力与硬件层面制造能力的具身智能被推向了资本及舆论关注的新高潮。 IT桔子数据显示,2025年1月至7月10日,国内的具身智能&人形机器人领域共发生141起投融资事件,其中有121起来自机器人整机厂,20起来自机器人零部件企业。要知道,2024年全年具身智能领域的投融资事件共77起,数量远低于2025年上半年。 “物理AI和机器人正在飞速发展,可能会成为规模最大的产业。”英伟达CEO黄仁勋在GTC2025年度技术大会上表示。 今年,“具身智能”首次被写入政府工作报告,全国多地已开始布局具身智能等人工智能技术产业发展,比如北京市将加快实现具身智能科技创新和产业创新深度融合,利用三年时间,力争突破百余项关键技术,推动万台具身机器人规模落地,培育千亿级产业集群;苏州市提出以具身智能技术为核心,覆盖工业、医疗、物流等15个垂直领域,加速技术融合与场景落地,至2027年,苏州市人工智能相关产业规模预计突破3000亿元,其中具身智能被列为重点发展方向;深圳市将构建具身智能基座及垂直领域大模型等。 在热闹的具身智能领域,什么样的企业拿到融资?谁在为具身智能出资?热潮背后,行业面临的技术早期性、产品成熟度不足困境,具身智能企业交卷窗口期何时到来? 大量资金涌入: 51起融资单笔过亿 截至7月10日,2025年以来具身智能领域单笔过亿的融资事件共有51起。 点击查看完整清晰大图 其中,银河通用于2025年6月获得融资11亿元,成为具身智能领域单笔最高融资金额。该轮融资由宁德时代及溥泉资本领投,国开科创、北京机器人产业基金、纪源资本(GGV)等机构跟投。银河通用曾在2024年6月和11月,分别宣布超7亿元的天使轮融资和5亿元战略轮融资,目前累计融资金额已超过23亿元。 银河通用成立于2023年5月,从项目估值来看,与宇树科技、智元机器人一起位居国内具身智能赛道的第一梯队。2024年6月,银河通用发布了首款具身大模型机器人Galbot G1,采用“双臂+折叠+轮式底盘”的躯体结构,侧重上肢操作能力。 银河通用Galbot G1 2025年3月,银河通用发布人形机器人智慧零售解决方案,由轮式双臂机器人Galbot全天候在50平米的无人店铺内执行5000种商品种类、6000个货道、10000多盒商品的盘点、补货、取送、打包等自动化全流程。6月,公司宣布与全球工业巨头博世集团旗下博原资本共同成立合资公司,共同探索具身智能机器人在工业制造场景的应用。 头部具身智能企业融资的节奏在加快。2025年以来,完成两轮融资的具身智能企业21家,完成三轮融资的企业有6家,分别是自变量机器人、千诀科技、玄源科技、零次方、鹿明机器人,开普勒机器人完成四轮融资,星海图则在短短半年内完成5轮融资。 在已披露的融资金额中,累计最高的是它石智航——分别于2025年3月、7月完成的1.2亿美元天使轮融资和1.22亿美元的天使+轮融资,合人民币累计约15.73亿元。天使轮投资方包括蓝驰创投、启明创投、联想创投、线性资本、恒旭资本、高瓴创投等;天使+轮由美团战投领投,钧山投资、碧鸿投资、国汽投资、临港科创投、赛富投资基金、建发新兴投资共同跟投。 它石智航成立于2025年2月,创始人兼CEO陈亦伦曾任清华大学智能产业研究院智能机器人方向首席科学家,华为自动驾驶CTO,大疆机器视觉总工程师;首席科学家丁文超是具身智能领域青年科学家、复旦大学机器人研究院研究员,曾从0到1主导华为智驾端到端决策网络,打造复旦大学首个人形机器人;董事长李震宇曾任百度智能驾驶事业群总裁。 紧随其后的是星海图,在2025年完成累计A系列融资约12.5亿元。投资方包括美团龙珠、美团战投、北京机器人基金、亦庄国投、IDG资本、BV百度风投、凯辉基金、今日资本、襄禾资本、中金保时捷基金、襄禾资本、米哈游、无锡创投集团等。 星海图成立于2023年9月,产品包括通用仿人形机器人R1 Pro、轮式双臂移动平台R1 lite,构建了全链路具身智能开发平台EDP,2024年底以来,星海图轮式双臂机器人本体已交付至国内外百余家顶尖开发者客户,同构型本体出货量与开发者数量跃升至行业第一。 VC、国资、大厂争投 热钱来自何方? 当前具身智能领域在一级市场火爆的背后,热钱来自哪里? 通过梳理,亿邦动力发现当前在具身智能领域的投资方可以分成三大阵营:第一类是VC,注重具身智能企业的团队组成、技术突破以及商业化场景;第二类是互联网大厂、车企甚至电池巨头等产业玩家,能够为机器人在实训阶段提供工厂、仓储等应用场景“实习”;第三类则国家队和地方产业基金,为企业提供政策加持和产业链条资源,推动具身智能在工业制造、智慧物流等国家战略场景里落地。 VC疯狂抢位,仍难敌产业资本的现实吸引力 尽管年初金沙江创投合伙人朱啸虎唱衰人形机器人,但是主流人民币基金和美元基金都不愿意错过具身智能领域出手机会。 蓝驰创投管理合伙人陈维广认为,具身智能机会非常大,与其说逐一去分辨不同团队的技术组合,团队更大的判断是要重投入具身赛道。这背后的底层逻辑在于:中国发展具身智能在全球占优,尤其在供应链、工程效率上远优于美欧,就像当年押中智能驾驶一样,蓝驰创投相信这里能跑出下一代的全球性公司。 “当下,VC投科技已经成为行业共识。”华映资本创始管理合伙人季薇表示。华映资本今天已投资自变量机器人、魔法原子、星动纪元、云深处科技等多家处在不同发展阶段的具身智能企业。 然而在当下,VC却并不是头部机器人企业最青睐的投资方。季薇认为,企业更倾向于产投或大国资。前者能帮助机器人企业订单落地,后者可帮助企业资本化以及获取政府资源、行业资源。陈维广也表示:“如果入局晚了,就只能跟大厂拼资源了。” 美团半年出手4次,大厂密集参投独角兽 无论是美团、阿里、腾讯等互联网大厂,还是吉利、宁德时代、欣旺达等新能源车厂、电池厂,都已频频出现在具身智能投资方行列,而大厂投资既有财务投资,也有战略投资。 其中,美团对具身智能的投资最为激进,短短半年内投资4家企业。2025年6月,美团作为自变量机器人A轮融资的独家投资方,注入数亿元资金;2025年以来,美团还跟投了它石智航天使+轮融资,美团龙珠跟投星海图A+轮融资,妙动科技的天使轮融资。 腾讯则分别在2025年3月和6月入股智元机器人、宇树科技两家独角兽企业;加注宇树科技的还有阿里巴巴和蚂蚁集团,除宇树科技外,阿里巴巴还入股机器人企业源络科技,蚂蚁集团则投资灵巧手企业灵心巧手、钛虎机器人、星尘智能和星海图。百度风投则持续跟投星海图2025年的5轮融资。 新能源大厂方面,宁德时代入股银河通用,欣旺达成为阿米奥机器人天使轮独家投资方,吉利控股成为宇树科技C+轮投资方。 国资高频出手,押注具身智能产业卡位 国资及地方基金更为活跃:2025年以来,国投创合投资灵宝、星海图、智平方、智元机器人等企业;北京国管参与银河通用、小雨智造、星海图、宇树科技、云深处科技、自变量机器人等企业融资;上海国资多次加注智元机器人、傅利叶智能、开普勒等机器人企业;灵宝CASBOT获河南资产基金投资;跨维智能获四川发展产业引导基金、成都科创投资金等。据不完全统计,在2025年已经发生的141起融资事件中,国资及地方基金参与的超30起。 投资热潮背后: 具身智能下个赛点何时到来? 2025年至今,具身智能领域发生的天使轮、种子轮55起,A系列融资61起,占总融资数量的76%,B轮之后只有不到10%。由此可见,具身智能整个市场还处在典型的早期淘金热阶段,投资方用广撒网的方式疯狂下注,赛道处于技术爆发与生态构建期,市场活跃度极高。 大部分企业尚未到达需要验证商业模式和营收能力的B轮、C轮,真正能批量出货、跑通商业闭环的公司寥寥无几。但是也有头部企业在工业制造、商业服务、文旅展示等方面率先作出了商业化尝试。(点击《从实验室到工厂车间:具身智能卡位战,五大场景如何引爆1540亿市场?》查看更多详细内容) 《华兴一级市场温度指数报告-2025年Q2篇》显示,当下具身智能公司停留在demo阶段的公司普遍较多,且大多数公司在工业、商业等场景下的落地方案比较趋同、差异化不足,未来投资人会更加关注具身模型对真实任务的解决能力,以及其带来的高质量的商业化收入,投资人还会关注这些公司的技术领先性以及模型的持续迭代能力,以及如何解决数据获取的成本问题 此外,上半年具身智能赛道交易活跃度居首,但投资热情已经开始放缓。赛道各个技术路线目前仍处于高度非共识的状态,且分化对立的趋势愈加明显;具身公司是否获得了相对充足的资金储备会接下来的重要门槛,也就是说一批项目需要拿到更多的钱来渡过接下来可能变冷的行业周期。 具身智能涉及机器人运动控制、环境感知等硬核技术突破,大多数企业还处于在实验室调试机械臂灵敏度,或者在小范围场景里跑Demo的阶段。因此朱啸虎的话才引起诸多共鸣:“他们说的都是自己想象出来的客户,谁会花十几万买一个机器人去干这些活?” 蓝驰创投管理合伙人朱天宇表示,具身智能下一个赛点就是找到有客户买单、且愿意持续买单的场景。 人形机器人领域的第一大单于7月11日产生。中国移动采购与招标网显示,智元机器人和宇树科技分别中标中移(杭州)信息技术有限公司人形双足机器人代工服务采购项目。本次采购的项目总预算为1.2405亿元(含税)。智元机器人中标全尺寸人形双足机器人,预算为7800万元(含税);宇树科技中标小尺寸人形双足机器人、算力背包、五指灵巧手,预算为4605万元(含税)。 此外,智元机器人还于3月发布小尺寸人形机器人灵犀X2,可用于文娱表演、展厅讲解和科研教育场景。目前,灵犀X2已在中国移动展厅担任讲解员,未来还将入驻银行、汽车4s店、公园、学校,今年公司计划产量灵犀X2达数千台。 智元灵犀X2 7月8日,科创板上市公司上纬新材公告,智元机器人将收购公司约67%股份,控股股东变更为智元恒岳,智元CEO邓泰华将成为上纬新材实际控制人。虽然智元方面不断强调本次收购不是借壳上市,但获得一家科创板上市公司的实际控制权已是既定事实。 另一边,宇树科技创始人王兴兴在6月的夏季达沃斯论坛上透露,宇树科技年度营收已超10亿元人民币。在此之前,宇树科技发布通知,因公司发展需要,杭州宇树科技有限公司即日起名称变更为杭州宇树科技股份有限公司,外界纷纷猜测宇树科技正在为IPO上市铺路。 宇树科技Unitree G1 蓝驰创投合伙人曹巍认为,2025年下半年和2026年上半年会是一个产业交卷的窗口期。头部团队开始陆续提交阶段性成果,整个领域的发展走向将更加清晰。若头部团队能够交出优秀的市场答卷,这个市场还有可能继续火热;反之,如果大家发现2026年上半年答卷与预期相差甚远,例如机器人技术进步有限、无法实现产品应用场景落地,那么资本市场热度可能会有一定的回调。同时,具身智能公司很可能出现发展分化,有落地成绩的团队将获得更多关注和资源,脱颖而出。就如同新能源汽车早期发展阶段那样,尽管参与者众多,但是只有少数生存下来。
娃哈哈150亿遗产之争,我用秘塔版深度研究扒清了
作者 | 江宇 编辑 | 漠影 智东西AI前瞻7月15日报道,秘塔AI搜索“深度研究”,今日正式上线。 作为对“浅度研究”的迭代升级,深度研究上线后,新增“问题链”可视化方案,支持用户更清晰追踪模型的检索和分析过程,整体体验相比此前更加深入和可视化。 用户可通过metaso.cn或秘塔AI搜索App直接体验,选择“深度研究”,输入问题即可使用。 目前该功能按搜索积分使用,普通用户每天可免费使用3至5次,付费用户每日额度更高。 一、从“浅度”走向“深度”:更长链、更可视化、更少黑箱 1、产品功能:链路可视化、报告结构化和信源可控 秘塔AI“深度研究”模块,基于对复杂问题的分步拆解逻辑,支持从一个具体切口出发,自动完成广域信息检索和深度分析。 不同于传统AI搜索“一问一答”的模式,秘塔AI“深度研究”通过拆解任务,将大问题分解为一系列动态子任务,最终生成结构化、条理清晰的研究报告。 在具体功能上,“深度研究”包括三大亮点: “问题链”可视化: 每次深度研究均可追踪AI的拆解路径,信源、推理链路、各阶段结论均可清晰查看,提升结果的可验证性和可解释性。 互动式报告:支持完整报告与互动式报告双模式切换。 信源偏好设置:可自定义优先站点或屏蔽特定来源,进一步提升研究质量。 2、技术方案:分段强化学习,中文场景更适配 秘塔AI“深度研究”升级的核心是引入子任务拆解与分段强化学习(RL)方案,通过逐层任务推理,在算力资源有限的条件下有效提升了复杂问题的准确率。 此外,据官方透露,秘塔AI搜索“深度研究”在中文搜索场景下相较通义WebSailor Agent表现更优。 在BrowseComp(中英文)和xbench-DeepSearch两项评测中,秘塔AI“深度研究”均位列榜首,整体成绩高于DeepSeek-R1、QwQ-32B和GPT-4.1等主流模型。 ▲(来源:秘塔AI搜索官方) 二、体验:从“遗产大战”切入,秘塔AI如何梳理家族纷争? 本次体验,智东西以近期热议的“娃哈哈150亿遗产之争”为例,提出了一个实际问题,并让AI做出预测: 请梳理娃哈哈150亿遗产大战的来龙去脉,分析事件起因、诉讼焦点、信托资产争议和家族关系冲突,结合中国内地和香港的继承法律、信托法律,以及娃哈哈家族治理背景,归纳该事件对公司经营的潜在影响,并根据现有信息合理推测,这场遗产之争最终谁的胜算更大,为什么。 秘塔AI“深度研究”给出了完整路径——不仅复盘了事件起因和核心矛盾,还追踪到诉讼焦点、信托法律,用“问题链”梳理出一份逻辑闭环,给出“胜算预测和法律推演”。页面左侧实时显示token消耗与信源数量,底部是滚动任务进度条,主屏幕则是可动态展开、点开即查的“问题链”: 每个节点都配有信源出处,点击即跳转 缺失信息直接标红 研究报告可一键切换“全文报告”与“互动可视化” ▲(耗时8.8分钟,共耗费24万Tokens) 报告正文如下: 在“娃哈哈遗产之争”这个案例里,智东西体验发现,秘塔从最初追溯官方来源,到后续拆解遗产结构、梳理企业经营波动,每一条推理链路都有清晰的可视化展示。 用户在查证细节时,也不需要反复跳转搜索,可以顺着链路逐层点击,就能直接查看对应信源和结论。 互动研究报告如下: 跑完深度研究后,秘塔还可以自动生成互动网页,把核心信息按传播路径、关键节点、数据表格等分类整理,方便快速查阅。 类似热点话题,秘塔用一次深度研究基本能把整体脉络梳理清楚,用户用于整理素材或者直接截屏分享都比较省事。 整体页面布局也比较清晰,查完资料甚至直接拿去做汇报PPT,基础框架也能直接用上。 为了进一步了解效果,智东西也对比体验了Google Gemini的Deep Research功能,重点观察了两者在文本输出的长度、内容的覆盖深度和信源的丰富程度上的差异。 实际对比下来,Google Gemini的Deep Research在文本量、内容深度和广度上整体表现更优。无论是单次报告的字数,还是对多角度、多背景资料的覆盖,Gemini都明显更“堆料”,适合需要尽可能全面掌握背景信息的用户。 相比之下,秘塔AI“深度研究”的单次文本输出上限约为1万字,其篇幅更克制,在路径拆解、可视化链路、互动报告上的设计更偏向“查重点、看脉络”。 结语:不卷风口,要卷的是“真正被需要的产品” 当外界从“AI搜索”卷向“Agent大爆发”,秘塔AI将更多精力放在搜索体验本身,整体呈现出更扎实的完成度。 从产品成熟度来看,秘塔“深度研究”在可视化链路和交互体验上有明显优势,但在文本体量和信息覆盖广度上,仍存在一定差距。 从实际体验来看,当用户想查清一件事、梳理一套脉络时,“深度研究”类产品可以省去不少反复搜索和零散整理的时间。遇到复杂问题时,先跑一轮深度研究,而不是直接用传统搜索找答案,往往是更高效、更省力的方式。 下次刷到类似遗产争议、企业风波等复杂事件时,你可能也会想用‘深度研究’快速梳理清楚来龙去脉。
700元 我买了台毫米波显示器,这体验太欢乐了
线,线,线。 不管是理论上的,还是现实中的,我们每个人的人生,似乎都离不开“线”。 在安部公房的作品《绳》中,他曾表示,“绳索和棍棒是人类最早发明的工具。绳索可以留住美好,棍棒则可以驱赶危险。两者皆是我们最早的朋友,皆由我们创造。有人的地方,就有绳索与棍棒。” 这里的绳索,其实就是一种“线”。 而到了现实中,我们更是和“线”形影不离,从用于蔽体的衣服,到连接起全球的互联网,设备与电力的连接、设备与设备的连接,几乎可以说整个人类社会,本质上就是用“线”联系在一起的。 可是“线”一多,就会显得杂乱无章。 有的时候,看着那杂乱无章的桌面和四处散落的线缆,我的内心里真的会涌出一丝“干脆所有线缆都从世界上消失”的想法。 Wait a minute…… 动了这方面的心思之后,我去仔细查了一下,你别说,有这种想法的人可绝对不止我一个,目前市面上主打无线投屏的设备可真不少,除了传统Wi-Fi串流,各种新技术产品也是层出不穷。 (图源:Peakdo) 为此,我在二手平台上斥资近700元,拿下了初代的PeakDo无线HDMI便携屏,这款产品最大的特点在于毫米波无线传输,号称动态延迟可以低至0~2帧(32毫秒内),远超传统Wi-Fi串流方案。 那么现在,是时候品鉴一下真正的无“线”生活了? 从有线,到无线 不过呢,在开始之前,我们不妨来回顾一下那些年概念很美好,但用起来总差口气的“便携屏”。 在我印象里,最早接触到的能算得上“便携屏”雏形的,可能还是那些需要拖着根线,吃着笔记本USB口供电的便携显示器。 作为笔记本的“第二块屏幕”,它们最大的价值在于解决了“有无”问题,只需HDMI加USB供电/一根USB Type-C线就能点亮,让用户在移动办公时也能享受双屏带来的效率提升。 (图源:京东) 放在当时,能在咖啡馆掏出双屏工作的场景,对我这种数码爱好者来说,还是挺有吸引力的。 可惜“有线”这个原罪,始终是它们无法回避的痛点。 而且早期的产品,屏幕参数、色彩表现、亮度以及响应速度也往往不尽如人意,更别提触控这种“奢望”了。 用户对于摆脱线缆束缚的需求日益迫切,也刺激了一批厂商向着“无线化”探索。 在此基础上,第一批基于DLNA、Miracast无线显示标准协议的产品开始涌现。 就拿我曾经入手过的雕塑家4K OLED便携式显示器作为例子,这类产品一般都会采用相对高端的屏幕配置,那价格自然不会低廉,基于无线显示标准协议的多屏显示功能,往往只会成为高端化的一个卖点。 (图源:京东) 这些协议的出现,理论上使得手机、平板、笔记本的画面可以无线传输到便携屏上。但实际体验嘛,延迟高、连接不稳定、画质压缩严重是家常便饭,谁用谁知道,尤其对于动态画面或者游戏场景,几乎是不可用的状态。 想要打破这些问题,就必须打破无线显示标准协议的限制。 于是乎,主打毫米波(mmWave)低延迟技术/Wi-Fi 6/6E直连技术的一批无线便携屏就这样诞生了。 毫米波,“零延迟”? 接下来,该看看我手上这款Peakdo便携屏了。 初看这款PeakDo便携屏,扑面而来的便是一股小作坊手搓的廉价感。 整机采用了哑光黑的金属外壳,摸上去有一种微妙的廉价感,漆面本身不够工整之余,切口看起来也有一种纯手工打造的粗糙感,做工看着和正经量产的产品根本不是一条水平线的。 (图源:雷科技) 物理按键基本集中在机身顶部,从左到右依次为电源、菜单、音量增、音量减,最后是3.5mm耳机接口。 (图源:雷科技) 值得注意的是,机身侧边设计了两道滑轨,这个滑轨设计是参考初代Switch制作的,因此可以兼容大多数采用Joycon制式的手柄,PeakDo这款产品本身主打的也是和手柄联动的无线游戏体验。 (图源:雷科技) 翻到机身正面,映入眼帘的便是一块黑边超大的屏幕,事实上PeakDo的黑边比Switch OLED的黑边还要夸张不少,屏幕本身参数也不亮眼,1080P分辨率+60Hz刷新率,标称亮度达到500nits,实测74%NTSC色域。 (图源:雷科技) 嗯...只能说比廉价笔记本稍强一些。 观感上倒还好,毕竟大部分人也辨认不出更多的色彩细节,除了整体画面效果会显得颜色更深一些,偶尔暗部丢失细节之外,看图片、看视频甚至打游戏都没有什么大问题。 作为一款无线显示设备,PeakDo除了接收端,还有发射端。 (图源:雷科技) 发射端本身有点像U盘,把它插进设备的HDMI接口并供电,然后再把发射口和接收口中间的杂物尽量清理一下,我们就可以开始这款产品的体验测试了。 个人认为,对于无线显示设备来说,最重要的因素在于3点—— 串流范围、串流延迟、稳定性。 先来说说串流范围,我租住的出租屋是大单间,有一个隔出来的独立厨房和卫浴,大致就像下图这样,但是电脑和电视间有一个硕大的柜子隔断,直线距离大概在4-5m左右。 (图源:雷科技@豆包AI) 当我在把发射端接在PS5上,坐在电脑桌这边的时候,串流效果是很稳定的。 把直线距离加大一点,从门口到电脑桌,约摸着7-8m的范围,基本上也不会出现断联的现象。 但是只要离开这个大单间,哪怕只是踏进厨房一步,这个串流立刻就断了。 出现这种情况的原因很简单,毫米波本质上是波长为1~10mm的电磁波,优点就是波束更窄、速度更快,缺点就是信号穿透性差,发射器和屏幕之间最好不要有太多遮挡物,甚至人体遮挡都可能导致信号劣化或中断。有效传输距离也比较有限,稍微远一点或者角度刁钻一点,就可能出现卡顿或黑屏。 (图源:X) 只能说,相较于传统WiFi无线显示,毫米波在串流范围上确实不是强项。 当然,对于远程游玩来说,串流画面的延迟可能是更重要的一环。 在家居环境中,我没有刻意清理柜子等杂物,在近距离直接连接上PeakDo,最终测得显示延迟在60ms左右。 (图源:雷科技) 接下来,切换到PS5上,基于《GT赛车7》里计时赛的UI显示,可以看到PeakDo的串流延迟是60ms左右。 作为对比,在家庭网络环境中,实测PlayStation Portal的串流延迟在80ms左右。 (图源:雷科技) 事实上,当两款设备处在同一个环境中,传统Wi-Fi串流和毫米波串流之间的延迟差距远没有想象中那么大,考虑到PeakDo在连接手柄时还会增加一些延迟,可以说二者表现是在伯仲之间的。 除了《GT赛车7》,我又陆续测试了《宇宙机器人无线控制器使用指南》《怪物猎人》《审判之逝:湮灭的记忆》等各式各样的游戏作品,哪怕要进行「完美闪避」或「弹反」这样的精细操作也完全没问题,基本都可以无压力畅玩。 对延迟要求更高的音游,现在也都基本标配了矫正模式,实测用PeakDo游玩《节奏医生》的体验就蛮好的。 可以说,在单间室内环境下,基于500M的电信内网传输速度,两者的操作延迟几乎都是意识不到的,PeakDo并没有显著的提升。 那么问题来了,毫米波串流的优势到底表现在哪里? 答案是稳定性。 在成功连上之后,PeakDo只要能够放定在那里,就基本不会产生任何波动,画面稳定性和有线连接基本没有差别,你完全可以把它看成一块常规的便携屏——只是不需要接线而已。 实际游玩一个半钟《对马岛之魂》,整个远程串流体验可谓无可挑剔,连一次画面波动/连接中断的情况都没有出现过。 (图源:雷科技) 作为对比,传统Wi-Fi串流在很大程度上会受到网络波动的干扰,虽然在状况良好的情况下,二者可能表现差不了太多,但只要网络出现波动,传统Wi-Fi串流就会自动降低码率以保证画面的流畅。 从1080P一路降到240P,只能息屏重新连接的事情,我也不是第一次遇到了。 不过,如果是拿在手上玩的话,其实毫米波也遭不住就是了。 还是按需购买吧 经过这番测试,我可以打包票地说—— 这毫米波无线显示设备啊,确实是有他们的使用场景的,只是正经人可能这辈子也碰不上几次就是了。 (图源:雷科技) 如果你的家里拥有多款硬件设备,又希望在不同的显示设备上游玩的话。 那么选择购入毫米波设备,可能会比购买一条超长的HDMI/DP线缆都要更加稳定,毕竟我自己也是亲自购入过5m以上的DP线的,也不是第一次体验到信号断流导致屏幕亮了灭、灭了亮的感觉了。 不过,我并不推荐你购入这款产品,因为初代PeakDo便携屏的屏幕素质确实是有些微妙了,如果你的家里拥有显示素质上佳的屏幕的话,个人认为他们出品的毫米波无线投屏器或许会更加值得购入。 当然,传统Wi-Fi串流其实也蛮好用的就是了。 诶呀,如果你对画面的稳定性没有太大需求,Steam Link/PS Remote Play其实就够用了。
谷歌砸170亿抢人,华人创企捡漏:Windsurf 72小时闪电解体
编译 | 王涵 编辑 | 漠影 智东西7月15日消息,今日凌晨,自主AI工程师工具Devin所属公司Cognition与AI代码生成初创公司Windsurf在海外社交媒体X上发布联合视频,共同宣布Cognition已签署最终协议收购Windsurf剩余团队。 而就在3天前,谷歌花了24亿美元(约合人民币172.2亿元)挖走Windsurf前首席执行官Varun Mohan、联合创始人Douglas Chen以及编码工具研发团队的部分成员。据谷歌发言人透露,该Windsurf团队将加入谷歌DeepMind部门,主要致力于Gemini项目,专注于智能体编程。 ▲Cognition与Windsurf在海外社交媒体X上发布联合视频(来源:X) 在Cognition与Windsurf的联合视频中,Cognition首席执行官Scott Wu和Windsurf代理首席执行官Jeff Wang透露,他们将首先将Cognition的自主AI工程师Devin整合到Windsurf IDE中。 这种组合产品可以让开发人员能够规划任务、将代码生成委托给智能体并审查拉取请求,所有这些都在单一界面内完成。 回溯整个Windsurf收购事件,从与OpenAI的30亿美元(约合人民币215.2亿元)收购谈判搁浅,到谷歌 “只取核心团队” 的争议性操作,再到如今被Cognition接手剩余业务的 “一鱼两吃” 结局。Windsurf这一连串波折,正是硅谷AI人才大战白热化的缩影。 一、谷歌挖走联创,Cognition“包圆”产品和用户 据外媒CNBC报道,除了挖走联合创始人之外,谷歌还将支付24亿美元(约合人民币172.2亿元)作为选择Windsurf技术的非独家许可。该交易不包括对Windsurf的任何股权投资,也不包括对该公司的全面收购。与此同时,Windsurf保留了授权其技术的能力,并将继续独立运营。 谷歌发言人回复CNBC称:“我们很高兴欢迎Windsurf团队的一些顶尖AI编码人才加入谷歌DeepMind。” 今日凌晨,Cognition与Windsurf,在海外社交媒体X上发布会联合视频宣布:Cognition已签署最终协议收购Windsurf剩余团队,收购金额尚未公开披露,具体的交易条款也尚未公布(两家公司均为未上市初创公司)。此次收购使Cognition能够获得Windsurf的核心产品、品牌和剩余团队。 在一篇题为“The Next Chapter”的Windsurf博客文章中,Jeff Wang直接承认了内部的动荡:“上周,我们失去了我们的创始人和研究团队。” 他赞扬了剩余员工在过渡期间的专业精神,并强调尽管经历了一些混乱,但许多优秀品质依然完好无损。 Jeff Wang在博客中写道,Windsurf的企业收入继续环比翻番,并且保持着数十万的每日活跃用户。Cognition强调,该交易包括Windsurf员工的全面财务参与,包括免除悬崖和加速归属。 ▲Windsurf博客文章(来源:Windsurf官网) Windsurf内部信翻译如下: 各位同事: 首先,我想承认Windsurf最近确实经历了一段动荡时期。上周,我们的创始人和研究团队相继离职。感谢大家在这段时间表现出的专业态度,我知道这并不容易。 尽管经历了这些波折,但让我们引以为豪的核心优势依然存在。我们的业务增长势头强劲,企业收入每季度翻倍,与合作伙伴和政府机构建立了优质渠道,并拥有数十万日活跃用户。 今天,我非常高兴地告诉大家,Windsurf将被Cognition收购。我们的顶尖团队将与这家创造了首个自主软件工程师Devin的标杆企业强强联合。我们的现有客户和强劲的业务线将得到更好的支持,并享受前所未有的产品创新。同时,Windsurf的独特知识产权也将融入Cognition,助力联合团队继续推动AI编程能力的边界。 在众多优质选择中(再次感谢大家的才华和努力让我们走到今天),Scott和他的团队是我们毫无疑问的最佳选择。就像我之前半开玩笑说过的那样,他们是唯一让我们感到压力的竞争对手。在整个AI领域,Cognition确实是我们最尊敬的团队,也是带领Windsurf进入下一阶段的完美伙伴。 作为领先的应用型AI公司,Cognition的旗舰产品Devin已在多家世界500强企业的生产级代码库中部署。他们的收入增长速度甚至超过了我们的高速发展,目前已通过Founders Fund等机构融资超过3亿美元(约合人民币21.5亿元),最新估值达到40亿美元(约合人民币287.0亿元),拥有稳健的财务状况和更强劲的客户资源。 这也是产品层面的完美结合:我们开创了智能IDE,而Cognition打造了市场领先的自主智能体。未来,工程师可以在Windsurf中规划任务(借助Devin对代码库的深度理解),将模块化工作分配给Devin团队,同时通过Tab、Cascade等功能在Windsurf中亲自处理最具挑战性的部分——最终在同一环境中无缝整合。这就是我们将共同创造的未来。 通过这次交易,两支世界级团队将在共同愿景下携手并进,并拥有强大的发展动能。“智能体+IDE”的组合将成为极具竞争力的解决方案。最重要的是,我们现在能够更好地服务快速增长的用户群体——无论是创意编程爱好者、独立开发者还是大型企业团队。 最后,我要向忠实的客户、Cognition的新同事,以及每一位才华横溢且忠于使命的团队成员表示衷心的感谢。 二、Cognition+Windsurf=智能体+IDE Cognition的协议如今为Windsurf的运营方向带来了亟需的清晰指引。在宣布此次交易的视频中,Scott Wu描述了两个平台将如何整合:“想象一下,在Windsurf中规划任务,组建Devins团队,并在舒适的IDE中审查PR。” Devin可以自主完成修复错误和部署应用程序等软件任务,现在将直接嵌入到Windsurf的IDE中。两家公司认为,这种设置将使开发人员能够将重复性工作并行卸载到多个智能体,同时仍然保持对关键架构决策的控制。 Cognition将此视为构建协作式人机代理系统的下一步,并称Windsurf的IDE提供了缺失的界面层,使代理工作流程能够大规模实用。两家公司对此十分有信心,认为用户将受益于更流畅、更紧密集成的开发体验。 Windsurf博客文章还扩展了产品级计划,确认Windsurf现有的功能(如Tab和Cascade,用于手动高杠杆编码)将继续集成在IDE中。 开发人员可以把工作分配给“一组Devin团队”,同时仍然可以自己完成或编辑复杂的部分。“所有工作都可以在同一环境中无缝衔接。”Jeff Wang写道。 合并后的Cognition-Windsurf实体将与GitHub Copilot、Replit、Cursor和其他AI原生IDE厂商直接竞争。谷歌的Gemini平台和微软带有“智能体模式”的Visual Studio Code也在迅速向该领域扩张。 三、和OpenAI“黄”了,跟Anthropic“和好” Jeff Wang在视频中还特别提到了Claude制作商Anthropic:“当然,我们再次与Anthropic成为朋友。” 为什么是“再次”? 外媒彭博社在5月份报道称,OpenAI已就收购Windsurf展开独家谈判,谈判金额高达30亿美元(约合人民币215.2亿元)。 然而在这期间,Windsurf的沟通渠道一度陷入沉寂,其产品变得不稳定,有多个合作伙伴退出,其中最具破坏性的打击来自Anthropic:Anthropic于6月初取消了Windsurf对其Claude 3系列型号的许可。 Windsurf在其博客上发表的声明中证实,Anthropic在不到一周的时间内切断了几乎所有Claude 3.5 Sonnet、Claude 3.7 Sonnet和相关型号的第一方API容量。为了应对这种情况,Windsurf不得不通过第三方推理提供商重新路由流量,并限制免费套餐用户的访问。该公司还推出了Gemini Pro的促销价,作为临时替代方案。 Anthropic联合创始人Jared Kaplan在TechCrunch Sessions: AI 2025上解释了这一决定,称该公司认为通过中间层向其最大的竞争对手OpenAI提供其模型的访问权限十分不合理。 ▲Anthropic联合创始人Jared Kaplan(来源:TechCrunch) 考虑到竞争压力,又考虑到Anthropic有限的计算能力,他认为“我们把Claude卖给OpenAI会很奇怪。”Kaplan补充说,Anthropic更倾向于专注于“持久的合作伙伴关系”,就像它与Cursor保持的那种关系一样。 Windsurf在声明中表达了失望,并强调其平台不仅仅是提供模型访问。“Windsurf的魅力从未仅限于模型”该公司写道,并强调了其用户体验(UX)功能、企业集成和代理工作流程。 四、“人才收购”成监管灰色地带,谷歌、微软、Meta争相效仿 谷歌的意外收购与2024年8月达成的一项协议如出一辙,该协议旨在从聊天机器人初创公司Character.AI聘用关键员工。 包括微软在内的大型科技公司,亚马逊和Meta等公司也采取了类似的所谓收购租赁交易,一些人批评这种交易是为了逃避监管审查。 微软于2024年3月与Inflection AI达成6.5亿美元(约合人民币46.6亿元)的协议,使用这家AI初创公司的模型并聘用其员工,而亚马逊于去年6月聘请了AI公司Adept的联合创始人及其部分团队成员。 今年6月,Meta收购了Scale AI 49%的股份,并挖走了其联合创始人兼CEO Alexandr Wang(汪滔),这是迄今为止对这种日益增长的商业合作形式的最大考验。 与那些让买方获得控股权的收购不同,这些交易无需接受美国反垄断监管机构的审查。然而,如果监管机构认为交易的结构是为了规避这些要求或损害竞争,他们可能会对交易进行调查。 其中许多交易现已成为监管调查的对象。 结语:巨头盯上初创潜力股,硅谷AI人才争夺愈演愈烈 从Meta收购Scale AI 49%的股份,并挖走了其联合创始人兼CEO Alexandr Wang(汪滔)开始,硅谷AI人才争夺战愈演愈烈。 可以看到,自身技术迭代难以支撑科技巨头抢占AI技术潮头的野心,他们开始瞄准初创公司里的“潜力股”,试图借并购、整合带来的“鲇鱼效应”,激活企业内部,甚至搅动整个市场的活力。 硅谷愈演愈烈的AI人才争夺战,仍在持续升温,短时间内看不到平息的迹象。
比想象更严重 索尼Xperia 1 VII问题扩及全球:多地区停止销售
快科技7月15日消息,索尼旗舰手机Xperia 1 VII自上市以来便被寄予厚望,不仅搭载了最先进的骁龙处理器和全新的影像系统,还肩负着整合索尼在影像、音效与游戏等领域的战略任务。 然而,这款备受期待的手机却陷入了严重的质量问题风波,自7月初开始有用户反馈称,Xperia 1 VII出现了无预警自动重启、进入重启循环,偶发性电源异常关机,甚至无法开机变“砖”的问题。 这些问题不仅无法通过系统更新解决,用户也无法自行修复,甚至连官方恢复工具Xperia Companion也无法成功解决。 7月初,索尼在日本停止了Xperia 1 VII的销售和发货,随后,该公司在中国台湾和香港也宣布了相同的举措。 几天后,索尼通知英国消费者,公司正在调查问题的原因以及受影响库存的范围,此外,索尼还在芬兰停止了该手机的销售,并从芬兰网站以及当地零售商和运营商的网站上移除了Xperia 1 VII及其他型号的列表。 据爆料,此次Xperia 1 VII的大规模异常事件可能与生产工厂的变更相关,如果情况属实,整体调整与恢复正常出货至少需待至秋季以后,这意味着Xperia 1 VII若想重返市场,最快也要等待三至四个月。 如果最终复产延迟过久或消费者信心无法恢复,索尼可能直接中止Xperia 1 VII的全球销售计划,选择由下一代机型取而代之,不光如此,还有消息称索尼可能会终止手机业务。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。