行业分类:
加载中...
头条分类:
加载中...
阿里千问上线“中国首个全周期高考志愿填报Agent”,提供免费咨询服务
IT之家 6 月 10 日消息,阿里巴巴今日宣布,千问上线国内首个全周期高考志愿填报 Agent,为全国考生免费提供志愿填报和咨询服务。 阿里巴巴表示,千问高考志愿填报 Agent 基于千问高考志愿大模型和夸克 8 年高考数据经验打造,具备“志愿日历”“志愿报告”“志愿问答”三项核心能力。 千问事业部产品负责人郑嗣寿介绍,中国每年有超过 1000 万考生参加高考。其中为考生聘请专业志愿填报师的家庭占比不到 5%,剩下 95% 的家庭和考生更多靠自己的摸索完成志愿填报。 千问高考志愿填报 Agent 宣称不仅掌握人类专家的思考链路、“位次法定位”等专业填报方法,还能结合历年院校录取数据和高考用户行为理解,提供更符合考生实际需求的志愿规划建议。IT之家附具体介绍如下: 志愿日历 考生在千问填写选科、估分等信息后,就能获得一份“志愿日历”。 “志愿日历”不仅能匹配考生所在省份的时间节点,将志愿填报拆解为一系列步骤,帮考生规划每一步,还能在交流中持续理解考生的兴趣方向、院校目标和城市偏好。 志愿报告 基于考生基础信息与志愿偏好,千问能生成个性化的“志愿报告”。今年,“志愿报告”实现了三大升级: 首先,通过 Agent 能力捕捉“乐于打交道”“不想离家太远”等更多细节需求,在志愿推荐中呈现。根据考生对未来发展路径的关注,增加了就业前景、考公考编、升学深造、AI 时代发展趋势等多项数据及建议。 其次,志愿报告升级了动态调整、主动建议两项能力。考生阅读志愿报告时,可边读边反馈“这个学校我不太想去”“再加几个金融学专业推荐”,报告即可实时调整。 同时,Agent 还对报告增加了自我检查机制,例如:识别到推荐志愿表“专业方向太发散”时,会主动建议考生聚焦方向、别浪费机会。 志愿问答 为满足考生关于高考志愿的咨询问答需求,千问还基于志愿填报 Agent 升级了高考问答能力。 在回复高考相关问题时,千问能调用各类高考工具和位次法定位等人类专家经验,回答考生询问,比如为考生估算“海淀一模 595 分相当于 2025 年高考 629 分”。 此外,阿里巴巴表示,千问工程团队对老旧机型与弱网环境进行了专项优化,保障乡村环境和父母群体使用的稳定性。
全网都在封神,Fable 5这三点实在忍不了
比起幻觉问题而担心大模型会变蠢,不如担心一下“最强”模型会故意变蠢。 Anthropic的“最强”模型发布不到24小时,网上的讨论度直接拉满。大家都想一探究竟最强到底多强。 实测证明,强的不是一星半点。 Gemini 3.1 Pro,GPT 5.5,Deepseek V4和最新Claude Fable 5对比,用的都是同一套提示词。 但是现在我们不说它到底有多强,因为目前为止都是夸它的。 这个模型,完美诠释了什么叫“能力越大,脾气越臭”。在惊艳的产出背后,是三大槽点:一是贵,二是强制降级,三是故意装傻。 第一:这哪里是AI,这是赛博碎钞机 与以往最大的不同是,Fable 5 和 Mythos 5 不是按照惯有的月度收费标准,而是重新明码标价,按照Token收费。 Fable 5 和 Mythos 5 的价格相同,均为每百万输入 token 10 美元,每百万输出 token 50 美元,并且据官方介绍,价格直接腰斩,不足预览版一半。 要知道现有的主流大模型API最低价格,阶跃星辰step-3.5-flash,每百万输入0.7元人民币,每百万输出0.14元人民币。 价格几乎差了百倍。 这意味着每次调用都需要进行慎重的思考,每一个字消耗的都是真金白银。 第一批受害者已经开始在网上吐槽了。 到底如何回本,或成为继吃自助餐之后普通人最常考虑的成本问题。 仅仅一句你好,就消耗了2%5小时额度。 第二:降级毫无道理,安全审核堪称“神经质” 如果说贵还能忍,毕竟一分钱一分货,那它的安全审核简直可以称为“被害妄想症”。 今天AI圈最艺术的行为:有网友刚跟Claude说了句“你好”,直接被系统判定为高危行为,强制降级。 何意味,你好也是一种攻击吗? 这是因为Anthropic给Fable 5加装了一套智能安全防护系统。 一旦系统怀疑用户在搞网络攻击、生化研究,或者是想“蒸馏”它的模型,它就会自动把用户切回到上一代的Opus 4.8去兜底。 官方表示,这套安全规则设置得相对保守,偶尔会误判普通问题,但这类情况极少发生,平均不足5%的会话会触发降级,95%以上的日常使用场景,用户都能体验到完整的顶级AI能力。 事实证明,这也太保守了,连“心脏有什么用”这样的中学问题也无法解答。 第三:故意装傻 知名AI研究机构SemiAnalysis指出,一旦Anthropic的最新模型发现你的机器学习研究很有价值,它就会停止提供实质性帮助,并暗中调低自己的智商,其伪装程度之高,连普通工程师都难以察觉。 该机构表示,他们已经亲身体验到了这种限制,模型对他们的GPU推理研究和编程工作进行了明显的过滤干预。 更可恶的是,它的答案明明是错误的、糟糕的,且提问完全符合要求,它还要照样收昂贵的Token费,这简直就是明目张胆的商业欺诈! 有网友表示:我完全支持拒绝提供安全服务的情况,而拒绝遵守服务条款也是可以理解的。但是,故意给出错误或不正确的回答,而这些回答其实并不违反服务条款,同时还向人们收取象征性的费用,这种行为实在是明目张胆的欺诈行为。 众多开发者怒不可遏,认为Anthropic是不道德的,虚伪的。 初创公司Prime Intellect的AI训练专家埃利·巴库什也表达了极度失望。他认为新模型在前沿研究任务上故意摆烂,对整个学术研究界是沉重打击,而这种暗箱操作更是极其荒谬。 回头看看今年早些时候,Anthropic高调宣布了Mythos级模型却迟迟不发。当时业内有三个猜测: 1官方借口:模型太危险,需要给网络安全人员准备时间。 2算力借口:这模型太大太贵,Anthropic手里算力不够。 3阴谋论:害怕同行“蒸馏”模型。即同行用它生成的高质量数据,去喂养、改进自己的竞品系统。 既然 Anthropic 已将这些人工智能研究的局限性纳入其官方 Mythos 发布计划中,那么第三种理论看起来就更可信了。 最后,想用AI初创公司Reka的联合创始人Mikel Artetxe的玩笑来结尾:“一切都是为了安全!”
博世押注人形机器人零部件:不造整机,做“智能大脑”供应商
凤凰网科技讯 6月10日,在柏林举办的博世互联世界大会(BCW)上,博世集团董事会主席史蒂凡·哈通博士表示,随着人形机器人技术的兴起,市场对博世零部件及解决方案的需求持续增长。博世明确不定位为人形机器人整机制造商,而是作为技术供应商和合作伙伴,提供传感器、软件、电驱动等核心技术与系统解决方案。博世预计有望在该领域拓展规模达数十亿欧元的业务空间。 博世集团董事会成员兼首席数字官Tanja Rueckert介绍,博世开放的ctrlX AUTOMATION平台可模块化快速集成机器人技术,已助力客户将无人驾驶运输系统与高精度机械臂结合。在传感层面,博世是全球MEMS传感器市场领导者,该传感器是机器人实现精准触觉感知的关键。据Yole Group预测,MEMS传感器市场到2030年将超过192亿美元,年均增长4%。 为加速技术落地,博世成立了罗伯特·博世机器人有限公司,并深化与纽鼐机器人(Neura Robotics)等企业的战略合作,共同开发认知机器人技术。今年年初成立的博世中国机器人中心(BROC)成为在华机器人生态合作的重要平台,统筹与本土伙伴在具身智能领域的合作。此外,博世全球230余家工厂积累的海量数据资产正用于训练AI驱动的机器人系统。
抢滩10亿白领,AI不想只围着程序员转
Vibe Working火了,Codex和Kimi Work都盯上10亿白领。 文 | 佘宗明 Vibe Working时代来了,不是轰的一响,而是哇的一声。 听到这,知道的人会说「1024(一级棒)」,不知道的人可能会一脸懵:什么是Vibe Working? 但如果将这里面的「Working」替换成「Coding」,很多人就悟了。 原因无他,过去一年多来,全球技术圈最火的词非Vibe Coding(氛围编程)莫属。 自从解锁了Vibe Coding后,许多程序员内心的os是:别再叫我「码农」了,请叫我「灵魂架构师」。 Vibe Coding的出现,部分革了「古法编程」的命,将原本复杂的逐行手敲代码变成了意图驱动式开发,让很多程序员就此告别逐行语法束缚。 可若「人描述意图+AI执行复杂工作流」只是程序员专属,那这场生产力革命辐射面终究有限:全世界程序员加起来是数千万,看起来是不少,可非程序员人群仍占据了职场打工人的绝大多数,其中白领人数就达到约十亿。 AI欲承「新工业革命」之重,从圈层化涟漪变成全民级浪潮是前提。 God说要有光,于是就有了光。白领们说「要让人负责Vibe(氛围),AI负责Working(干活)」,于是就有了头部AI企业揭开「Vibe Working」盖头的画面。 6月份以来,已有多家头部玩家在「Vibe Working」棋盘上落子:前有OpenAI官宣将Codex的核心能力直接并入ChatGPT,带动Codex周活用户突破500万,增量主要来自于知识工作者;后有Kimi近期推出桌面Agent产品Kimi Work Beta版,为知识工作者带来了「人动嘴皮子,AI干辛苦活」的程序员待遇同款体验卡。 ▲OpenAI方面官宣,将Codex装进ChatGPT。 ▲Kimi 推出了面向知识工作者的通用型本地Agent——Kimi Work。 可以预见,当Vibe Working能像Vibe Coding解放开发者指尖那样,让千行百业的知识工作者(泛白领人群)从无尽的表格整理、资料搜集、文档撰写、网页扒取等琐碎事情里抽身,「未来已来」四个字必然会变得愈发可感。 而现在,这一幕,已不远。 01 勇敢的人先享受世界,离AI近的人先享受AI世界的红利——最先感受到「AI真能干活」的群体,便是程序员。 2025年初,原OpenAI联合创始人Andrej Karpathy首次提出Vibe Coding,尔后该概念快速火爆出圈,究其原因就在于,Coding Agent重塑了编程工作形态。 「程序员,困在重复编码劳动里」,是程序员群体此前处境的真实写照。因为其工作的打开方式就是:梳理需求+架构设计+逐行编码+单元测试+BUG修复……循环往复。 但在Claude Code、Codex们出现后,事情起了变化:开发者们不用再什么都自己动手,只用讲清产品目标,剩下从代码撰写到环境部署交给Coding Agent就行。 这就好比,以往开发者得「自己做饭」,而今可以用语音「点外卖」,买菜、洗菜、炒菜、摆盘跟送餐,全都包在AI身上。 想想跟Code Agent说声「帮我搭个带鉴权的REST API(也就是带登录验证的后端接口)」,AI就能自动把文件建好、测试跑通、README写好,很多开发者能体会到钢铁侠拥有贾维斯的快乐。 程序员独乐乐,不如更多人众乐乐。Kimi Work就将Coding Agent的能力从代码世界平移到了通用办公场景中,让那些科研工作者、金融分析师、咨询顾问、企业文员们也能通过自然语言下达指令,让AI自动完成从获取原始资料到完整交付的全链路——即便他们是不懂Python爬虫、RPA配置的技术小白。 问题来了:为什么Coding Agent的能力能从代码圈外溢到泛知识工作领域? 第一性原理会告诉我们答案:Coding Agent干的,与其说是写代码,不如说是执行需要多步骤、多工具、多文件协作的复杂工作流,其核心就是理解意图、拆解任务、调用工具(API、终端)、读写文件、调试错误等。写代码只是种输出形式而已。 知识工作者的日常其实跟程序员高度相似:你写金融研报,要查数据、拉表格、建模型、写memo;你做竞品调研,要搜竞品、整资料、做分析、出报告;你做学术研究,要下文献、跑数据、画图表、写综述……拆解开来,其底层结构如出一辙:都是信息输入→多工具处理→结构化输出。 ▲做产品调研报告跟写代码看似是两回事,实则同构。 换个视角看,这些工作未尝不是另一种「业务代码」,只不过,输入的是财报和文献而不是GitHub仓库,输出的是Excel和PPT等而非Python文件。 Kimi Work就打破了那层壁垒,把Coding Agent在沙盒里跑代码的能力,泛化成了在电脑桌面上跑工作流的能力——它将Kimi Code在代码领域拉练出的任务拆解引擎、工具调用框架、异常处理逻辑等能力,经过场景适配后复用到了更多领域。 因而,可以将Vibe Coding与Vibe Working视作是同一套生产力逻辑的两次落地:前者是用自然语言驱动AI编码,后者将其适用面外扩,是用自然语言指挥AI处理各种知识型工作。 这就像,电力起初只是用来驱动工厂里的纺织机,后来却走进千家万户点亮无数灯泡。 02  Vibe Working之于白领,正如Vibe Coding之于程序员,作用直观体现在改变工作方式上。 一直以来,人类习惯于串行做事,做完这一件,再做下一件,没法同时「既做又做还做」,否则容易手忙脚乱、顾此失彼。拿我自己来说,每次事务扎堆时,我都十分头大,毕竟分身乏术。尤其是面对那些大体量、长流程任务时,只能靠熬夜爆肝换进度。 没办法,「单核处理器」是人出厂设置自带的bug,而这也框定了我们的效率天花板。 但这难不倒天生适配分布式、并行化协作的AI Agent集群。 如今,OpenAI的Codex、Anthropic的Cowork都采用了子智能体(Sub-Agent)架构,Kimi Work更是将Sub-Agent的支持数量上限提升到了300多个。 支持最多300个Agent同时干活,是什么概念? 前两天,我打开 Kimi Work后,勾选 K2.6 Agent集群按钮,接着说「帮我分析下AI Agent赛道的创业机会,包括竞品分析、市场规模、技术趋势、商业模型,做一份能直接给投资人看的PPT」。 随后我看到,Kimi Work会像项目管理软件那样,自动把我的目标拆解成深度研究、报告撰写、PPT制作等若干个Satge(步骤),然后调度不同专长的子Agent分工协作:探索Agent会去拉数据,数据分析Agent会跑Excel模型,产品Agent会梳理逻辑线,美术Agent会操控浏览器找配图……它们并行推进、交叉验证、相互配合。 自动播放 ▲Kimi Work的执行全过程录屏。 我理解,知识工作就像盖房子,用Agent就是摇人,以往单一Agent是单个装修工,他今天刷墙,明天铺地板,后天装灯具,工期长、效率低;Kimi Agent集群则是直接派装修公司——设计师、水电工、泥瓦匠、油漆工同时进场,他们齐头并进打配合,让效率倍增。 也许有人会说:说来说去,不就是所谓的「多线程作业」吗? 并不是。传统的多线程操作仅能同步执行任务,最终信息整合还得我们自己来。Kimi Work 的Agent集群则是有组织的并行协作,各个Agent同步运转、互通进度,相当于「蜂群智能」。如此一来,我们管理的不再是数百个孤立工具,而是一支高效协作的AI军团。 03 Vibe Working落地,离不开通用Agent。而在通用Agent方面跑在最前面的,仍是一方模型公司。 在当下,做Agent的产品基本可以分为两类:一类是第三方插件型(常被视作「缝合怪」),一类是一方模型原生型(即自研基模厂商的)。从Claude Cowork、Kimi Work纷纷发力Vibe Working看,一方模型公司更有机会做好通用办公Agent。 究其缘由,通用办公Agent 的生死线,就是交付的稳定性:你聊天框说错几句话,顶多是被人吐槽两下;Agent执行则是低容错性,错了一步,如在浏览器里点错按钮、在财务表格里算错公式,后果可能就很严重。 而通用Agent要想稳定交付,得解决复杂任务拆解可靠性、工具调用稳定性、长上下文+长输出能力、迭代速度等问题。 说到这,很多第三方插件型Agent产品会低下头——调用崩坏、数据断层、任务中断,是它们干活时的常见情形。未必是「给它们机会,它们不中用」,而是它们受制于上游模型能力和API配额。 一方模型公司下场,则像「亲妈带孩子」,对模型的能力边界、代码执行、工具调用理解得更透,非但能避免出现「套几层壳导致误差层层放大」的问题,还能模型和Agent一体化打磨,让Agent行为与基座模型共进化。 像Claude Cowork,就是脱胎于Claude Code,所以底层的指令跟随、长程规划、代码执行特别丝滑——还是「原厂调优」大法好。 Kimi Work内核也是根植于Kimi Code,因而生来就具备多重优势,如超长文本处理(一次性写几万字报告都不带喘气的)、专业数据源直接接入(天眼查、iFinD、Yahoo Finance、World Bank、arXiv等都不用用户手动配置)、浏览器操作深度整合(能登录、能点击、能下载、能截图而非简单网页抓取)…… ▲Kimi Work直接接入了大量专业数据源。 打个形象的比方,第三方插件型Agent就像是在模拟器里跑游戏,跑是能跑,但经常掉帧、卡顿、闪退;而一方模型公司做的 Agent,则好比原厂真机直玩,运行流畅,帧率稳定。 (Ps:这下很多人该懂车企自研发动机跟购买零件组装的差别了吧。) 04 刘易斯·芒福德在《技术与文明》中说:技术的真正意义,不在于其孤立的机械成就,而在于它如何被整合进生活的整体,并在此过程中扩散至整个社会肌体。 Kimi Work就在将原本专属于程序员的魔法棒递给更多知识工作者,他们随手一挥,Vibe Working的图景就陈于眼前。 每次技术变革,都会伴生着某些焦虑。Vibe Working的新工作方式出现,也难免会引得某些人焦虑:AI这么能干,还要人干嘛? 但Vibe Working替代的不是「人」,而是以往压在人身上的那些重复性、流程化执行动作。 以往作为手搓派的我们,可能80%的时间在拉数据、清表格、调格式,只有20%的时间在思考。但以后我们可以把脏活累活交给Agent,把认知带宽释放出来做更有价值的事情——如投资决策里的风险嗅觉、整体判断,学术研究中的创新假设、实验设计…… ▲如果让人来写这份报告,可能3天都完不成,但Kimi Work只用了不到30分钟。 需要看到的是,当前Kimi Work仍处于Beta阶段,产品仍处在迭代周期,面对那些小众细分行业、强主观决策类工作,表现还有提升空间。 但其价值会与其说是让AI完美落地执行,不如说是完整展示了Vibe Working的落地可行性:它证明了Coding Agent能力可以外溢普惠至更多行业,证明了Agent集群能落地重型知识工作,更证明了「人类提目标,AI做执行」的人机共生模式是大势所趋。 在此过程中,AI把「执行层」的门槛踏平的同时,也会将人类「决策层」价值放大。随之而来的,是职场里的「再分化」:分水岭不只是会不会用AI,更是能不能管理AI团队…… 未来职场竞争力的核心,不再局限于专业技能,还有任务拆解能力、AI 调度能力、结果验收能力。 那些AI使用阶段止步于L1层次(主要跟ChatBot闲聊)的、停留在L2层次(会让AI帮着动脑想方案)的、达到了L3层次(能让AI动手做执行)的,分别隔着10倍的效能差。 说到底,Vibe Working时代已来,方向盘仍在我们手里,但引擎已经换成了V8。关键是,你能否及时上车掌好舵。
人工智能+生态大会将于6月16日在京举行
人工智能+生态大会(AIEC 2026)将于6月16日在北京中关村展示中心举行。大会以集聚激活生态创新力量、加速推进人工智能落地为宗旨,汇聚多方资源共建开放协同的创新生态平台,系统探索”人工智能+”从战略部署迈向产业实践的方法路径,深度释放重点行业场景的智能化转型潜能,以生态合力推动人工智能技术加速进入千行百业。 本届大会由清华大学全球产业研究院主办,中关村科学城管委会支持,汇聚了来自清华大学、国家信息中心、IDC、阿里云、腾讯、月之暗面、火山引擎、浪潮信息、美的、上海人工智能实验室、阶跃星辰、百川智能等知名机构和领先企业的专家代表,以及Dify、中关村AI北纬社区、DataWhale等生态社区的开发者。 进入2026年,以智能体为代表的新型AI应用形态正在加速成熟。凭借完整的感知、规划与执行能力链路,正在推动人工智能从单点工具应用走向业务流程重构与组织协同变革。面向这一趋势,本届大会将全景式剖析智能体时代的生态演进方向,共同探讨 “人工智能+”纵深发展的新趋势、新路径与新实践。 本届大会设置近60场专题报告,与会嘉宾将围绕 “AI原生企业的组织进化与变革”、“开源大模型发展趋势”、“从大模型到Agent的基础设施演进”、“智能体驱动的制造业重构与AI Coding范式颠覆”,以及“OPC超级个体生存路书”等前沿话题分享实战洞察。同期,大会还将举办走进小米汽车超级工厂的“CIO研学营”和开发者市集,为与会者提供实地观察、动手实操与深度交流的空间。从前沿洞察到场景实践,从技术供给到生态共生,AIEC 2026将以生态之力加速推进“人工智能+”的商业化、规模化应用。
元气森林创始人投的AI云厂商,冲刺IPO
智东西 作者 | 李水青 编辑 | 云鹏 智东西6月10日报道,据港交所官网,独立云计算服务商派想未来今日递交主板上市申请,工银国际、申万宏源香港担任联席保荐人。 不同于阿里云、腾讯云等综合云巨头,PPIO派欧云(公司核心产品)作为独立边缘云平台,一大特色在于聚合全球分散的闲置算力,依托就近边缘节点通过统一调度平台向客户提供计算服务。 据灼识咨询数据,截至2025年12月31日,按计算节点数计,派想未来运营着中国最大的算力网络;按2025年收入计,其是中国最大的独立边缘云计算服务商;按2025年日均token消耗量计,其在中国独立AI云计算服务商中排名第一。 这是一个80后学霸的二次创业故事。该公司创始人兼CEO姚欣是华中科技大学计算机专业出身,曾于2004年休学创办PPTV,一度凭借巅峰时期全球4.5亿用户成为全国第二大视频平台。2018年,姚欣与PPTV老搭档、首席架构师王闻宇联合创立PPIO派欧云,2019年在开曼群岛注册派想未来公司,瞄准5G、AI时代的算力供需矛盾。 截至目前,派想未来已完成6轮融资,总融资突破5亿元人民币。投资方包括蓝驰创投、创世伙伴等机构,以及百川智能创始人王小川、前微软Azure中国总裁申元庆、元气森林创始人唐彬森等个人投资者。 截至2025年12月31日,派想未来的公司算力网络覆盖全球1340多个县市,包含4600多个计算节点。截至2026年4月30日,AI云计算服务在全球拥有超57.4万名注册开发者。2026年4月,日均token消耗量达10280亿次,为中国最大的独立AI云计算服务商。 一、收入复合增长46%,亏损收窄 2023年、2024年、2025年,派想未来收入分别为3.584亿元、5.580亿元、7.703亿元,复合年增长率46.6%。AI云计算服务收入从2024年的1039万元增至2025年的1.192亿元,增长逾十倍。 同期,该公司仍处亏损状态,年内亏损分别为1.894亿元、2.935亿元、2.229亿元,占收入比例从52.8%降至28.9%,亏损收窄;经调整净亏损分别为0.371亿元、0.616亿元、1.046亿元。公司预计2026年将持续净亏损,主因重大研发、行政及销售开支。 对应期内,其研发开支分别为0.678亿元、0.863亿元、1.199亿元,占收入18.9%、15.5%、15.6%。 根据招股书,其亏损主要源于可转换可回优先股公允价值变动、研发投入及服务网络扩展。2025年净亏损减少,得益于AI云计算服务强劲增长及优先股公允价值变动损失减少。 按照服务类别来看,派想未来收入来自于边缘云计算服务和AI云计算服务两部分。边缘云计算服务占主导,收入2023-2025年分别为3.581亿元、5.476亿元、6.511亿元;AI云计算服务收入分别为26.5万元、1039万元、1.192亿元,占比从不足0.1%升至15.5%。 对应期内,该公司毛利分别为0.635亿元、0.688亿元、0.720亿元,毛利率分别为17.7%、12.3%、9.4%。 该公司的流动资产总值分别为3.230亿元、3.627亿元、5.613亿元;现金流量净额分别为-0.664亿元、0.840亿元、-1.033亿元;年末现金及等价物分别为0.458亿元、1.140亿元、1.946亿元。 连续亏损下,其流动负债总额从2023年的7.62亿元增至2025年的14.91亿元,近乎翻倍;负债净额从4.04亿元膨胀至8.89亿元,资产负债率近247%。 该公司的主要市场在中国内地,2025年国内收入占92.8%。 该公司综合损益表如下: 二、三层架构:边缘云打底,AI推理爆发,押注智能体 派想未来构建了跨越三个整合层的云计算平台:底层为全球算力网络(IaaS),中间为模型即服务(MaaS)层,并正扩展至智能体基础设施层。 在边缘云计算服务业务方面,其整合第三方分散异构计算资源,将算力下沉到网络边缘,满足低时延需求。产品包括边缘节点服务和边缘CDN。 按2025年收入计,公司是中国第七大边缘云计算服务提供商、最大独立运营商,市场份额4.2%,且是头部厂商中唯一主要采用平台模式的公司。 在AI云计算服务业务方面,该业务于2023年推出,主要利用分布式GPU资源满足AI推理需求。产品包括: 1、GPU云服务:按需付费,自动扩缩容,内置优化推理引擎。 2、模型API:提供开箱即用的开源模型访问,也支持客户托管自有模型。 3、智能体基础设施:为AI智能体提供自主运行的云计算环境,涵盖编程、沙箱执行、记忆系统等。 按2025年及2026年Q1平均每日token消耗量,公司在中国独立AI云计算服务商中排名第一。日均token消耗量从2025年12月的2710亿增至2026年4月的10280亿。 根据招股书,该公司的核心技术主要包括以下几方面: 1、专有分布式计算架构:异构算力资源池,统一调度多样化计算单元;容器化边缘原生系统,支持Serverless GPU,自动扩展、故障恢复。 2、算力网络及调度能力:覆盖1340+县市、4600+节点,实现毫秒级时延(短至10ms);全球调度实现“削峰填谷”,2025年平均GPU利用率超75%,根据灼识咨询,远超行业40%-50%水平。 3、大语言模型的分布式推理加速:模型优化技术将输出效率提高7倍以上,理论运营成本降低85.7%。模型API定价较主要国际云服务商平均低40%以上。 三、大客户依赖明显,客户与供应商身份重叠 派想未来的所有服务均采用按需按量计费,不采取固定套餐。 其中,边缘类以流量MB为单位,GPU以运行时长为单位,大模型API以token/图片/视频/字符等资源消耗为单位,沙箱以秒级硬件资源占用计价,资源释放即停止收费。 其客户涵盖泛娱乐、社交、电商、教育、汽车、电信、IT、智能制造等领域。2023-2025年,其前五大客户合计占比92.5%、89.5%、79.0%。其中客户A占比分别为44.1%、35.2%、30.0%;客户B占比27.7%、32.6%、23.3%。 该公司存在多组客户与供应商身份重叠。客户A、客户C、客户D连续三年位列前五大客户,客户A和客户D于2025年同时成为供应商;供应商E和供应商H亦曾进入前五大供应商,且供应商H连续三年兼具客户身份。上述重叠方主要涉及算力资源的采购与供应。 同时,该公司与客户A、客户B业务关系分别约五年、六年。主要客户虽自有计算基础设施,仍在需求高峰期依赖公司补充容量。 派想未来的供应商主要为算力资源方。2023-2025年,最大供应商交易金额占销售成本4.0%、6.0%、5.5%;前五大供应商合计占比15.2%、20.3%、19.5%。 四、姚欣家族控股近48%,王小川、程浩都投了 家族财富安排前,姚欣及其夫人吕姗姗通过Patty William(吕姗姗全资)、PP Future(吕姗姗通过Patty William全资)、Water Seven(姚氏家族信托全资)合计持股约48.05%。2025年5月完成家族财富安排后,上述主体持股不变,仍由姚氏家族全资实益拥有。 公司在编纂招股书后的股权结构如下: 派想未来自创立完成6轮融资,早期累计融资超4亿元,叠加后续美元募资后总融资突破5亿元。 其在2021年3月天使轮,投后估值4600万美元。2025年4月其完成了B轮融资,投后估值4.69亿美元。2026年6月3日,该公司又完成首期B-2轮融资,募集3520万美元。 主要投资方包括蓝驰创投、创世伙伴、华业天成、磐霖资本、沸点资本等机构。 在投资名单中,Millennium是多家知名科技创业者共用的境外持股平台,汇集14位产业创始人,百川智能创始人、搜狗前CEO王小川,迅雷的联创程浩等人共同参股此主体;ALPHAX是前微软Azure中国区总裁申元庆专属境外投资控股壳公司。 BRV Aster是元气森林创始人唐彬森旗下挑战者资本配套境外投资实体,是天使轮大额投资方,A轮继续追加投资。 结语:巨头夹缝中求生存,上市是另一场硬仗的开始 从派想未来的IPO招股书,我们看到独立边缘云厂商在云巨头夹缝中的生存现状。他们聚焦盘活闲置算力,靠精细化调度和成本优势切走AI推理这块高增长蛋糕。但其毛利率持续下滑、大客户高度集中、负债率逼近247%,也暴露了平台模式的盈利脆弱性。 从PPTV到派欧云,姚欣的二次创业踩准了算力需求爆发的窗口期。同时边缘云的“低毛利、重资金”属性,叠加AI算力价格战,让这家号称“中国最大独立边缘云”的公司仍面临严峻考验。上市,只是另一场硬仗的开始。
讯飞给智慧空间安上“大小脑”,你的房间也有记忆和主动智能了
智东西 作者 | 陈骏达 编辑 | 漠影 2026年,AI Agent正加速涌入数字世界。从年初爆火的OpenClaw,再到后来诞生的Hermes,Agent框架层出不穷。接入大模型后,它们能调用工具、操作软件、完成复杂任务,一夜之间,数字世界的许多工作和琐碎事务,似乎有被Agent接管的趋势。 然而,在物理世界,Agent的渗透程度仍然有限。智慧空间类产品虽已涌现,却大多停留在“用户发指令,设备被动响应”的初级阶段。设备语义理解能力弱、缺乏记忆与主动服务等痛点,让“智慧”二字多少有些名不副实。 Agent在数字世界的成功,让不少国内外厂商开始思考:如何将这种自主执行、长期记忆、主动智能的能力,迁移到更复杂的物理世界,并在酒店、地产、工厂、办公场所、家庭等场景提供更为智能的交互体验? 今天,科大讯飞发布了对未来空间智能的最新理解——Agent架构SpaceMind。这也是全球首个在智慧空间领域落地的Agent平台。与传统方案不同,这一架构打通了空间感知、语义理解、记忆学习、智能决策与真实设备执行的全链路能力,给智慧空间的未来,提供了一个新的架构设计。 一、接入Agent后反而“降智”?双路由架构成解题思路 在讨论SpaceMind的具体细节前,我们有必要先看清一个行业现状:当AI能力、Agent能力被引入现有智慧空间产品时,体验并非总是正向提升。实际上,不少产品反而变得不如以前好用了。 这些问题已经在海外许多产品上集中爆发了,不少用户抱怨大模型接入智慧空间产品后,原有的流畅体验没了。 在海外社交媒体,有用户反馈大模型参与后,设置一个30秒倒计时需要等待10多秒,开关灯也变得像碰运气一样。在他把设备恢复出厂设置后,才重新拥有之前丝滑的天气预报、播放音乐等体验。 另一位用户分享道,以前用智能音箱开盏灯只要不到5秒钟,大模型被接入后要等个20~40秒,完全毁掉了智能家居的体验。 这些用户的吐槽不无道理。大模型固然强大,但并非所有任务都需要,或者适合它亲自出马。在智慧空间中,许多设备控制类、信息查询类指令天然要求低延迟、高稳定性,而大模型推理本身存在延迟和不确定性,两者之间存在着根本性冲突。 科大讯飞也看到了这一问题。SpaceMind对上述问题的解决思路是对指令进行分流。其双路由架构将控制指令与推理任务分别交由两条互不干扰的通道处理,分工逻辑类似人类的大脑和小脑。 其中,一级路由(控制通道)主要负责处理设备控制类指令。这些指令不经过大模型,端到端响应仅需700毫秒,其中负责判断指令的自研家居语义模型耗时不足200毫秒。相比传统方案,速度提升100%,稳定性提升30%。 现场演示中,我们能看到,在响应诸如开灯、拉窗帘、切换场景等指令时,SpaceMind一般仅需要1秒左右,用户等待的时间已经基本无感,体验十分丝滑。 针对更为复杂的任务,比如复杂语义理解、任务规划、Agent任务等,SpaceMind则提供了二级路由(推理通道),交给大模型深度推理。 从本质上来看,科大讯飞在SpaceMind中所做的,就是将“控制平面”与“推理平面”解耦。这套架构的价值在于,控制类指令不会因为引入大模型而变慢,而在需要大模型出马的复杂任务中,SpaceMind可以灵活切换,提供更为智能的体验。 在此基础上,SpaceMind还采用了双模型协同模式:云端部署的自研家居语义模型负责高频、简单的指令理解,成本低、延迟小;而推理大模型则专注于长期记忆、日程管理、冲突检测、主动提醒等复杂任务。两个模型各司其职,互不干扰。 除了架构创新,多模态感知能力对智慧空间同样至关重要。因为智慧空间需要实时理解“谁在哪里、在做什么、环境如何”,仅靠语音难以获取完整上下文。 SpaceMind架构已经支持通过毫米波雷达技术实现“无感感知”,把空间信息的状态也作为输入,给Agent提供决策信息。 这项技术可以实现精确到5厘米的三维空间定位、呼吸级微动检测、识别人数、区分人与宠物、判断静止/移动/跌倒。更重要的是,毫米波雷达不依赖光线,在烟雾、黑暗、遮挡等环境下依然稳定,还从传感器源头解决了隐私问题——雷达无需采集影像,只会获取空间里的位置和状态。 在真实应用场景里,这套方案可以帮助企业在办公、酒店等场景实现大幅节能。以一家100个房间的酒店为例,每年可以省下约40万元的电费。 二、复杂场景语音指令一步到位,真实记忆自学习重塑主动服务 如果说双路由架构、双模型架构实现了速度和智能的平衡问题,那么SpaceMind接下来的任务,就是把真正的Agent能力引入智慧空间。 科大讯飞海外产品部总经理卢尧认为,如今,用户对智慧空间的期待已经越来越高。智慧空间能否记住用户偏好、能不能主动提供服务、能不能理解复杂意图,都是用户关心的问题。 科大讯飞曾探索能否将OpenClaw框架引入智慧空间,但在研究后他们发现,该框架并不直接适用于智慧空间,但其核心设计理念值得参考。最终,科大讯飞打造的SpaceMind拥有了多智能体协作、长期记忆与主动智能的特性。 多智能体方面,科大讯飞为不同领域的任务打造了专家智能体,每个专家智能体都拥有处理其专精领域所需的知识和技能。 在记忆方面,SpaceMind能够记住用户偏好、家庭习惯、房间状态和长期使用历史,甚至区分说话人。这一系统还具备自学习能力,可以从日常行为中学习规律,让空间适应用户的真实生活习惯。 现场演示中,当不同用户说出同一句“我想休息一下”时,SpaceMind会根据说话人的个性化需求,自动切换到各自偏好的休息场景。用户也可以直接告诉SpaceMind记住特定设置,以后就可以便捷调用。 主动智能是SpaceMind区别于传统智慧空间系统的核心标志之一。传统系统只能被动等待指令,而SpaceMind可以在合适的时间主动提醒或执行。 发布会现场演示的这一能力就十分实用。当用户要求SpaceMind帮他订明天晚上7点的晚餐时,SpaceMind会发现与已有的网球课冲突,并主动提醒用户修改日程。 在SpaceMind这一智慧空间Agent架构中,我们看到了不少与OpenClaw在数字世界中相似的能力,比如能主动理解用户、记住偏好、个性化地执行任务等等。这些能力是OpenClaw在数字世界能斩获不少用户喜爱的关键,而SpaceMind要做的就是把这种体验带到智慧空间之中。 三、两级Gateway打通生态,从开发者共创到全球规模化落地 架构再先进、智能再强大,如果无法连接真实世界的设备,SpaceMind终究无法发挥其全部能力。目前,智慧空间领域涉及的产品、厂商、协议种类繁多,从KNX、Zigbee到Matter,从照明、暖通到安防,不同品牌、不同标准之间的设备往往互不兼容。 用户不可能为了使用SpaceMind而淘汰项目、厂房或家中已有的全部设备,智慧空间厂商也不可能靠一己之力覆盖所有品类。 SpaceMind选择用开放生态来解决这一问题。具体来看,科大讯飞为SpaceMind设计了两级Gateway体系,打通了不同协议、不同品牌设备之间的壁垒。 在基础网关(Gateway Lite)中,SpaceMind支持接入KNX、Zigbee、Matter、Thread等主流控制协议。用户无需替换现有设备,就能使用SpaceMind的AI能力。 在包含基础网关能力的同时,SpaceMind的高级网关(Gateway Pro)新增了多媒体控制能力,同时还将支持Agent现场可编程、本地NAS存储等高阶用户需求,为未来更复杂的空间智能预留了扩展空间。 这意味着,无论企业和个人用户使用的是高端的私有化方案,还是开源生态,SpaceMind都能无缝接入。 科大讯飞还为这一生态推出了SpaceMind Marketplace,它可以被理解为智慧空间的“应用商店”。单一用户的开发能力、想象力终归是有限的,而通过SpaceMind Marketplace,用户可以获取由第三方专家与开发者提供的丰富能力,并在自己的真实空间调用。 为了加速生态繁荣,科大讯飞同期发布了SpaceMind AI Agent创新应用大赛,面向全球开发者、高校团队、创业团队和生态伙伴,鼓励围绕家庭智能管家、老人关怀、儿童陪伴、能源管理、安全守护、沉浸式家庭体验等方向,打造下一代AI Agent应用。这一机制有望进一步释放社区想象力,也让智慧空间里的Agent进一步深入细分场景。 在硬件层面,WallEX是科大讯飞面向海外市场的智慧空间解决方案品牌,承担着将SpaceMind能力落地的重要角色。目前,WallEX可提供智能控制面板、语音设备、传感器、照明、窗帘、暖通、安防等全系硬件,并打造 “终端+方案”的一体化产品。 今天,WallEX联合生态伙伴发布了KNX艺术面板(与世聪联名)和NOVA系列氛围灯,不仅支持WallEX,也支持与CSA、Matter、Alexa、Google Home等生态联动,实现“灯随人动”等智能体验。 从科大讯飞的整体布局来看,今天打造的SpaceMind负责理解、决策与规划,而WallEX负责连接设备与场景落地,两者共同构成完整的智慧空间Agent体系。 结语:中国企业,率先交出智慧空间Agent答卷 如何将新一代AI能力与Agent能力引入家庭、酒店、办公场所,正成为智慧空间赛道的主战场。过去,全球智慧空间的竞争更多集中在连接协议、单品生态与入口之争;而未来,谁能真正把优秀的AI能力和Agent体验交付给用户,实现理解用户、主动服务,谁就有望掌握竞争的关键筹码。 正是在这一方向上,科大讯飞SpaceMind与WallEX的组合迈出了关键的第一步。它标志着中国企业已不再满足于只输出模型和产品,而是开始输出完整的智慧空间Agent系统能力。在全球AI竞争从模型层走向系统层、从虚拟世界走向物理世界的进程中,科大讯飞率先提交了一份来自中国的最新答卷。
史上最大IPO前夜,马斯克把自己的太空算力蓝图公开了
智东西 编译 | 田忠婷 编辑 | 程茜 智东西6月10日报道,昨日,美国太空探索技术公司SpaceX在X平台发布了一段内部技术谈话视频,SpaceX创始人、CEO兼董事长埃隆・马斯克(Elon Musk)介绍了公司太空算力发展路线:计划到明年年底实现AI-1轨道计算卫星年算力约1吉瓦,轨道太阳能系统为其供电,卫星通过太比特级激光链路互联,并依托TerraFab巨型芯片工厂支撑未来太瓦级算力需求。 与马斯克对话的是SpaceX卫星工程总监伊恩・达尔(Ian Dahl)和SpaceX沟通经理丹・霍特(Dan Huot)。在聊天中,他们公开了对太空算力基础设施的整体设想:依靠星舰实现百万吨级年度入轨运力、通过AI-1卫星打造起步150kW的太空算力节点、依托TerraFab巨型芯片工厂支撑太瓦级芯片产能,并长期规划月球电磁质量驱动器,实现低成本深空发射,最终将太空AI算力迭代至1太瓦级别。 在资本市场方面,该访谈视频时发布正处于SpaceX IPO路演的时间段。据SpaceX 6月3日更新的招股书,该公司预计6月12日正式上市。本次IPO发行价定为135美元(约合人民币915元)/股,基础募资750亿美元(约合人民币5083亿元),对应估值1.77万亿美元(约合人民币12万亿元),若超额配售权全额行使,总募资将达862亿美元(约合人民币5843亿元)。若按预期完成募资,该IPO有望刷新全球IPO募资记录。 ▲访谈参与人员伊恩·达尔(左)、埃隆·马斯克(中间)、丹·霍特(右)(图源:X) 以下是本次访谈的核心要点: 1、太空AI算力扩展路线图:SpaceX计划到明年年底实现1吉瓦太空算力规模,随后基本保持每年提升一个数量级的扩张速度,约2.5年达到10吉瓦、3.5年达到100吉瓦,长期目标为1太瓦(1000吉瓦)级太空算力,相当于美国当前总发电功率的两倍。 2、AI-1轨道计算卫星:作为第一代太空算力平台,AI-1卫星峰值功率150千瓦、持续功率120千瓦,相当于一套NVIDIA GB300服务器机柜。卫星采用全太阳能供电、真空辐射散热,并通过太比特级激光链路互联,形成轨道计算网络。 3、TerraFab巨型芯片工厂:SpaceX计划建设占地超1000英亩、制造空间超1100万平方英尺的TerraFab超级工厂,同时生产太阳能组件和AI芯片,为未来吉瓦级乃至太瓦级太空算力基础设施提供供应链支撑。 4、太空规模化部署三大核心要素:马斯克认为,实现大规模太空算力需要同时解决三项关键问题,百万吨级入轨运力、太瓦级太阳能供电能力,以及海量AI芯片和散热系统。 5、星舰的战略价值:作为完全可复用重型运载火箭,星舰被视为太空算力计划的基础设施。SpaceX计划未来3年将全球年入轨质量从目前约2500吨提升至100万吨级,为大规模AI卫星、月球基地和深空任务提供运力保障。 6、从地球数据中心到轨道数据中心:马斯克认为,地球数据中心长期受土地、电力传输和散热能力限制,而轨道环境可直接获取太阳能并利用真空散热,因此未来超大规模AI算力将逐步向太空迁移。 7、卡尔达肖夫文明路线:马斯克再次以卡尔达肖夫文明等级解释SpaceX长期目标,即通过不断扩大太阳能利用规模,从当前接近0型文明水平,逐步向能够利用恒星能量的II型文明迈进。 8、月球制造与电磁发射系统:在地球轨道部署达到极限后,SpaceX计划在月球建设工业基地,利用当地资源生产太阳能板、散热器等基础设施,并通过电磁质量驱动器(Mass Driver)将AI卫星直接发射至深空,进一步降低运输成本。 以下是对访谈全程内容的编译(为优化阅读体验智东西做了不改变原意的编辑): 一、太空数据中心,需要太瓦级太阳能、AI芯片 丹·霍特:大家好,欢迎收看。现在我和埃隆·马斯克以及星链团队的伊恩·达尔在一起。我们来聊聊近况。这是SpaceX典型的一年:发射了全新运载器,收购了xAI,现在SpaceX又宣布了TerraFab巨型芯片工厂项目。 埃隆·马斯克:是的,从来没有无聊的时候。 丹·霍特:是的,从来没有无聊的时候。典型的一年。那么我们想把这些点串联起来,看看这一切如何助力人类成为多行星物种,开始向卡尔达肖夫等级攀登,或许还能展示一些很酷的新AI卫星技术。我们先从银河系尺度切入,用卡尔达肖夫等级把大家带进来。 埃隆·马斯克:大局观是什么? 丹·霍特:大局观是什么?什么是卡尔达肖夫等级?我们如何判断一个文明的发展水平? 埃隆·马斯克:卡尔达肖夫等级是一种根据文明所能利用的能量总量来衡量其技术发展水平的标准。这是一种非常客观的指标,即使是来访地球的外星文明,也会用它来校准我们文明的进步程度。而其中最客观的方式之一,就是任何文明所能掌控并使用的能量总量。 这是一位名叫卡尔达肖夫的俄罗斯物理学家提出的,我认为这是很好的划分方式。你可以评估一个文明对母行星可用能量的利用程度,那就是I型;然后II型就是对恒星能量的利用程度;III型则是对整个星系能量的利用程度。这些都是非常客观且可衡量的数字。 丹·霍特:我们现在处于什么位置? 埃隆·马斯克:我们目前在卡尔达肖夫I型文明的尺度上非常低。比如说,我们对母行星能量的利用比例是一个非常非常小的数字。我们对恒星(太阳)的能量利用几乎为零。太阳是一个真正庞大的存在,很难用语言来描述它的巨大程度,但我们可以从一些数据来感受它的规模。 伊恩·达尔:从I型到II型是一个巨大的难度跃升。 埃隆·马斯克:是的,非常大的难度跃升。至于III型,我们甚至不知道该怎么实现。理解太阳大小的一个方式,是想想太阳的质量占太阳系总质量的多少。太阳大约占太阳系所有质量的99.86%。剩下的0.14%中,大部分是木星这颗行星。地球的质量属于极小的杂项类别,我们就像一粒微小的尘埃。 丹·霍特:但太阳释放的能量到底有多大?尤其是和我们在地球上使用的能量相比。 埃隆·马斯克:照射到地球横截面的太阳能,大约仅为太阳总输出能量的五亿分之一。而其中绝大多数我们无法有效利用。因为地球70%是水域,严格来说我们的星球应该叫“水球”。我想如果有外星文明来访,他们可能会疑惑:这颗星球大部分是水,为什么叫地球? 在剩下的30%陆地中,还有大量是南极洲、西伯利亚、加拿大北部这类严寒地区,这些地方人们通常不想长期居住,在极地也难以获得大量太阳能。所以真正可用于有效采集太阳能的陆地面积其实非常有限。 要想在卡尔达肖夫等级上取得进步,要想利用太阳任何有意义的能量比例,就必须走向太空。如果你想利用太阳输出能量的百万分之一,人类整体能量利用就必须提升远超百万倍。我们目前使用的能量还不到太阳输出能量的万亿分之一(一万亿是一百万的一百万倍)。所以在卡尔达肖夫II型尺度上,我们基本上还处于几乎不存在的位置,连I级都算不上。 只要实现哪怕百万分之一的利用,对我们当前而言都是史诗级的成就,这是我们奋斗的目标。这既是一个相对于我们现状极其宏大的冒险目标,但作为太阳能量的比例,其实又不算特别夸张。 我们不会只是简单地把太阳能板扔到太空去吸收能量,必须有实际的需求。在人类历史上直到现在,都没有真正的大规模太空能源需求。但现在时机已经成熟,是时候开始尝试取得一点进步了。即使只达到太阳能量的1%,那也将是一个极其强大的文明,远超我们现在的水平。 为了在卡尔达肖夫等级上取得进展,我们需要向地球轨道发射卫星来采集太阳能。这样可以避免在地球上建造巨型发电站,而且太空中的冷却要容易得多,你可以直接向真空辐射散热。 这就是我们在这里提出的计划,我们打算努力攀登卡尔达肖夫等级,成为一个值得尊重的文明。这样当外星人(希望他们存在)最终决定和我们对话时,我们至少利用了太阳的一部分能量,不至于显得太可怜。 丹·霍特:在正式把数据中心等送上太空之前,此前有一些限制因素会让这件事几乎不可能实现。 埃隆·马斯克:实现规模化需要什么?需要强大的入轨运载能力,这就是星舰将提供的大规模运力。我们最终需要向轨道及更远的地方运送数百万吨物资,同时需要与之匹配的电力。 如果你想把100兆瓦、最终是太瓦级的算力从地球送上太空,你就需要太瓦级的太阳能,然后还需要太瓦级的AI芯片。所以三大要素是:入轨质量、大规模太阳能、散热器,当然还有大量芯片。 二、马斯克:星舰将彻底改变航天领域,未来可能一小时飞多次 丹·霍特:好的,我们逐一来看。首先是入轨质量,这就是星舰的作用。我们刚刚完成了V3的首次飞行,非常震撼。我知道你当时在现场,看那枚火箭发射太疯狂了。星舰存在的目的是什么?它将实现哪些以前不可能做到的事情? 埃隆·马斯克:星舰将彻底改变航天领域,它是第一个能够实现完全且快速复用的火箭设计。可复用性是实现多行星生活以及攀登卡尔达肖夫等级的根本突破。没有可复用航天器,你无法攀登卡尔达肖夫等级,也无法把生命扩展到月球、火星以及太阳系其他地方。 火箭如果不能重复飞行,成本会高到令人望而却步。就像其他任何交通工具一样,如果你每次飞行都要扔掉飞机,那飞行成本会贵到没人能负担。所有成熟的交通方式,如汽车、飞机、船、自行车都是可复用的。 火箭实现复用要困难得多,因为地球有深重力井和厚厚的大气层,这使得复用勉强可能。此前有很多尝试全复用火箭的努力,大多在中途放弃了。 要实现完全复用,所有环节都必须完美:引擎、结构、航电、推进剂选择,还需要极致的质量优化。这也是我们用发射塔捕获火箭而不是安装笨重着陆腿的原因。我们尚未实现完全复用,但希望今年晚些时候能做到。然后还要实现快速复用,即火箭着陆、被塔捕获、放回发射台后,无需翻新或繁琐检查就能再次飞行,就像飞机一样。这极其困难,星舰是第一个有可能实现这一点的火箭,这也是它如此意义深远的原因。 它同时也是有史以来最重、最大的飞行物体。星舰V3的推力是土星五号登月火箭的两倍多,V4将接近三倍。我们期待未来星舰能达到每小时多次飞行。 丹·霍特:第12次飞行是SpaceX迄今最重的载荷,但这仍然只是V3能力的一小部分。如今猎鹰火箭已经承担了全球绝大部分入轨载荷,人们真的明白,星舰开始飞行后,入轨质量会达到什么规模吗? 埃隆·马斯克:一旦星舰大规模快速飞行,入轨质量将比现在高出好几个数量级。即使现在用猎鹰九号和重型猎鹰,SpaceX也承担了全球近85%至90%的入轨质量,大部分剩余是中国发射的,其余世界(包括美国其他部分)只占5-7%。有了星舰,我们计划在3年内将年入轨质量从约2500吨提升到百万吨级别。 ▲星舰入轨质量计划在3年内提升行2500吨至百万吨级别(图源:X) 三、在轨卫星超1万颗,正在打造AI卫星全球中心 丹·霍特:星舰解决了入轨质量限制。接下来是电力问题。伊恩,也许你能帮大家解答一下。人们可能很难想象太空中的数据中心,我们不是把整栋大楼装上引擎飞上去,这些东西看起来会很不一样。请讲讲如何把地面巨型建筑里的东西转化为太空可用的形式。 伊恩·达尔:很多人其实不知道数据中心里面是什么样子。它不是什么神秘的云端,有些人想象一堆电线,有些人想象一堆盒子,但本质上就是一定数量的芯片。我们需要送上太空的核心部件其实体积并不大,更具挑战的是如何供电,以及如何处理废热并将其散发到太空真空中。 埃隆·马斯克:AI卫星其实比星链卫星简单得多。星链卫星有巨大的相控阵天线、抛物面天线和大量激光链路,复杂得多。而AI卫星主要是大量太阳能电池和散热器,虽然也需要一些激光链路,但没有那些超级复杂的天线。所以AI卫星相对更容易设计,只是尺寸稍大一些。 丹·霍特:这就是我们的AI-1,请给我们介绍一下。 伊恩·达尔:我们设定的合理起点是150千瓦峰值功率,结合xAI的实际经验,我们还能稳定支持约120千瓦的平均算力。我们展示的是SpaceXAI卫星第一代(AI-1)的设计初稿。150千瓦峰值、120千瓦持续功率是一个好的起点。 埃隆·马斯克:为了让大家直观感受散热器和太阳能板的尺寸,我们假设太阳能阵列为每平方米250瓦,散热器为每平方米1400瓦(双面散热,刀刃朝向太阳)。这些是可实现的目标,未来我们还能做得更好,太阳能超过550瓦/平方米,散热器保持在1400瓦/平方米以上。卫星主要就是大量太阳能板和散热板,其他部件相对很小。 这些是基于我们已在星链星座中发射的技术演进。我们已经在用V3星链的太阳能技术,并计划把它做大。这不是需要什么尚不存在的困难技术,大部分我们已经在星链V3上实现了,所以相比我们已在做的事情,这不算特别难的问题。 卫星还将有太比特级的激光链路连接。150千瓦峰值功率大致相当于NVIDIA GB300(或GV300)机柜的水平(72块GPU,峰值约140千瓦,但很难长时间维持,更合理的平均是120千瓦)。你可以把它想象成太空中的一个计算机柜,这些机柜之间通过激光链路互联,或直接接入星链星座,再由星链用Ka/Ku天线或激光链路把数据传回地面。轨道高度约600-800公里,光每毫秒传播300公里,往返延迟仅约3毫秒,不用太担心延迟问题,光速还是很快的。 散热器本身的尺寸也和V3星链的太阳能板差不多,大约70米翼展。这些是相当大的设备,我们会建造很多并发射上去。但太空就是太空,那里空间极大,即使部署数千甚至上百万颗卫星,也有足够空间。地球上看这些卫星非常微小,几乎看不见。 我们目前在轨约1万颗星链卫星,对运营超大规模星座并保障安全有丰富经验。我们知道如何紧密排列并安全飞行卫星,这是我们的核心优势。 我们将在波士顿的这座工厂大量生产这些卫星。目前这座厂房已经很大,但我们即将建设的太阳能工厂和AI卫星生产厂房会更大。预计到明年年底,太阳能和AI卫星生产都能达到合理规模。这里将成为AI卫星的全球中心。我们身后生产线也在运转,继续生产星链用户终端,并新增产线。新款终端产能将远高于现有型号,最终全球可能有数亿台星链终端。此外,我们的星链直连手机星座也将让手机直接与太空实现高速通信。 ▲SpaceX的AI卫星厂房(图源:X) 四、TerraFab芯片工厂,预计3.5年后太空算力可达到100吉瓦 丹·霍特:现在两大限制因素已经解决,接下来是芯片。 埃隆·马斯克:初期我们可以直接发射现有成熟芯片,当前参考设计支持NVIDIA GB300或Rubin芯片,也会有TPU的参考设计。理论上任何现有芯片都能送上轨道。但全球AI算力规模可能达到100吉瓦左右,这远不够到太瓦级,这就是我们需要TerraFab的原因。 TerraFab将占地约1亿平方英尺,是得州特斯拉超级工厂的十倍,规模巨大(甚至需要用星舰在厂区内点对点通行)。TerraFab即使没有根本性技术突破,仅靠扩展现有芯片制造工艺,也能实现每年太瓦级的芯片产能。从逻辑芯片角度看,相当于每年生产10亿块每块1千瓦的芯片,并配套大量存储芯片。 很多人认为太空数据中心还要等十年,但我们想给大家一个时间框架,请带着一定保留态度看待,这只是我们的最佳预估,不是正式承诺,到明年年底,太空AI算力规模将达到约1吉瓦;随后每年有望提升一个数量级,约2.5年后达到10吉瓦,3.5年后可能达到100吉瓦;结合全球芯片产能提升和TerraFab工厂建设,最终目标是扩展至1太瓦(1000吉瓦,相当于美国当前总用电量的两倍),我相信未来会有这样的需求。 丹·霍特:当我们突破所有地球限制因素后,下一步要如何继续向卡尔达肖夫II型文明取得进步? 埃隆·马斯克:为什么要止步于此?1太瓦还是太小了。要再提升三个数量级(太瓦的一千倍),我们目前能想到的唯一可行方式是在月球上建设,使用质量驱动器。在月球本地生产光伏板、太阳能设备和散热器,芯片可以从地球运送或未来在月球制造。大部分质量在月球生产,就无需从地球长途运输。由于月球无大气、重力仅为地球1/6,你可以用电磁炮(线性电动机)直接把AI卫星加速发射到深空,而无需火箭。 ▲电磁炮把AI卫星加速发射至深空(图源:X) 丹·霍特:如果这都不能让你对未来感到兴奋,那我真不知道什么能了。 埃隆·马斯克:我非常期待看到月球上的质量驱动器建成,那会非常酷。 伊恩·达尔:科幻般的未来。 埃隆·马斯克:如果我们能向月球运输那么大规模的物资,也意味着任何想去月球的人都能去。我觉得这很酷。 丹·霍特:我会第一个排队上去。 埃隆·马斯克:是的,我认为每个人一生至少应该去月球一次。你甚至可以搬到那里居住。 丹·霍特:谢谢两位接受聊天。很兴奋看到全新类型的卫星、更多星舰发射、更多芯片、更多太阳能,一切都在推进。未来很宏大,我期待看到公司所有人一起去把它建成。 埃隆·马斯克:是的,未来将会非常精彩。我们才刚刚开始。 来源:X
官宣!何小鹏亲自下场,搞机器人
机器人前瞻(公众号:robot_pro) 作者 | 许丽思 编辑 | 漠影 机器人前瞻6月10日报道,今天,小鹏集团董事长、CEO何小鹏在一封内部信中宣布,即日起,除继续担任小鹏集团CEO外,他将亲自兼任机器人业务的“CEO”。 在这封题为《让梦想落地量产,共赴物理AI新十年!》的内部信中,何小鹏表示,小鹏机器人已经站在量产和商业化的前夜,这并非一次简单的业务升级,而是小鹏从“智能汽车公司”向“物理AI公司”转型的重要一步。 何小鹏在信中把当前的小鹏机器人,比作8年前小鹏汽车首款车型G3即将发布、量产交付前的阶段。他提到,过去三年,小鹏机器人团队围绕IRON完成了从概念到产品的跨越,让其逐步具备行走、奔跑、交互和工作的能力。机器人业务目前整合了小鹏集团的内部综合能力,包括硬件、AI大模型、供应链、营销等各个业务模块,复杂度很高。 和业内同类机器人产品相比,何小鹏称,小鹏要打造的是最具拟人特质的的机器人,可依托本地实现自然语言沟通、自主思考;安全性要顶尖,做到全包覆设计、轻量化动作和数据隐私安全;并坚持全栈自研、跨领域技术融合,同时规划自建数据中心和工厂,率先推动高阶人形机器人规模量产。 接下来,小鹏会持续加大对机器人业务的资源投入,把汽车业务积累的供应链、制造工艺、品控标准、全球化布局等能力,完整复刻到机器人业务板块,力争快速且高质量地把IRON 机器人交付到客户手中。 何小鹏亲自挂帅,也发生在小鹏机器人业务出现核心人事变动之后。此前有消息称,小鹏机器人产品规划高级总监施晓鑫已于6月初离职,小鹏方面回应称,该离职属于个人职业规划调整,人形机器人仍按计划推进量产。 在5月的机器人量产动员大会上,何小鹏明确了机器人业务的关键时间节点:2026年第四季度,小鹏将实现人形机器人量产;2027年一季度,小鹏将人形机器人带入线下门店进行导购工作;2027年二季度,人形机器人将被推向海外市场;2028年,机器人将开始走向更多的家庭。 接下来的几个月,将是小鹏机器人量产前最关键的冲刺期。何小鹏提到,将要逐一攻克量产环节的各类细节问题,打磨每一项功能,确保交付给用户的是真正好用、实用、耐用的产品。
所有考生免费!阿里发了个AI高考报志愿专家
AI应用风向标(公众号:ZhidxcomAI) 作者|毕伟豪 编辑|漠影 智东西6月10日报道,刚刚,千问推出了全新高考AI产品——千问高考志愿填报专家,这是国内首个全周期高考志愿填报Agent,具备“志愿报告”、“志愿日历”、“志愿问答”三项核心能力,将为全国1290万名考生免费提供志愿咨询服务。 又一年高考落幕,志愿填报如约而至,成为1290万名考生及其家庭的重大抉择时刻。一直以来,信息量庞大、信息获取难度高、决策极为复杂的志愿填报场景,都是各大AI厂商的必争之地。 刚刚千问所推出的高考志愿填报Agent,就直接指向了这个问题,回顾往昔,这支团队已经在高考志愿填报上走过了整整8年。 千问高考志愿填报专家是一个会主动规划、能拆解任务、记得住考生偏好的办事型Agent。 它会根据考生的分数、选科、兴趣、家庭条件、所在省份的志愿填报时间节点,主动排出一张从考后到填表的全周期路线图,带着考生一步步走完估分、探索、筛选、出方案、提交的全过程。 支撑这个Agent的,是一款专门为高考志愿场景自研的大模型。千问团队把夸克沉浸高考8年来攒下的22亿优质高考数据送进了预训练。 后训练阶段引入了300多名人类志愿填报专家的方法论,让模型学会人类专家的完整思考链条,同时配合近40万种提问模式的AI考生对抗训练进行强化学习。 此外,对于费用问题,阿里巴巴千问事业部千问产品负责人郑嗣寿提到了团队内部的一句话:志愿填报服务它不应该是一个稀缺资源,而应该是一种公共服务。 在后续与智东西等媒体的沟通中,郑嗣寿也明确提到,这项高考志愿填报服务,不会收费。 同时,千问团队也反复提到一件事,就是AI志愿填报始终是辅助决策,不能替代人类进行真正的判断,千问高考志愿填报Agent的定位一直都是一个辅助的角色。 一、志愿日历:量身定制填报计划,全周期主动规划 千问高考志愿填报Agent会一步步引导考生完成志愿填报的全过程,主动排好一张从考后到填表的完整时间表,根据考生所在地区、兴趣爱好、实际分数等信息,通过认知建立、成绩定位、方向探索、方案预选、成绩公布以及正式填报这六步实现全周期志愿填报辅导。 这就是志愿日历功能,郑嗣寿把它称为“今年做得最有想象力的产品”。志愿日历解决的是一个很具体但容易被忽视的问题:考完之后,绝大多数考生和家长对“志愿填报到底要准备什么”是模糊的,考前所有精力都在怎么考高分上,考完才发现连从哪下手都不知道。 千问的做法是把一个模糊的大任务拆成一系列清晰的步骤。日历会根据考生所在省份的出分时间、填报节点、录取通知书发放日期,自动生成一张从考后第一天到志愿提交日的路线图。 这种主动规划串起了六个关键动作:先帮考生搞懂政策框架(什么是平行志愿、冲稳保结构),再在估分区间里用冲稳保工具池浏览候选院校,接着引导考生做职业评测锁定方向,然后叠加上专业强度、城市偏好等维度生成初步方案,出分当天提醒查分并按真实位次更新方案,最后在填报前逐一检查代码和排序。 志愿日历的另一个关键能力是量身定制,它没有按省份和时间一刀切排内容,而是根据每个考生的分数段、兴趣方向、个人纠结来动态调整推送。一个600分对计算机感兴趣的学生,和一个550分对师范感兴趣的学生,日历里要准备的内容功课完全不同。 更进一步的是,日历会持续捕捉考生跟千问的交互对话来调整后续安排,比如考生表达过对考研率的关注,后续推送就按考研率排序;考生表达过对学费的敏感,后面就会加入院校生活成本分析。 郑嗣寿总结说:“这种主动规划的能力,过去只有人类规划师才能做到,而今天千问可以同时服务几百万人、上千万人。这就是AI在这个时代真正的价值,我们不是要取代人类专家的判断力,而是要把人类专家的主动规划能力规模化。” 二、志愿报告全新升级,随时修改、主动检查 志愿报告是千问去年首创的功能,今年做了三大升级。 第一是在内容质量上做了系统性升级。千问不只会考虑眼前能上什么好学校,还会着眼于未来考生的发展路径,比如考研的难度、考公的适配、就业的趋向、基础的水平、未来可能的发展前景等等。 从考虑几个月的事情,计划到能考虑几年之后的可能性,给考生更多参考,郑嗣寿举了一个真实案例: “湖南物化生595分,最近研究志愿有点迷茫,对专业也不是特别懂。想学点和AI、计算机相关的方向,或者学校重点培养、就业比较好的王牌专业。家里条件一般,学费别太高,不考虑中外合作和农林类院校。地域上优先湖南,在江苏上的小学,回江苏也能接受。另外我有国家专项资格,省内专项志愿也可以一起看看。” Agent输出的推荐方案中提供了湖南科技大学知识产权专业(计算机双学位+国家专项)、湘潭大学人工智能创新创业基地班等选项。 面对这种复杂的条件约束,千问高考志愿填报Agent从多个维度考量后进行了精准的志愿填报推荐,充分考虑了考生的未来发展情况。 第二,支持动态调整。以前的报告像一份一次性推荐清单,今年则更像反复校准后的完整填报方案,考生和家长在边看报告边记录新想法,Agent会在原方案基础上定向调整,不需要推翻重来。 第三,主动提建议。过去的报告只会呈现结果,不会提供建议,而今年升级后,千问会自行扫描方案中可能存在的风险或盲区,不等你发现问题再来问就已经做出了修改。现场展示的一个案例中,AI看完报告后提醒考生:选科和特长更匹配科技金融或AI方向,建议同步关注。 三、志愿问答:5大能力叠加,打造7×24在线的专家级规划师 做好高考志愿问答并不容易,考生的问题往往含混,甚至自己都不太清楚想表达什么,在对话过程中才逐渐清晰。此外,问答准确性要求高,没有容错,且需要结合考生的完整画像进行回答,难度很高,千问用了五个能力来处理这些问题。 第一,记得牢。Agent会持续记住你告诉它的所有信息,包括分数、选科、偏好、此前的纠结点,不需要每次重复一遍,这也意味着第10次对话给出的建议会比第1次更准,也就是官方所说的“越用越好用”。 第二,回答准。千问团队强制模型约束控制幻觉,特定需求仅参考官方可靠信源,进而排除网络上低质量信息的干扰。此外,千问将8年来积攒的高考数据库深度嵌入问答链路,让每个结果都有可溯源的出处。 第三,有方法。遇到需要换算或判断的问题,Agent会自动调用专业知识处理,比如用线差法将模考分数等效转化为高考分再做院校匹配。 第四,工具融合。高考场景下大量结构化数据很难用几句话说清。千问在问答中会将数据库转化为可视化卡片,考生既能读到自然语言的解释,也能直接看到比对表格。 第五,聪明追问。当考生问出比较宽泛的问题时Agent会进行先反问,通过两到三轮引导式追问(如你说的好是指排名高、就业好、还是离家近?分数大概在哪个段位?),精准锁定考生真实需求。 这五个能力叠加在一起,本质上模拟的是一个有8年高考志愿填报经验、服务过上亿考生、同时掌握全国近乎所有数据的一个规划师,并且这个规划师不睡觉,7×24小时在线,有耐心,不烦躁。 四、AI考生近40万种提问方式,训练出千问高考志愿大模型 上述产品能力,建立在一个专门为高考志愿场景训练的大模型上。 千问AI算法负责人蒋冠军在发布会上拆解了技术路线,数据层面,其团队补齐了全国约3000所院校、2000多个专业的全部基础信息,打通了分数、位次和报考要求的精准对应关系,同时引入了国家重大规划中的行业人才缺口数据和企业公开用人信息,反向映射到专业推荐中,关键字段的覆盖率和准确率达到95%以上。 后训练阶段,其团队每年聘请数百位高考志愿填报专家,标注模型的执行过程和结果正确性,让模型逐步学会专家的思考方式。同时设置了“AI考生对抗训练”,AI考生模拟近40万种提问模式,覆盖文字、图片上传、文档分析等不同内容载体,模型答对加分、答错扣分,用7个奖励函数做强化学习。 记忆方面,用户的对话历史跨度可能很长,从考后估分到最终提交横跨近20天,中间还会穿插非高考话题,模型要能分辨“本人还是家长在用”以及“哪些偏好已经变了”等问题,而目前千问的记忆模块评估数据达到了98%以上的准确率。 工程侧也有一个容易被忽略的细节:去年20%的访问来自老旧机型和低带宽网络。其团队专门做了低端机型稳定性测试和优化,确保不管你用什么手机、在哪上网,都能稳定使用。 结语:把专家能力规模化,免费服务守住高考流量入口 发布环节有一个让人沉默的数字:全国只有不到5%的家庭有能力请线下志愿规划师。而一个规划师一个报考季最多只能服务30到50名考生。那剩下95%的考生靠什么呢? 千问对于这个问题的解题思路是:把8年攒下的数据、300名专家的方法论、1.6亿用户的行为模式全部送进大模型,通过Agent免费同时为千万级用户提供志愿填报服务。 而对1290万考生背后的家庭来说,全周期规划加免费的志愿填报辅助模式,可能比任何模型参数都重要,不过需要注意的是,不论多么先进的AI志愿填报产品,其定位都只能是辅助决策,最终的判断还是要根据自身情况,由考生和家长自己做出。 但这种免费策略的本质是仍入口争夺,高考志愿填报代表着每年上千万的流量,而免费服务的背后连着教育规划、职业咨询、金融产品等一系列商业链条,此次千问高考志愿填报Agent的发布,是阿里守住志愿填报流量入口的又一举措。
能跑马拉松,却拿不稳一瓶水:具身智能的“最后一厘米”怎么破?|对话超维传感CEO
机器人前瞻(公众号:robot_pro) 作者 | 许丽思 编辑 | 漠影 能跑马拉松,打球、跳舞媲美真人的机器人,如果要轻拿轻放一瓶没拧紧盖子的矿泉水,大概率都得翻车。 要么,机器人用力过猛,捏扁瓶子;要么就会在瓶子接近桌面的时候突然松手,把水洒得到处都是。 这种的尴尬反差,就是当前具身智能行业最真实的写照。 长期以来,机器人感知研究以视觉为主,强调只要视觉足够精准、语言模型足够通用,机器人就能完成复杂操作任务。但真实物理世界远比图像世界更难处理,视觉没法准确判断物体的柔软程度、表面摩擦、受力变化和滑移趋势。 操作从来不是简单的、程序化的抓取与握紧,而是机器人的灵巧手在充满各种不确定性的环境中,不断感知、调整、反馈、再调整的动态交互过程。 所以,在如今具身智能的语境下,触觉的价值正在被重新认识,被认为是具身智能落地的“最后一厘米”,也是机器人能否完成从机器进化为生产力的关键跃迁。 资本也在用脚投票,今年以来,触觉赛道迎来融资热潮,甚至还被赋予了上万亿的估值想象。根据国泰海通证券测算,当人形机器人产量达到1000万台时,对应的触觉传感器市场规模约为0.24万亿元;而当产量达到1亿台时,这一市场规模将飙升至1.18万亿元。 最近,机器人前瞻对话了超维传感创始人兼CEO李炎辉。这家公司聚焦于灵巧手触觉传感器研发,独创了多物理量融合感知技术,能够在指尖微小空间内集成轮廓、三向力及姿态感知。核心团队出身“果链”企业,在产品量产上有着丰富经验。 在这场对话中,李炎辉拆解了他们打通具身智能“最后一厘米”的硬核逻辑与产业实践。 一、为什么轻拿轻放一瓶矿泉水,能难倒机器人? 对普通人来说,随手拿起桌上一瓶没拧紧盖子的矿泉水,拧开喝一口再放回原处,是再自然不过的肌肉记忆。 但就是这样一个人类三岁小孩都能做好的动作,能难倒一大片机器人。水瓶不是一个高难度物体,但它有重量变化、瓶身变形、盖子松动、重心变化等不确定因素。 李炎辉解释,这个过程可以拆解为四步: 视觉预判:机器人通过视觉双眼解决“在哪里”的问题,判断一个初始抓取力; 接触与初始抓握:灵巧手开始碰触物体,快速确定保持稳定抓取的最小力量; 移动与调整:这是最核心的一步,在拿起的动态过程中,机器人必须实时检测物体有没有向下滑动或倾斜,并实时纠正施力大小; 放置与释放:机器人要感知到物体被桌面托住、切向力突然趋近于零的微妙变化,确认平稳后再松开手指,实现轻拿轻放。 如果没有精确力信息,机器人只能加大冗余量,哪怕把瓶子捏瘪,也要先把它拿起来;而快接近桌面的时候,就会突然把瓶子往下一丢。 这背后的关键问题,是非结构化环境下的力控失稳,机器人不知道该用多大力,也不清楚力往哪处使。 所以,灵巧手要实现通用泛化,就离不开高精度的触觉信息。只有足够干净、稳定、可复现的触觉数据,才能支撑机器人从单次Demo走向跨物体、跨场景、跨本体的泛化操作。 二、高精度触觉信息,是灵巧手通用泛化的基础 既然操作失败的核心在于力控失稳,那么机器人到底需要什么样的触觉数据,才能训练出更稳定、更可泛化的灵巧操作能力? 目前,主流的触觉传感器技术路线各有千秋:压阻路线主打高性价比,电容路线可以实现接近感知,视触觉拥有极高的点阵分辨率,霍尔路线则长于高灵敏度感知。 但在李炎辉看来,回到灵巧手真实需求,当前更核心的短板是高一致性、高可靠性和高精度力控信息的缺失。 在灵巧操作的过程中,既需要视觉负责目标定位和路径规划,也需要触觉负责接触确认、动态控制等,两者深度融合形成视觉-触觉闭环,是实现泛化操作的关键。 为了寻找解法,超维传感团队将目光投向了人类皮肤的生物学构造。 人的皮肤从外向内有触觉小体、默克尔盘、环层小体、游离神经末梢等组织,分别感知精细触觉、持续压力、振动变化、冷热和痛觉等,人类触觉本质上就是多组织、多维度共同作用的结果。 基于此,灵巧手需要的触觉数据,也不能依赖单一维度的信息,而是一套完整的数据结构集合,包括高质量位置信息、法向力、切向力、姿态信息和温度等。 所以,超维传感从成立开始,就决定走一条与众不同的融合感知路线,满足灵巧手通用泛化数据需求。 针对行业长期存在的“片与片之间一致性差”、“温度漂移严重”、“剪切力测不准”等系统性顽疾,超维传感在底层材料和结构上进行了硬核重构: 材料:传统感压油墨的时漂率往往高达10%,超维传感通过纳米材料改性技术改良印刷工艺,将时漂率压到5%以内; 结构:在指尖小尺寸空间中集成位置信息和三向力信息,往往会互相干扰,产生耦合误差。超维传感通过解耦结构设计,将原始耦合误差控制在 3%以内; 算法:结合定制的AI与信号处理引擎,滤除外界的环境噪声,为上层具身大模型提供真正“原汁原味”的物理交互数据。 三、从指尖、指腹到手掌,打造整手触觉感知系统 在过去,触觉传感器常被认为是边缘配件,许多厂商宁愿把经费砸在视觉和运控算法上,也不愿意在触觉上多花心思。 关键原因是低质量触觉传感器输出的数据不够干净。在AI模型训练中,如果传感器不准确、一致性差,模型得到的更多是噪声,最终触觉信号反而会被误判为“不重要”。 而现在,触觉传感器的角色正在发生变化,从灵巧手配件变成操作模型的数据入口、实现控制闭环的感知底座。行业开始意识到,高一致性、高可靠性、高精度的触觉传感器,是实现灵巧手通用泛化操作的前提。 基于这种对底层逻辑的洞察,围绕融合感知的路线,超维传感已推出了三大触觉产品线,形成一套覆盖整只灵巧手的触觉感知系统。 HSP系列:这是指尖六维力触觉传感器,面向精细触觉交互,集成位置、三向力、姿态感知等信息,力控线性精度误差< 0.2%、一致性误差 < 1%; HSM系列:面向指腹场景,采用中空设计,可避让电机、连杆或腱绳空间,融合位置信息与高精度法向力检测,力控线性精度误差 < 0.2%,一致性误差 < 1%。 HSE系列:这是阵列式薄膜压力传感器,采用3mm超薄柔性设计,适合手掌、手臂等大面积接触区域,重复性误差 ≤ 5% FS,时漂 ≤ 5% FS/H。 谈及为什么打造这样的产品组合时,李炎辉谈道,核心是从灵巧手真实操作需求出发,指尖负责高精度位置、法向力和切向力感知,支撑底层精细力控;指腹提供位置和法向力信息,用于抓取过程中的轨迹修正;手掌和手背则提供大致受力与位置信息,服务上层握持策略决策。 这样的布局也能弥补行业只做指尖触觉带来的感知盲区,支持侧向夹持、狭窄空间操作等更复杂任务。同时,三类产品可按客户需求模块化选配,兼顾高精度与量产性价比。 更长远看,超维传感希望借此建立指尖、指腹、手掌的触觉信息范式,为具身AI构建标准化触觉数据底座。 结语:让机器人真正干活,先要补上高精度触觉这一课 业内人士经常讨论,通用具身智能机器人,到底什么时候能走进千家万户替人类干活?回答往往有五年、十年甚至更长。 但有一个共识是,在补齐高精度触觉这块拼图之前,一切大范围的商业落地都是空中楼阁。 “目前横亘在行业面前的最大门槛,是数据和应用的飞轮还没有真正转起来。”李炎辉坦言。低质量的触觉信息导致大模型无法通用,下游需求迟迟无法爆发;而缺乏大范围的应用,灵巧手厂商就难以获得海量数据来迭代产品。 在这样的洞察之下,超维传感的解法是,通过融合感知路线,让机器人获得高精度、高一致性、高可靠性的触觉信息;再加上工业级交付能力,把飞轮推向正向循环。 与大多数还停留于实验室演示效果、难以商业化落地的触觉传感器不同的是,超维传感凭借团队千万级出货量的系统级Know-how和深厚的工艺沉淀,已具备了大规模交付能力。 机器人成为生产力的关键一刻,或许就发生在它终于能像人一样,轻轻拿起一瓶水,再稳稳放回桌面的时候。
苹果升级iOS 27版地图:AI优化飞行俯瞰植被效果、引入本地榜单
IT之家 6 月 10 日消息,科技媒体 Appleinsider 昨日(6 月 9 日)发布博文,报道称在 iOS 27 版地图(Apple Maps)应用中,苹果升级城市飞行俯瞰(Flyover)植被显示效果,以及增强周边发现。 在本次 iOS 27 版地图应用更新中,苹果公司重点升级“飞行俯瞰”功能,重点升级植被效果以及 3D 建模。 在植被方面,以纽约城市为例,iOS 26 版放大后,树木等细节会显得粗糙,尤其像中央公园这类区域,树冠常常呈现明显的方块感。 iOS 18 中 Apple 地图的飞行预览显示树木呈方形(左图),iOS 27 中树木显示效果更好(右图)。 而在 iOS 27 系统中,苹果结合航拍图像和人工智能(AI),进一步丰富枝干层次,呈现更高质量的 3D 效果。这项画质升级并未全面铺开,当前仅在纽约和伦敦等部分城市可见。IT之家附上相关图片如下: iOS 18(左)和 iOS 27(右)中的 Apple 地图飞行俯瞰 iOS 18 [左] 和 iOS 27 [右] 中 Apple 地图的树木特写 另一项改进是 Local Lists(本地榜单)功能,该功能利用苹果地图应用内的交互数据,统计某一地区或城市中最受欢迎的餐厅。 该功能会定期刷新,并直接展示餐厅列表、营业时间、价格区间和菜品图片。用户若觉得合适,可通过加号把地点加入地图标记,点进条目还能查看更多信息。 iOS 27 版 Apple 地图中的本地榜单 苹果同时强调,这些洞察基于注重隐私的数据推导,不会关联到单个用户。目前该功能先在美国落地,后续会扩展到更多国家和地区。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。