行业分类:
加载中...
头条分类:
加载中...
比亚迪确认正自研人形机器人 成熟后走向4S店全网开售
快科技6月4日消息,近日,比亚迪执行副总裁李柯在专访中首次全面披露人形机器人战略,确认比亚迪正全力自研人形机器人,初期将应用于全球4S门店担任导购接待,技术成熟后将在4S店面向消费者开售。 李柯表示,机器人竞争的核心在于制造能力、软件能力和硬件能力,而这正是比亚迪的强项。 按照规划,比亚迪人形机器人将率先落地销售终端,计划在每个门店配置4个机器人做导购,解决海外门店招工难、多语言服务成本高的痛点。欧洲等地区4S店将批量部署,提供产品讲解、客户接待等标准化服务。 李柯预测,人形机器人可能在中国首先实现商业化,比亚迪自身将是最大买家。 她描绘了更远的场景:“等到我们都老了,每一个家里可以有三个机器人,一个帮你打扫卫生、一个帮你做饭、一个陪你聊天散步。”这意味着比亚迪的机器人最终将走向家庭消费市场。 关于商业模式,李柯透露比亚迪不排除做开放平台,既做生产又做销售,既可以是自己的机器人,也可以跟别人合作。 依托造车全产业链自研能力和供应链把控,比亚迪能有效控制机器人生产成本,而遍布全球的数千家4S门店无需额外铺设渠道,未来可直接兼顾卖车与售卖家用机器人。 实际上,比亚迪在机器人领域的布局早已启动。此前比亚迪已与优必选、智元机器人合作,并自主生产机器人产业链核心零部件,在汽车工厂投入150台人形机器人进行测试。 2026年目标内部部署2万台,西安机器人产业园一期投产,年产能5万台。比亚迪还投资了智元机器人、帕西尼感知等企业,与香港科技大学共建“具身智能联合实验室”,以自研与生态双轮驱动搭建“零部件—整机—应用场景”的完整闭环。
李飞飞看不下去了!亲自下场“辟谣”世界模型
世界模型这个词被滥用了。 编译 | 陈佳 编辑 | 漠影 智东西6月4日消息,今日,斯坦福大学教授、空间智能创业公司World Labs联合创始人兼CEO李飞飞(Fei-Fei Li)与团队发布新文章《世界模型的功能分类》,系统拆解了当下被广泛使用却释义混乱的“世界模型”。 文章指出,计算机视觉、机器人、强化学习和生成式AI各领域的人士都宣称其在研发世界模型,但各方所指内涵截然不同。李飞飞试图从强化学习经典的POMDP(部分可观测马尔可夫决策过程)框架出发,为这一概念建立清晰的功能分类体系。 李飞飞将世界模型归纳为渲染器(renderer)、仿真器(simulator)、规划器(planner)三大功能类别,并重点论证了在三者中受关注度最低的仿真器,恰恰具备最深远的产业价值与最棘手的技术难题。 她进一步提出,三类模型底层共用同一套世界知识,当前最重要的趋势是三者边界正不断消融,最终将走向能够灵活切换输出形式的大一统世界基础模型。 李飞飞发布《世界模型的功能分类》文章推文(图源:X) 李飞飞在文中提出了以下几个核心观点: 1、世界模型已成为AI领域最重要、也最被滥用的术语之一,各领域所指内涵截然不同,亟需精准定义。 2、世界模型的技术定义源自强化学习的POMDP框架,即智能体、动作、环境状态、观测信息构成的交互闭环,各类世界模型本质都是这套闭环的不同实现方向。 3、世界模型可分为三大功能类别:渲染器输出供人观看的像素画面、仿真器输出贴合客观规律的环境状态、规划器输出智能体的动作指令。 4、三类模型底层并不割裂,几何、物理、动力学这套描述世界运行逻辑的基础知识是三者共用的底层原理。 5、渲染器商业化最成熟但能力有上限,规划器前景最受期待但尚处起步阶段,仿真器关注度最低却是衔接二者的桥梁与核心支柱。 6、仿真赛道集中了AI领域的诸多棘手难题,包括三维数据稀缺、仿真与现实的域差、生成式仿真的几何隐患、多物理场仿真的高算力成本等。 7、当前最关键的发展趋势是三类模型相互融合,技术演进的终极形态是能根据下游需求灵活切换输出形式的大一统世界基础模型。 8、在同一套模型架构中平衡各项需求,是当前世界模型领域最核心的攻关课题。 以下是对李飞飞《世界模型的功能分类》的全文编译: 01. 世界并非由文字构筑而成 在此前的文章中,我们提出空间智能是AI的下一前沿方向,而世界模型是实现空间智能的必经之路。 本篇,我与World Labs团队将进一步深挖:当下大量被研发、冠以“世界模型”之名的各类产物中,究竟由哪些功能模块构成了世界模型的核心能力,各个模块又分别承担何种作用? 大语言模型让机器拥有了出众的概念理解、词汇运用与逻辑推理能力,但无论是现实物理世界还是虚拟世界,都依托另一套底层规律运行。语言模型学习文本的统计规律,世界模型则学习时空的统计规律:光线如何落在物体表面、不在相机拍摄视角下的花园是什么模样、物体受外力后如何运动并遵循物理定律。 这也让“世界模型”成为当下AI领域最重要、同时最被滥用的术语之一。 计算机视觉、机器人、强化学习、生成式AI各领域人士都宣称在研发世界模型,但各方所指内涵截然不同。能生成绚丽却违反物理规律的火焰的视频模型、能即兴生成游戏的语言模型、能精准模拟燃烧过程的物理引擎,如今都被装进“世界模型”这同一个筐里。 古希腊学者始终无法统一世界的本源究竟是火、水还是不可分割的原子,根源在于“世界”从来没有唯一定义,它只是研究者为了推演论证,对其所研究的完整客观存在的代称。如今AI领域在亟需精准定义的关键阶段,承袭了这一难题。 02. 分类体系底层的交互闭环 想要厘清概念乱象,可以从一张早于所有相关技术的经典原理图入手。 数十年来,包括Sutton和Barto编写的经典教材在内的各类强化学习教科书,都在用这套图示描述智能体与环境的交互逻辑。该框架的标准名称为部分可观测马尔可夫决策过程,即POMDP,而“世界模型”最初的定义便诞生于这套理论体系。 智能体可以是人类、机器人或是软件系统,它会执行动作;动作改变环境状态。智能体无法直接观测完整环境状态,只能获取观测信息:射入视网膜的光子、传感器传回的读数、视频画面中的像素。新的观测结果指导智能体生成新动作,循环往复形成闭环。 “状态”一词需要拆解释义,它在不同学科中定义不同。此处并非化学领域固液气三态的概念,而是物理与机器人学定义的状态:对某一时刻客观环境的完整描述,囊括所有物体的位置、速度与各类属性。 环境状态是客观世界的底层全貌,理论上信息完整,但身处其中的智能体无法直接全盘获知。观测是智能体对客观世界的局部感知,动作则是智能体基于感知做出的反馈行为。 从智能体、动作、环境状态再到观测信息、最终回馈智能体的这套闭环,奠定了现代“世界模型”的技术定义。 事实上,“世界模型”这一说法本身历史更为悠久。它最早可以追溯到1943年肯尼斯·克雷克(Kenneth Craik)提出人脑依靠构建现实的“微型模型”完成逻辑思考。上世纪80年代末至90年代初,克雷克的理念被引入神经网络研究。 这套闭环同样能解释当下五花八门的世界模型:如今各类冠以世界模型的产品,本质都是这套闭环的不同实现方向,各自只输出闭环中的某一部分信息。 03. 世界模型的三大功能分类 第一类世界模型是渲染器。渲染器以像素画面的形式输出可供人类观看的观测信息,核心评判标准是视觉还原度。 能够依据文本提示生成电影级航拍画面的视频模型属于渲染器,Google的Genie 3、World Labs自研的RTFM这类根据用户输入实时生成画面的交互式系统同样归为此类。 这类模型并不具备对三维结构的显性认知,它只生成人类肉眼所见画面,而非客观真实结构。航拍镜头里的建筑从上空看毫无破绽,但如果驾车穿行城下,建筑结构就会出现崩坏。 第二类是仿真器。仿真器输出环境状态:在几何、物理、动力学层面贴合客观规律的环境表征,可供人类与计算机程序运算、交互。渲染器只需要满足视觉效果,仿真器则要恪守结构真实性:几何结构经得起校验、物理规则符合牛顿定律、物体动力学表现贴合现实规律。 仿真器同时服务两类使用者:建筑师、设计师、影视与游戏开发者等从业者需要远超视觉逼真度的精准环境;强化学习智能体、机器人控制器、自动驾驶等程序则将仿真环境当作规模化训练场地,用以测试现实中危险、成本高昂或是无法落地的场景。 第三类是规划器。规划器输出动作指令:依托观测信息与预设目标,给出智能体下一步的行动方案。从逻辑上看,它和渲染器互为逆过程。渲染器输入动作、输出观测画面;规划器输入观测信息、输出动作指令,补齐感知与动作的闭环链路。 视觉-语言-动作(VLA)模型、基于模型的控制系统,以及新近兴起的世界动作模型(World Action Models)都属于规划器方向,这类系统能够为非结构化环境中的机器人制定行动策略。 当下落地量产的绝大多数世界模型产品都可以归入这三类,在实际应用中这套划分方式具备实用价值,但三类模型底层并非割裂。 几何、物理、动力学这套描述客观世界运行逻辑的基础知识,是三者共用的底层原理。理论上,能够从任意视角渲染杯子的模型,也可以仿真杯子被推倒后的状态、规划机械手抓取杯子的动作。当下前沿研究正不断打破三类模型的边界。 World Labs世界模型三大功能模块拆解示意图(图源:World Labs) 04. 仿真为何是核心支柱 在三类模型中,仿真器受到的大众关注度最低,却具备最深远的产业价值,本文将就这种关注度与重要度失衡的现状展开论述。 渲染器是商业化落地最成熟的品类,多款文生图、文生视频产品正快速渗透消费级与企业级市场。谷歌的Nano Banana模型将高质量图像生成能力带给了数以亿计的潜在用户。无论是技术本身,还是相应的市场需求,都已经得到了充分验证。 但渲染器以视觉逼真度为优化目标,不追求物理精准性,这成为它的能力上限:生成画面观感出众,却无法被用于建筑设计、机器人训练等需要严谨物理逻辑的场景。 规划器发展前景最受期待,但技术尚处在起步阶段,和高速发展的机器人学习领域深度绑定。 近两年来,机器人相关演示视频效果亮眼,但客观来看,绝大多数演示都局限在条件严苛的实验室环境中,操作物品种类有限、任务流程简短,还无法满足真实落地所需的环境复杂度、场景多变性与长时间稳定运行要求。从实验室演示到能在厨房、仓库、手术室稳定作业的商用机器人,中间仍存在巨大技术鸿沟。 不过资本对规划赛道投入巨大,一批资金充裕的创业公司争相落地通用规划系统,头部基础设施厂商也选择在仿真技术栈之上搭建规划能力。能够自主规划的机器人才具备实用价值,全行业都在争先攻克这项技术。 仿真技术是衔接渲染与规划的桥梁。如果说语言是世界的抽象概括、像素是世界的视觉投影,那么几何、物理与动力学规律就是世界本身。仿真器立足客观规律搭建底层结构,渲染所需的外观画面、规划所需的动作结果,都能从这套结构中衍生而来。 掌握仿真能力的模型,既可以把对世界的理解转化为可供人类观看的像素画面,也能为实体智能体预判动作结果,而仅专攻渲染或规划其中一项的模型,则无法兼备上述两项能力。 仿真的商业化市场空间十分庞大,仅英伟达的Omniverse,其面向工厂、仓储、供应链、数字孪生的潜在市场规模就被公司预估超万亿美元。机器人训练、自动驾驶测试、建筑可视化、工程研发、药物研发等领域,全都离不开仿真技术。 AI领域诸多棘手的待解难题也集中在仿真赛道。标注了几何结构、材质属性、物理参数的三维数据集,体量远少于渲染模型训练所用的互联网视频素材。仿真与现实间的域差问题始终难以根除。 生成式仿真还新增一项隐患:AI生成的几何模型看似正常,实则可能存在面相交、尺寸失真问题,进而导致物理运算结果违背常理。能够同时实现刚体、柔体、流体、织物交互的大规模多物理场仿真,算力成本远高于单一物理场景仿真。 World Labs推出的Marble是我们布局仿真领域的首款产品。该产品接收文本、图片、视频、空间草图等多模态提示词,生成可交互探索的三维环境,同时输出用于视觉浏览的高斯泼溅数据、可供物理引擎运算的碰撞网格。 不过随着渲染、仿真、规划的边界不断消融,Marble只是全行业技术演进长周期的开端。 05. 边界消融的现状与未来发展方向 行业的技术变革还在持续推进,当下最关键的发展趋势是三类模型正在相互融合。业界逐渐达成共识:实现环境渲染、物理仿真、动作规划所依托的底层世界知识高度同源。 沿用前文杯子的例子:真正掌握杯子在桌面的几何形态、材质、受力规律的模型,既能从任意角度渲染杯子画面,也能仿真杯子被碰倒的全过程,还能规划机械手抓取动作。三类应用只是同一套底层世界认知的三种落地形式。 大一统世界模型架构图(图源:World Labs) 举个例子,多家机器人实验室近期已有越来越多研究证实:从理论层面,预训练视频渲染模型可作为环境与动作联合预测的底层基座,用单一模型预判环境变化与对应动作,打通渲染器和规划器的技术壁垒。 World Labs的Marble已实现单模型同时输出高斯泼溅画面与碰撞网格,打破渲染器和仿真器的界限。全品类产品都在从被动生成输出转向交互式系统:渲染器开始支持根据动作指令生成画面,仿真器产出的环境可调控、可修改,规划器也从被动应激式决策升级为自主推演式决策。 技术演进的终极形态是大一统世界基础模型:单一基座模型既能生成照片级渲染画面、输出符合物理规律的环境结构,又能生成动作序列,可根据下游需求灵活切换输出形式。 不过落地之路仍有重重挑战:各类模型数据储备不均衡,渲染模型坐拥海量互联网视频素材,仿真与规划模型却紧缺三维资源与机器人实操数据;优先优化视觉效果往往会损耗机器人、高精度仿真所需的物理精度。 在同一套模型架构中平衡各项需求,是当前世界模型领域最核心的攻关课题,这也是World Labs迭代升级Marble的核心目标。 但行业发展方向已然明晰。从上世纪80年代末延续至今的行业核心猜想,正驱动着新一代科研攻关:只要构建足够完备的世界模型,智能体就能够感知、搭建环境并在其中自主行动。 这份猜想的落地底气源自三大技术路线的融合趋势:原本各自独立研发、且均已催生千亿级产业的渲染、仿真、规划赛道,正逐步融为一体。 随着三者边界彻底消融,它们将重塑更深层的产业格局:机器智能与客观物理世界的交互关系,推动空间智能完成漫长的产业进化。 语言让机器拥有了描述世界的能力,而世界模型终将让机器真正理解、构想客观世界,并与之推演、交互。
奥尔特曼:OpenAI内部有人每月用掉约1000亿个词元
IT之家 6 月 4 日消息,在当地时间周二的一场面向企业客户的活动上,OpenAI 首席执行官山姆 · 奥尔特曼聊起了全公司词元(token)消耗量最多的用户。 奥尔特曼透露,六年半以前,OpenAI 内部头号词元消耗者每月要消耗十万个词元,在当时“几乎是全球词元消耗第一人”。 “时隔六年半的如今,这个消耗量差不多已经变成了全球人均使用水平,”奥尔特曼表示,“而眼下 OpenAI 内部的词元消耗冠军,每月要用掉约 1000 亿个词元。” 不过这还算不上全球最高消耗量。奥尔特曼称,公司发现有一位外部用户的词元开销还要更高,这件事让他私下觉得颇为难堪。 大手大脚耗用词元已然成了 OpenAI 的内部风气。据悉公司内部设有词元消耗排行榜,员工还时常在社交平台 X 上晒出自己的高额使用记录来炫耀;当然,OpenAI 本身就是词元售卖方,这也在客观上助长了这类消耗。 还有更多实例佐证员工的惊人消耗量:OpenClaw 的开发者彼得 · 施泰因贝格尔晒出的截图显示,有人 30 天内就消耗了 6030 亿个词元;《纽约时报》也曾报道,一名 OpenAI 员工单周就用掉 2100 亿个词元。 IT之家注意到,就在 OpenAI 放任内部海量消耗词元之际,其他企业却在严控开销。亚马逊关停了内部词元消耗榜单,Uber 首席运营官坦言相关开支性价比堪忧后,公司也出台了词元使用限额制度。 奥尔特曼表示,OpenAI 仍在迭代优化自研模型,同时探寻各类降本增效方案,力求“以更低成本创造更高价值”。 他还提到,AI 成本问题是突然浮出水面的。2026 年初,“没人在意开销问题,大家对当时的消耗额度完全满意”。但现如今,AI 使用成本已经成了亟待解决的重大难题。
倒卖Token,隐秘的中转站生意有多暴利
Tech星球(微信ID:tech618) 文 | 张宁洢 封面来源 | 豆包AI 大模型时代,Token成为了最重要的流通货币。参与者们用他写代码、做短剧、设计宣传海报......每一个步骤都要用到Token。 但Token的价格并不那么友好。一个AI SaaS创业者一个月就可能消耗价值上万元的Token,高昂的价格让普通创业者和中小开发者直呼:扛不住。 因此,Token中转站应运而生。Token中转站作为Al算力中间转接服务商,可以让用户以更低廉的价格,使用到GPT、Gemini、Claude 、Deepseek等国内外主流大模型。 5月1日,波场创始人孙宇晨推出AI中转站B.AI,号称“一个API Key = Claude + GPT + Gemini + 国产大模型全系列”的口号。他还公开表示,一天至少补贴10万元人民币、100亿Token。孙宇晨5月7日称,平台注册用户已突破170万。 一起加入的还有猎豹创始人傅盛。他创建的AI中转站Easyrouter,通过统一接口帮助用户便捷调用GPT、Claude、Gemini、DeepSeek等40余个主流大模型,并用折扣与积分补贴拉新。 名人入局似乎更证实了Token中转站的热度,然而,对于普通人来说,这真是“一夜暴富”的好机会吗,“做中转站月入百万”的神话是一条真实可复制的发财捷径吗? 在市场鱼龙混杂的情况下,这个答案似乎并不明朗。 Token中转站是门好生意吗? 对于AI行业的个人客户或中小企业客户来说,Token中转站的存在大幅降低了模型的使用成本。比如,订阅最便宜的GPT Plus也需要一个月140元左右,但他们中的很多人Token使用量非常小,通过中转站往往只需几块钱就能拿到一百万Token。 而且对于这些用户来说,使用国外大模型相对比较困难。一方面,许多人不懂汇率差价,不懂各国模型订阅价差和海外官方拿货规则,信息差大;另一方面,模型在不断发展更新,不同工作适配的最佳使用模型也不同,这就导致用户需要充值很多不同的模型,不仅麻烦,而且浪费。 中转站的出现,则完美解决了这些问题,用户只需要在一个地方充值即可使用多个模型,节省了大量的时间精力成本。 AI从业者小平教练告诉Tech星球,谷歌、OpenAI 等官方平台不会直接与个人小用户进行合作,而是批发给一级代理,即各地的授权服务商。这些一级代理拿到的是最新大模型的接口,加上一定利润后向下游提供。普通中转站或开发者会找这类一级代理接入,成本比官方零售低。 除了这样传统的中转站模式,市面上中转站的进货渠道可谓是五花八门。 很多大模型平台注册企业账号后可以获取官方赠送的免费额度,比如OpenAI 等平台对创业型公司有扶持,可以免费使用好几个月,一些人会批量注册账号,集中起来变成一个“号池”,用户在使用的时候,消耗的是号池里所有账号注册后可免费使用额度的总额。 部分大厂员工所在的公司本身就拿到了极便宜的 Token 价格,甚至无限量使用,他们就会私下搭建中转站,把自己的 API 私钥接进去,成本非常低,再发展代理对外售卖。 还有人会批量购买大模型平台的会员账号,每个账号分给20人使用,即可分摊成本赚取差价。不过,这些钻空子的渠道往往都面临着被官方封号的风险。 这些中转站可以发展自己的下游,将Token以低价分销给不同的下游,不同层级靠拿货价和售价之间的差额获利。也可以寻找代理负责推广,拿到一个便宜的 Token 接口,然后开多个API子接口给代理商,代理商充值后去销售Token,一般会分到其20%–40%的佣金。 做中转站并没有过高的技术壁垒,有现成开源框架可用,单人就能实现搭建落地,既不需要重资产投入,又有刚需强的精准客户群体,看起来是一门适合普通人做的好生意。 有人月入百万、有人一周闭站 但现阶段,并非普通人入局Token中转站的最佳时机。 小平教练告诉Tech星球,确实有一部分人通过这门生意赚到了不少钱,但这样的案例大部分发生在三个月前,那时这个赛道还没有现在这么拥挤,Token使用量也正处在暴增阶段。“身边有人曾经通过做Token中转站实现了月入百万,但他们的盈利方式有很多种,绝对不止靠赚Token差价,还有很大一部分来自于收学员和做陪跑服务。” 第一种,就是赚取Token差价,利润率能达到50%以上。比如,100个Claude Max账号,每个拆20人用,每人月付50美元。月入10万美元,净利润就能有56万人民币;如果是通过企业折扣低价购买,他们基本可以拿到七折的价格,再加价卖给散户,一天处理几亿Token,日利润可以达到数万。 第二种,则是资金沉淀,很多人为了便宜而在中转站充值,但实际上用不完。比如,订阅199元的套餐,90% 的用户是消耗不完相应Token量的,这部分资金就可以被沉淀下来。 第三种,是真正能迅速获取大量利润的方式,即收学员或者做AI陪跑服务。比如,在社交平台发帖说“做中转月入几千”,从而引流私域,先发放免费资料,再进阶到让学员发88元、199元等红包进行“一对一赋能”;而针对企业部署智能体、使用中转站的陪跑服务一单就能收几千甚至上万元。 小平教练告诉Tech星球,由于用户对于中转站稳定性的追求,有固定私域流量池的人更适合做,一位在推特上有粉丝基础的AI博主做中转站,发个帖子不到24小时,11个群(每群 200 人)共 2000–3000人直接满员,成交率极高。 而现在这个赛道竞争激烈,已经不太适合小玩家。由于技术壁垒较低、价格越来越卷,现阶段正规渠道进货的利润空间大约只能达到30%左右,差价生意越来越难做了。如果有技术、资源或内容能力基础,依然有一定的获利空间,但如果只是想做中间商赚差价,空间已经很窄,这个赛道已经变成大玩家或收徒玩家的天下。越来越多的普通玩家退出市场,甚至有人建站一星期,就因利润率低、缺乏稳定客户而闭站。 不过,市面上依然存在不少通过薅羊毛、掺水等方式赚取暴利的小商户。据Tech星球观测,一个向下游报价0.18 元兑换1刀的中转站,一亿Token能够卖到36元,而其对应层级的上游报价为10 元/一亿 Token,其利润率超70%,这样的中转站往往存在很多合规和质量问题,极易被封号。 2026年5月,一个名为“西瓜的皮”的Token中转站的站长被上海警方刑事拘留,37天后转为取保候审。这位站长,去外网批量注册或购买GPT、Claude等境外大模型的账号,攒在一起,通过海外服务器当跳板,把接口转卖给国内用户,让国内用户也可以使用海外AI。 这种行为无疑于帮助用户魔法上网,在法律上与私搭VPN高度相似,都属于违规打通跨境信道,触碰了法规红线,不少Token中转站都采用了这种方式,法律风险极高。 中转站鱼龙混杂:以次充好,数据泄露 由于进货渠道多样,为了赚取更多利润,不少个人中转站会采用掺水的方式欺骗用户,甚至有人倒卖用户信息或直接卷钱跑路。 hvoy.ai 合伙人Stars 404告诉Tech星球,现在寻找一个靠谱的中转站并不容易。 许多中转站的Token是“掺水”的。所谓“掺水”,就是在后台偷偷用便宜模型或者是限制了规格,比如用较便宜的国内模型去替代国外模型,最典型的就是用Deepseek去代替国外模型的。 一位用户在社交媒体上分享,他通过中转站使用Gemini 3.1Pro的时候,思考链都没有了,但同时段使用Gemini 其他模型并未出现这种情况,用Claude 4.6 opus好几次思考链都是中文的,但他从未设置过中文思考链,大概率是直接用廉价国模掺水了。 所以除了模型名,还应该检测中转站提供模型的回答风格、上下文长度、报错信息、扣费明细等,与原模型做对比,才能辨别出纯度,Stars 404根据这些指标制作了网站hvoy.ai方便测试Token的纯度,网站后台数据显示,检测过的中转站里,Claude掺水概率最大,为60%左右,价格越便宜,质量就越无法保证,往往纯度较低。 更严重的一个问题则是信息泄露。一位用户在使用中转站提供的账号时,发现该模型可以根据用户问题提供用户曾经上传过的所有相关文件,但这些文件并不是他自己的,而是同账号其他用户上传过的,而且由于AI可能出现幻觉,甚至可能直接在新对话里把别人的文件链接给用户。 Stars 404告诉Tech星球,很多中转站都会被问过,要不要出售用户数据,这些希望购买数据的人主要是有模型蒸馏需求的第三方。但在他与中转站的交流之中发现,大部分中转站由于知道这类售卖行为违法,都不会保存,但信息泄露风险依旧是个大问题。 此外,还要注意的是,跑路的中转站不在少数。一位AI行业从业者告诉Tech星球,有些小中转站可能只提供GPT的接入,如果一段时间内,GPT封号封的比较多,就会有一批站子跑路;还有些中转站在达到收入高峰时卷钱跑路,消费者也无法追回钱款。 除了这些,使用Token中转站还存在着很多风险,比如计数虚高,变相多扣费,阉割上下文长度,缩短官方记忆窗口,联网搜索高峰期自动降配,高峰流量时切换低配模型等等,不良商家用这些方式赚取暴利,普通用户很难辨别。 目前,Token中转站市场依旧鱼龙混杂,难以保证产品质量和用户信息安全,未来还需要长期的规范化管理和市场监管。
把半个Vision Pro塞进眼镜,Google这次真成了?
分析师郭明錤最新爆料,苹果对其头戴设备线路图进行了大调整,只保留两款智能眼镜的开发工作,而 Vision Pro 后续产品全部推迟或彻底终止。 而这两款眼镜中,无显示屏幕的 AI 眼镜将在明年出货,带光波导显示的版本推迟到了 2029 年。 形成鲜明对比的是,隔壁家 Google 不仅将在今年推出 AI 音频眼镜,带小型镜片的显示眼镜也准备扩大测试规模,与此同时还在测试一款双目显示的「XR 眼镜」,将半个 Vision Pro 塞进了眼镜之中。 I/O 大会之后,不少媒体受邀亲自体验了这些智能眼镜,根据他们的反馈,Google 蛰伏 10 年重新推出的智能眼镜,确实有点意思。 图源:CNET 眼镜形态的 XR 头显 带有显示屏、搭载「Android XR」的眼镜,代号为「Project Aura」,由 Google 和 XREAL 联合打造,也是在去年 I/O 就已经率先亮相的产品。 爱范儿在 AWE 上体验过这款原型机,即使还算是比较早期的开发版本,给人的感觉已经很成熟,体验很接近 Meta Quest 头显。 这款产品由两个部分组成:眼镜本身,以及有线连接的计算终端,大小类似一台手机。 图源:CNET 硬件层面,Project Aura 支持 70 度大视场角,虽然不比 Apple Vision Pro,但视觉效果已经足够开阔,属于 AR 眼镜之中的绝对领先水平。 Tom’s Guide 也点赞了 Project Aura 眼镜的视场角,认为属于 XR 眼镜「沉浸感的代际飞跃」,边缘模糊也只存在于余光的位置。 自适应透明度是一个非常实用的功能:看屏幕内容,眼镜会自动调暗,让你能聚焦屏幕内容,而如果看向旁人,镜片就会变得相对透明,让用户能清楚看到周围环境。 图源:CNET 除了可以通过镜腿交互,Project Aura 还支持十指手势输入,体验比较自然,可以直接伸手点击按钮、抓取一些画面元素、放大缩小,不过稍微有点延迟。 Android XR 的体验本身也已经比较成熟,可以在面前打开多个窗口,像是 Google 的第一方应用,像是 Google 地图、YouTube 已经做了 XR 的适配,YouTube 上还有大量的全景视频内容,能充分发挥眼镜的优势。 The Verge 体验了 Project Aura 的一些 AR 应用,例如一个应用,可以伸手「捏」住现实世界的物体,眼镜会展示它的分子结构。 Engadget 称赞了 Google Map 在 Android AR 眼镜上的表现,可以在屏幕上实时看到步行路线,低头还能看到一个完整的小地图。 比起 Meta Ray-Ban Display 贫瘠的应用生态,Project Aura 不仅深度集成了 Google 生态,也能兼容更丰富的 Android APK 应用。 Google 眼镜的另一大优势,就是顶尖级别的 Gemini AI 智能体和多模态能力。在爱范儿的有限体验中,Gemini 可以在接到指令后,在 YouTube 找到具体的视频。 The Verge 发现 Gemini 的能力比之前更强,例如下令拍摄照片之后,能马上让它帮忙去除照片中的绿植;拍了菜谱的照片,可以将食材清单添加到 Google Keep 清单;能够马上将看到的演唱会日程加入 Google 日历;这些操作会立马同步所有登录 Google 账户的设备。 比较有趣的场景,是将眼镜连接到其他设备,比如 Steam Deck、iPhone 或者 MacBook,同时还能打开眼镜自己的应用,以及使用 Gemini Live 对外接设备的画面进行分析。 当然,AI 的能力也不是完全可靠,在户外人生嘈杂的场景可能会被干扰,也会出现明明在美国却记录伦敦地点的情况。 毫不夸张地说,Project Aura 已经实现了头显级别的显示和交互能力,相比起只能在家里用的头显,100 克不到的重量,相对简洁的外观设计,眼镜的门槛会更低,也更能适应更多场景。 包括爱范儿在内,大部分媒体都认为 Project Aura 的完成度已经很高,「XR 眼镜」离我们的距离,真的已经不再遥远了。 Gemini 的新入口 在 Google 的智能眼镜规划之中,还包括了单目显示智能眼镜和完全无显示的智能眼镜,目前 Google 将其称为「Intelligent Eyewear」(智慧眼镜)。 这两款产品的用途和定位都相对类似,主要对标 Ray-Ban Meta 眼镜,主打拍照、音频和 AI 助手,单目显示屏幕版本可以显示简单的反馈。 图源:The Verge Google 在活动现场展示了一款单目智能眼镜的「原型机」,严格意义上说它不是任何一款产品,更多是展示 Google 智能眼镜理念的一个「样品」。 多数媒体都提到,这款原型机产品相当「自然」,与传统眼镜的佩戴体验类似,并且重量也明显比同样单目显示的 Meta Ray-Ban Display 更轻。 不过,PC World 提到,在嘈杂的演示环境之中,眼镜的扬声器音量相对偏小,这也是目前智能眼镜普遍的短板。 和能够独立运行的 Project Aura 不同,Intelligent Eyewear 更接近手机的配件,有点像是为手机中的 Gemini 智能体,提供了一个更接近用户的入口。 因此,用户平时怎么在手机上用 Gemini,现在可以直接利用语音指令来和眼镜交互,省去掏出手机、解锁、打开 Gemini、输入的这些步骤。 用户可以直接让 Gemini 搜索什么东西,或者播放一首歌、设置提醒事项,以及利用 Gemini Live 的多模态能力,智能识别看到的东西。还有更复杂的场景,例如看着晚餐让 AI 推荐红酒,答案会通过扬声器传入用户耳中。 有些功能相对来说比较「为 AI 而 AI」,例如拍一张照片,告诉眼镜把它转变成卡通风格,虽然眼镜和 Gemini 可以做到,但意义不大。 如果你是一个使用 Android 手机、佩戴 Android Wear 手表的重度 Android 生态用户,这款眼镜带来的体验会更舒适:Pixel Watch 可以充当眼镜的取景器,拍下的照片能快速上传 Google 云端。 图源:CNET 在苹果还没入局的情况下,Google 智能眼镜,就是当下为数不多能真正和手机现有应用生态进行联动的产品。 单目显示屏在显示效果上自然不如 Project Aura 那么丰富,它更像是一个智能手表,只能显示一些简单的组件,比如导航时的方向,以及天气、翻译的回答。 关于 Intelligent Eyewear 和 Gemini 的隐私争议,不管是 Google 还是媒体,都有各自的忧虑和看法: Google 强调,对这类 AI 眼镜产品的隐私进行了大量思考,将配备旁观者 LED 指示灯、人工智能欺诈检测和其他功能。 更重要的是数据隐私问题,预计 Gemini 的隐私规则将与 Gemini 在手机上的运作方式类似,但眼镜会有更多「常时在线」的场景,Google 认为这需要长期的用户教育,以及不同的标准,今年秋季会公布更多细节。 不少媒体反而觉得,即使有隐私风险,让 Gemini 能一直在线,分析用户的所见所闻进行实时分析,然后主动提供帮助和回应,才是智能眼镜形态最有优势的使用方式。 今年秋季,Google 联手 Warby Parker、Gentle Monster 以及三星合作打造的 Intelligent Eyewear 眼镜将正式发布,第一波新品将不带有显示屏幕。 这两个品牌的眼镜新品设计也已经提前曝光,其中 Gentle Monster 延续了品牌的椭圆形镜框的风格,看起来要比同类产品时尚不少;而 Warby Parker 采用了更低调的方框造型。 Google 做眼镜,为什么值得期待? 在最近的 Meta 2026 股东大会上,CEO 马克 · 扎克伯格重点提到了 AI 眼镜,他将其称为「有史以来增长最快的消费电子产品类别之一」,并预计最终全球 15-20 亿戴眼镜人口,最终都会换成 AI 眼镜。 现阶段,大多数 AI 眼镜其实还停留在「AI 拍摄眼镜」阶段:拍照、录像、实时翻译、语音问答,再加一个 AI 助手,几乎已经成了行业标准答案,本质上仍是在复刻 Meta 已经验证过的路线。 再往下一步怎么走,或许还得看 Google 和苹果这些掌握「上一代终端」生态的公司。 如果说其他智能眼镜,只是将一个 App 戴到了头上,那么 Google 的眼镜,真正和一个大家已经习惯的生态连接在了一起。 这种感觉,其实很像智能手表,大部分人最终都会倾向购买和自己手机同品牌、同系统的产品,通知同步、数据互通、跨设备协作。 可以预见,在很长的一段时间里,手机还会是我们的智能计算终端,眼镜会充当手机「副手」的地位。 Google 这几年在 AI 智能体上的投入打开了另一扇窗:Gemini 开始可以操作手机,接收用户指令后,可以帮忙叫外卖、打车——这个交互就相当适配眼镜,不用掏出手机,直接对着眼镜说需求,事情在后台自动化完成了。 Project Aura 则是智能眼镜的更下一步进化方向,一个相对独立的生产力或者内容平台——或许短时内,它很难离开一个外挂的计算终端,但这个终端,最终可能直接由手机兼任。 在不远将来,手机内部会集成 XR 操作系统,眼镜通过有线或者无线的形式连接手机,然后在 Android 或者 iOS 的基础上呈现一个 XR 版本的界面,运行 XR 应用。 这并非空穴来风。彭博社报道,苹果正在开发的 XR 眼镜,就很可能是这样的形态,需要和 Mac 或者 iPhone 配合使用,兼顾简洁性和高性能。 智能眼镜会成为下一个 iPhone 吗? 我们还不能断定,但Google 这批原型产品所释放的可能性,确实在预示一个不错的未来。
华为多名AI人才离职创业!90后 "盘古少帅" 新公司估值达1亿美元
快科技6月4日消息,今年3月28日,王云鹤在朋友圈官宣辞职,告别华为。离职仅两个月,原华为诺亚方舟实验室主任、90后"盘古少帅"王云鹤的创业项目便收获资本青睐。 6月2日相关消息传出,其创办的AI企业基元律动顺利落地天使轮融资,投后估值已经达到1亿美元,投资方囊括国内一线风投机构与多家头部互联网企业。 工商资料显示,上海基元律动科技有限公司2026年4月8日完成注册,王云鹤担任法人代表与CEO。时隔9天,北京基元律动科技有限公司也完成工商注册。 团队方面,长期和王云鹤搭档研发,出身北大硕士、中科院博士的前华为诺亚方舟实验室首席研究员韩凯出任CTO。 企业锚定产业落地类AI Agent赛道,依托主创团队在华为打磨的轻量化大模型、低算力算法,面向工厂、金融、车企定制专属智能体,避开同质化严重的通用大模型赛道。 目前企业在产品正式上线前,已经斩获多家国资大厂合作订单,同时开出60万至100万年薪大范围招聘算法、Agent研发人员,首款商用产品计划在近几个月对外发布。 回望职业生涯,1991年出生的王云鹤2017年在读博士阶段便成为诺亚方舟实验室北京首位实习生,2018年北大博士毕业后正式入职华为。在近九年任职周期里,他从基层工程师起步,2021年末升任算法应用部部长,其主导研发的GhostNet入选华为年度十大发明。 2025年3月,王云鹤接任诺亚方舟实验室主任,全权掌管盘古大模型研发,同年6月牵头发布盘古5.5版本。2026年3月20日,他作为核心负责人出席盘古大模型开源发布会。 在他离职前,盘古大模型曾陷入原创性争议。2025年7月,有开发者指出,华为开源的盘古Pro MoE模型与阿里通义千问部分模型参数特征相似度较高,引发热议。 随后,华为诺亚方舟实验室官方否认抄袭,称部分底层组件参考开源项目,且全程遵守开源协议。王云鹤彼时内网回应,承认盘古模型并非完全从零开发,但所用开源组件均合规取自公开社区,不存在侵权行为。 王云鹤的出走,只是近年华为技术人才创业浪潮的一个缩影。近两到三年,至少十名华为 AI、自动驾驶、芯片领域的核心技术人员陆续离职创业,项目高度集中在具身智能、AI 芯片、AI Agent 三大黄金赛道。 其中具身智能赛道最为扎堆,前华为副总裁邓泰华与前华为天才少年彭志辉早在2023年就联合创立智元机器人,成为国内最早入局的头部玩家之一。原华为车 BU 自动驾驶CTO陈亦伦2025年联合创办它石智航,聚焦车载与具身智能技术,今年4月完成4.55亿美元Pre-A轮融资,一举刷新国内具身智能赛道单轮融资纪录。 在此之前,前华为云具身智能业务负责人朱森华创立具脑磐石,专注类人机器人核心技术研发。而前华为天才少年周顺波创办的欧拉万象,更是在成立当月就获得高瓴创投、五源资本数千万元种子轮融资。 AI芯片领域同样吸引了华为系技术骨干入局。前华为昇腾编译器专家季宇创办的行云集成电路,专注通用GPU研发,今年4月连续完成Pre-A、Pre-A +两轮融资,总额超4亿元,由五源资本、春华资本、赛富投资联合领投。
收费才是DeepSeek的“成人礼”
DeepSeek首次融资的“金主”名单,逐渐浮出水面。 6月3日,媒体报道称,DeepSeek计划募集约500亿元人民币,投后估值达3500亿至4000亿元。相比上月底传闻的700亿元,最新传出的融资规模略有收缩。 除了DeepSeek创始人梁文锋承诺投入200亿元外,腾讯考虑投资100亿元,宁德时代也可能投资50亿元。综合多方消息,其他潜在投资方包括国家集成电路产业投资基金、网易、京东、砺思资本、IDG资本、基石资本等。 DeepSeek是国内唯一尚未融资的主要AI公司。等到这笔资金到位后,它的财务压力将减轻不少。不过,和梁文锋的理想和大众对于 DeepSeek的期待相比,这笔钱显然远远不够。 再大的公司,搞 AI 都缺钱。豆包已经确定要收费,DeepSeek或许可以学习一下。 豆包5月初更新了App Store应用商店页面,公布了即将收费的消息,设置三档订阅价格,最低68元/月。 6月3日晚间,豆包发布消息称,计划推出专业版,将包含软件开发等多项专业服务。用户日常使用的功能,包含搜索问答、写作生图,以及语音和视频对话等,将保持目前的免费服务。专业版的服务也将在一定额度内免费。 豆包App启动收费,并不令人意外。 AI App烧钱严重、收入却非常少,现金流转正遥遥无期,是所有AI公司都面临的难题。坐拥3.45亿MAU、1.45亿DAU的豆包,同样逃不开这一行业现实。 更深层的难题是,互联网产品的边际效应不适用于AI产品。他们并不能像互联网产品那样,熬到用户量跨过某个节点后,立刻绝地逢生、扭亏为盈。恰恰相反,AI App的用户量越大,token使用量越高,亏损就越严重。 赚钱,已经成为AI App的头等大事。直接收取会员费,则是最简单直接、立竿见影的手段之一。 在国外,ChatGPT、Gemini、Claude、Grok等AI App早已搭建了一整套付费会员体系,同时对“白嫖”用户施加越来越多限制,形同“逼氪”。在国内,各大AI App吃相好看一些,但底层玩法并无二致。 如今,国内活得最好的豆包,也把收会员费提上日程。 但与同行相比,豆包背靠抖音这头现金牛,能够获得集团的资金支持。同时,字节多次上调火山引擎MaaS业务的全年营收目标,今年4月已达150亿元,相比去年底调高50亿元,侧面反映出字节AI的整体赚钱能力相当强劲。 真正该快马加鞭、向C端用户收费的,或许是一直对商业化不太着急的DeepSeek。 表面上看,DeepSeek在幻方量化的羽翼之下并不缺钱,数百亿元巨额融资也在路上。但豆包尚且需要靠卖会员“补贴家用”,DeepSeek资金实力更弱,也有必要广开财源。 收费的另一重好处是,一直顺风顺水的DeepSeek,能够借机逼自己一把,在研发新模型之余,深入AI编程为核心的生产力场景,真正具备“干活”能力。相比技术、工程方面的创新突破,补齐这一短板的战略价值并不逊色。 此前,DeepSeek违背“祖训”、引入外部股东,实现第一次自我突破。如今,一个敢于向C端收费的DeepSeek,将有机会再次完成“成人礼”。 A DeepSeek的可用资金并不宽裕,表现之一是算力资源明显不足。 主要AI App中,DeepSeek几乎是宕机次数最多的。特别是今年5月V4系列模型上线后,DeepSeek多次服务中断,相比前几个月更加频繁。 宕机的部分原因是token消耗量飙升。根据AI模型聚合平台OpenRouter的数据,5月最后一周,DeepSeek V4 Flash的token消耗量高达3.65万亿,环比增长32%,高居行业第一。 解决算力瓶颈并不困难:增加服务器、购买更多云端算力即可。不过,这也意味着更高的日常运营费用。DeepSeek若要不再频频宕机,就得多赚钱。 在B端,DeepSeek已经具备加大收费力度的条件。 最新发布的V4系列大模型虽然不算全方位SOTA,但性价比极为出色,吸引了大量专业用户和企业使用。再加上此前沉淀的口碑,DeepSeek完全有资格通过涨价赚得盆满钵丰。 但DeepSeek显然还不想马上“收割”。 在竞争对手纷纷涨价的情况下,DeepSeek一个月里四次调低V4模型的价格,5月底更是永久降价75%,每百万token输入(缓存命中)0.025元,输入(缓存未命中)3元,输出6元,堪称今年AI圈的“价格屠夫”。 DeepSeek释放的信号是:它希望聚拢尽可能多的B端用户,哪怕暂时赚不到钱,也要全力扩大用户规模。 这与DeepSeek下一步计划——在生产力场景落地相契合。 此前有报道称,DeepSeek组建了一个Agent Harness团队,方向是编程智能体,对标Anthropic旗下的Claude Code。与此同时,DeepSeek启动了相关职位的招聘。 不难看出,DeepSeek对于B端市场期待很高,希望通过超低价跑马圈地,并不急于盈利。这也意味着,现阶段,C端收入需要扛起DeepSeek的商业化大旗。 C端用户每天消耗token,却很少贡献收入,长期是AI App的亏损黑洞。 以豆包为例,其日均token消耗量从2024年5月的1200亿,飙升至今年3月的120万亿,增长约1000倍,其中很大一部分源自C端用户。但由于AI App的chatbot功能均为免费、不限量,巨量的token消耗并不能直接转化为收入,只会带来亏损。 在高峰期,这一矛盾更加突出。DeepSeek此前就有点儿“绷不住了”。5月29日下午,不少网友发现,DeepSeek重新生成、修改有次数限制了。有消息称,DeepSeek算力压力太大,采取了临时限制措施。 但只靠临时限流,无法真正解决问题。更何况,DeepSeek正在添加多模态能力,图片、视频、音频的token消耗量百倍、千倍于文字,算力需求更大,带来的亏损也更严重。 DeepSeek已经在找钱。但500亿的融资规模,比不上在港股市场狂飙的智谱、MiniMax,更比不上动辄融资千亿美元的OpenAI、Anthropic等巨鳄。只靠外部输血,DeepSeek迟早供不上仍在快速上升的C端用量。 破局之道,恐怕只有直接向用户收钱,为高消耗的高阶功能设置付费墙。 这其实是把B端的API商业模式移植到了C端。唯有如此,DeepSeek才能让token用量与收入规模真正挂钩,算力瓶颈才有机会被真正化解。 B 向C端用户收费,除了能够立竿见影地获得收入,还能以商业化倒逼产品落地,帮助DeepSeek补齐生产力场景的短板。 与国内AI公司相比,DeepSeek的长板是技术理念、模型能力、工程实现和性价比。每次发布新模型,它总是能够在这些维度上刷新行业认知,建立新的标杆。 坐拥高性能、高性价比模型,DeepSeek对于AI生产力的挖掘却并不充分。在产品落地上,DeepSeek尚有不少短板。 以AI编程为例,DeepSeek最新模型居于行业前列。按照DeepSeek的说法,V4的Agentic编程能力是开源模型里最强的,还针对Claude Code等进行了专项优化。V4发布后调用量迅速跃居行业前列,也从侧面印证了码农对于这一新模型的喜爱。 问题是,DeepSeek缺少Codex、Claude Code这样的独立AI编程产品,开发者大都通过第三方工具调用DeepSeek V4等模型。这一定程度上限制了DeepSeek的商业前景,也让DeepSeek App的功能矩阵止步不前。 当豆包、千问等想尽办法在App内塞入各种办公功能,并与电商、本地生活、学习教育等模块打通时,DeepSeek依然停留在chatbot的朴素形态,就连多模态都不支持。 面向生产力场景,DeepSee手握好牌,却慢了好几步。而这种慢,又导致了App的商业化进展有限。两者互相拖累,形成恶性循环。 如今,AI App纷纷开始收会员费,为DeepSeek提供了一个契机:以C端收费为切入点,让商业化先行一步,把产品侧的速度带起来。 AI App卖会员,基础功能chatbot肯定还是免费,卖点只能是高阶功能。这类功能是否好用、够用,很大程度上决定了用户是否愿意花钱。 以豆包为例,专业版将包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。 会员体系更成熟的AI App,则往往以AI编程为主打项。 比如Kimi划分四档付费套餐,入门版本为连续包月每月49元,最高版本则为699元。不同档位的差距主要是Agent额度、是否支持Agent多任务并行、能否调用AI编程、是否支持专业数据库、能否“养虾”等。 DeepSeek要想卖会员,就得效仿其他AI App,主动补齐生产力相关的能力矩阵。如今几乎白板一块的DeepSeek App,势必要经历一番大改造,才能端到用户面前。 这一改造的技术难度不大,却高度契合高价值用户的需求,并与Agent时代注重工作能力的潮流相吻合。DeepSeek很早就应该做了,却在种种原因下,始终没有迈出第一步。 后果已经显现:DeepSeek去年初击败一众玩家,登顶国内AI App榜首;如今却又被豆包反超,甚至落在了千问身后。这固然有其他App大举砸钱推广的因素,但DeepSeek功能单一,外加时常宕机,也是其热度下滑的重要原因。 所幸,DeepSeek仍然拥有大量忠实拥趸。 今年5月初,一个叫 DeepSeek-TUI的开源项目在GitHub引发关注,一天时间就收获1.6万颗星。它是一款基于DeepSeek V4的终端原生编程智能体,不少开发者称其“DeepSeek版Claude Code”。 官方无法提供的生产力,粉丝就自己造。热情的粉丝,不仅为DeepSeek缓解了生产力的短板,也让它在开收会员费时有了更好的基础。 C DeepSeek向用户收费,将是梁文锋的又一场“成人礼”。 上一场“成人礼”,是它不再对外部资本说“不”。 在风险投资驱动的AI行业,DeepSeek是一家颇为特立独行的公司:不接受外部融资、不稀释股权、不被任何人的商业化时间表绑架。“三不”原则造就了DeepSeek的独特气质和过往成功。 但进入2026年,DeepSeek出人意料地抛弃了这些原则,转而与众多巨头和风投基金接洽。 摆在梁文锋和DeepSeek面前的,是一个越来越清晰的事实:仅靠幻方量化每年7亿美元的收入,DeepSeek很难继续领跑,甚至会沦为二线选手。 资金薄弱的影响正在显现。App用户量被反超;万众期待的DeepSeek V4,虽然依然是开源模型的SOTA,但与一众闭源旗舰模型相比并无优势;罗福莉、郭达雅等核心人员投奔巨头,更是DeepSeek难以弥补的损失。 在资本市场上,DeepSeek最高4000亿元的投后估值,相当于两个MiniMax,却比智谱低了2500亿;相比万亿美元的OpenAI、Anthropic等,更是有两个数量级的差距。 于是,DeepSeek改弦更张,腾讯、宁德时代等即将成为新的股东。外部投资者除了带来丰裕的资金,也可以给DeepSeek创造更宽阔的用户入口和落地场景,并将自家的生产力工具矩阵“嫁接”到DeepSeek上。 但除了改变对于资本的看法,DeepSeek还需要商业化层面的“成人礼”——从“不赔不赚”,到“努力搞钱”。 过去,梁文锋和DeepSeek对于盈利的态度非常谨慎。在他的构想中,DeepSeek将继续推进开源AI模型,并以实现通用人工智能(AGI)为目标。利润并非公司的首要目标。 早在 2024年宣布DeepSeek V2降价时,梁文锋就表示,DeepSeek 只是按照自己的节奏做事,核算成本后定价,原则是不贴钱,也不赚取暴利,希望在成本之上稍微有点利润。 这套带有理想主义气息的逻辑,与OpenAI早年间的理念颇为相似。只不过,OpenAI几年前就抛弃了这一路线,转而朝着一家“正常”的公司转型,在赚钱的道路上狂奔;DeepSeek则尚未完成这一转变。 另一方面,追求“不赔不赚”意味着,DeepSeek需要更加依靠技术、工程等方面的突破来保持领先,去年的R1、今年的V4系列模型就是这样。但在激烈竞争中,这并非最快的发展路径,也并不会总是能够成功。 抱着旧思维的DeepSeek,面临新的竞争环境:AI已经从SOTA模型的对决,变成了既看产品和技术,更要赚钱逻辑的自洽、商业闭环的成立。 国内外AI公司已经充分意识到这一点。他们在集体迈向资本市场时,都把商业化能力摆在重中之重,客户比用户更重要,而ARR(年度经常性收入)是关键指标。 同时,资本市场正在奖励那些赚到钱的AI公司。Anthropic不仅收入规模超越OpenAI,还有望在今年第二季度首次扭亏为盈。在华尔街力挺下,Anthropic的估值已经反超OpenAI。 DeepSeek无法改变这一趋势,只能改变自己、迅速适应。和其他AI公司一样,DeepSeek到了“努力搞钱”的时刻了。 DeepSeek以往沿着梁文锋的想法前行,商业化怎么走、赚不赚钱,在于一念之间。但随着DeepSeek引入外部股东,这家公司的理想主义色彩注定消散,商业化进程势必加速。 今年以来,DeepSeek已经在加大AI编程方面的努力。在这一大动作产生效益之前,效仿豆包及其他对手,向C端用户收费,将是一举多得的举措,也可以推动DeepSeek再一次完成战略思维的跃迁。
投资人疯抢!千寻智能3个月狂揽近50亿:马云、雷军现身其中
快科技6月4日消息,继宇树科技之后,杭州又跑出来一家机器人独角兽公司。 昨日,国内具身智能初创企业千寻智能宣布完成15亿元A+轮融资。 至此,该公司3个月内已完成四轮融资,狂揽近50亿元,刷新具身智能行业融资速度纪录。 据悉,千寻智能成立于2024年1月,是一家专注于构建机器人“通用大脑”的具身智能公司。 与以往不同的是,千寻智能并未披露参与此轮融资的具体信息,只表示“包含一线美元基金、大型产业投资方以及国资基金,老股东持续加码”。 值得注意的是,千寻智能狂揽多轮融资的背后,出现了马云旗下云锋基金、雷军旗下顺为资本等具备产业生态资源的战略投资人身影。 今年2月,公司连续完成两轮合计近20亿元融资,估值突破百亿元,融资阵容堪称全明星:红杉中国、云锋基金、混沌投资(葛卫东)等知名机构都在其中。 3月,千寻再获10亿元融资,估值跃升至200亿元。该轮由顺为资本与云锋基金联合领投,这也是雷军与马云首度共同重仓一家具身智能企业,达晨财智等机构跟投。 而就在宣布新一轮融资的同时,公司还宣布自研具身基座模型Spirit v1.6,在被称为北美具身智能“奥林匹克”的RoboArena具身智能基准测试中综合得分位列全球第一。 该模型打破硅谷“霸榜魔咒”,力压英伟达Cosmos3与Physical Intelligence Pi0.5,成为首个登顶的中国具身模型。 而这也不是千寻智能第一次超越美国的具身智能模型。 今年1月,Spirit v1.5在RoboChallenge Table30真机评测中,正式超越长期霸榜的美国标杆模型Pi0.5,登顶全球第一。 目前,千寻已组建国内最大规模的真实数采网络,近千台设备在百余个城市并发运转,彻底打通了从低门槛采集到自动化清洗、标注、质检的数据全闭环链路。
启境GT7开启预售:搭载华为乾崑赤兔平台,21.99万元起
凤凰网科技讯 6月4日,由华为乾崑与广汽集团联合打造的智能汽车品牌“启境汽车”旗下首款车型——启境GT7,在东莞松山湖正式开启预订。新车共推出标准版、Ultra、Ultra超长续航及Ultra三电机四驱四款配置,预售价区间为21.99万元至30.99万元。 作为一款智能猎装车型,启境GT7全系标配闭式双腔空气悬架、连续阻尼可调减震器及高性能四活塞固定卡钳,并搭载华为乾崑赤兔平台与超级三电机系统,零百加速达到2.98秒,百公里制动距离在33米以内。 智能驾驶方面,新车配备全球最高规格的双光路图像级激光雷达,原生融合新一代华为乾崑智驾ADS 5;座舱首发全新一代鸿蒙座舱智能助理及HUAWEI SOUND AI交互式星环散射体。安全层面搭载CAS 5.0六维防护系统。 车辆采用“优雅张力美学”设计,获得意大利A' Design Award铂金奖。前备箱容积215升,后备箱常规647升、放倒后可扩展至1606升,并支持后排一键放倒形成1.9米休憩空间。 渠道方面,启境GT7将进入“华为乾崑智驾授权体验中心”及“启境用户中心”双渠道,覆盖全国70个城市共300家门店,预计6月底全部启用。此外,发布会上启境汽车还公布了首款大五座SUV命名——启境GX7,未来将形成双车产品矩阵。
外媒上手微软Surface Laptop Ultra:可能是有史以来最好笔记本
6 月 3 日消息,科技媒体 Windows Central 昨日(6 月 2 日)发布博文,在 2026 台北国际电脑展期间,上手体验了微软 Surface Laptop Ultra 样机,并评价称:“这可能是迄今为止最好的笔记本电脑”。 设计方面,Surface Laptop Ultra 左侧有 1 个全尺寸 HDMI 和 2 个 USB-C,右侧有 1 个 USB-C、1 个 USB-A 和 1 个全尺寸 SD 读卡器。 不过,右侧 USB-C 尺寸更大,微软未说明原因,该媒体推测它可能带有类似 Surface Connect 的磁吸或断开式设计。 交互方面,Surface Laptop Ultra 配备 Surface 史上最大触控板,支持 Windows 11 新的触觉信号反馈。 键盘延续 Surface Laptop 8 手感,作者认为它可能追平甚至超过 MacBook Pro。15 英寸 Mini LED 屏幕支持 120Hz,观感锐利,色彩对比也较好。 性能方面,Surface Laptop Ultra 搭载英伟达 RTX Spark 处理器,这是一颗 Arm 架构芯片,需要依赖 Prism 运行尚未适配 Windows on Arm 的 x86 应用。 现场展示中,多款游戏和应用处于模拟环境下运行,该媒体没有察觉到明显差异,但微软和英伟达未展示 FPS 数据。 噪音方面,微软为 Surface Laptop Ultra 加入 Surface PC 史上最大风扇。该媒体反馈称普通使用状态下,机器基本安静,不过在高负载演示,可以在几英尺外能听到风扇声。IT之家附上相关截图如下:
特斯拉被曝修改FSD购买协议
电车界6月4日消息 据 Electrek 报道,特斯拉修改了 FSD 购买协议,在协议中新增了车主当初购买产品时原本不存在的“监督驾驶”相关条款。 此外,部分车主的原始协议文档已彻底无法查看。 Electrek报道称已向多位车主证实了这一问题。相关合同签署于 2016 年至 2024 年初之间,当时特斯拉将该套件宣传为“完全自动驾驶能力”,协议中没有任何“监督驾驶”的表述,暗含车辆可实现无监督自动驾驶的承诺。 原始合同已被更改或无法查阅 其中一位车主 Oliver Abcarius 向 Electrek 反映了这个问题。Abcarius 于 2019 年 8 月 12 日为其 2018 款 Model 3 购买了 FSD 功能。 最近,当他试图通过特斯拉账户查看 FSD 购买协议以申请退款时,却发现特斯拉已对该文件进行了追溯性更新。原先的合同(其中并未包含“监督式”条款)现在链接到了一个无效页面。 “特斯拉追溯性地更新了我2019年购买FSD服务时签署的文件。2019年,特斯拉的购车协议中并没有‘监督驾驶’的字样。现在我根本打不开这份文件,因为它链接到了一个无效页面,”Abcarius告诉Electrek。 这种现象也发生在他家里。他妻子的2020款Model Y,于2020年5月29日购买,当时预装了FSD(全自动驾驶功能),也存在同样的问题——“机动车购买协议”无法访问。 关键细节:在这两个账户中,唯一无法访问的文件是那些涉及FSD购买详情的文件。其他所有文件,包括未配备FSD的车辆的购买协议,都能正常打开。 Electrek 已证实,其他特斯拉车主,特别是那些拥有特斯拉 HW3 硬件和 FSD 功能的车主,也遇到了同样的问题。该问题主要影响特斯拉在销售 FSD 时未包含“监督”条款的时期签订的合同。 特斯拉FSD语言转变 2016 年至 2024 年初,特斯拉以最高 1.5 万美元的售价售卖 FSD 软件套件,承诺车辆可通过远程在线升级,最终实现完全自动驾驶。首席执行官埃隆 · 马斯克多次宣称无监督全自动驾驶落地近在眼前,自 2018 年起,每年年末都对外许诺该功能即将落地。 2024 年 3 月,随着 FSD 12.3.3 版本推送,特斯拉正式将产品更名“FSD(需人工监督)”,“需人工监督”字样首次出现在产品说明中,补充细则写明:该系统无法让车辆实现自动驾驶。 2025 年 9 月,特斯拉彻底更改了 FSD 的产品定义,放弃了当初实现无监督自动驾驶的承诺;就连新的首席执行官薪酬方案里,也用模糊表述重新定义 FSD,称现行需要人工监督的辅助系统即可达标。 证据消失的模式 使原始购买协议无法查阅符合一种更广泛的模式。 2024年8月,特斯拉删除了其2016年10月发布的一篇博文。该博文称:“我们工厂生产的所有特斯拉汽车——包括Model 3——都将配备完全自动驾驶所需的硬件,其安全水平远高于人类驾驶员。” 在相关诉讼不断升级之际,特斯拉在未作任何解释的情况下删除了该博文。目前,该博文仍可通过互联网档案馆(Wayback Machine)访问。 现在,原本可以证明特斯拉在销售 FSD 时没有任何“监督”限定条件的原始合同正变得越来越难以获取——而此时特斯拉正面临着高达 145 亿美元的诉讼,这些诉讼涉及 FSD 虚假广告、自动驾驶系统事故责任和证券欺诈。 美国一项经认证的集体诉讼涵盖了2016年10月至2024年8月期间特斯拉发布的关于FSD(完全自动驾驶)的声明——这一时间段恰好与这些合同的涵盖范围一致。 加州行政听证办公室裁定特斯拉在FSD方面存在虚假宣传。一名仲裁员已责令特斯拉向一位FSD购买者退还10,600美元,认定该公司违反了合同。在中国和欧洲,针对FSD欺诈的诉讼也在进行中。 在所有这些案例中,原始的购买协议(现在已无法获取)是关键证据。 如果您是特斯拉车主,并且在 2024 年之前购买了 FSD 功能,我们建议您检查一下您的特斯拉账户中是否还能找到原始购车协议。如果找不到,请将其保存下来——这份合同可能具有重要的证据价值。
硬刚特斯拉!蔚来沈斐:乐道能耗、智驾性能双碾压Model Y
快科技6月4日消息,近日,蔚来总裁沈斐在媒体交流中表示,乐道L60在能耗和智驾上双线碾压Model Y,"以前大家把乐道L60看成精装版的Model Y,这次可能就是豪华版Model Y"。 沈斐指出,目前市面上坚持做纯电的只有两家公司:特斯拉和蔚来。乐道诞生后,在多个领域与特斯拉形成你追我赶的态势。 能耗方面,最开始特斯拉百公里12.7度电,乐道是12.1度电,后来特斯拉优化赶超,乐道又通过系统升级降至11.9度电,后驱版CLTC续航达740km。 作为对比,2026款Model Y后驱版百公里能耗约14.1度电,CLTC续航593km。 智驾方面,沈斐承认FSD在全球市场表现不错,但强调中国路况的特殊性。 "在智驾全家桶的支撑下,我们在复杂路况下表现都很好,过几天L60还会在上海、深圳复杂路段测试,我相信会比FSD在中国的表现要好一些。" 新款L60搭载5nm神玑NX9031芯片+世界模型+激光雷达,智驾已进入中国第一梯队。 至于特斯拉没有的,沈斐列举了几大优势:天空娱乐屏带来越级视听体验;换电体系在国内补能体验遥遥领先,东北、川藏、新疆等地的蔚来乐道用户远超特斯拉;新增遮阳帘等舒适性配置,在广东等地区是刚性需求。 沈斐承认特斯拉的品牌优势,"它的知名度肯定比乐道多一点",但强调"我们的实际转化率一点都不差"。 他表示:"放心来比,不管是Model Y还是别的任何车型,只要乐道有的大家就尽管放心来比。"
苹果实况图被指精准选丑!客服回应:实况定格是系统判断
快科技6月4日消息,今日,“苹果实况你要毁了小猫” 的相关话题登上热搜,大量用户反馈苹果实况照片存在系统自动选取定格画面不佳的问题。 针对该使用痛点,苹果官方客服回应称此前已多次收到同类用户反馈,并对封面选取规则与解决方案作出明确说明。 据介绍,实况照片(Live Photo)是苹果自iPhone6s机型起搭载的原生拍摄功能,2015年正式上线。 开启后相机可自动记录按下快门前后各1.5秒的画面与同期收录的环境音,组合生成总时长3秒、由静态JPG图片与短视频构成的复合文件,单张文件占用存储空间约5至10MB。 系统默认的静态封面由设备算法自主判定选取,没有人工干预机制,受算法逻辑影响,系统选取的定格画面和用户主观审美容易出现偏差,这也是频繁出现“选丑帧”的客观原因。 苹果官方同步标注,该功能自带封面自定义权限,用户无需借助第三方软件即可在系统相册完成修改。 具体操作流程为:在照片应用打开目标实况图片,点击页面右上角编辑按键,切换至实况编辑栏,拖动画面下方帧选择滑块,在3秒素材中挑选心仪画面,选定后点击设为封面照片,保存完成即可。 除更换封面外,实况照片还支持循环播放、来回播放、长曝光三种动态特效设置,用户可根据使用需求在同一编辑界面调整效果,也能一键关闭实况模式,将照片永久转为普通静态图片。
改个日期iPhone多出20G!网友神操作火了 苹果:官方没这方法
快科技6月4日消息,今日,词条#iPhone改日期 空出20G#登上微博热搜,引发网友关注。 有网友发帖称,将iPhone开启飞行模式后,手动把系统日期调整到一年后,等待约2分钟,再将日期改回自动并关闭飞行模式,手机存储空间会出现明显释放。 该网友表示,自己通过这一操作腾出了约20GB存储空间。 不过,据媒体报道,苹果官方客服对此回应称,Apple官方没有这种方法,也没有相关的文章说明支持这个说法。 如果用户需要尝试的话,苹果客服建议先备份好数据,防止丢失。 事实上,在社交平台搜索相关关键词可以发现,类似“修改系统时间清理iOS缓存”的说法并非首次出现,早在2024年就已有用户分享相关操作。 但需要注意的是,这种方式并非苹果官方推荐的清理方法,且可能带来一定风险。 此前就有网友提醒,谨慎使用修改时间的方式清除iOS系统缓存,这种操作可能触发Bug,导致“屏幕使用时间”等功能无法正常使用。 该网友称,一旦出现异常,可能需要等到系统时间真正到达此前修改的日期后才能恢复正常,重置手机设置也无法解决,只有刷机才能恢复。 因此,对于iPhone用户来说,如果存储空间不足,更稳妥的做法仍是通过系统设置查看存储占用,清理大文件、卸载不常用App,或备份重要数据后再进行相关操作。
低价苹果本需求爆单!MacBook Neo年产能直接翻倍至千万台
快科技6月4日消息,知名分析师郭明錤发文称,受市场火爆需求驱动,苹果将2026年MacBook Neo全年出货目标从原定500万台上调至1000万台,产能直接翻倍,该机型3月上市后市场热度远超苹果内部预估。 苹果CEO库克此前财报电话会坦言,MacBook Neo市场反响“超乎想象”,产品拉动一季度新增大批首次入手Mac的用户,打破品牌新购机用户纪录。 定价上,美版MacBook Neo起步售价599美元,学生专享优惠价499美元,是苹果史上定价最低的Mac产品。 设计上主打年轻化与便携性,机身采用铝合金材质,推出银色、桃粉色、柑橘黄色、靛蓝色四款配色四款配色。 屏幕配备13英寸Liquid视网膜显示屏,2408x1506分辨率、500尼特亮度,但不支持原彩显示和P3广色域。 性能方面舍弃M系列芯片改用A18 Pro处理器,第二代3nm工艺,拥有6核CPU+5核GPU和16核神经引擎;全系统一8GB内存,存储空间有256GB和512GB(支持指纹)可选。 苹果的整体策略就是极限压缩硬件成本和定价,以此来专攻入门市场,实际表现非常出色。 爆料显示,苹果已敲定第二代MacBook Neo开发计划,预计2027年发布,新一代将升级A19 Pro处理器与12GB运行内存,继续深耕入门级轻薄本赛道,依托低价优势持续扩充苹果在400-700美元价位笔记本市场份额。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。