EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
2025中国AI出海洞察
2025开年伊始,从1月DeepSeek R1发布引发新一轮国产大模型技术爆发,到3月Manus横空出世开启内测开启AI智能体话题热度,从底层基础设施到终端产品应用,从产业深耕提升纵深能力到产品创新形成差异化竞争优势,无论是技术能力还是商业模式,国产AI都处于全球领先水平。海外无论是政策环境还是供需关系,均从内外部双轮驱动国产AI出海蓄势待发。 01 中国AI出海背景概况 (一)中国AI出海产业图谱 AI产业链自下而上主要包括底层基础设施、中间技术层以及终端应用层,涵盖各类软硬件以及产品应用,同时由支付、营销、云等服务生态提供全方位赋能加持。终端应用层主要包括AIGC等软件应用以及智能硬件产品。 (二)中国AI出海驱动因素 1.政策法规 近年来,全球主要国家和地区相继出台了一系列人工智能相关战略和规划文件,将政策重点聚焦在加强投资和人才培养、促进合作开放以及完善监管和标准建设上,全球人工智能正进入战略布局加快、产业应用加速发展落地阶段。 2.技术能力 2024年,新增生成式AI专利数中,6家中国科技企业上榜Top10,专利总量处于领先地位,国产大模型在部分测试维度中已赶超国外大模型。大模型技术水平的进步进一步提升了效率,从而推动API调用价格的下降,也让AI出海企业在实际应用中降低了使用成本。 (三)中国AI出海历程阶段 根据当前中国AI出海现状,同时结合AI技术的发展,中国AI出海大致可分为三个阶段:第一阶段为通用工具及模型时代,第二阶段为AI应用和解决方案本地化时代,第三阶段为资源整合后的生态创新时代。 中国AI出海是开源社区里一次次更新的国产大模型,是云服务商在海外新建的数据中心,是全球AI独角兽榜单上不断涌现的中国创业公司。 02 中国AI出海现状分析 (一)AI海外用户画像 海外人口大国印度、东南亚、拉美等地区有大量AI用户;而北美和欧洲的用户付费习惯更为成熟,贡献了整体68%的收入占比。以ChatGPT为例:男女比例相对平衡,18-34岁的青年群体是AI用户的主力军。 (二)AIGC海外盈利模式 AIGC海外盈利模式主要包括订阅制、按量收费/单次收费和广告收入,三者各有特点,可以针对不同用户的消费意愿和消费能力满足其使用需求; 以Hailuo和Kling为例,两大视频赛道顶流产品,通过用户自主订阅来提供视频生成等服务,套餐价格按量和周期进行梯度划分,满足不同用户的购买需求。除此之外,两大产品还允许通过API调用的方式根据使用量来计费,向企业和开发者提供视频生成服务。 (三)AI硬件海外销售渠道 线上销售渠道:主要包括自建独立站以及上架当地主流跨境电商平台进行销售,例如AI耳机等智能可穿戴设备多通过该方式售卖。部分初创企业也会选择通过众筹平台来销售早期产品,例如Ropet、Loona等产品。 线下销售渠道:主要包括开设直营门店、入驻大型连锁商超打响品牌知名度,以及与当地经销商、分销商等合作拓宽销售渠道。该类销售模式多具备本地售后服务能力。 03 中国AI出海趋势分析 (一)市场趋势 东南亚、中美、西亚等地区凭借高于全球平均水平的互联网渗透率,同时具备大量年轻人口的年龄优势,随着未来经济发展以及基础设施完善,将是中国AI出海企业的核心潜力市场。 (二)行业趋势 用户对通用助手类产品和图像及视频编辑类产品有更高的付费意愿和使用习惯,这两类产品均能在工作或生活场景中帮助使用者实现效率提升。助手类产品的下载量增速远高于AI图像类产品,海外Top6区域市场的增长率都达到双位数,获客空间和增长潜力更加可观。 (三)技术趋势 基于多模态大模型,AI产品的交互方式已经逐渐从文生文,拓展至文生图、文生视频、图生图、图生视频等多元混合模式。在出海AI搜索类产品和以Cici等为代表的通用助手类产品中,Agent形式的出现能够让用户通过简单的自然语言进行复杂的任务处理。 (四)产品趋势 用户对产品应用的需求越来越垂直细分,对产品功能和场景切换能力要求也逐步提高,而AI技术的进步恰好让复杂的功能得以实现,从而推动硬件产品形态的突破和迭代,进而满足不同用户的多元化及个性化需求。与此同时,用户需求也推动了AI技术在硬件产品中的应用和融合,帮助AI出海企业找到全新的应用切入视角。 04 中国AI出海代表玩家 (一)字节跳动:丰富的产品矩阵 (二)昆仑万维:扎实的纵深能力 (三)蝴蝶效应:技术卡位到技术原创 (四)科大讯飞:软硬结合双向赋能 (五)科沃斯:线上线下双管齐下 05 中国AI出海解决方案 (一)支付解决方案:Airwallex 空中云汇 Airwallex 空中云汇是领先的全球支付及金融平台,面向现代化企业提供创新性的全球支付、财务管理、费控管理以及嵌入式金融解决方案。空中云汇运用自建的全球金融服务设施,解决了跨境支付和财务运营中的各种痛点,赋能全球超15万家企业实现无界增长,包括迈凯伦车队、SHEIN、澳洲航空、Canva以及一系列AI科技类企业。 (二)营销解决方案:科大讯飞 科大迅飞L4级智能营销解决方案,通过覆盖红人营销、精准投放和独立站电商三大营销场景,为品牌实现从红人种草、广告投放到站内运营收割的完整流程。 (三)云解决方案:阿里云 阿里云创立于 2009 年,是全球领先的云计算和人工智能公司,已有 10年服务企业全球化的丰富经验,帮助超过 25万中国企业出海,在计算、存储、网络、数据库、大数据、云原生解决方案和安全等产品方面全球领先。
AI编程工具Windsurf创始人谈团队管理:希望公司是个“脱水体”,员工入职带来水分
IT之家4月22日消息,据《商业内幕》今日报道,AI 编程工具 Windsurf 的联合创始人兼公司 CEO Varun Mohan 希望将这家初创公司保持在一种极度精简的状态。 “我希望公司几乎像一个脱水体,每一位新员工的加入都像是补充的一点水分,我们只在再次脱水时才考虑扩充团队。” 他指出,这样做并非为了迷信小团队的美学,而是希望公司“以最小的规模承载我们的雄心”。 IT之家注:Windsurf 前身为 Codeium,专注于开发利用自然语言提示编写代码的 AI 工具。 这家公司属于新一代投身“氛围编程”潮流的初创企业之一。“氛围编程”由 OpenAI 联合创始人 Andrej Karpathy 提出,意指通过向 AI 提示生成代码。Karpathy 曾说,开发者可以“完全沉浸在灵感的氛围中,甚至忘了代码的存在”。 “如果我们能真正成长为一家规模可观的企业,同时仍保持初创公司的运作方式,那就完美了。”Mohan 说。 据 PitchBook 统计,Windsurf 目前拥有约 170 名员工,其官网上仍列出逾 30 个招聘岗位,涵盖软件工程师及招聘专员等。 不过 Mohan 强调,限制员工人数不仅仅是为了节省开支,更是为了规避组织运作中的不必要问题。 他说,人员已经饱和的团队若继续招人,常常会滋生“诡异的内部政治”。当岗位本身并无实际需求时,新员工往往会凭空“制造”工作内容。“那些事其实没那么重要,但他们可能极力说服整个组织相信那很重要。” 这种内耗,反而可能拖慢公司的节奏。“作为一家初创企业,我们根本无力应对这类消耗。”只有在“团队成员几乎都举手示意‘真的扛不住了,我们急需多一个人’”的情况下,才应考虑扩编。
AI永生时代来临,DeepMind“生成幽灵”让逝者赛博重生
想象一个世界,你的亲人从未真正离去。DeepMind与科罗拉多大学提出“生成幽灵”——基于逝者数据打造自主的数字智能体。它不仅承载记忆和声音,还能以“逝者视角”回复当下事件,带来情感慰藉与想象。这不是科幻小说,AI正在创造逝者的数字回声,分享新见解并回应当下世界。 想象一下,在亲人离世后,你仍能与他们的“数字幽灵”互动、交流。 甚至获得他们“生前”从未表达过的想法或对当下事件的“看法”。 这听起来像是科幻小说的情节,但随着人工智能的飞速发展,正在迅速成为可能。 《超人:钢铁之躯》中超人父亲的“数字生命” DeepMind研究院和科罗拉多大学博尔德分校最近的一篇论文提出一个观点,在我们的有生之年,很有可能会看到一种新的智能体,一种全新的数字生命。 在人们去世后,仍然可以做到与亲人或更广泛的世界互动。 DeepMind将这种形态称为生成幽灵(generative ghosts),因为这些智能体将能够生成“新的内容”,而不仅仅是重复其创造者生前产生的内容。 论文地址:https://arxiv.org/pdf/2402.01662 这并不是幻想,随着AI系统在广度和深度的迅速提升,生成式AI能够创建越来越强大和逼真的智能体,甚至可以基于具体的一个人完成建模。 但这种区别碳基人类的全新生命,是否会带来未知的风险、伦理挑战和人机交互(HCI,Human computer interaction)议题,还未为可知。 DeepMind和科罗拉多大学为AI和HCI制定了一项研究议程,以更好地探讨这项新技术。 在这种生成幽灵、数字生命出现前,也许是时候提前“对齐”一下了。 聊聊身后事,如何与“死者”互动? DeepMind引入了“生成幽灵”的概念,代表未来已故人士的一种智能体。 这种形态会在多久的将来实现?真的会越来越普遍吗? 纵观历史,人们一直依赖技术来纪念、缅怀甚至与故去之人交流。 墓碑和其他葬礼标记可以追溯到公元前3000年左右。 芝加哥大学出版社《古埃及的死亡与来世》 讣告,比如美国的讣告可以追溯到16世纪。 等到了万维网、互联网时期,人们会创建自己的家庭主页,其中的某一页用来纪念家族的已故成员,可能是父母,也可能是曾经陪伴生活的宠物。 很快,在线墓地也随之出现。当互联网技术与死亡在不同背景下交汇,数字遗产、在线纪念、数字遗赠等纪念形态不断出现。 这些能够传递价值和意义的遗产,在逝者去世后,依然能继续代表逝者。 AI版本的“前世今生” 一些对AI技术“娴熟”的人已经通过亲人的数字内容,制作出了逝去亲人的数字形象。 Amy Kurzweil在她的图像小说《Artificial: A Love Story》中,记录了她的父亲、未来学家Ray Kurzweil如何创建了一个聊天机器人,以Ray称之为“Fredbot”的形式体现已故父亲Fred Kurzweil(Amy祖父)的记忆。 利用AI的力量Amy与她从不认识的祖父Fred建立联系 在2023年11月,披头士乐队的在世成员发布了一首新歌《Now and Then》,使用人工智能使已故的约翰·列侬能够与他的在世乐队成员一起唱歌。 虽然上面分享的例子展示了新兴方法的多样性,但这种“身后AI”的一个关键趋势是围绕着“哀悼”机器人。 “哀悼”机器人,有时也被称为死亡机器人,通常形态为聊天机器人(早于现代LLM),旨在让丧亲者能够与逝者“对话”。 “生成幽灵”可以被视为哀悼机器人的概念的延伸,但并非所有的哀悼机器人都能被称为生成幽灵。 生成幽灵总是包括以角色身份生成新颖内容的能力,并且可能随着时间推移而进化。 例如,用户应该能够向生成幽灵询问当前事件,并获得与逝者“角色相符”的回答,即使这些事件发生在被代表者生命结束之后。 生成幽灵的创建可能不仅仅是为了支持丧亲者的哀悼过程。 应该如何设计,来用AI连通“前世今生”? “生成幽灵”设计空间 从古至今,人们一直借助各种技术来缅怀逝者。 “生成幽灵”听起来有点神秘,其实可以从多个维度来理解。 先说说来源,也就是谁创建了这个幽灵。 如果是本人创建的,比如通过临终规划提前做好准备,这就是第一方幽灵。 比如,一位作家生前就安排好,自己去世后,生成幽灵能继续用自己的风格创作作品,和粉丝互动。 要是由其他人创建,像家人、朋友,甚至和逝者毫无关系的人创建的,那就是第三方幽灵。 Character.AI这样的公司和可汗学院这样的非营利组织,曾为了娱乐或教育目的,创建历史人物的第三方幽灵。 如果是经过逝者同意创建的,那还好说,要是未经授权,就可能引发很多问题。 再看看部署时间线。有的生成幽灵是在逝者去世后才开始生效。 但也有不少是生前就存在,帮人们处理一些事物,像回复邮件、打电话等等,等主人去世后再变成“幽灵”。 生前部署的好处是,人们可以按喜好调整它的行为和能力,给数字分身提前做好规划。 拟人化范式这个维度也很有意思。 生成幽灵在和人互动的时候,是把自己当成逝者的转世,还是仅仅作为逝者的数字形象?这会极大地影响人们和它互动的感受。 要是用第一人称、现在时态,还声称自己活着的幽灵,更容易让人产生它就是逝者本人的感觉,这可能会带来一些心理和伦理上的问题。 多重性说的是一个人是由一个幽灵代表,还是多个幽灵代表。多个幽灵可以针对不同的人展现不同的特点和能力。 比如说,一个人可能希望在孩子面前展现温柔耐心的一面,在朋友面前又有不同的形象,就可以设置多个幽灵来满足需求。 但这也可能带来问题,要是多个第三方未经授权为同一个人创建幽灵,就容易乱套。 截止日期决定了幽灵是静态的还是动态的。 静态的幽灵会一直保持逝者去世时的状态,记忆、能力都不会更新。 动态幽灵则会随着时间变化,比如根据新发现的逝者信息,或者周围环境的变化而改变。 如果是一个代表孩子的幽灵,静态的可能永远是孩子的样子和性格,动态的就可能长大。 具身形式很好理解,就是幽灵有没有实体形态。 它可以是像机器人这样真实的物理实体,也可以是逼真的虚拟形象,或者仅仅是一个聊天界面。 选择实体化还是虚拟化,涉及技术、成本,还有伦理和心理方面的考虑。 最后是被代表者的类型。生成幽灵不仅能代表已故的人,还可以代表非人类,比如心爱的宠物。 是利还是弊? 分析完“生成幽灵”的设计维度,接下来分析它有哪些好处。 对于被代表者来说,创建第一方幽灵就像是给自己的数字永生买了张门票。 人们想到去世后还能以另一种方式存在,给亲人留下温暖的回忆,传承自己的价值观和人生经验,会感到安慰。 它甚至可能带来经济收益。例如一位作家的生成幽灵,要是能继续创作作品,就能为家人赚取收入。 对丧亲者而言,和生成幽灵互动可能是一种情感寄托。 在悲伤的时候,能和逝去的亲人说说话,获得一些安慰和建议,对心理健康有积极作用。 在一些重要的人生时刻,比如结婚、生子,听听它的祝福和嘱托,那种感觉真的很特别。 幽灵还能把逝者生前的实用知识和技能传承下来,让亲人之间的联系更加紧密。 从社会层面看,生成幽灵在文化、历史和遗产保护方面有着巨大的潜力。它可以保存濒危文化的知识,比如一些快要失传的语言。 博物馆、历史研究机构能借助它,让人们以全新的方式和历史人物对话,这种体验肯定超有趣。 不过,“生成幽灵”不是只有好处,背后也藏着不少风险。 先说说心理健康的风险。虽然和幽灵互动能缓解悲伤,但如果过度依赖,就可能出现问题。 从西方心理学角度来看,健康的哀悼应该是逐渐接受亲人的离去,重新回归正常生活。 但有些人可能会对幽灵产生过度的依赖,把它当成生活中唯一的情感寄托,忽略了身边真实的人际关系。 另外,把幽灵拟人化,甚至神化的风险也不小。 要是有人真的把幽灵当成逝者本人,就可能产生一些不切实际的信仰,做出一些对自己或他人有害的事。 如果幽灵因为各种原因突然不能用了,这会让亲属再次经历失去的痛苦,带来很大的情感伤害。 声誉风险也不容忽视。 幽灵要是不小心泄露了逝者不想被公开的隐私,就会给逝者的声誉带来损害,也会伤害到在世的亲人。 另外,幽灵还可能会胡说八道,说出一些听起来合理的虚假信息,损害逝者声誉。 就算幽灵提供的信息是准确的,也可能有问题。 人们往往会记住亲人的美好瞬间,但幽灵可能会提醒那些负面的事情,影响逝者在人们心中的形象。 安全风险也不容忽视。生成幽灵可能会引发新的犯罪形式,比如死后身份盗窃。不法分子可以利用幽灵获取逝者的敏感信息,像密码、财务信息,进行非法活动。 社会文化风险也不容小觑。生成幽灵真的可能会对社会产生巨大的影响。 大量幽灵参与经济活动,可能会影响就业市场。它可能会改变人们的交往模式,让人与人之间的关系变得更复杂。 应对策略:降低风险,拥抱未来 在设计生式幽灵的界面时,一定要把风险降到最低。 比如,避免使用那些容易让人产生成瘾性的设计,像频繁的推送通知。 还要提高透明度,让用户清楚地知道这是个幽灵,不是真正的人。可以用数字水印或者其他技术来验证身份。 还可以增加一些保护机制,像监测用户和幽灵的互动模式,一旦发现过度依赖或者其他异常情况,就及时提醒或者限制使用。 政策制定也得跟上。对于第三方生成幽灵,必须制定严格的规范,明确谁能创建、谁能被代表,还要保护好逝者和家属的隐私和同意权。 对于公众人物和普通人,历史人物和近期去世的人,要有不同的标准。 同时,要建立紧急机制,一旦出现恶意行为或者其他问题,能迅速禁用幽灵,保护用户权益。 如果技术进步能降低风险,比如减少幻觉、提高安全性,就会有更多人愿意接受它。 另外,成本也很关键,如果太贵,就会造成新的数字鸿沟,只有少数人能使用。 参考资料 https://deepmind.google/research/publications/65827/ https://arxiv.org/pdf/2402.01662
“仅退款”再见!拼多多、淘宝、抖音、快手、京东将全面取消
快科技4月22日消息,据国内媒体最新报道,拼多多、淘宝、抖音、快手、京东等多个电商平台将全面取消 “仅退款”。消费者收到货后的退款不退货申请,将由商家自主处理。 据悉,上述电商平台已就全面取消“仅退款”的相关细节与管理部门进行了多轮商讨和修改,一旦审核完成即对社会公开宣布。 目前,电商平台售后一般设有“退款无需退货”和“退款退货”入口。“仅退款”政策取消之后,平台或将只保留“退款退货”,“收到货”情形下退款是否退货,将由商家与消费者协商决定。 这也标志着,“仅退款”历时四年野蛮生长之后,正式迎来落幕。 公开资料显示,2021年,拼多多率先推出“仅退款”政策,允许消费者在一定条件下直接退款而无需退货。 随后,京东、淘宝、抖音、快手等相关平台相继引入。国内五大电商平台均推出仅退款服务,成为行业标配。 随着“仅退款”的广泛运用,问题也随之而来。 一方面,部分平台没有了解纠纷具体情况,不经过商家同意就向消费者发送“仅退款”通知,导致部分商家责任在尚未明确的前提下就损失了货款和产品。 另一方面,也有商家表示产品如果有质量问题,他们可以凭借问题产品和厂家或者上游商家索赔,但是仅退款政策给他们带来了一定的麻烦。 此外,部分职业“薅羊毛”群体,恶意利用该规则以获利,致使部分商家损失严重。 该政策调整标志着电商行业从 “低价竞争” 向 “质量竞争” 转型,有利于电商行业的长期稳定发展。
英伟达终止Lepton AI运营!禁新用户注册、注销官推,贾扬清创业生意被收购,两年后再回大厂
整理|褚杏娟 近日,网上曝出 Lepton AI 已通知用户,Lepton 将于 2025 年 5 月 20 日正式停止运营,此后用户将无法再访问 Lepton AI 平台上的服务或提交的数据,建议用户在该日期之前尽快下载或备份所需数据。服务终止时,若用户账户中仍有未使用的积分,官方将会在关停后予以退款处理。 不仅如此,官方网站已经禁止新账户注册,显示正在维护。 Lepton AI 的官方推特显示也已经被注销。 就在大约两周前,The Information 报道,英伟达已完成对 Lepton AI 的收购,交易价值数亿美元,知情人士透露称创始人贾扬清及联合创始人白俊杰都已加入英伟达,目前还不清楚具体担任职位。 值得注意的是,黄仁勋还一直称英伟达是一家软件公司, Lepton Al 创始团队都是软件方面的顶尖人才,或许这也是双方契合的一点。 收购消息刚被曝出来时,许多人猜测英伟达收购后是会仅保留机器学习人才、大砍业务,还是会继续运营 Lepton AI 的云平台。目前看来,英伟达似乎更在意的人才,而非其相关具体业务,毕竟如今已经选择了关闭服务。 交易完成时 Lepton AI 约有 20 名员工,目前还未有消息指出这些员工的去留。英伟达此番价值可能达数亿美元的收购,实现了让 LeptonAI 投资方红杉中国、CRV 和 Fusion Fund 较为可观的退出,大约在两年前他们参与了该公司 1100 万美元的种子轮融资。 起于“百模大战” Lepton AI 成立还不到两年的时间。两位创始人在业内都颇有名气:贾扬清在博士期间创立并开源了深度学习框架 Caffe,白俊杰是开放式神经网络交换标准 ONNX 的共同创始人以及 Caffe2 的核心开发者。贾扬清先后在谷歌、Meta 任职多年,2019 年 3 月起在阿里担任技术副总裁。白俊杰也曾分别在 Meta、阿里云任职。两人担任 AI 研究员时,共同开发了 PyTorch 框架。 2023 年 3 月,贾扬清离开阿里云,四个月后宣布联合创立了 Lepton AI。他们创业时,正值国内“百模大战”,贾扬清等人没有直接入局大模型,而是选择成为大模型的基础设施提供商。不过,他们自己没有购买 GPU,而是用租用的方式,然后对外提供算力租赁等服务。这种模式被称为是典型的“人工智能即服务 (AIaaS) ”,即通过云计算平台预配人工智能 (AI) 服务和工具。 Lepton AI 整个团队主要在海外,所以目标客户主要为海外企业和国内想要拓展海外市场的企业。官网显示,Lepton 的服务主要包括: 全托管的 AI 云平台 Lepton:支持模型的开发、训练和部署,包括开箱即用的 Serverless 接口,兼容 OpenAI API;完全自定义的专属推理接口;支持运行分布式训练或批处理作业等。 企业版 Lepton:管理节点组,同时允许用户使用自有服务器创建自托管的节点组。 Python SDK,帮助用户构建 AI 应用。 与 Lepton AI 同名的云平台专为 AI 工作负载优化,用户可以在平台上进行模型训练和推理。该公司提供了一个可视化界面,帮助用户在其云平台上配置训练集群,并支持多款 Nvidia 显卡选择。对于需要并行训练多个模型的团队,平台还提供了一种集中管理每个项目分配硬件资源的工具。 在模型训练过程中,有时会出现降低输出质量的错误,Lepton AI 的平台具备检测此类错误的功能,同时还能发现更为隐蔽的技术问题,比如神经网络在训练过程中使用了超出预期的内存等。 模型开发完成后,Lepton AI 用户可以将模型部署在平台提供的推理优化实例上。该平台承诺,在推理过程中能够实现超过每秒 600 个 token 的处理速度,同时将延迟控制在 10 毫秒以内。平台还具备自动扩展功能,当推理需求增加时,可自动为客户增加计算资源。 Lepton AI 还采用开源工具 vLLM 来加速推理。该技术能够将相似的大模型提示合并成一次请求,从而减少模型所需处理的计算量。开发者还可借助 vLLM 降低模型的内存占用。 此前,贾扬清在接受 InfoQ 《大模型领航者》栏目采访时表示,团队在技术实现上没用什么“黑科技”,而是将很多耳熟能详的单点技术结合起来,以实现成本的显著降低,如大模型处理服务收到大量请求时的动态批处理(Dynamic Batch)、用小模型预测数个 token 的预测解码等。具体如何实现单点技术的有机结合,就是他们工作的重点和难点。 期间,团队还基于 Lepton 做了一些产品 demo。比如,贾扬清曾在其社交平台分享了他基于 Lepton Al 实现的 AI 搜索引擎 (类似 Perplexity),而且只用了不到 500 行代码。这个项目当时引起了大家热议,目前也已经开源,斩获 8.1k 颗星。 Lepton Al 开源了旨在通过主动监控 GPU 和有效管理 AI/ML 工作负载来确保 GPU 效率和可靠性的 GPUd。据悉,GPUd 基于团队多年来在 Meta、阿里云、Uber 和 Lepton AI 运营大规模 GPU 集群的经验而构建,能与 Docker、containerd、Kubernetes 和 Nvidia 生态系统等无缝集成。 “通过这些产品,我们可以展示自己在开源模型上能做的事情,以及 Lepton 平台帮助用户构建应用的能力。”贾扬清曾表示。团队希望通过这些产品或 demo 可以在用户中形成好的口碑,当有人需要部署大模型时就会想到 Lepton AI。 贾扬清还积极对外分享最新的大模型进展思考。比如 DeepSeek 爆火后,贾扬清分析称,它的成功更多体现了纯粹的智慧与务实:在计算资源和人力有限的前提下,通过聪明的研究方法,产出最好的成果。这与当年 Alex Krizhevsky 在只有两块 GPU 的情况下造出 AlexNet 模型一样,靠的不是超大规模集群,而是扎实的能力。 目前,贾扬清的 x 分享停留在了 3 月中旬。 止步于算力巨头的野望 AI 爆发后面临的主要问题就是缺算力。为了减少投入,不少企业“由买转租”,这催生了算力租赁的诞生,算力租赁价格一年就可实现翻倍。 北美和欧洲地区仍是算力租赁市场的主导者。像 CoreWeave 是挖矿起家,英伟达通过投资支持、供货保障等方式扶持 CoreWeave。CoreWeave 采用“GPU 即服务”(GAAS)模式,拥有 32 个数据中心,运行超 25 万 + GPU,主要服务微软、英伟达、OpenAI、Meta、Google 等北美大客户。而欧洲本地云服务商 Nebius,在芬兰拥有一个部署了约 2 万个 GPU 的数据中心。受益于欧洲扶持政策,Nebius 以短期租赁性价比取胜。值得注意的是,Nebius 也获得了英伟达的投资。 值得注意的是, Lepton AI 与英伟达若干主要客户的服务存在竞争关系,其中包括 AI 云服务商 CoreWeave。贾扬清去年 6 月时曾透露,Lepton AI 的客户数量和整体营收都处于非常健康的增长状态,他对此也比较满意,验证了团队之前的想法和产品在用户中的接受度。 对于英伟达此次收购 Lepton Al 的目的,业内猜测是其欲试图完全掌控供应链,而不仅仅是负责制造部分。与其只出售显卡或 AI 芯片,英伟达选择提供完整的解决方案:自己开发芯片、组装服务器、再提供租赁服务。这正是人们常说的“垂直整合”——一家公司掌控从上游到下游的整个流程。 这种垂直整合策略让英伟达能够从芯片设计到算力租赁的全产业链中获利,同时还能更好地控制其 GPU 芯片的使用方式和价格策略,进一步增强其在 AI 计算领域的主导地位。 通过这一策略,英伟达还成功规避了一个行业中常见的问题:库存积压。当市场降温、销量下滑时,许多公司往往会被大量滞销的设备所拖累。但如果英伟达可以自己出租服务器,就能让设备始终保持运转状态,同时还能继续从中盈利。 SemiAnalysis 指出,通过收购 Lepton,英伟达不仅获得了额外的收入来源,还可能挤压其他云服务提供商的生存空间。通过打造这套自有体系,英伟达也更有能力与亚马逊、谷歌和微软等巨头竞争,它们同样在 AI 领域布局,并采用定制芯片(也就是常说的 ASIC)提供服务。 这也对应了黄仁勋的想法。他在今年 3 月的 GTC 大会上表示,英伟达不再是一家芯片公司,也不再是一家 AI 公司,而是一家算法和基础设施公司。 目前,英伟达正在投入构建 AI 基础设施,规划周期必须在上游和下游都延伸多年。黄仁勋想要把英伟达打造成一个 AI 工厂,直接成为客户的收入来源。“每个行业、每个国家、每家公司都来到这里,因为我们已经成为一个基础平台,其他公司可以在此基础上构建自己的业务。”
加州AI博士一夜失身份!谷歌OpenAI学者掀离美潮,38万岗位消失
编辑:Aeneas 犀牛 加州一位AI博士,学生签证忽然被吊销!他从未有过犯罪记录,但在美国深造之路已被斩断。许多OpenAI、谷歌的顶尖学者都透露在考虑离开美国。这场AI竞赛中,美国或将彻底崩塌。 就在刚刚,加州一位AI博士的学生签证被吊销了。 这就导致,他在美国的移民身份岌岌可危,可能已成黑户。 然而,他从本科就来美国求学,近十年里从未有过任何犯罪记录。 他自己猜测,原因或许是自己多年前准备进入研究生院之前,跟警察的一次互动。 原本,他是计划毕业后继续在AI领域深造的,但如今,这条路可能已经被拦腰斩断。 而他的遭遇,并不是孤例。 在这场规模庞大的吊销签证运动中,没有哪所学校能幸免。无论是常春藤盟校、大型公立大学还是小型文理学院,都有学生签证被吊销。 一位教授直言,这样下去,美国的AI项目可能会倒退数年,AI优势将直接崩塌! OpenAI、谷歌的顶尖AI学者,在考虑离开美国 过去几个月,在特朗普政府的强硬政策下,美国国务院和移民与海关执法局终止了超过1000名国际的SEVIS记录。 Sevis数据库由美国国土安全部维护,用于追踪持有F、M和J签证的国际学生和学者。 Sevis记录一旦终止,学生的合法身份将立即失效。他们必须在宽限期内(通常为15天)离开美国,或采取措施恢复身份。否则,他们将面临被驱逐出境和未来签证受限的风险。 甚至很多时候,学校都并未收到联邦机构的通知,这让学生们措手不及,没有任何应对余地。 加州理工学院的机器学习教授Yisong Yue沉痛表示,美国政府的这种态度,正在严重损害人才输送渠道。 他直言:现在,种种政策的累积效应,已经让美国对许多顶尖研究者彻底失去了吸引力。因为AI的研究是极度专业化的,项目中损失一名博士生,可能就会让项目倒退数月,甚至数年! 可以说,美国如今AI领域的学术繁荣,跟国际学生做出的多项贡献是密不可分的。 Transformer开山之作的作者之一Ashish Vaswani,就是在2000年初来美国攻读计算机科学的。 而OpenAI的联创之一Wojciech Zaremba,就是凭借学生签证,在纽约大学获得了AI博士学位。 非营利教育协会NAFSA的最新分析显示,在2023-2024学年,国际学生为美国经济贡献了438亿美元,支持了超过37.8万个就业岗位。 但如今,AI领域的顶尖研究者,正在肉眼可见地开始流失。 Yisong Yue教授表示,自己跟多位研究者讨论过,包括顶尖大学的教授,以及OpenAI、谷歌等公司的研究人员。 这些人普遍表示,如果自己继续留在美国,接下来还要发生的事情实在令人担忧。 在美国多地,学生和民众已经掀起了抗议活动。 失控了!特朗普,在用AI筛人 而美国政府的「草台班子」作风,在这个过程中体现得是淋漓尽致。 有一些学生的签证撤销,似乎纯纯是由于工作人员的粗心大意。比如布里格姆杨大学的CS博士候选人Suguru Onda的学生签证,在律师提起诉讼后不久,又被恢复了。 背后原因很荒谬。律师表示,政府正在用AI筛选签证持有人,因为缺乏人工核查,导致错误频发。 据悉,马斯克的DOGE部门正在为特朗普政府提供技术支持,包括终止签证的一系列行动,而他们就在大量使用AI 在亚特兰大,移民律师Charles Kuck正为150名签证被吊销的学生进行辩护。 Kuck律师表示,特朗普政府正在用AI针对这些学生。 他推测,政府工作者会将所有学生与每个犯罪数据库、民事数据库、移民数据库进行比对,如果发现匹配,就会给他们发一份撤销通知。 被驱逐出境,只因超速罚单,或者和伴侣吵架? Lisa是威斯康星大学麦迪逊分校的一名国际学生,还有一个月就要毕业了。 某天晚上她正在朋友家吃外卖,忽然收到了一封邮件。「ISS通知您,您的SEVIS记录已被终止……」 邮件中还附上了一张截图,注释为「此人已在犯罪记录检查中被确认,且/或 VISA 已被吊销」。 Lisa还以为自己收到了诈骗邮件,然而翻了一下社交媒体,她发现不少学生有和自己类似的经历:他们已经失去了在美国的合法身份,继续留在美国,可能就意味着违反了移民法。 Lisa翻遍了评论区,加入了群聊,终于发现他们的共同特点——基本都被采集了指纹。因此,他们会显示有犯罪记录。 Lisa这才想起,自己在一年前开车回家时收到过两张罚单,一张是超速,一张是未停车。为了撤销指控,她去了法庭,在那里被按了指纹。 后来,案件被撤销了。Lisa已经拿到了offer,也被研究生院录取了。 她的工作签证获批,公司背调顺利通过,出入境也全程顺利。她以为一切都过去了。 但现在,她不知道自己周一是不是还能去上课。 2025年4月3日,波士顿大学的学生在学生主任办公室外抗议 4月4日,共有来自50所大学的学生签证被取消,其中一些原因仅为罚单,或非刑事犯罪记录。 而就在这波浪潮爆发的前几天,美国国务卿卢比奥宣布撤销300多名学生的签证。 「我们每天都在做这件事。每次我发现一个这样的疯子(威胁国家安全),我就吊销他们的签证。」 加州的移民律师Shenqi Cai表示,这轮签证吊销潮是史无前例的。 「学生们没机会解释自己的处境。只要他们被系统标记了,就会触发犯罪筛查机制,根据一项宽泛的指令被开除。」 中国学生David已经拿到了本科学位,开始在美国工作了。因为与伴侣发生口角,他的签证也被撤销了。 去年,他和伴侣发生争吵,有人报警了。警方赶到时,两人仍在争吵。但由于语言障碍,他的伴侣无法解释清楚事情经过。 David被拘留了一夜,被勒令出庭。他的伴侣写了一份声明给检察官,解释自己没有被家暴。 最终,指控被撤销,逮捕记录和生物特征数据已经被法官下令销毁。 然而4个月后,他收到了SEVIS的撤销通知,此时他已经工作一年。 跟F-1学生签证不同,他的工作签证是可选实践培训。一旦SEVIS记录被终止,这项许可也会终止,几乎无法恢复。 经理表示会尽力帮助他迁往加拿大工作,但因为通知已经生效,他必须遵守15天的离职规定。 「我告诉了家人,他们也无能为力。我的家境并不富裕,他们帮不上什么忙。」 超千名学生,签证被吊销 根据大学的声明及发言人透露,今年美国130多所学校的1000多名国际学生和应届毕业生在SEVIS中被撤销了签证或身份。 40个州的学院和大学向媒体证实了学生的签证和身份被终止。 现在,已经有不少美国大学建议留学生避免旅行,从而导致无法入境 田纳西州立大学的发言人Jimmy Hart表示,来自亚洲、欧洲和中东的6名该校学生被吊销了签证。 「学校不清楚签证状态变更的具体原因,只知道这些变更是在联邦数据库中进行的」,Hart说。 多所大学声称,政府没有提供撤销签证的理由。 很多学校都是自己检查系统时才发现签证被撤销的,只有少数大学知道学生签证或SEVIS账户被终止的原因。 俄勒冈大学发言人Eric Howald表示:「过去几周,美国国土安全部以未具体说明的刑事指控,撤销了该校4名国际学生的签证状态。学校事先没有收到通知,也不知道指控的具体细节。」 在美国政府大规模的移民限制政策下,一些美国顶尖大学的国际学生也都成了清理的目标。 理由各种各样,从犯罪记录到轻微违法,甚至是多年前的轻罪都有,种类繁多。 UCLA向CNN透露,12名该校学生或者应届毕业生受到了签证的影响。 他们的校长Julio Frenk在给学校社区的声明中说:「通知表明,所有签证终止都是由于学生违反了个人签证计划的条款」。 学生奋起反抗,联合起诉特朗普政府 虽然许多学生没有得到签证被撤销的具体答复,但已经有人开始起诉特朗普政府。 该诉讼在亚特兰大北乔治亚州联邦地区法院提起,涉及133名来自中国、印度、哥伦比亚、墨西哥和日本的学生。 据诉状和提起诉讼的律师之一Dustin Baxter透露,因为担心遭到报复,学生在诉状中均以化名出现。 该诉状称,移民和海关执法局突然非法终止了这些学生的合法身份,「剥夺了他们继续学业和在美国维持就业的能力,使他们面临被逮捕、拘留和驱逐出境的风险。」 不过,好在他们的诉讼成功了。 美国地方法院法官Victoria Calvert签发一项临时限制令,暂时禁止驱逐这133名国际学生。该命令有效期至5月2日。 这意味着,学生们的合法身份必须在SEVIS中恢复。 「我们为这些学生感到非常高兴,主要是因为他们头顶上的阴云已经消散,可以安心返回学校和工作,知道法官已经发布了保护令,」Baxter说道。 「我们认为,这一裁决表明学生们很可能会胜诉。我们很高兴法院命令政府停止其非法行为,同时诉讼仍在继续,」资深律师Akiva Freidlin表示。 438亿美元,超37.8万就业岗位 实际上,国际学生对美国意义重大。 他们不仅增强了美国的AI技术实力,还撑起了美国的经济增长和就业。 根据美国国际教育者协会(NAFSA)与JB国际联合发布的最新数据显示,在2023-2024学年,美国高校共接收了约110万名国际学生,他们为美国经济贡献了438亿美元,支持了超过37.8万个就业岗位。 这一数据创下了NAFSA有记录以来的最高值,打破了2018-2019学年410亿美元的历史纪录。 NAFSA执行董事兼CEO Fanta Aw表示: 国际学生为美国带来了巨大贡献。我们不能承受失去国际学生的代价,尤其是他们在STEM领域的贡献。 NAFSA的研究还发现了以下几个亮点: 每三位国际学生的支出,就能直接或间接创造/支持一个美国本土就业岗位。 国际学生在社区学院的经济贡献连续第二年增长,达到了20亿美元,同比增长33%,并支持了8,400多个工作岗位。 就读于美国语言课程项目的国际学生为经济贡献了3.713亿美元,支持了2,691个就业岗位。
京东、美团内卷即时零售赛道,谁将问鼎万亿规模市场?
近日,京东美团两家在互联网上的“隔空争战”,引得许多人广泛关注。 先是今年2月份,京东外卖正式上线,以“高品质外卖”全面进攻外卖业务,4月11日京东外卖宣布百亿补贴全面上线,通过“全民补贴+爆款直降”双重机制,加上其品质定位和补贴优惠,京东外卖业务的发展速度和势头似乎超过了美团的预期。 4月12日美团核心本地商业CEO王莆中在其社交平台评论称:“京东不是第一家想做外卖的公司,也可能不是最后一家”,并且直言“美团非餐饮品类的订单突破了1800万单,可以说让某些公司如鲠在喉,如芒刺背”,随后京东高管将王莆中的评论发给了刘强东,刘强东表示:不要打口水战,不能产生社会价值。 4月15日,美团闪购在其社交平台发布宣传视频,宣布美团闪购正式上线。在视频中出现带有红色背景小狗图片,同时还搭配“您的东东再等等”的字样,被质疑是在内含京东。 同日京东回应,“不打口水战,但坚持说实话”,并表示将再招收5万名全职外卖骑手,承担其全部的五险一金费用,还称“今日是京东外卖订单量突破500万的日子,GMV比‘幽灵外卖’的1000万还大”。 PChome认为,美团和京东这次在互联网上的“隔空争战”将会是一场持久战,比拼的不仅是时间,资本还有人力和人心。 1、美团闪购占先机,京东外卖寻突破 那么美团闪购的上线真的是对京东踏足外卖领域的反击吗? 据了解,美团闪购最早在2018年于美团内部正式上线,据知情人士向媒体爆料,美团闪购作为独立品牌的发布是经过长期内部筹备的战略举措,选择此时推出是因为用户需求和攻击两端均取得显著进展。 此外,该人员还进一步透露,自去年以来,平台数据显示,用户对闪购服务的粘性和依赖度呈显著上升趋势。据2024年美团财报显示,美团继续围绕“零售+科技”战略,持续加大对中国消费市场及科技研发的投入,研发投入达211亿元。 截止2024年末,美团闪购已和5600家大型连锁零售商,41万本地小商户以及超570家品牌商达成合作,其中2024年第二季度即时配送订单数达62亿单,同比增长14.2%;第三季度订单总量71亿,同比增长14.5%,这样来看确实是呈现上升趋势。 而早在2022年时任京东零售CEO辛利军在接受外媒采访时就表示,京东已考虑进军外卖业务,也一直在筹备,直到今年二月份,京东外卖正式启动“品质堂食餐饮商家”招募,首次对外承认已经进军外卖市场。 单从时间上看,美团闪购的上线远远早于京东外卖,与其说是对京东外卖的反击,不如说是两个巨头抓住了对方弱势,精准出击。 据相关数据显示,京东近三年净利润实现了大幅增长,但营收增速却明显放缓。从近八年的财务数据显示,2024年度京东集团总收入同比增长6.8%,经营利润仅为3.3%。 这次京东进击外卖领域也是摆脱自身危机的一次尝试,再加上近几年外卖质量问题不断,京东一直以高品质自称。 京东集团SEC副主席、京东集团CEO许冉直言,京东最重要的目的是解决行业痛点、满足用户需求,“稍微展开讲,我们看到了比如食品安全的隐患、商家反映佣金过高、骑手基本没有社会保障。京东有意愿也有能力去来解决这些问题”。 2、从京东到家到美团闪购,即时零售为什么这么火? 美团闪购的推出是和即时零售的市场红利脱不开的。讲到这里就不得不先提一下即时零售,许多人可能并不了解即时零售是什么? 即时零售不是新事物,提到京东到家,盒马鲜生,小象超市等大家肯定会有些印象,他们都属于即时零售的代表平台。 即时零售是一种依托线上平台,本地实体仓储/门店,通过高效物流配送(一般指30分钟-2小时内)将商品送达消费者的零售模式,核心是“线上下单,线下极速达”。拆开来看,速度快+品类丰富,即时零售中的商品不仅包括零食,医药,还有数码家电,各个领域的商品应有尽有。 正是因为有这样快的配送速度和能够满足个性化需要的商品,即时零售才才深受大众喜爱,才有如此大的市场潜力。即时零售有点类似于淘宝等网店,具有丰富的商品可供选择,但是它具有淘宝等没有的配送速度。 相关工商部发布有关《即时零售行业发展报告》(2024)数据显示,2023年即时零售规模达6500亿元,未来,将会继续保持持续增长态势,预计2030年将超过2万亿元。 图源: 《即时零售消费电子行业白皮书》P22 据《即时零售消费电子行业白皮书》显示,过去3年,消费电子品类在即时零售市场获得了高速增长,预计2021—2026年,年均复合增长率达68.5%,2026年即时零售消费电子行业规模将超千亿。 那么,在2025年美团推出闪购也不难猜测出美团的野心。即时零售市场蕴含的潜力巨大,美团想深入即时零售领域也情有可原。 3、美团闪购“快”制胜,京东到家“稳”守城 京东旗下的即时零售代表京东到家早在2015年就已经正式上线,且拥有多城市仓储配置,和海量商家最早入驻。 依托京东物流1400个仓库与“小时购”系统,实现从品牌商库存到消费者的数字化直连,在这种模式下,京东到家的鲜食损耗率优于美团。 此外,京东到家在母婴、个护、进口商品等高客单价品类占据优势,具有品牌直供的品控优势,且与苹果,华为等品牌合作推出“线上线下同款同价”服务,有品质有保障,售后能力强。 美团有什么优势来挑战最早就在即时零售市场的京东呢? 首先是运力方面,美团拥有日均百万级骑手和智能调度系统实现28分钟平均配送时长,即使是在恶劣天气下,准时率仍保持在92%以上。 美团利用动态定价算法,可以根据天气,时段,运力等变量实时调整配送费,确保在高峰时段仍然可以保持运力充足,其智能分单系统每秒处理百万级数据,动态匹配商家备货时间,骑手位置,交通路况等32个维度。 此外还采用“蜂鸟+美团”双平台运力池调配,单量承载能力提升40%,即使是在县城,美团仍然可以维持1小时送达。然而在这方面,京东到家在三四线城市的覆盖率不足60%。相关数据显示,美团闪购在县域市场的订单量同比增长54%,通过闪电仓模式将即时零售渗透到2500个市县。 其次是在供应链方面,美团闪购通过3万个闪电仓构建起城市网,每个闪电仓覆盖半径3公里,库存单位(SKU)达6000-10000个,能够实现高频商品的前置化存储,相比之下,京东到家依赖商超门店发货,SKU受限。 此外,闪电仓通过loT设备实时监控库存,缺货预警准确率达98.7%,还利用热力图分析优化爆款商品位置,拣货效率提升40%。 而京东到家谁能够调用京东物流的1400个仓库,但在即时零售场景下,区域大仓的响应速度远不及闪电仓的28分钟配送时效。 最后是在商家方面,美团闪购推出“3天到账+随时提现”政策,吸引超10万家门店入驻,其中包括7000家苹果授权店,800家名创优品闪电仓。 相比之下,京东到家的账期普遍为15至30天,且对中小商家的支持较弱,此外美团闪购通过牵牛花系统提供从供应链管理到订单履行的全链路数字化工具,帮助商家降低30%的运营成本。 此外,美团平台外卖用户与闪购用户的交叉销售,是的美团在本地生活领域的用户粘性提升27%,形成“餐饮+购物”的闭环生态。 京东到家若不能在末端配送和市场下沉上进行突破,恐怕很快将会被美团闪购超越。 总结:美团京东对决关键在谁能赢得骑手与消费者的心 美团和京东之间的战争将会是一场在残酷大环境下的持久之战。有竞争才会有发展,有创新,有竞争才能够不断的推动市场流动和活跃。在这样的一场持久战中,人始终是双方争战的核心。 配送离不开快递员,即使随着未来的发展配送全都成了无人机,机器人送货,但短时间内,当下不管是外卖还是即时零售,还都需要大量的人力,配送时间从原来的一个小时,到半个小时,再到现在的不到半小时,时间不断的被挤压缩短,如何保障快递员既安全又准时,既能够获得客观的收入又能保障自身权益,这都是不管是京东还是美团要好好思考的问题,而不是一味地打速度战。 其次市场的核心始终都是消费者,谁能在市场站稳脚跟,关键看谁能够看到并抓住消费者真正对商品品质以及其他方面的诉求,将企业真正做到消费者的心里去, 谁或许才能分的一块即时零售市场的大蛋糕。
哥伦比亚大学两位退学生打造“AI 面试作弊神器”,获3800万元融资
IT之家 4 月 22 日消息,据外媒 TechCrunch 报道,当地时间上周日,年仅 21 岁的 Chungin “Roy” Lee 宣布,其初创企业 Cluely 完成 530 万美元(IT之家注:现汇率约合 3867.4 万元人民币)种子轮融资,投资方包括 Abstract Ventures 和 Susa Ventures。这家位于旧金山的公司主打一款 AI 工具,号称可让用户“在所有场景中作弊”。 Cluely 的创立源于 Lee 在社交平台 X 上发布的一则热帖。他透露,因与联合创始人共同开发出一款用于帮助软件工程师在面试中作弊的工具,两人被哥伦比亚大学停学。 这款名为 Interview Coder 的工具,现已被整合为 Cluely 产品的一部分。它能帮助用户在考试、销售电话、求职面试等场景中使用 AI“作弊”—— 其核心是一种隐藏式浏览器窗口,不会被面试官或考官察觉。 Lee 现为 Cluely 首席执行官。他在接受采访时表示,这款 AI 工具在本月初的年度经常性收入(ARR)已突破 300 万美元(现汇率约合 2189.1 万元人民币)。 联合创始人 Neel Shanmugam 同样是 21 岁,也曾是哥伦比亚大学学生,现任 Cluely 首席运营官,过去也曾因参与该工具的开发面临校方纪律处分。据哥大学生报上周报道,两人目前均已从学校退学。校方以保护学生隐私为由,拒绝就此置评。 Cluely 起初只是一个帮助程序员“攻克” LeetCode 平台上编程题的工具。这类题目在部分程序员群体中(尤其是两位创始人)被视为老旧、形式主义,甚至是时间浪费。 Lee 坦言,他正是靠这款 AI 工具成功获得亚马逊的实习机会。亚马逊拒绝就 Lee 本人的情况作出回应,但强调公司明确要求面试者不得使用任何未经授权的工具。
小米、华为、苹果 OV,到底在手机拍照上争什么?
2011 年,胶片巨头柯达传出破产的消息,传统影像的脚步声在身后渐行渐远,逐渐淹没在时代洪流中。 另一边,为发烧而生的小米第一代在发布后迅速爆火,原本以运营商定制机主导的市场生态迅速动摇,国产手机厂家如春笋般涌现,早早为移动影像时代的来临埋下伏笔。 此后十年,智能手机野蛮生长,在芯片、屏幕等硬件配置上激烈角逐,在全面屏、伸缩摄像头等形态创新中不断演进,最终迈入第三个竞争周期——影像之争。 这个阶段,不再有早期市场的波澜壮阔,也不似形态竞争的百花齐放,如果说前两个时期是大开大合的过招,那么影像时期,则更显得精雕细琢,厂家依赖着传统影像野蛮生长的同时,也在小心翼翼地探索着独属于移动影像的道路。 站在 2025 年的时间节点回望,前两个竞争周期在较量中,已逐步收敛出趋于统一的答案。 那么,已经鏖战多年的移动影像,又走出了怎样的轨迹? 认知建立,百家争鸣 影像竞争的伊始,厂商们直面一个哲学级难题:什么是好照片? 或者说,什么是用户需要的照片? 芯片、内存、屏幕,都可以量化为参数与跑分数字,但影像这个东西和艺术沾了点边,就变得飘渺了一些——光学技术是客观的,参数摆在那里,用户一眼便知高下,但审美调校,却是一门见仁见智的艺术。 有人偏爱浓烈吸睛,有人钟情淡雅耐看,众口难调,哪种影像更能打动用户,谁也无法定论,广大的手机用户就像某些甲方,在方案做出来之前,很难意识到自己真正想要的是什么。 ▲ 相机 app 好做,但按下快门以后的处理,很难把握 面对这种不确定性,厂商选先后与已经经过残酷市场验证的传统影像厂商合作,塑造各自独特的影像认知,打造自己的品牌形象。 在这个过程里,认知的差异推动了技术演进与审美取向的分化,走出了不同的道路,最终体现在产品上,成为各家影像体系的核心标识,获得了一些教训,也得到了一些启发,最终组成了移动影像之争的上半场。 小米 2020 年,小米正式推出 Ultra 机型,确立了大底主摄+超长焦的方案,在 DXOMARK 评分上大幅提升,正式跻身影像的第一梯队。 在两年的打磨之后,小米与徕卡联手推出 12 S Ultra ,将徕卡的色彩认知融入「徕卡经典」和「徕卡生动」两种风格,小米正式成为德味的移动代言人。 不过,想要建立摄影认知和打造品牌,色彩仅是其中一环。 从街拍模式、徕卡定制界面到一年一度的影像大赛,小米系统性地将「人文摄影」基因移植到移动端,自 12S Ultra 延续至今的徕卡水印,更成为强化品牌认知的重要标识。 这些举措带来了显著商业回报:12S Ultra 首销月销量突破 120 万台,较前代增长 37%,成为小米首款 600 美元以上价位月销百万机型。 此后一年间,小米在 600-800 美元价位市场份额从 8.3% 跃升至 14.1%,迈出了走向高端的第一步。 今年早些时候,小米发布了 15 Ultra,打响了 2025 年影像旗舰的第一枪。 这部手机延续了一英寸大底主摄的配置,在原有影像阵容基础上进一步升级了超长焦镜头的规格,不仅提升了整体影像表现力,也通过影像手柄和与之搭配的街拍模式继续强化人文摄影这一主题,同时,它将关注点回归于光学质感本身,重新强调影像的物理属性与真实观感。 从某种意义上说,小米在影像认知上的建立,也影响了它在影像产品上的宣发思路。虽然同样具备 AI 修图、算法辅助等现代功能,但相比之下,小米显得更执着于那些来自影像历史的文化语境:无论是大师们的影调风格、经典的色彩偏好,还是反复被验证的焦段选择,几乎都能在摄影史中找到它的根系。 而小米真正做的,是用现代技术与工程能力将这些影像宝藏重新激活,并极大地降低了它们的使用门槛——经典不再只是属于少数人的专业语法,而成为每个人轻松按下快门、即时拥有的生活语言。 雷军曾描绘过小米的科技理念: 选择对人类文明有长期价值的技术领域,长期持续投入。 如果将这句有些笼统理念聚焦在影像上,那么影像最本质和朴实的价值,无疑在于记录,镜头里的个体、社会与时代,就是个人的价值、社会的价值与时代的价值。 记录的过程与结果,便是人文。 让用户更好地记录想记录的一切,这是小米在影像竞争上半场的核心命题,也是品牌高端化的关键驱动力。 无论是色彩风格,还是街拍模式,一切,皆为这一目标服务。 OPPO 作为跟随人类首个登上月球的相机品牌,哈苏在进入数码时代后,依然凭借胶片时代的余威和标志性的「自然色彩解决方案」,成为数码中画幅相机的标杆之一。 而 OPPO 与哈苏的合作,也始于色彩。 在 2022 年发布的 Find X5 系列中,OPPO 首次引入哈苏影像系统。尽管受限于手机传感器的物理条件,双方仍然努力对传感器进行色彩校准,在画面中尽可能复现哈苏风格的色彩表现,并将专业相机中的色温控制逻辑搬进手机,让用户在按下快门的瞬间,就能得到更贴近人眼感受的色彩。 后来,OPPO 又把中画幅相机所独有的那种「自然光学影调」继续引入手机,在 Find X7 Ultra 上首次实现了对「中间调」的重点调校,让照片在风格上更接近中画幅的层次感与细腻度。 Find X7 Ultra 也因此被不少人视为 OPPO 与哈苏合作三年以来的阶段性总结。不管是色彩还原的准确度,还是中间调的过渡质感,又或是大师模式下的多种专业风格选择,都能感受到它在影像表达上的全面进化。 直到今天,凭借「听劝」与不间断地更新,这台手机的影像仍受到好评,是我们编辑部中最抢手的影像手机之一。 在影像领域,OPPO 与哈苏的合作关系似乎更像是志同道合的朋友,而非紧密绑定的伙伴。 在合作的框架中保留自主思考的空间,这种松弛带来了更多可能性,三年的合作已然走向成熟,集大成之作 Find X7 Ultra 问世之后,OPPO 开始试图走出一条属于自己的影像之路。 在这条路径上,OPPO 一边学习,一边思考,最终将自己的影像认知浓缩为一句话:轻松捕捉生活之美。 这句话背后,其实是一个中画幅思维的延续:复杂的计算、色彩还原、镜头调教,全都藏在快门背后,用户只需要做一件事——按下快门,记录当下。 我们看到 OPPO 在 Find X8 上加入了三款胶片模拟滤镜,提供更多元的审美选择;也看到在 Find X8 Ultra 上推出了丹霞原彩镜头,为复杂光源下的夜景人像提供更坚实的基础,将影像认知真正落到了场景与感受之中,而不只是停留在参数与口号里。 从一开始借力哈苏,逐步建立自己的影像认知,再到聚焦人像风格,推出 LOMO 凝光影像品牌——OPPO 的影像探索,已经走上了属于它自己的路。 vivo 提及漫长摄影史,蔡司是一个无法回避的名字,在胶片时代,它以一家之力为包括康泰时、潘太康、徕卡、哈苏、禄来等相机名厂提供高性能的镜头设计,手握世界三大镀膜之一的 T* 镀膜,还横跨显微镜、望远镜、测绘仪器等领域定义行业标准。 这种跨越百年的技术积淀,为蔡司赋予了「光学教科书」的权威地位。 而 vivo 与蔡司一拍即合,成为国产阵营中唯一与殿堂级光学巨头深度绑定的厂商。 根据爱范儿在去年年底探访 vivo 总部,并与其执行副总裁胡柏山的对话中,vivo 表示了自己对影像的看法: 我们自己所定位的最终目标是取代绝大部分的单反相机的场景,我说的是场景。 也许是因为目的过于明确和具象,与别家借助传统摄影厂商搞色彩、培养文化、建立影像认知的路子不同,vivo 选择了一条更具工程思维与技术导向的路径,直面移动影像的结构性问题。 具体而言,双方的合作成果集中体现在三大维度: 光学技术移植 :将蔡司经典的 Biotar 旋涡虚化、Planar 高分辨率等镜头特性融入手机镜头设计,例如 vivo X 系列首创的蔡司人像模式,就是通过算法模拟蔡司经典镜头的光学特性,赋予手机人像摄影独特的「奶油焦外」质感; 镀膜工艺突破 :搭载蔡司 T* 镀膜技术,显著降低大光比场景下的眩光与紫边问题; 色彩科学体系 :基于蔡司自然色彩科学,建立覆盖从传感器到显示的全链路色彩管理系统,确保从拍摄到输出的色彩一致性,避免过度算法修饰的失真感。 在合作过程中,vivo 巧妙地利用蔡司的光学技术,巧妙地避免了陷入手机硬件堆砌的宣传口径中,转而建立了光学技术、专业成像的影像认知,打造了独特的品牌形象。 这一轮影像竞争,vivo 的表现不可谓不亮眼,根据 Canalys 的最新报告,随着影像旗舰的持续迭代,2024 年的第二季度,vivo 全球高端手机出货量同比增长 39%。 再加上适当的技术下放,vivo 凭借 4930 万台的出货量及 17% 的市场份额,成功登顶 2024 年中国大陆智能手机全年出货量榜单。 就在几天前,vivo 发布了 X200 Ultra,继续在影像上搞事情。这一次,他们把主摄从常见的 23mm 拉到了 35mm,配合画质更强的超广角与长焦,打造出了一个三颗镜头素质趋于一致的「影像大三元」组合。 在螺蛳壳里做道场,vivo 从光学焦段上做功课,尝试突破移动影像的既有领域,虽然这一步的方向还有待考察,但在逐渐陷入停滞的手机影像中,这样的探索本身已具备一定的积极意义。 从「身边统计学」角度来看,vivo 的成像风格在多个用户群体中展现出较强的接受度,技术理性与大众审美之间,它找到了一个足够稳的位置。 而 vivo 的野心远不止于此。2024 年,双方签署新一轮战略合作协议,将合作领域从手机影像拓展至 AR/VR 光学方案研发。这一布局直指未来移动终端的形态革命:蔡司在自由曲面镜片、空间光学模组等领域的技术储备,或将助力vivo在XR设备的光学显示与交互体验上抢占先机。 华为 如果要为国产智能手机的影像之争划定一个时间节点,我更愿意把起点放在 2016 年,华为 P9 的发布。 这一年,华为 P9 创下了两个「第一」——它是华为首次搭载双摄像头的机型,也是国产手机厂商首次与传统影像品牌深度合作的产品,正式拉开了移动影像进化的序幕。 上市一年时间,华为 P9 拿下 1200 万台全球销量的亮眼佳绩,再加上凭借彩色+黑白双摄方案带来的细腻色彩过渡和明暗影调,配以徕卡对色彩的悉心调教,时至今日,P9 依旧是社交媒体上常被提及的德味代表。 叫好又叫座,是联名合作为国产厂商带来的第一个甜头。 华为的特殊之处不止于此,2022 年,国产智能手机厂商开始全面深入合作时,华为踩下一脚急刹车,毅然决然与徕卡分手,取而代之的是随着 Mate 50 系列一起推出的自有影像品牌 XMAGE。 如果说影像合作是站在影像历史的巨人肩膀上向前眺望,那华为是第一个从肩上走下来,自己做巨人的角色。 影像品牌,是一个全面的东西,但另起炉灶,并不意味着必须独立打造所有工具。 英雄所见略同,与徕卡的「现任」小米一样,华为也用一系列的战略来铸造 XMAGE 影像品牌,从可变光圈、伸缩摄像头,再到去年年底的 Mate 70 Pro 系列上那颗红枫原色影像系统,华为一边探索更多的影像技术,一边靠 XMAGE 影像大赛、用户社群,逐步构建起自己的影像认知体系。 在终点到来之前,胜负尚未盖棺定论,但有一点毋庸置疑——华为,的确是那个敢为人先的探路者。 自 2016 年华为 P9 推出以来,手机影像竞争已历经九年;而从国产智能手机厂商全面与传统影像品牌合作算起,这场竞赛也已走过四年。 哪怕智能手机的发展速度一直在下降,但根据 Counterpoint Research 发布的数据,在全面合作开始以后,2022 年三季度 600 美元以上的智能手机整体份额达到 22.4%,这是连续九个月增长速度超过智能手机市场的整体增长速度。 将影像作为高端产品的立足点,并展开联名合作的战略,得到了市场的反馈。 苹果 在移动影像的讨论中,苹果是一个避不开的话题。 如果说国产厂商在上半场的竞争中卷生卷死,那 iPhone 扮演的角色,就是龟兔赛跑中的兔子。 我们先说说它面对风格化的挑战。 iPhone 是一个非常长期主义的厂家,纵观所有主流智能手机厂商,只有它在移动影像的光学时代和计算摄影时代都保持一种稳定的成像风格,也只有它从头到尾没有合作过任何一家传统影像。(原谅我排除三星这个厂商,在中国市场上,它的遗憾退场,实在太早了些)。 这种成像风格,我称之为「白开水」。 ▲ 使用 iPhone 15 Pro 拍摄 iPhone 一直不追求浓烈色彩或戏剧化对比,而是像一杯透明玻璃杯中的水,还原肉眼所见。这种影像策略背后,是苹果一贯信奉的理念:照片,应该忠实于发生过的现实。 但当对手们纷纷建立起独立的色彩体系、风格模型、审美认知时,苹果终于在 iPhone 16 Pro 上交出了一份答卷:调色盘。 ▲ 使用 iPhone 16 Pro 拍摄 这个可视化调色盘,简化了传统调色的逻辑管线,将复杂的参数归纳为四个可调维度。 就像自动挡汽车隐藏了机械原理,却让更多人能轻松驾驶一样,苹果将计算摄影的复杂逻辑封装在滑块背后,让用户仅需拖动坐标,便能直观地获得符合个人偏好的影像风格。 技术被隐藏于视觉之后,将审美的选择权交还给摄像头背后的人,这是苹果式的「无为而治」。 理念确实聪明,轻描淡写之间,用一个简单的坐标方块,提供了无数种成像可能性,四两拨千斤,苹果拿手的就是这种设计哲学。 但从另一个角度来看,调色盘甚至不能被称为答案——它更像是把风格化的答题纸还给你,让你自己动笔涂。 苹果一如既往地克制,也一如既往地骄傲:我不选边站,因为我就是标准。 但遗憾的是,正是这种骄傲,让 iPhone 成了那只领先以后就开始呼呼大睡的兔子。 在国产影像旗舰越来越贴身、越来越强势的追赶下,小小的滑块,似乎已经无法有效回应更深层次的影像需求。 这种无为而治,更像是一种不再进攻的姿态,可是逆水行舟,不进则退,iPhone 的静态影像能力,正在一步步失去昔日的优势。 影像旗舰的竞争,从未像今天这样清晰可辨,主观审美与计算摄影的花样百出,依旧无法掩盖物理硬件的客观差距,在这场军备竞赛中,谁领先尚无定论,但谁稍有短板,就很可能失去逐鹿中原的资格。 2025 年,是手机影像的拐点 几年前,各家手机厂商的发布会重点还围绕着「跑个分」,影像部分不过是 DXOMARK 排行榜的宣传专栏;如今,iPhone 在影像硬件上的领先地位已不复存在,国产手机正在成为移动影像,特别是静态影像创新的主导者,影像升级已成发布会的核心议题,占据近一小时篇幅。 不过弹指之间,时代变了。 但喧嚣之下,真正的变革迟迟未至。 合作的热度退去,品牌与风格调校逐步固化,用户的审美阵营初步划定。昔日的影像标杆 iPhone,也逐渐被超越。 一英寸大底、多焦段覆盖、计算摄影加持,画质已比肩卡片机,夜景直出不再稀奇。 看似卷无可卷,技已至巅,行业进入表面的「稳定期」——竞争不再是技术突破,而是划地为营,各守一方审美领地。 这样的平静,往往是风暴前的沉默。 二十世纪初,世界表面风平浪静,但刚步入工业化的列强已在暗中较劲,掰着手指盘算未来的版图。 工业革命席卷全球,有些国家抢先迈出两步,有些则稍显迟缓,但当时世界 90% 的土地已被列强瓜分,走在前列的国家开始质疑现有秩序——经济、资源、市场,是否该重新分配? 那是欧洲民众感到闷热潮湿的一个夏天,萨拉热窝的一声枪响,世界第一次世界大战就此爆发。 太阳底下并无新事,每一次产业秩序的重构,往往都始于表面风平浪静之时,移动影像也不例外。 当审美不再是唯一的差异化手段,风格调校逐步定型,参数堆砌渐趋饱和,影像竞争的上半场已然接近尾声。 所有厂商都在面对一个同样的问题:手机影像的下一枪,会在哪里打响? 我们不妨换个角度来看,大底的代价是厚重的影像模组与受限的 23mm 主摄,计算摄影虽强化影像质量,却难免带来影调不自然的痕迹,多镜头系统的一致性与切换稳定性仍是顽疾…… 硬件虽强,却不像想象中那么美满,这仍是一场「补短板」的游戏,不断在妥协中寻找平衡点。 内燃机时代,发动机的动力性能和燃油效率接近物理极限,车企开始面临「再提升 5% 没有实际意义」的问题,于是竞争焦点随之从发动机转向三电系统(电池、电机、电控)与智能驾驶,全面开启电动化与智能化的竞争赛道。 当技术接近物理极限或成本收益失衡时,单点突破的空间被压缩,想要在有限的物理条件下,实现更好的使用体验,竞争的焦点势必转向系统化比拼,影像领域也不例外。 谁能利用好硬件的技术积累,减少移动影像的妥协、谁能在焦段布局、计算摄影优化、色彩风格一致性等方面找到最优解、谁能构建一个足够稳定、无缝衔接的系统性闭环,谁就能突围。 届时,厂商之间的差距,可能会呈指数级拉开。 就像萨拉热窝的那声枪响,其导火索的意义往往只在事后才被赋予,时间的重要节点,总在回望时才清晰可辨。 但我隐隐觉得,我们或许正站在移动影像竞争的关键拐点上。 这个拐点的左侧,是红枫原色、丹霞原彩等对色彩与光线表达的重新定义;右侧,是焦段布局与模组结构的系统性重构,正悄然展开。 这个拐点的背后,是影像竞争上半场的平静落幕,这个拐点的面前,可能是下半场全面对抗的汹涌波涛。
折叠屏鼻祖柔宇破产 明星产品遭骨折价甩卖!75元一台不及上市时零头
快科技4月22日消息,曾经备受瞩目的柔宇科技,如今已经走向破产,其明星产品柔宇Rowrite智能手写板也遭遇了“骨折价”甩卖。 这款曾经售价799元的智能手写板,如今在闲鱼上的全新未拆封产品,售价仅为75元左右,不及上市时的零头。 2024年11月,深圳市中级人民法院裁定宣告柔宇科技及其关联公司正式破产,破产后柔宇科技位于深圳市龙岗区的柔宇国际柔性显示产业园被惠科股份接手。 柔宇智能手写板曾是柔宇科技的明星产品之一,由创始人刘自鸿在2017年推出,当时被认为是柔宇产品矩阵中,仅次于柔派手机的消费级产品。 该产品基于柔宇科技独创的柔性电子传感技术,支持2048级压感,可以记录手写笔迹,充当美工的绘图板,也可以一键生成可编辑文档,用于会议记录。 随着企业破产,其配套的“柔记APP”也停止服务,有不少用户表示,明明是个手写板,非要花心思阉割PC直连功能,搞个APP憋着割韭菜,现在可好了,直接变废铁了。 不过有闲鱼卖家表示,如果购买了这款产品,他们会提供一个二次开发的离线版APP。 其实前一段时间这款手写板在闲鱼的价格还在35元左右,随着消息的发酵,价格才涨到了现在的75元左右。
奔驰发布 MPV 概念车 VISION V,内饰科幻,前脸长了8 块腹肌
短短两三年时间,MPV 市场就从汽车行业的兵家不争之地,变成了兵家必争之地,以往丰田埃尔法高端,别克 GL8 和丰田赛那中端,往下是广汽传祺 M8 的大格局划分已经变成了群雄逐鹿的现状,后续出现了腾势 D9 和小鹏 X9 等等国产爆品,加上理想 Mega,魏牌高山,岚图梦想家,极氪 009,比亚迪夏等等选手。 已经有奔驰 V 级和奔驰威霆的奔驰,在 MPV 市场也有一席之地,不过眼见 MPV 市场如此热闹,奔驰自然也没闲着,于是乎,在上海车展前夕,奔驰 MPV 概念车 VISION V 就进行了全球首秀,以及前不久在海外发布的全新 CLA 也以北京奔驰国产的长轴距版 CLA L 身份亮相。 VISION V,奔驰进军豪华电动 MPV 市场的前哨战 先来看奔驰 MPV 概念车 VISION V,虽然说是概念车,但是奔驰表示,量产版会在明年问世,并且设计概念不会很大,所以这个概念车的参考价值还是比较大的。 奔驰 VISION V 概念车基于 VAN.EA 纯电架构平台打造,因而作为一款纯电车型,外观上自然和现在的奔驰 V 级区分非常大,在保留奔驰特色的同时,VISION V 概念车自然也是电味儿十足,比如说发光的奔驰立标,封闭式前脸虽然化用了 S 级的盾形格栅,但它也是会发光的。 并且因为 MPV 前脸更大,所以这个盾形格栅也更圆润,加上左右各三根镀铬条的区隔,这个前脸看起来就有点像 8 块腹肌。 盾形格栅上方也有一条贯穿式装饰灯带,再次表明它的纯电身份,这个设计和新发布的双平台车型 CLA 差不太多。 车尾的设计也很有想法,围绕一整块巨大玻璃面板的环形尾灯勾勒出车尾轮廓,简洁,且有未来感。 虽然外观多少有些未来感了,但奔驰 VISION V 概念车真正具有未来感的地方在内饰上。 奔驰 VISION V 概念车采用了 4 座布局,一款 MPV 采用 4 座布局的意思再明白不过了:定位奢华和舒适。 车门滑开,踏板伸出,照明灯点亮,照亮脚下,贵宾上车,入眼处的材质有木饰、白色 Nappa 皮革和白色丝绸,以及明明无形但最具有存在感的透明玻璃材质,大面积的玻璃组件嵌在抛光铝框架之中,形成了左右两侧的玻璃橱柜。 更显奢华的是奔驰 VISION V 概念车的扬声器配置:一共 42 个柏林之声扬声器组成了支持杜比全景声的环绕音响系统,其中有个 4 个扬声器被玻璃罩包裹,安装在了车身延伸出来的立柱之上,这个设计足够有辨识度,算是突出了音响系统的存在感。 奔驰表示,奔驰 VISION V 概念车空间设计理念是「私享贵宾厅」,所以座椅设计模拟了全平躺飞机头等舱的布局,后座座椅由一系列灵活的管状坐垫组成,可以完全平放变成一张床。座椅中央扶手处集成了触控面板,可以控制车载信息娱乐系统,内有一张折叠桌,这些当然都是奢华 MPV 的基本修养。 更显优雅和尊贵的是,小桌子可以化身国际象棋棋盘,前面说到的透明橱柜就装着玻璃国际象棋棋子。 和老派的国际象棋相对应的,是司机侧和乘客侧之间的玻璃隔断门,这个玻璃门可以一键雾化,隔绝前后视线,同时玻璃门区域配备了一个 65 英寸可升降的投影屏,隐藏在车顶内衬和地板上的七台投影设备,加上不透明的侧窗也可以作为额外的投影屏,于是乎,这些投影设备和投影屏就可以形成环绕状的观看区域,不是 VR,胜似 VR。 为了利用这个环绕投影系统,奔驰给后排乘客做了 2 个看起来有点奇怪的功能: 1,信息娱乐系统有多种模式,比如放松和工作,还有游戏,游戏模式,后排乘客可以用游戏手柄驾驶车辆玩赛车游戏,对,坐在车里「开车」。 2,「探索」模式下,车内投影可以显示车外环境,虽然窗关上了,然后外面的世界不隔绝。 剩下值得一说的还有灯,奥迪是车外灯的灯厂,那么奔驰就是车内灯的灯厂,奔驰对于 VISON V 概念车车内氛围灯和吸顶灯的投入也不吝啬,再配合大量的玻璃材质,可以说 VISON V 概念车内饰灯效效果足够让人迷糊。 因为是概念车,奔驰也没有聊具体的参数,比如车长轴距动力续航这些,但是这也不是坐在后排乘客会考虑的事情。 最后奔驰宣布,未来基于 VAN.EA 纯电架构平台打造的豪华 MPV 将启用全新命名:梅赛德斯-奔驰 VLS 和梅赛德斯-奔驰 VLE,2026 年见,看 S 和 E 的定位就知道不会便宜。 CLA L,加长轴距,加强本地化 另外再说一下,去年年底,奔驰宣布了三大电动平台,分别是针对高端 MPV 领域的 VAN.EA 纯电架构平台,针对高性能纯电领域的 AMG.EA 纯电架构平台,和油电双行的 MMA 平台。 MMA 首款量产车型就是全新 CLA,不过按照国内更青睐于长轴距车型的惯例,娇小的全新 CLA 肯定只有真爱粉才会买,所以奔驰这次全球首发的是 CLA L,CLA 的长轴距版,外观和内饰上和 CLA 没有什么区别,主要是车身尺寸的变化,奔驰 CLA L 车身尺寸为 4763/1856/1469mm,轴距 2830mm,相较于标准轴距车型,轴距增加了 40mm,后排乘坐空间更宽裕。作为参考,CLA 标轴版本长宽高分别为 4722/1880/1468mm,轴距为 2790mm。 除了轴距增加外,奔驰还着重强调了这款车的 3 大特点: 迄今为止最智能的奔驰:搭载奔驰「最强大脑」——自研 MB.OS 全新架构;搭载全场景智能辅助驾驶;搭载豆包 AI 大语言模型,更直观、更人性,更善解人意;同级最大的 14 英寸副驾娱乐屏,为副驾乘客提供专属的数字娱乐体验。 标杆级别能效表现:超长续航(CLTC 工况 866 公里)、超低能耗(10.9 千瓦时/百公里)、超快充电(800V 架构,10 分钟补充 370 公里续航-CLTC 工况)。日常通勤,一次充电跑两周;周末旅行,一次充电,可以往返上海南京。 满足梅赛德斯-奔驰最高安全标准:获得中国电动汽车火灾安全指数五星认证;热稳定性满足 2026 年生效的新国标的要求;标配 11 个安全气囊,包括同级独有的前排中央气囊;上市前进行了 180 次实车碰撞测试。 看得出来,奔驰在 CLA L 上的投入和期望都不小,就指望着它甩掉「杂牌电车」的帽子,从产品力来说,它放在一种国产电车里面也拿得出手,当然,唯一的问题是,售价多少?
详解具身智能算力需求,英特尔推大小脑融合方案
作者 | ZeR0 编辑 | 漠影 智东西4月22日报道,近日,在2025英特尔具身智能解决方案推介会上,英特尔正式发布其具身智能大小脑融合方案(下称具身智能方案)。 该方案基于英特尔酷睿Ultra处理器以及全新的具身智能软件开发套件和AI加速框架打造,凭借创新性的模块化设计,能够兼顾操作精度和智能泛化能力,且性价比出色,可满足不同领域需求。 现在具身智能产品处于小批量阶段,不同应用场景对IO接口、传感器、算力有不同的需求。如何打造能够快速适配不同需求的灵活计算平台,是一个关键挑战。 许多具身智能大小脑方案采用双系统来实现。而英特尔推出的具身智能应用解决方案采用一体化单系统设计,能够以较低的总成本,实现高效灵活的工作负载分配。 硬件上,该方案搭配英特尔酷睿Ultra CPU核心板。英特尔酷睿Ultra 200H CPU可提供90 TOPS性能,下一代Panther Lake算力可达到180 TOPS。 其硬件方案采用模块化设计,可针对不同具身智能应用场景进行灵活搭配,包括支持MxM嵌入式显卡插槽,可扩展接入英特尔锐炫独立显卡;摄像头转接板,接入多路MIPI/GMSL嵌入式摄像头,扩展感知能力;独立的IO载板,扩展各类接口。 软件上,该具身智能方案提供全栈式软件平台,包括底层的BSP、算法模型、加速库、参考示例等,附文档和开发教程;还提供实时调优BKC、RT Linux内核和优化的EtherCAT IgH主站协议栈示例,以更好支持实时运动控制。 算法方面,英特尔在CPU对传统运动规划和视觉算法进行优化,通过iGPU和NPU加速基于深度学习、大模型的感知和操作。 还有各种软件工具,包括实时性能调优工具和Debug工具,有助于降低学习成本和开发部署成本。 英特尔可扩展产品组合丰富,提供了从入门级到1000TOPS以上的AI算力,以及从低到高的CPU算力产品组合,并在开发工具等方面实现了统一,可用于构建覆盖各种类型的具身智能解决方案。 例如酷睿、凌动非常适合做本体运控小脑。云端或边缘侧大脑可接入酷睿、至强、锐炫独立显卡。无论是传统机器人智能化改造,还是人形机器人大小脑融合,或是将传统运控小脑升级成AI运控小脑,都可以利用酷睿UItra实现。 浙江人形机器人创新中心已基于英特尔酷睿处理器,打造出“领航者2号NAVIAI”人形机器人,实现了可泛化高精准视觉伺服、多行为联合学习的长序列行为规划、视力融合的操作行为学习等技术突破,能够使其在工业场景中执行复杂任务,也可以在服务场景中完成人机交互和辅助等任务。 一、具身智能需要单系统方案:低成本、低延迟、低功耗 随着具身智能从人工设计算法逐渐转向到数据驱动的模型,具身智能计算负载需求的发展趋势,也从以CPU为主计算发展到CPU、GPU并重,乃至需要云端算力的辅助。在不同场景、不同应用需求下,不同架构各具优势和性价比。 据英特尔技术专家介绍,目前主流计算架构是大小脑融合架构。小脑部分以x86为主,包括英特尔12、13代酷睿,还有凌动N97、N305,用小板子实现功耗和尺寸的优化;大脑部分的主流方案以其他厂商的产品为主。两个系统通过网络进行通信,最终实现双系统方案。 由于市面上没有单系统能够同时提供CPU和GPU算力,因此很多时候不得不采用双系统方案来解决现有问题。这样的架构带来很多设计挑战,带来研发、维护等成本的提升,对整个计算平台的功耗、尺寸、结构优化都有很大限制,无法像单系统那样进一步做极致优化。 另外,两个系统通过网络进行通信,无论是双系统时间同步,还是之间的信息交互,都会有带宽限制和延迟。 因此业界需要采用更好的单系统方案解决这些问题。 英特尔酷睿Ultra产品线把CPU、GPU、NPU封装在一个SoC里,让低功耗SoC可提供强劲的CPU算力、AI算力,满足了具身智能在绝大多数场景需求。 不同系统之间通过共享内存来通信,无论是网络通信还是CPU内存和独显的显存通信,共享内存方式会更稳定、更快速。 此外,单系统方案可帮助显著降低整体计算成本。在能效方面,酷睿UItra支持28W-65W,以便用户根据实际需求匹配功率实现更好的功效和续航。单系统配合ODM设计也可以实现更小巧的尺寸,以及更灵活的接口。 二、以大小脑融合为亮点,处理具身智能复杂任务 英特尔具身智能方案以大小脑融合为亮点,能够使感知、交互、任务规划和运动控制在统一的系统中实现高效整合。 作为其中的算力中枢,英特尔酷睿Ultra处理器通过CPU 、集成的英特尔锐炫GPU与NPU协同运行,以高性能异构算力和高精度实时性能,支持具身智能的多样化负载稳定运行,同时也大幅提升具身智能系统的整体效率和响应能力。 其中,通过CPU可以支持具身智能方案进行复杂的运动控制,集成的英特尔锐炫GPU可处理具身智能处理环境感知、任务识别、任务规划、大语言模型(LLM)、视觉语言模型(VLM)和端到端模型等复杂任务,NPU则承载语音识别、实时视觉处理、传感器数据分析等需长时间运行的AI任务。 据英特尔中国网络与边缘技术与产品总监王景佳分享,酷睿Ultra系列处理器的架构符合当前异构计算的趋势,不仅适用于AI PC消费类场景,而且为具身智能场景提供了理想的解决方案。 英特尔也在显卡市场持续投入。王景佳谈道,去年底发布的英特尔锐炫B系列显卡在市场上广受好评,对于具身智能场景而言,它可能是性价比或性能功耗比最佳的产品。 另据英特尔技术专家分享,酷睿Ultra处理器可持续提供强劲的x86算力,实现实时的运动控制。CPU采用大小核架构,拥有多达16个CPU核心,运行主频最高可达5.1GHz;在AI工作负载下,其实时确定性可达到20微秒抖动,为运动控制提供更好的确定性保障。 新推出的英特尔酷睿Ultra 200H系列处理器方案,总AI算力已达到90 TOPS。基于Intel 18A的下一代英特尔Panther Lake总算力将超过180 TOPS。 NPU的能耗表现尤为出色,可在2W功耗下提供13 TOPS的AI推理能力。 集成显卡GPU部分单独可达到77 TOPS的算力,支持各类视觉模型、大语言模型、端到端大模型,通过OpenVINO和IPEX-LLM,能够对传统的卷积神经网络模型和大模型进行优化。 英特尔也在集成显卡(iGPU)上进行了具身智能相关算法的测试。例如,对于机器人在物体检测中常用的YOLO v8算法,在2048×2048高分辨率下,使用FP16的网络精度进行测试,推理效率可达108 FPS。 如果使用该集成显卡运行6-9B参数规模的小尺寸大语言模型,能够达到约800毫秒的首个token生成时间,后续平均token生成时间为50-80毫秒,效率很高。 英特尔具身智能方案搭载了最新一代的英特尔锐炫B系列显卡(Battlemage)。该独立显卡采用Xe2架构核心,相较上一代产品效率提升显著,每个Xe核心的性能提升高达70%,每瓦性能也提升了50%。 英特尔在此方案中采用的是锐炫B570。该显卡具有18个Xe核心,每个Xe核心配备8个AI计算单元,总计144个AI计算单元,整体AI算力可达200+ TOPS,从而进一步扩展了AI能力。 英特尔在独立显卡上进行了大量的大语言模型推理测试。以6B-9B参数规模的大模型为例,在锐炫B系列显卡上,首个token的生成时间约为100毫秒,后续token的生成时间约为10-15毫秒,可用于具身智能应用中的人机交互、内容生成以及通过大语言模型进行动作编排。 VLA大模型通常包含三个部分:一个运行频率约为10Hz的慢思考视觉语言大模型,一个运行频率为200Hz的动作大模型,以及一个需要实时处理总线信息和模型运动控制的实时系统。2B-7B VLM大模型适合在酷睿Ultra内置的锐炫GPU上运行,NPU上则适合运行如ACT算法等。 三、提供具身智能软件开发套件,缩短评估和开发时间 同时,英特尔推出了具身智能软件开发套件,通过包括OpenVINO工具套件、英特尔oneAPI工具包、Intel Extension for PyTorch-LLM(IPEX)、英特尔工业边缘控制平台(ECI)、基于开源机器人操作系统的库、中间件和示例应用程序,使代码实现一次开发多平台部署,缩短评估和开发时间,加快客户应用程序的部署以及算法和应用的运行。 ▲英特尔具身智能软件开发套件 在软件框架和加速器的基础上,英特尔开发了一系列参考用例,例如视觉伺服、模仿学习、优化运动控制、以及基于大模型的运动规划。这些参考实践代码旨在帮助开发者更好地理解如何基于软件平台实现各种具身智能应用。 英特尔亦提供跨平台AI模型优化工具以及端到端流程加速方案,以简化方案搭建过程,加快产品上市。 该软件开发套件能够将不同类型的工作负载均匀地分配到CPU、NPU、集成显卡,甚至独立显卡上进行协同运行,从而更充分地利用整体计算资源。 例如,传统的运动规划库和MPC运动控制算法,因其软件特性,在CPU上能够获得更高的运行效率,因此可以将其调度到CPU上运行。而CNN视觉模型在iGPU或NPU上可能运行效率更高,因此可以将其调度到NPU上运行。对于需要更多AI算力的大模型,则可以将其分配到集成显卡或独立显卡上运行。通过这种方式,整个系统能够得到更高效的利用。 在使用上,英特尔具身智能软件开发套件旨在最大程度地降低用户使用成本,把SDK大部分的软件包打包,将英特尔提供的代码库添加到APT源中,然后安装Deb包、下载源码,就可以通过英特尔在线APT代码库进行下载和部署,软件包支持Ubuntu 22.04 LTS版本。 此外,用户可使用在线文档教程快速入门,获取相关信息及原文件下载。 四、与本体生态伙伴深度合作,探索具身智能全链路协同 在持续推动具身智能软硬件创新的同时,英特尔亦与本地生态伙伴展开深度合作,探索从技术研发到场景落地的全链路协同模式,构建起协同共进的产业生态格局。 其中,信步科技推出的具身智能硬件开发平台HB03,搭载英特尔酷睿Ultra 200系列处理器和英特尔锐炫B570显卡,能够提供强大且灵活的算力,并实现极强的控制实时性。 信步HB03平台通过紧凑结构、扩展接口与工业级可靠性设计,具有性能更强、尺寸更小、可靠性更高、灵活配置等优势,为具身智能“大小脑”融合构建了有力的硬件支撑。 HB03有4个显著优势: (1)更强大:采用了英特尔酷睿Ultra 200系列处理器,支持96 TOPS算力;采用了板贴内存方式,提高了可靠性,也旨在实现CPU和内存之间更高的数据带宽。96 TOPS的本体算力加上英特尔显卡,整个HB03最高支持300 TOPS算力。 (2)更紧凑:HB03有两个型号:支持显卡,算力达300 TOPS的版本,厚度为78毫米;不带显卡,本体算力为96 TOPS的版本,厚度仅为53毫米。不同型号能够适配不同尺寸、不同形态的具身机器人。 (3)更可靠:对所有对外接口都采用了加固设计,解决传统USB标准接口和RJ45水晶头在运动过程中容易脱落、线缆过粗、不易整理等问题。 (4)更灵活:采用模块化开发理念。屏幕上展示的所有接口都可以自由定制和灵活配置,帮助用户快速实现项目落地和产品销售。 HB03支持宽电压输入,最高耐压输入可达75V,可直接连接到电池模组上,无需额外配置200W的电压模块,令使用更加便捷可靠;散热方面,采用了CPU和GPU分别放置在两侧的设计,以解决热量集聚的问题,每个单元都采用了铜管和涡轮风扇散热,尽可能将热量导出。 结语:以高性价比软硬全家桶,助攻具身智能规模化、场景化应用落地 具身智能产业的快速发展,正在带动算力基础设施需求之变。英特尔具身智能方案凭借大小脑融合架构的创新,带来功耗、成本、算力的平衡,为高效构建具身智能系统提供了一个高性价比的选择。 英特尔市场营销集团副总裁、中国区OEM & ODM销售事业部总经理郭威谈道:“以人形机器人为代表的具身智能行业正迎来前所未有的发展热潮,然而,系统架构的非一致性、解决方案的泛化能力不足、场景适配的复杂性等挑战,正在制约其大规模商业化的进程。基于此,英特尔携手生态伙伴,通过大小脑融合的方式,打造更高效、更智能的解决方案,以基础通用大模型与硬件技术的协同突破,以及开放生态所带来的加速效应,推动具身智能向实践应用场景的迈进。” 未来,英特尔计划持续深化技术创新,与生态伙伴拓展其在医疗、教育、养老等关键领域的应用场景,共建开放、协同的具身智能生态体系,使具身智能真正赋能千行百业,为社会的高效运转与可持续发展提供助力。
外媒深度:机器人为什么要做成人形?
编译 | 江宇 编辑 | 漠影 机器人前瞻4月22日消息,ReadMultiplex平台发布的人形机器人综述指出,全球机器人技术正在经历重要变革,人形机器人正逐步进入高收入家庭和工业生产领域。这类机器人具备家务协助、儿童教育、老人看护等功能,同时也能缓解劳动力短缺问题,推动制造业和服务业的转型升级。 市场研究显示,人形机器人产业具有巨大发展潜力。预计到2030年,全球市场规模可能达到24万亿美元,其中家庭应用和工业应用将各占约50%的份额。这一发展趋势不仅反映了技术进步,也预示着社会生产生活方式的深刻变革。 一、为什么人形机器人是最佳选择? 我们的世界,从门把手到楼梯、从汽车仪表盘到工厂工作站,都是为人类体型、灵活性和动作设计的,这使得人形机器人相比轮式或固定臂机器人能无缝适应现有环境,无需昂贵的基础设施改造。 人形机器人凭借其独特优势脱颖而出:它们能直接融入基于人体工程学设计的环境,如椅子、桌子、梯子,操作按钮、杠杆、触摸屏,并通过双足移动穿越楼梯、狭窄空间及非结构化环境,如家庭、仓库和建筑工地。 例如,特斯拉Optimus和波士顿动力Atlas的机器人手部可使用螺丝刀、键盘、钻头等人类工具,开启门阀或处理脆弱物体,无需定制末端执行器。其拟人化设计,如头部视线和手臂手势,使人类更容易理解机器人动作,研究表明,这不仅提升共享工作空间的舒适度,还缩短培训时间,特别适用于医疗、客服和家庭协助场景。 ▲特斯拉Optimus进行电池码垛 此外,通用人形机器人能胜任多角色任务,从仓储搬运箱子、操作叉车,到制造装配、质量检查,再到老年护理中的协助行动和取物,减少对专用机器人的需求,显著降低长期成本。 人类天生倾向于与类人形态互动,人形机器人通过表情手势或面部提示,在客服、家庭和医疗场景中更易被接受,缓解自动化带来的陌生感。 然而,人形机器人仍面临挑战:平衡、精细运动控制和能效的技术复杂性尚未完全突破,早期型号如Optimus和Figure 01价格昂贵,且部分人对拟人化机器人产生“恐怖谷”不安感。 随着人工智能、执行器和材料的进步,这些障碍正逐步消解。人形机器人之所以重要,是因为适应人类形态比重新设计世界更高效,未来它们将在建筑、医疗、物流等领域填补劳动力缺口,变得像智能手机一样普及。 二、从吸尘器到Optimus:人形机器人60年间的惊人变化 机器人技术经过数十年发展,为人形机器人的崛起奠定了坚实基础。1961年,乔治·德沃尔获得可编程机器人专利,确立了核心技术。 1969年,西屋电气推出全球首款工业机器人Unimate 360,用于焊接,展示了自动化运动的潜力。 ▲西屋电气Unimate 360 70至80年代,家用机器人开始萌芽,PARC的MITOUCH等项目探索自主导航,光电传感器和接近开关成为关键组件。 1984年,Heathkit Hero Jr.作为首款商业可编程教育机器人问世,激发公众兴趣,揭示了消费者对家用机器人的需求。 2000年代初,iRobot的Roomba凭借“螺旋”清洁算法和传感器融合技术席卷市场,确立了机器人领域的领导地位。 ▲Roomba是一款扫地机器人,其迭代产品至今仍在发售 2000年代中期至2010年代初,服务机器人扩展至酒店和零售,利用RFID和计算机视觉技术,而波士顿动力对动态运动的研究为敏捷机器人铺平道路。 2010年代,深度学习推动人工智能革命,显著提升机器人导航、物体识别和操作能力,波士顿动力的Atlas机器人展示了强化学习的潜力。 2020至2023年,新冠疫情加速了消毒、配送和远程协助机器人的普及,凸显其社会价值。 2023年,特斯拉推出Optimus人形机器人,融合电动车技术与人工智能,标志着可扩展、价格合理的家用机器人平台的诞生。 从Roomba到Optimus,机器人技术的核心在于解决实际问题并持续优化,未来,机器人将从单纯的工具转变为家庭、工作场所和社区的协作伙伴。 三、全球机器人竞赛白热化,中美谁将率先领跑? 人形机器人不仅是技术突破,更是国家间经济与战略博弈的焦点,被视为新的“斯普特尼克时刻”(隐喻,它常被用来形容某一领域的突破性进展和由此引发的激烈竞争)。各国竞相布局,力求在技术和经济上占据优势。 中国在机器人领域拥有较强的产业基础和市场优势。2022年,中国机器人安装量占全球总量的52%,国内有小米、优必选、宇树科技、傅利叶智能等14家主要企业。政府设立了1380亿美元的产业基金支持行业发展,并计划到2027年进一步提升全球市场份额。此外,中国在机器人技术专利数量上增长较快,预计2024年将达到领先水平。同时,相关企业通过展会、赛事等活动展示技术成果。 美国以特斯拉、Apptronik等公司为核心,依靠AI芯片、软件和精密组件的优势保持竞争力,技术成果常在CES等活动中亮相。 ▲中美机器人产业关键项对比 其他国家同样积极参与:欧洲的PAL Robotics和TiBOT注重研究驱动,加拿大的Sanctuary AI、挪威的Agility Robotics和1X专注于AI整合与实用性,而以色列的Mentee Robotics和印度的MUKS Robotics分别深耕AI驱动和太空应用领域。 目前,全球已推出30家公司推出人形机器人,设计风格从未来主义到工业风各具特色。 ▲全球机器人产业国别分布与设计特征分析(数据源自ReadMultiplex,可能统计有误) 这场竞赛旨在解决劳动力短缺、提升生产力并改造产业,但也可能加剧地缘政治紧张,快速采用人形机器人的群体与因信息不足或群体趋势而抵制的群体之间,或将出现明显的社会分化。 四、价格大幅下降:人形机器人离普通家庭还有多远? 技术进步是人形机器人普及的关键。 多模态人工智能增强了机器人的适应性和决策能力,支持复杂任务的执行;高扭矩执行器实现精准运动,例如抓取鸡蛋或操作工具;LiDAR等先进传感器优化导航,使机器人能够适应动态环境;强大的计算能力支持实时决策,提升自主性;固态电池技术的突破(预计2028-2030年商用)将显著延长续航时间。 在成本方面,机器人价格已从25万美元(近175万人民币)大幅下降至如宇树科技G1的1.6万美元,预计到2026年将跌破1万美元,使家用机器人更加触手可及。 领先企业正加速布局,特斯拉的Optimus(5英尺10英寸)具备高级灵活性,能处理如鸡蛋的精细任务,目标售价为2万至3万美元;Figure AI的Figure 02(5英尺6英寸)专注于厨房协助,与微软和英伟达合作,目标价格低于2万美元;1X Technologies的NEO Beta(5英尺5英寸)专为家庭设计,计划2025年量产数千台;Engineered Arts的Ameca(6英尺1英寸)擅长社交互动,适合陪伴角色;鹏行的Iron(5英尺8英寸)则从工业领域扩展至家庭,展现了多样化应用前景。 结语: 美国一家投资公司ARK Invest预测,家用机器人市场将达12万亿美元,可应对老龄化、出生率下降和劳动力价格竞争等全球挑战。 机器人每天可处理23小时无偿家务,租赁成本约每月300美元,显著降低生活成本,甚至助力消除贫困。自动化还将解放人类从事创造性活动,提升生活质量,尤其对老龄化人口意义重大。 然而,快速的技术普及也引发争议。新卢德运动的兴起(以对特斯拉自动驾驶汽车的攻击为开端)和欧盟“机器人税”提案,反映了社会对自动化的复杂态度。部分人群因误解或群体趋势抵制机器人,社会接受度需时间调适。 从家务助手到产业支柱,人形机器人正重塑我们的生活方式。2025年,这场技术革命将迈入新阶段,带来无限机遇的同时,也提醒我们审慎应对社会与文化的变迁。正如个人电脑改变了世界,人形机器人或将成为下一个人人触手可及的科技奇迹。
庭院机器人Yarbo融资2700万美元 今年销售额预计增长4倍
编译 | 江宇 编辑 | 漠影 机器人前瞻4月22日消息,专注庭院机器人研发的美国公司Yarbo宣布完成2700万美元B轮融资,旨在加速其模块化院落机器人生态系统的全球扩张。 新资金将用于扩大生产规模、优化供应链并加大研发投入,以推动产品迭代,Yarbo预计2025年销售额增长4至5倍,市场覆盖北美、欧洲、日本和澳大利亚。 Yarbo成立于2015年,最初名为Snowbot,最初专注于机器人除雪,现已发展为户外自动化领域的领导者,产品覆盖割草、吹雪和吹叶等多种功能。 此前,Yarbo通过2022年众筹(345万美元)、2023年种子轮(1450万美元)及Pre-A轮和A轮(4000万美元),累计筹集约5845万美元。该公司正计划招聘更多人才并为上市做准备。 Yarbo的核心产品是一个可快速更换附件的机器人平台。 该公司最新推出的修剪模块即将量产,专为处理传统割草机难以触及的区域设计。此外,Yarbo正在开发喷洒、垃圾搬运、宠物粪便清理和水果采摘等模块,目标是打造一个满足全季节需求的“1+N”院落生态系统。 ▲新型修剪模块可安装在Yarbo Core机器人的后部平台 在2025年CES展会上,Yarbo展示了“跟随我”模式(通过视觉识别自动跟随用户)、3500磅牵引能力(可拖曳重物如柴火和园艺车)和HaLow技术驱动的通信中心(提供更稳定、更广的连接)等创新功能。 在市场表现上,YArbo在2022年众筹中筹集了345万美元,2024年直销预订获得6000多订单。此外,在4月初的春季促销直播活动中,两小时内售出702台设备,销售额超85万美元。 随着模块化设计和智能化功能的不断突破,Yarbo正试图定义院落工作的未来,致力于让繁琐的户外任务成为历史。
禾赛科技打开机器人百亿市场,官宣三项重磅合作!比汽车想象空间更大
作者 | 程茜 编辑 | 漠影 激光雷达正为机器人讲出新故事! 智东西4月22日报道,昨日,在上海的2025技术开放日上,全球最大激光雷达制造商之一禾赛科技连宣多项机器人领域重大进展。 在应用端,禾赛科技将为追觅生态链高端智能庭院品牌可庭科技的割草机器人提供30万颗JT系列激光雷达、最高线数车规级量产激光雷达AT1440在卡尔动力全球首款未来运输机器人上首发;在机器人训练端,禾赛科技与空间智能企业群核科技将共同推出机器人仿真训练场景生成新方案。 激光雷达在汽车与机器人应用中,均是环境感知 “利器”,为二者实现定位、导航、避障等功能,但具体应用上又有诸多差异,汽车对其精度、环境适应性要求严苛,机器人的应用需求则因场景而异更具多样性且成本敏感。 禾赛科技正基于这些交集与差异,为激光雷达的下一个爆发市场积势。 机器人商业化进展迅速,从家用扫地机器人、割草机器人到商用配送机器人、物流机器人几乎已经成为各个场景的标配,但其仍然有不少弊端为用户所诟病:定位不准、避障能力差…… 这些已经成为激光雷达发力的突破点。禾赛科技机器人感知业务VP刘兴伟认为:从技术角度看,3D激光雷达就是机器人移动的最佳传感器。 那么,激光雷达到底能解决机器人移动的哪些痛点?禾赛科技如何平衡汽车与机器人业务?激光雷达能加速机器人爆发吗?我们试图从禾赛科技这场技术开放日上找到这些问题的答案。 一、3D激光雷达入局机器人三大天然优势:定位、感知、避障 上周六,北京亦庄上演了全球首个人形机器人半程马拉松,这既是各家机器人秀肌肉的练兵场,也直观展现出了当下机器人在移动方面的不足之处。机器人想要在长距离、复杂地形的赛道上实现持续稳定运动,对其环境感知、精准定位、实时路径规划等自主移动能力提出了极高的要求。 3D激光雷达能为机器人做什么?禾赛科技机器人感知业务VP刘兴伟用两个词总结了搭载3D激光雷达后机器人的运动能力:从容和优雅。 这其中的原因在于,3D激光雷达可以帮助机器人知道自己在什么地方、知道整个环境的基本样貌、知道如何规划路径以及知道前方有什么样的障碍物,解决的就是定位、感知、导航问题。 首先,从定位的角度来看,机器人需要进行局部定位和全局定位,局部定位指的是通过激光发射与接收测量自己距离墙壁的定位,全局地位需要地图来确认其所处的大环境,基于3D激光雷达不断对周围环境进行扫描,最后实现3D建图。在此基础上,机器人通过局部定位后,再和记忆中的全局地图进行匹配,才能真正实现精准定位,并同步建图、导航。 其次,目前业界已有的感知避障方案并不少,如2D激光雷达、GPS+摄像头等方案,但这些在实际应用场景中无法覆盖所有情况,如2D激光雷达只能扫描平面空间的障碍物,而地上凹陷的坑等就无法进行识别;GPS+摄像头的方案会涉及到信号在室内被干扰、光照影响图像质量、识别安全等问题。 这些也正是3D激光雷达的优势所在。因此从技术角度看,刘兴伟认为,3D激光雷达就是机器人移动的最佳传感器。 机器人的三大核心要素是感知、决策、执行。因此,机器人能自主移动是第一步,真正学会决策并进行合适的操作也是接下来的难关。 当下决策部分需要依赖于机器人大小脑的发展,执行部分的难题就是机器人缺乏高质量的训练数据。刘兴伟提到,他们与机器人企业交流过程发现,当下的机器人训练面临数据获取成本高、数据质量差两大难题。 目前机器人训练数据的来源包括需要耗费大量人力成本的遥操作,让人重复动作以收集数据,以及在虚拟场景进行仿真训练,这就需要虚拟空间物品能足够逼真,使得机器人能与之进行互动,才能训练出在现实场景真实可用的机器人。 而3D激光雷达可以在仿真环境中获取数据重现真实世界的场景,且此举还可以使得机器人在虚拟环境中进行大量的训练和测试,减少真实环境中的实验次数,从而降低训练成本和风险。 维他动力联合创始人、产品与市场负责人赵哲伦认为,激光雷达在机器人上的重要性已经远超大家的想象。激光雷达为自动驾驶提供了诸多训练数据,这与机器人的逻辑相同;安全方面,物理世界的容错率非常低,激光雷达的精准性远高于视觉,因此在复杂场景做精准工作,激光雷达是必需的。 可以看出,在机器人走向千行百业的趋势下,机器人与激光雷达的市场交点正在增加。 二、多元场景、应用训练端纵横布局,今年出货量将超20万台 这一趋势也体现在了全球最大激光雷达制造商之一禾赛科技的市场表现上。 今年,禾赛科技的机器人激光雷达出货量将超过20万台,超过其历史机器人交付量总和。同时,禾赛科技也已成为2024年全球机器人激光雷达交付量第一的企业,并且出货量高于第二、第三名之和。 禾赛科技在机器人领域的战略布局正加速纵横拓展:横向覆盖割草机器人、无人物流车等不同应用场景机器人,纵向从应用端、训练端入手,找到激光雷达更全面的价值释放点。 目前,禾赛科技已经与追觅科技、海康机器人、维他动力、赛格威机器人等诸多企业达成合作,并且官宣与可庭科技的深度合作,未来一年内将为可庭科技提供30万颗JT系列激光雷达。 可庭科技割草机业务CTO秦岭提到,传统割草机的痛点是安装复杂,需要专业人员;无法感知周围文静,导致导航规划混乱;无法覆盖草地上障碍物周围、边角。 在此基础上,可庭科技基于禾赛JT16激光雷达,并自研了UltraView环境感知技术,实现智能搞定定位导航感知,彻底解决重复割草问题。而在激光雷达的加持下,他认为割草机未来可能变成通用庭院机器人。 刘兴伟回忆道,去年,他们拿到的割草机器人需求面临着成本苛刻、交付节奏快两大难题。这是因为割草机器人本身的市场售价并不高,定价在万元人民币上下,这也使得激光雷达的成本空间需要再度下探。 交付节奏快是因为割草机器人季节性强,其出货时间集中于夏天,因此需要开发团队在短时间内完成大规模交付。最后的结果是,禾赛科技去年12月,实现了首月2万台的交付。 另一大应用场景是卡尔动力全球首款未来运输机器人,禾赛全球最高线数车规级量产激光雷达AT1440在卡尔动力全球首款未来运输机器人上首发。 此外,禾赛科技还针对当下机器人训练的核心难题,找到了自己的发力点。 机器人训练数据获取成本高,使得仿真训练平台成为诸多机器人企业的主要选择方式,让虚拟环境更真实并具有物理属性,就是禾赛科技激光雷达要做的事。 禾赛科技将与群核科技合作推出机器人仿真训练场景生成新方案,这依赖的就是激光雷达与群核科技空间理解模型SpaitalLM、空间智能解决方案SpatialVerse的融合。 具体来看,相较于传统的视觉方案,禾赛XT及JT系列激光雷达可快速生成密集点云数据,解决纯视觉方案在弱光、动态场景下的精度衰减问题,基于此可实现毫米级3D空间建模与物理属性智能标注,然后为群核空间大模型提供可靠的基础数据输入。群核科技首席科学家唐睿谈道,基于激光雷达将物理世界进行绘制、理解,形成结构化信息传递给机器人,从而能使机器人更好为人类服务。 这样的机器人训练场景,就可以实现真的可交互、可操作,从而为机器人训练降本增效。唐睿补充说,他们联手做的事就是帮助机器人去“看”世界,理解世界。 刘兴伟补充说,事实上,激光雷达与机器人的故事仍在延续,他们发现,如果机器人基于禾赛科技传感器采集的数据进行训练,在最终部署时延用其传感器将得到一致的数据特征,进一步简化部署流程。 从禾赛科技当下的机器人布局中,我们已经可以预见激光雷达在机器人领域巨大的想象空间。 三、车规级能力下放,剑指机器人无限想象空间 相比于禾赛科技一直布局的汽车行业,机器人赛道仍有巨大的发展空间,一方面,人形机器人这一“机器人皇冠上的明珠”仍在加速从实验室构想迈向产业化落地的进程;另一方面,已经有一定规模应用的扫地机器人、割草机器人、配送机器人等仍在技术突破向更高层次迈进。 因此,对于激光雷达而言,未来机器人的想象空间将远大于ADAS,禾赛科技CEO李一帆用了一个简单且直观的数据来证明这件事:“你不可能同时开两辆汽车,但是你可以同时让很多机器人为你工作。” 禾赛科技公开测算的数据显示,2029年,全球使用激光雷达的机器人数量会达到500万台,市场规模将达百亿元。 作为激光雷达制造商,如何平衡车规级能力与机器人应用,成为摆在禾赛科技面前的问题。他们的答案就是:将车规级能力不断下放,服务机器人行业产品。这里讲的车规级能力,不只是其核心技术、产品的能力,更是禾赛科技在多年研发进程中积累的系统化能力。 刘兴伟提到了三个关键点,从光机电软固到芯片的系统集成能力、产品可靠性、以及成本控制能力、大规模的交付能力。 从光机电软固到芯片的系统继承能力有一个直观的佐证,车用电子元器件与激光雷达电子元器件的数量相近,将数量庞大的电子元器件放入如此小的激光雷达中,需要长期的研发和工程投入。 在系统集成能力之上,禾赛科技在缩小激光雷达体积的同时,提升了点频,并将此迁移到了芯片能力之上以进一步提升产品的精度等。在对空间、精度方面要求极高的电力巡检领域,禾赛科技在全球市占率达到80%。 另一大汽车与机器人的交集点就是可靠性,如农业机器人在使用时,相关零部件损坏可能会影响到农民一年的收入。 禾赛科技的产品已经通过了AEC-Q100的可靠性认证,该认证的目的是设置足够长的试验时间,从而明确每个零部件的寿命。刘兴伟透露,研发人员在长周期实验测试后发现,禾赛科技的产品仍然保持完好。这些能力就可以下放到机器人领域,应用于对生命周期、可靠性较为敏感的领域。 最后是成本控制和大规模交付能力,正如前文提到的割草机器人,禾赛科技基于拥有大量发射芯片、光电器件自研芯片的能力,以及开发和生产可以高速系统的自建产线能力。 这些禾赛科技的独特性优势,正是其当下在汽车、机器人行业发展的底气所在。 结语:激光雷达加速拓宽机器人应用边界 从替代人类完成重复性工作、前往人类无法到达的地方,以及辅助人类完成高难度、高精度任务等,机器人与千行百业的结合正逐渐加深。但随着其应用落地加速,对于其移动、执行方面的技术突破、产品性能把控的升级迭代要求更快、技术突破程度更高。 在此基础上,原先在汽车行业发展多年的激光雷达伴随着成本下降、大规模交付等,使得其在体积更小、对成本要求更为严苛的机器人上应用成为可能。 在李一帆看来,机器人的本质是做减法。把机器人执行多类型任务的能力提升到99%,远不如使其在一到两件事的任务上做到100%有意义,因为一旦做成,这一到两件事就可以彻底交给机器人。 因此,瞄准机器人,禾赛科技正在其擅长的激光雷达领域,与机器人企业一起,加速这一行业的发展与繁荣。
OpenAI新模型展现“AI Agent”潜力,Cursor AI客服“幻觉”暴露风险
编译 | 王涵 编辑 | 漠影 智东西4月22日消息,外媒The Information对话开发者,谈到AI(人工智能)行业先锋OpenAI新发布的o3和o4-mini模型突破了端对端的任务处理能力,成为更有实用价值的“智能体(AI Agent)”,但功能上仍存在缺陷,且新增加的身份验证流程引起部分人的不满。 其次,开发者们也关注到AI编程助手Cursor的AI客服编造登陆政策的“幻觉”事件,认为AI客服供应商应为此“绷紧神经”。 一、OpenAI智能代理获好评,身份验证程序引争议 OpenAI o3和o4-mini模型在上周发布, 开发者对新模型的反应值得关注。 ▲OpenAI不同模型的指令遵循和代理工具使用对比数据 开发者说,OpenAI新一代推理模型正逐步成为对终端用户和开发者更有实用价值的“AI Agent”,这与前几代产品形成鲜明对比。此前版本被批评为仅能在封闭环境中快速解决数学问题的“超智能AI”。新模型的突破在于能够调用外部工具和应用程序,为用户提供端到端的任务处理能力,包括在编写复杂功能时在线搜索文档,以及为用户制定带有学习提醒的课程计划等。 最令开发者们印象深刻的能力还是其对图像相关问题的解答。在一个颇具代表性(同时也令人担忧)的案例中,用户向AI提供食物照片或普通风景照,要求模型推测拍摄地点,其准确率之高令人意外。 ▲OpenAI o3模型图像识别功能演示图 当然,这些模型仍存在缺陷。它们在某些相对简单的问题上仍会出错,部分用户反映模型在解决问题时会未经提示就使用用户姓名,这种行为令人不适。 引发开发者争议的改动是通过API接口获取o3模型时新增的“身份验证”流程。据开发者透露,该流程要求用户上传政府签发的身份证件照片及面部识别视频。OpenAI此举可能旨在防止用户创建大量虚假账户获取o3模型输出数据,用于训练其他AI模型(即“模型蒸馏”技术)。但部分用户认为这一措施带有“监控”色彩,对向OpenAI提供个人数据表示担忧。 二、Cursor的AI客服编造登录政策,投诉声音高涨 目前看来,AI初创公司还算幸运,尚未出现过太多令人尴尬的AI事故。不过最近,首个因AI失误而让热门AI初创公司陷入困境的例子似乎出现了。 上周,一些开发人员注意到,Anysphere旗下热门AI编程助手Cursor存在一个问题:当他们试图从第二台电脑登录时,系统会将他们强制登出。 这对于需要在多种设备上测试网站或应用程序的开发者来说是个严重的困扰。 当开发人员向Cursor的支持邮箱反映这一问题时,他们收到了该公司AI客服代理的回复,称这是Cursor新登录政策下的正常行为。 但问题在于,根本不存在这样的登录政策, 这是客服机器人编造出来的,也就是所谓的“AI幻觉”。 ▲Cursor AI客服回复截图 这一事件引起了许多开发者在社交媒体上投诉,有些人甚至表示已经因此取消了订阅。 其实在事件发生后,交流过的大多数开发者客户都认为这不是件大事,他们也承认这类错误在使用任何初创公司的产品时都难以避免。但这确实给企业上了一课:不要在没有任何人工核实的情况下过于依赖AI产品。 开发人员说,这起事件对Cursor使用的客服代理服务提供商的影响要比对Cursor本身的影响大得多。这不禁让人好奇Cursor使用的是哪家客服公司,特别是考虑到这类客服机器人之所以能够成为对话式AI最早普及的应用之一,部分原因就在于它们的风险较低。 不过,在AI时代,客服的风险可能会越来越大,如今客户更换供应商是一件非常容易的事。这一点在AI编程市场尤为明显,因为即使是像新模型发布或编码助记忆信息量调整这样的微小变动,都能迅速使开发者转向新产品。这种情况让新兴编程初创公司更容易崭露头角,比如针对非技术开发者的StackBlitz或Lovable以及像Cline这样的开源方案。 Cursor或许目前暂时占据了编程领域的宝座,但它最好能让客户保持满意(尤其是在其主要竞争对手Windsurf似乎可能与OpenAI合作的情况下)。 结语:用户体验是AI产品生存与发展的重要指标 OpenAI新发布的o3和o4-mini推理模型凭借其实用性获得开发者广泛好评,尤其是其图像识别与跨工具任务处理能力,为“AI Agent”概念赋予了新内涵。然而,新增的身份验证流程因涉及用户隐私与数据安全争议,引发部分开发者对技术监控的担忧,凸显出用户对隐私保护与信任机制的高度敏感。 与此同时,Cursor的AI客服因编造登录政策导致用户投诉激增,暴露出人工智能在客户服务场景中的“幻觉”风险。尽管多数开发者认为此类问题在初创企业产品中难以避免,但事件仍为行业敲响警钟:过度依赖AI而缺乏人工核验机制,不仅可能直接损害用户信任,更可能因服务失误导致用户流失。 决定AI产品生命力的不仅是技术参数的高低,更是每一个真实用户的使用感受。在AI技术快速迭代的当下,AI创新若不能以优质的用户体验为基础,或许将难以获得市场的持久认可。
苹果深陷多重危机 股价何处是底:分析师预测还要暴跌28%!
快科技4月22日消息,股票研究公司Moffett Nathanson认为,尽管2025年内已经累跌超23%,短期内苹果股价的跌势不会迎来任何缓解。 Moffett Nathanson的分析师Craig Moffet重申了对苹果的“卖出”评级,并将其目标价从184美元大幅下调至141美元。 这意味着,相较于苹果上周四196.98美元的收盘价,Moffet认为其股价未来还可能下跌超28%。 Moffet指出,苹果目前面临的困境远不止股价下跌,由于美国的关税政策和贸易战等问题,苹果的长期盈利预期被下调。 虽然美国暂停对智能手机加征对等关税后,对苹果来说最坏的情况暂时被排除了,但苹果进口产品仍需面临关税问题。 Moffett解释道,苹果正在贸易战夹缝求生,面临双输选择,“苹果要么支付巨额关税,要么花费巨额资金重构供应链,导致成本大幅上升。” 在技术领域,Moffet指出,苹果在人工智能商业化方面已经落后于同行,其iPhone Intelligence未能为iPhone带来强劲的升级周期。 此外,谷歌面临的反垄断案也可能给苹果带来额外风险,谷歌为确保其在iPhone浏览器上成为默认搜索引擎,与苹果分享了Safari 36%的搜索广告收入。 Moffet警告称,这些收入占苹果运营利润的四分之一以上,而法官已经认定这些付款是非法的。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。