EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
刚刚,小扎任命清华校友为Meta AI首席科学家!GPT-4幕后功臣或取代65岁图灵奖得主
就在刚刚,Meta 宣布,清华校友赵晟佳(Shengjia Zhao)将正式担任其超级智能实验室( MSL)首席科学家。 「我很高兴地宣布,赵晟佳将担任 Meta 超级智能实验室的首席科学家,」扎克伯格在内部信中写道,「赵晟佳是新实验室的联合创始人,从一开始就是我们的首席科学家。现在我们的招聘进展顺利,团队逐渐成型,我们决定正式确立他的领导角色。」 扎克伯格还表示: 「赵晟佳已经在多个领域取得了开创性突破,包括提出一种新的扩展范式,并在该领域展现出了杰出的领导能力。我非常期待与他密切合作,共同推进他的科学愿景。我们正在组建一支高密度顶尖人才团队,并配备充足资源,专注长期发展,致力于推动超级智能研究的前沿进展。接下来的几年将会非常令人期待!」 Meta 超级智能实验室负责人 Alexandr Wang、英伟达机器人部门主管兼杰出科学家 Jim Fan 也在社交平台上纷纷发文祝贺。 对此,赵晟佳在社交平台发文回应称: 「我非常激动能够担任 Meta 超级智能实验室的首席科学家。期待与这里的优秀团队一起构建 ASI,并使其与人类需求保持一致,赋能每个人。让我们一起努力!」 值得注意的是,与 MSL 不同,FAIR 专注于长期 AI 研究——即可能在五到十年后使用的技术。尽管 FAIR 团队在 Meta 的整体战略中逐渐边缘化,图灵奖得主 Yann LeCun 的职位未发生变化。 小扎特别强调,Yann LeCun 将继续担任 FAIR 的首席科学家。 对于小扎的任命宣布,Yann Lecun 也体面回应:「我作为 FAIR 首席科学家的角色一直专注于长期的人工智能研究和构建下一代人工智能范式。我期待与赵晟佳合作,加速将新研究成果整合到我们最先进的模型中。」 那么赵晟佳是谁? 赵晟佳在 2016 年本科毕业于清华大学计算机系,曾在美国莱斯大学交换,后于斯坦福大学获得计算机科学博士学位,专注于大模型架构、多模态推理和对齐方向的研究。 学习与工作期间,他与多位顶尖学者合作密切,共同发表了多篇高引用论文,包括斯坦福计算机系副教授 Stefano Ermon、Luma AI 首席科学家 Jiaming Song、UCLA 助理教授 Aditya Grover 以及 Noah Goodman、Silvio Savarese、Marco Pavone 等学者和专家。 2022 年,他加入 OpenAI,担任核心研发成员,深度参与 GPT-4 和 GPT-4o 的系统设计工作。曾主导 ChatGPT、GPT-4、所有 mini 模型、4.1 和 o3 的研发工作,还曾领导 OpenAI 合成数据团队。 赵晟佳在大模型系统卡、安全机制、推理能力优化等关键技术路径中均有深度参与。 具体而言,赵晟佳曾作为主要作者之一参与撰写《GPT-4 技术报告》(2023),该论文截至目前已获得超过 1.7 万次引用,是当代 AI 领域被引用最多的技术文献之一。 他还深度参与 GPT-4o 系统卡(2024)、OpenAI o1 系统卡等研究项目,涵盖模型推理、工具调用、系统对齐等关键模块设计。可以说,他是推动 OpenAI 基础模型标准化与公开化的重要贡献者之一。 早年间,他在变分自编码器方向也有突出贡献,其代表作《InfoVAE: Balancing Learning and Inference in Variational Autoencoders》发表于 AAAI 2019,成为神经网络生成模型研究的重要基石之一。 根据 Google Scholar 数据,截至发稿前,赵晟佳的论文总引用次数已超过 23000 次,h-index 达 26。此外,LinkedIn 资料显示,他曾获得过 ICLR 2022 Outstanding Paper Award、JP Morgan PhD Fellow、Qualcomm 创新奖学金(QinF)与 Google Excellence Scholarship 等多项奖项。 赵晟佳的经历并非个案。 据外媒 The Information 上个月报道, 当时与赵晟佳一同加入 Meta 超级智能实验室,还有来自三位 OpenAI 研究人员——Jiahui Yu, Shuchao Bi 以及 Hongyu Ren。根据我们之前的报道,Meta 超级智能团队中,目前已知的就有多位华人面孔,其中大多本科毕业于清华、北大、上交或中科大,清一色中国顶尖高校出身。 上周,风投公司 Menlo Ventures 的投资人 @deedydas 也在社交媒体平台公布了 Meta 超级智能团队 44 名成员的详细资料。50% 团队成员为华人背景,且 Deedy 推测每位成员的年薪可能在 1000 万至 1 亿美元之间, 也难怪会有不少调侃,照如此之高的华人比例配置,Meta 超级智能团队开会直接讲中文可能效率会更高。 可以说,在 OpenAI、DeepMind、Anthropic、Meta 等超一线 AI 实验室中,越来越多华人面孔正站在最前沿,参与定义新一代通用人工智能的底层范式与安全架构。 而赵晟佳的任命,像是一颗钉子,钉在了这一进程的时间线之上。
阶跃Step 3把推理效率卷到DeepSeek的3倍,还拉来了国产芯片半壁江山
最强开源多模态模型来了,还顺带拉来了国产 GPU 的半壁江山。 今天下午,阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3,并宣布将在 7 月 31 日面向全球企业和开发者开源。 阶跃星辰创始人姜大昕博士 阶跃 Step 3 的两个关键词是:多模态推理能力领先开源阵营+推理效率在国产芯片上提升至行业顶尖的 300%。 发布会现场,阶跃还宣布成立「模态生态创新联盟」,联合多家国产芯片头部厂商,共同打通从模型到芯片、终端和工业应用的全链路。 一句话概括 Step 3 的定位:不只是「更强」,而是「更综合」。 而这场重磅发布的逻辑,其实早有迹可循。早在 5 月份,阶跃创始人姜大昕就曾在接受 AppSo 采访时表示; AI 行业的技术发展非常快,依然处于非常陡峭的区间。阶跃不想在这个过程中放弃主流增长或前进的趋势,所以我们还是会坚持做基础模型的研发。 多模态与高效:兼顾能力与落地 Step 3 是一款主打推理能力和推理效率的旗舰模型产品,无论是文本推理、代码、数学能力,以及最重要的多模态能力,Step 3 都可以胜任,它在多个榜单上的测试结果都非常出色。 在 SimpleVQA 榜单上,Step 3 的得分超过了国内外所有开源的同类模型,成为了最强的开源多模态推理大模型。 阶跃 Step 3 在语言榜单、多模态等榜单上的成绩 而在评估推理效率上,阶跃 Step 3 真正做到了在模型足够好的情况下,推理效率高,应用成本低。 Step 3 从设计伊始就结合多种硬件优化,在主流国产芯片上的推理效率,提升至行业翘楚 DeepSeek 推理效率的 300%;在英伟达 H800 平台上,对比 DeepSeek,也提升 70%,显著降低模型推理的成本压力。 与 DeepSeek 模型对比,左边是在国产芯片上的测试,右边是 NVIDIA H系列芯片的测试 黄金法则:「多、开、好、省」 在大模型「卷各种榜单」的今天,阶跃关注的不仅仅是模型智能的上限,更加关注模型是否能做落地应用,能否实现价值。 阶跃 Step 3 在保留基础模型强大推理能力的同时,更强调落地适配。强调在「低算力」环境下也能保持较强的响应速度和处理能力。 姜大昕进一步归纳了评估模型价值的四个维度:多模态(多)、开源(开)、能力强(好)、成本低(省)。而这四点正是 Step 3 发力的核心。 「多」,意味着模型的多模态能力,而不是针对某一项数学能力、代码能力。姜大昕在现场也举例说我们在很多场合,需要的并不是一个能够拿奥数金牌的模型,而是能够读懂一张纸的含义、能够语音和我们交流。 「开」指的是开源,此次发布的阶跃 Step 3,也将在 7 月 31 日向全世界开源。 「好」则是代表模型的能力要足够强,而「省」则是在模型能力足够好的前提下,尽可能降低成本。 阶跃星辰把 Step 3 放在一个二维坐标系里,能力和是否开源。国际头部模型集中在能力强但不开源区;而许多开源模型缺少多模支持或能力不足。Step 3 填补的正是 开源、多模态、推理顶尖 的象限。 这个「黄金法则」也正说明,阶跃 Step 3 不仅「更聪明」,而且更能「跑得起」「用得起」。 面面俱到:从读图识字到复杂分账 现场也展示了几个阶跃 Step 3 多模态能力的演示案例, 首先是色盲测试图片识别,Step 3 快速读出隐藏字母「Step 3」,甚至在推理思维链里自嘲「巧合」。 自动播放 菜单反光识别:在高反光环境下仍能读取菜名和价格,并精准回答如「无骨鸭掌 58 元」。 自动播放 群聊+超市小票联合推理题:从两张图中推断每个人的分摊金额,模型生成结果与人工计算极其接近,同时也感受到了因四舍五入导致的 0.03 元误差。 自动播放 这类视觉+语言+推理的联合能力,更加符合现实使用场景的需求。 模型矩阵:阶跃的下一个目标 而除了视觉的多模态理解推理,阶跃在 Step 3 这个旗舰模型之外,还构建了一套完整的,包含各种能力的模型全家桶;包括语音模型、音乐模型、图像生成、图像编辑和视频生成等等。 阶跃在现场还展示了他们的语音大模型,阶跃 Step-Audio 2,它能够生成各种方言、各种语种、各种角色的声音类型,同时有连续对话、被打断灵敏处理等能力。 自动播放 目前,所有这些模型目前都可以透过下载阶跃AI 或者前往阶跃官网体验。 不仅是模型发布,阶跃星辰在 WAIC 2025 还宣布与上海国有资本投资有限公司开展深度战略合作,将在资本对接、生态建设、业务协同等方面协作。 同时还披露上海国投将参与阶跃星辰新一轮融资,阶跃也宣布全年收入要向 10 亿人民币冲刺。 阶跃星辰这次还强调了一个核心战略方向,芯片适配能力和生态构建。 Step 3 此次在国产芯片的推理效率上取得了突破性的成绩,且对所有芯片友好。发布会上,阶跃宣布成立「模态生态创新联盟」,拉来了国产 GPU 的半壁江山。 包括华为昇腾、燧原科技、壁仞科技、沐曦、无闻芯穹、天数智芯等在内的 10 余家国产 GPU 头部厂商共同参与。芯片厂商和模型厂商将通过联合技术创新的模式,让大模型和算力双向实现价值最大化,加速推动 AI 真正被各行各业用起来。 目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。 该联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。 过去一年,在很多国产模型努力追 GPT 系列模型能力曲线时,阶跃星辰似乎选择了另一条路径。就像姜大昕在发布会上提到的木桶效应一样,不一定做到方方面面最强,但要先做到「到处能跑」。 Step 3 的发布,除了是能力极限的炫技,更是对「可用性」一次重申。 大模型如果要真正进入生产和生活,就不能只在超算中心跑得飞快、在论文里得分漂亮,而是要能在真实世界里快速响应、低成本部署、长时间稳定运行。 阶跃一直强调要做基础模型,我想之所以叫「基础」,是因为它希望模型真的能像基础设施一样,可靠、普及、负担得起。
字节跳动随意取消离职员工期权?官方回应来了
凤凰网科技讯 7月28日,抖音黑板报发布“关于网传‘期权被字节跳动随意取消’的澄清说明”。官方表示,近期有人在社交媒体发帖称,自己离职后被字节跳动随意取消期权。相关发帖内容与事实不符,公司不会随意扣减员工的期权。 官方声明如下: 近日,我们发现有人在社交媒体发帖称,自己离职后被字节跳动随意取消期权。相关发帖内容与事实不符,公司不会随意扣减员工的期权。经公司内部调查,相关情况因该前员工违反公司廉洁管理制度和其签署的期权授予协议,触发期权扣罚条款。该前员工涉嫌骗取公司云服务资源,导致公司重大经济损失,已于 2025 年 5 月因涉嫌诈骗罪被警方采取刑事强制措施。 2025 年 7 月 16 日,公司对其期权进行扣罚,并于 7 月 25 日向其发送扣罚通知。 对于违法侵害公司利益的行为,公司始终秉持“零容忍”的态度,除依法追究行为人的法律责任外,还会采取同步行业联盟、根据双方签署的期权授予协议扣除全部期权等措施。 请大家注意甄别信息,勿轻信谣言。针对相关社交媒体账号发布不实信息影响公司商誉的行为,我们将依法维权。 据了解,7月25日,脉脉账号“小哥哥在重庆造火箭”在“字节跳动同事圈”发文称,从字节跳动离职后,已归属的期权被通知取消,理由为“在职期间严重违反了公司政策和流程”。在小红书平台,众多职场自媒体号纷纷进行讨论,引发网友热议。
外籍员工能接受艰苦奋斗吗?任正非说了一句大白话...
作者 | 蓝血创作组 华为创始人任正非认为,华为外籍员工也是懂“以奋斗者为本”的核心价值观的,他说: 外籍员工的核心价值观与我们的核心价值观并不矛盾。你把这个话变成“你想不想多拿钱?”“想。”“那你多干活好不好?”“可以。”,OK就是这样了。以奋斗者为本其实就是多干活多拿钱,不矛盾不冲突。我们想讲的一些道理,西方员工照样能接受,员工想多休息,少拿一点就行了,如果想多拿一点那你就奋斗,这两个价值观没有冲突。 当任正非用一句近乎“大白话”来解释其核心价值观时,“以奋斗者为本”这个听起来充满东方集体主义色彩的口号,被还原成了一个全球通用的朴素交易。这番解释,乍听之下是实用主义的极致,似乎将一切复杂的文化与哲学差异都消解于无形。 但任正非紧接着的另一段话,却揭示了这“简单”背后更深邃的思考。他认为,西方员工因其宗教与哲学传统,对这类问题的理解可能比我们更深刻,并希望通过哲学学习,为习惯了标准答案的中国员工“犁松思想的土壤”。他说:“哲学来自于宗教,在西方宗教的气氛很浓烈,西方对哲学问题的认识比我们深刻,我们认为中方员工比外籍员工要幼稚一些,所以希望中方员工先学。我们学一点哲学,目的是把自己的思想犁松,我们的土壤太板结了。华为公司绝大多数的高中级干部是学工科出身的,学文科出身的人思维方式是平面的,没有立体结构;学理工的人有立体结构,对事物的理解很深,但缺点是很死板。我们学了半天就是要把理工科的人思想犁松一些。” 这引出了一个有趣的问题:任正非的自信从何而来?“多干活多拿钱”的逻辑,为何能让不同文化背景的外籍员工,尤其是西方员工,不仅理解,甚至能够深度认同?答案或许就藏在西方文明的“文化基因”里。任正非所说的“奋斗者”,在西方世界其实有着早已根深蒂固的哲学根基。 01 新教伦理与奋斗的内在驱动力 当我们检索西方关于“奋斗”的思想源头时,马克斯·韦伯在《新教伦理与资本主义精神》中的论述几乎是绕不开的界碑。韦伯精辟地指出,新教,特别是加尔文宗,将世俗的职业劳动提升到了“天职”(Calling)的高度。 在这一观念下,努力工作、创造财富不再仅仅是为了满足个人欲望,而是荣耀上帝、证明自己是“上帝选民”的方式。懒惰是可耻的,而系统性、理性、不知疲倦的奋斗,则是一种近乎神圣的道德义务。这种思想将个体的奋斗与一种超越性的价值和终极意义紧密相连。 任正非的“多干活多拿钱”,表面上看是物质激励,但其背后“以奋斗者为本”的内核——即通过个人努力实现价值、获得承认与回报——恰恰与这种世俗化的“天职”观念不谋而合。对于一个成长于德国、美国或北欧等深受新教伦理影响的文化环境中的员工而言,“奋斗”本身就带有一种内在的、不言自明的正当性。他们或许不会用“奋斗者”这个词,但他们理解“敬业”(Professionalism)、“责任”(Accountability)和“成就驱动”(Achievement-driven),这些词汇共享着同一个精神内核:你的价值,由你的行动与贡献来定义。 因此,当华为提出“以奋斗者为本”时,它并非在输出一种陌生的东方价值观,而是在激活一种早已沉淀在西方员工文化血液中的古老共鸣。他们听到的不是遥远的口号,而是熟悉的旋律。 02 自我塑造的渴望 如果说新教伦理为“奋斗”提供了神圣的动机,那么存在主义哲学则为其赋予了现代的、个人主义的色彩。以萨特为代表的存在主义者宣称“存在先于本质”,这意味着人没有预设的“人性”,“人是其所不是,是其所是”,人通过自己的选择和行动来塑造自己。 这难道不就是“奋斗”的另一种哲学表达吗?一个“奋斗者”,正是一个拒绝安于现状,通过持续的行动和创造,来定义自身存在价值的个体。你的职位、薪酬、地位,并非取决于你的出身或背景,而是你“做”了什么。这与华为“不看资历看贡献”的原则形成了完美对偶。 这种思想在美国文化中,与“美国梦”的叙事合流,演变成了我们熟知的“车库创业”精神。从惠普到苹果,再到谷歌,硅谷不眠的传奇反复讲述着同一个故事:凭借才华、激情和不眠不休的努力,普通人可以颠覆世界,实现非凡的自我价值。这种对个人意志与自我创造的尊崇,使得“奋斗”不仅是一种选择,更是一种实现自由与尊严的路径。 因此,当一名外籍工程师在华为的实验室里通宵达旦,他可能不仅仅是为了奖金,更是在践行一种深植于其文化背景的信念——我手所创,即我本身。任正非的逻辑之所以能被接受,因为它提供了一个清晰、公平的平台,让这种自我塑造的渴望得以安放和实现。 03 犁松思想的土壤 任正非推崇哲学,并非为了培养一群坐而论道的思想家,而是为了打造一支能打胜仗的“铁军”。他批评工科生“死板”,文科生“空想”,实际上是在点明一种思想上的“熵增”——缺乏开放性与多元结构的思维,最终会走向僵化和封闭。 他让员工学习哲学,目的就是“犁松土壤”。他要的不是让员工背诵康德或黑格尔,而是要借助哲学这把“思想的犁铧”,打破思维定式,建立一种立体的、能够容纳矛盾和复杂性的认知框架。为什么西方员工可能“更深刻”?因为他们的教育和社会环境,本身就鼓励批判性思维和多元视角。宗教辩论、哲学探讨、社会议题的公开交锋,早已在无形中为他们的思维“松了土”。 从这个角度看,“以奋斗者为本”不仅仅是一条薪酬原则,它更是一种组织哲学。它要求管理者和员工都要有一种动态的、非线性的思维方式。奋斗不是蛮干,而是要理解战略、洞察变化、持续学习。这恰恰需要一种被哲学“犁松”过的、既有结构深度(理工科优势)又具灵活性(哲学赋予)的头脑。 04 结 论 所以,任正非的自信并非空穴来风。他看似简单的“多劳多得”逻辑,实则巧妙地搭建了一座跨越文化鸿沟的桥梁。其桥面,是人人都能理解的普世人性——对更好生活的向往;其桥墩,则是深深植根于西方文明中的哲学传统——从新教伦理的神圣感,到存在主义的自我创造,再到实用主义的成果导向。 华为的“以奋斗者为本”,在西方员工听来,可能不是一种需要被“启蒙”的新思想,而是一种对他们既有文化基因的确认和激活。任正非做的,不过是用最直白的语言,触碰到了那个全球共通的、关于“努力与回报”的古老开关。他不是在布道,而是在点燃早已存在的引信。这或许才是一个中国企业家能够真正影响世界的深刻洞察。
XREAL One Pro 评测:主打实用主义的成熟 AR 眼镜
放弃幻想 何不拥抱 阶段性完美? 前段时间,苹果内部对于 Vision 和眼镜产品线的规划线路图流出,而终点就在于 2028 年的 XR 眼镜,简单来说,就是 Vision Pro 的能力,装进一副和普通眼镜无异的机身之中,是 AI + AR 的结合体。 这种科幻的形态,不止苹果在探索,但各家的产品还停留在原型机中,暂时没有进入市场。 既然一步登天很难,那就先退一步,从功能一步步做起,再叠加融合。 Meta 和小米在做的 AI 拍摄眼镜,代表的就是智能眼镜在 AI 方面的能力;而 XREAL 做的分体式 AR 眼镜,就是混合现实技术方面的能力。 XREAL 告诉爱范儿,AR 行业仍在进步当中,尽管产品形态趋于完善,但技术和产品的打磨还没有结束,未来还有进步空间。 但如果有人想看看,2025 年中最优秀的AR眼镜已经到了什么水平——XREAL One Pro,绝对称得上业界目前最成熟、最具代表性的新品。 绝无仅有的视觉体验 从外观来看,XREAL One Pro 已经非常接近一副普通的太阳眼镜。 这得益于全新的 X Prism 光机显著缩小了体积,并且眼镜的边框(内置大部分光学元器件)也比上一代的 XREAL Air 2 系列更薄。 出门在外戴着一副这样的眼镜,只要不是离得特别近,都不会引来路人奇怪的目光。 戴上 XREAL One Pro 后,眼前会浮现出一个发光的大屏。 这种感觉,就像一个屏幕被「投影」在空气中。你也可以调整这块屏幕的「大小」,和与你的「距离」。 相比起 XREAL Air 2 的 46° 视场角,XREAL One Pro 有了更明显的进步,来到 57°:这个视场角水平,相当于是在人眼的视野中央,放了一个中等尺寸的「虚拟电视」。 从沉浸感来说,XREAL One Pro 当然不如 100° 的苹果 Vision Pro——但别忘了,这是一个比 Vision Pro 要轻便的多,甚至社交距离都看不出来的「眼镜/准头显」。所以不用对它抱有不切实际的期待。 (这句话,同样适用于 2025 年的所有其它轻便型/非头显的智能眼镜产品。) 当然,1080P 的分辨率,肯定还有提升空间,但实际上 AR 眼镜大屏+远距离的条件,让较低画质的影响没有那么明显,仔细看才会发现字体边缘会有锯齿。 不过考虑到带出门看视频是一个主要使用场景,分辨率的影响其实真没那么大:毕竟你不会要求民航客机的娱乐屏有多高的分辨率,对吧? XREAL One Pro 的最特别之处,就是搭载了 XREAL 自研的「X1」空间芯片,眼镜自带了一个小系统,不仅可以调出菜单调节屏幕参数,还能实现「云台」「悬停」这两种不同的模式。 这是 XREAL 老型号,以及其他品牌同类产品所不具备的能力。 「云台模式」很好理解,其实就是和其他普通眼镜一样,让画面始终保持在视野中央,但 X1 带来了云台防抖的效果。 由于我父母家在另一个城市,我经常需要有需要一个半小时的地铁的场景,还常常只能站着,这时候就非常适合 AR 眼镜连手机看点视频。 开启「云台模式」之后,基本上地铁的颠簸也不会造成画面的剧烈抖动,看久了不容易发晕。 而我更喜欢的,也是其他产品目前还无法很好实现的是「悬停模式」。 X1 芯片加持,XREAL One Pro 不用像以往 XREAL 产品一样,需要外接一个 Beam 外设,就能实现 3DoF 的空间悬停能力。 简单来说就是眼镜能将显示的画面固定在视野之中,不管是左右转头、上下抬头低头还是左右歪头,屏幕都不会跟随头部移动: 将虚拟屏幕固定在笔记本电脑屏幕上方之后,XREAL One Pro 就能实现视线在两块屏幕之间切换,和桌面办公基本无异,相当于带了一个便捷大屏在身边。 如果觉得还不够,XREAL One Pro 其实还有一个「超宽屏」的模式,能够将屏幕变成一个 32:9 的带鱼屏画面。 开启超宽屏后,眼镜内几乎整个视野都会被画面填满,并且显示画面还有一定的弧度,效果有点像电影院的 IMAX 大屏,适合看电影,或者办公时将窗口全部平铺的工作流。 美中不足的是,超宽屏模式下,画面的清晰度会有所下降。 为了能让你在公众场合也能愉快地看大屏幕,XREAL 还做了三档电致变色,眼镜会调暗屏幕之外的环境,可以调到最暗的一档,视野范围内只有一个大屏浮动在一片黑暗之中。 在户外场景中,黑色的镜片能像墨镜一样遮挡阳光,加上升级到最高 700 尼特的亮度,基本能在比较明亮的环境中正常使用。 坐高铁飞机的时候,将 XREAL One Pro 接上手机,沉浸于电影/综艺,或者工作内容当中——既不会影响他人,更不会被他人打扰——这是 iPad 和笔记本电脑的自带屏幕,所无法实现的。 要使用 XREAL One Pro 很简单,只需要用配套的 USB-C 线连接自己的手机、电脑、平板等等支持 DP 视频输出的终端设备,就能让眼镜显示画面,并不需要其它复杂的操作。 佩戴体验还需提升 单就显示效果方面,XREAL One Pro 绝对算得上是 AR 眼镜的第一梯队,3DoF 的悬停能力更是仅此一家的独门体验。 但作为一副要「上头」的眼镜,佩戴体验也是很重要的一环,而我认为 XREAL 的佩戴体验也算得上「舒适」,但也有进步的空间。 以前用过的一些 AR 眼镜,不仅个头要大上一圈,画面也不够清晰,用久了不仅眼干眼涩,还会有点头晕。 而 XREAL One Pro 的显示效果几乎可以说是我个人用过最顶级的一档,并且重量也在能接受的范围内,更重要的是,我戴着能一口气工作两个小时。 当然,在长时间使用后,眼镜的不适感还是会比较明显的。 至于很多人担心是否会加深近视的问题,目前行业争论不一。有观点认为,人眼透过眼镜看到的虚拟屏幕画面,实际上成像位置在好几米开外,比如 XREAL One Pro,就支持 2-10 米的距离调节,远远要大于眼球到手机的距离。 当然,亮度、蓝光以及屈光度这些因素,以及长时间用眼,都会对眼球有所影响。其实跟耳机一样,AR 眼镜戴久了一样会有损伤,关键看你能不能科学、适度地去使用。 简单来说:近视不近视,取决于用眼方式,而不是设备。 虽然压迫感不强,但 XREAL One Pro 它 87 克的重量控制对比其他产品来说并不算优秀,比 XREAL Air 2Pro 重了12 克,对比 44克的魅族 StarV Air 2 更是显得「重量级」了。 XREAL One Pro 给人带来的不适感,最主要不是因为这个重量,而是发热的问题:在夏天室内,使用 7 分钟就能感觉明显的温度,戴上半小时后鼻梁就会被热到出汗。 重量和发热,或许背后的「罪魁祸首」都是这颗 X1 芯片,这也意味着如果未来 AR 眼镜需要成为一个高集成的独立设备,这两个问题需要得到进一步的解决。 以及一个智能眼镜的通病:漏音。 XREAL One Pro 配备了和 Bose 联合调教的音响系统,通过眼镜的镜柄实现环绕声,虽然听感很不错,低音比之前要更好出色,但由于是开放式设计,旁人还是能很轻易听到音响当中的声音。 所以在公众场合,我肯定还是戴上一副耳机。 不考虑漏音,使用这支眼镜的「私密感」还是相当不错的。XREAL One Pro 延续了过往产品的电致变色能力,不仅支持三档调节,还有一个全新的「自动通透模式」。 简单来说,眼镜会根据视线调整画面亮度:看向虚拟屏时画面变暗,让我可以更专注;转移视线时镜片自动变亮,方便查看真实屏幕,提升了便携生产力体验。 对于近视消费者来说,XREAL 也提供了解决方案:XREAL One Pro 随盒提供了可以附着在眼镜上的镜框,用户可以用这个镜框线下自行配镜,也能直接在电商平台直接定制镜片配件。 爱范儿也了解到,XREAL 还在探索一种更加简单方便的解决方案: 一种有厚度的透明胶体,可以直接粘在眼镜的光机透镜上,从而改变眼镜的屈光度,不过目前还处在实验的阶段。 XREAL 也推出了一种同样比较实验性的配件:XREAL Eye,能够插入 XREAL One Pro 的鼻托之间,让眼镜具有 1200 万像素的拍摄能力,和虚实结合的录屏能力。 在这颗镜头加持下,XREAL One Pro 还能实现 6DoF 的悬停能力,将虚拟画面定在一个地方,用户可以走近仔细观察。 让我对 AR 更有信心的眼镜 总的来说,XREAL One Pro 是一款足够成熟的产品,能给用户带来相对舒适的体验。 分体式AR眼镜这种品类,目前处在一个相对尴尬的情况,实用,并且也算得上好用,面向的是主流最大众的消费者,没有太多使用门槛,但依旧还是一个相对小众的产品。 移动便携大屏是个更大众的市场,目前这个生态位其实由 iPad 和折叠屏手机占据,但 AR 眼镜不管是便携性还是屏幕尺寸,其实都做得更好--而这部分的需求,显然还有待挖掘。 这种情况在中国市场更甚,目前 XREAL 的眼镜出货,有七成来自海外市场。 这几年渐渐火起来的游戏掌机,其实 AR 眼镜就是一个很好的搭子,手不用端起掌机,头也不用低下看屏幕。 相信 XREAL 解决了和 Switch 2 的兼容性问题后,还能进一步刺激 XREAL 的 AR 眼镜销量。 XREAL One Pro 更像是一款「秀肌肉」的高端产品。4399 元的价格,对于 AR 眼镜来说都已经属于高价,还撞上了电视、投影仪的主流价位,而大众对后面两者的接受度明显要更高。 但 XREAL 对此相对来说比较坦然。CEO 徐驰告诉爱范儿: 我们先做好的是先打造一款百万级的爆品,我们再去努力去做千万级的爆品,然后才真正到上亿级的、全民大家都能普及的爆品,我们一步一步来。 虽然分体式 AR 眼镜是一种妥协,但却是一种更为实用主义的妥协,对比起提供平台和服务的 AI 眼镜,分体式 AR 眼镜其实更接近「配件」,XREAL 这种厂商卖得更多是硬件和技术本身。 让人更愿意先把眼镜用起来也是一个很重要的方向,因为智能眼镜也就是一种非常前沿的形态,不管是 AI 拍摄眼镜,还是分体式 AR 眼镜,都是在培养消费者佩戴眼镜的习惯。 随着像 Meta、小米这样的大牌纷纷入局AI智能眼镜,XREAL 作为一家体量和知名度都相对较小的初创企业,不去和这些大厂硬碰硬拼 AI 和摄影,继续做更脚踏实地的AR眼镜,其实也不失为一种差异化。 徐驰认为,在行业的上半场,只有持续创新能保持竞争力,靠技术和产品创新去转化到品牌和渠道,加速在全球竞争中脱颖而出。 就目前来看,XREAL 已经收获颇丰:行业巨头 Google 在智能眼镜和头显上选择了 XREAL 和三星作为合作对象,意味着 XREAL 的实力已经能和后者这家消费电子龙头相提并论。 特别是在今年 5 月的 Google I/O 大会上,XREAL 与 Google 共同开发的 Android XR 平台智能眼镜「Project Aura」,获得了足足半小时的主角时间。 和 Google 的合作,也意味着 XREAL 距离真正的 AI + AR 真 · 智能眼镜的遥远未来,又踏进了一步。 而 XREAL One Pro 所体现出的成熟 AR 显示能力,意味着这样的未来,真的没那么遥远了。 文|苏伟鸿
碰瓷雷军?米粉怒了!
「董明珠健康家」的威名,相信今年有关注家电行业热点的朋友都不会陌生。但「小雷智能家居」这个名字,不知道大家又有没有听过呢? 前段时间,建博会上一家名为「小雷智能家居」的企业引起了网友的激烈讨论。 图片来源:小雷科技 不过这个小雷智能家居并不是吃瓜网友们设想的「雷军妙妙屋」,甚至和雷军、小米都没什么关系。根据天眼查的数据,「小雷智能家居」品牌属于广东小雷科技有限公司,后者成立于 2015 年 11 月,老板也姓雷。 图片来源:雷科技 尽管「小雷智能家居」在建博会期间招牌所使用的字体和我们熟悉的「xiaomi」字体有些许相似,但从基本的社会风俗来判断,「小雷智能家居」这个名字确实也合情合理。与其说是「碰瓷」小米,倒不如说是「好的企业名字总是心有灵犀」。 咋看「小雷智能家居」这个名字,小雷感觉还是蛮亲切的,毕竟我们雷科技的IP也叫「小雷」,大家看我们的文章经常会看到「小雷」这个词,很多粉丝也亲切地将我们称为小雷。而且更巧的是,2014年成立时,雷科技的定位就是「关注智能家居、智能硬件、智能生活」的新媒体,只是经过多年发展,我们逐步进化成“聚焦AI硬科技”的新媒体机构,目前在微信、头条、百度、B 站、视频号等多个主流新媒体平台上拥有过千万的真实订阅粉丝。 因此这样看,说「小雷智能家居」是碰瓷雷军和小米,确实有些过——你不能说咱雷科技也是碰瓷吧?不过米粉有这样的感受也可以理解,毕竟雷军的形象确实已经和小米高度绑定,颇有「雷军就是小米、小米就是雷军」的风范,这也是高管 IP 化的结果。 雷军被「偷家」是高管 IP 化的结果 所谓「高管 IP 化」,是指企业将创始人或核心高管的形象人格化、标签化的做法。在成功案例中,高管不仅是企业运作、发展的掌舵者,同时也会成为企业的代言人和流量入口。 上文提到的雷军无疑就是其实就是国内「高管 IP 化」的最佳代表:经过多年的发布会和直播互动,雷军早已从一般的「创始人」转型成一位具有代表性的企业活招牌:略带口音的普通话,商务休闲的着装、平易近人的形象、工程师思维的演讲方式,再加上一些以《Are You OK》为代表的「自黑」,这些共同构成了一个具像化的「雷军」IP。 图片来源:雷科技 而雷军 IP 与小米企业形象的高度绑定,也模糊了雷军和小米的边界,构建了「雷军就是小米」的企业形象闭环。 只不过,当雷军的 IP 形象进一步扩张时,消费者也会对这种高管 IP 产生「过耦合」现象。简单来说,就是「看什么都像是碰瓷」。这时候,一个带有「小雷」字样的品牌出现;即使这个品牌同样以创始人的姓氏命名,和街边快餐店的命名方式没有差异,也难免会被外界认为是「碰瓷」雷军。 或者说,这种所谓的「偷家」,只不过是雷军作为高管 IP,向外扩散后的必然结果。 既然容易误伤,为何高管会追求 IP 化? 那问题来了:既然高管 IP 化有被「偷家」的风险,甚至可能让品牌边界变模糊,为什么还有那么多企业依旧乐此不疲,把老板推上前线当门面呢? 原因很简单:企业高管 IP 化,比使用外部代言人的效果更好、更可控。 首先,企业高管 IP 化能打破传统的「企业-消费者」的对立局面,打造更平易近人、与消费者平等交流的企业形象,小米 SU7 首批交付时,雷军为 SU7 车主开车门的形象,就是一个极为成功的宣传点。 其次,不同于使用外部代言人,企业高管与企业发展方向、利益高度绑定,相对于传统的外部代言人模式也更加可控。要知道近几年外部代言人「翻车」导致企业宣传「暴雷」,需要紧急更换宣传物料或与代言人划清界限的情况并不罕见。让高管亲自成为企业形象的一部分,反而可以规避这种风险。 图片来源:X 比如掌握 SpaceX、特斯拉、X、xAI、Neuralink 等「马」系企业的马斯克,就是「高管 IP 化」战略在全球市场中最极端、也最成功的案例。作为多家重点企业的实际控制人,马斯克每天高强度在 X(前推特) 上主动制造舆情,让自家企业股价坐过山车;或者直接在 X 上「讨薪」,要求特斯拉向其支付数百亿美元的股权。 在他的影响力之下,特斯拉和 SpaceX 早已成为了他的「衍生品」,让企业反过来成为他标签的一部分。虽然他的风格更极端,但不可否认,这种极端的个性输出,确实为给企业带来了真金白银的注意和品牌效益。 但高管 IP 化也绝非想做就能做,想红就能红。不少品牌的口碑崩塌,其实都和高管 IP 化密不可分。 图片来源:京东 以董明珠为例,作为最早试水高管 IP 化的一批企业家,董明珠拍广告,上综艺,在互联网上「造梗无数」,在消费者心中留下了「格力等于董明珠」的强绑定。但和董明珠强捆绑也给格里带来了不少无妄之灾:那些董明珠针对小米的激烈抨击、对外的「迷惑发言」、以及由董明珠亲自设计的玫瑰空调,就是高管 IP 化的典型失败案例。 不是所有的老板都适合成为「雷军」 让我们把话题重新带回文章开头那个被「误伤」的小雷。在雷科技看来,「碰瓷」的根源其实不在于小雷智能家居用了什么名字,而在于如今「雷军」这两个字,在大众心中早已不只是一个人名,而是一整套品牌、设计语言、产品逻辑与「好用不贵」价值观的集合体。 这种高识别度、高信任度的个人品牌,恰恰是雷军十几年如一日持续经营的成果。也正因如此,「雷军 IP」才如此容易被联想、被误解、甚至被「借用」。 但雷军的案例,真能被其他人照搬吗?我觉得难。 在雷科技看来,雷军的 IP 建立,不是一朝一夕蹭热度蹭出来的:从「金山」时代到小米创业,再到投资生态链企业和最近的直播互动,雷军的每一步都在构建自己的「长期主义」人设。外界看到的是「Are you OK?」,但真正支撑这个 IP 的,是雷军背后那套极度稳定的产品发布节奏,和「让每个人都能享受科技的乐趣」的品牌价值。 图片来源:雷科技 其次,小米品牌的体系化建设也给了雷军这个 IP 充足的支撑空间。小米丰富的产品线与「生态链」,为雷军带来了足够多的高光时刻和「IP 覆盖面」。无论雷军出现在小米的哪一条产品线上,都在为整个小米产品矩阵服务。 相比之下,不少失败的高管 IP 案例,问题往往出在「只凹人设,不做体系」上:高管在微博等平台大放厥词「榨流量」,但品牌却在后方「路径依赖」,根本没将高管 IP 利用上。部份企业甚至还有高管发言前后不统一的情况,就连自己的企业也无法匹配高管的观点,站在了高管 IP 的对立面。 每个老板都想「成为雷军」,但不是所有的老板都能成为下一个雷军。 再说了,高管 IP 做得再好,归根结底也只是品牌的一部分,一个人的形象再鲜明,也难以撑起所有用户的信任感。不是每个企业都需要一个「高管 IP」,更不是每个老板都适合当自己企业的「代言人」。 在搞清楚老板出镜背后的意义之前,希望各位老板还是「矜持」些比较好。
抖音直播推出“主播安心入会”政策,打击退会难、合约模糊等不当签约行为
IT之家 7 月 28 日消息,抖音直播 7 月 24 日宣布推出“主播安心入会”政策,针对公会承诺主播保底收入不兑现、霸王条款主播退会难等问题,保障主播权益。 官方介绍显示,当主播与公会在退会、合约等方面存在纠纷时,主播可申请平台介入研判,保障自身合法权益。公会在与主播进行合约签约、履约过程中,应严格遵守相关规范要求。若公会在签约条款或履约行为上存在违反相关规范的情况,平台将在退会仲裁中支持主播退会申请,同时公会将受到平台公会健康分扣减等处置。 IT之家附情形如下: 1.公会设定不合理违约金额或责任 设定不合理高额违约金 违约条款标准模糊 2.公会约定主播收入、服务不履约 承诺或约定主播收入、服务不履行 公会设置高强度直播时长、过高流水指标等不合理要求 3.公会承诺退会条件不履行 承诺或约定退会条件不履行 主播退会约定从业限制等不合理要求 利用信息差欺诈主播等 政策中提到,新主播将被赋予“无理由退会权益”:入会 14 天内的新主播,无需公会审批可直接退会;入会两个月主播,只要满足“累计开播不足 14 天”、“直播总时长未达 45 小时”或“单月最高流水低于 3000 元”三者任一条件,亦可免公会审批直接退会。
通义万相2.2正式开源:首个使用MoE架构的视频生成模型
凤凰网科技讯 7月28日,阿里宣布开源视频生成模型「通义万相Wan2.2」,此次共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-5B)三款模型,其中文生视频模型和图生视频模型均为业界首个使用MoE架构的视频生成模型,总参数量为27B,激活参数14B,均由高噪声专家模型和低噪专家模型组成,分别负责视频的整体布局和细节完善,在同参数规模下,可节省约50%的计算资源消耗。 同时,Wan2.2还首创了「电影美学控制系统」,光影、色彩、构图、微表情等能力媲美专业电影水平。用户通过输入「黄昏」、「柔光」、「边缘光」、「暖色调」「中心构图」等关键词,模型可自动生成金色的落日余晖的浪漫画面;使用「冷色调」、「硬光」、「平衡图」、「低角度」的组合,则可以生成接近科幻片的画面效果。 通义万相还开源了一款5B小尺寸的统一视频生成模型,单一模型同时支持文生视频和图生视频,可在消费级显卡部署。该模型采用了高压缩率3D VAE架构,时间与空间压缩比达到高达 4×16×16,信息压缩率提升至 64,均实现了开源模型的最高水平,仅需22G显存(单张消费级显卡)即可在数分钟内生成5秒高清视频,是目前24帧每秒、720P像素级的生成速度最快的基础模型。 开发者可在GitHub、HuggingFace、魔搭社区下载模型和代码,企业可在阿里云百炼调用模型API,用户还可在通义万相官网和通义APP直接体验。
人在WAIC,和大模型一起“狂奔”
本文为 澎湃号·湃客 x 光锥智能 联合出品 文|魏琳华 编|王一粟 “人已经多到炸馆,逛展堪比庙会。” 2025年,WAIC的火爆程度已经不用多说:闲鱼上炒到2000元一张的门票;现场随处可见的老外;各个展区被人流挤得水泄不通...... 光是外围的火爆就已经说明——今年,AI大模型在应用上已经势如破竹。 前所未有的参展产品数量,是AI应用遍地开花的佐证:创纪录的800家企业参展,带来3000余产品及100+首发新品参展,涵盖40+大模型、50+AI终端产品、60+智能机器人,和去年相比,产品数量整整翻了一番,不少观众散会纷纷戏称“逛到断腿”。 在一个展区中,你能看到各个品类下不同厂商演绎的多种玩法:机器人1:1复刻人类动作、给人类调酒、搬东西;Agent写代码、作文、当理财助手;AI+教育不仅有AI学习机、还搬上了AI黑板...... 比起看得见摸不着的Agent“数字员工”,能看到实体的智能机器人成为了会场的“顶流”。 H3展馆中,大片机器人“整活”的场景相当壮观:和真人对打的宇树机器人、练习摞百事可乐的智元机器人、魔法原子的机器狗绕着场馆跑来跑去...... 除了面向C端用户的产品爆发,在B端,AI也已经在企业中应用起来。 “就在我们公司内部,员工每天需要写很多代码,做很多研究型实验,这里边大概有 70% 的代码是 AI 来写,90% 数据分析是靠 AI 来做。”在MiniMax CEO闫俊杰的分享中,Agent构建的智能系统已经真正帮上了员工的忙。 随着年初大模型进入深度推理阶段,性能进入高可用的程度,加上训练和推理成本进一步降低。经过三年的一路狂奔,厂商们终于高调地秀起了肌肉。 推理模型的“爆发年” 从模仿学习到强化学习,大模型已经进化到2.0时代。 以OpenAI的o1模型为分水岭,2025年成了推理模型的“爆发年”。区别于以往靠大量监督数据提升性能,通过RL(强化学习)算法的训练模式,让大模型的能力迈上新一个阶段。 由此,文字、视觉、多模态等领域,叠加推理能力成了国内大模型公司上半年角逐的重点。 在WAIC大会上,“大模型新五强”之一阶跃星辰就在会上发布了自家原生多模态推理模型Step-3,在开源梯队中达到SOTA;商汤同样在论坛中发布日日新V6.5多模态基座大模型,强调强推理、高效率和智能体三大优化。 大方向转向强化学习的基础上,一个明显的趋势是,训练和推理的成本在上半年进一步降低。通过使用新模型架构的优化、训练算法的进步以及软硬件协同的算力效率提升,大模型们开始比肩DeepSeek,给出更便宜的训练和推理成本。 闫俊杰给出了一个更为乐观的判断,认为在接下来一两年之内,最好模型的推理成本可能还能再降低一个数量级。 再从应用方向来看,出于商业化落地考虑,绝大部分模型不会再去做上万的参数,同时向着商业化路线的应用要求考虑。 以视频生成来说,生数科技CEO骆怡航认为,目前整个视频生成还有进一步优化空间,他总结为“好快省”。 “首先一致性还需要提升,然后在生成的速度上还需要加快,第三是,在视频生成的成本上还要大幅降低。”骆怡航说。 对应到落地产品上,几家视频模型产品不约而同地贴合专业赛道的制作方向做优化。生数科技旗下的产品Vidu 7月发布的Vidu Q1 参考生视频功能,改变传统视频制作流程和AI图生视频流程,仅需上传人物、道具、场景等参考图,即可直接生成一段视频,完全省去了分镜制作的环节,并且参考生支持7个主体一致不变形;快手可灵AI则在会议期间发布“灵动画布”,把AI辅助和多人协作放到了一块无限大的工作界面中。 Vidu Q1 参考生视频 另外,AI公司们也开始围绕着两个业内更加关注的产品落地——Agent和具身智能,为其打造专属能力匹配的模型。 从智能体的发展来看,今年上半年涌现出一些为Agent“量身定做”的模型,比如更匹配上下文理解的超长文本模型、优化Agent“视力”的视觉推理模型。再有,随着具身智能的火爆,为机器人打磨“视觉”和“大脑”的任务也落在了大模型公司们的身上。在商汤、科大讯飞、阶跃星辰等公司的展台,也有机器人在站台表演。 最火热的落地 Agent、具身智能 当大模型能力突破到一定阶段,应用也随之爆发。 阶跃星辰创始人、CEO姜大昕表示:“从Step 1到Step 2两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。” 在WAIC现场,Agent和具身智能成了会场中最热门的两个赛道。多模态能力和推理能力的提升,让Agent和具身智能装上了“眼睛”和“大脑”。 Agent,几乎出现在各个展台中: 面向C端用户,有少量通用Agent和多种面向细分场景的垂类Agent。比如百度的GenFlow 2.0支持多个智能体协作,阶跃星辰的Agent则装到了智能手机端上,搭载AI拍照问、AI助手等功能;刚上新全栈功能的MiniMax Agent,能让用户在几分钟做个网页出来。 在智能硬件端,Agent也开始接管起人的生活体验。美的高端定位AI科技家电品牌COLMO落地应用了行业首个适配家电家居全场景的AI Agent智能体——COLMO AI管家,通过“多维感知-自主学习-推理规划-决策执行”,提升智能家居对场景的理解能力。 做To B生意的软硬件厂商,智能体成为企业帮助客户增量提效的落地手段。除了在软件端应用,软硬件协同的厂商也在AI平台中植入智能体服务。在DeepSeek一体机展台,光锥智能就见到了政务/医疗等领域的Agent,作为其软件服务端的新产品能力。 在上半年的进展中,一个明显的趋势是,AI Agent从打辅助的定位,已经开始过渡到自主驱动任务完成的阶段。 以亚马逊云科技发布的编程智能体Kiro为例,它的Spider模式,在Agent执行任务的需求-计划-执行过程中,AI已经能在每个环节中提供助力。Kiro技术专家举了个例子,比如,当用户给出一句话需求后,AI会根据需求创建更为详细的PrD(产品需求文档),把各种隐性的需求挖掘出来,确保AI能够精准执行任务,做出可交付的产品。 在企业内部,多智能体的运转协作已经初见成效。 谈及大模型在工厂内部的落地,美的集团副总裁兼CDO张小懿告诉光锥智能,目前已经看到了工厂用大模型的能力在进行工厂的运营改进,在3-4个月的尝试中,目前靠智能体已经能帮助产品实现品质和效率上的提升。 “在美的洗衣机荆州工厂,我们已经上线了14个智能体,这14个智能体能够互相关联起来运行,”张小懿说。过往,这些数据全都需要人和人直接沟通协作,寻找问题根源。但交给智能体后,它自己就会找当时的参数情况、设备、产线和具体型号,再判断出大致的结果。 “把控品质的智能体,它能够把相关数据全部回流到其中,实时判断情况,当发现品质波动,它反过来会影响到负责产品设备维护的智能体和设备工艺智能体。”张小懿说。 纵观下来,Agent市场在半年的搭建过后,在和企业磨合试验的过程中,暴露出一些技术上亟待完善的工作。 有Agent平台工作人员告诉光锥智能,目前开发者们更关注长时记忆和MCP的生态扩充,前者决定了让Agent能够在需要长久记忆的场景保留上下文信息,而针对一些即时场景,则需要及时将信息清理,避免无谓的成本浪费;MCP的扩充让Agent有更多工具可供调用。 同样靠大模型武装“大小脑”的具身智能,成为了这次展会品类数量最多的一个。 以具身智能的头部来说,其主要包含大脑、小脑两个部分。以主流的“大小脑”分层架构来说,其中多模态大模型作为“大脑”,负责感知、理解和规划;再由多个小模型结合运动控制算法组成“小脑”,负责运动控制和动作生成。 不过,对于产品百花齐放、融资热切的具身智能赛道来说,一切还处在开始阶段,距离实际场景来说,还离落地太远。 其中发生在机器人赛道的一个问题是,今年,软硬件拉开的差距更大了。 和云深处合作布局安防机器人赛道,康迪机器人技术总监崔广章对光锥智能表示,目前,硬件与软件之间的代差还在加大。软件已经进入了验证到量产的过程,但硬件还没有达到,在功能、稳定性和成本表现上还差了一些。 目前,面向工业的机器人的软硬件水平,已经可以满足在特定工业场景下的一些任务。康迪科技和云深处合作的机器狗将销向北美,用于北美仓库的安防巡检场景。 犹如去年徘徊的大模型落地,这两条赛道还需要更多的摸索和模型能力的进化支撑。 加速落地 “AI大模型的发展,从人工智能第四次浪潮的元年2022年开始,各路英豪都在一路狂奔。”科大讯飞副总裁李翔说。 在大模型技术上线不断被拓宽的过程中,AI+大模型也在重构产业智能的生态。在B端,通过AI挖掘数据和产业互联网的价值,大模型和智能体逐渐承担起更多提升收入、降低成本的任务。 “市面上的开源大模型很多,但它们都是独立的个体”,做AI+工业互联网的卡奥斯化工行业总经理康健告诉光锥智能,“无论是垂类小模型还是行业模型,散点的价值还是有限的。” 以化工大模型为例,卡奥斯没有选择上来就做模型,而是搭了一个工业互联网平台,把三个城市的所有集团和二级单位的业务和数据拉通,再进行数据收集和治理。在这个基础上,大模型和智能体,就有了业务的需求拉动及数据的支撑。 康健举了个例子,以延长石油为例,生产经营智能体及市场产品价格预测智能体的协同应用,会根据产业链上的实时情况调整生产策略。根据成品油及化工品的价格及收益情况,调整生产计划及各自产能,让集团产业链价值最大化。 “没有业务及数据的互连,它拉通不了全产业链和全价值链,就不能把用户本身和供应商连起来,如果不连起来,智能体的价值就无法最大化。”康健说,“用单场景模型,你一年可能省10万,如果基于我们的全产业链大模型进行智能优化,可能全年的价值是一个亿”。 比起去年清一水但稍显苍白的行业客服、对话助手,通过深度结合行业数据,AI今年在各行各业跑出了一些更具行业针对性的新功能,展现出更为成熟和实用的应用前景。 在AI+医疗行业中,大模型公司通过和医院合作,在数据训练的基础上,一些有应用价值的功能开始陆续落地。阿里在展示台放了一个AI CT扫描的功能,基于其通用多模态医疗大模型,模型能够根据病人的医学影像自动生成详细的诊断报告,辅助医生做判断。 模型的能力决定应用的上限,今年同理。其中一个明显的节点就是推理模型DeepSeek-R1为代表的各个推理模型发布,进一步提升了AI在行业中的应用能力。 以教育行业为例,以DeepSeek为代表的推理大模型能力突破,在AI教育方面找到了对应的应用场景。 “通常来讲,家长对于AI教育有很多顾虑,比如担心直接抄答案、误导学生,但是今年最大的一个利好就是DeepSeek的出现。”学而思学习机AI产品负责人李通说。“只有当家长自己试过大模型,并且认可了能力,他才会愿意让自己的孩子也试一试。” 李通提及,编程和解题是基座大模型过去一段时间提升较为明显的能力。对于纯文本数学题,大模型能在完全没见过的情况下,做到92%的准确率。在解题率提升的基础上,今年AI在大模型一对一讲题这个场景,在过去的这段时间里面出现明显的突破。 从“炫技”到“实干”,AI大模型正破冰行业深水区。随着AI能力的进一步突破,冰山之下蕴藏的价值,才会慢慢展现全貌。
大厂眼镜一戴,谁也不AI
阿里哇哦AI智能眼镜在本届WAIC(世界人工智能大会)上首度亮相,在1号馆的阿里展位上,一个硕大的模型十分显眼,屏幕上的绿色文字展示着这款AI眼镜的光波导AR技术。 而在前一天下午的人工智能终端产业发展论坛上,阿里巴巴智能信息事业群终端业务负责人宋刚介绍了该产品的功能细节。这也意味着阿里将是继小米之后,又一位入场AI眼镜的赛道的头部企业玩家。 不过,据现场参展人士透露,WAIC现场的阿里AI眼镜并无法点亮,产品展示停留在“模型机”和外观层面。一些业内人士向“直面AI”表示,阿里AI眼镜其实还在比较早期的阶段,目前展示的产品还只是工程机,距离可市售仍有一段距离。 此前的相关报道显示,阿里AI眼镜分为两个版本——不带AR显示的AI智能眼镜,以及带显示的AI+AR智能眼镜,后者优先级更高。产品硬件层面,这款眼镜与此前发布的小米AI眼镜类似,采用高通骁龙AR1+恒玄BES2800的双芯架构,传闻其代工厂商为“果链”硬件巨头立讯精密,正式发售时间预计为今年的“双十一”。 但是,不管是在WAIC的阿里展位上,还是在宋刚的介绍环节,都没有提到无AR功能的版本。据业内人士介绍,光波导AR功能需要在设计上预留投影装置的位置,因此两个版本共用同一模具的概率较小。也就是说,阿里方面是否会同步推出非AR版本的产品仍是未知。 据了解,从2024年年底开始,阿里相关业务就开始了一系列整合。先是“通义”应用团队正式从阿里云分拆,并入阿里智能信息事业群;再到拥有To C硬件品牌“天猫精灵”的智能互联事业群宣布与夸克团队相融合,此次发布的AI眼镜,是阿里自去年底整合AI To C业务之后推出的首款AI硬件产品。 过去一个月内,小米首款AI眼镜发售后引发巨大热度,让智能眼镜为更多消费者所熟知。传闻中3天销量达到5万副,甚至部分线上线下渠道出现卖断货的情况,堪称智能眼镜届的“小米YU7”。在此前的返场直播中雷军表示,“很快会补货,大家不要着急。” 而采用了光波导AR技术的阿里AI眼镜,相比小米AI眼镜多了AR显示功能。据了解,光波导因其轻薄和外界光线的高穿透特性,被认为是消费级AR眼镜的必选光学方案。经过行业的多年发展,光波导成本已逐步降低,但技术的成熟性还有待市场进一步检验。相比小米,阿里似乎选择了一条更有“野心”的道路。 另一边,互联网内容巨头字节跳动自研AI眼镜的消息也不断传出,相关信息显示,字节自研AI眼镜也有望于年内发布。届时,伴随着阿里/小米/字节三家头部企业相继入场,智能眼镜市场是否会迎来一个“三国”时代? 01 阿里AI眼镜:功能很全面,设计有争议 “我们用它重新定义了AI眼镜的新标准,它是一个真正的随身超级助理,他是一个全天候、多场景可使用的智能终端。”昨天下午的论坛上,阿里智能终端业务负责人宋刚这样介绍道。 不过,本届WAIC上,阿里AI眼镜仅仅是“展示”,离正式发售还有一段时间。而据阿里方面人士介绍,阿里AI眼镜已完成研发工作,本次是首次以完整产品形态亮相。 观察阿里AI眼镜的外观可以发现,由于在两侧集成了光波导组件,这款智能眼镜正面看起来比同类产品要更宽一些,镜框到镜腿由一条曲线过渡,握持部分较为纤细,但其电池和主板模块均集成在镜脚处。目前展示的配色中,也仅有黑色一种。 “一副超级眼镜,首先还要戴着好看、戴着舒服。”在宋刚的介绍中,轻便的镜腿设计是阿里AI眼镜的外观亮点之一,阿里AI眼镜通过定制小型化的扬声器,使得镜腿更细,镜框更窄、更薄。不过,由于产品还在工程机阶段,无法进行实机体验该产品。 “其实他们(阿里)目前还是比较早期的阶段,我不太理解为什么这个时间节点要着急放出来。”在观看了论坛上宋刚的产品介绍后,某头部智能眼镜厂商产品经理吴晨这样感慨道。 虽然产品无法实机体验,但基于WAIC的热度,以及目前展位上的产品外观展示,这款AI眼镜在业内还是引发了不小的关注度。在一些业内人士看来,一方面,阿里AI眼镜可插拔电池的设计,为解决AI眼镜续航提供了一个新思路;但整体设计观感上却有点“不太平衡”。 “感觉他们(阿里)是什么都想要,既想要一个小巧的外观,又想要光波导的显示。”谈及看到阿里AI眼镜的第一感受,吴晨表示,阿里AI眼镜一方面兼顾了比较多的功能,同时又想实现相对轻便的结构,导致其设计思路有些“拧巴”。 吴晨进一步解释了他的观点,他表示,目前,包括小米在内的主流AI眼镜产品都将主板设置在镜腿前侧,也就是更靠近转轴的位置。而阿里AI眼镜选择将主板模组设置于其中一条镜腿的末端。主板模组后置的设计,理论上可以获得相对更细、更轻便的镜腿,但研发团队又在镜腿中段塞下了两个扬声器模组。“从侧面观察这个产品,会有一种‘一会细,一会粗’的违和感。” 此外,主板模组后置到镜腿末端的设计,在用户体验上可能要打一个问号。吴晨表示,镜脚的位置和用户皮肤直接接触,而采用高通AR1芯片的眼镜产品,在拍摄等高功耗场景下,往往会出现发热的情况。“一些场景下AR1芯片温度可以达到40度以上,不知道他们(阿里团队)后续会怎样优化这个散热问题。” 目前,智能眼镜市场主要有两条技术路线,一条是小米/Meta拍摄+AI的赛道,另外一边则是雷鸟、Rokid和Xreal此前发力的AR赛道。像阿里AI眼镜这样AI+AR的融合产品,此前只有雷鸟/Rokid等企业有推出相关产品。 Rokid创始人兼CEO祝铭明,在小米AI眼镜发布时就曾表示:“产品不大一样,其实没太大竞争,要和小米学习。”而阿里本次推出的AI+光波导产品,也表明行业内技术融合的速度正在加快。 吴晨所在的企业,同样有采用光波导方案的AR智能眼镜产品,面对阿里的同类产品竞争,他表示,友商们都还比较“淡定”,因为当前的智能眼镜市场,离残酷竞争市场份额的局面还很远。“各家厂商从供货到库存,都还没到一个供过于求的情况。” 02 大厂各有优势,三国杀时代来了? 对于AI眼镜这样的新兴产品而言,硬件选型+软件适配在前期研发阶段尤为重要,也考验着厂商的供应链管理和协调能力,在这一点上,“大厂”们确实有一些先天的优势。 “小米的优势在于供应链成本,他能以很低的价格批量买到大量的原材料。”吴晨表示,硬件厂商小米在开发新产品上有着天然的原发优势,且小米的产品思路一直相对“保守”,会优先采用成熟稳定的硬件方案。而对于阿里而言,虽然天猫精灵旗下也有一些硬件产品的积累,但其主要优势来自于软件端的适配。 相比起同为互联网行业竞争对手的字节跳动,在软件生态上,阿里系产品与可穿戴硬件有着更好的适配性。 从去年发布的Rokid Glasses,到刚刚发布的小米AI眼镜,这些产品都曾先后接入了支付宝/高德地图等阿里系产品。相比起暂时只能在Ola耳机上落地“豆包”和“汽水音乐”的字节,阿里方面可落地的软件生态更多元,也似乎更“有用”。 在昨天阿里AI眼镜的展示环节,宋刚也针对软件生态进行了重点介绍。其中,飞猪、支付宝、高德地图、淘宝、饿了么作为自有软件生态组成了“AI硬件入口”的核心阵地。同时,在现场的播放demo中,阿里AI眼镜演示了“拍照识别商品”“看一眼比价”等全新使用场景。 不过,对于第三方眼镜厂商而言,阿里系硬件产品虽然庞大,但也并非垄断了市场,类似软件也能找到替代的合作伙伴。而在这一背景下,阿里一直有在积极“吆喝”自家软件生态。据业内人士介绍,一些第三方智能眼镜接入支付宝的动作,背后是阿里方面主动推进的结果。 另一方面,在AI能力建设上,业内一些头部智能眼镜厂商早已是阿里的合作伙伴。今年年初,雷鸟创新RayNeo与阿里云达成独家战略合作,通义系列大模型将为雷鸟创新的AI眼镜提供独家定制的技术支持。另一家智能眼镜头部厂商Rokid旗下的AR眼镜此前也接入了通义大模型。在AI+智能眼镜的生态上,阿里经取得了一定的先发优势。 而提到另一家互联网巨头,已经秘密研发智能眼镜很久的字节跳动,吴晨表示,业内对于字节最大的担心主要围绕两个字:砸钱。在一些业内人士看来,字节此前对于新业务会进行“All In”式不计成本的投入,当年字节收购PICO后,就曾给VR硬件行业带来“钞能力”的震撼。 VR市场的“震撼”回忆发生于4年前,2021年,PICO在国内掀起价格战,部分产品的售价一度低于2000元。有字节加持的PICO,疯狂降价的同时也到处投流,PICO免费体验、打卡免费送的广告在各类社交媒体上到处刷屏。结果是,那一年之后,许多国内VR厂商逐渐退出本土市场,开始转向海外高端化赛道。 毫无疑问,价格战是所有头部企业“杀手锏”,不过当下智能眼镜市场还在扩张期,产品技术迭代迅速,业内的竞争关系相对良性,这一背景下出现价格战的可能并不大。但随着阿里和小米分别带着各自生态优势入场,加上暗中发力的字节跳动,智能眼镜行业似乎将迎来几大巨头的“三国杀”时代。 03 产能有限,产品“鸡肋”,短期内还是“诸侯混战” 当前,国内智能眼镜市场始终保持着稳定的高增速。IDC预计,2025年中国智能眼镜市场出货量预计达到290.7万台,同比增长121.1%,其中音频和音频拍摄眼镜出货量预计216.5万台,同比增长178.4%;AR/VR设备出货量预计74.2万台,同比增长38.1%。 快速增长的市场背景下,也对各家厂商的产能提出了挑战。自发布以来,传闻中首批备货30万台的小米AI眼镜,在短时间内就出现了卖断货的情况。另一方面,阿里AI眼镜两个版本中仅亮相一个,尚不清楚是否会铺开两条生产线。而据相关行业人士透露,阿里AI眼镜首批备货目标为10万台。 在更早前,一些厂商在新品发布后缺少现货的情况并不罕见,受产能限制,一些智能眼镜产品甚至卖成了“期货“。 “手搓一个工程机是比较快的,但更大的问题在于优化和量产。”在吴晨看来,量产和供应链管理环节是困扰当前智能眼镜厂商的重要因素之一。 “年初开始业内就在讨论‘百镜大战’,半年时间过去,真正能突破的厂商并不多。”吴晨表示,智能眼镜的研发难度并不低,其研发+生产的周期也一直被低估。和手机行业相比,手机行业已经高度成熟,设计也已普遍模块化。而智能眼镜领域高度依赖定制化,各家厂商的设计思路也有很大差异。 “这个行业推一个产品的周期,没有大家想象的那么短,目前供应链也相对不成熟。”谈及接下来的行业形势,吴晨表示,在硬件研发能力上,大厂们并不一定有绝对优势,打磨产品的周期也相对较长。“一些互联网企业并没有‘硬件基因’,下场做硬件其实要交更多的学费。” 在吴晨看来,目前真正有“硬件基因”,且身处智能眼镜领域的大厂,只有小米一家。他表示,如果小米长期投入做智能眼镜的话,未来也许会成为业内很重要的厂商。“但就目前这个阶段而言,小米也没有特别明显的优势。” 吴晨的观点也是一些业内人士的普遍看法,即未来1-2年的智能眼镜市场,相比起巨头争霸“三国”时代,可能仍然是诸侯混战的“战国”时代。而做出这一判断的原因,主要源于当前产品普遍的不成熟。 “虽然名字叫做AI眼镜,但实际的功能还是以拍摄为主。”在交流中,一些业内人士表示,AI虽然是一个很重要的功能点,但目前大模型在眼镜上能支持的场景有限。“主要还是满足用户的一些听歌、拍照的需求,这两个功能可能比较占了用户使用眼镜设备的频率的70%以上。” 这一结论在相关研报中也可窥探一二,Wellsenn XR此前发布了一份针对某AI眼镜进行的用户调研,该报告走访了200位某品牌AI眼镜用户,可以初步窥探国内用户视角下对AI眼镜的看法。 根据这份报告,只有22%的用户是被AI功能吸引而产生的购买想法,拍照和立体声功能反而是主要的动机来源。报告中还专门询问了用户对于AI功能的满意度,仅有8%的用户表示“很满意”,55%的用户选择了“不太满意”。 “想象一下在办公室或者在地铁上,旁边坐着很多人,然后我戴着眼镜,突然开始自言自语。”作为硬件产品经理的吴晨,点出了在眼镜上使用AI能力的痛点。同时,当前的AI语音识别和交互能力尚未达到“无感”级别,且对用户所处的网络环境有较高要求,这些都对AI能力在眼镜上泛用性上提出了挑战。 而在一些业内人士看来,处于“启蒙”阶段的智能眼镜市场还远没有到收割用户的阶段,这也解释了为何没有大厂掀起“价格战”,而未来市场仍将是“群雄争霸”的局面。对此Xreal CEO徐驰此前曾这样评价:“AI眼镜体验还没过线,没到下半场抢市场的时候,慢慢来。” 04 未来:打通硬件生态,挖掘线下潜力 除了软件端的适配问题外,作为一类可穿戴硬件终端,智能眼镜仍然有着产品形态上的局限性。 “智能眼镜目前没有办法作为一个一体机单独使用,所以长期来看,只做眼镜的厂商会面临一个相对不利的局面。”吴晨表示,除了小米这样的传统硬件厂商之外,业内大部分企业都缺少硬件生态的交互能力。而在上月发布会的演示中,小米AI眼镜完成了诸如控制智能家电这样的跨端交互。“如果你是小米生态的用户,用起来就会很爽。” 事实上,小米AI眼镜拥有的这些能力并不新鲜,智能家电控制、拍图问答、计算食物卡路里、实时翻译以及通过语音操控小米手机拨打电话、设置提醒等功能,绝大部分都是手机端超级小爱已经具备能力的移植。作为手机端原生AI助手,超级小爱相比豆包等“同行”可以实现更多跨端交互。 不过,其他厂商们并非没有机会打破这一局面。此前,苹果方面曾传出,将会和阿里合作让iPhone的AI功能在国内落地。而国内手机厂商也不乏联合外部AI服务商,搭建第一方AI助手的案例,像vivo系统级AI助手“蓝心小V”,就通过火山引擎接入了豆包大模型。 另一方面,其他友商们也在积极准备“解法”。据吴晨介绍,他所在的团队已经在和一些手机厂商展开合作,探索接入一些品牌的硬件生态。另一种方案就是打造智能眼镜一体机,直接为眼镜插入eSIM卡,使得智能眼镜可以单独联网。“我们甚至考虑自己做一个终端,除了联网还能作为眼镜的充电宝。” “眼镜是个戴在脸上的东西,不像手机,不管好不好看,反正平时就放在兜里。”身为产品经理的吴晨,道出了眼镜作为可穿戴产品的另一个特殊性。他表示,智能眼镜除了是电子消费品外,还需要考虑用户因近视等原因的配镜需求,同时还要兼顾时尚单品的作用。“事实上,买回来一个眼镜,用户先看的是和自己脸型、肤色适不适配。” 因此,和其他智能产品更多靠线上渠道走量的现状不同,智能眼镜对线下渠道有一定依赖性,一些智能眼镜厂商也相继加速线下门店的建设。Rokid此前就曾宣称,今年年底覆盖超过1000多家线下眼镜门店,明年的出货目标是100万台。而对于阿里/字节这样互联网企业而言,在线下渠道并没有先天优势,同样需要依赖与眼镜品牌合作进驻线下市场。 “小米是个例外,小米之家的数量可能比一些眼镜店还要多。”说到线下渠道,吴晨又一次提到了小米。然而,除了硬件厂商带来的渠道优势,小米背后还有其强大品牌力所带来的“启蒙效应”。 “本来看发布会是在蹲YU7,结果被AI眼镜种草了。” “直面AI”在走访了一些智能眼镜用户后发现,小米AI眼镜在宣发阶段的热度远超其他企业,约6成小米AI眼镜用户是因为品牌原因,才第一次关注/购买智能眼镜。 在这一点上,后入场的阿里和字节并不具备同样的优势。不过,目前智能眼镜行业内并没有明确的“后发竞争者”,在技术和供应链层面,行业内的所有玩家,都在于一个开放和积极拥抱变化的状态。 “智能眼镜领域现在没有能称之为‘护城河’的东西,目前的产品也在一个相对早期的阶段。”吴晨表示,智能眼镜今年以来吸引了如此多热度,除了大厂入场外,近年来传统智能设备缺少新业态也是影响因素之一。 “连手机折叠屏也讲不出新故事,大家都想有一个新话题,然后目光就投到 AI眼镜这边。”吴晨这样总结道。 (文中吴晨为化名)
比尔・盖茨:AI进步速度远超预期,大学毕业生找工作更难
IT之家 7 月 28 日消息,微软联合创始人比尔・盖茨当地时间上周日在接受 CNN 专访时指出,人工智能(AI)技术的进步速度远超他的预期,尤其是在编程和深度研究领域。 盖茨认为,AI 将改变白领和蓝领的工作环境,尤其是对于大学毕业生来说,找工作将变得更加具有挑战性。他提到,AI 可能会替代某些简单的工作,如电话销售或客户支持,但在人类最具创造力的领域,AI 将更多作为辅助工具使用。尽管这种变化可能会带来短期的不适应,但盖茨认为提高生产力将带来更多积极影响,能让人们有更多机会去做更有价值的工作。 在谈到人工智能(AI)与人工通用智能(AGI)之间的区别时,盖茨表示,人们对于这两个概念有着不同的定义。他认为,当 AI 工具能够以比人类更便宜、更准确的方式完成“电话销售工作或支持工作”时,AGI 就将实现。 盖茨还提到,AI 的发展速度让他感到惊讶,尤其是新增的深度研究功能。他举例说:“我有一个优势,那就是我可以随时向一些非常聪明的人请教物理学方面的问题。但现在,我开始使用深度研究功能来获取答案,然后再将这些答案发给我的聪明朋友,问他们‘嘿,这个答案对吗?’而大部分时候,他们都会回答‘哦,是的,你根本不需要我帮忙’。” 此外,盖茨表示,他正在与微软和 OpenAI 合作,以确保 AI 工具能够在低收入国家得到推广使用,从而帮助这些国家在健康、教育和农业等领域取得进步。 IT之家注意到,当被问及对年轻人在 AI 时代应对复杂就业环境有何建议时,盖茨说:“掌握这些工具的能力既有趣又令人振奋。拥抱 AI 并紧跟其发展将非常重要。但这并不能保证我们不会出现大量的人员流动。”他补充道:“不过,我仍然坚持我一直以来的建议 —— 年轻人要保持好奇心,多阅读,并使用最新的工具。”
云天励飞宣布全面聚焦AI推理芯片!要支撑万亿参数大模型
作者 | ZeR0 编辑 | 漠影 国产AI芯片正处于重要的历史机遇窗口。 今年的模型创新仿佛踩上风火轮,开源模型密集发布更新,进一步引爆推理需求增长。AI推理芯片将在接下来的AI产业发展进程中扮演更加重要的角色。 在世界人工智能大会期间,云天励飞公布全面聚焦AI芯片的最新战略,并披露最新AI芯片全产品矩阵及未来三年商用路线图,计划到2028年将单芯片算力最高扩展至数千TOPS。 凭借创新的“算力积木”架构,云天励飞AI芯片能实现7B、14B、130B、671B等不同参数量大模型的高效推理,适配DeepSeek-R1系列模型、阿里QwQ-32B模型及国产鸿蒙操作系统。云天励飞CTO李爱军告诉智东西,包括DeepSeek、Qwen模型在内,云天励飞AI芯片与主流开源模型均已完成适配。 特别的是,云天励飞打造的是“纯血版国产工艺AI芯片”,而且实现端边云“三栖”落地,应用场景小到嵌入式硬件,中到边缘计算与具身智能,大到万亿参数大模型。 在具身智能领域,云天励飞已与十余家机器人厂商建立合作关系,边缘芯片产品应用于服务型机器人已进入实际部署阶段。该公司还作为创始股东之一,参与投资了深圳国创具身智能机器人有限公司,探索AI推理芯片在具身智能等未来前沿方向的应用和落地。 值此时机,云天励飞为何全面聚焦AI芯片?又如何在日趋激烈的AI芯片竞赛突出重围?云天励飞董事长兼CEO陈宁博士、云天励飞CTO李爱军与智东西进行了深入交流。 一、风起大模型,解读AI推理风向与历史性机遇 云天励飞董事长兼CEO陈宁博士谈道,2030年是全球公认的AGI(通用人工智能)可能实现重大突破的一个转折时间点。 2025年上半年,AI应用落地提速,Agent成本的降低将带来应用普惠,随着AI应用无处不在,全球AI将从训练时代进入以应用驱动为核心的推理时代。 过去十多年,AI领域经历了以训练为核心的GPU时代——通过训练大规模模型获取基础能力,类似于电力时代的“发电”,注重大规模生产算力。 而AI推理芯片的关键在于“用电”,即在终端及云边端以低成本、高效率完成推理运算,更关注成本效率及规模化应用,不像训练芯片那样依赖CUDA。 在此背景下,AI推理芯片的重要性逐渐上升,成为推动AI技术应用落地及与商业化的核心驱动力。 陈宁认为,AI推理芯片不仅在推理效率、能效方面具有重大优势,它们还将作为智能硬件、机器人、智能设备等终端产品的“引擎”,成为AI产业大规模应用的核心基础。 AI推理芯片是中国抢占第四次工业革命的一张关键入场券。随着2030年AGI(通用人工智能)突破的潜在临近,AI推理芯片能否实现成本、性能和生态的突破,决定了中国能否在新一轮技术浪潮中占据主动。 未来五年,从可穿戴设备、AI原生硬件、智能终端到算力设备,AI将重塑所有电子设备,推理算力网络将无处不在,推动推理芯片市场迎来爆发。 在国外先进算力几乎完全禁售的背景下,这将带给国产全自主可控AI推理算力巨大市场机会。 经过10年积累,云天励飞在AI推理芯片技术研发和市场应用上的布局逐渐成熟,选择在2025年全面聚焦AI推理芯片,抓住这一历史性机遇。 二、围绕AI芯片沉淀四大业务板块,端边云支撑高性价比大模型推理 到2028年,云天励飞计划研发三代“算力积木”架构,布局三大商用计算平台(深界、深擎、深穹),算力最高可扩展至数千TOPS。下一代芯片将基于第二代“算力积木”架构,通过新型计算、近存计算、NB-Mesh新型互连、新型封装、NB-Link通用扩展性五大创新,打造新型大模型推理平台。 · 深穹:大模型推理一体机 · 深界:边缘网关、边缘盒子 · 深擎:机器人/无人机/无人车 基于国产工艺及自研“算力积木”架构,其深界DeepEdge10平台已适配DeepSeek、QwQ-32B模型及鸿蒙操作系统。 云天励飞的整体产品布局围绕自研AI推理芯片展开,沉淀出4大业务板块,布局端边云,联合生态合作伙伴推出覆盖从模组、边缘推理盒子、AI推理加速卡、大模型推理一体机、智算服务器等产品。 其产品已广泛应用于智算中心、智慧城市、具身智能机器人等领域。 2024年6月,云天励飞签署《AI算力运营合作框架协议》,拿到16亿元的算力服务大单,提供总算力规模约4000PFLOPS的AI训练及推理异构算力服务。 面向具身智能和机器人领域,云天励飞战略投资闪极科技、智慧互通、臻识科技、神州云海、国创具身机器人等,为AI推理芯片的应用开辟了更多元化的场景。 未来云天励飞AI推理芯片计划重点面向三大市场:边缘计算、云端大模型推理、智能机器。 在市场拓展方面,云天励飞获得16亿元算力服务大单,显示了其产品在部分关键领域的商业认可度。 三、靠芯片拿到创业“第一桶金”,云天励飞做AI芯片的基因与优势 身为一家AI公司,云天励飞为什么要自研AI推理芯片?答案是通过深入匹配特定应用场景,自研AI芯片一旦形成规模化,就能带来更好的成本效益。 据陈宁分享,云天励飞核心创始团队具备深厚的NPU芯片设计经验,最早从2009年开始参与神经网络处理器相关设计。 该公司的第一笔融资,也来源于芯片。 2014年,云天励飞刚成立时,初心是通过NPU降低AI计算成本,当时还用NPU课题申报了政府的人才引进项目,还拿下第一,得到研发资金支持。 可以说,芯片,正是云天励飞初期获得投资的关键。 云天励飞在2015年启动第一代深度学习处理器的研发,2018年-2019年第二代AI芯片DeepEye1000流片成功,并且在之后几年中,云天励飞AI芯片相继并下国家发改委、科技部、工信部重大专项的“大满贯”,结合自身技术积累及市场需求,逐步发展成集芯片设计、软硬件集成和应用落地于一体的企业。 2020年5月,因被列入美国实体清单,云天励飞不得做出战略调整,坚定转向国产工艺路线。 面对国产工艺尚不成熟的挑战,它首创“算力积木”架构,并敲定国产先进工艺的合作,成为首家采用国产Chiplet工艺的AI芯片,自此踏上用国产工艺设计商用AI芯片的新阶段。“算力积木”架构通过模块化设计解决单芯片面积与良率的矛盾,以实现算力的可扩展性和商业化应用。 自2020年决定转向国产工艺后,云天励飞不仅克服了当时国产工艺的不成熟问题,还通过技术创新实现了算力积木架构的突破。通过自主研发的算力架构和互连技术,云天励飞在推理芯片领域取得了显著的技术进展,并将其成功转化为实际的产品。 此后两年多时间,云天励飞斩获第十届吴文俊人工智能专项奖芯片项目一等奖,发布大模型边缘推理一体芯片深界DeepEdge10,全面入局大模型推理。 这两年来,云天励飞相继推出AI推理芯片深界DeepEdge200、大模型推理加速卡深穹6000及深穹X6000 Mesh加速卡,其DeepSeek一体机解决方案在深圳龙岗、南山、湛江等城市落地。 结合算力架构演进趋势,云天励飞在过去10年研发了5代NPU,技术路径贯穿从小规模CNN算法到面向大规模预训练模型的异构计算需求。这些在智能硬件、智算中心、智慧城市等领域积累的know-how和经验,为其芯片设计和持续迭代提供了明确指导,形成了算法-芯片-应用的“数据飞轮”闭环,推动AI和芯片技术持续迭代。 “算法芯片化”一直是云天励飞的核心技术策略,将不断进化的AI算法映射至芯片架构,确保算法与硬件高度契合。基于技术与应用双轮驱动,云天励飞旨在提升AI推理芯片在性能、成本、功耗及生态兼容等方面的综合竞争力,坚持“算法芯片化”技术策略。 通过与生态伙伴紧密合作,云天励飞进一步加强了产品的市场适配,尤其是在具身智能和边缘计算领域,确保其AI推理芯片能够在不同应用环境中发挥最佳性能。 结语:AI推理芯片未来,看中国 AI芯片是智能硬件和算力网络的核心,AI推理芯片的需求已进入加速期,国产AI芯片正面临前所未有的机遇。而中国作为全球AI产业重要一环,必须在这一浪潮中抓住核心技术机遇。 云天励飞通过“算力积木”架构和国产工艺的创新,以及持续的产业积累,提供高效、低成本的AI推理芯片产品,逐步打破技术和工程壁垒,满足大模型推理的广泛需求。 随着AI推理需求的爆发和国产生态的不断完善,AI推理芯片的全球竞争预计将更加激烈。国产AI芯片的发展不仅依赖于技术突破,更需产业链上下游的协同配合。 面对技术突破及生态构建挑战,云天励飞的战略聚焦将不仅限于技术创新,还要通过推动推理芯片标准化,为国产芯片在全球市场的布局铺平道路。
马斯克承认有生之年难以实现星际旅行:99%精力应放在地球
快科技7月28日消息,据“超角度”报道,近日,马斯克做客Xtakeover活动,与主持人直播连线进行访谈。 在谈到SpaceX星际旅行计划时,马斯克表示,可能在我有生之年实现不了,但最终会实现。 对于移民火星的问题,马斯克认为,具体的治理方式应该由火星人决定,但目前我自己也不清楚。 除非火星完成地球化,否则我们还不能在户外生活,初期可能得住在类似地下室的地方。 至于为什么要耗费巨大精力去实施火星计划,马斯克解释道:我的想法是,99%的精力确实该放在地球,但或许1%可以用来致力于成为太空文明,成为多行星物种。 因为这涉及一个“防御性理由”:如果发生某种灾难降临地球,摧毁人类文明——可能是第三次世界大战,也可能是像灭绝恐龙那样的陨石撞击。 我们需要确保人类这缕“意识之火”不会熄灭。所以成为多行星物种很重要,这能保障意识和地球上所有生命的长期存续。 另外,火星计划还有一个激励性理由:生活不能只用来解决一个又一个棘手的问题。你该对未来充满期待——早上醒来时会想“真期待今天会发生什么”,这样的事也很重要。 地球上的每个人,就像阿波罗计划——虽然只有少数人登月,但它激励了全人类。我们都间接“参与”了登月,这是人类的伟大成就,激励了全世界的人。 所以了解宇宙的本质、探索未知,即使自己没去过,也会很受激励。我认为这些都非常重要。
真正的应用来了,百度智能云“空间智能”燃爆深圳
作者 | 江宇 编辑 | 漠影 智东西7月28日报道,“应用来了”2025空间智能应用大会于深圳圆满落幕。大会由百度智能云主办,南山区科技创新局指导,NVIDIA提供支持,聚焦大模型与空间智能融合背景下的产业应用。 这也是百度继去年牵头成立空间智能产业联盟后再次集结生态力量,并以三大关键词——AIGC、智能硬件、IP创新,明确空间智能将进入“从1到N”转折阶段。 在开场致辞中,百度智能云副总裁、百度智能云泛科技业务部总经理张玮谈到,“我们希望百度在产业链当中可以作为纽带,为上下游的伙伴提供技术的共研和资源的共享。”他强调,AI正在成为空间智能的引擎。从设备、模型到交互和落地,百度的目标不是成为某一单点工具,而是作为“平台型支撑者”,连接技术、产品与应用。 ▲百度智能云副总裁,百度智能云泛科技业务部总经理张玮 南山区创新发展促进中心负责人刘静在随后的演讲中指出,空间智能作为科创前沿领域,正受到南山区高度重视。她详细介绍了南山“创业之星NextStar”全球大赛、模力营AI生态社区的情况。今年“创业之星NextStar”全球大赛将设立4029万元奖金池、5亿元直投基金及150万平方米产业空间等配套资源,鼓励更多空间智能企业在南山扎根发展。 ▲南山区创新发展促进中心负责人刘静 一、空间智能产业初成,快速发展的瓶颈待解 空间智能不仅是一个技术概念,更正在向具象化的产业演进,其核心理念是“虚拟空间与物理空间的融合”——通过AI大模型对人、物、场的感知与理解,进而在虚拟世界中实现再现和互动,构建具备生成力、交互性和环境感知能力的“数字空间”。 百度智能云空间智能行业负责人常佳硕在大会上指出,空间智能的关键在于“让AI既能理解人,也能理解物理世界的状态”,并通过语言、图像、3D等多模态能力,将这些信息转化为虚拟空间中的交互体验。未来,AI不再只是信息处理工具,而将以眼镜、玩具、车载系统、机器人等智能终端的形态,成为物理空间中的组成单元。 ▲百度智能云空间智能行业负责人常佳硕 但在这一愿景落地前,行业还面临不少现实瓶颈。当前空间智能的推进受限于高昂的数据采集成本、模型适应性不足、终端设备标准不一,以及异构算力资源难以统筹等问题。这些问题导致了项目交付链条易断、调试成本高和协作效率低。 为了破解这些结构性难题,百度正通过共建平台机制,打通模型、硬件、内容之间的协同机制,为产业生态提供通用能力底座。 二、构建“算力+模型+工具链”能力,接住空间智能的产业需求 围绕空间智能规模化落地的产业需求,百度正在加速构建底层技术能力。其核心策略是通过“算力+模型+工具链”的全栈布局,为企业提供从开发到部署的全周期支撑。 百度智能云已构建起从芯片到大模型的一体化体系,底层以昆仑芯片提供算力支撑,配合百度百舸GPU云平台,实现万卡级的算力调度;上层以文心大模型为核心大模型,形成稳定的空间智能技术底座。 在开发工具方面,百度构建了基于千帆大模型的一站式平台,从2D/3D创作、到大模型微调、再到场景生成与虚拟数字人部署,逐步建立起覆盖2D至5D交互的多模态工作流,加速了从创意到产品的交付路径。 与此同时,百度也在算力层面与生态伙伴展开深度合作。 NVIDIA资深解决方案架构师金国强在演讲中指出,当前AIGC模型在推理阶段资源消耗极高,成为制约空间智能应用落地的重要瓶颈。例如,图像生成模型Flux参数规模已达120亿,需执行50步去噪过程;开源视频模型Wan2.1则达到140亿参数,生成5秒720P视频耗时超过100分钟,显存需求高达62GB,难以满足高频实时调用场景。 为此,NVIDIA推出TensorRT推理引擎、量化压缩、模型卸载等一系列优化工具,实测可带来2至3倍的推理提速、50%以上的显存压缩,并已在百度绘想等视频模型部署中验证效果。 ▲NVIDIA资深解决方案架构师金国强 同时,百度云也在其“百舸”平台上与NVIDIA展开合作,共同缓解推理瓶颈,为空间智能提供更具可扩展性的技术支撑。 三、空间智能真落地,百度和伙伴们正交付一批真产品 衡量空间智能是否真正进入产业落地阶段,最关键的指标之一就是:有没有真实交付、面向用户的项目。此次大会展示了多个“能交付、真落地”的案例,它们不仅跑通了AI的模型能力与产业的衔接,还探索出了可持续发展的商业路径。 从内容创作、三维建模到智能终端与情感陪伴,空间智能正逐步穿透不同类型的应用场景,构建起完整的产业接口能力。 1、角色生成、建模复原、AI投流:空间智能内容“产线”已成型 2033科技是空间智能在内容创作领域的重要落地案例。创始人兼CEO马宇驰曾主导三角兽科技,服务百度、小米、vivo 、oppo等3.5亿台手机和1.5亿台IoT设备,此次再创业,聚焦普通用户可用的3D角色生成与多模态交互平台。 其产品已上线灰度版,用户可通过上传模型,自定义捏脸、语音、性格和对话风格,生成具有动作执行能力的AI角色,并支持在3D空间中完成做饭、讲故事、密室互动等行为。 其系统由百亿级大模型与世界模型驱动,强调角色在“人、时间、空间、事件”四维下的认知与响应,已支持数千个用户角色上线,构建起从IP创作到空间智能的闭环能力。 ▲2033科技创始人兼CEO马宇驰 KIRI公司开辟了从现实视频复现可交互3D空间的独特路径。其核心产品KIRIEngine已服务200万用户,广泛应用于3D打印、游戏开发、电影特效等领域,为各行业提供高效的3D模型解决方案。​ 该公司率先推出的3DGaussSplatting(高斯溅射)技术,大幅降低建模门槛,用户通过手机拍摄即可快速生成高保真3D模型,让更多人能参与3D内容创作。​ 在C端应用上,KIRI潜力可观。樱花树下的纪念影像、艺术装置留存、航建筑建模、亲人建模等场景,为空间智能在情感类与消费类场景的落地提供了清晰案例,让技术更具温度与实用价值。 ▲KIRI创始人兼CEO王正男 筷子科技则让AI内容生产走入品牌营销主战场。其产品系统以视频理解与热点识别为底座,提供从AI素材抓取、视频自动合成到智能投放的链条化流程,形成支持大规模商业传播的“AI内容中台”。 筷子将AI能力模块化为MCP组件,并构建了商业镜头库、热点素材库,覆盖从创意到分发的内容链路,为空间智能在“人-内容-消费”之间的落地提供了模板。 ▲筷子科技高级产品总监陈龙 2、从创作者到开发者,空间智能的“AI工具集”来了 海马云联合创始人兼副总裁赵珅展示了AI工作流如何承接大模型能力并实现应用交付。 其RunningHUB平台定位为面向全球开发者的AIGC共创平台,聚焦图像、音视频的AI工作流开发与部署,已吸引来自154个国家和地区的5万余名开发者。 目前,该平台同时开放C端入口,用户可通过小程序一键调用全球开发者构建的AI工具。从基础算力到高兼容的ComfyUI开发框架,海马云打造了内容生产链,也为空间智能提供了类“开发者平台”的生态。 ▲海马云联合创始人兼副总裁赵珅 3、智能终端贴身落地,空间智能走向日常场景 在AI+硬件的落地路径中,李未可科技带来了AI眼镜的实装案例,展示空间智能如何真正“贴身进入”用户生活。 李未可科技合伙人兼生态业务负责人张建华提到,其创始团队出身于百度、小米、天猫精灵等产品体系。自2023年以来,李未可科技推出多款AI眼镜产品,从骑行运动款到带摄像头的轻量眼镜,功能涵盖语音助手、翻译、导游等Agent服务。 眼镜搭载自研可穿戴模型,并通过统一调度框架连接多家大模型平台,形成“眼镜应用商店”式的智能生态。李未可也已将平台能力开放给其他硬件厂商,通过云端预装和MCP能力嵌入,推动空间智能终端走向产业链合作与可复制交付。 ▲李未可科技合伙人兼生态业务负责人张建华 4、情绪交互成新接口,空间智能切入陪伴场景 数伴科技展示了数字情感体如何进入日常生活,尤其是针对年轻群体的“陪伴刚需”。其产品通过Unity引擎与手势识别、头部追踪等感知技术,构建出可触摸、可互动、具备角色个性的3D虚拟形象,并将其载入屏幕与硬件载体中。 创始人兼CEO李巍佳提出,“从你看手机到AI看你”是未来交互趋势。通过专利化的指向式样全息方式、标准化的角色模型平台“模之屋”,数伴打造了一套“虚拟形象驱动情绪连接”的系统样本。其落地路径不仅服务二次元群体,也在提示情感陪伴场景中各种空间智能角色。 ▲模之屋 这批产品共同勾勒出空间智能“从平台到项目”的落地路径:它们既展示了内容生成、交互建模、Agent调度等关键能力的协同突破,也体现出产业伙伴围绕真实场景推进产品化落地的持续探索。空间智能正逐步具备规模化走入产业与消费端的系统能力。 结语:平台逐渐成熟,场景正在生长,空间智能不止是个“热词” 从内容生成、交互硬件到智能体系统,本次大会展示了一批可交付、可复制的空间智能落地项目,标志着这一概念正在由愿景走向现实。 多位嘉宾也在现场强调,空间智能的价值不止于“技术可用”,更在于其对未来生活方式与表达方式的重塑。无论是以VisionPro为代表的沉浸式观演体验,还是AI眼镜等轻交互设备,空间智能正逐步渗透至文化IP、零售营销、创作者生态等多元场景。虚实融合、可共建的数字空间,将塑造新一代的“内容—人—设备”范式。 空间智能是百度AI战略中持续深耕的方向。本次大会展示的是百度空间智能平台的阶段性成果,也为后续产业的快速发展和产品的快速落地提供了良好的技术底座。即将于8月28日召开的云智大会,百度将进一步展示这套能力如何贯通上下游,支撑产业规模化落地。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。