行业分类:
加载中...
头条分类:
加载中...
逛遍世界机器人大会:27款人形机器人爆场,机械臂大跳刀群舞,仿生人逼真到恐怖
世界机器人大会首日逛展:特斯拉擎天柱北京首秀,人形机器人走红毯、疯狂比心。 作者 | 程茜 编辑 | 李水青 智东西8月21日报道,今日,2024世界机器人大会在北京亦庄拉开帷幕,30度高温也没有阻挡参观观众的热情,展馆内人头攒动,每个展台前都挤满了举着手机拍视频的观众。 智东西在展会现场暴走一天,穿梭于各个展台之间,并与多位机器人企业的相关人士进行交流,带来新鲜的一手逛展报道。 这届世界机器人大会最大的亮点就是:到处都是“人”!人形机器人的数量为历年之最,达到27款,科技属性拉满。 扎堆出现的人形机器人全都秀起了才艺,“苏轼”现场与观众battle念诗、优必选Walker S化身汽车检测工程师、宇树科技人形机器人展会大跳“科目三”,还有绘画、下棋、书法机器人争奇斗艳。我行走在展台旁听到最多的就是此起彼伏的惊呼声! 除了人形机器人,京城机电的机械臂跳起了“刀群舞”,为这场盛会增添了更多的科幻色彩。 往年,世界机器人大会大多是人形、四足机器人等创新形态的机器人与医疗、配送、清洁领域已经上岗就业的机器人平分秋色,但今年这些商用服务领域的机器人展商从数量上看都不如此前,更偏趣味性的做咖啡、绘画、下棋机器人数量明显上涨。 可以看出,在大模型等技术的催化下,人形机器人已经成为机器人产业发展的主流话题,不论是观众的关注焦点还是企业争相亮出的技能都是如此。 但唯一不变的是,人们对机器人产业的热情仍然不减。下面,智东西带你一睹为快。 01. 人形机器人爆满! 行走、跳舞、念诗、写字……大秀技能 一进展馆,满目皆是人形机器人! 刚进门就看到了EX机器⼈展台中的人形机器人大秀。 左边是诺贝尔机器人小剧场,扮演“炸药之王”和“和平之父”两个角色的机器人在声情并茂激辩,不仅外形相似,EX机器⼈还通过声纹模拟了诺贝尔的音色。 中间是形似苏轼的人形机器人,现场还和观众battle起了诗词。 右边舞台是人形机器人“群舞”表演,展台设置了交互,我能通过话筒直接和他们对话、询问。美中不足的是,现场声音过于嘈杂,想要仔细听清他们的回答有点困难。 看完机器人大秀,一扭头就是宇树科技的机器狗跑酷,翻墙越障都不在话下,引起周围小朋友们的阵阵惊呼。 除了跑酷,在展区里,宇树科技的机器狗Go2、B2、Go2的轮足版本,以及H1和G1两款人形机器人都轮番进行了表演,人形机器人更是大跳科目三。 现场,G1还经过特殊妆造,呈现出悟空和机甲的独特造型,不过我只拍到了它匆匆离去的背影。 优必选这次亮出的是人形机器人的工业版Walker S系列,现在已经进入多家车厂,和东风柳汽、吉利汽车、一汽红旗、一汽-大众青岛分公司、奥迪一汽等诸多汽车企业达成合作。 现场,Walker S演示了检测汽车轮胎的过程,检测完成后在大屏幕上就会出现不同部件的检测结果。 在智能搬运任务中,Walker S系列人形机器人首先构建周围环境的3D语义地图,实现复杂环境中的精准导航与避障。 加速进化的人形机器人共有23个自由度,身高1.1米,体重为20kg,能做到前向、后向、侧向的全向行走。 他们在展区里直接搞了一场机器人大赛,两台机器人分属雷神队、火神队,谁率先通过障碍冲过终点就获胜,不少小朋友在场外自发组成拉拉队为机器人呐喊助威。 因为受限于场地等因素,科大讯飞的人形机器人在展台上只展现了拿取可乐、行走的操作。不过据了解,这一人形机器人已经集成了大模型和多模态强化学习控制,复杂任务拆解成功率超过95%,开放场景物体寻找成功率超过85%。 除了人形机器人,科大讯飞还有一台具身智能通用机器人,其并没有双足,而是结合了轮式、机械臂来执行不同场景的任务。 星尘智能机器人直接在现场大笔一挥,写出了一手绝佳毛笔字。 松延动力的产品级人形机器人Dora,相比大会现场的其他机器人,它身材并不大,但有效负载也达到了10kg。 逐际动力现场的双足机器人P1造型实属少见,据了解这一双足机器人之前就已经基于强化学习实现了野外徒步,在展馆现场的爬坡、行走过程也比较流畅。 逐际动力的全尺寸人形机器人也首度公开亮相了。 星动纪元的人形机器人直接在展会现场走起了红毯。 银河通用的机器人在现场展出的是几个真实的工作场景,让机器人去搬运物品、摆放货物等。 帕西尼感知科技的人形机器人在现场疯狂比心,其多维触觉人形机器人TORA系列,拥有多自由度双臂和4指仿生灵巧手,双手上有近两千个该公司自研的ITPU高精度触觉传感器。 人形机器人(上海)有限公司的青龙全尺寸通用人形机器人身高1.85米,是全体系对标生物人功能指标。 乐聚机器人在现场能榨果汁、送水,妥妥的全能帮手。 北京具身智能机器人创新中心自主研发的通用人形机器人母平台天工在现场也引起了围观,现场快速完成了爬斜坡、下楼梯、打招呼等操作。 同时,这一机器人还能实现语音交互抓取,例如工作人员要求它“将苹果放到绿色的碗”里。 还有工业协作方面,人形机器人已经能和机械臂配合默契,例如下面天工机器人和机械臂可以分别在工业流水线上负责物料分拣与上下料,即使物品位置摆放变了,两个机器人都不会被干扰。 众擎机器人展出了主要面向科研教育市场发售的专业级双足机器人SA01,售价3.85万元,SA01 EDU版整机重量约40KG,单腿6个自由度,膝关节扭矩最大160Nm,脚踝关节最大96Nm,可单脚站立,最大28rad/s的关节速度。还有下图形态奇特的小怪兽S2首次亮相。 智元机器人的人形机器人在现场做起了展台前台,承担了和观众打招呼的工作。 开普勒机器人的一抹亮眼黄色在展馆内也很吸睛,据了解,开普勒第5代人形机器人会在今年第四季度开始小批量生产,给一些早期的客户发货。 大象机器人的猫、狗、熊猫机器人,可以化身陪伴机器宠物,在外观、触感上都接近真实的宠物。 最后我还发现一款超mini人形机器人,高擎机电的mini双足机器人仅有59cm高。 各路国产玩家的人形机器人争奇斗艳,开起了竞技场,而特斯拉的Optimus却仍在站桩。 02. 前方排队预警!下棋、绘画、咖啡 煎饼果子机器人成网红打卡点 除了争奇斗艳、科技属性拉满的人形机器人,场馆内做饮品、下棋、绘画、摊煎饼的机器人也数不胜数,不禁让人感叹:“还有什么是机器人不能做的吗?” 与机器人对弈已经成为很多小朋友学习下棋的重要方式。这不,商汤元萝卜在大会上发了新的下棋机器人——国际象棋专业版。 不同于之前的围棋、象棋机器人,这次机器人的抓夹换成了机械爪,可以拾取立体立体棋子对弈。现场已经有小朋友跃跃欲试,和机器人进行对弈。 还有科大讯飞的讯飞玄机iFlyGo弈棋机器人,也吸引了不少爱好者前来体验。 遨博智能和北京大学的绘画机器人都在展会上画起了肖像画。不过,如果单看前面的绘画过程,机器人的每一笔都落在了我意想不到的位置,很难直接看出它们到底画了什么。 不同的是,北京大学的情感伙伴仿人机器人爱瑟尔,绘画只是它的技能之一,它还可以与人类进行交互对话,进行情感陪伴,所以外形也更加可爱。 修身养性结束,走在展区突然一阵香味扑鼻,我看到了在大会现场正式上岗的久秉AI餐饮机器人,它能自主完成煎饼果子的制作,不仅能根据顾客的需求选择是否添加香菜、葱花等,还能自动折饼、包装。 不过我围观的这场摊煎饼表演,煎饼的酱貌似并没有抹开。 吃完煎饼,可以再来杯咖啡。 在展馆内大排长龙的就是氦豚的咖啡机器人。 还有遨博智能的咖啡机器人,制作咖啡、拉花一气呵成,最后的拉花成果也十分精致。 遗憾的是,青龙机器人现场演示点咖啡,但由于现场设备调试原因,没能一睹全貌。 喝完咖啡再来一口甜甜的冰激淋,遨博智能的冰激淋机器人十分实在,每个冰激淋都堆的十分高。 03. 商用服务机器人均已上岗 打针、输液、做手术机器人已接管 除了人满为患的人形机器人展台,配送、清洁、手术这类早已经上岗就业的机器人仍是机器人大会的一大亮点。 1、商用服务机器人:消杀、清洁机器人已成老员工,配送系列产品解决最后一公里难题 擎朗智能在展台上设置了医院、酒店等场景,将全套的商用服务解决方案呈现了出来。 例如酒店场景内,擎朗智能采用多机调度系统及智能算法来部署多台不同类型的机器人,如配送机器人W3及清洁机器人C30。 还有医院场景的擎朗消毒机器人M2、医疗配送机器人X101等。在酒店场景,擎朗智能已经打造了3大系列、7种机型构建全场景覆盖的数智化医院解决方案,大幅提升医院工作效率及整体精细化管控能力。 京东物流中的智能配送产品系列中,室内配送机器人基于京东物流L4级别的自动驾驶技术,已经实现了全自助导航、智能避障等,实现了24小时的无人配送服务。 京东无人配送的智能配送车,有不同大小的12个置物空间,能满足不同场景的配送需求。 库卡机器人的全新重载AMR,可以全向移动的3000kg负载,能够在汽车、新能源、航空航天、工程机械等场景实现应用。 面向物流行业,库卡中国的移动机器人KMP 1500i能在工厂里提高作业效率,降低人工成本。 中科重德的医疗配送机器人能打通医院各科室间重复性医疗资源的配送场景,最大速度达到了1.5m/s。 该公司的室内外通用配送机器人,能在城市园区、医院、工厂等区域自由行走,接管配送任务。 2、医用机器人:手术机器人仍是展会热门,抽血、打针都不在话下 与其他机器人不同,手术机器人往往都由多个部件组成,有操作手术的机械臂装置,有辅助医生看清患者体内图像的显示屏装置,有的还有脚踏等,都是保证手术机器人能够更好、更快完成工作的关键。我看到了涵盖外科手术、关节手术、骨科手术、腔镜手术等各种各样的手术机器人。 术锐机器人直接在展台搭建了模拟手术室。 微创机器人的图迈腔镜手术机器人由医生控制台、患者手术平台和图像平台组成,这也就是模拟人的手、眼、脑,并且这一手术机器人在患者身上留下的创伤口会十分小。 唯精医疗主要针对于微创外科和精准治疗,目前已经有3D视觉处理系统、医生控制台、四臂手术平台、单孔手术平台等核心产品体系。 抽血、输液机器人也可以完成了!伏羲九针的智能静脉辅助穿刺系统可以让机器人直接帮你抽血,还有智能输液机器人,只需要把胳膊放进去就可以完成输液,不过现场未看到演示。 04. 结语:北京领跑机器人赛道 全力打造机器人产业高地 自2015年起,世界机器人大会已经举办九届,2024世界机器人大会由中国电子学会、世界机器人合作组织主办,北京市经济和信息化局、北京经济技术开发区管委会支持,首程控股公司、北京亦庄机器人科技产业发展有限公司协办。 北京市委常委、副市长靳伟在世界机器人大会开幕上表示,2023年,北京机器人产业的总收入超200亿元,企业数量超400家。其中,专精特新小巨人企业有50家,居全国首位。 本届大会博览会共有169家企业展出600余件创新产品,如人形机器人、四足机器人、按摩机器人、采摘机器人等悉数亮相。 作为全球机器人产业界一场顶尖盛会,世界机器人大会已经成为全球企业集中展示最新技术、最新产品、最新应用的舞台。 目前,北京已经在机器人产业发展中走在前列。北京已经共建全国首个具身智能机器人创新中心,设立了百亿规模的机器人产业基金。同时,今年年初,目标规模100亿元的北京机器人产业发展投资基金注册落地经开区。在2024世界机器人大会上,北京亦庄宣布要实施50个应用场景示范工程,开展一批“机器人+”应用示范。 北京市副市长靳伟在世界机器人大会上表示,北京将坚持产品创新和场景示范的双轮驱动,产业协同和生态优化的共同联动,全力打造全球的机器人产业高地。 在技术、场景、资金、政策等多重要素齐全的当下,北京已经成为机器人产业发展高地,并加速推动发展成果惠及更多行业,共享机器人的创新发展成果。
微软发布Phi-3.5系列AI模型:上下文窗口128K,首次引入混合专家模型
IT之家 8 月 21 日消息,微软公司今天发布了 Phi-3.5 系列 AI 模型,其中最值得关注的是推出了该系列首个混合专家模型(MoE)版本 Phi-3.5-MoE。 本次发布的 Phi-3.5 系列包括 Phi-3.5-MoE、Phi-3.5-vision 和 Phi-3.5-mini 三款轻量级 AI 模型,基于合成数据和经过过滤的公开网站构建,上下文窗口为 128K,所有模型现在都可以在 Hugging Face 上以 MIT 许可的方式获取。IT之家附上相关介绍如下: Phi-3.5-MoE:首个混合专家模型 Phi-3.5-MoE 是 Phi 系列中首个利用混合专家(MoE)技术的模型。该模型在 16 x 3.8B MoE 模型使用 2 个专家仅激活了 66 亿个参数,并使用 512 个 H100 在 4.9T 标记上进行了训练。 微软研究团队从零开始设计该模型,以进一步提高其性能。在标准人工智能基准测试中,Phi-3.5-MoE 的性能超过了 Llama-3.1 8B、Gemma-2-9B 和 Gemini-1.5-Flash,并接近目前的领先者 GPT-4o-mini。 Phi-3.5-vision:增强型多帧图像理解 Phi-3.5-vision 共有 42 亿个参数,使用 256 个 A100 GPU 在 500B 标记上进行训练,现在支持多帧图像理解和推理。 Phi-3.5-vision 在 MMMU(从 40.2 提高到 43.0)、MMBench(从 80.5 提高到 81.9)和文档理解基准 TextVQA(从 70.9 提高到 72.0)上的性能均有提高。 Phi-3.5-mini:轻量级、强功能 Phi-3.5-mini 是一个 38 亿参数模型,超过了 Llama3.1 8B 和 Mistral 7B,甚至可媲美 Mistral NeMo 12B。 该模型使用 512 个 H100 在 3.4T 标记上进行了训练。该模型仅有 3.8B 个有效参数,与拥有更多有效参数的 LLMs 相比,在多语言任务中具有很强的竞争力。 此外,Phi-3.5-mini 现在支持 128K 上下文窗口,而其主要竞争对手 Gemma-2 系列仅支持 8K。
革命性KAN 2.0横空出世,剑指AI科学大一统!MIT原班人马再出神作
4月30日,KAN横空出世,很多人预言这会敲响MLP的丧钟。 没想到,子弹还没飞4个月,核心团队又推出了KAN 2.0,瞄准AI+Science领域,进一步挖掘了KAN的潜力。 这篇论文更雄心勃勃的地方在于,作者希望通过一种框架来弥合AI世界的连接主义(connectionism)和科学世界的符号主义(symbolism)之间的不相容性。 通过提出pykan等工具,作者还展现了KAN发现各种物理定律的能力,包括守恒量、拉格朗日量、隐藏对称性和本构方程等等。 论文地址:https://arxiv.org/abs/2408.10205 这次KAN 2.0依旧出自初代架构原班人马之手。 深度学习变天了,MLP成过去式? 我们先简要回顾一下,今年4月首次提出的KAN究竟在哪些方面改进了MLP。 MLP(multi-layer perceptron)又被称为全连接神经网络,是当今几乎所有深度学习模型的基础构建块,它的出世甚至可以追溯到第一波人工智能浪潮方兴未艾的1958年。 论文地址:https://www.ling.upenn.edu/courses/cogs501/Rosenblatt1958.pdf KAN的论文中都表示,MLP的重要性怎么强调都不为过,因为这是神经网络中用于逼近非线性函数的默认模型,其对函数表达能力的底层逻辑由「通用逼近定理」保证。 Transformer和其他架构中常见的FFN本质上就是一个MLP。但由于网络稠密、参数量大,MLP往往占据了模型中几乎所有的非编码层参数。 而且相比注意力层,在没有后期分析工具时,MLP中的大量参数也缺乏可解释性。 受到Kolmogorov-Arnold表示定理的启发,KAN打破了对通用逼近定理的遵循。 虽然底层逻辑变了,但是他们做出的修改相当简洁且直观: - 将激活函数放在网络边缘而非节点处 - 给激活函数赋予可学习参数,而非固定的函数 KAN中没有任何线性权重,网络中的每个权重都变成了B-spline型单变量函数的可学习参数。 这种看似简单的改变让KAN获得了拟合准确性和可解释性方面的优势。今年4月的第一篇论文中,作者们就发现KAN在数学和物理定律方面的潜力。 下面这个动图展示了简单的3层KAN网络拟合一个复杂函数的训练过程,相当简洁清楚。 此外,KAN也能从根本上很好地解决MLP中普遍存在的「灾难性遗忘」问题。 以上这些优势,都奠定了KAN作为「科学家合作助手」的基本能力。 KAN2.0问世,一统AI+科学 虽然第一版的KAN网络本身有很多适合科学研究的优点,但深度学习和物理、化学、生物学领域依旧有完全不同的「语言」,这构成了AI4Science最大的障碍之一。 因此扩展后的KAN 2.0的终极目标只有一个——使KAN能轻松应用于「好奇心驱动的科学」。研究人员既能将辅助变量、模块化结构、符号公式等科学知识集成到KAN中,也能从KAN的可解释性分析中得到观察和见解。 所谓「好奇心驱动的科学」,根据论文的解释,是过程更具有探索性、提供更基础层面新发现和新知识的研究,比如天体运动背后的物理原理,而非AlphaFold这类应用驱动的科学研究。 科学与KAN的协同 具体来说,科学解释有不同的层次,从最简单粗略到最精细、最难发现、最具因果性,可以有如下几个分类: - 重要特征:例如,y完全由x1和x2决定,其他因素并不重要;即存在一个函数f使得y=f(x1, x2) - 模块化结构:例如,存在函数g和h是的y=g(x1)+h(x2) - 符号公式:例如,y=sin(x1)+exp(x2) MultKAN 在原始KAN网络的基础上,这篇最新的论文引入了一种称为MultKAN的新模型,其核心改进是引入额外的乘法层进行增强。 KAN所依据的Kolmogorov-Arnold表示定理提出,任何连续高维函数都可以分解为单变量连续函数和加法的有限组合: 这意味着加法是唯一真正的多元运算,而其他多元运算(包括乘法)都可以表示为与单变量函数组合的加法。因此,原来的KAN中仅包含加法运算。 然而,考虑到乘法在科学和日常生活中的普遍存在,MultKAN中明确包含乘法,能更清楚地揭示数据中的乘法结构,以期增强可解释性和表达能力。 如图2所示,MultKAN和KAN相似,都包含标准KAN层,但区别在于插入了乘法节点,对输入的子节点进行乘法运算后再进行恒等变换,用Python代码可表示为: 其中⊙表示逐元素乘法。 根据上图,整个MultKAN网络进行的运算就可以写作: 其中,𝚿L≡𝐌L∘𝚽L。 经过扩展后,论文将KAN和MultKAN视为同义词,即默认情况下的KAN都将允许乘法层的存在,除非有特殊说明。 GitHub仓库中的KAN代码已经更新,可以通过pip快捷命令直接安装使用。 仓库地址:https://github.com/KindXiaoming/pykan Science to KAN 在科学领域,领域知识至关重要,让我们可以在数据稀少或不存在的情况下,也能有效工作。 因此,对KAN采用基于物理的方法会很有帮助:将可用的归纳偏置整合到KAN中,同时保持其从数据中发现新物理规律的灵活性。 文中作者探讨了三种可以整合到KAN中的归纳偏置,从最粗略(最简单/相关性)到最精细(最困难/因果关系):重要特征、模块化结构和符号公式。 在KANs中添加重要特征 在回归问题中,目标是找到一个函数f,使得y=f(x1, x2, ···, xn)。假设我们希望引入一个辅助输入变量a=a(x1, x2, ..., xn),将函数转化为y=f(x1, ···, xn, xa)。 尽管辅助变量a不增加新的信息,但它可以提高神经网络的表达能力。这是因为网络无需消耗资源来计算辅助变量。此外,计算可能变得更简单,从而提升可解释性。 这里,用户可以使用augment_input方法向输入添加辅助特征: 图3显示了包含辅助变量和不包含这些辅助变量的KAN:(a)由符号公式编译而成的KAN,需要5条连接边;(b)(c)包含辅助变量的KAN,仅需2或3条连接边,损失分别为10⁻⁶和10⁻⁴。 为KAN构建模块化结构 模块化在自然界中非常普遍:比如,人类大脑皮层被划分为几个功能不同的模块,每个模块负责特定任务,如感知或决策。模块化简化了对神经网络的理解,因为它允许我们整体解释神经元群集,而不是单独分析每个神经元。 结构模块化的特点是连接群集,其中特征是群集内的连接远强于群集间的连接。为此,作者引入了module方法:保留群集内的连接,同时去除群集间的连接。 模块由用户来指定,语法是: 具体而言,模块化有两种类型:可分性和对称性。 可分性:如果说一个函数是可分的,那么它就可以表示为非重叠变量组的函数的和或积。 广义对称性:如果f(x1, x2, x3, ···)=g(h(x1, x2), x3, ···),则这个函数在变量(x1, x2)上是对称的。因为只要h(x1, x2)保持不变,即使x1和x2发生变化,f的值仍然保持不变。 将符号公式编译成KAN 为了结合「符号方程」和「神经网络」这两种方法的优势,作者提出了一个两步程序:(1)将符号方程编译成KAN,(2)使用数据微调这些KAN。 其中,第一步可以将已知的领域知识嵌入到KAN中,而第二步则专注于从数据中学习新的「物理」知识。 具体来说,作者首先提出了用于将符号公式编译成KAN的kanpiler(KAN编译器)。过程如图5a所示: 1. 将符号公式解析为树结构,其中节点表示表达式,边表示操作/函数; 2. 然后修改该树以与KAN图结构对齐。修改包括通过虚拟边将所有叶节点移动到输入层,并添加虚拟子节点/节点以匹配KAN架构。这些虚拟边/节点/子节点仅执行恒等变换; 3. 在第一层中组合变量,有效地将树转换为图。 然而,通过宽度/深度扩展来增加表达能力kanpiler生成的KAN网络是紧凑的,没有冗余边,这可能限制其表达能力并阻碍进一步的微调。 为了解决这个问题,作者又提出了expand_width和expand_depth方法来扩展网络,使其变得更宽和更深,如图5c所示。 KAN to Science 这一节同样关注提取知识的三个层次,从最基本到最复杂:重要特征,模块化结构和符号公式。 识别重要特征 给定一个回归模型f,有y≈f⁢(x1,x2,…,xn) ,我们的目标是为输入变量分配重要性分数。 论文提出,之前所使用的L1范数(图6a)只考虑到了局部信息,因此得出的结果可能存在问题。 依据KAN网络,作者提出了一种更有效的归因分数,能比L1范数更好反映变量的重要性,还可以根据这种归因分数对网络进行剪枝。 识别模块化结构 归因分数可以告诉我们哪些边或节点更有价值,但它没有揭示模块化结构,即重要的边和节点如何连接。 神经网络中的模块化结构可以分为两种:解剖模块化(anatomical modularity)和功能模块化(functional modularity)。 解剖模块化是指,空间上彼此靠近的神经元相比距离较远的神经元具有更强的连接趋势。论文采用了之前研究提出的「神经元交换」方法,在代码中被称为auto_swap,可以在保留网络功能的同时缩短连接,有助于识别模块。 图7展示了两个成功识别模块的auto_swap任务:多任务匹配和分层多数投票。其中,KAN的模块结构相比MLP更加简单且富有组织性。 但无论auto_swap结构如何,网络全局的模块化结构仍和整体功能仍不清楚,这就需要用到功能模块化分析,通过输入和输出的前向和后向传递来收集有关信息。 图8定义了三种类型的功能模块化:可分性、一般可分性和一般对称性。 识别符号公式 符号公式信息量最大,因为可以直接、清楚地揭示函数中重要的特征和模块结构。图9展示了与KAN进行交互协作进行符号回归的3个技巧: 1.发现并利用模块化结构 2.稀疏初始化 3.假设检验 用KAN助力物理学研究 除了进行原理层面的说明,论文还讲解了多个具体案例,如何将KAN融入到现实的科学研究中,比如发现新的物理概念和定律。 论文给出的案例包括守恒量、拉格朗日量、隐藏对称性和本构方程等。这里我们以最简单的守恒量发现为例,看看KAN是如何工作的。 守恒量即时间变化过程中保持恒定的物理量,比如能量守恒定律告诉我们,孤立系统的总能量保持不变。 传统上,科学家如果不借助计算工具,仅靠纸笔推导守恒量可能非常耗时,并且需要广泛的领域知识。但机器学习方法可以将守恒量参数化,转化为求解微分方程的问题。 此处所用的方法基本类似于作者Ziming Liu等人2022年发表的论文,但将其中的MLP网络换成了KAN。 论文地址:https://pubmed.ncbi.nlm.nih.gov/36397460/ 比如使用KAN可以发现二维谐振子(x, y, px, py)中具有3个守恒量:x轴方向的能量H1、y轴方向的能量H2和角动量H3。 关于KAN的其他应用,论文也描述了如何从实验数据中推断出拉格朗日量(图11)。 或者,发现Schwarzschild黑洞中的隐藏对称性(图12)。 还有数据驱动的本构定律发现(图13)。本构定律通过模拟材料对外力或变形的响应,定义材料的行为和属性,比如描述弹簧的胡克定律。 作者介绍 Ziming Liu(刘子鸣) Ziming Liu目前是MIT和IAIFI的三年级博士生,由Max Tegmark教授指导。他是两篇KAN论文的第一作者,可以说是这个架构背后最主要的贡献者。 他的研究兴趣主要集中在AI与物理学(以及其他科学领域)的交叉区域: 1. Physics of AI:从物理学原理来理解AI,目标是让「AI像物理学一样简单」; 2. Physics for AI:受物理学启发的AI,目标是让「AI像物理学一样自然」; 3. AI for physics:利用AI增强物理学研究,目标是让「让AI像物理学家一样强大」。 为了实现利用AI和物理学共建更美好世界的最终目标,Ziming Liu对包括发现物理定律、受物理启发的生成模型、机器学习理论、机械解释性等在内的多个主题都有深厚的兴趣。 并且,与凝聚态、高能物理、量子计算等领域的物理学家以及计算机科学家、生物学家、神经科学家和气候科学家等建立了紧密合作关系。 他多次在顶尖的物理期刊和AI会议上发表论文,并担任IEEE、Physical Review、NeurIPS、ICLR等的审稿人。同时,还共同组织了NeurIPS 2021和ICML 2022的AI4Science workshop。 在攻读博士学位之前,他在北京大学获得了物理学学士学位,并曾在微软亚洲研究院实习。 Pingchuan Ma(马平川) Pingchuan Ma目前是MIT CSAIL实验室的博士生,由Wojciech Matusik教授指导。 他的研究方向涵盖了「基于物理的智能」的整个流程: 1. 重建高效逼真的物理环境 2. 基于这些环境生成AI 智能体 3. 在物理世界中实现这些智能体 此前,他在南开大学获得软件工程专业学士学位,并在麻省理工学院获得计算机科学硕士学位。 同时,他还在IBM、字节、商汤、港大等知名机构从事过研究工作,有着丰富的经验。 Yixuan Wang Yixuan Wang目前是加州理工学院,应用及计算数学专业的博士生。 他的研究方向十分广泛,包括数值分析、偏微分方程、应用概率,以及AI for Science。 此前,他在北京大学获得数学学士学位。 Wojciech Matusik Wojciech Matusik是麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的电气工程与计算机科学教授,也是计算机图形学小组的成员,负责带领计算设计与制造团队。 他的研究兴趣包括计算机图形学、计算设计与制造、计算机视觉、机器人学和人机交互。 他于2003年在MIT获得计算机图形学博士学位,2001年在MIT获得电气工程与计算机科学硕士学位,1997年在加州大学伯克利分校获得电气工程与计算机科学学士学位。 并他曾在三菱电机研究实验室、Adobe和迪士尼苏黎世研究所工作。 2004年,他被「麻省理工科技评论」评为全球100位顶尖青年创新者之一。2009年,获得了ACM Siggraph的杰出新研究者奖。2012年,获得了DARPA青年教师奖,并被评为斯隆研究学者。2014年,获得了Ruth和Joel Spira卓越教学奖。 Max Tegmark Max Tegmark被大家亲切地称为「疯狂的麦克斯」(Mad Max)。 凭借着自己创新的思维和对冒险的热情,他的科研兴趣涵盖从精确宇宙学到探索现实的终极本质。 比如,结合理论与新的测量技术,精确限定宇宙学模型及其参数。在他作为物理学研究者的前25年里,这种研究方向使他主要关注宇宙学和量子信息学。 虽然他仍与HERA合作研究宇宙学,但目前他的主要研究方向是智能的物理学,即运用物理方法深入探索生物智能和AI。 作为麻省理工学院的物理学教授,他发表了超过两百篇技术论文,并多次在科学纪录片中出现。他在SDSS项目中关于星系聚类的研究,赢得了《科学》杂志「2003年度突破」的第一名。 在此之前,Tegmark于1989年在斯德哥尔摩经济学院获得了经济学学士学位,1990年在皇家理工学院获得物理学学士学位。 毕业后,他便前往加州大学伯克利分校继续深造,先后获得物理学硕士和博士学位。 在美国西海岸生活四年后,他回到了欧洲,出任马克斯·普朗克物理研究所的助理研究员。 1996年,他作为Hubble Fellow以及普林斯顿高级研究院的研究员,再次来到美国。 几年后,他获得宾夕法尼亚大学的助理教授职位,并于2003年获得终身教职。 2004年,他来到MIT并定居在查尔斯河畔的剑桥。
B站赚走了大模型创业的“快钱”
大模型创业,赚钱很难。 去年年底,有媒体提到,一位大模型创业公司的CEO参加线下沙龙发现,到场的十多家创业公司,仅两家有收入。但如果把研发费用算进来,它们没有一家是赚钱的。 这显然不符合投资人的期待,金沙江创投主管合伙人朱啸虎说,在中国做AI创业,必须考虑在什么场景下可以实现落地,并且第一天就要可以赚钱。 倒是不少中大型互联网公司的财报,单从纸面数据看,大模型的投入已经能看到回头钱了。 比如360公司表示,大模型产品创造了2000万元相关业务收入;商汤宣布,生成式AI相关收入增长670%;美图称,大模型拉动公司利润增长3.2倍。 最典型的是百度,李彦宏在百度2023 年第四季度及全年财报电话会上透露,大模型为云业务带来约 6.6 亿元增量收入。此外,大模型也给百度广告业务带来了上亿元的增量收入。 但明眼人一眼就能识破其中的猫腻:各种定语的“包装”,告诉外界自己能赚到钱,实则只为丰满一个大模型的故事。 这个故事的背景色是,“所有行业都值得用大模型重做一遍。”但它们背后的业务逻辑并没有发生根本性变化,还是原来的底子,只是套了身“皇帝新装”。 从这点看,科大讯飞就很“诚实”。根据其业绩报告,2024年上半年,其归母净利润同比暴降616.50%~725.24%。相比上年同期盈利7357.20万元,本期直接巨亏3.8亿~4.6亿元。这也是科大讯飞自2008年上市以来,首次交出半年度亏损的成绩单。 科大讯飞将亏损归因为在大模型上的投入更多了,“公司2024年上半年在大模型研发以及核心技术自主可控和产业链可控,以及大模型产业落地拓展等方面,新增投入超过 6.5 亿元。” 从官方给出的这个解释可以看出,“新增投入”包括两部分:研发投入和落地拓展两部分。财报数据显示,科大讯飞在2022年底宣布拥抱大模型后,其研发投入在去年同比增长14.36%,占营收的比例也达到19.53%。 更值得注意的是落地拓展部分,科大讯飞的销售费用比研发投入增长更快,在押注大模型后的2022年,其销售费用首次超过研发费用。当年和2023年,科大讯飞的销售费用率也都高过研发费用率。 对此,在今年一季度的业绩说明会上,科大讯飞董事长刘庆峰曾介绍,随着业务规模的扩大,公司的成本投入也在持续加大,除了本就规模相对较大的研发费用,今年科大讯飞在市场投入上也增加了不少。 科大讯飞的表态很诚恳。一方面研发投入是它绕不过去的选择,因为核心技术是关系到科大讯飞能否继续留在牌桌上的关键;另外一方面是科大讯飞依然不会赚钱,销售成本上去了,但营收却没跟上,需要对市场和投资人一个交代。2023年,科大讯飞的研发费用、销售费用分别同比增长11.89%、3.27%,但营收仅较上一年多了4.41%。 当把视线抬高到整个行业时,就会发现,科大讯飞的窘境只是大模型商业化难题的一个缩影。 海外市场也是如此。OpenAI预计2024年的亏损将达50亿美元,现金流可能撑不了一年。 投资者对大模型的追捧也逐渐回归“理性”。市场研究机构PitchBook发布的数据显示,2024年第一季度全球AI领域共计完成1779笔融资交易,筹集的风险投资总额为216亿美元,交易价值环比下降7.8%,同比下降31.2%。 目前来看,大模型的变现路径只有两条:一是To C,即面向C端用户推出付费应用。比如文心一言的会员业务。另外一条是To B,即针对B端客户提供接口、订制或者解决方案等服务。这也目前包括百度、华为等大公司和百川智能等初创企业最为主流的商业化方式。 但无论是哪条路线,或者是两条腿走路,在技术不成熟、对场景理解程度不一以及大模型同质化等现实问题的束缚下,大模型的商业化都充满了不确定性。 对于大模型厂商来说,唯一确定的选择就是,无论是B端还是C端,都需要不断地获取、转化和留存用户,以图活下去。 大模型的价格战也由此打响,这实际有两场战斗。一场是成本价格战 :今年5月,DeepSeek率先将API调用价格直接降至每百万tokens输入1元、输出2元,价格只有GPT-4的百分之一。随后智谱AI、字节豆包、阿里巴巴、腾讯、百度、科大讯飞等相继跟进,或降价或免费,从“卷研发”走到“卷价格”,希望快速获取用户。 还有一场是营销价格战, 豆包和Kimi是这场战争里的两个大显眼包,贴着用户的脸打营销战。豆包的投放还是字节惯用的“大力出奇迹”。据AppGrowing统计,6月上旬,豆包的投放金额高达1.24亿元。 Kimi的背后,是估值超30亿美元的AI独角兽“月之暗面”。它主要的投放阵地是B站,几乎关联了B站所有的关于“AI”的词条。36氪提到,月之暗面在B站给出的CPA(Cost Per Action,用户转化人均成本)报价,高达30元左右。曾有投资人在2023年3月透露,Kimi的平均获客成本达12-13元/人,每日的获客成本至少要花去20万元。 相比之下,豆包的投放主要通过自家的穿山甲联盟进行。也可以说是,字节左手倒右手,肥水不流外人田。Kimi出圈带动的B站投放风潮,烧的钱都成为B站的财报数据。 最终就形成大模型赛道一个尴尬的事实:无论是卖铲子的,还是卖水的,最后都卖不过卖周边的。 换句话说,这轮价格战进行下去,AI企业能否获得商业回报是个未知数,但流量平台,特别是B站确实挣到钱了。 根据AppGrowing的统计,6月第一周,B站的AI广告投放量是去年同期的3到4倍,AI测评类up主广告收入不降反增。B站财报也提到,2024年一季度B站来自AI行业的广告收入同比增长了5倍。正如一位AI从业者所说:“AI时代,商业化最成功的是B站。” 需要正视的是,B站挣的也只是一笔快钱。 Kimi的投流套路和早期的美团、滴滴没有本质不同,烧的钱也是来自融资。 投资人看不到回报时,耐心也会被消耗。有知情人士透露,Kimi高昂的营销成本已经让部分股东感到不可持续,“大家会怀疑,离开营销之后,你本身的产品力够不够维持用户的自然增长”。 还有AI从业者无奈地称,Kimi投放B站后,其他AI公司都投不起了,更多AI创业公司被这个投放价格拖伤了。“2023年初B站普遍的CPA报价,都在10元/人以下。月暗的报价,足足涨了两倍不止。” 越来越多的厂商也开始退出或者转换赛道。 比如零一万物创始人李开复放话,“如果中国市场就是这么卷,大家宁可赔光、通输也不让你赢,那我们就走外国市场”。 拿着锤子找钉子,最后拿到的可能都是废铁。 这对大模型厂商提出一个挑战:如何在价格之外,打磨自身核心技术,寻找到合适的落地场景,提高用户留存以继续这场无限游戏。而B站挣的“快钱”,已经揣进兜里。 李彦宏就曾表示,AI时代,“超级能干”的应用比只看DAU的“超级应用”要更重要。只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。 参考资料: 定焦,《大模型创业,谁赚到钱了?》 中国新闻周刊,《AI老兵,半年亏了4个亿》 智能涌现,《Kimi投放B站后,其他AI公司都投不起了》
百度、商汤、智谱前三,IDC首次发布大模型平台及应用市场份额报告
IT之家 8 月 21 日消息,国际数据公司(IDC)于今日首次发布了《中国大模型平台市场份额,2023:大模型元年 —— 初局》。数据显示,2023 年中国大模型平台及相关应用市场规模达 17.65 亿元人民币。 报告称,在过去的一年中,行业对于大模型更多的是早期投入,甚至观望而不重投入,因此 2023 年整体市场规模并不显著;并且市场格局也主要还是由早期投入者如百度、商汤、智谱、百川等公司构成。进入 2024 年,头部互联网公司加大对大模型的投入且发起价格战,为早期的大模型初创企业带来一定的竞争压力。预计未来 2—3 年,市场格局将发生多轮巨变。 IT之家附报告中 2023 年中国大模型平台及应用市场份额如下: 1、受益于多年来在 AI 领域的大力投入以及大模型的早期投入,百度智能云在 2023 年大模型市场规模达 3.5 亿元人民币,位居市场第一,市场份额达 19.9%; 2、商汤科技也受益于其对大模型的专注投入,以及其所建设的上海 AIDC 能够为客户提供一体化的大模型计算与应用解决方案,位居市场第二,市场份额达 16.0%; 3、智谱 AI 则是 2023 年初创企业中的胜出者,位居市场第三; 4、其次是百川智能、第四范式等。 展望未来,报告称尽管大模型与生成式 AI 是今天科技市场的最大焦点,大模型实际实现的能力仍然较低,不同技术提供商的大模型能力也有一定的差异。不能持续投入基座大模型,很容易导致企业在下一轮的模型能力竞争中落后且出局。 报告还提到,大语言基础模型的创新已经接近收敛阶段,而多模态大模型、视频大模型应用场景更为广泛但技术尚不成熟,市场需要该类产品。此外,并非所有的数据类型都是文本类或者图像视觉类,在科学计算领域,数据类型特殊,当前的大模型未必能适用,仍需要全新的基座大模型。
阿维塔发布了一辆卖 70 万的新车,顺便解决了增程的 3 大难题
强调设计的阿维塔,今晚又发布了一台高定车型:阿维塔 012。 阿维塔 012 是阿维塔与 Dior 男装艺术总监、Fendi 女装及高定艺术总监 Kim Jones 推出的联名限量版车型,预售价 70 万元,全球限量 700 台。 外观上,阿维塔 012 换上了专属的液态银车漆和 21 寸专属锻造镜面轮圈,其他地方并没有太大变化。 内饰上也延续了 012 的设计,顶部新增了一块后排娱乐屏和星光天幕,更显豪华。 同时,阿维塔 012 也是首批搭载华为乾崑智驾 ADS 3.0 的车型,支持车位到车位的全场景贯通,以及更高阶的全向主动防碰撞。 此外,阿维塔今晚还带来了一辆阿维塔 11 和 12 的「皇家剧院版」,拥有双色车身和 22 英寸七幅星芒锻造轮毂。各位看图感受一下。 好了,看完这些赔钱玩意儿,是时候来看一些真正能让阿维塔赚到钱的东西了。 实际上在今天上午,阿维塔还举办了一场增程技术发布会,发布了他们的昆仑增程系统。官方表示,这套昆仑系统的首搭车型就是此前曝光的阿维塔 07。 ▲阿维塔 07 虽说是第一次做增程,但纯电出身的阿维塔,对增程有着自己独到的见解。 我们认为,好的增程就是「体验无限接近纯电,里程毫无焦虑」。 阿维塔科技副总裁胡成太表示,阿维塔是一个做纯电出身的高端新能源品牌,既然要做增程,那就一定要以纯电体验作为标准。 尽管增程车型有着补能便利性和续航里程上的优势,但内燃机也给它带来了一定的劣势,比如噪音、震动、馈电动力受限,以及更慢的充电速度等。而昆仑增程技术的目标,就是抹平增程和纯电在体验上的差距。 问题 1:动力 阿维塔首先盯上的,用户感知最为明显的动力问题。 以往的增程车型在电池电量充足时有着强劲的动力,但在馈电状态下动力严重衰减,影响用户在高速、爬坡等高动力要求场景下的用车体验。「满电一条龙,馈电一条虫」并不只是一句玩笑,核心原因在于动力电池在馈电状态下,其放电能力会出现衰减。根据汽车之家上个月做的测试,主流增程车型的衰减幅度普遍超过 40%。 为了解决这个痛点,阿维塔携手宁德时代,推出了一块容量为 39kWh 的「神行超级增混电池」,其在满电状态下拥有 9C 的峰值放电倍率,即便是在低电量状态下,也能保持 7.7C 的峰值放电倍率。 具体到搭载昆仑增程的阿维塔 07 上,其在满电状态下的零百加速成绩是 4.9 秒,馈电时仍能达到 5.8 秒,差距仅有 0.9 秒,衰减率为 15.5%。两驱车型的衰减率更低,满电加速成绩 6.6 秒,馈电为 7.3 秒,衰减率不到 10%、与此同时,阿维塔 07 在馈电时的最高车速为 190km/h,与满电时无异。 在加速层面,增程车型还有着另外一个难题,就是连续加速后的动力衰减。周末出游,如果遇到曲折蜿蜒的山路,你可能会发现,连续深踩几脚油门过后,车子似乎「越踩越没劲」。实际上这是系统为了保护电机,防止其过热损害内部的永磁体,而自动降低电机的输出功率导致的。 一般来说,电机内部如果达到了 180°C,就会对转子上的永磁体造成不可逆的损伤,因此电机通常会在转子达到 140°C 时,就开始限制输出功率。行业通常的做法是通过电驱的油温来计算转子的温度,但这样的方式并不准确,误差甚至可能会达到 30°C,这意味着,实际温度可能只有 110°C,系统就开始限制功率了。 为了让温度测得更准,阿维塔在电机的 50 个关键位置安装了温度采集设备,同时在软件层面,引入了 AI 大模型,通过各种工况下测得的海量数据来对其进行训练,当大模型学习和理解温度的变化规律,从而进行更高精度的温度计算——电机内部温度到了 132°C 时,系统才会限制功率输出。 官方表示,搭载昆仑征程的阿维塔汽车,能够做到连续 25 次零百加速后,依旧维持原有的动力水准。 问题 2:噪音 &震动 车辆在高速行驶时,我们对发动机的噪声感知其实并不太强,因为它会被风噪和胎噪所掩盖,因此对于增程车型来说,需要重点解决的是低速和怠速的发动机噪音,而行业通常的做法其实就是给增加隔音材料,做物理隔离。 而阿维塔决定从根源上去解决。 我们采用了 30 多项主被动降噪技术,包括集成排气歧管,减震限流器、静音、正时链条等等多项超静音的结构设计,并将连杆活塞组件做轻量化处理,比行业减重 15% 以上,有效改善了机体的震动。 胡成太表示,阿维塔自研的昆仑增程 HE 1.5T 超增压专用发动机,配备了电子机油泵技术与停机活塞主动控制技术,成功将怠速充电时的车内声压控制在 35.7dB。「说实话,这个表现已经是同级别里面最好的了,」胡成太说,「但我们觉得还不够完美。」 实际上,这个 35.7dB 只有在发动机运转一段时间过后才能达到,刚启动时产生的震动和噪声,还是没有办法解决,这本身就是内燃机领域的百年难题,而这一问题,在如今的增程车型还被进一步放大了。 传统的机油泵是靠发动机来带动,然后把机油泵到发动机需要润滑的地方,这个工作原理有一个天然的 bug——发动机需要先运转起来,才能够带动油泵工作。这就带来两个问题: 发动机在刚启动时润滑不足,会产生较大的噪声和震动; 润滑不足产生的磨损比热机时更严重,尤其是增程车型。 不少增程用户充电都比较勤快,发动机有可能几个星期都不会启动,机油几乎全都流回了油底壳里,这个时候启动,震动以及造成的磨损都会比平时更加严重。 而昆仑增程全球首搭的电子机油泵由独立的电机驱动,控制更灵活,响应更快,每一次开车,电子机油泵都会先建立机油压力,一旦需要启动,它就会无延迟地给发动机提供润滑,让启动更安静。正因如此,胡成太将电子机油泵称为「增程的绝配」。 除此之外,停机活塞主动控制技术也是昆仑增程独有的技术,听起来有些专业拗口,胡成太给我们做了个类比: 这就像骑自行车,我们上车的时候会下意识地去调整脚踏板,把它调整到一个更容易发力的位置,但下车的时候我们则不会去管脚踏板在哪里。其实发动机也是同样的道理,有一个最的最有利于启动的活塞的位置,在这个位置上启动,缸压会最低,阻力会最小,震动也会更低。 为了寻找这个位置,阿维塔用了一个最笨的方法:把活塞调到不同的位置,反复测试缸内压力,通过大量的实验数据来找到最佳位置。在发动机熄火后,一旁的发电机会转换身份,成为电机,进行反向转动,从而带动曲轴的旋转,把活塞调到最佳位置。 最终的结果是发动机的启动的缸压降低了 62.5%,气动瞬间的震动降低了 90%。 问题 3:补能 如今,快充已经是高端纯电车型的标配,很多都已经支持 4C 甚至 5C,但增程到现在为止仿佛停留在 10 年前一样,充电速度慢得可怜,再加上电池容量小,需要更频繁的充电,一叠加,用户体验就很差。 而昆仑增程的神行超级真混电池,电量从 30% 充到 80% 只要 15 分钟。阿维塔还会在明年带来一款更大的电池,容量为 52.4kWh,峰值充电倍率达到 4C,电量从 30% 到 80% 只要 10 分钟,从满电到 15%,纯电续航里程可以达到 325 公里。 至于综合续航,阿维塔控制在了 1220 公里——这并非一个特别突出的成绩。对此,胡成太作出了他的解释: 行业里已经有人实现超过 1600 公里的能力,其实我们也可以,只需要把从 45 升换成 65 升,但其实这对用户来讲并没有意义,实际续航超过 1000 公里,再往上其实是负担,用户要长期多背 20 公斤的重量,多占 20 升的空间,这是不划算的。 弃子?大股东! 介绍完昆仑增程,我们来聊聊阿维塔这个品牌本身。从诞生之日起,联合了长安汽车、华为、宁德时代的阿维塔被市场寄予厚望,但其市场表现却并不算理想。 长安汽车去年提到,在慕尼黑车展进行全球首发的阿维塔 12,上市首月大定量就突破了 2 万辆,订单均价超过 35 万元,称其「已逐步站位高端市场」。但事实上,即便是阿维塔 11 和 12 两个车型加起来,2023 年的总销量也只有 2.7 万辆,远未达成 10 万辆的销量目标,只完成了 23.5%。 即便是在更便宜的 24 款车型推出后,阿维塔也只是略有起色,如今到了 8 月,车圈全年赛事已然过半,阿维塔的业绩仍显得不疾不徐,上半年的销量加起来,仍旧抵不过别人一个月的销量。 因为自身卖的不好,阿维塔还差点拖垮了长安,以至于今年上半年,长安不得不降本增效,关掉阿维塔的自营店,选择让经销商卖车。有不少人认为,这是长安放弃阿维塔的信号。但实际上,长安一直都没有放弃。 去年 9 月,长安宣布对阿维塔进行增资扩股。公告显示,阿维塔拟新增注册资本 3.50 亿元,其中长安汽车增资 1.23 亿元,另有 7 家投资方参与增资。通过增资,阿维塔的注册资本由约 16.45 亿元增至约 19.95 亿元。在增资公告发布的前一天,阿维塔还完成了 B 轮融资,募集资金 30 亿元,投后估值近 200 亿元。 阿维塔变「弃子」的谣言不攻自破。 最近,长安汽车与华为车 BU 的股权合作也有了实质性的进展,阿维塔以 115 亿元购买华为引望的 10% 股权,成为第二大股东。引望是华为车 BU 独立后成立的公司,与华为的进一步合作,或许有助于阿维塔提升销量,进而提高行业竞争力。 在今晚的发布会中,长安汽车董事长朱华荣表示,阿维塔与华为的合作将从此前的 HI 模式升级至更深入的 HI PLUS 模式,入股引望,也让双方有了更深的资本上的绑定。 关于阿维塔,朱华荣还曾说过这么一番话: 一直以来,我都有一个判断和信念,十年内一定会诞生世界级的中国品牌,这也是我对阿维塔的期许。拥有全新面貌、全新起点的阿维塔品牌,绝对有可能带来更多惊喜。 而在产品层面,如今的阿维塔也更加「脚踏实地」。朱华荣称,阿维塔将会在今年四季度推出阿维塔 07、阿维塔 11 增程版以及阿维塔 12 增程版。利用增程车型的受众更广、成本更低的特点,逐步实现正向现金流。
中国机器人相关有效专利超19万项,占全球约三分之二
IT之家 8 月 21 日消息,在今日上午开幕的 2024 世界机器人大会上,工业和信息化部副部长辛国斌提到,截至 2024 年 7 月,我国持有的机器人相关有效专利已超过 19 万项,占全球比重约 2/3。 辛国斌表示,机器人被誉为制造业皇冠顶端的明珠,是人工智能技术与实体经济深度融合的重要领域。当前,新一轮科技革命和产业变革深入演进,全球机器人产业创新密集活跃,机器人易用性及配置效率显著提升,正以空前的广度和深度融入人们的生产生活,推动人类社会加速进入智能时代。 他提到,过去十年来,我国加大创新政策支持,推进生产服务模式变革,促使我国机器人产业从小到大,到今天已成为全球机器人产业的一支重要力量。中国已连续 11 年成为全球最大工业机器人市场,近三年新增装机量占全球一半以上;制造业机器人密度达到每万名工人 470 台,十年间增长近 19 倍。 辛国斌最后表示,下一步,我国将大力开展机器人基础研究、关键核心技术攻关,积极完善“机器人 +”应用体系,推动我国机器人产业高质量发展。 图源 Pexels IT之家 8 月 9 日报道,国家发展改革委就业收入分配和消费司负责人常铁威还提到,我国送餐、教育、医疗等服务机器人不断迭代升级,2024 上半年服务机器人产量同比增长 22.8%。 2024 世界机器人大会于 8 月 21 日至 25 日在北京经济技术开发区(北京亦庄)北人亦创国际会展中心举行,聚焦产业发展、协同创新和技术革新三大篇章。 2024 世界机器人博览会继续采用“机器人 +”应用场景展示方式,深耕成熟应用,拓展新兴场景,邀请到了包括波士顿动力、宇树、特斯拉等 150 余家国内外机器人头部厂商、知名公司、行业新锐参展,60 余家企业首次亮相,50 余款新品将首发登场。
史上首次,苹果高端iPhone由印度生产
编译 | 陈骏达 编辑 | Panken 智东西8月21日消息,据彭博社昨日报道,印度将参与今年9月发布的iPhone 16全系列手机的生产工作,这是苹果首次在印度生产Pro和Pro Max机型的iPhone。 中国台湾电子代工大厂富士康的印度工厂已经在加紧工人的培训工作,力求在9月的全球首发之前完成iPhone 16 Pro和Pro Max机型在印度的本土化生产。另一家中国台湾电子代工大厂和硕的印度子公司也参与了iPhone 16 Pro的制造工作。 印度本土企业将首次参与iPhone高端机型的制造工作。2023年底,印度最大企业塔塔集团收购中国台湾电子制造企业纬创的印度业务,成为苹果在印度的3家合约制造商之一。他们投资600亿卢比(约合51亿元人民币)的新工厂最早将于今年9月开始运行,容纳以女性为主的50000名员工,成为印度最大的iPhone组装厂之一。不过,这一工厂的大部分零部件都由富士康印度工厂生产,或是从中国进口。 印度已成为iPhone全球供应链中的重要一环,其中大部分苹果供应链企业都选择在具有高质量劳动力的泰米尔纳德邦设厂,苹果上一个财年中14%的iPhone为印度制造。印度日益崛起的中产阶级将iPhone视为身份的象征,这或将成为苹果未来的一个机遇。 到今年年底,印度生产的iPhone便基本能够满足当地市场的需求,本地组装的iPhone Pro系列机型可能会比进口版本便宜10%。不过,大部分印度制造的iPhone Pro和Pro Max机型会出口到欧洲、中东和美国,因为印度市场对这些机型的需求量较小。 一、富士康领衔制造工作,印度本土企业首次参与 在上一个财年中,苹果累计在印度组装了价值约140亿美元的iPhone,占其全球总产量的14%。知情人士称,苹果会在iPhone 16标准版全球首发的同一天推出印度制造的版本。 iPhone 16系列手机预计将于今年9月正式发布。作为苹果在印度组装的主要合作伙伴,富士康在印度南部泰米尔纳德邦的工厂已培训上千名员工,力求尽快生产出iPhone 16 Pro与Pro Max机型。他们的目标是尽可能赶在全球首发之前完成。 ▲富士康印度工厂(图源:彭博社) 知情人士透露,苹果在印度的另一家合作伙伴——电子制造商和硕的印度子公司也会尽快开始组装Pro机型。这类高端机型往往拥有更大的电池、更好的相机与钛金属机身,并且也需要更好的生产线方能完成。 在过去,苹果在印度主要依赖3家合约制造厂商,分别为富士康、和硕与纬创,这3家企业均来自中国台湾。2023年底,印度本土最大企业塔塔集团(Tata Group)以1.25亿美元的价格收购了纬创的印度业务,并成为苹果在印度唯一的本土合约制造商。塔塔集团也将首次参与今年iPhone 16高端机型的组装工作。 塔塔集团曾在2023年投资600亿卢比(约合51亿人民币)在泰米尔纳德邦建立一家新的iPhone组装厂。这一工厂预计将于印度今年的节日季(9月-11月)投入运营,并雇佣以女性为主的约50000名员工。 二、为什么选择印度?市场广阔、用工性价比高 在过去一段时间里,印度总理莫迪出台了大量吸引高端制造业的财政激励措施。苹果iPhone全系列产品在印度的生产,标志着印度成为iPhone全球供应链中的重要一环。 印度目前是世界上人口最多的国家,也日益成为苹果的重要市场。iPhone在印度被视为中产阶级的身份象征,因此受到不少消费者的追捧。 苹果首席执行官库克在2023年访问印度,为印度首批开设的2家苹果专卖店揭幕。2023年,苹果在印度的年销售额接近80亿美元,同比增长33%。 ▲库克为印度孟买的苹果专卖店揭幕,同期开设的另一家专卖店位于新德里(图源:苹果) 多家iPhone印度工厂的选址都位于泰米尔纳德邦。该邦拥有7600万人口,其城市化水平、识字率、性别比和人类发展指数都在印度名列前茅。 电子制造业是泰米尔纳德邦的支柱产业,2023年产值达到53.7亿美元,位居印度之首。三星、思科和戴尔都在泰米尔纳德邦设有工厂,因为这里能提供价格相对低廉且素质较高的制造业劳动力。 知情人士称,到今年年底,印度制造的iPhone将能够基本满足当地需求。与进口设备相比,本地组装可能会帮助苹果将Pro版本的iPhone价格降低多达10%。 不过印度政府仍会在这一基础上征税,高昂的零部件进口关税和其它税收可能会让印度iPhone的售价高于一些没有税收的海外市场。 苹果计划把大部分印度制造的Pro和Pro Max机型出口到欧洲、中东和美国,因为印度对这些定价较高的产品需求量较小。不过,即将到来的节日季可能会提振这部分产品的在印度的销量。 结语:苹果供应链全球化持续,但印度工厂仍面临挑战 苹果供应链全球化的深度和广度正在不断扩展。苹果供应链企业除了在印度增加投资之外,还在越南、巴西等国都有布局。其中,越南更是凭借与中国接壤的地缘优势,承接了大量iPad和苹果可穿戴设备的组装工作。 苹果在印度的供应链企业能获得廉价的劳动力,但印度员工与富士康、和硕等中国台湾企业管理层的文化差异也是需要面临的挑战。此外,印度的基础设施仍然较为落后,若印度希望进一步提升其在苹果全球供应链中的地位,就需要优化道路和电力等基础设施。
奇瑞星纪元 ES 上市:奇瑞要打造自己的奥迪和「雷克萨斯」
大众集团有「奥迪」,丰田集团有「雷克萨斯」,世界上两个最大的汽车集团都有自己的高端品牌,国内几个大的汽车集团也都逐步开始考虑类似的计划:打造属于自己的高端品牌,于是乎我们看到了仰望、腾势、极氪等等品牌异军突起。 奇瑞集团子品牌也不少,其中负责高端化的是星途 EXEED,而星途旗下的星纪元是高端化突破的核心。 因而,在星纪元 ES 2025 款发布会上,奇瑞集团董事长尹同跃就说: 星途,特别是星纪元,要成为奇瑞的「奥迪」,奇瑞的「雷克萨斯」,为奇瑞集团发展成为「百年老店」镀上一层金色。 有意思的是,雷克萨斯的主力车型恰好就是 ES 系列,当然,电动化之后的星纪元 ES 各种意义上,都和雷克萨斯 ES 有相当大的差异,不过当雷克萨斯 ES 降价到了 2 字头,星纪元 ES 也卖到了 2 字头,二者已然产生交集,这种交集不仅存在于中国市场,也可能在全球市场上,毕竟奇瑞是中国车企中出海做得最好的,没有一,并且星纪元 ES 2025 款也是一款全球车型。 所以,2025 星纪元 ES 是一款什么样的车? 设计:一头一尾一颜色 首先说一个个人的审美判断:星纪元 ES 颜值能打,设计比以往的奇瑞车型,包括星纪元车型要大胆不少。 过往奇瑞的设计并不显山露水,主打一个低调,但星纪元 ES 是个例外,2025 款的设计亮点可以分为三点:一头一尾一颜色。 一头:ISD 风语交互灯,由 744 颗 LED 灯珠组成,可以生成 11 种场景图案。 因为电车不需要进气格栅,所以电车的前脸设计基本上以简洁风格为主,这类风格见仁见智,相对而言,星纪元 ES 的前脸因为这个 ISDN 风语交互灯变得更有辨识度,当然设计风格也更为复杂。 一尾:驭风电动尾翼,尾翼未必有大用处,但尾翼帅啊。星纪元 ES 的电动尾翼有两档角度可以调节,最大能够提供 37KG 的下压力,城区道路用不上,但跑高速确实可以更稳一点。 一颜色:星纪元 ES 2025 款的专属配色为晨曦红,这是由百年历史世界级工业涂料巨头 PPG 为星纪元 ES 2025 款特调专属液态金属漆。因为采用纳米工艺和靶向金属定向,所以就呈现了一种流动的金属感,同时饱和度非常之高,红色,高饱和,跑在路上就是最亮眼的存在。 另外,因为是纳米陶瓷清漆,所以耐磨耐刮性能也不错。 除了这一头一尾一颜色之外,其实我认为星纪元 ES 的侧面姿态和线条感也不错,兼顾了优雅和运动感。 科技配置:想要的全都有 这两年开始,许多新势力擅长的产品定义能力也被传统的汽车大厂学习走,比如智能驾驶,智能座舱,零重力座椅, AI 大模型交互等等,一度是科技属性为主的新势力专有。但最近我们可以明显感到,传统汽车大厂不光长于造车,在科技上追赶也很快。 星纪元 ES 就是如此,所以我们可以在它身上看到诸多新锐消费者想要的科技配置: NEP 智能辅助驾驶系统,不光有高速智能辅助驾驶,还有城区智能辅助驾驶。 自动泊车,分为自动泊车辅助 APA(覆盖了多重泊车场景和复杂车位);和记忆泊车(实现地面、地下、跨层记忆路线泊车,长达 1 公里的记忆距离)。 Lion AI 大模型语音交互,更像真人的交互反馈 零重力座椅,座椅通风、按摩和通风 双 50W 无线快充 所以说,星纪元 ES 在智能座舱和智能驾驶层面的表现还是值得期待的,最起码看起来不像是短板了。 基本素质:好底盘,800V 在星纪元 ES 的基础素质层面,奇瑞强调了底盘,续航和安全特质。 星纪元 ES 的底盘采用了前双叉臂+后五连杆悬架,以及 IAS 智能空气悬架+CDC 电磁减振系统,这些配置搭配起来就保证了驾乘体验的下限,以及一些可能的上限:+50MM–10MM 可升降高度、3+1 档可调空悬。 发布会上,奇瑞还突出了星纪元 ES 的安全水平:46000N·m/deg 超强车身身扭转刚度,车身高强度钢、铝用量达 88%,车顶扩压强度超过 11 吨,承受住了三方向 120km 时速的碰撞。 车身尺寸方面,2025 款星途星纪元 ES 长宽高分别为 4945x1978x1467mm,轴距为 3000mm,顶配车型采用了 21 英寸双五辐轮毂,搭配米其林 255/40 R21 轮胎和前后红色卡钳,配合溜背造型,运动感就出来了。 星纪元 2024 款的入门版还是 400V 平台,到了 2025 款则全系变为了 800V 平台,分为单电机和双电机两个版本,电池也有 2 个版本,分别是 77kWh 的神行电池和 100kWh 的三元锂电池,再加上智驾版本的区分,所以分成了 4 个版本: 2025 星纪元 ES Pro:单电机,77kWh 电池,680km 续航, NEP 高速智驾,售价 21.59 万元 2025 星纪元 ES Pro 城市智驾版:单电机,77kWh 电池,680km 续航, NEP 城市智驾,售价 23.69 万元 2025 星纪元 ES Pro 四驱版:双电机四驱,77kWh 电池,605km 续航, NEP 高速智驾,售价 23.69 万元 2025 星纪元 ES Ultra 旗舰版:双电机四驱, 100kWh 三元锂电池, 710km 续航, NEP 城市智驾,CDC+空气悬架,售价 29.99 万元 另外,奇瑞还发布了一款更入门的 2025 星纪元 ES 国际版,主要区别是电池更小,为 70kWh, 续航 605km,售价为 19.59 万元。 所以问题来了,在星纪元 ES 顶配和雷克萨斯 ES 入门版售价接近的情况下,你选哪个 ES 呢?
9月12日重磅开幕!2024服贸会热点前瞻,AI、机器人、算力玩家都来了
作者 | 程茜 编辑 | 漠影 大模型、AI、机器人……这些热门话题俨然已经深入人们生活的方方面面,甚至成为我们日常生活、办公的重要部分。 智东西8月21日报道,2024年中国国际服务贸易交易会将于9月12日至16日在北京举办。今年服贸会主题为“全球服务,互惠共享”,将突出新质生产力,打造“新而专”的展览展示。 其中,服贸会电信、计算机和信息服务专题展将围绕“数贸创新,科技赋能”为主题,设置通信和数字技术、元宇宙两大展馆,开设电信服务、人工智能、智慧生活、低空飞行、专精特新、国际创新孵化、元宇宙前沿技术创新应用体验中心七大展区。 如今,从以大模型为代表的各类AI应用层出不穷,到技能多样的人形机器人“进厂打工”,以及元宇宙技术的逐渐普及,科创创新正以令人瞩目的速度蓬勃发展,且正深刻影响我们日常的方方面面。 围绕着这些科技行业热门话题的AI、算力、机器人行业不断涌现出令人惊叹的成果,此次服贸会汇集了这些赛道的一系列玩家,为企业提供展览展示、洽谈推介、成果发布、配套活动系列服务。此次活动有哪些企业展出了最新科技成果?值得关注的热门赛道有哪些?我们试图从服贸会已经披露的企业参展信息中找到这些问题的答案。 一、大模型遍地开发,行业应用成玩家共识 我国大模型已经遍地开花。根据国家数据局最新统计,中国10亿参数规模以上的大模型数量已超100个,行业大模型已经在赋能各个领域。 1、智谱AI:已构建全自研基座大模型,形成AIGC模型产品矩阵 智谱AI致力于打造新一代认知智能大模型,专注于做大模型的中国创新。智谱AI自2020年底开始研发GLM预训练架构,先后完成了百亿参数模型GLM-10B和中英双语千亿级超大规模预训练模型GLM-130B的研发。 新一代基座大模型GLM-4,整体性能相比上一代大幅提升,比肩世界先进水平。基于全自研基座大模型的强大能力,智谱AI构建了极具竞争力的AIGC模型产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。 2、澜舟科技:“一横N纵”系列产品亮相,能力覆盖理解、问答、协作、翻译 澜舟科技的“一横N纵”孟子大模型系列及其产品将亮相服贸会。“一横”指的是孟子通用大模型、金融行业等孟子垂直大模型。“N纵”是基于孟子大模型的多个能力型应用产品,包括其推出的澜舟智会、澜舟智库、澜舟智搭企业大模型应用三件套。 这些应用的能力覆盖AI文档理解、AI文档问答、AI文档协作、机器翻译以及AI搜索等。 当下,大模型的发展愈加专注于与行业的深度结合,聚焦不同应用方向和场景的工具探索,既能让AI能力深入千行百业,同时可以驱动模型能力提升。 3、滴普科技:专攻工业制造大模型,集成五大核心特色能力 作为工业制造大模型落地的头部厂商,滴普科技入选了全球数字经济大会”2024人工智能大模型场景应用典型案例”。 Deepexi滴普企业大模型集成了五大核心特色能力,如通过语料库的精细化扩展与多模态解析,提升了Token的语义密度和模型性能,增幅近25%;模型具备自动生成SQL调用及Function Calling能力,完成精细化调整,在70B以下模式中排名领先;基于多元逻辑技巧与超参数调优,让Token生成更精准,响应提速逾20%;具备全面的数据安全与权限管理体系,保障了模型的安全与合规。 目前滴普科技已经通过工信部中国信通院模型能力标准符合型4+级认证。针对国产化算力需求,Deepexi Fast5000E一体机预装企业级大模型,能实现低成本、即插即用的高效部署。 二、三大运营商齐亮相,为AI搭建完备底层基座 大模型狂欢背后,算力的重要性愈发凸显,犹如基石之于高楼大厦。大模型的训练和运行需要处理海量的数据,其复杂程度超乎想象。强大的算力是保障大模型能够快速、准确地完成训练的关键。 与此同时,企业涌现出对于AI支撑能力体系愈发复杂的需求,底层基础设施玩家为AI构建起了完备的算力底座,同时这些玩家还依托基础设施构建优势,打造基础模型、机器人等创新成果。 1、中国联通:元景大模型体系,已实现10个行业应用 中国联通已推出“1+1+M”联通元景大模型体系,即1套基础大模型、1个大模型底座、M种行业大模型,相关模型已实现10个行业应用。同时,联通云形成了“安全可靠、云网一体、数智相融、专属定制、多云协同”的特色优势,提供“联接+感知+计算+智能”的算网一体化服务,打造数字经济“第一算力引擎”。 此外,面向C端用户,联想还将以智慧安防、智慧助老、AI看家等为主题,展出诸多最新的科技成果。 2、中国移动:业务涵盖AI、大数据、安全,展出智能体感陪练产品+机器人产品 中国移动的主营业务涵盖移动语音、短彩信、无线上网、有线宽带、物联网等连接服务,数据中心、云计算、 内容分发网络、算网融合等算力服务,以及基于人工智能、大数据、安全等新一代信息技术能力的平台、应用和解决方案。 此次,中国移动还会展出将AI健康技术与中华传统优秀文化“八段锦”内容相结合的运动健身游戏智能体感陪练产品。 3、中国数谷·贵阳贵安:已引进17个超大型数据中心,智算能力突破30EFLOPS 以城市为单位,贵阳贵安正聚焦算力、赋能、产业三个关键,加快推进数字新基建、产业数字化、数字产业化、数字化治理、数据价值化,助力数字经济发展创新区核心区建设,打造具有国际影响力的 “中国数谷”。 目前,该地已引进超大型数据中心17个;布局智算卡超过9万张,智算能力突破30EFLOPS;建设5G基站2.76万个,国际互联网数据通道带宽240G,入围“千兆城市”。 4、思腾合力:提供云计算系列产品+整体解决方案,天津已打造AI产业园 思腾合力专注于AI领域,提供云计算、AI服务器、AI工作站、系统集成、产品定制、软件开发、边缘计算等产品和整体解决方案。目前该公司已经在天津打造了AI产业园,承接全国智能高科技企业入驻;在内蒙古包头建立了云计算中心,新增裸金属服务器租赁、服务器托管和云业务。 本次服贸会,该公司将展示思腾云在图像识别、无人驾驶、语音识别等人工智能算法的应用能力。 思腾云计算适用于图像识别、无人驾驶、语音识别等人工智能算法的训练以及推理应用计算;在科学计算方面,适用于流体动力学、计算金融学、分子动力学、环境分析等。 此外,中国电信、中国铁塔展示算力网络布局、低空经济、人工智能、行业大模型应用、量子等前沿技术成果。 三、机器人落地应用元年已至,四足、人形机器人群雄逐鹿 当下,随着技术创新,机器人产业发展的脚步加快,一方面,从工业、服务到特种,机器人应用领域逐渐拓宽;另一方面,大模型技术不仅增强了机器人的认知智能,还提升了其交互和推理能力,推动机器人大脑发育以及智能自主进化。 技术与应用的双轮驱动下,机器人产业正迎来前所未有的机遇期。 1、中国移动:打造四类家庭机器人矩阵,机器狗、下棋机器人将亮相 中国移动智家中心依托家庭产品研发运营中积累的视频生成、家电操控等能力,打造的“益智、陪伴、人形、双足”四类家庭机器人产品。 在服贸会上,中国移动还将展出家庭四足机器狗笨笨、中国移动与商汤深度合作的首款娱乐性家庭智能机器人AI下棋机器人。 2、伟景智能:自研双目智能视觉技术,展出新一代双足行走人形机器人 伟景智能是一家以立体智能视觉和机器人技术为核心,专注研究和生产立体视觉工业相机和人形机器人的人工智能公司。该公司自主研发了基于“立体视觉+自然学习(Natural Learning)”的双目智能视觉技术,具备可认知、可学习、累积性、叠加性等特性,帮助机器人更好地感知立体世界。 该公司已经发布新一代双足行走人形机器人晓唯,拥有视觉、语音、学习、行走以及操作五大核心能力,可以 四、物联网快速增长、深化应用加速,万物智联时代已来 目前物联网整体发展处于快速增长与深化应用的阶段,正从万物互联向万物智联迈进。 其中,车联网是物联网的一种具体应用形式和重要组成部分,车联网为物联网提供了丰富的应用场景和数据来源。车辆作为一个移动的智能终端,搭载了大量的传感器和设备,能够实时采集车辆自身的状态信息(如速度、位置、油耗等)以及周围环境的信息(如路况、天气等)。 新能源汽车与智能物联网平台等诸多科技创新的应用,正为我们的日常生活带来天翻地覆的影响。 1、东风汽车:4+2业务布局,将展出三款新能源车型 东风汽车作为新能源汽车行业的代表玩家,正着力推动新能源跃迁和科技跃迁,围绕汽车产业全价值链,该公司已经形成了“4+2”业务布局。 在服贸会现场,东风汽车将展示猛士917、岚图FREE 318、eπ008三款车型,及商用车“龙擎”和乘用车“马赫”动力、量子架构、东风氢舟燃料电池、东风“悦享智能”等核心技术。 2、珠海爱浦京:平台、应用、行业方案一体化,系列解决方案将亮相 基于自主研发的智能物联网平台,珠海爱浦京将以“核心平台+创新应用+行业方案”的模式,为制造业、工业园区、石油化工等行业的安全生产、绿色低碳等领域,提供安全管理云、安全教育云、智慧检维修管理平台、智慧能碳管理解决方案等数字化产品与解决方案。 此次服贸会,该公司将展示包括三维可视化展示、实时预警告警处理、精准定位、智能调度算法。 3、盈创力和:已掌握系列机房机柜动环测控技术,传感器、检测仪等亮相 盈创力和专注于机房动力环境监控、智能机柜、智慧监控、以太网温湿度传感器、智能温控灯带、一体化智慧综合箱灯产品的自主研发。 此次服贸会,该公司将展出以太网温湿压传感器APEM-5930-P、城市管+智能系列产品YC-MC01、北斗形变监测仪YC-BDS02、户外智能机柜等系列产品。 作为持续关注物联网与工业以太网环境监控产品与研发的企业,该公司已经拥有不同规模下的机房机柜动环测控技术,并为众多企业提供了OEM、ODM产品。 五、多个低空飞行整体解决方案亮相,低空经济产业增速加快 低空飞行产业作为新兴产业,近年来发展迅速,赛迪顾问发布的《中国低空经济发展研究报告(2024)》显示,2023年中国低空经济规模达5059.5亿元,增速达33.8%。其中,低空飞行器制造和低空运营服务贡献最大,接近55%。 1、中国联通:基于5G大带宽、低时延,5G-A通感一体赋能低空管理 无人机、直升机、eVTOL等所飞行的低空区域,被视为一个新的万亿级规模量级跃变的产业空间。 中国联通借助5G的大带宽和低时延能力,打通了无人机系统的操控端、飞行平台端和任务挂载端,真正做到数据链实时同步。联通5G-A通感一体赋能低空管理,为发展低空经济注入新动能。 同时,5G-A技术被认为是5G向6G演进的关键阶段,通信感知融合技术则是5G-A的重要创新方向。 2、亿航智能:无人驾驶航空器产品、低空经济整体解决方案将展示 广州亿航智能等无人驾驶飞行器制造商也将向业界展示适用于不同应用场景的无人驾驶航空器产品和低空经济整体解决方案,进一步推动产业交流与进步,推动低空经济的高质量发展。 此外,无人直升机系统解决方案提供商航景创新将带来其已用于防汛实战的应急通信保障无人直升机平台 结语:科技重磅玩家齐聚,创新成果盛典展现中国力量 服贸会的电信、计算机和信息服务专题展汇集了国内多个领域的重磅玩家,已经成为国内科技展会的突出代表,以及各领域玩家与产业界交流的舞台。 本届服贸会同样汇聚了从AI突破到机器人、物联网革新的众多玩家,在这里,既让我们看到了科技对未来的引领,同时感受到了创新为生活带来的深刻变革。从实验室里的前沿探索到市场上的实际应用,每一项科技创新成果都展现出了强大的生命力和影响力。
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
编译 | 陈骏达 编辑 | Panken 智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型! 微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。 性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数,在5个示例的MMLU测试中击败了GPT-4o mini。这是微软首次使用混合专家模型架构。 这一模型系列中最小的Phi-3.5-mini-instruct在长上下文代码理解任务以明显优势击败Llama-3.1-8B-instruct和Mistral-7B-instruct,而其参数规模还不到Llama-3.1-8B-instruct的一半。 微软本次发布的3款模型的名字中都带有“instruct”,这意味着模型专门针对遵循用户指令进行了优化,这对端侧模型来说是项极为重要的技能。 微软在开源模型库Hugging Face上详细公布了这3款模型的炼制过程,包括数据来源、数据规模、算力等等。3款模型均在MIT协议下开源,开发者可以自由使用、修改或出售软件副本。 项目地址:https://huggingface.co/microsoft/Phi-3.5-mini-instruct 一、连发三款轻量级模型,击败GPT-4o mini与Llama 3.1-8B 微软今天发布的3个Phi-3.5模型包括用于基础快速推理的Phi-3.5-mini-instruct(38.2亿个参数)、性能更为强大的Phi-3.5-MoE-instruct(419亿个参数)和视觉模型Phi-3.5-vision-instruct(41.5亿个参数)。 1、Phi-3.5-mini-instruct:A16芯片本地可跑 Phi-3.5-mini-instruct专为遵守指令而设计,此模型非常适合在内存或算力受限的环境中提供强大推理能力,能胜任代码生成、数学问题和基于逻辑的推理等任务。 尽管参数规模仅有38.2亿,但Phi-3.5-mini-instruct模型在多语言和多轮对话任务中表现出的性能不俗。它在许多基准测试中拥有较为先进的水平,并在长上下文代码理解任务中以明显优势超过了其它模型(Llama-3.1-8B-instruct和Mistral-7B-instruct)。 ▲Phi-3.5-mini-instruct在长上下文代码理解任务中优势明显(图源:微软) 微软并未直接阐明Phi-3.5-mini-instruct能否在手机上运行,但与其参数规模的基本一致的Phi-3-mini在经过4位量化后,能在搭载A16仿生芯片的iPhone上流畅运行,生成速度超过每秒12个token。 2、Phi-3.5-MoE-instruct:微软首个专家混合模型 Phi-3.5-MoE-instruct是微软首个专家混合模型。这类模型将多种功能不同的模型组合起来,每种模型专注于特定的任务。 这款模型利用了具有419亿个激活参数的架构,但根据微软在Hugging Face上公布的文档,这一模型仅需66亿激活参数即可运行。 Phi-3.5-MoE-instruct在各种推理任务中表现出色,在代码、数学和多语言语言理解方面具有强大的性能,超过了参数规模更大的其它开源模型。 ▲Phi-3.5-MoE-instruct对Python、Java等编程语言的掌握显著好于其它同类模型(图源:微软) 这一模型还在5个示例的MMLU测试中击败了GPT-4o mini。这一基准测试涵盖了科技、工程、数学、人文、社科领域的问题。 ▲Phi-3.5-MoE-instruct在5个示例的MMLU测试中以微弱优势击败GPT-4o mini(图源:微软) MoE模型的独特架构还能使Phi-3.5-MoE-instruct在处理多种语言的复杂AI任务时保持效率。这一模型支持包括中文在内的23门语言。 3、Phi-3.5-vision-instruct:适用于OCR、图表理解与视频摘要 Phi-3.5-vision-instruct兼具文本和图像处理功能。能在算力和内存不足的情况下提供较好的一般图像理解能力、光学字符识别(OCR)、图表和表格理解、多图像比较和多图像或视频剪辑摘要等能力。 这一模型能管理复杂的多帧视觉任务。微软强调,该模型是使用合成和过滤的公开可用数据集的组合进行训练的,专注于高质量、推理密集的数据。 二、训练时间最短不到1周,模型全部开源提供 微软还在Hugging Face上公布了这组轻量级模型具体的训练情况。Phi-3.5-mini-instruct模型用掉了3.4万亿个token的数据,训练算力来自512个英伟达H100-80G GPU,训练耗时10天。 ▲Phi-3.5-mini-instruct的Hugging Face页面(图源:Hugging Face) Phi-3.5-vision-instruct模型训练耗时更短,仅为6天。其数据量为5000亿个token,训练过程中使用了256个英伟达A100-80G GPU。 Phi-3.5-MoE-instruct的参数规模较大,因此训练时长为23天。这款模型使用的训练算力与Phi-3.5-mini-instruct一致,但数据量为4.9万亿个token。 3款Phi-3.5模型都在MIT许可下开源,这符合微软之前对开源社区的承诺。MIT许可证允许开发人员自由使用、修改、合并、发布、分发、再许可或出售软件的副本。 该许可证还包括一项免责声明,即软件按“原样”提供,不提供任何形式的保证。微软和其他版权所有者不对因使用软件而可能产生的任何索赔、损害或其他责任负责。 结语:微软轻量级模型再出成果,端侧AI潜力凸显 微软的Phi系列模型一直以轻量级为特点。今年4月底,微软发布了Phi-3系列模型,其能力水平大致与GPT-3.5相当,但运行的成本却远远低于GPT-3.5。仅仅4个月后,微软又将其轻量级模型的表现提升了一个档次。 开发算力要求较低的端侧模型,或许能让微软的AI PC和其它使用Windows系统的设备拥有本地化运行、低延时、高安全性的AI体验。苹果的Apple Intelligence背后也有一系列端侧模型,这显示出即便在模型尺寸越做越大、能力越来越强的现在,兼具性能与成本效益的端侧模型也有巨大潜力。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。