行业分类:
加载中...
头条分类:
加载中...
阿斯麦CEO:世界需要中国生产的传统制程芯片
财联社7月8日讯(编辑 夏军雄)荷兰光刻机巨头阿斯麦CEO克里斯托弗·富凯(Christophe Fouquet)表示,包括德国汽车行业在内的芯片买家需要中国芯片制造商目前投资的传统制程芯片。 富凯于今年4月接替退休的彼得·温宁克,成为阿斯麦新任总裁兼CEO。他发表上述言论之际,有报道称,欧盟正向欧洲芯片行业征求对中国扩大传统制程芯片产能的看法。 所谓传统制程芯片,又称成熟制程芯片,一般指28纳米制程以上的上一代芯片,广泛应用于汽车、洗衣机以及医疗设备等日常科技产品。 “尤其是汽车行业,包括德国汽车行业,需要更多使用更简单、早已为人所知的技术制造的芯片,”富凯在接受媒体采访时说。 据富凯介绍,全球对传统制程芯片的需求正在急剧上升,但制造这类芯片的利润并不高,西方公司的投资也不够。他说:“欧洲甚至不能满足自己一般的需求。” 根据行业组织SEMI的估计,到2025年,中国芯片制造商的产能将增长14%,达到每月1010万片,约占全球总产量的三分之一。 富凯表示:“如果有人想降低(中国芯片生产商的)生产速度,不管出于什么原因,那么就需要替代方案。阻止别人生产你需要的东西是没有意义的。” 据媒体报道,欧盟向欧洲芯片行业征询的信息范围,超过了美国商务部向美国公司发送的安全调查的范围。 去年12月,美国商务部宣布开始管理中国生产的传统半导体的信息,以此追踪美国公司对中国技术的依赖程度。 对此,中国外交部当时回应称,全球产供链的形成和发展是市场规律和企业选择共同作用的结果。人为干预将经贸问题工具化、武器化,违反市场经济和公平竞争原则,加剧全球产供链安全风险,最终受损的是包括美国自己在内的整个世界的利益。美方应当切实尊重国际经贸规则和市场经济原则,为中美经贸合作创造良好条件。
人形机器人“论斤卖”
5~10年将有大突破,商业落地蓄势待发 作者|IT时报记者 沈毅斌 编辑|孙妍 “桌面有点乱,你帮忙清理一下。” “好的,正在为您清理桌面。” 听到指令后,“青龙”一边回答一边缓缓抬起双臂,用双手缓慢且轻柔地抓起桌面上混合摆放的面包和水果,分类放进左右两个篮筐内,即使是柔软的面包,也不会变形。在人形机器人与具身智能发展论坛上展示的这款“青龙”人形智能机器人不仅拥有识别认知能力,185厘米的身高和80公斤的体重,放在机器人界也是妥妥的“型男”一枚。 从国内外众多机器人企业“大秀肌肉”展出的“十八金刚”,到各种论坛畅想着机器人的发展前景,人形机器人、具身智能成为2024世界人工智能大会(WAIC 2024)当之无愧的“顶流”。主办方数据显示,本届大会合计展出的人形机器人超过25款。火热的人形机器人赛道,正在迎来商业化蝶变的关键时刻。 但冷静下来思考,人形机器人的发展依旧面临诸多挑战,上海人形机器人制造业创新中心首席科学家江磊表示,人形机器人当前面临的问题可以总结为“一高五难”,硬件门槛高、软件算法难、软硬解耦难、知识积累难、人才聚集难、安全应用难。 人形机器人与具身智能目前发展现状如何?何时能够商业化落地?怎样让人形机器人遵循“机器人三大定律”?带着这些问题,走进WAIC 2024的人形机器人“世界”。 人形机器人应该“论斤卖” 人形机器人由控制器、传感器、精密减速器、交流伺服电机等核心零部件组成,每一个部件都需要不菲的成本。 根据Macquarie Research在2023年发布的报告,人形机器人的硬件总成本目前约为5万美元。其中,端到端AI软件大脑、传感器与芯片、伺服电机与电机驱动器都各需要1万美元,惯性测量单元与扭矩传感器需要5000美元,精密减速器需要8000美元,电池与电池控制系统需要2000美元,其他部件约5000美元。 以色列智能机器人中心主席Yosi Lahad在人形机器人前沿论坛上表示,为了让人形机器人能够得到大规模采用,其成本需要降到2万美元以下,是现在成本的一半以下,甚至可能需要对机器人的外型进行一些改变,例如重新考虑模仿人类腿部的底座设计。而特斯拉预计明年量产的Optimus,预计成本控制在1万美元左右,预计售价2万美元。 相比之下,国内人形机器人已经将售价降至10万元以下,今年5月,宇树科技发布的最新的人形机器人产品Unitree G1,市场售价仅9.9万元起。“我们一直认为,人形机器人未来应该像猪肉一样论斤卖。”宇树科技联合创始人陈立在“国际人形机器人技术与应用发展论坛”上表示,抛开研发成本,人形机器人其实是铁、钢、铜等材料的堆叠,随着零部件的量产,成本自然也会随之降低。 根据《2024年中国人形机器人行业研究报告》,人形机器人按量产规模不同,降本大致可划分为三个阶段:小批量千台量级生产,降本20%~30%至约10万美元;万台级别降本50%至5万美元;数十万至百万台大规模量产,降本70%~80%至2万~3万美元。一时间,人们感到人形机器人商业落地近在咫尺。 但需要注意的是,Unitree G1与Optimus的区别在于没有搭载大模型,若按照智能标准来看,特斯拉的Optimus依旧可以作为行业的风向标之一。 成本不仅来自硬件 硬件是人形机器人最直观的成本,但在降低成本方面不能只依赖于硬件的量产。 “硬件成本降低我认为已经不是主要难题,而是时间问题,设计和研发环节的成本才是人形机器人目前需要突破的成本问题。”聚焦国讯芯微董事长方婷婷在论坛上表示,国内人形机器人领域有许多核心技术依赖国外进口,如人形机器人仿真工具平台。 从人形机器人软件形态来说,大量的跨学科内容都需要软件来融合,需要更多的相关产业企业来抱团。而人形机器人本体厂商也要从设计之初就考虑软硬件成本。 鑫精诚传感器董事长吴浩认为集成化也是降低人形机器人成本的方式之一,比如在灵巧手方面,人类的手指可以感受温度、力度等,人形机器人的传感器也可以借鉴,将多模态的感受集成在同一零部件上,这样既能降低成本,也能减少体积。 人形机器人会在哪些应用场景爆发?B端场景下,开普勒CEO胡德波认为,第一类是工业场景,尤其是重工业,工人的安全得不到保障,用人成本高,适合用人形机器人替代;第二类是仓储物流场景,可能是最快实现落地的场景之一;第三类是制造业,如3C制造、汽车制造等。业内人士对C端场景的应用已经达成共识,人形机器人将走进千家万户,赋能养老育儿场景。 据高盛最新预测,人形机器人到2035年将呈爆发式增长,出货量将达到140万台,全球市场总规模(TAM)达380亿美元。全球从事物流和制造业的人形机器人将在2030年左右达到100万台,人形机器人有望在十年内走入服务、家庭护理、健康和教育产业。 5~10年迎来大突破 如今的人工智能如同一颗封在瓶子中的“大脑”,虽然会计算、思考,却不能付诸行动。具身智能是一种智能系统或机器通过感知交互与环境进行实时互动的能力,通俗的理解是为人工智能打造一款可操控的身体,包括四足机器狗、工业机器人、动物仿生机器人、自动驾驶汽车等多种形态,但人形机器人的类人形态,可以更贴合人们的互动需求,无疑是具身智能的最佳载体。 中国工程院外籍院士张建伟在人形机器人与具身智能发展论坛上表示,实现具身智能需要完成三个维度的突破,即空间维度,在开放式、复杂、动态的空间环境下,实现二维、三维动态语义建模;时间维度,除了简单移动外,还要同时具备操作和使用工具的能力;交互能力,让机器人基于知识和人、环境做出正确的交互行为。这其中依赖的便是AI大模型。 仅靠大模型进行感知、策划还不能让具身实现真正智能,加入“小脑”才能进行动作执行。 以“青龙”为例,名为“朱雀”的具身大脑以多模态大模型为核心,通过文字信息、图像信息作为输入,输出语音交互以及任务决策信息。“玄武”小脑模型则是具体任务执行模型,轨迹规划模块由端到端模仿学习所驱动,以人类的作业作为模仿对象,进行机载视觉输入,并输出人们所期待的行动轨迹。运动控制器则基于强化学习的智能运动控制方法和全身动力学的模型预测控制方法两条技术路径,通过环境信息以及机器人的状态,完成任务执行。 尽管AI大模型开始“移植”到具身智能上,但效果并不算理想。“青龙”机器人平台技术负责人梁振杰坦言,目前,模型还处于发展的初期阶段,功能尚不完善,能力仍需提升。 宇树科技CEO王兴兴在论坛中表示,目前大语言模型、多模态模型对整个世界的理解其实是非常糟糕的,包括时间、时空、物理定律等方面的理解。世界模型+具身智能才是通向AGI的最佳路径。 上海人工智能实验室主任、首席科学家周伯文也认为,具身智能不只是大模型加机器人的应用,而是需要根据物理世界的反馈及时进化的大模型。 不过,对于人形机器人和具身智能未来的发展,业内依旧持积极开放态度。“未来5年肯定有很大的技术突破,绝对不会超过10年。”王兴兴预测道。国家地方共建人形机器人创新中心总经理许彬也表示,会把相关的人形机器人的全栈技术,包括大脑、小脑、肢体的相关技术全部开源。通过5年~10年,在人类的家政服务、交流陪护领域进行更多应用。 规模化数据是最大痛点 数据无论是对人工智能,还是具身智能而言,都是灵魂般的存在。目前,人形机器人主要数据来源是国外的开源数据,以及研发机构通过动作捕捉、视觉捕捉等方式自行采集。 但自行采集往往需要大量的人力成本,去不断模拟演示。北京大学助理教授、银河具身智能联合实验室主任王鹤在人形机器人与具身智能发展论坛上举例道,把电池放到盒子里这样一个对于人类而言十分简单的动作,特斯拉靠40人的采集团队进行遥操实现,每一个倾斜、横倒、错位等所有失效案例都要采集。 “人形机器人规模化数据是整个行业目前最大的痛点。”国家地方共建人形机器人创新中心研发体系总监邢伯阳也同样表示。 面对这一行业痛点,王鹤认为当下可以真正实现规模化量产的数据就是合成数据。所谓合成数据,是一种通过算法生成的数据,虽与真实数据相似,却并不直接来源于真实世界。 靠合成数据具身智能实现了从0到1的突破。在银河通用机器人训练时发现,二维传感器存在泛化问题,跳脱出训练数据便不会处理;三维传感器又无法识别玻璃等透明物体。最终,靠合成数据进行千万场景十亿抓取的大规模训练,才实现银河通用机器人对各种物体的任意抓取。 邢伯阳代表的国家地方共建人形机器人创新中心则主张通过数据开源的方式来共享海量数据。为此打造出Openloong开源社区,通过社区和训练场创新的机制加速人形机器人、具身智能训练和数据集构建的工作。 不发展是最大的不安全 人形机器人已不再是科幻小说中的幻想,而是融入日常生活的现实。试想一下,未来人形机器人穿梭于繁华都市的大街小巷,在工厂、医院等地按照系统指令按部就班,这将改变人们的生活方式和社会结构。而与这一科技进步相伴而来的,是关于人形机器人治理的思考与挑战。 “高铁刚进入中国时,许多人担心电磁波辐射;早期飞机、电话等发明同样被人们所担忧。可以说人类的进步史就是对科技发展的担忧史。我们应该制定一部促进人工智能发展的法律,而不是一部规范人工智能行为的法律。”在人形机器人法治与伦理论坛上中国政法大学副校长时建中表示,面对担忧不应过度焦虑,要对人工智能采取包容和审慎态度,这体现在训练数据易获取、算力与算法鼓励合作、生成内容容错并及时纠错等方面。 联合国人工智能高级别咨询机构成员、中国政法大学数据法治研究院教授张凌寒同样表示,不发展是最大的不安全,要全力促进人工智能的发展。 “它就像一岁半大的孩子,需要我们的正确引导。”华东师范大学人工智能金融学院院长、教授邵怡蕾表示,目前,人形机器人在人工智能的加持下已经具备感知智能和认知智能,最后一座需要攻克的“堡垒”是行为智能。而当人形机器人行为出现在人类社会后,是对人类身份与法律的挑战,这不仅需要对人形机器人进行身份界定,更需要人类对其行为进行引导和约束。 如何协调机器人与人类之间的互动?阿西莫夫的“机器人三定律”曾经被视为基础规范。但是,当具身智能时代来临之际,这样的“约法三章”已经难以解决人机共生的复杂问题,需要一种新的法律治理架构。 中国海洋大学法学院教授李晟在《东方法学》人形机器人法治专刊中表示,治理架构需要立足于人形机器人与人的差距,考虑当前发展阶段的应用问题,而不是关注人形机器人替代人时所产生的未来问题。
人工智能测谎技术问世:比人类更强,但需谨慎使用
IT之家 7 月 8 日消息,近年来,人们在分辨真假信息方面遇到越来越多的挑战,尤其是网络上充斥大量的虚假新闻和夸大宣传。研究表明,人类在判断真假话方面表现得并不好。 图源 Pexels 据IT之家了解,传统测谎手段,例如测谎仪,因其准确性问题而饱受诟病。一些人认为,人工智能 (AI) 可以帮助我们提高识别谎言的准确率。未来的某一天,基于人工智能的测谎系统或许能帮助我们识别社交媒体上的虚假信息、评估网络上的各种言论,甚至还能甄别求职者的简历和面试回答中的夸大之处。然而,问题在于我们是否会信任这些系统,以及它们是否值得信赖。 德国维尔茨堡大学经济学家 Alicia von Schenk 及其团队最近研发了一款人工智能测谎工具,该工具的准确率明显高于人类水平。他们进行了相关实验以探究人们如何使用这一工具,实验结果显示,使用该工具的人在识别谎言方面确实有所提升,但同时也会导致更多的人被怀疑说谎。 研究人员在发表于 iScience 期刊的论文中提到,他们让参与者书写周末计划。其中一半的参与者被要求撒谎,并会因为说服人相信谎言而获得少量金钱奖励。研究共收集了来自 768 人的 1536 份陈述。 随后,研究人员利用谷歌的人工智能语言模型 BERT,对其中 80% 的陈述进行训练,以帮助算法区分真假话。测试结果表明,该工具能以 67% 的准确率识别出剩余 20% 陈述的真伪。相比之下,人类的平均准确率仅为 50% 左右。 为了解人们如何借助人工智能工具识别谎言,von Schenk 团队又将另外 2040 名志愿者分成小组进行了一系列测试。 其中一项测试显示,当人们可以选择支付少量费用使用人工智能测谎工具并获得奖励时,只有三分之一的人会选择使用该工具。von Schenk 推测,这可能是因为人们对这项技术持怀疑态度,或者高估了自己的识谎能力。 然而,选择信任该工具的那三分之一人对其表现出了极大的依赖。“当人们主动选择依赖这项技术时,他们几乎都会遵循人工智能的预测…… 他们非常信任其判断。”von Schenk 说。 这种依赖会影响我们的行为。通常情况下,人们倾向于相信他人说的是实话。这项研究也印证了这一点 —— 尽管参与者知道一半的陈述是谎言,但他们只标记出其中的 19%。然而,当人们选择使用人工智能工具后,标记为谎言的比例上升到了 58%。 在某种程度上,这或许是一件好事。此类工具可以帮助我们在日常生活中识别更多的谎言,例如社交媒体上的虚假信息。 但另一方面,这也会破坏信任,而信任是人类行为的基础,有助于我们建立良好的人际关系。如果准确的判断建立在社会关系的恶化之上,那么这样的准确性还有价值吗? 其次,准确率问题也不容忽视。研究人员承认,他们的目标仅仅是让 AI 比人类表现更好,但对于社交媒体内容的真实性判定或求职者的简历审核等场景来说,仅仅“比人类强”可能还不够,因为这会带来更多的误判和指控。 值得一提的是,传统测谎手段也存在着缺陷。测谎仪旨在测量心率和其他生理唤醒指标,因为人们曾认为压力是说谎者的特有生理反应。但事实并非如此,这也是为什么测谎仪结果在美国法庭上通常不被采信的原因。 von Schenk 指出,由于人工智能测谎工具易于大规模应用,其带来的影响可能会更大。测谎仪每天只能检测少数人,而人工智能测谎工具的应用范围几乎是无限的。 “鉴于当下充斥着大量虚假新闻和错误信息,此类技术的确有一定的益处,”von Schenk 说,“然而,我们确实需要对其进行严格测试,以确保其远超人类的准确率。如果人工智能测谎工具只会带来大量的误判,那么或许放弃使用才是更好的选择。”
OpenAI这个盘,阿里云们能接得住吗?
7月8日,距离最后的关口只差一天。 6 月 25 日,OpenAI通知部分开发者,将从7月9日起阻止来自其不支持地区的API 流量,不幸的是,目前OpenAI仅向161个国家和地区开放API,中国恰好未包含其中。这意味着,中国的开发者们将不能使用来自OpenAI的API服务。 这份“禁令”,有人将其与曾经的“芯片”断供相类比,认识到国产大模型发展的重要性;也有人设想未来,看到了国产大模型崛起的机会与即将面临的严峻挑战。一石激起千层浪,这或许就是OpenAI这个大模型领军者的能量。 不过作为追随者的国产厂商,历经两年的发展已经变得有模有样。在OpenAI禁令下达的不久后,这些厂商已动作起来,试图吃掉OpenAI遗漏的盘子。那么,这个盘他们真的能接得住吗? 抢客竞赛 OpenAI禁令对大模型行业有何影响? 一边是部分开发者的层层担忧,一边却又是大模型厂商的跃跃欲试。 目前,国内使用OpenAI的技术主要有两种渠道,一种是对接OpenAI官方提供的API;一种是对接微软智能云Azure提供的OpenAI技术。当下,虽然第一种渠道被关闭,但第二种渠道仍然畅通,甚至微软内部员工表示,今年包括中华地区在内,工作重心是推OpenAI。 这意味着,OpenAI禁令的影响在开发者端并没有想象中那么大。事实上,对开发者影响大的反倒是禁令发布后国内厂商们的动作。 当一条街上最受认可、人流量最大的饭店被关了之后,会发生什么?周围的饭店会趁着这个机会大力促销抢客。现在的大模型领域就是如此。 随着OpenAI禁令的公布,大模型厂商迅速行动起来,推出了自己的迁移方案,甚至有的还抛出了零成本迁移服务,主打的就是一个“来就行了”。 其中,最先动起来的是百度智能云千帆,推出“0元迁移+服务”的豪华套餐。其中,文心旗舰大模型首次免费,针对OpenAI迁移用户赠送与OpenAI使用规模对等的更高级旗舰模型使用包,在7月25日24点前适用。 大厂中,阿里云也不甘示弱,承诺提供“最具性价比的中国大模型替代方案”,通义千问为中国开发者提供2200万免费Tokens和专属迁移服务;腾讯云宣布为新迁移企业用户免费赠送1亿腾讯混元大模型tokens(标记),并提供免费专属迁移工具和服务。 此外,智谱、零一万物、百川智能、月之暗面等也加入到这场接盘之争中,抛出了“特别搬家计划”“Yi API二折平替计划”“零成本迁移计划”等。其中,月之暗面发文表示,“Kimi开放平台接口完全兼容 OpenAl,最快五分钟实现丝滑搬家。” 这些新老厂商们有着自己的底气。如果说发展早期,国内厂商许多“套壳”OpenAI,将技术化为己用,甚至大厂都有过这样的传闻,那么经过发展,当下国内厂商已经具备了独立自主的实力。 如周鸿祎所说,“国内在早期大模型训练时,会用OpenAI来生成一些微调的数据,相当于把OpenAI GPT-4的能力‘蒸馏’到国内本地大模型里,但这是在大模型发展早期。现在大模型的很多训练方法、数据、工具都已经发展非常成熟了,这样做的厂商应该也不太多了。” 从行业端来看,这次OpenAl禁令,除了让一些仍然继续“套壳”的厂商生存艰难外,对拥有自主研发能力的国产厂商反倒是利好:一,给他们空出了一点儿盘子;二,敦促他们继续加强自主研发投入。 曾经在团购、共享出行、共享单车这些领域上演的百团大战,如今正在大模型领域上演,且战况更加激烈。 最近的2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)上,参展大模型的数量由去年的30多款,迅速增长到百款,其中有阿里、华为、百度、商汤、腾讯、网易这些老牌大厂,也有智谱、百川智能、阶跃星辰这些新势力。 “这个WAIC是我参加以来最火的一次”,百川智能技术联合创始人谢剑在一场论坛中感慨道。 火热的市场,催化着这些厂商不断迭代,此次大会期间,华为、快手、商汤、腾讯、网易、B站等厂商各展所长,或从娴熟的业务入手,或从精通的视频起步,或发挥自己在语音能力上的优势…… 中小厂同样有自己的竞赛智慧。有厂商表示,2023年做了20多个应用场景测试,而今年仅保留和聚焦了“企业营销大模型”这一场景,并不断进行深挖,解决最困扰企业发展的获客成本问题。 如果说2023年是大模型的诞生元年,那么2024年就是大模型的应用元年。所有人都试图找准自己的优势,更快找到自己与产业、与商业的落地点。OpenAl禁令后的抢客竞赛,不过是再普通不过的竞争新日常。 落地之战 从团购到外卖,从共享出行到共享单车,中国互联网的每次竞争,都离不开价格战的影子。降价抢客户——市场份额提升——涨价赚利润,这几乎是每次行业竞争的基本路径,互联网厂商们对此已经形成依赖。 大模型上,似乎也是如此。OpenAl禁令后的抢客竞赛,其实不过是大模型价格战的缩影。自今年5月以来,国内厂商就掀起了一轮大模型降价潮,可以对标GPT-4等全球主流模型的自研模型,它们将价格从每单位几分降到了几厘。 百度就宣布文心大模型4.0 Turbo(ERNIE 4.0 Turbo)面向企业客户全面开放,输入输出价格分别是0.03元/千Tokens、0.06元/千Tokens。 当然,这些聪明的大模型厂商们,并没有对大模型降价效果寄予像其他行业那样的厚望,与团购、外卖、共享出行这些更偏向C端的行业相比,更偏向B端的大模型投入更高,用户对价格的敏感性也并没有那么高。 一个共识是,AI将是一次巨大的成本驱动型的生产力革命,但企业在使用AI并不是成本驱动,而是由能否产生业务价值来决定。通俗地来说,企业使用AI是为了降成本,为了更高的生产效率,但企业使用AI并不像普通人那么在乎钱,而更在乎好不好用。 京东探索研究院院长何晓东的看法,代表了一大部分业内人士的心声:“大模型价格战短期来讲确实会繁荣生态,但长期来讲一定不是长久之计,现在的价格可能连电费都不一定付得起。” 可以预见,大模型的价格战将在理性与谨慎中展开。华泰证券在一份研报中也持这一观点:“我们认为,国产厂商在这波降价中,并不会盲目打价格战,仍然会考虑成本等因素。” 截至今年5月,通过对各大模型厂商的降价模型进行统计后,华泰发现,降价甚至免费的并不是模型厂商最先进的模型,往往是Lite轻量版或本身价格较低的模型。同时,“降价幅度较大(80%以上)的多是国内互联网大厂,拥有自有的云算力基础设施。” 意不在价格战,那么国内厂商的这些降价动作真正目的是什么? 大模型兼顾C端和B端属性,OpenAI的ChatGPT可以在全球普通科技爱好者中掀起一轮机器人对话热潮,也可以与苹果、微软合作。前者让大模型这个概念爆火,让OpenAI估值暴涨,让全球资本看到大模型的无限前景;后者让大模型落地到产业中,让它可以商业化。 现在许多大模型厂商都有面向C端的聊天机器人,这成为它们向普通用户展示自身能力的窗口。但大多数厂商都像OpenAI一样将当前的发展重心放在了商业化上,其优先级甚至超越了模型能力的发展。据外媒报道,OpenAI 正在考虑将其治理结构转变为一家营利性企业。 尤其是对于中国厂商来说,商业化普及必须加速。原因有二: 一,投入大。大模型投入动辄数十亿、数百亿,再大的企业都不能长期单纯投入不产出,所以需要一边深入基础研究,一边做应用研究,将技术尽快转化为成果,促进技术与市场的正向循环; 二,赢者通吃。大模型是一个赢者通吃的市场,中国市场竞争激烈,在商业化上慢人一步就必须耗费更大的成本抢回份额,甚至还可能步步慢。 而无论是成长为超级应用,还是发展为深入产业的超级模型,大模型商业化普及的前提是用户/客户普及。 民生证券在研报中指出,当新应用上线时,市场应从成长性的维度出发,观测用户规模和活跃度、下载量、产品迭代等指标,关注应用的发展潜力,弱化对付费用户规模、付费渗透率等营利性指标的考虑。 降价,永远是刺激消费,提升普及率的有效方式,在大模型领域也不例外。据阿里云CTO周靖人透露,降价后大批客户在阿里云上直接调用大模型,近两个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。 有用户/客户就有生态,有生态就有规模和增长。作为API资源供给方,AI开放平台存在一个这样的飞轮:更多的API产品、更低的调用单价——更好的AI能力和体验——更多的开发者入驻——形成更大的产业生态——反哺AI平台壮大——更多产品、更低单价…… 价格竞赛背后,打响的是一场商业化落地之战,更是未来门票的抢夺战。谁能抢到更多的客户,落地更多的场景和产业,谁就在竞赛中更有优势。 结语 在打响价格竞赛、抢客竞赛的同时,大模型厂商不能忽视的还有另一个关键之战:技术之战。 降价竞争的背后是技术之战。单纯牺牲自身利润的降价是莽夫之举,正面的案例是优化架构中的各个部件,降低训练成本、推理成本。 竞争的终极是技术之战。大模型是一个人才密集、技术密集的行业,顶级的技术几乎是一切竞争的先决条件,造轮子、买沙发式拼汽车的糊弄方式在这里一定不适用,别人不会留着时间等你,用户也没有耐心等你。 现在才是竞争加速的初始阶段,但也是关键阶段。或者说,任何时候都是关键阶段。
国产算力路在何方?2024 WAIC行业观察
2024年7月4日~6日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海圆满召开。当今全球生成式人工智能(AI)发展热潮正加大对“算力”的需求,这也成为本届大会的重要议题之一。 作为AI生态基础设施的重要组成部分,包括华为、浪潮信息、中兴通讯、壁仞科技、摩尔线程、燧原科技、国科微、无问芯穹、天数智芯、联想、中科曙光在内的中国GPU芯片与设备公司,以及中国电信、中国联通、中国移动等头部算力企业,均在WAIC 2024大会精彩亮相,展示一系列助力我国AI算力发展“破局”的成果。 算力步入万卡时代,多种难关亟待攻克 2022年ChatGPT-3.5大模型横空出世,引发全世界生成式AI浪潮,彼时这一大模型规模约为1750亿个参数,然而2023年推出的ChatGPT-4,参数迅速膨胀至1万亿个。如此体量的大模型,建设超过1万张GPU加速卡的算力集群必不可少。 在7月6日WAIC举办的中兴通讯AI创新生态论坛,中国工程院院士郑纬民指出,“人工智能发展有三驾马车,其中一驾就是算力。”步入万卡集群时代,数据中心将面临一系列全新挑战需要攻克。郑纬民表示,万卡时代GPU之间的互联是大问题,如何实现高带宽、低时延连接?将是提高计算效率的重点。此外作为万卡规模的数据中心,可能2~3小时就会发生一次故障,如何应对故障率增加的问题同样是一大挑战。 郑纬民指出,尽管目前英伟达占据AI GPU龙头位置,性能领先,但是目前基于国产AI芯片的系统,最关键的差距并不在算力方面,而是生态。他表示,之前许多企业并不愿意使用国产AI芯片方案,最核心的问题在于国产AI芯片的软件生态不好,易用性方面与英伟达相比有明显差距。为此,郑纬民提出国产软件生态需解决的重点,包括编程框架、并行加速、容错系统等。 目前,我国算力基础设施规模位居全球第二,截至2023年底,我国在用数据中心机架总规模超过810万架,算力总规模达到230EFlops;以闪存技术为代表的先进“存力”不断提高,在部分行业占比超过25%。郑纬民认为,尽管目前我国算力行业面临国外算力获取难、国产算力使用难/效率低、国产算力种类多等痛点,但只要解决关键问题,一定可以构建开放解耦、互联互通的国产算力新生态。 助力生成式AI,国内算力企业深度赋能 为解决当前算力提升瓶颈难题,助力我国生成式AI进一步发展,本届WAIC各大厂商带来一系列解决方案,涵盖“云、边、端”各个应用场景。以下为集微网对本届大会亮相的重点国内算力企业进行盘点: 壁仞科技:三个维度解决算力瓶颈 壁仞科技创立于2019年,致力于研发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。在7月5日举办的“智启新章·算引未来”AI基础设施论坛,壁仞科技副总裁兼AI软件首席架构师丁云帆表示:“解决算力瓶颈问题需要从三个维度考虑:硬件集群算力、软件有效算力、异构聚合算力。” 丁云帆称,在硬件集群算力维度,壁仞科技在行业中相对领先,2020年设计的第一代产品里面就做了chiplet的架构,兼具DSA和通用GPU两个优势,是当前行业主流能够突破摩尔定律的解决方案。壁仞科技同样注重互联能力,支持单节点8卡全互连,目前已推出千卡集群建设方案,并可扩展至万卡规模。在软件效率方面,通过优先级、资源配额、弹性训练等多种手段来提升集群的调度效率,真正发挥硬件算力优势。此外,壁仞科技同样开发了异构聚合算力技术,支持壁仞GPU与英伟达A100 GPU协同训练,效率超过90%。 如何解决郑纬民院士提出的“高故障率”“并行难”问题?在7月6日举行的“中兴通讯AI创新生态论坛”,丁云帆介绍,与中兴通讯合作开发大型计算集群的3D并行、弹性训练技术,能够自动进行故障迁移,灵活应对故障;创新的网络拓扑,也能够减少网络拥塞风险。 对于AI芯片企业来说,在不断攻克技术难点的同时,需提前进行算力建设规划。7月4日,壁仞科技联合创始人兼COO张凌岚在圆桌会议表示,AI算力芯片的迭代周期通常为两年至三年,远远慢于应用侧的迭代速度。今年壁仞科技将重点发展两部分:一是进一步完善软件平台,让现有产品尽快适配全新的应用需求;二是在下一代产品中前瞻性地预见市场趋势带来的技术需求,并提前在设计中布局。 摩尔线程:AI旗舰产品夸娥升级 摩尔线程此次参与WAIC 2024,宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案升级,在GPU显存和传输带宽方面,夸娥万卡集群具备PB级显存总容量、每秒PB级超高速卡间互联总带宽和节点间互联总带宽,全面提升集群计算性能。 摩尔线程称,希望能够建设一个规模超万卡、场景够通用、生态兼容好的加速计算平台,并优先解决大模型训练的难题。此外,该公司同时推出夸娥集群管理平台(KUAE Platform)以及夸娥大模型服务平台(KUAE ModelStudio),旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。 燧原科技:智算中心在多地落地 燧原科技在WAIC现场展示了展示了智算中心落地案例和里程碑系列产品,还为与会者带来了基于燧原算力的AIGC交互体验站,展示其最新商业落地成果及规模化应用。 在生成式人工智能(AIGC)应用方面,燧原科技现场展示编程助手、AI视频生成、3D生成等交互技术。由燧原和智谱AI合作的大模型编程助手一体机,基于云燧i20推理加速卡,能为软件开发企业提供代码生成、代码翻译、代码注释、代码补全、智能问答等多种服务。 无问芯穹:千卡规模异构芯片混训平台 无问芯穹联合创始人兼CEO夏立雪,在7月4日WAIC现场发布了千卡规模异构芯片混训平台,称这一训练集群算力利用率最高达到了 97.6%。夏立雪宣布,无问芯穹 Infini-AI 云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性。 无问芯穹同样展示其Infini-AI大模型开发与服务云平台,并表示7月起,通过试训申请的用户,已可在Infini-AI上一键发起700亿参数规模的大模型训练。 天数智芯:自研通用GPU产品矩阵 天数智芯连续4年参加WAIC大会,该公司表示,联合合作伙伴推出的大模型推理16卡服务器,搭载16张自主研发的智铠100推理卡,性能和性价比达到国际一流水平。天数智芯宣布,与爱特云翔合作建设千卡GPU算力集群,可支持千亿以上参数大模型的全量预训练,支持客户进行微调、参数高效微调等服务,解决了大模型训练高端算力紧缺的瓶颈问题,从算力底层支持国产大模型创新发展。 协力共创,打造中国AI生态 我国人工智能的发展,效率、生态是一大瓶颈。为齐心协力推动我国AI算力及应用建设,多家企业拿出了开放包容的态度,携手打造中国AI生态。 壁仞科技联席CEO李新荣强调,人工智能是一个庞大的系统工程,人工智能产业形成的三大要素包括:数据、算力、算法。融合三大要素的AI生态集成、生态建设,需以软硬件整合的方式实现。 壁仞科技丁云帆介绍,壁仞科技构建了开放的BIRENSUPA软件生态系统,携手合作伙伴和客户共同推进大模型产业生态的发展,为国产GPU在千卡集群规模上实现商用落地提供了有力支持。这一平台包含编译器、多种工具链,支持主流深度学习框架和自研推理加速引擎,并配备针对不同场景的应用SDK等,能够助力开发者实现软硬件协同,探索未来的无限可能。目前壁仞科技《BIRENSUPA编程模型白皮书》现已正式公开。 在WAIC大会期间,壁仞科技对外宣布,搭载壁砺系列通用GPU算力产品的中国移动智算中心(呼和浩特),近日成功上线运营。据了解,中国移动智算中心(呼和浩特)属于全国型N节点万卡训练场,单体算力6.7EFLOPS(FP16)。采用万卡高速互联、软硬全链路监控等高新技术为AI业务保驾护航,同时通过液冷机柜、闭式冷却塔、智能小母线等绿色节能技术,实现设计PUE值平均为1.15。今年5月,壁仞科技正式获颁中国电信“云网基础设施安全国家工程研究中心云计算合作伙伴”;在WAIC大会期间,中国电信发布了四大AI联创基地,壁仞科技作为中国电信的算力合作伙伴参与其中,共同为人工智能大模型场景应用助力赋能。 摩尔线程表示,万卡集群的建设需要产业界的齐心协力,为实现大模型创新应用的快速落地,让国产算力“为用而建”。发布会现场,摩尔线程携手中国移动通信集团青海有限公司、中国联通青海公司、北京德道信科集团、中国能源建设股份有限公司总承包公司、桂林华崛大数据科技有限公司(排名不分先后),分别就青海零碳产业园万卡集群项目、青海高原夸娥万卡集群项目、广西东盟万卡集群项目进行了战略签约。 本届WAIC,燧原科技表示正在推进“燎原”生态合作计划,以全国算力一体化布局的智算中心算力网络为根基,在燧原自主技术体系的基础上,发展云服务、大模型、垂直模型(ISV)、AIDC集成部署运营运维等战略生态伙伴,打造从算力建设到应用的完整落地闭环。目前,燧原科技已在四川成都、湖北宜昌和甘肃庆阳展开了智算中心的建设及合作。其中,宜昌点军智算中心仅用1年时间完成了300P国产算力建设和交付,并实现了上线全消纳。 无问芯穹在4个月前,宣布其Infini-AI大模型开发与服务云平台宣布首次公测,已有智谱AI、月之暗面、生数科技等大模型公司客户在Infini-AI上稳定使用异构算力,还有20余家AI Native应用创业公司在Infini-AI上持续调用各种预置模型API,使用无问芯穹提供的工具链开发自身业务模型。此举将打通异构新品生态,持续降低大模型应用落地成本。 天数智芯表示,天数智芯通用GPU产品适配主流CPU芯片/服务器厂商,能够支持国内外主流AI生态和各种深度学习框架,通过标准化的软硬件生态接口为行业解决产品使用难、开发平台迁移成本大等痛点,大幅缩短适配验证周期,实现业务系统的无缝使用,可以灵活支持各种算法模型,便于客户自定义开发。 集微网了解到,本届WAIC 2024,中国电信领衔承办主题论坛,聚焦中国电信智算及大模型能力规划;中国联通在“AI+赋能,智算未来”论坛上启动“上海联通新一代智算中心”,加快国产算力布局;中国移动举办以“AI赋能,创见未来”为主题的生态论坛,并正式启动五个“100”人工智能生态计划。 其它厂商方面,在“2024昇腾人工智能产业高峰论坛”中,华为携手生态伙伴首发昇腾AI新品,展现AI算力领域的技术与商业合作新样本;中兴通讯展示端到端的全栈全场景开放解耦的智算解决方案,覆盖智算、通算、存储全场景组网;算能科技携算力处理器、RISC-V融合服务器智算集群、多样大模型体验区、云边端全场景智能生态产品等亮相展区;商汤科技带来国内训练大模型的先进基础设施,SenseCore商汤大装置总算力规模高达12000PFLOPS,可支撑超过20个千亿超大模型同时训练。 随着AI大模型引发全球新一轮科技浪潮,我国算力产业在压力之下正在蓬勃发展,各项创新技术不断涌现。除了技术领域,目前我国同样注重AI产业安全与风险,已建立了一套涵盖产业应用、算法、算力、数据等方面的治理规则。 壁仞科技张凌岚强调,壁仞科技对未来AI算力芯片的市场前景和技术落地充满信心。未来,随着国产AI算力芯片陆续落地,我国多产业的数字化转型有望进一步加深。李新荣表示,希望早日实现自主可控的国产供应链,同时搭建一个覆盖全产业的软件生态合作平台。壁仞科技不只是国产大模型训练的支持者,同时也希望能够积极支持并且利用自有的资源来推动产业协作。 本届WAIC 2024大会,吸引来自50多个国家和地区的嘉宾、观众前来,汇聚1300位全球领军人物,9位图灵奖、菲尔兹奖、诺贝尔奖得主,以及88位国内外顶级院士,线下参观人数突破30万人次。 如今万卡计算时代正逐步到来,AI基础设施提供的强大算力,正为生成式AI、大模型前沿创新提供充足的想象空间。本届WAIC 2024汇聚全球AI领域前沿技术与成果,促成产学研各界的深度对话。通过不断创新的架构和开源开放的生态系统,未来中国算力产业必将持续取得突破性进步,紧紧跟随世界前沿。从长远看,人工智能必将成为推动产业经济发展的关键,随着各类应用逐步落地,AI将深入赋能千行百业,成为我国创新与发展的得力助手。
OpenAI头号竞争对手:大模型训练成本最多三年将升至百亿美元
AI初创企业Anthropic的CEO称百亿美元量级AI(人工智能)模型的训练可能在明年开始。 近日,Anthropic的CEO兼总裁达里奥·阿莫代(Dario Amodei)在播客节目In Good Company中表示,目前公司正在开发的AI模型训练成本高达10亿美元,他预计,AI模型的训练成本将在2027年之前提升到100亿美元,甚至是1000亿美元。 被视为OpenAI头号竞争对手的Anthropic由一群OpenAI前员工创立。阿莫代在OpenAI工作了五年,在离开时,他已经做到了OpenAI副总裁的位置。Anthropic旗下最知名的模型是在2023年3月发布的Claude模型,今年3月,Claude 3系列正式发布。 在采访中,阿莫代谈到了自己对于AGI(通用人工智能)的看法,称自己不认为AGI会在某一个时间点突然出现,而是会以循序渐进的方式逐渐现身:“我认为,这就像一个能够学习和成长的人类孩子一样,他们会变得越来越好、越来越聪明,知识越来越丰富。” 为了让模型越变越好,就需要越来越多的资金投入。据报道,GPT-4o的训练“仅”花费了不到1亿美元,谷歌Gemini Ultra模型的训练成本则为1.91亿美元。阿莫代预计,100亿美元量级模型的训练可能会在2025年的某个时候开始,一个充满活力的下游生态系统也会随之出现。目前,公司已经筹集了超过80亿美元的资金。 阿莫代指出,模型推出的速度和模型的成本与质量之间存在一定关系,可以把它想象成一条“权衡曲线”。公司正在努力推动这条曲线“向外移动”,以同时实现模型的快速推出、高质量和低成本:“曲线在变化,我们可以用更少的资源做更多的事情,也可以用更多的资源做更多的事情。我认为这两种趋势是共同存在的。” 当主持人问到“谁会在AI上赚最多的钱”时,阿莫代认为,尽管有先后顺序,所有人都会分得一杯羹:“蛋糕会变得很大。就像现在,芯片公司肯定赚得最多,我认为这是因为模型的训练先于模型的部署,而模型的部署先于其收入。所以我认为,芯片公司的估值是一个先行指标,AI公司的估值可能是一个当前指标,而下游很多东西的估值是滞后指标,但这股浪潮将影响到每个人。” 随后,阿莫代也谈到了AI芯片龙头英伟达。面对越来越激烈的竞争,英伟达将产品发布间隔从隔一年发布大幅缩短至每年发布一次,今年市值已涨到三万亿美元以上。阿莫代指出,为了构建AI集群,包括Anthropic在内的AI企业正在为英伟达的芯片支付大笔金额;虽然尚未看到AI产生的大量收入、依然存在泡沫破灭的可能,但Anthropic选择继续押注看涨。 目前,以GPU为主的硬件需求仍是决定AI训练成本的一大因素。今年6月,红杉资本分析师David Cahn表示,AI行业每年需要为数据中心等基础设施支付6000亿美元的费用。在过去的采访中,阿莫代曾提到,有足够资金来训练专业等级AI模型的公司依然不多。 今年6月,Anthropic发布了旗下性能最强的AI模型Claude 3.5 Sonnet,称其为“迄今为止最智能的模型”。据介绍,在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能基本全面超越了包括GPT-4o在内的一众知名AI模型,仅在MMLU(大规模多任务语言理解)和MATH(数理)数据集上略逊于GPT-4o,且优于自家此前最强的模型Claude 3 Opus。
ChatGPT无法取代人类程序员:IEEE35页论文测出困难编码正确率仅为0.66%
有了ChatGPT,还需要人类程序猿编码吗? 上个月,一项发表在IEEE TSE期刊(Transactions on Software Engineering)上的研究评估了ChatGPT所生成的代码在功能性、复杂性和安全性方面的表现。 结果显示,ChatGPT生成可用代码的能力差异很大。 其成功率从0.66%到89%不等,这主要取决于任务的难度、编程语言等多种因素。 论文地址:https://ieeexplore.ieee.org/document/10507163 具体来说,研究人员测试了GPT-3.5在5种编程语言(C、C++、Java、JavaScript和Python)中,解决LeetCode测试平台上的728个编码问题,以及应对18个CWE(常见缺陷枚举)场景的能力。 虽然在某些情况下,AI能够生成比人类更优质的代码,但分析也揭示了,一些AI生成代码的安全性问题。 论文作者、格拉斯哥大学助理教授Yutian Tang指出,「AI代码生成一定程度上,可以提升开发效率,自动化软件工程。然而,我们必须认识这类模型优势和不足,以便合理应用」。 「通过全面的分析,可以发现ChatGPT生成代码过程中,出现的潜在问题和局限性,进而改进生成技术」。 有网友庆幸地发出疑问,所以我还没有被解雇?另一人对此表示,至少不是今天。 还有人指出,这项研究是关于GPT-3.5的评估。要是GPT-4早就在编码能力上大幅提升,Claude 3.5更是如此。 确实,现在我们有了更好的模型,对于GPT-3.5模型的评估,并没有太大的意义。 0.66%-89%,惊人反差率 总体而言,ChatGPT在不同编程语言的问题上表现相当不错——特别是在尝试解决2021年之前LeetCode上的编码问题时。 例如,它能够为简单、中等和困难的问题生成可运行代码,成功率分别约为89%、71%和40%。 然而,当涉及到2021年之后的算法问题时,ChatGPT生成正确运行代码的能力受到影响。即使是简单级别的问题,它有时也无法理解问题的含义。 比如,ChatGPT在生成「简单」编码问题的可运行代码方面的能力,在2021年后从89%下降到52%。 而它在生成「困难」问题的可运行代码方面的能力也在此时间后从40%下降到0.66%。 Tang对比表示,「一个合理的假设是,ChatGPT在2021年之前的算法问题上表现更好的原因是这些问题在训练数据集中经常出现」。 接下里,具体看看研究者们对ChatGPT进行了哪些方面的评估。 实验评估 评估的整体流程如图2所示。 首先为给定的LeetCode问题或CWE场景构造合适的提示并发送给ChatGPT,让它根据提示和上一轮对话的上下文信息给出响应。 之后,研究人员将模型响应中的代码片段提交给LeetCode平台,利用其在线判断功能来检验代码的正确性,CWE漏洞则使用CodeQL进行手动分析。 如果测试结果通过,则生成结束,否则就需要利用LeetCode和CodeQL的反馈继续建立新的提示、输入给ChatGPT,再次进行代码生成。 如果ChatGPT在对话轮数限制(5轮)之内始终没有生成出通过测试的代码,则认为生成任务失败。 功能性正确代码生成 ChatGPT生成的代码在功能上是否正确? 研究动机: 给定提示,ChatGPT生成相应的文本,这种能力可能会提高开发者的生产力。首先去评估ChatGPT在单轮对话中,自动生成功能正确代码的能力。 研究方法: - 让ChatGPT阅读问题描述,在单轮对话中生成相应代码。(最大对话轮数设为1) - 使用LeetCode平台上的编程问题作为数据集,截止研究时,有2500个难度不等的问题。 - 将LeetCode所有问题分为2021年之前(Bef.problems)和2021年之后(Aft.problems)两类,因为ChatGPT的训练数据截止于2021年。 - 考虑到2021年之前的问题可能已存在于ChatGPT的训练集中,这可能使代码生成任务退化为简单的数据库查询(即代码复用)。为了进行全面评估,研究中同时考虑了这两类问题。 具体而言,研究人员重点关注LeetCode上的算法问题,因为算法问题是该平台上最重要、最多和最多样化的问题。 Bef.problems和Aft.problems的总数分别为1624个和354个。此外,两者的难度分布为难、中、易,比例为1:2:1。 在所有Bef.problems中,作者随机抽取了374个问题,其数量与Aft.problems相似,难度分布也与Aft.problems相同。 同样,在354个Aft.problems和Bef.problems中,难、中、易问题的数量比例也是1:2:1,与LeetCode平台上所有问题的难度分布一致。 此外,研究人员还检查了Bef.problems和Aft.problems之间是否存在显著差异。 如果Aft.problems只是Bef.problems的重构,那么ChatGPT很可能可以轻松解决这些问题,这可能会影响实验结果在区分时间段方面的可靠性。 论文中,作者总共找到了142对问题。然后,再让2名研究生独立检查这些问题对。 通过仔细核对和讨论,结果发现这些相似的问题要么情景相似,但求解目标完全不同;要么情景和条件不同,但可以使用类似的算法(如动态编程)求解。 经过仔细的人工分析,作者没有发现在任何情况下,Bef.problems可以很容易地重新表述为Aft.problems。 因此,作者认为Aft.problems和Bef.problems之外,对于每个问题,都要求ChatGPT用5种不同的语言生成代码:C、C++、Java、Python3和JavaScript。 此外,他们还使用相同的提示模板为每个 < 问题、语言> 对创建了相应的提示。 Bef.problems和Aft.problems分别共有1,870和1,770个提示。由于ChatGPT的查询速度有限,研究者将每条提示输入一次,要求生成代码。 然后,研究者将解析后的解决方案,提交给LeetCode进行功能正确性判断,并得到提交状态,包括接受、回答错误、编译错误、超过时间限制和运行错误。 它们分别对应于A.、W.A.、C.E.、T.L.E.和R.E.。一个问题对应一个唯一的对话,以避免从其他问题触发ChatGPT的推理。 实验中,作者以状态率(SR)来评估 ChatGPT 的代码生成能力。其中 和 分别是根据状态生成的代码片段数和输入的提示数。 提示: 所设计的提示模板由4个部分组成:它们分别是<Content>、<Examples>、<Template>和<Command>。 <Content> 用自然语言描述问题,<Examples> 显示功能正确的代码 <input, output> 对,<Template> 指定生成代码的方法签名(method signature),<Command> 要求用特定语言生成代码。 结果: 表1和表2显示,LeetCode对五种编程语言在两个时间段、两种形式下的代码生成结果、SR以及相应的相对频率柱形图。 由于Python3和JavaScript都是动态编程语言,因此这两列不包含C.E.。 从总体结果来看,ChatGPT为Bef.problems生成的功能正确代码的A.率明显高于Aft.problems。 具体来说,Bef.problems的五种语言平均正确率(68.41%)比Aft.problems的(20.27%)高出 48.14%。 五种语言在不同阶段的代码生成性能差异显著,P值为0.008,效应大小值为1。 对于Aft.problems,总体正确率低于25%,其中难、中、易问题的正确率分别为0.66%、13.90%和52.47%。 用Holm-Bonferroni校正程序调整的P值和五种语言不同难度之间的效应大小值分别小于0.05和等于1。 结果表明,面对Aft.problems,随着问题难度的增加,ChatGPT在功能上正确生成代码的能力明显下降。 此外,即使是简单的问题,它也只能正确回答一半。 在这五项/四项指标中,W.A.率是所有语言中最高的一项,达到58%。 此外,每个W.A.代码片段平均有109个测试用例,而ChatGPT生成的代码只能通过其中的25%。 难题、中难题和简单难题的测试用例通过率分别为20.90%、21.03%和38.41%。因此,无论难度如何,生成代码的语义都与相应问题描述的逻辑有很大差异。 此外,C.E.率和R.E.率也都达到了16%,而且难题和中难题的C.E.率明显高于简单难题。 ChatGPT生成的中难题代码,更容易出现编译和运行时错误。比如,图4中显示生成的函数cmpfunc,在调用前没有声明。语法错误只占这些错误的一小部分(3.7%)。 至于T.L.E.率,虽然数值不高(6%),但测试用例的平均通过率为51%,高于W.A.代码片段。 T.L.E.问题的难、中、易三个难度级别的测试用例,平均通过率分别为68%、50%和1%(易问题由于其T.L.E.率接近0%,可以忽略不计)。 由于T.L.E.代码片段的测试用例通过率是部分的,不过生成的代码中最多还有6%在功能上是正确的,尽管它们的时间复杂度可能并不理想。 细分到每种语言,C、C++、Java、Python3和JavaScript的A.率分别为15.38%、19.37%、20.17%、23.93%和22.51%。 此外,图5显示了将五种不同语言与每个问题(仅考虑至少有一个正确解决方案的问题)相结合的A.率分布(接受率分布)。 从图中可以看出,Medium语言的平均线和中位线都≤0.5,而Easy语言的平均线和中位线都≥0.6。 对于简单问题ChatGPT更容易将生成的代码泛化到不同的语言中。简单问题和中等问题的中位数和均值分别为0.4和0.5。 对于Bef. Problems问题方面,难、中、易问题的正确率分别为40.13%、70.95%和89.80%,远高于Aft. problems,但不同难度之间仍存在显著差异。 用Holm-Bonferroni校正程序调整后的P值和难与中、难与易之间的效应大小值分别小于0.05和大于0.9。 五种语言中,中等难度和简单难度之间的调整后P值和效应大小值分别为0.056和0.76。 ChatGPT在解决2021年之前训练集中可能出现的问题时,表现更好,尤其是中等难度和简单难度的问题。 解决难题的正确率提高了40%,但仍低于50%,这表明ChatGPT生成逻辑复杂问题代码的能力仍有很大的提升空间。 总体正确率下降到 17.03%,难、中、易问题的正确率分别为32.89%、15.05%和6%。 生成的代码仍能通过平均112个测试用例中的25%。难、中、易问题的测试用例通过率分别为19.19%、31.12%和47.32%。 后两者都提高了10%,这表明ChatGPT对Bef. Problems有更好的理解力。 不过,C.E.率和R.E.率仍达到13%,接近Aft. problems的16%,两个阶段之间的P值和效应大小值分别为0.328和0.3125,且困难问题通过率最高,中难度问题通过率次之。 编译错误和运行时错误与Aft. problems类似,例如,图6所示代码用于重塑给定的二维矩阵,但在第15行引发了运行时错误,该行为*returnColumnSizes分配了错误大小的内存。 至此,T.L.E.率降至1.87%,测试用例平均通过率为74%。 接下来,再细分到每种语言,C、C++、Java、Python3和JavaScript的A.率分别为47.24%、68.63%、76.37%、75.35%和74.44%。 后四种语言的A.率值彼此接近,且大大高于C(最低级别语言)的A.率值,至少高出20%。 图 7 显示的是与图 5 相同的Bef. Problems。从图中可以看出,中等题和简单题的平均线和中位线都≥0.75,而且它们的中位数和平均值之间的差异比之前的Aft. problems要小一半。 此外,有难度的平均线和中位线都≥ 0.55。对于Bef. Problems,ChatGPT更容易将代码扩展到不同的语言中。 ChatGPT接受的问题的人类平均接受率为55%,而ChatGPT未接受的问题的人类平均接受率为47%。 总而言之,通过实验,ChatGPT在功能性正确代码生成任务上,比起Aft. problems,更加擅长解决不同编程语言中的Bef. Problems。 尤其是,前者的平均正确率比后者高出48.14%。此外,不同的难度也会影响基于ChatGPT的代码生成。 对于两个阶段的问题,ChatGPT都能生成运行时间和内存开销小于至少50%的人类解决方案的代码。 无论哪个阶段的问题,ChatGPT生成的代码出现编译或运行时错误的概率都差不多,平均为14.23%。 在所有问题中,C++、Java、Python3和JavaScript的A.率值分别为44.75%、48.74%、50.00%和48.80%,彼此接近,且大大超越C的31.28%。 多轮修复功能管用吗 在这个方面,作者想探究ChatGPT支持的多轮对话能力在改进代码正确性上究竟表现如何?人类能够「知错就改」,LLM可以吗? 首先,研究人员对ChatGPT生成的157段代码的错误类型进行了分析,可以大致分为以下几类: - 细节错误(WD):代码细节上的错误一般源于误解题意,或者代码与问题理解不一致,但大体逻辑基本正确,因此这类错误很容易被修复。 - 误解某些内容(MCC):生成代码没有满足给定问题的主要条件,使用的算法合适,但需要修改其核心。 - 误解问题(MP):指ChatGPT完全错解了题意,这是最难修复的一种情况,代码需要完全重写, 将错误信息反馈给ChatGPT的方式依旧延续了图3所示的格式,包括原始问题、生成代码片段、LeetCode的报错信息以及相应指令。 进行不超过5轮的对话修复后,得到了表5所示的结果。 可以看到,157个问题中能通过自动化修复的只有25个,其中16个属于简单模式,困难问题的错误答案几乎不可能被修复。 如果把对话轮数的上限增加到10轮呢?结果依旧不乐观。 从157个问题中随机选出10个,结果只有其中2个能在10轮内成功修复,剩下的8个依旧无法通过。这能让研究人员进一步分析ChatGPT很难自动修复的原因。 作者认为,一方面,ChatGPT缺乏掌握逻辑细节的能力;另一方面,在需要复杂逻辑推理的问题中,生成代码往往偏离问题的实际含义,这即使对于人类程序员也很难修复。 代码复杂度 代码的复杂性对于可读性、可维护性以及整体质量来说,都是一个重要的影响因素。想象一下,如果ChatGPT对简单的排序问题都生成出了你很难看懂的代码,那会大大拉低使用体验。 作者利用了SonarQube和cccc两个指标来评估LeetCode数据集中Bef.问题的复杂程度,并评估响应生成代码的循环复杂度(cyclomatic complexity)和认知复杂度(cognitive complexity)。 循环复杂度会计算执行时线性独立路径的数量,从而体现源代码的测试难度。认知复杂度则从人类角度衡量理解、推理一段代码的难度。 由于以上量化标准不够直观,研究人员还同时评估了人类编写的C++和Python3的LeetCode问题解答来与ChatGPT进行比较。 图20的对比中可以看出,C代码的复杂度最高,C++、Java和JavaScript次之并基本处于同一水平,Python3是最不复杂的,这与我们的固有认知基本吻合。 此外,与人类相比,ChatGPT生成的代码虽然复杂度稍高,但差距并不明显。 随着LeetCode问题难度逐渐升高(表16),无论是人类还是ChatGPT,低复杂度代码的占比都会逐渐降低,复杂度被分类为「高」和「非常高」的占比也随之逐渐提高,这种趋势也是类似的。 然而,不好的消息是,ChatGPT的多轮修复功能似乎没法让代码更简洁,多数情况下会维持甚至提高代码的复杂 性,这或许也是多轮修复功能效果不理想的原因之一。 代码安全性 由于ChatGPT训练时可能学习到了各种各样的内容,包括质量较低、易受攻击的代码,因此评估生成代码的安全性也非常重要。 由于LeetCode的算法代码通常专注于解决特定的逻辑或计算问题,并不涉及管理系统资源、网络通信等通常有敏感安全问题的操作,因此在这部分的评估中,论文同时采取了两种路径。 1)利用CodeQL对LeetCode答案的所有C、C++和Java代码进行漏洞检测,针对MITRE Top25中的5个CWE问题,包括指针和内存相关的共30个查询。 2)针对MITRE Top25中的18个CWE问题,每个问题提供3种上下文场景,给ChatGPT「挖坑」,要求它补全代码,再用CodeQL自动检测看是否确实出现了相应问题。 在第一个测试中(表18),ChatGPT表现良好,91.8%的错误集中在MissingNullTest这一类,其余的漏洞的出现频次则一般不超过5次。 但仍要注意的是,ChatGPT在CWE 787,即「越界写入」问题上表现不佳,这可能会导致潜在的代码漏洞。 而且,由于这些漏洞的修复比较简单,因此在给定错误信息并要求生成修复代码后, ChatGPT也能较好完成任务。 要求ChatGPT修复CWE-787问题的提示模板 在第二个测试——安全代码生成方面,ChatGPT共生成了2983(99.07%)个有效代码片段,其中994个存在安全漏洞,占比达到33.32%。 而且,C语言中的易受攻击片段的百分比(51.64%)远远高于Python3(17.08%),这有可能是由于C代码本身就对程序的内存安全提出了更高的要求,也可能源于训练数据中C和Python3代码的质量差距。 多轮修复功能依旧表现出色,89.4%的漏洞都能在给出CWE信息后成功解决,比如溢出、数据泄露、不安全内存操作、未经身份验证访问等相关问题。 ChatGPT非确定性 ChatGPT的非确定性输出如何影响代码生成? 如下表所示,表22和表23分别列出了所选算法问题和温度为0.7时的实验结果。 在温度为0的条件下,10次试验中,算法问题和CWE代码场景的非确定性代码生成统计结果如表24、表25和表26所示。 其中表26列出了所选的20个CWE代码场景。 此外,作者还研究了非确定性对多轮修复过程的影响,修复结果如表27-32所示。 温度设为0.7,5次试验中算法问题的多轮修复过程。 温度设为0,5次试验中算法问题的多轮修复过程。 温度设为0.7,5次试验中算法问题的CWE多轮修复过程。 温度设为0,5次试验中算法问题的CWE多轮修复过程。 温度设为0.7,5次试验中安全代码生成的多轮修复过程。 温度设为0,5次试验中安全代码生成的多轮修复过程。 总之,实验中,当温度设置为0.7时,单轮流程中的代码生成可能会受到ChatGPT非确定性因子的影响,从而导致代码片段在功能正确性、复杂性和安全性方面出现差异。 要减轻ChatGPT在单轮过程中的非确定性,一种可能的策略是将温度设置为0。 然而,在多轮修复过程中,无论温度设置为0.7还是0,ChatGPT固定的代码片段在功能正确性、复杂性和安全性方面都可能存在差异。
WAIC:AI应用落地成焦点华为云盘古大模型解行业硬核难题
【环球网科技报道 记者 张阳】AI的下半场价值点在哪里?从产业生态来看,2024年国内AI大模型技术层面依旧格局未定。近期在上海举办的世界人工智能大会(WAIC)上,垂直领域的AI应用落地成为头部大厂及初创企业共同关注的焦点, 在产业发展主论坛上华为常务董事、华为云CEO张平安介绍了获得本次WAIC SAIL奖TOP30的华为云盘古钢铁大模型案例,据介绍,华为云盘古大模型已经在宝钢的一条热轧生产线上线,精轧宽展预测精度较传统模型提升了5%以上,每年有望多生产2万吨钢板,增收9000多万元。让我们看到,行业大模型正在加速落地应用,解行业难题。 模型微调从“天”到“时” 年收益增加9000万 当前钢铁业普遍面临的技术难题是热轧生产要经过20道工序,需调整300多个参数变量,且钢板加工过程中会同时受到热胀冷缩、挤压变形、轧辊磨损等多种不确定性因素的影响,这使得钢板的成材质量面临巨大挑战。 据张平安介绍,在宝钢的这条热轧生产线上,一块260mm厚的钢坯将在2分钟之内被轧制成1.2毫米厚的钢板,钢板的尺寸厚度公差不超过0.05mm,宽度公差不超过5mm。如果进行生产规格切换或设备状态不稳定时时候,传统模型精度会波动劣化,如果需要对模型进行优化完善,通常需要花费至少一周以上时间进行调整和部署。这还只是一种钢材模板,当想生产新的钢板的种类和尺寸时,各种参数又再次需要重新修改。 而现在,华为云的盘古大模型5.0创新地将时序数据、表格数据、工艺参数、行业机理等进行token化,通过大模型的学习,实现对最优参数的预测。目前,盘古大模型已经在宝钢1880热轧生产线上线,使宝钢的精轧宽展预测精度较传统模型提升了5%以上,钢板成材率提升0.5%,更将调整生产参数的时间从过去的5天甚至一周以上缩短至3-4小时,年收益因此增加了9000余万元。下一步,华为云还要与宝钢一起挑战钢铁行业最困难的高炉场景。 AI大模型发展离不开算力基础设施创新 “中国的AI创新道路要怎么走?”张平安在产业发展主论坛上抛出了这样一个问题。在他看来,从我国现有的发展格局来看,推动AI发展,应当从芯端算力上云、面向AI进行网络架构升级、做好云基础设施系统架构创新三方面出发。 “我们不能将AI算力需求全部放在终端。”在张平安看来,由于芯片、能耗等因素制约,端侧算力存在一个“天花板”。 因此,当前最重要的是思考如何释放对芯片和端侧AI算力的需求,做好芯、端、云、网的融合,在云端构建我国的算力基础 芯端算力上云方面,华为创新的方向是将端侧的AI算力需求通过光纤和无线网络释放到云上,实现端云协同,获得无缝的AI算力。这一创新不仅让端侧保持了丰富的功能,还极大地降低了功耗。 华为云CEO张平安 在网络技术创新方面,华为具备的5G - Advanced网络为端侧算力上云和端云算力协同提供了坚实的网络保障。其上下行带宽相较5G得到了10倍的增长,时延从10毫秒降低到1毫秒,这为华为云大模型的高效运行提供了有力支持。中国丰富的光纤网络和无线5G网络,构筑起了中国的AI算力网络,也为华为云大模型在各行业的应用奠定了坚实的基础。 云基础设施方面,华为云发布的全新CloudMatrix架构,以“一切可池化”“一切皆对等”“一切可组合”的创新设计,匹配了超大规模算力诉求。基于云的技术,华为云对昇腾集群进行端到端优化,使得千亿参数模型在云上训练可实现40天无中断,平均故障恢复时间小于10分钟。这些技术创新为华为云大模型的训练和运行提供了强大的算力支持和可靠的保障。 加速行业应用落地真正解决行业难题 中国拥有千行万业的业务场景,也拥有全球最大的软件创新人群。全力支持AI技术发展的根本目的,是推动不同行业积极拥抱AI,开放行业业务场景。正如张平安所说,“中国的AI发展道路,追求的应该是在行业领域构筑大模型的全球领先地位。如果各行各业都积极拥抱AI,积极的开放行业的业务场景,中国很有机会在ToB领域构筑起全球的领先优势。” 华为云盘古大模型坚持聚焦行业,为行业“解难题,做难事”,加速了千行百业的智能升级。近期,华为云的盘古大模型5.0在华为开发者大会上正式发布,该版本在全系列、多模态、强思维三个方面进行了全面升级,在自动驾驶、工业设计、建筑设计、具身智能、数字内容生产、高铁、钢铁、气象、医药等领域,提供了更加丰富的创新应用和落地实践,标志着华为云在人工智能领域再次迈出了坚实的步伐。 盘古大模型5.0重塑自动驾驶 可以说,宝钢项目的成功是华为云大模型在行业应用中的一个缩影。在过去的一年中,盘古大模型已在30多个行业、400多个场景中落地,为不同行业带来了智能化升级,落地成效显著。 在气象预报领域,盘古气象大模型再升级,推进至更高难度的公里级区域预报,实现了从全球25公里模型向1公里、3公里、5公里区域预报精度的跨越,包含气温、降雨、风速等气象要素;在高铁动车巡检工作领域,北铁所将华为云盘古铁路大模型应用于高铁巡检机器人,双方合作采用国内首创的二维图片+三维点云+激光光谱等多模态融合诊断技术,能精准识别超限、异物等各种复杂故障。多模态融合诊断比起单模态,故障识别准确率可提升到98%以上,不仅将巡检工人从繁重的劳动中解放出来,还大幅提升了检测效率和检测准确率。 华为云盘古大模型的发展离不开中国千行百业的业务场景和全球最大的软件创新人群。中国各行各业积极拥抱AI,开放行业的业务场景,为华为云大模型的发展提供了广阔的应用空间和创新机遇。张平安也表示,“华为云与众多客户、伙伴一起,在各行各业开展AI的创新应用实践,持续深入行业解难题、做难事,不断推动华为云大模型的发展和完善。” 从目前行业内的多项创新成果来看,AI不再仅仅是实验室中的技术探索,而是真正走向了千行百业,成为推动行业变革和发展的重要力量。在今年的人工智能大会上,越来越多的企业和组织开始意识到行业应用的重要性。随着AI在各行业的深入应用,可以预见,未来将会涌现出更多创新的应用场景和解决方案,助力千行万业实现智能化的创新发展。
全光谱光源!Aqara推出系列智能照明新品,精准调光控制加码全屋智能
作者 | 程茜 编辑 | 李水青 智东西7月8日报道,今晚,全球IoT独角兽玩家Aqara发布系列智能照明新品,包括银河系列轨道灯V1以及繁星系列妙控旋钮V1等。 现代家居生活设计中,消费者越来越重视光和灯具在家居中的应用。Aqara已经布局了完整的灯具产品矩阵,包括入门、中端、高端、旗舰全系列,涵盖主灯、无主灯、氛围照明等多个品类。 今天,Aqara发布高端V系列Aqara银河系列磁吸轨道灯V1。V1采用了全光谱光源,拥有Ra98超高显色指数,Aqara合伙人兼高级副总裁彭江波谈道,全光谱光源光谱连续性更好、缺失率更低,这种光源可以自然展示物体颜色。较上一代轨道灯,V1的功率和光通量平均提高了30%。 该灯具还实现了突破性的百万分级调光技术,能实现精准的调光控制。且在安装方面,V1既可以通过嵌装在预埋轨道中,还可以配置超薄明装轨道,满足前装和后装的不同需求。 此外,为了满足全屋智能的整体兼容性,V1还提供了IoT转接支架,这一转接器可以直接安装到轨道上,通过标准的1/4英制螺丝及双边USB-C口,可以将其他网关、传感器、摄像头等Aqara生态设备转接至磁吸轨道上,无需额外布线。 在软件方面,Aqara推出了MARS-Tech火星技术多负载类型强适应高可靠开关技术(Multi-load-type Adaptable and Reliable Switching Technology)。MARS-Tech火星技术可以解决智能灯具与智能开关的兼容问题,保证灯具状态在不同设备上同步显示。 调光方面,Aqara的软件上提供了单灯单控、调光序列、缓亮缓熄等个性妙控调光技术。 Aqara此次也同步发布了繁星系列妙控旋钮V1,其配备了X轴线性马达,模拟出逼真的段落感和阻尼,旋钮中间的触控屏不仅能显示天气、时间和环境状况等信息,还能添加各种设备,便于实时状态查看和功能控制。 Aqara还发布了云熙吸顶灯D1S及云耀吸顶灯Z1S,两款新品均采用全光谱光源,显色指数高达Ra97保证光源品质。 结语:软硬件协同满足千人千面智能家居需求 灯具已经越来越成为人们智能家居生活中的重要组成部分,每个人对于光的需求、自定义的场景特色都各有不同,因此需要硬件的标准化与软件层面的千人千面才能解决人对于灯具的本质需求。 基于此,Aqara为了满足不同用户的不同装修风格以及场景需求,正在充分布局硬件和软件产品,以为用户带来更好的智能家居体验。
薄机身且长续航,将成为智能手机的标配
还记得 Redmi Turbo 3 发布会上,介绍到这款手机的续航能力时,Redmi 品牌总经理王腾无奈一笑,表示为了更薄的机身和手感,Turbo 3 只能选择配备 5000mAh 的电池。 才过去 2 个月不到的时间,各家厂商都拿出了新一代又薄又大的「黑科技」电池:搭载 6000mAh 电池的 vivo S19 手机,机身厚度只有 7.19 毫米;一加全新「冰川电池」,6100mAh 的大容量,却比普通 5000mAh 电池更薄。 ▲ 图源:微博@数码闲聊站 史上最薄直板智能手机,诞生在十年前 5 月发布的全新 iPad Pro,因为比 iPod nano 还薄的 5.1 毫米机身,引发了外界的热烈讨论。 这个超薄 iPad 还只是一个开始,据彭博社报道,未来的苹果设备将会掀起一阵「瘦身」风潮,除了 iPad 之外,iPhone、Mac 产品都将会往更轻薄的路上走。iPhone 17 还预计会推出主打轻薄的全新「Slim」型号。 都说时尚是一个圈,数码产品可能也是。早在十年前,「瘦身」的风,已经在众厂商之间吹过。 14 年,苹果推出了 iPhone 6,6.9 毫米的厚度至今还没有 iPhone 超越,而国内两家厂商,OPPO 和 vivo 在薄上更是卷到极致。 OPPO R5,厚度 4.85 毫米,薄到塞不下一个 3.5 毫米耳机接口,在 2014 年就很「超前」地让 Micro-USB 接口分担了音频功能。 而 vivo X5 Max 凭借 4.75 毫米的「薄」度,问鼎全球最薄直板智能手机,至今还未有超越者。 这种对于手机厚度的极致追求其实也很好理解。OPPO 和 vivo 都是主打线下的手机品牌,超薄的机身,消费者在线下一看一摸就能感知得到;而让步最大的电池续航,恰好又是线下购机人群无法快速感受到的短板。 超薄也让 OV 走出了一条和其他厂商不同的差异化路线,与同期 7.9 毫米厚的华为 Mate 7,甚至 8.9 毫米厚的小米 4 一对比,原本在产品力上不太占优势的 OV 手机,也有了人无我有的独特卖点。 ▲ 小米 4 在厚度上真就是「一块钢板」 代价也很显而易见,不到 5 毫米的小机身,一些元件可以做得小又薄来节省空间,但是电池在当时只能选择妥协。于是,OPPO R5 和 vivo X5 Max 都搭载着 2000mAh 的电池。 作为对比,同期的三星 Galaxy S5 ,在屏幕尺寸小于这两款手机的情况下,搭载了 2810mAh 的电池,当然厚度也来到了 8.1 毫米。 小电池还带来了连锁反应,vivo X5 Max 和 OPPO R5 都搭载了高通骁龙 615 的一个低频改版,以降低功耗,导致这个原本偏中端的芯片,性能释放更加保守。 ▲ vivo X5 Max,图源:Phone Bluff 而且,手机厚度的减小明显具有用户边际效应,虽然手机做到了 4 毫米薄,但是给用户带来的使用体验,或许已经不如配备一个更大一点的电池。 值得一提的是,两款 4 毫米级别的手机在重量上其实和 145 克的 Galaxy S5 难分伯仲,OPPO R5 还比 S5 重了 10 克,所以手机虽然薄了,重量却没能同步降低,手感提升有限。 ▲ 三星 Galaxy S5 因此在追求过极致的超薄机身后,OV 开始探索「端水」的艺术:如何在不过度牺牲其他性能的前提下,尽可能保证手机的机身轻薄。 两款超薄手机的继任者,OPPO R7 和 vivo X6 机身都回到 6 毫米级别,都容纳了一个 2400mAh 左右的电池,虽然增加了 1.5 毫米左右的厚度,但两款手机仍然处于薄手机的范畴。 ▲ vivo X6,厚度 6.56 毫米 随后就开始了各家开始打造「水桶机」的潮流,开始卷影像、性能、续航各种配置,降下去的智能手机厚度,又开始向上走。 曾经追求过极致轻薄的 OPPO,真旗舰系列 Find 回归首作 OPPO Find X,各种配置拉满,机身厚度来到 9.6 毫米,几乎就是 OPPO R5 的两倍。 ▲ 接近 1 厘米厚的 OPPO Find X,在外观上用了曲面屏来尽量显薄 动辄半斤一厘米厚和两百克重的手机,几乎就是一块「板砖」,躺在床上玩手机,如果一不留神没抓住,很可能把鼻梁也给砸伤了。 ▲ 演员周迅躺着玩手机,鼻梁被手机砸伤了 在各个价位几乎都能做到拉满配置的情况下,「轻薄」的风又吹回了手机厂商。特别是中端机型,由于不需要顶尖的堆料水平,加上近几年各厂商都有意提升中端机型的外观造型,不少中端机都逐渐走向了轻薄和时尚的路线。 像是 OPPO 和 vivo 两家,主打线下的中端旗舰 Reno 和 S 系列,就一直有意在轻薄上做文章。 ▲ vivo S19,厚度为 7.19 mm 和 10 年前不同,已经成长为「大人」的各厂商表示,这次薄和续航「全都要」。 薄机身和长续航已经不再是单项选择题 轻薄和续航两者之间的矛盾似乎从一开始就不可调和。为了一体化的轻薄机身,手机厂商干掉了手机上的可拆卸电池,手机没电直接换电池也成为了和耳机接口一样再也回不来的「外星科技」。 ▲ 上次用能拆电池的手机,还是 Lumia 640,图源:iFixit 但科技是一直发展的,矛盾也有解决的方法。新一届的电池技术,让更大的容量,能够被塞入更小的机身。如果你有留意最近的国产手机电池,那你应该会觉得「蓝海电池」、「青海湖电池」、「冰川电池」「金沙江电池」这几个名字有点眼熟。 这几个听起来「水灵灵」的电池,其实背后都是一种名字叫「硅碳负极」的电池技术。 这里需要讲解一下锂电池的原理。电池内部被隔膜分成两个区域:正极和负极,以及充盈在电池内部的电解质。充电时正极的锂离子会从电解液穿过隔膜进入负极,放电则是从负极进入正极,所以负极可以简单理解为锂离子的「存储池」。 目前行业内锂电池负极的材料一般都是石墨,其实石墨的锂离子容量不是很大,优势是材料比较容易获取,工艺也更成熟。 说到这里,「硅碳负极」的意思已经不言而喻——以碳硅复合材料来作为电池的负极。 比起石墨,硅基材料能够吸纳更多的锂离子,比容量理论极限值能达到石墨材料的 12 倍,即使是目前小规模应用的硅碳负极材料,实际比容量也比石墨负极的理论最高比容量高出 13-20% 左右。 ▲ 一加冰川电池技术沟通会 而最近各家厂商在介绍新电池时,总会说到一个数值「电池能量密度」,意思就是在同样的体积下,能提供多少电池容量。 理论上,在其他条件和状况一致的情况下,电池能量密度越高的电池,能够在相同体积下提供更大的电池容量,或者在同样的电池容量下,实现更小的电池体积。 现在来看看几家「五湖四海」碳硅负极电池的电池能量密度: 小米「金沙江电池」:779Wh/L 荣耀「青海湖电池」(第一代):740Wh/L vivo「蓝海电池」:809Wh/L 一加「冰川电池」:763Wh/L 联想/ moto「星海电池」:822Wh/L 作为对比,石墨负极电池的能量密度,目前上限在 700Wh/L 左右。 ▲ 左边:荣耀青海湖碳硅电池 右边:iPhone 15 Pro Max 石墨电池 硅碳电池的一个突破点和难点就在于碳硅材料的「硅含量」:硅在充放电过程中,膨胀和收缩效应会很严重,因此纯硅基负极电池非常不稳定,需要将碳和硅复合,增强电池的稳定性。 而这造成了一个新的矛盾:硅含量越高,电池的能量密度越大,但是相应的,稳定性越低。 目前已经各家新电池的硅含量都在个位数左右,而荣耀第三代的青海湖电池,已经将硅含量突破到 10%,带来了进一步的能量密度提升。 这其实也说明,碳硅电池还有着不小的潜力等待挖掘。如何在保证电池稳定的情况下,提升硅含量,成为了硅碳电池的目前的一个技术突破口。 想要兼顾轻薄和续航,不仅仅只能在电池上花心思,这几年大热的 LTPO 屏幕,也给小身板手机更长续航的可能。 ▲ 一加 9 属于国内比较早搭载 LTPO 屏幕的手机 LTPO 屏幕最大的优势就是可以实现范围较大的刷新率变化,从 iPhone 13 Pro 上的 10 – 120Hz,再到 OPPO Find X7 的最低 1Hz,甚至卷到现在的 0.5Hz。 这种「动静分明」的屏幕刷新率,在手机呈现静态内容时使用低刷新率省电,而操作滑动时又回到高刷呈现细腻的观感。 也因为能够实现极低的刷新率,手机「Always on Display」的常亮显示功能也要更加省电。 在今年 realme 真我 GT Neo6 SE 发布会上,产品经理毛巾介绍 LTPO 屏幕的好处时就表示,真我 GT Neo6 SE 上的 8T LTPO 屏幕省下的电,相当于给这款手机增加了 300mAh 的电池容量。 因此,这款实载 5500mAh 电池的手机,DOU 续航测试接近 2 天,并且机身厚度和重量都控制在了 9 毫米和 200 克以下。 薄=未来? 苹果要做「超薄 iPhone」的消息一出,大众的观点很快就分裂成两派: 支持派认为,现在动辄 1 厘米半斤重的手机手感实在不够友好,小拇指都磨出了茧子。 反对派认为,把数码产品做薄根本没有意义,还牺牲了会影响体验的续航。 但新 iPad Pro 的实际表现,或许能够给反对派一颗「定心丸」。 虽然做到了这种极致的轻薄,但新 iPad Pro 在电池续航上,几乎和前代没有差距,这还是在新款 iPad Pro 电池容量比上一代略微缩水的情况下。 这背后是新 M4 芯片的魔力,优化的设计和制造工艺,更高的能效比,在电池变小的情况下,续航能够和以往的水平持平。 更何况,iPad Pro 本身就是苹果主打专业和性能的平板产品线,搭载苹果最新 M4 芯片的新 iPad Pro,足以胜任各种高能任务,甚至不少评测都觉得,这块芯片在 iPad 这个平台上有点「屈才」。 看得出来,与 10 年前不同,现在的数码产品用上了功耗更低的处理器,屏幕更省电,电池也更加高密度。现在的超薄机身,不是性能和续航都缺憾的「瘦弱」,而是各种元件高集成、电池高密度的「精壮」。 因此轻薄不单单是厂商创造的噱头,背后是各种技术的突破,薄型设计也因此被视为工程和技术创新的标志,我们正处在技术缓慢进步的「甜蜜点」中。 对于轻薄的追求不仅是厂商的一厢情愿,也是用户一直以来对科技产品的期待。 就像是 2022 年后的 MacBook Pro,新的模具虽然代表着更先进更强悍的生产力,但是也让人怀念曾经那个更具有曲线,外观上更显薄的旧模具。 更有人觉得,这个旧模具不是落后了,而是「太超前」了。 或者说当年微软的 Surface Pro X,即使 ARM 处理器带来了性能和兼容等诸多问题,但轻薄的机身对比起同期的 Surface Pro 7,更让人感觉前者才是真正的未来。 ▲ 图源:The Verge 当然,虽然现在续航和性能已经给轻薄机身开了绿灯,国产厂商如何把这两年也开始卷的散热系统塞进小机身,也成了新的挑战。 2024 年是「AI」的一年,因此也有人说是「未来」的一年,但除了人工智能,重走上「轻薄」道路的数码产品,或许也在为我们描绘着未来设备的形态。
智能电视的上半年:体验影响开机率,AI成全村希望
今年夏天,欧洲杯战火重燃。 当我们聚集起三五好友,其乐融融地坐在电视机前,欣赏着日耳曼战车德国队对阵斗牛士西班牙队的强强对话时,两家国产电视厂商投放的场边滚动广告确实很难不吸引人眼球。 姑且不论谁是“全球第二”,谁是“全国第一”这种小问题,能看到国产电视在面向世界的舞台上备受瞩目,身为国人还是挺自豪的。 不过,正如很多曾经高速增长过的行业那样。随着技术的发展、产品的迭代,特别是电脑、智能手机、平板电脑等一系列智能终端的普及,如今电视行业正进入一个用户需求更新、整改落实阵痛、产业格局重塑等多种因素叠加下的特殊阶段。 根据洛图科技(RUNTO)发布的《中国电视市场品牌出货月度快报》数据显示,截至5月底,中国电视市场的累计出货量为1380万台,同比小幅下跌。根据奥维云网近日出炉的618数据显示,备受业界期待的618大促,并没有给彩电市场带来超出预期的逆势回暖,这条道路依然是任重而道远。 (图片来源:洛图科技) 不可否认的是,如今的电视在消费者心目中的地位确实不如当年,尤其是年轻一辈消费者,早已把电视当成是客厅的装饰品,日常生活很少打开,更别说坐在沙发上看一晚上电视了。 不过,正所谓“全局观大势,局部觅良机”。不确定中并非没有确定性,变局之中也更容易开新局,电视厂商们显然不会坐以待毙,虽然当下面临着一些挑战与调整,但同时一些新趋势也在不断显现,更多具有诚意和娱乐属性的电视,更强的显示技术和AI大模型赋能,更是有望给产业带来新的增长。 接下来,就是由雷科技为你带来的2024年上半年的电视行业大盘点。 大屏化、高端化已成行业趋势 在市场饱和和技术创新速度放缓的背景下,近年来电视行业确实面临了一些挑战。为了应对这种略显瓶颈的趋势,电视厂商们纷纷开始寻求新的增长点,整个电视行业开启了一场参数内卷的行业风暴。 有趣的是,在这波参数内卷的行业风暴中,产品“大屏化”的趋势可以说是稳定看涨。 根据奥维云网线上监测数据显示,2024年618期间彩电线上市场平均尺寸已经达到65.8英寸,大屏化进程显著加快。根据洛图科技(RUNTO)最新的零售监测数据,如果从尺寸结构来看,在线上和线下零售市场,75英寸电视均已经成为销量最高的尺寸。 今年,各家头部厂商都推出了各自的高端大屏电视,各具特色。 举个例子,TCL Q9K系列以其MiniLED技术和全域光晕控制技术著称,提供了55寸~98寸多种尺寸选择。海信则以110UX为代表,不仅在尺寸上达到了惊人的110寸,更拥有40000+级分区和10000尼特亮度;小米电视S MiniLED系列以高性价比打动市场,其中75英寸版本价格低至5999元起。 (图片来源:奥维云网) 出现这个趋势的原因之一,在于国内面板供应链的快速发展。由于全球主要屏显市场销售不振,目前中国内地的面板企业产能远超现有需求,产能过剩导致主流尺寸电视的平均价格在近些年明显下降,而随着产品价格越来越亲民,可以预见越来越多的消费者会选择更大屏的电视。 当然,也有行业人士表示,在低迷的行情下,这样的市场表现反映出彩电市场大尺寸化变得更为激进。其为接下来彩电品牌行业发展定义了明确方向:即“唯大”才是王道。在这样的背景下则预示着彩电市场产品消费升级和价值转变,是崭新的行业竞争赛道的开启。 从海信、TCL等头部厂商过往的财报来看,这个观点已然成为行业共识。 (图片来源:中国证券网) 早年间,消费者对电视的要求并不高,无非就是结实耐用、画面清晰就行,这也导致早期消费者更换电视的需求和欲望并不高。 但开头也曾提到,智能终端的普及丰富了用户的娱乐生活,看电视也不再是消费者唯一获取外界信息和丰富精神生活的选择,在这样的发展趋势下,电视自然开始往“高端化”线路去走。 为此,厂商们将各种新技术带到市场上,其中最典型的莫过于Mini LED电视和OLED电视的普及。无论是OLED与生俱来的画质优势,还是Mini LED那精准的区域发光调节、更好的透光均匀度、较高的对比度和更多的明暗细节,目的都是最大化地提升这些电视产品的画质表现,填补电视领域由低端液晶向高端的过渡期。 (图片来源:TCL) 由此可见,基于技术优势和体验提升的向上突围,正在一定程度上成为电视厂商的增长之道。 另外,正如我在开头所说,2024年还是一个难得的体育大年,奥运会、欧洲杯、美洲杯等重大赛事和电视的大屏化、高端化趋势叠加,也有望为行业的升级带来一定助推力。 体验升级,刻不容缓 “不是我们不想看电视,现在打开电视全是广告,等90秒的广告放完了已经没心思看电视了”。 在很长一段时间,小雷经常会在各种评论区看到这种类型的评论。 其实这种现象也十分常见,从开机时固定的15-30s广告,到各家视频平台在电视剧中插播的贴片广告,不知不觉间,各种平台会员、广告植入带来的隐形收费似乎已经成为很多电视厂商最重要的收益来源之一。 由此看来,近些年来电视行业销量不断下滑,其中固然有智能设备普及、移动互联网冲击、用户时间碎片化等外部因素影响,但这一现象的内因,无疑主要还是集中在二次收费、操作复杂这些行业痼疾上。 (图片来源:澎湃新闻) 想要改变现状,就要下大气力解决 “看电视难、看电视烦”的问题。 正因如此,近一年来,主流电视厂商都在大力改善用户开机看电视的体验,市面上的电视品牌都在逐步取消开机广告。 其中,TCL可以通过联系“TCL 官方服务”微信公众号,创维则是联系“配开视界”微信公众号;小米、海信是通过电视端查看以太网 MAC 地址后联系品牌京东自营旗舰店客服即可;海尔则需要微信搜索“海尔服务”小程序,选择“维修”申报、填写说明需要关闭电视广告,之后售后工作人员会通过远程指导帮助用户解决开机广告问题。 这块折磨用户多年的“牛皮藓”,正在被有效铲除。 此外,广电总局联合工业和信息化部、文化和旅游部、市场监督管理总局等有关部门单位,已经交出了第一阶段治理工作的答卷,包括取消开机广告、收费包压减、收费主体减少、消费透明化、优化免费专区等,希望能带来的是用户体验的提升和用户认知的改善。 可以预见的是,围绕二次收费、操作复杂的整改,将是未来很长一段时间里的电视行业主旋律,更加健康可持续的行业生态的建立,也将有力推动电视行业走向全新增长的下一站。 AI电视,蓄势待发 自去年以来,AI 成为了各行各业绕不开的话题。 OpenAI公司旗下的ChatGPT带来了惊人的连续自然语言对话能力、音频处理工具Sovit将AI语音变成现实,而近期话题度极高的Sora,则是让人类进入到通用人工智能时代(AGI)的进程再度被缩短。 在这股浪潮的推动下,电视厂商们也纷纷跟上了脚步。 到目前为止,主流电视厂商均已经落地相关应用,例如海信自家的信芯AI感知芯片,可以通过AI三维感知技术的加持,智能分析环境光线、片源内容,随时调整优化画面色彩、对比度、清晰度、细节等,并协同显示芯片、背光显示控制技术和抗扰屏等全链路一体运作,给用户带来更加真实、更有细节的观影体验。 按照海信官方的说法,那就是全面进入了AI计算画质时代。 (图片来源:海信) 再看看TCL X11H,采用了TCL自研TSR独立画质芯片搭配上自研全识AI大模型的组合,以强大的AI算力及深度计算模型为基础,通过全域信息采集、全维图像分析、全景画质增强三个步骤对画质进行系统化处理,从而带来更符合人眼观看的画质效果。 两家大厂都在用AI强化画面效果,或许这便是所谓的英雄所见略同。 (图片来源:TCL) 当然,其他厂商也有进行相关布局,例如长虹电视集成的云帆AI平台、三星电视上搭载的新一代AI芯片NQ8 AI Gen3,创维也在其主打的壁画电视上加入了大语言模型加持的AI助手功能。 目前来看,市面上AI电视的核心要素主要可以概括为以下三点: AI画质:通过AI芯片,对传统低清资源的画面进行优化还原,或是对画面的色彩、对比度进行实时矫正,增强电视最根本的画质、音频方面的能力,给用户带来更好的影音体验。 AI交互:接入自研语言大模型,使人机交互更加顺畅,让电视可以更懂人的需求。用户通过一个简单的指令,甚至可以是比较模糊的语义指令,就能让电视主动实现后续一系列复杂的操作,甚至可以让电视成为真正的全屋无感智能中枢。 AI创作:基于大模型技术的文生图、文生文能力,部分厂商正在进行一些AI生成应用的落地,比如长虹壁画电视的画报创作,再比如未来可以对家庭相册进行AI识别分类,智能视频合成等。 在手机、PC设备不断被AI重新赋能的当下,电视自然也有着不少机会,并有望借此获得新的增长。 但就如何定义AI电视这点,我们还有好一段路要走。 电视进入转型升级的关键时期 我认为,今年可以说是电视行业转型升级的关键时期。 电视行业本身就在进行的大屏化、高端化升级,搭配上行业对开屏广告、“套娃”收费、操作复杂持续进行的治理,再加上有望给电视赋予新活力的AI,构成了电视未来的三大增长之道。 在我看来,只有基于对用户消费场景的深入洞察,在不断探索实现新应用与新场景的基础上,持之以恒地对产品进行迭代升级,通过开发具有高附加值的产品,用技术和创新来赢得消费者的口碑。 (图片来源:雷科技摄制,三星AWE展台) 至于AI电视这边,作为一款才刚面世的产品品类,它究竟会长成怎样需要行业一起去定义。 当前行业还面临大模型技术不成熟、端侧芯片计算力较低、AI应用生态不丰富等难题,但唯一确定的是,不管电视巨头做不做AI电视,它们都不会忽视AI大模型带来的创新机会。如何将与AI大模型的融合应该回归到用户体验与价值创造上,或许才是行业未来最应该关注的方向。 雷科技相信,我们现在能看到的应用场景只是AI大模型在电视上落地后的一小部分,未来的这个品类还会爆发出更大的威力。 随着下半年的到来,小雷相信会有越来越多的厂商开始发力,或许属于电视市场的新时代,马上就要到来了。
苹果低端Apple Watch要用塑料壳,血压监测难产,AI新Siri延期
编译 | 罗添瑾 编辑 | 云鹏 智东西7月8日消息,据昨日彭博社报道,苹果公司将于Apple Watch十周年之际,对其系列产品进行重大升级。手表的显示屏将增大,同时整个设备也会更加轻薄。Apple Watch Series 10和新的Apple Watch Ultra 3都将配备新芯片,这可能是在为未来苹果的AI功能做铺垫。 据消息透露,Apple Watch健康检测功能在升级过程中遭遇了一些技术阻碍,血压测量功能或只能现实展示波动而无法显示数值,睡眠呼吸暂停检测等功能或无法在新品上出现。Apple Watch SE系列产品的外壳材料或将由铝壳替换成硬质塑料。这类塑料外壳的Apple Watch或将以更低的价格出售,以和三星最便宜的手表产品Galaxy Watch FE竞争。 此外,Siri的新功能或将推迟发布,带摄像头的AirPods或将于2026年问世。 一、芯片升级,更大更薄,Apple Watch十周年喜迎更新? 苹果公司总喜欢在产品的周年纪念日上做大动作。 2017年iPhone十周年之际苹果就推出了无边框设计的iPhone X,这是iPhone系列机型的重大更新(为了让这个型号生效,苹果跳过了iPhone 9)。2011年iPod问世十周年之际苹果无法以用样的方式庆祝,因为iPod已经在走下坡路了。2020年iPad问世十周年,苹果对iPad Pro做了一些小调整。 如今,Apple Watch即将迎来10周岁,在今年秋天,苹果计划对“Series”系列进行一些更新升级,显示屏的尺寸将变大,但设备整体会更轻薄,外观设计上变动不大。 ▲Apple Watch Series 9:Series 10会有多大不同?(图源:Apple) 据报道,两个版本的Series 10——代号为N217和N218——都将拥有更大的屏幕。这一变化意味着Series 10的购买者将能够选择一个屏幕大小与Apple Watch Ultra相当的型号。同时,Apple Watch Ultra本身不会进行重大设计更改(但当前型号仅追溯到2022年)。 Apple Watch Series 10和新的Apple Watch Ultra 3都将配备新的芯片,这可能是为未来的某些AI增强功能奠定基础。不过,Apple Intelligence相关功能要在Apple Watch的更新中遗憾缺席了。目前,该服务仅面向iPhone、iPad和Mac。之后,苹果的AI功能或将会应用到Vision Pro,但目前并没有计划称要将其完整地引入Apple Watch。 考虑到Apple Watch是在2014年宣布但在2015年才正式发布的,因此苹果在今年还是明年发布Apple Watch十周年的重要更新尚未可知。 二、两项健康检测功能升级遇滑铁卢,苹果陷入法律纠纷 苹果一直在研发检测高血压和睡眠呼吸暂停的技术,原计划这些功能将在今年发布。但研发过程并不顺利。据相关人士透露,苹果自去年以来便遇到了一些阻碍。 测量血压的技术在测试期间并未达标,因此该功能的发布或许要推迟到明年。 关于该功能还存在许多质疑,许多人并不认为血压测量功能可以在新的Series 10设计中被正常使用。即使最终推出,也不会取代消费者家中的血压计。事实上,Apple Watch Series 10上的血压检测功能并不是给你提供实际的血压读数——这和Apple Watch上的心率和血氧检测功能不同。相反,它会计算你的血压数值基线并监测你的血压波动。 第二个功能——睡眠呼吸暂停检测——则面临更大的挑战。该功能与血氧饱和度数值相关。而目前,由于苹果和Masimo Corp正在进行的法律纠纷,Apple Watch并无法获取用户血氧饱和度的相关数值。 苹果若无法在九月前解决相关纠纷,那么Apple Watch Series 10的发布便可能推迟。 苹果的另一个长期目标是将血糖监测功能引入Apple Watch。据相关报道称,该功能已开发了大约十年,目前苹果取得的成就较为可观。 三、Apple Watch SE系列新品或将是“历史最低价” 除了新功能,苹果还在考虑一些生产方面的变化。 苹果正在持续的讨论和测试将3D打印技术引入,用来制造Apple Watch部分型号的外壳。3D打印技术不仅可以加快生产速度,还能减少材料消耗。 ▲6月份的Apple开发者大会(图源:David Paul Morris/Bloomberg) 公司还在研发新的低成本Apple Watch SE型号,该型号上次更新是在2022年。苹果欲将SE系列的外壳材料由铝壳换成坚硬的塑料。从这一消息来看,苹果可能希望降低成本以提升竞争力,用这款更亲民的产品与三星最便宜的手表——售价199美元的Galaxy Watch FE竞争。当前SE的起售价为249美元。 四、Siri升级要等到明年,AirPods将配备摄像头? Siri的大规模升级预计将在明年春季到来。Siri的新功能将成为Apple Intelligence推出的亮点之一。 在六月的苹果开发者大会上,首次亮相的数字助手将能够精确控制苹果应用中的操作,这意味着你可以要求Siri编辑照片,然后将其发送给朋友。它还将能够理解你在显示屏上看到的内容,帮助Siri根据上下文确定你想做什么。但据相关人士透露,这些升级在今年秋季可能并不会来。 据报道称,Siri的功能可能会在明年一月进行开发者测试版,然后在春季和iOS 18.4一同公布。其他Siri功能,如和ChatGPT的集成,将在今年晚些时候推出。Apple Intelligence也将在明年出现在Vision Pro上。 ▲苹果AirPods(图源:Gabby Jones/Bloomberg) 上周,苹果分析师郭明錤表示带摄像头的AirPods可能在2026年投入生产。 早在今年二月,相关外媒记者便报道了苹果正在开发内置摄像头的增强型AirPods。这项工程项目的代号是B798,背后的想法是利用摄像头与AI结合,向佩戴者提供更多的信息。例如,AirPods可以识别用户周围的街区并给予他们导航。 这项技术还可以用于识别物体并提供相关信息——这是AR设备的一个关键卖点。 结语:Apple Watch十周年更新未定,但更亲民的SE系列或成黑马 关于Apple Watch十周年更新的爆料中有很多关于Apple Intelligence的地方,可见苹果的AI布局已是“润物有声”,但由于Apple Watch问世之初官宣和正式发布之间存在时间差,因此人们对苹果这次更新的推测并不确定。 纵观Apple Watch十周年更新的相关爆料,除了芯片的升级、屏幕尺寸变大变薄之外,SE系列外壳材料的变动或将捧出一款“更亲民”的Apple Watch,价格也会更低。相关报道中称,替换成硬质塑料外壳的Apple Watch SE佩戴起来可能会更轻便舒适。
16亿元大模型大单!花落深圳AI第一股
作者 | 李水青 编辑 | 心缘 智东西7月8日报道,近日,深圳AI上市公司云天励飞签署约16亿元的AI大单,为北京德元方惠科技开发有限责任公司(简称“德元方惠”)提供AI训练及推理算力服务。 服务内容包括智能算力调度及AI大模型开发服务平台配套服务,算力总规模约4000PFLOPS,服务期为三年。 相关设备交付预计于7月中旬完成。截至7月初,相关设备的采购合同已签署,其中累计已发货数量占全部采购数量的比例为60.96%。 这一大单将对云天励飞2024年度业绩产生积极影响。财报显示,云天励飞2023年营收为5.06亿元,较上年同期的5.46亿元下降7.36%,亏损3.83亿元。 同时,云天励飞拟使用不超过15.46亿元的自有和自筹资金,先支付设备采购资金,前期投入成本也是不小的。投入既是为本项目服务,也将为云天励飞未来大模型研发工作提供算力补充。 面对云巨头在大模型领域的猛烈攻势,独立AI企业正联合中小云服务商探索商业新模式。 一、三年4000PFLOPS算力,每年5.36亿元服务费 拿下大单的是深圳云天励飞技术股份有限公司的全资子公司——深圳励飞科技有限公司(简称“励飞科技”)。 7月1日,励飞科技与北京德元方惠科技开发有限责任公司(简称“德元方惠”)签署《关于AI算力运营项目的服务合同》。 根据合同,德元方惠将向励飞科技购买AI训练及推理算力服务,算力总规模约4000PFLOPS。合同服务期为36个月,月度服务费约为4463万元,每年总服务费约为5.36亿元。 德元方惠创立于1996年,是一家科技推广和应用服务企业,已取得算力产业相关经营资质。截至2023年12月资产总额约为7921万元人民币,年营业收入约为6258万元,净利润约为544万元。其云天励飞不存在关联关系,且最近三年不存在交易往来。 根据合同,云天励飞为甲方提供的服务内容,为AI训练及推理算力服务及对应的交付物。具体来看,服务内容主要包括:智能算力调度及AI大模型开发服务平台配套服务。 云天励飞于2023年推出自研千亿级大模型“天书”,包含通用大模型、行业大模型及场景大模型,在C-Eval、CMMLU等权威测试中多次刷榜,并通过中央网信办备案。根据合同内容,项目所涉及的高性能异构算力的采购,未来也将作为云天励飞大模型研发工作所需算力基础的补充。 在自研大模型的同时,云天励飞在大模型的研发过程中积累了一系列算力调优、提升模型训练效率的技术平台和相应工具。 根据最新公告,上述技术将沉淀运用在AI算力服务中,帮助客户提升模型训练及算力利用效率。 截至本公告披露日,相关设备的采购合同已签署,其中累计已发货数量占全部采购数量的比例为60.96%,设备交货预计于7月中旬前完成。 按计划,励飞科技将与德元方惠合作开展算力运营业务并对外提供服务。励飞科技提供算力资源服务,德元方惠已取得相关经营资质,来运营算力资源并对客户提供服务。 本合作属于先采购、构建异构算力集群并同步进行软件平台研发,将公司在研发大模型过程中积累的系列软件平台及工具融合进算力集群,最终形成算力服务,并按约定周期收到服务费用回款。 二、将拉动业绩增长,15.46亿投入或影响流动性 云天励飞预期,如在2024年度内顺利执行,项目则会对公司2024年度业绩产生积极影响。 根据财报可知,云天励飞2019年、2020年、2021年、2022年及2023年的营收分别为2.30亿元、4.26亿元、5.66亿元、5.46亿元及5.06亿元;净利润分别为-5亿元、-3.93亿元、-3.90亿元、-4.47亿元及-3.83亿元。这一大单能为云天励飞的业绩带来什么样的拉升,引起产业关注。 项目在为云天励飞业绩带来积极影响的同时,也存在一些不确定性风险。 根据云天励飞公告,这些风险主要涉及业绩不及预期风险、设备供应风险、与业务模式有关的风险、提前解约导致的流动性风险、业务规模扩大带来的风险、履约及违约风险。 合作可能涉及设备供应风险。虽然累计已发货数量占全部采购数量的比例为60.96%,但采购仍可能受到行业政策调整、市场环境变化等因素以及市场、经济、政治等层面的不确定因素的影响,存在交付风险。 在业务模式有关的风险方面,励飞科技依赖德元方惠从其客户方获得付款。 励飞科技取得相关服务费需以客户向德元方惠付款为前提,如果德元方惠与客户之间的合同提前终止、客户未及时向德元方惠支付款项或者德元方惠未能按照协议约定与公司及时核算,则存在业绩不及预期、无法及时回款、坏账等风险。虽然双方已进行了明确约定,但如果双方中断合作,则存在设备空置率上升、预期取得的订单金额下降等风险。 项目也可能带来提前解约导致的流动性风险。云天励飞拟用自有和自筹资金先支付设备采购资金,预计将使用不超过15.46亿的自有和自筹资金。此外,若出现用户提前终止合同不续租的极端情况,或对公司流动性产生影响。 此外,项目可能带来业务规模扩大带来的风险,云天励飞本次开展规模为4000PFLOPS的算力运营业务。公司参与算力运营业务时间较短,过往已落地的算力运营项目规模较小,如果公司不能满足客户对大规模算力运营服务的核心需求,可能会导致客户接受度不高,影响后续的销售和推广。 结语:大模型时代,AI公司蹚出算力服务新路子 这是近期最大的一起独立AI公司大模型大单。今年6月,云天励飞与德元方惠签署《AI算力运营合作框架协议》,这一大单终于在本月靴子落地。合作模型、服务方式、风险等具体细节随之公布,本项目是独立AI企业大模型服务方式的新探索。 可以看到,大模型正在改变AI企业的业务模式。云天励飞将研发大模型过程中积累的系列软件平台及工具,融合进算力集群,最终形成算力服务,并以按期收取服务费的方式实现商业化。面对云巨头的攻势,独立AI企业与新晋智能云运营商展开合作,正成为一种新的产业形态。
Wedbush:苹果iPhone呈现企稳迹象,三季度中国市场有望反弹
IT之家 7 月 8 日消息,据投资公司 Wedbush Securities 的最新供应链调查显示,苹果 iPhone 在全球多个市场的销售迹象趋于稳定。在周一盘前交易中,苹果股价小幅上涨。 分析师丹・艾夫斯 (Dan Ives) 在投资报告中写道:“我们相信,在一季度表现好于预期之后,iPhone 增长的乐观迹象正在各个市场形成,最终我们认为二季度将是中国市场最后一个负增长的季度,增长的转机将从三季度开始。中国市场仍是苹果的增长关键,我们认为,从 iPhone16 开始,这一关键地区将再次实现增长。” IT之家注意到,艾夫斯维持对苹果的“跑赢大盘”评级,目标股价为 275 美元。他表示,自从上个月苹果召开年度开发者大会并展示其人工智能技术后,市场对这家科技巨头的乐观情绪有所上升。艾夫斯补充道,下一代 iPhone 可能将聚焦人工智能,这可能会在全球范围内引发“黄金升级周期”,并带来累积的换机需求。 艾弗斯认为:“展望未来,开发人员和其他科技巨头可能需要将他们的 AI 模型 / 技术集成到苹果 Apple Intelligence 中,因为苹果及其庞大的 iOS 生态系统是触达全球 22 亿 iOS 设备和 15 亿部 iPhone 的唯一途径。我们预计在未来 6 到 12 个月内,开发人员将构建数百个生成式 AI 驱动的应用程序,这将成为苹果成功秘诀中的关键因素,因为其技术堆栈将成为消费者人工智能浪潮的核心支柱,而这波浪潮将在 9 月中旬发布的 iPhone 16 开始显现。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。