EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
开源声音与音乐生成模型AudioLDM2,只需提供文本即可生成高质量音频
站长之家(ChinaZ.com)8月30日 消息:最近,一款优秀的开源声音与音乐生成模型AudioLDM2在 GitHub 上引起了关注。这个模型的运行速度很快,可以生成节奏、音效和基本对话。它操作简单,并具有强大的提示样式鲁棒性。 该模型采用了先进的隐式扩散模型AudioLDM,可以生成高质量的音频。用户只需要提供文本描述,就可以让模型自动生成对应的音频。 项目地址:https://github.com/haoheliu/AudioLDM2 相比传统的 Concatenative 方法,该模型可以生成更流畅连贯的音频。同时,相比基于GAN的方法,它生成的音频质量更高,更符合文本描述的语义。 该工具提供了命令行接口和网页应用,非专业用户也可以轻松使用。用户可以选择不同的模型检查点,生成不同风格的音频。同时,调整随机种子也可以生成不同的音频样本。 总之,这是一个强大且易用的文本到音频生成工具,可以广泛应用于音乐创作、音效生成、语音合成等领域。它极大地降低了音频内容生成的门槛,对创意行业有重大帮助。 该模型的出现,无疑为音频处理领域注入了新的活力,并为相关行业提供了一种全新的解决方案。未来,这个模型的应用领域还可能进一步扩展,为我们的生活带来更多惊喜。
谷歌CEO皮查伊解释为何急于发布AI产品:内部势头太猛
8月30日消息,美国当地时间周二,谷歌首席执行官桑达尔・皮查伊(SundarPichai)向全体员工发送电子邮件,解释了该公司急于发布人工智能产品的原因。他称,这反映了公司内部的“势头”。 在这封电子邮件中,皮查伊介绍了将在本周开幕的年度云计算大会 (CloudNext) 上发布的一系列新公告和产品。 皮查伊还强调了公司内部的其他变化,比如 YouTube 与音乐行业合作,共同开发生成式人工智能的原则。 皮查伊在电邮中写道:“我看到谷歌的进步随处可见。” 去年底,OpenAI 的 ChatGPT 的出现使谷歌受到了震动,此后谷歌以极快的速度开发和推出了生成式人工智能产品,包括其 Bard 聊天机器人。 今年 4 月,谷歌宣布将其一个重要的人工智能研究团队与 DeepMind 合并,DeepMind 正在开发一种名为 Gemini 的新人工智能模型,可能对 OpenAI 构成威胁。 皮查伊还在邮件中透露了将在“几个月内”推出的新硬件产品。 谷歌拒绝发表评论。 以下是电子邮件全文: 大家好! 我们将迎来令人兴奋的一周,整个公司都充满了即将发布新产品的喜悦之情。 今天早上,我们在 Cloud Next 大会上分享了如何帮助谷歌云的客户利用人工智能解决问题并开展新的方式。我们不仅将最新的生成式人工智能技术应用于我们自己的产品中,还将其提供给企业和开发者使用。数万名开发者已经在 VertexAI 中使用了 100 多个模型,这是谷歌云构建生成式人工智能应用的平台。现在,我们正在扩展 VertexAI 的功能,使客户能够自定义、集成和深度部署基础模型到应用中。 我们还分享了有关 Duet AI 的一些消息,这是我们的智能 AI 协作伙伴,可以帮助您在 Workspace 和 GoogleCloud 中高效完成工作。已经有超过一百万人在 Workspace 中测试 DuetAI,用于撰写电子邮件和文档、创建自定义表格以及在幻灯片中生成图像。感谢他们的反馈,自从 I / O 大会上发布以来,我们已经能够迅速改进产品。现在,DuetAI 在 Workspace 中已经全面推出,而在 GoogleCloud 中的预览版也进行了扩展,并与更多的产品和服务进行了集成。它现在可以帮助组织进行专业级编码、构建和提取数据库信息,甚至可以成为网络安全顾问。你们可以在 Go / Cloudnext23 上观看主题演讲,了解更多关于 CloudNext 大会上的所有公告。 谷歌云对很多人和组织产生了巨大影响。通过团队的辛勤工作和深思熟虑的投资,托马斯(ThomasKurian,谷歌云 CEO)和他的团队已经将谷歌云打造成真正的行业领导者,而我们还只是刚刚开始。 我在谷歌内部看到这种进步无处不在:从 Google Research 和 GoogleDeepMind 的研究团队,到我们改进搜索生成体验的最新成果,通过新的内联定义、AI 支持的概览、更低的延迟,使人们更容易从网络上查找和理解信息。自从上个月将 Bard 扩展到更多国家和语言以来,我们收到了更多有益的反馈。我个人也发现与 GoogleLens 整合的图像提问功能非常实用。在 YouTube 方面,团队与音乐行业合作,共同开发支持创意表达的 AI 功能。而在几个月后,我们的设备和服务团队将推出最新产品。这种势头是全公司各个团队辛勤工作的结果,感谢大家! 下个月,我们将迎来谷歌成立 25 周年。看到谷歌员工延续着早期的乐观、雄心和速度,继续从事重要的工作,这让人感到非常振奋。期待在我们的生日月份庆祝这一里程碑,期待我们还有很多重要的工作等待着我们。 桑达尔
好消息,AI暂时还没能取代人类
自ChatGPT出现后,业界掀起了一股AIGC的热潮:在用户端,从文心一言到妙鸭相机,新的应用层出不穷,并迅速成为朋友圈爆款;在企业端,出现了大量可以辅助企业进行管理、工作的“AI+SaaS”服务项目,宣称可以替代掉大量重复性工作。 一时间,AI可以取代文案、设计师、主播等职业的说法甚嚣尘上,到底哪些职业会率先被取代——人们陷入热切讨论,被搅得人心惶惶。 不过,在小半年的营销、直播实践中,人们逐渐发现了AIGC的短板,而第一波研究大模型的AI独角兽企业Jasper,在近日也曝出了裁员的消息。 AIGC的美好未来,似乎还没有完全到来? 未来——先等等,还没来 至少在AI直播这一领域,距离AIGC掌控一切的未来还很遥远。 宝尊电商副总裁Ricky在7月20日举办的社趣邻居“AI赋能新消费”峰会上,对自身的AI直播实践做了分享和展示。 目前,AI直播分为全自动直播和AI中置人直播,前者无论是主播形象还是内容都由AI一手操办,后者则以技术手段提取并模拟真人的样貌、动作,文本内容仍然是AI播报,可谓是“画皮”型直播。 新零售商业评论摄 Ricky表示,AI直播的优势,一是相对于真人直播降低了近一半的成本,二是可以24小时“工作”,三是不遗漏消费者留言,可以一一准确回复,四是可以规避口误等直播风险。 但实际上,一张AI直播、AI加真人直播以及完全真人直播的GMV数据对比图,就足以让品牌们暂时打消完全用AI替代真人直播的念头——情感更丰富、更有真实互动感的真人,在引导消费者下单的能力上取得了压倒性的胜利。 AI直播、AI加真人直播以及完全真人直播的GMV数据对比,新零售商业评论摄 由此,Ricky认为,目前AI直播暂时只能作为真人直播的辅助手段,还无法完全取代真人。 同样,国内不少打着有AI助教旗号的教育类产品,如多邻国、流利说、作业帮、猿辅导等,在解题、辅导教学等专业能力上或许早已超越了真人的响应速度,也能给出千人千面的教学方案,但在情感连接上始终还是差了不少。 事实上,情感价值对消费者来说是不可或缺的。 无独有偶,在文本创作和图片制作方面,不少企业渐渐发现,AI没有那么好用。 自ChatGPT横空出世以来,李睿(化名)就再没接到过为某广告咨询公司做文案优化的活计——这本是他较为稳定的兼职工作,涵盖了品牌介绍、产品优势提炼、使用指引等大量的文案内容。 他一打听,原来这家公司的员工正在努力“调教”ChatGPT,希望以后能由AI替代李睿的工作。李睿虽感无奈,但也知道这是大势所趋,毕竟,AI相对人来说真的很便宜,还能取之不尽、用之不竭。 谁知,三个月后,这家公司重新找到李睿,希望继续合作。 原来,要让AI生成一段文字、一张图片,首先要“喂”给它大量且较为准确的文字信息,不然AI可能会生成风马牛不相及的内容。即便AI完成了创作,也还需要人工花不少精力去修改、完善内容…… 此外,ChatGPT来自美国,还不太适应中文的语言环境,而国内的文心一言、讯飞星火,又不够成熟,经常写出大段言之凿凿实则胡说八道、前言不搭后语的“废话文学”,需要人来重新编辑。 “AI用起来太费劲了,他们觉得还不如继续找我写。”李睿耸耸肩,脸上难掩“AI也比不过我”的得意之色。 许多AIGC内容皆是如此,有用户告诉新零售商业评论,作为一名插画师,她对AI绘画工具Midjourney新鲜了好一阵,但后来越看越觉得:“它做出来的图总是带着一种‘失真的美感’,渐渐就无法吸引我了。” 而她的插画师朋友普遍对AI绘画带有敌意,认为威胁到了画师的职业生存环境,也破坏了艺术创作行业的生态平衡。 如果把AI比作一柄利剑,要达到它与人类“人剑合一”的状态,还有很长的距离。 一柄双刃剑 许多产品如今已经把加入AI技术当成了一种营销手段,更像是为了吸引消费者而在产品中加的“佐料”。 AI的名头也确实火。要在刚上线一周的妙鸭相机小程序上制作一个自己的数字分身,需要等待超过8小时,而一周后,这个时间仍然超2小时,这热度谁不眼红? 但妙鸭相机的热度恐怕也不会维持太久,这几年来我们已经见过太多“一夜爆红,二夜被山寨,三夜就失宠”的短命爆款产品。 这些产品是有其价值所在的:让更多人看到某个新技术、新模式,也让行业了解了自己的红线应该划定在哪。 技术是一把双刃剑,AIGC也具有反噬品牌、平台的力量。 首当其冲的是数据安全和隐私保护问题。 被消费者诟病最多的便是AIGC服务,即AI客服。现在,你可能会在一天内接到三四个来自AI客服的问候电话,他们用毫无波澜的语音语调,询问你是否需要万用金或是拉高信用卡额度,是否对某个产品感兴趣,是否很久没光顾过某家旗舰店…… 有时候,你回答慢了半拍,它们就会无情地重复一遍之前的话术,任你如何打断都无济于事,最好的办法唯有挂断电话。 “我现在对用AI客服的品牌、平台都没有太多好感——感觉他们一点都不真诚。”一位受够了AI客服的消费者向新零售商业评论抱怨,“我觉得他们在监视我的一举一动,自以为是地为我提供所谓我需要的服务,让我有一种生活细节都被暴露的感觉……” 除此之外,当真需要客服解决困难时,这些AI客服又“只会说车轱辘话,不但不能很快解决我的问题,还给我添堵”。 此外,消费者们也担心有诈骗组织会利用AI合成自己的肖像、声音,对自己的亲人进行诈骗。“自己的肖像、声音、指纹等信息,其实都保存在互联网平台中,这些信息一旦暴露,后果不堪设想。”上述消费者表达了自己的担忧。 其次是版权与确权的问题。 今年5月,有人制作出AI孙燕姿,并演唱了周杰伦的歌,播客“乱翻书”主播潘乱和ACE虚拟歌姬创始人郭靖就此探讨了版权的归属问题——词曲版权应该仍属于周杰伦,AI孙燕姿只是一个演唱该歌曲的“乐器”,而这个乐器的制作方不能用“孙燕姿”的名义发布歌曲,不然就是侵犯了孙燕姿的权益。 图源乱翻书播客 同样发生在今年5月,杭州互联网法院就我国第一例虚拟数字人侵权案做出一审判决,认定被告杭州某网络公司构成著作权侵权及不正当竞争——该公司擅自使用了另一家公司制作的数字人视频进行牟利。最终,该公司被判赔偿12万元的经济损失。 对于此种风险,抖音干脆先一刀切——封杀了全自动的AI直播间,并紧随其后发布了AIGC平台规范,规定AI声称的内容必须打上相应的标识,以区分真人和AI生产的内容。 而大众点评等本地生活平台也开始打击AI生成的大量评论、种草内容。 事实上,AIGC本身的商业模式前景也并不明晰,目前还处于烧钱跑马圈地的阶段。 比如,研发出Jasper单一模型的公司在近日宣布裁员,而ChatGPT背后的OpenAI日子也不好过,据媒体援引知情人士的话说,由于ChatGPT的开发工作,以及从谷歌聘请了关键员工,2022年OpenAI的亏损大约翻了一番,达到约5.4亿美元。 AIGC的“冷静期” 很多人误解了AIGC的用途。AIGC诞生的本意是辅助人类,而非取代人类。 ChatGPT和Midjourney本质上是通过大数据生成符合描述的文字、图像,把大量枯燥的、重复性的工作内容替代掉,让人类去做更有创意、更具决策性、且AI想不到的事。 “AIGC只是在做选择,而不是创造。”《乱翻书》主持人潘乱如此说道。 AI Talk创始人汗青则认为,AIGC行业的从业者目前分成两派。一是追求模仿派,指通过AI做成很像真人产出的内容,但他认为这只是AIGC的第一阶段,也是目前AIGC行业大部分人在做的; 另一派是激发创造派,指利用AI技术激发人类艺术的新的可能性,创造出更多突破人类想象的艺术内容,但要达到这样的境界,或许还需要积淀一段时间。 业内狂欢之后,AIGC进入了相对的“冷静期”,行业发展更加平稳,行业规范和法律的边界也会越来越明晰。 第四范式联合创始人胡时伟认为:“一项技术之所以在爆火之后引起质疑或销声匿迹,是因为它无法满足大众对于 ‘技术应该为生产生活带来巨大的改变’的预期,而往往在沉寂期是技术冷静下来,真正带来价值、产生沉淀的部分。”他还表示,AI产生价值的趋势会“一浪高过一浪”,而“每个波峰之间的距离在逐渐缩短”。 AIGC无疑还会继续发展下去,只不过会更加润物细无声地影响着每个人的生活,成为一个更加无所不在的存在,而人们也会逐渐适应和AI互相配合的工作与生活模式。 对此,你期待吗?
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
谷歌第五代定制张量处理器(TPU)芯片TPU v5e用于大模型训练和推理,训练和运行AI模型的速度提高了5倍。 当地时间8月29日,谷歌在旧金山的年度云会议Google Cloud Next上发布了新的人工智能芯片,即第五代定制张量处理器(TPU)芯片TPU v5e,用于大模型训练和推理。与上一代芯片相比,TPU v5e每一美元的训练性能提高2倍,每一美元的推理性能提高2.5倍。 TPU是谷歌为神经网络设计的专用芯片,TPU经过优化可加快机器学习模型的训练和推断速度,2016年推出第一代TPU,2021年发布第四代定制处理器TPU,2022年面向开发者提供。云TPU(Cloud TPU)是一项谷歌云服务,适合训练需要进行大量矩阵计算的大型复杂深度学习模型,例如大语言模型、蛋白质折叠建模和药物研发等,帮助企业在实现AI工作负载时节省资金和时间。 此次推出的TPU v5e专为中大型模型训练和推理所需的成本效益和性能而构建。谷歌云表示,该版本芯片的开发重点是效率,与上一代TPU v4相比,TPU v5e每一美元的训练性能提高2倍,每一美元的推理性能提高2.5倍,而成本不到TPU v4的一半,使得更多组织能够训练和部署更大更复杂的AI模型。客户不需要通过牺牲性能或灵活性来获得这些成本效益。谷歌云将TPU v5e描述为“超级计算机”,最多允许256个芯片互连,总带宽超过400 Tb/s,支持八种不同的虚拟机配置,客户可选择合适的配置服务于各种大语言模型和生成式AI模型。根据速度基准测试,在TPU v5e上训练和运行AI模型时速度提高了5倍。 据科技媒体TechCrunch报道,谷歌云计算和机器学习基础设施副总裁兼总经理马克·洛迈尔(Mark Lohmeyer) 表示,“这是迄今为止最具成本效益且易于访问的云TPU。” 洛迈尔强调,谷歌云确保用户能够将其TPU集群扩展到以前无法达到的水平,让客户能够轻松扩展他们的人工智能模型,超越单个TPU集群的物理边界。也就是说,单个大型人工智能工作负载可以跨越多个物理TPU集群,扩展到数万个芯片,并且经济高效。“在云GPU和云TPU方面,我们为客户提供了很多选择和灵活性,以满足我们看到的人工智能工作负载的广泛需求。” 除了新一代TPU,谷歌云还宣布将在下个月推出基于英伟达H100 GPU的A3系列虚拟机,作为GPU超级计算机进行交付,为人工智能大模型提供动力。
AI+云计算共生共长,能否解锁下一个高增长空间?
在过去近一年的时间里,AI大模型从最初的框架构建,逐步走到落地阶段。 然而,随着AI大模型深入到千行百业中,市场开始意识到通用大模型虽然功能强大,但似乎并不能完全满足不同企业的个性化需求。 大模型技术的安全性、解释性、易用性等综合指标正在成为此轮AI竞赛的关键,部分企业不再执着于大模型的开发,而把目光向普惠式AI、生成式AI+多云、大模型的私有化部署等多种商业模式。 01 AI与云计算迎来大融合时代 从诞生起,云计算一直被认为是未来的发展方向、互联网企业们的“第二增长曲线”。 但是,受互联网增长红利见顶以及政策监管趋严的影响。从2021年开始,原本处在高速增长阶段的云服务商们纷纷陷入了增速放缓的阶段。从高峰时的超过50%的增速,一路跌至2022年的20%,甚至更低。 全球产业需求的消退,导致云计算行业增速失调。根据研究机构TrendForce今年2月的预警,Meta、微软、谷歌、亚马逊这四家云厂商的服务器采购量可能从年增6.9%放缓至4.4%。 不过,拐点很快到来。在ChatGPT出现后,即使行业需求放缓,国内外云服务商们也在积极将业务重心转移至AI领域。 可见云服务商们逐渐从上半场的“求速度”转变为落地于产业深处,去寻求更高的价值增量。 随着第一波上云的完成,企业正在进入深度用云阶段。AI与云的结合不仅能够进一步降低企业上云的门槛,还能为企业实现业务深度的智能化。 根据Gartner《2022年人工智能技术成熟度曲线》报告,尽早采用复合型人工智能(AI)、决策智能等AI技术将给企业机构带来明显的竞争优势,缓解AI模型脆弱性引发的问题,有助于捕捉业务背景信息,推动价值实现。 今年4月中旬,阿里云智能首席商业官蔡英华对外表示,算力的飞速发展使数字化成为确定,使智能化成为可能。 未来阿里云将以云计算为基石,以AI为引擎,参与到从数字化迈向智能化的划时代变革中。 02 AI走向普惠的一大步 英伟达第二财季的业绩惊艳众人,其背后是生成式AI革命中,行业对高性能算力的迫切需求,然而现在,昂贵的算力成本下,AI大模型似乎仍是个“富人游戏”。 面对GPU价格的暴涨与未来可能到来的“算力荒”,大公司砸钱囤卡,尚可悠然步入AI竞技场,而中小企业没有“钞能力”,在发展AI模型、应用过程中,更容易受算力制约。 拿什么来拯救AI算力资源极度不均衡的现状?如何让更多创业者参与到大模型的市场竞争中? 作为全球GPU龙头供应商、此轮AI热潮最大的受益者,英伟达给出了破局之道——算力租赁。 今年3月,英伟达正式推出算力租赁服务方案“DGX云”,该方案由英伟达与微软云、谷歌云、甲骨文等全球top10的云服务商共同打造,企业通过一个浏览器就可以按月租用英伟达DGX AI超级计算机,不需要采购与拥有服务器设备。 事实上,英伟达DGX云并非AIGC产业首例,但由于DGX AI超级计算机的杰出性能,DGX云将AIGC云算力产业推向了更高的起点,该服务推出标志着AI云算力进入新阶段。云算力采用“化整为零”的方式赋能产业链各方,具备可持续性。 算力租赁,即对算力进行出租,是一种通过云计算服务提供商租用计算资源的模式。算力生产商与云平台的合作由来已久,用户可以通过阿里云、腾讯云等平台租用英伟达的显卡与AI处理器。 对于英伟达与云服务商来说,算力租赁是实现双赢的策略。 全球第七大云服务商甲骨文是最先响应英伟达DGX云计划的大厂,该公司于2022年10月将英伟达加速计算堆栈工具(包括GPU 、系统、软件)迁移到其IaaS业务的旗舰产品——云服务平台OCI(Oracle Cloud infrastructure)上。 从最新的季报数据来看,这对甲骨文的业绩有非常显著的拉动作用。 2023年第四财季(自然年3月1日-5月31日),其云业务(IaaS+SaaS)营收达44亿美元,同比增加54%;其中,IaaS业务营收14亿美元,同比大增76%,云厂商中单季度云业务增收增速第一。 于英伟达而言,这亦是一笔回本周期短且毛利率可观的生意。 以A100(80G)租赁服务为例,A100(80G)显卡单价成本取10万元,现假设每张卡都得到充分租用,则按照2023年8月19日国内云算力平台租用A100(80G)服务器的均价15.1元/小时,考虑到各大平台竞争客户,经常性推出优惠活动,则假设平均实际租金为7.6元/小时,投入10亿元资金的实际回本周期为1.5-2年,按照平台最低定价计算,毛利率至少为46.3%。 目前,英伟达正积极拓展“朋友圈”,与领先的云服务商联合托管DGX云基础设施,甲骨文之外,微软Azure也已开始托管DGX云,这项服务还将在不久之后扩展到谷歌云。 基于算力租赁,用户只要按需付费,不用承担硬件设备的采购、维护、升级等费用,也不用担心设备闲置或者过时造成浪费;用户可随时随地通过云端访问所需的算力资源,快速开始训练和应用;用户可根据需求选择不同算力平台和机型,也可以不受地域或者时间的限制模型、工具等资源,进行更多的尝试和探索。 03 当多云遇到生成式AI 为了向大模型客户提供高稳定性和高性价比的AI基础设施,生成式AI+多云的模式成为科技厂商们新的角力点。 云被看作是AI的承载,而AI也是云的核心抓手,开展大模型所需要的算法、算力和数据等能力,以及覆盖IaaS、PaaS、MaaS的解决方案。 近期,VMware 推出Intelligent Assist、Private AI架构方案。在此之前,阿里云提出了“Model as a service”的概念,亚马逊云科技推出了包括Amazon Bedrock和Amazon Titan模型等生成式AI新工具。 VMware CEO Raghu表示:“生成式AI与多云可谓珠联璧合。客户的数据无处不在,遍布其数据中心、边缘、云等多处。 我们将与NVIDIA一同助力企业放心地在数据附近运行生成式AI工作负载,并解决其在企业数据隐私、安全和控制方面的问题。” NVIDIA创始人兼首席执行官黄仁勋表示:“我们能够训练AI模型,微调AI模型,为了跨多个GPU部署AI模型和大语言模型,特别是大语言模型,一台计算机运行不了,必须将其分配到多机多卡上,并对其进行推理、生成token,实现交互,其速度可媲美人类日常交互。” 同时他表示,通过与VMware扩大合作,我们将能够为金融服务、医疗、制造等领域的成千上万家客户提供其所需的全栈式软件和计算,使其能够使用基于自身数据定制的应用,充分挖掘生成式AI的潜力。 Private AI由一套集成式AI工具组成,能够使企业自定义模型并运行各种生成式AI应用,如智能聊天机器人、助手、搜索和摘要等。 该平台将作为全集成式解决方案,采用NVIDIA提供的生成式AI软件和加速计算,基于VMware Cloud Foundation构建,并针对AI进行了优化。 VMware AI Labs副总裁Chris Wolf表示:“最开始,AI是由一部分数据科学家为方便其他的数据科学家而构建和设计的。 随着全新VMware Private AI产品的推出,VMware正在让计算和AI模型的选择更加贴近数据,从而使未来的AI服务于企业中的每一个人。” 04 AI能拉动云服务增长吗? 行业研究机构IDC日前发布的2022年全球云计算追踪数据显示,全球云计算IaaS市场规模增长至1154.96亿美元,同比去年上涨26.2%。 全球前三名云厂商依次为亚马逊、微软、阿里云,所占份额分别为48.9%、14.4%、6.2%,谷歌和IBM紧随其后,所占份额分别为5.6%和2.9%。华为云、中国电信、腾讯云、中国移动和百度云位列六至十名。 与2021年相比,阿里云市场份额在减少,而亚马逊和谷歌所占市场份额在增加。 移动互联网发展见顶之后,全球云服务商收入增长都在放缓,AWS增速从40%下降到12%,微软Azure增速从31%下降到15%,但显然阿里云面临的挑战更大一些,增速已降至不足10%,上个季度首次出现负增长。 反观紧随其后的谷歌云仍保持近30%的增长,极有可能取代阿里云占据全球云厂商第三的位置。 2023年第二季度,阿里云的收入同比增长了4%。财报显示,阿里云本季度收入增长主要受到存储、网络和AI计算相关产品驱动,部分被CDN需求正常化抵消增幅。 从客户分布维度,收入增长主要受到金融服务、教育、电力和汽车行业驱动,部分被主动缩减项目式收入的举措所抵消。 AI热潮带来的算力和模型服务需求,正在推动云计算巨头重回增长,那么这种增长能否长期持续? IDC统计了全球主要云计算厂商的收入拆分,阿里云、AWS的收入结构基本接近, 均主要以IaaS业务为主,辅以一部分PaaS业务,而微软Azure的PaaS和SaaS的收入占比超过60%。 实际上,云计算产业链中,从底层的IaaS,到中间层的PaaS,再到上层的SaaS,越往上产品差异化越大,毛利率越高。 微软Azure正是将自身的Windows、Office、SQL Server等软件与云服务打通,获得了更高的毛利率。 IDC在7月6日发布的《全球公共云服务半年度跟踪报告》显示:2022年全球公共云服务市场收入总计为5458亿美元,其中,SaaS(软件即服务)是公共云服务收入的最主要来源,占2022年总收入的45%以上。 面对全球市场以及国内市场激烈的IaaS竞争,阿里云发力PaaS和MaaS,微软Aure是可以参考比较的对象。 作为OpenAI的投资方,微软显然更受益于生成式AI的发展。今年初,微软宣布Azure OpenAI服务在全球Azure平台发布,该服务旨在为开发人员提供对大型语言模型的便捷访问,这些模型可以跨其他Azure产品无缝集成,以协助企业开发和部署对话式AI服务和解决方案。 此外,微软在其全球合作伙伴大会上宣布了Microsoft 365 Copilot定价、推出Bing Chat Enterprise AI聊天机器人、和Meta联合宣布将Llama 2开源大模型引入Azure云和Windows。 微软2023年第四财季电话会议上,微软首席财务官Amy Hood则表示,尽管目前对Azure AI服务的需求强劲,但目前AI服务对Azure的收入贡献仅有约1个百分点,随着微软加速投资云基础设施,AI对微软收入带来的影响将集中在2024财年的下半年。 张勇在财报会议上也说:“人工智能AI革命是一个增量机会,各行各业,所有公司他们都会希望利用人工智能来提升他们的服务。 但是这个是离不开要利用大量高性能的算力,不仅是用于现阶段模型的训练,还要用于支撑以后他们提供各种的服务。因此我们认为这是非常重要的、长期的一个带动增长的引擎。” 企业数字化、产业智能化是一条漫长的路,但云计算大厂们则通过不断的技术革新、开放赋能,正助力更多企业大步快跑进产业智能化的升级浪潮中,大大缩短了这一升级路径所需时间。 在人工智能技术融入万物,技术、需求与产业进化永不停歇、奔涌向前的现实下,未来的技术框架又会进步到何种程度,让我们拭目以待。
索尼做了个带手柄的屏幕,并打算卖你1500块钱…
前阵子,索尼发布了一个看上去有点抽象的设备 PlayStation Portal 。 这个玩意儿非常生硬地把 PS5 手柄给一刀两半,然后中间塞进去一个显示器,有一种让玩游戏和不玩游戏的人都沉默的美感。。。 乍一看,它的缩写也是 PSP ,好像是一个新世纪索尼掌机,PSP 和 PSV 的次世代继承者,然而。。。 它只是一个自带手柄的显示器而已。。。 目前看来,它唯一的作用就是通过串流的方式玩 PS5 上面的游戏,没了。 估计有的差友可能懵了,意思就是,这个带显示器的手柄,本身没有任何独立运行游戏的能力,它真的只是一个显示器。。。 然后当你的 PS5 正在运行游戏时,你可以通过串流的方式,用这个设备来进行玩耍。 串流也被叫做流式传输,意思就是把游戏的运算和渲染工作交给一台性能很好的机器,然后另一台设备再通过网络获取对应的游戏画面。 串流适合一些配置比较差的设备来使用,或者像 “ PSP ” 这种压根没法独立运行的设备。 讲真,虽然一开始托尼是难以理解的,但毕竟它是一个自带手柄的便携显示设备,万一哪天犯懒就想用了呢? 所以我一直本着 “ 尊重祝福 ” 的想法去看待这玩意儿,直到最近它公布了高达 200 美刀的售价。。。 3202 年了,就连 Switch Lite 都只要 1200 多块,还能随时随地想玩就玩,我花 1500 块买一个带手柄的显示器到底是图个啥。。。? 是不是觉得这玩意儿没啥用?而托尼作为一个老玩家,稍微分析了一波之后,发现这玩意儿的槽点比想象中还要多。。。 首先就是前面提到的,它只是一个纯串流设备,不能独立运行任何应用,离开了 WiFi 直接变砖。。。 而且作为显示器本身,它本身的屏幕素质可能也一般,因为这是一块 LCD 屏幕。。。 而这块 LCD 屏幕,是不支持 HDR 的。 还有一个最要命的地方,那就是和这个世界上的所有串流设备一样,它多多少少都有延迟的情况,这个对于游戏体验的影响是非常大的。 如果你用过蓝牙耳机打游戏的话,应该体会过声音永远比操作慢半拍的感觉有多么难受。 串流的延迟有点类似,但不同之处是当你按下手柄,画面上的角色却慢了半拍才出招。 如果是在对反应速度要求不那么高的 RPG ( 角色扮演 ) 游戏中,还算能够忍受,但 PS5 在北美可是有另一个外号 —— 《 使命召唤 》 启动器。。。 而 FPS ( 第一人称射击 ) 游戏偏偏是对响应速度要求最高的那一类游戏,开枪慢一丢丢就直接被对面爆头送走了。。。 所以托尼个人猜测,这玩意儿可能连 “ 使命召唤启动器 ” 的作用都承载不了。 这时候公司的硬件部点子王 —— 米罗,还发现了一件事,那就是串流质量好坏,是极度依赖 WiFi 环境的,虽然延迟没法彻底解决,但是我们可以通过好的路由器来提升串流质量啊! 领势 Velop MX5300 妙,妙啊。 但这样就需要动用 “ 钞能力 ” ,花大价钱买个旗舰级路由器。 然而在水深火热的国外,随便买一个好点的路由器,价格甚至比 PSP 都高。。。 里外里这就花了 400 甚至 500 美刀,为了一个串流玩法,真的不值。 而几百美元已经属于安卓掌机的价格区间了,像是 Retroid Pocket 之类的不仅同样支持串流,在不连接 PS5 的时候还能打打别的游戏啥的,这不也挺好的吗? 而且高通最近还公布了几款 G 系列游戏芯片,估计过段时间会蹦出来一堆安卓掌机。 这么一看,好像索尼出的这个玩意儿干啥啥不行啊。。。 倒也没有这么不堪,至少托尼看了 IGN 的视频,里面有提到索尼认为的使用人群。 比如 PS5 放在客厅,但此时客厅电视被人占用的;家里有小孩,你想打游戏但是又不想打扰到他们;或者干脆就是不喜欢在客厅打游戏,想在卧室玩 PS5 的。 不知道为啥,托尼看完之后觉得这东西反而更抽象了。。。 有没有一种可能,你可以把心爱的 PS5 直接搬到卧室去玩呢? 总之,这东西确实是槽点满满,一时之间很难想出购买这玩意儿的理由。 当然,这个 PSP 由于是官方的串流设备,整体的操作肯定比第三方方便得多,用起来不会那么麻烦。 而且它自带一个 DualSense 自适应扳机手柄,游玩体验肯定不会差,光是单独买一个手柄就要五六百块钱了。 而 PSP 用起来,肯定比一个手柄再额外带一个便携显示器要方便。 其实托尼并不反感这样的设备,只是觉得索尼这样的设计有些过于粗暴了,真就是把显示器直接塞到手柄中间,价格没有到天价的程度,但也不便宜。 你说你都做到这份儿上了,真的不如直接出个正儿八经的掌机。。。 众所周知,索尼家的 PS5 本来就基于 AMD 处理器设计,而现在掌机公认的最佳处理器之一也是出自 AMD 的 Z1 系列,它们甚至还都是 X86 架构。 只要索尼想,按照自家的技术力,做一个水平不错的能够游玩轻量级 PS5 游戏的掌机,完全没问题。 而且看看现在的 Steam Deck 和 ROG Ally ,在核心玩家的圈子里已经传开了,掌机文艺复兴是完全可行的事情。 更别提 PSP 当年在掌机界掀起的血雨腥风了,就凭索尼这号召力,有多少人在盼着复活当年的 PSP 和 PSV 呢。。。 结果索尼可倒好,搞了一个前不着村后不着店的串流设备,卖的也不便宜。。。 也许,索尼的掌机时代,真的一去不复返了吧。。。 撰文:百威 编辑:米罗
机器人技术在护理领域中的应用
新技术正在帮助我们应对技术工人短缺等挑战。机器人技术是否也能够帮助缓解医疗和护理领域的高强度压力?我们对两位专家进行了访谈。 专家介绍 库卡医疗机器人业务发展经理AndreasKeibel博士 库卡公司的高级UX研究员NadineReißner 问:机器人技术和人工智能正在进入越来越多的领域,并且可以为老龄化社会提供支持。在护理领域,是否也存在使用机器人技术的趋势? AndreasKeibel博士:总的来说,护理领域需要新技术。人口结构变化的影响已经显而易见,另外,护理人员还严重短缺。这一领域需要采取行动,这是考虑到未来的必要之举。在护理领域使用人工智能/机器人技术已经成为了国际上集中研究的主题之一。 机器人对于护理领域来说,最初的重点任务可能是支持护理人员的操作,以便护理人员有更多的时间进行护理,将更多的注意力转移到病人身上。自动化物流是一个可能的应用场景。例如,机器人技术可以及时准确地提供各种物品,如餐食、消耗品甚至床铺等。这些是最容易实现的第一批应用领域,因为这不涉及机器人技术和人工智能与患者的直接交互。 该行业需要转变,需要将资金用到先进技术上。例如,德国政府颁布的《医院未来法案》为医疗和护理设施配备现代技术提供了财政支持,这就是朝着正确方向迈出的一步。 问:作为机器人和自动化解决方案的供应商,库卡主要活跃在工业生产领域。那么库卡在护理和医疗保健领域也有具体的项目和应用吗? Andreas Keibel博士:库卡的技术有助于将人们从危险、单调或繁重的任务中解脱出来。机器人技术也可以为技术工人的日益短缺和人口结构的变化提供支持。在医疗领域,库卡为各种医疗机器人的应用提供了解决方案。例如,我们灵敏的协作机器人LBR Med就是专门为医疗技术开发的。Life Science Robotics公司已经使用它来开发康复机器人应用程序ROBERT®,机器人在其中起到了辅助治疗的作用。这种机器人辅助治疗的方式减轻了护理人员的负担。 NadineReißner:此外,库卡还致力于针对护理领域的新技术研究。库卡一直在与合作伙伴一起研究护理行业的解决方案,例如为后勤工作提供机器人支持。该项目的目标是减轻护士的工作负担并节省时间。 问:您已经指出并非所有护理工作都可以自动化。那么,机器人能够完成哪些任务,哪些任务较为困难? NadineReißner:护理任务和其他任务是有区别的,其他任务会使护士脱离了他们的核心工作。这些任务包括文档记录和管理以及各种后勤工作。护理活动的本质是人与人之间的互动以及建立社交联系。护士不仅仅需要送餐,还要检查病人的情况并与其互动,从而了解病人的情况。对机器人来说,完成一些依赖社交技能的任务是较为困难的,例如同情心。这些人际层面仍然是人类的专属领域。但是人工智能和机器人可以为后勤工作或文档记录提供很好的支持。 康复机器人ROBERT®移动患者:机器人辅助治疗减轻护理人员工作负担 问:你期待机器人技术在近期和未来会对护理领域有什么影响?人工智能将如何改变护理? AndreasKeibel博士:数字化是将更多技术引入护理领域的基础。例如,人工智能可以促进传感器的实时评估,以此更好地评估疗养院中的情况和环境。这可以帮助移动机器人在设施周围移动,以补充货架或维持秩序。人工智能还可以识别人员并且评估他们的状况,并以这种方式减轻员工的负担。
“AI孙燕姿” 爆火之后,这门生意可能真的要成了
AI不只是新的麦克风。 图片来源@视觉中国 今年 5 月 AI 歌手爆火,其中以「孙燕姿」为最。 周杰伦的《发如雪》、许嵩的《清明雨上》、周华健的《难念的经》,通通拜倒在技术加成的「音色流氓」之下。 你跟一个每几分钟就推出一张新专辑的人还有什么好争的。 孙燕姿时隔一个多月的回应,洞若观火又泰然自若。 尽管她认为人类无法超越 AI 已指日可待,但现实只能且行且看,现在 AI 音乐已经过了听个响的阶段,开始认真琢磨赚钱这件事了。 让明星帮你唱歌可以,但请交钱 最近,YouTube 和环球音乐集团「一拍即合」。 一个是全球最大的视频网站,一个是全球最大的音乐公司之一,控制着约三分之一的音乐市场,与索尼音乐、华纳音乐「三足鼎立」,拥有泰勒·斯威夫特、鲍勃·迪伦等巨星版权。 AI 斯威夫特演唱的《My Way》. 「强强联盟」奔着「加强版权保护」而去,它们不是抵抗 AI,反而是拥抱 AI,重新思考音乐版税和内容创作,让音乐人和平台都能继续赚到钱。 行业老大坚决打击的,其实是那些类似「AI 孙燕姿」的、不问自取的侵害版权行为。 目前还没有落地的事物,两者先是召集了包括格莱美得主的环球音乐音乐人,这些「小白鼠」们负责试验正在开发的 AI 工具并提供反馈。 逝世的「瘦皮猴」Frank Sinatra,「遗产」也会被征用. YouTube 的入局,有些「亡羊补牢」的感觉。仅今年上半年,YouTube 上与 AI 工具相关的视频观看次数就超过 17 亿次。 对于侵害版权的行为,YouTube 的态度是,技术的问题交给技术解决。 生成式 AI 系统可能会加剧当前的挑战,例如商标和版权滥用、错误信息、垃圾邮件等。但 AI 也可以用来识别这类内容。 说到 YouTube 的合作伙伴环球音乐,互联网是有记忆的,就在几个月前,它还对 AI 音乐十分不满。 今年 4 月,「Heart on My Sleeve」这首歌在外网爆火,它用 AI 克隆了歌手 Drake 和 The Weeknd 的声音,TikTok 的观看次数超过 850 万次,Spotify 的收听次数超过 25 万次,随后被环球音乐要求下架。 光下架还不够,环球音乐向 Spotify、苹果等流媒体平台下达了通知,要求它们阻止 AI 工具从受版权保护的歌曲中抓取歌词和旋律。 如今看来,这不是回旋镖,只是环球音乐打算将 AI 音乐规范化,并从中分一杯羹,你用 Drake 的声音唱自己的歌,那你就该付钱。 比和 YouTube 官宣早十几天,环球音乐也和 YouTube「顶头上司」Google 讨论过相同的话题,当时的想法是为粉丝开发一种制作 AI 生成歌曲的工具,版权所有者将获得报酬,艺术家可以选择是否参与,但也没有立即推出产品的计划。 YouTube 首席执行官将 AI 生成歌曲的兴起,与 YouTube 发展早期相提并论,那是平台首次直面用户生成内容和版权之间的冲突。 当时人们将流行歌曲作为视频配乐,涉嫌侵犯版权,所以 YouTube 开发了版权管理系统 Content ID,让版权所有者得到报酬,每年累计向音乐行业支付约 20 亿美元。 这让 YouTube 意识到,音乐视频得以在平台上繁荣,连接世界各地的艺术家和粉丝,核心就是保护版权。 AI 不只是新的麦克风 如果说平台更多是利益和商业模式方面的考量,音乐人的心情则更复杂,既担心养家糊口的生计,也放不下对艺术的追求。 说唱歌手 Drake 猛烈抨击了模仿他声音的 AI 歌曲,称其为「最后一根稻草」,另一位说唱歌手 Ice Cube 更是将 AI 歌曲称为「恶魔」,难说其中没有对技术的恐惧。 当 AI 模拟人声不再是难事,人们自然希望它能够做到更多。部分先发制人的艺术家们,尝试将名为艺术和商业的磁铁两极,都掌握在自己手中。 加拿大创作歌手、马斯克前女友格莱姆斯,就是「第一位吃螃蟹的人」。 格莱姆斯. 今年 5 月,格莱姆斯推出了专门用来复制她声音的开源软件 Elf.tech,允许自己的声音开放使用,但要求分 50% 的版税,快刀斩乱麻地把盈利模式确定好了。 这几个月来,虽然还无法颠覆乐坛,也称不上病毒式传播,但 AI 格莱姆斯的作品已经不少,至少发行了 300 多首歌曲,甚至在 Spotify 有官方账号并收取版税,最受欢迎的《Cold Touch》有 100 万多次播放,剩下的基本没能超过 10 万次播放。 《Cold Touch》出自 DJ 兼制作人 Kito 之手,和 AI 孙燕姿翻唱歌曲类似,它更像是披了个 AI 的皮,编写和制作等「重头戏」交给人类,演唱也有小样,歌手被要求唱法尽可能像格莱姆斯本人,然后才重制成了格莱姆斯的声音。 Kito. 这恰恰说明,AI 还不能抹除人类的创作痕迹,我们仍然需要写歌、制作和演唱。 格莱姆斯在接受采访时也提到,AI「就像一个新的麦克风」,AI 格莱姆斯不会否定对格莱姆斯的需求。 AI 格莱姆斯其中一首歌的海报. 虽然人类参与可能会随 AI 进步而减少,但格莱姆斯仍然对技术保持「病态乐观」,她相信新技术应该赋予人们权利,而不是取而代之。 人们变得沮丧,说「我想听听人类制作的东西」,但我想正是人类创造了这一切。 橘生淮南则为橘,生于淮北则为枳,AI 格莱姆斯是格莱姆斯的「种子」,但在不同的环境之下,它长出了味道不同的果实。 例如,《Friend V. Enemy》的演唱风格很不像格莱姆斯,但打样的歌手发音非常好,格莱姆斯很欣赏;《Ether》听起来就完全不像人唱的,不过格莱姆斯特别喜欢它的怪异感。 AI 格莱姆斯其中一首歌的海报. 这或许能够缓解音乐人的焦虑:AI 格莱姆斯和格莱姆斯本人,可能根本不在一个赛道,AI 是一个相邻边的扩展,而不是对原有领土的攻占,更不是原模原样的克隆。 格莱姆斯的赚钱方式是分版税,而电子音乐艺术家 Holly Herndon 设想得更加周全。 她推出了深度伪造自己声音的 AI 工具 Holly+,并建立了一个去中心化自治组织(DAO),当艺术家使用 Holly+ 创作时,作品被提交给 Holly+ DAO,成员将最好的作品制作成 NFT 并拍卖,收益由创作者、DAO 成员和 Holly Herndon 分配。 Holly+ . 引入区块链技术,为的是确认音乐的版权归属。Holly Herndon 自诩为「计算机音乐家」,观点也很极客,她认为,应该是艺术家本人而不是公司,决定 AI 在音乐中怎么使用,并自由地加入或退出。 Holly Herndon 更担心的不是 AI 技术本身,而是不负责任的公司们像 AI 一样训练所有人的口味。 Holly Herndon 在 TED 分享 AI 会唱多种语言. 在她看来,AI 应当是促进艺术发展的工具,唱着她不会的语言,为她自己伴唱,和其他歌手合唱,让更多人和她一起投入创作之中。 当任何人都可以像你一样创作时,成为一名艺术家意味着什么?让我们承认 AI 是正在发生的事情,看看我们能走多远。 技术狂奔的时代,看见人类的角色 对技术的规范,往往落后于技术的发展。目前为止,音色和风格是不受著作权法保护的。 Drake 和 The Weeknd 是环球音乐的艺术家,但环球音乐让流媒体平台下架 AI 歌曲,不是因为 AI 生成了他们的声音,而是因为曲子包括了制作人的创作,这部分受到版权保护,所以才能下架。 当一首歌被 AI 翻唱,其实应当征得词曲著作权人的同意,如果词曲著作权人签订过转让版权的合同,那么版权也可能归属于唱片公司,该走的流程也得走,除非是不以营利为目的的「合理使用」。 歌手是版权法中规定的「表演者」,对词曲本身不享有版权,但这类 AI 歌曲也可能损害到歌手的「公开权」——名人的某项特征很突出,人们通过它可以联想到本人,那么就该得到保护。 曾有这样一个案例,某位歌手拒绝拍摄福特的广告,福特请了她的一位伴唱,并要求这位伴唱尽可能唱得像歌手本人,结果真的骗过了不少人,歌手因此提起诉讼,法院判定她歌声的公开权被盗用。 所幸改变正在发生。今年 7 月,环球音乐呼吁在全国范围内推行公开权,目前它只在美国部分州有效。 不仅是引发版权相关的争议,AI 还可能让无用内容泛滥,并突出流媒体平台的不公。 AI 音乐初创公司 Boomy 就钻过空子。Boomy 提供的服务是,用户选择喜欢的音乐风格,由 AI 生成歌曲,用户可以改变节奏、编曲、乐器并添加人声,然后再将歌曲上传到流媒体赚取版税。 最近几个月,Spotify 删除了 Boomy 在其平台 7% 的内容,大概是几万首歌曲,因为 Boomy 涉嫌让机器人「听歌」,扩大播放数从而赚到更多的版税。流媒体分配版税的现金池就那么大,作弊的做法显然不正当。 Boomy 官网界面. 但未来很可能会有更多的 Boomy。它就像是用户和流媒体平台之间的中间人,甚至提供文生图功能,让用户快速用 AI 创建封面,一条龙服务太过贴心。目前,Boomy 的用户已经创作了超过 1400 万首歌曲。 与此同时,流媒体的「二八定律」,也可能因为 AI 而加重。「界面文化」《创作零工,普遍贫穷》一文提到,80 年代,音乐行业 80% 的收益来自 20% 的顶尖作品,现在的收益只来自 1% 的作品,因为算法和长尾效应,人们的注意力和消费对象更加集中了。 抖音神曲们如巨轮势不可挡,15 秒的副歌,先从短视频平台开始病毒传播,然后征服社交网络、霸榜音乐平台,最后走入线下,曲高和寡的歌曲真的成了小众圈子的狂欢。 固然孙燕姿和格莱姆斯接受了 AI 的存在,但前提是孙燕姿已经成为了孙燕姿,格莱姆斯已经成为了格莱姆斯,她们受到的冲击相对不那么大。 试图建立新版权系统的 YouTube 和环球音乐,暂时也没考虑改变这种不平衡。 音乐家借着格莱姆斯的 AI 账号出头,倒不失为一种引流的办法。AI 格莱姆斯的《Concept of Creation》在 Spotify 的播放量接近 7 万,算不上热门,但创作这首歌的艺术家,其他作品的播放量才 1000 多而已。 当 AI 一天一个模样,新的行业规则仍在以人类为中心展开。 根据美国地方法院近日的一起裁定,AI 生成的艺术品不受版权保护,虽然版权法确实需要与时俱进,但人类作者身份仍是版权的基本要求。 另外,美国版权局也发布过一份指南,其中一项要求是,提交作品时披露 AI 生成的内容,版权局将考虑歌曲中 AI 的使用是「机械复制」的结果,还是代表了作者的「原创构思」。 大名鼎鼎的格莱美,也只允许 AI 的「部分参与」。如果 AI 担任主唱,那么这首歌可以竞逐创作类别的奖项,但失去表演类别的资格。如果 AI 负责词或曲,这首歌就不必考虑了。 今年 3 月,创作歌手陈珊妮进行了一项实验,在发出新歌《教我如何做你的爱人》几天后,才公布这首歌是 AI 演唱的,封面也是用 AI 生成的。她自认为是 AI 的「支配者」,虽然未来会如何很难说。 这位探索 AI 音乐的先锋,最近在浪潮音乐大赏的颁奖引言说到,过去上过很多课程,其中最有趣的一堂课是「即兴」,老师不停地弹着钢琴,她要即时唱出不同的东西,尽可能不重复自己。 常有人问我什么是 Al 不能取代的?或许有一天,AI 真能为你完成一首毕生最伟大的作品,但是过程中你成为什么样的人,这是 AI 无从知晓,也无法站在这里分享的记忆与情怀。 以人的尺度去丈量宏观事物,未必不是一种立身处世的方式。 AI 是碾向所有人的巨轮,但对一些人来说,拥抱 AI 不是为了被时代抛下的模糊恐慌,而是为了自己还能留下什么具体的、与从前不同的东西。
全球GPU缺口超40万张!算力之困,中国大模型有解了
【新智元导读】大模型时代,玩家如何掘金?最近,这套大模型智算软件栈OGAI,竟吸引了国内几十家参与「百模大战」的企业围观。 中国企业,能否赶超OpenAI? 大模型爆火之后,许多人都在追问这样的问题。 然而,这个领域的中美差异性,决定了这一事实:美国现在的格局,未必就是中国未来的格局。 美国可能只有少数的大模型企业,而中国,或许会呈现百花齐放的新格局,并不会是只剩下少数几个大模型,其他人在它们的基础上去做应用和开发。 从十年维度来看,如今的GPT-4还只是一个baby,而今天的我们,只是刚刚打开生成式AI的一扇门而已。 在这个大模型狂飙的时代,英伟达CEO黄仁勋有一句名言,「the more you buy,the more you save!」 「如果你能将一个价值50亿美元的数据中心的训练时间缩短一半,那么节省下来的费用就超过了所有芯片的成本。」 01.大模型,怎样才能玩得起 但问题在于,面对如此高的门槛,究竟哪些玩家才能玩得起? 目前,大模型研发已进入万卡时代,一家企业如果想自己拥有大模型,至少需要几十亿投资。 然而,即便是买下来之后,紧接着还会面临建不了的问题。 此前的云计算是把一台机器拆分成很多容器,而现在的大模型需要多台机器集群的集中力量,在较长时间内完成海量计算任务。 如何保证低时延海量数据交换?如何让多台机器均衡计算,避免冷热不均?如果硬件出现故障,算法需要重新跑一遍,又怎么办? 瓶颈之下,算力利用率变得尤为重要 不可否认,对于大模型的研发来说,最大的挑战之一,就是对庞大的算力基础设施的需求。 然而,训练大模型的算力平台并不是算力的简单堆积,随着模型的规模越来越大,单卡算力与模型总算力需求之间存在着巨大的差异。 与此同时,虽然随着硬件的改进FLOPs的成本得到了部分改善,但大模型的持续升级使得总成本一直在增加。 目前,GPT-4、PaLM-2的算力当量,已经达到了GPT-3的数十倍,相当于上万颗业界性能领先的NVIDIA Hopper架构的GPU芯片组成的AI集群,训练超过1个月的时间。 算力平台的构建之所以这么难,是因为它不止是服务器、存储、 网络等硬件设备的集成,也有诸多设备软硬件兼容性和性能调教上的know-how。 而对于企业来说,由于缺乏工程实践的经验,进一步限制了硬件计算能力的发挥。这不仅让本就匮乏的算力资源雪上加霜,更是无法快速地提升模型质量来应对狂卷的竞争。 从数据到算法再到RLHF,过程冗长 在算法开发层面,PB级数据的爬取、清洗、过滤和质检,大规模预训练的算法设计、性能优化和失效管理,都面临着重重难题。 DeepMind的研究表明,想要把一个大模型训练充分,每个参数的训练量要达到20个token。因此,当前的很多千亿规模的大模型还需要多用10倍的数据进行训练,模型性能才能达到比较好的水平。 目前,国内大模型产业数据集主要还是简体中文加上少量英文为主,数据集的单词量在100亿级。相比之下,训练GPT模型的单词量级为5700亿。也就是说,单从规模上来看就是1:57的差距。 不仅如此,从设计指令微调数据集,到优化RLHF,整个开发链十分冗长,这更需要背后有诸多工程化工具。 模型训练:周期长、效率低,断点问题严峻 另外,大模型的训练过程,也比传统的分布式训练复杂,训练周期长达数月。 而集群计算效率低、故障频发且处理复杂,会导致训练中断后不能及时恢复,从而会降低成功率,也会使训练成本 居高不下。 从工程角度来看,这是一个非常复杂的流程,其中的硬件、系统、软件、驱动等等都必须相互适配,才能起跑。 期间,各个部分都需要能稳定持续运转,才能保障模型训练的效率。一旦出现问题,都会让整个训练过程停摆。 比如,Meta就曾在训练OPT-175B模型的日志中提到,几乎整个训练过程都要面对不停地重启和中断。 在训练完成到30%左右处,Meta的训练日志显示,在两个星期的时间段内因为硬件、基础设施或实验稳定性问题而重新启动了40多次! 绝大多数重新启动都是由于硬件故障以及缺乏提供足够数量的「缓冲」节点来替换坏节点的能力。通过云接口更换一台机器可能需要几个小时。 在维护日志中,Meta的训练人员记录到: 总而言之,解决基础设施问题占据了团队最后两周的大部分时间,因为这些硬件问题可能会在一天中的任何时间导致训练中断几个小时。 虽然我们充分意识到这些问题会在这种规模的训练过程中反复出现,但考虑到在2021年底之前完成一个175B模型训练全部工作时间非常紧迫,我们别无选择,只能通过不停重启的方式,看看如果没有额外的训练工具的帮助我们能走多远。 在找到一个加速重启的方案并安排了更多的人手24小时轮值维护之后,Meta依然还是要面对硬件层面的各种问题。 内部训练进度的图表显示,接下来的两周之内,最长的3次连续训练时间长度只有2.8天,2天,1.5天。 不难看出,就连强如Meta这样的团队,都会或多或少地受到上述挑战的困扰。 因此,对于还处在探索阶段的国内大模型产业来说,就更加需要一套能够保障其生产力的AI基础设施。 正如浪潮信息人工智能与高性能应用软件部AI架构师Owen ZHU所说:「以前都认为,买服务器就像买手机、买电脑一样,只要开机就能用了;但实际上随着算力需求持续变大,事情变得越来越复杂,实际上买回去也不一定能用得起来。」 02.OGAI:你可能要踩的坑,他们都替你踩过了 为了切实地解决这些问题,近日,浪潮信息正式发布发布了大模型智算软件栈OGAI(Open GenAI Infra)——「元脑生智」。 面对各种以大模型为核心的生成式AI开发与应用场景,OGAI都提供了全栈全流程的软件,包括集群系统环境部署、算力调度保障、大模型开发管理等。 为了充分释放智算集群的能力,OGAI在每个层次上都对性能和稳定性进行了相应的优化,包括服务器BIOS的调教、大规模集群组网性能、算力调度策略等。 同时,也融合了浪潮信息在MLPerf性能评测、服务客户实际需求、开发源大模型的实践经验。 如此一来,就可以大幅降低大模型算力系统的使用门槛、优化大模型的研发效率。无论是生产,还是应用,都得到了保障。 总之,你可能会踩的坑,浪潮信息都提前帮你踩过了。 具体而言,OGAI由5层架构组成,从L0到L4分别对应基础设施层的智算中心OS、系统环境层的PODsys、调度平台层的AIStation、模型工具层的YLink和多模纳管层的MModel。 值得注意的是,OGAI软件栈的使用非常灵活。从L0到L4层的设计和实现,都是分层的。也就是说,你并不一定要用到L0到L4整体的方案去开发大模型。 因为每一层都是分层解耦的,需要哪一层的实现或对应的功能,就只用那一层就可以了。 L0层智算中心OS:面向大模型算力服务的智能算力运管平台,满足多租户以裸金属为主的弹性AI算力运管需求。 其中,高效的裸金属服务可以在几分钟内部署规模达上千的裸金属节点,并按照需求进行扩容,能够一键获取异构计算芯片、IB、RoCE高速网络、高性能存储等环境,同时实现计算、网络和数据的隔离,确保业务的安全性。 L1层PODsys:开源、高效、兼容、易用的智算集群系统环境部署方案。 这一层可以全面覆盖AI集群的部署场景,包括系统环境,从OS、驱动到系统监控可视化、资源调度等。值得一提的是,这是浪潮信息首创的一个开源项目。 下载地址:https://podsys.ai/ PODsys集成了数十个智算集群部署所需的驱动程序、软件和其他安装包,并提供了一系列脚本工具来简化部署过程,而用户只需执行两个简单的命令就能完成整个集群的部署。 就拿模型整套流程中的一环「驱动」来说,不管是上层调优,还是底层调优。 在过去就像是开盲盒一样,对于客户来说A可能适用,而对B并非适用,由此所带来的成本是巨大的。 举个栗子,某互联网客户A在使用AI集群,在对面向推荐场景的AI大模型进行训练时,却发现服务器中的CPU到GPU之间的通信带宽和存储到服务器之间的通信带宽没法同时跑满。 带来的结果就是,模型数据不能及时从存储读取,进而导致GPU空闲和训练性能低下。 面对这一难题,客户A的算法团队用了几个月的时间也没有攻克。 浪潮信息的AI团队介入后,发现客户的场景中,大模型对数据读取IO的需求远超一般的AI模型训练情况,从而导致针对普通模型训练的服务器配置在推荐场景中出现了不适配的情况。 针对这一特殊的需求,基于自身经验,浪潮信息团队对CPU BIOS中的mps等多个选项配置进行了针对性的的修改优化,很好的解决了这一问题。 再比如在环境配置中,也会遇到一些意想不到问题。 为了满足大模型算力需求,某互联网客户B购买多台高端的AI服务器,并沿用之前的使用习惯进行了操作系统和环境的部署。 然而,在运行大模型训练任务时发现,GPU掉卡,OOM等错误频频出现,导致开发人无法正常使用设备。 触发这一故障警报的主要原因就是,客户B操作系统配置中的部分pcie相关参数和当前GPU设备的需求不兼容。 对此,浪潮信息向客户提供了正确的配置参数之后,很快解决了这个问题。 可以看出,大模型算力平台并非是简单算力堆积,还需要解决训练推理效率,系统稳定性等一系列工程问题。 就像Owen ZHU谈到的一样,当智算中心的规模从十几台服务器扩展到几百台,使用难度便会呈指数级上升。 L1层PODsys就像初始化操作系统预装的驱动程序,能够高效部署AI系统,而不用重新开发组件。 它恰恰为AI集群部署提供一个完美的解决方案,即「将工程经验总结成一套工具链式的回答。」 L2层AIStation:面向大模型开发的商业化人工智能算力调度平台。 这一层主要针对大模型训练中常见的「训练中断」难题,能够训练异常快速定位,断点自动续训。 AIStation的核心能力,可以归结为以下3个方面: 1. 在开发环境和作业管理方面 AIStation实现了计算、存储、网络等训练环境的自动化配置,同时允许用户自定义基本的超参数,只需简单几步,就能完成大模型分布式训练。 并且,AIStation还集成了主流的大模型训练框架,包括Megatron-LM、DeepSpeed、HunggingFace上的诸多开源解决方案,实现了秒级构建运行环境。 这样的优势在于,能够帮助开发者在大规模集群环境下便捷地提交分布式任务。 然后,调度系统根据分布式任务对GPU算力的需求,通过多种亲和性调度策略,大大降低构建分布式训练任务技术门槛。 比如,英伟达开发的基于PyTorch框架Megatron-LM能够在AIStation上实现快速部署,训练全程都有保障。 2. 在大规模算力调度方面 能够制定合理的作业执行计划,以最大限度地利用资源,满足训练任务的时延和吞吐需求。 AIStation优化调度系统性能,实现了上千POD极速启动和环境就绪。 另外,针对大模型训练通信要求高的场景,AIStation提供集群拓扑感知能力。通过联合优化,AIStation在千卡集群中能实现90%以上的分布式计算扩展。 比如,就拿GPT-4来说,在大约25000个A100GPU上训练90-100天,算力利用率为32%至36%。 而浪潮信息所打造的「源1.0」训练算力效率则达到了44.8%。 3. 在训练稳定保障方面 健壮性与稳定性是高效完成大模型训练的必要条件。 利用AIStation内置的监控全面的监控系统和智能运维模块,可以快速定位芯片、网卡、通讯设备异常或故障。 进一步,通过对训练任务进行暂停保持,然后从热备算力中进行自动弹性替换异常节点,最后利用健康节点进行快速checkpoint读取,让大模型断点自动续训成为可能。 比如,之前提到Meta在训练OPT-175B模型时反复遇到的训练中断问题。 AIStation就能提供一整套的解决方案,避免类似情况的发生,或者将训练中断造成的影响控制到最小。 L3层YLink:面向大模型数据治理、预训练、微调的高效工具链。 针对大模型开发的2个核心环节——数据处理和模型训练。浪潮信息在YLink中集成了大模型研发中所需的自研工具和开源工具,如数据处理工具包(Y-DataKit)、大模型训练工具包(Y-TrainKit)和大模型微调工具包(Y-FTKit)。 这些多样且完善的工程化、自动化工具,大大加速了大模型的训练和开发效率。 首先是数据的处理。 在LLM出现以前,鲜少有人能预见它背后巨大的想象力。它被视为大模型落地的入场券,军备竞赛中的护城河,AI界的战略资源。 GPT-3.5的文本语料多达45TB,而GPT-4在GPT-3和GPT-3.5训练数据集的基础上,又增加了多模态数据。 想训练出强大的大语言模型,就需要依托充足的高质量数据。数据的数量、质量、多样性乃至清洗能力,都是影响大模型性能的关键要素。 在YLink工具链中,数据生成工具DataGen、数据抽取工具FileQA、数据采集工具Gather、格式转换工具Transform、数据清洗工具Purify,大大方便了开发者的数据处理过程。 这样,数据源和元数据被采集、处理后,就被转换成模型训练所需的数据,也就是得到了「炼丹」的原材料。 在有了「足够高质量」的标注数据之后,就可以进一步为「足够稳定」的模型逻辑推理能力提供支撑了。 接下来,针对大模型的预训练过程,YLink提供了数据处理工具Gather、Transform和Purity以及基于业界主流大模型分布式训练框架NVIDIA Megatron和MS DeepSpeed的大规模分布式预训练参考流程。 ChatGPT能火爆全球,关键的原因之一,是「它能像人一样思考。这背后的原因,就是基于人类反馈的强化学习(RLHF)」。 在微调类ChatGPT模型过程中,主要会涉及三个阶段:有监督微调(SFT)、奖励模型(RM)训练和奖励模型上的近端策略优化(PPO)。 在SFT阶段,模型通过模仿人类标注的对话示例来学习通用的类人对话;在奖励模型训练过程中,模型会根据人类反馈来比较不同回复的偏好;在PPO阶段,根据奖励模型的反馈更新模型,通过探索(exploration)和利用(exploitation)发现最优策略。 同样的,对于模型微调这个阶段来说,数据质量也至关重要。 现在,有了YLink在数据和训练上提供的全方位支持,我们就可以轻松炼丹了。 L4层MModel:提供多模型接入、服务、评测等功能的纳管平台。 对于客户来说,不论是开发大模型,还是调用第三方模型再用数据微调训练,都会遇到一个问题,即不会只用到一个模型。 鉴于当前AI领域各种模型的丰富度,他们会选择把多家模型进行比对,以找到更适合自己的最优解。 而这当中需要经历一个必不可少的过程,涉及到如何管理多模型,如何下载,如何根据自身场景对模型进行自动化评测。 对此,浪潮信息提供了多模型纳管方案,其核心组件包括数据集管理、模型纳管和评测,可以方便开发者和研究人员更好地管理多版本、多类型的基础大模型与任务模型。 并且,通过多样化的评测数据集与评测任务,它可以对多个模型进行生成准确率、推理延迟、推理稳定性等指标的全面评估。 这样,开发者就可以快速部署和应用模型,并且,多模型的纳管可以让我们在保证模型权重、数据集安全的前提下,对外提供API服务。 03.大模型掘金的「秘密武器」 不难看出,OGAI不仅可以保障大模型训练时算力供应的可持续性,而且还充分考虑到了硬件、软件、算法、框架层面引发的训练中断、失效的问题,进而帮助企业顺利跨越大模型研发应用门槛。 这些能力和基础的背后,是来自浪潮信息在30余年深耕硬件行业的积累之上,在AI服务器产品,算力系统优化方面的先发优势。 一方面,率先布局AIGC领域的浪潮信息,是国内为数不多具备了千亿大模型工程实践经验的企业。这使得浪潮信息对于开发大模型的整套流程了如指掌。 未来客户在AIGC工程领域中要踩的坑,浪潮信息已经提前替客户踩了;必须要面对的技术难题,浪潮信息已经提前解决了。客户借助浪潮信息推出的OGAI解决方案,让自己能站在巨人的肩膀上,落地产品和服务。 基于千亿级大模型的工程实践,浪潮信息对于如何高效调度千卡规模的算力,以及保障训练任务的长期稳定运行已经有了丰富的经验。 具体来说,在训练数据层面,浪潮信息的AI团队逐步建立了完整的从公开数据爬取到数据清洗、格式转化、数据质量评估的完整流程和工具链。 通过自研海量数据过滤系统(MDFS),建立从数据采集、粗滤、质量分类、精滤的全自动化的端到端数据工作流程,通过清洗866TB海量数据,获得5TB高质量中文数据集。 在模型训练层面,浪潮信息通过对云原生的调度系统进行了改造,大幅加速其启动速度,并重点解决了RDMA网络在容器中的接入和适配优化,较好地构建了一套能够满足大模型需求的算力调度系统。 另一方面,除了亲自搭建和研发的经验之外,浪潮信息还在服务客户的过程中,解决了各种不同体量、不同赛道的企业在实践中遇到的问题。 在集群架构及软硬件层面,解决了诸多如CUDA初始化失败、GPU掉卡、 p2p Bandwidth Latency延迟过高、NCCL通信性能低,GPU direct RDMA未使能等问题。 2022年以来,浪潮信息的AI团队协助多个客户把大模型训练的GPU峰值效率从30%左右提升到50%。从而大幅加速了模型训练过程。 比如,将系统工程经验,应用于智算中心算力系统,全面优化了集群架构、高速互联网络和算力调度等等。「通过合理设计张量并行、流水并行和数据并行,精准调整模型结构和训练过程的超参数,千亿参数规模的大模型训练算力效率可达至53.5%」。 此外,网易伏羲中文预训练大模型「玉言」,也在浪潮信息的助力下登顶中文语言理解权威测评基准CLUE分类任务榜单,并在多项任务上超过人类水平。 基于丰富的经验积累,浪潮信息能够快速挖掘出客户的痛点,并将需求与现有技术进行有效整合。 最大程度地解决未来客户会的遇到的问题,满足各个赛道不同客户在AI工程领域的不同需求。而这,便是OGAI解决方案正在实现的。 大模型的发展,犹如黑暗森林里的一束光,让整个产业高效迈入AGI。 站在未来10年看如今百模争霸的时代,加快产业进度,就是核心关键。 浪潮信息高级副总裁刘军表示,浪潮信息的初心即是「探索前沿技术,让算力充分赋能大模型训练,以及背后的产业落地化」。 今时火热的AIGC产业机遇中,浪潮信息必然会留下浓墨重彩的一笔。
联想准备造一款新掌机,这不就是 Windows 版的 Switch 吗?
据路透社报道,联想表示受全球个人电脑需求长期低迷的影响, 4 月 至 6 月季度收入下降 24% ,跌幅超出预期,是联想连续第四个季度销量下滑,截止 3 月份的年度利润则下降了 14 % 。这是联想自 2019 年来首次出现年度利润下滑的现象。 此时的联想急需一条新产品线来刺激收入。 爆料显示,联想正在开发自家旗下首款 Windows 掌机,其实早在 2021 届国际消费电子展上,联想就展示了一款名为「Legion Play」的 Android 设备,向消费者展示了其涉足掌机市场的可能性。如今看来,联想选择了 Windows 作为新掌机的内核,并命名为 Legion Go ,将其纳入 Legion 家族。 消息称, Legion Go 搭载了一块 8.8 英寸的 QHD+ ( 2560 x 1600 ) 屏幕,且支持 144Hz 刷新率,后者对于 Windows 掌机来说算是标准配置,毕竟「1 帧能玩, 3 帧电竞」的说法不适用于 PC 玩家。但 QHD+ 屏幕可就不常见了。受限于掌机电池大小,厂商们通常会采用分辨率较低的屏幕以保证掌机续航表现。联想却反其道而行之,以「我全都要」的气魄,把高清和高刷同时给予玩家。 这股气魄来源于 Legion Go 最高 65W 的充电功率,虽然 49.2Wh 的电池容量没有和主流竞品拉开太大差距,但联想希望以更高的充电速度提升玩家的使用体验。 机身重量在分离手柄时 640 克, 连接手柄时 854 克。是的你没看错, Legion Go 采用了和 Switch 一样的分离式手柄设计。与 Switch 不同的是,联想给手柄加入了一块触摸板和四颗按键,提供用户丰富自定义功能的同时,兼顾便捷性。 搭配上机身的 USB 4.0 接口,这款产品也能拥有和 Switch 一样的主机模式。除此之外,联想可能想以此让这款掌机拥有多功能属性,比如拆卸手柄后变成一台平板电脑。 Legion Go 搭载了 AMD Ryzen Z1 Extreme 芯片,这是 AMD 今年新出的 Windows 掌机芯片。据官方介绍,这块芯片能在 720P 的分辨率下,以 60 帧游玩《荒野大镖客 2》等大型 3A 游戏,对于手持设备来说,这表现的确亮眼。如果爆料属实,Legion Go 将是今年第二款搭载该芯片的机型。(第一款是华硕的 ROG Ally) 与高性能芯片相匹配的,是 Legion Go 背面和顶部的超长通风口,所以至少在物理层面, Legion Go 有不俗的散热能力。但不确定这款设备的风噪控制怎么样,应该没人会想在玩游戏的时候一直听到「呼呼」的风声吧。 Legion Go 提供 256G 、 512G 和 1TB 三种可选存储空间的同时,带有一个 SD 卡插槽,支持最高 2TB 的容量扩充。 目前看来联想 Legion Go 会是一款兼顾高性能和多功能的 Windows 掌机产品,它给用户提供了至少三种使用场景(主机、掌机、平板),799 美元(约 5800 人民币)的起售价对于这款产品来说也不算很离谱。 跟着主角一起登场的还有一款「One more thing」,据外媒报道,联想会同时推出 Legion Glasses ,一款用了 Micro OLED 技术的 AR 眼镜,这款 AR 眼镜虽然是 Legion 家族的一员,但它支持连接任何拥有 DP Alt 模式的 USB-C 设备。也就是说,用户可以单独购买这款 AR 眼镜,搭配自己已经有的设备使用。 Legion Glasse 售价将定为 499 美元(约 3600 人民币)。
realme宣布“五年计划”,冲击高端市场,发布真我GT5,2999元起
作者 | 云鹏 编辑 | 李水青 智东西8月30日消息,近日realme发布了真我GT5智能手机新品,其搭载了第二代骁龙8,支持24GB内存和240W快充,硬件配置可以说是“拉满”。此次realme还发布了真我Buds Air5、真我Buds T300等IoT新品。 今年是realme成立五周年,其副总裁徐起登台进行了演讲。徐起说,五年来realme手机销量从“Others”进入了全球前十,在21个国家销量跻身前五,是全球成长最快的智能手机品牌之一。 演讲中徐起宣布了真我realme的“五年计划”,包括围绕“性能、影像、设计”三个方向进行技术创新、深耕2000-4000元价位段并突破中高端、未来五年覆盖全球百大市场。 价格方面,真我GT5 240W版24GB+1TB售价3799元,真我GT5 150W版12GB+256GB售价2999元。真我Buds Air5售价为299元,真我Buds T300售价为199元。 回到具体的产品,此次真我GT5联合比亚迪电子首发了新的玻璃工艺背板。其玻璃背板研发生产历时超过了1年,据称投产成本是到普通玻璃机身的4倍。在四种复杂工艺加持下,真我GT5以40°曲率实现了相机DECO与后盖的过渡。 屏幕方面,真我GT5搭载了一块6.74英寸144Hz屏,边框最窄处1.46mm,支持Pro-XDR高动态显示,在相册浏览高动态范围范围影像时,可激发到8倍动态范围。 性能是这款产品的重点优势项,真我GT5搭载了第二代骁龙8以及24GB+1TB的内存组合。 值得一提的是,真我GT5支持用户在游戏中自定义调节CPU各核心的频率上限,大核最高可拉到3.2GHz,进一步释放性能。 此前真我机型中搭载的独显芯片X7,依然沿用,可以实现110款游戏144Hz+1.5K双开。 充电续航方面,realme是今年首发量产240W快充的厂商,真我GT5搭载了SUPERVOOC S电源管理芯片,可实现99.5%的放电效率。 值得一提的是,真我GT5提供了150W+5240mAh电池组合的版本,150W快充最快18分钟可充满。 影像方面,真我GT5搭载了IMX890 OIS大底主摄。此外,真我GT5三频GPS车道级定位系统,三频GPS以及四频北斗,可实现亚米级导航与车道级定位。 结语:死磕性能、聚焦性价比,realme向高端冲刺 此次真我GT5在性能方面进行了一些技术创新,进一步释放了芯片性能,并通过工艺的提升进一步提升了产品的品质感,这与realme希望冲击高端市场的方向不谋而合。 此前realme一直以性价比为突出特点,其产品以中低端市场为主,五年后,realme也准备向高端市场发起冲刺,但高端市场竞争更为激烈,realme仍将面临不小的挑战。
要涨价?内存、闪存同时需求大涨
这两年,DRAM内存芯片、NAND闪存芯片都需求疲软,导致价格持续处于地位,内存、SSD硬盘产品也越来越便宜。 不过,这种好日子似乎要结束了。 根据集邦咨询最新研究报告,预计在2024年,内存、闪存原厂仍然会延续减产策略,尤其是亏损严重的闪存,但与此同时,至少在2024年上半年,消费电子市场需求仍不明朗,服务器需求相对疲弱。 由于内存、闪存市场在2023年已经处于低谷,价格也来到相对低点,因此预计在2024年,内存、闪存芯片的市场需求将分别大涨13.0%、16.0%,相比今年高出大约6.5个、5.0个百分点。 虽然这依旧远不如2020-2021年的势头,但总算缓和了不少,只是要想有效降低库存、恢复供需平衡,还得看原厂减产力度如何,控制得当的话有机会实现价格反弹。 2024年,预计PC内存平均容量增长约12.4%,尤其是随着Intel Meteor Lake处理器的到来,不再支持DDR4,将推动DDR5内存在明年下半年成为主流。 PC SSD平均容量预计增长仅约8-10%,512GB笔记本长期是主流,1TB普及还不够快。 手机内存平均容量预计增长约14.3%,明年再涨7.9%,但一方面智能手机市场疲软,预计2024年出货量只会增长约2.2%,而且移动内存平均价格仍然处于地位。——知道为啥敢做24GB手机了吧。 手机存储容量预计增长约13.0%,但受成本限制,1TB以上的中低端机型暂时不会多,而且QLC闪存一直没有获得认可,手机空间增长将会比较缓慢。
老对手变成好朋友,三星和 LG 准备为智能家居组个局
哪天你想看电视但突然找不到遥控,于是想让小爱同学帮你打开电视,可开口时口误,喊成了「嘿,Siri,帮我打开电视」,这时 Siri 回答「我不明白你在说什么」,最后你只能以「人工智能」中「人工」的方式打开电视。 在智能家居市场不断扩大的环境下,碰到这个场景的消费者应该不在少数,根据 statista 发布的报告预测,全球智能家居市场规模预计将从 2022 年的 1261 亿美元增长到 2026 年的 2078 亿 美元,并以 13.30% 的年复合增长率增长。 市面上智能家居品牌增加,不同品牌间的产品大多无法互通。不同品牌的「智能」相互碰撞,带来的是消费者的无奈「人工」介入。 市面上搭载通用协议的设备不少,可由于目前的通用协议是以硬件方式内置在产品中,所以消费者无法通过升级系统来获得协议。要想用上的话,我们只能重新购买有通用协议的产品。 使用私有协议的方式捆绑消费者这件事并不新鲜,各厂商都在努力打造属于自己的生态,但这种做法无疑会给多生态用户造成麻烦。 好消息是,终于有厂商准备解决这个痛点了,在昨天的 IFA 科技展上三星和 LG 宣布,2024 年前,用户无需升级硬件,即可享受三星和 LG 产品间的互联控制。也就是说用户只要更新了最新系统,就能获得不同品牌智能家居互联的功能。 为了达成这个目标,2021 年三星作为创始成员之一组建了 HCA(Home Connectivity Alliance),旨在创造一个新的智能家居互联协议。该协议采用云端技术,以此让不同品牌产品实现互联,这样做的好处是产品无需通过硬件搭载协议,一次简单的 OTA 就能使其获得互联功能, HCA 成立前发布的老设备也是如此。这是 HCA 协议与别的互联协议最大的差异之一。 HCA 协议给消费者提供了一种成本低且更简便的智能家居互联模式, 这同样是 HCA 不加入其他互联协议的原因之一,他们认为此前的互联方式成本过高,导致普及率降低 —— 不是所有消费者都愿意为了互联功能而去购买新一代产品。 但目前 HCA 协议的普及还在起步阶段,三星和 LG 是 HCA 协议发布后唯二公布支持该协议的公司,而且只会在韩国、美国、英国、德国、法国、意大利、西班牙和土耳这八个国家推出实行。 不过倒也不用担心,HCA 宣称会持续开放加盟渠道,且在 2025 年之前,会有更多成员公司支持该协议,并在其他国家推出,面向更多消费者。对了,15 名成员公司中除了三星和 LG 外,还有中国家庭熟知的「光屁股兄弟」——海尔。但遗憾的是,中国智能家居市场份额最大的米家目前不在成员名单内。 云端技术的好处固然很多,可弊端也存在。米家 2022 年 6 月因为服务器崩溃,导致很多用户在微博抱怨「找了一晚遥控器」,「米家崩了」的话题甚至被顶上微博热搜。一方面我们可以看出米家产品的超高普及率,一方面也显示了云端技术的弊端——一旦服务器故障,被影响的用户量可能破亿。 我们只能希望 HCA 在给消费者提供方便的同时,加强云端建设,尽量减少「找遥控器」的事件发生。
李斌曝出蔚来致命软肋,新品牌明年发布,手机 9 月开售
ES6 卖得这么好,为什么蔚来的营收还比上个季度少了 20 个亿? 蔚来刚发布今年二季度财报,就有朋友向我抛来了这个问题。 的确,从蔚来今年的表现来看,这家新势力车企中的「种子选手」理应获得更好的成绩。蔚来今年不仅成功让全线产品迭代至 NT2.0 平台,新推出的 ET5T、ES6 也十分火爆。 那为何在短短 3 个月内,蔚来就少赚了 20 亿元?面对营收大幅下滑和巨额的经营亏损,财报电话会里的李斌,展现出一如既往的真诚,没绕一点弯子,直接点明了蔚来的「软肋」。 但在深入了解其中原由之前,还是得先来翻一下这份长达 36 页的财报。 赚得少,花得多 蔚来二季度的收入总额为 87.72 亿元,同比下降 14.8%,较上一季度少了 17.8%,直接回到了 2 年前的水平。蔚来的营收由「汽车销售」与「其他销售」两部分构成,其中汽车销售带来的收入为 71.85 亿元,占比 81.9%。 成本方面,蔚来二季度销售成本总额达到了 86.85 亿元,毛利仅有 0.87 亿元,毛利率只有可怜的 1%,环比下降了 50 基点。 唯一值得欣慰的是,蔚来的汽车毛利率从一季度的 5.1% 提升到了 6.2%,对此,蔚来表示原因在于上一代 ES8、ES6 以及 EC6 的促销折扣有所减少;客观来看,也与其度过了 NT1.0 到 NT2.0 换代阵痛有关,产能利用率得以恢复。 但要注意,6.2% 的单车毛利率并不算健康,去年的这个时候,蔚来的单车毛利率是 16.7%——这个数字才勉强算得上健康。 蔚来单车毛利的大幅下降,与持续的高投入有直接关系——蔚来的研发支出连续 3 个季度突破 30 亿元,而这一季度的数字是 33.4 亿元,远超小鹏的 13.7 亿元和理想的 24.3 亿元。 这么多钱,蔚来都花到哪里了?首先是软件方面。 蔚来在今年 6 月的最后一天,发布了蔚来智能系统 Banyan 2.0.0。这次升级包含加电路线自动规划、专属服务、NOMI 记事、ISS 智能舒适刹停、RPA 遥控辅助泊车、MAI 误加速抑制辅助等超过 120 项新增功能及体验优化。 同时,伴随 Banyan 2.0.0 的发布,NOP+增强领航辅助也摘掉了 Beta 的「帽子」,升级成了正式版,启用了全新的 BEV 感知模型,在复杂场景里有着更强的博弈和控制能力。 CEO 李斌表示,蔚来会在接下来的几个月里逐步释放 NT2.0 平台的一些软件功能,自动驾驶功能也会部分落地。 硬件层面就不用多说了,如今的蔚来有着「蔚小理」中最丰富的产品线,瞄准移动互联的蔚来手机也将在 9 月下旬交付,还有不断扩张的充换电网络,这些全都要花钱。 另外别忘了,蔚来的入门级子品牌「阿尔卑斯」,也在路上。 李斌在财报电话会中透露,阿尔卑斯的首款产品将会在 2024 年下半年发布,目前已有媒体车下线,第二款车型的开发也已开始。 开发很顺利,(阿尔卑斯)非常有市场竞争力。 聊到这辆新车时,李斌显得颇为自信。 疯涨的交付量,暴露了蔚来的「软肋」 从蔚来二季度的交付量来看,李斌的乐观也是有道理的。 财报显示,蔚来二季度的汽车交付量达到了 23520 辆,其中 SUV 占比 44.6%,轿车占比 55.4%,为 13028 辆。 尽管从数据上来看,蔚来二季度的交付量较一季度下降了 24.2%,但蔚来在这一季度的低迷期,只存在于 4 月和 5 月(交付量分别为 6658 辆和 6155 辆),伴随着 ET5T 的交付,蔚来在 6 月迎来了自己的「花期」,单月交付量重回万辆级别,达 10707 辆。 除了新车型带来的需求释放,蔚来在 6 月的销量回暖与其新出台的权益政策不无关系。 6 月中旬,压力之下的蔚来对购车政策进行了调整,解绑了免费换电权益,全系车型降价 3 万元,成功为自己续上了一口气,展现了逆势而上的苗头。 随后的 7 月,全新 ES6 也迎来了交付期,在新政策的加持下,全新 ES6 的价格来到了 35 万元以内的市场区间,成为了蔚来 SUV 车型的走量主力。在 7 月,蔚来的单月交付量环比暴增 91.1%,累计向用户交付了 2.04 万辆新车,突破历史新高。全新 ES6 也成功创下了蔚来的单车型月度交付纪录。 不过,随着交付量的上涨,蔚来最致命的问题也开始显露,那便是渠道。 李斌在财报电话会中坦言: 蔚来的销售人员在数量和能力上远远落后于市场的竞争对手。 众所周知,蔚来品牌主打 30 万元以上的高端纯电市场,直接的竞争对手便是奔驰、宝马、奥迪三个主流高端品牌。尽管蔚来如今在高端纯电市场已经拥有了 59% 的份额,但其渠道和销售能力远不及在中国市场摸爬滚打多年的 BBA。 李斌表示,奔驰、宝马等主流高端品牌的销售人员数量是蔚来的 6-7 倍,而销售人员在数量上的不足会直接影响到用户满意度,同时也无法满足 8 款车型同时销售的需求。 虽然我们在服务方面的投入,包括换电站、道路服务、牛屋的服务人员以及社群的人员是多的,但是在店里的用户顾问比同行少,落后于计划。 销量火爆的 ET5T 和 ES6 让蔚来意识到了人手不足的问题,并开始在 7 月份着手解决。解决方法无非就两个:招人、开店。 李斌表示蔚来将会在 9 月底初步达成 5000 人的招聘目标,经过一段时间的培训,在 10-11 月形成足够的销售能力,而蔚来的单月销能目标是 3 万辆。 另一方面,渠道下沉也是一个紧迫的任务。 目前,江浙沪三省占了蔚来销量的一半以上,省会城市的销量则占据了本省的 80-90%,三线城市覆盖率低下,在不知不觉中丢失了许多市场。 只要解决了招人和开店这两个问题,蔚来的交付量必然还会上一个台阶。蔚来预计,今年三季度的交付数量将在 5.5 万辆至 5.7 万辆之间,同比增长 74% 至 80.3%。与此同时,营收水平也将大幅提升,预计营收 189 亿元至 195.2 亿元,同比增长 45.3% 至 50.1%。 李斌认为,8 款车型中最应该关注的是 ET5、ET5T、ES6、EC6 这 4 款车型的交付量,4 款车型的月度交付总量预计会在 1.5 万辆至 2 万辆之间。 换电,也是一个赚钱的路子 在李斌看来,蔚来要想把车买好,还有一件极为重要的事——扩大充换电网络。拓宽销售渠道固然重要,但要想达成转化,换电模式的便利性不得不提。 蔚来用户有多喜欢换电?蔚来联合创始人、总裁秦力洪此前在 NIO Power Day 里给出了具体的数据: 在 2022 年开年之际,蔚来用户的换电渗透率首次突破了 50%。而在今年 6 月,这一数字已经来到了 60%,换电成为了蔚来车主最爱的补能方式。即便是无法享受免费换电的蔚来二手车车主,也很乐意去付费换电。 因为车价便宜,而且换电也不算太贵。 蔚来二手车工作人员舒生向董车会表示,部分二手车用户由于在购车时享受了较为优惠的价格,因此更愿意为换电买单。 诚然,换电渗透率的迅速提升与每月 4-6 次的免费换电政策不无关系,但随着这一政策的取消,以及新车主的不断加入,付费换电的比例也越来越高。 为了满足蔚来用户的换电需求,蔚来在 6 月份开始加速换电站的建设,单月新建超过 100 座换电站。根据蔚来在 2 月份透露的信息,该公司今年计划新增 1000 座换电站。 从长远来看,换电站也将成为蔚来独有的一种盈利模式。李斌在会议中表示,第三代换电站单日换电次数超过 60 次,即可实现盈利,目前已有 20% 的三代站达到了盈利标准。 同时,对于自家的换电网络,蔚来始终都保持着一个开放的态度。 李斌相信,蔚来的换电模式能够帮助行业加快电动化转型,蔚来也欢迎其他汽车品牌加入他们的换电网络。「目前有在和其他公司进行初步讨论,但是要加入换电网络,需要对车进行新的开发和改造,这需要时间。」
我在印度跑“滴滴”送外卖,比白领工资高一半
前段时间,印度的拉贾斯坦邦通过了《 2023 年平台零工(注册和福利 )法案 》。 正式宣布,将在当地成立一个福利委员会和专门的社会保障基金,为零工提供社会保障。 印度的媒体说, 这个法案是【 里程碑意义 】的。 之所以,这项法案会有如此高的评价,是因为在这个法案的背后,藏着印度爆炸增长的零工人数。 零工直白粗暴地翻译,就是打短工,不签署长期劳务合同的人。 拉贾斯坦邦这一个邦,就有超过 40 万的零工工人。而在整个印度,约有 770 万名,到 2030 年,规模更是将扩大到 2350 万。 可能你看这个人数,会觉得也没多少。但是,比较夸张的是,印度几乎一半以上的新岗位,都是零工工作。 根据经济学教授巴尼克估计, 56% 的新就业机会都由 “ 零工经济 ” 提供的。 甚至,很多原本的白领们,都在转向打零工、做兼职。 仅仅 2022 年,白领参与零工经济的人数就增长了 240% 。 而在这些数字背后,占比最大、人数最多的是网约车和送外卖。 为什么在印度开网约车和送外卖这么吃香?甚至连白领,都跑去送外卖了。。。 为了搞清楚,差评君就动用人脉找了好几个印度好哥们,一问真假。 最后得到的答案,是齐刷刷的一列:It's real. 而且涌去跑网约车和送外卖,其实很早就开始了。 2016 年前后,这两个行业都是收入非常可观的业务。尤其是 Uber 和印度版 “ 滴滴 ”Ola 在印度市场掐架的时候,各家补贴力度都很大。 2016 年 Uber 就毫不客气地打出了 “ 一个月赚 10 万卢比 ” 的广告。 10 万卢比是啥概念? 相当于八千多人民币,几乎是当时印度平均收入的 10 倍多。 就算到了 2022 年,印度的平均工资也才 3.3 万卢比。而且,大部分人还没有办法达到这个水平线。 所以,虽然 Uber 还需要你支付汽车的租赁贷款费用,但收入已经比普通印度家庭要高出一大截。 而根据 Willis Towers Watson 发布的全球 50 强薪酬规划报告,印度专业白领的平均工资,每月是 6.9 万卢比。 这就是为什么越来越多的白领,放弃原本安定的工作和福利保障,开始买车跑出租。 送外卖的工作也是一样,虽然收入不如网约车,但广告也能打出一个月赚 4.5 万卢比,和周围人的基本工资一比,也算相当可观了。 而且,门槛更低,只要一辆自行车,你就可以得到这份工作。 收入高,工作时间又很自由,工作门槛又很低,这么香的活,谁不想干呢。 不过,好日子并没有过得太久。随着进入行业的人越来越多,池子越来越满。 不用差评君点破,大家应该也能猜到,接下来会发生什么。 资本开始勒紧裤腰带了。 先是一些新冒头的外卖平台开始出现了,比如印度现在最大的杂货平台之一 Zepto 。他们主打的不是半小时内送达,而是 10 分钟送达。 甚至,一开始的时候,他们打出来的招牌是 9 分钟送到家门口。 后来据说是因为时间紧迫造成快递员压力山大而容易出事故,才改为 10 分钟。 这个速度卷得连中国人看了,都得喊一声够狠。 不仅仅是 Zepto ,其他家也都在压缩自己的配送时间。 在这张表上,你能看到几乎没有超过 30 分钟的配送时间。尤其是百货,基本都要控制在 10 分钟。 一边压缩配送时间,一边在骑手的收入也在减少。 印度一家大型杂货 APP Blinkit ,率先把配送员的单价压缩到了 25 卢比。 公告一出,工人立马就不买账了,开始大面积地罢工。 别以为故事到这就结束了。更让人大跌眼镜的是,后来 Blinkit 被印度版饿了么 Zomato 收购,配送价被进一步压缩到了 15 卢比。。 讽刺的是,广告里 Blinkit 打出了月入 3.7 万的承诺。 差评君算了一下,如果想要达到广告宣传里的收入,一天要送 80 多单,连送 30 天。 而且,看到 Blinkit 降价之后,其他配送公司开始跟上这股降价的风潮。 印度第二大的外卖平台 Swiggy 在一年时间里,连续两次降价,从 35 卢比的单价,降到 15 卢比。 再加上骑手数量暴增,也使得大家能接到的单子变少了。 根据凤凰 Weekly 的报道,有的骑手说因为工人数量暴涨,基本上一个小时才能接到一个单子。 到了网约车市场这边,情况也没有好到那去。 早期的扩张结束后,补贴该取消的取消,佣金该降的就降。 2018 年,新德里交通部有规定过,空调出租车的基本票价是每公里 16 卢比。 但到了后面,司机的基本票价,甚至都没法够到法规的最低线。很多司机说,实际只有 10 卢比到 12 卢比。 半数以上的司机每天开 15 小时以上的车,但越开,到手的钱越少。 2016 年,平均收入还能稳定在每月 7 万到 10 万卢比,但现在再去招聘网站看薪资预估, Uber 司机平均月薪只剩 2.7 万卢比了。 比单价压低的情况更严峻的,是刹不住车的油价。 85% 原油都依赖进口的印度,只能紧紧跟着国际油价的浮动变化。一个月涨幅 10% 以上,都是家常便饭。 油价飙升,导致运输费用增加 现在柠檬都被捧成了奢侈品 深受油价折磨的印度网友们,甚至开始苦中作乐,疯狂玩梗。 比如在印度能加的起一整箱油的人,就能喜提 Fiilionnaire ( 加油富翁 )的称号。 不过,玩梗归玩梗,那些看油吃饭的人,日子就不好过了。 司机们起码有四分之一的收入,要花在油费上。每单平台又要抽走 25%-30% 的佣金。 而且,很多司机的车都是从 Uber 和 Ola 租赁的,每个月还需要偿还租金。 更有一些人,在广告的诱人宣传后,选择了高价买车。最后的结果,就是被困在了贷款和油价里。 在一些论坛上,能看到很多人在吐槽,如果想保持住收入,他们一天都不能休假,也没有生病的权利。 眼看着口袋里的钱越来越少,司机们也不是没有抗争过。 就在去年,为了对抗出租车公司,印度的网约车司机联合会,在发起了一场 “ 不开空调运动 ” 。 。。对,没有开玩笑。就是不给乘客开空调,以此来抗议网约车的低价和高抽成。 而且,抗争最后还真的起效果了。Uber 把首都新德里的出行价格提高了 12% ,把孟买的出行价格提高了 15% 。 但是,更多抗议的人更希望的是,政府能够出手限制平台的抽成和票价。 他们到底能不能获得成功,可能需要画上一个问号。 因为印度交通部长给联盟的回复是:出租车服务正在提供就业机会,我们不应该制造麻烦。 他说的并没有错,甚至在很长一段时间里,网约车、外卖行业,都被吹捧为 “ 救世主 ” 。政府觉得这是解决就业危机的解决方案,民众也以为这是解燃眉之急的救星。 零工的服务产值,将在 2030 年增长到约 2500 亿美元,为印度 GDP 贡献约 1.25% 的增量。 而到了这个时候,大家跑去网约车和外卖,已经从早期为了高收入,转向了糊口和生存。 根据国际劳工组织的数据显示,印度每 10 个工作岗位中,得不到福利保障的灰色岗位,足足占到了九个。 在一些网约车和外卖报道视频中,你能看到各种各样的人。 失业的、半工半学的,能看头发已经有点发白的人,也背着红色的外卖箱。 你甚至可以看到凌晨的时候,还有很多的外卖小哥跑在路上。 印度朋友 Bitstar 和我说,自己的朋友白天上班,到了晚上就开始送外卖,每天都要送 4-5 个小时。 因为到了晚上,平台会有额外的补贴激励。 很多人都把印度庞大的年轻劳动力,当成人口红利的资本。 但是,在这个数字的另一面,对应的是政府每年都需要为进入劳动力市场的数百万人,创造足够的就业机会。 在跟印度年轻人交流的过程中,你能明显感觉到他们的焦虑。 当问到什么工作是最好的,所有人都和差评君说: 做私人工作,就是一辈子都在挣扎,只有得到一份公务员的活,才是最好的选择。 在差评君采访的人中,有一个青年一边在攻读加尔各答大学的政治学硕士,与此同时还在一所公立学校教书。为了补贴开支,又兼顾着直播的工作。 但是,他依然为自己没有得到一份更稳定的工作而懊恼。 谁看了,不想说一句,真的很拼。。 撰文:四大 编辑:江江 & 面线 封面:焕妍
华为Mate60 Pro太给力了Mate50滞销,网友:降价就行
【手机中国新闻】8月29日,绝大部分人都没有预料到,华为在当天直接开售了Mate60 Pro的12GB+512GB版本。虽然没有太多的官方宣传,但是该机的问世直接引爆了话题,该机也成为了当天讨论度最高的手机。而8月30日,手机中国注意到,似乎是因为华为Mate60系列实在太给力了,有博主吐槽,Mate50成了滞销库存。 有博主表示,他们在上个月接到通知说华为Mate50系列全线停产,在上周又接到通知说华为Mate60系列有5G版本,让清库存。结果华为Mate60 Pro突然开售,吸引了大量消费者的关注,Mate50成为了滞销库存。目前,在各个电商平台上,仍然有大量的华为Mate50系列机型在售。对于这种情况,有网友表示:这个其实问题不大,降价就行! 事实上,产品更新是很正常的事情。一般情况下,同一个系列的机型中,新机型问世之后,老机型的产品力是不如新机型的。由于问世时间较长,它们的关注度也不如新机型。因此,有些厂商会选择通过降价的方式,来提升老机型的产品力,清理老机型的库存。如果你现在想入手一款华为旗舰机型,预算又有些吃紧的话(华为Mate60 Pro售价为6999元),其实可以关注一下华为Mate50系列的老款旗舰,它们仍然是非常不错的产品,昆仑玻璃和卫星消息等也都是非常实用的配置和功能。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。