行业分类:
加载中...
头条分类:
加载中...
全球AI面临6000亿美元难题,人工智能泡沫正在接近临界点!
新智元报道 编辑:Aeneas 好困 【新智元导读】AI基础设施的巨额投资,和实际的AI生态系统实际收入之间,差距已经到了不可思议的地步。曾经全球AI面临的2000亿美元难题,如今已经翻成了6000亿美元。 现在,业内关于AI模型收入的质疑声,已经越来越大。 动辄投入几万亿美元打造基础设施,跟部分国家的GDP不相上下,然而从AI模型中得到的回报,究竟能有几何? 在2023年9月,来自红杉资本的David Cahn发表了一篇名为《AI的2000亿美元问题》的文章,目的是探讨:「AI的收入都去哪了?」 根据报告,当时AI基础设施建设的预期收入,和AI生态系统的实际收入增长之间存在巨大差距。同时,这也反映了终端用户的价值。 对此,他解释道:「每年需要填补1250亿美元的空缺,以应对当前的资本支出水平。」 随着英伟达一度成为全球市值最高的公司,如今的「2000亿美元问题」是解决了,还是更加严重了? 结果出乎意料:AI的2000亿美元问题,现在已经变成了6000亿美元问题。 2000亿美元问题,直接翻了3倍 最近,David Cahn再次发表博文,对全世界提出警告:人工智能泡沫,如今正在接近临界点! 他列出了下面这张表格,并且详细解释了6000亿美元是怎么算出来的。 计算这个指标其实很简单。你只需将英伟达的年化收入预测乘以2倍,以反映AI数据中心的总成本(GPU占总成本的一半,另一半包括能源、建筑、备用发电机等)。然后再乘以2倍,以反映GPU终端用户的50%毛利率(例如,从Azure、AWS或GCP购买AI计算资源的初创公司或企业,他们也需要盈利)。 那么,自2023年9月以来发生了什么变化呢?David Cahn进行了以下总结。 1. 供应短缺已经缓解 2023年末是GPU供应最紧张的时候。当时,初创公司纷纷联系风险投资公司,甚至任何愿意帮助他们的人,只为获得千金难求的GPU。 如今,这种焦虑几乎完全消失了。如今的现状是,获取GPU变得很容易,交货时间也非常合理。 2. GPU库存正在增加 英伟达在第四季度报告中指出,其数据中心收入中约有一半,都来自大型云供应商。仅微软一家公司,可能就占了英伟达第四季度收入的约22%。 如今,超大规模的资本支出正达到历史新高。 这些投资也成为了大科技公司2024年第一季度财报的主要亮点,CEO们明确表示:「无论你们喜不喜欢,我们都会投资GPU。」 在业内,囤积硬件已经不是什么新鲜事了,一旦库存增加到足以减少需求,就会引发市场调整。 3. OpenAI仍然占据AI收入的最大份额 《The Information》最近报道,OpenAI的收入已增至34亿美元,在2023年末,他们的收入还是16亿美元。 虽然也有一些初创公司达到了不到1亿美元的收入规模,但显然,跟OpenAI相比,它们还在努力追车尾。 除了ChatGPT,今天消费者真正使用的AI产品有多少呢? 如果需要付费,每月15.49美元的Netfix,或者每月11.99美元的Spotify,岂不更香? 从长远来看,AI公司提供的价值需要足够显著,才能让消费者有持续的掏钱意愿。 4. 1250亿美元的空缺现在变成了5000亿美元的空缺 在上次分析中,David曾经做过这样一种乐观的的假设:每年,谷歌、微软、苹果和Meta能从新产生的AI相关收入中获利100亿美元。 他还假设,甲骨文、字节跳动、阿里、腾讯、X和特斯拉每家能产生50亿美元的全新AI收入。 即使这些假设仍然成立,并且再增加几家公司到名单中,那么1250亿美元的空缺,现在将变成5000亿美元的空缺。 5. B100即将到来 今年早些时候,英伟达官宣了B100芯片,它的性能提高了2.5倍,而成本却仅仅增加了25%。 David预计,这将最终导致对英伟达芯片的需求激增。 因为B100在成本与性能上较H100有显著提升,可能会导致今年晚些时候的又一次供应短缺,到时候大家都会争相抢购B100。 在GPU资本支出中,我们忽略了什么 有人反驳上一篇文章时说道:「GPU资本支出就像修铁路,火车最终会来,目的地也会出现——比如新的农产品出口、游乐园、购物中心等等。」 对此,David表示赞同,但也提出了他们忽略的一些问题。 1. 缺乏定价权 在物理基础设施建设中,所建的设施本身是有一定的内在价值的。 如果你拥有从旧金山到洛杉矶的铁轨,你可能会有某种垄断定价权,因为在A地和B地之间,只能铺设有限的铁轨。 而在GPU数据中心的情况下,定价权则要少得多。 GPU计算,如今越来越像是一种按小时计费的商品。 不同于成为寡头垄断的CPU云,后来者正在持续不断地涌入市场,建设专用的AI云。 在没有垄断或寡头垄断的情况下,高固定成本+低边际成本的业务,价格竞争下降到边际成本几乎会成定局(比如航空公司)。 2. 投资焚烧率 即使在铁路建设中,投机性投资狂潮也往往会导致极高的资本焚烧率。 在新技术出现时,也是如此。 在关于技术投资的最佳教科书之一《推动市场的引擎》中,得出的主要结论是:在投机性的技术浪潮中,很多人损失了大量资金。(比如铁路) 想要找出赢家很难,但要找出输家,则容易得多。(在铁路的情况下是运河)。 3. 折旧 从技术历史中我们知道,半导体的发展会越来越好。 英伟达还将继续生产更强的下一代芯片,如B100。这将导致上一代芯片更快的折旧。 因为市场低估了B100和下一代芯片改进的速度,它高估了今天购买的H100在3-4年内保价的程度。 不过,这种情况在物理基础设施中是不存在的,因为物理基础设施不会遵循任何摩尔定律曲线,成本与性能也不会持续改进。 4. 赢家与输家 现在,我们需要仔细看看谁是赢家,谁输家——在过度的基础设施建设期间,总是会有赢家的。 David认为,AI可能是下一个变革性的技术浪潮,而GPU计算价格的下降,实际上对长期创新和初创公司是有利的。 如果他的预测成真,主要受损的就是投资者了。 而创始人和公司建设者将继续在AI领域创新,因为他们将受益于更低的成本,和在这一实验期间积累的经验教训。 因此,他们更有可能成功。 谁为终端用户提供价值,谁就会获得回报 显而易见,AI将带来巨大的经济价值。那些专注于为终端用户提供价值的公司,终将获得丰厚的回报。 如今,我们正处在一个有潜力重新定义一代人的技术浪潮中。 像英伟达这样的公司,在这一变革中功不可没,并且很可能在未来很长一段时间内,都会继续在生态系统中扮演关键角色。 投机狂潮是技术发展的一部分,因此不必害怕。 在这个时刻保持冷静的人,有机会建起极其重要的公司。 但是,我们需要警惕那种从硅谷蔓延到全美,甚至全球的幻想:我们都能快速致富,因为AGI明天就会到来,我们都需要囤积唯一有价值的资源——GPU。 实际上,前方的道路将会很长。 它会有起伏,但可以肯定的是,这条路是值得走的。 参考资料: https://www.sequoiacap.com/article/ais-600b-question/
这个首创来自中国 AI 公司,能分钟级精准控制人物的视频大模型来了 | WAIC 2024
商汤科技又整大活了,只需一张照片就能生成一分钟视频。 7 月 4 日,由商汤科技打造的首个面向 C 端用户的可控人物视频生成大模型——Vimi 入选世界人工智能大会(WAIC)展览展示最高荣誉「镇馆之宝」,成为本届大会最具创新展品。 基于商汤日日新大模型,Vimi 仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。 随着大模型和生成式 AI 技术的迅猛发展,让静止的照片「活」起来已不再是难事。 然而,市面上现有产品在实际应用中仍存在诸多问题,如动作和表情控制不精准、效果稳定性差、视频时长受限等,这些限制了视频创作者的创作空间。 为了突破这些瓶颈,商汤科技推出了可控人物视频生成大模型——Vimi。 与图片表情控制类技术只能控制头部表情动作不同,Vimi 不但可以实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。 同时,Vimi 还能合理生成光影变化,使得人物动作和视觉效果流畅自然,画面和谐唯美。 更重要的是,Vimi 能够稳定生成长达 1 分钟的单镜头人物视频,画面效果不会随时间推移而劣化或失真,充分满足娱乐互动等场景对长时间稳定视频的需求。 日日新官方表示,Vimi 将完全面向 C 端用户开放使用,尤其能够满足广大女性用户的娱乐创作需求。 用户只需上传不同角度的高清人物图片,即可自动生成数字分身和不同风格的写真视频。 由 Vimi 生成的视频人物不再只是呆板的五官运动,而是搭配手势、肢体、头发等,形成更完整、统一的人物动作,让创作者可基于生成的视频素材进行剪辑和再创作。 对于喜爱自拍的用户,Vimi 支持聊天、唱歌、舞动等多种娱乐互动场景;对于热衷表情包的用户,Vimi 通过单张照片即可生成各种趣味的人物表情包,玩法多样,实现创作自由。 此外,Vimi 还提供唯美写真风、奇幻风等多种生成风格,让用户仿佛穿越不同次元,享受大片质感的沉浸式视觉效果。 目前,行业里 80% 的视频都是以人物为主要内容,同时伴随短视频、直播平台的爆发,以人物为主体的视频需求量成指数级增长。 然而,市面上缺少可控人物视频生成的 AIGC 产品,这导致内容创作者的效率亟待提升。 可以说,Vimi 的问世正好填补了这一空白,能够为广大 C 端的视频创作者提供了简单、好用的创作工具,方便广泛应用于人物类短视频的创作。 在 7 月 5 日商汤科技举办的「大爱无疆·向新力」人工智能论坛上,还将揭开 Vimi 的更多细节。APPSO 届时也将跟进报道。 目前,Vimi 已在商汤科技官网开放预约,欢迎体验。
阶跃星辰首发万亿和「多模」大模型,还与《大闹天宫》跨界联动 | WAIC 2024
仅仅过去 100 天左右,站在 AGI 风口上的阶跃星辰再次亮出王炸成果。 在今天揭幕的世界人工智能大会,阶跃星辰宣布对 Step 系列通用大模型家族进行全面升级。 阶跃星辰一口气连发三款 Step 系列通用大模型新品:Step-2 万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。 ▲ APPSO 在现场 最新发布的 Step-2 万亿参数语言大模型正式版,采用了创新的 MoE 混合专家模型架构。 同时,基于阶跃星辰行业领先的系统能力,Step-2 大幅提升了训练效率,在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面逼近 GPT-4,企业和开发者可以通过阶跃星辰开放平台申请体验。 此外,阶跃星辰还公布了其在多模态大模型研发领域的多项进展。 新升级的 Step-1.5V 千亿参数多模态大模型,在图像感知和理解能力上全面提升,并具备出色的视频理解能力。它能准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪。 在 Step-2 万亿参数大模型的加持下,Step-1.5V 推理能力大幅增强,能根据图像内容进行解答数学题、编写代码、创作诗歌等高级推理任务。 如果说 Step-1.5V 的发布,标志了阶跃星辰在极短的时间内,实现了从图像理解到视频理解的跨越升级,那么新发布的 Step-1X 图像生成大模型,则代表了阶跃星辰在推动多模态理解和生成统一的技术路线上取得重要进展。 它采用全链路自研的 DiT(Diffusion Models with transformer)模型架构,支持 600M、2B、8B 三种不同的参数量,能够满足不同场景的需求。 并且,Step-1X 具备更加强大的语义对齐和指令跟随能力,还针对中国元素和文化进行了深度优化,更具中国风格。这也是 Step-1X 区别于其他模型的重要特色。 值得一提的是,阶跃星辰也凭借 Step 系列通用大模型的创新,一举斩获 WAIC 2024 SAIL 之星的称号。 阶跃星辰创始人、CEO 姜大昕博士曾表示: 攀登 AGI 山峰,『万亿参数』和『多模融合』缺一不可。万亿参数规模,是实现 AGI 的基础门槛;多模态大模型,是通向 AGI 的必经之路。 面向未来,我们会继续将模型做大做强,打造超级模型,同时让模型服务于工作和生活,十倍每个人的可能。 阶跃星辰也在 WAIC 现场展示了面向 C 端用户的自研产品,以及应用落地的最新成果与计划。 智能助手——「跃问」和 AI 开放世界平台——「冒泡鸭」,是阶跃星辰面向 C 端用户推出的两款自研产品。 基于 Step 系列通用大模型的强大能力「跃问」能准确地描述和理解图像中的文字、数据、图表等信息,出色地完成内容创作、逻辑推理、数据分析等任务。 「冒泡鸭」则打造了一个全新的 AI 开放世界。在这里,用户可以探索故事、创作角色,沉浸属于自己的开放世界。 同时,阶跃星辰与众多合作伙伴达成了深度合作,共同探索面向 C 端用户的创新应用。 例如,阶跃星辰与上海报业旗下界面财联社达成深度合作,双方围绕 AIGC 财经资讯、智能投研、智能投顾等领域推进大模型的应用落地。 APPSO 在现场 面向内容创作领域,阶跃星辰联合上海电影在「AI+IP」领域进行创新探索。双方推出了一款《大闹天宫》AI 互动体验——「测测你是哪路神仙」,调用了 Step 系列大模型,融合了图像理解、风格迁移、图像生成、剧情创作等多种能力。 阶跃星辰还与上海电影结合《葫芦兄弟》的 IP 进行了视频生成能力的展示。此外,阶跃星辰已与中文在线、中国知网等展开合作,共同探索大模型在网络文学、知识服务等领域的创新应用。 此外,阶跃星辰宣布推出开放平台——「繁星计划」,投入优质资源扶持多模态领域优秀的初创企业与独立开发者团队,共同加速 AI 大模型技术在各类场景的应用落地。 鲜少有人知道的是,阶跃星辰的名字其实来自于「阶跃函数」。 这仿佛与上文提到的「Scaling Law」核心理念不谋而合,随着模型规模的不断扩大,其性能也会随之显著提升,也迎来阶跃式进步。 今日发布的 Step 系列通用大模型新品,对于阶跃星辰而言,只是其探索之路上的一小步,但也是迈向 AGI 之路,以阶跃之力,赴星辰大海的重要一步。 在今后的国产大模型战场上,或许没有人敢忽视阶跃星辰这个国产大模型黑马了。
如何通往AGI?阶跃星辰用万亿+多模交卷,三大模型亮相WAIC
作者 | 香草 编辑 | 漠影 随着大模型的智能水平迅速增长,科技圈对AGI(通用人工智能)将于几年内降临的预测声音越来越多。 那么在通往AGI的路上,有什么因素是必要条件?这一问题也成为产业内备受关注的话题。 智东西7月4日报道,今日,在世界人工智能大会(WAIC)2024上,大模型独角兽阶跃星辰正式发布Step系列模型“全家桶”,包括万亿参数语言大模型Step-2、千亿参数多模态大模型Step-1.5V以及图像生成大模型Step-1X。 三款模型分别对应Scaling Law、多模态理解和多模态生成,也对应了阶跃星辰对于实现AGI目标的判断——万亿参数、多模融合。 这两点同样是Step系列通用大模型的核心优势。从3月首次亮相,到此次正式发布,Step系列模型在参数规模和多模态能力上取得巨大进展。 具体来说,Step-2在数理逻辑、编程、世界知识、指令跟随等方面体感全面逼近GPT-4,Step-1.5V从图像理解升级到视频理解,Step-1X全面支持600M、2B、8B三种参数量,在多模态理解和生成统一技术路线上实现重要技术突破。 阶跃星辰成立于2023年4月,创始人姜大昕曾担任微软全球副总裁、微软亚洲互联网工程院首席科学家。从成立初期,阶跃星辰就从算力、数据、算法和系统四大要素上综合布局,坚定追逐AGI的目标。 一、通往AGI之路,万亿参数、多模融合缺一不可 在如何实现AGI的问题上,业内一直存在诸多不同的声音。 如OpenAI Sora团队的核心成员Tim Brooks和Bill Peebles认为,视频生成技术将通过模拟一切来实现AGI。DeepMind创始人Demis Hassabis则认为,最快可能实现AGI的方法,就是将世界上现有的所有知识都收集起来,用于模型训练。 大模型创企月之暗面CEO杨植麟称,Scaling Law是通往AGI的第一性原理。百川智能CEO王小川则认为仅靠Scaling Law还不够,AGI需要大模型范式的改变。 而在阶跃星辰创始人姜大昕看来,要攀登AGI这座高峰,“万亿参数”和“多模融合”缺一不可。 在发展阶段上,早期的AI语言、视觉、声音等不同模态独立发展,每个模型主要学习如何更好地表征各自模态的特点;现在,不同模态开始走向融合,但仍不彻底,面临理解能力与生成能力难以同时实现的痛点;最终,生成和理解需要统一在一个模型里,与具身智能相结合起来,模型作为机器人或其他硬件设备的“大脑”,带领它探索并与世界交互,实现AGI。 因此,多模态理解和生成的统一是通向AGI的必经之路。 另一方面,根据Scaling Law,模型的参数量决定模型能力上限,所以全面跨入万亿参数,甚至十万亿、百万亿,是通向AGI的另一核心。 行业内第一梯队的大模型公司是怎么做的?以OpenAI为例,其最新发布的GPT-4o模型全方面加强了语音、视频交互能力,而“大力出奇迹”的暴力美学也是其屡试不爽的模型训练方式。 这恰好印证了Scaling Law与多模态融合这两个关键点,与阶跃星辰所选择的路径不谋而合。 二、三大模型亮相WAIC,阶跃星辰大模型全家桶来了 今年3月,阶跃星辰首次推出Step系列通用大模型并发布预览版,向万亿参数规模发起冲击。 经过100天的打磨,今天在WAIC上,阶跃星辰正式发布Step系列模型“全家桶”,包括万亿参数语言大模型Step-2、千亿参数多模态大模型Step-1.5V以及图像生成大模型Step-1X。 ▲WAIC现场发布Step系列模型“全家桶” 其中,Step-2在数理逻辑、编程、世界知识、指令跟随等方面体感全面逼近GPT-4。 在算法架构方面,目前MoE模型的训练方式主要分为两种,基于已有模型向上复用训练,或是从头开始训练。 第一种方式对算力需求低,训练效率更高,但容易出现同质化严重等问题。相比之下从头训练虽然难度更高,但能获得更高的模型上限。 在设计MoE架构时,阶跃星辰选择迎难而上自主研发。具体来说,通过部分专家共享参数、异构化专家设计等架构设计,Step-2中的每个“专家模型”都得到充分训练,不仅总参数量达到了万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。 有万亿参数的模型当“老师”,Step-1.5V的推理能力大幅提升,可以根据图像内容进行各类高级推理任务,如解答数学题、编写代码、创作诗歌等。 同时基于创新的图文混排训练方法,Step-1.5V感知能力增强,能理解复杂图表、流程图、准确感知物理空间复杂的几何位置。 另一个重要的升级点是视频理解能力,Step-1.5V不仅能够准确识别视频中的物体、人物和环境,还能理解视频的整体氛围和人物情绪。 图像生成大模型Step-1X首次亮相,其采用全链路自研的DiT模型架构,支持600M、2B、8B三种不同的参数量,可满足不同场景的需求。其中,600M适合对于速度敏感的轻量级场景;2B是适用于日常的主力模型,效果和速度达到平衡;8B则追求更高、更极致的生成效果。 Step-1X具备优秀的语义对齐能力和指令跟随能力,并针对中国元素进行深度优化,支持中国元素、文化内容,同时更符合国人的审美风格。 基于这一系列模型的能力,在彩色动画长片《大闹天宫》发行60周年之际,阶跃星辰与上海美术电影制片厂合作,推出一款H5 AI互动体验。 ▲《大闹天宫》游戏现场体验 根据用户上传的个人照片,大模型会识别人物特征,并结合《大闹天宫》画风和角色进行风格迁移,生成新的肖像。 在交互中,用户可以与大模型生成的剧情进行交谈,系统将根据用户的选择和回答分析其MBTI人格,并在天庭为其安排一项适合其人格的差事。 ▲《大闹天宫》游戏界面截图 基于Step系列模型,该游戏将先进的生成式AI技术与《大闹天宫》情景深度融合,用当代的新视角,带领观众领略这部经典动画作品中的传统文化魅力,这是生成式AI技术在落地应用层面上的又一次创新尝试。感兴趣的读者朋友,可以点击本文下方的“阅读原文”进行体验。 值得一提的是,阶跃星辰Step系列通用大模型凭借技术创新和广泛的应用落地,被选入WAIC 2024 SAIL(Super AI Leader)之星,这意味着阶跃星辰在技术和应用方面获得业界的高度认可。 三、模型和产品双轮驱动,面向C端构建生态圈 成立于2023年3月的阶跃星辰,在喧哗吵闹的“百模大战”中并不高调。 在创业之前,姜大昕担任过微软全球副总裁、微软亚洲互联网工程研究院首席科学家,曾主导微软搜索引擎Bing、智能语音助手Cortana、微软云Azure、办公全家桶Microsoft 365等产品的自然语言理解系统的构建。 自成立起,阶跃星辰就在算力、数据、算法和系统这四大要素上综合布局,坚定投入Scaling Law。 ▲阶跃星辰创始人姜大昕讲解攀登Scaling Law所需的要素 姜大昕认为,模型和产品的关系就像是灵魂和皮囊,“好看的皮囊千篇一律,有趣的灵魂万里挑一。”阶跃星辰希望通过“有趣的灵魂”,来显示出产品的不同。 因此,从成立第一天开始,阶跃星辰就同时开发模型和应用产品。应用作为牵引和数据补充,模型与应用深度绑定,通过双轮驱动将两者都做到极致。 而在应用落地的过程中,只靠一家公司自身存在局限性,需要不同公司之间的生态合作才能够促进技术的创新和发展,加速技术的落地应用,推动整个行业持续进步。 通过自有产品与生态合作产品相结合的方式,阶跃星辰对大模型落地应用展开了积极探索。 在自有产品方面,阶跃星辰已发布效率工具“跃问”和AI开放世界平台“冒泡鸭”两款自研产品,均已全面开放使用。 其中,跃问作为一款个人效率助手,能够基于联网搜索、代码分析增强(POT)等能力,为用户提供信息查询、语言学习、创意写作、图文解读等多样化服务,帮助用户在工作、学习、生活等场景下解决问题。 基于Step-1.5V等模型能力,跃问的主要优势在于业界领先的多模态内容理解能力,不仅能够帮助用户识别真实世界的万事万物、理解和分析复杂的金融图表,还能理解网络热梗图片中的深意。 ▲跃问图像理解能力 在生态合作产品方面,阶跃星辰在内容创作、金融财经、消费娱乐等领域与合作伙伴达成深度合作,共同发掘面向C端用户的创新应用。 在WAIC亮相的《大闹天宫》,就是阶跃星辰联合上海电影共同推出了一款AI互动体验产品,将先进的AI大模型技术与《大闹天宫》情境深度融合,用当代全新视角领略中国传统文化的魅力、回顾经典动画作品艺术成就,同时也为创作者打开更多想象空间。 在金融财经领域,阶跃星辰联合国泰君安以及界面财联社,推出业内首家千亿级参数多模态证券垂直类大模型——君弘灵犀大模型,在业内首个实现将大模型能力全面融入客户智能化服务体系之中,在智能投顾问答、投研内容生产和交互模式上为客户带来新体验。 从模型到应用,对AGI的追求始终贯穿着阶跃星辰的战略布局。通过构建开放、合作的生态系统,其正在推动AI技术的广泛应用和行业的共同发展。 结语:微软前高管带队AGI,闯入大模型创企第一梯队 在大模型“百花齐放”下,越来越多的大厂牛人下场创业,成为生成式AI创业赛道的主力军。据智东西统计,2023年至今,至少有25位大厂高管已投身生成式AI创业。 这些创业公司所选择的细分赛道各不相同,覆盖通用大模型、垂直大模型、生成式AI应用、AI基础设施、AI数据服务、AI咨询等全产业链环节。 其中,阶跃星辰作为模型与产品双管齐下的创企,始终用行动践行着对AGI的终极追求。Step系列通用大模型和多样化的自有、合作产品是阶跃星辰在通往AGI之路上交出的最新答卷,“万亿+多模”也将成为大模型企业格局的分水岭。
AI让全球GDP翻10倍!但风险比核问题还严峻,三大图灵奖大佬对话,WAIC干货看尽
作者 | 李水青 香草 编辑 | 云鹏 智东西7月4日报道,今天上午,2024世界人工智能大会(WAIC)在上海开幕!作为国内最高规格的AI领域行业大会之一,WAIC 2024开幕主论坛不仅有高层参与,同时汇聚了众多产学研领域大佬。 开幕式请到了三大图灵奖得主姚期智、罗杰·瑞迪(Raj Reddy)和曼纽尔·布卢姆(Manuel Blum)共同进行圆桌论坛交锋,原微软执行副总裁、美国国家工程院外籍院士沈向洋担任圆桌主持人。 更有IEEE主席托马斯·考夫林(Thomas Coughlin),清华大学苏世民书院院长、清华大学人工智能国际治理硏究院院长薛澜,上海人工智能实验室主任兼首席科学家、清华大学惠妍讲席教授周伯文,新思科技总裁兼首席执行官盖思新(Sassine Ghazi)等重磅大咖演讲。 开幕式上,沈向洋向三位图灵奖抛出了关于“AI发展及风险”、“有意识的AI”、“AI教育和人才培养”等众多产学研关注的问题。 图灵奖得主罗杰·瑞迪谈道,AI风险确实应该得到高度关注,同时我们也不能因噎废食。同时他认为当下的教育体系没法培养了解AI的未来一代人。如果AI让每个人的工作效率提升10倍,全球GDP将从100万亿美元增长到1000万亿美元。 图灵奖得主曼纽尔·布卢姆解读了其团队意识图灵机(CTM)成果,1000万个处理器都是类似于意识模型,没有一个中央决策者,而是让每一个处理器参与决策。 图灵奖得主姚期智谈及了AI发展的网络、社会和生存三大方面的风险,认为AI的风险比核问题更严峻,我们创造了比我们强大很多倍的新物种,需要探讨如何用AI控制AI避免重大破坏。 ▲沈向洋对话三位图灵奖得主 同样谈及AI治理的重要议题,薛澜谈道,巨量的基础设施已经使得全球25亿人受益,但AI发展仍面临AI技术鸿沟、治理鸿沟,阻碍全球AI的发展,需要多方一起攻克。 此外,黑石集团董事长、首席执行宫兼联合创始人苏世民(Stephen A. Schwarzman),索奈顾问及投资公司董事长、首席执行官乔舒亚·雷默(Joshua Ramo)也做了精彩分享。 此次WAIC 2024展览面积超5.2万平方米,共有500余家企业参展,展品数量超1500项,覆盖核心技术、智能终端、应用赋能等三大板块。 大会还公布了“镇馆之宝”名单,商汤科技首个面向C端用户的可控人物视频生成大模型Vimi、阿里云A编程助手通义灵码、支付宝智能助理、智谱A基座大模型、特斯拉赛博越野旅行车等入选。 一、沈向洋对话三大图灵奖得主:AI风险比核更严峻,但不能因噎废食 在开幕式上,三位图灵奖得主罗杰·瑞迪、曼纽尔·布卢姆和姚期智进行了精彩的圆桌对话,原微软执行副总裁、美国国家工程院外籍院士沈向洋担任主持人。 沈向洋向三位图灵奖得主提出了多个问题,包括:如何看待AI发展及担忧?为什么我们紧迫关注AI治理问题?如何看待有意识的AI等等。 ▲原微软执行副总裁、美国国家工程院外籍院士沈向洋 1、灵奖得主罗杰·瑞迪:教育体系落后于AI时代,发展AI不能因噎废食 罗杰在当年获得图灵奖时就提到要建立大型AI系统,他在圆桌中谈道,很开心看到会场大家对AI治理和风险的探讨,没有只是去探讨怎么去用AI。大家没有花太多时间,探讨我们如何来用AI,需要做哪些研究和投资?我们现在还没做到这一点。 在能力建设方面,罗杰认为,目前我们的教育体系没办法培养未来了解AI的一代人,他们需要用AI做好自己的工作,我们怎么让每个人把自己的工作做好?这个问题很关键。 谈及接下来推进的研究,罗杰谈道,每个领域都会出现新机会,也会出现新问题,比如汽车刚出现时,为人们出行带来便利,但交通事故也带来很多伤亡。因此对于AI我们也不能因噎废食。 每个工程师都能做更好的事,如何让他们效率更高?这意味着要做很多投资和研究工作,我希望不要只想着负面,要想着未来的机会很多。他觉得最大的机会,以后每个人的工作效率会提升10倍,全球GDP将从100万亿到1000万亿美元。 ▲图灵奖得主罗杰·瑞迪 2、图灵奖得主曼纽尔·布卢姆:解读图灵机CTM意识模型,模拟人脑决策 曼纽尔在现场解读了有意识的AI。他谈道,年少时他的父亲曾告诉他:“如果你知道你的这个大脑里在发生什么,那么你就会变得更加聪明一些。”很幸运,他的工作是跟意识有关的。意识可以给我们想法,让我们去建立AGI。 曼纽尔的团队已经创立了一个意识模型——图灵机CTM,以此向大家解释大脑里在发生什么。如果我们将大脑里发生的事情想成一个剧场,有一些演讲者在剧场中央讲话,我们可以让很多处理器同时工作,相当于大脑里的神经元,这些处理器会听现场发生了什么,告诉我们怎么去做各种各样的事情。 CTM意识模型特别有意思,1000万个处理器都是类似于意识模型,没有一个中央决策者,而是让每一个处理器参与决策。 曼纽尔的学生众多学生也拿到了图灵奖,当沈向洋问及他有什么为师之道?曼纽尔谦虚地称:“我的学生都比我聪明,我从他们身上学到了很多。有时候我不懂什么,我就直接说我不懂。” ▲图灵奖得主曼纽尔·布卢姆 3、图灵奖得主姚期智:AI治理警惕三大风险,比核风险更严峻 姚期智谈及的自己对AI治理的关注,从风险方面讲解到自己作为计算机科学家对AI治理的见解。 他认为,AI风险主要来自三个方面:(1)它是网络风险的延伸和扩大,AI能力的出现使得传统的网络风险被放大。我们已经觉得管理数据很困难,现在难度会放大100倍。(2)社会风险,人们可以用很多方式使用强大的AI,可能对某些领域带来颠覆式风险,也可能带来新的失业问题。(3)生存和存在的风险,AI风向相比于核风险可能更严峻,这都需要很多的专家来一起解决,包括科学家、政府人士、律师及经济学家都需要参与进来。 从计算机科学教角度,姚期智更关注第一类和第三类风险。 面对第一类风险,AI有时无法解释一些问题,使得研究新的密码学比较困难,我们对网络风险的应对还处在很早的阶段。 而面向第三类风险,这个和计算性有关,更大的算力可以带来更多的知识和智慧,解决很多以前解决不了的问题,这也是让人很恐惧的。现在,我们就是突然发现了一个方式,能创造比我们强大很多倍的新物种,我们需要确定能不能与它共存。 所以作为计算机科学家,姚期智看到最有深度的问题,就是我们怎么把AI控制好,避免它带来重大破坏,这是很难预测的。 ▲图灵奖得主姚期智 二、清华大学苏世民书院院长薛澜:降低AI风险,缩小全球AI技术鸿沟 清华大学苏世民书院院长、清华大学人工智能国际治理硏究院院长薛澜探讨了AI治理的重要议题。 AI能为我们做什么?薛澜谈道,大家对AI给予了很高的期望,根据SDG(可持续发展目标)最新分析,AI总体来看会对可持续发展的134个(79%)具体目标产生促进作用,对59个(35%)目标产生阻碍作用。 ▲清华大学苏世民书院院长、清华大学人工智能国际治理硏究院院长薛澜 AI对这些目标的阻碍作用,代表AI可能带来风险。这些风险包括基于技术本身的风险、基于技术开发的风险和基于技术应用/滥用的风险等多个方面,都是不可忽视的。 如何推动AI收益最大化、风险降到最低? 薛澜谈道,首先在底层,我国在产业应用安全方面推出了一系列法律法规,推动AI的合理发展。我们针对算法、算力、数据推出了一系列的治理规则,针对风险推出了一系列准则。针对一些专项问题,包括具体场景的应用,我们也出台了相应的一些治理规则。此外,我国也在采取措施推动全民数字素养的提升。 从全球角度来讲,AI发展也还面临很多挑战。一方面,巨量的基础设施已经使得25亿人受益,但AI发展仍面临技术鸿沟、治理鸿沟,阻碍全球AI的发展。当今社会,一个国家带来的风险就是全球风险。国际对安全问题日益重视,同时对AI数智鸿沟关注仍不够,需要全球社会一起努力攻克。 三、上海AI实验室周伯文:AI性能与安全失衡,99%算力用在预训练 以大模型为代表的深层次AI快速发展,也带来数据泄露、虚假信息、伦理问题等一系列风险、社会挑战,如何建立一个全面的AI安全治理体系,成为全球范围内的优先议题。 为此,上海人工智能实验室主任、首席科学家、清华大学慧妍讲席教授周伯文提出了一个新的技术主张——AI的45度平衡律。 ▲上海人工智能实验室主任、首席科学家、清华大学慧妍讲席教授周伯文 这一定律指的是,从长期视角来看,AI安全与性能要大体沿着45度的路线平衡发展。 现在AI发展的路线整体是低于45度的,也就是性能发展快于安全治理,也就带来了各种风险;而如果长期高于45度,则会阻碍技术和产业应用的发展。如何找到两者之间的平衡,是亟待解决的难题。 为了实现这一定律,上海人工智能实验室提出了一条以因果为核心的路径,即可信AGI的“因果之梯”。这一路径将可信AGI的发展划分为三个递进阶段,从“泛对齐”,到“可干预”,再到“能反思”。 “泛对齐”包含当前最前沿的人类偏好技术,如机器反学习、监管式对齐、基于人类反馈对齐等。这些对齐技术目前仅依赖统一的相关性而非真正的因果关系,因此可能导致错误的推理和潜在危险。 “可干预”是第二层AI对齐技术,包含AI系统的对抗训练、机械可解释性等,其通过高可解释性和泛化性来提高安全性能,同时也提升AI能力。 “能反思”则要求AI系统不仅要追求高效的执行任务,还要审视自身行为的外在影响和潜在风险,从而保证在高性能的前提下安全和道德边界不被突破。这个阶段的技术包括基于价值的训练、因果可解释性、反事实推理等。 ▲可信AGI的“因果之梯” 周伯文谈道,目前全球AI安全和性能技术发展主要停留在第一阶段,一部分开发者在尝试第二阶段。但要真正实现AI的安全与性能平衡,必须完善第二阶段,并勇于攀登第三阶段。 最后,他呼吁全球开发者加强国际合作,这对于推动AI技术健康发展至关重要,我们的共同目标是构建一个开放安全的AI创新生态系统和人才培养环境。 四、新思科技CEO盖思新:能耗减少30%,缓解人才紧缺 新思科技总裁兼首席执行官盖思新认为,从商业和企业的角度来看,我们要了解AI产业链是从半导体开始的,同时也离不开上层软件。 回顾半导体行业历史,行业花了60年才实现5000亿美美元的销售额,2020年翻了1倍到1万亿美元,几乎所有的这些增量都是由AI的增长所驱动的。 ▲新思科技总裁兼首席执行官盖思新 AI是一个非常大的转折点。盖思新谈道,新思公司为此提供软件,帮工程师使用复杂的半导体芯片,尽可能用软件实现自动化。AI能帮我们改进芯片开发的过程,从而实现更快的速度,在各方面实现优化。 “我们在AI上面有很多共同的原则。”包括政府合规问题,芯片中每个部分的材料都要保证安全,确保芯片没有不合规成分且监管高效。同时,如何使得半导体能耗消耗更高效,也是我们在半导体设计中需要考虑的问题。 新思科技有2万多名工程师,如何用AI来助力业务? 新思科技创办了一个AI卓越中心,以此教育自己的工作人员,让他们知道AI的价值、伦理及风险等,并帮他们教育客户来使用AI来开发芯片。 同时,新思科技也对AI进行商业化,2017年开始就在投资AI,在提供客户的方案里涉及AI,目前也已经包含很多生成式AI内容,比如用用生成式AI作为知识基础,提升工程师的效率,缓解工程师人才紧缺问题,从而提高整个行业的工作效率。 在耗能方面,基于AI技术服务,能耗减少30%,涉及更复杂的问题时效率还能增长15倍。 五、全球治理高端对话:拥抱新技术,建立学术界新扶持方式 AI的快速发展,对企业运营模式、价值评估以及投资决策过程也产生了深远影响,深刻改变了投资格局。 黑石集团董事长、首席执行官兼联合创始人苏世民与索奈顾问及投资公司董事长、首席执行官乔舒亚·雷默就这一系列问题,展开了全球治理高端对话。 ▲苏世民与乔舒亚·雷默 从商业的角度来看,AI是怎么改变一家企业现有的价值认定的? 苏世民谈道,自己在刚入行的时候并不擅长做模型,而现在出现了新的AI应用,可以帮助自己起草会议备忘录等,带来了很多惊喜。 在他看来,虽然对新的技术仍需保持一定警惕性,但不能“像鸵鸟一样把头埋在沙子里”充耳不闻,也不能完全不关注技术风险。 在AI领域中,苏世民是在学术研究方面慈善捐赠规模最大的人之一。当雷默问及为什么突然选择AI这个领域时,苏世民有些感慨地回答:“我想并不是我选择了AI,而是AI选择了我。” 早些时候,他曾作为投资新人资助了牛津大学的一个AI伦理运营项目。之所以这么做,是因为当时每个人都涌向纯理科投资的时候,他觉得需要将理科研究和人类情感上的一些事情相结合,去进行思考和研究,因为“这将会影响和改变人类未来10-20年之后的一些行为”。 同时他也十分关注监管方面的项目,在他看来,从事硬核技术、理科技术的人,在有可能出错的地方应心存敬畏。 相比于商业界,高校等学术机构现在在AI竞争方面处于劣势,一些突破性的进展大多出现在商业领域。这是算力等开发成本所导致的结构性变化。苏世民谈道,随着AI的持续发展,必须对学术界建立一种更有价值的扶持方式,要做一些比仅仅资助一位教授的研究项目来说,更有意义的事情。 结语:生成式AI狂飙,风险管控成为重要议题 在去年的WAIC上,产学研大佬们畅谈大模型浪潮,对下一阶段发展方向、应用爆发领域展开深入探讨和积极展望。 而到了今年,AI风险与安全已成为最受关注的话题之一,无论是性能与安全的平衡,还是教育体系的落后,都是全球范围内共同探讨的重要议题。 总的来看,AGI仍是科技行业共同期待的目标。我们期待看到各行各业能在安全可信的指导下,为AGI的发展注入新的生命力。
可降低30%电池生产成本,LG新能源计划在2028年前实现干式涂层技术商业化
IT之家 7 月 4 日消息,据彭博社报道,LG 新能源解决方案有限公司(LG Energy Solution Ltd.)最新表态称,计划到 2028 年实现干式涂层技术(dry-coating technology)的商业化,该技术旨在取代制造阴阳电极(电动汽车电池的关键部件)的高能耗湿法工艺,可将生产成本降低 30%。目前,特斯拉、三星 SDI 等公司均在研究该技术。 LG 能源解决方案公司首席技术官 Kim Je-Young 在接受彭博社采访时表示:“在干式涂层技术方面,LG 在电池厂商中处于领先地位。我们从 10 年前就开始研发这项技术。”Kim 透露,LG 计划在第四季度完成干式涂层工艺的试生产线,并于 2028 年实现全面量产。这是 LG 首次披露该技术的商用化时间表,Kim 估计干式涂层技术可以将电池制造成本降低 17% 到 30%。 特斯拉在 2019 年收购了干式涂层技术初创公司麦克斯韦尔科技公司 (Maxwell Technologies Inc.),并尝试在其位于得克萨斯州奥斯汀的工厂生产其 4680 型电池,但收效甚微。湿法工艺需要在电池生产线上使用长达 100 米的烘干炉,在高达 200 摄氏度的高温下烘干溶解有毒溶剂的化学物质,不仅成本高昂,而且非常耗费能源。 干式涂层技术可以让电池制造商节省能源、设备成本和空间,因为他们无需投资烘干炉或溶剂回收系统。大众汽车集团 (Volkswagen AG) 也在其内部电池公司 PowerCo 尝试研发干式工艺,他们将这项技术称为“颠覆者”,因为该技术可以让企业减少 30% 的能源消耗和 50% 的空间占用。 LG 旨在通过该技术提升自身竞争力,应对来自中国企业的挑战。IT之家注意到,今年以来,LG 在电动汽车电池市场的份额已从去年的 14.6% 下降到 12.6%,这在很大程度上是因为宁德时代和比亚迪等中国企业的扩张。据彭博新能源财经 (BloombergNEF) 称,截至 4 月份,中国磷酸铁锂电池 (LFP) 的平均价格暴跌 44%,降至每千瓦时 53 美元。 电池由三个主要部分组成:两个电极(阳极和阴极)和一个隔膜,隔膜帮助在电极之间输送电荷。用于制造这些部件的材料决定了电池可以存储多少能量以及成本高低。 特斯拉在 2020 年的电池日活动上大力推广了电极干法工艺。但据路透社报道,这家美国电动汽车制造商目前仅能将该工艺应用于电池的阳极部分,尚未应用于阴极部分。 专家表示,由于阴极材料通常更难处理,因此使用干法工艺生产阴极比生产阳极更具挑战性。 Kim 表示,LG 正在开发的干法电极制造工艺可以应用于阴极和阳极,而不管阴极颗粒的尺寸大小。但他补充说,将干法电极制造应用于具有较小颗粒尺寸的阴极非常具有挑战性。 根据 SNE Research 4 月份的一份报告,除特斯拉之外,松下、宁德时代、亿纬锂能和蜂巢能源科技等公司也正在研发干法电极技术,并将其应用于高能量密度的 4680 型电池。 来自世宗大学的汽车工程学教授 Park Chul-Wan 表示:“由于特斯拉率先采用这项技术,所以现在所有厂商都争相投入研发,韩国的三家电池制造商都还处于干法工艺的早期阶段。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。