EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
新iPad下周就来,准备官宣AI的苹果,怎么卖不动iPhone了?
今年以来,全球手机市场迎来了新的机遇和挑战—— AI 如何与设备更好地结合? 苹果很多技术应用都不是最先发布的,甚至在大部分厂商都大举跟进 AI 功能时,它们才初步确定了「合作」的 AI 上机方案。 处在时代岔路口的苹果,刚刚公布了2024 年第二季度财报。 总体来看,它们的日子并不好过: 苹果第二财季营收 907.5 亿美元,市场预期 900 亿美元,上年同期 948 亿美元; 第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 iPhone 哑火,尖子生越考越差 财报公布前,市场普遍不看好苹果的营收销量表现,并认为在 2024 财年第二财季的营收和利润,都将同比和环比下滑。 其中 iPhone 销量的持续回落,是当中最大的原因。 苹果第二季度财报显示,本季度 iPhone 营收为 459.6 亿美元,与之前市场预期的 457.6 亿美元基本吻合。 iPhone 一直都是苹果总营收的中流砥柱,财报好看与否,与 iPhone 卖的好不好直接挂钩。 事实上,今年以来 iPhone 的销量并不乐观,此前,根据 Counterpoint 的数据,本季度 iPhone 销量下滑 19%。 图片来自:Counterpoint 这与市场的大趋势形成了十分鲜明的对比,特别是在国内。 2024 年第一季度,中国智能手机销量同比增长 1.5%,环比增长 4.6%,连续第二个季度同比正增长。 国内市场手机销量持续火热,和 2023 年同期相比,苹果失去了引以为豪的「首席」市占率,从 2023 年的 19.7%,下降到了今年的 15.7%,排名第三。 一方面,vivo、荣耀、小米等国内手机厂商不断迭代优化产品,陆续推出大底相机、AI 大模型助手、终端互联等新功能,赢得了消费者的青睐。 另一方面,华为依靠 Mate 60 Pro 的爆火,正慢慢恢复市场地位,并且用守护了四年的品牌力,逐步在高端市场恢复了与苹果硬碰硬的资质。 在如此「卷」的国内市场环境下,苹果的当家产品、占苹果总收入六成的 iPhone,在第二财季销售额同比下降 10.9%(至 457.5 亿美元)。 去年同期,iPhone 销售额曾意外增长 1.5% 至 513.3 亿美元,甚至还打破史上第二财季的手机营收纪录。 而上一季度,iPhone 在中国大陆的销量还实现了增长。 2024 财年第一季度苹果营收为 1196 亿美元,同比增长2%,手机销售额从上一财年同期的 658 亿美元增至 697 亿美元。 然而今非昔比,缓慢的更新、持续的同质化、比国内慢了大半拍的 AI 步伐,就连苹果本身的品牌号召力,也难以维持之前在国内市场的傲人战绩。 财报显示,第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 今年三月,上海静安寺对面,被围了七八年的下沉广场,终于迎来了 Apple Store 静安寺店的真面目。 这里是上海市区中心的黄金区域,这家苹果商店也是苹果在中国最大的新店,更是仅次于纽约第五大道店的世界第二大苹果旗舰店。 库克本人也在开业当天来到了现场,一同参加揭幕仪式。 静安寺店占地面积约 3835 平方米,是亚洲面积最大的苹果店,虽然苹果没有公布造价成本,但有消息称这家新店花费了 8340 万元进行改造,折算下来每平方米超过 2 万元。 对苹果来说,国内市场有着无法取代、无法撼动的重要地位。 尽管市场低估了苹果在国内的销量,但总体收入的下降,一定是它们不想看到的局面。 由于我之前提到的 50 亿美元的影响,我们面临着与去年相比的艰难比较。 库克也在随后的电话会议中,直面了苹果目前的处境。 今年一开年,苹果先被微软夺取了全球市值的手把交椅,更是在 Q1 交出了仅有 5540 万部的 iPhone 出货量,同比下降 9.6%,环比大降 36%。 事实证明,「挤牙膏」式的更新早已过时,市场和消费者都在变聪明,也在购买新机时更理性,苹果急需一剂扭转局面的「强心剂」。 苹果的配件,成了市场的配角 库克在财报电话会中称: 中国是全球最具竞争力的市场。在中国的业务除了 iPhone 之外,还有需要努力的方面。 努力的方面,包含了 Mac 和 iPad 系列产品。 得益于今年刚刚更新了 M3 芯片,MacBook 的季度收入为 75 亿美元,同比增长 4%。 虽然我们并没有在 Mac 上看见库克所说的「AI 领域最好的消费级笔记本电脑」,不过依靠其本身优秀的产品力——流畅的 MacOS 操作系统,一众专业且操作简单、功能丰富的软件生态——MacBook Air 还是取得了一定的增长。 而另一边的 iPad,则面临着非常大的挑战。 电话会议中提到,iPad 在 3 月份季度的收入为 56 亿美元,同比下降了 17%。 当中最核心的原因是,过去的一整年,很多期待 iPad 的朋友都没有等来该产品的迭代,去年关于 iPad 最大的更新,就只有一支 Apple Pencil USB-C,还有 eSIM 版本的 iPad 10,可以说几乎没有任何变化。 而 iPad Pro 的上一次更新,还是在 2022 年 10 月份,包含了 11 英寸和 12.9 英寸两种规格。 库克并过分担心 iPad,并且保持乐观态度,因为过两天,iPad 即将迎来设计整个产品线的升级。 根据此前彭博社的报道,此次产品更新,将会包括: 搭载 M3 芯片的 OLED iPad Pro 搭载 M2 芯片的 iPad Air 全新妙控键盘 第三代 Apple Pencil 我们在之前,也对 iPad 2024 的更新事宜做了比较详细的统计汇总,从已经爆出的细节看,此次升级很可能会给 iPad 的市场表现带来积极的改变。 在配件方面,由于苹果所称「推出困难」等原因,该系列产品收入为 79 亿同比下降了 10%。 AirPods 的推出计划也延续了缓慢的节奏,这也是造成销量和营收低迷的主要原因,在版本和功能迎来大更新之前,现在的苹果耳机够用也挺好用,因此也就没有了换新的必要。 不过根据此前 Mark Gurman 报道,新型号的 AirPods 或许会很快推出,将取代第二代和第三代 AirPods,并具有两个版本:「入门」和「中端」。 两者都将采用新的设计、改进的佩戴贴合性以及 USB-C 的充电仓。中端版本将配备主动降噪功能,和充电仓的「Find My」扬声器功能。 据报道,苹果的供应商正在为 AirPods 发布做准备,计划 5 月开始量产,将生产 2000 万至 2500 万只耳机,比以往新型号的生产要更多。 新款 AirPods 预计 9 月或 10 月发布。 另一边的 Apple Watch 实际上也不好过。 苹果在电话会议中给予了很高的评价,它们称购买第一代 Apple Ultra 的用户,有近 2/3 在本季度购买了新的苹果手表: 「苹果手表的安装基数达到了历史新高,最近在美国的服务客户满意度达到了 95%。我们的活跃设备安装基数继续以不错的速度增长。」 但是受到与 Masimo 公司血氧专利纠纷的影响,Apple Watch 全系列的销量在未来都还是个未知数。 AI,最后的押注 简言之,2024 年的苹果「压力山大」。 在产品端,尽管 MacBook 依靠性能卓越的 M3 芯片有了一定程度上的回暖,但大体看来,整体销量下滑、营收受挫已是既定的事实。 在财报上,虽说多项营收都超过了市场预期,看起来是被低估的实力派,实际上以苹果以往的实力和对公司的要求,当下的战绩还不能让它们自己满意。 图片来自:Google 即使通过服务收入创下了 239 亿美元的历史季度记录,但 iPhone 收入与去年同期相比下降了超过 50 亿美元。 在政策里,和欧盟持续多年的抗争,无疑给是苹果的艰难时期「雪上加霜」,「DMA 守门人」名单的列出,不仅使得苹果要在欧盟地区被迫打开封闭了多年的 App Store 生态,也让它们和 Spotify 在音乐流媒体服务市场中的诉讼案中,被重罚了 18.4 亿欧元(约合人民币 143.7 亿元)。 在规划里,Vision Pro 只是一个美好的愿景,起码目前,这款打开「空间计算」大门的未来产品,还不足以扭转苹果困局。 走到十字路口的库克和苹果,也在今天表明了态度: 我们会抓住生成式 AI 领域的发展机遇。我们正在进行重大投资,并期待很快与我们的客户分享一些非常令人兴奋的事情。 库克预计下周预告新的人工智能功能,并于 6 月的全球开发者大会上公布。 前些时候,苹果通过取消进行了十年的「泰坦计划」,来表明深耕 AI 的决心。 尽管苹果在生成式 AI 领域的布局相对较晚,但它们一直在积极收购人工智能公司并构建自家的大型语言模型。 而且,苹果也在今早表示将回购额外 1100 亿美元股票,这是美股历史上最大规模回购。 但是,以目前 AI 在手机和 PC 端的实际体验,还不足以达到影响消费者下定决策的程度,简言之,用户对 AI 的感知并没有预期中的强烈。 的确,许多手机品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重,但各家大模型的可用性只能算达到及格线。 这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。 因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。 哪怕是宣称「独立主义」的各种 AI 工具和穿戴设备,也只是满足了小部分场景的试验,实话讲还只是起步阶段,并不成熟。 在 AI 对用户使用的体验没有产生显著提升前,我们还需要谨慎看待打着 AI 旗号的产品宣传。 更何况,AI 并不是万能药,「遇事不决,All in AI」的策略已经没那么奏效了,想要提高销量,获得市场认可,给出令人信服的硬件配置、提供流畅顺滑的软件系统、定一个合理且可以接受的产品售价,才是王道。 下个月,苹果将会迎来 2024 全球开发者大会,这次 AI 会以怎样的方式出现?库克还有哪些 one more thing 的大招?都将是本届 WWDC 重点关注的对象。 对于苹果来说,此次开发者大会的战略布局,不仅关乎着手机销量、财报表现,更会决定它们在下个时代的话语权。
iPhone 销售额下跌 10%,苹果下周除了发新 iPad 还将官宣新 AI 功能
今年以来,全球手机市场迎来了新的机遇和挑战—— AI 如何与设备更好地结合? 苹果很多技术应用都不是最先发布的,甚至在大部分厂商都大举跟进 AI 功能时,它们才初步确定了「合作」的 AI 上机方案。 处在纠结时代岔路口的苹果,刚刚公布了 2024 年第二季度财报。 总体来看,它们的日子并不好过: 苹果第二财季营收 907.5 亿美元,市场预期 900 亿美元,上年同期 948 亿美元; 第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 iPhone 哑火,尖子生越考越差 财报公布前,市场普遍不看好苹果的营收销量表现,并认为在 2024 财年第二财季的营收和利润,都将同比和环比下滑。 其中 iPhone 销量的持续回落,是当中最大的原因。 苹果第二季度财报显示,本季度 iPhone 营收为 459.6 亿美元,与之前市场预期的 457.6 亿美元基本吻合。 iPhone 一直都是苹果总营收的中流砥柱,财报好看与否,与 iPhone 卖的好不好直接挂钩。 事实上,今年以来 iPhone 的销量并不乐观,此前,根据 Counterpoint 的数据,本季度 iPhone 销量下滑 19%。 ▲ 图片来自:Counterpoint 这与市场的大趋势形成了十分鲜明的对比,特别是在国内。 2024 年第一季度,中国智能手机销量同比增长 1.5%,环比增长 4.6%,连续第二个季度同比正增长。 国内市场手机销量持续火热,和 2023 年同期相比,苹果失去了引以为豪的「首席」市占率,从 2023 年的 19.7%,下降到了今年的 15.7%,排名第三。 一方面,vivo、荣耀、小米等国内手机厂商不断迭代优化产品,陆续推出大底相机、AI 大模型助手、终端互联等新功能,赢得了消费者的青睐。 另一方面,华为依靠 Mate 60 Pro 的爆火,正慢慢恢复市场地位,并且用守护了四年的品牌力,逐步在高端市场恢复了与苹果硬碰硬的资质。 在如此「卷」的国内市场环境下,苹果的当家产品、占苹果总收入六成的 iPhone,在第二财季销售额同比下降 10.9%(至 457.5 亿美元)。 去年同期,iPhone 销售额曾意外增长 1.5% 至 513.3 亿 美元,甚至还打破史上第二财季的手机营收纪录。 而上一季度,iPhone 在中国大陆的销量还实现了增长。 2024 财年第一季度苹果营收为 1196 亿美元,同比增长 2%,手机销售额从上一财年同期的 658 亿美元增至 697 亿美元。 然而今非昔比,缓慢的更新、持续的同质化、比国内慢了大半拍的 AI 步伐,就连苹果本身的品牌号召力,也难以维持之前在国内市场的傲人战绩。 财报显示,第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 今年三月,上海静安寺对面,被围了七八年的下沉广场,终于迎来了 Apple Store 静安寺店的真面目。 这里是上海市区中心的黄金区域,这家苹果商店也是苹果在中国最大的新店,更是仅次于纽约第五大道店的世界第二大苹果旗舰店。 库克本人也在开业当天来到了现场,一同参加揭幕仪式。 静安寺店占地面积约 3835 平方米,是亚洲面积最大的苹果店,虽然苹果没有公布造价成本,但有消息称这家新店花费了 8340 万元进行改造,折算下来每平方米超过 2 万元。 对苹果来说,国内市场有着无法取代、无法撼动的重要地位。 尽管市场低估了苹果在国内的销量,但总体收入的下降,一定是它们不想看到的局面。 由于我之前提到的 50 亿美元的影响,我们面临着与去年相比的艰难比较。 库克也在随后的电话会议中,直面了苹果目前的处境。 今年一开年,苹果先被微软夺取了全球市值的手把交椅,更是在 Q1 交出了仅有 5540 万部的 iPhone 出货量,同比下降 9.6%,环比大降 36%。 事实证明,「挤牙膏」式的更新早已过时,市场和消费者都在变聪明,也在购买新机时更理性,苹果急需一剂扭转局面的「强心剂」。 苹果的配件,成了市场的配角 库克在财报电话会中称: 中国是全球最具竞争力的市场。在中国的业务除了 iPhone 之外,还有需要努力的方面。 努力的方面,包含了 Mac 和 iPad 系列产品。 得益于今年刚刚更新了 M3 芯片,MacBook 的季度收入为 75 亿美元,同比增长 4%。 虽然我们并没有在 Mac 上看见库克所说的「AI 领域最好的消费级笔记本电脑」,不过依靠其本身优秀的产品力——流畅的 MacOS 操作系统,一众专业且操作简单、功能丰富的软件生态——MacBook Air 还是取得了一定的增长。 而另一边的 iPad,则面临着非常大的挑战。 电话会议中提到,iPad 在 3 月份季度的收入为 56 亿美元,同比下降了 17%。 当中最核心的原因是,过去的一整年,很多期待 iPad 的朋友都没有等来该产品的迭代,去年关于 iPad 最大的更新,就只有一支 Apple Pencil USB-C,还有 eSIM 版本的 iPad 10,可以说几乎没有任何变化。 而 iPad Pro 的上一次更新,还是在 2022 年 10 月份,包含了 11 英寸和 12.9 英寸两种规格。 库克并不担心 iPad,并且保持乐观态度,因为过两天,iPad 即将迎来设计整个产品线的升级。 根据此前彭博社的报道,此次产品更新,将会包括: 搭载 M3 芯片的 OLED iPad Pro 搭载 M2 芯片的 iPad Air 全新妙控键盘 第三代 Apple Pencil 我们在之前,也对 iPad 2024 的更新事宜做了比较详细的统计汇总,从已经爆出的细节看,此次升级很可能会给 iPad 的市场表现带来积极的改变。 在配件方面,由于苹果所称「推出困难」等原因,该系列产品收入为 79 亿同比下降了 10%。 AirPods 的推出计划也延续了缓慢的节奏,这也是造成销量和营收低迷的主要原因,在版本和功能迎来大更新之前,现在的苹果耳机够用也挺好用,因此也就没有了换新的必要。 不过根据此前 Mark Gurman 报道,新型号的 AirPods 或许会很快推出,将取代第二代和第三代 AirPods,并具有两个版本:「入门」和「中端」。 两者都将采用新的设计、改进的佩戴贴合性以及 USB-C 的充电仓。中端版本将配备主动降噪功能,和充电仓的「Find My」扬声器功能。 据报道,苹果的供应商正在为 AirPods 发布做准备,计划 5 月开始量产,将生产 2000 万至 2500 万只耳机,比以往新型号的生产要更多。 新款 AirPods 预计 9 月或 10 月发布。 另一边的 Apple Watch 实际上也不好过。 苹果在电话会议中给予了很高的评价,它们称购买第一代 Apple Ultra 的用户,有近 2/3 在本季度购买了新的苹果手表: 「苹果手表的安装基数达到了历史新高,最近在美国的服务客户满意度达到了 95%。我们的活跃设备安装基数继续以不错的速度增长。」 但是受到与 Masimo 公司血氧专利纠纷的影响,Apple Watch 全系列的销量在未来都还是个未知数。 AI,最后的押注 简言之,2024 年的苹果「压力山大」。 在产品端,尽管 MacBook 依靠性能卓越的 M3 芯片有了一定程度上的回暖,但大体看来,整体销量下滑、营收受挫已是既定的事实。 在财报上,虽说多项营收都超过了市场预期,看起来是被低估的实力派,实际上以苹果以往的实力和对公司的要求,当下的战绩还不能让它们自己满意。 ▲ 图片来自:Google 即使通过服务收入创下了 239 亿美元的历史季度记录,但 iPhone 收入与去年同期相比下降了超过 50 亿美元。 在政策里,和欧盟持续多年的抗争,无疑给是苹果的艰难时期「雪上加霜」,「DMA 守门人」名单的列出,不仅使得苹果要在欧盟地区被迫打开封闭了多年的 App Store 生态,也让它们和 Spotify 在音乐流媒体服务市场中的诉讼案中,被重罚了 18.4 亿欧元(约合人民币 143.7 亿元)。 在规划里,Vision Pro 只是一个美好的愿景,起码目前,这款打开「空间计算」大门的未来产品,还不足以扭转苹果困局。 走到十字路口的库克和苹果,也在今天表明了态度: 我们会抓住生成式 AI 领域的发展机遇。我们正在进行重大投资,并期待很快与我们的客户分享一些非常令人兴奋的事情。 库克预计下周预告新的人工智能功能,并于 6 月的全球开发者大会上公布。 前些时候,苹果通过取消进行了十年的「泰坦计划」,来表明深耕 AI 的决心。 尽管苹果在生成式 AI 领域的布局相对较晚,但它们一直在积极收购人工智能公司并构建自家的大型语言模型。 而且,苹果也在今早表示将回购额外 1100 亿美元股票,这是美股历史上最大规模回购。 但是,以目前 AI 在手机和 PC 端的实际体验,还不足以达到影响消费者下定决策的程度,简言之,用户对 AI 的感知并没有预期中的强烈。 的确,许多手机品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重,但各家大模型的可用性只能算达到及格线。 这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。 因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。 哪怕是宣称「独立主义」的各种 AI 工具和穿戴设备,也只是满足了小部分场景的试验,实话讲还只是起步阶段,并不成熟。 在 AI 对用户使用的体验没有产生显著提升前,我们还需要谨慎看待打着 AI 旗号的产品宣传。 更何况,AI 并不是万能药,「遇事不决,All in AI」的策略已经没那么奏效了,想要提高销量,获得市场认可,给出令人信服的硬件配置、提供流畅顺滑的软件系统、定一个合理且可以接受的产品售价,才是王道。 下个月,苹果将会迎来 2024 全球开发者大会,这次 AI 会以怎样的方式出现?库克还有哪些 one more thing 的大招?都将是本届 WWDC 重点关注的对象。 对于苹果来说,此次开发者大会的战略布局,不仅关乎着手机销量、财报表现,更会决定它们在下个时代的话语权。
Vision Pro价格跳水,苹果慌吗?
Vision Pro上市已经一段时间,虽然还没有在国内上市,但已经可以在多个平台购买。 然而,其价格已经从原本的天价降到和美国市场差不多了。 一些购物网站上vision pro价格已经和美国购买的价格持平 从原本以为的引爆xr市场,到现在市场的跳水,人们开始怀疑vision pro是否会成为苹果有一个失败的产品不过,最近一些苹果的动作似乎表明,苹果对vision pro有了新的商业规划。成本2万的设备,苹果不打算让个人消费者为此买单。 01 苹果To B的算盘 在Vision Pro推出的初期,一直被质疑的都是配套应用太少,即使设备性能优秀,但是对于个人消费者来说使用场景太少。有用户指出,“不是Vision Pro买不起,而是实在没有性价比。”正是因为一直没有杀手级的应用,让曾经溢价过万的风光变成了一周只能出台个位数的景象。据报道,苹果零售店内的 Vision Pro 试用预约已经出现大幅下滑,甚至预约体验的用户也经常爽约,一些门店的销量更是从日均几台暴跌到一周仅售出寥寥数台。 分析师郭明錤表示,苹果正在削减 2024 年 Vision Pro 的出货量,并重新考虑下一款型号的计划。据他表示苹果现在将今年 Vision Pro 的出货目标定为 40 万到 45 万台。这与最初市场预期的 70 到 80 万台相比有所下降。 在市场较为消极的反应中,苹果似乎想通过To B的生意来开辟新市场。事实上,苹果的开发人员一直在为众多企业类别的 Apple Vision Pro 构建应用程序,从业务生产力和产品设计,到沉浸式培训和指导工作。 2024年2月,Microsoft 365也为Vision Pro推出了应用程序,用户可以在Vision Pro上丝滑使用Microsoft Word、Excel、PowerPoint、Outlook、Loop、OneNote 和 iPad 版 Teams 来源: Microsoft 365 具体功能包括:创建和编辑文档、演示文稿和电子表格;共享、共同创作和实时协作;使用 Microsoft Copilot 创建、编辑和聊天;以及参加和主持会议或与朋友、家人和同事聊天。虽然不理解“沉浸式”办公的乐趣所在,但线上会议的功能正是许久之前大火的元宇宙概念的愿景。 同一时期,SAP Analytics Cloud也宣布登陆Apple Vision Pro应用商店。 来源: SAP 2024年3月,英伟达宣布登陆Vision Pro应用商店。英伟达将基于通用场景描述(OpenUSD)工业场景Omniverse企业数字孪生引入,开发人员可以将大量 3D 工程和模拟数据集从云端传输到 Vision Pro。英伟达模拟副总裁 Rev Lebaredian 表示:“Apple Vision Pro 是首款不受束缚的设备,让企业客户能够毫不妥协地实现他们的工作。” “我们期待我们的客户能够使用这些令人惊叹的工具。” 以上例子基本都展示了Vision Pro在To B领域的应用,相比之下保时捷与Vision Pro的合作似乎相对“休闲”。2024年3月库克与保时捷首席执行官奥利弗·布鲁姆“连麦”展示了Vision Pro为新款Taycan电动汽车提供的座舱应用程序。但这款应用程序显然不是给驾驶员驾驶用的,而是允许使用者以第一人称视角查看赛道圈速,相关数据统计和3D赛道地图等等。从展示的画面上来看,这款程序更像是沉浸式的赛车观赛程序。 但消费者期待的并不是被办公软件包围。曾几何时,Vision Pro被赋予改变娱乐体验的XR设备,认为苹果将终于开启XR落地时刻。但上市至今依旧没有可以引爆Vision Pro销量的杀手级软件问世。 02 问君何时能娱乐? 虽然有着大量的办公软件,但用户对Vision Pro的最大期待依旧是娱乐。 一位Vision Pro用户指出他当前使用Vision Pro最多的场景就是娱乐。有用户表示Vision Pro是他用过的最佳视频观看设备,在通过Vision Pro观看Disney+上的《Echo》和Apple TV+上的《Dickinson》时,他体验到了极强的沉浸感。这两个应用程序的影院模式已经可以接近真实的影院了。即使与65英寸的电视屏幕相比,在保真度和沉浸感上,Vision Pro的表现都更加优秀。 然而对于生产力,用户认为虽然虚拟显示器的表现令人印象深刻,但使用Vision Pro打字却相当困难。Vision Pro的感应器虽然能捕捉用户眼球运动,但对于打字来说其实很模糊。对于用户来说,在手机和电脑上使用浏览器与邮件还是更加方便。 对于普通消费者来说,Vision Pro的售价依旧较高,即使是相对便宜的Quest 3的价格也不低,大概为3646元。 人们想要创新;他们想要下一代 iPhone。传统观点认为创新在于硬件——这是合理的。然而,那些比大多数人更书呆子的人肯定会认为软件可以说是任何技术产品最重要的方面。 XR设备在消费市场的普及一直面临诸多挑战。此前,为推广元宇宙概念,Facebook更名为Meta,但效果并不显著。最近,Meta作出了重要决策,采取众志成城的策略,向第三方制造商开放其Meta Horizon OS。此举被外界视为可能重塑VR、AR和元宇宙市场格局的关键举措。若成功构建庞大的开发者生态,Meta有望继PC时代的微软和移动开发时代的Google之后,成为VR和元宇宙时代的领导者,打造VR领域的“Android”操作系统。 据官方公告,Meta Horizon OS是Meta公司十年努力打造下一代计算平台的成果。开放此系统意味着更多人将从中受益。经过十年的研发,Horizon OS融入了Meta众多自研技术,包括内向外跟踪和自跟踪控制器等。内向外跟踪技术能精确捕捉用户的手部和手指动作,实现更自然的操作和互动。而自跟踪控制器则允许设备自动跟踪用户的手部或其他身体部位,为用户提供更智能、更灵活的界面控制。 为实现更自然的交互系统,Meta还研发了手部、眼部、面部和身体追踪技术。在混合现实技术方面,Meta开发了一整套融合数字和物理世界的技术,包括高分辨率穿透、场景理解和空间锚点等。随着Horizon OS的开放,已有数家科技公司采用此操作系统。据Meta官方公告,华硕的Republic of Gamers将利用Horizon OS开发高性能头戴设备游戏。联想则凭借其在Oculus Rift S和ThinkPad笔记本电脑系列等方面的丰富经验,开发用于生产力、学习和娱乐的混合现实设备。 去年,Xbox与Meta合作将Xbox云游戏(测试版)引入Meta Quest,为用户提供在混合现实大型2D虚拟屏幕上玩Xbox游戏的新体验。如今,两家公司再次携手,以Xbox为灵感打造限量版Meta Quest。此举有望进一步推动XR设备在消费市场的普及和发展。 03 消费市场:大厂跌倒、小厂吃饱 虽然大公司的星辰大海迟迟没有征服,但一些更亲民的产品在消费市场已经牛刀小试。 由于Xreal和Rokid等公司推出的价格更低的AR眼镜产品,AR市场在2024年也有望增长,这些耳机往往充当显示器的替代品,同时能够提升生产力或改善媒体消费体验。 4月22日,Rokid正式推出了其全新产品——AR Lite空间计算套装。该套装包含一款轻便的显示终端Rokid Max2眼镜,重量仅为75克,以及一款集成传感、计算和电池模块的Rokid Station 2主机,可以单手握持与操作。 据现场展示,Rokid AR Lite具备多样化的功能,如移动轻办公、沉浸式大屏游戏、观影体验以及电脑手机快速投屏等。在交互方式上,Rokid AR Lite进行了创新升级,取消了原有的正面物理按键,新增了多指多手势触控功能,使用户能够无缝衔接在手机、平板上的交互模式,Rokid方面并未透露AR Lite的具体售价信息。根据行业人士的普遍猜测,其售价可能在3000元以内。这一价格区间使得Rokid AR Lite在市场中具有一定的竞争力。 这些XR设备能够实现亲民价格,主要归因于它们所采用的技术与苹果有所不同。XR设备的透视功能主要基于两种技术路径。一种是VST(Video See Through,视频透视),该技术通过摄像头等传感器捕捉真实世界的影像,并将其投射在屏幕上,为用户带来更加沉浸式的体验。例如,苹果的Vision Pro以及Meta的Quest等VR设备就采用了这种技术。另一种则是OST(Optical See Through,光学透视),该技术通过摄像头定位和芯片计算与真实世界进行交互,以真实世界为主导,常见于AR设备中。这也是Rokid、Xreal、雷鸟创新、INMO等国内AR眼镜头部厂商所选择的技术路线。 VST和OST各有其优势与不足。由于VST需要构建沉浸式和数字化的物理世界,这导致设备体积难以实现轻量化,这也是Vision Pro、Quest等产品价格高昂的原因之一。相比之下,OST无需进行物理世界的重建,因此具有轻便、舒适的优势,但难以实现深度沉浸。苹果之所以选择VST,是因为这种技术能够充分发挥其在芯片、操作系统、供应链整合以及产品议价能力上的优势。显然对于消费市场来说,OST无疑是当前更为合适的选择。 消费电子产品的普及离不开游戏和社交两大场景,而实现社交场景的碎片化是至关重要的。当AR眼镜能够具备便捷的碎片化功能时,它有望在短期内实现多个场景的爆发式增长。然而,这一过程的前提是光学、电池、算力和通信等关键材料必须经历技术变革。这一过程可能需要3到5年的时间来完成。当然价格低并不意味着无法进入to B领域。许多AR厂商将企业端作为技术与市场的重要试验场。 04 XR行业的iPhone时刻 XR行业的发展阶段与2007年的智能手机行业相似,众多公司均在探索新一代产品的方向,而这个行业需要一个具有划时代意义的产品。而苹果的Vision Pro有可能成为这样的产品。 无论答案如何,至少这款产品带动了整个行业。Rokid创始人兼CEO祝铭明在接受采访时表示,Vision Pro发布后,Rokid的销量和开发者都迎来了数倍增长。 根据CINNO Research所公布的数据,2023年国内消费级AR设备销量总计22.7万台,同比实现了显著增长,尽管销量有所上升,但从整体出货量来看,AR眼镜尚未全面进入大众市场。不过Rokid预测2024年AR Lite的出货量有望达到30万至50万台,这一数字已相当于一款智能旗舰手机的年度销售量。若这一预测得以实现,无疑标志着AR眼镜在市场上的普及程度迈出了重要一步。相对于Vision Pro,AR眼镜更像是一个屏幕,从价格和生态两个角度而言,都更有优势。或许对于苹果来说,性价比从来不是它所追求的,但生态问题,应该成为它眼前的第一任务。 XR行业正逐渐迎来类似于智能手机行业的革命性时刻,VIsion Pro面对的是从单纯的设备创新转变为应用创新,进而融入更多场景。 苹果创造了手机行业的iPhone时刻,又能否创造XR行业的iPhone时刻?
潞晨科技尤洋:如何用低成本做出类Sora?成功复现有四个要素,时空分割是关键一步|GenAICon2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,新加坡国立大学校长青年教授、潞晨科技创始人兼董事长尤洋以《技术共享:类Sora开源架构模型与训练细节》为题发表演讲。 潞晨科技在今年3月开源的全球首个类Sora视频生成模型Open-Sora,是迄今GitHub上获得星标数最高的开源视频大模型项目之一,截至发稿前已有1.6万个星标,用户群体遍及全球。 值得一提的是,这个模型在低成本下训练而成,相比Sora耗费数千张H100 GPU、花费数千万美元乃至数亿美元,Open-Sora的训练成本仅不到1万美元。 尤洋认为,视频生成正处于“GPT-2时刻”,还没有出现成熟的应用。对于视频生成模型来说,数据可能是最核心的资产。他还谈到,模型开源是有意义且重要的。正如Meta最新发布的Llama 3,极大地调动了开源社区的积极性,不但造福大量开发者,更有助于开源社区整体的繁荣。 因此,Open-Sora模型也进行了全面的训练流程开源,开源了包括模型架构、模型权重、训练细节、数据处理在内的多项技术细节,让更多的开发者可以尝试Open-Sora模型,共同迭代与升级。 在演讲期间,他详细解读了成功复现类Sora视频生成模型的四个关键要素,并分享了Open-Sora的底层架构、demo和教程。 在他看来,考虑到成本压力,视频生成模型将分为大规模图像预训练、大规模视频预训练、高质量视频数据微调三个阶段。在模型设计上,时空分割处理将是显著降低视频生成模型计算成本和内存压力的关键一步。他还提到,Open-Sora未来的发展方向主要在于完善数据处理流程以及训练视频压缩Encoder。 以下为尤洋的演讲实录: 我演讲的主题是最近做的Open-Sora,希望帮助更多中小企业以及研究人员去快速地复现类似Sora这样的视频生成模型。 首先简要介绍一下我的技术背景。这张照片拍摄自我博士毕业答辩时,图中的人物包括我在加州大学伯克利分校的几位教授,他们的专业背景主要集中在高性能计算(HPC)和计算机视觉(CV)领域。HPC的目标是提高模型训练的效率,即用成百上千的处理器卡来加快训练速度。CV则是视频生成模型的关键技术之一,这与我的个人技术背景非常相似。 目前,我们了解到大模型对计算能力的需求非常高,特别是在今天的Infra专场中,我们可以预见,未来对算力要求最高的模型可能会是视频生成模型。 今天我的分享旨在抛砖引玉,我认为视频生成模型目前还处于一个相对早期的发展阶段,其情形有点类似于视频领域的GPT-2时期。市场上尚未出现一个完全成熟且广泛可用的视频生成应用。因此,我将分享我们在这一领域的一些初步探索成果,并希望这能激发大家的兴趣,进而深入探讨。 本次演讲将分为几个部分。首先,我会简单介绍Open-Sora模型,以及与之相关的OpenAI Sora。需要明确的是,尽管我们称之为Open-Sora,也确实采用了类似于OpenAI技术报告中类似的技术,但它实际上是一个不同的模型。然后我将介绍Open-Sora的技术要点、性能表现,以及我们对未来发展的规划。 一、未来人人都能成为导演,视频生成有颠覆教育和技术传播的潜力 大家都看过Sora的Demo视频,其效果确实令人震撼。未来,我们可能会进入一个每个人都能成为导演的时代,每个人都能够迅速生成自己想要的视频或故事,并且通过视频这种形式进行学习,这很可能比传统的文字学习效率要高得多。 如果我们需要了解某个问题,能否让AI为我们生成一段视频,以便快速掌握相关知识呢?我认为视频生成技术有潜力颠覆教育和技术传播领域。 在Sora模型之前,市场上已经存在一些视频生成工具,例如Pika、RunwayML、Stable Video等。然而,Sora在视频长度上实现了显著的突破,超越了之前所有顶尖产品,因此其效果还是非常惊艳的。Sora的应用前景非常可观,可以涵盖游戏、艺术、媒体创作、药物研发、市场营销和教育等多个领域。甚至在未来,许多物理模拟领域也可能采用视频生成模型。 尽管如此,视频生成技术目前尚未广泛普及。我们希望能大幅降低制作电影或视频的成本。以今天的标准,制作一部优秀的电影可能需要高达五千万美元的投资,这显然限制了普通人参与的可能性。但如果未来有了先进的视频生成模型,我们只需向AI描述我们的想法,它就能为我们生成一部高质量的动画片或电影。 只有达到这样的水平,视频生成模型的真正价值才能得到最大化的体现。 二、介绍首个类Sora开源视频生成模型,成功复现Sora有四个关键要素 在介绍了Sora及其影响力后,第二部分介绍一下Open-Sora。 Open-Sora是一个开源的视频生成模型项目,我们的目标是将模型的重要部分都公之于众,以便社区能进一步发展这一技术。 要成功复现视频生成模型,主要包括几个部分。 首先,需要了解模型的架构,比如我到底用的是Diffusion、Llama、GPT还是BERT,不同的架构决定我模型基本的骨架。 其次,一旦模型训练完成,分享训练得到的权重也是非常重要的。这意味着其他人可以直接拿来用,而不需要从头开始训练模型。例如Meta刚刚开放了Llama 3,尽管4000亿参数版本还没有完全训练完成,但已经可以从中看到很好的效果。通过分享这些权重,社区可以快速地将模型部署到各种应用中。 通过这种开放的方式,我们希望能够促进视频生成技术的创新和普及,让更多有兴趣的研究者和开发者能够参与进来,共同推动这一领域的发展。 第三点非常关键,它涉及到开源模型的透明度和可控性。 虽然现有的一些开源模型,如Llama 1和Llama 2,已经公开了模型参数和使用方式,但它们并没有公开训练过程的具体细节,包括超参数的设置。这导致了我们无法完全复现其预训练过程,也就是说,模型的预训练并不是百分百自主可控的。 我们认为,如果未来的视频生成大模型能够实现百分之百的自主可控,那么将能更有效地激发和调动整个行业的生产力。 此外,数据处理也是决定模型性能的一个关键因素。 通过审视OpenAI的技术报告,我们可以发现,尽管在模型架构和算法方面,OpenAI并没有特别强调其创新性,沿用了如Video Diffusion等现有模型,但OpenAI在数据方面做得非常出色。高质量的数据是决定视频生成效果的直接因素,因此,数据处理方式和数据集的质量极为关键。 三、解读STDiT架构核心思想,将成本控制在1万美元 我将展示一些我们的demo和教程,这将涵盖开源模型的几个重要组成部分。 从技术角度来看,Open-Sora模型采用了STDiT架构。我们选择STDiT的主要原因是考虑到成本效益。我们的目标是将Open-Sora的成本控制在1万美金或者更少。 STDiT架构的核心思想在于它包含时间维度的Self Attention和空间维度的Self Attention,这两个方面是分开处理的,而不是合并计算,这样的设计可以显著降低模型的训练和推理成本。相比于DiT模型,STDiT在成本上有着显著的优势,而且在相同的硬件条件下,其吞吐量也更高,这对于提升模型效率来说是非常有利的。 在架构方面,我们的创新点并不是特别多,核心思想仍然与DiT的架构相似。具体来说,处理视频的流程是这样的:首先,我们获取一个视频,然后通过Encoder将其压缩到Latent Space中,这样视频就可以在这个空间中进行交互和处理。这种方法实际上与文本到图像生成的技术非常相似。 我们对文生图的概念并不陌生。我们首先对视频进行压缩,目的是为了将其转换到潜在空间中。压缩有两个主要目的:首先,原始视频文件可能非常大,直接处理它们成本太高;其次,我们的目标是生成特定的视频内容,比如一只狗在雪地里追雪球的场景。如果我们不进行压缩,而是直接在原始视频上操作,可能会生成不符合要求的内容,比如生成了一只老虎或一只猫,即使视频质量再高,如果内容不是我们想要的,那么这样的结果显然是不可接受的。 通过这种方式,我们可以更有效地控制视频生成的过程,确保生成的视频内容符合我们的预期和需求。这种方法不仅降低了处理成本,而且提高了生成视频的准确性和相关性。 在潜在空间中,我们需要融入人类的指令,这些指令通常通过自然语言处理来实现。然而,自然语言数据类型并不能直接与视频信息进行交互。因此,潜在空间的第二个关键作用是将自然语言也转换到这个空间中。这样潜在空间就包含了视觉信息和文本信息,使得这两类信息能够在该空间内进行交互。这是我们压缩视频并将其转换到潜在空间的两个主要目的。 完成这一过程后,我们的工作流程与文本到图像生成技术非常相似。文本到视频生成本质上是文本到图像生成的一种扩展,因为视频可以被视为一系列图片的集合。在这种情况下,我们仍然需要借鉴许多文本到图像生成的技术。 具体到实现方式,与扩散模型的做法非常相似,我们通过引入高斯噪声来生成所需的视频。首先,在潜在空间中随机采样一个高斯噪声,然后将这个噪声与人类的指令一起输入模型,模型据此生成视频。最后,我们将生成的视频从潜在空间解码回原始的三维空间,完成整个生成过程。 四、视频生成模型三阶段:图像预训练,视频预训练,高质量视频数据微调 至于如何实现这一技术,考虑到成本的压力,我们可以将其分为三个阶段进行。 尽管今天介绍的技术在未来十年或二十年可能会被新的技术所取代,但在当前算力有限的情况下,我们可能需要采取分阶段的方法来训练高质量的视频模型。直接使用高质量视频数据训练视频模型的成本可能高达数千万甚至数亿美元,这显然限制了大多数人参与的可能性。 在成本受限的现实条件下,我们的策略是,首先找到一个不错的文本到图像生成模型,这类模型目前比较容易获取,市场上也有很多选择,当然我们也可以自己训练一个。 第二阶段,有了文生图模型,再给它大量视频做初始训练,让它对视频世界有很好的理解。 第三阶段,用高质量、精挑的视频提升它的视频质量。这种思想在大模型领域已经用了七八年,早在2018年、我们训练BERT的时候,BERT训练也是分两个阶段,第一阶段sequence是128,第二阶段的sequence是512。短序列上让它对自然语言有基本的理解,再在长序列上微调,给它一个更好的生成效果,这些其实都是出于成本的压力才这样操作的。 理论上我们有无限算力的话,我们应该直接拿最好的数据让它去训练。包括Llama、GPT,它们训练时也都参考了类似的思路,先在短序列上大规模训练,之后再在长序列或者更好的数据上去做微调,提升最终的模型生成质量。 具体而言,我们可以看一下三个阶段究竟是怎么操作的。 第一个阶段还比较简单,现在有很多文生图的模型,即便不自己训练,也可能找一些不错的文生图模型,它其实就是我的基准,我从起点开始去构造我的整个方案。我们改造Stable Diffusion,可以快速把这件事完成。 第二阶段,现在有了基本对三维世界的理解,文生图本质上还是对自然语言指令信息转到三维世界,有一个基本的能力之后,现在我希望它每秒钟能生成很多图,每秒钟生成60张图就是一个视频了。这种情况下,再进一步给它很多视频数据让它训练。 我们的创新点有两部分,用了STDiT,有时间信息和空间信息,我们新加了时间上的Attention模块,因为本身已经有空间上的Attention模块。比如空间上就是S,时间上就是T,现在有一个S和T,S是已经训得差不多了,T刚刚开始。S相当于是一个初中生,T相当于是一个婴儿,但现在我们希望S和T都能达到大学生的水平。 有时我们会采用一种混合训练的方法,即将成熟度不同的模型一起训练。这种方法听起来可能有些冒险,因为S可能已经相当于一个初中生,而T可能还只是一个刚刚起步的婴儿。如果将它们放在一起训练,可能会担心它们无法跟上对方学习的节奏。 然而,现代的大型模型拥有庞大的参数量,这使得它们能够通过适当的调整迅速自适应不同的学习速度。在这种情况下,尽管S模型最初学习速度较慢,但T模型可以快速增长,最终两者都能迅速达到相同的水平,最终都能达到相当于大学生的能力水平。 即使我们没有自己的S模型,也可以利用一些现有的资源。当我们引入T模型后,通过适当的整合和调整,可以显著提升整体系统的性能。 这种策略体现了深度学习模型训练的灵活性和适应性,通过合理的设计和调整,即使是成熟度不同的模型也能够协同工作,最终实现性能的共同提升。 当我们拥有了视频生成模型之后,接下来的第三部分工作是使用更高质量的视频数据对模型进行精调。 这里的核心区别在于,第三部分生成的视频在质量上将显著优于第二部分。尽管第二部分的模型已经对三维视觉世界有了一定的理解,但其生成的视频质量仍有提升空间,这也正是我们进行第三阶段工作的原因。 在这一过程中,还有一个关键点值得注意,即我们在OpenAI的技术报告中发现,他们使用了多模态版本的GPT-4来进行视频描述,但这种方法的成本较高。为了降低成本,我们转而采用了开源的LLaVA 1.6模型来进行视频描述任务。LLaVA 1.6是基于E34B数据集训练的,如果大家对此感兴趣,可以进一步了解和探索。 通过使用LLaVA 1.6,我们能够在保持描述质量的同时,减少计算资源的消耗。这种方法不仅有助于提升最终视频产品的质量,也使得整个视频生成过程更加高效和经济,从而为更广泛的应用场景和用户群体提供了可能性。 五、如何将成本降到最低?时空分割是关键一步 介绍完整体的模型、算法、设计流程之后,接下来考虑如何把成本降到最低。 要想把成本控制在1万美金左右,显然我们不能用太多的GPU,我们可以简单地做一笔数学计算。现在H800一台月租8万-10万人民币,假设有8台H800,每月的租金就要80万,如果用20台,每月的租金大概需要200万。要想一次性试验成本控制在10万以下,只能用8台H800 64个H800GPU,就需要把速度、效率破到最高。 之前我们打造了Colossal-AI系统,从三个角度,高效的内存优化、N维并行系统、低延迟推理,通过Colossal-AI进一步实现2-4倍的加速。 训练过程中,一个关键因素是它们需要处理的序列长度通常非常长。无论是国内还是美国的大模型,研究者们都在努力扩展模型的序列长度,以期获得更高的预测精度。以GPT模型为例,其损失函数依赖于一个窗口的信息来预测下一个词的概率,窗口越大,即包含的信息越多,预测的准确性也就越高。 对于视频生成模型而言,即便是较短的视频,其序列长度,这里指的是帧数,即每秒钟包含的画面数量,也可能是巨大的。例如,即便是每秒24帧的视频,如果帧率提高到60,那么在数据训练中的长度可能达到150万tokens,这将导致计算和内存开销急剧增加。 因此,将时间信息和空间信息进行分割处理是非常关键的一步。通过时空分割,我们可以显著降低计算成本和内存压力。具体来说,这意味着我们不是同时计算时间信息和空间信息,而是分步骤进行,先处理时间维度,再处理空间维度,这样可以大幅提升处理效率。 通过这种方法,我们可以更高效地训练视频生成模型,同时控制计算资源的消耗,使得模型训练变得更加可行,即使是在资源有限的情况下。 经过我们的优化之后,训练策略提升了很大。从右图可以看出,即使在8个GPU上训练速度也提升了16%,尤其在Encoder部分,计算密集型任务也实现了显著加速。 六、低成本模型能生成20秒视频,Open-Sora已获得1.4万个GitHub星标 最后展示下我们的demo。我们的demo远差于OpenAI,主要有两个原因: 首先,我们的demo是在低成本条件下完成的,OpenAI使用了2000到4000个H100 GPU,花费了五千万美元到两亿美元,而我们仅用了不到1万美金进行试验。在如此有限的预算下,我们取得的效果是可接受的。 其次,我们没有使用大量的数据。通常数据质量越高,生成的视频质量越好。如果我们采用更好的数据集,我们目前的内部版本能够生成大约20秒的视频。这是一个在成本受限条件下的演示版本,感兴趣的朋友可以在我们GitHub页面上查看更多信息。 Open-Sora目前在视频大模型开源领域中是GitHub上获得星标数最高的项目之一。自从我们在3月3日开源以来,已经获得了1.6万个星标,用户群体遍布全球,包括中国、美国、欧洲、印度和东南亚。 我们的发展方向包括完善数据处理流程。我再次强调,对于视频生成模型来说,数据可能是最核心的资产。虽然算法大多是公开的,比如STDiT、DiT或Video Diffusion,大家使用的算法和模型结构相似,结果也不会有太大差异。但是,如果数据质量有显著差异,那么模型的质量也会有很大差别。因此数据处理流程非常关键。 此外,视频压缩和编码也非常重要,如何将视觉信息有效地转换到潜在空间,以及潜在空间是否能够准确表达视频内容的所有信息,这对于模型的推理和学习过程至关重要。 以上是尤洋演讲内容的完整整理。
阿里云李鹏:进一步压榨云上GPU资源,将大模型训推效率最大化丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,阿里云高级技术专家、阿里云异构计算AI推理团队负责人李鹏以《AI基础设施的演进与挑战》为题发表演讲。 李鹏谈道,大模型的发展给计算体系结构带来了功耗墙、内存墙和通讯墙等多重挑战。其中,大模型训练层面,用户在模型装载、模型并行、通信等环节面临各种现实问题;在大模型推理层面,用户在显存、带宽、量化上面临性能瓶颈。 对于如何进一步释放云上性能?阿里云弹性计算为云上客户提供了ECS GPU DeepGPU增强工具包,帮助用户在云上高效地构建AI训练和AI推理基础设施,从而提高算力利用效率。 目前,阿里云ECS DeepGPU已经帮助众多客户实现性能的大幅提升。其中,LLM微调训练场景下性能最高可提升80%,Stable Difussion推理场景下性能最高可提升60%。 以下为李鹏的演讲实录: 今天我分享的是关于AI基础设施的演进和挑战。我讲的内容分三个部分:第一部分是关于生成式AI对云基础设施的挑战;第二部分是如何进一步压榨云上GPU资源的性能,保证训练和推理的效率达到最大化;第三部分是生成式AI场景下训练和推理的客户案例和最佳实践。 一、算力需求规模10倍递增,带来三大计算结构挑战 关于生成式AI最近的发展和行业趋势,我们看到的情况是,2023年生成式AI爆发,文生视频、文生图、文生文等场景下有很多垂类大模型或通用大模型出来。我和公司的产品团队、架构师团队与客户进行了很多技术分享和交流。 我的感受是,现在很多云上客户逐渐在拥抱生成式AI场景,开始使用大模型,比较典型的行业是电子商务、影视、内容咨询、办公软件这几大部分。 大模型发展对AI算力的需求方面,左边这张图是前几天GTC大会上黄仁勋展示的关于模型发展对算力的需求曲线图。2018年开始,从Transformer模型到现在的GPT-MoE-1.8T,其对算力的需求呈现出10倍逐渐递增的规模性增长,可以看出训练的需求非常大。 另外,我们也做了一些估算,比如训练1750亿参数的GPT-3模型,训练的计算量大概在3640PFLOP * 天,相当于需要大概1024张A100跑1个月,达到了千卡规模。换算到成本上就是一笔巨大的计算开销。总体来看,因为当前的GPU算力价格还比较昂贵,所以推理或微调本身的成本,以及计算需求和推理部署成本也会比较高。 大模型发展给计算体系结构带来挑战。 首先就是功耗墙的问题。以NVIDIA的GPU举例,V100的功耗大概只有250W,A100功耗增加到400W,H100功耗达到750W,最新的B200功耗大概为1000W。可以看到,算力8年间增长1000倍,其计算功耗也会相应增加。最近有相关的讨论提到,AI的尽头是能源,计算需求的增大会带来更大的能源需求。 第二个体系结构挑战就是内存墙。所谓内存墙,就是数据在CPU和GPU之间做搬移或者交换,现在PCIe的体系结构已经成为数据交换和传输的瓶颈。目前,NVIDIA已经在Grace Hoper架构上推出了NVLink-C2C的方案,能够大幅提升整个数据传输的速率。 第三个是通讯墙。分布式训练的规模非常大,已经从去年的千卡规模达到了现在的万卡甚至十万卡的规模。分布式训练场景下如何增强机器之间的互连带宽有很大的挑战。从国内外厂商的进展来看,他们会在A100上采用800Gbps互连的带宽,在H100上采用3.2Tbps带宽。 总结下来,现在的趋势就是硬件堆砌,会有更大的显存、更高的显存带宽、更高的CPU和GPU之间的互连带宽,同时PCIe本身也会向下迭代。 以NVIDIA的GPU为例,可以看到从Ampere这一代架构到Blackwell架构的变化。算力计算规模会越来越高,从不到1P增长到1P以上;显存规格越来越高,从80GB增加到100多GB规模;显存带宽不断增加。这反映了未来AI计算上硬件规格的变化趋势。 二、大模型训练的现实难题:模型装载、并行、互连 第二部分是大模型训练对于云上技术的挑战。 大模型训练技术栈包含Transformer模型结构、海量数据级、梯度寻优算法,这三块构成了AI训练的软件和算法。硬件就是GPU计算卡,从单卡扩展到单机8卡的服务器,再扩展到千卡、万卡互连规模的更大服务器集群,构成整个大模型训练硬件的计算资源。 大模型训练中遇到的典型现实问题是模型的加载和模型的并行。 以175B参数的GPT-3模型为例,其训练需要的显存规模大概为2800GB。我们可以根据A100 80GB来计算所需卡的数量。但是要解决的问题,一是我们需要多少张卡装载模型?二是装载这个模型之后如何提升训练效率?解决这个问题就需要用到模型并行技术,现在已经有各种各样的模型并行技术去解决这样的问题。三是互连的问题,有NVLink单机内部互连、机器跟机器之间的互连网络。对于分布式训练来说,这都是非常重要的问题,因为会在通信上产生瓶颈。 大模型训练中的模型装载过程中,175B模型以FP16精度计算,大概需要350GB显存规模,模型梯度也需要350GB,优化器需要的显存规模大概为2100GB,合并起来大概是2800GB规模。分布式训练框架目前已经有比较成熟的方案,比如NVIDIA的Megatron-LM框架、微软开发DeepSpeed ZeRO3的算法,都可以用来解决模型装载和并行的问题。 在大模型训练方式上也有比较多的并行技术,包括张量并行、流水线并行、数据并行等。 在模型分布式训练过程中,我们还看到一些比较关键的问题,如集合通信性能问题。比如在TP切分中会产生一些All-Reduce(全局归约操作),这些操作夹杂在计算流当中,会产生计算中断影响计算效率,因此会有相应的集合通信算法、优化软件被开发出来,去解决集合通信性能的问题。 三、显存、带宽、量化,成大模型推理瓶颈 大模型推理时我们需要关注三个点:一是显存,模型参数量大小决定了需要多少显存;二是带宽,大模型推理时是访存密集型计算方式,在计算当中需要频繁访问显存,所以这种情况下带宽的规格会影响推理速度;三是量化,现在很多模型发布时除了提供基础的FP16精度的模型,还会提供量化后的模型,因为低精度量化可以省下更多显存,也可以提高带宽访问速度,这也是模型推理中业界经常会采用的一种技术。 总结下来就是,大模型推理有显存瓶颈;在推理方面可以走多卡推理,训练卡也可以用在推理业务,而且会产生不错的效果。 我们在做模型微观性能分析时发现,典型的Transformer-Decoder,很多大模型都是Decoder Only结构,里面包含注意力结构和MLP层。 在这些算子中,我们通过微观性能分析会看到,大部分的计算都是矩阵乘操作,实际85%的耗时都是访存,进行显存读取。 由于大模型推理是自回归的生成方式,上一个生成出来的Token会被用于下一个Token的计算。这种访存方式就是我刚刚提到的访存密集型计算。基于这种行为,我们会把这些注意力结构和MLP层分别进行融合,形成更大的算子后执行推理,就会显著提高计算的效率。 在大模型推理的带宽需求方面,下图展示了Llama 7B在A10、A100上推理性能的对比。在不同的Batch Size下,A100和AI的比例关系基本是一条比较水平的线(图中红线)。 这也可以反映A100的显存带宽和A10的显存带宽之间的比例关系,从侧面印证了大模型推理基本是访存密集型的操作,它的上限由GPU的HBM显存带宽决定。 除此之外,我们还分析了大模型推理时的通信性能。这里主要说的通信性能是指单机内部的多卡推理,因为如果跑Llama 70B的模型,仅靠A10一张卡没办法装载,至少需要8张卡的规格进行装载。 因为计算时做了TP切分,实际计算是每张卡算一部分,算完之后进行All-Reduce通信操作,所以我们针对这种通信开销做了性能分析。最明显的是在推理卡A10上,通信开销占比较高,达到端到端性能开销的31%。 我们如何优化通信性能的开销?通常来说比较直观的方法是,如果有卡和卡之间的NVLink互连,性能自然会得到提升,因为NVLink互连带宽本身就比较高;另一个方法是,如果卡上没有NVLink,你就需要一些PCIe的P2P通信,这也能帮助提高通信开销占比。 基于在阿里云上的亲和性分配调优,我们摸索出了一套调优方法,能够在4卡、8卡场景下进一步优化通信开销占比。 对于视频模型,今年年初OpenAI发布Sora,虽然没有公开太多技术细节,但国外机构已经给出了其关于算力需求的分析。 因为Sora的模型结构与文生图模型结构不同,其中比较显著的区别就是,从原来的UNet结构变成Diffusion Transformer结构,通过结构上的变化和算力的估算,我们看到的结果就是Sora在训练和推理上都会对算力有比较大的要求。 下图是国外研究机构估计的算力需求,他们估算训练Sora这样的模型,需要大概4000到10000多张A100训练1个月。在推理需求上,如果要像Sora这样生成5分钟长视频,大概需要1张H100算1个小时。 四、软硬协同优化方案,可将大模型微调效率提升80% 阿里云弹性计算为云上客户在AI场景提供了关于基础产品的增强工具包DeepGPU。DeepGPU是阿里云针对生成式AI场景为用户提供的软件工具和性能优化加速方案。用户在云上构建训练或者推理的AI基础设施时,该产品就能提高其使用GPU训练和推理的效率。 这非常重要,因为AI算力现阶段比较贵,我们需要通过工具包的方式帮助用户优化使用GPU的效率。我们也会提供文生图、文生文等的解决方案,并且帮助众多云上客户实现了性能的大幅提升。 接下来是阿里云帮助客户进行训练微调和推理案例。 第一个案例是文生图场景下的微调训练。我们将DPU和阿里云GPU结合,在客户的业务场景下帮助客户提升端到端微调的性能,大概会实现15%-40%提升。 第二个案例是关于大语言模型场景的微调。很多客户想做垂直领域或者垂直场景下的大模型,会有模型微调的需求。针对这种需求,我们会做相应的定制性解决方案或优化方案,在这个场景下,客户可以通过软硬结合的优化方法,提升大概10%-80%的性能。 第三个案例是关于大语言模型的推理,这个客户需要在细分场景做智能业务问答、咨询等,我们在这个场景下为客户提供了端到端的场景优化方案,从容器、环境、AI套件、DeepGPU到下层云服务器,帮助客户优化端到端推理性能,这会帮助客户提升接近5倍的端到端请求处理或推理的效率。 以上是李鹏演讲内容的完整整理。
早报 | 库克:上季度中国大陆的 iPhone 销量实现增长/990 万拍下周鸿祎迈巴赫当事人:已完成支付/小米回应大压铸自研问题
苹果第二财季营收净利润均超预期 990 万拍下周鸿祎迈巴赫当事人:已完成支付 特斯拉裁员潮又有新的受害者 小米公司发言人:有人故意混淆超级大压铸系统和冲压线概念 苹果确认欧盟的 iPad 今年秋季支持应用侧载 环球音乐集团与 TikTok 达成新的版权许可协议 奇瑞四月份销量公布,出口近 9 万辆 Altman 预测:核聚变将成为地球上主导的发电方式 Beats 发布新款耳机 Beats Solo Buds 华为预热新款 MatePad 平板 郭明錤:Apple Watch Ultra 今年「几乎没有」硬件升级 面壁开源新模型推理性能超 Llama3-70B KITH x TAG HEUER 合作系列正式登场 MARKET x EASTPAK 全新多功能包袋系列发布 Crocs 首次携手 MARMOT 发布联名鞋款 杜皮约戛纳开幕片预告 《宇宙巨人希曼》真人电影定档 杰克·吉伦哈尔新剧《无罪推定》首曝预告 苹果第二财季营收净利润均超预期 今日凌晨,苹果发布了 2024 财年第二季度财报,并宣布启动该公司史上最大的股票回购计划 1100 亿美元。 财报数据显示: 第二财季营收 907.5 亿美元,市场预期 903.3 亿美元。 二季度 iPhone 业务营收 459.6 亿美元,市场预期 457.6 亿美元。 二季度大中华区营收 163.7 亿美元,同比下降 8.1%,显著高于市场预期的两位数百分比降幅。 值得一提的是,在公布第二季度财报后,Tim Cook 接受 CNBC 的采访时称: 「在竞争异常激烈的环境下,我们上一季度在中国大陆的 iPhone 销量实现了增长,我感到非常高兴。这可能会让一些人感到意外… 因此,我对中国市场感觉良好,我考虑更多的是长远利益,而不是只看未来一周左右的时间。」 另外,据《华盛顿邮报》报道,为重振消费者热情,苹果预计将在下周预告新的 AI 功能,并于 6 月的全球开发者大会上公布。 990 万拍下周鸿祎迈巴赫当事人:已完成支付 近日,周鸿祎以 990 万元的价格售出迈巴赫。但有网友爆料,买家褚会长,至今仍未付清余款。 据悉,买受人需在验车完成后 1 小时内完成《二手车买卖合同》的签署,2 小时内将车款支付至拍卖人指定收款账户,否则拍卖人有权判定买受人违约。此举也引发同场竞拍者不满。 对此,褚会长昨晚发布视频称,此次拍卖的本意也是为了二手车行业做代言,给行业树立一个诚信透明的正面形象,推动一下二手车行业的进一步发展。 「此次竞拍款 990 万元,经过筹措已经按约定支付完成,车辆过户交割也正在进行中。」 特斯拉裁员潮又有新的受害者 据新浪科技消息,特斯拉公司在暑期实习开始前几周突然撤回了录用通知,导致多名暑期实习生成为了这波裁员潮新的受害者。 迈阿密大学学生 Joshua Schreiber 在社交平台 X 上描述了自己的经历,他原定三周后开始实习,并已在住宿上花费数千美元,却在一天之内先后收到关于航班信息的邮件和实习取消的通知。 不过,撤销实习生录取的决定可能不会为特斯拉节省太多成本,Glassdoor 数据显示,部分实习生职位甚至是无薪的,而带薪实习岗位的时薪也通常在 18 至 28 美元之间。 小米公司发言人:有人故意混淆超级大压铸系统和冲压线概念 小米公司发言人昨日在微博上就有关小米超级大压铸系统与冲压线概念混淆的谣言进行澄清。 「大压铸和冲压是两种完全不同的工艺,在小米汽车工厂中,这两者也是分属不同的车间。 我们已经多次澄清,小米超级大压铸 9100t 的压铸机,是小米跟海天联合研发。压铸机只是一个环节,小米自研了整个压铸集群系统,包括 60 个设备、433 个工艺参数。 同时,小米研发团队在行业已有的压铸机技术基础上,进行了 11 项专利设计创新提升,其中大部分为发明专利,如 AI 主动优化压射参数设定系统等。」 小米公司发言人强调,小米是目前国内唯一同时拥有量产自研压铸合金材料,以及自研大压铸设备集群系统两项技术的汽车厂商。 苹果确认欧盟的 iPad 今年秋季支持应用侧载 据 Macrumors 消息,苹果确认今年秋季晚些时候将最近 iOS 对于欧盟 App 的更改引入 iPadOS。 欧盟的开发者未来可以通过其他应用市场或网站来分发他们的 iPad 应用,适用所有相同的条款。对于首年安装量超过一百万次的应用,若其通过非 App Store 渠道分发,则需缴纳核心技术费用。 苹果官方还表示:若用户在 12 个月内在 iOS 及 iPadOS 上安装了同一应用,该应用仅计算一次首年安装量,而非两次。这一政策将帮助开发者更容易控制在核心技术费的标准以下。 与 iOS 的更新类似,这些即将到来的 iPadOS 更新只针对在欧盟地区分发应用的开发者及那里的 iPad 用户。 对于其他地区的用户而言,应用依旧只能通过 App Store 获取。 环球音乐集团与 TikTok 达成新的版权许可协议 据 The Verge 报道,音乐版权巨头环球音乐集团(UMG)宣布与 TikTok 签订了一项新的版权许可协议,旗下包括泰勒·斯威夫特等艺术家将回归 TikTok。 此前,UMG 因旧合同到期,自 2 月 1 日起开始从 TikTok 撤下音乐内容。 现在,TikTok 和 UMG 将携手确保音乐行业 AI 的发展,保护艺术家创作的艺术性和其应得的经济收益。 TikTok 还承诺与 UMG 合作,从平台移除未授权的 AI 生成音乐,并提升对艺术家和词曲作者贡献的辨识度。 奇瑞四月份销量公布,出口近 9 万辆 昨日,奇瑞控股集团公布了 4 月具体销量情况。 4 月份销售汽车 182049 辆,同比增长 43.7%;其中出口 89377 辆,同比增长 18.3%;新能源销量 32995 辆,同比增长 165.2%。 1-4 月份,奇瑞控股累计销售汽车 711653 辆,同比增长 55.7%。其中,新能源汽车 93128 辆,同比增长 137.3%;同期累计出口汽车 342795 辆,同比增长 34.2%。 另外,多家车企近日也公布了 4 月交付数量。 小米:截止 4 月 30 日 24 时,小米 SU7 4 月交付量达 7058 台,累计锁单量达到 88063 台。 上汽通用:旗下三品牌新能源车型,4 月共交付 8762 辆,同比增长 93.1%。 极氪:4 月交付 16089 台,同比大增 99% ,环比增长 24%。 理想:2024 年 4 月,理想汽车交付新车 25787 辆,同比增长 0.4%。 蔚来:2024 年 4 月,蔚来交付新车 15620 台,同比增长 134.6%,环比增长 31.6%。 鸿蒙智行:全系交付新车 29632 辆,连续 4 个月蝉联中国新势力品牌月销量冠军。其中问界 M9 4 月交付新车 13391 辆,智界 S7 4 月累计交付新车 4546 辆。 比亚迪:4 月销售 313245 辆,其中乘用车销售 312048 辆,同比增长 49%。比亚迪汽车 王朝丨海洋销售 297864 辆,四月销售同比增长 49.7%,腾势汽车销售 11122 辆,仰望汽车销售 952 辆,方程豹汽车销售 2110 辆 。 Altman 预测:核聚变将成为地球上主导的发电方式 OpenAI CEO Sam Altman 近日在斯坦福企业思想领袖讲坛上就多个热议问题分享自己的见解。 Sam Altman 认为,在通往 AGI 的道路上,尽管 ChatGPT 目前表现平平,GPT-4 将来或许会是任何人都不得不再次使用的最愚蠢的模型。 他强调,无论 OpenAI 年烧资金 5 亿、50 亿还是 500 亿美元,只要能持续运营并找到资金支持,为社会创造更多价值,即使成本高昂也是值得的。 Altman 还预测,核聚变将成为地球上主导的发电方式,认为它将是「最便宜、最丰富、最可靠、最密集的能源来源」。 Beats 发布新款耳机 Beats Solo Buds 近日,Beats 发布了全新 Beats Solo Buds 真无线入耳式耳机和头戴式耳机 Beats Solo 4。 Beats Solo Buds 采用 Beats 迄今为止最小巧的外形,支持长达 18 小时的电池续航能力、支持 iOS 用户的无缝式一键配对以及 USB-C 充电功能。 Beats Solo Buds 拥有四款高级配色,分别是哑光黑、风云灰、极光紫和晶透红,售价为人民币 699 元。 Beats Solo 4 支持头部动态追踪的个性化空间音频、拥有 UltraPlush 超软皮质耳罩、长达 50 小时的电池续航能力以及通过 USB-C 传输实现的无损音频。 Beats Solo 4 带来三款惊艳配色供选择,分别是哑光黑、岩青色和云彩粉,售价为人民币 1799 元。 华为预热新款 MatePad 平板 近日,华为宣布将于 5 月 7 日在迪拜举行「创新发布会」,预计将推出一系列新品。 从华为官方公布的全新 MatePad 渲染图来看,其有 13 个扬声器孔位,预计共有 8 个扬声器,并将采用新一代 PaperMatte 显示屏,也就是 MatePad 11 2023 款的柔光屏技术的升级版。 据数据博主 @看山的叔叔 透露,华为 5 月预计将发布 6 大新品,包括 WATCH Fit 3、畅享 80、Matebook 14、平板电脑、华为 nova 12 SE 等。 郭明錤:Apple Watch Ultra 今年「几乎没有」硬件升级 据 Macrumors 消息,苹果供应链分析师郭明錤近日透露,尽管 Apple Watch Ultra 将在今年更新,但新款相比 Apple Watch Ultra 2 在硬件上「几乎没有」升级。 关于 Apple Watch Ultra 3 的具体变化,郭明錤并未透露,但预计该款产品将在 9 月发布。并且如果苹果遵循两年一次的更新周期,今年还有可能推出第三代 Apple Watch SE。 彭博社记者 Mark Gurman 此前曾报道,苹果正在设计一款「Apple Watch X」,具有更薄的机身和磁性表带,但他表示这款产品将在「2024 年或 2025 年」发布。 面壁开源新模型推理性能超 Llama3-70B 近日,面壁智能低调发布了领先的开源大模型「Eurux-8x22B」。 据官方介绍,该模型激活参数仅 39B,支持 64k 上下文,相比 Llama3 速度更快、可处理更长文本。 Eurux-8x22B 由 Mixtral-8x22B 对齐而来,在 UltraInteract 大规模、高质量对齐数据集上训练而成。 Eurux-8x22B 在代码和数学等复杂推理的综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA,堪称「理科状元」。 KITH x TAG HEUER 合作系列正式登场 KITH 与 TAG HEUER 合作系列近日正式发布,一共推出 10 款新表。 首款设计灵感来自 Ronnie Fieg 首个收藏表款,采用升级材料限量发行;其余七款为 KITH 独有,致敬品牌旗舰店,每款不锈钢表链限量 350 枚,橡胶表链限量 250 枚。 另外,两款 TAG HEUER 独家款式限量 825 枚,表圈和表带为蓝绿色,表壳为黑色 PVD 钢。 合作系列将于 5 月 3 日在迈阿密门店提前发售,5 月 6 日正式登陆 KITH 门店和部分 TAG Heuer 精品店。 MARKET x EASTPAK 全新多功能包袋系列发布 街头服饰品牌 MARKET 与 EASTPAK 继篮球包后再次合作,推出全新包袋系列。 新系列以提升生活便捷性为核心,为畅销的衬垫背包增加更多侧袋和新配色,同时可折叠网袋大小可根据需求调整。 亮点包括 MRKT 篮球包和 MRKT RUSH 战术包的清新蓝黑白格图案,以及新推出的三角形 MRKT TRIANGLER 包型,具有开放式设计和相同格纹印花。 Crocs 首次携手 MARMOT 发布联名鞋款 Crocs 与户外品牌 MARMOT 首次携手推出联名球鞋。 这款联名鞋以海草色为主色调,模拟自然色彩,采用 Crocs 专利 Croslite 材质,提升穿着舒适度。 鞋领处使用 MARMOT 标志性紫色,搭配立体网眼面料,外缝黄色线条。银色调节器和独家登山扣设计,增加鞋款格调,适合多种活动。 据悉,这款联名鞋定价为人民币 1099 元,将于 5 月 3 日起在 Crocs 官方渠道发售。 杜皮约戛纳开幕片预告 由蕾雅·赛杜等人主演、昆汀·杜皮约执导的法国超现实喜剧《第二幕》近日发布海报。 影片讲述了 Florence 希望将她深爱的 David 介绍给父亲,但 David 却对 Florence 无意,反而想把她与自己的朋友 Willy 牵线。这四个角色将在一家偏僻饭馆中相遇,展开一场超现实的故事。 作为本届戛纳电影节开幕片,该片将在 5 月 14 日非竞赛展映单元亮相。 《宇宙巨人希曼》真人电影定档 《宇宙巨人希曼》真人奇幻电影确定由亚马逊米高梅出品,塔拉维斯·奈特(《大黄蜂》导演)执导。 此前,在与 Netflix 洽谈未果后,版权方美泰玩具公司随后与亚马逊达成合作。自 2007 年项目启动以来,曾历经华纳兄弟、索尼影业,以及多位导演如朱浩伟、McG 的接洽。 目前该电影计划于 2026 年 6 月 5 日上映。 杰克·吉伦哈尔新剧《无罪推定》首曝预告 由杰克·吉伦哈尔倾情出演的悬疑剧《无罪推定》近日首曝预告。 该剧改编自斯考特·杜罗同名小说,讲述芝加哥检察官拉斯蒂·萨比奇(吉伦哈尔饰)在办公室谋杀案中成为嫌疑人,受害者为其情妇。 鲁丝·内伽饰演其妻芭芭拉,面对丈夫的谋杀指控,她的生活陷入混乱,同时为家庭而战并应对丈夫的公开审判。该剧将于 6 月 12 日登陆苹果流媒体平台。
库克:上季度中国大陆的 iPhone 销量实现增长/990 万拍下周鸿祎迈巴赫当事人:已完成支付/小米回应大压铸自研问题
🍏 苹果第二财季营收净利润均超预期 💵 990 万拍下周鸿祎迈巴赫当事人:已完成支付 🚗 特斯拉裁员潮又有新的受害者 🍀 小米公司发言人:有人故意混淆超级大压铸系统和冲压线概念 📱 苹果确认欧盟的 iPad 今年秋季支持应用侧载 🎵 环球音乐集团与 TikTok 达成新的版权许可协议 🚗 奇瑞四月份销量公布,出口近 9 万辆 ⚛️ Altman 预测:核聚变将成为地球上主导的发电方式 🎧 Beats 发布新款耳机 Beats Solo Buds 🛰️ 华为预热新款 MatePad 平板 ⌚ 郭明錤:Apple Watch Ultra 今年「几乎没有」硬件升级 💻 面壁开源新模型推理性能超 Llama3-70B 🕶️ KITH x TAG HEUER 合作系列正式登场 🎒 MARKET x EASTPAK 全新多功能包袋系列发布 🐊 Crocs 首次携手 MARMOT 发布联名鞋款 🏖️ 杜皮约戛纳开幕片预告 🎬 《宇宙巨人希曼》真人电影定档 📺 杰克·吉伦哈尔新剧《无罪推定》首曝预告 苹果第二财季营收净利润均超预期 今日凌晨,苹果发布了 2024 财年第二季度财报,并宣布启动该公司史上最大的股票回购计划 1100 亿美元。 财报数据显示: 第二财季营收 907.5亿美元,市场预期 903.3亿美元。 二季度 iPhone 业务营收 459.6 亿美元,市场预期 457.6 亿美元。 二季度大中华区营收 163.7 亿美元,同比下降 8.1%,显著高于市场预期的两位数百分比降幅。 据 Macrumors 报道,苹果 CEO Tim Cook 在财报电话会议上表示: 我们仍然非常看好我们在生成式人工智能领域的机遇。我们正在进行大量投资,我们期待着很快与客户分享一些非常激动人心的事情。 我们相信人工智能的变革力量和前景,我们相信我们拥有在这个新时代脱颖而出的优势,包括苹果公司将硬件、软件和服务无缝整合的独特组合、开创性的苹果芯片与我们业界领先的神经引擎,以及我们对隐私的坚定不移的关注,这些都是我们创造的一切的基础。 值得一提的是,在公布第二季度财报后,Tim Cook 接受 CNBC 的采访时称: 在竞争异常激烈的环境下,我们上一季度在中国大陆的 iPhone 销量实现了增长,我感到非常高兴。这可能会让一些人感到意外... 因此,我对中国市场感觉良好,我考虑更多的是长远利益,而不是只看未来一周左右的时间。 另外,据《华盛顿邮报》报道,为重振消费者热情,苹果预计将在下周预告新的 AI 功能,并于 6 月的全球开发者大会上公布。 990 万拍下周鸿祎迈巴赫当事人:已完成支付 近日,周鸿祎以 990 万元的价格售出迈巴赫。但有网友爆料,买家褚会长,至今仍未付清余款。 据悉,买受人需在验车完成后 1 小时内完成《二手车买卖合同》的签署,2 小时内将车款支付至拍卖人指定收款账户,否则拍卖人有权判定买受人违约。此举也引发同场竞拍者不满。 对此,褚会长昨晚发布视频称,此次拍卖的本意也是为了二手车行业做代言,给行业树立一个诚信透明的正面形象,推动一下二手车行业的进一步发展。 此次竞拍款 990 万元,经过筹措已经按约定支付完成,车辆过户交割也正在进行中。 特斯拉裁员潮又有新的受害者 据新浪科技消息,特斯拉公司在暑期实习开始前几周突然撤回了录用通知,导致多名暑期实习生成为了这波裁员潮新的受害者。 迈阿密大学学生 Joshua Schreiber 在社交平台 X 上描述了自己的经历,他原定三周后开始实习,并已在住宿上花费数千美元,却在一天之内先后收到关于航班信息的邮件和实习取消的通知。 不过,撤销实习生录取的决定可能不会为特斯拉节省太多成本,Glassdoor 数据显示,部分实习生职位甚至是无薪的,而带薪实习岗位的时薪也通常在 18 至 28 美元之间。 小米公司发言人:有人故意混淆超级大压铸系统和冲压线概念 小米公司发言人昨日在微博上就有关小米超级大压铸系统与冲压线概念混淆的谣言进行澄清。 「大压铸和冲压是两种完全不同的工艺,在小米汽车工厂中,这两者也是分属不同的车间。 我们已经多次澄清,小米超级大压铸 9100t 的压铸机,是小米跟海天联合研发。压铸机只是一个环节,小米自研了整个压铸集群系统,包括 60 个设备、433 个工艺参数。 同时,小米研发团队在行业已有的压铸机技术基础上,进行了 11 项专利设计创新提升,其中大部分为发明专利,如 AI 主动优化压射参数设定系统等。」 小米公司发言人强调,小米是目前国内唯一同时拥有量产自研压铸合金材料,以及自研大压铸设备集群系统两项技术的汽车厂商。 苹果确认欧盟的 iPad 今年秋季支持应用侧载 据 Macrumors 消息,苹果确认今年秋季晚些时候将最近 iOS 对于欧盟 App 的更改引入 iPadOS。 欧盟的开发者未来可以通过其他应用市场或网站来分发他们的 iPad 应用,适用所有相同的条款。对于首年安装量超过一百万次的应用,若其通过非 App Store 渠道分发,则需缴纳核心技术费用。 苹果官方还表示,若用户在 12 个月内在 iOS 及 iPadOS 上安装了同一应用,该应用仅计算一次首年安装量,而非两次。这一政策将帮助开发者更容易控制在核心技术费的标准以下。 与 iOS 的更新类似,这些即将到来的 iPadOS 更新只针对在欧盟地区分发应用的开发者及那里的 iPad 用户。 对于其他地区的用户而言,应用依旧只能通过 App Store 获取。 环球音乐集团与 TikTok 达成新的版权许可协议 据 The Verge 报道,音乐版权巨头环球音乐集团(UMG)宣布与 TikTok 签订了一项新的版权许可协议,旗下包括泰勒·斯威夫特等艺术家将回归 TikTok。 此前,UMG 因旧合同到期,自 2 月 1 日起开始从 TikTok 撤下音乐内容。 现在,TikTok 和 UMG 将携手确保音乐行业 AI 的发展,保护艺术家创作的艺术性和其应得的经济收益。 TikTok 还承诺与 UMG 合作,从平台移除未授权的 AI 生成音乐,并提升对艺术家和词曲作者贡献的辨识度。 奇瑞四月份销量公布,出口近 9 万辆 昨日,奇瑞控股集团公布了 4 月具体销量情况。 4 月份销售汽车 182049 辆,同比增长 43.7%;其中出口 89377 辆,同比增长 18.3%;新能源销量 32995 辆,同比增长 165.2%。 1-4 月份,奇瑞控股累计销售汽车 711653 辆,同比增长 55.7%。其中,新能源汽车 93128 辆,同比增长 137.3%;同期累计出口汽车 342795 辆,同比增长 34.2%。 另外,多家车企近日也公布了 4 月交付数量。 小米:截止 4 月 30 日 24 时,小米 SU7 4 月交付量达 7058 台,累计锁单量达到 88063 台。 上汽通用:旗下三品牌新能源车型,4 月共交付 8762 辆,同比增长 93.1%。 极氪:4 月交付 16089 台,同比大增 99% ,环比增长 24%。 理想:2024 年 4 月,理想汽车交付新车 25787 辆,同比增长 0.4%。 蔚来:2024 年 4月,蔚来交付新车 15620 台,同比增长 134.6%,环比增长 31.6%。 鸿蒙智行:全系交付新车 29632 辆,连续 4 个月蝉联中国新势力品牌月销量冠军。其中问界 M9 4 月交付新车 13391 辆,智界 S7 4 月累计交付新车 4546 辆。 比亚迪:4 月销售 313245 辆,其中乘用车销售 312048 辆,同比增长 49%。比亚迪汽车 王朝丨海洋销售 297864 辆,四月销售同比增长 49.7%,腾势汽车销售 11122 辆,仰望汽车销售 952 辆,方程豹汽车销售 2110 辆 。 Altman 预测:核聚变将成为地球上主导的发电方式 OpenAI CEO Sam Altman 近日在斯坦福企业思想领袖讲坛上就多个热议问题分享自己的见解。 Sam Altman 认为,在通往 AGI 的道路上,尽管 ChatGPT 目前表现平平,但 GPT-4 将来或许会是任何人都不得不再次使用的最愚蠢的模型。 他强调,无论 OpenAI 年烧资金 5 亿、50 亿还是 500 亿美元,只要能持续运营并找到资金支持,为社会创造更多价值,即使成本高昂也是值得的。 Altman 还预测,核聚变将成为地球上主导的发电方式,认为它将是「最便宜、最丰富、最可靠、最密集的能源来源」。 Beats 发布新款耳机 Beats Solo Buds 近日,Beats 发布了全新 Beats Solo Buds 真无线入耳式耳机和头戴式耳机 Beats Solo 4。 Beats Solo Buds 采用 Beats 迄今为止最小巧的外形,支持长达 18 小时的电池续航能力、支持 iOS 用户的无缝式一键配对以及 USB-C 充电功能。 Beats Solo Buds 拥有四款高级配色,分别是哑光黑、风云灰、极光紫和晶透红,售价为人民币 699 元。 Beats Solo 4 支持头部动态追踪的个性化空间音频、拥有 UltraPlush 超软皮质耳罩、长达 50 小时的电池续航能力以及通过 USB-C 传输实现的无损音频。 Beats Solo 4 带来三款惊艳配色供选择,分别是哑光黑、岩青色和云彩粉,售价为人民币 1799 元。 华为预热新款 MatePad 平板 近日,华为宣布将于 5 月 7 日在迪拜举行「创新发布会」,预计将推出一系列新品。 从华为官方公布的全新 MatePad 渲染图来看,其有 13 个扬声器孔位,预计共有 8 个扬声器,并将采用新一代 PaperMatte 显示屏,也就是 MatePad 11 2023 款的柔光屏技术的升级版。 据数据博主 @看山的叔叔 透露,华为 5 月预计将发布 6 大新品,包括 WATCH Fit 3、畅享 80、Matebook 14、平板电脑、华为 nova 12 SE 等。 郭明錤:Apple Watch Ultra 今年「几乎没有」硬件升级 据 Macrumors 消息,苹果供应链分析师郭明錤近日透露,尽管 Apple Watch Ultra 将在今年更新,但新款相比 Apple Watch Ultra 2 在硬件上「几乎没有」升级。 关于 Apple Watch Ultra 3 的具体变化,郭明錤并未透露,但预计该款产品将在 9 月发布。并且如果苹果遵循两年一次的更新周期,今年还有可能推出第三代 Apple Watch SE。 彭博社记者 Mark Gurman 此前曾报道,苹果正在设计一款「Apple Watch X」,具有更薄的机身和磁性表带,但他表示这款产品将在「2024 年或 2025 年」发布。 面壁开源新模型推理性能超 Llama3-70B 近日,面壁智能低调发布了领先的开源大模型「Eurux-8x22B 」。 据官方介绍,该模型激活参数仅 39B,支持 64k 上下文,相比 Llama3 速度更快、可处理更长文本。 Eurux-8x22B 由 Mixtral-8x22B 对齐而来,在 UltraInteract 大规模、高质量对齐数据集上训练而成。 Eurux-8x22B 在代码和数学等复杂推理的综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA,堪称「理科状元」。 KITH x TAG HEUER 合作系列正式登场 KITH 与 TAG HEUER 合作系列近日正式发布,一共推出 10 款新表。 首款设计灵感来自 Ronnie Fieg 首个收藏表款,采用升级材料限量发行;其余七款为 KITH 独有,致敬品牌旗舰店,每款不锈钢表链限量 350 枚,橡胶表链限量 250 枚。 另外,两款 TAG HEUER 独家款式限量 825 枚,表圈和表带为蓝绿色,表壳为黑色 PVD 钢。 合作系列将于 5 月 3 日在迈阿密门店提前发售,5 月 6 日正式登陆 KITH 门店和部分 TAG Heuer 精品店。 MARKET x EASTPAK 全新多功能包袋系列发布 街头服饰品牌 MARKET 与 EASTPAK 继篮球包后再次合作,推出全新包袋系列。 新系列以提升生活便捷性为核心,为畅销的衬垫背包增加更多侧袋和新配色,同时可折叠网袋大小可根据需求调整。 亮点包括 MRKT 篮球包和 MRKT RUSH 战术包的清新蓝黑白格图案,以及新推出的三角形 MRKT TRIANGLER 包型,具有开放式设计和相同格纹印花。 Crocs 首次携手 MARMOT 发布联名鞋款 Crocs 与户外品牌 MARMOT 首次携手推出联名球鞋。 这款联名鞋以海草色为主色调,模拟自然色彩,采用 Crocs 专利 Croslite 材质,提升穿着舒适度。 鞋领处使用 MARMOT 标志性紫色,搭配立体网眼面料,外缝黄色线条。银色调节器和独家登山扣设计,增加鞋款格调,适合多种活动。 据悉,这款联名鞋定价为人民币 1099 元,将于 5 月 3 日起在 Crocs 官方渠道发售。 杜皮约戛纳开幕片预告 由蕾雅·赛杜等人主演、昆汀·杜皮约执导的法国超现实喜剧《第二幕》近日发布海报。 影片讲述了 Florence 希望将她深爱的 David 介绍给父亲,但 David 却对 Florence 无意,反而想把她与自己的朋友 Willy 牵线。这四个角色将在一家偏僻饭馆中相遇,展开一场超现实的故事。 作为本届戛纳电影节开幕片,该片将在 5 月 14 日非竞赛展映单元亮相。 《宇宙巨人希曼》真人电影定档 《宇宙巨人希曼》真人奇幻电影确定由亚马逊米高梅出品,塔拉维斯·奈特(《大黄蜂》导演)执导。 此前,在与 Netflix 洽谈未果后,版权方美泰玩具公司随后与亚马逊达成合作。自 2007 年项目启动以来,曾历经华纳兄弟、索尼影业,以及多位导演如朱浩伟、McG 的接洽。 目前该电影计划于 2026 年 6 月 5 日上映。 杰克·吉伦哈尔新剧《无罪推定》首曝预告 由杰克·吉伦哈尔倾情出演的悬疑剧《无罪推定》近日首曝预告。 该剧改编自斯考特·杜罗同名小说,讲述芝加哥检察官拉斯蒂·萨比奇(吉伦哈尔饰)在办公室谋杀案中成为嫌疑人,受害者为其情妇。 鲁丝·内伽饰演其妻芭芭拉,面对丈夫的谋杀指控,她的生活陷入混乱,同时为家庭而战并应对丈夫的公开审判。该剧将于 6 月 12 日登陆苹果流媒体平台。
终于,华为Pura 70系列,杀向海外!
5 月 2 日,华为马来西亚官方宣布 HUAWEI P 系列品牌升级为 HUAWEI Pura 系列,同时华为 Pura 70 系列手机也已经开启预售(即日起至 2024 年 5 月 24 日)。 除此之外,华为 Pura 70 系列手机也已经在欧洲等市场开启预售。 华为 Pura 70 系列在马来西亚市场没有提供 Pro + 版本,另外三款机型定价分别为: 华为 Pura 70(12+256GB 版本):3699 林吉特(当前约 5622 元人民币),预购可享价值 2036 林吉特的礼品,包括 FreeBuds Pro 3、AppGallery 优惠券和亚太地区保修等等。 华为 Pura 70 Pro(12+512GB 版本):4899 林吉特(IT之家备注:当前约 7446 元人民币),预购可享价值 2336 林吉特的免费礼品,包括 FreeBuds Pro 3 等等。 华为 Pura 70 Ultra(16+512GB 版本):6599 林吉特(当前约 10030 元人民币),预购同样可享价值 2376 林吉特的礼品。 相信大家对于海外版的价格会感到意外,但其实这里最重要的是华为公布了这三款机型的参数信息。 其中大家最关心的在于,华为 Pura 70 Ultra 及 Pura 70 Pro 官宣搭载海思麒麟 9010 芯片,Pura 70 搭载麒麟 9000S1 芯片,均为八核设计。 其他方面,这三款机型预装了 EMUI 14.2 系统,其他部分基本与国内版本相同。 配置信息显示,麒麟 9010 处理器采用 2 x 2.3GHz + 6 x 2.18GHz + 4 x 1.55GHz CPU 核心(也就是说 8 核 12 线程),配有麒麟 9000S 同款 Maleoon 910 GPU。 作为参考,麒麟 9000S 搭载 1 x 2.62Ghz 泰山核心(超线程)+ 3 x 2.15Ghz 泰山核心(超线程)+ 4 x 1.53Ghz 的 A510 核心。 麒麟 9000S1 可以看做是麒麟 9000S 大核降频版,CPU 为 2x2.49GHz+6x2.15GHz+4x1.53GHz Cortex-A510,GPU 也是 Maleoon 910。 华为 Pura 70 Ultra 可选绿色、棕色、黑色三款配色可选(国内还有白色版本),采用星芒纹设计,后置摄像头采用三角形状,162.6mm(长)*75.1mm(宽)*8.4mm(厚),重量约 226 克,支持 IP68 防尘防水。 该机搭载 6.8 英寸 2844 × 1260 像素 OLED 屏,支持 1-120Hz LTPO 自适应刷新率、1440Hz 高频 PWM 调光、300Hz 触控采样率,配有玄武钢化昆仑玻璃。 影像方面,该机采用了业界首创 50 MP 超聚光伸缩摄像头(1 英寸,F1.6~F4.0 光圈,传感器位移防抖),还有 4000 万像素超广角摄像头(F2.2 光圈)+ 5000 万像素超聚光微距长焦摄像头(F2.1 光圈,OIS 光学防抖),支持自动对焦;前置 1300 万像素超广角摄像头(F2.4 光圈,自动对焦)。 其他方面,华为 Pura 70 Ultra 拥有 5200mAh 电池,支持 100W 有线快充、80W 无线快充、20W 反向无线充电,配有 Type-C(USB 3.1 Gen1)接口,支持 Wi-Fi 6 和蓝牙 5.2。
华为Pura 70系列中国境外全球首发 首次公开麒麟9010
集微网消息,华为4月18日宣布,华为Pura 70 Ultra、华为Pura 70 Pro开启先锋计划,正式在中国开售。华为并将目光投向海外,5月2日,华为Pura 70系列手机在马来西亚开启预售(即日起至2024年5月24日)。 华为Pura 70系列在马来西亚市场没有提供Pro +版本,另外三款机型定价分别为: 华为 Pura 70(12+256GB版本):3699林吉特(当前约5633元人民币),预购可享价值2036林吉特的礼品,包括FreeBuds Pro 3、AppGallery价值300林吉特的独家以旧换新或优惠券优惠券等。 华为Pura 70 Pro(12+512GB 版本):4899林吉特,预购可享价值2036林吉特的免费礼品,包括FreeBuds Pro 3等。 华为Pura 70 Ultra(16+512GB 版本):6599林吉特,预购同样可享价值2076林吉特的礼品。 与国内的华为商城不同,马来西亚的华为商城公布了三款机型处理器型号。 其中Pura 70和Pura 70 Pro搭载麒麟9010,Pura 70 Ultra则是麒麟9000S1,与国行版本保持一致。 据了解,麒麟9010采用12核心CPU架构,分别是2x2.30GHz+6x2.18GHz+4x1.55GHz Cortex-A510,GPU则是麒麟9000S同款的Maleoon 910。 麒麟9000S1可以看做是麒麟9000S大核降频版,CPU为2x2.49GHz+6x2.15GHz+4x1.53GHz Cortex-A510,GPU也是Maleoon 910。 麒麟9010大核性能虽然低于麒麟9000S和麒麟9000S1,但中核和小核性能提升,综合性能超越麒麟9000S,能效比更高,功耗更低。 据悉,华为Pura 70系列三款机型在马来西亚均搭载EMUI 14.2系统,其他主要配置基本与国行版相同。 除此之外,华为Pura 70系列手机也在德国等欧洲等市场开启预售。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。