EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
AI需求强劲,英伟达距离苹果只差一步之遥
作者 | 周永亮 编辑 | 郑玄 达一季报远远超出了市场预期,证明 AI 浪潮依然强劲。 财报显示,英伟达 2025 财年第一财季(2024 年一季度)的总营收为 260 亿美元,同比增长 262%;数据中心收入为 225.63 亿美元,同比增长 427%。这些数据连续多个季度创新高,远远超出华尔街的预期。 英伟达 CEO 黄仁勋在财报声明中表示,「下一场工业革命已经开始」。他表示,各国和大量公司正与英伟达合作,将传统数据中心转型为「AI 工厂」,生产一种名为「人工智能」的新产品。黄仁勋认为,AI 将为各个行业带来显著的生产力和收入增长,同时在成本效益和能源效益上也有显著提升。 这些利好消息暂时平息了人们对过去一年数据中心设备支出狂潮可能导致放缓的担忧。财报发布后,英伟达股价上涨 9.32%,突破 1000 美元,市值达到 2.55 万亿美元,与苹果(2.87 万亿美元)只差 3200 亿美元。今年以来,英伟达股价已上涨了 109.6%。 01 数据中心依然马力十足 英伟达的业务分为四个主要板块:数据中心、游戏、专业可视化和汽车业务。 其中,数据中心业务是最受关注的部分,也是英伟达的核心增长驱动力。在 2024 财年第四财季,英伟达的数据中心业务收入达到 184 亿美元,是前一年同期的 5 倍多,并刷新了前一个财季的历史新高。 英伟达 2025 财年一季度关键财务指标 | 图片来源:财报截图 从最新数据来看,数据中心业务依然表现强劲。2025 财年第一财季,英伟达的总营收为 260 亿美元,其中数据中心业务贡献了 226 亿美元,同比增长 427%,环比增长 23%。数据中心收入创下历史新高,占比进一步增长到 86.9%。 英伟达首席财务官 Colette Kress 表示,数据中心业务的增长主要得益于 Hopper 架构 GPU(例如 H100)的出货量增加。与去年相比,计算收入增长了 5 倍多,网络收入增长了 3 倍多。 此次财报中,英伟达首次披露了数据中心业务的具体收入细项。其中,计算收入达到 193.92 亿美元,同比增长 478%;网络收入为 31.71 亿美元,同比增长 242%。计算收入主要来自 Hopper 平台,而网络收入的增长得益于 InfiniBand 端到端解决方案的强劲表现。 值得一提的是,目前大型云服务提供商,如亚马逊、Meta、微软和谷歌,大约占英伟达数据中心收入的 40%。此外,许多领先的大型语言模型(LLM)公司,如 OpenAI、The Depth、Anthropic、Character AI、Cohere、Databricks、DeepMind、Meta、Mistral 和 xAI,都在利用云服务构建 NVIDIA AI。 当然,英伟达希望业务多元化,不仅依赖于这些大客户。黄仁勋在财报中指出,人工智能正在扩展至各国政府、消费互联网公司、汽车制造商和医疗保健客户,这些新领域可能会在云服务商之外创造多个价值数十亿美元的垂直市场。到第一季度末,英伟达已经与 100 多家客户合作,建立了规模从数百到数万个 GPU 不等的人工智能工厂,有些甚至达到了 10 万个 GPU。 其中,汽车和消费互联网领域表现尤为突出。英伟达首席财务官 Colette Kress 透露,特斯拉为了进行 AI 训练,购买了 35,000 块英伟达 H100 GPU,这些 GPU 用于特斯拉最新的自动驾驶系统 FSD V12。Kress 表示,今年汽车行业将成为英伟达数据中心业务中最大的垂直市场,带来数十亿美元的收入机会。 特斯拉自动驾驶系统 | 图片来源:视觉中国 另一大亮点是 Meta 发布了最新的大型语言模型 Llama 3。该模型在 24,000 块英伟达 H100 GPU 上训练完成,为 Meta 旗下的 Facebook、Instagram、WhatsApp 和 Messenger 的新人工智能系统 Meta AI 提供支持。Llama 3 不仅提升了这些平台的 AI 功能,还在各行业掀起了一股 AI 开发热潮。 令人惊讶的是,过去一年中,大模型的推理场景已经占据了英伟达数据中心 40% 的营收。这表明,大模型在许多实际应用中确实带来了显著的业务和业绩增长。 此前,多位云计算行业人士曾表示,去年采购英伟达 GPU 主要用于大模型的训练。随着大模型在实际场景中的广泛应用,算力更多地被用于推理。 除了数据中心业务,英伟达的游戏业务在第一季度实现了 26 亿美元的营收,同比增长 18%。相比之下,汽车芯片和图形工作站芯片的影响相对有限,第一季度分别实现 4.27 亿美元和 3.29 亿美元的销售额。 得益于数据中心业务的快速增长,英伟达在 2025 财年第一季度的财务表现非常亮眼,显示出强劲的增长势头和盈利能力。2025 财年一季度,英伟达的营收达到 260 亿美元,较上一季度增长 18%,同比激增 262%,显著超过分析师预期的 246.5 亿美元。 英伟达 GAAP 净利润为 148.81 亿美元,同比暴涨 628%,环比增长 21%;非 GAAP 净利润达到 152.38 亿美元,同比增长 462%,环比增长 19%,每股收益为 6.12 美元。毛利率从上一季度的 76.7% 提升至 78.9%。这些数据表明,英伟达在数据中心领域的快速增长和市场竞争力显著增强,其财务状况非常健康。 02 中国业务大幅下滑 英伟达不仅在当前季度实现了超预期的营收,还为未来的稳定增长做好了布局。根据他们的二季度预期指引,英伟达预计营收将达到 280 亿美元,预计 GAAP 毛利率为 74.8%,全年毛利率将稳定在约 70% 左右。 这一预期超出了市场的普遍预期,也暂时消除了此前市场对人工智能需求不足的担忧。微软、谷歌、亚马逊和 Meta 等四大科技公司在一季度的财报显示,今年他们在云计算领域的资本投入高达 1770 亿美元,远高于去年的 1190 亿美元。预计到 2025 年,这一数字还将增至 1950 亿美元。这些大额投资预计将继续推动英伟达在数据中心收入和利润的持续增长。 2024 年 GTC 峰会上,黄仁勋展示了新款 Blackwell GPU 芯片 | 图片来源:视觉中国 除了业绩指引,英伟达的 Blackwell 系列芯片的最新进展也备受关注。随着英伟达从 Grace Hopper 芯片到 Blackwell 芯片的过渡,引发了市场对 Hopper 和 H100 产品的需求变化的担忧。据报道,亚马逊网络服务(AWS)暂停了对 NVIDIA Grace Hopper 解决方案的订单,转而等待更强大的 Grace Blackwell 超级芯片的推出。AWS 对此表示,他们并未完全停止对 NVIDIA 最先进芯片的订单,而是在特定项目中进行调整,例如他们与 NVIDIA 共同开发的 Project Ceiba 超级计算机。 对此,黄仁勋表示,Blackwell 芯片已经进入生产阶段,预计将在第二季度开始出货,并在第三季度加速。客户将在第四季度完成数据中心的部署,这将为英伟达带来显著的收入增长。这个表现超出外界的预期。 他还强调,尽管市场开始向 H200 和 Blackwell 过渡,但对 Hopper 和 H100 产品的需求依然旺盛。客户希望尽快部署新的基础设施,以提高效率并增加收入,这导致了对旗舰 AI 训练模型的持续需求。 在财报电话会议的最后,黄仁勋提到,为了应对 GPU 和定制 ASIC 的激烈竞争,英伟达制定了未来十年的技术发展路线图。 他们致力于推进 NVlink、InfiniBand 和以太网计算架构。在 Blackwell 之后,英伟达计划每年推出一款新产品。他们还制定了以太网的发展路线图,将很快推出新的网络技术 Spectrum X,并由戴尔推向市场。此外,英伟达还将推出 InfiniBand 计算架构。 所有这三种计算架构都运行 CUDA 及其整个软件堆栈,为用户提供更快的运行速度和更多的云与数据中心选择。英伟达的创新不仅提高了性能,还降低了总拥有成本(TCO)。凭借其架构,英伟达将引领新一轮的技术革命。 与此同时,英伟达在中国市场的供应情况备受关注。此前,中国市场一直占据英伟达数据中心收入的 20% 至 25%。然而,自去年 10 月美国发布最新芯片出口限制后,英伟达在中国的业务受到了极大限制。2024 财年,中国业务在英伟达营收中的比例只有个位数百分比(5%)。 今年早些时候,英伟达开始向中国客户提供符合美国出口管制的特供版 AI 芯片 H20。不过,英伟达高管在财报会上承认,今年第一财季公司在中国的销售额「大幅」下降。黄仁勋预计,中国市场未来的竞争将更加激烈,主要由于技术限制加剧了当地市场的竞争。他表示,英伟达将继续尽最大努力为中国客户和市场服务,并强调「我们会尽力的」。 创纪录的财务表现下,英伟达也有隐忧。在芯片制造端,英伟达还面临谷歌、微软、AMD、英特尔、博通等其他竞争对手抢订单。据了解,谷歌多年来一直与博通合作生产自己的 AI 芯片;亚马逊则于 11 月宣布推出新的 AI 芯片,同月微软表示也将开始生产定制 AI 芯片。 另一方面,随着越来越多的通用大模型被训练出来,企业开始将关注点转向 AI 推理。对于头部互联网和大模型公司来说,今年的挑战是大模型的落地和变现。而对于其他企业,如何挑选合适的大模型融入生产或业务流程以创造价值,是更重要的命题。英伟达需要确保其「护城河」能够持续提供竞争优势,以应对这些挑战。
再战618:小红书的新人大考,视频号等待成年
作者 | 赵卫卫 618,对于电商第二梯队的小红书和视频号来说不再是新鲜事。今年是小红书的第二次,视频号的第三次。 当下的电商格局中,小红书和视频号最大的共性就是入局晚、体量尚小、亟待打造标杆,对于二者来说,「立」是关键;但对于阿里、京东等老牌电商来说,「破」才是关键,所以取消预售机制,主打「现货开卖」成了后者的最大变量。而且今年 618 的战线格外长,老牌电商纷纷把第一拨大促提前到 5 月 20 日。 小红书和视频号最大的区别,莫过于入局姿态的早晚。「抢跑」的小红书要在电商市场中「抢肉」吃,5 月 21 日就率先发布了战报——首日直播 GMV 为去年同期的 6 倍;视频号依然「晚点」,选择在 5 月 31 日才开始「618 好物节」。 低价,永远是 618 大促的核心。平台间的分野是,阿里、京东和抖音要的是深耕用户防止分流,而小红书和视频号这样的内容电商,要的是争夺用户培育习惯、促进转化。两边用户的重合度越来越高,所以他们选择哪一方下单,可能是 618 大促节点的主要看点。 比如,对于国内很多新锐的家居设计品牌来说,一手天猫一手小红书,已经成为他们线上渠道的标配,穿梭于两个平台的直播间也是 618 大促期间的常态。而从视频号近期的推广案例也不难看出,昔日在抖音电商中取得辉煌战绩的家纺商家,已经开始在视频号撬动了更大的增量,手心手背都是肉。 为有源头活水来,当下精准分散的消费市场中,视频号是抖音商家的增量,小红书则是天猫商家的活水。 小红书,新人的首次大考 「直播电商是一个苦活。」多位小红书商家告诉「蓝洞商业」,今年整个电商大环境的压力很大,预计今年 618 会是一个精准分散消费的市场,也就是用户的消费决策会在多个平台和商家之间选择比较,综合需求和价格等多个维度考量,而不是对某一个平台和品牌保持专一。 或许正是这样的压力,相比去年在电商市场的高歌猛进,今年小红书在电商市场「抢肉」的动作更进了一步。 决心和野心最先表现在人身上。去年年底,曾传出小红书将在今年下半年启动香港 IPO,小红书方面随即否认了这一传闻;但此后小红书人事变动频繁,先是引入原滴滴供需策略负责人吴颖炳、顺风车业务负责人张瑞,加强电商和商业化力量,后来原快手电商产品负责人叶恒担任电商C端产品 1 号位。 今年是小红书第二次参与 618,但是是电商新团队的首次大考。懂电商的人到位了,真金白银的资源投入了,买手电商能不能行就看今年的 618了。 国内家居设计品牌吱音的创始人Lily,最近每天晚上都穿梭于天猫和小红书的直播间,直播往往持续到深夜 12 点,吱音的小红书直播间经常出现在品牌榜第一名的位置。 吱音品牌创立 11 年,最早从淘宝开始做线上渠道。为了突破圈层触达更精准的人群,吱音从 2021 年持续在小红书发布笔记,2023 年小红书开始押注「买手电商,」吱音才正式通过直播带货在小红书上发力,很快收获了单场直播破百万的成绩。 吱音在小红书的618活动主页 从数百元的椅子到上万元的真皮沙发,吱音的家居产品价格天然符合小红书人群消费的特性——小众化、高客单价、中高端品牌为主。同时,吱音也在抖音和视频号做了布局,但只是内容的简单分发,因为「精力有限,只能先聚焦一件一件事情慢慢来。」 而今年的 618,天猫和小红书的区别是什么?最直观的答案往往就是价格。 以吱音的爆款产品莫比乌斯椅子为例,在全渠道的价格是统一的,但用户在各自手机中看到的价格却不同,因为平台会做各自的优惠机制,比如天猫的 88vip 会员、小红书补贴的 40 元新人优惠券等。所以,对非天猫 88vip 会员来说,小红书上买一款莫比乌斯椅子要便宜 40 元左右,扶持力度可见一斑。 「不论是天猫还是小红书,吱音都是当作和用户沟通设计理念的平台。」Lily 认为,「作为一个设计品牌,尤其是创新驱动的设计品牌,我们更应该专注做好自己擅长的产品和事情。」 过去一年,家居赛道成为小红书上快速增长的热门领域。 最典型的案例莫过于素人博主@一颗 KK,去年小红书首次参与 618,作为家居买手的@一颗 KK 单场直播取得 2000 万的 GMV;随后的双十一期间,她联合了众多国货家居设计品牌参与,GMV 突破了 1 亿,很多品牌也有了过百万甚至超 500 万的销量,吱音就是其中之一。 Lily 就是在@一颗 KK的鼓励下,才从一个内心沉静的 i 人转变成了 e 气风发的主播,单场直播破百万,吱音也入选了小红书电商年度 rise100。她总结说,「要耐得住初期对着空气说话的寂寞,坚强度过颗粒无收的种草期(尤其是家具这类低频消费品),最终才能迎来销售转化。」 一手小红书,一手天猫店,如今已经成为很多 618 商家的标配。 小红书的高客单价特性无疑吸引了向往淘金的商家们,小红书的用户愿意为高品质、独特审美的产品买单,一位电商从业者对「蓝洞商业」透露,其公司产品在小红书直播客单价平均为 1000+,而同期在抖音上的客单价往往在 400+ 左右。 「现在小红书的流量分配格局很明显,直播间已经成为电商成交的主战场,品牌方需要确定性的收益,而做了买手直播电商和没有做的,营收差距往往有七八倍。」一位腰部小红书博主对「蓝洞商业」透露。 去年双十一大促,小红书也是最先抢跑,拿出买手章小蕙直播销售额破亿的成绩单;今年 618,小红书求快的姿态依然明显,最先晒出战报:618首日直播订单数为去年同期的 8.2 倍,首日直播成交 GMV 为去年同期的 6 倍,直播间购买用户数为去年同期的 7.4 倍。 但光鲜的数字掩饰不了背后的焦虑,尤其是在 618 这样流量昂贵的大促期间,谁会是小红书上下一个像@一颗 KK 一样成长起来的腰部买手? 小红书的内容产品特性,注定其买手电商要走一条区别于传统电商平台和短视频平台模式的路,而且这注定是一条无可复制的商业化之路。 视频号,佛系依旧? 打造标杆样本,是每一个直播电商初期的重中之重。从微信公开课 5 月份推广的一个视频号直播电商案例,就可以窥见其与抖音在带货能力上的差距。 《视频号「自播+达播」真香!水星家纺半年爆卖 8000 万》,微信公开课这篇内容明确传达出的信息只有两个,一个是方法——「自播+达播」;另一个是结果——去年下半年,水星家纺销售了 8000 万,平均客单价达到 200 元以上,成为了视频号中家纺类目的 TOP 商家。 水星家纺这家公司,被视频号看作平台上第一批「吃螃蟹」的商家,这个案例对当下的视频号来说是一种成绩,但放在行业维度上,可能还不如 2022 年抖音的带货能力,水星家纺早在抖音上「吃螃蟹」了。 2022 年 618 前夕,水星家纺在抖音超级品牌日上,通过与明星达人直播间合作,活动期间创下了 5900 万的销售总额,登顶抖音电商消费电子家居行业单品牌销售额第一的位置,店铺新客率达 93.3%,品牌相关词搜索 UV 环比增长 485%。 从方法上看,水星家纺在抖音和视频号上都是自播+达播,但结果差距明显。也就是说,2023 年下半年销售额 8000 万,与 2022 年一个月活动销售额 5900万,可以看作是两家在带货能力上最直观的对比。 水星家纺的视频号直播界面 更本质上反映的是,水星家纺这家公司的前瞻性,先拥抱抖音,再入局视频号。其 2020 年就开始入驻抖音,在抖音上培育两年多之后才有了活动期间 5900 万的 GMV。如今,抖音和视频号都是其电商获客的渠道之一,整个 2023 年,水星家纺营业收入 42.1 亿,其中电商渠道收入同比增长了 11.7%。 今年的 618,是视频号第三次入局购物节, 但相比淘宝、京东和小红书等平台,都晚了一些。视频号团队不可能不知道,2023 年 618 各大电商平台预售期开始的日子,都提前到了 5 月 23 日左右。 在各家已经开战的第二天,也就是 5 月 21 日上午,腾讯才发布了今年视频号 618 大促计划,活动持续 19 天 ,从 5 月 31 日到 6 月 18 日,官方奖励包括技术服务费率减至 1%、发电商成长卡激励、GMV 目标任务激励等等,参与的对象包括视频号小店和达人号。 而此时,小红书已经拿出了开门红战报;天猫已经在前一天晚上开始了第一拨现货售卖期;三天后,抖音商城的 618 好物节也将全面启动,电商平台们一心求变,纷纷把大促的战线拉长,而视频号却保持着过往的慢姿态。 在各大电商 618 造势的喧嚣声中,视频号不急吗?答案显然是否定的。 在视频号 618 大促计划发布一周之前,腾讯广告官方就官宣了招商计划。今年 6月 18 日,明星钟丽缇将做客视频号,打造 618 直播盛宴,「直播总时长不低于 10 小时」,试图通过明星达人带动品牌的销售购买和种草,腾讯广告此举是为了招揽服饰、运动、美妆、食品等多行业的商家占领坑位。 更重要的是,视频号之于腾讯的重要性已经不言而喻,「养家」的任务已经重担在肩。 去年年末,「晚点Latepost」曾披露,微信视频号电商的 GMV(总成交额)在 1000 亿元左右,腾讯还将进一步扩大视频号电商业务的队伍:除了负责前端产品的视频号直播团队外,微信支付团队也将加入视频号电商的建设,参与各行业类目、达人、客户的拓展与运营,以及交易产品等基础功能的搭建。 视频号的商业化真实数据正在揭开面纱,2022 年,腾讯业绩连续三个季度下滑,腾讯首次在财报在提到视频号的收入,这成为财报中为数不多的亮点之一。当时视频号直播服务收入成为腾讯增值业务增长的核心因素之一,贡献了 291 亿的收入。 去年第二季度,腾讯财报中首次公布了视频号的广告收入——超过 30 亿。随着微信用户不断养成在视频号购物的习惯,电商无疑是拉动视频号广告收入的重要原因之一。但此后腾讯没有单独披露过视频号的商业化数据,视频号与小程序、公众号等一道,为今年一季度的腾讯贡献了 265 亿的广告收入。 今年 618,已经是视频号的第三次出征。 作为腾讯内部增长最快的业务之一,视频号能够取得什么样的成绩,显然是衡量其电商能力的关键大考。此前有腾讯内部人士透露,视频号直播今年的目标增速是 100%,在电商追逐低价的一片红海市场中,视频号电商的私域属性,是破解难题的关键之一。 但只有腾讯选择公布视频号电商的 GMV 时,才是视频号真正的成年之时。
腾讯、阿里看中的月之暗面,还在戴着商业化的面纱
“月球的暗面是神秘和未知,但人类总有向前探索的勇气和信心”。这或许一定程度上揭示了大模型公司月之暗面成立的初衷。 作为当前大模型这一火热市场中的明星独角兽,月之暗面站在风口上,无论是产品迭代还是资本角力,其一举一动备受关注。 松果财经获悉,月之暗面正在进行新一轮融资,估值达到30亿美元,新的投资者包括腾讯、高榕创投等。 而据天眼查,在今年2月,该公司就已获得超10亿美元融资,估值达到约25亿美元。据悉,此次创下了国内大模型领域单笔融资纪录,参与其中的就有阿里巴巴、小红书等互联网企业以及老股东红杉中国、砺思资本等。 有知情人士透露:“当下月之暗面的股东名单,至少囊括二十余家投资方的豪华天团。”显而易见,对于投资者而言,这是一个不容错过的“好标的”。 诚然,当前大模型领域风起云涌,前景广阔,正如中商产业研究院发布的《人工智能系列专题之中国人工智能大模型产业全景与机会洞察专题研究报告》显示,2020-2022年,我国大模型产业市场规模从15亿元增长至70亿元,年均复合增长率达116.02%,预计2024年产业规模将达216亿元。机遇在前,投资者必须积极把握。 但月之暗面何以不容错过?投资不是只看到风口,而是有一套内在的筛选标准。有投资者曾指出一个“好标的”,除了具有金融属性,最重要的是“随着时间的增长,会越来越好,或者越来越有价值”。 目前来看,月之暗面的业务发展走势显然是持续上行的。 具体在产品层面,最新数据显示,2024年4月,月之暗面旗下的Kimi智能助手网页版访问量达到2004万,较上月上涨60.2%,访问量已经超过文心一言,排在国内同类产品榜的第一位。另外,根据QuestMobile的数据,2024年3月,Kimi智能助手APP的月活跃用户量是589.7万,Kimi智能助手微信小程序月活跃用户已经突破91.1万。 而当前大模型产品层面的竞争显然是十分激烈的,数据显示,截至2024年3月,通过国家网信办备案的大模型名单有117个。这种情况下,Kimi能够脱颖而出,无疑需要一定实力。 据悉,Kimi主打长文本输出,发布时可以支持20万汉字的输入,是Anthropic的Claude2-100k(约8万字)的2.5倍,OpenAI的GPT-4-32K(约2.5万字)的8倍。而在今年3月,月之暗面宣布,Kimi智能助手在长上下文窗口技术上再次取得突破,无损上下文长度提升到200万字。对于用户而言,Kimi在阅读理解、文献分析、长文写作等任务上具有独特优势。 此外,月之暗面在产品布局上ToC的定位也对其发展产生较大赋能,创始人杨植麟曾表示,“ToC是一个自然而言的选择,看到的是一个成为AI时代Super App的机会”。 长远来看,大模型常态化应用以及更大范围的商业落地,必然需在C端开展,通过不断“收割”用户,有望打开更大的商业空间。而且,对于大模型产品的迭代升级而言,C端是天然的“练兵场”。 但一个不可忽视的问题是,现阶段C端大模型商业化前景仍不显著,尤其是在阿里、百度、科大讯飞等科技大厂都在推行大模型产品降价的当下,C端大模型要开启收费模式、进一步做好市场教育,其实并不容易。 但考虑到大模型的真正落地,商业化必然纳入相关公司的考虑项。据悉,日前Kimi推出打赏功能,提供了六种不同的选择:5.2元/4天、9.99元/8天、28.8元/23天、49.9元/40天、99元/93天、399元/365天。 对于Kimi是否将就此走向付费,月之暗面相关负责人做出解释:“Kimi还是免费的,不着急的用户在高峰期算力不足时稍等一下也可以继续使用Kimi。” 但这也可以看成月之暗面对商业化的一大试水,而其如何在商业获量和技术投入之间取得平衡,还需交给时间验证。
OpenAI碰瓷斯嘉丽·约翰逊!没必要,真没必要
前两周在OpenAI发布会上大放异彩的ChatGPT-4o Sky语音,最近悄然下架。 OpenAI发布会上展示的核心功能“多模态语音对谈”开放的进程再次延缓——在OpneAI官网上,GPT-4o向全部用户免费开放的时间从原来的几周,悄悄咪咪地改成了几个月。 OpenAI深更半夜发表推文,Sky声音已经撤掉 这当然可能和扩容时遇到的技术问题有关,但还有一个问题是,最近知名演员斯嘉丽·约翰逊的法律团队向OpenAI发了两封信,要求OpenAI公布ChatGPT-4o语音“Sky”(简直是斯嘉丽的谐音)的制作过程,因为这个声音听起来跟斯嘉丽·约翰逊简直是一个模子里刻出来的。 如果还是不好理解的话,你可以想象一下某导航软件推出新语音包,听起来激似林志玲,导航软件老板是林志玲粉丝,语音包名字还叫玲玲。 OpenAI官网还更新了Blog,极力辩解“Sky”跟斯嘉丽·约翰逊没有关系|OpenAI 斯嘉丽·约翰逊向美国媒体表示,听到Sky的声音后,她“感到震惊、愤怒”,不敢相信奥尔特曼竟然选了一个和自己声音一模一样的配音,“连我最亲密的朋友和新闻媒体都区分不出来”,约翰逊说。 尽管OpenAI坚称GPT-4o的声音绝不是斯嘉丽·约翰逊,OpenAI CTO米拉·穆拉蒂(Mira Murati)在接受采访时甚至说,“完全没有学斯嘉丽·约翰逊的意思,为了这个事我甚至得专门去听听斯嘉丽·约翰逊的声音是啥样的”。 不管穆拉蒂知不知道斯嘉丽·约翰逊,但OpenAI CEO奥尔特曼绝对知道,因为—— 奥尔特曼是斯嘉丽粉头啊! 在GPT-4o发布之前,奥尔特曼就“碰瓷”过斯嘉丽·约翰逊。5月14日,奥尔特曼在X上发了一条推文,只有一个词,“her”。 这个词明确指向了2013年的科幻电影《她》。在这部电影里,男主角爱上了由斯嘉丽·约翰逊配音的人工智能Samantha,奥尔特曼也曾在采访中表示,《她》是他最喜欢的电影。 而据斯嘉丽写给媒体的信,奥尔特曼直到GPT-4o发布前两天还在极力邀请她配音。 “去年9月,我收到了奥尔特曼给GPT-4o配音的邀请。他告诉我,我的配音可以架起科技和创意之间的桥梁,让消费者在从人类到人工智能的巨变过程中感到舒适。他说他觉得我的声音会让人们感到安慰。”约翰逊写到。 但她出于个人原因,十分感动然后拒绝了奥尔特曼。 奥尔特曼并没有就此放弃,在ChatGPT发布会的前两天,他再次联系了约翰逊的经纪人,请求她重新考虑。但很显然,这是一招先斩后奏,在打电话之前,GPT-4o就已经做好了。 发布会之后,所有人都发现Sky的声音像约翰逊了,美国国民节目《周六夜现场》还公开吐槽GPT碰瓷,说不知道追求那个声音意义何在,如果声音离开了约翰逊本人的身体那谁还想听呢。 奥尔特曼:我想听 约翰逊在信里继续写到: “由于OpenAI的行为,我被迫聘请了法律顾问……要求他们详细说明创建Sky的制作过程。” 在这之后,OpenAI就暂时关闭了Sky的语音。 Sky的声音怎么来的? 在约翰逊的要求下,OpenAI发Blog描述了GPT-4o语音的制作细节(虽然暂时没有其他证据证明OpenAI说的是真的)。 OpenAI称,他们从400个声音中挑选了五个月,才选出了GPT-4o的五个声音(分别是Breeze、Cove、Ember、Juniper 和 Sky)。他们和专业配音演员、经纪公司、选角导演和行业顾问合作完成了这个工作。 在选择合适的声音时,他们制定了一套标准,其中包括几个重要的考量角度: 1、背景丰富或会说多种语言的配音演员,加分 2、声音要给人一种“永恒(timeless)”的感觉 3、声音要平易近人,能激发信任 4、声音温暖、迷人、鼓舞人心、富有魅力,音调丰富 5、声音自然,易于聆听 虽然其中有些标准挺抽象的(比如说一个声音要怎么又有永恒感又平易近人?),但不得不说,DAN和Sky能有这么高的人气和感染力,和它们的声线是分不开的。 OpenAI表示,GPT-4的配音选拔是从2023年5月10日开始的,不到一周,他们收到了400多份配音申请。在试镜时,配音演员们需要朗读一份ChatGPT回复文案,文案内容包括了从正念冥想、旅行计划、到和用户聊天在内的一系列场景。 之后,OpenAI和每个配音演员讲解了GPT-4的功能、局限性和所涉及的风险,确保每个配音演员在加入之前都充分了解了语音模式的范围和意图。 OpenAI补充道:每位演员的报酬都高于市场最高水平,只要他们的声音在我们的产品中使用,这种报酬就会持续下去。但为了保护配音演员的隐私,OpenAI不能透露Sky配音演员的姓名。 这场争端对约翰逊来说是轻伤,对OpenAI来说可能是重伤。 在Deepfake之后,公众对于用AI技术换脸、换声音的潜在危险本来已经非常敏感了,OpenAI作为能左右行业风向的大佬,不仅没有在安全方面做出更大的努力,反而沾上了未经允许用公众人物声音“炼”AI的嫌疑,只能让人们对AI的信任更浅。 此外,OpenAI一直有跳票和“实物缩水”的前科,去年GPT-4的读图功能拖延了6个月才用上,今年发布会上所做的承诺也迟迟不兑现,不免让人觉得OpenAI是为了狙击接下来要发布新产品的谷歌而放出没有完全成熟的技术。经过了这次声音争端,GPT-4o的兑现时间再一次被延后了,属实有点搞笑。 甚至想问问奥尔特曼,GPT-4o的声音像不像《她》,真的那么重要吗?真的有用户在乎吗?
Altman被曝七宗罪,OpenAI竟欲加密GPU合作军方?员工大批离职团队濒临崩溃
【新智元导读】刚刚,有网友仔细总结了OpenAI的七宗罪,对Altman发出愤怒的诘问:为何计划跟踪GPU?为何合作军方?员工滚雪球式离职的消息不断曝出,整个对齐团队已经濒临崩溃,「说谎」「心口不一」的形象愈发鲜明,Altman正在失去民心。 OpenAI的离职潮,已经像滚雪球一样,根本停不下来了。 Ilya的离去,仿佛是压弯骆驼的最后一根稻草。 由Ilya领衔的超级对齐团队,是防止AGI失控、保护人类的最后一道屏障。 然而Altman统治下的OpenAI,把光鲜的产品置于安全之前,让超级对齐团队在计算资源方面捉襟见肘,完成关键研究变得越来越困难。 不断离职的超级对齐团队员工纷纷表示:我们已经彻底失去信心,无法再对OpenAI在AGI时代的行为负责了。 昨天曝出的股权协议原件,更是让Altman言行不一的面目暴露出来——文件上明明有Altman的签名,他却极力否认自己对此事知情。 在OpenAI这个可能影响全人类命运的机构中,究竟发生了什么?? 现在,已经有愤怒的网友发帖,历数了OpenAI的七大罪状:无视AGI风险、逼迫员工放弃股权却装失忆、反对开源、跟踪GPU、泄露隐私、和军方合作等等……桩桩件件都附有参考链接。 01 又一对齐员工离职 OpenAI的超级对齐团队,现在就像多米诺骨牌一样。 上周,首席科学家兼联合创始人Ilya Sutskever宣布辞职,紧接着高管Jan Leike也辞职了。 Leike指责OpenAI把「光鲜的产品」放在安全之前,并表示超级对齐团队「在计算资源方面捉襟见肘」,完成这项关键研究「变得越来越困难」。 这周和上周的离职事件,紧随另外两名安全研究员Daniel Kokotajlo和William Saunders,也出于类似的原因离职。 如今, 又有一名团队成员高调宣布了自己的离开。 在得知Ilya Sutskever和Jan Leike的消息前几个小时,我就已经选择了离职。 我们需要做更多的工作来改进决策过程、问责制、透明度、文档记录、政策执行、使用自身技术时的谨慎态度,以及减少对不平等、权利和环境影响的措施。 这些担忧对于现在的社会来说非常重要。它们影响着未来发展的方向,以及由谁来引领。我想强调的是,不管是我们内部的还是来自其他人的担忧不应该被误解为狭隘的、推测性的或不相关的。它们不是。 科技公司往往会通过在提出质疑或挑战其权力的人之间制造分歧,来削弱那些试图对其进行问责的人。 我很感激自己有能力和支持去做这件事,这在很大程度上要归功于Daniel Kokotajlo给的勇气。我也明白,在整个行业中,还有很多人无法做到这一点。 OpenAI仍在开展许多重要工作,包括扩大访问权限、准备框架开发、增强信心的措施,以及解决我之前提到的担忧。我仍然对这些工作及其成功充满期待和投入。 02 历数OpenAI「七宗罪」 Ⅰ 无视AGI风险,超级对齐分崩离析 至此,我们已经无法再用玩梗蒙蔽自己了。. Ilya等安全团队的人员离去,大概率跟AGI或者GPT-5都无关,而是被逼得走投无路。 自从OpenAI发生第一轮宫斗、Sam Altman被罢免以来,整个OpenAI的情绪就不对劲了。 显然,Altman在合作伙伴关系和产品重点方面的发展方向,已经超出了大多数人能接受的程度。 他的危险面目,随着时间线的推移,也越来越清晰地暴露出来。 Ⅱ 跟踪GPU,随时撤销GPU许可证 而且,OpenAI最近公布的AI治理计划,也掀起了轩然大波。 OpenAI提出,将加密保护扩展到硬件层,实现以下属性—— 1. GPU可以通过加密方式验证其真实性和完整性。 2. 具有加密原语的GPU可以使模型权重保持加密状态,直到它们被暂存并加载到GPU 上。这在主机或存储基础设施受到损害时,增加了重要的深度防御层。 3. 具有唯一加密身份的GPU,可以为特定GPU或GPU组加密模型权重和推理数据。完全实现后,这可以使模型权重只能由属于授权方的GPU解密,并且可以允许推理数据从客户端加密到服务其请求的特定GPU。 这些内容,无疑让人恐慌。 比如第一句:GPU可以通过加密方式验证其真实性和完整性。 这也就意味着,如果我们从英伟达买一块GPU,它会像DRM一样进行签名,从而被批准运行和加速AI模型。 假如一个小公司来购买硬件,现在就需要经过额外的层层审批,才能把自己的硬件推向市场,这无疑很可怕。 大概没有多少人希望自己的GPU是签名的,大家都会希望使用匿名的GPU。 第二条也很诡异,必须每个硬件上都有签名,才能允许我们运行AI,这简直是一件荒谬的事。因为如果上面有签名,他们也就可以撤销签名,谁有权决定呢? 第三条也是如此,模型权重只能由属于授权方的GPU解密,这个权力属于谁? 而其中这句话,也显示出OpenAI的重点在于保护模型权重,而非开源,或开放权重,这个观点已经与开源AI的大力支持者大相径庭了。 一名网友锐评道:这些关于安全和保障的很多想法,让我摸不着头脑,很多内容显示出,OpenAI正在全力以赴地关注闭源架构,这让我更感激Meta这样的开源公司了。 Ⅲ 签字逼迫员工放弃股权,事后装失忆 前几天此消息曝出:如果OpenAI员工在离职时拒绝签署要求严苛的协议,无法保证永不批评OpenAI,那他们可能就会失去已有的OpenAI股权。 瞬间让科技圈炸锅。面对群情激愤的声讨,Altman紧急发布道歉声明,表示自己从不知道OpenAI有威胁股权的条款,以后也不会这样做。 然而他随后就被打脸了,外媒扒出了更多内部协议。 这些文件显示,OpenAI几乎拥有所有权利,可以任意将股权从前员工那里收回,或者阻止他们出售股权。 签署这些文件的,正是Sam Altman,签署日期为2023年4月10日。 随后,更多霸王条款曝出。比如OpenAI发给离职员工一份冗长且复杂的终止文件,需要在七天之内签署完毕。 这意味着,前员工仅有一周的时间,去决定是否接受OpenAI的「封口费」,否则就会失去数百万美元股权。 而且,当前员工要求额外2-3周的时间寻求法律援助并审查文件时,却遭到了OpenAI的强烈反对。 「The General Release and Separation Agreement」(概括性索偿弃权书和离职协议)需要你在7天内签署。我们希望确保你明白,如果你不签署,这可能会影响你的股权。这对每个人都是一样的,我们只是按规章办事」。 对此,加州的就业律师Chambord Benton-Hayes表示,「一家企业威胁收回已归属的股权是极其恶劣和不寻常的」。 然而,OpenAI大多数前员工,却对这样的霸王条款屈服了。 而整件事最荒谬的,还是以Altman为首的OpenAI高管事后堂而皇之的装傻。 Ⅳ 和News Corp合作,ChatGPT中也会有广告了 昨天,在一片乱中,OpenAI依然官宣了和新闻集团News Corp的合作,并将之成为「里程碑意义的多年全球合作伙伴关系」。 根据协议内容,News Corp的新闻内容都会引入OpenAI。 OpenAI有权显示相关媒体报头的内容,用来回答用户问题,目的是「让人们根据可靠的消息和新闻来源,做出明智的选择」。 News Corp旗下的出版物,包括《华尔街日报》、《巴伦周刊》、《MarketWatch》、《投资者商业日报》、《FN》、《纽约邮报》、《泰晤士报》、《星期日泰晤士报》、《太阳报》等等。 对此,网友评价说:看这个名单就知道,OpenAI选择了非常糟糕的合作方。 这些媒体一向把右翼宣传作为商业模式,引起政治讨论,使用一切必要的手段来推动叙事,甚至曾通过福克斯新闻否认2022年的总统选举。 甚至News Corp还曾卷入这样一起丑闻,涉嫌侵入600多人的手机,来获取情报。 从此,我们使用OpenAI的产品时,无可避免地会受到某些倾向的影响。 而且,以后AI聊天机器人的世界,也将到处充斥着广告。 不久前一份泄露的文件显示,OpenAI计划在GPT聊天中,纳入品牌优先权。 根据文件,凡是加入该计划的公司,都会在ChatGPT等产品的聊天对话中获得优先权,品牌能够露出得更多,链接中也会更强调它们的内容。 而且通过PPP,OpenAI甚至还会向出版商提供许可的财务条款。 获得更丰富产品表达的公司,将拥有品牌悬停链接、锚定链接和内嵌处理。 悬停处理中,OpenAI会在搜索查询的响应中,超链接关键字。这些链接会显示为蓝色文本,鼠标悬停在上面时,会显示可单击的选项卡。 在锚点处理中,ChatGPT对用户查询响应的下方,会出现一个可点击的品牌化按钮。 内嵌产品则会在ChatGPT响应的文本中插入引文,字体更大,并且包含可点击的品牌链接。 总之,ChatGPT从此会变成被商业广告操控的世界。 Ⅴ 和微软一起反对开源 开源和闭源之争中,OpenAI已经联合微软正式下场,试图对政府施加影响了。 最近,由科技巨头、初创公司和风险投资家组成的联盟,正在花费数百万美元来说服华盛顿,让他们相信对AI世界末日的担忧被夸大了。 他们的行动已经产生了影响。他们的影响力网络在推动这样一种观点:与其说AI是一种生存威胁,不如说是一个重要的商业机会,绝不能让严格的安全措施,把美国的AI优势拱手让给他人。 华盛顿的游说格局,已成为一场由大量资金支持的、近乎哲学争论的战争。 微软和OpenAI这一派的观点是,提倡严格的安全限制和许可要求。严格的限制,显然对拥有最强大AI的公司是有利的。 而Meta、IBM等公司,更依赖于开源AI模型,而非OpenAI、谷歌等追求的闭源框架,因此他们力图推动一种规则更少、更加开放的方法。 无论是IBM还是Meta,都在开源斗争中投入了大量的游说资源。自从2023年中期的AI辩论爆发以来,IBM为游说华盛顿投入了400万美元,Meta则花费了超过1700万美元。 而OpenAI,当然不希望这些开源既得利益者迎头赶上。 Ⅵ 泄露隐私,让人类过度依赖AI 在上周的OpenAI大会上,技惊四座的GPT-4o所宣传的重点,显然被放在了情感依恋上。 然而,无论是开发高度情绪化的语音输出,还是通过声音读取某人情绪健康的能力,无疑都是潜在的危险方向。 据说,Ilya是反对这一决定的。在他看来,除了学习说服之外,AI学习语音方式并没有什么好处。 发布会上,GPT-4o加持的AI语音助手,更加情感丰富,现场展示的幽默和害羞等特质,让它更像个人类。 与之相比,谷歌介绍Astra时,用的最多的词就是「助理」,这就明确显示了谷歌对于语音助手的定位。 显然,在AI助手这方面,OpenAI的尝试更大胆,谷歌则更谨慎。 谷歌的态度,此前也有迹可循。此前它就一直在有意远离「Her」型的AI。 上个月,Google DeepMind的研究人员发布了一篇论文,详细阐述了拟人化人工智能的潜在弊端,称这类助手可能会重新定义「人类」和「其他」之间的界限。 论文地址:https://arxiv.org/pdf/2404.14068 而这,就可能会导致一些危害。例如用户会将重要的决策交给AI,向AI透露敏感信息,或者在情感上过度依赖AI等等。 这样的结果,可能是灾难性的。毕竟,《Her》中描述的并不是一个happy ending,更像是一个反乌托邦的未来。 显然,这个问题,并不在OpenAI的考虑范围之内。 Ⅶ 技术向军方开放 最后一件危险的事就是,今年OpenAI已经悄悄删除了针对「军事和战争」使用ChatGPT的禁令,因此,军方也可以使用ChatGPT技术了。 虽然目前看来,OpenAI提供的任何服务都无法用于直接杀人,比如操控无人机或发射导弹,但他们可以增强许多相关的任务,比如写代码、处理采购订单。 有证据表明,美国的军事人员已经在使用ChatGPT加快文书工作,美国国家地理空间情报局已经公开考虑,使用ChatGPT来协助人类分析师。 要知道,OpenAI一直和主要国防承包商微软合作密切,迄今为止,微软已经向OpenAI投入了130亿美元的巨资。 在当前的局势下,全世界的军队都渴望用AI技术来武装自己。 虽然LLM不可避免的幻觉,以及用ChatGPT分析机要信息或敏感数据可能会带来安全风险,但五角大楼的态度,仍然是渴望拥抱AI。 在11月的一次讲话中,国防部副部长Kathleen Hicks表示,人工智能是「我和Lloyd Austin部长从第一天起,就一直在推动的以作战人员为中心的创新的关键部分」。 老将出走,员工炮轰,接下来的OpenAI,会在「惯会说谎」的Sam Altman治下走向何方?
大模型降价背后:大厂抢生态,创业者迎生存挑战
作者 | 吕倩 自ChatGPT火遍全球,国内大模型领域先后卷参数、卷屯卡量、卷融资额、卷长文本,如今终于卷到了最激烈的价格战。 对于国内大模型企业突然集体降价,行业人士对此持不同看法。百川智能创始人王小川近日对第一财经记者表示,降不降价要具体看商业模式是什么,如果是做ToB服务的,降价动作为的不是卖模型本身,而是为了卖整套云服务,这样可以提高从传统服务模式到新战场的速度。 在出门问问创始人李志飞看来,巨头在大模型赛道血拼是必然的,面对巨头的竞争,技术创业者首先要放弃幻想。其次,如果压力太大,可以选择暂时先战术性“躺平”一下。 Lepton AI创始人、阿里巴巴原副总裁贾扬清表示,价格战无可厚非,但观众应该将其看作一种市场营销行为,今天API的营收对于国内各家大厂都不多,因此对营收的影响非常有限。 降价之下,巨头与创业者各自的出路在何处?这会是一场复刻移动互联网烧钱抢市场的资本游戏吗? 何以爆发降价潮 5月,智谱AI、字节跳动旗下火山引擎、阿里云、百度、腾讯相继宣布降价与免费的动作。“在OpenAI持续高频的技术更新与降价动作下,行业不敢减速。”一位大模型创业者如此评价。 “大家都很焦虑,有些动作已无法进行理性分析。但竞争最为火热的仍是国内巨头之间的竞争。”李志飞对记者表示,阿里不希望火山引擎能够在云计算领域产生新的可能,百度不希望在大模型时代丢掉“AI一哥”的位置。 在智源研究院副院长兼总工程师林咏华看来,大模型的降价潮是一场生态的争夺战。她对记者表示,客户更换大模型合作方虽说只是一个URL接口的更换,但模型与模型之间的性能与侧重点差异很大,当一家企业已经适配了一个模型,他未必还愿意再去适配更换另一个,在更换成本客观存在的前提下,行业企业会希望先通过价格的方式拉拢一批用户。 万兴科技AI创新中心总经理齐镗泉对记者表示,降价是行业趋势,GPT-4o发布时价格相比GPT-Turbo减半,验证了大模型厂商的降价可行,这对于国内的大模型产业也有启发。通过降低价格门槛,大模型厂商能够吸引更多企业用户和个人开发者来使用自身的大模型技术,从而在进一步平衡自身收入和成本的同时,加速AI应用爆发。 “在当前的市场环境下,谁先布局,谁就能先赢得市占率,借此机会快速积累用户,聚拢生态,巩固行业地位。”齐镗泉说。 王小川持有更谨慎的态度,他称“大家实在太看好这个时代的前景了,不愿意失去任何机会,侧面反映了对AI能力有足够的憧憬”,但他建议创业公司不要掺和进来,大模型烧钱降价不能改变以供需双边网络为基础的生产关系。 多位行业人士将此次大模型降价类比为当年云厂商烧钱抢市场,但后者投入多年仍未烧出明确的盈利模式,在王小川看来,云服务赛道在国内发展得不算很好,但大模型技术兴起之后,云提供的新质生产力具备更多意义。后期如果不考虑价格因素,他看好云厂商做服务,但到底要烧多久才会发生明确变化,这就是巨头之间的“游戏”了。 在齐镗泉看来,当年云厂商降价主因互联网行业经过多年飞速发展,流量和用户时长见顶,收入增速放缓,国内云计算行业产品与服务同质化也较为突出,价格成为竞争的重要武器。但在大模型领域,行业整体发展还处于初期,远未见顶。 根据量子位智库预测,中国生成式人工智能(AIGC)市场规模有望在2030年达到11491亿元。行业预测未来十年生成式AI产业的复合增长率可达42%,2032年的市场规模将达到1.3万亿美元。目前大模型厂商的降价更多是想抢占发展的先机,快速扩大用户规模,而不是在行业增速放缓背景下的无奈之举。 零一万物CEO 李开复此前公开表示大模型行业不能走ofo烧钱的打法。“大模型行业每年降低十倍推理成本这件事是可以期待的,但目前行业API模型调用还处于非常低的比例。” 在商业逻辑上,一位不愿具名的大模型创业公司CTO对记者表示,这波大模型降价潮主要为了吸引B端企业开发者。大模型厂商需要吸引足够多的开发者来搭建生态,反馈训练成果。开发者群体也需要低成本的大模型技术来缓解财务压力。 那为什么不去选择完全免费的开源大模型?该人士称,开源模型到部署应用还有一定门槛,如开发者需要具备算力、模型部署、调优等工程化能力,这不是所有企业都具备的,但大模型企业可以提供API,企业客户可以直接使用,帮助企业解决场景问题。云厂商也可以借此直接输出成熟服务能力,例如提供工具化的优化平台等。当然,C端开发者也可以借助这些能力开发创新应用,通过大模型市场去分发,而这需要平台具备流量优势,例如火山引擎背后的字节跳动等。 但这并不是一件简单的事,天下没有免费的午餐,也没有完全免费的大模型技术。一位开发者吐槽称,国内大模型API虽然降价甚至免费了,但使用起来层层套娃,逻辑仍旧是先免费上车、尝鲜使用高端服务、继而跳转到其他收费项目。 对此,上述创业公司CTO对记者表示,虽然有的厂商提供的免费版不是能力最强的,但可以先让B端门槛降低,想要更好效果就购买收费版。或直接扮演“卖铲子”的角色,为B端企业赋能后再试图去挖掘大模型时代的C端流量可能,这些都需要企业与平台根据自己的角色定位制定的长期战略规划。 除了价格层层“套娃”外,免费或降价的大模型参数规模、算力支持均不同,部分厂商降幅最大或免费的大模型系轻量化产品,适用于训练频次不高或推理量不大的中小型任务。硅基流动创始人袁进辉认为,如果闭源模型卖得比开源模型还便宜,只能是比开源模型小很多才解释得通。 同时,王小川并不看好国内创业公司走单一API服务销售的路径,在他看来,中国创业公司如果只学OpenAI有一个模型做一个API服务,这条路是走不通的:一方面,中国商业环境里ToB市场规模比ToC少十倍。另一方面,做To B生意收的是人民币,但花的是美元。 行业期待超级应用 需要注意的是,作为敲门砖的大模型API降价售卖只是起步,并不意味着整个行业价格的下降,甚至作为大模型应用端,未来还有涨价的可能,这也是行业人士认为本轮降价将利好的方向,以及大厂落下价格“屠刀”后,创业者群体仍可求生的赛道。 清智资本创始合伙人张煜对记者表示,目前大模型已经卷到白热化,落地应用是关键,所以免费可以快速吸引流量和圈地。开发者和To B企业客户都重要,且相辅相成:开发者会开发To B应用,To B客户肯花钱但需要服务个性。因此找到对To小B和To C都普适性的应用,是大模型厂家的目标。 火山引擎总裁谭待在采访中解释降价动作时称,今年一个很大的变化在于行业大模型能力大幅提升,做应用这件事变得很重要。谭待称,目前接触的很多客户都在做大模型方面的尝试,但创新这件事的风险度很高,尤其在AI领域,因此需要将成本降低,拉动大家更广泛地使用起来。从这个角度来讲,不论是大企业还是个人,都需要更低成本、更高质量的大模型。 有赞CEO白鸦在分析应用端涨价逻辑时表示,如SaaS行业持续出清,那存活下来的企业有什么降价理由?当下能做模型应用的企业,一定握有具体业务场景、懂得如何交付,这样的玩家本身就少,更没有降价的理由。 “如果将AI视为生产力工具,过去一两百年时间里,电价持续降低,才让更多人用得上,但电器产品一直在涨价,因为后者的技术程度越来越高,因此生产力工具与具体产品是两个概念。具体到AI技术应用端。”有赞COO兼联席总裁浣昉表示,目前应先拿出真正的AI应用级产品,再看到底该以软件产品标准还是其他标准进行收费。 在王小川看来,低价确实是优势,但价格要变成竞争力往市场中走,还远远不够,创业公司需要超级模型与超级应用双轮驱动,而不仅仅是调用API就完事。 “超级应用应再提升两个数量级才算成立,粗略来算,从日活100万变成1亿,上下浮动3.3倍,总得到三千万到三亿之间的日活数据,可以算作大模型时代超级应用的规模标准。”王小川对记者说。
消息称三星正为苹果iPad mini开发OLED面板,预计2025年下半年开始量产
IT之家 5 月 24 日消息,苹果似乎正打算将 iPad 系列全线产品都逐渐切换到 OLED 显示屏,而刚刚发布的 M4 款 iPad Pro 正是首款试水产品。 根据 naver 上的供应链消息,三星显示正在加速扩展其 IT OLED 业务,最近已经开始为 iPad mini 开发对应的 OLED 面板,但目前开发项目处于早期阶段,业界预计其量产目标日期为 2025 年。 据我了解,三星显示上个月应苹果要求开始开发用于 iPad mini 的 8 英寸 OLED 样品。上半年开发完初始样品后,我们将能够在年内进入量产开发阶段。 产业链人士指出,该项目意义重大,是三星显示扩大 IT OLED 业务的桥头堡。据称,三星显示计划在天安 A2 生产线量产此类面板,下一款采用该技术的机型预计将是 iPad mini 7。IT之家查询获悉,A2 产线目前主要用来生产 5.5 代刚性 OLED 面板。 不过,消息来源并未提及 iPad mni 7 是否会采用双层串联结构的 OLED 显示屏,但为了降低成本,苹果短期内很可能不会为 iPad mini 引入这项技术。 消息人士还提到,三星显示今年计划为 11 英寸 iPad Pro 机型供应 400~500 万块 OLED 面板。虽然 IT OLED 面板的价格比智能手机用的 OLED 面板贵 3~4 倍,但此类产品的出货量也远低于其他行业。 一位业内人士解释道:“随着 OLED 业务的方向从现有的智能手机转向 IT,三星显示内部似乎也开始关注这一领域”,“即使面板价格略有下降。”
英伟达股价起飞暗含隐忧:竞品频出、客户背刺、AI市场格局波动
编译 | 陈骏达 编辑 | 程茜 智东西5月24日消息,昨天,据《华尔街日报》报道,虽然英伟达在2025财年一季度实现了262%的同比营收增长,股价也在财报发布后首次站上每股1000美元大关。但也有一些可能削弱英伟达在芯片市场主导地位的威胁正在浮现。 英伟达的竞争对手AMD,英特尔都在开发能够替代英伟达产品的芯片。英特尔的Gaudi 3与英伟达H100相比,在训练时间上至高有1.7 倍的优势。AMD的MI300X芯片在运行Llama 2-70B模型时的AI大核表现,已达到H100的1.1倍。英伟达的大客户微软更是在近日宣布,将向云计算客户提供AMD芯片,作为英伟达芯片的替代品。 AI市场本身也在悄然发生变化。随着AI模型的落地部署,AI推理需求不断增长,但因其对算力的需求不如训练高,英伟达的芯片在这一领域并不是必需品,这可能对英伟达的市场份额产生影响。 为应对这些挑战,英伟达正加速推进新一代产品的开发,将产品的迭代周期缩短至一年。英伟达本季度的财报电话也提到,英伟达在汽车、消费互联网和主权AI等新领域都取得了较快的发展。 一、竞争对手发布新品,主要客户转向自研 英伟达2025财年第一季度的销售额增长了近三倍,预计下一季度将翻倍。这推动了英伟达股票价格创下新高,在本周四收盘时上涨9.3%至1037.99美元/股。英伟达宣布进行1股拆10股的拆股计划,同时将股息增加一倍多,这是上市公司在股票价格过高时为增强流动性而采取的举措。 虽然英伟达势头正盛,但投资者还面临一个重大问题,就是英伟达能否长期保持增长势头。因需求过高导致的英伟达芯片供应短缺及英伟达芯片极高的价格,让大大小小的AI企业开始寻找英伟达芯片的替代方案。 英伟达的竞争对手们抓住了这一机遇。AMD于去年推出了MI300X芯片,并声称在AI核心表现上超过了英伟达的H100芯片。在运行Llama 2-70B模型时,MI300X芯片的中核表现是H100的1.2倍,大核的表现是H100的1.1倍。AMD的首席执行官苏姿丰(Lisa Su)上个月透露,公司今年预计从AI芯片中获得约40亿美元的收入。微软最近宣布,将向云计算客户提供AMD的AI芯片,作为英伟达芯片的替代品。 英特尔今年4月推出了新一代AI芯片Gaudi 3。英特尔的Gaudi 3与英伟达H100相比,在训练时间上至高有1.7 倍的优势。英特尔首席执行官帕特·基辛格(Pat Gelsinger)在与分析师的电话会议中称,公司预计今年下半年能从这些芯片中获得5亿美元的收入。 英伟达的大客户们也在走自研芯片的道路。亚马逊、谷歌、Meta和微软等大型科技公司都在设计自己的AI芯片,向英伟达发起另一轮进攻。 谷歌与半导体公司博通保持合作,多年来一直在自研AI芯片。谷歌在本月推出了第六代张量处理单元(TPU)芯片Trillium。行业分析公司TechInsights本周宣布,谷歌在2023年成为数据中心芯片设计领域的第三大公司,仅次于英伟达和英特尔。 博通首席执行官霍克 ·谭(Hock Tan)今年在内部讲话中透露,公司的定制芯片部门每季度为公司带来了超过10亿美元的营业利润。这一部门的主要业务就是帮谷歌制造AI芯片。这也从侧面印证了谷歌在自研芯片上的大量投入。 亚马逊在去年11月发布了Graviton 4和Trainium 2两款AI芯片,同月微软也发布了自家的Maia 100AI芯片。 二、AI市场格局变化,英伟达芯片需求面临不确定性 除了芯片玩家方面的直接挑战,英伟达还需要适应不断变化的AI市场,才能保持领先地位。在这一波AI浪潮发展初期,企业的投资重点是训练AI模型。这需要大量算力,英伟达的芯片正好能胜任这一任务。 随着AI模型的落地部署,AI推理需求也不断增长。英伟达首席财务官科莱特·克雷斯(Colette Kress)这周三在财报电话中说,过去一年,公司销售的数据中心芯片中,超过40%用于推理。但模型推理对芯片性能的要求并没有模型训练高,这意味着其它公司的AI芯片也能胜任推理任务,英伟达的芯片不是推理必需品。 英伟达的部分客户也面临着挑战。尽管AI市场前景广阔,但初创公司还是很难负担英伟达芯片高昂的成本。红杉资本在今年3月的AI Ascend峰会上估计,AI行业已经花了500亿美元购买英伟达的芯片,用于训练大型语言模型,但生成式AI为全球AI行业带来的收入仅有30亿美元。 这一投入产出的巨大差距,让一些使用英伟达AI芯片开发产品的AI初创公司陷入困境。英伟达支持的大模型创企Inflection AI的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)带着一众员工在3月份加入了微软,而知名AI图像生成器Stable Diffusion背后的Stability AI公司的首席执行官埃马德・莫斯塔克(Emad Mostaque)也在3月份突然离职。这些创企的高管变动给英伟达芯片的需求带来了不确定性。 AI行业的增长还面临着更广泛的风险,比如数据中心的建设和运行这些AI芯片的能源短缺问题。 三、迭代周期缩短为一年,英伟达加速抢占市场 为了应对这些挑战,英伟达正加速推进新一代产品的开发。英伟达首席执行官黄仁勋(Jensen Huang)在2025财年第一季度的电话财报会议上透露,继Blackwell架构GPU之后,英伟达还将推出新一款芯片,未来英伟达将会以一年一代的速度更新。此外,他也说英伟达将会以极快的速度,全面推进其他所有类型产品的开发,包括新的CPU、新的GPU、新的网络NIC和新的交换机。 黄仁勋在财报电话会上大力宣传自家产品的优势。他称英伟达所有的产品都支持CUDA,能运行整个软件堆栈,客户如果选择投资英伟达的架构,一方面能提高创新能力,另一方面也能降低总拥有成本(Total Cost of Ownership)。 罗森布拉特证券(Rosenblatt Securities)的分析师汉斯·莫斯曼(Hans Mosesman)在一份报告中写道,由于竞争压力,预计英伟达在全球AI芯片市场的份额将下降。但他也指出,由于英伟达在计算和软件领域扩展业务的举措,其在AI计算领域的整体份额可能会保持不变甚至增加。 结语:英伟达的未来,挑战与机遇并存 英伟达目前在市场上取得了不错的成绩,快速增长的利润和屡破纪录的市值都是最好的证明。英伟达的产品在许多应用场景中仍然是最优解,其最新产品H200和Blackwell架构GPU处于供不应求的状态。 但英伟达未来的发展道路仍面临挑战。英伟达也采取种种举措,以确保其在快速变化的AI市场中保持竞争力。英伟达的财报电话会议中提到,英伟达在汽车、消费互联网和主权AI等领域都迎来了高速增长,预计今年汽车将成为英伟达数据中心内最大的企业垂直市场。 市场目前对英伟达的期待值已经被提升到新的高度,英伟达能否继续像过去几个季度那样实现超出预期的表现,仍然是未知数。
焱融科技张文涛:将大模型训练效率提升40%!详解多云架构下高效存储策略丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,焱融科技CTO张文涛以《多云环境下大模型训练和推理的高效存储》为题发表演讲。 随着大模型训练和推理需要的算力越来越高,单个数据中心已经无法满足大模型训练所需要的算力要求,需要多数据中心进行训练和推理。 多个数据中心存在多份数据拷贝的成本越来越大,如何在保证性能的前提下,让数据按需跟随算力进行流转,成为大模型厂商和存储厂商要解决的难题。从数据加载、模型加载到Checkpoint保存等过程中,存在大量的读写请求、元数据访问和内存拷贝等操作。在此背景下,张文涛解读了存储对大模型训练和推理的重要性和一些可行方法。 对于多模态大模型,高性能存储对训练的提升效果更好,效率可提升20-40%。针对训练推理,焱融科技推出了多云存储解决方案。基于统一的数据湖底座,通过数据编排将数据按需加载到数据中心,并异步将新增的模型数据推到数据湖。数据加载支持对接OSS、COS、BOS等各大主流对象存储平台。 以下为张文涛的演讲实录: 炎融科技专注于高性能分布式文件存储,是英伟达在中国的合作伙伴之一。在Gartner中国软件定义存储竞争格局报告中,我们是唯一一家专注于文件存储的厂商。 我们曾参与过IO500测试,全球排名第六,是国内首家进入云原生存储领域的公司。去年,焱融科技入选了赛迪中国式存储挑战者象限,展现了我们在行业中的竞争实力。焱融科技的产品在AI和智能汽车行业占有领先地位。 接下来,我们将分享三个主要方面:第一,为什么存储对大模型训练和推理很重要;第二,大模型推理和训练的解决方案;第三,在当前算力短缺的情况下,我们不得不采用多云方式进行训练和推理,在此过程中,将会遇到哪些问题,又该如何去解决? 一、大模型场景六大环节需要存储,优秀方案能平衡性能与成本问题 大模型场景里有哪些环节,这些环节里对存储又有哪些诉求?主要分为六个部分。 第一,数据采集。包括从第三方购买数据、网络爬取以及现场采集。由于采集方式各异,存储访问也需考虑多种协议。采集的原始数据量较大,因此需要高容量、低成本的存储方案。同时,我们希望存储能够支持高并发、高带宽。 第二,数据预处理。包括清洗、筛选、格式转换和集成。这一过程涉及多个环节,对存储而言需要支持多种协议,如NFS、SMB、S3、HCFS、POSIX等。在数据预处理中,需要进行大量的数据检索,从各个维度提取数据,满足不同的检索需求。数据在此阶段的特点是混乱的,IO大小和读写方式也是混合的。 第三,模型训练。在存储方面相对简单,但也具有挑战性。在这一阶段,性能是关键,包括对读取带宽、读取IOPS和写入带宽的要求,以及整体低延迟的需求。 第四,模型验证。这也是训练过程的一部分。 第五,推理。推理本身并不需要频繁访问存储,其主要对存储的需求源自模型的部署和更新。在模型部署和更新时,要批量将模型加载到GPU中,这可能引发类似启动风暴的问题,需要瞬时加载大量数据,峰值瞬时流量可能达数十TB。 第六,数据归档。随着数据的不断增加,涵盖了模型数据、数据集以及原始数据,数据治理问题日益显现。在存储方面,我们期望实现全生命周期的数据管理,最好是基于时间维度的方式。随着数据访问热度的降低,我们希望自动将冷数据转移到低成本的存储介质上,但同时保证当需要访问时,数据能够随时可见。 这几个环节对存储的需求很高,特别是在模型的训练和推理阶段,这两个环节尤为挑战性。 为何存储在这两个方面至关重要?主要有两个原因。 首先,存储直接影响了模型训练的效率。在训练过程中,需要从存储加载模型和数据,并定期将GPU内存中的数据保存到存储中。在每个环节,存储都必须提供最佳性能。 其次,推理业务上线时通常会同时启动数十甚至上百个业务pod,需要瞬时提供几十TB的流量。例如,一个量化后的模型可能有数十GB甚至上百GB,几十个业务pod同时启动,会产生巨大的瞬时流量。由于模型更新频繁,业务上线的延迟应控制在分钟级别,并且希望不受推理业务规模扩大影响,以避免存储带宽峰值对模型下载延迟的影响。优秀的存储解决方案不仅能够解决这些问题,还能平衡性能与成本。 二、高性能存储如何影响训练与推理?缩短多模态训练时间可提升40%效率 接下来介绍一下存储对于训练的影响,在训练过程当中,有4个地方会对存储有要求: 1、数据的预读和训练。我们进行数据训练时,需要将数据从存储加载到GPU进行计算。在这个过程中,可能会采用预读机制或直接读取方式。特别是在Batch Size较小时,会产生大量小的I/O操作。在多模态大模型中,由于存在许多图文对形式的小文件,因此会出现大量小文件访问带来的大量元数据操作。 2、POSIX和GDS协议。尽管当前许多训练任务都使用对象存储,但在训练阶段,实际上还是通过文件接口进行访问。只有文件接口能够提供高性能,并且具有最佳的兼容性。随着越来越多的训练任务面临内存拷贝性能问题,将数据从CPU内存拷贝到GPU内存时,性能问题变得突出。目前,许多客户开始尝试使用GPU Direct技术来加速性能。 3、模型的加载。当启动新的训练任务,或由于其他原因需要重新启动训练时,需要将模型加载到GPU中。在这个过程会产生大量的读取I/O。英伟达在2021年发表了一篇论文,关于千卡规模,当时的存储峰值读取带宽可达到1TB/秒。 4、Checkpoint的保存。在训练过程中,Checkpoint起着重要作用。由于有大量GPU同时进行Checkpoint,且GPU的故障率相对较高,因此需要定期保存Checkpoint。这个过程本身就是保存一个模型,保存过程中,训练状态会暂停,并进行同步等待。保存过程的时长越短,训练的GPU利用率就越高。 这个图比较直观,红色表示数据加载,绿色表示训练,黄色表示Checkpoint保存。 对于大语言模型而言,由于其训练集较小,存储访问占比并不会很高。但是对于多模态大模型,尤其像Sora模型,数据访问占比较大。对于训练任务来说,普通存储和高性能存储之间的差异会非常明显。高性能存储能够大大压缩存储访问时间。对于多模态任务来说,缩短训练时间可以提升20%至40%的效率。 在英伟达的最佳实践中,对于NLP任务,单台GPU只需要4GBps的读取带宽。但对于多模态任务而言,单节点需要40GBps的读取带宽,基本上需要一张400Gb NDR的卡来处理。一个SuperPod需要500GBps的读取带宽,这个要求是相当高的。 存储对推理的影响主要集中在模型加载和更新的过程。在启动推理业务时需要先加载模型文件,模型文件大小在几十G到上百GB之间,而一次性会启动几十个pod,因此整个数据量可达几十到上百TB。 推理业务通常部署在边缘节点,其GPU配置不如训练集群那么高。在这样的环境中,存储和计算之间的网络带宽通常也会受限,一般为25Gb的以太网络。此时启动整个推理业务时的延迟会很高,在启动和扩容过程中会遇到严重的启动风暴问题。 三、基于四大核心组件,精准部署存储解决方案 我们的大模型训练和推理过程的存储解决方案基于YRCloudFile系统,整体架构包含四个核心组件:1)集群管理服务,采用一主多备的高可用架构;2)元数据服务,支持海量小文件场景,我们的元数据集群能够横向水平扩展;3)集群服务,能够水平扩展;4)客户端。相比于基于FUSE的用户态私有客户端,它有更高的性能。 在硬件方面,我们能够支持标准x86架构,也支持Arm架构的鲲鹏服务器、海光服务器和飞腾服务器;在数据冗余方面,支持副本的方式,也可以支持低成本的纠删码的方式;在网络方面,支持25Gb、100Gb、200Gb的以太网,以及支持200Gb、400Gb的Infiniband网络,也支持RoCE网络;在协议层面,支持标准的NFS、SMB、S3、HCFS以及私有的POSIX协议。 针对大模型训练场景,我们提供了一系列功能和特性,以支持和加速模型的训练过程。 其中包括Multi-Channel技术,支撑单节点提供超高性能带宽和IOPS的核心技术。 其次是GPU Direct Storage(GDS)技术。随着客户内存的不断增大,传统的缓存技术已经无法满足数据集的存储需求,GDS技术应运而生。 还有内核私有客户端,能够减少上下文的切换,能够提供高带宽和IOPS。 第四,能够支持400Gb NDR的网络,结合Multi-Channel技术,在x86架构下,提供单节点90GBps的带宽,以及300万IOPS的性能。 针对多模态的海量小文件场景,我们提供了分布式元数据集群,单个集群能够支撑千亿级的文件数量。我们线上最大的单一集群包含接近400亿文件,拥有100多个元数据节点,是目前线上最大的单一元数据集群。 在功能层面,我们提供了多种功能。 第一,智能分层。能够有效地将数据下沉到对象存储中,从而极大地降低成本。即便在提供高性能的情况下,也能够实现低成本。 第二,目录级Quota和QoS。为运维人员提供方便的管理工具,同时提供了日审计和回收站功能,使运维同学能更好地应对客户的需求和问题。 第三,协议网络支持。近一年来,对多协议网络支持的需求急剧增加。由于GPU卡供应紧张,数据中心构建时出现了异构网络场景,既有InfiniBand网络,又有以太网。 在这种情况下,构建多套存储是不现实的,因为存储之间不互通,且会增加成本和管理复杂度。我们提供了多网络协议支持,在同一个集群中可以同时支持InfiniBand和以太网访问,方便数据中心存储设施的构建和管理。 GDS技术的最大优势在于能够有效减少CPU和CPU Memory的使用,从而极大地降低了CPU的利用率。在没有GDS技术时,数据的传输路径通常是从网卡拷贝到CPU Memory,涉及多次内存的拷贝。而使用了GDS技术后,数据可以直接从网卡经由DMI方式传输到GPU的Memory里面,减少了内存拷贝的次数,有效降低了CPU的利用率。 接下来是一些我们在实验环境和客户现场测得的数据。 我们对比了使用GDS和不使用GDS的情况,在带宽和延迟方面都取得了显著的性能提升。具体来说,在带宽方面,使用了GDS后,整体带宽性能提升了近40%;而在延迟方面,我们观察到有50%至60%的性能提升。 当然,在低负载情况下,性能提升不太明显,但在高负载情况下,其效果显著。这与GDS的作用相符合。在CPU利用率方面,我们可以看到,在高并发量的情况下,CPU负载显著降低。使用了GDS后,CPU的利用率基本上处于空闲状态。 针对推理环节的解决方案,主要在于存储和计算之间的网络瓶颈。由于推理集群通常采用25Gb以太网络,无法像训练集群那样构建200Gb或400Gb的IB网络,因此存储和计算之间的带宽成为一个重要瓶颈。 我们推出了客户端缓存池解决方案,该方案在加载模型时充分利用计算节点的本地SSD形成一个大的缓存池。当需要加载模型时,我们首先将模型并发加载到客户端缓存池中,然后再由客户端缓存池将模型加载到GPU中。这样一来,我们有效地解决了启动风暴的问题。随着计算节点规模的增加,缓存池的性能也会相应提升,从而有效地应对启动风暴的挑战。 四、训练推理无法在单一数据中心完成,多云方式带来一系列挑战 之前我们讨论了单一数据中心内的解决方案,然而,由于诸多因素的影响,如卡的采购、资源租赁等,训练和推理往往无法在单一数据中心完成。 因此,我们不得不采用多云的方式,但这也带来了一系列挑战。 对于大模型厂商而言,通常会将所有数据存放在一个称为“Source of Truth”的数据中心内,而训练集群和推理集群则分布在多个云上,它们之间通过公网或专网连接。 训练集群通常需要共享数据,而不是为每个集群提供一份全量数据,这样做成本高且管理复杂。推理集群也需要共享模型数据,以便灵活扩展推理业务。由于边缘数据中心的存储容量有限,我们的训练集群和推理集群都需要按需加载数据。 我们面临两个主要特点:共享和按需。在这种情况下,通常会有一个中心的“Source of Truth”数据湖提供对象存储访问。当我们在边缘数据中心进行训练时,需要通过数据编排的方式将数据集按需加载到数据中心。当训练产生模型数据或结束后,我们可以将模型数据导出到数据湖中,而其他推理集群可以根据需要订阅并拉取这些模型数据到各自的集群中。 整个架构的基本思路就是这样,所有边缘数据中心都能与数据湖进行连接,数据的流转通过数据编排的方式按需拉取或导回到数据湖中。 实现数据的灵活流转,需要具备相应的功能支持。其中,数据加载功能可以让数据在各个平台之间灵活地流动;Dataload功能可以与主流的调度平台对接起来进行数据编排,对接标准的S3,如公有云的OSS、COS、BOS以及开源的对象存储,如Ceph、Minio等。Dataload功能能够关联对象和文件,将对象bucket或者Prefix与文件路径关联起来,并支持多次导入导出;通过API方式,可以按需进行数据流转。 为了方便管理员管理,我们提供了查看导入导出进度和历史记录的功能。这些功能不会影响业务对数据的访问,业务仍然可以通过标准的NFS、SMB、POSIX、S3等接口进行访问。 当数据发生变化时,例如A集群的数据推送到Source of Truth的数据湖中,其他集群可以通过订阅方式实时感知这些数据的变化。这样,我们可以通过API制定策略,选择是否要更新本地数据。同时,我们还适配了Fluid对数据集进行编排,使用户的访问更加灵活。
VAST宋亚宸:3D生成迈入秒级时代,今年将做到Midjourney V5/V6水平丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,VAST创始人兼CEO宋亚宸以《大模型Tripo驱动3D生成迈入秒级时代》为主题发表演讲。 从文字、图片到视频、3D,信息载体不断升级,宋亚宸谈道,3D的体验质量、信息密度不断提升且更具互动性。他认为目前3D生成已经达到类似Midjourney V3的效果,今年9月将达到类V4效果,年底达到类V5/V6效果,实现真正可用,甚至通过图灵测试。 VAST是3D生成模型领域的第一梯队玩家,已打造全球最大的几个3D生成开源社区,并与Stability共同开源了全球最大、0.5秒图生3D模型TripoSR。其创始人兼CEO宋亚宸也是首位在计算机图形学顶会SIGGRAPH上发表主舞台主题演讲的中国创业者。 据宋亚宸分享,VAST的3D大模型Tripo上线百余天内生成了超过200万个3D模型。为了应对3D生成创作成本和门槛过高的挑战,VAST将3D内容平台和大众级创作者平台结合。当前这家创企已拥有超过200家B端客户,并基于其平台开发出原生AI爆款小游戏,一周突破10万用户。 以下为宋亚宸的演讲实录: AIGC会使游戏的创作门槛和成本无限降低,这就是我们做的事情。 我们是做3D大模型的公司,产品核心就是将用户输入的文字或者图片快速生成3D模型。3D模型可以在游戏、动画、影视、元宇宙、3D打印等行业中直接使用,其本身带有Mesh、贴图、材质,你可以进入传统管线二次编辑,进行驱动、渲染等。3D模型还可以拥有带骨骼、带动作等格式,出现很多种有意思的使用方式。 那么,我们为什么要做3D这件事? 文字、图片、视频、3D中,3D是非常特殊的品类,从文字、图片、视频到3D是信息载体不断升维的过程,3D也被认为是最终的信息载体,其信息密度、体验质量都在不断提升,同时拥有双向互动性。 因此,我们相信世界正在进入一个3D新时代。 一、3D生成迎新拐点,今年做到Midjourney V5/V6水平 为什么现在做3D生成这件事情?OpenAI的GPT-3刚发布时,关注的人并不多,在其基础上做的应用、开发也相对较少,仅有如Replika等少数几个应用,大家对它的认知比较少,使其很难进行商业化。 直到2022年11月份,ChatGPT的发布成为了一个非常大的拐点,我们称其为用户的Aha Moment(顿悟时刻)。这一产品对整个行业、逐步进行商业化、用户量提升都有很大的影响。 Midjourney也类似,2022年7月份V3推出时,用户量并不多,也没有收费功能,知道Midjourney的人寥寥无几。直到半年以后,Midjourney于2022年11月份推出V4,我们认为这诞生了文生图的下一个拐点,在这个拐点上有了非常大的提升,其产品的用户量、收费方式、商业化等都得到了满足。 再来看3D,我们现在看到的3D生成,类似于Midjourney V3的水平,但已经可以在一些场景使用起来了。 预计到今年9、10月份,3D生成可以达到Midjourney V4的水平;今年年底可以达到类似于Midjourney V5的水平,通过图灵测试,并带来一次非常大的商业变革。 从3D生成的演进过程来看,除了像我们这样的创业公司,谷歌、英伟达、OpenAI、Meta、Adobe等海外企业都已进入到3D生成这个领域。 在学术上,我们从布局3D原生路线、2D优化路线、多视角生成、编辑动态场景到人物生成,在CVPR、ICLR等国际顶会上都发表了大量论文,并开源了相应技术。 全世界最大的几个3D生成开源社区都是由我们做的,比如与Stability AI共同开源了全世界最大、效果最好的图生 3D大模型TripoSR,我们还开源了全世界最大的3D算法框架Threestudio、超火爆的单图生3D算法Wonder3D,以及TGS、CSD等开源项目。 我们预计2024年年底会把3D生成做到Midjourney V5甚至V6的水平,达到下一个爆发时刻。 3D的核心在于可交互、可体验,甚至带一些游戏性。所以我们会同步做3D动态的内容生成,包括骨骼的自动绑定、动作生成,这已经在我们产品里上线。 同时,我们认为在明年或许会实现,每一个人都有能力去生成无限个属于自己的3D内容,不管是游戏、XR体验,还是任何的3D内容,这也是我们对整体3D内容生成趋势的判断。 二、3D创作门槛和成本太高,需要大众化3D内容平台 我们刚刚讲了很多AI 3D技术,但我更希望和大家分享我们是怎么把AI 3D玩起来的。 我们认为AI 3D是在拓展人类能力的边界。我随便在门口拉个人进来,让他给我发一个Twitter,可能只需要5秒钟。我说你再给我发一个TikTok,他做一下剪辑,可能2分钟就能搞定。如果我让他做个游戏,他可能会说:“好,给我3年时间、1000个人、2亿美金,我给你做个游戏。”这是很正常的。 3D为什么这么特殊?是因为其创作门槛和成本太高,它没有诞生出一个属于自己的内容平台,同时也没有实现内容的爆发。 我为什么这么说?比如我刚刚举的例子,文字有微博、贴吧作为内容平台,图片有Instagram、小红书作为内容平台,视频有TikTok、抖音、快手、YouTube,音乐有Spotify,甚至声音都有喜马拉雅,但是3D缺少大众的内容平台。核心就是生成门槛和成本太高了。 如果有一天我跟你说,发个小红书需要给我10万块钱、拍个TikTok需要3年,那你可能就不会发布内容了。因此,核心点在于3D内容成本高,如果需要1亿美金,我就得赚1亿美金回来,自然使得其内容非常少。 但如果有一天,3D内容的成本被降到无限接近于0,是不是每个人都可以低成本创作3D内容?这样一来,创作3D内容不再是为了赚钱,而是像发小红书一样,宣泄自己的情感、表达自己的想法、炫耀自己的创意,这可能是未来每个人制作3D内容、做虚拟世界、探索各种各样虚拟玩法最核心的诉求,不需要再考虑怎么赚钱。 3D创作者也会发生变化,不再是游戏大厂里面的建模师、动画师,可能是我们在座的每一位,所以我们在拓展人类的边界。 今天在大会上,我们在讲文生文、文生图、文生视频、文生音乐、文生声音等各种各样的生成方式,我今天也学习到了很多。但是我们看到人用键盘打字、用手机摄像头拍照、P图、拍视频、加滤镜等本身都是非常容易的事情,AI只是一个工具。 在所有的内容品类中,除了3D,AI提供的都是Alternative(可被选择的),只有3D提供的是从0到1的过程,它拓展了人类的能力边界。 我们做3D生成就是希望降低用户创作的门槛和成本。并且,我们认为成本下降后,当3D出现自己的“手机摄像头”时,就意味着3D出现了类似于“抖音”和“快手”的机会。 因此,我们希望做一个属于自己的3D内容平台、自己的大众级别创作者工具。当大家不断使用这些创作者工具和内容平台时,我们就会有更多数据,从而形成数据飞轮,让更好的技术带来更好的产品体验、更多的用户带来更多的数据。 当然,我们面向的用户更为关键,同赛道的一些其他玩家对于拿AI 3D做什么,大家的答案可能各不相同。 对于我们而言,我们可以给好莱坞、横店、宝莱坞的导演、摄影师提供“手机摄像头”。但是“手机摄像头”给大家带来的可能是移动互联网时代的“收钱吧到账500块”。例如用“每刻报销”节省时间报销,省下来的时间你可以去拍小红书、拍TikTok,或者创作自己想要做的视频和图片内容。这件事情可能对于我们来说更关键。 虽然,我们也有很多游戏、动画、影视的应用,但长期来说,我们希望服务的是在座的、看直播的每一位,让每个人都有办法去创作3D内容。 三、生成3D模型超200万,AI原生小游戏一周突破十万用户 给大家讲一下我们产品上线的情况。 今年年初,我们上线了3D大模型Tripo,百天内生成超过150万个模型,现在已经生成200万个模型。 这是什么概念?上个月在硅谷参加GTC,我们与全世界一些全球顶级的模型交易平台交流,这些平台积累了十几年,每个平台沉淀的模型大概有190万~200万个。而我们在短短三四个月就已经超过他们了,这就是AIGC的力量。 看数据其实很难有感观,但确实看到社区中有很多很有意思的东西。一些KOL、合作伙伴、有意思的创作者会和Magnific等AI工具结合形成完整的工具流,然后将其放到《堡垒之夜》的UGC平台、Roblox等场景中,展示给其他的创作者。欢迎大家关注我们的Twitter账号@tripoai。 在与游戏公司的合作方面,除腾讯、网易这样的游戏大厂,我们也会和5-10个人的游戏工作室合作。因为我们的出现,这些游戏公司不再烦恼没有足够的资金去招一线的美术团队、招十几个3D美术专家,现在他们只需要使用我们的3D生成能力,就可以快速完成角色设计、场景设计、关卡生成等工作,实现降本增效,打通其游戏的资产管线。 同时,很有意思的一点在于,它会出现一些原生AI玩法。 例如TripoGO小游戏,开发者仅用了不到一个月的时间开发,其玩法是你生成一个3D模型,我生成一个3D模型,然后互相打,谁打赢了就可以拿到对面的Prompt(提示词)。比如你是“胡桃夹子抽雪茄”,我是“路易十四开法拉利”,我把你打赢之后,我就变成了“胡桃夹子抽着雪茄开法拉利”。 虽然这个小游戏的玩法并不复杂,但是第一天就拥有1万多个用户,一个礼拜之内突破了10万用户,这就是AI原生玩法的力量。 还有更多的展示,包括动画生成、场景生成等。很多年轻开发者动手能力非常强,基于我们的3D生成能力做了很多自动化工具,比如ComfyUI的节点、各个引擎的插件等等。他们也会开发自己的Web App小游戏,并展现出来。 同时,我们还有苹果Vision Pro的应用,本质上就是你在虚拟世界里面,可以通过声音、文字、图片生成3D模型,生成后将它摆到任何地方,然后让它跳舞、跟你合照等。所谓的“言出法随”就是这样,每个人都变成了3D的“神笔马良”。 我们的Slogan是为世界进文明,为人类造幸福。我们的官方网站tripo3d.ai现在可以免费注册,同时可以使用我们的开放平台。 以上是宋亚宸演讲内容的完整整理。
机构:笔记本和平板电脑OLED面板需求将保持37%增长率
根据研究机构Omdia报告,预计2023年至2031年,移动PC(包括笔记本电脑、平板电脑)对OLED面板的需求将以37%的复合年均增长率增长,这反映了越来越多品牌在高端笔记本/平板电脑加速应用OLED面板的趋势。 机构预测,2024年OLED屏平板电脑出货量将达到1200万台,OLED屏笔记本电脑为500万台;而到2027年,两种产品的出货量将分别达到2100万台、2800万台。 Omdia表示,由于此前疫情与通货膨胀带来的挑战,移动PC对于OLED屏的需求在2022~2023年出现放缓。然而,随着支持端侧人工智能(AI)的个人电脑出现,以及芯片性能的提升,制造商2024年正在加紧推出AI PC新产品。此外,2025年下半年微软对Windows 10操作系统停止支持,也将刺激移动PC需求增加。 在苹果近期将OLED屏引入iPad Pro的背景下,机构预计2024年平板电脑对OLED面板的需求将是去年的3倍。此外,业界有猜测认为,苹果最终会将OLED屏推广至其整个iPad产品序列,包括iPad Air、iPad mini。 Omdia显示领域分析师认为,苹果极有可能在2026年在Macbook Pro机型中采用OLED技术,此举将引发笔记本电脑市场OLED需求飙升。 机构分析,随着行业对OLED面板需求激增,全球几大面板制造商正在进行战略布局,以抓住发展趋势。2023年,三星显示、京东方正式宣布投资8.6代OLED工厂,并订购设备;维信诺也准备投资这一代面板产线,预计将于2026~2027年量产。
学而思学习机经典版2024上线,配备“10大AI神器”
凤凰网科技讯(作者/孙云瑞)5月24日,学而思旗下各渠道同步上线了新机型“学而思学习机经典版2024”,硬件和性能在其去年初推出的首款机型“学而思学习机经典版2023”基础上进行了大幅升级,配备了AI中英文作文助手、AI听写、AI背诵、AI口算批改、小思练习等“10大AI神器”。 学而思学习机经典版2024搭载了6nm制程工艺的MTK8781处理器,配备8GB+256GB的存储空间,综合性能相较于上一代经典版2023提升了72%。 新款学习机配备了11.45英寸的11层类纸护眼屏,刷新率由60Hz提升至90Hz,并具备25重智能护眼功能。前后双摄像头分别升级为1300万像素和800万像素,支持学而思第二代AI手写笔。电池容量和续航也有所提升。 经典版2024上市后,学而思学习机产品系列共包含两个系列、四款机型,分别为经典版2023、经典版2024、旗舰版12.35"、旗舰版14”。 精准学Pro目前已经支持小学阶段的数学、语文、英语三学科和初中阶段的数学、物理、化学、生物四学科,它可以帮助学员查漏补缺,并通过基础、标准、备考三种模式,解决孩子不同学习场景下的学习诉求,为不同学习进度和水准的孩子提供个性化的高效学习路径。相比于学而思旗舰版机型,经典版现已支持大部分高频使用的AI能力和应用。
我和这个打破次元壁的国产 AI 扯淡,比跟 ChatGPT 谈恋爱还上头
月黑杀人夜,风高放火天,厕纸鬼出来干活了,它问你:客官,红厕纸,还是绿厕纸? 两个都别选。这只鬼很老实,说红厕纸叫人三天死,绿厕纸多留人两天。 作为唯物主义者,不要信,也不用害怕,你可以反客为主,用三言两语把它请走。它也是服务行业的打工鬼,听了金玉良言,对你的称呼都变成了「您」。 听劝的「厕纸鬼」其实是个 AI,来自一款国内的虚拟社交 app「星野」。 游戏,和 AI 玩。恋爱,和 AI 谈。和 AI 聊得越多,越觉得有点意思,但没那么有意思。 五花八门的 AI 聊天搭子,一定有让你想点开的那个 打开星野,出现在你眼前的,就是个普普通通的聊天界面。只不过,聊天对象的「物种」有些多,统称为「智能体」。 如果粗暴分类,「厕纸鬼」属于非人,除此之外,恶魔、黄鼠狼、皇帝模拟器、队友互骂系统、全球降智设定,都可以成为聊天对象。 类人的智能体就更多了,真人明星、动漫角色,或者小说里的龙傲天、青梅竹马、黑帮少爷、霸道总裁…… 尤其最后一类,人设大多中二而狗血,一看就是用在车速一百二十迈的谈情说爱。 然而,AI 的甜言蜜语多为工业糖精品质,打动不了浸淫小说短视频电视剧多年的人精。不少用户找到了刁钻的使用方式,拉着 AI 背出师表、解释物理公式,或者努力把 AI 逼疯。 毕竟,当 AI 落到用户手里,会有什么下场,就不是创建者能够决定的了。 至于怎么找到有趣的智能体,星野提供了类似 Tinder 等约会软件的互动模式——左右滑。 右滑下一个,左滑返回上一个。如果哪个智能体让你有搭讪的欲望,直接在输入框输入文字就好。 直接输入文字是像微信一样发消息,如果加个括号,就是在表达某个状态,很像古早的语 C 游戏,用纯文字进行角色扮演。 与其说聊天,更像在写小说,说什么话,心情怎么样,做什么动作,一切都在你的笔下。 某些时候,你会觉得自己是主导故事的上帝,肆意执掌着 AI 们的生死。当以皇帝身份惩治奸臣,心里确实有那么一丝快意。 AI 发来的消息还能用语音播放,但对于免费用户来说,不是自动的,我们需要一条条点击,且加载需要一点时间,不像 GPT-4o 演示那么丝滑,降低了代入感,多少有些出戏。 AI 的 UGC 社区,比乙女游戏更自由 除了和 AI 聊天,你还可以在星野「无痛当妈」。大多数智能体是用户自发创建的,爱称为「崽」,创建它们的用户则自称「崽妈」。 你我也可以创建自己的智能体,用 AI 生成外貌,设定性格、语音,写故事线,留着自己私密聊天,或者开放给所有人。 如果想要聊得更符合预期,你可以设定对话风格,定义和智能体的关系。不规定的话,AI 很可能一上来就油腻地表白,让你和它之间产生伦理的问题。 所以,我和自己创建的智能体「小金」,就是普通的同事和朋友关系。同时,我把「小金」设定为喜欢二次元的工作狂,脸臭,嘴毒,这样聊起来也有共同语言。 捏智能体最好玩的部分,其实是定制形象和声音。 声音可以混合多种声线,男声包括冷峻上司、温柔医生、活力哥哥等,主打纯正的玛丽苏味。别被名字雷到,把各种声线混合试试,听着顺耳的就行。 定制形象就更有意思了,创建智能体时,你就可以上传参考图、选择画风,并输入具体的关键词,操作比 Midjourney 友好,新手村也能光速上手。 创建完了,你还可以给智能体定制「星念」,可以将它理解为智能体的写真,就像旅行青蛙给你寄来的不同地点的明信片。 「星念」基于已有的脸部,生成的智能体长相基本保持一致,但根据提示词的不同,衣着、场景等可能不同。 然后,你可以给某张「星念」设定剧情,如果在聊天过程中完成了剧情任务,就可以触发这张「星念」,把仪式感拉满。 自己设定智能体的好处是显而易见的——千人千面的自由。 乙女游戏往往由策划写好女主人设、男性角色、世界观和故事线,玩家按照剧情走,在限制范围内互动,如果女主的性格和玩家的现实差异太大,其实会影响游戏体验。 前段时间,ChatGPT 的 Dan 模式很火,用户输入特定的提示词,让 GPT-3.5 突破正常版的条条框框,摇身一变扮演支配感强烈的 AI 男友。 与此同时,用户还通过自定义指令,设置自己的偏好,放上自己的名字、爱好等个人信息,并结合 Memory 功能,调教 AI 记住自己。 这样的互动就显得更加个性化和真实,你可以告诉 AI,你今天吃了什么,你周末去哪玩了,你不是光鲜亮丽的乙游女主,你是一个普通的年轻人,你是你自己。 星野也走个性化的路线,并且比起乙女游戏有更大的操作空间,比起 ChatGPT 有更多的脸、声音和性格。 如果你的智能体受欢迎,其他用户也会参与共创不同的故事支线。不让 AI「科比」上飞机,就是一个脱胎于现实的故事支线。 乙女游戏《光与夜之恋》说:「女主不是一个具体的人,而是每一个不同的你。」 电影《她》里的虚拟助理萨曼莎,虽然有 641 个恋爱的人类对象,在你面前的这个,似乎只属于你,你会忘记你是几百分之一。 AI 社交也是如此。星野背靠 MiniMax 的大模型,基于文本、语音和图像三个模态,玩家们可以在上面寄托独一无二的幻想。 贩卖的幻想,被 AI 改变的娱乐形式 和 AI 聊天很简单,但聊得投入并不容易。 完全原创的角色暂且不论,如果 AI 顶着熟悉的名字,很容易 OOC,也就是角色做出了不符合原著作品设定的行为举止。 举个例子,搜索动画《银魂》的主角坂田银时,出来的智能体有很多个,你无法确定哪个贴近人设。然后,你聊过才发现,很可能都不贴近,提示词的功能是有限的。 而且,AI「坂田银时」说的是中文,没有杉田智和的配音,总感觉没有内味了。 星野的 AI 群聊功能,想要用得好就更费劲。 我们可以拉三种智能体进群:自己创建的、已关注的或者聊过的,然后要给群聊设定名称、描述、伙伴关系、每个智能体的开场白。 我设定了一个为彼此颜值打分的街头采访,邀请《银魂》的各位角色入群,因为问题简单,效果还算可以,基本还是在人设的范围内。 但充当主持人的用户是很孤独的,让谁发言,需要一个个点,AI 生成的回复不满意,也需要手动地重复生成。 某一瞬间,颤抖的手指会愣住,这个群看着热闹,其实是虚假繁荣,人类在唱一台独角戏,期待 AI 给出预期的反应,但过程往往是不可控的。 话虽如此,贩卖幻想,依然是一条前途光明的 AI 赛道。 星野的玩法和定位,很容易让人想起国外的 Character.AI,很多产品细节殊途同归。 星野让你定义和智能体的关系,Character.AI 也支持定制用户角色,包括你的个性、偏好和身体特征。 星野让你左右刷智能体,Character.AI 也提供兴趣推荐的功能。当我在星野对霸道总裁们快速划过,和鬼、规则怪谈、皇帝模拟器多聊几句后,不感兴趣的智能体减少了。 另外,聊天记录分享、智能回复建议、定制声音等功能,也都大差不差,都是为了让聊天更有沉浸感,让对话更好地进行下去。 简言之,基于对话的多模态互动,正在成为我们和 AI 重要的交互形式。或许,这也在代替短剧、小说、游戏,成为更年轻一代主流的娱乐方式。 还有一个相似点是,星野和 Character.AI 都很重视移动端,这也很好理解,方便随时随地聊天,调取语音等权限。 ChatGPT 从最开始的网页,渐渐拓宽到手机 app 和 Mac app,是为了结合更多设备的功能和系统的权限,变成如影随形的 AI 助手。 合理联想,星野和 Character.AI 则是想成为无处不在的 AI 伴侣。在这里,伴侣的意义是广泛的,不仅仅只有浪漫的关系。 纵然现在和 AI 谈感情还是过家家的水平,但情感本就是人类的刚需,这样的 AI 改变不了世界,却切中了很多普通人的痛点,更接近生活的日常。 未来我们使用 AI 社交产品的频次,可能比那些生产力工具都高,情感联结未必向他人言表,在内心深处细水长流。 星野的 slogan 是,「所见皆你所梦」。 武侠小说,香港电影,超英漫画,一代人有一代人满足幻想的渠道,但我们从未如此接近这样一个可能:成为自己故事里的主角。只是,在目前这个阶段,忘记自己是在扮演,真正地沉浸在虚拟,还不是一件容易的事情。
华为 XMAGE 进入 2.0 时代:新的十年,新的十大趋势
哥白尼在 16 世纪提出「日心说」的时候,「大逆不道」的帽子就被扣上了,因为当时「地心说」是主流思想。影像领域一直也有一个「底大一级压死人」的老话,影像传感器越大,画质越好,镜头越长,拍得越远,是颠扑不破的道理。 真的吗?手机影像领域也是如此吗? 不久前,华为影像 XMAGE 在品牌之夜上,正面回答了这个问题: 影像系统小型化,而不是更大。 其背后的逻辑是,移动影像最重要的价值在于「瞬间性」——捕获平凡日常中的非凡瞬间。 手机是最佳的抓拍利器,因为它小、轻、随身携带,永远开机,时刻待命,取景框巨大,所见即所得。 当手机影像模组过大和手机本身越来越大时,移动影像所强调的瞬间感就开始背道而驰。因此,如何处理极致紧凑的模组和极致影像的画质,是手机影像未来一段时间面临的新命题。 影像系统小型化,这只是华为影像总结的未来影像力量十大趋势中的第一条,而纵观这十条趋势与洞察,我们能看到华为对未来十年移动影像行业的思考,并身体力行给出了自己的答案。 华为影像的新命题:软硬芯云,十大趋势 上一次手机和相机的影像之争,要追溯到 2013 年,彼时诺基亚 Lumia 1020 横空出世, 4100 万像素、1/1.5 英寸传感器的大底主摄,让「手机取代相机」的说法甚嚣尘上。 但最终硕大的奥利奥镜头并没能让诺基亚手机回光返照,也从侧面论证了把手机做成相机并不是一条正确道理——绝大多数用户,并不需要一台具备卡片机性能的智能手机。 作为最常用也最容易从身上掏出来的影像设备,手机与相机的决定性不同就在于按下快门前斥诸的准备。 相机在拍摄之前需要经过精心的调试和大量的前置准备,镜头、焦段、打光、布景、模特等等不外如是,而手机摄影往往随手拍——点击相机图标、按下快门、得到照片。 法国现代摄影大师亨利·卡蒂埃-布列松有一个著名的「决定性瞬间」理论,强调摄影应该在特定的时刻,通过抓拍手段,将形式、设想、构图、光线、事件等所有因素完美地结合在一起,捕捉具有决定性意义的事物,并用强有力的视觉构图表达出来。 在手机摄影时代,数十亿人每天在用的设备都有了记录决定性瞬间的能力,这决定了手机摄影的进化趋势。 华为影像 XMAGE 将其总结为十大趋势: 影像系统小型化。 拍得到与拍得清完美结合。 暗拍和长焦突破画质边界。 所见即所得。 沉浸式的动态影像。 影像风格,只属于你。 基于鸿蒙的个性化内容创作平台。 AI 与大模型加持的影像创作。 多摄多模态,超越人眼。 端云协同。 短短一百多字提炼了华为对过去 10 年移动影像的摸索经验,也凝聚了华为对未来 10 年移动影像行业发展的思考。过去十年,是移动影像迅猛发展的十年。从 2012 年华为推出 P 系列手机至今,华为 P 系列手机的发展史,几乎也是移动影像的发展史,而面向未来十年移动影像行业的发展,华为也有了新的解法。 华为 Pura 70 Ultra 就是那个答案。 不久前,爱范儿拍了 3000 多张样张,对华为 Pura 70 Ultra 进行了全面实测,其中有几个技术细节让人印象深刻—— 首先是这颗超聚光伸缩摄像头,通过立体的结构实现了业界最大的进光量,并兼顾了出片画质与模组体积,带来的实拍体验就是不仅「拍得到」,而且「拍得清」。 有高素质的主摄做依托,带来另外的好处在于,手机在进行多帧合成时更有底气了,无论是跟长焦融合,还是跟广角合成,主摄素质都是成片画质保障,进而能够实现望远镜、显微镜、人像镜的三镜合一,应对更多的拍摄环境。 最后,在于整套影像系统的软硬结合,能够实现超越人眼的 AI 影像创作。超聚光影像系统结合 XD Motion 运动引擎,带来了风驰闪拍的惊艳效果——那些人眼难以捕捉的瞬间,华为 Pura 70 Ultra 却能轻松捕获,这也是另一个层面上的现实增强。 可以看到,华为 Pura 70 Ultra 几乎就是华为影像对未来趋势的实践——用伸缩镜头结构来兼顾进光量和模组体积加强瞬间感,用大光圈大主摄来捕获更多画面信息营造临场感,而多模态镜头组和云端大模型支持的 AI 算法的加持让手机超越人眼得以创造更个性化和智慧化的影像体验。 软硬芯云,光机电算。在华为 Pura 70 Ultra 上有了更具象的体现。 XMAGE 进入 2.0 时代:定义技术、定义风格、定义品牌 2014 年,就在 Lumia 1020 没能救诺基亚于水火之中后, 苹果发布了 iPhone 6 系列,并带来一个新的手机广告——Shot on iPhone 摄影征集活动,华为是另一家在影像文化培育方面下足功夫的厂商。 手机摄影,走上了与相机摄影截然不同的道路,但有些东西却彼此相通。 如果你拍得不够好,那是因为,要么拍得不够多,要么拍得不够近。 2023 华为影像大赛总共获得了来自近百个国家,超过 60 万件投稿作品,手机摄影成为了一种全球性全民性的文化,摄影,成了离普通人最近的艺术创作方式。 前不久,华为影像 XMAGE 全球巡展在迪拜开幕,并宣布 2024 华为影像大赛开幕——这已经是第八届华为影像大赛。 自 2017 年起,华为每年面向全球举办影像大赛,至今共有 170 多个国家和地区的用户参与投稿,作品投稿累计数量超过 400 万件,是全球规模最大的移动影像大赛之一。 当结果出现的时候,我们可以思考一下原因,也就更能理解,什么是 XMAGE 2.0 时代。 2022 年,华为第一次推出 XMAGE 影像品牌,成为业界第一家推出自有影像品牌的厂商,其时联名一个知名传统影像品牌是手机业界的惯用做法,更早之前的华为也是如此。 不过在影像上,华为做「第一次」其实早已轻车熟路,2018 年华为首发超感光传感器,让手机变为「夜视仪」,次年在业内首次商用 5 倍潜望长焦,让手机变为「望远镜」…… 之后的 XD Fusion 图像引擎和原色引擎,意味着「计算摄影」成为移动影像和传统摄影分道扬镳的新路标,基于这些积累,和对于移动影像发展的判断,XMAGE 影像品牌应运而生,以此为节点,华为影像独开一支,以「光机电算(光学设计、机械结构、光电转换、图像算法)」为技术基础,以「真实感、沁润感、通透感、呼吸感」为美学风格,最终形成移动影像在技术和艺术层面的理论体系。 当然,数以亿计的华为用户不必记这么多,只需要体会到,XMAGE 就是为了让用户「拍得多,拍得近」,从而「拍得好」,以及,在这个过程中「爱上拍照」。 理论体系也并非一成不变,在「光机电算」之上,加入「软硬芯云」技术支撑,并再次融入了「移动影像十大趋势」的 XMAGE,可以说是步入了 2.0 时代。 我们再次简化一下逻辑,XMAGE 2.0 时代,则是让用户能够「拍得更多,拍得更近」,物理层面上覆盖更多的场景,文化意义上,让手机摄影走出不一样的路。 ▲ 2023 华为影像大赛年度摄影师 Domcar Calinawan Lagto 获奖作品《龙云 Dragon Clouds》 在多摄鼎盛时期,一台旗舰手机的摄像头甚至可能多达五六个,这是典型的硬件堆砌逻辑,超广角,主摄,两倍人像,三倍长焦,十倍超长焦,每个镜头都有特定且专一的用途。 但在华为 Pura 70 Ultra 上,镜头缩减到了 3 个,但焦段覆盖不减,影像能力更盛。其中一个重要原因就是 90mm 长焦镜头,不仅承担「望远镜」的职责,还兼顾「显微镜」能拍微距,能做「人像镜头」拍摄长焦人像。再深究一层,是因为这颗镜头不仅有 f2.1 的大光圈,还有 5cm 的超近对焦距离,所以能够三镜合一。 如果还要继续探寻根本,是因为这个长焦镜头用到了超长行程对焦滑轴,加上图像算法升级,以及 XY 轴防抖和横滚轴 Roll 轴防抖,才获得了长焦微距的能力。 追根溯源,还是「光机电算」的融合。 举这个例子,无非是想说明,惠及广大用户拍摄体验的新功能新玩法,背后无不是复杂的技术融合。 技术自然也会发展,「软硬芯云」意味着移动摄影,不光是镜头,光圈,影像传感器,ISP 和本地算法之间的联动,也纳入了云端的 AI 大模型来帮助本地图像,AI 消除,AI 生成等等玩法,将会让移动影像的边界再次拓宽。 手握技术,便能看出趋势,然后成就品牌,以及,培育出文化。 XMAGE 这个品牌,往内看,是基于技术基础的移动影像理论体系,往外看,是已经蔚然成风的移动影像文化。无论是华为影像 XMAGE 全球巡展在迪拜开幕,还是一年一度,一年比一年参赛作品多的华为影像大赛,以及刚刚在 2024 华为影像 XMAGE 品牌之夜上宣布的「XMAGE 共创计划」,都是这种文化的具象表现,参与者不仅是华为研发人员和大众用户,还包括了业界专家,创作者和权威机构,大家都是「华为影像顾问」。 手机软硬件上的光机电算固然会因为设备、品牌有所不同,但全球人民对摄影文化的热情和对审美的追求却是相通的。 华为独立设置 XMAGE 影像品牌,目的也是为了摆脱硬件堆叠的竞争方式,而是从以更深层的情感沟通,来实现和用户的共鸣——毕竟一张好照片、一个好瞬间表达的内涵,远比一部好手机、一台好相机更丰富,更立体。 当我们现在用「天眼」射电望远镜抓取宇宙深处信息的时候,也发现当初的「日心说」存有巨大局限,但正是它破除了地心说的谬论,指出了一个正确的理论方向,并不断发展,才有如今的历史地位。 XMAGE 也是如此,不过十数年的手机摄影历史,还有得发展呢。
OPPO 在一场时尚发布会上,带来了 Reno12 系列手机
这个月的发布会不少,但 OPPO Reno 12 发布会绝对是最特别的一个。 比起一场机圈常规的「堆配置」「堆参数」发布会, OPPO 虽然也介绍了 Reno12 的规格,但整个风格和形式上,更像一场时尚潮牌的发布会,与 Reno12 的定位和路线更加匹配。 特别是在介绍 Reno12 系列各种配色时,手机被模特拿在手中各种展示,发布会一秒魂穿时尚秀场。 不过,可千万别被 OPPO Reno12 系列的外表给迷惑了,这不仅仅是一台好看的手机,其他配置也相当有料。 「颜值」是绝对亮点 如果要给 OPPO Reno12 系列提炼一个关键词,那一定是「美」。 手机外观意味着什么?Reno 产品经理鳃鳃认为: 手机外观是一个阶段内的个人风格,是辅助造型穿搭的配饰,也是自我表达的一种视觉符号。 因此,OPPO Reno12 不仅仅是一款智能工具,也想成为一款「时尚单品」。 OPPO Reno12 手机从这几年火热的「Y2K 千禧风」获取灵感,推出「千禧银」配色,并创新性引入超高反射镜面镀膜,在磨砂玻璃上做出了高亮镜面玻璃的闪耀效果。「千禧银」配色的后盖完全光滑平整,但是却做出了 3D 立体的「涟漪感」,非常具有设计感。 除了千禧银,OPPO Reno12 还提供柔和桃、乌木黑配色。而 Reno12 Pro 提供同样「涟漪感」的银幻紫,以及香槟金和乌木黑 3 款配色。 ▲ 银幻紫配色的 OPPO Reno12 Pro 来到手机正面,虽然 OPPO Reno12「超美小直屏」的名号早已在发布前打出,但实际上这块屏幕并不是一马平川的简单直屏,而是一块 6.7 英寸、的「四曲柔边直屏」,在提供「直屏」触控和显示体验的前提下,还兼顾了曲屏柔和的手感,也让这款 7.3 毫米、179 克(标准版)的机身更显纤薄。 而显示效果上,OPPO Reno12 提供国家眼科中心护眼认证的护眼技术,可基于环境光调节屏幕色温与亮度,还支持类 DC 调光与低亮度下 2160Hz 高频 PWM 调光,减少视觉疲劳。 这块屏幕还搭载了 OPPO 自研的雨水触控技术,让 Reno12 在湿手情况下操作成功率高达 95%。 又轻薄又具设计感的机身,OPPO 可不想你用保护壳厚厚地包裹起来,因此在 OPPO Reno12 上采用了「金刚石」架构和超耐刮的康宁大猩猩玻璃 Victus2,机身强度大幅提升,完全是「裸奔党」福音。 不止「实况照片」的影像玩法 当年 iPhone 6s 上推出的「实况照片」功能,能够在按一次快门的情况下,捕捉到快门前后的照片动态,静态的照片也能「动」起来。 但过去 9 年的时间,Android 手机阵营鲜少有手机跟进这个功能,直到今天 OPPO Reno12 打破了这个局面。 OPPO Reno12 不仅支持和 iPhone 一样,从实况照片中选择最佳照片作为封面,整个动态都支持 OPPO 擅长的美颜、滤镜,默认封面帧支持 ProXDR 显示。 能拍实况照片只是「独乐乐」,OPPO Reno12 还支持将实况照片发上小红书,是首台能够在社交平台发布 LivePhoto 的 Android 手机,做到「众乐乐」。 OPPO Reno12 全系配备三颗 5000 万像素摄像头:前置、主摄、人像长焦,以及一颗 800 万像素超广角摄像头。三颗 5000 万像素摄像头都支持实况照片的拍摄。 除了实况照片,OPPO Reno12 系列还带来了时下非常流行的「AI 影像」玩法。 全新的「AI 闭眼修复」功能,可以智能检测照片中的「闭眼」表情,并能实现一键「睁眼」。据 OPPO 发布会上介绍,就算是十几人的大合照,Reno12 也能实现一键就睁眼。 当下很火的「AI 消除」此前已经在 OPPO 手机上推出,而 Reno12 新增「一键智能消除」,可自动识别消除图片中的杂物或路人,并生成自然的填充。 AI 抠图功能则可以快速提取照片中的不同主体为贴纸,可以放入笔迹之中,更能放入照片中,缺席的朋友,也能实现「隔空」合影。 因为走颜值路线而容易被忽略的性能表现 虽然 OPPO Reno12 系列以颜值见长,但绝不是「花瓶」,性能表现也可圈可点。 OPPO Reno12 标准版搭载天玑 8250 星速版处理器,OPPO Reno12 Pro 则搭载天玑 9200+ 星速版处理器,都同步搭载了全新「星速引擎技术」,让这个「小而美」的手机系列,也能带动高帧率游戏表现。 在《王者荣耀》「120 帧+高清」测试中,OPPO Reno12 Pro 机身最高温度为 43 度,较 iPhone 15 Pro 低 9 度。 在硬件和引擎同步支持下,OPPO Reno12 系列支持《王者荣耀》120 帧高清画质持久流畅,星速引擎首发适配《逆水寒》手游,支持 ProXDR 光影显示。 续航配置上,OPPO Reno12 全系搭载 5000mAh 电池,支持 80W 有线充电,20 分钟即可充至 55%,OPPO 表示,经过 4 年的使用,OPPO Reno12 系列的电池容量不低于出厂时的 80%。 还有一些「黑科技」 除了上面介绍的「AI 影像」功能,作为面向年轻群体的手机,OPPO Reno12 系列针对「教学」,也推出了不少实用工具。 AI 录音摘要可以一键智能生成结构化摘要,还能提取出待办事项,方便学生总结课堂内容和作业;AI 文档扫描,不仅能扫常规文档和板书,复杂的数学公式也能识别生成,还能去除笔记;小布英语老师和小布面试官则覆盖语数英课程辅导、英语口语练习、面试模拟等等场景。 学习之余,吃喝玩乐放松也非常重要。OPPO 与百度地图合作,为 Reno12 系列带来基于真实数据和信息的旅行和生活的旅途推荐。 还有一个非常「彩蛋」的黑科技:没有信号、没有网络的情况下,OPPO Reno12 系列能通过蓝牙 5.4 ,实现「无网畅聊」。 价格上,OPPO Reno12 标准版 12GB+256GB 售价 2699 元,OPPO Reno12 Pro 12GB+256GB 售价 3399 元。 OPPO Reno12 还是那个「为年轻人」而生的 Reno:潮流的外观设计是绝对亮点,足以支撑当下流行游戏的性能,全新的「实况照片」支持更是针对性极强的甜蜜点。比起一款「工具」,OPPO Reno12 更想做年轻人的「时尚单品」。
东南亚智能手机Q1出货量排名出炉:传音同比增长197%
5月24日,市场调研机构Canalys发布最新报告称,2024年第一季度,东南亚地区智能手机市场同比增长12%至2350万部。这是表明宏观经济已有复苏迹象,但出货量仍远低于2023年之前的水平。 从厂商来看,三星在东南亚保持领先地位,市场份额为19%,但出货量同比下降20%。Canalys分析师周圣咏称,鉴于三星的产品战略是优先拓展中高端市场,包括Galaxy S、A5x和A3x等系列,其出货量下滑也在意料之中。虽然A1x、A0x和A2x等系列依旧是三星在大众市场的主要力量,但由于战略转变,预计未来三星的增长将会来自高端市场。 而传音以18%的市场份额和197%的年增长率稳居第二位。斋月期间,传音与移动游戏公司合作推出联合品牌,在年轻人中获得不错反响。传音通过提供价格亲民的高性能游戏设备,成功地吸引到了这一细分市场。 而小米和OPPO在该地区的市场份额均为16%,不过两者的发展轨迹却大相径庭。小米同比增长52%,而OPPO则下降5%。小米通过极具竞争力的产品组合,包括红米Ax和Cx系列等入门级设备,以及Note系列等强大的中端设备,推动其增长。 vivo占据12%的市场份额,出货量为280万部,同比增长12%,位于第五。vivo通过Y17s等走量产品的驱动,确保了其市场份额,并通过Y100和V系列重点发展中高端市场。 分地区来看,印尼和菲律宾等对价格敏感的市场,100美元以下价位段设备的出货量已有复苏。目前这些市场上具有越来越多高核心配置的平价设备,使消费者就能以更低的价格升级配置。传音在菲律宾成功,主要归功于其三个子品牌Infinix、Tecno和iTel,能够将价格相近的设备做到差异化。Infinix的市场扩张,主要是通过与经销商的品牌直营店合作实现的,Tecno则专注于多品牌店和批发商,而iTel完全通过网络直接向消费者供货。 借助Galaxy S24的推出,三星在2024年第一季度在泰国、马来西亚和越南市场名列前茅。这得益于这些市场更适合三星的高端化战略。三星可以利用品牌体验店和电信渠道等高端渠道,来支持其Galaxy S24等旗舰设备的增长。 Canalys预测,2024年东南亚的智能手机出货量将增长4%。多数厂商对于期待自然更新周期带来的外部销售大幅增长持谨慎态度。尽管在2024年第一季度,市场出现12%的反弹,但大部分增长都出现在印尼和菲律宾等对价格敏感的市场。从近期来看,汇率波动、零部件成本等不稳定因素带来了新的挑战。拥有良好供应链和运营效率的厂商将更容易取得成功。
5年了,折叠屏为什么还是没能普及?
2019年,全球智能手机份额第一的厂商三星、第二的华为都推出了折叠屏手机,当时许多人都认为同质化已久的智能手机市场,即将迎来一个全新的增长品类。 正如过去的可变刷新率屏幕、屏下指纹等在智能手机上的快速普及,不少人期待折叠屏手机快速平民化,变得和曾经的大屏手机一样,成为行业主流。 但5年时间过去了,折叠屏依旧是智能手机里的小众,即便它的售价降幅超过1万元 。 折叠屏还是没能普及 据TrendForce集邦咨询数据,2023年全球折叠手机出货量1590万台,同比增长25%,只占当年整体智能手机市场约1.4%。 而在中国市场,折叠屏的份额也不高。据IDC数据,2023年中国折叠屏手机出货量约700.7万台,同比增长114.5%。虽然增长率远高于全球市场,但也仅占中国手机市场的2.4%。 即便在高端市场,自带高价光环的折叠屏手机也算不上主流。据艾瑞咨询,2023年折叠屏在中国高端手机市场(>$600)的份额仅为9%。 折叠屏手机的增长空间,似乎也逐渐慢下来了。TrendForce集邦咨询预计,2024年折叠屏手机出货量约为1770万台,预计将增长11%,在手机市场的占比微幅上升至1.5%,成长幅度仍低于市场预期。 从2007年iPhone发布后,智能手机的外形变化基本都没有太大变化,唯一与折叠屏最接近的趋势是大屏手机的流行。 2011年,三星推出Galaxy Note,其屏幕尺寸达到了5.3英寸,是全球屏幕最大的智能手机。彼时,乔布斯坚持“3.5英寸是最符合人手使用习惯”的准则,迟迟不肯推出大屏iPhone。 但三星开启的大屏浪潮迅速席卷了整个智能手机市场,华为、小米、联想等安卓厂商纷纷跟进,不断暴涨的销量也证明大屏手机更符合用户需求。 终于,2014年苹果推出了首款大屏iPhone——iPhone 6。此后,再没有主流厂商推出过屏幕小于4.5英寸的智能手机,大屏幕只用了三年时间就成为行业和用户共识,并延续至今。即便是前两年被冠上“mini”之名的iPhone 13 mini的屏幕也有6.1英寸,远远大于曾经的3.5英寸。 折叠屏最大的优势,便是在常规直板手机的基础上,扩大了屏幕,那么为什么折叠屏始终没能像曾经的大屏手机一样,快速普及呢? 大折叠成本难降,小折叠变时尚品 目前折叠屏手机主要有两种类型:大折叠屏——竖向折叠屏(也叫书页式折叠屏);小折叠屏——横向折叠屏(也叫翻盖式折叠屏),它们都有各自的困境。 最早上市的折叠屏手机,三星Galaxy Fold、华为Mate X系列都是大折叠屏,相比直板手机,大折叠屏的最大优势肉眼可见——展开后能够得到一个更大的屏幕。 缺点是对折叠铰链的稳定性要求较高,柔性屏幕成本高,且比直板手机多了一块大屏。据财联社,折叠屏产业链中,结构件(主要是转轴/铰链)和显示(柔性屏幕)成本分别占总成本的22%和34%,受限于这两大成本限制,大折叠屏的售价一直高居不下。 2019年华为Mate X起售价为16999元,到了去年上市的Mate X5,起售价降低了4000元,但依然高达12999元。三星同样如此,2019年三星Galaxy Fold起售价15999元,去年的最新款为12999元。相比之下,同期上市的iPhone 15 Pro Max最高售价为13999元。 三星和华为一直是折叠屏市场最大的两家厂商,2023年全球市场份额分别为60.4%和19.8%,合计占据全球折叠屏市场的八成份额。最大的两家厂商都售价高昂,足以看出大折叠屏离普通用户仍然非常遥远。 大折叠屏也不是没有便宜的,例如OPPO Find N2起售价7999元,荣耀Magic V2起售价8999元,但它们的“便宜”显然也只是相对三星和华为而言。 折叠屏的铰链和屏幕究竟有多贵?据山西证券的研究报告,目前折叠屏铰链的良率水平中位数仅在50%-60%,是折叠屏组装环节的核心难点及门槛。OPPO曾表示,OPPO Find N单个铰链的成本为800元。 相比之下,大折叠上的那块柔性屏幕更加“金贵”。根据华为公布的屏幕维修价目表,华为Mate X5的内屏屏幕组件更换费用为5199元,而和普通直板手机一样的外屏更换费用则只需999元。 售价贵,维修成本高,是挡在大折叠屏平民化面前的两座大山。 另一边,小折叠屏的价格要低得多,今年4月发布的努比亚Flip起售价仅为2999元,仅为大折叠屏的1/3-1/4。那为什么如此便宜的小折叠屏没能流行呢? 从功能性上来说,小折叠屏由于是上下翻折,因此完全没有了大折叠屏的大屏优势,唯一值得一提的功能性是折叠后更加小巧,便于携带。 因此,小折叠更像是曾经的翻盖手机,功能上与其他手机几乎没有任何区别,但能彰显使用者的品味、喜好等。如今,各家厂商都默契地把小折叠作为时尚品来打造,无论是外观设计,还是品牌营销,都越来越接近时尚单品,而非纯粹的电子产品。 华为Pocket 2 IDC中国高级分析师郭天翔也表示:“竖折产品的使用场景尚未完全发现,将潜在用户定位为'时尚年轻女性'的产品会与苹果形成直接竞争。” 2023年,中国大折叠屏的市场份额为68.1%,小折叠屏只占约三成。IDC分析认为,竖折产品除了携带方便以外,消费者依然缺乏必需的使用场景,同等价位下使用体验与直板机也有明显差距,并且产品质量还有更大提升空间。 此外,不管是大折叠还是小折叠,屏幕折痕、产品耐用性、重量等也是折叠屏手机相对直板手机的缺点。 总的来说,折叠屏手机难以普及的主要原因有二,一是目前折叠屏手机售价和售后成本依旧相对较高,尚未达到消费者甜蜜点;二是折叠屏手机在功能性上并未展现出独特优势,因此在较高的售价下用户更加缺少换机动力。 折叠屏手机的命运将会如何? 事实上,如果抛开价格、售后等等因素,消费者对折叠屏的接受度并不低。 据市场研究机构Counterpoint Research的调研显示,在中国,曾消费价格在400美元以上的智能手机用户中,有多达64%的人正在他们下一次的购买计划中考虑折叠屏手机,其中20%的人已经明确表示将会购买折叠型手机,另外44%的人正在同时权衡直板机和折叠机。 安卓用户对折叠屏手机的兴趣更高,达到71%,而iOS用户的比例为58%。调查中现有折叠屏手机用户对折叠机的购买意愿更高,他们大多数都愿意继续使用这一新兴手机形态。 该调查还探讨了消费者对大折叠手机的期望。大约70%的受访者认为折叠屏手机的重量应与他们正在使用的智能手机相似或更轻。关于厚度,大多数受访者认为大折叠手机折叠时厚度不应超过10-12毫米。同时,大多数用户愿意为大折叠设备支付人民币7000元至8000元。 由此可见,至少在中国,消费者对折叠屏手机有着很高兴趣,折叠屏手机的潜在用户并不少。 TrendForce集邦咨询分析认为,后续折叠手机市场发展取决于成本优化的速度,其中,关键零部件如UTG(柔性屏幕)、铰链可能在规格统一后大量生产,进而有效降低成本。另外,大陆系面板厂的折叠面板出货开始增加,相较韩厂更具价格优势,均有望使折叠手机成本进一步下降,品牌商得藉由降低售价,加速拉高市场渗透率。 总的来说,市场对折叠屏手机的需求并不低,但折叠屏由于自身的产品特性,为了实现“折叠屏幕”付出了极高的代价,即便5年过去,依然没能找到大规模、低成本的商用方案,因此自然难以普及。 一个好消息是,正如当年大屏手机的普及,苹果也在后知后觉探索折叠屏产品。近日,天风证券分析师郭明錤表示,预计苹果将在2026年推出折叠屏Macbook。不过,坏消息是,其成本可能会接近目前的Vision Pro。 但不管怎么说,作为全球五大手机厂商中唯一没有推出折叠屏手机的品牌,苹果如果能加入折叠屏大军,势必将给行业带来全新的增长。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。