行业分类:
加载中...
头条分类:
加载中...
携程同程,追着对方跑
撰文 | 文烨豪 编辑 | 吴先之 经过几年的沉寂与低迷,随着解冻的土地上绽放出一朵朵野花,旅游行业终于迎来了久违的春天。特别是在经历一系列宏观环境的变化后,大众消费观念逐渐向享受、悦己型消费转变,推动着线下演出、音乐节、旅行等市场的持续性繁荣。 在此背景下,作为旅游行业的两大老牌玩家,携程与同程近期发布的财报,无疑成为了观察OTA赛道的重要风向标。 财报显示,2024年第一季度,携程集团营收119亿元,同比增长29%,归母净利润约43亿元,同比增长 26%;而同程旅行营收38.66亿元,同比增长49.5%;经调整净利润5.58亿元,同比增长10.9%。 尽管增长趋势有所放缓,但考虑到去年同期基数较低的因素,整体表现皆较为稳健。而在这片渐趋繁荣的市场中,携程、同程等老牌玩家稳扎稳打,不断出招,仍然存在诸如抖音等新晋玩家的袭扰,他们亦在积极布局酒旅市场,此番新旧势力的碰撞,或许预示着一场可能的行业变革。 携程同程,求同存异 旅游业在经历了一年的恢复期之后,增长的步伐已见放缓,但复苏之路依旧清晰可辨。 文化和旅游部统计数据显示,2024年一季度,国内旅游人次达14.19亿,同比增长16.7%;游客总花费亦同比增长17.0%。在此背景下,除却第一季度因春节假期导致企业差旅收入环比减弱,携程与同程多数业务仍保持增长势头。 以OTA核心的交通票务和住宿业务为例,携程财报显示,2024年第一季度住宿预订收入为45亿元,同比增长29%;交通票务收入为50亿元,同比增长20%;同程同期交通业务收入达17.37亿元,同比增长25.6%;住宿业务收入为9.65亿元,同比增长15.6%。 尽管两家公司强调营收多元化,且业务版图不断扩展,但交通票务和住宿业务在总营收中仍占较大比例——携程接近80%,同程则接近70%。而旅游度假业务虽增长较为迅猛,但对两位玩家而言,其在总营收中所占比例依然较小,依然具备上探空间。 财报显示,2024年第一季度,携程旅游度假业务的营业收入达8.83亿元,同比飙升129%;同期,程包含线下旅行社业务、旅游景区运营等在内的旅游业务收入为6.63亿元,增长同样强劲。 另一方面,一直以来,携程与同程好似OTA的AB两面。 从市场定位来看,携程主要服务于高收入、高学历的高净值人群。而作为OTA巨头,其盈利能力主要依赖于其基于规模形成的在整个供应链、产业链的议价主导权,同旅游服务产业融合更为紧密。因此,携程一直加速自营化进程,以解决履约难题和消费者决策难点,并通过控制更多服务环节提升利润率。 相比之下,同程更像是扮演中介的角色。早在2020年,同程将深耕五环外市场作为核心战略之一,通过同程旅业深入二三线城市和乡镇市场,并借助线下门店在未被互联网完全渗透的地区建立品牌影响力。此外,同程与微信的合作开辟了巨量流量的新途径,通过利用微信庞大的用户基础转化潜在用户。 数据显示,截至2023年底,中国非一线城市用户占同程平台用户总数的86.9%,微信平台的新付费用户中,约72.7%来自非一线地区。 因此,尽管行业整体处于复苏阶段,但复苏逻辑有所不同。对酒旅行业的长期挖掘,使携程的增长更多取决于对用户潜力的挖掘;而学步拼多多的同程,核心优势在于中低端酒旅资源、下沉市场份额,这也使其顺应了今年以来的反向旅游浪潮。 当前,反向旅行正在成为一大趋势,无论是柳州、淄博、天水等城市,还是周边县城,均受到游客青睐——常年被“人挤人”所困扰的游客们,已然学会了避开热门路线,寻求小众目的地。《2024年五一假期旅游消费报告》显示,三线及以下城市的酒店预订热度同比增长超100%,部分热门县级城市景区门票预订量同比大增200%以上。 携程亦在业绩说明会上指出到,由于旅游偏好向出境目的地和低线城市分流,国内酒店ADR(已售客房平均房价)有所下滑,可谓有人欢喜有人忧。基于此,携程亦主动放下了身段,加大了同三四线城市的合作力度,并增设度假农庄,拓展下沉市场。 尽管这波旅游新浪潮,为玩家们带来了短期的营收高峰,但繁荣能否持续仍是一个待观察的命题。尤其是在五一假期后,社交媒体上对于“反向旅行”的祛魅声音不绝于耳——实际体验与宣传的差距,让不少游客败兴而归。 因此,对于携程和同程来说,除抓住行业变迁的机遇外,若想彻底复苏,仍需攻克更多增长关口。 国际业务,撑起复苏节奏 在全球旅游业渐趋复苏的大背景下,国际市场的拓展似乎已成为携程与同程寻求第二增长曲线的关键战场——在国内市场逐渐恢复至2019年的水平后,此番打法既是对国内市场潜在饱和的提前适应,亦是一场关于未来增长潜力的赌注。 此番投资,在很大程度上得益于全球化浪潮和国际出入境政策的积极调整。比如同新加坡、泰国等国的相互免签协议,大大降低了国际旅行的门槛,刺激了跨国旅游的需求。国家移民管理局数据显示,2024年第一季度,免签入境外国人198.8万人次,同比增长266.1%。 在此背景下,两位玩家纷纷改造、拓宽自身业务面,以此接住红利。 具体而言,拥有国际OTA平台Trip.com的携程,在此领域无疑具备先发优势,因此打法更加偏向于优化现有产品并加固市场防线。比如在Trip.com上线了景区在线预约功能,覆盖600多家国内头部景区,使得旅游预订更为便捷,进而撬动需求,增强市场竞争力。 财报显示,2024年第一季度,携程的出境酒店和机票预订同比均增长超过100%,入境游预订同比增长更是超过4倍,而Trip.com平台营收则同比增长约80%。这一切都标志着国际业务在携程总营收中的比重和重要性正在迅速增加。 相比之下,同程国际业务起步较晚、资历尚浅,因此步调更多偏向于业务面的补全。正如其在财报中所言:“2024年第一季度,我们增加了对国际业务的投资,以进一步扩大我们的产品和服务覆盖范围并加强与用户互动。” 据悉,同程已在新加坡设立了海外总部,并在洛杉矶开设了首个海外实体店,且计划推出服务北美用户的一站式预订服务APP WatsTravel。除此之外,同程还在加速对英国、泰国、印尼、菲律宾等市场的布局,可谓野心勃勃。 基于此,同程第一季度国际业务表现同样不俗,其第一季度国际机票票量同比增长超260%,国际酒店间夜量同比增长则超150%。只是,对同程这一新晋玩家而言,面对国际市场的复杂性,以及全球在线旅游服务市场的内卷,其如何巩固初步成果并在市场竞争中突围,将是其面临的重大挑战。 但不论如何,从长远来看,国际市场的开拓是携程和同程实现持续增长的必经之路。而未来,随着全球旅游市场的进一步恢复和发展,携程和同程的国际业务或将成为其业绩增长的重要指标与看点。 终 眼下,随着觊觎酒旅市场的玩家越来越多,携程与同程,各自遇到了对手。 携程凭借其过往庞大的高星级酒店资源库,一直站在行业的高地上。毕竟高星酒店建设成本高昂且周期漫长,且属地资源稀缺,无法轻易被复制或替代,比如三亚亚龙湾海岸线,几乎都被各五星级酒店所瓜分。而携程过往利用稀缺的高星酒店资源,构筑了难以攀越的护城河。 因循该逻辑,飞猪、美团等老对手,正试图通过“挖墙脚”提高自身平台的高星酒店比例,企图从根基上动摇携程的地位。 可即便如此,携程在高星酒店领域的地位依然稳固。某高奢酒店服务人员告诉光子星球,在其酒店内部,来自携程的客户重要层级最高,携程评价亦是其最为看重的评价渠道。此外,一位业内人士透露,携程有很多独家签约酒店,若酒店违约,将面临被摘牌甚至下线的惩罚。 或因如此,当飞猪企图通过“攻城价”,借由日本京都威斯汀酒店打响价格战时,酒店方面才会紧急发布未授权公告,并停止飞猪订单核销来避免误会。因此,尽管受到竞争因素的影响,携程独家签约酒店数量已不如前,但在行业心智层面携程优势尚存。 相比之下,面对市场竞争,同程并没有这么好运。除却美团、飞猪等老牌劲敌外,迅速扩张的短视频玩家亦对同程构成了前所未有的挑战。这其中,相较于主打合作逻辑的快手,抖音显然更具威胁。 去年以来,抖音不断在旅游市场投入重兵,不仅将其酒旅业务提升为一级部门,亦通过流量倾斜与远低于行业的住宿业务佣金率向行业开战。在此背景下,纵使高星酒店坚守自身价格体系,不愿入驻,但中低端酒店、民宿却普遍愿意为了流量而内卷。 而大量中低端酒店和民宿同抖音合作,恰恰动摇了同程低星酒店的基本盘。为此,去年9月,同程与快手本地生活达成合作,希望通过新的流量入口抵御抖音的侵蚀。然而,随着抖音在旅游行业的战略推进,未来二者的厮杀只会愈发激烈。 归根结底,在市场涡旋之中,各路玩家们的每一步棋都尤为关键。面对行业内外部的嬗变,这场旷日持久的对弈,尚未走到终局之时。
字节的“细水长流”式裁员
作者丨古廿 编辑丨伊页 字节开发出一种新的裁员模式。 近日,在社交媒体平台上有字节跳动员工发帖称:HR说北京裁员已经到了不让裁员的地步了。 有网友表示,相比过去的一次性大规模裁员,目前字节在执行的是考核优化策略,这也是一直没爆炸性的裁员消息被媒体报道的主要原因。具体来说就是,HR私下里把人喊到小会议室一对一聊,谈好赔偿后直接离职,用这种“细水长流”的方式进行裁员,在完成裁员目标的同时动静也不会太大。 不一样的裁员动作背后,是字节业务调整的步伐开始举棋不定。 仅5月份以来,有媒体报道的字节业务调整就一直来回拉扯。先是5月初,去年出售线下门店业务,转型线上房产信息平台的“幸福里”再次调整,并入抖音本地生活。 紧跟着5月中旬,又有知情人士向媒体透露,“字节出售美中宜和这个事,完全没有。”但是在一个月前,美中宜和宣布由妇儿专科转向综合医疗平台,全新的三级综合院区将于年底投入运行。彼时,投资圈内有关字节跳动考虑出售旗下美中宜和的消息就已经传了一阵子。 最近,多名内部人士也向外界透露:“字节跳动正考虑将旗下负责游戏的朝夕光年和沐瞳科技合并为一个新的全资子公司。未来,新公司将作为独立公司自负盈亏。”不过朝夕光年相关负责人在回应传言时对此予以否认:“消息不实。” 对于房产、医疗、游戏三块业务的调整传言,几乎每隔一段时间就会出来一些。来源的根本在于,相较于字节此前在教育、PICO两块业务调整上的迅速利落,目前在这三块业务调整方向上似乎并不能做到快刀斩乱麻。 2016 年,有媒体曾经问张一鸣,“三年多,你做了哪些关键决策,让今日头条从一亿美金,做到了百亿美金?”他回答说:“我觉得,大部分重要决策,我在创业之初头三个月就基本做完了。” 自信的基础是认知。字节发展历史上,曾经有过三次“大力出奇迹”,均建立在远超行业认知的基础上。 第一次是在2012年,张一鸣力主开发个性化推荐引擎。当时做推荐引擎对创业公司来讲难度很高,张一鸣却认为,“如果不解决个性化的问题,我们的产品只是做些微创新,也许能拿到一些移动互联网的红利,但不可能取得根本性的突破,不能真正地创造价值。在任何时候,我们都要努力从根本上解决问题。” 第二次在2016年,张一鸣力主进军短视频领域。彼时字节跳动只有今日头条一款产品,而且尚未盈利。但是张一鸣有一个斩钉截铁的认知:“如果我不做短视频,我将退出历史舞台。” 上线短视频产品的前九个月,数据都很难看。但在这个重大关头,他说了这样一句话,“逻辑上正确的事情一定是对的,况且还有别人已经验证过了,我们数据差是我们自己没做好。”之后还把头条一半以上的资源都投入进去,最终成就了今天的字节跳动。 第三次就是字节国际化的关键转折点,花10亿美元重金收购了Musical.ly。事实上当时有三家公司都在谈收购,一是Facebook,二是快手,三是张一鸣。最终的三选一胜出,Musical.ly的天使投资人傅盛起到很重要的作用。傅盛说,“当时张一鸣多决绝啊。他家在北边,我在东边,每次专门跑到我家楼下咖啡馆聊,连续聊了两三次。”傅盛提了很多条件,张一鸣都答应了,魄力令人震惊。 投资人童士豪曾说过这样一句话,“抖音的崛起不是平白无故的,张一鸣砸钱比谁砸得都多,挖人也挖最牛的人,他在短视频里所展现出来的气势和格局比我们任何人想象得都大。” 眼下,不得不“细水长流”式裁员的字节,缺少的可能正是张一鸣时期的那份自信。
华为和小米干上了,你搞短剧,我也搞
作者 | 李响 华为付费短剧APP即将上线 小米前脚开始做短剧,华为后脚也跟着来了。 前不久,小米一则30万招短剧编剧的招聘信息,才激起了网友的热烈讨论,这边华为就迅速推出了全新的短剧大全App,并在华为会员中心启动了公众测试。 图源:华为 根据任务介绍显示,该短剧大全App正在测试短剧付费功能,后续将会不断引入新的短剧内容。 与小米侧重于内容入手的方式不同,华为的方式是先搭建平台,然后再一步步扩充和优化内容。 但不管怎么说,从手机到汽车,再到短剧,小米与华为的竞争战场已走向多元化领域。接下来,双方之间的火药味只会越来越浓。 不过,华为入局短剧并不只是单纯为了与小米竞争。 我们都知道,短剧作为一种新兴的娱乐形式,有着时长短、内容紧凑、情节跌宕起伏等特点,相当符合现代人碎片化的观看习惯。 而随着网络视频市场的快速发展,短剧市场已经呈现出巨大的增长潜力。数据显示,2023年我国网络微短剧市场规模为373.9亿元,同比增长267.65%,2027年市场规模有望达到1000亿元。 图源:艾媒咨询 相比之下,2023年中国电影总票房为549.15亿元,仅经过两年迅猛发展的微短剧市场,其体量已接近电影市场的七成。 短剧的发展速度相当惊人,对华为而言,这无疑是拓展业务范围的好机会。 从另一个角度看,通过付费观看、广告植入等方式,短剧可以实现盈利模式的多元化。而华为作为科技巨头,布局短剧市场可以增加收入来源,其又何乐而不为呢? 更何况,华为布局短剧有很多优势,没有理由不做。 首先,华为相较于众多中小厂商,拥有强大的资金储备,这使得它在涉足短剧这一新兴业务时,能够承担更高的风险,并且其业务部门在创意和策略上也将拥有更大的灵活性和自主决策的空间。 其次,华为是一个巨大的流量入口,拥有上亿国内用户的支持。公开数据显示,华为应用市场在全球范围内的月活跃用户数量已经突破5.8亿,这一数字使其在全球市场中排名第三,仅次于Google Play和App Store。 Canalys最新报告显示,2024年第一季度,华为在中国大陆市场的出货量达1170万台,市场份额达17%。 图源:Canalys 假如短剧大全App上线后,华为通过“App预装”的方式进行引流,其增长势头必定异常迅猛。 还有,华为凭借庞大的手机用户群体和忠实的粉丝基础,用户对华为品牌的认知度高且已建立深厚的信任。 数据显示,华为手机在60后、70后、80后用户群体中均保持着显著的活跃度,占比分别为26.4%、24.1%、24.1%,均稳居首位。 其中,60后和70后的用户群体是短剧付费市场的主要力量。 根据QuestMobile去年11月发布的数据,短剧应用中的用户年龄分布呈现出明显的趋势,其中46岁以上的用户占比高达37.3%,分别高出长视频App、短视频App 12.3%、4.8%。 相较于年轻用户,60后和70后用户群体对于免费资源的依赖度较低,更倾向于为心仪的短剧内容付费,表达对创作者和作品的支持。 这样一看,华为入局短剧说不定还真有“搞头”。 再说回来了,“华为影业”名声在外,若是短剧App正式上线后,华为亲自参与内容制作,其质量想必也是拿得出手的。 总之,华为短剧这步棋算是迈出去了,接下来能做成什么样,就看接下来怎么走了。 互联网大厂涌入短剧市场 近两年来,各互联网平台布局短剧内容那叫一个认真。 拼多多方面,自从在平台内的“多多视频”推出短剧频道以来,便迅速上线了大量高清短剧,且全部内容均免费提供给用户观看。 图源:拼多多 美团方面,在今年的3月对短视频栏目进行了全新改版,特别增设了剧场频道;一个月后,美团又在剧场频道的显眼首栏推出了编辑精选板块,其中包含了丰富的短剧内容。 图源:美团 B站方面,通过其官方账号“小剧场台柱子”正式推出B站小剧场,希望通过营造短剧文化氛围,激励和鼓舞UP主们投身于短剧内容的创作之中。 图源:B站 360方面,此前其在浏览器的搜索导航界面,推出了固定短剧专区——甜虾剧场;近期,360更是积极扩张短剧业务,大量招聘与短剧相关的岗位。 图源:360 就上述几个平台来说,虽然它们在短剧领域的布局策略各有不同,但共同点都在于积极投入内容创作与运营,为用户呈现丰富多样的短剧内容。 这种多元化的布局模式不仅展示了各大平台对于短剧市场的重视,也反映了短剧内容在当今网络娱乐领域中的重要性。 都说站在风口上,猪都能飞起来。在这个巨大的风口下,如何把利益最大化是互联网平台最需要思考的一件事情。 主编观察到,品牌定制短剧作为一种新兴形式,正成为市场上的一大亮点。 例如,韩束在抖音投放的定制短剧《以成长来装束》、《你终将会红》;丸美与快手、古麦嘉禾、六度传媒等联手制作的恋爱短剧《靠近双子星》;养元青在京东上线的《青丝上额图》;淘宝在618前夕上线的巴黎欧莱雅赞助短剧《奶爸联盟》…… 这类品牌定制短剧相较于拼多多、美团、B站、360等互联网平台上的常规短剧,拥有一个显著的优势:能够直接带动品牌产品的销量转化。 以韩束为例,该品牌在2023年2月底投资制作的短剧在抖音平台上取得了超过50亿的播放量。借助这一强大的宣传效应,自2023年3月起,韩束的月成交额呈现井喷式增长,成功突破亿元大关。 图源:抖音 很明显,这种品牌定制短剧赚钱的方式不仅更直接,而且更加高效。 值得注意的是,尽管品牌定制短剧在收益方面具备直接和高效的优势,但并非所有平台都能或都应采用这一模式。 在短剧风口之下,结合自身特点、资源优势和市场环境,选择最合适自己的路,这才是最重要的。 精品化才是唯一出路 入局者众多,行业内卷,钱越来越不好赚,这是许多短剧从业者面临的严峻现实。 据相关统计数据显示,短剧行业内超过98%的企业正陷入亏损状态,看似一本万利的买卖,却也开始暴露出巨大的风险。 尤其近期,短剧行业迎来新规,从业者们就更慌了。 新规要求,各平台要将目前未经备案上线播出的微短剧剧目相关信息,于2024年5月31日前报所属地省级广电主管部门备案,并从6月1日起,禁止未经审核且备案的微短剧上网传播。 这就意味着,那些血腥暴力、低俗擦边的短剧将无处遁形,其内容将不得不遵循更严格的规范和标准。 如此背景之下,互联网平台只有聚焦精品化这一条出路。 今后,不管是小米,还是华为,抑或是其他大厂,只有把内容做好才能长赢。 可以预见,当短剧行业褪去虚假繁荣的外衣,内容质量的竞争愈发激烈,这条赛道才会迎来真正的巅峰时刻。
蚂蚁井贤栋:下个十年将聚焦人工智能和数据要素技术
凤凰网科技讯(作者/黄若曦)5月24日,第七届数字中国建设峰会在福州开幕,今年大会的主题是“释放数据要素价值,发展新质生产力”。蚂蚁集团董事长兼CEO井贤栋在主论坛上发言表示,下一个十年,蚂蚁将以投入科技创新,聚焦人工智能和数据要素技术。 井贤栋称,科技创新始终是蚂蚁发展的原动力。“20年前,我们创立了支付宝,二维码让移动支付成为每个人的生活日常。10年前,我们创立了蚂蚁金服,大数据技术让再小的企业也能获得普惠金融服务。” 蚂蚁是国内较早布局AI大模型的厂商,自研的百灵大模型2023年已通过备案。井贤栋介绍,蚂蚁大模型坚持面向产业、全栈布局,当下重点破局三个应用,分别是生活管家“支付宝智能助理”、就医助理“安诊儿”和金融管家“支小宝”。 在生活领域,支付宝智能助理围绕用户的吃、喝、行、游、办事、买票、娱乐等数十种生活场景。在医疗领域,蚂蚁联合浙江卫健委推出了全国首个AI就医助理“安诊儿”, 运用了亚运同款数字人技术。金融管家“支小宝”,提供投资者教育、市场行情、财经资讯等服务。 目前,蚂蚁集团全链布局数据要素技术,包括分布式数据库,区块链、隐私计算和绿色计算,助力数据价值释放和共享。 井贤栋认为,数据要素要“用得好”,关键是“流得动”。数据要素的流通发展,已经从“水井”式的自采自用、“桶装水”式的点对点流通,快速发展为犹如“城市自来水网”的行业、区域间可信流通。 作为数据要素领域的技术服务商,蚂蚁正在探索下一代隐私计算技术,包括一套端到端的数据安全保障,一套软硬件结合的计算加速解决方案,一个隐私计算云服务平台。 目前,蚂蚁可信隐私计算和人工智能方面的核心技术已对外开源,包括“隐语”可信隐私计算框架、大规模智能分布式训练系统DLRover等。此外,参与制定了100多项国内外标准,其中主导了10余项国际标准。
AI需求强劲,英伟达距离苹果只差一步之遥
作者 | 周永亮 编辑 | 郑玄 达一季报远远超出了市场预期,证明 AI 浪潮依然强劲。 财报显示,英伟达 2025 财年第一财季(2024 年一季度)的总营收为 260 亿美元,同比增长 262%;数据中心收入为 225.63 亿美元,同比增长 427%。这些数据连续多个季度创新高,远远超出华尔街的预期。 英伟达 CEO 黄仁勋在财报声明中表示,「下一场工业革命已经开始」。他表示,各国和大量公司正与英伟达合作,将传统数据中心转型为「AI 工厂」,生产一种名为「人工智能」的新产品。黄仁勋认为,AI 将为各个行业带来显著的生产力和收入增长,同时在成本效益和能源效益上也有显著提升。 这些利好消息暂时平息了人们对过去一年数据中心设备支出狂潮可能导致放缓的担忧。财报发布后,英伟达股价上涨 9.32%,突破 1000 美元,市值达到 2.55 万亿美元,与苹果(2.87 万亿美元)只差 3200 亿美元。今年以来,英伟达股价已上涨了 109.6%。 01 数据中心依然马力十足 英伟达的业务分为四个主要板块:数据中心、游戏、专业可视化和汽车业务。 其中,数据中心业务是最受关注的部分,也是英伟达的核心增长驱动力。在 2024 财年第四财季,英伟达的数据中心业务收入达到 184 亿美元,是前一年同期的 5 倍多,并刷新了前一个财季的历史新高。 英伟达 2025 财年一季度关键财务指标 | 图片来源:财报截图 从最新数据来看,数据中心业务依然表现强劲。2025 财年第一财季,英伟达的总营收为 260 亿美元,其中数据中心业务贡献了 226 亿美元,同比增长 427%,环比增长 23%。数据中心收入创下历史新高,占比进一步增长到 86.9%。 英伟达首席财务官 Colette Kress 表示,数据中心业务的增长主要得益于 Hopper 架构 GPU(例如 H100)的出货量增加。与去年相比,计算收入增长了 5 倍多,网络收入增长了 3 倍多。 此次财报中,英伟达首次披露了数据中心业务的具体收入细项。其中,计算收入达到 193.92 亿美元,同比增长 478%;网络收入为 31.71 亿美元,同比增长 242%。计算收入主要来自 Hopper 平台,而网络收入的增长得益于 InfiniBand 端到端解决方案的强劲表现。 值得一提的是,目前大型云服务提供商,如亚马逊、Meta、微软和谷歌,大约占英伟达数据中心收入的 40%。此外,许多领先的大型语言模型(LLM)公司,如 OpenAI、The Depth、Anthropic、Character AI、Cohere、Databricks、DeepMind、Meta、Mistral 和 xAI,都在利用云服务构建 NVIDIA AI。 当然,英伟达希望业务多元化,不仅依赖于这些大客户。黄仁勋在财报中指出,人工智能正在扩展至各国政府、消费互联网公司、汽车制造商和医疗保健客户,这些新领域可能会在云服务商之外创造多个价值数十亿美元的垂直市场。到第一季度末,英伟达已经与 100 多家客户合作,建立了规模从数百到数万个 GPU 不等的人工智能工厂,有些甚至达到了 10 万个 GPU。 其中,汽车和消费互联网领域表现尤为突出。英伟达首席财务官 Colette Kress 透露,特斯拉为了进行 AI 训练,购买了 35,000 块英伟达 H100 GPU,这些 GPU 用于特斯拉最新的自动驾驶系统 FSD V12。Kress 表示,今年汽车行业将成为英伟达数据中心业务中最大的垂直市场,带来数十亿美元的收入机会。 特斯拉自动驾驶系统 | 图片来源:视觉中国 另一大亮点是 Meta 发布了最新的大型语言模型 Llama 3。该模型在 24,000 块英伟达 H100 GPU 上训练完成,为 Meta 旗下的 Facebook、Instagram、WhatsApp 和 Messenger 的新人工智能系统 Meta AI 提供支持。Llama 3 不仅提升了这些平台的 AI 功能,还在各行业掀起了一股 AI 开发热潮。 令人惊讶的是,过去一年中,大模型的推理场景已经占据了英伟达数据中心 40% 的营收。这表明,大模型在许多实际应用中确实带来了显著的业务和业绩增长。 此前,多位云计算行业人士曾表示,去年采购英伟达 GPU 主要用于大模型的训练。随着大模型在实际场景中的广泛应用,算力更多地被用于推理。 除了数据中心业务,英伟达的游戏业务在第一季度实现了 26 亿美元的营收,同比增长 18%。相比之下,汽车芯片和图形工作站芯片的影响相对有限,第一季度分别实现 4.27 亿美元和 3.29 亿美元的销售额。 得益于数据中心业务的快速增长,英伟达在 2025 财年第一季度的财务表现非常亮眼,显示出强劲的增长势头和盈利能力。2025 财年一季度,英伟达的营收达到 260 亿美元,较上一季度增长 18%,同比激增 262%,显著超过分析师预期的 246.5 亿美元。 英伟达 GAAP 净利润为 148.81 亿美元,同比暴涨 628%,环比增长 21%;非 GAAP 净利润达到 152.38 亿美元,同比增长 462%,环比增长 19%,每股收益为 6.12 美元。毛利率从上一季度的 76.7% 提升至 78.9%。这些数据表明,英伟达在数据中心领域的快速增长和市场竞争力显著增强,其财务状况非常健康。 02 中国业务大幅下滑 英伟达不仅在当前季度实现了超预期的营收,还为未来的稳定增长做好了布局。根据他们的二季度预期指引,英伟达预计营收将达到 280 亿美元,预计 GAAP 毛利率为 74.8%,全年毛利率将稳定在约 70% 左右。 这一预期超出了市场的普遍预期,也暂时消除了此前市场对人工智能需求不足的担忧。微软、谷歌、亚马逊和 Meta 等四大科技公司在一季度的财报显示,今年他们在云计算领域的资本投入高达 1770 亿美元,远高于去年的 1190 亿美元。预计到 2025 年,这一数字还将增至 1950 亿美元。这些大额投资预计将继续推动英伟达在数据中心收入和利润的持续增长。 2024 年 GTC 峰会上,黄仁勋展示了新款 Blackwell GPU 芯片 | 图片来源:视觉中国 除了业绩指引,英伟达的 Blackwell 系列芯片的最新进展也备受关注。随着英伟达从 Grace Hopper 芯片到 Blackwell 芯片的过渡,引发了市场对 Hopper 和 H100 产品的需求变化的担忧。据报道,亚马逊网络服务(AWS)暂停了对 NVIDIA Grace Hopper 解决方案的订单,转而等待更强大的 Grace Blackwell 超级芯片的推出。AWS 对此表示,他们并未完全停止对 NVIDIA 最先进芯片的订单,而是在特定项目中进行调整,例如他们与 NVIDIA 共同开发的 Project Ceiba 超级计算机。 对此,黄仁勋表示,Blackwell 芯片已经进入生产阶段,预计将在第二季度开始出货,并在第三季度加速。客户将在第四季度完成数据中心的部署,这将为英伟达带来显著的收入增长。这个表现超出外界的预期。 他还强调,尽管市场开始向 H200 和 Blackwell 过渡,但对 Hopper 和 H100 产品的需求依然旺盛。客户希望尽快部署新的基础设施,以提高效率并增加收入,这导致了对旗舰 AI 训练模型的持续需求。 在财报电话会议的最后,黄仁勋提到,为了应对 GPU 和定制 ASIC 的激烈竞争,英伟达制定了未来十年的技术发展路线图。 他们致力于推进 NVlink、InfiniBand 和以太网计算架构。在 Blackwell 之后,英伟达计划每年推出一款新产品。他们还制定了以太网的发展路线图,将很快推出新的网络技术 Spectrum X,并由戴尔推向市场。此外,英伟达还将推出 InfiniBand 计算架构。 所有这三种计算架构都运行 CUDA 及其整个软件堆栈,为用户提供更快的运行速度和更多的云与数据中心选择。英伟达的创新不仅提高了性能,还降低了总拥有成本(TCO)。凭借其架构,英伟达将引领新一轮的技术革命。 与此同时,英伟达在中国市场的供应情况备受关注。此前,中国市场一直占据英伟达数据中心收入的 20% 至 25%。然而,自去年 10 月美国发布最新芯片出口限制后,英伟达在中国的业务受到了极大限制。2024 财年,中国业务在英伟达营收中的比例只有个位数百分比(5%)。 今年早些时候,英伟达开始向中国客户提供符合美国出口管制的特供版 AI 芯片 H20。不过,英伟达高管在财报会上承认,今年第一财季公司在中国的销售额「大幅」下降。黄仁勋预计,中国市场未来的竞争将更加激烈,主要由于技术限制加剧了当地市场的竞争。他表示,英伟达将继续尽最大努力为中国客户和市场服务,并强调「我们会尽力的」。 创纪录的财务表现下,英伟达也有隐忧。在芯片制造端,英伟达还面临谷歌、微软、AMD、英特尔、博通等其他竞争对手抢订单。据了解,谷歌多年来一直与博通合作生产自己的 AI 芯片;亚马逊则于 11 月宣布推出新的 AI 芯片,同月微软表示也将开始生产定制 AI 芯片。 另一方面,随着越来越多的通用大模型被训练出来,企业开始将关注点转向 AI 推理。对于头部互联网和大模型公司来说,今年的挑战是大模型的落地和变现。而对于其他企业,如何挑选合适的大模型融入生产或业务流程以创造价值,是更重要的命题。英伟达需要确保其「护城河」能够持续提供竞争优势,以应对这些挑战。
再战618:小红书的新人大考,视频号等待成年
作者 | 赵卫卫 618,对于电商第二梯队的小红书和视频号来说不再是新鲜事。今年是小红书的第二次,视频号的第三次。 当下的电商格局中,小红书和视频号最大的共性就是入局晚、体量尚小、亟待打造标杆,对于二者来说,「立」是关键;但对于阿里、京东等老牌电商来说,「破」才是关键,所以取消预售机制,主打「现货开卖」成了后者的最大变量。而且今年 618 的战线格外长,老牌电商纷纷把第一拨大促提前到 5 月 20 日。 小红书和视频号最大的区别,莫过于入局姿态的早晚。「抢跑」的小红书要在电商市场中「抢肉」吃,5 月 21 日就率先发布了战报——首日直播 GMV 为去年同期的 6 倍;视频号依然「晚点」,选择在 5 月 31 日才开始「618 好物节」。 低价,永远是 618 大促的核心。平台间的分野是,阿里、京东和抖音要的是深耕用户防止分流,而小红书和视频号这样的内容电商,要的是争夺用户培育习惯、促进转化。两边用户的重合度越来越高,所以他们选择哪一方下单,可能是 618 大促节点的主要看点。 比如,对于国内很多新锐的家居设计品牌来说,一手天猫一手小红书,已经成为他们线上渠道的标配,穿梭于两个平台的直播间也是 618 大促期间的常态。而从视频号近期的推广案例也不难看出,昔日在抖音电商中取得辉煌战绩的家纺商家,已经开始在视频号撬动了更大的增量,手心手背都是肉。 为有源头活水来,当下精准分散的消费市场中,视频号是抖音商家的增量,小红书则是天猫商家的活水。 小红书,新人的首次大考 「直播电商是一个苦活。」多位小红书商家告诉「蓝洞商业」,今年整个电商大环境的压力很大,预计今年 618 会是一个精准分散消费的市场,也就是用户的消费决策会在多个平台和商家之间选择比较,综合需求和价格等多个维度考量,而不是对某一个平台和品牌保持专一。 或许正是这样的压力,相比去年在电商市场的高歌猛进,今年小红书在电商市场「抢肉」的动作更进了一步。 决心和野心最先表现在人身上。去年年底,曾传出小红书将在今年下半年启动香港 IPO,小红书方面随即否认了这一传闻;但此后小红书人事变动频繁,先是引入原滴滴供需策略负责人吴颖炳、顺风车业务负责人张瑞,加强电商和商业化力量,后来原快手电商产品负责人叶恒担任电商C端产品 1 号位。 今年是小红书第二次参与 618,但是是电商新团队的首次大考。懂电商的人到位了,真金白银的资源投入了,买手电商能不能行就看今年的 618了。 国内家居设计品牌吱音的创始人Lily,最近每天晚上都穿梭于天猫和小红书的直播间,直播往往持续到深夜 12 点,吱音的小红书直播间经常出现在品牌榜第一名的位置。 吱音品牌创立 11 年,最早从淘宝开始做线上渠道。为了突破圈层触达更精准的人群,吱音从 2021 年持续在小红书发布笔记,2023 年小红书开始押注「买手电商,」吱音才正式通过直播带货在小红书上发力,很快收获了单场直播破百万的成绩。 吱音在小红书的618活动主页 从数百元的椅子到上万元的真皮沙发,吱音的家居产品价格天然符合小红书人群消费的特性——小众化、高客单价、中高端品牌为主。同时,吱音也在抖音和视频号做了布局,但只是内容的简单分发,因为「精力有限,只能先聚焦一件一件事情慢慢来。」 而今年的 618,天猫和小红书的区别是什么?最直观的答案往往就是价格。 以吱音的爆款产品莫比乌斯椅子为例,在全渠道的价格是统一的,但用户在各自手机中看到的价格却不同,因为平台会做各自的优惠机制,比如天猫的 88vip 会员、小红书补贴的 40 元新人优惠券等。所以,对非天猫 88vip 会员来说,小红书上买一款莫比乌斯椅子要便宜 40 元左右,扶持力度可见一斑。 「不论是天猫还是小红书,吱音都是当作和用户沟通设计理念的平台。」Lily 认为,「作为一个设计品牌,尤其是创新驱动的设计品牌,我们更应该专注做好自己擅长的产品和事情。」 过去一年,家居赛道成为小红书上快速增长的热门领域。 最典型的案例莫过于素人博主@一颗 KK,去年小红书首次参与 618,作为家居买手的@一颗 KK 单场直播取得 2000 万的 GMV;随后的双十一期间,她联合了众多国货家居设计品牌参与,GMV 突破了 1 亿,很多品牌也有了过百万甚至超 500 万的销量,吱音就是其中之一。 Lily 就是在@一颗 KK的鼓励下,才从一个内心沉静的 i 人转变成了 e 气风发的主播,单场直播破百万,吱音也入选了小红书电商年度 rise100。她总结说,「要耐得住初期对着空气说话的寂寞,坚强度过颗粒无收的种草期(尤其是家具这类低频消费品),最终才能迎来销售转化。」 一手小红书,一手天猫店,如今已经成为很多 618 商家的标配。 小红书的高客单价特性无疑吸引了向往淘金的商家们,小红书的用户愿意为高品质、独特审美的产品买单,一位电商从业者对「蓝洞商业」透露,其公司产品在小红书直播客单价平均为 1000+,而同期在抖音上的客单价往往在 400+ 左右。 「现在小红书的流量分配格局很明显,直播间已经成为电商成交的主战场,品牌方需要确定性的收益,而做了买手直播电商和没有做的,营收差距往往有七八倍。」一位腰部小红书博主对「蓝洞商业」透露。 去年双十一大促,小红书也是最先抢跑,拿出买手章小蕙直播销售额破亿的成绩单;今年 618,小红书求快的姿态依然明显,最先晒出战报:618首日直播订单数为去年同期的 8.2 倍,首日直播成交 GMV 为去年同期的 6 倍,直播间购买用户数为去年同期的 7.4 倍。 但光鲜的数字掩饰不了背后的焦虑,尤其是在 618 这样流量昂贵的大促期间,谁会是小红书上下一个像@一颗 KK 一样成长起来的腰部买手? 小红书的内容产品特性,注定其买手电商要走一条区别于传统电商平台和短视频平台模式的路,而且这注定是一条无可复制的商业化之路。 视频号,佛系依旧? 打造标杆样本,是每一个直播电商初期的重中之重。从微信公开课 5 月份推广的一个视频号直播电商案例,就可以窥见其与抖音在带货能力上的差距。 《视频号「自播+达播」真香!水星家纺半年爆卖 8000 万》,微信公开课这篇内容明确传达出的信息只有两个,一个是方法——「自播+达播」;另一个是结果——去年下半年,水星家纺销售了 8000 万,平均客单价达到 200 元以上,成为了视频号中家纺类目的 TOP 商家。 水星家纺这家公司,被视频号看作平台上第一批「吃螃蟹」的商家,这个案例对当下的视频号来说是一种成绩,但放在行业维度上,可能还不如 2022 年抖音的带货能力,水星家纺早在抖音上「吃螃蟹」了。 2022 年 618 前夕,水星家纺在抖音超级品牌日上,通过与明星达人直播间合作,活动期间创下了 5900 万的销售总额,登顶抖音电商消费电子家居行业单品牌销售额第一的位置,店铺新客率达 93.3%,品牌相关词搜索 UV 环比增长 485%。 从方法上看,水星家纺在抖音和视频号上都是自播+达播,但结果差距明显。也就是说,2023 年下半年销售额 8000 万,与 2022 年一个月活动销售额 5900万,可以看作是两家在带货能力上最直观的对比。 水星家纺的视频号直播界面 更本质上反映的是,水星家纺这家公司的前瞻性,先拥抱抖音,再入局视频号。其 2020 年就开始入驻抖音,在抖音上培育两年多之后才有了活动期间 5900 万的 GMV。如今,抖音和视频号都是其电商获客的渠道之一,整个 2023 年,水星家纺营业收入 42.1 亿,其中电商渠道收入同比增长了 11.7%。 今年的 618,是视频号第三次入局购物节, 但相比淘宝、京东和小红书等平台,都晚了一些。视频号团队不可能不知道,2023 年 618 各大电商平台预售期开始的日子,都提前到了 5 月 23 日左右。 在各家已经开战的第二天,也就是 5 月 21 日上午,腾讯才发布了今年视频号 618 大促计划,活动持续 19 天 ,从 5 月 31 日到 6 月 18 日,官方奖励包括技术服务费率减至 1%、发电商成长卡激励、GMV 目标任务激励等等,参与的对象包括视频号小店和达人号。 而此时,小红书已经拿出了开门红战报;天猫已经在前一天晚上开始了第一拨现货售卖期;三天后,抖音商城的 618 好物节也将全面启动,电商平台们一心求变,纷纷把大促的战线拉长,而视频号却保持着过往的慢姿态。 在各大电商 618 造势的喧嚣声中,视频号不急吗?答案显然是否定的。 在视频号 618 大促计划发布一周之前,腾讯广告官方就官宣了招商计划。今年 6月 18 日,明星钟丽缇将做客视频号,打造 618 直播盛宴,「直播总时长不低于 10 小时」,试图通过明星达人带动品牌的销售购买和种草,腾讯广告此举是为了招揽服饰、运动、美妆、食品等多行业的商家占领坑位。 更重要的是,视频号之于腾讯的重要性已经不言而喻,「养家」的任务已经重担在肩。 去年年末,「晚点Latepost」曾披露,微信视频号电商的 GMV(总成交额)在 1000 亿元左右,腾讯还将进一步扩大视频号电商业务的队伍:除了负责前端产品的视频号直播团队外,微信支付团队也将加入视频号电商的建设,参与各行业类目、达人、客户的拓展与运营,以及交易产品等基础功能的搭建。 视频号的商业化真实数据正在揭开面纱,2022 年,腾讯业绩连续三个季度下滑,腾讯首次在财报在提到视频号的收入,这成为财报中为数不多的亮点之一。当时视频号直播服务收入成为腾讯增值业务增长的核心因素之一,贡献了 291 亿的收入。 去年第二季度,腾讯财报中首次公布了视频号的广告收入——超过 30 亿。随着微信用户不断养成在视频号购物的习惯,电商无疑是拉动视频号广告收入的重要原因之一。但此后腾讯没有单独披露过视频号的商业化数据,视频号与小程序、公众号等一道,为今年一季度的腾讯贡献了 265 亿的广告收入。 今年 618,已经是视频号的第三次出征。 作为腾讯内部增长最快的业务之一,视频号能够取得什么样的成绩,显然是衡量其电商能力的关键大考。此前有腾讯内部人士透露,视频号直播今年的目标增速是 100%,在电商追逐低价的一片红海市场中,视频号电商的私域属性,是破解难题的关键之一。 但只有腾讯选择公布视频号电商的 GMV 时,才是视频号真正的成年之时。
腾讯、阿里看中的月之暗面,还在戴着商业化的面纱
“月球的暗面是神秘和未知,但人类总有向前探索的勇气和信心”。这或许一定程度上揭示了大模型公司月之暗面成立的初衷。 作为当前大模型这一火热市场中的明星独角兽,月之暗面站在风口上,无论是产品迭代还是资本角力,其一举一动备受关注。 松果财经获悉,月之暗面正在进行新一轮融资,估值达到30亿美元,新的投资者包括腾讯、高榕创投等。 而据天眼查,在今年2月,该公司就已获得超10亿美元融资,估值达到约25亿美元。据悉,此次创下了国内大模型领域单笔融资纪录,参与其中的就有阿里巴巴、小红书等互联网企业以及老股东红杉中国、砺思资本等。 有知情人士透露:“当下月之暗面的股东名单,至少囊括二十余家投资方的豪华天团。”显而易见,对于投资者而言,这是一个不容错过的“好标的”。 诚然,当前大模型领域风起云涌,前景广阔,正如中商产业研究院发布的《人工智能系列专题之中国人工智能大模型产业全景与机会洞察专题研究报告》显示,2020-2022年,我国大模型产业市场规模从15亿元增长至70亿元,年均复合增长率达116.02%,预计2024年产业规模将达216亿元。机遇在前,投资者必须积极把握。 但月之暗面何以不容错过?投资不是只看到风口,而是有一套内在的筛选标准。有投资者曾指出一个“好标的”,除了具有金融属性,最重要的是“随着时间的增长,会越来越好,或者越来越有价值”。 目前来看,月之暗面的业务发展走势显然是持续上行的。 具体在产品层面,最新数据显示,2024年4月,月之暗面旗下的Kimi智能助手网页版访问量达到2004万,较上月上涨60.2%,访问量已经超过文心一言,排在国内同类产品榜的第一位。另外,根据QuestMobile的数据,2024年3月,Kimi智能助手APP的月活跃用户量是589.7万,Kimi智能助手微信小程序月活跃用户已经突破91.1万。 而当前大模型产品层面的竞争显然是十分激烈的,数据显示,截至2024年3月,通过国家网信办备案的大模型名单有117个。这种情况下,Kimi能够脱颖而出,无疑需要一定实力。 据悉,Kimi主打长文本输出,发布时可以支持20万汉字的输入,是Anthropic的Claude2-100k(约8万字)的2.5倍,OpenAI的GPT-4-32K(约2.5万字)的8倍。而在今年3月,月之暗面宣布,Kimi智能助手在长上下文窗口技术上再次取得突破,无损上下文长度提升到200万字。对于用户而言,Kimi在阅读理解、文献分析、长文写作等任务上具有独特优势。 此外,月之暗面在产品布局上ToC的定位也对其发展产生较大赋能,创始人杨植麟曾表示,“ToC是一个自然而言的选择,看到的是一个成为AI时代Super App的机会”。 长远来看,大模型常态化应用以及更大范围的商业落地,必然需在C端开展,通过不断“收割”用户,有望打开更大的商业空间。而且,对于大模型产品的迭代升级而言,C端是天然的“练兵场”。 但一个不可忽视的问题是,现阶段C端大模型商业化前景仍不显著,尤其是在阿里、百度、科大讯飞等科技大厂都在推行大模型产品降价的当下,C端大模型要开启收费模式、进一步做好市场教育,其实并不容易。 但考虑到大模型的真正落地,商业化必然纳入相关公司的考虑项。据悉,日前Kimi推出打赏功能,提供了六种不同的选择:5.2元/4天、9.99元/8天、28.8元/23天、49.9元/40天、99元/93天、399元/365天。 对于Kimi是否将就此走向付费,月之暗面相关负责人做出解释:“Kimi还是免费的,不着急的用户在高峰期算力不足时稍等一下也可以继续使用Kimi。” 但这也可以看成月之暗面对商业化的一大试水,而其如何在商业获量和技术投入之间取得平衡,还需交给时间验证。
OpenAI碰瓷斯嘉丽·约翰逊!没必要,真没必要
前两周在OpenAI发布会上大放异彩的ChatGPT-4o Sky语音,最近悄然下架。 OpenAI发布会上展示的核心功能“多模态语音对谈”开放的进程再次延缓——在OpneAI官网上,GPT-4o向全部用户免费开放的时间从原来的几周,悄悄咪咪地改成了几个月。 OpenAI深更半夜发表推文,Sky声音已经撤掉 这当然可能和扩容时遇到的技术问题有关,但还有一个问题是,最近知名演员斯嘉丽·约翰逊的法律团队向OpenAI发了两封信,要求OpenAI公布ChatGPT-4o语音“Sky”(简直是斯嘉丽的谐音)的制作过程,因为这个声音听起来跟斯嘉丽·约翰逊简直是一个模子里刻出来的。 如果还是不好理解的话,你可以想象一下某导航软件推出新语音包,听起来激似林志玲,导航软件老板是林志玲粉丝,语音包名字还叫玲玲。 OpenAI官网还更新了Blog,极力辩解“Sky”跟斯嘉丽·约翰逊没有关系|OpenAI 斯嘉丽·约翰逊向美国媒体表示,听到Sky的声音后,她“感到震惊、愤怒”,不敢相信奥尔特曼竟然选了一个和自己声音一模一样的配音,“连我最亲密的朋友和新闻媒体都区分不出来”,约翰逊说。 尽管OpenAI坚称GPT-4o的声音绝不是斯嘉丽·约翰逊,OpenAI CTO米拉·穆拉蒂(Mira Murati)在接受采访时甚至说,“完全没有学斯嘉丽·约翰逊的意思,为了这个事我甚至得专门去听听斯嘉丽·约翰逊的声音是啥样的”。 不管穆拉蒂知不知道斯嘉丽·约翰逊,但OpenAI CEO奥尔特曼绝对知道,因为—— 奥尔特曼是斯嘉丽粉头啊! 在GPT-4o发布之前,奥尔特曼就“碰瓷”过斯嘉丽·约翰逊。5月14日,奥尔特曼在X上发了一条推文,只有一个词,“her”。 这个词明确指向了2013年的科幻电影《她》。在这部电影里,男主角爱上了由斯嘉丽·约翰逊配音的人工智能Samantha,奥尔特曼也曾在采访中表示,《她》是他最喜欢的电影。 而据斯嘉丽写给媒体的信,奥尔特曼直到GPT-4o发布前两天还在极力邀请她配音。 “去年9月,我收到了奥尔特曼给GPT-4o配音的邀请。他告诉我,我的配音可以架起科技和创意之间的桥梁,让消费者在从人类到人工智能的巨变过程中感到舒适。他说他觉得我的声音会让人们感到安慰。”约翰逊写到。 但她出于个人原因,十分感动然后拒绝了奥尔特曼。 奥尔特曼并没有就此放弃,在ChatGPT发布会的前两天,他再次联系了约翰逊的经纪人,请求她重新考虑。但很显然,这是一招先斩后奏,在打电话之前,GPT-4o就已经做好了。 发布会之后,所有人都发现Sky的声音像约翰逊了,美国国民节目《周六夜现场》还公开吐槽GPT碰瓷,说不知道追求那个声音意义何在,如果声音离开了约翰逊本人的身体那谁还想听呢。 奥尔特曼:我想听 约翰逊在信里继续写到: “由于OpenAI的行为,我被迫聘请了法律顾问……要求他们详细说明创建Sky的制作过程。” 在这之后,OpenAI就暂时关闭了Sky的语音。 Sky的声音怎么来的? 在约翰逊的要求下,OpenAI发Blog描述了GPT-4o语音的制作细节(虽然暂时没有其他证据证明OpenAI说的是真的)。 OpenAI称,他们从400个声音中挑选了五个月,才选出了GPT-4o的五个声音(分别是Breeze、Cove、Ember、Juniper 和 Sky)。他们和专业配音演员、经纪公司、选角导演和行业顾问合作完成了这个工作。 在选择合适的声音时,他们制定了一套标准,其中包括几个重要的考量角度: 1、背景丰富或会说多种语言的配音演员,加分 2、声音要给人一种“永恒(timeless)”的感觉 3、声音要平易近人,能激发信任 4、声音温暖、迷人、鼓舞人心、富有魅力,音调丰富 5、声音自然,易于聆听 虽然其中有些标准挺抽象的(比如说一个声音要怎么又有永恒感又平易近人?),但不得不说,DAN和Sky能有这么高的人气和感染力,和它们的声线是分不开的。 OpenAI表示,GPT-4的配音选拔是从2023年5月10日开始的,不到一周,他们收到了400多份配音申请。在试镜时,配音演员们需要朗读一份ChatGPT回复文案,文案内容包括了从正念冥想、旅行计划、到和用户聊天在内的一系列场景。 之后,OpenAI和每个配音演员讲解了GPT-4的功能、局限性和所涉及的风险,确保每个配音演员在加入之前都充分了解了语音模式的范围和意图。 OpenAI补充道:每位演员的报酬都高于市场最高水平,只要他们的声音在我们的产品中使用,这种报酬就会持续下去。但为了保护配音演员的隐私,OpenAI不能透露Sky配音演员的姓名。 这场争端对约翰逊来说是轻伤,对OpenAI来说可能是重伤。 在Deepfake之后,公众对于用AI技术换脸、换声音的潜在危险本来已经非常敏感了,OpenAI作为能左右行业风向的大佬,不仅没有在安全方面做出更大的努力,反而沾上了未经允许用公众人物声音“炼”AI的嫌疑,只能让人们对AI的信任更浅。 此外,OpenAI一直有跳票和“实物缩水”的前科,去年GPT-4的读图功能拖延了6个月才用上,今年发布会上所做的承诺也迟迟不兑现,不免让人觉得OpenAI是为了狙击接下来要发布新产品的谷歌而放出没有完全成熟的技术。经过了这次声音争端,GPT-4o的兑现时间再一次被延后了,属实有点搞笑。 甚至想问问奥尔特曼,GPT-4o的声音像不像《她》,真的那么重要吗?真的有用户在乎吗?
Altman被曝七宗罪,OpenAI竟欲加密GPU合作军方?员工大批离职团队濒临崩溃
【新智元导读】刚刚,有网友仔细总结了OpenAI的七宗罪,对Altman发出愤怒的诘问:为何计划跟踪GPU?为何合作军方?员工滚雪球式离职的消息不断曝出,整个对齐团队已经濒临崩溃,「说谎」「心口不一」的形象愈发鲜明,Altman正在失去民心。 OpenAI的离职潮,已经像滚雪球一样,根本停不下来了。 Ilya的离去,仿佛是压弯骆驼的最后一根稻草。 由Ilya领衔的超级对齐团队,是防止AGI失控、保护人类的最后一道屏障。 然而Altman统治下的OpenAI,把光鲜的产品置于安全之前,让超级对齐团队在计算资源方面捉襟见肘,完成关键研究变得越来越困难。 不断离职的超级对齐团队员工纷纷表示:我们已经彻底失去信心,无法再对OpenAI在AGI时代的行为负责了。 昨天曝出的股权协议原件,更是让Altman言行不一的面目暴露出来——文件上明明有Altman的签名,他却极力否认自己对此事知情。 在OpenAI这个可能影响全人类命运的机构中,究竟发生了什么?? 现在,已经有愤怒的网友发帖,历数了OpenAI的七大罪状:无视AGI风险、逼迫员工放弃股权却装失忆、反对开源、跟踪GPU、泄露隐私、和军方合作等等……桩桩件件都附有参考链接。 01 又一对齐员工离职 OpenAI的超级对齐团队,现在就像多米诺骨牌一样。 上周,首席科学家兼联合创始人Ilya Sutskever宣布辞职,紧接着高管Jan Leike也辞职了。 Leike指责OpenAI把「光鲜的产品」放在安全之前,并表示超级对齐团队「在计算资源方面捉襟见肘」,完成这项关键研究「变得越来越困难」。 这周和上周的离职事件,紧随另外两名安全研究员Daniel Kokotajlo和William Saunders,也出于类似的原因离职。 如今, 又有一名团队成员高调宣布了自己的离开。 在得知Ilya Sutskever和Jan Leike的消息前几个小时,我就已经选择了离职。 我们需要做更多的工作来改进决策过程、问责制、透明度、文档记录、政策执行、使用自身技术时的谨慎态度,以及减少对不平等、权利和环境影响的措施。 这些担忧对于现在的社会来说非常重要。它们影响着未来发展的方向,以及由谁来引领。我想强调的是,不管是我们内部的还是来自其他人的担忧不应该被误解为狭隘的、推测性的或不相关的。它们不是。 科技公司往往会通过在提出质疑或挑战其权力的人之间制造分歧,来削弱那些试图对其进行问责的人。 我很感激自己有能力和支持去做这件事,这在很大程度上要归功于Daniel Kokotajlo给的勇气。我也明白,在整个行业中,还有很多人无法做到这一点。 OpenAI仍在开展许多重要工作,包括扩大访问权限、准备框架开发、增强信心的措施,以及解决我之前提到的担忧。我仍然对这些工作及其成功充满期待和投入。 02 历数OpenAI「七宗罪」 Ⅰ 无视AGI风险,超级对齐分崩离析 至此,我们已经无法再用玩梗蒙蔽自己了。. Ilya等安全团队的人员离去,大概率跟AGI或者GPT-5都无关,而是被逼得走投无路。 自从OpenAI发生第一轮宫斗、Sam Altman被罢免以来,整个OpenAI的情绪就不对劲了。 显然,Altman在合作伙伴关系和产品重点方面的发展方向,已经超出了大多数人能接受的程度。 他的危险面目,随着时间线的推移,也越来越清晰地暴露出来。 Ⅱ 跟踪GPU,随时撤销GPU许可证 而且,OpenAI最近公布的AI治理计划,也掀起了轩然大波。 OpenAI提出,将加密保护扩展到硬件层,实现以下属性—— 1. GPU可以通过加密方式验证其真实性和完整性。 2. 具有加密原语的GPU可以使模型权重保持加密状态,直到它们被暂存并加载到GPU 上。这在主机或存储基础设施受到损害时,增加了重要的深度防御层。 3. 具有唯一加密身份的GPU,可以为特定GPU或GPU组加密模型权重和推理数据。完全实现后,这可以使模型权重只能由属于授权方的GPU解密,并且可以允许推理数据从客户端加密到服务其请求的特定GPU。 这些内容,无疑让人恐慌。 比如第一句:GPU可以通过加密方式验证其真实性和完整性。 这也就意味着,如果我们从英伟达买一块GPU,它会像DRM一样进行签名,从而被批准运行和加速AI模型。 假如一个小公司来购买硬件,现在就需要经过额外的层层审批,才能把自己的硬件推向市场,这无疑很可怕。 大概没有多少人希望自己的GPU是签名的,大家都会希望使用匿名的GPU。 第二条也很诡异,必须每个硬件上都有签名,才能允许我们运行AI,这简直是一件荒谬的事。因为如果上面有签名,他们也就可以撤销签名,谁有权决定呢? 第三条也是如此,模型权重只能由属于授权方的GPU解密,这个权力属于谁? 而其中这句话,也显示出OpenAI的重点在于保护模型权重,而非开源,或开放权重,这个观点已经与开源AI的大力支持者大相径庭了。 一名网友锐评道:这些关于安全和保障的很多想法,让我摸不着头脑,很多内容显示出,OpenAI正在全力以赴地关注闭源架构,这让我更感激Meta这样的开源公司了。 Ⅲ 签字逼迫员工放弃股权,事后装失忆 前几天此消息曝出:如果OpenAI员工在离职时拒绝签署要求严苛的协议,无法保证永不批评OpenAI,那他们可能就会失去已有的OpenAI股权。 瞬间让科技圈炸锅。面对群情激愤的声讨,Altman紧急发布道歉声明,表示自己从不知道OpenAI有威胁股权的条款,以后也不会这样做。 然而他随后就被打脸了,外媒扒出了更多内部协议。 这些文件显示,OpenAI几乎拥有所有权利,可以任意将股权从前员工那里收回,或者阻止他们出售股权。 签署这些文件的,正是Sam Altman,签署日期为2023年4月10日。 随后,更多霸王条款曝出。比如OpenAI发给离职员工一份冗长且复杂的终止文件,需要在七天之内签署完毕。 这意味着,前员工仅有一周的时间,去决定是否接受OpenAI的「封口费」,否则就会失去数百万美元股权。 而且,当前员工要求额外2-3周的时间寻求法律援助并审查文件时,却遭到了OpenAI的强烈反对。 「The General Release and Separation Agreement」(概括性索偿弃权书和离职协议)需要你在7天内签署。我们希望确保你明白,如果你不签署,这可能会影响你的股权。这对每个人都是一样的,我们只是按规章办事」。 对此,加州的就业律师Chambord Benton-Hayes表示,「一家企业威胁收回已归属的股权是极其恶劣和不寻常的」。 然而,OpenAI大多数前员工,却对这样的霸王条款屈服了。 而整件事最荒谬的,还是以Altman为首的OpenAI高管事后堂而皇之的装傻。 Ⅳ 和News Corp合作,ChatGPT中也会有广告了 昨天,在一片乱中,OpenAI依然官宣了和新闻集团News Corp的合作,并将之成为「里程碑意义的多年全球合作伙伴关系」。 根据协议内容,News Corp的新闻内容都会引入OpenAI。 OpenAI有权显示相关媒体报头的内容,用来回答用户问题,目的是「让人们根据可靠的消息和新闻来源,做出明智的选择」。 News Corp旗下的出版物,包括《华尔街日报》、《巴伦周刊》、《MarketWatch》、《投资者商业日报》、《FN》、《纽约邮报》、《泰晤士报》、《星期日泰晤士报》、《太阳报》等等。 对此,网友评价说:看这个名单就知道,OpenAI选择了非常糟糕的合作方。 这些媒体一向把右翼宣传作为商业模式,引起政治讨论,使用一切必要的手段来推动叙事,甚至曾通过福克斯新闻否认2022年的总统选举。 甚至News Corp还曾卷入这样一起丑闻,涉嫌侵入600多人的手机,来获取情报。 从此,我们使用OpenAI的产品时,无可避免地会受到某些倾向的影响。 而且,以后AI聊天机器人的世界,也将到处充斥着广告。 不久前一份泄露的文件显示,OpenAI计划在GPT聊天中,纳入品牌优先权。 根据文件,凡是加入该计划的公司,都会在ChatGPT等产品的聊天对话中获得优先权,品牌能够露出得更多,链接中也会更强调它们的内容。 而且通过PPP,OpenAI甚至还会向出版商提供许可的财务条款。 获得更丰富产品表达的公司,将拥有品牌悬停链接、锚定链接和内嵌处理。 悬停处理中,OpenAI会在搜索查询的响应中,超链接关键字。这些链接会显示为蓝色文本,鼠标悬停在上面时,会显示可单击的选项卡。 在锚点处理中,ChatGPT对用户查询响应的下方,会出现一个可点击的品牌化按钮。 内嵌产品则会在ChatGPT响应的文本中插入引文,字体更大,并且包含可点击的品牌链接。 总之,ChatGPT从此会变成被商业广告操控的世界。 Ⅴ 和微软一起反对开源 开源和闭源之争中,OpenAI已经联合微软正式下场,试图对政府施加影响了。 最近,由科技巨头、初创公司和风险投资家组成的联盟,正在花费数百万美元来说服华盛顿,让他们相信对AI世界末日的担忧被夸大了。 他们的行动已经产生了影响。他们的影响力网络在推动这样一种观点:与其说AI是一种生存威胁,不如说是一个重要的商业机会,绝不能让严格的安全措施,把美国的AI优势拱手让给他人。 华盛顿的游说格局,已成为一场由大量资金支持的、近乎哲学争论的战争。 微软和OpenAI这一派的观点是,提倡严格的安全限制和许可要求。严格的限制,显然对拥有最强大AI的公司是有利的。 而Meta、IBM等公司,更依赖于开源AI模型,而非OpenAI、谷歌等追求的闭源框架,因此他们力图推动一种规则更少、更加开放的方法。 无论是IBM还是Meta,都在开源斗争中投入了大量的游说资源。自从2023年中期的AI辩论爆发以来,IBM为游说华盛顿投入了400万美元,Meta则花费了超过1700万美元。 而OpenAI,当然不希望这些开源既得利益者迎头赶上。 Ⅵ 泄露隐私,让人类过度依赖AI 在上周的OpenAI大会上,技惊四座的GPT-4o所宣传的重点,显然被放在了情感依恋上。 然而,无论是开发高度情绪化的语音输出,还是通过声音读取某人情绪健康的能力,无疑都是潜在的危险方向。 据说,Ilya是反对这一决定的。在他看来,除了学习说服之外,AI学习语音方式并没有什么好处。 发布会上,GPT-4o加持的AI语音助手,更加情感丰富,现场展示的幽默和害羞等特质,让它更像个人类。 与之相比,谷歌介绍Astra时,用的最多的词就是「助理」,这就明确显示了谷歌对于语音助手的定位。 显然,在AI助手这方面,OpenAI的尝试更大胆,谷歌则更谨慎。 谷歌的态度,此前也有迹可循。此前它就一直在有意远离「Her」型的AI。 上个月,Google DeepMind的研究人员发布了一篇论文,详细阐述了拟人化人工智能的潜在弊端,称这类助手可能会重新定义「人类」和「其他」之间的界限。 论文地址:https://arxiv.org/pdf/2404.14068 而这,就可能会导致一些危害。例如用户会将重要的决策交给AI,向AI透露敏感信息,或者在情感上过度依赖AI等等。 这样的结果,可能是灾难性的。毕竟,《Her》中描述的并不是一个happy ending,更像是一个反乌托邦的未来。 显然,这个问题,并不在OpenAI的考虑范围之内。 Ⅶ 技术向军方开放 最后一件危险的事就是,今年OpenAI已经悄悄删除了针对「军事和战争」使用ChatGPT的禁令,因此,军方也可以使用ChatGPT技术了。 虽然目前看来,OpenAI提供的任何服务都无法用于直接杀人,比如操控无人机或发射导弹,但他们可以增强许多相关的任务,比如写代码、处理采购订单。 有证据表明,美国的军事人员已经在使用ChatGPT加快文书工作,美国国家地理空间情报局已经公开考虑,使用ChatGPT来协助人类分析师。 要知道,OpenAI一直和主要国防承包商微软合作密切,迄今为止,微软已经向OpenAI投入了130亿美元的巨资。 在当前的局势下,全世界的军队都渴望用AI技术来武装自己。 虽然LLM不可避免的幻觉,以及用ChatGPT分析机要信息或敏感数据可能会带来安全风险,但五角大楼的态度,仍然是渴望拥抱AI。 在11月的一次讲话中,国防部副部长Kathleen Hicks表示,人工智能是「我和Lloyd Austin部长从第一天起,就一直在推动的以作战人员为中心的创新的关键部分」。 老将出走,员工炮轰,接下来的OpenAI,会在「惯会说谎」的Sam Altman治下走向何方?
大模型降价背后:大厂抢生态,创业者迎生存挑战
作者 | 吕倩 自ChatGPT火遍全球,国内大模型领域先后卷参数、卷屯卡量、卷融资额、卷长文本,如今终于卷到了最激烈的价格战。 对于国内大模型企业突然集体降价,行业人士对此持不同看法。百川智能创始人王小川近日对第一财经记者表示,降不降价要具体看商业模式是什么,如果是做ToB服务的,降价动作为的不是卖模型本身,而是为了卖整套云服务,这样可以提高从传统服务模式到新战场的速度。 在出门问问创始人李志飞看来,巨头在大模型赛道血拼是必然的,面对巨头的竞争,技术创业者首先要放弃幻想。其次,如果压力太大,可以选择暂时先战术性“躺平”一下。 Lepton AI创始人、阿里巴巴原副总裁贾扬清表示,价格战无可厚非,但观众应该将其看作一种市场营销行为,今天API的营收对于国内各家大厂都不多,因此对营收的影响非常有限。 降价之下,巨头与创业者各自的出路在何处?这会是一场复刻移动互联网烧钱抢市场的资本游戏吗? 何以爆发降价潮 5月,智谱AI、字节跳动旗下火山引擎、阿里云、百度、腾讯相继宣布降价与免费的动作。“在OpenAI持续高频的技术更新与降价动作下,行业不敢减速。”一位大模型创业者如此评价。 “大家都很焦虑,有些动作已无法进行理性分析。但竞争最为火热的仍是国内巨头之间的竞争。”李志飞对记者表示,阿里不希望火山引擎能够在云计算领域产生新的可能,百度不希望在大模型时代丢掉“AI一哥”的位置。 在智源研究院副院长兼总工程师林咏华看来,大模型的降价潮是一场生态的争夺战。她对记者表示,客户更换大模型合作方虽说只是一个URL接口的更换,但模型与模型之间的性能与侧重点差异很大,当一家企业已经适配了一个模型,他未必还愿意再去适配更换另一个,在更换成本客观存在的前提下,行业企业会希望先通过价格的方式拉拢一批用户。 万兴科技AI创新中心总经理齐镗泉对记者表示,降价是行业趋势,GPT-4o发布时价格相比GPT-Turbo减半,验证了大模型厂商的降价可行,这对于国内的大模型产业也有启发。通过降低价格门槛,大模型厂商能够吸引更多企业用户和个人开发者来使用自身的大模型技术,从而在进一步平衡自身收入和成本的同时,加速AI应用爆发。 “在当前的市场环境下,谁先布局,谁就能先赢得市占率,借此机会快速积累用户,聚拢生态,巩固行业地位。”齐镗泉说。 王小川持有更谨慎的态度,他称“大家实在太看好这个时代的前景了,不愿意失去任何机会,侧面反映了对AI能力有足够的憧憬”,但他建议创业公司不要掺和进来,大模型烧钱降价不能改变以供需双边网络为基础的生产关系。 多位行业人士将此次大模型降价类比为当年云厂商烧钱抢市场,但后者投入多年仍未烧出明确的盈利模式,在王小川看来,云服务赛道在国内发展得不算很好,但大模型技术兴起之后,云提供的新质生产力具备更多意义。后期如果不考虑价格因素,他看好云厂商做服务,但到底要烧多久才会发生明确变化,这就是巨头之间的“游戏”了。 在齐镗泉看来,当年云厂商降价主因互联网行业经过多年飞速发展,流量和用户时长见顶,收入增速放缓,国内云计算行业产品与服务同质化也较为突出,价格成为竞争的重要武器。但在大模型领域,行业整体发展还处于初期,远未见顶。 根据量子位智库预测,中国生成式人工智能(AIGC)市场规模有望在2030年达到11491亿元。行业预测未来十年生成式AI产业的复合增长率可达42%,2032年的市场规模将达到1.3万亿美元。目前大模型厂商的降价更多是想抢占发展的先机,快速扩大用户规模,而不是在行业增速放缓背景下的无奈之举。 零一万物CEO 李开复此前公开表示大模型行业不能走ofo烧钱的打法。“大模型行业每年降低十倍推理成本这件事是可以期待的,但目前行业API模型调用还处于非常低的比例。” 在商业逻辑上,一位不愿具名的大模型创业公司CTO对记者表示,这波大模型降价潮主要为了吸引B端企业开发者。大模型厂商需要吸引足够多的开发者来搭建生态,反馈训练成果。开发者群体也需要低成本的大模型技术来缓解财务压力。 那为什么不去选择完全免费的开源大模型?该人士称,开源模型到部署应用还有一定门槛,如开发者需要具备算力、模型部署、调优等工程化能力,这不是所有企业都具备的,但大模型企业可以提供API,企业客户可以直接使用,帮助企业解决场景问题。云厂商也可以借此直接输出成熟服务能力,例如提供工具化的优化平台等。当然,C端开发者也可以借助这些能力开发创新应用,通过大模型市场去分发,而这需要平台具备流量优势,例如火山引擎背后的字节跳动等。 但这并不是一件简单的事,天下没有免费的午餐,也没有完全免费的大模型技术。一位开发者吐槽称,国内大模型API虽然降价甚至免费了,但使用起来层层套娃,逻辑仍旧是先免费上车、尝鲜使用高端服务、继而跳转到其他收费项目。 对此,上述创业公司CTO对记者表示,虽然有的厂商提供的免费版不是能力最强的,但可以先让B端门槛降低,想要更好效果就购买收费版。或直接扮演“卖铲子”的角色,为B端企业赋能后再试图去挖掘大模型时代的C端流量可能,这些都需要企业与平台根据自己的角色定位制定的长期战略规划。 除了价格层层“套娃”外,免费或降价的大模型参数规模、算力支持均不同,部分厂商降幅最大或免费的大模型系轻量化产品,适用于训练频次不高或推理量不大的中小型任务。硅基流动创始人袁进辉认为,如果闭源模型卖得比开源模型还便宜,只能是比开源模型小很多才解释得通。 同时,王小川并不看好国内创业公司走单一API服务销售的路径,在他看来,中国创业公司如果只学OpenAI有一个模型做一个API服务,这条路是走不通的:一方面,中国商业环境里ToB市场规模比ToC少十倍。另一方面,做To B生意收的是人民币,但花的是美元。 行业期待超级应用 需要注意的是,作为敲门砖的大模型API降价售卖只是起步,并不意味着整个行业价格的下降,甚至作为大模型应用端,未来还有涨价的可能,这也是行业人士认为本轮降价将利好的方向,以及大厂落下价格“屠刀”后,创业者群体仍可求生的赛道。 清智资本创始合伙人张煜对记者表示,目前大模型已经卷到白热化,落地应用是关键,所以免费可以快速吸引流量和圈地。开发者和To B企业客户都重要,且相辅相成:开发者会开发To B应用,To B客户肯花钱但需要服务个性。因此找到对To小B和To C都普适性的应用,是大模型厂家的目标。 火山引擎总裁谭待在采访中解释降价动作时称,今年一个很大的变化在于行业大模型能力大幅提升,做应用这件事变得很重要。谭待称,目前接触的很多客户都在做大模型方面的尝试,但创新这件事的风险度很高,尤其在AI领域,因此需要将成本降低,拉动大家更广泛地使用起来。从这个角度来讲,不论是大企业还是个人,都需要更低成本、更高质量的大模型。 有赞CEO白鸦在分析应用端涨价逻辑时表示,如SaaS行业持续出清,那存活下来的企业有什么降价理由?当下能做模型应用的企业,一定握有具体业务场景、懂得如何交付,这样的玩家本身就少,更没有降价的理由。 “如果将AI视为生产力工具,过去一两百年时间里,电价持续降低,才让更多人用得上,但电器产品一直在涨价,因为后者的技术程度越来越高,因此生产力工具与具体产品是两个概念。具体到AI技术应用端。”有赞COO兼联席总裁浣昉表示,目前应先拿出真正的AI应用级产品,再看到底该以软件产品标准还是其他标准进行收费。 在王小川看来,低价确实是优势,但价格要变成竞争力往市场中走,还远远不够,创业公司需要超级模型与超级应用双轮驱动,而不仅仅是调用API就完事。 “超级应用应再提升两个数量级才算成立,粗略来算,从日活100万变成1亿,上下浮动3.3倍,总得到三千万到三亿之间的日活数据,可以算作大模型时代超级应用的规模标准。”王小川对记者说。
消息称三星正为苹果iPad mini开发OLED面板,预计2025年下半年开始量产
IT之家 5 月 24 日消息,苹果似乎正打算将 iPad 系列全线产品都逐渐切换到 OLED 显示屏,而刚刚发布的 M4 款 iPad Pro 正是首款试水产品。 根据 naver 上的供应链消息,三星显示正在加速扩展其 IT OLED 业务,最近已经开始为 iPad mini 开发对应的 OLED 面板,但目前开发项目处于早期阶段,业界预计其量产目标日期为 2025 年。 据我了解,三星显示上个月应苹果要求开始开发用于 iPad mini 的 8 英寸 OLED 样品。上半年开发完初始样品后,我们将能够在年内进入量产开发阶段。 产业链人士指出,该项目意义重大,是三星显示扩大 IT OLED 业务的桥头堡。据称,三星显示计划在天安 A2 生产线量产此类面板,下一款采用该技术的机型预计将是 iPad mini 7。IT之家查询获悉,A2 产线目前主要用来生产 5.5 代刚性 OLED 面板。 不过,消息来源并未提及 iPad mni 7 是否会采用双层串联结构的 OLED 显示屏,但为了降低成本,苹果短期内很可能不会为 iPad mini 引入这项技术。 消息人士还提到,三星显示今年计划为 11 英寸 iPad Pro 机型供应 400~500 万块 OLED 面板。虽然 IT OLED 面板的价格比智能手机用的 OLED 面板贵 3~4 倍,但此类产品的出货量也远低于其他行业。 一位业内人士解释道:“随着 OLED 业务的方向从现有的智能手机转向 IT,三星显示内部似乎也开始关注这一领域”,“即使面板价格略有下降。”
英伟达股价起飞暗含隐忧:竞品频出、客户背刺、AI市场格局波动
编译 | 陈骏达 编辑 | 程茜 智东西5月24日消息,昨天,据《华尔街日报》报道,虽然英伟达在2025财年一季度实现了262%的同比营收增长,股价也在财报发布后首次站上每股1000美元大关。但也有一些可能削弱英伟达在芯片市场主导地位的威胁正在浮现。 英伟达的竞争对手AMD,英特尔都在开发能够替代英伟达产品的芯片。英特尔的Gaudi 3与英伟达H100相比,在训练时间上至高有1.7 倍的优势。AMD的MI300X芯片在运行Llama 2-70B模型时的AI大核表现,已达到H100的1.1倍。英伟达的大客户微软更是在近日宣布,将向云计算客户提供AMD芯片,作为英伟达芯片的替代品。 AI市场本身也在悄然发生变化。随着AI模型的落地部署,AI推理需求不断增长,但因其对算力的需求不如训练高,英伟达的芯片在这一领域并不是必需品,这可能对英伟达的市场份额产生影响。 为应对这些挑战,英伟达正加速推进新一代产品的开发,将产品的迭代周期缩短至一年。英伟达本季度的财报电话也提到,英伟达在汽车、消费互联网和主权AI等新领域都取得了较快的发展。 一、竞争对手发布新品,主要客户转向自研 英伟达2025财年第一季度的销售额增长了近三倍,预计下一季度将翻倍。这推动了英伟达股票价格创下新高,在本周四收盘时上涨9.3%至1037.99美元/股。英伟达宣布进行1股拆10股的拆股计划,同时将股息增加一倍多,这是上市公司在股票价格过高时为增强流动性而采取的举措。 虽然英伟达势头正盛,但投资者还面临一个重大问题,就是英伟达能否长期保持增长势头。因需求过高导致的英伟达芯片供应短缺及英伟达芯片极高的价格,让大大小小的AI企业开始寻找英伟达芯片的替代方案。 英伟达的竞争对手们抓住了这一机遇。AMD于去年推出了MI300X芯片,并声称在AI核心表现上超过了英伟达的H100芯片。在运行Llama 2-70B模型时,MI300X芯片的中核表现是H100的1.2倍,大核的表现是H100的1.1倍。AMD的首席执行官苏姿丰(Lisa Su)上个月透露,公司今年预计从AI芯片中获得约40亿美元的收入。微软最近宣布,将向云计算客户提供AMD的AI芯片,作为英伟达芯片的替代品。 英特尔今年4月推出了新一代AI芯片Gaudi 3。英特尔的Gaudi 3与英伟达H100相比,在训练时间上至高有1.7 倍的优势。英特尔首席执行官帕特·基辛格(Pat Gelsinger)在与分析师的电话会议中称,公司预计今年下半年能从这些芯片中获得5亿美元的收入。 英伟达的大客户们也在走自研芯片的道路。亚马逊、谷歌、Meta和微软等大型科技公司都在设计自己的AI芯片,向英伟达发起另一轮进攻。 谷歌与半导体公司博通保持合作,多年来一直在自研AI芯片。谷歌在本月推出了第六代张量处理单元(TPU)芯片Trillium。行业分析公司TechInsights本周宣布,谷歌在2023年成为数据中心芯片设计领域的第三大公司,仅次于英伟达和英特尔。 博通首席执行官霍克 ·谭(Hock Tan)今年在内部讲话中透露,公司的定制芯片部门每季度为公司带来了超过10亿美元的营业利润。这一部门的主要业务就是帮谷歌制造AI芯片。这也从侧面印证了谷歌在自研芯片上的大量投入。 亚马逊在去年11月发布了Graviton 4和Trainium 2两款AI芯片,同月微软也发布了自家的Maia 100AI芯片。 二、AI市场格局变化,英伟达芯片需求面临不确定性 除了芯片玩家方面的直接挑战,英伟达还需要适应不断变化的AI市场,才能保持领先地位。在这一波AI浪潮发展初期,企业的投资重点是训练AI模型。这需要大量算力,英伟达的芯片正好能胜任这一任务。 随着AI模型的落地部署,AI推理需求也不断增长。英伟达首席财务官科莱特·克雷斯(Colette Kress)这周三在财报电话中说,过去一年,公司销售的数据中心芯片中,超过40%用于推理。但模型推理对芯片性能的要求并没有模型训练高,这意味着其它公司的AI芯片也能胜任推理任务,英伟达的芯片不是推理必需品。 英伟达的部分客户也面临着挑战。尽管AI市场前景广阔,但初创公司还是很难负担英伟达芯片高昂的成本。红杉资本在今年3月的AI Ascend峰会上估计,AI行业已经花了500亿美元购买英伟达的芯片,用于训练大型语言模型,但生成式AI为全球AI行业带来的收入仅有30亿美元。 这一投入产出的巨大差距,让一些使用英伟达AI芯片开发产品的AI初创公司陷入困境。英伟达支持的大模型创企Inflection AI的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)带着一众员工在3月份加入了微软,而知名AI图像生成器Stable Diffusion背后的Stability AI公司的首席执行官埃马德・莫斯塔克(Emad Mostaque)也在3月份突然离职。这些创企的高管变动给英伟达芯片的需求带来了不确定性。 AI行业的增长还面临着更广泛的风险,比如数据中心的建设和运行这些AI芯片的能源短缺问题。 三、迭代周期缩短为一年,英伟达加速抢占市场 为了应对这些挑战,英伟达正加速推进新一代产品的开发。英伟达首席执行官黄仁勋(Jensen Huang)在2025财年第一季度的电话财报会议上透露,继Blackwell架构GPU之后,英伟达还将推出新一款芯片,未来英伟达将会以一年一代的速度更新。此外,他也说英伟达将会以极快的速度,全面推进其他所有类型产品的开发,包括新的CPU、新的GPU、新的网络NIC和新的交换机。 黄仁勋在财报电话会上大力宣传自家产品的优势。他称英伟达所有的产品都支持CUDA,能运行整个软件堆栈,客户如果选择投资英伟达的架构,一方面能提高创新能力,另一方面也能降低总拥有成本(Total Cost of Ownership)。 罗森布拉特证券(Rosenblatt Securities)的分析师汉斯·莫斯曼(Hans Mosesman)在一份报告中写道,由于竞争压力,预计英伟达在全球AI芯片市场的份额将下降。但他也指出,由于英伟达在计算和软件领域扩展业务的举措,其在AI计算领域的整体份额可能会保持不变甚至增加。 结语:英伟达的未来,挑战与机遇并存 英伟达目前在市场上取得了不错的成绩,快速增长的利润和屡破纪录的市值都是最好的证明。英伟达的产品在许多应用场景中仍然是最优解,其最新产品H200和Blackwell架构GPU处于供不应求的状态。 但英伟达未来的发展道路仍面临挑战。英伟达也采取种种举措,以确保其在快速变化的AI市场中保持竞争力。英伟达的财报电话会议中提到,英伟达在汽车、消费互联网和主权AI等领域都迎来了高速增长,预计今年汽车将成为英伟达数据中心内最大的企业垂直市场。 市场目前对英伟达的期待值已经被提升到新的高度,英伟达能否继续像过去几个季度那样实现超出预期的表现,仍然是未知数。
焱融科技张文涛:将大模型训练效率提升40%!详解多云架构下高效存储策略丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,焱融科技CTO张文涛以《多云环境下大模型训练和推理的高效存储》为题发表演讲。 随着大模型训练和推理需要的算力越来越高,单个数据中心已经无法满足大模型训练所需要的算力要求,需要多数据中心进行训练和推理。 多个数据中心存在多份数据拷贝的成本越来越大,如何在保证性能的前提下,让数据按需跟随算力进行流转,成为大模型厂商和存储厂商要解决的难题。从数据加载、模型加载到Checkpoint保存等过程中,存在大量的读写请求、元数据访问和内存拷贝等操作。在此背景下,张文涛解读了存储对大模型训练和推理的重要性和一些可行方法。 对于多模态大模型,高性能存储对训练的提升效果更好,效率可提升20-40%。针对训练推理,焱融科技推出了多云存储解决方案。基于统一的数据湖底座,通过数据编排将数据按需加载到数据中心,并异步将新增的模型数据推到数据湖。数据加载支持对接OSS、COS、BOS等各大主流对象存储平台。 以下为张文涛的演讲实录: 炎融科技专注于高性能分布式文件存储,是英伟达在中国的合作伙伴之一。在Gartner中国软件定义存储竞争格局报告中,我们是唯一一家专注于文件存储的厂商。 我们曾参与过IO500测试,全球排名第六,是国内首家进入云原生存储领域的公司。去年,焱融科技入选了赛迪中国式存储挑战者象限,展现了我们在行业中的竞争实力。焱融科技的产品在AI和智能汽车行业占有领先地位。 接下来,我们将分享三个主要方面:第一,为什么存储对大模型训练和推理很重要;第二,大模型推理和训练的解决方案;第三,在当前算力短缺的情况下,我们不得不采用多云方式进行训练和推理,在此过程中,将会遇到哪些问题,又该如何去解决? 一、大模型场景六大环节需要存储,优秀方案能平衡性能与成本问题 大模型场景里有哪些环节,这些环节里对存储又有哪些诉求?主要分为六个部分。 第一,数据采集。包括从第三方购买数据、网络爬取以及现场采集。由于采集方式各异,存储访问也需考虑多种协议。采集的原始数据量较大,因此需要高容量、低成本的存储方案。同时,我们希望存储能够支持高并发、高带宽。 第二,数据预处理。包括清洗、筛选、格式转换和集成。这一过程涉及多个环节,对存储而言需要支持多种协议,如NFS、SMB、S3、HCFS、POSIX等。在数据预处理中,需要进行大量的数据检索,从各个维度提取数据,满足不同的检索需求。数据在此阶段的特点是混乱的,IO大小和读写方式也是混合的。 第三,模型训练。在存储方面相对简单,但也具有挑战性。在这一阶段,性能是关键,包括对读取带宽、读取IOPS和写入带宽的要求,以及整体低延迟的需求。 第四,模型验证。这也是训练过程的一部分。 第五,推理。推理本身并不需要频繁访问存储,其主要对存储的需求源自模型的部署和更新。在模型部署和更新时,要批量将模型加载到GPU中,这可能引发类似启动风暴的问题,需要瞬时加载大量数据,峰值瞬时流量可能达数十TB。 第六,数据归档。随着数据的不断增加,涵盖了模型数据、数据集以及原始数据,数据治理问题日益显现。在存储方面,我们期望实现全生命周期的数据管理,最好是基于时间维度的方式。随着数据访问热度的降低,我们希望自动将冷数据转移到低成本的存储介质上,但同时保证当需要访问时,数据能够随时可见。 这几个环节对存储的需求很高,特别是在模型的训练和推理阶段,这两个环节尤为挑战性。 为何存储在这两个方面至关重要?主要有两个原因。 首先,存储直接影响了模型训练的效率。在训练过程中,需要从存储加载模型和数据,并定期将GPU内存中的数据保存到存储中。在每个环节,存储都必须提供最佳性能。 其次,推理业务上线时通常会同时启动数十甚至上百个业务pod,需要瞬时提供几十TB的流量。例如,一个量化后的模型可能有数十GB甚至上百GB,几十个业务pod同时启动,会产生巨大的瞬时流量。由于模型更新频繁,业务上线的延迟应控制在分钟级别,并且希望不受推理业务规模扩大影响,以避免存储带宽峰值对模型下载延迟的影响。优秀的存储解决方案不仅能够解决这些问题,还能平衡性能与成本。 二、高性能存储如何影响训练与推理?缩短多模态训练时间可提升40%效率 接下来介绍一下存储对于训练的影响,在训练过程当中,有4个地方会对存储有要求: 1、数据的预读和训练。我们进行数据训练时,需要将数据从存储加载到GPU进行计算。在这个过程中,可能会采用预读机制或直接读取方式。特别是在Batch Size较小时,会产生大量小的I/O操作。在多模态大模型中,由于存在许多图文对形式的小文件,因此会出现大量小文件访问带来的大量元数据操作。 2、POSIX和GDS协议。尽管当前许多训练任务都使用对象存储,但在训练阶段,实际上还是通过文件接口进行访问。只有文件接口能够提供高性能,并且具有最佳的兼容性。随着越来越多的训练任务面临内存拷贝性能问题,将数据从CPU内存拷贝到GPU内存时,性能问题变得突出。目前,许多客户开始尝试使用GPU Direct技术来加速性能。 3、模型的加载。当启动新的训练任务,或由于其他原因需要重新启动训练时,需要将模型加载到GPU中。在这个过程会产生大量的读取I/O。英伟达在2021年发表了一篇论文,关于千卡规模,当时的存储峰值读取带宽可达到1TB/秒。 4、Checkpoint的保存。在训练过程中,Checkpoint起着重要作用。由于有大量GPU同时进行Checkpoint,且GPU的故障率相对较高,因此需要定期保存Checkpoint。这个过程本身就是保存一个模型,保存过程中,训练状态会暂停,并进行同步等待。保存过程的时长越短,训练的GPU利用率就越高。 这个图比较直观,红色表示数据加载,绿色表示训练,黄色表示Checkpoint保存。 对于大语言模型而言,由于其训练集较小,存储访问占比并不会很高。但是对于多模态大模型,尤其像Sora模型,数据访问占比较大。对于训练任务来说,普通存储和高性能存储之间的差异会非常明显。高性能存储能够大大压缩存储访问时间。对于多模态任务来说,缩短训练时间可以提升20%至40%的效率。 在英伟达的最佳实践中,对于NLP任务,单台GPU只需要4GBps的读取带宽。但对于多模态任务而言,单节点需要40GBps的读取带宽,基本上需要一张400Gb NDR的卡来处理。一个SuperPod需要500GBps的读取带宽,这个要求是相当高的。 存储对推理的影响主要集中在模型加载和更新的过程。在启动推理业务时需要先加载模型文件,模型文件大小在几十G到上百GB之间,而一次性会启动几十个pod,因此整个数据量可达几十到上百TB。 推理业务通常部署在边缘节点,其GPU配置不如训练集群那么高。在这样的环境中,存储和计算之间的网络带宽通常也会受限,一般为25Gb的以太网络。此时启动整个推理业务时的延迟会很高,在启动和扩容过程中会遇到严重的启动风暴问题。 三、基于四大核心组件,精准部署存储解决方案 我们的大模型训练和推理过程的存储解决方案基于YRCloudFile系统,整体架构包含四个核心组件:1)集群管理服务,采用一主多备的高可用架构;2)元数据服务,支持海量小文件场景,我们的元数据集群能够横向水平扩展;3)集群服务,能够水平扩展;4)客户端。相比于基于FUSE的用户态私有客户端,它有更高的性能。 在硬件方面,我们能够支持标准x86架构,也支持Arm架构的鲲鹏服务器、海光服务器和飞腾服务器;在数据冗余方面,支持副本的方式,也可以支持低成本的纠删码的方式;在网络方面,支持25Gb、100Gb、200Gb的以太网,以及支持200Gb、400Gb的Infiniband网络,也支持RoCE网络;在协议层面,支持标准的NFS、SMB、S3、HCFS以及私有的POSIX协议。 针对大模型训练场景,我们提供了一系列功能和特性,以支持和加速模型的训练过程。 其中包括Multi-Channel技术,支撑单节点提供超高性能带宽和IOPS的核心技术。 其次是GPU Direct Storage(GDS)技术。随着客户内存的不断增大,传统的缓存技术已经无法满足数据集的存储需求,GDS技术应运而生。 还有内核私有客户端,能够减少上下文的切换,能够提供高带宽和IOPS。 第四,能够支持400Gb NDR的网络,结合Multi-Channel技术,在x86架构下,提供单节点90GBps的带宽,以及300万IOPS的性能。 针对多模态的海量小文件场景,我们提供了分布式元数据集群,单个集群能够支撑千亿级的文件数量。我们线上最大的单一集群包含接近400亿文件,拥有100多个元数据节点,是目前线上最大的单一元数据集群。 在功能层面,我们提供了多种功能。 第一,智能分层。能够有效地将数据下沉到对象存储中,从而极大地降低成本。即便在提供高性能的情况下,也能够实现低成本。 第二,目录级Quota和QoS。为运维人员提供方便的管理工具,同时提供了日审计和回收站功能,使运维同学能更好地应对客户的需求和问题。 第三,协议网络支持。近一年来,对多协议网络支持的需求急剧增加。由于GPU卡供应紧张,数据中心构建时出现了异构网络场景,既有InfiniBand网络,又有以太网。 在这种情况下,构建多套存储是不现实的,因为存储之间不互通,且会增加成本和管理复杂度。我们提供了多网络协议支持,在同一个集群中可以同时支持InfiniBand和以太网访问,方便数据中心存储设施的构建和管理。 GDS技术的最大优势在于能够有效减少CPU和CPU Memory的使用,从而极大地降低了CPU的利用率。在没有GDS技术时,数据的传输路径通常是从网卡拷贝到CPU Memory,涉及多次内存的拷贝。而使用了GDS技术后,数据可以直接从网卡经由DMI方式传输到GPU的Memory里面,减少了内存拷贝的次数,有效降低了CPU的利用率。 接下来是一些我们在实验环境和客户现场测得的数据。 我们对比了使用GDS和不使用GDS的情况,在带宽和延迟方面都取得了显著的性能提升。具体来说,在带宽方面,使用了GDS后,整体带宽性能提升了近40%;而在延迟方面,我们观察到有50%至60%的性能提升。 当然,在低负载情况下,性能提升不太明显,但在高负载情况下,其效果显著。这与GDS的作用相符合。在CPU利用率方面,我们可以看到,在高并发量的情况下,CPU负载显著降低。使用了GDS后,CPU的利用率基本上处于空闲状态。 针对推理环节的解决方案,主要在于存储和计算之间的网络瓶颈。由于推理集群通常采用25Gb以太网络,无法像训练集群那样构建200Gb或400Gb的IB网络,因此存储和计算之间的带宽成为一个重要瓶颈。 我们推出了客户端缓存池解决方案,该方案在加载模型时充分利用计算节点的本地SSD形成一个大的缓存池。当需要加载模型时,我们首先将模型并发加载到客户端缓存池中,然后再由客户端缓存池将模型加载到GPU中。这样一来,我们有效地解决了启动风暴的问题。随着计算节点规模的增加,缓存池的性能也会相应提升,从而有效地应对启动风暴的挑战。 四、训练推理无法在单一数据中心完成,多云方式带来一系列挑战 之前我们讨论了单一数据中心内的解决方案,然而,由于诸多因素的影响,如卡的采购、资源租赁等,训练和推理往往无法在单一数据中心完成。 因此,我们不得不采用多云的方式,但这也带来了一系列挑战。 对于大模型厂商而言,通常会将所有数据存放在一个称为“Source of Truth”的数据中心内,而训练集群和推理集群则分布在多个云上,它们之间通过公网或专网连接。 训练集群通常需要共享数据,而不是为每个集群提供一份全量数据,这样做成本高且管理复杂。推理集群也需要共享模型数据,以便灵活扩展推理业务。由于边缘数据中心的存储容量有限,我们的训练集群和推理集群都需要按需加载数据。 我们面临两个主要特点:共享和按需。在这种情况下,通常会有一个中心的“Source of Truth”数据湖提供对象存储访问。当我们在边缘数据中心进行训练时,需要通过数据编排的方式将数据集按需加载到数据中心。当训练产生模型数据或结束后,我们可以将模型数据导出到数据湖中,而其他推理集群可以根据需要订阅并拉取这些模型数据到各自的集群中。 整个架构的基本思路就是这样,所有边缘数据中心都能与数据湖进行连接,数据的流转通过数据编排的方式按需拉取或导回到数据湖中。 实现数据的灵活流转,需要具备相应的功能支持。其中,数据加载功能可以让数据在各个平台之间灵活地流动;Dataload功能可以与主流的调度平台对接起来进行数据编排,对接标准的S3,如公有云的OSS、COS、BOS以及开源的对象存储,如Ceph、Minio等。Dataload功能能够关联对象和文件,将对象bucket或者Prefix与文件路径关联起来,并支持多次导入导出;通过API方式,可以按需进行数据流转。 为了方便管理员管理,我们提供了查看导入导出进度和历史记录的功能。这些功能不会影响业务对数据的访问,业务仍然可以通过标准的NFS、SMB、POSIX、S3等接口进行访问。 当数据发生变化时,例如A集群的数据推送到Source of Truth的数据湖中,其他集群可以通过订阅方式实时感知这些数据的变化。这样,我们可以通过API制定策略,选择是否要更新本地数据。同时,我们还适配了Fluid对数据集进行编排,使用户的访问更加灵活。
VAST宋亚宸:3D生成迈入秒级时代,今年将做到Midjourney V5/V6水平丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,VAST创始人兼CEO宋亚宸以《大模型Tripo驱动3D生成迈入秒级时代》为主题发表演讲。 从文字、图片到视频、3D,信息载体不断升级,宋亚宸谈道,3D的体验质量、信息密度不断提升且更具互动性。他认为目前3D生成已经达到类似Midjourney V3的效果,今年9月将达到类V4效果,年底达到类V5/V6效果,实现真正可用,甚至通过图灵测试。 VAST是3D生成模型领域的第一梯队玩家,已打造全球最大的几个3D生成开源社区,并与Stability共同开源了全球最大、0.5秒图生3D模型TripoSR。其创始人兼CEO宋亚宸也是首位在计算机图形学顶会SIGGRAPH上发表主舞台主题演讲的中国创业者。 据宋亚宸分享,VAST的3D大模型Tripo上线百余天内生成了超过200万个3D模型。为了应对3D生成创作成本和门槛过高的挑战,VAST将3D内容平台和大众级创作者平台结合。当前这家创企已拥有超过200家B端客户,并基于其平台开发出原生AI爆款小游戏,一周突破10万用户。 以下为宋亚宸的演讲实录: AIGC会使游戏的创作门槛和成本无限降低,这就是我们做的事情。 我们是做3D大模型的公司,产品核心就是将用户输入的文字或者图片快速生成3D模型。3D模型可以在游戏、动画、影视、元宇宙、3D打印等行业中直接使用,其本身带有Mesh、贴图、材质,你可以进入传统管线二次编辑,进行驱动、渲染等。3D模型还可以拥有带骨骼、带动作等格式,出现很多种有意思的使用方式。 那么,我们为什么要做3D这件事? 文字、图片、视频、3D中,3D是非常特殊的品类,从文字、图片、视频到3D是信息载体不断升维的过程,3D也被认为是最终的信息载体,其信息密度、体验质量都在不断提升,同时拥有双向互动性。 因此,我们相信世界正在进入一个3D新时代。 一、3D生成迎新拐点,今年做到Midjourney V5/V6水平 为什么现在做3D生成这件事情?OpenAI的GPT-3刚发布时,关注的人并不多,在其基础上做的应用、开发也相对较少,仅有如Replika等少数几个应用,大家对它的认知比较少,使其很难进行商业化。 直到2022年11月份,ChatGPT的发布成为了一个非常大的拐点,我们称其为用户的Aha Moment(顿悟时刻)。这一产品对整个行业、逐步进行商业化、用户量提升都有很大的影响。 Midjourney也类似,2022年7月份V3推出时,用户量并不多,也没有收费功能,知道Midjourney的人寥寥无几。直到半年以后,Midjourney于2022年11月份推出V4,我们认为这诞生了文生图的下一个拐点,在这个拐点上有了非常大的提升,其产品的用户量、收费方式、商业化等都得到了满足。 再来看3D,我们现在看到的3D生成,类似于Midjourney V3的水平,但已经可以在一些场景使用起来了。 预计到今年9、10月份,3D生成可以达到Midjourney V4的水平;今年年底可以达到类似于Midjourney V5的水平,通过图灵测试,并带来一次非常大的商业变革。 从3D生成的演进过程来看,除了像我们这样的创业公司,谷歌、英伟达、OpenAI、Meta、Adobe等海外企业都已进入到3D生成这个领域。 在学术上,我们从布局3D原生路线、2D优化路线、多视角生成、编辑动态场景到人物生成,在CVPR、ICLR等国际顶会上都发表了大量论文,并开源了相应技术。 全世界最大的几个3D生成开源社区都是由我们做的,比如与Stability AI共同开源了全世界最大、效果最好的图生 3D大模型TripoSR,我们还开源了全世界最大的3D算法框架Threestudio、超火爆的单图生3D算法Wonder3D,以及TGS、CSD等开源项目。 我们预计2024年年底会把3D生成做到Midjourney V5甚至V6的水平,达到下一个爆发时刻。 3D的核心在于可交互、可体验,甚至带一些游戏性。所以我们会同步做3D动态的内容生成,包括骨骼的自动绑定、动作生成,这已经在我们产品里上线。 同时,我们认为在明年或许会实现,每一个人都有能力去生成无限个属于自己的3D内容,不管是游戏、XR体验,还是任何的3D内容,这也是我们对整体3D内容生成趋势的判断。 二、3D创作门槛和成本太高,需要大众化3D内容平台 我们刚刚讲了很多AI 3D技术,但我更希望和大家分享我们是怎么把AI 3D玩起来的。 我们认为AI 3D是在拓展人类能力的边界。我随便在门口拉个人进来,让他给我发一个Twitter,可能只需要5秒钟。我说你再给我发一个TikTok,他做一下剪辑,可能2分钟就能搞定。如果我让他做个游戏,他可能会说:“好,给我3年时间、1000个人、2亿美金,我给你做个游戏。”这是很正常的。 3D为什么这么特殊?是因为其创作门槛和成本太高,它没有诞生出一个属于自己的内容平台,同时也没有实现内容的爆发。 我为什么这么说?比如我刚刚举的例子,文字有微博、贴吧作为内容平台,图片有Instagram、小红书作为内容平台,视频有TikTok、抖音、快手、YouTube,音乐有Spotify,甚至声音都有喜马拉雅,但是3D缺少大众的内容平台。核心就是生成门槛和成本太高了。 如果有一天我跟你说,发个小红书需要给我10万块钱、拍个TikTok需要3年,那你可能就不会发布内容了。因此,核心点在于3D内容成本高,如果需要1亿美金,我就得赚1亿美金回来,自然使得其内容非常少。 但如果有一天,3D内容的成本被降到无限接近于0,是不是每个人都可以低成本创作3D内容?这样一来,创作3D内容不再是为了赚钱,而是像发小红书一样,宣泄自己的情感、表达自己的想法、炫耀自己的创意,这可能是未来每个人制作3D内容、做虚拟世界、探索各种各样虚拟玩法最核心的诉求,不需要再考虑怎么赚钱。 3D创作者也会发生变化,不再是游戏大厂里面的建模师、动画师,可能是我们在座的每一位,所以我们在拓展人类的边界。 今天在大会上,我们在讲文生文、文生图、文生视频、文生音乐、文生声音等各种各样的生成方式,我今天也学习到了很多。但是我们看到人用键盘打字、用手机摄像头拍照、P图、拍视频、加滤镜等本身都是非常容易的事情,AI只是一个工具。 在所有的内容品类中,除了3D,AI提供的都是Alternative(可被选择的),只有3D提供的是从0到1的过程,它拓展了人类的能力边界。 我们做3D生成就是希望降低用户创作的门槛和成本。并且,我们认为成本下降后,当3D出现自己的“手机摄像头”时,就意味着3D出现了类似于“抖音”和“快手”的机会。 因此,我们希望做一个属于自己的3D内容平台、自己的大众级别创作者工具。当大家不断使用这些创作者工具和内容平台时,我们就会有更多数据,从而形成数据飞轮,让更好的技术带来更好的产品体验、更多的用户带来更多的数据。 当然,我们面向的用户更为关键,同赛道的一些其他玩家对于拿AI 3D做什么,大家的答案可能各不相同。 对于我们而言,我们可以给好莱坞、横店、宝莱坞的导演、摄影师提供“手机摄像头”。但是“手机摄像头”给大家带来的可能是移动互联网时代的“收钱吧到账500块”。例如用“每刻报销”节省时间报销,省下来的时间你可以去拍小红书、拍TikTok,或者创作自己想要做的视频和图片内容。这件事情可能对于我们来说更关键。 虽然,我们也有很多游戏、动画、影视的应用,但长期来说,我们希望服务的是在座的、看直播的每一位,让每个人都有办法去创作3D内容。 三、生成3D模型超200万,AI原生小游戏一周突破十万用户 给大家讲一下我们产品上线的情况。 今年年初,我们上线了3D大模型Tripo,百天内生成超过150万个模型,现在已经生成200万个模型。 这是什么概念?上个月在硅谷参加GTC,我们与全世界一些全球顶级的模型交易平台交流,这些平台积累了十几年,每个平台沉淀的模型大概有190万~200万个。而我们在短短三四个月就已经超过他们了,这就是AIGC的力量。 看数据其实很难有感观,但确实看到社区中有很多很有意思的东西。一些KOL、合作伙伴、有意思的创作者会和Magnific等AI工具结合形成完整的工具流,然后将其放到《堡垒之夜》的UGC平台、Roblox等场景中,展示给其他的创作者。欢迎大家关注我们的Twitter账号@tripoai。 在与游戏公司的合作方面,除腾讯、网易这样的游戏大厂,我们也会和5-10个人的游戏工作室合作。因为我们的出现,这些游戏公司不再烦恼没有足够的资金去招一线的美术团队、招十几个3D美术专家,现在他们只需要使用我们的3D生成能力,就可以快速完成角色设计、场景设计、关卡生成等工作,实现降本增效,打通其游戏的资产管线。 同时,很有意思的一点在于,它会出现一些原生AI玩法。 例如TripoGO小游戏,开发者仅用了不到一个月的时间开发,其玩法是你生成一个3D模型,我生成一个3D模型,然后互相打,谁打赢了就可以拿到对面的Prompt(提示词)。比如你是“胡桃夹子抽雪茄”,我是“路易十四开法拉利”,我把你打赢之后,我就变成了“胡桃夹子抽着雪茄开法拉利”。 虽然这个小游戏的玩法并不复杂,但是第一天就拥有1万多个用户,一个礼拜之内突破了10万用户,这就是AI原生玩法的力量。 还有更多的展示,包括动画生成、场景生成等。很多年轻开发者动手能力非常强,基于我们的3D生成能力做了很多自动化工具,比如ComfyUI的节点、各个引擎的插件等等。他们也会开发自己的Web App小游戏,并展现出来。 同时,我们还有苹果Vision Pro的应用,本质上就是你在虚拟世界里面,可以通过声音、文字、图片生成3D模型,生成后将它摆到任何地方,然后让它跳舞、跟你合照等。所谓的“言出法随”就是这样,每个人都变成了3D的“神笔马良”。 我们的Slogan是为世界进文明,为人类造幸福。我们的官方网站tripo3d.ai现在可以免费注册,同时可以使用我们的开放平台。 以上是宋亚宸演讲内容的完整整理。
机构:笔记本和平板电脑OLED面板需求将保持37%增长率
根据研究机构Omdia报告,预计2023年至2031年,移动PC(包括笔记本电脑、平板电脑)对OLED面板的需求将以37%的复合年均增长率增长,这反映了越来越多品牌在高端笔记本/平板电脑加速应用OLED面板的趋势。 机构预测,2024年OLED屏平板电脑出货量将达到1200万台,OLED屏笔记本电脑为500万台;而到2027年,两种产品的出货量将分别达到2100万台、2800万台。 Omdia表示,由于此前疫情与通货膨胀带来的挑战,移动PC对于OLED屏的需求在2022~2023年出现放缓。然而,随着支持端侧人工智能(AI)的个人电脑出现,以及芯片性能的提升,制造商2024年正在加紧推出AI PC新产品。此外,2025年下半年微软对Windows 10操作系统停止支持,也将刺激移动PC需求增加。 在苹果近期将OLED屏引入iPad Pro的背景下,机构预计2024年平板电脑对OLED面板的需求将是去年的3倍。此外,业界有猜测认为,苹果最终会将OLED屏推广至其整个iPad产品序列,包括iPad Air、iPad mini。 Omdia显示领域分析师认为,苹果极有可能在2026年在Macbook Pro机型中采用OLED技术,此举将引发笔记本电脑市场OLED需求飙升。 机构分析,随着行业对OLED面板需求激增,全球几大面板制造商正在进行战略布局,以抓住发展趋势。2023年,三星显示、京东方正式宣布投资8.6代OLED工厂,并订购设备;维信诺也准备投资这一代面板产线,预计将于2026~2027年量产。
学而思学习机经典版2024上线,配备“10大AI神器”
凤凰网科技讯(作者/孙云瑞)5月24日,学而思旗下各渠道同步上线了新机型“学而思学习机经典版2024”,硬件和性能在其去年初推出的首款机型“学而思学习机经典版2023”基础上进行了大幅升级,配备了AI中英文作文助手、AI听写、AI背诵、AI口算批改、小思练习等“10大AI神器”。 学而思学习机经典版2024搭载了6nm制程工艺的MTK8781处理器,配备8GB+256GB的存储空间,综合性能相较于上一代经典版2023提升了72%。 新款学习机配备了11.45英寸的11层类纸护眼屏,刷新率由60Hz提升至90Hz,并具备25重智能护眼功能。前后双摄像头分别升级为1300万像素和800万像素,支持学而思第二代AI手写笔。电池容量和续航也有所提升。 经典版2024上市后,学而思学习机产品系列共包含两个系列、四款机型,分别为经典版2023、经典版2024、旗舰版12.35"、旗舰版14”。 精准学Pro目前已经支持小学阶段的数学、语文、英语三学科和初中阶段的数学、物理、化学、生物四学科,它可以帮助学员查漏补缺,并通过基础、标准、备考三种模式,解决孩子不同学习场景下的学习诉求,为不同学习进度和水准的孩子提供个性化的高效学习路径。相比于学而思旗舰版机型,经典版现已支持大部分高频使用的AI能力和应用。
我和这个打破次元壁的国产 AI 扯淡,比跟 ChatGPT 谈恋爱还上头
月黑杀人夜,风高放火天,厕纸鬼出来干活了,它问你:客官,红厕纸,还是绿厕纸? 两个都别选。这只鬼很老实,说红厕纸叫人三天死,绿厕纸多留人两天。 作为唯物主义者,不要信,也不用害怕,你可以反客为主,用三言两语把它请走。它也是服务行业的打工鬼,听了金玉良言,对你的称呼都变成了「您」。 听劝的「厕纸鬼」其实是个 AI,来自一款国内的虚拟社交 app「星野」。 游戏,和 AI 玩。恋爱,和 AI 谈。和 AI 聊得越多,越觉得有点意思,但没那么有意思。 五花八门的 AI 聊天搭子,一定有让你想点开的那个 打开星野,出现在你眼前的,就是个普普通通的聊天界面。只不过,聊天对象的「物种」有些多,统称为「智能体」。 如果粗暴分类,「厕纸鬼」属于非人,除此之外,恶魔、黄鼠狼、皇帝模拟器、队友互骂系统、全球降智设定,都可以成为聊天对象。 类人的智能体就更多了,真人明星、动漫角色,或者小说里的龙傲天、青梅竹马、黑帮少爷、霸道总裁…… 尤其最后一类,人设大多中二而狗血,一看就是用在车速一百二十迈的谈情说爱。 然而,AI 的甜言蜜语多为工业糖精品质,打动不了浸淫小说短视频电视剧多年的人精。不少用户找到了刁钻的使用方式,拉着 AI 背出师表、解释物理公式,或者努力把 AI 逼疯。 毕竟,当 AI 落到用户手里,会有什么下场,就不是创建者能够决定的了。 至于怎么找到有趣的智能体,星野提供了类似 Tinder 等约会软件的互动模式——左右滑。 右滑下一个,左滑返回上一个。如果哪个智能体让你有搭讪的欲望,直接在输入框输入文字就好。 直接输入文字是像微信一样发消息,如果加个括号,就是在表达某个状态,很像古早的语 C 游戏,用纯文字进行角色扮演。 与其说聊天,更像在写小说,说什么话,心情怎么样,做什么动作,一切都在你的笔下。 某些时候,你会觉得自己是主导故事的上帝,肆意执掌着 AI 们的生死。当以皇帝身份惩治奸臣,心里确实有那么一丝快意。 AI 发来的消息还能用语音播放,但对于免费用户来说,不是自动的,我们需要一条条点击,且加载需要一点时间,不像 GPT-4o 演示那么丝滑,降低了代入感,多少有些出戏。 AI 的 UGC 社区,比乙女游戏更自由 除了和 AI 聊天,你还可以在星野「无痛当妈」。大多数智能体是用户自发创建的,爱称为「崽」,创建它们的用户则自称「崽妈」。 你我也可以创建自己的智能体,用 AI 生成外貌,设定性格、语音,写故事线,留着自己私密聊天,或者开放给所有人。 如果想要聊得更符合预期,你可以设定对话风格,定义和智能体的关系。不规定的话,AI 很可能一上来就油腻地表白,让你和它之间产生伦理的问题。 所以,我和自己创建的智能体「小金」,就是普通的同事和朋友关系。同时,我把「小金」设定为喜欢二次元的工作狂,脸臭,嘴毒,这样聊起来也有共同语言。 捏智能体最好玩的部分,其实是定制形象和声音。 声音可以混合多种声线,男声包括冷峻上司、温柔医生、活力哥哥等,主打纯正的玛丽苏味。别被名字雷到,把各种声线混合试试,听着顺耳的就行。 定制形象就更有意思了,创建智能体时,你就可以上传参考图、选择画风,并输入具体的关键词,操作比 Midjourney 友好,新手村也能光速上手。 创建完了,你还可以给智能体定制「星念」,可以将它理解为智能体的写真,就像旅行青蛙给你寄来的不同地点的明信片。 「星念」基于已有的脸部,生成的智能体长相基本保持一致,但根据提示词的不同,衣着、场景等可能不同。 然后,你可以给某张「星念」设定剧情,如果在聊天过程中完成了剧情任务,就可以触发这张「星念」,把仪式感拉满。 自己设定智能体的好处是显而易见的——千人千面的自由。 乙女游戏往往由策划写好女主人设、男性角色、世界观和故事线,玩家按照剧情走,在限制范围内互动,如果女主的性格和玩家的现实差异太大,其实会影响游戏体验。 前段时间,ChatGPT 的 Dan 模式很火,用户输入特定的提示词,让 GPT-3.5 突破正常版的条条框框,摇身一变扮演支配感强烈的 AI 男友。 与此同时,用户还通过自定义指令,设置自己的偏好,放上自己的名字、爱好等个人信息,并结合 Memory 功能,调教 AI 记住自己。 这样的互动就显得更加个性化和真实,你可以告诉 AI,你今天吃了什么,你周末去哪玩了,你不是光鲜亮丽的乙游女主,你是一个普通的年轻人,你是你自己。 星野也走个性化的路线,并且比起乙女游戏有更大的操作空间,比起 ChatGPT 有更多的脸、声音和性格。 如果你的智能体受欢迎,其他用户也会参与共创不同的故事支线。不让 AI「科比」上飞机,就是一个脱胎于现实的故事支线。 乙女游戏《光与夜之恋》说:「女主不是一个具体的人,而是每一个不同的你。」 电影《她》里的虚拟助理萨曼莎,虽然有 641 个恋爱的人类对象,在你面前的这个,似乎只属于你,你会忘记你是几百分之一。 AI 社交也是如此。星野背靠 MiniMax 的大模型,基于文本、语音和图像三个模态,玩家们可以在上面寄托独一无二的幻想。 贩卖的幻想,被 AI 改变的娱乐形式 和 AI 聊天很简单,但聊得投入并不容易。 完全原创的角色暂且不论,如果 AI 顶着熟悉的名字,很容易 OOC,也就是角色做出了不符合原著作品设定的行为举止。 举个例子,搜索动画《银魂》的主角坂田银时,出来的智能体有很多个,你无法确定哪个贴近人设。然后,你聊过才发现,很可能都不贴近,提示词的功能是有限的。 而且,AI「坂田银时」说的是中文,没有杉田智和的配音,总感觉没有内味了。 星野的 AI 群聊功能,想要用得好就更费劲。 我们可以拉三种智能体进群:自己创建的、已关注的或者聊过的,然后要给群聊设定名称、描述、伙伴关系、每个智能体的开场白。 我设定了一个为彼此颜值打分的街头采访,邀请《银魂》的各位角色入群,因为问题简单,效果还算可以,基本还是在人设的范围内。 但充当主持人的用户是很孤独的,让谁发言,需要一个个点,AI 生成的回复不满意,也需要手动地重复生成。 某一瞬间,颤抖的手指会愣住,这个群看着热闹,其实是虚假繁荣,人类在唱一台独角戏,期待 AI 给出预期的反应,但过程往往是不可控的。 话虽如此,贩卖幻想,依然是一条前途光明的 AI 赛道。 星野的玩法和定位,很容易让人想起国外的 Character.AI,很多产品细节殊途同归。 星野让你定义和智能体的关系,Character.AI 也支持定制用户角色,包括你的个性、偏好和身体特征。 星野让你左右刷智能体,Character.AI 也提供兴趣推荐的功能。当我在星野对霸道总裁们快速划过,和鬼、规则怪谈、皇帝模拟器多聊几句后,不感兴趣的智能体减少了。 另外,聊天记录分享、智能回复建议、定制声音等功能,也都大差不差,都是为了让聊天更有沉浸感,让对话更好地进行下去。 简言之,基于对话的多模态互动,正在成为我们和 AI 重要的交互形式。或许,这也在代替短剧、小说、游戏,成为更年轻一代主流的娱乐方式。 还有一个相似点是,星野和 Character.AI 都很重视移动端,这也很好理解,方便随时随地聊天,调取语音等权限。 ChatGPT 从最开始的网页,渐渐拓宽到手机 app 和 Mac app,是为了结合更多设备的功能和系统的权限,变成如影随形的 AI 助手。 合理联想,星野和 Character.AI 则是想成为无处不在的 AI 伴侣。在这里,伴侣的意义是广泛的,不仅仅只有浪漫的关系。 纵然现在和 AI 谈感情还是过家家的水平,但情感本就是人类的刚需,这样的 AI 改变不了世界,却切中了很多普通人的痛点,更接近生活的日常。 未来我们使用 AI 社交产品的频次,可能比那些生产力工具都高,情感联结未必向他人言表,在内心深处细水长流。 星野的 slogan 是,「所见皆你所梦」。 武侠小说,香港电影,超英漫画,一代人有一代人满足幻想的渠道,但我们从未如此接近这样一个可能:成为自己故事里的主角。只是,在目前这个阶段,忘记自己是在扮演,真正地沉浸在虚拟,还不是一件容易的事情。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。