EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
缘何持续兑现业绩?张韶峰细数百融云创三张“王牌”
近日,一站式服务的AI科技领航者——百融云创(百融云-W,6608.HK)发布了上市以来最强一期中报。数据显示,上半年,公司实现营业收入12.43亿元(人民币,下同),同比增长32%;净利润达2.07亿元,同比增长121%;经调整后净利润达2.27亿元。 事实上,百融云创已经连续两期取得净利润翻倍增长的战绩。根据2022年年报,该公司经调整后净利润录得2.94亿元,同比增长108%。再根据今年中报,百融云创上半年净利润额已经达到去年全年的七成有余。 盈利能力的实质性跃迁表明公司已经步入快车道。相应的,在发展新阶段,百融云创对于业务结构进行了策略调整,将原有的三条业务线合并成两条:利润稳定增长的MaaS和收入高速增长的BaaS。 “目的是更加清晰地反映百融云创的商业模式和技术本质。”百融云创CEO张韶峰在中期业绩发布会上说道。   全场业绩发布会听完可以发现,百融云创净利润爆发式增长源于其用好了手中“三张”王牌。 王牌一:算力可以买,行业know-how买不来 “行业know-how”可谓是业绩发布会上的高频词汇。 在张韶峰看来,百融云创能够成为国内率先找到生成式AI和决策式AI规模化应用场景,并且实现增收又增利的AI科技公司;同时,还在持续拉大领先优势,进一步加速生成有机利润,主要源于其AI技术优势和积累近十年的行业know-how在发挥作用。 算力可以买,行业know-how买不来,“对于我们在垂类行业做AI应用的科技公司来说,相比算力,行业know-how更为重要。”张韶峰说道。 行业know-how到底会释放多强的势能,张韶峰谈了以下两点: 第一,行业know-how决定了对于行业洞察的深度。张韶峰认为,与通用行业不同,垂直行业的AI技术赋能需要很深刻的industry know-how和domain knowledge。做好了这两点才能在领域内形成专有部署,才能不断优化模型,进而乘上规模化的良性飞轮。 第二,行业know-how决定了对于行业洞察的广度。众所周知,百融云创是以“AI+金融”起跑,经过多年的数智服务,百融云创的产品和解决方案可以覆盖金融领域的全生命周期,涵盖信贷场景、增量用户获取、机构资产端、财富场景、存量用户运营、机构负债端等等。 王牌二:一站式交钥匙秘诀:模型/算法与场景耦合 因为是To B公司,其主营业务又是没有实际触感的无形服务,这使得百融云创距离普通民众的生活比较远。但是在其服务的客户看来,百融云创的数智产品及解决方案却是实实在在可用、可感、可度量的。 曾经某家知名银行找到百融云创协助进行代发客群运营。代发难留存一直是银行财富管理中的一个普遍议题,数据显示,约有35%的代发客群会在三日之内将工资卡中80%的资金转走。 对此,百融云创建立了一整套从提升留存率、提升理财客户数、进而提升AUM的财富管理数智化解决方案。据悉,百融云创通过“客群洞察、智能策略、AI运营、敏捷迭代”的组合部署,触达该行近百万名代发客群,最终使得该银行的代发留存率有效提升2个百分点,接近行业优秀水平。 为什么银行不能自行建立财富管理策略?由于金融机构岗位设置等原因,银行营销体系中存在“堵点”,特别是在AI运营和敏捷迭代两大环节,银行无法为每名客户建立运营跑道,这样庞大的数智工程还是需要专业的人做专业的事。 为什么银行没有选择其他科技公司?答案是,一些AI公司重视算法和模型的开发,但是技术和场景之间存在一道“鸿沟”,这导致算法不能有效落地,无法实现场景闭环。 百融云创的解决方案来自超7000家机构客户的点滴积累,更为重要的是跑通了商业模式小闭环。张韶峰解释道,与其说百融云创是技术服务商,不如说是垂直行业的业务合作伙伴。“百融云创对于客户的要求是,说出你的KPI,我们协助完成KYP(了解你的产品)和KYC(了解你的用户)。”这也是其在业内持续扩围的关键,即从结果入手逆向设定解决方案,交付的是机构业绩,而非单纯的模型、算法。 王牌三:大模式时代的双轮驱动:决策式与生成式AI彼此增益 在ChatGPT爆火之后,AIGC这一概念才终于飞入寻常百姓家。在此之前,百融云创对于生成式AI技术在垂直领域的应用已经探索了很多年。该公司也是业内首批将基于Transformer的类ChatGPT语义理解技术进行规模商业化应用的公司。 但不同于唯生成式AI而论的科技公司,“百融云创的算法核心是融合决策式AI与生成式AI,一直走得是两种算法彼此赋能之路。”张韶峰说。 在构建客户经营闭环生态的过程中,上述两种算法缺一不可,即用决策式AI可以补齐生成式AI的预测精度;用生成式AI得以拓展决策式AI的创造空间。两种算法的合力才能串联起垂直行业、场景和客户,通过云+本地化部署等方式,为行业提供全体系服务。 百融云创自主研发的AI大模型——BR-LLM便是在传统决策式模型应用经验的基础上,结合生成式AI的技术特点,通过将多种AI技术进行集成,进而改善大模型泛化的问题,并防止过拟合。 张韶峰表示,决策式与生成式AI的彼此补充、增强,可以极大提升AI大模型的准确性及对各种场景的适应力。 同时,在两者的相互增益之下,百融云创云服务类业务稳健扩张,其在细分市场的领先地位进一步稳固。中报显示,公司以决策式AI为基的MaaS业务上半年收入达4.31亿元,同比增长24%,核心客户留存率维持98%的高位。 另外,公司基于决策式AI及对生成式AI技术进行深度探索形成的BaaS业务上半年收入8.12亿元,同比增长36%。其中,金融行业云收入4.92亿元,同比增长55%,撮合资产交易规模212.62亿元,同比增长72%。 “百融云创抓住AIGC机会迅速拓展应用端业务,将生成式AI与决策式AI有机融合,为银行、财富管理等机构提供一站式turnkey资产运营服务,上半年促成的交易规模已接近去年全年的体量。”张韶峰说。
《父辈的荣耀》穿过父辈的风霜雨雪 为那一座座青山
  《父辈的荣耀》以上世纪90年代的林业改革为背景,循着生活在三道沟林场的林业工人家庭生活轨迹,领观众回望林业变迁的来时路和生态文明的传承史。   三个少年人爬上护林小屋的瞭望塔——三道沟方圆几里地的制高点。城里来的晓晴为星散在白雪皑皑里的村庄兴奋不已,那是她眼中的童话世界,也是凤勤刚认识的“923”,是兴杰口中牵系着他的血脉、乡愁和此刻所有生命记忆的“小破村”。   《父辈的荣耀》在央视一套热播。年轻人命运的齿轮悄然转动,而对他们的父辈、祖辈,坚守了一辈子的山林正在酝酿剧变,一场持续近20年的改革、治理、建设徐徐拉开大幕。该剧由康洪雷任总导演,刘翰轩执导,赵冬苓编剧,张晚意、郭涛、刘琳等主演。故事以上世纪90年代的林业改革为背景,循着生活在三道沟林场的林业工人家庭生活轨迹,领观众回望林业变迁的来时路和生态文明的传承史。   如同瞭望塔上少年人的目之所及,曾经的原始森林渐渐后退,人工次生林取而代之,时代即将作出抉择。电视剧便融入时代的洪流、穿越父辈的风霜雨雪,讲述一段从过去到现在甚至通往未来的“人不负青山,青山定不负人”。   绵密的细节,引人回到那时那地   高天碧透,松涛万顷,莽莽山野绵延着壮美的原始森林。《父辈的荣耀》开篇即是一长段航拍镜头,从夏的万木吐翠到秋的层林尽染,从冬的茫茫雪原到春的遍野新绿,森林在镜头前随四季变幻新衣,东北林场的实景拍摄一下把观众带回那时那地——上世纪90年代、中国林业改革前夕的东北大地。   主创花了大力气营造准确的时代风貌。画面扫过林海雪原,往来运送木材的专用小火车、作业用的“爬山虎”、原始森林里响彻云天的“顺山倒”号子声……早些年东北林场的广袤又肃杀、威严又庄重扑面而来。镜头一推入“923”队的生活区,则是另一种气息。屋檐连着屋檐,从顾家的土房热炕、炊烟袅袅,到少年人看得正入迷的《大话西游》录像带,都透着浓浓的1990年代东北地域的烟火气。   故事里,顾长山是三道沟林场“923”队的队长。这天,他和媳妇那存花正张罗一桌“杀猪菜”,打算用当地饭桌上的至高礼遇对林业局局长动之以情。那是1997年冬天,随着国家采伐指标减少,林业局决定缩减上山伐木的人数,只给“923”队留20个名额。严重的僧多粥少,让本就生活吃紧的林业工人们日头恐怕更不好过。不承想,计划全部落空,局长没吃饭、没进门,留下饭钱,但对20个伐木名额丝毫不松口。减少采伐的消息在“923”队炸开了锅,有人忧心工作不保、生计成愁,有人望向远方改革开放的前沿、心痒难耐……人心浮动间,倒是顾长山的师父宋留喜看得明白,“我们第一批林场工人啊,当年把山林砍得太狠了”,他决心要把这辈子砍掉的三万六千棵树全都种回去。   哪怕没有开篇的年份标注,许多熟悉东北林业的观众也会明晰,一个转型的时代就要来临。1998年,一场特大洪水席卷中国多个流域,人们认识到森林生态系统的重要性。也是那一年,国家天然林资源保护工程开始实施,林业人即将付出巨大努力,为大山重披“绿衣”。在剧中,98特大洪水困住了陈兴杰迈入高考考场的脚步,梦想推迟实现的那一年,个人命运将在国家政策、时代进程的演变中悄然转轨。   任时间流转,理想与善良总是动人   从“猫冬”“伐林”“靠山吃山”到构筑生态屏障、发展林下经济、推行碳中和……《父辈的荣耀》书写时代的风浪呼啸、产业的探索与思考,而浓情笔墨落在“一家人”身上。   顾长山,林场“923”队的队长,也是家中一家之主。不过他家有些特别,并不完全以血缘维系。父亲操心继子顾兆成报名征兵的进度,收养因公殉职工友的孩子陈兴杰,就连被亲妈东藏西放的凤勤也在顾家把暂居过成了长住。甚至,孩子们嘴里的爷爷,是被顾长山“一日为师终身为父”侍奉在家的师父宋留喜。   一片屋檐下,三代七口人,五个不同的姓氏,亲情何以落地?前几集,一场“家人”间的互动,触到了观众内心深处。凤勤被二姨从山东送回故乡东北,不想,父母身边却是咫尺天涯。离家出走被寻回的那个夜晚,姑娘辗转难眠,披上外衣蹲到了炉灶前。不一会儿,陈兴杰、顾兆成也来了,柴火一爿一爿传递在三个少年人手中,没有台词,胜过千言万语。三个顾家的“外人”原本各自命运飘零,但因为顾长山、那存花夫妇的善良而有了家,因为家的守护,他们在这一冬夜的炉火前从此有了胜过亲兄妹般的亲睦。柴火亮堂堂透着暖意,内心有了可以停泊的港湾,漂流的孩子也能遥想未来了。   顾家日复一日的柴米油盐、真情以待酿出了独一份的情浓于血,也正是亲情总能通达人心,观众会为这一家三代人牵动情肠,惆怅着他们的惆怅、憧憬着他们的憧憬。譬如宋留喜,林场第一代工人,长达半个世纪的生涯里,他无怨无悔“献完青春献子孙”,青山于他,是一生夙愿,亦是生命归途。譬如顾长山,经历过林场的“鼎盛”时期,也正见证国家恢复森林生态的历史性变革,结束了赖以生存数十年的生产生活方式,放下斧和锯,他们这代林业人该往何处去,该如何在坚守山林的同时积极寻找新的生活方式,将撬动同样经历巨变、滚石上山的中年人的心思。又譬如陈兴杰,站在瞭望塔上的少年郎选了与小火车合影,因为运木材的小火车连着他的年少乡愁,更载着这片土地上的热望。             《父辈的荣耀》展开的时代图景与生活情感里,没有英雄的咏叹,但有父辈、祖辈闯过的关、跨过的坎儿,更有一代代年轻人把个人命运融于家国时代的理想主义。(记者 王彦)
MWC上海吹来三股热风:6G、元宇宙与数字万物
中国商报(记者 焦立坤 文/图)6月28日—30日,以“时不我待”为主题的2023上海世界移动通信大会(以下简称MWC上海)火热举行。大会聚焦“5G变革、数字万物、超越现实”三大方向。随着5G进入“下半场”,5G应用遍地开花,在这场亚洲最具影响力的电信行业技术盛宴上,一大批“未来”技术喷薄而来。中国商报记者在现场采访中发现,6G、元宇宙与数字万物成为展会的热词,各大科技公司纷纷秀“肌肉”。中国移动展台特设元宇宙板块。6G研发进入加速期6月29日,中国移动举行了一场6G协同创新论坛。该公司正式发布了6G公共试验验证平台,将为产业合作伙伴提供开放的、场景化的联合研发和试验环境,并支持各种新型业务和应用场景的验证,降低6G关键技术研发门槛,助力形成全球统一的6G标准。中国移动副总经理高同庆在会上表示,当前是确定6G技术体系和技术路线的关键窗口期,他建议加强技术融合创新,扎实推进原创技术策源地建设,强化商业趋势研究和需求牵引,确保6G的先进技术能够转化为产业和应用优势,做到不仅“上书架”,还能“上货架”。另外两个运营商也在积极部署6G。在MWC上海主论坛上,中国电信董事长柯瑞文表示,中国电信正在系统化开展6G智简网络架构创新,与标准组织和产业伙伴紧密合作,推动制定全球统一的6G国际标准。中国联通副总经理梁宝俊则表示,6G已经成为新一轮科技创新和产业变革的必争之地,中国联通后续的发展方向将会在以下三个方面:一是聚力挖掘应用场景,使6G能够真正成为运营商有效运营的6G;二是全力攻关关键技术,在6G统一网络架构、突破性理论体系、共性技术方面开展协同创新,形成6G统一国际标准;三是奋力推进融合创新。在业界看来,三大运营商的积极表态意味着6G技术研发已进入更快更深的节奏。距离我国5G发牌已4年,5G已经深入寻常百姓家,而关于6G的竞赛也持续升温。尤其是今年6月初,工信部部长金壮龙在第31届中国国际信息通信展览会上宣布,我国将全面推进6G技术研发,更是激发了业界的热情。中国移动首席科学家王晓云在MWC上海期间表示,当前国际电信联盟已经明确6G的愿景与指标体系,不久前工信部在全球率先将6GHz用于5G/6G系统,6G研发进入加速期。但相较5G而言,6G研发面临更多的挑战,比如6G研发周期更长、技术发散等。同时,6G网络的技术创新也面临需要原创技术突破、融合技术突破、网络拓展创新的“三重挑战”。观众现场体验VR游戏。元宇宙不再是雾里看花“你对元宇宙有信心吗?”面对这个问题,全球移动通信系统协会大中华区总裁斯寒的回答是:“我非常虔诚地相信。如果不相信,我是不会来参会的。”6月28日,斯寒出现在2023中国移动元宇宙产业联盟发布会现场。她认为,元宇宙尚处于早期发展阶段,正在内容、标准、终端等方面进行积极探索。中国移动及其众多产业生态伙伴无疑是这个领域的开拓者。当日,中国移动元宇宙产业联盟正式成立,集结了24个元宇宙的“头部玩家”,覆盖产学研金链条,重点聚焦元宇宙内容制作、XR终端、关键技术、算力网络四个方向。中国通信标准化协会理事长闻库表示,元宇宙产业联盟的成立为促进元宇宙技术创新发展提供了有益的思路和借鉴,也为加强行业交流与合作提供了良好的开放性平台。与此同时,在展会上,中国移动咪咕打造了一个体育元宇宙比特空间,云AR(增强现实)、视频彩铃、终极战甲、星际广场、比特骑行等创新产品向用户展示了一场极具沉浸感和互动性的“元宇宙奇幻之旅”。元宇宙是2022年中国科技界最火热的概念之一,它被视为数字技术的重要一环,吸引了各个领域的玩家入局。MWC上海传递的信号显示,元宇宙正从梦想照进现实。MWC上海期间还举办了一场别开生面的手机元宇宙论坛。中国联通华盛公司董事长王启明表示,元宇宙的最终形态还未被定义,这成为其最大魅力所在。目前虽然手机性能在变强,但手机的出货增速在放缓,与此同时,手机的形态从2007年后未作出重大变革,而性能也已呈现过剩趋势。在他看来,我国独步天下的5G网络已经具备了实践手机元宇宙的基础,同时用户进入数字世界的方式也呈现多元化趋势,所以元宇宙的明天将会是由应用来定义硬件,将来,无论是UGC(用户生成内容)、PGC(专业生产内容)还是AIGC(生成式人工智能)都将会使元宇宙变得更为生动。在业界看来,随着元宇宙概念的沉淀,元宇宙正从过去的“燥热”回归“理性”,业界对元宇宙的认知正逐步清晰:元宇宙是新一代信息技术的聚合体,元宇宙是信息化、数字化的最高境界,是信息文明的崭新阶段。与此同时,元宇宙发展还面临诸多挑战。MMI发起人之一、工体元宇宙创始人CEO葛颀表示,目前市场对元宇宙的需求和供给都处在一个高速发展的阶段,同时元宇宙市场也是一个非常灵性和匹配的市场。他认为,目前元宇宙面临三大难题,分别为技术可演进、商业可持续、体验可运营。“数字万物”扎堆亮相“数字万物”是这场技术盛宴聚焦的三大主题之一,万物互联正在深入生活的方方面面。VR(虚拟现实)/AR(增强现实)相关产品是展会上的一大看点。全球知名AR眼镜品牌XREAL的展台设计充满未来感。透过一副眼镜,体验者可快速感受到影院级别的巨幕显示效果,全球知名AR眼镜品牌XREAL的展台吸引了众多体验者。中兴通讯带来了全球首款GPT无线AR智能眼镜——nubia Neo Air,看上去与普通眼镜极为相似,实际上却是一款引入与GPT同类AIGC算法的智能眼镜,可以在演讲、直播、主持等场合通过眼镜镜片为用户提供文字提示,还能通过自带麦克风将采集到的语音信息进行实时翻译。手按到一台主机上,对着耳机说:“海上生明月”,几秒钟后,一幅由语音创作的画便会出现在面前。这款联想小绘AI语音作画产品也吸引了不少人。据现场工作人员介绍,其设计原理是通过语音交互和神经网络算法,将语言幻化成艺术想象画。此外,联想晨星四足机器人Q1也是全场的“明星”。这款机器人基于智能边缘计算技术,结合混合现实和计算机视觉技术,具备自主导航、自动避障功能,不论是室内的狭窄空间、上下楼梯,还是室外的巡检涉水、穿越草地,都能从容应对。在数字万物时代,消费电子与汽车两个行业的深度融合和超级协同已经成为发展的一个重要方向。星纪魅族集团将汽车开上了展台,搭载Flyme Auto智能座舱操作系统的领克08车型引来不少围观。“数字人直播”是一种新型网络直播技术。在中国联通展区,一名全真3D虚拟人电商主播吸引眼球,它可以像真人电商主播一样,进行商品介绍、售卖以及观众互动。据了解,这样的数字人已经出现在元宇宙课堂、元宇宙景区、元宇宙展馆、元宇宙营业厅等场景里。MWC上海虽然已经落幕,但数字时代的创新浪潮却在不断奔涌向前。
苹果秋季发布会定档9月13日,关于iPhone 15有什么值得期待?
凤凰网科技讯(作者/贾楠) 8月30日凌晨消息,苹果正式在官网宣布今年的秋季新品发布会将于北京时间9月13日凌晨1点举行。从目前已有的爆料看,新的iPhone 15系列将遵循欧盟法律更换为USB-C接口,同时Apple Watch及Apple Watch Ultra或将获得更新。 作为每年的秋季发布会最重要的新品,iPhone 15系列最受瞩目。综合目前的传闻,今年iPhone 15全系依旧包含四款机型:iPhone 15、iPhone 15 Plus、iPhone 15 Pro以及iPhone 15 Pro Max四款机型。iPhone 15 以及iPhone 15 Plus将采用与目前iPhone 14 Pro系列的同款A16仿生芯片,这也意味着灵动岛设计或出现在iPhone 15系列中。 传闻的iPhone 15全系配色 此外,iPhone 15 Pro以及iPhone 15 Pro Max或将采用全新的钛合金作为机身材料,机身整体变轻薄,同时屏幕正面采用微曲玻璃屏幕并进一步缩减屏幕边框。同时iPhone传统的静音按键将会被改为与Apple Watch Ultra的Action Button类似的按钮,以提供包括打开手电筒、激活快捷指令等多种自定义快捷操作。 iPhone 15 Pro系列的两款机型将采用最新的3nm工艺的A17仿生芯片,同时在长焦镜头上有所提升,其中iPhone 15 Pro Max或将支持潜望式长焦镜头。在配色上,有传闻称今年苹果或将取消Pro系列的金色配色,转而用类似钛金属灰的配色作为代替。 iPhone 15全系产品的尺寸将与目前的iPhone 14系列四款机型保持一致,同时或将依据欧盟法律从lightning接口更换为USB-C接口,其中iPhone 15 Pro系列的两款机型获支持USB 3.2或雷雳3等更快速的传输协议。另外有传言称,iPhone 15全系四款机型将采用更新后的超宽频(UWB)芯片,以配合即将于明年上市的Apple Vision Pro。 结合目前关于Apple Watch的传闻,由于今年watchOS 10有大幅升级改变,在硬件上Apple Watch Series 9将不会有明显的升级,Apple Watch Ultra第二代则会推出全新的黑色配色。 总的来说,今年的秋季发布会对于iPhone来说会是一次重要升级,同时作为苹果目前受众最为广泛的产品,iPhone与Apple Watch的变化与创新都备受期待,甚至会影响整个手机行业在未来一年的一些变化。
做不了YouTube的B站,试着变成抖音
近日,韩国放送公社KBS起诉B站侵权,相关案件将于10月11日和11月8日在上海市杨浦区人民法院开庭审理。 事实上,无论是“搬运”还是“二创”,都近些年使得B站频频陷入侵权纠纷。向B站追责的对象,既有爱奇艺、网易等一众互联网平台,也有以中超联赛、中职篮为代表的职业体育联赛等,还有尚雯婕、葛优等艺人。 但B站的二季度财报还是很漂亮的,总营收达53.04亿元,同比增长8%。为实现降本增效的一些举措,看起来也已经奏效。与此同时,B站也开始了对流量与变现的新思考,广告、带货或将成为其新的关键词。 频频坐上被告席 “收藏夹里好多综艺都消失了,我的快乐没有了。”准大一的何琪从拥有个人手机之后就成为了B站的重度用户。虽然平时不太看番剧,但B站上的Kpop(韩国流行音乐)内容却一直吸引着何琪。 何琪的B站关注列表中,几乎都是“搬运”和“二创”Kpop视频的博主。“以前哪怕是冷门的韩综,都能够找到及时搬运的博主。热门的如《无限挑战》《RUNNING MAN》《两天一夜》《新西游记》更是有大量的博主第一时间搬运,我通常会选择其中弹幕最多的来看,下饭搭子。”何琪说到。 不过最近,这些视频在B站上几乎看不到了,即便有,也只是很短的碎片视频。这或许与韩国放送公社起诉B站侵权一案有关。据报道,近日,B站关联公司上海宽娱数码科技有限公司新增两则开庭公告,原告为韩国放松公社KBS,案由均为侵害作品信息网络传播权纠纷,两案将于10月11日、11月8日在上海市杨浦区人民法院开庭受理。 2021年,韩国另一放送株式会社MBC电视台也曾以“著作权权属、侵权纠纷”为案由起诉过B站。 B站部分有关侵权的法律诉讼 图源:企查查 关于侵权这件事,B站一直深陷围城。一边是UP主“搬运”“二创”带来的社区活跃度,另一边则是不断缠上身的官司。 仅今年以来,B站就频频坐上被告席位。2月,尚雯婕和北京黑方金圆文化传媒有限公司新增名誉权纠纷案件开庭公示,B站关联公司为被告之一;同月,北京互联网法院向B站关联公司上海幻电信息科技有限公司公告送达起诉状副本、开庭传票等,关联案件为葛优与该公司网络侵权责任纠纷;6月,美商NBA产物股份有限公司、中超联赛有限责任公司追责B站;7月,杭州网易云音乐科技有限公司起诉B站,案由为侵害作品信息网络传播权纠纷。 这样的形式也展现出B站的困境,“UP主”们“二创”带来的日活用户数、月活用户数虽然可观,但变现能力有限。二季度财报显示,B站正式会员数达2.14亿,正式会员第12个月留存率稳定在80%,曾被B站重视的用户增长,如今已经进入平稳发展期。 如何继续推动商业化进程,则是B站当前的新课题。 B站带货的未来形态是怎样的? 在B站14周年庆直播中,CEO陈睿宣布B将之后将以统计播放分钟数替代B站播放次数作为外显数据。到了前几日,B站又对部分UP主开启播放时长指数内测。 这些变动的产生,让不少UP主开始了一番重新思考。直白地以商业变现角度来说,这两项指数都会影响到合作品牌对UP主的选择与传播效果的审视。 哔哩哔哩14周年庆 但从B站的近期动态来看,为了得到更显著的收入增长,B站一直在刷新自己的“种草”能力和交易能力。 具体的措施是,今年6月,B站进行了一次组织架构调整,整合了多个团队,成立新的一级部门交易生态中心,目的就是加强公司在商业化交易方面的基建。随后在618大促期间,B站推出“星火计划”,基于B站与阿里淘宝联盟的合作,通过数据分析实现种草链路的可量化。 除此之外,各路平台都垂涎的直播带货业务也被B站提上了日程。第二季度,B站上通过直播带货和视频带货获得收入的UP主人数同比增长超220%。 不少B站用户也发现,首页推荐的广告大量增加,一不小心就会误点广告视频。因此已有不少用户对此开始吐槽,表示“如果是看这类赤裸裸的带货视频,我为什么打开B站呢?” 这也正是B站当前在直播带货业务上探索时需解决的一大问题,社区与商业化之间的平衡是一项艰巨的挑战,做到既满足社区用户的调性,又满足商业化变现的规则,或许是B站带货的未来形态。 事实上,B站内容的生产成本较高,用户与UP主之间的“羁绊”很深,能够被量化的平台粉丝数实际上已经是被“提纯”的私域流量。加上B站去中心化的推荐机制,更是进一步巩固了UP主的私域流量池。 这意味着,B站直播带货从根本上与淘宝、抖音、快手等平台走的路径不同。今年618期间,拥有448万粉丝的B站“百大UP主”宝剑嫂开播首日单场GMV为2800万,明显与其他平台头部博主的带货成绩有着差距。 不过B站的决心可见一斑。第二季度中,B站游戏业务收入为8.9亿人民币,IP衍生品及其他业务收入为5.4亿元,同比减少10%。 B站副董事长兼COO李旎也在电话会议中表示,“B站全年广告收入有望实现同比25到30%的增长,双11大促期间来自电商行业的广告收入预计同比增长50到60%。” 看来,进一步提高广告与带货业务的营收占比,将是B站未来的主题曲。 硬核内容网站要找到自己的带货风格 今年的带货市场可谓热闹非凡。据“电数宝”电商大数据库显示,今年上半年,直播电商交易规模约为19916亿元,预计全年交易规模达到45657亿元,同比增长30.44%。同时,直播电商竞争格局不断变化,东方甄选、交个朋友先后“上市”;谦寻、宸帆等MCN机构陆续拿地盖楼。 今年上半年,直播电商交易额渗透率约为27.8%,全年预计达31.9%,增长率为26.08%,增速趋缓。直播电商用户规模约为5.2亿人。全年用户规模预计达5.4亿人,同比增长14.16%,增速上涨。2018—2022年直播电商人均年消费额为分别为296.95元、1775元、2822.58元、4639.68元、7399.58元。 近年来,直播电商成为了不少企业的新增长点,因此B站想要新增这条营收业务也是自然而然的事。不过,这次转型对于不少老用户来说,仍然是一件难以适应的事。 用户对B站带货的观感 锌刻度从微博、小红书等平台看到有用户评价B站:“有点小失望,本来以横屏出彩的B站,硬是直愣愣地竖屏带货,一个做硬核内容的网站想要找到自己的带货风格,任重道远吧”。 的确如此,相较于其他平台,B站过去的发展一直强调内容的纵深开发,用户的粘性培养。但跨界直播带货业务之后,选品价格、推送机制、用户消费力都很难有优势。 B站的商业化之路一直广为讨论,如今广告与带货业务的增长的确也能够带来一定的发展活力,然而从长远来看,直播带货虽火,但这块蛋糕几乎已被巨头瓜分殆尽,B站的入局如果讲不出更新的故事,那么可能很难持续带来增长。
第三个“百亿”发力,拼多多远超预期
拼多多的一个不成文传统是,每位CEO走马上任之后,都要围绕“百亿”做文章。 黄峥是把拼多多与“百亿”关联起来的人。他在2019年提出“百亿补贴”,大幅简化电商行业繁复难懂的优惠玩法,成功建立实惠的用户心智。 第二任CEO陈磊于2021年3月接棒黄峥,五个月后推出“百亿农研”,把未来几个季度的全部利润优先投入农业科技研发,推动拼多多向“重营销”向“重研发”转型,从根本上巩固农产品护城河。 到了今年4月,赵佳臻成为拼多多联席CEO,分管供应链和国内业务。他拿出了“百亿生态”,通过百亿规模的帮扶资金,以及站内流量等资源倾斜,推动中小企业、优质商家实现有质量的增长。 赵佳臻 对于商家而言,“百亿生态”意味着平台更大力度的资金、流量和资源扶持;对于消费者而言,则意味着更多物美价廉的高质量商品。 在赵佳臻掌舵拼多多国内业务的第一个完整季度,“百亿生态”开始发挥效力。 8月29日,拼多多发布2023年第二季度财报。报告期内,拼多多营收达522.8亿元人民币,同比增长66%。其中,在线营销服务及其他收入同比增长50%,交易服务收入同比增长131%。 在拼多多的营收构成中,在线营销服务收入指的是商家广告投放费用,而交易服务收入主要是平台抽取的交易佣金,与商家销售额挂钩。这两项收入的高速增长,意味着在“百亿生态”的加持下,拼多多商家的销售额大增,同时也愿意加大站内投放力度。 成本和费用方面,拼多多上季度营业成本达186.9亿元,同比增长134.8%,主要受到高速扩张的海外业务多多跨境的影响;销售、行政和研发费用总计208.7亿元,同比增长41%,明显低于营收增速;费用率为39.9%,为上市以来最低水平。 第二季度,拼多多营业利润为127.2亿元,同比增长46%;净利润为131.1亿元,同比增长47%;非美国通用会计准则(Non-GAAP)净利润为152.7亿元,同比增长42%。 盈利能力的大幅提升,为拼多多带来了更充沛的现金流。截至今年6月30日,拼多多持有现金、现金等价物和短期投资总计1795亿元,相比去年底增长300亿元。 据富途统计,拼多多上季度的营收和利润指标均大幅超越行业预期。二级市场应声而起,周二美股交易中,拼多多股价大涨15.43%至93.22美元,总市值超过1200亿美元。 拼多多最新季报并不令人意外。今年上半年,国内消费市场逐渐复苏,消费者在信心恢复的过程中,消费潜能加快释放。 不过,经历过前几年消费结构性升级的洗礼后,消费者对品质格外看重。他们不愿意支付过高的品牌溢价,却也不会为了追求价格,在品质上做出妥协。消费者真正需要的是“高质量平替”。 拼多多也看到了这一新趋势。今年第一季度,拼多多首次提出“高质量发展”战略,并为之配套“百亿生态”专项,从消费、供给和生态三方面入手,提升平台整体发展水平。 从第二季度业绩来看,“百亿生态”初见成效,赵佳臻履新后首战告捷。同时,消费者对于“高质量平替”的长期需求,逐渐成为支撑拼多多走得更远的基石。 01  根据国家统计局公布的数据,今年第一、二季度,居民人均消费支出保持同比增长,二季度累计增幅达7.6%,创下近一年新高。 大大小小的企业也感受到了这股暖意。在发布第二季度业绩时,拼多多董事长兼联席CEO陈磊表示,“在过去这个季度,我们观察到,消费者对多个产品品类的需求持续提升。” 不过,消费者在扩大支出的同时,对于“高质量平替”的需求也愈发凸显。 安信证券此前在一份研报中指出,中国当下面临的并非“消费降级”,而是“消费平替”,即供给侧的国货平替加速,需求侧的实用主义与理性消费成为新消费趋势。 安信证券新消费阶段的平替样本 例如,在餐饮领域,今年上半年最火的品类当属淄博烧烤。成千上万的外地人涌入这座三线小城,除了赶时髦、吃个新鲜外,人均五六十块吃到撑的实惠价格,也是淄博烧烤的魔力之一。毕竟,在大城市吃一顿丰盛的烧烤,往往需要每人100元以上的开销。 相对应的,那些依靠品牌、设计等撑起高溢价的商品不再受到追捧。以雪糕为例,素以高质高价闻名的钟薛高,正在竭力洗脱“雪糕刺客”的标签,发布了3.5元一支的平民新品。 一度流行各种高价进口产品的水果市场,同样兴起国产平替风潮。 今年上半年,日本静冈蜜瓜一度冲上热搜,起因是深圳某日料店给它标上了每片138元的天价。店方辩解道,这种进口蜜瓜的进货价高达四五百元一个。 但消费者很快发现,拼多多的同款蜜瓜每个仅售11.89元,每斤不到4块钱。即便是“精品蜜瓜”,在百亿补贴频道的售价也不过每个15.8元,比进口蜜瓜便宜了几十倍。 看穿天价蜜瓜背后的猫腻后,大量消费者直奔拼多多下单同款产品,一度导致“静冈蜜瓜”成为平台热搜词汇。 除了蜜瓜,榴莲也是“水果刺客”的老熟人。 国内进口榴莲大多产自泰国;今年5月,由于需求旺盛,泰国许多榴莲产区断货,导致国内进口量降至日常的1/10,市场价格飙升。 在此期间,还发生了快手大主播辛巴“封柜”的乌龙:辛巴在泰国高调直播带货榴莲,单日销量高达4800吨,市场上出现“辛巴垄断榴莲市场”的传闻;随后,辛巴团队和广州市场监管部门先后否认了这一说法。 不过,在不少城市,阶段性的供需失衡的确导致榴莲涨价。据中新网5月中旬报道,一位上海消费者吐槽,榴莲“上上周23.5元一斤,现在35元一斤”;北京新发地批发市场的一位批发商也证实,“一些好货每箱(32斤)拿货价达到900多元,在往年这个时候是不可能的。” 线下渠道的高昂售价,促使消费者转投线上,而电商平台也提供了针对性补贴。以拼多多为例,其百亿补贴3人团、万人团等活动先后上线泰国金枕榴莲,单果售价拉低至30多元。 面对日本静冈蜜瓜、泰国金枕榴莲这样的高品质商品,消费者并没有捂紧钱包、放弃或减少购买,而是更理性地选择国产平替,或是通过电商渠道购买,省去一大截销售渠道溢价。这种消费观念并不是单纯为了省钱,而是源自对于“高品质平替”的追求。 电商平台也看清了这一逻辑。今年7月初,拼多多上线“水果自由消费季”,对榴莲、蜜瓜、荔枝、椰青、菠萝蜜、百香果、阳光玫瑰等高价水果进行重点补贴。 拼多多相关负责人表示,这次活动是为了帮助消费者告别“水果刺客”,让高档水果回归平价消费,而不是让广大消费者为消费概念买单。 02 要想完成优质商品的“高质量平替”,并不能一蹴而就。 以蜜瓜为例,要想把日料店138元一片的静冈蜜瓜卖到每斤4块钱,牵涉到产地引进、国内培植推广、供应链和消费链路升级等方方面面,需要产区、商家和平台的合力。 据拼多多蜜瓜商家张胜杰介绍,国内各大水果产地许多年前即已引种静冈蜜瓜,经过多次改良后,口感已超越进口产品。“所谓的静冈蜜瓜在国内其实很常见,只是叫法不同,比如山东的品种叫‘鲁厚甜’。” 张胜杰表示,蜜瓜的收购价格约为每斤2.8~3.5元,完全可以做到低于4元的零售价。只不过,蜜瓜属于小众水果品类,存在一定程度的信息不透明,从而导致线下渠道价格高企。 但在拼多多等电商平台上,供需双方的中间环节大幅减少,信息差被抹平,再加上平台补贴,消费者下单的价格几乎是产地价。静冈蜜瓜终于走下神坛,被国产高品质水果平替。 这也意味着,“高品质平替”离不开电商对于供应链的整合重塑。以金枕榴莲为例,许多商家专门在泰国建立果园和工厂,确保榴莲从原产地直达消费者餐桌。在这套模式下,每个金枕榴莲的拼购价格只有30多元,而在线下渠道,同等规格的流量售价超过100元。 蜜瓜、榴莲等水果只是“高品质平替”消费潮流的一个缩影。为了将更多农产品及其他商品纳入这股潮流中,拼多多把高质量供给和消费作为出发点,过去两个季度动作频频。 南国食品的工作人员在拼多多直播间介绍黄灯笼辣酱。摄影 余东升 在供给侧,今年第二季度,拼多多“农云行动”深入山西运城、四川成都、陕西西安等水果大产区,以及湖北潜江小龙虾、福建霞浦海产、山东金乡蔬菜、苏州大闸蟹等农产带,为当地商家提供电商运营专场培训,以及一对一定向运营指导,推动农特产的标准化、品牌化、数字化发展,建设数字化新供给。 对于农产品之外的其他品类,拼多多主要靠“百亿生态”专项提供助力,具体措施包括推出百亿规模帮扶资金,支持并帮扶优质商户、品牌及中小企业;通过流量等资源倾斜,辅助产业带商家建设“数字化新供给”;通过爆品打造、加“数”发展、推动中小企业、优质商家实现有质量的增长等。 另一方面,拼多多也在需求侧推动高质量消费。今年第二季度,拼多多继续加大对优质农产品的补贴力度,百亿补贴农产品的销售额同比增长80%;在农产品零佣金政策的支持下,入驻百亿补贴的涉农商家同比增长60%,覆盖全国超百个农产区。 此外,拼多多也加大家电、数码、美妆等品类的补贴。618电商大促期间,在补贴福利的刺激下,拼多多美妆品牌细分类目销量最高增幅超过790%;县域市场手机订单量同比增长130%;家电品牌的全品类销售规模同比增长113%。 除了物美价廉,高质量消费的另一层含义是好服务。拼多多今年把绝大多数品类从支持72小时发货升级至支持48小时内发货;并与邮政等快递企业合作,开通新疆包裹中转集运包邮业务,大大降低了新疆订单的运费成本,进一步减少商家因运费贵而不发货、不包邮的情况。 供给和消费侧的高质量发展,促使用户在拼多多购买更多商品。根据拼多多的数据,过去在拼多多消费额不足500元的群体,今年上半年消费额上涨了近2倍。与此同时,“百亿补贴”频道今年上半年用户数和品牌数增长明显。 03 除了供给和消费,拼多多“高质量发展”的第三个维度是高质量生态。 得益于平台模式,拼多多电商生态拥有足够宽阔的广度和价格区间。不同行业和地域的商业提供了多元化的商品供给,而平台以“优质低价”为基础的流量分发机制,也让那些真正物美价廉的商品更容易脱颖而出。 不过,庞大的电商生态意味着平台治理难度的提高。拼多多作为规则制定者和维护者,不仅需要维持平台生态的繁荣,更需要引导商家良性竞争,避免“劣币驱逐良币”。 上个季度,拼多多围绕高质量生态出台了一系列举措,包括发布新版《拼多多商品描述及质量抽检规则》《拼多多图书市场管理规范》《拼多多直播经营管理规范》等。商家在平台内做生意,边界更加明晰,奖惩机制也更加完善。 同时,拼多多也在通过技术手段,加强违规内容的巡查与清理。截至目前,平台合计清理低俗广告图片逾10万条;处置饰品、家居摆件等品类的违规商品超30万件;下架危险化学品商品链接3000多条。 此外,拼多多启动未成年人保护专项,从未成年人账号认定、青少年浏览模式、购物下单限制和正面内容引导四方面入手,禁止未成年人下单购买诸如成人用品、账号代充值、处方药、医疗美容等商品;并在各大电商平台中率先禁售亚硝酸盐,以及非厨刀具的实名制购买。 如果说发展高质量供给和高质量消费是在“踩油门”,那么拼多多投入大量资金资源的高质量生态,就相当于必不可少的“方向盘”和“刹车”。一个充满活力又秩序井然的电商生态,不仅是维护消费者权益的基石,也是本分做事、合法守规经营的商家的生长土壤。 在8月29日的第二季度财报电话会议上,赵佳臻表达了这一观点:“只有把平台生态管理好,塑造良币驱逐劣币的大环境,优质商家才能得到更多成长机会,用户才能获得更多增量价值。” 从供给、消费再到生态,拼多多高质量发展的“三位一体”初步成型。高质量发展能够带来更多品质优良、价格实惠的商品,从而在理性消费的新趋势中,为消费者的“高质量平替”提供更多选择。 对于拼多多而言,高质量发展是一套在过往基础上升级而来的增长飞轮:平台与商家双向奔赴,以更高效的供应链、更精准有力的补贴提供更高性价比的商品;消费者买到平价好物,实现“高质量平替”;商家获得更多订单和销售额,拿出一部分利润在站内做营销,推动平台收入增长,进而促使平台继续加大对于高质量增长全链条的投入。 从最近几个季度来看,拼多多已经在驱动这套飞轮转动;上一季度则是对这套发展哲学的梳理总结,将其上升为公司战略,并迅速反映在了经营和财务业绩中。正如赵佳臻所言,“加速高质量发展转型与整体生态质量建设,不仅从长期来看是好事,短期也会得到消费者和商户的正向反馈。” 不过,拼多多接下来的挑战仍然不小:国内主要电商都在把价格作为核心竞争力,而第三方商家也再度成为争夺重点。在愈发白热化的行业竞争中,拼多多能否守住高质量发展的初心,避免跑偏,将是陈磊、赵佳臻等人的长期考题。
Meta举行虚拟键盘打字比赛:最快每分钟可敲出119个单词,扎克伯格不是第一
IT之家 8 月 30 日消息,Meta 公司的技术总监 Andrew Bosworth 在最近的一次在线问答中,分享了他使用虚拟键盘打字的惊人速度,达到了每分钟 119 个单词。 扎克伯格在 Instagram 上也发布了一个视频,展示了一场基于计算机视觉和混合现实技术的打字比赛,称 Reality Labs 的研究成果可将任何平面变成虚拟键盘。Meta Reality Labs 是 Meta 公司的一个部门,专门研发先进的 VR 和 AR 技术、硬件原型和测试版软件,这些产品可能永远不会面世,但它们展示了 Meta 公司的技术潜力和未来的愿景。 视频显示在一个桌子上贴着一个大型二维码,比赛者将手放在桌面上,手指敲击着虚拟按键,屏幕上显示出快速出现的文字。Zuckerberg 在帖子中提到,他取得了每分钟 100 个单词的打字速度,而 Bosworth 则以接近 120 个单词的速度赢得了比赛。Bosworth 后来在他的问答中澄清,他的速度是每分钟 119 个单词,准确率是 98.9%。他的第一次尝试速度明显低于此,大约是每分钟 70 个单词。在“放开自己”并克服心理障碍后,才取得了 119 个单词的成绩。 IT之家注意到,Meta 公司最近为 Quest 用户提供了一个滑动键盘,使用手柄时体验不错,但是只用手时,如果移动太快,准确性就会受到影响。 Meta 研究团队没有透露这个混合现实键盘何时或是否会为消费者提供。值得注意的是,Reality Labs 使用了 Quest 2 头戴式设备,但是可以看到有一根线缆连接着电脑,这表明需要一台电脑来运行这项技术。
开源声音与音乐生成模型AudioLDM2,只需提供文本即可生成高质量音频
站长之家(ChinaZ.com)8月30日 消息:最近,一款优秀的开源声音与音乐生成模型AudioLDM2在 GitHub 上引起了关注。这个模型的运行速度很快,可以生成节奏、音效和基本对话。它操作简单,并具有强大的提示样式鲁棒性。 该模型采用了先进的隐式扩散模型AudioLDM,可以生成高质量的音频。用户只需要提供文本描述,就可以让模型自动生成对应的音频。 项目地址:https://github.com/haoheliu/AudioLDM2 相比传统的 Concatenative 方法,该模型可以生成更流畅连贯的音频。同时,相比基于GAN的方法,它生成的音频质量更高,更符合文本描述的语义。 该工具提供了命令行接口和网页应用,非专业用户也可以轻松使用。用户可以选择不同的模型检查点,生成不同风格的音频。同时,调整随机种子也可以生成不同的音频样本。 总之,这是一个强大且易用的文本到音频生成工具,可以广泛应用于音乐创作、音效生成、语音合成等领域。它极大地降低了音频内容生成的门槛,对创意行业有重大帮助。 该模型的出现,无疑为音频处理领域注入了新的活力,并为相关行业提供了一种全新的解决方案。未来,这个模型的应用领域还可能进一步扩展,为我们的生活带来更多惊喜。
谷歌CEO皮查伊解释为何急于发布AI产品:内部势头太猛
8月30日消息,美国当地时间周二,谷歌首席执行官桑达尔・皮查伊(SundarPichai)向全体员工发送电子邮件,解释了该公司急于发布人工智能产品的原因。他称,这反映了公司内部的“势头”。 在这封电子邮件中,皮查伊介绍了将在本周开幕的年度云计算大会 (CloudNext) 上发布的一系列新公告和产品。 皮查伊还强调了公司内部的其他变化,比如 YouTube 与音乐行业合作,共同开发生成式人工智能的原则。 皮查伊在电邮中写道:“我看到谷歌的进步随处可见。” 去年底,OpenAI 的 ChatGPT 的出现使谷歌受到了震动,此后谷歌以极快的速度开发和推出了生成式人工智能产品,包括其 Bard 聊天机器人。 今年 4 月,谷歌宣布将其一个重要的人工智能研究团队与 DeepMind 合并,DeepMind 正在开发一种名为 Gemini 的新人工智能模型,可能对 OpenAI 构成威胁。 皮查伊还在邮件中透露了将在“几个月内”推出的新硬件产品。 谷歌拒绝发表评论。 以下是电子邮件全文: 大家好! 我们将迎来令人兴奋的一周,整个公司都充满了即将发布新产品的喜悦之情。 今天早上,我们在 Cloud Next 大会上分享了如何帮助谷歌云的客户利用人工智能解决问题并开展新的方式。我们不仅将最新的生成式人工智能技术应用于我们自己的产品中,还将其提供给企业和开发者使用。数万名开发者已经在 VertexAI 中使用了 100 多个模型,这是谷歌云构建生成式人工智能应用的平台。现在,我们正在扩展 VertexAI 的功能,使客户能够自定义、集成和深度部署基础模型到应用中。 我们还分享了有关 Duet AI 的一些消息,这是我们的智能 AI 协作伙伴,可以帮助您在 Workspace 和 GoogleCloud 中高效完成工作。已经有超过一百万人在 Workspace 中测试 DuetAI,用于撰写电子邮件和文档、创建自定义表格以及在幻灯片中生成图像。感谢他们的反馈,自从 I / O 大会上发布以来,我们已经能够迅速改进产品。现在,DuetAI 在 Workspace 中已经全面推出,而在 GoogleCloud 中的预览版也进行了扩展,并与更多的产品和服务进行了集成。它现在可以帮助组织进行专业级编码、构建和提取数据库信息,甚至可以成为网络安全顾问。你们可以在 Go / Cloudnext23 上观看主题演讲,了解更多关于 CloudNext 大会上的所有公告。 谷歌云对很多人和组织产生了巨大影响。通过团队的辛勤工作和深思熟虑的投资,托马斯(ThomasKurian,谷歌云 CEO)和他的团队已经将谷歌云打造成真正的行业领导者,而我们还只是刚刚开始。 我在谷歌内部看到这种进步无处不在:从 Google Research 和 GoogleDeepMind 的研究团队,到我们改进搜索生成体验的最新成果,通过新的内联定义、AI 支持的概览、更低的延迟,使人们更容易从网络上查找和理解信息。自从上个月将 Bard 扩展到更多国家和语言以来,我们收到了更多有益的反馈。我个人也发现与 GoogleLens 整合的图像提问功能非常实用。在 YouTube 方面,团队与音乐行业合作,共同开发支持创意表达的 AI 功能。而在几个月后,我们的设备和服务团队将推出最新产品。这种势头是全公司各个团队辛勤工作的结果,感谢大家! 下个月,我们将迎来谷歌成立 25 周年。看到谷歌员工延续着早期的乐观、雄心和速度,继续从事重要的工作,这让人感到非常振奋。期待在我们的生日月份庆祝这一里程碑,期待我们还有很多重要的工作等待着我们。 桑达尔
好消息,AI暂时还没能取代人类
自ChatGPT出现后,业界掀起了一股AIGC的热潮:在用户端,从文心一言到妙鸭相机,新的应用层出不穷,并迅速成为朋友圈爆款;在企业端,出现了大量可以辅助企业进行管理、工作的“AI+SaaS”服务项目,宣称可以替代掉大量重复性工作。 一时间,AI可以取代文案、设计师、主播等职业的说法甚嚣尘上,到底哪些职业会率先被取代——人们陷入热切讨论,被搅得人心惶惶。 不过,在小半年的营销、直播实践中,人们逐渐发现了AIGC的短板,而第一波研究大模型的AI独角兽企业Jasper,在近日也曝出了裁员的消息。 AIGC的美好未来,似乎还没有完全到来? 未来——先等等,还没来 至少在AI直播这一领域,距离AIGC掌控一切的未来还很遥远。 宝尊电商副总裁Ricky在7月20日举办的社趣邻居“AI赋能新消费”峰会上,对自身的AI直播实践做了分享和展示。 目前,AI直播分为全自动直播和AI中置人直播,前者无论是主播形象还是内容都由AI一手操办,后者则以技术手段提取并模拟真人的样貌、动作,文本内容仍然是AI播报,可谓是“画皮”型直播。 新零售商业评论摄 Ricky表示,AI直播的优势,一是相对于真人直播降低了近一半的成本,二是可以24小时“工作”,三是不遗漏消费者留言,可以一一准确回复,四是可以规避口误等直播风险。 但实际上,一张AI直播、AI加真人直播以及完全真人直播的GMV数据对比图,就足以让品牌们暂时打消完全用AI替代真人直播的念头——情感更丰富、更有真实互动感的真人,在引导消费者下单的能力上取得了压倒性的胜利。 AI直播、AI加真人直播以及完全真人直播的GMV数据对比,新零售商业评论摄 由此,Ricky认为,目前AI直播暂时只能作为真人直播的辅助手段,还无法完全取代真人。 同样,国内不少打着有AI助教旗号的教育类产品,如多邻国、流利说、作业帮、猿辅导等,在解题、辅导教学等专业能力上或许早已超越了真人的响应速度,也能给出千人千面的教学方案,但在情感连接上始终还是差了不少。 事实上,情感价值对消费者来说是不可或缺的。 无独有偶,在文本创作和图片制作方面,不少企业渐渐发现,AI没有那么好用。 自ChatGPT横空出世以来,李睿(化名)就再没接到过为某广告咨询公司做文案优化的活计——这本是他较为稳定的兼职工作,涵盖了品牌介绍、产品优势提炼、使用指引等大量的文案内容。 他一打听,原来这家公司的员工正在努力“调教”ChatGPT,希望以后能由AI替代李睿的工作。李睿虽感无奈,但也知道这是大势所趋,毕竟,AI相对人来说真的很便宜,还能取之不尽、用之不竭。 谁知,三个月后,这家公司重新找到李睿,希望继续合作。 原来,要让AI生成一段文字、一张图片,首先要“喂”给它大量且较为准确的文字信息,不然AI可能会生成风马牛不相及的内容。即便AI完成了创作,也还需要人工花不少精力去修改、完善内容…… 此外,ChatGPT来自美国,还不太适应中文的语言环境,而国内的文心一言、讯飞星火,又不够成熟,经常写出大段言之凿凿实则胡说八道、前言不搭后语的“废话文学”,需要人来重新编辑。 “AI用起来太费劲了,他们觉得还不如继续找我写。”李睿耸耸肩,脸上难掩“AI也比不过我”的得意之色。 许多AIGC内容皆是如此,有用户告诉新零售商业评论,作为一名插画师,她对AI绘画工具Midjourney新鲜了好一阵,但后来越看越觉得:“它做出来的图总是带着一种‘失真的美感’,渐渐就无法吸引我了。” 而她的插画师朋友普遍对AI绘画带有敌意,认为威胁到了画师的职业生存环境,也破坏了艺术创作行业的生态平衡。 如果把AI比作一柄利剑,要达到它与人类“人剑合一”的状态,还有很长的距离。 一柄双刃剑 许多产品如今已经把加入AI技术当成了一种营销手段,更像是为了吸引消费者而在产品中加的“佐料”。 AI的名头也确实火。要在刚上线一周的妙鸭相机小程序上制作一个自己的数字分身,需要等待超过8小时,而一周后,这个时间仍然超2小时,这热度谁不眼红? 但妙鸭相机的热度恐怕也不会维持太久,这几年来我们已经见过太多“一夜爆红,二夜被山寨,三夜就失宠”的短命爆款产品。 这些产品是有其价值所在的:让更多人看到某个新技术、新模式,也让行业了解了自己的红线应该划定在哪。 技术是一把双刃剑,AIGC也具有反噬品牌、平台的力量。 首当其冲的是数据安全和隐私保护问题。 被消费者诟病最多的便是AIGC服务,即AI客服。现在,你可能会在一天内接到三四个来自AI客服的问候电话,他们用毫无波澜的语音语调,询问你是否需要万用金或是拉高信用卡额度,是否对某个产品感兴趣,是否很久没光顾过某家旗舰店…… 有时候,你回答慢了半拍,它们就会无情地重复一遍之前的话术,任你如何打断都无济于事,最好的办法唯有挂断电话。 “我现在对用AI客服的品牌、平台都没有太多好感——感觉他们一点都不真诚。”一位受够了AI客服的消费者向新零售商业评论抱怨,“我觉得他们在监视我的一举一动,自以为是地为我提供所谓我需要的服务,让我有一种生活细节都被暴露的感觉……” 除此之外,当真需要客服解决困难时,这些AI客服又“只会说车轱辘话,不但不能很快解决我的问题,还给我添堵”。 此外,消费者们也担心有诈骗组织会利用AI合成自己的肖像、声音,对自己的亲人进行诈骗。“自己的肖像、声音、指纹等信息,其实都保存在互联网平台中,这些信息一旦暴露,后果不堪设想。”上述消费者表达了自己的担忧。 其次是版权与确权的问题。 今年5月,有人制作出AI孙燕姿,并演唱了周杰伦的歌,播客“乱翻书”主播潘乱和ACE虚拟歌姬创始人郭靖就此探讨了版权的归属问题——词曲版权应该仍属于周杰伦,AI孙燕姿只是一个演唱该歌曲的“乐器”,而这个乐器的制作方不能用“孙燕姿”的名义发布歌曲,不然就是侵犯了孙燕姿的权益。 图源乱翻书播客 同样发生在今年5月,杭州互联网法院就我国第一例虚拟数字人侵权案做出一审判决,认定被告杭州某网络公司构成著作权侵权及不正当竞争——该公司擅自使用了另一家公司制作的数字人视频进行牟利。最终,该公司被判赔偿12万元的经济损失。 对于此种风险,抖音干脆先一刀切——封杀了全自动的AI直播间,并紧随其后发布了AIGC平台规范,规定AI声称的内容必须打上相应的标识,以区分真人和AI生产的内容。 而大众点评等本地生活平台也开始打击AI生成的大量评论、种草内容。 事实上,AIGC本身的商业模式前景也并不明晰,目前还处于烧钱跑马圈地的阶段。 比如,研发出Jasper单一模型的公司在近日宣布裁员,而ChatGPT背后的OpenAI日子也不好过,据媒体援引知情人士的话说,由于ChatGPT的开发工作,以及从谷歌聘请了关键员工,2022年OpenAI的亏损大约翻了一番,达到约5.4亿美元。 AIGC的“冷静期” 很多人误解了AIGC的用途。AIGC诞生的本意是辅助人类,而非取代人类。 ChatGPT和Midjourney本质上是通过大数据生成符合描述的文字、图像,把大量枯燥的、重复性的工作内容替代掉,让人类去做更有创意、更具决策性、且AI想不到的事。 “AIGC只是在做选择,而不是创造。”《乱翻书》主持人潘乱如此说道。 AI Talk创始人汗青则认为,AIGC行业的从业者目前分成两派。一是追求模仿派,指通过AI做成很像真人产出的内容,但他认为这只是AIGC的第一阶段,也是目前AIGC行业大部分人在做的; 另一派是激发创造派,指利用AI技术激发人类艺术的新的可能性,创造出更多突破人类想象的艺术内容,但要达到这样的境界,或许还需要积淀一段时间。 业内狂欢之后,AIGC进入了相对的“冷静期”,行业发展更加平稳,行业规范和法律的边界也会越来越明晰。 第四范式联合创始人胡时伟认为:“一项技术之所以在爆火之后引起质疑或销声匿迹,是因为它无法满足大众对于 ‘技术应该为生产生活带来巨大的改变’的预期,而往往在沉寂期是技术冷静下来,真正带来价值、产生沉淀的部分。”他还表示,AI产生价值的趋势会“一浪高过一浪”,而“每个波峰之间的距离在逐渐缩短”。 AIGC无疑还会继续发展下去,只不过会更加润物细无声地影响着每个人的生活,成为一个更加无所不在的存在,而人们也会逐渐适应和AI互相配合的工作与生活模式。 对此,你期待吗?
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
谷歌第五代定制张量处理器(TPU)芯片TPU v5e用于大模型训练和推理,训练和运行AI模型的速度提高了5倍。 当地时间8月29日,谷歌在旧金山的年度云会议Google Cloud Next上发布了新的人工智能芯片,即第五代定制张量处理器(TPU)芯片TPU v5e,用于大模型训练和推理。与上一代芯片相比,TPU v5e每一美元的训练性能提高2倍,每一美元的推理性能提高2.5倍。 TPU是谷歌为神经网络设计的专用芯片,TPU经过优化可加快机器学习模型的训练和推断速度,2016年推出第一代TPU,2021年发布第四代定制处理器TPU,2022年面向开发者提供。云TPU(Cloud TPU)是一项谷歌云服务,适合训练需要进行大量矩阵计算的大型复杂深度学习模型,例如大语言模型、蛋白质折叠建模和药物研发等,帮助企业在实现AI工作负载时节省资金和时间。 此次推出的TPU v5e专为中大型模型训练和推理所需的成本效益和性能而构建。谷歌云表示,该版本芯片的开发重点是效率,与上一代TPU v4相比,TPU v5e每一美元的训练性能提高2倍,每一美元的推理性能提高2.5倍,而成本不到TPU v4的一半,使得更多组织能够训练和部署更大更复杂的AI模型。客户不需要通过牺牲性能或灵活性来获得这些成本效益。谷歌云将TPU v5e描述为“超级计算机”,最多允许256个芯片互连,总带宽超过400 Tb/s,支持八种不同的虚拟机配置,客户可选择合适的配置服务于各种大语言模型和生成式AI模型。根据速度基准测试,在TPU v5e上训练和运行AI模型时速度提高了5倍。 据科技媒体TechCrunch报道,谷歌云计算和机器学习基础设施副总裁兼总经理马克·洛迈尔(Mark Lohmeyer) 表示,“这是迄今为止最具成本效益且易于访问的云TPU。” 洛迈尔强调,谷歌云确保用户能够将其TPU集群扩展到以前无法达到的水平,让客户能够轻松扩展他们的人工智能模型,超越单个TPU集群的物理边界。也就是说,单个大型人工智能工作负载可以跨越多个物理TPU集群,扩展到数万个芯片,并且经济高效。“在云GPU和云TPU方面,我们为客户提供了很多选择和灵活性,以满足我们看到的人工智能工作负载的广泛需求。” 除了新一代TPU,谷歌云还宣布将在下个月推出基于英伟达H100 GPU的A3系列虚拟机,作为GPU超级计算机进行交付,为人工智能大模型提供动力。
AI+云计算共生共长,能否解锁下一个高增长空间?
在过去近一年的时间里,AI大模型从最初的框架构建,逐步走到落地阶段。 然而,随着AI大模型深入到千行百业中,市场开始意识到通用大模型虽然功能强大,但似乎并不能完全满足不同企业的个性化需求。 大模型技术的安全性、解释性、易用性等综合指标正在成为此轮AI竞赛的关键,部分企业不再执着于大模型的开发,而把目光向普惠式AI、生成式AI+多云、大模型的私有化部署等多种商业模式。 01 AI与云计算迎来大融合时代 从诞生起,云计算一直被认为是未来的发展方向、互联网企业们的“第二增长曲线”。 但是,受互联网增长红利见顶以及政策监管趋严的影响。从2021年开始,原本处在高速增长阶段的云服务商们纷纷陷入了增速放缓的阶段。从高峰时的超过50%的增速,一路跌至2022年的20%,甚至更低。 全球产业需求的消退,导致云计算行业增速失调。根据研究机构TrendForce今年2月的预警,Meta、微软、谷歌、亚马逊这四家云厂商的服务器采购量可能从年增6.9%放缓至4.4%。 不过,拐点很快到来。在ChatGPT出现后,即使行业需求放缓,国内外云服务商们也在积极将业务重心转移至AI领域。 可见云服务商们逐渐从上半场的“求速度”转变为落地于产业深处,去寻求更高的价值增量。 随着第一波上云的完成,企业正在进入深度用云阶段。AI与云的结合不仅能够进一步降低企业上云的门槛,还能为企业实现业务深度的智能化。 根据Gartner《2022年人工智能技术成熟度曲线》报告,尽早采用复合型人工智能(AI)、决策智能等AI技术将给企业机构带来明显的竞争优势,缓解AI模型脆弱性引发的问题,有助于捕捉业务背景信息,推动价值实现。 今年4月中旬,阿里云智能首席商业官蔡英华对外表示,算力的飞速发展使数字化成为确定,使智能化成为可能。 未来阿里云将以云计算为基石,以AI为引擎,参与到从数字化迈向智能化的划时代变革中。 02 AI走向普惠的一大步 英伟达第二财季的业绩惊艳众人,其背后是生成式AI革命中,行业对高性能算力的迫切需求,然而现在,昂贵的算力成本下,AI大模型似乎仍是个“富人游戏”。 面对GPU价格的暴涨与未来可能到来的“算力荒”,大公司砸钱囤卡,尚可悠然步入AI竞技场,而中小企业没有“钞能力”,在发展AI模型、应用过程中,更容易受算力制约。 拿什么来拯救AI算力资源极度不均衡的现状?如何让更多创业者参与到大模型的市场竞争中? 作为全球GPU龙头供应商、此轮AI热潮最大的受益者,英伟达给出了破局之道——算力租赁。 今年3月,英伟达正式推出算力租赁服务方案“DGX云”,该方案由英伟达与微软云、谷歌云、甲骨文等全球top10的云服务商共同打造,企业通过一个浏览器就可以按月租用英伟达DGX AI超级计算机,不需要采购与拥有服务器设备。 事实上,英伟达DGX云并非AIGC产业首例,但由于DGX AI超级计算机的杰出性能,DGX云将AIGC云算力产业推向了更高的起点,该服务推出标志着AI云算力进入新阶段。云算力采用“化整为零”的方式赋能产业链各方,具备可持续性。 算力租赁,即对算力进行出租,是一种通过云计算服务提供商租用计算资源的模式。算力生产商与云平台的合作由来已久,用户可以通过阿里云、腾讯云等平台租用英伟达的显卡与AI处理器。 对于英伟达与云服务商来说,算力租赁是实现双赢的策略。 全球第七大云服务商甲骨文是最先响应英伟达DGX云计划的大厂,该公司于2022年10月将英伟达加速计算堆栈工具(包括GPU 、系统、软件)迁移到其IaaS业务的旗舰产品——云服务平台OCI(Oracle Cloud infrastructure)上。 从最新的季报数据来看,这对甲骨文的业绩有非常显著的拉动作用。 2023年第四财季(自然年3月1日-5月31日),其云业务(IaaS+SaaS)营收达44亿美元,同比增加54%;其中,IaaS业务营收14亿美元,同比大增76%,云厂商中单季度云业务增收增速第一。 于英伟达而言,这亦是一笔回本周期短且毛利率可观的生意。 以A100(80G)租赁服务为例,A100(80G)显卡单价成本取10万元,现假设每张卡都得到充分租用,则按照2023年8月19日国内云算力平台租用A100(80G)服务器的均价15.1元/小时,考虑到各大平台竞争客户,经常性推出优惠活动,则假设平均实际租金为7.6元/小时,投入10亿元资金的实际回本周期为1.5-2年,按照平台最低定价计算,毛利率至少为46.3%。 目前,英伟达正积极拓展“朋友圈”,与领先的云服务商联合托管DGX云基础设施,甲骨文之外,微软Azure也已开始托管DGX云,这项服务还将在不久之后扩展到谷歌云。 基于算力租赁,用户只要按需付费,不用承担硬件设备的采购、维护、升级等费用,也不用担心设备闲置或者过时造成浪费;用户可随时随地通过云端访问所需的算力资源,快速开始训练和应用;用户可根据需求选择不同算力平台和机型,也可以不受地域或者时间的限制模型、工具等资源,进行更多的尝试和探索。 03 当多云遇到生成式AI 为了向大模型客户提供高稳定性和高性价比的AI基础设施,生成式AI+多云的模式成为科技厂商们新的角力点。 云被看作是AI的承载,而AI也是云的核心抓手,开展大模型所需要的算法、算力和数据等能力,以及覆盖IaaS、PaaS、MaaS的解决方案。 近期,VMware 推出Intelligent Assist、Private AI架构方案。在此之前,阿里云提出了“Model as a service”的概念,亚马逊云科技推出了包括Amazon Bedrock和Amazon Titan模型等生成式AI新工具。 VMware CEO Raghu表示:“生成式AI与多云可谓珠联璧合。客户的数据无处不在,遍布其数据中心、边缘、云等多处。 我们将与NVIDIA一同助力企业放心地在数据附近运行生成式AI工作负载,并解决其在企业数据隐私、安全和控制方面的问题。” NVIDIA创始人兼首席执行官黄仁勋表示:“我们能够训练AI模型,微调AI模型,为了跨多个GPU部署AI模型和大语言模型,特别是大语言模型,一台计算机运行不了,必须将其分配到多机多卡上,并对其进行推理、生成token,实现交互,其速度可媲美人类日常交互。” 同时他表示,通过与VMware扩大合作,我们将能够为金融服务、医疗、制造等领域的成千上万家客户提供其所需的全栈式软件和计算,使其能够使用基于自身数据定制的应用,充分挖掘生成式AI的潜力。 Private AI由一套集成式AI工具组成,能够使企业自定义模型并运行各种生成式AI应用,如智能聊天机器人、助手、搜索和摘要等。 该平台将作为全集成式解决方案,采用NVIDIA提供的生成式AI软件和加速计算,基于VMware Cloud Foundation构建,并针对AI进行了优化。 VMware AI Labs副总裁Chris Wolf表示:“最开始,AI是由一部分数据科学家为方便其他的数据科学家而构建和设计的。 随着全新VMware Private AI产品的推出,VMware正在让计算和AI模型的选择更加贴近数据,从而使未来的AI服务于企业中的每一个人。” 04 AI能拉动云服务增长吗? 行业研究机构IDC日前发布的2022年全球云计算追踪数据显示,全球云计算IaaS市场规模增长至1154.96亿美元,同比去年上涨26.2%。 全球前三名云厂商依次为亚马逊、微软、阿里云,所占份额分别为48.9%、14.4%、6.2%,谷歌和IBM紧随其后,所占份额分别为5.6%和2.9%。华为云、中国电信、腾讯云、中国移动和百度云位列六至十名。 与2021年相比,阿里云市场份额在减少,而亚马逊和谷歌所占市场份额在增加。 移动互联网发展见顶之后,全球云服务商收入增长都在放缓,AWS增速从40%下降到12%,微软Azure增速从31%下降到15%,但显然阿里云面临的挑战更大一些,增速已降至不足10%,上个季度首次出现负增长。 反观紧随其后的谷歌云仍保持近30%的增长,极有可能取代阿里云占据全球云厂商第三的位置。 2023年第二季度,阿里云的收入同比增长了4%。财报显示,阿里云本季度收入增长主要受到存储、网络和AI计算相关产品驱动,部分被CDN需求正常化抵消增幅。 从客户分布维度,收入增长主要受到金融服务、教育、电力和汽车行业驱动,部分被主动缩减项目式收入的举措所抵消。 AI热潮带来的算力和模型服务需求,正在推动云计算巨头重回增长,那么这种增长能否长期持续? IDC统计了全球主要云计算厂商的收入拆分,阿里云、AWS的收入结构基本接近, 均主要以IaaS业务为主,辅以一部分PaaS业务,而微软Azure的PaaS和SaaS的收入占比超过60%。 实际上,云计算产业链中,从底层的IaaS,到中间层的PaaS,再到上层的SaaS,越往上产品差异化越大,毛利率越高。 微软Azure正是将自身的Windows、Office、SQL Server等软件与云服务打通,获得了更高的毛利率。 IDC在7月6日发布的《全球公共云服务半年度跟踪报告》显示:2022年全球公共云服务市场收入总计为5458亿美元,其中,SaaS(软件即服务)是公共云服务收入的最主要来源,占2022年总收入的45%以上。 面对全球市场以及国内市场激烈的IaaS竞争,阿里云发力PaaS和MaaS,微软Aure是可以参考比较的对象。 作为OpenAI的投资方,微软显然更受益于生成式AI的发展。今年初,微软宣布Azure OpenAI服务在全球Azure平台发布,该服务旨在为开发人员提供对大型语言模型的便捷访问,这些模型可以跨其他Azure产品无缝集成,以协助企业开发和部署对话式AI服务和解决方案。 此外,微软在其全球合作伙伴大会上宣布了Microsoft 365 Copilot定价、推出Bing Chat Enterprise AI聊天机器人、和Meta联合宣布将Llama 2开源大模型引入Azure云和Windows。 微软2023年第四财季电话会议上,微软首席财务官Amy Hood则表示,尽管目前对Azure AI服务的需求强劲,但目前AI服务对Azure的收入贡献仅有约1个百分点,随着微软加速投资云基础设施,AI对微软收入带来的影响将集中在2024财年的下半年。 张勇在财报会议上也说:“人工智能AI革命是一个增量机会,各行各业,所有公司他们都会希望利用人工智能来提升他们的服务。 但是这个是离不开要利用大量高性能的算力,不仅是用于现阶段模型的训练,还要用于支撑以后他们提供各种的服务。因此我们认为这是非常重要的、长期的一个带动增长的引擎。” 企业数字化、产业智能化是一条漫长的路,但云计算大厂们则通过不断的技术革新、开放赋能,正助力更多企业大步快跑进产业智能化的升级浪潮中,大大缩短了这一升级路径所需时间。 在人工智能技术融入万物,技术、需求与产业进化永不停歇、奔涌向前的现实下,未来的技术框架又会进步到何种程度,让我们拭目以待。
索尼做了个带手柄的屏幕,并打算卖你1500块钱…
前阵子,索尼发布了一个看上去有点抽象的设备 PlayStation Portal 。 这个玩意儿非常生硬地把 PS5 手柄给一刀两半,然后中间塞进去一个显示器,有一种让玩游戏和不玩游戏的人都沉默的美感。。。 乍一看,它的缩写也是 PSP ,好像是一个新世纪索尼掌机,PSP 和 PSV 的次世代继承者,然而。。。 它只是一个自带手柄的显示器而已。。。 目前看来,它唯一的作用就是通过串流的方式玩 PS5 上面的游戏,没了。 估计有的差友可能懵了,意思就是,这个带显示器的手柄,本身没有任何独立运行游戏的能力,它真的只是一个显示器。。。 然后当你的 PS5 正在运行游戏时,你可以通过串流的方式,用这个设备来进行玩耍。 串流也被叫做流式传输,意思就是把游戏的运算和渲染工作交给一台性能很好的机器,然后另一台设备再通过网络获取对应的游戏画面。 串流适合一些配置比较差的设备来使用,或者像 “ PSP ” 这种压根没法独立运行的设备。 讲真,虽然一开始托尼是难以理解的,但毕竟它是一个自带手柄的便携显示设备,万一哪天犯懒就想用了呢? 所以我一直本着 “ 尊重祝福 ” 的想法去看待这玩意儿,直到最近它公布了高达 200 美刀的售价。。。 3202 年了,就连 Switch Lite 都只要 1200 多块,还能随时随地想玩就玩,我花 1500 块买一个带手柄的显示器到底是图个啥。。。? 是不是觉得这玩意儿没啥用?而托尼作为一个老玩家,稍微分析了一波之后,发现这玩意儿的槽点比想象中还要多。。。 首先就是前面提到的,它只是一个纯串流设备,不能独立运行任何应用,离开了 WiFi 直接变砖。。。 而且作为显示器本身,它本身的屏幕素质可能也一般,因为这是一块 LCD 屏幕。。。 而这块 LCD 屏幕,是不支持 HDR 的。 还有一个最要命的地方,那就是和这个世界上的所有串流设备一样,它多多少少都有延迟的情况,这个对于游戏体验的影响是非常大的。 如果你用过蓝牙耳机打游戏的话,应该体会过声音永远比操作慢半拍的感觉有多么难受。 串流的延迟有点类似,但不同之处是当你按下手柄,画面上的角色却慢了半拍才出招。 如果是在对反应速度要求不那么高的 RPG ( 角色扮演 ) 游戏中,还算能够忍受,但 PS5 在北美可是有另一个外号 —— 《 使命召唤 》 启动器。。。 而 FPS ( 第一人称射击 ) 游戏偏偏是对响应速度要求最高的那一类游戏,开枪慢一丢丢就直接被对面爆头送走了。。。 所以托尼个人猜测,这玩意儿可能连 “ 使命召唤启动器 ” 的作用都承载不了。 这时候公司的硬件部点子王 —— 米罗,还发现了一件事,那就是串流质量好坏,是极度依赖 WiFi 环境的,虽然延迟没法彻底解决,但是我们可以通过好的路由器来提升串流质量啊! 领势 Velop MX5300 妙,妙啊。 但这样就需要动用 “ 钞能力 ” ,花大价钱买个旗舰级路由器。 然而在水深火热的国外,随便买一个好点的路由器,价格甚至比 PSP 都高。。。 里外里这就花了 400 甚至 500 美刀,为了一个串流玩法,真的不值。 而几百美元已经属于安卓掌机的价格区间了,像是 Retroid Pocket 之类的不仅同样支持串流,在不连接 PS5 的时候还能打打别的游戏啥的,这不也挺好的吗? 而且高通最近还公布了几款 G 系列游戏芯片,估计过段时间会蹦出来一堆安卓掌机。 这么一看,好像索尼出的这个玩意儿干啥啥不行啊。。。 倒也没有这么不堪,至少托尼看了 IGN 的视频,里面有提到索尼认为的使用人群。 比如 PS5 放在客厅,但此时客厅电视被人占用的;家里有小孩,你想打游戏但是又不想打扰到他们;或者干脆就是不喜欢在客厅打游戏,想在卧室玩 PS5 的。 不知道为啥,托尼看完之后觉得这东西反而更抽象了。。。 有没有一种可能,你可以把心爱的 PS5 直接搬到卧室去玩呢? 总之,这东西确实是槽点满满,一时之间很难想出购买这玩意儿的理由。 当然,这个 PSP 由于是官方的串流设备,整体的操作肯定比第三方方便得多,用起来不会那么麻烦。 而且它自带一个 DualSense 自适应扳机手柄,游玩体验肯定不会差,光是单独买一个手柄就要五六百块钱了。 而 PSP 用起来,肯定比一个手柄再额外带一个便携显示器要方便。 其实托尼并不反感这样的设备,只是觉得索尼这样的设计有些过于粗暴了,真就是把显示器直接塞到手柄中间,价格没有到天价的程度,但也不便宜。 你说你都做到这份儿上了,真的不如直接出个正儿八经的掌机。。。 众所周知,索尼家的 PS5 本来就基于 AMD 处理器设计,而现在掌机公认的最佳处理器之一也是出自 AMD 的 Z1 系列,它们甚至还都是 X86 架构。 只要索尼想,按照自家的技术力,做一个水平不错的能够游玩轻量级 PS5 游戏的掌机,完全没问题。 而且看看现在的 Steam Deck 和 ROG Ally ,在核心玩家的圈子里已经传开了,掌机文艺复兴是完全可行的事情。 更别提 PSP 当年在掌机界掀起的血雨腥风了,就凭索尼这号召力,有多少人在盼着复活当年的 PSP 和 PSV 呢。。。 结果索尼可倒好,搞了一个前不着村后不着店的串流设备,卖的也不便宜。。。 也许,索尼的掌机时代,真的一去不复返了吧。。。 撰文:百威 编辑:米罗
机器人技术在护理领域中的应用
新技术正在帮助我们应对技术工人短缺等挑战。机器人技术是否也能够帮助缓解医疗和护理领域的高强度压力?我们对两位专家进行了访谈。 专家介绍 库卡医疗机器人业务发展经理AndreasKeibel博士 库卡公司的高级UX研究员NadineReißner 问:机器人技术和人工智能正在进入越来越多的领域,并且可以为老龄化社会提供支持。在护理领域,是否也存在使用机器人技术的趋势? AndreasKeibel博士:总的来说,护理领域需要新技术。人口结构变化的影响已经显而易见,另外,护理人员还严重短缺。这一领域需要采取行动,这是考虑到未来的必要之举。在护理领域使用人工智能/机器人技术已经成为了国际上集中研究的主题之一。 机器人对于护理领域来说,最初的重点任务可能是支持护理人员的操作,以便护理人员有更多的时间进行护理,将更多的注意力转移到病人身上。自动化物流是一个可能的应用场景。例如,机器人技术可以及时准确地提供各种物品,如餐食、消耗品甚至床铺等。这些是最容易实现的第一批应用领域,因为这不涉及机器人技术和人工智能与患者的直接交互。 该行业需要转变,需要将资金用到先进技术上。例如,德国政府颁布的《医院未来法案》为医疗和护理设施配备现代技术提供了财政支持,这就是朝着正确方向迈出的一步。 问:作为机器人和自动化解决方案的供应商,库卡主要活跃在工业生产领域。那么库卡在护理和医疗保健领域也有具体的项目和应用吗? Andreas Keibel博士:库卡的技术有助于将人们从危险、单调或繁重的任务中解脱出来。机器人技术也可以为技术工人的日益短缺和人口结构的变化提供支持。在医疗领域,库卡为各种医疗机器人的应用提供了解决方案。例如,我们灵敏的协作机器人LBR Med就是专门为医疗技术开发的。Life Science Robotics公司已经使用它来开发康复机器人应用程序ROBERT®,机器人在其中起到了辅助治疗的作用。这种机器人辅助治疗的方式减轻了护理人员的负担。 NadineReißner:此外,库卡还致力于针对护理领域的新技术研究。库卡一直在与合作伙伴一起研究护理行业的解决方案,例如为后勤工作提供机器人支持。该项目的目标是减轻护士的工作负担并节省时间。 问:您已经指出并非所有护理工作都可以自动化。那么,机器人能够完成哪些任务,哪些任务较为困难? NadineReißner:护理任务和其他任务是有区别的,其他任务会使护士脱离了他们的核心工作。这些任务包括文档记录和管理以及各种后勤工作。护理活动的本质是人与人之间的互动以及建立社交联系。护士不仅仅需要送餐,还要检查病人的情况并与其互动,从而了解病人的情况。对机器人来说,完成一些依赖社交技能的任务是较为困难的,例如同情心。这些人际层面仍然是人类的专属领域。但是人工智能和机器人可以为后勤工作或文档记录提供很好的支持。 康复机器人ROBERT®移动患者:机器人辅助治疗减轻护理人员工作负担 问:你期待机器人技术在近期和未来会对护理领域有什么影响?人工智能将如何改变护理? AndreasKeibel博士:数字化是将更多技术引入护理领域的基础。例如,人工智能可以促进传感器的实时评估,以此更好地评估疗养院中的情况和环境。这可以帮助移动机器人在设施周围移动,以补充货架或维持秩序。人工智能还可以识别人员并且评估他们的状况,并以这种方式减轻员工的负担。
“AI孙燕姿” 爆火之后,这门生意可能真的要成了
AI不只是新的麦克风。 图片来源@视觉中国 今年 5 月 AI 歌手爆火,其中以「孙燕姿」为最。 周杰伦的《发如雪》、许嵩的《清明雨上》、周华健的《难念的经》,通通拜倒在技术加成的「音色流氓」之下。 你跟一个每几分钟就推出一张新专辑的人还有什么好争的。 孙燕姿时隔一个多月的回应,洞若观火又泰然自若。 尽管她认为人类无法超越 AI 已指日可待,但现实只能且行且看,现在 AI 音乐已经过了听个响的阶段,开始认真琢磨赚钱这件事了。 让明星帮你唱歌可以,但请交钱 最近,YouTube 和环球音乐集团「一拍即合」。 一个是全球最大的视频网站,一个是全球最大的音乐公司之一,控制着约三分之一的音乐市场,与索尼音乐、华纳音乐「三足鼎立」,拥有泰勒·斯威夫特、鲍勃·迪伦等巨星版权。 AI 斯威夫特演唱的《My Way》. 「强强联盟」奔着「加强版权保护」而去,它们不是抵抗 AI,反而是拥抱 AI,重新思考音乐版税和内容创作,让音乐人和平台都能继续赚到钱。 行业老大坚决打击的,其实是那些类似「AI 孙燕姿」的、不问自取的侵害版权行为。 目前还没有落地的事物,两者先是召集了包括格莱美得主的环球音乐音乐人,这些「小白鼠」们负责试验正在开发的 AI 工具并提供反馈。 逝世的「瘦皮猴」Frank Sinatra,「遗产」也会被征用. YouTube 的入局,有些「亡羊补牢」的感觉。仅今年上半年,YouTube 上与 AI 工具相关的视频观看次数就超过 17 亿次。 对于侵害版权的行为,YouTube 的态度是,技术的问题交给技术解决。 生成式 AI 系统可能会加剧当前的挑战,例如商标和版权滥用、错误信息、垃圾邮件等。但 AI 也可以用来识别这类内容。 说到 YouTube 的合作伙伴环球音乐,互联网是有记忆的,就在几个月前,它还对 AI 音乐十分不满。 今年 4 月,「Heart on My Sleeve」这首歌在外网爆火,它用 AI 克隆了歌手 Drake 和 The Weeknd 的声音,TikTok 的观看次数超过 850 万次,Spotify 的收听次数超过 25 万次,随后被环球音乐要求下架。 光下架还不够,环球音乐向 Spotify、苹果等流媒体平台下达了通知,要求它们阻止 AI 工具从受版权保护的歌曲中抓取歌词和旋律。 如今看来,这不是回旋镖,只是环球音乐打算将 AI 音乐规范化,并从中分一杯羹,你用 Drake 的声音唱自己的歌,那你就该付钱。 比和 YouTube 官宣早十几天,环球音乐也和 YouTube「顶头上司」Google 讨论过相同的话题,当时的想法是为粉丝开发一种制作 AI 生成歌曲的工具,版权所有者将获得报酬,艺术家可以选择是否参与,但也没有立即推出产品的计划。 YouTube 首席执行官将 AI 生成歌曲的兴起,与 YouTube 发展早期相提并论,那是平台首次直面用户生成内容和版权之间的冲突。 当时人们将流行歌曲作为视频配乐,涉嫌侵犯版权,所以 YouTube 开发了版权管理系统 Content ID,让版权所有者得到报酬,每年累计向音乐行业支付约 20 亿美元。 这让 YouTube 意识到,音乐视频得以在平台上繁荣,连接世界各地的艺术家和粉丝,核心就是保护版权。 AI 不只是新的麦克风 如果说平台更多是利益和商业模式方面的考量,音乐人的心情则更复杂,既担心养家糊口的生计,也放不下对艺术的追求。 说唱歌手 Drake 猛烈抨击了模仿他声音的 AI 歌曲,称其为「最后一根稻草」,另一位说唱歌手 Ice Cube 更是将 AI 歌曲称为「恶魔」,难说其中没有对技术的恐惧。 当 AI 模拟人声不再是难事,人们自然希望它能够做到更多。部分先发制人的艺术家们,尝试将名为艺术和商业的磁铁两极,都掌握在自己手中。 加拿大创作歌手、马斯克前女友格莱姆斯,就是「第一位吃螃蟹的人」。 格莱姆斯. 今年 5 月,格莱姆斯推出了专门用来复制她声音的开源软件 Elf.tech,允许自己的声音开放使用,但要求分 50% 的版税,快刀斩乱麻地把盈利模式确定好了。 这几个月来,虽然还无法颠覆乐坛,也称不上病毒式传播,但 AI 格莱姆斯的作品已经不少,至少发行了 300 多首歌曲,甚至在 Spotify 有官方账号并收取版税,最受欢迎的《Cold Touch》有 100 万多次播放,剩下的基本没能超过 10 万次播放。 《Cold Touch》出自 DJ 兼制作人 Kito 之手,和 AI 孙燕姿翻唱歌曲类似,它更像是披了个 AI 的皮,编写和制作等「重头戏」交给人类,演唱也有小样,歌手被要求唱法尽可能像格莱姆斯本人,然后才重制成了格莱姆斯的声音。 Kito. 这恰恰说明,AI 还不能抹除人类的创作痕迹,我们仍然需要写歌、制作和演唱。 格莱姆斯在接受采访时也提到,AI「就像一个新的麦克风」,AI 格莱姆斯不会否定对格莱姆斯的需求。 AI 格莱姆斯其中一首歌的海报. 虽然人类参与可能会随 AI 进步而减少,但格莱姆斯仍然对技术保持「病态乐观」,她相信新技术应该赋予人们权利,而不是取而代之。 人们变得沮丧,说「我想听听人类制作的东西」,但我想正是人类创造了这一切。 橘生淮南则为橘,生于淮北则为枳,AI 格莱姆斯是格莱姆斯的「种子」,但在不同的环境之下,它长出了味道不同的果实。 例如,《Friend V. Enemy》的演唱风格很不像格莱姆斯,但打样的歌手发音非常好,格莱姆斯很欣赏;《Ether》听起来就完全不像人唱的,不过格莱姆斯特别喜欢它的怪异感。 AI 格莱姆斯其中一首歌的海报. 这或许能够缓解音乐人的焦虑:AI 格莱姆斯和格莱姆斯本人,可能根本不在一个赛道,AI 是一个相邻边的扩展,而不是对原有领土的攻占,更不是原模原样的克隆。 格莱姆斯的赚钱方式是分版税,而电子音乐艺术家 Holly Herndon 设想得更加周全。 她推出了深度伪造自己声音的 AI 工具 Holly+,并建立了一个去中心化自治组织(DAO),当艺术家使用 Holly+ 创作时,作品被提交给 Holly+ DAO,成员将最好的作品制作成 NFT 并拍卖,收益由创作者、DAO 成员和 Holly Herndon 分配。 Holly+ . 引入区块链技术,为的是确认音乐的版权归属。Holly Herndon 自诩为「计算机音乐家」,观点也很极客,她认为,应该是艺术家本人而不是公司,决定 AI 在音乐中怎么使用,并自由地加入或退出。 Holly Herndon 更担心的不是 AI 技术本身,而是不负责任的公司们像 AI 一样训练所有人的口味。 Holly Herndon 在 TED 分享 AI 会唱多种语言. 在她看来,AI 应当是促进艺术发展的工具,唱着她不会的语言,为她自己伴唱,和其他歌手合唱,让更多人和她一起投入创作之中。 当任何人都可以像你一样创作时,成为一名艺术家意味着什么?让我们承认 AI 是正在发生的事情,看看我们能走多远。 技术狂奔的时代,看见人类的角色 对技术的规范,往往落后于技术的发展。目前为止,音色和风格是不受著作权法保护的。 Drake 和 The Weeknd 是环球音乐的艺术家,但环球音乐让流媒体平台下架 AI 歌曲,不是因为 AI 生成了他们的声音,而是因为曲子包括了制作人的创作,这部分受到版权保护,所以才能下架。 当一首歌被 AI 翻唱,其实应当征得词曲著作权人的同意,如果词曲著作权人签订过转让版权的合同,那么版权也可能归属于唱片公司,该走的流程也得走,除非是不以营利为目的的「合理使用」。 歌手是版权法中规定的「表演者」,对词曲本身不享有版权,但这类 AI 歌曲也可能损害到歌手的「公开权」——名人的某项特征很突出,人们通过它可以联想到本人,那么就该得到保护。 曾有这样一个案例,某位歌手拒绝拍摄福特的广告,福特请了她的一位伴唱,并要求这位伴唱尽可能唱得像歌手本人,结果真的骗过了不少人,歌手因此提起诉讼,法院判定她歌声的公开权被盗用。 所幸改变正在发生。今年 7 月,环球音乐呼吁在全国范围内推行公开权,目前它只在美国部分州有效。 不仅是引发版权相关的争议,AI 还可能让无用内容泛滥,并突出流媒体平台的不公。 AI 音乐初创公司 Boomy 就钻过空子。Boomy 提供的服务是,用户选择喜欢的音乐风格,由 AI 生成歌曲,用户可以改变节奏、编曲、乐器并添加人声,然后再将歌曲上传到流媒体赚取版税。 最近几个月,Spotify 删除了 Boomy 在其平台 7% 的内容,大概是几万首歌曲,因为 Boomy 涉嫌让机器人「听歌」,扩大播放数从而赚到更多的版税。流媒体分配版税的现金池就那么大,作弊的做法显然不正当。 Boomy 官网界面. 但未来很可能会有更多的 Boomy。它就像是用户和流媒体平台之间的中间人,甚至提供文生图功能,让用户快速用 AI 创建封面,一条龙服务太过贴心。目前,Boomy 的用户已经创作了超过 1400 万首歌曲。 与此同时,流媒体的「二八定律」,也可能因为 AI 而加重。「界面文化」《创作零工,普遍贫穷》一文提到,80 年代,音乐行业 80% 的收益来自 20% 的顶尖作品,现在的收益只来自 1% 的作品,因为算法和长尾效应,人们的注意力和消费对象更加集中了。 抖音神曲们如巨轮势不可挡,15 秒的副歌,先从短视频平台开始病毒传播,然后征服社交网络、霸榜音乐平台,最后走入线下,曲高和寡的歌曲真的成了小众圈子的狂欢。 固然孙燕姿和格莱姆斯接受了 AI 的存在,但前提是孙燕姿已经成为了孙燕姿,格莱姆斯已经成为了格莱姆斯,她们受到的冲击相对不那么大。 试图建立新版权系统的 YouTube 和环球音乐,暂时也没考虑改变这种不平衡。 音乐家借着格莱姆斯的 AI 账号出头,倒不失为一种引流的办法。AI 格莱姆斯的《Concept of Creation》在 Spotify 的播放量接近 7 万,算不上热门,但创作这首歌的艺术家,其他作品的播放量才 1000 多而已。 当 AI 一天一个模样,新的行业规则仍在以人类为中心展开。 根据美国地方法院近日的一起裁定,AI 生成的艺术品不受版权保护,虽然版权法确实需要与时俱进,但人类作者身份仍是版权的基本要求。 另外,美国版权局也发布过一份指南,其中一项要求是,提交作品时披露 AI 生成的内容,版权局将考虑歌曲中 AI 的使用是「机械复制」的结果,还是代表了作者的「原创构思」。 大名鼎鼎的格莱美,也只允许 AI 的「部分参与」。如果 AI 担任主唱,那么这首歌可以竞逐创作类别的奖项,但失去表演类别的资格。如果 AI 负责词或曲,这首歌就不必考虑了。 今年 3 月,创作歌手陈珊妮进行了一项实验,在发出新歌《教我如何做你的爱人》几天后,才公布这首歌是 AI 演唱的,封面也是用 AI 生成的。她自认为是 AI 的「支配者」,虽然未来会如何很难说。 这位探索 AI 音乐的先锋,最近在浪潮音乐大赏的颁奖引言说到,过去上过很多课程,其中最有趣的一堂课是「即兴」,老师不停地弹着钢琴,她要即时唱出不同的东西,尽可能不重复自己。 常有人问我什么是 Al 不能取代的?或许有一天,AI 真能为你完成一首毕生最伟大的作品,但是过程中你成为什么样的人,这是 AI 无从知晓,也无法站在这里分享的记忆与情怀。 以人的尺度去丈量宏观事物,未必不是一种立身处世的方式。 AI 是碾向所有人的巨轮,但对一些人来说,拥抱 AI 不是为了被时代抛下的模糊恐慌,而是为了自己还能留下什么具体的、与从前不同的东西。
全球GPU缺口超40万张!算力之困,中国大模型有解了
【新智元导读】大模型时代,玩家如何掘金?最近,这套大模型智算软件栈OGAI,竟吸引了国内几十家参与「百模大战」的企业围观。 中国企业,能否赶超OpenAI? 大模型爆火之后,许多人都在追问这样的问题。 然而,这个领域的中美差异性,决定了这一事实:美国现在的格局,未必就是中国未来的格局。 美国可能只有少数的大模型企业,而中国,或许会呈现百花齐放的新格局,并不会是只剩下少数几个大模型,其他人在它们的基础上去做应用和开发。 从十年维度来看,如今的GPT-4还只是一个baby,而今天的我们,只是刚刚打开生成式AI的一扇门而已。 在这个大模型狂飙的时代,英伟达CEO黄仁勋有一句名言,「the more you buy,the more you save!」 「如果你能将一个价值50亿美元的数据中心的训练时间缩短一半,那么节省下来的费用就超过了所有芯片的成本。」 01.大模型,怎样才能玩得起 但问题在于,面对如此高的门槛,究竟哪些玩家才能玩得起? 目前,大模型研发已进入万卡时代,一家企业如果想自己拥有大模型,至少需要几十亿投资。 然而,即便是买下来之后,紧接着还会面临建不了的问题。 此前的云计算是把一台机器拆分成很多容器,而现在的大模型需要多台机器集群的集中力量,在较长时间内完成海量计算任务。 如何保证低时延海量数据交换?如何让多台机器均衡计算,避免冷热不均?如果硬件出现故障,算法需要重新跑一遍,又怎么办? 瓶颈之下,算力利用率变得尤为重要 不可否认,对于大模型的研发来说,最大的挑战之一,就是对庞大的算力基础设施的需求。 然而,训练大模型的算力平台并不是算力的简单堆积,随着模型的规模越来越大,单卡算力与模型总算力需求之间存在着巨大的差异。 与此同时,虽然随着硬件的改进FLOPs的成本得到了部分改善,但大模型的持续升级使得总成本一直在增加。 目前,GPT-4、PaLM-2的算力当量,已经达到了GPT-3的数十倍,相当于上万颗业界性能领先的NVIDIA Hopper架构的GPU芯片组成的AI集群,训练超过1个月的时间。 算力平台的构建之所以这么难,是因为它不止是服务器、存储、 网络等硬件设备的集成,也有诸多设备软硬件兼容性和性能调教上的know-how。 而对于企业来说,由于缺乏工程实践的经验,进一步限制了硬件计算能力的发挥。这不仅让本就匮乏的算力资源雪上加霜,更是无法快速地提升模型质量来应对狂卷的竞争。 从数据到算法再到RLHF,过程冗长 在算法开发层面,PB级数据的爬取、清洗、过滤和质检,大规模预训练的算法设计、性能优化和失效管理,都面临着重重难题。 DeepMind的研究表明,想要把一个大模型训练充分,每个参数的训练量要达到20个token。因此,当前的很多千亿规模的大模型还需要多用10倍的数据进行训练,模型性能才能达到比较好的水平。 目前,国内大模型产业数据集主要还是简体中文加上少量英文为主,数据集的单词量在100亿级。相比之下,训练GPT模型的单词量级为5700亿。也就是说,单从规模上来看就是1:57的差距。 不仅如此,从设计指令微调数据集,到优化RLHF,整个开发链十分冗长,这更需要背后有诸多工程化工具。 模型训练:周期长、效率低,断点问题严峻 另外,大模型的训练过程,也比传统的分布式训练复杂,训练周期长达数月。 而集群计算效率低、故障频发且处理复杂,会导致训练中断后不能及时恢复,从而会降低成功率,也会使训练成本 居高不下。 从工程角度来看,这是一个非常复杂的流程,其中的硬件、系统、软件、驱动等等都必须相互适配,才能起跑。 期间,各个部分都需要能稳定持续运转,才能保障模型训练的效率。一旦出现问题,都会让整个训练过程停摆。 比如,Meta就曾在训练OPT-175B模型的日志中提到,几乎整个训练过程都要面对不停地重启和中断。 在训练完成到30%左右处,Meta的训练日志显示,在两个星期的时间段内因为硬件、基础设施或实验稳定性问题而重新启动了40多次! 绝大多数重新启动都是由于硬件故障以及缺乏提供足够数量的「缓冲」节点来替换坏节点的能力。通过云接口更换一台机器可能需要几个小时。 在维护日志中,Meta的训练人员记录到: 总而言之,解决基础设施问题占据了团队最后两周的大部分时间,因为这些硬件问题可能会在一天中的任何时间导致训练中断几个小时。 虽然我们充分意识到这些问题会在这种规模的训练过程中反复出现,但考虑到在2021年底之前完成一个175B模型训练全部工作时间非常紧迫,我们别无选择,只能通过不停重启的方式,看看如果没有额外的训练工具的帮助我们能走多远。 在找到一个加速重启的方案并安排了更多的人手24小时轮值维护之后,Meta依然还是要面对硬件层面的各种问题。 内部训练进度的图表显示,接下来的两周之内,最长的3次连续训练时间长度只有2.8天,2天,1.5天。 不难看出,就连强如Meta这样的团队,都会或多或少地受到上述挑战的困扰。 因此,对于还处在探索阶段的国内大模型产业来说,就更加需要一套能够保障其生产力的AI基础设施。 正如浪潮信息人工智能与高性能应用软件部AI架构师Owen ZHU所说:「以前都认为,买服务器就像买手机、买电脑一样,只要开机就能用了;但实际上随着算力需求持续变大,事情变得越来越复杂,实际上买回去也不一定能用得起来。」 02.OGAI:你可能要踩的坑,他们都替你踩过了 为了切实地解决这些问题,近日,浪潮信息正式发布发布了大模型智算软件栈OGAI(Open GenAI Infra)——「元脑生智」。 面对各种以大模型为核心的生成式AI开发与应用场景,OGAI都提供了全栈全流程的软件,包括集群系统环境部署、算力调度保障、大模型开发管理等。 为了充分释放智算集群的能力,OGAI在每个层次上都对性能和稳定性进行了相应的优化,包括服务器BIOS的调教、大规模集群组网性能、算力调度策略等。 同时,也融合了浪潮信息在MLPerf性能评测、服务客户实际需求、开发源大模型的实践经验。 如此一来,就可以大幅降低大模型算力系统的使用门槛、优化大模型的研发效率。无论是生产,还是应用,都得到了保障。 总之,你可能会踩的坑,浪潮信息都提前帮你踩过了。 具体而言,OGAI由5层架构组成,从L0到L4分别对应基础设施层的智算中心OS、系统环境层的PODsys、调度平台层的AIStation、模型工具层的YLink和多模纳管层的MModel。 值得注意的是,OGAI软件栈的使用非常灵活。从L0到L4层的设计和实现,都是分层的。也就是说,你并不一定要用到L0到L4整体的方案去开发大模型。 因为每一层都是分层解耦的,需要哪一层的实现或对应的功能,就只用那一层就可以了。 L0层智算中心OS:面向大模型算力服务的智能算力运管平台,满足多租户以裸金属为主的弹性AI算力运管需求。 其中,高效的裸金属服务可以在几分钟内部署规模达上千的裸金属节点,并按照需求进行扩容,能够一键获取异构计算芯片、IB、RoCE高速网络、高性能存储等环境,同时实现计算、网络和数据的隔离,确保业务的安全性。 L1层PODsys:开源、高效、兼容、易用的智算集群系统环境部署方案。 这一层可以全面覆盖AI集群的部署场景,包括系统环境,从OS、驱动到系统监控可视化、资源调度等。值得一提的是,这是浪潮信息首创的一个开源项目。 下载地址:https://podsys.ai/ PODsys集成了数十个智算集群部署所需的驱动程序、软件和其他安装包,并提供了一系列脚本工具来简化部署过程,而用户只需执行两个简单的命令就能完成整个集群的部署。 就拿模型整套流程中的一环「驱动」来说,不管是上层调优,还是底层调优。 在过去就像是开盲盒一样,对于客户来说A可能适用,而对B并非适用,由此所带来的成本是巨大的。 举个栗子,某互联网客户A在使用AI集群,在对面向推荐场景的AI大模型进行训练时,却发现服务器中的CPU到GPU之间的通信带宽和存储到服务器之间的通信带宽没法同时跑满。 带来的结果就是,模型数据不能及时从存储读取,进而导致GPU空闲和训练性能低下。 面对这一难题,客户A的算法团队用了几个月的时间也没有攻克。 浪潮信息的AI团队介入后,发现客户的场景中,大模型对数据读取IO的需求远超一般的AI模型训练情况,从而导致针对普通模型训练的服务器配置在推荐场景中出现了不适配的情况。 针对这一特殊的需求,基于自身经验,浪潮信息团队对CPU BIOS中的mps等多个选项配置进行了针对性的的修改优化,很好的解决了这一问题。 再比如在环境配置中,也会遇到一些意想不到问题。 为了满足大模型算力需求,某互联网客户B购买多台高端的AI服务器,并沿用之前的使用习惯进行了操作系统和环境的部署。 然而,在运行大模型训练任务时发现,GPU掉卡,OOM等错误频频出现,导致开发人无法正常使用设备。 触发这一故障警报的主要原因就是,客户B操作系统配置中的部分pcie相关参数和当前GPU设备的需求不兼容。 对此,浪潮信息向客户提供了正确的配置参数之后,很快解决了这个问题。 可以看出,大模型算力平台并非是简单算力堆积,还需要解决训练推理效率,系统稳定性等一系列工程问题。 就像Owen ZHU谈到的一样,当智算中心的规模从十几台服务器扩展到几百台,使用难度便会呈指数级上升。 L1层PODsys就像初始化操作系统预装的驱动程序,能够高效部署AI系统,而不用重新开发组件。 它恰恰为AI集群部署提供一个完美的解决方案,即「将工程经验总结成一套工具链式的回答。」 L2层AIStation:面向大模型开发的商业化人工智能算力调度平台。 这一层主要针对大模型训练中常见的「训练中断」难题,能够训练异常快速定位,断点自动续训。 AIStation的核心能力,可以归结为以下3个方面: 1. 在开发环境和作业管理方面 AIStation实现了计算、存储、网络等训练环境的自动化配置,同时允许用户自定义基本的超参数,只需简单几步,就能完成大模型分布式训练。 并且,AIStation还集成了主流的大模型训练框架,包括Megatron-LM、DeepSpeed、HunggingFace上的诸多开源解决方案,实现了秒级构建运行环境。 这样的优势在于,能够帮助开发者在大规模集群环境下便捷地提交分布式任务。 然后,调度系统根据分布式任务对GPU算力的需求,通过多种亲和性调度策略,大大降低构建分布式训练任务技术门槛。 比如,英伟达开发的基于PyTorch框架Megatron-LM能够在AIStation上实现快速部署,训练全程都有保障。 2. 在大规模算力调度方面 能够制定合理的作业执行计划,以最大限度地利用资源,满足训练任务的时延和吞吐需求。 AIStation优化调度系统性能,实现了上千POD极速启动和环境就绪。 另外,针对大模型训练通信要求高的场景,AIStation提供集群拓扑感知能力。通过联合优化,AIStation在千卡集群中能实现90%以上的分布式计算扩展。 比如,就拿GPT-4来说,在大约25000个A100GPU上训练90-100天,算力利用率为32%至36%。 而浪潮信息所打造的「源1.0」训练算力效率则达到了44.8%。 3. 在训练稳定保障方面 健壮性与稳定性是高效完成大模型训练的必要条件。 利用AIStation内置的监控全面的监控系统和智能运维模块,可以快速定位芯片、网卡、通讯设备异常或故障。 进一步,通过对训练任务进行暂停保持,然后从热备算力中进行自动弹性替换异常节点,最后利用健康节点进行快速checkpoint读取,让大模型断点自动续训成为可能。 比如,之前提到Meta在训练OPT-175B模型时反复遇到的训练中断问题。 AIStation就能提供一整套的解决方案,避免类似情况的发生,或者将训练中断造成的影响控制到最小。 L3层YLink:面向大模型数据治理、预训练、微调的高效工具链。 针对大模型开发的2个核心环节——数据处理和模型训练。浪潮信息在YLink中集成了大模型研发中所需的自研工具和开源工具,如数据处理工具包(Y-DataKit)、大模型训练工具包(Y-TrainKit)和大模型微调工具包(Y-FTKit)。 这些多样且完善的工程化、自动化工具,大大加速了大模型的训练和开发效率。 首先是数据的处理。 在LLM出现以前,鲜少有人能预见它背后巨大的想象力。它被视为大模型落地的入场券,军备竞赛中的护城河,AI界的战略资源。 GPT-3.5的文本语料多达45TB,而GPT-4在GPT-3和GPT-3.5训练数据集的基础上,又增加了多模态数据。 想训练出强大的大语言模型,就需要依托充足的高质量数据。数据的数量、质量、多样性乃至清洗能力,都是影响大模型性能的关键要素。 在YLink工具链中,数据生成工具DataGen、数据抽取工具FileQA、数据采集工具Gather、格式转换工具Transform、数据清洗工具Purify,大大方便了开发者的数据处理过程。 这样,数据源和元数据被采集、处理后,就被转换成模型训练所需的数据,也就是得到了「炼丹」的原材料。 在有了「足够高质量」的标注数据之后,就可以进一步为「足够稳定」的模型逻辑推理能力提供支撑了。 接下来,针对大模型的预训练过程,YLink提供了数据处理工具Gather、Transform和Purity以及基于业界主流大模型分布式训练框架NVIDIA Megatron和MS DeepSpeed的大规模分布式预训练参考流程。 ChatGPT能火爆全球,关键的原因之一,是「它能像人一样思考。这背后的原因,就是基于人类反馈的强化学习(RLHF)」。 在微调类ChatGPT模型过程中,主要会涉及三个阶段:有监督微调(SFT)、奖励模型(RM)训练和奖励模型上的近端策略优化(PPO)。 在SFT阶段,模型通过模仿人类标注的对话示例来学习通用的类人对话;在奖励模型训练过程中,模型会根据人类反馈来比较不同回复的偏好;在PPO阶段,根据奖励模型的反馈更新模型,通过探索(exploration)和利用(exploitation)发现最优策略。 同样的,对于模型微调这个阶段来说,数据质量也至关重要。 现在,有了YLink在数据和训练上提供的全方位支持,我们就可以轻松炼丹了。 L4层MModel:提供多模型接入、服务、评测等功能的纳管平台。 对于客户来说,不论是开发大模型,还是调用第三方模型再用数据微调训练,都会遇到一个问题,即不会只用到一个模型。 鉴于当前AI领域各种模型的丰富度,他们会选择把多家模型进行比对,以找到更适合自己的最优解。 而这当中需要经历一个必不可少的过程,涉及到如何管理多模型,如何下载,如何根据自身场景对模型进行自动化评测。 对此,浪潮信息提供了多模型纳管方案,其核心组件包括数据集管理、模型纳管和评测,可以方便开发者和研究人员更好地管理多版本、多类型的基础大模型与任务模型。 并且,通过多样化的评测数据集与评测任务,它可以对多个模型进行生成准确率、推理延迟、推理稳定性等指标的全面评估。 这样,开发者就可以快速部署和应用模型,并且,多模型的纳管可以让我们在保证模型权重、数据集安全的前提下,对外提供API服务。 03.大模型掘金的「秘密武器」 不难看出,OGAI不仅可以保障大模型训练时算力供应的可持续性,而且还充分考虑到了硬件、软件、算法、框架层面引发的训练中断、失效的问题,进而帮助企业顺利跨越大模型研发应用门槛。 这些能力和基础的背后,是来自浪潮信息在30余年深耕硬件行业的积累之上,在AI服务器产品,算力系统优化方面的先发优势。 一方面,率先布局AIGC领域的浪潮信息,是国内为数不多具备了千亿大模型工程实践经验的企业。这使得浪潮信息对于开发大模型的整套流程了如指掌。 未来客户在AIGC工程领域中要踩的坑,浪潮信息已经提前替客户踩了;必须要面对的技术难题,浪潮信息已经提前解决了。客户借助浪潮信息推出的OGAI解决方案,让自己能站在巨人的肩膀上,落地产品和服务。 基于千亿级大模型的工程实践,浪潮信息对于如何高效调度千卡规模的算力,以及保障训练任务的长期稳定运行已经有了丰富的经验。 具体来说,在训练数据层面,浪潮信息的AI团队逐步建立了完整的从公开数据爬取到数据清洗、格式转化、数据质量评估的完整流程和工具链。 通过自研海量数据过滤系统(MDFS),建立从数据采集、粗滤、质量分类、精滤的全自动化的端到端数据工作流程,通过清洗866TB海量数据,获得5TB高质量中文数据集。 在模型训练层面,浪潮信息通过对云原生的调度系统进行了改造,大幅加速其启动速度,并重点解决了RDMA网络在容器中的接入和适配优化,较好地构建了一套能够满足大模型需求的算力调度系统。 另一方面,除了亲自搭建和研发的经验之外,浪潮信息还在服务客户的过程中,解决了各种不同体量、不同赛道的企业在实践中遇到的问题。 在集群架构及软硬件层面,解决了诸多如CUDA初始化失败、GPU掉卡、 p2p Bandwidth Latency延迟过高、NCCL通信性能低,GPU direct RDMA未使能等问题。 2022年以来,浪潮信息的AI团队协助多个客户把大模型训练的GPU峰值效率从30%左右提升到50%。从而大幅加速了模型训练过程。 比如,将系统工程经验,应用于智算中心算力系统,全面优化了集群架构、高速互联网络和算力调度等等。「通过合理设计张量并行、流水并行和数据并行,精准调整模型结构和训练过程的超参数,千亿参数规模的大模型训练算力效率可达至53.5%」。 此外,网易伏羲中文预训练大模型「玉言」,也在浪潮信息的助力下登顶中文语言理解权威测评基准CLUE分类任务榜单,并在多项任务上超过人类水平。 基于丰富的经验积累,浪潮信息能够快速挖掘出客户的痛点,并将需求与现有技术进行有效整合。 最大程度地解决未来客户会的遇到的问题,满足各个赛道不同客户在AI工程领域的不同需求。而这,便是OGAI解决方案正在实现的。 大模型的发展,犹如黑暗森林里的一束光,让整个产业高效迈入AGI。 站在未来10年看如今百模争霸的时代,加快产业进度,就是核心关键。 浪潮信息高级副总裁刘军表示,浪潮信息的初心即是「探索前沿技术,让算力充分赋能大模型训练,以及背后的产业落地化」。 今时火热的AIGC产业机遇中,浪潮信息必然会留下浓墨重彩的一笔。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。