EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
【财报鑫观察】当“二次腾飞”遇上行业调整 新华保险交出怎样的2021答卷
经济观察网 记者 姜鑫  3月30日,新华保险(601336.SH)披露了公司2021年的业绩答卷,这是李全掌舵新华保险后的第二个完整年度财报以及第三份年报业绩单。 财报显示,2021年新华保险营业收入2224亿元,同比增长7.7%;保险业务收入1635亿元,同比增长2.5%;归母净利润149亿元,同比增长4.6%。 面对上述成绩单,中信建投和光大证券双双在研报中给出了“买入”评级。当日,新华保险股价报收34.93元,涨幅2.83%。 时间拨回到2019年12月,在新华保险召开的媒体开放日上,履新首席执行官、总裁半年的李全携管理层悉数亮相,提出“二次腾飞”并确定了“资产负债双轮驱动、规模价值全面提升”发展模式。 然而“腾飞”尚未企稳,保险行业就迎来了新冠疫情的冲击,随后行业陷入了增长乏力的转型期,新华保险采取了哪些应对之道? 个险清虚效果明显 对于保险行业来说,2021年是艰难的一年。 这一年,新冠肺炎疫情持续蔓延,国际金融市场震荡,全球保险业遭受冲击。我国寿险业发展不平衡、不充分的问题日益突出,新单保费增长承压,行业竞争显著分化,销售人力持续缩减。 随着一系列监管新政相继落地,寿险行业进入从高速度向高质量发展转型的关键阶段:一方面行业加快转型步伐,转变经营思路,注重提升代理人质量、产品回归保障属性;另一方面加快创新突破,积极运用新技术,从产品设计到成本控制推动精细化运营,从客户角度出发探索新模式、构建新生态,切实推进供给侧结构性改革,以适应我国经济社会发展新的变化与要求。 在业绩发布会上,李全介绍称,公司采取了“稳中求进”的工作总基调。在这一年里,公司总资产达到11277亿元,同比增长12.3%;总投资收益率5.9%,同比提升0.4个百分点;内含价值2588亿元,较上年末增长7.6%。   保险业务方面,新华保险实现总保费收入近1635亿元,同比增长2.5%。其中,长期险首年保费近410亿元,同比增长5.0%;续期保费约1169亿元,同比增长3.5%。实现归母净资产收益率14.2%,同比下降1.3个百分点;新业务价值59.8亿元,同比下滑34.9%;每股股息1.44元,同比增长3.6%。 销售人力缩减的大趋势下,2021年持续进行人力清虚的新华保险人力脱落同样明显。截至年末,代理人同比下滑35.8%至38.9万人(其中上半年和下半年分别脱落16.5万/5.2万人)。 个险渠道首年保费约185亿元,续期保费约1014亿元,同比增长5.2%。有分析师在研报中表示,2021年新华保险个险渠道首年保费为185亿元,同比下降12.3%,降幅较前三季度仅扩大0.1个百分点,其中长期险首年保费154亿元,同比下滑0.3%,降幅较前三季度缩窄1.3个百分点,实现边际改善。同时,新华保险2021年月均人均综合产能(=月均首年保费/月均规模人力)为2725元,同比增加4.1%,增速较上半年提升17.3个百分点。 新华保险副总裁李源表示,个险的问题是当前寿险最突出的问题,应当讲从2020年开始我们的个险转型受到巨大的压力,一是来自于疫情的反复,从2020年开始到现在来看疫情反反复复,特别是个险营销的现场管理、亲访客户受到影响;第二就是个人营销30多年来积累下来的顽疾也日显突出,导致个人营销体系受到更大的冲击,可谓是“一夜撞墙”;第三个压力是来自于监管,公司严格执行监管的系列措施,再一个是“双录”(录音录像)的严格执行。 李源表示,在这种压力下,进行人力清虚以及高质量转型发展成为行业的选择。新华的打法是在个险渠道提出了“守规律、讲专业、勇创新”的指导方针,“守规律即回归保险本原,个人保险必须做实我们的基础管理加强基本功”。 银保渠道发力 投资端不惧压力 值得注意的是,新华保险对银保渠道加大了战略投入,因此,银保渠道保费的增长也是公司保费增长的动力之一。新华保险表示,银保渠道大力发展期交业务,深化重点渠道合作,优化产品与服务供给,期交保费、价值、首年保费全面实现正增长,2021年实现保费收入407亿元,同比增长2.5%。其中,长期险首年期交保费约72亿元,同比增长26.7%。 作为规模增长的利器,银保渠道在保费规模增长上发挥着重要的作用,但对于保险公司价值的增长却难以实现个人渠道长期业务的贡献,且对公司的投资能力有很高的要求。 资产和负债能否良性匹配?关于这个担忧,新华保险副总裁兼首席财务官杨征表示,公司每年都会根据市场的情况、根据宏观条件、根据市场的需求来把握具体的业务策略,银保渠道实现快于个险渠道的增长环境所致,银保业务带来投资压力的确客观存在,但是公司在安排这块业务的同时,会考虑相关产品的久期,以及资产成本问题。 杨征表示,在负债匹配的时候也相应地进行了安排,所以这些业务对于公司资产的增加是有明显贡献的,对公司的利润和价值增加有一定的贡献。从现在来看,公司投资端的安排和匹配能够保证这些业务,所以我们还会继续根据市场提供的条件来把握相关的业务发展机会。 投资收益表现亮眼 “资产负债双轮驱动下”,新华保险的投资表现值得一提。2021年,面对“资产荒”和“低利率”的投资环境,新华保险投资组合总投资收益率为5.9%,净投资收益率为4.3%。全年总投资收益576亿元,同比增长23.5%,表现优于同行。 新华保险还披露了公司非标资产的占比情况,杨征表示,到2021年底,公司非标资产占比持续下降,占总投资资产比例为20.5%,下降3.6个百分点,同时我们的持仓状况及持仓的信用风险依旧稳健可控。 2022年初,A股市场波动明显,对于在2021年取得了5.9%总投资收益的新华保险来说续写这个成绩压力并不小。投资出身的李全直呼“压力山大”。在李全看来,2022年复杂的投资环境对于所有投资人来说压力都不小,但在开年遇到这样的问题使得其对未来比较乐观。 “我们对今年的状况是有一定的思想准备的,所以在投资上的话还是在积极的应对在大类资产上做一些调整,虽然开年就遇上这样非常严峻的问题,但也对未来比较乐观,一方面是中国整体的经济形势在全球范围内是表较好的,另外开年遇到这样的问题比到年底遇上这样的问题好一些,这会给我们更多的时间做一些调整和进一步的投资运作,而且保险资金现金流还是不错的。”李全说。
中行行长刘金多次喊话投资者:坚定对中行股票的信心
经济观察网 记者 胡艳明  “刚才会议前和同事们路过走廊,看到外面又下雨了。去年的业绩发布会是3月30日,那天北京从早到晚都在下雨,我当时说‘春雨贵如油,但是比春雨更珍贵的是投资者和市场对我们中国银行的信心和支持’。尽管我们比去年提前了一天召开发布会,今天又下雨了,这场春雨又一次让我们感受到各位对中国银行的信任和支持。” 3月29日,在中国银行(以下简称“中行”)召开的2021年业绩发布会即将结束时,中行行长刘金说道。当天,中行在上交所和港交所同步公布了2021年业绩。此时距离2021年2月刘金从光大银行行长之位赴任中行行长,已有一年多的时间。 财报显示,截至2021年末,中行集团资产总额为26.72万亿元,比年初增长9.51%;负债总额为24.37万亿元,比年初增长9.59%。营业收入达6057.17亿,同比增长6.71%;实现股东应享税后利润2166亿元,同比增长12.28%。在盈利指标方面,中行平均总资产回报率(ROA)为0.89%,净资产收益率(ROE)为11.28%,同比分别提升0.02和0.67个百分点;净息差为1.75%,同比下降10个基点。 在当日的发布会上,中行管理层回答了分析师、媒体及投资者关于全年信贷投放、核心盈利指标、普惠金融策略、财富金融布局、资产质量分析、海外业务经营、分红和派息、资本补充等十余个问题。 其中,中行行长刘金回复了关于核心盈利指标、分红派息、资本补充、未来业务规划、数字化转型等问题,大都脱稿回答,言辞恳切,并多次亲自为中行股票站台,喊话投资者关注中国银行股票,“不论是30%的分红率,以及6.99%或5.78%的股息率,对机构投资者来说尽管不高,但在当前复杂的国内外形势下,也是一个稳定可靠的选择。” 最后,刘金说,“强烈建议各位投资者、分析师,大家既要看股价,又要看分红,既要看资本市场上关注的增长性、成长性,又要看我们的稳定性;既要看到中国银行作为商业银行的市场化特点,更要看到中国特色社会主义的制度优势,对中国银行这支股票坚定信心,让我们一起共同稳定资本市场,稳定经济大盘。” 股息率6.99%行长呼吁市场坚定信心 对于过去一年中行的表现,刘金认为,过去一年中国银行的业绩稳中向好,主要呈现三个特点:一是营业收入迈上新台阶,突破六千亿关口;二是收入结构明显改善,其中,非利息收入在营收中的占比提升了3.33个百分点,达到29.79%。三是经营效率逐步提升。 在业绩发布会上,有投资者提问关于分红派息方面的考虑。刘金说,“从中国银行以及几个大型银行来看,大股东确定了30%的分红比例,这个多年没变,没有特殊情况,我们也不会变,大家也应该有充分信心。” 刘金介绍,这个分红比例下,2021年全年,中行A股的成交价均价是3.16元,董事会建议每股派息0.221元。照此计算,股息率是6.99%,比上年增加了1.21个百分点。 “同业的数据现在不好说,还没有公布完。但以2020年的数据看,中行的股价不是最高,因为2020年各方面影响较多,特别是受疫情影响较大。2020年全年中行A股的成交价均价是3.41元,股息率达到5.78%,是几个大型银行里面最高的。所以不论是30%的分红率,以及6.99%或5.78%的股息率,对机构投资者来说尽管不高,但在当前复杂的国内外形势下,也是一个稳定可靠的选择。”刘金说。 刘金表示,上述股息率,对于个人财富管理者、个人客户而言,作为资产组合的一部分,已经是一个不错的选择。如果自己选择理财产品、基金定投等各类投资工具能达到这样的收益水平就很好了。中行会保持这样的分红派息水平,回报投资者和股东。 3月29日,中国银行A股报收3.19元/股,港股报收3.05港元/股。 截至3月30日,国有六大行已公布利润分配方案中,建设银行每10股派发现金股息3.64元(含税);交通银行每10股派发现金股息3.55元(含税);邮储银行每10股普通股派发人民币2.474元(含税)。 从盈利指标来看,近年来中国银行息差持续收窄,自2018年至今,中行净息差分别为:1.95%、1.89%、1.85%和1.75%。 光大证券银行业首席分析师王一峰认为,贷款收益率下行是中国银行净息差主要拖累因素。具体看,生息资产收益率为3.25%,较2020年下降13基点;其中,贷款收益率为3.83%,较2020年下降13基点;资产端收益率承压背景下,中国银行加强了负债成本管控,计息负债成本率较2020年下降3基点至1.63%,负债成本压降对息差压力形成一定缓释。 境内人民币贷款增量1.38万亿 创历史新高 资产规模方面,截至2021年末,中行集团资产总额为26.72万亿元,比年初增长9.5%,其中,客户贷款总额为15.71万亿元,比年初增长10.5%;负债总额为24.37万亿元,比年初增长9.59%。 年报显示,2021年,中行境内本外币贷款增加1.45万亿元,增量创近十年新高。境内人民币贷款比年初新增1.38万亿元,增量创历史新高。 从中行公布的新增信贷投放领域来看:战略性新兴产业贷款新增2993亿元,增长135%;民营企业贷款新投放2.4万亿元,新投放占比较上年提升0.98个百分点;普惠型小微企业贷款新增3059亿元,创历史新高;制造业中长期贷款新增1291亿元,增长29%。 “坦率的说,我们对信贷增长还是有很强动力和渴望的,这种动力和渴望一方面来源于作为国有大型银行服务实体经济、发挥大行作用的需要,另一方面也来源于我们业务发展和盈利增长的需要。”刘金表示。 但任何规模的增长都是要和资本相匹配,刘金表示,中行要不断制定和完善资本应急预案,在外部经营环境恶化、经营条件变化或是加快信贷投放的情况下,通过优化资产结构,控制风险资产增长等措施,来确保资本合理充足。 展望2022年的全年信贷计划,中行副行长王志恒表示,一是规模保持稳健增长。中行对标构建新发展格局要求,继续扩大新增贷款规模,预计境内人民币贷款同比多增,增幅不低于10%。二是结构继续优化。从行业维度看,将持续加大对小微企业、科技创新、绿色发展等重点领域的支持力度,合理管控“两高一剩”信贷投放。从地区维度看,深入落实国家区域重大战略和区域协调发展战略,促进东、中、西和东北地区平衡协调发展。从个人贷款的安排来看,坚持“房住不炒”原则,在满足监管要求的前提下适度投放,满足购房者的合理住房需求;另一方面,积极服务扩大内需战略,主动对接新型消费发展模式,实现个人贷款与公司贷款的均衡发展。 海外加息利好境外经营业绩 目前,海外局势动荡。对于未来中行的海外业务发展,中行副行长陈怀宇表示,展望2022年,全球经济复苏态势仍将延续,为中行境外机构业务发展提供了较好的外部环境,当前发达经济体正在推动或酝酿货币政策转向,加息环境对中行境外经营整体有利。 据了解,作为国内全球化程度最高的银行,在所有的国内金融机构当中,中行境外的资产利润占比最高,而且和其他同业差距很大,境外资产现在占到中行全集团24%以上,境外利润占比在20%以上。 陈怀宇表示,主要发达国家货币政策有溢出风险,新兴经济体金融风险加大,需要我们持续关注。总体而言,中行在新兴经济体机构的资产、收益集团占比不大,影响有限。 对于今年中行海外业务的发展策略,陈怀宇透露,在机构布局方面,中行境外机构已覆盖62个国家和地区,今后将稳妥推动区域整合,亚太机构协同机制将覆盖RCEP全部境外成员国,按计划推进欧非中东地区机构区域化管理,初步建成欧盟IPU区域总部。 同时,在风险防控方面,陈怀宇表示,中行将持续关注境外疫情发展变化、当地经济发展情况以及地缘政治等情况,因地制宜确保人员、机构运营的安全,有效应对外部环境变化和监管趋严的要求。同时,进一步强化海外资产质量管控,主动控制受疫情影响较大行业的组合占比,优化国别风险评级和限额核定规则,将国别风险总体控制在合理水平。
四家险企合计向东航预付保险赔款1.16亿元
经济观察网 记者 姜鑫  “3.21”东航MU5735航空飞行器事故保险理赔工作迎来进展。 3月30日,银保监会官网发文称,3月22日,银保监会指导飞机机身主要承保公司人保财险做好预付赔款相关工作。3月23日,人保财险先行向东方航空公司预付保险赔款5000万元。目前,相关保险公司都已做好赔付准备工作,在合同责任范围内,应赔尽赔快赔。 上述文章显示,截至3月29日,财产保险方面,承保飞机机身的人保财险、太保财险、平安财险、国寿财险合计向东方航空公司预付保险赔款1.16亿元。人身保险方面,相关保险公司根据客户报案情况,积极开展保险理赔工作,目前已有11家公司向遇难人员家属支付14笔赔款,金额合计1485万元。 此前,记者了解到,失事飞机东航MU5735涉及保险主要包括航空保险和航空意外险等。根据蒙特利尔公约,国际航空承运人应当对旅客的人身伤亡、行李和货物损失、以及由于延误造成旅客、行李或货物的损失承担责任并予以赔偿。当事国应当要求其承运人就其在本公约中的责任进行充分保险。 因此,一般情况下,航空事故中,遇难者家属及受伤乘客获得的赔偿包括两部分:一部分是承运人(航空公司)所承担的赔偿;另一部分是保险公司所承担的赔偿,除了航空意外伤害险,还包括乘客自身投保的意外险或者意外医疗保险等。 航空保险方面,记者了解到,失事飞机东航MU5735由中国人保首席承保,平安产险和太保产险等公司参与了共保。 平安产险相关人士此前告诉记者,航空公司购买的保险主要有四个险种,包括机身及零备件一切险及其责任险、机身战争险、战争责任超赔和机身免赔额保险。我国民航机队除海航系航司外,所有的航空器均由民航机队大保单统保,包括上述四个险种。经初步排查,平安产险广东分公司共保东航MU5785机身零备件一切险及责任险。 据记者了解,国寿财险也共保参与了中国民航联合保险机队航空保险业务,险种包括机身、零备件一切险及责任险,机身战争险等相关险种。 飞机一切险是承保飞机(包括机身、推进器、机器及设备) 不论任何原因造成的意外损失或损坏的保险。一切险承保范围一般指因火灾、雷击、爆炸、风暴、碰撞、偷窃以及飞机停泊于水面时发生的碰撞、沉没、漂失及倾覆等原因引起的损失。 中国太保方面则表示,目前中国太保产险已核查确认跟单承保中国民航联合保险机队航空保险。 “中国民航联合保险机队航空保险业务是将国航、东航、南航三大集团作为一个整体,其所涵盖的机队作为一个投保主体进行参保。由北京航联经纪作为受托人寻找承保公司,目前我们看到的主承保是人保,部分公司参与共保,但其实承保主体自留部分比例并不高(主承保可能5%-10%的份额),主要通过分保或再保来转移风险,特别是国际上的再保险公司,例如劳合社等。”一位保险中介人士表示。 银保监会表示,下一步,银保监会作为“3.21”东航MU5735航空飞行器事故国家应急处置指挥部善后处置工作组成员,将在指挥部统一领导下,统筹协调保险行业进一步细化理赔方案,优化理赔流程、把握关键环节、注重方式方法,妥善做好后续保险理赔服务工作。
中国华融发布2021年业绩扭亏 迎新大股东中信集团
经济观察网 记者 梁冀 2022年3月29日,中国华融(2799.HK)发布2021年度业绩公告与股东权益变动公告。经历去年千亿巨亏后,中国华融正逐步回归正轨。公告显示,中国华融报告期内实现营业收入930.67亿元,同比增长23.4%;营业支出836.34亿元,同比下降52.7%;净利润19.86亿元,较2020年扭亏为盈。 此外,中国华融原第一大股东财政部将所持24.07亿股内资股向中信集团增资。此次权益变动后,财政部所持中国华融股权比例降至24.76%,中信集团则成为中国华融第一大股东,持股比例为26.46%。 扭亏为盈 2020年,中国华融巨亏1029.03亿元。中国华融去年8月表示,2020年巨亏系计提1077.55亿元资产减值计提所致。此外,中国华融还引进中信集团、中保投资有限责任公司、中国人寿资产管理有限公司、中国信达资产管理股份有限公司和远洋资本控股有限公司作为战略投资者。 2021年,中国华融三大业务板块—不良资产经营分部、金融服务分部及资产管理和投资分部分别实现收入总额517.47亿元、314.38亿元和143.78亿元,税前利润分别为72.06亿元、60.41亿元和52.44亿元。 去年以来,中国华融持续推进化险瘦身。据悉,中国华融2021年已完成华融交易中心股权转让,华融消费金融与华融证券也已完成股权转让协议签署;此外,华融湘江银行、华融租赁、华融信托等5家牌照类子公司的股权转让工作也在有序推进。 中国华融副总裁王文杰表示,经过2020年全面评估风险并大额计提减值后,2021年公司按照资产质量和会计准则常态化进行了资产分类和减值计提。经过全年持续加强存量风险处置化解工作,2021年末三阶段资产总额407.68亿元,较2020年末减少62.34亿元;减值准备179.43亿元,较2020年末减少62.9亿元。 数据显示,截至2021年底,中国华融资产总额为1.57万亿元,同比减少4.4%;负债总额为1.46万亿元,同比减少7.2%。中国华融董事长王占峰表示,2021年,在持续压降资产规模、负债规模基础上,公司收入结构趋势性向好,业务结构持续优化,经营总体运行平稳,营业收入小幅上升,实现扭亏为盈。 参与处理房地产业务风险 除自身业绩表现、大股东变更外,中国华融作为AMC参与化解房地产企业风险的事宜也受到市场关注。财报显示,中国华融收购的金融类不良资产主要来自大型商业银行、股份制商业银行、城市和农村商业银行以及非银行金融机构出售的不良贷款和其他不良债权资产。 中国华融总裁助理高敢表示,随着房地产行业进入周期调整新阶段,与房企债务化解、低效无效资产盘活、企业结构调整、民生保障等相关的不良资产业务机会激增,将给公司带来较多的不良资产收购来源和业务机遇。中国华融将真正发挥资产管理公司重组盘活功能,以“法律隔离、实质管控、封闭运行、重组盘活”为原则,通过将底层资产与债务企业实现隔离,完善交易结构设计和退出路径,加强对项目还款来源的封闭监管,灵活参与房地产企业风险化解和存量资产盘活。 一方面,公司将贯彻落实国家“房住不炒”政策定位,按照监管部门要求,把握房地产市场风险形势变化,发挥不良资产处置盘活核心功能,以存量涉房不良资产为基础,以优质项目并购重组为方向,重点开展国家号召、符合功能定位、利于维护经济社会稳定、促进地产行业良性循环和健康发展的涉房项目。 另一方面,将立足自身存量、所处区域存量,围绕房企上下游,联合产业链战略客户开展并购重组,以发挥诸如风险隔离、困境房企托管、助力出险项目并购、提供类共益债救助、组建房地产重整盘活专项基金等多种功能,通过综合施策,重点参与实施“保交房”、烂尾楼盘活、“非居改保”等宏观政策支持鼓励、与社会民生相关的业务,服务地方风险化解,维护社会稳定。 中信集团成第一大股东 股东权益变动公告显示,财政部拟将其持有的中国华融约24.07亿股向中信集团增资。此次权益变动后,中信集团成为中国华融第一大股东,持股比例为26.46%;财政部则持有中国华融24.76%股权。中国华融表示,此次权益变动后,公司仍为国有控股金融机构,不会导致该公司的实际控制权变化。 去年引入中信集团等5家战略投资者后,中国华融募得资金420亿元,资本实力得到补充;其资本充足率提升至12.95%,超过监管要求最低12%的水平。中国华融在财报中称,将围绕“主业转型、风险攻坚”总体目标,进一步聚焦主业、回归本源,加快推进风险化解,开展机构瘦身,调整优化资产结构和业务布局,努力提高资本使用效率,推动公司高质量发展。 中国华融总裁梁强在业绩会上表示,中信集团在金融和产业两大领域有非常强的市场竞争力,中国华融“瘦身”后,尤其是转让金融牌照子公司完成之后,主业将更加突出,精力将更加聚焦。“围绕问题资产、困境企业、危机救助、风险化解等功能优势和专业特长,我们将和中信集团的各板块、各机构形成较强的互补性和协同性,共同致力于为客户提供一揽子的综合性全方位金融解决方案,共同完成好支持服务实体经济、防范化解金融风险、深化金融改革的三大任务。”梁强表示。 香颂资本董事沈萌向经济观察网表示,中国华融从AMC起家,但是目前已经涉足金融、实业等多个板块,只有像中信集团规模级别的大型国资集团方有能力接手、化解其存在的问题。未来,不排除中信集团会引导内部的金融和实业板块逐渐介入融合中国华融业务板块,以循序渐进的方式逐步完成对华融的整合。他指出,中信集团接手中国华融是为了通过市场化手段化解华融的风险,财政部将所持中国华融内资股转为对中信集团的增资,有助于增强中信集团整合过程中的话语权和控制力,减少在推动中国华融处置过程中的作业流程复杂度。
盈米基金创始人肖雯:改变中国人买基金的方式
经济观察报 记者 李沁  与肖雯见面是在北京的一个清爽的早晨,她热情且善于表达,给人留下深刻的印象。 在中国公募基金行业里,肖雯有着很高的知名度。从1992年入行算起,到如今她已经拥有30年的证券基金从业经验,多个公募基金销售的纪录均出自她的手中。 因对资产管理、财富管理及买方投顾业务有深刻的认知和思考,她被基金圈誉为具有创新意识与行业洞察力的资深专家之一。 在创办珠海盈米基金销售有限公司(以下简称“盈米基金”)前,肖雯曾任广发证券经纪业务部副总经理、广发基金副总经理。她是行业内首个提出“基金赚钱而基民不赚钱”问题的人;盈米基金提出的“四笔钱”投顾框架和“三分投七分顾”的投顾模式,几乎已是行业共识。 作为盈米基金的创始人,肖雯有一个“改变中国人买基金的方式”的初心与愿景,想要用买方投顾的方式帮助投资者赚钱。 而回归家庭时,肖雯就变成好妻子、好妈妈,她认为经营家庭也同样需要智慧。 人生似乎拥有很多面向,而肖雯能自在变换、乐在其中,她始终认为,做一个有趣的人和做一件有意义的事情一样重要。 做一件有意义的事 肖雯开办盈米基金的整个过程可以用四个字来概括:“老炮”创业。 创业的源头可以追溯到2012年,彼时,肖雯还是广发基金的副总经理,同时兼任互联网金融部总经理,常常与互联网公司和平台打交道。互联网公司那种强调“极致的客户体验”,让肖雯很是感慨:互联网站的角度和基金公司站的角度很不一样,产品能给对方带来再大的利益,如果客户体验不好,那就免谈。 “当时我们的老大把我拉到一旁说:‘肖雯,我在咱们自己的平台上买200万的基金,但买完后什么信息也没有。我不知道在这1天的时间里,钱去了哪里,究竟成功了没有。基金的交易规则是T+1,所以T+1日后才能显示买到的份额。可是我从淘宝买一个台灯,买完后打包及物流的每一步都是清清楚楚的。’”肖雯回忆称,“这件事对我的触动很大,开始下决心去思考改进基金用户体验的问题。” 为什么金融行业无法做到这种极致的用户体验?基金本该是一个大众化的产品,为什么那么多的投资者在亏钱?一个连买菜可能都要货比三家的投资者,把钱投进基金市场,两百、三百、四百……很容易就亏掉了。这究竟是业务模式的问题?还是技术的问题? 这些对基金行业的疑问及客户体验的思考,不知不觉成为了埋在肖雯心中的创业的种子。2015年,“大众创业、万众创新”的大潮兴起。此时,肖雯的感受也越发强烈:在传统的基金销售模式中,销售机构的收入主要来源于交易的佣金,为此,销售机构有动力通过周转用户资金来获取更高额的佣金,而用户频繁买卖行为则加剧了“基民不赚钱”的现象。 “所以说,传统的基金销售模式肯定是遇到了很大的挑战。那么,我能不能创立一家能解决当前行业痛点的公司?”此时,肖雯的心中涌现了很多想法。 在想法逐渐明晰后,肖雯逐一拜访了当时已经拿到基金销售牌照的公司,得到朋友们的建议是:“千万别干,这事不能干,太难了。” 不过,肖雯决心已定,如果能就此改变行业痼疾,为基民带来更多收益,这无疑是一个件更有意义的事情。 在被问及为何放弃令人艳羡的工作而选择创业时,肖雯回答道:“一来我对行业已经有了足够的认识,知道投资者没有分享到公募基金行业创造的价值,也没有分享到中国经济增长的红利,这种深刻的反思让我想要做些什么。那时我也经常研究海外的顾问制度,虽然不知道用在中国是否行得通,但还是想要试试;二来,我的孩子已经读大学了,先生也非常支持,让我没有后顾之忧。别人委婉地评价说我有勇气,不过我认为自己是任性,我就是‘任性地’想去做自己想做的事。” 就这样,肖雯辞职创业,成立了盈米基金。 肖雯是首位提出行业存在“基金赚钱而基民不赚钱”问题的人,为了解决这个行业痛点,她和团队提出了“买方投顾”的理念,即以投资顾问的模式来帮助投资者买基金,解决“怎么买、怎么卖、什么时候买、什么时候卖”的问题。 在这样的框架之下,盈米基金提出了重要的“四笔钱”框架和“三分投七分顾”的投资理念。 “四笔钱”的框架诞生于2018年。在以往的基金销售中一直以“风险承受能力”问卷的方式来了解客户。盈米基金分析后认为这种方式过于笼统,忽视了千人、千面的复杂性。比如说人在不同的年龄阶段,对投资收益和投资目标的要求是不一样的,年轻的时候可能追求比较高的收益,而年纪大的时候可能就需要追求比较稳健的收益;另外,不同的收入情况承担的风险也不一样;甚至相同的一笔钱,如果是短期内用来买房,或者长期之后给孩子念书,不同的时间和用途,对投资风险的承担能力和风险承受能力也都是不同的。 “在经过了深入分析和思考以后,我们改变了视角,将对‘人’进行划分变成对‘钱’进行划分,来帮助不同的用户需求完成他们的资金规划。从投资期限的时间维度,将钱分为‘短、中、长三笔钱’,再结合客户的家庭情况、不同的年龄阶段等信息规划出‘第四笔保障的钱’,从而形成伴随了每个人一生的‘四笔钱’框架。”肖雯解释道。 2020年,盈米基金首次提出了“三分投七分顾”的投顾服务理念。 彼时,肖雯和团队成员发现很多机构更关注投顾组合的策略本身,对于组合策略给客户带来的实际收益关注不够。在长期的投顾服务过程中,肖雯和团队成员意识到投顾的能力不是将股票基金的年化回报率从16%提高到18%,而是改变客户错误的行为习惯和认知,从而改变“基金赚钱,基民不赚钱”的行业痛点。 “所以我们得出结论,投顾业务应该是‘三分投、七分顾’,用我们长期的、不同形式、不同特点的投顾服务来改变客户基金投资的不理性行为,帮助他们克服‘追涨杀跌’的习惯,从而在基金投资中获得收益。”肖雯说。 在盈米基金的官网上写着这样一句话:“改变中国人买基金的方式。”而肖雯和她的团队也一直在向着这个目标靠近。如今的盈米基金成为国内首批拿到基金投顾试点资格的三家独立基金销售机构之一。截至2021年12月31日,盈米基金投顾服务资产规模在行业内率先突破200亿元,投顾签约客户数超23万人。盈米基金旗下针对个人理财的基金投顾服务平台“且慢”,其“四笔钱”策略中所有非长钱的投顾策略客户盈利占比为98.14%;对于建议客户至少持有三年以上的长钱投顾策略,且慢持有一年以上的客户盈利占比为84.4%。 肖雯说,能取得如此亮眼的成绩,足以验证盈米的策略是奏效的,机构真的可以帮助投资者赚到钱。 常识的胜利 在创业成功光环背后,肖雯也是一名优秀的女性,是家里的好妻子、好妈妈。对此,人们总会忍不住问一句:她成功的秘诀是什么? 肖雯给出的回答是:常识。 “这是常识的胜利,而常识来自多年沉淀的认知。一来我对这个行业充满信心;二来我坚持在自己的能力边界内做事。”肖雯说。 肖雯很清楚自己的能力边界,不做能力之外的事情。当初在选择创业之时,不少人曾劝肖雯尝试非标产品,而她觉得背后一定有风险,且不清楚风险何在。而公募基金是肖雯从内到外都非常熟悉的领域,知道风险在哪、如何控制,所以由此作为创业点再合适不过。 常识的另一番胜利,是她在经营家庭的过程中得到的应验。 一周七天的时间,对于一个公司业务处在上升期的掌门人而言,着实有些不够用。处理文件、开会、拜访客户、与团队成员沟通交流……肖雯每天的工作都排得很满,结束工作后还要留出部分时间为自己“充电”。 就算在这样的情况下,除非有工作会议,否则肖雯每周六的时间雷打不动地留给家人。每周五晚上结束在广州的工作,再回珠海的家过周六。周六的晚上,肖雯的家就变成了一个知己好友活动的俱乐部,朋友们相聚在此,男士们打打牌,女士们喝茶、聊天,兴致来了还会一起跳跳操。 “星期六的时候,我就只是一个普通的家庭主妇,我会为朋友们端茶倒水。不把公司的身份和做派带回家,这也是常识。毕竟在家里的角色和在公司的角色是完全不一样的。一回家我就变成一个普通的妻子,家里的大事都听先生的。” 肖雯的先生叫“若愚”,他们的孩子小时候曾经说:“我爸爸叫‘若愚’,我妈妈是‘弱智’,他们俩很般配。”这个听起来好笑,实则拥有大智慧。 “大家往往喜欢用一些看得见的东西来衡量其对家庭的贡献,例如收入。但是,一个家庭的维系,除了钱还有很多东西是没法衡量的,比如爱、勇气、道德、爱心……它们不太容易被看见,但它们和钱一样重要。”肖雯说。 做一个体验丰富且有趣的人 当抛开创业者身份、妻子身份、母亲和女儿等诸多身份后,肖雯是怎样的一个人? 肖雯的兴趣很多。“没有创业前,我喜欢跟着先生去自驾,曾多次开车跑川藏线,喜欢跟各种不同人打交道,体验不一样的生活。我还喜欢逛博物馆、看瓷器,尤其喜欢景德镇的各种小玩意儿。现在我们家里也有很多画册,周六俱乐部之夜经常会拿出来看看。插花是我保留到现在的唯一爱好,每周我都会订一束花,因为插花时候的专注和宁静可以让我得到放松,那种灿烂而安静的美让人沉醉。” 肖雯喜欢阅读。比如她最近正在看《值得信赖的顾问》和《销售加速公式》,就算日常工作再繁忙,她也一定会挤出时间学习新知识。“说到底,公司之间的竞争是认知的竞争。作为一家公司的掌门人,你的认知就是公司的天花板,所以我要不断保持学习。” 而回忆起大学时代读的书,肖雯最爱的还是文史哲类的书籍。“我们这一代人是有文化,但是我们身上人文精神的教育是有欠缺的。现在回想起来,大学时代那一阵苦读文史哲,虽然很多书的内容我现在都不记得了,但它们在我身上留下的人文精神,对于理解人、尊重人、洞察人以及如何领略生活的智慧对于我后来的人生经历是非常有帮助的。” 肖雯也是那种坚定地把理想照进现实的人。“人生是一趟回不去的旅程,我们能做的是让自己过得精彩而有意义。我想我不会再有其他职业了,现在唯一想做的就是和伙伴们一起继续向着‘买方投顾’的理想前进,为梦想去到更远的地方。”
校企分离改革后首份年报“出炉”:华工科技年度营收首破100亿
经济观察网 程久龙 实习记者 谭嘉璇 3月30日,华工科技(000988)发布2021年年报,财务报表显示,报告期内公司全年实现销售收入101.67亿,同比增长65.7%,净利润7.61亿,同比增长38.24%。其在年报中表述,这是公司“经营业绩首次突破100亿元,创历史最高水平。” 华工科技产业股份有限公司1999年成立于武汉“中国光谷”腹地,原为华中科技大学校办企业。依托高校在激光领域的技术积累和研发优势,华工科技形成了以激光加工技术为重要支撑的智能制造装备业务、以信息通信技术为重要支撑的光联接、无线联接业务,以敏感电子技术为重要支撑的传感器以及激光防伪包装业务三大业务格局。公司于2000年在深圳交易所上市。 2021年,华工科技完成校企分离改革,实控人由华中科技大学变更为武汉市国资委,公司正式迈入系统成长、拓展战略空间的新阶段。华工科技董事长马新强对经济观察网表示,在“参与构建全联接、全感知、全智能世界,成为全球有影响力的科技企业”的愿景统领下,光通信器件、传感器、激光先进制造装备、激光全息防伪等核心业务被重新定义为联接、感知、智能制造业务。 而2021年年报,则是华工科技完成校企分离改革后的首份“成绩单”。经济观察网查阅公司年报发现,经营业绩创历史新高的背后,是公司三大核心业务全线发力。智能制造业务方面,报告期内智能装备业务收入同比增长38%,精密系统事业群业务收入同比增长超过30%;联接业务方面,公司智能终端业务成功开拓网络终端新领域,Joinsite系列无线小站产品大批量发货,收入规模同比增长670%。光学业务依托“棱镜+码盘”新业务,收入同比增长约50%;感知业务方面,报告期内,家电行业出口实现高速增长,新能源汽车、光伏储能行业迎来强增长周期,该板块实现销售同比增幅43.2%。 3月30日当天,华工科技还发布了一季度预增公告,预计2022年第一季度归属于上市公司股东的净利润2亿元-2.3亿元,同比增长75.88%—102.27%。扣除非经常性损益后归属于上市公司股东的净利润1.82亿元-2.12亿元,同比增长83.95%—114.27%。
展商推荐 | 专注城市管道预警系统及管道检测机器人的武汉天仪海波邀您参观2022武汉水博会
展商推荐参展商:武汉天仪海波仪器有限公司展位号:F27公司简介武汉天仪海波仪器有限公司是一家集研发、生产、销售为一体的综合型生产企业,公司拥有雄厚的软件开发实力,完善的生产基地,优质的销售及售后服务。公司旗下产品:城市管道预警系统、管道潜望镜、管道检测机器人、水利钻孔电视、桩基检测等产品,产品齐全,拥有顶尖的技术含量。努力打造智能城市、海绵城市,城市下水道监测是不可或缺的一个重要部分,而我司的管道预警系统将解决城市管网的一切问题,该系统做到了早发现、早研判、早预警、早处理为目标,可以真正实现海绵城市,成为智能城市的一个节点。公司目前主要是海绵城市系统研发,包括管道监测预警系统、管道检测机器人CCTV、管道潜望镜QV、管道检测声波机器人,管道修复设备。产品展示管道机器人1. 我们公司的管道机器人一共有8款,都是可以在水面上面漂浮行走的(同行的只能是无水或者水很少的情况下使用);2. 我们的管道机器人都是水陆两用,有线无线双用的,带双激光测量缺陷面积大小;3. 同行是前后两个摄像头,我们是一个摄像头360度水平旋转,也可90度仰俯,能全方位的看到整个管道内的情况。管道潜望镜1、研发出双激光标的,三激光标的功能,一个激光测量距离,另外两个激光测量堵塞大小,破损面积大小,这是一种利用激光的特性用来标的量化功能,使用这个功能能直观的分析堵塞面积大小,缺陷程度判断;2、可以下载我们的APP,实现多人多机同时检测。下水道预警报警系统1、系统高度集成,采用三合一的方式,三种水位监测报警于一体;2、手机就是终端机,研发合适的APP功能,存储报警二合一,提供管道维修的第一手资料;3、系统设计小巧,尺寸120*120,方便安装;4、研发出模块系统,功耗小,20000mAh锂电池可以待机2年,方便系统维护;5、系统预留升级余步,为大面积下水道的中央实时监控提供数据。企业荣誉资质展会现场
古惠南:预计四季度完成A轮引战,之后于A股或H股上市
由于完成混改而受到业界尤其是国有企业关注的广汽埃安,将于今年九月或十月完成A轮引战,总经理古惠南表示之后便会选择去A股或者H股上市。 混改帮助埃安实现了体制与机制的创新 根据古惠南的介绍,埃安混改在三月已经完成了员工持股。首批参与混改的投资人包括南方电网、广州产投与诚通,员工持股加上这三家战投合计占股6.6%。接下来的工作就会进入真正的A轮引战,目前有几百家投资人在排队,预计在九月或十月会完成A轮引战,之后便会选择在A股或者H股上市。 古惠南认为混改对于埃安有着重大的影响。 首先,混改解决了员工的中长期激励问题。在企业,尤其是国企,单靠提高工资与奖金只能算是短期的激励政策,长期来看,企业与员工之间并没有绑定利益。在埃安本次混改中,有近800名员工实现了持股,这样就实现了员工跟企业的发展捆绑,同时也可以实现为员工提供中长期的激励,以激发员工的积极性,对提升员工对于企业的忠诚度都会有非常重要的意义。 其次,混改可以实现埃安体制与机制的创新。当混合所有制实行之后,很多机制都要更符合上市公司运行规则,企业的决策机制与运营机制都会发生变化,更加市场化,会进一步提高企业运行的效率。 第三,埃安的品牌力也会借混改而提升。古惠南坦言尽管埃安的发展速度还算不错,但是实现品牌向上还需要继续努力。引入资本的竞争有助于引起资本界、投资人与股民的关注,可以进一步提升埃安品牌的影响力。 原材料价格上涨的问题短期内会得到改善 2022年初,中国的新能源汽车产业再次面对了原材料供给不足以及价格上涨的问题,广汽埃安也没能独善其身。 古惠南表示原材料涨价非的确是超出了预期。由于新能源汽车发展速度极快,上游的很多新材料,尤其是碳酸锂的产能是不足的,这个是必须正视的现实现。但是很多电池厂也在加大投入,电池厂自身也加大了对上游碳酸锂的资源投入,这种投入的产出根据古惠南的了解在未来几个月会逐步释放,也就意味着材料紧缺的状况半年之后会逐步得到缓解,但是还不能达到彻底的缓解。 面对这样的一个局面,由于埃安在产业上下游布局比较早,与动力电池供应商一直有很好的合作,还是可以得到优先的供应保障。在原材料纷纷涨价的现实面前,古惠南理解供应商的成本也出现了上涨,表态肯定会根据市场行情判定与协商价格,不可能剥削自己的零部件供应商。这一点是古惠南与埃安最基本的合作理念,共同发展也是埃安的价值观。 根据古惠南的介绍,碳酸锂之前的价格不过3.8万元/吨,当价格涨到48万元/吨时已经上涨了10倍有余。电池的成本占新能源汽车成本的40%左右,所以近期新能源车企纷纷上调价格。如果这个供应不足的周期太长,对新能源汽车产业会有很大的影响。但是古惠南乐观地表示,这应该会是一个相对短期的行为。碳酸锂不同于早几年的电池,钴只有在少量的国家有矿产储备,如今的镍、锰、锂等资源并不是稀缺资源,只是需要一个投资产出的时间而已,这只是新能源汽车发展速度过快导致上游准备不足而出现的问题。现在上游企业开始加大投入,大投入肯定会有大产出,短期内这种局面会得到改善。 现在没必要去调整销量目标 现在新能源汽车企业面对的局面有点难,但还没有难到让埃安去调整销量目标的程度。古惠南表示埃安当前的市场销售表现很好,只有销量下滑才会去调整目标,当下要做的是尽可能满足市场需求,以最大程度地实现销量目标。 对于生产与销售的影响因素,古惠南认为原材料上涨只是其中一个,广东东莞、深圳等地的疫情反复导致零部件供应缺乏保障也是不容忽视的问题。“现在搞生产真的不容易,要克服特别多的困难,但是我们会努力完成既定的目标。” 埃安不会用自己的电池产品线替代外部供应商 埃安将于今年年底建成并投入使用的自研动力电池试制线引发了外界关注,这是否会意味着将来的埃安在动力电池领域要自给自足呢?古惠南表示:不用担心。 这条试制线的出现只是为了满足埃安在电池技术研发方面的验证。埃安已经在电池技术研领域做了五六年的时间,已经掌握了从电芯到模组、PACK与BMS电池管理方面的核心技术。古惠南认为动力电池与车的性能紧密关联,而电池的技术研发必须要整车厂配合才能完成,所以埃安才有了这样一条试制线。 古惠南特意要外界打消疑虑:“我们不是想替代这个工艺的供应商,我们的目标只是掌握电池技术,能够实现小批量的供应来供应给自己,至于大批量的应用还会交给专业的动力电池公司,目前我们不会考虑用自己的产品来代替我们的电池供应商。”
扭亏为盈!650亿疫苗龙头境外营收增480倍,百亿名基再加仓
3月27日晚间,康希诺生物股份公司(下称“康希诺”)发布2021年年度报告。 数据显示,康希诺2021年实现营业收入42.99亿元,相较2020年同期的2489万元大增17174.82%;净利润实现19.14亿元,2020年同期则为亏损3.97亿元。基本每股收益7.74亿元,2020年同期则为亏损1.72元。 分季度看,康希诺分别在2021年第一季度至第四季度实现营收4.67亿元、15.94亿元、10.24亿元和12.14亿元。净利润分别实现-1.4亿元、9.51亿元、3.97亿元和5.8亿元。分地区看,境内贡献营业收入12.4亿元,相较上年同期增6600%;境外贡献营收30.57亿元,相较上年同期增长48074%。 公开资料显示,康希诺是一家致力于研发、生产和商业化符合中国及国际标准的创新型疫苗企业。现主要从事疫苗的研发、生产及商业化,主要产品为重组新型冠状病毒疫苗(5 型腺病毒载体)、脑膜炎球菌疫苗、重组埃博拉病毒病疫苗(腺病毒载体)、百白破疫苗、肺炎球菌结合疫苗、结核病加强疫苗等。 作为一家创新型企业,研发人才是核心竞争力。财报数据显示,截至2021年末,康希诺研发人数309人,占公司比重15.88%,平均薪酬29.8万元。 从股东持仓来看,焦巍管理的银华富裕主题混合基金四季度末持有康希诺340万股,首次进入前十大股东。从该只基金过往持仓看,焦巍于2021年中报时建仓174万股,并于三季度加仓至218万股。 截至发稿,康希诺股价报261.86元/股,总市值648亿元。
蔚来搏未来
3月25日,蔚来发布年报,“赚钱”能力增强,但研发投入近乎翻番,因此与大部分新造车企一样,蔚来未实现盈利。李斌称扩大技术投入“是不会妥协的”,且还会继续加大。背后逻辑很简单,维持毛利水平的基础上,通过不断扩充产品,在量产车型中放大技术优势,支撑蔚来的销量提升,而提升销量后,研发投入会被分摊,从而实现盈利。 为了长期主义,蔚来不怕亏? 蔚来更会花钱了。 3月25日,蔚来发布2021年年报及第四季度财报。财报显示,去年第四季度,蔚来研发支出达到18.29亿元,较上个季度增加53%,也是蔚来美股上市以来研发投入最多的一个季度。根据财报显示,蔚来2021年全年研发投入为45.91亿元,较上一年度24.9亿元的研发投入增长84.7%,占营收12.7%。 事实上,蔚来主营业务的“赚钱”能力增强。从财报来看,蔚来整车毛利率维持在20.1%。截至2021年1月,蔚来品牌车辆平均成交价超43万元,高于很多传统豪华品牌。 另一方面,蔚来的亏损收窄24.3%,在仍未实现盈亏平衡的基础上,研发投入大幅增加,是限制其现阶段盈利的一大原因。 “去年(2021年)我们基本上执行的公司财务战略是我们的毛利能覆盖销售费用和管理费用,我们执行得还不错。”李斌称,过去一年,公司的主要亏损即在于对长期研发的高投入。 不止蔚来,事实上,目前大部分新能源车企都未实现盈利。这背后,如果把新能源汽车比作上半场,智能网联汽车比作下半场,中国汽车行业上半场取得了很大成效,但决定胜负还在下半场。车企也深谙此理,在下半场的竞争中,谁都不敢松懈。 财报电话会议上,蔚来创始人李斌称,在毛利已经可以覆盖销售管理费用的经营现状下,蔚来将在未来几年继续加大研发投入。 “我们全年的研发投入与去年相比,增长会超过一倍,有很多是长期技术的研发,包括明年上市新车型的研发,也包括进入全球市场的一些车型的适配。今年年底预计研发人员会到9000人的规模。”李斌说,“(对于)研发的投入毫无疑问,我们是不会妥协的。” 对于蔚来加大研发投入的逻辑,理解起来并不复杂,由于新能源汽车已经进入了超大的增量市场。今天能不能赢,并不重要,毕竟目前市场盘子还不够巨大,但是随着新能源汽车市场渗透率加大,接下来几年能不能赢,就十分重要了。到最后,各家车企拼的是全方位能力。其中,最重要的一项就是技术能力,包括全栈自动驾驶技术和动力电池相关的关键领域。 为了接下来的三至五年中能够更有竞争力,蔚来只能暂时放弃短期内盈亏平衡的目标。对此,有业内人士认为,这是在产品和技术高倍速更迭的新能源智能汽车赛道上,把资金投进去做研发,为了打造出更多有竞争力的技术和产品的做法,目的是几年之后的市场爆发。 蔚来的危机意识:预防“卡脖子” 毫无疑问,在技术、产品、商业模式高倍速迭代的新能源汽车市场,加大研发是竞争所需。 这一点,在软件和智能驾驶层面体现得淋漓尽致。蔚来虽然已建立起足够的研发实力,但汽车工业全方位智能化的过程,目前还是正在进行时,对于一家在长跑赛道上竞赛的企业而言,蔚来需要投入更大精力主动探索,而这些都需要持续的投入。 软件能力是未来车企打造差异化必不可少的条件,而车企围绕人才的竞争焦点也“由硬向软”,从传统造车技术人才转变为智能网联、自动驾驶等领域人才的竞争。 当大众汽车宣布组建5000人的软件部门时,就代表着大众加速车内智能布局以及数字化转型步伐,这就意味着,造车逻辑发生了根本变化,车企追求产业链核心技术的自主可控和技术创新研发已成为刚需。 以行业标杆特斯拉为例,2020年,特斯拉的研发费用合到每辆车上近1.9万元,是行业平均水平的3倍,在埃隆·马斯克眼里,汽车就是一个可以载人的“机器人”。 为加强技术能力,蔚来“求贤若渴”,2022年要把自己的研发团队扩大到近万人的规模。 “没有全栈自研的能力就会被卡脖子。” 一位蔚来内部人士告诉《财经天下》周刊,当前,人才是车企争夺战中最重要的,没有人才就没有全栈自研的能力,自动驾驶研发、电池研发这些核心技术研发都要人。 据不完全统计,车企发布的自动驾驶研发、智能座舱设计、软件工程师、用户运营等岗位的需求同比增幅已经超过1.8倍。蔚来储备更多人才,也是为了解决技术问题。 实际上,现在蔚来服务好、品牌口碑也不错,但蔚来部分产品,的确走在技术升级的十字路口上,主动升级成为必须投入精力的事情。 此外,李斌承认,目前其在售车型ES8、ES6、EC6座舱等智能硬件,已经到了升级的周期内,“2022年我们计划对ES8、ES6、EC6进行智能硬件的升级,同时也会给现有的用户提供后装升级服务。” 此情况下,蔚来只能加大投入来维持赶超。而智能化等技术的全面投入,是提升企业竞争力和改善盈利水平的重要因素。这些已在蔚来的诸多产品上得到体现,但未来会继续体现在更多产品上。 在业内人士看来,蔚来“烧钱”研发实现盈亏平衡的逻辑很简单。维持毛利水平的基础上,通过不断扩充产品,在量产车型中放大技术优势,能够继续支撑蔚来的销量提升,而提升销量后,研发投入会被分摊,从而实现盈亏平衡乃至盈利。 2024年盈亏平衡,蔚来还需做什么? “对核心技术的研发投入,不仅能够增强我们技术和产品的持续竞争力,长期来看也能提升毛利率水平和盈利能力。”李斌还明确了其具体的市场预期扭亏为盈的时间点会出现在2023年第四季度,并在2024年全年实现盈利。 要想实现盈亏平衡,一般有两种路径:第一是增加营收和毛利率;第二是减少支出。蔚来目前处于加大研发投入阶段,新车型亟待推向市场,渠道和换电站也在扩张,支出显然必不可少。 至于增加营收最重要的方式,就是多卖车。需要注意的是,2021年,蔚来的全年毛利率提升至17%,蔚来整车毛利率达到20.1%,创历史新高。稳健的整体毛利率为蔚来接下来的发展奠定了盈利的基础。 这也就意味着,蔚来车卖得越多,整体毛利就越高,支出虽然在增加,但只要收入增加的速度高于支出增加的速度,实现盈亏平衡就比较容易了。过去一年蔚来的净亏损比收窄,也离不开销量的增长,以及毛利率的提升。 事实上,蔚来也将此次盈利的主抓手放到了汽车销售主营业务上,并发起了自成立以来最大规模的一次产品攻势。2022年,蔚来将推出包括ET7、ET5、ES7在内的三款基于第二代技术平台NT2打造的全新车型,另外,面向大众市场的新品牌首批产品也已经进入了关键的研发阶段。 新车型代表了蔚来的最新技术水平,在ET7身上,蔚来倾注了大量心血,在这场核心实力上的较量中,外界可以从ET7的身上看到蔚来有要赢的冲动。 它是蔚来NT2平台开发的首款高度智能化电动旗舰轿车,采用最新的Orin芯片,算力高达1016TOPS,是目前最强大的量产移动计算平台,此外还采用了固态电池,续航里程最高可达到1000公里,蔚来ET7的目标竞争对手是宝马5系。 ET5作为一款中型轿跑,为蔚来打开了30万元价格大门的局面,是蔚来的入门款车型。李斌直言,ET5的订单火爆程度超过蔚来此前所有车型,该车型预计2022年9月开启交付。而中型5座SUV产品ES7本来预计将于今年北京车展对外正式发布,同时与宝马X5直接展开竞争,国产前的X5目前的月销量稳定在4000多台,蔚来对这款车的期待很高,该车将在今年第二季度发布并交付。 但《财经天下》周刊也注意到,从车型配置上看,这三款车型具备很强的竞争力,对接下来的交付会有很大提振作用,即便蔚来有NT1和NT2两个几乎完全不同的车型平台,属于新旧平台共存,但并不会影响现有车型的市场竞争力。 正如李斌所说:“我们不认为这会对现在的866SUV的销售有什么影响,它应该会是一个增量。ES7所在的五座SUV市场容量是20多万辆,而且还在不断地增长,我们对这个细分市场还是非常有信心的。” “现在卖车环境也与燃油车时代大不相同,新能源车企其实都是在找自己的用户和市场生存空间,只讨好属于自己细分市场的人。”一位业内人士告诉《财经天下》周刊,但挑战在于,“三辆新车毕竟交付时间晚 ,同类优秀产品也越来越多,我预计放量的时间会有所延长。” 事实上,蔚来毛利水平较高,现在对2023四季度盈亏平衡的预期,其实已经是参考了原材料上涨的现实因素。 与此同时,行业面临部分原材料上涨压力,李斌明确表示,目前在售车型ES8、ES6和EC6近期不会涨价,但三款新车会针对智能硬件进行提升。“我们要看到时候原材料价格来制定具体政策。” 李斌还透露,出于对原材料成本上涨的考量,2022年全年整车毛利率目标为18-20%。 另外,蔚来的大众化新品牌也有了最新的消息。“蔚来品牌主要在5万-10万美金的区间,然后用一个新的品牌进入大众市场,这是一个更好的策略。保时捷、奥迪、大众,或是雷克萨斯和丰田,都是非常成功的例子。”李斌说,进入大众市场的前提是通过完整的效率导向去设计有足够毛利的产品,“我们不会牺牲毛利去进入大众市场。” 据悉,目前该业务工作进展顺利,核心团队搭建完成,首批产品也已经进入了关键的研发阶段。蔚来品牌的大面积投入或许也可以赋能给大众市场新品牌,助其更快实现盈利。 此外,2022年,蔚来将累计建成1300座换电站,6000根超充桩,10000根目的地充电桩,全面提升蔚来服务和销售网络体系实力。2022年,蔚来将继续在中国扩展销售服务网络,计划全年新增不少于100个销售网点,新增超过50家蔚来服务中心和授权服务中心。 日渐成熟的产品和服务、充足的现金流、逐步加强的成本控制能力和资金使用效率、越来越完善的供应链体系,也让蔚来的护城河不断加深并加宽。 “蔚来现在的现金流很充裕,现金存货差不多554亿元,虽然足以支撑起其基础设施和业务运营,但还是需要合理调整控制,做好健康发展。好日子也要当紧日子过。”一位业内人士说道。
百度李震宇:自动驾驶正在成为智能汽车的竞争焦点
“伴随着新一轮的科技革命和产业革命,中国汽车正在经历着百年一遇的重大变革,电动化拉开了汽车产业的序幕,而人工智能、自动驾驶、车路协同正在重构未来的汽车、未来的交通和未来的城市。”在3月26日举办的中国电动汽车百人会论坛(2022)上, 百度集团资深副总裁、智能驾驶事业群组总经理李震宇指出。 展望未来汽车,百度认为,它将会具备自我进化能力的新物种,它将具有情感和智慧的机器人,不仅具备L4级别或者L5级别的自动驾驶能力,而且能够比人类驾驶更安全。它还具备语音、人脸识别等多模交互能力,可以分析用户潜在的需求,主动提供服务,是忠诚陪伴人类出行的智能助理。此外,它还具备自我学习和不断升级的能力,可以在各类场景中为人类提供服务。 而面向未来交通的发展,李震宇认为,在未来10年甚至40年,车路行一体化是交通发展的必经之路,从数字化(人类驾驶员&应需交通诱导),到网联化(少量无人驾驶&环境信息辅助)再到自动化(完全无人驾驶&一体化决策)。 随着未来交通系统的升级,汽车机器人的日益普及,丰富的智能网联场景将应用到阡陌之中,城市规划、能源供给、通信服务、产业发展等相应发生创新变革,交通出行行业的技术创新,让城市治理、人们的生活更加美好,人享其行,物畅其流,我们的生活将变得更加安全、便捷、高效、经济、绿色。 百度在出行这个大领域也耕耘了近十年,李震宇在此次论坛上重点分享了百度在实践过程中的发现的一些重要机遇。 创新机遇1:自动驾驶正在成为智能汽车的竞争焦点。 随着各方的投入、政府政策的支持、相关企业的竞争,将加速自动驾驶时代的到来。在过去一年,自动驾驶发展明显提速。去年5月,在北京的首钢园区首先开放了商业化的无人化运营,在今年1月,北京的开放道路上已经开始了大规模的无人化测试,驶入了亦庄核心区域的社会开放道路。 同时也看到,自动驾驶也在加速商业化的运营落地。去年11月,北京正式开放了国内首个自动驾驶出行服务试点,自动驾驶正由技术验证、产品开发迈向了商业化布局的新阶段。百度获得首批运营许可,得以把服务放在真实的环境中接受市场的体验。自动驾驶服务已经开始慢慢成为一些老百姓通勤的选择之一。目前百度的萝卜快跑,已经在北上广深等八个城市面向公众区开放。 百度在实践中也深刻意识到,其实未来已经到来,无人化正成为全球自动驾驶技术、产业竞争的制高点,是智能网联汽车发展的必然趋势。 创新机遇2:车路云图融合发展,是中国汽车产业“换道超车”的关键路径。 近年来,传统的交通正在实现智能化的升级,这个智能化的转型可以理解为“一个数字底座”、“三个智能引擎”,还有上面支撑的“N个生态应用”。 简单来看:“一个数字底座”是车路云图的数字化升级,“三个智能引擎”分别以自动驾驶、车路协同、MaaS出行服务为核心的技术,“N个生态应用”就是在车路云图的智能底座基础上形成新的产业生态。整体架构,面向未来,还能服务当下。 车路云图为所有的参与者提供服务、创造价值,广大的开发者生态合作伙伴和产业上下游都可以进行丰富的应用开发,比如面向未来的自动驾驶出行、园区的新物种,还有服务当下的智能信号灯、智能停车、智能网联服务等。这些应用在过去一段时间都取得很显著的进展。 车路云图数字化升级,可以让交通更加高效。在河北保定,百度的“ AI 智慧交管大脑”让红绿灯能够看清路口流量的状态,能够看懂交通的演变规律,并实时动态调整红绿灯的配时策略,就是灯看到车,车过来的时候适时调整。目前已经在多条主干道形成绿波带,让市面一路绿灯出行,不再依赖好运气,行程时间缩短了20%。 在长沙,百度建立了覆盖全域的停车管理平台,静态交通管理和市民动态服务结合起来,改善了城市停车难、停车乱的现象,有效提升了城市核心区的通行效率。核心区的泊车位,周转率提高了3倍,周转效率提高了56%。 车路云图在智能网联中的广泛应用,还可以创造更大的价值。在高速场景中,过去因为雨雾这种恶劣天气,经常封路,因为有些是安全管理的要求,也有些是基于实际技术水平的限制,会存在一些不合理封路的情况,也带来了很大的经济损失。 实际上,智慧高速可以有效解决雾天通行的问题。通过车路协同看到车端视角的问题,能够保证车辆安全行驶,预计可以大幅度降低不合理的封路和交通事故,实现高速公路准全天候的通行。 而在城市的复杂场景,车路云图的协同应用正在加速自动驾驶的规模落地。自动驾驶规模化落地的最大挑战是安全,目前来看,在城市道路里最难的是路口,仅仅凭着单车智能,会存在一些场景中无法解决的问题。 比如,信号灯遮挡、盲区感知、超远视距,还有一些障碍物、地图更新等,但是这个路口经过升级之后,可以有效的解决这些问题,路侧的基础设施已经具备了感知和规划决策的能力,高精地图能够提供动态的更新路况的信息,云端的数据能够提供协助的决策,相辅相成。 同时云端还有一个5G的安全员,他可以提供远程的安全冗余,车路云图协同应用可以带来图中显示的上帝视角,支持车辆在车端的控制执行,打破单车感知和场景理解的局限性,降低困难场景的复杂度,提升路口的通行效率。 在去年5月份,百度联合清华大学智能产业研究院、北京高级自动驾驶示范区一同发布了Apollo Air计划,共同验证了车路协同可以让自动驾驶更经济、更安全。李震宇表示,百度坚定的相信,车路协同的技术价值和市场价值,是中国汽车产业实现换道超车的关键路径。 在演讲分享的最后,李震宇表示,“一直以来百度Apollo秉承开放的理念,以领先的技术和开放的平台,向全社会赋能,开放能力,共享资源,加快创新,持续共赢。我们相信智能汽车、智能交通的发展,来自于产业技术突破和上下游的紧密协同。”(本文首发钛媒体App
直播实录 | 全面剖析新一代高性能AI计算集群中的技术方案和应用
导读: 百度智能云于3月9日对外宣布落地新一代高性能AI计算集群,可提供EFLOPS级算力支持,并发布新一代GPU服务器实例GPU-H5-8NA100-IB01。 3月16日,智东西公开课联合百度智能云、英伟达,策划推出「百度智能云&英伟达新一代高性能AI计算集群」线上分享会,并在B站企业号“百度智能云的朋友们”和“百度智能云”视频号,以及“智猩猩”视频号上成功进行同步直播。 百度智能云的异构计算产品经理玄凌博、资深研发工程师孙鹏、资深系统工程师武正辉,以及英伟达解决方案架构师程帅四位技术专家参与了本次线上分享会,并围绕新一代高性能AI计算集群中的技术方案和应用进行了深入剖析。 GPU云产品体系介绍和应用场景分享 百度智能云异构计算产品经理玄凌博 从算力维度出发,首先回顾企业在计算方面的发展 按照时间维度,企业有四个典型的计算发展阶段: 1、2006年以前,大多数企业仍是以传统物理机为主的单体IT架构; 2、2006年以后,随着企业上云的大趋势,迎来了云计算的时代,并随着云服务器、弹性裸金属等产品的爆发,能够弹性按需的满足企业对IT资源的使用诉求; 3、2017年以后,随着云原生技术的成熟,像容器、微服务等技术不断的商业化落地,能够为企业提供极致弹性,云原生应用的开发架构; 4、2020年以后,随着人工智能技术不断的爆发及增长,现在正迎来一个AI原生云的阶段。 企业需要极强的AI算力,来满足各个AI应用相关的开发及训练。在这个时代,云服务器厂商需要提供极致弹性且高性能AI算力,是适用于AI应用开发的云架构。 为了更好的解决人工智能计算的并发问题,通常会使用适用于计算密集且易于并行计算的GPU。 随着计算架构的不断发展,异构计算加速器通常会包含多种计算核心,来更有效率的加速特殊数据格式的计算。以NVIDIA GPU为例,通常CUDA Core是面向通用计算的计算核,能够计算几乎所有的数据格式。RT Core则是面向渲染里做光线追踪的加速单元,而Tensor Core则是面向人工智能或深度学习里做矩阵向量乘加的核心。近年来,很多国产的AI芯片也采取了类似的思路和策略,例如昆仑芯,包含拥有大量的面向矩阵做加速的处理单元。 异构计算是AI原生时代重要的算力底座。百度内部拥有大量的AI应用场景,多年的AI算力建设经验和技术积累,通过百度智能云对外提供的异构计算云服务,能够赋能千行百业。 云上的异构计算服务主要分为两种:一种是以BCC异构计算云服务器的形态,提供极致弹性、灵活、高性价比的算力规格。而搭配BBC异构计算的弹性裸金属服务器,能够做到算力的零虚拟化损失、百分百服务于客户业务,提供极高性能的算力,且满足部分客户对安全隔离性的要求。 百度智能云支持丰富的异构加速卡的型号,支持英伟达最新的安培架构计算卡,也提供自研的加速芯片昆仑芯。在高性能的异构计算上,用户可以在分钟级创建以往可能花费需要数月来构建的InfiniBand集群环境。 在产品命名上,主力产品的实例规格族和异构卡类型是一一对应的,比如GN5通常会支持英伟达安培架构的卡,GN3会支持上一代的架构,像V100、T4等。在实例规格的搭配方面,实例根据GPU的一些物理规格,例如显存、SM等,经过了合理CPU、内存配比。针对部分的异构计算卡也提供了像vGPU的实例,能够提供更具性价比的计算算力和渲染算力服务。 在面向AI应用爆发的时代,异构计算产品也在不断打磨,推出新的产品特性。除了业界对云服务的一些通用要求,像运维及弹性按需之外,百度智能云也深耕GPU虚拟化技术,通过透传、GPU分片以及多容器共享等技术,能够更好的提高客户对资源的利用率。在硬件层面上,也是百度智能云投入的重点,陆续推出了自研的AI芯片、AI架构服务器,即X-MAN,以及云上高性能的网络组网方式,目的是能够不断提高AI全栈的负载计算效率。 在异构计算卡、服务器和网络等方面,百度智能云的产品能力有哪些? 不同GPU的型号都有不同的定位,面向计算的GPU,比如AI推理、训练或者HPC的型号,通常会在双精度浮点FP64以及半精度FP 16上做一些特殊的加强。有些GPU则会支持更多的应用场景,例如A10,有更多的CUDA Core和RT Core,在渲染场景也有很好的性能,提供更强的单精度算力。 除了计算单元,显存也是一个很重要的参数。A100和A30都是支持HBM的。对于一些访问密集型的计算,HBM显存会有更强的性能表现。此外一点是GPU的P2P能力,PCle这一代在双向带宽上可以做到64GB,而支持NVLink的计算卡,比如A100、V100,能够在GPU P2P上有进一步的能力提升,像最新的NVLink 3.0,可以做到双向600GB的量级。 除了英伟达的卡,昆仑芯也来迎来了第二代。第二代的昆仑芯在性能上都有了全方位、大幅度的提升,比如在通用性以及各个规格的算力,工艺也从13纳米到了7纳米。除了性能的提升,也集成了ARM核,可以更好的适用于一些边缘计算场景。此外,也考虑到了分布式的典型AI应用场景,昆仑芯也可以支持K-Link这种高速P2P能力。如果客户在云上突然对虚拟化有一些诉求,昆仑芯可以在物理上支持虚拟化。在软件的适配性上,提供了更友好的开发环境,支持C和C++编程。 本次讲解的重点话题是云上的高性能计算集群,以往企业搭建一套高性能计算集群,需要投入极高的人力成本和数月的时间成本。而大部分客户使用高性能计算,追求的是极高的业务时效性。使用百度智能云可以分钟级获取到一套高性能的异构计算实例,也就是利用最新发布的高性能H5系列,来组建高性能集群,这套实体也是基于X-MAN架构来对外提供服务。 在计算效率上,数据的访问效率及通信效率都进行了硬件层面的升级与增强;在配置上,标配了业界最高规格的配置,比如英特尔铂金系列CPU,全闪存的本地盘,还有和GPU 1:1配比的InfiniBand网卡;I/O设备可以直连A 100 GPU,这样可以通过GDR、GDS加速GPU读取I/O设备的访问效率。 在集群分布式的AI训练中,往往会有一半的时间用于GPU节点之间做梯度交换,而在交换时则会造成计算资源的闲置或浪费,影响了整个模型的收敛效率。那RDMA的高性能网络,可以极大的降低节点之间的时延,而InfiniBand作为天然支持RDMA的通信协议,有极强的性能表现。InfiniBand对比传统TCP IP协议,对时延有极大的提升。 从实际模型的训练表现来看,以BERT的训练为例子,高性能计算H5对比云上普通的A100,在单节点上差距并不明显,但在整个集群训练中,即便是4节点的小规模计算集群,高性能计算H5也可以带来近2倍的吞吐性能。更高的吞吐意味着模型收敛时间可以进一步降低,一个小时的训练任务可以缩短到接近半个小时,成本可以节约近50%。 那么如何更有效率的发挥硬件的性能?百度在去年推出了百度百舸·AI异构计算平台,除了高性能H5这些计算实例外,也推出了AI容器、AI存储,进一步能提高GPU工作效率和作业效率,像AI存储可以提供百万级IOPS和百万GB吞吐的能力,可以进一步的提高训练数据读取效率;AI容器则提供多种调度以及GPU增强能力,比如AI作业调度、集群管理能力,并且提供GPU容器虚拟共享。 超大规模AI异构计算集群的设计和优化 百度智能云资深研发工程师孙鹏 最近,业界有一个很大的趋势是训练规模越来越大的模型。从GPT-3开始,模型已经被推到了千亿参数量的维度。从2020年到现在,各个厂商也在不断推出更大参数量的模型,比如OpenAI的GPT-3、Google的Switch Transformer,百度去年也先后推出了多个大模型,像ERNIE 3.0 Titan,它是全球最大的中文单体模型。 现阶段大模型还会成为一个逐渐演进趋势,比如可以类比人脑,通常认为人脑中有861亿个神经元,每个神经元大概有7000多个突触,近似的做一个类比或代换,大概有60万亿的参数规模,约是GPT-3模型参数量的300多倍。现在的模型规模离人脑的通用智能还有很大差距,这会是一个值得持续投入和研究的领域。 那大模型究竟是个什么样子?该怎么用它呢?文心大模型提供了一个线上试用的地址: https://wenxin.baidu.com/wenxin/ernie,感兴趣的同学可以打开试一试。 文心大模型可以在NLP领域支持多个任务,包括歌词续写、旅行问问、剧本生成、对联续写等。举个简单例子,输入文本“7月11日准备去青海,该准备怎么样的服装”,文心大模型会根据训练过的模型数据自动生成一段对话:“如果是自己去,要准备好衣服、雨衣、帽子、墨镜、手机、相机,还有一些生活必需品,如手表、相机、雨衣、防晒霜、太阳伞、洗发液等。这些是在青海的基本必需品。”,结果看起来比较符合真实场景,也比较符合人类智能,这就是用大模型的实际感受。 同时,大模型不仅业务效果好,而且对业务还会产生很多的收益,比如随着模型规模越来越大,业务训练过程中的损失会越来越低,而且呈Power-law的趋势。并随着参数规模的倍数增长,Test Loss会线性下降,这也带来了一个启发:可以用大模型的方式提升整体业务的训练效果,或整体业务在线上的效果。 除此之外,研究人员还发现大模型可以通过小样本在其他领域取得很好的效果,不需要像原来一样,对每个业务场景都重新训练一遍,而是先拿一个大参数的预训练模型,结合特定领域的小样本做finetune,可以很快完成业务的迭代。而从一定程度上也反映,它其实是一种更接近通用智能的方式。 虽然大模型有很多好处,但大模型训练会很难,那究竟多难呢?比如有3000亿条词语,需要1750亿的参数,这样的模型计算量大概是420ZFLOPS,其中1 ZFLOPS是1024 EFLOPS,1 EFLOPS又是1024 PFLOPS,这是一个非常大的数量级。也有论文分析,对于这么大的参数、这么多的样本,用1024张A100卡,也需要月级别才能完成训练,这对整个训练和技术架构的挑战都是非常大的。 百度智能云现在做的就是如何在大规模参数情况下完成高效稳定的持续训练。模型训练需要这么多的参数,也需要很多的计算资源,因此需要搭建一个集群来支撑整个训练。 有集群建设经验的同学可能知道,搭建一个集群并非易事,这个过程会有很多不同的选择,比如单机该如何选,训练卡是什么样,训练卡内部的互联方式是什么样,多机之间又应该如何架设网络保证它们之间能高效通信,网络规模又需要是什么样的,这些都是在集群建设中很关键的问题。 要解答这些问题,必须深入整个理解大模型训练的过程和模式。所以接下来会结合现在业界比较主流的几种大模型训练方式,对它进行展开和剖析,看看完整的训练一个大模型需要什么样的计算、通信和过程。 先来看下业界比较主流的混合并行的模式,混合并行是指什么?先来做一个简单的数学计算题,在当前的大模型下,假设以1000亿参数为例,每个参数需要占4个字节,是FP 32的数据类型,因此仅对于这个参数来说,就需要400G左右的存储空间。对比市面上最大的计算卡,一张卡可能只有80G,像NVIDIA A100,在400G到80G之间存在一个很大的GAP,尤其是包含了其他的一些梯度等中间变量之外,GAP会变得越来越明显,所以无法简单粗暴的像以前一样把一个模型塞到一张卡里,然后通过纵向扩展数据卡来提升训练效率,而是一定要把模型做切分。 目前,大模型通常都是BERT类模型,BERT类模型的特点是不断的堆叠Transformer层,这种堆叠天然的带来一些切分的策略和方式。业界通常有几种切分策略,如BERT模型中的两个Transformer层,这两个Transformer层之间会有前后的依赖关系,即在第一层计算完之后,把计算结果传送到第二层再开始计算,这就带来了一种切分的可能性,就是按层切分, 把这种每层切分的方式叫做流水线并行,因为层与层之间可以认为是流水线的过程,先把第一层计算完,然后再流水的计算第二层。 除此之外,再观察每一层内部,在大模型的环境下,MatMul参数会特别大,导致其中的矩阵张量都会很大,在一张卡上计算会比较慢,那如何加速这个过程呢?可以把模型中的张量一分为二,一部分卡负责其中的一部分计算,它们之间的额外代价需要进行一些通信操作,这种切分由于是把一个张量一分为二,所以这种切分策略通常称为张量切分或模型并行。 有了这样的切分方式之后,模型基本可以做一个完整的训练。由于样本比较多,这时训练效率会比较低,可以通过传统的数据并行方式,不断的堆叠这些层做数据训练的加速,这就是纵向扩展方式,也是大家比较熟悉的数据并行方式。 因为显存占用还是比较紧张的,还有一些减少显存占用的策略和方式,大家比较熟悉的是Sharding方式。这些混合策略整合起来,会形成混合并行的策略,像百度飞桨提出的4D混合并行策略就是将这几种运行策略做了组合。这个是第一种大模型训练方式,即混合并行的模式。 业界还有另外一种训练方法,称为混合专家模式,或专家并行模式。专家并行模式是原来一个模型由一张卡的一部分做计算,但由于模型参数很大,所以需要把它打散到不同的卡上。现在对一些层面压缩模型的大小,让每一个卡或每一个专家只负责处理其中的一部分参数,然后只需要横向扩展不同的专家个数,就可以达到参数上的成倍或者线性的扩展。好处是可以在计算量基本不变的情况下,大幅增加模型的参数量,从而在更低廉的规模集群上完成训练,但这个训练同样也会带来一些通信能力上的要求。举个例子,原来每一个专家可能分别会有自己的一些数据,但是现在要把这些数据分发给不同的专家,所以会做一个给所有人发送数据的操作,即是All2All的操作。这个操作对整个集群的网络压力或网络要求非常高,这就是常见的专家并行模式。 在百度内部我们对整个训练的模式做了更细微的观察,以及更量化的计算。如果以1000亿参数的模型为例,对于不同的切分模式、切分策略,在通信的卡数、通信量上以及在通信过程中做计算时间都会有不同的差异,这就能整体推导出对集群需求会不一样。比如流水线并行,一般会把不同流水线的层放到不同机器上,机器之间需要互相传递最后一层的激活以及反向梯度,这通常是一个标准的Send/Recv操作,而这个数据量大概在MB级别。这种并行模式对集群的要求是机间的P2P带宽延迟要非常低,从而尽量减少对整个模型训练的阻塞。 大家比较常见的数据并行模式,同样也会把它分成不同的组,然后组内全部卡都要做数据并行的AllReduce操作。虽然看起来数据通信量很大,但是留给它的计算时间相对的充裕一些,不过整体上来看,仍然要求很高的机间高吞吐AllReduce操作。 最后一个是专家并行模式或者混合专家模式,它要做全卡之间的All2All操作,每张卡在往外发数据的同时,每张卡还要做收数据,这对整个集群要求非常高,尤其是对网络上的吞吐和整体网络的交换能力,这个也导出了要求机间高吞吐All2All的需求。 结合论文来看,还有一个隐式的需求,比如在英伟达在《Efficient Large-Scale Language Model Training on GPU Clusters》论文中预估过:1750亿参数的模型,在3000亿样本的规模下,即使是1024卡,也需要训练34天。维护过集群或做过分布式学习的同学可能都会知道,这么多卡在这么长时间之内不出现故障基本是不可能的,那如何保证在有故障发生的情况下,模型能持续稳定的训练,也是亟需解决的问题。 总之,为了训练一个完整的大模型,要建设一个机内高速通信、机间有低延迟高吞吐能力,同时支持大规模算力的集群,还要保证它能持续稳定的月级别训练。 百度智能云推出的百度百舸·AI异构计算平台,就是基于这样的AI工程能力构建的解决方案。 百度百舸·AI异构计算平台在底层使用了超级AI计算机X-MAN,也基于InfiniBand做了一个大规模网络的建设,同时还配合上自己的高性能存储,解决了数据I/O的问题。在这之上,还给AI容器做了一些优化,比如有高效的AI作业调度、AI加速引擎,再配合上PaddlePaddle框架、TensorFlow框架、PyTorch框架,可以很方便的给开发者提供高性能、高效率且稳定的大规模模型训练的平台和场景。 首先,从单机层面看,单机用的是X-MAN 4.0超高性能计算机。这款计算机上搭载了8块NVIDIA A100 80GB GPU,共提供640G显存,因为需要卡与卡之间的高性能通信,所以启用了NVSwitch,保证机内带宽能做到134GB每秒。同时,为了能保证机间能做高性能的互联,最终选择了8×200G的网卡,接下来会用IB网络做互联。这台机器的效果怎样呢?在最近发布的MLPerf 1.1单机训练A100 80G规格中,做到了全球TOP 2。 再来看下集群,集群上关注的是规模如何以及集群互联方式是什么样的。这里选用了一个面向大模型优化过的三层Clos架构,分别是Tor层、Leaf层、Spine层,它最大能支持到16000卡的超大规模集群,这个规模是现阶段全IB网络盒式组网的最大规模。 上面提到在计算过程中会频繁做AllReduce操作,甚至会做All2All操作。结合这些计算模式,尤其是针对AllReduce需求,做了一个8导轨网络的定制优化,即在同号卡尽量减少跨网络的跳步数,从而增加网络的稳定性,以及减少对整体网络的冲击。此外还充分使能了IB网络中的Sharp能力,整体支撑集群的稳定和持续训练。 在网络架构上,结合CPU、 GPU做了联合网络规划,从而高效的提供网络拓扑感知能力。那这个集群的效果如何?在建完之后做实测,发现集群中的P2P延迟能做到1.4us左右,网络中平均时延小于2us。单机转发延时小于200ns,远低于以太网络的400~500ns。在96机All-Reduce算法带宽实测为78GB每秒。同时,为了保证作业能稳定的训练,还特意测试了性能稳定性,性能稳定一致性能做到98%的水平,也就是接近一个一直在稳定通信的状态。有了这样的集群就可以让算力发挥的更好,从而让训练时间变得更短。 即使集群搭建好了,但上面的所有软件或模型也不可能一直安全的运行下去。除了硬件之外,还要在软件层面做一些软硬结合的联合优化。百度有8年多的万卡规模EFLOPS算力最佳实践的能力和积累,然后把这些最佳实践统统用到了自研的平台上,下面介绍几个比较有特色的: 首先是自研的异构集合通信库ECCL。由于内部有很多不同代的GPU,还有昆仑芯等不同的异构芯片,如何把所有的芯片都高效使能起来,是要解决的一个关键问题。同时,在大规模上还需要解决一些拓扑探测、拓扑感知的问题,所以也把它放在通信库中。 在此有这么多资源,还需要做一个比较好或比较科学的调度和管理,包括AI作业调度、硬件感知,及在训练过程中发现的故障节点和慢节点的感知,放到了集群资源管理层中。 百度自研的PaddlePaddle框架,提供了从框架到集群再到通信联合优化的可能性。 下面会为分享一些具体的case。先从通信来看,自研的异构集合通信库ECCL是为了解决现在集群中同时存在多类芯片,但集群中的容错能力有限,而且有一些慢节点业务感知不到,慢慢的拖慢了训练效率。为了解决这些问题,设计了一款自研高性能集合通信库,它首先是面向超大规模设计的,专门为这些弹性能力做了一些考虑。此外,还提供了一些拓扑探测、通信算法的高性能实现,加上刚才提到的在训练过程中很敏感的故障感知,提供了部分的自愈能力,这些都在大集群中做过验证。除此之外,还具备异构多芯的特点,能支持GPU和CPU之间、GPU和昆仑之间的高性能通信。总之,它就是为了加速卡与卡之间AllReduce等级流动性操作而设计。 异构芯片通信通过联合GPU、昆仑团队,把传统需要通过CPU中转、CPU过滤转发进行通信的方式,通过Direct RDMA的方式直接进行实现,这样可以有效减少数据拷贝的次数,提升通信性能。 IB网络中也有很多有意思的能力,比如做AllReduce操作时,为了保证网络吞吐尽可能发挥,会在算法层做一些AllReduce实现。AllReduce本身会进行两次操作,比如同一块数据要做两份,但会给集群带来的是数据要在整个网络和集群中进行两次。IB有一个很有意思的特点叫Sharp,即把整个计算卸载到交换机中,对于用户来说,只需要把数据传给交换机,交换机就可以把AllReduce计算完的结果再反馈给我,整个过程能使数据通信的带宽降低、减半,也能使算法翻倍。同时,由于减少跳步之间的次数,可以让通信延迟更加稳定,这也是在大集群中跟英伟达联合使能的一个工作。 在大集群训练中会需要做All2All操作,这对网络中的需求或对整个网络的冲击都非常大,因为所有的节点都在同时的收发数据,在NCCL 2.12版本中也使能了一个新的功能,就是做Rail-local的All2All,即可以利用本机高性能的NVSwitch的一些通道,减少对网络的冲击。尤其是在8导轨设计下,能很好的减少网络中的流量。在使能英伟达的联合工作之后,本地也做了一些性能测试,在64机的情况下有70%的性能提升。 在集群资源的管理层面也做了很多工作,包括面向AI训练作业的特点,提供了一些Gang调度、优先级资源管理的能力。还结合硬件的特点,尤其是结合通信中提供的拓扑能力、组网能力,做了一些相关的拓扑感知,以及TOR亲和、TOR反亲和之类的调度策略,从而更好的支撑做训练。联合框架进行了一些弹性扩缩容,包括故障容错、慢节点巡检等,都是在集群调度层面去实现的。 接下来分享下端到端自适应训练框架,众所周知,在训练过程中经常会发生故障,发生故障之后有几种做法,一种是做容错的替换,还有一种可以做弹性的扩缩容。无论是替换还是扩缩容,由于参与计算的节点所在位置发生了变化,它们之间的通信模式也许不是最优,也许可以通过作业重新排布、调度,在更好的放置来提升整体训练作业的效率。 这个过程中联合PaddlePaddle框架,整体提供了端到端自适应训练框架的能力。具体来说,当发生节点替换时,无论是因为容错还是节点扩缩容,都会重新做一个预跑,在小节点上去看这个模型需要什么样的计算方式和通信方式,然后结合集群拓扑探测出来的集群性能,再结合计算需求和通信需求,整体做了一个重新的映射。这是一个系统性、全生命周期的优化,在端到端上实测有2.1倍的性能提升。 映射和拓扑是两部分信息,一部分是框架告诉模型该怎么训练,或模型有哪些切分方式,切分之后计算模式是什么样的,它们之间的通信模式什么样。另一部分是结合自己在通信库中做的拓扑探测和拓扑感知,会探知出一个集群中的单节点和集群之间的计算、通信模式和能力,形成集群拓扑通信图。 这两个图之间会结合一些图算法,做最优映射,再将映射结果交由框架,再借助调度器的策略调度能力,做最终的硬件拓扑调度以及作业的重放置。通过这种方式,实现了一个框架调度通信库的联合优化,从而端到端的提升整体的训练效率。 最终的效果建立了一个完整的EFLPOS级算力的集群,真正的实现了月级别千卡大模型的训练。在训练过程中,整个GPU的利用率一直维持在95%以上,很好的发挥了硬件能力,千卡规模的加速倍也做到了90%以上,整个业务训练的吞吐结合业务实测大概有3.87倍的提升,这个集群也真实的支撑了像ERNIE 3.0 Titan等多个大模型的持续迭代。 超级AI计算机X-MAN技术揭秘 百度智能云资深系统工程师武正辉 GPU进入数据中心约有8~10年,这些年内GPU显存的容量、GPU P2P带宽、GPU性能都在不断提升。据不完全统计,每年GPU显存大约有一倍的变化, P2P带宽有1.5倍到2倍的变化,而且性能变化更多。 由于性能的变化,会引起GPU功耗的变化, GPU功耗变化从最早的40瓦一直到现在的400瓦、500瓦,以及到未来的700瓦等等,这种变化会引起算力提升。 由于业务模型的需求,算力的提升推动了硬件在整个性能方面的不断迭代。模型的变化大约在3~4个月会有一次迭代更新,每年大约有3~4次的迭代,而近几年硬件的变化速度明显低于模型的变化,这对整个硬件系统在设计过程中带来了极大挑战,主要表现在以下5方面: 1、算力挑战,主要表现在GPU的算力方面和整个系统的算力; 2、存储挑战,主要是GPU和存储之间通信的带宽和通信速度的挑战。 3、通信挑战,主要是GPU和GPU之间或者计算节点和计算机节之间的挑战 4、散热挑战,GPU 功耗增加散热的挑战越来越明显。 5、供电挑战,最早是12V的供电,近几年逐渐发展到54V供电,目的是为了解决大功率密度GPU在供电过程中的高功耗问题。 X-MAN 4.0的设计恰好解决了上面提到的几个痛点。算力问题上,因为整个设计是一个硬件解耦的设计,采用了GPU资源池化的解决方案,同时是一个模块化的设计,兼容了OAI和OAM;由于X-MAN 4.0设计有一个灵活的、拓扑的I/O,能够支持I/O扩展和多网卡的性能;在整体散热上,采用了风冷兼容液冷的设计,能够很好的发挥GPU的性能;供电上,采用了54V供电,相较于12V供电,系统更加稳定可靠,而且适合于大功率密度的GPU应用场景。 在整个硬件架构设计方面,采用了融合架构,即AI和HPC架构融合,整机柜和标准机架构融合,同时把存储靠近GPU,实现GPU和存储之间访问时延最短; 硬件解耦是GPU和计算节点完全分离,而且可以灵活支持不同的CPU,比如Intel 平台、ARM平台、AMD平台等;还有灵活分布的I/O,而且I/O可以扩展;GPU和网卡之间的配比关系可以实现1:1;在整个散热的过程中,有风冷和液冷共存; 另外,支持资源池化和模块化的设计。X-MAN 4.0在相同硬件配置下,它的MLperf结果在全球名列第二。 因为X-MAN 4.0具有I/O灵活的扩展性,所以对于超大规模集群来说,它有一个很好的组网能力。因为在整个集群的组网过程中,采用了200G的IB网络,实现了上行网络和下行网络的1:1的带宽。在整个的集群设计过程中,采用了Ethernet和IB共存的模式,实现了存储和GPU之间高带宽通信,实现了GPU和存储的池化。 除X-MAN 4.0之外,也看到了一些其他的产品,比如X-MAN 1.0、X-MAN 2.0、X-MAN 3.0,还有正在开发的X-MAN 5.0。对于每一代产品都有不同的产品形态和架构设计, X-MAN 1.0采用的是一个16卡的PCIe卡架构,这种架构设计当时是为了解决多机和单机处理不同任务时,可以给一个机器分配多个任务,或者把一个任务分配给多个机器,好处是可以充分利用GPU资源,从而实现 GPU资源的最大利用。 从X-MAN 1.0到X-MAN 2.0,实现了 GPU P2P带宽的提升,从PCIe 3.0提升到NVLink 2.0,而且在X-MAN 2.0时,具有灵活I/O雏形。 在X-MAN 2.0到X-MAN 3.0之后,整个网络实现了100G RDMA的通信,同时整个架构上的设计,可以支持单机内的大模型,从而在GPU和GPU之间通信采用了NVLink 3.0技术。 从X-MAN 3.0到X-MAN 4.0,整个架构发生了一些变化,即有了更丰富的I/O,能够支持更多的网卡,而且能够实现节点和节点之间的高速互联和灵活组网,支持100G网络和200G网络以及更高的一些网络。 X-MAN还能够结合4路CPU的计算节点,解决一些行业内应用的问题。 从整个架构上来看, X-MAN是硬件的解耦,而且能够灵活匹配不同的硬件平台,比如Intel平台,AMD平台,ARM平台。 另外,在整个设计过程中,采用资源池化的设计思路,即可以把一个机箱里的GPU看做一个资源池,按照业务需求去分配。 同时,机内的网络能够支持Fabric任务架构,动态的对GPU资源进行分配。 在整个设计过程中,是模块化设计,可以把整个架构分为4个模块:网络交换模块, GPU模块,存储模块和供电模块,以及计算模块。整个网络模块从X-MAN1.0、X-MAN2.0、X-MAN3.0、X-MAN4.0发生了重大的变化,而且整个时延在不断减小,网络带宽在逐渐提升。 X-MAN架构还引领了 OAI和OAM标准,因为它有一个丰富的I/O,能够实现灵活扩展,而且适合于匹配不同的计算节点,或适合于组成不同的网络和集群。 同时 ,X-MAN在新技术方面,也在不断的探索和尝试,比如散热方面,从最早的风冷逐渐过渡到冷背技术,而冷背技术在X-MAN 2.0上已经大规模的应用,在数据中心已经应用了长达2~3年,而且非常的稳定。随着GPU功耗和性能的不断提升,在未来的某个时刻内,会发现冷背的散热技术已经满足不了GPU的需求,所以会采取浸没的散热方式彻底解决GPU散热问题,提高GPU的性能。 未来随着模型的发展,可以看到芯片的设计越来越大,而且需求的带宽和时延越来越低,这样可能会形成一个芯片在未来代表一个集群,这种设计的好处是时延低、带宽大。但对于系统设计来说,散热是一个挑战。另外,还需要有一些非常高速的带宽网络满足节点和节点之间的通信需求。 随着网络和网络带宽的不断提升,在整个集群方面,需要有更高的带宽网络来满足GPU和GPU之间通信的需求。同时,由于显存和内存的局限性,未来在显存和内存的扩展方面会有新技术的出现,这样会形成显存和内存的池化技术,来满足业务的需求,从而提升显存和内存的利用率。 随着技术的发展,未来整个系统架构的设计,模块化的融合设计。而对于应用场景来看,需要精准的匹配不同应用,来满足不同应用场景和业务需求。 随着芯片技术的不断发展和整个行业互联技术的发展,从底层的芯片到服务器节点内部,CPU和GPU之间互联技术的带宽比原来越来越高,大约有2~3倍的提升,而时延在不断的降低,节点之间和Rack之间的带宽也越来越高。所以,未来整个通信方面或互联技术方面,需要更高的Ethernet或IB网络支持整个节点和节点之间的通信,或Rack和Rack之间的通信。 随着技术发展,不仅仅有IB网络和以太网,还有其他的网络用于节点或集群之间的通信,可能有另外一种低时延、高利用率的网络出现,来满足像HPC或者AI集群的通讯需求。 NVIDIA SuperPOD赋能AI数据中心 英伟达解决方案架构师程帅 AI数据中心的趋势和挑战 在数据中心里,不管是数据集还是模型大小,近几年都呈现出爆炸式的增长。从数据的角度来看,数据已经非常接近100+Zettabytes量级,更可怕的是这里面数据,90%是在过去两年的时间内产生的,这也得益于智能手机、智能终端以及消费互联网的普及,使得每个终端每时每刻都在产生大量的数据。 另外,可以看到一个趋势是AI+HPC的融合,在科学领域可以看到它的数据集在不同计算领域里也呈现非常大的增长,比如正在经历的新冠病毒,如何分析它对人类细胞的攻击变化,可能需要几百T的数据量;比如做地球气候的模拟,每天会产生200+T的数据量,这些数据都是非常大的量级。对大数据更好的洞察和解析其本身内在的一些模式,由此引出需要更大的模型来处理和分析这么多的数据。 在过去三年,以Transformer为代表的语言模型,参数量已经提升了3个数量级。2020年,GPT-3有175B的参数量,达到了千亿级别。那这样的数据爆炸及模型爆炸趋势,对计算、通信和基础架构带来什么样挑战? 首先,以GPT-3为例,从计算量来看,做了一个相关的评测。根据英伟达的《Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM》论文中的Lower bounder of each iteration公式对GPT-3模型进行解析,可以发现GPT-3最小需要的计算量和batch size、sequence length、Transformer网络层数、hidden size以及词汇表的大小有关。在实际应用中,batch size可以选为1536,通过对Lower bounder of each iteration公式计算,一个迭代步骤的计算量大概是4.5ExaFLOPS。另外,在我们的实践中,大概需要有9万多次迭代,所以总的计算量430 ZettaFLOPS。 这个计算量有多大呢?以A100 312TFLOPS的FP 16计算能力来看,需要16000张A100算一天的规模,而且还没有考虑计算过程中效率的损耗。在实际训练中,这个大模型大概需要在1000多张卡,计算训练34天。 模型变化对底层的通信也有非常大的挑战。过去, AI模型并不大,可以在单卡GPU中放下一个模型,更多是做纯数据并行的加速、迭代。在这个过程中,只需要在模型后向时去做一次AllReduce通信,把梯度全部规约一遍。而且在很多实际优化中,通信的AllReduce有很大机率会和计算重叠,有很好的一个优化效果,所以这种模式是比较简单的。 当模型大时,需要加上Tensor模型并行,即一个GPU已经放不下大模型了,必须把模型切分开。它是把一个网络层切开,每个层的第一部分可以放在第一个GPU上,第二部分放在第二个GPU上。这样做给计算和通信都带来一个挑战,即每次前向及后向计算时,每走一遍网络都要做一次通信,通信量非常大。通信通常也是AllReduce类型,所以针对这种计算通信特点,最好把模型并行的划分限制在节点内,利用NVLink以及NVSwitch的高速带宽来缓解这一变化带来的通信压力。 如果模型大到一定程度时,单机8卡的规模也放不下一个模型,则需要做另外一种划分,即网络层之间的划分,是Pipeline并行。它的特点是在相邻划分点的前向及后向计算时都会有通信,通信的类型往往是P2P通信。每次P2P通信的计算量可能不是很大,但通信的点非常多,最好的情况是每一个GPU和相邻节点通讯时,有一个最近的网卡和它配合,这样可以运用到GPU DirectRDMA的功能。这种划分的挑战是需要多网卡来加速通信。 总之,建一个数据中心大概有三方面的挑战:第一,怎么设计一个可扩展的训练平台,它可以更好的支撑不同计算特征的业务,而且还要保证它的可扩展性,以及AI模型变化带来计算特征变化的预期;第二,一个分布式的集群系统非常复杂,它需要很长的部署过程,是否有一种方案可以快速部署搭建起来;第三,部署完之后,怎样让业务部门、云客户更快的使用起来,以及自身如何做到可持续的维护。 为什么需要GPU SuperPOD 为解决上面三个挑战,英伟达推出了SuperPOD架构。大家知道英伟达做了很多AI研究,像自动驾驶、语言模型等,它也有自己的数据中心。结合过去四五年的时间,英伟达在数据中心的迭代、运维维护以及建设经验,总结出来一套方案叫DGX SuperPOD,DGX SuperPOD分为3块,一块有一套标准化的部署流程,可以帮你快速部署;第二块是架构有最优的设计,只要参考这个架构,就可以在AI训练里面达到更好的效果;第三块有一套完整的运营流程。DGX SuperPOD可以帮用户快速的搭建、使用和可持续运维。 对一般用户可以有两个选择,一种可以直接采用NVIDIA DGX SuperPOD架构搭建自己的平台,另一种正如今天的主题,百度参考了这样的架构建设X-MAN SuperPOD。用户可以通过百度智能云灵活、按需的使用SuperPOD架构,加速自己的AI业务。 英伟达基于自己的SuperPOD架构,建了集群NVIDIA Selene。NVIDIA Selene由560台8卡计算机组成,有4000多块A100 GPU,850台 InfiniBand交换机搭建的集群,存储搭配了14PB的分布式高性能存储,计算能力可以达到2.8 EFLPOS的AI计算能力。 这个集群的性能如何呢?在MLPerf 1.1版本中,以收敛到一定程度最快的时间来看,采用分布式训练的方式加速评测中的8个任务,包括目标检测、语音、推荐系统等,可以看到在所有的任务中,NVIDIA SuperPOD架构的时间是最快的,这也足以证明了NVIDIA SuperPOD架构的可扩展性和有效性。 NVIDIA SuperPOD最新参考架构解析 SuperPOD架构的设计理念是什么呢?首先,它是一个模块化的理念,它由140台的A100服务器,即1120张A100 GPU组成,它的网络采用计算网络和存储网络相隔离的方式,计算由8张200G的InfiniBand搭建起来,存储由1个或2个200G的InfiniBand搭建起来,这样可以保证计算和存储互不干扰。另外,不管是计算网络还是存储网络,都是采用了一个胖树互联的方式,而且是无阻塞的,这样可以达到更好的扩展和低延时。而且里面可以用到InfiniBand的自适应路由,以及SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)卸载的功能。 SuperPOD的可扩展单元简称为SU,每个SU有20台的规模。对于计算网来说,因为每台机器有8个200G的计算网,每个网卡都会连到Leaf层的相应位置,每台机器的第1个卡连到第1个Leaf,第2个卡连到第2个Leaf,以这样的互联方式。从Leaf层到Spine层,需要有4台Spine层交换机,然后均分的连接起来。好处是可以保证到相同位置GPU在通信时都在一个交换机上,可以减少延迟跳数;另外,可以很好的去用到网络卸载,相同位置的GPU以及相应位置的网卡通信时,用SHARP卸载功能加速这个过程。 基于1个SU的拓扑,可以去扩展到2个SU,甚至标准的7个SU。7个SU的拓扑相比于1个SU多加了一层交换机。从计算节点到Leaf层连接,和1个SU的理念一样。从Leaf层到Spine层,每个SU里相应位置的Leaf层交换机连到相应的一个SG组,一共是有8个SG组,80台的交换机。从Spine层到Core层分成两个组,CG1和CG2,Spine层奇数位置的交换机连到 CG1,偶数位置的交换机连到CG2,通过这样的互联方式达到扩展。 总之,SuperPOD是一个可以是任意扩容的设计理念,可以基于1个SU甚至半个SU扩展,可以扩展到2个、4个、7个,甚至像百度一样可以扩展到上千台的规模。 另外,SuperPOD里可以用到优化好的一个软件镜像NGC,即NVIDIA GPU Cloud。这个Cloud是一个软件概念,它里面包含了很多针对不同框架优化好的镜像,这些镜像可以很快启动起来,保证性能更优。另外,NGC里也放了很多预训练模型。除此之外,针对不同的行业,还有一些开发好的方案,比如针对医疗有Clara,针对智慧城市有Metropolis方案,针对自主机器人有Isaac,这些都已经放在NGC里使用,这些镜像可以支持不同的云、裸金属、混合云或终端,在x86、ARM以及POWER上都有很好的支持。 分布式训练很大的一个挑战是通信,英伟达有NCCL(NVIDIA Collective Communication Library)通信库,它是GPU之间通信优化的库,也已经成为了一个工业标准。NCCL可以支持不同节点内的拓扑,也支持不同节点间的拓扑,它可以自适应的选择最优的Ring或Tree以及相应的协议,让通信最快。 同样,交换机卸载的功能叫Sharp,即可扩展的分层聚合和规约协议,简单来说就是把在CPU或GPU上的通信放到交换机上,一方面释放CPU和GPU资源,另一方面延迟和带宽是最好的。Sharp和NCCL可以无缝结合起来,只需要通过一个插件库就可以把这个功能用起来。 NVIDIA SuperPOD加速全球AI数据中心案例 不管在学术界还是工业界,有很多采用SuperPOD构建自己的AI数据中心,在加速自己领域的一些AI研究。 第一是Meta,这也是在国外最大的一个AI数据中心, Meta用DGX SuperPOD搭建的一个平台,支撑Meta研究院里300多人的研究。Meta的研究涵盖各种前沿AI领域,比如会话系统、推荐系统、大语言模型。Meta会在今年会建设成由2000台DGX A100组成的SuperPOD,达到了16000张 A100 GPU的规模。 最早采用SuperPOD做模型加速的是微软,微软和OpenAI做了一个有上万卡的规模,这个集群当时也加速催生了GPT-3模型的诞生。 韩国最大的搜索引擎公司NAVER,用DGX SuperPOD建立了一个AI数据中心,训练一些会话模型用于呼叫中心。由140台DGX SuperPOD组成的集群,相比于原来传统的集群在会话系统基础模型的训练上,可以达到2.7倍的加速效果。 另外,我们也谈了很多AI科学领域,这也是AI和HPC结合比较好的一个方向。佛罗里达大学在这领域深耕了很多年,一直在探索去用AI如何融合到一些跨学科、跨学界的加速。基于DGX SuperPOD,搭建了一个针对医疗领域的模型分析,即利用一些语言模型分析病人的临床数据,在39亿模型参数下,之前的训练大概需要几周时间,现在只需要不到一周的时间就可以完成。相比于之前的训练效率可以达到10倍以上的提升。 另外一个领域是自动驾驶,特斯拉是自动驾驶行业开启比较早的一个家企业,也是用 CV解决自动驾驶问题非常坚实的拥簇者。特斯拉针对感知这块,有四五十个DNN模型,每天都要做训练,基于SuperPOD架构搭建了一个5000多卡的集群,支撑它每天上百位AI科学家,进行几十个模型的训练迭代。 汽车行业比较领先的大陆集团,基于DGX SuperPOD搭建了一个集群,用于AI训练、模拟和虚拟数据的生成。搭建的集群性能名列在Top500里面。 最后,用MLPerf 数据做下总结,在过去一年半的时间里,MLPerf迭代了三个版本:MLPerf 0.7、MLPerf1.0和MLPerf 1.1。在MLPerf 1.1与MLPerf 0.7的性能对比中可以看到,基于一些软件和分布式技术的优化,同样是A100安培架构的GPU,可以看到在同样的任务里面,最快有5.3倍的性能提升;单机性能的对比,可以看到基于软件优化,在同样的A100 GPU里最高也有2倍的性能提升。这表明只要购买了A100 GPU,只需要通过软件升级就可以得到持续加速的效果,这也是英伟达软件栈持续优化带来的好处。 总之,SuperPOD是一个非常高效的架构,它用在大规模的分布式训练里,不管是直接采用NVIDIA DGX SuperPOD,还是采用百度智能云上的SuperPOD,都可以享用SuperPOD架构带来的好处。 SuperPOD架构可以帮助在AI领域做快速迭代,开发更智能的AI模型,它是把产品更快上线非常关键的一个环节。不管是在CV、NLP、语音、推荐系统、AI+科学等领域,还是做搜索、CTR、AV感知等各种各样的场景,都可以用SuperPOD架构做加速。如果你想要用SuperPOD架构,上百度智能云,即刻享用SuperPOD带来的好处。
拒绝隐私泄密 手把手教你设置访客网络!
越来越多的设备联网让安全威胁频出。今年3月,黑客入侵了一家位于硅谷的安全设备厂商,盗取了15万个摄像头拍摄的实时视频。同样是在年初,Palo Alto Networks对13.5万个安全摄像头进行了检查,发现54%的摄像头至少有1个安全漏洞,黑客利用这些漏洞可以完全控制、操控这些摄像头,以此为跳板进入企业网络发动攻击。此外,大部分家庭使用的路由器也普遍存在安全漏洞,黑客很容易通过这些设备进入家庭网络,利用薄弱的家庭和办公设备发起勒索攻击。 (图片来自computechds) 连续两年的调查结果显示,企业必须改善网络安全措施,以保护企业网络免受非商业物联网设备带来的风险。今年的研究中,100%的中国大陆受访者都认为其组织的物联网安全保护方法需要改进,27%的受访者则表示需要彻底改革。其中,对风险评估(70%)、提供给安全团队的物联网设备上下文(64%)、装备可见性和库存(62%)以及政策执行和零信任控制(62%)等方面需求最大。 随着更多的员工以个人为单位使用智能音箱、穿戴设备、智能家居等产品,安全风险的入口也越来越多,而且像工业类企业用到的传感器也越来越细分,包括具有WiFi功能的恒温器控制的采暖通风和HVAC系统等等,这些传感器在接入核心网的时候很可能没有经过IT运维团队的授权。一项调查显示,大多数企业并没有觉察到物联网或工业物联网的无线网络,与企业基础设施是分离的。 其实对于家中的联网设备来说, 同样面临着被入侵的风险。比如,当亲友来访时,都会问“你家WiFi密码多少?”。每个人都告诉一遍其实是个非常麻烦的事。而且亲友的移动设备,是否存在安全风险并不能确定。如果亲友的移动设备安装了“WiFi万能钥匙”等应用或者已被木马感染,自家的网络就会受到威胁。 访客网络可以解决这一问题。要向来访亲友发送自己的SSID和WiFi密码,需要很强的安全性。无线路由器厂商已经在iOS和安卓的路由器控制应用中,提供发送SSID和WiFi密码的功能。这一隐私信息将通过电子邮件或文本文档,发送给来访的亲友。路由器还可以主动为接入的亲友进行网络限速,优先保障用户自己的设备能够流畅上网。 国内的厂商也考虑到了这一问题,比如,艾泰推出的无线路由器产品,将无线路由器的移动端管控和微信相结合。用户无需单独下载移动端app,关注微信公众号,并绑定设备,就可以使用微信对无线路由器进行管理。在移动端微信管理后台的“应用中心”中,用户只需用手指点击一下,即可将WiFi密码发送到亲友的微信中,非常方便。 除了向亲友的设备发送信息外,用户还可以设立“访客网络”,来支持亲友的移动设备上网。“访客网络”会设置一个单独的SSID,用户可以选择不设置密码方便亲朋好友来访时使用。并且用户可以对“访客网络”进行限速,在不影响自己网络流畅的前提下,提供无线网络连接。并且“访客网络”不会访问用户的内网,只提供外网连接。使用“访客网络”,来访亲友上网更方便了,用户自己的网络安全也能得到保障。 对于很多人来说,安装后变很少去关心的很多无线路由器上,都有“访客网络”或者“客人网络”这一功能。只需要打开浏览器,在浏览器地址栏输入“http://192.168.x.1”(根据不同型号路由器后台管理地址略有不同,请大家自行分辨)。然后,路由器的管理后台中找到“访客网络”这一功能,就可以对其进行设置。 随后,可以对访客网络的网络名称(SSID)进行个性化设置,方便亲友进行查找,设置一个辨识度高的名字是必须的。一般的访客网络,为了方便使用,通常都会在开放状态下运行,让亲友不必再输入无线密码进行连接。因为无法访问内网,使得安全级别大幅提升,如果发现不是自己认识的亲友连接到了自己的访客网络,千万别忘了将它强制断开连接
以后的iPhone SE,可能是无碳铝做的
苹果要铝,也要够「绿」 课本上的这个知识点,你还记得吗:在地壳中含量最丰富的元素中位列前三的,分别是氧、硅、铝,也就是说,铝是地壳中含量最丰富的金属元素。 电解铝技术大幅提升了铝的产量,重量轻、强度高和并且可回收,让铝成为了广泛应用于生产和生活各个领域的材料,也成了可持续产品开发的首选。 图片来自:Twitter 在铝中添加其他元素形成的铝合金,在我们的生活中也随处可见,你的手上也许就正在握着铝合金制品。 手机、平板等电子产品经常会用到铝合金。从 iPhone 5 以后,在苹果的产品上,你总能找到铝合金。但苹果想要的不止是铝,还得是「绿色」的铝。 iPhone 12 的铝合金边框,图片来自:Unsplash 苹果不久前宣布,将向加拿大公司 ELYSIS 购买全球首批商用纯度的低碳铝金属,并计划将其用于 iPhone SE 机型,并且这批铝会由 ELYSIS 公司在位于加拿大魁北克省的工业研究与开发中心使用水电生产。 图片来自:Apple 上百年的工业化让人类文明得到快速发展,也让我们慢慢尝到了「苦果」,如今全球都在为环保和可持续而努力,苹果自然也不例外。 苹果有一个目标:在 2030 年底前实现整个供应链的碳中和,为了实现这个目标,它从 2016 年起开始发行绿色债券,目前总计发行了 47 亿美元,「无碳铝」正是这个项目的其中一项成果。 图片来自:Apple 铝的冶炼方法从诞生至今已经有超过130年,虽然消耗能源和规模等方面有变化,但原理一直没变,它需要通过施加电流将氧化铝变为电解铝,这个过程中很重要的一部分是阳极,而阳极会在燃烧作用下释放二氧化碳及甲烷、二氧化硫等「副产品」。 ELYSIS 公司开发了一种专有的电极材料,并以此作为炼制铝时的阳极,传统的碳阳极通常每 25 天更换一次,而 ELYSIS 公司的阳极预计可以使用好几年都不需要更换,生产率提升的同时还消除生产过程中的温室气体。 图片来自:Apple 2018 年起苹果与美国铝业公司、力拓集团等的合作,促进了这项铝金属生产工艺的进步。也让苹果即将拥有更「绿色」的 iPhone。其实在 2019 年,苹果就已经将 ELYSIS 公司产出的首批商用级铝材料,用于 16 英寸 MacBook Pro 的生产。 16 寸 MacBook Pro 铝作为苹果产品的重要原料,遇上「减碳」后,不止诞生了「无碳铝」。此前苹果已经用再生铝与使用水电冶炼的铝进行产品制造。比如包括新款 iPad Air 在内的 iPad 系列产品全部机型,以及最新款的 MacBook Pro、MacBook Air、Mac mini 与 Apple Watch 的外壳,都是 100% 再生铝。 图片来自:Unsplash 也正因为这些尝试,从 2015 年至今,苹果与铝有关的碳排放量已减少了近 70%。 值得一提的是,与苹果绿色债券有关的项目还有不少,比如为丹麦的 Viborg 数据中心供电甚至能将剩余能源并入丹麦电网的大型陆上风力涡轮机,以及苹果在 44 个国家和地区的办公地点和零售店都已使用 100% 清洁能源。许多合作伙伴也已承诺在苹果产品的生产过程中使用 100% 可再生资源。 丹麦 Viborg 数据中心,图片来自:Apple 也许很快,我们就能看到越来越多高度「绿色」的苹果产品。
除了服务,蔚来还有什么底牌?
新眸汽车业组作品 作者|阮雪 编辑|桑明强 走到今天这一步,蔚来并不容易。 前不久,蔚来发布了2021年度财报。去年交付9万辆的蔚来,依旧保持着稳健的节奏感:全年营收361.4亿元,同比增长122.3%,营收提高之外,全年整车销售毛利率20.1%的成绩,格外亮眼。 这是一个很明显的信号,尤其对于蔚来来说,在电动化和智能化的双螺旋浪潮下,这个数字意味着公司的成长性和经营状况良好,背后牵系着供需两端。 自去年开始,新能源汽车涨价呼声此起彼伏,蔚来是少数还未提价的车企之一,考虑到材料成本上涨以后的毛利目标,展望2022年,李斌还是把数字定格在了18-20%之间,对比保时捷、法拉利17%上下的单车毛利率,对于定位豪华高端的蔚来来说,这已经是里程碑。 高举高打,蔚来从超跑起步,逐步下沉进入高端市场,蓄力奔跑了近8年后,走过了至暗时刻的蔚来,迎来了曙光。当人们还停留在“关于蔚来有没有未来”的探讨时,蔚来已经不断刷新自己,无论是新品ET7、ES7的发布,还是对原有车系“886”的迭代升级,在新能源赛道上,蔚来有了自己的新逻辑。 新“军备竞赛” 改变从来不是悄然发生的。 财报之外,蔚来谋划的大局也在徐徐铺开。和之前相比,ET7、ET5、ES7终于来到了台前。今年3月28日,蔚来首款智能电动轿车ET7即将开始交付,这也意味着蔚来基本实现畅销车型产品的全覆盖。在Q4财报的电话会议上,和过去的卖个关子不同,李斌称ET7的实际订单量是超乎预期的。 某种意义上来说,推新和爆单的背后,是蔚来长期投入和播种的必然结果。 众所周知,自研是摆在新能源汽车玩家面前的一道艰难的选择题,不自研会受制于人,搞自研又难免在短期内落于人后。在车企倾力投入自研时,巨额的成本支出不可被忽视。这有可能直接引发一个现象——烧钱。 问题是,投入并不意味着自研完全成功,因为这还涉及实验室建设、专业人才招聘、核心团队搭建等;另一方面,时间成本也是车企不可回避的重要因素。技术研发除了巨大的资金和人力成本投入外,研发周期的长短,也会对一项新技术从研发到投入应用产生关键影响。 而在这道选择题面前,蔚来给出的答案是“持续加大关键技术的研发投入”,从2018年的40亿,到2021年全年超45亿元的研发费用,蔚来在技术研发上从来没有吝啬。不过,和盲目地烧钱投入不同的是:蔚来的自研已经有所收获。 以新车ET7搭载的第二代高效电驱平台为例,首次应用碳化硅模块,在蔚来的旗舰轿车中采用峰值功率180kW的碳化硅前永磁驱动电机和后300kW的感应电机,在这样的组合下,蔚来ET7系统综合功率可以达到480kW、峰值扭矩850Nm,动力系统层面的升级蔚来ET7的 0-100km/h加速可以做到3.9s,100km/h-0制动距离可做到33.5米。 在新能源汽车硬件上的“军备竞争”里,蔚来和它的电力系统一起,跑在了前面。从最初的三电系统,到现在的核心三智单元全套自研,没有标的可对标的蔚来,一直在摸着石头过河,河是中国新能源车市场,石头是蔚来自己的判断,这是一条艰难的道路,不过好在结果并没有让李斌失望。 拆解财报背后的隐性基因 做企业就像种一棵树,你不能头天种下了,下个星期就将它拔起,我们需要做的,是观察它的根本,看看它是否还在生长。 这也是我们容易忽略的企业隐性基因。一般来说,传统汽车平均换代的周期在5-7年,这也解释了为什么传统整车厂会把产品的更新重点放在动力、底盘、车身和内外饰上,和燃油车相比,新能源车的结构性差异,让它在产品的迭代模式也有了巨大的改变,软件与服务上的升级革新,意味着新能源汽车需要在硬件设计和软件搭载上实现快速迭代。 单从新能源汽车的结构来看,除了具有传统的车辆基本要素车身、底盘外,核心的变化在于电池、传感器、软件和服务部分,它们迭代的周期也被缩短,以电池为例,迭代周期多在2年左右,而车辆的软件和服务迭代周期在3-6个月,甚至更短,就像是人体细胞的更新,每间隔几个月,已经全面换新。 对于新能源赛道的玩家来说,如果说新车的推出是各家显性基因的外露,那么藏在迭代之间的则是不易察觉的隐性基因。不过,和人体的自我更新所不同的是,蔚来的隐形基因来自于后天的打磨和创新,以及以产业级的视角看待行业的演进。 这也解释了为什么蔚来这些年会一直押注底层创新能力的建设,以ET7搭载的最新的自动驾驶技术NAD为例,从感知算法到地图定位、再从控制策略到底层系统,蔚来已经实现了全面自研,在NAD全栈自动驾驶技术能力下,蔚来先后发布了NIO Aquila超感系统和NIO Adam超算平台。 如果将这些成果落实在财报数字上,恰好对应了蔚来四季度高达18亿人民币的研发费用以及全年同比增长84.6%的技术投入,落实在人员配置上,则是蔚来年底规模近9000人的研发团队,可以预见的是,这些数字在未来还会增长。 值得一提的是,在2022年的产品升级中,蔚来的隐性基因也开始逐渐显露。 一方面,蔚来2022款ES8、ES6、EC6产品,三款改款车型将对智能硬件进行重大升级,这些升级包括8155芯片、360环视摄像头以及5G模块等,均达到预期性能的提升;另一方面,蔚来也同样承诺,可以为现有ES8、ES6和EC6用户提供智能座舱硬件后装升级服务。 这也符合蔚来留给用户们的期待,因为对于他们来说:提车从来不是终点。 关于蔚来的边界问题探讨 2018年时,我国前十豪华车市场销量合计为275万辆,新能源汽车的加入为场开辟了新的增量,在当时有一个假设:如果2025年新能源的渗透率达到20%-25%,豪华车所对应的市场规模也将达到80-100万辆。 在现在看来,这个假设会显得过于悲观,以蔚来ET7所在的30万元以上中大型轿车市场为例,去年销量75万辆,而ES7所在的中大型五座SUV市场容量也已经达到20万辆。2021年全年,就上海地区来看,在35万人民币以上所有燃油和电动SUV中,蔚来的市场份额已经达到23%。 随着新能源汽车渗透率的不断提高,新能源车企们也走进了深水区。 在工业时代,物资缺乏,通常是卖方市场,企业关注的是产品、价格、渠道、促销,比如福特的T型车,性价比当道;时间来到信息时代,消费者开始按照喜好选择产品,企业需要对市场进行细分,针对消费群体的差异化需求,开发最优势的产品,例如宝马的运动品牌营销,沃尔沃主打汽车安全等;到了互联网时代,人与人、人与厂商、厂商和产业之间的交互方式也都发生了转变。 过去在新能源行业,高研发投入带来技术突破后产品的升级,往往被看作是车企能否跑赢的关键,但人们常常容易忽略的是:在这场赛跑中,用户往往决定着企业能不能跑得稳,而产业链的高度往往决定这个行业能跑多远。 在蔚来的直营模式中,相比传统OEM的产销分离,带来的车厂与用户之间的交流割裂,蔚来的“线上订车”+“线下体验”,一方面管控服务质量,提供极致的用户体验,及时掌握用户数据,扩大用户规模;另一方面,越过经销商,降低了用户的购买成本,将销售利润回归车企,进而反哺用户。 需要注意的是,除了订车和服务外,线上的NIO App还被蔚来打造成为线上社区,进行用户间的社交及经验分享,这种做法的好处很明显,既可以提高用户的产品粘性,还利于增强宣传,扩大涟漪,据新眸不完全统计,蔚来有超过50%的新客户是由老客户推荐来的。 门店的扩张和服务网络的铺设,反应在蔚来的财报中对应的是销售及行政费用的持续走高:2021年四季度公司销售及行政费用23.58亿元,占收入的24%,环比第三季度增加了29%;而反应在消费者层面,最直观的就是2021年蔚来同比增长109.1%的订单量。 浅水是喧哗的,深水总是沉默的。对于蔚来来说,它的边界隐藏在它的布局动作里,也隐藏在蔚来背后的产业链接里,我们不能用简单的产品思维去理解它所构建的护城河,无论是技术层面的大力投入,还是对于用户服务感的提升,这些都是当下很难看到财务成效的付出,如果以长期主义的视角,你会发现,蔚来的胜算恰恰在于它押注了未来。
王传福:电池续航比肩燃油车 电池最重要指标变了
原标题:比亚迪王传福:电池续航比肩燃油车 能量密度不再是最重要指标 3月26日,比亚迪股份有限公司董事长兼总裁王传福在2022中国电动汽车百人会论坛发表主题演讲。 王传福表示,按照去年行业变革速度来看,如果是等速计算,今年底,预计我国新能源汽车渗透率可达35%。 在论坛上,王传福还提出了几点建议和想法,第一是希望明确后补贴时代新能源汽车优惠政策。考虑到产品开发需要3到5年,为稳定行业预期,建议新能源汽车的购置税减免政策能够继续延长。 对于新能源汽车技术路线的看法,王传福称,要坚持纯电动和插电混动“两条腿”走路。目前,市场上插电混动产品越来越多。 如果说纯电动车重点解决了增购需要,那么插电混动则有效解决了更多家庭首购和换购需求,对庞大存量燃油车市场,形成了明显替代效应。” 同时,随着我国新能源汽车的快速爆发,动力电池行业,也发生了明显产业变革。比亚迪坚持磷酸铁锂作为正确的发展道路。 这是因为安全是新能源汽车发展的基石,成本是必须要面对的一项重要指标,当性能迈过一定门槛后,能量密度重要性在降低。 而且,因为续航里程的提高,动力电池的能量密度重要性和优先级,也会发生相应的改变。 以前电动车续航里程在200公里的时候,能量密度是最重要指标;但当续航里程达到 500 公里的时候,和燃油车一箱油一样里程,电池能量密度已不再是最重要的了,最重要的指标可能会变成安全、成本、循环寿命等。 比亚迪推出刀片电池,解决安全痛点,实现包体能量密度与三元电池相当,循环寿命、安全系数更强,把磷酸铁锂重新拉回了行业正道。同时,中国不可能从燃油车时代被石油卡脖子,变成电动车时代被金属钴、金属镍卡脖子。磷酸铁锂不含稀有金属,更加匹配社会资源承受度。
汽车“救命”装置建议汽车标配!政协委员发声:非常赞同
原标题: AEB装置建议汽车标配!政协委员:非常赞同 当前一众新能源电动车,均已配备有AEB紧急制动功能,但是大部分传统燃油车,还没有配备此功能。对此,国内不少汽车业内人士,呼吁车企积极配备,并且规范法规建设。 在3月26日举行的2022中国电动汽车百人会论坛“迎接新能源汽车市场化发展新阶段”高层论坛上,全国政协经济委员会副主任苗圩在主题演讲中表示: 非常赞同理想汽车创始人、董事长兼CEO李想提出的将AEB(自动刹车系统)作为车辆标配的建议,此举将大幅提高道路交通安全。 据悉,AEB是一种主动安全技术,采用雷达测出与前车或者障碍物的距离,然后利用数据分析模块将测出的距离与警报距离、安全距离进行比较,小于警报距离时就进行警报提示。 并且,不少车企设置的紧急策略为,当车辆小于安全距离时,即使在驾驶员没有来得及踩制动踏板的情况下,AEB系统也会启动,使汽车自动制动,从而保证行车安全。该设置也避免了不少事故车祸,为车辆的“救命”装置。 此外,苗圩也展望了中国新能源汽车行业的发展,他认为,中国汽车行业决胜取决于下半场的智能化竞争,“我们要充分发挥我国在体制机制、市场空间、信息通信技术等方面的优势,坚持单车智能+网联赋能,凝聚行业共识与战略协同,强化创新驱动,加速法规修订,扩大示范应用。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。