行业分类:
加载中...
头条分类:
加载中...
科技股延续强势恒指站上18000点 旅游概念股行情重启|港股风向标
财联社5月2日讯(编辑 冯轶)5月首个交易日,港股表现抢眼。截至收盘,恒指涨超2.5%,一举站上18000点。恒生科技指数涨4.45%,国企指数涨2.60%。 我们来看今日市场热点,分别有:核心科技股延续强势,恒指站上18000点;地产及汽车板块涨幅居前,旅游概念炒作反弹;美联储按兵不动 能源股集体回落。 【核心科技股延续强势 恒指站上18000点】 盘面上,今日核心科技股保持强势,美团涨近9%,快手涨近6%,京东、哔哩哔哩双双涨超4%,腾讯、阿里、小米、百度均有不同程度上涨。 其他热点方面,地产、汽车,生物医药领涨,旅游概念股重新强势。保险、券商等金融板块也有所表现。 下跌的板块中,油气股跌幅居前,煤炭、电力等能源股跟随下行。此前连续上涨的家电板块迎来回调。 整体上看,恒指短线攻势继续,今日再度创出18217.82点的阶段新高。 值得注意的是,尽管港股通因假期因素关闭交易,但今日恒指全天成交仍保持在千亿港元规模,达1159.12亿港元。 此外,隔夜美联储公布利率决议,维持基准利率不变,海外市场均有震荡。但港股行情显然未受影响,可见市场情绪高涨。 【地产及汽车板块涨幅居前 旅游概念炒作反弹】 今日,地产及汽车两大板块领涨,对行情起到明显的带动作用。 地产方面,央地支持政策密集出台,行业“去库存”预期提升。汽车股则主要受北京车展及4月较好的交付数据表现催化。 此外,前两日连续调整的旅游经济概念开始炒作反弹,数据面也迎来利好验证。 记者从国铁集团获悉,5月1日,全国铁路发送旅客2069.3万人次,创单日旅客发送量历史新高。 而5月2日,全国铁路预计发送旅客1700万人次,计划加开旅客列车1094列。五一假期旅客出行需求旺盛,铁路客流保持高位运行。 此外,交通运输部消息称,4月30日,全社会跨区域人员流动量20414.7万人次,环比增长31.4%,比2019年同期增长37.9%,比2023年同期增长22.6%。 需要注意的是,由于假期期间外围市场正常交易,而港股短线走强仍以交易型资金为主,也存在炒作抢跑的嫌疑,值得投资者谨慎关注。 【美联储按兵不动 能源股集体回落】 随着美联储公布5月利率决议,近期宏观层面最大不确定性落地。 但由于美联储按兵不动,且多项数据仍暗含通胀隐忧,市场对美联储降息预期进一步延后,引发部分板块回落,能源类板块首当其冲。 最为明显的,石油股今日逆市下跌。隔夜全球油价大幅下挫,6月交割的WTI原油期货价格下跌3.6%,收报79美元/桶。7月交割的布伦特原油期货价格下跌3.4%,收报于83.44美元/桶。 有分析称,近期降息提振石油需求希望减弱。目前宏观情绪整体中性偏强。尽管美国通胀有所反弹导致市场降息预期减弱,但经济不衰退基本成为当下市场共识,降息时间延后并未对风险资产定价形成明显抑制。
4月制造业PMI出炉!
4月30日,国家统计局服务业调查中心和中国物流与采购联合会发布了4月份中国采购经理指数。数据显示,中国采购经理指数的三大指数均继续保持在扩张区间,我国经济景气水平总体延续扩张。制造业采购经理指数(制造业PMI)连续两个月扩张,工业品价格水平稳步恢复,服务业景气面有所扩大。 经济回稳向好,动力趋好运行 4月份,制造业PMI为50.4%,比上月下降0.4个百分点,连续两个月位于扩张区间。从分类指数看,生产指数为52.9%,比上月上升0.7个百分点,表明制造业企业生产活动继续加快;新订单指数和供应商配送时间指数虽然都较上月有所下降,但继续高于临界点;原材料库存指数和从业人员指数低于临界点。 中国物流信息中心分析师文韬表示,由于3月份市场需求释放集中,4月份需求增速有所回调。新订单指数为51.1%,较上月下降1.9个百分点,仍保持在扩张区间。国外需求也保持平稳增长势头,新出口订单指数为50.6%,较上月下降0.7个百分点,同样保持在扩张区间。结合前期指数变化来看,3—4月制造业新订单和新出口订单均保持增长态势,经济回稳向好动力趋好运行。 分不同企业规模看,4月份各规模企业PMI均高于临界点。“大、中、小企业都保持稳定运行态势是4月份我国经济运行中的一个突出亮点。”文韬说,当前大中小企业协同增长,经济恢复的稳定性、均衡性有所提升。 购进价格与出厂价格均有改善 在中国制造业PMI其他相关指标中,4月份,主要原材料购进价格指数为54.0%,比上月上升3.5个百分点;出厂价格指数为49.1%,比上月上升1.4个百分点。 “4月份主要原材料购进价格和出厂价格子指数均有所改善。”仲量联行大中华区首席经济学家兼研究部总监庞溟对记者表示,这表明价格水平正稳步恢复正常。 建筑业商务活动指数方面,4月份,建筑业商务活动指数比上月上升0.1个百分点,为56.3%,继续位于较高景气区间。其中,土木工程建筑业商务活动指数为63.7%,比上月上升3.9个百分点,升至高位景气区间,企业施工进度有所加快。 而国金证券研报认为,国内新一轮设备更新等政策加快落地,或可强化通用设备、汽车等低库存行业“补库”意愿。汽车、通用设备等是本轮设备更新的主要“生产方”,政策带动下未来补库意愿或更高。设备制造业生产强度提升的过程中,又能够对金属制品、化工等上游行业需求形成带动。 不过庞溟强调,需要看到,购进价格与出厂价格子指数之间差值在扩大,需要注意企业短期内盈利性可能受原材料价格回暖、出厂价格提价弹性不足而承压。 国家统计局服务业调查中心高级统计师赵庆河也谈到,调查结果显示,反映原材料成本高的企业占比为46.0%,比上月上升4.2个百分点。 服务业景气面有所扩大 数据显示,4月份,服务业商务活动指数为50.3%,比上月下降2.1个百分点,服务业扩张有所放缓。但从行业看,多数行业生产经营持续恢复。 赵庆河介绍,在调查的21个行业中有15个商务活动指数高于临界点,较上月增加3个,服务业景气面有所扩大。其中,铁路运输、道路运输、邮政、电信广播电视及卫星传输服务等行业商务活动指数位于55.0%以上较高景气区间,业务总量增长较快。 从市场预期看,业务活动预期指数为57.4%,继续保持在较高景气区间,服务业企业对市场发展前景持续看好。 来源:证券时报
美股收盘:中国金龙指数大涨6% 苹果盘后市值增2000亿美元
财联社5月3日讯(编辑 牛占林)美东时间周四,美股三大指数悉数收涨,因美联储维持了偏宽松立场,且企业业绩整体好于预期。 美联储在周三的政策声明中维持了降息可能性仍大于加息可能性的措辞,鲍威尔也试图保持美联储政策选择的开放性,他坚持自己的观点,认为利率处于限制性水平,通胀有可能重拾下降势头。 鲍威尔认为美联储可能没有必要恢复加息,这令投资者欢欣鼓舞。然而,他指出,最近强劲的通胀数据表明,首次降息可能要等待很长时间。 Murphy & Silvest市场策略师Paul Nolte表示:"昨天的结果显示,美联储的基本倾向仍是降息,他们不愿意从现在开始提高利率。只要有任何经济疲软或通胀下降的迹象,他们都准备好了立即降息。" Nolte补充道,本季度那些表现好于预期的公司股价并没有像前几个季度那样得到回报,而那些没有达到预期的公司股价正在遭受重创。 投资者还关注周五发布的非农就业报告,因为不管鲍威尔怎么说,最终的决定因素仍然是通胀和其他经济数据。 美国银行分析师Savita Subramanian指出,即使美联储不降息,强劲的经济也足以维持美国股市的牛市,经济也能够实现软着陆。 市场动态 截至收盘,道指涨322.57点,涨幅为0.85%,报38225.86点;纳指涨235.48点,涨幅为1.51%,报15840.96点;标普500指数涨45.80点,涨幅为0.91%,报5064.19点。 美股行业ETF整体收涨,半导体ETF涨2.01%,全球航空业ETF涨1.89%,区域银行ETF涨1.64%,网络股指数ETF涨1.56%,全球科技股ETF涨1.48%,科技行业ETF涨1.44%,银行业ETF涨1.30%,可选消费ETF涨1.26%。生物科技指数ETF、日常消费品ETF、能源业ETF及公用事业ETF各涨至少0.5%。 标普500指数的11个板块多数收涨,科技板块与可选消费板块涨幅居前,各上涨超过1.5%,房地产与通信服务板块各涨超1%。而原材料板块则跌逾0.5%,医疗保健板块微跌0.11%。 热门股表现 大型科技股普涨,英伟达、亚马逊涨超3%,奈飞涨超2%,谷歌涨逾1%,微软、Meta、英特尔、特斯拉小幅上涨。 苹果收涨2.2%,由于其业绩超预期,且宣布了1100亿美元的股票回购计划,苹果美股盘后涨幅一度扩大至7.7%,对应增加市值逾2000亿美元。 高通大涨9.74%,该公司发布了全面好于预期的第二财季业绩报告,业绩指引也好于预期。 热门中概股普涨,纳斯达克中国金龙指数涨超6%,创去年11月底以来收盘新高。小鹏汽车、哔哩哔哩涨超15%,贝壳涨超12%,金山云、京东涨逾11%,高途、理想汽车涨超10%,微博涨逾8%,百度、好未来涨超7%,蔚来、阿里巴巴涨逾6%。 公司消息 【苹果第二财季营收、净利润均超预期 将回购额外1100亿美元股票】 苹果第二财季营收907.5亿美元,市场预期900亿美元,上年同期948亿美元;第二财季净利润236.36亿美元,市场预期231.7亿美元,上年同期241.6亿美元;第二财季iPhone营收为459.6亿美元,预期为457.6亿美元;第二财季可穿戴设备、家居及配件收入79.1亿美元,市场预期82.9亿美元;第二财季大中华区收入163.7亿美元,同比下降8.1%,市场预期为158.7亿美元。将回购额外1100亿美元股票,提高季度股息。 【FTC批准埃克森美孚与先锋645亿美元交易】 美东时间周四,美国联邦贸易委员会(FTC)批准了埃克森美孚以645亿美元收购先锋自然资源公司的巨型交易,但却禁止先锋创始人兼前首席执行官Scott Sheffield加入埃克森美孚董事会。FTC指控Sheffield参与了抬高油价的合谋行为,指控内容包括Sheffield向石油输出国组织(OPEC)的代表发送了几百条有关市场动态的信息,包括定价和生产水平。此外,FTC表示,Sheffield没有掩饰将美国石油产量与欧佩克“挂钩”的行为,他还敦促美国石油生产商在产量方面保持“自律”。 【Coinbase第一季度营收为16.4亿美元 市场预计为13.2亿美元】 Coinbase第一季度营收为16.4亿美元,市场预计为13.2亿美元;第一季度交易收入为10.8亿美元,市场预计为7.75亿美元;一季度每股收益4.40美元,市场预期1.07美元。
FTC批准埃克森美孚与先锋645亿美元交易 但先锋高管却摊上事了
财联社5月3日讯(编辑 牛占林)美东时间周四,美国联邦贸易委员会(FTC)批准了埃克森美孚以645亿美元收购先锋自然资源公司的巨型交易,但却禁止先锋创始人兼前首席执行官Scott Sheffield加入埃克森美孚董事会。 FTC指控Sheffield参与了抬高油价的合谋行为,指控内容包括Sheffield向石油输出国组织(OPEC)的代表发送了几百条有关市场动态的信息,包括定价和生产水平。 此外,FTC表示,Sheffield没有掩饰将美国石油产量与欧佩克“挂钩”的行为,他还敦促美国石油生产商在产量方面保持“自律”。 该监管机构认为,OPEC和美国石油生产商之间的合作,导致产量增长率低于竞争市场中应该有的水平,从而推高了美国的能源价格,牺牲了美国家庭和企业的利益。 Sheffield创立的先锋公司是美国二叠纪盆地最大的石油生产商,也是美国最大的纯页岩油生产商,Sheffield于去年12月正式退休。 FTC指出,Sheffield被广泛认为是美国页岩油行业的领军人物,但他却利用自己的职位与石油生产商和OPEC合作,限制其产量并抬高能源价格,因此不应该进入埃克森美孚的董事会。 FTC竞争局副局长Kyle Mach在一份声明中表示:“Sheffield过去的行为清楚地表明,他不应该进入埃克森美孚的董事会,美国消费者不应该仅仅为了填满企业高管的钱包而支付不公平的价格。” 当被问及Sheffield是否会面临刑事指控时,FTC发言人回答称:“FTC有责任举报潜在的犯罪行为,并会非常认真地对待这一义务。” 据悉,埃克森美孚与先锋之间的交易将在周五正式完成,埃克森美孚并未面临任何不当行为指控。 先锋公司回应称,它对FTC的指控感到惊讶,但希望交易能够完成,并称前首席执行官Sheffield针对行业发表的评论属于“公共利益问题”,不应该成为剥夺他董事会席位资格的理由。 埃克森美孚声称,不会让Sheffield加入董事会,FTC的长期调查“没有对我们的商业行为提出任何担忧”。
山东国信2亿产品展期1年分期方案“擦线”通过,背后担保方曲江文控此前陷被“举报”悬案
界面新闻独家获悉,山东国信(01697.HK)一逾期产品近期召开受益人大会,就一涉及西安城投的信托产品展期1年多、分期付款方案进行投票表决。目前,该方案已获投票通过。 与此同时,该产品增加西安城墙建设管理有限公司(下称“城墙建设”)为信托计划提供连带责任保证担保。城墙建设负责“杏渭佳苑”项目的开发建设,并承诺将“杏渭佳苑”项目每笔融资所取得资金的20%用于偿还信托计划。 具体来看,该产品全名为“山东信托·城市发展124号集合资金信托计划 ”(下称山东信托城市发展124号),融资人为城墙建设,是西安古城墙景区旅游资源开发及配套基础设施建设的主要承接主体,相关业务在区域内具有一定的垄断性。保证人为曲江文控,为西安市曲江新区最大的基础设施建设公司保证人主体长期信用等级为AAA,评级展望为稳定。  值得注意的是,担保方曲江文控此前曾陷入一宗“举报悬疑门”。一封被认为是广州越秀融资租赁公司(下称越秀租赁)撰写的举报信引发市场关注,该举报信控诉曲江文控募集书谎报还债信息。 随后,据财联社报道,越秀租赁相关负责人澄清表示,未听闻有这一举报信、该举报信并非该公司所写。目前西安曲江文控的债务情况正常还本付息,相关传闻不涉及越秀租赁的经营风险。一时间,这起举报事件扑朔迷离。 但据界面新闻独家了解,举报背后,中信信托和山东国信两涉及曲江文控的相关产品此前已逾期。目前,两家信托公司均已采取法律措施,其中,“山东国信-城市发展101号集合资金信托计划(下称山东国信城市发展101号)(详见《),此次山东国信召开受益人大会的信托产品为另一产品,涉及规模为2亿。 受益人大会会议议案显示,拟于4月12日至4月16日召开受益人大会投票,议案为将山东信托城市发展124号全部信托单位存续期限及信托计划项下20,400万元债权按如下还款计划进行展期,展期期间利率不变,利随本清,不再按季付息。 具体还款安排为: 1)2024年4月10日前,偿还2,040万元以及对应利息; 2)2024年6月10日前,偿还2,040万元以及对应利息; 3)2024年9月21日、2024年12月21日、2025年3月21日分别偿还500万元本金及对应利息; 4)2025年5月13日前,偿还剩余贷款14,820万元及对应利息。 山东国信称,如借款人未执行以下还款计划,山东国信将择机进行司法诉讼程序。目前,第一笔2,040万款项已经存放至受托人监管的借款人银行账户中,待受益人大会议案表决通过后即划付至信托计划财产专户。 与此同时,山东信托城市发展124号增加城墙建设为信托计划提供连带责任保证担保。城墙建设负责“杏渭佳苑”项目的开发建设,并承诺将“杏渭佳苑”项目每笔融资所取得资金的20%用于偿还信托计划。 如“杏渭佳苑”项目实现销售,在执行该议案第1条还款计划的同时,项目住宅预售网签面积占项目住宅总可售面积的20%时,借款人归还不低于3,264万元;项目住宅预售网签面积占项目住宅总可售面积的40%时,借款人需归还不低于6,528万元;项目住宅预售网签面积占项目住宅总可售面积的60%时,借款人归还完毕全部信托贷款。 界面新闻获得的产品决议公告显示,前述议案目前已获表决通过。 参与情况为:山东信托城市发展124号信托计划项下共有信托单位总份数20,400万份,受益人为94名。实际出席会议受益人所代表的信托单位份数13,600万份,占信托单位总份数的66.67%。受益人大会的召开、议事方式和表决程序等均符合《信托公司集合资金信托计划管理办法》以及《信托合同》的规定。 投票结果为:同意9,370万份,不同意4,230万份,同意份数占出席会议受益人所持表决权的68.90%。 根据山东信托城市发展124号合同条款,需有信托单位总份数1/2参与受益人会议,普通决议需经参与会议的受益人所持表决权的2/3通过方为有效,特别决议需经全体受益人通过。 因此,该议案属于“擦线”通过。 来源:界面新闻
超配A股!顶流基金经理迎来"顺风期",基民"回本"还有多远?
“继续超配A股。”外资最新发声以及A股行情转暖,让投资者兴奋不已。 当A股各大指数接近年内高点时,公募基金业绩也在持续回暖。不少亏损基民在经历了伤心失望的三年后,今年终于看到账户净值回升。尽管多数主动权益基金持有人距离回本还有很大空间,但是基金账户回升带来的希望再度被点燃。 梳理基金业绩,不难发现,一些顶流基金经理今年终于打了个“翻身仗”,在连续亏损三年后,基金净值开始逐步修复前期回撤。不过,这些顶流基金经理管理的产品最新净值距产品净值历史最高点仍有20%至50%的距离。尽管与长期持续亏损产生的“痛苦”相比,今年仅4个月的业绩回升带来的“喜悦”分量略显不足,但是影响更多的是增强了投资者对市场的信心。 顶流基金经理业绩“回血” 在连续三年亏损后,沪深300指数今年实现低开高走,多数时间处于上涨区间。与之相对应的是,主动权益基金业绩也在持续向好。 Wind数据显示,大盘价值基金指数、大盘平衡基金指数年内均实现正收益。 2022年—2023年,公募基金业绩普遍下滑,最具代表性的万得偏股混合型基金指数两年分别亏损21%和13.52%。在投资业绩“泥沙俱下”的时间里,不少顶流基金经理被认为走下“神坛”,基金业绩出现巨大回撤、投资策略失效等,面临“逆风期”的考验。 好在部分顶流基金经理在连续亏损多年后,今年终于迎来投资的“顺风期”,管理的基金产品逐步修复前期回撤。 最新规模仍在百亿元以上的主动权益基金中,有半数基金产品今年实现正收益。如张锋管理的东方红启恒三年持有基金、焦巍管理的银华富裕主题基金、萧楠管理的易方达消费行业基金、周蔚文管理的中欧时代先锋今年分别实现16.81%、12.63%、8.74%和7%的不错收益。 张锋管理的东方红启恒三年持有基金自2021年以来最大回撤接近40%,今年取得16.81%的正收益,修复了2023年16.05%的年度亏损,基金产品最新净值距离历史最高位置的回撤缩小至26.66%。 尽管与长期持续亏损产生的“痛苦”相比,今年仅4个月的业绩回升带来的“喜悦”分量略显不足,但是影响更多的是增强了投资者对市场的信心。 部分成立时间短、由顶流基金经理挂帅的部分基金产品甚至已经完全修复回撤,持有人实现盈利。 骆帅与范佳瓅管理的南方发展机遇一年持有基金成立于2022年3月,在年初创造了自成立以来近30%的历史最大回撤。基金经理抓住A股市场底部反弹机会,年内实现24.6%的不俗业绩,最新基金单位净值重新回到1元以上。 谭丽管理的嘉实价值创造三年持有基金亦成立于2022年3月,年内实现16.22%的不俗业绩,最新基金单位净值在4月26日重新回到1元以上,对于基金持有人,账户均实现盈利。 基金修复回撤进行时 今年以来,随着宏观数据出现企稳回升迹象,市场逐步走出悲观情绪,A股市场基本修复1月份跌幅。今年以来,上证综指上涨3.82%,接近年内新高,代表大盘风格的上证50指数上涨5.83%,代表中小盘成长风格的创业板指数下跌3.58%,大小盘风格分化明显。 公募基金重仓股今年普遍有大幅反弹。如公募基金持仓市值前20的上市公司中,仅贵州茅台、迈瑞医疗、立讯精密和中微公司年内股价下跌,而中际旭创、紫金矿业、海尔智家、北方华创、美的集团、宁德时代、招商银行等年内涨幅均超20%。 众所周知,顶流基金经理多偏爱“茅指数”为代表的核心资产、价值股,伴随基金重仓股的大幅反弹,今年公募基金相关产品业绩回升趋势明显,尤其是管理规模大的顶流基金经理。 数据显示,连续3年(2021年—2023年)亏损的主动权益基金中,有一半基金今年实现了正收益。 历经3年亏损后,卢纯青管理的中欧瑞丰基金今年实现21.65%的正收益,李耀柱管理的广发沪港深新起点基金、史博和骆帅管理的南方绩优成长、萧楠和王元春管理的易方达瑞恒基金、谭丽管理的嘉实价值发现三个月定开、焦巍管理的银华富裕主题、章晖管理的南方成安优选基金今年均取得10%以上正收益。 近300只主动权益基金今年收益覆盖了2023年的亏损。如莫海波管理的万家臻选今年实现15.5%正收益,覆盖了2023年15.25%的亏损。大成基金韩创、鹏华基金袁航、博时基金曾豪、景顺长城基金余广、华安基金王斌等今年收益均能覆盖2023年的亏损。 宏利基金王鹏管理的宏利景气领航两年持有基金今年实现24.87%正收益,覆盖了2023年23.58%的亏损。不过,该基金最新单位净值仅有0.6759元,成立之初就持有的投资者仍面临着超30%的亏损。 随着A股市场情绪的回暖,尽管基金修复回撤的速度有望加快,但是距离大多数基金持有人实现账户盈利的目标还有很远。 “优质资产”价值回归 从顶流基金经理业绩回暖的背后,可以看到一直被基金经理青睐的“优质资产”价值正在回归。 年初,小微盘股遭遇重挫,A股市场也经历了显著的风格切换。多种因素共同驱动,A股市场从过去的炒小、炒差逐渐转向价值、绩优等优质股。 “经济的回升将给市场上行注入新的动力,市场有明显的企稳迹象。” 嘉实基金谭丽认为,整体市场的估值水平较低,隐含了较为悲观的业绩增长预期,乐观对待低预期下的收益率空间。此外,上市企业开始关注经营质量和分红,带给投资者切实的回报,回归投资的本质。 近期恒生指数实现五连涨,A股单日吸引超200亿元的北向资金,进一步将A股市场情绪推向高潮。“近期港股、A股均迎来大幅净流入,尤其银行、有色等经济关联品种配置资金流入较多,表明境外机构投资者也逐渐调整预期从悲观到中性偏乐观。” 华夏基金认为,A股、港股在悲观中连续下行,当前在全球范围的估值非常便宜。 从年内表现来看,申万低市盈率指数、低市净率指数、大盘指数均实现正收益,表现远好于小微盘指数、高市盈率指数。 核心资产、绩优股、价值股等热度升温,一直青睐上述标签公司的外资机构也在积极看多A股。 “继续超配A股。”高盛亚太首席股票策略师慕天辉及高盛首席中国股票策略师刘劲津在近日高盛举行的活动中给出了最新投资建议。同日,瑞银全球新兴市场股票首席策略师也发表了新兴市场股票策略,上调MSCI中国指数的评级至超配。 来源:证券时报
周鸿祎的人情江湖
人在江湖飘,哪能不挨刀 古代的镖局,靠的是武功?不,靠的是人情世故,否则光靠打,一路山山水水,各路神仙,一身是铁能打几颗钉呢? 红衣教主卖车了,这里面的人情世故,颇有趣,不说是非,就拿把剔骨刀,慢慢解。 看个时间线 4月20号,红衣教主说雷军本人为小米创造了10亿的广告价值。 转头,27号就说卖车,买家可以跟他吃饭。 结果都让他惊讶,有个二手车商褚先生出价990万拿下,这个价格把红衣教主都吓一跳,没想到二手车商比他玩的还野。一个旧迈巴赫就算加上炒作价值,卖了200也就差不多了。 兑现诺言,吃饭: 看得出来,教主何止是不太高兴,已经把不耐烦写到了脸上,也就是维持个体面,没拂袖而去搞的太难看。 所以有朋友讲,这事件是自导自演,我还真不觉得是,我相信拍卖的时候下面肯定安排了接盘人的,这也是防止流拍搞的难看。出价的褚会长这一行 ,明显跟教主不是一个圈子的人,是没法搞什么自导自演这一出的。 但这个视频流出,对双方都不利。 说二手车商的,没好话:你没看那个视频都说了么,不是一个圈子别强融,那意思就是:你们是什么阿物玩意,不是有个拍卖的事,配跟周总吃饭?也不照照镜子,还喝酒?还加微信,还要介绍pony 马?撒尿不照镜子的么? 说教主的就有好话了么?也没有!有不少人说:出来卖车吃饭,不就是做流氓软件出身的现在开始捞个流量,还装什么大瓣蒜?真的吃头孢了?真的加不上了?如果是个省部级的饭局,你还是这个表情么?不乐意就别开那个口,别吃那个饭,去了,吃了,请把姿势摆正。出台就有个出台的样子。 这话说错了?也没有。你看教主跟pony马见面,就明显是另外一个微表情嘛: 奇怪吗?不奇怪。 正常吗?很正常,就这就是人性,是你我皆有的人性:看人下刀,人均双标。 我刚工作那会,单位老大是个资历老,水平高的老领导。特点是雷厉风行外加脾气大。 开干部会,毫不留情客气的。经常把中层干部骂的狗血淋头。所以人说起来,都说L书记脾气不好。 我有位徐州老大哥,有次听到这话用他的徐州方言悠悠的说:他见到Z总的时候,脾气一点都不大。(Z总是更大的领导) 真相了,扎心了。 什么脾气大,什么情商低?都是在能发脾气的时候发脾气,能低的时候才低。 只听过喝醉酒性侵,殴打什么妇女儿童之类的,没听过醉酒去抽领导嘴巴子的。 所以昨天都有人说了,这钱是不是会付?今天教主说了,付了。 看来褚会长那一群油腻归油腻,信用还是有的。 而且涨了粉,算算账,也不是不能接受,来回反转眼球吸很多了。 其实看红衣教主,还是有点IT男气质的,IT男面上的人情世故或许有弱点,比如跟那群油腻二手车商吃饭吃的就不是特别愉快的样子。 但该拎得清的地方是特别拎得清的。无论是见到pony马的微表情,还是鼓吹国产电动车的正确性。 就说我自己用的那台破笔记本,里面的各种360想卸载都难,不是弹这个就弹那个,气的我经常想把电脑砸了;但公家电脑上一样有360企业版,就什么也不弹特别安分好用的样子,特别能践行不知道什么人对教主发出的赞誉: IT男,有IT男的人情世故的。
奥特曼承认了神秘gpt2!哈佛MIT巡演继续,斯坦福演讲完整版公开
奥特曼斯坦福爆火演讲,完整版录像公开了! 这还只是第一站,在哈佛和MIT再次发现了他的身影。 特别是在哈佛,他还变相承认了神秘gpt2-chatbot确实与OpenAI有关,但不是GPT-4.5。 事实上,我们可以同时在所有模型的行为和功能上取得进展,我认为这是个奇迹。 他还提到“每个大学生都应该学会训练GPT-2……这并不是最重要的事情,但我打赌两年后这是每个哈佛新生都必须做的事情”。 难不成,就真的是GPT-2 1.5B Plus Pro Max Q*威力加强年度典藏豪华版??? 斯坦福大学位于硅谷附近,而哈佛大学和麻省理工学院则位于美国另一端的东海岸波士顿。 奥特曼在哈佛的活动同样座无虚席,学生们据称提交了超过2000个问题,但只有少数人获得了现场提问的机会。 奥特曼这是复刻去年GPT-4发布后的世界巡游,又来了一把美国大学巡演的节奏。 更详细的消息来自哈佛大学校报和MIT科技评论。 在哈佛,奥特曼与师生讨论了AI在学术中的使用。 论文到底是学生还是ChatGPT写的,有关系吗? 奥特曼举例过去人们也曾担心计算器和搜索引擎会毁了教育,但这并没有发生,而ChatGPT就像“单词计算器”。 “必须不断发展的是规范”,奥特曼支持ChatGPT不仅可以用于理工科写作,也可以用于人文学科。 再用老式的方法写论文已经行不通了。用ChatGPT把发现和表达、交流想法做到最好,我认为这就是未来的发展方向。 在MIT,奥特曼则谈到Agent将是AI的杀手级应用。 就像一个超级能干的同事,他了解我一生的一切,我的每封电子邮件,每一次对话。‍ 在奥特曼看来,Agent新范式的AI能够在聊天界面之外帮助我们,摆脱现实世界的任务,但这并不一定需要单独的硬件。 我对新技术的消费硬件非常感兴趣,但我只是一个业余爱好者,离我的专业还很远。 被问到“是否已经知道GPT-5预计何时发布”时,奥特曼平静地说“是的”,面带微笑,没有再说别的了。 上周他在斯坦福的演讲完整版视频公开后,也有几个片段引发了热烈讨论: GPT-4将是你们中任何人必须再次使用的最愚蠢的模型。 我不在乎我们是否每年烧掉500亿美元,我们正在构建 AGI,这将是值得的。 奥特曼斯坦福爆火演讲整理 以下是双语字幕版完整视频以及内容整理。 奥特曼的大学生涯 主持人:如果用三个词形容你作为斯坦福本科生时的感受,你会用哪三个词? 奥特曼:兴奋、乐观、好奇。 主持人:形容现在,你会用哪三个词? 奥特曼:我猜是一样的。 主持人:这很棒。尽管过去19年世界发生了许多变化,但与未来19年即将发生的变化相比,这些变化可能显得微不足道。因此,我想请教你一个问题:如果你明天醒来,突然发现自己回到了19岁,并且拥有现在的所有知识,你会怎么做?会感到开心吗? 奥特曼:我会觉得自己正处在一个极具历史意义的时刻,世界正经历着巨变,同时,我也看到了参与其中并产生深远影响的机会,比如创业、从事AI研究等。 我认为现在是自互联网时代以来,甚至可能是技术史上,创立公司的最佳时机。随着AI的进步,每年都会产生更多的奇迹,伟大的公司正是在这样的时刻诞生,最具影响力的产品也是在此刻孕育。因此,我感到无比幸运,并决心充分利用这个机遇。我将明确自己的贡献方向,并付诸实践。 主持人:那你对自己将贡献的领域有偏好吗?你是否想继续保持学生的身份?如果是的话,你会主修什么专业? 奥特曼:我不会继续做学生,但只是因为我以前也没有这样做,而且我觉得可以合理地假设人们可能会再次做出他们曾经做过的决定。我认为做一名斯坦福的学生是一件很好的事情。只是,这可能不是我想要的。 主持人:你会怎么做? 奥特曼:我想我还是会选择我喜欢的方向,这并不奇怪,因为人们通常会按照自己的意愿行事。我想我会投身于人工智能研究。 主持人:你可能会在哪里做?学术界还是在私营企业? 奥特曼:我觉得,很明显我偏向于开放的应用程序,但我认为无论在哪里,只要能做有意义的AI研究,我都会感到非常兴奋。但我要悲伤的说,现实情况是,我会选择进入行业。我觉得确实需要在计算资源极其丰富的地方。 创业还是打工? 主持人:我们上周邀请了Qasar Younis,他极力主张不要成为创始人,而是加入一家现有的公司以学习相关技能。对于那些正在纠结是应该在19、20岁自己创业,还是加入其他创业公司的学生,你会给他们什么建议? 奥特曼:既然他给出了加入其他公司的理由,那我就讲另一个观点。我认为自己创办公司能学到很多东西。如果这是你想做的事,保罗·格雷厄姆有句话说得很好,我认为非常真实:创业不像医学那样有预科阶段,你只能通过实际经营创业公司来学会如何管理公司。如果你确信这就是你想做的事,那么你可能应该直接投入其中去做。 主持人:如果有人想要创办一家公司并从事AI领域,你认为当前AI领域最适合创业的短期挑战是什么?为了明确这一点,我指的是哪些问题是你认为需要优先解决但OpenAI在未来三年内无法解决的? 奥特曼:从某种意义上说,这个问题是非常合理的,但我不会直接回答它。因为我认为你永远不应该从任何人那里接受这种关于如何开始创业的建议。 当某个领域已经如此显而易见,以至于我或者其他人站在这里都可以指出它时,那它可能就不是一个好的创业方向了。我完全理解,我还记得我当初也会问别人,“我该创办什么样的公司?”。 但我认为拥有一份有影响力的职业最重要的原则之一是必须要走自己的路。如果你正在思考的事情是其他人也会去做的,或者是很多人都会去做的,那么你应该对其保持一点怀疑。 我认为我们需要培养的一个重要的能力是提出那些非显而易见的想法。我不知道现在最重要的想法是什么,但我确信这个房间里的某个人知道答案。我认为学会信任自己,提出自己的想法并勇敢去做那些不被广泛认同的事情非常重要。 比如我们刚开始创办OpenAI那会儿,这件事并没有得到很多人的认同,但现在它已经成为非常显而易见的事情了。现在我只是因为自己身处其中,才会对这个方向有比较明确的想法,但我相信你们会有其他的看法。 主持人:那么换个方式问,我不知道这样问是否公平。你正在思考但其他人并没有谈论的问题是什么呢? 奥特曼:如何建造真正大型的计算机。 我想,其他人也在讨论这个问题,但我们可能从别人无法想象的角度来看待它。我们正在努力解决的问题不仅是开发小学或中学水平的智能,还包括博士水平及更高层次的智能,并将其以最佳方式应用于产品,最大限度地对社会和人们的生活产生积极影响。我们目前还不知道答案,但我认为这是一个需要弄清楚的重要问题。 主持人:如果我们继续探讨如何建造大型计算机的问题,你能分享一下你的愿景吗?我知道有很多猜测和传闻,关于你正在开展的半导体代工厂项目。这个愿景与目前的做法有什么不同? 奥特曼:代工厂只是其中的一部分。我们越来越相信人工智能基础设施将成为未来最重要的投入之一,是每个人都会需要的资源,其中包括能源、数据中心、芯片、芯片设计和新型网络。我们需要从整体上看待整个生态系统,并设法在这些方面做得更多。仅关注某个部分是行不通的,我们必须全面考虑。 我认为这就是人类科技发展史的轨迹:不断构建更大、更复杂的系统。 不在乎烧钱,为了AGI都值得 主持人:至于计算成本方面,我听说训练ChatGPT模型花费了1亿美元,其参数量为1750亿。GPT-4的成本是4亿美元,参数量是前者的10倍。成本几乎增加了4倍,但参数量却增加了10倍。请纠正我,如果我有误的话。 奥特曼:我知道,但我想…… 主持人:好的。即使你不想纠正实际数字,但如果方向上是对的,你认为每次更新的成本是否会继续增长? 奥特曼:是的。 主持人:这种增长会呈倍数增加吗? 奥特曼:大概吧,我的意思是。 主持人:那么问题就变成了,我们该如何为此筹集资金? 奥特曼:我认为给人们提供真正强大的工具,让他们自己去探索如何用这些工具来构建未来,是非常有价值的。我非常愿意相信你们和世界上其他人的创造力,可以找到应对这一问题的方法。所以,OpenAI中可能有比我更具商业头脑的人担心我们花了多少,但我并不在意。 主持人:OpenAI、ChatGPT以及其他所有模型都非常出色,去年烧掉了5.2亿美元,这不会让你担心它的商业模式吗?盈利来源在哪里? 奥特曼:首先,谢谢你这么说,但ChatGPT还远称不上出色,顶多算是勉强合格。GPT-4是大家未来可能用到的最笨的模型了。但是,重要的是早早开始并不断发布,我们相信迭代式发布。 如果我们在地下室开发通用人工智能,然后世界浑然不觉地盲目前行,我不认为这会让我们成为好的邻居。因此,考虑到我们对未来的看法,我觉得重要的是表达我们的观点。 不过,更重要的是,将产品交到用户手中,让社会与技术共同进化。让社会告诉我们,集体和个人从技术中想要什么,如何将其产品化以便于使用。这个模型在哪些方面效果好,哪些方面效果差,让我们的领导者和机构有时间做出反应。给人们时间将其融入生活,学会使用这项工具。 一些人可能会用它作弊,但有一些人也可能会用它做非常了不起的事。每一代人的发展都会有所扩展,这意味着我们发布了不完美的产品,但有一个非常紧密的反馈循环,我们可以学习并变得更好。 发布让你感到尴尬的产品的确有点糟糕,但比起其他选择,这是更好的方式。在这个特别的情况下,我们真的应该向社会迭代发布。 我们了解到AI和惊喜不相容。人们不想受到惊吓,他们想要逐步推进并有能力影响这些系统。这就是我们的做法。 将来或许会有一些情况让我们认为迭代发布不是一个好的策略,但这似乎是目前最好的方法。我认为通过这样做,我们已经学到了很多东西。希望更广泛的世界也从中受益。 不论我们每年花费5亿美元、50亿美元还是500亿美元,我都不在乎。只要我们能够持续创造比这更多的社会价值,并能够找到支付账单的方式。我们正在开发AGI,这会很昂贵,但绝对值得。 主持人:那么,你有一个2030年的愿景吗?如果现在是2030年,你做到了。在你眼中,世界会是什么样子? 奥特曼:在某些非常重要的方面,或许并没有太大区别。 我们还会回到这里,会有新的一批学生。我们会谈论初创公司是多么重要,科技是多么酷。我们会拥有这个世界上新的伟大工具。 如果我们今天能够传送到六年前,并拥有这个在许多学科上比人类更聪明的东西,能够为我们完成这些复杂的任务,那将感觉非常棒。你知道,我们可以编写复杂的程序,完成这项研究或开始这项业务。 然而,太阳仍然东升西落,人们继续上演他们的人类戏剧,生活继续。所以,从某种意义上来说非常不同,因为我们现在有丰富的智能,但从另一个意义上来说,又没什么不同。 主持人:你提到了通用人工智能。在之前的采访中,你将其定义为能够模拟一个普通人类在各种任务中表现的软件。你觉得什么时候会实现这个目标?你能给出一个大致的时间或范围吗? 奥特曼:我认为我们需要对AGI有一个更精确的定义,以解决时间的问题。因为在这一点上,即使是你刚刚给出的定义,也是合理的,这就是你的定义。 主持人:我是在重复你之前在采访中说过的话。 奥特曼:我要批评我自己。这个定义太过宽泛,容易被误解。 所以我认为真正有用或能让人们满意的标准是:当人们问“AGI的时间表是什么”时,他们其实想知道的是世界什么时候会发生巨大变化,变化的速度什么时候会大幅加快,经济运作的方式什么时候会发生巨大变化,我的生活什么时候会改变。由于很多原因,这个时间点可能与我们想象的很不一样。 我完全可以想象这样的世界:我们在任何领域都能开发出具备博士水平的智能,可以大幅提升研究人员的生产力,甚至可以实现一些自主研究。从某种意义上说,这听起来似乎会对世界产生很大的影响,但也可能我们已经做到了这些后,却发现全球GDP增长在随后的几年里并没有发生变化。想想这种情况还是很奇怪的。这最初并不是我对整个过程的直觉。 所以,我无法给出一个具体的时间来说明我们何时能达到人们所关心的里程碑,但是在未来的一年以及之后的每一年,我们都会拥有比现在强大得多的系统,我认为这是关键。所以,我已经放弃了预测AGI的时间表。 主持人:你能否谈谈你对AGI危险性的看法?具体来说,你认为AGI最大的危险会是来自一场轰动各大媒体的灾难性事件,还是更为隐蔽和有害的东西,就像现在大家因为使用TikTok而注意力严重分散一样。或者两者都不是? 奥特曼:我更担心隐蔽的危险,因为我们更容易忽视它们。 很多人都在谈论灾难性的危险,并对此保持警惕。我不想轻视这些危险,我认为它们的确很严重且真实存在。但至少我们知道要关注这一点,并会花费大量精力。就像你提到的大家因为使用TikTok而注意力严重分散的例子,我们不需要去关注最终结果。这是一个真正棘手的问题,那些未知的东西真的很难预测,因此我更担心这些,尽管两者我都担心。 主持人:会是未知因素吗?你能说出你特别担心的因素吗? 奥特曼:嗯,那它们就会被归为未知因素。 尽管我认为短期内的变化会比我们想象的要少,就像其他重大技术一样。但从长远来看,我认为变化会超出我们的预期。我担心社会适应这种全新事物的速度,以及我们花多长时间去找到新的社会契约与我们能够用多长时间做到这一点,我对此感到担忧。 奥特曼的优点和最危险的弱点 主持人:随着事物的快速变化,我们正尝试将恢复力(resilience)作为课程的核心内容之一,而恢复力的基石是自我意识。所以,我想知道你在踏上这段旅程时,是否清楚自己的驱动力。 奥特曼:首先,我相信恢复力是可以被教的,恢复力一直是最重要的生活技能之一。在未来的几十年里,恢复力和适应能力会变得更重要,所以我觉得这个观点很好。至于自我意识的问题,我觉得自己是有自我意识的,但就像每个人都认为自己有自我意识一样,我是否真的有,很难从自身角度来评判。 主持人:我能问你我们在自我意识入门课程中经常问的问题吗? 奥特曼:当然。 主持人:这就像彼得·德鲁克的框架,Sam,你认为自己最大的优点是什么? 奥特曼:我认为我在许多事情上都不是特别出色,但也在很多方面都还不错。而且我认为在这个世界,广泛的技能被低估了。每个人都在过度专精,所以如果你擅长很多事情,就可以在其中找到联系。我认为这样你就能提出不同于其他人的想法,而不是仅仅成为某个领域的专家。 主持人:你最危险的弱点是什么? 奥特曼:最危险的弱点,这是个有趣的思考。我倾向于偏向支持技术,可能因为我很好奇,想看看技术的发展方向,而且我相信总体而言,技术是件好事。 我认为这种世界观总体上对我和其他人都很有利,因此得到了很多积极的反馈。然而,这并不总是对的,而且当它不对时,对许多人来说会产生非常不好的影响。 主持人:哈佛大学心理学家戴维·麦克利兰提出了一个框架,即所有领导者都被三种原始需求之一驱动:归属需求,即被喜欢的需求;成就需求;以及权力需求。如果必须对它们进行排序,你会怎么排? 奥特曼:在我的职业生涯中,不同时期都有这些需求。我认为人们会经历不同的阶段。而目前,我觉得驱使我前行的是想做一些有意义和有趣的事情。我之前肯定也经历过追求金钱、权力和地位的阶段。 主持人:你对即将推出的ChatGPT-5最感到兴奋的是什么? 我还不知道,这个答案听起来有点敷衍。但我认为关于GPT-5或任何我们将其命名的版本,最重要的是它将会更聪明。 听起来像在逃避,但我觉得这是人类历史上最显著的事实之一:我们能做点什么,并且现在可以以高度科学的确定性说,GPT-5会比GPT-4更聪明得多,GPT-6会比GPT-5更聪明得多。我们还没有到达这个曲线的顶端,我们大致知道该怎么做。它不会只在某一个领域变得更好,也不是总会在这次评估、这个学科或这种模式上表现更好,而是整体上会变得更聪明。我认为这一事实的重大意义仍被低估了。 观众提问环节 最后,我们也摘录了一些观众提问环节的精彩内容。 提问1:随着你们越来越接近AGI,你们打算如何负责任地部署它,以防止抑制人类创新并继续推动创新? 奥特曼:我并不担心AGI会抑制人类创新。我真的深信人们会用更好的工具做出更棒的成就。历史都显示,如果给人们更多的杠杆,他们就能做出更神奇的事情。这对我们所有人来说都是一件好事。 但我确实越来越担心如何负责任地做这一切。随着模型变得更加强大,我们面临的标准也会越来越高。我们已经做了很多事情,比如红队测试和外部审计。这些都很好。但我认为随着模型变得更强大,我们需要更加渐进地部署,并保持更紧密的反馈循环,关注它们的使用情况和发挥效果的领域。 我们过去可以每隔几年就发布一次大的模型更新,但现在我们可能需要找到方法来增加部署的颗粒度,比较更频繁地进行迭代部署。具体该如何做还不太清楚,但这将是负责任部署的关键。 此外,我们让所有利益相关者协商人工智能规则的方式,随着时间的推移,这也会变得越来越复杂。 提问2: 你之前提到,每年我们都会有更强大的AI系统。世界上许多地方都不具备建设这些数据中心或大型计算机的基础设施,全球创新会受到怎样的影响? 奥特曼:关于这个问题,我想分为两部分来谈。 首先,无论计算机在哪里建造,我认为全球公平地使用计算机进行训练和推理的访问权极为重要。我们使命的核心之一是让尽可能多想要使用ChatGPT的人能够使用它,我们可能无法或出于良好原因不想在那里运营。我们如何考虑使训练计算对世界更加可用,将变得越来越重要。我确实认为我们将进入一个世界,在这个世界里,我们认为获取一定量的计算能力是一种人权。我们得想办法如何将这种能力分配给世界各地的人们。 然而,还有第二点,那就是我认为各国将越来越意识到拥有自己的AI基础设施的重要性。我们想要找到一种方法,我们现在正花费大量时间周游世界,帮助许多想要建立这些设施的国家。我希望我们能在其中发挥一些微小的作用。 提问3:您认为人工智能在未来的太空探索或殖民中将扮演什么角色? 奥特曼: 我认为太空显然对生物生活并不友好。因此,如果我们能发送机器人,那看起来更容易。 提问4:你如何知道一个观点是非共识的?如何验证你的想法有没有得到科技界的共识? 奥特曼: 首先,你真正想要的是正确。持有相反观点但错误仍然是错误的。 如果你预测了过去两次衰退中的17次,你可能只是在你正确的那两次上持有相反观点。可能并非必然如此。但你其他15次都错了。所以我认为,成为相反意见者过于兴奋是很容易的。再次强调,最重要的是要正确。群体通常是正确的。但当你持有相反观点同时又正确时,价值最大,而这并不总是以非此即彼的方式发生。就像在场的每个人都可能同意AI是创业的正确领域。如果房间里的一个人找出了正确的公司来创立,然后成功地执行了它,而其他人都认为那不是你能做的最好的事情,那才是最重要的。 至于如何做到这一点,我认为围绕自己建立正确的同行群体非常重要,找到原创思考者也很重要。但你在某种程度上必须独自做这件事,或者至少是独自做一部分,或者与将成为你的联合创始人或其他人的几个人一起做。 我认为,一旦你在如何找到正确的同行群体这个问题上陷得太深,你已经处于错误的框架中了。学会信任自己和自己的直觉以及自己的思考过程,这随着时间的推移会变得容易得多。无论他们说什么,我认为没有人在刚开始时就真的非常擅长这一点。因为你还没有建立起肌肉,所承受的社会压力和进化压力都与此背道而驰。因此,随着时间的推移,你会越来越好,不要过早地对自己要求太高。 提问5:我很想知道你对未来几十年能源需求的变化,以及我们如何实现可再生能源每千瓦时1美分的未来。 奥特曼: 这一天也许会到来,但我不确定……我猜测最终核聚变将主导地球上的电力生产。我认为它将成为最便宜、最丰富、最可靠、能量密度最高的能源。我可能在这方面是错误的,也有可能是太阳能加上储能。你知道,我最大的猜测是,最终可能是这两种方式中的某一种,并且会有某些情况下其中一种比另一种更好,但这些看起来像是真正全球规模、每千瓦时一美分能源成本的两种主要选择。 提问6:从OpenAI去年的发生的事中学到了什么,是什么让你能回来? 奥特曼: 我学到的最好的一课是,我们拥有一个非常出色的团队,这个团队完全有能力在没有我的情况下运营公司,并且他们真的在没有我的情况下运营了几天。随着我们向人工通用智能(AGI)的进展,一些疯狂的事情可能会发生,甚至可能会有更多的疯狂事情在我们之间发生。因为世界的不同地区对我们的情感反应越来越强烈,风险也在不断增加。我曾经认为,在很大的压力下,团队会做得很好,但你永远不会真正知道,直到你有机会进行实验。我们有机会进行了这个实验,我了解到团队非常具有韧性,并且准备好了在某种程度上运营公司。 至于为什么我回来了,你知道,最初当董事会在第二天早上打电话给我,问我是否考虑回来时,我回答说不,我很生气。然后,我思考了这个问题,我意识到我有多么热爱OpenAI,我有多么热爱这些人,我们建立的文化,以及我们的使命。我有点想要和大家一起完成这一切。 提问7:能谈谈OpenAI这种俄罗斯套娃的结构吗? 奥特曼: 这种结构是逐渐形成的,如果我们可以重新来过,这不会是我会选择的方案。但在我们开始的时候,并没有想到会有一个产品。我们只是打算成为一个人工智能研究实验室。我们甚至都不清楚,我们对语言模型、API或ChatGPT没有任何概念。 所以,如果你要创办一家公司,你必须有一些理论,认为你总有一天会销售一个产品,而我们当时并没有这样想。我们没有意识到我们会需要这么多钱用于计算,我们也没有意识到我们会拥有这样一个不错的业务。OpenAI创办之初只是打算推进人工智能研究。 提问8:制造出比人类更聪明的东西是否会让你感到恐惧? 奥特曼: 当然让我感到恐惧。人类随着时间的推移变得越来越聪明、越来越有能力。你比你的祖父母能做的事要多,不是因为个人吃得更好或得到更多的医疗保健,而是社会的基础设施进步,如互联网、iPhone,让大量知识触手可及。 社会就是一个AGI系统,并不是某个人的大脑所能左右的,是所有人一砖一瓦搭建起来,为后来者创造更高的成就,你的孩子将拥有你没有的工具。 这总是有点吓人。但我认为,好的方面要比坏的方面多得多。未来的人们将能够使用这些新工具解决更多的问题, One More Thing 不知道奥特曼接下来几天还会到访哪些高校,不过整个旅程可能会在5月9日之前结束。 从泄露的文件可以看出,OpenAI设置了search.chatgpt.com子域名。 预计会在5月9日发布AI搜索功能。 目前,相关功能网页前端代码和设置界面已经泄露。 可能包括图片搜索、小组件(天气、计算器、体育、股票、时区计算)。 可选用GPT-4 Lite、GPT-4、GPT3.5等不同模型。
Vision Pro没起飞,下个故事是AI:苹果变成了一家卖梦的公司
作者|张潇雪 现实太骨感的苹果,正变成一家卖梦的公司。 上一季度财报发布时,正值Vision pro正式发售前夜,一切热闹都被苹果转化为推销给投资者们的“下一个iPhone”的美梦。 而一个季度过去,到今天第一个包含Vision pro销量的财报发布时,已经几乎没人在为这个“梦”买单。包括库克自己。在最新的财报和发布会上,关于上一财报季大讲特讲的Vision pro,库克只是用一些简单的官方发言一笔带过。另外更多的信息就只是强调了一下这个消费级硬件在企业级市场的受欢迎。 然后,苹果开始卖另一个梦:AI。 这是今年6月苹果WWDC之前的最后一次财报,而WWDC是苹果必须展示自己AI能力的最后机会。 1 iPhone卖不动,大中华区好难 先来看看苹果在硬件上的销售挑战。 财报显示,本季度苹果总营收907.5亿美元,同比下降4.3%,利润也下降2.2%至236亿美元,不过两项数字略高于分析师预期。每股摊薄收益1.53美元,与上年同期的1.52美元相比微增。 先来看龙头业务,苹果“当家老大”、占总收入六成的手机部门此次业绩低迷。除上次财报实现增长以外,已经是最近六个季度中的第五次下滑。销售额同比下降10.5%至460亿美元,表明去年9月推出的iPhone 15系列需求疲软。尽管15 Pro Max 1200美元的起价是有史以来最高的,但显然这种高端策略已不再像过去那样玩得转了。 根据IDC研究数据,今年前1到3月,三星已重新夺回了全球智能手机第一名的市场份额。但蒂姆·库克也解释说,去年同期实际叠加了因疫情影响拖延的50亿美元iPhone 14收入。如果刨除掉这50亿,两次收入本会持平。 然而当目光投向大中华区,任凭再怎么换算,情形也乐观不起来了。作为除美洲、欧洲外的全球第三大市场,本季度苹果在大中华区的表现比上次财报还惨。虽高于市场预期,且据库克透露iPhone销量略升,但收入总和滑落至163.7亿美元,同比下降8%,环比大跌了21.3%。 其中一大部分原因是来自中国本土手机品牌们的极速成长。研究机构Counterpoint Research指出,去年以来,华为手机在华销量激增近70%,而iPhone则下降了19%。高端智能手机市场的激烈竞争,让苹果在中国走得举步维艰。 1 Vision Pro首战财报季,回报尚需时间验证 iPhone打不动,其它硬件本季战绩如何? 继去年万圣节推出搭载新一代M3芯片的MacBook Pro后,今年3月苹果又将MacBook Air全线升级。推动Mac本季销售额增长4%至74.5亿美元。除此以外,Apple Watch、AirPods耳机和iPad都不幸以超过两位数的百分比下滑。 而另一款可穿戴设备——Vision Pro MR头显,作为苹果“20年来最冒险的革命性产品”,首个完整季度销售额也被涵盖在了这份财报中。 Vision Pro于今年2月初正式开售,是苹果向空间计算领域迈出革命性一步,开启混合现实技术新时代的产品。刚上市时曾狂揽一大波关注,从硅谷到纽约,瞬间涌现各种戴着Vision Pro走街串巷、隔空比划的“新人类”,网上更是热梗无数,火爆异常,让大家再次见识了苹果的品牌号召力。 图源:Sam Shedden 库克曾表示,Vision Pro是团队多年的研发心血,包括 5000 项技术专利,投资它相当于“为未来埋单”。 可毕竟动辄3500美元、折合2.53万人民币的售价,对普通人来说实在是肉疼。虽然财报中并未披露具体数字,但外界推测其销量远低于苹果主要产品线。此前,跟踪苹果最为紧密的分析师郭明錤透露,苹果已经把这款产品今年的订单下调到了40万到45万台,远低于此前70万到80万台的普遍预期。 而在财报上,库克只是冠冕堂皇的表示“对这一季度销售Vision pro感到激动”。 “当前我们只是触及了表面,我对未来蕴藏的机会感到非常兴奋。”库克这样说。 而电话会上的表态更有意思,他强调了财富100强里有一半已经在订购这款产品。对一个定位消费级硬件的产品却只能强调企业级市场的“订购意愿”,你几乎可以明确感受到库克也不指望这款产品能成下一个iPhone了。 纵观来看,除服务业务增长14.2%至239亿美元外,其余核心业务整体下滑。以及更重要的是,在微软、谷歌、Meta等各大互联网巨头都争相进军生成式人工智能、拼得你死我活的时候,苹果的节奏却显得又佛系又被动。 反映在二级市场也很明显,今年以来苹果股价下跌了6.79%,成为美国“科技七巨头”里除Tesla外表现第二差的股票。除了这两位难兄难弟,其余五家都在比着涨。作为参考,最早布局AI的微软今年股价上涨27%,以Llama3豪赌开源的Meta,即使发完财报市值跳水后股价仍比年初高28%。苹果也因此被外界批评“明显缺乏长期投资和创新的远见,给VR大把烧钱,对AI领域却没有思想领导力。” 1 生成式AI,不得不上了 AI已经是苹果不能再迟讲出的故事。 在财报后的电话会议上,库克表示:“我们相信人工智能的变革力量和前景,我们也拥有能在这个新时代脱颖而出的优势,包括苹果独特的硬件、软件和服务无缝整合;开创性的苹果芯片和业界领先的神经引擎;还有我们对隐私的坚定关注。” 库克也暗示苹果一直在悄悄开展人工智能项目,强调将对AI技术进行“持续且重大的投资”,并承诺将在2024年后期公布令人兴奋的AI进展。 值得注意的是,此前库克在苹果的生成式AI计划方面一直低调保密,只是偶尔透露一些公司的小型投资消息。这是他第一次如此强烈地公开表明苹果将如何在该领域与其它对手正面竞争。 而最令人期待的当然是6月10日即将举办的年度WWDC开发者大会,不仅是苹果生成式人工智能雄心的启动平台,更将成为整个AI行业的历史时刻。分析师认为,“下一季度可能成为市场情绪的转折点,催化剂就是苹果这场全球开发者大会。”库克也称生成式人工智能将为苹果带来巨大机遇,具有令人难以置信的“突破潜力”,将为用户释放“变革性机会”。 图源:UNSPLASH: @TRACMINHVU/APPLE 此前就有各种消息称,苹果一直在与Google、OpenAI等大模型供应商探讨合作。它也曾在3月时发布自研的30B 参数多模态 MoE架构大模型。甚至果断放弃了十年造车业务,转而把更多人才和技术资源大举投入GenAI。此次的WWDC将是苹果最近几年最重要的一次发布会,也是决定它未来几年命运的一场发布会。苹果的AI,或者说苹果会把别人的AI以何种形式引入自己下一代iOS系统、以及iPhone、Mac和Vision Pro等热门硬件上,会决定这家公司的一切。 不过,在那之前,在今天的财报发布后,库克还是先把自己最擅长的事情做了。在管理好了华尔街对苹果的预期——大家一致看衰,预期极低后,这次财报的跌幅可以看起来“没到预期那么糟糕”。然后库克推出公司史上最大的一笔1100亿美元股票回购计划,成功把苹果的市值稳住了。股价盘后还上涨了6%。 看来库克做好了自己能做的一切,准备迎来可能是自己在苹果的最后一战了。
绿电与绿色甲醇混合动力保障石油及粮食安全
刘科,李俊国,吴昌宁 南方科技大学 1. 前言 近期电动车与燃油车之争,因苹果丰田退出电动车、小米造车等话题又引起国人的讨论。本文从能源全生命周期及碳中和的大系统出发探讨适合中国国情的绿色甲醇与电池的混合动力路径,供大家参考。本文主体内容新近发表于中国工程院主办的国际知名学术期刊《Engineering》上(2023年 第29卷第10期,中英双语,绿色甲醇——实现碳中和的重要途径)[1]。《Engineering》于2015年创刊,入选了“2023中国最具国际影响力学术期刊(自然科学与工程技术)”。 中国正在推动以碳达峰碳中和为宏伟目标的“双碳”行动计划,其关键在于增加可再生能源生产与消纳,用更多的可再生能源取代石油及煤炭。太阳能的成本近年大降,但每年的有效发电时间非常有限,长三角地区每年1000小时左右,榆林鄂尔多斯等地约1700小时,约为全年时长的11~20%,而风能全国各地不同,平均 2200小时左右,约为全年时长的20~25%。这表明,太阳能、风能仅在其能发电的时段比火电便宜,而在其他时段,如果要储电,其成本会远远高于火电。因此,在多数情况下,太阳能发电不具备竞争优势,实际情况下已发出的电较大比例被浪费了。风力发电存在关于季节性成本波动的类似问题,中国风电行业每年因不合理电源结构和远距离输配电网挑战产生了可达200亿度的弃电量[2]。 为了实现“双碳”目标,开发一种商业上可行的、可以在全球范围内实施的大规模储能技术势在必行。一般来说,基于电池的储能解决方案由于其技术不成熟和成本限制而不适合大规模储能。目前电池的全年产能远低于日益增长的可再生能源储能需求。不管是抽水储能、压缩空气储能,还是电池储能、重力储能,只能实现短期储能。在降雨量减少或风力低的时期,这些储能技术的功效受到极大限制[3, 4]。在过去的40年里,北半球一半的风力资源一直在减少,下降幅度超过30%,这可以归因于气候变化。因此,迫切需要探索太阳能和风能大规模储存的解决方案,同时推进长期储能技术的开发和部署。 实现中国的双碳目标挑战很大,需要在双碳实现路径与经济社会协同发展之间取得微妙的平衡。这种平衡在很大程度上依赖于太阳能、风能、煤炭、石油和天然气等基础设施和设备现有及未来投资的可持续利用。与双碳目标相关的资金需求量是巨大的,因此市场导向和稳步进展对于成功实现该目标至关重要。也就是说,仅仅依靠财政补贴不足以达到预期的结果。预计未来可再生能源/氢能在中国能源总结构中的比重将大幅提高。然而,可再生能源的内在间歇性和不稳定性是一个关键的制约因素[5]。因此,为了实现双碳目标,实现可再生能源可靠、安全、有效的运输及储存势在必行。我们对开发大规模、低成本、实用的高效储能技术具有非常迫切的现实需求。目前,大多数储能技术的研究都集中在增强材料能量容量或发现新型储能材料[6, 7]。然而,这些努力主要停留在理论研究阶段,短期内无法作为大规模储能技术应用。 我们提出一条支持低碳社会发展的绿色甲醇路径,建议尝试利用中国最丰富的两大资源(即西部的沙漠戈壁带来的几乎无限的风光资源与中国丰富的劣质煤资源)结合制取绿色甲醇,同时用劣质煤分离出的矿物质微粒改良板结的土地、盐碱地及沙土地,既解决中国石油不够的问题又能保障粮食安全。同时,绿电与绿色甲醇混合动力,解决纯电动的几大痛点。甲醇因其高能量密度而被广泛认为是一种适宜的能量载体。中国的风光资源既煤炭资源主要在西北;通过将中国西部的间歇性可再生能源及劣质煤转化为绿色甲醇,可以有效地将可再生能量以液体形式储存起来,并实现长期保存。结合中国本身西高东低的地理特征,西部生产的甲醇可以通过管线低成本高效运输到东部及沿海城市。这有可能是一种大规模的、符合中国国情的绿色液体取代石油的解决方案。 业界对绿色甲醇的概念有不同的理解,容易导致学术研讨及工程实践方面的混淆,我们对绿色甲醇的概念,做了适当的补充说明。 1994年诺贝尔化学奖得主、美国南加州大学Olah教授于2006年在其专著《Beyond Oil and Gas: The Methanol Economy(跨越油气时代的甲醇经济)》中首次提出了甲醇经济的概念,受到全世界各国学者、政府及产业界的广泛关注。经多年科技开发与产业实践,甲醇的来源已从早期的化石能源制取路线(煤制甲醇、天然气制甲醇等)发展到化石能源/非化石能源共同制取、可再生能源制取路线,甲醇经济已深入融合世界经济发展。在2023年举办的杭州第19届亚运会上,主火炬燃料首次使用废碳再生的“绿色甲醇”,实现了零排放的碳循环过程。 国际可再生能源署IRENA在2021年的《创新场景:可再生甲醇》报告中尝试给出了“生物甲醇”、“绿色甲醇”的定义[8]。“生物甲醇”指的是由例如林业和农业废弃物及副产品、沼气、污水、城市固体废弃物(MSW)和制浆造纸业的黑液等生物质生产的甲醇。“绿色甲醇”指的是从可再生能源电力生产的二氧化碳和绿氢中获得的可再生甲醇。 对于来自发电厂、钢铁和水泥厂等各种工业来源的CO2,IRENA考虑到这些CO2通常会排放到大气去,作为替代方式可将其进行再利用(即与绿氢共同生产低碳甲醇),这类甲醇归入了绿色甲醇的范围。为了实现可持续及CO2净零排放,未来将越来越多地使用生物来源的CO2,例如蒸馏厂、发酵装置、MSW、沼气以及其他装置来源(如生物质发电厂)的CO2通常被视为废气而排放到大气中,从这些装置捕获、存储或利用CO2的工艺通常被称为生物能源与碳捕获和储存(BECCS)或生物能源与碳捕获和利用(BECCU) [9],属于IRENA认可的绿色甲醇生产工艺。基于直接空气捕获[DAC]的CO2,结合绿氢生产甲醇的工艺,也属于IRENA认可的绿色甲醇生产工艺,但该技术方向仍面临技术开发及商业化的挑战。 地球上的能源主要来自阳光,但“光阴似箭”难以捕获,如何把阳光变成随人们的意志可储存、可运输的液体,白春礼、张涛、李静海、施春风四位院士于2018年9月在国际知名期刊《焦耳》上联名发表文章解答了这个问题。他们将甲醇技术划分为五代,第五代甲醇技术以空气中的二氧化碳和取之于水的氢合成甲醇,也叫液态阳光(Liquid Sunshine)[10]。中科院大连化物所李灿院士团队进一步通过甘肃省兰州新区的1000吨/年液态阳光甲醇示范装置验证了液态阳光的基本原理:利用太阳能、风能等可再生能源分解水制绿氢,再由绿氢加二氧化碳转化生产甲醇[11]。CO2+H2可以制甲醇(CO2+3H2 = CH3OH+H2O),技术上没问题,但宝贵的H2有1/3转化为只有几元一吨的水(H2O),成本比我们提出的用绿电生产甲醇的路径要高出一倍以上,如果欧洲人愿意出高价收购,我们乐见其成,去赚欧洲人的钱,但在中国国内在可见的未来,成本太高,没必要追求100%绿色零碳,我们的路径比煤制甲醇减碳近~82%,尽管还有~18%的碳排放,但CO2排放太多不行,没有,人类也无法生存,因为我们呼吸的氧气及吃的食品都是CO2光合作用形成,欧洲极端环保主义追求的零碳既不现实,也不科学。 目前生物甲醇、液态阳光甲醇的生产成本与现有甲醇产品相比还是过高了,导致其推广应用遇到了相当大的阻力。按中国科学院液态阳光研究组在2018年的预测,液态阳光甲醇的大规模应用可能要到21世纪40年代。同时从全生命周期角度看,甲醇制造过程的装备制造、生产消耗及储运过程是伴随着一定程度的碳排放的,做到绝对的零碳排放(也即100%绿色)是很有挑战的,其实质意义也是存疑的。汽车行业出于碳中和需要,已在积极探索实践引入零碳绿色甲醇的可能性,但受生产成本控制需要,CO2来源中短期内只能优先考虑工业排放源,合成甲醇用的氢源暂时用石能源加工装置的低成本副产氢气[12, 13]。此类暂时采用工业副产氢的甲醇项目,业界一般称为“绿色低碳甲醇”项目,目前已投产的主要包括吉利集团河南安阳11万吨/年CO2加氢制绿色低碳甲醇联产LNG项目、江苏斯尔邦10万吨/年CO2加氢制绿色低碳甲醇-光伏新能源材料项目。各类采用绿氢的绿色甲醇项目,尚处于规划阶段。 2. 适合国情的绿色甲醇技术路径 传统的甲醇合成主要以煤作为原料,工艺流程如图1(a)所示。煤基甲醇合成包括两个主要步骤:煤气化(煤 + O2 + H2O → H2 + CO + CO2);甲醇合成(2H2 + CO → CH3OH),每份甲醇合成大致需要1体积CO和2体积H2,即氢碳比应为2 : 1。然而,目前工业中典型煤气化工艺中粗煤气的氢碳比约在0.5 : 1~1.0 : 1水平,所以必须通过水煤气变换过程(WGS,H2O + CO → H2 + CO2)来补氢。基于上述分析,在传统煤基甲醇合成过程中,每生产1吨甲醇约排放2吨的CO2,进一步考虑配套装置的公用工程消耗,全厂总CO2排放量3.5~4吨,典型的全厂碳排放数据,详见图1(a)。 图1 (a)常规甲醇合成;(b)绿色甲醇合成示意图 有学者专门研究了电转氢气储能过程的效率[14, 15]。在中国西部地区,可再生能源(光伏发电与风电)结合先进的电解水技术制取绿氢绿氧是有市场竞争力的,如果通过汽运送到东部地区,则可为东部地区供应氢能。尽管这一愿景前景广阔,但氢既不容易储存也不容易运输[5],未来要建氢气输运管线,但长距离输氢的管线投资很大(约600万/公里),另外更重要的是即使氢气管线修到某个城市,必须在短时间内消耗掉,否则再大的储罐也储不下,氢气输运系统需要各方协调且非常复杂的系统工程;在可见的未来国家还没有规划。而在没有管道的情况下,目前运氢的高压罐车重量大,一辆49吨重的卡车只能装350kg的氢,为了维护压力平衡,到目的地后只能卸载250kg,另外那100kg必须来回跑,而且运氢的大罐车,超过一定规模的氢按目前的安全政策是不允许过隧道的。甲醇是具有储氢、储电、储光功能的良好能量载体,在储运方面有先天优势[16, 17]。通过将中国西部的间歇性可再生能源转化为液态甲醇,可以有效地将能量以液体形式储存起来,以便长期保存及输运[18, 19]。为提高甲醇生产的环境友好性,中国西部已有的煤化工行业可以消纳源自可再生能源的氧气和氢气。 我们团队正在开发的绿色甲醇新合成工艺,如图1(b)所示。相比于传统工艺,我们不仅利用绿电制绿氢,同时用副产的绿氧去气化一点碳源,甲醇厂需要的能量都来源于风光,只是甲醇分子力的C原子从碳源来, 如果碳源用生物质,我们的过程也是100%绿色,如果碳源用劣质煤,我们也比煤制甲醇减碳约~82%,尽管不是100%零碳,但成本是生物质的一半,而剩余的18%的碳排放是人类生存必须的CO2. 我们的路径可精简掉空气分离和WGS单元的碳排放,这是由于引入了足量的从可再生能源制得的绿氢和绿氧。 除了这个创新点之外,上述工艺方法与现有绿色甲醇工艺的区别,可概述如下: 与IRENA所述绿色甲醇工艺的“来自发电厂、钢铁和水泥厂等各种工业来源的CO2”先排放,再收集后与绿氢化合转化不同,本工艺让绿氧直接作为煤气化过程的原料气、让绿氢进入甲醇合成单元,使得甲醇合成工艺实现低碳化甚至零碳化排放; 与液态阳光甲醇工艺的“空气中的二氧化碳和取之于水的氢合成甲醇”[10, 11]不同,本工艺不仅利用绿氢,更主要的是要充分利用绿氧去气化最便宜的碳源(如劣质煤等),同时让气化炉生产的CO和少量CO2与绿氢及气化产生的氢一起催化合成甲醇; 与煤化工耦合绿氢的简单工艺不同,本工艺可采用煤与生物质/MSW联合转化[20, 21],具有原料操控弹性,且所用煤炭原料优先使用可分离出具有土壤改良固碳功能的天然远古矿物质的低质煤煤源(确保控制低生产成本及土壤碳汇能力)[22]。 此外,本工艺方法具有落地实施方面的优势,传统甲醇生产设施只需进行适量的改造翻新即可用于制取绿色甲醇。 与此同时,绿色甲醇可作为光伏发电、风能和地热能耦合融合制绿氢后的氢能载体。绿色甲醇也可作为生物质气化耦合二氧化碳加氢制化学品过程的主要产品(CO2+ 3H2→ CH3OH + H2O),从气化炉出来少量的CO2,无需分离,用绿电生产的绿氢,把气化炉出来的CO和CO2全部转化为甲醇,进而实现多元化路径的减排, 如下节所述,我们提出的路线在解决传统煤制甲醇工艺固有的高碳排放问题的同时,成本比CO2加氢的液态阳光路径降低很多,既可以大量减碳又成本可控。 3. 绿色甲醇应用的预期效益 3.1. 绿色甲醇的成本 前文概述了我团队提出的绿色甲醇技术路线。针对绿电、绿氢、绿氧完全替代传统甲醇工艺过程所需的公用工程消耗及原材料消耗工况,每增加1千克绿氢,可降低CO2排放量,约为7千克(以典型干法气化为例)。每吨绿色甲醇对应的土壤碳汇潜力:用2000~3000 kcal/kg的劣质煤,经微矿分离制得优质化工原料并进一步制取甲醇,天然远古矿物质(SRM)收率按劣质煤原料的40%计算,每吨SRM用于土壤改良后的固碳能力按0.9 t CO2/t SRM测算;与传统甲醇相比,约可进一步降碳10个百分点。具体计算过程:每吨传统甲醇,生产过程排放3.5吨CO2,自身使用后排放1.38吨CO2;每吨绿色甲醇,仅自身使用后排放1.38吨CO2,减碳率约为72%。引入土壤碳汇之后,每吨绿色甲醇被使用排放0.88吨CO2,减碳率约为82%。 为了进一步评估其可行性,我们通过算例比较了传统煤基甲醇工艺和新型绿色甲醇工艺(考虑短期内更具实操性的工况,燃煤使用量减量50%;中长期将采用绿电代替公用工程)的生产成本。计算考虑电解水用电价格为0.2元/kWh,其他费用基于中国的平均价格标准。考虑征收100 CNY/t CO2的碳税,加上原材料和公共工程的消耗和价格,传统煤基甲醇的生产成本约为2515.7 CNY/t。在相同规模下,通过本研究提出的新型绿色甲醇的生产成本约为2491.3 CNY/t。因此,绿色甲醇工艺实现了与传统路线相当的成本水平,同时提供了减少碳排放的额外好处。 3.2. 用于分布式发电的绿色甲醇 甲醇蒸汽重整工艺用于H2 生产及其在燃料电池中的后续使用,提供了一种有前途的分布式发电技术。基于甲醇的分布式发电技术的主要应用场景,如图2所示。一个重要的应用场景,是给位于偏远山区的5G基站供电,例如广东省的多个山顶5G基站。这些基站依靠甲醇蒸汽重整结合氢能发电系统作为其能源供应。这些电站经多年运行的稳定性,证明了甲醇分布式发电方法的可行性和可靠性。 图 2 基于甲醇的分布式发电技术的主要应用场景 使用基于甲醇的分布式发电系统,其主要优点是避免了从城市到远程基站的高昂能源传输成本。例如,通过部署四个2.5千瓦的绿色甲醇分布式供能系统,即可为5G基站提供足够的电力。每隔几个月拉半车甲醇就可满足其用电需求。这个设备发电只要甲醇和水。工作原理是甲醇和水在200多摄氏度产生氢气,氢气在80摄氏度和空气通过燃料电池发电。它的发电效率就比内燃机燃烧发电效率高2倍-3倍,而且反应器中200多摄氏度的余热冬天可以供暖,夏天通过热泵可以制冷。2.5千瓦的单台机器就可以满足一个普通别墅的供电、供暖、制冷需要。这个例子很好展示了该技术应用的多功能性和高能源效率,包括固定式和移动式电源系统。 基于现有的技术,选取具有代表性的工艺流程的效率及成本,计算“光伏发电-电解水制氢-液氢储运”及“绿色甲醇+甲醇制氢”的供氢成本及效率,结果如图3所示。 图 3 “光伏发电-电解水制氢—液氢”与 “绿色甲醇-甲醇制氢”供氢成本及效率对比 本案例计算,假设场景为氢源为利用西部丰富的风光能源通过电解水制得的氢气,用氢地为距离氢源地约500km的中东部地区。图3中各单元上标的百分数为绿氢的转换效率,下标为该单元的生产/运输氢气的成本。综合供氢成本由各单元累计成本(基于转换效率折算)除以终端氢气量计算而得。考虑两种技术路线均经过相对成熟的商业化运行磨合之后,其综合供氢成本可以通过多步骤的分解评估与汇总核算获得。通过“光伏发电-电解水制氢-液氢储运”路线,其终端用氢成本为95元/kgH2,而“绿色甲醇+甲醇制氢”路线的终端用氢成本为41元/kgH2。因此,在本案例的物理场景下,“绿色甲醇+甲醇制氢”相较于“光伏发电-电解水制氢-液氢储运”具有成本优势,其主要原因有: 1) 氢气压缩成本降低。氢气压缩为高压氢(30MPa)时成本较高,而绿色甲醇的制备过程中压缩氢气用于合成甲醇的压力上限为10MPa,进而成本极大降低。 2) 运输效率的提升及成本的降低。液氢的运输过程中需使用特制液氢罐车,且该过程中部分液氢将气化后损失(0.5%-1%/天),总损失量与运输天数有关。在500km运输距离上,损失约为3%。而甲醇在运输过程中的总损失量与距离无关,约为0.5%,且甲醇运输的物流链成熟,物流成本低。此外,甲醇的运输相较于液氢的安全性更为高。 在绿色甲醇-甲醇制氢流程中,两个关键单元甲醇合成、甲醇制氢的氢气转化效率低于90%(分别为82%、70%)。在甲醇合成单元中,氢气转化效率为单程效率,尚未考虑驰放气的回收利用。在甲醇制氢单元中,按照目前的技术方案,采用30%的甲醇作为制氢反应装置的热源,暂未考虑甲醇制氢系统的热管理优化。这两个单元的优化将提升“绿色甲醇-甲醇制氢”方式的整体效率。 相比之下,目前西部建一个典型火电厂,整体能源效率约为40%。这表明,每100万大卡的煤只能发40多万大卡的电,在输送的过程中再损失一些,只有30多万大卡电送到东部沿海城市的用户端,其中60多万大卡以热的形式耗散掉。与电力不同,热量不能通过网络有效地长距离传输,但绿色甲醇作为液体可以通过管道运输。 3.3. 对减少石油进口依赖有很大的作用 只要绿电成本低于0.2元/kWh,绿色甲醇每百万大卡的成本不会超过汽油,利用中国已经便宜的太阳能和大量的生物质、城市垃圾(约80%是生物质)及劣质煤制成的绿色甲醇,不仅可以大大减低碳排放,而且可大规模替代进口石油,可逐渐打破石油美元的垄断。 在可预见的未来,预计可以大规模推广以绿色甲醇为资源的能源系统,并与广泛的可再生能源技术相结合,包括发电、储能及输电。智能电网与绿色甲醇网络的有机结合,可以逐步将当前的煤炭/石油经济转变为以可再生能源为主导的绿色电力和甲醇经济。绿色甲醇具有满足中国交通、电力和供热系统能源需求和挑战的潜力。它产生的碳排放量仅为传统能源的20%,有效地解决了石油短缺和碳中和问题。 3.4. 绿色甲醇与绿电的混合动力能在保障能源安全的前提下实现碳中和 利用我国东西部的海拔差,液体可以借势流往东部沿海城市。在“双碳”的要求下,今后既然储电成本尚高,电网还存在一定的瓶颈,那可以把多余的、便宜的风能太阳能在西部电解水制氢制氧,仅利用少量碳,把太阳能风能转成绿色的液体进行利用。 绿色甲醇作为燃料有各种应用场景。Wu等人[23]提出了一种基于混合燃料电池系统的新型甲醇利用发电技术,该技术可以高效、经济地将甲醇转化为电能。Wang等人[24]提出了一种新的甲醇-电力热电联产系统,实现了医疗废物的近零排放资源化利用。关于替代燃料在内燃机中的应用,首先,吉利集团已经开发出成熟的甲醇内燃机技术,并已在西安、贵阳等中国多个城市实施。公共交通车辆(即公共汽车和出租车)近年来配备了甲醇内燃机,证实了可安全运行。其次,插电式混合动力电动甲醇汽车具有降低油耗和温室气体排放的潜力,比亚迪的DM-i等油电混合动力汽车实现了低至每百公里5升的油耗。最后,当燃料电池成本足够便宜了,车上装绿色甲醇,通过车载甲醇在线制氢,氢气通过燃料电池发电,电再为车辆提供动力,1升甲醇制氢气的质量是1升液氢的两倍。通过把现有液体基础设施加油站改造成绿色甲醇加注站,可以支持内燃机车、电动车、氢燃料电池车三代汽车的发展。中国液体运输的地理优势,以及绿色甲醇作为燃料的多功能性,为减少碳排放和向可持续能源解决方案过渡提供了机会。 加氢站所需建设规模明显超过现有加油站规模。因此,建议不要急于拆除现有的加油站,而是将其改造为绿色甲醇站。这种方法可很好地利用现有的燃料加注设备。同一套甲醇装置在现在可服务内燃机,进一步可支持插电式混动设备,在未来还能够服务氢能与燃料电池。 作为汽车的替代燃料,甲醇的安全性一直是公众和政府部门最关心的问题,甲醇汽车试点自2012年起由国家工信部在山西、陕西、甘肃、贵州等省实施。这些试点项目于2018年成功通过了测试,验证了甲醇燃料汽车的环保、安全、经济和可靠性。这一结果澄清了公众和政府层面长期存在的与甲醇燃料相关的安全质疑。 2018年我们就写了《关于中国新能源汽车战略再思考》的文章,后来网易又请作者做了一期《电动车与氢能的历史与未来》的公开课。由于篇幅有限,可能给读者造成我们反对电动车的误解;其实恰恰相反,我们不仅不反对电动车,而是想办法解决电动车的痛点。我们提出用绿色甲醇与电池的混合动力来解决纯电动的以下痛点: 痛点1:纯电动要保证600公里的续航,电池必须做的很大、很重,需要消耗大量锂、钴、镍等昂贵的金属材料,使得其成本上升;而对绝大多数的人,可能每年只有不到5%的时间需要600公里续航,绝大多数时间每天上下班有150公里的续航就够了。偶尔需要开长途,在车上装一个50-100升的燃料桶及一个小型的绿色甲醇增程器。平时上下班时这个燃料桶可空着;需要远行时再加满液体燃料,路上可以边开车边充电——这样就解除了续航旅程焦虑。平时95%的时间里,也不需要背着一套600-800公斤的大电池到处跑(那是能源的浪费)。而且,造一辆纯电动的电池材料可以造4辆混合动力车,可减少材料成本。 痛点2:如果大部分汽车走纯电动的路线,全社会就必须再花几万亿资金建快充的基础设施。纯电动的应用场景下,用户不太愿意等几个小时去慢充。快充站必须集中管理,且占地成本偏高。今天标准的加油站是设计每天服务大概450辆车,每辆车加油约3分钟左右,由此可计算加油站的占地面积。目前快充约需30分钟,这意味着要建一个服务450辆纯电动车的快充站,占地约是今天加油站的近10倍。北上广深地价如此之贵,卖电的收入很难支付地价。而混合动力就不需要快充,采用慢充的设备可降低造价,且可安装到各个小区,电网不需要大规模更新,基础设施成本大降。此外,慢充的一大好处是可以选择电价便宜的时段。在电网的风能、太阳能无法消纳时,可通过智能控制,让电动车有选择地变成绿电的消纳装置。 如果全都推行纯电动,车没电时大家都要火急火燎地快充赶路,那电网有什么电就得充什么电。中国电网在可见的未来还是以火电为主,所以纯电动表面是电开车,实际是煤开车,很难起到真正的减碳作用。目前限制可再生能源在电网里的比例就是因为风光无法预测,有时候为了维护大电网的稳定,不得不弃光弃风。纯电动如果在白天峰电时段,突然有几千万辆电动车去快充,就会增加电网的负荷及风险。要让电动车有选择地使用绿电,用混合动力和慢充是正确方向。 在今天的加油站基础上增加绿色甲醇的加注设备,比在全中国乃至全世界建快充站要容易的多。把人类已经花了几十万亿建的液体的基础设施废掉,再去重新去建快充站或加氢站,既不现实,短期不可能做到,也不科学。电动车的出发点是减碳,用风光等新能源取代汽柴油来开车,而纯电动要求的快充不太容易有选择地去使用绿电开车。 痛点3:纯电动不适合在寒冷的冬天使用,而这个世界70%以上的经济体是有寒冷冬天的区域如纽约、伦敦、巴黎、柏林、多伦多、莫斯科、北京、东京等大城市。在这些寒冷的地区,电动车冬天不太合适;但如果用绿色甲醇和电的混合动力,冬天甲醇燃烧发电的余热就可以维持汽车及电池再最佳温度。即使在重庆这些暖和的地区,纯电动因为电池太重,电动车爬坡是平地耗电的8倍左右,里程会大打折扣。 痛点4:纯电动因为电池大,一般整个车底盘都是电池,一旦着火驾驶员及乘客安全都有危险;如果做成混合动力,因电池只有纯电动的1/4,就可以布局到离驾驶员及乘客远一点的地方,降低风险。 痛点5:纯电动因电池600-800公斤,太重,回收运输不方便, 需要吊车等装卸设备。如果走醇电混动,把电池重量控制在150公斤以下,一个人开个小货车就可以回收,对建立低成本的回收体系有帮助。 总之,纯电动适合在平坦暖和的城市做乘用车,但对有寒冷天气的地区及山区不合适;另外对大卡车等商用车,电池本身就有几吨重,在山区爬坡容易耗光电源,纯电动也不合适。因此既不要用绿色液体燃料去反对电动车的推广应用,也不要用电动车去反对低碳绿色液体燃料的推广应用(如用风能、太阳能和劣质煤制的绿色甲醇)。未来碳中和时代的能源体系就是绿色电网及绿色液体管网及绿色氢气管网的有机结合。适合用电的地方用纯电动,适合用绿色液体燃料(甲醇)的地方用液体;绿色液体和电的混合动力适合大部分地区。燃烧汽油柴油的燃油车有可能在未来消失,燃烧绿色液体的内燃机不但不会消失,还要大发展。 4. 结论与展望 太阳能发电的成本已接近甚至低于火电,但平均大约只有不到20%时间能有效发电(取决于地域),其它80%以上的时间要依赖储能。用绿色能源取代化石能源的核心是储能;将风能和太阳能转化为绿色甲醇液体储存是成本较低、能满足长周期能量储用需求的储能技术之一。液体是最好的能源载体,以绿色甲醇为原料的能源系统若能大面积推广,加上智能电网与绿色甲醇管网的有机结合,可把今天的煤炭/石油经济改为以可再生能源为主的绿色电力与绿色甲醇经济,有望用如今煤炭和石油经济约20%的碳排放量,解决中国的交通、电力和供暖供冷及石油短缺问题,并实现碳中和。 绿色甲醇可用已有的液体基础设施,满足内燃机车、绿色甲醇混动增程车及氢燃料电池车三代汽车的使用,实现交通的绿色化。与此同时,该技术还可应用于各类分布式用能领域,且使用过程中,可为所处环境提供供暖及制冷服务。推动碳中和是全社会共同的事业,需要社会体系进行创新与变革,同时更需要政产学研良性互动,共同推动碳中和目标的实现。 本工作尝试提出一条支持低碳社会发展的绿色甲醇路径,利用中国最丰富的两大资源(即西部的沙漠戈壁带来的几乎无限的风光资源与中国丰富的劣质煤资源)结合制取绿色甲醇,同时用劣质煤分离出的矿物质微粒改良板结的土地、盐碱地及沙土地,既解决中国石油不够的问题又能保障粮食安全。同时绿电与绿色甲醇混合动力,解决纯电动的几大痛点。甲醇因其高能量密度而被广泛认为是一种适宜的能量载体。中国的风光资源既煤炭资源主要在西北;通过将中国西部的间歇性可再生能源及劣质煤转化为绿色甲醇,可以有效地将可再生能量以液体形式储存起来,并实现长期保存。结合中国本身西高东低的地理特征,西部生产的甲醇可以通过管线低成本高效运输到东部及沿海城市。这有可能是一种大规模的、符合中国国情的绿色液体取代石油的解决方案。 南方科技大学刘科院士领导的清洁能源和土壤改良研究团队,近几年积极倡导绿色甲醇新技术路线:我国减碳的关键在于改变能源结构,将风能和太阳能以液体形式存储的绿色甲醇将成为最合理的能源解决方案之一;有了具有市场竞争力的绿色甲醇,汽车内燃机就机会成为绿色能源动力,实现低碳排放;更重要的是,如果大面积运用以绿色甲醇作为原料的能源系统(煤化工及生物碳源耦合绿氢绿氧),可实现如今煤炭经济不到1/5的碳排放量,解决中国的电力、交通和供暖供冷等问题;可开创性地从煤中低成本分离出巨量的天然远古矿物质,制成土壤改良剂后用于板结土地、盐碱地及沙土地治理,通过促进植物生长的方式将燃煤排放的二氧化碳重新存储回来,实现生态系统碳排放[25, 26, 27]。我们团队一直倡导:太阳能、风能耦合劣质煤制甲醇虽然不是100%绿色,但是理论上也能减碳75%左右(含土壤碳汇之后,减碳幅度更大能达到~82%),剩下这18%的碳是人类生存必须的碳,也就是让放出去的碳与吸收回来的碳产生平衡;CO2排放不能太多,但没有CO2,人类也无法生存;因人类呼吸的氧气,吃的食品及所有的绿色植物都要靠CO2的光合作用产生;因此,用经济可行的技术路径,比使用石油/煤炭减碳>~82%的低碳甲醇生产技术,是适合中国国情的绿色燃料,建议国家制定适合中国国情的绿色甲醇标准[28, 29]。欧盟如果愿意从中国进口由生物质及绿电制的减碳近100%的绿色甲醇,只要欧盟愿意出高价,我们很高兴给欧盟出口赚取外汇,但其成本是我们提出的减碳近~82%绿色甲醇的两倍以上。我们认为用绿电和少量劣质煤结合制取的绿色甲醇所排放的少量的CO2是人类生存必须的CO2,我们自己要有清晰的科学认知,不要被欧洲发达国家一批极端的不顾成本地去追求零碳的环保极端主义而误导。如果我们把今天的煤炭、石油经济转为我们提出的绿色甲醇经济,全生命周期可减碳约~82%,剩余的~18%的CO2排放是人类生命活动必须的CO2,生命就是碳的循环,追求零碳是错误的。未来的能源体系就是绿色电网与绿色管网的有机结合;适合用电的场景就用电,适合用绿色液体的用绿色液体;不要用一个去反对另一个。 5 政策建议 (1)布局适合中国国情的绿色甲醇路径,抢占碳中和先机 中国劣质煤资源储量丰富,而且整体利用效率较低。通过煤炭清洁高效利用新技术(如微矿分离技术)对劣质煤进行预处理,获得清洁固体燃料来制备优质水煤浆,用于现有煤气化工厂进行气化,并耦合绿电产生的绿氢及绿氧,省去传统工艺中高能耗高碳排的空分装置及水煤气变化装置;微矿分离过程副产的矿物质,可制成微矿有机肥、微矿复合肥及土壤改良剂去治理板结土地、沙土地及盐碱地,让更多的贫瘠土壤恢复耕种能力。综合下来,只要氢和氧是由绿电产生,碳源即使由劣质煤提供,该工艺生产的甲醇对比传统煤制甲醇工艺也能减碳约82%,而剩余18%的碳排放是人类生存所必须的碳(大气层维持稳定温度、植物光合作用等),因此通过劣质煤微矿分离结合气化工艺并耦合绿电制氢制氧系统所制得的甲醇也应当被认定为绿色甲醇(整体工艺碳排放只有传统煤制甲醇过程的18%)。而欧洲倡导的生物质气化或用绿氢还原CO2制绿色甲醇工艺,其最新标准要求每生产1MJ热值的甲醇整个工艺CO2排放不能超过28.2克,该路径在技术上是可行的,但目前经济代价太高;从碳中和的需求而言,我们没必要去一步到位追求这样高成本的绿色甲醇。而以劣质煤微矿分离耦合绿电制氢制氧所制备绿色甲醇路径,每生产1MJ的甲醇其CO2排放可以控制在约40克,尽管比欧洲的绿色甲醇标准要求碳排放高一些, 但整套工艺甲醇生产成本只有欧洲绿色甲醇的一半不到;此外,通过微矿分离技术副产的矿物质去改良酸化的土地、盐碱地及沙土地,进一步提高土壤种植率及农作物产量,生长更多的植株来吸收CO2,恢复土壤碳汇。综上所述,根据我国资源禀赋,以劣质煤为原料通过微矿分离技术耦合现有绿电制氢制氧系统,制备绿色甲醇的技术路径,具备更加良好的经济可行性,同时基于全生命周期计算,再加上土壤碳汇和植被碳汇,每生产1MJ的甲醇其CO2排放将低于40g,是目前从技术层面与经济效益层面都最为符合中国国情的绿色甲醇制备路径。 碳中和是一个循序渐进的过程,应在技术合理且经济可行的情况下科学地去追求碳中和,而不是盲目过急地去追求零碳。中国的绿色甲醇标准也不应该完全照搬欧盟模式,而是要根据中国国情制定科学合理且经济可行的绿色甲醇标准,助力碳中和同时也应该在经济发展上更具竞争力。建议利用上述甲醇路径打造适合中国国情的绿色甲醇标准体系,按照先立后破原则,逐步实现碳中和目标。 (2)推进绿色甲醇全产业链经济转型,替代高碳排放石油资源 在可预见的未来,可以大规模推广以绿色甲醇为资源的能源系统,并与广泛的可再生能源技术相结合,包括发电、储能及输电。中国有广袤的戈壁沙漠,及海岸线,有巨大的风光资源;优质煤主要分布在鄂尔多斯,榆林的能源金三角一带,但劣质煤全国到处都有,而且储量巨大。绿色甲醇路径可把中国最便宜的两大资源绿电及劣质煤充分利用起来,即可生产大量的绿色甲醇缓解我国石油不够导致的能源安全问题,又可把由劣质煤副产的矿物质作为土壤改良剂去改善酸化的土地,盐碱地及沙土地,为粮食安全提供保障,同时让更多的国土再绿起来,助力碳中和。 碳中和时代的能源是智能的绿色电网与绿色甲醇管网的有机结合,可以逐步将当前的煤炭/石油经济转变为以可再生能源为主导的绿色电力和甲醇经济。绿色甲醇具有满足中国交通、电力和供热系统能源需求和挑战的潜力,是经济可行又可实现碳中和的合理路径,可有效缓解我国目前所面临的能源供给及粮食安全问题。。 (3)探索能源资源开发新模式,共绘“山清水秀”蓝图 以内蒙古为例,其风能储量居全国首位,技术可开发量约占中国陆地风能一半,太阳能储量仅次于西藏,位居全国第二,其风能、太阳能资源技术可开发量都属于全国最丰富的区域之一。内蒙古煤炭资源探明储量7323亿吨,居全国第一位,远景储量1万亿吨,占全国远景储量的四分之一。但是,内蒙古横跨三北地区,是我国荒漠化和沙化土地最集中、危害最严重的省区之一,也是全国防沙治沙的主战场,荒漠化主要指各种自然或人为因素造成的干旱、半干旱和亚湿润干旱地区的土地退化;沙化主要指因气候变化和人类活动所导致的天然沙漠扩张和沙质土壤上植被破坏、沙土裸露的过程;二者有一定交集。内蒙古全区荒漠化土地面积8.89亿亩、沙化土地面积5.97亿亩,分别占全国的23.03%和23.59%。盐碱化土地面积4740万亩,盐碱化耕地1500余万亩,占全区总耕地面积的11.4%。 以新疆为例,其具有突出的“风光”资源优势,风能资源总储量约占全国的20%,位居全国第二位。太阳能资源丰富,年太阳辐射总量均值5800兆焦/平方米。新疆煤炭资源非常丰富,预测储量约为2.19万亿吨,占全国总储量的40%以上。但是,新疆盐碱地面积占全国盐碱地的1/3,其中具有改良价值的轻中度盐碱地达1.16亿亩,是我国盐碱土地分布最广、面积最大的省区,也是世界上盐碱地分布比较集中的地区。新疆是我国荒漠化、沙化土地面积最大的省区,其荒漠化土地106.86万平方公里(约16.0亿亩),占新疆国土面积的64.18%、占全国荒漠化土地的41.52%;沙化土地面积74.68万平方公里(约11.2亿亩),涉及90%的县(市、区),占新疆国土面积的44.86%、全国沙化土地的44.25%。 构建能源资源开发新模式势在必行。能上网绿电优先上网,直接上网是最便宜高效的能源使用路径;但随着风光资源基础设施的大规模建设,产生的电力可能无法全部上网。为此上不了网的电和周围的劣质煤结合制成绿色甲醇用管路输到东部,因此绿色甲醇是把太阳能风能大规模长时储存的能源载体。内蒙古和新疆位于中国第二阶梯,借助东西部的海拔差,液体可借势能低成本输送到东部,基于西气东输的管线已经建成,在已建成的西气东输管道上安装甲醇输运管路相对容易,且管线输送液体线损少,同时输送的甲醇能量密度高(常温常压下天然气的能量密度是10kWh/m3,甲醇是4300kWh/m3),而且甲醇的凝固点为零下94.8℃,可保证一年四季以液体形式通过管道稳定运输。进而实现中国西部非稳定的风光资源在国家能源中的占比大大提高,实现“风光”资源与煤炭资源的全生命周期高价值化利用过程,同时实现沙化土地和盐碱地面积的大规模 “双缩减”,共绘“山清水秀”蓝图,助力碳中和的实现。 (4)尽早布局电动车废旧电池回收体系的建设,加强电池回收技术的研发 目前中国的电动车电池保质期是8年左右,很快每年就面临一大批退役的电动车电池的回收问题。欧洲的电池法,一方面想限制中国的电动车出口欧洲;另外一方面,说明回收体系的建设及回收的环保成本目前还太高,利润不大。如果回收效益好,我们出口等于把锂,钴,镍等贵金属运到欧洲,一回收,就是钱,他们何乐而不为? 电动车的安全不仅仅要解决电池着火的问题,同时要注意电池的环境安全。有报道称电池拆解工厂的工人,癌症等患病率较高,这方面也需系统的研究。笔者参观过一些电池回收厂,工人的工作环境的确不是太好。其实从全生命周期的角度看,在电池生产过程的研发就要开始考虑未来电池的回收问题,从全生命周期的角度去评价电池的生产技术路径。电动车要可持续大力在全世界推广,要早点开始布局电池回收体系的建设,及电池回收技术的研发。否则,若干年后,每年几百甚至几千万个废旧电池如果分散在世界各地,如回收问题解决不好,旧电动车在露天任其风吹雨淋,就会污染土地,污染地下水,那是环境的灾难;因此笔者呼吁要尽早布局电池回收的体系建设,加强回收技术研发, 从全生命周期考察各种排放的角度去整体考虑电池的生产及回收体系一体化的建设方案。 致谢 笔者感谢南方科技大学翁力、曹道帆、王欣、胡顺轩及江锋浩等团队成员。感谢国家发改委、国家自然学科基金委、广东省科技厅、山东省科技厅、贵州省科技厅、深圳市发改委与科创委、深圳燃气集团、吉利控股集团、浙江绿色智行科创有限公司、贵州绿色产业技术研究院等给予的支持。 参考文献 [1] Li J, Wu C, Cao D, Hu S, Weng L, Liu K. Green methanol—an important pathway to realize carbon neutrality. Engineering 2023;29(10):27-31. [2] Pei W, Chen Y, Sheng K, Deng W, Du Y, Qi Z, et al. Temporal-spatial analysis and improvement measures of Chinese power system for wind power curtailment problem. Renew Sustain Energy Rev 2015;49:148–68. [3] Benato A, Stoppato A. Pumped thermal electricity storage: a technology overview. Therm Sci Eng Prog 2018;6:301–15. [4] Chen H, Cong TN, Yang W, Tan C, Li Y, Ding Y. Progress in electrical energy storage system: a critical review. Prog Nat Sci 2009;19(3):291–312. [5] Wang Y, Kowal J, Leuthold M, Sauer DU. Storage system of renewable energy generated hydrogen for chemical industry. Energy Procedia 2012;29:657–67. [6] Liu C, Li F, Ma LP, Cheng HM. Advanced materials for energy storage. Adv Mater 2010;22(8):E28–62. [7] Zhu Z, Jiang T, Ali M, Meng Y, Jin Y, Cui Y, et al. Rechargeable batteries for grid scale energy storage. Chem Rev 2022;122(22):16610–751. [8] 国际可再生能源署(IRENA). 创新展望:可再生甲醇. 2021. [9] Consoli C. Bioenergy and carbon capture and storage, 2019 perspective. Global CCS Institute. 2021. [10] Shih CF, Zhang T, Li J, Bai C. Powering the future with liquid sunshine. Joule 2018;2(10):1925–49. [11] 李灿. 用“液态阳光”减碳. 全国能源信息平台, 2022-03-09 [12] 胡志远. 绿色甲醇制备及其在内燃机上的应用. 内燃机 2022;6:7–10. [13] 渠沛然. “绿色甲醇+甲醇汽车”助力零碳运力. 中国能源报, 2023年2月27日. [14] Kötter E, Schneider L, Sehnke F, Ohnmeiss K, Schröer R. The future electric power system: impact of power-to-gas by interacting with other renewable energy components. J Energy Storage 2016;5:113–9. [15] Colbertaldo P, Agustin SB, Campanari S, Brouwer J. Impact of hydrogen energy storage on California electric power system: towards 100% renewable electricity. Int J Hydrogen Energy 2019;44(19):9558–76. [16] Reed TB, Lerner RM. Methanol: a versatile fuel for immediate use: methanol can be made from gas, coal, or wood. it is stored and used in existing equipment. Science 1973;182(4119):1299–304. [17] Biedermann P, Grube T, Höhlein B. Methanol as an energy carrier. Report. Jülich: Forschungszentrum Jülich GmbH; 2006. [18] Seifritz W. Methanol as the energy vector of a new climate-neutral energy system. Int J Hydrogen Energy 1989;14(10):717–26. [19] Räuchle K, Plass L, Wernicke HJ, Bertau M. Methanol for renewable energy storage and utilization. Energy Technol 2016;4(1):193–200. [20] Sun Z, Aziz M. Comparative thermodynamic and techno-economic assessment of green methanol production from biomass through direct chemical looping processes. J Clean Prod 2021;321:129023. [21] Hakandai C, Sidik Pramono H, Aziz M. Conversion of municipal solid waste to hydrogen and its storage to methanol. Sustain Energy Technol Assess 2022;51:101968. [22] 吴昌宁, 翁力, 李俊国, 贾昊霖, 王欣, 陈加利等. 微矿分离:煤炭清洁化与土壤改良的新契机. 科学通报 2021;66(25):3352–3364. [23] Wu Z, Zhu P, Yao J, Kurko S, Ren J, Tan P, et al. Methanol to power through high-efficiency hybrid fuel cell system: thermodynamic, thermo-economic, and techno-economic (3T) analyses in Northwest China. Energ Conver Manage 2021;232:113899. [24] Wang Y, Chen H, Qiao S, Pan P, Xu G, Dong Y, et al. A novel methanol-electricity cogeneration system based on the integration of water electrolysis and plasma waste gasification. Energy 2023;267:126490. [25] 刘科, 吴昌宁. 中国新能源汽车发展战略之再思考. 凤凰财经, 2018年9月4日. [26] 刘科. 绿色甲醇是最合理的能源解决方案. 第十九届《财经》年会,2021年11月28日. [27] 刘科, 吴昌宁, 曹道帆, 李俊国. 碳中和关键问题与颠覆性技术: 第13章 碳中和误区与实现路径. 清华大学出版社, 2023年3月. [28] 韩逸飞. 绿色甲醇混合动力方案可解决电动车里程焦虑. 21 世纪经济报道, 2023年9月29日. [29] 刘科. 我认为绿色甲醇车大有前途. 中国石油和化工产业观察 2023;3:41–42.
周鸿祎600元起拍价的迈巴赫,为什么能拍出天价?
撰文 | 小不董 编辑 | 李信马 在北京车展上以车模形象火了好几天的360创始人、董事长兼CEO周鸿祎,以后可能是要在热搜上当常驻嘉宾了。 图片来源:微博 4月27日,周鸿祎发布直播预告,拍卖迈巴赫600,起拍价格600元,引起热烈讨论。周鸿祎在视频中强调了三点: 1.甭管你怎么看这次卖车,搞流量也好,行为艺术也好,买车确实不是为了把车卖掉,而是为了给国产新能源智能网联车打气加油充电。我认为国产新能源智能网联车将远超国外品牌豪车,会成为消费者和企业家的优先选择; 2.我自己不留一分钱,不论拍出多少钱,扣掉税费后,都以我和买车人的名义共同全额捐赠给王选基金会; 3.既然老有人问我迈巴赫600是不是600就能卖?那么起拍价就定600元。 4月28日,以“卖掉迈巴赫,拥抱国产新能源”为主题的周鸿祎卖车拍卖会在北京三六零总部举行,并于18:00在抖音直播。在三六零大厦现场,几乎半个车圈都赶来助阵,小米、哪吒、理想、小鹏等车企均在列,俨然一个小型车展。 图片来源:微博 在直播现场,周鸿祎感谢了国产新能源车的大佬:“大家给了我很多支持。大家不停给我推荐各自的产品,网上说我是像挑妃子一样乱挑车,但这不准确。对于车厂来说,自己的孩子永远是最俊的。”周鸿祎尤其提到了雷军:“我深表佩服,这给车圈很大启发,在新的时代,如何用新的传播方式进行互动。” 而现场的竞拍者汇聚了北京、天津、郑州、佛山、上海、徐州、银川等多地二手车商,网友调侃:感觉全国的二手车商都来了。经过多轮竞拍,周鸿祎一锤定音,这辆迈巴赫最终以990万元成交,相当于起拍价的16500倍! 但这辆迈巴赫600实际上已经开了9年,据懂车帝二手车介绍,这款迈巴赫S600新车原指导价为288.8万元。周鸿祎的这辆二手车是2015年款,目前市场评估价为90万元左右。 连周鸿祎都直呼:“我都懵了,不到100万元的市场价,我内心期望能翻两倍三倍差不多了。” 懂车帝对这辆迈巴赫进行了全面的检查,发现一个座椅磨损的很严重,而另一个跟新的一样,周鸿祎解释:“这说明我的另一个座位没坐过别人,说明周总很孤独。” 孤独的周鸿祎表示,本来准备拿这个钱去买新车的,后来觉得这个钱拿着烫手,最终决定捐赠给公益组织。之所以选择王选基金会,是因为时间很紧的情况下,太多的基金会来不及联系,正好自己前几天在北大讲课,老一辈人为我们的数字化生活作出了很大贡献,他们的名字不应该被遗忘。(2006年6月,九三学社中央根据原全国政协副主席、九三学社中央副主席、两院院士王选先生的遗愿,在王选先生生前捐款的基础上筹备成立了北京九三王选关怀基金会,是直属于九三学社中央管理的非营利性机构。) 此外,根据事先的约定,买下这辆车的车主在未来三年内,每年都会有一次与周鸿祎面对面吃饭交流的机会。这听起来有点股神巴菲特的午餐那味儿了,不过巴菲特的慈善拍卖活动从2000年开始,距今已经有24个年头了,周鸿祎的第一顿还没开始吃,谁又能说得准明年又会不会卖什么呢? 得到这次与周鸿祎交流吃饭机会的是北京天安二手车褚会长,据悉,褚会长原名禇振亮,为天安二手车创始人,现任北京汽车流通行业协会的常务会长。而天安二手车成立于2002年,是行业内的百强企业之一。此次拍下迈巴赫,既是对其实力的体现,也为自家企业打了一次广告。 褚会长 图片来源:抖音 总之,拍卖会可以说是皆大欢喜。 最近几个月,不止是周鸿祎,商业大佬们频频亮相在公众视野中。另一位“当红炸子鸡”雷军“三年磨一车”,预告了三个月后的小米SU7掀起汽车圈前所未有的流量风暴,4月18日,雷军在抖音开启一场不带货的直播,硬控两个小时,随后许多车企老总都亲自下场直播间,奇瑞董事长尹同跃还表示“逼着我60多老汉来直播”。 大佬纷纷下场,主要是因为当下的行业竞争越来越激烈,流量成为企业开拓市场的重要法宝,而短视频和直播又给了大佬们获取流量的新机会。以往,企业和消费者几乎不可能直接接触,中间有企业公关和媒体做桥梁,而现在,技术的发展让企业家们可以更容易地成为流量的中心,在这方面,国外的马斯克可以说是受益颇多的典型案例了。 在国内企业家中,周鸿祎无疑是会玩流量的,从1月5日风马牛年终秀圆桌论坛上跟程前的互怼,到随后找董宇辉学网红经济,再到开公开课、跟刘德华进行访谈说如果刘德华去当网红的前途不可限量...... 周鸿祎想做网红,并且在努力打造个人IP,直至在汽车圈撬动了巨大的流量杠杆,甚至成为了北京车展最亮眼的车模。 至4月30日,周鸿祎抖音账号拥有602.8万粉丝,微博拥有1151.8万粉丝。 图片来源:抖音 在直播或短视频中,观众看到的不只是大佬个人,也是他们身后的企业。就像周鸿祎所说,企业家做短视频和直播,学会和公众对话,这已经成为一个趋势,但是一个不可避免的问题就是,你的粉丝和观众越多,就有更多的人用放大镜来看待你的言行。但他也提到:“心理学上有一个词叫自证陷阱,彪悍的人生不需要证明,只需要做好自己就好了。” 在企业家们纷纷涌向前台,追求流量变现的同时,如何塑造良好的个人形象和企业形象,是值得大佬们研究的问题。
AI芯片的一块重要拼图
因为大模型的火爆,对算力的的渴求持续攀升。过去两年,让我们知道了英伟达H100芯片的影响力。与之相伴随的,高带宽内存(HBM)、CoWos封装等相关的技术也让大家有所耳闻。殊不知,互联的作用不亚于这些技术。互联技术也是AI芯片中很重要的一块拼图。 AI芯片之间互联一直是个难题,随着近年来越来越多的加速器被集成到一起,如何高效传输数据成为了瓶颈。当需要连接成千上万个加速器时,性能损耗和带宽瓶颈就会显现出来。这正在持续倒逼互联的迭代加速。 可以说,当前,我们正处于重大互联技术转型的风口浪尖。 超越 PCIe:AI 芯片厂商自研互联技术 由于PCIe技术的发展速度跟不上时代需求,目前主流的AI芯片厂商都已经自研了互联技术,其中较为代表的就是英伟达的NVLink和AMD的Infinity Fabric。 英伟达的NVLink 自2014年开始,英伟达在其GPU中引入了NVLink互联技术。NVLink 是由 Nvidia 开发的一种高带宽、低延迟的点对点数据传输通道。它的主要用途是连接 Nvidia GPU,或者 GPU 与 CPU 之间的通信,允许它们以高速率共享数据。这对于那些要求高数据吞吐量和低通信延迟的应用至关重要,如深度学习、科学计算和大规模模拟。过去十年间,NVLink已成为英伟达GPU芯片的核心技术及其生态系统的重要组成部分。 让我们再来细细回顾下NVLink这一技术的发展历程。2014年,NVLink 1.0发布并在P100 GPU芯片之间实现,两个GPU之间有四个NVLink,每个链路由八个通道组成,每个通道的速度为20Gb/s,系2统整体双向带宽为160GB/s(20*8*4*2)/8=160GB/s),是PCle3x16的五倍; 2017年英伟达推出了第二代NVLink,两个V100 GPU芯片之间通过六个NVLink 2.0连接,每个链路也是由八个通道组成,不过每个通道的速度提升至为25Gb/s,从而实现300GB/s的双向系统带宽(25*8*6*2)/8=300GB/s),几乎是NVLink1.0的两倍。此外,为了实现八个GPU之间的完全互连,Nvidia引入了NVSwitch技术。NVSwitch1.0有18个端口,每个端口的带宽为50GB/s,总带宽为900GB/s。每个NVSwitch保留两个用于连接CPU的端口。通过使用6个NVSwitch,可以在8个GPUV100芯片之间建立一个全连接的网络。 2020年,推出NVLink 3.0技术。它通过12个NVLink连接连接两个GPU A100芯片,每个链路由四个通道组成。每个通道以50Gb/s的速度运行,从而产生600GB/s的双向系统带宽,是NVLink2.0的两倍。随着NVLink数量的增加,NVSwitch上的端口数量也增加到36个,每个端口的运行速度为50GB/s。 DGX A100系统由8个GPU A100芯片和4个NVSwitch组成 2022年,NVLink技术升级到第四代,允许两个GPU H100芯片通过18条NVLink链路互连。每个链路由2个通道组成,每个通道支持100Gb/s(PAM4)的速度,从而使双向总带宽增加到900GB/s。NVSwitch也升级到了第三代,每个NVSwitch支持64个端口,每个端口的运行速度为 50GB/s。 2024年,随着英伟达全新Blackwell架构的发布,NVLink 5.0也随之而来。NVLink 5.0以每秒100 GB的速度在处理器之间移动数据。每个 GPU 有 18 个 NVLink 连接,Blackwell GPU 将为其他 GPU 或 Hopper CPU 提供每秒 1.8 TB 的总带宽,这是 NVLink 4.0 带宽的两倍,是行业标准 PCIe Gen5 总线带宽的 14 倍。NVSwitch升级到了第四代,每个NVSwitch支持144个NVLink 端口,无阻塞交换容量为 14.4TB/s。 NVLink设计之初,就是为了解决传统的PCI Express (PCIe) 总线在处理高性能计算任务时带宽不足的问题。从下面两幅图的对比中,可以发现,从单通道速度的角度来看,NVLink的速度通常是同代PCle的两倍左右。总带宽的优势更加明显,NVLink提供的总带宽约为PCle的五倍。 各代NVLink的性能参数 各代PCIe的参数(图源:naddod) 除了NVLink,另外一个值得一提的互联技术是InfiniBand。英伟达收购的Mellanox在InfiniBand领域也处于佼佼者。自收购Mellanox以来,NVIDIA也开始将NVLink技术与InfiniBand(IB)技术相结合,推出新一代NVSwitch芯片和具有SHARP功能的交换机,针对外部GPU服务器网络进行了优化。 InfiniBand是一种开放标准的网络互连技术,具有高带宽、低延迟、高可靠性的特点。该技术由 IBTA(InfiniBand 贸易联盟)定义。该技术广泛应用于超级计算机集群领域。同时,随着人工智能的兴起,它也是GPU服务器的首选网络互连技术。由于 RDMA(远程直接内存访问)等功能,InfiniBand 在人工智能等数据密集型任务中通常优于以太网。据Dell'Oro 估计,约90%的AI部署都是使用Nvidia/Mellanox的InfiniBand,而不是以太网。这些部署将 Nvidia 的网络收入推至每年100亿美元。 近日传奇CPU设计师兼Tenstorrent首席执行官 Jim Keller是开放标准的坚定支持者,他建议 Nvidia应该在基于 Blackwell 的GB200 GPU 中使用以太网协议芯片到芯片连接,而不是专有的NVLink,背后的主要原因是,这可能会使软件移植到其他硬件平台变得更加复杂。而凯勒认为,使用以太网协议可以为英伟达及其硬件用户节省大量资金。 AMD的Infinity Fabric 与英伟达的NVLink相似,AMD则推出了其Infinity Fabric技术,支持芯片间、芯片对芯片,以及即将推出的节点对节点的数据传输。Infinity Fabric是AMD在其“Zen”微架构中引入的一个关键特性,旨在提高整体系统性能,特别是在多核心处理器和数据中心环境中。 Infinity Fabric由两部分组成:数据布线(Data Fabric)和控制布线(Control Fabric)。数据布线用于处理器内部和处理器之间的数据传输,而控制布线则负责处理器的功耗、时钟和安全性等方面的管理。Infinity Fabric的主要特点包括:1)高效率:Infinity Fabric设计用于提供高效率的数据传输,支持多个设备之间的高速通信;2)模块化:Infinity Fabric支持AMD的小芯片(chiplet)架构,允许不同功能的芯片模块通过高速互连进行组合;3)内存共享:Infinity Fabric支持CPU和GPU之间的内存共享,有助于提高异构计算的效率;4)扩展性:Infinity Fabric的设计允许它随着技术进步和需求增长而扩展。 视频已经上传至公众号后台:epyc_infinity_architecture-alpha AMD最新的AI加速器Instinct MI300X 平台,就通过第四代AMD Infinity Fabric链路将 8 个完全连接的 MI300X GPU OAM 模块集成到行业标准 OCP 设计中,为低延迟 AI 处理提供高达 1.5TB HBM3 容量。第四代 Infinity Fabric支持每通道高达 32Gbps,每链路产生 128GB/s 的双向带宽。 不同于英伟达NVLink仅限于内部使用,AMD已经开始向新合作伙伴开放其 Infinity Fabric 生态系统。在去年年末AMD MI3000的发布会上,Broadcom宣布其下一代PCIe交换机将支持XGMI/Infinity Fabric。不仅如此,AMD还希望Arista、博通、Cisco等合作伙伴能推出适用于 Infinity Fabric 等产品的交换机,能够方便MI3000在单一系统外实现芯片间通信。这类似于英伟达的NVSwitch。 英特尔:以太网的坚实拥护者 英特尔的用于生成式AI的Gaudi AI芯片则一直沿用传统的以太网互联技术。Gaudi 2 每个芯片使用了24 个 100Gb以太网链路;Gaudi 3也使用了24 个 200 Gbps 以太网 RDMA NIC,但是他们将这些链路的带宽增加了一倍,达到 200Gb/秒,使芯片的外部以太网 I/O 总带宽达到 8.4TB/秒。 在近日的intel vision峰会上,英特尔还宣布正在开发一款用于超以太网联盟(UEC)兼容网络的 AI NIC ASIC 以及一款 AI NIC 小芯片,这些创新的AI高速互联技术(AI Fabrics)将用于其未来的 XPU 和 Gaudi 3 处理器。这些创新旨在革新可大规模纵向(scale-up)和横向(scale-out)扩展的AI高速互联技术。 一直以来,英特尔都希望通过采用纯以太网交换机来赢得那些不想投资 InfiniBand 等专有/替代互连技术的客户。InfiniBand非常适合那些运行少量非常大的工作负载(例如 GPT3 或数字孪生)的用户。但在更加动态的超大规模和云环境中,以太网通常是首选。Nvidia 最新的 Quantum InfiniBand 交换机的最高速度为 51.2 Tb/s,端口为 400 Gb/s。相比之下,以太网交换在近两年前就达到了 51.2 Tb/s,并可支持 800 Gb/s 的端口速度。 虽然InfiniBand在很多情况下表现都不错,但它也有缺点,比如只能在特定范围内使用,而且成本也不低,将整个网络升级到 InfiniBand 需要大量投资。相比之下,以太网因为兼容性强,成本适中,以及能够胜任大多数工作负载,所以在网络技术领域里一直很受欢迎,建立了一个庞大的“以太网生态”。 Dell'Oro 预计 InfiniBand将在可预见的未来保持其在 AI 交换领域的领先地位,但该集团预测在云和超大规模数据中心运营商的推动下,以太网将取得大幅增长,到2027 年大约将占据20%的市场份额。 不仅是英特尔,在2023年的AI Day上,AMD也表示将重点支持以太网,特别是超级以太网联盟。虽然 Infinity Fabric提供了GPU之间的一致互连,但AMD正在推广以太网作为其首选的 GPU 到 GPU网络。 此外,英特尔还提出了一种开放性互联协议Compute Express Link(CXL)。关于CXL互联技术,业界看法不一。英伟达的GPU一向单打独斗,并不支持CXL;AMD透露其MI300A会支持CXL。目前来看,像三星、SK海力士、美光等存储厂商更加青睐于CXL。 AI互联的下一步:迈向光互联时代 诚然,这些互联技术都已是目前最好的互联技术,但是一个不争的事实是,随着计算数据的爆炸式增长、神经网络的复杂性不断增加,以及新的人工智能和图形工作负载和工作流程以及传统科学模拟的出现,对更高带宽的需求还在继续增长。这些互联技术将不可避免的存在性能瓶颈。例如Nvidia 的 NVLink 虽然速度很快,但是功耗也相当高;而 AMD的Infinity Fabric则适合于芯片内部的连接,对于芯片之间的互联效率并不理想。 是时候进行范式转变了。光互联凭借高带宽、低功耗等优势,几乎成为公认的未来 AI 互联技术的发展方向。Nvidia 数据中心产品首席平台架构师 Rob Ober 在媒体咨询中表示:“在过去的十年中,Nvidia 加速计算在人工智能方面实现了数百万倍的加速。” “下一个百万将需要光学I/O等新的先进技术来支持未来 AI 和 ML 工作负载和系统架构的带宽、功率和规模要求。” 在光互联之路上,谷歌的TPU芯片已经率先起了个好头儿。作为AI芯片的重要玩家,谷歌的TPU一直可圈可点。过去几年时间,谷歌一直在悄悄地检修其数据中心,它被称为“阿波罗任务”,主要是用光代替电子,并用光路交换机(OCS)取代传统的网络交换机。 自TPU v4开始,谷歌引入了其内部研发的创新的互联技术:光路交换机 (OCS)。TPU v4是第一台部署可重新配置 OCS 的超级计算机,它内部的4096个芯片通过OCS互连,能够提供百亿亿次的机器学习性能。OCS可以动态地重新配置其互连拓扑,以提高规模、可用性、利用率、模块化、部署、安全性、功耗和性能。 据谷歌声称,OCS比Infiniband更便宜、功耗更低且速度更快,OCS和底层光学组件的成本和功耗只占TPU v4系统的一小部分,不到5%。下图显示了 OCS 如何使用两个 MEM 阵列工作。无需光到电到光转换或耗电的网络数据包交换机,从而节省电力。谷歌表示,TPU 超级计算机的性能、可扩展性和可用性使其成为 LaMDA、MUM 和 PaLM 等大型语言模型的主力。Midjourney一直在使用 Cloud TPU v4 来训练他们最先进的模型。 到了TPU v5代,其每个Pod网络中包含8,960个芯片,这些芯片也是通过专有的OCS互连,并提供 4,800 Gbps 的吞吐量。与TPU v4相比,TPU v5p 的 FLOPS 提高了 2 倍以上,高带宽内存 (HBM) 提高了 3 倍,达到 95GB,TPU v4 Pod 具有 32GB HBM。 Broadcom、Marvell、思科等厂商则在光电共封交换机领域发力。其中博通和Marvell都已经推出了51.2Tbps的交换机。关于光电共封的更多知识,可以翻看《芯片巨头的“新”战场》一文。 博通表示,光学互连对于大规模生成式AI集群中的前端和后端网络都至关重要。如今,可插拔光收发器消耗大约50%的系统功耗,占传统交换机系统成本的50%以上。新一代GPU不断增长的带宽需求,加上AI集群规模的不断增大,需要颠覆性的节能且经济高效的光学互连,超越分立解决方案。 2024年3月14日,博通已向客户交付业界首款 51.2 Tbps共封装光学 (CPO) 以太网交换机Bailly。该产品集成了八个基于硅光子的6.4-Tbps光学引擎和 Broadcom 的 StrataXGS Tomahawk5交换芯片。与可插拔收发器解决方案相比,Bailly 使光学互连的运行功耗降低了 70%,并将硅片面积效率提高了 8 倍。 初创公司在硅光子互联领域大展身手 在硅光互联这个新技术领域,得益于技术创新和商业模式的灵活性,初创公司在硅光子互联领域取得了突破性进展,为这个市场带来了更多的活力。 Celestial AI是这一领域的一个重要参与者,其Photonic Fabric(光子交换机)技术可以将AI计算和内存解耦,旨在通过光传输的方式来连接不同的 AI 处理单元。这种技术已吸引了包括AMD Ventures在内的多个投资者。 Celestial的技术主要包括三大类:chiplets、interposers和一种基于英特尔 EMIB 或台积电 CoWoS的称为OMIB的光学解决方案。其中chiplet是最为核心的部件,可以作为额外的内存扩展卡,也可以作为一个芯片与芯片之间的高速互联通道,有点类似于光学版的 NVLink 或 Infinity Fabric。据该公司称,单个 chiplet 的尺寸略小于一个 HBM 存储器堆栈,可以提供高达 14.4 Tb/s 的光电互联速率,当然这不是上限,只是现有芯片架构能够处理的结果。具体而言,Celestial 的第一代技术每平方毫米可支持约 1.8 Tb/秒。第二代 Photonic 结构将从 56 Gb/秒提高到 112 Gb/秒 PAM4 SerDes,并将通道数量从 4 个增加到 8 个,从而有效地将带宽增加到四倍。 Celestial AI宣称,这种方案的内存事务能量开销约为每比特 6.2 皮焦,相比于 NVLink、NVSwitch大约62.5 皮焦的方案降低了 90% 以上,同时延迟也控制在了可接受的范围内。Celestial AI公司预计将在 2025 年下半年开始向客户提供光子交换机芯片样品,并预计在 2027年左右实现量产。 除了 Celestial AI 之外,还有其他几家创业公司也在研发光子互联技术。 Ayar Labs是一家得到英特尔投资支持的光子学初创公司,它已经将其光子互连集成到原型加速器中,实现了小规模量产和出货。Ayar Labs CEO在2024 OFC(光纤通信大会)上表示:“如果想最终改变计算行业,就需要实现电IO 到光学 IO的巨大的提升。”早在2022年,英伟达还与之合作开发光互联技术,与 Nvidia 的合作将侧重于集成 Ayar Labs 的 IP,为未来的 Nvidia 产品开发通过高带宽、低延迟和超低功耗基于光学的互连实现的横向扩展架构。 然后是 Lightmatter,该公司在12月份获得了1.55亿美元的C轮融资,估值高达12亿美元。Lightmatter 的技术被称为Passage,他们提供一个功能类似于OCS(光路交换机)的通信层,该层位于基本和ASIC之间,几乎可以实现全方位通信,这个通信层可以进行动态的配置。通过采用硅内置光学(或光子)互连的形式,使其硬件能够直接与 GPU 等硅芯片上的晶体管连接,这使得在芯片之间传输数据的带宽是普通带宽的 100 倍。该公司声称,Passage 将于2026年上市。 Lightmatter的Passage技术(图源:Lightmatter) Coherent在2024 OFC的上推出了一款支持高密度人工智能集群的光路交换机(OCS)。该设备预计明年批量发货,具有 300 个输入端口和 300 个输出端口。在 OCS 中,数据信号在传输交换机时保留在光域中;消除 OEO 转换可以显着节省成本和功耗。此外,与传统交换机不同的是,当下一代AI集群配备更高速的连接时,OCS不需要升级。对于数据中心来说,这显着提高了资本支出回报率。 成立于2020年Nubis Communications也是一个不容小觑的初创公司,该公司在2023年2月份发布其基于硅光芯片的1.6T光引擎XT1600,单通道速率为112Gbps, 功耗达到4.9pJ/bit,带宽密度达到250Gbps/mm。XT1600通过新颖的2D光纤阵列和高度集成的高速硅光子学实现。Nubis的突破基于重新思考光学设计,大幅降低光学DSP所需的性能和功耗,甚至完全消除它。据其称,与传统光学解决方案相比,人工智能加速器或类似的大型 ASIC可以在数据中心内实现全带宽连接,而功耗仅为传统光学解决方案的一小部分。XT1600光学引擎的样品现已提供给客户。而且这种光互连非常适合新兴的盒式架构以及本地chiplet实施,以便在未来实现更紧密的集成。 国内在这一领域,曦智科技发力于光子计算和光子网络两大产品线。2023年,曦智科技发布了首个计算光互连产品Photowave、以及首款片上光网络(oNOC)AI处理器OptiHummingbird。Photowave通过光学器件实现CXL 2.0/PCIe Gen 5的连接,可配置x16、x8、x4、x2等不同通道数,覆盖多种部署场景。 结语 总体来看,在众多厂商的参与下,互联技术将会迎来重大的发展。尤其是围绕光电共封装和硅光子中继层技术的光互连,正在成为AI领域热门赛道。 行业分析公司 LightCounting 首席执行官 Vlad Kozlov 证实:“800G 及以上的数据中心光学器件将继续强劲增长,到 2027 年,可插拔收发器、有源光缆和共封装光学器件的总价值将达到 84 亿美元。未来五年,将有大量全新的光学产品问世。"
新iPad下周就来,准备官宣AI的苹果,怎么卖不动iPhone了?
今年以来,全球手机市场迎来了新的机遇和挑战—— AI 如何与设备更好地结合? 苹果很多技术应用都不是最先发布的,甚至在大部分厂商都大举跟进 AI 功能时,它们才初步确定了「合作」的 AI 上机方案。 处在时代岔路口的苹果,刚刚公布了2024 年第二季度财报。 总体来看,它们的日子并不好过: 苹果第二财季营收 907.5 亿美元,市场预期 900 亿美元,上年同期 948 亿美元; 第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 iPhone 哑火,尖子生越考越差 财报公布前,市场普遍不看好苹果的营收销量表现,并认为在 2024 财年第二财季的营收和利润,都将同比和环比下滑。 其中 iPhone 销量的持续回落,是当中最大的原因。 苹果第二季度财报显示,本季度 iPhone 营收为 459.6 亿美元,与之前市场预期的 457.6 亿美元基本吻合。 iPhone 一直都是苹果总营收的中流砥柱,财报好看与否,与 iPhone 卖的好不好直接挂钩。 事实上,今年以来 iPhone 的销量并不乐观,此前,根据 Counterpoint 的数据,本季度 iPhone 销量下滑 19%。 图片来自:Counterpoint 这与市场的大趋势形成了十分鲜明的对比,特别是在国内。 2024 年第一季度,中国智能手机销量同比增长 1.5%,环比增长 4.6%,连续第二个季度同比正增长。 国内市场手机销量持续火热,和 2023 年同期相比,苹果失去了引以为豪的「首席」市占率,从 2023 年的 19.7%,下降到了今年的 15.7%,排名第三。 一方面,vivo、荣耀、小米等国内手机厂商不断迭代优化产品,陆续推出大底相机、AI 大模型助手、终端互联等新功能,赢得了消费者的青睐。 另一方面,华为依靠 Mate 60 Pro 的爆火,正慢慢恢复市场地位,并且用守护了四年的品牌力,逐步在高端市场恢复了与苹果硬碰硬的资质。 在如此「卷」的国内市场环境下,苹果的当家产品、占苹果总收入六成的 iPhone,在第二财季销售额同比下降 10.9%(至 457.5 亿美元)。 去年同期,iPhone 销售额曾意外增长 1.5% 至 513.3 亿美元,甚至还打破史上第二财季的手机营收纪录。 而上一季度,iPhone 在中国大陆的销量还实现了增长。 2024 财年第一季度苹果营收为 1196 亿美元,同比增长2%,手机销售额从上一财年同期的 658 亿美元增至 697 亿美元。 然而今非昔比,缓慢的更新、持续的同质化、比国内慢了大半拍的 AI 步伐,就连苹果本身的品牌号召力,也难以维持之前在国内市场的傲人战绩。 财报显示,第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 今年三月,上海静安寺对面,被围了七八年的下沉广场,终于迎来了 Apple Store 静安寺店的真面目。 这里是上海市区中心的黄金区域,这家苹果商店也是苹果在中国最大的新店,更是仅次于纽约第五大道店的世界第二大苹果旗舰店。 库克本人也在开业当天来到了现场,一同参加揭幕仪式。 静安寺店占地面积约 3835 平方米,是亚洲面积最大的苹果店,虽然苹果没有公布造价成本,但有消息称这家新店花费了 8340 万元进行改造,折算下来每平方米超过 2 万元。 对苹果来说,国内市场有着无法取代、无法撼动的重要地位。 尽管市场低估了苹果在国内的销量,但总体收入的下降,一定是它们不想看到的局面。 由于我之前提到的 50 亿美元的影响,我们面临着与去年相比的艰难比较。 库克也在随后的电话会议中,直面了苹果目前的处境。 今年一开年,苹果先被微软夺取了全球市值的手把交椅,更是在 Q1 交出了仅有 5540 万部的 iPhone 出货量,同比下降 9.6%,环比大降 36%。 事实证明,「挤牙膏」式的更新早已过时,市场和消费者都在变聪明,也在购买新机时更理性,苹果急需一剂扭转局面的「强心剂」。 苹果的配件,成了市场的配角 库克在财报电话会中称: 中国是全球最具竞争力的市场。在中国的业务除了 iPhone 之外,还有需要努力的方面。 努力的方面,包含了 Mac 和 iPad 系列产品。 得益于今年刚刚更新了 M3 芯片,MacBook 的季度收入为 75 亿美元,同比增长 4%。 虽然我们并没有在 Mac 上看见库克所说的「AI 领域最好的消费级笔记本电脑」,不过依靠其本身优秀的产品力——流畅的 MacOS 操作系统,一众专业且操作简单、功能丰富的软件生态——MacBook Air 还是取得了一定的增长。 而另一边的 iPad,则面临着非常大的挑战。 电话会议中提到,iPad 在 3 月份季度的收入为 56 亿美元,同比下降了 17%。 当中最核心的原因是,过去的一整年,很多期待 iPad 的朋友都没有等来该产品的迭代,去年关于 iPad 最大的更新,就只有一支 Apple Pencil USB-C,还有 eSIM 版本的 iPad 10,可以说几乎没有任何变化。 而 iPad Pro 的上一次更新,还是在 2022 年 10 月份,包含了 11 英寸和 12.9 英寸两种规格。 库克并过分担心 iPad,并且保持乐观态度,因为过两天,iPad 即将迎来设计整个产品线的升级。 根据此前彭博社的报道,此次产品更新,将会包括: 搭载 M3 芯片的 OLED iPad Pro 搭载 M2 芯片的 iPad Air 全新妙控键盘 第三代 Apple Pencil 我们在之前,也对 iPad 2024 的更新事宜做了比较详细的统计汇总,从已经爆出的细节看,此次升级很可能会给 iPad 的市场表现带来积极的改变。 在配件方面,由于苹果所称「推出困难」等原因,该系列产品收入为 79 亿同比下降了 10%。 AirPods 的推出计划也延续了缓慢的节奏,这也是造成销量和营收低迷的主要原因,在版本和功能迎来大更新之前,现在的苹果耳机够用也挺好用,因此也就没有了换新的必要。 不过根据此前 Mark Gurman 报道,新型号的 AirPods 或许会很快推出,将取代第二代和第三代 AirPods,并具有两个版本:「入门」和「中端」。 两者都将采用新的设计、改进的佩戴贴合性以及 USB-C 的充电仓。中端版本将配备主动降噪功能,和充电仓的「Find My」扬声器功能。 据报道,苹果的供应商正在为 AirPods 发布做准备,计划 5 月开始量产,将生产 2000 万至 2500 万只耳机,比以往新型号的生产要更多。 新款 AirPods 预计 9 月或 10 月发布。 另一边的 Apple Watch 实际上也不好过。 苹果在电话会议中给予了很高的评价,它们称购买第一代 Apple Ultra 的用户,有近 2/3 在本季度购买了新的苹果手表: 「苹果手表的安装基数达到了历史新高,最近在美国的服务客户满意度达到了 95%。我们的活跃设备安装基数继续以不错的速度增长。」 但是受到与 Masimo 公司血氧专利纠纷的影响,Apple Watch 全系列的销量在未来都还是个未知数。 AI,最后的押注 简言之,2024 年的苹果「压力山大」。 在产品端,尽管 MacBook 依靠性能卓越的 M3 芯片有了一定程度上的回暖,但大体看来,整体销量下滑、营收受挫已是既定的事实。 在财报上,虽说多项营收都超过了市场预期,看起来是被低估的实力派,实际上以苹果以往的实力和对公司的要求,当下的战绩还不能让它们自己满意。 图片来自:Google 即使通过服务收入创下了 239 亿美元的历史季度记录,但 iPhone 收入与去年同期相比下降了超过 50 亿美元。 在政策里,和欧盟持续多年的抗争,无疑给是苹果的艰难时期「雪上加霜」,「DMA 守门人」名单的列出,不仅使得苹果要在欧盟地区被迫打开封闭了多年的 App Store 生态,也让它们和 Spotify 在音乐流媒体服务市场中的诉讼案中,被重罚了 18.4 亿欧元(约合人民币 143.7 亿元)。 在规划里,Vision Pro 只是一个美好的愿景,起码目前,这款打开「空间计算」大门的未来产品,还不足以扭转苹果困局。 走到十字路口的库克和苹果,也在今天表明了态度: 我们会抓住生成式 AI 领域的发展机遇。我们正在进行重大投资,并期待很快与我们的客户分享一些非常令人兴奋的事情。 库克预计下周预告新的人工智能功能,并于 6 月的全球开发者大会上公布。 前些时候,苹果通过取消进行了十年的「泰坦计划」,来表明深耕 AI 的决心。 尽管苹果在生成式 AI 领域的布局相对较晚,但它们一直在积极收购人工智能公司并构建自家的大型语言模型。 而且,苹果也在今早表示将回购额外 1100 亿美元股票,这是美股历史上最大规模回购。 但是,以目前 AI 在手机和 PC 端的实际体验,还不足以达到影响消费者下定决策的程度,简言之,用户对 AI 的感知并没有预期中的强烈。 的确,许多手机品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重,但各家大模型的可用性只能算达到及格线。 这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。 因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。 哪怕是宣称「独立主义」的各种 AI 工具和穿戴设备,也只是满足了小部分场景的试验,实话讲还只是起步阶段,并不成熟。 在 AI 对用户使用的体验没有产生显著提升前,我们还需要谨慎看待打着 AI 旗号的产品宣传。 更何况,AI 并不是万能药,「遇事不决,All in AI」的策略已经没那么奏效了,想要提高销量,获得市场认可,给出令人信服的硬件配置、提供流畅顺滑的软件系统、定一个合理且可以接受的产品售价,才是王道。 下个月,苹果将会迎来 2024 全球开发者大会,这次 AI 会以怎样的方式出现?库克还有哪些 one more thing 的大招?都将是本届 WWDC 重点关注的对象。 对于苹果来说,此次开发者大会的战略布局,不仅关乎着手机销量、财报表现,更会决定它们在下个时代的话语权。
iPhone 销售额下跌 10%,苹果下周除了发新 iPad 还将官宣新 AI 功能
今年以来,全球手机市场迎来了新的机遇和挑战—— AI 如何与设备更好地结合? 苹果很多技术应用都不是最先发布的,甚至在大部分厂商都大举跟进 AI 功能时,它们才初步确定了「合作」的 AI 上机方案。 处在纠结时代岔路口的苹果,刚刚公布了 2024 年第二季度财报。 总体来看,它们的日子并不好过: 苹果第二财季营收 907.5 亿美元,市场预期 900 亿美元,上年同期 948 亿美元; 第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 iPhone 哑火,尖子生越考越差 财报公布前,市场普遍不看好苹果的营收销量表现,并认为在 2024 财年第二财季的营收和利润,都将同比和环比下滑。 其中 iPhone 销量的持续回落,是当中最大的原因。 苹果第二季度财报显示,本季度 iPhone 营收为 459.6 亿美元,与之前市场预期的 457.6 亿美元基本吻合。 iPhone 一直都是苹果总营收的中流砥柱,财报好看与否,与 iPhone 卖的好不好直接挂钩。 事实上,今年以来 iPhone 的销量并不乐观,此前,根据 Counterpoint 的数据,本季度 iPhone 销量下滑 19%。 ▲ 图片来自:Counterpoint 这与市场的大趋势形成了十分鲜明的对比,特别是在国内。 2024 年第一季度,中国智能手机销量同比增长 1.5%,环比增长 4.6%,连续第二个季度同比正增长。 国内市场手机销量持续火热,和 2023 年同期相比,苹果失去了引以为豪的「首席」市占率,从 2023 年的 19.7%,下降到了今年的 15.7%,排名第三。 一方面,vivo、荣耀、小米等国内手机厂商不断迭代优化产品,陆续推出大底相机、AI 大模型助手、终端互联等新功能,赢得了消费者的青睐。 另一方面,华为依靠 Mate 60 Pro 的爆火,正慢慢恢复市场地位,并且用守护了四年的品牌力,逐步在高端市场恢复了与苹果硬碰硬的资质。 在如此「卷」的国内市场环境下,苹果的当家产品、占苹果总收入六成的 iPhone,在第二财季销售额同比下降 10.9%(至 457.5 亿美元)。 去年同期,iPhone 销售额曾意外增长 1.5% 至 513.3 亿 美元,甚至还打破史上第二财季的手机营收纪录。 而上一季度,iPhone 在中国大陆的销量还实现了增长。 2024 财年第一季度苹果营收为 1196 亿美元,同比增长 2%,手机销售额从上一财年同期的 658 亿美元增至 697 亿美元。 然而今非昔比,缓慢的更新、持续的同质化、比国内慢了大半拍的 AI 步伐,就连苹果本身的品牌号召力,也难以维持之前在国内市场的傲人战绩。 财报显示,第二财季大中华区收入 163.7 亿美元,同比下降 8.1%,市场预期为 158.7 亿美元。 今年三月,上海静安寺对面,被围了七八年的下沉广场,终于迎来了 Apple Store 静安寺店的真面目。 这里是上海市区中心的黄金区域,这家苹果商店也是苹果在中国最大的新店,更是仅次于纽约第五大道店的世界第二大苹果旗舰店。 库克本人也在开业当天来到了现场,一同参加揭幕仪式。 静安寺店占地面积约 3835 平方米,是亚洲面积最大的苹果店,虽然苹果没有公布造价成本,但有消息称这家新店花费了 8340 万元进行改造,折算下来每平方米超过 2 万元。 对苹果来说,国内市场有着无法取代、无法撼动的重要地位。 尽管市场低估了苹果在国内的销量,但总体收入的下降,一定是它们不想看到的局面。 由于我之前提到的 50 亿美元的影响,我们面临着与去年相比的艰难比较。 库克也在随后的电话会议中,直面了苹果目前的处境。 今年一开年,苹果先被微软夺取了全球市值的手把交椅,更是在 Q1 交出了仅有 5540 万部的 iPhone 出货量,同比下降 9.6%,环比大降 36%。 事实证明,「挤牙膏」式的更新早已过时,市场和消费者都在变聪明,也在购买新机时更理性,苹果急需一剂扭转局面的「强心剂」。 苹果的配件,成了市场的配角 库克在财报电话会中称: 中国是全球最具竞争力的市场。在中国的业务除了 iPhone 之外,还有需要努力的方面。 努力的方面,包含了 Mac 和 iPad 系列产品。 得益于今年刚刚更新了 M3 芯片,MacBook 的季度收入为 75 亿美元,同比增长 4%。 虽然我们并没有在 Mac 上看见库克所说的「AI 领域最好的消费级笔记本电脑」,不过依靠其本身优秀的产品力——流畅的 MacOS 操作系统,一众专业且操作简单、功能丰富的软件生态——MacBook Air 还是取得了一定的增长。 而另一边的 iPad,则面临着非常大的挑战。 电话会议中提到,iPad 在 3 月份季度的收入为 56 亿美元,同比下降了 17%。 当中最核心的原因是,过去的一整年,很多期待 iPad 的朋友都没有等来该产品的迭代,去年关于 iPad 最大的更新,就只有一支 Apple Pencil USB-C,还有 eSIM 版本的 iPad 10,可以说几乎没有任何变化。 而 iPad Pro 的上一次更新,还是在 2022 年 10 月份,包含了 11 英寸和 12.9 英寸两种规格。 库克并不担心 iPad,并且保持乐观态度,因为过两天,iPad 即将迎来设计整个产品线的升级。 根据此前彭博社的报道,此次产品更新,将会包括: 搭载 M3 芯片的 OLED iPad Pro 搭载 M2 芯片的 iPad Air 全新妙控键盘 第三代 Apple Pencil 我们在之前,也对 iPad 2024 的更新事宜做了比较详细的统计汇总,从已经爆出的细节看,此次升级很可能会给 iPad 的市场表现带来积极的改变。 在配件方面,由于苹果所称「推出困难」等原因,该系列产品收入为 79 亿同比下降了 10%。 AirPods 的推出计划也延续了缓慢的节奏,这也是造成销量和营收低迷的主要原因,在版本和功能迎来大更新之前,现在的苹果耳机够用也挺好用,因此也就没有了换新的必要。 不过根据此前 Mark Gurman 报道,新型号的 AirPods 或许会很快推出,将取代第二代和第三代 AirPods,并具有两个版本:「入门」和「中端」。 两者都将采用新的设计、改进的佩戴贴合性以及 USB-C 的充电仓。中端版本将配备主动降噪功能,和充电仓的「Find My」扬声器功能。 据报道,苹果的供应商正在为 AirPods 发布做准备,计划 5 月开始量产,将生产 2000 万至 2500 万只耳机,比以往新型号的生产要更多。 新款 AirPods 预计 9 月或 10 月发布。 另一边的 Apple Watch 实际上也不好过。 苹果在电话会议中给予了很高的评价,它们称购买第一代 Apple Ultra 的用户,有近 2/3 在本季度购买了新的苹果手表: 「苹果手表的安装基数达到了历史新高,最近在美国的服务客户满意度达到了 95%。我们的活跃设备安装基数继续以不错的速度增长。」 但是受到与 Masimo 公司血氧专利纠纷的影响,Apple Watch 全系列的销量在未来都还是个未知数。 AI,最后的押注 简言之,2024 年的苹果「压力山大」。 在产品端,尽管 MacBook 依靠性能卓越的 M3 芯片有了一定程度上的回暖,但大体看来,整体销量下滑、营收受挫已是既定的事实。 在财报上,虽说多项营收都超过了市场预期,看起来是被低估的实力派,实际上以苹果以往的实力和对公司的要求,当下的战绩还不能让它们自己满意。 ▲ 图片来自:Google 即使通过服务收入创下了 239 亿美元的历史季度记录,但 iPhone 收入与去年同期相比下降了超过 50 亿美元。 在政策里,和欧盟持续多年的抗争,无疑给是苹果的艰难时期「雪上加霜」,「DMA 守门人」名单的列出,不仅使得苹果要在欧盟地区被迫打开封闭了多年的 App Store 生态,也让它们和 Spotify 在音乐流媒体服务市场中的诉讼案中,被重罚了 18.4 亿欧元(约合人民币 143.7 亿元)。 在规划里,Vision Pro 只是一个美好的愿景,起码目前,这款打开「空间计算」大门的未来产品,还不足以扭转苹果困局。 走到十字路口的库克和苹果,也在今天表明了态度: 我们会抓住生成式 AI 领域的发展机遇。我们正在进行重大投资,并期待很快与我们的客户分享一些非常令人兴奋的事情。 库克预计下周预告新的人工智能功能,并于 6 月的全球开发者大会上公布。 前些时候,苹果通过取消进行了十年的「泰坦计划」,来表明深耕 AI 的决心。 尽管苹果在生成式 AI 领域的布局相对较晚,但它们一直在积极收购人工智能公司并构建自家的大型语言模型。 而且,苹果也在今早表示将回购额外 1100 亿美元股票,这是美股历史上最大规模回购。 但是,以目前 AI 在手机和 PC 端的实际体验,还不足以达到影响消费者下定决策的程度,简言之,用户对 AI 的感知并没有预期中的强烈。 的确,许多手机品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重,但各家大模型的可用性只能算达到及格线。 这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。 因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。 哪怕是宣称「独立主义」的各种 AI 工具和穿戴设备,也只是满足了小部分场景的试验,实话讲还只是起步阶段,并不成熟。 在 AI 对用户使用的体验没有产生显著提升前,我们还需要谨慎看待打着 AI 旗号的产品宣传。 更何况,AI 并不是万能药,「遇事不决,All in AI」的策略已经没那么奏效了,想要提高销量,获得市场认可,给出令人信服的硬件配置、提供流畅顺滑的软件系统、定一个合理且可以接受的产品售价,才是王道。 下个月,苹果将会迎来 2024 全球开发者大会,这次 AI 会以怎样的方式出现?库克还有哪些 one more thing 的大招?都将是本届 WWDC 重点关注的对象。 对于苹果来说,此次开发者大会的战略布局,不仅关乎着手机销量、财报表现,更会决定它们在下个时代的话语权。
Vision Pro价格跳水,苹果慌吗?
Vision Pro上市已经一段时间,虽然还没有在国内上市,但已经可以在多个平台购买。 然而,其价格已经从原本的天价降到和美国市场差不多了。 一些购物网站上vision pro价格已经和美国购买的价格持平 从原本以为的引爆xr市场,到现在市场的跳水,人们开始怀疑vision pro是否会成为苹果有一个失败的产品不过,最近一些苹果的动作似乎表明,苹果对vision pro有了新的商业规划。成本2万的设备,苹果不打算让个人消费者为此买单。 01 苹果To B的算盘 在Vision Pro推出的初期,一直被质疑的都是配套应用太少,即使设备性能优秀,但是对于个人消费者来说使用场景太少。有用户指出,“不是Vision Pro买不起,而是实在没有性价比。”正是因为一直没有杀手级的应用,让曾经溢价过万的风光变成了一周只能出台个位数的景象。据报道,苹果零售店内的 Vision Pro 试用预约已经出现大幅下滑,甚至预约体验的用户也经常爽约,一些门店的销量更是从日均几台暴跌到一周仅售出寥寥数台。 分析师郭明錤表示,苹果正在削减 2024 年 Vision Pro 的出货量,并重新考虑下一款型号的计划。据他表示苹果现在将今年 Vision Pro 的出货目标定为 40 万到 45 万台。这与最初市场预期的 70 到 80 万台相比有所下降。 在市场较为消极的反应中,苹果似乎想通过To B的生意来开辟新市场。事实上,苹果的开发人员一直在为众多企业类别的 Apple Vision Pro 构建应用程序,从业务生产力和产品设计,到沉浸式培训和指导工作。 2024年2月,Microsoft 365也为Vision Pro推出了应用程序,用户可以在Vision Pro上丝滑使用Microsoft Word、Excel、PowerPoint、Outlook、Loop、OneNote 和 iPad 版 Teams 来源: Microsoft 365 具体功能包括:创建和编辑文档、演示文稿和电子表格;共享、共同创作和实时协作;使用 Microsoft Copilot 创建、编辑和聊天;以及参加和主持会议或与朋友、家人和同事聊天。虽然不理解“沉浸式”办公的乐趣所在,但线上会议的功能正是许久之前大火的元宇宙概念的愿景。 同一时期,SAP Analytics Cloud也宣布登陆Apple Vision Pro应用商店。 来源: SAP 2024年3月,英伟达宣布登陆Vision Pro应用商店。英伟达将基于通用场景描述(OpenUSD)工业场景Omniverse企业数字孪生引入,开发人员可以将大量 3D 工程和模拟数据集从云端传输到 Vision Pro。英伟达模拟副总裁 Rev Lebaredian 表示:“Apple Vision Pro 是首款不受束缚的设备,让企业客户能够毫不妥协地实现他们的工作。” “我们期待我们的客户能够使用这些令人惊叹的工具。” 以上例子基本都展示了Vision Pro在To B领域的应用,相比之下保时捷与Vision Pro的合作似乎相对“休闲”。2024年3月库克与保时捷首席执行官奥利弗·布鲁姆“连麦”展示了Vision Pro为新款Taycan电动汽车提供的座舱应用程序。但这款应用程序显然不是给驾驶员驾驶用的,而是允许使用者以第一人称视角查看赛道圈速,相关数据统计和3D赛道地图等等。从展示的画面上来看,这款程序更像是沉浸式的赛车观赛程序。 但消费者期待的并不是被办公软件包围。曾几何时,Vision Pro被赋予改变娱乐体验的XR设备,认为苹果将终于开启XR落地时刻。但上市至今依旧没有可以引爆Vision Pro销量的杀手级软件问世。 02 问君何时能娱乐? 虽然有着大量的办公软件,但用户对Vision Pro的最大期待依旧是娱乐。 一位Vision Pro用户指出他当前使用Vision Pro最多的场景就是娱乐。有用户表示Vision Pro是他用过的最佳视频观看设备,在通过Vision Pro观看Disney+上的《Echo》和Apple TV+上的《Dickinson》时,他体验到了极强的沉浸感。这两个应用程序的影院模式已经可以接近真实的影院了。即使与65英寸的电视屏幕相比,在保真度和沉浸感上,Vision Pro的表现都更加优秀。 然而对于生产力,用户认为虽然虚拟显示器的表现令人印象深刻,但使用Vision Pro打字却相当困难。Vision Pro的感应器虽然能捕捉用户眼球运动,但对于打字来说其实很模糊。对于用户来说,在手机和电脑上使用浏览器与邮件还是更加方便。 对于普通消费者来说,Vision Pro的售价依旧较高,即使是相对便宜的Quest 3的价格也不低,大概为3646元。 人们想要创新;他们想要下一代 iPhone。传统观点认为创新在于硬件——这是合理的。然而,那些比大多数人更书呆子的人肯定会认为软件可以说是任何技术产品最重要的方面。 XR设备在消费市场的普及一直面临诸多挑战。此前,为推广元宇宙概念,Facebook更名为Meta,但效果并不显著。最近,Meta作出了重要决策,采取众志成城的策略,向第三方制造商开放其Meta Horizon OS。此举被外界视为可能重塑VR、AR和元宇宙市场格局的关键举措。若成功构建庞大的开发者生态,Meta有望继PC时代的微软和移动开发时代的Google之后,成为VR和元宇宙时代的领导者,打造VR领域的“Android”操作系统。 据官方公告,Meta Horizon OS是Meta公司十年努力打造下一代计算平台的成果。开放此系统意味着更多人将从中受益。经过十年的研发,Horizon OS融入了Meta众多自研技术,包括内向外跟踪和自跟踪控制器等。内向外跟踪技术能精确捕捉用户的手部和手指动作,实现更自然的操作和互动。而自跟踪控制器则允许设备自动跟踪用户的手部或其他身体部位,为用户提供更智能、更灵活的界面控制。 为实现更自然的交互系统,Meta还研发了手部、眼部、面部和身体追踪技术。在混合现实技术方面,Meta开发了一整套融合数字和物理世界的技术,包括高分辨率穿透、场景理解和空间锚点等。随着Horizon OS的开放,已有数家科技公司采用此操作系统。据Meta官方公告,华硕的Republic of Gamers将利用Horizon OS开发高性能头戴设备游戏。联想则凭借其在Oculus Rift S和ThinkPad笔记本电脑系列等方面的丰富经验,开发用于生产力、学习和娱乐的混合现实设备。 去年,Xbox与Meta合作将Xbox云游戏(测试版)引入Meta Quest,为用户提供在混合现实大型2D虚拟屏幕上玩Xbox游戏的新体验。如今,两家公司再次携手,以Xbox为灵感打造限量版Meta Quest。此举有望进一步推动XR设备在消费市场的普及和发展。 03 消费市场:大厂跌倒、小厂吃饱 虽然大公司的星辰大海迟迟没有征服,但一些更亲民的产品在消费市场已经牛刀小试。 由于Xreal和Rokid等公司推出的价格更低的AR眼镜产品,AR市场在2024年也有望增长,这些耳机往往充当显示器的替代品,同时能够提升生产力或改善媒体消费体验。 4月22日,Rokid正式推出了其全新产品——AR Lite空间计算套装。该套装包含一款轻便的显示终端Rokid Max2眼镜,重量仅为75克,以及一款集成传感、计算和电池模块的Rokid Station 2主机,可以单手握持与操作。 据现场展示,Rokid AR Lite具备多样化的功能,如移动轻办公、沉浸式大屏游戏、观影体验以及电脑手机快速投屏等。在交互方式上,Rokid AR Lite进行了创新升级,取消了原有的正面物理按键,新增了多指多手势触控功能,使用户能够无缝衔接在手机、平板上的交互模式,Rokid方面并未透露AR Lite的具体售价信息。根据行业人士的普遍猜测,其售价可能在3000元以内。这一价格区间使得Rokid AR Lite在市场中具有一定的竞争力。 这些XR设备能够实现亲民价格,主要归因于它们所采用的技术与苹果有所不同。XR设备的透视功能主要基于两种技术路径。一种是VST(Video See Through,视频透视),该技术通过摄像头等传感器捕捉真实世界的影像,并将其投射在屏幕上,为用户带来更加沉浸式的体验。例如,苹果的Vision Pro以及Meta的Quest等VR设备就采用了这种技术。另一种则是OST(Optical See Through,光学透视),该技术通过摄像头定位和芯片计算与真实世界进行交互,以真实世界为主导,常见于AR设备中。这也是Rokid、Xreal、雷鸟创新、INMO等国内AR眼镜头部厂商所选择的技术路线。 VST和OST各有其优势与不足。由于VST需要构建沉浸式和数字化的物理世界,这导致设备体积难以实现轻量化,这也是Vision Pro、Quest等产品价格高昂的原因之一。相比之下,OST无需进行物理世界的重建,因此具有轻便、舒适的优势,但难以实现深度沉浸。苹果之所以选择VST,是因为这种技术能够充分发挥其在芯片、操作系统、供应链整合以及产品议价能力上的优势。显然对于消费市场来说,OST无疑是当前更为合适的选择。 消费电子产品的普及离不开游戏和社交两大场景,而实现社交场景的碎片化是至关重要的。当AR眼镜能够具备便捷的碎片化功能时,它有望在短期内实现多个场景的爆发式增长。然而,这一过程的前提是光学、电池、算力和通信等关键材料必须经历技术变革。这一过程可能需要3到5年的时间来完成。当然价格低并不意味着无法进入to B领域。许多AR厂商将企业端作为技术与市场的重要试验场。 04 XR行业的iPhone时刻 XR行业的发展阶段与2007年的智能手机行业相似,众多公司均在探索新一代产品的方向,而这个行业需要一个具有划时代意义的产品。而苹果的Vision Pro有可能成为这样的产品。 无论答案如何,至少这款产品带动了整个行业。Rokid创始人兼CEO祝铭明在接受采访时表示,Vision Pro发布后,Rokid的销量和开发者都迎来了数倍增长。 根据CINNO Research所公布的数据,2023年国内消费级AR设备销量总计22.7万台,同比实现了显著增长,尽管销量有所上升,但从整体出货量来看,AR眼镜尚未全面进入大众市场。不过Rokid预测2024年AR Lite的出货量有望达到30万至50万台,这一数字已相当于一款智能旗舰手机的年度销售量。若这一预测得以实现,无疑标志着AR眼镜在市场上的普及程度迈出了重要一步。相对于Vision Pro,AR眼镜更像是一个屏幕,从价格和生态两个角度而言,都更有优势。或许对于苹果来说,性价比从来不是它所追求的,但生态问题,应该成为它眼前的第一任务。 XR行业正逐渐迎来类似于智能手机行业的革命性时刻,VIsion Pro面对的是从单纯的设备创新转变为应用创新,进而融入更多场景。 苹果创造了手机行业的iPhone时刻,又能否创造XR行业的iPhone时刻?
潞晨科技尤洋:如何用低成本做出类Sora?成功复现有四个要素,时空分割是关键一步|GenAICon2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,新加坡国立大学校长青年教授、潞晨科技创始人兼董事长尤洋以《技术共享:类Sora开源架构模型与训练细节》为题发表演讲。 潞晨科技在今年3月开源的全球首个类Sora视频生成模型Open-Sora,是迄今GitHub上获得星标数最高的开源视频大模型项目之一,截至发稿前已有1.6万个星标,用户群体遍及全球。 值得一提的是,这个模型在低成本下训练而成,相比Sora耗费数千张H100 GPU、花费数千万美元乃至数亿美元,Open-Sora的训练成本仅不到1万美元。 尤洋认为,视频生成正处于“GPT-2时刻”,还没有出现成熟的应用。对于视频生成模型来说,数据可能是最核心的资产。他还谈到,模型开源是有意义且重要的。正如Meta最新发布的Llama 3,极大地调动了开源社区的积极性,不但造福大量开发者,更有助于开源社区整体的繁荣。 因此,Open-Sora模型也进行了全面的训练流程开源,开源了包括模型架构、模型权重、训练细节、数据处理在内的多项技术细节,让更多的开发者可以尝试Open-Sora模型,共同迭代与升级。 在演讲期间,他详细解读了成功复现类Sora视频生成模型的四个关键要素,并分享了Open-Sora的底层架构、demo和教程。 在他看来,考虑到成本压力,视频生成模型将分为大规模图像预训练、大规模视频预训练、高质量视频数据微调三个阶段。在模型设计上,时空分割处理将是显著降低视频生成模型计算成本和内存压力的关键一步。他还提到,Open-Sora未来的发展方向主要在于完善数据处理流程以及训练视频压缩Encoder。 以下为尤洋的演讲实录: 我演讲的主题是最近做的Open-Sora,希望帮助更多中小企业以及研究人员去快速地复现类似Sora这样的视频生成模型。 首先简要介绍一下我的技术背景。这张照片拍摄自我博士毕业答辩时,图中的人物包括我在加州大学伯克利分校的几位教授,他们的专业背景主要集中在高性能计算(HPC)和计算机视觉(CV)领域。HPC的目标是提高模型训练的效率,即用成百上千的处理器卡来加快训练速度。CV则是视频生成模型的关键技术之一,这与我的个人技术背景非常相似。 目前,我们了解到大模型对计算能力的需求非常高,特别是在今天的Infra专场中,我们可以预见,未来对算力要求最高的模型可能会是视频生成模型。 今天我的分享旨在抛砖引玉,我认为视频生成模型目前还处于一个相对早期的发展阶段,其情形有点类似于视频领域的GPT-2时期。市场上尚未出现一个完全成熟且广泛可用的视频生成应用。因此,我将分享我们在这一领域的一些初步探索成果,并希望这能激发大家的兴趣,进而深入探讨。 本次演讲将分为几个部分。首先,我会简单介绍Open-Sora模型,以及与之相关的OpenAI Sora。需要明确的是,尽管我们称之为Open-Sora,也确实采用了类似于OpenAI技术报告中类似的技术,但它实际上是一个不同的模型。然后我将介绍Open-Sora的技术要点、性能表现,以及我们对未来发展的规划。 一、未来人人都能成为导演,视频生成有颠覆教育和技术传播的潜力 大家都看过Sora的Demo视频,其效果确实令人震撼。未来,我们可能会进入一个每个人都能成为导演的时代,每个人都能够迅速生成自己想要的视频或故事,并且通过视频这种形式进行学习,这很可能比传统的文字学习效率要高得多。 如果我们需要了解某个问题,能否让AI为我们生成一段视频,以便快速掌握相关知识呢?我认为视频生成技术有潜力颠覆教育和技术传播领域。 在Sora模型之前,市场上已经存在一些视频生成工具,例如Pika、RunwayML、Stable Video等。然而,Sora在视频长度上实现了显著的突破,超越了之前所有顶尖产品,因此其效果还是非常惊艳的。Sora的应用前景非常可观,可以涵盖游戏、艺术、媒体创作、药物研发、市场营销和教育等多个领域。甚至在未来,许多物理模拟领域也可能采用视频生成模型。 尽管如此,视频生成技术目前尚未广泛普及。我们希望能大幅降低制作电影或视频的成本。以今天的标准,制作一部优秀的电影可能需要高达五千万美元的投资,这显然限制了普通人参与的可能性。但如果未来有了先进的视频生成模型,我们只需向AI描述我们的想法,它就能为我们生成一部高质量的动画片或电影。 只有达到这样的水平,视频生成模型的真正价值才能得到最大化的体现。 二、介绍首个类Sora开源视频生成模型,成功复现Sora有四个关键要素 在介绍了Sora及其影响力后,第二部分介绍一下Open-Sora。 Open-Sora是一个开源的视频生成模型项目,我们的目标是将模型的重要部分都公之于众,以便社区能进一步发展这一技术。 要成功复现视频生成模型,主要包括几个部分。 首先,需要了解模型的架构,比如我到底用的是Diffusion、Llama、GPT还是BERT,不同的架构决定我模型基本的骨架。 其次,一旦模型训练完成,分享训练得到的权重也是非常重要的。这意味着其他人可以直接拿来用,而不需要从头开始训练模型。例如Meta刚刚开放了Llama 3,尽管4000亿参数版本还没有完全训练完成,但已经可以从中看到很好的效果。通过分享这些权重,社区可以快速地将模型部署到各种应用中。 通过这种开放的方式,我们希望能够促进视频生成技术的创新和普及,让更多有兴趣的研究者和开发者能够参与进来,共同推动这一领域的发展。 第三点非常关键,它涉及到开源模型的透明度和可控性。 虽然现有的一些开源模型,如Llama 1和Llama 2,已经公开了模型参数和使用方式,但它们并没有公开训练过程的具体细节,包括超参数的设置。这导致了我们无法完全复现其预训练过程,也就是说,模型的预训练并不是百分百自主可控的。 我们认为,如果未来的视频生成大模型能够实现百分之百的自主可控,那么将能更有效地激发和调动整个行业的生产力。 此外,数据处理也是决定模型性能的一个关键因素。 通过审视OpenAI的技术报告,我们可以发现,尽管在模型架构和算法方面,OpenAI并没有特别强调其创新性,沿用了如Video Diffusion等现有模型,但OpenAI在数据方面做得非常出色。高质量的数据是决定视频生成效果的直接因素,因此,数据处理方式和数据集的质量极为关键。 三、解读STDiT架构核心思想,将成本控制在1万美元 我将展示一些我们的demo和教程,这将涵盖开源模型的几个重要组成部分。 从技术角度来看,Open-Sora模型采用了STDiT架构。我们选择STDiT的主要原因是考虑到成本效益。我们的目标是将Open-Sora的成本控制在1万美金或者更少。 STDiT架构的核心思想在于它包含时间维度的Self Attention和空间维度的Self Attention,这两个方面是分开处理的,而不是合并计算,这样的设计可以显著降低模型的训练和推理成本。相比于DiT模型,STDiT在成本上有着显著的优势,而且在相同的硬件条件下,其吞吐量也更高,这对于提升模型效率来说是非常有利的。 在架构方面,我们的创新点并不是特别多,核心思想仍然与DiT的架构相似。具体来说,处理视频的流程是这样的:首先,我们获取一个视频,然后通过Encoder将其压缩到Latent Space中,这样视频就可以在这个空间中进行交互和处理。这种方法实际上与文本到图像生成的技术非常相似。 我们对文生图的概念并不陌生。我们首先对视频进行压缩,目的是为了将其转换到潜在空间中。压缩有两个主要目的:首先,原始视频文件可能非常大,直接处理它们成本太高;其次,我们的目标是生成特定的视频内容,比如一只狗在雪地里追雪球的场景。如果我们不进行压缩,而是直接在原始视频上操作,可能会生成不符合要求的内容,比如生成了一只老虎或一只猫,即使视频质量再高,如果内容不是我们想要的,那么这样的结果显然是不可接受的。 通过这种方式,我们可以更有效地控制视频生成的过程,确保生成的视频内容符合我们的预期和需求。这种方法不仅降低了处理成本,而且提高了生成视频的准确性和相关性。 在潜在空间中,我们需要融入人类的指令,这些指令通常通过自然语言处理来实现。然而,自然语言数据类型并不能直接与视频信息进行交互。因此,潜在空间的第二个关键作用是将自然语言也转换到这个空间中。这样潜在空间就包含了视觉信息和文本信息,使得这两类信息能够在该空间内进行交互。这是我们压缩视频并将其转换到潜在空间的两个主要目的。 完成这一过程后,我们的工作流程与文本到图像生成技术非常相似。文本到视频生成本质上是文本到图像生成的一种扩展,因为视频可以被视为一系列图片的集合。在这种情况下,我们仍然需要借鉴许多文本到图像生成的技术。 具体到实现方式,与扩散模型的做法非常相似,我们通过引入高斯噪声来生成所需的视频。首先,在潜在空间中随机采样一个高斯噪声,然后将这个噪声与人类的指令一起输入模型,模型据此生成视频。最后,我们将生成的视频从潜在空间解码回原始的三维空间,完成整个生成过程。 四、视频生成模型三阶段:图像预训练,视频预训练,高质量视频数据微调 至于如何实现这一技术,考虑到成本的压力,我们可以将其分为三个阶段进行。 尽管今天介绍的技术在未来十年或二十年可能会被新的技术所取代,但在当前算力有限的情况下,我们可能需要采取分阶段的方法来训练高质量的视频模型。直接使用高质量视频数据训练视频模型的成本可能高达数千万甚至数亿美元,这显然限制了大多数人参与的可能性。 在成本受限的现实条件下,我们的策略是,首先找到一个不错的文本到图像生成模型,这类模型目前比较容易获取,市场上也有很多选择,当然我们也可以自己训练一个。 第二阶段,有了文生图模型,再给它大量视频做初始训练,让它对视频世界有很好的理解。 第三阶段,用高质量、精挑的视频提升它的视频质量。这种思想在大模型领域已经用了七八年,早在2018年、我们训练BERT的时候,BERT训练也是分两个阶段,第一阶段sequence是128,第二阶段的sequence是512。短序列上让它对自然语言有基本的理解,再在长序列上微调,给它一个更好的生成效果,这些其实都是出于成本的压力才这样操作的。 理论上我们有无限算力的话,我们应该直接拿最好的数据让它去训练。包括Llama、GPT,它们训练时也都参考了类似的思路,先在短序列上大规模训练,之后再在长序列或者更好的数据上去做微调,提升最终的模型生成质量。 具体而言,我们可以看一下三个阶段究竟是怎么操作的。 第一个阶段还比较简单,现在有很多文生图的模型,即便不自己训练,也可能找一些不错的文生图模型,它其实就是我的基准,我从起点开始去构造我的整个方案。我们改造Stable Diffusion,可以快速把这件事完成。 第二阶段,现在有了基本对三维世界的理解,文生图本质上还是对自然语言指令信息转到三维世界,有一个基本的能力之后,现在我希望它每秒钟能生成很多图,每秒钟生成60张图就是一个视频了。这种情况下,再进一步给它很多视频数据让它训练。 我们的创新点有两部分,用了STDiT,有时间信息和空间信息,我们新加了时间上的Attention模块,因为本身已经有空间上的Attention模块。比如空间上就是S,时间上就是T,现在有一个S和T,S是已经训得差不多了,T刚刚开始。S相当于是一个初中生,T相当于是一个婴儿,但现在我们希望S和T都能达到大学生的水平。 有时我们会采用一种混合训练的方法,即将成熟度不同的模型一起训练。这种方法听起来可能有些冒险,因为S可能已经相当于一个初中生,而T可能还只是一个刚刚起步的婴儿。如果将它们放在一起训练,可能会担心它们无法跟上对方学习的节奏。 然而,现代的大型模型拥有庞大的参数量,这使得它们能够通过适当的调整迅速自适应不同的学习速度。在这种情况下,尽管S模型最初学习速度较慢,但T模型可以快速增长,最终两者都能迅速达到相同的水平,最终都能达到相当于大学生的能力水平。 即使我们没有自己的S模型,也可以利用一些现有的资源。当我们引入T模型后,通过适当的整合和调整,可以显著提升整体系统的性能。 这种策略体现了深度学习模型训练的灵活性和适应性,通过合理的设计和调整,即使是成熟度不同的模型也能够协同工作,最终实现性能的共同提升。 当我们拥有了视频生成模型之后,接下来的第三部分工作是使用更高质量的视频数据对模型进行精调。 这里的核心区别在于,第三部分生成的视频在质量上将显著优于第二部分。尽管第二部分的模型已经对三维视觉世界有了一定的理解,但其生成的视频质量仍有提升空间,这也正是我们进行第三阶段工作的原因。 在这一过程中,还有一个关键点值得注意,即我们在OpenAI的技术报告中发现,他们使用了多模态版本的GPT-4来进行视频描述,但这种方法的成本较高。为了降低成本,我们转而采用了开源的LLaVA 1.6模型来进行视频描述任务。LLaVA 1.6是基于E34B数据集训练的,如果大家对此感兴趣,可以进一步了解和探索。 通过使用LLaVA 1.6,我们能够在保持描述质量的同时,减少计算资源的消耗。这种方法不仅有助于提升最终视频产品的质量,也使得整个视频生成过程更加高效和经济,从而为更广泛的应用场景和用户群体提供了可能性。 五、如何将成本降到最低?时空分割是关键一步 介绍完整体的模型、算法、设计流程之后,接下来考虑如何把成本降到最低。 要想把成本控制在1万美金左右,显然我们不能用太多的GPU,我们可以简单地做一笔数学计算。现在H800一台月租8万-10万人民币,假设有8台H800,每月的租金就要80万,如果用20台,每月的租金大概需要200万。要想一次性试验成本控制在10万以下,只能用8台H800 64个H800GPU,就需要把速度、效率破到最高。 之前我们打造了Colossal-AI系统,从三个角度,高效的内存优化、N维并行系统、低延迟推理,通过Colossal-AI进一步实现2-4倍的加速。 训练过程中,一个关键因素是它们需要处理的序列长度通常非常长。无论是国内还是美国的大模型,研究者们都在努力扩展模型的序列长度,以期获得更高的预测精度。以GPT模型为例,其损失函数依赖于一个窗口的信息来预测下一个词的概率,窗口越大,即包含的信息越多,预测的准确性也就越高。 对于视频生成模型而言,即便是较短的视频,其序列长度,这里指的是帧数,即每秒钟包含的画面数量,也可能是巨大的。例如,即便是每秒24帧的视频,如果帧率提高到60,那么在数据训练中的长度可能达到150万tokens,这将导致计算和内存开销急剧增加。 因此,将时间信息和空间信息进行分割处理是非常关键的一步。通过时空分割,我们可以显著降低计算成本和内存压力。具体来说,这意味着我们不是同时计算时间信息和空间信息,而是分步骤进行,先处理时间维度,再处理空间维度,这样可以大幅提升处理效率。 通过这种方法,我们可以更高效地训练视频生成模型,同时控制计算资源的消耗,使得模型训练变得更加可行,即使是在资源有限的情况下。 经过我们的优化之后,训练策略提升了很大。从右图可以看出,即使在8个GPU上训练速度也提升了16%,尤其在Encoder部分,计算密集型任务也实现了显著加速。 六、低成本模型能生成20秒视频,Open-Sora已获得1.4万个GitHub星标 最后展示下我们的demo。我们的demo远差于OpenAI,主要有两个原因: 首先,我们的demo是在低成本条件下完成的,OpenAI使用了2000到4000个H100 GPU,花费了五千万美元到两亿美元,而我们仅用了不到1万美金进行试验。在如此有限的预算下,我们取得的效果是可接受的。 其次,我们没有使用大量的数据。通常数据质量越高,生成的视频质量越好。如果我们采用更好的数据集,我们目前的内部版本能够生成大约20秒的视频。这是一个在成本受限条件下的演示版本,感兴趣的朋友可以在我们GitHub页面上查看更多信息。 Open-Sora目前在视频大模型开源领域中是GitHub上获得星标数最高的项目之一。自从我们在3月3日开源以来,已经获得了1.6万个星标,用户群体遍布全球,包括中国、美国、欧洲、印度和东南亚。 我们的发展方向包括完善数据处理流程。我再次强调,对于视频生成模型来说,数据可能是最核心的资产。虽然算法大多是公开的,比如STDiT、DiT或Video Diffusion,大家使用的算法和模型结构相似,结果也不会有太大差异。但是,如果数据质量有显著差异,那么模型的质量也会有很大差别。因此数据处理流程非常关键。 此外,视频压缩和编码也非常重要,如何将视觉信息有效地转换到潜在空间,以及潜在空间是否能够准确表达视频内容的所有信息,这对于模型的推理和学习过程至关重要。 以上是尤洋演讲内容的完整整理。
阿里云李鹏:进一步压榨云上GPU资源,将大模型训推效率最大化丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,阿里云高级技术专家、阿里云异构计算AI推理团队负责人李鹏以《AI基础设施的演进与挑战》为题发表演讲。 李鹏谈道,大模型的发展给计算体系结构带来了功耗墙、内存墙和通讯墙等多重挑战。其中,大模型训练层面,用户在模型装载、模型并行、通信等环节面临各种现实问题;在大模型推理层面,用户在显存、带宽、量化上面临性能瓶颈。 对于如何进一步释放云上性能?阿里云弹性计算为云上客户提供了ECS GPU DeepGPU增强工具包,帮助用户在云上高效地构建AI训练和AI推理基础设施,从而提高算力利用效率。 目前,阿里云ECS DeepGPU已经帮助众多客户实现性能的大幅提升。其中,LLM微调训练场景下性能最高可提升80%,Stable Difussion推理场景下性能最高可提升60%。 以下为李鹏的演讲实录: 今天我分享的是关于AI基础设施的演进和挑战。我讲的内容分三个部分:第一部分是关于生成式AI对云基础设施的挑战;第二部分是如何进一步压榨云上GPU资源的性能,保证训练和推理的效率达到最大化;第三部分是生成式AI场景下训练和推理的客户案例和最佳实践。 一、算力需求规模10倍递增,带来三大计算结构挑战 关于生成式AI最近的发展和行业趋势,我们看到的情况是,2023年生成式AI爆发,文生视频、文生图、文生文等场景下有很多垂类大模型或通用大模型出来。我和公司的产品团队、架构师团队与客户进行了很多技术分享和交流。 我的感受是,现在很多云上客户逐渐在拥抱生成式AI场景,开始使用大模型,比较典型的行业是电子商务、影视、内容咨询、办公软件这几大部分。 大模型发展对AI算力的需求方面,左边这张图是前几天GTC大会上黄仁勋展示的关于模型发展对算力的需求曲线图。2018年开始,从Transformer模型到现在的GPT-MoE-1.8T,其对算力的需求呈现出10倍逐渐递增的规模性增长,可以看出训练的需求非常大。 另外,我们也做了一些估算,比如训练1750亿参数的GPT-3模型,训练的计算量大概在3640PFLOP * 天,相当于需要大概1024张A100跑1个月,达到了千卡规模。换算到成本上就是一笔巨大的计算开销。总体来看,因为当前的GPU算力价格还比较昂贵,所以推理或微调本身的成本,以及计算需求和推理部署成本也会比较高。 大模型发展给计算体系结构带来挑战。 首先就是功耗墙的问题。以NVIDIA的GPU举例,V100的功耗大概只有250W,A100功耗增加到400W,H100功耗达到750W,最新的B200功耗大概为1000W。可以看到,算力8年间增长1000倍,其计算功耗也会相应增加。最近有相关的讨论提到,AI的尽头是能源,计算需求的增大会带来更大的能源需求。 第二个体系结构挑战就是内存墙。所谓内存墙,就是数据在CPU和GPU之间做搬移或者交换,现在PCIe的体系结构已经成为数据交换和传输的瓶颈。目前,NVIDIA已经在Grace Hoper架构上推出了NVLink-C2C的方案,能够大幅提升整个数据传输的速率。 第三个是通讯墙。分布式训练的规模非常大,已经从去年的千卡规模达到了现在的万卡甚至十万卡的规模。分布式训练场景下如何增强机器之间的互连带宽有很大的挑战。从国内外厂商的进展来看,他们会在A100上采用800Gbps互连的带宽,在H100上采用3.2Tbps带宽。 总结下来,现在的趋势就是硬件堆砌,会有更大的显存、更高的显存带宽、更高的CPU和GPU之间的互连带宽,同时PCIe本身也会向下迭代。 以NVIDIA的GPU为例,可以看到从Ampere这一代架构到Blackwell架构的变化。算力计算规模会越来越高,从不到1P增长到1P以上;显存规格越来越高,从80GB增加到100多GB规模;显存带宽不断增加。这反映了未来AI计算上硬件规格的变化趋势。 二、大模型训练的现实难题:模型装载、并行、互连 第二部分是大模型训练对于云上技术的挑战。 大模型训练技术栈包含Transformer模型结构、海量数据级、梯度寻优算法,这三块构成了AI训练的软件和算法。硬件就是GPU计算卡,从单卡扩展到单机8卡的服务器,再扩展到千卡、万卡互连规模的更大服务器集群,构成整个大模型训练硬件的计算资源。 大模型训练中遇到的典型现实问题是模型的加载和模型的并行。 以175B参数的GPT-3模型为例,其训练需要的显存规模大概为2800GB。我们可以根据A100 80GB来计算所需卡的数量。但是要解决的问题,一是我们需要多少张卡装载模型?二是装载这个模型之后如何提升训练效率?解决这个问题就需要用到模型并行技术,现在已经有各种各样的模型并行技术去解决这样的问题。三是互连的问题,有NVLink单机内部互连、机器跟机器之间的互连网络。对于分布式训练来说,这都是非常重要的问题,因为会在通信上产生瓶颈。 大模型训练中的模型装载过程中,175B模型以FP16精度计算,大概需要350GB显存规模,模型梯度也需要350GB,优化器需要的显存规模大概为2100GB,合并起来大概是2800GB规模。分布式训练框架目前已经有比较成熟的方案,比如NVIDIA的Megatron-LM框架、微软开发DeepSpeed ZeRO3的算法,都可以用来解决模型装载和并行的问题。 在大模型训练方式上也有比较多的并行技术,包括张量并行、流水线并行、数据并行等。 在模型分布式训练过程中,我们还看到一些比较关键的问题,如集合通信性能问题。比如在TP切分中会产生一些All-Reduce(全局归约操作),这些操作夹杂在计算流当中,会产生计算中断影响计算效率,因此会有相应的集合通信算法、优化软件被开发出来,去解决集合通信性能的问题。 三、显存、带宽、量化,成大模型推理瓶颈 大模型推理时我们需要关注三个点:一是显存,模型参数量大小决定了需要多少显存;二是带宽,大模型推理时是访存密集型计算方式,在计算当中需要频繁访问显存,所以这种情况下带宽的规格会影响推理速度;三是量化,现在很多模型发布时除了提供基础的FP16精度的模型,还会提供量化后的模型,因为低精度量化可以省下更多显存,也可以提高带宽访问速度,这也是模型推理中业界经常会采用的一种技术。 总结下来就是,大模型推理有显存瓶颈;在推理方面可以走多卡推理,训练卡也可以用在推理业务,而且会产生不错的效果。 我们在做模型微观性能分析时发现,典型的Transformer-Decoder,很多大模型都是Decoder Only结构,里面包含注意力结构和MLP层。 在这些算子中,我们通过微观性能分析会看到,大部分的计算都是矩阵乘操作,实际85%的耗时都是访存,进行显存读取。 由于大模型推理是自回归的生成方式,上一个生成出来的Token会被用于下一个Token的计算。这种访存方式就是我刚刚提到的访存密集型计算。基于这种行为,我们会把这些注意力结构和MLP层分别进行融合,形成更大的算子后执行推理,就会显著提高计算的效率。 在大模型推理的带宽需求方面,下图展示了Llama 7B在A10、A100上推理性能的对比。在不同的Batch Size下,A100和AI的比例关系基本是一条比较水平的线(图中红线)。 这也可以反映A100的显存带宽和A10的显存带宽之间的比例关系,从侧面印证了大模型推理基本是访存密集型的操作,它的上限由GPU的HBM显存带宽决定。 除此之外,我们还分析了大模型推理时的通信性能。这里主要说的通信性能是指单机内部的多卡推理,因为如果跑Llama 70B的模型,仅靠A10一张卡没办法装载,至少需要8张卡的规格进行装载。 因为计算时做了TP切分,实际计算是每张卡算一部分,算完之后进行All-Reduce通信操作,所以我们针对这种通信开销做了性能分析。最明显的是在推理卡A10上,通信开销占比较高,达到端到端性能开销的31%。 我们如何优化通信性能的开销?通常来说比较直观的方法是,如果有卡和卡之间的NVLink互连,性能自然会得到提升,因为NVLink互连带宽本身就比较高;另一个方法是,如果卡上没有NVLink,你就需要一些PCIe的P2P通信,这也能帮助提高通信开销占比。 基于在阿里云上的亲和性分配调优,我们摸索出了一套调优方法,能够在4卡、8卡场景下进一步优化通信开销占比。 对于视频模型,今年年初OpenAI发布Sora,虽然没有公开太多技术细节,但国外机构已经给出了其关于算力需求的分析。 因为Sora的模型结构与文生图模型结构不同,其中比较显著的区别就是,从原来的UNet结构变成Diffusion Transformer结构,通过结构上的变化和算力的估算,我们看到的结果就是Sora在训练和推理上都会对算力有比较大的要求。 下图是国外研究机构估计的算力需求,他们估算训练Sora这样的模型,需要大概4000到10000多张A100训练1个月。在推理需求上,如果要像Sora这样生成5分钟长视频,大概需要1张H100算1个小时。 四、软硬协同优化方案,可将大模型微调效率提升80% 阿里云弹性计算为云上客户在AI场景提供了关于基础产品的增强工具包DeepGPU。DeepGPU是阿里云针对生成式AI场景为用户提供的软件工具和性能优化加速方案。用户在云上构建训练或者推理的AI基础设施时,该产品就能提高其使用GPU训练和推理的效率。 这非常重要,因为AI算力现阶段比较贵,我们需要通过工具包的方式帮助用户优化使用GPU的效率。我们也会提供文生图、文生文等的解决方案,并且帮助众多云上客户实现了性能的大幅提升。 接下来是阿里云帮助客户进行训练微调和推理案例。 第一个案例是文生图场景下的微调训练。我们将DPU和阿里云GPU结合,在客户的业务场景下帮助客户提升端到端微调的性能,大概会实现15%-40%提升。 第二个案例是关于大语言模型场景的微调。很多客户想做垂直领域或者垂直场景下的大模型,会有模型微调的需求。针对这种需求,我们会做相应的定制性解决方案或优化方案,在这个场景下,客户可以通过软硬结合的优化方法,提升大概10%-80%的性能。 第三个案例是关于大语言模型的推理,这个客户需要在细分场景做智能业务问答、咨询等,我们在这个场景下为客户提供了端到端的场景优化方案,从容器、环境、AI套件、DeepGPU到下层云服务器,帮助客户优化端到端推理性能,这会帮助客户提升接近5倍的端到端请求处理或推理的效率。 以上是李鹏演讲内容的完整整理。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。