EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
家电行业,等待“换机潮”
作者|Camille 编辑|Ray “昨天去超市囤货,你们猜怎么着?”“我买了台冰箱。” 当同事还在调侃Jesse从买菜到买冰箱,在商场就着急完成“保鲜闭环”时,其实Jesse也没想到,怎么买个菜的功夫就把家里冰箱给换了。 “虽然家里冰箱用了很多年,但没坏嘛,我也没想过要换。昨天逛到了家电区,想着现在的家电都号称有‘黑科技’,我就抱着好奇的心态去体验,结果销售店员从不同品类茶叶,到不同气候瓜果的智能温度调节,再到同冰箱内能养活海鲜养活鱼,竟然还能直接给食材抽真空保鲜,直接刷新了我对现在冰箱的认知。” 回想家里的冰箱对食材只起到“空调”的作用,Jesse就忍不住地心动,当店员拿出“以旧换新”补贴时,直接冲破了Jesse的最后防线——“刷卡!下单,买!” 家电行业发展至今,不论从技术革新,还是从工业美学,或是“美好生活”解决方案,都已经进入到“优中求精,精中求异”的阶段。消费市场也到了从追求价格到追求品质的需求升级阶段。 看似“你有我需”的完美市场,可现实中却如同两个相切的圆,有点交集但不多。潮汐商业评论曾在《厨房革命》的文章中写到,尽管供给端正以新技术、新场景、新需求带着行业走向更先进、更智能、更多元的高新时代,但即便有“新意识”的需求端也抵不住“不坏,不换新”的传统观念已根深蒂固。 显然,厨电之外,这也是整个家电行业正面临的问题。如何激发消费者的换新欲望?如何坚定他们的换机决心? 家电行业们,亟待「换机潮」。 看到如今中国家电行业的盛况,其实很难想象,在20多年前,我国家电企业还被外资品牌“按在地上摩擦”,市场长期由外资品牌主导。 由于行业发展初期,我国的家电企业在供应链上基本以进口、组装和技术引进为主,缺乏核心技术,因此长期受制于人。在后面的很长一段时间里,中国主要的家电市场份额一直被欧美、日、韩的家电品牌霸占着。 直到90年代,“醒悟”的国内家电企业也开始暗自发力。在供应链上,家电企业们从过去依赖进口引进,开始进行自主研发以及规模化生产,让产业链模型逐渐成型。与此同时,市场红利的显现,也让家电行业此时的品牌数量急剧膨胀。 以电视为例,似乎那时每个省份都有自己的电视机厂:北京的牡丹牌,天津的北京牌,上海的金星、凯歌、飞跃,福建的福日,厦门的厦华,广东的TCL、创维…… 彼时的国内家电市场,外有行业巨头的穷追猛打,内有国内家电品牌的“百家争鸣”,行业进入“无序化”竞争,并且各品牌迅速以“价格战”的形式展开激烈厮杀。 例如,1996年,长虹掀起的价格战,倪润峰宣称“凡是国外产品有的功能,我们都有;凡是国外产品具备的品种,我们都具备;凡是国外产品提供的服务,我们都提供。但是在同等功能和同等质量下,我们的价格比国外低30%。” 类似的家电价格战从未停止过,最终许多小厂入不敷出,被迫淘汰。美的、格力、海尔等龙头企业也在这时开始对规模、渠道、成本、品牌等方面优势扩大。行业从野蛮生长的无序竞争慢慢转变为有门槛的有序竞争。 紧接着,受“家电节能补贴”、“新家电”、“家电下乡”、房地产发展和产品升级需求的推动,我国家电零售规模在2006年以后实现了快速稳定增长,并且受政策扶持,国外品牌的生存空间越来越小,外资品牌开始退潮。 同时,中国家电企业的“大反击”也开始了,各种并购事件让人眼花缭乱。例如,2011年,海尔收购松下旗下的三洋白电业务;2013年,长虹旗下的华意成功收购西班牙Cubigel压缩机公司;2015年海信电视收购了意大利高端电视品牌Gorenje,同年长虹收购松下旗下的三洋黑电业务…… 如今,经过多年的引进吸收和创新,特别是进入到互联网时代,中国家电产业借助家居智能化浪潮,在某种程度上部分实现了“弯道超车”,再加上我国家电行业拥有全球最为齐全的产业链布局,海尔、海信、格力、美的等中国家电企业已在全球享誉盛名,牢牢占据全球家电行业的领军地位。 据智研咨询《2023年中国家用电器产业现状及发展趋势研究报告》显示,我国作为家电制造大国,家电产量规模占全球份额的60%左右,贸易规模占全球份额超30%。回顾20多年来国内家电企业的发展历程,无论是惨烈的行业价格战还是决定性的技术革新,都没能阻挡他们前进的步伐,总能逆风翻盘,实现跨越式增长。 只是,当“对手们”都被打败,当海外市场逐渐被攻占,国内家电企业们的下一站又在哪? 如果说,过去国内家电企业们的注意力都在抢占市场份额上,那么现在它们的竞争点则是在自己身上找增量。 如今,中国家电市场主要由海尔、格力、美的、海信、TCL、老板电器等几个主要的品牌主导,这些品牌在各自的市场领域内均拥有强大的品牌号召力和市场份额。在消费者心中早已埋下了“买空调选格力”“买冰箱选海尔”“买电视选海信”等与品牌绑定的消费心理。 然而,即便消费者已经有清晰的消费偏好,但“大件不用到坏,不换新”的家电消费意识却也已根深蒂固。尽管近些年来,时常有“家用电器使用寿命”的科普出来教育大家,但依旧无法撼动大众的“传统观念”。 有媒体曾测算过,根据《家用电器安全使用年限》,冰箱和空调的安全使用年限为10年,洗衣机、热水器、吸油烟机为8年。2022年冰箱、冷柜、空调、洗衣机等重点产品在我国的更新量总和约为1.5亿台,理论上占2022年内销量的比重超过80%。但实际上,空调的实际更新率可能不超过50%,冰箱、洗衣机的实际更新率60%左右。 这意味着有大量家电产品正在超期服役,甚至存在大量使用超过10年甚至20年的家电产品。 家电行业经历了地产红利期和行业成长爆发期之后,产品渗透率已接近饱和,增长速度开始趋缓,行业已迈入存量时代。而在存量之下,“换机”的生意或许能够行业带来新的增量。 但与过往侧重打法的商业酣战不同,如今家电巨头们需要的是回归商业本质,洞悉用户需求,用产品本身,击破消费者“旧观念”的最后防线。在消费者已有消费倾向的前提下,巨头们的竞争对手就是“自己”。 我们以电视为例,按照原本的商业逻辑,电视行业的竞争应该主要集中在电视厂商之间的竞争,但随着手机、平板、笔记本电脑的普及,小屏逐渐占据了大众的眼球,电视厂商们的争夺则主要在于如何将小屏的注意力再次转回大屏。于是,“体验”成了电视厂商们“革命”的关键词。 从100吋的超大屏视觉震撼,到配备顶尖音响的听觉盛宴,一次次的“视听”技术突破下,电视厂商们将“视听体验感”拉到了极致。从直接的感官体验再延申至场景的氛围体验,例如今年上半年,海信电视与《黑神话:悟空》合作的官方定制电视E8N系列,为游戏玩家带来“黑神话:悟空专属模式”,联合游戏制作方,针对游戏中的画面、情节、动作等特性,通过专业级的游戏影音解决方案,提升游戏表现力,为玩家带来更具冲击力、更身临其境的游戏体验。 如今,电视厂商们的“自我革命”,让消费者买电视的目的不在仅仅是看电视,而是为了“体验感”,而体验感能够延申出来的产品价值也已远超产品本身。 在当下的环境中,家电巨头们若想拥有新的增量突破,要先革自己的“命”。 如果说,产品的跨越式提升可以刚好满足部分有换机或购新机需求的人,那么,如何打动更多对换新不敏感的消费者,这是摆在面前的现实问题。 4月12日,商务部等14部门印发《推动消费品以旧换新行动方案》(下称《行动方案》),文件聚焦汽车、家电与家装厨卫三大赛道,提出将逐步建立“去旧更容易、换新更愿意”的有效机制,着力扩大国内需求。 但今时不同往日,无论是家电,还是汽车,这些年随着保有量和渗透率一路提高,已经很难再有大的上升空间。过往的换新是解决“有没有”的问题,而这一轮的换新则更多的是把“存量”转化为“新增量”。 常用家电的安全使用年限大多集中在8-10年,而距离上次09年大规模家电下乡活动结束也已超10年,目前我国正处于家电报废高峰期。行业估算,每年将有1亿至1.2亿的废旧家电被淘汰,并以平均每年20%的幅度增长。 换新市场的空间很大,但也很难攻破。政策利好、现金补贴、0换新成本等是多方刺激消费的基本途径。 但事实上,【潮汐商业评论】通过大量换新用户调查发现,消费者的换新时机往往在“不经意之间”:不经意之间-路过换新售点,不经意之间-看到换新信息,不经意之间-跟销售聊了两句……值得注意的是,消费者在电商平台上的“不经意之间”则多了“刻意”。 “我也就是忙着618怎么下单更便宜的功夫,后来在京东发现‘以旧换新’可以减钱的方式,起初这个换‘新’,是新物品,不是新家电。后面一想,什么都能用旧家电来抵,那就看看家电也换新一下吧,因为是大家电抵的金额更多一些,索性把该换的旧家电就都给换了。这种换新方式太丝滑了。”平时的Andy可以说是“不坏不换新”传统观念的保卫者,在“精打细算”的细节之间,没想到竟然把旧家电都给换了。 消费者逛电商平台往往带着消费的目的性,与传统逛线下店不同,“精打细算”的消费者往往会在自主寻找间,主动发现消费需求并产生消费,而线下则相对被动,消费者在被销售搭讪的第一句话时往往就已经产生了回避/拒绝的心理。 Andy的经历也并非个例。京东零售家电家居生活事业部负责人表示,过去三年,有超2000万用户选择在京东以旧换新。仅2023年,京东通过以旧换新回收的家电超过1500万台,以旧换新补贴额超15亿元。京东用户通过以旧换新购买的一级能效空调、冰箱、电视、洗衣机、热水器五大类家电,每年节约用电可减少20万吨碳排放。 或许家电企业们要找的“换新锚点”,就在消费者生活里的“不经意之间”。 格拉德威尔曾在《引爆点》一书中提到,“别看我们的世界看上去很巩固,或者说很顽固,其实只要找到那个点,轻轻一触,它就会倾斜。” “家里的洗衣机就是今年京东618以旧换新的,不仅省了好多钱,而且京东上门直接取走,非常方便。等双十一看看,再换新些新的家电。”Jesse说道。 你看,商业就是这样。
“孤勇者”隆基绿能被架在火上烤
时值炎炎夏日,但“光伏茅”隆基绿能却陷入了多事之秋。 鉴于连日来风波不断,隆基绿能(601012.SH)在6月7日晚间集中回应了市场的一系列质疑,可惜效果并不理想。端午节后的第一个交易日,隆基的股价依旧继续下跌,股价最低下探到16.41元/股,创年内新低。 客观上而言,隆基绿能的这波下跌离不开冰凉彻骨的大环境——一方面,近一年来,光伏行业被低价内卷、产能出清“阴影”笼罩。没有一家光伏企业能够独善其身;另一方面,受退市新规政策影响,市场担心退市和量化抽走流动性,大盘整体下跌。 此背景下,隆基绿能的股价表现也情有可原。这是很多看好隆基绿能的投资者的普遍共识。毕竟面对行业寒冬,这家光伏巨头无论是从战略和战术上都没有自乱阵脚,反而一直在坚持做产品和技术创新。 但从悲观者视角来看,隆基绿能的基本面却难言乐观——近日传出马来西亚和越南的产线要关停,此前接连爆出大幅裁员,今年一季度公司营业、利润均出现大幅下滑,账上躺着570亿又要发债百亿...... 分歧之下,乐观者抵不过残酷现实。悲观者往往引起了更多共鸣。隆基绿能只能被架在火上“烤”。 从股价上看。隆基绿能的股价已经从2021年的最高点73.2元,跌至如今的16.59元,跌幅高达75%。抛开光伏大环境之外,股价一路下跌是一系列原因综合作用的结果,而这背后也隐藏着资本市场的深深忧虑。 忧虑之一,账上躺着570亿又要发债百亿,存在“存贷双高”之嫌。 6月6日晚间,隆基绿能就披露公告称,拟发行不超100亿元公司债券。但资本市场却对这一大手笔发债计划并不买账。原因在于,根据财报显示,截至今年一季度末,隆基绿能货币资金超过570亿元。 明明手握重金却仍选择发债,让不少投资者陷入到对隆基绿能“存贷双高”的质疑中。 在二级市场,存贷双高从来都不是一个利好消息,因为存贷双高的不合理性在于企业保留大量货币资金的同时大量举债,这无疑会给企业带来不必要的利息费用,增加财务成本。 而更隐秘的焦虑是,存贷双高往往与也财务造假一同出现。 忧虑之二,隆基绿能被传言在东南亚“撤摊子”,国际化可能短暂受阻。 此前,媒体就据引一位业内人士的消息:隆基绿能在马来西亚的组件厂,开始进入逐步关停期。同时,这位人士还表示,早些时候,隆基绿能在越南电池片工厂的五条产线,也已全部停工。 这一消息并非空穴来风。今年5月16日,美国商务部就宣布对进口自柬埔寨、马来西亚、泰国和越南的晶体硅光伏电池(无论是否组装成模块)发起反倾销和反补贴调查。尽管这次双反调查目标国家并非中国,但调查目标却瞄准了中国在东南亚打造的一条完整的光伏产业链。 这意味,美国决定对东南亚四国光伏产品重启双反调查,中国光伏企业从东南亚地区向美国出口产品的通路将受阻。而随着形势的持续不明朗,投资的成本可能不仅没有收回来,还有可能打了水漂。 忧虑之三,隆基绿能已经多次陷入裁员舆情。 据报道,去年12月下旬,隆基绿能开始清退应届生,且该公司出现多个生产线停产等问题。有受访者表示,隆基绿能裁员人数可能超出1万人。 彼时,隆基绿能对外表示,市场变化很大,企业面临着激烈的市场竞争,会根据经营情况、市场环境变化和未来产业结构调整,做相应的资源分配。今年3月,隆基绿能再被曝出将裁员近三分之一,以求在产能过剩和竞争激烈的行业中削减成本。 财报显示,在2023年末,隆基绿能在职员工总数为7.51万,比上一年增加了1.45万人。据了解,在2023年,隆基绿能的员工总数峰值超过了8万人。但即使按照7.51万人计算,本轮也有超过3700人被优化。 忧虑之四,一季度的财务数据在四大组件厂中净亏损最多。 财报显示,隆基绿能一季度营业收入同比下降37.59%,归属于上市公司股东的净利润同比下降164.61%,归属于上市公司股东的扣非净利润同比下降167.37%,一季度亏损约23.5亿元,成为晶科能源(688223.SH)、晶澳科技(002459.SZ)、天合光能(688599.SH)等四大组件厂中净亏损最多的企业。 出现这种情况的主要原因,是光伏“降价潮”仍在延续,但上一次隆基绿能出现第一季度亏损,还是11年前的事了。 有投资者对隆基绿能今年的表现表示失望,认为在过去两个季度的价格战中,隆基绿能的现金损失速度过快,在价格战中表现不佳,“友商在Q1甚至略有盈利”。 “长坡厚雪多起伏。”隆基绿能的2023年财报发布时,少见地在最前面放了一封董事长钟宝申写给全体股东的信,开头就是这句话。 产能过剩、价格大战,光伏产业自2023年以来就在爬这个“雪坡”。即使是行业龙头隆基绿能,也不得不面对挑战。 而从这些星星点点的消息和传言来看,随着龙头排位更新、新旧产能更替,一场产业洗牌和格局的巨变也在酝酿之中。隆基绿能要靠什么实现翻盘、迎来春天,它是否还能再次押中未来。这才是业界真正关心的。 多重忧虑叠加大盘的消极情绪下,很少有投资者真正的关心隆基绿能的质地是否真的发生变化。实际上,如果投资者足够细心或者长期关注隆基绿能就会发现,站在企业的视角上,隆基绿能一直坚持在做“正确的事”。 回顾隆基绿能的历史,最著名的就是“单多晶硅之战”。公司成立时,太阳能电池硅材料仍处于以多晶硅为主的时代,但李振国和钟宝申认为,单晶硅将成为未来最优的发展路线,并坚决下注。 这个长期战略造就了一家超级产业龙头。2019年单晶硅迎来决定性的逆转,市场占比达到65%,隆基绿能顺势发展成为全球最大的单晶硅片和组件制造企业。 2022年,隆基绿能营收突破千亿元。目前,隆基的业务已覆盖了硅片、光伏电池组件、分布式光伏解决方案、地面光伏解决方案以及氢能五大板块,其中硅片和光伏电池组件是其主营业务,在总营收中占比超过95%。 但到了2023年形势却发生了逆转。隆基绿能虽然维持住了千亿营收规模,但它的增长却已减速了。 这离不开一个背景,过去几年各地方政府热衷光伏投资扩产,连带承诺投资、设立基金等各类扶持措施的持续投入。由此造成了整个光伏产业链陷入至暗时刻。 据相关不完全统计,全国有近80个城市是本省或本区域的“光伏第一城”或“光伏之都”,加上区县一级的中小城市,有近两百座光伏制造城市。这些城市占据了全国的大部分光伏产能,数量庞大且近年来仍在不断增长。 强力短期刺激所带来的,是阶段性的产能过剩,是各环节价格几近全线跌破成本。 根据中邮证券的说法,从2023年四季度开始,光伏产业链就已经进入了全面过剩阶段,各环节盈利均承压。今年以来,库存问题叠加硅料价格继续下跌,已经基本触及现金成本。有专业机构测算,在当前价格下,光伏产业链已全线亏损,部分环节开始亏现金流。 行业寒冬还会持续多久,什么时候见底?谁也没有准确的答案。 早就嗅到危机的隆基绿能的做法是“韬光养晦”,隆基绿能创始人、总裁李振国表示,为应对这场“寒冬”,隆基做了比较充足的准备:“我们致力于在技术上打磨得更好,同时,在财务上走得更稳健,现阶段少‘失血’。” 为此,隆基绿能在2023年进行了大额度的计提减值,计提存货和固定资产跌价准备67.57亿元。同时进行的还有在囤积现金,将现金储备从200亿拉升到了500多亿,翻了一番。 公告显示,截至2024年3月末,隆基账面仍有货币资金573.14亿元。当光伏行业普遍“赔本赚吆喝”,许多企业流动资金紧张,隆基绿能充足的粮草储备,成为了其应对寒冬的底气之一。 这也可以解释为何关于隆基“裁员”的消息甚嚣尘上,本质上是即便不差钱的隆基也要“刀刃向内”,毕竟在等待光伏再度“回春”的过程中,“节俭度日”并无不妥。 而在另一方面,隆基绿能将更多的精力放在了产品和技术创新上。自2023年9月宣布全面布局BC技术路线以来,隆基接连发布了耐湿热组件、泰睿硅片、Hi-MO 9组件、Hi-MO X6 Max组件等新品,更在前不久拿下了“全球光伏行业首个灯塔工厂”。 不过,在这之中,隆基绿能也曾饱受争议。当时,原来主流的P型PERC电池已然“将死”是行业的普遍共识,不过如何选择下一代电池技术路线各大企业站在了分岔路口上。领先的光伏组件“四小龙”中,以晶科能源为首的三家都选择了技术相对成熟的N型TOPCon电池并全面投入,隆基绿能宣布押注相对“小众”的BC电池,成为了特立独行的那个。 之所以选择并非没有原因。在隆基绿能董事长钟宝申看来,BC的理论转换效率极限为29.1%,高于TOPCon和HJT的28.7%和28.5%。TOPCon技术和传统PERC电池相比效率提升幅度比较小,技术高度同质化,非常容易出现投资收益达不到预期的状态,甚至可能面临未赚钱就过剩的尴尬。 事实证明了隆基绿能的判断。当时间步入2024年,选择N型路线并没有让行业变得更好,反而情况显得更加严峻。4月12日,华电集团2024年第一批光伏组件集中采购项目开标,N型组件的最低报价为0.81元/W,P型组件报出了最低为0.756元/W的“跳楼价”,均创下了新低。 隆基绿能向来信奉“不领先,不扩产”,量产也意味着基本解决了产品技术成熟度与量产爬坡的问题。而对于现在重心全放在BC技术路线的隆基绿能而言,家中有粮还要借债的理由其实很好理解,在当前利率环境下,债券融资渠道比传统信贷渠道在可获得性和成本上优势明显。隆基绿能无非就是想用更充裕的资金来确保BC技术路线的推广过程不会因为资金流影响而受阻,这是准备好了打长期攻坚战的准备。 对于投资者而言,看清了这一点,换个角度看市场上的这些利空反而是利好。 5月23日,隆基绿能的嘉兴工厂迎来首次对外开放,由行业专家、客户代表和新闻媒体等百余人组成的体验团深入生产线感受这个全球光伏行业的首个“灯塔工厂”。 在开放日当天,隆基绿能官宣了一款名为“Hi-MO X6 Max”的组件产品,而此时距离其发布全新一代超高价值组件产品Hi-MO 9,仅过去了半个月。 事实上,从最早HPBC技术而生的Hi- MO 6到Hi- MO X6防积灰组件、Hi-MO X6双玻耐湿热组件、Hi- MO X6Max系列产品,再到更高效的HPBC二代技术以及应运而生的Hi-MO 9产品,隆基绿能的新产品是一个接着一个。 明眼人都能看出来,隆基绿能放弃了行业依靠“价格战”占领市场份额的方式,试图走出另一条路线——深耕BC技术路线,拿出“高功率、高价值”领先技术和产品,突出“全生命周期价值”,打破这场行业同质化困局。 这一系列动作虽没有错,但也间接说明了龙头在“卷技术”引领光伏行业迭代升级、穿越周期的过程中所承受的压力。 这种压力一方面来自于行业,另一方面来源于客户。 根据中国光伏行业协会预计,去年中国硅料产量超过140万吨,硅片、电池片与组件产能均超过700GW,远超450GW左右的市场需求。 与之对应的,2023年年初,光伏组件价格还处于1.8-1.9元/W的水平,到2023年10月首次跌破1元/W。今年以来,价格继续下跌,5月底北京能源集团的招标中,投标均价在0.803元/W,最低价已降至0.76元/W。 对此,李振国也坦言,“我们也没想到价格竞争会到这么惨烈的地步,现在这种价格是全行业任何一个环节都必然亏现金。” 从行业上看,如此巨大的过剩产能,消化并非是一朝一夕能够完成的。更何况,从全局上看,唯有更多的光伏从业者投入到BC电池的技术路线中才能推动行业走出低谷,走向繁荣。 现实情况是,大量的产能投入到了P型和N型电池中,尤其是走TOPCon路线扩产的企业已经太多了,从而导致光伏电池“N型替代”仍在持续。根据中国光伏行业协会(CPIA)此前的预测,在2024-2030年,TOPCon路线会始终保持市占率上的优势。 反观去年隆基绿能推出了基于BC技术的第一代HPBC产品后产能并不大。2023年,隆基的西咸29GW、泰州4GW高效HPBC电池产能实现投产。在业绩说明会上,隆基管理层披露,2023年,HPBC产品共出货5.95GW,今年3月和4月的月度出货量均刚超过2GW。 对比来看,隆基绿能的BC电池产能还只是“小巫”,才开始放量。 不过,隆基也开始从战略上、战术上反思自己是否在为客户价值创造上做的不够多。李振国在近期的一次采访中被问到:在过去十几年,隆基绿能安身立命的根本就是技术创新。那么,接下来的十年,隆基绿能除了坚守技术创新的“第一性原理”之外,还将锚定什么方向? 李振国给出的结论是:“我们不希望自己沦为卖大宗商品的公司。”言外之意,隆基要开始全面出击。 今年以来,隆基绿能陆续放出了几个创新性的大动作,而这些动作无一不透露着对市场的新思考。 比如单晶硅片问世后,至今多年硅片领域都再没有太大的创新。隆基绿能推出了“泰睿硅片”,该产品采用全新的TRCz拉晶工艺,具备电阻率均匀性和吸杂效果好、全平台支持等优势,一经推出就受到下游电池客户的欢迎。 再比如,今年5月隆基推出了划时代的产品——Hi-MO 9组件,基于高效HPBC 2.0电池技术打造,集多种先进技术于一身,拥有更高发电能力、更低BOS成本和更高可靠性等核心优势,最高功率660W,转换效率高达24.43%。 隆基绿能副总裁佘海峰表示,公司成功在分布式屋顶市场商业化第一代BC产品后,市场有一个普遍认知,认为BC产品优于常规产品的外观天然属于屋顶。 “隆基的一代BC产品主要的市场定位的确是屋顶市场,但是二代BC完全不同。二代BC产品的应用将是面向全场景市场。这也是公司率先发布的基于二代BC的Hi-MO 9产品主要定位于地面集中式市场的原因。” 可以看到,无论是泰瑞硅片,还是第一代和第二代BC电池以及组件产品,隆基绿能开始学会如何重视客户,尊重和敬畏市场,这是之前这个“理科直男”不曾做的。 这或许是隆基在财报中自信的底气所在:“到2025年,我们的全线产品将处一个非常显著的领先地位。未来三年,公司预计单晶硅片年产能将达到200GW,其中泰睿硅片产能占比超80%;BC电池年产能将达到100GW;单晶组件年产能将达到150GW。” 当年,隆基绿能坚定地推进单晶硅革命,至今仍为人所津津乐道。现在,愿意押注“长期正确”隆基绿能坚定看好BC电池路线,是否能再度上演一个“逆袭”故事?对于看清隆基绿能的人来说,心中已经有了答案。
65岁日本艺术家用Luma“复活”已故11年的妻子!网友:AI没有温度,但是用AI的人有
6月14日,一位65岁的日本艺术家在社交平台上,发布了一个用Luma的Dream Machine制作的视频。视频中,他将自己已逝去11年的妻子,在视频中重新复刻,把冰冷的照片变成了鲜活的影像。视频一经发布,这些温情瞬间触动了无数网友的心弦,不少网友在评论区留言,表示感动到热泪盈眶。 图片来源:X Koya Matsuo(松尾公也)是一位65岁的日本AI艺术家、IT编辑和音乐人,为了纪念他逝去了11年的妻子小鸟酱(Tori-chan),他用Luma的AI视频Dream Machine制作了一段视频,并发布在了社交媒体。 图片来源:X 该视频引发了许多网友的关注,播放量超过了40万次,不少网友称,“这简直就像是《哈利波特》里的魔法”。视频内容如下: 图片来源:X 有网友在这条视频下留言,表示AI技术的进步在这些地方得以体现,不禁让人泪目。 图片来源:X 据外媒报道,2013年6月25日,松尾公也的妻子小鸟酱因乳腺癌不幸逝世。此后,松尾公也陷入对妻子的巨大思念中。 每当AI视频和音乐生成工具面世,65岁的松尾就开始疯狂学习,想法设法用它们“复活”妻子。 这次Dream Machine爆火,松尾公也在第一时间试用。 图片来源:Technoedge 他在发表于TECHNOEDGE中的文章里表示:“我使用它的目的并不是为了电影等视频制作,而是用于静态图像,尤其是让人物动起来。更具体地说,是为了看到11年前去世的妻子的动态身影。” 松尾公也用1978至1987年间拍摄的胶片照片,通过Remini技术进行高清化处理,再利用Luma Dream Machine转换成视频,实现了让妻子在视频中“复活”的愿望。 图片来源:X 据他本人介绍,他把妻子高中时的一张照片(拍摄于1978 年)上传到Dream Machine,然后输入提示词:“a girl is talking with her friend on a moving train(在移动的火车上,一个女孩正在与她朋友交谈)”,从而生成视频。 照片中的人随着火车的震动而摇晃,窗外的阴影变化也被反映出来了。 图片来源:X 他还找出妻子的数张照片,先用SD生成图像,然后使用Dream Machine将这些静态画面转化为动态视频。 在尝试过程中,松尾公也发现,如果动作太大,比如回头或站起来,视频中的脸部往往会与本人不符。他推测这可能是因为AI的训练数据偏向欧美人。为了解决这个问题,他尝试使用“... is looking at me(某某正在看着我)”或“... is staring at the viewer(某某正凝视着观众)”等提示词,成功生成了视线始终朝向他的视频。 这是1985年他们在筑波博览会拍摄的照片。 图片来源:X 松尾给的提示词是:“a girl is looking at me(一个女孩正在看着我)”,然后,Dream Machine生成了让他每看一次都会心动的视频。 图片来源:X 为了使作品更加完整,他把妻子保留下来的声音进行取样,利用 Suno的Voiceflex功能作词作曲,最终为妻子生成一条音乐MV:《Can Dream Machine Dream?》,完成了一次跨越时空的音乐与影像的融合。 图片来源:X 有网友表示:“AI没有温度,但是用AI的人有。” 每日经济新闻综合自公开信息 每日经济新闻
低价套现的英伟达创始人:血亏1000亿美元,还把家产全都捐了
编译 | 陈骏达 编辑 | Panken 芯东西6月18日消息,随着英伟达市值站上3万亿美元大关,创始人兼CEO黄仁勋的身价也水涨船高。根据福布斯的实时数据,目前黄仁勋的净资产达1134亿美元,位列全球第12名。 不同于黄仁勋的高调与风光,英伟达的另外两位联合创始人都早早隐退。其中曾是英伟达首任CTO的柯蒂斯·普里姆(Curtis Priem)早在2006年便出售了自己拥有的所有英伟达股票。 如果他不出售自己做持有的英伟达股票,目前将拥有超过1000亿美元的资产。但普里姆如今过着离群索居的生活,几乎从不公开露面,不参与英伟达的任何事务。 ▲柯蒂斯·普里姆(来源:伦斯勒理工学院) 普里姆其实是英伟达创业早期技术方面的重要奠基人。他拥有近200项发明专利,基本都和计算机图形和I/O设备相关,也负责了英伟达初创时重要技术人才的引进。 在加入英伟达之前,他曾设计了世界上第一个用于PC的图形处理器——IBM的专业图形控制器。在3位创始人正式创立英伟达之前,曾用普里姆的姓氏暂时命名这家公司。 不过在英伟达成立10年之后,普里姆就因为家庭问题完全退出了英伟达公司。他的前妻对他有长期的家庭暴力史,多次引得警方上门处理,最后闹上法庭以离婚收场。 普里姆在英伟达1999年上市后就开始了自己的慈善和教育事业,通过出售英伟达股票获取大量资金,并捐赠给自己的大学母校纽约伦斯勒理工学院(RPI),捐赠总额达2.75亿美元。2023年时他更是豪掷9500万美元,为伦斯勒理工引进了IBM的Quamtum System One量子计算机,使伦斯勒理工成为世界上唯一一座拥有这一计算机的大学。 01. 计算机图形领域大佬, 设计世界上第一个PC图形处理器 童年时期的普里姆就对计算机展现出浓厚的兴趣。他童年时随着家庭在美国东海岸各地居住,最后定居在克利夫兰。除了计算机,他还演奏古典音乐,在大学时期曾经担任四年的大提琴手。 普里姆大学时就读于纽约伦斯勒理工学院(RPI),这所学校以培养出色的工程师而闻名,是美国四大工程院校之一。普里姆本可以选择更知名的大学,比如麻省理工学院(MIT),但他了解到伦斯勒理工有当时最先进的IBM计算机,于是便选择了这所大学。 在创办英伟达之前,普里姆曾在Vermont Microsystems和Sun Microsystems工作,并在计算机图形领域做出了诸多开创性的工作。在Vermont Microsystems工作时,普里姆为IBM设计了世界上第一个用于PC的图形处理器——IBM的专业图形控制器(PGC)。他是PGC的架构师和首席设计师。这一处理器是当时最为先进的图形处理器之一,提供了640×480像素的高分辨率,可以从4096种颜色的调色板中选择256种颜色,刷新率也达到60赫兹。 ▲普里姆为IBM设计的图形处理器(来源:《GPU编年史——创新之路》) 1986年,普里姆加入了Sun Microsystems。在Sun工作期间,普里姆设计了Sun的明星产品GX系列图形加速卡中帧缓冲控制器(FBC)和变换引擎和光标(TEC)芯片中的变换引擎。 帧缓冲控制器是GPU渲染管线和显示输出之间的接口,对实现流畅高效的图形渲染和显示至关重要。而TEC芯片让加速卡能支持更多类型的计算需求。 普里姆设计的初代GX图形加速卡能提供50兆浮点计算(MFLOPS)的算术计算能力,这并不是当时最先进的算力水平。但在80年代末,强大的3D图形系统是昂贵且难以编程的。普里姆在设计时采用了开放的操作系统和图形库,同时也没有一味往芯片上堆料,这让这块GX图形加速卡的售价相对低廉,让更多开发者能获取到图形加速工具。 ▲普里姆参与设计的GX图形加速卡(来源:《GPU编年史——创新之路》) GX图形加速卡还允许开发者在原生环境中直接使用类似C语言这样的高级语言进行编程,无需特殊的模拟器、汇编器、微码或硬件,实现了之前从未有过的设备控制水平。这些思想后来在英伟达初创时期的UDA(统一驱动架构)、CG(C for Graphics)和最终推广的CUDA上都有体现。黄仁勋认为,如果没有CUDA,就不会有今天的英伟达。 02. 曾是黄仁勋年轻时顶头上司, 技术路径失败后不再参与硬件架构设计 Sun Microsystems是普里姆结识黄仁勋和另一位创始人克里斯·马拉乔斯基(Chris Malachowsky)的地方。80年代末,黄仁勋以半导体设计公司LSI Logic驻场员工的形式加入了Sun Microsystems的一个开发项目,这个项目的领导者就是普里姆和马拉乔斯基。黄仁勋在工作期间和普里姆和马拉乔斯基有大量的互动,这让二人注意到黄仁勋的才华。他们在工作期间建立了牢固的友谊。 ▲英伟达3位创始人近期合照,从左至右:普里姆、黄仁勋、马拉乔斯基(来源:英伟达) 普里姆和马拉乔斯基其实是最早有创业想法的两位创始人,他们花了不少时间才说服黄仁勋入伙。在1993年英伟达未正式创立之前,这3位创始人还暂时用普里姆的姓氏(Priem)命名了他们的初创企业,称之为Primal Computer。他们在普里姆家的一间卧室里完成了英伟达创业前的准备工作。 ▲90年代的普里姆(图源:普里姆) 在英伟达创立初期,普里姆作为公司CTO,负责了不少技术人才的引进,其中就包括英伟达的首席架构师约翰·蒙特拉姆(John Montrym)。蒙特拉姆后来设计出了世界上第一块可配置的图形处理器NV20,为机器学习革命打开了大门。 成立初期,英伟达坚持使用普里姆在Sun Microsystems时期使用的四边形渲染技术。四边形在渲染时可以更容易地与像素网格对齐,这有助于减少纹理映射的锯齿效应。 但英伟达的这一愿景并未受到市场的认可。当时的游戏开发者很少使用四边形渲染技术,大多数都使用三角形渲染技术。微软更是在1995年9月宣布基于三角形渲染的DirectX规范,还将当时最热门的《毁灭战士》(Doom)系列游戏移植到DirectX上。 2个月后,英伟达的NV1芯片才正式发布,此时市场对采取四边形渲染的NV1芯片已经没有太大兴趣了。 ▲搭载NV1的世嘉设备(来源:YouTube) 英伟达的合作伙伴日本游戏机巨头世嘉由于编程困难和开发进度慢,也放弃了进一步使用NV1的计划。当时黄仁勋亲自前往日本与时任世嘉总裁入交昭一郎会面,最终世嘉总裁决定再给英伟达一次机会——一笔500万美元的投资。 这笔救命钱让英伟达能够与世嘉公司继续合作开发NV2,这块芯片同样是基于四边形渲染技术的。项目期间普里姆7次飞往日本推进工作,但这一项目最终胎死腹中,NV2产品从未问世。 普里姆在NV2项目之后就不再参与硬件架构的工作了,但他继续在英伟达的其他项目中做出了贡献。英伟达的前两款产品的失败原因不只是四边形渲染技术,还因为当时他们想在一块加速卡上融入图形、音频和游戏手柄端口等多种功能,这让产品价格过于昂贵且每一部分的表现都不能达到最优。 硅谷传奇投资人、红杉资本的唐·瓦伦丁(Don·Valentine)给了英伟达第一笔投资。在英伟达出现财务危机后,他向黄仁勋分析道,英伟达的定位不够清晰,必须从计算机图形公司、音频公司和游戏机公司这3个方向中选出1个。 普里姆也有类似的观点,他在公司走廊里与黄仁勋进行了长时间的交流,并最终说服黄仁勋选择图形加速器这一发展路径。 这一决定让英伟达终于走出了泥潭,做出了他们第一款广受市场认可的产品RIVA 128。普里姆在2022年的一场分享会中称,这是英伟达精神的转折点,彻底重塑了英伟达。 ▲ RIVA 128(来源:Videocard Virtual Museum) 在英伟达任CTO的10年里,普里姆的愿景对于塑造公司发展轨迹并推动其在科技行业取得成功发挥了重要作用。他对新兴趋势和技术有十分敏锐的理解,很早就意识到了GPU不仅仅只能用于计算机图形,推动英伟达走在科技创新的前沿。 03. 一上市就放弃近10%股票, 如今价值约1300亿美金 1999年,英伟达以11亿美元的市值上市,并正式将公司的产品命名为GPU。同年7月,普里姆还与他的第一任妻子维罗妮卡结婚。 2个月后,他成立了普里姆家族基金会,将他持有的12.8%(IPO时)英伟达股份的3/4以上捐赠到这一基金会。按今天的股份数量计算,相当于约10亿股。他在2023年接受福布斯采访时说,这笔捐赠的主要原因是他不想让政府从股票出售中获得任何税款。 那时候,普里姆认为自己在英伟达剩余的股份最终可能会有5000万美元的价值,在2023年接受《福布斯》采访时,普里姆吐露真言,完全没想到英伟达市值会突破万亿美元。 如今,英伟达市值已经稳居3万亿美元,普里姆当年持有的股票如果没卖掉,现在价值大概超过1000亿美元了。 一开始,普里姆家族基金会主要的捐赠对象是大自然保护协会和蒙特利湾水族馆等自然保护组织,后来主要转向了教育方面的捐赠。普里姆家族基金会早期的网站上写道,“我们相信,大部分痛苦都是可以避免的,因为它一开始就在我们的控制范围之内”。他认为教育可以从源头上解决人类面临的许多问题。 ▲普里姆家族基金会支持的部分公益项目与合作伙伴(来源:普里姆家族基金会) 普里姆醉心慈善或许与他家庭的宗教背景有关系。虽然他本人不信奉基督教,但他的父亲,姐姐和祖父母都是牧师。 2000年,普里姆回到他的大学母校伦斯勒理工学院,接受该大学给他颁发的年度企业家奖。 普里姆说:“我一走进校园就感觉这就是我的使命。”他称自己在2000年和2001年两次向伦斯勒理工捐赠了100万美元。从2002年至今,普里姆家庭基金会开始每年向伦斯勒理工捐赠少1000万美元。 此外,在2001年,也就是普里姆开始向伦斯勒理工捐赠时,这所大学宣布收到一笔匿名捐赠,承诺分期捐赠3.6亿美元。但普里姆和学校都没有评论他是否是捐赠者。如果将这笔匿名捐赠算在普里姆头上,他目前可能已经向伦斯勒理工捐赠了2.75亿美元,占该时期伦斯勒理工收到的捐赠总额的40%。他还承诺再捐赠约8000万美元。 伦斯勒理工学院不仅仅是普里姆的捐款对象,也是他寻找意义和慰藉的地方。在谈到自己对母校的捐赠时,普里姆称:“我在外面的世界经历了地狱般的事情,而这所学校实际上是我的避难所。”他从2003年起就在伦斯勒理工的校董会任职,他认为这是自己的“目标”和“维持理智的方式”。 04. 因家庭问题从英伟达离职, 豪捐9500万美元归零基金会 普里姆的慈善事业一片风生水起,但他在英伟达的工作却并不顺利。普里姆说,他因家里的个人问题而分心,无法在工作时达到他想要的水平,所以他在2003年,也就是英伟达成立10周年时辞任英伟达CTO,彻底离开了英伟达公司。 普里姆在2023年接受《福布斯》采访时说自己接下来10年的生活一团糟。普里姆的妻子对他有长期的家庭暴力史,他在2013年提交的法庭文件中称,他妻子对他的家庭暴力“产生了19份书面警方报告、5次逮捕、3项刑事定罪、3项刑事保护令、1项民事临时限制令和3次缓刑”,最终二人离婚。 普里姆说,他曾与加州当时的参议员会面,倡导一项修正案,使涉嫌家庭暴力的施暴者更难获得配偶赡养费,这项法案最终通过。他的前妻对家庭暴力轻罪指控没有提出抗辩,他也从未支付过配偶赡养费。 在此期间,普里姆继续帮助伦斯勒理工学院。他说伦斯勒理工几十年来一直在财务上“陷入困境”。他的捐款首先用于基本需求,比如雇用更多教师、翻修建筑和购买实验室设备。随后他又向伦斯勒理工的生物技术和跨学科研究中心以及表演艺术中心做出了捐赠。 ▲普里姆家族基金会官网(来源:普里姆家族基金会) 2023年,普里姆做出了他有史以来最大的一笔捐赠,金额达9500万美元。这笔资金将用于引进IBM的量子计算机Quantum System One。这将使伦斯勒理工成为世界上唯一拥有IBM Quantum System One量子计算机的大学。他预计这笔捐赠将开启他基金会的“归零之旅”。 05. 结语:也曾后悔早早放弃股票, 目前已经离群索居 目前普里姆的净资产大概仅有3000万美元,这要远远少于另外两位创始人的财富。与普里姆一样已经退隐江湖的英伟达创始人马拉乔斯基近期未披露过他的持股情况。但2002年的一次披露信息显示,他当时持有7.73亿股英伟达股票,按照英伟达如今的市值计算约为1000亿美元。 普里姆现在居住在加利福尼亚州弗里蒙特附近一栋价值600万美元的住宅里,远离电网,手机服务也不可靠。他还拥有一架名为“史努比(Snoopy)”的湾流G450高级私人飞机,每年4次飞往伦斯勒理工。 普里姆目前处于离群索居的状态,他在联系其他人时会使用由一串随机数字构成、用后即弃的电子邮箱,几乎没有人能够打扰他。他说自己从2001年之后就几乎没有收到过垃圾邮件。 普里姆每天只会想起英伟达两次——在他戴上和脱下英伟达5周年纪念手表的时候。但如此洒脱的他在看到英伟达飞涨的股价时,也会有几分不甘。他在《福布斯》2023年的采访中说道:“我做了件有点疯狂的事情,我希望我当时多保留一些英伟达的股票。”
端侧大模型火了,但CPU被低估了
作者|赵健 大模型火了之后,GPU也火了。一时间,GPU的持有量几乎成为了评估大模型成败的“度量衡”。 GPU很好,但不是大模型的全部。远比GPU诞生更早的中央处理器芯片——CPU,它在大模型中的地位可能被远远低估了。 尤其是在端侧大模型兴起之后,端侧推理越来越成为CPU的舞台。 过去大半年,端侧推理已经成为继“百模大战”之后下一个行业趋势,由此衍生的AI PC、AI手机等概念,也成为电脑厂商、手机厂商的兵家必争之地。 把大模型装在PC、手机或者其他硬件中,需要足够的算力来支撑,同时也需要兼顾效率和功耗。而CPU很可能是当前阶段端侧推理的算力最优解。 1.端侧大模型火了 今天,如果你想体验业内最领先的大模型对话助手,无论是OpenAI的ChatGPT,还是国内的Kimi、智谱清言等,都必须要联网。这些大模型都部署在云端,适合编排涉及高级推理、数据分析和上下文理解的复杂任务的应用程序。 但是,云端模型不仅要消耗巨大的算力成本,还需要用户上传数据。出于对成本、数据隐私安全等方面的考量,把大模型部署在端侧,已成为大势所趋。 在大模型落地端侧的需求下,我们能看到业内正在发生的两个趋势: 第一个趋势是大模型正在越做越“小”。 Meta、谷歌、微软等大厂在发布大模型时,往往是一个“中杯、大杯、超大杯”的模型家族,其最小的模型参数基本都在10B以下,并且有的会针对手机这样的大众级终端设备做适配。 比如,微软在去年专门成立了一个小模型(SLM)团队,并在今年5月22日的微软Build开发者大会上发布了专门为手机端侧推理而设计的Phi-3系列模型;随后,在6月11日的WWDC开发者大会上,苹果也低调发布了一个3B的端侧小模型。 值得一提的是,小模型并非要取代大模型,而是更适合处理那些不需要大量复杂推理或快速响应的应用程序。 在适合端侧推理的小模型陆续出现之后,第二个趋势很快出现了——终端厂商正在积极尝试把模型装进PC、手机中,也就是现在热议的“AI PC”、“AI手机”等概念。 上个月,苹果、微软先后发布最新的PC设备,AI PC的概念达到了一个高峰——5月8日,苹果在春季发布会上发布了自研Arm架构的M4芯片,直言其中的神经网络引擎“性能强到足以傲视当今的AI PC”;2周后,微软推出了名为“Copilot+PC”的“AI PC新物种”,其搭载了基于Arm架构的高通处理器。 摩根士丹利在5月14日发布的研报中指出,2025年-2026年,AI PC的渗透率将从2024年的8%增至50%。 在AI手机领域,vivo X100系列、OPPO Find X7系列,以及荣耀Magic 6在内的一众安卓旗舰产品已经成功实现了70亿大模型的本地部署;联发科最新发布的天玑9300+旗舰芯片能实现Llama-2-7B端侧大模型更高速的运行。 近期,苹果在WWDC开发者大会上推出了Apple Intelligence,将大语言模型集成到下一代终端设备,让AI能力几乎覆盖了所有重要的原生应用,包括相机、照片、备忘录、语音备忘录、提醒事项、邮件、Safari、Keynote等,为用户提供个性化的智能服务。如果说iPhone让手机用户开始抛弃实体键盘,彻底转向大尺寸多点触控屏,那么AI加持的iPhone,或许将正式引领全球40亿智能手机用户进入下一轮变革。AI手机,有了新的定义。 在新能源汽车、XR等新的终端设备上,大模型也在陆续落地。比如小米SU7也加入了端侧AI大模型,配合小爱同学语音助手带来全新智驾体验。 可以说,模型公司与终端硬件公司正相向而行,共同推动端侧大模型的应用落地。而两者的交汇点,就是端侧设备的算力条件。在现阶段,CPU可以认为是端侧推理的算力最优解。 2.跑端侧推理,还得靠CPU 很多AI从业者对于CPU或多或少带有一些先入为主的“偏见”,认为大模型的大规模并行计算特点更适合GPU来处理,但并不适合CPU。 在大模型的训练阶段的确如此。但在大模型的推理阶段,尤其是端侧推理,实际上CPU也能胜任大部分计算任务。 关于GPU与CPU的关系,可以概括为“专才”与“通才”的对比——GPU像是一名“拥有最强大脑的专才”,其强大的计算能力专门应对图像处理、AI计算等需要大规模并行计算与数据吞吐的任务;而CPU像是一名“十八般武艺的通才”,虽然加速计算能力比不上GPU,但擅长处理操作系统、系统软件与应用程序等复杂指令调度、循环、分支、逻辑判断与执行的任务。 既然是一名“通才”,CPU自然也能处理AI计算任务。实际上,CPU过去一直就是这么做的。比如在智能手机里,有很多功能都涉及AI计算,包括对面部、手部和身体动作的追踪,高级的相机效果和滤镜,以及许多社交应用中的细分功能。此类AI工作负载的处理可能全权交由CPU,或是结合GPU或NPU等协处理器一起提供支持。 到了大模型时代,端侧推理出现了新的计算需求,主要的应用场景包括文本生成——虚拟助理撰写电子邮件;智能回复——即时通讯应用自动提供针对某个问题的建议回复;文本摘要——电子书阅读器提供章节摘要等。 针对不同的设备和应用场景,计算需求也呈现出差异化。在诸如入门级智能手机、汽车智能座舱、AIoT设备等中低端应用场景中,对计算能力的要求相对较低,CPU能够高效处理参数规模在数十亿级别的小型计算任务。在一些高端场景,如PC和旗舰智能手机上,所需处理的任务相对更为复杂和庞大,即便配备了AI专用加速器,CPU仍是不可或缺的算力基石,且能独立承担处理百亿参数级别的更大规模计算任务。以当今的安卓平台来看,第三方应用中有70%的AI运行在Arm CPU上。 今天,智能手机的CPU几乎都是基于Arm架构。得益于Arm CPU本身的AI计算能力,全世界约99%的智能手机都具备在端侧处理大模型所需的技术。这些技术包括: NEON扩展架构,主要用于加速多媒体和信号处理算法,如视频编码/解码、2D/3D图形处理、游戏渲染、音频和语音处理,以及图像处理等; SVE(Scalable Vector Extensions)可扩展向量扩展技术,特别适用于需要进行大规模数据处理和高性能计算的场景,如机器学习、数据分析和科学计算等; SVE技术的进阶版SME(Scalable Matrix Extensions)可扩展矩阵扩展技术,则进一步提升了性能和能效,能够满足人工智能、机器学习和高性能计算等领域对计算能力和效率的严苛需求。 据Arm官方消息显示,预计到2025年底,将有超过1000亿台使用Arm处理器的AI设备。 在2024世界移动通信大会(MWC 2024)上,Arm还专门演示了在搭载Arm Cortex-A700系列的安卓手机上,使用3个CPU核运行Llama-2-7B的性能表现,其文本生成速率达到每秒9.6个单词,这大约是一般成年人平均读取速度的两倍。这一过程全都在手机本地完成,无需联网。 Arm CPU可在移动端的边缘侧运行生成式AI,图片来自Arm官方 一个70亿参数的模型之所以能够在手机端畅通地运行起来,除了Arm CPU本身就具备的AI算力之外,也得益于Arm针对开发者生态做了一系列优化工作,核心是压缩与量化技术。 其中,int4位量化技术可以将模型压缩至足够小,以便能在RAM资源有限的设备上流畅运行;高效的线程绑定技术能够轻松提升各类设备的CPU工作负载性能,确保系统的稳定运行;深度优化的矩阵乘CPU例程,使得LLM的Token首次生成时间缩短50%以上,文本生成速率提升20%,不仅进一步降低了延时,还为用户带来了更为高效和流畅的使用体验。 AI手机是现阶段CPU做端侧推理最大的应用场景,当然这仅仅只是开始。随着大模型的不断演进,越来越多新的模型与应用涌现,相信这些都将会在CPU上率先跑通。 3.从硬件基础到软件生态的持续迭代 在移动互联网时代,Arm计算平台是移动计算的底座。如今到了AI时代,Arm计算平台依然保持着持续迭代和创新。 在日前台北电脑展举办前夕,Arm推出了面向智能手机、PC等设备的全新平台型解决方案——Arm终端计算子系统(CSS),结合了最新Armv9架构的特性,其中CPU和GPU在AI方面都有大幅性能提升。据Arm介绍,Arm终端CSS是迄今为止运行速度最快的Arm计算平台,在计算和图形性能方面实现了30%以上的提升,同时AI推理速度也提高了59%,适用于更广泛的AI、机器学习和计算视觉工作负载。 为了让开发者能够快速获得开发生成式AI应用所需的性能、工具和软件库,Arm还专为此量身定制了Arm Kleidi软件开发平台,其中包括面向生成式AI的KleidiAI和针对计算机视觉应用的KleidiCV。KleidiAI支持Neon、SVE2和SME2等Arm架构的关键功能,并与PyTorch、Tensorflow、MediaPipe等热门AI框架深度集成,能有效加速Llama-3、Phi-3等关键模型的性能。 可以说,Arm为移动端AI的落地打造了一个功能完备的“百宝箱”。 全新Arm Kleidi软件开发平台,图片来自Arm官方 Arm CPU以及Arm生态所提供的强大支持能力可广泛适用于各类消费电子设备,包括旗舰智能手机、AI PC,以及主流移动设备、XR和可穿戴设备等在内的各类消费电子设备。虽然不同设备的端侧算力分布参差不齐,但CPU的通用性使其能够快速响应端侧大模型的落地需求。 此外,若要实现高能效与低功耗的目标,Arm CPU无疑是端侧算力的首选。在主流CPU阵营中,Arm架构以其低功耗特性而著称,这一优势在AI PC、AI手机等应用场景的能效竞争中尤为关键。 举例来说,在一系列热门手游的运行测试中,当游戏画面以平均每秒120帧的速度运行时,Arm最新发布的终端CSS在相同功耗条件下,可带来37%的平均性能提升,同时GPU功耗降低30%。 Arm CPU低功耗的特性吸引了PC厂商的青睐。2020年,苹果率先发布了首款基于Arm架构的M1芯片,并将其搭载在Mac电脑上,成为“第一批吃螃蟹”的厂商。今年,苹果的M系列芯片已经迭代到第四代。 苹果的这一举动让PC厂商意识到,原来Arm CPU不仅能装在手机里,还能装进电脑里,而且性能抗打。此后,PC厂商逐渐转向Arm CPU阵营。比如,微软近期发布的第一款Copilot+PC,也就是最新的Surface系列,首发搭载的正是高通基于Arm架构的处理器。 随即在AI PC概念的基础上,还专门产生了一个更加细分的名词——WoA AI PC,即Windows on Arm。 在微软Build大会上,微软特别提到一组数字——现有Arm PC应用程序中,有87%都是原生的Arm版本。除了Microsoft Office、Dropbox、Zoom、Adobe套件,越来越多的主流应用正在成为Arm原生应用。 摩根士丹利在近期的研报中指出,WoA AI PC趋势可能会重新洗牌全球PC半导体供应链。报告预计,到2027年,WoA AI PC的芯片出货量将达到5000万件,较市场预期高出60%。此外,根据Arm高管的预测,Arm在Windows PC领域的市场份额也在加速扩大,在未来五年内可能会超过50%。 Arm CPU在Windows PC的市场份额,图片来自摩根士丹利 4.既是今天的计算起点,更是明天的计算支点 CPU可能是当前阶段端侧推理的最优解,那么未来呢? 随着端侧推理的需求越来越高,所需处理的任务日益复杂,数据量也不断攀升。当GPU以其出色的并行计算能力稳坐云端AI算力的宝座时,AI芯片市场的竞争愈演愈烈。其中NPU作为一种关键的技术支撑,以其优秀的能耗比,也在悄然崭露头角,成为实现AI大模型在终端设备上运行的关键。 NPU全称为Neural Processing Unit(神经网络处理单元)。从名字就可以看出,它专门针对神经网络进行设计与优化,能更加高效地运行Transformer架构的AI模型。 随着AI手机、AI PC概念的普及,NPU的重要性也日益凸显,它可以在视频、图像、系统管理等各类场景中发挥出色的AI加速能力,解决日益增长的终端推理需求。 本届微软Build开发者大会上,微软甚至专门定义了AI PC的入门门槛——只有配备性能达到40 TOPS的NPU,才能被称为AI PC。 回看国内市场,中国最大的芯片IP设计厂商安谋科技在成立之初就已布局AI赛道,并在2018年发布了首款本土自研的“周易”NPU。经过多年发展,“周易”已相继推出了多款迭代产品,满足多样化计算需求。 其中,“周易”X系列主要面向ADAS、智能座舱、平板电脑、台式机和手机等应用场景提供更高的算力,最高可达320Tops。同时,“周易”NPU针对端侧大模型场景也进行了专门的升级优化,据悉下一代“周易”NPU将会适配国内外多个主流的开源大模型方案,覆盖硬件及其配套的软件工具。 需要明确的一点是,虽然都能解决AI需求,但NPU、GPU与CPU并非替代关系。三者通常是集成在一起,形成“CPU+GPU+NPU”的异构计算组合,每个处理器擅长不同的任务。CPU擅长顺序控制和即时性,GPU适合并行数据流处理,NPU擅长标量、向量和张量数学运算,可用于核心AI工作负载。 这种异构计算的组合方式,能够实现最佳应用性能、能效和电池续航,以最大化发挥生成式AI终端用户体验。 今天,异构计算已经成为芯片公司布局市场不可或缺的一环,好为未来端侧推理市场的爆发做好准备。 例如,安谋科技结合了Arm CPU、GPU等通用计算单元与本土自研的NPU专用计算单元,打造了一体化、高质量的异构计算IP平台,支持并推动芯片公司在异构计算领域的创新。 安谋科技的异构计算平台,图片来自安谋科技 安谋科技市场及生态副总裁梁泉认为,未来端侧AI应用要迎来爆发,不仅需要以高端的异构计算平台作为样板落地,更要在大众的终端设备上快速普及。 他表示:“Arm CPU作为普及率最高的计算单元,已经完全可以胜任合适规模的端侧生成式AI计算,且有着极其平衡的能效。配合全新的Kleidi软件,以及Arm持续更新的CPU技术和CSS方案,接下来将成为端侧AI快速普及的核心平台。同时,安谋科技投入研发的‘周易’NPU已历经六年深耕,目前产品将迎来新一轮的迭代升级。在国内市场,我们提供灵活且丰富的计算平台及方案组合,与芯片客户、终端厂商及生态伙伴共同推动端侧AI的高速发展。” 当前,国内外已有很多GPU和AI芯片企业在云端开展大模型相关工作。但在边缘端与终端,还没有一个成熟、统一的硬件平台能够支撑大模型部署到手机、PC或机器人等设备上,因此市场潜力巨大。 但不论市场如何变化,CPU的重要性都无可替代。Arm终端事业部产品管理副总裁James McNiven在接受采访时表示,不论CPU还是GPU,即便有AI专用加速器,仍需要计算基础,正如CPU支撑万物。 纵观当前端侧推理的存量市场,CPU是端侧算力的最优解,也是实现端侧推理的起点;而在未来端侧推理的增量市场,在CPU、GPU及NPU组成的异构计算平台中,CPU又是支撑万物计算的支点。 如何有效释放CPU在端侧推理的能力,或将成为决定端侧大模型落地竞赛的赛末点。
德国机器人产业面临中国厂商激烈竞争,销售前景承压
IT之家 6 月 18 日消息,据路透社报道,德国机械工程行业协会 (VDMA) 表示,来自中国的竞争正给德国机器人产业带来压力,而该行业在疲软的国内经济形势下订单已经出现下滑。 图源 Pixabay VDMA 机器人与自动化部门负责人弗兰克・康拉德 (Frank Konrad) 周一表示:“竞争非常激烈,许多中国供应商已经在国内市场站稳脚跟,并正积极进军欧洲市场。” 以强大的工程能力和技术创新著称的德国,如今却正面临经济下滑的局面。高昂的能源成本、利息上涨以及繁琐的行政审批程序导致的投资不足,都加剧了这一局面。 康拉德指出,海外订单是德国机器人和自动化行业增长的主要动力。今年前四个月,德国国内订单同比下降 15%,而同期海外订单则增长了 21%。 该行业的重要参与者包括由中国控股的工业机器人制造商库卡,以及西门子公司(Siemens AG)的工业自动化业务。 根据路透社获得的数据,VDMA 将该行业今年的销售预期下调了一半。他们预计 2024 年的销售额将仅增长 2% 至 165 亿欧元(IT之家备注:当前约 1285.83 亿元人民币),基本与去年持平。 相比之下,2023 年,得益于疫情后订单的回升,该行业销售额增长了 13%。康拉德补充说,今年迄今为止的销售业绩仍受益于去年强劲的订单量。
英伟达急了,准备应对最坏情况
作者 | 荣智慧 编辑 | 向由 “中国特供”人工智能芯片开局不利,英伟达大幅下调价格。 去年年底,英伟达推出三款为中国量身定制的芯片。此前,美国不断抛出制裁法案,明令禁止其出口最先进芯片。 三款芯片中,H20性能最强大,但一直“卖不动”。如今,H20对标华为昇腾910B降价——比后者价格低10%。 6月起,拳打谷歌、脚踢苹果的英伟达睥睨群雄,一年内市值疯涨2万亿美元,排名仅次于微软,碾压所有其他芯片公司。英伟达的市值,等于台积电、三星、英特尔、超威、高通与阿斯麦之和。 然而,此次“秘密”降价让英伟达显得不那么高傲,毕竟中国市场为它贡献近20%的收入。 有分销商为了卖英伟达GPU,甚至打起了人气游戏《黑神话:悟空》的主意。 巨头也得打价格战 5月底,英伟达下调中国特供芯片价格,H20芯片的价格比华为昇腾910B便宜10%以上。 英伟达中国特供芯片共有三款,分别是HGX H20、L20 PCIe和L2 PCIe,均从H100基础版修改而来,以符合美国芯片出口条款的新规定。 过去两年里,美国三度加码,细化对华芯片出口管制政策。2023年底,英伟达推出如上三款“阉割版”芯片。今年3月30日,美国出口禁令宣布“逐案审查”规则,全面限制英伟达、超威等先进产品向中国销售。 H20没有受到限制,它在三款芯片中性能最强,卖得却不好。 2023年底,H20定价和华为竞品差不多。到2024年2月,H20每张定价约为1.2—1.5万美元(约8.6—11万人民币),已经略低于华为昇腾910B约12万元人民币的售价。 华为昇腾910芯片(左) 中国服务器分销商出售H20的价格为10万元人民币,八卡服务器售价约为110—130万元人民币;销售华为昇腾910B的单价为12万元人民币,八卡服务器售价约为130—150万元人民币。 另外,今年第一季度有一部分被囤积的芯片开始流入市场,价格亦有所回落。像H800的八卡服务器,从高峰期的320万元人民币,降到不到290万元,而且供应相对充足。 形势比人强。H20芯片从5月底开始会在华为昇腾910B的价格上“打九折”,也就不奇怪了。 据消息人士称,华为昇腾910B在某些关键指标比如FP32上优于H20。 FP32也称“单精度浮点格式”,是一种计算机数字格式,用来表示数值的宽动态范围,也是衡量芯片处理任务速度的标准。而H20的FP32性能,还不到对手的一半。 H20的互联速度更好。假如客户需要把大量芯片连接一起,作为一个系统应用,H20的表现优于对手。 可以说,H20的命运意味着英伟达中国业务的命运,然而其命运已经蒙上阴影。 华为今年将大幅度增加昇腾910B的出货量,单卡价格在7万元人民币左右,牢牢卡住优势位置。同时,中国公司也越来越倾向于大量采购国货,放弃食之无味的H20。 也可以说,“英伟达最怕的不是少了中国市场,而是中国的市场体量可以培育出一个可怕的竞争对手。” 最怕巨头全都要 就此说华为超越英伟达,肯定是不客观的。 英伟达GPU产品有一个序列,华为昇腾910B所对标的产品,应放到这个序列中对比。 H100、H200和B100,是英伟达当家GPU产品。以上三种芯片,包括2020年的A100,都受到美国芯片出口管制条款的限制,不能出售给中国企业。 业内普遍认为,昇腾910B和A100性能接近。但是,A100只是两年前的产品,在A100之后,每一代新产品的性能都是上一代的两倍多。 H100性能,是A100的2倍以上。H200性能,是H100的2倍以上。B100性能,又在H200的2倍以上。 以此计算,市面上英伟达主流产品B100(Blackwell)的性能,是A100的8倍多,也就是昇腾910B性能的8倍多。 英伟达预计B100的性能“望不到头” 英伟达首席执行官黄仁勋最喜欢举这个例子:“训练一个1.8万亿参数的GPT模型,如果用Hopper(H200)做,可能需要8000个芯片,但如果你用Blackwell,只需要2000个就够了”。这仅是算力方面的差距。 而且,6月2日的中国台北国际电脑展,黄仁勋的演讲再一次长达两小时。他不仅再次重申Blackwell是“世界上有史以来最强大的芯片”,还公布了更强大的芯片、下一代“芯王”Rubin——名字来自美国天文学家Vera Rubin。 Rubin问世之前,Blackwell的加强版Blackwell Ultra将在2025年落地。 这场演讲比较全面地透露了英伟达的布局和野心:从下至上,从芯片到应用,“我全都要”。 AI芯片只是芯片层的一部分,除了Hopper、Blackwell系列,英伟达还有自动驾驶芯片、游戏芯片和机器人芯片。 英伟达汽车芯片 芯片层之上,是云计算层,分为公有云和私有云。其上有计算机层,是Eos人工智能超级计算机。 计算机层上是数字孪生层,有3D设计协作平台Omniverse和数字地球Earth-2。之上是模型层,并列大语言模型ChipNeMo和机器人大脑模型Project GROOT。 再往上就是应用层,英伟达有产品NIM,也叫生成式AI助手定制服务。 这套无所不包的全方位打法,配合热情高涨的华尔街投资,鲜有匹敌的竞争对手。对任何挑战者来说,压力都是巨大的。 碰瓷“黑神话悟空” 英伟达第一季度财报显示,由于美国制裁政策,该公司在中国的业务大幅低于过去的规模。 按照“历史经验”,英伟达和AI相关的数据中心业务在中国大陆的收入占比过去长期达到20%—25%。英伟达某高层表示,自2023年10月起,中国大陆在数据中心收入中的比例已降至个位数。 去年财报显示,2023年第三财季,英伟达中国大陆收入高达40.3亿美元,环比大涨47%。出口管制规则出台后,2023年第四财季英伟达中国大陆收入仅为19.5亿美元,环比大降52%。当季,来自中国大陆的收入仅占英伟达总营收的8.8%,是历史最低点。 根据中国市场研究公司赛迪咨询的一份报告,预计到2035年,中国在全球人工智能行业的份额将超过30%。尽管英伟达正在努力抢占中国的芯片市场份额,但前景越来越不确定。 “我们在中国的数据中心收入比10月份实施新的出口管制限制之前的水平大幅下降,”英伟达首席财务官柯莱特·克雷斯说,“中国市场未来仍将保持非常激烈的竞争。” 有分析师表示,“英伟达正在走一条微妙的路线,试图在维持中国市场和应对美国紧张局势之间取得平衡。”“从长远来看,英伟达肯定在为最坏的情况做准备。” 一方面,英伟达的战略正如黄仁勋公开演讲所宣称,极大扩展业务范围,“霸占”数据中心、游戏、自动驾驶乃至人形机器人等热门应用领域,把握住全球市场风向。 黄仁勋在演讲现场与“机器人伙伴”站在一起,并表示机器人时代已经来临 另一方面,对于可能缩小的中国市场,英伟达尽最大努力销售产品,甚至做出比过去更多的让步。 2024年下半年,将有近100万颗H20芯片运往中国,如果要紧跟单价7万元人民币的华为昇腾910B,英伟达的利润空间将受到大幅度挤压。 作为英伟达在中国市场唯一“能打”的产品,H20的售价不到H100的一半,但由于更高的内存容量,其制造成本高于H100。 除去价格战和出货量因素,英伟达H20在中国之外也不好卖。 根据外媒对现有政府采购数据的调查,过去的半年里,只有5个国家或国家附属机构有意向购买H20,但华为昇腾910B的买家有十几个。 关键是,不光AI芯片不好卖,连显卡都不好卖了。分销商不得不各出奇招。 为了推销英伟达显卡,有公司打出买显卡送动作角色扮演游戏《黑神话:悟空》的口号。6月18日前,只要购买英伟达GeForce RTX4070、4080、4090显卡或电脑,即可免费获得该游戏的数字密钥。 《黑神话:悟空》 《黑神话:悟空》是中国国产3A游戏的希望,自2021年首次公布实机演示片段以来,已经成为中国游戏玩家眼中最具民族代表性的游戏。 该游戏将于8月20日发售,简体中文PC版为268元。首批国内预售大幅度超额——限量1万套、价格为1998元人民币的豪华实体收藏版,预约人数高达11万。 然而,《黑神话:悟空》的玩家对英伟达显卡并不“感冒”。原因很简单,为了200多元的游戏,买5000多元的显卡,相当于为了一碟醋包一顿饺子,“不值”。
疯狂点餐遭解雇?麦当劳AI员工翻车视频全网疯转
原标题:点冰淇淋下单25份麦乐鸡,麦当劳AI员工疯狂点餐惨遭解雇,翻车视频全网疯转 麦当劳宣布其与IBM合作进行的得来速人工智能语音点餐技术测试期结束,该技术已在100多家餐厅部署,这些餐厅将在下个月暂停此项服务。麦当劳表示,将会为自动点赞技术寻求新的合作方,潜在的合作伙伴可能包括OpenAI的Whisper/ChatGPT和谷歌的Gemini。 生成式人工智能的出现本应会摧毁包括餐饮业在内的各行各业的就业机会。 事实证明,现在还为时尚早。 麦当劳正在从100多家得来速餐厅中移除人工智能点餐技术,这标志着这项与IBM的合作没有通过「试用期」。 该公司告诉特许经营商,「不迟于2024年7月26日,将终止与IBM的人工智能得来速订购合作关系」。 AI点餐员之所以被炒鱿鱼,实在是因为翻车视频有点多,AI版的得来速引发的点餐事故在TikTok上疯传——顾客明明点的水和冰淇淋,结果却收到了番茄酱和黄油包,或者是25份麦乐鸡莫名出现在账单中。 惹得顾客惊呼「The McDonald’s robot is wild!」 尽管如此,麦当劳对未来的人工智能解决方案仍然保持乐观,人工智能点餐服务不会就此作罢,而是「另请高明」,公司计划在今年年底前探索替代语音订购系统。 不过,对于麦当劳AI点餐助手的翻车,Ethan Mollick火速澄清,不能让LLM背锅!因为背后的技术支撑「并不是基于LLM,而是基于较旧的NLP技术」。 积极拥抱AI的麦当劳 麦当劳得来速(McDonald’s Drive-Thru)是麦当劳推出的一种快餐服务模式,允许顾客不必离开汽车便可完成点餐、支付和取餐的整个过程。 我国第一家得来速餐厅于2005年12月10日开业,截至2023年,国内已经有超过660家得来速餐厅,网友戏称得来速为「打开新麦门」。 在网友的玩梗创作中,麦当劳变为了一种信仰,「麦门」代表麦当劳+金拱门,是麦当劳忠实门 徒的简称。 作为一个影响力巨大的餐饮业巨头,麦当劳建造了自己的麦氏帝国,其引发的标准化革命影响了食品加工、厨房设备乃至美国农业的主要模块,甚至有人称之为整个社会的「麦当劳化」。 在人工智能飞速发展的今天,麦当劳自然不甘落伍,率先进行AI化。 2019年,麦当劳控制了人工智能语音公司Apprente,创建了McD Tech Labs。 2021年,麦当劳与IBM建立合作伙伴关系,McD Tech Labs被IBM收购,麦当劳和IBM在测试期间开发并部署了人工智能点餐技术,以「确定自动语音订购解决方案是否可以简化工作人员的操作,并为我们的顾客创造更快、更好的体验。」 愿望虽然美好,可是新系统在准确性方面面临重大挑战,让顾客大失所望。 麦当劳首席执行官Chris Kempczinski于2021年6月向CNBC表示,语音识别技术在大约85%的情况下是准确的,但大约五分之一的订单必须由人类员工协助。 帮倒忙的「AI点餐员」 去年,得来速顾客艰难使用自动点餐机的视频首次在TikTok上引起关注。 一些顾客表示,该技术是为了「帮倒忙」,导致他们在点餐时感到沮丧和烦恼—— 一名女子试图点水和一杯香草冰淇淋,人工智能系统计算了这些物品,但错误地在她的订单中添加了四包番茄酱和三包黄油。 在另一段视频中,一名TikTok用户表示,她只点了一大杯冰甜茶,但人工智能技术却添加了九杯到订单中。 还有两位女士被AI点餐系统笑得前仰后合,因为系统疯狂地将价值数百美元的麦乐鸡放入了她们的账单中,根本停不下来。 麦当劳的AI革命仍将继续 尽管遇到挫折,麦当劳仍然对语音订购解决方案的潜力充满信心。 该公司表示,与IBM的合作提供了宝贵的经验,并将继续探索长期、可扩展的解决方案。 麦当劳的目标是在今年年底前就替代语音订购系统做出明智的决定,潜在的合作伙伴可能包括OpenAI的 Whisper/ChatGPT和谷歌的Gemini。 当然,麦当劳也没有抛弃老朋友,帮IBM挽尊,「事实证明,这项技术具有业内最全面的功能,能够在一些最苛刻的条件下快速而准确地工作」,「我们期待继续与他们(IBM)在各种其他项目上合作」。 还特别补充道,「IBM目前还在与几家对AOT(自动订单处理)技术感兴趣的快餐餐厅客户进行讨论和试点」。 麦当劳+人工智能=快餐的未来 不止是自动订单处理,麦当劳一直处于新技术应用的前沿。 不再只是巨无霸(Big Macs)和开心乐园餐(Happy Meals),而变成了大数据(Big Data)和快乐机器人(Happy Bots)。 该公司推出了人工智能菜单板、移动点餐、店内信息亭,甚至尝试了无人机送货和厨房机器人。 去年12月,麦当劳与谷歌达成协议,创建一款名为「Ask Pickles」的聊天机器人,能够就如何清洁餐厅设备等问题对员工进行培训,两家公司还同意致力于开发生成式人工智能的其他潜在用途。 估计麦当劳会在全方面拥抱AI的道路上坚定地走下去。 餐饮界也掀起AI热潮 麦当劳并不是唯一一家追求人工智能驱动解决方案的公司。 Wendy’s、White Castle、Carl’s Jr. 和Hardee’s等其他快餐连锁店也在尝试人工智能驱动的得来速系统。 尽管对订单准确性的担忧仍然存在,但这些公司为了实现任务自动化并提高效率,都不会对新技术坐视不理。
不能上网的笨手机,怎么突然火了?
这是索尼的高解析度音乐播放器——NW-WM1AM2,俗称「黑砖」。能听高品质音乐,像手机但不能打电话,和更大众的 MP3 相比,它确实大了点。 这是另一块黑砖,看着像一台播放器,但它真的是一台手机,能听音乐也能打电话。和当下流行的智能机放在一起,它小了点,比例也有点「失调」。 在小屏手机快要消失,但依然有一大批小屏爱好者呼喊 mini 快回来的 2024 年,手机公司 Light 像是听到了小众的心声,推出了旗下第三代机型 Light Phone III。 更加激进的是,他们不仅把屏幕砍了,还试图把智能从手机中分割开来。 失去彩色的「笨手机」 你很难想象,这是一台诞生在 AI 手机元年的设备。 和主流智能机相比,Light Phone III 最明显的不同是,去掉了硕大且彩色的手机屏幕,取而代之的,是一块 3.92 英寸黑白 OLED 面板。 虽然看上去这就是一块墨水屏,和 Kindle 阅读器的那块屏幕几乎一样。 的确,上一代 Light Phone 用的是电子墨水屏,这和 Light 的成立主旨高度一致:用最简单的零件做最简单的机器。 尽管电子墨水屏有一定的先天优势:护眼,低电耗,更适合长时间使用。可有超过 50% 的老 Light Phone 用户反映,没办法习惯如此低的刷新率,本就没什么功能的机子在墨水屏的「加持」下,更加难用。 许多用户的弃坑也使得 Light 在三代机上启用了更加符合这个时代的 OLED 屏。 Light Phone III 的屏幕分辨率不高,仅为 1080 x 1240,不过屏幕刷新响应的速度很快。 一方面,更好的屏幕能让许多曾经的粉丝考虑重新入坑,另一方面,也降低了想要尝试 Light Phone 的智能机用户的使用门槛,起码在屏幕观感上,Light Phone 不会和智能机拉开太大的差距,产生极强的割裂感。 Light Phone 在官网的介绍中写到: 它不具备互联网、社交媒体、新闻、电子邮件或任何诱饵式的无限功能。 它没有内置也不能下载任何一个常用的应用,虽然设备能连 Wi-Fi,但不能上网。 连儿童手表都在 All in AI 的时候,Light Phone III 却回头向功能机看齐:打电话、发短信、放音乐、定闹钟、计时器、地图导航和语音备忘录,这几乎就是 Light Phone 能做到的所有。 从某种程度说,Light Phone 甚至还不如一台能砸核桃的诺基亚,因为这套系统里连贪吃蛇之类的小游戏,都被拒之门外。 但 Light 在前两代机型上还是积累了些经验——用户想要的极简,是简单,不是简陋。 因此,在 Light Phone III 在上一代设备的基础上,加入了非常多这个时代「本该有」的手机配置。 从外观来看,Light Phone III 增加了当下流行的金属中框,和前两代机型的全局塑料比起来,金属总能给手机带来一点高级感,也更抗造。 另外,三代机型上还配备了: USB-C 2.0 降噪麦×2 立体声扬声器×2 1800 mAh 电池 指纹识别 手电筒 NFC 和 5G 芯片 如果把上面的这些配置都放在第二代 Light Phone 上,你出门还是会有些慌张,因为没有摄像头的手机真的很不方便,即使你我都能舍去拍照录像、记录生活点滴的习惯,但点餐下单、扫码付款总还是需要一颗镜头,这也是二代机被诟病最多的缺点之一。 因此,知错就改的 Light Phone III 就加上了镜头,前置 50mp,后置 8mp。它既可以扫码,也可以视频,用它拍照虽然比不上主流手机,但有一种用 CCD 拍出老照片的质感。 更惊喜的是,虽然屏幕是黑白的,但照片导出后,是彩色的。 这些小功能单拎出来都不算什么重大更新,但把它们放在一起,而且是放在一台极简风的手机上时,这家公司的意图就十分明显了: 他们希望 Light Phone 能成为一台独立设备,而不是备用机,即使你出门只带着它,也不会担心和这个世界脱节。 Light Phone 的归园田居 Light 创始人 Joe Hollier 和 Kaiwei Tang 称,他们和团队一起: 打造了一款功能极少,且几乎可以永久使用的手机。 能永久使用的 Light Phone III,并不是说所有零件都耐用,而是便于拆卸的设计,让它易于更换电池和其他零部件,所以才说这款手机可以使用多年。 无论从哪个角度看,Light 的三代机,都有一种过去与现在交错的「拧巴感」。 和 1GB+8GB 的 Light Phone II 比较,Light Phone III 的内存组合升级为了 6GB+128GB,本就不多的功能加上更大的内存存储,三代机的确耐用了不少。 当然,Light Phone III 799 美元(约合人民币 5800 元)的价格也比上一代(299 美元)贵了将近三倍。 不过官网目前的预售价为 399 美元(约合人民币 2895 元),打了五折。从对半砍价格不难看出,Light 急需一批尝鲜的用户,并且成为极简手机模式的粉丝。 可是,Light Phone,或者说极简手机,真的行得通么? 2014 年,Joe Hollier 和 Kaiwei Tang 在一个 Google 实验项目中相识,他们最初被安排的工资是制作智能手机应用程序,在更深层次上学习了不同产品的构建、资助方式和背后的因果关系。 本应潜心钻研手机 Killer App 的二人组,最后却合作成立了 kill the App 的公司——Light。这种叛逆感,也完美在每一代 Light Phone 中体现。 他们希望借助自己对产品的理解,让现代人脱离手机通知的骚扰,重新回归到自己的现实生活中。 在 Hollier 和 Tang 看来,LightOS 在设计之初,有两个核心的概念: 世界最不需要的就是另一个争夺我们注意力的智能手机应用程序,因为这些广告驱动平台的兴趣和性质永远不会与我们的实际生活质量相符。 我们的使命就是让人们重新拥有他们最宝贵的财富——注意力。 Light Phone 也就是在这样的概念下初见雏形。 手机脱敏计划的第一步,就是要减少设备对人的吸引和诱惑,所以从第一代 Light Phone 开始,一切可能会分散用户注意力的「非必要」功能,都没能出现在这款极简手机上。 Light Phone I 应该是三代机型中,最激进的一个。不仅没有 App,就连最基础的音乐、蓝牙、短信功能都没有,这块 mini 像素屏,只能显示时间,手机唯一的对外功能,只剩接打电话。 说它是一款产品,我更愿意把它看成一个概念,是 Light 为日后走向更广泛市场打下的基调,虽然销量平平,但也引起的讨论不小,当时市面上还出现了仿制 Light Phone I 的山寨机。 Light Phone II,在一代建好的毛坯房里,搞了点装修,但不多: 2.8 英寸的 E-Ink 电子墨水屏幕,78g 的小巧机身,能收发短信,计算器、闹钟、音乐、导航和叫车服务等功能也陆续在二代机上出现。 但是,第二代 Light Phone 仍然很激进: 原本我们觉得摄像头是一个很好的工具,但它存在「诱导性」,即人们会习惯将自己拍下的东西传到社交网络上,再去看自己获得的点赞数,所以我们决定去掉。 至此的两代机型,哪怕放在它们发布的那一年,对「极简」的追求都略显夸张,和时下流行的手机放在一起,Light Phone 给人一种与世隔绝的感受,可惜去的不是桃花源,而是监狱。 这种被迫被剥夺一切的实际体验,使许多想要尝试的用户望而生畏,它们不属于这个时代,也不属于大多数人。 但即使是这样疯狂的产品,Light Phone 的前两代产品,仍然卖出了 10 多万台。 极简手机有市场,但如此极简的 Light Phone 想要更进一步,还得继续深挖:这群小众的用户到底需要什么? 使人离不开手机、让人对手机成瘾的,是手机里的各种 App 而并非手机本身,所以这种把软硬件一刀切的做法,不仅误伤了自己,也失去了许多对 Light 感兴趣的人。 原因很简单,拿着一二代的 Light Phone 出门,很多事你根本做不了,本来是要和脱敏手机,现在搞不好要和社会断绝关系了。 所以,Light Phone III,才是当初设想的完全体。 它既给你提供了远离 App、极简生活的可能,又能在到处都需要手机的环境里,不至于让你和这个世界断开连接。 这两年,声称能够戒掉手机瘾的「自律神器」很受考公考研党,以及轻生活爱好者的欢迎。 把手机放在盒子里设置好时间关起来,就没办法在倒计时结束前,拿出手机刷视频、刷微博分神了。 虽然神器宣称「整个使用生命周期只能暂停两次取出手机,用完了就只能等计时结束,不然打不开」,但这里面有两个很明显的 bug: 只要想打开,谁都阻止不了; 自律神器只是中介和辅助,最后靠的还是自己。 手机的健康屏幕使用时长、学生群体中很火的番茄时钟,包括 Light Phone,也都是如此。 想着靠一台手机、一个软件,甚至一个盒子让自己走向自律人生,还是有点痴人说梦,所以这类设备最大的意义在于:当你想要改变一些生活习惯或是生活现状的时候,它们会是一些不错的工具。 就像 Light Phone III 的广告语一样: 无论您是梦想着摆脱数码产品,还是想更多地关注您的孩子,或者正在购买您的第一部手机,Light Phone III 都是一款让生活更美好的工具。
苹果的 Apple Intelligence,为什么要这样设计新 Siri?
苹果的审美,也有被吐槽的一天。 上周的 WWDC,AI 生成的卡通图片,就算是演示也丑得肉眼可见。 ▲ 左:Apple Intelligence,右:新版 Siri 同时,Apple Intelligence 和新版 Siri 的炫彩 logo,也引起了一些质疑:怎么和微软 Copilot 神似?乔布斯当年的话还言犹在耳:微软唯一的问题是他们没有品味。 ▲ 微软 Copilot 换种高情商的说法,这次微软和苹果是英雄所见略同,都挺好。 AI 产品越来越多,也离我们越来越近,科技公司们都在绞尽脑汁地想,怎么用设计传达,这个产品被 AI 赋能,用户正在和 AI 功能交互。 目前,答案大致可以分为两派,一种像苹果、微软这样,更加丰富、多彩和圆润,一种像 OpenAI、Perplexity,更简单的颜色,更抽象的形状,更有高级感。 友好,友好,还是特么的友好 每天和你相处的 AI,你有注意它们长着怎样的「脸」吗? 之前我们写过一篇 AI 产品为什么喜欢拿「四角星」当 logo 的文章。 背后原因主要有两个,一是,「四角星」有 bling bling 的效果,让人觉得亲切和喜悦,二是,「四角星」可以引申到「魔法」,体现技术的神奇,同时略过技术的黑箱,一键使用某个功能,事情就能解决。 新版 Siri 似乎有着类似的觉悟,未来,我们拿着 iPhone 15 Pro 及以上手机和它交互的时候,屏幕边缘会亮起一圈彩色的光芒,同样有些「魔法」特效的味道。 过去的人类不理解电,将暴风雨时的电弧称为魔法。当 AI 同样不可名状时,用魔法的比喻反而更容易为人接受。 从这个角度上说,logo 不负责解释 AI 是什么,而是塑造 AI 带给用户的感觉。越陌生的概念,就越应该以平易近人的姿态接近。 所以,我们可以看到,虽然各家 AI 产品 logo 的设计风格不大一样,但基本的思路还是共通的——友好、日常、包容、人性化…… 有的凸显色彩,微软 Copilot,柔和的糖果色,天然有亲和力,对应自身的 slogan——「你的日常 AI 伴侣」。 有的勾勒形状,Meta AI,用渐变的圆圈,体现 AI 助手比以往更快、更智能、更有趣,流转在扎克伯格的社交产品宇宙里。腾讯的元宝,也是「圆滚滚」的模样。 甚至还可以拟人,抖音旗下的豆包,名字取得接地气,logo 用的也是可爱的 3D 卡通女性头像,定位就像抖音一样,老少咸宜,适合对 AI 感兴趣但不了解的大众。 除了推出新的 logo,苹果还在 WWDC 玩了文字游戏,对「AI」旧词新解,把 Artificial 改成 Apple。 但道理还是那个道理,苹果智能听起来比人工智能温暖,不关联冷色调的电路、芯片、机器。 总之,AI 不能是科幻电影里的反派,比如《2001 太空漫游》的「红眼」HAL 9000。 每个 logo,都在讲一个故事 也有唱反调的声音说,这些设计都太幼稚了,像儿童动画,不够严肃和专业。 各花入各眼,OpenAI 和 Perplexity 是另外一种风格,更侧重展现产品的专业性和 AI 的可能性。 Perplexity 的 logo,像一本打开的、翻不完的书,切合 AI 搜索作为互联网门户的定位,又突出 Perplexity 自身的特点——搜索、总结、通过引用来源的方式尊重事实…… 同时,Perplexity 把界面包装得像淡黄色的纸张,有意和传统的科技产品区分。情商超高的聊天机器人 Pi 也是这个风格,将聊天塑造得像笔友相互写信。 OpenAI 的 logo 则是个风格化的六角形,也像一个漩涡,和通义、DeepMind 有共同语言。 我请 GPT-4 解释一下含义,它的答案是,这个 logo 用交织的图案、相扣的线条,象征着 AI 与人类的协作和联系,以及 AI 的复杂本质,传达出和谐、平衡和创新的感觉。 尽管还是很抽象,但已经比几年前像用 Word 随手打出来的 logo 好多了。 OpenAI 的网站也包装得有模有样,之前是抽象的 AI 生成图片,配合浅景深的暖色调人像摄影。 最近又进行了微调,用类似油画的风格装点门面,显得更加文艺范儿。 其实,OpenAI 的整体视觉风格是 2021 年底请了创意机构重新设计的。 这个时间点很微妙,2021 年初,OpenAI 发布了文生图模型 Dall-E,并且计划在 2022 年发布 ChatGPT。他们必须拾掇一下自己的企业形象,站上舞台面向大众了。 所以,OpenAI 的总体改造思路就是「既要又要」——既要展现人性化的色彩,也要清楚传达人工智能的概念。 很有意思的一点是,从书本到艺术,OpenAI 和 Perplexity 的人文色彩都带点「复古」。 如何带给用户舒适和安全的感觉,直观的色彩、形状、拟人化是一种方式,而怀旧也行之有效。 这种「怀旧」也体现在产品的使用方式上。 Perplexity 长得就像传统搜索,你知道怎么输入查询,OpenAI 为 ChatGPT 设计的对话界面,简单性高于一切,每个交互都不言自明,无需说明书,降低了用户的上手门槛。 logo 并不孤立存在,而是和其他设计一起,服务于用户使用一个产品的美好感觉。 从小众到主流,AI 正在成为产品本身 我们已经习惯用图标指认功能,比如放大镜表示「搜索」,齿轮表示「设置」,三个点表示「更多」,向下的箭头表示「下载」。 然而,目前为止,AI 还没有约定俗成的表现形式。 一方面,AI 是一个太过广泛的概念,当我们说到 AI,有可能在说抖音的猜你喜欢、美图秀秀的 P 图,也可能在说和 ChatGPT 聊天、用 Midjourney 从文字生成图片。 另一方面,从前的 AI 往往是作为一个功能,低调地嵌入产品之中,比如推荐算法、比如 P 图选项。 但现在,AI 自己就是一个独立的产品,以及产品的宣传点,比如 ChatGPT、比如 PS、PR 被生成式 AI 加成的一系列功能。 AI 一直都存在,但我们从未像现在这样明确地感知到。如果是你,会用什么 logo 表示 AI? 北亚利桑那大学社会学家 James I. Bowie,提出过一个非常有趣的发现。 和 AI 有关的美国 logo,上世纪 80 年代就有出现,当时的企业喜欢用抽象的人头,以及埃舍尔式三角形和条纹,凸显智能的概念。特别是其中的条纹,可能是在效仿当时的巨头 IBM。 不过,近十几年来,和人有关的因素减少了,取而代之的是简约的机器人造型,像是从 Android 标志、《机器人总动员》取材的。 如此看来,没有标志凭空产生,或多或少受到了巨头、行业趋势甚至科幻作品的影响。同时,我们解读某个标志,其实也是基于我们对某些元素的既有认知。 不得不说,目前的 AI logo 们,仍然需要刻意地「阅读理解」,如果不加以解释,我们只会觉得「就这」或者「不解其意」。 标志的目的,应该是尽可能清晰和普遍地传达含义,让我们无需依赖文本或语言即可理解。根据这个评判标准,AI logo 里还没有成功的榜样。 反过来看,AI logo 更适合作为一面镜子,让用户了解企业的使命和价值观。那些五颜六色的图标带着一点点讨好的意味,主动地提供情绪价值,不太容易联想到「一夜变天」「抢饭碗」之类的负面词汇。 这是基准测试之外的一种软实力比拼,类似于各家 AI 厂商往哪里投广告,是女性用户多的小红书,学生、打工人多的 B 站,还是中老年也覆盖的抖音。 人靠衣装佛靠金装,为了让更多人愿意用起来,AI 们当然也要考虑,画上一张怎样的皮。
Apple Watch X 即将到来:纤薄机身、更大屏幕,更有全新磁吸表带
2014 年 9 月 9 日,苹果在加州库比蒂诺的 Flint Center 发布了 Apple Watch。这是在乔布斯离世后,苹果的第一个「One More Thing」产品,也是库克时代发布的第一个没有以「i」开头的新品。 转瞬间,十年已经过去。为纪念 Apple Watch 发布十周年,苹果可能会为 Apple Watch 带来重大更新,并将使用「Apple Watch X」来命名。 按照惯例,自 Apple Watch Series 1 开始,苹果几乎总是每隔三代就进行一次大的外观更新。 伴随着 Apple Watch Series 7 的发布,苹果为手表升级了更大的屏幕,还带来了更圆润的机身。直到现在,这一 ID 设计正好迭代了三款手表,同样在暗指着下一代 Apple Watch 将获得外观上的全新变化。 作为 Apple Watch 发布十周年的纪念表款,「Apple Watch X」有望带来「里程碑式更新」。 郭明錤在最新的 Medium 博客中,提到即将推出的 Apple Watch 将迎来全新外观升级。 新的 Apple Watch 会拥有更大的屏幕尺寸,将从之前的从 45mm / 41mm 升级到约 49mm / 45mm。另外,Series 10 还会变得更薄。 另外,郭明錤还补充到,虽然去年最后没有无量产,但经过过去一年多的密集测试,目前 3D 打印的生产效率已有明显改善。因此 Apple Watch 将从今年下半年开始,采用由 3D 打印技术生产的零部件。 至于 Apple Watch Ultra 的下一代产品,郭明錤表示该款机型的规格无明显变化,若生产良率能符合预期,则可能会新增机壳颜色选项,例如黑色或深色等。 「Apple Watch X」将采用更薄设计这一观点,与彭博社的马克·古尔曼(Mark Gurman)上周末报道的内容完全吻合。 在最新的 Power On 时事通讯中,古尔曼表示苹果正在努力对 MacBook Pro 和 Apple Watch 进行「瘦身处理」,并计划让最新款 iPad 成为同类产品中最薄、最轻的设备。 此外,他还在此前的报道中,声称下一代 Apple Watch 将是「迄今为止最大的一次革新」。 目前 Apple Watch 的表带,是通过机身侧面划入来固定连接的。从发布至今,所有的 Apple Watch 都采用了这一设计。这样做的好处是可以兼容不同型号的产品,从初代到 Apple Watch Ultra 的表带均可互相替换。 但这样做也带来了一些负面影响。庞大的表带固定槽无法变动,会占用较多原本可以留给电池和其他部件的位置,这对于手表上寸土寸金的空间会造成一定的「浪费」。 因此,「Apple Watch X」可能会采用一种表带连接系统。据参与开发 Apple Watch 的内部人士透露,Apple Watch X 可能会采用一种新的磁吸表带固定方式,但目前并没有披露太多细节。 新表带的磁吸固定方式,可能会带来更便捷的体验。不过这也意味着现有的 Apple Watch 表带,可能不再与新的「Apple Watch X」兼容。 在健康管理方面,苹果一直尝试在 Apple Watch 上提供血压监测功能。 据彭博社此前报道,下一代 Apple Watch 将首次配备血压传感器。苹果首次实现该功能的关键之处在于,它不会向用户显示确切的收缩压和舒张压读数。 相反,该功能将显示血压随时间变化的趋势,类似于 Apple Watch 目前的体温功能。如果用户的血压呈上升趋势,他们就会收到通知,提醒他们注意这一变化。该功能还会提示用户记录血压飙升时的情况。 美国商标和专利局则在早前也公示了一项苹果的专利,其中就涉及到非侵入式血压测量方法。 苹果在专利信息中称,相较于侵入性测量技术,传统的非侵入性测量血压的方法准确性普遍不高而且在实际测试中存在诸多变量。 但苹果在这一专利中,对非侵入性血压测量方法进行了改进,可以明显提高准确度。另外还有消息称,苹果仍在开发一个能提供准确血压数字的系统,但「这些改进仍遥遥无期」。 Apple Watch 即将推出的另一项功能,是睡眠呼吸暂停检测。这项功能最快将于今年推出,其工作原理与 Apple Watch 的其他大多数健康功能类似,将提醒用户可能出现的健康问题,并建议他们接受医生的进一步诊断。 据彭博社报道,Apple Watch 的睡眠呼吸暂停检测功能将监测用户的睡眠和呼吸情况,「以预测用户是否患有这种疾病。 放眼当下,Apple Watch 已经走进了许多人的日常生活。无论是作为饰品还是运动检测设备,Apple Watch 都是十分合适的存在。它不是必须,但是 Apple Watch 带来的「锦上添花」,已经让众多用户感受到了那份喜悦。 十周年之际,Apple Watch 也即将迎来「X」时刻,让我们一同期待苹果会呈现一份怎样的礼物。
谷歌真·AI配音神器来了!自动看懂画面、对齐音频,能为任何视频生成无数音频
编译 | 陈骏达 编辑 | 程茜 智东西6月18日消息,今日凌晨,谷歌DeepMind发布了一个名为V2A(Video-to-Audio)的系统,能根据画面内容或者手动输入的提示词直接为视频配音。它还可以为任何视频输入生成无限数量的音轨。 谷歌DeepMindV2A系统最大的特点就是无需人工输入提示词也可以为视频配音。DeepMind在博客中称V2A能依靠自己的视觉能力理解视频中的像素。也就是说,V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。 自动播放 ▲谷歌DeepMind发布的V2A Demo视频 当然,V2A也能够根据提示词生成所需的音频。使用者可以通过输入“正面提示词”来引导模型输出所需的声音,或输入“负面提示词”来引导其避免出现不需要的声音,这给了使用者更大的控制权。 与其它AI音频生成工具不同,V2A在生成音频后无需人工对齐音频视频,而是可以直接自动将音频与画面对齐。 但谷歌DeepMind也承认,这一系统目前仍然存在很大的局限性。如果输入的视频质量不高,那么输出的音频质量也会出现明显的下降。他们认为需要进一步提升系统安全性并补齐当前V2A在口型同步等方面的短板,才能正式向公众发布这一系统。 谷歌发布V2A没过几小时,语音克隆创企ElevenLabs就发布了文字到音频模型的API,并基于这一API做了一个Demo应用让公众免费使用。 自动播放 ▲ElevenLabs最新应用给Luma生成的视频配音 与V2A不同的是,该应用并不能直接实现画面到音频的转换,而是利用了GPT-4o将视频截图转换为文字提示词,之后再输入文字转在几秒内生成多条与画面内容匹配的音频。这是基于该公司5月底发布的文字到音频模型打造的。 一、与自家Veo模型配合生成有声视频,但对复杂画面理解存在缺陷 虽然目前Sora、Pika、可灵以及近期的Dream Machine和Runway Gen-3 Alpha等一系列视频生成模型已经能输出逼真的视频画面,但它们生成的视频都是没有声音的。 AI工具也可以直接生成质量尚可的音频。AI创企Stability AI发布的Stable Audio Open模型可以输出长达47秒的乐器演奏片段,语音克隆初创公司ElevenLabs发布的音频生成工具可以根据用户输入的提示词生成音频。然而,目前没有工具可以全自动将视频与音频相结合,为AI生成的视频配音将是让AI视频变得更为真实的重要一步。 谷歌DeepMind推出V2A系统就是为了解决这一问题。谷歌DeepMind的博客中写道,V2A可与谷歌自家的Veo等视频生成模型配合使用,直接生成有声音的AI视频,V2A也可用于历史档案画面配音、无声影片配音等领域。 在下方的视频中,V2A展现出了对画面和提示词的超强理解能力。配乐营造出了提示词中紧张的恐怖片般的氛围,且音频与视频几乎完全同步。脚步声基本符合人物走动的节奏,随着画面的切换,脚步声也瞬间消失了。 自动播放 ▲音频提示词:电影风、惊悚片、恐怖片、音乐、紧张、氛围、混凝土上的脚步声 在下方的这则视频中,V2A生成的音乐婉转悠扬,配乐后的视频颇有西部大片般的感觉。 自动播放 ▲音频提示词:草原上夕阳西下时,悠扬柔和的口琴声响起 谷歌DeepMind发布的Demo视频中也出现了不少破绽。下方的视频是一位鼓手在演奏架子鼓。而V2A生成的第一秒音频还相对符合画面中的演奏节奏和所击打的鼓,然而后面的音频却出现了不属于这一画面的声音。画面中鼓手一直演奏的是架子鼓中的军鼓,然而音频中却出现了击打架子鼓其它部分(嗵鼓)的声音。这显示出V2A对复杂画面的理解尚存在缺陷。 自动播放 ▲音频提示词:音乐会舞台上的鼓手,周围环绕着闪烁的灯光和欢呼的人群 V2A还有一个特点就是给了创作者很大的自由。它可以为任何视频输入生成无限数量的音轨,还可以给模型定义“正面提示”以引导模型输出所需的声音,或定义“负面提示”以引导其避免出现不需要的声音。 这种灵活性使用户可以更好地控制V2A的音频输出,让用户可以可以快速尝试不同的音频输出并选择最佳匹配。 自动播放 ▲视频1(音频提示词:空灵的大提琴氛围) 自动播放 ▲视频2(音频提示词:宇宙飞船在浩瀚的太空中疾驰,星星划过,高速,科幻) 上方2个视频是V2A根据同一段视频生成的不同音频效果。只需简单调整提示词,V2A就能迅速给创作者提供风格迥异的音频。 二、采用基于扩散的高质量音频输出,AI给视频加注释辅助训练 谷歌DeepMind的研究人员称,他们一开始尝试了自回归和扩散这两种技术路径,发现基于扩散的音频生成方法为同步视频和音频信息提供了最真实的输出结果。 V2A系统首先会将视频输入编码为压缩表征,然后扩散模型迭代地从随机噪声中提炼音频。该过程由视觉输入和自然语言提示引导,以生成高度符合提示词的音频。最后,音频输出被解码,转换为音频波形并与视频数据组合。 为了生成更高质量的音频并增加引导模型生成特定声音的能力,谷歌DeepMind的研究人员在训练过程中添加了更多信息。这些信息是AI根据视频生成的注释,包括对画面内声音的详细描述和画面中的口语对话的记录。 通过使用视频、音频和附加注释进行训练,V2A系统学会了将特定的音频事件与各种视觉场景相关联,同时还能理解提示词中提供的信息。 博客中写道,V2A系统可以理解原始像素,将文本提示变为可选项。这意味着V2A可以直接看懂视频画面并据此生成音频。这一系统也不需要人工将生成的声音与视频对齐,创作者不需要经历繁琐的调整过程。 尽管目前这一系统已经初具成效,但DeepMind的研究人员认为目前这一系统仍然存在缺陷。它的音频输出质量严重依赖于视频输入的质量,视频中的伪影或失真会导致音频质量的严重下滑。 此外,研究人员还在不断改进系统的口型同步能力,目前V2A在这方面表现不佳。在下方的视频中,虽然V2A只生成了一位小女孩的说话声,但是画面中所有人物的口型都在变化,并且与说话内容并不一致。 自动播放 ▲音频提示词:音乐、对话内容:“这只火鸡看起来棒极了,我太饿了。”(Music, Transcript: “This turkey looks amazing, I’m so hungry.”) 虽然V2A可以按照输入文本生成人物对话的音频,并基本与画面中角色的口型同步。但口型同步的效果与视频生成模型相关,如果视频生成模型没有对口型的能力,口型同步的效果便会大打折扣。 三、ElevenLabs开源视频配音应用,部分效果不如V2A 5月31日,同样在AI声音生成赛道上的ElevenLabs发布了他们最新的AI音频模型,可以通过文本提示生成音效、乐器演奏片段和各种角色声音。 在ElevenLabs发布的宣传片中,他们的AI音频模型展现出了不俗的能力。它能一次生成多段音效供创作人员选择,在口型同步上表现也不错。ElevenLabs认为这一模型在游戏行业和影视行业中有较大的应用前景。 自动播放 就在谷歌DeepMind发布V2A系统后不久,ElevenLabs就上线了他们的文本到声音效果API,并基于API做了一个开源的视频到声音效果的应用。智东西第一时间测试了这一应用的生成效果,我们将谷歌Demo中的视频消音后输入了ElevenLabs的开源应用,让其生成音频。 自动播放 ▲ElevenLabs产品给谷歌Veo生成的视频配音 就这一视频而言,ElevenLabs的应用要逊色于谷歌V2A系统。视频前半部分的脚步声频率基本与画面相符,但在切换镜头后音频就与画面不匹配了。此外,由于不支持人工提示词输入,视频没有配上适合的背景音乐。 ElevenLabs的研究人员称,他们的视频到声音应用在不到一天的时间内开发出来了。该应用自动将视频按照每秒截取四帧的频率截图,并发送给GPT-4o模型,将画面内容转为文字提示词。提示词将输入到他们的文字到音频模型中,模型会生成符合画面内容的音频。 结语:V2A系统尚不对外开放,开发者需要对模型潜在风险负责 谷歌DeepMind目前并不打算向公众开放V2A系统。他们目前在与创作者进行沟通,收集创作者的看法与建议然后进一步优化V2A系统。 谷歌DeepMind强调,他们特别将SynthID工具包(谷歌标记AIGC的特殊水印)纳入到V2A研究中,为所有AI生成内容添加水印,防止滥用该技术的可能性。 ElevenLabs的音频模型和谷歌DeepMind的V2A系统的相继发布,或将给内容创作的生态带来巨大的改变。而正如之前所有AI模型那样,音频生成模型也面临着滥用的风险。这将是摆在开发者面前的重要挑战。
2024Q1国内平板战报:华为增88%、苹果降3%
原标题:2024Q1 国内平板战报:华为增 88%、苹果降 3%、小米增 35%、荣耀降 7%、联想持平 IT之家 6 月 18 日消息,市场调查机构 Canalys 公布最新报告,预估 2024 年中国大陆个人电脑(含台式机、笔记本和工作站)市场预计会缩减 1%,不过会在 2025 年迎来 12% 的反弹。 报告指出 2024 年第 1 季度全球市场已恢复增长趋势,而中国大陆第一季度的 PC 出货量仍然下跌 12%。 台式机和笔记本 联想出货量 272.8 万台,市场占有率为 34%,同比下降 16% 华为出货量 95.6 万台,市场占有率为 12%,同比不变 惠普出货量 69 万台,市场占有率为 9%,同比下降 24% 华硕出货量 62.3 万台,市场占有率为 8%,同比下降 11% 苹果出货量 47.5 万台,市场占有率为 6%,同比下降 21% 平板 AI 不仅推动 PC 市场的发展,也成为平板电脑市场的重要催化剂。尽管第一季度的笔记本和台式机出货量分别下降 13% 和 11%,但平板电脑市场却实现 22% 的增长。 华为继续更新其平板产品组合,推出 MatePad SE 系列的低端产品和 MatePad Pro 系列高端产品。其他厂商则陆续推出新设备和提高效率的 AI 应用(如录音、翻译和笔记 app),来为平板电脑赋能。 IT之家附上主要平板情况如下: 华为出货量 214.1 万台,市场占有率为 29%,同比增加 88% 苹果出货量 195.6 万台,市场占有率为 27%,同比下降 3% 小米出货量 91.3 万台,市场占有率为 12%,同比增加 35% 荣耀出货量 65 万台,市场占有率为 9%,同比下降 7% 联想出货量 64 万台,市场占有率为 9%,同比不变 该机构认为受益于商用领域,尤其是大型国企和地方政府部门的采购需求,2024 年台式机出货量预期将表现良好,同比涨幅达到 10%。 短期内,消费者和私营企业在 PC 等方面的支出仍然保持谨慎,预计全年笔记本电脑出货量将下降 5%。
京东App苹果Vision Pro版曝光:商品可“拖拽”到家中,支持下单购买
IT之家 6 月 18 日消息,在今日的京东 618 媒体开放日活动上,京东宣布,随着苹果 Vision Pro 在国内正式上市,京东.Vision 将作为国内首批发布的 Vision Pro 应用与用户见面。 京东.Vision 首期以家场景为核心,覆盖了多个家电家居与潮流数码产品,后续将逐步拓展至全品类,IT之家小伙伴可以在 VisionOS 的 App Store 搜索“京东.Vision”进行下载和体验。 据介绍,京东.Vision 利用 Vision Pro 的空间计算技术,为用户提供了一种新的购物方式。用户可以通过京东.Vision 直接将心仪的家电家居或数码产品以 1:1 等比例“拖拽”到自己的家中,实现真实预览每件物品在空间中的布局和外观。 负责京东.Vision 开发的京东零售技术人员表示,目前电商购物无论是 PC 还是移动端,都是基于 2D 平面的购物体验,希望通过京东.Vision 为用户带来对商品的三维立体直观感受。用户不用再局限于平面看商品,也不用再等着到货之后才能试搭,而是下单前就可以对商品进行各种角度的放置或搭配,并立体地查看相应的摆放效果,获得一种全新的沉浸式购物体验。 为了进一步提升用户体验,京东还通过把 Vision Pro 技术与京东云言犀大模型技术结合,在京东.Vision 内研发推出了智能导购服务。用户在选购时如果暂时对自己的具体需求不太明确,可通过与智能导购“小萌宠 Joy”的互动,逐步明确需求,并获得越来越精准的内容或商品推荐。 截至目前,京东.Vision 联合三星电视、卡萨帝冰箱、老板电器、哈曼卡顿、MORRORART 等合作伙伴,实现了对场景的内容覆盖。用户通过京东.Vision 选购这些产品时,即可以看到它们在现实空间中的摆放效果。 据京东官方介绍,和淘宝的 Vision Pro 版比,京东 Vision Pro 版更多的是围绕场景进行深度细化。“淘宝的版本只能看,不能购买和交易,但是京东的产品是可以下单的,可以进行交易,价格和手机端也是相同的,未来我们还在研发不同的场景,京东的强势是各个品类的专业度,在日后的细化中,我们希望未来可以让用户体验坐在车里的感觉。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。