行业分类:
加载中...
头条分类:
加载中...
外媒:苹果将在欧盟市场向第三方开放iPhone触碰支付功能
4月21日消息,据外媒报道,近日在《欧洲数字市场法案》的推动下,苹果公司上月发布的iOS 17.4系统为欧盟的iPhone用户带来了与之前大不同的改变。新系统不仅允许用户使用第三方应用商店,还能为Apple App Store之外的应用和服务付费,这一变革打破了苹果生态系统长久以来的封闭性。 这一系列的开放措施并非苹果自愿,而是在《欧洲数字市场法案》的强制要求下实现的。此前,苹果公司的“围墙花园”策略使得第三方很难进入其生态系统,尤其是在使用iPhone的NFC功能进行支付方面,苹果一直将其限制在自家的Apple Pay服务内。然而,这种情况有望在下个月得到改变。 据内部消息人士向路透社透露,欧盟委员会预计将在5月份批准苹果公司开放触碰支付NFC功能的提议。这意味着,未来第三方移动钱包也将能够使用非接触式支付功能。苹果公司在经过四年的反垄断调查后,于今年1月份首次提出这一开放提议。 若欧盟委员会批准该计划,苹果公司或将避免被发现存在不当行为,从而躲过可能高达其全球年营业额10%的巨额罚款。值得一提的是,就在上个月,苹果刚因通过应用商店限制阻碍Spotify等竞争对手的竞争,被处以18.4亿欧元的罚款,这是苹果公司首次受到欧盟的反垄断处罚。显然,苹果公司希望这是最后一次因类似问题受到处罚。 业界认为,此次开放NFC支付功能,不仅是对欧盟法规的响应,也是苹果公司在面临反垄断压力下做出的重大让步。
小米在印度推出红米Note 13 5G系列HyperOS更新
【环球网科技综合报道】4月21日消息,小米公司近日在印度正式宣布,将为红米Note 13 5G、红米Note 13 Pro 5G以及红米Note 13 Pro+ 5G等热销机型推送全新的HyperOS 1.0系统更新。这一系列设备自去年上市以来,便以其出色的性能和用户体验赢得了消费者的广泛好评,原系统基于Android 13及MIUI 14打造。 此次推送的HyperOS更新,以“全面重构”为核心理念,致力于在所有兼容设备上实现性能的优化提升。据小米介绍,HyperOS将通过改进任务调度算法,智能地在多个计算核心之间分配处理任务,从而确保设备能够以最高效率运行。此外,新系统还对底层技术栈进行了深度优化,旨在为用户带来更为流畅的操作体验。 在用户界面方面,HyperOS带来了诸多新颖的设计元素。用户将能够体验到全新的个性化锁定屏幕,控制中心的界面也得到了重新设计,去除了图标标签,使操作更为简洁直观。此外,新系统还引入了交互式通知功能,以及一系列新的应用程序图标和动画效果,大大提升了用户的视觉享受。文件管理器应用也得到了更新,新增了新的分类方式,便于用户更高效地管理手机中的文件。同时,天气应用也加入了新的动画效果,使得查看天气信息变得更加生动有趣。 小米表示,HyperOS的推送将分阶段进行,以确保更新过程的稳定性和用户体验的顺畅。因此,预计所有相关设备的用户将在接下来的几天至几周内陆续收到更新提示。公司强调,此次更新的推出标志着小米在持续提升用户体验方面的又一重要步骤。
问界 M9 推送 V4.2.1.4 更新:华为盘古大模型加持语音助手、新增误踩油门提醒等
IT之家 4 月 21 日消息,据IT之家网友反馈,问界 M9 车型现已推送 V4.2.1.4 版本更新,软件包大小 6.65 GB,新增 / 优化多项功能。 主要更新内容如下: 新增智能交互矩阵大灯情景灯语功能; 新增 ADS 双 3D 视图功能(仪表和中控屏均显示 ADS 3D 视图); 新增后视摄像头清洗功能入口; 新增对侵占车道障碍物主动避让功能; 新增误踩油门提醒功能; 新增盘古大模型加持的智慧助手小艺功能; 新增小艺全车免唤醒功能; 新增语音打开尾灯的感谢灯语功能; 新增语音控制激光投影巨幕系统的开 / 闭功能; 优化 NCA 匝道场景驾驶体验; 优化车屏互联手机反控投影巨幕功能; 优化激光投影巨幕下降受阻语音播报功能; 其他功能项和体验项优化。 AITO 问界 M9 于 2023 年 12 月 26 日上市,共推出四款车型,官方指导价区间为 46.98-56.98 万元,2 月 5 日首批车主正式开启交付。IT之家附问界 M9 主要配置: 问界 M9 长宽高分别为 5230/1999/1800 毫米,轴距为 3110 毫米;风阻系数 0.264,提供 5 款颜色,其中两款纯色,三款双拼配色。 动力方面,问界 M9 纯电版 0-100km/h加速时间仅需 4.3s,增程版为 4.9s,搭载 4 活塞固定卡钳,100-0km/h制动距离仅为 34.9m,最大扭矩分别为 673N・m 和 675N・m。问界 M9 系列搭载猫头鹰增强转向技术,转弯半径仅为 5.8 米。 问界 M9 增程版提供 52 度电和 42 度电版本,CLTC 综合续航分别达到了 1402km 和 1362km,纯电续航分别为 275km 和 225km。 问界 M9 纯电版搭载华为“巨鲸”800V 高压电池平台,充电 5 分钟续航 150km,采用 800V 高压碳化硅高效率电机,CLTC 综合续航达 630km。
刘强东数字人直播常态化,数字人成本低至真人直播的10%
京东的数字人直播正在常态化。4月22日,京东集团创始人刘强东的虚拟数字人形象“采销东哥AI数字人”在京东图书采销直播间进行了直播,也是4月16日和4月20日之后的第三场采销东哥AI数字人”直播。从变化看,本场直播中加入了数字人助理、多机位切换等多种方式,通过和采销东哥聊天的方式增加互动感。 在4月16日的第一场直播中,刘强东数字人取得了不错的效果。对此,京东云言犀算法总监在接受采访时对第一财经表示, “采销东哥AI数字人”首播后,言犀团队收到很多合作意向,不少商家包括大品牌商都主动寻求合作。此外,也有部分企业的CEO计划合作打造数字人直播。言犀算法总监表示,现在直播短视频是大趋势,目前来看,数字人直播带货有很大机会成为一个大的爆点,主要是它在内容层次上达到了一个新的水准,大家的接受度和信任度已经过了关键点了。 成本方面,京东云正在降低商家端的成本以吸引更多商家参与数字人直播。对此,京东云言犀负责人对第一财经表示,对于商家,京东数字人直播的成本目前是商家邀请真人主播直播的10%。从商业化角度看,京东618期间京东云宣布免费开放数字人直播。而从成本看,数字人直播在选品、运营等方面会出现一些额外成本。但在模型成熟的情况下,目前服务器成本不断降低。 数字人直播,如何解决交互提高互动感是重点。对此,京东云言犀算法总监表示,所有用户的问题都会以文字的方式来回复用户。口播则有自己的口播策略,会实时抓取弹幕选一些相对比较有代表性的、有特色的问题去回复。 京东云言犀负责人表示,互动的策略是直播不能经常被打断,以频率看最多可能每三十秒或每半分钟被打断,回复大家比较关注或比较有代表性的问题。选择问题上,京东云一些算法判断是否已重复问,或者与某个商品结合得非常紧密,是否能聊更多有故事性的内容,来选择是否口播回复。 从现阶段看,目前数字人直播的体验还有待提高。京东云言犀负责人表示称,目前从运营角度看,从用户接受度、从表现情况来说,用户接受度还是比较高的。“我也看了很多评论,数字人直播中运营的选品、运营调性的匹配确实很关键。我是做技术的,我们还有第三档没有做到,例如数字人是否能成为一个人的分身,比具有类似理念、思想、知识背景、生活背景,可以更长时间、更深度地与观众侃侃而谈。想象一下,如果这个大V不但只是带货蓝莓,说这个蓝莓好吃,甚至可以和观众聊聊他小时候也种过蓝莓,这样渗透感就更深了。这需要AI的大脑还需要进一步丰富、进一步成长起来,这是我们说的三步走的第一步。” 从应用方向看,数字人领域目前确实更多地是表现出来人机协作共生的价值。目前看,人机接档的直播间数据表现明显优于纯人直播间或纯数字人直播间,有条件的品牌直播间可以关注人机穿插直播模式的价值和团队打造。此外,在货架电商里面,把商品详情转化为视频化内容,发挥数字人直播的价值;并非取代真人,而是与真人接力打造日不落直播间,挖掘闲时直播的价值,目前言犀数字人提高闲时转化率超30%。 从策略看,今年京东计划推出更多数字人主播,上述负责人表示其“采销东哥AI数字人”技术代表京东云现在的通用技术,如果为其他大V或者CEO打造数字人主播可以达到同样的效果。 从行业看,虚拟人行业仍处于蓝海市场。艾媒咨询发布的《2024年中国虚拟数字人产业发展白皮书》显示,2023年中国虚拟人带动产业市场规模和核心市场规模分别为3334.7亿元和205.2亿元,预计2025年分别达到6402.7亿元和480.6亿元,呈现强劲的增长态势。应用场景方面,中国受访者常接触到的虚拟人类型有虚拟主播、虚拟偶像以及虚拟员工三种,其中虚拟主播的受众最为广泛,达81.40%。 艾媒咨询CEO张毅对第一财经表示,从用户需求、技术成熟度、电商行业需求以及政策支持方面看,数字人直播今年大有可为。近年来多个电商平台的头部主播,因为各种因素例如自身问题、薪酬问题等导致平台方和机构方较为被动,行业需要虚拟人来替代过于强势的个人主播。此外,资本的关注和投入也为整个行业提供了机会,能推动技术和应用的快速发展。与此同时,商业模式的成熟受头部企业的推动,例如京东不遗余力地推广数字人直播,其他平台例如百度和阿里也在布局这块业务。随着头部企业的推进,数字人在直播电商、娱乐、教育等方面都会有机会。不仅如此,数字人直播是解决跨境电商时差问题、语言问题、文化风俗问题以及沟通的及时性问题等的好方式。 从挑战看,张毅认为发展数字人直播的挑战主要在于当前数字人主播的互动性和优化用户体验,用户体验包括直播间的个性推荐能力,以及直播间与品牌的合作,能否让观众和高品质产品的互动等要素都十分关键。此外,数字人直播在技术、理论、伦理、内容监管以及这个新旧模式挑战方面,仍然有很多需要努力之处。数字人直播会对成熟的真人直播商业模式产生冲击,甚至对已有的主播生态解构,所以短视频平台对数字人直播较为敏感。但从行业趋势看,数字人直播的风向会持续。
这次阿里云京东云降价,为什么其他家不跟了?
作者 |叶子 编辑 |钊 进入2024年,云服务市场的开局显得格外平静。在经历了春节假期的短暂休整之后,行业在开年的两个月内并未展现出往常三四月份惯有的喧嚣与活跃。 过去,云厂商们往往会借新一年业务开展之际,祭出各类极具吸引力的降价优惠策略,以期在新财年伊始便抢占市场份额,赢得客户的青睐。 以2023年为例,阿里云在4月率先宣布了核心产品价格全线下调15%至50%的降价优惠,意图进一步扩大公共云的用户基数和规模,提升云计算的市场渗透率。而在其后腾讯云、百度云、京东云、华为云以及运营商云们纷纷跟进,纷纷推出大促活动,整个市场好不热闹。 但在2024年中,除了阿里云和京东云扔出了让用户无感的“重磅”炸弹外,毫无新意。而其他云厂商则显得十分克制,在两云争斗后近两月时间中,都没有正面“接招”的意思。 那么,往年猛打价格战的云服务市场为何会出现“阿里云进,其他云止”的情况?在降价的另一面,云厂商还应该思考什么呢? 1 阿里京东大张旗鼓,其他云企一言不发 虽说2024年选择大张旗鼓降价的云商只有阿里云与京东云两家,但并不意味着它们的降幅不够大。 2月29日,阿里云发布通告,宣布全线下调云产品官网售价。这次降价涉及计算、存储、数据库等在内的100多款产品,平均降价幅度超过20%,最高降幅达55%,属于阿里云历史上力度最大的一次,也被外界评为史上最大力度的公有云价格战。 而在国内市场外,4月8日,阿里云宣布海外市场也跟随全线降价,覆盖全球13个地域节点部署的核心云产品、500多个产品规格,平均降幅为23%,最高降幅为59%。降价后,阿里云海外市场云产品价格全面低于其他国际主流云厂商。 在此期间,在交个朋友四周年淘宝直播间,罗永浩久违现身,首度为阿里云带货,选品包括4款主要面向创业者与中小企业的云服务器和云存储产品。 在直播中,老罗称“如果你在企业不是做IT的,可以把截屏发给公司IT看一下,他看到这个价格后可能会激动起来,一定能打动他。你不知道是怎么回事,发给公司IT他直接就崩溃了,直呼‘老罗,你路子真野’。” 而在阿里云宣布全面下调云产品售价的同日晚,京东云宣布全系核心产品继续参与全网比价,喊出了“全网比价、击穿低价、再低10%、买贵就赔”的口号,且3月1日起即时生效。 在宣传口上,面对阿里云打出的老罗直播卖云牌,京东云正面强势回应,配合“现场直播比价,比特定直播间再低10%”的激进口号,让这场云服务商之间的价格战“火药味”十足。 按照往年的情况,在发令枪被打响后,又一波降价潮即将来临,然而现实却并非如此。 除去腾讯云低调宣布推出包括语音识别、语音合成、AI绘画等一系列AI产品在内的促销活动外,无论是想要通过技术获客的华为云、百度云,还是背靠运营商的天翼云与移动云,都没有任何想要跟进降价的迹象。 那么,为何半年前还在卖场式大促销的云企们,如今却能像达成默契般集体无视阿里云的降价“挑衅”呢? 2 低价难撼市场,技术创新与服务稳定决胜未来 出现这样情况的原因只有一个,那就是虽然阿里云这轮降价足够狠,但对友商造成的伤害还是不够大,即降价已经刺激不到用户们的G点了。 具体来看,虽然阿里云核心产品已经击穿了全网最低价,但这只是对于中小客户以及个人用户来说的,长期合作的大客户早已享受到了更低的合同优惠价,这样的降价根本不会对它们的成本产生任何影响。 而个人用户和中小企业的长尾市场,却并没有那么容易被简单的低价吃下。 仍在博士学习阶段的不会飞(化名)同学向奇偶派表示,由于有着在不同终端进行项目推进与相关存储的需求,他选择使用云服务器。“但像我这样的轻量级用户,各家云厂商其实都有针对高校学生可以免费使用的服务器,未来毕业后我还可以一家一家'白嫖'过去,并没有一定要去购买的说法”。 某家公司IT管理人员倪先生则向奇偶派表示,“阿里云确实是降价了,但我们今年的合同早就签过了,至于下一年是否会因成本的变动更换云服务商那也是明年的事情”,“其实经过这些年的降价,我们对价格的敏感度已经没有那么高了,反而相关技术支持会是更重要的影响因素”。 此外,阿里云此次是包年降价,目录价并未改变,也就意味着在最重要的弹性业务上并没有任何让利,受益的只有那些弹性较小的用户罢了,而这样的用户,占比又有多少呢? 在个人用户和中小企业需求挖掘难度增大之外,六年四次宕机的阿里云也让人对其服务的稳定性心存疑虑。 2022年12月,阿里云位于香港的数据中心因制冷故障发生宕机事故,造成多项服务无法使用,多个大客户受到影响。而由于没有完善的备用冗余方案,服务器宕机持续超过12个小时,成为了阿里云运营十多年来持续时间最长的一次大规模故障。 就在不足一年之后的2023年11月12日,由于云产品控制台访问及API调用出现异常,包括淘宝、闲鱼、钉钉、饿了么、菜鸟等多个阿里系App出现无法访问或服务异常的情况。 据DoNews报道,阿里云事故后,纳思云充电桩发布重要通知称,因阿里云IoT服务API接口故障,导致使用阿里云相关服务的设备无法正常使用。乐爽cooleasy发布紧急通知称“阿里云网络全国崩盘了,导致所有平台都出现问题”。 这样的情况,对于那些极度依赖云服务的企业是完全无法接受的。只要发生一次宕机,订单丢失、生产停摆、数据丢失等一系列直接经济损失就已经远远超过企业在不同云服务商之间微小的价格差异所带来的成本节省了。试问,在这样高频的事故发生之下,哪家想要上云的企业不会在心中掂量一下呢? 而从友商的角度来看,跟随阿里云降价的打法远不符合他们的投入产出模式。 阿里云在追求政企市场失败后,逐步脱离了原有的高增长轨道,只得重新切换回他们擅长的互联网模式中来,即通过低价来实现价格飞轮留住用户,未来再考虑增厚利润的打法,但这一套玩法,已经无法让友商觉得“恐惧”了。 以华为云为例,作为国内市场份额达到19%的国内第二大公有云厂商,却很少打过价格牌,其底气就是不断迭代的创新技术:比如将“突破乌江天险”的大量基础软件、软硬件开发工具上云;推出国产AI算力的昇腾AI云服务;国产数据库华为云GaussDB;全面自主可控的MetaERP等。 大家都看到了华为正向研发-生产-商业化循环的成功跑通,再结合市场对阿里云服务质量的担忧,云厂商们明白,依靠扎实的技术创新与对用户的理解,完全可以实现健康、稳定的市场增长,无需过度依赖价格战。 特别是在面对阿里云降价策略时,考虑到其在政企市场失利后的战略调整以及外界对其服务能力的持续疑虑,云厂商们更加确信,找到市场需求、强化自身核心竞争力,才是应对挑战、赢得市场的明智之举,而盲目跟风降价只会被拖到阿里云擅长的领域中不断失血,最终消亡。 3 存量时代里,云竞争只剩“阳谋” 而对于阿里云来说,大幅度降价也像一把双刃剑,在刺激市场需求、抢占市场份额的同时,正在对直销与代理团队的利益分配格局造成显著冲击。 官网直接降价使得终端客户能以更低的价格购买到相同的产品和服务,这直接导致了代理商渠道的价格竞争力下降。据雷锋网报道,有经销商表示,“上午官网发布降价消息,下午马上就有客户来找我们咨询了,问能否按照新价格执行。” 还有一些经销商对此表示担忧,“现在很多产品价格已经贴着成本线了,如果再降的话,会进一步影响我们的返佣金额”。某代理商更透露,“阿里云产品只要是低于3.8折,则没返点。”而他昨天上午查看这次降价的U1机型带宽按量的产品多年期已经没返佣了。 长期来看,若阿里云未能妥善调整直销与代理团队间的利益分配机制,持续的低价策略恐将加速代理商群体的流失。代理商作为连接阿里云与广大企业用户的桥梁,其营销网络、定制化服务及客户关系维系能力对阿里云的市场渗透至关重要。 一旦大量代理商因利益受损而选择退出,阿里云可能会面临市场触角收缩、客户服务响应能力下降以及新客户获取成本上升等问题,这对于其长远发展而言无疑是巨大的隐忧。 可以说,时至今日,哪怕对于阿里云来讲,单纯的降价也已经不再是那个百试百灵、可以拖友商“下水”的市场竞争策略,甚至成为了需谨慎权衡利弊、兼顾各方利益的复杂抉择了。 而云服务市场,也在此刻被画下一条分界线,在存量时代中,云企间的竞争正式进入“精细化”运作的阳谋阶段。 不过,也正如云与智慧产业事业群CEO汤道生所说的那样,“价格战的本质没有变化,就是‘卷’。只是现在的市场更成熟,玩家变少,客户变理智,不会单纯因价格而选择,更看重的是优质服务的能力,必须发挥技术优势,提高供应链管理效率,才能体现长期成本优势。”
新测试基准发布,最强开源Llama 3尴尬了
梦晨 发自 凹非寺 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。 Llama 3的两个指令微调版本实力到底如何,也有了最新参考。 与之前大家分数都相近的MT Bench相比,Arena-Hard区分度从22.6%提升到87.4%,孰强孰弱一目了然。 Arena-Hard利用竞技场实时人类数据构建,与人类偏好一致率也高达89.1%。 除了上面两个指标都达到SOTA之外,还有一个额外的好处: 实时更新的测试数据包含人类新想出的、AI在训练阶段从未见过的提示词,减轻潜在的数据泄露。 并且新模型发布后,无需再等待一周左右时间让人类用户参与投票,只需花费25美元快速运行测试管线,即可得到结果。 有网友评价,使用真实用户提示词而不是高中考试来测试,真的很重要。 新基准测试如何运作? 简单来说,通过大模型竞技场20万个用户查询中,挑选500个高质量提示词作为测试集。 首先,挑选过程中确保多样性,也就是测试集应涵盖广泛的现实世界话题。 为了确保这一点,团队采用BERTopic中主题建模管道,首先使用OpenAI的嵌入模型(text-embedding-3-small)转换每个提示,使用 UMAP 降低维度,并使用基于层次结构的模型聚类算法 (HDBSCAN) 来识别聚类,最后使用GPT-4-turbo进行汇总。 同时确保入选的提示词具有高质量,有七个关键指标来衡量: 具体性:提示词是否要求特定的输出? 领域知识:提示词是否涵盖一个或多个特定领域? 复杂性:提示词是否有多层推理、组成部分或变量? 解决问题:提示词是否直接让AI展示主动解决问题的能力? 创造力:提示词是否涉及解决问题的一定程度的创造力? 技术准确性:提示词是否要求响应具有技术准确性? 实际应用:提示词是否与实际应用相关? 使用GPT-3.5-Turbo和GPT-4-Turbo对每个提示进行从 0 到 7 的注释,判断满足多少个条件。然后根据提示的平均得分给每个聚类评分。 高质量的问题通常与有挑战性的话题或任务相关,比如游戏开发或数学证明。 新基准测试准吗? Arena-Hard目前还有一个弱点:使用GPT-4做裁判更偏好自己的输出。官方也给出了相应提示。 可以看出,最新两个版本的GPT-4分数高过Claude 3 Opus一大截,但在人类投票分数中差距并没有那么明显。 其实关于这一点,最近已经有研究论证,前沿模型都会偏好自己的输出。 研究团队还发现,AI天生就可以判断出一段文字是不是自己写的,经过微调后自我识别的能力还能增强,并且自我识别能力与自我偏好线性相关。 那么使用Claude 3来打分会使结果产生什么变化?LMSYS也做了相关实验。 首先,Claude系列的分数确实会提高。 但令人惊讶的是,它更喜欢几种开放模型如Mixtral和零一万物Yi,甚至对GPT-3.5的评分都有明显提高。 总体而言,使用Claude 3打分的区分度和与人类结果的一致性都不如GPT-4。 所以也有很多网友建议,使用多个大模型来综合打分。 除此之外,团队还做了更多消融实验来验证新基准测试的有效性。 比如在提示词中加入“让答案尽可能详尽”,平均输出长度更高,分数确实会提高。 但把提示词换成“喜欢闲聊”,平均输出长度也有提高,但分数提升就不明显。 此外在实验过程中还有很多有意思的发现。 比如GPT-4来打分非常严格,如果回答中有错误会狠狠扣分;而Claude 3即使识别出小错误也会宽大处理。 对于代码问题,Claude 3倾向于提供简单结构、不依赖外部代码库,能帮助人类学习编程的答案;而GPT-4-Turbo更倾向最实用的答案,不管其教育价值如何。 另外即使设置温度为0,GPT-4-Turbo也可能产生略有不同的判断。 从层次结构可视化的前64个聚类中也可以看出,大模型竞技场用户的提问质量和多样性确实是高。 这里面也许就有你的贡献。
有望打败闭源模型?阿里、百度、腾讯云厂商抢食开源Llama 3算力
Meta发布Llama 3系列两个开源大模型之后,百度、阿里、腾讯等国内云厂商迅速抢食Llama 3的算力部署需求。 今日,阿里云宣布全方位支持Llama 3系列模型的训练与推理。阿里云百炼大模型服务平台推出针对 Llama 3系列的限时免费训练、部署、推理服务。腾讯云也宣布腾讯云TI平台成为国内首批支持Llama 3全系列模型的平台之一。 而在4月19日,百度智能云千帆大模型平台已宣布成为国内首家推出针对Llama 3全系列版本训练推理方案的云厂商。亚马逊云同日宣布这两款模型已在Amazon SageMaker JumpStart中提供。 多名科技界人士此前对Llama 3系列评价颇高,认为后续可能开源的Llama 3超4000亿参数版本有望改变大模型生态,更有从业者指出,开源的Llama 3有如安卓,一夜之间打掉所有闭源手机操作系统。 随着开源潮流继续,云厂商也不再仅依托与闭源大模型厂商绑定,而走向了抢食开源大模型算力需求。 Llama 3性能几何? Llama 3已开源版本的基准测试数据亮眼。据Meta介绍,指令微调的Llama 3 8B在五项基准上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三项基准超过Gemini Pro 1.5和Claude 3 Sonnet。 这两个开源模型发布后,近日陆续还有业界人士发表对该模型的看法。360创始人、董事长周鸿祎认为,这两个开源模型性能很强,应该远远超过GPT-3.5,Llama问世再次验证了其对开源的信心。 国内则关注到Llama 3的中文能力和长文本弱点。记者在一个大模型业内人士讨论群中看到,不少大模型开发者诟病Llama 3的中文表现,有大模型开发者实测发现其中文能力不如GPT-3.5,称后续使用可以等第三方微调的中文Llama 3出来。不过有业内人士分析,Llama 3将中文能力弱化了,这不是很大的问题,好的中文模型不一定需要很大量中文数据。 Llama 3上下文窗口仅8k,落后于业内平均水平。周鸿祎表示,360的7B(70亿)参数大模型可输入长文本360k,已开源了长文本训练方法,可将这个方法用在Llama 3 8B训练,弥补该模型短板。 Llama 3开源引发开闭源路线之争讨论后,Meta CEO扎克伯格近日在一次访谈中则透露了Meta开源的想法和决心。他表示,即便一个模型研发成本达100亿美元,只要对Meta有帮助,就会开源。扎克伯格提到开源的好处时举了个例子:此前Meta开放计算项目开源,随着全行业以Meta的设计为标准,供应链基本围绕此建立,起量后为其节省了数十亿美元。 “开源可以在很多方面提供帮助,一个是人们能否找到更便宜运行模型的方法。随着时间推移,我们将在这些东西上花费几千亿美元或更多。所以如果能提高10%效率,就能节省数十亿甚至数百亿美元,它本身就可能值很多钱。”扎克伯格表示。 周鸿祎在论述Llama 3开源的意义时也提到相似观点,他曾经问过谷歌高管为什么把很多大数据项目贡献给公众,对方的回答令他惊讶。“他说软件规模非常大,靠一家公司独立维护成本非常高,开源之后就变成公共财产,形成我为人人、人人为我的文化。“周鸿祎表示。 云厂商抢食 Llama 3开源一石激起千层浪,阿里云、百度云、腾讯云也嗅到了机会,入场抢夺算力需求。 云厂商绑定大模型公司以锁定算力乃至芯片需求,以往并不少见,且云厂商由此获得的利润可观。OpenAI背后站着的投资方是微软,ChatGPT就运行在微软Azure上。有“OpenAI最强对手”之称的Anthropic,身后则站着亚马逊。 今年3月,亚马逊完成对Anthropic的40亿美元投资,双方战略合作协议内容包括,Anthropic选择亚马逊云科技作为其关键任务工作负载的主要云服务提供商,Anthropic将利用Amazon Trainium和Amazon Inferemtia芯片来构建、训练和部署未来模型。这两款芯片是亚马逊的自研芯片。今年3月,Anthropic发布最新大模型系列Claude 3,亚马逊立马宣布Amazon Bedrock可运行Claude 3系列,且是唯一一个为该系列模型提供托管服务的平台。 参考微软云服务绑定OpenAI后的收效,在截至2023年12月31日的2024财年第二季度,微软智能云营收259亿美元,剔除汇率影响后同比增长19%,AI为Azure云贡献了6个百分点的增长,其中绝大部分增量来自OpenAI在Azure云上的推理调用。亚马逊云服务AWS则在2023财年第四季度获得242.04亿美元营收,同比增长13%。亚马逊首席财务官布奥尔萨夫斯基表示,客户对AWS生成式AI产品表现出很大兴趣,虽然生成式AI服务体量相对较小,但公司相信其在未来几年将带来价值数百亿美元的收入。 国内云厂商中,不少也是大模型开发商,腾讯自研混元大模型,阿里自研通义千问,百度有文心大模型。此外,不同于一些大型互联网服务厂商自建服务器集群的情况,一些大模型创业公司还无太多余力搭建服务器集群,而是使用云厂商计算资源。有云厂商相关负责人向记者描述,大模型训练所需GPU算力,要一千张卡、一万张卡连通,这不是所有公司都能做到的,云厂商基于规模和效率优势天然更适合大模型场景。 除了自研大模型,云厂商自然不愿放过其他大模型的算力需求。百度旗下有面向企业客户的大模型平台文心千帆,支持第三方大模型能力导入,千帆ModelBuilder支持国内外第三方主流模型,总数量达79个。此外,阿里云旗下有魔搭社区,腾讯云TI平台则已接入Llama 2、Falcon、Dolly等开源模型。今年3月,阿里云魔搭发起一项开源计划,支持国内类Sora模型创新。 相比推理训练更具中心化特点的闭源模型,诸多云厂商都有机会拼抢算力分散的开源模型部署需求。而随着Grok-1、Llama 3等相继突破开源模型参数上限,潜在算力需求也在攀升。如果Llama 3 参数量超4000亿版本可以获得媲美GPT-4的性能,部署该模型的需求攀升,接入Llama 3的云厂商能吃到的算力红利可能不低于微软。 开源大模型厂商也在评估自身能否从云服务厂商相关收入中分成。 在谈到是否考虑向云厂商授权模型,以赚取可观收入时,扎克伯格表示:“希望有这样的安排,但我不知道会有多大意义。我们希望,如果他们打算把我们构建的东西转卖并从中赚钱,那么他们应该来和我们谈谈。如果你是微软Azure或亚马逊,打算转售我们的模型,那么我们应该有一些收入分成。“ 扎克伯格提到,Llama 2基本已与所有主要云计算公司达成协议,可以作为托管服务在这些云上使用,而随着发布的模型越来越大,这将成为一件大事。“如果要销售我们的模型,我们就应以某种方式分享其中的好处。”
供应链:先进封装仍供不应求,大厂将积极全球扩张
集微网消息,中国台湾供应链表示,台积电先进封装CoWoS产能需求依然强劲,即使2024年实现产能翻倍并与OSAT企业合作,仍无法完全满足客户的需求。 台积电积极与日月光合作,后者能够执行完整的2.5D CoWoS封装和测试。随着人工智能(AI)的发展,先进封装技术无疑将是未来AI芯片的主流工艺。台积电高管此前表示,由于客户对CoWoS需求爆发式增长,溢出订单由Amkor(安靠)、日月光等分担,这些分包商已启动oS环节或CoW环节的产能扩增项目。 终端用户产品需求正在回暖,这也是市场复苏的关键。从长远看,汽车、HPC(高性能计算)、AIoT(人工智能物联网)的需求将支撑半导体市场重回上升轨道。 供应链人士表示,封测巨头纷纷在全球扩建工厂,新加坡、马来西亚、日本有望成为海外扩张首选目的地,未来将积极关注这三个地区的机遇和限制。 业界分析,大多数中国台湾半导体制造商在寻找海外扩张地点时都会考虑五大因素,包括政府补贴、充足的人才供应、上下游供应链健康程度、当地客户支持程度以及基础设施完备程度。 台积电总裁魏哲家此前在财报电话会议中提到,安靠已宣布计划在美国兴建先进封测工厂,地点靠近台积电亚利桑那州芯片代工厂,双方正积极合作,以满足当地客户需求。
数字人成了大佬标配?
作者丨樱木 编辑丨伊页 大佬与数字人的配搭,永远不会缺少流量。 上周,以刘强东为原型的AI数字人「采销东哥」在京东直播开启带货,不到1小时吸引了2000万观看,最终成交额超5000万。这个成绩放到全网来说也可圈可点。 走在时代与科技前沿的大佬,对数字人的偏爱一点都不少。 三年前ChatGPT尚未爆发,黄仁勋就用数字人代替自己发表演讲。因为没有事先公开,三个月内竟无人辨出真假。以生产数字人核心支撑硬件的GPU为主业的英伟达,从那以后便开始了一飞冲天之路。 根据国元证券分析显示,与当下大热的人形机器人可以替代劳动者一样,在数字世界中数字人对于人类的替代,成本的降低,以及灵活性与可塑性,都是让它成为风口的原因。 近几年,随着硬件基础算力的提升以及GPT-4等大模型应用升级,数字人有望真正成为个人分身,输出文字、图像、音视频,甚至细微到情绪表达。在未来构建数字内容的过程中,将有更多的场合可以用GPU+电耗替代人工,真正打造元宇宙数字世界,使数字人集社交、创作、分享于一身,成为多模态的杀手级应用。 那么为何当下成为了数字人发力最好的时机? 首先从技术上来说,随着算力提升,新概念的数字人正在打破“皮套人”的固定认知。从外观看,通过超精细渲染,数字人高分辨率的皮肤微结构极大限度地提升了数字人在中、近景出镜的真实程度,拟人表现力显著提高,基本突破了之前的诟病——“恐怖谷效应”。 刘强东的数字人带货从C端反馈来看,固然有许多不足之处,如没有互动环节,人像眨眼较少等。但随着大厂对于算力的投入,相信这些问题在未来会逐步被优化。 其次,数字人本质上是一款强内容驱动的产品。早先市场关注的3D数字人存在“成本高、周期长、缺交互”的弊端,影响了商用推广。如柳夜熙这样精度的数字人,制作成本至少在50万以上,且每期视频的创作周期需要一个月左右,幕后创作团队包括导演、策划、制片、三维、运营等人员。 但随着垂类场景的爆发,2D仿真数字人凭借其较低的技术门槛,相关应用在直播带货、娱乐主播、客服、游戏NPC等方向上会快速扩张。根据研报显示,2D仿真数字人使用静态扫描技术制作,即通过40-60个照相机对真人进行全方位拍照,根据拍照光线和角度进行矩阵扫描,从而在软件中呈现出2D立体形象。静态扫描技术仅需拍照搭配上少量所需数据,就能以较低的成本制作出2D数字人形象。尤其在AIGC发展迅速的现在,2D仿真数字人的制作门槛、周期和成本远远低于3D建模数字人。 (2D虚拟新闻主播,3D建模数字人) 最后,在内容端无论是京东、阿里等电商平台,还是短视频的抖音快手,都拥有着庞大的场景数据沉淀。这些数据可以从多维度支撑电商带货的全过程,从前端的销售,到中端的客服,再到后端的售后物流。伴随着AIGC的发展,2D数字人也同样具备语言交互功能,且由于较为垂直而更容易用大模型训练,体验将持续得以提升。 总结来看,降温增效+内容数据的完善,让数字人在消费场景的潜力正在逐步打开。在线上线下融合的新零售、以兴趣为先的内容电商之后,AI电商的蓝图已然画出了一个模糊的轮廓,而数字人也许就是打开大门的钥匙。
抖音追不上Sora
在AI文生视频这条热门赛道,抖音旗下的剪映,正在被OpenAI的Sora越甩越远。 近日,美国软件巨头Adobe宣布,将在知名视频编辑软件Premiere Pro的新版本添加多款文生视频AI工具。近两个月震动全球科技圈的Sora,以及两款同类产品Gen-2和Pika,都会在不久的将来加入“Adobe全家桶”。 有了Sora等第三方AI工具的助力,新版Premiere Pro除了编辑处理预先拍摄的常规视频外,还能根据用户输入的文本即时生成AI视频,并将两者融为一体。 Adobe放出了一条官方演示视频:一个男人走向窗前,观看整个城市的夜景。用户无需拍摄实景,只需输入一段文字,即可利用Sora生成一段城市雨夜的视频,并与前面的视频无缝衔接,效果几可乱真。 Sora今年2月初次亮相,OpenAI放出几段演示视频,但并未公布产品进展和上线时间。如今,Sora被Adobe接纳,表明过去几个月又有不小进步,距离开放使用更近。 另一边,背靠抖音的视频剪辑软件剪映,同样朝着AIGC(人工智能生成内容)方向前行。但截至目前,剪映尚未拿出令人惊艳的成绩。 目前,剪映的AI玩法不少,包括一键成片、剪同款、AI克隆音色、数字人口播等,但并不具备根据文本直接生成视频的能力。它的海外版本Capcut在2月底推出文生视频功能,但效果距离Sora相去甚远。 如今,Sora除了在技术和产品上领先剪映,还得到了Adobe的青睐。Adobe在全球拥有超3300万付费用户;Sora接入“Adobe全家桶”,有望获取订阅收入分成,从而初步构建商业模式。 这也意味着,仍在打磨AIGC能力的剪映,追赶Sora的难度将越来越大。 剪映被外界视为抖音搭上AIGC时代快车的关键筹码。得益于抖音的加持,剪映已成为用户量最大的手机视频剪辑软件之一,每天产出大量短视频;在此基础上更进一步,从UGC(用户生产内容)迈向AIGC,似乎水到渠成。 今年2月7日,抖音功勋老将张楠辞去集团CEO职务,亲自带队剪映。她在官宣职务变动的内部信中称,AI图像生成对她产生很大的触动,潜力巨大,并决定“放下一切”,义无反顾地出发。 剪映的发展根基不可谓不好,抖音的重视程度也很高。但两个多月过去,剪映依然没有太大动静,Sora反而继续高歌猛进。 在AIGC时代,抖音及其背后的字节,似乎总是棋慢一着。 字节八年前布局AI,成立了专门的实验室,招募大批业内精英,但成果却停留在内容审核、自动翻译、搜索服务等。2022年下半年,ChatGPT引爆行业;字节随即增加大模型投入,一口气推出AI聊天机器人等十几款应用,却迟迟没有拿出震动行业的技术和产品。 今年1月底的年度全员会上,字节CEO梁汝波感叹,字节“该有的大公司病全有了”。他特别点名AI业务,称:“公司层面的半年度技术回顾,直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司,都是在2018年至2021年创立的。” 如今,在立身之本的视频内容领域,OpenAI着着抢先,剪映乃至整个字节又双叒慢了。 01 背靠抖音这颗大树,剪映原本有很大机会在AI文生视频领域的占得先机。 剪映2019年上线,2021年推出PC端的专业版。它显著拉低了UGC视频的创作门槛,普通人只需准备好素材、点击几下,就能生成一段质量尚可的视频,并一键发布至抖音。 此外,作为一款工具软件,剪映还带有一定的社区属性。除了官方提供的视频创作课堂外,用户还可以参考达人制作的视频模板进行创作,也就是“剪同款”。这有助于提高用户留存率和活跃度。 依靠丰富的功能,以及与抖音深度绑定,剪映仅用了三年就获得超1亿月活跃用户,跃升至同类软件的第一名。 剪映海外版CapCut的增长同样惊人。 Capcut上线于2020年,与TikTok关联密切。移动应用分析平台点点数据显示,目前Capcut的月活跃用户超2亿。另据市场调研机构data.ai的数据,截至2023年8月,Capcut在iPhone和安卓端的用户超4.9亿,相当于TikTok全球用户量的1/4。 除了用户规模庞大,剪映在AI领域的另一个优势是“近水楼台先得月”,坐拥大量可用于AI大模型训练的视频数据。 数据、算法和算力是AI大模型的三大基础要素,其中数据是根基。要想提升大模型的综合能力,就需要不断“投喂”多模态数据,主要是互联网文本、图像和视频。 OpenAI、Adobe等公司都不直接掌握数据,必须从第三方付费获取,成本不菲。据媒体报道,OpenAI每年仅采购版权新闻文章授权的费用,就高达100万~500万美元;Adobe为了训练自家的文生视频大模型,以每分钟3美元的价格,向另一个大模型服务Midjourney购买视频片段。 相比之下,剪映在国内绑定抖音、在海外背靠TikTok,每天有大量用户使用它剪辑和上传视频。这让剪映能够以相对低廉的成本,接触到大量视频内容,为训练大模型、探索AI文生视频功能打下基础。 但从2019年至今,剪映并未研发出强大的AIGC能力,反而早早启动了商业化。 剪映很早就上线了VIP会员,用户每月支付二三十块钱,可以使用专属素材、精选模板等,AI玩法也被列为会员权益之一。根据官方介绍,AI玩法主要包括“无限创作”“无限运镜”和“瞬息宇宙”,基于现有视频素材进行AI美化编辑。 不难看出,剪映的AI玩法距离Sora这样的文生视频相去甚远。此外,它的收费也并不低廉:会员每月可获得1200积分,而使用一次“无限运镜”就需要480积分。积分耗尽后,用户可以选择继续充值,兑换比例为1元:100积分。 剪映诞生之初的定位是,尽可能拉低短视频创作门槛,促进抖音UGC生态的繁荣。过去五年,它的确完成了这一任务,大量抖音爆款视频背后,都有剪映提供技术和模板。特别是那些趣味特效视频、踩点视频,抖音红人发布之后,大量用户迅速群起效仿、共同推高热度;没有剪映的帮忙,恐怕不易做到这一点。 但如今看来,抖音还是把剪映的天花板设定地太低了。它原本有机会成为Sora这样的划时代产品,却始终停留在视频剪辑软件的范畴。 今年以来,剪映开始奋起直追,但先机已失、对手已至,追赶难度也迅速增大。剪映被Sora甩开,字节在AI领域仍然没能跳出“起大早、赶晚集”的怪圈。这也从侧面印证了梁汝波此前批评的“平庸的重力”。 02 过度重视对业务的帮助,过早追求商业化,是剪映乃至整个字节AI板块的难题。 剪映除了开设付费会员、将AI玩法纳入权益包,还在APP内增加了不少广告位。例如,用户点击“剪同款”,映入眼帘的除了手机照片和视频素材,还有悬浮在素材上方、几乎毫无关联的横幅广告。 作为一款用户破亿的工具软件,剪映的常规投入和资金压力并不会特别大。它之所以早早发展会员和广告,或许与字节的做事风格和评判标准有关。 众所周知,字节是一家超快节奏、高度内卷的互联网巨头。如果个人、团队或业务无法迅速带来肉眼可见的产出,就有可能被调整,甚至彻底出局。即使是需要长期投入的AI,也无法跳出这一隐形的评判标杆。 早在2016年,字节就设立了AI Lab人工智能实验室,并引入多位学界和行业精英。彼时,OpenAI同样初出茅庐,正朝着通用人工智能的愿景前行,将自己视为非营利组织。 相比之下,AI Lab虽然名为“实验室”,实际上仍然需要密切配合和服务业务。它的官网宣称,其研究重点是开发为字节内容平台服务的新技术;具体领域则包括自然语言处理、数据挖掘、计算机视觉、机器学习等,且和抖音各业务板块贴合紧密。 随后几年,字节拿出了一系列AI工具,比如提供翻译服务的Byte Translator,AI写稿机器人Xiaomingbot,以及头条和抖音的搜索服务等。它们固然颇有价值,但算不上突破AI领域认知边界、定义AI发展范式的创新产品。 直到2022年下半年,OpenAI多年磨一剑,ChatGPT席卷全球,生成式AI成为全球科技公司竞逐焦点,字节才把更多精力投入到这一新浪潮中。 已经淡出字节一线管理的张一鸣,对AI产生强烈兴趣,并鼓励团队大举投入。他在2023年4月的一封内部信中称,“字节跳动无法错过AGI(通用人工智能)”,它是抖音和TikTok在全球发现新的增长机遇不可或缺的伙伴。 创始人发话后,字节各业务部门闻风而动。从那时起,字节陆续上线十多款AI产品,如豆包、话炉、扣子、Gauth等,剪映、飞书等也增添了AI功能。 但在这一轮大举投入中,字节以业务需求为原点、对标竞争对手的做事逻辑被延续下来。豆包等产品均为现有AI技术的场景化应用,而非对于AGI的原生探索。 例如,去年3月,微软上线整合了GPT功能的365 Copilot,全球办公软件市场为之震动。一个月后,飞书宣布即将上线AI助手“My AI”,以对话形式提供多种功能,包括优化和续写文字内容、创建日程、自动汇总会议纪要、搜索公司内部知识库等。 一年后,GPT已经在微软“全家桶”遍地开花,带动后者股价从250美元一路上涨至400美元以上。飞书却没能依靠My AI完成逆袭,反而在3月底宣布裁员。 又比如,Sora今年2月16日发布演示视频,CapCut一周后就宣布推出这一功能,每人每天可免费生成5段视频。CapCut的技术力显然无法与OpenAI比肩,其文生视频功能也较为简陋;仓促上线、对标Sora,不免带有蹭热点、强行完成KPI的味道。 从张一鸣点名AGI至今,字节AI又走过了一年,并未显著拉近与OpenAI的差距,甚至有扩大的趋势。字节AI向实用主义的过度倾斜,不仅让它错失了以往的机遇,也有可能拖累追赶的步伐。 03 对于AI板块各自为战、围绕业务打转的局面及其危害,字节已经有所察觉。 2023年11月,字节抽调多个部门的精兵强将,组建AI部门Flow。TikTok技术负责人朱文佳、字节产品与战略副总裁朱骏、字节技术副总裁洪定坤、飞书产品副总裁齐俊元均加入其中。人员的“高配”,显露了字节通过Flow统筹AI发展、消除重复建设的意图。 目前,字节曝光度最高的AI产品——豆包、扣子、话炉等,均由Flow部门负责。剪映、飞书、大力教育等虽然也有AI业务,但声量已经逐渐被Flow盖过。 另一方面,字节云雀大模型已经打磨近一年时间,多模态大模型BuboGPT也取得进展,为Flow批量产出AI应用奠定根基。假以时日,Flow有望扭转字节AI总是慢人一步的局面。 不过,字节毕竟不是OpenAI,没有微软这样的超级金主。AGI固然重要,但对于现有业务的拉动尚不明显,需要更长时间的沉淀和打磨,才能释放商业价值;字节对AGI的投入不可能无止境,必须考虑中短期的投入产出比。 短期来看,字节需要用钱、用人、用资源的地方很多,比如抖音货架电商、生活服务等,都需要大量真金白银。随之而来的现象是,尽管Flow挑起了大梁,但字节AI依然呈现兼顾业务需求的倾向。 据Tech星球近日报道,抖音生活服务刚刚成立一支AI团队,希望利用AI技术创造增量业务价值,且已开启对相关AI产品的研发,包括搭建生活服务相关的内容创作平台等。 抖音生活服务之所以拉起这样一支队伍,或许与竞争对手美团和饿了么的动作有关。 美团近日开始小规模测试AI助手服务“问小袋”,可为用户推荐符合其需求的外卖商品,以及用餐建议。饿了么则在4月初面向零售行业商家发布“AI经营助手”,可为商家智能生成各类经营关键报表和关键数据。 在此情况下,不让美团饿了么专美于前,或许是抖音生活服务入局AI的基本目标之一。 内外因素影响下,字节没有条件像OpenAI那样厚积薄发。既要追赶AGI潮流,又要具备快速落地、服务业务的能力,是字节AI的双重目标。 在张一鸣和梁汝波的督促下,外界无需质疑字节做AI的决心。但倘若再过去一年、两年,字节仍然跟不上OpenAI的节奏和水准,那么它或许应该考虑另一种选择:退回“卖水者”的角色,做AGI训练素材提供商。 如前所述,数据是大模型的三大基础要素之一,而字节麾下的今日头条、抖音、TikTok等,已经积累了数以亿计的文本、图片和视频。字节可以用这些数据训练自家大模型,也可以考虑更进一步,在妥善解决安全和隐私问题的前提下,将其出售给OpenAI等第三方公司。 充当AGI时代的“卖水者”,其实是字节擅长的流量生意的变体。字节如今的现金牛——广告和电商业务,都建立在流量变现的基础上;如果把AI公司转变为新客户,那么字节心心念念的第二增长曲线问题将迎刃而解。 另一方面,OpenAI既然能够与微软、Adobe合作,与字节合作也并非不可想象。毕竟,抖音和TikTok是Sora等AIGC服务最庞大的落地场景。倘若字节与OpenAI达成“竞合”关系,那么字节将跳出一步慢、步步慢的循环,在OpenAI的助力下搭上AI快车。
苹果发布《2024年环境进展报告》,首次公开中国部署两台回收机器人
【环球网报道 记者 张阳】今年4月22日是第55个“世界地球日”。苹果公司也于当日发布了其《2024年环境进展报告》(以下简称《报告》),《报告》表示,苹果公司正着力于回收和可再生材料、清洁电力及低碳物流这几个方面,努力达成整体碳足迹净零排放的目标。 《报告》显示,自2015年以来,苹果公司整体碳足迹已减少排放55%以上的二氧化碳当量;通过供应商清洁能源项目,苹果公司在2023年成功避免了排放 1850万吨二氧化碳当量;在2023年出货的产品中,22%的材料都来自回收和可再生原材料;2023年,1280万件设备和配件交付至新用户,实现了再利用;与2022年相比,产品运输环节的排放量减少了20%。 苹果公司在《报告》中着重提及了只使用回收和可再生材料制造产品,这推动了采购和设计方面的创新,同时也极大减少了苹果公司的碳足迹。其中,2023年,苹果产品电池中56%的钴来自回收来源,是前一年的两倍多。例如,搭载M3芯片的MacBook Air是首款使用50%回收材料制造的Apple产品,其电池和MagSafe接口中的磁体均采用100%再生钴。多个印刷电路板的镀层采用100%再生金,所有磁体采用100%再生稀土元素。2023年,苹果产品电池中24%的锂来自经认证的回收来源。 为了实现材料再生利用,苹果公司设计了全新的技术来推动电子产品回收领域的发展,其中包括拆解机器人Daisy,它现在可以将29种型号的iPhone拆解成15个独立的组件。同时,另外两款回收机器Dave和Taz目前已部署在中国的一家回收合作伙伴处。相对传统电子产品的回收,这些创新技术能够利用开创性的方式,提升材料回收效率。 日前,环球网记者也探访了两款新型回收机器人Dave和Taz。据了解,在传统的废旧电子产品回收过程中,因为回收过程粗放,产品中很多非常重要的元素材料都没有办法得到有效的回收,因而也没有办法被回收成可以再次用于制造产品的原材料规格。在参考了市场上现存的回收拆解机械之后,苹果公司发现无法适用于精密且小巧的手机部件材料的拆解回收,所以,苹果公司专门研发的几款回收机器人正是为了解决高效回收原材料进而再输送至制造过程中变为新的产品原料的难题。 “通过这种方式,最大的好处在于一方面减少了对矿石材料的开采,另一方面回收材料的加工提炼过程也更有助于减少碳排放。”记者了解到。 回收机器人Taz是一台采用类似粉碎机的新技术的机器,能够从声学组件中分离出磁铁,并回收更多稀土元素。Taz每年可以处理8000万个iPhone声学组件。Taz拆解一吨iPhone声学组件所回收的稀土元素,相当于新开采超过170 吨岩石所提炼的材料。并且Taz的操作极为简单,一次进料可以容纳200公斤声学组件,只需要两名操作人员即可完成拆解回收的全部工作。 Taz从声学组件中分离出来的非磁性材料(铜线圈,塑料,不锈钢) 用于拆解触感引擎的机器人Dave则有助于回收重要的稀土磁体、钨和钢。Dave每年可以处理480万个触感引擎。它拆解一吨触感引擎可回收的钨与稀土元素,相当于新开采超过360吨岩石所提炼的材料。 操作人员正将触感引擎装入Dave 苹果公司方面还表示,正在努力通过与卡内基梅隆大学等学术机构合作,进一步在回收领域利用人工智能、机器学习、机器人技术和自动化的力量。 此外,苹果公司日前宣布全球运营及制造供应链现已使用超过18千兆瓦清洁电能,是2020年的三倍以上。苹果公司呼吁全球供应商使用清洁能源,并使所有与苹果公司相关的运营完全实现碳中和。迄今已有超过320家供应商投入这一变革,这些供应商在 Apple 直接制造支出中占比95%。截至目前,在苹果公司供应链投产的可再生能源已达16.5千兆瓦。 作为更广泛的环保工作的一部分,苹果公司还在持续推进实现另外一项宏伟的 2030目标:在水资源紧张的地区,补偿100%公司运营所消耗的淡水。这方面的工作包括推出新的合作项目,在接下来的20年里通过恢复土壤含水层和河流,以及资助获取饮用水等方式,提供近70亿加仑(约2650万吨)淡水的水资源效益。和清洁能源一样,苹果公司深化了整个供应链的清洁水资源承诺:苹果公司供应商去年累计共已节约了超过120亿加仑(约4542万吨)淡水;自公司 2013年启动供应商清洁用水项目以来,总计已节约760亿加仑(约 2.87 亿吨)淡水。 苹果公司在《2024 环境进展报告》中宣布,通过不断努力Apple 2030目标的实现过程中已取得了重大进展。Apple 2030 是苹果公司的一项宏伟目标,即到 2030 年在整个价值链实现碳中和。目前,Apple在全球的公司运营已经实现了碳中和。
Ai Pin差评如潮,首批AI硬件公司面对现实
记者 张勇毅 编辑 高宇雷 在 2007 年的 iPhone 发布会上,乔布斯引用图灵奖获得者 Alan Kay 的一句话,解释苹果为什么需要做“苹果的手机”:真正在意软件的人,应该自己造硬件。 随着 2023 年大模型浪潮席卷全球,为 AI 打造专用的硬件,似乎也成为了时代趋势:这种风潮直接提现在了 CES 2024 中:超过上百件各种“AI 硬件”被展出,其中类似 Rabbit R1、Ai Pin 这样的产品纷纷在此期间开放了小批量测试,给更多人实际体验产品的机会。 而在国内,一些硬件厂商为了防止自己在这一波潮流中掉队,或想借助这个机会弯道超车,还是抢在第一批上马了 AI 硬件的项目 —— 其中不乏魅族这样业内熟知的手机公司,在巨头中,也有字节跳动这样想通过硬件进一步落地 AI 能力的选手。似乎一个硬件的新风口已经诞生。 但在 Ai Pin 上市之后,用户的反馈却变成了一道晴天霹雳:来自媒体各种各样的花式差评,无不直指 Ai Pin 的无屏幕操作模式,反而严重影响了与大模型交互的效率,让原本生成式 AI 对话机器人能做的事变得更加稀少了。 无论 Ai Pin 与背后的 Humane 最终结局如何,作为第一批吃到螃蟹的 AI 硬件独角兽,Ai Pin 都注定会是一个被反复研究与咀嚼的对象。 坏评价与坏产品 在 AI 领域的各路创业者中,不乏从消费电子硬件制造业从业者的身影,打造出 Ai Pin 的 Humane,创始人是来自苹果的前软件工程总监 Bethany Bongiorno 与设计师 Imran Chaudhri。在 2023 年 C 轮融资时,宣布将致力于构建“AI 集成设备平台”。 除了两位创始人之外,Humane 还将包括苹果 iCloud 基础架构工程主管 Patrick Gates、苹果 5G 调制解调器负责人 Ruben Caballero、iPhone 设计总监 Miguel Christophy,以及数十名在苹果负责工业设计的员工挖进了这个团队,几乎打造了一个全苹果阵容的研发团队。因此被许多人寄予了“颠覆 iPhone”的期望。 甚至在产品完全没有开售的 2023 年,Ai Pin 就被《时代》杂志评选为 2023 年年度创新产品。 现实是,所谓“AI 原生硬件”的概念,还处于相当早期的探索阶段,其迭代速度不及大模型体积发展本身,甚至难以赶上现有智能手机使用体验。 客观来讲,无论是 Ai Pin 还是 Rabbit R1,在硬件设计上都做出了让人眼前一亮的突破:Ai Pin 开创性地使用了“激光墨水屏”这一技术,将内容通过激光直接投射在用户的掌心,同时还能兼顾手势操作的识别;Rabbit R1 在设计上成功的通过近似玩具的工业设计,降低了电子产品的冰冷感,从而变成了一款让用户愿意拿在手上的“玩具”。 但用户不会因为一款产品解决了工程难题而购买,只会因为这款产品解决了生活中的某个难题而购买。 Ai Pin 上市后遭遇的口碑滑铁卢,让不少 AI 硬件创业者终于意识到一个迟迟不愿意面对的事实:类似的产品即使是面对手机上的 ChatGPT App,都几乎没有任何护城河。 目前为止,绝大多数已经公开的 AI 硬件产品概念,都难以摆脱一个尴尬的现实:自己的产品并没有让用户脱离手机的必要理由。 现有已经问世的 AI 硬件,所提供的功能,理论上都可以通过智能手机来完成,并且智能手机有着更为强大的算力、相机/屏幕以及软件开发生态,这些都是决定手机能比 Ai Pin 做的更好的竞争优势。 「用户对 AI 硬件的预期,往往是以一个真正通用人工智能的标准来审视,这一点很像 VR 设备在市场上长期面对的问题」 一位深圳初创公司的硬件产品经理对记者表示,他当前也在从事一款生成式大模型音箱硬件的研发工作,因此在市场调研后得出这样的结论。 但仍然有人试图解决这个问题:面对当下的 AI 硬件困境,Rabbit 采取了两个策略:首先是首款产品 R1 定位小众极客属性,他们不介意在手机之外再随手携带这样一款设备,这样从一开始就降低了用户对其定位预期 —— 充当手机的辅助品而非取代手机。 其次就是价格,不同于 Ai Pin 与 iPhone 相同的起售价,Rabbit R1 将硬件售价压缩到了 199 美元,这是使其首销前三万台都开售即售罄的主要原因。不到 1500 元人民币的起售价使其更加坐实了“科技潮玩”的属性,这是相比 Ai Pin R1 能在销量上取得首发成功的重要原因。 只是到目前为止,Rabbit R1 都没有如期发货:仍处于持续性跳票的状态,当它最终到用户手中时,同样将面临 Ai Pin 在当下经历的所有质疑与测试;作为一款形态与智能手机过于接近的产品,目前已经有首批体验过的用户经历了这个“从手机到玩具”的落差感。 笔者在实际上手体验过 Rabbit R1 早期 Demo 后才意识到,不同于渲染图的光鲜,R1 机身的廉价塑料感与分辨率并不高的显示屏,都会是让用户上手后快速感到失望的因素。 AI 硬件面对“现实” 对国内的 AI 硬件创业公司来讲,Ai Pin 的启示或许要更深刻一点:依托更完善的供应链体系,将类似产品的售价控制在千元人民币以内并非难事,但中国市场追求更加落地的产品,因此如何将大模型塞进合适的产品内,就成为中国 AI 硬件的新命题。 对于中国厂商来讲,在涉足 AI 硬件领域之前,最先需要回答的一个问题是“中国用户需要怎样的 AI 硬件”? 除了魅族发布的魅族 21 Pro,宣称将要成为“AI 时代的树莓派”、开放给所有大模型厂商这种“取巧”的做法,几乎所有 AI 硬件开发过程中,都无法忽视 AI 大模型在硬件产品中的重要性。 生成式大模型服务作为后期运营成本极高的产品,模型即服务(Model as a Service)概念已经逐渐被越来越多人所理解,但对于一款硬件产品,在已经支付了一笔设备购买费用之后,还需要每个月定期支付“使用费”,这样的模式 中国用户并没有对订阅制有足够高的接受程度:三星在今年旗舰手机 Galaxy S24 系列国行版发布时,主推了借助大模型能力实现的各种 AI 功能,但没多久就被线下用户爆出,其中部分 AI 功能,仅可免费使用 180 天,用户之后想要继续使用,则必须开通对应的会员服务。 这个机制在发布会上并未被三星明确指出,但一经用户爆出便引起了不小的争议:其中一个未经证实的说法是,收费是因为合作方 WPS 的要求,才让 Galaxy AI 不得不改变了运营策略。 无独有偶,时下火爆的 Rabbit R1,在后期运营成本这一问题上,也选择了向用户收取订阅费作为解决方案:但是作为一个可选项,为用户提供 Perplexity Pro 订阅,年费为 200 美金。这个订阅费用已经超过了 R1 硬件售价本身。 除了订阅费之外,云端大模型在响应速度上带来的延迟问题也是 AI 硬件无法翻越的大山:Ai Pin 采用了云端+端侧的混合模型策略,但由于设备本身的算力极为有限,只能用来处理语音识别以及一些基本操作指令,涉及稍多一点的信息,就需要依赖云端模型:然后用户感受到的往往是长达数秒才能给出的回应(往往还并不准确),这样的实际体验显然与最开始的预期天差地别。 眼下这一尴尬的趋势,是目前 AI 专用硬件发展道路上几乎无可避免的尴尬情况。但仍然有被解决的可能性:完全依赖端侧算力的端侧大模型,或许才是 AI 硬件发展的真正未来。 但至少在当下,纯端侧算力的 AI 硬件并不适用于所有场景,因此教育成为被多次提到的 AI 硬件场景:毕竟如果一个设备不能取代手机,那在不需要智能手机的地方,它或许能发挥更大的作用。 除了教育硬件,在目前我们所熟知的各种消费电子形态中,智能手机与 TWS 耳机这类可穿戴设备,是目前唯二没有被智能手机吞噬领地,同时能大面积销售的产品,这决定了它们也是“AI 硬件”的良好载体:近期颇受关注的 AI 硬件 Limitless,就是以吊坠的形态示人,使用方式接近 Ai Pin,但上手的学习门槛与佩戴难易度都更低。 它所充当的更像是“随身智能音箱”的概念,通过纯语音交互的方式来完成信息搜索、日程管理等简易工作。用户无需经常掏出手机,即可完成大多数轻量级的任务。 可穿戴设备成为目前 AI 硬件扎堆的赛道,除了相对更加低廉的售价之外,或许是目前 AI 硬件开发团队面临最尴尬的现实:完全无力与包括苹果在内的智能手机巨头正面竞争,唯有在智能手机难以触及的角落,AI 硬件才有生长的空间。 但最终,能打动用户的仍然是只会是产品能否解决问题,正如 Marques Brownlee 在视频中对外界评论他的 Ai Pin 差评是否太过激烈、没有对硬件创业公司给予足够的肯定时,作出的回应那样: 坏评价不会摧毁一个公司,坏产品才会。
大模型没过“试用期”
撰文 | 吴坤谚 编辑 | 吴先之 东市买骏马,西市买鞍鞯,南市买辔头,北市买长鞭。 出自《木兰辞》中的诗句展现了充分竞争的自由市场中,供给方各司其职的状态。在同一市场内,消费者往往会从不同供应商处获取不同商品和服务,就像当下扎入垂直行业、走向定制化的大模型服务一般。 如果仔细观察诸如百度、阿里、科大讯飞等大模型服务商透露的产业方向的商业化进展,我们不难发现虽然其客户列表中重量级选手不少,但这些客户们往往“只取一瓢饮”,以探索的方式从点开始大模型及AIGC方面的合作。 新兴技术的未知性特点在大模型的算法黑箱下再度放大,导致产业在面对既往合作伙伴时依旧保持着相当的审慎——虽同为产业智能化,但模型服务的“完整性”远不如上云。这也导致了模型服务商扩大商业化的一个困境,即在体量不大的项目上投入大量定制化服务与资源,成为做多收少的“高科技施工队”。 然而吊诡的地方在于,而今增速趋近停滞的云计算市场已经发生了明确的转向,拓客方向自大客户转向中小客户。但模型服务却因以算力为主的基建成本高企,而难以跟上云计算的节奏,只能试图通过标准化产品广撒网,一点点啃下中小企业。 生成式AI代表未来已经成为业内共识,“断舍离”再难成为选项之一的同时,一众企业不得不迎难而上,冲突亦在这一过程中不断上演。 大模型需要好销售 过去一年多的时间内,商业化无疑是国内模型服务商最为关注的重要议题,以至于在一定程度上影响了服务商对模型及相关能力的迭代路线。 一个绝佳例证是,业内在模型易用性、工具链、避免“幻觉”等关乎使用门槛的演进频频落地。事实上,在2024年这一被定义为“AI原生应用”元年的时间节点,以低代码或无代码形式创建AI应用正逐渐成为现实,门槛或早已不是大模型商业化的首要难关。 此外,除少数闭源巨头外的开源社区也在持续缩小国内模型服务商的底座能力代差,几乎业界每每出现突破性的进展,其余主流玩家总能第一时间跟进,在Kimi近期掀起长文本风潮中,百度、阿里等玩家跟进并没有花多少时间。这意味着,通用底座能力难成大模型商业化初级阶段的胜负手。 事实上,在以AIGC为代表的产业智能化的创新扩散中,智能并不是关键,反而更像是一种“添头”。例如我们曾对话的一家SaaS企业,他们与而今逐渐深入业务流程的AI大模型的相遇,不过是一次偶然。 上述企业人士李浩告诉光子星球,就像许多深耕垂直行业的企业一般,他们对技术的感知不算敏捷,之所以了解到大模型,还是源于此前某场展会上的一次闲聊。 “腾讯那边有人和我们CTO聊了会,展会结束后,CTO觉着可行就跟市场部的人接触了”,他说,“机缘巧合下凑了一桌饭局,人家直接让业务VP拎着一大瓶酱酒来,推杯换盏间讲了很多大模型改造业务流程的事情,不过合作还是没能在饭局上谈成”。 尽管腾讯的合作意向非常明确,但李浩的领导还是有些兴致缺缺——早在去年,CTO便有意与业务数据所在的阿里云展开AI合作,但是“阿里那边迟迟不见动静,也没什么优惠”,这才给了腾讯半道截胡的机会。 另一方面,许多垂直行业早在两三年前就感受到了AI的冲击,但实际对业务的改造其实并不算明显。或许大模型的加入足以让AI脱胎换骨,但在销售口中天花乱坠的功能并不足以构成决策理由。 我们不难在云计算的政企BD中看到与之类似的销售场景——不可否认的事实是,“上云是一种趋势”的共识更多存在在互联网视域内,而政企侧对云的需求更多在于对顶层设计的考量。说白了,大多数非互联网企业应用新型技术的根本原因并非技术本身,而是需要“跟上同行的节奏”,AI大模型亦然。 当然,腾讯方面绝无可能放弃这条相对明显的线索,其还在饭局结束后多次登门拜访,“除了婉拒给我们独家提供技术支持外,我们提其他的条件,基本都答应了”。在这么一个几近赔本赚吆喝的情况下,腾讯才堪堪拓展一家企业客户。 据了解,这家SaaS公司经过数月的“AI初体验”后,最终决定在年中前后扩大合作范围。届时,腾讯作为模型服务商提供的由点到面的服务才刚刚开始,成本回收尚不知时日,遑论凭此盈利。 云计算行业从“比较技术性的超前概念”到“上云是一种趋势”,花了足足10年时间。反观技术深度、黑箱、幻觉等问题并存的大模型,似乎其商业化的路途更为崎岖。 这么看来,与其在产品层面持续做加法,倒不如多下功夫挖掘销售线索。另一方面,完善的BD体系也在一定程度上可以打破技术认知的高墙。 可惜的是,在大模型技术尚未祛魅的当下,厂商的外宣重点往往落在技术突破上。进一步说,当大模型服务可以像云计算一般召开合作伙伴大会的时候,或许大模型商业化才能迎来真正的春天。 大模型需要CIO 模型再强也只能解决业务上的问题,其商业化困境本质上不在于技术,而在于商业模式和生态。不过自模型服务商的视角看,模型服务普及的“鬼故事”同样不少。 正如上文提到的SaaS企业,便在希望更广泛地接入AI能力时犯了难。“现在我们内部可以说是跑着两套系统,内部业务流还像以前一样跑在阿里云上,但尝试对外输出的AI大模型能力却跑在腾讯云上。领导那边还希望再引进语音、OCR之类的AI支持,又准备让我们接触一下科大讯飞”。 李浩无奈表示,现在公司有点“骑虎难下”,既不太方便彻底抛下阿里云做整体数据迁移,又不好再拓展与其他厂商的AI合作,毕竟这背后是搭建混合多云架构的隐性成本。他还提到,前端时间领导才刚刚因为销售团队开不出单而大发雷霆,在AI大模型尚未展现盈利能力的情况下,狠下心全面转投腾讯云怀抱可以说是不可能的事情。 不难看出,即使是有意引入AI能力改造业务的企业,由于领导层对AI大模型的了解仅限于网络公开信息与模型服务商的单向度灌输,其往往对市场没有一个清晰明确的认知。这家SaaS企业在采购决策上犹豫不决便是绝佳例证。 况且,非互联网企业的组织架构也是遭致上述情况的重要原因。或许大部分组织完善的企业都设有CTO职位,但其既有知识域基本局限于企业业务,而设有CIO的企业可以说是寥寥无几。 据红杉于去年末的一次调查显示,以CIO为代表的企业技术管理者将通过应用AIGC满足产品差异化和服务创新需要、增强办公效率与内部沟通作为主要目的;相较而言,CEO则将紧跟前沿技术趋势、拓宽企业经营边界作为AIGC应用的核心动因。哪种更利于AI对业务的深度改造,一目了然。 如果CIO的缺位不过是将AI大改造交由CEO或CTO统筹的话倒也还好,更糟糕的情况是在买方市场下,这份重担被转嫁给模型服务商。在一位模型创业者看来,这无异于是化身客户企业刚刚萌生的AI业务的“保姆”。 “前阵子,和我一起创业的产品经理差点顶不住与客户之间无休止的扯皮,闹离职”,他说,“我那时候还在美国那边做交流,听他辞职信都写好了,我赶紧打飞的回去,好说歹说才劝住他”。 据悉,事件起因是客户在为期三个月试用期内,就提出做多个深入业务流程的应用,从早期的基于RAG(检索增强生成)的企业内部知识问答到数字员工再到智能营销,可是试用项目的合同金额才30万。可怜这位产品经理在试用期内每天抓耳挠腮地控制交付成本,团队两天一小会三天一大会,然而客户还是在试用期结束后便接洽了服务更为成熟的大厂。 定制化项目在固定时限内的交付,将模型服务高大上的“皇帝的新衣”无情扯下,空留一个期货般的内核。 当模型服务商被迫在客户企业的AI改造中承担主要责任的时候,所谓产品的价值交付也就不再存在,取而代之的是极致的成本控制和交付压力。如果不能完全把握客户的需求,那么深入合作破裂也不过是时间问题。 定制化之困 近段时间,国内一级市场对AIGC的热情愈发低落。著名投资人朱啸虎亦公开表示,“AIGC PMF(产品/市场匹配),你投十个人找不到,投一百个人同样找不到。” 不可否认,在难销售、难交付、高成本的特性之下,大模型距离养家糊口的距离太远。那么,大模型PMF的终极阻碍是什么? 从上述案例中我们不难看到,首当其冲的难关在于定制化。 这背后的逻辑是,技术尚未进入创新扩散周期之前,依靠标准化产品回笼资金遥遥无期,高强度的BD以及其后的定制化是现金流的唯一来源。而定制化项目扯皮、交付、成本等各种窘境的缘由,则在于服务商丧失了对需求的控制力。 设想一下,如果是模型服务商自己训练某个MoE模型或是针对业务创建AI应用,在技术一把手的统筹下,只需对应业务部门给出明确需求以及不同优先级,便可以按需求驱动的方式进行敏捷开发,确保项目能在时限内以较高完成度交付。 如果将AI开发场景放到模型服务商与客户之间,则情况很可能“两级反转”。一面是客户并不真正了解AIGC对业务创新的抓手所在,导致需求频出而没有重点,另一面是服务商在不断提出的需求中疲于奔命。 如果服务商能在提供服务时获取行业数据的话,转起数据飞轮从而迭代垂直领域能力倒也是一笔不错的买卖。只是大多体量稍大的企业都对自家数据敝帚自珍,导致定制化项目做来做去都没有太多实际收益。 可以预见的是,定制化作为大模型商业化的一个补充手段,很可能只是少数大客户的专属。标准化产品做铲子以及建立在其上的应用生态才是淘金者的未来。 AGI的愿景虚无缥缈,长期主义也不过是商业化举步维艰的推辞。无论是靠定制化拉起营收从而做好市值管理,还是靠标准化打开认知从而将创新扩散出去,这锅夹生饭怎么着都得把它吃下去。
黄仁勋最新研判:人形机器人未来或低至1万~2万美元,三大行业将迎来颠覆性变革
迪夫根(左)对话黄仁勋(右) 图片来源:视频截图 在4月17日于美国硅谷圣塔克拉拉会议中心举行的CadenceLIVE Silicon Valley 2024大会期间,英伟达CEO黄仁勋与Cadence公司CEO兼总裁阿尼鲁德•迪夫根(Anirudh Devgan)进行了一场深入的对话。Cadence由SDASystems和ECAD两家公司于1988年兼并而成,是全球最大的电子设计自动化、半导体技术解决方案和设计服务供应商。 这场前沿对话覆盖了多个话题,包括加速计算、人工智能(AI)的未来发展和能耗等问题。 黄仁勋认为,AI将在数据中心、机器人/自动驾驶、生命科学这三个领域带来革命性影响,人形机器人未来或低至1万~2万美元。 同时,对于目前广受关注的AI能耗问题,他表示,虽然AI会消耗大量计算能力,人工智能将彻底改变我们应对气候变化的方式,有助于使用更少的能源,提高能效等等。 没有加速计算,生成式AI难以实现 在对话中,黄仁勋强调了加速计算对于人工智能发展的重要性。他以加速计算给Cadence的数字孪生平台Millennium带来的诸多益处为例,一旦采用加速计算,生成式人工智能就有可能成为现实。如果没有向加速计算的过渡,生成式人工智能将很难实现。 他表示,加速计算与通用计算并不相同。在通用计算中,你可以创建一个处理器,它将运行所有代码,这绝对不是加速计算的情况。据他介绍,加速计算能够带来1000倍的X因子,在那之上还有另外30倍的X因子。而如果再加上生成式 AI,在此基础上就还有另外10万倍的因子。他提到,设计工具通常只进行一次处理,但设计师实际上需要进行多次探索,以寻找多维多模态下的最佳解决方案。而人工智能将帮助我们深入特定领域进行探索和优化。 黄仁勋称,他发现,一个程序中的一小部分代码代表了工具的大部分运行时间。例如CFD(计算流体力学),它可能只用3%的代码,代表运行99.9%的时间,而剩余的97%的代码可以用 AI 和加速计算进行重写,使得应用程序加速10万倍。 作为“加速计算”一词的创造者,他说道:“如果我们不转向加速计算,如果不转向AI,计算机行业可能会经历反摩尔定律,原因非常清楚,我们所做的工作量和计算量都在增长,但是CPU的扩展速度已经放缓,因此我们的计算成本将会增长,而不是降低。” 图片来源:视频截图 人形机器人未来或低至1万~2万美元 在被问及英伟达参与的哪些行业会令其在短期或中期内感到非常兴奋时,黄仁勋表达了对数据中心/计算、机器人/自动系统和生命科学这三个行业的极大兴趣。 谈及机器人/自动系统这一领域时,他表示,无论是汽车还是卡车,披萨外卖机器人还是人形关节自连接机器人,这类系统有很多共性,它们都需要有许多传感器,更重要的是需要功能安全。设计计算机和验证计算机的方式,要求操作系统不是普通类型的操作系统,这一点非常重要。 他认为,人工智能的使用非常广泛,这些系统将随时连接到云,连接到数据中心,这样它就可以更新体验,报告故障和新的情况,然后下载新模型。“可以说,我喜欢整个自动系统领域,它是一个全新的类别。” 黄仁勋在对话中提到,人形机器人的制造成本可能比人们预期的要低很多。“你可以买到1万~2万美元的汽车,为什么不能有1万~2万美元的人形机器人?机器人很可能在一个为人类设计的环境中,表现得比人类更灵活、更多功能。” 而在谈到生命科学这一话题时,他表示,他希望将生物学变成一个工程领域,科学发现过程非常重要,但它是零星的。 他认为,无论如何,数字生物学将经历一场全面的复兴,科学和工程越来越紧密,这是一个非常复杂的领域。“显然,我们在芯片设计中不谈论薛定谔方程,因为我们改变了晶体管,直到我们可以避免薛定谔方程。而在生物学中,显然薛定谔方程是必要的。所以我们有很多需要创新的东西,我们第一次有了必要的工具,计算系统和算法帮助我们处理非常大且非常混乱的系统,数据驱动的方法与你之前所说的原则性模拟方法的融合可能会给我们一个机会。” 他在对话中强调,“我认为这三个行业的市场规模都将非常庞大,单是人形机器人的市场规模就已足够大。” “能源黑洞”?AI将彻底改变人们应对气候变化的方式 对于人工智能的能耗问题,黄仁勋坦承,“加速计算的能耗非常高,原因是集成的计算机数量非常多。” 不过他也表示,对电源利用率进行的任何优化都会直接转化为更高的性能,这种性能是可以衡量的,因为更高的工作效率会产生更多的收入,或者直接转化为在相同性能的情况下,购买更小的东西所节约的成本。 “人工智能实际上可以帮助人们节省能源。” 他举例称,一次模型训练的投资会让数百万像他一样的工程师从中受益,未来几十年内,数十亿人将享受到节省的成本。节省的成本和能耗应从整个跨度上纵向来考虑。他认为,从纵向来看,人工智能将彻底改变人们应对气候变化的方式。 黄仁勋强调,通过投资加速计算、AI、数据中心等领域,人类能够设计出更好、更节能的产品。“你设计一次芯片,但能够以万亿倍的速度出货;你建造一个能够节约6%电力的数据中心,节约出的电力可供10亿人使用一整天。因此,通过设计更好的软件、芯片和系统,我们为世界节省的能源将对社会产生永久的效益。一方面,人工智能消耗更多的电力和数据中心;另一方面,通过更好的产品设计、更好的计算机、更好的汽车、更好的手机和更好的材料等等,我们将减少其他98%的电力和能源消耗。”
起底黄仁勋:为何中国没有英伟达?
作者|关不羽 英伟达(NVIDIA)这个生涩的单词源于拉丁语Invidia,意为“嫉妒”。用这个“坏词”命名自家公司,的确体现了这家初创企业的反叛精神。 英伟达(NVIDIA)又一次上了媒体头条。上周五(4月19日),英伟达股价暴跌10%,这是继2020年新冠疫情爆发以来的最大单日跌幅。一天之内市值蒸发2100亿美元,相当于跌没了2.6个OpenAI。 作为“一年十倍股”,英伟达无疑是人工智能时代最大的宠儿,OpenAI负责赚台前的利润,它负责赚幕后的利润。各大AI公司不论开发大模型成功与否,不论技术开源与否,甚至不论最终死活,只要踏足这个行业,就要买英伟达的芯片。英伟达成为了真正意义上的那个守在金矿入口处卖铲子的人:不管能不能挖到金矿,铲子总得买一把吧? 2016年英伟达捐赠给OpenAI一台全球首款一体化深度学习超级计算机DGX-1,成为了OpenAI初期的重要转折点;今天,英伟达的GPU产品占据了人工智能算力市场90%以上的份额,其GPU产品的利润率高达1000%,可能是世界上最赚钱的合法生意。 英伟达的崛起,是一场“计划外”的技术革命。今天统治着人工智能产业的GPU,前身不过是小小的显卡,一个主要为电子游戏产业服务的小玩意儿。 01 创立英伟达,源于对妻子的承诺 提到英伟达,就不能不提黄仁勋。外号“老黄”的黄仁勋是硅谷任职最长的CEO,执掌英伟达30年足以当得起这个“老”字。除了硅谷资深的骨灰级玩家身份外,老黄穿皮衣、秀纹身、口无遮拦的“非主流”人设,更让人印象深刻。其实,和所有的人设一样,真真假假,多少有些刻意营销之嫌。 比如老黄童年的“少管所”经历。黄仁勋1963年生于中国台湾的台南市,早年随父母赴泰国生活。9岁时他和哥哥一起,被送到美国的舅舅身边接受“美式教育”,却落入了问题少年扎堆的乡村寄宿学校,老黄说这所学校更像是“少管所”。这段“非主流生活”,老黄自己津津乐道,媒体更是积极传播。 其实,黄仁勋在那个肯塔基乡下学校只待了两年,此后的人生和硅谷华人技术精英的成长路线别无二致:在正规学校当学霸,以天才之姿进常春藤名校,毕业后进入硅谷高科技企业,一路顺风顺水,毫无波澜。 1984年,走出校门的黄仁勋进入了芯片企业AMD公司,成为一名芯片设计工程师。当时的AMD专攻CPU芯片,是英特尔的竞争对手之一。二十年后,黄仁勋还会和这个“老东家”演绎分分合合的恩怨情仇。 1985年,黄仁勋跳槽偏向于图形处理的芯片商巨积(LSI Logi),任职数年,收获颇丰。干了两年芯片设计师的老本行,深度接触图形处理芯片技术后,黄仁勋主动申请调至销售部。硅谷的华人科技精英有性格内向、擅长技术不擅长与人打交道的刻板印象,黄的这一调职申请确实显得有些“另类”。 黄仁勋在回顾往事时这样评价自己的选择,“从工程部转到销售部,这是我曾经作出的最佳职业选择,我逐渐学会了产品的设计开发如何与市场结合。因为我意识到,消费者并不关心你从哪家商学院毕业,他们只关心一件事,你的产品对他有什么好处。”很快,黄仁勋就以优秀的销售业绩,证明了自己的才能,晋升业务部主任,后又升任“系统集成芯片”总负责人。 这个“系统集成芯片”大有讲究。八十年代后期,随着计算机应用的日益广泛,图形处理的市场需求增长,图形处理的科技路线出现了分化。一条技术路线是系统集成,即CPU芯片集成图形处理功能,CPU芯片绝对霸主英特尔就是系统集成路线的代表。 当时CPU代表了计算机的核心算力,图形处理再重要也只是个附加功能,所以英特尔等CPU大厂并没有大力投入自研,而是找供应商买现成的做系统集成,LSI Logi就是其中之一。也就是说,黄仁勋执掌的“系统集成芯片”业务部门,是个伺候“大甲方”、兼具市场和技术的跨界部门,很适合既懂技术又懂市场的老黄。 但是,黄仁勋并没有选择企业高管的舒适区,他以敏锐的市场感觉,选择了另一条技术路线——开发独立显卡。他会在这条道路上狂奔30年,最终做成了硅谷的“最牛乙方”。 1992年,黄仁勋辞去了巨积的职务。选择这一年正式创业,有两个原因:其一是取得了斯坦福的硕士学位,学业有成放手一搏;其二是他和妻子承诺“三十岁拥有自己的公司”,到了兑现诺言的时候了。 1993年初,黄仁勋和两个好友拼拼凑凑攒了14万美元,组建了自家的公司。创业地点是在一家老黄早年打工的连锁快餐店,直到他们注意到窗上的弹孔,才意识到高速公路边上的快餐店不适合当办公室。 这套“车库创业”式的励志故事是硅谷早期创业的标准模版,九十年代初是科技群雄起于草莽的时代,很多年轻的硅谷创业者都有相似的经历,倒也算不上有多少特色。 比起硅谷精英人设标配的“车库创业”经历,更值得玩味的是公司的命名——NVIDIA。这个生涩的单词源于拉丁语Invidia,意为“嫉妒”。用这个“坏词”命名自家公司,的确体现了这家初创企业的反叛精神。但这也算不上特立独行,硅谷科技精英在命名自家产品和公司时整活儿,算是基本的才艺秀。 “嫉妒”更多地反映了当时图形处理芯片技术高度“内卷”的紧张状态。黄仁勋后来回忆说,当时显卡行业已经有了250家同行,卷的不行。之所以这么“卷”,是因为与CPU这样的高端芯片技术相比,图形处理芯片的技术门槛和资金门槛都要低得多,吸引了很多新手进场搏一搏。用我们最熟悉的话语来形容,九十年代的显卡创业是“乱相丛生”、“无序扩张”。新生的NVIDIA也是诸多“乱相”之一。 1993年,黄仁勋在他三十岁生日时入驻新公司的办公室,实现了对妻子的诺言。这是值得大书特书的浪漫,是老黄诸多人设中最亮眼的一笔。但是,创业终归是门生意,情怀满满也不能改变市场竞争的残酷现实,黄仁勋的创业之路异常坎坷。 02 老黄能屈能伸,该低头时就低头 经过两年的准备,1995年英伟达推出了第一款显卡产品NV1。英伟达的“首秀”没有天命之子的出道即巅峰,而是一步错步步错的连续踩坑,很快就陷入了破产边缘的窘境。 平心而论,NV1是一款诚意满满、颇有卖点的野心之作。在技术路线上,NV1整合了3D和2D的图形处理功能,理念超前。在市场方向上,老黄精准地锁定了图形处理需求的主要客户——游戏厂商,诚意满满地把声卡和手柄控制单元集成进了NV1。但是,这样大而全的功能配置不可避免地增加了成本。NV1售价399美元,是同类产品的两倍。更为致命的是,NV1采用了小众的四边形成像技术,兼容性很差。 又贵又小众的产品,即使性能卓越,也无法赢得主流市场。NV1在商业上并未取得成功。值得庆幸的是,专门为游戏机厂商服务的功能设置赢得了大洋彼岸的知音。大名鼎鼎的日本游戏业巨头世嘉(SEGA),成了英伟达第一个“命中贵人”,世嘉的格斗类游戏VR战士成为NV1上的首款3D游戏,更是投资700万美元作为研发NV2的定金。这笔定金足够“包养”英伟达好几年。只要英伟达在“包养”期间成功推出NV2,就能和世嘉新一代游戏机百年好合,从此幸福地生活。 然而,故事并没有按照王子和公主的童话剧本展开。700万美金的雪中送炭还没有捂热,英伟达就迎来了宿命之敌3Dfx。“嫉妒”一语成谶,显卡时代天命之子、一代传奇3Dfx让英伟达“嫉妒”很久。 3Dfx创立于1994年,比英伟达小一岁。迟到一年和强烈的主角光环相比,无足轻重。3Dfx的四位创始人背后是多家图形处理技术公司,技术底蕴雄厚。100万美元的初始投资,在门槛不高的显卡初创企业中可算是“含着金钥匙出生”。有钱有技术的3Dfx出手不凡,1995年底推出的第一款产品Voodoo,以其强大的性能,被誉为第一款真正意义的3D图形加速器。 当时方兴未艾的3D游戏,一夜之间就有了“两个版本”,一个是没有Voodoo的低配版,另一个则是有了Voodoo的顶配版。如此明显的性能差异,市场选择毫无悬念。仅仅用了一年时间,Voodoo的市场占有率就达到了85%,大有一统显卡市场之势。强敌横空出世,直接导致英伟达的NV2腹死胎中,已经生产的十几万张NV2显卡报废了。 NV2的彻底失败,也有自身的因素。英伟达固执地坚持兼容性和性能表现都不好的四边形成像技术,惹怒了世嘉。1997年世嘉宣布和3Dfx合作新一代主机的开发,英伟达成了最大的输家,几乎到了破产的边缘。好在世嘉公司没有立即收回700万美元的开发定金,给黄仁勋留下了力挽狂澜的机会。 老黄的应对之策是向世嘉CEO入交昭一郎坦诚沟通,后来他在台大演讲时回忆那次生死攸关的沟通时说“面对我们的错误,以谦卑的态度求助”。最终入交昭一郎同意了他的请求,世嘉同意不收回之前的投入,给英伟达开发下一代产品的时间。 入交昭一郎“放过”英伟达的决定,老黄坦诚沟通的“感情牌”无疑是有作用的。但是,商场如战场,涉及700万美元的重大决定,纯粹因为“感情牌”的奇迹也很难令人信服。世嘉应该还有更深层次的商业考虑。 首先,3Dfx以业界新星的强势姿态出道,迅速形成压倒性的垄断优势。为了避免这种垄断优势的扩大,扶持其竞争对手是明智的选择。其次,Voodoo虽然性能优异,却也价格昂贵。因为Voodoo没有集成2D功能,新一代游戏主机还需另配2D图形处理器。英伟达的NV1一开始就集成了“3+2”功能,有改善性价比的技术空间,值得“放他一马”。 此外,3Dfx出道即巅峰,明星气质十足,行事风格颇为霸道,世嘉和3Dfx之间的合作基础并不稳固。实际上,世嘉后来确实放弃了3Dfx,而是和日本的NEC合作开发了新一代主机。 市场竞争,赢家通吃,但是市场天然排斥垄断,这给了英伟达起死回生的机会。 其实,黄仁勋也没有把宝全部压在“感情牌”上。和世嘉成功沟通后,他主动联系了台积电老总张忠谋,以后辈的谦逊姿态,成为这位半导体产业大佬、台商大前辈的小朋友。今天号称“最强硬的乙方”、和英特尔、苹果、AMD、ATI等巨头“打成一片”、经常把“不和解”挂在嘴边的霸道总裁黄仁勋,当年也是能屈能伸、放低姿态的老黄。 人设当然不是虚构的,但人设并不是全部真相。 03 显卡大战:营销大师,擅长“阉割” 经历了NV1、NV2失败的劫后余生,黄仁勋的经营理念走向成熟。英伟达走上了市场需求优先、拥抱主流标准的务实路线。 1997年4月, Nvidia正式推出了第三代产品NV3即Riva 128。这款产品果断抛弃了四边形技术,成为全球首款支持硬件三角形引擎的128bit 3D图形处理芯片。同时继续发挥“3+2”的初始特长,把性价比路线贯彻到底。单以3D性能衡量,Riva 128比不过专攻3D技术的Voodoo。 但是,胜在200美元搞定一切的性价比——花300多美元装了Voodoo,还得另外买块2D芯片,否则连windows也进不去。一百多美元的差价,对PC厂商、游戏机厂家和众多平民玩家无疑是有吸引力的。Riva 128因此大卖,一年出货100多万张,英伟达这才真正搭上了3D游戏热的风口。 不过,即便有了“百万加”的销售业绩,英伟达依然并没有追上3Dfx的脚步。1997年11月,3Dfx推出了Voodoo2,再次以高超的3D性能碾压竞争对手,成为高端玩家的首选。而且,Voodoo2还开创性地采用了SLI技术,实现了两块显卡串接发挥极致3D处理能力。这一技术在当时并没有引起业界的高度重视。 毕竟Voodoo2太贵了,装一块都是奢侈品,串两块的极致体验只属于少数顶尖玩家,这样的技术曲高和寡。直到多年后SLI成了多重GPU技术的起点,成为英伟达的制胜法宝。 Voodooo2的性能碾压,迫使英伟达再次升级。英伟达针对性地推出了Riva TNT系列,这款以TNT炸药命名的产品就是为了“炸”Voodoo2而诞生的。TNT较前代增加了一根像素管线,支持32位色深,理论上达到了VooDoo2的两倍。然而,TNT的实际表现不尽如人意,高功耗和高温的缺点是真的有点“炸”。老黄的处理方式非常简洁——降频,最初这是不得已的技术处理方案,后来竟成了N家的“传统技能”,隔三差五表演一回。 标准的流程是新品发布的性能指标爆表,吸引市场注意力,出现高功耗、高温的问题后降频处理,推出系列的“阉割品”,即实际使用的性能表现打点折扣,反正是能用的。后来英伟达推出的“核弹芯片”、“风扇芯片”,都如法炮制,阉割得相当精准。 这种营销实用主义的极致操作,为老黄赢得了另一个广为人知的绰号“皮衣刀客”。这个绰号很酷,却是揶揄的成分居多。 不管怎么揶揄老黄,Riva TNT系列毕竟给出了平替Voodoo2的选择,就算是降频处理,32位色深加持之下的性价比是真“香”。后来推出的TNT2系列,性能表现更上一层楼,系列中的高端产品性能表现不输Voodoo2。 英伟达和3Dfx的产品针锋相对,你方唱罢我登场的竞争看上去还将持续很久,结局却提前到来——3Dfx倒下了。转折点是1999年3Dfx发布的VooDoo3,依旧是16位色彩渲染,看上去像是VooDoo2套了个马甲。玩家们倍感失望,3Dfx的显卡江山丢失了大半,只剩下死忠粉坚守的高端市场。 3Dfx并没有从这次失败中清醒过来,在脱离市场的“作死”道路上越走越远。 1999年初3Dfx收购板卡制造厂STB,这是一石二鸟的“阳谋”,打击对手,壮大自己。STB是英伟达的主要合作伙伴之一,3Dfx的收购有挖竞争对手墙脚的用意。而且,通过这次收购,3Dfx从“无厂芯片制造商”升级为“捧牢自家饭碗”的自产自销,增加了在市场博弈中的话语权。但是,这次理论上的“成功的收购”,引发了一系列的严重后遗症。 STB此前从未和3Dfx有过业务交集,收购之后的磨合异常困难。与此同时,为了保证“自家的饭碗”优先,曾经为3Dfx打江山立下汗马功劳的第三方制造商纷纷被收回授权、扫地出门,受害者包括华硕、帝盟、技嘉等行业巨头。这些被抛弃的老伙计大部分都被英伟达收入麾下。最终的结果不是3Dfx成功“偷家”,而是英伟达成功“换家”。产能大增,降低成本、产品多元化的能力更强了。 1999年下半年,英伟达推出划时代的产品GeForce 256,敲响了3dfx的丧钟。GeForce 256的设计概念,早在1996年就已经公诸于世,当时就引起了震动业界旋风。3Dfx在Voodoo3之后的产品研发,都有针对GeForce 256的竞争意识。然而,Voodoo4性能太差,Voodoo5价格太高,Voodoo TV更是吃错药似的,剑走偏锋和电视搞多媒体集成。反正是一个能打的也没有。 2000年3月,3Dfx最后一搏,以1.86亿美元的天价收购了Gigapixel的公司。此举是为了获取技术弥补产品技术的不足,为上市做最后的冲刺。然而,一切都是徒劳。第二季度财报发布,销售业绩几近腰斩,3Dfx失去市场竞争力的现实大白于天下,重金收购的最后一搏耗尽了最后的现金“子弹”,巨人退场进入倒计时。 2000年12月15日,3Dfx发布了最后的财报,业绩惨淡无可救药。同一天,3dfx宣布倒闭,以7000万美元的低价“卖身”老对手英伟达。 被GeForce 256“卷”走的不只是3Dfx,1996年到2001年,全球显卡制造商从45家减少到12家,3年卖出1亿张GeForce 256的英伟达成了最大的赢家,从此不再“嫉妒”,成了被“嫉妒”的对象。 这场悲壮的最终对决,并没有为老黄增加多少人设素材。市场竞争归根结底是比的是产品,而不是华丽的人设。老黄没有做什么出格的动作,只是打造了一个划时代的产品,打开了通向新时代的大门。GeForce 256,一款性能卓越的显卡,也是第一个被明确定义的GPU产品。 04 黄仁勋究竟是不是“GPU之父”? GeForce 256问世时,玩家用户关注的是它强大的图形处理性能。然而,这款产品真正划时代的意义不只是呈现华丽的图像,而是独立于CPU之外的“算力革命”。 其实,这种独立性并不是GeForce 256首创的,九十年代的日本显卡厂商就曾有过类似产品的早期版本,从3Dfx手上抢走世嘉新一代主机的NEC就有过这样的产品。但是,以忠诚服务甲方为己任的日本同行并没有意识到“这一小步”的革命意义,没有沿着独立开发GPU的技术路线走下去。英伟达在GPU领域的主要竞争对手ATI也在1998年制造出了具备独立图形处理能力的显卡,也没有赋予它单独的产品概念。 因此,老黄自居“GPU之父”一直存有争议,有“老黄爱吹牛”之嫌,但是没人能否认他的确是GPU的定义者。老黄也许并不是GPU的“肉身”之父,却是GPU的灵魂缔造者。 英伟达在产品发布会上用精确而又通俗的方式,向公众解释了GPU和CPU的区别。CPU好比是个数学教授,可以解高难度的微积分,而GPU就像是个小学生,只能做简单的加减乘除。单独一块GPU的计算能力,远不如CPU。但是,就像一个教授只能一次解一道难题,CPU必须按部就班地一步步解题,而GPU却可以一百个小学生同时解一大堆四则运算题,这就是GPU的“并行计算”能力。 所以,面对大量简单重复的计算任务,GPU的运算效率远超CPU。结构更简单甚至可以说更“低技术”的GPU却有更大的算力提升空间和更灵活的算力应用。这种应用潜力后来被总结为通用计算能力。这就是GPU算力革命的划时代意义。 总之,GPU概念被清晰的提出,意味着这一产品有了独立的技术定位和技术发展路径。 老黄定义了GPU,意识到了GPU有巨大的应用潜力。但是,率先开发GPU新应用的,不是制造GPU的老黄,而是市场需求。 科学家对GPU并行计算显示出巨大的兴趣。科学研究给人高深莫测的印象,然而在真实的研究过程中,真正消耗科研工作者大量精力的不是创新的脑力劳动,而是大量简单重复的计算。GPU的并行计算无疑是解放科学家脑力的最优解。 但是,这一市场需求并不容易在商业上实现。从商业角度看,科研计算是一个小而分散的市场,总规模不过几十亿美元。如此小的市场,应用场景的差异却很大。这意味着大量的研发资金投入到一个小众需求里,怎么看都是个大炮打苍蝇的鸡肋生意。 黄仁勋依然决定架上大炮打,2006年CUDA诞生。CUDA是为英伟达GPU设计的运算平台和编程模型,有了这个工具,用户可以自行编程开发,这让GPU的算力真正变得通用。想法很前瞻,科研工作者很欢迎。但是,大举开发科学计算这样的小众应用实属逆天,英伟达再次陷入生死困境。 英伟达为CUDA付出的代价是高昂的,全员开发导致英伟达成本激增,影响了业绩。更难堪的是,安装CUDA逻辑电路牺牲了产品性能,2008年闹出了轰动一时的“显卡门”事件——安装英伟达两款CUDA电路显卡的电子产品出现了显示异常的问题,消费者集体诉讼,苹果、戴尔等大客户也对英伟达十分失望。 最糟糕的是,“显卡门”的持续发酵还让英伟达失去了手机芯片业务的大蛋糕。一连串打击之下,2009年、2010年英伟达出现了罕见的亏损,直到2011年才勉强回血。 华尔街对热衷CUDA英伟达发出了最强的警告,对CUDA估值竟然为0,侮辱性和伤害性高到爆表。股价更是跌跌不休,“黄为什么要做CUDA这种没人用的东西?”成了华尔街的热门话题。 十年之后,AI崛起,英伟达登上王座。所有质疑烟消云散,都化作了鲜花掌声。CUDA不仅赋予了英伟达GPU真正的通用计算能力,还打造了完整的软件生态,这成了英伟达垄断人工计算算力供应的护城河。竞争对手的产品如果没有压倒性的性能优势,那么已经习惯CUDA生态的用户是不会放弃英伟达的GPU产品的。 90%的市场份额、1000%的利润,都是这条生态护城河的成就。 这种生态优势在IT行业并非首创,微软视窗系统的成功就是生态覆盖的胜利。但是,黄仁勋的成功并非“抄袭”微软。因为老黄豪赌CUDA时并没有清晰的生态意识。他后来回忆这一逆天改命的重大决策时说“我当时认定的是投资加速运算,我相信加速运算如果能成功,一定会有更大的市场”。至于结果,他说“船到桥头自会直”。老黄不是先知,更不是穿越者,也不是一个追求乌托邦理想的科技极客,在皮衣纹身的另类人设包装下,他是一个拼市场的科技商人。这就是黄仁勋的底色,人设之外才是真相。 创始人的人设已经是硅谷科技企业的营销模版,这些聪明的科技精英们知道大众想要看到什么——理想主义的科学狂人、浑身反骨的叛逆者、对抗华尔街的英雄。硅谷的科技精英很乐意为大众提供这样的“增值服务”,好产品搭配好故事就是更好的产品。这些精心准备,再经过大众媒体传播再创作的人设,并非纯粹虚构。 比如六零后的老黄,在嬉皮士文化鼎盛的时代成长起来,皮衣纹身的时代烙印当然是真实的。这些看似非主流、高度个人化的文化元素,无疑会影响他的经营方式、企业战略,但是万变不离其宗的是商人本色,科技商人也是商人,对市场的判断、对产品的追求、在风险与收益之间权衡取舍,与古往今来的商业人士没有什么不同。 所有成功的企业家,都有相同的企业家精神。他们不是市场的先知,而是市场的先行者。他们发明、创造、定义了自己的产品,甚至自己都未意识到这些产品的全部意义。因此,他们的成功或多或少都有偶然的幸运,比如对手的失误、新生的市场需求,这些都在他们的计划之外。 但是,市场没有侥幸的赢家,机会总是留给最有勇气、准备最充分的赢家。黄仁勋就是这样的市场赢家。他和英伟达能不能继续赢下去,并不重要。因为只要开放的、充满竞争的市场存在,新的、更好的产品就会源源不断地被创造出来,每一个人都是这种创新活力的受益者。 05 呼唤中国自己的英伟达 显卡诞生时,没有人会想到这个资金门槛不高、技术含量有限的边缘产业会成为算力革命的起点,最终成为打开人工AI时代的钥匙。这是一个“计划外”的奇迹。这个创造奇迹的机会曾经公平地摆在各国面前,其中也包括中国大陆。 其实,中国大陆的显卡研发起步并不晚。和当时的很多科研领域一样,我们的显卡研发流程是很标准的计划流程——科研机构的实验室“成功填补国内空白”,然后是“国家队”的国企龙头宣布商用化成功。 1992年,中国科学院计算技术研究所成立了显卡研究室,开始了国产显卡的研发工作。1994年,中国科学院计算技术研究所研制出了国内第一款显卡——“天河一号”。1997年,中国科学院计算技术研究所与中兴通讯合作研制出了第三代显卡——“天河三号”,这是国内第一款商用显卡。然后,就没有然后了:没有“乱相丛生”,更没有“无序扩张”,队形整齐、行礼如仪。 即便我们还能多走两步,也走不了多远。显卡最大的需求来自游戏产业,这是很多国人咬牙切齿、恨其速死的“精神毒品”,无数的管制和限制之下,我们这个全球最大的游戏消费国却始终没有成熟的游戏产业生态,作为游戏产业重要分支的显卡产业能走多远? 没有游戏产业的良好生态,十个、百个黄仁勋又能如何呢?即使有了英伟达,还没有成长到90%的市场占有率,就会死于“垄断恐惧症”的口诛笔伐之下。 中国没有皮衣刀客老黄,没有自家的GPU产品,一切都在“计划”之中。往事不谏,成事不说,人工智能时代的大门已经打开,眼前这一步要怎么迈出,总要有个思量。2023年9月5日中国工程院郑伟民院士谈国产GPU时说到“60%硬件性能+好生态,好过80%硬件性能+坏生态”,非常中肯。技术生态很重要,但是没有好的市场生态就没有好的产业生态,没有好的产业生态又怎么会有好的技术生态呢?这是我们必须面对的问题。
数码厂商都去隔壁打野的时候,小度想用AI机器人“偷家”?
上个礼拜,憋不出稿子的世超,和差评君一起去深圳,参加了百度开发者大会。 会上李彦宏发布了一款,最新的基于文心大模型的添添 AI 平板机器人。 这款机器人号称是大模型的大集成体,因为不同于那些行业向的感知,这款产品试着把技术,真正送到用户的身边。。。 其实吧,在过去一年多,作为编辑部指定的 AI 产品人肉体验器,世超把玩过的 AI 工具、应用,不说一千个,上百个肯定有了。 但不少体验很一般。 因为它们中的大多数,现阶段呆呆的。 打个比方,那些装了原生大模型的工具,看似功能强大,但无论问啥,它都会写小作文,车轱辘话说个没完没了。 看似智能,实则智障。 有些 AI 工具虽然用了更实用的小模型,可一个没处理好,经常胡言乱语或者一个劲地说 “ 我不会 ” 。 以至于在用 AI 工具之前,你自己得先给问题评级分类,然后再从 AI 工具海里找到适合的。。。 而按介绍,添添 AI 平板机器人就不一样了,基于文心大模型技术的它,能够在处理不同工作时,分别调用不同的大小 AI 模型。 既能在需要的时候处理复杂任务,面对简单的指令时,也比只会用文心大模型的版本,响应速度提升 2 倍、成本下降 99% ,更聪明的同时,还能省钱省时间。 冲着这种表现,勾得世超心里痒得不行,好在差评君神通广大,当天就给我搞到了这个挤眉弄眼的小家伙。 等咱们在办公室掏出添添 AI 平板机器人,分分钟就引起了围观。 当编辑部的小伙伴们听说这是首款基于文心大模型的机器人,进一步提高了大家的期待值,时不时就有人来围观我的搞机现场。 毕竟,编辑部内部在试了这么多大模型后,文心一言一直口碑爆棚。 文心一言在内部的一些评价 结果一顿操作下来,大家几乎一致觉得这小子当得起两个评语,优雅而且精准。 优雅到什么地步呢? 这么一个底座是个品质音响、背后自带磁吸充电,连接处自带电机转动轴,前面还是个文心大模型加持的智能 PAD ,四项合一让你知道什么叫高颜值全能王。 不是我吹,颜值、气质这块拿捏的死死的。 光把这个产品静静放在那里的时候,息屏之后,如果选择设置成名画壁纸,高级; 如果选择换成眨眼萌的小度,可爱。 根据我的摸索,发现它居然有自己的 “ 生活节奏 ” ,比如无聊的时候丢纸飞机玩、上班的时候狂敲键盘,放歌的时候自带麦克风。。。 而且这些节奏基本能对应上我们真实世界时间点,比如 12 点左右大口吃甜甜圈、下午一点左右搁那午睡。。。 当然了,你也可以用自家的宝宝、自己的男 / 女朋友、全家福等等,就像我们这样。 而且,不论你在任何时候、任何角度,只要叫小度,它就会根据声源和人脸跟随你。。。 比如在追剧的时候,你走到哪,就跟随你到哪,这就很丝滑。 大家也别以为底座就是个摆件,其实人家是个高品质音箱。 抛开颜值不说,这个音响扬声器覆盖的是羊毛材料,而羊毛可以帮助减少高频的刺耳感,增加声音的柔和度,以及改善中频的饱满度。 突出一个润字。 实际效果呢,就这么说吧,隔壁小黑胖放《 谢天谢帝 》的时候,就连火锅的尾巴甩起来都有了节奏。 除了颜值和音质的优雅,精准这个特点就更夸张了,它给我的感觉像个人。 因为有了文心大模型给添添 AI 平板机器人来了波 “ 焕脑 ” ,它能像人一样记住上下文、也更聪明,在互动的时候,能更丝滑。 比如你让它扮演个猫娘,你和她唠上半小时,都还在 “ 喵喵喵 ” 的。 而且这个小度还特别有好奇心,你和它聊天的时候,贼喜欢每次回答完你问题之后,反手给你抛个问题。 这种高强度的互动,有的时候我都有点招架不住它的热情。 除了 “ 好奇心 ” 重,它出色的 AI 能力也体现在其它方面。 咱就拿它的语音唤醒体验举个例子。 以往咱们用一些 AI 设备,语音唤醒很多时候很鸡肋: 真喊它的时候不理你,没事儿的时候动不动抽风来一句:我在。 这就不得不实名举报隔壁小发桌上的某款 AI 助手,午休的时候总突然来段 Rap 。 小度就牛了,在编辑部这么闹腾的环境下,识别距离和精准度 “ 遥遥领先 ” 。 基于这种能力之上,它还能设置成只喊小度 + 你想要问或者要小度做的事。 这种感觉,有点类似一个能揣摩透你心思的小马仔,大大减少了那种 AI 对话的味道了。 进一步的,在功能上,有了文心大模型加持的添添 AI 平板机器人,几乎可以全方位优化家庭、工作、娱乐等等使用场景。 咱们这么简单玩了两天,就在各种细节上,感受到它有时候充满人味。 比如现在很常见的一个画面就是,宝妈在家带娃,这边有点工作要处理,那边娃闹着要玩手机。 如果随便拿一个 PAD 啥的给娃,长时间使用普通 PAD 容易伤眼。 可要是用上添添 AI 平板机器人,就能解决这个烦恼。 首先它的这块 AI 平板屏幕通过了莱茵低蓝光认证,是一款 DC 调光无频闪的 AG 类纸屏,可以大幅减少对孩子眼睛的危害。 而且它还能自动检测坐姿,从而方便根据孩子不同身高,自由调节角度,提供最合适的使用角度。 不仅如此,普通的平板给了孩子,很容易就成了游戏机、视频播放器,最后学习 5 分钟,游戏 2 小时。 添添 AI 平板机器人,则能有效避免这个问题。 因为你基本上可以直接把不想给孩子用的 App 给禁用了,要想恢复使用,得通过你手机上确认才行。 不仅如此,你还可以在手机上直接找到添添 AI 平板机器人的使用记录。 这操作,不得比小时候老妈手摸电视机温度来得更恐怖。。。 小发听世超说到这个功能,已经种草准备给家里的小侄子来一个了。 而且,添添 AI 平板机器人可以充分发挥它的 AI 能力,比如利用 AI 绘画,帮宝宝的简笔画一键生成超级超级超级精美的画作。 它也能凭一张简笔画,加点简单的剧情,轻松生成一个精美的绘本。 我们也试着用火锅来生成了个绘本,效果还挺好的。 制作绘本 绘本效果( 这还是有声书哦 ) 我们去市面上看了下有声儿童绘本的售价,我只能说这功能确实很香。 除此之外,添添 AI 平板机器人还内置了很多数字人伙伴,比如我们找了一个度龙龙,奶声奶气地和他聊天。 这家伙还挺话痨,一顿对答下来,我们发现它有一个完整的故事背景,还有自己的朋友圈和成长轨迹,类似刚开始还是个蛋,等孵化出来才能看到什么样子,有个最好的朋友是只美丽的凤凰小美。 就我们聊了一会,感觉孩子完全能把他们当成一个虚拟好朋友。 除了这些 AI 伙伴,还有很多常规數字人扮演的不同角色,比如心理师、奶狗、甜妹等等。 我们逛了一圈,发现都是些深度调教的了 AI 角色,都能融入相应的角色身份和我们聊天。 当然了,抛开孩子、老人,像我一样的 “ 科技先锋体验官 ” ,添添 AI 平板机器人也足够帮我娱乐工作一把抓,甚至还有不少让我惊喜的丝滑体验。 比如只要是在使用添添 AI 平板机器人过程中,随时可以对照片、或者手动截图,进行文字识别提取、翻译、解释等等。 直接截屏识别、翻译外文 文档 OCR 识别并进行 AI 解释 视频会议的时候,也可以直接用基于文心一言打造的小度 AI 记笔记生成会议纪、智能做摘要啥的。 还有最特殊的一个惊喜就是,以前上网听歌、追剧,你得先绞尽脑汁去想片源在哪个版权方手里,再打开相应的 App 看才行。 而添添 AI 平板机器人聚合了市面上几乎所有主流的视频、音频软件。 只要一声令下,它自己识别片源、歌曲版权归属,直接就能播放你想看、想听的。 甚至,我在 5 点半时说想看新闻联播,它还提醒我新闻联播得 7 点半才有,给我放新闻频道好了。。。 所以,总得看下来,添添 AI 平板在获得了百度自家 AI 大模型助力后,已经走出了一条新道路: 从多维度感知真实世界,努力朝更不像机器、更人性化的智能机器人进化。 你还真别小瞧了技术的迭代速度,这两年, AI 火了之后,智能机器人的普及,问题已经不再是 “ 我是否会被其影响 ” ,而是 “ 影响会何时到来,会以什么形式出现 ” 。 前前后后也出现了很多类似的 AI 硬件。 什么 AI pin 、 rabbit 们,都在尝试着成为那第一个 AI 智能硬件。 但说实话,不少 AI 产品的噱头虽然足,可使用体验上并不全都尽如人意。 之前被冠以 “ AI 时代 iPhone ” 的 AI pin ,最近就引来用户的反对和退货。 这里面的原因很多,但我觉得大家容易忽视的一条就是,很多AI 公司并没有终端落地开发经验,而生态另一端的电子产品制造商,又普遍没有 AI 团队。 最终要么是产品过于理想化,使用体验一塌糊涂;要么就是产品细节都挺好的,就是和 AI 关系不大。。。 在我看来,这也是百度自身的一大优势所在,论 AI 有国内顶流文心大模型、论终端产品研发制造,也有小度的经验积累。 毫无疑问, AI 时代新型硬件终端的赋能、落地,依旧需要更多的公司下场,但或许,能在内部进行软硬件结合的企业,可能会具有一定优势。 过去的 2023 年,一直被行业称为大模型元年,海内外基础大模型爆发,这也意味着机器学习和人工智能技术进入了一个新时代,不少人开始对 AGI 开始了期待。 而今年,不少人期待它能成为大模型应用元年。 过去的几个月里,我们也的确看到了很多常用的 App 开始大面积接入 AI 。 这次不一样的是,小度坚持通过自身 AI 技术能力以及创新的产品理念相结合,将文心大模型深度植入到添添 AI 平板机器人上,从根本性上进行了一次硬件件终端与 AI 技术相结合的尝试,得到的产品用起来还挺香。 我们也能相信,这远远未到它的最终姿态,未来也期待小度能带来更多更好的 AI 产品,提高大家的生活品质。 当然了,夸了这么多小度,咱们也不是白夸的,我们再次用到了差评君的 “ 超能力 ” ,找到了小度官方那边,给我们差友们要来了专属福利。 撰文:八戒 编辑:江江 & 面线 封面:焕妍

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。