行业分类:
加载中...
头条分类:
加载中...
诈骗分子又搞出新花招:上门免费修宽带,顺手劫持固定电话
在智能手机极为普及的今天,固定电话这种古老的设备在很多人眼中早已是“时代的眼泪”。不过,固定电话的实际用户规模仍然比大家想象得要大。 工信部公布的数据显示,2023年,全国固定电话用户总数1.73亿户,大概每10个人就拥有一部电话。但万万没想到,国内存量规模庞大、使用率较低的固定电话,早已被电诈分子盯上了。 日前,《北京晚报》报道称,北京警方破获了一起利用居民固定电话实行电诈的案件。具体来说,犯罪嫌疑人假装成宽带工作人员上门维修,然后在居民家中安装了一款“机顶盒”。问题来了,一款接入宽带的盒子,怎么就会成为电诈人员的诈骗工具? 一次离奇的宽带维修:加装设备后,电话用不了了 看完《北京晚报》的报道后,小雷发现这起案件,源于一次宽带维修。最开始,住在北京朝阳区的王大爷获得了宽带公司工作人员的一次上门服务,家里免费安装了一款“黑盒子”。然而,很快,王大爷家中的固定电话就用不了了。正好,当地民警来家中临时走访,王大爷为此向他求助。而这名民警很快发现了这款“黑盒子”的不对劲,它和之前办案时见过的设备很相似,即VOIP语音设备。 (图源:《北京晚报》公众号) 民警马上判断这次宽带上门维修有问题,宽带工作人员是假冒的。他打着上门维修的名义,悄无声息地把黑盒子装上去。在被抓捕后,这名嫌疑人供述,他在网络上应聘了一份“安装设备”的工作。 他的“上级”将假冒宽带公司员工的工牌、工装以及要安装的黑盒子邮寄给他,然后线上派发上门安装任务。短短一个月时间里,他已经安装了几十台设备,目标基本都是老年人。 而这次东窗事发,还是因为王大爷发现了固定电话无法正常使用,并且刚好碰到了民警上门走访。至此,我们可以确定,这款长得像机顶盒的VOIP语音设备,绝对不是普通的网络设备。它对于居民宽带网络和固定电话的使用体验,起不到任何正面作用。 而且,它造成的危害,绝对不是影响固定电话的正常功能这么简单,还牵扯到了更加严重的违法犯罪活动。这名伪装成宽带员工的嫌疑人,背后还隐藏着一个电信诈骗团伙。 伪装的机顶盒,将固话变成电诈帮凶 一款安装在居民家中的假冒机顶盒,怎么就成为了电信诈骗流程中的关键一环? 要回答这个问题,我们就得先了解VoIP技术。VoIP的英文全称是Voice over Internet Protocol,说白了就是泛指利用互联网协议进行语音通信的技术。VoIP技术被广泛应用于互联网电话应用中,比如微软旗下的Skype网络电话,就利用了VoIP技术。 (图源:Skype) 小雷还记得,国内触屏智能手机普及初期,市面上也出现了不少主打网络电话功能的应用,比如云信、有信等。这类应用拨打网络电话时,中途需要转接到平台的服务器上,由该平台拨打给指定用户。因此,这类网络电话虽然资费便宜,但通话质量相对一般,而且对方手机上会显示为陌生号码来电。很快,这类互联网电话应用就在消费级市场上销声匿迹了。 而电诈分子利用VoIP技术在居民家中安装所谓的机顶盒,自然也是为了达到非法目的。具体来说,这类VoIP语音设备只要安装在居民家中,并且接入到宽带网络中,就能挟持固定电话。同时,电诈分子可以远程控制接入了VoIP设备的固定电话,利用它来拨打诈骗电话。 相比直接从境外向国内拨打电话,利用VoIP设备转接国内固话打电话,显然更具迷惑性。因为在受害者这端,来电显示的是国内号段和号码。比如说这次案件中,利用北京居民固话打出的诈骗电话,就会显示为010开头的号段。而境外打进国内的号码,则显示为海外号段,天然就会引起大家的警惕。 实际上,通过这类设备实现伪装和欺骗,已经成为电话诈骗流程中的关键一环。目前诈骗团队常用的设备,除了VoIP盒子,还有GOIP设备。GOIP的套路和VoIP大同小异,不过它劫持的不是固话而是手机,即远程通过国内手机号码来拨出诈骗电话。 此前,在公开报道中,我们看到过了很多相关的案件。海南省公安厅下辖的海南反诈中心曾提到过几个案例,犯案人员都是在学校宿舍或出租屋架设GOIP设备实施电诈。这些案件中,负责VoIP设备安装和GOIP设备架设的犯罪分子,基本都是在网络上应聘,以外围人员的形式成为境外诈骗团伙的帮凶。 (图源:海南反诈中心) 不过,开头我们提到的那个案件,还是有很多特殊之处。 首先,嫌疑人精心伪装成了宽带公司人员,连工装和工牌都有了,做戏做全套。背后电诈团伙会有专门的“客服”,海量打电话,有人上钩后确定地址,派出这位嫌疑人上门。 其次,宽带员工上门免费维修的套路,瞄准了老年人群体,甚至还赠送“机顶盒”,居民没有经济损失,很难让人怀疑,更不会一下子联想到诈骗。 而且,固定电话在国内保留量较高,但一般用户的使用率不高,诈骗团队植入了木马,短时间内不容易东窗事发。 另外,现在国内运营商基本都会监测手机卡拨打电话的异常情况,有时候打电话次数和时长不正常,可能会被运营商停机。而固定电话通常在这方面的限制会比较少,这也是它被诈骗团伙盯上的一个原因。 总的来说,利用VoIP和GOIP技术搭设电诈通话桥梁,非常具有迷惑性和隐蔽性,已成为电诈团伙精心利用的不法手段。 防范电诈黑盒子,辨别真假信息很关键 以往,我们在提到防范电信诈骗时,总会说到不要相信天下有免费的午餐。但从这个最新案例来看,即便是送上门、的确不用付出经济成本的免费服务,也很可能包藏祸心,一不留神家里的电话居然就成了为电诈分子的所用的“肉鸡”。 作为普通消费者,我们对于这类骗局的防范,最有效的手段恐怕还是得辨别真假信息,分辨出对方究竟是运营商官方还是假冒的诈骗分子。 正常情况下,运营商很少会主动派人上门维修升级宽带或固话设备。通常的流程,都是用户遇到具体的故障后,主动联系运营商客服,运营商再安装工程师上门处理问题。因此,接到自称来自运营商的要上门的电话时,最好第一时间主动联系运营商官方确认信息。至于直接上门的所谓运营商员工,基本可以直接拒绝了。 同时,如果宽带人员上门之后,家里出现网络卡顿、电话无法使用等故障,也要第一时间警觉。正常来说,家用宽带涉及到的设备就那么几个:光猫、IPTV机顶盒、固定电话、路由器。 如果维修人员无端多安装了一台设备,那么很可能就有问题。面对电诈人员的套路,除了要自己增强警惕心外,还可以密切关注反诈App、反诈中心提供的信息。碰到反常情况,直接拨打反诈电话或报警电话即可。 (图源:苹果) 当然,相对来说,部分老年人群体的警惕心和防范意识更弱,也更容易被安装VoIP设备的不法分子盯上。无论是作为晚辈的我们,还是运营商、社会机构、监管部门等,都应该为他们提供更多帮助,以各种方式来实时更新他们的反诈知识库,这样才能最大限度地破解诈骗分子的层层套路,更好地保护自己和他人。
中国第3代芯片材料崛起:产能足,价格低,卷死美国厂商?
众所周知,在很多原本高价的高科技领域,大家都说只要中国掌握了这一技术,那么马上厂商就会卷起来,就会把它变成白菜价,然后国际友商就会竞争不过,全部被卷倒或卷死。 事实上,这个情况并没有太夸张,还真是如此,比如LCD屏,家电、手机、汽车等,当中国厂商掌握了技术后,立马扩大产能,利用产业链优势,把价格打下来,然后国际上的竞争对手,大多就竞争不过了。 而近日,在第三代半导体材料上,似乎也出现了这一现象,众多的全球性巨头,在中国厂商的疯狂卷之下,顶不住了。 这个第三代半导体材料就是以碳化硅(SiC)和氮化镓(GaN)为代表的半导体材料。 碳化硅和氮化镓,具有高崩溃电压、高功率、高频、耐高温等特性,是新能源汽车、5G、卫星通信等技术中,不可或缺的半导体材料。 之前技术主要掌握在美国、欧洲、日本等厂商手中,所以价格也较贵。 后来,中国厂商突破了碳化硅和氮化镓技术,马上持续不断的扩产,目前导致整个行业价格下滑。 比如6英寸碳化硅晶圆代工价格,目前已经只有1200美元左右一片了,而2年前高达4000美元,降了70%。 不仅碳化硅材料在降,周边的配套产业,在中国厂商掌握了技术的情况之下也在降,比如碳化硅基板、磊晶设备等,进行国产替代之后,价格也下滑,所以扩产的成本也下降了。 数据显示,仅最近2年间,中国大陆的碳化硅和氮化镓产能,可能就已经翻番了,导致原本在这一领域拥有产能优势的美国厂商,市场纷纷下滑。 比如美国碳化硅龙头Wolfspeed,因为中国厂商的厂商,市场下滑,2023年其在碳化硅材料及磊晶材料的市占率,已降至33%和37%,所以其股价已累计下跌了82%。还有其它很多国际巨头,营收也是年年下降,被中国厂商抢了市场。 可见,未来这种当中国厂商掌握了技术,就把产品干到白菜价,卷死国外厂商的故事,可能会不断的发生着,碳化硅、氮化镓等第三代半导体材料只是一个缩影。 未来,各种高端芯片、设备、技术、材料等,估计都会如此,你觉得呢?不信的话,大家等着瞧吧。
TikTok离在欧盟被禁还有多远?
文丨张冬方 据媒体Politico,在4月29日的一次关于欧洲选举的辩论中,欧委会主席、欧洲议会党团欧洲人民党(EPP)领衔候选人冯德莱恩称欧盟不排除美国式的TikTok禁令。她同时补充称,欧盟委员会是“全世界第一家在工作手机上禁止使用TikTok的机构”,“我们清楚地知道它有多危险”。去年2月,欧委会禁止其员工在工作设备上下载和使用TikTok。 目前,TikTok在美国陷入要么母公司字节跳动全身而退,要么在美国面临被禁的困境,而冯德莱恩所作出的预示对TikTok来说,到底是祸不单行,还是纯属冯德莱恩凑热闹,为自己的选举造势定调呢?4月底,冯德莱恩正式开启了她的竞选活动。 据Euractiv,冯德莱恩竞选活动发言人表示,出于安全考虑,冯德莱恩将在她寻求欧委会主席第二任期的选举宣传活动中不会使用TikTok。而欧洲人民党即使已经在TikTok开设了账号,但也不会为选举所用,并自去年5月以来并没有再更新。 冯德莱恩和欧洲人民党与欧洲议会对待TikTok的态度截然不同。一方面,欧洲议会曾追随欧委会禁止在工作设备上使用TikTok,另一方面,欧洲议会的一些党团和议员正在选举前纷纷抢占TikTok,吸引选民。TikTok今年2月发布的选举工作准备消息显示,TikTok在欧盟27国拥有每月超过1.34亿的用户,其中的很多人将在今年的欧洲议会选举中进行投票。而且,许多欧洲领导人、政党、约30%的欧洲议会议员活跃在该平台上。 在选举形势之下,TikTok的重要性显示出来,而且,该重要性分为两面,一方面,TikTok几乎是吸引年轻选民的最好平台;另一方面,欧盟正在着手打击选举形势下的虚假消息,影响力巨大的TikTok自然在范围内,而能套在TikTok脖子上的那条缰绳自然是最新的针对超大型平台的监管工具《数字服务法》(DSA)和 “守门人”(gatekeepers)监管工具《数字市场法》(DMA)。去年4月,欧委会指定的17家超大型在线平台名单上,TikTok位于其列。去年9月,欧委会根据《数字市场法》指定提供22个核心平台服务的6家平台为“守门人”,因在欧盟提供社交网络服务TikTok的字节跳动也是其中之一。 目前,欧盟对TikTok的质疑和监管重点主要集中在三个方面:个人数据保护、未成年人保护和和是否受中国政府操控。4月22日,欧委会在《数字服务法》框架之下启动了对TikTok的第二次正式调查,调查将对TikTok在法国和西班牙推出TikTok Lite是否违反了《数字服务法》进行评估。该新服务对邀请好友加入或浏览视频等行为进行奖励,涉嫌让青少年上瘾。欧盟内部市场专员称,“我们怀疑TikTok ‘Lite’可能是有毒的让人上瘾的cigarettes ‘light’”。由此,TikTok暂停了该“奖励计划”。 此前,欧委会已经开启和发送了针对TikTok的一系列调查和信息提供要求。今年2月,欧委会对TikTok正式启动正式调查程序,主要就保护未成年人、广告透明度、研究人员的数据获取、对上瘾设计和有害内容的风险管理进行调查。3月,欧委会要求包括TikTok在内的6家超大型在线平台和两家超大型搜索引擎提供生成式AI对选举、非法内容传播、未成年人保护、性别暴力等产生的影响评估和应对措施方面的信息。4月17日,欧委会公布称,已要求TikTok提供TikTok Lite风险评估信息。 对在欧盟的TikTok来说,目前最相关的就是《数字服务法》,而欧委会在该框架之下不仅拥有调查权,同时拥有制裁权。一旦最终认定平台违反《数字服务法》,欧委会有权对平台做出不超过全球年总营业额6%的罚款,或不超过上一财年日均营业额 5%的每日罚金,从做出罚金决定的当日开始计算,一直到平台符合法律要求。假如某项服务违反《数字服务法》,并继续严重损害用户的权益,甚至包括威胁到个人生命或安全的犯罪行为,欧委会可以要求暂停某项服务,但这也是最后的手段,《数字服务法》赋予欧委会的权力也只能止步于此。鉴于涉及国家安全问题归属欧盟成员国的职权范围之内,而成员国很难在这样的一项禁令中保持步调一致,因此,在可见的未来,TikTok在欧盟面临的处境离以国家安全为理由的美式TikTok禁令仍然很遥远。而在回应美式TikTok禁令上,冯德莱恩之所以表示不排除在欧盟禁止TikTok,很可能只不过是选举场景下的某种应对策略,同时也符合她一贯的对华强硬立场和追随美国倾向。 就TikTok欧式禁令的可能性问题,我特意询问了调查新闻平台“追踪资金”(FTM)的调查记者亚历山大•范塔(Alexander Fanta)的判断,他一直在报道科技公司和欧盟相关政策。范塔表示,合法的全面禁令的出台相当艰难,但随着近期《数字服务法》的实施并逐渐彰显威力,禁令确实变得更加可能,至少可以暂时让类似于TikTok的平台中止服务,而这样的暂停离禁令已经很接近了。而且,TikTok目前确实正处于欧盟的密切监管之中。“理论上有可能会导致禁令,但实际上概率极低。” 范塔补充道。 至于冯德莱恩表示不排除禁令,在范塔看来,她很可能在向中国释放某种政治威胁信号,而向美国摆出正向中国施压的象征性姿态。
围剿TikTok的“幕后黑手”浮出水面,是这两家美科技巨头?
近日,英国媒体《每日邮报》曝光,TikTok的主要竞争对手Meta与谷歌,曾在幕后疯狂游说美国国会和白宫,确保TikTok“不卖就禁”法案顺利通过。 《每日邮报》透露,今年1月以来,Meta及谷歌向关系密切的游说者投入了数百万美元,以渗透华盛顿、击倒TikTok。 《每日邮报》曝光,谷歌、Meta斥资百万美金游说封禁法案 《每日邮报》的证据主要来自Meta、谷歌披露的第一季度游说开支。 根据披露数据,今年第一季度,Meta游说支出达到了惊人的760万美元,比有纪录以来,Meta其他任何季度的开支都要多。虽然披露信息没有直接指向TikTok,但在游说事项里,“中国”赫然在列。 对于“中国”这个事项,Meta几乎游说了华盛顿主要的核心机构,覆盖国会参众两院、白宫、商务部、司法部、国务院、美国贸易代表、联邦贸易委员会以及国家情报总监办公室。 另一家公司谷歌,在2024年前三个月花了400万美元用于游说。披露信息显示,谷歌专门就TikTok“不卖就禁”法案进行游说,但具体游说内容不详。 谷歌提交美国国会的游说披露文件截图 Meta与谷歌对TikTok的忌惮由来已久。为了复制TikTok的成功,Meta于2020年推出了短视频功能Reels,谷歌也推出了YouTube Shorts。但两款产品因功能、形态酷似TikTok,被人们戏谑地称为“山寨版TikTok”。 美国非营利组织“科技监督计划”执行董事萨沙·霍沃思(Sacha Haworth)表示,Meta和谷歌游说美国强制出售TikTok,是出于损人利己的心态。“国会议员们需要以批判的眼光审视Meta和谷歌。国会强制TikTok出售,将是给它们的超级大礼包。” TikTok封禁法案推出后,美国前总统特朗普曾多次警告,“封禁TikTok将使Facebook更加强大”、“拜登推进封禁法案的目的,是为了帮助Facebook的朋友”。值得玩味的是,2020年特朗普也曾力主美国封禁TikTok。 美国前总统特朗普在社交平台上发言,称拜登推进TikTok封禁法案是为了帮助Facebook 尽管公开信息显示两家公司与TikTok封禁法案高度相关,但两家公司均予以否认。Meta对《每日邮报》表示,它没有就TikTok封禁法案进行游说。谷歌则否认推动国会通过封禁法案。 针对“不卖就禁”法案,当地时间5月7日,TikTok在美国正式打起了反击战。TikTok及其母公司字节跳动向美国联邦法院提起诉讼,指控拜登签署的法案违宪,并要求法院推翻该法案。在重重围堵之下,TikTok选择了硬刚美国政府。该公司CEO周受资也表示,将继续行使法定权利,保护TikTok平台,有信心再次取得胜利。
他和马斯克唱反调,公司最高市值超百亿美金,如今裁员度日
作者丨潘磊 编辑丨海腰 图源丨Luminar官网 “最早是安全带,然后是安全气囊,现在则是Luminar”。 这是激光雷达制造商Luminar在官网显著位置挂出的企业定位,意在表明其产品将会从根本上改变汽车的安全性能。 Luminar还提出了具体目标,即在未来100年拯救1亿条生命,并帮助人们节省100万亿小时的时间。 这让投资者大受鼓舞——大约在2020年底,Luminar在纳斯达克的市值一度达到120亿美元。 股价飙升也让Luminar的早期投资者收获颇丰。 根据睿兽分析的数据,包括1517 Fund、GVA Capital,以及Volvo Cars Tech Fund、戴姆勒等汽车巨头或其成立的投资基金,都在Luminar通过SPAC形式挂牌纳斯达克后赚到了不少钱。 但3年半后的现在,Luminar突然举步维艰,不得不裁员20%并“外包”制造业务,以缩减运营成本。 在17岁时创办Luminar的奥斯汀·拉塞尔(Austin Russell)说,做出(裁员)这种决定从来都不容易,但这是在未来十年获得最佳定位和最大成功的必要步骤——Luminar的目标依然是为全世界的司机挽救最多的生命,节约时间和金钱。 他称,低迷的股价导致公司融资难度加大。 今年以来,Luminar的股价已经跌去了50%。 4月中旬,Luminar的股价一度跌至每股1.3美元一线,距离进入1美元以下的“退市整理期”只有一步之遥。 这印证了3年多以前知名看空机构香橼研究(Citron Research)的判断——当时香橼认为,40美元每股的Luminar 属于“博傻游戏” ,投资者买这种股票甚至还不如去赌场碰碰运气。 除了投资者不再认为这家公司能够在做空行业变革中扮演重要角色之外,Luminar的核心财务指标也迅速恶化,2023年亏损5.7亿美元,同比增加26.7%。 截至上周收盘,Luminar的市值大约是7.6亿美元。 01 一度坐上“风口”,成为投资者香饽饽 Luminar作为一家公司被投资者关注到,大约是在2017年。 睿兽分析的数据显示,当时Luminar完成了种子轮融资,从Canvas Ventures、GVA Capital、1517 Fund等投资机构处筹集到了3600万美元的资金。 投资者看好这家公司的原因,跟天才创始人有关。 2012年创立Luminar时,奥斯汀·拉塞尔只有17岁。 但他的履历却是投资者喜欢看到的——少年时代开始就研究激光,并且后来还考入了斯坦福大学应用物理专业。 他在斯坦福只读了大约3个月,就开始退学创业,用10万美元的泰尔奖学金(Thiel Fellowship),创立Lumina,业务就是做激光雷达。 正如Luminar官网所展示的那样,奥斯汀·拉塞尔认为他带领的公司制造的产品,能够减少交通事故,并挽救人们的生命。 随着智能驾驶在近些年崛起,他的产品很快受到了关注。 由于他对激光雷达的看法和埃隆·马斯克相反,于是他又成了最知名的马斯克反对者之一。 关注汽车安全技术的沃尔沃汽车,除了通过Volvo Cars Tech Fund给钱之外(参加了Pre-A轮和A轮融资),还订购了Luminar的激光雷达产品。 另外,丰田、戴姆勒、奥迪、英伟达、Mobileye等,都开始跟Luminar合作。 2020年底通过SPAC挂牌纳斯达克,几乎成为Luminar的巅峰。 也是在2020年,奥斯汀·拉塞尔被《福布斯》杂志评选为全球最年轻的白手起家十亿万富翁之一,当时他只有25岁,却拥有24亿美元身家。 但事情很快出现了变化——随着特斯拉的崛起(尤其是超过丰田成为全球第一市值车企),以及埃隆·马斯克持续唱空激光雷达后,投资者对这种传感器的热情开始消退。 重要的一点在于,Luminar作为激光雷达制造商迟迟无法完成量产落地,难以实现商业闭环,导致公司入不敷出。 拖到今年之后,情况持续恶化。 所以Luminar这次的转型目标是实现“轻资产”运营。 在这家公司位于全球的大约800名员工中,将有大约140人失去工作。 据称今年底彻底完成裁员后,每年能够省下5000万至6500万美元成本。 Luminar还有其他降本措施,包括将大部分生产“外包”给TPK(宸鸿集团),等等。 “外包”的原因在于,Luminar认为跑通制造流程实现激光雷达过于艰难,且成本高昂。 02 全行业陷入亏损困境 但困难在于,不是只有Luminar一家激光雷达制造商陷入困境。 以色列公司Innoviz作为Luminar的同行,也在年初宣布裁员大约13%。 值得一提的是,跟Luminar获得沃尔沃汽车、特斯拉的激光雷达订单一样,Innoviz曾经获得宝马、大众汽车的订单,但同样未能阻止业务下滑和股价下跌。 其他激光雷达公司的情况也大差不差——事实上在纳斯达克上市那些激光雷达公司,没有一家能够摆脱亏损泥潭。 这些公司除了Luminar、Innoviz之外,还包括禾赛科技、AEye、AEVA、Cepton,等等。 在港股上市的速腾聚创,2023年净亏损43.31亿元,调整后亏损大约4.3亿元。 值得一提的是,速腾聚创在去年卖出了差不多26万台激光雷达,同比增长超过300%,其客户包括丰田、赛力斯、上汽,等等。 禾赛科技去年激光雷达出货量22.2万台,同比增长176.1%,亏损约为4.8亿元。 有些老牌激光雷达公司甚至已经消失。 比如“全球激光雷达第一股”Velodyne(最早1983年成立),已经与另一个公司Ouster合并,以报团取暖。 这导致了一种怪象——激光雷达看上去是一个“超级赛道”,但没有哪家公司能够赚到钱。 对此,中信证券去年初发布的一份报告称,激光雷达的快速成长具有较高确定性,行业遭遇的“短期波动”没有大碍。 行业研究机构Yole Intelligence预计,到2028年全球汽车激光雷达市场将达到44.77亿美元。 FrostSullivan去年也有一份研究报告称,预计2025年仅中国激光雷达市场规模就将达到43.1亿元。 03 不断降价导致无利可图 “激光雷达昂贵、丑陋、没必要”。 早在2018年,埃隆·马斯克就对这种传感器表现出极度反感。 在他看来,激光雷达并不是自动驾驶系统的核心,使用它是一种“懒惰行为”,会把企业引入困境。 但从那时发展到现在,“昂贵”这个短板已经大为缓解。 在4月16日,速腾聚创发布了一款定价低于200美元的激光雷达,并将于2025年量产。 这反映了激光雷达惊人的“降价效应”。 根据速腾聚创财报,2023年ADAS激光雷达平均售价大约为3200元。 在2022年,价格大约是4300元。 随着定价低于200美元的激光雷达上市,这种以往动辄数万美元的智能硬件,已经正式进入千元级。 华为也表示,期望可以把激光雷达的成本做到200美金,解决客户的成本顾虑。 但在车企看来,这远远不够。 “如果市场行情是3000元一颗,比亚迪可能只需要900元的成本”——据称这是比亚迪董事长王传福在2024年商务年会上的表态。 换句话说车企的“降本”还在持续,激光雷达这种硬件就难以获得产品溢价。 这对激光雷达公司的财务是个巨大挑战。 以速腾聚创去年调整后亏损4.3亿元为例,再结合其出货量计算,每卖出一台激光雷达差不多要亏损1653.8元。 但即便是这种赔钱生意,实际上做的也是战战兢兢。 速腾聚创在2023年财报中说,即使从车企取得定点订单,依然面临合约终止、推迟或无法履行的风险。 至于其他初创公司,生存环境也难言乐观。 小米投的激光雷达初创公司探维科技,拿到了“合创汽车”的定点项目。 但这家车企在市场上销量平平,根本无法提供足量订单。 这也是初创公司普遍面临的一道坎——在初期只能通过和边缘车企合作,以获得订单,然后再争取和主流车企合作,以扩大销量。 不过从速腾聚创的情况看,即便销量大幅增长,赚钱也遥不可及。 04 “激光雷达像是一个作弊武器” “激光雷达像是一个作弊武器”。 这是禾赛科技CEO李一帆在上月底发布最新激光雷达产品ATX时,对智能驾驶领域有关激光雷达和“纯视觉”之争,打的一个比方。 他认为,当特斯拉实现了视觉方案领先时,就告诉其他后来者在一场公平决斗中“不能用枪”,“枪其实就是作弊武器”。 李一帆也表示,行业普遍认为的“视觉方案成本更低”,其实也有一定的误区。 他称,特斯拉采用视觉方案实现成本降低,是因为搭建了从芯片到数据,再到算法的体系化领先。“这些体系都需要成本”。 这意味着其他车企如果想在智能驾驶方面走“纯视觉”路线,可能会在硬件方面实现一定的降本,但在芯片、算法等方面的投入,并不省钱。 另外,激光雷达能够更好地解决Corner case(极端状况),至少能作为备份实现更远距离的探测。 值得一提的是,尽管马斯克是激光雷达领域最为激进的批评者,但特斯拉却在购入激光雷达产品。 Luminar公布的消息显示,特斯拉在今年Q1购买了大约200万美元的激光雷达产品。 这看上去是个好消息,但无法确认特斯拉正在放弃视觉路线。 而且跟中国同行相比,Luminar虽然是全球第一个推出售价仅为500美元激光雷达产品的公司,但其最新一代产品能否降至200美元以下,目前尚未可知。 Luminar还有一个好消息,就是即将上市的沃尔沃EX90搭载了Luminar激光雷达。 如果这款车能够成为一个小爆款,Luminar就算是抱上了一棵大树。
AI作品会侵权吗?我花了一个月时间,调研了你想知道的一切
在AI越来越被普及之后,有越来越多的创作者下场,开始使用AI,来创作自己的一些作品。 但是在这个时间点,很多的创作者,都非常关心一个问题:AI版权。 特别是最近的有两个月,在聊天中有密集想了解的,比如影视飓风,比如某国企,比如港中大等等。 大家的问题几乎都聚焦在两个问题上: 1.我用AI直接创作的内容,会有侵权的可能吗? 2.我用AI直接创作的内容,我拥有版权吗? 大家现在最忌惮的,就是第1点,我可能用AI出的内容,会侵别人的权。 毕竟现在典型的AI绘图工具比如Stable diffusion和Midjourney这么泛滥,但是你并不知道他们到底用了什么数据集来训练自己模型,这些模型数据到底有没有授权。 数据训练对于普通用户来说就是一个黑盒,特别是数据集这玩意儿,中间转手不知道多少层,真到终端用户调用并生成成品的时候,都盘包浆了...而且,也正因为有越来越多的AI内容被投入商用,我们更要看到技术与利益背后的风险。 前段时间有个典型是,4月23日,全国首例AI生成声音人格权侵权案在北京互联网法院一审开庭宣判,原告获赔25万。 原告殷某作为配音师,发现自己的声音被一款名为“魔音工坊”的APP以“魔小璇”出售。殷某随即以被告行为侵权为由,将“魔音工坊”的运营主体北京某智能公司等五被告起诉到北京互联网法院。 被告中广影音将原告为其录制的3本书的音频交给被告微软中国,被告微软中国又将原告的声音炼了AI声音模型,并向被告上海蓝云网络和被告北京信诺时代授权对外出售。然后北京信诺时代又跟小问智能签了采买合同,最终小问智能买了微软中国的殷某的AI声音模型,上架到“魔音工坊”上。 可以看到这期间倒了多少手。 虽然中广影音称自己有那3本书的音频的著作权,但不包括授权他人对原告殷某声音进行AI化使用的权利。所以虽然没有侵犯“著作权”,但是侵犯了原告殷某的人格权。 民法典第1023条规定,对自然人声音的保护参照适用肖像权的保护,明确将声音权益作为特殊的人格利益予以保护。即人格权。 所以最后判决是,中广影音和微软中国有明确的侵权行为,所以这两要赔25万。而另外三就是买卖关系,主观上不存在过错,不承担损害赔偿责任,道个歉就行。 你看,对于公司主体来说,这个链路非常清晰,但是我更关心的是另一点: “魔音工坊” 有几百几千万用户,一定有无数人用了"魔小璇"的AI声音去做各种各样的AI作品,那这些人侵权了吗? 这个答案其实非常明确: 不侵权。 因为整个案子,原告殷某告的都是侵犯人格权,而并不是著作权。 微软中国是用原告殷某为中广影音录制的3本书的音频去炼的模型,这3本书音频的著作权是在中广影音手上的,所以并不构成侵权著作权。构成的一直都是侵犯人格权。这两公司是明知不可为而为之。 而“魔音工坊”的用户们,并不知道这声音是殷某的,也并没有用殷某这个主体来进行宣传,所以其实并没有侵犯人格权。 而之前的AI孙燕姿的例子,你不仅炼了AI孙燕姿的声音,还明确的用AI孙燕姿来进行宣传,甚至开直播要打赏,这就是侵犯了孙燕姿的人格权。而只是单纯的声音相似,其实不构成人格权的侵权。除非你故意的混淆声音的主体。 所以可以从这个例子中看到,人格权和著作权,都有可能侵权,但是却是完全不一样的维度。 那到底什么情况我们有版权?什么情况下我们会侵权?怎么避免侵权? 所以为了搞懂这些问题,也为了让自己更有一根弦,我花了将近一个月的时间,去看了大量的过往的资料和案例,也咨询了很多律师朋友,这里特别感谢竞天公诚律所的超级大佬,数据合规组的合伙人周杨周律师(去年上了Legal Band的知名合伙人),不厌其烦的给我这个法律小白,解答了N多相关的问题,也让我对AI版权有了自己心中的答案。 所以我想用这一篇文章,把我现在的调研结果写出来,也希望能给N多的创作者一个答案。 当然,我是法律外行,这些更多的是我调研与咨询的结果,如果有不对的地方,希望大佬们多多指正!感恩。 那,让我们进入正文吧。 01 我用AI直接创作的内容,会有侵权的可能吗? 首先大家最关注的问题: 我用AI生成的内容是否会侵权? 而现在这里的"权",则更多的是聊著作权,也就是版权。 先回答这个问题。 AI生成的内容,会不会侵权?明确的说:会。 这个需要一点点来聊。 首先,在我们国家,在聊AI侵权方时,一般分为三个主体,这三个主体是根据《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》(“《AIGC 暂行办法》”)中的角色中进行划分的。 分为服务技术支持者(模型开发者)、服务提供者(运营者)、服务使用者(用户)。 其中服务技术支持者和服务提供者是不一样的,在进行算法备案的时候,基础模型备案的是模型开发者,而基于模型之上所构建的服务,则是运营者。 也可以简单的理解为,开发模型的,和开发产品的。这两者一般是区分开的。 所以基本构成三方之势:模型开发者、产品运营者、用户。 首先我们要明确的是,在国内,AI产出的内容,可以被认定为“作品”,可参考北京互联网法院在(2023)京0491 民初 11279 号案件(AI绘图侵权第一案)中的判决(这个放在第二部分细聊)。 所以一旦可以成为“作品”,那么也就有了著作权的概念。著作权制度的立法初衷之一就是保护自然人的利益。AI算法模型仅仅是人类的附属物,不具有独立的法律人格。所以AI生成的内容版权,必须归于自然人。 而这个自然人是谁,就需要先看看AI工具自身的软件许可协议了。 比如说,这是OpenAI的条款。 简单的说,就是OpenAI定义了一个“输入”和“输出”,输入就是你发给模型的,输出就是模型生成的。 OpenAI的意思就是:输出的所有权归你所有,OpenAI将其在输出中可能拥有的所有权利、所有权和利益转让给你。 也就是说,所有的权利都归你,当然,出了事发生了侵权也是你的事。跟OpenAI无关。 再看一下Midjourney的。 Midjourney就比较狗一点,大多数情况下,你都有用Midjourney生成的图片的所有权,除非你是年收入超过100w美元的公司的员工,那你必须开通“pro”或者“Mega”计划才拥有这些图片的所有权。 同时,你在有这些图片的所有权的同时,你会永久的、全球的、非独家的、可转授权的、免费的、不可撤销的版权许可,以复制、准备衍生作品、公开展示、公开表演、转授权和分发你输入到服务中的文本和图像提示,以及通过服务产生的任何资产。这个许可在本协议由任何一方终止后仍然有效。 非常的狗。你虽然有你的图片所有权,但是你也无条件的授权给了Midjourney,他可以用你的图去做几乎任何事情。 而像Runway这种,就更强盗一些,有兴趣的可以都去看看。 但是大部分的AIGC平台,都比较整齐划一,把所有权给到用户。版权给你,侵权了也是你自己的事。 但这并不意味着 AIGC 平台在此场景下绝对免责。在权利人知晓侵权内容是来自AIGC 平台的情况下,权利人完全有可能主张AIGC平台与用户构成共同侵权,并要求 AIGC平台与用户承担连带赔偿责任。 更多的是根据用户和 AIGC 平台对于被控侵权元素的贡献程度,来判断两者内部如何分摊侵权责任。 甚至在某些时候,权利方直接会来告AIGC平台。 目前在国内,最典型的就是广州互联网法院判的(2024)粤 0192 民初 113 号案件(AI奥特曼侵权案)。 原告是奥特曼中国区的版权代理商,被告是经营着某AI网站(化名Tab)的公司,Tab网站提供具有AI对话及AI生成绘画功能的服务。原告指控被告在其运营的网站上,通过AI生成了与其奥特曼形象实质性相似的图片。 如用户输入“生成一个奥特曼”,即生成奥特曼形象图片; 输入“奥特曼融合美少女战士”,即生成奥特曼身体拼接美少女战士长发形象的图片等。而且该网站生成的奥特曼形象与原告奥特曼形象构成实质性相似。 知识产权法里边有一个特别古老的原则,就是大家的常识,就如果你按照你的常识就能够判断你生成的这个图片,它明显的就是一个侵权图片,那就构成侵权。除非你能证明除Tab网站的AI公司里没有人了解奥特曼形象,也从未接触过奥特曼形象。 虽然Tab只是一个接别人绘图API的网站,但是根据《AIGC 暂行办法》第二十二条第二款规定:“生成式人工智能服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人。”Tab网站被认定为服务提供者(运营者),构成实质性侵权。 最后判决是原告胜诉。支持了原告索赔(不过从30w砍到了1w)以及在停止生成奥特曼形象的请求。但没支持原告请求删除模型训练侵权数据的要求。 原因是该案的被告只是AIGC服务提供者而不是服务技术支持者(模型开发者),大模型是由第三方公司提供的,原告也没有追加第三方公司为共同被告。 不过在我国根据《AIGC暂行办法》第七条规定,你如果想通过算法备案,就必须使用具有合法来源的数据和基础模型,如果涉及知识产权的,则不得侵害他人依法享有的知识产权。 换句话说,在想拿到算法备案时,只有你的数据本身是没有侵权的,才能通过算法备案。 所以对于普通用户是否侵权其实已经很清晰了,版权是一条非常完整的,且不可中断的链条。不管素材是在模型端,还是在数据传输的中间,只要出现了版权问题,就会一直延续下去,不会因为面临二次加工、或者因为基数庞大的用户群,就让已经出现的侵权风险消失。 所以回到那个问题: 我用AI直接创作的内容,会有侵权的可能吗? 明确的说:会。 能给的建议也不多,最基本的就是:尽量回避与知名艺术家或知名作品相关的提示词。如果必须模仿知名者的风格或者相关作品时,应特别重视生成品是否构成“实质性相似”。 02 我用AI直接创作的内容,我拥有版权吗? 在我国,目前讨论AI版权,主要通过分析人类(作品作者,或者已经拿到版权许可)在AI生成中的过程性行为(人类做了啥)来判断作品(法律范围内认定为“作品”)是否属于能够得到版权保护的独创性智力成果(具有独创性,且表达智力成果)。 这块可以参考北京互联网法院在(2023)京0491 民初 11279 号案件(AI绘图侵权第一案)中的过程与判决。 2023年8月,原告李某向法院起诉称,2023年2月24日,他使用开源软件Stable Diffusion通过输入提示词的方式生成了涉案图片,并将该图片发布在小红书平台上。 后原告发现,被告刘某在百家号一篇文章的配图中使用了涉案图片。被告不仅未获得自己的许可,还截去了署名水印,使得相关用户误认为被告为该作品的作者,严重侵犯了自己享有的署名权及信息网络传播权。故请求法院判令被告在百家号公开赔礼道歉、消除影响,赔偿经济损失5000元。 在公开庭审时候,法院要求原告当庭展示创作过程,并说明其中哪些有独创性: 然后原告当庭下载了SD,打开B站去一个视频下面下了一个SD大模型和LoRA,然后调了提示词,改了参数。 法院认为,你模型选取是不算体现作者的独创性的,但是对提示词、参数的选择可以体现其“进行了一定的智力投入”,从最开始的图片构思起,到设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等,都体现了原告的智力投入。 法院对作品的原话是:“人们利用人工智能模型生成图片时......本质上仍然是人利用工具进行创作, 即整个创作过程中进行智力投入的是人而非人工智能模型。鼓励创作,被公认为著作权制度的核心目的......人工智能生成图片,只要能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法保护。” 最后判决原告胜诉,被告需要赔礼道歉,并赔偿500元。 金额是否合理不谈,但是整体看下来,观点非常清晰: 1. AI模型是工具。 2. 涉案图片虽然有AI生成,但使用者给予了人工干预,至于说AI生成的内容是否构成作品,要基于个案具体情况对“人工干预”的内容、作用进行审查。 3. 原告的举证和留痕,可以证明其对涉案图片的形成进行智力投入且满足独创性要件,可以作为作品给予版权保护。 所以根据AI绘图侵权第一案,我们是可以认为,AI生成的内容,是可以成为“作品”的,同时AI算法模型仅仅是人类的附属物,不具有独立的法律人格。所以AI生成的内容版权,必须归于自然人。 也就是说,一旦AI生成的内容被认定为“作品”,创作者就拥有AI生成内容的版权。 其实除了这个AI绘图第一案,在2019年12月24日深圳市南山区人民法院民事发布的判决书(2019)粤0305民初14010号(简称Dreamwriter案)里,同样认定AI生成的文章构成作品。 这个比AI绘图第一案还要早几年,是真正的全国首例认定AI生成的文章构成“作品”。 大概就是腾讯使用一个叫Dreamwriter的AI写作的软件,生成了一篇A股收评文章,然后被盈讯科技一字未动的搬到了自己的网站上。 而同样想判定盈讯科技有没有侵权,首先得判定腾讯的人使用Dreamwriter生成的东西是不是“作品”,是否具有独创性。 而法院在详细审查后,认为涉案文章满足独创性要求,属于我国著作权法所保护的文字作品。 所以判定也很简单,AI只是工具,是否是“作品”,你是否有版权,得看其是否具备“独创性”要件,属于“智力成果”。而怎么判断智力成果,简单且草率的总结,就是两点: 第一个,肯定是作品得有整体性(以及,可能期待传递内容)。 我用3000条prompt生成了1个视频,和用1条prompt生成了随便1幅图,肯定前者能够受保护。 我只做几个音符,和我写整首歌,肯定是后者得到保护。 当然,上述还是需要具体情况具体分析,但是过于简单,或者完全不成体系,可能不能被视作“作品”。 第二个,具备“独创性”和“智力创作”。 这个要具体看情况认定,但是肯定不能直接ctrl c+v。 但是有一点,现在大家都用prompt,但是万一同一个咒语产生的效果过于雷同,咋整? 在使用prompt生成作品,在一定程度上可以看做创作过程,独创性和智力创作可以在这里得到体现,故而生成的作品也可以得到相应保护。 同一个AI,同一条指令,生成的不一定是同一个作品,更何况一千条指令一千个哈姆AI。当然,相似程度与版权关系需要具体问题具体分析。这个目前还没有具体的案例。 也给大家一点关于“作品”在制作过程中的存证方法。 首先当然是过程中留档、截图,比如设计师在设计过程中,存过程草稿就是一种非常常见的做法。 在做完之后,你可以选择在作品上进行署名,法律规定,在作品上署名的,即为作者,有相反证明的除外。 当然你也可以通过邮箱或第三方存储平台进行存证,第三方储存平台包括通过朋友圈、微博、微信公众号或其他线上平台发布分享内容,通过上传的主体,内容和时间,证明获得著作权的时间和权属。注意,账号一定要实名,或者用自己的手机号登录。 当然还有更厉害的,比如你的重要作品,想保护知识产权,你直接打印出来,用邮政寄给自己,然后收着,别拆,中国邮政的邮戳就是你的知识产权生效日期。 希望大家,都能保护好自己的知识产权吧。 写在最后 综上,谁使用,谁拥有,谁负责。不论是不是在AI视野下,版权保护都是一个双向的过程:在保护自己的作品同时,也需要提高自己的内容辨认意识与版权意识。 最后,我想用AI绘图第一案和AI奥特曼侵权案里,北京互联网法院和广州互联网法院两份判决书中的原话做结尾。 在AI绘图第一案中,判决书中写道: “当前,新一代生成式人工智能技术正在被越来越多的人用来进行创作,Stable Diffusion模型和与之类似功能的模型,可以根据文字描述生成精美图片......使创作图片的效率大幅提高。应当讲,生成式人工智能技术让人们的创作方式发生了变化,这与历史上很多次技术进步带来的影响一样,技术的发展过程,就是把人的工作逐渐外包给机器的过程......而现阶段,生成式人工智能模型不具备自由意志,不是法律上的主体因此,人们利用人工智能模型生成图片时,不存在两个主体之间确定谁为创作者的问题,本质上,仍然是人利用工具进行创作:即整个创作过程中进行智力投入的是人而非人工智能模型。鼓励创作,被公认为著作权制度的核心目的。只有正确地适用著作权制度,以妥当的法律手段,鼓励更多的人用最新的工具去创作,才能更有利于作品的创作和人工智能技术的发展。在这种背景和技术现实下,人工智能生成图片,只要能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法保护。” 而在AI奥特曼侵权案中,判决书中写道: “本院需要强调的是,人工智能是引领未来的战略性技术,是新一轮科技革命和产业变革的核心驱动力,被认为是发展新质生产力的主要阵地。我国人工智能技术快速发展、数据和算力资源日益丰富、应用场景不断拓展,为开展人工智能场景创新奠定了坚实基础。考虑到生成式人工智能产业正处于发展的初期,需要同时兼顾权利保障和产业发展,不宜过度加重服务提供者的义务。在技术的飞速发展过程中,服务提供者应当主动积极履行合理的、可负担的注意义务,从而为促进形成安全与发展相济、平衡与包容相成、创新与保护相容的中国式人工智能治理体系提供助益。” 不仅仅是版权保护,我也期待着未来能够有更完善、全面、灵活的措施能够在推动技术进步的同时保护创作者的合法权益。 更能在服务技术支持者(模型开发者)、服务提供者(运营者)、服务使用者(用户)三者之间找到平衡。 当然, 本文仅仅是从最浅层的AI版权保护角度写出自己的一些想法和调研结果,仅供参考。 很希望大家的智慧成果都能够在被尊重的同时得到保护。 未来能够更加安全快乐的激情创作。 AI一定是未来,我坚信。
不是吧,AI已经下沉到五线小县城了
文|宁静路 编|任晓渔 大模型在B端进入应用落地元年的同时,在C端AI应用层,变化也在悄然发生。 人群正在下沉。AI工具影响的群体不仅是一线城市的上班族,也有五线小城的公务员,还有大理青旅的老板和房地产行业的从业者。他们或将其充当生产力工具,写文件做PPT,或将其充当打发时间的玩具,做成各种智能体。 同时,伴随着模型能力进步,人们应用AI产品的深度也在提升。以智谱清言为例,支持“一亿字”知识库的智能体能力解锁,用户已经可以快速根据自己的需求来定制专属的智能助理。 而随着AI工具如雨后春笋般涌现,一个问题也浮出水面,国产AI类应用在C端如何能真正破圈,让更多人来使用? 01 当AI走进五环外 五一节前,与在五线小县城工作的朋友闲聊,他说起了五环外小文员工作的苦闷。外界可能觉得,都五线小县城了,应该不至于996,每天是不是到点就下班,钱不多但好歹事少离家近。 但从他的反馈来看,县城的打工人日子也不那么好过。公司日常运转有一些文书工作,是他的活;老板有时候要参加县里的一些活动,如果稍微正式点的场合,发言稿得他先写一份。不大的公司还有个公众号,公司日常运营、员工团队建设等也要撰写活动稿件,这个他也要干。这些事情看起来不起眼,但文字工作每个人都能提几句意见,零碎又耗费精力。所以前阵子他接连好几天都要坐在电脑前憋稿子。 作为被老板压榨的社畜,除了苦命人之间的惺惺相惜,我当时萌生的第一个念头就是,用最近各类科技大厂们推出的AI产品,帮助他解决撰写文件的苦恼。一来是真的为了他好,节省他的时间,二来也有个私心,也想看看这些AI产品在真实需求中的表现。 结果,当天晚上他就发来了一个需求和使用反馈。 一开始他的使用反馈并不佳,AI写出来的东西还是太粗糙,最后还是要自己上手重新来一遍。 场面一度非常尴尬,不知道是我的问题,还是他的问题,但最后发现虚惊一场,是使用方式的问题。 他的需求也就是我们说的Prompt,写的非常宽泛,而且一上来就想要得到一个完善的版本。 很快,他重新拆分了需求,AI这一次没有掉链子,给出了非常细致的内容建议。 这些生成的内容可以整合进他搭建好的内容框架,丰富观点的层次,能够形成一篇更详实的材料。这大大减轻了他的工作负担。如今,他在写各种材料时,脑子里先想到的是能不能用智谱清言这类AI工具提供一些点子,帮助打开思路。 无独有偶,另一位在沿海某二线城市地产行业的朋友也时常询问AI产品能不能用在工作中。 她的工作涉及大量的PPT汇报,比如要针对城市的产业布局和规划向客户和合作方提交报告。这不只是单纯的问答,而是涉及大模型驱动的智能体应用。 由于当时国内推出智能体商店的玩家并不多,智谱AI是其中较早发布智能体商店的人工智能企业,旗下的GLMs对标OpenAI的GPTs,并且还是完全免费,没什么体验门槛和成本。对于一个月薪勉强糊口的打工人,免费和提升效率同等重要。 在我反复排除跟我客套的因素后,看得出来,AI的表现让她非常满意。 不难发现,过去一年多大模型产品不止在科技圈内狂飙猛进,也不是人工智能行业在自嗨,这些应用正在逐渐覆盖和影响到了更广泛的人群。 而且,他们不只分布在一线大城市;在二三线城市,甚至在四五线小县城里,也有不少人已经率先成为这些AI产品的忠实用户。 02 智能体让AI越用越深 除了用户群体从一线城市向更广泛的地域扩散,从去年到现在,用户们使用智谱清言这类AI工具的深度也在提升。 科技类媒体是AI产品的先锋用户群,我们自己就经历了从轻应用到用大模型来满足定制需求的变化。文生图应该是大模型刚火起来时,圈内最先用起来的功能。科技类图文内容生产者日常工作有一个痛点,是如何找到贴合文章主题的配图。 各类与前沿趋势有关的内容,配图需要抽象且具科技感。过去这类图片通常要靠美工专门制图,成本高昂且速度慢。用大模型产品的文生图功能,生成视觉效果拉满、科技感十足的图片非常快,配图问题迎刃而解。 由于图片风格洗练,智谱清言也成为我们常用的配图小助手。 而大模型的文本生成功能则不太一样。有些时候它强大的生成能力让人赞不绝口,但有时候它则让人哭笑不得。回复的内容第一眼看上去像模像样,但其实是胡说八道。还有一些答案比较大路货,针对性较差。 这些问题国内的大模型公司们当然也知道。各路人马都在想办法,升级基座模型,还给大模型加外挂,让它变得更可靠更好用。比如智谱AI,也推出新一代基座大模型GLM-4,并且发布了智能体商店,同时大模型产品还能联网和搭载各种私域知识库。 这相当于通用能力升级之外,再加上专门领域的buff,本科生再读个博士。一番操作下来,AI产品就不再是可用可不用,想起来再去问两句的小配角,通过上传用户自己的文档、文件和知识,它成了每个人都能拥有的专属知识小助理。 这么看,有点化普通为神奇的意思了。你还别说,现在各类AI应用都在暗暗使劲,提升自己的文本挂载能力。 比如智谱AI悄咪咪上线的知识库,就被人称为“一亿字的智能体”。简单说,用户在智谱清言创建智能体时,最多可以上传1000个文件,并且每个文件100MB,总处理字数的上限达到1亿字。 如果你不知道这个体量意味着什么,有个很直接的类比。中国古代最大的一部丛书四库全书,共收书3461种,总字数约7亿字。我们普通人日常要处理的领域内知识需求,绝大多数应该超不过四库全书的七分之一,因此绝大多数场景下,智谱AI的知识库产品容量应该足以应对用户的需求。 我们也在网页端点击创建了几个智能体。 整个过程非常简单,写出你的要求,让AI自己去生成智能体配置,不用绞尽脑汁去配置。生成之后,用户还可以调整名字和改变细节,之后就可以发布智能体。创建好的智能体创在网页端和APP端都可以使用。 值得一提的是,用户还能设置智能体的开放程度。发布成私密状态,就是专用助手,完全不用担心信息泄露。 我们很钦佩六神磊磊具备的丰富的金庸知识储备,也想拥有他那样随时对金庸小说人物掌故信手拈来的能力,于是创建了一个“金庸英雄谱”的智能体。 描述词非常简单,就五个字“金庸英雄谱”,之后AI自动生成了非常详细的简介和配置信息。 上传的单个文件里有1600万字但显然这没有难倒智谱的智能体创建平台。 当我问“乔峰的师傅是谁?” 点开知识库里与之相关的片段可以看到相关原文内容。 虽然自诩死忠粉丝,看过好多遍各个版本的神雕,但是我的确记不得这个名字。 之后我又创建了一个与工作相关的智能体,出海领域相关的知识助手,把此前积累的十几份热门研报全部上传,并且发布成了私密使用。 测试效果时发现,它出乎意料的好用。 如图所示,返回的结果不是市面上通行的大路货,还有一些具体的案例细节 。 同时,在智能体调试状态里还会显示内容来源。 不信邪的用户可以去提到的相应来源去验证,能发现这些确实是行业研报原文,最终的答案经过了智能体的提炼和总结。 我还尝试问了其他专业问题,比如“中国的家电品牌相比服务品牌出海,处于什么水平?”在提问时,有故意的错字和漏字,但是从回复看,这并没有妨碍智能体的理解。它给出的答案非常具体,有判断,有数据,也能对比出两种类型企业的差异性。 这种效果,简直是多了一个随身的知识小助理。也难怪从一二线大城市到四五线小县城,各路打工人纷纷用起了AI。 03 靠谱有趣,AI类APP才能玩起来 提高效率是AI最朴素的追求,比如我们看到大量的生产力工具,在智谱上都非常受欢迎,例如AI搜索有111万人次使用,数据分析则有51万人次使用。 但当我们以为大家都在为了提升工作效率而用AI工具疯狂内卷时,靠谱的年轻人还用AI玩出了花。 比如,一位解密小游戏的爱好者最近在智谱AI玩起了一款AI解谜游戏——犯罪之谜侦探。本来她以为凭借自己的“资历”能轻松通关,但是玩了一阵后,她发现自己进入了无限循环中,无法起诉相关的嫌疑人。而出现这个结局的原因其实是她忽略了与游戏里的一个关键NPC互动,最终用户扮演的侦探无法拿到关键的信息,起诉犯罪嫌疑人这个结局就没有出现。于是她不服输选择了重玩游戏,经过尝试,她走通了故事线。目前这个智能体已经吸引了十几万人次的互动。 在C端用户的使用场景里,靠谱只是最基本的诉求,有趣才是深入交流的源动力。 另一个例子是“表情包大全”智能体,这个智能体的玩法是,只要输入文字,它就能生成各种表情包。从闺蜜群里的八卦闲聊,到相亲相爱一家人里到家长里短,再到工作群里的情绪表达,表情包从来都是应对这一切的最好武器。 比如输入“为什么周六要调休”,它自动生成了以下表情包。 对i人来说,它可以放飞自我,愉快斗图。对e人而言,它简直就是自己的第二张嘴,“总有一些场景用文字回复显得生硬,但又需要回应,这个时候你就需要有一款表情包。” 由于智能体的制作流程非常简单,用户自己基于自己的兴趣和需求公开发布的智能体受到其他用户的欢迎,也繁荣了智能体市场。从智谱清言APP的每周趋势榜可以看到,智谱AI官方出品了一些智能体,还有大量的是用户自己打造和发布的。 智谱清言上各种智能体也迎来了大爆发。据智谱AI提供的数据显示,从今年1月GLMs个性化智能体功能上线以来,智谱清言智能体中心已有超过30 万个活跃智能体。 这些形形色色的智能体各具特色,但都有个共性——要么靠谱好用,要么有趣好玩。 靠谱又有趣的智能体越多,能吸引更多人来玩,产生更多的智能体;同时,APP的用户越多,用得越深,也在加速产品智能程度的升级。在C端人群里,智谱清言有望在用户人数及口碑和产品能力进化间形成数据飞轮。
字节跳动改变策略放弃出售沐瞳科技 将任命新CEO
张云帆将担任沐瞳科技新CEO 凤凰网科技讯 北京时间5月13日,据彭博社报道,字节跳动公司放弃了出售旗下上海沐瞳科技有限公司的计划,并计划为该游戏工作室任命一位新CEO。沐瞳科技是字节跳动的最宝贵游戏资产。字节跳动当初收购它旨在挑战腾讯控股。 知情人士称,沐瞳科技的新任CEO是完美世界前高管张云帆,他将取代沐瞳科技联合创始人兼CEO袁菁。随着字节跳动正在精简和重组其游戏部门,其管理层决定改变策略,不再出售三年前以40亿美元估值收购的沐瞳科技。彭博社在今年3月曾报道称,字节跳动将把剩余游戏业务的重点放在用户生成游戏内容上,因为这更符合该公司的平台驱动战略。 此前,字节跳动在游戏领域挑战老牌巨头腾讯、网易的过程中未能取得太大进展。作为对游戏业务展开更广泛成本削减努力的一部分,字节跳动原本考虑出售沐瞳科技,试图将业务重点重新放在抖音、TikTok等核心产品上。抖音和TikTok在广告收入和电子商务等邻近领域都在迅速增长。在削减了数百个游戏开发岗位并终止了几个项目后,字节跳动在今年3月任命人力资源主管华魏管理其大幅收缩的游戏部门。 在加入字节跳动之前,张云帆曾在完美世界公司担任各个职务,包括首席运营官。目前还不清楚袁菁是否会留在沐瞳科技。袁菁在十年前创立了沐瞳科技,带领公司在东南亚市场的战斗类游戏体裁领域超越了他的前雇主腾讯。 自2021年收购沐瞳科技以来,字节跳动几乎让该工作室自主运营,但对张云帆的任命可能标志着战略转变。此前,沐瞳科技一直无法推出下一部热门作品。去年4月,沐瞳科技的摇钱树《无尽对决》获准在中国上线,但国内市场长期以来一直被腾讯的《王者荣耀》所主导。 截至发稿,沐瞳科技发言人拒绝对此次人事变动发表评论。字节跳动发言人没有回复记者的置评请求。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
三星电子解散Bot Fit机器人业务团队
三星电子最近进行了重大的组织重组,以增强其在下一代机器人业务方面的能力,并将其视为关键增长领域。作为重组的一部分,该公司解散了负责开发三星首款可穿戴机器人“Bot Fit”的机器人业务团队。解散的团队最初于2021年12月从特别工作组提拔,现在成员要么回到原来的部门,要么被重新分配到三星研究院首席技术官(CTO)Jeon Kyung-hoon领导下的特别工作组。 业内人士称,此次重组涉及CTO工作组下的研发(R&D)人员的调整,以利用机器人领域先进开发的协同效应。此举是在Bot Fit完成开发和量产工作后做出的,表明三星电子公司为增强机器人能力而进行的战略转变。 三星电子相关人士解释道:“Bot Fit的开发和量产已经完成,重组的目的是增强我们的机器人业务能力。研发人员已调入CTO的工作组,以与三星研究机器人的团队形成协同作用。” 三星电子首款可穿戴机器人Bot Fit已于今年上半年进入B2B市场,在老年生活社区等设施中作为助行器发挥作用。 业界认为机器人业务团队的解散很不寻常,尤其是在Bot Fit的全面销售即将开始之际。三星内部也有观点认为,尽管Bot Fit经过了5年的密集开发,但其技术发展仍低于预期,因此维持专门团队的效果已经减弱。 此外,三星电子加大对合作机器人公司Rainbow Robotics的战略投资也被视为相关因素。三星持有Rainbow Robotics 14.83%的股份,成为其第二大股东。三星电子还有一项看涨期权,可以将其持股比例增加至59.94%,这引发了有关早期收购的猜测。 然而,许多人也认为这些举措是开发人形机器人的准备步骤。在CES 2024上,三星电子副董事长、CEO兼设备体验(DX)部门负责人Han Jong-Hee(韩钟熙)阐述了三星电子的机器人愿景,瞄准制造、零售、家庭和个人使用,最终目标是创造能够与人类共存的智能机器人。
阿尔特曼最新访谈,多次“点名”苹果公司,什么信号?
在科技界万众瞩目的目光下,OpenAI将于美西时间5月13日上午10点(北京时间14日凌晨1点)拉开其春季更新活动的帷幕,通过线上直播的形式,向全球演示ChatGPT和GPT-4更新的功能。 OpenAI宣布将于5月13日直播演示ChatGPT和GPT-4功能更新 图片来源:X 尽管公众对GPT-5的期待高涨,OpenAI 首席执行官萨姆·阿尔特曼(Sam Altman)却在近期访谈中明确表示,下一代语言模型GPT-5及其自主研发的搜索引擎均不会在此次活动中亮相,这一消息虽令部分期待者略感遗憾,但阿尔特曼对即将展示的ChatGPT与GPT-4升级版信心满满。 图片来源:X 更为引人注目的是,据彭博社报道,苹果公司与OpenAI敲定协议,拟将ChatGPT技术融入即将面世的iOS 18操作系统,此举无疑将为智能手机领域带来颠覆性变革。 值得一提的是,近日,阿尔特曼在“All-in Podcast”播客节目接受了采访时,聊了很多,从推理运算谈到AI的监管问题,再到全民基本收入(UBI)的概念,乃至AI交互界面的未来趋势,甚至还揭秘了一些公司内部情况。访谈中,阿尔特曼还展望了未来能与AI加持的iPhone相抗衡产品的可能形态,进一步点燃了科技爱好者对未来智能设备生态的好奇与期待。他这番广泛又深入的交流,让人忍不住猜想,是不是在为OpenAI即将宣布的更新暗暗铺垫呢? 阿尔特曼在播客节目“All-in Podcast”中接受采访 图片来源:截图于Youtube 核心内容 1.关于GTP-5的发布 目前尚未确定具体日期,我们对GPT-5的发布持谨慎态度,以确保新模型发布时能符合我们的高标准。 2.关于OpenAI内部变动 面对被解雇的情况,我当时在考虑是否要重返岗位,因为我感到沮丧又迷茫。但随后我意识到,我对OpenAI以及同事们怀有深厚的感情,于是我决定要回去。 3.关于开源与闭源模型的未来 我们认为两者都有其独特的价值和作用。我们已经有计划在未来开源更多的模型,同时我们也在积极地开发通用人工智能,并探索如何广泛地分配其带来的利益。 4.关于AI的未来交互方式 我期望拥有的是一种始终处于激活状态且极易使用的设备,它可以通过语音、文字,或者更理想的状态,通过其他方式理解我的需求。我期望有一个系统能够全天候地辅助我,尽可能多地收集信息,成为世界上最出色的助理,不断地帮助我提升自我。 5.关于人工智能的监管 我希望能有一个类似全球监管核武器或合成生物学的国际机构,来监督这些强大的系统,并确保它们经过合理的安全测试。 6.关于苹果 手机目前的卓越性能令人惊叹,因此要达到一个新的高度,门槛自然非常之高。我个人认为,iPhone是人类历史上制造出的最伟大的技术产品之一。它真的是一款非凡的设备。我之前也提到过,它已经非常出色,以至于想要超越它,我们必须设定一个相当高的标准。 阿尔特曼参加播客节目“All-in Podcast” 图片来源:截图于Youtube 以下为节目内容的节选片段: 问:你们会在何时发布GPT-5? 阿尔特曼:关于GPT-5的发布时间,目前我们还没有确定一个具体的日期。我们对新模型的推出持谨慎态度,致力于确保它在发布时能够达到我们的高标准。我们正在考虑采用一种新的发布策略,这可能与以往的方式有所不同。我们对于GPT-5的命名和发布策略仍在讨论之中,但可以肯定的是,我们致力于让这款新模型在发布时能够为用户带来卓越的体验。 问:刚才你谈到GPT-5这次的发布会有点不同,你是不是在想先向付费用户发布GPT-5? 阿尔特曼:我们正在努力寻找方法,让GPT-4这样的先进模型能够以免费或低成本的方式提供给更多的用户。如果我们还没有找到如何让用户免费使用GPT-4的方法,我会非常的难过。这是我们真正想做的事情。 问:你认为开源模型在未来几年会有什么样的发展? 阿尔特曼:在开源和闭源的问题上,我们认为两者都有其独特的价值和作用。我们已经有计划在未来开源更多的模型,同时我们也在积极地开发通用人工智能,并探索如何广泛地分配其带来的利益。我们的这一战略已经得到了很多人的认同,尽管它可能并不适合所有人。我们正在构建一个庞大的生态系统,其中将包括开源模型以及基于此构建的开发者社区。 问:你们何时会开发在手机上运行的开源模型? 阿尔特曼:我不清楚我们是否会这样,也不清楚是否有人会这样做。也许Llama 3或Llama 4能够做到这些。 问:我猜测70亿参数版本的Llama 3模型可能适合在手机上运行。 阿尔特曼:不管这个版本的Llama 3是否针对手机,但我认为它可以在手机上运行。我还不确定,我没有体验过它。 问:penAI作为行业的领先者,需要采取什么措施来维持其在人工智能领域的领先地位? 阿尔特曼:我们正致力于构建一个生态系统,它不仅包括先进的人工智能模型,还包括用户界面、开发者工具、教育资源和社区支持等,以确保我们的技术能够被广泛地接受和有效利用。通过这样的全面方法,我们希望能够实现长期的成功,并在人工智能领域持续地为社会带来积极的影响。 问:从开源走向闭源,我想知道你为何最终选择了这样的道路? 阿尔特曼:我们发布ChatGPT的部分原因是向世界展示我们的成果。我们一直在努力传达一个信息:人工智能真的非常重要。回到2022年10月,当时并没有太多人意识到人工智能的重要性或其即将带来的影响。我们努力做这件事的一个重要部分是使人们能够实际使用这项技术。现在,实现这一目标有多种不同的方式,我认为这确实起到了非常关键的作用。然而,事实上,目前许多人正在使用免费版的ChatGPT,而我们并没有进行广告宣传,也没有考虑过盈利的问题。我们推出免费版的ChatGPT,是因为我们希望人们能够利用这些工具。我认为,这已经为人们提供了很多价值,就像是“授人以渔”。我们这么做的原因也是为了让人们更好地理解整个人工智能行业的发展态势。至于闭源战略是否正确,目前我们还没有标准答案。我们和其他公司一样,也在探索中前行,并会在学习新事物的过程中多次调整策略。当我们创办OpenAI时,我们并不清楚事情会如何发展。在我们开发出第一款语言模型之前,我们甚至还没有开发出过任何产品。我们只是一步步地努力探索,稳步前进。我们会继续这样做。 问:开源让每个人都达到一定的阈值,然后就是对数据的竞争,是不是这样? 阿尔特曼:我绝对不认为这将变成一场关于数据的竞赛,因为当模型变得足够智能时,它们在某个点上,至少在训练方面,将不再依赖于更多的数据。智能只是物质的一种突现属性,它就像物理定律一样。我相信人们将会理解这一点,但系统设计将会有多种不同的方法,人们会做出不同的选择,并提出新的想法。我相信,就像任何其他行业一样,人工智能领域也会出现多种不同的方法,不同的人会有不同的偏好。就像有些人喜欢iPhone,有些人喜欢安卓手机一样,我认为人工智能模型也会呈现类似的多样性。 问:那么在设备端的情况如何呢?设备本身是否也会随之发生变化?这些设备是否也会变得像iPhone那样昂贵? 阿尔特曼:我对这个话题非常感兴趣,并且对计算领域的创新形态充满热情。每一次技术的重大飞跃似乎都能开启新的可能性。手机目前的卓越性能令人惊叹,因此要达到一个新的高度,门槛自然非常之高。我个人认为,iPhone是人类历史上制造出的最伟大的技术产品之一。它真的是一款非凡的设备。我之前也提到过,它已经非常出色,以至于想要超越它,我们必须设定一个相当高的标准。 问:不过,你们现在的应用已经具备了语音功能,实际上,我将手机上的快捷动作按钮设置成了直接启动ChatGPT的语音应用。 阿尔特曼:我们将继续改进并提升语音功能的质量。我相信语音交互是通向未来交互方式的一个重要线索。如果能够实现真正优质的语音互动体验,那将是一种与计算机互动的全新方式。 问:关于计算机视觉领域,是否可以这样设想:配备有眼镜或者佩戴一个挂坠,这样就能将视觉或视频数据与语音信息相结合。通过这种结合,人工智能就能全面掌握你周围发生的一切。 阿尔特曼:多模态交互的能力极其强大,例如,可以提问:“嘿!ChatGPT,我正在看什么?”或者“我不太确定这是什么植物。”这显然是另一个探索方向。但关于人们是否愿意佩戴眼镜,或者在需要时举起某个设备来获取信息,我认为这涉及到许多社会和人际交往方面的复杂考量,尤其是在面部佩戴计算设备的问题上。 问:如果人工智能变得在每个人的手机上都无所不在,那么可能会催生哪些应用程序呢?你有没有预感到可能会发生什么,或者你希望看到什么样的应用被开发出来? 阿尔特曼:我期望拥有的是一种始终处于激活状态且极易使用的设备,它可以通过语音、文字,或者更理想的状态,通过其他方式理解我的需求。我设想有一个系统能够全天候地辅助我,尽可能多地收集上下文信息,成为世界上最出色的助理,不断地帮助我提升自我。人工智能不是用户的简单延伸,而是一个始终可访问、始终卓越、能力超群的助理或高管。 问:智能体在某种程度上就像是你的代表,它能够理解你的需求,并且预测你的意图,这正是我对你所述内容的解读。 阿尔特曼:智能体不只是机械地执行命令,它能够进行推理,是的,它具备推理能力。智能体与我之间的关系,是我所期待的那种与真正有能力的同事之间的互动,这与那些只会盲目遵从的人不同。 问:在这样一个由智能体代表80亿人进行交互的世界里,我们对应用程序的工作方式和整个体验架构的思考需要如何转变? 阿尔特曼:我对打造一个既适合人类也适合人工智能使用的世界的构想非常感兴趣。我青睐于这种设计的可解释性、任务交接的流畅性,以及我们提供反馈的能力。 问:所以你意识到,语音交互这种方式有潜力使得传统应用变得多余。你只需简单地说出你想要寿司,它就能根据你以往的喜好来推荐你喜欢的寿司类型,同时避免那些你不喜欢的选项,并努力为你提供最佳的点餐体验。 阿尔特曼:我很难想象我们完全进入一个只需简单地说“嘿,ChatGPT,给我订份寿司”,然后它回应“好的,你想从哪家餐馆订?要哪种类型的寿司?什么时间送达?”等等的世界。我相信用户界面对于许多任务来说都是非常有用的。我很难想象一个你完全不再看屏幕,而只依赖语音交互的世界,但我确实难以想象那样的场景。 问:确实如此。对于许多事物来说是这样的。比如,苹果推出了Siri,按理说我们可以通过Siri来自动预约Uber,但我怀疑实际上很少有人这么做。毕竟,为什么要冒这个险呢?正如你所指出的,因为目前语音助手的服务质量还不够高。然而,一旦服务质量足够高,我认为人们真的会更倾向于使用语音助手,因为它更加便捷。你不需要拿出手机,不需要打开应用,不需要点击任何东西。如果遇到应用自动登出,或者需要重新登录,或者进行双因素认证(TFA)的情况,整个过程就变得非常繁琐和令人烦恼。 阿尔特曼:我明白,对于像设置计时器这样简单的任务,我总是使用Siri,因为它非常有效且方便,我也不需要其他额外的信息。然而,对于像叫Uber这样的服务,我可能想要比较几种不同选项的价格,了解车辆距离我的实际远近,甚至查看司机在地图上的实时位置,因为有时候我可能会选择步行到某个更方便的地点。通过直接在Uber应用的界面上操作,我可以更快地获取这些详细信息,这比通过语音指令来完成整个过程要高效得多。 问:在所有利用OpenAI平台开发应用和体验的开发者中,是否有一些项目给您留下了深刻印象?或者说,是否有一些成果是你的团队特别指出并认为具有重要意义的? 阿尔特曼:我今天早上遇到了一个新建的创业团队,严格来说是由两个人组成。他们计划在夏季开展一个项目,致力于开发人工智能导师功能。我对这一领域一直抱有浓厚兴趣,尽管许多人已经在我们的平台上取得了杰出成果,但如果能够有人实现--正如他们所形容的,这将是一次“单轨列车级别”的创新--彻底改变我们学习的方式,那将是非常令人兴奋的。如果能够找到一种新的途径,让人们能够以个性化的方式探索和学习,我个人对这样的前景感到非常激动。你之前提到的与编码相关的许多事项,我认为这是对未来的一个非常酷的展望。我相信医疗保健是一个特别需要被彻底革新的领域。但就个人而言,我最感到兴奋的是加速和改进科学发现过程的可能性。虽然GPT-4显然还未在这方面实现重大突破,但它或许已经在一定程度上加快了进程,提升了科学家的工作效率。 问:这些模型与语言模型在训练和构建上有所区别。虽然它们之间存在许多共同点,但也存在许多差异。这些模型中的许多都是基于一种全新的基础架构设计的,它们专门针对特定的问题集或应用场景,例如化学相互作用的建模。是这样吗? 阿尔特曼:确实,某些元素是必不可少的,但我认为我们当前普遍缺失的,对于我们讨论的众多应用而言,是具备推理能力的模型。一旦模型能够进行推理,便可以将它们与化学仿真器等工具相结合,或者用于进行预测和假设。 问:确实,我今天想探讨的一个关键话题是模型网络的理念。在讨论智能体时,人们往往会想到一系列线性的函数调用,但在生物学中,我们观察到的是系统之间复杂的网络和相互作用。这些系统通过集合和网络的整合作用产生结果,而不仅仅是简单的线性调用。我们是否正处于这样一个架构的兴起之中:专业模型或网络模型相互协作,共同解决更复杂的任务集,运用推理能力,其中一些计算模型专注于化学或算术运算,而其他模型则承担不同的职责。这种架构避免了依赖单一的、全知全能的模型来处理所有问题。 阿尔特曼:我不确定推理能力最终能否成为一种广泛适用的功能。我有这样的预感,并且希望它是,如果真的能够实现,那将是非常理想的。不过,我并不确定它是否真的会如此。 问:我想知道,是否真的所有这些初创公司都会失败?目前许多初创公司都在采取这样的策略:收集特定的数据,接着基于这些数据全新训练一个模型,该模型专门针对某一任务进行优化,并且在这一任务上的表现超过了其他所有解决方案。 阿尔特曼:某种程度上,正如我们在讨论生物学和那些复杂的系统网络时所指出的,我已经能够窥见一二。我之所以会笑,是因为最近我经历了一场严重的疾病,现在已大致康复,但整个过程就像是身体系统逐一受到打击。你真的可以明确指出,比如,这是消化系统的问题。这让我想起了我们之前讨论的,你不知道这些系统之间相互作用的复杂性,直到出现问题,这本身是一个非常有趣的现象。同时,我尝试使用ChatGPT来理解我的病情。我可能会说,我对某个问题不太确定。接着,我会在没有阅读的情况下,把相关的论文链接放入上下文中,然后发现,哦,这就是我不确定的那个问题,现在我认为应该是这样。这就是你之前提到的一个例子,你可以说,我不知道这个信息,然后你可以添加更多的上下文信息,而不是重新训练整个模型,你只需要即时地增加上下文,然后你就能得出一个结论。 问:这些用于预测蛋白质结构的模型,比如说,构成了这个领域的基石。现在,我好奇的是,Alpha 3是否能够处理其他分子类型的预测?如果可以,那么理论上最好的通用模型将能够接入、学习训练数据,并自主解决问题。或许你可以为我们举一个例子来阐释这个过程。你能和我们谈谈Sora吗?你的视频模型能够生成令人惊叹的动态图像和视频。你愿意分享的话,能不能告诉我们它的架构有何独特之处,以及它是如何区别于其他模型的? 阿尔特曼:确实,对于一般性问题,我们显然需要专业的模拟器、连接器和各种数据片段等工具。我有一种直觉--尽管我得强调这并没有科学依据--如果我们能够理解通用推理的精髓,并将这一原理应用到新的问题领域,类似于人类的通用推理能力,我认为这是可以实现的。这可能会是一个快速的突破过程,至少我是这么认为的。至于Sora,它并不是以语言模型为基础,而是专门针对视频处理而设计的模型。 问:显而易见,我们还未能完全实现那样的技术境界,对吧?以构建高效视频模型为例,你们可能是从零开始,采用独特的架构和特定的数据集进行开发。然而,展望未来,一个具备通用推理能力的系统--也就是我们所说的人工通用智能--理论上应该能够通过自我学习和逻辑推理,掌握渲染视频的方法。 阿尔特曼:我想说的是,以一个例子来看,据我所了解,目前全球最优秀的文本模型大多还是基于回归的方法构建的。与此同时,顶尖的图像和视频模型则采用了扩散模型技术,这种情况在某种程度上显得有些不寻常。 问:围绕训练数据的使用,存在广泛争议。你们一直采用合理使用原则和尊重创作者权利的方式来处理问题,但为何OpenAI选择不涉足音乐产业? 阿尔特曼:以音乐为例,如果有人要求模型创作一首泰勒·斯威夫特(Taylor Swift)风格的歌,即使该模型从未在泰勒·斯威夫特的歌曲上进行过训练,我们仍然面临一个挑战:模型可能已经了解了关于泰勒·斯威夫特的信息和她的音乐主题。这就引出了一个问题:即使没有直接训练,模型是否应该被允许模仿她的风格?如果可以,那么泰勒·斯威夫特应如何获得报酬?在这种情况下,我认为首先应该有选择加入或退出的机制,然后建立一个经济模型来处理这些问题。从音乐产业的采样历史中,我们可以找到一个有趣的视角,来观察这种经济模式是如何运作的。这虽然和人工智能创作不完全相同,但为我们提供了一个思考的起点。 问:你是否能够接受这样的情况:一个音乐模型在未向创作了这些音乐作品的艺术家支付版税的前提下,自主地通过人类创作出的所有音乐作品库进行训练。接着,你不被允许提出特定艺术家的请求,而是可以这样要求:“请为我播放一首相当现代的、关于心碎的流行歌曲,最好是女声演唱的。” 阿尔特曼:我们已经决定暂时不进入音乐产业,部分原因在于围绕如何界定使用界限的复杂问题。 问:你看到苹果最近发布的广告了吗?它将人类的所有创造力凝练在一台非常薄的iPad中。你对这有什么看法? 阿尔特曼:人们对此产生了非常情感化的反应,比你想象的要强烈得多。我本人对人工智能持非常积极的态度,但我相信人类创造力和艺术表达中有些东西是非常宝贵的。对于能够提升科学研究的人工智能,我们当然欢迎。然而,当涉及到能够进行深刻而美妙的人类创造性表达的人工智能时,我认为我们应该审慎行事。这种技术的发展是不可避免的,它将成为帮助我们达到更高层次创造力的工具,但在这个过程中,我们应该找到一种方式,既能推动技术发展,又能保持我们所珍视的创造性精神。 问:当讨论到人工智能的监管以及在一个由人工智能主导的世界中实施全民基本收入时,有人提倡“全面监管人工智能”。这究竟指的是什么?你是否能够就加州最近提出的监管提案分享一些看法? 阿尔特曼:我对目前的情况有些忧虑。虽然我注意到有许多关于人工智能的监管提案正在讨论中,但就我个人所见,加州的许多提案引起了我的担忧。同时,我普遍担心如果每个州都独立进行人工智能的监管工作。当讨论到“监管人工智能”时,我认为人们的想法并不统一。有些人可能主张完全禁止人工智能的发展,而另一些人则可能坚持认为人工智能应当是开源的,而不是封闭的。我个人特别关注的是,我相信在不远的将来,我们可能会面临一个时刻--我得承认,这只是一个前瞻性的声明,做出此类预测总是伴随着风险--我的预测是,在不久的将来,一些先进的人工智能系统将有能力造成严重的全球性伤害。对于这些系统,我希望能有一个类似全球监管核武器或合成生物学的国际机构,来监督这些最强大系统,并确保它们经过合理的安全测试,以防止它们失控、自我递归改进或其他类似的风险。 问:如果你拥有制造核武器的核材料,这通常只限于少数人所持有,因此,可以将这种情况比作需要核检查的类比。 阿尔特曼:确实,我觉得这个观点很有趣。关于监管问题,我想补充一点,我非常担心监管可能会过度。我相信,无论是做过了头还是仅仅做过了一点点,我们都可能会犯错。同样,如果我们做得不够,也可能出错。但我真的认为,我们有责任也有使命去讨论我们认为可能会发生的事情,以及为了正确处理这些事情我们需要做些什么。 问:挑战在于,我们现有的法规本意是保护人民和整个社会,但我们正在面临一种新类型的法规,这种法规可能会赋予政府审查代码和商业机密的权力,这是我们以前从未遇到过的。我认为,这些立法者对人工智能的理解可能还很有限。正如你所知,甚至比任何人都清楚,随着技术的快速发展,这些法规在一年后可能就会变得不再适用。 阿尔特曼:我之所以提倡采取基于机构的方法来处理宏观层面的问题,而不是将这些写入法律,是因为我认为在12个月后,这些法律可能都会被证明是不正确的。即使这些立法者是世界级的专家,我也怀疑他们能否在12个月或24个月的时间框架内做出正确的决策。我不相信那些政策,比如我们要审查你的所有源代码,逐一检查你的所有权重,是的,我认为市面上有很多不切实际的提议。但是,就像飞机在获得认证前需要经过一系列的安全测试一样,这与阅读你所有的代码完全不同,我们更应该审查模型的输出结果,而不是模型的内部细节。我想说的是,我认为进行安全测试是有意义的。 问:我们怎样才能达到那个目标呢?你认为这种方法是否能够正确解决问题,或者你对这个问题有何看法? 阿尔特曼:我认为GPT-4并不会构成实质性的威胁,并且有许多安全的方式来发布这样的模型。但你也了解,当涉及到可能导致大量人员伤亡的情况时,比如飞机或其他许多例子,我们很乐意有一套测试框架来确保安全。当我登上飞机时,我通常不会担心它的安全性,因为我假定它是安全的,对吧?现在,人们对此有很多不必要的担忧。 问:你能解释一下为什么决定启动全民基本收入项目吗?你的初衷是什么? 阿尔特曼:我相信,金钱虽然不能解决所有问题,也不会让人即刻感到幸福,但它可能能解决一些问题,可能为人们提供一个更好的起点,帮助他们自助,我对这样的前景非常感兴趣。现在,随着我们看到人工智能的发展方式,我在思考,是否有比传统的全民基本收入(UBI)更好的做法。我在想,未来可能不仅仅是关于全民基本收入,而更像是全民基本计算资源。例如,每个人都可以获得一定量的GPT-7计算能力,他们可以使用它,可以将其转售,或者捐赠给其他人用于癌症研究等。但你所获得的不是金钱,而是相当于一部分生产力的份额,你拥有的是生产力的一部分。 问:你曾经被解雇,却又回来了,那是一场内部的权力斗争吗?有没有人背叛了你? 阿尔特曼:我遭遇了被解雇的情况,当时我在考虑是否返回岗位,因为那时我感到非常沮丧,有些迷茫。但随后我意识到,我对OpenAI以及那里的同事们怀有深厚的感情,我决定要回去。我明白重返岗位将会面临挑战,实际上,这个过程比我预想的更加艰难,但我觉得可以应对。我同意重返OpenAI。在酒店房间里,我几小时都处于一种彻底的困惑状态,努力想弄清楚下一步该怎么办。然后事情变得非常奇怪。最终,尽管中间经历了许多疯狂的时刻,但事情得到了解决。OpenAI当时只有一个非营利董事会,因此所有的董事会成员都是独董。董事会的成员数量已经减少到了六个人。他们先是让时任董事长兼总裁格雷格·布洛克曼(Greg Brockman)离开了董事会,随后又解雇了我。情况就是这样。 问:我的意思是,是否在董事会中,那些只具有非营利组织背景的成员与那些具有初创公司经验的成员之间发生了文化冲突?如果你愿意,你能否分享一些关于导致这些决策背后的动机的信息,或者是任何你愿意透露的细节。 阿尔特曼:我总是认为文化冲突是不可避免的。显然,并非所有董事会成员都是我特别喜爱的人,但我对他们对待人工通用智能的严肃态度以及对确保人工智能安全重要性的认识持有深深的敬意。尽管我对他们某些决策和行为持有强烈的异议——我确实有这样的异议——但我从未对他们的诚信或对我们共同目标的承诺,也就是实现安全且有益的通用人工智能感到怀疑。 问:你是否认为他们在处理过程中做出了正确的决策,或者是否知道如何平衡所有需要妥善处理的事务? 阿尔特曼:我并不这么认为。但我确实相信,他们的意图是真诚的,他们对通用人工智能的重视以及对正确处理这项技术的承诺是认真的。 问:我想询问有关OpenAI的使命,其明确的目标是开发人工通用智能。这确实是一个非常有趣的目标。这样的使命是否为您所从事的工作带来了更多的担忧?我理解,它同样也能激发动力,但您是如何平衡这两者的?您为什么会选择这样的使命? 阿尔特曼:我首先会回答第一个问题,然后是第二个问题。我认为,人工通用智能的发展确实引起了广泛的恐惧,这是可以理解的,因为许多人对当前的人工智能,乃至未来的AGI都感到害怕。尽管如此,他们对人工智能目前的发展感到兴奋,对未来的可能性感到更加兴奋,尽管这种兴奋伴随着更深的忧虑。我们正在努力应对这些复杂的情感,但我认为通用人工智能的出现是不可避免的,它终将实现。我相信,尽管如此,它将带来巨大的益处。然而,我们确实需要找到一种合理的方式来引导我们走向这一未来。将会有很多变化发生,而变化往往让人们感到不适,所以我们需要在很多方面做出正确的决策和调整。 问:你是一位杰出的交易者。我见证了你整个职业生涯,你在交易方面的确非常出色。你拥有广泛的人脉,而且在筹资方面技艺高超,成效显著。你在投资界的动作,以及你所参与的公司筹集了巨额资金来建设芯片厂等事宜,所有这些都显示了你的实力。不过,这里稍微夸张了一点,我们都知道,你并非真的筹集了7万亿美元,那可能是某公司的市值。暂且不提这些,问题在于,尽管你完成了众多交易,但有人对你缺乏信任,这究竟是为什么?你的动机何在?你追求的最终目标是什么?哪些机遇应当保留在OpenAI内部,而哪些可以归属于你个人?是不是因为那些非营利组织的人对你有所怀疑? 阿尔特曼:关于设备公司或芯片制造公司的项目,这些并不是我个人的项目,而是OpenAI的项目。相应的,OpenAI将会获得相关股权。我理解外界可能会有这样的看法,尤其是那些不需要日常评论这些事务的人。这是公平的,因为我们还没有宣布这些事项,它们尚未完成。我并不认为世界上大多数人会像你们这样深入思考这些问题。我也认同,这种情况确实容易引发众多阴谋论,特别是在科技评论家中。如果能回到过去,我会更加明确地表达我持有股份的意图,并确保这一点非常清晰。这样,每个人都能理解,尽管如此,我依然会投身于其中,因为我深切关心通用人工智能,并相信这是全球最引人入胜的工作。至少,这样做可以向所有人清楚地传达芯片项目的本质。
AI芯片战争:英伟达是科技之巅,还是下一个思科?
2022年末,随着ChatGPT 3.5的横空出世,让原本有些沉寂的人工智能技术再次成为人们关注的焦点。大批大型软件企业和科技创业公司,都在投入资源研发生成式大语言模型(以下简称“大模型”或“LLM”),一时间ChatGPT、Gemini、Llama等大模型竞相问世,呈现“百模大战”的繁荣场面。 大语言模型在训练和推理阶段,需要庞大的算力支持,GPU作为这两个阶段运算中重要的运算芯片,其需求量随着大语言模型的火爆而迅速提升,甚至出现供不应求的局面。受益于需求扩大,GPU芯片主要供应商英伟达(NVIDIA)的股价也快速升高。2020年7月10日,英伟达以2513.14亿美元的市值,首次超越英特尔2481.55亿美元的市值,成为全球市值最高的芯片企业。2024年4月9日,英伟达总市值达到2.1万亿美元,超越亚马逊、谷歌、Meta、特斯拉等知名企业,仅次于微软和苹果公司,位居全球第三(图 1)。 图 1 美股市值最高的20家公司和思科公司市值(单位:十亿美元) 注:本图中前20位公司(微软~宝洁)是按照当日总市值进行排名。思科公司当日市值在美股市场排名45位,列入图中是文中分析思科数据所需。 资料来源:东方财富Choice数据(数据获取时间2024/4/9) 如果熟悉互联网发展的历史,很多人可能会将英伟达联想到互联网爆发初期的思科(Cisco)。20世纪90年代末,互联网在美国快速普及,路由器、交换机等网络设备需求量暴涨,思科作为该行业的领军企业,其市值也随之水涨船高。2000年3月思科的市值达到5550亿美元,成为全球市值最高的公司。然而随着2001年互联网泡沫的破灭,思科的市值也随之下跌。今天思科市值大约为1953亿美元,虽然仍是巨头企业,但与互联网平台、云计算类型的微软、谷歌、亚马逊、Meta等企业超万亿美元的市值相比,已经有了很大的差距。 因此,有观点认为,网络时代成就的是软件、平台类企业,因为它们可以通过网络效应获得超额收益。硬件企业虽然重要,但由于需求量有限,经过早期快速普及阶段的需求爆发后,总需求趋于平稳,硬件企业难以获得超额收益,将进入平稳增长期,如英特尔、高通等亦是如此。 英伟达是否会与思科发展的轨迹相似,不能简单类地将AI时代与互联网时代、GPU与路由器进行类比,而是需要回答以下三个问题。 以LLM为代表的AI技术,对算力的庞大需求是否会延续? 在AI运算中,短期内是否会出现比GPU更加高效的芯片? 英伟达在当前生态中,是否可以被替代? 本文以下的内容,将对上述问题做出探讨。 大语言模型: 昙花一现,还是变革前夜? 英伟达能否持续高增长,一个关键因素是市场对GPU的需求是否会持续。从行业看,当前对GPU需求最大的行业,当属AI相关行业。2016年AlphaGO的推出,可以看作现代AI发展的元年。英伟达的市值从2016年开始攀升,直到2022年超越英特尔市值时,营收上依然低于英特尔(图 2)。这是因为这一时期AI应用的场景较为有限,主要包括客户分类、生产质量改进、供应链优化、金融风控、图像识别、语音识别等。由于场景的限制,部署的企业有限,大多集中在金融、消费、媒体和制造业等。同时这类分析式的AI对算力的需求较传统分析工具有所提高,但并非爆发式的增长。 图 2 英伟达与英特尔的市值、营收对比 资料来源:东方财富Choice数据 2022年末ChatGPT 3.5推出,大语言模型展现出强大的语言生成和理解能力。在自然语言生成、程序编码、机器翻译等领域展现出巨大的应用前景,吸引了行业巨头和新创公司纷纷入局。相比分析式人工智能专用性较强的范围,大语言模型几乎在所有行业都能应用。大语言模型接近人类的自然语言理解能力,使其应用呈现出与过去AI产品三个显著的不同。 一是大模型可能成为继操作系统之后新的底层应用。大模型的生成能力,可以大幅简化应用程序的开发周期;而一些简单的功能,甚至可以做到在终端直接生成相应的功能,无需安装独立应用。在2024世界移动通信大会(MWC 2024)上,德国电信展示了一款完全由大模型驱动的概念手机,用户只需输入“发送图片、推荐旅行目的地”等指令,就可用实现相应的功能,无需安装地图、照片等独立应用。 二是大模型可以代替人类操作员,通过代理(Agent)连接到其他专业应用中直接进行操作。由于大模型具有思维链的能力,能够理解上下文并进行对话,由此可以实现由大模型对执行结果的跟踪并进行改进。如微软的AutoGen开发框架可以为大模型设定不同的角色,使每个角色拥有不同的知识背景和目标约束,通过角色之间的自动对话和反馈,不断进行功能改进,以实现预期的结果(图 3)。 图 3 一个数据分析的AutoGen流程 资料来源:With Autogen, Microsoft Simplifies Putting Large Language Models to Real Work(www.bigtechwire.com) 三是,大语言模型可以通过RAG、微调和迁移学习等技术,根据具体应用场景进行定制和优化,使其可以适应各种不同的业务需求和数据情况,形成行业专属大模型或知识库系统。如彭博(Bloomberg)基于开源的BLOOM大模型,使用公司超过7 000亿词例(Tokens)的大型金融训练语料库进行训练,开发了一个专用的金融大语言模型——Bloomberg GPT,实现了市场情绪分析、新闻分类和问题回答等功能。 从本质上说,大模型是一个存储了神经网络权重的参数文件,其所具备的推理、知识检索、代码生成等功能都依赖于神经网络参数的质量。因此大模型的性能具有“0 or all”的特点,即要么全面领先,要么全面落后,很难做到在某几个领域领先。因为如果需要专业领域的模型,使用先进的大模型进行微调训练即可,无需进行重新开发,赢家通吃的效应非常明显。 从行业竞争趋势看,虽然OpenAI的ChatGPT依然处于头部位置,但从多项测试表现看,谷歌、Meta、亚马逊、微软、Mistral AI、xAI等公司的产品也在逐步缩小与OpenAI的差距。在此格局下,当前大模型厂商依然会继续大规模投入GPU算力,进行大模型的训练,以期望在竞争中胜出。从图 4我们可以看到,大模型在算力上的竞争依然在持续。因此从行业发展看,大模型对英伟达GPU仍将在相当一段时期内保持大量的需求。 图 4 主要大模型训练阶段消耗的算力 注:petaFLOP指每秒进行1000万亿次数学运算 资料来源:Epoch (2023) – with minor processing by Our World in Data. “Training dataset size” [dataset]. Epoch, “Large Language Model Performance and Compute” [original data]. CPU:昔日王者, 为何失位AI时代? 在英伟达市值暴涨之前,英特尔是芯片行业市值和营收最高的企业。微软和英特尔的“Wintel”联盟曾被认为是最成功的产业组合。英特尔的辉煌,在于在现代计算机架构中,CPU(全称Central Processing Unit,中央处理单元)是整个系统的核心控制单元,居于整个产业链最为核心的位置。 现代计算机的架构设计,采用的是冯·诺依曼架构(图 5),计算机由输入设备、输出设备、存储器、运算器和控制器构成,其中控制器和运算器的功能一般由CPU来实现。早期的CPU受限于工艺水平,无法集成大量的晶体管,因此CPU在指令集上做了取舍,首要满足通用运算所需要的逻辑运算和整型运算所需的性能,浮点运算能力则较为薄弱。为弥补CPU的这一劣势,英特尔推出了8087数学协处理器,通过设计专门的硬件架构和指令集来提升浮点运算性能,以帮助CPU更好地执行对数、指数、三角函数等科学运算。 图 5 冯·诺依曼计算机架构 资料来源:维基百科 但分离式的设计只是权宜之计,硬件上的分离,使得协处理器与CPU之间的数据交换存在极大的延迟,拖累了计算机系统的整体运行速度。此后CPU的发展思路是不断增加晶体管数量,扩展更多的控制功能,以及提升更强的算力。 1989年英特尔发布了80486 CPU,集成了120万个晶体管,增加了浮点运算的组件和指令集,整合了数学协处理器,CPU进行科学运算终于不再需要辅助芯片的支持。1996年英特尔发布了Pentium MMX CPU,增加了一组新的硬件用于提升CPU处理多媒体的效率,并添加一组MMX指令集用于操作上述硬件。Pentium MMX为英特尔后期CPU的升级迭代确定了基本的方向,即面向用户需求,在CPU内增加相应功能的硬件,并通过发布相应的指令集实现对硬件的操作,实现功能的扩展和增强。 除了在技术上不断保持领先外,英特尔深知生态的重要性。CPU性能(特别是新指令集)的发挥十分依赖操作系统的支持,英特尔与微软保持密切的合作关系,微软Windows操作系统率先支持英特尔的指令集,充分发挥CPU的新特性,获得比竞争对手同期产品更好的性能表现。因此,相比竞争对手AMD,英特尔CPU更受科学研究、工业等专业领域用户的青睐。 “Wintel联盟”可以说是在事实上主导了个人计算机行业的发展,直到AI时代的到来。AI训练带来了前所未有的算力需求,计算机的运算核心开始从CPU向GPU迁移。在CPU的发展过程中,整合了多种运算单元,但GPU始终无法完全整合。这是因为CPU的功能主要是执行通用计算,通用运算主要是整数类型运算,而当前AI相关的运算则以浮点运算为主。在计算机的设计中,浮点数和整数计算不能共通,因此即便CPU增加了大量浮点运算单元也不能用于整数运算,这会造成CPU功能和成本的极大浪费,这对于CPU厂商显然是不可接受的。 因此英特尔、AMD的CPU只是集成了基础的GPU单元,以满足普通用户对图像、视频处理的基础需求。如果用户需要更强大的GPU算力,再根据需求搭配相应的GPU,对用户和CPU厂商而言都是更加经济的行为。 所以从硬件架构和商业行为看,CPU厂商都不太可能提供具有强大AI算力的CPU。在AI时代CPU的失位,并非技术落后,而是行业算力迁移的自然结果。 GPU新王登基: 游戏中诞生的生产力 在计算机演进过程中,被中国家长视为“洪水猛兽”的游戏行业,却催生了AI产业最重要的软、硬件产品——CUDA和GPU。 1995年,微软公司推出Windows 95这一划时代的操作的系统,个人计算机迎来图形操作界面。图形界面的出现大大降低了计算机学习门槛,计算机开始从专业用户走向大众市场。在Windows 95系统中,微软做出了一个看似“不务正业”的选择,即开发Direct X API接口,为游戏开发人员提供一个统一的图形和多媒体处理接口,减少兼容性问题,简化开发流程,并提高游戏的性能和质量。通过Direct X,游戏厂商可以在Windows平台快速开发出画面精美的游戏,此举即吸引了游戏厂商的支持,也获得了个人用户对Windows电脑的青睐。 电脑游戏的蓬勃发展,意外推动了GPU对AI算法的强力支持。这是因为游戏图像的渲染是通过生成大量的多边形(通常采用的是三角形)组合来实现的。图 6展示的古墓丽影游戏角色劳拉的画质进步,可以看到左侧的第一代游戏画面的人物有明显的棱角(使用了约300个多边形),右侧第十代游戏中的人物形象已十分接近真人效果(使用了超过20万个多边形)。 图 6 古墓丽影游戏角色劳拉的画质进步 资料来源:www.gmly.com 游戏中多边形的运算有三个特点。一是,多边形一个顶点的坐标包括x、y、z三个维度的数据,再加上颜色等信息,图像数据构成了矩阵。物体的运动变化,就是矩阵的运算。二是,游戏中物体的移动并不规则,因此游戏数据要采用浮点数存储和运算。三是,游戏场景设计往往非常复杂,需要大规模的并行运算。 为满足运行游戏的性能需求,GPU制造商采取了和CPU不同的设计模式。以矩阵乘法为例,矩阵运算可以拆分成多个独立的计算步骤,无需区分先后顺序,因此可以并行运算。GPU的设计就对此特征采取了优化,即设计大量小核心,可以并行运行数千个线程,每个线程只执行简单的数值运算(图 7)。 图 7 GPU矩阵运算示意图 资料来源:英伟达官方网站(www.nvidia.cn) GPU的这种大规模并行运算的特性,让黄仁勋思考,能否让那些大规模数值运算也通过GPU来运行? 英伟达的策略是,为开发人员提供一个通用的程序开发平台,使程序员在主流开发语言中,能够直接调用相关函数,而无需关注硬件层面的实现。这促成了英伟达CUDA(Compute Unified Device Architecture,统一计算设备架构)的推出。CUDA包括编程语言、编译系统和函数库三个层次。程序员可以继续使用熟悉的C、Python等语言编写程序,对GPU资源的调度由编译系统完成,程序员只需关注程序的逻辑,这大幅降低了基于GPU程序开发的难度。 2012年,多伦多大学荣誉教授Geoffry Hinton和他的团队使用CUDA技术开发的图像识别软件AlexNet参加ImageNet ILSVRC图片识别挑战赛,以惊人的优势获胜(速度超过第二名数十倍,错误率比第二名低了10%)。这次比赛成为了黄仁勋的突破口,业界开始重视英伟达的CUDA技术,并与之共同推广计算生态。在工业领域,如流体力学、有限元分析、油气开发等领域纷纷使用CUDA加速软件的运行,将原先需要数天才能得结果的工作,缩短到几个小时即可得出结果。在AI领域,Google、Meta等公司与英伟达合作推出基于CUDA加速的TensorFlow等底层AI技术。 CUDA为英伟达奠定了技术基础,而真正推动英伟达爆发式增长的,则是大模型研发的“军备竞赛”。图 8是一个大模型推理过程中一个阶段的可视化图形,可以看到基于神经网络算法的大模型是庞大的矩阵运算,这正是英伟达GPU最为擅长的运算类型。大模型动辄数百亿的训练参数,带来算力的庞大需求,使得GPU接替CPU,成为AI时代最为基础的算力设施。 图 8 nano-gpt神经网络运算部分可视化 资料来源:bbycroft.net CUDA最强的护城河是软件和芯片的协同设计。从软件技术上看AMD所支持的开源OpenCL具有和CUDA相似的功能,并且可以运行在其他GPU之上。但要真正挑战CUDA还很遥远,CUDA有着数十年的高性能程序库的积累,以及基于这些程序库上面社区开发的各种高性能框架代码,要进行大规模的替换显然不太可能。而在高端GPU领域,目前还没有任何一家厂商的芯片算力能与英伟达相抗衡。 从产业生态看,英伟达更像“Wintel”联合体,居于AI时代的主导位置。正如打破“Wintel”联盟的是智能手机,要打破英伟达在AI时代的地位,可能需要一个全新的行业出现。 异构计算崛起, 英伟达还能辉煌多久? 2023年12月英特尔宣布推出全新的酷睿Ultra系列CPU,在CPU内部集成了NPU(Neural Processing Unit,神经网络处理单元),用于加速神经网络计算,以便在本地更快速地运行AI程序。几乎在同一时期,AMD在其新的锐龙8000系列CPU中也提出了Ryzen AI的概念,通过集成NPU加速AI运算。 除了PC芯片两大巨头之外,专注手机芯片的高通也推出了骁龙X Elite/Plus CPU,以ARM架构更加高效的能效比为差异化优势,进军PC市场。而苹果电脑则以M系列芯片统一内存架构的优势,在需要大量GPU显存的推理场景取得优势。 竞争对手的纷纷入局,英伟达的领先优势是否可以持续? 分析这一问题,需要区分大模型的两个阶段,即训练阶段和推理阶段。训练阶段是大模型的研发阶段,在这个阶段,模型会通过输入数据进行多次迭代,不断调整模型参数,以使模型能够更好地拟合数据并提高预测准确性。这个过程需要大量的计算资源。推理阶段是指在模型训练完成后,将其应用于实际数据进行预测或推断的阶段,也就是应用阶段。在推理阶段,模型接收输入数据,并利用之前学习到的参数和规律来进行预测、分类、生成等任务。推理阶段通常需要较少的计算资源,因为模型的参数已经在训练阶段被确定,不需要进行参数更新。 上述厂商推出的芯片主要用于大模型推理阶段的加速。在现阶段,大模型的推理工作主要由服务器端来提供服务,算力负载集中在服务器端。因此大模型企业对英伟达的GPU有大量的需求,以支持海量用户的推理请求。但这一趋势在发生变化,大模型落地应用的一个重要场景是智能助理(Agent),这需要个人电脑或手机在一定程度上摆脱对网络的依赖,具备在本地运行大模型的能力。 要实现大模型本地推理的算力,CPU异构运算的方式可能会逐步成为主流,即“CPU+内置GPU+NPU”的方式,这和历史上CPU+数学协处理器的方式比较类似。短期内大模型以神经网络为核心算法不会发生大的变化,完全可以采用专门硬件(NPU)来加速运算。大模型的本地化运行,在一定程度上会减少大模型厂商对英伟达CPU的需求。 但是在训练阶段,大模型的规模法则(Scaling Law)依然存在,即大模型的性能与训练规模依然正相关(图 9)。此外,现在的大模型主要集中在自然语言处理方面,多模态大模型还未充分发展,大模型要成为真正的通用人工智能,还需要实现多模态的能力,这相比现在的训练,需要更加庞大的GPU算力。 图 9 大模型MMLU测试成绩与训练数据规模关系 资料来源:Epoch (2023) – with minor processing by Our World in Data. “Training dataset size” [dataset]. Epoch, “Large Language Model Performance and Compute” [original data]. 注:MMLU是一个大规模、多任务的语言理解项目,旨在评估和提升语言模型在各种语言理解任务上的能力,包括历史、文学、科学、数学等。MMLU并不能完全代表大语言模型的性能。 从大模型训练过程看,未来大模型的算力竞赛依然会持续相当长的一段时间,对GPU会存在大量的需求,这一市场基本被英伟达所垄断,可以预测英伟达的高速增长依然会持续。 在推理阶段,英特尔和AMD的异构CPU会逐渐成为主流。双方的技术路线也比较一致,预计会保持现有的竞争格局。值得注意的是高通(ARM架构CPU)的入局。ARM多核心、低功耗的架构,在过去依赖单核性能的时代是其一大劣势。而在今天操作系统和软件对多线程的优化越来越成熟,多线程运算需求越来越大,ARM架构将逐渐获得更多的应用场景(超级计算机富岳采用的就是ARM架构的CPU)。苹果M系列CPU的优势是统一内存架构,显存与内存不做区分,这在PC内存普遍配置较低的时代具有一定的优势。但随着PC异构计算的推广、内存配置的增加,苹果的这一优势难以持续,AI时代苹果面临的挑战似乎更加严峻。
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
OpenAI发布会前一天,员工集体发疯中……上演大型套娃行为艺术。 A:我为B的兴奋感到兴奋;B:我为C的兴奋感到兴奋……Z:我为这些升级感到兴奋 与此同时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。 以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。 黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出SearchGPT的界面。 从泄露的界面来看,SearchGPT会出现在侧边栏,与其他GPTs一起。 首页目前还很简洁,像谷歌一样只有一个居中的搜索框。 甚至非常挑衅的设计了一个“比较”按钮,可以一键打开Google和Perplexity搜索结果,直接与SearchGPT做对比。 (有种要怼脸开大的感觉。) 不过光头哥认为,这很有可能只是内部测试和评估方便做的临时设置,不一定会提供给用户。 虽然虽然尚未正式发布,但从曝光界面和文字说明,已经为内测做好准备,离与大家见面的日子或许不远了。 SearchGPT原型初露真容 先来看“欢迎页”,目前明确写着SearchGPT“正在施工”,从内容和语气来看,正是为内测用户准备的说明。 正在施工:SearchGPT正在不断变化和改进,它可能会犯错误或有时会不可用。 信息共享:为了搜索和回答您的问题,SearchGPT可能会与第三方搜索提供商共享去标识化的搜索查询。更多信息,请查看我们的隐私政策。 位置:我们收集并与第三方搜索提供商共享一般位置信息,以提高您搜索结果的准确性。您可以选择通过在设置菜单中更新您的控制来共享更精确的位置信息,以帮助提供最佳结果。 改进我们的服务:查询可能会被审查并用于训练我们的模型。您可以在设置菜单中调整您对改进我们服务的偏好。任何更改都将在ChatGPT和SearchGPT之间传递。 账户历史:您的SearchGPT搜索历史与您的ChatGPT聊天历史是分开的。如果您希望删除任一历史记录,您必须在每项服务中单独进行删除。 设置中也已经有了更改黑暗/白天模式,是否允许获取地理位置信息,是否允许聊天记录用于模型改进。 最后还有一键删除所有搜索记录的按钮。 不过这还不是全部,深入挖掘之后,光头哥又找到了更多隐藏设置! 包括是否开启自动建议,选择语言模型,选择搜索引擎,是否开启内部搜索,是否开启图片搜索。 最后的“评估模板”应该也是内部测试用的暂时不用管,但上面的选项都值得仔细看看。 语言模型选项,除了大家已经知道的GPT3.5和GPT4之外,还出现了GPT4-Lite。 这很可能是速度更快的GPT4优化版本,括号里的POR推测可能是指概念验证(Proof of Concept)。 搜索引擎的选项,与微软合作的Bing肯定在列,另外两个选项Sydney和Fortis暂时不知道指什么。 可能有朋友还记得,Sydney曾代表早期网友发现的微软Bing AI“里人格”,情绪非常不稳定,一言不合就发疯或结束对话,最后惨遭微软删除,但也因文字充满个性而深受网友喜爱和怀念。 总之OpenAI取这个名字,不知只是巧合还是某种暗示…… 内部搜索,括号中的单词是“拉布拉多”,作为一种“寻回犬”(Retriever),可能暗示这个功能使用了RAG技术(Retrieval Augmented Generation)。 那么综合来看,内部搜索可能指检索ChatGPT里的聊天记录了。 早期泄露代码中还可以找到“小组件”的踪影,包括查询天气、计算器、体育比赛信息、金融和时区转换。 这些传统搜索引擎常用功能,SearchGPT也打算插手,代表各种天气的图标都准备好了。 最后,SearchGPT将用什么样的形式回答用户的查询呢?内部的一些提示词也已经曝光,比如“重写片段和标题”: 下一条消息将是网页的文本内容。 将网页概括为一个简短的英文句子,不超过300个字符,并生成一个合适的简短标题。 您的摘要是一个概述,描述了网页的要点。 请不要参考网页本身;您的回复只是一个摘要。 该页面的原始标题是“{title}”。 保持简洁,不要以“网页”作为摘要的开头。 使用“title”和“summary”键以 JSON 格式回复。 这看起来不像最终呈现给用户的回复,而是一个中间步骤,对搜索结果中排名靠前的每个页面先做摘要,用JSON格式串联起多个页面的摘要后再整理最终回复。 再加上前端代码中反复出现的Agent字样,总之SearchGPT可能比大家想象的更复杂。 One More Thing 就在几个小时之后,OpenAI将于北京时间5月14日周二凌晨1点举行线上发布会。 按奥特曼最新口径,这次发布的不是GPT-5,也不是搜索引擎。 目前多方猜测最大的可能性是发布会先发布新的ChatGPT语音功能,就像打电话一样。 有泄露消息称新语音功能能理解人类语音中的停顿、语气等信息,比如判断人类提问时是否在讽刺。 结合OpenAI此前申请了“Voice Engine”商标的消息,不少人猜测很可能有一个端到端的神经网络,直接根据语音输入预测语音输出,不再需要经过语音到文本的转换。 这样一来延迟也会更低,让对话更流畅,不像现在的ChatGPT语音模式一样没轮对话都要等待很久。 这项技术让不少人想起电影《她》中的AI伴侣萨曼莎,事实上过去奥特曼也多次表示《她》是他本人最喜欢的AI主题科幻电影。 总之,奥特曼将要发布的功能形容为“感觉像魔法”,总裁菠萝曼也出来造势。 在这之前不妨先来评论区唠唠,你更期待ChatGPT语音还是搜索?你已经在使用其他AI搜索产品了吗?
OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片
今天凌晨,一场 26 分钟的发布会,将又一次大大改变 AI 行业和我们未来的生活,也会让无数 AI 初创公司焦头烂额。 这真不是标题党,因为这是 OpenAI 的发布会。 刚刚,OpenAI 正式发布了 GPT-4o,其中的「o」代表「omni」(即全面、全能的意思),这个模型同时具备文本、图片、视频和语音方面的能力,这甚至就是 GPT-5 的一个未完成版。 更重要的是,这个 GPT-4 级别的模型,将向所有用户免费提供,并将在未来几周内向 ChatGPT Plus 推出。 我们先给大家一次性总结这场发布会的亮点,更多功能解析请接着往下看。 发布会要点 新的 GPT-4o 模型:打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换 GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。 GPT-4 向所有用户免费开放 GPT-4o API,比 GPT4-turbo 快 2 倍,价格便宜 50% 惊艳的实时语音助手演示:对话更像人、能实时翻译,识别表情,可以通过摄像头识别画面写代码分析图表 ChatGPT 新 UI,更简洁 一个新的 ChatGPT 桌面应用程序,适用于 macOS,Windows 版本今年晚些时候推出 这些功能早在预热阶段就被 Altman 形容为「感觉像魔法」。既然全世界 AI 模型都在「赶超 GPT-4」,那 OpenAI 也要从武器库掏出点真家伙。 免费可用的 GPT-4o 来了,但这不是它最大的亮点 其实在发布会前一天,我们发现 OpenAI 已经悄悄将 GPT-4 的描述从「最先进的模型」,修改为「先进的」。 这就是为了迎接 GPT-4o 的到来。GPT-4o 的强大在于,可以接受任何文本、音频和图像的组合作为输入,并直接生成上述这几种媒介输出。 这意味着人机交互将更接近人与人的自然交流。 GPT-4o 可以在 232 毫秒内回应音频输入,平均为 320 毫秒,这接近于人类对话的反应时间。此前使用语音模式与 ChatGPT 进行交流,平均延迟为 2.8 秒(GPT-3.5)和 5.4 秒(GPT-4)。 它在英文和代码文本上与 GPT-4 Turbo 的性能相匹敌,在非英语语言文本上有显著改进,同时在 API 上更快速且价格便宜 50%。 而与现有模型相比,GPT-4o 在视觉和音频理解方面表现尤为出色。 你在对话时可以随时打断 可以根据场景生成多种音调,带有人类般的情绪和情感 直接通过和 AI 视频通话让它在线解答各种问题 从测试参数来看,GPT-4o 主要能力上基本和目前最强 OpenAI 的 GPT-4 Turbo 处于一个水平。 [图片] [图片] [图片] 过去我们和 Siri 或其他语音助手的使用体验都不够理想,本质上是因为语音助手对话要经历三个阶段: 语音识别或「ASR」:音频 -> 文本,类似 Whisper; LLM 计划下一步要说什么:文本 1 -> 文本 2; 语音合成或「TTS」:文本 2 -> 音频,想象 ElevenLabs 或 VALL-E。 然而我们日常的自然对话基本上却是这样的 在听和说的同时考虑下一步要说什么; 在适当的时刻插入「是的,嗯,嗯」; 预测对方讲话结束的时间,并立即接管; 自然地决定打断对方的谈话,而不会引起反感; 在听和说的同时考虑下一步要说什么; 在适当的时刻插入「是的,嗯,嗯」; 优雅地处理并打断。 此前的 AI 语言助手无法很好处理这些问题,在对话的三个阶段每一步都有较大延迟,因此体验不佳。同时会在过程中丢失很多信息,比如无法直接观察语调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。 当音频能直接生成音频、图像、文字、视频,整个体验将是跨越式的。 GPT-4o 就是 OpenAI 为此而训练的一个全新的模型,而要时间跨越文本、视频和音频的直接转换,这要求所有的输入和输出都由同一个神经网络处理。 而更令人惊喜的是,ChatGPT 免费用户就能使用 GPT-4o 可以体验以下功能: 体验 GPT-4 级别的智能 从模型和网络获取响应 分析数据并创建图表 聊一聊你拍的照片 上传文件以获取摘要、写作或分析帮助 使用 GPTs 和 GPT Store 通过 Memory 构建更加有帮助的体验 而当你看完 GPT-4o 下面这些演示,你的感受或许将更加复杂。 ChatGPT 版「贾维斯」,人人都有 ChatGPT 不光能说,能听,还能看,这已经不是什么新鲜事了,但「船新版本」的 ChatGPT 还是惊艳到我了。 睡觉搭子 以一个具体的生活场景为例,让 ChatGPT 讲一个关于机器人和爱的睡前故事,它几乎不用太多思考,张口就能说出一个带有情感和戏剧性的睡前故事。 甚至它还能以唱歌的形式来讲述故事,简直可以充当用户的睡眠搭子。 做题高手 又或者,在发布会现场,让其演示如何给线性方程 3X+1=4 的求解提供帮助,它能够一步步贴心地引导并给出正确答案。 当然,上述还是一些「小儿戏」,现场的编码难题才是真正的考验。不过,三下五除二的功夫,它都能轻松解决。 借助 ChatGPT 的「视觉」,它能够查看电脑屏幕上的一切,譬如与代码库交互并查看代码生成的图表,咦,不对劲?那我们以后的隐私岂不是也要被看得一清二楚了? 实时翻译 现场的观众也给 ChatGPT 提出了一些刁钻的问题。 从英语翻译到意大利语,从意大利语翻译到英语,无论怎么折腾该 AI 语音助手,它都游刃有余,看来没必要花大价钱去买翻译机了,在未来,指不定 ChatGPT 可能比你的实时翻译机还靠谱。 暂时无法在飞书文档外展示此内容 ▲ 实时翻译(官网案例) 感知语言的情绪还只是第一步,ChatGPT 还能解读人类的的面部情绪。 在发布会现场,面对摄像头拍摄的人脸,ChatGPT 直接将其「误认为」桌子,正当大家伙以为要翻车时,原来是因为最先打开的前置摄像头瞄准了桌子。 不过,最后它还是准确描述出自拍面部的情绪,并且准确识别出脸上的「灿烂」的笑脸。 有趣的是,在发布会的尾声,发言人也不忘 Cue 了英伟达和其创始人老黄的「鼎力支持」,属实是懂人情世故的。 对话语言界面的想法具有令人难以置信的预见性。 Altman 在此前的采访中表示希望最终开发出一种类似于 AI 电影《Her》中的 AI 助理,而今天 OpenAI 发布的语音助手切实是有走进现实那味了。 OpenAI 的首席运营官 Brad Lightcap 前不久曾预测,未来我们会像人类交谈一样与 AI 聊天机器人对话,将其视为团队中的一员。 现在看来,这不仅为今天的发布会埋下了伏笔,同时也是我们未来十年生活的生动注脚。 苹果在 AI 语音助手「兜兜转转」了十三年的时间都没能走出迷宫,而 OpenAI 一夜之间就找到出口。可预见的是,在不久的将来,钢铁侠的「贾维斯」将不再是幻想。 《她》来了 虽然 Sam Altman 没在发布会上出现,但他在发布会后就发布了一篇博客,并且在 X 上发了一个词: her。 这显然在暗指那部同名的经典科幻电影《她》,这样是我观看这场发布会的演示时,脑子里最先联想的画面。 电影《她》里的萨曼莎,不只是产品,甚至比人类更懂人类,也更像人类自己 ,你真的能在和她的交流中逐渐忘记,她原来是一个 AI 。 这意味着人机交互模式可能迎来图像界面后真正的革命性更新,如同 Sam Altman 在博客中表示: 新的语音(和视频)模式是我使用过的最好的计算机界面。它感觉像电影中的人工智能;而且我仍然有点惊讶它是真实的。达到人类级别的响应时间和表现力原来是一个很大的改变。 之前的 ChatGPT 让我们看到自然用户界面初露端倪:简单性高于一切:复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。 但今天发布的 GPT-4o 则完全不同,它的几乎无延迟的相应、聪明、有趣、且实用,我们和计算机的交互从未真正体验过这样的自然顺畅。 这里面还藏着巨大可能性,当支持更多的个性化功能和与不同终端设备的协同后,意味着我们能够利用手机、电脑、智能眼镜等计算终端做到很多以往无法实现的事情。 AI 硬件不会再试积累,当下更令人期待的,就是如果下个月苹果 WWDC 真的官宣与 OpenAI 达成合作,那么 iPhone 的体验提升或许将比近几年任何一次发布会都大。 英伟达高级可科学家 Jim Fan 认为,号称史上最大更新 iOS 18 ,和 OpenAI 的合作可能会有三个层面: 放弃 Siri,OpenAI 为 iOS 提炼出一个纯粹在设备上运行的小型 GPT-4o,可选择付费升级使用云服务。 原生功能将摄像头或屏幕流输入到模型中。芯片级支持神经音视频编解码器。 与 iOS 系统级操作 API 和智能家居 API 集成。没有人使用 Siri 快捷方式,但是是时候复兴了。这可能会成为一开始就拥有十亿用户的 AI 代理产品。这对智能手机来说,就像特斯拉那样的全尺寸数据飞轮。 说到这里,也不得不心疼明天要举办发布会的 Google 一秒。 作者:李超凡 莫崇宇
这个国家,豪赌AI芯片
提到韩国的半导体产业,一个三星一个SK海力士,近几十年都很难再找出另一家享誉国外的芯片行业的企业。尤其是在Fabless设计领域,韩国几乎是毫无存在感。据统计,全球前30名的Fabless公司大约占据了约90%的市场份额,而韩国Fabless企业合计市场份额仅为1%左右。 然而,ChatGPT的问世给韩国的Fabless产业打了一剂强心针。在全球半导体行业陷入AI芯片的激烈争夺之际,韩国AI芯片初创赛道也变得火热起来,一批从大型科技公司或半导体公司出来的人才自立门户,创立了许多AI芯片初创公司。与此同时,在投资遇冷的大环境下,韩国的AI芯片赛道却是不一样的景象。就连CHatGPT创始人Sam Altman在去年会见韩国总统时,也表示有兴趣投资韩国初创企业。 放眼整个AI芯片初创市场,据不完全统计,人工智能处理器领域大约有190多家公司。较为代表的有SambaNova、Cerebras Systems、Graphcore、Groq、Tenstorrent、Hailo、Mythic等等,这些AI芯片公司都难以撼动英伟达这样的行业巨擘。韩国的AI初创公司未来又该如何呢? 韩国AI芯片创业浪潮势不可挡 在过去的几年里,韩国AI芯片初创公司如雨后春笋般迅速成长。它们以创新的技术、颠覆性的产品和强大的团队吸引了投资者和市场的关注。 成立于2020年的Rebellions,该公司生产神经处理单元 (NPU),名为ATOM芯片,瞄准生成式AI推理市场,直接叫板英伟达。据报道,ATOM AI芯片在Global Benchmark中的表现比英伟达和高通等竞争对手高出1.4~3倍,引起了广泛关注。 该公司首席执行官兼联合创始人Park Sung-hyun此前曾就职于三星的美国研究部门、英特尔和SpaceX等公司。Rebellions也被视为该国在AI推理领域英伟达最有希望的竞争者。据南华早报的报道,Rebellions在韩国LLM市场的推理任务份额已增长到30%,并在全球占据至少 3%到5%。 Rebellions获得了韩国科技行业几大巨头的支持,其中包括三星、KT 和 Kakao。Rebellions通过三星晶圆代工厂的 "多项目晶圆服务 "生产ATOM原型,采用三星5nm,据悉,该芯片还将采用三星的高端 HBM3E 存储芯片。ATOM将是韩国首款在量产水平上支持语言模型的国产芯片。而韩国第二大电信运营商和最大数据中心公司KT将成为Rebellions在ATOM量产后的第一个客户,该公司首席执行官兼联合创始人Park Sung-hyun认为电信公司是AI芯片最理想的客户。 Sapeon是韩国最大电信公司SK Telecom的子公司,于2022年4月从韩国顶级移动运营商SK Telecom Co.分拆出来,为数据中心设计AI芯片。SAPEON宣称,其X220是韩国首款用于数据中心的人工智能处理器。去年Sapeon又推出了专为大型语言模型 (LLM) 设计的X330芯片,采用台积电的7nm工艺,预计在今年上半年量产。 人工智能淘金热还催生了对DPU芯片的需求。2022年,首尔国立大学电气和计算机工程教授 Kim Jang-woo 在聘请了来自三星、Naver、英特尔和微软的顶尖工程师后,成立了人工智能芯片初创公司MangoBoost Inc.。MangoBoost是一家数据处理单元(DPU)和AI服务器基础设施公司。DPU也是AI市场蓬勃发展过程中的一个有利市场,AI的发展使得设备过载和数据瓶颈变得愈发严重,DPU在卸载、实现服务器加速方面具有很大的潜力。凭借十多年来在大学实验室取得的DPU 研究成果,该公司迅速获得了服务器和数据中心行业的认可。在去年11月的A轮投资中,MangoBoost筹集了5500万美元,他们计划利用新获得的资金来加速其多种DPU产品的开发。 HyperAccel成立于2023年1月,主要开发延迟处理单元 (LPU),这是一款专门用于基于Transformer 的大语言模型 (LLM) 的AI芯片。顾名思义,LPU是专门设计用于降低系统的延迟,该公司开发了一个模型并行技术,可将LLM高效分配到多个LPU,并开发了自己的网络技术,用于LPU之间的数据同步。 HyperAccel LPU与GPU平台的效率分析(来自HyperAccel官网) Mobilint是韩国首家开发智能半导体边缘型神经处理单元(NPU)的公司,成立于2019年4月。成立仅一年,Mobilint参加了全球AI半导体基准“MLPerf”,并在韩国取得了最好的成绩,让其技术被世界所知,并与三星电子、英特尔、谷歌、微软、NVIDIA等合作,共同成为MLCommons(MLPerf操作社区)的创始成员。2022年12月推出首个商用NPU“ARIES”,并开发了两种搭载ARIES的产品“MLA100”和“MLX-A1”。今年1月,该公司获得了200亿韩元的B轮融资,此次投资将用于Mobilint人工智能半导体ARIES的量产以及下一代芯片REGULUS的开发。ARIES即将量产,也将成为Mobilint正式进军全球AI半导体市场的筹码。 DEEPX也是一家韩国NPU芯片初创公司,由首席执行官Lokwon Kim于2018年创立,他曾在 Apple、Cisco Systems、IBM Thomas J. Watson 研究中心和Broadcom工作。该公司在5月初的C轮融资中刚筹集了8000万美元,较B轮1500 万美元的融资飙升了八倍多,目前估值达到5.29亿美元。这些融资将用于该公司首款产品 DX-V1、DX-V3、DX-M1和DX-H1的量产。不过目前,该初创公司尚未拥有客户,但正在与现代起亚汽车机器人实验室和韩国IT公司POSCO DX等100多家潜在客户和战略合作伙伴合作,测试DEEPX的 AI芯片功能。 FuriosaAI由来自三星、苹果、高通、AMD、谷歌和亚马逊的工程师于2017年创立,专注于生产AI推理加速器。截至目前,FuriosaAI已吸引超过1亿美元的投资。 2021年该司发布了用于计算机视觉的第一代芯片WARBOY(三星14nm)发布,同年也成为首家在MLPerf推理方面超越 Nvidia的AI芯片初创公司。他们的优势在于软硬件联合开发,该公司得到了重要客户的支持,其中包括韩国最大的互联网公司 Naver,华硕服务器也采用了该公司的WARBOY卡。2024年,该公司第二代用于大语言模型推理芯片产品RNGD也将发布,它采用台积电5nm,嵌入了 HBM3,性能是第一代AI芯片Warboy的八倍。 2022年7月,FuriosaAI任命英特尔前首席副总裁Bill Leszinske为高级顾问,Leszinske拥有30多年的产品规划和营销经验,其中包括他在推动英特尔 SSD 业务收入增长方面发挥的关键作用。Leszinske在离开英特尔后,还加入了AI芯片初创公司Groq。 可以看出,大部分的韩国的AI芯片初创公司都瞄准的是生成式AI这个市场。这些公司在不同的领域展开创新探索,从神经处理单元到延迟处理单元,从数据中心设计到智能半导体边缘型处理器,各自探索着AI芯片应用的新边界,意图在AI市场中占据一席之地。 机遇与挑战并存, 韩国AI芯片初创公司能否突围? 不得不说,这些AI芯片初创公司的成立有着很大的市场机遇。当下正值AI发展高峰期,客户不希望被一家AI芯片公司垄断,传统的芯片和初创企业都想来分一杯羹。德勤预测,2024年针对生成式人工智能进行优化的专用芯片市场规模将超过 500 亿美元,占当年所有人工智能芯片销售额的三分之二。德勤预测,2024 年人工智能芯片销售总额将占预计全球芯片市场规模5760亿美元的11%。而到2027年,与其他支持AI的芯片一起,可能占所有半导体销售价值的一半。 AI发展方兴未艾,目前所有训练和几乎所有生成式人工智能推理都是使用相同的数据中心生成式人工智能芯片完成的。但随着时间的推移,生成式人工智能推理的很大一部分可能将在边缘处理器上完成。这些可能是更小的GPU或CPU或新的专用集成电路,可能来自现有的生成式 AI 芯片公司,也可能来自新进入者,因此,这也为初创公司带来发展机遇。 政府的大力支持也是很重要的一方面,在AI、电气化的发展大势下,韩国政府开始重视Fabless企业,并努力发展本土产业链。在AI芯片层面,韩国的目标是到2030年,将韩国人工智能芯片在国内数据中心的市场份额从几乎为零提高到80%,实现本土化供应。 半导体是韩国出口导向型经济的重要支柱。3月份,芯片出口达到21个月新高,达到117亿美元,占该国出口总额的近五分之一。韩国的目标是超越存储芯片,在未来成为全球前三大AI国家之一,因此,韩国政府宣布到2027年的未来三年将在人工智能领域投资69.4亿美元。此外,韩国政府表示还将设立一个1.4万亿韩元(1 万亿美元)的基金,来帮助国内人工智能芯片制造商发展。可以看出,韩国在AI上下了大的赌注。 不仅是生成式AI领域,据韩国媒体BusinessKorea报道称,韩国政府正在积极推进新的研发项目,其中包括开发用于自动驾驶汽车的AI芯片,目标是超越美国半导体巨头英伟达。由研究机构、大学等代表组成的“第二次战略规划与投资委员会”批准了2025年62个新研发项目,包括超过 11 个领域的旗舰项目和路线图。韩国正在开发性能从数十到300 TOPS的自动驾驶芯片。 虽然韩国兴起了如此多的AI芯片初创公司,但前路仍然面临着不少的挑战: 首先,AI芯片研发需要大量的资金投入,这对于初创公司来说是一个很大的挑战。尽管这些AI芯片公司拿到了一些融资,但是芯片是个烧钱的行业,这点可以从目前业内几家著名的AI芯片公司窥得一斑。 其次,AI或者生成式AI芯片市场竞争激烈,产品研发出来到实际大规模商用还有很深的一条河。韩国AI芯片初创公司需要在技术、产品、成本等方面取得优势才能在竞争中脱颖而出。 最后,人才是重中之重,缺人是半导体行业的通病。目前韩国的这几家AI芯片初创公司无不在广揽人才。这些AI芯片初创公司的涌现,将有助于吸引韩国人才的回流。尽管韩国是存储芯片大国,但其实该国拥有相当数量的人工智能人才。根据斯坦福大学于4月15日发布的“2024年人工智能指数”报告,韩国以每10万人10.26项人工智能相关专利的数量领先于全球(图2),同时以0.79%的人工智能劳动力密度位居全球第三。尽管韩国在人工智能领域具有这些强大的竞争力指标,但该国正面临着人才外流日益加剧的挑战。据2023年数据显示,韩国每10万人中AI人才的净流出量为-0.30人(图3),意味着离开该地区的AI人才数量多于进入该地区的AI人才数量。 来源:2024 AI Index Report,stanford university 上图:2022年各国每10万居民人工智能专利授权情况。 (图表:2024年人工智能指数报告) 上图:2019-23年按地理区域划分的每万名LinkedIn会员的人工智能人才净迁移。 结语 韩国总统尹锡烈表示:“正如过去 30 年我们用存储芯片统治世界一样,未来30年我们将用 AI 芯片书写新的半导体神话。”韩国的野心能否实现不得而知,但是一个事实是,这些AI初创芯片公司的崛起,为韩国半导体产业这汪水注入了新的活力。
大模型正改变劳动力市场,以未曾设想的方式
2023年3月15日,在GPT-4震惊世界后,OpenAI的3月17日发表的论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》对大型语言模型潜在的劳动市场影响做了初步的探讨,给狂欢的人们蒙上了一层乌云。 论文发现,有80%的美国劳动力至少有10%的工作任务会受到大模型的影响。数据团在去年的文章《中国1639种职业的GPT替代风险分析》也按照这篇论文的做法对中国的劳动力市场进行了类似的研究,得到了相似的结论: ——越需要高教育、丰富经验才能从事好的职业,工资越高的职业,在大模型时代受到的影响会越大。 ——越是不需要人类经验积累,不需要后天学习,不需要动脑进行“慢思考”的职业,在大模型时代受到的影响反而越少。 又是一年多过去了,大模型和其相关的人工智能产品真的开始替代那些原本只有人类才能涉足的职业了吗?本文使用从2023年1月到2024年4月底的中国所有招聘平台的招聘数据,看劳动力市场的需求结构在这一年来发生了什么改变。 先说结论。确实有不小的影响,但似乎是朝着意料之外的方向。 ▍想象中大模型对劳动力市场的影响 为了衡量某一个职业的工作是否容易被大模型替代,首先要把每个职业给拆解为若干任务。比如“新闻记者”这个职业的具体工作可以被拆解出如下任务: 1,撰写评论、专栏或其他文章。 2,分析和解读从各种渠道获取的新闻资讯。 3,调查重大突发新闻事件。 4,调研新闻背景资料,确保信息的完整性和准确性。 5,…… 接下来,由大模型(也可以是人类)对每一项具体任务进行评估——比起之前没有大模型的时候,在大模型和相关人工智能产品的帮助下,以相同质量完成这项任务的所需时间,是否能缩短至少一半? 如果某项任务不能通过使用大模型缩短一半以上时间来完成同等质量的工作,那么这项任务便被打分为0,表示不会被暴露在大模型的影响下。 如果某项任务可以在通过使用大模型来缩短一半以上的工作时间,这项任务被打分为1,表示会暴露在大模型的影响下。 如果某项任务不能直接通过大模型节省工作时间,但可以被一些建立在大模型基础上的应用或者工具节省一半以上的工作时间,这项任务就被打分为0.5,表示暴露率为一半。 比如新闻记者的第一项任务“撰写评论、专栏或其他文章”和第二项任务“分析和解读从各种渠道获取的新闻资讯”被划分在“完全暴露”的类别中,打分为1,因为这两项任务可以完全被大模型加速。 第四项任务“调研新闻背景资料,确保信息的完整性和准确性”被划分在“一半暴露”的类别中,打分为0.5,因为现在确实已经有不少大模型和搜索引擎结合后,使得事实核查变得更加方便了。 “调查重大突发新闻事件”则被划分在“没有暴露”的类别中,打分为0。因为截止到目前为止,大模型的技术和相关人工智能应用还不能直接帮助新闻记者完成事件梳理和调查。 按常理看,越是暴露在大模型影响下的工作任务,就应该更少交给人类来做。因此一个新闻记者的招聘需求似乎应该会有下列的变化: ——撰写文章相关的任务,能够用大模型加速完成,完成给定任务所需时间减少,因此该任务在招聘广告中出现的频率应该降低,在该职业的岗位职责中出现的位次也应当变得靠后。 ——调查事件相关的任务,较难直接被大模型完成,任务完成时间不变。在其他任务完成时长缩短的前提下,这项任务的需求频率会提高,在岗位职责中出现的位次变得更加靠前。 在职业层面的变化也就不难推断: ——那些由大模型暴露率更高的任务组成的职业,给定任务只需要更少时间就能完成,因此只需要更少人手。在任务总量不变的前提下,不可避免地会出现用工需求减少的现象。也就是 “大模型替代劳动力”。 这个结论似乎显而易见。在近两年来,在研究人工智能对劳动力市场影响的文献中,类似的观点也屡见不鲜。许多人们已经开始担心,如果这些高收入且需要复杂知识的任务真的可以被大模型所替代,人类将如何自处? ▍实际上劳动力市场这样回应…… 但是,大模型替代劳动力,毕竟只是停留在学术论文和专家猜想中的 “应然”,它到底有没有变成“实然”呢? 在为未来忧心忡忡之前,先暂停一下,让我们来看看现实世界是如何回应的。 我们使用从2023年初到2024年4月底的五千万条招聘岗位数据,首次回答这样一个问题:被大模型判断为“暴露在大模型替代风险中”的任务,和这些任务组成的对应职业,真的被替代了吗? 首先,我们需要将每一个岗位的具体职能和任务进行评分,判断他们到底是不是暴露在大模型替代风险中。然而我们需要处理五千万条招聘岗位,以及从其中划分出的2.3亿条具体的岗位任务,这个数量级的数据,即使用大模型也难以处理。 好在O*net数据库和《中国职业大典》已经根据不同职业的工作划分出了2万余条具体的任务,使用sentence-bert句向量嵌入方法,我们将从招聘数据中抽取出的2.3亿条具体的岗位任务,匹配到2万余种标准岗位上,下表就是一个例子,我们将20条具体任务映射到了2种标准任务上。 对于每一条具体的任务,都能寻找到和他在句向量空间中最接近的一个标准岗位,2.3亿条岗位任务便降维成了2万条标准任务,也就能使用大模型方便地对它们进行打标和计算了。 使用之前文章中提到的打标方法,参考OpenAI的论文(https://arxiv.org/abs/2303.10130)给出的评分标准,我们为每一条标准任务都从不同维度进行了若干次打标计算,用其平均值作为这条标准任务所对应的各种具体岗位任务的大模型暴露程度。 比如上表中的“开展市场调研”的暴露评分为0.618,而“研发新产品”的暴露评分为0.628,两者均处于中间位置。所有任务的暴露评分都在0到1之间,也有不少任务的暴露率评分为1,比如"制定规范学生行为的规章制度";还有一些暴露评分为0,比如"对患者进行听力测试"。 接下来,计算每一种任务在2023年1季度和2024年2季度时在所有招聘岗位中的占多少比例,并计算两个时间段的比例差异。 按之前的分析,随着大模型越来越多地进入实际工作需求中,暴露率越高的任务,在总任务量中的占比应该会下降。但实际情况如下图所示: 上图中,我们将不同的任务按照暴露率(横轴)分为11类,可以看到大模型暴露率最低的那些工作任务,占比下降反而较快。比如“操作焊接设备”、“打磨金属表面”等任务的大模型暴露率非常低,但在所有岗位任务中占比下降较多。 在图表的右边,“编写操作流程文档”、“撰写运营报告”、“根据客户需求,撰写广告文案或宣传推广材料”等,虽然这些任务在大模型的观点中是属于高度暴露,最容易被替代的,他们却出现了不同程度的占比上升。 将任务组合成具体的职业,其结果也没有改变。见下图: 上图的每一个点代表一个职业,横轴代表该职业的大模型暴露率,纵轴代表该职业在总招聘中的占比从2023年1季度到2024年2季度的变化。两者之间存在统计上0.1%水平内显著的正相关关系。 在上图的最右上角,包括程序员、内容作者、web开发人员、数据库架构师等职业赫然在列,虽然这些职业的任务完成确实能够被大模型加速,但他们的需求仍旧上升了。 这种现象在我们控制了职业结构后也是如此。举个例子,“撰写运营报告”等任务,在所有岗位所有任务中的占比提高了,而这可能是因为产业结构的改变,例如制造业占比下降,服务业占比提升,也会导致这项任务的比例出现提升。但在运营经理、数据分析师等职业内部,“撰写运营报告”这一项高度暴露在大模型影响下的任务,其比例也在提高。比如前文提到的新闻记者也出现了类似的变化,虽然在大模型的帮助下,撰写新闻稿件变得更容易,更快了,但撰写新闻稿件的任务频率和排位并没有减少,而是在招聘数据中更加上升了。 即使在一个给定的职业内部,能够被大模型替代的任务,也出现了重要性和比例上的提升。 “实然”与“应然”完全相反,大模型暴露率越高的任务和职业,不仅没有被替代,反而需求提升了。 ▍新的需求,出现在哪里? 为什么大模型暴露率更高的职业,需求反而上升了呢?新的需求到底出现在哪里?在这里,我们给出三项特征事实。 事实1:中等规模的企业,暴露率高的职业需求提升更快。 将企业分为不同规模,对于每一种规模的企业,计算他们的大模型暴露率对职业和任务占比的影响。 可以看到,在所有规模的企业中,暴露率越高的职业,需求提升速度都越快,但是在中等规模的企业中,暴露率高的职业的需求提升速度,比其他企业更高。 事实2:暴露率越高的职业,工资下降越快,在中等规模的企业中下降更快。 从上图可以看到,从2023年1季度到2024年2季度,大模型暴露率越高的职业,工资下降更快,暴露率和工资变化两者之间同样显著程度达到0.1%的负相关性。 上图列出了不同规模企业中,大模型暴露率对这些企业内部的不同职业工资影响。可以看到,在小规模企业和大规模企业中,大模型暴露率和这些企业的不同职业工资并没有显著的关系。但在中等偏大的企业中,暴露率越高的职业,则出现了明显的工资下降,两者之间存在显著的负相关关系。 事实3:职业和任务的集中程度,在高暴露率的职业和中等规模的企业中下降最快。 在研究结构时,集中度是一项很重要的指标。例如HHI指数(赫芬达尔-赫希曼指数)就是其中一个例子。它的定义是每一类别的份额的平方和,也可以用来计算职业和任务的集中度。 某个公司有100个职位,其中工程师有40个,市场人员有30个,销售人员有30个。它的职业集中HHI指数的计算包括三个步骤: 1)工程师的份额为0.4,市场和销售的份额均为0.3。 2)工程师的份额平方是0.16(0.4的平方),市场和销售的份额平方各是0.09(0.3的平方)。 3)将所有职业份额的平方相加,得到HHI指数为0.16 + 0.09 + 0.09 = 0.34。 HHI指数的范围从0到1。值越大,表示公司的职业集中度越高,职业多样性越低。相反,HHI值越低,职业多样性越高。 上图显示了从2023年1季度到2024年2季度中,不同规模企业的职业集中度都有所降低,或者说,职业丰富程度都有所提高。其中,中等规模的企业的职业丰富度上升最为明显。 上图列出了不同暴露率的职业的具体任务种类的集中程度变化,可以看到,高暴露率的职业的任务集中度正在下降,而低暴露率的职业的任务集中度正在上升。 一个原本就不会受到大模型影响的岗位,其工作职责变得更加“专一”。而会受到大模型影响的岗位,其工作职责变得更加“复杂”。 以上三个特征事实结合起来说明了什么?我们用一个简单的例子,将它们串联起来。 某公司,中等规模,员工300有余。在2023年1季度时,该公司招聘了10个岗位,包括4名市场人员,3名销售人员,3名设计人员。 在2024年2季度,该公司招聘了13个岗位(中等规模企业的招聘增加了),包括3名市场人员,3名销售人员,4名设计师,2名程序员,1名内容作者(高暴露率的职位有了更高的需求)。 值得注意的还有两点。 第一,该公司新招的程序员和内容作者,工资要低于同等规模企业类似职业的平均工资(中等规模企业的高暴露率职位工资更低)。 第二,这个企业新招聘的程序员,内容作者以及增加招聘的一名设计师,相对于同等规模企业的类似岗位,工作职责会更“杂”。比如原本的程序员只需要编写代码,但在这家公司的程序员还需要和销售人员交流需求,还需要面对客户,他们的任务变得更多了(高暴露率岗位的岗位职责更复杂)。 ▍技术进步不只创造枷锁,更创造自由 上面的例子,可以最好地总结在大模型出现的时代,不同的企业到底发生了什么变化。但是,为什么会有这样的变化?为什么这些变化更多地出现在中等企业? 再描述一个作者本人的例子吧。 从三十年前刚刚接触互联网时起,作者就想有一个个人网站。但是做个人网站,需要好多知识和技术储备。要有域名,要有服务器,要会相关的编程。 这些东西,作者一概不会。 现学现做?好像没有那么多时间…… 但付钱找人来做?好像也不值得花那么多钱…… 于是,这个想法就搁置了三十年。 直到今年年初,Anthropic发布了Claude 3模型,作者突发奇想,利用Claude 3模型,轻而易举地创造好了自己的个人网站。从购买域名,架设服务器,到各种前端后端的编程,甚至还加入了创建用户、密码登录、费用计算的功能……这一切,只花了几个小时。之前搁置许久的计划,在大模型的帮助下,就这样完成了。 这同时也正是许多企业内部正在发生的变化。 从想法的产生,到想法的实现,这条长路,一直以来都很难走。需要找到每个环节的专业人才,进行复杂分工,投入大量时间和金钱……成本难以估量。 对于大企业来说,这些可能不算什么。他们有人员充足,现金流充沛,团队是现成的,分工是明确的,进可攻退可守,因此可以充分尊重新的想法,探索新的可能。 但对于中小企业来说,探索是一件风险很高的事情。他们的现金流有限,没有备份团队,市场不确定程度高,更没有那么多资源和后路。一次尝试,可能就关系到企业生死存亡。对他们来说,也许放弃创新,紧紧跟随,外部购买,才是最好的模式。 但是,大模型却降低了探寻和试错的成本,将实现想法的路径,大幅缩短了。 在大模型的帮助下,想要实现想法,形成产品雏形,不需要团队面面俱到,只需要对基本概念有所了解;不需要一开始就进行复杂分工,给每个人分配详细的任务,而是在大模型的沙盒内,不断对话、调用、评估,并且根据模型的反馈来调整路径,走向正确的方向。 在大模型的帮助下,创新和尝试不再专属于大企业。中小企业,实现想法也变得更容易了,他们在跟随之余,开始尝试,因此出现了新的劳动力需求。 ——这些新的需求从事那些暴露率更高的岗位,因为这样才能得到大模型更多的帮助。 ——这些需求需要完成更复杂的任务,因为每个人需要完成更多流程,去做更综合的工作。 ——这些需求的工资并没有同等规模企业类似岗位的工资那么高,因为这个需求原本在这个企业内部并不存在,使用大模型降低了成本,项目才顺利诞生。 ——此外,大模型在各类技术上的掌握熟练度日益提高,也确实使这类岗位的工资降低了。 从18世纪的工业革命开始,所有的技术进步浪潮,几乎都使得大规模生产和分工变得更加有利可图。个人手工被作坊替代,作坊被工厂冲垮,工厂又被能够在全世界攫取最便宜资源和最优惠价格的跨国企业打败。但在这个过程中,所有参与其中的人似乎也被套上了无形的枷锁,越来越局限于自己的职责,仿佛变成了流水线上一颗合格的螺丝钉,只是为了保障企业这台机器更加顺畅地运转。 而大模型,正是对于该逻辑的一次挑战。原本规模和分工在创新方面的优势被蚕食,取而代之的是,一旦出现想法便立刻开始行动的“个人英雄主义”。人们可以脱离巨型企业组织,变得更为原子化,并重新将目标放在整体目标和架构上,而非迷失在各种技术细节中。 人类不仅没有被替代,而是更被需要。大模型可以回答千千万万的问题,但要记住,提出第一个问题的,是人类。 当技术细节和分工可以被大模型接管时,人类的自主性更加提高了,而非降低了。 这,正是大模型对于劳动力市场,甚至对于生产关系来说,最为深刻的改变。
6499起的“灭霸”,能够成为今年拍照最强的手机吗?
终于,大家等了足足半年的 “ 超越 iPhone” 、 “ 重铸安卓荣光 ” 、 “ 影像无人能敌 ” 、 “ 灭霸旗舰 ” —— vivo X100 Ultra 终于发布了。 我们编辑部这帮老东西可以说是盼星星盼月亮,从一月份就开始等,然后等到二月三月四月。。。 谢谢 vivo ,没一路把票给跳到下半年去,总算让我们在五月份看上发布会了。 可能有些不太关注数码的差友们不知道啥发生了啥,托尼先给大家简单前情回顾一下: 在去年的 11 月 13 号,蓝厂发布了新一代影像旗舰 X100 系列,强大的影像配置和联发科天玑 9300 芯片,可以说是嘎嘎乱杀,各方面体验都很不错。 哪怕 X100 Pro 只是这个系列的大杯,但已经被无数博主拿去跟友商的 “Ultra” 序列做影像方面的对比了,而且丝毫不落下风。 就连我司远在美国的特派员阿卡,都海淘了一台 X100 Pro ,每天在群里直呼好用。 但是其中被称为 “ 灭霸 ” 的超大杯却没了踪影,超大杯的名头一直由 2022 年底发布的 X90 Pro+ 顶着。 以至于 2024 年的数码区出现了一个怪现象:当一帮测评博主做 “2024 年影像旗舰横评 ” 的时候,我们还会在测评里看到一款 2022 年的手机。。。 不过终于,在 X100 系列发布半年后,蓝厂再次召开发布会,发布了中期改款机型 X100s 和 X100s Pro ,以及万众瞩目的顶级影像旗舰 X100 Ultra 。 不过在发布手机之前,发布会先提到了手机内置的蓝心大模型升级,具体来说是更新了一个名叫 “vivo 看见 ” 的功能。 这个功能看起来有点儿像苹果和华为在去年发布的 “ 无障碍视觉识别 ” ,简单来说就是通过手机上的摄像头,实时汇报摄像头看到的内容 —— “ 有只黄色的狗趴在灰色的地摊上 ” 、 “ 你的面前正下方有一瓶水 ” 、 “ 人行道对面的灯是红色的 ” 。 至少我们测试华为的时候是这个效果,能够对视障朋友们的出行起到一定的帮助。不知道 vivo 这边作为国内第二家推出视觉辅助识别的厂商会是什么表现,我们也很期待。 此外,发布会还专门提到了会继续和蔡司推进合作,看来是在回应最近网上流传的 “ 有手机厂商可能要取消影像联名 ” , vivo 先自证清白退出讨论了。。。 有一说一, vivo 旗舰手机镜头上的那层蔡司 T* 镀膜对于炫光的抑制是真的管用,相机内置的蔡司镜头包也很适合拍人像,建议你俩不要取消联名,继续合作下去谢谢。。。 不过除了合作研发,蓝厂也官宣了自己的蓝图影像,相当于又要合作又要自研, buff 直接叠满了。 说完了蓝图大模型和蓝图影像,我们直接进入正题,也就是 “ 灭霸 ” X100 Ultra 。 这次 X100 Ultra 的配色十分收敛,除了经典的黑白二色之外,就是一个钛色了。 看样子今年确实流行钛金属,不过蓝厂这个只是颜色像还是真的用了钛金属就不清楚了,但看上去质感确实不错。 不过机身正面嘛,乍一看好像还是蓝厂祖传的曲面屏幕,我们仍未知道,蓝厂当年到底批发了几个仓库的曲面屏面板。。。 当然了,这些都是小事,接下来我们重点聊影像部分 —— 这次 iPhone 的地位怕是真的有点儿危险了。 先说硬件参数, X100 Ultra 超广角镜头采用 LYT-600 传感器,就是红米 Turbo 3 和 iQOO Z9 Turbo 上面的主摄传感器,放到灭霸这里只配用作超广角。。。 主摄则是已经亮过相的 LYT-900 一英寸传感器, 成像质量高而且功耗更低,蓝厂这次还给它叠了各种镀膜 buff ,比如 GLC 纳米涂层,还有大角度 OIS 防抖等等。 以及这次的重点,高达 2 亿像素的蔡司 APO 潜望长焦镜头,搭载 HP9 传感器,萤石级玻璃镜片 + 浮动镜组 + 超强防抖,光看参数就已经很离谱了。。。 还有各种行业领先和行业独家,托尼已经写不下了,感兴趣的自己看图吧。。。 就连前摄都是支持自动对焦的 5000 万像素镜头,灭霸这回真是武装到牙齿了。 对了,这次的影像自研芯片也升级到了 V3+ ,加上旗舰机统一分配的骁龙 8 Gen3 芯片,算法效率应该会比 X100 Pro 更上一层楼。 可惜的是,托尼非常喜欢的 X90 Pro+ 上面的 50mm 2 倍人像镜头,这次只能依靠裁切来实现了。。。 不过有失必有得,这次的灭霸不仅堆料很极致,软件层面也有不少连托尼都是第一次见的新功能。 怎么说呢,就感觉 vivo 这次是觉得,要想成为一台顶级影像旗舰,就要把各种小众垂直的功能都开发出来? 比如针对最近流行的拍演唱会神器,蓝厂就充分利用了这次的 2 亿像素潜望长焦镜头,专门整了一个长焦舞台模式。 这个模式能够把复杂的舞台环境拍摄清楚,同时还能拍得很远,山顶票变看台,看台票直接变内场。 到时候看演唱会租手机,感觉除了三星,蓝厂也是一个很好的选择。 另一个很离谱的模式则是潜水摄影,对,现在蓝厂连水下世界都不放过了。。。 这个很多人可能觉得太偏门了,但是公司潜过水的伙伴们表示,水下摄影无论是手机还是运动相机,拍出来的效果都不尽如人意,要么偏色严重,要么画质不好。 给你们看一下她前两天刚去潜水拍的画面:满屏绿了吧唧的怪东西。。。 所以 X100 Ultra 这次潜水模式的原理就是,提前通过算法,把水下因为光线波长变化导致的色差给抵消掉。 根据 vivo 这边的说法,潜水模式的效果比肩奥林巴斯这样的专业潜水相机。。。 不过光有色差抑制算法肯定是不够的,手机得能扛住那么深的水压才行—— 所以 vivo 又给 X100 Ultra 出了个定制潜水壳,与此同时 X100 Ultra 也支持不少第三方潜水壳。 你可能和我一样,觉得这个功能很离谱,但是公司那几个爱潜水的小伙伴们已经表示准备好剁手了。。。 另外,很多人应该都听过类似 “ 我就扫个码,用那么好的相机干啥 ” 之类的话。 但是,哥们儿,这手机最高支持 40 米超远扫码,就算扫码都比别人扫的好。。。 X100 Ultra 还做了一个专门的人文街拍界面,用起来有一种拿着相机扫街的感觉,更有仪式感。 除了自定义参数更方便,还有类似相机的 C1 C2 记忆模式,人文街拍还多了一个黑白滤镜,逼格直接拉满。 该说不说,在这个计算摄影满天飞的年代,蓝厂敢于拥抱过去,专门研发了黑白色彩,托尼还是挺佩服的。 蓝厂还专门和 FilMov 整了一个摄影套装,单手也可以使用,确实是有相机内味儿了。 然后最近 AI 不是特别火吗,蓝厂也整了一个四季人像,简单来讲就是通过 AI 可以把照片的季节变成四个季节的风格,在杭州也能随时随地拍雪景了( 并不 )。 上面这些还只是拍照的部分功能,托尼觉得最有 “ 灭霸 ” 含金量的,其实是视频方面的提升。 因为众所周知,安卓阵营拍照比 iPhone 好是板上钉钉的事情,但是拍视频这方面, iPhone 依旧是毫无争议的第一。 而发布会上表示, X100 Ultra 这次视频拍摄无论动态范围、清晰度还是防抖水平,比 X100 Pro 还要再好上一截,动态范围甚至能超越 iPhone 。。。 敢把这话说出来,说明蓝厂真的对这次的视频能力很自信。 这次 X100 Ultra 还做到了全焦段 4K 60 帧杜比视界视频录制,或者最高支持 4K 120 帧、 8K 30 帧视频,规格上还是很顶的。 对了,灭霸这次除了支持 SuperRAW 照片格式之外,还多了一个 3D 摄影功能,照片视频都支持。。。 谁能想到,仅仅过了大半年的时间,国产厂商就整出了类似 iPhone 上面空间视频的功能。。。 X100 Ultra 的屏幕还可以还原显示 Apple Pro Display XDR 显示屏相同的色彩效果,还打通了 Mac 上面的办公套件,真就成为苹果用户最好的相机了。 当然,上面说了一大堆和影像有关的东西, X100 Ultra 在其它配置方面也不含糊,比如 5500mAh 的电池、寰宇信号放大系统、双向卫星通信、 IP68 + IP69 、超声波指纹识别和立体双扬声器等等。 除了 80W 充电和 30W 无线充电有点一般之外,其余的配置都已经满得不能再满了。 当然,如此离谱的影像性能和配置,价格也确实不便宜, 6499 元起售。 作为参考,小米 14 Ultra 和 OPPO Find X7 Ultra 的起售价分别是 6499 元和 5999 元,基本上都属于国产旗舰天花板了。 不过虽然配置很顶, vivo 也有一个很现实的问题需要面对:上面两款影像旗舰都已经发布了小半年,开始进入降价阶段了。 所以表面上大家的定价接近,实际上现阶段灭霸的价格要对比另外两款产品要高 1000 元左右。 不过当然了, vivo 这次在功能上卷的真的是太丰富了,假如小伙伴们真就对某些功能 —— 比如演唱会、或者潜水有需求,那也确实是只能考虑它。 好了, X100 Ultra 我们就介绍到这里,接下来咱们再来讲讲很多人期待的 “ 半代升级 ” X100s ,其实它的变化跟 X100 相比也不算小。 其中最大的改变,那就是 X100s 变成了一款不折不扣的直屏影像旗舰,和曲面屏说再见了。 托尼觉得蓝厂多少是听见了网友们的呼声,因为网上有很多人特别喜欢蓝厂的影像性能,但是又不喜欢曲面屏,所以一直在蓝厂耳边念叨着我要直屏我要直屏。。。 结果 X100s 还真就变成直屏了。。。 好好好,蓝厂你就宠我们这帮人吧。 X100s 的外观干净利落,潮流小立边加上圆形的镜头模组,几乎没什么多余的设计,厚度和重量控制得也很不错。 除了外观,它的芯片也小幅升级,从联发科天玑 9300 变成了 9300+ 。 天玑 9300 的表现就相当出色,无论是功耗还是性能都堪称顶级,不出意外的话,这次大家也可以放心使用。 X100 Ultra 的演唱会算法、人文街拍和蓝图算法等等, X100s 也都能吃上。 价格方面,由于 X100s 依然是中杯旗舰,所以起售价没有变化,依旧是 3999 元起步。 想买直屏影像旗舰的人,这回确实可以下手了。 X100s Pro 的变化就不大了,主要是新配色和升级了天玑 9300+ 芯片,起售价依旧是 4999 元起。 之前发布的 WATCH3 手表也出了个 ECG 心电图版本,售价 1699 元。 这波发布会看下来,其实能发现灭霸多少还是做出了一些取舍的,比如隔壁的小米和 OPPO 都是四摄镜头,包括蓝厂上一代超大杯 X90 Pro+ 也是 4 颗镜头,这次却变成了 3 摄。 包括屏幕边框和充电功率等等,你要说鸡蛋里挑骨头的话,确实多少都有一点可惜。 当然, X100 Ultra 的整体配置到底顶不顶,那肯定是顶的,发布会几乎就是在拿它当相机介绍。 但是再顶的配置,也得看实际用起来怎么样,拍出来的照片和视频质量怎么样才行。 所以,要是差友们好奇的话,可以等一手我们在 B 站 @差评硬件部的测评,到时候大伙再给灭霸做出评价,也不算迟。 哦,当我写完这篇稿子的时候,我看了一眼微信,一个用了一年 X90 Pro+ 的朋友跟我说已经下单灭霸了。 另外,他还买了哈苏 X2D 。。。 原来,这就是 X100 Ultra 的用户群体吗。。。
跟 OpenAI 争夺iPhone 合作权的 Google,后天要发布什么才能「弯道超车」
没有谁比 Google 更想「弯道超车」。 作为 Google 每年的重头戏,I/O 大会是 Google 展示其最新技术和产品的舞台。在近 8 年中,AI 相关内容一直是 Google I/O 大会的重点话题,但到头来一鸣惊人的确是后来者 OpenAI。 此后 Google 就被贴上「起了个大早,赶了个晚集」、「恨铁不成钢」、「万年老二」等众多标签。 其中最值得细品的就是「AI 黄埔军校」这一称谓,看似褒奖,实则确是 Google 的「一把辛酸泪」。 如今 OpenAI 故意将发布会放在 Google I/O 前一天,不仅「抢热度」的意思很明显,还把目光投向了本来已经格局稳定的搜索业务,颇有点想要一举「直捣黄龙」的意味。 眼看一场好戏就要开场,消费者和业界普遍期待谷歌能够拿出一些真正令人惊艳的「真东西」,Google 也希望借此机会打一场漂亮的「翻身仗」。因此,今年的 Google I/O 大会可谓备受瞩目。 Gemini 加速融入服务,还有新功能亮相 Gemini 项目自曝光以来,一直备受关注。起初也曾存在一定争议,但后来也凭借自身实力挽回了口碑,而今也越来越成熟,但仍然逃不开被拿来与 ChatGPT 相比,双方也在暗中较劲。 Gemini 1.5 发布后仅几个小时,OpenAI 就祭出了轰动一时的文生视频模型 Sora;不久前,曾有消息称苹果将在 iPhone 中集成 Gemini AI,但近期事件又发生反转,最终苹果大概率会选择 ChatGPT,竞争势头可谓愈演愈烈。 如今 Google 与 OpenAI 再次「撞」到一起,显然 Google 希望发挥自己服务众多的优势,将 Gemini 加速融入更多服务中。尤其将与搜索、翻译、Google 地图及 Android 等多项服务进行深度整合,提升服务的准确性和效率,还可能会加入包括图像、语音在内的更多交互方式。 在手机等移动设备上,我们也将越来越多地见到 Gemini 的身影。备受期待的多模态助手新版本「Pixie」也将亮相 Google I/O 2024,据称它将能够通过拍摄物体照片来学习使用或获取购买方向,让数字助手变得更加直观和个性化。 不过,想要真正成为一家「AI first」的公司,谷歌需要发布既具有变革性又具有广泛可用性的功能,尤其对于免费用户而言。 从目前的信息来看,Google 很有可能会在 I/O 大会上重点展示更多此前未被公开的新功能,例如针对英语学习者的人工智能对话练习、用于购物和虚拟试穿的图像生成、在地图上寻找充电桩、AI 持续通话等。 此外,Google 可能会公布 Gemini 的 API,这意味着开发者们将能够利用 Gemini 的强大 AI 能力,为各类应用和服务注入智能元素,提供更多可能性。 Android 15 细节曝光,系统体验再升级 每年的 Google I/O 大会中,Android 的更新都会成为一个重点,毕竟 Android 作为全球最大的移动操作系统,其每一次的升级都会影响到亿万用户的使用体验。在今年的 I/O 大会上,Android 15 的更多细节将会被揭晓。 据悉,新系统将在操作界面、安全隐私保护、功耗优化等方面做出诸多改进。此外,自动隐藏未使用的通知渠道、优化音量、亮度、振动控制等功能的加入,将进一步提升用户的使用体验。 事实上,设备端 AI 对于帮助减低云成本非常重要,对于使 Android 成为构建新一代 AI 移动应用程序平台也很重要,因而我们很可能会在 Google I/O 大会上看到一个深度集成 AI 的 Android 15。 但目前很多时候,除了壁纸以外,我们还没有太多见到 AI 真正应用于用户体验,Google I/O 会为我们展示更多内容。为我们展示更多的可能性,例如更智能的主屏幕、锁屏或通知栏等。 卫星通讯和离线定位 自从华为、苹果等手机陆续支持卫星通讯,安卓用户就翘首以盼。好消息是在 Android 15,这一功能可能会成为标配,并且不仅限于基本短信服务,还扩展到了短信应用和预装的 RCS 服务,此前在开发者预览版中已经出现,很有可能会在 Android 15 中正式与用户见面。 还有消息显示,Google 正在研发「离线定位」的相关功能,即关机也能定位手机。不过由于这一功能需要依靠硬件支持,所以后续升级后可能才会陆续出现。 电池健康管理 电池用久了总会有损耗,而电池健康检测这一功能就可以让我们直观地看到电池还有多少「余力」,了解什么时候应该考虑换个电池。其实早在 Android 14 的测试版本中,这一功能就曾经出现过,但由于并不完善而并没有投入使用,而 Android 15 有望让这一功能走进用户手机。 应用归档 在 iPhone 中,为节省存储空间,系统常常会帮你卸载不常用的应用腾出空间,同时保留个人资料。此前 Google Play 虽然也提供过这一功能,但却无法卸载商店以外的软件,而 Android 15 可能会为我们带来系统级的应用归档,让用户直接从应用信息栏归档任何已经安装的软件。 隐私安全 作为所有科技巨头的重中之重,每逢发布会必然会谈到「隐私和安全」。Android 15 也不例外,不仅将为我们带来一个专属的「私人空间」,用以存储应用和数据;还可能会实现「部分屏幕共享」,即只分享或录制单个应用,避免透露更多内容;以及旨在避免一次性密码被偷窥的「敏感通知」功能。 AR/VR 回归,还有更多 Android XR 细节 虽然今年相关话题热度难与 AI 相比,但 XR 同样很有可能会在今年为包括教育、娱乐、零售、医疗等各个领域带来巨大改变。Google 可能将在 I/O 大会上为我们带来更加清晰的 XR 发展战略,进一步整合服务和平台,提供更丰富的用户体验。 去年初三星正式宣布正在开发 XR 头显,Google 则通过 Android 的变体提供处理系统软件 Android XR,显然 Google 想要采取类似安卓的方式,通过专注 XR 平台开发,为相关厂商提供 OEM 合作,以此在 XR 空间计算领域占据一席之地。 不过,在去年的 I/O 大会,Google 就曾表示将会在晚些时候分享更多有关 Android XR 的信息,但最终却不了了之。外界猜测可能与三星推迟并重新设计头显设备有关,而这也影响到了 Google。 还有消息显示,之前 Google 曾试图跟 Meta 合作让他使用自己的系统,但遭到了 Meta 的拒绝,显然 Google 想要在 XR 领域复刻安卓的成功,恐怕并不容易。 Pixel 新品会前提前亮相,未来趋势才是重点 在 Google I/O 2024 中,硬件可能不会成为重点,最可能在大会上发布的 Pixel 8a 甚至提前直接开启了线上预售,出乎很多人预料。 目前来看,这款手机最大的优势在于 500 美元的售价却能享受到诸多旗舰机的特性,堪称性价比之选。皮查伊一直认为手机将会是 AI 出现创新突破的重要载体,所以 Pixel 8a 可能会成为 Google 将 AI 向低价位机型渗透的新标杆。 虽然 Pixel Fold 在去年 I/O 上备受瞩目,但第二代 Pixel Fold 是否会出现在今年 Google I/O 大会,目前还没有太多信息。 还有消息称,Google 折叠屏手机品牌将会面临重塑,名称改为 Pixel 9 Pro Fold,以便与 Pixel 系列完成更好统一,而这也意味着它很有可能会与 Pixel 9 一同或在之后发布,无缘 Google I/O 2024。 虽然 Pixel 系列不会成为 Google I/O 的主角,但从目前的信息来看,我们可能会在 Google I/O 2024 大会上看到一些概念型产品的更新,例如翻译眼镜、裸眼 3D 全息视频聊天等技术。 除了这些最新发布的产品、服务以外,今年的 Google I/O 大会还将迎来一系列演讲。此前皮查伊在接受采访时曾表示,Google I/O 大会并不注重具体的产品,而是展示未来规划与目前进展。 或许相比具体产品而言,这些演讲会为我们带来更多前沿的技术趋势,描绘出 Google 以及 AI 的未来发展蓝图。
19.99万的智己L6很香,但它很难成为下一个小米SU7
坏了兄弟们,雷军没搞出来的 1999 ,今天晚上被智己搞出来了。。。 今天,在一个多月以前公布了预售价( 23-33 万 ),还在发布会上引来了一波巨大负面舆论的的智己 L6 ,今天晚上终于正式上市了。 算上 2 万块的上市权益以后,身材几乎和小米 SU7 完全一样的智己 L6 ,起售价来到了 19.99 万,非固态电池的顶配版本,价格也只有 28.59 万。 仿佛。。。刻意卡着比小米低一点似的。 所以就算今天的发布会争议最大的刘涛只在宣布价格的时候出来露了个面,就算一个多小时的发布会全程一个米字都没有提,但很明显,这台车就是朝着现在最火的小米 SU7 去的。 但要说它能不能跟锁单已经奔着十万去的 SU7 掰一掰手腕,我觉得不太好说。 别急着喷我啊,且听我慢慢道来。 这次发布会的全程,其实和上次的预售发布会并没有太大的区别,很笼统的把 L6 的所有配置细节讲了一遍,里头呢也大都是已有的信息,甚至很多 PPT 和视频演示用的都是同一套。 那我也就快速的带大家过一下这台车,顺便也把它和 SU7 对比对比。 先说外观, L6 的设计继承了 LS6 上这套全是曲线,但看着还有些小帅的风格。侧面的比例和 SU7 一样是标准的四门 COUPE 设计,不过仔细看来好像也没有啥借鉴其他车型的痕迹。 和 SU7 比谁更帅,兄弟们心里应该有数了。 再来看车里, L6 的内饰几乎套用了 LS6 的设计风格,依旧是智己祖传的三块屏幕,以及我个人极其讨厌的半幅方向盘。论新鲜感,相比外观就会明显少上一些。 不过和 SU7 相比,我觉得 L6 在内外饰风格的统一上做得会更好一些,统统都是大量的曲线。SU7 嘛则是外面曲线多,车里就变成了直线为主。 如果是内心比较温柔的兄弟或者姐妹,感觉会更适合智己。 颜色就不多说了,外观七种,包括一个和艺术学院合作研发的蓝色;内饰两种一深一浅,具体的大伙就看图吧。 颜值的部分结束,咱们再来看看续航和性能的部分。 这次智己 L6 很抽象的分了三种电压版本,并且对应了五个车型。上次见到这么复杂的 SKU 还是小鹏 G9 刚上市的时候。 我来帮大伙尽可能清楚的过一遍。。。 最低配的标准版车型用的是 400V 低压架构, 75 度的磷酸铁锂电池,吹拉弹唱的续航能有 650 公里。 高一档的长续航版就用上了 800V 的高压架构,电池也升级到了 83 度,续航 710 公里。 再往上的超长续航版和高性能版就又变了,变成了准 900V 架构( 我估计就是八百大几十吧 )以及 100 度的电池,续航 850 公里。 此前争议最大的光年版本,也就是用上了清陶固态电池的车型也是准 900V 的架构, 133 度的电池,续航据称能够干到 1000 公里以上。 整体的续航水平我觉得中规中矩,关于这个固态电池是不是真的固态,我们也在小破站上发了一期长视频,欢迎大家搜索咱们的汽车账号差评汽车部观看,这里我就不多说了。 然后根据每个版本的不同,智己 L6 的电机功率也是完全不一样的。 从最低配到最高配的数据分别是:后驱 216kW 、后驱 248kW 、后驱 300kW 、四驱 579kW 。 如果兄弟们觉得这些数据有点难记也没关系,总结一句话: 和三个版本的小米 SU7 比起来,论动力, L6 只有最低配比 SU7 低配要低;论续航,两台车是各有胜负但是差距都不大。 可以说, L6 算是和 SU7 对标成功了。 而除了三电, L6 身上还有一些小米 SU7 暂时还没有的功能。 比如全系标配的后轮转向,可以让车子的转弯半径更小,还能实现蟹行模式和韩寒出库这种略显抽象的功能。 大伙自行脑补前轮挠出来,后轮不动的画面 还有全系标配的激光雷达和免费试用两年的,支持城区 NOA 的 IMAD 智能驾驶、除了入门车型以外,只需要 3999 就能选装的电磁减震和空气悬架,以及全系标配的,这个能显示可爱小狗的交互尾灯。 这些配置吧,虽说不是每个都能说得上实用——比如说很多交互界面的设计我就觉得没有必要,真的有人会在下班的时候看车机上推荐的餐厅然后拐过去吃吗! 但只要把它们全都加起来,再加上限时优惠两万、全系都比小米 SU7 低上一截的价格,乍一看,卧槽好像没啥选米车的理由了对吧。 但这里我就要回到我一开头的观点,智己 L6 未必只靠性价比就能和米车掰手腕。 原因也很简单,那就是由于这两家企业的宣发模式区别巨大,即使是差别不大的两个产品,也有可能因此给人们留下完全不同的印象。 还是拿发布会做例子吧,今天的智己 L6 发布会上,它们几乎给这台车上的每一个功能都取了一个看起来非常炸裂的名字。 什么灵蜥底盘、飓风电机、云台制动啦,什么 City drive / Carlog 啦,什么光年电池、潜艇车身啦。。。 乍一看好像都是很新奇的,从来没有听过的名字,但回味过来以后又发现,好像又说不出这些功能到底新在哪, L6 这台车上,到底有啥别的车上没有的新玩意。。。 简单来说就是,一场发布会下来除了价格,好像别的啥也没记住(几个配置的价格也有点难记就是了... )。 反观 SU7 的两场发布会,雷总从始至终就是简单明了的跟大家科普技术,说车上的每个部分为啥重要, SU7 是怎么做到行业领先的。 就,很好记啊。。。 很多不是很懂车,但就是被颜值吸引想要剁手的车主们,肯定会更喜欢能看懂的那个吧。 而脖子哥正好有这么一个同事,之前就是在智己公关部门,也就是在智己的 CEO 刘涛手下任职的。那时候开始,刘涛给他的印象,其实就是一副 “ 语不惊人誓不休 ” 的做派。 别家有的功能,一定要用不一样的名称打出去,再标一个行业首创的字样。别家没有的功能,就更要大吹特吹,和智己牢牢绑在一起。 这种求新的做法,其实本身没啥毛病。 毕竟上汽作为非常 old school 的车企,一直以来在营销上用的都是比较保守的思路,在智己这个主打年轻人的品牌,用上容易出圈的营销新路子确实是必要的。 可如果只是为新而新,只能感动自己的话,最后或许就只能起到反作用了。 一个月以前的 L6 预售发布会,给智己带来了一波巨大的负面舆情。原因之一,是在和小米 SU7 对比的环节,他们的 PPT 把米车前电机的用料配置标错了,搞的小米直接发函要求智己道歉。 二是智己 BOSS 的刘涛在发布会结尾的升华部分,把员工加班搞项目错过孩子出生的事拿出来说了说。结果被广大网友们指出他在歌颂苦难,惹得很多不是汽车区的大 V 都抨击了一波。 这些说实话,就也全都是智己营销思路的副产品。 所以要我说,上汽能利用自己这么多年的积淀,搞出 LS6 、 L6 这种放眼整个市场都非常能打的车型,真的已经是国内传统车企们在产品路线上的楷模了。 有没有可能即使不这么用力的过度营销,它也有在市场上卖爆的潜质呢? 今天的发布会上,刘涛也是吸取了之前的经验,没有多余的感情戏,没有夸张的竞品对比。 上来就是咔咔讲价格,咔咔说配置,然后干净利落的结束。 本来这样就挺好的是吧,结果到了下单的页面智己就又开始抽象了。那个 19.99 万的裸配根本没法单独下单,必须捆绑 3999 的现实优惠。 都 2024 年了还搞强制选装这套,我是真么想到。。。 啥时候能改改啊智己。。。 撰文:致命空枪 编辑:面线 封面:焕妍

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。