EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
编段子搞擦边营销,网易有道是玩不明白了
网易在网络上有个别名,叫“黄易”。个中起源就不必赘述了。前两天,在群里看到一张PDF截图,标题是《实名举报网易渣女无底线玩弄感情》,直指网易旗下有道事业部的员工“王爱可”。 编段子,搞擦边营销 根据文件内容,“王爱可”完全符合时下狗血影视剧里的渣女人设:多次玩弄感情,丧失道德。和多人关系暧昧,男女老少通吃,且和多人有金钱交易,甚至明码标价自己的时间。爆料人还详细列出了她和直系领导、实习生以及客户等人的复杂关系,并附有多张微信聊天页面的截图,让看客浮想联翩,直呼真“黄易”。 看完前半部分,还直接惊叹,现在互联网吃瓜也太卷了。不仅是文件撰写的专业规整,而且爆料也充满故事性。但翻到最后,也是事件高潮部分时,“举报文件”文风突变,情绪由前文的怒斥、恨得牙痒痒转为夸赞王爱可,称其也拿过很多奖项。再在最后来了个大反转,揭示王爱可不是真人,而是网易有道推出的产品虚拟人“Hi Echo”。 不得不承认,整篇内容和过去网上流传的“吃瓜素材”十分相似,大厂八卦、网络热点、聊天截图等关键流量要素一应俱全,特别是不正当男女关系、家庭情感纠纷、职场潜规则等等细节,吸引众多“吃瓜群众”的眼球。 这本质上还是营销领域常用的故事化软文营销手法:一切情节都是虚构的,进行情绪化铺垫后,软植入产品信息,打起广告。其根本目的只是为了让受众记住“王爱可”这个名字。 好故事具有穿透力,但烂故事就会引发舆论危机,拉低品牌好感度。网易有道的这番操作,就是典型的讲烂故事,搞擦边营销。虽然套路娴熟,但以违背公序良俗的方式来硬蹭硬上,“连蒙带骗”,只能带来抹黑的负面效应。这很难不让人怀疑,网易有道早就算计好利弊得失,黑红也是红,才有计划的推动这波炒作。 对此,网易有道回应称,这份PDF文件是由两位脑洞比较大的同事创作,没有计划去营销推广,只在内部小群发送过,但是发出后便失去了控制,传播出去了。现已删除物料,内部进行反思和整顿,但不会把“锅”扣在两位同事的脑袋上,仍然鼓励创新,但会加强审核机制,由法务、公关等做好把关工作,避免类似事件再次发生。 真“黄色新闻”,有毒! 网易有道的说法听着就像掩耳盗铃。虽然说这个内容没有正式发布,只是“不受控”的传播开了,但事实上已经产生了不太好的社会影响。这与网红“Thurman猫一杯”编造的“秦朗丢作业”事件没有本质区别,都可以归为胡锡进曾提及的“黄色新闻”。 所谓的“黄色新闻”,是指一种具有煽动性的、格调不高的新闻类型,通常不具备较大的社会价值,纯粹是对大众趣味的无底线迎合。如今,在短视频平台上,一些内容肤浅却有煽动性、博人眼球的“新闻”,则被称为“新黄色新闻”。 而中国人民大学新闻学讲师董晨宇称之为“狗屁新闻”,它们的特点是用放大镜人为制造的,没有公共价值却占据公共注意力的内容。 这类内容的产生离不开一个大背景,即算法逻辑下,信息的穿透力极强,但又同时编织出强硬的信息茧房。在这个过程,新闻的碎片化、娱乐化特点越来越强。人人都是发声筒,这作用在营销上,就形成“万般皆下品,唯有流量高”的乱象,也就是所谓的“黑红也是红”。 因为有关注就有利益。不少媒体、企业或者机构才不惜俯身畸形的追逐流量,这也直接推动了“新黄色新闻”的泛滥。让“不明真相”的观众陷入真假信息难辨、真假新闻难分的尴尬境地,“新黄色新闻”的毒性也在被流量裹挟中加剧。 央视在点评类似事件时表示:博流量不能无底线,不能挑战公序良俗。网易有道的这次“举报文件策划”不过是其中最新的一例。有网友吐槽称,“不管是贵司哪个经理想出来的营销方式,但你给你的公司、你的团队,还有这个所谓Hi Echo带来的只有抹黑。” 极目新闻更是入木三分的批评,用“渣女”做标题,以暧昧关系,金钱交易“博眼球”,的确是会钓到一些关注度,但是这种追着腥味来的关注度,能转化为对产品的认可吗?虚构这样一个形象来污名化同公司的女性,难道不会让女同事们觉得膈应吗?公司主推的智能私教,被描述成一个对感情不负责,靠不正当关系谋取私利的人,对这一产品的美誉度有什么好处?如此宣传虚拟人私教,是教人学口语还是蹭热度?玩创意玩成这样,真的是“有毒”啊! 不只是简单的乌龙闹剧 这场乌龙闹剧并没有因为原文件删除而终止。实际上,网易类似的案例不少。比如2023年10月,国家网信办通报,“网易CC”直播平台多个账号主播在直播过程中存在言行低俗、打色情擦边球等问题,被暂停“舞蹈”版块信息更新7日。人民网发表评论称,不要“走捷径”去以身试法。 梳理网易有道的发展史可以发现,其起点是搜索,这是技术含量极高的创业项目。其董事和高管也多是计算机技术背景,具有浓厚的工程师文化。换句话说,技术是网易有道的核心优势。只是后来随着业务发展,为了生存才推出词典业务、在线教育业务等。其中,有道词典的成功,也离不开搜索业务上的技术沉淀。 图:网易有道CEO周枫 网易有道CEO周枫曾多次强调,网易有道是以技术为出发点的公司。但如今,网易有道所在的各个赛道,特别是大模型代表的新技术方向,都是强者林立,内卷到极致。比如,以科大讯飞、网易有道、百度、阿里为代表的互联网公司,和以读书郎、作业帮、学而思为代表的在线教育相关公司,均在加速推动学习硬件和大模型的场景融合。 “举报文件”中提到的王爱可,其官方姓名是“网易有道Hi Echo”,网易有道称其是全球首个虚拟人口语私教,也是国内最早实现大模型能力真正落地的教育类应用。其背后是网易有道推出的教育大模型“子曰”,Hi Echo是其中的一个落地产品。目前,Hi Echo 已经迭代到2.0版本。 但有评论指出,网易有道身为一家教育公司,“王爱可”作为一款教育产品,本身的特殊性决定了其需要格外爱惜羽毛。如此低级营销,不仅很难精准吸引到目标用户,还必然会有损品牌自身形象。 而这番“骚操作”更深层次的原因在于网易有道面临流量焦虑时的进退失据。2024年2月29日,网易有道公布了大模型获批3个月后的第一份业绩答卷。数据显示,2023年全年,网易有道实现净收入53.9亿元,同比增长7.5%,虽然增长幅度较大,但与同行10%以上的增速相比略显逊色,而且毛利润呈现环比和同比双下降的局面。 官方解释,有道毛利润环比下降,主要由于学习服务的收入贡献下降。其同比略降,主要由于智能硬件的收入贡献下降,并被在线营销服务的收入贡献增加所部分抵消。 按照2023年第四季度及全年财报,网易的营收结构分为四个板块:游戏、有道、云音乐和创新及其他业务。也就是说,网易有道承载着网易游戏之外第二增长赛道的探索。甚至可以说,它寄托了网易特别是丁磊在下一个10年乃至更长时段的一种想象。 但就目前来看,网易有道的造血能力羸弱,经营压力巨大。周枫显然是着了“互联网流量思维”的道,在无法靠技术优势去赢得市场竞争时,就只能在渠道、营销上“曲线救国”,试图以剑走偏锋的方式出圈。 但有一句话是说:路线玩不明白,方向跑错了,越努力越尴尬。丁磊也应该给周枫敲敲小黑板了。
嗅觉数字化!AI还原记忆中的味道
【新智元导读】人类嗅觉的数字化来了!近日,有业内大佬创立的公司宣布实现了气味的远程传送,并开始朝商业化方向努力。 人类嗅觉的数字化,它来了! 当今的计算机算法,尤其是AI技术,几乎已经把人类的视觉和听觉完全虚拟化了。 文字和语音的相互转换、文生图和视频的效果已经出神入化、难辨真假。 但同为人类最古老的感官之一,嗅觉却似乎没有相应的进展。 ——别急,在这么卷的时代,科研人员不会遗漏任何东西。下面将要出场的Osmo,已经开始应用相关的研究,并朝着商业化方向努力。 Osmo推出的气味传送技术,可以在世界的任何地方捕捉气味,并在另一个地方释放出来。 作为一种新的沟通方式,有朝一日,这将赋予数字世界新的感知,——在新的时代,计算机将能够产生气味,就像我们今天生成图像和声音一样。 传送气味 这项技术能给我们带来什么?想象一下: 你可以在世界任何地方,闻到生长在你家附近的百合花; 参观完西斯廷教堂,将亲人送回家,还能闻到教堂里旧油漆和石膏的气味; 看一部关于大海和水手的电影时,可以在剧院闻到海水的咸味。 ——这些听起来像是遥远的东西,但已经在Osmo的实验室中成为技术现实。 对此,有网友表示,“这正是我梦寐以求的”。 甚至有网友也在进行类似的工作:通过传感器捕捉气味数据、向量化后用于RAG,希望能够增强LLM的感知。 当然也有较为煞风景的网友:既然什么气味都能传,那我放个屁岂不是...... 如何实现? 我们今天所知道的数字世界,大部分都是教计算机如何看和听的结果。 而传送气味的原理也类似,——使用环保分子记录、分析和再现气味,这项技术被命名为Scent Teleportation。 Scent Teleportation首先利用传感器采集薰衣草田的气味,然后处理器识别所有正在工作的分子,最后使用特殊的打印机找到正确的气味组合来重现它。 ——之后,你就可以在纽约的一个实验室,闻到来自加利福尼亚的花香。 Scent Teleportation使用一种称为气相色谱质谱仪(GC/MS)的分子传感器,识别气味中工作的分子,并使用AI模型和气味图谱生成可用于传送的配方。最后,使用一个冰箱大小的打印机来还原气味。 以上的技术流程,以多篇谷歌Brain等机构的研究为基础,比如下面这篇: 论文地址:https://doi.org/10.1101/2022.09.01.504602 而Osmo的创始人兼首席执行官Alex Wiltschko,就是这些搞科研的大佬之一。 Alex Wiltschko毕业于哈佛大学,获得了神经科学博士学位,导师为Sandeep R Datta教授。 Alex Wiltschko的研究方向为嗅觉神经科学,并开发了下一代高通量行为表型技术,该技术已在数十家顶级实验室和制药公司中使用。 2017年,Alex加入Google Research,从事机器学习和生物学的交叉领域工作。 2022年,他创立了Osmo,同时,作为GV的常驻企业家,他还加入了生命科学团队,专注于推进数字嗅觉领域。 Alex Wiltschko曾多次创业,他职业生涯的大部分时间都在探索人工智能的新领域。 在加入谷歌之前,Alex与他人共同创立了Syllable Life Sciences(后被Neumora收购),该公司使用人工智能和计算机视觉来破译肢体语言,以加速临床前开发并构建更好的疾病治疗方法。 Alex还是Whetlab(被Twitter收购)的联合创始人,早期还自己负责coding。 作为业内的大佬,Alex Wiltschko也发表了许多具有影响力的文章。 感官地图 如何测量气味?气味是由在空气中飘荡、进入我们的鼻子并与感觉受体结合的分子产生的。潜在的数十亿个分子可以产生气味,因此很难确定哪些分子会产生哪些气味。 感官地图(Sensory map)可以帮助我们解决这个问题。 不过嗅觉是一个更难破解的问题:分子的变化方式比光子多得多;数据收集需要物理上接近(没有类似的摄像头);相比之下,人眼只有三个颜色感觉感受器,而人的鼻子超过有300个气味感受器。 2019年,Alex Wiltschko参与的谷歌团队开发了一个图神经网络(GNN)模型,用于探索数千个不同分子的例子,每个例子与它们唤起的气味标签配对,例如“牛肉”、“花香”或“薄荷”,以了解分子结构之间的关系,以及此类分子具有每个气味标签的概率。 模型的嵌入空间包含每个分子的表示,作为固定长度的向量,根据气味描述分子,就像根据RGB值描述颜色一样。 传送气味是第一步,Osmo的下一个目标是传送各种气味的组合,比如苹果和薰衣草的混合。 随着未来技术的进步,嗅觉的数字化终将走出实验室,成为我们日常生活的一部分。 当然了,应用于全新领域的AI模型也需要全新的数据集,包括传感器和打印机的改进,都是有趣的技术。 Osmo在去年拿到了850万美元的投资,来自比尔及梅琳达·盖茨基金会(Bill & Melinda Gates Foundation),另外Alex Wiltschko的老东家Jeff Dean也是公司的投资人之一。 将气味数字化意味着重构数字世界的感官,同时将更广泛的真实气味带入物理领域。这让我们对气味世界有了新的掌握,与我们最古老、最能引起情感共鸣的感官建立新的联系。 未来,将有数以百万计的人捕捉和分享气味,或者重新混合来创造自己的气味。这种创作也会成为一种新的公共艺术形式,香水行业或将为之颤抖。
李彦宏大模型“创业”400天
“过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种‘FOMO’状态,既兴奋、又害怕错过。” 面对在生成式AI浪潮中正被彻底改变的开发者群体,4月16日对外演讲中,李彦宏率先谈起了他们所遭遇的选择迷茫问题。 部分大模型头部创企开始走上 “双轮驱动”路线——既做模型又做应用,既想避开模型能力不断进化后,很多应用场景可能被完全覆盖的风险,又不想错失借助应用收集更多数据的机会。 但并不是所有创业者都能玩转“双轮驱动”策略。在近期一次公司内部分享中,李彦宏就明确表示,“双轮驱动”不是一个好的模式。“创业公司的精力和资源都是有限的,同时做两件事情和只做一件事情,哪个成功率更高是不言自明的。” 对于更多资源有限的普通创业者、开发者来说,在大厂现有模型基础上开发相关应用,或许是一种更具现实性的抉择。 即便如金山办公这类已上市公司,也因高昂的前期投入成本,以及自研大模型商业化上的不确定性,决定引入外部模型;即使强大如微软,也直接引进了OpenAI的大模型,而非从头原创。更重要的是,各行各业创业者所积累的行业Know-How,不仅是驱动大模型不断进化的关键数据要素,还是创业者有针对性开发行业大模型和AI应用的机会所在。 “大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”李彦宏在演讲中再次呼吁道。 从去年3月16日文心一言正式亮相至今,过去近400天时间内,李彦宏带领百度成为推动AI应用落地的最强有力声音。 截至目前,文心一言用户数、API日均调用量双双突破2亿,服务客户数达到8.5万,利用千帆平台开发的AI原生应用数超过19万。 爆款AI应用的缺失,直接导致业界情绪的低迷。从去年下半年开始,无论是用户还是投资人,对大模型的态度都变得更为冷静。 直到今天,“无论是中国,还是美国,最好的AI原生应用还没有出现。”在李彦宏看来,就像移动时代诞生了像微信、抖音这样的“mobile-native”的应用一样,AI原生时代一定会有新的超级应用将基于大模型开发出来。 但上述超级应用的诞生不会在短时间内骤然出现。这既需要基础大模型技术能力不断迭代,也需要越来越多开发者参与其中。 01 搜索“什么时候去新加坡人最少”,以前百度APP只能给你呈现一系列网址链接,现在它可以明确告诉你答案,“1-3月人最少”。 体验改善的背后,得益于百度在Creat2024百度AI开发者大会上最新提供的零门槛智能体开发工具AgentBuilder。这是百度降低AI应用开发门槛,吸引更多普通开发者投入其中的又一神器。 打开文心智能体平台,新手小白直接选择“零代码模式”,用自然语言,便能复现上述操作:先给智能体起名叫“新加坡旅游局”,然后在设定里写明需要打造旅游方案、解答问题,提供酒店门票预订服务,在高级配置中将新加坡百科词条和官网链接添加到知识库里,确保实时更新。一个可供查询、预订门票等服务的新加坡旅游局智能体便做好了。 据字母榜(ID:wujicaijing)了解,目前文心智能体平台已有超过1万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过30个行业。 值得一提的是,相比其他平台提供的智能体开发工具,文心智能体平台还配套提供了流量变现通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,尽可能解决开发者商业变现的后顾之忧。 对于不满足于AgentBuilder的开发者,百度还提供了另一AI原生应用开发工具AppBuilder,开发者最快只需三步,就可以用自然语言开发出一个AI原生应用,甚至已经有人借此拿到了10万元比赛奖金。 今年年初的一期AI原生应用开发挑战赛上,百度给出的赛题是利用AppBuilder打造一款“游乐场排队规划助手”,以环球影城为例,帮助游客更好地了解游乐场排队情况,设计个性化的游玩路线,在有限时间内获得最好的游玩体验。 最终获胜的冠军选手,先是在AppBuilder开发界面给应用起名“游乐场排队助手”,然后在角色指令中描述具体要求,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等,最后一步是到工具组件中,把代码解释器添加进来,帮助运算。 实际测试环节,当在右侧输入问题“我有3个半小时时间,怎么玩最刺激?”后,代码解释器得出将《哈利波特禁忌之旅》《侏罗纪大冒险》《霸天虎过山车》《大黄蜂回旋机》,这四个项目组合游玩,效果最佳。 对于有更高需求的专业开发者,百度还准备了一款有各种尺寸的模型定制工具ModelBuilder,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调。 达成上述效果的过程中,离不开ModelBuilder里面预置的丰富大模型储备资源,包括了百度自有的通用大模型ERNIE3.5和ERNIE4.0,三个轻量级大模型ERNIE Speed、Lite、Tiny,以及两个垂直场景的模型ERNIE Character和ERNIE Functions,同时还覆盖国内外77个第三方主流模型。 02 智能体开发工具AgentBuilder,AI原生应用开发工具AppBuilder,以及各种尺寸的模型定制工具ModelBuilder的推出,只是过去近400天的大模型“创业”中,李彦宏为降低开发者门槛,加速AI应用落地,推出的一系列举措之一。 为了抢占国内大模型产品上市先机,2023年春节过后,百度组建“项目组”,由李彦宏亲自过问、CTO王海峰挂帅,两人保持着每晚和所有相关技术、产品人员开会的节奏。 2023年3月16日,百度终于赶在所有国内厂商前面,率先发布文心一言,李彦宏在会上首度明确,“大模型时代,真正最大的机会既不在基础服务,也不在行业服务,我觉得恰恰是在应用。” 为了让更多开发者加入AI应用中来,李彦宏不仅手把手教用户写Prompt、做AI原生应用,还在去年5月启动了“文心杯”创业大赛,成为国内第一个聚焦应用层的创业大赛。 除了为参赛团队提供文心大模型API接口,以及百度智能云算力资源外,百度还设置了价值1000万元的投资奖励。 时隔近一年后,4月16日演讲现场,李彦宏再次宣布,第二届“文心杯”创业大赛正式启动。除了项目筛选范围扩大、设置分赛场外,百度还首次设立了“特别大奖”,最终获胜的AI原生应用项目将有机会获得最高5000万元的现金和资源支持。 借助创业大赛推动AI应用生态繁荣之外,百度还在使用效果和成本环节,尽可能让更多开发者可以高效、低价地用大模型来做AI应用。 依托百度在芯片、框架、模型、应用四层架构上的全栈布局优势,相比一年前,文心大模型算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。这意味着,客户原来一天调用1万次,同样成本现在可以调用100万次。 03 在吸引外部开发者聚焦应用层面之外,百度自身成为李彦宏重构AI原生应用的第一步。 去年的中关村论坛上,李彦宏首度对外明确:“百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!”李彦宏眼中的AI原生应用,不是简单重复移动互联网时代的APP,或者PC时代的软件,而是去解决过去解决不了或解决不好的问题。 在上述理念指导下,过去一年内,百度相继完成了十余款应用的重构,输入法、搜索、网盘、地图、文库等一系列用户量过亿的产品均在其中。 尤为值得一提的是文库。完成从“内容工具”向“生产力工具”进化的百度文库AI新功能,在去年上线2个月时间内,便累计下超过1300万使用用户、累计功能使用次数更是破亿。 被AI重构后的新百度文库,更是被李彦宏称赞为百度内部“重构最彻底的一款产品”。去年二季度财报电话会上,李彦宏表示,百度文库的“AI文档助手”功能发布后,用户的使用时长翻了一番多,7日留存率提升了将近10%。“我们可以转化更多的用户,也可以将更多的用户转化为付费账户,并在未来对新的人工智能功能收取额外费用。” 在提升百度货币化率之外,被AI重构后的各个产品,也开始建构起新的协调机制。微软CEO纳德拉就曾在一次讨论会中表示:“最终希望用AI打破应用之间的界限。”如今,通过使用AI控制和检索信息,李彦宏也正在带领百度打破每款应用原有的工作流程,帮助公司业务走向更加紧密的一体化。 对百度自有应用的AI化重构,也承载着李彦宏对外打造百度AI技术效果和实力试验田的愿望。 有“科技预言家”之称的凯文·凯利曾分享过一个观点,认为“每一次技术革命都是一次权力的重构。”微软借助Windows创造了应用创业新机会,网景借助浏览器开创了网站创业新机会,谷歌、苹果分别借助Android、iOS,开创了移动应用新机会。现在,生成式AI借助大语言模型,正在带来新的改写应用的新机会。 在新的权力重构过程中,模型和应用的关系都在发生变化:一方面,随着模型体量变大,很多应用生存空间被碾压;另一方面,随着应用开发者变多,其对模型先进性的追求愈来愈高。 面向未来,在文字、图片、语音、视频等多模态大模型的长期竞争中,留给李彦宏的新挑战之一便是,如何带领百度继续保持模型性能的领先优势。
AI营销,大厂竞技
采写/王舒然 编辑/万天南 大模型火到今天,如何落地成了行业主旋律。 如果说有些领域存在“拿着锤子找钉子”的“嫌疑”,那么,营销领域则恰恰相反,属于“一堆钉子等锤子”——营销中存在大量的基础性工作,等待AI来解放。 首当其冲的是制作广告素材,文生图、图生图、文生视频......各种形式的内容生产,皆命中AIGC的能力靶心。数字营销公司NP Digital对此预测,2024年AI将主导广告等网络内容的创作。 不止如此,在广告精准匹配、投放计划设置等环节,更懂用户和数据的AI也将有十足的用武之地。 用AI将营销全链条重做一遍,已是大厂共识,他们左手有AI大模型,右手有客户和场景,可谓AI营销落地的最佳“试炼场”。 《财经故事荟》盘点大厂近一年的AI营销动作发现,他们在整体思路上有共性,都布局了从广告生产到投放的全链条,但在各环节的功能落地上,或因业务场景和主体客户不同,他们现阶段各有侧重。 但伴随时间和技术迭代,我们认为,在功能的全面性上,他们将不断趋近,“你有的我也会有”。 一 AI+营销,主打降本增效 在降本增效的大背景下,商家面临的营销难度在变大。 一边要向存量市场求增长,另一边却是预算在减少,据秒针营销科学院发布的《2024中国数字营销趋势报告》显示,2024年中国市场营销投资信心整体不足,43%的广告主认为整体营销投入将减少,其中13%认为将大幅减少,30%认为将小幅减少。 来源:《2024中国数字营销趋势报告》 如何用有限的预算获得确定性增长,是摆在商家面前的核心命题。 降本增效的“代言人”AI成了公认的解题希望,上述报告显示,AI营销是广告主未来最期待的创新营销形式,未来会使用的广告主比例高达44%。 现阶段AI为营销带来的新价值,主要是优化各环节效率。 比如,在广告生产环节,AI能更快得产出营销素材,降低商家的时间和人力投入,从而将营销人员从繁琐的执行过程解放出来,回归到创意本身的思考。 以制作电商模特图为例,在传统流程中,场景实拍加后期制作,整体可能耗时两三天甚至更久,但AI介入后,几分钟就能产出几百条素材,供商家做投放测试。 这不仅能提高效率,还增加了批量测试出“爆款”的概率。 目前AI广告正被不少商家所实践,《2024中国数字营销趋势报告》显示,3成广告主在使用AI生成图文,2成广告主通过AI生成视频,还有超过3成的广告主计划使用AI生成图文或视频。 当然,现阶段部分AI广告还存在不尽如人意的地方,譬如被诟病的“塑料感”“AI味儿”“假面”等,但大模型技术迭代速度很快,应用也将随之越来越广泛。 据量子位智库估计,中国目前生成式AI在广告营销行业中业务营收占比不到1%,但未来每年增速或将达到60%以上,预计2030年将达到1500亿左右规模。 再比如,在广告投放环节,AI基于对用户意图和广告内容的理解,能将两者更精准智能的匹配起来,从而减轻商家投放过程的复杂度。 此前,广告投放一度被认为是“玄学”,投放效果如何,很大程度上依赖广告优化师对投放计划的设置,如人群定向、出价策略等,而这大多基于个人的能力和经验,并无方法论,因而效果可能不稳定,同时也难以“复制”给其他人。 AI则能基于底层技术逐渐掌握“玄学”,虽然当下并不能完全代替广告优化师的能力,但其能在数据反馈中不断自我迭代,趋近最优解。 总的来说,AI现阶段对营销的赋能主要是针对现有投放环节的优化,但其想象空间不止于此,未来AI可能会对广告格局、商家经营等产生一系列联动影响。 比如,AI基于营销数据分析输出洞察,指导商家的生产和设计,按需定制生产可能成为现实;比如,AI基于对个体用户的理解,自动生成个性化广告,彻底改变现有广告模式..... 面对这广阔前景,大厂们已尽数下场。 二 AI生成广告,多模态是共识 近一年内,大厂们相继推出了自己的AIGC工具,用于商家制作广告素材。 比如,阿里妈妈去年7月上线的“万相实验室”、今年3月阿里又上线了“绘蛙”;百度去年6月推出“擎舵”;抖音去年10月推出“即创”;京东去年12月推出“京点点”;腾讯今年1月推出“妙思”;快手推出“盘古”。 除了新开发工具外,部分大厂还对原有工具进行“AI改造”,使其更智能化。比如,阿里妈妈对其创意生态中心“淘积木”进行AI升级,能自动抓取商品卖点,为商家定制大促落地页;还有京东的“羚珑”,能根据商家需求秒级生成促销海报、活动宣传图等素材。 其实,广告素材无外乎图片、文案、视频等,大厂投放场景多元,从长远看,全面支持多模态广告的生成将是他们的一致选择。 但就眼下而言,他们还是优先服务于主要场景,因而,功能点有一定差异。 阿里、京东主要服务电商场景,两者均支持根据商品信息自动生成商品场景图和营销文案。 而在图片生成方面,阿里特别支持生成商品模特图,这或许是因为服装是其优势类目。在“万相实验室”和“绘蛙”中输入商品图片,选择系统内置模特,便会自动生成商品模特图,后者还支持输入自带模特图,系统会将其训练成AI模特。 此外,“万相实验室”今年3月还新增了生成视频功能,上传图片输入动作文字指令后,静态图片就能在各种场景中动起来。 腾讯、百度则服务于泛行业营销,如游戏、阅读、教育、电商等。 其中,百度“擎舵”目前支持生成广告文案和数字人口播视频,图片生成功能已在规划中,但尚未开放体验。 腾讯“妙思”目前仅支持生成图片,和阿里京东一样,其可以根据商品原图合成不同背景,但特别的是,其还支持仅通过提示词生成图片,该功能尤其适用于非实物行业如阅读、游戏等的投放。 不过,视频等多模态能力已在腾讯规划中,在今年3月的腾讯“妙思”发布会上,腾讯广告平台产品技术副总经理郭伟提到,“妙思”未来探索方向之一是构建多模态能力。 抖音、快手主要支持短视频场景,抖音“即创”可生成数字人口播视频,同时还支持生成带货样式的图文;快手“盘古”则能生成AI配音和短视频切片。 值得一提的是,除了抖音,字节系还有今日头条、西瓜视频、番茄小说等流量场景,因而需要适配更多元的素材形式,这可能会由字节巨量引擎今年1月推出的自动化投放平台UBMax负责,巨量引擎产品运营中台负责人于粟天表示,2024年UBMax会探索广告创意的自动生成问题。 可以看到,大厂的AIGC工具还刚刚起步,所支持的功能各有侧重,但他们都在朝着更全面的方向迭代。 三 简化投放操作,大厂各有侧重 在简化投放操作方面,多家大厂推出了新的智能投放平台或功能。但由于投放计划涉及因素众多,难以一蹴而就彻底“AI化”,因而,他们基于自身能力和客户需求的考量,现阶段选择从不同侧重点切入。 百度去年9月推出“轻舸”投放平台,侧重于目标人群的设置简化——此前,商家需要设置大量的搜索关键词圈定目标受众,如今只需用自然语言描述即可。 以老牌教育机构中国东方教育为例,其在“轻舸”平台直接描述“帮我把广告投放给想学IT找工作的年轻人”,再设置好落地页、投放时段、出价和预算等基础信息后,“轻舸”便能自动锁定人群。 基于此,此前商家需要管理十几万关键词,如今只要提供400多个自然语言提示词,创编一条搜索广告方案的时长也大大缩减,从此前的2小时缩减到5分钟左右。 阿里妈妈则主要从全域流量整合的角度切入。 此前,商家需要对搜索、信息流等不同场域进行区隔投放设置,但去年8月阿里妈妈推出的效果广告投放平台“万相台无界版”和品牌广告投放平台“阿里妈妈百灵”,将搜索、推荐、直播、短视频等各场域流量整合,商家可一站式投放。其中,后者还打通了淘外其他阿里系的流量渠道。 全域整合的利好是,品牌商家可以从人群、货品等更精细化的维度做整合投放管理,“万相台无界版”对此提供了“序列化追投”能力,当AI发现某用户搜索了商家产品,但没有购买时,便会在其他流量场景对其进行二次触达;平台还会指引商家根据货品从测款、上新到爆品塑造的不同生命周期进行追投。 字节方面,巨量引擎的UBMax平台主要侧重于简化多计划设置、盯盘的复杂度。 此前,商家为抢占站内流量会设置多时段投放计划,并需及时盯盘,根据跑量情况补充或关停计划,这不仅导致操作复杂,还可能因为判断不足,导致计划之间相互挤压,或部分计划只消耗不转化。 UBMax的方式是由系统代替人工盯盘,自动感知竞价环境,通过跑量模型预估出最佳投放时间和计划条数,在保障投放成本的同时,提升跑量能力。 巨量引擎数据显示,UBMax平均帮助客户节省45%的创编时间,提升125%的跑量。 快手方面更“大刀阔斧”,其去年9月推出直播智能托管功能,直接省略了人群定向设置,商家只需选择好预算、预期ROI和投放时段,系统便会自动选择人群并智能出价,这尤其适合对投放不熟悉的新商家。 腾讯“妙思”目前则主要盯上了投放审核环节,对其进行了大幅度提效。 此前,广告素材的审核等待时间可能长达4到6小时,大促期间甚至更长。对此,“妙思”打通素材生产和审核环节,素材一经生成便即时提交审核,不符合条件的素材会自动拦截,避免投入精力,由此广告主平均审核等待时长能缩短80%左右。 京东投放的“AI改造”也在规划中,从其近期官宣看,其“京准通”投放平台将会从“全域投放”、“为商家提供对话交互方式的智能助手”、“智能出价”等多个角度切入,这与前述几家大厂的侧重点既有重叠,又有不同。 四 AI赋能,更懂用户 除了简化素材生成和投放设置外,大厂还在用AI赋能投流的前后链路,以进一步放大营销效果。 前链路是指流量撬动方面,各大厂均通过训练大模型来增强对用户意图的理解,以提升广告匹配精准度。 成果已尽数体现在他们的财报业绩上。比如,腾讯财报显示,2023年腾讯网络广告收入同比增长23%,驱动因素便是“广告AI模型的改进显著提升了精准投放效果”。 来源:腾讯财报 再比如百度,AI对其广告的增长助力也已开始显现。财报显示,2023年Q4百度在线营销收入为192亿元,同比增长6%,而据百度创始人李彦宏表示,2024年大模型将为广告和人工智能云业务带来数十亿元的增量收入。 值得一提的是,在认知用户方面,阿里妈妈正持续升级方法论,其3月25日发布的LMA大模型技术,不只根据单一的购买行为定义用户,而是通过兴趣、生活场景、文化属性等多维度,挖掘用户的潜在需求。 比如,针对购买过入门款登山杖的用户,系统会自动提炼出“户外小白”人设,并继续向其推荐防晒衣、露营椅等跨品类的初阶户外产品。如此,商家便可突破品类限制,获取更多圈层的流量。 同时,阿里妈妈还将发布“以付费流量撬动自然流量”的新产品,进一步拉动商家全域增长势能,这背后皆赖于对用户的“立体”认知,才能更全面的匹配用户和商家。 而在后链路环节,多家大厂正尝试用AI数字员工的方式承接用户,并在智能化服务中完成转化。 百度在去年11月推出对话式营销产品“商家智能体”,在部分搜索场景中,商家专属“智能体”会适时触发,与用户智能互动,实现精准营销。 比如,在品牌三棵树的智能体对话中,用户咨询“我刷墙后多久可以入住?”,智能体会在回答行业知识的同时,洞察到商机,主动为用户推荐三颗树的健康涂料。 据百度营销披露,商家智能体的接待效果大幅领先于传统AI机器人,展现量提升51%,消费提升56%,咨询开口量提升72%。 京东则是对原有智能客服“京小智”进行了AI升级,使其实现更加智能化的咨询与导购服务,尤其在营销大促节点时,能为商家分担不少服务压力。 在去年的双11大促中,开售10分钟,“京小智”累计咨询服务量超188万次,服务商家数量超36万。 巨量引擎UBMax也在规划类似服务,其表示将利用智能接待技术,让机器人自动承接用户咨询,或者生成推荐话术辅助人工接待用户,以提升投放后的线索转化效率和咨询效率。 其实,智能客服早已存在多年,各大厂目前都有自己的智能客服产品,如淘宝的“店小蜜”、腾讯企点的智能客服等,在大模型的加持下,他们均有望进化成真正懂用户的金牌员工。 AI数字人的服务形式也正被更多广告主接纳,《2024数字媒体营销趋势》显示,79.1%的广告主愿意将数字人应用到广告与品牌内容传播上,以兼具科技感和人性化的互动,在调研、售后、咨询等场景创造新的消费体验。 综上可见,AI有能力重构营销的各个环节,其本质是让机器替代人完成那些繁琐复杂的工作,并通过自我迭代不断达成更优的效果,而人则可以去做真正有价值的思考。 但必须承认,目前AI营销才刚起步,大厂们的“AI改造”只是“冰山一角”,更多智能营销场景等待挖掘,而平台和商家们在新时代的增长机会就蕴藏其中。
向用不起的AI宣战!宇视掀起“装备大模型化”变革
“大模型只是技术升级不是革命……大模型技术商业化落地的路线一定是:装备大模型化。”宇视科技CEO张鹏国说。 智东西4月16日报道,今日,在2024宇视合作伙伴大会上,宇视科技宣布推出AIoT行业大模型“梧桐2.0”,并发布“猎光 2.0” AI-ISP图像引擎感知终端等一系列大模型产品,打响AIoT行业“装备大模型化”的第一枪。 ▲宇视科技CEO张鹏国发表题为《AIGC:千里之行,始于足下》的演讲 从爆火的ChatGPT到Sora,大模型正冲向边缘侧、端侧设备,从而重构千行百业。小到一个摄像头,大到一个个物联网场景,大模型如何在其中真正跑起来?备受产业关注。 装备大模型化,是宇视科技与万家渠道伙伴一起给出的答案。 ▲2024宇视合作伙伴大会现场 去年5月,宇视科技领先AIoT行业率先推出大模型“梧桐”,并与多家行业龙头联合启动“梧桐大模型种子合作伙伴计划”,探索大模型在交通、教育、零售、体育公共服务等领域的端边云侧的深入落地。 一年后的今天,宇视与合作伙伴不仅带来了AI体育、AI文旅等各个行业的大模型新落地成果,还通过软件硬件化、硬件装备化、装备序列化的新经验,为全行业带来“装备大模型化”产品底座开放能力的质变。 ▲AIoT新生态产品底座2.0 从实验室到产品化、从软件到硬件工程化、从价格昂贵到低门槛化,大模型有望通过守护城市和田间地头的“机器之眼”,完成从技术到行业价值的新飞跃。 01. 所有装备 都值得用大模型重做一遍 大模型是技术升级还是革命? 不同的人观点不同:闭源派、技术信仰者更倾向于这是一次技术革命,而开源派、市场信仰者更倾向于这是一次技术升级。 站在AIoT行业的角度去看,张鹏国认为,大模型是AIoT行业当下最大的技术变量,但大模型是技术升级,而不是革命。这很好理解,就像我们说蒸汽机出现不算是工业革命,但是把蒸汽机装到了火车、轮船和各种生产工具上提高效率,才是工业革命。 如何让大模型发挥出“革命”力量?还要靠装备大模型化。 “大模型技术是AIoT行业当下最大的技术变量,必定会给我们带来新的市场机会点。一个大的机会点就是大量在网产品的更新迭代。”张鹏国说,“借助于行业大模型技术,边、端产品有望用更低的成本,在某些细分场景下实现更好的应用效果。” 这意味着最直观的需求:所有装备,都值得用大模型重做一遍。 大模型技术升级对产品和解决方案架构提出新的要求,比如要求云边端的芯片都支持Transfomer架构,大规模参数对设备的显存和算力提出新的要求,进而产品的形态和功能也将被改变,比如支持更强大语音对话的摄像机已经出现。 装备大模型化时代,“视频+大模型”首先会成为一大金矿。 正如宇视科技首席产品官朱兵所说,大模型的出现,让我们可以一起用更低的投入去挖掘海量视频的价值,解决传统AI技术解决不了的问题。在他看来,视频的价值如何挖掘落地则可以用一个公式来表达,那就是:“视频”价值=(边端装备+大模型)x 生态业务 基于这样的理念,宇视今年推出了一大批“装备大模型化”产品,实现了业界最宽业务场景的覆盖: 1、AI端侧装备:基于“猎光2.0 -AI-ISP”图像引擎的AI全彩感知终端产品。它基于“梧桐”大模型,使得极暗环境下全彩画面画质得到极大改善,30米外仍可智能识别和分析目标。 2、AI边缘端装备:AI NVR、AI BOX、AI控制器和AI互动发布屏等。这些装备基于“梧桐”大模型生成的长尾算法,可用于众多行业场景,如用于校园AI体育的室外AI体测一体机、室内AI体锻屏等。 3、AI边缘域装备:基于梧桐大模型的视频智能推训一体机、视频数据服务一体机等。这些产品一般部署在中心机房,可以脱离平台单独使用,处理能力和路数相对边缘端装备有数倍的增加。 用大模型重做AIoT装备,首先要注意规避小模型时代踩过的“坑”。 在上一波小模型AI浪潮中,宇视科技被认为是国内AI工程化最成功的AIoT企业之一,与海康、大华等一起把智能摄像机、边缘盒子落到了全国各地,同时也踩过AI落地几乎所有会遇到的坑。 正是基于先前的经验,在张鹏国看来,在涉及“AI+还是+AI?”这一重要路线问题时,在这场变革中最容易成功的,还是后者,也就是装备大模型化路线。 这背后是深刻的产业逻辑:随着大模型推动的技术平权加速,大模型落地AIoT行业更离不开的是,紧密合作的客户群和渠道、公司营销的基本盘以及强大工程化落地能力迭代。 02. 参天生长的梧桐2.0 行业商业化落地新破局 为了推动装备大模型化,宇视今日正式发布梧桐2.0大模型。 梧桐2.0从训练、推理、测试、数据等AI开发过程进行全面升级。图像方面,梧桐2.0新增了大模型AI-ISP、超分及图像质量评价等多个模块;CV方面,由视频结构化全面升级为视频内容理解;NLP方面,更好地支持软件代码生成;多模态方面,文生图、文生视频在智慧景区、智慧体育等领域应用,极大地提升用户体验。 宇视AI首席科学家李聪廷说,装备+梧桐大模型,将重新定义图像质量、视频解析、模型的推理和训练,也将重新定义装备本身。新一代的AI装备,在图像质量、算法精度、算法生产率、用户体验等方面有质的飞跃,同时服务效率也大幅提升。 作为一个行业大模型,梧桐2.0的一大显著特征是“边用边升级”。 以宇视在AI体育领域的落地方案为例,基于梧桐大模型的AI体育锻炼屏可以让很多孩子站在同一个屏幕前一块做运动,记录每个孩子的动作细节和成绩,为其自动打分并提供锻炼建议,让孩子能更快乐且更科学地锻炼身体。 ▲宇视AI体育锻炼屏展示 随着体育在素质教育中越来越重要,体育教育缺乏科学的评判工具和较完备的方法论,成为当下国内教育的一大痛点。基于梧桐大模型的AI体育方案以极低成本,使系统实现了远超小模型方案的效果,助力学生体育教学的质量大大提高。 ▲宇视AI跑步屏展示 大模型首先进入的行业有一些显著特征。以文教体行业为例,这一市场用户基数和市场空间庞大,并符合社会进步的方向,且在技术上没有过于苛刻的精度要求,给大模型固有的幻觉留出了空间,因此成为大模型的一大绝佳“着陆点”。 可以看到,经过大模型化的边缘、端侧装备融入到具体场景,将为行业商业化落地带来全新的突破口。 然而,要实现装备大模型化,也不是一蹴而就的。 正如朱兵所说,其能力随着时间在算法的大模型能力和装备部署大模型的能力两个维度上发展,算法前期会发展更快些,而装备部署大模型的能力未来有望迎来“井喷式”发展。 以下这张图展示了宇视边端装备大模型化的演进路径: 1、算法+大模型的能力:从CV到多模态充分融合 •对于安防CV算法,大模型的贡献是从自动生成样本数据,帮助小模型算法提高效率开始的。 •2023年下半年已经可以基于更少的数据样本+自学习实现长尾算法开发效率的指数级提升。 •接下来今年上半年大模型CV算法和NLP语义理解能够充分结合,能够在客户现场基于语义化描述快速调用多种算法按语义理解的逻辑组成新的算法。 •未来的算法则会多模态化,基于视图理解和交互会充分融合,就像不久前谷歌发布Gemini所演示的一样,会成熟落地。 2、装备部署大模型能力:从公有云到边端侧使用门槛降低 •去年首先实现的是公共云部署大模型的能力,从去年下半年开始逐步在边缘装备上部署基于大模型生成的长尾算法,对算力的要求相对较高。 •然后是大模型本身可以私有化部署在边缘域一体机中,随着算力成本的降低,今年年底开始会逐步有感知终端部署大模型生成的算法。 可以预测,随着AI PC、具身机器人等成为具有前景的大模型落地方向,作为“机器之眼”的视觉传感设备,有望率先成为大模型落地的载体,发挥出巨大的行业价值。 03. 装备大模型化 宇视与渠道伙伴的双向奔赴 实际上,装备大模型化赋能行业的故事已经越来越多。 基于梧桐大模型和边端装备,过去一年宇视和渠道一起还做了很多有价值的行业案例: 在国家东北虎野生动物园,10天快速输出了老虎识别算法,夜间效果准确率达到90%,发现老虎能实时联动报警,有效防止人虎冲突。 在湖南某地,一周生成不牵狗绳算法,准确率达到96%以上,从识别到最后狗主人将狗绳系好,整个过程不到3分钟,获得当地电台的报道点赞。 在海南环岛公路,集雷视融合检测、LED屏显、数据深度处理、无线通信为一体的道路安全预警装备,实现弯道双向预警,有效降低交通事故发生。 在濮院时尚古镇,宇视与顶度集团一起,基于VR和VLOG AI短视频融合体验,让每一位游客融入“濮院T台”,记录自己的“时装周”精彩瞬间。 …… 碎片化是AIoT行业多年以来面临的顽疾,但大模型的泛化能力让这些问题有了一致解法,装备的大模型化也将带来AIoT产品底座开放能力的质变。 和去年相比,宇视将提供更彻底的开源能力,新增宇视公共云服务提供的开源组件;提供了覆盖更全面的OPEN API南北向接口,新增全配置式接口创建以及适配,业务整合效率整体提升70%。 同时,基于梧桐CV大模型能力,1周发布1个新分类检测模型,合作伙伴可以方便训练自己的AI长尾算法;其还提供更丰富的轻代码/零代码工具,通过拖拽式点位标记,1人天即可实现3D地图应用发布。 此外,梧桐还提供更智能的软件开发方式,借助AIGC辅助生成代码工具,帮助开发人员通过文本交互或原型快速自动创建代码,同时及时纠错,提高开发效率。 李聪廷告诉智东西,过去,很多人可能觉得大模型高不可攀,用起来一定很贵。但在大模型落地AIoT边缘和端侧的过程中,宇视已经能实现比传统方案成本降低的情况下,效果明显的提升。大模型方案越来越成为更超值的选择。 04. 结语:装备大模型化 助力解放新质生产力 随着「百模大战」展开一年多,我们看到很多软件App已经接入大模型,进而寻求打造爆款超级应用;而今年,以宇视科技为首的AIoT企业率先打响“装备大模型化”的变革,展现了大模型跨越软硬件的鸿沟,落地千行百业的潜力。 “人工智能+(AI+)”在2024年两会中首次被写进政府工作报告,国家正加强顶层设计,加快形成以AI为引擎的新质生产力。“AI+”的落地需要结实的凭借和抓手。装备大模型化有望聚AIoT生态之力,提供有力的抓手,助我国加速解放新质生产力。
Gemini Ultra训练烧掉近2亿美元!斯坦福迄今最全AI报告发布,中国AI专利数遥遥领先
智东西4月16日报道,最新的501页《2024斯坦福AI指数报告》刚刚发布,披露了其迄今最全面的AI指数,提供从2010年至今涉及AI研发专利、开源趋势、技术性能、训练成本、经济影响、投融资、监管进程变化的数据与图表。 根据报告,产业界继续主导前沿AI研究,先进AI模型的训练成本突破亿级大关,其中烧钱最猛的谷歌Gemini Ultra达到了惊人的1.91亿美元。 2023年生成式AI投资数量大幅增长,相比2022年接近翻倍,总额达到252亿美元。而全球AI私人投资则连续第二年呈下降趋势。 就开源与闭源路线而言,新发布的基础模型中,开源模型占比超过6成。但从平均性能表现来看,闭源模型要优于开源模型。从2011年到2023年,GitHub上AI相关数量从845个一路暴增到181万个,仅是去年数量就飙涨59.3%。 从专利数量来看,中国近年一直稳居第一,显著超过第二名美国。 报告广泛研究了包括语言处理、编程、计算机视觉(图像与视频分析)、推理、音频处理、自主agents、机器人与强化学习,还聚焦过去一年显著的AI研究突破,探讨了通过提示、优化和微调来改进大语言模型的方法。 各行各业的企业正在以不同方式利用AI。报告研究了企业对AI的采用情况,以及与AI相关的劳动力需求、招聘趋势、技能渗透率和人才可用度,评估了AI当前和预计的经济影响。 2023年,被调研的专业开发者中,ChatGPT是最受欢迎的AI搜索工具,GitHub Copilot是最受欢迎的AI开发工具,AWS是最流行的云平台。 同时,报告分析了隐私与数据治理、透明度与可解释性、安全性与公平性等负责任AI的关键议题,并探讨了AI对政治进程的潜在影响。 01. 大模型训练成本高达近2亿美元, 中国AI专利数问鼎全球第一 1、前沿模型越来越贵,Gemini Ultra训练成本近2亿美元 据AI指数估计,先进AI模型的训练成本已经达到了前所未有的水平。例如,OpenAI的GPT-4花了约7800万美元的计算成本进行训练,谷歌Gemini Ultra更是在计算上花费了1.91亿美元。 这些模型对环境造成的影响如下表所示。 不同模型推理任务造成的碳排放情况不同。 2、工业界继续主导前沿AI研究,知名模型数“倍杀”学术界 2023年,工业界生产了51个知名机器学习模型,而学术界只贡献了15个。2023年产学研合作产生的知名模型也达到21个,创历史新高。 3、超6成基础模型开源,闭源表现明显优于开源 2023年总共发布了149个基础模型,是2022年发布数量的2倍多。 在这些新发布的模型中,65.7%是开源的,而2022年和2021年分别只有44.4%和33.3%。 出于对风险控制等因素的考虑,基础模型们采用了不同的开放策略,像BLOOM、GPT-J等完全开源,PaLM、Imagen等则完全闭源。 在10个AI基准测试中,闭源模型的表现优于开源模型,平均性能优势为24.2%。闭源模型和开源模型的表现差异对AI政策辩论具有重要意义。 自2011年以来,GitHub上与AI相关的项目数量持续增长,从2011年的845个增加到2023年的181万个。仅在2023年,GitHub AI项目总数就急剧增长了59.3%。 从地理分布来看,美国GitHub AI项目占比最多,约为22.93%,中国大陆占3.04%。 GitHub上AI相关项目的star总数也在2023年大幅增加,从2022年的400万增加到1221万,增加了2倍多。 同样,美国AI项目的star总数远超世界其他地区。 4、61个顶级AI模型来自美国,数量远超欧盟和中国大陆 2023年,61个知名AI模型来自美国的机构,远远超过中国大陆的20个。 5、AI专利数12年暴涨31倍,中国问鼎全球第一 从2021年到2022年,全球AI专利授权量大幅增长62.7%。自2010年以来,AI专利授权数量增长了31倍以上。 2022年,中国大陆以61.1%的比例领先全球AI专利,显著超过美国的20.9%。 6、AI出版物数量12年增加近2倍 2010年至2022年间,AI出版物的总数几乎增加了2倍,从2010年的约8.8万篇增加到2022年的24万多篇。2022年同比增幅放缓。 7、GPT-4去年最受关注 被选模型中,2023年GPT-4在AI社交媒体上受到最多的关注。 2023年各季度AI模型的净情绪得分情况如下: 8、AI加速科学发现与医疗进步 2022年,AI开始推动科学发现。023年,我们看到了更重要的与科学相关的AI应用推出——从提高算法排序效率的AlphaDev,到促进材料发现过程的GNoME。 2023年有几个重要的医疗系统问世,包括增强大流行预测的EVEscape和协助AI驱动的突变分类的AlphaMissence。AI越来越多地被用于推动医学进步。 过去几年,AI系统在评估AI临床知识的关键基准测试MedQA上取得了显著进步。2023年的突出模型GPT-4 Medprompt的准确率达到了90.2%,比2022年的最高分提高了22.6%。自2019年推出该基准以来,MedQA上的AI性能几乎增长了2倍。 2022年,FDA批准了139种与AI相关的医疗设备,比2021年增加了12.1%。自2012年以来,FDA批准的AI相关医疗器械数量增加了45倍以上。 02. 多模态AI时代来了! 基准测试转向人工评估 1、AI在某些任务上胜过人类,但并非所有任务 AI在图像分类、视觉推理、英语理解等基准上的表现超过了人类。但在更复杂的任务上,比如竞赛水平的数学、视觉常识推理和规划,它就落后了。 2、多模态AI大放异彩 传统AI系统的适用范围有限,语言模型在文本理解方面表现出色,但在图像处理方面表现不佳,反之亦然。而多模态模型正在兴起,例如谷歌的Gemini和OpenAI的GPT-4。这些模型展示了灵活性,能够处理图像和文本,在某些情况下甚至可以处理音频。 3、基础测试更加严格,并转向人工评估 AI模型在ImageNet、SQuAD和SuperGLUE等既定基准上的性能已经达到饱和,促使研究人员开发更具挑战性的模型。2023年出现了几个具有挑战性的新基准,包括用于编码的SWE-bench、用于图像生成的HEIM、用于通用推理的MMMU、用于道德推理的MoCa、用于基于agent的行为的AgentBench和用于幻觉的HaluEval。 随着生成模型产生高质量的文本、图像和更多内容,基准测试已经慢慢开始转向像Chatbot Arena排行榜这样的人工评估,而不是像ImageNet或SQuAD这样的计算机化排名。在跟踪AI的进展时,公众对AI的感受正成为一个越来越重要的考虑因素。 4、更好的AI意味着更好的数据 SegmentAnything、Skoltech等新兴AI模型正被用于生成图像分割和3D重建等任务的专门数据。数据对于AI技术的改进至关重要。使用AI创建更多数据增强了当前的能力,并为未来的算法改进铺平了道路,特别是在更难的任务上。 5、大语言模型让机器人更灵活 语言模型与机器人技术的融合产生了更灵活的机器人系统,如PaLM-E和RT-2。除了改进的机器人能力之外,这些模型还支持问答,这标志着机器人向能够更有效地与现实世界互动的方向迈出了重要一步。 6、更多AI Agent技术研究 长期以来,创造能够在特定环境中自主运行的AI Agent一直是计算机科学家面临的挑战。新兴研究表明,自主AI Agent的性能正在提高。Agent现在可以掌握像《我的世界》这样的复杂游戏,并有效地处理现实世界的任务,比如在线购物和研究协助。 03. 生成式AI投资猛增, 新投资AI公司数量大涨 尽管去年AI私人投资总体下降,但对生成式AI的投资却大幅增长,比2022年增长了近2倍,达到252亿美元。 获得新融资的生成式AI公司数量去年达到99家。 生成式AI领域的主要参与者,包括OpenAI、Anthropic、Hugging Face和Inflection都公布了大量融资。 全球在AI领域的私人投资总额连续第二年下降,但幅度低于2021年至2022年的急剧下降。 新获得投资的AI公司数量飙升至1812家,比上年增长40.6%。 其中美国占了近一半。 2023年,美国在AI领域的私人投资达到672亿美元,是第二名中国大陆的近8.7倍。自2022年以来,中国大陆和欧盟(包括英国)的AI领域私人投资分别下降了44.2%和14.1%,而美国在同一时间段内显着增长了22.1%。 在生成式AI私人投资上,美国总投资额一骑绝尘,2023年达到224.6亿美元。 与2022年相比,在AI Infra、研究和监管领域的私人投资总额大幅增长。 04. 生成式AI成大公司焦点, 近6成组织用AI增加收入 1、《财富》500强企业财报会议大量提及生成式AI 2023年,AI在财报电话会议中被提及394次(几乎占所有财富500强公司的80%),比2022年的266次有显著增加。自2018年以来,《财富》500强企业财报电话会议中提到AI的次数几乎翻了一番。最常被提及的主题是生成式AI,占所有财报电话会议的19.7%。 2、全球范围内AI工作岗位减少 2022年,AI相关职位占美国所有招聘职位的2.0%,到2023年,这一数字降至1.6%。AI职位列表的下降是由于领先的AI公司发布的职位减少,以及这些公司的技术职位比例减少。 3、超半数组织采用AI 麦肯锡2023年的一份报告显示,55%的组织现在至少在一个业务部门或功能中使用AI(包括生成式AI),高于2022年的50%和2017年的20%。 至少一个功能或业务部门引入AI功能的调查结果如下: 4、AI降低了成本,增加了收入 麦肯锡的一项新调查显示,42%的受访组织表示实施AI(包括生成式AI)降低了成本,59%的组织表示收入增加。与前一年相比,报告成本下降的受访组织增加了10个百分点,这表明AI正在推动企业效率的显著提高。 科技、传媒、通信领域在产品和服务开发、市场和销售方面的AI采用率显著增长。 5、AI提高了员工的工作效率和质量 2023年,几项研究评估了AI对劳动力的影响,表明AI使员工能够更快地完成任务,并提高他们的产出质量。 这些研究还表明,AI有潜力弥合低技能工人和高技能工人之间的技能差距。还有一些研究警告说,在没有适当监督的情况下使用AI可能会导致性能下降。 6、ChatGPT、GitHub Copilot最受专业开发者欢迎 调查显示,ChatGPT、Bing AI、WolframAlpha是最受专业开发者欢迎的3款AI搜索工具。 GitHub Copilot是2023年最受专业开发者欢迎的AI开发工具,其次是Tabnine和AWS CodeWhisperer。 云计算平台中最受欢迎的是AWS、微软Azure和谷歌云。 开发者们认为AI工具有提高生产力、加快学习、提高效率、提高代码精确度等好处。 常用的生成式AI功能有生成草稿、个性化营销、总结文稿、生成图像或视频等。 7、中国主导着工业机器人,机器人安装更加多样化 自2013年超越日本成为工业机器人的主要安装国以来,中国与最接近的竞争对手的差距已显著扩大。2013年,中国大陆的安装量占全球总量的20.8%,到2022年这一比例将上升到52.4%。 2017年,协作机器人仅占所有新工业机器人安装量的2.8%,到2022年这一数字将攀升至9.9%。同样,2022年,除了医疗机器人之外,所有应用类别的服务机器人安装量都有所增加。 05. 负责任的AI: 缺乏标准化,深度伪造难被发现 1、对大语言模型负责任的健全和标准化评估严重缺乏 AI指数的新研究表明,负责任的AI报告严重缺乏标准化。 包括OpenAI、Google和Anthropic在内的领先开发人员主要针对不同的负责任的AI基准测试他们的模型。这种做法使系统地比较顶级AI模型的风险和局限性的努力变得复杂。 2、政治造假易产生、难被发现 政治深度伪造已经影响到世界各地的选举。近期研究表明,现有的AI深度伪造检测方法的准确率参差不齐。此外,像CounterCloud这样的新项目展示了AI如何轻松地创建和传播虚假内容。 3、研究人员发现大语言模型中更复杂的漏洞 以前,红队AI模型的大多数努力都集中在测试对人类直观有意义的对抗性提示上。今年,研究人员发现了让大语言模型表现出有害行为的不太明显的策略,比如要求模型无限重复随机单词。 4、AI风险是全球企业关注问题 一项关于负责任的AI的全球调查强调,企业最关心的AI问题包括隐私、安全、可靠性。调查显示,企业已经开始采取措施来降低这些风险。然而,在全球范围内,大多数公司迄今只减轻了这些风险的一部分。 5、大语言模型可能输出受版权保护的材料 许多研究人员已经表明,受欢迎的大语言模型的生成输出可能包含受版权保护的材料,比如《纽约时报》的节选或电影中的场景。这种输出是否构成侵犯版权正成为一个核心的法律问题。 6、AI开发者透明度得分低 新引入的基金会模型透明度指数显示,AI开发者缺乏透明度,特别是在训练数据和方法的披露方面。这种开放性的缺乏阻碍了进一步理解AI系统的稳健性和安全性。 7、极端的AI风险很难分析 在过去的一年里,AI学者和从业者之间出现了一场关于关注即时模型风险(如算法歧视)与潜在的长期存在威胁的实质性辩论。区分哪些主张是有科学依据的,应该为政策制定提供信息,已经变得具有挑战性。与存在威胁的理论性质形成对比的是,已经存在的短期风险的实际性质使这一困难更加复杂。 8、AI滥用事件数量持续上升 根据追踪与AI滥用相关事件的AI事件数据库,2023年报告了123起事件,比2022年增加了32.3%。自2013年以来,AI滥用事件增长了20多倍。一个值得注意的例子包括在网上广泛分享的由AI生成的泰勒·斯威夫特(Taylor Swift)露骨的深度伪造照片。 9、ChatGPT、图像生成模型需持续解决偏见问题 研究人员发现,ChatGPT对美国民主党和英国工党存在明显的政治偏见。这一发现引发了人们对该工具可能影响用户政治观点的担忧。 5个主流商用图像生成模型在年龄、种族、性别方面的平均偏见得分如下: 10、全球AI立法进程提速 全球立法程序中提到AI的次数几乎翻了一番,从2022年的1247次增加到2023年的2175次。每个大洲至少有1个国家在2023年讨论了AI,这突显了AI政策话语的真正全球影响力。 在过去的一年和五年里,美国与AI相关的法规数量显著增加。到2023年,AI相关法规从2016年的一项增加到25项。仅去年一年,AI相关法规总数就增长了56.3%。 发布AI法规的美国监管机构从2022年的17个增加到2023年的21个,在2023年首次颁布AI相关法规的新监管机构包括交通部、能源部和职业安全与健康管理局。 06. 结语:全球公众更加认识到AI 的潜在影响,也更加紧张 益普索(Ipsos)的纵向调查数据分析了全球对AI的态度,多伦多大学调查了公众对ChatGPT的看法,皮尤研究中心(Pew)调查了美国人对AI的态度。 一项调查显示,过去一年,认为AI将在未来三到五年内极大地影响他们生活的人的比例从60%上升到66%。此外,52%的人对AI产品和服务表示紧张,比2022年上升了13个百分点。皮尤研究中心数据显示,52%的美国人对AI感到担忧甚于兴奋,这一比例高于2022年的38%。 2022年,包括德国、荷兰、澳大利亚、比利时、加拿大和美国在内的几个西方发达国家,对AI产品和服务的态度最不乐观。从那以后,这些国家中承认AI好处的受访者比例都有所上升,其中荷兰的转变最为显著。 在益普索的一项调查中,37%的受访者认为AI会改善他们的工作。只有34%的人认为AI将促进经济发展,32%的人认为AI将改善就业市场。 在对AI改善生计潜力的看法上存在显著的人口差异,年轻一代普遍更为乐观。例如,59%的Z世代受访者认为AI将改善娱乐选择,而婴儿潮一代只有40%。此外,收入和受教育程度较高的人比收入和受教育程度较低的人更看好AI对娱乐、健康和经济的积极影响。 多伦多大学的一项国际调查显示,63%的受访者知道ChatGPT。在这些人中,大约一半的人每周至少使用一次ChatGPT。
电车还要降价,因为车企还没把造电池的吸干
和去年几乎一样的剧本,今年车市一开局,立马就开始了疯狂的价格战。 比亚迪率先动刀,秦 PLUS 直接降 2 万,到 7.98 万。要知道这台 10 万级的家轿,去年可是已经降过 1.4 万了。 在比亚迪开搞后,其他车企很快跟进。 同样去年刚降过 4 万的问界 M7 ,今年再降 2 万;阿维塔 12 上市才不到 5 个月,搞个 2024 款,降价 3.5 万;智界 S7 也是,去年年底发布,最近又二次上市,降价 2 万;腾势 N7 ,新款足足降了 6.2 万。 还有小鹏 P7 ,现在都卖到了 14 万你敢信? 这么看来,今年这波降价大军的阵势丝毫不比去年小。 去年汽车价格战之惨烈,大家都有目共睹。我们之前也有专门出一篇内容,说说车企是怎么把车子做便宜的。( 传送门 ) 只是谁能想到,今年新能源车是降的更猛,力度更大。而这批大降价,所有线索都指向了电车上最贵的零件——电池。 为了搞清楚电车怎么能降这么多,我们找了一圈电池行业人士来聊聊,里头有车企的采购人员,有电池厂的工程师,有供应商员工,还有一直研究电池行业的投资人士。 在和近十位从业者聊完之后,我发现原来还是香饽饽的电池行业,现在项目开发周期不断压缩,加班成了常态化,大家都被价格战卷到不行。 有人说他们现在的要求就是 “ 一个人干两个人的活 ” ,还有人形容现在动力电池行业是在上演一场 “ 大逃杀 ” 。 而且出乎意料,电池的降价幅度比我设想的还要大,更重要的是这轮极度的内卷还在继续,真没准,电车可能还会更便宜。 电池对电车的重要性不言而喻。电池是啥样的,直接决定了这车会卖多少钱。 一辆车上,根据电池包的大小,用的磷酸铁锂还是三元锂,电池成本都会有一定变化,但总的来说,电池包就能占到一辆车 40-60% 的成本。 所以,说买电车就是买电池,一点都不夸张。 而花在电池包上的钱,大头都拿来买了电芯。一堆电芯加起来,又能占到电池包 70-80% 左右的成本。我们常听到的碳酸锂,就是电芯的重要原料。 电芯是由四大主要材料组成:正极、负极、电解液和隔膜。这里头最贵的是正极材料,成本占比超过 50% ,它的主要原料就是碳酸锂。而成本占比约 15% 的电解液,它的主要原料六氟磷酸锂也会受到碳酸锂的影响。 因为这种关系,电池价格和碳酸锂的价格和息息相关。 一位负责采购电池的人士是这么比喻的:碳酸锂之于电池,就像是中国的猪肉价格之于 CPI ( 居民消费价格指数 )。 CPI 反映了物价,它本身是一个非常复杂的指标,但因为猪肉在 CPI 中的权重很大,所以物价涨没涨,咱老百姓就可以从猪肉价格的变化中知道一二。 同理,碳酸锂就是电池价格的晴雨表。想知道现在电池卖什么价,看看碳酸锂的供货价就行。 但就是这么重要的原料,我们也知道,过去几年的价格却来了个过山车。 最开始,碳酸锂价格不过 5 万元 / 吨,然后从 21 年下半年开始持续暴涨,从 5 万到 15 万再到 50 万,根本停不下来,直到 22 年底达到了前所未有的 60 万元 / 吨。 而到了高点之后,碳酸锂的价格掉头就来了个一路狂降, “ 跌跌不休 ” ,短短一年时间下降了 80% ,一度跌破了 10 万元。 碳酸锂的过山车,也就造成了锂电池价格的急起急落。 之所以会有这么剧烈的变化,一个重要的影响因素是电池产能。一开始电池市场供不应求,推高了原料价格,但后来上游纷纷扩产,电池包又卖不掉,原料成本也就跟着下降了。 早些年,新能源刚开始火起来的时候,电池厂就那么几家,车企压根没得选。到什么地步呢,电池厂作为一个乙方,话语权比甲方还大。 主机厂为了能买到电池,要先打钱给电池厂,而且得全款。电池厂那边叮的一声 “ 到账 1000 万 ” 之后,才会跟你谈这单生意。注意是开始谈,不是说东西立马给你,因为人家手里说不定还有更优质的客户,要先保证大金主的。 一位主机厂工程师告诉我,他们当时有个项目为了买电池,项目领导、部门总监连着去找供应商,都不管用,最后硬是靠集团副总登门拜访,才把电池要来了。 在汽车行业,几乎所有零件都是先交货再慢慢结账,有的主机厂还会对供应商的尾款一拖再拖。这样要先付钱再拿货的特例,恐怕也只有电池上能看到。 这种供需关系,也就造成了电池价格的飞升。 一位资深电池采购人士表示, “ 那时候涨价的不仅是碳酸锂,电池所需要的电解液、铜箔、铝箔等原料,供应商全在涨价,本来我们是季度或者半年才会调一次价,但他们追着我们,一个月就要动一次价格。 ” 当时价格涨得过于离谱, “ 最贵的时候,电池采购成本占到了一辆车的 90% ,就是面粉比面包还贵 ” 。 但也是在那几年,新能源车销量年年翻倍,行业一片欣欣向荣。 乘联会数据显示, 2020 年,全国新能源车销量是 111 万辆;2021 年,就变成了 299 万辆;到了 2022 年,已经是 568 万辆的规模。 大家一看这么大商机在,那还说啥,扩充产能呗。 一位电池厂的技术人员回忆起当时的状况: “ 那段时间,公司新建了好几个基地,我们部门的同事都在全国各地跑,上个月出差 A 省份,下个月 B 省份的新基地就要投产了,又要去那里。连着出差,每次地方都不一样。 ” 不仅电池厂在忙着新建产线,行业外的很多公司也在盯着这门新兴产业。 比如原来是做磷化工的企业,现在能和磷酸铁锂沾点边,转身就来分一杯羹。这就算了,还有做衣服的,卖水泥的,制化肥的,甚至是搞房地产的,也来往这个风口上蹭。 可是这么多玩家们猛扎进来后,新能源车销量并没有预期增长那么快,很快市场变成了供过于求,产能出现过剩。 根据中国汽车动力电池产业创新联盟的数据,去年中国动力电池累计装车量是 387.7GWh ,但累计销量有 616.3GWh ,刨开出口的 127.4GWh ,还剩 101.2GWh 的库存,多出来的这些差不多可以够 200 万辆车使用。 2023 年,中国一共卖了 774 万辆新能源车,有人预测,到 2025 年,中国新能源车销量能达到 1800 万台。这么多车,一台按需要 60kWh 电计算,一年就需要 1080GWh ,但是目前电池行业规划产能已经达到 4800GWh ,远超需求。 显然,当卖方市场变成了买方市场,电池降价也就成为必然。 一位电池供应商的销售告诉我们,去年下半年,很多二三线电池厂因为造了太多电芯卖不出去,都在低价抛售,行业内是一片 “ 电芯滞销,帮帮我们 ” 的哀嚎声音。 碳酸锂的价格回落,代表着面粉回到了它应有的价值。 而这两年,因为价格战的关系,车企对成本是极其敏感的,一分一毛都要给你抠出来。 原来他们是没办法,处处让着电池厂。现在电池的货源多了,价格便宜了,主机厂的话语权也回来了,自然而然,电池就成了降本的重点。 对于降本要怎么玩,主机厂可以说是轻车熟路。 首先一步是技术降本,就是在电池包的设计上,把 BOM 成本( Bill of Material ,指所需原材料、零部件、工具和人工等的成本总和 )降下来。 前面说了,电芯的材料成本已经下降了很多,而除了电芯外,电池包里还有很多结构材料、隔热材料、电气零件等,这些东西也不能放过。 一位供应商举例,电池包里的冷却系统,原来是用到挤压型材又大又重,现在会用冲压冷板,更薄更轻,用料更少。 像前段时间吵上热搜,是用铝线还是用铜线的问题。有车企工程师表示,特斯拉有在用铝线,他们现在也打算这么搞。 铝的导电性能没有铜那么好,但可以通过增大它的截面积来增加载流,达到同样的效果。而因为铝比铜便宜很多,这能省不少钱。 不仅有材料上的细抠,国产化替代也是屡试不爽的法子。 比如连接器,燃油车里发动机靠曲轴、连杆来传输动力,在电车里,连接器就充当了这个角色,一块电池包里头需要多到多种连接器。 有供应商和我说,以前高压连接器都得买国外企业的产品,一个就得一二百块钱,而且供货还不稳定。现在国内企业被培养起来后,五六十块就能搞定,价格直接砍半。 这些方案是在实现同等性能的基础上,把成本降了下来。而有的车企为了继续抠钱,还会选择适当降低原来的高标准。 有供应商告诉我们,他们之前在电芯和模组之间,还有电池包的上盖壳体,都会贴一层叫做 “ 云母纸 ” 的材料用来隔热,这个材料很薄,也就零点几毫米。 “ 后来因为客户要技术降本,我们就把云母纸取消,换成了便宜得多的泡棉。那泡棉的隔热性能肯定不如云母纸。 ” 另一位供应商举例,电池包有均温性的要求,即内部电芯温差要控制在一定范围内。 “ 原来我们可以做到温差控制只有 2 ℃,现在因为我在某些地方做了降本,温差控制变成了 2.5 ℃,就没有原来那么好了。 ” 这里需要说明一下,据我们了解,在电池行业,很多企业标准都是高于国标的。他们取消云母纸这类做法,其实是把之前的安全冗余拿掉,但即便这样,电池包的安全等级依然很高,也能够通过各种测试。 当然,技术降本只是一方面。主机厂为了达成降本目的,还有很多其他辅助手段。 一位头部电池厂员工表示,他们的工厂被要求降低人效,多的要被砍掉 55% 。 “ 人效可以理解为,比如说在工厂的某个工序,一天能产出几万颗电芯,这道工序投入多少人能有多少产出,里头有一个计算公式,每个工序都不太一样。砍掉 55% ,你可粗暴理解为,就是让一个人干两个人的活。 ” 而当原有供应商不给力,主机厂就会去外头捞点新供应商进来当鲶鱼。 一位车企人士是这么形容的:在找新供应商方面,主机厂就是个 “ 海王 ” ,成天在外头和人家眉来眼去的,只有对方有那么点意愿,就可以坐在一起谈一谈。 让新供应商把水搅浑,这都是惯用伎俩了,只是在电池行业稍有不同的是,因为燃油车市场在缩小,不少原来做传统零件的供应商,都非常想转型新能源。 电池包内很多零件的制造工艺,本来就和车上其他零件有相通性,比如原来做车身冲压件的供应商,稍微调一下,也能来做电池包的铝板结构件。 有几位电池厂人士都提到,有很多这样的供应商想进来,他们的目的也非常明确,就是要把坑占住,先进你的供应体系,再谈后面的事。 “ 所以他们会为了拿项目,报出一个非常低的价格,甚至说不赚钱也要把项目拿到。 ” 反正对于主机厂来说,这样的鲶鱼越来,我肯定越开心。而当手里的供应商多了之后,主机厂就可以整出更狠的招数。 一位电池供应商告诉我们,有家头部企业,在电池里的一个通用零件上,因为出货量很大,找了 7-8 家供应商来做。原来这个零件是半年、一年招一次标,现在是一个季度,甚至一个月就要招一次标。 招标搞这么勤快,其实就是为了压价。 “ 如果这个月有 5 家供应商达到要求了,那这个月订单就给这 5 家,其他几家这个月就没饭吃。这个要求说白了,主要就是价格。 ” 供应商为了要中标,只能拼命去降低自己的报价。 这位供应商进一步解释道: “ 其实现在那边的需求, 4 家供应商产能拉满就能满足,但它偏偏搞这么多人进来,让大家都吃不饱饭。 ” 之所以这些供应商会陪着这么玩,其实也是无可奈何。由于很多新玩家带来了富余的产能,让这些供应商不得不去舔着脸去低价拿订单。 “ 工厂设备都要算折旧费的,有订单在,至少设备、人员还能动起来。如果设备不开机,我只会亏得更多。 ” 所以,这些企业哪怕是赚不到钱,也要硬挺着生产。 而除了在量产项目上做文章,有不少主机厂选择了自研电池,自研电芯。在一些业内人士看来,搞清电芯的成本结构才是更大的目的。 一般来说,电芯对于主机厂是一个黑盒子零件,它只是买来用,至于里面是啥样的,并不太知道。 但现在大家也看到,很多车企都说自己要做电池。 对于车企需不需要做电池,行内人的看法并不相同,但有一个共同的观点是:自研这一步,对于搞懂电芯这个黑盒子零件里的成本构成,肯定是有帮助的。 一位车企人士说的更直接:这是车企不想再被供应商忽悠了。 但不管怎么看,电池制造的上下游分工已经很明确,是个很成熟的产业链,肯定不会是所有的车企都适合自研电池。 这方面,一位研究电池产业的投资人士是这样判断的: “ 根据我们的理解,车企进入电池研发领域最好的时机是 8-10 年前。 ” 巧了吗不是,国内还真有一位车企是这样的,送分题:___。 正是靠着这些材料降本、技术更新以及供应链上的各种小动作,电池的成本下降得非常明显。 有多位业内人士都表示,现在动力电池的价格,相较于之前高点,已经是便宜了一半。 前段时间, 36 氪报道过,宁德时代、比亚迪在强推降本,动力电池(磷酸铁锂 )的价格有望下降到 0.3 元 /Wh 。 这是什么概念呢?一辆车 60 度电,光电芯成本是 1.8 万,再把辅材、人工成本杂七杂八的都加起来,电池包成本应该也不会超过 3 万元。 作个不严谨的对比,我们看下在售的比亚迪秦 PLUS EV 车型,用了磷酸铁锂 57.6 度电的车型,官方指导价是 11.98 万。 关于 0.3 元 /Wh 这个价格,好几位业内人士向我们证实,目前已经能达到这个水平。还有两位直接告诉我们,这还没到头,电池价格还能比这个更低。 如果电池价格还能往下降,那就意味着电车可以做得更便宜,这就有搞头了呀。 在燃油车时代,欧美消费者可以用自己负担得起的价格,挑一辆自己喜欢的车,而中国消费者要付出高得多的价格才能买到。 比如宝马 M3 ,在德国的起售价是 7.39 万欧元,大概是 56 万人民币,在美国也差不多, 7.6 万美元,大概 55 万人民币。 而它在中国的指导价是 86 万多,差了有 30 万。 但在电车时代,因为中国电池产业足够扎实,制造成本更低。 电车上中外之间的差价,已经有了反转的趋势。大众 ID 系列在中国比老家德国便宜得多,就是最好的证明。 设想一下,电车价格更便宜,比方说 20 来万的电车再降个 2-3 万,小米 SU7 不到 20 万,极氪 001 顶配不到 30 万,那咱老百姓简直不要太开心好吧。 要知道五六年前,还是在有国补的情况下,大家去选电车,怎么也得掏个 20 来万,才能买个像样的产品。现在补贴早没了,车价也降了,我们买到手的产品反而更好。 说到底,还是因为我们的电池产业链成熟了。 只能说电池厂商们苦了,我们爽了。所以大伙儿别急,以后花同样的钱,只会有更香的车。 撰文:白日梦 编辑:脖子右拧 & 面线 & 大饼 封面:焕妍
“天下第一”的游戏出了个抽卡手游,结果翻大车?
完美世界联合日本游戏厂商 ATLUS,制作的《 女神异闻录 5:夜幕魅影 》,终于公测了。 作为游戏圈大名鼎鼎的《 女神异闻录 5 》的手游/PC 双端衍生抽卡游戏,P5X 公测前的宣传堪称铺天盖地。 这几天,小发被它的短信、电话、开屏和贴片广告轮番轰炸。 不过对于这游戏,我一开始是不太看好的。 小发算是个新时代 P 系列粉丝,买过目黑将司的 OTS CD,副岛成记的设定集,自 P3P 开始每代作品都通关过至少一遍。 但这两年 ATLUS 频繁消费 IP,搞了各种联动,推出各种骗钱的衍生作。 导致我现在听说喜欢的游戏系列,又被改成了氪金抽卡手游,只剩一脸嫌弃。 可抱着试一试的心态,小发还是玩了玩,并狠狠肝了一个周末。 现在主角 36 级,第一个迷宫探索 100%,正在过第二章主线,也算是体验了超过 80% 的现有内容。 但目前它给我的感觉,却相当纠结且复杂。 我对这游戏甚至没法给一个黑白分明的总结性评价,可以说是又爱又恨。 所以,对 P5X 感兴趣的差友不妨听我聊聊,应该对你了解这款游戏有点帮助。 首先聊聊 P5,给没玩过的差友简单科普下。 这款女神异闻录系列的第五代正统作品,是最早登录于 PS3 平台的日式 RPG,将有日历推进的校园日常生活,与打败大反派的概念相融合,即有 GalGame 的元素,又有爽快的回合制战斗。 尤其是它风格鲜明的美术和 UI,以及质量顶中顶的配乐编曲,一句话概括就是潮的出水,相当抓人眼球。 游戏的剧情则属于中二王道,讲了一群高中生化身怪盗团,通过“ 偷心 ”,清除反派内心的邪恶欲望,从而拯救世界的故事。 因为质量上乘,“ P5 天下第一 ”这句话也一直被 RPG 爱好者挂在嘴边。 总之,P5 算是游戏界的白月光,人气居高不下,动漫和二创也层出不穷。 配图为 P5 加强版 P5R 而这次的 P5X,虽然是完美世界和 ATLUS( 女神异闻录的开发商 )联手基于 P5 开发。 但它几乎就是把 P5 原版复制粘贴了一遍。 无论是地图、战斗、养成,还是音乐,都几乎没有区别。 一样的主题曲,一样的 UI,一样的东京实景。 除了我头顶上的那两个广告牌 尽管还原度确实高,但甭管是人设还是开始的剧情,都让小发提不起什么兴趣。 新主角 WONDER 的形象,依然是原画师副岛成记的设计。 但在我看来,论魅力值完全不能和雨宫莲( Joker )相比。 左 WONDER 右 JOKER 性格人设方面,他也像是活在 Joker 的阴影里,差别不大。 唯一的不同,可能就是 Joker 只能睡个咖啡厅的破阁楼。 而新主角是个东京富哥,一个人住一整栋。 到了主角团的其他成员,貌似又换成了其他设计师。 设计质量参差不齐,风格之间也不再统一。 比如主角团里的新井素羽,穿上战斗服的形象属实辣眼睛。 一身黄带个红眼镜,而且立绘里的眼镜好像还有点歪,显得很智慧的样子。 P5X 的吉祥物设计 小发也对不上电波 可另一个中国的四川妹子李瑶铃,就还挺可爱的,迷宫里的怪盗形象也不错。 内容方面,P5X 也和原作一样,分为了主线剧情和迷宫探索。 但二者的背景设定相反,在 P5X 的世界里,人们渐渐消失了各种欲望。 这导致社会变得冷漠,很多人失去了生活的目标,还有人成为了怪人般的“ 魅影 ”,而主角团则是帮人们夺回欲望。 其实这个设定还可以,也比较有发挥空间。 但 P5X 开头的剧情让人昏昏欲睡,注水对话相当多,让小发实在忍不住快进。 直到第一个反派出现,居然还是个地铁肘击男。 看得出来,编剧是想讽刺之前真实发生的事件。 就是日本曾有一种男性,会在高峰期地铁故意撞女性,以身体接触行为满足自己的恶趣味。 但游戏里的这个肘击男,不知道是不是吃了大力。 一下就把主角的女同学原地撞飞,从月台撞到了轨道里。 看到这一幕小发甚至愣了一会,感觉物理学都不存在了。 然后的剧情走向,也是和 P5 的第一个 BOSS 鸭志田有点类似,但咖位和罪行却显得有点不够劲儿。 剧情中,这个社畜肘击男以前是个挺出名的职业棒球手,后来自我放弃,失去了奋斗的欲望,走向堕落。 所犯的罪过,也只是去地铁肘人,一股小家子气。 总之整个开头的单机部分体验,给我玩的哈欠一个接一个。 到这还没完,因为剩下的就是抽卡类手游的标配系统了。 日常任务、通行证、体力限制、抽角色等元素,P5X 全安排一遍。 但有些体验却很割裂,比如抽角色,剧情没多久就可以抽。 可这些角色的相关剧情还没推进到,却莫名可以提前加入阵容里。 而游戏给出的解答,是有个“ 偶像怪盗 ”设定,可以理解为这些角色都是从某个平行空间中来帮助主角的。 听上去就有点牵强,像是为了抽卡特意编了个借口。 当然上面的都不是重点,因为这游戏还直接把米哈游的养成系统搬过来了。 “ 命座、专武、圣遗物 ”,P5X 一个不落。 什么 50 抽新人自选五星,80 抽大保底,5 星基础出货率 0.8%。 然后抽出 5 星还有 50% 概率,才是第一期限定的 Joker 雨宫莲。 就算抽到 Joker,也还要继续在池子里捞一把五星武器,才是完全体。 这一套连招下来,我还能说什么。 而初期没抽到什么 5 星角色的小发,只能靠保底和自选打一打副本。 最恶搞的是,开服前官方还宣传上线 60 抽,首周免费 260 抽。 结果奖励都在副本和任务里,几乎全是要肝出来的。 以及主线卡等级,也让人挺难顶的。 只要主角等级不够,后续关卡就不开放。 想提升等级还要刷副本,可那少的可怜的体力限制,直接给我干回贤者状态。 再加上这游戏的优化堪称灾难,在手机和 PC 端的发烫现象都很严重。 明明画面规格并不高,却无论哪种画质设置都烫。 而且手机端触屏操作蹩脚,常有卡顿。 前期主线迷宫的探索质量本来就一般,综合下来就更让人烦躁。 总之,P5X 给我的初印象,直接跌入谷底。 再看看 TapTap 上的评分,我会心一笑。 心想果然辣鸡,毁我 P5。 但是。 这里小发要开始转折了。 就在我强忍着无聊,打到第一个 BOSS 的后段,发出预告信后,游戏质量突然又有点回升。 剧情里我慢慢来了感觉,仿佛回到了当年第一次玩 P5 的时候。 因为剧情脉络逐渐清晰,各种短片与对话的质量也莫名提高。 再加上一直开自动战斗无脑挂机的我,被 BOSS 几下就团灭了。 这我才反应过来,BOSS 战攻高血量奇厚,还有各种机制,前期是完全没法无脑过的。 于是小发研究阵容搭配,试了好几次终于打通。 最后看着主角团第一次让 BOSS 改邪归正,偷走秘宝。 我居然,有点热血了。 然后,这游戏终于开始发力。 和原版不同,P5X 通关一个迷宫后,非但不会无法进入,还会彻底解开全地图以供二次探索。 主线所能到达的区域,可能仅占全地图内容的 1/5。 重新探索时,迷宫的质量也比原来高很多。 各种机关解谜,绕来绕去的大型迷宫,让我到处找钥匙开门,击败同样有挑战性的精英怪,我也不断更换阵容搭配,研究机制与打法。。。 不是哥们,真挺好玩。 还是 P5 原汁原味的那种好玩。 而且,至少在刚开服这段时间,我打了这么多精英怪和副本发现,5 星角色虽然有不少优势,但如果只是渡过前期,甚至可以不抽卡,只上剧情给的角色。 因为 P5X 里最强的角色其实就是固定的主角,以及辅助治疗角色。 5 星输出,顶多是让你打得快一点罢了。 所以抽卡抽不到,对于主线任务来说,也还好。 给主角合成各种强力面具 依然很关键 毕竟 P5X 几乎也是把 P5 的战斗系统全照搬了过来,没简化太多。 所以击败敌人需要各种属性克制、考虑释放时机,而属性共有十一种。 正确的打法,比一个五星角色要重要的多。 只要打出敌人的弱点,利用总攻击高额输出,基本就够用了。 总之在养成和战斗策略上,P5X 因为还原,并没有失去原版的一些乐趣。 这套玩法系统放到回合制手游里,真没有能打的。 并且这游戏的剧情到了第二章,也慢慢变得好看了起来。 虽然谈不上多精彩,但也是 P 味十足,还有各种动画穿插。 反应过来时,我发现自己已经好久没有点过跳过了。 第二个 BOSS 讽刺一些探店吃播网红 再加上各种原版里的日常玩法,P5X 同样塞进了游戏里。 读书、打工、上课、社团活动,应有尽有。 还增加了各种原版的后日谈,可以在勒布朗咖啡店和原作主角团互动,并在游戏里加了不少致敬小彩蛋。 玩到后面,发现内容量也很足,需要好好肝一肝。 对我这个老玩家来说,就。。。 还真感觉挺不错的。。。 虽然系列最核心的塔罗牌社群 coop 关系,和面具融合系统被魔改了( 原作的两种玩法,一个是 Gal,一个是培育养成 )。 时间流动也不再有固定日期,只有简单的昨天今天明天( 原作里有日历推进主线 )。 但想想,放在手游里,这些改动也算是种妥协。 解锁社群等级 给点素材和钻石 总之,如果是 P5 粉丝,其实玩玩也未尝不可。 而且官方几乎一天发一次补偿,每个问题好像也有意解决。 像是最头疼的优化问题,说是要改善了; 开服福利少,就再补一点; 精英战太难打,干脆下调些难度。 这让我想接着喷它,也难免产生点恻隐之心。 当然如果继续发热还是要喷 现在回看一下这游戏,只能说制作团队确实有个把 P5 搬到手机上,做个真正优秀的单机手游的想法,也并非单纯的蹭 IP。 但奈何ATLUS 和完美世界,实在是能力有限。 不仅要还原不那么好上手,会大批劝退新人的 P5 战斗/日常系统,还要塞进去个人人必喷的氪金抽卡,开局评分血崩也正常。 这种纯机制类的精英关卡 就很有单机玩法的策略感 该夸的夸该骂的骂,我觉得没什么问题。 因为玩到后面,这个慢热的 P5X 确实给了我点惊喜。 听着 P5 熟悉的音乐,在涩谷街头和四轩茶屋小巷,跟 NPC 做做支线,解锁一下新的社群剧情。 至少在 P6 出来之前,我还挺期待这游戏后续更新的。 不过,要想继续更新高质量的迷宫和剧情,可不是个小工程。 谁也不知道后续这游戏会不会摆烂,亦或是因为营收问题烂尾。 因为目前主线暂定一共 7 个大 BOSS,现在第二个都还没全做完。 所以推进到第二章后期不少人会卡关,这也是官方有意在控制玩家进度。 不过咋说呢,还是希望他们能做好吧。 毕竟 P5 无论是玩法、音乐还是美术风格,亦或是这种高中生拯救世界的中二设定,就算在主机平台都称得上个“ 天下第一 ”。 能把接近原版的体验放手机上,跟那些流水线二游相比,真不在一个纬度。 虽然 P5X 能让女神异闻录更出圈,这游戏也天然地适合做成抽卡。 可归根结底,日式回合制 RPG 现在终究是小众品类,难说能多火。 所以 P5X 以后到底会变成啥样,小发还真没有多乐观。。。 只希望策划别把抽卡玩脱了,做好平衡性,至少让人人都能通个主线吧。 撰文:赤膊朋克 编辑:莽山烙铁头 封面:萱萱
特斯拉开启大规模裁员,本田推出新品牌“烨”,苹果新机或容量翻倍价格不变,华夏芯被申请破产清算,这就是今天的其他大新闻
今天是4月16日 农历三月初八 今天举办了个 2024 百度 Create AI 开发者大会 李彦宏开会的时候表示 在当今的大模型生态下 开源模型会越来越落后 。。。 下面是今天的其他大新闻 # 特斯拉开启大规模裁员 ( IT 之家 )汽车博主 @孙少军09 、@胖虎Shawn 今日声称,特斯拉已开始与门店沟通裁员名单,赔偿标准为 N+3,“ 基本每家店都有人被裁 ”。特斯拉这次大范围裁员据悉还波及上海工厂。 另据“ 汽车公社 ”报道,上海浦东临港特斯拉工厂的员工们已经收到了官方的邮件。今日早些时候另有知情人士表示,特斯拉中国这次裁员比例远不止马斯克说的 10%,销售部门是裁员重灾区。 知情人士表示,此次裁员有的部门将优化 30%~40%,个别部门优化 50%。其他部门普遍在 20%,补偿从 N+1 到 N+3,当天谈完即走就是 N+3。 :什么裁员?这不是发年终奖吗。 # 本田推出全新品牌“ 烨 ” ( IT 之家 )4 月 16 日消息,在本田 Honda 中国全新电动品牌发布会上,本田公布了为中国内地用户需求打造的“ 烨 ”品牌。 同时发布了三款新车 —— 将于 2025 年量产的“ 烨 GT ”、将于今年年底上市的“ 烨 P7 ”和“ 烨 S7 ”。据介绍,P7 将由广汽本田投产,S7 则由东风本田投产,年底上市。 :智界和小鹏或成最大赢家。 # iPhone 16 Pro 或容量翻倍价格不变 消息源“ LeaksApplePro ”近日发布推文,曝料称苹果今年 iPhone 16 Pro 起步存储为 256GB,且售价可能维持 999 美元(国内起售价为 7999 元)不变。 苹果 iPhone 15 Pro 机型起步存储为 128GB,而 iPhone 15 Pro Max 的起步存储为 256GB,而今年推出的 iPhone 16 Pro 将拉到同一水平线上,均从 256GB 起步。 报道称此举能够进一步统一苹果的 iPhone Pro 系列,除了尺寸差异之外,包括相机、存储方面保持相同规格。目前尚不清楚苹果是否因此提价,不过该消息源认为可能性并不大,应该会继续维持 999 美元。 :四舍五入,算不算降价一千块? # 华夏芯被申请破产清算 4 月 16 日消息,全国企业破产重整案件信息网显示,北京市第一中级人民法院裁定受理西安九步坊企业管理合伙企业对华夏芯( 北京 )通用处理器技术有限公司( 以下简称:华夏芯 )申请破产清算一案。 据悉,华夏芯号称拥有完全自主知识产权的 CPU、DSP、GPU 和 AI 处理器 IP。而目前,华夏芯存在多条自身风险,包括失信被执行人、限制消费令、被执行人、股权冻结、破产案件等多种类型。 :看来还是龙芯更靠谱。
索尼 PS5 Pro 或年底发布,开发者已收到适配通知
距离索尼发布 PS5 已经过去三年多了,其全球销量也已经达到了惊人的四千多万台。现在,它的升级款有新消息了。有爆料称今年 11 月份,会正式与用户见面。 这款游戏主机将在 PS5 的基础上大幅改进,可能会命名为「PS5 Pro」,并将支持全新的超分辨率技术 —— PlayStation Spectral Super Resolution(PSSR)。 ▲ PS5 Pro 概念图,图片来源:Technizo 据 The Verge 报道,最近部分开发者已经收到索尼的通知,要求改进他们的游戏以适配即将推出的新品,重点是对光线追踪进行支持和改进。 在给开发者的通知文件中,索尼提及了一些 PS5 Pro 的具体内容。索尼称 PS5 Pro 的 GPU 将获得提升,并使用了更快的内存。 PS5 Pro 上的 GPU 渲染将会「比标准版 PS5 快约 45%」。索尼还在 PS5 Pro 中使用了「更强大的光线追踪架构」,其速度比普通 PS5 快了三倍。 对于使用光线追踪的游戏场景,PS5 Pro 的渲染速度将得到大幅提升,在某些游戏中还可以达到更高的分辨率和帧率。 2023 年初,据 Key to Gaming 的报道,PS5 Pro 的内部代号为「Trinity」,搭载的 SoC 对应代号为「Viola」,遵循了索尼使用《黑客帝国》人物名字作为代号的做法。相较于 PS5,其主要改进目标是优化 4K 分辨率下的游戏帧率、适配 8K 分辨率的新「性能模式」。 此前,Youtube 频道「Moore’s Law is Dead」在视频中公布了一份泄漏配置,称 PS5 Pro 将搭载 AMD 定制八核 Zen2 CPU,主频可能低于 4.0 GHz。 GPU 部分则提升巨大,升级为拥有 30 个 WGP / 60 个 CU 的 RDNA 3 架构芯片,核心频率介于 2500 – 2800 MHz,同时搭配速率为 18Gbps 的 GDDR6 显存,容量为 16GB。 内存方面,PS5 Pro 的内存读写速度达到了 576GB/s,相较于 PS5 的 448GB/s 提高了 28%。索尼表示,由于 PS5 Pro 上的内存系统效率更高,「带宽增益可能会超过 28%」。 在 PS 平台上,游戏一直无法利用完整的内存空间。在 PS5 上运行游戏时,只能使用固定的 12.5GB 内存。但现在,索尼进一步释放了系统内存的使用权限,开发者可以获得额外的 1.2GB 内存分配,游戏可使用的总内存达到了 13.7GB。 针对游戏画质,各家硬件厂商都曾提出过自家的超分辨率解决方案 。英伟达拥有「深度学习超采样技术」(DLSS), AMD 则推出了「超级分辨率锐画技术」(FSR)。索尼计划对这两种现有超分辨率技术进行升级,PS5 Pro 的硬件调整也是在为此做准备。 ▲ 英伟达 DLSS 技术,图片来源:英伟达官网 PS5 Pro 构建了新的「机器学习定制架构」,支持 300 TOPS 的 8 位神经网络计算。索尼称其「输入与 DLSS 或 FSR 非常相似」,并能全面支持 HDR。 这一技术目前还在开发阶段。索尼表示,将 1080p 图像超分辨率到 4K,将会有大约 2 毫秒的延迟。其正在努力支持 8K 分辨率,并在未来不断改善延迟。 所有的这些升级,都是为了优化光线追踪效果和游戏画质。同时,索尼也鼓励开发者积极使用新技术。如果开发者通过适配,为游戏「带来了显著的增强效果」,就可以在游戏宣发时使用「Trinity 增强」或「PS5 Pro 增强」标签。 早前有一份文件中写道:「Trinity 是 PlayStation 5 的高端版本。」这意味着在 PS5 Pro 发布后,索尼将继续销售标准版 PS5,而不是像之前一样直接取代前代。 未来 PS 平台的游戏上架后,将会有一个同时支持 PS5 和 PS5 Pro 的安装包,开发者也无需针对不同机型分别开发。对于已有的旧款游戏,新款安装包还可以直接在旧版本上迭代,以便获得更好的优化。 关于 PS5 Pro 的具体发售日期还依旧不确定,不过根据泄漏文件来看,索尼大概率会在今年 11 月进行发布。爱范儿将继续关注,并带来最新报道。
一年卖出100万台,全景相机到底有什么魔力?
马上五一了,大家有没有选好自己的旅行目的地? 托尼我算是发现了,越到这种假期,公司的设备就越紧张,无人机、运动相机、稳定器没得特别快,甚至有人提前两个月就开始预定了。。。 谁出去玩,不卷一下朋友圈啊。。。曾经在质朴的年代,随便发点风景照就一堆人点赞,但现在,没点活还真不行了。 而且现在,公司里被抢的设备又多了一种 —— 全景相机。甚至不在节假日,公司总也有人在借用。 全景相机本身虽然不是新鲜产品,但如果你看过用它拍出来的视频,你就能体会到那种沉浸感和视觉冲击力。 比如这种短视频常见的滑雪视频,明明旁边没有摄影师,但就是能拍出稳如老狗的精彩画面。。。 或者,你可能看过那些摩托骑行视频,全方位无死角的那种,骑帅不骑快,头盔一戴谁也不爱。 那为什么一定要用全景相机? 来,咱们大家一起来脑补这么个画面哈:你正在以 40 迈的速度飞驰在雪地上,你感觉周边的景色美爆了,自己的姿态帅炸了。 这要是不拍下来,可就太对不起自己的七天年假了! 但此时,你光是维持住身体的姿态就已经很费力了,别说看一眼手机里的取景框了,就是把手机握稳都不太可能。 恨啊,自己的风姿无人欣赏。 悔啊,要是有个滑雪高手外加摄影高手跟拍该多好。。。 这时候,全景相机来拯救你了—— “ 既然顾不上怎么拍,那先把所有的画面都拍下来,等完事之后重新编辑选择取景不就好了? ” 只要我什么画面都没错过,也就不用担心没拍好或者没拍上的问题了 ~ Bingo !全景相机就是这么个神奇玩意儿,它能把镜头上下左右 360 °范围内的所有画面都收在里面,然后你可以选取任意你喜欢的角度的画面截出来。。。 我见过身边人有人用全景相机录自己打羽毛球的,有人带全景相机去潜水的,而且还有人上下班骑车的时候,也愿意放个全景相机当做行车记录仪。。。 毕竟录得全啊,真要遇到啥事儿了还能帮你保个底。。。 甚至还有一些 UP 主,都用上了全景相机拍日常的 vlog 。 这里用 B 站 UP 主 @ 陈抱一的话来说就是,只需要一台手机搭配全景相机,你需要担心的不是缺素材,你只会觉得素材太多了。。。 如果看到这儿,你迫不及待想要拥有这么一台增加生活趣味的全景相机,那么你绝对绕不开一个名字。。。 对,就是前面提到的,常年屠榜各种全景相机榜单, AKA 托尼的老朋友 —— 影石 Insta360 ~ Insta360 年年的新品,托尼都是第一时间拿到,今年也不例外。。。 这不,最新款 Insta360 X4 如约而至,而且我已经提前找公司预定了它今年五一的空档,没有人比我手速更快哈哈 ~ 看看 X4 标志性的鱼眼镜头,就知道这拍摄能力绝对不一般。 虽然看上去有点呆呆的,但也正是这种独特的设计,让全景相机可以 360 度无死角捕捉到所有的画面,实现先拍摄再构图,甚至能帮你把自拍杆藏起来。 而且,今年 X4 有一个我特别看重的提升,就是今年它把最高分辨率提高到了 8K ! 更高的分辨率,就意味着视频画质更高,后期剪辑的空间也会更大。 上一代 5.7K 的最高分辨率说实话其实也挺厉害了,但是吧,这 5.7K 是要分配给整个全景画面的,所以最终截取一部分画面后,单看下来没那么高清。 但现在 8K 的分辨率下,画面就很够用了。 如果你用不到那么高的分辨率,那么其他模式的帧率也比上代提高了,这个也挺有用。 我猜这个新款的镜头和画面处理芯片都升级了,所以画面上才好了这么多。 对了,我们拿到这个设备也不少时候了,如果有人好奇我们拿这个产品拍了怎么样炫酷画面,可以看看咱在 B 站差评硬件部上的这个视频。 点击图片,查看视频 然后另一个使用者最头疼的,全景画面的剪辑问题,这一代也有了特别大的提升。 以往大家都觉得全景画面剪辑难,因为它不是一个简单的平面,而是要通过后期构图来选择自己想要的画面,这就需要大家需要提升自己的空间想象力来剪辑。 影石 Insta360 也很清楚这件事,所以他们在新版的 Insta360 App 里做了个特别容易上手的快剪功能。 这个功能专门针对手机操作做了优化,光是取景就有划动屏幕、重力感应,或者虚拟摇杆这三种方式。 我特别推荐大家试试虚拟摇杆,手感就跟在玩原神一样,特好上手。。。 Insta360 启动! 至于续航焦虑嘛。。。影石 Insta360 这次换上了一块更大的电池( 2280mAh ),而且新的 AI 芯片也让功耗更低了,综合下来能录制两个多小时的 5.7K 视频。。。 还有之前有很多人说凸起的镜头容易磨损,所以这次他们还做了一个可拆卸的镜头保护镜,主打一个听劝。。。 也就是说,影石 Insta360 这次把托尼觉得最需要改进的几个痛点都给改了。 所以如果说之前的 Insta360 X3 全景运动相机的体验可以称之为 “ 把全景视频玩明白了 ” ,那么这次发布的 Insta360 X4 就是把全景视频玩到了极致。 之前一直有外行人担心,说全景相机这么小众的东西,会不会做着做着公司就没了,售后怎么办。。。 那我觉得大家想多了,上一代 Insta360 X3 上市一年就卖了 100 万台,简直就是在闷声发大财。。。 不仅如此,我在网上看到过滑滑板的,录节目的,拍车辆的,反正只要是各种角度清奇到连摄影师都找不到在哪的画面,基本上就是全景相机没跑了。 要想一款又小巧又能无死角捕捉所有画面的相机,确实找不到比 Insta360 更好更有趣更简单的替代品了。。。 也因为这种独特的记录方式,很多人把记录生活的设备换成了全景相机,从骑行到露营,从 Citywalk 再到旅行,拍摄全景视频已经成为了一种生活方式。 其实到了这里,有的差友应该已经发现了,很多人真正想要的不只是一部相机,而是能够拍出最潮流的内容,并以最快的速度分享到社交媒体的设备。 这种社交裂变,其实源源不断的给 Insta360 带来新的用户,而这些新用户又像种子一样把它带到更多人身边。。。 说回来,影石 Insta360 这家公司也挺有意思。 我估计知道影石 Insta360 的人有很多,但是知道这家公司最开始并非全景运动相机起家,而是从专业级 VR 拍摄设备开始的人,托尼敢打赌并不算多。 追求前沿、敢于创新,其实也是影石 Insta360 这家公司的缩影。 如果你去翻看 Insta360 历代的产品,那么你就会发现因为不光全景相机,他们总是喜欢做出让人意想不到的产品,比如拇指相机 Go 3 。 它最大的亮点,就是可以把镜头单独拿出来用,体积相当小巧轻便,而且还支持磁吸。 再往前还有一个模块化运动相机 One R ,从形态上你就知道它有多么吸引我这种直男了,它可一度是我的梦中情机。。。 这台运动相机用起来就跟搭积木似的,镜头等配件都可以更换,比如全景镜头或者徕卡一英寸镜头等等。 还有前段时间推出的运动相机 Ace Pro ,虽然长得和传统运动相机差不多,但是它有一个翻转屏。。。 而且它的画质在运动相机里面可以说是天花板了,尤其是在夜间画质等极限场景,连老大哥 GoPro 看了都汗流浃背。。。 这些也是影石 Insta360 在向外界传递一个信息:我的相机不仅可以用在运动场景,它也可以胜任日常拍摄和记录生活。 因为全景相机发展到现在,最出圈的固然是那些刺激又好看的运动视频,但最需要全景相机的场景,其实是每个人的普通生活。 不少人都很喜欢翻看以前的童年相册,然后感受这种往事瞬间涌上心头的感觉。 如果没有这些胶卷作为记忆的载体,那么人们没过多久可能就会忘记这些事情。。。 当然,为了保留记忆,这些载体也在不断变化,从胶卷到 DV 机再到数码相机,再到现在大家熟悉的手机摄影。 而下一个最适合记录和保存记忆的载体,可能会是记录身边一切的全景相机。 在全景视频的世界里,你无意之间按下的录制键,却能记录下远远不止 4 : 3 比例的画面,而是一个完整的空间。 全景相机的记录没有取景框的限制,你可以截取其中最精彩的部分秀到社交媒体,也可以选择把这个没有边界限制的全景回忆录留给自己。 比如骑车时头顶的阳光穿透树叶,你专注于路面,但相机都帮你记下来了。 或者是遛狗的时候,怎么拽都不走的尴尬时刻。 甚至是你打方向盘时,不曾注意到疯狂乱跳的 G 值。。。 这些都是我们随手拍的,按下录制键之后就什么都不用管了,但这份全景回忆录,反而可能是我们拍过的视频里最独特的那一档。 而且 VR 也在不断发展,苹果的 Vision Pro 现在已经可以观看全景视频了,人们将不会错过回忆中的任何一个角落。。 就像哔哩哔哩 UP 主 @橙红Iris 的视频里提到的,婚礼现场人们的目光都在中央,但旋转全景视频的画面,就可以见到镜头后面抹眼泪的母亲。 那么也许,给 VR 里载入已经录好的全景画面,将成为未来人们重温回忆的主流方式( 希望影石看到这里赶紧努努力! )。。。 到那时,你一定会庆幸自己曾用全景相机,把最精彩的画面握在手中。 撰文:百威 编辑:结界 摄影:若轩 美编:焕妍
AI数据荒下的创业众生相:盗用GPT-4生成数据训练模型,引发投资人担忧
编译 | 长颈鹿 编辑 | 李水青 智东西4月16日消息,据外媒The Information 4月15日报道,在AI领域,许多初创公司开发的聊天机器人实际上是建立在OpenAI等大型企业所提供的数据和技术基础之上的。这些低成本的服务能够在某些程度上模仿GPT-4、Llama的性能,但这种做法可能违反了这些科技强企的使用要求。不仅如此,这种低成本的模仿还有可能对AI强企的市场份额和收入产生威胁。 AI巨头们自身也难逃版权纠纷,一些未经许可的数据使用引发了较多争议和诉讼。但好在行业整体版权意识有所转势,OpenAI和谷歌带头与出版商和网站达成了数据的授权协议。 此外,在当下如此复杂的市场竞争中,投资者们也有着自己的考量。他们即希望看到AI行业的快速进步,又不愿支持初创公司在技术研发中出现“偷工减料”的行为。因为他们担心这些违反规则的行为可能会对初创公司的长期可持续性和声誉造成负面影响。 一、AI公司创业新路子:用GPT-4生成内容训练模型 开发者利用OpenAI最先进的模型GPT-4作为资源,来帮助加速他们的研究和开发过程。他们会向模型提问,来获得有关特定问题的洞见和建议。比如 :这行代码有什么问题?然后利用答案来改进他们自己的模型。 一位帮助开发者构建对话式AI的创始人估计,他的客户中约有一半从OpenAI的GPT-4或Anthropic的Claude模型中生成了一些数据,并用这些数据改进了自己的模型。 许多开发者无需从头开始训练模型。小规模模型的开发过程通常是基于免费提供的流行开源模型,如Meta或Mistral AI的开源模型。然后,他们再通过加入OpenAI模型的答案,使这些小规模模型得到显著的改进。 对于某些公司来说,违反明文规定或潜规则的风险可能是值得的。在竞争激烈的生成式AI领域,获取高质量数据用于训练或完善模型至关重要。任何一家AI初创企业都了解如果缺乏数据来源用于训练,就会落后于人。 即使是大型科技公司,也无法抵挡这样“便利的”诱惑。据《泰晤士报》报道,这方面的例子包括谷歌转录YouTube视频用于训练其AI模型以及Meta雇用非洲承包商总结受版权保护的书籍来训练AI模型。此外,彭博社报道了一则Adobe公司的消息,他们利用初创公司Midjourney提供的AI生成的照片训练自己的图像生成软件Firefly。 据The Information报道,去年,谷歌的一位高级AI工程师在对该公司使用OpenAI的ChatGPT数据来训练谷歌自己的模型表示担忧后,辞职以示抗议。 但有些开发者不愿主动承认自己对于开源模型的使用情况。一旦这种行为被公之于众时,他们的公司就会陷入尴尬的局面。例如巴黎的Mistral AI和北京的零一万物,在信息泄露事件之后,才不得不承认他们确实使用了Meta的开源模型Llama 2作为自己产品开发的基础。 随着越来越多的公司开发出源于其他模型的模型,它们可能会变得难以区分。这可能会蚕食OpenAI等领先企业的竞争优势,当顾客选择更便宜、更方便的模型,而不是最先进、最昂贵的模型时,它们在价格上将展开竞争。 二、阿尔特曼放宽ChatGPT使用限制,OpenAI此前深陷版权纠纷 OpenAI和Anthropic、谷歌等其他领先的AI公司一样,在技术上禁止这种行为。尽管如此,OpenAI首席执行官山姆·阿尔特曼(Sam Altman)在一次会议上与初创企业创始人的对话中提到,小型企业创始人可以在一定程度上使用OpenAI的技术。 虽然阿尔特曼的回答让在场的一些创始人松了一口气,但如果这种做法损害了OpenAI的发展,他们随时可能改变主意。目前还不清楚,OpenAI、谷歌、Anthropic和其他大型开发商会在多长时间内允许较小的竞争对手有效复制他们的AI。 不过,初创公司利用OpenAI数据所做的事情与OpenAI和其他领先的AI开发商在训练自己的模型时所做的事情有相似之处。OpenAI的首席技术官米拉·穆拉提(Mira Murati)上个月的一次采访中,在回答有关其同事是否使用了谷歌旗下的YouTube以及Meta Platforms旗下的Facebook和Instagram的数据来训练Sora时,表现得有些含糊其辞。 如果OpenAI确实使用了这些数据,也不足为奇。纽约时报最近的一篇报道描述了OpenAI如何创建语音识别工具Whisper来转录YouTube视频,以改进其GPT-4 模型。The Information此前曾报道,该公司秘密使用YouTube数据训练其之前的AI模型。本月早些时候,YouTube首席执行官尼尔·莫汉(Neal Mohan)表示,他不会同意OpenAI使用YouTube视频来开发像Sora这样的模型。 这引发了新闻出版商和一些作家的指责。去年12月,《纽约时报》起诉OpenAI及其最大支持者微软,指控它们在训练模型时非法复制了纽约时报的文章。诉讼称,OpenAI的聊天机器人可以产生完整纽约时报内容的输出。 OpenAI在回应中辩称,它曾试图与新闻出版商建立合作关系,其训练行为是美国版权原则“合理使用”所允许的。 尽管如此,OpenAI和谷歌都与包括Axel Springer在内的出版商达成了价值数百万美元的授权协议,并与Reddit等大型网站达成了更大的协议。 但并非每个AI开发商都游走在“灰色地域”。Databricks公司的首席科学家乔纳森·弗兰克尔(Jonathan Frankle)表示,该公司在开发强大的开源大型语言模型时,并没有依赖竞争对手的作品。Anthropic的一位发言人也称,该公司没有利用其他模型的输出结果来训练自身大模型。 三、投资者不愿初创公司“走捷径”,合成数据或成训练新来源 一些投资者对“偷工减料”或开发出与竞争对手无异的技术的公司感到不舒服,因为这些公司实际上并没有自己真正的技术。投资者们更希望看到AI领域的快速进步和比同行更好的科研成果。 一些筹集了数亿美元资金的公司甚至不承认使用了其他AI公司的开源模型。这种情况更加剧李投资者的不满,认为公司的诚信有问题。门罗风险投资公司(Menlo Ventures)的董事总经理马特·墨菲(Matt Murphy)解释道,在一个新的生态系统中,没有一套明确的规则,就会出现这种情况。 合成数据是一种替代方案,公司可以用自己的AI模型生成数据,而不是获取线上的内容。例如,谷歌和Meta就表示,它们使用合成数据来建立模型,以解决几何问题和生成计算机代码。由于AI能够生成这类数据,因此它避免了使用人工生成的内容所带来的许多法律问题。 与此同时,数十家AI初创公司正在获取医疗保健和律师事务所等行业的私人数据,以开发特定用途的模型。 结语:生成式AI模仿风波不断,OpenAI持宽容态度 许多初创公司开发的AI大模型很可能使用了OpenAI和其他公司的数据,尽管这些初创公司正试图削弱OpenAI的实力。这种做法已成为了行业内的公开秘密,导致了技术同源但价格减半的竞争态势。 虽然OpenAI等初创公司对于小规模使用情况保持宽容的态度,但一些公司仍不主动披露他们在开发过程中使用了他者的技术。他们认为承认可能会给公司带来风险。 不管怎样,训练大模型数据的紧缺和日益增长的竞争压力仍在增加,目前合成数据仍在探索阶段,我们期待AI公司更前沿的模型训练和数据获取。
Sora 加入 Adobe 全家桶!一句话 P 视频,真成美图秀秀了
Adobe 的「新课程」来了:教你一句话 P 视频。 当年,Adobe 全家桶里的视频编辑工具 Premiere Pro,是大学选修课的常驻嘉宾,为此多少学生临时在 B 站抱佛脚,然后用进废退,把知识忘个精光。 收藏夹积灰的视频还没扔,不如现在开始学怎么指挥 AI 攻克 PR,还来得及从入门到精通。 一句话改视频,Sora、Pika 都为你服务 Adobe 昨天发布了一件大事:由生成式 AI 加强的 PR,计划在今年内推出。 遗憾的是还没公布具体时间,但官方演示已经让人恨不得立刻上手产品了。 毕竟,效果看起来太直观了。输入文本提示词,就能添加、改变和删除物体,增加辅助镜头,甚至把某个镜头延长几帧。 黑帮片地下交易的钻石不够多,显得剧组穷、演员没有逼格?没关系,用钢笔工具选中箱子,输入提示词「黑色天鹅绒布上的一堆大钻石」,AI 就能无中生有。 同理,布景也可以「如非必要、勿增实体」,桌子上加个花瓶,书房里挂幅画,不在话下。 反过来,多余的道具可以轻松地被删除,墙上的标志、地上的包,一键原地消失。如果麦克风、灯架不小心入镜了,亦能快速补救。哪里不要选哪里,场务和后期都能省点心。 演员的妆造同样可以锦上添花,给表换个牌子,给衬衫打条领带。 甚至,视频长度也能随意更改,女演员的特写时间不够长,那么在剪辑的开头或结尾单击并拖动到合适的位置,AI 就能帮忙延长几帧。 为了实现这些 AI 功能,Adobe 不仅在开发自己的视频模型,还在 PR 集成了第三方视频模型,让用户自由地选择效果更好的一个。 Runway、Pika、OpenAI 的 Sora,AI 视频赛道最出名的香饽饽,都被 Adobe 纳入合作对象了。 从目前的演示来看,几个第三方模型各有所长。Pika 主要用在扩展视频,让场景过渡更加流畅。 Sora 以及 Runway,用于为场景生成辅助镜头,即 B-roll,比如「夜间雨中的城市天际线景观」「从驾驶员的视野中夜间驾车穿过城市」。 让 AI 负责难拍的空镜,既能让整个视频的节奏更好,也能服务于故事,以景衬情刻画主角的心理活动。 当然,如果不想用 AI 功能了,用户也可以反悔,因为 AI 素材和原始素材是独立的,要么在同一条时间线切分,要么干脆在不同的时间线。 尽管只是个演示,还是想让人感叹,Adobe 到底还是那个 Adobe,当年学习用 PS 抠头发、用 PR 拉速度线,痛并快乐着,如今一切又在变得更加新鲜和简单。 工具在我们手下自成一片天地,这里是个垃圾桶还是消防栓,背景是在城市还是野外,都由脚本和我们的想象力决定。 让 AI 的主动,换来用户的死忠 Adobe 的 AI 系列工具叫作「Adobe Firefly」,去年 5 月集成到了 PS,这次又轮到了 PR。 PS 的生成式 AI 功能,思路上和 PR 有些类似,都是通过文字提示词,让一些人类觉得麻烦的细节处理起来更加简单:通过文字,添加内容、移除或替换图像的一部分、扩展图像…… 不知不觉,PS 的 AI 功能「生成式填充」已经融入了编辑部的工作流。 视频组拿它来为现场置景,比如这张图片里电视下方的摆件,均由 AI 生成,但自然地融入画面,不刻意说,可能就看不出来,真正地节省了道具费,也节省了拍摄时间。 用视频组王编辑的话说,「真的太好用了,感受到神奇」。 设计组作为 Adobe 全家桶的重度用户,自然也积极探索新的玩具。目前,AI 加强的 PS,更适合作为辅助。 比如,去除某个物体或者某个人物,生成式 AI 比 PS 原有的内容识别填充功能更高效,边缘处理也更柔和,不会出现扭曲地面等情况。 ▲ 依次为:原图,内容识别填充,生成式 AI. 扩展图像的功能更是派得上用场,甲方经常给一些尺寸不够的素材,这时候的应对办法不必是在群里@对方来回拉扯,交给 AI 搞定,就能让素材更好用。 类似 PR 的 AI 素材保持独美,PS 的生成式填充,AI 也是单独一个图层。 如果说 PR、PS 因为 AI 变得更加精致,效率提高了一个数量级,那倒也没有,比如 AI 生成的图片没办法拆解微调,AI 生成的视频也还是让人出戏,有种说不出的 AI 味。 虽然生成的素材很多没法直接用,但 AI 足以弥合一些创作和工作流中的缝隙。 很多繁琐、费时又无聊的事情,比如抠图,不必人类手动了。在客户提出需求时,AI 也能快速生成可供参考的效果,减少彼此的沟通成本。 之前,为了给 PR 增加生成式 AI 功能,Adobe 深入用户群体调研,希望找到一个答案:AI 如何解决他们实际工作中的问题? Adobe 发现,用户的核心诉求有三个: AI 必须集成到工作流和他们每天使用的工具里; AI 必须更快地编辑和处理内容,同时用户仍然能精准地控制内容; 用户对于 AI 有选择的权利,同时也能使用各有所长的 AI 模型; 从这次演示的效果来看,Adobe 确实是从用户的需求出发,哪怕乍见不如 Sora 惊艳,但群众基础强大,对于忠实用户来说,只用一个软件更好更快地解决问题,也足够有吸引力了。 其实在少有人关注的角落,Adobe 推出了更多的 AI 模型。 Firefly Image 2 文生图模型、Firefly 矢量图形生成模型、Firefly 文本到模板设计模型……Adobe Illustrator 作为全家桶一员,早已沾到了 AI 的光。 不少网友还在 Adobe 的 YouTube 评论区留言:什么时候轮到 AE? 自我革命的老牌创意公司,想做 AI 界的清流 Adobe 在创意领域和 Google 在搜索赛道的境遇,莫名有些类似,它们都因为 AI 的到来,等待一场自我革命。 不少设计师、插画师、摄影师对生成式 AI 态度负面,觉得 AI 的审美崩坏,侵权人类的作品,并威胁到自己的岗位。 同时,华尔街不看好 Adobe。市场担心 Adobe 的核心业务因为 AI 受损,今年其股价已经下跌约 20%。 Adobe 做出了自己的选择,一方面拥抱 AI,甚至积极地和那些革自己命的 AI 初创公司合作。 另一方面站在艺术家的一边,只用 Adobe Stock 等授权的素材或者版权过期的素材训练,并为 Adobe Stock 的贡献者提供一套补偿体系,标榜自己的职业道德。 但 Adobe 未必能独善其身。 前段时间有媒体爆料,Adobe 的部分数据来自 Midjourney,Adobe 回应这部分素材经过了严格审核,这次 Adobe 又和 Sora 达成了合作,然而 Sora 的训练数据也是不清不楚的,连 OpenAI CTO 都言辞闪烁地说「我不知道」,临场反应被做成表情包。 哪怕是从正规渠道搜罗素材,Adobe 给的价格也并不高,彭博社报道,图片的价格在每张 6 美分到 16 美分之间,视频的价格在每分钟 2.62 美元到 7.25 美元之间。 这次官宣 PR 的生成式 AI 功能时,Adobe 至少表明了态度,强调会为每个视频标注「内容标签」,告诉你视频有 AI 的参与,甚至具体到告诉你是哪个模型。 争议的声音一直存在,但阻碍不了,工具变得更好也更快。 Adobe 入局生成式 AI 的速度不算敏锐,在图片、视频等领域都不是第一,但思路比较稳扎稳打,走渐进式创新的路子,一边基于全家桶直接提供 AI 功能,一边又集成第三方的服务。 这样的方式或许很符合用户的直觉,我们可能不会为全新的、可替代的 AI 产品付费,但可能会为用惯了的、增加了 AI 功能的生产力软件付费。 从用户的角度来说,如果说 PS 提高了艺术家的工作效率、美图秀秀让大众用户一键体验瘦脸的快乐,而 AI 版 PS 和 PR 同时赋能了业内人士和业余爱好者。 但也有从业者被默默地「牺牲」,几位 Adobe 员工告诉 Business Insider,有些艺术家的工作,已经变成了给 AI 打工、为 AI 修图。部分广告公司,也正在缩减图形设计团队的规模。 与其说人人都是创作者,不如说人人都是技术的参与者和竞跑者,写脚本、做分镜仍然需要门槛,如何让 AI 生成理想的图片和视频,又催生新的学问。 来到当下这个节点,最神奇的便是,服务于创造力的公司,也正在重新构想创作的过程,以 AI 驱动的工具服务用户,又不会削弱自己的核心优势。对于每个人,乃至前生成式 AI 时代的公司,面前都是一座等待跨越的山。
生成式AI智能手机出货量将大涨,2027年占比达43%
集微网消息,研究机构Counterpoint报告显示,生成式人工智能(GenAI)智能手机出货量将在2023~2027年迅速增长,预计2024年出货量占比为11%,到2027年将达到5.5亿部,占比43%,年均复合增长率为49%。 此外,机构预计到2027年,生成式AI智能手机的市场保有量将突破10亿部。 Counterpoint将“生成式AI智能手机”定义为利用大规模、预训练生成式AI模型的移动设备,能够创建原创内容或执行情境感知任务。希望这类设备具有多模态功能,能够处理文本、图像、语音和其他输入信息,并生成各类输出,实现流畅、无缝的用户体验。预计随着技术进步,这类硬件规格可能会不断发展,但目前想要有效运行人工智能模型,设备的硬件性能应该与当前旗舰手机相当,或者更好。 该机构研究总监Tarun Pathak表示,迄今为止,已有10多家OEM产商推出了30多款支持生成式AI的智能手机,自年初以来,这一直是人们谈论的焦点。尤其是在三星Galaxy S24之后,三星凭借该系列所搭载的AI功能,获得了良好市场份额,预计三星将在2024年引领生成式AI智能手机排行榜。 近日有传言称苹果将在WWDC开发者大会公布在人工智能领域的新进展,以及AI智能手机的新功能。预计苹果的加入,将进一步加快生成式AI的应用,这将在2025年成为中高端智能手机的标配功能。分析师补充,真正的差异化将在于应用,因为消费者仍在评估人工智能对未来设备的潜在影响。 Counterpoint认为,未来的手机将更加个性化,以满足人们的使用偏好。目前手机厂商在AI方面的应用包括增强图像、翻译、改进应用体验、内容推荐、创建更多个性化内容等。随着大语言模型(LLM)在规模和效率上不断增长,这些应用也将发展。 该机构认为,边缘(移动设备)和云端的整合,将成为智能手机中生成式AI的主流模式,而软件能力方面发挥出色的OEM厂商,在战略合作伙伴的加持下,很可能会在竞争中保持领先地位。 展望未来,Counterpoint预计生成式AI智能手机将在2025年迎来拐点,因为这些设备将渗透到更广泛价位段,尤其是400美元~599美元(约合2896元~4336元人民币)。联发科、高通已经率先推出了新一代AI SoC芯片,包括多个计算平台,支持终端多模态人工智能大模型。预计2024年,高通公司将在人工智能移动SoC领域占据领先地位,在生成式AI智能手机中的份额达到50%。 (校对/张杰)

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。