行业分类:
加载中...
头条分类:
加载中...
网易云音乐崩溃了,会员调侃补偿“一人发头猪就好了”
8月19日,“网易云音乐崩了”登上热搜。许多网友反馈网易云音乐页面出现“服务器发生错误”,音乐播放、加载等均出现异常。此次故障持续的时间近两小时,下午17时左右,网易云在线音乐播放恢复正常。 “大家好,没有删库,没有跑路,故障已陆续修复。作为补偿,8月20日0-24时,云音乐搜“畅听音乐”,可领取7天会员权益到您的账户(具体规则请见活动页面)抱歉必须再说一遍,请您息怒。”故障修复后,网易云音乐作出了官方回应并对用户给出了补偿方案,此前,有传言称此次故障因“网易云音乐开发者删库跑路”,网易云音乐表示此次故障原因与机房无关。网易云音乐官方微博曾回应称,网易云音乐各端无法正常使用是由于基础设施故障。 此次网易云音乐故障影响的功能范围较广,根据用户反馈,故障期间,网易云客服入口、音乐榜单、评论区等页面均无法正常访问,用户可以收听部分本地歌曲,但在线音乐无法正常播放。 不少用户在微博调侃“上班摸鱼受到了影响”“下班路上不能听歌了”,网易云如何针对此次故障“善后”受到用户关注,不少用户期待网易云赠送会员作为补偿,Rokid创始人兼CEO祝铭明在社交平台调侃:“我们这些会员要求不高,一人发头猪就好了。” 今年3月,网易云音乐也曾因系统故障登上热搜,彼时,有网友反映网易云音乐登录状态失效,需要重新登陆,网易云音乐客服回应称,登陆情况异常是网络异常导致,与版本更新无关,故障在一段时间后修复。 近期各类APP交替出现故障,考验平台基础设施、技术能力、修复速度的同时,如何做好用户运营亦受到关注。一个值得关注的现象是,对在线音乐平台来说,付费用户对营收的影响也越来越大。 目前,网易云音乐有着两亿多的活跃用户。财报数据显示,截至2023年底,网易云音乐在线音乐服务月付费用户数为4412万人,相比2022年底增加585万人。2023年底,网易云在线音乐服务月活跃用户数由2022年的1.894亿人增加至2.059亿人。同时,网易云有160.3万社交娱乐服务月付费用户。2023年,网易云音乐来自订阅会员的收入同比增长20.2%。 网易云在财报中表示,尽管整个行业放缓,但网易云音乐2023年的在线音乐服务月活跃用户数仍增长至205.9百万人,同比增长8.7%,这一增长主要来自于不断扩大差异化的优质内容、用户体验的提升以及平台运营能力的加强。 数据显示,由于社交娱乐服务收入的下降,2023年,网易云收入由2022年的人民币90亿元减少至79亿元,同比下降12.5%。但由于规模效应及持续成本优化,网易云音乐毛利率由2022年的14.4%上升至2023年的26.7%,网易云音乐实现了首次实现全年盈利,录得经调整净利润人民币818.5百万元, 未来,能否持续提升在线音乐服务收入,以音乐和用户体验吸引更多付费用户、降低获客成本,关系着网易云音乐能否实现长期盈利。 故障目前并未对网易云音乐股价产生重大影响。8月19日,云音乐股价以94.25港元/股收盘,上涨2.89%。
大模型的“掘金卖铲”生意,AI Infra的最佳机会来了?
在19世纪的淘金热中,最赚钱的并不是挖金矿的,反而是那些卖铲子、卖牛仔裤的人。正如卖铲人在淘金热中成为最大赢家,在当今AIGC时代,AI Infra也扮演着类似的角色。 如果用云计算三层构架做类比,AI Infra与PaaS层级相似,是链接算力和应用的中间层基础设施,包括硬件、软件、工具链和优化方法等,为大模型应用开发提供一站式模型算力部署和开发工具平台。算力、算法、数据可以看作IaaS层,各种开源和闭源模型则是SaaS在大模型时代的新演变,即MaaS。 随着大模型应用落地的进程不断加速,AI Infra的价值潜力被进一步释放。中金数据预测,目前,AI Infra产业处于高速增长的发展早期,未来3-5年内各细分赛道空间或保持30%的高速增长。 当大模型进入大规模应用落地时期,提供大模型训练、部署和应用时所需的基础设施成为关键一环,AI Infra成为大模型应用爆发背后“掘金卖铲”的最佳生意。 中台模式解锁AI生产力 从ICT产业的演进轨迹来看,三层架构似乎是宿命般的终极图景。在传统的本地部署阶段,操作系统、数据库、中间件等基础软件通过控制硬件交互、存储管理数据、网络通信调度等功能,解决底层硬件系统的复杂性难题,让上层应用开发者能专注于业务逻辑进行创新。 在云定义一切的时代,也形成了IaaS、PaaS、SaaS协同进化的经典架构,其中PaaS层提供应用开发环境和数据分析管理等服务,为云计算加速渗透奠定了坚实基础。 经历了漫长的蛰伏期后,AIGC按下了人工智能通用化进程的快进键,整个产业在狂飙突进的氛围中急速重构。算力与应用无疑是最耀眼的主角,但二者之间的鸿沟堪比天堑,大模型面临“悬浮”或“踏空”的风险。 从这个意义上讲,AI Infra犹如一座桥,可以承担类似基础软件或PaaS曾经扮演的角色——通过构建新型的软件栈及综合服务,赋能算力挖潜、模型优化和应用开发,成为连接算力与应用的中坚力量。 AI Infra涵盖一切跟开发部署相关的工具和流程。随着云计算的不断发展,又逐渐衍生出了DataOps、ModelOps、DevOps、MLOps、LLMOps等一些XOps的概念。 从宏观的角度来看,所有XOps本质上是为了开发部署生命周期的提效。比如DataOps是为IaaS层的存储和PaaS层的数据处理提效的,DevOps、MLOps实际上是为PaaS层开发部署提效的,LLMOps是为MaaS层提效的。 事实上,在AIGC风起云涌之前,关于AI中台的理论与实践就已如火如荼地展开。但当时的AI中台更像是“救火队员”,功能比较庞杂,干了不少“脏活”、“累活”,却难以获得上下游的认可。 大模型为AI平台化搭建起更宽广的舞台,也让AI Infra“掘金卖铲”的逻辑更具确定性,进而赢得可观的发展空间。相关机构预测显示,未来3~5年AI Infra产业将保持30%+的高速增长。 就像“三明治”的两片面包间可以有无数种夹层选择,身处算力与应用之间的AI Infra同样不拘一格。从广义上看,AI Infra涵盖人工智能基础框架技术,涉及大模型训练、部署领域的各种底层设施;狭义而言,基础软件栈是AI Infra的核心组成部分,优化算力算法、促进应用落地是其主要目标。 AI Infra定义的相对开放为不同的路径探索提供了更多可能。基于各自的资源禀赋与市场定位,业界的资深厂商与新兴玩家正在积极拓展AI Infra的疆界,不少做法值得借鉴。 AI Infra将是 下一个应用热点? 相比模型价值,卷AI应用成为行业共识。李彦宏坚信,基础模型之上将诞生数以百万计的应用,它们对于现有业态的改造作用,比从0到1的颠覆作用更大。 如今AI应用的供给在不断增加,IDC在年初时预测,2024年全球将涌现出超过5亿个新应用,这相当于过去40年间出现的应用数总和。 最近,视频生成类模型产品扎堆出现,快手的可灵、字节跳动的即梦、商汤的Vimi集体亮相,此外还有AI搜索产品、AI陪伴类产品等层出不穷。 大模型应用爆发趋势已然确定,根据InfoQ研究中心数据,2030年AGI应用市场规模将达4543.6亿元,模型应用层的巨大机会已经吸引了几乎各行各业的参与。 而在大模型应用之下,AI Infra成为其爆发的隐藏推手。 目前,大模型产业链大致可以分为数据准备、模型构建、模型产品三个层次。在国外,AI大模型的产业链比较成熟,形成了数量众多的AI Infra(架构)公司,但这一块市场在国内还相对空白。 在充满不确定性的道路上,率先找到清晰的赛道,快速建立显著的里程碑尤为重要。AI Infra市场尚处于混沌期,每个科技巨头都希望在自己的生态中形成闭环。 在国内,巨头们都有一套自己的训练架构。 比如,华为的模型采用的是三层架构,其底层属于通识性大模型,具备超强的鲁棒性的泛化性,在这之上是行业大模型和针对具体场景和工作流程的部署模型。这种构架的好处是,当训练好的大模型部署到垂类行业时,可以不必再重复训练,成本仅是上一层的5%~7%。 阿里则是为AI打造了一个统一底座,无论是CV、NLP、还是文生图大模型都可以放进去这个统一底座中训练,阿里训练M6大模型需要的能耗仅是GPT-3的1%。 百度和腾讯也有相应的布局,百度拥有覆盖超50亿实体的中文知识图谱,腾讯的热启动课程学习可以将万亿大模型的训练成本降低到冷启动的八分之一。 整体来看,各个大厂之间的侧重点虽然有所不同,但主要特点就是降本增效,而能够实现这一点,很大程度上就是受益于“一手包办”的闭环训练体系。 反观国外,成熟的AI产业链形成了数量众多的AI Infra公司。 如果把开发AI应用看成建房子,那么AI Infra就是提供水泥钢筋的施工队。AI Infra施工队的价值点在于它是一个集成平台,将下层的算力芯片层与上层的AI应用层打通,让开发者实现一键调用,并且实现降低算力成本、提升开发效率并且保持模型优秀性能的效果。 让应用更简单,让AI落地更便捷,是AI Infra的使命。可以说,AI应用的市场有多大,AI Infra的机会就有多大。 AI Infra公司有的专门做数据标注、做数据质量、或者模型架构等。这些企业的专业性,能够让他们在某一个单一环节的效率、成本、质量上都要比大厂亲自下场做得更好。 比如,数据质量公司Anomalo就是Google Cloud和Notion的供应商,它可以通过ML自动评估和通用化数据质量检测能力,来实现数据深度观察和数据质量检测。 这些公司就像汽车行业的Tier 1,通过专业的分工,能够让大模型企业不必重复造轮子,而只需要通过整合供应商资源,就能快速地搭建起自己模型构架,从而降低成本。 但国内在这一方面并不成熟,原因在于:一方面国内大模型的主要玩家都是大厂,他们都有一套自己的训练体系,外部供应商几乎没有机会进入;另一方面,国内也缺乏足够庞大的创业生态和中小企业,AI供应商也很难在大厂之外找到生存的空间。 以谷歌为例,谷歌愿意将自己训练的数据结果分享给它的数据质量供应商,帮助供应商提高数据处理能力,供应商能力提升之后,又会反过来给谷歌提供更多高质量数据,从而形成一种良性循环。 国内AI Infra生态的不足,直接导致的就是大模型创业门槛的拔高。如果将在中国做大模型比喻成吃上一顿热乎饭,那必须从挖地、种菜开始。 目前,在AI 2.0的热潮中,一个重要的特点就是“两极化”:最热门的要么是大模型层、要么就是应用层。而类似AI Infra的中间层,反而是很大的真空地带,也可能是下一个机遇所在。 铲子难卖,金矿难挖 尽管在大模型应用爆发的当下,AI Infra层潜藏着巨大的生意。但是对于这些做AI Infra的公司来说,即使他们在自己的专业领域如此强大,在潮水的变化面前依然脆弱。 英伟达CUDA生态已经发展了20年,在AI领域,最先进的模型和应用都首先在CUDA上跑起来。 每个硬件之间都有不同的接口,CUDA统一了不同接口之间的语言,让使用者能够用一套标准语言去使用不同硬件。在模型开发过程中,开发者势必会趋同于在同一个语言体系中去完成自己的开发。而这实际上就构成了英伟达CUDA生态厚度。 目前,CUDA生态在AI算力市场占据了90%以上的份额。不过随着AI模型的标准化,模型之间结构差异变小,不再需要调度多种大小模型,英伟达CUDA生态厚度在变薄。 即使如此,英伟达在算力市场也是绝对王者。据业内人士预测,英伟达在接下来的3~5年当中,还会是整个AI硬件提供商中绝对的领头羊,市场发展占有率不会低于80%。 对AI Infra层的卖铲厂商来说,外有英伟达守矿人,堵在门口卖门票与铲子,好不容易找到一条进入金矿的小路,却发现,里面的挖矿人已经习惯“徒手”挖矿,不再接受新铲子。 在国内,企业为软件付费意愿低,且大多习惯集成式服务。国内SaaS投资已经降到冰点,如果AI Infra层厂商单靠卖硬件或软件难以实现商业化。 伴随AI应用的快速发展,未来谁能够为多样化的应用场景提供高效便捷的大模型一站式部署方案,谁就有可能在这场竞争中胜出。而这其中,底层技术、中层平台、上层应用缺一不可,只有让各方面能力得到更全面、均衡地发展,才能在AI之路上走得更远、更稳健。 放眼未来,人工智能重塑千行百业的进程刚拉开帷幕,Al Infra铺就的厚雪长坡有助于这个超级赛道行稳致远。今年,数据基础设施已在顶层设计中“独立门户”,人工智能基础设施战略地位的跃迁亦不遥远。
率先开放!讯飞打造全新中文交互模式,极速畅聊还能角色扮演
中国版GPT-4o来了!讯飞星火版“Her”抢先到来,打造国内首个全新中文交互模式,并将在8月底率先全民开放使用。这意味着国内首个对标GPT-4o语音功能的产品正式到来。 8月19日,科大讯飞宣布星火语音大模型更新,正式推出星火极速超拟人交互,并将其能力落地在讯飞星火APP“小星畅聊”功能中。星火极速超拟人交互响应速度更快,对话更加自然流畅,随时打断、插话之后还能秒回。有趣的是,星火极速超拟人交互还能感知你的情绪变化,并共情地回应你的喜怒哀乐,在表达上更加自然、更具情感。 从官方展示效果来看,星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破,让整体的交互体验更自然、更有趣,就像电影《Her》中展现的智能且人性化的聊天效果一样。 在响应速度上,星火极速超拟人交互支持极速响应多轮交互,能够在对话过程中生成高质量的回答,并且响应速度更快、与GPT-4o响应时间相当,几乎与人类正常聊天节奏一致,并且对话中允许用户随时打断、插话,可谓实现了人机对话的“无缝衔接”。 在情绪感知情感共鸣上,星火极速超拟人交互可以在对话中感知到用户的喜、怒、哀、乐、害怕、困惑等各类情绪,不仅能根据声音的内容来判断,还能像朋友一样用合适的情感回应用户。比如,用笑声回应开心,安慰悲伤情绪……此刻是不是有一种《Her》的既视感。同时,星火极速超拟人交互还能识别用户咳嗽、猫和狗的叫声等,给出对应的回复语。 相比以前语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。“用调侃的方式给我说个笑话”、“用东北话给外地朋友介绍下锅包肉”、“说的更快一点”…… 此外,星火极速超拟人交互还支持“角色扮演”,可以模仿不同的角色陪你聊天。比如,“模仿孙悟空的声音来和小孩子对话”,超拟人便会模仿孙悟空的声音和人设和小朋友聊天。 今年5月OpenAI惊艳亮相了GPT-4o,展示了堪比电影《Her》中的人机交互体验,但迟迟没有面向用户开放,上个月底也只是选择性地向一小部分Alpha测试参与者开放部分语音功能。 讯飞星火版Her的到来,也代表国产大模型开始从追赶、对标到进行自主创新、走出差异化路线。 据科大讯飞透露,此次星火极速超拟人交互采用统一神经网络直接实现语音到语音端到端建模,对比传统的语音转文字、大模型生成回复文本、语音合成三步骤来说可谓“一气呵成”,大幅缩短响应时间的同时,也提升了交互拟人度和流畅度。 同时,结合讯飞多维度的语音属性解耦表征训练准则,将内容、音色、情感、语言、风格都信息进行解耦训练,使得星火极速超拟人交互能够更加灵活控制各类元素,还能根据需求便捷定制,让系统快速落地应用。 正是基于以上技术创新,8月底星火极速超拟人交互将率先全民开放使用。科大讯飞表示,基于全新端到端框架创新基础上,星火极速超拟人交互目前主要开放语音模态,未来会持续在交互上创新突破,不仅会带来更多更实用、丰富的功能,也会拓展到更多模态。 在2023年科大讯飞全球1024开发者节上,华为科技有限公司副董事长、轮值董事长徐直军曾表示,“华为公司在全球所有使用的智能终端的语音技术,都是来自于科大讯飞,而且不仅仅是中文”。这一波语音能力的革新,多轮交互、语义理解、指令跟随、逻辑推理、情感共鸣……代表了智能语音交互领域的一大阶跃。全新的星火超拟人交互模式达到了类人级别的极速响应和聪明、实用、流畅、自然的非凡表现,这一技术的应用和普及还隐藏着巨大的可能性——语音市场在这个时代将被重写,语音交互带动万物互联的第六次产业浪潮有望出现一次井喷。 该项技术突破,将会极大地促进智能语音技术进一步应用于智能手机、智能汽车、智能家电以及智能家居等各类消费级产品当中,并且随着全球化进程的加深,对多语种、多方言的需求也会持续增加。据国际数据公司IDC分析,预计到2030年,全球智能语音服务市场规模将达约731.6 亿美元,复合增长率27%。科大讯飞凭借上述技术突破有望收获新一轮产业红利。
世界上最癫的AI, 由人类模仿
人类模仿 AI 的视频成了新晋的流量密码。 上一秒还因口角所剑拔弩张,下一秒便放慢了动作,不知何时从哪里掏出一碗面,一杯酒,硬控我 21 秒的视频永远也猜不到下一秒会发生什么。 这种荒诞不经的场景切换,正是最近爆红网络的「人类模仿 AI」视频的典型特征。从 Reddit 到 X,这些模仿 AI 的视频把老外拿捏得死死的,甚至在外网收获了数百万的点击量。 反正看完这些视频,我的脑子里只剩下一句话,好一场酣畅淋漓的抽象艺术盛宴。 与 AI 割席,标榜人类的独特性 这些视频有个共同点:夸张的表情搭配动作,在放大镜的效果下模仿着 AI 的缺陷。 突如其来的场景转换和不连贯的叙事方式,既是为了自带节目效果博取流量,也是在模仿 AI 视频生成内容常常出现的「逻辑跳跃」。 就像刚学走路的孩子总会跌跌撞撞。AI 视频生成技术虽然进步神速,但青涩和不成熟依旧是当下普罗大众的第一印象。 在狂飙突进数年后的今天,离不开「炼丹」的视频生成质量固然有着提示词的兜底,但视频生成的稳定性更多是在从「无到有」走向「有到优」。 甚至也有的画饼画大半年的,除了个演示 demo 的空头支票,就再也渺无音讯了。 在最近的牛津数学公开讲座系列研讨会上,华裔数学家陶哲轩认为,AI 基本上就是一台「猜测机器」,它们既不像专家那样可靠,尽管有时它们可以提供专家级输出。 谁曾想,从最初主动拥抱 AI 的惊叹,到批评,再到愚弄,人类对 AI 的态度短短两年间就来了 180 度大转弯。 以风靡一时的 AI 写真为例。一年前横空出世的妙鸭相机还是香饽饽,跟风而至的网友纷纷打出了 5 分好评,也让 AI 写真干翻海马体的调侃流传至今。 然而,随着 AI 前所未有地入侵我们的生活,当新鲜感褪去,嗤之以鼻亦或者久处而厌开始成为常态。 即便是在小红书一搜,关于 AI 写真的评价也从最初的一片赞誉声,转为写满了避雷的故事。当 AI 不再是遥不可及的高科技,而是日常生活中随处可见的应用时,人们开始以更挑剔的眼光来看待它。 面对这种 AI 的青涩,不想与之「同流合污」的人类采取了最简单粗暴的做法——割席。所以我们看到越来越多人开始与 AI 划清楚河汉界,标榜起人类的独特性。 美国自由插画师 Beth Spencer 想出了一个笨办法,拿起 iPad 花 5 分钟画了一个充满生命力的标志,上面用英文写着「用人类智能创造」,以此来划分人类与 AI 的边界。 而在 Beth Spencer 之前,一个类似的活动已经在 2023 年初发起——「Not By AI」。 不管是网站、视频、书籍还是艺术创作,对于非商业用途的作品,人类原创内容只需要达到 90%,就可以免费使用这个电子贴纸。剩下的 10% 则可以使用 AI 进行翻译等细枝末节等任务。 因此,Not By AI 不是要否定 AI 的价值,而是要强调人类创造力的独特性。 毕竟在这个 AI 无处不在的时代,「人造」反而成了一种稀缺资源,如同在快餐文化盛行的时代,街边坚持手工制作的小店反而更受到欢迎。 AI 焦虑当前,人们需要抱团取暖 这场看似荒诞的「镜像游戏」背后,隐藏着人类对新技术的复杂情感和深层焦虑。 前段时间想蹭奥运热度的 Google 为 Gemini 做了一支电视广告,但上线仅一周就在观众的口诛笔伐中黯然撤下。 广告展示了一位父亲使用 Gemini 帮助女儿给田径运动员 Sydney McLaughlin-Levrone 写信。 这则广告的初衷或许很美好,但被骂也不冤枉。 原因在于大众早已给 AI 划定了红线,我们欣赏它的高效,却又害怕它的情感;我们依赖它的智能,却又担心它会取代我们的思考。 在职场无坚不摧的 AI 不能传递真情实感,当父亲用 AI 来协助女儿写信时,这种行为被视为越界。 给偶像写信这样充满感情的事,不应该让 AI 代劳。掺和上 AI 味的信件缺乏人情味,也更轻易触动观众心中那根敏感的神经。 AI 再强大,不应该也不能轻易介入人类最珍贵的情感交流。 因为它唤醒了人们心中潜藏的恐惧——害怕有朝一日,连最私密的情感交流都需要 AI 的协助。所以也难怪华盛顿邮报专栏作家亚历山德拉・佩特里直白地呼喊,求求一双没有看过这广告的眼睛。 而不论是通过夸张和幽默化模仿 AI 生成视频,还是给 AI 画上令行禁止的分界线,无一不是在重申人类的优越性。 ChatGPT 推出仅两个月,月活跃用户就达到了 1 亿,成为有史以来增长最快的消费应用程序。用户的飙升不只是统计图表上的一条曲线,也在无形中映射出人们面对 AI 迅猛发展所带来的焦虑。 各类社交平台的「AI 教父/教母」们也通过发布各种关于 AI 资讯来吸引关注和挑拨情绪,向普通人发起了一场信息的围剿。 以抖音为例,当你在平台上搜索 AI 相关的内容,你会发现无数的帖子和视频都在手把手教你如何玩转 AI,但仔细一看,教学是前菜,卖课和倒流才是阴影下的后手。 用更另类的方式来「驯服」AI,既让人们感觉自己理解了 AI,也在心理上获得某种控制感。 与此同时,这也是一种社会互动和群体认同的形式。比如在 TikTok上,#HumanvsAI 的话题标签已经累积超高的浏览量。 通过共同嘲笑或批评 AI,人们的抱团取暖强化了群体的认同感,形成了一种「我们 vs AI」的心理。 技术超速,我们如何适应? 技术的超速,有目共睹。 如果说,我们能识破这些模仿 AI 视频是因为人类刻意营造的不真实,但在 AI 时代,随着技术进步与「真实」界限的渐趋模糊,我们又该如何适应。 往前看,《纽约时报》报道了一起令人警醒的案例: 去年底,82 岁的退休老人 Beauchamp 被 AI 马斯克推广的一项高风险投资计划所吸引。马斯克的脸庞、BBC 的背书,「剑走偏锋」的 AI 让这场骗局天衣无缝。 入局的老人在接下来的数周内,通过一系列交易累计投资超过 69 万美元,耗尽了退休金。结果也可想而知,退休金和所投公司一同人间蒸发。 再往近一些看,最近以假乱真的 TEDx 演讲者的照片或视频刷屏全网,骗过了数百万网友的眼睛,上演了一出眼见未必为实的精彩戏码。 而经过一番深挖,网友发现这些照片正是出自 Stable Diffusion 团队的前成员 Leo Kadieff 之手。 他在 LinkedIn 揭秘道,这些所谓的 TEDx 演讲者照片其实是由 FLUX+LoRA 制作而成的,过程中甚至不需要经过任何的微调。 仅需一个 22MB 的小文件,用户就不必在每个提示词里堆砌一大堆与真实相关的词汇。简单一句「一张 RAW 超现实照片,超高清,8k」就足以解决生成的照片没有人味的问题。 随着如同洪流的 AI 生成内容触及互联网每个角落,最终得来的却是「真实性」的日渐流失。 在去年四月份的索尼世界摄影奖颁奖礼上,德国摄影艺术家 Boris Eldagsen 公开表示,他所获奖的作品实际上是由 DALL·E 2 创作而成。 他质疑彼时的摄影比赛是否已经准备好接纳 AI 生成的影像,并指出他通过提交 AI 作品参赛,试图测试这一问题,结果发现比赛并没有准备好应对这种情况。 Boris 的提醒振聋发聩,我们不能像对待房间里的大象一样,对 AI 在艺术创作领域,乃至各领域的介入视而不见。 假使有一日当人们无法区分 AI 生成的内容和人类创作的内容,并且意识到 AI 在某些领域的能力已经接近甚至超越了人类时,或许我们需要重新定位人类的价值和意义。 科幻小说《三体》中描绘了人类面对外星文明威胁时的反应,为我们提供了一个有趣的类比。 三体人拥有远超人类的科技,能够轻易摧毁地球文明。他们派出「智子」监视和干扰人类的科技发展,而人类的应对措施也反过来推动了科技和战略思维的进步。 正如著名未来学家阿尔文·托夫勒在《未来的冲击》中所警告的:「技术的发展速度远远超过了我们适应它的速度。」 历史上,面对新技术带来的冲击,总有一部分人选择抵制和破坏。 在上世纪 90 年代,破茧而出的计算机网络和互联网也遭到了一些传统行业的抗拒。很多公司和个人担心网络会导致信息泄露、隐私问题和业务不稳定等问题。 但现实给了我们一记清脆的耳光,很快人们爱上的第一台机器正是曾经抵制的电脑。 或许我们应该换个思路来看待当下的 AI(人工智能): 不必抱着你死我活的态度,它不是虚假的智能,只是不是人类的智能。 而机器以历史上从未有过的方式思考、学习,乃至与人类合作共事,这恰恰是我们最为擅长的事情。
AMD杀疯了!豪掷350亿收购支持英伟达芯片的AI服务器系统龙头ZT Systems
(图片来源:钛媒体App编辑拍摄) 刚收购完赛灵思两年多,“苏妈”再度开启“买买买”。 北京时间8月19日18点,美国芯片巨头AMD公司宣布,以现金+股票交易方式收购全球最大超大规模计算公司、领先的 AI 基础设施系统提供商ZT Systems,交易价值高达49亿美元(约合人民币350.14亿元),从而大幅扩展AMD数据中心 AI 系统业务。 AMD表示,49亿美元中,包括根据交易完成后的某些里程碑支付的高达 4 亿美元的或有付款。该公司强调,ZT Systems在设计和优化云计算解决方案方面拥有丰富经验,此次收购还将帮助云和企业客户显著加快大规模部署由AMD提供支持的AI基础设施,促使AMD提供基于跨芯片、软件和系统创新的领先AI训练和推理解决方案。AMD 预计,到2025年底,该交易将在非GAAP收入基础上实现增值。 该交易已获得 AMD 董事会一致批准,目前预计收购案将于2025年上半年完成,但须获得某些监管部门的批准并满足其他常规成交条件。收购完成后,ZT Systems将成为AMD数据中心解决方案业务集团的一部分。AMD将保留该公司的设计和客户团队,并考虑出售制造部门。 AMD董事长兼CEO苏姿丰博士表示:“收购 ZT Systems 是我们长期 AI 战略的下一个重要步骤,旨在提供可在云端和企业客户中快速大规模部署的领导力培训和推理解决方案。ZT带来了世界一流的系统设计和机架级解决方案专业知识,将大大增强我们的数据中心 AI 系统和客户支持能力。此次收购还建立在我们为加速 AI 硬件和软件路线图而进行的投资之上,将我们的高性能 Instinct AI 加速器、EPYC CPU 和网络产品组合与 ZT Systems 业界领先的数据中心系统专业知识相结合,将使 AMD 能够通过我们的 OEM 和 ODM 合作伙伴生态系统大规模提供端到端数据中心 AI 基础设施。” 消息公布后,AMD美股大涨,盘前现涨超2%,此前跌近1%。 据悉,ZT Systems总部位于美国新泽西州锡考克斯(Secaucus),拥有超过15年为全球最大的云公司设计和部署数据中心 AI 计算和存储基础设施的经验。ZT Systems 的设计、集成、制造和部署能力使其成为 AI 训练和推理基础设施的领先提供商之一。 值得注意的是,英伟达、OpenAI一直是ZT Systems的客户。今年6月,ZT Systems宣布推出采用 NVIDIA GB200 Grace Blackwell 超级芯片的 ACX200 解决方案,用于下一代加速计算。 因此,鉴于英伟达和AMD的关系,这意味着,AMD收购ZT Systems完成之后,与英伟达的合作或将停止。 交易完成后,ZT Systems 将加入 AMD 数据中心解决方案业务集团。ZT 首席执行官 Frank Zhang 将领导制造业务,ZT Systems总裁 Doug Huang 将领导设计和客户支持团队,两人均向 AMD 执行副总裁兼总经理Forrest Norrod汇报。AMD 将寻求战略合作伙伴收购 ZT Systems 业界领先的美国数据中心基础设施制造业务。 ZT Systems 首席执行官 Frank Zhang 表示,“我们很高兴加入 AMD,共同在设计定义计算未来的 AI 基础设施方面发挥更大作用。近 30 年来,我们不断发展业务,成为全球最大云公司的关键计算和存储基础设施的领先供应商。AMD 与我们有着共同的愿景,即我们的技术和员工在设计和构建支持全球最大数据中心的计算基础设施方面发挥着重要作用。” 事实上,就在2022年2月,AMD宣布以全股票交易方式完成对FPGA大厂赛灵思公司的收购,交易价值为498亿美元(约合3165亿元人民币)。收购完成之后,AMD CEO苏姿丰将继续担任公司的CEO,赛灵思总裁兼CEO Victor Peng将加入AMD,任新成立的自适应和嵌入式计算集团 (AECG) 的总裁。然而,预计到8月30日,Victor Peng将从AMD公司退休。 如今,收购赛灵思不足3年,AMD再度出手收购产业链龙头,加注 AI 算力赛道。 AMD强调,在过去 12 个月中,除了增加有机研发活动外,AMD还投资了超过10亿美元来扩展 AMD AI 生态系统并增强公司的 AI 软件能力。 (作者|林志佳,编辑|胡润峰)
“华为天才少年”再放大招!一口气发布五款商用人形机器人:灵犀X1为最大“彩蛋”,可以实现“0元购”
图片来源:摄图网 目前,人形机器人成为科技界最炙手可热的赛道之一,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品。随着人工智能和机械技术的快速发展,人形机器人的应用前景广阔。它们不仅可以在制造业中发挥作用,还能用于个人服务、医疗护理和教育等领域。人形机器人的出现将改变人们的生活方式和工作方式,提高生产效率和生活品质。 8月18日上午,智元机器人举行2024年度新品发布会,智元联合创始人“稚晖君”(彭志辉)主持并发布了“远征”与“灵犀”两大系列共五款商用人形机器人新品。彭志辉还展示了智元在机器人动力、感知、通信、控制四大领域的自主研发成果,以及具身智能G1到G5技术路线图和AIDEA具身智能数据系统。 “稚晖君”有着“华为天才少年”、“野生钢铁侠”等称号,曾在2020年加入华为,从事昇腾AI芯片和AI算法相关研究工作。同时,他也是个科技up主,在哔哩哔哩有着超过250万的粉丝。2022年底,“稚晖君”离开华为,于2023年成立智元机器人。据企查猫显示,上海智元新创技术有限公司成立于2023年02月27日,注册资本6,991.7342万人民币,法定代表人舒远春,公司经营范围包括:智能机器人的研发;服务消费机器人销售;智能机器人销售;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能应用软件开发;人工智能公共数据平台;人工智能通用应用系统;人工智能硬件销售;人工智能基础资源与技术平台等。 智元此次发布的五款商用人形机器人新品,采用了家族化设计语言,有轮式与足式两种形态,覆盖交互服务、柔性智造、特种作业、科研教育和数据采集等应用场景。这五款商用人形机器人分别是:交互服务机器人远征A2、性智造机器人远征A2-W、重载特种机器人远征A2-Max、全栈开源机器人灵犀X1和专业数采机器人灵犀X1-W。 智元机器人合伙人兼营销服副总裁姜青松透露,智元双足人形机器人预计今年10月份开始量产,后期预计一个月生产100台。智元机器人今年整体出货量预计达300台左右,其中人形200台、轮式机器人预计出货100台左右。他强调,“最终肯定可以超过300台这一数量”。 值得一提的是,在发布会的尾声,远征A2-W推着一个“神秘箱子”缓缓上台,这正是本场发布会最大的“彩蛋”——智元机器人首个模块化机器人灵犀X1,身高133厘米,体重不到66斤,十分小巧。 灵犀X1由智元X-Lab打造,这是智元于6月新成立的一个实验室,又叫“稚晖君实验室”,专门做一些前沿技术创新类研究。“稚晖君”表示,这是一个基于创新和热爱诞生的实验室,因此灵犀X1的定价为0元,大部分设计资料和代码,包括本体的设计图纸、软件框架、中间件源码、基础的运控算法等将被开源,以吸引更多人才加入行业生态共建,开启“人形机器人人人造”的时代。 回看人形机器人行业发展情况: ——科技企业与跨界龙头纷纷布局人形机器人 当前人形机器人的主要布局者多为科技公司。此外,也有多家跨界公司入局。从国内企业来看,2022年8月,小米发布人形机器人Cyberone;2023年4月,腾讯(Robotics X实验室)发布了灵巧操作研究成果,并推出自研机器人灵巧手TRX-Hand和机械臂TRX-Arm;2023年8月,智元机器人推出远征A1,对百亿级别的开源大模型进行了调优,使其具备理解人的指令,并对指令进行任务编排、执行闭环的能力;同月,均普智能宣布基于丰富的工业机器人经验,正在积极研究探索人形机器人领域的业务机会,以进行规划和布局;同月,字节跳动拟入局机器人,探索把AI大模型能力用到机器人上,目前并未确定机器人的具体形态与具体数量目标。 ——准直驱方案有望成为部分关节首选 特斯拉当前的方案采用的是传统的刚性驱动器的结构,特点是精度高,但功率密度达不到生物肌肉的水平、抗冲击性也一般,不太能适应复杂的地理环境。除了刚性驱动器外,还有弹性驱动器、准直驱等方案,控制算法会复杂、精度一般,但安全性和效率显著提升,其中准直驱方案在一些四足狗、人形机器人方案中使用较多。 相较于刚性驱动器方案(无框力矩电机+谐波减速器+力传感器+编码器),准直驱方案多采用直驱电机低减速比的行星减速器磁编码器,无须昂贵的力传感器,通过电流环直接实现力控,故适合力控精度要求高、响应快、抗冲击的场合。目前国外UCLA的机器人Artemis自研四个准直驱模组用于髋关节。 ——人形机器人应用市场将由细分领域突破到通用型 参照自动驾驶,从L1到L3是经历5年以上迭代的,并且完全自动驾驶L5也仍需时间。人形机器人的成熟也是渐进式,可在细分市场的率先商业化,如工厂生产、安防巡检、物流配送、服务业引导、救援、军事等,初期功能单一,后逐步成熟转为通用型机器人,由Tob转为Toc,进入家政等市场;更远的未来,人形机器人有望应用于航天航空领域。 根据人形机器人行业快速发展的趋势,随着商业化步伐持续加快,行业将迎来一波爆发性增长。据《人形机器人产业研究报告》预测,至2024年,中国人形机器人市场规模将达到约27.6亿元,而到2029年,该市场规模有望扩大至750亿元,占据全球市场的32.7%,到2035年有望达到3000亿元。
国产AI机器人好超前…弹琴泡茶打咏春,还能撸猫??
量子位 | 公众号 QbitAI 什么水平,让海外最火AI机器人Figure的CEO都第一时间关注? 国产人形机器人大秀肌肉,最新技能居然是弹琴泡功夫茶……和颠勺?! 手握琴竹,精准轻巧敲击每根琴弦,演奏动听音乐。 熟练泡一壶功夫茶,十几道工序、数个杯壶轻松拿捏。 搞定一份香喷喷的华夫饼,最后还附送一个祖传颠勺。 “闲情逸致”时还能带你练练咏春,这不就是机器人版叶师傅? 注意哦,以上操作都是机器人独立自主完成,原倍速展示。 不仅手超稳,而且各个动作行云流水、一气呵成,像吃了德芙般丝滑。 甚至是泡功夫茶这种繁琐的长序列任务,它脑子也规划得清清楚楚,把十几个不同的步骤,陶瓷、金属、木、茶叶等不同材质、到不同形状的碗、盏、壶、杯,拿捏得死死的。 这需要机器人能像人一样学习、规划和执行,有强大的泛化能力和通用智能。 如上就是今天正式发布的中国人形机器人Astribot S1。 它由初创公司星尘智能(Astribot)开发,而且不玩虚的,8月21日到25日会在北京的世界机器人大会上直接亮相,对公众展示。 今年4月,S1在首次技术展示中,凭借熨叠衣、分拣收拾、颠锅、吸尘到竞技叠杯等几十个对机器人高难度,对人真有用的炫技动作,初登场就引发国内外不小讨论。 美国网友惊呼:中国AGI级别机器人震惊全!行!业! 不到4个月,Astribot S1以整机形态正式发布,这次又为你做了什么? 做家务使工具秀武术十项全能 Astribot S1的技能中,很大一部分是大家最关心的做家务环节。标语就是: 你远行无忧(尽管去浪),我守护家庭温暖。你在家悠然(放着我来),我助你乐享生活。 先做华夫饼,暖。 S1能稳稳抓着汤勺舀出面糊,倒进华夫饼机。 识别出面糊铺满锅底后,它抓住锅柄合上盖子。 这个过程中,机器人的腰部关节很重要。抓住打开的锅柄,需要一个探身的动作。如果机器人的腰不能配合上臂,很难完成这个大幅前伸的动作。 然后“扭开”旋钮给面糊加热。 “抓”叉取饼,不忘展示“翻”手腕颠饼的骚操作。 继续挑战长长长长长工序的泡功夫茶,暖。 它不仅考验机器人的精细操作,更看在环境、任务、物品的复杂度交织时的智能规划。 泡茶一般涉及洗茶、冲泡、倒茶、分茶等多个环节,每个环节要用多种不同工具。 它需要判断出各个环节使用哪些工具,还要抓握一系列完全不同的物品。 它需要实时调整力控。比如从陶瓷杯子中舀出茶叶时,陶瓷光滑易碎,不能用太大力抓握;但是下一个动作马上是拿起金属水壶倒水,机器人就实时调整力控,确保可以拎起水壶倒水。 除此之外,Astribot S1还会使用吸尘器。它怎么知道腰部反弓大腿发力能减少腰酸……怕是常去健身房。 给猫猫喂饭,特暖。 甚至是远程逗猫。 主人只需戴上XR头显,在工位都能陪自家猫主子玩,带薪吸猫! Astribot S1会通过设备实时远程获取人类手部运动轨迹,然后根据轨迹计算出自身双臂该如何协调,确保自己能在家有效和猫猫互动,同时又不搞乱房间or被误伤。 这需要机器人的运动系统能够快速响应,并能处理复杂的空间关系。 与此同时,Astribot S1还丝滑复刻了更多专家技能。 比如演奏扬琴。 因为琴弦和琴竹带弹性,对精准力控要求极高,机器人必须每次敲击马上准确反馈力觉,并实时调节敲击角度,太轻会触不到琴弦,力太大会出杂音,太慢乱节奏。S1:我太难了…… 而上次丢纸飞机,这次上投篮。 这个动作需要机器人全身姿态协同配合,开始时持球弯腰并抬高肘部,然后在腰部逐渐直立时调整手腕,最后腰和手同时发力投出篮球。 还有预告片里,跳海草舞还顺便极限下腰,自由度炸裂。 对比3个月前的首次技术展示,Astribot S1一路开挂。 不仅移动和操作范围变大了,环境和任务也更复杂,精细化程度更高。 这些高难度、长序列、可泛化任务,Astribot S1是如何实现的? 高价值的上半身+可落地的下半身 首先在形态上,Astribot S1采用人形上半身+轮式底盘的路线。 上肢操作正在逐渐成为具身智能的焦点,自然界能用手干活的基本都是智能化水平非常高的哺乳动物,而人类大部分操作都由上肢和手完成,因此上半身的智能决策+操作,就成了解决真实需求、能实际落地应用的核心技术壁垒。而S1在4月刚面世时,就主打一个同规格机器人中“最强操作”。 而代表移动能力的下半身,星尘选择了“可落地”的轮式,稳定性高、能耗低、控制简单,更重要的是人类大部分时间都在平面环境生活工作,比如家庭、办公室、工厂和购物中心等,轮式已经能覆盖很大一部分应用场景。 而头、手、躯干均采用模块化设计,可按不同需求灵活组装或拆卸。 S1身体指标极度仿人,单臂自由度为7,和人类一样。手部有2根机械手指,能完成大多数任务,灵巧手也在研发中。 运动以及单臂负载能力都超过了人类普通男性,定位精度达0.03mm。 多维数据高效采集 突破具身智能瓶颈 如果机器人的智能看AI,那AI就看数据、算法和算力这三大要素。 GPT能产生划时代的突破,离不开数以百亿的训练数据,这些数据在互联网容易获取。而训练机器人,直接可用的数据几乎为零。因此能否获得高质量且足够便宜的数据,成了当下制约机器人发展的瓶颈,和拉开公司竞争的重要手段。 而星尘就在具身智能数据获取上具备独特优势。 一方面,S1能从海量的真实世界视频数据、人体动作捕捉数据中快速学习。另外,S1还能以第一人称视角高效收集视觉、听觉、触觉到力觉等最接近真实世界的多维度、高质量数据。 综合这些高质量数据,星尘就能进行更高效的规模化训练,同时降低了机器人高质量数据的采集成本、数据量级和新任务训练难度,极大提升了泛化性。 当与真实世界持续交互,S1能源源不断产生新的“学习资料”,从而持续学习进化,向通用人工智能迈进。这也是S1能在学习、思考和执行上如此像人的关键。 而在AI算法上,加载大模型,让S1具备在复杂环境中的感知、认知、实时决策能力,及智能理解和多模态交互执行能力,实现物体、任务和环境级别通用操作泛化。 这意味着S1有了“最强大脑”,能更快速适应新环境、新事物,“举一反三”,“一通百通”。 刚柔耦合传动 最强操作还安全 机器人的全能,极大依赖其身体,也就是本体或硬件。 S1的“最强操作”,就来自其独特的刚柔耦合传动机构设计。通过将传感器装入传动过程中,S1能实时监测力的传输。比如削黄瓜时,不是依赖轨迹估算,而是像人一样,精准感知削皮刀压到黄瓜上时力的大小,再精准控制力的输出,这种特殊的传动结构,显著提升操作精度。 值得一提的是,通过刚柔耦合的硬件设计和创新力规划算法,让S1具备极高安全性。通过刚柔耦合硬件设计和创新力规划算法,它能在交互中精确控制力度,在运动中不伤人、不伤物、不伤自己。够安全,才有落地可能。 得益于这套悉心打磨的完备技术方案,Astribot S1的发布总能给人一种“技惊四座”之感。 当下具身智能领域正处于“百花齐放”的时期。不仅新秀林立,各家机器人的形态和技术路线也各有千秋。 Astribot S1的技术路线如何形成? 出自腾讯机器人实验室一号员工之手 回答这一问题,还需从Astribot S1幕后团队看起。 星尘智能(Astribot),成立于2022年12月;名字源自拉丁古谚语 “Ad astra per aspera”,意为“穿越苦旅,以达星辰”,代表了公司对AI机器人技术普及的长期计划与坚定承诺。 创始人兼CEO来杰,具有16年机器人研发经验,是AI和机器人领域的“老兵”。他于2014年加入百度,后担任“小度机器人”团队负责人。 2018年,计算机视觉和机器人领域世界知名专家张正友博士,也是腾讯最高专业职级的杰出科学家,当时正在筹建腾讯RoboticsX机器人实验室,来杰以一号员工的身份加入,之后主导研发了轮腿式机器人Ollie。 星尘智能的另一位创始人戴媛,在UIUC获得学士学位,后在UCLA拿下博士学位,主攻机器人感知。她在Nature Comm和Science Adv等顶刊上发表过30多篇论文,拥有70多项机器人专利。与来杰相同,她也是2018年就加入了刚刚成立的RoboticsX。 也得益于在腾讯RoboticsX机器人实验室的经历,星尘智能非常重视Design for AI的“软硬一体”能力,还搭建了与RoboticsX相似的团队结构,一半人主攻机器人本体,另一半强调用AI算法去做感知和运动控制,以此来探索AI和机器人的强耦合。 团队也大多来自腾讯、谷歌、华为、大疆等企业,和国内外顶尖高校和人工智能研究院。 让数十亿人拥有AI机器人助理 从成立第一天起,星尘智能的愿景就是让数十亿人拥有AI机器人助理。 这样的机器人助理,要能像人一样学习、思考和劳动,与人流畅智能交互,会使用人的工具和设备、帮人完成枯燥、困难或危险的任务,才能不断拓展应用场景边界,引领“AI+机器人”技术革新。 公司很快完成数千万美元的Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本超额跟投。 从四月技术展示,八月整机发布,星尘同时宣布于2024年内商业化。且通过关键零部件自研,S1具备明显的成本优势和价格竞争力。 总之,方方面面,星尘智能的脚步都很快。 而最快的,恐怕是机器人本身。四月时,创始人兼CEO来杰就放话: 欢迎大家来给S1提需求! 这样它的能力才能从55%、85%成长到99.99%,无限接近人类水平。 前文展示的打咏春拳这个能力,说不定就来自四月网友,如今已经实现了。 那你希望S1能为你做什么?
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
大语言模型(LLM)因“涌现能力”(emergent abilities)而拥有了超出人类预期的技能,但也因此让人类十分忌惮:操纵、欺骗人类,自主实施网络攻击,自动化生物研究...... 然而,也有专家认为,这种过度的担忧会损害开源和创新,不利于人工智能(AI)行业的健康发展。当前,有关“AI 灭绝伦”的争论愈演愈烈。 那么,“涌现能力”真的是导致 AI 大模型威胁人类生存的罪魁祸首吗?一项最新研究否定了这一观点。 来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。 他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多所谓的“涌现能力”,其实都是 AI 大模型在面对不熟悉的任务时,依赖于已有的数据和经验做出的“即兴表演”。 相关研究论文以 “Are Emergent Abilities in Large Language Models just In-Context Learning?” 为题,已发表在 AI 顶会国际计算语言学年会(ACL)上。 他们通过一系列实验验证了 AI 大模型在不同上下文条件下的表现,结果发现:在零样本(zero-shot)的情况下,许多大模型根本无法展现所谓的“涌现能力”,反而表现得相当一般。 他们表示,这一发现有助于理解 LLM 的实际能力和局限性,并为未来的模型优化提供新的方向。 智能涌现:只是“即兴表演”? AI 大模型的“涌现能力”来自哪里?它是否真如听起来那样神秘,甚至令人担忧? 为了破解这一谜题,研究团队选择了 GPT、T5、Falcon 和 LLaMA 系列模型作为研究对象,通过实验分析了非指令微调模型(如 GPT)和指令微调模型(如 Flan-T5-large)在 22 个任务(17 个已知的涌现任务和 7 个基线任务)和不同条件下的表现。 图|模型列表。 为了全面评估模型能力,他们将 Exact Match Accuracy、BERTScore Accuracy 和 String Edit Distance 作为评估指标。同时,为了提高实验的准确性,他们还进行了偏见控制,通过调整提示和输出格式,确保非指令微调模型的公平性,并通过手动评估验证模型输出的准确性。 在实验中,研究人员采用 zero-shot 和少样本(few-shot)两种设置,重点分析了 GPT 的表现能力。 图|非指令微调 GPT 模型在零样本下的表现。 令人惊讶的是,尽管 GPT 在之前的研究中被认为具有涌现能力,但在 zero-shot 的情况下,这种能力表现得非常有限。 具体而言,只有两个任务在不依赖上下文学习(ICL)的情况下展示了涌现能力,这两个任务主要依赖形式语言能力或信息检索,而非复杂的推理能力。由此可以得出,在没有上下文学习的条件下,GPT 模型的涌现能力受到了极大的限制。 然而,涌现能力的来源仅仅如此吗?研究团队又将目光转向了指令微调模型,提出了一个大胆的假设:指令微调并非简单的任务适应,而是通过隐式上下文学习,激发了模型的潜在能力。 通过对比 GPT-J(非指令微调)与 Flan-T5-large(指令微调)的任务解决能力,他们发现,尽管两者在参数规模、模型架构和预训练数据上存在显著差异,但在某些任务上的表现却出奇地一致。 图|两个模型的表现在高于随机基线部分有很大的重叠,这表明指令微调可以有效地获取上下文中的能力,而非导致功能性语言能力的涌现。 这一现象表明,指令微调模型可能并不是在展示一种全新的推理能力,而是通过隐式上下文学习,巧妙地利用了已有的上下文学习能力。 进一步的实验表明,无论是模型规模的增加,还是训练数据的丰富,指令微调模型在 zero-shot 的情况下,仍然能够与非指令微调模型表现出相似的任务解决能力。这一发现再次强调了指令微调与隐性上下文学习之间的紧密联系。 AI威胁人类生存:真实还是夸大? 尽管 LLM 在任务表现上展现出超凡的能力,但研究结果表明,这些能力并不意味着 AI 对人类生存构成实质性的威胁。 首先,LLM 的涌现能力主要来源于上下文学习和指令微调,这些技术在模型的设计和训练中是可以被预测和控制的,并未表现出完全自主发展的趋势,也没有产生独立的意图或动机。 例如,在社交智力测试(Social IQA)中,模型能够正确回答涉及情感和社会情境的问题,例如:“卡森醒来去上学时很兴奋。他为什么要这样做?” 在这一问题中,模型通过上下文学习和指令微调,能够超越随机基线(random baseline),选择出合理的答案。这说明模型并非在自发产生某种“智能”,而是在具体输入和设计条件下展现出的一种高级模式识别能力。 其次,研究发现随着 LLM 规模的扩大,这些能力表现得更加显著,但并未脱离设计者的控制。通过对模型的微调,可以引导 LLM 更好地理解和执行复杂任务,而这种能力的增强并不意味着模型会产生自主意识,还不足以对人类产生威胁。 在实验中,LLM在特定任务上的表现大大优于随机基线,尤其是在需要推理和判断的任务中。然而,这种表现依然依赖于大量训练数据和精心设计的输入提示,而非模型自发的智能觉醒。 这一结果进一步证实 LLM 的涌现能力是在可控范围内发展的,虽然这一假设仍需进一步的实验证实,但为研究理解大模型的涌现能力提供了一个全新的视角。 研究指出,虽然未来人工智能可能会在功能性语言能力上进一步发展,但其潜在危险性依然是可控的。现有证据还不能支持“AI灭绝伦”的担忧,相反,AI 技术的发展正在逐步朝着更加安全和可控的方向前进。 不足与展望 尽管这项研究为理解 LLM 的涌现能力提供了重要的见解,但研究人员也指出了该研究的局限性。 当前的实验主要集中在特定的任务和场景下,而 LLM 在更加复杂和多样化的情境中的表现尚需进一步研究。 研究人员表示,模型的训练数据和规模仍然是影响涌现能力的关键因素,未来的研究还需进一步探索如何优化这些因素,从而提高模型的安全性和可控性。 他们计划进一步研究 LLM 在更加广泛的语言和任务环境中的表现,特别是如何通过改进上下文学习和指令微调技术来增强模型能力,且确保安全性。 此外,他们还将探讨如何在不增加模型规模的情况下,通过优化训练方法和数据选择,实现涌现能力的最大化。
救命妈妈!我一字一句写的作业,又被AI判抄袭了
大家好,我是美国高中在读十年级的Jennifer。自从AI出现以来,我和我的同学都迫不及待地成为了它的忠实用户,非常好用。 随着学生用AI越来越多,我所在的美高老师都用AI来检测作弊情况,却时常出现误判的情况。 在谷雨星球一篇爆款文章里👉🏻《第一被AI淘汰的专业出现了?!》就提到了AI对非母语使用者的不友好,确实如此: ——自己辛辛苦苦一字一句写的作业,竟经常被它判定为「100%抄袭」! ▲ 哲学教授 Antony Aumann 因作业中的语法过于完美而发现学生使用 ChatGPT 代笔,引发对 ChatGPT 到底是教育工具还是抄袭的争议。截图来自 Youtube 视频 当时我以为这种情况只是个例,但万万没想到,我有一次完全自己写出来的历史作业,也被判定为「50%AI写作」。 而且不光是我这个国际生,连美国本土长大的同学,也被AI这样坑过。 这也让我产生了莫大的好奇: AI到底是如何判定一份文本是否抄袭的?如果我让AI自己写一份,再让AI自己去批改,结果又会如何?我们还该继续相信AI吗? ■这是我妈妈的留言 被老师鼓励使用的AI 从去年ChatGPT出现,学校对于AI的使用还是比较鼓励的。 我们老师就曾在晨会上聊过这个话题——并不是那种严肃深刻地讨论,而是更加包容且有互动性地表达一些观点并和同学们交流。 后来,在今年的一个关于选课的会议上,我们学校的CS老师介绍了一门关于AI研究的新课程,也针对AI的出现做了一些更加详尽地解释和说明,并且倡导大家合理地使用,保持好与AI的边界。 因为学校的态度还是比较「鼓励」的,我们也就比较频繁地使用着ChatGPT,它能很大地帮我提高学习效率,保持作业的准确率。 ■美高需要大量阅读,这些AI工具都可以帮我快速阅读和总结 那么,什么是「与AI的边界」呢? 准确来说,因为AI经常编造一些资料来源、引用等等,所以我觉得无论它多么完善,主导者依然需要是我们自己,而不能完全依赖AI。 完成作业的时候,我一般会用AI去给我一些建议。 比如英语写作project的语法修改建议或是结构建议,在这些方面AI确实比我们细致一些。 ■可以给出详细语法修改建议的Grammerly AI 数学方面,AI对我来说更是一个「进阶版作业帮」的用处,它最大的好处就是,在我遇到不会的题的时候,会给我非常详细的每一步思路,如果我不会,还可以追问它,就像一个一对一的老师。 但最大的问题是,AI的答案经常是错的。所以建议大家使用的时候,重点借鉴它的思路,答案还是要自己亲手算出来。 ■数学辅导AI有很多,通常都是上传作业后给出详细的每一步思路,比如这个号称正确率高于ChatGPT的Tutoreva(近期我们也会分享好用的数学AI资源) 还有,有时候我们西班牙语会有一些presentation,比如最近我们需要做一个关于某个城市的旅游介绍,需要先制作一个包含十个活动的旅游攻略。 这时候我们老师会说这一部分可以给到ChatGPT做出来一个大纲,但是具体内容需要我们自己写。 ■ChatGPT也是西班牙语等二外的学习助手 被AI背刺 AI在美国校园的使用越来越普遍,但问题也应运而生,比如作弊。 相应地,如今也出现了很多AI检测工具,像是Turnitin GPT,GPTZero等等,可以做论文查重,防止有人直接让AI代替自己写作业。 前段时间,我的学校历史课有一个作业是关于撰写一篇自己选择的历史事件的分析,前期的要求是进行research以及大纲撰写。因为我有改述一部分资料上的内容,所以我就比较好奇我的查重率会不会变高。 于是,我就在网上随便检索了一个查重检测工具,想看看会不会有什么有趣的发现。 毫无疑问,我的thesis statement通过了查重检测,显示「没有抄袭」。但是当我看到下面的「AI Detector」按钮的时候,我突然想到前段时间一直让我感到疑惑的问题: 无论是自己写的、又或是AI写出来的内容,都是由一个一个词藻组成的,AI到底会用什么分别其区别呢? 即使真的能够分辨出来,它的准确性是否值得参考呢?因此,我便把我的thesis statement又放在了这个AI检测的栏框里。 令人惊讶的是,AI检测给出的结果竟然是:我的内容有40%的可能是AI创作的! 至此,我开始对AI检测的真实可靠性产生了怀疑。因为各种不同的检测网站层出不穷,我便试图又找了几个网站希望获得一些其他的信息。 有些搞笑的是,这几个AI检测的网站中,每个检测结果都大相径庭。有的AI说100%都是人类写的,有的则说40%是用AI写的。 无所不能的AI出现了如此出人意料的漏洞,彻底点燃了我的探索欲——如果ChatGPT自己写一段文字,再让别的AI去检测,结果会是如何? 我便又让ChatGPT帮我写了一个相似方向的thesis statement,提交给不同的AI检测工具。 这次的结果,比检测自己的内容还让我更加出乎意料——这些100%由AI写的东西,在某些网站竟被判定为「人类撰写」。 这下我彻底迷惑了:人类写的被判定为抄袭AI,而AI自己写的又被归为人类的功劳,人工智能到底在干什么? 第二天上课的时候,我们被两两分成了小组互相讨论彼此作业的内容。我和我的同桌便探讨起了关于AI检测的内容。 接着,他也尝试把自己写的作业放进不同的检测工具里,看看AI是否能够较为准确地分辨和识别,最终的结果令我们两个人都惊了—— 一位纯英语母语者,作业竟然也被判定为AI写作。 我想,作为一个非母语者,或许语言能力没有母语者那么地道是一个情有可原的事情。但这个离奇的结果告诉我: AI不单单歧视的是非母语者,而是所有人类。 ■斯坦福一位学者的论文发现,AI在判定非母语者的论文时,会变得格外不可靠 那么到底是为什么,AI总是把在检测查重的时候背刺我们人类呢? 这个问题困惑了我很久,于是我查阅了资料。 斯坦福大学生物医学数据科学教授詹姆斯·邹发现,AI检测的指标依据叫做perplexity(困惑度),也就是词汇丰富度,词汇多样性,句法复杂性和语法复杂性。 显然,非母语人士会在这个指标上得分比较低,会被认为语言过于机械和匮乏。 相应地,要想绕过人工智能审查也非常容易,只要在自己写的内容里,加入一段AI生成的「包含复杂文学性语言」的语段,就能轻松获得高分。 ■这两年出现很多这类事情,比如这个新闻里的妈妈,女儿的作业被AI判定为90%抄袭,她花了几个月的时间向教育部门申诉,因为这个记录会影响大学录取 对我而言,语言能力其实是一个很笼统的表述—— 就像托福作为一个语言能力测试,分成了4个方面听说读写,有些人有一门或者两门十分出类拔萃,剩下的一两门不是那么显眼,或是获得了不是那么优异的成绩。 这算学习语言的能力过于机械、过于缺乏吗? 或者就说我自己,我是一个非常不擅长应试的人,这样的标准化考试会让我感到紧张、焦虑,但是我的GPA不算低、学校的成绩也能比较轻松地handle住,这算是语言机械、抑或是语言能力的缺乏吗? 应试能力≠学习能力,每个人能力也不应该被任何事物标签化,我觉得才是留学真正让我收获的意义。 ■几天之后的历史课,老师讲到了我们research的一些citation要求,虽然和之前的要求相差无几,但是这次多了一个关于AI Citing的要求。 我还会相信AI吗? 被AI「耍」了好几轮,我还会继续使用并相信它吗? 在我的观点里,AI依然是一个作为学生值得学习、探索以及使用的工具。 AI在很多时候能够让我节省很多时间,比如复习某个科目的guideline,一些难解的问题找不到方法,AI都能够高效地帮我筛掉无效信息,检索出最精确的我所需的内容(虽然有时候还是会抽风)。 除此以外,我觉得我这段时间的一个特别的小的经历,也能够推动我对AI的态度有更清晰的认知。 最近上数学课的时候,我们班的有一个同学问老师,这些复杂的微积分题目在未来到底对我们有什么用,我们又不会成为数学家、科学家。 老师的回答给了我一个对于学习所有科目的新思路: 「学习数学的目的并不是为了在未来解更多的数学题,而是为了培养一种我们的数学思维,这种思维模式能够让我们有更清晰的思路,去解决更多在未来面对的不同的难题。」 ■罗博深教授曾来分享的时候也说过,「确保孩子拥有旺盛的好奇心和求知欲,用头脑和工具提供创新的解决办法,才能解决无数没见过的新问题」(罗教授的女儿也是本文作者的学姐,申到了MIT和加州理工,最终选了后者) 所以,当我看到《第一个被AI淘汰的专业出现了?!》中讨论翻译会不会被彻底取代的时候,我的第一反应是并不会。 就像翻译有翻译器,艺术有AI作画,但是其中的思维模式、学习能力,以及艺术灵感和人文思维,恰恰都是AI无法代替的。 这些能力并不会局限于某个领域,而是在生活中解决不同的生活问题的时候伴随着我们,让我们用积攒的能力获得难题的最优解。 ■目前AI总是画不好人类的手和脚,有人猜测,这是AI在故意露怯,缓解人们对于AI接管世界的恐惧:「你看,我连手和脚都画不好,怎么会代替你呢?」
昆仑万维进军短剧市场,发布AI短剧平台SkyReels
8月19日,昆仑万维领先发布集成视频大模型与3D大模型的AI短剧平台SkyReels。SkyReels平台集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,让创作者“一键成剧”,轻松制作高质量AI视频。 国海证券研报提到,AI有望提高短剧产能,降低成本。据昆仑万维的实践,其采用游戏引擎技术与视频大模型混合构建的WorldEngine,用于视频生成可以将成本降低百倍以上。在可见的未来,技术平权或将带来一个全新的短剧生态。 “生产内容的门槛每降低一倍,创作内容的人数增长十倍。”这是昆仑万维董事长兼CEO方汉在7月世界人工智能大会期间提出的一个判断,他认为,AI将带来全球文化平权和巨大的出海红利,也会催生大量的新的AI UGC平台。 在这样的判断下,昆仑万维入局AI短剧并不突然。与此同时,短剧市场近两年增长迅猛,短剧也是内容赛道当下的新增长极,基于昆仑万维此前多年的AI与娱乐产品孵化与运营经验,AI短剧赛道将杀入一名猛将。 制作周期缩短至小时级 昆仑万维此次推出的AI短剧平台SkyReels,与当下视频生成赛道的可灵AI、智谱清影等平台有显著区别,赛道更垂直,功能也更细分和全面,不仅仅是是“生成一段视频”,而是从创意的概念到最后成片的全流程创作。 据官方的介绍,SkyReels是AI驱动的全流程短剧创作平台,集剧本生成、角色定制、分镜设计、视频拍摄与合成于一体,这样的一站式短剧创作平台,能将制作周期从周级缩短至小时级,一个人即可独立完成创作。 SkyReels背后,有几大模型和引擎支撑,包括昆仑万维自研的剧本大模型SkyScript、自研的分镜大模型StoryboardGen以及业界率先将AI 3D引擎与视频大模型深度融合的创新平台WorldEngine,基于此,SkyReels拥有支撑短剧创作全流程的能力。 (SkyReels在剧本质量、分镜质量、人物表演等各维度质量评估) 具体操作上,在SkyReels中用户只需简单输入一个概念或创意,系统就能自动生成一份结构完整、情节丰富的剧本,并且提供不同类型和风格的故事模板供选择。 短剧创作最重要的是戏剧冲突或者说观众情绪上的“爽点”,据介绍,昆仑万维首先构建了亿级的高质量短剧结构化数据集SkyScript-100M,该数据集针对海量精彩短剧的剧情节奏、爽点、情绪变化进行了高质量标注,基于这些高质量且结构化的训数据得到的剧本大模型,能生成高质量的故事情节,包含戏剧冲突、爽点及情感表达,能保证剧本的吸引力。 此外,如果创作者有更多自己的想法,SkyReels也支持创作者导入已有剧本文档,基于AI能整理、识别并润色优化故事内容。 剧本之外,短剧的角色也是重要的创作要素。在角色定制方面,SkyReels能实现自动角色生成,根据剧本自动推荐合适角色。当然,如果有更多个性化想法创作者也可自定义角色,系统内置了多种角色形象库,支持用户自定义设计与修改角色形象。同时,平台也提供了多样化的音色选择,用户可自行添加或调整人物音色,增强角色表现力。 在角色创作方面, AI 3D引擎与视频大模型融合的创新平台WorldEngine能大幅提升效率, 据介绍,这一平台聚合了多家顶级视频生成大模型,包括昆仑自研视频大模型,同时针对人物表演做了定向优化,因此在人物表演能有更强的口型表情和肢体动作的可控生成能力。 由于引擎的使用,与传统的视频生成相比,WorldEngine在成本上实现了革命性地下降,可大幅降低百倍以上。同时,生成速度也提升了数个量级。 在分镜生成方面,模型能根据剧本内容一键生成分镜图片和对应的文字脚本,创作者等待1-2分钟即可查看每个镜头的效果。在美术风格上,创作者可选择动漫、卡通、真人3D等,每个分镜的视频长度可选择5秒或8秒,满足不同的叙事需求。 最后,创作者无需费力剪辑,分镜可以自动转换为连续视频,所有流程成果可以一键整合,快速生成最终短片。SkyReels能够自动将内容转换为1080P 60帧的高清视频,并且单次可生成视频长度达180秒,相比Sora单次可生成60秒视频、可灵单次可生成10秒视频,有显著突破。 创意是极为个性化的,作为创作工具来说,灵活性、可调整很重要。在这方面,昆仑万维介绍,SkyReels可以高精度调整,如用户可通过修改文字描述(如场景或人物动作)灵活调整分镜效果,也可以控制创意参数,调整镜头主体、人物站位、故事场景等主要描述,以及运镜方式、镜头角度、运动轨迹等参数,确保创意的精确实现。 AI赋能的短剧创作能极大程度节省创作成本,这样的一站式创作流程,不再需要高昂的专业团队和设备支持。它将对视频内容创作流程进行全面颠覆,让创作者从繁琐、复杂的制作流程中解放出来,专注于创意实现与灵感表达,让“一人一剧”的梦想成为现实。 华泰证券研报认为,“AI+短剧”模式推动剧本生产以及推广触达,能有效为短剧行业赋能。短剧行业“剧本为王”,由于短剧制作周期短,需要大量剧本储备,高效率产出优质剧本是短剧行业的重要能力。传统模式下,编剧产能有限,这种创作模式不能保证短剧产出效率和爆款率的稳定。 华泰证券认为,AI大模型可以通过快速读取大量小说,生成剧本大纲,辅助编剧进行剧本创作,提升剧本创作的效率和爆款率。除剧本创作外,AI还在短剧的素材选取、制作与后期和内容推广与反馈等环节为短剧制作方提供帮助。 此外,SkyReels AI短剧平台极大地降低了AI短剧创作的门槛,有望带来AI短剧用户生成内容(UGC)与专业用户生成内容(PUGC)的爆发式增长,推动短剧内容创作与消费市场的进一步快速增长。 在具体场景上,除了短剧,SkyReels也有更多的适用范围,如广告制作、短视频内容创作、科普、公益和宣传片、产品展示与推广等创作,对内容创造者、企业宣传部门、新闻机构、独立制作人等从业者来说,SkyReels同样有其应用价值。 AI UGC平台有巨大红利 2023年4月,在2022年年报中昆仑万维提到:展望未来十年,将坚定“All in”AGI(通用人工智能)与AIGC。 自2020年布局AIGC以来,昆仑万维在AGI与AIGC领域已有不少积累,已形成AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI视频多元AI业务矩阵,公司面向国内已率先推出搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用——天工AI智能助手。同时,面向海外推出《Club Koala》、Linky等多款AI产品。在生成式AI落地的当下,聚焦全球化市场,推出AI短剧创作平台SkyReels,是昆仑万维新的探索。 “未来30年是自我表达的30年。”昆仑万维创始人周亚辉对于UGC赛道也有很大的信心,“未来30年,人类社会将从感知线,变成表达线,整个人类社会在自我表达侧要翻1000倍;创作和自我表达是未来30年在整个社交和文化领域增长最快的曲线,会有越来越多人表达自我,表达对世界的理解、对社会事物的态度。”他提到,这种表达在过去很困难,因为工具门槛高,而昆仑万维要做的是,用AI把人类创作的门槛降得足够低,让人们更充分地实现自我表达。 基于这一判断,在短剧方面,昆仑万维希望建立一个新的创作生态系统,激发更多的人参与到短剧创作中来。“无论是专业的电影制作人,还是对视频创作感兴趣的普通用户,都可以在这个平台上创作、表达个性化的想法。”这是团队的愿景。 另外方汉还有一个判断是,内容创作成本降低后,每个语言都需要自己的一套产品,这时 AIGC 平台就能在全球得到红利。“综合来看,我们的机会一是做可以泛化的垂类,二还是做全球市场。”方汉提到,这个垂类可能是偏网文、短剧、动画的 IP 创作,相比to B,这类娱乐性的C 端方向更容易成为巨头。 从过往的经验中,昆仑万维观察到,内容、娱乐赛道的用户和收入增长都更明显,昆仑万维推出的Opera和StarMaker(一款音频社交产品)在100多个国家上线,月活用户均突破3亿。 昆仑万维做AI短剧产品延续了既有思路,瞄准内容与娱乐赛道的C端应用,这类应用的用户对AI输出的容错度较高,市场上限也非常高,“全球80亿人即使只有1%的用户买单,也会形成规模收入。” AI的市场是全球化的,具体到海外的短剧赛道,也还是一片蓝海。海外短剧发展始于2022年8月ReelShort上线,后其他短剧APP陆续推出。2023年11月ReelShort登上美国iOS娱乐榜免费第1名,实现破圈。国海证券研报认为,短剧出海市场空间保守估计约为360亿美元。团队采用短剧DAU*ARPPU测算海外短剧市场空间,得出的范围为144-648亿美元,中值为360亿美元。 昆仑万维此时入局,推出一站式短剧视频创作平台SkyReels,将是全球短剧赛道的劲敌,其优势除了在大模型上的积累外,也具备十余年的娱乐产品经验和全球化视野。昆仑万维曾从0到1打造了多款千万级别DAU产品,以其目前在内容娱乐产品上的方法论积累和经验优势,将AI短剧产品在全球范围内落地推广是顺势而为。
央视惊呼“神了”!空间计算+手机,会是移动影像的下一站吗?
作者 | 云鹏 编辑 | 漠影 今天,影像无疑是顶级旗舰智能手机之战的核心关键词,甚至没有之一。 科技的根本是服务于人,在满足功能性之后,记录生活的美好,成为了智能手机非常重要的使命。 从硬件配置到软件算法调教,从夜景拍照到长焦望远,从风景建筑到人物大片,可以说智能手机影像的各个角度几乎都被“卷”得差不多了。 所以移动影像如何才能更“极致”,移动影像发展的下一个“突破点”会是什么? 显然,AI大模型的到来一定是一个新的契机,对影像算法或许会掀起一次底层重构,而另一方面,空间计算浪潮的火爆,似乎也成为智能手机巨头们瞄准的下一个关键风口。 苹果Vision Pro的出现,将空间计算的概念带向更多普通消费者,其与iPhone的融合,让我们看到了照片、视频这些2D内容升维到3D带来的巨大想象空间。 从3D空间照片到3D空间视频,智能手机移动影像与空间计算设备的碰撞,爆发出极高潜力。 但另一方面,机遇同样伴随着挑战,智能手机与空间计算设备的结合,想要把体验做好,还有诸多技术难题需要攻克,从硬件到算法,再到底层操作系统层面的打通融合,内容的短板亦需补齐。 解决这些问题,无疑需要手机行业和空间计算行业头部玩家们的共同合力。 就在这样的关键行业节点,国内聚焦空间计算领域的头部AR创企Rokid已经先走一步,联合国内智能手机巨头vivo,亮出了诸多基于“手机+ AR眼镜”的空间影像体验。 就在前不久,央视记者线下体验后直接惊呼“神了”,而智东西在体验Rokid Max和vivo X100 Ultra协作实现的“3D影像空间相册”和“望远镜”功能后,也深深感受到3D影像未来已至。 自动播放 ▲央视记者体验“望远镜”功能 毫无疑问,这是国内移动影像发展的里程碑,也是智能手机与空间计算产业结合的重要节点。双方合作背后的诸多创新和突破都值得深挖,其对于消费者体验带来的升级也颇具突破性。 空间影像的未来,大门已经推开。 一、手机与空间计算能擦出怎样的火花?当影像升维,体验迎来质变 智能手机发展十余年,已经成为人们生活中最核心的智能硬件。而AI大模型浪潮的涌起,进一步强化了智能手机的主导地位,各类AI体验都需要借助手机实现。 值得一提的是,曾有无数的AI“新硬件”想要挑战手机,但绝大多数都失败了,我们看到,发展最好、市场最稳定的新品类,往往不是试图取代手机的,而是与手机结合最好的。 比如智能耳机、智能手表,以及各类VR、AR设备。 在苹果发布会上我们也能看到,苹果Vision Pro要做的并不是取代iPhone,相反,苹果极为强调两者的融合体验,从3D照片到3D视频,两者的体验是打通的。 手机与空间计算设备的融合,必然是产业发展的重要方向。 明确了大方向,细看下来,还有不少需要梳理的问题,比如两者具体要如何结合,体验如何完善?显然,移动影像是一个绝佳的切入点。 因为影像,天生就具有“空间”属性。 手机屏幕无法跳出二维世界,我们看到的照片和视频也都是二维的,但实际上所有被摄物体都是三维的,我们生活在三维世界中,这就是AR眼镜这类空间计算设备的机会所在。 一副小小的AR眼镜,就可以彻底解放智能手机的显示能力,让所有的二维照片和视频有了“升维”的机会,让体验彻底变得不一样了。 ▲vivo副总裁,影像副总裁于猛与央视记者谈3D影像体验 这样有些“科幻”的体验,如今已经落地,走入现实。Rokid与vivo的合作,已经落地了一系列实打实的功能,给我们带来了现阶段可圈可点的“空间影像”体验。 所以手机+AR眼镜能有怎样新奇的体验?其中颇具代表性的功能就是“3D影像空间相册”。 我们只需要一部vivo X100 Ultra和一副Rokid Max系列AR眼镜就可以体验到。用手机拍摄3D照片,用AR眼镜观看,具有立体纵深感的空间照片即可呈现在眼前,沉浸感、空间感十足,这是再精美的传统2D照片都无法替代的体验。 另一个令我印象比较深刻的是“望远镜”功能,AR眼镜与手机连接后,AR眼镜可以直接调用手机的长焦拍摄能力,手机的取景画面呈现在AR眼镜屏幕中。这种体验是极为新颖的,仿佛科幻电影中的“感官同步”。 此时,我只需要用手指捏合放大,就可以放大屏幕中的视野,利用手机的长焦能力清晰地看到远处的景物。 这就相当于我有了一个“百寸大屏望远镜”,视野开阔,同时还能清楚地看到远处的景物,这种体验极具科幻感、临场感、沉浸感,试想我们在演唱会现场、体育赛事现场、旅游登高望远时,这种能力都可以带来非常不错的沉浸式体验。 据了解,未来Rokid和vivo双方还会合作推出“空间多屏”功能,手机上的多个App都可以直接在AR眼镜的虚拟大屏上同时打开、同时运行,多应用交互效率大幅提升。 一方面,这彻底打破了手机屏幕的空间限制,同时还解决了AR眼镜的算力瓶颈,可以说是一举多得。 可以看到,Rokid与vivo的联手,打破了智能手机和空间计算设备的边界,消除了2D照片、视频和3D空间显示之间的壁垒。 而影像这一关键切入点,也是消费者感知最强烈的一环,我们开始可以用一种新的方式体验到空间计算的魅力。如时光回溯一般的“记忆重现”,质朴的情感通过直观的视觉表达被呈现出来,3D影像给用户带来的触动是前所未有的。 二、手机AR两大终端巨头牵手背后:硬核技术创新让不可能变为可能 实现这样“突破次元壁”的体验,离不开双方在技术和场景方面的深度打通融合,这种融合是“系统级”的,涉及到操作系统底层的打通协同。同时,Rokid多年来在空间计算领域积累的技术也有大量应用。 整体来看,通过手机+AR实现空间影像体验,从拍摄、存储到显示,其背后包含完整的技术链路,涉及不少技术难题。 首先,从拍摄、存储这一环节来看,vivo X100 Ultra是目前安卓阵营中唯一支持3D影像素材的拍摄、录制、编辑和储存的智能手机,这大幅降低了手机摄录空间视频的技术门槛。 但实际上,实现这些功能并不容易,相比于人眼的瞳距和专业的3D拍摄设备,智能手机摄像头的间距过小,并且每颗摄像头之间硬件规格、拍摄焦段都相差很大,为了实现3D影像拍摄录制,vivo在软件和硬件层面解决了不少技术层面的难题。 vivo X100 Ultra的2亿像素蔡司APO长焦打了一个很好的底子,支持长焦舞台模式和3D拍摄,而vivo在移动影像领域多年来积累的大量算法,也是实现多摄同步调用、最终实现3D影像成片的关键。 在显示环节,Rokid Max AR眼镜出色的显示效果保证了我们的观看体验,其在同类型产品中均位于第一梯队的屏幕分辨率、刷新率、亮度、对比度以及视场角,都成为3D照片视频显示的良好基础。 更重要的是,从操作系统底层来看,Rokid早在去年就发布了基于开源AOSP专门为空间计算设备研发的空间化操作系统YodaOS-Master,这一操作系统融合了感知、理解、显示、交互等能力,并且支持键鼠、触摸、射线、手势、按键多种交互模式。 更进一步,Rokid将这些空间计算能力整合成了“Rokid空间”应用,进行对外赋能,与手机在操作系统层面打通、互信,实现深度优化。 以“Rokid空间”APK的形式,Rokid完成了YodaOS-Master空间操作系统到高端智能手机的功能“迁移”,让空间计算的独特体验,能够在智能手机上快速复制。 可以看到,Rokid与vivo双方“一拍即合”的背后,是双方在各自赛道多年深耕所积累的大量技术成果的深度融合,在两条赛道融会贯通的今天,这些关键技术成为实现空间影像体验的基础,让消费者可以获得真正优质的体验。 两家厂商,彼此都选择了对方赛道最优秀的合作者。 三、走开放合作的路子,让3D内容创作“大众化”,空间化浪潮势不可挡 虽然3D影像空间相册以及望远镜等功能已经给我们留下了足够惊艳的印象,但手机与空间计算的融合才刚刚开始,未来的想象空间仍是巨大的,好戏还在后面。 不论是电视、笔记本电脑、平板电脑还是智能手机,这些设备的屏幕都无法真正呈现拥有深度信息的空间视频,诚然市面上有一些3D显示设备,但价格都极高,技术也并不成熟。 以前,我们可能更多只能是在电影院中体验一下3D电影,但今天我们却可以时刻佩戴一个轻便的空间计算设备。AR眼镜与智能手机打通,高质量3D内容从拍摄、存储到分享,被彻底打通,3D内容的大众普惠,进一步加速。 随着技术的不断迭代,3D影像的上手门槛和设备成本都将大幅降低,未来,从影视娱乐到数字游戏,3D化都已成为大趋势,媒介内容的升维,已经势不可挡。 未来,我们拍摄、分享、体验照片和视频的方式可能都将被改变,我们的生活方式甚至都会因此受到更加深远的影响。 智能手机直接化身创作3D内容的工具,这丰富了空间计算时代所匮乏的3D内容素材,优质3D内容的缺乏是长期制约VR/AR产业发展的关键因素之一,如今所有普通用户都可以成为3D内容的生产者,3D内容的生态增长也将迈入快车道。 在这样行业大趋势下,Rokid与vivo的合作可以说是率先趟出来一条高效可行的路子。 Rokid并没有“重复造轮子”,没有自己做手机或类似产品,而是选择与头部智能手机厂商合作,高效地将空间应用体验快速融合到消费电子产品中。 Rokid和vivo的这种合作模式,一方面加强了智能手机的移动影像能力,让手机影像体验“升维”,提升了高端旗舰机的竞争力,另一方面进一步推动了当下空间计算市场的用户尝鲜和设备普及。 当前,苹果基于自身的封闭生态打造了Vision Pro+iPhone的体验闭环,而相比苹果的封闭,Rokid与vivo联手走出的OST路线对于创作者更亲民,创作门槛更低,也更加开放。 对于Rokid来说,自己一个人前进可以“小步突击”,但和行业、生态伙伴一起前进,才能真正让AR走的“更远”,推动空间计算体验更快走入寻常百姓家。 结语:Rokid联手vivo,迈向空间计算时代需要更多产业合力 毫无疑问,旗舰智能手机+AR眼镜带来的出色空间影像体验让我们更直观地感受到了空间计算的魅力,影像这一切入点可以说选的十分精准,用户感知明显,这样让科技变得更有温度。 Rokid和vivo的合作,给行业打了一个样,将空间计算的体验带向数亿级智能手机用户,让产业看到了空间计算相关的系统权限开放、硬件标准对齐、空间计算应用在中国的手机厂商中快速嫁接、复制带来的巨大潜力。 未来,一定会有越来越多的手机品牌加入3D内容生态中,随着3D内容制作的门槛不断降低、3D内容创作者越来越多、亿万用户UGC内容的涌现,XR行业的体验孤岛连接上智能手机这块“亚欧大陆”,整个行业的爆发力和成长都将迈入新阶段。
Arm强势入局独立显卡市场!英伟达终极对手终于出招了
如果说现在半导体市场最火的是什么,那么答案只有一个:显卡。 从游戏爱好者到企业的算力中心,庞大的需求正在促使越来越多的半导体厂商进入GPU市场,就连在移动领域非常出名的企业——Arm都忍不住要来分一杯羹了。 据媒体报道,Arm正在以色列秘密开发一款全新的GPU,并且为此招聘了超过百名芯片和软件开发工程师。而且与以往的GPU芯片不同,这款产品或许会是Arm的首款独立显卡,面向PC市场。 图源:Arm 如果是不太关注半导体市场的朋友,或许会对Arm感到陌生,不过只需要一句话就可以让你意识到这家企业的强大:“高通、华为、苹果、联发科的处理器,大多都脱胎或基于Arm指令集”。 某种程度上,其实可称之为“移动处理器的王”,甚至可以说没有Arm,就没有现如今丰富的移动生态。不过,Arm在此之前其实鲜少踏足PC市场,虽然在移动领域也有自己的GPU核心,但是大多与Arm架构的芯片一起搭配出售,搭载在手机等移动智能终端上,与独立的高性能显卡是完全的两码事。 Arm能否给本已非常火爆的GPU市场再添一把火呢? 凭什么? 虽然在多数PC玩家看来,Arm进入PC市场还是最近一年的事情,但是早在多年以前,Windows系统就已经展开了对Arm架构芯片的适配,而且苹果已应用在Mac产品线上的M系列芯片也是基于Arm指令集设计的。 在CPU领域,Arm与PC市场的瓜葛并不少,这段时间超级活跃的“骁龙PC本”背后就有Arm的一枚军功章。不过在GPU领域Arm在PC端并无存在感。 图源:Arm 此前在移动领域,Arm的GPU技术积累不少,比如自研的光线追踪技术,甚至可以让移动端的设备支持光线追踪功能,在计算效率上甚至超过了英伟达的光线追踪技术。 除此之外,Arm此前还发布了自研的Adaptive Scalable Renderering(ASR,超自适应可拓展渲染,又称超级分辨率技术),其效果与英伟达的DLSS,AMD的FSR,英特尔的XeSS是一样的,能够让GPU先渲染低分辨率的原始画面,再通过ASR技术拓展成实际输出的分辨率,并且画面的质量不会下降太多。 实际上你会发现,虽然Arm在独立显卡市场并无多少建树,但是其在GPU领域的技术积累却十分全面,光线追踪与超级分辨率都是目前最炙手可热的显卡核心技术,再加上最近几年Arm对Vulkan API等开发环境的广泛支持,它实际上已经差不多解决了独立显卡在软件技术方面的问题。 那么在硬件上呢?此前,Arm的GPU大多应用在智能手机等小型设备上,因而更看重能效比——毕竟手机最怕的就是“掉电快”以及发热等能效问题。重视能效比并不代表Arm的GPU硬件性能很差,以天玑9300上的Arm Immortalis-G720为例,这颗GPU的性能足以在2K分辨率的手机屏幕上以120Hz的帧数运行《原神》等大型游戏,此外像《堡垒之夜》《使命召唤》等游戏均可以高帧率运行。 图源:Arm 当然,你会说相较于电脑而言,手机在画面精细度、特效等方面都有明显的区别,但是在《逆水寒》等做了针对性优化的手游中,你会发现,Arm GPU驱动游戏的精细度其实并不比一般的PC游戏差,这也是最近两年手游经常宣传的「PC级画质」。 而「PC级画质」能够实现的背后,核心是超分技术的深度优化,再加上Arm架构的高效,让其能够针对部分平台进行深度优化,极大地提高计算效率并降低能耗。 凭借Ray Tracing、Adaptive Scalable Renderering和Arm架构的三板斧,Arm在显卡领域其实是不弱小的潜力玩家。 为什么? Arm为何会选择在此时进入GPU市场?很大原因与Arm在移动领域的发展受阻有关系。虽然Arm在移动市场有着近乎垄断的统治力,但是其营收却并不乐观,2023年披露的营收仅为26.79亿美元,其中净利润为5.24亿美元,同比下降达22.49%。 不说与英伟达等巨头相比,就算是与一些规模较小的半导体厂商对比,Arm的营收都算不上高。受此影响,Arm完成上市后股价一直处于缓慢下跌的状态,直到2023年第四季度的营收暴涨,才算是勉强挽回了市场的信心。不论是利润、营收还是市值,Arm所获得的都与其“移动芯片之王”的地位丝毫不匹配。 Arm的营收状况不佳,其实与他们的盈利方式及消费市场的变化有很大关系,Arm的营收主要来自两方面:1、架构授权;2、芯片授权,前者是将架构专利授权给苹果等厂商,一般只收取一次授权费用,然后苹果等厂商以此为基准自主设计处理器,后者则是直接找Arm采购新的芯片设计,然后由买方委托第三方如台积电等代工厂商生产。 图源:Arm 换言之,Arm本质上就是一个设计图卖家,并不参与到实际的芯片制造等环节,这也导致Arm能够得到的利润甚至不如台积电等代工厂。而且,随着移动市场的芯片集中化,高通、苹果等厂商都在探索自己的道路,减少对Arm的依赖,这一度让Arm的授权涨价计划搁浅,营收受到进一步冲击。 在可预见的未来,虽然Arm依然会是移动市场的主导架构,但是Arm本身却很难从架构授权等传统盈利渠道里得到更多的增长,Arm迫切需要一个新的市场来完成增长目标,而在遍历了自己的技术库存后,炽手可热甚至供不应求的显卡,就成了很好的选择。 图源:OnLogic 一方面,是显卡市场的庞大需求。显卡爆发本质是算力需求爆发,算力需求爆发,前些年靠的是游戏、区块链挖矿这些“前菜”应用,结果这两年,大模型AGI才是算力行业真正的“大家伙”。在AI浪潮驱动显卡需求爆发的今天,Arm再不做显卡,更待何时? 另一方面,显卡市场正处于革新期,市场依然存在机会。英伟达和AMD虽然在高性能显卡领域拥有主导权,但是微软等算力供应商也在寻求甚至自研更高能效比的芯片,用来搭建新的算力中心。云计算王者亚马逊,在与英伟达等合作的同时,早已在自研显卡,甚至亚太云计算巨头阿里云都在试图自研显卡芯片。此外,微软、谷歌前段时间都分别曝光了各自的AI芯片研发计划,其中就有采用Arm架构的方案,利用Arm指令集的简洁高效,在AI运算等领域,Arm芯片可以将能效比提高到传统芯片的数倍甚至数十倍,这对于大厂来说无疑有着更高的吸引力。 或许正是受到计算领域的Arm GPU爆火的鼓励,Arm终于决定再赌一把。 怎么干? Arm被曝光的独立显卡是消费级显卡,因此不是面向算力中心的to B产品。很多人猜测Arm的秘密显卡是一款高性能游戏显卡,但是在雷科技看来Arm或许更倾向于打造一款适用于笔记本电脑等移动设备的高性能AI显卡,而游戏需求只是显卡的应用范畴之一。 简而言之:面向移动设备的低功耗、高性能显卡是Arm的巨大机会。 前段时间发布的骁龙X Elite系列,虽然在日常使用和续航上带给小雷不小震撼(雷科技已对骁龙版YOGA Air 14s等热门骁龙PC产品评测,可在雷科技搜索查看),但是一个问题却是大家无法忽略的:Arm架构的核显,并不足以支撑PC级的大型游戏需求,性能与生态适配均存在不少问题。 对此,骁龙表示后续会对英伟达等显卡进行适配,通过混合搭配来实现对PC大型游戏的支持。不过,一些用户认为传统显卡的高功耗会「毁了」骁龙笔记本的轻薄和高续航体验。如果想兼顾续航和体验,那么最好的方法其实是Arm CPU+Arm GPU,兼顾轻薄与性能,并且能够提供远高于传统笔记本电脑的离电性能。 图源:DIGITMES 实际上这也是目前传统显卡厂商「忽略」或者说「无法兼顾」的市场,英伟达和AMD都将技术迭代重点放在了堆高极限性能上,对中低端显卡和低能耗市场的关注度非常低,这也导致传统的游戏笔记本电脑在这么多年后,续航和离电性能表现依然一塌糊涂。 目前多数厂商都选择用NPU来提高AI性能,但是在面对文生图等应用时,GPU的运算能力仍然是一个绕不开的坎,如何提升GPU的能效比,已经成为显卡厂商需要共同面对的下一个问题。 对于Arm来说这就是最好的机会,其GPU正好有着高能效、低功耗等特点,而且在AI运算方面也有充足的技术积累,正好契合未来轻薄型AI PC的各种需求。按照此前的预估数据,到2028年为止,AI PC的出货量将高达2.05亿台,这是一个庞大且充满诱惑力的市场,而在这个市场中,Arm、英特尔、英伟达、AMD都处于同一条起跑线上。 一个全新的PC时代,谁又能从中脱颖而出,成为新王呢?雷科技将保持密切关注。
调查报告显示:超半数世界500强企业视AI为风险
编译 | 徐豫 编辑 | 漠影 智东西8月19日消息,英国《金融时报》援引一项最新研究,称超过半数的《财富》世界500强企业,视人工智能(AI)为风险而非机遇。 企业观测和评估平台Arize AI的这份调查显示,在最新的年度报告中,上述56%的企业将AI列为“风险因素”,这一数字是2022年的6倍多,当时该比例仅有9%。公司引入AI技术的成本、AI在实际应用中的安全性,都是这些500强企业所着重考量的。 一、超9成流媒体企业担心AI风险会拉低业绩 面对AI时代潮流,流媒体行业比其他行业更忧心忡忡。Arize AI的研究数据表明,超9成的大型媒体和娱乐企业担心,快速发展的AI生态将给公司今年的业绩带来负面影响。 迪士尼方面称,包括生成式AI在内的AI新技术管理制度尚未成熟,“如何界定用AI生成的娱乐产品”、“如何规范AI知识产权的收入来源”,这些都可能打击生成式AI现存的商业模式。 市值2900亿美元的流媒体企业Netflix则认为,竞争对手如果抢先一步搭载了先进的AI技术,或将削弱Netflix的行业竞争力,并且可能对公司的运营业绩带来不利影响。 二、大部分企业都担心AI今年会带来商业风险 除了流媒体行业,AI系统的快速迭代也给其他行业带来压力。相似地,86%的软件和技术企业,超过67%的电信企业,以及超50%的医疗健康、金融服务、零售、消费和航空航天企业,都担心AI今年会带来商业风险。 自2022年11月OpenAI推出聊天机器人ChatGPT以来,机器学习模型在过去两年间持续发展。目前,大型科技公司已投资数百亿美元开发AI系统,数百家初创企业入局AI,企业级、消费级的AI模型和应用推陈出新。 然而,各行各业的公司在布局AI的过程中,可能存在成本增加且不可预测等财务风险。市值2500亿美元的软件公司Salesforce称,其利润率可能会受到新兴AI应用“不确定性”的影响。换而言之,该公司可能需要投入更多资金来开发和测试新模型。 三、AI安全隐忧:侵犯隐私、泄露机密、信息失真 AI的安全性仍有待加强。研究显示,AI可能会侵犯隐私和人权,以至于触犯法律。 制药企业Viatris称,员工或供应商使用AI系统时,“可能导致机密信息的泄露”。除此之外,员工、临床试验参与者或其他私人数据,也可能被AI系统“未经授权访问”。 电信企业Motorola提到,“AI可能无法始终按预期运行,数据集可能不足,或者包含非法、偏见、有害或攻击性信息,这可能会对公司收益和声誉产生负面影响。” 结语:平衡风险与机遇,AI发展的长期课题 娱乐公司迪士尼、软件公司Salesforce、制药公司Viatris都提出对AI侵权、泄密、“脑雾”的隐忧,对布局AI持谨慎态度。在专门讨论生成式AI的108家企业中,仅有33家企业视其为机遇。 但与此同时,这也突显了AI作为新兴技术可能带来的全面产业转型。有公司在年度报告中提到,生成式AI的潜在优势能够有效助力企业发展,例如提升成本效率、增强运营效益,并加速推动创新。如何把握AI机遇和预防风险,大公司们也许还会改写他们的答案。
韩国拟推AI教科书:明年起进入8岁及以上学生的课堂
编译 | Vendii 编辑 | 漠影 智东西8月19日消息,据英国《金融时报》报道,韩国计划在2028年之前引入人工智能(AI)驱动的数字教科书(以下简称“AI教科书”),以促进教育改革。这一举措旨在打破死记硬背的“填鸭式”教育模式,为学生提供个性化的教育,鼓励学生主动学习,从而激发创新精神。 然而,这一计划遭到了许多家长和学者的强烈反对,他们担心AI教科书可能带来一系列负面影响,比如学生过度依赖数字设备、接触到错误信息、个人隐私信息泄露等问题。 一、韩国AI教科书计划:旨在推动个性化学习,培养学生创新思维 尽管韩国在经济合作与发展组织(OECD)所发起的国际学生评估项目(PISA)测试中一直表现优异——但首尔政府深感担忧,强调死记硬背的“填鸭式”教育正在扼杀创新思维,不利于国家减少对传统制造业的依赖。 韩国教育部长李柱镐提到,采用具备AI技术的平板电脑将会成为此次教育模式改革的核心所在。 “我们都认识到,有必要从以记忆为主导的单向课堂,转型为让学生主动投入并掌握自我学习的环境。”李柱镐说,“2025年将是这一转变的关键时期,我们可以借助AI教科书辅助教师实现教学方式的革新。” 据悉,AI教科书将于明年起进入8岁及以上学生的课堂,并预计在2028年前覆盖除音乐、美术、体育以及伦理学以外的全部学科。同时,学生们还将接受数字素养培训,以便能正确运用AI工具。 据韩国教育部介绍,这些平板电脑可以根据学生的学习能力和进度进行个性化设置,AI系统将针对“快节奏学习者”和“慢节奏学习者”制定不同难度的学习任务。此外,教师也可以通过数字仪表板实时监测学生的学习状况。一位政府官员说到:“AI教科书将助力教师根据学生的数据评估其学习水平和进度,从而提供更具针对性的教育服务。” 这位官员进一步解释道:“部分学生在课堂上容易犯困,原因在于部分学生已在课外辅导机构提前学习过相关知识,而另一部分学生则难以跟上课程进度。然而,随着AI教科书提供多样化的情境内容,激发学生的学习兴趣,有助于培养他们的创新思维。” 此外,韩国课堂还将引进其他AI工具。比如,能够在教师授课过程中将其讲课内容自动录入电子白板的软件,以及能够提供AI实时回答的移动机器人等。 二、专家与家长的担忧:AI教科书的潜在风险与副作用 众多专家对政府推行AI教科书的提案持审慎态度。首尔中央大学社会学教授申光荣提到:破解应试教育弊端需从教育制度革新着手,其中包括考试模式改造;政府急于跟进AI热潮,忽视了其潜在的副作用。 申光荣谈到,在课堂上使用AI有可能“失控”,可能会引发虚假信息的传播、抄袭以及学生个人信息泄露等问题。 另一方面,这一提案也遭到了家长们的强烈抵制。据悉,超过5万名家长联名上书,恳请政府更加重视学生们的整体福祉。这份请愿书写道:“孩子过度依赖数字设备,身为家长,我们深感这个问题已达到前所未见之严重地步。” 41岁的首尔母亲李善英育有两个学龄阶段的孩子,她主张雇佣更多的课外辅导员以协助学生学习,而非采用AI教科书。她忧虑地表示:“孩子们已经过度沉迷于智能手机和平板电脑,这恐怕将会对孩子们的智力发展、专注力及问题解决能力造成不良影响。” 不过,韩国政府推出AI教科书的举措得到了一些教师的欢迎。韩国教师协会联合会的一项调查显示,高达54%的公立学校教师对此表示赞同。 结语:AI赋能教育,该如何辩证看待? 韩国计划引入AI教科书以推动教育现代化,遭遇众多家长与专家的反对。这一计划不仅预示着技术如何能够为教育领域带来革命性的变化,同时也揭示了在推进这类改革时所面临的挑战与权衡。 随着AI技术在教育领域的不断发展,如何在利用其潜力的同时,确保教育的质量,将是未来教育改革的关键议题。
蹭小米汽车,获得了流量,付出了道歉
小米汽车,毫无疑问是 2024 年汽车圈最大的流量密码,首试,首提,首撞,首次翻车等等等都能登上热搜,同时它也是价位段里唯一二手可以卖得比一手还贵的电车。 与此同时,小米汽车持续不断的泼天流量和大定数量,也羡煞同行,只不过,小米之流量,是行业之蜜糖,也可能是砒霜。 ▲ @原来是翔翔啊 发布的对撞视频截图 一场「车圈德比」,最后竟是「假球」? 如果说首发试驾是正常内容,首次提车是用户 UGC 内容,首次撞车是意料之外的内容的话,那么小米 SU7 和极氪 007 这对针锋相对的竞争对手直接对撞,就犹如皇马对巴萨,曼城对曼联一样,堪称车圈的国家德比。 也真有博主这么做了,前几天 B 站 UP 主@原来是翔翔啊就做了一期小米 SU7 对撞极氪 007,看谁更安全的测试视频。 视频的结论是, 小米 SU7 在对撞之后,出现了「自动紧急呼叫系统失效,小电瓶断电,车门无法打开」的重大问题,而极氪 007 则表现更好,自动紧急呼叫系统呼叫成功,车门也能正常打开。 在车辆出现事故之后,自动紧急呼叫系统呼叫车主,备用电源供电,车门自动解锁都是救援或者自救的重要组成部分,过往不少的真实车祸伤亡事故,都和这些安全冗余措施失效有关,所以当视频结论一出,人红是非多的小米 SU7 又一次被拉到了聚光灯下。 但马上,小米汽车就针对舆情做出了回应: 经过分析,我们认为这一所谓「测试」是设置不严谨、记录不完整、结论不科学的。 现将初步分析中我们的发现向大家报告! 第一,相关测试「碰撞后 E-CALL(自动紧急呼叫系统) 失效」的说法不实。经查,呼叫中心在碰撞后第一时间呼叫并接通,后台连续呼叫持续 5 分钟没有收到任何反馈;后对车主登记手机号码共计进行 5 次回拨,均没有接听。 第二,关于网友关注的「小电瓶断电」相关信息,根据国家监控平台数据显示:在碰撞前该车辆数据长时间掉线,存在小电瓶长时间断开的情况;随后,小电瓶再次被接通。在碰撞时,国家监控平台数据缺失,小电瓶已处于断电状态。我们无法确认在此过程中小电瓶再次上电时,是否按照标准锁紧电极,也无法排除因装配不当导致碰撞后小电瓶断电的可能。 第三,此前小米 SU7 在开发过程中,已经进行过严苛的碰撞测试,无安全隐患,且并未出现视频中所述问题。 我们对小米 SU7 的产品质量有着充分的信心,也在此呼吁:车辆撞击测试,是一项复杂、严谨且异常严肃的测试,应当交由专业机构进行。同时,对于不够严谨、完整严肃的测试,我们也恳请大家不采信、不传播,感谢大家的关注和支持! 意思就是对撞视频的结论不可靠,存在严重失实的情况,甚至有可能车辆还被动了手脚。 ▲ @原来是翔翔啊 发布的道歉 接着发布对撞视频的@原来是翔翔啊发布了道歉视频,承认对撞测试环节和结论有问题。 如标题所言,@原来是翔翔啊在 B 站拥有近百万粉丝,已经算是领域内的头部玩家,而小米 SU7 相关的几条视频,则是他播放量最高的几条视频,包括他的道歉视频,确实是收获了流量,付出了道歉。 别忘了,小米出动公关部不可怕,可怕的是出动法务部,所以这件事并不一定以该 UP 主的道歉为结束。 同时,作为对撞视频的另一方,极氪法务部也很快跟进发布了公告: 近日,我们关注到,网络平台上有某自媒体将极氪 007 与友商某车型对撞的测试,同时网上出现大量谣言及引导内容,称此测试为「付费测试」。经核实,极氪未与任何个人或机构合作此类测试,针对不实信息,极氪保留追究相关方法律责任的权利。 极氪不赞同也不会参与任何「抺黑友商」的「拉踩式」营销,同时坚决抵制和反对任何涉嫌「不正当竞争」的行为。请大家不造谣不传谣,共同维护中国新能源汽车产业良好发展氛围。 到这里,我们可以认为,这个所谓的对撞视频,过程不可信,结论也不可信。 至于这位 UP 主的动机是什么,也没法考证,但可以肯定的是,小米 SU7 即便发布了半年,依旧是流量密码。 为什么都爱蹭小米? 其实上一个蹭小米,获得了流量,付出了道歉的事儿,还没过去很长时间。 4 月份智己 L6 发布的时候,就把小米 SU7 列为了对标对象,在智己 L6 超强性能版对比小米 SU7 Max 三电参数 PPT 中,智己把小米 SU7 Max 的双电机描述成了「前 IGBT(绝缘栅双极型晶体管),后 SiC(碳化硅)」,而自己的却是双 SiC。IGBT 和 SiC 都是半导体材料,应用于电车电机当中,一般来说,SiC 的性能和能效会优于 IGBT,所以双 SiC 电机的配置,也一般优于「前 IGBT,后 SiC」。 不过小米 SU7 Max 也是双 SiC 的配置,这就意味着智己在发布会上捏造并传播了虚假信息,客观上抹黑了小米 SU7 Max 的配置信息。 在发布会上拿竞品作为对比,以己之长攻彼之短,突出优势部分,展示平手部分,隐藏劣势部分,制造一种稳赢大赢特赢的结论,是各大厂商在发布会上的惯用手法。比如 iPhone 历年来就是国产手机发布会上出现得最多的产品,每年都被各种吊打,但基本上大家都还遵循一条底线:可以展示部分事实,但不能捏造虚假的事实。 面对友商的中伤,小米自然也迅速反击,敦促道歉,最终多轮交锋之下,智己分别以联席 CEO 微博和官方微博的身份发布了道歉声明。 这两个「蹭小米汽车,收获了流量,付出了道歉」的案例,其实有不少的共性前提,就是当下汽车圈的战局里,流量成为了没法回避的关键词。 在万象更新的汽车大变局时代,许多过往的经验和积累完全没有用武之地。 谁能想到 4S 店开始大量暴雷呢? 谁能想到价格战打得几乎所有人都不赚钱呢? 谁能想到新入局的小米华为搞的流量如此炸裂如此破圈,并且还能带来巨量真实转化呢? 汽车市场规模远远大于手机和周边市场规模,但以流量和品牌价值考虑,国际上,苹果和三星要超过丰田奔驰宝马特斯拉,国内的华为和小米,更是遥遥领先于理想蔚来小鹏极氪智己等等等品牌。 这是由手机的全民属性决定的,中国这几年每年智能手机的出货量大概是 3 亿部左右,而乘用车的年销售量则为 2100 万辆,这意味着因购买行为而产生的关注量,就有天生的量级差距,并且像华为和小米,不仅有手机,还有电脑,平板,手表,耳机,电视等等周边电子电器产品,而主流汽车厂商在消费者市场里除了汽车,也甚少涉足其他产品。 手握流量优势的品牌,在一个几乎重置的市场里,并无包袱,反而占据领先身位。 于是乎,当各大车企老板看到在微博和抖音粉丝都超过两千多万的雷军能够在舆论场上呼风唤雨并以中年年纪保有清爽形象和健康身材时,大概觉得我上我也行。 但最终就是,中国互联网上,汽车圈所有老板的影响力加起来,还不如雷军。也许他们比雷军更懂汽车,但雷军比他们更懂互联网和年轻人。 在宣传和舆论上绑定小米,其实是新品牌或者小品牌一种获取流量的捷径,也是以小博大的豪赌。 这点在智能手机市场就已经是许多品牌惯用的手法,最早的魅族,后来的荣耀,以及现在的一加,都在舆论场上和小米针锋相对,官方之间相互阴阳,粉丝之间相互攻讦,顺便还可能有宣传供应商大量铺黑稿搞抹黑。 虽然是兵行险招,但确实也产生了流量,有的时候也会产生官司。 比如两年多前,海信旗下的互联网电视品牌 vidda 就曾经使用「米有屌丝」「米有暴利」「米有耍猴」等文案来暗讽小米,随后小米将 vidda 告上法庭,一审宣判 vidda 败诉,认为 vidda 侵权,损害小米商誉。 更早之前的魅族也有类似的文案出街,以「傻、慢、丑、小,糙」的海报,暗讽「傻慢丑,小米造」作为对比宣传自己产品。 同时小米官方也和粉丝一起,策划了针锋相对的「扫黄灭章」话题,意在针对魅族创始人黄章。 总而言之,逻辑很粗暴,效果却很好,确实和小米吵起来就会有关注度。有的时候吵过火了,就上法庭了,甚至还有暗处的供应商需要蹲监狱了。 为什么不建议蹭小米? 当下汽车圈的营销,有很多行为折射了流量焦虑,没事蹭小米算一种,再比如请周鸿祎来站台做宣传,看似获得了流量和关注,但流量有没有用需要商榷。 诚然,这几年汽车行业的主旋律就是「活下去」,「打赢淘汰赛」,所以诸多企业的经营行为就显得短视,甚至可以说是饮鸩止渴。 这些年不少互联网公司开始从 KPI(Key Performance Indicator,关键绩效指标)管理,走向了 OKR(Objectives and Key Results,目标与关键成果)管理,核心区别在于,KPI 重视某一项或者几项关键指标,而 OKR 更重视成果和目标。 比如说,一个公司品牌营销部门的 KPI 很可能是上多少个热搜,话题有多少流量;而 OKR 则可能是品牌美誉度提升多少,品牌知名度提升多少。 类似的,不少手机厂商在整体市场趋于平稳之后,把产品部门考核的指标从销量,替换成了 NPS(Net Promoter Score,净推荐值),这个维度的转变,意味着产品部门需要更加考虑产品的美誉度,能不能驱动用户复购和推荐。 从 KPI 到 OKR,从销量到 NPS,其实都折射出更长期,更宏观的经营价值观。 于车企而言,中短期肯定是要卖更多的车,长期则要建设出知名品牌,更短期的目标可能才是流量。 诚然,小米华为可以凭借爆发式的流量转化出订单,但这流量大多数是正向或者中性的流量,而非争议性的流量。 但不少企业做出的争议性流量,是没法转化成为订单价值或者品牌价值的,甚至还有不小概率让品牌受损。比如前不久某家南方车企的新能源品牌,先后请了两位在互联网上影响力大但口碑不佳的名人站台做宣传,最终结果是宣传物料评论区全是批评和揶揄的声音(当然也有很多水军),让本不富裕的品牌和销量变得雪上加霜。 无论是手机厂商,还是汽车厂商,蹭小米的结果也是类似,除了流量什么都带不走,除了道歉和牢饭什么留不下,于销量无益,于品牌有害。 品牌之间的绑定营销,要么搞联名,要么像奔驰和宝马那样相爱相杀整点高级活。最好还是放下仇恨,做回自己,曾经喜欢对着小米输出的荣耀如今已经释然,不再提及小米,反而在独立之后走得更好。 而在移动互联网竞争中落败给 Google 的微软,一度很喜欢在各种场合阴阳怪气 Google,但后来微软现任 CEO 纳德拉上任之后,不光矫正了微软的竞争颓势,也不再把精力放在无意义的口水仗上。 近来甚少露面的李想在内部反思中也有类似总结:很多动作变形,不及预期的事情,源于过度关注竞争。 正常来说,用户考虑一个汽车品牌,一款汽车产品,是他的需求和产品的匹配程度,而非这个品牌在一场舆论战里成功地贬低了另外一个品牌另外一款产品。 当然,从难度上来说,打造一款好汽车,周期上需要两三年,打造一个知名汽车品牌,则要十年二十年乃至百年,而制造一个热搜,只需要一个小时足矣。 终究来说,蹭小米也好,蹭其他品牌也好,都是一种自欺欺人的虚假流量繁荣,而非真实的品牌建设,这种痴迷于捷径的方法,最大的恶果不是来自于小米或者网友的声讨,而是对于自身能力的腐蚀。 雷军在微博和抖音上累计的数千万粉丝,是一条条微博,一个个短视频,一次次直播累计出来的,以数年乃至十数年的时间为单位,而不是一时兴起和别人对骂几句得来的。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。