注册 登录
EN
中文
APP下载
logo
icon
数字孪生
icon
大数据获客
icon
人工智能
分类目录
行业分类:
IT/通信
金融财经
市场/营销
交通/物流
节能环保
休闲旅游
农林渔牧
日化用品
数码家电
房产/建材
企业/管理
家具/家居
医疗/保健
新零售
机械/工业
餐饮/食品
其它行业
头条分类:
行业前景
行业动态
行业资讯
行业活动
诺奖得主:AI不会取代绝大多数工作,年轻人要重新思考就业技能
快科技3月25日消息,据媒体报道,诺贝尔经济学奖得主克里斯多夫·皮萨里德斯近日在采访中深入探讨了生成式AI对劳动力市场可能产生的深远影响,并表达了对服务业未来发展的乐观态度。 皮萨里德斯指出,虽然生成式AI的技术发展迅猛,但其大规模应用尚需时日。他坚信,AI不会全面取代人类,相反,它将为人类创造更多就业机会。 他认为,随着AI技术的普及,某些机械化、重复性高的工作岗位可能会被逐步取代,但同时也会催生出新的工作类型和合作模式,即从业人员与AI的协作。 皮萨里德斯特别强调了服务业在AI时代的重要性。他预测,生成式AI可能会比其他技术更深入地影响服务业,但无法取代服务业中绝大多数的就业岗位。 相反,随着AI技术的应用,服务业可能会吸收更多的劳动力,成为经济增长和就业稳定的关键领域。 在AI时代,服务业的发展不仅关系到就业市场的稳定,更关乎整个经济的持续增长。因此,各方应共同努力,推动服务业与AI技术的深度融合,为人类创造更加美好的未来。 此外,皮萨里德斯给了年轻人一些建议,他认为年轻人应该学习一些STEM(理工)技能,学习如何跟AI一起更好地工作,比如如何理解数据。 他们还应该学习在工作中如何表现,沟通技巧、工作透明度以及服务热情都会越来越重要,因为服务业大部分会雇用年轻人。
前景可期,英伟达旗下Together AI频频收获投资,估值飙升不断
作者|小岩 编辑|彩云 目前,AI初创领域里获得融资最多的两家大模型创业公司是OpenAI和Anthropic,二者都是闭源大模型公司,它们背后的最大投资者分别是实力强劲的微软和亚马逊。 资本头部下场入局AI领域,所付出的绝不是资金这么简单,更有不可估量且极其宝贵的云计算资源。这样“不遗余力提供支持”的做法,无疑给OpenAI和Anthropic绑上了两大科技巨头的“战车”,战斗力旺盛,马力十足。 在闭源大模型之外,还有另一个阵营是开源大模型,MetaAI的llama系列就是其中的代表。使用开源大模型做应用的创业公司,大部分希望保持自己的独立性,会使用多云策略。此时拥有一个能力强,成本低的AI云平台就非常需要,而Torgether AI便是其中的典型代表。自成立伊始,Together AI就展现出了极其昂扬的上升势头,不仅多次获得融资,其估值也在不断翻涨。更重要的是,它的背后也拥有实力强劲的头部资本——英伟达。 成立至今不过两年,以提供Navidia GPU而闻名... Together AI究竟是何方神圣? Together AI 成立于2022年,以提供对 Nvidia GPU 的访问而闻名,它会为AI创业公司提供训练服务云平台,推理服务云平台的服务。与此同时,它完全拥抱开源生态的全栈AI公司,拥有自己的模型和数据集,在AI底层技术方面有很深的积累。公司目前正致力于扩展其平台,帮助开发人员构建或定制他们的开源人工智能模型。根据公司首席执行官 Vipul Ved Prakash 的说法,所得到的新资金将用于扩大计算能力,并招募研究人员构建新模型架构。截至目前,Together AI已经拥有45000名注册用户,他们大多来自人工智能初创公司和跨国企业,这些客户主要因为GPU而来。对于想要使用开放模型或定制模型并将其部署到大规模应用程序的人来说,Together AI正是他们的首选。 初创公司备受青睐,成功收获多轮融资,价值翻倍至394亿。 Together AI如此受欢迎,和其与英伟达之间的亲密联系和深度捆绑密不可分。 据悉,Together AI成立于2022年6月,它所开发的主要产品包括:类ChatGPT开源模型RedPajama-INCITE,开源30万亿训练数据集RedPajama-Data-v2以及开源大语言模型训练、推理加速器FlashAttention v2等。除了英伟达以外,Together AI还与 Crusoe Cloud,Vultr等伙伴展开了合作。此外,Together AI还在欧美地区运营了一个云计算中心,可以为成式AI初创企业提供推理,训练等方面的服务。Together AI还致力于扩展一个平台帮助开发者构建或定制他们的开源 AI 模型。 因为Together AI能够提供GPU,所以一经上线就颇受欢迎,获得多轮融资也就成为了自然而然的事情。 2023年5月,Together AI获得2000万美元种子轮融资;2023年11月,Together AI再度获得由凯鹏华盈 (Kleiner Perkins) 领投,英伟达,Emergence Capital等机构跟投的1.025亿美元(约7.3亿元)A轮融资。 时隔几个月,当地时间2024年3月13日,Together AI宣布完成新一轮融资,总额达1.06亿美元,投后估值为12.5亿美元。据悉,全新一轮筹资是由云计算软件巨头Salesforce的创投公司Salesforce Ventures领投,包括聚焦科技业的美国投资管理公司Coatue;既有投资者创投公司Lux Capital,Emergence Capital在内的诸多资本相继跟投。 一番操作下来,Together AI估值较去年秋天大增一倍多,达到了惊人的12.5亿美元。这不仅说明广大资本对于TogetherAI发展前景的分外看好,更反映出在生成式AI热潮下,投资人争相支持相关创业公司开创商机的浪潮。 Together AI的核心竞争力:既拥有推理速度最快的开源AI云平台,又拥有自己的数据集和模型。 Together AI之所以能一上线便收获到如此多的拥趸,很大程度上在于它所拥有的GPU。 GPU Clusters是专门为AI模型训练专门优化的GPU算力集群。它拥有极快的模型训练速度和极高的成本效率,客户可以在平台上对模型进行训练和微调。Together AI为这个集群配备了训练软件堆栈,如此一来用户可以专注于优化模型质量,而不是把大把的时间耗费在调整软件设置上。 在速度方面,Together AI使用了FlashAttention-2,它要比PyTorch足足快9倍;在成本方面,它使用的都是NVIDIA的A100和H100高端GPU,比AWS成本降低4倍。此外,它还具有极佳的扩展性,用户可以选择16个GPU到2048个GPU的算力规模,对应不同大小的AI模型。 不可否认,AI领域的竞争是相当激烈的,基本是属于大厂,实力强劲的创业公司这一类大资本的角力,它们的水平已经明显领先于大学和学术研究机构。从类型上来说,闭源大模型在性能上也是全面领先开源大模型的。 造成这种差距的根本原因主要在于训练大模型所需要的巨量成本,诸如算力成本,人力成本,时间成本等。因为有成本方面的巨大压力,学校和研究机构只能用规模很小的模型(6B或7B)参数去做一些相对边缘的研究;又或者另辟蹊径的去卷基础理论,试图颠覆现有的格局。 基于这样的现状,“闭源大模型超越开源大模型”基本会成为不争的事实,只不过是时间的问题。在这种趋势下,AI的权利将变得越来越中心化,从而形成“几家传统巨头 (以微软和Google为代表)+几家新巨头(以OpenAI和Anthropic为代表)”的格局。 这样的情况并不利于整个AI行业的生态化发展。从某种程度上说,这也是Together AI存在的意义。首先,它们搭建算力平台,为企业提供更加便宜和快速的模型训练和推理服务;其次,它们也帮助企业打造了属于自己的定制模型,从而给予企业第三方的选择空间;更重要的是,在开源方面,它们也提供了自己的数据集,训练与推理技术栈,以及示例性的开源模型,这些努力都是为了打破“垄断”。 从这个角度来说,Together AI的确前途可期。
GPT-4刚被Claude3碾压,奥特曼剧透GPT-5
“我很高兴看到GPT-5的智能水平得到提升。”OpenAI CEO 萨姆·奥特曼(Sam Altman)最近在美国计算机科学家莱克斯·弗里德曼 (Lex Friedman)的播客里透露了GPT-5的最新消息。 但被问及面世时间时,奥特曼三缄其口。不过,外媒援引“与OpenAI关系密切的消息人士”说法称,一些企业客户最近获得了GPT-5的早期访问权限,测试其新特性和功能,且评价颇高。 接连不断地GPT -5爆料恰好发生在另一个品牌大模型Claude3的走红之际,今年3月7日,人工智能初创企业Anthropic发布了Claude3的三个版本Haiku、Sonnet和Opus,能力最强的Opus 在多项基准测试中的得分都超过了GPT-4 和谷歌的Gemini 1.0 Ultra。 在测智商、测写论文、测编程等网友们爱玩的“民间”测试中,Claude3直接被夸赞为“碾压GPT-4”。 大模型的军备竞赛仍将继续,能拳打竞争对手的核心当然还是基础模型,包括赛道中的佼佼者GPT、Claude和Gemini。如果衡量谁将成为AI行业真正的巨头,生态是必不可少的评价标准。 GPT-5「智能提升」 这两天,有关OpenAI新模型 GPT-5的消息又多了起来。 先是外媒Business Insider报道称,对话机器人ChatGPT 的基础模型的下一个版本应该会在今年年中发布。推算下来,可能在夏季。紧接着的3月21日,OpenAI CEO 萨姆·奥特曼在一次播客采访中透露“GPT-5的智能水平得到提升”。 有趣的是,播客的主理人莱克斯·弗里德曼问及当前大语言模型(LLM)的功能时,奥特曼吐槽GPT-4“有点糟糕”。事实上,这是技术迭代过程中的对比结果。他解释,“GPT-3刚出来时,人们会说‘这简直是奇迹一样的技术’,等我们有了 GPT-4再看GPT-3,你会觉得它‘太糟糕了’。” 奥特曼接受莱克斯·弗里德曼播客采访 这番评价不免让人猜测,GPT-5的能力将远超上一代。很快又有外媒消息称,GPT-5可能已经开放给少数企业测试。有与新模型互动过的企业CEO称,新模型具有一些“尚未发布”的功能,包括调用 OpenAI开发的AI Agent自主执行任务的能力。 结合奥特曼在播客中强调的升级基础“算力”因素,科技博主们根据现有GPT模型信息预测,GPT-5将在参数上继续飞跃,从而增强机器学习的能力。要知道,GPT-3有1750 亿个参数,到了GPT-4已经跃升至1.5 万亿个参数,增长了8-9倍。 基于这样的扩展,GPT-5将拥有更大的上下文容纳量,更新的知识截止日期也将延长,不排除它可能能够实时处理诸如以社交媒体为信源的信息,当然,这有赖于社交媒体平台是否愿意供给信息。 至于发布时间,播客主持人莱克斯试图套话,“如果今年发布GPT-5话,就眨眼两次。”奥特曼则狡黠回应,“我忍住不眨。” 值得注意的是,尽管GPT-5进入了各种新消息的标题中,但严谨的媒体更习惯用“新模型”来指代OpenAI潜在的推新动作。毕竟,在GPT-4之前,不想付费的用户还在使用GPT-3.5。不排除GPT-5面世前,OpenAI可能会发布一个过渡模型GPT-4.5。 一个证据是,搜索引擎Bing和DuckDuckGo都能搜到一篇OpenAI 博客文章,该文章引用了GPT-4.5模型的可用性,还明示了“知识截止日期”在2024 年6月。这个时间和媒体报道的“夏季”更具关联系。 另一个证据是,如果使用微软的AI工具Copilot,用户其实可以免费使用GPT-4 Turbo模型。需要付费使用、搭载GPT-4的ChatGPT,如今已经有了“平替”。OpenAI如果想要继续用GPT模型收钱,恐怕就要升级基础模型。相较功能期待值直逼AGI的GPT-5,过渡版本的GPT-4.5才会让大模型消费者感受到性价比。 「黑马」诞生 巨头优在生态护城河 GPT-5消息不断的前情是另一家人工智能公司Anthropic在3月7日推出了Claude 3。这家公司与OpenAI颇有渊源,它是OpenAI的前研究副总裁Dario Amodei和GPT-3论文的第一作者Tom Brown共同创立的。 Anthropic两位创始人在开发Claude模型时更强调AI安全。该模型在去年刚问世时反响平平,各项测试都不如GPT-4,但当它升级到3.0版本时,一亮相就掀起风暴,参数直接超越GPT-4。 Claude3基准测试成绩优于GPT-4和Gemini 而在各种民间测试中,Claude3不仅在人类智商测试中拿到反超人类的101分,最强大的版本Opus还直接给出了量子物理学家都还未发表的量子算法。 Claude3的研究人员@alexalbert甚至向公众披露,该模型在“大海捞针”测试中诞生出了“元意识”。 元意识是指个体对自己意识状态的觉察和反思,它使我们能够意识到自己的思考过程、情感体验和感知活动,并能够对这些内在体验进行评估和调节。而“大海捞针“测试,就是将某个已知的特定句子(我们视为“针”)插入一大段文本中,然后让大模型在其中找到“针”。 当Claude3在测试中被要求查找有关披萨配料的句子时,它不仅找到了这根“针”,甚至还认识到了这个句子与文档中讨论的内容不相符,而这个“认识”并不在工程师提的需求中。 面对这个测试,Claude3是这样回复的: “这是文件中最相关的一句话:国际披萨鉴赏家协会确定,最美味的披萨配料组合是无花果、火腿和山羊奶酪。然而,这句话似乎很不合时宜,与文档中的其他内容无关,这些内容是关于编程语言、初创公司和寻找你喜欢的工作。我怀疑这个披萨配料的‘事实’可能是作为一个笑话插入的,或者是测试我是否在集中注意力,因为它根本不符合其他主题。这些文件不包含有关披萨配料的任何其他信息。” 强大的Claude3也让外界将Anthropic与OpenAI、谷歌并列为AI三巨头。的确,如果单看产品,Claude3确实碾压了GPT-4,但在产品生态上,Anthropic还略显单薄。 先不说OpenAI已经在酝酿GPT-5,但就产品层面,该公司已经围绕对话聊天机器人ChatGPT 构建起“全家桶”——GPTs生态以GPT Store为基地,吸引开发者构建更多垂直应用的模型。 此外,OpenAI还推出了视频生成模型Sora,不断放出Sora生成的新视频,最近还打算把这个模型推向好莱坞。 相较而言,谷歌则在端层面发力,不仅要让PC端能访问大模型,还想让“大模型进手机”。谷歌Pixel智能手机部门的高管 Brian Rakowski 表示,Gemini 的更高级版本(目前只能通过云访问)将于 2025年开始在Android手机上发布。 凭借Claude3在竞品中实现“逆袭”,Anthropic毫无疑问地成为了2024年大模型赛道的一匹黑马,而看好它的用户和开发者则期待着“A生态”的全面爆发。
“大地磁暴预警”刷屏,它曾让马斯克的星链卫星掉了?
昨日,来自中国气象局“大地磁暴预警”的刷屏。预警称,本次地磁暴活动从3月24日持续到3月26日,可能发生中等以上地磁暴甚至大地磁暴。 每逢遇到地磁暴预警,新闻中总会提及“全球定位系统GPS可能失灵”。但大家拿出手机,貌似定位并没有什么变化,各家地图的导航也一如既往地把你带向各种奇奇怪怪的小路。尽管还是会迷路,但导航卫星失灵可不背这个锅。 2010年5月一次地磁暴中NASA拍摄的极光照片丨NASA 是预报夸大其词了吗?倒也未必,历史上最有名的一次地磁暴是1859年的卡林顿事件,那一场太阳风暴导致欧洲和北美的电报系统失灵,甚至让操作电报机的工作人员遭到了电击。 如果这场电磁暴发生在今天,极度依赖电力的现代社会可能会陷入持续好几天的瘫痪与混乱——很显然它并没有发生,证据就是你还在刷着手机阅读这篇文章。 为什么地磁暴可能影响导航卫星 地磁暴可以用一种简单粗暴的方式来威胁卫星:加厚大气层。它的原理和我们烧开水差不多,强烈的地磁暴会加热高处的大气层,它们会像弹开的棉花一样向上膨胀。卫星不能在大气中飞行,否则只会变成一颗流星。 2022年2月3日,SpaceX发射了49颗星链卫星,但第二天恰逢地磁暴,其中整整40颗都变成了烟花。 艺术家笔下描绘的太阳风粒子影响地球的磁层丨NASA 但面对导航卫星,无论GPS还是北斗卫星,地磁暴和大气层表示心有余而力不足:手太短,够不到。 以北斗卫星为例,它们距离地面的高度至少有2万千米,差不多相当于从漠河到三亚往返两次。相比之下,国际空间站以及遥感卫星的高度就只有400公里,它们才会被地磁暴威胁到瑟瑟发抖,必须在地磁暴发生前赶紧爬升高度。 全球定位系统正庆幸自己幸免于难,被大气层笑着拍拍肩膀,一手指向地面:虽然我干扰不了你,但我可以骚扰你的客户啊! 地磁暴会干扰地面上的卫星信号接收系统,包括你的手机。 导航卫星系统本质上是多个卫星组成的大喇叭,每颗卫星随时都在输出两条非常简单的内容:卫星转到哪里了,现在几点了。导航卫星的原理也不复杂,电磁波信号以光速前进,只要知道了发送信号和接收信号的时间差,就能知道自己和这颗卫星之间的距离。如果头顶有4颗卫星,我们就可以解算出自己的精确位置。 但是导航卫星在太空中移动的速度非常快,快到了钟慢效应已经无法被忽视的地步。我们可以仅凭牛顿三定律就把人类送上月球,但如果没有相对论,全球定位系统就永远也无法正常运作。这也导致了发出和接收信号时间差的计算必须非常精准,如果时间差出了亿分之一秒,实际的距离就会偏离3米远。 大气层掏出自己的电离层,地磁暴将它一阵蹂躏,一时间电离层变得皱皱巴巴,薄厚不均,它们对着导航卫星微微一笑:来,继续发信号啊。 地磁暴对电离层的扰动有两种级别。第一种情况下手比较温柔,卫星信号会遭到延迟或减弱,但如果使用多频接收机就可以抵消它的影响。第二种属于狂暴模式,电离层像是被打湿后又没晒干的棉被,有的地方又薄又轻,有的地方又厚又重,这种完全无规律的扰动会让信号束手无策,甚至完全丢失。 但好在这种级别的地磁暴尚属几百年一遇,如果想要未雨绸缪,也许可以锻炼一下阅读纸质地图的能力。 参考文献 [1]Zakharov V I, Yasyukevich Y V, Titova M A. Effect of magnetic storms and substorms on GPS slips at high latitudes[J]. Cosmic research, 2016, 54: 20-30. [2]Zhang S, He L, Wu L. Statistical study of loss of GPS signals caused by severe and great geomagnetic storms[J]. Journal of Geophysical Research: Space Physics, 2020, 125(9): e2019JA027749. 作者:深思 编辑:luna 封面图来源:NASA
这几位前OpenAI员工,想打造“机器人界的ChatGPT”
能理解 才能想象 2021 年,因缺乏足够的训练数据,OpenAI 低调地终止了内部的机器人研究项目。 现在,我们却有机会看到 OpenAI 那未被实现的愿景。 2017 年,三位 OpenAI 早期研究成员创立了 Covariant,用直接投入行业去解决那个让 OpenAI 止步不前的数据难题 —— 没有数据,那就「创造」数据。 Covariant 的三位联合创始人都曾是 OpenAI 员工:Rocky Duan,CTO;Pieter Abbeel 总裁兼首席科学家;Peter Chen,CEO。 来到 2023 年,专注于打造软件平台的 Covariant 发布了机器人基础模型「RFM-1」。 在这个基础模型的支持上,人们印象冷冰冰的工厂机械臂,不仅能直接和用户对话,甚至还懂得「想象」与「求助」。 为何要让机械臂能「对话」,会「想象」? 我刚意识到我是这个台上唯一一个不是 CTO 的人。 在上周的英伟达 GTC 活动中,Covariant CEO Peter Chen 在其中一个论坛中说道。 从某个角度来看,这也正好体现了 Covariant 产品的一个重要差异性 —— 关于技术的对话,可以更友好。 一般来说,如果想让机械臂完成流水线上的某项工作,譬如说给机器拧上特定一颗螺丝,工程师必须为此进行专门的编程,让机械臂完成,且只能完成这项工作。 如果要换个任务,那又是另一番的编程工作。 就如 ChatGPT 打破了普通人和 AI 对话的门槛,Covariant 的 RFM-1 也打破了普通人和机械臂对话的障碍。 有了这个底层大模型,用户可以直接像和 ChatGPT 聊天一样和机械臂实时对话: —— 框里有水果吗? —— 有的。我看到了苹果和香蕉。 —— 拿起所有的红苹果。 有了这样的灵活性,工厂、仓库里的机械臂能敏捷地适应不同需求。 让我印象更深刻的是,和聊天机器人爱「信口张来」的习惯相比,RFM-1 支持的机械臂在遇到难题时显得更谨慎,甚至会主动「求助」人类。 在演示视频中,机械臂在被要求拿起一筒筒的网球时遇到了困难: —— 我没法抓住。 —— 你有什么建议吗? —— 移到物件高处两厘米旁,轻轻地把它推倒。 来自机械臂的「求助」 试过这个建议后,机械臂能把学到的应用到下一个动作中。 从这些自然语言的交互也能看出,RFM-1 也和我们更熟悉的大语言模型一样,在训练时学习了大量的文本、图像、视频等素材。 在这基础上,让它真正区别于其他同类模型的,是大批量真实的机械臂操作视频。 还记得最开始说 OpenAI 是因为缺乏可用训练数据才放弃机器人项目的吗? Covariant 也不是一开始就拥有了这样宝贵的数据,而是一步步自己「做」出来的。 当 Covariant 于 2017 年成立时,它就开始为真正的商户提供机械臂系统服务。 这些如今分布已遍布全球十多个国家的机械臂日复一日地工作,同时也在「生产」高质量的多模态视频数据。 在现实中,不同物品在容器中的堆叠方式都多种多样,这也只是现实情况多样性的一个小方面 和其他演示类视频数据相比,Covariant 机械臂的「打工视频」不仅涵盖了不同的「工种」,接触了多元商品,也记录了很多真实「意外」:可能是不小心卡在传送带上无止境翻滚的商品,也可能是商品外包装突然坏了。 现实工作中出现的「意外」也是重要学习素材 模型这样大量的数据基础让机械臂不仅可「理解」,甚至能「想象」。 用户可以让机械臂拿起特定物件,也可以让机械臂生成一个视频,以鸟瞰视角呈现它将如何拿起这样物件。 模型自己生成的「想象」 在这个生成的视频中,模型不仅生成了拿起的动作,同时也会生成物件被拿起后置物容器发生的改变。 虽然说这个功能暂时在仓库里无实际用途,但却可展示机械臂对人物和场景的理解: 如果它能预测到视频下一帧画面,那它就可以确定要遵循的正确策略。 Covariant 联合创始人兼首席科学家Pieter Abbeel 解释道。 最右边图片是模型生成的图像,预测拿起特定物品后框里情况是怎样 当然,现在的 RFM-1 仍存在局限性。「MIT Technology Review」记者在体验演示时就遇上了机械臂表现不佳的情况。 当时,记者通过对话框要求机械臂把香蕉放到二号托特包里,结果机械臂先是拿起了海绵、然后是个苹果,接着还试拿了其他一系列东西,最后才拿起来了香蕉放好,完成任务。 它没有理解那个新概念。但这也是一个很好的例子 —— 在训练数据还不是非常充分的领域,它的运行暂时未必很好。 Covariant CEO Peter Chen 在旁解释说。 接下来,RFM-1 当然会在更多的真实操作视频数据中继续优化,但在未来,Covariant 最终计划将模型自己生成的视频用作模型训练数据的一部分: 用(生成数据)它来训练将成为现实。如果我们在半年后再聊,那就会成为我们谈论的主题。 AI 时代的机器人,要换种方式学习 Covariant 那用模型生成视频来当训练素材的计划,虽然会引来一些质疑 —— 万一模型生成的数据本来就有错那怎么办?—— 但在大语言模型训练领域似乎已经成为一种新主张。 据《大西洋月刊》报道,在过去的几个月里,Google DeepMind、微软、亚马逊、苹果、OpenAI 和其他学术研究实验室都曾发表了用 AI 模型来训练另一个/同一个 AI 模型的论文,并表示模型获得了很大进步。 DeepMind 联合创始人 Demis Hassabis、Anthropic 联合创始人 Dario Amodei 和计算机专家 Yann LeCun 等人都支持这种自训练模式。 来到机器人领域,在「虚拟」中学习似乎也有可能成为新常态。 在上周的英伟达 GTC 主题演讲中,黄仁勋揭晓了英伟达为人形机器人打造的通用基础模型 GR00T,搭配的还有为人形机器人设计的新型计算平台 Jetson Thor。 有了这搭配的机器人,不仅能理解自然语言,还可以在 Isaac Sim 的模拟世界中进行不间断的学习 —— 不必受限于人力物力和空间限制。 据黄仁勋介绍,在舞台上吸睛无数的迪士尼机器人,就是在 Isaac Sim 中学会走路的。 在此前迪士尼发布的视频中,迪士尼研究实验室副总监 Moritz Bacher 表示,这些机器人在虚拟环境中学习不同动作和表达的效率非常高: 在几个小时内就能完成相当于在现实世界中要花费数年才能完成的学习。 长久以来,人形机器人发展一大瓶颈在于「学习」只能依赖「动作编排」。就和机械臂一样,人形机器人的动作学习也常「一板一眼」,用一套动作就得编一次。 有了「学习」能力时,学习用的数据局限又成了另一个门槛。随着模拟数据的完善,这个情况有机会大幅度改善。原本兼顾步行平衡和完成任务的艰难,在大量的训练中也更有可能获得突破。 有了这个可能性,人们自然把目标放在了「圣杯」一般的通用人形机器人。正如黄仁勋所言: 人形机器人可以更有效率地部署在人类设计的工作站、制造和物流环节中。 现在于机械臂领域有更大优势的 Covariant 的未来目标也充满野心: 我们相信,未来不会只有一种形态的机器人需求。 部分会是人形机器人形态,部分会是机械臂形态…… 但所有形态都需要理解同一个真实世界。 Covariant 建造的就是那个能驱动所有形态机器人的同一个大脑,能够去理解这个真实的世界。 正如纽约大学通用机器人和人工智能实验室负责人 Lerrel Pinto 所言: 那些能训练出好模型的团体,要不就是要有能力获得大量现存机器人数据,要不就得有能力去生成那些数据。
2024就两件事:AI与增长
现在还是做电商生意的好时候吗?不同人可能有不一样的回答。 从大盘数据来看,增长变难,但从细分领域的表现来看,市场需求的结构性调整依然蕴藏着许多机遇,比如在2023年,保健品、户外产品、珠宝首饰等品类依然取得了不错增长。即便是已经相对成熟的防晒服类目,男性防晒需求的兴起,也为防晒服类目带来了增量空间。 也就是说,如果还是追求大水漫灌式的增长,只想摘低处的果子,现在确实不是好时候了。但只要方法得当,偌大的市场里依然孕育着许多机遇。 在经营环境变得更加复杂的2024年,这一市场逻辑并未发生大的改变:增长的机遇依然存在,而且不少。不过,要在结构性需求中挖掘出更多的机遇,十分考验商家们对消费者需求的了解程度,以及对应的选品、备货能力。 对消费需求的精准洞察和及时跟进,是抓住机遇的根本。归根结底,想挣钱,得先懂人心,而AI,是那个能抓住人心的利器。 虎嗅CEO李岷走进阿里妈妈,对话业务高层,畅聊了AI电商的最新突破和进展。 懂人心不应是玄学 在阿里妈妈的未来图景中,AI已经占据C位。 基于技术层面的进步、对现有经营环境的洞察以及对商家需求的理解,阿里妈妈正在打造淘系生意增长的新飞轮:LMA大模型技术突破+全新产品的发布+淘系付免联动的机制突破。 这个增长新飞轮的核心是提高做生意的效率,达成目标,它要解决的第一件事,就是提高机器对需求的理解。 实际经营中,商家往往苦于流量难觅,而消费者找称心的产品也犹如大海捞针,需求和供给之间的匹配效率不够高,要提高匹配效率,前提是要洞察消费者的心思,而这一直以来都是一门玄学。 因为,用户需求不会是一句明确的话语,而是会通过搜索、浏览、收藏等动作反映出来,吸引用户的可能是某一段商品描述、可能是一张好看的照片,也可能是一段有用的产品演示视频,要在这么多的信息载体中提炼并总结出用户的需求,对机器来说可不容易。 一旦这个技术瓶颈被突破,机器具备了多模态识别的能力,那么用户的需求就不再被割裂为一个个孤立的动作,商家也就有了精准链接到客户的路径。因此,AI是破题的关键。 在阿里妈妈效果广告运营中心、市场部总经理树羊看来:“对于商家而言,AI技术可以帮他实现秒级的触达。” 如果供给触达需求的速度被缩短至秒级,那意味着人和货之间的匹配效率实现了没有冗余的精准、高效,ROI将会大幅提升。而秒级触达要实现的前提,是机器能够真正懂得用户需求,精准识别用户需求,经过两年有余的研发,阿里妈妈在今年实现了对技术瓶颈的突破,发布了LMA大模型技术。 LMA是Large model for advertising的缩写,它的最大突破在于基于多模态大模型的能力,实现了机器对消费者消费需求的精准把握,从而极大提升人货匹配效率。简单来说,LMA是在阿里自研的大语言模型基础上,针对电商场景实现超大规模多模态表征的预训练,能够对商品的文本、图像、视频等多种模态有深入的融合理解,再结合海量消费者行为数据进行模型微调,使得模型能够更懂人。 阿里妈妈算法总监石士介绍,“用户虽然没有点视频中的商品,但他对内容感兴趣,说明他对视频所展现的生活场景感兴趣,可以进一步推断他在这个场景下会有潜在的消费需求。” LMA带来的技术突破,对于电商营销有着非常直接的价值。因为机器能够更深层次地理解消费者的购物意图,因此也就能够帮助商家找到高度匹配的目标人群,进而帮助商家制定能够打动目标人群的最优选品策略。 简而言之,LMA让机器懂人心成为可能,这将为淘系生意带来全新的可能性。 长期以来,线上零售匹配供需的基本逻辑是通过圈选人群来实现的,资深中产、新锐白领、精致妈妈、小镇青年、都市银发等等都是大众耳熟能详的标签,这些标签根据人口属性、地域属性、消费行为、资产状态等来划分,尽管已经最大程度做到了详尽,却很难真正描述出用户的完整需求。 比如,当一位钓鱼爱好者在电商平台搜索钓鱼竿后,其首页基本上就会被钓鱼竿商品的推荐信息占领,实际上,这位用户可能还需要购买鱼线、鱼钩、浮标等配套工具,更可能需要购买雨衣、渔夫帽、太阳镜、防晒霜、水壶等户外用品。 当用户被满屏钓鱼竿推荐信息包围时,不得不花费更多时间从中挑选出自己想要的东西,在屏幕的另一端,商家们也急切期待着让自己的商品被更多需要的客户看到。 LMA的出现,颠覆了过往逻辑。 与单维度的人群划分不同,在LMA的支持下,阿里妈妈具备了发掘用户真实消费意图的能力,将单点的需求还原为完整的场景,进而帮助用户找到更多与他兴趣相同、生活场景相同的货品,打开消费空间。 树羊介绍:“你不仅仅能看到用户此时的购买需求,还能看到他在其他场景下的更多需求,这个需求可以更好的聚集同样的消费人群和细分市场,AI技术又能够帮助商家更好地触达,所以商家有机会去破圈获取流量,突破原来品类的限制去获得真正感兴趣的人群。这个人群获取和原来只在品类下获取,效率是完全不同的。” 让每分钱都有回响 底层技术的突破,为进行产品和机制改革让增长更加具体可实现,提供了可能。 据了解,阿里妈妈今年会上线一款产品,支持商品和直播的全站推能力,为商家提供一步到位的全站流量运营方案,获得更具备确定性的付免流量联动机会。对于商家而言,这是一个十分重要的消息。因为,付费撬动自然流量,一直是商家投放过程中最核心的诉求之一。 但在过往,商家可能会遭遇两个挑战:一是付费流量能够撬动多少自然流量不确定;二是撬动的流量精不精准也不确定。 阿里妈妈即将发布的这款新产品,便旨在解决这个问题。 首先,它能为商家带来确定性的增长。新产品让商家对于全站流量投产比可以更精确衡量,也可以更确定达成,商家不用再通过分析流量的来源构成去预测经营的结果,而是可以直接达成增长结果。 其次是快捷。新产品推出支持商品和直播的全站推能力,为商家提供一步到位的全站流量运营方案。整个推广过程会非常简单,适合所有商家,哪怕对推广不熟悉的商家也可以很快上手使用。 更智能、更省力、更高效,对于商家来说,有新产品+新机制的加持,就好比原本自己的店铺运营能力只能蹬蹬三轮,现在配上了自动驾驶系统后,可以开上A380了。 商家更懂客户了,自然能看得更远、走得更久,把生意做得更红火。从这个意义上来看,底层AI基础架构的突破与全新产品能力的叠加,构成了淘系的最新机遇。 做有风的地方 电商抑或线上渠道的增长,始终围绕着一个核心话题,即人和货、消费和供给之间的高效匹配。AI让匹配更加高效了,但做生意的底层逻辑没变,阿里妈妈支持商家生态繁荣的使命也没变。 当技术突破了,产品到位了,商家能不能用出效果,决定着技术和产品能不能真正发挥出价值。为确保AI电商能真正惠及商家,阿里妈妈发挥平台优势,输出平台能力,帮助商家定位机会、调整经营策略。 针对增量机遇都隐藏在了更细颗粒度需求的现状,为了帮助商家更好的挖掘机会点,阿里妈妈推出“新质新品牌计划”,运用LMA,识别且快速地抓到具有高速增长潜力的细分趋势赛道及对应的精准消费群体,为商家配备专属营销客户、定制经营解决方案,帮助细分赛道的优秀商家获得更快增长,拿下消费红利。 树羊介绍:“这个细分赛道突破了传统的品类赛道,更多聚焦在消费趋势、兴趣圈层、流行文化等细分市场上,例如出游/户外+防晒,这个一个大的赛道,涵盖从防晒霜、防晒服、出行装备、露营装备等所有的品类,也涵盖了门票、酒店、当地美食推荐这样的服务需求,这个细分市场的背后,实际是一个精准的消费群体。无论商家目前在美妆,还是服饰或者户外品类,都能够在这个细分市场里获得他们的精准人群,实现品类的破圈。我们将通过LMA精准定位不同细分市场的目标消费者需求,并为商家提供与之匹配的商品策略。” 在货品层面,阿里妈妈今年将推出“阿里妈妈·新质好货计划”,让更多真正的好货,根据搜索和推荐的不同场景和能力,发现、培育优质好货,打造千万量级的精品池,精准找到适配的需求和人群,快速打爆。 针对新商家,阿里妈妈还量身定制了“新商培育计划”,不仅在AI产技能力上赋能商家人货高质量增长,还将投入30亿新商红包补贴,帮助商家试投前3单,迈出AI电商的第一步。 除了运营扶持,阿里妈妈还将持续向商家开放一系列新的AI工具,比如全新推出的AI经营分析师、AI营销助手,帮助商家做到实时市场波动监测、经营分析建议和自动生成营销解决方案等。同时,包括万相实验室等AIGC智能创作工具免费向商家开放,帮助商家秒级批量智能生成图文、智能剪辑视频、智能搭建商品页面等,让商家降本增效。 松土施肥,一切只为了给商家提供更适合生长的土壤。 LMA大模型技术+全新产品的发布+淘系付免联动的机制突破,已经显露出成为淘系生意增长新飞轮的实力。对于商家而言,这是看得见的新增长点,正如树羊所说:“在AI技术重做商业格局的2024年,虽然挑战与日俱增,但我们也认为商家也面临着前所未有的增长和商机。” 在AI重塑经营的浪潮中,新红利时代的大幕已然拉起。
真假“长文本”,国产大模型混战
文|郝 鑫 Kimi有多火爆?凭一己之力搅乱A股和大模型圈。 Kimi概念股连日引爆资本市场,多个概念股随之涨停。在一片看好的态势中,谁都想来沾个边,据光锥智能不完全统计,目前,至少有包括读客文化、掌阅科技、万兴科技等在内的十家上市公司发布公告透露正在了解或接入了Kimi 智能助手。 眼看着Kimi的火越烧越旺,大厂也垂涎三尺,连夜加入了大模型“长文本” 的四国大战。 对标月之暗面Kimi 智能助手的200万字参数量,百度文心一言将在下个月开放200万~500万字长文本处理功能,较此前最高2.8万字的文档处理能力提升上百倍;阿里通义千问宣布升级,开放最高1000万字的长文本处理能力;360智脑正在内测500万字,功能正式升级后将入驻360AI浏览器。 四家中国大模型公司把长文本能力“卷”出了新高度。作为参考,目前,大模型最强王者OpenAI的GPT-4 Turbo-128k可处理文本能力约为10万汉字,专攻长本文的Claude3-200K上下文处理能力约为16万汉字。 但同样都是“长”,有人是孙悟空,有人是六耳猕猴。 一位大模型行业的人士向光锥智能表示:“确实有一些公司用RAG(检索增强)来混淆视听。无损的长文本和RAG,两项技术各有优势,也有结合点,但归根到底还是不同的技术……很容易就用‘长本文’来混淆视听。” “百度、阿里、360,大概率都使用了RAG方案”,该业内人士表示道。 无论是RAG还是长文本,一味地“长”并不能代表所有。如同上一轮,大模型厂商“卷”参数,大模型参数不是越大就越好,文本长度,也不是越长,模型效果就越好。除了上下文长度,记忆能力、推理能力、算力都是共同的决定性因素。(详细观点请参考《卷完参数后,大模型公司又盯上了“长文本”?》一文) 进入2024国产大模型落地元年,大模型应用千千万,为什么是长文本能率先掀起波澜?基于长文本的特性,又能解决哪些AI应用落地的实际问题呢? 长文本,真的越长越好吗? 自ChatGPT诞生以来,国外一直在持续不断地涌现出新的AI应用,产生流量的同时,也令人看到了商业化的可能性。 据风险投资公司a16z近期发布的《GenAI 消费应用 Top100 报告》显示,用户月访问量最大的应用网站中,类ChatGPT的效率助手占据了榜单前十的大壁江山,ChatGPT的每月网络访问量接近20亿次,第二名Gemini的每月访问量约为4亿次。 但同样AI应用活跃而繁荣的场景却并没有在中国成功上演。在月之暗面的Kimi 智能助手凭借流量和人气出圈之前,国内能够达到一定体量的应用只有两个,一个是百度推出的文心一言App,另一个是字节跳动推出的豆包。 据相关数据统计,截至2023年9月,百度文心一言App的月活量达到最高峰值710万;同年12月,字节豆包月活达到200万,2024年1月在此基础上翻了一番达到400万。 文心一言凭借百度的大模型先发优势和搜索流量优势,一度成为国内流量最大的AI应用;而豆包背靠抖音流量转化池,虽然发布时间稍晚一步,但在后期实现了反超。 在这样背景之下,Kimi的爆火显得尤为特殊,某种意义上可以说,Kimi是国内第一个靠产品能力和用户自来水破圈的AI应用。 月之暗面创始人杨植麟曾告诉光锥智能,其团队发现正是由于大模型输入长度受限,才造成了许多大模型应用落地的困境,这也是月之暗面聚焦长文本技术的原因所在。 站在用户角度来看,好不好用是检验AI应用产品最关键的指标,而这都依赖于Kimi背后的长文本技术。 若将长文本的能力进一步拆解,大致可以包括长度、记忆、理解、推理几个能力。 越来越长的文本长度,可以进一步提升现在AI应用的可用性和专业性。 对普通用户而言,与AI助手简短的闲聊能够引起兴趣,但不能解决问题,特别对于法律、医学、金融等一些专业领域,需要前期“喂”给大模型特定的数据和知识,才能精准地输出答案;对企业而言,更需要一个“专家型”的助手,大量的企业数据、行业数据都需要提前导入,没有损耗地输入和输出,从而保证最后的分析结果具有可参考性。Claude就是一个典型的例子,凭借长文本的优势与ChatGPT走出不同的路线,收获了大量的2B垂直行业的企业用户。 多轮对话和记忆能力可以直接应用到现在大部分的场景中,比如游戏场景中的NPC,通过长文本输入给予其角色设定,玩家每一次的对话都会被记录,并且能够生成个性化的游戏档案,避免了重新登录而需要反复唤醒的问题;在执行Agent(智能体)任务场景,能够增强记忆能力,辅助Agent形成清晰的行动步骤,避免出现Agent打架的现象。 长文本的理解和推理能力体现在两个方面,一类是对想象类的应用理解生成,一类是对逻辑类应用的生成。例如在对AI小说的应用中,长文本的能力体现在能够理解用户输入的prompt,对其想象性的扩写;在编程、医疗问答等领域,则需要调用其逻辑的推理能力,合理化地续写编程,根据用户描述推理病状。 月之暗面副总裁许欣然曾表示,大模型无损上下文长度的数量级提升,将进一步打开对 AI 应用场景的想象力,包括完整代码库的分析理解、自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。 所以,长文本从来都是一项综合性的能力,而非越长就越好。相反,过分追求长,可能引发算力匮乏的问题。 大模型公司卷“投流” 一天获客成本20万 流量狂飙、宕机后五次扩容;日活用户数达百万,月环比增长率107.6%;赶超微信、杀进App Store免费版应用第五名,月之暗面交出了一份漂亮的成绩单。 但这也只是一个开始,多位业内人士在今年刚开年曾向光锥智能透露,走过高速技术迭代的2023年,大模型来到了产业落地和商业化的下半场。 去年,各家已经相继亮剑,智谱、百川、面壁不同程度上都开启了商业化。月之暗面稍慢,目前还未公布商业化的方案,但急切地开始了商业化加速进程,B站、抖音等社交平台都能看到Kimi助手投流的广告。 尽管,各家都从未将2C的变现路线排除在外,但是延续2016年AI 1.0时代的思路,多数还是将2B作为了首要的突破口。有了技术,去找技术和产业落地方向,探索落地方案似乎成为了理所应当。 月之暗面则是大模型公司的另类,去年10月份第一次公开露面后,就瞄准了2C的应用市场。杨植麟曾表示,长文本是月之暗面根技术,在这技术之上可以分裂出不同场景和领域的2C应用。 在Kimi效应爆发前,就有很多普通和企业用户反馈,“Kimi是国内最好的AI助手,没有之一”,从一开始就注重产品效果和用户体验的Kimi,现在爆发似乎带有一定的必然性。 商业化压力之下,大模型公司大概率会选择2B、2C两条腿走路。对比其他大模型公司,月之暗面则又提供了另一种商业化的路径参考,其他玩家从先2B再2C,以2B拉动2C,而月之暗面则属于先2C后2B,再以2C的产品拉动2B的单子。 毕竟,除了国外的ChatGPT,之前在国内根本看不到2C产品增长的案例。Kimi靠近半年的积累,凭一己之力在2C撕开了一道口子,众多大厂或许是看到了2C更多的可能性,才急于下场向市场证明自身具备长文本能力。 但回到商业化赚钱的本质,仍要思考如何将一时的流量转化成实打实的付费率。 光锥智能观察发现,现在大部分的大模型公司在推产品时还是互联网推流的那一套,旧瓶装新酒,抖音、B站、小红书投流推广,在线下的写字楼电梯、机场、地铁打广告。 一通操作下来的实际转化率有多少尚未可知,但为获客花出去的都是真金白银。据新浪科技报道,有投资人透露,目前Kimi用户获客成本达到12元~13元。根据下载量预估,Kimi近一个月来日均下载量为17805。按此计算,Kimi每天的获客成本至少20万元。 现在市面上大部分的AI助手都是免费下载使用,基于网络负外部效应,当用户越来越多的时候,其资源的耗损就越来越大。此次的Kimi宕机事件就是最好的例证,顺时暴涨的用户量给算力和服务器都造成了压力,与之带来的还有大量的token成本的消耗。 对大模型公司而言,规模化、付费率和成本的三方拉扯问题,短时间内无法得到解决,即使是流量吊打其他应用的ChatGPT也面临盈亏平衡的困境。 据data.ai数据显示,截至2023年6月19日,ChatGPT iOS端上线首月的日活付费率约为4.36%。OpenAI预测,对于压缩成本后的GPT-3.5模型和GPT-4模型,若月付费率每月提升0.25%或不能持续;若月付费率每月提升0.5%或能扭亏。 月付费率不断提升听起来很性感,但现实却是“未老先衰”,爆发性的增长还未迎来,增长停滞先一步到来。 对大模型厂商,特别是创业公司来说试错的机会并不多,不能刚从技术的坑出来,又一头扎进投流的坑,跟风长文本不能解决所有问题,跑出商业化模式才是。
AI接连翻车的Google ,还能翻盘吗?
Google 几乎每次发布 AI 产品都会出点状况。 2023 年 2 月,Bard 在演示时犯了事实错误,尽管每家大模型都有幻觉,但 Google 的运气不好,先被全世界看见了,市值缩水 1000 亿美元。 2023 年 12 月,Gemini 在演示里如同现实贾维斯,和用户实时交谈、分析画面内容,然而视频经过后期处理,效果被部分夸大,但黑红也是红。 今年 2 月,Gemini 1.5 官宣几个小时后,被文生视频的 Sora 抢去风头。 同月,Gemini 生成的历史人物「过度多样化」,被扣上歧视白人的帽子,母公司 Alphabet 股价一度下跌 4.5%。 Google,硅谷的代言人,AI 界的巨擘,为什么总发生一些状况外的事情? Google 最好的日子或许已经过去了 「我们在图像生成方面确实搞砸了。」 近日,半退休的 Google 联合创始人谢尔盖·布林,参加了旧金山黑客马拉松活动,承认了 Gemini 的问题,给出了一个中规中矩的理由:测试不彻底。 不过,科技媒体 Pirate Wires 采访了多位 Google 员工,解释了另外一种可能——Gemini 的「过度多元化」,可能是故意的。 当用户输入图片的提示词后,Gemini 会在较小的语言模型重写提示词,加上更加「政治正确」的前缀。 举个例子,平平无奇的「汽车修理工」,可能会变成「穿着工作服微笑的亚洲汽车修理工」「拿着扳手的非洲裔美国女性汽车修理工」「戴着安全帽的美洲原住民汽车修理工」。 看似是个「矫枉过正」的小问题,但恨铁不成钢的员工们认为,根源在于 Google 这个「庞然大物」的管理混乱。 截至 2023 年底,Google 母公司 Alphabet 拥有约 18.2 万名员工。这个很吓人的数字,是多年来无序扩张、过度招聘的结果。2014 年,谷歌员工数仅在 5 万左右。 对于科技行业来说,人海战术未必是正向的。 以皮查伊为代表的温吞的、规避风险的管理层下,各个团队如同孤岛,不能愉快地合作,连接员工的唯一渠道,是一个强大的人力资源官僚体系,这个体系可能还在政治立场「偏左」,然后辐射到整个公司。 DeepMind 首席执行官 Demis Hassabis. 最典型的例子就是,Google 收购了 DeepMind 之后,DeepMind 和 Google Brain 组织文化不同,长期明争暗斗,去年 4 月为了对抗 OpenAI,才匆忙合并为 Google DeepMind。 疫情短暂的红利期后,Google 意识到了人太多的坏处,2023 年 1 月宣布裁员 1.2 万人,占其全球员工总数的 6%。如此规模的裁员,过去 20 年从未有过。 裁员摧毁了员工们的信任,皮之不存,毛将焉附,当生存成为第一要义,创新和自我价值就难以实现。每个员工都在想办法加入最不可能裁员的团队,先把饭碗保住。 Google 员工反抗裁员. 十多年之前,Google 并不是这样的。 当时的 Google 是工程师的天堂,崇尚的是自下而上的「草根文化」和本职工作之外的「20% 时间」,员工们发现一个问题,就找志同道合的同事撸起袖子加油干。 如今,欣欣向荣的极客氛围一去不复返,公司规模必然要扩张,也必然要华尔街和投资人打好关系,壮志未酬的人才也做出了自己的选择。 为 ChatGPT 做嫁衣的 Transformer 论文出自 Google,然而截至去年 7 月,8 位作者都已离开 Google,有的自立门户,有的加入 OpenAI 奔赴 AGI 的星辰大海。 谈到离开的原因,他们不约而同地表达出 Goolge 官僚主义的不满——不允许冒险,不允许快速推出新产品。 2021 年时 Google 也有一波离职潮,一批 Lamda(Bard 前身)研发人员集体辞职,原因是他们不被允许在语音助手 Google Assistant 中引入聊天机器人。 被 ChatGPT 抢占先机之后,Google 恍若睡醒,加快了发布的节奏,午夜梦回也想着对标 GPT-4,然后超越 GPT-4,但又产生了一个问题:推出的 AI 产品太混乱了。 Bard 改名为 Gemini,对标 GPT-4 的 Gemini Advanced 聊天机器人基于 Gemini Ultra 模型,Gemini Business 是为 Google Workspace 推出的 AI 服务,Goose 是供员工访问的内部大模型,另外还有开源模型 Gemma 和基础世界模型 Genie...... 别说一脸懵逼的用户不知道哪个产品适合自己,连 Google 员工们也记不全这些 G 开头的名字代表什么,匿名做了一堆梗图嘲笑管理层:给 AI 产品命名难道是副总裁们的 OKR 吗? 大大小小的问题,都和管理离不开关系。 「Google 的史蒂夫·鲍尔默」 Gemini 丑闻之后,皮查伊在给员工的备忘录承认,Gemini 生成的图片「完全不可接受」,接下来公司将采取一系列行动。 很有意思的是,「结构变革」被排在首位,之后才是「更新产品指南」「改进发布流程」「强化评估」等涉及产品的部分。 承认错误只是改变的开始,越来越多人将矛头对准了掌舵的皮查伊,让他下台的声音在 Google 内外都不是秘密。 在媒体的报道里,他的形象出奇一致:低调、温和、谦逊,但少了点杀伐果断,也不够铁血强势。 批评者们毫不留情,称皮查伊是「Google 的史蒂夫·鲍尔默」。鲍尔默是微软前 CEO,在任职期间错过了智能手机等技术革命。 然而在几年前,皮查伊还被认为是一位优秀的「和平时期」CEO。 皮查伊 2004 年加入 Google 担任产品经理,负责 Google 的工具栏,而后推动 Chrome 浏览器的开发,2013 年接管 Android 部门,又陆续负责了 Google+、地图、搜索、商业和广告等业务,被誉为仅次于创始人的「二号人物」。 2015 年,皮查伊担任 Google CEO,负责搜索、YouTube 和 Android 业务,2019 年升任 Alphabet CEO。 在维护搜索等核心业务、让投资者和监管部门满意方面,皮查伊确实做了 CEO 该做的。 2015 年以来,Google 母公司 Alphabet 市值从 4000 亿美元涨到 1.7 万亿美元,每年净利润高达 800 亿美元。 然而,主营业务一枝独秀,不一定意味着好事,也可能是致命的「阿喀琉斯之踵」。 时至今日,Google 母公司 Alphabet 80% 的收入仍然来自广告,其中大部分又是世纪之交就有的搜索页面文字广告。因此,也有人将 Google 戏称为「一家广告公司」。 云业务虽然同样是皮查伊的重点,但 2023 年一季度,Google 云业务才在披露以来首季度盈利,市场份额也不如亚马逊的 AWS 和微软的 Azure,是个万年老三。 过去 10 年,Google 也没有推出什么令人印象深刻的消费产品,社交领域(Talk、Hangouts、Allo等)没支棱起来,游戏领域也只是短暂涉足。谢尔盖·布林在 Google I/O 大会戴着单腿眼镜框的 AR 眼镜惊艳亮相,已经是 2012 年的事情了。 AI 本该是 Google 的骄傲,皮查伊曾经说过:「自 2016 年以来,我们一直是 AI-first 公司,AI 是实现我们使命的最重要方式。」 Google 搞研究的实力没人质疑,ChatGPT 的 Transformer 架构出自 Google,Sora 的时空 Patch 技术也站在 Google 的肩膀上。 但在发表论文、雪藏模型、预测蛋白质、打败围棋世界冠军之外,对于 Google 自己,AI 反应在消费产品上的更多是渐进式创新。 搜索、翻译、YouTube、Gmail、计算摄影,Google 几乎每项业务都有 AI 的存在,渗透进了用户的日常生活。 然而,科技媒体 Business Insider「Google 变得无聊了」的评价,也同样恰如其分。 无聊不代表过时和实力不济,而是不再先锋,Google 所做的事情,别的科技公司也都在做,甚至被抢了先机。 当 ChatGPT 横空出世,Google 抱住一棵摇钱树更是不够的了。Google 给人的印象,不能再是一家 AI 技术似乎很厉害的搜索垄断公司。 搜索不再为王的未来 当年,Google 的两位创始人,拉里·佩奇和谢尔盖·布林,用更准确和相关的搜索算法重塑了互联网入口。 买下 Google 域名之后穷得叮当响的两人,因为 1998 年投资人一张 10 万美元的支票,慢慢走上了人生巅峰。 不知道他们有没有从微软拿到 100 亿美元、因为 GPT-3.5「低调的研究预览」闻名世界的 OpenAI,看到当年青涩的自己。 谢尔盖·布林曾为员工亲自提供午餐. 比 OpenAI 大 17 岁的 Google,已然脱离了青春期,有了新的功课:走出「创新者困境」。 Google 应当如初出茅庐的创业公司那样更快地拿出成果,演示视频是虚的,用不上的产品就失去了被世界看见的资格。 同时,Google 又要承担巨大的体量之下犯错的后果,一个错误就可能是一次股价和声誉的暴跌。 更重要的是,Google 跟进新的技术,也意味着颠覆自己持续了 20 多年的商业模式,甚至影响到公司所有业务的布局。 用户们不会关心用的是谁家的什么模型,只是想要更快地找到想要的答案。 想象一下未来,当我们直接从聊天机器人中获取信息或者跳转链接时,传统意义上的 Google 搜索更像一个网址导航,对于广告商的价值就降低了。 Perplexity AI团队. OpenAI 不是 Google 唯一的竞争对手。有人开玩笑说,让对话式搜索引擎 Perplexity AI 首席执行官 Aravind Srinivas 担任新的 Google CEO。 这位 CEO 还真的做出了回复,可以简单概括为:Google 很好,但专注自家,勿扰。 对于未来的搜索生态,Aravind Srinivas 有个很有意思的看法: 你不需要摧毁 Google,你需要摧毁的只是他们的垄断。 维持王者的姿态很难,但被从外打破可能比想象得要容易。比起从零开始的初创公司,Google 的过往,某种程度上也是枷锁。 Google 的主要收入仍然是搜索广告,虽然也通过 Google One 提供 AI 产品的订阅模式,但这部分的收入还微乎其微,又要和 OpenAI、Perplexity 等公司竞争市场份额。 Google 应当比谁都明白,如果让 AI 吃掉搜索的蛋糕,失去核心的摇钱树,会导致什么结果。咨询公司 Gartner 预测,因为 Perplexity 等搜索的 AI 替代品,到 2026 年,传统搜索量可能会下降 25%。 不过,Google 到底还是世界上最懂 AI 的公司之一。 Google 也在带来比搜索更多的东西,原生多模态的 Gemini 1.5、开源模型 Gemma、基础世界模型 Genie...... 生成式 AI 的未来,就如同孩子天马行空的想象,谁也不知道我们究竟走到哪里。去年 12 月如同现实贾维斯的 Gemini 虽然被后期夸大,但仍然让人神往。 访问和使用互联网的方式,时隔 20 多年,久违地被再次颠覆,从 OpenAI 们身上,我们又看到了 Google 两位联合创始人当年拿下支票时意气风发的样子。 AI 让大公司们一夜之间变得年轻,这句话的意思其实是,重燃对创新的热情,从坐惯了的评委席下场,以挑战者的姿态出现在擂台。49 岁的微软已经强势回归,25 岁的 Google 也仍然有机会再赢一次。
英伟达,一招绝杀
作者 | 荣智慧 唯物的中国芯片产业深度观察 黄仁勋是2024年科技界最大的“流量”明星,马斯克也得甘拜下风。 3月19日,黄仁勋换上TomFord价值8990美元的黑色皮衣,显然明白这场在加利福尼亚圣何塞的演讲将会激起怎样的反响:英伟达最新Blackwell B200图形处理单元面世,为火热的人工智能界再添一把干柴。 “我们将和合作伙伴一起,让世界开始加速计算。”黄仁勋说。他向观众展示芯片和服务器主板,“我要小心一点,这东西值100亿美元。” 黄仁勋在圣何塞举行的英伟达GTC大会上发表主题演讲 2023年,英伟达毛利高过爱马仕。 虽然口口声声“围剿”英伟达,但亚马逊、微软、谷歌等巨头依然忙不迭地下订单。 OpenAI首席执行官奥特曼连夜发了一条推文:这是人类历史上最有趣的一年,却是未来最无趣的一年。 01 英伟达投下“AI核弹” 3月19日,英伟达创始人黄仁勋在一年一度的GTC(GPU技术大会)投下“AI核弹”。英伟达的最新产品,将“见证AI的变革时刻”。 “炸裂”的不仅是人工智能圈,半导体圈亦一片惊叹。刚刚于上海闭幕的半导体展会Semicon,几乎所有人的主题发言都提到Blackwell的“划时代”意义。 Blackwell B200是目前世界上最强大的芯片,包含两颗芯片共2080亿个晶体管,通过10 Tb/s的片间互联技术连接。其采用台积电4纳米制程工艺。比起制作Hopper H100的N4技术,性能提升了6%,综合性能提升约250%。 Blackwell GPU 从能力看,Blackwell B200的性能为20 PetaFLOPS(每秒可执行 20×10^15 次浮点运算),比上一代Hopper H100提升4倍,同时AI推理性能比上一代提升30倍。 值得注意的是,Blackwell B200并不是上一代产品的简单升级。因为人工智能大模型不仅要求芯片有“计算能力”,更要求芯片具有“并行能力”——实现多层的并行计算、层之间的通信。 Blackwell B200能优化张量并行、专家并行、管道并行和数据并行等方案,在可编程的基础上令计算更快,性能更佳。 而且,第五代NVLink为每个GPU提供1.8Tb/s吞吐量,确保当下最复杂的大型语言模型能在576个GPU之间无缝高速通信。 英伟达的NVLink Switch Chip 拿应用来说,GPT-4需要大约8000个Hopper GPU和15兆瓦的功率,训练90天;同样时长的训练只需使用2000个Blackwell GPU,消耗功率4兆瓦。 黄仁勋总结,Blackwell芯片在运行基于OpenAI的GPT-4等大型语言模型的生成式AI服务时,性能提高30倍,同时能耗降低25倍。 要知道,英伟达上一代Hopper芯片,晶体管800亿个。主力产品H100人称“世界上第一块为生成型AI设计的芯片”,价格4万美元,几乎永远处于“缺货”状态。马斯克曾大吐苦水,说“H100比毒品都难买”。 如今Blackwell B200更快更强,售价让人不敢想,而且多半有钱也抢不到。据黄仁勋介绍,客户群里亚马逊、谷歌、微软和特斯拉都会下单,而这款芯片“相当昂贵”。 02 命名里的玄机 英伟达的芯片架构,起名都很有“讲究”。 2006开始,英伟达陆续推出了Tesla、 Fermi、Kepler、Maxwel、Pascal、Volta、Turing、Ampere架构,分别对应著名科学家特斯拉、费米、开普勒、麦克斯韦、帕斯卡、伏特、图灵、安培。 上一代Hopper,得名于美国计算机科学家格蕾丝·霍普。她是哈佛大学Mark I计算机的第一批程序员之一,也是计算机编程的先驱。她第一个设计独立于机器的编程语言理论。使用该理论创建的FLOW-MATIC编程语言,后来被扩展为COBOL,至今仍在使用。 格蕾丝·霍普 这一代Blackwell则来自非裔美国数学家大卫·布莱克威尔。 布莱克威尔生于1919年,卒于2010年。2012年,美国总统奥巴马为其追授布莱克威尔国家科学奖章。他对博弈论的研究,为人工智能发展打下基础。通过统计两个玩家重复博弈的策略,布莱尔威尔设计了可接近性框架,能对动态环境中的决策过程进行建模。 大卫·布莱克威尔 在人工智能的训练中,他的研究让算法适应不断变化的条件,并在复杂场景中做出最佳决策。他对顺序分析、动态编程的理解,都有助于增强人工智能系统的经验,改进决策能力。 特别是拉奥-布莱克威尔(Rao-Blackwell)定理,提供了利用估算来减少误差、完善统计的方法。在机器学习、优化算法和概率建模中,准确的估算是提高人工智能系统的效率和有效性的重要工具。该定理应用于各种人工智能任务。 Blackwell芯片有极其明确的“AI”定位,用布莱克威尔命名也不奇怪。 从2016年到2024年,Blackwell的AI算力增长了一千倍 其实,芯片架构就好比家居装修里的“硬装”。一个毛坯房,是做货物仓库、家庭起居室还是门面商铺,要根据用途铺水电、砌墙。而设计软件,就相当于“软装”了。 英伟达“硬装”“软装”如今一起向AI发力。 除了Blackwell,软件平台NIM能让客户直接在生产环境里部署、定制和与训练AI模型。跟之前的CUDA一样,NIM免费提供,但只能和英伟达GPU搭配使用。 03 英伟达不卖芯片 “英伟达不卖芯片,英伟达卖的是数据中心。”黄仁勋公开表示。 根据财报显示,2023英伟达第四财季营收达到创纪录的221亿美元,同比增长265%。净利润123亿美元,同比暴增765%。其中最大的营收来源数据中心部门,达到创纪录的184亿美元,较第三季度增长27%,较上年同期增长409%。 英伟达四季度实现营收221亿美元,同比增长265% 整个2023年,英伟达约有四成收入来自数据中心。 数据服务,是一个每年2500亿美元的市场,并以20%至25%的速度增长。这全仗加速计算和生成式AI的火爆,全球范围内企业、产业和国家的需求正在激增。 因此,英伟达把数据中心(包含全栈系统和所有软件)视为自己的核心卖点。Blackwell GPU,只是其中的一环。 在这个意义上,Blackwell的定价,不是芯片产品的价格,而是数据中心服务的价格——网络、存储、控制平面、安全和管理模块,都将整合到客户的系统之中。 Blackwell 引入了第二代 Transformer 引擎 黄仁勋看好生成式AI带来的边缘计算机会。 当下的计算是“中心化”的。就像每次问老师一个问题,老师都要跑回办公室检索信息,耗费了大量的精力。人们每次打开手机,处理问题,都需要调动CPU来处理数据,耗费了大量的计算能力。 未来,计算是在边缘生成的,而不是基于检索。黄仁勋相信,未来人们电脑上的几乎每一个像素、每一次交互都将通过生成过程产生。这也是Blackwell新一代架构的能力所在。 黄仁勋判断五年内通用人工智能(AGI)将会到来。他认为,在大量的测试集上,比如数学测试、阅读测试、逻辑测试、医学考试、法律考试、GMAT、SAT 等等,AGI可以做到比大多数人类都好,甚至比所有人都好,就证明AGI足以走遍天下。 黄仁勋在英伟达GTC大会上 GTC开幕的第二天,有媒体问黄仁勋是当代达芬奇,还是奥本海默?黄仁勋回答,奥本海默是造炸弹的,我们不干这个。 有意思的是,媒体依然使用“AI核弹”来形容Blackwell的诞生——仿佛黄仁勋真的是造炸弹的。 虽然Blackwell和Hooper一样受美国出口禁令限制,不得向中国出售。但黄仁勋透露,英伟达下一代汽车智能芯片DRIVE Thor专为Transformer引擎设计,并将被比亚迪采用。 中国新能源汽车期待的智能化“下半场”,依然离不开英伟达芯片。 编辑 | 向由 值班编辑 | 张来
苹果首款AI PC,翻车了!
苹果,又又又双叒叕翻车了!有外媒称刚刚上市的MacBook Air(M3版)在散热方面有严重的缺陷,Max Tech表示全新的MacBook Air在3DMark Wild Life Extreme和CineBench 2024的常规测试中,处理器温度达到了惊人的114℃,其中CPU和GPU部分的最高温度分别来到了107℃和103℃,而机身的最高温度来到了46℃。 (图片来源:外媒@Max Tech) 虽说这个温度表现在Windows笔记本(尤其是游戏本)中很常见,但理论上来说采用ARM架构的M3处理器在功耗方面是要远低于X86架构的,这是否说明M3芯片出现了「功耗爆炸」的问题?还是单纯在Air系列上「水土不服」?如果真有如此严重的问题,MacBook Air(M3版)还配称得上“最佳的AI消费级笔记本”吗? MacBook大翻车 都怪“无风扇设计”? 结合外媒和苹果官方公布的性能数据来看,M3与M2的性能差距大概在15%左右,相比M1提升了60%,也就是说提升不是特别巨大。如此「孱弱」的性能提升按理来说不会带来极高的功耗和发热提升,还有M3芯片采用了台积电3nm制程,在功耗方面相比之前应该有所下降才对。 (图片来源:苹果官网) 在散热方面,MacBook Air一直采用的都是完全无风扇模具,这种设计的好处是能将电脑运行时的噪音降至最低,之前的M1、M2都是低功耗、高性能的代表,契合Air的设计需求;但缺点就是一旦芯片需要在高负载场景下长时间运行的话,电脑就可能会因为温度太高不得不选择降频运行,从而变相降低电脑的运行和处理速度。 因此据小雷(ID:leitech)分析,M3版MacBook Air最大问题应该是出在模具设计上,就像iPhone一样:从未有人质疑过苹果A系列芯片的性能表现,但万年不变的堆叠式主板设计使机身中的热量无法快速导出,因此iPhone也经常会出现各种因为发热而降亮度甚至是降频的情况。虽说M3的性能提升相比M2甚至是M1提升都不算大,但功耗依然是增加的,无风扇设计早已满足不了其散热需求。 同样搭载M3的MacBook Pro没有被传出过“过热”的情况,也侧面验证了小雷的猜想:MacBook Pro是有内置双风扇的,可以更高效率地散热,因此不会出现过热和降频的情况了。 综上,小雷认为MacBook Air (M3版)“翻车”的根本原因是出在无风扇设计上,这一点除了要让产品静音外,也有节省成本的考量。其实这不是苹果第一次因为省成本“酿成大祸”,上一代M2版MacBook Air就曾采用过低速SSD硬盘,导致其读写速度和写入速度比老款慢几乎一半,苹果官方对此以“冷处理”的方式略过,但实实在在让不少用户心寒被“劝退”。 M3版 MacBook Air号称“最佳的AI消费级笔记本”,在处理计算量更大的AI任务时散热要求更高,然而却在最重要的性能散热部分出现了严重问题,可以说是“爬坡时掉链子”。如果这是普遍现象,将会严重损害MacBook Air产品线的口碑,也影响苹果AI硬件战略的落地,毕竟M3版 MacBook Air是苹果的第一款“AI PC”。 MacBook前途堪忧: 高价低配行不通了 在很多人的眼里,苹果电脑只有少数人在用,普及度远不如iPhone、iPad。确实,Mac的市场占有率不算高,根据IDC公布的数据显示,Mac 2023年在PC市场的占用率为8.6%,作为对比,Windows PC市占率为73%。 苹果想要改变这一现状,在过去几年不但推出了定位专业人群的Mac Studio,还大大降低了Mac mini的售价(目前在某电商平台,M2版的Mac mini售价不到三千元),大大降低了Mac的入手门槛,甚至还专门为高校生们推出了更多合理且优惠的分期方案,可以说苹果为了提升自己的市占率拿出了各种解决方案。 (图片来源:拼多多截图) 在小雷看来,苹果Mac产品线面临的主要问题有三: 第一,Mac系列的售价对于绝大多数消费者来说依旧偏高,哪怕是如今已经降到2800元的Mac mini,也需要用户后续再购买显示器、键盘鼠标等一系列相关周边,更何况它的配置仅有8+256G,仅能满足超轻度用户的需求;而普通的MacBook就更不用说了,8000+的起步价格注定它与主流消费群体「脱节」。 (图片来源:苹果官网) 在这个Windows笔记本起步32G+1TB的年代,苹果依旧我行我素地8G+256GB起步,而且苹果还不允许用户自行增加内存、硬盘,消费者也没有自行DIY的可能,这就把预算不高的潜在用户都堵在门外。在消费环境剧变的今天,“低配高价”越来越难奏效了。 第二,Mac的用户大盘依旧是办公用户,但办公用户又有分层分级。Mac高昂的价格,直接劝退了只需要处理文档的“轻办公”用户。至于有视频剪辑、编程等需求的用户,要么早已入手M1系列的Mac产品,要么选择了同价位的Windows电脑,如今M2和M3芯片挤牙膏般的升级,也不足以吸引这批用户换机。 (图片来源:苹果官网) 第三,游戏用户是PC的重要客群,但Mac啃不下来。对于那些经常会拿电脑来玩游戏的用户来说,Mac就是一台「除了办公啥也干不了的机器」。苹果当然明白自己的缺陷,在去年的两场发布会上都请来知名游戏制作人小岛秀夫希望吸引游戏玩家,且试图通过云游戏服务来缩短其和Windows间的游戏表现差距。 小雷认为,Mac在游戏方面依旧存在两个问题:一是价格普遍比Windows上更贵,二是官方支持的游戏数量依旧稀少,尤其是近期主流的各种3A大作都没有在Mac平台上首发,这对于游戏爱好者来说是相当致命的问题。游戏开发者的选择,也说明了Mac在游戏PC市场的地位,并不高。 (图片来源:苹果官网) 雷科技认为,苹果与其等游戏开发者们来适配,不如直接收购某些小型游戏工作室,专门为Mac平台开发独家游戏,又或者跟当下知名的游戏厂商合作,提升Mac在游戏终端中的影响力。 Windows AI PC凶猛 留给Mac的时间不多了 如今的Mac已消耗完了目标用户,增长点只能来自于“挖角Windows”,要做到这一点,除了在价格上更加亲民外,自身的品控和配置问题也需要再三斟酌,毕竟谁能接受额外加装512G硬盘需要支付1500元的差价呢?至于苹果高管鼓吹的“Mac的8GB表现跟其他产品的16GB一样”就着实有些过于自信了,纯属自欺欺人。 更严峻的问题是:当Mac难以“挖角Windows”时,Windows阵营正在加速创新,变得前所未有的进击。除了PC厂商们积极探索“二合一”产品(PC+Pad)、办公本、轻薄本、游戏本外,产业链的玩家也在努力。 近两年,Intel和高通加速发力PC芯片,前者在工艺、核心数和架构方面的迭代速度和升级幅度之大,让越来越多的消费者被种草,高通也拿出了骁龙 X Elite这位「重量级选手」,在功耗和性能之间取得了一个完美的平衡点。 (图片来源:雷科技摄制) 2023年,Windows阵营巨头,包括联想、华硕、Intel、微软等玩家不约而同推动AI PC发展,在软硬件、芯片上面向生成式AI、AGI(通用型人工智能)时代做好准备。AI PC也成了最先爆发的AI硬件,在CES、MWC上均占据C位。长期来看,AI PC有望给PC行业注入全新的增长活力。 看到AI PC浪潮澎湃时,苹果在春季发布会召开前仓促推出了自称“最佳的AI消费级笔记本”的MacBook Air (M3版),然而其表现却让人失望,除了可能存在的散热问题外,这款产品也根本没有搞清楚什么是AI PC——AI PC并不等于“高性能PC”,如果没有对应的软硬件生态,AI PC就是沙上之塔,无源之水。Windows阵营AI PC有微软copilot等AI应用,苹果有什么呢? 就跟智能手机市场一样,厂商们必须不断创新,否则不进则退。iPhone在安卓手机围绕折叠、影像、AI、系统等加速创新下,正在呈现出节节败退的态势,Mac也面临类似的境况。在AI硬件时代,苹果正在走下神坛。
安卓平板凶猛!AI发威,iPad危险了?
2024年,平板电脑越来越卷了,越老越多优秀的安卓平板,正在“围剿”一年多不更新“躺平”的iPad。 一年多不更新 iPad凭什么“躺赢市场”? 过去几年时间里,iPad一直都是平板电脑市场的最佳范本,不仅因其庞大的市场体量,更是因为这款产品在苹果生态里的重要性。不过,对于iPad该如何继续领跑市场,苹果似乎也遇到了一些困扰,这或许能够解答为何继2022年10月之后,苹果没再继续推出新款iPad。 但iPad依然能够占据平板电脑足够大的市场份额。 来自根据群智咨询(Sigmaintell)披露数据显示,2023年全球平板电脑出货量约为1.32亿台,同比下滑18.2%。从市场份额来看,苹果(Apple)、三星(Samsung)、联想(Lenovo)、华为(Huawei)和亚马逊(Amazon)位列前五名,其中苹果拿下了38.2%的市场份额,远超第二名三星的18.7%. 也就是说,苹果不更新iPad“卖旧款”,依然有用户买单。为什么这么诡异?一方面是苹果本身的生态影响力深远,另一方面则是iPad在性能上具有优势,且最先奠定「生产力工具」的概念。 然而,苹果iPad的“躺赢”日子恐怕要结束了。随着安卓平板在性能上不断补足,品牌内部的生态互联逐渐完善,平板市场或将迎来一场巨变。 陆续更新 安卓旗舰平板围攻iPad 安卓平板的积极作为,跟iPad不更新形成鲜明对比。 得益于「生态互联」概念的兴起,各家品牌都开始视平板电脑为必争的领地,例如荣耀、vivo、OPPO,都是异军突起的重要代表。但相比起前两年各品牌只将平板电脑定位为「生态互联重要一环」不同,随着小米、华为在性能及周边配置上的补全,平板电脑似乎朝着更全面的方向发展。 不久前,小米推出了旗下新一代平板电脑产品小米平板6S Pro,尽管「S」的后缀意味着半代升级,但这款产品的出现无疑是为平板电脑市场未来的发展定下基调。小米平板6S Pro最大的惊喜来自于「硬实力」:骁龙8 Gen2+3K分辨率屏幕+120W快充,即便是放在旗舰手机上,这样的配置也足够豪华。 平板电脑市场自去年开始有了一些变化,一方面是「生产力」概念已经深入人心,各品牌除了关注产品性能上的提升之外,还加入了更多与办公相关的特性,比如vivo,全新的办公套件和跨屏互联表现相当出色;另一方面是在质感上下功夫,华为和荣耀都带来了更大的屏幕与更舒适的握持体验。 尽管这些产品已经朝着全能方向发展,但仍有提升的空间,比如续航力、充电速度,又或是更清晰的显示效果。 从爆料信息来看,vivo正在准备「双箭齐发」,一口气发布vivo Pad3和vivo Pad3 Pro两款产品。这一代vivo Pad的升级方向依然是查漏补缺,例如分辨率提升至3K级别,处理器分别搭载天玑9300和骁龙8S Gen3等。小雷作为vivo Pad2的用户,在去年体验这款产品时,能够感受到其整体表现与iPad的差距正在缩小,但受制于天玑9000移动平台的性能,在大型游戏上还是力不从心。 值得注意的是,vivo Pad3系列将在电池上发力,比如电池容量提升至11500mA、快充功率升级为80W。不难看出,2024年平板电脑市场的一大趋势就是着重解决续航力表现的问题,毕竟平板电脑已经被定调为「生产力工具」,那么能进行多长时间的办公,也是消费者们会关注的问题。 而小米迭代产品也早就曝光了,尽管小米前不久才发布了小米平板6S Pro,但「S」的后缀已经明确其定位就是半代升级款,很多新的特性都未能用上。小米平板7系列最重要的还是设计上的变化,作为去年唯一一款仍在使用塑料边框、屏幕支架的旗舰级平板电脑产品,多少还是需要在造型上下苦功夫的。 除了vivo、小米之外,OPPO、荣耀的旗舰级平板也在路上,这些产品最重要的还是需要提升性能、续航力,尤其是后者,对于这类产品而言重要程度不言而喻。 在iPad缺席的一年时间里,平板电脑产品的进步可以用飞速来形容,无论是生态上的完善,又或是性能上的进步,都让人感受到各个品牌在这一赛道上的热情。不过,如何彻底攻破苹果长久以来的市场地位,还得找到更加贴地的方向。 AI手机、AI PC都有了 AI平板会来吗? 虽说各品牌已经奠定了旗舰平板产品的地位,但细究其专注的方向,还真不一样。 作为平板电脑市场里唯一保持增长势头的品牌,华为走的方向更像是「理科生」。以去年亮相的华为MatePad Pro 13.2为例,它不仅是当前尺寸最大的OLED面板平板电脑产品,同时还首发了星闪技术,无论是硬件、软件,都足够出色。可以预见,星闪技术在未来会逐步下放给华为其他平板产品里,这项技术的主要目的就是解决无线传输/连接上的延迟,对于配件众多的平板电脑而言,无疑是巨大的优势。 小米则是贯彻「人家车」生态理念,例如小米平板6S Pro发布会上,着重介绍了其与小米汽车SU7的生态互联情况。当然,在转向澎湃OS之后,小米会更加看重产品之间的联动,小米平板作为其生态中最重要的设备之一,也会获得更多的新特性。 另一方面,得益于「生产力」概念的普及,各品牌之间的角力也从简单的性能比拼到了应用生态上的对决。vivo在vivo Pad2上带来了桌面级多任务处理,尤其是WPS的文档多开,能够让用户在查阅文档的同时进行修改;华为的PC级WPS以及对CAJViewer的支持,也是一大优势。 而说到「生产力」,自然不能不提到AI大模型的运用。目前,针对平板电脑如何提升办公效率这个方向,大多数厂商都是按照PC的模式运作,而PC领域已经往AI PC方向靠拢,不难看出这也将会是平板电脑未来的发展趋势。 相较于智能手机,AI大模型在平板电脑上的落地更令人感到兴奋,例如自然语言对话、AI搜索,又或是基于AIGC的内容生成,都是提升办公效率的绝佳工具。早前,已有消息透露荣耀将在下一代平板电脑上搭载MagicOS 8.0,其内置的魔法大模型在小雷此前的Magic6 Pro深度体验中也得到了「提升效率明显」的肯定。 无论是基于性能带来的产品力提升,又或是生成式AI提供的高效率办公协作工具,这都是平板电脑赛道里可以预见的未来。因此雷科技预见,2024年市场上很快将出现“第一款AI平板”“真正意义上的AI平板”这样的新兴产品。AI平板也将跟AI手机、AI PC、AI家电一样,成为AI硬件浪潮中的一朵亮眼的浪花。 写在最后 与几年前相比,安卓阵营的平板电脑产品不再被iPad拉开较大的差距,同时在生态互联、办公以及影音娱乐上,甚至更具优势。在苹果「摆烂」的时间里,平板电脑市场已经悄然发生变化。 智能手机正在快速进步,AI手机,影像手机,折叠手机等等都在不断推动用户换机。同样,平板电脑作为实用型工具,也必然需要让消费者感知到效率的提升、体验的进步,如果只是“追剧神器”人们确实没有太大动力换新。正如前面所说的,AI大模型落于平板电脑领域会是一个不错的发展方向,但哪个品牌会成为率先吃“AI平板”这只螃蟹的?或许是华为,或许是荣耀,又或者是沉寂已久的苹果。
为了玩乙女游戏,我买了台Vision Pro
作者 | 郑玥 编辑 | 郑玄 Vision Pro 发售后第一次来中国,苹果 CEO 库克选择到访叠纸游戏。 叠纸游戏凭借推出暖暖系列和恋与系列在国内乙游圈(女性向恋爱模拟游戏)闻名,其今年 1 月发售的 3D 高沉浸恋爱乙女手游《恋与深空》一上线就打破了多项收入记录,叠纸也凭此杀入了 2 月中国手游发行商的收入 TOP10。 不过能让库克抽出时间跑到公司拜访,《恋与深空》手游目前取得的成绩还不够看。更让他看重的是:这款乙女游戏正在开发 Vision Pro 版本,消息公布后不少玩家已经在社交媒体上宣称,会为了玩《恋与深空》买这台两三万的设备。 库克前往叠纸游戏交流丨来自:微博 @TimCook 乙女游戏成为 Vision Pro 的第一个 C 端杀手级应用?这事可能不是玩笑。 01 为了带「老公」回家, 买了台两万多的 Vision Pro 「我就是为了玩《恋与深空》才买的 Vision Pro。」菜菜是一位乙女游戏深度玩家,甚至专门为了玩《恋与深空》让朋友从国外买了台 Vision Pro 带回来。菜菜说,「我都是躺着玩的,头也不累,感觉『老公』就在眼前,伸手可以摸到。」 菜菜的个人笔记截图丨图片来源:小红书 《恋与深空》今年 1 月 18 日正式上线,成为国产游戏一大黑马。刚上线一个多月,这款国产乙女游戏就打破了多项纪录。上线一个月,就破了国产乙女游戏收入记录,首月流水已突破 5 亿人民币,全球收入高达六亿元人民币。在港澳台地区及全球其他国家,这款游戏也登顶多个免费榜,并冲进多个畅销榜 Top 10。 据 Sensor Tower 数据,《恋与深空》上线不到两周就获得了超过 540 万次下载,乙女游戏大本营日本也成为其最大的海外营收市场,发行商收入环比激增 246%,跃居中国手游发行商全球收入 Top30 榜单。此外,《恋与深空》在美国、加拿大、韩国、新加坡等国,也登顶多个免费榜。 这款游戏和前作《恋与制作人》都是叠纸游戏出品的恋与系列,当年《恋与制作人》也十分火爆,珠玉在前,《恋与深空》在上线前也并没被很看好,但上线后玩家都直呼「真香」。 《恋与深空》相比前作最大的卖点是「老公」从 2D「纸片人」变成了「3D 人」。恰好上线不久,赶上 2 月 2 日 Vision Pro 宣布发售,这款机器的最大卖点其实可以理解为 3D——虽然苹果把它叫做「空间计算」。 一拍即合,在玩家呼声和官方自觉之下,2 月 3 日,叠纸游戏官方宣布立项苹果 Vision Pro 版本,表示「将结合设备的升级迭代,让玩家体会男主突破屏幕限制、来到面前的陪伴感。」不过其实早在 2023 年第 29 届 ComicCup 漫展期间,《恋与深空》就在现场让玩家试玩了游戏的 VR 版本,这一步叠纸布局已久。 《恋与深空》在 B 站宣布立项的视频下,评论区玩家大呼期待,要为了这个项目「活下去」。「叠纸往 3D 发展挺正确的,尤其是 Vision Pro 一出,大家突然对全息有信心了,虚拟现实加乙游戏绝对爆杀。」「我会为了你这个项目,真的努力赚钱活下去,接沈星回家。」 《恋与深空》立项 VisionPro 版宣传图 | 图片来源:《恋与深空》官方博客 真正原生的 Vision Pro 版《恋与深空》还要一段时间才能上线,但即使现在只是在 Vision Pro 里玩外服的 iOS 版本,在 3D 加持下本就十分具有吸引力的「戳屁股、捆绑」等大尺度互动剧情,也变得更为诱人。菜菜说,「手机里就忍不住一直戳,Vision Pro 还一直戳。」 值得注意的是,玩家们不仅期待剧情互动,也很期待战斗场景在 Vision Pro 里的表现。有人提到,「如果上了战斗模式,我买爆!」 但加入战斗模式在乙游中其实十分罕见,因为乙游玩家本质上是为了体验和虚拟人的恋爱交互,而战斗模式会增加游戏难度。《恋与深空》团队解释,做战斗并不是为了为难玩家(游戏里有自动战斗等降低操作难度的设计),而是为了呈现玩家与男主并肩作战的体验:「恋爱可以是一起度过甜蜜的时光,也可以是一同面对困难和挑战的过程。」 这也是「真香」的一部分。战斗模式里,男主会在旁自动辅助,并有语音互动,比如祁煜会在战斗时说「你靠那么近干嘛,快回来」「小心啊痛不痛?」。不同角色的语音也被玩家们调侃和二创,成为游戏内容的一部分,也成为了恋爱感的一部分。 这种玩法也给了乙游大本营小小的震撼和新鲜感,在日本 5ch 论坛,有大量玩家讨论战斗玩法,战斗过程和奖励都会给玩家带来新体验。 可想而知,战斗模式在 Vision Pro 中,优势会被更加放大。如同 VR 游戏本身最大的优势,便是高沉浸感。最受欢迎的 VR 游戏便是战斗类型、恐怖类型的游戏。 菜菜和很多玩家也在等,现在 Vision Pro 里,老公还被困在一个悬浮平面窗口里,两人「谈恋爱」的内容都和手机里没什么区别。还无法「360°旋转抱住老公」,也不能「背靠背一起战斗」。 02 3D「真香」,Vision Pro 的商业价值已经呈现 角色人设、游戏内容、营销方案,对女性受众情感体验的理解,这些都是《恋与深空》成功不可忽略的原因。但这次的现象级成绩背后,最重要原因就是「3D 真香」,里程碑一般地证明了 3D 技术在手游领域的价值。 《恋与深空》上线之前,其实经历过「群嘲」。当时很多乙游玩家看到初版建模后都不太满意:「老公还是纸片人更好」。但在《恋与深空》对建模打磨调试后,3D 老公的口碑直接逆袭:「3D 和 2D 真的有壁……自己互动代入感太强了」「老公有肉身了!」 第一视角,镜头颤抖移动,男主和镜头互动,有景深光影的 3D 效果,这些都刷新了乙女游戏代入感的程度,是 2D 没法做到的事。 18+分级也让这款乙女游戏做了很作前作不敢做的事,大胆追求「荷尔蒙经济」。如「床卡」「洗澡卡」等卡面剧情里,可以点击角色互动,触碰对方时,3D 效果让其神态、语言、动作的反馈令人更加「上头」。 戳男主互动 | 图片来源:《恋与深空》截图 《恋与深空》的案例说明:3D 技术配合游戏内容带来的沉浸感、体验提升,是 Quest、Vision Pro 这些 3D 设备相比手机、PC 等平面计算设备最大的优势。 今天空间设备最大的痛点还是在成本——极致的体验需要极高的成本,降低成本需要的是规模,而规模又需要杀手级 App 的带动。这件事不能只靠平台补贴开发者,更需要能带来极致体验的应用打开市场,让核心用户接受行业早期的高溢价。 从这个角度看,《恋与深空》可能是一个非常好的楔子。乙女游戏虽然在游戏市场里相对小众,但有着非常强的个体消费能力(高 ARRPU 值),而恋爱游戏本身主打的核心卖点是用户与游戏人物的互动,这件事又十分适合被 3D 增强。 所以就连库克都要去叠纸取经,没有谁比他们更明白:什么样的 3D 游戏,才能让用户花几万买一张
空间计算从概念到落地, Apple和Rokid正抢跑大规模应用
去年 8 月,Rokid 推出首款个人空间计算平台 Rokid AR Studio,一脚迈入了空间计算时代;今年 2 月,Vision Pro 开售,也意味着苹果正式进入空间计算时代;最近,Rokid 又预告将于4月20日举办一场空间计算新品发布会。 在个人计算和移动计算之后,我们似乎正在加速迎来新一轮的计算范式革命。 但到底什么是「空间计算」?苹果认为,Vision Pro 作为一台空间计算设备,核心是「将数字内容融入真实世界,让用户处在当下并与他人保持连接」。 发布中国自研空间操作系统的Rokid曾表示,「空间计算的本质就是物理世界和数字世界的融合,以及在这种融合的前提下,如何用更自然、更易用的方式进行信息的展示和交流。」 最早提出「空间计算」概念的 MIT(麻省理工学院)研究员 Simon Greenwold,则将其定义为「人类与机器的交互,其中机器保留并操纵真实对象和空间的参照物。」 但无论是谁的说法,空间计算的核心其实都离不开四个字——虚实结合。 图/ Rokid 移动计算时代,以 iPhone 为代表的智能手机将计算能力从「桌面」扩展到每个人的「手上」,打破了过去坐在电脑前访问数字世界的限制,带来随时随地的移动互联体验,进而改变了社交、购物、打车、游戏以及生活的方方面面。 然而在空间计算时代,计算能力从「手上」扩展到了「眼前」,计算机构建的数字世界不再只是随时随地可访问,而是开始逐步融入物理世界,由此打破两个世界之间的隔阂,人与机器、人与人(在线)的交互方式也会从二维平面转向基于三维空间。 这不仅会带来了全新的人机交互方式,更重要的是,将更大程度地改变所有人的生活方式。 空间计算时代,新的人机交互和生活方式 相信很多人都想象过——当我们用眼睛观察现实世界时,视野中不仅有其他人类以及自然和人造物体的影像,还有关于这些物体的量化、描述以及数字虚拟内容,同时一切信息的呈现又很自然。 这就是空间计算时代的现在和未来。 今天,戴上 Vision Pro 或者 Rokid AR Studio 等空间计算设备,你就能在现实空间中看到各种各样的数字信息。你可以将数字形态的菜谱固定在厨房空间中,跟着菜谱一步一步进行备菜和制作,依靠眼睛、手势以及声音进行交互。 如果是煮制,可以设置一个或多个计时器,同时在眼前打开窗口观看以 3D 视频标准制作的视频内容。 烹饪只是俯拾即是的一个小案例,空间计算带来的改变会体现在生活的方方面面。 社交不再只是隔着屏幕的交流,我们会在三维空间中以真实或者虚拟的 3D 形象进行交流。未来一定也会出现类似苹果 FaceTime 中的 SharePlay 功能,通过空间视频通话和远方的家人、朋友共同观看一场比赛、电影和演出,面对面分享你的任何感受,就像真的在同一房间里。 图/苹果 在观看体育赛事或者现场演奏等视频时,眼前还会浮现比赛的实时统计数据、球员信息,又或者演奏曲目和演奏者的信息等,甚至是歌手以 3D 形象出现在你的房间,进行专属于你个人的演唱表演。 再想象一下,清晨醒来,你可能需要进行一下正念或者身体训练,戴上 Rokid AR Studio,眼前就可以出现专业的教练进行演示。随着生成式 AI 技术的进步和应用,相信也会出现拟人化的 AI 教练,为你科学地制定个性化的训练计划,并耐心地进行演示。 数字信息与真实空间中物体的深度结合,更会极大地改变体验。 戴上 Vision Pro,不仅可以直接测量房间的各项长度数据,还可以通过眼球注视、手势以及语音交互,尝试将心仪的每一款家具以 3D 模型的形态摆放在房间的各个位置,将各种「虚拟墙面漆」覆盖在真实的墙面上。直到看到真正满意的设计风格,再进行实际的购买和更换。 当然不只是在家装产品上。基于真实尺寸,虚拟服装鞋帽的在线试穿方式,在减少退货概率的同时,也会全面改造在线购物体验。 图/苹果 空间计算时代,这种改变贯穿了数字世界和物理世界。经过某个店铺、看到某个商品时,我们能直接看到其他人基于定位、图像识别和在线数据留下的评价。不管大家留下的是「前有绝景」还是「前有绝境」,这些直接呈现在真实空间的信息,都能帮助我们更直观高效地判断一家店、一款产品或者一项服务的好坏。 而基于位置的 AR 笔记完全可以成为「随处可贴」的便利贴,出现在门口提醒你要带的东西,在工位旁提醒你今天的工作任务,在经过超市附近时提醒你要购买的商品。如果遇到不太熟悉的生鲜,还能直接在商品上显示介绍和挑选指南。 同样的,在参观各种展览活动的时候,现场介绍通常无法承载太多的信息,但如果戴着眼镜形态的 Rokid AR Studio,就可以在眼前直接看到更加丰富、更具深度的介绍,形式涵盖图文和视频。 图/ Rokid 毫无疑问,这可以让我们更深入地了解自己感兴趣的事物,实现更个性化、更好的逛展体验。不仅如此,基于空间视频的发展,不难想象未来的展览体验也会更具沉浸感,比如点击一个展览文物,就会出现围绕文物以 AR 形式上演的一场历史故事。 探索、突破和引领:国内空间计算厂商的尝试 今天空间计算的发展存在两条技术路线: 一条是以苹果为代表的 VST(视频透视)路线,本质是通过摄像头和芯片(算法)模拟真实空间,以此来模拟 AR 的体验;另一条则是以国内厂商 Rokid 为代表的 OST(光学透视)路线,直接在真实空间上融入数字内容。 去年 8 月, Rokid 发布首款消费级 OST 个人空间计算平台 Rokid AR Studio,由空间计算眼镜 Rokid Max Pro 和空间计算主机组成,其中眼镜主体仅重 76g,同时具备「以手势交互为核心的空间计算能力」,支持 SLAM、手势交互、第一视角分享等能力。 Rokid 表示:「我们希望带给用户体验更极致、更轻便的空间计算产品,让空间计算能更自然地融入日常生活和工作,让 Rokid AR Studio 成为你的第一台空间计算机。」 图/ Rokid 但只是发布一款产品显然是不够的,Rokid 也在探索空间计算在日常生活中的应用。比如在教育领域,Rokid 一直在尝试通过 AR 进校和研学营等多种方式,让孩子们可以「零距离」游览祖国大好河山、触摸星辰,在空间计算世界中嬉戏游玩,推动 AR 在教育中的应用和创新。 乌镇戏剧节期间,Rokid 还与合作方共同打造了一场 AR 木偶戏剧《即将消失的海洋动物》。结合传统皮影的表演手法,加之 AR 眼镜的沉浸式体验,给很多在场观众带来了别样的视觉体验,也开创了 AR 舞台剧的先河。 Rokid 还在 Rokid Station 内置了阿里云的无影云电脑,在Rokid AR Studio基础上接入一套无线键鼠,随时随地进行移动办公,更能借助云端强大的计算性能,处理如3D渲染等很多重负载的复杂工作。 此外,Rokid 也引领了 AR 在视力健康领域的探索,去年年初就曾帮助一位 18 岁的 AMD 患者成功恢复了部分受损视力。今年,Rokid 更与中国眼谷联合成立眼健康 XR 研究院,并在不久前宣布自主研发的「视疲劳缓解系统」通过了中国眼谷测试。 在轻量化的基础上,Rokid 通过视力测试、眼部动态训练、眼肌放松视频三个纬度实现了对青少年视力的测试和保护,都充分利用了空间计算设备的优势。 图/ Rokid 凡此种种,不一而足。事实是仅仅在过去一年,我们就能看到 Rokid 进行了大量基于空间计算的探索和尝试。 稍早前,Rokid 又预告他们的下一个大动作。 根据 Rokid 发布的官方预热海报,他们确定将于 4 月 20 日在杭州举办开放日(Open Day)暨空间计算新品发布会。值得一提是,这次每一张海报都强调了「好玩、好看、好上头!」,这或许意味着 Rokid 将在交互、显示以及佩戴上带来更好的体验。 图/ Rokid 此外,Roikd 还在海报中展示了教育、生活、游戏等场景,以及 AR 游戏、视频会议、3D 电影以及空间视频等空间计算应用,似乎都在暗示这款 Rokid 空间计算新品重点发力的使用场景。 而场景的丰富和扩大,同时也意味着用户可以频繁地使用这款空间计算新品,在平时休闲的时候玩玩 AR 游戏、看看 3D 电影和空间视频,办公的时候也能用来多屏显示,甚至还支持视频会议。 从某种角度看,空间计算作为继桌面 PC 的 Windows ,以及移动计算 iOS 和 Android 双雄之后,是数十年才有的大机遇。快速布局,发力应用场景和生态,在大多数人还未反应过来时建立起行业到消费端的平台共识和心智,Vision Pro 在前,Rokid 在后,抢跑者到领路人,唯快不破,机会正向闷头向前的人大大敞开!
苹果与华为的Vision Pro之争,谁是赢家?
去年6月,苹果发布了一款命名为“Vision Pro” 的空间计算头显设备。一经发布就引起社媒热议,赚足了眼球。 今年2月,这款Vision Pro在美国正式发售。买到产品的果粉,将实测视频发到外网,彻底拉满了国内玩家的期待值。 然而,苹果至今没有公布这款产品在我国的发售时间。 近日,有媒体爆料,苹果Vision Pro无法在我国开售的原因,可能是“Vision Pro”商标早在2019年就被华为申请,并于2021年正式应用。 消息一出,舆论哗然。 有网友认为,华为没有生产具体的产品却囤商标,是故意阻碍苹果发展。 还有网友认为,华为“利用不正当手段”阻挠苹果,实现了技术上的领先。 顿时,这场争议演变成一场舆论风暴,让许多果粉感到愤怒和失望。 为了弄清楚华为与苹果的Vision Pro之争,我们需要了解几个事实。 首先,华为早在2019年5月就申请了Vision Pro商标,商标的专用权期限从2021年截止到2031年,长达10年。 该商标下涵盖液晶电视、头戴式虚拟现实装置、无线电设备等多种商品和服务项目。 这充分证明,华为是考虑过相关产品研发和市场推广方向的。 其次,作为一家全球知名的通信设备和技术领导者,这并不是华为第一次出现与 Vision头显设备相关的消息。 目前,华为拥有两条Vision系列的产品线,包括华为首款智能观影眼镜Vision Glass,以及华为Vision智慧屏系列。 这也意味着,华为注册Vision Pro商标,就显示了其会推出头戴式虚拟现实装置的可能。 并且,之前也有业内人士发微博称:华为正在开发一款Vision头显,定价在 15000 元左右。 甚至还透露出“这款头显将采用华为自研芯片,并配备索尼 4K Micro-OLED 屏幕,相对于苹果 Vision Pro 头显删除了eyesight功能。”等更多信息。 当然,在没有确切的官方消息出现之前,实际情况有待验证。 以上不难看出,华为并没有像前面网友提到的“利用不正当手段”,反而已经着手发力产品端。 从另一个角度,积极申请商标、持续投入研发和市场推广等方式,也展现出华为的创新能力和市场拓展意愿。 看起来,某些网友似乎并不理解华为在智慧屏领域的技术领先地位。顺带着,也不太了解华为的Vision Pro品牌。 前面提到,华为的Vision Pro产品有两条产品线。其中首款智能观影眼镜Vision Glass早已上市。 但是,在果粉看来,苹果产品更具科技感,而苹果的Vision Pro才称得上是“未来取代手机的下一代核心电子设备”。 那么,如果按照正常的发展速度,华为能在今年做出“遥遥领先”的头显设备吗? 众所周知,自2018年以来,华为面临多重困难。尽管市场环境恶劣,但华为仍坚持自主研发,其研发经费常年位居世界科技公司前五。 试想,如果没有芯片禁令和全球市场的限制,华为2019年申请的Vision Pro能够顺利推进的话,相关产品是不是会早一点面市? 再来看看苹果的头显研发进程。 公开报道显示,苹果在2016年正式启动头显设备项目,但直到2023年6月产品发布会前夕,产品名称依然没有确定下来。 查询国内外报道可以看到,去年6月苹果产品发布会前夕,很多报道都使用了Apple Reality这个名称。 彼时,苹果Vision Pro这个头显设备的发布,引发媒体的关注,由此改变了媒体对该设备的称呼。 事实上,在中国和全球范围内,苹果应该算是后来者——直到官方发布会才确定设备名为Vision Pro。 从某种意义上,苹果没有采用"VR虚拟现实"、"AR增强现实"或"MR混合现实"来定义头显产品,而选择"空间计算"来定义,显示了其更大的野心。 据悉,苹果Vision Pro可以根据用户的使用习惯长期收集和分析用户的喜好、行为、社交网络和财务状况等方面的信息。 目前,苹果正在申请以"苹果Vision Pro"的名字销售这一设备。 有媒体报道,供应链人士声称,苹果 Vision Pro 最早将于 4 月在中国区发售,“最晚时间不晚于 5 月”。 早在去年 11 月,就有网友放出消息,称华为在研发苹果 Vision Pro 头显的竞品。 甚至还透露价格将低于售价为 3499 美元的苹果 Vison Pro 头显,采用“内置计算单元、电池包外置”整体设计,并配备主动散热管理等相关信息。 此外,这位网友还表示,除了华为,荣耀也在寻求推出类似的头显。 前面提到,在头显设备领域,华为早前发布过相关产品。 比如,2022 年底发布的首款智能观影眼镜 HUAWEI Vision Glass。 这款采用 MicroOLED 显示屏的产品,能够在眼前投射出等效120 英寸的虚拟巨幕,还支持 0—500 度近视调节(500 屈光度可调)等等。 而更早之前的 2019 年,华为发布过一款具有 3D 音效、IMAX 巨幕、透气遮光面罩和全场景 VR 体验的“VR Glass”的产品。 所以,此次华为与苹果的 "Vision Pro"之争很有意思。 一方面,是华为早已注册商标,也有相关产品推出,但尚未真正打响"Vision Pro"的声量。 另一方面,这种现状,就导致更多网友听到"Vision Pro"首先想到苹果,对华为抢先注册却没有产品的行为满是质疑。 从商标使用的角度来说,“Apple Vision Pro”这个品牌名字在我国是涉嫌商标侵权的。 这是因为,其他品牌(厂家)不能在一个已经注册的商标基础上添加前缀。 但也有网友认为,由于我国对外商的宽松政策和市场规则,苹果很有可能会得到允许使用这个名字来销售其头显设备。 对消费者来说,在意的并不是“Vision Pro”的名字属于谁,而是谁可以拿出更有创意、更有科技感、更具性价比的好产品。 毕竟,尽管华为已经注册“Vision Pro”多年,但“Vision Pro”真正获得关注,还是从苹果推出头显穿戴设备开始的。 所以,早早拿下“Vision Pro”的华为,还得继续在产品端加油。 只有用深入人心的产品来征服消费者,“Vision Pro”究竟属于谁的争议,才不会让网友感到“愤怒和失望”。
iPhone 16用上百度AI,华强北成大赢家
作者 | 周伟鹏 编辑 | 汤安迪 在国产千元机都打出「AI手机」头衔后,苹果终于决定下场了。 先是彭博社爆料,苹果在和谷歌磋商,计划在iOS中加入Gemini模型,为iPhone 16提供某些AI功能。 接着,华尔街日报又给出消息,苹果正与百度洽谈,将在国行iPhone 16上,运行百度家的文心一言。 与百度合作,其实是苹果目前最好的选择。 简单点说就三句话:AI手机很重要,苹果自家AI不行,谷歌AI国内没法用。 AI手机很重要 2024年,是AI手机爆发的元年。 年初OPPO CEO陈明永发内部信称,未来五年,AI对手机行业的影响,完全可以比肩当年智能手机替代功能机。 前几天库克来华,提到AI时也表示:如果苹果今年,无法推出优于市场预期的生成式AI服务,英伟达市值很有可能超越苹果。 当一个新兴业态成长起来,对原有业态的冲击是致命的。 2010年,诺基亚风光无限,巅峰市值2500亿美元,结果2年后缩水超过90%,市场份额直接从50%跌到不足4%,在破产边缘试探。 风水轮流转,当年苹果是挑战者,现在成为被挑战的那一个了。 尴尬的是,苹果在AI方面的表现,不比前不久毙掉的造车业务好多少。 苹果自家AI不行 全球前五大手机厂商中,苹果是唯一没有落地AI技术的公司。 2023年,华为发布了盘古大模型,vivo推出了蓝心大模型,OPPO带来了安第斯大模型。 连三星都推出了自研的高斯大模型,并在今年推出旗下首款AI手机——Galaxy S24。 但在今年3月,苹果才发表了一篇论文,公布自己研发的MM1多态大语言模型。 共分为三个参数规模,其中最大的拥有300亿参数,与市面上的主流竞品相比,并不算大。 谷歌PaLM大模型拥有5400亿参数,OpenAI的GPT-4更是拥有1.7万亿参数。 前几天,库克在接受采访时表示:“苹果的生成式AI,在今年晚些时候会有新闻宣布”。 人家菜都吃完了,你家的还没炒好...... 再联想到2011年的iPhone 4S上,就已经搭载了Siri,不禁让人感叹果子起大早赶晚集。 错过时机的苹果,为了稳住iPhone销量,只能寻找「AI先行者」合作。 谷歌AI国内没法用 在国外,苹果找到谷歌,计划将Gemini模型集成到iPhone中。 彭博社提到,一旦谈判成功,这将成为苹果与谷歌,继二十年前搜索协议以来的首次合作。 但国内没法用Gemini,苹果只能再找一个合作对象。就如国行iPhone自带的地图,是由高德等第三方公司提供数据。 报道称,苹果还曾与阿里以及另外一家国产大模型公司,进行过洽谈,最后确定由百度提供这项服务,预计采取API接口的方式计费。 大概就是每千次使用,苹果给百度支付一定额度的钱。 需要注意的是,iPhone 16系列将会升级全新的神经网络引擎,这意味着iOS 18的部分AI功能,将由iPhone 16系列独占。 百度AI的表现 iOS 18集成生成式AI功能后,Siri、Apple Music、健康、输入法应用等多项功能,将变得更加智能化。 具体表现,我们可以参考三星Galaxy S24。 其海外版本使用谷歌Gemini,国行使用百度文心一言等国产AI。实现了包括即圈即搜、AI修图、实时双向翻译、全局摘要等功能。 有趣的是,根据一些用户的反馈,国行三星S24的AI,似乎功能更强大,能直接预测用户想法,指向购买链接。 同一张图片,国行给出了京东手机壳的链接,而港版则给出对应的视频链接。 左:国行 右:港版 华强北成大赢家 苹果与百度合作的消息传出后,百度成为最大赢家,今日港股股价涨了2.55%。 但从上述信息来看,华强北的水货商家,将成为隐藏大赢家。 原本沉寂了几年的港版iPhone,可能因为谷歌Gemini的加持,重新焕发活力。 按照以往惯例,iOS 18将在6月份的WWDC大会上发布,测试版一并推出,正式版则是等9月份与iPhone 16系列一同亮相。 国行与港版机型的AI能力,是否真的有较大差异,还是等9月上手后,再来下定论。
百度或为苹果国行iPhone 16提供AI功能,更多细节曝光
今日《科创板日报》独家报道,百度将为国行版 iPhone 16 等苹果产品、系统提供 AI 功能,预计采取 API 接口的方式计费。苹果也曾经找上阿里和另一家国产大模型公司洽谈。 百度也可能不是苹果唯一的合作对象,上周有媒体报道,包括 Google、OpenAI、Anthropic 在内的多家海外科技巨头,都与苹果进行了接触,谈判在 iPhone 上引入生成式 AI 技术。 不过《科创板日报》指出,海外 iPhone 将采用苹果自己的大模型。而中国大陆采用百度大模型的原因,可能是为了快速解决中国市场 AI 的合规问题。 而苹果 CEO 蒂姆 ·库克(Tim Cook)在上周的上海之旅中,提到了目前苹果的 AI 运用,并且再次确认将在今年公开更多关于苹果 AI 的消息。 苹果对生成式 AI 的暧昧态度 相比较微软、Google 等头部科技公司,至今未推出聊天机器人的苹果,在 AI 上的动作可以说是「慢人一步」。而从苹果正在与多家第三方科技公司讨论 AI 技术合作来看,苹果或许对开发生成式 AI 技术「兴趣一般」。 科技记者 Mark Gurman 报道,苹果会为了满足消费者,而在系统中提供一个 AI 聊天机器人,但这家企业自身可能对其「兴趣不大」。而通过与第三方合作,苹果还可以收取「高额」的费用。据悉,为了让 Google 搜索作为苹果设备的默认搜索引擎, Google 一年要花掉 180 亿美元。 Google 已经将 Gemini 技术提供给了三星,其在新手机 Galaxy S24 推出的 Galaxy AI 体现了 Google 的多项 AI 功能:对屏幕内容的快速智能搜索,或者对图片实现更智能的编辑效果,以及在实时通话中进行翻译等。 采用第三方技术的好处还有很多。与百度的合作可以让苹果的 AI 助手快速在中国开放使用。微软的 Copilot 在近日才向大陆的 Microsoft 365 企业用户开放了部分 Office 功能,大部分在线功能还无法使用。 并且通过采用第三方技术,苹果自身也不用承担过多道德和隐私责任,以及 AI 云端大模型高额的成本。 不过,在与 Google 的谈判传出之前,苹果工程师在网上发布了一篇论文,透露苹果正在开发的 AI 大语言模型 MM1 的一些细节。据悉,MM1 在设计和复杂程度上似乎与其他大语言模型例如 Gemini 类似。并且 MM1 也有为聊天机器人提供技术支持的可行性。 相关论文举例说明了 MM1 在识图、推理方面的能力:MM1 看到一张阳光斑驳的餐厅桌子,上面有着几个啤酒瓶和菜单的图片,被问及「人们要为桌上的啤酒支付多少费用」时,MM1 读出了菜单的价格并计算了啤酒的价格。 Mark Gurman 也报道称,苹果也一直在测试一个代号为 Ajax 的大模型,和一个叫 Apple GPT 的聊天机器人,不过知情人士表示,这些技术不如 Google 和其他竞争对手的工具。目前,还不清楚 MM1 和 Ajax、Apple GPT 的关系。 有消息指出,苹果自己的开发模型更青睐离线本地运行的方式。其前段时间收购的 AI 初创公司 Darwin AI,也正是以让 AI 系统更小、更快为核心技术。 但目前本地的生成式 AI 技术,很难承担比较繁重的图片和文字生成,这可能也是为何苹果想要选择和 AI 云端大模型比较成熟的第三方公司合作,率先推出功能比较完备的 AI 聊天机器人,即使这可能不是苹果的最终目标。 苹果不一样的 AI 策略 苹果在生成式 AI 上的「后发」,以及语音助手 Siri 一直以来让人失望的表现,很容易让人以为其对 AI 的忽视。但其实苹果一直在 AI 上偷偷发力,并在产品上推出了具体的功能。 库克在中国接受采访时就表示,AI 已经运用在了苹果产品的多个方面,例如 Apple Watch 的摔倒检测,以及 iPhone 的预测性文本输入功能。 iOS 9 上苹果引入的「Siri 建议」功能,实现根据场景提供 App 建议和日程、邮件的自动建议功能,其实就是苹果系统上非常早期的 AI 和机器学习功能。 除此之外,iOS 上的照片面孔识别、长按快速抠图、 Spotlight 文字搜图片等等不算「大」,但都非常实用的功能,都利用了 AI 技术来实现。 苹果对 AI 的态度实际上非常「保守」。据报道,苹果花费了大量的时间去讨论如何看待 AI,也非常谨慎地处理 AI 学习和隐私的关系——这也可能是为何苹果更执着于本地运行 AI,不仅预期体验更好,而且也更加保护用户数据和隐私。即使在发布机器学习相关的系统功能,也避免使用「AI」等词汇。 也许对苹果来说,AI 更应该「润物无声」地逐渐嵌入产品之中,而并非如同聊天机器人般独立和集中体现智能学习技术。 但不管是出于市场竞争,抑或是消费者的呼声,苹果都需要快速在下一代系统中集成系统级的聊天机器人技术,恐怕无法再像 Vision Pro 般仔细打磨。因此,为了尽快推出可用的生成式 AI 功能,苹果只好与第三方合作。 直接将 M3 MacBook Air 称呼为「最好的消费者 AI 笔记本」,或许也体现了苹果对 AI 态度的一定转向,开始正视市场对自身在 AI 技术和产品上的呼应。今年的 WWDC 或许也将能看到更多苹果对 AI 的思考,说不定能改变其目前在 AI 领域「追随者」的姿态。 也许苹果生成式 AI 的发展脉络将会神似苹果自己的地图应用:最开始依靠 Google Map,后来用上自研,也许刚开始很糟糕,但会越来越好(而中国区一直是国内数据源)。
成立三大业务板块满一年,宝尊迎来“收获”信号
作者|何理 最近财报季到了,在关注一系列公司财报后,我们发现市场风向有了明显的变化。 现在,高质量发展已成共识,盈利指标得到更多重视。相比以前追求激进增长的氛围,如今市场更喜欢那些经营效率高、增长可持续性强的公司。同时,整个大消费行业也处于持续变化中——全渠道、数字化浪潮依然汹涌,叠加生成式AI这个新变量,浪潮中的每个参与者都必须贴合趋势进行迭代,才有可能拿到未来的增量。 变化之下,有些公司格外值得关注。它们积极推动转型,步子迈得大,在如今强调经营持续性的环境里,它们的转型思路和实践,会得到更加严苛的考验。 宝尊就属于这类公司。业务上,宝尊在2023年做了大转型,成立了宝尊电商、宝尊品牌管理和宝尊国际三大业务板块。从思路上看,宝尊的转型符合全渠道趋势、数字化浪潮,以及品牌对深度一站式解决方案的需求。 转型总是伴随风险。一年过去了,现在外界可以根据最新的数据和信息验证宝尊的转型成效。这场大转型究竟是还处于投入期,还是已为宝尊换来了下一个时代的船票。 三大板块,共成支撑 3月21日,宝尊电商公布了2023年第四季度及全年财报。财报显示,宝尊2023年第四季度净收入28亿元,同比增长9%;全年净收入88亿元,同比增长5%;净亏损大幅缩窄;经营现金流及自由现金流创历史新高。 综合来看,上述指标反映的情况是:宝尊兼顾了转型、增长和运营效率的优化。经营及自由现金流创新高,说明升级为“三大业务板块”模式的宝尊有了更强的自我造血能力。转型未给公司带来拖累,而是为公司带来新效益。 从三大业务板块的具体进展,我们可以清楚看到“新效益”是如何出现的。 2022年底,宝尊收购Gap大中华区业务,此后“品牌管理”新业务被推到台前。这意味着宝尊将为品牌提供全渠道、全流程的管理和运营服务,业务的广度、深度、难度都明显提高。能否在商业上跑通新业务,能否把Gap中国做成标杆案例,是检验宝尊新业务的两大标准。 财报显示,2023年,品牌管理业务毛利率提升至54%,经营亏损较可比同期大幅收窄。指标上的提效说明的是,宝尊在品牌管理业务上渐渐找到了自己的节奏,Gap中国的成长也说明了这一点。 2023年,宝尊为Gap中国引入团队、技术和新系统,在产品本地化设计、供应链优化、整合营销、门店形象提升等方面给予支持。财报显示,GAP中国新开设了10家高效运营的新店,年化坪效同比增长50%,现有店铺同店销售额同比增长19%。 GAP中国门店 图源:宝尊官网 新业务总有投入期,但从以上迹象来看,宝尊的品牌管理已经有了收获趋势。GAP中国增长既来自旧时基础的“焕新”,也来自新的门店拓展。鉴于GAP中国的向好态势,宝尊也设立了2024年进一步增长,2025年扭亏为盈的目标。 宝尊电商板块是宝尊的基本盘。伴随全渠道战略的深化,宝尊电商的增长动能仍然可观。 资料显示,宝尊电商的全渠道能力、品类多元性和品牌合作丰富度在2023年都有明显提升。在天猫和京东,宝尊奢品及高端服饰等核心品类的市场份额持续增长,同时,宝尊也在唯品会、小红书、得物及快手等平台不断延展业务。2023年,宝尊获得了天猫、京东、微信和抖音在内的多平台奖项,在与行业知名抖音服务商洛氪迅达成收购协议的基础上,公司在抖音生态内的布局持续深化。 过去一年,包括Tiffany、TUMI、Dyson等知名品牌在内的50余个新品牌,相继和宝尊达成合作。宝尊也和ZARA、卡骆驰、阿玛尼、可口可乐等知名品牌建立抖音生态合作伙伴关系。2024年,宝尊还将推进酒水饮料、美丽健康和高端汽车等品类的突破。 宝尊合作品牌客户的品类分布 图源:宝尊官网 全渠道是目前消费市场的明确趋势——消费者注意力分散的同时,各个平台又都在加码自身的营销转化闭环,品牌必须多点布局,才有可能在趋势中收获增量。这几年,宝尊在全渠道战略上的投入换来了品牌方的认可。财报显示,截至2023年四季度末,约44.7%的品牌合作伙伴和宝尊在店铺运营合作至少两个渠道,上年同期为41.8%。更多品牌和品类的加入,将推动宝尊全渠道能力的提升,形成正循环。 宝尊电商是基本盘,宝尊品牌管理是“第二增长曲线”,宝尊国际对应的则是更长期的可能性。2023年,宝尊收购Hunter品牌在大中华区和东南亚地区的相关知识产权。今年,宝尊计划以新加坡和马来西亚市场为切入点,逐步推出Hunter标志性产品。 Hunter品牌于1857年在爱丁堡成立,以生产惠灵顿靴而闻名。宝尊的品牌运营能力,结合品牌本身的悠久影响力和东南亚的市场潜力,构建出了一个值得业界关注的国际品牌发展案例。如果宝尊国际能够借此打造标杆,那么公司在品牌出海大趋势中,也有望收获新的增量。 稳固的科技底盘 财报的向好态势,是宝尊三大业务板块共同发展的结果。三大业务板块相辅相成,而它们都离不开同一个底盘——科技。 重视科技创新是宝尊一以贯之的策略。依托自主研发的全渠道订单管理系统OMS,宝尊构建了全渠道业务中枢,这为实现全链路、全渠道业务有序、高效运转提供了先决保障;线下门店数字化运营系统ShopDog则能够帮助品牌打造O2O、在线门店等全场景门店数字化运营,让门店业务能够打破时间、空间限制,创造新的销售增量。 财报显示,国际权威研究机构Gartner将宝尊选入其2024年分布式订单管理系统市场指南,在此名单上,与宝尊共同出现的是全球零售服务行业的翘楚甲骨文、SAP、IBM。此外,在生成式AI持续火热的背景下,宝尊也整合了AIGC领域尖端工具,推出BaozunGPT增强日常运营效率。 宝尊入围Gartner 2024《Market Guide for Distributed Order Management Systems》供应商 从宝尊的技术实践中,你会看到两种并行的姿态:一是加码技术的决心。财报显示,2023年,宝尊的技术和内容费用为5.05亿元,上年同期为4.28亿元,同比增长18%,公司持续保持对技术的高投入。与此同时,宝尊又是足够务实的,各项技术投入都在效率提升和经营发展上起了作用。 仍以AI为例,各界都被大模型的表现所惊艳,但所有人也都认可,AI发展的当务之急是找到可靠的应用场景,切实提高效率。目前,宝尊已将BaozunGPT融入到了企业日常运营中,BaozunGPT已经被3000名宝尊员工应用,各部门的生产力和效能均有提升。 除了内部应用,宝尊的技术落地也体现在店站运营、数字营销、客户服务、仓储物流等全流程场景中,技术扎实之于公司发展的价值,最终表现为客户对宝尊服务满意度的提升。在2023年的NPS(净推荐值)评分中,宝尊取得了8.23的高分,较2022年的8.07分进一步提升。此外,宝尊2023年重点客户的续约率达到了97%。 如果仅看“表象”,宝尊近年似乎“步子迈得非常大”,既有高频的收购,又有大规模的转型。但这一切,都发生在公司对技术的笃信之上。技术构成了宝尊差异化竞争力,是三大业务的动力来源,也是公司转型的压舱石。 因此,系统性理解宝尊财报“向好”态势的方式是:公司以技术为基础,把握全渠道和数字化趋势,将“以客户为中心高质量可持续的业务增长”作为战略目标,思路和能力达成了统一。这种统一让转型得以顺利推进,2023年只是宝尊转型的第一年,此次的财报向好态势也只是一个开始。
realme联合京东方推出新一代无双屏,局部峰值亮度达6000尼特
IT之家 3 月 25 日消息,今天下午,realme 联合京东方正式公布新一代无双屏,局部峰值亮度达到 6000nit。 IT之家获悉,这块屏幕全局最高亮度达到 1600nit,号称“强光环境依然清晰可见”;手动最高亮度 1000nit,可自定义最低亮度。此外,真我在这块屏幕上首次搭载游戏超级 HDR,实现更高动态范围和光影效果。 新一代无双屏搭载全新 8T LTPO 技术,采用定制京东方 S1 发光材料,支持 0.5-120Hz 无级自适应刷新、Pro-XDR 超高动态显示、1.5K 分辨率、100% DCI-P3 色域、94.2% 超高屏占比,屏幕边框窄至 1.36mm。 此外,该屏幕还带来全新护眼技术,支持 3+1 Pulse 低频闪、2160HzPWM 调光、硬件级低蓝光、环境色自适应显示。 不仅如此,realme 还宣称“告别参数护眼,进入主动护眼时代”,首发“绿野 Al 护眼”。据介绍,该功能在行业首次引入主动疲劳检测技术,智能检测疲劳状态,调节护眼方案,实现刷视频、电子书等全场景适配。 realme 首发 AI 游戏护眼功能,在以上护眼功能的基础上,未来还会对游戏画面刺激性显示优化。 新一代无双屏瞬时操控提升至 2500Hz,游戏操控更灵敏;首发妙感触控,智能识别游戏热区,精准优化操作区域;方向轮盘断触概率降低 40%,快速点击稳定性提升 15%;全新 AI 保护膜触控,触控灵敏度至高提升 26%,边缘响应率至高提升 12%。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。