EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
Marshall Major V 体验:100 小时续航!目前佩戴最舒服、续航最夸张的贴耳式头戴耳机
最舒服的 贴耳式头戴 更新了一系列便携音箱和真无线耳机之后,Marshall 将关注点放到了头戴式耳机上。 这次,Marshall 要更新的是贴耳式头戴耳机 Marshall Major。 来到第五代的它,延续了 Marshall 标志性的声音表现,获得了佩戴感最舒服的设计,以及目前最夸张的续航表现。 先从这经典的外观说起,Marshall Major V 继续沿用 Major 系列标准的方块型设计,配色首发只有黑色一种选择。耳罩外侧有 Marshall 产品最常见的荔枝皮纹理和手写体白色 Marshall LOGO,看起来不太平整的外壳在这里依旧支持无线充电。 方块尺寸是刚好能覆盖到耳朵的大小,耳罩和头梁的位置有折叠结构,日常收纳时能把耳罩折叠起来,然后直接塞进小尺寸的化妆包即可,比折叠收纳还要看方向的索尼 ULT Wear 来得方便。 Marshall 对 Major V 头梁和耳罩上的材质做了升级,这一代的材质更松软,上头的感觉基本不压耳。哪怕是我这种头比较大还要戴眼镜的胖子,Major V 的上头感也不错,眼镜腿和耳罩之间地方不夹耳朵,佩戴一整天也不累。 另外,我还让编辑部的小伙伴试一下。大家佩戴完都觉得 Major V 戴起来舒服,耳棉和头梁上的覆盖足够松软,佩戴不夹耳朵不压头,没有硬质结构和头部硬碰硬的感觉,不管是比 Major IV 、Beats Solo 系列的贴耳式,还有全包裹式的索尼 ULT WEAR 都要舒服。 当然,舒适感提升并不只是耳棉的功劳。 Major V 机身重量为 186g,放到头戴式耳机阵营里面也能算是羽量级选手,戴在头上、挂在脖子上一天不会觉得累。 按键采用朝向后侧的设计,左右两侧分别对应的是 M 键位和电源键。 电源键用了 Marshall 标志性的金色旋钮摇杆设计,除了有开关机和启动配对模式外,也整合了播放控制功能,上下推动是控制音量。按键比 M 键突出,方便用户盲操作。 M 键功能可以通过 Marshall app 进行自定义设置,如果你日常用的流媒体是 Spotify,那 Major V 也支持 Spotify Tap 功能。连接手机开启软件后,点按一下 M 键,你的 Spotify 就能够开启播放。 配置方面,Major V 支持蓝牙 5.3,能够同时连接两台设备,记住 10 台配对过的设备,之后将会通过更新支持低功耗的 LE Audio。蓝牙编码支持最常用的 AAC 和 SBC,没有支持无损规格的 LDAC 或 aptX Lossless 编码。 考虑到 Marshall 的声音特性以及 Major 系列定位,没有配备无损编码似乎也很合理。 耳机和设备最远距离为 10m,我在无线环境复杂、设备多的办公室里测试了一下,Major V 直连表现稳定,比没有用上外置接收器的 Poly 还要稳一点。 延迟我们也测了,在办公室连接电脑的状态,Major V 播放音乐和视频都没有出现明显延迟和断连,日常办公使用足够稳定。游戏的话,如果只是塔防或卡牌类游戏,Major V 也能应付。 续航方面,Major V 播放时间来到了夸张的 100 小时,是 Marshall 目前首款在没有降噪的前提下实现 100 小时续航的头戴式耳机,相信也是为数不多续航能突破到三位数的头戴式耳机。 不只是长续航,耳机的短充模式也夸张。 Major V 充满需要 3 小时,也支持充电 15 分钟最长能支持 15 小时的播放,平时只要用线充个 8-10 分钟就能够满足日常通勤使用,很少会用到完整充满的情况。 而且,这款头戴式耳机还神奇地延续了无线充电的传统,只要将它的右侧耳罩放到无线充电板上面就可以充电。那每日的充电任务可以留到睡觉前,用无线充电器充它即可,日常使用只需要用充电线小充小补即可。 声音方面,Major V 搭载了 40mm 的动圈单元,阻抗为 32Ω,灵敏度是 106dB SPL。耳机底部还附带了 3.5mm 接口,包装内也配备了 3.5mm to 3.5mm 耳机线。 要是真没电了,你也可以将耳机接到电脑、手机小尾巴和播放上继续听。 耳机蓝牙手机的时候,用户能通过 Marshall app 内的均衡器设置声音输出。app 内预留了两档设置,设置完成后可以通过 M 键切换,以对应不同类型的音乐。 Major V 的声音是标准的 Marshall 风格,拳拳到肉的鼓点表现力突出,回弹圆滑,生硬的数码味不明显。打游戏和听摇滚时的力量很充足,挺流行也能给到不错的声音厚度,完成度比在同价位上强调重低音效果的耳机都要高。 低频突出,但整体风格不会完全向着低频倾斜。整体听感清爽,低音量大但不糊,整个氛围有点像是耳机版本的 Marshall Emberton II。 Major V 的人声很特别,仔细听得话有种加了淡淡的一层类收音机效果的滤镜。 听歌时人声不会太锐利,日常喜欢斟酌歌手演唱细节的用户可能会觉得有点奇怪,但听摇滚、舞曲较多的话没有太大影响,听以 LoFi 或 Chil Pop 为背景音乐的播客会有奇效。 Major V 连接 MacBook 时的音量(我听的音量比较大,并不是这样才能驱动耳机) 还有一点要注意,Major V 并不太适合用小音量来听。耳机在音量低于 1/3 时会有声音力量不足、动态降低和声音稍稍有点疲软的情况。建议在保护听力的前提下,音量控制到 1/3 或 1/2 之上会更好。 最后来看看价格,Marshall Major V 的国行预售价为 1299 元,这样的价格放在 Marshall 头戴式耳机里还是挺惊喜的。 这样看的话,Major V 的特点也很鲜明。 1300 元的定价,你可以获得几乎是贴耳式无线头戴耳机里最好的佩戴体验以及最强的续航表现。它有 Marshall 招牌的声音和做工设计,以摇滚为主的重低音表现感拉满,Marshall 的造型设计对于年轻人来说也具备足够的时尚属性。 这样看起来,Major V 确实比一些还没有搞清方向的入门头戴式耳机,本身以穿搭属性为主、声音听起来还摸不着头脑的潮牌耳机,以及突然想起来要将重低音和潮流结合到一起做新品牌的产品要好很多。 佩戴、续航、潮流和极具个人风格的声音,Marshall Major V 能一下子满足你这四个愿望。 如果说你是喜欢摇滚乐、喜欢 Marshall 风格、追求潮流的年轻人,自身对降噪没有需求,只想要一款戴着舒服、电池也很够用的头戴式耳机,那 Major V 就很适合你。
传奇芯片Z80,面世近50年后将停产
Zilog 在 Z80 上市 48 年后即将退役。它最初是作为 Intel 8080 的一个项目开发的,最终成为游戏和通用计算设备中最受欢迎和广泛使用的 8 位 CPU 之一。 由 Federico Faggin 开发的标志性 IC 器件很快就会被淘汰,感兴趣的各方只剩下几个月的时间下订单,Zilog 的制造合作伙伴就会结束对该技术的支持。 根据 Zilog 的通知,晶圆代工制造商 (WFM) 将于 6 月中旬停止接受剩余 Z80 产品的“最后一次购买”(LTB) 订单。Zilog 将根据客户需求处理和安排 Z80 的 LTB 订单,而 WFM 将在此后提供实际交货日期。根据 LTB 的总体需求,公司可能会对最小和最大数量提出更严格的要求。 Federico Faggin 是一位 Intel 工程师,他在开发第一个 4 位 CPU Intel 4004 后于 1974 年创立了 Zilog。Zilog Z80 随后于 1976 年 7 月发布,被认为是 Intel 8080 处理器的软件兼容“扩展”和增强。 Z80 由仅 12 人的团队开发而成,取得了巨大成功,导致 Zilog 建立了自己的芯片制造工厂,并在两年内将员工规模扩大到了 1000 多名。与英特尔的同类产品一样,Z80 最初是为嵌入式系统设计的,但后来成为 20 世纪 70 年代至 80 年代中期游戏硬件的一个重要里程碑。 一些家用电脑和游戏机都是围绕 Z80 的功能构建的,包括世嘉的 Master System 和 SG-1000,以及任天堂的 Game Boy 和 Game Boy Color。许多经典街机游戏也使用了 Z80,包括原始版本的吃豆人。此外,8 位处理器在军事应用、Roland Jupiter-8 等音乐合成器以及各种其他电子设备中很常见。 Zilog 将其 Z80 技术授权给美国公司 Synertek 和 Mostek(这两家公司帮助 Faggin 的合资企业进行生产)以及欧洲制造商 SGS/STMicroElectronics。这种 CPU 设计后来被日本、东欧和苏联制造商复制,而 NEC、东芝、夏普和日立等公司也生产了自己的兼容版本的芯片。 近年来,Zilog 将 Z80 生产重新聚焦于嵌入式设备市场,提供先进的微控制器产品,保留与原始 Z80 和 Z180 设计的兼容性。
三星新款3nm Exynos 2500有望超越高通Snapdragon 8 Gen 4
【环球网科技综合报道】4月21日消息,据国外科技网站gsmarena报道,近日,有关三星新款处理器Exynos 2500的传言引起了业界的广泛关注。据称,这款采用3nm工艺技术的芯片有望在能效和原始性能方面超越其竞争对手高通的Snapdragon 8 Gen 4。如果传言属实,三星有望在2025年通过这一技术突破,在移动处理器市场上占据领先地位。 根据行业内部消息人士透露,以及PandaFlashPro在社交媒体上的发帖,Exynos 2500在能效和性能上都将展现出卓越的表现。与此相比,Snapdragon 8 Gen 4预计将继续使用4nm工艺技术,这可能在技术上使三星的新款芯片占据一定优势。 三星此前的Exynos系列在处理器性能和功效上一直面临挑战,但Exynos 2500的推出似乎标志着该公司在此领域取得了重大进展。据悉,今年的Exynos 2400已经能够跟上高通Snapdragon 8 Gen 3的步伐,而三星显然发现了更多可以改进的空间。 据了解,Exynos 2500将有两种旗舰芯片组变体:一种是为智能手机设计的Exynos 2500-A,配备八核CPU;另一种是为平板电脑和Galaxy Book笔记本电脑设计的Exynos 2500-B,配备更强大的10核CPU。这种多样化的产品设计策略显示了三星对不同设备性能需求的细致考虑。 此外,还有传言称三星可能会在其新款芯片中使用谷歌的张量处理单元,而非自家的NPU。然而,目前这一消息尚未得到官方确认,因此仍需进一步观察。
2024年第一季度印度手机市场强劲增长 三星、小米、vivo三足鼎立
【环球网科技综合报道】4月21日消息,近日,据市场研究机构Canalys最新发布的报告,2024年第一季度,印度智能手机市场表现出强劲的增长势头。在这个竞争激烈的市场中,三星、小米和vivo等顶级品牌展开了激烈的角逐,且三者之间的市场份额相差无几,形成了三足鼎立的局面。 报告显示,今年第一季度,印度智能手机市场的销量达到了3530万部,相较于2023年同期的数据,增加了近500万部,同比增长率高达15%。这一增长率反映了印度市场对智能手机的持续需求和市场的活跃度。 在各大品牌中,三星以670万部的出货量稳居榜首,小米和vivo分别以640万部和620万部的出货量紧随其后,位列第二和第三。OPPO(不包括OnePlus)和realme也取得了不俗的成绩,出货量分别达到370万部和340万部。 三星Galaxy S24的成功发布为品牌带来了更多的关注度,其强大的人工智能功能和吸引人的营销活动推动了销量的提升。而小米则凭借其Redmi 13C 5G和Redmi Note 13 5G系列等产品,成功实施了大众市场5G战略,也取得了显著的增长。 此外,报告还指出,摩托罗拉、Infinix和苹果等品牌也实现了两位数的增长。特别是苹果的iPhone 15机型,在多次降价和促销活动的推动下,成功脱颖而出,赢得了消费者的青睐。
曝iQOO 13系列采用1.5K直屏和2K曲屏 普及超大电池
【CNMO科技消息】近日,CNMO注意到,有数码博主爆料,iQOO 13系列将采用1.5K直屏和2K曲屏设计,屏幕供应链涵盖国产及三星。博主进一步透露,继成功普及超级快充技术后,iQOO 13系列再度引领潮流,普及超大电池容量,两款机型都是双芯电竞旗舰。 iQOO 12系列于去年11月份正式登场,预示着iQOO 13系列也极有可能在这个时间段与我们见面。由于距离新品发布尚早,网络上关于iQOO 13的爆料尚不算多。因此,让我们一同回顾一下iQOO 12系列的卓越配置。 iQOO 12系列搭载由第三代骁龙8移动平台、满血版LPDDR5X和UFS4.0组成的新一代“性能铁三角”,还增加了自研电竞处理器Q1和自研电竞引擎的组合。 屏幕方面,iQOO 12 Pro国内首发搭载三星2K E7144Hz全感屏,支持517 PPI、144Hz刷新率、1600nit全局峰值亮度和高达3000nit局部峰值亮度。iQOO 12则配备了一块6.78英寸的1.5K分辨率OLED屏幕,屏幕刷新率最高为144Hz,峰值亮度可达3000尼特。 iQOO 12系列还配备超极石墨电池,最高120W快充可实现快速补电。新机还提供3倍潜望式长焦镜头,集望远拍摄、长焦微距和长焦人像三种效果于一身,可实现10倍高清变焦和最大100倍变焦。 目前可以预测的是,iQOO 13系列将搭载第四代骁龙8移动平台,其性能表现将十分出色。至于影像方面,虽然可能不会达到顶尖水准,但考虑到其他配置的兼顾,依然能够保持中规中矩的表现。
外媒:苹果将在欧盟市场向第三方开放iPhone触碰支付功能
4月21日消息,据外媒报道,近日在《欧洲数字市场法案》的推动下,苹果公司上月发布的iOS 17.4系统为欧盟的iPhone用户带来了与之前大不同的改变。新系统不仅允许用户使用第三方应用商店,还能为Apple App Store之外的应用和服务付费,这一变革打破了苹果生态系统长久以来的封闭性。 这一系列的开放措施并非苹果自愿,而是在《欧洲数字市场法案》的强制要求下实现的。此前,苹果公司的“围墙花园”策略使得第三方很难进入其生态系统,尤其是在使用iPhone的NFC功能进行支付方面,苹果一直将其限制在自家的Apple Pay服务内。然而,这种情况有望在下个月得到改变。 据内部消息人士向路透社透露,欧盟委员会预计将在5月份批准苹果公司开放触碰支付NFC功能的提议。这意味着,未来第三方移动钱包也将能够使用非接触式支付功能。苹果公司在经过四年的反垄断调查后,于今年1月份首次提出这一开放提议。 若欧盟委员会批准该计划,苹果公司或将避免被发现存在不当行为,从而躲过可能高达其全球年营业额10%的巨额罚款。值得一提的是,就在上个月,苹果刚因通过应用商店限制阻碍Spotify等竞争对手的竞争,被处以18.4亿欧元的罚款,这是苹果公司首次受到欧盟的反垄断处罚。显然,苹果公司希望这是最后一次因类似问题受到处罚。 业界认为,此次开放NFC支付功能,不仅是对欧盟法规的响应,也是苹果公司在面临反垄断压力下做出的重大让步。
小米在印度推出红米Note 13 5G系列HyperOS更新
【环球网科技综合报道】4月21日消息,小米公司近日在印度正式宣布,将为红米Note 13 5G、红米Note 13 Pro 5G以及红米Note 13 Pro+ 5G等热销机型推送全新的HyperOS 1.0系统更新。这一系列设备自去年上市以来,便以其出色的性能和用户体验赢得了消费者的广泛好评,原系统基于Android 13及MIUI 14打造。 此次推送的HyperOS更新,以“全面重构”为核心理念,致力于在所有兼容设备上实现性能的优化提升。据小米介绍,HyperOS将通过改进任务调度算法,智能地在多个计算核心之间分配处理任务,从而确保设备能够以最高效率运行。此外,新系统还对底层技术栈进行了深度优化,旨在为用户带来更为流畅的操作体验。 在用户界面方面,HyperOS带来了诸多新颖的设计元素。用户将能够体验到全新的个性化锁定屏幕,控制中心的界面也得到了重新设计,去除了图标标签,使操作更为简洁直观。此外,新系统还引入了交互式通知功能,以及一系列新的应用程序图标和动画效果,大大提升了用户的视觉享受。文件管理器应用也得到了更新,新增了新的分类方式,便于用户更高效地管理手机中的文件。同时,天气应用也加入了新的动画效果,使得查看天气信息变得更加生动有趣。 小米表示,HyperOS的推送将分阶段进行,以确保更新过程的稳定性和用户体验的顺畅。因此,预计所有相关设备的用户将在接下来的几天至几周内陆续收到更新提示。公司强调,此次更新的推出标志着小米在持续提升用户体验方面的又一重要步骤。
问界 M9 推送 V4.2.1.4 更新:华为盘古大模型加持语音助手、新增误踩油门提醒等
IT之家 4 月 21 日消息,据IT之家网友反馈,问界 M9 车型现已推送 V4.2.1.4 版本更新,软件包大小 6.65 GB,新增 / 优化多项功能。 主要更新内容如下: 新增智能交互矩阵大灯情景灯语功能; 新增 ADS 双 3D 视图功能(仪表和中控屏均显示 ADS 3D 视图); 新增后视摄像头清洗功能入口; 新增对侵占车道障碍物主动避让功能; 新增误踩油门提醒功能; 新增盘古大模型加持的智慧助手小艺功能; 新增小艺全车免唤醒功能; 新增语音打开尾灯的感谢灯语功能; 新增语音控制激光投影巨幕系统的开 / 闭功能; 优化 NCA 匝道场景驾驶体验; 优化车屏互联手机反控投影巨幕功能; 优化激光投影巨幕下降受阻语音播报功能; 其他功能项和体验项优化。 AITO 问界 M9 于 2023 年 12 月 26 日上市,共推出四款车型,官方指导价区间为 46.98-56.98 万元,2 月 5 日首批车主正式开启交付。IT之家附问界 M9 主要配置: 问界 M9 长宽高分别为 5230/1999/1800 毫米,轴距为 3110 毫米;风阻系数 0.264,提供 5 款颜色,其中两款纯色,三款双拼配色。 动力方面,问界 M9 纯电版 0-100km/h加速时间仅需 4.3s,增程版为 4.9s,搭载 4 活塞固定卡钳,100-0km/h制动距离仅为 34.9m,最大扭矩分别为 673N・m 和 675N・m。问界 M9 系列搭载猫头鹰增强转向技术,转弯半径仅为 5.8 米。 问界 M9 增程版提供 52 度电和 42 度电版本,CLTC 综合续航分别达到了 1402km 和 1362km,纯电续航分别为 275km 和 225km。 问界 M9 纯电版搭载华为“巨鲸”800V 高压电池平台,充电 5 分钟续航 150km,采用 800V 高压碳化硅高效率电机,CLTC 综合续航达 630km。
刘强东数字人直播常态化,数字人成本低至真人直播的10%
京东的数字人直播正在常态化。4月22日,京东集团创始人刘强东的虚拟数字人形象“采销东哥AI数字人”在京东图书采销直播间进行了直播,也是4月16日和4月20日之后的第三场采销东哥AI数字人”直播。从变化看,本场直播中加入了数字人助理、多机位切换等多种方式,通过和采销东哥聊天的方式增加互动感。 在4月16日的第一场直播中,刘强东数字人取得了不错的效果。对此,京东云言犀算法总监在接受采访时对第一财经表示, “采销东哥AI数字人”首播后,言犀团队收到很多合作意向,不少商家包括大品牌商都主动寻求合作。此外,也有部分企业的CEO计划合作打造数字人直播。言犀算法总监表示,现在直播短视频是大趋势,目前来看,数字人直播带货有很大机会成为一个大的爆点,主要是它在内容层次上达到了一个新的水准,大家的接受度和信任度已经过了关键点了。 成本方面,京东云正在降低商家端的成本以吸引更多商家参与数字人直播。对此,京东云言犀负责人对第一财经表示,对于商家,京东数字人直播的成本目前是商家邀请真人主播直播的10%。从商业化角度看,京东618期间京东云宣布免费开放数字人直播。而从成本看,数字人直播在选品、运营等方面会出现一些额外成本。但在模型成熟的情况下,目前服务器成本不断降低。 数字人直播,如何解决交互提高互动感是重点。对此,京东云言犀算法总监表示,所有用户的问题都会以文字的方式来回复用户。口播则有自己的口播策略,会实时抓取弹幕选一些相对比较有代表性的、有特色的问题去回复。 京东云言犀负责人表示,互动的策略是直播不能经常被打断,以频率看最多可能每三十秒或每半分钟被打断,回复大家比较关注或比较有代表性的问题。选择问题上,京东云一些算法判断是否已重复问,或者与某个商品结合得非常紧密,是否能聊更多有故事性的内容,来选择是否口播回复。 从现阶段看,目前数字人直播的体验还有待提高。京东云言犀负责人表示称,目前从运营角度看,从用户接受度、从表现情况来说,用户接受度还是比较高的。“我也看了很多评论,数字人直播中运营的选品、运营调性的匹配确实很关键。我是做技术的,我们还有第三档没有做到,例如数字人是否能成为一个人的分身,比具有类似理念、思想、知识背景、生活背景,可以更长时间、更深度地与观众侃侃而谈。想象一下,如果这个大V不但只是带货蓝莓,说这个蓝莓好吃,甚至可以和观众聊聊他小时候也种过蓝莓,这样渗透感就更深了。这需要AI的大脑还需要进一步丰富、进一步成长起来,这是我们说的三步走的第一步。” 从应用方向看,数字人领域目前确实更多地是表现出来人机协作共生的价值。目前看,人机接档的直播间数据表现明显优于纯人直播间或纯数字人直播间,有条件的品牌直播间可以关注人机穿插直播模式的价值和团队打造。此外,在货架电商里面,把商品详情转化为视频化内容,发挥数字人直播的价值;并非取代真人,而是与真人接力打造日不落直播间,挖掘闲时直播的价值,目前言犀数字人提高闲时转化率超30%。 从策略看,今年京东计划推出更多数字人主播,上述负责人表示其“采销东哥AI数字人”技术代表京东云现在的通用技术,如果为其他大V或者CEO打造数字人主播可以达到同样的效果。 从行业看,虚拟人行业仍处于蓝海市场。艾媒咨询发布的《2024年中国虚拟数字人产业发展白皮书》显示,2023年中国虚拟人带动产业市场规模和核心市场规模分别为3334.7亿元和205.2亿元,预计2025年分别达到6402.7亿元和480.6亿元,呈现强劲的增长态势。应用场景方面,中国受访者常接触到的虚拟人类型有虚拟主播、虚拟偶像以及虚拟员工三种,其中虚拟主播的受众最为广泛,达81.40%。 艾媒咨询CEO张毅对第一财经表示,从用户需求、技术成熟度、电商行业需求以及政策支持方面看,数字人直播今年大有可为。近年来多个电商平台的头部主播,因为各种因素例如自身问题、薪酬问题等导致平台方和机构方较为被动,行业需要虚拟人来替代过于强势的个人主播。此外,资本的关注和投入也为整个行业提供了机会,能推动技术和应用的快速发展。与此同时,商业模式的成熟受头部企业的推动,例如京东不遗余力地推广数字人直播,其他平台例如百度和阿里也在布局这块业务。随着头部企业的推进,数字人在直播电商、娱乐、教育等方面都会有机会。不仅如此,数字人直播是解决跨境电商时差问题、语言问题、文化风俗问题以及沟通的及时性问题等的好方式。 从挑战看,张毅认为发展数字人直播的挑战主要在于当前数字人主播的互动性和优化用户体验,用户体验包括直播间的个性推荐能力,以及直播间与品牌的合作,能否让观众和高品质产品的互动等要素都十分关键。此外,数字人直播在技术、理论、伦理、内容监管以及这个新旧模式挑战方面,仍然有很多需要努力之处。数字人直播会对成熟的真人直播商业模式产生冲击,甚至对已有的主播生态解构,所以短视频平台对数字人直播较为敏感。但从行业趋势看,数字人直播的风向会持续。
这次阿里云京东云降价,为什么其他家不跟了?
作者 |叶子 编辑 |钊 进入2024年,云服务市场的开局显得格外平静。在经历了春节假期的短暂休整之后,行业在开年的两个月内并未展现出往常三四月份惯有的喧嚣与活跃。 过去,云厂商们往往会借新一年业务开展之际,祭出各类极具吸引力的降价优惠策略,以期在新财年伊始便抢占市场份额,赢得客户的青睐。 以2023年为例,阿里云在4月率先宣布了核心产品价格全线下调15%至50%的降价优惠,意图进一步扩大公共云的用户基数和规模,提升云计算的市场渗透率。而在其后腾讯云、百度云、京东云、华为云以及运营商云们纷纷跟进,纷纷推出大促活动,整个市场好不热闹。 但在2024年中,除了阿里云和京东云扔出了让用户无感的“重磅”炸弹外,毫无新意。而其他云厂商则显得十分克制,在两云争斗后近两月时间中,都没有正面“接招”的意思。 那么,往年猛打价格战的云服务市场为何会出现“阿里云进,其他云止”的情况?在降价的另一面,云厂商还应该思考什么呢? 1 阿里京东大张旗鼓,其他云企一言不发 虽说2024年选择大张旗鼓降价的云商只有阿里云与京东云两家,但并不意味着它们的降幅不够大。 2月29日,阿里云发布通告,宣布全线下调云产品官网售价。这次降价涉及计算、存储、数据库等在内的100多款产品,平均降价幅度超过20%,最高降幅达55%,属于阿里云历史上力度最大的一次,也被外界评为史上最大力度的公有云价格战。 而在国内市场外,4月8日,阿里云宣布海外市场也跟随全线降价,覆盖全球13个地域节点部署的核心云产品、500多个产品规格,平均降幅为23%,最高降幅为59%。降价后,阿里云海外市场云产品价格全面低于其他国际主流云厂商。 在此期间,在交个朋友四周年淘宝直播间,罗永浩久违现身,首度为阿里云带货,选品包括4款主要面向创业者与中小企业的云服务器和云存储产品。 在直播中,老罗称“如果你在企业不是做IT的,可以把截屏发给公司IT看一下,他看到这个价格后可能会激动起来,一定能打动他。你不知道是怎么回事,发给公司IT他直接就崩溃了,直呼‘老罗,你路子真野’。” 而在阿里云宣布全面下调云产品售价的同日晚,京东云宣布全系核心产品继续参与全网比价,喊出了“全网比价、击穿低价、再低10%、买贵就赔”的口号,且3月1日起即时生效。 在宣传口上,面对阿里云打出的老罗直播卖云牌,京东云正面强势回应,配合“现场直播比价,比特定直播间再低10%”的激进口号,让这场云服务商之间的价格战“火药味”十足。 按照往年的情况,在发令枪被打响后,又一波降价潮即将来临,然而现实却并非如此。 除去腾讯云低调宣布推出包括语音识别、语音合成、AI绘画等一系列AI产品在内的促销活动外,无论是想要通过技术获客的华为云、百度云,还是背靠运营商的天翼云与移动云,都没有任何想要跟进降价的迹象。 那么,为何半年前还在卖场式大促销的云企们,如今却能像达成默契般集体无视阿里云的降价“挑衅”呢? 2 低价难撼市场,技术创新与服务稳定决胜未来 出现这样情况的原因只有一个,那就是虽然阿里云这轮降价足够狠,但对友商造成的伤害还是不够大,即降价已经刺激不到用户们的G点了。 具体来看,虽然阿里云核心产品已经击穿了全网最低价,但这只是对于中小客户以及个人用户来说的,长期合作的大客户早已享受到了更低的合同优惠价,这样的降价根本不会对它们的成本产生任何影响。 而个人用户和中小企业的长尾市场,却并没有那么容易被简单的低价吃下。 仍在博士学习阶段的不会飞(化名)同学向奇偶派表示,由于有着在不同终端进行项目推进与相关存储的需求,他选择使用云服务器。“但像我这样的轻量级用户,各家云厂商其实都有针对高校学生可以免费使用的服务器,未来毕业后我还可以一家一家'白嫖'过去,并没有一定要去购买的说法”。 某家公司IT管理人员倪先生则向奇偶派表示,“阿里云确实是降价了,但我们今年的合同早就签过了,至于下一年是否会因成本的变动更换云服务商那也是明年的事情”,“其实经过这些年的降价,我们对价格的敏感度已经没有那么高了,反而相关技术支持会是更重要的影响因素”。 此外,阿里云此次是包年降价,目录价并未改变,也就意味着在最重要的弹性业务上并没有任何让利,受益的只有那些弹性较小的用户罢了,而这样的用户,占比又有多少呢? 在个人用户和中小企业需求挖掘难度增大之外,六年四次宕机的阿里云也让人对其服务的稳定性心存疑虑。 2022年12月,阿里云位于香港的数据中心因制冷故障发生宕机事故,造成多项服务无法使用,多个大客户受到影响。而由于没有完善的备用冗余方案,服务器宕机持续超过12个小时,成为了阿里云运营十多年来持续时间最长的一次大规模故障。 就在不足一年之后的2023年11月12日,由于云产品控制台访问及API调用出现异常,包括淘宝、闲鱼、钉钉、饿了么、菜鸟等多个阿里系App出现无法访问或服务异常的情况。 据DoNews报道,阿里云事故后,纳思云充电桩发布重要通知称,因阿里云IoT服务API接口故障,导致使用阿里云相关服务的设备无法正常使用。乐爽cooleasy发布紧急通知称“阿里云网络全国崩盘了,导致所有平台都出现问题”。 这样的情况,对于那些极度依赖云服务的企业是完全无法接受的。只要发生一次宕机,订单丢失、生产停摆、数据丢失等一系列直接经济损失就已经远远超过企业在不同云服务商之间微小的价格差异所带来的成本节省了。试问,在这样高频的事故发生之下,哪家想要上云的企业不会在心中掂量一下呢? 而从友商的角度来看,跟随阿里云降价的打法远不符合他们的投入产出模式。 阿里云在追求政企市场失败后,逐步脱离了原有的高增长轨道,只得重新切换回他们擅长的互联网模式中来,即通过低价来实现价格飞轮留住用户,未来再考虑增厚利润的打法,但这一套玩法,已经无法让友商觉得“恐惧”了。 以华为云为例,作为国内市场份额达到19%的国内第二大公有云厂商,却很少打过价格牌,其底气就是不断迭代的创新技术:比如将“突破乌江天险”的大量基础软件、软硬件开发工具上云;推出国产AI算力的昇腾AI云服务;国产数据库华为云GaussDB;全面自主可控的MetaERP等。 大家都看到了华为正向研发-生产-商业化循环的成功跑通,再结合市场对阿里云服务质量的担忧,云厂商们明白,依靠扎实的技术创新与对用户的理解,完全可以实现健康、稳定的市场增长,无需过度依赖价格战。 特别是在面对阿里云降价策略时,考虑到其在政企市场失利后的战略调整以及外界对其服务能力的持续疑虑,云厂商们更加确信,找到市场需求、强化自身核心竞争力,才是应对挑战、赢得市场的明智之举,而盲目跟风降价只会被拖到阿里云擅长的领域中不断失血,最终消亡。 3 存量时代里,云竞争只剩“阳谋” 而对于阿里云来说,大幅度降价也像一把双刃剑,在刺激市场需求、抢占市场份额的同时,正在对直销与代理团队的利益分配格局造成显著冲击。 官网直接降价使得终端客户能以更低的价格购买到相同的产品和服务,这直接导致了代理商渠道的价格竞争力下降。据雷锋网报道,有经销商表示,“上午官网发布降价消息,下午马上就有客户来找我们咨询了,问能否按照新价格执行。” 还有一些经销商对此表示担忧,“现在很多产品价格已经贴着成本线了,如果再降的话,会进一步影响我们的返佣金额”。某代理商更透露,“阿里云产品只要是低于3.8折,则没返点。”而他昨天上午查看这次降价的U1机型带宽按量的产品多年期已经没返佣了。 长期来看,若阿里云未能妥善调整直销与代理团队间的利益分配机制,持续的低价策略恐将加速代理商群体的流失。代理商作为连接阿里云与广大企业用户的桥梁,其营销网络、定制化服务及客户关系维系能力对阿里云的市场渗透至关重要。 一旦大量代理商因利益受损而选择退出,阿里云可能会面临市场触角收缩、客户服务响应能力下降以及新客户获取成本上升等问题,这对于其长远发展而言无疑是巨大的隐忧。 可以说,时至今日,哪怕对于阿里云来讲,单纯的降价也已经不再是那个百试百灵、可以拖友商“下水”的市场竞争策略,甚至成为了需谨慎权衡利弊、兼顾各方利益的复杂抉择了。 而云服务市场,也在此刻被画下一条分界线,在存量时代中,云企间的竞争正式进入“精细化”运作的阳谋阶段。 不过,也正如云与智慧产业事业群CEO汤道生所说的那样,“价格战的本质没有变化,就是‘卷’。只是现在的市场更成熟,玩家变少,客户变理智,不会单纯因价格而选择,更看重的是优质服务的能力,必须发挥技术优势,提高供应链管理效率,才能体现长期成本优势。”
新测试基准发布,最强开源Llama 3尴尬了
梦晨 发自 凹非寺 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。 Llama 3的两个指令微调版本实力到底如何,也有了最新参考。 与之前大家分数都相近的MT Bench相比,Arena-Hard区分度从22.6%提升到87.4%,孰强孰弱一目了然。 Arena-Hard利用竞技场实时人类数据构建,与人类偏好一致率也高达89.1%。 除了上面两个指标都达到SOTA之外,还有一个额外的好处: 实时更新的测试数据包含人类新想出的、AI在训练阶段从未见过的提示词,减轻潜在的数据泄露。 并且新模型发布后,无需再等待一周左右时间让人类用户参与投票,只需花费25美元快速运行测试管线,即可得到结果。 有网友评价,使用真实用户提示词而不是高中考试来测试,真的很重要。 新基准测试如何运作? 简单来说,通过大模型竞技场20万个用户查询中,挑选500个高质量提示词作为测试集。 首先,挑选过程中确保多样性,也就是测试集应涵盖广泛的现实世界话题。 为了确保这一点,团队采用BERTopic中主题建模管道,首先使用OpenAI的嵌入模型(text-embedding-3-small)转换每个提示,使用 UMAP 降低维度,并使用基于层次结构的模型聚类算法 (HDBSCAN) 来识别聚类,最后使用GPT-4-turbo进行汇总。 同时确保入选的提示词具有高质量,有七个关键指标来衡量: 具体性:提示词是否要求特定的输出? 领域知识:提示词是否涵盖一个或多个特定领域? 复杂性:提示词是否有多层推理、组成部分或变量? 解决问题:提示词是否直接让AI展示主动解决问题的能力? 创造力:提示词是否涉及解决问题的一定程度的创造力? 技术准确性:提示词是否要求响应具有技术准确性? 实际应用:提示词是否与实际应用相关? 使用GPT-3.5-Turbo和GPT-4-Turbo对每个提示进行从 0 到 7 的注释,判断满足多少个条件。然后根据提示的平均得分给每个聚类评分。 高质量的问题通常与有挑战性的话题或任务相关,比如游戏开发或数学证明。 新基准测试准吗? Arena-Hard目前还有一个弱点:使用GPT-4做裁判更偏好自己的输出。官方也给出了相应提示。 可以看出,最新两个版本的GPT-4分数高过Claude 3 Opus一大截,但在人类投票分数中差距并没有那么明显。 其实关于这一点,最近已经有研究论证,前沿模型都会偏好自己的输出。 研究团队还发现,AI天生就可以判断出一段文字是不是自己写的,经过微调后自我识别的能力还能增强,并且自我识别能力与自我偏好线性相关。 那么使用Claude 3来打分会使结果产生什么变化?LMSYS也做了相关实验。 首先,Claude系列的分数确实会提高。 但令人惊讶的是,它更喜欢几种开放模型如Mixtral和零一万物Yi,甚至对GPT-3.5的评分都有明显提高。 总体而言,使用Claude 3打分的区分度和与人类结果的一致性都不如GPT-4。 所以也有很多网友建议,使用多个大模型来综合打分。 除此之外,团队还做了更多消融实验来验证新基准测试的有效性。 比如在提示词中加入“让答案尽可能详尽”,平均输出长度更高,分数确实会提高。 但把提示词换成“喜欢闲聊”,平均输出长度也有提高,但分数提升就不明显。 此外在实验过程中还有很多有意思的发现。 比如GPT-4来打分非常严格,如果回答中有错误会狠狠扣分;而Claude 3即使识别出小错误也会宽大处理。 对于代码问题,Claude 3倾向于提供简单结构、不依赖外部代码库,能帮助人类学习编程的答案;而GPT-4-Turbo更倾向最实用的答案,不管其教育价值如何。 另外即使设置温度为0,GPT-4-Turbo也可能产生略有不同的判断。 从层次结构可视化的前64个聚类中也可以看出,大模型竞技场用户的提问质量和多样性确实是高。 这里面也许就有你的贡献。
有望打败闭源模型?阿里、百度、腾讯云厂商抢食开源Llama 3算力
Meta发布Llama 3系列两个开源大模型之后,百度、阿里、腾讯等国内云厂商迅速抢食Llama 3的算力部署需求。 今日,阿里云宣布全方位支持Llama 3系列模型的训练与推理。阿里云百炼大模型服务平台推出针对 Llama 3系列的限时免费训练、部署、推理服务。腾讯云也宣布腾讯云TI平台成为国内首批支持Llama 3全系列模型的平台之一。 而在4月19日,百度智能云千帆大模型平台已宣布成为国内首家推出针对Llama 3全系列版本训练推理方案的云厂商。亚马逊云同日宣布这两款模型已在Amazon SageMaker JumpStart中提供。 多名科技界人士此前对Llama 3系列评价颇高,认为后续可能开源的Llama 3超4000亿参数版本有望改变大模型生态,更有从业者指出,开源的Llama 3有如安卓,一夜之间打掉所有闭源手机操作系统。 随着开源潮流继续,云厂商也不再仅依托与闭源大模型厂商绑定,而走向了抢食开源大模型算力需求。 Llama 3性能几何? Llama 3已开源版本的基准测试数据亮眼。据Meta介绍,指令微调的Llama 3 8B在五项基准上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三项基准超过Gemini Pro 1.5和Claude 3 Sonnet。 这两个开源模型发布后,近日陆续还有业界人士发表对该模型的看法。360创始人、董事长周鸿祎认为,这两个开源模型性能很强,应该远远超过GPT-3.5,Llama问世再次验证了其对开源的信心。 国内则关注到Llama 3的中文能力和长文本弱点。记者在一个大模型业内人士讨论群中看到,不少大模型开发者诟病Llama 3的中文表现,有大模型开发者实测发现其中文能力不如GPT-3.5,称后续使用可以等第三方微调的中文Llama 3出来。不过有业内人士分析,Llama 3将中文能力弱化了,这不是很大的问题,好的中文模型不一定需要很大量中文数据。 Llama 3上下文窗口仅8k,落后于业内平均水平。周鸿祎表示,360的7B(70亿)参数大模型可输入长文本360k,已开源了长文本训练方法,可将这个方法用在Llama 3 8B训练,弥补该模型短板。 Llama 3开源引发开闭源路线之争讨论后,Meta CEO扎克伯格近日在一次访谈中则透露了Meta开源的想法和决心。他表示,即便一个模型研发成本达100亿美元,只要对Meta有帮助,就会开源。扎克伯格提到开源的好处时举了个例子:此前Meta开放计算项目开源,随着全行业以Meta的设计为标准,供应链基本围绕此建立,起量后为其节省了数十亿美元。 “开源可以在很多方面提供帮助,一个是人们能否找到更便宜运行模型的方法。随着时间推移,我们将在这些东西上花费几千亿美元或更多。所以如果能提高10%效率,就能节省数十亿甚至数百亿美元,它本身就可能值很多钱。”扎克伯格表示。 周鸿祎在论述Llama 3开源的意义时也提到相似观点,他曾经问过谷歌高管为什么把很多大数据项目贡献给公众,对方的回答令他惊讶。“他说软件规模非常大,靠一家公司独立维护成本非常高,开源之后就变成公共财产,形成我为人人、人人为我的文化。“周鸿祎表示。 云厂商抢食 Llama 3开源一石激起千层浪,阿里云、百度云、腾讯云也嗅到了机会,入场抢夺算力需求。 云厂商绑定大模型公司以锁定算力乃至芯片需求,以往并不少见,且云厂商由此获得的利润可观。OpenAI背后站着的投资方是微软,ChatGPT就运行在微软Azure上。有“OpenAI最强对手”之称的Anthropic,身后则站着亚马逊。 今年3月,亚马逊完成对Anthropic的40亿美元投资,双方战略合作协议内容包括,Anthropic选择亚马逊云科技作为其关键任务工作负载的主要云服务提供商,Anthropic将利用Amazon Trainium和Amazon Inferemtia芯片来构建、训练和部署未来模型。这两款芯片是亚马逊的自研芯片。今年3月,Anthropic发布最新大模型系列Claude 3,亚马逊立马宣布Amazon Bedrock可运行Claude 3系列,且是唯一一个为该系列模型提供托管服务的平台。 参考微软云服务绑定OpenAI后的收效,在截至2023年12月31日的2024财年第二季度,微软智能云营收259亿美元,剔除汇率影响后同比增长19%,AI为Azure云贡献了6个百分点的增长,其中绝大部分增量来自OpenAI在Azure云上的推理调用。亚马逊云服务AWS则在2023财年第四季度获得242.04亿美元营收,同比增长13%。亚马逊首席财务官布奥尔萨夫斯基表示,客户对AWS生成式AI产品表现出很大兴趣,虽然生成式AI服务体量相对较小,但公司相信其在未来几年将带来价值数百亿美元的收入。 国内云厂商中,不少也是大模型开发商,腾讯自研混元大模型,阿里自研通义千问,百度有文心大模型。此外,不同于一些大型互联网服务厂商自建服务器集群的情况,一些大模型创业公司还无太多余力搭建服务器集群,而是使用云厂商计算资源。有云厂商相关负责人向记者描述,大模型训练所需GPU算力,要一千张卡、一万张卡连通,这不是所有公司都能做到的,云厂商基于规模和效率优势天然更适合大模型场景。 除了自研大模型,云厂商自然不愿放过其他大模型的算力需求。百度旗下有面向企业客户的大模型平台文心千帆,支持第三方大模型能力导入,千帆ModelBuilder支持国内外第三方主流模型,总数量达79个。此外,阿里云旗下有魔搭社区,腾讯云TI平台则已接入Llama 2、Falcon、Dolly等开源模型。今年3月,阿里云魔搭发起一项开源计划,支持国内类Sora模型创新。 相比推理训练更具中心化特点的闭源模型,诸多云厂商都有机会拼抢算力分散的开源模型部署需求。而随着Grok-1、Llama 3等相继突破开源模型参数上限,潜在算力需求也在攀升。如果Llama 3 参数量超4000亿版本可以获得媲美GPT-4的性能,部署该模型的需求攀升,接入Llama 3的云厂商能吃到的算力红利可能不低于微软。 开源大模型厂商也在评估自身能否从云服务厂商相关收入中分成。 在谈到是否考虑向云厂商授权模型,以赚取可观收入时,扎克伯格表示:“希望有这样的安排,但我不知道会有多大意义。我们希望,如果他们打算把我们构建的东西转卖并从中赚钱,那么他们应该来和我们谈谈。如果你是微软Azure或亚马逊,打算转售我们的模型,那么我们应该有一些收入分成。“ 扎克伯格提到,Llama 2基本已与所有主要云计算公司达成协议,可以作为托管服务在这些云上使用,而随着发布的模型越来越大,这将成为一件大事。“如果要销售我们的模型,我们就应以某种方式分享其中的好处。”
供应链:先进封装仍供不应求,大厂将积极全球扩张
集微网消息,中国台湾供应链表示,台积电先进封装CoWoS产能需求依然强劲,即使2024年实现产能翻倍并与OSAT企业合作,仍无法完全满足客户的需求。 台积电积极与日月光合作,后者能够执行完整的2.5D CoWoS封装和测试。随着人工智能(AI)的发展,先进封装技术无疑将是未来AI芯片的主流工艺。台积电高管此前表示,由于客户对CoWoS需求爆发式增长,溢出订单由Amkor(安靠)、日月光等分担,这些分包商已启动oS环节或CoW环节的产能扩增项目。 终端用户产品需求正在回暖,这也是市场复苏的关键。从长远看,汽车、HPC(高性能计算)、AIoT(人工智能物联网)的需求将支撑半导体市场重回上升轨道。 供应链人士表示,封测巨头纷纷在全球扩建工厂,新加坡、马来西亚、日本有望成为海外扩张首选目的地,未来将积极关注这三个地区的机遇和限制。 业界分析,大多数中国台湾半导体制造商在寻找海外扩张地点时都会考虑五大因素,包括政府补贴、充足的人才供应、上下游供应链健康程度、当地客户支持程度以及基础设施完备程度。 台积电总裁魏哲家此前在财报电话会议中提到,安靠已宣布计划在美国兴建先进封测工厂,地点靠近台积电亚利桑那州芯片代工厂,双方正积极合作,以满足当地客户需求。
数字人成了大佬标配?
作者丨樱木 编辑丨伊页 大佬与数字人的配搭,永远不会缺少流量。 上周,以刘强东为原型的AI数字人「采销东哥」在京东直播开启带货,不到1小时吸引了2000万观看,最终成交额超5000万。这个成绩放到全网来说也可圈可点。 走在时代与科技前沿的大佬,对数字人的偏爱一点都不少。 三年前ChatGPT尚未爆发,黄仁勋就用数字人代替自己发表演讲。因为没有事先公开,三个月内竟无人辨出真假。以生产数字人核心支撑硬件的GPU为主业的英伟达,从那以后便开始了一飞冲天之路。 根据国元证券分析显示,与当下大热的人形机器人可以替代劳动者一样,在数字世界中数字人对于人类的替代,成本的降低,以及灵活性与可塑性,都是让它成为风口的原因。 近几年,随着硬件基础算力的提升以及GPT-4等大模型应用升级,数字人有望真正成为个人分身,输出文字、图像、音视频,甚至细微到情绪表达。在未来构建数字内容的过程中,将有更多的场合可以用GPU+电耗替代人工,真正打造元宇宙数字世界,使数字人集社交、创作、分享于一身,成为多模态的杀手级应用。 那么为何当下成为了数字人发力最好的时机? 首先从技术上来说,随着算力提升,新概念的数字人正在打破“皮套人”的固定认知。从外观看,通过超精细渲染,数字人高分辨率的皮肤微结构极大限度地提升了数字人在中、近景出镜的真实程度,拟人表现力显著提高,基本突破了之前的诟病——“恐怖谷效应”。 刘强东的数字人带货从C端反馈来看,固然有许多不足之处,如没有互动环节,人像眨眼较少等。但随着大厂对于算力的投入,相信这些问题在未来会逐步被优化。 其次,数字人本质上是一款强内容驱动的产品。早先市场关注的3D数字人存在“成本高、周期长、缺交互”的弊端,影响了商用推广。如柳夜熙这样精度的数字人,制作成本至少在50万以上,且每期视频的创作周期需要一个月左右,幕后创作团队包括导演、策划、制片、三维、运营等人员。 但随着垂类场景的爆发,2D仿真数字人凭借其较低的技术门槛,相关应用在直播带货、娱乐主播、客服、游戏NPC等方向上会快速扩张。根据研报显示,2D仿真数字人使用静态扫描技术制作,即通过40-60个照相机对真人进行全方位拍照,根据拍照光线和角度进行矩阵扫描,从而在软件中呈现出2D立体形象。静态扫描技术仅需拍照搭配上少量所需数据,就能以较低的成本制作出2D数字人形象。尤其在AIGC发展迅速的现在,2D仿真数字人的制作门槛、周期和成本远远低于3D建模数字人。 (2D虚拟新闻主播,3D建模数字人) 最后,在内容端无论是京东、阿里等电商平台,还是短视频的抖音快手,都拥有着庞大的场景数据沉淀。这些数据可以从多维度支撑电商带货的全过程,从前端的销售,到中端的客服,再到后端的售后物流。伴随着AIGC的发展,2D数字人也同样具备语言交互功能,且由于较为垂直而更容易用大模型训练,体验将持续得以提升。 总结来看,降温增效+内容数据的完善,让数字人在消费场景的潜力正在逐步打开。在线上线下融合的新零售、以兴趣为先的内容电商之后,AI电商的蓝图已然画出了一个模糊的轮廓,而数字人也许就是打开大门的钥匙。
抖音追不上Sora
在AI文生视频这条热门赛道,抖音旗下的剪映,正在被OpenAI的Sora越甩越远。 近日,美国软件巨头Adobe宣布,将在知名视频编辑软件Premiere Pro的新版本添加多款文生视频AI工具。近两个月震动全球科技圈的Sora,以及两款同类产品Gen-2和Pika,都会在不久的将来加入“Adobe全家桶”。 有了Sora等第三方AI工具的助力,新版Premiere Pro除了编辑处理预先拍摄的常规视频外,还能根据用户输入的文本即时生成AI视频,并将两者融为一体。 Adobe放出了一条官方演示视频:一个男人走向窗前,观看整个城市的夜景。用户无需拍摄实景,只需输入一段文字,即可利用Sora生成一段城市雨夜的视频,并与前面的视频无缝衔接,效果几可乱真。 Sora今年2月初次亮相,OpenAI放出几段演示视频,但并未公布产品进展和上线时间。如今,Sora被Adobe接纳,表明过去几个月又有不小进步,距离开放使用更近。 另一边,背靠抖音的视频剪辑软件剪映,同样朝着AIGC(人工智能生成内容)方向前行。但截至目前,剪映尚未拿出令人惊艳的成绩。 目前,剪映的AI玩法不少,包括一键成片、剪同款、AI克隆音色、数字人口播等,但并不具备根据文本直接生成视频的能力。它的海外版本Capcut在2月底推出文生视频功能,但效果距离Sora相去甚远。 如今,Sora除了在技术和产品上领先剪映,还得到了Adobe的青睐。Adobe在全球拥有超3300万付费用户;Sora接入“Adobe全家桶”,有望获取订阅收入分成,从而初步构建商业模式。 这也意味着,仍在打磨AIGC能力的剪映,追赶Sora的难度将越来越大。 剪映被外界视为抖音搭上AIGC时代快车的关键筹码。得益于抖音的加持,剪映已成为用户量最大的手机视频剪辑软件之一,每天产出大量短视频;在此基础上更进一步,从UGC(用户生产内容)迈向AIGC,似乎水到渠成。 今年2月7日,抖音功勋老将张楠辞去集团CEO职务,亲自带队剪映。她在官宣职务变动的内部信中称,AI图像生成对她产生很大的触动,潜力巨大,并决定“放下一切”,义无反顾地出发。 剪映的发展根基不可谓不好,抖音的重视程度也很高。但两个多月过去,剪映依然没有太大动静,Sora反而继续高歌猛进。 在AIGC时代,抖音及其背后的字节,似乎总是棋慢一着。 字节八年前布局AI,成立了专门的实验室,招募大批业内精英,但成果却停留在内容审核、自动翻译、搜索服务等。2022年下半年,ChatGPT引爆行业;字节随即增加大模型投入,一口气推出AI聊天机器人等十几款应用,却迟迟没有拿出震动行业的技术和产品。 今年1月底的年度全员会上,字节CEO梁汝波感叹,字节“该有的大公司病全有了”。他特别点名AI业务,称:“公司层面的半年度技术回顾,直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司,都是在2018年至2021年创立的。” 如今,在立身之本的视频内容领域,OpenAI着着抢先,剪映乃至整个字节又双叒慢了。 01 背靠抖音这颗大树,剪映原本有很大机会在AI文生视频领域的占得先机。 剪映2019年上线,2021年推出PC端的专业版。它显著拉低了UGC视频的创作门槛,普通人只需准备好素材、点击几下,就能生成一段质量尚可的视频,并一键发布至抖音。 此外,作为一款工具软件,剪映还带有一定的社区属性。除了官方提供的视频创作课堂外,用户还可以参考达人制作的视频模板进行创作,也就是“剪同款”。这有助于提高用户留存率和活跃度。 依靠丰富的功能,以及与抖音深度绑定,剪映仅用了三年就获得超1亿月活跃用户,跃升至同类软件的第一名。 剪映海外版CapCut的增长同样惊人。 Capcut上线于2020年,与TikTok关联密切。移动应用分析平台点点数据显示,目前Capcut的月活跃用户超2亿。另据市场调研机构data.ai的数据,截至2023年8月,Capcut在iPhone和安卓端的用户超4.9亿,相当于TikTok全球用户量的1/4。 除了用户规模庞大,剪映在AI领域的另一个优势是“近水楼台先得月”,坐拥大量可用于AI大模型训练的视频数据。 数据、算法和算力是AI大模型的三大基础要素,其中数据是根基。要想提升大模型的综合能力,就需要不断“投喂”多模态数据,主要是互联网文本、图像和视频。 OpenAI、Adobe等公司都不直接掌握数据,必须从第三方付费获取,成本不菲。据媒体报道,OpenAI每年仅采购版权新闻文章授权的费用,就高达100万~500万美元;Adobe为了训练自家的文生视频大模型,以每分钟3美元的价格,向另一个大模型服务Midjourney购买视频片段。 相比之下,剪映在国内绑定抖音、在海外背靠TikTok,每天有大量用户使用它剪辑和上传视频。这让剪映能够以相对低廉的成本,接触到大量视频内容,为训练大模型、探索AI文生视频功能打下基础。 但从2019年至今,剪映并未研发出强大的AIGC能力,反而早早启动了商业化。 剪映很早就上线了VIP会员,用户每月支付二三十块钱,可以使用专属素材、精选模板等,AI玩法也被列为会员权益之一。根据官方介绍,AI玩法主要包括“无限创作”“无限运镜”和“瞬息宇宙”,基于现有视频素材进行AI美化编辑。 不难看出,剪映的AI玩法距离Sora这样的文生视频相去甚远。此外,它的收费也并不低廉:会员每月可获得1200积分,而使用一次“无限运镜”就需要480积分。积分耗尽后,用户可以选择继续充值,兑换比例为1元:100积分。 剪映诞生之初的定位是,尽可能拉低短视频创作门槛,促进抖音UGC生态的繁荣。过去五年,它的确完成了这一任务,大量抖音爆款视频背后,都有剪映提供技术和模板。特别是那些趣味特效视频、踩点视频,抖音红人发布之后,大量用户迅速群起效仿、共同推高热度;没有剪映的帮忙,恐怕不易做到这一点。 但如今看来,抖音还是把剪映的天花板设定地太低了。它原本有机会成为Sora这样的划时代产品,却始终停留在视频剪辑软件的范畴。 今年以来,剪映开始奋起直追,但先机已失、对手已至,追赶难度也迅速增大。剪映被Sora甩开,字节在AI领域仍然没能跳出“起大早、赶晚集”的怪圈。这也从侧面印证了梁汝波此前批评的“平庸的重力”。 02 过度重视对业务的帮助,过早追求商业化,是剪映乃至整个字节AI板块的难题。 剪映除了开设付费会员、将AI玩法纳入权益包,还在APP内增加了不少广告位。例如,用户点击“剪同款”,映入眼帘的除了手机照片和视频素材,还有悬浮在素材上方、几乎毫无关联的横幅广告。 作为一款用户破亿的工具软件,剪映的常规投入和资金压力并不会特别大。它之所以早早发展会员和广告,或许与字节的做事风格和评判标准有关。 众所周知,字节是一家超快节奏、高度内卷的互联网巨头。如果个人、团队或业务无法迅速带来肉眼可见的产出,就有可能被调整,甚至彻底出局。即使是需要长期投入的AI,也无法跳出这一隐形的评判标杆。 早在2016年,字节就设立了AI Lab人工智能实验室,并引入多位学界和行业精英。彼时,OpenAI同样初出茅庐,正朝着通用人工智能的愿景前行,将自己视为非营利组织。 相比之下,AI Lab虽然名为“实验室”,实际上仍然需要密切配合和服务业务。它的官网宣称,其研究重点是开发为字节内容平台服务的新技术;具体领域则包括自然语言处理、数据挖掘、计算机视觉、机器学习等,且和抖音各业务板块贴合紧密。 随后几年,字节拿出了一系列AI工具,比如提供翻译服务的Byte Translator,AI写稿机器人Xiaomingbot,以及头条和抖音的搜索服务等。它们固然颇有价值,但算不上突破AI领域认知边界、定义AI发展范式的创新产品。 直到2022年下半年,OpenAI多年磨一剑,ChatGPT席卷全球,生成式AI成为全球科技公司竞逐焦点,字节才把更多精力投入到这一新浪潮中。 已经淡出字节一线管理的张一鸣,对AI产生强烈兴趣,并鼓励团队大举投入。他在2023年4月的一封内部信中称,“字节跳动无法错过AGI(通用人工智能)”,它是抖音和TikTok在全球发现新的增长机遇不可或缺的伙伴。 创始人发话后,字节各业务部门闻风而动。从那时起,字节陆续上线十多款AI产品,如豆包、话炉、扣子、Gauth等,剪映、飞书等也增添了AI功能。 但在这一轮大举投入中,字节以业务需求为原点、对标竞争对手的做事逻辑被延续下来。豆包等产品均为现有AI技术的场景化应用,而非对于AGI的原生探索。 例如,去年3月,微软上线整合了GPT功能的365 Copilot,全球办公软件市场为之震动。一个月后,飞书宣布即将上线AI助手“My AI”,以对话形式提供多种功能,包括优化和续写文字内容、创建日程、自动汇总会议纪要、搜索公司内部知识库等。 一年后,GPT已经在微软“全家桶”遍地开花,带动后者股价从250美元一路上涨至400美元以上。飞书却没能依靠My AI完成逆袭,反而在3月底宣布裁员。 又比如,Sora今年2月16日发布演示视频,CapCut一周后就宣布推出这一功能,每人每天可免费生成5段视频。CapCut的技术力显然无法与OpenAI比肩,其文生视频功能也较为简陋;仓促上线、对标Sora,不免带有蹭热点、强行完成KPI的味道。 从张一鸣点名AGI至今,字节AI又走过了一年,并未显著拉近与OpenAI的差距,甚至有扩大的趋势。字节AI向实用主义的过度倾斜,不仅让它错失了以往的机遇,也有可能拖累追赶的步伐。 03 对于AI板块各自为战、围绕业务打转的局面及其危害,字节已经有所察觉。 2023年11月,字节抽调多个部门的精兵强将,组建AI部门Flow。TikTok技术负责人朱文佳、字节产品与战略副总裁朱骏、字节技术副总裁洪定坤、飞书产品副总裁齐俊元均加入其中。人员的“高配”,显露了字节通过Flow统筹AI发展、消除重复建设的意图。 目前,字节曝光度最高的AI产品——豆包、扣子、话炉等,均由Flow部门负责。剪映、飞书、大力教育等虽然也有AI业务,但声量已经逐渐被Flow盖过。 另一方面,字节云雀大模型已经打磨近一年时间,多模态大模型BuboGPT也取得进展,为Flow批量产出AI应用奠定根基。假以时日,Flow有望扭转字节AI总是慢人一步的局面。 不过,字节毕竟不是OpenAI,没有微软这样的超级金主。AGI固然重要,但对于现有业务的拉动尚不明显,需要更长时间的沉淀和打磨,才能释放商业价值;字节对AGI的投入不可能无止境,必须考虑中短期的投入产出比。 短期来看,字节需要用钱、用人、用资源的地方很多,比如抖音货架电商、生活服务等,都需要大量真金白银。随之而来的现象是,尽管Flow挑起了大梁,但字节AI依然呈现兼顾业务需求的倾向。 据Tech星球近日报道,抖音生活服务刚刚成立一支AI团队,希望利用AI技术创造增量业务价值,且已开启对相关AI产品的研发,包括搭建生活服务相关的内容创作平台等。 抖音生活服务之所以拉起这样一支队伍,或许与竞争对手美团和饿了么的动作有关。 美团近日开始小规模测试AI助手服务“问小袋”,可为用户推荐符合其需求的外卖商品,以及用餐建议。饿了么则在4月初面向零售行业商家发布“AI经营助手”,可为商家智能生成各类经营关键报表和关键数据。 在此情况下,不让美团饿了么专美于前,或许是抖音生活服务入局AI的基本目标之一。 内外因素影响下,字节没有条件像OpenAI那样厚积薄发。既要追赶AGI潮流,又要具备快速落地、服务业务的能力,是字节AI的双重目标。 在张一鸣和梁汝波的督促下,外界无需质疑字节做AI的决心。但倘若再过去一年、两年,字节仍然跟不上OpenAI的节奏和水准,那么它或许应该考虑另一种选择:退回“卖水者”的角色,做AGI训练素材提供商。 如前所述,数据是大模型的三大基础要素之一,而字节麾下的今日头条、抖音、TikTok等,已经积累了数以亿计的文本、图片和视频。字节可以用这些数据训练自家大模型,也可以考虑更进一步,在妥善解决安全和隐私问题的前提下,将其出售给OpenAI等第三方公司。 充当AGI时代的“卖水者”,其实是字节擅长的流量生意的变体。字节如今的现金牛——广告和电商业务,都建立在流量变现的基础上;如果把AI公司转变为新客户,那么字节心心念念的第二增长曲线问题将迎刃而解。 另一方面,OpenAI既然能够与微软、Adobe合作,与字节合作也并非不可想象。毕竟,抖音和TikTok是Sora等AIGC服务最庞大的落地场景。倘若字节与OpenAI达成“竞合”关系,那么字节将跳出一步慢、步步慢的循环,在OpenAI的助力下搭上AI快车。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。