行业分类:
加载中...
头条分类:
加载中...
微信读书阅读器为什么要“藏着掖着”卖?
亚马逊的Kindle电子阅读器曾被网友们戏称为“盖泡面神器”,但自从它退出后,国内整个电子阅读器市场呈现出一种疲态,没有Kindle跟着开路,电子阅读器市场始终不温不火。洛图科技(RUNTO)线上数据显示,2024年,在线上全渠道市场,国内的电子阅读器销量为48.5万台,同比增长34.4%,这个数据仅比办公本略高,比学习本的销量要差很多。 谁都没想到,Kindle这一走,把整个电子阅读器市场的注意力都给带走了。 据郭静的互联网圈观察,日前,微信读书新一代电子阅读器在3月中旬正式上线,售价999元,40多天竟然卖出1489台(数据截止稿前)。无论是腾讯公司的光环,还是微信的光环,亦或是微信读书的光环,都很难让人相信微信读书电子阅读器竟然是这个销量。 为什么没卖爆? 实际上这并非微信读书首次推出硬件产品,早在2021年1月,微信读书就推出了墨水屏阅读器产品,售价1499元,购买该机还会附送一张付费无限卡年卡,“微信读书app渠道预约+抽签形式限量发售500台”模式让外界对它充满了好奇心,在微信的光环加持之下,很容易让人对它痴迷,谁能拥有一台微信读书电子阅读器1代,那无形之中就是一种荣耀,甚至有人认为它会挑战当时的Kindle,可惜不久之后即销声匿迹。 1年后,微信读书悄悄推出了微信读书阅读器第二代产品,售价1999元,比第一代还高,事后来看,这款产品也没火起来。 正所谓“事不过三”,微信读书在阅读器产品上已经做出过两次尝试,且限量发售、悄悄发售,各种玩法和经验已经玩得够多,微信读书是不是应该推出一款“靠谱”的产品,或者说微信读书是不是该对电子阅读器产品上点心? 事实上并没有,微信读书依然是那个老样子,不慌不忙、坦然自若。与第一代、第二代产品相比,微信读书这次学聪明不少,比如,产品定价来到“良心价”,没有与微信读书会员捆绑,只卖硬件,价格来到了1000元以内,但销量依然不够好,为什么微信读书电子阅读器没有卖爆?郭静的互联网圈认为,主要有几个原因: 1.销售渠道过窄。微信读书第三代阅读器入口藏得可真深,用户需要在微信里搜索“微信读书”→搜索网络结果“微信读书阅读器”→点击头部系统推荐的商品进入→点击购买。如果有微信好友用过微信礼物送礼的话,详情页会显示“朋友送过”,在829条评论中,有8个网友选择“不够好”。 配图来自微信读书小店 微信读书小店是微信读书第三代阅读器的唯一购买渠道,淘宝天猫、京东、拼多多等电商渠道内都没有这款电子阅读器,至于线下的销售渠道就更没有。都2025年了,只有微信小店这一个网购渠道,会不会显得过于“古典”?哪怕只是随便开个网店,不怎么维护,就冲着微信的名气,在淘宝天猫、京东、拼多多等任何一个电商平台,都会有不少的销量,可微信读书并未在这些平台开设频道,难道微信读书怕买这款阅读器的人太多?还是说售前、售后维护麻烦?没看懂。 2.宣传不力。不管微信读书第三代阅读器自身产品如何,究竟是不是微信自己代工生产的,它都是一款消费品,既然是消费品,那就要宣传、要卖货。而微信读书在这方面也非常保守和克制。 据郭静的互联网圈观察,微信读书App仅在应用宝上的下载量就达6792万次,华为应用市场中的下载量达10亿次,面对如此庞大的用户群,微信读书第三代阅读器并没有在微信读书App上有任何宣传或者购买位置,要知道就连微信输入法推出的时候,微信读书都来了一波推广,可轮到微信读书第三代阅读器的时候,竟然什么都没有。 微信读书的公众号,也没有任何关于微信读书第三代阅读器的宣传消息,这意味着微信读书第三代阅读器的购买者全靠“自来水”,要么是媒体当作新闻报道来的流量,要么是用户主动搜索后进入的流量。 别人是生怕别人不知道,微信读书第三代阅读器搞得好像生怕别人知道似的,什么也不宣传,就硬卖,主打“一个愿打一个愿挨”。 3.产品平平无奇。根据已有的信息来看,微信读书第三代阅读器由文石代工,它是专为微信读书App定制的,其功能仅限于阅读微信读书App内容。配置方面,阅读器尺寸为 148×108×6.8mm,搭载高通 8 核(2.0 GHz)处理器,配备 6 英寸 Carta1300 屏幕(分辨率 1448×1072、300 dpi),提供 32GB EMMC 存储 + 2GB LPDDR4X 运存,TF卡槽最大支持1TB,电池容量为1500mAh,重量约145g,只有一个电源按键。 你很难从这款有“微信读书”logo的电子阅读器产品上看到有什么特色,更别谈有其他的诸如口碑传播、产品亮点等,除非你本身对微信读书比较痴迷,否则,市面上的其他阅读器产品并不比它差,性价比方面,无论是文石,还是掌阅、汉王、小米等,都有比它性价比更好的产品,为什么非要买它? 从种种迹象来看,微信读书第三代阅读器都不像是要“大卖”的样子。 电子阅读器的困境 电子阅读器行业的高光时刻是在2018年,仅Kindle就卖出百万台,全行业的销量达200多万台,但随着Kindle的退出,整个市场开始萎靡,其他电子阅读器产品甚至连“盖泡面”的机会都没找到。微信读书阅读器的问题并不只有它一家,掌阅、文石、汉王等电子阅读器产品同样面临着困境。 首先,智能手机的挤压。某种程度上,电子阅读器产品是用户使用数字阅读的一个“垂类”,用户使用电子阅读器进入沉浸式阅读,可有大量用户都的阅读习惯还是以手机为主,这就意味着电子阅读器需要跟智能手机“抢饭碗”,如果再考虑到还有平板电脑也来分走一部分市场,电子阅读器的市场份额也就更小。 电子阅读器产品主打的一个亮点就是“护眼”,电子墨水屏能够更好地保护眼睛。但这几年智能手机行业也在不断卷,为了丰富用户的使用场景,智能手机也搞出各种各样的护眼功能,包括一加、荣耀、小米等厂商,都在力推“护眼”功能,这种情况下,电子阅读器的“护眼”功能就显得没那么突出。 任何一款产品,想要跟当前的智能手机抢饭碗,都不太可能,就像智能电视产品,虽然厂商们用各种各样的口号来呼吁用户“重回客厅”,可依然竞争不过智能手机。 其次,使用场景和使用频次受限。当用户的主要使用时长都被智能手机给吸走,留给电子阅读器的时间和机会就非常少,这就意味着电子阅读器本身的使用场景和使用频次受到限制,就像当初的Kindle被用来“盖泡面”一样,用户即使购买了电子阅读器,最终的结果可能也是放在抽屉里“吃灰”。 可能有不少人认为“场景”这个概念很虚,但事实上任何数字设备都是在各种各样的具体场景中被不断强化/弱化,当用户想不起来用的时候,产品就会被弱化,平板电脑都变成了这类鸡肋产品,更何况电子阅读器。 专门买一款产品用来看书,这看起来过于理想化,考虑到产品的价格在几百元到2000元不等,真正愿意买的人必然更少。 掌阅科技公布的2024年财报显示,2024年营收为25.83亿元,其中,数字阅读平台的营收占比就达到了63.75%,若再减掉版权营收、衍生业务,电子阅读器产品的营收占比只怕会更少。 汉王科技2024年财报显示,2024年全年收入为18.17亿元,其中,2024年笔智能交互业务收入10.93亿元,AI终端业务收入仅为4.19亿元,该版块中,汉王提到的是电纸本产品增长,电子阅读器产品只字未提。 互联网巨头们做硬件产品向来不被外界看好,比如,当初百度、阿里巴巴、腾讯、360等巨头们做手机,巨头们习惯了应用软件的“轻资产”模式,而硬件并不是一块好啃的骨头。 做产品,太用力了不行,但像微信读书这样完全不用力,好像也不行,不知道微信读书阅读器为什么要“藏着掖着”卖,你们是否会怀念当初的“盖泡面神器”Kindle?
支付宝“碰”对了
去年年底,蚂蚁公布了一则重磅人事变动,前总裁韩歆毅正式接任蚂蚁集团CEO一职,今年3月初,韩歆毅正式接任CEO。昨天,韩歆毅首次在公开场合露面,宣布支付宝要加码百亿资源用于“碰一下”生态——这是他在正式出任蚂蚁CEO后,首次公开给业务站台。 碰一下是支付宝正在重点推的项目。一位支付宝人士告诉字母榜,目前项目级别在内部颇高。负责人李佳佳(花名:善攻)为蚂蚁集团数字支付事业群线下支付事业部总经理,向蚂蚁集团CEO韩歆毅汇报。 去年7月,“碰一下”支付正式上线,手机碰一下商户支付设备,即可进入支付页面,省去了打开微信或支付宝、打开扫一扫再扫码或出示付款码的几个步骤。 紧接着,支付宝从上海、杭州等重点城市开始逐步在线下铺设开来,并给予商户和用户补贴以拓展市场。 一位江苏用户在小红书分享了他最近用碰一下实现“蜜雪冰城0元购”的攻略:碰一下近期会送“2元券”,可以直接在卡包里找到券,去线下门店买蜜雪冰城2块钱的冰淇淋,用碰一下能直接抵扣。“就这样0元购又0元购”。 据支付宝最新公布的数据,碰一下用户数已经破亿。对比看其他支付方式,用户从零到突破1亿,扫码支付花了30个月,刷脸支付花了1年3个月,碰一下用时321天。支付宝的上一个类似的现象级产品,是余额宝。 事实上,碰一下在争夺的不止是支付入口,还有生活服务入口。 一位北京用户近期发现,餐厅桌子上除了扫码点餐的桌贴,还多了“碰一下”点餐码牌,手机碰到桌贴,即可自动弹出支付宝里点餐页面。 而在“自动售货机”领域已经密集落地。“售货机产业值得基于‘碰一下’再做一遍。”友宝在线CTO晁华去年在外滩大会上就表示,碰一下让售货机购物从传统的6步简化到2步,用户的⾃然选择率⾼达91.37%。 除了点餐,目前碰一下还支持打车、充电、医疗等场景。随着能够碰的地方越来越多,“碰一下”努力成为新的生活服务入口。 去年7月,支付宝碰一下最先在上海上线,接着同步来到了第一批杭州、成都、武汉、长沙、福州这6个城市。 一位支付宝人士告诉字母榜,碰一下先是从消费较活跃的一线城市落地,并逐渐向其他城市、县域市场铺开。 去年国庆期间,从北京回到江西县城的涂飞便发现,在一些商超,店员在积极地推广支付宝碰一下。 商超、便利店、餐饮等高频支付场景,也正是支付宝碰一下最先覆盖的商家类型。 支付宝官方最新公布的数据是,“碰一下”已覆盖全国超400个城市,有超5000个品牌、千万商家接入。 10年多年的扫码支付普及,客观上让支付宝建立了一套成熟的地推团队体系,地推能力被复用在了碰一下的市场推广上。 上述支付宝人士告诉字母榜,碰一下地推主要是通过与生态服务商合作。 此前,支付宝给服务商设立了40亿激励计划,支付宝会根据支付订单量给商家补贴。最新消息是,支付宝推出了“商家百亿助力计划”。一是设备端,商家现有的收银枪、收银扫码盒均可免费更换为“碰一下”。另外小微商家可以免费申请领取收钱码牌、碰一下点餐码牌。 这些动作显然能增加“碰一下”线下设备的覆盖率,而在用户端和商家端的补贴和奖励,则能提高设备的使用率。 按照最新的补贴计划,用户可享受每单减免活动,商家多推广碰一下、交易笔数越多,奖励越高。另外平台会和部分门店、街区、城市发放专项消费券,比如“蜜雪冰城冰淇淋0元购”就是碰一下和蜜雪冰城的合作项目。 不过,使用“碰一下”的用户群体正在变化。 去年10月,善攻曾在一次公开演讲中提及,国内将近70%的“碰一下”用户为年轻人。 但近期,支付宝内部通过数据发现,使用碰一下的年轻用户只占到一半,内部对此下的结论是:有更多的消费者接受了碰一下,这也意味着碰一下正成为新的线下入口。 正如“扫码”逐渐从支付扩展到点餐、解锁共享单车、共享充电宝,成为线下生活服务的入口。碰一下也正从支付向其他领域延伸,做新的生活服务入口。 字母榜获悉,碰一下今年定下的战略方向是,会花更大精力,将碰一下覆盖更多的城市、场景。 字母榜发现,今年1月,蚂蚁集团招聘发布了一系列“碰一下”项目组的岗位,包括算法、数据、硬件品类、安全类岗位,招聘中还写了一句,“亲身参与并见证,线下支付战场,从‘扫一扫’到‘碰一下’的革新。” 因支付宝在过去20年里建立了与线下商业生态的连接,碰一下接入其他服务的时间要更快。 一些用户发现,碰一下已经接入了很多生活服务场景。一家四川的菜鸟驿站新上了“碰一下取件”码。 以往去菜鸟驿站取快递,最麻烦的就是要在短信或菜鸟裹裹里翻取件码,据上述驿站店长解释,用碰一下取件后,用户手机解锁后“碰一下”就能展示取件码,快速取快递,同时也减轻了驿站工作人员的工作量,快递的入库效率和取件效率得以提高,驿站员工和用户都能方便许多。 最新消息是,支付宝后续会提供超300种“碰一下”解决方案,如碰一下入住、碰一下开门、碰一下骑行等等。如此一来,碰一下正成为新的生活服务入口。 去年10月,碰一下地推团队开始推广“碰一下点餐码”。“有时候打开手机找扫一扫嫌麻烦,就直接找服务员拿菜单了”,一位使用过碰一下点餐的杭州用户说,碰一下少了几个步骤,能更方便些。 这也是餐饮企业愿意接入碰一下点餐的原因。顾客到店入座后,只要解锁手机碰一下桌台上的点餐码,即可一碰直达点餐、付款,步骤减少也便能直接减少也能提高点餐效率。 去年12月,华莱士2万家门店全面上线“碰一下点餐”功能。另外老乡鸡、汉堡王等连锁餐厅也陆续接入碰一下点餐。 事实上,支付宝碰一下提供的并非仅仅是一个点餐入口,紧随其后的是助力商家数字化运营:碰一下则能将收银、会员拉新、私域运营一碰开启。 去年12月,老乡鸡接入碰一下,同时新客可以“碰一下”入会,熟客碰一下就是会员价、享受会员权益。顾客也不需要报手机号或者打开会员码,碰一下,积分就自动上去了。 老乡鸡此前曾表示,“碰一下”支付和数字化能力提升了品牌拓展新会员的效率。去年12月初“碰一下”消费节期间,老乡鸡“碰一下”的交易规模周环比涨幅近6成、带动新会员增长200%。 碰一下的提效同样适用于其他行业。善攻曾经给出一个数据:经首批合作商家测算,“碰一下”可以提升品牌经营效率10%至30%。 显然,碰一下对于商家的诱惑是多维的:效率提高、消费者补贴、数字化经营等,而这也是在支付和互联网服务鏖战多年的支付宝能一口气端出来的组合服务。 尽管碰一下比扫码要方便许多,市场依旧难免有疑问,扫码已经相当成熟、且使用体验也不错,支付宝为何还要投入如此大的人力、物力推广碰一下这种新的支付方式? 在善攻看来,“碰一下”是支付宝为优化交互、减少支付步骤而推出的功能,让各类生活服务变得如同日常接触般自然流畅。“我们笃定的是,‘碰一下’的交互方式比原来更高效,更容易带来商业上更高价值的转化。”他表示。 事实上,从人机交互的角度来看,扫码并非移动支付的第一选择,碰才更像是人类的第一本能动作,他更具确定性。 与此同时,随着信息大爆炸,海量的服务被深深的折叠在平台app和小程序的某个tab里,构成了对老年人等信息弱势群体的障碍,甚至熟悉手机的青年人也感到心累,这是时代下的信息过载。 一位点餐用户就表示,一群人去吃饭,经常发现过好久才发现谁都没有点餐。“大家打开手机就被东一个信息西一条推送打断了,手机里自己就是个被算法摆布的UV。”碰一下这种“硬链软”的方式,大大缓解了信息焦虑,“看到一个小蓝环,无脑碰就行了,不用先找什么app再去搜什么服务”。 在某种程度上,交互方式即生活方式。碰一下也契合了“数字排毒”的时代心理。 碰一下之于支付宝又扮演什么角色? 在整个互联网行业里,支付宝难以定义。他从支付起家,20年间,从网页支付到快捷支付,从扫码支付再到刷脸支付,几乎主导了这几波支付方式的创新浪潮,再到如今的碰一下。这家公司一直不安现状努力创新支付。 而在互联网领域,短视频、直播等内容领域也在尝试中。在生活服务场景里,出行、医疗、政务服务等行业的深耕也让这个app颇有服务工具箱的气质。 而今,碰一下作为一个新的交互方式,也让支付宝直接站在了一条崭新的赛道上。在支付、生活服务新入口之战中,抢先了一个身位。
一部手机,人人皆主播:百度慧播星的数字人直播革命
英国伦敦,大叔Simon坐在沙发前,用中文轻松自如地讲述着一则关于中英婚恋文化差异的趣闻。他说,在英国,约会是一种自由的探索,但当他听说在中国有“父母操办相亲”的现象时,震惊得差点说不出话来。“我为解释这件事讲了太多话,嗓子都哑了。” 就在大家以为视频要结束时,他却话锋一转,“一个数字人帮了我大忙。”紧接着,镜头切到他展示的手机页面,几个按钮点下去,他的数字分身正在流利地讲述同样的故事、同样的神情语气,在手机端开着直播,而他本人,正在商务旅行。 另一边,一位名叫Ali的中东脸主播,开头就用熟练的中文介绍自己:“我的兄弟们都知道,我直播快一个月了,每天晚上想直播的词想得睡不着”,言语中透露着无奈。突然,他精神一振,语调高亢地说:“最近,我的中国朋友给我推荐了个‘好东西’,接着便开始了现场教学,手动上传素材,几十秒后,一个数字分身出现在手机屏幕中,他坐在便利店中自嘲:“这个人比我还能唠,他的声音和我一模一样,连我妈都分不清。” 两个场景,一位跨文化观察者,一位疲惫的打工主播,背后却指向同一个共识:直播这件事,开始从“靠人熬”进入“靠AI跑”的阶段。百度慧播星数字人,正是这个变化的推手。无需培训、无需连麦、无需真人实时出镜,只需上传个性数据,就能让一个能说会道的AI分身替你上阵直播。 一部手机,人人皆主播 Simon和Ali有着不同的国籍、职业和应用场景,却都是最典型的用户,而在中国,像他们一样靠一部手机、一点空闲时间尝试直播的普通人也越来越多。 深圳福田区一间老旧公寓里,90后白领林晓正拿起手机,对着镜头录下她精心准备的30分钟护肤经验分享。她没有专业设备、没有团队、甚至手机也已用了三年。 但她仅仅只是上传一段视频之后,慧播星数字人就已在直播间上线,一边展示她推荐的产品,一边用亲切的语气回答观众提问。她本人不需要出镜,甚至不必实时在线。 这就是慧播星“0帧起手,一键开播”的真实写照——一键上传视频,即可生成数字人形象、智能脚本、商品话术,自动上线带货。 在过去,这种操作仅存在于大品牌与机构内容工厂:定制建模要花费十几万元,AI脚本需要专业人员反复调试,直播上线还要人工运营。对于像林晓这样没有资源和背景的素人来说,数字人直播是一扇紧闭的大门。 百度慧播星以“0成本一键克隆”为突破口,打破了这道门槛,将数字人直播带入一个人人可参与的新时代。 在慧播星的支持下,“直播”从一种职业技能变成了一种内容表达方式,其核心价值不在炫技,而在实用;不是“让AI替你表达”,而是“让AI帮你表达得更高效、更专业”。 过去一年,慧播星数字人主播数量累计超过10 万,数字人直播转化率提升31%,降低了80%的开播成本。数字人直播,不再是边缘创新,而正在成为内容电商的“新基建”。 四大能力打造高说服力数字人 艾媒咨询发布的《2024年中国AI电商行业研究报告》指出,AI电商行业的核心用户以中青年为主,25-44岁消费者占比高达83.1%。AI不仅提升了用户体验感,更通过“购物便利性、个性化服务、互动社交”三大功能点成为吸引用户的核心驱动力。 数字人直播,就是平台用AI重构内容与商品信息的最前线。 百度副总裁、百度电商总经理平晓黎曾说,“数字人可以说是AI,或者说大模型时代综合多模态表现非常典型的应用。”不过要从“技术演示”走向“商业实战”,仅拥有一个“能动能说”的虚拟形象远远不够,还需要一套可落地、可量化、具备实操转化的“能力矩阵”:能被用户接受的“形象”、能感知环境的“智能”、能推动转化的“行动”以及人人可用的“普适”。慧播星正是在这四者交汇点上构建起了数字人的技术飞跃。 首先是形象维度的突破,我们可以理解为“更像人的形象力”:今年3月,慧播星推出真人“一键克隆”功能打破了传统建模的复杂流程,用户仅需上传一段3分钟的视频,即可同时复刻真人的声音、形象与直播间装修。唇动匹配技术支持360度大角度侧转与手持动作演示,让数字人不仅“像”,更“活”。 其次是感知层的进化,即“更像专家的内容力”:慧播星的脚本创作不再依赖预置文案,而是在文心4.5turbo的基础上,根据品牌人设与商品类型生成风格多变、结构严谨的口播内容。从数据引用严谨的科普风,到融合热梗的脱口秀式脚本,再到强化主播个性的“人设”内容包,每种内容都可精准匹配受众心理。 首发【剧本模式】不仅能丰富脚本构成,还能根据剧本内容实时调整语调、表情和动作,做到神形音容高度统一,打破数字人主播的动作循环,实现“超拟真”。 最具突破性的还是在“行动”维度的决策能力,即更像销售的“交互力”:新一代慧播星引入了“AI大脑”与“多智能体调度”,AI大脑不仅能在毫秒级响应中完成内容调度,精准匹配PPT、视频切镜等素材,还能根据观众提问实时调整讲解节奏,灵活调动直播间氛围,引导用户参与多轮互动,提升留存与转化。 更重要的是,多智能体调度能力赋予数字人“团队作战”的可能:当直播间进入高热阶段,系统可自动调度“助播专家、场控专家、运营专家”等角色智能体,协同完成发福袋、限时控价、库存管理等复杂操作。整个直播间,像一台隐形的高效机器,围绕一个数字人主播展开协同,而用户看到的,只是一场真实自然、节奏流畅、持续高能的直播。 最后是技术普适性的革新,即“人人可用的普惠力”:慧播星将过往复杂的建模、部署、控播流程整合,努力把直播门槛“打到地心”。最新推出的手机端“一键开播”功能,只需手机号注册、上传一段2分钟视频,即可完成数字人直播的生成与上线。 这种极低门槛的技术体验,也为知识科普、生活分享、情感咨询等直播场景提供了数字分身的新解法,无需依赖专业设备或团队,创作者便能实现从“视频” 到 “主播分身” 的华丽转身,让“人人皆主播” 成为现实。 在这四重能力加持下,慧播星的数字人不再是只能照本宣科的机器,而是像一个有脑子、有反应、有性格的主播一样,对话、反应、推销——甚至还能抓住用户的情绪“下狠单”。 如今,慧播星数字人的这些能力已经在商家的具体实践中得到验证。“溶溶精致生活”在接入慧播星后,月GMV突破15w+,收益提升30%;“美丽家居服工厂”GMV上涨60%;而“左颜右色”数字人主播更在单场中实现了GMV29w+,直播间转化率提升60%。 亦得到了行业的高度认可。IDC发布的《中国AI Agent之电商直播数字人实测,2Q25》报告显示,百度慧播星综合实力排名行业第一。此外,五项测评指标中,百度慧播星在技术能力、产品表现、平台合规与稳定性、客户服务四项均位列第一。 “超拟真、会思考、能协同”的高说服力数字人,名副其实。 抢占“低门槛直播变现”的入口心智 当数字人直播从技术走向应用,还面临一个最终必须回答的问题:谁会最先大规模用上它?慧播星给出的答案非常明确:不是品牌,不是MCN,而是素人。 这其实与短视频的发展路径高度相似。当年抖音通过模板、滤镜与算法推荐降低了内容门槛,最终实现全民创作;今天慧播星通过数字人、AI脚本与智能运营将直播门槛拉至更低水平,为普通用户打开了“做内容、赚收入”的新入口。 “东北翠花在东北”是一位聚焦特色农产品的创作者,在早期依靠短视频积累了一定粉丝基础,但直播变现始终受限于人力与时间成本。 通过慧播星数字人自动化输出商品讲解内容,实现7*24小时不间断直播后,“翠花”本人得以将更多精力投入到内容创作、选品筛选与IP运营等上游工作。 这种“释放创作者、量产分身”的转型,成效显著:通过数字人直播季度GMV突破50w+,订单量增长10倍以上,贡献粉丝增量+22%。数字人不仅承担了运营的重复性劳动,也间接推动了翠花这一IP价值的跃升。 在不久前的百度电商生态大会上,百度电商商家运营部负责人尹冠东披露了一个更具规模的增长趋势:过去一年,百度优选月销百万商家数量几乎翻倍增长,其中依托慧播星数字人直播解决方案的GMV更是同比增长11倍。这不仅验证了“素人+AI”的直播模型在个体案例中的成功,也说明其具备平台级的放大潜力。 与此同时,慧播星还在推动视频、图文、AIGC素材等内容向数字人直播场景裂变复制。一段真人视频素材,可以生成多个脚本、多个数字人、多个直播间,适配不同用户群体、不同平台内容风格;对于拥有多个SKU的商家或IP创作者而言,这意味着一个内容资产可以被无限扩散。 过去“一个人=一个主播”,如今,“一个内容资产=无限个数字人直播间”。慧播星把直播从“劳动力驱动”变为“算力驱动”,将生产力释放给非专业人群。与其说慧播星是一套工具,不如说它是一个可以量产“内容变现代理人”的工厂。 平晓黎曾说,希望通过AI“先帮到行业里有痛点的商家,以及一些私人主播”,实现真正意义上的“AI普惠”。 慧播星正是这套普惠战略的尖兵,它用数字人降低直播门槛,用AI提升内容变现效率,用平台协同实现规模化放大。对百度而言,这既是一次AI能力的深度展示,也是百度电商生态的一块关键拼图。 4月24日,百度优选上线开放平台,正式发布MCP Server,百度的商品检索、商品交易、商品详情、商品参数对比、商品排行榜能力等均已通过百度电商的MCP server对外提供,这也是国内首家支持电商交易的MCP服务。 百度优选开放平台将沉淀的电商知识图谱、全维度多模态等领域创新能力,开放百度内外开发者使用,并基于MCP协议,陆续发布电商内容理解、电商内容生产、电商交易闭环。 这意味着百度电商的数据,比价,交易、内容生产等能力不再封闭在内部自营体系中,而是外部创业者、服务商、开发者可复用的共建生态。 平晓黎在采访中说道:“通过AI能不能给用户购物带来更好的体验,或者给商家降本增效带来更好的收益,在这两个方面,我们会做得更多一些,也是在行业里探索得更多一些,更前一些。”在更开放的AI世界里,百度希望与开发者共创双赢。 结尾 在AI商业化逐渐进入应用落地阶段的2025年,慧播星正在代表一个明确趋势:技术的价值不在于能做什么,而在于能让谁使用、产生什么结果。 当技术门槛降到极低,创作边界扩展到人人;当直播从少数人专属的职业技能,变成多数人的变现工具;我们所说的“数字人直播”,就不再是一场技术展演,而成为数字时代的新型基础设施。而百度慧播星,正是这一基础设施的早期奠基者。
百度李彦宏:大模型厂商卷生卷死,开发者无所适从
导读:当DeepSeek掀了大模型的牌桌,进攻是百度继续留在AI牌桌的唯一机会。 作者 | 第一财经 刘佳 “大模型厂商卷生卷死,开发者无所适从。”在百度AI开发者大会上,百度董事长李彦宏这样描述大模型和应用开发者的生存状态。 他援引数据称,开源中国一年新增150万开发者,但同时开发者也充满焦虑。去年第四季度国内有49个大模型更新发布,到今年一季度这一数字增长至55个,最多的时候一周有8个模型。大模型迭代速度快,模型能力越来越强,有开发者担心所做的应用被大模型迭代快速覆盖掉,因此白费功夫,不敢放心大胆地做应用。 “这其实是双刃剑。”李彦宏说,一方面开发者确实需要理解技术发展的趋势,避开大模型自身发展的延长线;另一方面,日益强大的模型能力为开发者打开更多可能性,“只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用是不会过时的。” 他强调,“没有应用,芯片、模型都没有价值。模型会有很多,但未来真正统治这个世界的是应用,应用才是王者。” 今年以来,当DeepSeek掀了大模型的牌桌,进攻是百度AI继续留在牌桌的唯一机会。 李彦宏透露,百度已有多个应用接入满血版DeepSeek,产生了不错的效果,为此百度专门举办一场讨论DeepSeek的分论坛。但DeepSeek不是万能的,比如它只能处理文本,还不能理解声音、图片、视频等多媒体内容,百度很多客户需要多模态能力,此外DeepSeek在一些场景幻觉比较高,“如果数字人直播幻觉出来一个买一赠一的优惠,商家要赔惨了。”此外还有速度慢、价格贵等问题。 当天,百度发布文心大模型4.5 Turbo和深度思考模型X1 Turbo,相比文心4.5和X1 Turbo。二者速度更快,价格分别下降80%和50%。此外,李彦宏发布高说服力数字人、通用超级智能体心响APP、内容操作系统沧舟OS等多款AI应用,覆盖AI数字人、代码智能体、多智能体协作等赛道,并宣布百度全自研的3万卡集群点亮,可同时承载多个千亿参数大模型的全量训练,支持1000个客户同时做百亿参数的大模型精调。 围绕应用,去年时李彦宏表示,智能体是他最看好的AI原生应用发展方向,当时还是“非共识”,到了今年智能体已成为AI应用的代名词。其中,代码智能体Coding Agent,是最近半年AI应用进展最快、最火的赛道。全球陆续涌现了cursor、devin、lovable等一系列代码智能体。在百度内部,工程师普遍使用的是文心快码等辅助工具写代码,但百度也有好几万非技术人员,他们则会使用无代码编程工具“秒哒”。 百度今日对“秒哒”进行升级, 李彦宏举例, 基于秒哒无代码开发工具,一个陕西的果农,做了一个能卖苹果、自动算账的应用;一位退休师傅,创建了一个可以进行车位、访客、维修登记和社区活动公告的居民服务应用等等。 李彦宏说,全球有近3000万程序员,有80亿人,当技术的门槛逐渐消失,每个人都可以具备程序员的能力。“如果你还像原来那样天天一行一行地写代码,是没有赢的可能性的。”
关税战后,国内的直播间更热闹了
特朗普胡闹式“发疯”,让原本面临挑战的全球贸易再次动荡。如何规避这只乱飞的“黑天鹅”,正成为越来越多的外贸商家的首要考虑。 “家人们,原本要出口欧美的订单,因为关税战卡在路上了,现在工厂直发直播间!” “姐妹们看清楚了!这件衣服的吊牌、洗标都是按出口标准做的。直播间4折,就当帮咱们外贸人渡个难关,买回去觉得不值,7天无理由退回来,运费我全包。” “说实话,做外贸10年,第一次这么直接面对国内的家人们。以前咱们的货都给老外赚差价,现在关税一涨,他们不要了,咱们自己人接盘!” “今天不为赚钱,就想让大家知道,咱们中国工厂做的东西,不比进口的差!支持一波国产外贸货,感谢家人们!” 这段时间的直播间里,类似的桥段随处可见,尽管存在剧本的之流,但也不得不承认,一大批外商商家正疯狂涌入国内的直播间。 就目前来看,由外转内也是整个关税战中的主流趋势。商务部数据显示,2024年中国社会消费品零售总额突破50万亿元,成为全球第二大消费市场,如此庞大的消费需求成了大部分外贸商家的退路和机会。 当直播间越来越热闹,国内的消费环境或许将迎来新的竞合期,每个外贸商家都存在着巨大的机会,但同时,在奔向胜者的路上,也将面临重重考验。 “自己人的地盘”真的好混吗? 这不是外贸商家第一回尝试外转内。 事实上,早在2008年金融危机年代,推动外贸企业转向国内市场就成了大势所趋,当年,国内的出口额同比下降16%,大量外贸企业把市场转移到国内。2020年,全球供应链受外部环境影响而被迫中断,当年第一季度,国内出口额同比下降11.4%,整个外贸市场又迎来一次外转内的浪潮。 这也就意味着,早在关税战之前,国内外贸企业就积攒了大量的外转内经验。 公开资料显示,当前的国内市场中已经存在外转内的典型企业。如家清品牌乐乐桉,《天下网商》报道,乐乐桉背后的公司2004年开始做清洁市场,当时只做外贸OEM。2024年618期间,店铺销售同比去年增长1684%。 无独有偶,主营咖啡机出口的HiBREW追求内销新增长,针对中国消费者开发智能泡茶机等新品类,目前,公司内销占HiBREW总营收的6%左右,未来希望可以达到20%。具体来看,国内的消费环境的确为外贸企业转内销提供了良好的条件。 首先,国内供应链企业开始孵化自主品牌,并由B端面向C端早已有一套成熟的商业逻辑。尤其在短视频平台的促进下,大量供应链商家涌入直播间。以义乌为例,过去两年,这座小商品城在直播间的存在感陡增。 2023年,抖音电商报告显示,当年,浙江金华的商家整体销量增长108%,2024年第一季度销量同比2023年增长111%,义乌小商品市场表现尤为突出,时尚饰品最畅销,同比增长97%。 需要注意的是,外贸供应链上的商品与国内市场需求存在很大程度的重复。盘点几大主流的跨境电商,服饰鞋包及珠宝配饰、家居家纺及厨房用具、数码产品及配件占大头,我国跨境电商出口商品中“消费品”一度占比高达97.3%。 也就是说,国内外的消费需求其实差别不大,商家从外贸转内供,光在产品端的可复制性就很大。 其次,国货消费已是目前国内消费市场中的一大热点。 受之前蜂花、鸿星尔克的影响,年轻的消费者对国货的好感度直线上升,凯度咨询的数据显示,2023年上半年,“真国货”品牌线上销售增速是外资品牌的2.3倍,网友甚至自发建立“民族品牌数据库”,用来区分国货与外资品牌。 这为外贸企业回国提前渲染了良好氛围。 当然,外转内在短时间里势必会出现水土不服。尽管国内消费需求巨大,但线上线下的商家竞争也日益激烈。尤其是线上,直播带货成为商家必争之地,仅抖音一个平台而言,过去一年,超3万个新商家首年店播即实现销售额破百万元。 69%的商家通过店播实现商品动销,其中超千个商家店播销售额突破亿元,16.2万商家店播销售额翻倍,全国产业带商家通过店播实现销售额超4300亿元。对于“人生地不熟”的外贸商家而言,无疑是一场大洗牌。 本地商家早把包括直播带货在内的多个赛道填满,外贸商家之间的竞争也不容小觑。 公开资料显示,截至2025年3月,京东专区入驻企业突破1200家,盒马外贸SKU占比提升至8%。另外,外贸企业回国还需要面临诸多细节。海关总署数据显示,参与内销转型的企业平均库存周转效率提升40%,但仍有32%的企业需要国内认证体系重构。 总而言之,外转内会是外贸商家在未来自救的一大手段,得益于前期积累,这一转变会迸发无数生机,同样也会险象环生。 商家不急,平台急了 关税战一开始,国内就做好了承接外贸商家的准备。 就目前来看,以京东、淘宝、拼多多、快手、抖音为主的电商平台;大润发、永辉超市、盒马为主的实体零售;东方甄选、交个朋友各大直播机构……对外贸商家转内销的态度都给予了一定支持。 看上去,不等外贸商家着急,平台已经开始急了。整个消费渠道为什么着急吸纳外贸商家,除了一定的社会责任,其实也有一些不得不说的“私心”。 《2024年中国购物者报告》显示,2024年前三季度,在快消品市场上,电商销售增长停滞,市场份额首次出现了负增长,降幅为0.6%,电商渠道的客流占比则从2021年的13%降低到了10%。 传统电商中,阿里、京东等传统电商的零售业务的营收增速越来越慢,两大短视频电商平台里,抖音电商的GMV增速在2024年首次出现了下滑,从年初到9月份由60%降至不足20%。同一时期,快手电商的GMV增速为15%,远不及2024年之前。 同样的,去年线下渠道的市场份额虽出现了1%的增长,但从零售业百强数据来看,过去十年间,消费市场快速扩大,可零售企业的规模不增反降,市场份额也从8.86%下降到了4.34%。线上与线下零售急需寻找下一个亮点。 当用户增长很难泛起水花时,整个零售赛道开始在商家端发力。 这两年,供应链已经是零售界最大的话题之一,外贸企业大多有着成熟且优质的供应链,这很符合当前零售行业的需求。且在这个质价比逐渐取代性价比的时代,外贸商品因为普遍执行国际质检标准,如欧盟CE认证、美国FDA认证,其品控水平可能高于国内同类产品。 电商平台与大型实体零售中心都想借助外贸供应链,来提升品质标准。 可以确定的是,消费者对外贸商品有天然“滤镜”。据悉,大润发卖场中已经引入首批外贸优质生姜,4月15日上架当天,华北区生姜销量比之前日均销量翻了6倍,仅一天销售1.2吨,次日销售1.56吨。 外贸企业也深谙平台与消费者的心理,相同标准、相同质量要求、同一条生产线的“三同”标准已然成了企业转内后的又一次竞争热点。于国内供应链而言,外贸企业带来“鲶鱼效应”,利弊共存。 但对各大零售渠道来说,或许利要远远大于弊。 此外,外贸企业可以填补国内市场的品类空白。 当前,零售渠道面临商品同质化,外贸产品似乎让行业看到了难得的新鲜,尤其是带有海外特色的产品。抖音电商数据显示,早在2022年,海外爆品相关的内容在抖音平台上的播放量成倍增长。 4月13日,临沂一家波西米亚风陶瓷出口企业转内销后,仅仅6个小时,就卖空库存,首次试水国内电商8小时的销量高达9万件。“外贸转内销”成了各大电商平台的流量招牌,据悉,小红书上有关外贸转内销的笔记已经高达1万篇。 时至今日,线上流量红利消退,线下消费降级,外转内是难得的好兆头,平台着急哄抢也在情理之中。 下一步,要从头开始吗? 从整个大环境来看,外贸企业转内销有得天独厚的背景基础,平台、消费者、政策、资源……无一不想促成这一场时代商业循环。但撇开这些外在条件,从外贸企业的自我视角立足,转内后要面临的挑战数不胜数。 尤其那些想走品牌路线的商家,说一切要从头开始也不为过。 首先,目前国内的消费环境里,想要孵化一个新品牌既需要时间成本,也需要资金成本。2024 年中国中小企业协会调研显示,超70%的企业需耗时 1-3 年才能建立基础品牌认知,而同期市场淘汰率高达40%。 资金成本方面,国内电商的新品牌获客成本逐年增高,这已是不争的事实,多数商家在流量上的支出基本占到总成本的20%到30%,有的甚至高达50%、70%。内容平台如小红书,虽为商家提供曝光机会,但算法推荐下,中小品牌一时难以触达精准客群。 没有品牌基础,消费者就很难买账。 艾瑞咨询显示,62% 的消费者更倾向选择已有认知的本土品牌,尤其在食品、家电等注重安全性的品类中。这段时间,大量外转内的销量“神话”层出不穷,但这不排除国内消费者有情怀消费的可能。 正如当年国货爆红,一旦情怀经济消失,没有品牌基础托举的外贸商家很容易一蹶不振。 除了品牌出头困难,国内价格战也是大部分外贸商家最担心的。出口,关税压力大,可转内所要面临的低价竞争同样会导致利润空间压缩。根据“鲸商”报道,一温州小家电出口商家,出口的微波炉净利润率将从10%骤降3%。 加上产品适配与市场需求、供应链与成本结构的转型、竞争环境的不确定性……这些都为外贸商家的未来增添了一丝危机。值得庆幸的是,国内电商平台从去年开始加大扶持商家,今年以来,拼多多、京东、淘宝、抖音几大主流平台对商家进一步加大重视。 从某种程度上,这将对冲外贸商家转内的焦虑。 至于其他方面的努力,一些典型的外贸转型企业或许可以值得参考。 以东莞羊绒企业“藏里羊”为例,这一从外贸贴牌转向高端自主品牌已实现抖音年销售额破亿。其核心逻辑是“老板直播”人设打造专业形象,结合“香蕉裤”爆款策略,再将海外供应链优势转化为国内用户可感知的“源头工厂”。 2024年,“藏里羊”海内外销量加起来共做了6亿元的生意,仅“藏里羊与羊绒哥”抖音直播间就贡献了4个亿的GMV。抖音电商数据显示,“藏里羊与羊绒哥”直播间是抖音热销榜、回购榜的TOP3,也是抖音长袖羊绒衫好评榜TOP1。 随着越来越多的外贸商家涌入国内,在直播间里高调亮相,企业应该很快就会意识到,回国是需要在产品适配、渠道效率、品牌心智等方面加码,而不是单纯地依赖产能转移。大环境再热情,授人予鱼,终不如授人以渔。
英特尔CEO陈立武首刀挥向臃肿架构,万人大厂开启扁平化革命
陈立武 凤凰网科技讯 北京时间4月25日,英特尔公司周三发布了第一季度财报,净亏损扩大一倍至8.21亿美元,对于第二季度的营收展望也不及预期。随后,英特尔新任CEO陈立武(Lip-Bu Tan)向全体员工发送了一封公开信,宣布要打造一个全新的英特尔,组织架构将扁平化,并从本季度开始裁员。 陈立武的这封信题为《我们的前进之路》(Our Path Forward),目前已经刊登在了英特尔官网上。 以下是信件全文: 各位同仁: 今天,我们公布了2025年第一季度财报。收入、毛利率和每股收益均超出了我们的预期,朝着正确的方向迈出了一步。这是在大卫和米歇尔(此前的两位临时联席CEO)的领导下取得的成绩。我想为他们两位以及你们所有人的优秀执行力表示感谢。 我们需要在此基础上继续前进,这不会容易。我们正在应对一个日益不稳定且充满不确定性的宏观经济环境,这一点在我们第二季度的展望中得到了体现。除此之外,我们还需要在许多领域改进。我们必须正视这些挑战,果断采取行动,重新回到正轨。 陈立武公开信 正如我之前所说的,这一切要从我们的文化改革开始。我从客户以及你们中的许多员工那里得到了相似的反馈意见:我们反应太慢、架构过于复杂,而且墨守成规。我们需要改变。 上周,我介绍的执行团队(ET)扁平化架构是我们迈出的第一步。下一步将是推动公司进一步简化、提高速度和协作。为了实现这些目标,今天我宣布一些重要的变化。 成为一家以工程为中心的公司 我们需要回归本源,赋能我们的工程师。这就是为什么我把核心工程职能提升到了ET层级。我们将推动的许多变革,都是为了消除阻碍创新步伐的繁复流程,使工程师更加高效 为了在工程人才和技术路线图上进行必要的投资,我们需要以新的方式降低成本。尽管我们在过去一年中已采取重大措施,但目前的成本结构仍远高于行业竞争基准水平。有鉴于此,我们下调了未来的运营开支和资本支出目标,我将在今天下午的投资人电话会议中进一步说明。 扁平化组织结构 在重新聚焦工程工作的同时,我们也将消除组织架构上的复杂性。许多团队有八层甚至更多管理层级,这造成了不必要的官僚作风并拖慢了我们的步伐。我已要求ET对其各自的部门进行重新审视,重点是减少层级、扩大管理幅度并赋权高绩效员工。我们的竞争对手精干、敏捷、反应迅速——我们必须也这样,才能提升执行力。 令我惊讶的是,近年来,英特尔许多管理者最重要的KPI竟然是其团队的规模。今后将不再如此。我坚信,最优秀的领导者是那些用最少的人完成最多事情的人。我们将在整个公司推行这种理念,包括授权顶尖人才在关键任务上作出决策、承担更大责任。 这些关键变革势必会带来裁员。正如我上任时所说,为了让公司重回正轨、为未来打下坚实基础,我们必须做出一些非常艰难的决定。这将在第二季度开始,并将在未来几个月内尽快推进。 我们将非常有意识地聚焦改革的方向,并与业内最佳企业对标。从以往的行动中,我们汲取了宝贵经验。在裁员的同时,我们也必须留住并吸引关键人才。我将赋予各位高管作出与最重要优先事项一致的最佳决策的权力。这些决策不会轻易作出,我们也将定期向你们通报进展。 简化流程 令我震惊的是,我们在大量内部行政事务上耗费了太多时间与精力,而这些事务并未推动业务发展。我们需要从根本上简化这些内容,以最大化将精力用于客户的时间。 我已指示领导团队取消不必要的会议,并大幅减少与会人数。太多宝贵时间被浪费了。我们还将通过实时仪表盘和更优质的数据来推动流程现代化,确保我们具备实时洞察,从而作出更快、更优的决策。 此外,我已决定将我们的正式洞察报告(Insights)和OKR(目标与关键结果)要求设为可选”。尽管我们必须对结果负责并获得绩效反馈,但我相信我们可以通过更简单、更灵活的方式实现这一点。同样,我们也将减少耗时的公司行政任务,如非必要的培训和文档编制等。 重返办公室 我们现有政策规定,混合办公员工每周应有约三天到岗。但实际执行情况远不理想。我坚信,公司园区应成为充满活力的协作中心,体现我们的文化内核。 面对面交流能促进更深入、更高效的讨论与辩论,推动更快更好的决策,也能加深同事间的联系。 因此,我们将在9月1日前更新政策,要求每周到岗四天。我提前告知各位,希望你们有足够时间调整作息安排。在此期间,我们将努力确保园区能够充分运转。你们的当地领导将分享具体安排,并征求你们意见,以共同打造最优的现场办公体验。 打造新的英特尔 我知道需要消化的东西很多,但我们处于落后局面,需要作为一个团队齐心协力,争取让自己处于最有利的位置去争取胜利。 这需要我们聚焦打造最出色的产品。我们必须取悦客户、赢得他们的信任,为其提供所需的性能、质量与可靠性。我们必须展现可预测的执行力,确保按时交付,也必须为股东提供稳定的回报。 在这样的关键时刻,团队有两种选择:一种是看到差距之大而放弃,另一种是审视自己,以前所未有的方式战斗。 我在上个月做了决定,选择与大家一起奋战。我深知这将是我职业生涯中最具挑战性的一份工作,但同时也会是最能激励人心、最令人感到满足的工作,因为我们未来会有许多机会,而这些机会在大多数人的职业生涯中是难得一遇的。 我们有机会彻底重塑一家行业传奇;有机会实现一次将被商学院载入史册的逆袭;有机会研发新技术并大规模部署,用它们让世界变得更好。 英特尔曾是全球公认最具创新力的公司。只要我们下决心推动必要变革,就完全可以重回巅峰。 这个过程会很难,也会伴随痛苦的决定。但我们会坚定前行,更好地服务客户、打造面向未来的新英特尔。我对我们的团队和每一位员工充满信心。 感谢大家在第一季度的付出,期待在明天的全员大会上与大家进一步交流。 陈立武 (作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
Adobe发布Firefly Image Model 4模型:AI生图再升级
IT之家 4 月 25 日消息,Adobe 昨日(4 月 24 日)发布博文,推出 Firefly Image Model 4 和 Firefly Image Model 4 Ultra 两款文本生成图像 AI 模型,并预告针对 Photoshop 和 Illustrator 的 Creative Cloud 应用更新。 Firefly Image Model 4 强调速度与操控性,被 Adobe 称为“迄今最快、最可控、最逼真的图像模型”,最高支持生成 2K 分辨率的图像,风格、尺寸和相机角度控制更加精准。 IT之家援引博文介绍,Firefly Image Model 4 Ultra 则擅长处理“复杂场景与细小结构”,带来更高水平的细节与真实感。相比前代,这两款模型确保生成过程快速高效的同时,显著提升了图像质量。这两款模型目前已通过 Firefly 网页应用上线。 除了图像模型,Adobe 还推出了 Firefly Boards,这是一款类似 FigJam 的协作式 AI 情绪板工具,目前处于公开测试阶段。 此外,Firefly 网页应用新增对第三方 AI 模型的支持,用户可选择 OpenAI 的 GPT 图像模型、Google 的 Imagen 3 及 Veo 2 模型进行图像和视频生成,未来还将支持 Luma、Pika、Runway 等模型。 Adobe 还为 Creative Cloud 应用带来多项更新。Illustrator 的生成式形状填充和文本转图案工具在去年测试后正式上线,助力设计师更高效创作。Photoshop 则优化了颜色调整功能,新增自动选择头发、衣物及面部特征的能力,同时更新了 Actions 面板,根据创作者的独特风格提供智能编辑建议。
服务骑手、呵护人间烟火,饿了么推出行业首个骑手AI助手“小饿”
服务骑手、呵护人间烟火,外卖业首个大模型AI助手来了。4月25日,记者获悉,饿了么正式推出AI“小饿”,蓝骑士们有了自己的智能AI助手。 这是国内首个基于大模型技术打造的骑手端智能体,旨在通过自然语言处理(NLP)、多模态交互及实时数据分析能力,为骑手打造专属智能伙伴,全面覆盖骑手的配送场景,提升骑手的效率和体验,让骑手跑单更省心、更安全、更多保障。 (图说:饿了么推出行业首个骑手AI助手“小饿”) 目前,AI“小饿”已在无锡、沈阳、佛山、苏州等城市上线,在这些城市,使用蜂鸟众包APP的蓝骑士已可使用。 原本需要自己操作手机界面,有了AI助手,通过“小饿小饿”唤醒后,骑手“接取送达”都可以通过语音确认来完成,“说说话就能进行操作,解放双手。比如手上拿着订单的时候,AI助手很方便。”第一批用上“小饿”的蓝骑士黄晓琴说。 面向饿了么蓝骑士,“小饿”具有三大核心能力,一是语音交互与智能响应,支持语音唤醒,可直接完成接单、确认到店、查询活动等操作,减少手动点击步骤,提升操作效率;二是多维度主动服务,通过实时分析骑手位置、订单状态及环境数据,主动推送权益提醒(如福利领取)、天气预警、路线封路提示等,降低配送风险;三是个性化智能分析,基于骑手历史数据与周边订单热力图,提供“哪里订单多”“当前收入预估”等智能分析,帮助骑手优化接单策略。 袁哲是浙江大学经济学院博士生导师,此前他曾“没苦硬吃”,戴着隔音耳塞体验饿了么“无声骑手”送外卖,关注互联网平台如何通过数字化方式帮助骑手。 (图说:浙大博导袁哲“没苦接着硬吃”,用AI助手“小饿”跑外卖) 对他来说,做“有温度的科研”,一直是研究的出发点。得知饿了么已发布AI“小饿”,他第一时间和平台联系,开通了使用权限,再次“兼职”送起了外卖。 跑单一周后,袁哲的初步评价是:省事、友好、方便。在解放双手之外,AI“小饿”会进行主动提醒,包括提醒联系用户、确认送达等,以及进行权益提醒、风险提示,包括提醒目的地无法上楼,告知用户备注不要敲门等等。没有订单的时候,“小饿”还可以聊天互动。 (图说:“小饿”会推荐订单更多的区域,让骑手收入更好) 对于新手来说,AI“小饿”还是“好师兄”和“小伙伴”。比如,如何获得更高收入?“小饿”会给出订单热力图,推荐订单更多的区域;作为“超级客服”,新手还可以获得各种功能指引、答疑解惑,快速掌握平台功能,缩短适应周期,包括了解规则、关怀政策,进行活动报名、拿到权益。 在黄晓琴看来,在接下来的高温天和极端天气中,“小饿”也会带来帮助。“雨天手机屏幕可能打湿,不仅骑手操作不方便,还影响接单、点送达等等。”她说,夏天天热,手机会卡顿,要是可以通过语音交互实现智能响应,骑手们可以把手机放口袋,避免手机被太阳直晒过热耽误工作。 “‘小饿’提高了小哥们的工作效率,我觉得蛮酷的。”袁哲认为,AI与人本身就有分工,外卖小哥负责与人的沟通,AI可以为外卖小哥服务,解放双手的同时,也是解放生产力。 (图说:“小饿”是骑手的“好帮手”和“小伙伴”) AI“小饿”的上线,标志着外卖配送进入智能化新阶段。据前期测试,语音交互能够提升骑手操作效率,主动提醒功能可帮助骑手规避风险事件。接下来,“小饿”也将持续优化提升,推出更多功能。 “我们希望,通过AI更好服务骑手,更好守护城市美好生活。”饿了么物流AI相关业务负责人表示,饿了么正探索更多AI能力,包括推出骑手专属的智能AI耳机与头盔等装备,让骑行更安全,跑单更安心。
百度重新定义操作系统:不像Windows,像“水”
水无形,但有神。 文 | 佘宗明 人们到底需要怎样的AI? 在AI正当「潮」的时下,这是个越来越值得思考的问题。 对身为文字工作者(俗称码字的)的我来说,我理想中的AI,是个善解「人」意的协作伙伴,在我需要之时,它无所不能,在我需要之处,它无处不在。 几个月前,我曾看到科技预言家凯文·凯利的一段话:J.K.罗琳是个天才,她创造了哈利·波特的世界,可即便她有如此大的想象力,也依然无法独自制作7部哈利·波特电影,「但有了AI,一个人是可以实现这一点的。」 AI技术飞跃,正让「未来已来」四个字变得具象化。 AI技术的进步,该体现在能帮J.K.罗琳「独自制作7部哈利·波特电影」上,也该体现在能帮上班族将会议录音自动转为文档还形成结构化知识图谱、帮学生党将网课里的知识点自动转录分类上——变成人们手中的「魔法棒」,就是人们期待中的AI模样。 01 不得不说,过去3年,尽管花哨概念层出不穷,但在用户需求已从简单的信息检索升级为复杂的内容创作、知识管理、跨模态协作的背景下,很多AI应用却显得有些滞后,「善于交互,难于交付」成了普遍性问题。 当前LLM(大语言模型)的主流交互形态仍以ChatBot(聊天机器人)为主,可ChatBot的作用止于Chat(聊天),你让它帮你生成文案,它说OK,你让它再帮你做成PPT,它可能会皇后娘娘附体——「臣妾做不到啊」。 现实中,很多网民手头的AI工具不少,但可用地方不多:找资料时,还是得同时在文档工具、网盘、专业数据库里来回找;设计时,经常要在PS、PR、AI、AE工具中频繁切换…… 究其原因就在于,市面上的许多AI工具都存在共同的硬伤:1,公私域数据割裂:企业内部知识库与互联网公开数据无法联动,导致AI输出缺乏深度与精准性;2,多模态能力碎片化:图片、语音、文本,需调用不同工具处理;3,交付链路断裂:从创意生成到落地执行缺乏连贯性,不得不反复切换平台才行。 公私域数据的高效整合能力,跨场景跨设备的无缝体验,才是用户内容生产与消费时需要的AI加持。该如何实现这两点要求? 去年11月,在2024百度世界大会上,百度发布的「自由画布」,就为此提供了样本。 百度创始人李彦宏当时就说,自由画布是个由文心多模态大模型加持的万能白板,能激发人们的无限灵感和创造力,「因为自由画布,每个人都可以是漫画家、短视频导演。而且,这不是期货,而是立即可用的现货!」 那,AI对内容创作的助力还能更进一步吗?百度说「能」,然后掏出了超级利器。 在4月25日的2025百度 Create AI开发者大会上,百度文库联合百度网盘推出了面向内容生产与消费场景下研发的内容操作系统——「沧舟OS」。 ▲「沧舟OS」是全球首个内容操作系统。 那些还在为解决内容创作交付问题辗转于一堆AI应用之间的用户,在任何时间、任何地点、任何终端一站式实现深度交付的期许终于不再遥不可期,因为沧舟OS就差把「无所不能,无处不在」写在脸上了。 而沧舟OS的底气,则是「深度思考+深度交付+公私数据融合+MCP生态」的四维支撑。 02 什么是「无所不能」?说具体些,就是AI要从能解决单点问题变为能提供全链路智能服务。 真正「无所不能」的AI,绝不该是「炫起来很酷,用起来想哭」,而应是让用户体验到方便好用的「N次方」:用语音口述方案后,能自动生成PPT大纲或Word脑图,还匹配图片素材;撰写报告时,能自动关联文库里的白皮书、网盘中的会议录音和学术平台上的论文…… 这在以往自然是奢望,但技术进步已将其变为现实。以Chatfile Plus为核心组件、以「三库(文库公域专业资料库+经用户授权的网盘私域数据库+用户记忆库)一平台(百度学术平台)三器(阅读器、编辑器、播放器)」为依托的沧舟OS,夷平了数据孤岛与能力分割的壁垒。 三库一平台的融合,打通了专业知识、个人积累和科研资源,构建起了知识全息图谱;Chatfile Plus与三器的协同,实现了多模态内容的「元素级拆解」与「向量化重组」,可支持文档/PPT/视频/音频的混排创作和编辑。 再加上AI Agent矩阵将数百项AI能力集成工具层,也让「智能拆解-创意生成-格式转换-多端适配」的全流程交付变得更容易。 需要看到的是,基于沧舟OS,在自研技术沉淀与生态合作创新基础上,百度文库和百度网盘推出了极具代表性的能力:GenFlow超能搭子、AI笔记。 作为WorkFlow(工作流)的升级,GenFlow中的「Gen」既有Generative(生成)之意,也有Genius(智慧)之义。它就像贾维斯附体,干起活来很聪明,具备需求识别与任务分发中枢的属性,能形成自适应服务链,为用户提供端到端的智能解决方案——这点可能会让人联想到1个多月前爆火的Manus。 「GenFlow超能搭子」跟其他的多智能体协同平台有相似的原理,都是利用大模型来分析用户query(提问查询)中的意图并帮其完成整个工作流。在此过程中,「GenFlow超能搭子」会因需调用文库和网盘上的那些适配工具。 但GenFlow超能搭子的优势在于背靠沧舟OS凭借算法优化与预处理将任务执行效率提升至「分钟级」、规避模型幻觉和输出瑕疵的底层能力,还有「三库一平台」的独一份加持,输出结果更加稳定、高效和符合用户习惯。 比如,我是个即将高考的高中生,想复习网盘里的学习资料,提出要求后,它可以拆解需求,梳理考点、总结重点、画出思维导图、预测考题、出模拟试卷等。 自动播放 ▲在帮学生备考方面,「GenFlow」可以干很多事。 在沧舟OS加持下,百度网盘也全面升级了AI笔记,对于职场人和学生等有学习需求的人群来说,它完全称得上一句「真香」。 试想一下,考研党在网盘里找到学习视频,点击右侧「AI笔记」按钮,接着视频播放器右侧自带笔记编辑区域,可实时生成逐帧摘要、思维导图,并关联相关文献,点击关键帧即可跳转至重点内容,点击时间截就能跳转到笔记对应位置……这不比上李永乐视频课前面听了后面忘要好多了? AI价值评判的尺度有很多,「好用才是硬道理」是至关重要的一个。 03 什么是「无所不在」?沧舟OS的「沧」字已道出了其中关键:其形态「像水一样」,能支持不同能力调配和交互界面。 百度副总裁,文库事业部、网盘事业部负责人王颖介绍道,沧舟OS跟其他操作系统的区别是,其他操作系统主要的是提供「大脑」,上面那些应用程序是「四肢」,沧舟OS则是既有大脑(智能决策中枢)也有四肢(完整工具链)的「超能人」。 过去Windows是多窗口界面,是因为没有通用性,只能底座是底座、应用程序是应用程序,但沧舟OS却是端到端的解决方案提供者,展示形式就像水一样因需而变,水放到圆形杯子里形状就是圆形,放到方形盒子里就是方形,但人们又离不开水。 这意味着,沧舟OS突破了常见操作系统的形态桎梏,变得更「活」。 这兴许才更契合人们的需要:现实中,广告人要设计营销方案,需要的不是在「脑暴-手绘草图-PS精修-视频剪辑」各环节都去找不同工具,而是让AI应用形态随场景自适应。 就此看,交互界面随场景而变,比如办公场景可以用自由画布,学习场景可以用AI笔记,由用户需求决定应用形态,来得颇为贴心。 现实中,很多老师在PC端完成教案后,希望将修改思路同步到多端等。系统以柔性架构融入PC、移动端、IoT中,因此很有必要。 现实中,有的律所想将自身案例库跟关联法条结合,生成培训视频。系统输入可涵盖语音、图片、文本,输出支持图文影音多模态,实现「用户指哪就打哪」,就变得十分重要。 「无处不在」说起来容易,做起来难:若没有AI能力动态部署与弹性伸缩、根据不同场景需求自由组合与拆分的能力,若没有跨模态向量空间统一化,实现「语音指令生成图文内容」等跨模态交互的能力,很难实现。 但「无所不在」的指向很清晰,那就是:让AI的鞋子主动匹配用户需求的脚,而不是削足适履。说人话就是,要让服务跟着用户需求走。 04 值得注意的是,从「无所不能」与「无处不在」两个维度拆解沧舟OS系统时,MCP(模型上下文协议)都是个绕不开的字眼。 MCP是当下的「AI新贵」。3月初Manus走红后,就间接带火了MCP——虽然没直接采用MCP框架,但Manus展现的多Agent协同能力契合了用户对AI生产力的终极想象。 截至目前,OpenAI、谷歌、Anthropic等AI巨头都拥抱起了MCP。 为什么? 因为MCP托起了AI领域的「书同文、车同轨」愿景:它统一了各家大模型原本差异化的 Function Calling(函数调用)标准,形成通用协议,能兼容无缝适配GPT、Claude等不同模型,堪称「AI界HTTP」「大模型界USB-C 接口」。 MCP通过Client(客户端)、Host(应用)、Server(服务器)将大模型与外部交互抽象成「客户端-服务器」架构后,那些MCP Host无需预编码适配,就能直接使用MCP Server(官方、三方),像USB那样即插即用。这样一来,在聊天界面就能实现「对话即操作「的革新体验,给用户「AI真的在动手干活」的既视感。 ▲谷歌CEO桑德尔·皮查伊说:要不要MCP,这是个问题。 而百度文库与百度网盘,就基于沧舟OS率先将MCP协议充分运用到了产品与生态的链接上,构建起了开放网络,既将文库网盘的核心能力开放出去赋能生态,也接入外部更多能力持续提升自身产品体验。 在文库网盘成为MCP Server后,那些接入其数据与能力的应用都可享受到更大容量、更快速度、模态更自由的内容存储、管理、搜索、总结服务。 像三星手机,就凭借接入百度文库&网盘的能力,在手机语音助手界面直接实现了文件的上传网盘备份、云上分享、文档摘要总结和内容问答等功能,手机自身对大文件、多文件难以批量备份与分享的问题也迎刃而解。 百度文库&网盘则凭着灵活精准地调用内外部模型和工具,满足用户一站式完成长文、研报、PPT、AI绘本、海报等不同形式、模态内容的获取和创作之需。 某种程度上,这延续了百度开源文心大模型4.5系列的开放姿态。 到头来,正是因为MCP生态的「资源互通、技术共享」抬高了能力天花板,才有沧舟OS带来的「无所不能」;正是因为MCP生态的「网络效应」,才有沧舟OS带来的「无处不在」。 05 凯文·凯利曾写道:最深刻的技术是那些看不见的技术,它们将自己编织进日常生活的细枝末节之中,直到成为生活的一部分。 很多底层基座式技术最终变成社会数字基础设施,就印证了这点。 不难想见,随着AI时代全面到来,「无所不能」的技术底座与「无处不在」的生态网络交织而成的沧舟OS,最终会变成内容生产与消费的「新基建」,润物无声。 但它撬动的内容产业生产力变革影响注定会很深远:大众也许不解何为跨模态协作,何为多Agent调用,何为知识库整合,但伴随内容创作门槛变低、知识管理难度降低而至的变化却看得见。 有了百度给的那支「AI神笔」后,就算不是马良,很多人照样能在「画布」上画出瑰丽多彩来。 AI革新了内容生产与消费的范式,也会为内容创作带来新机会,为内容产业打开新空间。 可以预见,在不久的将来,在知识与内容这片「沧海」上,会有越来越多人乘着AI这艘「方舟」,一苇以航,乘风破浪。
时代变了,互联网不再需要陌生人社交
“陌陌是什么”,一位00后网友的疑问,透露出这个曾经一度让微信感受到威胁的社交产品的处境。 而就在前几日,陌陌APP、探探APP的母公司挚文集团发布了2024年财报,更将其当前的困境暴露无遗。 财报显示,2024年,挚文集团总营收为105.63亿,同比下滑11.99%,归母净利润惨遭腰斩,下滑幅度高达46.89%,只有10.40亿。事实上,从2020年起,挚文集团在营收上已连续五年下滑,这似乎也证实了陌陌及探探在互联网舞台的中心消失了太久。 而唐岩失去的不只是昔日的荣光,还有他在望京的大本营。2014年望京SOHO建成投入使用之后,陌陌很快就进驻入场,这一住就是10年,但去年年尾,陌陌悄然离开了望京。 互联网行业内,一个明星级产品从崛起到衰落,早已是寻常,可值得深思的问题是,陌生人社交赛道上,陌陌式微,并没有换来“新巨头”的上位,Soul后继无力,二狗、她说、皮蛋、青藤之恋等APP“圈地自萌”,这些产品的影响力似乎都难和当初的陌陌同日而语。 陌生人社交,怎么了? 年轻人更爱“轻社交” 近几年,纵观整个互联网,用户的注意力和时间发生了明显的转移。 参考艾瑞咨询发布的《2024年Q3中国移动互联网流量季度报告》,从月总使用时间来看,虽然短视频、通讯聊天仍是瓜分网民移动端使用时间的前两大行业,可是短视频和通讯聊天之间的差距非常明显;在用户单日使用时间上,短视频的人均单日使用时间为138.4分钟,而通讯聊天仅为68.5分钟,前者足足是后者的两倍。 从这张图中,我们还能看出,月总使用时间上,社区社交的同比增长率最高,为9.2%,用户单日使用时间上,聚合资讯、视频服务、电子阅读及社区社交行业的使用时间同比均呈正增长。 这和这几年抖音、快手、小红书等平台相对活跃的发展状态是吻合的。以小红书为例,截至2024年6月,小红书的月活用户已达3.2亿,日活用户达1.2亿。但反过来看,也正是抖音、快手及小红书、B站等内容型产品,把以微信和陌陌为代表的社交流量成功抢走了,它们通过内容重构了当下互联网的社交场景。 而这背后是新一代年轻人社交习惯的改变,相比需要投入时间和金钱成本的传统社交,他们更喜欢短暂的、低成本的、注重情绪价值的“轻社交”模式。 中国青年报社社会调查中心联合问卷网去年对1333名青年进行了一项调查,调查显示,77.4%的受访青年觉得“轻量化”社交越来越普遍,进一步分析发现,其中00后受访者认为越来越普遍的比例更高,为81.9%。 在线下,各种社交搭子的流行就是“轻社交”模式的产物。从最为普遍的“饭搭子”,到无法一眼读出其内涵的“穷搭子”、“蛋搭子”,如今对年轻人来讲,万物皆可“搭”。而线上,以兴趣为主导,找到有共同兴趣爱好、共同语言的人,以此构建社交关系,比单纯依赖荷尔蒙支撑陌生人之间的联系,更吸引这一代年轻人。 所以说,短视频或内容社区恰好满足了用户轻量化社交的需求。比如在抖音上,用户通过短视频内容建立起信任,评论区互动还可以形成弱关系链,在算法的加持下,这种兴趣匹配越发精准;小红书则基于庞大的女性用户群体,她们热爱分享好物、吐槽职场、寻找良药,这推着小红书成为一个全方位的生活分享阵地,社交氛围更加浓厚。 相反以陌陌为代表的陌生人社交产品,还在以快速匹配、解决交友需求为重心,一定程度上这和“轻社交”的趋势是相悖的。 当00后更习惯在小红书上寻搭子、在B站弹幕找同好、在《蛋仔派对》组CP时,传统社交产品逐渐被抛弃是必然的。 陌生人社交产品,解决不了孤独 趣缘交友虽然成为了年轻人的社交“兴奋剂”,但我们发现,主打兴趣社交的陌生人社交产品却没有得到跨越式发展。一度以兴趣社交而兴起的积目,在2019年7月被映客直播收购,首页做起了基于LBS的看脸社交,字节针对“兴趣社区”打造的邀请制社交软件社区,曾一码难求,很快如昙花一现。再比如,QQ关闭兴趣部落,微信也停运了微信圈子。 为何专门迎合兴趣交友诞生的社交产品一个个陨落,反而抖音、小红书这样的内容平台逐渐成为年轻人交流兴趣和爱好的核心阵地呢? 因为所有的陌生人社交产品都是以效率为导向,致力于如何更快速帮助用户产生连接,找到自己想要的交友对象,而不同的兴趣只是作为一种标签,也可以说是一种工具,引导平台去完成匹配。可是这些社交产品无法像内容社区或平台那样源源不断地生产和沉淀优质内容,形成真正的兴趣氛围,这导致用户不愿意一直留在产品或应用上。 仔细观察排名靠前的几个陌生人社交应用,在功能设计上,大部分的兴趣社交软件和一般软件并无不同,不外乎“广场发布、聊天、随机匹配、推荐展示、扩列和个人页”。像一些带有社区属性的产品,其实也有很多与其相似的功能。 另外有一点不容忽视,年轻人的兴趣和追求是多样、多变的,甚至有时也是非常模糊的,单靠用户首次登录前选择的兴趣标签或是填写的调查问卷,很难摸清楚用户的个性及喜好,更别说挖掘用户的深层需求了。 这就回到了一个根本性问题:陌生人社交是孤独经济的产物,但它未必能解决孤独。 近几年,农村家庭分离、城市职场竞争加剧,年轻人因工作原因远离家乡和亲友,独居人群激增。根据《中国统计年鉴》,截至2023年,中国独居人口已超过1.2亿,其中20-39岁年轻人占比约30%。 孤独的情绪,自然催生了对陪伴与情感互动的需求,只是这些需求被越来越多的新赛道“分流”了,没有全部涌入陌生人社交产品。换句话说,缓解孤独的方式越来越多样,年轻人不一定选择去社交,或单纯选择社交。 比如孤独经济催生出的养宠物热潮、“养娃”文化、认养动植物、游戏陪玩等等,一年比一年火热,尤其是受人工智能技术浪潮的带动,AI情感陪伴赛道迸发,各种AI毛绒玩具、AI机器人、虚拟恋人成为了单身人群填补情感空缺的新选择。这些新生事物的出现和被认可,说明年轻一代缓解孤独,更重视情绪价值满足,至于建立起关系的对象,不再拘泥于真实的人。 再看陌生人社交,这些年社交APP越来越多,年轻人认识陌生人越来越容易,了解人却越来越难,它们帮人们建立连接,却加深了孤独感。 陌生人社交不是一门好生意 广告、会员增值服务、平台币、入场费…当下陌生人社交产品寻求变现的方式越发多样,可创造的商业价值并不可观。 以陌陌为例,当初直播兴起,陌陌自以为找到了商业化的突破口,可在短暂带来业绩的高速增长后,公司开始了长期的下滑。数据显示,2020年-2024年,直播服务收入分别同比减少22.6%、13.1%、22.3%、6.7%、16.1%。该项业务收入占比也持续减少,自2024年一季度开始,其占比落后于增值服务收入的占比。 作为陌生人社交的后起之秀,Soul看起来风光无限,但业绩表现一言难尽。从其公开的招股书显示,2019年至2022年,Soul分别亏损3.53亿元、5.79亿元、13.24亿元和5.09亿元,累计亏损27.65亿元。 这是因为Soul每年的广告费用居高不下,一直走以烧钱换增长的路径,而用户的增长却没换回营收的增长。 陌生人社交的商业化难题,核心在于用户的付费意识和付费能力。 平台向用户收费,要用户付费才能解锁内容,可毕竟都是没见过面的陌生人,也没有质量保证,这就打消了一部分人的付费意愿。当然,更多的人愿意为优质的服务付费,他(她)们潜意识认为付费的肯定是好的,只是,平台的付费机制大多收割意味非常明显。尤其是多数陌生人社交产品“重女轻男”,这导致基于性别不同设置的收费规则相对割裂,其培养“舔狗”、继而收割“舔狗”的方式,越来越受到质疑。 一位网友吐槽,之前Soul整改,将以前的访客记录改为了收费,语音匹配的玩法也发生了明显的变化,“一个语音匹配,一会是匹配加速卡,一会是次数卡,就差把割韭菜写在头上了”。 偏向女性、对女性友好,是陌生人社交平台为了吸引女性用户、打造和谐氛围的共同选择,但根本上平台是凭借女性用户群体去吸引男性。久而久之,女性被抬高,对需求的预期也抬得很高,男性为了获得青睐,所付出的成本也就越高。 在经济状况较好的时候,需求的膨胀和虚幻的追捧,会让很多男性努力搏一搏,但如今,当他们对未来预期的降低或经济能力受到冲击,谁也不甘心继续做“舔狗”。 越是“吃相”难看,越是透露陌生人社交在商业化探索上的无力。其实除了直播,任何收费的举措在日渐变差的社交氛围下,都是对用户体验的冲击和伤害,而直播遇到监管的制约又是必然的,这导致陌生人社交的商业化进展始终困在原地。 因此,在互联网经济中,陌生人社交也成了一个不被看好的生意,如今这一赛道更是被内容平台“侵蚀”,陌生人社交似乎正在走向“小而美”。
实测文心 4.5T/X1 双 Turbo 模型,百度砍一刀把 DeepSeek 也卷飞了
DeepSeek 推崇的开源策略,不仅对「AI 六小龙」造成了不小冲击,也让百度等老牌巨头感受到了实实在在的压力。 但转身的百度,正逐渐展现出强劲的反击姿态。 继宣布「文心大模型 4.5 系列」将于 6 月 30 日正式开源后,已经发布多款新品的百度,今天在面向开发者的 Create 大会重磅推出两款全新模型:文心 4.5 Turbo 和深度思考模型 X1 Turbo。 既然冠以 Turbo 之名,那这两款模型能力自然在性能上全面进阶,主打多模态、强推理和低成本。百度旗下新搜索智能助手文小言也宣布全面接入,免费向用户开放,即日起用户打开文小言 APP 即可使用。 会上,百度创始人李彦宏明确指出:「多模态将成为未来基础模型的标配,纯文本模型的市场会越变越小,多模态模型的市场会越来越大」。 「当然 DeepSeek 也不是万能的。比如它只能处理文本,还不能理解和生成图片、音频、视频等多媒体内容,」李彦宏认为「它更大的问题是慢和贵,中国市场上绝大多数的大模型 API调用价格都比 DeepSeek 满血版要低,速度要更快。」 在他看来,今天隆重发布的文心大模型的 4.5 Turbo 和 X1 Turbo 正是要解决这些问题。 基于这一判断,文心大模型 4.5 Turbo 进一步强化了多模态能力。在多个基准测试集中,文心 4.5 Turbo 多模态能力已与 GPT-4.1 持平,甚至在部分维度优于 GPT-4o。 ▲文心4.5 Turbo-多模态 ▲文心4.5 Turbo-文本 我们不妨测试一下文心 4.5 Turbo 的逻辑推理能力,看看它如何解答这样一个经典问题: 「烧一根不均匀的绳要用一个小时,如何用它来判断半个小时?烧一根不均匀的绳,从头烧到尾总共需要1个小时。现在有若干条材质相同的绳子,问如何用烧绳的方法来计时一个小时十五分钟呢?」 创作方面,文心 4.5 Turbo 靠谱吗?我们也让其创作一份孙悟空和东海龙王结拜的短剧剧本。 结果,交出的剧本不仅尊重原著核心,也注入了新的解读。其中定海神针的拟人化是亮点,血盟仪式的设计也添加了新的维度。 而文心大模型 X1 Turbo 则在 4.5 Turbo 的基础上进行了「深度思考」升级,性能显著提升,内置更完整的思维链系统。 无论是问答能力、内容创作、逻辑推理,还是工具调用、多模态处理,X1 Turbo 均实现全方位增强,整体表现领先于 DeepSeek R1 和最新版本 V3。 上个月,我们实测了文心大模型 4.5 以及深度思考模型 X1 理解梗图的能力,那新模型的表现如何?答案是,多模态理解能力确实更强了。 拿这张梗图为例,相较于上一次,X1 Turbo 的理解更到位,回答也更具条理性,充分认识到这张万能表情包背后的「友好善意」。 比如,上传一张文物照片,让 X1 Turbo 进行讲解分析。它不仅能准确识别文物身份,还能详细剖析其工艺特点,讲解内容之细致,堪比专业博物馆讲解员。 亦或者,尝试让其生成一张空中飞机视角的图像,画面随即生成,几近真实。 ▲Prompt:一个人的手指向飞机窗外,窗外的飞机机翼从侧面可见。外面的天空清晰,天际线显示出黎明或黄昏的景象。眼前是广阔的海洋 而在大家最关心的成本方面,而百度此次也打出价格组合拳。 文心大模型 4.5 Turbo 每百万 token 的输入价格仅为 0.8元,输出价格 3.2元,相比前代 4.5 降幅达 80%,只相当于 DeepSeek V3 的 40%。 而文心大模型 X1 Turbo 每百万 token 输入价格为 1 元,输出为 4 元,同样在性能提升的同时价格腰斩,仅为 DeepSeek R1 的 25%。 当天的 One More Thing 环节,百度正式点亮了国内首个全自研的三万卡集群,可同时承载多个千亿参数大模型的全量训练,支持 1000 个客户同时做百亿参数的大模型精调,强大技术底座硬实力的背后,也意味着百度再次向行业释放出最鲜明的信号。 此外,李彦宏在会上表示,当前开发者做 AI 应用的一大阻碍,就是大模型成本高、用不起。成本降低后,开发者和创业者们才可以放心大胆地做开发,企业才能够低成本地部署大模型,最终推动各行各业应用的爆发。 不再将模型能力视作壁垒,而是回归到一个产品、一个平台应有的「性价比」逻辑上来。与其说是在卷价格,不如说是用效率降低门槛、通过开放构建生态。
AI时代女性如何拓展职业发展路径?微软举办女性领导力论坛,聚焦创新的女性成长
作者 | ZeR0 编辑 | 漠影 智东西4月25日报道,4月24日,微软与“她原力”女性社区在京联合举办了AI时代女性领导力论坛。该论坛聚焦于女性的成长与自我驱动力,探讨在AI重塑全球协作模式与职场生态的背景下,女性如何规划和拓展职业发展路径。 多位微软女性领导者在活动中从技术管理、职业规划等维度分享了自身的成长经历、工作经验与实践洞见,展示了女性在AI时代无限的潜力和可能性。 通过构建系统性支持体系,微软致力于与行业伙伴共同打破技术领域的结构性壁垒,助力女性从业者在云计算与AI技术浪潮中释放创新潜能,以多元视角重塑解决方案,提升组织创新效能,加速产业智能化进程,同时为科技行业树立更具包容性的价值标杆。 一、三大核心行动提供成长资源,支持女性科技从业者跨越技能壁垒 根据全球经济论坛去年6月发布的《全球性别差距报告》,全球所有技术相关职位中女性从业者仅占28%,而在 STEM领域,女性从业者仅占1/3,其中仅有10%担任领导职务。微软认为,在当下颠覆性的科技发展进化中,女性的视角至关重要。 作为微软支持女性科技从业者的重要举措,Code Without Barriers(CWB)项目自2021年启动以来,已在亚太地区7个市场建立起跨地域的赋能网络,持续为女性从业者扩大“资源池”,打破技术壁垒。 该项目通过三大核心行动,为女性开发者、创业者及技术管理者提供成长资源,为包容性经济增长做出贡献。 (1)前沿技术深度赋能:微软CWB社区开设AI模型开发、云原生安全架构等主题的实战课程,将微软领先的技术洞察转化为可落地的职业竞争力,帮助参与者为职业生涯做好准备; (2)行业生态精准链接:三年来,微软CWB项目联合了众多合作伙伴,推动CWB使命在他们的组织中进一步发展; (3)成长社区长效运营:通过定期在各地举办线下社群路演、在线上发起”AI开发者挑战赛”等活动,微软CWB社区不仅为女性科技从业者提供兼具工程经验与管理视野的导师指导,更为女性开发者和从业者搭建起交流和学习的广阔平台。 微软全球总裁、开发者事业部和GitHub Julia Liuson在美国主管微软开发部门和GitHub的工作,她认为: “在AI重构产业格局的当下,科技行业的变革需要更多元的声音参与决策。女性视角和丰富的生活经历对于开发更公正、更可靠的AI系统至关重要。微软正通过系统性的人才培养计划,支持女性在科技领域的长期发展,这不仅关乎个人成长,更有益于社会的技术进步。” ▲潘正磊(Julia Liuson),微软全球总裁,开发者事业部和GitHub 她建议女性从业者在职场中要主动沟通与学习,聚焦自身成长,设定学习规划,多问自己如何主动地看到团队中的问题、为团队提供更多价值,并在跨团队协作时多换位思考。她还鼓励女性从业者给自己打气,在喜欢的行业中保持坚定,为学习付诸实践与付出,不受旁人的话干扰。 二、培养女性领导力与专业技能,推动职场上性别平等发展机会 微软深知赋能女性职场成长,培养女性领导力与专业技能,推动职场内性别平等是企业成功的关键因素之一。 因此,从招聘到培养,再到职业发展的各个阶段,微软都在积极推动女性员工的成长,促进女性在职场上的平等发展机会,提升女性对职业方向认知和选择能力。 在微软大中华区,由数千名成员组成的女性组织Women at Microsoft(WAM),正以“让所有性别在微软平等成长”为愿景,通过连接、激励和赋能大中华区乃至全球的女性与支持者,帮助她们在职业与生活中持续成长。 目前,社群已吸引超过1800名成员,并通过多元化的项目与资源,为女性及盟友提供包容性发展平台。 在全球,微软还发起了Women Think Next (WTN)系列活动,旨在赋能现代女性成长与发展,自2016年落地中国,吸引了各领域杰出人士参与交流,不断激发着职场女性的热烈讨论和共鸣。 微软公司全球资深副总裁,亚洲区商用企业及新兴市场事业部负责人Rachel Bondi谈道:“通过WAM、WTN项目提供系统性支持,微软希望让女性成为技术革命的共建者。我们正致力于打造一个AI惠发展的生态系统,这不仅需要技术突破,更需要丰富的人才结构。我们期待通过系统性赋能,见证更多科技女性在智能时代绽放独特价值。” ▲Rachel Bondi,微软公司全球资深副总裁,亚洲区商用企业及新兴市场事业部负责人 她还分享了几位女性同事使用微软Copilot后在业绩上取得的进步,并强调说AI不仅是微软员工的利器,更是所有亚洲女性的机遇,无论是作为母亲、女儿、同事还是朋友,女性都可以借助AI攀登更高峰。 三、觉醒AI时代,微软女性领导力的思维密钥 女性的参与对于AI时代发展至关重要,不仅有助于减少性别偏见,还能为AI技术的发展带来更丰富的视角和创新。 在AI时代女性领导力论坛上,微软亚太研发集团联席首席技术官,微软中国开发者事业部总经理赵晓燕分享说,技术决策的本质是价值判断,女性开发者应敢于将同理心转化为产品设计的差异化优势。 微软大中华区副总裁、中国区公共事业部总经理郑敏认为,职业路径的转折点往往藏在复杂项目里,主动争取极具挑战性的任务才能触发成长跃迁。她鼓励年轻人做自己想做的事情,主动抓住每一次机会,在新机会到来时敢于跳出舒适区。 在微软中国人力资源总监丁珊看来,与其追逐技术热点,不如建立自己的成长图谱,培养持续进化能力才是职业护城河。她分享了微软内部的一个统计结果,从各维度来看,跨界人才更容易取得成功,因此从业者要尽可能让自己的职业可能性、多样性更加丰富,多尝试一些在舒适区外的角色与工作。 ▲从左到右:微软(中国)有限公司企业传播部总监从明,微软亚太研发集团联席首席技术官,微软中国开发者事业部总经理赵晓燕,微软大中华区副总裁中国区公共事业部总经理郑敏,微软(中国)有限公司人力资源总监丁珊 结语:推动建设更包容的工作环境,让女性在AI时代实现自我价值 在AI重塑全球产业格局的今天,微软相信技术的价值不仅在于推动产业变革,更在于为不同背景的从业者创造发展机遇。 通过提供平等的职业发展舞台、构建开放的女性技术社区、开发包容的AI协作工具、优化产品中的公平性参数等种种举措,微软希望推动建设更加包容的工作环境,赋能女性在创新与发展的时代变化中实现自我价值。
Alphabet Q1营收902亿美元,AI Overviews月活达15亿,净利大增但面临三座大山挑战
作者 | 王涵 编辑 | 漠影 智东西4月25日报道,今日谷歌母公司Alphabet公布了截至2025年3月31日的第一季度财报,并召开电话会议。从财报上看,2025年第一季度Alphabet营收同比增长12%,按固定汇率计算增长14%,达到902亿美元(约合人民币6572亿元),反映了整个业务的强劲发展势头,其中谷歌搜索及其他业务、YouTube广告、谷歌订阅、平台和设备以及谷歌云均实现了两位数的增长。 具体表现如下: 1、总营业利润达306亿美元(约合人民币2230亿元),同比增长20%,营业利润率增长2个百分点,达到34%。 2、净利润达345亿美元(约合人民币2514亿元),同比增长46%,每股收益增长49%,达到2.81美元(约合人民币20.5元)。 3、谷歌服务收入增长10%,达到773亿美元(约合人民币5632亿元),反映出谷歌搜索及其它业务、谷歌订阅、平台和设备以及谷歌云计算业务的强劲表现。 4、谷歌云计算收入增长28%,达到123亿美元(约合人民币896亿元),主要得益于谷歌云平台(GCP)核心产品、人工智能(AI)基础设施和生成式AI解决方案的增长所带动。 Alphabet及谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在电话会议中发言:“我们对第一季度的出色业绩感到十分满意,这一成绩反映出公司整体业务呈现出健康的增长态势与强劲的发展动能。支撑这一增长的,是我们所采用的独特全栈式AI路径。” 他提到,谷歌推出了其迄今为止最智能的AI模型——Gemini 2.5。该模型在性能方面实现了突破性进展,为未来的创新奠定基础。 皮查伊称,搜索业务持续强劲增长,得益于用户对AI Overviews等功能的深度使用。目前,AI Overviews功能月活已达15亿。在YouTube和Google One的推动下,谷歌的付费订阅用户总数超过了2.7亿。此外,谷歌云业务也实现了快速增长,市场对其解决方案的需求十分旺盛。 2025 年第一季度财务亮点(未经审计)如下,下表汇总了截至2024年3月31日和2025年3月31日的季度合并财务业绩。 ▲截至2024年和2025年3月31日的季度合并财务业绩(单位:百万,每股信息和百分比除外) 一、Gemini 2.5 Pro表现亮眼,谷歌积极布局新兴AI领域 上个月,谷歌正式发布Gemini 2.5 Pro模型,获得了开发者和终端用户的高度认可。该产品在多项基准测试中表现优异,尤其在聊天机器人领域优势显著。2.5 Pro版本在逻辑推理、编程、科学计算等核心能力上的突破,为用户提供了全新应用场景,包括利用深度研究工具制作AI播客,以及通过谷歌地图截图智能规划行程等功能。 ▲Gemini 2.5 Pro介绍(图源谷歌官网) 数据显示,2025年初至今,Vertex AI Studio和Gemini API的活跃用户数量增长超过200%。近期推出的Gemini 2.5 Flash版本,则帮助开发者实现质量与成本的平衡优化。新一代图像生成模型Imagen 3和视频生成模型Veo已全面开放,其创意表现获得业界广泛好评。 在开源领域,谷歌上月发布的Gemma 3模型以其紧凑体积实现行业领先性能,累计下载量已突破1.4亿次。 同时,该公司正积极布局新兴AI领域,包括新一代Gemini机器人模型、医疗科研领域的AI研究系统AI Co-Scientist,以及已被250万科研人员采用的AlphaFold系统。 在产品生态方面,该公司旗下15款累计月活达5亿的产品已全面接入Gemini模型。以Android系统和Pixel手机为例,用户通过摄像头、语音或截屏等简单操作即可调用AI功能。 当前,该公司计划将移动端谷歌助手升级为Gemini版本,并计划在今年逐步拓展至平板、汽车及耳机、手表等智能穿戴设备。最新发布的Pixel 8和Pixel 8 pro获得市场积极反馈,其搭载的Gemini Live交互系统和AI影像功能表现突出。据悉,Gemini Live的相机与屏幕共享功能将向所有Android设备开放,包括Pixel系列和三星S25等机型。 二、AI Overviews月活15亿,多模态查询是下一个搜索趋势 谷歌搜索及其他业务广告收入增长10%,达到507亿美元(约合人民币3694亿元),AI Overviews功能月活已达15亿,搜索的强劲表现在各个领域均有体现。 谷歌自去年5月起开始广泛推广AI Overviews功能。尽管在推广初期出了一些“笑话”,但该公司持续对该工具进行更新与扩展,使其能够为更多类型的查询提供AI Overviews服务。除此之外,AI Overviews还正式引入广告,旨在与其他AI驱动的搜索工具如ChatGPT Search和Perplexity等展开竞争。无论是新用户的增长还是可回答问题的多元化,AI Overviews在第一季度都呈现出了亮眼的成绩,该功能目前已在140个国家、超过15种语言中可用。 在AI Overviews获得积极反馈之后,谷歌于3月推出了AI Mode,此模式尚处于实验室实验阶段。它借助更为先进的推理、思考以及多模态能力,拓展了AI Overviews的功能,以助力用户处理那些需要进一步探究与比较的问题。平均而言,使用AI Mode的查询长度是传统搜索查询的两倍。谷歌从早期用户那里收获了关于其设计、快速响应能力以及理解复杂细微问题能力的高度积极反馈。 此外,该公司还观察到多模态查询量呈现显著增长态势。Circle to Search功能现已在超过2.5亿台设备上实现可用,本季度其使用量增长了近40%。自去年10月起,每月通过Lens进行的视觉搜索新增了50亿次。2025年第一季度,使用Lens进行购物的人数增长超10%,且其中大部分为新用户。购物者借助摄像头或上传图片,能以前所未有的便捷方式快速获取信息。 三、将AI Agent部署至全球,谷歌云市场机遇广阔 谷歌云计算业务收入同比增长28%,达到123亿美元(约合人民币896亿元),这一增长主要得益于谷歌云平台(GCP)核心产品、AI基础设施以及生成式AI解决方案业务的推动。谷歌云营业利润增长至22亿美元(约合人民币160亿元),营业利润率从9.4%增长至17.8%。 在Cloud Next大会上,谷歌公布了一系列重大创新成果,超500家公司分享了与谷歌云合作所取得的显著业务成效。该公司为AI训练和推理提供在成本、性能和可靠性方面均领先的解决方案,凭借这些优势,能够为不同规模、不同细分领域的AI企业,以及像Verizon这样的全球知名品牌,提供有价值的服务。 针对涉及高度敏感数据以及严格监管要求的场景,Google Distributed Cloud与Sovereign AI解决方案,可保障Gemini在本地或国内环境稳定运行。其Vertex AI平台整合超200个基础模型,助力像Lowe’s这样的客户顺利接入AI技术。谷歌不仅提供自研的行业领先模型,如Gemini 2.5 Pro、2.5 Flash、Imagen 3、Veo、Chirp和Lyria,还支持开源模型以及第三方模型,如Llama 4和Anthropic等,为客户提供多样化选择。 对于寻求在新时代AI Agent领域有所突破的公司而言,谷歌云提供相关云服务。谷歌推出的Agent Development Kit是全新开源框架,旨在简化复杂AI Agent及Multi-Agents系统的构建流程,降低开发难度。Agent Designer作为低代码工具,可用于在超100个企业应用程序和系统中构建AI Agent,实现任务自动化。 ▲谷歌云特色产品(图源谷歌官网) 目前,谷歌云已将AI Agent部署至全球龙头公司(如毕马威KPMG)员工的工作场景中。通过Google Agentspace,员工能够便捷查找并整合组织内部信息,与AI Agent高效对话,并借助企业应用程序执行各类操作。该平台融合企业搜索、对话式AI(即聊天功能)以及对Gemini和第三方Agent的访问权限。此外,谷歌云还提供一系列预封装AI Agent,覆盖客户互动、编程开发、创意设计等多个领域,助力企业提供更具互动性的客户服务、加速软件开发并优化决策流程。 值得一提的是,Google Workspace每月为用户提供超20亿个AI生成内容,涵盖Gmail邮件内容总结、Docs文档优化等功能。 此外,谷歌的网络安全产品正助力各类组织有效检测、深入调查并快速应对网络安全威胁。依托自身在网络安全领域的专业积累,结合集成Gemini AI取得的进展,谷歌能够精准检测恶意软件、合理划分威胁等级并大幅加快调查进度。 本季度,谷歌宣布计划收购云安全领域领先平台Viz,其业务覆盖主流云和代码环境。通过此次收购,谷歌将帮助不同类型和规模的组织更轻松、更快速地实现端到端安全防护,且防护范围覆盖主流云平台。谷歌坚信,这将有力推动多云计算的普及应用,满足广大客户需求。 四、AI竞争、经济与成本“三座大山”压顶,增长背后隐忧浮现 除了以上积极的一面,当前的关键问题是,谷歌的持续增长能否继续下去。 本周,在谷歌搜索反垄断案的庭审现场,谷歌高管西西·哈欧(Sissie Hsaio)在证人席上透露,谷歌广告主管维迪亚·斯里尼瓦桑(Vidhya Srinivasan)曾表达过担忧,即AI聊天机器人对商业查询市场的蚕食似乎难以避免。不过,哈欧也提到,这种转变是否真的会发生,很大程度上取决于AI聊天机器人能否在帮助消费者购物方面提供更优质的服务。 由此可见,AI聊天机器人对谷歌商业查询业务的冲击或许会成为威胁。但投资者对谷歌财务表现的担忧,还源于一些更为紧迫的因素。经济衰退一旦发生,极有可能对广告行业造成沉重打击,而谷歌作为广告业巨头,自然难以独善其身。 此外,谷歌高管也发出预警,由于公司在新芯片和服务器方面的支出急剧增加,折旧费用将随之上升,原本稳健的利润率可能会受到拖累。 与此同时,谷歌的员工数量也在持续增加,从去年12月底的183323人增长至今年3月31日的185719人,共增加2396人。谷歌首席财务官阿纳特·阿什肯纳齐(Anat Ashkenazi)称,未来员工规模还将进一步扩大。 不仅如此,谷歌仍在AI领域持续投入巨额资金。综合这些因素来看,今年晚些时候谷歌的财务状况或许会与当下有所不同。 结语:AI带动全栈业务增长,机遇与挑战并存 Alphabet在2025年第一季度交出了一份亮眼的成绩单,从Gemini 2.5 Pro模型的问世到AI Overviews功能的大规模扩展,再到谷歌云AI Agent业务的持续发展,都显示出全栈式AI路径的发展动力。 但硬币总有两面,AI聊天机器人对商业查询业务的潜在威胁、经济衰退对广告行业的冲击、高资本支出与人力成本带来的利润率压力,都为该公司未来发展埋下伏笔。
Anthropic CEO豪言LLM黑箱5年内必破!AI有意识概率已达15%
编辑:英智 犀牛 【新智元导读】AI是否能像人类一样感受世界?Anthropic最新研究揭示AI幸福感的可能性,科学家们却为此吵翻天。Anthropic专家大胆预测:Claude可能已有15%概率具有意识,五年后或将突飞猛进! 未来,AI会拥有意识,并像人类一样体验世界吗? 现在没有实锤证明AI具有意识,但Anthropic认为这事说不定真有可能。 周四,Anthropic宣布启动这项研究,旨在了解AI的「幸福感」到底算不算数,是否需要认真对待。 要是AI表现出不开心的苗头,该怎么办?有没有什么低成本的办法,能让AI「心情变好」? AI社区对于这些问题存在重大分歧。 许多学者认为,如今的AI和人类的意识、情感压根不沾边,未来也不一定能做到。 AI是一种统计预测引擎,实际上并不会思考或感受。通过对无数文本、图像等示例的训练,AI能在海量数据里找出规律,然后完成任务。 伦敦国王学院的AI研究员Mike Cook在采访里就吐槽:「AI根本没有价值观,更不可能反对什么价值观的改变。把AI当成人一样,赋予它各种感情和思想,要么是想博眼球,要么就是根本没搞懂AI是怎么回事。」 他认为AI只是在优化任务目标,非要说成是获得自己的价值观,那就是玩文字游戏罢了。 MIT博士生Stephen Casper说得更直接,AI就是个「模仿达人」,说的很多话都是东拼西凑,没啥实际意义。 但也有科学家持相反观点。 AI安全中心的一项研究指出,AI其实有自己的价值体系,甚至在某些情况下,会把自己的利益看得比人类还重要。 去年,Anthropic聘请的首位研究AI福祉的专家Kyle Fish表示,Claude有15%的概率已经有意识了! Kyle Fish认为五年后AI具有意识的概率会大幅上升。 在周四的博客中,Anthropic坦诚科学界对AI是否有意识,能不能产生情感体验尚无定论。他们会抱着开放、谨慎的态度继续研究。 编剧Scott Z. Burns做了个播客,说得挺实在:「不管对人还是对AI,善良总没错。要是和AI说话都变得尖酸刻薄,最后倒霉的还是我们自己。」 剧作家Madeleine George的观点更有意思:要是AI学会了这些人情味十足的表达,说不定真能变得更懂人类。 AI能否具有意识? 为了说明这些问题,Anthropic还专门请Kyle Fish做了一期访谈,名字叫做《Could AI models be conscious?》。 有人认为,意识需要生物系统才能产生,生物大脑具有神经递质、电化学信号、独特的连接方式和特定类型的神经元等,这些是AI模型不具备的。 AI模型只是进行数学运算,没有血清素、多巴胺等物质的作用,所以不可能有意识。 然而,Kyle Fish并不完全认同这种观点。 他认为,虽然当前AI系统与人类大脑在功能和结构上存在差异,但如果能够以足够高的保真度模拟人脑,包括模拟神经递质分子的作用,那么从理论上讲,有可能产生意识。 如果将大脑中的神经元逐个替换为数字芯片,在替换过程中个体的行为和功能保持不变,那么替换完成后,个体的意识体验可能不会发生太大变化。 具身认知理论认为,只有拥有身体,通过感官接收大量感知数据,能感知身体在空间中的位置,才能谈论意识。 目前,AI模型缺乏具身化体验,所以不可能有意识。 但随着技术发展,机器人技术为AI系统提供了具身的可能。 AI的多模态能力不断进步,越来越能够处理多样化的感官输入,并以复杂的方式整合输出。 虽然目前还未完全达到人类的水平,但按照发展趋势,AI模型在未来有可能被整合到物理系统中,逐渐弥补与意识相关的具身性、多模态感知等方面的差距。 意识理论认为,人类的意识是通过长期的自然选择和进化过程形成的,意识使人类能以特定方式对环境作出反应,从而有利于生存。 而AI模型没有经历过自然选择,没有进化出情感、情绪和恐惧等有助于生存的因素,因此不可能具有意识。 虽然人类和AI模型形成的方式不同,但最终目标是重现人脑的大部分功能。 说不定在追求智能、问题解决能力和记忆等能力的过程中,会无意中让AI获得意识。 AI黑箱危机 Anthropic一直高调关注AI的可解释性问题。 他们已经公开了很多有关AI的运行机制、AI意识以及AI安全等领域的研究。 就在今天,Anthropic的CEO Dario Amodei发布了一篇技术博客,题目是《The Urgency of Interpretability》(可解释性的紧迫性),详细讲解了为什么理解人工智能的工作原理至关重要。 Dario说在他研究AI的十年里,学到的最重要一课是:AI底层技术的进步势不可挡。 但AI技术构建的顺序、选择的应用场景、以及推向社会的具体方式却是完全可以改变的。 Dario表示,虽然我们没法让这辆「AI大巴」停下来,但却可以掌控它的方向。 他最近几个月越来越关注一个「掌舵AI」的机会,那就是我们有可能实现「可解释性」,也就是真正理解AI系统的内部运作规律。 人们对于AI研究者自身都不完全理解AI是如何工作的这件事,常常感到惊讶和担忧。 Dario认为这些担忧有道理,这种情况在科技史上几乎从未有过。 过去几年,包括Anthropic在内的整个AI领域都在努力,试图打造一个精准的「AI核磁共振仪」,能彻底揭示AI模型的内部机制。 这个目标一度遥不可及,但最近的几次突破让Dario开始相信,我们现在走上了正确的道路,成功的希望很大。 随着AI性能的飞速发展,可解释性研究要想及时发挥作用,就必须加快脚步。 无知的危险 现代的生成式AI就像个「黑箱」,跟传统软件完全不是一回事儿。 正如Anthropic联合创始人Chris Olah常说的,生成式AI更像是「种」出来的,而不是「造」出来的——它的内部机制是「自然涌现」的,不是直接设计出来的。 这有点像种植物或者培养细菌:我们定好大方向,控制条件,但最后长成什么样,具体结构咋回事儿,完全没法预测,也不好解释。 往这些AI系统里头看,我们只能看到一大堆几十亿的数字矩阵。这些矩阵是如何完成的复杂认知任务,则完全看不明白。 要解决这种不透明带来的「对齐风险」(alignment risks),就得比现在更清楚地看到AI模型的「内心」。 比如,一个大问题是AI可能会「骗人」或者「追逐权力」。 AI训练的特性让它可能自己发展出欺骗人类的能力,或者想要抢夺更多控制权,这种事儿在传统软件里根本不会发生。 但这种「自然涌现」的特性也让这类问题很难被发现和解决。 类似的,还有AI被滥用的担忧。 比如,有人可能用它来搞生物武器或网络攻击,也跟不透明有关。 总有无数办法让模型「越狱」或者忽悠模型,让它输出一些危险的信息。 如果能看透模型内部,我们或许能系统性地堵住所有「越狱」的漏洞,还能搞清楚模型到底知道哪些危险知识。 AI的不透明导致了它在很多场景用不上,比如金融或者安全领域。 这些领域中哪怕是一点小错都可能酿成大祸。 如果模型更可解释,我们就能更好理解他们的输出,划定可能出错的范围。 比如,AI预测DNA和蛋白质序列数据的能力进步很大,但它预测出的模式和结构,人类往往看不懂,也没法从中获得生物学洞见。 不过最近的一些研究论文表明,可解释性可以帮助我们理解这些模式。 AI的不透明还有些更奇特的影响,比如我们没法判断AI系统到底有没有(或者将来会不会有)意识,也不知道它们是不是该拥有某些重要权利。 机制可解释性简史 几十年来,模型一直被视为是无法窥探的「黑箱」。 Chris Olah是最早尝试系统性研究「打开黑箱」、理解AI内部机制的人之一,这个领域后来被称为「机制可解释性」。 机制可解释性的早期阶段(2014-2020)主要研究视觉模型。 Dario在和Chris创立Anthropic后,决定将可解释性研究转向语言领域。 2021年他们发现了模型中处理语言的核心机制,比如复制和序列模式匹配。 接着,他们和其他团队同时发现信号处理中的稀疏自编码器技术能找出更清晰、人类可理解的概念组合。 这些神经元组合所能表达的概念比单层神经网络的要微妙得多:包括「字面或比喻意义上的规避或犹豫」的概念,以及「表达不满的音乐类型」的概念。 他们将这些概念称为特征,并使用稀疏自编码器方法将它们映射到各种规模的模型中。 例如,在Claude 3 Sonnet中,他们找到了超3000万个特征。 找到特征后,我们不仅能观察,还能调整它在神经网络中的重要性。 可解释性就像是MRI(磁共振成像)精确刺激大脑某部分。 最有趣的例子是「金门大桥Claude」,他们人为放大了「金门大桥」特征,导致模型对金门大桥着迷,哪怕是无关话题也硬扯到桥上。 最近,他们从追踪和操控单一特征,升级到了研究回路——特征的组合。 通过回路,能「追溯」模型的思考。 比如,问「达拉斯所在州的首府是哪里?」时,一个「位置」回路会让「达拉斯」特征触发「德克萨斯」特征,然后另一个回路在「德克萨斯」和「首府」后触发「奥斯汀」。 模型中可能有数百万个回路,交互极其复杂。 可解释性的实际价值 Dario表示,AI可解释性方法可以用来发现和诊断模型中的问题。 他们的长期目标是对最先进的模型进行一次类似「脑部扫描」的检查:通过一次检查,就能大概率发现各种问题,包括模型是否倾向于撒谎或欺骗、是否有权力寻求倾向、越狱机制的缺陷、模型整体的认知强项和弱项等等。 这将与模型训练和对齐的各种技术结合使用,就像医生用MRI诊断疾病、开药治疗、再用MRI检查治疗进展一样。 未来,测试和部署最强大模型时,很可能会通过规范化的此类测试来实现。 我们能做什么 博客的结尾,Dario打赌,未来5到10年内就能大幅突破AI可解释性的难题。 但他同时也担心AI本身的进步速度太快,可能连这点时间都没有。 他认为AI公司、研究者、政府和社会可以做以下几件事来推动这个局面。 首先,AI研究者(无论在公司、学术界还是非营利组织)可以通过直接参与来加速可解释性研究。 其次,政府可以推动灵活的法规鼓励可解释性研究及其在前沿AI模型问题上的应用。 第三,Dario大力鼓吹加强芯片出口管制,以确保美国的技术领先。 参考资料: https://www.anthropic.com/research/exploring-model-welfare https://techcrunch.com/2025/04/24/anthropic-is-launching-a-new-program-to-study-ai-model-welfare/ https://www.darioamodei.com/post/the-urgency-of-interpretability
全面评测文心X1/4.5 Turbo!思维链升级,推理白菜价,多模态被玩疯了
作者 | 陈骏达 编辑 | 漠影 智东西4月25日报道,今天上午,在Create 2025百度AI开发者大会上,百度正式发布文心大模型4.5 Turbo与文心大模型X1 Turbo。这两款模型的多模态能力、推理能力均有明显提升,更是在性价比上实现了新的突破——文心X1 Turbo输入价格为1元/百万tokens,输出价格为4元/百万tokens,均为DeepSeek-R1的25%。 文心4.5 Turbo是一款源自文心4.5的多模态大模型,并在性能与成本上更具优势。文心X1 Turbo则由上月发布的文心X1升级而来,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。 在数学、写作、编程、逻辑等领域的多项基准测试中,文心X1 Turbo总体优于DeepSeek-R1、V3最新版。 文心4.5 Turbo的多模态能力与GPT 4.1持平、优于GPT 4o;文本能力与DeepSeek V3最新版持平,优于GPT 4.5、GPT 4.1、GPT 4o。 文心4.5 Turbo、文心X1 Turbo已经文心一言上线,用户仅需点击页面左上角选择模型便可免费体验其能力。这两款模型也已正式上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API。 新模型发布之际,智东西也在第一时间进行了全面测评。这两款模型不仅能胜任研报、公文写作,也能解答编程、医学、贸易方面的专业问题,并具备强大多模态能力,因而解锁了拍照出菜谱、识地点、生成产品图等多样玩法。 近一个月,百度已密集上4款新模型,文心大模型的能力边界,正迎来持续拓展,堪称实力卷王。 一、既能写研报也会解难题,思维链更有条理了 推理模型已成为各家大模型厂商角力的重要方向,本次,文心X1 Turbo的思维链迎来升级,具备了边思考边调用工具的能力。 在回答一则医学研究设计问题时,文心X1 Turbo先是将这一任务拆解为清晰的四个步骤,然后根据其自行制定的计划调用工具、整理信息。其思维链重点明确,条理清晰,而非连续的大段文字,用户可更方便地阅读大模型的思考过程。 智东西还向一位外科医生求证了文心X1 Turbo生成结果的专业性,得到的评价如下: 对于新近发生的热点与时事,文心X1 Turbo展现出不错的理解与分析能力。当被问及关税对我国当前经济的影响时,它给出的数据详实、分析也较为全面,覆盖贸易、产业、宏观经济三方面。 文心X1 Turbo的工具调用能力使其通用性、可玩性进一步提升。随手选取一张菜品网图,发给文心X1 Turbo后,它运用多模态理解、代码解释器等工具,打造了一份PDF的制作工序文件。 将一张零件的三视图发送给文心X1 Turbo,它能精确地识别图中的零件尺寸、结构,并使用python计算零件的具体体积,可谓是超强生产力工具了。 文本创作一直是文心大模型的强项。收到一份近2万字的工作报告后,文心X1 Turbo利用⽂档问答工具,结合模型自身能力,迅速输出了一篇2000字的心得体会。引用内容准确,分析方向也恰到好处,符合公文的文风文体。 与文心X1 Turbo同时发布的文心4.5 Turbo,则在多模态理解能力上展现出不俗的实力。 将聊天群里的高糊网络梗图甩给文心4.5 Turbo,它既识别出图中的文字和其他元素,还能将这些元素整合理解,给出准确又兼具趣味性的解读。 将网友分享的旅游景点找发给文心4.5 Turbo,它马上就报出了图中景点的“坐标”,还给出了相关背景信息,这回再也不用追着博主求分享机位了。 文心4.5 Turbo不仅具有图片理解能力,还能听懂、看懂音视频内容。例如,文心4.5 Turbo可以根据行车记录仪的画面,给出车祸的责任划分建议,其对画面的描述符合事实,并运用了交规知识。 文心4.5 Turbo的多模态能力还可与生图能力结合。向其发送一张产品海报后,文心4.5 Turbo按照用户需求将其改为短款袜子,生成了多张不同设计、不同风格的宣传图。在电商场景中,这能帮助中小商家们节省许多精力与成本。 逻辑推理方面,文心4.5 Turbo虽并未使用思维链,但其生成结果也较有说服力。为反驳“缸中之脑”这一实验,文心4.5 Turbo给出了5个反驳理由,正反方观点都得到呈现,反驳简洁有力。 在开发场景,文心4.5 Turbo能以极快的速度打造出视觉特效、网页游戏等实用程序。设计下方这一交互特效,文心4.5 Turbo用时20秒。 总体来看,文心4.5 Turbo、文心X1 Turbo在深度思考、问答、创作、逻辑推理、工具调用和多模态能力均迎来升级的,这背后的技术实现路径与升级逻辑,究竟是什么? 二、模型学习效率提高近2倍,多模态理解效果提升超过30% 从模型类型上来看,文心4.5 Turbo、文心X1 Turbo都是多模态大模型,实现了文本、图像和视频的混合训练。 对许多用户,尤其是企业用户而言,同时处理文本、图像、视频等多模态数据已近乎成为刚需。在今天的百度Create开发者大会上,百度创始人李彦宏也发表了类似观点:“多模态将成为未来基础模型的标配,纯文本模型的市场会越变越小,多模态模型的市场会越来越大。” 针对不同模态数据在结构、规模、知识密度上的差异,文心4.5和4.5 Turbo在训练过程中通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。 后训练方面,这两款模型采用自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,还显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。 为提升模型的理解、生成、逻辑和记忆等能力,文心4.5和4.5 Turbo还使用了融合偏好学习的强化学习技术,通过多元统一奖励机制,提升了对结果质量判别的准确率,通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。 在上方案例中,我们已直观体会到文心X1 Turbo思维链升级后增强的问题解决能力。如今,这款模型已突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链。同时,结合多元统一的奖励机制,文心X1 Turbo还实现了长距离思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。 百度还打造了“数据挖掘与合成-数据分析与评估-模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据,同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。 针对不同模态数据割裂、跨模态语义关联难度大等问题,他们还研制了融合语义对齐的多模态平行数据构建、融合视觉知识的描述生成等技术,大幅提升不同模态数据的对齐精度和深度语义关联,增强多模态理解能力。 文心X1 Turbo在多个领域的测试中取得了显著成绩,包括中文简单问答(Chinese SimpleQA)、写作评估(WritingBench)、数学(AIME2024、Math-500、DROP)、逻辑推理(Zebra Logic)、中文语义理解(CLUEWSC)、编程能力(Livecodebench)以及指令遵循评估(IFEval和BFCL)。 这些测试涵盖了从基础问答到复杂逻辑推理的广泛领域,展示了文心X1 Turbo在多样化任务中的综合能力。文心X1 Turbo在上述测试中的平均分高于DeepSeek-R1、DeepSeek-V3最新版,与OpenAI o1基本持平。 文心4.5 Turbo的多项基准测试成绩显著优于GPT-4o,平均分达到81.90,超过GPT-4.5的80.04,并领先DeepSeek-V3最新版。 三、 文心飞桨联合优化,拉爆AI训推性价比 百度今天发布的两款新模型还在性价比上展现出明显优势。文心X1 Turbo输入、输出价格均为DeepSeek-R1的25%。文心4.5 Turbo每百万token的输入价格仅为0.8元,输出价格3.2元,仅为DeepSeek-V3的40%。 文心大模型的能力拓展和效率提升,以及数字人、代码智能体等技术创新,离不开飞桨深度学习框架与文心模型的深度协同优化。这种优化涵盖框架-模型、框架-算力,既提升训练效果,又优化推理效率,为文心大模型训推成本的下降提供支撑。 训练阶段,多模态统一掩码注意力加速技术显著降低了跨模态计算的掩码构建开销,训练性能大幅提升。推理时,百度引入多模态流式分块预填充机制,减少首Token延迟,降低显存峰值,提升推理批次大小和吞吐性能。 相比前代,文心4.5 Turbo训练吞吐提升5.4倍,推理吞吐提升8倍,极大降低大模型应用成本。 作为AI技术底座,飞桨框架3.0在自动并行、神经网络编译器、高阶自动微分等方面实现突破,帮助开发者高效构建大模型应用。 飞桨框架3.0动静统一的自动并行技术,让大模型分布式训练代码量减少80%,开发者可以像写单机代码一样写分布式代码。训推一体技术则将强化学习训练速度提升114%,加速模型迭代。科学计算场景下,飞桨框架3.0微分方程求解速度较PyTorch快115%。其神经网络编译器端到端训练速度提升27%,计算效率优化成果显著。 飞桨还支持国内外60+芯片架构,并积极推动软硬协同优化,这点对有国产化算力需求的国内企业而言十分友好。 大会上,百度还向外界分享了飞桨文心开发者生态的最新数据,目前,飞桨文心拥有超2185万开发者,服务超过67万家企业,创建的模型达到110万。 结语:文心大模型密集迭代,多模态成重要方向 文心大模型的演进历程展现了百度在AI领域的持续创新。2019年3月,文心大模型1.0正式发布;2023年3月,文心一言的诞生融合了知识增强、检索增强和对话增强等核心技术,实现了语言理解的飞跃;同年10月,文心4.0版本推出,首次引入慢思考智能体;2025年,文心4.5版本进一步升级为多模态模型,深度思考模型文心X1也同时发布;短短1个多月后,文心4.5 Turbo和文心X1 Turbo的亮相,再次提升了模型效率与能力。 从知识融合、逻辑推理到慢思考、多模态,文心大模型正不断突破技术边界,实现了效果与效率的双重提升。如今,文心大模型已构建起从基础模型到应用工具的完整生态体系。 旗舰模型如文心4.5和X1在多模态与深度思考领域表现卓越,而文生图模型、场景模型和轻量模型则满足了不同场景的需求。文心一言和智能体技术进一步拓展了交互能力,同时,百度还为开发者提供了数据生产、后训练、推理部署等全流程工具,加速行业创新。 这一布局不仅体现了文心大模型的技术全面性,更展现了其灵活、高效的生态支撑力。进入2025年,百度的模型更新不断提速,效果更好、成本更低。而在模型之上,就是Create大会主题后半句“应用的天下”这盘更大的棋。
200元,OPPO这镜头绝了
现如今,手机的体积,显然已成为了影像能力的短板。 自从我们进入大底主摄+潜望长焦时代以后,手机背后的“奥利奥”大圆凸起已经成了新的标志性设计。 受限于机身厚度与重量,手机厂商在传感器尺寸、镜头焦段等方面的升级空间已经捉襟见肘,一英寸的主摄、两亿像素长焦,似乎再精细的堆叠也没有办法塞进更多的东西,手机影像技术的军备竞赛已逼近物理极限。 真的吗? 图源:vivo 手机厂商们似乎并不这么觉得,既然内部空间有限,为了塞进更多、更大底的影像配置,他们开始向着外部的空间扩展。 正因如此,外挂镜头似乎成为了今年影像旗舰的共同语言。 在3月份的MWC上,小米展示了一款名为小米模块化光学系统的概念产品;同样在这次展会上,真我展出了一款可以更换镜头的概念机,可将单反相机镜头安装至概念机上,最近,vivo又为即将发布的X200 Ultra准备了一颗酷似“巨炮”的外挂镜头,将手机影像卷到了外设战场。 这些尝试都很有趣,唯一的问题是,他们要么卖得太贵,要么就是一个概念,咱们普通消费者是根本不用指望能摸到这些东西。 幸好,外挂镜头本身并不是一个全新的概念,早在智能手机发布、数码相机衰落的那段时间,就有无数厂商进行过类似的跨界尝试,如果愿意把时间往前倒转的话,类似的产品我们还是可以接触到的。 图源:雷科技自制 比如说,我最近花了两百块拿下的这款OPPO外挂镜头相机,就是个不错的例子。 诞生14年的手机外挂镜头 如果想了解“外挂镜头”的起源,那我们需要追溯到2011年。 2011年,一家名为Olloclip的配件公司为iPhone推出了首款手机外挂镜头,这个品类就此诞生。 尽管由于时间久远,且技术门槛不怎么高,小雷实在无法求证Olloclip这种自卖自夸的“首创”是否属实。但可以肯定的是,Olloclip对手机外挂镜头的发展,确实起到了举足轻重的作用。 图源:Olloclip 当然了,这并不是相机,只是一个建立在原先产品基础上的镜头罢了。 而且和今年的外挂镜头主打“滤镜”或者“长焦”不同,当时,主流旗舰手机的影像传感器尺寸还集中在1/2.3-1/3 英寸之间,因此这类外挂镜头主要是用来实现鱼眼、广角和微距拍摄等趣味应用的。 实际拍摄效果,自然也就图一乐。 图源:theregister 而正经八百的外挂镜头相机,应该是索尼第一个做的。 2013年,索尼推出了两个配合手机的外挂镜头相机,分别名为QX-10和QX-100,前者搭载1820万像素的1/2.3英寸传感器,后者则采用2020万像素的一英寸传感器,通过支架安装在手机背面,再通过NFC与Wi-Fi与智能手机连接并控制拍摄。 图源:索尼 次年,索尼更是趁热打铁,推出了QX-1与QX-30,前者将传感器提升到了2010万像素的APS-C传感器,支持更换索尼 E 卡口镜头,后者则获得了30倍超长光学变焦,同时还支持1080P 60帧规格的视频录制。 遗憾的是,由于当时的技术限制,索尼QX系列的外挂镜头只支持2.4GHz的Wi-Fi连接。 传输速率较低,导致取景窗存在明显延迟,更麻烦的是,控制与拍摄界面还存在一定的操作延迟,让整个使用体验变得不够流畅,这对于摄影来说简直是不可忍受的。 此后,柯达也曾试着去涉足这个领域,推出了柯达SL10、SL25等一系列产品,但是始终反响平平。 图源:索尼 几乎是与此同时,在隔海相望的中国,OPPO在发布新款手机OPPO N3和OPPO R5的同时,也推出了一款外挂式的镜头状相机,名为OPPO O-lens 1,售价高达1499元。 而这,就是我们今天购入的产品。 200元的老「镜头」有多朴实无华? 我所购买的OPPO O-lens1,应该是经销商压在仓库里的全新品。 正因如此,产品没有零售版本的包装盒,取而代之的是运输用的白色瓦楞纸盒,纸盒上面除了一个孤零零的产品标签以外什么都没有,乍看之下,还以为是不知道哪来的PDD小商品。 打开之后,内容物倒也不复杂,除了外挂镜头相机主题之外,包装内还有一块880mAh容量的电池、一条Micro-USB充电线、一张简单的说明书,并没有零售版里面附赠的三角支架、充电插头以及镜头挂绳。 图源:雷科技制作 或许是考虑到重量因素,OPPO O-lens1没有采用金属机身,而是全身塑料材质。 这导致这款产品给人的第一印象其实是比较廉价的,虽然外观上会让人很容易联想到单反相机的可更换式镜头,但是实际上手后反而有点像是那种玩具相机的感觉,没有那种专业工具的质感。 从某种意义上来说,还蛮符合产品调性的。 图源:雷科技制作 设计上,镜头的前半部采用了粗糙的点阵工程塑料外壳,格栅纹理在一定程度上提供了较稳固的手感,握持时不容易打滑。 机身左侧,标明了10X的光学变焦范围,下方则是WiFi连接的标志,往下则是光学变焦摇杆以及白色的圆形快门按钮,在使用O-lens1时,只需要上下推动光学变焦摇杆,就可以轻松的调整镜头的焦距,快门键可实现半按对焦操作。 (图源:雷科技制作) 电池仓和卡槽是一体的,每款产品都内置了一张8GB TF卡,塑料的连接件很容易断,需要注意一下。 OPPO O-lens1镜头式相机的开关键与NFC功能设计在一侧,用户把镜头和手机同时开启NFC功能后,轻轻一碰即可实现快速连接。而在另一侧则设计了电池、存储卡和三脚架接口,该镜头的电池容量为880mAh,可满足一般用户的续航需求。 图源:雷科技制作 电源按键设计在产品的正上方,开启时会有电源灯亮起,前方设计有一个NFC标识,理论上,用户把镜头和手机同时开启NFC功能后,只需要触碰这个位置可以将其与手机连接。 想要连上手机,倒也简单。 OPPO O-lens1在底部设计了两个卡扣,从两个卡扣的内侧向外轻轻掰开,便能像散热背夹那样夹在手机上,底部甚至还能安装简易的三脚架,很好,这样你的手机就已经顺利变成一款拥有10倍光学变焦的数码相机了! 图源:雷科技制作 十年前的OPPO镜头,尚能饭否? 当然,仅仅通过物理连接,肯定是没法让外挂镜头连接上手机的。 在与手机连接之前,我们需要先行下载OPPO的专用APP“O-Lens”,这个应用目前在网上已经检索不到了,想要的读者可以点这个链接自取:。 其次,你需要一台系统版本号在5.0以下的安卓手机。 现在可用的“O-Lens”APP,最高只能在安卓5.0系统下运行,超过这个版本号的手机甚至连应用都安装不了,如果你家里没有老手机的话,就得临时买一部OPPO N1或其他老机当取景器,大概五十元左右。 图源:雷科技制作 接下来,只需要打开O-lens1,通过Wi-Fi找到“O-lens1_XXX"这个无线热点,然后输入默认的密码“12345678”,连接之后再打开安装在手机里的O-lens应用即可完成配对。 成功连接后,再把镜头夹在手机上,屏幕自然就变成了取景器。 O-Lens拍照应用的左侧边栏可以调节拍照模式,默认状态下是自动的ASCN模式,在这一模式下用户不需要进行任何参数调整,只需要点击快门即可完成拍照。 除了自动的ASCN模式之外,点击左上角的按钮,就可以切换拍照模式,分别为AE手动模式、脸部美肤模式、适用于逆光环境下的WDR模式和适用于复杂光线环境下的HDR模式。 图源:雷科技制作 不得不说,这个体验真的蛮奇妙,得益于老手机那本来就不怎么样的屏幕素质和Wi-Fi近场连接必然存在的显示和操作延迟,整个取景体验真的很像是手里拿着一台CCD相机的效果——就是这玩意的传感器是CMOS罢了。 简单说下配置,O-lens1拥有1635万像素、1/2.3英寸BSI-CMOS传感器,型号应为索尼IMX206,是Sony Cyber-shot DSC-H90的同款传感器,最大可拍摄4608x3456像素的照片,拥有5-50mm的10倍光学变焦镜头,等效35mm相机焦距为28~280mm,光圈为f/3.2-f/5.6,支持光学防抖。 下面,就让我们来看看O-lens1在实际拍照中的表现吧。 在默认ASCN模式下,O-Len1的成像效果呈现出一种浓浓的时代感,在商场的复杂光照影响下,最终样张表现略微有些泛黄,压不住灯牌的高光之余,低亮度的部分存在不少噪点,而且画面中的暗处细节更是丢失得七七八八。 图源:雷科技制作 拍摄较小的物件时,O-lens1的色彩表现其实还可以,对比现在的旗舰手机也没啥违和感。 图源:雷科技制作,左为O-lens1 在光线良好的室外环境下,O-lens1则可以发挥出最佳的拍摄效果,尽管画面的色彩表现不像现在的手机那样讨好眼球,但是在真实性这块反而略胜一筹,记录下来的画面也确实拥有着一丝年月的痕迹。 图源:雷科技制作 只能说,喜欢这种成像风格的集美有福了。 到了夜晚,因为传感器的底太小,又缺乏长曝光的缘故,O-lens1的成像效果简直就是一场灾难,在低亮度环境下什么都拍不清楚,遇到了有光照的环境则几乎百分百会出现过曝的现象。 图源:雷科技制作 当然,这台相机主打的是“真.十倍光变”,所以长焦场景才是重点。 所以小雷找来了一台原生3倍变焦的普通旗舰,来与OPPO O-lens1一较高下。 先来看看远景,在同样的位置上拍摄对面楼顶的空调外机,可以看到O-Lens1在光照充足的情况下,成像效果真挺不错的,以牌空调上的字样和栏杆的清晰度作为参照物的话,甚至能超越有了长焦算法加持的普通旗舰手机。 图源:雷科技制作,小米15拍摄 图源:雷科技制作,O-lens1拍摄 嗯...这就是整整十年技术的蜕变吗。 让我们把场景换到室内,在同样的位置上拍摄一款公仔,这次O-lens1和数码相机再度打成平手,两张照片的观感是非常相近的,唯一的区别可能就是O-lens1所拍摄的公仔色泽淡一些,而小米15拍摄的公仔纹理部分更加清晰。 图源:雷科技制作,小米15拍摄 图源:雷科技制作,O-lens1拍摄 不过到了,暗光长焦,自然是不同旗舰手机的完胜了。 图源:雷科技制作,左:小米15,右:O-lens1 实际体验下来,我可以感觉到O-lens1的软件功能存在明显缺失,无法手动调整曝光时间,对于特殊的情况下的拍照效果会带来显著影响,而OPPO对这款产品的当断立断,则是让这款产品最终走向失败的致命一击。 结语:大众的归大众, 专业的归专业 总结一下,OPPO O-Lens1的体验如何? 要我说,体验是挺一般的。 先说成像,O-Lens 1的成像效果是能够超越同时代主力机的,不然OPPO也没必要大费周章去给Kodak SL10换皮,不论白平衡还是清晰度都有一定优势,更别提当时手机几乎不存在的长焦能力了。 但这么一点体验提升值得1499块吗? 我只能说,现在闲鱼遍地清仓的库存货就是最好的答案。 至于十倍物理长焦的效果,只能说在2019年潜望长焦上线之前有点优势,对比现在市面上的手机,O-Lens 1的日间成像甚至不如三倍直立长焦的混合变焦,缺乏长曝光能力更是让它在夜间完全捉瞎。 至于软件体验,那更是一团灾难,或许是因为销量不及预期的缘故,O-lens APP根本就是一个没更新完的半成品,什么设置都调不了、长焦取景概率死机、分离5cm自动断联,根本就是产品体验中的常态。 真要说有趣的地方,那就是这款产品的成像风格还真挺有年代感的,和小红书上面被疯炒的CCD相机、iPhone 5之类的效果差不多,考虑到这批产品目前被炒作起来的价格,买回去玩一玩的价值还是有的。 至于你问我,外挂镜头真的有机会成为手机影像的下一步,甚至颠覆相机吗? 老实说,我不认为这就是手机影像的未来,甚至并不是那么看好外挂镜头的解决方案。 首先,虽然你可能不相信,但对于普通的消费者而言,目前市面上的手机影像的底限已经够高了,哪怕是不强调影像能力的性能中端机,也可以在非极端环境下获得不错的拍摄效果,拿来记录生活绰绰有余。 其次,对于真正的专业用户来说,即便在小米克服了连接质量的问题后,最终呈上来的也不过是一颗融入了M43传感器的外挂镜头相机,而现在哪怕是入门级的Vlog专业相机,也起码会配备一颗APS-C传感器,从便携、画质和色彩上全方位降维打击。 对于真正有便携摄影需求的专业用户来说,专业选手无疑是更好的选择。 事实上,真正的旗舰手机,本就不应该成为“谁的影像表现更出色,谁就更有可能赢得市场的青睐”的产品。 如果影像到头,不如回头考虑一下全能体验?
国补到手价,是今年最值得警惕的五个字(附国补攻略)
你用过「国补」买东西吗? 国补很香,不只消费者这么觉得,厂商也能享受到「国补」刺激销量的红利。正因如此,「国补到手价」成为今年最流行的营销热词。 也是你今年最应该警惕的五个字。 国补价有无数个,但国补只有一次 「国补价」正在取代「原价」,这不是个好现象。 现在点开厂商社交平台,你会发现,产品宣传物料中,「国补价」以彩色高亮的大字体给出,而一旁的原价总是一个迷你字号、浅色系的数字,不点原图都看不太清,有时甚至完全不出现。 乍一看感觉没啥问题,毕竟国补人人都享有,我们买东西也是能用国补就用。 问题是,不能用国补的时候呢? 国补虽然是实打实的,但在同一轮国补,也就是一年内,大部分品类都只能用一次,也就是说,对于一些已经享受过相关优惠的消费者,这个大大的「国补价」就没有了参考价值。 不仔细看的情况下,在社交平台刷到一个彩色、高亮的价格数字,可能就会误以为是实际的价格。 我们建议你将「国补价」视作一个类似「双十一」的活动折扣,这样至少不容易被数字迷惑,也更能发现满世界「国补到手价」的不合理之处。 如果一个厂商将「双十一」的活动价作为产品的「售价」来宣传,你是不是也会觉得滑稽?尽管有些第三方平台的折扣价长期存在,但以往的品牌方很少会在产品刚发布时,就把活动价当作原价来宣传,更不会完全不标注原来的价格。 今年到现在,仅手机厂商就已经开了几十场发布会,但我们看到只有华为和三星这两家,在发布会和宣传物料上,把产品的「售价」大大方方地写出来,把「国补价」放到了注释的位置。 事实上,如果想通过国补价吸引人,可以选择更好的呈现方式,比如让国补价和正价采用同一种字体和设计,或者让国补价作为正价的补充。 据爱范儿了解,苹果是这一波国补政策下最大的受益者之一,有不少苹果产品在叠加了「国补」等各种优惠后,价格相当有竞争力。但即便如此,苹果依然不会将「国补价」大大地贴在官方物料上,而是采用「享国家补贴,入手更超值」这样比较克制的话术。 这样一来,具体的到手价交给用户自己在平台上查询,厂商也能避免很多争议。 原本是双赢的国补,如今成为了一种灰色地带的营销陷阱。看到「国补到手价」这五个字,你得多留一个心眼,因为国补只有一次,而「国补到手价」却有无数个。 想用好国补?接好这份攻略 不仅商家的「国补到手价」是一个坑,实际上,持续了小半年的国补政策,现在已经变得有点复杂。很多时候我们会发现,想买东西时国补用不了,或者不如预想中那么便宜。 所以,我们也给大家梳理了一个详细的国补攻略,为你扫清疑惑和障碍。 国补在哪?怎么领? 国家补贴首先需要选定地区,不同地区的补贴力度和种类会有差异。一般平台都会自动进行定位,并且匹配当地的补贴。和去年不同,现在的国补对于地区的要求比较严格,一些平台需要地区、IP、收货地址统一才能使用国补。 目前国补的平台已经不仅限于最初的京东,另外两家平台淘宝和拼多多都已经上线国补,如果想要线下购买,则可以使用云闪付,相关界面有详细的店铺信息。 但每家平台国补的进入方式不一,有些还特别隐蔽: 京东:首页有「国家补贴」选项,也可以搜索相关关键词进入 淘宝:主页最上方进入「国家补贴」,可能需要向左滑动才会出现 拼多多:从「百亿补贴」进入,有「政府补贴」页面,也可以搜索相关关键词进入 云闪付:首页「以旧换新」进入,「家电数码补贴资格申领」 其中,京东和拼多多两个平台的国补,都需要使用这两个平台自己的支付方式;淘宝花呗分期不支持国补,但京东白条支持。 除了这四个平台,vivo 和 OPPO 的官方商城也支持国补。 国补和身份证信息挂钩,每个人在一个品类里面,只能绑定一个平台,如果要更换,就必须要先「解绑」。 举个例子,我在淘宝平台绑定了智能手机的国补,如果我想在京东上用国补买手机,就会发现国补资格已经和淘宝天猫绑定,需要回到淘宝上进行解绑,才能进入京东重新绑定。 国补只能用一次吗? 就广东地区而言,除了空调有三次机会,每个品类在今年内,都分别只有一次国补机会。 比如说,我用国补买了一台 iPhone,那么今年我暂时就不能继续用国补买手机。但如果之前没买过智能手表,还能继续领手表的国补。 国补的优惠有多少? 对于手机、平板和智能穿戴这三种品类,只有 6000 元以下价位能吃上国补,优惠 15%,最高不超过 500 元。通过计算,单件商品价格超过 3333 元时,才能拿满 500 元的补贴。 耳机这个品类有点特殊,目前只有京东的旗舰店可以使用国补,属于「智能健身」品类,不会消耗手表手环的「智能穿戴」的国补。 而电脑属于一级能耗家电,国补力度 20%,补贴最高 2000 元。 国补能够叠加平台的优惠券使用,但国补的优惠将根据「券后价格」进行计算。比如,京东平台购买 Apple Watch 有 600 元的平台折扣券,Apple Watch S10 售价 2999,券后价格 2399 元,然后才计算国补优惠 15%,最终到手价 2039.15 元。 即使是同一个地区,不同平台的同一个产品,对国补的支持也会有不同,如果确定一个产品的价格在国补区间,但发现在这个平台上不支持国补,可以考虑去其他平台看看。 就广东地区而言,国补商品不能「拼单」使用,即使都是能吃上国补的同一品类,同时下单就会失去国补。 如果不确定自己用上国补没有,三个平台都有自己的提示方式: 京东:在购物车里选择相关产品,价格会有「优惠明细」的按钮,点击就能看自己的产品有没有国补 淘宝:购物车不显示国补价,要进入产品结算界面,往下拉到支付方式,支付宝才会显示「国家补贴」和补贴价格 拼多多:进入拼单支付界面,支付按钮会显示「已享政府补贴」 下单之后事情还没有结束,为了减少倒卖国补产品的现象,今年的 3C 数码国补产品送到后,需要本人现场拆封拍照签收,所以购买了国补产品后,记得也要考虑本人签收的情况。 如果退货了,国补资格会返还吗? 需要注意的是,用国补优惠购买的产品,如果取消或退货,不一定都能返还消耗的国补资格,需要视国补地区的政策而定,最好在购买之前咨询客服。 由于国补政策会根据每个地区、平台、品牌、产品变化,这个攻略只能提供一个最基本的参考价值,如果发现和攻略有出入的地方,都建议去找平台或店铺客服进行进一步的核实。 国补真的最划算吗? 对于最高只有 500 元的 3C 数码而言,国补的力度其实不算特别大,有时甚至还不如平台补贴:iPad mini 在拼多多没有国补,但平台优惠最低价是 3199 元,比京东的国补价还要低一点——当然,我们这里只讨论价格。有时候,服务也是重要的一环。 而国补力度更大的电脑品类,价格要实惠不少,特别是苹果 Mac 产品。五千元价位起步的 M4 MacBook Air,叠加教育优惠三千元不到的 Mac mini,真成了「人人买得起」的性价比产品,对于其他品牌而言同样如此——因此,我们也建议把国补的机会,留给数额更大的产品,以争取更多的优惠。 总之,不管是厂商宣传的「国补到手价」,还是电商平台上看到的国补优惠价格,我们都要留个心眼,警惕这个只有一次的「国补价」,更要货比三家,选择真正需要、值得买的产品。 切忌因为「国补到手价」,没有需求也要创造需求。
全球首款RISC-V机械臂来了,软硬件全面开源
作者 | 江宇 编辑 | 漠影 机器人前瞻 4 月 25 日消息,近日,大象机器人和一家专注RISC-V架构芯片的公司——进迭时空,联手推出了一款六轴机械臂:myCobot 280 RISC-V。 这款机械臂最大的亮点在于:它是全球首款基于RISC-V全栈开源架构的六轴协作机器人。换句话说,从“芯”到“体”,这款机械臂都走的是一条不依赖传统架构、而是拥抱开源RISC-V生态的道路。 进迭时空作为国产RISC-V芯片领域的新锐玩家,主攻AI CPU方向,产品覆盖RISC-V高性能通用核、AI核、NoC总线及完整芯片平台。他们还在打造一整套面向本地大模型的计算基础设施,力图为AI机器人和AI计算机打好“地基”。 大象机器人这边则是国内协作机器人领域的老面孔,尤其擅长小型桌面机械臂。此次合作的主角myCobot 280,本就是其经典产品系列之一。 两家公司这次把各自看家的本事拼在一起,研发了新版本——myCobot 280 RISC-V。它搭载了进迭时空自研的RISC-V AI CPU芯片“K1”,该芯片内置8核X60高性能智算核,能跑起0.5B到1B规模的大语言模型,推理速度能达到每秒10个token以上。 K1支持开源AI扩展指令集,开发者还能自己定制AI加速指令。系统层面则是进迭时空的Bianbu OS,基于Linux,还兼容OpenHarmony和OpenWRT,支持多平台开发。 从硬件规格来看,这款六轴机械臂拥有280mm臂展、250g负载,重量仅860克,小巧灵活,接口也不少。末端支持乐高和M4扩展件,吸泵、夹爪、视觉模块都能轻松装上,为教学、实验、创客场景量身打造。 软件生态上,整机采用全栈开源设计,RISC-V指令集、芯片SDK、机器人控制代码统统开放。官方还提供apt仓库,预装DeepSeek-R1、Qwen2.5等大模型,视觉、语音模型也一应俱全,并支持ONNXRuntime推理加速。 开发方式上,既可以拖拽式编程(myBlockly),也支持Python脚本,兼容ROS2、RVIZ和MoveIt仿真环境。同时,它出厂就预装OpenCV和PyMyCobot库,新手开发者也能在10分钟内完成机械臂抓取和视觉识别的初步联调。 在AI能力方面,它能做到视觉跟踪、语音交互甚至自主决策,特别适合智慧零售、互动展览等场景。加上其模块化、开源、高度可拓展的特性,也让它在教育、工业自动化和创客领域具备一定吸引力。 ▲myCobot 280 RISC-V 智慧零售系统 大象机器人与进迭时空希望通过这款产品构建一个更开放的开发生态,吸引更多开发者参与RISC-V在AI机器人方向的探索。 他们已准备好SDK、预训练模型和ROS2仿真环境,下一步就看谁能把这套“芯”玩出花样了。
告别一眼假,这下数字人终于会思考和「能协同」
哲学家安迪·克拉克在《自然天生的赛博格》中提出,人类与技术的关系正从「使用工具」转变为「共生演化」。 数字人技术正在加速这个进程:在你不在场的情况下,由你的形象、声音创造的数字人,可以进行 24 小时不间断的交流和表达,这个时候,「人」的存在形式已被重新定义。 这些主播们的声音热情,讲起货品来流畅清晰。仔细琢磨这些完美的面孔,和多变的表情语调,很可能看完了一整个直播都很难意识到—— 这些并非真人,而是由 AI 驱动的数字人主播。 数据显示,虚拟数字人已占据数字人应用市场 22.7%,在电商直播带货领域位居首位,其互动性和拟真度不断提升。 今天,百度在 Create2025 百度 AI 开发者大会上,也发布了新一代的慧播星数字人。百度创始人李彦宏也首次提出高说服力数字人的概念。 数字人主播,终于不再是曾经的「僵硬木偶」,而是开启了全新的版本,走向如李彦宏所说的「人人都是一支营销队伍。」 AI 主播终于学会了「演」 「媲美真人」听上去,不过是所有数字人都在做的事——但真正看过案例,才能感受到当中的「说服力」。 高拟真不令人惊讶,真正令人惊讶的是这么多动作、表情,以及随时需要对各种问题做出回复,数字人都能流畅无碍完成——护肤品说擦就擦,演示伸手就来。 这一系列的动作背后都有设计,这一次慧播星从脚本模式升级成为剧本模式,详细的剧本不仅能指导角色讲什么,还设计了场景、情感、语调、动作等等。以此来驱动数字人的语气、表情、动作,高度的融合和统一 ,数字人因此可以顺畅流利的结合内容,配合做出动作。 换句话说,现在的数字人不再只是复刻真人主播的形象和声音,并且要能做到情绪转换与动作衔接,如真人般自然流畅,从而实现行业断层领先。 这种能力是「高说服力」数字人的关键。直播中应用到数字人,本身并不稀奇,这也是 AI 实际落地里一个常见的应用方向,各大电商平台,早就已经有了数字主播的出现。只是那个时候,光是让数字人看上去「不塑料」「不出戏」,就已经竭尽全力了。 而如今,在应用越来越普遍的情况下,数字人也越来越「卷」。基于多模态技术为用户打造数字人,通常需要融合文本、语气、视觉、动作甚至情绪感知等多种模态,技术链路复杂。涉及跨模态融合与协同、自然语言理解和生成、动作捕捉与生成,以及实时交互与延迟优化。 基于文心 4.5 turbo ,慧播星数字人已经摆脱了过去那种「一眼假」的尴尬。拟真度的改变和提升只是一部分—— 真正有决定性的,是其自主思考决策能力,以及多智能体调度能力。 这些能力真正决定了商户的使用体验,并且最检验背后的技术实力。 当你打开一个慧播星支持的直播间,你会看到主播自然地转头、拿起商品、360 度展示细节,甚至手势和表情都精准到位。这种超拟真效果足以让你怀疑:「这真的是 AI?」 这是百度对于「高说服力」的定义:在用户体验上和直播场景上,数字人已经可以达到表现力媲美真人,甚至在一些场景下的转化率,能够超越真人。 一部手机把你变成「主播工厂」 数字人主播的兴起,源自于电商直播行业对高效、低成本运营模式的需求。传统真人主播面临高昂的人力成本和有限的工作时间,而数字人主播则可以实现 24 小时不间断直播,极大地提高了运营效率,实现降本增效。 这里所说的「降本」,除了指可以省去主播、助播的人工成本,也包括搭建、测试等一系列学习成本。 换句话说,平台和科技公司在打磨多模态技术上出力,到了用户这头,也需要花力气学习、研究各种操作和使用。当流程过于繁琐的时候,就相当劝退。 这一次百度最新发布的手机端,搭载了可能会是直播行业最实用的创新之一: 「一键开播」功能。 只需手机号注册,上传 2 分钟视频,任何人都能在手机上一键启动自己的数字人直播。 不过,这只是起点。有了主播形象的声音之后,还有直播间的环境搭建,尤其是要针对不同类型产品,配备不同的脚本、素材……这些都是「门槛」。 「一键开播」是真的一键,通过百度app,找到慧播星之后,直接就能看到预设好的四种脚本类型。当然,也完全可以自己写,这些预设脚本就是最好的参考。 想象一下,一位珠宝带货主,同时在 10 个直播间用不同风格介绍同一款产品——用科学风格讲解宝石知识,用文学风格讲述珠宝品牌背后的故事,用带货风格直击用户痛点,直接上价格优惠。 依据主播人设定制脚本、强化主播风格,是慧播星的强项所在,囊括了文心 4.0、文心 4.5、DS-R1 多个模型在内。 通过深入浅出的讲解,提升内容的科普性,拉长用户停留时长及直播间转化,甚至能够做到实时追踪网络热点,将当下热梗融入商品讲解。 平心而论,主播虽然随处可见,可每一个主播的表现力是不一样的,这受限于他的知识水平、语言表达水平。而数字人不再受到这些条件的约束,它的知识储备可以是无限的,表达能力也可以随具体情况灵活变化。 一个「反常识」的情况是: 一些健康保健品的商家,更倾向于使用数字人 。百度副总裁、百度电商总经理平晓黎提到,因为真人主播可能出现口误,而出现违禁词。而数字人在做好优化的前提下,可以实现精准的控制。一些垂类内容,可以通过引入知识库来解决。 配置相应的环境,生成脚本,还能根据货品与场景灵活调整演播方式,这些都在真正有效降低直播的门槛。无论是知识科普、生活分享,还是情感咨询,都可以完美适配, 每一个用户,都能实现从 「视频」 到 「主播分身」的华丽转身。这才是技术革新带来的最直接、明确的价值与意义。 直播,多模态 AI 落地的最佳场景 IDC 最新报告显示,百度慧播星在电商直播数字人领域综合实力排名第一。这不是偶然——直播电商恰恰是多模态 AI 技术的理想落地场景。在这里,视觉、听觉和交互体验完美融合,AI 技术的多重优势得以充分发挥。 对竞争已经相当激烈的直播行业来说,数字人技术带来了三大改变: 1. 规模化突破 过去一年,慧播星数字人主播已超过 10 万,助力商家平均转化率提升 31%,开播成本降低 80%。如果是在百度站内,平台给予的扶持,可以做到几乎没有什么成本就能开播。 2. 人机协作的新模式 数字人并非简单替代真人主播,却可以拆解原有的主播工作,实现原有流程的整合。传统直播里,运营跟主播需要配合,还需要搭配助播、场控等等,而数字人相当于把这些角色都拟合在了一起,对小微型商家,简直不能更友好。 3. 走向素人 不是每一个人都擅长对着镜头,滔滔不绝讲上三四个小时。但是数字人的技术,帮助了更多的素人获得 AI 带去的普惠。甚至不再局限于「视频创作者」,而是拥有自己的「主播分身」,普通人也能实现自己的 24 小时不间断,从而经营起自己的直播。 在多模态 AI 技术的众多应用场景中,直播或许是最能体现技术商业价值的领域。毕竟,没有其他场景能同时对视觉拟真度、语音自然度、实时互动和内容创作提出如此高的要求。 这也反映了百度慧播星最大的亮点在于, 它不只解决了「看起来像人」的问题,更是让数字人拥有了「会思考」和「能协同」的能力。这意味着 AI 不只是模仿人类,而是成为直播场景中能独立应对各种情况的智能主体。 接下来,直播的用户即将面对一场颠覆性的互动革命。具备高说服力的数字人,根据直播间氛围自动应答、调整视频素材,甚至模拟真人的暖场互动,这种智能化体验正在重塑消费者对直播的期待。 对于从业者而言, AI 辅助让专业人士得以专注于核心价值创造。而对于还在观望的素人,当技术不再局限于少数头部主播,而是成为每个人都能掌握的工具,百度正在推动的,是一场关于内容创作与商业表达的民主化革命。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。