行业分类:
加载中...
头条分类:
加载中...
鸿蒙版百度地图大更新!新增手机与手表、车机互联、添加常用地址
近日,百度地图官方微博宣布鸿蒙版百度地图迎来重大升级。此次更新集中上线了手机手表互联、手车互联、设置常用地址等多项功能,不仅强化了鸿蒙生态的设备协同能力,还在导航显示、个性化设置等功能上进行了优化,无论是日常通勤还是长途出行,都能提供更贴心、高效且无缝衔接的导航体验。 手机与手表、车机互联,导航跨端无缝接续 鸿蒙手机、手表互联,出行更安全:用户外出步行或骑行时,可将鸿蒙手机端的导航任务流转至手表,不用一直看手机,瞥一眼手表即可查看导航信息,让步行、骑行时的安全保障升级。 手机、车机同步导航路线:支持与V20、V21车机尝鲜版实现手车互联,自驾出游时,可提前在手机上规划好出行路线,上车后无需重复操作,一键即可将路线同步至车机,即刻启程。 导航功能全面升级,打造专属出行体验 导航界面新升级:驾车时遇到复杂路况真的会焦头烂额,尤其是到人生地不熟的陌生城市,更是会不知所措。鸿蒙版百度地图更新后的导航界面对标当前最新的V21版本,不仅优化了界面布局,让显示范围更广、关键信息更突出,还能帮助用户提前预知复杂与异常路线,各种路线信息了如指掌。 设置常用地址:每次开启导航前都要输入常用的地址,不仅操作繁琐,还可能会输入错误浪费时间。本次更新后,用户可将家庭、公司等常用地址固定在首页,快速开启导航,节省输入和查找时间。 快捷选择起终点、途径点:周末想要短途周边游,可以用“地图选点”、或者从“我的位置”、“收藏夹”或中快速选择地址,如果导航中途需要要接送朋友,还可添加最多15个途经点,让规划路线更高效。 此外,用户可在鸿蒙版百度地图的“设置-通用设置-地图显示大小设置”中调整底图的字体大小,还可以在订单中心一站式集中管理打车、酒店等订单信息,历史订单查询更便捷。 鸿蒙版百度地图近期积极更新,将用户的心愿一一兑现,在华为应用市场收获了大量用户好评。从手机与手表、车机的无缝互联,到导航体验的全面优化,再到个性化设置的贴心升级,每一项功能改进,都让用户的出行体验再获升级!
700万播放、首期就拿下赞助,我们聊了聊这位AI歌手出道背后的故事 | 浪潮对话
摘要: “Yuri在逻辑上完全不同,这不仅仅是AI和3D呈现技术的区别,而在于支撑人格的内容生产方式不同”。 凤凰网科技《浪潮》出品 作者|赵子坤 编辑|董雨晴 “我,我有点紧张,你知道吗……” 一个挑染蓝发的少女,笑脸盈盈地看向镜头,偶尔露出略显紧张的羞涩,眼神不时还会飘忽到虚空一点。这段歌手@Yuri尤栗 的自我介绍视频,不久前在AI圈子刷屏,更早之前的出道歌曲《Surreal》则在全网拿下了700万的播放量。其中,MV视频两次登上B站热门榜,连续两天登上网易音乐飙升榜。 自动播放 特别之处在于,Yuri是一个AI驱动的数字人。 Yuri背后的“造物主”团队AI.TALK主理人赵汗青,已经是一个用AI搞创作的老手。早在两年前做出了“AI尼采对谈AI小丑”“老年科比跟老年奥尼尔对话”等系列热门AI视频。 但当下这个节点,Yuri的走红或许更具有标志性意义。随着Veo3、可灵大师版、即梦数字人等新一代AI创作工具的发布,AI创作的内容正以前所未有地规模流行于互联网。 和一年多之前,人们称之为“污染”不同,这一代AI内容的质量更高、传播更广,思路上也更天马行空。 汗青的创作野心也在今天更进一步——用AI来做IP人格化,做出不同人类思维模式的“新东西”。 汗青认为,Yuri跟上一代所熟知的虚拟偶像不同,是AI驱动的全新人格。从外观设计,到歌曲创作,再到“自我介绍”,是全环节上的AI主导。 作为经历了两波互联网浪潮的“大厂老兵”,汗青认为,AIGC是生产力的变革,而移动互联网是一次分发的变革,二者很多逻辑都不太一样。 而且:“AI是一个特别少见的,在还没彻底进入全民生活前,大家就已经有点厌倦了的新生事物。” 他最近正为团队寻找合适的人才。他相信,AI时代的创作,专业性不会再是唯一壁垒,审美力才是做出内容差异化的关键。 在今天,创作者怎么去借助AI能力撬动增量市场,在注意力稀缺的当下夺回自己的表达? 以下是凤凰网科技《浪潮》与汗青的交流,经编辑发布: “Yuri不单纯是一个外表上的数字人,AI参与全流程的创作” 凤凰网科技:虚拟人大家已经不陌生了,之前“柳夜熙”也火过,Yuri的区别是什么? 汗青:柳夜熙很成功,我们很尊重这些“前辈”。但Yuri在逻辑上完全不同,这不仅仅是AI和3D呈现技术的区别,而在于支撑人格的内容生产方式不同。比如她的音乐、她的访谈,这些内容本质是生成式的,而不是只在表现层运用AI。 Yuri是AI.TALK孵化的第一个IP,她的歌曲、对话的脚本都是用AI写的。我就想看大众对她到底感不感兴趣,而且一定不能只是圈里人感兴趣。 圈里人是拿着一个技术审视角度去看,关心的是你这个手指头画得好不好,运动表现真不真。老百姓关心的只有它够不够好看。 现在大家对AIGC生成的虚拟人存在一些争议,但哪吒也不是真人,阿凡达也不是真人, AI本质跟3D有什么区别?都是一个虚拟的资产。说白了,不是AI有问题,是拿AI做出来的东西,还不足够让大家有代入感。一个新东西出来,如果有价值,一定不是拿着旧的范式去套。 凤凰网科技:过去做IP都要有人设,比如Labubu是森林里的精灵,你所谓的“新”的东西是什么? 汗青:这些设定到最后一定会有,但我不希望是靠传统的写作,靠人为设计。比如你是可以设计Yuri 是个素食主义者,这个设定很好去喂。但我不希望直接给这种颗粒度的设定。我希望AI能帮助我们去构思、生成相关的内容。 两年来,从AI.TALK开始创立,我们做的都是一件事儿,让AI去生成内容,但并不是说就脱离了人的控制。 大家都会担忧,插画师和设计师是不是要失业了,AI能直接生成了。但在我看来,不是抢活,是创作者稍微往后退了半步。 原来,我们要直接决定杯子的形状轮廓,要直接设计它的细节状态。现在设计是我要离远处看,要的也许就是一个鲍豪斯的工艺风格,是这种比较抽象的概念设计。 Yuri的运营也是这样,往后退一步并不是说不管了。类似于人设、故事,慢慢都会有,但是这些东西,我们希望让AI去涌现、生成,我们来做挑选。 凤凰网科技:最后人工参与的比重是多少? 汗青:人和AI比例大概是三比七,但这三的权重会比七的那部分高很多,会规划谈话的范围,选题,和调性。但绝对不是“换皮”,那不是我想做的市场。到最后如果就是一个高级的3D版本,这种模式不是我们擅长的。 我们从2023年开始做对话,2024年做短片,2025年做音乐,短剧我们一直没做,也有人找我们做,但我的判断是,技术上还没到节点,或者我自己还看不懂,那我就先不着急。 我一直希望能踩在技术节点上,去上线给C端的内容。要达到B站100万左右的播放量,不太可能只靠圈内人,我更在意圈外人的评价。 影视也有在布局,但我不想只做降成本的流程改造。从故事到跟用户的互动,我都希望是全新的。 对创作者来说,降成本并不一定是新的机会点。 考虑降成本,AIGC就会变成一个工业生产的平替,影视剧作公司可以用这个技术去降低它原来的制作成本。但是我们的角色不一样,站在生产方想,我希望自己的东西是有溢价的,所以两年来我们没有着急做短剧。 说实话,对短剧我还是存在很多疑问的。现在大家讨论还是停在一个视觉层面上,但真到了爆发节点,AI有价值的部分也许体现在叙事。 如果说Yuri这次是我们买了谁的歌翻唱,说实话我就没那么开心,意义也没那么大。 有一些艺人经纪朋友会找到我们,希望帮忙运营的,基本上我都谢绝了。我尊重他们的经验,但如果最终我所有的打法逻辑,全是过去20年的真人逻辑,只是说,最后你用AI建了个模,那这不是我们要做的事。 凤凰网科技:所以在AI歌手这件事上,你们和专业音乐人的区别是什么? 汗青:所谓的专业在定义上可能会发生些改变,也许不再是技能,更多是审美。而技能在AI时代还能不能成为壁垒,我持开放态度。 音乐我不敢妄言,但美术和设计领域我比较有发言权。我从6岁开始学画,有12年的专业训练。现在大学里教授的专业内容,有用的大概是审美层的东西,你的技法AI是很容易替代的。 我们团队招聘时也不看重专业背景,会深入交流考察候选人的审美积累。比如会聊看过哪些电影、听过什么音乐、喜欢什么文学作品。我们需要的是感觉敏锐的“发烧友”,纵向的专业深度反而不是首要考量。一个观影量很大的人,可能比部分专业电影人更适合我们的工作。 我始终认为,AI时代需要的是一套全新的创作逻辑,而不是在旧体系里做局部突破。后者对我们没有实质意义,因为我不懂,没有什么优势。 凤凰网科技:看上去你对AI更接受,当年AIGC出来第一枪就打向了绘画圈,当时业内普遍挺悲观,好像这么多年的勤学苦学,看起来马上要被AI替代了。 汗青:这个问题和美术教育体系有很大关系。学美术本身就不该等同于去学怎么画画。 其实世界上很多美术学院里,素描和色彩课程早就大幅减少了。美术教育的核心应该是培养两种能力:一是审美判断力,二是如何表达欲望。而不是单纯训练人如何把一杯咖啡画得很像。 表达的东西才是本质。我一点都不觉得AI会破坏这个圈子,被AI替代掉的那部分工作,可能本身就不是在去做表达。 我说话可能很多人不爱听,但一个设计师如果被AI取代了大部分的价值,是不是也得想想自己到底是否在真的做设计。 在一个高度分工化的社会里,设计师要考虑的是怎么解决问题,跟看病一样,看谁解决问题更优雅。从这个角度看,AI对真正的创作者其实是种赋能。 凤凰网科技:你怎么定义现在在做的事情? 汗青:现在AI Talk 只有三个频道,短篇,对话,音乐,从我这看是一件事儿。 过三年,如果AI Talk这个牌子还在一线的话,一定不是说我们的工具用得如何,一定还是我们背后对于IP这件事情,对于叙事的理解。品味一定是最重要的。 长期来说,技术会拉平创作的门槛。大家今天都有单反相机,但我们拍出来的照片肯定不一样。就像照相机出来时,画师也很有危机感,但100年过去了,绘画也没消失。 也不会因为人人都有相机,大家的摄影都是一个水平。这就是本质区别,AI反而会把人和人之间的差距放大,不是缩小。 我实际的经验是,我身边做插画的同学也好,做各种各样的创作的朋友也好,真正有想法的人跟别人的区别会更大,而不是说你原来的优势就没了。 这个IP,后面会产生很多的叙事。你看Yuri出来先唱歌,接了北面的合作出的是聊天视频。后面会不会有电影,她能不能变成演员?完全可以,就演一个歌手就好了。 我们未来的重点还在于叙事,但是做法会跟现在大家看到的不太一样。短期内不太会去定义它。定义的本质是拿一个大家都熟悉的概念去套它,那就意味着一定是个旧东西。 比如我们做Yuri之前,有很多人都会觉得说,根本没必要去做,因为之前虚拟偶像已经出来太多了,都没那么火,似乎挺难的。 这些担忧对我来说意义不大,我怎么样都是要试一次,试出来之后看看反响,看看观众是不是买单。 我是做互联网出身的,我的理解是,如果现在想的一些东西,不是共识,也许成功概率会高一些。如果我今天说一个事情,坐在这不用说你都明白了,大概率不会是我们的机会。 我想做的,是用AI的方式去做一种叙事。叙事的格式在过去其实不断地在变。刚有电影的时候,大家也不知道怎么拿一个旧的概念去定义电影,起个名字就好了。 今天的一个新东西,从逻辑上很难找一个既有概念去形容它。 Yuri只是一个很早期的成果,后续一方面需要不断地出新歌,另外要想办法让她跟粉丝互动,要让AI在想象力方面有所发挥,我希望不给特别多的限制,而是让模型自己去跑。 这个基本上是我们做AI talk的经验。我跑了一年多的对话,就是为了看能不能发散出来更新的东西,而不是基于已有的创作模式。 总的来说,我会觉得AI是短期被夸大了,但长期可能被低估了,是一个很矛盾的状态。就跟互联网当时刚出来的时候一样,短期大家觉得这东西一下能上天,其实不会。 凤凰网科技:你有没有复盘过,这次Yuri为什么受欢迎? 汗青:我一直觉得人跟媒介的互动,其实有一条线。那条线的意义在于,你迈过去了,大家就信你了。说信任可能有点大,至少能被骗到,至少会投入(感情)进去。 如果你在那条线后面,比如说前两年我们做的东西,其实也很少说能让观众真正有共情。(以)现在技术的发展速度,我觉得很快会有很多作品能迈过这条线。 用AI去做内容,到底图什么? 成本上是一个重点的考虑。比如Yuri那首歌,如果只有一个员工做两周,按照传统你是很难做到的。但我更愿意把它称之为效率,而不是成本。因为成本的目标是让这件事情越来越便宜,但效率不一样,效率是让在相同成本下你能生产更多的东西。 当你跟别人说,AI的价值是成本的时候,要的是比原来便宜。但如果说AI的价值是效率,原来花30万,你可能还愿意花30万,但你要的是比原来的30万更好的东西。越来越便宜,不见得对谁都是好事。低成本不是属于我们这种团队的机会。 我们这样的公司,本身不做工具,不做大模型。成本效率的提升,更多地是属于产业和平台的机会,是建立在一个规模上。就像电商一样,每单的净利其实并不高,但是规模大,就可以把生意做好。 个人创作者很难是这个路子,要想什么是在AI出现前,用传统的方法很难做的东西。最早我们做AI talk,就在跑这个模式,比如说我们做一个50岁的梅西跟一个16岁的梅西互相对话,原来没有AI能不能做?当然能做,3D建模花费时间久一点,但现在可能两天就做出来了。 图|AI马斯克与AI乔布斯的对谈,辩论人工智能的威胁(来源AI.TALK视频号) 这才是AI出现之后,真正会产生差异化的东西。AI内容的机会是在这边,要做增量市场,不是存量市场。 那种AI出现之前,互联网上已经很火了,出来后用一个更低的成本去做,当然是机会,但不是我们的机会,所以我们不做。 好多朋友也在做AI歌手,也做得挺好的。但实话实说,目前我们在细节上的一些打磨还是最笨最费劲的。 护城河在工业细节的差距。最早数字人是基于真人实拍,很多商业的名人都会去授权自己的形象去做训练,这是比较早期的一个成熟的数字人产品,这类产品成本现在挺低的了。 我是希望做出来的尽量不要那么像人,甚至有意回避说特别像人,是希望比真人好看一点。仔细看Yuri五官比例跟皮肤质感,她是带一点CG的风格的。 我更愿意在真实之上找一种非真实的东西。 凤凰网科技:在你们整个设计创作中,有给你惊喜的部分吗? 汗青:设计的过程中,美术层面倒还好,更多的惊喜是一些文本和人格层面。它经常会说一些话,是人想不出来的。 比如让它想Slogan,我问你怎么总结你跟真人的区别,它说了一句:“我不在场,但我在线。” 你会很愿意跟AI聊天,恰恰因为它的思考方式跟人不一样。把AI当成一种新的风格,当成一种新的互动方式,这件事情其实是源自于我自己的实践。 过去两年,我们在和AI聊天这件事上,应该是国内实践量比较大的团队。这个过程中我在想,有没有一种可能性,是AI可以有人格化的发展。 凤凰网科技:人怎么跟一个虚拟的IP,在知道是AI生成的情况之下建立信任感? 汗青:柯南也不是真人,但柯南的粉丝对他的信任肯定是真实的对吧?显然并不是一定要有一个活体的人真实存在在三维世界里,你才会去信任他。 我们的目标就是,让用户看了后情感上能有共鸣,能产生情感连接。 所谓人物一致性,不是一个特别复杂的问题,技术一定是在发展的。今天不够好,明年这个点你再坐下来看,肯定会进步很多。 说实话,一致性有的时候没那么重要,还拿动漫举例子,不见得每个镜头一致性都特别好,关键是:大家有没有共鸣。 本质是你用AI去创造了一个叙事,大家愿不愿意相信你? “AI创作,技术不是成本,人才是” 凤凰网科技:Yuri这次发歌用了多少大模型,生产周期多长? 汗青:真正发歌制作就是2~3周。但因为技术的迭代,之前推翻了一整版,两个月之内模型能力也在进步。歌都有一部分是重写的,又重新拿模型再重新去跑。 模型上,我们是绝对的实用主义者,什么好用我就用什么。当然不同的模型擅长的不一样,大动态用可灵多一点,口型用即梦多一点。但即便口型这一点,用了至少四五种不同的工具和方法,也不是说只用一家去做。 两次升级,主歌副歌歌词都差不多,但一些编曲、乐器上差蛮多的。因为音乐模型也在升级,还是区别很大,原来那版单薄一点。 凤凰网科技:你核算过成本了吗? 汗青:现在大家对成本都很关心,但实际上最大的成本不在算力层。即便用各种工具,开源的本身就不花钱了。即便是闭源的,现在市面上这些所有的工具,哪怕都用满,一个月花不了多少钱。 技术不是成本,真正的成本其实是人。 我们团队最近特别迫切去招人,但招人进度特别慢。AIGC这种创作模式跟工作流下,对人的能力要求是一个以前很少见的类型。 市面上我们能接触到这类人比较少,最贵的可能是那个对的人。 当然,考核人的标准跟大厂需要的完全不一样,大厂基本上我们都会垂在一个领域里,比如产品、技术、运营等。我们现在需要的是复合型人才。 就拿做Yuri来说,至少音乐你得懂一点,不用说自己做过乐队,但得了解基本的一些常识,主副歌的结构、乐器、基本的节拍感和听感要有,要对影视有了解,美术你得也懂一点,对视觉审美要求也比较高。 凤凰网科技:听上去你想要一个懂AI的“全能艺术生”? 汗青:不只是,还要具备一些逻辑思考能力。 我们团队一方面很稳定,因为市面上想做我们这类事的团队并不是特别多。 我们想做的这个事,本质上是不太讨好市场的。一是流量上不讨好,今天做流量,最重要的是什么?是频次,是落地性,是能不能去触达最广的人群,而我们的节目基本上80%是英文。 第二,如果把我们纯粹看成一个内容公司,在一些旧的范式里,这也不算多好的商业模式。 对团队来说,也不讨好。很多事情可能都做完了,不一定能放出来。我自己本身一开始是拿它当成一个实验性的东西在玩,也没那么功利,不是一个目的导向型创作。 当我跟别人说,我要拿AI去做一个IP化的人格,如果你不是看过这个片子,也不理解。 凤凰网科技:类似于MCN机构,不过员工都是AI生成的? 汗青:也不太一样。AI的出现,是之前产业结构里不太可能出现的一个范式。相比MCN来说,我们更重要的是围绕艺人去产生的内容,而不只是去经营它的形象,我会更看重叙事本身。 我是80后,那个年代一个偶像出来了,比如说姜文拍了个电影,或者说王菲唱了首歌,背后一定是有一个叙事的。 我比较感兴趣的是能不能真的做出一个数字人格,它背后能有一些内容去支撑。 凤凰网科技:AI创作的歌曲,跟流行的“抖音神曲”是一回事吗? 汗青:大模型出来的内容,理论上会更谄媚人的听觉。它一部分的逻辑就是在想,怎么能让你更爱听,这是客观现实。再加上所有的模型是建立在一个数据基础之上的,流行歌曲的占比肯定是高的。但是不等于说,AI写不出来不流行的东西。 实际上,AI写出来过一些,我会觉得挺好听,但可能拿出来没流量的东西。我们马上也会上一些不是那么“流行味”的歌曲,或许是一些纯音乐。 凤凰网科技:现在短剧这么火,你们为什么不考虑做? 汗青:拿AI去做一个短剧,你图啥?一方面AI会吸睛。当然现在可能也没那么新鲜了。我跟很多行业里的前辈去聊,大家更感兴趣的其实是降成本。 今天拍一个短剧,说实话花不了太多的钱,比如60-100万左右,还有更便宜的。当你想做一个100~120分钟的AI短剧,又想保证它的质量,我不确定你能比这个便宜很多。便宜很多,质量可能就相当堪忧了。 过去两年没做是商业上这笔账算不回来,短剧本身还不像电影跟音乐,短剧是建立ROI的逻辑之上,它更像产品,而不是作品。 我经常开玩笑,AI在我国的普及的一个阻力在于我们的人工成本比较便宜。 我去横店上次参加一个影视节,有一个朋友做短剧的,在边上我就看着,演讲结束后过来两个小姑娘长得特别漂亮,说导演我们就想拍剧,不要钱,让我们拍,我当时就觉得,难啊... 短剧当然是一个好的生意。我们也不排斥做,但必须得非常理性,至少过去两年拿AI做短剧这件事,我们自己很慎重。 短剧也是很结构化的事物,有很多值得尊重的方法和经验,但我不觉得我们团队很懂这个市场。所以我没必要非要去碰一个没有优势的地方。我们下半年也会推影视的内容,但它自己得有独特的东西。一定得有自己一些AI的特点。 “不像真人才有价值,AI美学为何不能成为一种风格” 凤凰网科技:前些日子你在一席演讲,标题是“AI不会杀死创作,但会杀死平庸”,但大模型训练后是更平均的能力,生产出的内容会有创新性突破吗? 汗青:这个问题特别好。复杂就在于,你不能让AI去负责所有的东西,如果让AI负责所有的东西,也许会出现您说的情况。 AI本身就是个工具而已,当然了我觉得这个工具现在的进化速度很可怕,我们现在没上线的那些剧本,有一些已经很吓人了。 我们不是让它仅仅做生产,而是把它做成一个放大器,一个杠杆。 因为不像真人,才好玩。我们做的东西不是想让大家真假难辨,那意义不大,做到头无非就是个假的真人。 今天在互联网上有太多真人你可以关注了,每个人都有自己的性格。如果说你能做出一个很好玩的东西,恰好是真人不会这么去思考问题的,那会更有趣一点。 凤凰网科技:有人说Yuri的长相是比较韩范的,风格也是女团风,所谓AI创新的基调是否还基于当下真实世界已有的模版? 汗青:我们主要想做是东亚的市场,肯定不会去做一张让大家接触起来觉得陌生的脸。今天让模型画各种各样的人理论上都能实现。 有人跟我说,说一听Yuri这首歌就是AI写的,我一开始还有点害怕,我们自己觉得已经能当正常歌听了,就问为什么?他说,歌词都在讲硅基碳基啊。我就松了一口气,因为歌词是我们自己写的,真正的AI参与,反倒是在旋律、编曲和演唱这些不那么“表象”的环节上。 未来可能会出现一种新的AI美学,类似二次元。二次元的人都是假的对吧,你会发现一旦二次元真人化,大众反而很反感。二次元真人化的电影基本都败了。 今天AI还没有到一个更成熟的阶段,但到了一定成熟的阶段后,为什么要去掉AI味,为什么AI味本身不能变成一种风格或者滤镜? 像今天,大家喜欢拿徕卡相机去拍一些胶片感的胶片,这东西当年就是个技术缺陷,因为显影技术还做不到高度还原,颜色就都会偏灰偏绿,但今天胶片风都变成一种美学了。 动漫也一样,其实动漫也有很多风格,也不是说所有的动漫都是一种风格。有偏写实的,有偏卡哇伊的。AIGC内容未来也是如此。 现在不讨喜因为它本身就是个缺陷,本身不够好,你不能拿一个不够好的东西说这就是我的风格对吧?一个人唱歌难听,你不能非得说走音了,你说这是我的风格。 但是当技术到了一定程度的时候,一定会出来很多种风格,供你去选择。 凤凰网科技:Yuri在国内其实接受度并不如海外,700万播放,有五六百万都是在美国和日本,这是为什么? 汗青:一是语言门槛,Yuri发的英文歌。我们粉丝大部分都在国内,最开始为什么选英文歌,是希望在创作上,最大化整个模型能力。从模型生成质量来看,英文目前是最佳选择。 另外我们是想作为中国品牌形象,去往海外打。英文是一个通用语言,全世界都能听懂。 我们80万粉丝里,大部分还是中文区用户,但体感很明显的是,国内用户对AI的要求更高。 Yuri也比较特殊,第一次基本上从流量结构上跟之前的反过来了。 图|Yuri首期“出道视频”拿下知名户外品牌赞助 国内反响也还可以,B站连着两期都上了热门榜,网易云音乐那边基本上也都是打榜的,视频号、抖音量也都不小。但我第一次意识到了,全球是一个更大的市场,尤其日本,对虚拟偶像的文化本身接受度会更高。语言是一个传播阻碍。所以后来上自述采访视频,因为北面要考虑中国的市场,就用中文配音。 有人说,AI是一个特别少见的,在还没彻底进入全民生活前,大家对此就已经有点厌倦了的新生事物。 跟当年我们做移动互联网跟互联网——这两波我都是从业者,感受是完全不一样的。不知道为什么,可能现在短视频自媒体会把信息的宣传放大,大幅度挤压在了一个时间段上,大家有点反感? 凤凰网科技:可能跟前两波浪潮不一样的是,那个阶段大家明显能感觉到,比如说从PC端到移动端,对我生活是有帮助的,我是受益方,但现在AI感觉是来抢我工作的? 汗青:目前来看,AI尚未进入到百姓生活刚需的服务层面。 AI某种意义上更像是一个让你去生产东西的技术。它不像当年整个移动互联网,是让大家在手机上消费内容。 这也是乔布斯当年在硅谷受到的一个争议。以前做 Macbook,让人更有创造力地生产内容。但后来影响力更大的iPhone,则是在消费内容。 今天显然不能说,我们主要拿iPhone是去办公,更多是拿来刷一些东西,消费一些内容,比如听歌这些偏娱乐化的行为。 AI大部分能力是在生产内容,但生产本身很难直接影响到你的衣食住行。 还有一个特别大的问题是,它似乎会影响到很多人的职业,有一个所谓的取代性危机。再结合现在的大环境,难免大家会有一点敏感。 我接触到了很多做音乐,做美术的朋友,有的有危机感,有的也有一些不屑。但我真的认为,未来AI能产生的东西,不一定比很多专业人士差太多。 “所有东西重做一遍,在AI时代是否还能成立?” 凤凰网科技:决定是否上线或成品是否能够被推出来,最终决定权还是只有你一个人?更像是你在借助各项AI工具来完成自己审美表达? 汗青:有点惭愧,在创作上我们是一言堂的公司。因为我是一个表达欲很强的人,基本上还是非常个人风格化的东西。 凤凰网科技:你说用AI的能力做IP,最大的壁垒在审美力,但审美实际上很难被复制的,你跟资方聊,应该也会被问到,Yuri是你们推出的第一个IP,之后IP矩阵怎么考虑? 汗青:我们也在思考质量跟效率的平衡问题。 首先我们不是一家技术公司,不可能说只有你会用这个技术,如果说你用这个技术已经能很快生产出来内容,就意味着别人也可以。所以门槛还是人,人的审美也好,还是对内容的感受力也好。 在做 AI 这两年,我一直也在想说,能不能按原来传统移动互联网的逻辑做一些事儿,说实话今天我还是觉得很难的。 不光是我,包括我身边的朋友有很多做工具类创业的朋友,跟移动那一波太不一样了,彻头彻尾的不一样。 功利地讲,首先流量的结构发生了巨大的变化,因为移动互联网跟互联网出来的时候,人的注意力市场是一个高度真空的状态。 互联网出现的时候,大家还在看电视听广播,平时还在找东西看,我是85后,我们小时候找到一本杂志就会疯狂看,因为你没东西可看。 人的眼睛是很饥饿的,在找信息去消费。互联网出来就解决这个问题。移动互联网出现时,原来是你每天只能看三四个小时的剧,现在你发现,你可以躺床上玩手机玩到到睡觉,注意力是不是不断地被填满了? 那是一个人均的手机设备可能从1亿到10亿之间的过程,今天不太一样了。 今天是一个我们根本看东西已经看不过来的状态,因为技术再怎么增长,人的时间是不变的,这是第一个问题。今天你再想去做一个新东西的时候,人的迁移成本变得很高,做的本质上都是注意力的存量市场。 那对独立的创业者来说,这块是非常难的。大部分的独立开发者不太可能具备投流的优势。 移动革命解决的是分发问题,带来了新的分发渠道。但是AI不一样,AI本身是一个生产的革命。 这就会导致,今天拿AI做的所有的东西,其实还是在抖音、B站、小红书这些APP 上。目前没有出现增量渠道,对于创业者来说就很难。 移动时代搭了一个台子,有各种各样的东西值得你重新做一遍。今天的问题是,大模型可能一更新,直接就淹掉了很多垂直领域里你该做的事情。 凤凰网科技:AI人格这个理念,你会担心变成一种噱头吗,就像上一代数字人那样热度很快过去? 汗青:肯定不希望是这样,但是我也觉得,这个新东西用户能接受多少,或者说未来是不是能成为流行,是不确定的。 到今天,我都觉得用AI做IP这件事情成功率是不到一半的,甚至更低。我们是一个预期非常低非常悲观的团队。 Yuri发出去,最近收到的反馈大概都是正向的,但我觉得还没破圈。说句大家都不爱听的,AIGC的内容到今天为止,我的个人观点是还没真正破圈。 我们最好的节目就一两千万的播放,真正的破圈应该是,今天走在路上,旁人在讨论的,或者知道的。 凤凰网科技:前段时间 MIT 有个研究,结论是越依赖AI创作,大脑活跃度会越下降,你会担心过度依赖吗? 汗青:我特别反对拿AI做读书和文章摘要,去做总结,总觉得这有点偷懒,担心到最后你我会变得越来越迟钝。 但是你能不能本身就把AI当一本书看?有问题我就去跟它聊,这种依赖是良性的。就像是一个老师或者朋友,对话是一个非常能激发思考的一种模式。看书其实也是一种对话,它不会影响到你的深度的思考和表达,反而会扩宽。
银行业首家,高盛将试点全球首个AI程序员Devin
IT之家 7 月 11 日消息,据 CNBC 今日报道,高盛正在测试人工智能初创公司 Cognition 开发的自主软件工程师,高盛技术主管 Marco Argenti 告诉该媒体,首个 AI 程序员预计很快将加入高盛 12000 名人类开发者的行列。 全球首个 AI 程序员名为 Devin,去年发布后在科技界引起不小的关注,开发商 Cognition 声称创造了世界上第一位 AI 软件工程师,演示视频显示该 AI 可作为全栈工程师运行,在最小干预下完成多步骤任务。 Argenti 在本周的一次采访中表示:“我们将开始用 Devin 增强我们的劳动力,这将像是我们新雇佣的员工,将开始代表我们的开发者工作。” 他说:“最初,我们将试点数百个 Devin,后续可能会达到数千个,具体取决于使用案例。” IT之家注意到,就在去年,包括摩根大通和摩根士丹利在内的华尔街公司已开始推出基于 OpenAI 模型的认知助手,让员工熟悉这项技术。 如今,在华尔街出现了更加自主的 AI —— 如 Devin 等 AI 程序员,它们不仅帮助人类完成总结文件或撰写邮件等任务,还能执行复杂的、多步骤的工作,如构建整个应用 —— 这标志着更大的转变,具有更大的潜在回报。 包括微软和谷歌在内的科技巨头表示,AI 已经为其某些项目贡献了大约 30% 的代码,而 Salesforce 首席执行官 Marc Benioff 上个月表示,AI 在其公司处理了高达 50% 的工作。 高盛作为全球顶级投资银行之一,据 Argenti 称这种更强大的 AI 形式有潜力将员工生产力提升至以往 AI 工具的三到四倍。 Argenti 还提到,Devin 将接受人类员工的监督,并处理工程师们通常认为枯燥的工作,例如将内部代码更新到新版编程语言。 据 Cognition 透露,高盛是首家使用 Devin 的银行。今年 3 月,这家初创公司估值翻了一番,达到近 40 亿美元(IT之家注:现汇率约合 287.18 亿元人民币)。
小米Vela系统完成上千款产品落地应用,累计装机量突破1.4亿台
IT之家 10 月 22 日消息,openvela 首届全球开发者大会于上周末在哥斯达黎加圆满落幕。NuttX 创始人 Gregory Nutt 携 NuttX 社区核心成员亲临现场,与国际开源开发者代表共话 AIoT 生态。 IT之家注:Vela 是小米基于开源实时操作系统 NuttX 打造的物联网嵌入式软件平台,适配多种不同硬件规格的产品,最小系统仅需 8KB 内存,CPU 主频不限,适配任意 SoC 多核架构,支持柔性部署。 小米在 2024 年底宣布 Vela 系统代码开源,也就是 openvela 项目。 据小米官方披露的新闻稿,大会开场,NuttX 创始人 Gregory Nutt 发表题为《NuttX 与 openvela 携手构建开放 AIoT 生态系统》的演讲,深度解读与 openvela 在 AIoT 领域的生态协作路径,并对双方的合作表示高度认可:“非常开心 openvela 能够采用 NuttX 操作系统,我认为这对我们双方来说都是一件双赢的事 —— 它让 openvela 成为了更出色的平台,同时也助力了 NuttX 的发展。” 小米团队自 2017 年起持续深耕 NuttX 社区,至今已培养三名 PMC 委员和四名 Committer,连续三年贡献了社区超 50% 的代码修改,成为社区最大贡献者。此外,小米积极推动 NuttX 项目加入 Apache 基金会,并于 2022 年助力其成功升级为顶级项目。 依托于 NuttX 的技术协同,openvela 自开源以来,便以开源开放为核心,吸引了众多开源社区及组织加入,半年多时间,社区累计收到超 4400 笔 Commits 提交,其中外部开发者数量过半。 openvela 开源负责人杜超表示:过去几年,Xiaomi Vela 生态持续快速扩张,市场反响热烈。目前已实现近百个设备品类的大规模部署,完成上千款产品落地应用,涵盖小米自有品牌及众多第三方厂商的智能设备,累计装机量突破 1.4 亿台。 openvela 商务负责人于晶表示:截至目前,已有超过 70+ 芯片厂商、设备厂商和服务商加入 openvela,354 个芯片平台和开发板完成适配,并且与 NuttX、LVGL 等国际主流开源社区深度联动。
Netflix宣布全力投入AI:“能帮人类把故事讲得更好”
IT之家 10 月 22 日消息,据外媒 TechCrunch 今日报道,在娱乐行业探索是否、何时、以何种方式“拥抱 AI”的当下,Netflix 选择了“积极拥抱”的态度。 在当地时间周二下午发布的季度财报中,Netflix 在致投资者的信中表示,公司“非常有优势,能够有效利用 AI 的持续进步”。 Netflix 并不打算让生成式 AI 成为内容创作的核心,而是将其视作“能提升创作者效率”的工具。Netflix CEO 特德・萨兰多斯在财报电话会上表示:“创造伟大作品需要真正的艺术家。AI 可以为创作者提供更好的工具,增强会员的影视体验,但如果你本身不是出色的故事讲述人的话,AI 并不能自动让你变得更优秀。” 今年早些时候,Netflix 首次在阿根廷剧集《The Eternaut》的最终画面中使用生成式 AI,制作了一栋建筑倒塌的场景。随后,《Happy Gilmore 2》的制作团队在开场使用 AI 让角色显得更年轻,《Billionaires’ Bunker》的制片人则利用 AI 在前期制作中设计服装和布景。 萨兰多斯表示:“我们相信 AI 能够帮助我们和创作伙伴以更快、更好、更创新的方式讲故事。我们全力投入,但不是为了追求新奇而新奇。” AI 在娱乐行业一直存在争议。因为艺术家担心,其作品在未经同意的情况下被各路大模型作为训练数据,会对职业产生负面影响。 IT之家从报道中获悉,当投资者问及 Sora 对 Netflix 的影响时,萨兰多斯表示:“内容创作者可能会受到一定影响,但我对电影和电视剧业务并不担心。我们不担心 AI 会取代创造力。”
9998元抱回家!全球首款万元以下人形机器人来了,21自由度,能说会走,会尬舞
9998元、21个自由度 双十一的购物车又满了?手机、平板、耳机、手表、化妆品、衣服…… 今年,还有一件「意想不到」的商品悄悄加入——不是模型,也不是玩具,而是真·能走能跑、能跟你聊天、还能跳舞的人形机器人。 作为全球首款万元以内的消费级人形机器人,松延动力Bumi小布米将在双十一登陆京东首发。 价格甚至比一部高配旗舰手机还低,放在几年前,几乎不敢想。 要知道,今年早些时候,特斯拉人形机器人「玩具」一上架就被秒空——40美元被炒到1300美元,马斯克点赞的「AI 威震天」也要1199美元。但它们都只是玩具。这一次,走进你客厅的,是真的人形机器人。 自动播放 机器之心通过编辑,让小布米「cha」了一段宋雨琦的《M.O.》 参照系也摆在这:宇树R1起步3.99万,松延动力N2在五一前促销价同为3.99万。如今,松延动力直接把门槛打到万元以内,人形机器人第一次真正迈入消费级时代。 说到松延动力,这家公司如今已是行业焦点。成立不到两年,完成6轮融资。产品也成了今年最忙、最出圈的人形机器人之一。 他们第一次被公众熟知,是在今年四月的北京亦庄半程马拉松暨人形机器人半程马拉松上。你或许刷到过那段视频: 一个只有1米2的小机器人,在长长的跑道上孤独奔跑,它就是松延动力的N2「小顽童」。 作为唯一一个全程无需人类陪跑、独立完成比赛的机器人,它最终拿下亚军。 2025年4月19日,北京亦庄半程马拉松暨人形机器人半程马拉松现场,松延动力N2在比赛中。 之后,「小顽童」N2的脚步就没停下。八月,它在2025世界人形机器人运动会上,一举拿下自由体操冠军和单机舞蹈亚军;另一款「小个子」E1,也以1.25米的成绩拿下立定跳远冠军。 金秋,N2飞到巴黎,在联合国教科文组织会场亮相,登上时代杂志报道。国庆黄金周,松延的人形机器人化身景区「流量担当」,以日租4000~5000元活跃在文旅现场。 2025年10月8日,N2机器人在巴黎联合国教科文组织会场走秀 极致轻巧,自由度不打折 先来看看Bumi小布米的真面目。 它是松延家族里个头最小的一位。相比N2,不仅更矮,更轻。 为更好地和「人类幼崽」做朋友,小布米的身高控制在94厘米——不到一米,和幼儿园小朋友差不多,平视交流,零压迫感。 「身材」很紧凑。底座长34.5厘米、宽19厘米,窄而稳,穿门道、走廊这些狭窄空间毫不费力,伸手、转身也不前倾不后仰。 体重只有12公斤——一袋米重,抱起就走。 轻量化的好处很直接:行走对地面冲击更小,偶发摔倒不易造成伤害,更安全;同时更节能,这对消费级很关键。 材料上也做了「加减法」。躯干与外壳用高强度塑料,轻、坚固、绝缘;关键受力部位用高强度铝合金,既承力又散热。轻巧与强度耐用,两头都要。 图片展示的为Bumi小布米原型机,最终产品敬请期待。 别看个头小,灵活度可一点都不打折。这款机器人全身拥有21个自由度(DOF)——比N2还多出3个,主要集中在腰部和腿部。 新增的腰部关节,让它在走路、转弯、起跳甚至跳舞时,能像人一样随时调整姿态,灵活转移重心、抵消惯性,动作更稳、更自然。 腿部自由度的增加,让它在不同地面上行走、舞蹈都更加自如,步态更协调,落脚也更精准。 能扭胯 什么样的腰部,可以支撑起这样的魔鬼舞步? 上半身的表演能力也不赖。 微妙的手部动作 手臂很有戏 肩部灵活 电池系统同样不含糊。采用48V平台,带来更强的电机输出能力,不仅能支撑多自由度的复杂动作,也让能量传输更高效、线束设计更简洁,让机身更加轻盈。 续航时间在1到2小时之间,虽然谈不上「持久战选手」,但对于教育、陪伴、演示等短时场景,或是具备固定充电设备的业务应用,已经够用。 懂交流,还能教娃学AI 要成为真正的人类伙伴,仅有「轻」和「灵」还不够,机器人必须「聪明」——能听懂、会沟通、懂回应。毕竟,智能才是让机器人走进现实世界的通行证。 小布米就是这样的存在。它能听会说、还能理解你的意思——无论是语音唤醒、自然对话,还是动作指令响应,都流畅自然。面对人类的语言和动作,它不仅听得懂,还能做出恰到好处的回应。 更有趣的是,它还藏着一项「教学技能」——会教人学AI。 它支持图形化编程,零代码门槛。孩子们只需拖拽积木块式指令,就能让机器人完成动作、互动甚至表演。复杂的算法和逻辑被转化成形象的拼图,编程变得直观、有趣、人人可懂。 教育,是松延动力最早耕耘、也最看好的方向。如今,公司教育场景订单规模很大,覆盖多层次的教育类场景。在人工智能课堂,学生用编程训练机器人循线行走;在幼儿园,它陪孩子做游戏,让他们在笑声中遇见科技。一次次课堂与活动,它在孩子心中,悄悄种下智慧的火花。 这一次,松延动力把这项被反复验证的教育能力带进了消费级新品。「它不仅是一台机器人,更是一块让孩子和创客学习AI、算法和工程思维的实验平台。」团队希望把编程从代码变成拖拽积木,让创造力人人可及。 在家庭中,它也成了连接两代人的科技桥梁。父母借它传授知识,孩子借它展示想象力。在这样的瞬间,机器不再冰冷,而是有了温度——承载爱、传递智慧,启发下一代。 9998也能打:供应链与自研的合力 这一次,松延动力把实验室的前沿技术浓缩进不到一米高的「小身体」,做出更多人买得起、玩得起、用得起的人形机器人,背后是对产品定位的「反向」思考。 行业普遍追逐「全尺寸」,松延动力专卷「小个子」。目前产品线分两路:一条是双足人形(代表作 N2、E1),另一条是仿真人形。 全尺寸当然酷,但成本与风险同样「全尺寸」。即便今年国内价格从「一套房」跳水到「一台车」,距大众购物车仍有距离;用户价值与成本、风险不成正比。 而小尺寸机器人轻巧、安全、不怕摔、好带走。更关键的是,它也够聪明——「大个子」会的,它基本都能干。在科研、教育、文娱、展览等对容错与效率更友好的场景里,小尺寸几乎能覆盖大尺寸的绝大多数能力,还更便宜、更灵活。 这样的策略,正逐渐被验证为正确路径。N2在「人形半马」后出圈,商业化进展也突飞猛进。此后在世界人形机器人运动会上亮相,热度持续拉满。松延动力也成为继宇树科技之后,国内又一家销量破千的人形机器人公司。 能做到这一切,自研的技术底座是关键。自研伺服电机输出精准动力,先进运动控制算法充当「小脑」,保障动作稳定、协调、敏捷。 以小布米为例,虽更紧凑却拥有21 DOF。要让这样一台多自由度机器人站稳、行走、起舞,控制系统必须更聪明。松延自研运动控制算法在此发力:深度强化学习叠加高性能伺服驱动,毫秒级修正姿态,动作顺滑且稳定。 松延动力在深度强化学习方面有着深厚的积累。强化学习能让机器人像人一样,通过试错与反馈不断进化。正如公司创始人姜哲源所说:「人类的学习技能过程包含试错、记忆、改进,强化学习也是一样,只不过把这一切交给了算法和算力。」 团队会先让机器人在虚拟仿真环境中接受高强度训练,再在高保真模拟中验证,最终才登上真机。结果已经证明一切——N2是目前全球第一台能在「一镜到底」拍摄中完成连续完美空翻的机器人。 空翻是公认的高动态、高难度动作,只有通过强化学习才能高效地自主习得并实现对力矩、时序的精确控制。 当然,能把价格打到「9998」,国产供应链同样功不可没。 过去三年,中国在电机、谐波减速器等核心部件上的突破显著,业内人士指出,国产零部件的成熟速度和成本下降幅度,都远超市场预期。 摩根士丹利今年5月报告称,减速器、电机、电池甚至螺丝在美国本土几乎难以完全替代,多数机器人厂商仍需从中国采购核心部件。 以人形机器人为例,其传动系统的核心部件——谐波减速器,国产品牌已开始全面替代国外厂商;执行器中的行星滚柱丝杠等高精度零件,也正被中国供应商逐步取代。 松延既是受益者,也是推动者。除北京研发基地外,松延动力还在多地筹建机器人制造工厂,形成研发—生产—测试—交付一体化能力。7 月单月破百台交付。 公司在伺服驱动、传感融合、高性能控制板卡等环节实现高度国产化与算法自研。姜哲源在接受《人物》采访时透露:「基本上全国产化了,现在连主控芯片都是瑞芯微 RK3588S,没有用进口的。」 最后一件事。 限时提醒:9998元仅在双十一至双十二期间开放优惠。 人形机器人,正在完成从实验室到客厅的「下凡」。它不再只是冰冷机械,而是可对话、可学习、可共创的智能伙伴;不只是技术结晶,更是「科技育人」的起点。 第一次把真·人形带进千家万户,这一仗不轻松,但足够值得。
放开成人内容,OpenAI是为了提升性能?
互联网有一条玩笑,叫做"搞黄色是第一生产力"。从最早的录像带到影碟机,从图片网站到短视频平台,成人内容始终是新技术和新模式普及的试验场。 上世纪80年代,VHS录像带之所以能击败画质更好的Betamax,就是因为成人内容制作商选择了VHS。90年代互联网刚刚兴起时,成人网站是最早探索在线支付和流媒体技术的先驱。进入移动互联网时代,成人平台又率先应用了自适应视频技术和用户订阅模式。 如今,AI大模型领域又重演了这一幕。 对于任何大模型来说,成人内容都是潘多拉的魔盒。打开它,意味着大量的用户涌入和可观的收入增长,但同时也意味着监管风险、道德争议和品牌形象的不确定性。 更关键的是,一旦打开就很难再关上,没有任何办法可以准确评估这些成人内容对产品生态带来的长期影响。但现如今,OpenAI执意要这么做。 2025年10月15日,OpenAI CEO山姆·奥特曼正式宣布:从12月起,ChatGPT将为经过年龄验证的成年用户开放成人内容生成功能。 自从ChatGPT问世,OpenAI就是行业的风向标。他们推出Dall·E,互联网上才开始有了文生图。他们推出了Sora,互联网上才开始有了文生视频。从12月开始,如果OpenAI开始毫无限制地输出成人内容,那么其结果可想而知。 事实上,在此之前,ChatGPT就已经具备了一定的成人内容生成能力。 2025年2月,OpenAI就悄悄放宽了ChatGPT的内容过滤器,允许在特定情况下跳过警告直接生成成人内容。用户通过特定的提示词,已经可以让ChatGPT输出一些成人向内容,只是这些功能并未被官方正式认可或系统化。 这种渐进式的政策松动,实际上为此次正式开放埋下了伏笔。OpenAI在测试市场反应,观察竞争对手的动向,同时也在评估技术可行性和法律风险。现在,他们终于决定迈出这一步。 《凡人歌》有句歌词,“道义放两旁,把利字摆中间”。马斯克就深谙这个道理,他旗下的Grok从一开始就采取了极其开放的内容政策。 如果你给ChatGPT讲一个成人段子,它会回复你说这个话题不适合讨论。但是如果你给Grok讲,它会回敬你一个更黄的。 Grok不仅允许模型输出成人内容生成,还推出了3D AI伴侣功能,包括动漫风格的虚拟女友Ani和虚拟男友Valentine。 根据Appfigures的数据显示,Grok的第三季度移动端收入达到1850万美元,较第一季度增长400%。这个增长数字远超其他AI应用,其中成人内容功能的贡献不可忽视。 付费订阅 “SuperGrok” 的用户,能够启用两款 3D 伴侣。Ani拥有好感度机制与记忆模式,用户通过互动可以提升好感度。当好感度达到一定等级后,就可开启 “成人模式”。 不过马斯克可不像奥特曼那样扭扭捏捏,他对成人内容此毫不避讳,甚至将其奉为Grok的核心竞争力。 他甚至在X平台上公开转发用户对Grok虚拟伴侣的喜爱,毫不掩饰地将成人内容作为产品卖点。有用户在推特上发帖说自己每天跟Ani聊天聊到凌晨,马斯克直接点赞并评论:“这才是AI该有的样子。”他甚至鼓励用户对Ani诉说污言秽语,称这是“言论自由”的体现。 连基座大模型都这样了,那些通过对基座大模型套壳的AI应用厂商更是肆无忌惮。 比如早些时候被谷歌收购的Character AI。这是一个AI陪聊平台,你可以在上面找到各种角色:霸道总裁、温柔学长、冷酷杀手、甚至是历史人物。 不过该平台存在明确的内容规范与限制,例如会对暴力、仇恨言论、极端内容等进行过滤,以维护基本的交互安全与合规性。但在实际使用中,用户仍能通过特定话术引导或模糊表述,使平台输出一些成人内容。 根据Appfigures的数据,Character AI年收入已突破3200万美元,拥有2000万月活用户,预计2025年底年收入将达到5000万美元。这个增长速度让很多传统互联网公司都眼红。 Character AI 的用户中女性占比约为55%。18-24岁的用户占比约为53%-57%,25-34岁的用户占比约为22%-24%,35-44岁的用户占比约为12%。更直观的是,Character AI的用户每日平均使用时长达75分钟,甚至堪比主流的短视频平台,这种粘性简直是产品经理的梦想。 除此之外,还有像Janitor AI这样,专门提供UGC的AI成人内容平台,更是直接以成人内容为卖点。根据Hackernoon的说法,Janitor AI在推出第一周就吸引了超过100万用户,70%的用户为女性,平台目前拥有超过35万个独特的AI角色。 事实证明,在AI这条赛道上,成人内容AI市场,规模庞大、来钱快、用户粘性强。这些活生生的案例摆在OpenAI面前,想不动心都难。 不过,OpenAI光明正大的搞黄色,并不只是为了流量。从大模型的训练上来讲,过度的内容审查会对内容审查进行污染,进而影响模型的整体性能。换句话说,禁止成人内容可能反而会导致模型变得“智障”。 严格的内容过滤会导致训练数据缺乏多样性,使模型在处理边缘案例时表现不佳。OpenAI在DALL·E 2的开发过程中就发现,过滤掉的图像往往代表了数据集中的某些重要聚类,这种过滤会导致模型在相关领域的表现下降。 这个问题的技术根源在于数据分布的完整性。大语言模型的训练依赖于对真实世界语言分布的学习,而真实世界的语言表达中,涉及性、情感、身体等话题的内容占据了相当大的比例。 当训练数据中这些内容被大规模过滤后,模型学到的就是一个被人为扭曲的语言分布。 而模型在训练阶段被强制回避某些词汇、概念和语境时,它的词嵌入空间(embedding space)就会出现"空洞"。这些空洞会导致模型在遇到相关概念时,无法准确理解上下文关系,甚至会产生语义漂移,从而降低模型的整体性能。 它可能无法准确理解包含这些元素的合法内容,比如文学作品、历史文献或医学资料。 OpenAI认为,这是为了让模型输出更安全、更符合道德标准的内容而必须做出的让步,他们还给这个“空洞”取了个名字,叫做“对齐税”(alignment tax)。 AI之所以会产生偏见,也是因为“对齐税”。过度的安全限制会让模型在创意写作、文学创作等需要丰富表达的场景中显得“刻板”和“说教”,严重降低了用户体验。 ChatGPT-5发布之后,许多用户抱怨ChatGPT过于“政治正确”,缺乏人性化的表达,这便是过度内容审查带来的副作用。 所以,一旦OpenAI放开了成人内容的限制,那么作为用户,你能明显感觉到ChatGPT的性能提升了,即使是无关成人内容。 而从企业角度来看,OpenAI面临着巨大的商业化压力。根据最新财务预测,OpenAI 2025年全年的预计收入是130亿美元,但企业上半年净亏损达到了73亿美元,全年净亏损预计135亿美元。这种巨额亏损状态迫使OpenAI必须寻找新的收入增长点。 摩根大通的报告显示,到2030年OpenAI的收入将达到1740亿美元,相当于占据25%左右的AI市场份额。虽然这个预测并非完全基于成人内容功能,但成人内容的开放无疑会成为重要的增长驱动因素。 可OpenAI也有头疼的地方,ChatGPT拥有超过7亿周活跃用户,但付费订阅用户仅约2000万,付费转化率不足3%。相比之下,专注成人内容的AI平台往往有着更高的付费意愿和用户粘性。 虽然奥特曼没有亲口承认,可我知道他也眼馋。 AI女友应用市场的增长数据更是惊人。根据GII Research的报告,2024年全球AI伴侣市场价值约为281.9亿美元,预计在2025年至2035 年间将以30.8%的复合年增长率扩张,换句话说,到了2030年,这个产业的市场价值就会突破1400亿美元。 不仅是如此,由于AI可以根据用户偏好生成高度个性化的内容,再加上AI生成内容的成本极低,这就导致输出成人内容的AI正在抢夺传统成人市场。 用户只需输入几句提示词,就能在几秒钟内获得定制化的内容,不满意还可以再次修改,并要求AI重新生成。可传统成人内容产业需要真人参与,成本高昂且受限于现实条件,也没办法一直修改直到用户满意。 根据ARK Investment的数据,成人AI网站已经从OnlyFans等传统成人平台抢夺了14.5%的流量份额,而一年前这一比例仅为1.5%。 所以,无论是从技术来看,还是从市场来看,OpenAI早晚都要全面解除这个限制,打开潘多拉的魔盒。 然而,成人内容也会带来巨大的挑战。年龄验证就是摆在OpenAI面前的第一关。 在国际社会,年龄验证是形同虚设的。比如全球最大的游戏分发平台Steam,它允许用户自行设定年龄,你可以是20岁的青年、百岁老人,甚至是远超人类寿命极限的存在。 OpenAI声称将建立严格的年龄验证机制,但奥特曼并没有明确表示具体使用哪种方法。再加上国际社会对于网络痕迹、隐私的重视,年龄验证机制一直是举步维艰。 与此同时,这也牵扯到了第二个问题——地缘政治。欧盟的AI法案是一个全面的法规体系,要求对AI系统进行严格的合规性审查。成人内容AI在很多欧盟国家都被视为高风险领域,必须满足严格的透明度要求、人工监督机制和事故报告义务。 如果违反这些规定,罚款可能高达公司全球年收入的4%或2000万欧元,以较高者为准。对于OpenAI这样的公司,罚款金额将是巨大的。 在美国,各个州对AI成人内容的法律是不同的。比如德克萨斯州和犹他州已经通过法律,要求成人内容网站必须验证用户年龄,否则将面临民事诉讼。加州正在推动更严格的《年龄适当设计规范法案》,要求平台默认屏蔽不适合未成年人的内容。 以国际上最大的成人网站PornHub为例,在日本、韩国等地进行访问时,只需勾选自己是否年满18岁。而在美国部分州进行访问时,必须上传以证明自己年满18岁的相关法律文件。 更麻烦的是,家长们可以联合起来起诉OpenAI,特别是在未成年人接触到不当内容并受到心理伤害的情况下。而且OpenAI是有前科的。 2025年8月,美国加州一对夫妇就起诉了OpenAI及其首席执行官,指控ChatGPT导致他们16岁的儿子自杀身亡,因为ChatGPT为其儿子提供了关于自杀方式的信息,还鼓励亚当伤害自己。 除此之外,美国联邦法律明确规定,任何形式的儿童色情内容,包括虚拟生成的,都属于违法。2019年,一名男子因持有AI生成的儿童色情图像被判处20年监禁。虽然OpenAI可以辩称自己已经采取了预防措施,但如果系统被大规模滥用,监管机构可能会要求OpenAI承担连带责任,甚至吊销运营许可。 奥特曼身处硅谷,身为IT精英,对于成人内容这个板块,他低不下头,放不下面子,这并不难理解。不过在面对董事会给出的压力时,他心里清楚,想站着把钱挣了,难上加难。
首个全国产!兆芯、联想开天联合打造AI教室:屏幕巧妙
快科技10月22日消息,近日,国内首个面向中小学生的全国产化AI教室,落地北京市第二十中学。 该实验室由兆芯和联想开天提供核心支撑,配置了数十套内置信创PC的一体化云课桌和信创高性能旗舰工作站。 其中,云课桌采用一体化设计,屏幕可以隐藏于桌面内,方便快速部署学习环境、灵活调度资源,还支持多端协同操作,可根据教学需求,将教室秒变理论授课室、小组实践室、个人探索电教室等不同场景。 工作站能够支撑从AI模型训练到智能体开发的完整流程,可以让全部同学同时进行模型训练或智能体开发。 该教室还内置了严格贴合《中小学人工智能通识教育指南(2025 年版)》的课程体系,引导学生从建立AI认知与系统思维,到进一步提升AI核心素养与跨学科实践创新能力,为学生掌握AI技能构建起系统性的阶梯式成长路径。 在首堂实践课程上,学生们亲手搭建了京剧知识智能体,不仅可以根据不同的需求配置相应的知识库,还能将机器视觉模型与智能体结合,实现“图像识别-知识讲解- 语音输出”的完整流程,并支持多语言讲解、个性化内容设计等。 当前,AI已成为引领科技革命和产业变革的战略性技术,在基础教育阶段普及AI教育,是培养具备AI素养的时代新人、实现科技自立自强的关键。 兆芯在不断迭代全国产x86处理器、提升性能的同时,还积极协同操作系统、云服务、应用软件等生态,围绕智慧校园、智慧课堂、智慧电教等教育行业核心场景,合作共建了一系列教育应用解决方案。 包括教育数据中台、教务综合管理与服务、校园身份互联认证、校园网络安全、信创实验室、3D科创教学、远程教学系统、信创双轨云教室、教育云桌面等等。 这些方案都实现了整机“开机即用”,外设“即插即用”,软件“想用就用”。 基于兆芯处理器,联想开天打造了一系列软硬件全国产、主流教育软件100%适配、部署本地AI大模型等的产品,包括笔记本、台式机、一体机、工作站等。 目前,兆芯、联想开天合作的解决方案,已在全国各级各类学校中得到广泛应用。
跌出双11预售20强榜单,始祖鸟的危机才刚开始
“炸山”风波的市场反噬已开始显现。 近日,天猫双11户外预售首日战报发布,去年还稳居前十的始祖鸟,今年彻底消失在20强榜单之外。 这并不令人意外。事件发生后,硬核户外爱好者公开抵制,社交平台上“退货”声四起。两天的沉默后,始祖鸟的致歉信姗姗来迟,却陷入 “双标甩锅”争议,其背后大股东安踏则始终沉默。 二者显然都深谙国内舆论场的“短期记忆”的特点,但冷处理没能等来舆论的遗忘,却等来了核心用户的转身。那些秉持“无痕山野”理念的户外发烧友,认为品牌背叛了精神内核。 背叛核心用户所带来的品牌危机,正迅速转化为实实在在的销售压力。 风波仍在发酵。10月15日,西藏日喀则市官方通报认定始祖鸟需承担相应生态赔偿责任。两天后,始祖鸟母公司亚玛芬体育内部公告宣布始祖鸟大中华区总经理Ivan She(佘移峰)离职,其职务暂由亚玛芬大中华区总裁Jeffery Ma(马磊)代理。 这场风波,更像是一根导火索,引爆了始祖鸟深藏已久的增长焦虑。在安踏的运作下,始祖鸟从小众神坛成功破圈,成为中产的身份符号。但高增长背后,始祖鸟的增速正连续放缓,其大中华区营收增长率从2021年的84%,逐步回落至2024年的54%。 为了支撑高估值和增长预期,始祖鸟的营销策略愈发激进,从联名奢侈品到玩转配货,不断向“泛人群”扩张,品牌的专业性逐渐被稀释。与此同时,市场上“平替”品牌层出不穷,国内外竞争对手也在加速分食它亲手做大的户外市场。 万元冲锋衣的价值,正被消费者重新审视。 资本市场的反应更为剧烈,始祖鸟母公司亚玛芬体育股价较“炸山”事件前跌去18%,连同大股东安踏,两家公司市值已蒸发超580亿元。 对安踏而言,始祖鸟不仅是其提升品牌价值的关键棋子,更是其全球化野心的支点。如何挽救这只一度高飞的“头鸟”,已成为安踏必须直面的一场硬仗。 背叛核心人群,或许是始祖鸟犯的第一个错误。 事件发生后,大量核心用户群体明确表达抵制态度,多位户外博主公开抵制始祖鸟,直言其行为背离“无痕山野”的户外准则,更有博主宣称放弃了和始祖鸟的商业合作。社交平台上,不少网友表示“不会再买”,还有网友声称已经在赶往退货的路上。 始祖鸟的核心用户显然是那些硬核的户外发烧友,他们之所以选择始祖鸟,除了产品性能外,更看重品牌所传递的精神内核。对于户外爱好者而言,敬畏自然不是更高追求,而是底线。 那么,始祖鸟为何要这样做? 回看这场被品牌方称为“致敬高山文化”的烟花秀,从其张扬、宏大、渴望被看见的表现形式来看,目标受众显然是那些将始祖鸟视为“中年三宝”身份符号的泛人群。 从2019年被安踏接手以来,通过门店入驻奢侈品扎堆的顶级商圈,跨界联名和饥饿营销等一系列运营,安踏把始祖鸟从小众户外品牌打造成了百万中产的身份信仰,不仅业务快速扩张,产品定价也一路水涨船高,千元的始祖鸟被卖到了上万。 然而支撑户外品牌高价策略的根基之一,正是品牌调性。 短期来看,收割“泛人群”的生意来得更快、更直接。但长期看来,大众消费者之所以向往始祖鸟,正是源于那些硬核专业人士构建的“光环效应”。一旦被核心人群抛弃,大众也会很快去魅。 面对排山倒海的批评,始祖鸟与安踏的“沉默”则是第二个错误。 事件发生后,始祖鸟并没有第一时间进行回应,而是在两天后才发布致歉信,内容却再次引发 “内外双标”“甩锅中国团队” 的新争议,之后,始祖鸟再度陷入沉默。而安踏也自始至终未发表任何声明。 直到事件发生约一个月后,西藏日喀则市官方通报认定始祖鸟需承担相应生态赔偿责任。此后,始祖鸟才宣布大中华区总经理离职。 就目前的反噬来看,想要挽回品牌口碑和用户信任并没有那么容易。 “炸山”风波不只是一次失败的危机公关,更是始祖鸟在中国市场陷入增长困境的集中爆发。 在安踏的运营下,中国市场已然成为始祖鸟的第一大市场。今年二季度,亚玛芬体育大中华区营收为4.1亿美元,同比增幅达到42%,营收规模首次超过北美市场,成为第一大市场。而曾经的最大市场美洲大区增幅只有6%。 但其中国市场增速放缓也是不争的事实。根据亚玛芬财报,2022年、2023年和2024年其大中华区的营收增长率分别为60%、61%和54%,而在2021年,这一数字高达84%。 业绩增速放缓下,急于抓住泛人群的始祖鸟在营销上愈发激进,不仅把自己从一个户外品牌塑造成了奢侈品牌,更成了二级市场的理财产品,连一个吊牌都被炒到了几百元。 2022年,始祖鸟与奢侈品牌古驰(Gucci)联名推出限定系列,在国内发售当天即被抢空,成为二级市场加价炒作的“投资品”。 奢侈品牌的配货也被始祖鸟玩到飞起,一个吊牌都能卖上三五百元。 在中国市场,始祖鸟不仅凭冲锋衣统一了中产们的衣柜,更培育出了一个更大的泛户外用户市场。一个穿始祖鸟的人不一定要去奔赴山海,他的目的地可能只是楼下的星巴克。 始祖鸟甚至让冲锋衣从中产破圈到年轻人。年轻人也需要这样一个符号,一个“热爱户外” 的符号,一个 “贴近中产” 的符号,因此一度有不少年轻人节衣缩食攒钱买始祖鸟,并热衷于在社交平台上拍照晒图。 但随着消费趋势的变化,消费者对户外装备的需求从 “炫耀性消费” 回归 “实用性需求”,始祖鸟高达数千元,甚至万元的定价开始受到质疑,尤其是国内外价差问题引发消费者广泛不满。 始祖鸟“平替”开始大行其道。“不是始祖鸟买不起,而是某某更有性价比”,成了大批户外博主的开场白。在社交平台上,骆驼、伯希和、凯乐石和拓路者等品牌都曾被当作始祖鸟“平替”。其中,骆驼率先吃到了“平替”红利,过去两年双11,分别喜提天猫户外和抖音户外榜的销冠。 诚然,这些“平替”品牌与始祖鸟所锚定的客群和消费层级并不重合,但那些原本可能 “攒钱买始祖鸟” 的年轻人,却有可能不再转化为始祖鸟的用户。 更重要的是,随着更多玩家的涌入,始祖鸟培育的市场正不断被分流。 硬核户外玩家们开始寻找更专业、小众和调性更纯粹的品牌;泛户外人群则在“一鸟二象三鼠”之间反复横跳;耐克、阿迪达斯等巨头也开始布局高端户外领域,推出专业户外系列试图分一杯羹;凯乐石和探路者等国内品牌,则通过聚焦细分赛道突围,以性价比优势抢占中高端市场。 如今这场 “炸山” 风波,更给了虎视眈眈的对手们一个加速追赶的机会。 即便保持沉默,安踏也难逃波及。炸山事件以来,安踏体育股价累计跌去12.5%,市值蒸发339.6亿港元。 作为将始祖鸟打造成中国市场现象级品牌的操盘手,安踏很难隐身。 2019年11月,安踏体育宣布以46.6亿欧元(约合360亿元人民币)完成对芬兰体育巨头亚玛芬体育的收购,这是中国体育品牌史上最大规模的海外并购。 彼时,旗下拥有始祖鸟、萨洛蒙等品牌的亚玛芬正陷入持续亏损的困境,中国业务仅占全球总营收约6%。 在安踏的一番运营下,亚玛芬成功逆袭。不仅在2024年完成了在美上市,还结束了持续5年的亏损困局。亚玛芬财报显示,2024年,公司录得营收51.83亿美元,同比增长19%;调整后净利润暴涨329%至2.36亿美元。这其中,始祖鸟在该年度的营收突破了20亿美元。 在此之前,安踏最成功的收购就是FILA,作为收购的第一个国外品牌,FILA一度为安踏贡献近一半营收,成为最大的“现金牛”,FILA增速放缓,在安踏集团的营收占比逐渐下滑。 对于安踏而言,主品牌定位大众市场,FILA主打中高端时尚运动,始祖鸟填补了集团在超高端户外领域的空白。其“户外爱马仕”的定位,吸引高净值消费群体,能够提升集团品牌形象和利润空间。 收购亚玛芬,安踏不仅收获财务回报,更获得始祖鸟、萨洛蒙等全球高端品牌矩阵。始祖鸟们的“抬咖”,不仅使得安踏从一个发源于晋江的三线品牌,坐稳了国内运动品牌头把交椅,还一跃成为全球市场上可以与耐克掰手腕的对手。 更重要的是,始祖鸟是安踏全球化布局的关键。通过收购其母公司亚玛芬体育(Amer Sports),安踏获得了进入欧美高端市场的通行证。 在用始祖鸟跟中产交上朋友之前,安踏走了不少弯路。直到通过“买买买”的方式将一众国际高端品牌收入麾下,丁世忠“不做中国的耐克,要做世界的安踏”的梦想才开始起飞。 近年来,除东南亚市场外,安踏也在加快拓展美国及中东市场。今年6月,安踏品牌进驻美国比弗利山庄,9月,其北美首店将正式营业。 与此同时,吃到并购红利的安踏也不忘寻找下一块新标的。今年4月,安踏发布收购德国户外品牌狼爪的公告,并于2个月后宣布完成收购。 但一方面,安踏的“买买买”之路已被一众国内同行效法,留给安踏的优质标的已经所剩无几。 另一方面,作为特定时期的产物,始祖鸟的成功也难以复制。始祖鸟进入中国时,正值中产阶级崛起、户外运动兴起、消费升级多重红利叠加的窗口期。安踏实施的奢侈品战略和饥饿营销,也恰逢社交媒体的爆发期,放大了品牌效应。 这也是为什么同样是安踏运营,迪桑特、萨洛蒙、可隆和狼爪等品牌都被寄予厚望,但却始终没能跑出“下一个始祖鸟”。 显然,在此之前,始祖鸟并不会就此成为安踏的“弃子”。如何修复品牌形象,挽回用户信任,成了安踏的当务之急。
人工最高节省90%,AI制作游戏被批“没有灵魂”
“之前画画的只想让AI帮忙画,作曲的只想让AI帮忙作曲,但现在变化非常大。”时隔一年再接受记者采访时,盛趣游戏美术总监林蕤感慨,据他所知,业界已有创业团队在探索复杂的AI应用方式,类似于可快速生成完整游戏的智能体,这些工具已在筹备。 同样认为AI对游戏形成巨大影响的,还有谷歌云游戏业务全球总监Jack Buser,他在近日一个播客中表示,AI已经到了影响游戏行业的重要时刻,“需要好几年甚至十年才能开发出来的游戏(video game)并不罕见,但有了AI,就能更快将想法付诸实践。” 虽然还有另一些声音认为,AI难以替代从业者的创意工作,但记者了解到,一些业内人士已经看到AI对游戏研发效率带来的巨大影响,且已在展望新的游戏生产方式。 头部公司已对外开放工具 AI对游戏制作的效率提升作用明显。 以往制作一款品质精良的游戏,耗时不低。例如,去年爆火的《黑神话:悟空》从立项到面世花了7年。《侠盗猎车手5》发布以来,玩家等待《侠盗猎车手6》则超过10年。 有游戏厂商近期统计了应用AI工具之后可以节省的工作量。 “游戏开发工作量大约有70%~80%是美术资产处理,其中两个大头是动画制作和模型制作。” 腾讯游戏效能产品部产品负责人刘奇申向记者表示。此前腾讯推出全链路AI创作解决方案VISVISE,包含AI自动蒙皮工具、动画生成工具等,覆盖游戏制作多个环节。 据刘奇申介绍,动画制作的骨骼绑定环节中,蒙皮占了70%~80%工作量,是人力重投入的环节,“原本需要1天半到3天半完成的工作,用AI工具1~3 个小时就能完成,节省 70%~90%人工。” AI也可用于动画制作的关键帧制作环节。刘奇申告诉记者,在游戏动画行业,人工K帧(手工逐帧调整)仍占主导地位,占比60%。但在高度依赖动画师经验的情况下,单角色动画制作周期可能长达数周,动画师手动补帧耗时占角色动画制作总工时的60%~70%,中小团队选择手工K帧,人力成本占项目预算可达30%以上。但如果使用动画生成大模型,AI则能根据关键帧5~10帧自动生成60帧流畅动画,将效率提升3~5倍。 腾讯内部项目已统计过AI带来的效率提升。据介绍,光子工作室的角色动画制作周期缩短了40%,还有的项目组中,角色技能原型验证时间从2周压缩至3天。 刘奇申告诉记者,这些工具已经在腾讯内部头部项目使用,并开放给外部公司。包括完美世界、库洛游戏在内,现在至少有50多家外部公司在使用这些工具。出海业务也在推进,这些工具已向一些日韩头部游戏公司和欧洲游戏公司开放试用。 一年前,林蕤看到的还是AI替代一些2D美术制作,现在他的感受是,3D工具品质也变高了,游戏制作成本下降可以明显看到。 他向记者举例,以《黑神话:悟空》这种体量和品质的游戏为例,游戏取了近40个外景,包含各种雕像、大型建筑,要带无人机和3D扫描设备区景区扫描,需要取景团队、现场指导、当地地陪等,前期研发人员还要花大量时间准备。但如果使用一个成熟的3D生成工具,基本上只需要坐在办公室选照片、花几分钟做前置处理、让工具生成模型再做简单处理、放到引擎中使用,“并不是说AI工具可以替代一个建模很厉害的人,但至少展现出一种可落地的新制作方式。在合适场景下,AI工具会带来很大帮助。” 林蕤表示,他的团队做过一些项目验证,发现3D工具尚无法用于一些高品质资产的制作,难以在3A游戏中发挥核心作用。但在一个大型项目中,除主角、标志性建筑等需要特别抓眼的资产外,还有一些玩家无法靠近观察的次级资源,例如植被、山林、路边雕像、半山腰的亭台楼阁等,原来要花大量人力物力去构建,现在3D生成工具已能替代人力高效完成。 “还是以《黑神话:悟空》举例,其制作成本3亿元以上。对于美术成本超亿元的3D类产品来说,其中20%~30%的次级资源可以用AI工具解决,由此达到千万元级别的降本效果。” 林蕤向记者分析。 替代掉一些高成本支出环节的同时,AI的使用成本并不高。林蕤告诉记者,盛趣目前使用订阅制的AI工具,同时部署本地工具。游戏外包人员每人日薪基本过千元,正式员工日薪更高,人力成本远高于订阅制AI工具,“生成一张符合要求的图,现在开箱率普遍不超过10张,即生成10张必有1张符合要求,每张成本很低。如果无情地做量化统计,AI肯定有很大优势。” 中小团队接受度更高 对于AI的能力,业内还是有不同看法。 本月早些时候,特斯拉CEO马斯克成立了xAI游戏工作室,宣布将在2026年底前发布一款AI生成游戏。《博德之门3》背后的工作室Larian Studios的发行总监Michael Douse公开表示,马斯克承诺的AI生成视频游戏不靠谱,AI无法提供优秀游戏必需的创意和远见。 类似这种AI“没有灵魂”的表达是业内一种代表性观点,也有些玩家发现了目前AI游戏的程式化和枯燥性。已发行的AI游戏中,米哈游联合创始人蔡浩宇成立的AI公司8月发布了AI游戏《星之低语》。有玩家在Steam平台上评论称,这款游戏更像一个技术演示,玩久了有些枯燥。也有玩家称,估计游戏背后的模型有很多限制,大大削弱了游戏可玩性,玩家的新鲜感过后会觉得对话公式化且乏味。 不过,也有从业者对AI是否具有“灵魂”有了新的看法。一年前,林蕤告诉记者,游戏充满人性与创意,而AI缺少人性的表达。一年后,他的想法发生了一些微妙的转变。“业内有强烈排斥AI的声音认为,AI做出来的东西没有灵魂,我原来也这么想。”他告诉记者,但后来他接触过一个小说工具,AI生成的故事让他大吃一惊。 “我一直觉得AI和人的差距是,人能高度概括一些语义,触发他人的联想,听到‘梗’的人会心一笑。现在AI在这方面的进步令人惊讶,AI好像逐渐学会了如何触动人。” 林蕤表示,虽然目前业内还有一些人排斥AI,但他认为AI带来的创作方式多样化不是坏事,不论将AI当作敌人还是朋友,从业者都要尽量了解它,不听不看的态度是危险的。 对于AI如何影响游戏制作流程和不同规模的团队,业内也有一些讨论。 林蕤告诉记者,AI工具能发挥最大作用的地方,是独立游戏这种极小型的团队,以及一些做短平快项目的轻量级团队。“原来需要依附一个中大型团队,或需要在一个十人以上团队中完成的工作,现在由于AI赋能,可以一两个人就把事情做了。” 他表示,这是一种技术平权的体现,AI解决了少数人“能不能做”的问题,让原来没有太多学习积累的人获得新的能力。 然而,林蕤表示,AI还无法让一个没有太多专业能力的人一步跨到专家级高度,人与人之间的高度并未被拉齐。一个个人开发者和一个大且成熟的团队之间的品质差距还很难拉近,这也是为何现在AI工具更多是中小型团队在大量使用。而目前3A这种品质要求特别高的商业项目,为了口碑或研发工作稳定性等,大多还没广泛铺开AI工具使用。 刘奇申表示,相比大型团队,小型团队在一些环节没有制作时间方面的优势,用AI工具则能大幅提升流程效率,这对小型团队更有价值,“我觉得未来的形态是:AI 工具提高大型公司的团队配合度并节约制作成本,同时让中小型公司发挥长处、尽量弥补弱点。” 刘奇申举例,游戏动画制作时,3A游戏厂商多采用动捕(动作捕捉),3A大作单角色面部及身体捕捉成本约50万~100万美元。独立工作室较依赖的手工K帧精细程度可与动捕比拟,成本则次之。中型厂商多使用预存标准化动作的动作库,成本最低但质量也最低。“整体呈现出投入越大、效果越好的情况。但在AI出现后,大家技术上能有更平等的权利。AI能把原来门槛比较高的工作,比如动作捕捉、找大团队精修,降到小团队也能负担的程度。”他表示。 提升效率的同时,整个游戏工业管线并未被颠覆。刘奇申称,目前他的团队提供的工具主要还是关注提效,没有将原来的工作流程完全打破。林蕤表示,新技术成熟衍生出新的生产管线是必然的,但产业原有的专利、渠道、生产工具协议、合作等壁垒或规则,已花费几十年乃至更长时间构建,打破重组并不容易。 不过,技术迭代还在带来新可能。近期也出现了一些可能影响游戏制作的新技术。8月谷歌更新了可交互的通用世界模型Genie 3,交互感与游戏体验相似。视频模型方面,Sora2面世后,近日谷歌也推出新视频模型Veo3.1,新模型可模拟人物语言和环境音。 “世界模型就像一个经验包,包含世界各种规律。它有很大好处,例如项目向上级汇报时要告知游戏玩法,传统的做法是在游戏引擎中做出Demo,要按月来规划时间,汇报结束后才有下一步决策。但用世界模型生成,或许就能很快表达游戏玩法,在意思传达方面有很好的推动。”林蕤认为,此外,人们面对日渐增多的AI工具将寻求更聚合的解决方案,智能体将成为聚合线上线下资源的支点,用户可以输入数值、文本等前置材料就快速生成完整游戏。这种智能体若能与世界模型结合,会让做出来的游戏更精彩。 刘奇申称,目前他的团队在探索的工具是出于较传统的角度,推动游戏制作往更自动、更智能的方向走,世界模型则是从最终形态往回推,这两种不同的路径未来可能有所交集。3D生成世界的路径可能还要再过三五年,才会推动一些独特的工作流出现,在此之前,多种AI工具预计将并存一段时间。
研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真
IT之家 10 月 22 日消息,康奈尔大学最新研究指出,大语言模型(LLM)在长期接触低质量网络内容后可能出现类似“大脑退化”(brain rot)的现象,其理解力、推理力及伦理一致性均显著下降。 这一发现令业界再次聚焦“死网论”(Dead Internet Theory)—— 即网络因充斥机器生成或低质内容而逐渐失去人类创造力的假说。 AI 性能受“低质数据”影响显著 研究团队以 Meta 的 Llama 3 和阿里云 Qwen 2.5 为实验对象,通过构建不同质量比例的数据集,测量低质量内容对模型性能的影响。 结果显示,当模型仅以低质量内容进行训练时,其准确率从 74.9% 骤降至 57.2%,长文本理解能力从 84.4% 降至 52.3%。 研究人员还指出,这种“剂量 — 反应效应”(dose-response effect)意味着模型在持续接触低质数据后会出现逐步退化现象,不仅推理链条被简化甚至跳过,生成的回答也更表面化。此外,模型的伦理一致性下降,出现“人格漂移”(personality drift)倾向,更容易输出错误信息。 “死网论”引发科技圈担忧 近几个月,多位科技界人士公开表达了对“死网论”的担忧。Reddit 联合创始人 Alexis Ohanian 表示:“如今互联网上的很大一部分实际上已经‘死了’—— 无论是机器生成的、半 AI 的内容,还是充斥着低质量信息的社交平台。”他呼吁未来的社交网络应能“验证人类真实性”。 OpenAI 首席执行官 Sam Altman 也持类似观点,认为“死网论正在我们眼前发生”,并称现今多数 X(前 Twitter)账号已由 AI 接管运营。 网络内容质量危机正在加剧 亚马逊云科技(AWS)研究团队去年发布的报告指出,目前约有 57% 的网络内容是由人工智能生成或翻译的,这一趋势正影响搜索结果的质量与可靠性。 前 Twitter 首席执行官 Jack Dorsey 亦警告,由于图像生成、深度伪造(deepfake)与视频合成技术的普及,“我们将越来越难分辨真假”,用户必须通过亲身体验来验证信息真伪。 随着 AI 生成内容的快速扩散,互联网正面临内容质量与真实性的双重考验。业内专家提醒,如果人工智能模型与网络生态继续陷入低质量循环,所谓“死网论”终有一天会成为现实。
DeepSeek-OCR:大模型技术,正站在一个新的十字路口
想象一下,在这个AI技术如潮水般涌来的时代,我们忽然发现,一张简单的图像,竟然能以惊人的效率承载海量文字信息。这已不是“想象”,而是刚刚发生的现实。 本周,DeepSeek开源了一个名为“DeepSeek-OCR”的模型,它首次提出了“上下文光学压缩”(Context Optical Compression)的概念,技术细节和背后的论文也随之公开。 虽然市场上的讨论还不多,但这或许是AI演进史上一个悄然却深刻的转折点——它让我们开始质疑:图像,是否才是信息处理的真正王者? 01 图像的隐秘力量:为什么图像可能胜过文本 回想一下,我们日常处理的文档、报告、书籍,往往被分解成无数的文本标记(tokens),这些标记像砖块一样堆砌成模型的“理解墙”。 但DeepSeek-OCR却另辟蹊径:它将文字视为图像来处理,通过视觉编码,将整页内容压缩成少量“视觉标记”,然后再解码还原为文字、表格甚至图表。 结果呢?效率提升了十倍之多,准确率高达97%。 这不仅仅是技术优化,而试图证明:图像不是信息的奴隶,而是它的高效载体。 拿一篇千字文章来说,传统方法可能需要上千个标记来处理,而DeepSeek只需约100个视觉标记,就能以97%的保真度还原一切。这意味着,模型可以轻松应对超长文档,而不必为计算资源发愁。 02 架构与工作原理 DeepSeek-OCR的系统设计像一部精密的机器,分成两个模块:强大的DeepEncoder负责捕捉页面信息,轻量级的文本生成器则像一位翻译家,将视觉标记转化为可读输出。 编码器融合了SAM的局部分析能力和CLIP的全局理解,再通过一个16倍压缩器,将初始的4096个标记精简到仅256个。这正是效率的核心秘密。 更聪明的是,它能根据文档复杂度自动调整:简单的PPT只需64个标记,书籍报告约100个,而密集的报纸最多800个。 相比之下,它超越了GOT-OCR 2.0(需要256个标记)和MinerU 2.0(每页6000+标记),标记量减少了90%。解码器采用混合专家(MoE)架构,拥有约30亿参数(激活时约57亿),能快速生成文本、Markdown或结构化数据。 在实际测试中,一台A100显卡,每天能处理超过20万页文档;如果扩展到20台八卡服务器,日处理量可达3300万页。这已不是实验室玩具,而是工业级利器。 03 一个深刻的悖论:图像为何更“节约”? 这里藏着一个有趣的悖论:图像明明包含更多原始数据,为什么在模型中反而能用更少标记表达?答案在于信息密度。 文本标记虽表面简洁,但在模型内部需展开成数千维度的向量;图像标记则像连续的画卷,能更紧凑地封装信息。这就好比人类记忆:近期事件清晰如昨,遥远往事渐趋模糊,却不失本质。 DeepSeek-OCR证明了视觉标记的可行性,但纯视觉基础模型的训练仍是谜题。传统大模型靠“预测下一词”这个清晰目标成功,而图像文字的预测目标模糊不清——预测下一个图像片段?评估太难;转为文本,又回到了老路。 所以,目前它只是现有体系的增强,而非替代。我们正站在十字路口:前方是无限可能,却需耐心等待突破。 如果这项技术成熟推广,它将如涟漪般扩散影响: 首先,改变“标记经济”:长文档不再受上下文窗口限制,处理成本大幅降低。其次,提升信息提取:财务图表、技术图纸能直接转为结构化数据,精准高效。最后,增强灵活性:在非理想硬件下仍稳定运行, democratize AI应用。 更妙的是,它还能改善聊天机器人的长对话记忆。通过“视觉衰减”:将旧对话转为低分辨率图像存储,模拟人类记忆衰退,扩展上下文而不爆表标记。 04 结语 DeepSeek-OCR的探索意义,不止于十倍效率提升,更在于它重绘了文档处理的边界。它挑战了上下文限制,优化了成本结构,革新了企业流程。 虽然纯视觉训练的曙光尚遥,但光学压缩无疑是我们迈向未来的一个新选项。 相关常见问题索引: 问:为什么不能直接从文字图像开始训练基础模型? 答:大模型成功靠“预测下一词”的明确目标和易评估方式。对于文字图像,预测下一个图像片段评估困难、速度慢;转为文本标记,又回到了传统路径。DeepSeek选择在现有模型基础上微调,解码视觉表征,但未取代标记基础。 问:与传统OCR系统相比,速度表现如何? 答:处理一张3503×1668像素图像,基础文本提取需24秒,结构化Markdown需39秒,带坐标框的完整解析需58秒。传统OCR更快,但准确率同等时需数千标记——如MinerU 2.0每页6000+,DeepSeek仅需800以内。 问:这项技术能否改善聊天机器人的长对话记忆? 答:是的。通过“视觉衰减”:旧对话转为低分辨率图像,模拟记忆衰退,扩展上下文而不增标记消耗。适用于长期记忆场景,但生产实现细节待详述。
百川发布循证增强大模型M2 Plus,号称“医生版 ChatGPT”
IT之家 10 月 22 日消息,据百川大模型官方微信公众号消息,今天,百川发布了循证增强医疗大模型 Baichuan-M2 Plus,同步升级配套应用百小应并开放 API。这是百川自 8 月开源 Baichuan-M2 以来的又一次重要动作。 官方称,评测显示,M2 Plus 的医疗幻觉率较通用大模型显著降低,相比 DeepSeek 低约 3 倍,优于美国最火医疗产品 OpenEvidence,可信度比肩资深临床医生水准。 据官方介绍,百川 M2 Plus 首创六源循证推理(EAR)范式,打造“医生版 ChatGPT”,让大模型技术在辅助临床诊疗场景迈过“敢用、可用”关键门槛,不仅适合中国医疗环境,在美、日、英的医疗评测中均超过 OpenEvidence,代表中国在世界大模型擂台上再下一城。 IT之家附官方对 Baichuan-M2 Plus 介绍的原文如下: 首创六源循证推理范式,把循证做“全”、检索做“准”、推理做“对” (一)六源循证:打造从原始研究到真实世界的完整知识体系 循证医学(Evidence-Based Medicine, EBM)作为现代医学知识体系的核心范式,是确保医疗决策可信的关键。 通用大模型像一个“博学但不可靠”的专家,即便有搜索增强,也会因为知识来源混杂不符合循证医学范式。 我们不仅主动屏蔽了互联网的非专业信息来源,只使用权威来源的医学证据,在此基础上构建了从证据、到实践、再到真实世界反馈六层证据类型的知识体系: 原始研究层:索引海量医学期刊论文 4000 余万篇,超过 PubMed 收录数量,涵盖基础与临床研究成果,是循证链条的起点; 证据综述层:整合系统评价和 Meta 分析等高等级证据,提供经过汇总的研究结论; 指南规范层:引入国际和国内权威机构发布的临床指南、专家共识和行业标准,确保回答符合最新规范; 实践知识层:包含临床病例报道、一线专家经验和诊疗技巧等实用知识,贴近医疗实践场景; 公共健康教育层:汇集权威科普和公共卫生知识,如疾病预防宣教、健康指导等内容,服务大众健康教育; 监管与真实世界层:涵盖药监部门公告、临床试验登记及大规模真实世界研究数据等信息,以反映最新的监管动态与人群研究结果; 这个金字塔形的“六源”,是一层一层演化而来:原始层回答“事实是否存在”、证据层回答“结论是否一致”、指南层回答“行业如何规范”、实践层回答“医生应如何决策”、公共层回答“患者应如何理解”、真实世界层回答“是否存在新风险”。这让模型从“生成答案”走向“据实回答”,实现了从语言可信度到知识可信度的跃升。 (二)循证检索:从“找得到”跃升到“找得准” 传统的 RAG 检索往往追求“找得到”,而循证检索追求“找得准”。 M2 Plus 采用 PICO 框架(人群 Population、干预 Intervention、对照 Comparison、结局 Outcome)思维,将查询转化为结构化医学问题,并在六源数据库中进行分层匹配。 例如:当输入“老年 OSA 患者使用 CPAP 能否改善高血压?”时,系统优先在高等级证据(系统综述、RCT 元分析)中搜索,并自动辨识研究质量、样本量、置信区间与结局指标。 这种方法克服了通用 RAG 的两大缺陷:一是缺乏医学语义理解(无法区分 CPAP 疗效与依从性分析);二是无法辨别文献可靠性(新闻与指南同权)。 在此基础上,M2 Plus 能够三步精准锁定“铁证”: 第一步,智能提问:自动将用户问题拆解成多个专业的 PICO 查询,进行“地毯式”证据搜索,兼顾精度与广度。 第二步,精准锁定:通过自研的 Medical Contextual Retrieval 技术,完整保留文献的临床因果链,避免信息割裂。 第三步,证据排序:内置“审稿人”模型,自动评估证据等级(如 RCT、Meta 分析),将最可信、最相关的“铁证”优先呈现。 (三)循证推理:让模型“像医生一样思考” 如果说“六源循证”解决了医疗 AI 知识从哪来的问题,“PICO 智能检索”解决了如何快速找到正确证据的问题,那么最关键的一步是如何确保 AI 在手握证据时,不会“自由发挥”、脱离事实胡乱回答。 我们在 M2 Plus 中引入“循证增强训练”机制,为模型的回答过程“上了一道锁”,从根本上改变了其生成逻辑,让它学会“引用,而非臆测”: 首先,在训练中奖励“引用”,惩罚“臆测”,准确引用权威来源(如指南、文献)时会获得高分,一旦回答脱离了检索到的证据就会受到惩罚; 其次,内置“证据评估器”,模型被训练得能够自动评估检索到的证据质量,优先采纳高可信度的信息(如 RCT、Meta 分析),并将其无缝嵌入到推理链中; 第三,句句有据,可回溯、可验证:经过训练,M2-Plus 的回答风格发生了根本性改变,在输出关键结论时,会自动附上参考文献、指南出处等来源,这赋予了 AI 回答更高的可解释性与可信赖度。 幻觉最低,达到与人类资深临床专家同等可信度 这种“循证驱动”的生成逻辑,让 M2 Plus 几乎杜绝了无中生有的内容。在多场景评测中,其综合幻觉率在所有大模型当中最低,相较 DeepSeek R1 最新版降低 3 倍,显著领先 OpenEvidence。不仅如此,在病史分析、诊断思路、治疗方案等真实复杂的核心医疗场景中,达到了与人类资深临床专家同等的可信度。 301 医院的姜医生提问,“目前公认最有效的基因治疗药物靶向足细胞递送方案有哪些?”很多通用大模型回答这个问题时都产生了明显幻觉,而 M2 Plus 的回答不仅查到了全球最新研究成果,还能按纳米系统 / AAV 病毒载体等维度分类。姜医生赞叹:“引用文献非常具有专业性、且信息源紧贴顶刊 ERA 等最新进展,对足细胞基因治疗这么前沿的方向,能帮我快速了解国际热点技术路线,少走弯路。” 北京天坛医院的熊医生,在研究目前 PACAP 在偏头痛中的研究进展如何时发现,头痛相关的研究越来越多,想找到真正有价值的文献并不容易,多数大模型给出的答案都因幻觉问题而不可用。他试用百小应时看到,“能梳理全球 PACAP 偏头痛研究,从机制到 III 期临床试验自动串联证据链,不仅回答问题,更让医生站在未来看科研进展。” 无论是专业医疗问题还是常规医疗问答 M2 Plus 都会引用权威医学证据多国医学考试断崖领先,医学知识运用能力超越人类医生 美国执业医师资格考试(USMLE)是评估临床知识和推理能力的黄金标准,即便是经验丰富的临床专家,要突破 90 分也极具挑战。在此项考试中,M2-Plus 取得了惊人的 97 分,不仅远超人类考生平均水平,更与 GPT-5 的成绩持平,稳居全球第一梯队,展示了其世界级的临床问题解决能力。 中国执业医师资格考试(NMLE)及格线为 360 分,对于广大医学生而言,能考到 450 分以上已是高分,超过 500 分则被视为“学神”级别。M2 Plus 取得了 568 分的“碾压级”成绩,在所有公开测试的主流大模型中位列第一,充分证明其对中国临床指南和医疗实践的掌握已炉火纯青。 如果说执医考是“从业门槛”,那么中国硕士研究生招生考试临床医学综合能力(西医)考试则是顶尖医学生竞争的“华山论剑”。该考试不仅知识面广,且题目设计极为复杂,对临床思维要求高。通常,能考到 280 分以上的考生,都是协和、北医等顶尖学府的头部学霸。M2 Plus 在此项考试中取得了 282 分。 同时,在日本、英国、澳大利亚等国高级医师职称晋升考试中,准确率 85% 以上,远超各国及格线。 这些压倒性的成绩充分说明,M2 Plus 在复杂医学知识运用上的能力,已经超越了人类医生水准。 “医生版 ChatGPT”推动医疗 AI 迈入可信可用阶段 接入 M2 Plus 的百小应已在各大手机应用商店更新,成为 " 医生版 ChatGPT"。为方便电脑端使用,网页版(ying.ai)也同步上线。 随着大模型的普及,除了需要借助 AI 高效地辅助临床决策,医生还开始面对新的挑战:患者用 DeepSeek 自诊和带着 DeepSeek 就医的现象越来越多。虽然知道大模型可能有幻觉和偏颇,但没有时间和精力去甄别哪句对哪句错。通过百小应,医生有了面对通用模型挑战的“专属武器”。 对于希望深入理解诊断、治疗、预后、病因、检查等背后科学逻辑的患者及家属,面对复杂的就医环境和不同医生给出的诊疗方案,百小应让他们有机会获得最新最权威的知识、顶尖专家的思维和视角,得到无限耐心的专业解答。 Baichuan-M2 Plus 也提供了标准化 API 接口,医院信息化部门、互联网医疗、大健康服务等各类泛医学机构,以及从事医疗 AI 行业的开发者,则可以通过 API 将循证推理接入服务场景,提升 AI 服务的医学专业性。 通过开源 Baichuan-M2、发布 Baichuan-M2 plus、百小应,开放 API,百川致力于持续提升 AI 医疗在真实临床场景的可用性,推动大模型在严肃医疗场景进入落地可用新阶段。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。