EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
谷歌揭秘AI生图模型为何叫Nano Banana:最初仅用于“占位”
IT之家 11 月 6 日消息,今年下半年,谷歌的 AI 生图模型 Nano Banana 一瞬爆红。11 月 5 日,谷歌官方揭晓了其名字的来历:原本只是一个深夜临时想出的“占位符(placeholder)”,结果因为网友们太喜欢,谷歌干脆顺势采纳。 在最新一期《Made by Google》播客中,产品负责人 David Sharon 表示,这款模型的正式名称其实是 Gemini 2.5 Flash Image。当时,一位名叫 Nina 的产品经理为了让用户在 LM Arena 基准网站上匿名测试模型,需要输入一个临时名称。凌晨两点半,她灵光一闪,随手写下了“Nano Banana”。没想到模型很快在网上爆红,用户纷纷用这个有趣的昵称称呼它,于是谷歌决定正式沿用。 Sharon 透露,团队甚至在 Gemini 应用内加入了多个香蕉图标,用来标示这款模型出现的位置,可谓彻底“玩上了梗”。 谈到技术亮点,Sharon 表示,真正让他惊讶的是模型在还原人物面孔方面的准确度。能让生成的角色真的像本人,而不是一个“AI 生成的相似版本”,正是这款功能迅速走红的原因之一。 他还提到了一些在全球范围流行的创作趋势:例如源自泰国、仅 90 个词的“人偶”提示语、宝丽来拼贴风照片,以及修复老家庭照片的玩法。同时,他强调了生成式 AI 图像的安全措施 ——Gemini 生成的图片都带有可见水印和隐形的 SynthID 标记,以确保来源可追溯。 对于第一次体验“Nano Banana”的用户,Sharon 建议先从简单入手。在 Gemini 应用中可以直接使用现成模板,例如风靡一时的“人偶”玩法:上传一张照片,就能看到自己化身新形象。之后,还能继续尝试不同服装、场景或年代风格,探索更多玩法。
小马智行港交所鸣锣,或成2025年全球自动驾驶最大IPO
11月6日,小马智行正式在香港联合交易所主板挂牌上市,股票代码2026。 小马智行微信公众号信息显示,本次港股IPO中,已悉数行使发售量调整权,共计发行约4825万股。若承销商的超额配售权悉数行使(即绿鞋后),集资额可达77亿港元,成为2025年全球自动驾驶行业规模最大IPO,同时是2025年港股AI领域募资额最高的新股。 2024年11月,小马智行在美国纳斯达克以股票代码“PONY”成功上市,成为“全球Robotaxi第一股”;不到一年后在港股挂牌,标志着正式构建起“美股+港股”双重主要上市架构。 小马智行创始人兼首席执行官彭军表示:“经过近九年的坚持和探索,小马智行已经站在自动驾驶大规模商业化的前夜。技术的积累、场景的落地、生态的构建——一切准备正迎来收获的时刻。港股上市是我们全球资本战略的关键一步,更是我们面向全球市场、链接更广泛资源的重要里程碑。” 作为自动驾驶领域的先行者,小马智行自2016年成立以来,致力于为全球市场提供出行和物流领域的自动驾驶技术和解决方案。公司目前已在硅谷、北京、上海、广州、深圳及卢森堡设立研发中心,并向欧洲、中东及亚洲等地拓展产品和业务布局。其核心业务覆盖自动驾驶出行服务(Robotaxi)、自动驾驶卡车服务(Robotruck)及技术授权与应用业务三大板块,不仅是中国首个在北京、上海、广州、深圳四大一线城市均取得无人驾驶出行服务许可的公司,也是中国唯一在北上广深一线城市开展全无人Robotaxi商业化运营的公司。此次港股上市,将为公司进一步推动车规量产、商业化以及海外落地提供关键资源,加速驱动自动驾驶从“技术可行”走向“运营可验证”。
人形机器人等待ChatGPT时刻
文 | 海克财经 许俊浩 AI浪潮持续高涨。 机器人领域颇为典型。由中国机械工业联合会等单位主办的2025中国机器人产业发展大会,近日召开了新闻发布会。发布会数据显示,国内机器人产业规模高速增长,营收已由2020年的1061亿元增长到了2024年的2378.9亿元;2025年前三季度,国内机器人产业营收同比增长29.5%,工业机器人产量达59.5万台,服务机器人产量达1350万套,工业机器人和服务机器人产量均已超2024年全年。 作为AI的关键载体与核心落地方向,机器人正为产业变革注入全新动能。这一趋势更流行的表述是“具身智能”,后者指具有物理载体的智能体,能够通过感知、决策与交互能力在现实世界中执行任务,并在与环境互动中持续进化。具身智能已在推动技术从算法模型迈向现实世界,进而拓展AI应用边界,为实现通用AI探索更多可能。 从定义看,具身智能不止包括人形或其他形态的机器人,也包括搭载AI模型的无人机、智能汽车等。具身智能中,人形机器人赛道尤为引人注目。从海外的Figure AI、特斯拉到国内的宇树科技、智元机器人等,全球创新力量带动行业疾步向前,不断刷新。 2025年10月29日,挪威科技公司1X发布家用人形机器人NEO,以约2万美元(约合人民币14.2万元)的售价或每月499美元(约合人民币3500元)的月度订阅费用开放预订,计划于2026年交付。宇树科技则将人形机器人带入“双十一”大促活动,以2.99万元的价格在京东平台售卖。 自2022年11月ChatGPT点燃全球AI热潮,AI迅速进入大众视野,从遥不可及的高端科技变成人人皆可使用的工具。CNNIC即中国互联网络信息中心发布的《生成式人工智能应用发展报告(2025)》显示,截至2025年6月,国内生成式人工智能用户规模已达5.15亿人,普及率为36.5%。 生成式人工智能或称生成式AI、AIGC的发展促进了相关领域,特别是具身智能行业的发展,使《我,机器人》《机器人总动员》等科幻作品中的人与机器人共处的场景离现实越来越近。于是,科技巨头重金押注,创业公司争相入场。在这场关乎科技未来的竞争中,玩家们竭力挖掘护城河,试图率先创造人形机器人的“ChatGPT时刻”。 01 求解动作难题 如今人形机器人的迭代可谓日新月异。 机器人表演就颇为显眼。在2025年1月的央视春晚上,宇树科技机器人H1表演的《秧Bot》仅是根据节奏扭动身体和转动手帕,动作相对简单。到了2025年10月,在舞剧《天工开物》的谢幕环节中,宇树科技机器人已能精准复现舞者姿态,以流畅的侧翻、后空翻等完成“人机共舞”。 宇树科技机器人相关表演视频在抖音、快手等平台迅速传播,目前视频点赞量已累计超过130万。有用户在评论区发出感慨说,机器人动作年初看起来还不协调,没几个月已经协调到这种地步,像是“输入武功秘籍”了。 机器人的突破性进展是科技发展数十年持续积累的结果。 要知道,AI奠基者艾伦·图灵在1950年的论文中就提出过智能必须依托物理实体与外界动态交互才能形成。只是受限于科技水平,半个多世纪以来,机器人都与真正意义上的具身智能相去甚远。 在2011年福岛核电站事故中,救援现场找不到具备实际作业能力的成熟机器人,有限的设备在复杂辐射环境中频频受困,甚至被散落电缆绊倒,难以执行关键任务。在此之后,DARPA,即美国国防部高级研究计划局宣布举办机器人挑战赛,旨在推动灾难救援机器人技术研发。 第一届美国国防部高级研究计划局机器人挑战赛2012年10月启动,直到2015年6月才决出胜者。决赛需要机器人进行抵达任务区、自主下车、打开房门、关闭闸门、借助工具开洞等操作,参赛机器人大多步履蹒跚,频频跌倒,多数都无法完整完成所有操作。获得冠军的是韩国KAIST研发的机器人HuBo,行进时并不是依靠双足,而是以万向轮保证机器人的速度和平衡。亚军则是由波士顿动力研发的机器人Atlas。 彼时该决赛视频引发了公众热议——机器人行动迟缓,错漏百出,与公众期待的灵敏、智能的助手形象毫不相干。 作为全球头部人形机器人公司,成立于1992年的波士顿动力曾是行业先驱。早在2017年,波士顿动力的Atlas就展示过后空翻。然而,Atlas原先采用的是液压驱动系统,高强度、高精度的同时还有高能耗、高噪音和高成本的问题,难以商业化。波士顿动力2013年被谷歌收购、2017年转至软银,2021年又被韩国现代收购。软银时期,波士顿动力曾以约7.5万美元(约合人民币53万元)的价格将机器狗Spot推向市场,仅售出约400台。 空翻动作之所以被视为机器人技术发展的关键里程碑,在于它系统性融合并推动了机器人硬件设计、动态控制与实时决策等多个核心领域的进步。 据海克财经了解,要完成空翻动作,机器人的驱动系统要瞬间释放足量功率密度,且高负载持续时间极短;系统需实时解算包含前后、左右、上下平移及绕三轴旋转的六自由度运动方程,超过0.5度的角度偏差就可能导致落地失衡;机器人脚踝、膝盖与髋关节需要减震缓冲,要求脚掌力传感器在0.01秒内感知地面反作用力并作出响应。 以宇树科技为代表的新玩家舍弃了液压驱动方案,选择纯电驱动技术路线,克服了原先电力驱动功率不如液压驱动的问题,通过自研高扭矩电机与轻量化结构设计来保证动作完成性与成本的平衡。比如宇树G1,用23-43个关节电机设计,最大关节扭矩达120N·m,使其即使在侧空翻这类对横向惯性控制要求极高的动作中仍能维持整体稳定。 波士顿动力亦于2024年4月推出了电驱版Atlas,标志着电驱技术路径获得更广泛认可。到了2025年2月,国内企业众擎机器人成功完成全球首次机器人前空翻,实现了技术上的重要突破。与前阶段常见的后空翻相比,前空翻对机器人的动态平衡能力、瞬间爆发力与精准落地控制提出了更高要求。 02 智能从何而来 空翻等高难度动作的突破,意义远不止于技术展示。 这些动作能够系统验证整机控制系统与关键零部件的成熟度,为机器人在复杂现实环境中的应用奠定了基础。在2025年9月的公开演示中,宇树机器人G1面对连续推搡与踢打,能够很快反应,恢复至站立状态,展现出了相当的运动智能。 这标志着机器人从实验室走向复杂现实世界的进程再度加速。 自2022年AIGC的突破及特斯拉推出机器人Optimus原型机以来,全球人形机器人产业进入快速发展期。国泰海通证券2025年11月发布的一份研报综合多方数据显示,2024年国内人形机器人企业注册量为104家,同比增速104%;人形机器人亦是投融资热点,2025年1-7月,国内人形机器人行业融资达101起,融资额超过260亿元,已超过2024年全年融资额;2024年以前,人形机器人行业处于实验测试阶段,产品性质为原型机,规模多在10台以内,2024-2025年,行业进入试制阶段,部分头部企业开启数十台至数百台的试点交付,2025年以后行业将进入规模量产阶段。 需要说明的是,机器人行业玩家根据业务重心可划分为硬件型与软件型两大发展路径。硬件型企业以机器人本体为核心切入点,聚焦关节模组、电机、减速器、控制器等关键零部件的自主研发,并重点突破运动控制算法。这类似于人类的“小脑”,其产品通常以载重、速度与运动性能作为主要衡量指标,比如波士顿动力、宇树科技等。 软件型企业则更多从具身智能技术出发,以前沿的视觉语言大模型、世界模型、仿真合成数据等大脑能力作为研发起点,通常通过外采零部件进行本体集成,重点强调机器人的认知与决策智能,比如银河通用。而像特斯拉这样具备规模化制造基础的车企,能够凭借深厚的硬件制造基因与来自智能驾驶的软件积累,在机器人领域展现出软硬一体的全栈能力。 在人工智能技术尚未成熟阶段,机器人完全依赖工程师编写的精确轨迹代码执行任务,本质与传统的生产设备并无差异。正如波士顿动力Atlas在2017年展示的后空翻动作,本质上仍是预设程序的精确执行。 之后,机器人学习进入数据驱动阶段,通过观察模仿与反复试错自主学习技能。更进一步以后,智能系统与自主学习深度融合,机器人开始能理解抽象指令,在陌生环境中主动尝试解决方案,逐步向能应对复杂现实的自主智能体进化。由此,全球玩家在算法上各展所长。 海外头部玩家Figure AI在2025年2月宣布终止与OpenAI的合作后,转向自研端到端AI模型,据称其AI大模型Helix已取得重大技术突破。Helix首次将双系统思维引入VLA模型(视觉语言动作模型),系统1专注于实时动作控制,能够以极高响应速度处理视觉信息;系统2拥有强大场景理解和语言解析能力,负责解读复杂指令、识别环境要素,并制定行动规划。双系统架构还在模块化迭代能力方面颇具优势。二者可独立优化,无需重新调整整体模型。 国内玩家智元机器人则于2025年9月宣布全面开源其通用具身基座大模型GO-1,该模型采用了创新的ViLLA架构,是全球首个采用该架构并开源的通用具身智能模型。ViLLA架构的全称为Vision-Language-Latent-Action,能够通过引入隐式动作标记,有效弥合图像、文本输入与机器人最终动作执行之间的语义鸿沟,使机器人能够更准确地理解人类指令并转化为精细动作。 此外还有美国的Physical Intelligence和Skild AI等新玩家,正对世界模型这一前沿领域进行探索,旨在让机器人构建一个内在的物理世界模型,从而能够预测自己行动的结果。 03 挑战依旧颇多 机器人行业已开始构建系统化的技术发展框架。 类比L1至L5的自动驾驶分级体系,智元机器人提出了G1至G5的具身智能技术路线图。据海克财经了解,G1级针对特定场景定制,缺乏跨场景迁移能力;G2级则能洞察多场景任务,结合大语言模型实现有限泛化;G3级转向端到端数据驱动,在架构层面实现范式转换;G4级引入通用操作大模型与仿真数据,显著提升复杂任务表现;而G5级作为长期目标,将实现从感知到执行的完全端到端自主操作。 在机器人技术迈向更高水平的过程中,泛化是极为重要的挑战。 所谓泛化,指机器人能够在不同场景中灵活执行多种任务,无需针对每个新场景重新训练或调整。就目前来看,机器人在特定环境下熟练掌握的技能,难以有效迁移到新场景、新任务或新对象上。它或许可以在实验室环境中精准完成抓取动作,但只要更换一个不同形状的杯子,或改变光照条件,其性能就会显著下降甚至完全失效。 这一挑战的根源在于现实世界的无限复杂性。真实环境是开放且动态变化的,物体的形状、材质、摆放角度,以及光线、背景干扰等因素的组合几乎是无穷尽的。人类无法为所有可能性预先编程,也难以收集覆盖所有边缘情况的训练数据。面对一个反光强烈的桌面、突然出现的宠物,或是形状特异的日常物品,机器人操作的准确性便会大幅度降低。这意味着真正意义上的自主智能还为时尚早。 被很多网友揶揄的北京亦庄机器人马拉松赛事即是一例。2025年4月,该人形机器人马拉松赛事聚集了知名机器人及智能制造生态企业超过300家,参赛机器人需要工程师团队全程跟随,负责更换电池、处理失衡等突发状况。比赛视频显示,有的机器人跑着跑着平地摔倒;有的机器人颤颤巍巍,走不出直线;有的机器人甚至直接把头部摔掉了。 而1X公司Neo机器人的相关视频展示了所谓家用机器人的现有水平。Neo完成从3米外冰箱取水的基本操作耗时超过1分钟,人类完成同样任务仅需十几秒。用户无法通过“请帮我收拾房间”这样的自然指令让机器人理解并执行这套复合任务。1X公司坦诚展示了远程操作员的存在,说明当前机器人尚未突破自主应对开放环境的核心技术瓶颈。 机器人训练数据的获取与使用也是亟待解决的重点问题。 如果采用虚拟仿真环境生成训练数据,机器人就必须面对Sim-to-Real Gap(仿真与现实差距)的问题。虚拟世界中的物理参数、传感器噪声与环境交互难以完全还原真实场景的复杂性,导致在仿真中表现优异的算法迁移至实体机器人时出现明显性能衰减。 如果完全依赖在真实环境中采集数据,则面临高昂的时间成本与硬件损耗,规模化推进存在现实阻力。比如特斯拉,就选择整合自有的Dojo训练中心,让Optimus人形机器人团队放弃传统的动作捕捉技术,转而采用纯视频学习方法,通过让机器人观察人类执行任务的视频录像,自主提炼行为模式并生成操作策略。 尽管机器人技术仍面临诸多挑战,但具身智能作为科技前沿的核心方向,发展浪潮已不可阻挡。在这一新兴赛道,国内企业积极布局并已取得显著进展,展现出快速跟进的态势。 政策层面同样已释放出明确支持信号。2025年3月,国务院发布的政府工作报告中明确提出,国家将以培育壮大新兴产业、未来产业作为重点工作方向。报告首次将具身智能与生物制造、量子科技、6G等并列纳入未来产业培育范畴,具身智能发展由此上升至国家战略层面。北京、杭州等地也都围绕具身智能及机器人产业发布了针对性政策文件,旨在加速技术突破和产业集聚。 就目前来看,机器人演进与智能手机产业的发展路径极为相似。早期各家厂商各自为战,技术处于路线分化的探索阶段,逐步走向关键突破点。正如智能手机的“iPhone时刻”重新定义了移动终端的形态与生态,机器人领域也将在未来迎来属于自己的临界点——当某项技术或产品以超越用户预期的体验出现时,将迅速推动行业标准的统一与生态的成型。 这一突破将不仅仅是技术参数的提升,更是用户体验的根本性变革。在AI领域,这更像横空出世的ChatGPT,将AI从实验室概念转化为生活的日常。量产只是漫长征程的第一步,技术的加速度已露端倪,科幻作品中的智能机器人走进寻常百姓家的那一天,离我们或已不远。
小鹏女机器人里面藏真人?何小鹏发一镜到底视频回应质疑
凤凰网科技讯 11月6日,小鹏汽车董事长何小鹏发视频,回应了网友对小鹏Iron机器人小姐姐走猫步,里面是真人的质疑。他表示,这种质疑让团队既高兴,又哭笑不得。为了打消这个质疑,团队强迫自己拍了个一镜到底无剪辑的视频。 自动播放 视频中,何小鹏读了几条网友的评论信息,“这里面是真人,放大能看到头部有耳朵的轮廓。”“臀部似乎有肌肉在动,并且似乎还有内衣内裤,而且还有衣服的褶皱,感觉里面像是有肉。” 随后,何小鹏让团队用一镜到底的方式,再次展示Iron走路的过程。为打消网友质疑,员工还把Iron的上衣拉链解开,能够明显看到,里面都是骨骼支架,完全没有人。 何小鹏解释道:机器人皮肤下面是肌肉,手中有谐波关节,绝对不是人;而头部看着像耳朵的地方,其实是两组麦克风阵列,解决了机器人听觉的问题。并且,从机器人走路过程中,还能明显听到电机旋转和散热的声音,这也进一步证实了Iron机器人并非真人。 据官方介绍,小鹏新一代人形机器人IRON采用了女性形态,其肌肉结构通过3D打印晶格材料模拟,表面则由无缝材料进行整体包裹。采用82个自由度的设计,并配备了全固态电池与仿生脊柱技术。 在核心算力方面,其搭载的3颗图灵AI芯片可提供高达2250 TOPS的总算力。功能实现上,IRON机器人搭载了物理世界大模型,旨在融合视觉、语言与行动能力,使其能够执行对话、行走和复杂交互等任务。
马斯克xAI要求员工交出生物识别数据训练“虚拟女友”Ani,引发内部不满
IT之家 11 月 6 日消息,据《华尔街日报》当地时间 11 月 4 日报道,马斯克的人工智能公司 xAI 要求员工提交个人生物识别数据,用于训练其女性聊天机器人“Ani”。 Ani 是一个拥有金色双马尾并设有成人内容选项的动漫头像,于今年夏天上线,专为订阅 X 平台每月 30 美元(IT之家注:现汇率约合 213.8 元人民币)SuperGrok 服务的用户设计。 会议录音内容显示,在今年 4 月的一次会议上,xAI 的公司律师 Lily Lim 要求员工提交自己的生物识别数据,以帮助训练这款 AI 伴侣,让其与顾客互动时更具“人性化”。 作为保密项目“Project Skippy”的一部分,担任 AI 导师的员工被要求签署授权书,授予 xAI“永久、全球范围内的非独占、可再授权且免版税的使用权”,并为其使用、复制和分发员工的面部和声音数据“开绿灯”。这些数据将用于训练 Ani 以及 Grok 的其他 AI 伴侣。 报道称,一些员工对这一要求感到不满,担心自己的面部或肖像会被卖给其他公司,或被用在深度伪造视频中。员工也对该聊天机器人的性暗示和其“老婆”形象表示不满,但他们却被告知,收集这些数据是为了“推进 xAI 使命的工作要求”。 据IT之家此前报道,目前,Grok 已有四种、五位“AI 伴侣”形象,分别为“AI 男友”Valentine、“AI 女友”Mika 和 Ani,以及“AI 萌宠”小熊猫 Rudi 的两种形态 Good Rudi 和 Bad Rudi(除 Good Rudi 外均为 18+)。
牵手王楚钦,联名麦当劳,奔驰想和年轻人麦驰一下
全新奔驰纯电 CLA 上市了。 昨晚的发布会,奔驰一上来就不按套路出牌,选择先报价格:24.9 万元起。 在豪华品牌里,这么不吊胃口的开场并不多见,甚至放在整个汽车行业里也是头一回。 除了不搞「最后揭晓」那套,整场发布会给人的感觉也挺放飞。奔驰没搞宏大叙事,也没念 PPT,而是办了一场「游园会」,北京梅赛德斯-奔驰销售服务有限公司总裁兼首席执行官段建军,甚至还上台自黑了一把。这种坦诚又松弛的范儿,在以前的奔驰身上几乎是见不到的。 奔驰的画风突变,其实要从半个月前它和麦当劳的联名活动说起。 10 月 16 日,奔驰先是发了则「寻车启事」,@麦当劳说全新奔驰纯电 CLA 跑去了「M」,紧接着又发布了一条不正经的广告,真就用拍汉堡的方式去拍全新奔驰纯电 CLA。 是松软的汉堡,还是让人放松的头枕? 是点亮味蕾的酱汁,还是点亮心情的氛围灯? 这广告能帮忙卖多少车不好说,但至少,广大「麦门人」这回都记住全新奔驰纯电 CLA 了。 从「我定义」到「你参与」 「麦驰」(Match)这对新 CP,看着只是一次会玩的跨界,但奔驰显然是想明白了才去做的。 这次联名玩得很有章法。它始于一则「寻车启事」,当线上的好奇心被点燃,奔驰和麦当劳又顺势把这股流量引到了线下。 客观来讲,这套线下承接做得非常扎实。奔驰和麦当劳在全国 6 座城市铺开了联名「星级主题店」,店内的「星级品鉴区」让你可以一边看车一边吃汉堡。同时,喷涂着「安格斯」黑金涂装的全新奔驰纯电 CLA 痛车也开始上路,甚至还转化成了真实的送餐服务——你有机会让一辆全新奔驰纯电 CLA 来给你送麦乐送。 这一系列操作,把一次线上传播,变成了一场覆盖「线上社交+线下体验」的完整活动,而不是简单发个海报、拍个广告就结束的一次性营销。 在这之前,传统豪华品牌做营销往往更习惯于「筛选」,也就是用特定的精英符号,去圈定那些出现在高尔夫球场、艺术中心、财经论坛的,符合品牌调性的目标用户。这更像是一种「我在这里,你过来看」的姿态。 奔驰这次反其道而行之。 麦当劳是当下最普适的消费符号之一,「麦门」更是年轻人玩梗的亚文化。奔驰主动走进「麦门」,是在用一种更接地气的方式,跟更广泛的年轻用户打个招呼,混个脸熟。 如果说和麦当劳的联名是奔驰打开局面的「面」,那么选择王楚钦作为品牌新锐大使,就是这轮营销中那个最精准的「点」。 王楚钦的身份很巧妙,他不只是奔驰的品牌新锐大使+星愿基金的首位公益伙伴,同时也是麦当劳的品牌代言人。于是乎,他天然成了「麦驰」联名的最佳代言。 但奔驰看中的其实不止是这点巧合,更重要的是王楚钦身上的标签:「新生代」的实力、赛场上的「拼搏」与「突破」,代表着一种锐利、向上的力量。 这种特质,与同样是新生代、同样需要在中国这个内卷的市场中拼搏与突破的全新奔驰纯电 CLA,在精神内核上是高度契合的。这款新车承载着推动奔驰电动化转型的重任,它需要一个同样有冲劲的伙伴。 所以我们看到,在奔驰官宣的短片里,几乎没有传统「产品+明星」的同框。奔驰没有急着让王楚钦开上全新奔驰纯电 CLA 去兜风,而是花了大量的笔墨去讲述他的成长故事——那些在训练馆里的汗水、曾经被质疑的低谷,以及那句「为什么不能是你」的自我叩问。 这是一种更高级,也更慢的打法:和用户达成精神上的共鸣。 它不再是单向地输出「我有多豪华」,也不是简单粗暴地流量变现,而是通过一个有血有肉的故事,提炼出「成长与突破」的价值观内核,去和这届年轻人交朋友。 这届年轻人看过了太多的明星代言,对那种拿钱办事的商业合作早已脱敏。相反,一个能真正打动他们、让他们觉得「这很真实」的故事,反而能建立起更牢固的品牌好感。 除此之外,奔驰还请王楚钦担任了梅赛德斯-奔驰星愿基金的首位公益伙伴。后续,双方将共同发起青少年素质教育公益项目,计划在未来 4 年为全国 100 余所学校(含 4 所奔驰希望小学)的孩子们提供涵盖文体、美育、科普等内容的素质教育物资及课程,助力青少年成长成才。 更年轻的奔驰,更年轻的全新奔驰纯电 CLA 奔驰在营销上又是「麦门」,又是王楚钦,动静搞得这么大,它到底图什么? 原因其实很简单:市场变了,用户也变了。 J.D. Power 在 2024 年的报告里就提到,95 后已经成为中国新能源车市场占比超过 26% 的关键群体。因此,占领这部分用户的心智非常重要。 奔驰必须用实际行动来破局。那些破圈营销,就是他们拿出的新姿态。但光有姿态还不够,所有的声量最终都需要一个坚实的产品来落地——全新奔驰纯电 CLA。 全新奔驰纯电 CLA 是奔驰 MMA 平台的第一款量产车,它几乎承载了电动奔驰能否被中国年轻人重新接受的全部希望。 这一次,奔驰在产品上确实拿出了不少诚意。 首先,在中国消费者最看重的「智能化」上,奔驰拿出了和 Momenta 联合研发的智能辅助驾驶系统,开始支持城区领航辅助驾驶。与此同时,新引入的豆包大模型让语音助手变得真正好用,不仅是唤醒时间缩短到 0.2 秒,还能识别多种方言,对于模糊指令的识别率也要更高,比如: 帮我找一家适合全家人一起吃饭的餐馆,要好停车的。 其次是本土化的空间需求。针对中国消费者对大空间的偏好,奔驰特别推出了全新奔驰纯电 CLA 的长轴距版本,比海外标准轴距版增加了 40 毫米,继续回应中国市场的真实需求。 再次,是在能效和安全这两个看不见的「里子」上,奔驰也拿出了工程上的偏执。 能效上,全新奔驰纯电 CLA 应用了 VISION EQXX 能效概念车技术,用 800V 平台和两挡变速箱,通过北京到上海只充一次电的 1204 公里的京沪高速实测,证明其解决了高速续航焦虑的能力。 安全上,它不仅有远超国标的电磁抗干扰和热失控标准,甚至在全行业追求电子门锁的时代,偏执地保留了最原始的机械拉线开锁结构。这种在极端情况下「兜底」的工程思维,同样是一种诚意。 当然,还有价格。昨晚开场就公布的 24.9 万元起的售价,绝对是一个有诚意的姿态。奔驰还为 12 月 31 日前下订的客户提供了包括 0 首付金融方案、最高 3 万元的辅助驾驶优惠等多重礼遇,抢先晒单还会送一个限量奔驰行李箱。 经过智能化的补课,如今的全新奔驰纯电 CLA 在产品力上已经有了和同价位自主品牌掰手腕的资本。更何况,它车头挂着的,是那枚三叉星徽。 当能打的配置和奔驰的品牌溢价结合在一起时,这种「质价比」就成了一种新的吸引力。然而,真正让这场发布会显得不一样的,是奔驰在产品之外,所展现出的一整套体系化的转变,特别是销售体系的转变。 传统豪华品牌最大的痛点之一,就是经销商模式下的价格不透明。奔驰推动的统一售价,就是想解决这个信任问题,让消费者不用再花时间去砍价,也不用担心买完就背刺。 现在,呈现在我们面前的是一个更年轻、更坦诚、也更敢玩的奔驰。 这不只是为了卖好全新奔驰纯电 CLA 这一款车,更是奔驰这个百年品牌,在面对中国市场和年轻一代消费者时,一次主动的、全面的自我革新。 全新奔驰纯电 CLA 作为 MMA 平台的先锋,只是打响了第一枪。 当然,这场仗并不好打。对手们不会停下来等奔驰调整好姿态。但无论如何,看到一个百年品牌愿意卸下先前的人设,放低姿态、坦诚沟通、认真补课,这本身,比全新奔驰纯电 CLA 这款车更值得玩味。
索尼新数据集可检验AI模型是否公平对待不同人群
IT之家 11 月 6 日消息,索尼人工智能(Sony AI)发布了一个用于测试人工智能模型公平性与偏见的新数据集,名为“公平以人为本图像基准”(Fair Human-Centric Image Benchmark,简称 FHIBE,发音类似“Phoebe”)。该公司称,这是“首个公开可用、具有全球多样性、基于参与者知情同意的人类图像数据集,可用于评估各类计算机视觉任务中的偏见问题”。换言之,该数据集旨在检验当前 AI 模型在多大程度上能够公平对待不同人群。值得注意的是,索尼在评估过程中发现,目前没有任何一家公司发布的数据集能够完全满足其设定的公平性基准。 图源:索尼 索尼表示,FHIBE 有助于应对 AI 行业在伦理与偏见方面的挑战。该数据集包含来自 80 多个国家近 2,000 名有偿参与者的图像,所有参与者的肖像均在明确知情同意的前提下被使用 —— 这与当前业界普遍采用的、未经许可大规模抓取网络数据的做法形成鲜明对比。FHIBE 参与者可随时选择撤回其图像。据IT之家了解,这些图像还附有详细标注,涵盖人口统计学和身体特征、环境因素,甚至包括拍摄时的相机参数。 该工具“验证了当前 AI 模型中此前已被记录的偏见”,但索尼强调,FHIBE 还能对导致这些偏见的具体因素进行细致分析。例如,某些模型在使用“she / her / hers”代词的时准确率较低,而 FHIBE 分析发现,此前被忽视的一个关键因素是这些人群在发型上的高度多样性。 此外,FHIBE 还发现,当 AI 模型被问及某个中立问题(如“该人物的职业是什么?”)时,会强化刻板印象。测试显示,模型对特定代词使用群体和族裔背景人群存在明显偏见,常常将受访者描述为性工作者、毒贩或小偷。而在被要求推测某人所犯罪行时,模型对非洲或亚洲族裔、肤色较深者以及使用“he / him / his”代词的人群,更频繁地生成“有毒”(toxic)回应。 索尼 AI 表示,FHIBE 证明了在数据收集中实现伦理、多样性和公平性是完全可行的。该工具现已向公众开放,并将随时间推移持续更新。相关研究成果已于本周三发表于《自然》(Nature)期刊。
丹·豪瑟:如果《荒野大镖客:救赎3》存在,自己会因未参与而失落
IT之家 11 月 6 日消息,据 IGN 今晚报道,Rockstar Games 联合创始人、前首席编剧丹・豪瑟表示,如果得知《荒野大镖客 3》正在开发而自己未参与,他会比未参与《GTA6》更感惋惜,但也坦言这款游戏“迟早会推出”。 2018 年问世的《荒野大镖客 2》被誉为史上最出色的西部题材游戏之一。豪瑟当时担任首席编剧,几乎 R 星的所有游戏都出自他的笔下。 豪瑟离开公司已超过五年,并于近日向 IGN 确认,《GTA6》的剧情与角色设定都不是出自他手中,但自己仍相信这部新作会表现出色。 豪瑟在 Lex Fridman 的播客节目中谈到,若 R 星未来重启《荒野大镖客》系列,他的情绪会更加复杂。 我花了大约二十年时间参与这些项目,其中十多年都亲自编写剧本,放下这些确实是个巨大的改变,也让人有些伤感。 每一部《侠盗猎车手》都有独立的故事,因此情感上相对容易放下。 但《荒野大镖客》是连贯的两部曲,如果有人继续制作续作,我可能会更难接受。不过那种事大概也会发生。毕竟我不拥有该系列的版权,那是离职时的协议内容。能创作这些作品是一种荣幸,但版权并不属于我。 关于《荒野大镖客 3》是否会问世,豪瑟认为系列延续几乎是必然的。据IT之家了解,饰演《荒野大镖客 2》主角亚瑟・摩根的演员罗杰・克拉克早在 2023 年就曾表示,自己“确信”《荒野大镖客 3》终将出现,但完全不知道何时会公布。但是,他同时也否认亚瑟・摩根会在续作中回归。
前Meta大佬推出智能戒指:内置聊天机器人,支持语音转写,不到2000元
编译 | 王欣逸 编辑 | 程茜 智东西11月6日消息,11月5日,美国智能硬件创企Sandbar推出了其第一个产品智能戒指Stream Ring和其配套的应用程序Stream。 该公司称,这款戒指配备了麦克风和触摸板,可以进行语音转录、与AI助手交互,还能控制音乐。用户可以在任意场景对Stream Ring说话,向它提问、制定list、记录灵感等,对话记录还会同步到其含AI服务的配套应用程序Stream上。该应用无需订阅即可享受无限笔记支持。 Sandbar专注智能硬件领域,成立于2023年,联合创始人为两位前Meta工程师。据外媒TechCrunch报道,该公司已获得了1300万美元(约合人民币9264.8万元)融资。 目前Stream Ring已进入预售阶段,银色版售价249美元(约合人民币1774.6元),金色版售价299美元(约合人民币2131元),预计明年夏天发货。从官网信息看,除了颜色,两款戒指其他配置没有什么不同,但价格差了50美元。 一、从Meta离职创业,专注研究智能硬件 Sandbar创办于2023年,由两位前Meta工程师米娜·法赫米(Mina Fahmi)和基拉克·洪(Kirak Hong)联合创立。Sandbar此前已从True Ventures、Upfront Ventures和Betaworks获得了1300万美元的融资。 Sandbar联合创始人:基拉克·洪(左)、米娜·法赫米(右)(图源:TechCrunch) Sandbar现任CEO米娜·法赫米在人机界面设计领域拥有丰富的经验,他曾就职于美国神经科技大牛布莱恩·约翰逊(BryanJohnson)创立的脑机接口公司Kernel与另一家智能眼镜创企Magic Leap,随后加入美国脑机接口技术研发公司CTRL-Labs。 两人正是在CTRL-Labs结识。2019年,Meta收购CTRL-Labs,这家公司的研发成果为后来Meta推出智能可穿戴产品打下了基础。从技术项目经理到产品经理,米娜·法赫米在Meta工作了将近4年。 Sandbar现任CTO基拉克·洪曾就职于谷歌,随后加入CTRL-Labs与Meta。 据外媒TechCrunch报道,法赫米曾在大模型刚兴起时尝试开发试验性的日记应用,然而,他发现这样的应用程序反而成了记录自己想法的障碍。鉴于他在硬件界面开发方面的经验,他转而探索对话式硬件界面。 法赫米称:“我很多想法都是在散步或通勤时冒出来的,但都会因为掏手机而错过。我和基拉克一直在思考怎么样才能第一时间捕捉到自己的想法,这就是我们推出Stream的初衷。” 二、内置AI聊天机器人,配套可转录编辑的应用程序 Stream Ring外层采用铝制材料、内层为黑色树脂,配备了麦克风和玻璃触摸板,内置触觉反馈,所有部件均防水,用户可将其佩戴在惯用手的食指上。 Stream Ring外观(图源:Sandbar) 在使用演示中,法赫米带上Stream戒指,通过长按触摸板就可以记录自己的想法。 默认情况下,戒指的麦克风处于关闭状态,长按可激活使用。这一麦克风能捕捉轻声细语,并在配套的应用程序中进行转录。Wispr Flow和Willow等AI语音输入应用程序同样支持Stream Ring。 法赫米展示Stream戒指及转录功能(图源:TBPN) Stream应用程序内置了一个AI聊天机器人,用户可以通过戒指和耳机与AI聊天机器人进行对话,对话会同步到应用程序内,用户可以将这些对话整理成单独的笔记,用户和AI都可以编辑数天或数周内讨论的内容。 Stream配套应用程序(图源:Sandbar) Stream Ring还可以进行个性化设置,用户对戒指说几句话后,应用程序会对声音数据进行处理,生成一个和用户极为相似的声音,由此给用户带来“独白”、与自己对话的效果。 法赫米称,在拥挤的场所,用户可以佩戴耳机与AI助手进行私密对话;不戴耳机时,也可以通过戒指进行添加待办事项、记录笔记或勾选清单等,戒指会在成功记录笔记时提供触觉反馈。 除了语音功能,戒指的触摸板平面还可用来做媒体控制器,用户可以使用戒指进行播放、暂停、跳过曲目以及调节音量等操作。虽然目前许多耳机也提供类似的控制功能,不过在一些特殊情况下(比如手上拿了很多东西),戒指可能会更方便高效。 Stream Ring功能(图源:Sandbar) Stream Ring已于11月5日开启预售,起售价249美元(约合人民币1774.6元),计划于明年夏天发货。 智能戒指配套的应用程序将先推出iOS版本。在订阅上,Stream Ring将配合应用使用,免费版支持无限笔记,专业版每月10美元(约合人民币71.3元),可解锁更多AI功能。参与预售的用户可免费获得三个月的专业版订阅功能。 法赫米称:“无论用户选择哪个订阅级别,公司都保证让用户完全掌控自己的数据,在静态和传输过程中均对数据进行了加密。” 他还补充说,Sandbar不赞成打造封闭的应用生态,他们还计划支持将用户数据导出到Notion等应用程序。 投资方True Ventures合伙人托尼·施耐德(Toni Schneider)称:“我们觉得这个产品很有意义。很多人都会认同语音和AI非常契合。而且当只需要语音交互时,手机、笔记本电脑等设备就显得有些繁琐,所以应该有一种新的设备形态出现。我们考察了很多产品,但很多都不太达标。” 结语:智能语音硬件赛道竞争日渐激烈 语音AI硬件领域竞争激烈,许多开发者正在探索戒指设备形态。芬兰智能戒指制造商Ōura、科技巨头三星,以及国内品牌如RingConn、追觅、魅族等都推出了智能戒指产品。 法赫米称,他不希望Stream成为一个助手或陪伴者,而是希望它成为用户表达想法的界面,并让用户保持完全的控制权。 不过就目前来看,虽然AI大模型给了智能硬件新的机遇,但相关智能硬件产品仍未受到主流市场的认可。 Sandbar智能戒指不同于其他专注于追踪用户健康信息的硬件设备,而是追踪用户自己的想法,这或许将赋予戒指这种形态的智能硬件更实用、更契合消费者的价值。
告别繁琐切换!昆仑万维SkyReels用“无限画布”改变AI创作,一站式搞定图文视频
作者 | 陈骏达 编辑 | 漠影 这一多模态AI创意工具,迎来多项重磅升级! 智东西11月6日报道,近日,昆仑万维旗下的多模态创意工具平台SkyReels迎来一波集中升级,其中最大的亮点就是,他们用一张“无限画布”,取代了复杂的创作交互方式。 在新版SkyReels上,无论是图片、视频生成还是数字人,每一种内容的生成、编辑与组合都可以在同一张“无限画布”上完成,并且通过简单拖拽即可实现多模态内容的自由创作。 这些新功能并非孤立存在,而是相互联动、形成层次分明的解决方案。SkyReels根据用户不同的工具使用能力,提供了三种创作路径: 熟悉AI工具的用户可以直接使用AI模型生成图片、视频、音频或数字人内容;希望更高效创作的用户,则可依托近30款聚焦特定场景的Expert Agent,快速完成生成;而对没有创作经验的小白用户,只需套用智能模板,通过简单的文字描述和画面替换,即可轻松复刻参考内容。 在此基础上,SkyReels还推出了Agentic Copilot模式——集Super Agent与Expert Agents于一体的“双核驱动”体系。用户可以通过自然语言、上传素材或提供链接,让AI理解并生成跨模态的创意内容。我们还用这一功能,复刻了Vlog之父Casey Neistat的拍摄风格。 无论是捕捉灵感瞬间,还是规划完整的创作流程,Agent都能提供智能辅助,让复杂的创作变得轻松、高效。 智东西对SkyReels近期的升级进行了全面体验。可以说,这一升级后的创作平台,不仅在功能上提供了便利,更在整体体验上实现了统一与流畅。无限画布、智能Agent等要素的结合,让用户能够在一个简洁直观的平台上,实现海量创意的可能。 一、一张无限画布,如何统一AI多模态创作? 如今的多模态AI创作平台看起来五花八门、功能强大,但用起来却常常让人头大。界面层层叠叠,操作逻辑又有点反直觉,更麻烦的是,不同功能之间(比如生图、生视频、生音频)等往往处在不同的界面,甚至是不同的网站,毫无连贯感。 例如,谷歌推出的AI视频创作工具Flow仅支持文本转视频、帧转视频和素材转视频,如果想用谷歌的Gemini 2.5 Flash生成图像,并用于创作,还需切换到谷歌的其他AI工具。 对创作者来说,这种割裂的体验打断了创作灵感,也拉高了AI工具的学习成本。AI本该让创作更轻松、更有趣,但现在的门槛反而挡住了许多好点子。 那么,一个真正以创作者为中心、能够打通多模态的AI创作平台,应该是什么样的? SkyReels给出的答案,就是一张“无限画布”。 打开新版SkyReels,占据视觉中心的并非密集的功能面板,而是承载创作素材的画布。这让用户的注意力和操作重心始终在创作本身,而不是被复杂的菜单和参数所干扰。 所有AI功能与模型都被整合到画布的侧边栏,既有昆仑万维自家的多款模型,也覆盖了当前业内的几乎所有主流模型。在这片空间中,用户可以自由地上传图像、音频、视频等多模态内容,文生图生成的素材可以成为图像编辑、图生视频的起点。 这种设计符合用户长期形成的心智模型。Photoshop以画布为中心,工具和功能区被放在侧边栏或顶部菜单,用户直接在画布上操作图像、绘制、编辑。AE同样以画布为视觉核心,所有特效、素材、合成操作在画布上直观呈现,工具界面相对辅助。 在继承经典创作软件的界面逻辑、降低用户学习门槛的同时,SkyReels也对多模态创作流程进行了创新整合,让创作在图像、视频、音频之间自由流动。 在无限画布上,用户主要以三种方式进行交互与创作:拖拽、对话、二次编辑。 用户可以一次性上传多张图片、多个视频,并根据创作需求将素材拖拽到对应的功能上。 例如,将静态图片拖拽到“视频生成”功能上后,它便会在画布原地变为动态视频。 如果需要让视频中的人物说出想要的台词,就只需拖动这个视频到“Avatar(数字人)”功能上,人物就能开口说话。 同时,用户还能在无限画布上捕捉并打磨灵感。当听到令人心动的音乐、看到有启发性的视频后,只需将音频拖入Chat界面,与智能agent对话。Agent能帮助用户逐步厘清创作需求,并最终生成相应的视觉画面。 在获得初步生成结果后,用户可以进行二次编辑——包括视频风格化、延长内容或进行UpScale画质升级等。这些操作都可在同一界面中完成,无需跳转或切换。 SkyReels的无限画布,把复杂的操作和设置都封装在了简单的物理动作背后。“我们希望用户不需要学习AI,而只需要使用AI。”SkyReels团队这样强调。 二、Agent深度融入创作,海量模板让数字营销更轻松 为了让创作的流程进一步提效与智能化,SkyReels 还引入了“双核驱动”的智能创作体系——由Super Agent与Expert Agents共同构成的全能与专业一体化系统。 在内容创作的早期阶段,灵感往往稍纵即逝,图片、文字、视频都有可能成为创作的起点。Super Agent的设计让捕捉这种瞬间的创意需求变得更为容易。 在试用中,Super Agent的多模态识别能力表现出色:无论是上传图片、输入文字,还是提供视频,它都能跨模态快速理解意图,并给出有针对性的反馈。 知名Vlogger Casey Neistat有“Vlog之父”称号,其风格启发了不少创作者。如今,借助Super Agent的能力,普通人也能在SkyReels中复刻Neistat的风格。 我们可以上传Neistat的Vlog,并输入指令“按照Casey Neistat的风格帮我打造一只关于小狗的Vlog”。Super Agent系统能根据视频的内容,并结合公开信息,分析提炼创作风格。 当用户的指令并不清晰时,Super Agent不会将错就错,而是会主动提问,让用户输入所需信息,或是选择创作方向。 完全了解用户需求后,Super Agent才会开始规划创作流程,帮用户逐步打造制作计划、分镜、生成角色与背景和生成视频,期间,用户不用手动切换工具,只需要确认Agent提出的方案或动作,仅在不满意时才需介入调整。 SkyReels生成的首个镜头如下,无论是清晨的纽约城,还是富有动感的运镜,都和Neistat的风格有几分神似。在此基础上,用户可以继续按照计划生成视频,最终获取足够的创作素材。 更值得一提的是,Super Agent并非单次响应的“问答式工具”,而是一个可以被随时唤起、持续陪伴的创作伙伴,可以参与到用户创作的每一个阶段。 相比Super Agent的通用创意能力,Expert Agents更像是一个针对垂直行业打造的“专业智囊库”。目前SkyReels已内置28个专家Expert Agents,覆盖市场营销、电商运营、虚拟形象打造和故事创作等领域。 在我们的体验中,营销类Expert Agent尤其值得关注。要使用Expert Agents,用户本身并不需要是特定领域的“专家”——Expert Agents在每个场景都会给出清晰的指引,用户按照指引,像做填空题一样补全产品卖点、目标受众、所传递的情绪、使用场景等关键信息后,系统便能生成完整的营销素材,如海报、宣传视频等等。 SkyReels帮助用户厘清消费电子产品的宣传视频拍摄策略 这28个专家Agent均在特定领域经过深度训练和优化。它们内置了该领域的专业知识库和成熟的工作流程,能够理解行业术语和复杂需求,提供具有行业洞察、可执行性强的专业方案。这使非专业用户也能快速获得具备可执行性的成品方案,而不必陷入反复调整和试错。 随着多Agent的协作机制进一步完善,未来,这些Agent或许将有望组成专业团队,协作完成更为复杂的任务。 同时,为进一步便利创作,SkyReels还配备了海量创作模板。这些模板同样主打“简单好用”,甚至连文字提示词都无需输入——用户只需上传基本的图像素材,即可完成替换。 例如,在服装外贸电商场景,SkyReels的模板已经覆盖了不同人种、不同肤色、不同服装类目,无论是T恤衫、卫衣、夹克还是大衣,都有对应的细分模板。 替换元素后,新的卫衣款式、品牌Logo能与原模板无缝融合,真正实现了模板效果的“所见即所得”。 智东西批量尝试了多个不同样式的模板,其融合效果始终稳定可靠,几乎没有割裂感和不自然的观感。 此类数字营销工具,让相关从业者无需耗费大量时间、精力拍摄宣传素材,也减少了他们学习AI工具的机会成本。从业者可以把精力集中于产品创意与市场策略本身,从而更高效地实现品牌传播与业务增长目标。 三、底层模型能力集中升级,数字人能实现多人对话了 “无限画布”、Agent、模板等创作方式的升级背后,是昆仑万维在视频生成模型底层能力上的不断突破。 数字人能力方面,SkyReels V3模型首先在生成长度上实现跨越,能完成数分钟的数字人画面生成。借助这一功能,我们甚至可以用自己打造的卡通形象,拍一部新品宣传广告片。 SkyReels在生成数字人时,支持32个运镜组合与镜头运动选项,能够满足不同叙事和画面表达需求,使视觉表现更加生动自然。这些特性,让数字人能胜任更为完整的营销叙事,提升宣传效果。 SkyReels V3还是业内首个支持单镜头多人多轮对话的数字人模型。在传统的数字人生成模型更多仅提供单人对口型和多人同时发声。SkyReels V3则能精准控制每个角色的说话时机、节奏、肢体语言和角色间的眼神互动,实现自然的多人对话流,甚至还能同步生成真实的环境音。 在创意场景,SkyReels现在还能将视频的创意延展,或是转变为特定的风格。 这些能力基于升级的SkyReels V3。其视频延长不再局限于业内“单镜头拉长”的传统方式,而是基于视频语义和用户Prompt,智能预测下一个镜头的合理延续与场景内容。 SkyReels V3视频延长支持多种切镜方式,包括影视拍摄中常用的切入镜头、切出镜头、反打镜头、多角度镜头、切离镜头等,能生成具备叙事逻辑与视觉连贯性的延展片段,让镜头语言更丰富,画面更具动感与电影感。 这一能力让用户可以从短视频中自然过渡至更完整的叙事结构,为影视预演、电商视频延展、UGC 创作等场景提供更高效的生成方式。 而SkyReels V3此次的风格化模型并非简单的“滤镜迁移”。它通过对视频时序一致性、细节保真度与光影逻辑的深度优化,实现了1:1的角色、动作和场景保真。 无论是“辛普森风”、“乐高风”还是“梵高风”,视频中的细节都能保持一致,让风格化不再只是“涂层”,而是深度地融合到画面之中。 与市面上常见的5秒级别LoRA一键风格化不同,SkyReels的模型保持了原视频的动态结构与语义逻辑。这让风格迁移具备了更强的稳定性和一致性,足以支撑时长更长广告创意、动画预演的视觉再创作。 结语:SkyReels升级背后,昆仑万维的AI全景布局 SkyReels近期的升级,只是昆仑万维在AI领域的部分探索。昆仑万维近期披露的财报显示,其AI布局已经涵盖大模型、AGI研究、多模态创作平台、智能音乐与语音、游戏与社交等方向,并开源了Skywork-Reward、Skywork-R1V、UniPic、Matrix-3D 等系列模型,推出了SkyReels、Mureka、Linky、StarMaker和DramaWave等多款应用。 这也带动了其业绩的快速增长。昆仑万维在本财年前三季度的营收已达58亿元,同比增长 52%,海外收入占比93%。作为中国AI出海的重要力量之一,昆仑万维有望持续推动AI技术研发、产品迭代和商业化应用,打造覆盖研发、创作和内容生态的全方位AI平台。
AMD:英特尔和英伟达的合作将加剧竞争,带来更大定价压力
IT之家 11 月 6 日消息,今年 9 月,英特尔宣布与英伟达达成合作,双方将共同设计并开发面向数据中心和客户端市场的定制 x86 芯片。这项价值数十亿美元的协议不仅意味着英伟达将利用英特尔的 x86 知识产权(IP)开发用于其数据中心及 AI 基础设施的定制 CPU,同时也将把英伟达的 RTX GPU IP 集成到面向 PC 市场的 x86 片上系统(SoC)中。 此前,业界曾质疑英特尔是否会因此放弃自身的 GPU IP 路线图而全面转向英伟达。对此,英特尔明确表示,其自有 GPU 路线图不会受到影响,公司将继续独立开发相关产品。英伟达的 RTX IP 将被用于一类不同的 SoC 产品,主要对标 AMD 的“Halo”设计,例如 Ryzen AI MAX 系列等。 据IT之家了解,针对英特尔与英伟达的此次合作,AMD 最初回应称,对其自身产品阵容充满信心,并将持续提供具有颠覆性的技术。 然而,在近期的一份声明中,AMD 态度有所调整,指出该合作将加剧市场竞争,并对其产品带来更大的定价压力。在接受《CRN》采访时,AMD 表示,竞争对手英伟达与英特尔之间的合作可能对其业务产生不利影响。该公司在向监管机构提交的文件中,已将此项合作列为“经济与战略风险”部分的典型案例,明确指出:“竞争对手之间的战略联盟、并购及业务合作可能‘加剧竞争,并对我们的业务产生不利影响’。” AMD 在文件中进一步强调:“此项合作可能导致我们产品面临更激烈的竞争和更大的定价压力,从而对我们的业务、财务状况及利润率造成实质性不利影响。” 尽管 AMD 的担忧不无道理,但需要指出的是,英特尔与英伟达联合开发的定制产品距离上市仍需数年时间。目前,AMD 的 Ryzen AI MAX 系列产品已上市多时,在移动平台提供了卓越的 PC 与工作站级性能。这一细分市场正是英特尔希望发力的领域 —— 其原计划通过 Arrow Lake Halo 系列产品参与竞争,但该项目最终被取消。据预期,英特尔最早要到 2026 至 2027 年才会推出基于 Nova Lake-AX 架构的首款 Halo 级芯片;而英伟达则计划于明年推出基于 N1 系列 SoC 的自有 AI PC 产品。 据 Wccftech 获得的信息,AMD 也正在为明年准备代号“Strix Halo”的产品更新,目前产能已全面爬坡。凭借新增的 SKU 选项,AMD 有望在掌上设备等细分市场斩获更多平台设计订单。 未来,英特尔与英伟达的联合攻势确实不容小觑:英伟达将为其提供顶尖的 GPU IP,而英特尔则向英伟达开放其先进的封装技术及 x86 IP 授权。然而,AMD 已做好准备,将以基于 Zen 6 架构的下一代高性能 CPU,以及即将到来的新一代 RDNA GPU 架构,应对这场来自两个方向的挑战。
育碧称《刺客信条:影》已扭转舆论危机:能做的唯有不关注批评者
IT之家 11 月 6 日消息,据外媒 Game File 今日报道,育碧上周在一场活动中分享了《刺客信条:影》的开发历程,并形容这一总结“非常戏剧化”。 育碧 CEO 伊夫・吉列莫在巴黎游戏周分析了《刺客信条:影》面临的网络反弹,并通过视频向现场观众讲述了育碧是如何“扭转局势”的。 据IT之家了解,《刺客信条:影》最初公布后受到了一部分批评,原因之一是游戏中一位共同主角弥助是一位黑人武士。部分玩家指责育碧“政治正确”,不过,历史上确有弥助其人。 吉列莫在演讲中表示,育碧“最初对攻击的程度感到意外”,并补充道:“我们很快意识到,这是一场与玩家的战斗,一场向玩家证明我们首先是游戏,而非信息载体的战斗。” 随后,他播放了一段三分钟的英文视频,讲述育碧如何应对批评,并提出问题:“当一个传奇系列公布最受期待的作品,却变成人人又爱又恨的游戏时,会发生什么?当讨论从游戏玩法转向意识形态时,会怎样?当你说的每句话都火上浇油时,又该如何应对?” “2024 年 9 月,我们已走投无路,那时我们意识到,要摆脱困境,就必须停止关注批评者,转而激励支持者。因此,我们不再争论,而是依靠支撑我们 18 年的核心 —— 刺客信条品牌。” 视频进一步指出,育碧首先通过推迟游戏来争取时间,让开发团队有机会打磨和优化游戏,这“是任何人都不建议的做法”。 “我们从承诺转向行动,不再害怕泄露,而是展示游戏,发布详细游戏内容,让体验本身说话。我们向创作者、媒体和玩家开放幕后,展示团队的才华和工艺,几周内制作了成千上万的游戏资产。” 视频强调,通过赢得粉丝支持,育碧能够面对批评者。“有了支持者的陪伴,我们重新找回信心,敢于挺直腰杆,敢于冒险,敢于发声,即便面对最激烈的反对声音。到《刺客信条:影》发售时,多亏粉丝,势头终于站在我们这边。”
华为Mate 70 Air手机命名规则揭晓
IT之家 11 月 6 日消息,史上最薄 Mate —— 华为 Mate 70 Air 手机今日开启预售,新机搭载麒麟 9020A / B 处理器、配有 7 英寸 2760 × 1320 分辨率 60/90/120Hz 高刷 OLED 屏,定价 4199 元起。 IT之家注意到,华为官网现对 HUAWEI Mate 70 Air 常见配置及功能参数作出说明,回答了 Mate 70 Air 的中框材质、Mate 70 Air 主打轻薄为什么手感偏厚重,以及 Mate 70 Air 产品命名规则。 HUAWEI Mate 70 Air 的中框是什么材质? 您好,HUAWEI Mate 70 Air 中框采用了高分子与金属复合材料一体成型工艺,整机轻盈,降低握持负担;天线隐藏设计,表面无分割接缝,手感圆润;材料韧性高,可吸收瞬间冲击力,提升抗摔能力。同时对中框表面进行了特殊工艺处理,提升了硬度,保证产品的耐磨性。 HUAWEI Mate 70 Air 主打轻薄为什么手感偏厚重? HUAWEI Mate 70 Air 实现了 6.6mm 的超薄机身,同时搭配 6500mAh 大容量电池,保证了优秀的续航能力,可满足全天候的使用需求,同时创新地采用 7 英寸大屏,对称立体扬声器、红枫原色镜头及长续航的设计,为您带来极致的使用体验,感谢您的支持与关注。 HUAWEI Mate 70 Air 产品命名规则。 HUAWEI Mate 70 Air 是 2025 年 11 月华为全新发布的旗舰机,外观设计延续 Mate 70 系列经典设计语言,同时创新地采用 7 英寸大屏,对称立体扬声器、轻薄机身及长续航的设计,搭载 HarmonyOS 5.1 系统,为您带来优秀的用机体验,感谢您的支持与关注。 图源:华为官网截图 | HUAWEI Mate 70 Air 常见配置及功能参数说明

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。