EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
超4万亿AI投入掏空家底,美科技巨头现金告急,如何筹钱?
美科技巨头为AI疯狂投资 凤凰网科技讯 北京时间2月9日,据《金融时报》报道,由于科技巨头今年在AI领域的投资飙升,资本开支甚至超过了现金流,即便是全球最赚钱的一些公司也将不得不筹集数以百亿美元计的资金来为这些投入买单。 过去两周,谷歌母公司Alphabet、亚马逊以及Meta披露的AI支出计划规模之大,令投资者感到意外。为争夺硅谷普遍认为的“互联网以来最大创新浪潮”的主导权,这些公司今年计划向芯片和数据中心投入合计超过6600亿美元(约合4.58万亿元人民币)。 如何筹集资金? 分析师指出,这种前所未有的基础设施大规模建设,将迫使科技巨头高管们在三种方案中做出抉择:要么削减股东资本回报,要么动用现金储备,要么比原先计划更多地进入债券和股票市场融资。 “由此带来的对高评级债券发行的利好影响是显而易见的。”摩根大通分析师称。他们预计,今年科技和媒体公司将至少发行3370亿美元的高评级债券。 由于股东们对巨额资本支出计划望而却步,并担忧这笔支出何时可能产生回报,大型科技股近日遭到猛烈抛售,不过部分股票在上周五有所回升。 亚马逊上周五在一份监管文件中暗示,可能很快寻求通过债务或股权筹集新资金,但并未说明具体金额或时间表。受此消息影响,该公司股价当日收盘下跌5.6%。 金融数据平台标普Capital IQ预计,亚马逊今年2000亿美元的资本支出计划预计将超过其1800亿美元的运营现金流。甲骨文上周通过发债筹集了250亿美元,以支撑其对AI的巨额押注,这缓解了投资者对其如何资助3000亿美元交易,为OpenAI提供算力的担忧。 道明证券分析师指出,受亚马逊、Meta和Alphabet等公司潜在“巨额交易”推动,本周投资级企业债券发行规模可能高达800亿美元,达到“正常季节性节奏”的两倍。道明证券在发给客户的报告中指出,由于市场预期科技巨头即将入市融资,近日美国投资级信用利差已有所扩大。 现金流告急 为训练和运行ChatGPT、谷歌Gemini及Anthropic旗下Claude等AI系统,相关企业投入的建设资金之巨大,可能将压过这些全球最具现金流创造能力企业的利润表现。 法国巴黎银行分析师指出,甲骨文、Alphabet、亚马逊和Meta的自由现金流正开始“迅速下滑,逼近负值区间”,目前看来,只有微软“至少在现阶段显得更具韧性”。 Meta预计今年资本开支高达1350亿美元,而分析师预期其运营活动现金流为1300亿美元。该公司在去年10月完成了其迄今为止最大规模的300亿美元债券发行。 Alphabet预计将产生1950亿美元的运营现金流,足以覆盖其1850亿美元的资本支出计划,不过该公司还需支付既定的股票回购与股息分红。虽然其长期债务已从2024年的109亿美元激增至去年的465亿美元,但截至年末该公司仍持有1268亿美元现金及等价物储备。 从轻资产到资本密集型 投资公司AJ Bell投资总监拉斯·莫尔德(Russ Mould)表示,近期科技股下跌部分原因是市场担忧这些互联网集团“正在从轻资产模式转向更为资本密集的模式”,使其现金流“比以往更不透明或更难预测”。 莫尔德表示,在专注AI的科技公司中,“资本支出的增速已远超营收增长”。他指出,“这一趋势的初步迹象是债务使用增加,以及股票回购计划的缩减。此类慷慨支出的下降,会降低投资者在这些公司短期持股的回报”。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
从几千跌至几百,射频美容仪“裸奔”清仓背后的合规生死劫
摘要: 自2026年4月1日起,射频治疗仪、射频皮肤治疗仪类产品必须取得第三类医疗器械注册证,方可销售。在新规正式执行前,仍有企业在裸奔甩卖产品,对消费者而言,其售后又如何保障? 凤凰网科技 出品 作者|尚志芳 编辑|董雨晴 2024年初时,射频美容仪市场曾经历过一场"雪崩"。 当时极萌、觅光等多个射频美容仪品牌都打出降价清仓的标签,原价几千元的射频美容仪,直接暴跌至四五百元。知名美容仪企业跑路的消息打的消费者措手不及,留下众多消费者在社交平台上追问,售后该找谁? 引起这场雪崩的原因,是2022年3月,国家药品监督管理局发布公告,明确射频治疗仪、射频皮肤治疗仪类产品按最严格的第三类医疗器械管理。当时曾规定,自2024年4月1日起,射频治疗仪、射频皮肤治疗仪类产品未依法取得医疗器械注册证不得生产、进口和销售。 后来,这一新规延期了两年。 当下,一个百亿级市场正在经历前所未有的洗牌,那些制造面容焦虑的厂商们,谁在合规转型?谁又在大胆擦边? 去库存压力下,大胆擦边的品牌们 新规正式落地时,市面上绝大多数射频美容仪品牌将无法继续销售,行业将迎来一场残酷的“大逃杀”。 这意味着,现有的库存产品如果不能在新规实施前售出,将会砸在手里。对于企业来说,4月1日之前能清掉就是赚到,甩卖正在进行中。但对于消费者而言,这些产品就成了裸奔的“清仓机”,未来或将下架,售后无法保障。 凤凰网科技查阅某电商平台,从几百元到几千元不等,不同品牌都在进行力度不一的降价措施。进口品牌中,初普紫矿美容仪产品从7000元跌至2800元。国产品牌同样未能幸免,极萌大熨斗pro产品显示从2499元跌至1300元区间,花至小紫弹美容仪也从4300元下滑至2500元左右。此外,有部分品牌直接打出"清仓"的标识。 降价之下,对于第三类医疗器械注册证的合格申请情况也不容乐观。 医疗器械,主要按照风险等级分为一类、二类和三类,其中一类风险程度低,备案管理无需注册,而二类指中度风险,需要注册,一般由省级药品监督管理部门审批,血压计、助听器等属于这一范畴。三类往往有更高风险,需要由国家药品监督管理部门(国家药监局)审批获得注册证,人工关节、心脏起搏器都属于这一范畴。此前,有不少美容仪产品会打小家电的标签,主要遵循家电产品的3C认证、质量安全等通用标准。 凤凰网科技在某电商平台询问客服发现,目前有不少品牌并未拿到三类医疗器械注册证,初普、极萌、德技等品牌表述正在申请中或在备案进度中。当问及今年4月1日以后是否还会上架该产品时,则回复以后续通知为主。 而另一些品牌则直接将该类产品定性为家用电器,“不需要三类证”。金茉旗舰店的客服就回复称:“店铺目前在售的均属于家用美容仪,不在医疗器械认证范围之内”。 与此同时,凤凰网科技还发现,部分小众品牌在没有申请三类证的情况下表示,后续4月1日以后还会上架。 对于大型射频仪器,商家更显“经验丰富”,直言这是行业惯例,消费者要自己评估风险,也有商家“传授”经验,“很多客户有人检查就会把仪器藏起来”。 第三类医疗器械证如此难办?对于中小品牌来说,几乎是一道难以跨越的门槛。 要知道,第三类医疗器械属于"严上加严"的最高风险等级,和心脏起搏器、人工晶体一个级别,申报材料需提交至国家药品监督管理局审查。企业想拿证,要先按医疗标准研发,再做完检测、临床试验等多个环节,前前后后需要2-10年不等。华西证券分析师曾指出,其花费高达400-500万元。 面对高昂的拿证成本和时间压力,中小品牌不得不做出选择,要么放弃射频赛道,转向其他品类,要么趁着过度期再赚一波快钱后退出。 在这其中,一部分品牌选择绕道,放弃射频赛道,转向微电流和LED类技术路线为主的新品,如"胶原炮""大排灯"等产品。这些新品类不在三类医疗器械监管范围内,可以暂时规避拿证压力。 当然也有部分品牌选择退出。 凤凰网科技查阅国家药品监督管理局发现,截至发稿,目前仅有金茉、玛丽仙、热芙美、花至、觅光等12家少数品牌完成了射频皮肤治疗仪的注册。 需要注意的是,第三类医疗器械证是一品一证,并不是一个证可以覆盖所有产品。 此外,凤凰网科技查阅某电商平台发现,目前在售的持证上岗的产品仅有两款,且产品明显标注“医疗版”,分别是深圳宇石科技有限公司旗下品牌玛丽仙的RFO601Pro+型和杭州瑞彼加医疗科技有限公司旗下的R1M型。 4月1日以后,对于无证生产、销售射频美容仪的商家,将会被没收产品及违法所得,最高处15-30倍罚款,最低5万元。情节严重的,会面临停产停业,相关责任人终身禁止从事医疗器械生产经营活动。 值得注意的是,并非所有射频类产品都属于医疗器械。仅用于皮肤清洁、按摩、促渗吸收或去角质等功能的射频仪器,不符合医疗器械定义,无需要按械字号管理。 合规前夜,潜伏的风险隐患 家用射频美容仪的安全问题,并非始于今日。 美容仪产品,在美妆赛道历经疲软之后,曾经是最具增长潜质的新类目。 2019-2021年双十一,面部美容仪销量榜前三位还是初普、雅萌、宙斯等海外品牌,但到了2023年极萌、觅光等国内品牌的销售额增长迅速,抖音上的销售额前列排名中已有过半为中国品牌。 以极萌为例,2023年上半年,其达到了品类销额TOP1,增速达到了惊人的35136%。当年度双11,通过绑定头部主播广东夫妇,仅在其直播间销售额就破亿。 但野蛮发展也带来了种种隐患。 2022年7月,新基石(深圳)科技有限公司根据《消费品召回管理暂行规定》,主动召回一批进口的初普第一代StopEye家用射频美容仪,数量高达18万余台。 召回原因则是产品在使用过程中如停留过久或移动过慢,存在探头温度过高导致皮肤烫伤的安全隐患。 这并非个案,在社交媒体上关于美容仪烫伤的投诉也屡见不鲜。有消费者分享使用某品牌射频美容仪后额头和脸颊冒痘,更有消费者出现皮肤凹陷、垮脸、长斑的情况。 此外,凤凰网科技在黑猫投诉平台搜索美容仪发现,相关投诉超过5000条,涉及雅萌、觅光、慕苏、初普等多个知名品牌,问题主要集中在虚假宣传、产品质量、售后困难等方面。 售后方面,即便消费者发现产品存在问题,维权之路也比较困难。 当前美容效果的鉴定还缺乏统一标准,而一旦鉴定往往要投入大量资金,普通消费者难以承担巨额资金压力。 而在责任归属上其实也更难追溯。美容效果本身跟个人的年龄、皮肤状况、生活习惯有很大关系,即便收效甚微,商家也能归咎于个人差异。 有上海皮肤科医生向雷达财经透露,家用美容仪与医美设备原理相通,抗衰效果确有科学依据。但这类仪器对温控要求苛刻,超过46℃就可能烫伤,目前市面上多数产品根本做不到这种精度,花大几千购买,确实是在交"智商税"。 即将迎来合规归宿 家用美容仪行业的乱象,根源在于其长期处于灰色地带。 2021年4月,首次提出将家用射频美容仪纳入医疗器械监管范畴。2022年3月30日,明确将射频治疗仪、射频皮肤治疗仪按照第三类医疗器械管理。 在新规出台之前,家用射频美容仪是按照“小家电”的标准进行监管。这意味着,这类产品既不需要像医疗器械那样经过严格的临床试验验证安全性和有效性,也不需要像化妆品那样进行功效宣称的备案管理。企业可以按照自己的理解生产产品,宣传功效,而监管部门缺乏明确的执法依据。 这种监管的空白,直接导致了市场的无序生长。 根据智研咨询的调研数据,2021年我国家用美容仪市场规模已逼近百亿元,并保持每年30%以上的高速增长,预计到今年,整体市场规模将突破200亿元。另外企查查数据显示,目前已有超过8000家公司入局美容仪市场。 新规延期两年,让品牌方有了喘息的时间。 对于已经投入大量资金进行临床试验的企业来说,两年的时间可以让它们更加从容地完成注册申报。而对于尚未启动拿证流程的企业,此次延期可能让一些企业产生侥幸心理,继续以小家电的身份销售本应属于医疗器械的产品,并借机在过渡期结束前疯狂营销、收割最后一波。 由于门槛太高,对于近两年都没行动的企业,说明根本不具备办证能力或意愿,再延两年也无实质性变化。 "有证"与"无证"之间,正在形成一道清晰的分水岭。 随着越来越多品牌持证上岗,消费者对"械字号"的认知度正在提升,无证产品的市场竞争力将大打折扣。 对于那些制造面容焦虑、大胆擦边的厂商来说,躺赚的时代已经结束。无论是选择合规转型、技术绕道还是黯然退出,都必须为自己的选择承担后果。 对于整个行业来说,这场行业内的洗牌虽然痛苦,却是必要的。只有淘汰那些靠营销驱动、缺乏技术实力的玩家,才能让真正专注研发、重视安全的企业脱颖而出。 不久后的4月1日,"大限"将至之日。届时,谁持证上岗,一目了然。
被追讨1.5亿元,闻泰科技与立讯联滔就印度业务资产包仲裁事项仍在进行
IT之家 2 月 9 日消息,闻泰科技今日公告,公司与立讯联滔关于印度业务资产包的协议履行存在争议,该争议已被立讯联滔提交至新加坡国际仲裁中心。印度闻泰已提交答辩及反请求,目前双方在讨论仲裁庭的组庭程序。 此次仲裁仅涉及印度业务资产包,公司已启动法律应对程序。其他标的资产已完成权属变更登记且不涉及诉讼仲裁。该仲裁案件涉及复杂的跨境法律,审理周期及最终结果存在不确定性。目前暂无法准确预估该事项对公司财务的具体影响。 IT之家注意到,1 月 12 日晚间,闻泰科技发布关于重大资产出售的进展公告称,公司子公司印度闻泰与交易对方子公司立讯联滔就印度业务资产包交易存在争议。 根据公告,闻泰科技要求立讯联滔根据《印度资产协议》的相关约定,支付印度业务资产包剩余的交易对价约 1.6 亿元;而立讯联滔主张终止《印度资产协议》并返还其此前已支付的交易对价,合计约 19.77 亿印度卢比(IT之家注:现汇率约合 1.5 亿元人民币),并支付自立讯联滔发出终止通知书之日起至前述款项实际支付日期间产生的相应利息及仲裁费用。 立讯精密 1 月 13 日晚公告称,由于印度闻泰相关资产存在包括资产查封、冻结等在内的交割受限情形,导致无法办理权属变更手续,相关资产交易尚未完成权属交割。基于前述因交易对方原因导致的实质性交割障碍,本次印度资产转让协议的合同目的已无法实现。
欣旺达电池翻车!东风奕派碰撞50秒爆燃、超3.8万辆极氪001 WE版更换电池包
快科技2月9日消息,近日,两起与欣旺达动力电池相关的安全事件接连引发市场关注。 一起是极氪汽车备案召回计划,将免费更换超3.8万辆搭载欣旺达电池的001 WE版车型电池包,以消除热失控隐患;另一起是尘封近一年的东风奕派碰撞爆燃事故曝光,其搭载的欣旺达相关动力电池在碰撞后仅50秒便燃起明火,两大事件叠加,让欣旺达电池的安全性能深陷舆论漩涡。 据市场监管总局网站2月9日发布的消息,浙江极氪智能科技有限公司根据相关法规要求,受浙江吉利汽车有限公司委托,已正式向国家市场监督管理总局备案召回计划,召回编号为S2026M0023V。此次召回自2026年3月6日起实施,范围涵盖2021年7月8日至2024年3月18日期间生产的部分极氪001 WE版汽车,共计38277辆。极氪将通过电话、短信、APP等方式通知相关车主召回事宜。 极氪方面明确,召回原因系召回范围内车辆的高压动力电池存在部件制造一致性问题,长期使用后动力电池内阻会异常升高,不仅可能导致电池性能下降,极端情况下还可能引发动力电池热失控,存在严重安全隐患。为彻底消除隐患,极氪将对召回范围内车辆进行全面检查或远程诊断,对尚未更换动力电池的车辆免费更换动力电池总成。 据悉,此次召回背后,是极氪关联公司威睿电动与欣旺达子公司欣旺达动力的质量纠纷,涉案金额曾达23.14亿元,双方于2026年2月6日达成和解,威睿电动已启动撤诉程序。根据和解协议,欣旺达动力需承担2025年12月31日前已发生的电池更换剩余成本6.08亿元,该款项分2026年至2030年五年分期支付。 与此同时,一段尘封近一年的汽车碰撞救援视频近期在网络传开,进一步加剧了市场对欣旺达电池安全的质疑。 视频显示,一辆东风奕派eπ007纯电动轿车与重型车辆碰撞后,短短数十秒内便冒出黑烟、燃起明火。令人关注的是,该车搭载的正是欣旺达相关动力电池,此前曾被宣传为“不起火、不爆炸”,具备极致安全防护能力。东风奕派官方回应称,经核实该事故系车辆与货车高速碰撞引发。 经核实,该起事故发生于2025年3月19日,涉事车辆为东风奕派eπ007纯电动网约车,其搭载的电池核心电芯源自欣旺达。 监控画面显示,碰撞发生仅41秒后车辆便开始冒黑烟,约50秒时燃起明火,主驾驶位司机曾自行下车并尝试打开后座车门救人,最终车辆被烧至只剩车架。 一边是大规模召回换包,一边是宣传“不起火”的动力电池碰撞后快速爆燃,两起事件均指向欣旺达动力电池的安全短板。 截至目前,欣旺达尚未对上述两起事件中的电池安全问题作出明确回应,其产品宣传与实际安全表现的反差、部件制造一致性不足等问题,已引发行业及消费者的广泛担忧,后续其质量管控及安全整改情况值得持续关注。
神秘模型“Pony Alpha”火了,被曝是智谱 GLM-5
马年未至,春节档新模型已经蓄势待发。 OpenRouter就已悄然上线了一款强大的神秘模型“Pony Alpha”,几天之内引发了一大波网友的无奖竞猜! 有人猜它是Claude新模型: 有人猜它是Codex 4.6: 还有人猜它是xAI并入SpaceX后推出的Grok 4.2: 甚至Llama 5都出来了…… 根据OpenRouter官方说法,这款神秘模型主打编码、推理和角色扮演,它针对智能体工作流进行了优化,具有很高的工具调用准确率。 经过几天的发酵,目前的备选答案满天飞,各家模型都被提了一遍。不过基于即将到来的马年春节,大多数网友认为这很可能是一款中国模型。 DeepSeek-V4和GLM 新模型成为热门选项。而在这两个选项中,又有更多证据指向了这款呼之欲出的马年新模型——GLM-5。 200k上下文,前端设计one-shot 从公开资料来看,Pony Alpha是OpenRouter于2月6日上线的一款“隐身模型”(stealth model),目前完全免费,并可通过OpenRouter调用。 其模型页面显示,Pony Alpha具备200K的上下文窗口,最大输出131K。 OpenRouter官方表示,这款模型主打编码、推理和角色扮演,为智能体工作流做了大量优化,具有很高的工具调用准确率。 但这几天经过不少网友的实测,发现其前端能力相当惊艳,堪比最新发布的顶级模型Claude Opus 4.6,而且很多优秀的案例仅靠单一提示词(one-shot)即可完成。 比如一位网友做的全球收音机直播的网站,Pony Alpha为其构建了一个完整的广播应用程序,包含超过 35 个电台,美观的UI及交互设计。这个网页应用包含超过 500 行代码,并且在单个文件中实现。 有网友制作了一个音乐播放器,可以看到前端设计风格相当时尚,已经逼近一个成熟的音乐播放器水准。UI交互十分丝滑,功能也很完整,包含“为你推荐”、查找、收藏夹、播放列表等多个功能。 还有一个workflow生成平台的前端展示页,从头图简介、收费计划再到专家推荐语,每个版块的设计和配色都很赏心悦目,鼠标悬停等交互也很丝滑。 在3D模型生成和游戏制作方面,Pony Alpha的表现也不在话下。 有网友花了3小时制作了一款类似《精灵宝可梦·红宝石》的 3D 游戏,游戏具备动画效果,可在浏览器上运行。该网友的评价是:比原版更接近原版。 还有一个法拉利的3D模型: 在SVG图形处理方面,Pony Alpha的表现也相当不错,已经接近Claude Opus 4.6的水平: 多项证据指向GLM-5 关于这款神秘模型,有不少网友猜测它可能是DeepSeek-V4、GLM新模型、Claude Opus 5.3、Grok 4.2等等,目前还众说纷纭尚无定论。 合作方Kilo Code表示,这款模型来自“某个全球实验室最受欢迎的开源模型的专项进化版”。 再加上马年春节即将到来,那么这款“小马模型”就很有可能是一款国产模型了。 而在DeepSeek、GLM、Kimi、甚至腾讯(因为老板姓马……)的诸多猜测中,呼声最高的还是GLM-5。 原因有三:第一,已经有网友发现,通过在OpenRouter的设置中将系统提示符改为“自定义”,然后询问模型型号,它会回答“I’m GLM”。 第二,有网友进行了PoC令牌测试,利用了一个在特定模型分词器中会触发异常的字符串,发现这款模型和GLM-4背后用的是同一套分词器。 第三,还是实测生成的前端风格太像GLM了。一名网友实测,单提示词输出2200行代码,评价是:“带有中国模型的味道,但看起来更加干净精致”。 当然,还有一个重要原因是时间对上了。智谱AI在2月初官宣“计划在未来两周内发布新模型”,而唐杰老师发的帖子也是吊足了大家的胃口。 除了智谱,几家国产大模型在春节前后都会轮番上阵:MiniMax计划在春节前发布M2.2,DeepSeek更不用说,早已是外界最瞩目的春节档选手。 所以这个春节,哪家大模型能够一马当先?让我们拭目以待吧。 参考链接: [1]https://x.com/OpenRouterAI/status/2019831892733022606 [2]https://openrouter.ai/openrouter/pony-alpha
吴永辉接管字节Seed这一年
创新需要适当的灰度和混乱,但应对竞争需要秩序和纪律。 文丨陈佳惠 贺乾明 制图丨黄帧昕 编辑丨贺乾明 上千人的研究团队、投入上百亿元追赶两年,终于研发出能排在中国第一梯队的基础模型,迅速被只有上百人的团队用更少资源研发的模型超过,部门负责人承认失误,公司 CEO 在全员会上点名,本可以做得更好。 这是吴永辉 2025 年初接管字节跳动大模型研究部门 Seed 时的情况。多位 Seed 人士说,他背负着 “把模型能力做到国内第一,与国际领先模型公司竞争” 的期待。 “沉稳” 是他们对吴永辉的直观感受。我们了解到,接管 Seed 后,吴永辉密集与 100 多位核心研究员 1on1,随后提拔了数位模型架构方向的研究员。 接管 Seed 一年间,吴永辉聚焦两件事:一是提升基础模型能力,提高研究效率保证交付;二是营造研究导向的氛围,“做第一流的研究,打造第一流的 AI 研究团队”。 “有务实又有浪漫。” 一位接近吴永辉人士说,他像是在字节体系内成长起来的,而不是出自 Google。 吴永辉 2008 年博士毕业后加入 Google,前 7 年作为软件工程师参与最核心的搜索排名工程;随后转岗到 Google Brain 从事 AI 应用研究,推动深度学习改变翻译领域、用到搜索排名算法中;2023 年成为大模型研发部门 Google DeepMind 研究副总裁,参与 Gemini 大模型研发和早期追赶历程。 另一位接近吴永辉的人士说,“他对技术了解很深,能迅速判断什么方向可以出成果。” 过去一年,Seed 的文生图、文生视频模型在一些基准测试榜单上排在全球前列,豆包手机助手模型成为行业关注焦点。 在竞争最激烈、最重要的基础模型方向,Seed 迭代 4 版(算上即将发布的豆包 2.0),与此前模型能力有较大提升,持续追赶海外领先模型。“但还需要补课,填上过去几年留下来的 ‘技术债’。” 一位 Seed 人士说。 追求 “一流研究团队” 这个长期目标的同时,吴永辉还要不断和短期目标做平衡。 调整:组建三个虚拟团队,打通数据、代码库提高效率 2025 年 1 月,Seed 组建 “Seed Edge” 虚拟团队,设置 3 年期限的考核机制,鼓励骨干研究更基础、更长期的 AGI 课题。我们了解到,吴永辉参与了该团队的组建。 随后他又抽调研究人员组建 Focus 团队,打破部门边界和既有分工,负责基础模型的攻坚,研发下一版模型需要提升的部分。剩下基础模型的团队划分成 Base,包括工程、数据、测评等,研发当前一代基础模型。 这年 3 月,时任 LLM 团队负责人乔木被举报暂停工作后,LLM 下属的 Pre-train(预训练)、Post-train(后训练) 和 Horizon 等直接向吴永辉汇报。 两位 Seed 人士说,在吴永辉的规划中,可以同时推进三代模型研发,人员、课题都可以相互轮换,同时盘活内部的资源,“Edge 有了成果可以直接下放;Focus 发现长期课题可以转入 Edge,有了成果可以用于改进当前一代模型。” 为了提高效率,吴永辉还推动内部数据、代码库透明,对外保密。他在内部说,这是 “改进内部反映的一些问题”。 在字节跳动,Seed 脱离各营收部门单独设立,团队直接向集团管理层汇报,更容易摆脱部门政治。但在 Seed 中,总是多个团队研发方向接近,团队之间沟通相对困难。 两位曾在 Seed 工作的研究员说,之前他们像是一群研究小组的集合,而不是整体的研究部门,比如小组 A 的研究者想看小组 B 的文档,要先经过文档所有者、所有者的领导同意,“有时候部门负责人出面调解都看不了全部信息。” 更透明的信息共享提高了沟通效率,也带来了一些麻烦。我们了解到,2025 年下半年,Seed 至少发生两起实习生泄密事件。之后他们不再要求内部文档公开授权。 基础语言模型研究方向之外,Seed 依旧保持原有的组织架构。上一任 Seed 负责人朱文佳与吴永辉同时负责 Seed 部门数月后,转向吴永辉汇报,负责大模型应用。 多模态交互和世界模型团队由 2024 年从阿里加入字节的周畅负责,代表成果是豆包手机助手模型。过去一年,随着视觉多模态生成负责人杨建朝休假、视觉基础模型研究负责人冯佳时离职等变动,周畅的管理范围持续扩大,新增文生图 Seedream、文生视频 Seedance 模型等。 Infra(基础设施)团队由项亮负责。字节跳动的 AI Lab 带着剩下的三个研究方向——AI for Science、Robotics、Reponsible AI 并入 Seed,负责人李航向吴永辉汇报。 过去一年,Seed 整体规模维持在 1500 人左右,扩张速度比前两年放缓,几乎不再从外部招聘中高层技术管理者。他们更加重视招聘应届毕业生、提拔年轻人。我们了解到,一位 2024 年从清华大学毕业的博士生,现在同时向周畅和吴永辉汇报。 成果:边开车边修轮子,训出万亿参数豆包 2.0 即将发布的豆包 2.0 模型是吴永辉接管 Seed 一年最核心的产出。它是一款类似 Gemini 的多模态模型,10000 亿参数,是 Seed 成立以来训练的最大模型。 吴永辉到来后,多位 Seed 研究员明显感受到开会的频率提升,原本 3 个月开一次会的研究团队现在每月就要沟通一次,核心团队基本每两周一次。有字节人士提到,在食堂吃饭时,经常能看到吴永辉端着餐盘坐到研究员对面,边吃边聊进展。 每次研究团队汇报完毕后,吴永辉通常会提几个简短的问题——通常是 3 个。“他不会直接给出具体的解决方案,而是引导大家思考更本质的问题。” 一位 Seed 研究员说。 多位 Seed 人士告诉我们,这款模型训练期间遇到基础设施层面的挑战。他们分析,过去两年 Seed 持续追赶期间,相对忽视了基础能力建设,所以训练豆包 2.0 期间扩大参数规模时不稳定,一度难以推进。 “就像盖房子,如果地基不稳,往上加砖头的确容易出问题。” 一位 Seed 研究员说。 OpenAI 的 RL Infra 负责人翁家翌在一档播客节目中说,每个模型团队的 Infra 都有 bug,模型公司本质上拼的是 Infra 修 bug 的速度,它决定了单位时间内验证想法的数量,而想法只要提高人才密度就能解决。OpenAI 去年开始重构使用三年的 Infra 体系,解决越积越多的 “技术债”。 过去一年,阿里、腾讯的大模型团队都提高了对 Infra 的重视程度。Qwen 模型团队去年中开始在内部组建 Infra 团队,这部分工作原来主要靠阿里云的人工智能平台 PAI。腾讯去年底宣布成立 AI Infra 部及数据计算平台部,由大模型负责人姚顺雨直接负责。 而对于 Seed 团队,想要重整 Infra 系统难度更大。我们了解到,Seed 的 Infra 团队有数百人,同时支撑 Seed 内部数十款模型的研发和尝试,高层认为水平国内第一。“想要重整,需要投入大量人力、物力,还要承担不小的信任成本。” 一位 Seed 人士说,只能 “边开车边修轮子”。 我们了解到,训练豆包 2.0 遇到问题后,最终多个团队配合,花了 3 个月时间,主要从模型架构、训练数据等方面入手解决问题,确保模型赶在春节前上线。 难题:既要做一流研究组织,又要有短期产出 “我们致力于打造一种独特的文化融合体:既有初创企业的专注与活力,又兼具学术界的天马行空式思维。”Google DeepMind CEO 德米斯·哈萨比斯(Demis Hassabis)曾说。 多位 Seed 人士说这也是吴永辉的目标,“他想把 Seed 做成一流的研究品牌。” 字节跳动给他提供了环境。过去两年,字节在 Seed 聚集了一批研究人才,就算没有合适的位置,也倾向于 “先把人招进来”。 字节给 Seed 部门设置更宽松的考核机制,大部分取消 OKR。2025 年中,字节发放独立于公司期权之外的 “豆包虚拟股” 激励员工,并多次提高薪酬。 他们也在 Seed 营造一种宽松的工作氛围,实习生能直接与最高层交流。一位 TopSeed 实习生曾在社交媒体上分享,他在开发某个项目的近两个月里,大部分时间睡在公司,经常凌晨两点带着新想法兴奋惊醒,写两小时代码再睡,“感觉每一刻都在不断的发现新现象”。 去年 3 月,吴永辉在部门全员会上说,Seed 做了很多不错的工作,但外界不太了解,鼓励研究者以论文和博客的形式发表成果。“他还建议大家 ‘装修’ 下个人主页。” 一位曾在 Seed 的人说。根据我们初步统计,吴永辉加入 Seed 之后的三个月,该团队发布的论文数量就超过 2024 年全年。 能够对外界充分展示研究成果,进一步激发了 Seed 研究者的自驱力。“筛选出来了一批非常勤奋专注,或者说热衷于钻研的年轻人。” 一位去年离开 Seed 的核心研究者说,他们多数人每天两点一线,为了省事,吃饭只在公司食堂,“生活的主要乐趣就在于工作带来的 feedback”。 我们了解到,Seed 会出现一种情况:几个研究员决定自发研究一个方向,如果上级不同意、不分配资源,他们可以上升汇报,得到认可后,就可以从上到下推进。 “他们从前是自己领域内的 ‘小霸王’,带着 ego 来到 Seed,每个人都想成就一番事业。” 上述人士预估,可能只有 20% 的资源是用在短期有用的课题上,“浪费有可能是对的,字节不缺资源。” 但 Seed 并不是一个脱离竞争存在的研究组织,他们需要给字节跳动提供 “弹药”,应对腾讯、阿里等公司的竞争。团队资源不可避免会向短期有成果的团队倾斜。多位 Seed 人士说,去年下半年开始,有研究者做一些单点研究,“感觉不符合 Seed 的主流方向,就很少有人在意这份成果”。 我们了解到,从去年三季度开始,字节管理层对 Seed 团队发论文有了新要求,包括 “高质量”“内容与正迭代的核心技术无关” 等,之后每月发布的论文有所减少。 “永辉想要营造研究氛围,但很难避免 DDL 导向。” 一位 Seed 研究员说,他们团队本来要花更多资源和时间,自研算法解决某个技术问题,但为了尽快上线,项目启动后不久就被要求调整思路,在开源项目基础上改进,“哪怕性能有损失”。 今年 1 月,字节跳动 CEO 梁汝波在全员会上说,字节今年关键词是 “勇攀高峰”,短期内高峰是 “豆包 /Dola(豆包海外版)助手应用”,重点是 “AI 模型能力要做到行业前列,通过助手整合好已有业务”。一年前的全员会上,梁汝波说 AI 研究团队要 “探索智能上限”。 创新需要适当的灰度和混乱,而应对竞争需要秩序和纪律。怎么平衡好这两个目标,是吴永辉在 Seed 持续要解的管理难题。 题图来源:《盗梦空间 Inception》
编程AI变天了!实测神秘模型Pony Alpha:Opus级智能,架构师思维上线
作者 | 陈骏达 编辑 | 漠影 智东西2月9日报道,这两天,一款叫Pony Alpha的神秘模型,在模型聚合平台OpenRouter上悄然走红。没有发布会、没有论文,甚至连厂商也没有公开,它却凭借一连串超出预期的实测表现,在开发者和模型爱好者圈子里迅速引发关注。 据OpenRouter官方介绍,这款模型是某家厂商的下一代基础模型,在编程、推理和角色扮演方面具有不错的性能,还针对智能体工作流进行了优化,工具调用准确性较高。 更有说服力的,是已经上手测试的用户反馈,不少网友给出了几乎一致的好评。一位博主用自己的秘密SVG生成测试题“拷打”Pony Alpha,结果生成质量高得离谱,甚至让他一度怀疑是不是泄题了。 还有开发者分享称,自己让Pony Alpha连续编程3小时,最终直接做出了一个真正可游玩的Pokemon Ruby,完成度之高,甚至在某些细节上“比原版还像原版”。 也正因为这种不合常理的强势表现,Pony Alpha 的“身世之谜”迅速成为讨论焦点。有人猜测它可能是Anthropic的Sonnet 5,毕竟这种代码能力实在过于眼熟;也有人联想到此前频频被传将发布的DeepSeek-V4;还有不少声音认为,这或许是智谱下一代模型GLM-5的提前试水。 那么,Pony Alpha的真实能力究竟如何?这些传言有没有技术层面的依据?接下来,我们不妨抛开猜测,直接通过一系列实测,看看这匹“Pony”到底能跑多远。 一、从数据仪表盘到算法可视化,Pony Alpha初体验 目前,Pony Alpha已在OpenRouter开放,免费可用,可以直接在网页与模型对话,也能通过API方式直接调用。其上下文窗口为200K。 由于Pony Alpha是一款主打编程的模型,我们也将测试的重点放在编程领域。 第一个Case是“迷你数据仪表盘”。提示词要求输入一组数字,实时生成最大值、均值‘最小值和波动率,并伴随平滑动画更新。 这个提示主要考察三点能力:一是对统计指标的理解是否准确;二是前端结构组织能力,能否把数据和UI卡片合理拆分;三是动画与状态更新的细腻程度。 Pony Alpha打造的“迷你数据仪表盘” 实际结果中,Pony Alpha打造的网页在指标计算上没有偏差,动画采用了过渡效果而非生硬刷新,整体完成度已经很高了。 我们尝试的第二个Case是SVG卡通场景绘制。提示词非常具体:尺寸、主题、元素、风格和细节要求齐全,核心难点在于复杂约束下,模型能不能确保一致性。 模型最终输出的SVG在结构上清晰,图层关系合理,太阳光晕、海浪曲线、椰子树阴影都被准确实现,色彩饱和但不过曝,并没有简单堆砌图形。 第三个Case是算法可视化演绎,我们要求模型将排序或寻路算法转化为动画,本质是把步骤映射为时间与空间变化,对编程和推理能力进行了综合考验。 Pony Alpha在这里表现出色:颜色变化对应状态,节奏体现算法进度,路径演化直观呈现决策过程,说明它不仅会写代码,还能用代码解释复杂的概念。 Pony Alpha打造的“算法可视化器” 在完成这三组案例之后,可以明显感觉到:Pony Alpha在“能跑、好看、好理解”这一层面已经打造目前主流模型的水平线上方了。接下来我们要做的,是把它放到更复杂、更需长时间推理的场景中,看看是否依然能保持创造力。 二、架构师思维上线,从零复刻星露谷 前面的案例更多是在验证模型“写代码”的能力,本质仍是短链路、低复杂度的任务执行。而真正拉开差距的,是模型是否具备Agentic Coding能力——也就是能否以系统视角理解问题,并长期、自主地推进复杂工程。 这意味着模型要像资深架构师一样拆解系统级需求,在长时间运行中保持上下文连贯与目标一致。接下来,我们用复刻知名游戏《星露谷物语》的任务,来对Pony Alpha进行一场压力测试。 这是我们发送给Pony Alpha的提示词。对专业的人类开发者来说,复刻像星露谷这样的游戏,至少需要涉及数千行代码,需要处理好游戏循环、场景管理、玩家与NPC行为逻辑、农作物成长、地块管理、UI、背包、存档系统等多种机制和不同的主体。 同时,还要保证各模块接口一致、逻辑同步、动画渲染平滑、事件交互响应正确,并考虑性能优化和可维护性,这样写出来的代码才有可运行、可扩展、可调试的实际应用价值。 那么,Pony Alpha会如何解决这一问题呢?拿到提示词后,Pony Alpha首先像项目经理一样,分析了我们复杂的提示词中的核心需求,梳理出需要设计的八大系统与配色方案,以指导后期的开发。 紧接着,Pony Alpha又化身系统架构师,规划了项目的整体项目架构。打开源文件后,我们能看到这一项目采用了最基础且通用的前端资源结构,JS项目结构有明显的模块化思路:模型、渲染、系统分开,逻辑清晰,适合中小型项目。 在这样的理念指导下,Pony Alpha打造出了一个初步可玩的游戏界面,视觉风格统一、治愈系满满,核心玩法逻辑也很清晰。比如开垦(土地)、播种(种子)、浇水(水壶)这些动作都能正常运行,体力消耗系统也设计得合理。 当然,本质上,这还是一个纯前端的 Demo。为了让它更有“玩头”,我们进一步挑战了Pony Alpha:加入数据保存机制,并让游戏画面更精美。 在了解完我们的需求后,Pony Alpha给了多个技术解决方案供选择。 上手优化项目后,Pony Alpha进行了打造了后端的服务器和数据库,完成了前端存档管理器,连续编程了超过10多分钟,无需任何人为干预。 升级后,Pony Alpha大幅度优化了原本的设计,背包和物品栏被移动到页面下方,让虚拟世界本身占据视觉中心。画面中的湖泊、草地、树木都变得更为精细。天气系统也被加入进来,晴天、阴天、下雨甚至小雪都能动态呈现,让整个世界更加生动、真实。 三、深入生产“屎山”,实测存量代码深度重构 在真实企业环境中,开发新功能只是整个工程的一部分,更多时候程序员面对的是已经存在、复杂且历史悠久的“屎山”代码库。这些系统往往包含隐式规则、技术债务和历史遗留行为,使得理解现有代码、定位问题并安全修改,比从零开发更具挑战性。 因此,AI在企业中的价值不仅在于生成新代码,还在于对已有项目中进行有效的代码理解、调试、重构和增量开发。接下来,我们将通过实测案例,看看Pony Alpha在这类工程任务中的表现。 我们先是用Pony Alpha+人工手搓了一个一眼看上去就有年头的财务系统。乍一看,这一系统只是UI有些陈旧,但是深入代码后,里面埋着更大的雷(当然,这都是我们要求Pony Alpha做的,不代表其自身能力)。 我们能发现里头变量命名混乱、函数职责不明确、一些特殊的神秘账户隐晦地藏在if分支里,还有随机批量操作和对历史数据的隐性依赖。 清空上下文后,我们让Pony Alpha排除自己刚才亲手埋下的雷。 其实,对人类程序员来说,这种存量系统简直是噩梦,如果没有一个靠谱AI的帮助,你可能永远不知道重构时会不会“顺手删掉一条祖传逻辑。 而AI模型也很容易在这种情况下翻车,它们会试着统一规则、试图去掉重复逻辑,但却忽略了一些技术现状其实代表了某种业务上的妥协或者真实形态,如果妄加修改可能真的会引发更大的Bug。 我们给Pony Alpha发送了如下提示词,基本上就是要求它在尽可能确保系统可以无缝替换原模块的基础上,实现代码的重构和现代化。 Pony Alpha没有急着上手修改,而是先分析了一通。它能理解这是个财务系统,也能准确判断其使用的技术栈。 为了让问题看起来更清晰,Pony Alpha按照严重程度分了类。 在模型自行设定的重构目标指导下,Pony Alpha开始了改造。 最终,Pony Alpha成功交付了一个更为现代化的版本。这一重构后的财务系统不仅实现了原来的所有功能,甚至连原系统里可能是给领导使用的“9999”特殊账户隐藏逻辑也得到了完整保留,这波操作真是情商拉满了,技术与心思都在线。 再来看看底层的代码。原版中,全局变量和函数都是混合在一起的,而Pony Alpha改造后的版本架构清晰度明显提升,配置层、数据层、业务层等都清晰地隔离了,依赖关系清晰,便于单元测试。 原来混乱的变量名也规范化了,无意义的字母变成了一个个语义化的命名,这样后续接手代码的其他同事能更轻松地理解代码逻辑。 除此之外,Pony Alpha还主动新增了提示词中没有明确要求的各种安全性和可维护性功能。比如输入验证就可以避免用户遗漏关键信息,而数据加载容错机制可以避免程序崩溃。 说实话,看着Pony Alpha把这堆老旧代码一点点梳理、优化,又保留关键逻辑,感觉它就像一位耐心又靠谱的老师傅,让人工作起来踏实多了。 结语:下一代旗舰级基础模型要来了 综合多轮实测下来,Pony Alpha给人的整体使用感受,更像是一个Opus级别的下一代旗舰级基础模型,而不是一次简单的模型小版本更新。 它在长上下文、复杂工程理解与执行稳定性这些真正决定生产力的维度上,体现出明显的代际差异。或许是某家厂商长期打磨、针对真实开发工作流深度优化模型能力的一次集中释放。至于它究竟来自哪一家,目前仍然没有定论。 但可以确定的是,如果这匹“Pony”真的是某家国内厂商憋了很久的大招,那么国内基础模型在高阶编程与工程智能体方向上的竞争,可能已经提前进入了新阶段。
人形机器人规模化元年已至,2025年全球出货量接近1.8万台
IT之家 2 月 9 日消息,今日,IDC 公布最新数据,2025 年全球人形机器人出货量接近 1.8 万台,同比增长约 508%,销售额约 4.4 亿美元;同期,累计销售订单量预计超过 3.5 万台,为后续交付和市场持续放量奠定基础。 人形机器人是指在结构形态上采用人形或类人形设计的机器人系统,通常具备躯干、头部、双臂等关键人形结构,并在功能层面集成类人的感知、学习、决策与执行能力。其通过仿人化的身体构型,能够模拟人类动作与交互行为,在动态环境中执行多任务,并实现与人类或其他系统的自然交互。 报告称,从厂商格局来看,中国厂商凭借完善的制造体系、快速迭代能力与成本优势,在全球市场中占据主导地位: 智元机器人、宇树科技出货约为 5 千台,位居行业头部,具备规模化交付能力、产品成熟度以及应用场景覆盖上具有领先优势。 乐聚机器人、加速进化和松延动力出货 1 千台左右,专注重点场景的落地。 银河通用、优必选、众擎机器人、星尘智能等厂商的出货 4 百台到 1 千台,以试点项目和定制化交付为主。 星动纪元、魔法原子、北京人形机器人创新中心、星海图、墨甲智创、逐际动力等公司实现了百台以上的出货,处于商业化早期探索阶段。 相比之下,Apptronik、Figure AI、Agility Robotics 等国际厂商仍主要处于试点测试阶段,出货量约数十台。Tesla 的人形机器人尚用于内部测试,预计将于 2026 年正式启动规模化量产。整体来看,中国厂商已在当前阶段的人形机器人规模化落地中占据先发优势。 从产品形态来看,2025 年全球人形机器人市场以双足形态为主。数据显示,双足机器人(全尺寸与中小型)合计贡献 66.3% 的市场销售额,成为当前市场的主流形态。 其中,全尺寸双足人形机器人贡献 41.6% 的销售额,为所有产品形态中最高,凭借更高的智能化水平和复杂环境适应能力,在导览导购、文娱商演及科研教育等场景中实现较快推广。该细分市场呈现明显头部集中,智元机器人在商业化进展上领先。 中小型双足人形机器人以轻量化设计和相对较低的单价优势,主要应用于文娱商演和教育科研等对负载和通用性要求相对较低的场景,成为双足机器人市场的重要补充。 相比之下,轮式机器人以移动性和成本优势在数据采集、工业制造及仓储物流等场景发挥作用。 从应用场景分布来看,人形机器人市场当前呈现出集中度较高、逐步多元化的发展特征。2025 年,市场需求主要由文娱商演、教育科研和数据采集等场景驱动,这些场景强调展示效果、交互体验或技术验证,成为人形机器人商业化落地的核心动力。 IT之家从报告获悉,随着核心技术持续成熟、系统稳定性提升及成本逐步下降,工业、物流及其他垂直行业应用的市场空间有望进一步打开。 在商业模式方面,行业正由一次性硬件销售,逐步向 RaaS(Robot as a Service)、运维服务、平台化生态演进,探索“产品 + 服务 + 生态”并行的发展路径,为后续规模化应用和持续收入创造条件。
实测Seedance 2.0:红包满天飞,字节悄悄进化
眼看就要到春节了,很多团队已经开始放慢节奏,但 AI 圈还是一如既往地卷。就在不少人以为“该发的模型都发完了”的时候,新模型还是一波接一波往外上,完全没有停住的趋势。 这段时间你会发现一个很有意思的现象:一边是各家都在 AI 入口上做很重的营销动作,抢入口、抢用户心智、抢使用场景;但另一边,底层模型的更新速度其实一点都没慢下来。 厂商自己也很清楚,只靠入口包装和营销声量,是撑不住长期竞争力的,模型能力本身必须持续往前推。 最近,字节跳动又放出了一张新牌:新一代视频生成模型 Seedance 2.0 正式发布,把视频生成这条线往“更可控、更连贯、更像真实镜头语言”的方向又推了一步。值得注意的是该大版本号模型,离前一代支持音视频联合生成的模型 Seedance 1.5 Pro 的发布日期只过去了 2 个月。 入口在打仗,模型在加速,两条线同时在跑,而且都没打算等对方。 下面,我们也完整实测了一波 Seedance 2.0。 先说一下,这次我是直接在「即梦」里用的 Seedance 2.0,下面讲的体验也都基于这个平台。 Seedance 2.0 这版主打一个点:参考能力更全面。跟上一代的音视频模型 Seedance 1.5 Pro 比起来,它现在对多张图片、多段视频一起参考的支持更强,用起来也更顺手。 另外你也能看到一个趋势:不只是做视频生成的模型在加强“参考视频”这件事,像 Kimi 2.5 这种通用大模型,也开始强调可以参考视频内容来生成结果,大家都在往这个方向走。 01 苹果风格商品宣传 我们一开始,就先做了一组素材:运动品牌风格的人物模特,加上运动手表这种实物产品,一起拿来做测试。 然后我又上传了一支很经典的 Apple Watch 官方宣传片。这种片子本身就是多镜头结构,既有人物镜头,也有产品特写,很适合拿来当参考素材。 现在在即梦里,你基本不用写很复杂的提示词,按它那个很直观的提示方式来就行。直接告诉它:参考这支视频的镜头节奏和风格,生成一条新的运动手表广告。 同时把主角换成我自己的图片,把商品也换成我准备好的产品图。整套流程很直接,就是选参考视频 + 选人物图 + 选商品图,然后让模型去生成一条新的广告片。 生成这类视频的时间会比较久,而且积分消耗也不低。比如两张图片加一段参考视频,同时都参与参考的话,做一条 15 秒的视频,基本要花接近 200 积分。 不过成片出来之后,你能明显感觉到质量是在线的。整体真实感很强,模特在公路上跑步时的光线变化、头发上的反光、脸部的受光细节,都做得很到位,看着不会假。 还有一点:我其实没有给它一个完整的故事结构,只是给了参考素材和目标类型。最后的视频节奏基本是它自己排出来的。 片子里出现的商品,主要就是我给它的那只手表。它里面有两段镜头是专门切到手表上的,而且还加了动效。 整体看下来,画面元素基本没什么大问题。比较常见的坑还是那个:数字和中文偶尔会乱写,会有点“AI 幻觉”。 右下图片那个转场,它会有一个滑动手表的动作。我专门截了几帧去看,很多帧里文字其实是正常的,只是在滑动的那一瞬间容易出错。这个表现跟上一代比,确实进步很明显。 你要是认真去逐帧截图看,会发现细节也比较到位。女模特手臂上的纹理、手上的细小汗毛,是能够看清的。 02 “跨风格整合”的财神拜年 因为它的动效表现确实不错,我就又多做了一组测试。我新生成了一张新春财神抱着金元宝的图,再加上一张美剧风格的恶灵骑士角色图,然后把这两张图一起丢进去当参考素材,让它按这个方向继续生成视频。 我给它的目标其实很简单:先让财神出场,背后是一堆元宝和金币,在发光、在晃动;接着恶灵骑士骑着摩托冲进画面;然后变成财神骑着这辆摩托直接开走;最后闪出一帧画面,打上“新春快乐”和具体日期的中文与数字。 成片看下来,开头恶灵骑士那一段,AI 感还是偏重一点,能看出来是模型在“拼”画面。不过从财神和道具之间的互动,到表情变化,再到动作衔接,比以前顺了不少。 还有一个小规律我这次也注意到:如果画面里放的是那种比较大的艺术字,Seedance 2.0 出错的概率会低很多。 如果是一张图片里有多个主体,然后让镜头一个个扫过去,这种场景我也测了一下 Seedance 2.0 的表现。 03 多主体镜头 我做了一张图:五个小动物穿着不同礼服,一起坐在同一条长椅上。主体多、造型差异大,还都在同一画面里,这种情况其实挺考验模型的镜头理解和主体保持能力。 我当时的提示词设计很直接:让画面里所有小动物一起跳舞给大家拜年,镜头要一个个扫过去。每扫到一个角色,就在它的动作上停一下,给慢镜头和特写。 这个视频主要在考一件事:镜头逐个扫过时,角色的出现顺序要对。也就是视频里的出场顺序,要和原图里小动物从左到右的顺序一致,这点很看一致性能力。 从生成结果来看,Seedance 2.0 在画面质量和整体一致性上都还不错。不过这条视频我也反复跑了三四次才选到比较满意的版本。动作质量普遍很高,但还是会有顺序问题,比如熊猫和兔子的位置被对调,这种情况还是会出现。 但如果只看角色本身和动作表现,这一版确实提升很明显。每次镜头停在单个角色上时,毛发细节、质感、真实度,还有镜头之间的切换,都处理得比较顺。 04 宇航员与 3D LED 屏里的猫 左边是一张十字路口的大型 3D LED 屏画面,里面有一只猫,尾巴是从屏幕里伸出来的;右边是一张很经典的宇航员图片。 提示词是:让这个宇航员走进十字路口,在路口下面停住,把头盔面罩打开,再戴上墨镜,看向 3D LED 屏里的猫,然后整个人愣一下,周围街道人来人往。 从最后生成的视频来看,整体效果其实很不错。尤其是宇航员走进路口那段,你能看到周围行人和车辆都是在动态变化的,没有那种很明显的错乱感,看起来会比较顺。 小问题也有,就是屏幕里的猫还是显得有点呆,灵动感差一点。整体能用,但这个角色的表现还有提升空间。 05 多人物 INS 风剪贴画 我给 Seedance 2.0 的目标也很明确:人物不要变,背景不要变,画面里的这些男性角色都要保留下来,只是在这个基础上,让他们一起跳起来动起来。 这个任务其实挺难的。按以前的经验,一张元素很多、结构很复杂的图,光是做静态生成就不太稳,很容易出错。要是在视频里再让这些剪贴画人物动起来,还要跳舞、互动,就更容易把周围元素带乱。 所以一开始我自己的预期也不高,会觉得出错的概率不小。 我给的提示词:这是一张有多个男性角色的剪贴画,背景和版式全部保持不变,只让人物跳舞;节奏偏搞笑、偏抽象;人物之间要有互动动作,比如握手、击掌。 最后生成出来的视频,其实跟提示词对得挺准。画面里的文字没有被改动,不管是上面的主标题,还是下面的小块文字,都保持原样。整张图里一共七个角色,他们之间都有互动,而且基本是在同一个节奏上跳舞。 而且你仔细看细节会发现:这些角色就算把后面的剪贴画文字挡住了,在遮住、再淡出的那一下,文字本身也没有被改掉。 06 NIKE 风运动员剪影 最后一个案例,我用的是一位体操运动员运动时的模糊剪影。我给了它一套 5 张参考图,每张都有很明显的动态拖影,构图也很极简,没有 logo 和文字,但整体质感很强。 我当时对 Seedance 2.0 的要求也比较高:希望它能把这种动态拖影的感觉保留下来,整体风格往运动广告片那边靠,像那种品牌宣传片的质感,再简单配点字,就能直接发到短视频平台。 这个目标其实不低,但最后生成的效果还是挺可以的。 你能看出来,它在结构和节奏上是有主动安排的,不是那种很死板的处理方式。镜头切换也不生硬,没有走老路:不是简单把一张图变成动图,再在几段动图之间硬切。 这种老式做法在早期的视频模型里很常见,这一版明显更自然一些。 音乐这块我其实什么参考都没给,也没写相关提示词,但它最后配出来的音乐,和整条视频的节奏还挺合拍的,不是很违和。 有几个镜头它还会主动给慢镜头特写,比如倒数第二个镜头,就明显放慢了节奏,把动作拉出来单独展示。我还专门截了一帧图来看,那一刻的画面,和我上传的参考图几乎是一样的。 同时你也能看出来,它为了把前后镜头接顺,会把这张参考画面往前多补一点内容,也往后多延一点动作,这样前后过渡就会更自然,不会突然断掉。 最后简单收一下:整体看下来,Seedance 2.0 在叙事节奏、镜头切换,还有对参考图片和参考视频的一致性保持上,都比上一代音视频模型强了不少。 问题也还是有的,比如画面里有很小的文字,或者很细的小元素,在动态变化的时候,还是会偶尔出错。不过出错的频率,确实比上一代低了很多。与此同时,单个视频的生成时间往往非常漫长,积分的消耗也非常大。 对字节的平台来说,这是内容供给效率的提升,毕竟字节已经将该模型全面下发到旗下各个 AI 内容创作平台,例如即梦、CapCut(剪映)等等。 从更现实的角度看,视频生成模型这条线,已经快速进入产品化和商业化验证期。谁能把生成质量、生成速度、可控性和接入成本一起压到可用区间,谁就更有机会进入真实内容生产链路。 可以说,春节前这一波密集发布,更像是新一轮视频 AI 竞速的发令枪。接下来,整个 AI 视频模型领域的竞速将会以肉眼可见的速度,迅速“开卷”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。