EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
大模型套壳往事
华为盘古大模型涉嫌套壳阿里云Qwen大模型的风波,再次将模型“原研”与“套壳”的讨论摆上了台面。 回溯三年前,在ChatGPT刚刚开启大模型航海时代时,那时候的套壳还停留在小作坊山寨ChatGPT的阶段。调用ChatGPT的API,接口再包上一层“中文UI”,就能在微信群里按调用次数卖会员。那一年,套壳成了很多人通往AI财富故事的第一张船票。 同时,开始自主研发大模型的公司里,也不乏对ChatGPT的借力。这些企业虽然有着自研的模型架构,但在微调阶段或多或少利用了ChatGPT或GPT-4等对话模型生成的数据来做微调。这些合成语料,既保证了数据的多样性,又是经过OpenAI对齐后的高质量数据。借力ChatGPT可以说是行业内公开的秘密。 从2023年开始,大模型赛道进入开源时代,借助开源框架进行模型训练,成为了很多创业团队的选择。越来越多的团队公开自己的研究成果,推动技术的交流与迭代,也让套壳开发成为了更普遍的行为。随意之而的,争议性的套壳事件也逐渐增多,各种涉嫌套壳的事件屡次冲上热搜,随后又被相关方解释澄清。 国内大模型行业也在“套”与“被套”中,轮番向前发展着。 01 GPT火爆的那一年:山寨API和造数据 回顾AI的进化史,今天我们看到各类大模型都源自同一个鼻祖——2017年Google Brain团队发布的Transformer神经网络架构。Transformer的原始架构和核心包括编码器(Encoder)与解码器(Decoder),其中,编码器负责理解输入文本,解码器负责生成输出文本。 如今,在大型语言模型领域依然采用三大主流Transformer架构:Decoderonly(如GPT系列)、EncoderDecoder(如T5)和Encoderonly(如BERT)。不过,最受关注和应用最广泛的,是以Decoderonly为核心的GPT式架构,并不断衍生出各种变体。 2022年11月,基于GPT3.5,OpenAI推出ChatGPT,发布后短时间内获取数千万用户,让LLM正式登上公众舞台,也将GPT架构推为主流AI架构。随着ChatGPT打响大模型时代第一枪,各大厂商纷纷涌入大模型研发赛道。由于ChatGPT无法直接接入国内用户,一些小作坊也看到了套壳的牟利前景。 2022年底开始,许多山寨ChatGPT在互联网上涌现,此时的套壳基本不涉及任何二次开发,很多开发者直接包装一下API就拿出来卖钱。 2022年底至2023年,国内涌现数百个ChatGPT镜像站,包括名噪一时的“ChatGPT在线”公众号,运营者拿到OpenAI API,再在前端加价售卖。这种低劣的套壳手段很快就被监管部门发现,“ChatGPT在线”背后的上海熵云网络科技有限公司,就因涉嫌仿冒ChatGPT被罚6万元,成为首例“ChatGPT套壳”行政处罚。 另一方面,在同期发布的其他模型中,时常出现一些“GPT味”的回复,这些模型背后的企业也遭受了套壳质疑。 2023年5月,曾有网友发现,讯飞星火大模型在有些问答中会出现“我是由OpenAI开发的”等内容,由此一则关于“讯飞星火大模型被质疑‘套壳ChatGPT’”的消息传播开来。 这种情况并非个例,甚至2024年发布的DeepSeek V3也曾暴雷,有用户反映其在测试中出现异常,模型自称是OpenAI的ChatGPT。相关企业对这类情况的解释为,这可能是由于训练数据中混入了大量ChatGPT生成的内容,导致模型“身份混淆”。 互联网公开信息中AI内容日渐增多造成的数据污染,确实是可能造成这些“GPT味”对话的原因。但另一种可能是,模型研发团队在微调训练过程中,主动使用了通过ChatGPT等OpenAI旗下模型构造的数据集,也就是所谓的“数据蒸馏”。 数据蒸馏是大模型训练中一种高效低成本的知识迁移方式,这里的逻辑就像是用一个强大的“老师模型”(如GPT-4)生成大量高质量问答数据,而后将这些数据喂给一个“学生模型”去学习。 事实上,在GPT -3之后,OpenAI就彻底转向了闭源,所以对于想要自研大模型的竞争对手而言,并无法在基础架构层面套壳OpenAI的产品。这些企业或多或少也在模型技术上有一定积累,在架构层面纷纷推出自家的研究成果,但如果想要保证训练质量,从更强的模型产品那里以借力的方式获取数据无疑是一种捷径。 虽然借力ChatGPT/GPT-4生成训练数据是业内公开的秘密,但一直以来鲜有被披露的案例,直到那起著名的“字节抄作业”事件。2023年12月,外媒The Verge报道称,字节跳动利用微软的OpenAI API账户生成数据来训练自己的人工智能模型,这种行为实际上已经违反了微软和OpenAI的使用条款。在此消息被披露不久,据传OpenAI暂停了字节跳动的账户。 字节跳动方面随后表示,这一事件是技术团队在进行早期模型探索时,有部分工程师将GPT的API服务应用于实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。按照字节跳动的说法,其对于OpenAI模型的使用是在使用条例发布之前。 对此,来自国内某头部AI企业算法部门的叶知秋向直面AI(ID:faceaibangg)表示,业内的普遍认知是,数据蒸馏不应该被认为是套壳。“数据蒸馏只是一个手段,通过一个能力足够强的模型产出数据,对于垂直领域(的另一个模型)去做加训。” 加训(Continual Training)是一种常见的提升模型性能的方法。通过在新数据上继续训练模型,可以使其更好地适应新的任务和领域。“如果利用数据蒸馏做加训算套壳,那这个技术就不该被允许。”叶知秋解释道。 2025年的今天,大模型开发市场日渐成熟,直接调用API“山寨套壳”的模型产品已逐渐消失。在应用层面,随着AI Agent领域的快速迭代,调用API落地的AI工具已经成为常态,如Manus这类通用AI Agent逐步进入市场,AI应用层面的套壳已经成为了一种常见的技术手段。 而在大模型开发领域,随着开源时代的到来,模型开发领域的套壳,又陷入了新一轮的争论。 02 开源大模型时代:你用我用大家用 进入2023年,许多厂商选择开源方式公布模型方案,用以刺激开发者群体对模型/模型应用的迭代。随着Meta在2023年7月开源LLaMA 2,标志着AI行业也进入开源时代。在这之后,先后有十余款国产模型通过微调LLaMA 2完成上线。同时,利用开源模型架构进行二次开发,也成为了新的套壳争议点。 2023年7月,百川智能CEO王小川回应了外界对旗下开源模型Baichuan-7B套壳LLaMA的质疑。他提到,LLaMA 2技术报告里大概有9个技术创新点,其中有6个在百川智能正在研发的模型里已经做到。“在跟LLaMA 2对比的时候,我们在技术的思考里不是简单的抄袭借鉴,我们是有自己的思考的。” 就在几个月后,国内AI圈迎来了另一场更汹涌的套壳风波。2023年11月,原阿里技术副总裁、深度学习框架Caffe发明者贾扬清在朋友圈中称,某家套壳模型的做法是“把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。”事后证实,该信息直指零一万物旗下的Yi-34B模型,开源时代的套壳争议被搬到台面上。 一时间,关于零一万物是否违反了LLaMA的开源协议,在各大技术社区引发了激烈的争论。随后,Hugging Face工程师Arthur Zucker下场对这一事件发表了看法。他认为,LLaMA的开源协议主要限制了模型权重,而不是模型架构,所以零一万物的Yi-34B并未违反开源协议。 事实上,利用开源模型架构只是打造新模型的第一步,零一万物在对Yi-34B训练过程的说明中也作出了解释:模型训练过程好比做菜,架构只是决定了做菜的原材料和大致步骤……其投注了大部分精力在训练方法、数据配比、数据工程、细节参数、baby sitting(训练过程监测)技巧等方面的调整。 对于AI行业而言,推动技术开源化的意义之一是停止“重复造轮子”。从零研发一款全新的模型架构,并跑通预训练流程需要耗费大量成本,头部企业开源可以减少资源浪费,新入局的团队通过套壳得以快速投入到模型技术迭代和应用场景中。百度CEO李彦宏就曾表示:“重新做一个ChatGPT没有多大意义。基于语言大模型开发应用机会很大,但没有必要再重新发明一遍轮子。” 2023–2024年,AI行业掀起一场“百模大战”,其中的国产大模型大约10%的模型是基座模型,90%的模型是在开源模型基础上加入特定数据集做微调的行业模型、垂直模型。套壳帮助大量中小团队站在巨人的肩膀上,专注于特定领域的工程化和应用探索。 如今,在Hugging Face上按“热度”排序检索,以文本模型为例,DeepSeek R1/V3、LLaMA3.2/3.3、Qwen2.5以及来自法国的Mistral系列模型均位居前列,这些开源模型的下载量在几十万到上百万不等。这表明开源极大地促进了行业的进化。目前,Hugging Face平台上共有超过150万个模型,其中绝大多数是用户基于开源架构的衍生产物——sft微调版本、LoRA微调版本等。 另一方面,随着LoRA与QLoRA等轻量化微调方案面世,定向微调模型的成本也在不断下降,为中小型团队进行模型开发提供了有利基础。麦肯锡在今年5月的一份调查显示,92%的企业借助对开源大模型的微调提高了24%–37%的业务效率。 2023年以来,模型开发门槛因开源不断降低,在迎来百模齐放的良好生态之余,也浮现出一些浑水摸鱼的恶劣套壳行为。 2024年5月,斯坦福大学的一个研究团队发布了一个名为LLaMA3V的模型,号称只要500美元(约人民币3650元)就能训练出一个SOTA多模态模型,效果比肩GPT-4V。 但随后有网友发现,LLaMA3V与中国企业面壁智能在当月发布的8B多模态开源小模型MiniCPM-LLaMA3-V 2.59(面壁小钢炮)高度重合。在实锤套壳抄袭后,该团队随后删库跑路。该事件一方面反映出,国产模型凭借其优异性能也成为了被套壳的对象;同时,也再一次引发了业界对开源时代套壳合规边界的思考。 对于AI行业而言,厂商通过开源以协作的方式可以对模型进行完善与优化,加速推动问题解决与技术创新。由于协作的工作模式和开放的源代码,开源大模型的代码具有更高的透明度,并且在社区的监督下,公开透明的代码能更容易进行勘误。 “透明度”是促进开源社区交流进步的关键,而这需要二次开发的团队和所有从业者共同维系。在LLaMA3V的案例中,斯坦福方面的研究团队只是对MiniCPM-LLaMA3-V 2.59进行了一些重新格式化,并把图像切片、分词器、重采样器等变量重命名。 原封不动地拿过来,并且作为自己的学术成果发布,相比起套壳,这更像是彻头彻尾的抄袭。 所以,套壳的道德边界,究竟是什么呢? 03 “套壳”和“自研”的矛盾体 “如果一个团队没有以原生模型的名义发表,就不能叫套壳,应该叫模型的再应用。”谈及套壳的定义,叶知秋这样说道。在加入大厂项目之前,叶知秋曾参与过一些创业公司的开源项目。他判断,业内有实力造基础模型的企业只会越来越少,加速利用开源技术是行业发展的必然,“毕竟核心技术上,只有那几家公司有。” 叶知秋口中的“核心技术”,指的是从零研发模型基础架构,并落实预训练流程的能力。相关报道显示,国内目前有完整自研预训练框架的大模型公司数量较少,仅有 5家左右。能“造轮”的企业屈指可数,对此叶知秋的解释是:“一些企业也有实力投入基础模型研究,但他们要考虑做这件事的收益。” “演化和加训,严格来说和套壳是两码事。”叶知秋表示,像LLaMA这样开源架构已经为业内熟知且熟用,很多成果都是在这一架构的基础上演化而来的。但同时他也强调,套壳合规与否在于冠名问题,利用开源技术就需要在技术文档中做出明确说明,“如果你是在一个已经开源的模型上进行加训,那就要在冠名和文档中体现这一点。” 对于如何理解大模型非法套壳,知识产权法领域的法律界人士秦朝向直面AI分享了他的看法。他表示,一些恶劣的“套壳”行为虽然在社会舆论上引发很多反响,在法律视角上却是另一回事。如何区分套壳和抄袭的界限、如何证明因为套壳行为导致了不当获利、如何证明具体的获利额度,这些问题都存在着一定的举证难度。“目前来说,这一类事情还处于一个灰色地带。” 秦朝进一步解释,所谓“借鉴”就是很难区分性质的套壳,一些开发者可能“借鉴”了不止一家企业,然后宣称是自研产品。除非是简单粗暴的纯套壳,不然很难去界定这一行为的恶劣程度。“而且大模型赛道发展速度极快,走法律流程下来可能要两三年,到那时技术都更新换代了。” 在技术圈语境下,自研是套壳的反义词。在叶知秋看来,如果一个模型团队宣称自己是全程端到端自研,势必会吸引业内同行审视的目光,未公开的套壳行为很难真正被掩盖。“一个开源的模型,其实一切信息都有迹可循,就是看业内人去不去挖掘而已。” 叶知秋进一步解释道,模型原研厂商都会在大模型组件中留下一些“标签”,当研发团队在发布论文时,这些“标签”就会被用以证明其采用了创新技术。因为一旦团队宣称这款模型是自研,那就需要说明,这款新的模型基于传统模型有什么不一样的地方。“如果没有,那大家必然会问,你的模型的架构是从哪来的?” 对于一些企业而言,套壳和自研的取舍,也往往伴随着成果产出的压力。另一位资深算法从业者向直面AI表示,借鉴架构/方案在业内并不稀奇,因为很多团队需要尽快解决0到1的问题。“在保留技术底线基础上,能有成果产出是最重要的。” 针对这一现象,叶知秋表示,一些头部企业虽然在其他领域实力雄厚,但在模型领域,可能在底层的训练逻辑上缺少经验和积累。对这些企业而言,充分利用开源技术套壳,可以更快完成从数据层面到模型层面的积淀。“像一些企业在某一领域的‘垂类’大模型,其实都有‘套壳’的成分在。” “通过‘套壳’去做自己的开发,还是非常低成本高价值的。”作为从业者,叶知秋十分肯定开源为行业带来的积极影响。他认为,长期来看,单一企业很难在模型能力上建立壁垒,开源有助于整个行业的进步,实现更高的效率、更低的成本,去打造更多的模型能力。 关于开源时代的套壳争议,叶知秋表示,这些争议本质上还是跟企业的宣传口径有关,“用开源技术不丢人,前提是企业不要宣传是自研。” (文中叶知秋、秦朝为化名)
IP生意成解药,是哪吒带给光线传媒的“幻觉”
或许只是看上去很美。 作者|小遥 国内外影视圈中,影视公司想要利用手中IP创造多元且持久收益的例子层出不穷,只是成功者少之又少。 一个例子是,手握《喜羊羊与灰太狼》《巴啦啦小魔仙》《铠甲勇士》等国民IP的奥飞娱乐,曾以改编电影,打造游戏、玩具、母婴用品和潮玩手办等衍生品,建设主题乐园等多种方式进行IP变现,却未能改变近十年营收增长有限,半数时间都在亏损的状况。 但这样的尝试却没停过。 眼下,光线传媒也正在成为其中一员。 01 解药 2025上半年的最后一天,《哪吒之魔童闹海》(简称《哪吒2》)以上映153天、累计票房159.1亿元告一段落。 但它的故事还没有结束。8月下旬,它会以英文配音版陆续在美国、加拿大、澳大利亚和新西兰陆续上映。 国内同样如此,不过是以另一种形式出现在人们眼前。 首先是数量众多的周边产品,除各品牌的联名外,《哪吒2》出品方光线传媒在其上映前开发了潮玩、手办、卡牌、出版物等衍生品,当前这些衍生品已经在泡泡玛特等合作方的店铺进行销售;其次,光线传媒计划将于今明两年推出公司的线上品牌店与线下品牌店,三年后推出首款3A游戏,同时,公司还在与多地洽谈建造主题乐园的事宜,而这些场景中自然少不了哪吒的元素。 可以看出,光线传媒在努力地延续哪吒的热度。 而这不仅是为了当下的利益,还有对未来的铺垫。2025年4月的投资者交流会上,光线传媒表示公司定位将由“高端内容提供商”向“IP创造者和运营商”转型,后续在不到一个月的时间内接连开了两家业务与IP相关的公司。 5月27日,一家名为“十月光线科技”,经营范围包括动漫游戏开发、玩具、动漫及游艺用品销售的公司在北京成立,大股东是光线传媒旗下公司北京光线影业;6月25日,光线影业(广州)有限公司成立,经营范围为玩具、动漫及游艺用品销售、游艺及娱乐用品销售等,由北京光线影业全资持股。 光线转型,最直接的刺激大概来自《哪吒2》衍生品巨大的收入规模。光线传媒董事长王长田曾给出一组数据:“现在有人推测《哪吒2》带来的整个GDP的增量会超过2000亿元人民币,据不完全的统计,我们授权的一部分产品,最多的一个产品门类大概带来上百亿的销售额。《哪吒2》让衍生品的开发商、生产商、销售商,得到了很大的市场红利,几百亿的销售额。到最后我估计上千亿衍生品销售额是完全有可能的。” 而衍生品市场规模庞大的背后,是情绪消费在近两年迅速崛起,对于影视公司来说,正可以利用手中的众多IP进入这个还在上升的赛道。 另一个更重要的原因,光线传媒也已在宣告转型时给出:“原来我们是电影的生产者,主要的收入和利润来自于电影项目,以票房为主,也有一部分艺人经纪、版权、音乐等收入,还有剧集的收入。但总体来讲,这些收入具有波动性,可复制性和可持续性偏弱。” 这的确是光线传媒近几年较为突出的问题,翻阅财报可以发现,光线传媒的业绩自2018年以来便存在很大的波动——公司营收在2018年仅为14.92亿元,第二年便几乎翻倍达到28.29亿元,而疫情期间,光线传媒营收、净利等指标的变动幅度多次超过100%;营收占比在70%以上的电影及相关衍生业务,业绩不稳定则更加明显:2018年以来的7年中,有三年营收变动幅度超过了60%,毛利率也曾在三年内由最高59.87%下降至13.13%。 不过,业绩波动大并非光线传媒独有的烦恼,知名影视公司华谊兄弟的业绩同样并不稳定——2024年,其营收仅为4.65亿元,相当于巅峰时期2017年的11.8%,2018年首次由盈利8.28亿元转变为亏损11.69亿元后持续处于亏损状态。 这一方面是由行业性质决定的,比如内容制作周期长、上映效果不可控导致付出得到的回报不确定,另一方面也与近年来行业的低迷有关。 出于爆款较少等原因,国内电影票房和观影人次在2016年开始出现增速放缓迹象,并在受到疫情冲击后暴跌。尽管行业在封控解除的2023年略有复苏,但因为观众观影习惯改变、优质作品供给不足,2024年再次陷入低迷,票房和观影人次同比下降了22.7%和23.1%,均低于2015年水平。 同时, 由于手游和直播在当时十分火热,光线传媒在2014年和2016年通过收购相关公司股权的方式进军动漫游戏和视频直播领域。只是,不久后,这些业务便因光线对相关公司股份的减持,或业绩占比下降至10%以下,不再出现在光线传媒的财报中。 衍生品业务对它来说也并不陌生。2016年,光线传媒便正式涉足电商及衍生品业务,其发展情况从未被单独披露,但从外界表现来看,恐怕并不成功——2016年公司为销售衍生品开设了天猫旗舰店,因衍生品质量参差不齐,店内销售一路走低,2017年底,该店商品被全面下架,2019年8月,天猫平台已搜索不到相关店铺。 如今,IP生意又一次被光线传媒提起,并视为公司业绩波动大、回报不确定性强、收入来源单一等问题的解药。 02 幻觉 做IP生意对光线传媒来说并不稀奇,对于影视行业来说也并不新鲜。 早在十几年前,影视行业便开始了探索IP变现的可行路径。 短期带来收入的快消品联名、衍生品开发,能够实现长尾效应的影游联动、多媒介演绎、打造文旅项目,都是业界给出的答案。 不能否认的是,这些答案有效过。 2015年,随影视剧播出上线的《花千骨》同名手游,凭借前者的人气——全剧平均收视率破2、刷新了中国电视剧网络播放量最高纪录和电视周播剧收视最高纪录,获得了巨大成功:安卓版发布一周达到日活破百万,在iOS畅销榜前十待了接近三个月,单月流水曾达到2亿元左右;次年,《幻城》电视剧与手游同步上线,既增强了双方的营销效果,也带来实际收益:电视剧开播当晚登顶同时段全国网和城市网收视第一,手游上线首月流水突破千万。 《山河令》红线手绳、收藏卡、折扇、发簪等官方周边物品的销售额超过2000万元,《庆余年2》的盲盒销量超过20万个,卡牌的GMV在剧集播出之前便达到了2000万。 《猎罪图鉴》《沉默的真相》等影视作品改编的舞台剧上座率可观,迪士尼、环球影城等主题乐园在全球长盛不衰,也证明着影视IP多途径变现的可行。 但它们并不是每一次都奏效。 《花千骨》之后,《楚乔传》《芈月传》等多部影视作品都曾效仿推出同名游戏,由于游戏质量和运营不佳、影视剧受众与手游用户匹配度有限等原因,相较于剧集的高收视率,这些游戏的反响平平:《楚乔传》手游上线40天后便从开始时的iOS畅销榜第8名跌落至第195名,《芈月传》手游则从未进入过畅销榜前100名。大多数尝试成为失败案例之后,“影游联动”的温度也逐渐降了下来。 泸州老窖结合《三生三世十里桃花》剧情推出的“桃花醉”产品在剧集热播时供不应求,然而,当公司加量生产,第二批产品却因生产周期较长,完成生产时剧集的热度已消散而滞销。 此外,由于IP热度的持续性有限、园区在建设和运营上存在不足等原因,华谊兄弟在苏州、济南、南京等地落地的实景娱乐项目“电影小镇”“电影世界”纷纷亏损、闭园的结局,公司品牌授权及实景娱乐业务的收入也并不乐观,自2018年以来的7年中,除2020年外均呈现同比下降的趋势,2024年该业务的营收为188.68万元,仅为2017年2.58亿元的0.7%。 图:7月5日,“苏州华谊兄弟电影世界”正式更名为 “苏州阳澄半岛乐园” 光线传媒曾经着力打造的实景娱乐项目,后续进度也不算迅速。2014年~2017年,光线传媒多次宣布筹备推出“光线中国电影世界”实景娱乐项目,并与上海、大连、湖南、扬州的相关部门达成协议。但后续只有扬州一地进行了建设,且目前该地的诸多项目中仅有部分已经投入运营。 而这些意味着,想要做IP生意,可能会面临以下问题: 如果选择在影视作品上映前便进行IP周边产品的开发,便可能存在观众对影视作品的喜爱不直接转化为对相关产品的付费意愿、观众为相关产品付费意愿的持续程度有限、产品生产与市场需求在数量和周期上错配等风险;而即使抛开这些风险,提前的投入也会成为一种杠杆,让人气高的作品带来更多收入,差强人意的作品造成更大亏损,进一步加剧业绩的不稳定。 选择较为稳妥的确认影视作品效果后再进行投入的做法,则对开发、生产的响应速度提出了较高的要求——毕竟一个IP的热度能持续多久并不由发行方完全掌控,对于影视公司来说,这同样不简单。 因此,IP生意能够成为当下问题的解药,更像是哪吒爆火为光线传媒带来的一场幻觉——看上去很美,实际做起来却可能存在很大的差别。
全球首个AI智能体安全测试标准发布,蚂蚁集团、清华大学、中国电信等联合编制
IT之家 7 月 14 日消息,据蚂蚁技术消息,世界数字科学院(WDTA)在联合国日内瓦总部日前正式发布 AI STR 系列新标准《AI 智能体运行安全测试标准》,标准由蚂蚁集团、清华大学、中国电信牵头,联合普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外机构、企业及高校共同编制,为全球首个单智能体运行安全测试标准。 据介绍,该标准针对智能体跨越“语言墙”所带来的“行为”风险,首次将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来,构建了全链路风险分析框架;同时,细分了智能体风险类型,完善并创新提出了模型检测、网络通信分析和工具模糊测试等测试方法,弥补了智能体安全测试技术标准的空白。 IT之家从蚂蚁技术获悉,该标准不仅提供了一套可行可靠的智能体安全基准,也为全球 AI 智能体生态的安全、可信和可持续发展增加了有益的探索。目前,部分标准的测评与认证已在金融、医疗等领域落地应用。 此前,WDTA 已发布 3 项 AI STR 标准,包括“生成式人工智能应用安全测试标准”,“大语言模型安全测试方法”和“大模型供应链安全要求”,由 OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同参与。
B站神级配音AI被曝光!一个意外泄露的视频,让鬼畜区UP主都沉默了
最近一个「泄露」的文本转语音模型演示版本在 Reddit 上火了。 演示视频被网友贴出来后,评论区一片惊呼。 这情绪太细腻了,我不相信这不是人说的。 我们终于能跟糟糕的配音演员说拜拜了。 Reddit 帖子截图,链接:https://www.reddit.com/r/LocalLLaMA/comments/1lyy39n/indextts2_the_most_realistic_and_expressive/ 它来自一个还没正式发布的项目,IndexTTS2。不过我们发现,这个演示版本并不是什么项目的泄露文件,而是论文作者亲手贴出来的 Demo 演示页。 看起来只是一次误会。但它惊艳的背后,却可能是下一代 AI 声音生成的分水岭。 不是 404 链接,是 AI 配音的「奇点」时刻 故事要从这个链接说起, https://index-tts2.github.io,这是一般放在 GitHub 上的项目主页链接格式,但是这个链接直到现在都是 404。 Reddit 上这位网友在 GitHub 上找到了这个项目仓库,发现了里面有多个 IndexTTS2 的演示视频,他分享了其中的一个 https://index-tts.github.io/index-tts2.github.io/ex6/Empresses_in_the_Palace_1.mp4。 自动播放 自动播放 这些演示视频,不仅音色还原度高,情绪也自然的让人一时忘了是在听 AI。 自动播放 除了甄嬛传这个配音视频,还有让子弹飞的演示视频,同样精彩。我甚至觉得如果电影需要英配,用这个是完全可以。 但其实这些 Demo 并不是「偷偷隐藏」在项目仓库里的。作者在论文中给出的链接就是 https://index-tts.github.io/index-tts2.github.io/,只不过可能是还没有写好演示的网页,所以被误会成了这是一个泄露的演示版本。 所以准确地说,这是一场误会,但也正是这场误会,让更多人第一次看到了 IndexTTS2 的惊艳表现力。 IndexTTS 2 项目主页网站目前仍是 404 IndexTTS2 就是那种一耳朵就能分辨出「质变」的模型。甚至不需要对比参数,我们只要点开这个 demo,就能很明显的感觉到它和之前那些「AI 声音」不一样。 声音不再平滑得像机器,而是有起伏、有重音、有轻笑、有叹息。 情绪不是靠「语速快慢」去模仿,而是真的在「表达情绪」。 音色不仅像人,甚至像是有个人格、有表演的「人」。 如果说 ElevenLabs 让我们第一次看到了产品化语音的可行性,IndexTTS2 给人的震撼,更像是 Midjourney 横空出世那年,大家开始意识到:AI 不止能模仿人类,它能「重构表达」。 揭秘 B站王牌:AI 如何学会「表演」而非「朗读」 那么这个模型到底是怎么回事,又是怎么把 AI 生成的声音做到这么有情感,这么像真人。 IndexTTS2 来自 B站语音团队,他们在上个月发布了一篇论文专门介绍这项工作,哔哩哔哩技术公众号在前几天也分享了这个模型的相关信息。 论文链接:https://arxiv.org/abs/2506.21619 它是一个文本转语音模型(TTS),但和过去我们听到的 AI 声音不一样。它不是在读字,而是在讲话;不是同步而粗糙的配音,而是有情绪、有表现力的声音演绎。 IndexTTS2 模型概览,由基于源文本、风格提示、音色提示输入的文本转语义模块、语义转频谱图模块和将频谱图转换为高质量语音波形的声码器三个模块组成,实现端到端的语音合成过程。 同时,这个模型还能做到: 不依赖参考音频,通过微调语言模型 Qwen3 来解读自然语言指令实现的情感控制 对同样的一段文本,不同语音、不同情绪、不同语速都能精确对应 语音时长可控,可以用在配音对齐、视频解话、影视合成等场景 它不仅仅是一个「好听」的模型,而是一个「好控」的模型。你给一段文字,它不仅能说出来,还能按照你的意思,表现成一个有情感的声音表演。 B 站也拿这个模型和阿里通义实验室的 CosyVoice2、上海交大的 F5-TTS、MaskGCT 等 TTS 开源模型,在多个评估基准上进行测试,IndexTTS2 在词错误率、说话人相似度以及情感保真度等多个关键指标上均是当前最优的。 但目前 IndexTTS2 还没有完全开源,哔哩哔哩技术公众号在文章里面说会持续优化模型性能,全面开源 IndexTTS2 的推理代码和模型权重。希望未来能尽快得到实际体验的机会。 就像 Reddit 上网友说的,IndexTTS2 是具有革命性意义的一项工作。 这是我第一次真正觉得 AI 声音可以让人享受整部电影的配音。我注意到它在配音时甚至克隆了中文口音。非常有趣。 我迫不及待想用好的参考声音在本地尝试它,尝试不同的情感参考音频片段,并根据需要多次重新运行生成,以获得非常逼真的表演。这太酷了。 它让我们看到的,不仅仅是一项很酷的技术,更是一个内容创作新范式的黎明。从「能说话」到「复制音色」、再到现在「突出情感表现力」,我们的短视频可能又将有新的素材了。 如果 IndexTTS2 在大部分视频的配音上,都能做到像文章开头说的那个「泄露 Demo」这么出色,那我们真的可以说看一部 AI 配音的电影了。
等不到小米 SU7 ?也可以看看这辆 40 万元级的现代 IONIQ 6 N
现代汽车在周末的古德伍德速度节上带来了一辆新的高性能的电动汽车——IONIQ 6 N。 这是继 2023 年的IONIQ 5 N 后,现代汽车的第二辆高性能电动产品。 IONIQ 6 N 搭载双电机,可输出 601 匹马力和 740 牛·米的扭矩,其搭载的「N Grin Boost」瞬时增压功能可以在 10 秒内将输出提升至 641 马力和 770 牛·米扭矩,配合「弹射起步」功能,新车可以在 3.2 秒内完成零百加速,最高时速可达 258 公里/小时。 作为对比,保时捷电车 Taycan GTS 的最大马力为 700 匹, 配合起步控制,零百加速为 3.3 秒,小米 SU7 Max 的最大马力为 673 匹,零百加速则做到了 2.78 秒。 现代汽车的工程师们为了提升车辆的操控性能,对 IONIQ 6 N 的悬架结构和底盘都进行了重新设计。IONIQ 6 N 的电子减震控制器集成了传感器,可以根据路面状态和行驶条件在驾驶过程中动态调节阻尼,电控系统中搭载的「漂移优化器」和「扭矩分配」也可以由驾驶者自定义车辆的动力分配模式,在赛道、漂移等场景下为用户提供了更多的驾驶乐趣。同时车主也可以选装 N Performance 个性化选装包来实现更多定制项目。 为了匹配 IONIQ 6 N 的性能输出,现代在新车上配备了前四活塞、后单活塞的制动卡钳,以及专为 6 N 开发的 275/35 R20 倍耐力 P Zero 5 轮胎,车辆尾部也配备了天鹅颈式后扰流板来增加下压力。 这辆 IONIQ 6 N 开起来也有如同油车一样的乐趣,现代在其上面加入了升级后的「N e-Shift」模拟换挡、「N Ambient Shift Light」换挡氛围灯以及「N Active Sound+」主动声浪系统,在用户进行模拟换挡操作的同时,车辆的氛围灯和声浪都会同步发生变化。现代还专门设计了三种声浪选项,分别是更复古的 Lgnition(点火)、更现代的 Evolution(进化),和更为科幻风格的 Lightspeed(光速)。 根据现在官方提供的数据,IONIQ 6 N 将搭载一块 84 度的动力电池,WLTP 续航约为 468 公里,这得益于轿车的样式的造型和更优的风阻系数,相比之下 SUV 造型的 IONIQ 5 N 在相同的电池容量下就只有 356 公里续航。 IONIQ 6 N 延续了普通版I oniq 6的造型基础,但整体风格更具有速度感,现代为新车设计了专属的宽体翼子板、功能性前扰流板、独立设计的进气口以及独特的「天鹅颈」尾翼,车灯则采用了像素风格的LED灯组,并在细节上加入N系列专属元素。配色方面则有黑色、白色、哑光灰以及一款独有的「性能蓝珍珠」配色。 新车的内饰风格则和普通版车型并无二致,整体以黑色为主,搭配了「性能蓝」饰条、氛围灯以及包裹性更强的 Alcantara 运动座椅。 IONIQ 6 N 的价格预计和 IONIQ 5 N 的价格接近,其国外售价为 6.78 万美元(约合 48 万人民币),但现代 IONIQ 系列是少见的在中国市场的售价比韩国本土市场低的车型,目前国内在售的 IONIQ 5 N 终端价格为 38.88 万元。 现在 IONIQ 6 标准版的销量其实平平无奇,在多国市场的的月销量不过 3 位数左右,但现代的工程师明确表示,造这车不为赚钱。 (N 系列)车型本就不是走量的产品,而且我们也触及了我们客户群体和粉丝在价格承受能力方面的极限,但我们仍然决定做。正常情况下,汽车行业首先会评估商业模型、投资与成本,决定是否开发。但在这里,只要有提升性能、提高速度、增强操控性的好点子,公司就说「去做吧」。 或许觉得小米 SU7 太过大众的可以考虑一下 IONIQ 6 N ?就是不知道会不会被认成伊兰特。
新国标要求电子产品应内置一键信息清除功能,手机、平板电脑等需至少覆写2次
IT之家 7 月 14 日消息,网信办今日对《电子产品信息清除技术要求》强制国标征求意见,文件明确要求,电子产品厂商应在设备中内置一键信息清除功能。针对不同设备,标准规定了严格的数据覆写次数:手机、平板电脑等用户数据需至少覆写 2 次,而电脑的固态硬盘同样至少覆写 2 次,传统机械硬盘则不少于 3 次,以确保数据无法被恢复。 IT之家从《要求》中获悉,标准重点规范了电子产品回收环节。回收经营者必须确认用户数据已被有效清除,严禁转售或出境未做处理的设备。标准创新性地引入了追溯码制度,用户可凭码查询旧设备的清除处理状态。 电子产品应对用户可寻址或访问的数据存储空间(简称用户数据空间)的以下用户数据进行清除: 清除用户安装的应用程序、应用私有数据和跨应用共享数据; 清除照片、视频、文档、音乐、录音、下载文件、浏览记录等用户媒体文件; 清除用户使用电子产品产生的临时缓存文件; 清除电子产品中备份的用户数据; 清除用户使用电子产品时设置的系统配置信息,如账号密码、指纹模板、蓝牙配对设备密钥、Wi-Fi 记录、个性化设置等; 清除用户通过 NFC 技术绑定的用户 IC 和 ID 卡; 清除或破坏用户数据的加密密钥
年底见,马斯克暗示特斯拉将展示“有史以来最史诗级”的产品
IT之家 7 月 14 日消息,马斯克今日在 X 上透露,特斯拉可能即将在今年年底举办一场堪称公司历史上最重要的演示活动。 马斯克提到,自己刚刚参观了位于加州霍桑的特斯拉设计工作室,自己对所见之物深感震撼。他还透露,特斯拉将在年底举行一场极为盛大的演示。“刚离开特斯拉设计工作室。今年年底将奉献‘有史以来最史诗级’的演示。” 至于这次“史诗级发布”究竟为何者,电动汽车分析师、特斯拉爆料人士 Sawyer Merritt 在评论区抛出了一个投票,预测第三代 Optimus 机器人、下一代 Roadster 跑车等产品将会是可选项。 综合IT之家此前报道,马斯克曾在上月透露,特斯拉的 Optimus 人形机器人将迎来重大改进。从财务角度来看,该产品可以说是特斯拉正在开发的、最具日常消费应用潜力和价值增长潜力的产品。 Optimus 目前仍处于开发阶段,但特斯拉在过去几年中已取得了显著进展。该项目最初仅是一个简单概念,以一名身着紧身衣的人类形象首次亮相。然而,短短几年间,特斯拉已成功开发出多款人形机器人原型,并将其应用于公司内部的制造设施中。 去年,马斯克曾在投资者电话会议上暗示 Roadster 超跑将被进一步推迟。马斯克并未更新特斯拉 Roadster 超跑的发布日期,只是强调特斯拉的重点仍然是那些对全球有更大影响的项目,跑车的研发虽然有趣,但必须排在优先事项之后。
中国有条件批准:美国EDA巨头新思科技收购安似科技
快科技7月14日消息,今天下午,市场监管总局发布《关于附加限制性条件批准新思科技公司收购安似科技公司股权案反垄断审查决定的公告》。 据了解,2024年1月16日,美国EDA大厂新思科技曾在宣布,将以现金加股票的形式,收购工业软件大厂安似科技(Ansys),总价值约为350亿美元。该交易原本预计将于2025年上半年完成,但需获得Ansys股东的批准、获得必要的监管部门批准以及其他惯例成交条件。 今年5月底,新思科技收购ANSYS的交易已经获得了美国联邦贸易委员会的最终批准,获得了除中国以外的所有其他地区的监管机构的批准。 同期,美国商务部工业和安全局(BIS)向包括新思科技在内的三大EDA公司发出通知,要求他们停止向中国发货和提供服务,这也使得这三大EDA厂商的对华供应一度中断。直到今年7月2日,美国BIS才发布通知,宣布解除对中国芯片设计业所需的EDA软件的出口管制。 随着美国对华EDA工具的出口管制禁令的取消,这也将使得中国有条件批准新思科技收购ANSYS交易案。 案件基本情况: 收购方:新思科技。1986年成立于美国,纳斯达克证券交易所上市公司,无最终控制人。主要从事EDA软件和设计IP业务,为芯片和电子系统开发公司提供解决方案。 被收购方:安似科技。1970年成立于美国,纳斯达克证券交易所上市公司,无最终控制人。主要业务为开发和销售数字模型仿真与分析(以下称S&A)软件和服务。安似科技的S&A软件可用于半导体设计领域,供芯片设计人员在芯片设计工作流程中使用,可视为EDA软件。 交易双方于2024年1月15日签署协议,新思科技将以现金和换股形式,收购安似科技所有流通的普通股。交易后,安似科技将成为新思科技的全资子公司。 当然,中国市场监管总局对该收购案的批准是有限制条件的。 公告称,鉴于此项经营者集中在全球和中国境内光学软件、光子软件市场、部分EDA软件市场和设计IP市场具有或者可能具有排除、限制竞争效果,根据申报方提交的附加限制性条件承诺方案,市场监管总局决定附加限制性条件批准此项集中,要求集中双方和集中后实体履行如下义务: (一)剥离光学解决方案相关业务,即新思科技整个光学和光子器件仿真业务。 (二)剥离功耗分析软件有关业务,即安似科技功耗分析软件相关的研发、分销、许可、销售等业务。 (三)遵守所有现有客户合同,包括价格和服务水平条款。不得终止现有客户合同,不得拒绝中国客户续签现有客户合同的要求,公平、合理、无歧视地向中国客户供应主要用于寄生分析、晶体管级电源完整性分析和功率器件分析的新思科技EDA产品和安似科技EDA产品。 (四)不得以任何方式捆绑搭售交易双方相关产品,不得阻碍或限制客户单独购买或使用新思科技或安似科技相关产品,不得在服务水平、价格或功能等方面对客户差别对待。 (五)继续支持安似科技相关EDA产品或主要用于寄生分析、功率器件分析和晶体管级电源完整性分析的新思科技相关EDA产品所支持的行业标准格式。 (六)继续维持并应中国客户要求续签有关产品的现有互操作性协议。 (七)在获得中国客户书面支持的情况下,根据第三方EDA厂商的要求,与第三方EDA厂商签订互操作性协议。
华为穿戴产品发货超两亿只:其中GT系列超5200万只,官方透露产品设计历程
IT之家 7 月 14 日消息,华为“心声社区”今日发文透露,截至 2025 年 6 月,华为穿戴产品发货超过两亿只,其中 GT 系列超过 5200 万只。 ▲ 华为 WATCH GT 系列“全家福” 时任华为智能穿戴产品管理部部长戴晓锋在文中透露,2017 年初,彼时的华为穿戴仍在艰难探索着未来的发展方向。“在对消费者和市场深入洞察分析后,我们意识到:高颜值可以解决消费者‘愿意戴’的问题,长续航可以解决消费者‘戴得住’的问题,基础运动和健康的智能化功能可以增加消费者佩戴粘性。我们决定锚定产品,定义黄金三角:打造一款‘具备两周超长续航,兼顾高颜值和完善运动健康功能’的手表,创造一款超越行业的产品。” 然而,在彼时的技术储备下,要实现超长续航对开发团队来说无疑是异想天开。 转机出现在架构师赵工的一次逆向思维提案:“如果要把大电池堆放到寸土寸金的手表的中心,有没有可能将 PCB(电路板)碎片化,围绕在大电池周围?”他的意思是 PCB 采用异形方案,与电池平铺布局,通过三维堆叠优化,确保电池仓空间,这个方案理论上可以将电池容量提升至 420mAh,但是需要对现有的硬件布局进行重构,不确定是否可行。 戴晓锋表示,2018 年元旦刚过,各领域专家针对大电池方案进一步进行探讨。经过尺寸打磨、造型微调等,2018 年 10 月,GT 系列成功上市,销量超出预期。上市后,消费者调研结果显示,81% 的消费者购买手表的第一理由是:两周持久续航。这真正打中了消费者的第一痛点,开创了 GT 系列的长续航心智,也开启了国内 GT 系列全新赛道。 而到了第 2 代 GT 开发时,团队分析了数万条用户体验数据及数轮的用户调研结果后,挖掘出消费者对于智能手表在场景拓展上的追求:逛街或运动时,无需掏出手机,抬腕就能优雅地接听电话。这就是 GT 第 2 代关键卖点“蓝牙通话”灵感的来源。 此外,表盘市场的成功打造对于 GT 2 的影响深远。在 GT 2 上市近半年时,一位第三方表盘的开发者设计并上架了一款“太空人表盘”,萌趣的卡通形象迅速火爆全网,带动了 GT 2 的销量。GT 2 上市后大获成功,周销量超过了一代同期的三倍,并在生命周期达成千万台销量。 GT 3 Pro 43mm 版成为智能穿戴行业首款搭载纳米微晶陶瓷的产品,采用局部的 C 形金属条作为天线,并嵌入到陶瓷侧壁,既满足天线要求,还不占用表径空间。 ▲ 华为 WATCH GT 3 Pro 陶瓷版 GT 4 系列采用八边形几何美学方案,提出绿白设计,首次使用了复合编织表带。该系列销量较上代近乎翻倍,且累计 FFR(现场失效率)、NPS(净推荐值)均达成挑战目标,较上一代改进 19%,并获得华为穿戴在终端 BG 的首个质量奖一等奖。 ▲ 华为 WATCH GT 4 WATCH GT 5 系列作为手表核心传感器 PPG(IT之家注:光电容积描记法)第六代模组首个商用的产品,承担起把 PPG 6.0 打造成“玄玑”技术品牌的重任,在心率、血氧等基础指标上的监测能力提升显著。 WATCH GT 5 系列将健康监测从生理维度拓展至心理领域,率先推出情绪健康助手,还创造性地通过萌宠表盘,将情绪数据卡通化地展示在表盘上。上市后,团队对 GT 5 功能的使用情况进行了分析:情绪健康助手成为 GT 5 使用率最高的运动健康功能,萌宠表盘也成为 GT 5 使用率最高的表盘。 ▲ 华为 WATCH GT 5 系列情绪萌宠表盘
Gartner解读2025中国十大AI趋势:开源模型增强生态掌控力,超4成中国企业已试点Agentic AI
作者 | ZeR0 编辑 | 漠影 智东西7月14日报道,今年,Gartner 首次面向中国市场发布《2025 中国 AI 趋势》研究报告,提出三个主题、十大趋势:一是在机遇中开展创新(开放式生成式AI模型、“自建策略倾向”、代理型AI),二是利用成本可控的AI实现业务转型(节俭型AI、工程化能力、协作式AI防御体系、快速增长的AI人才),三是B2C驱动的AI生态系统(无处不在的AI、包容性AI生态系统、从数据到AI的生态系统)。 近日,这份报告的主笔人、Gartner中国AI研究团队分析师费天祺(Fay Fei)与智东西等媒体进行深入交流,对这十大趋势进行更详尽地解读,分享中国AI产业在资源约束与战略机遇交织下的发展逻辑。 生成式AI正多维度重塑企业运营:非技术人员接触AI的门槛降低,员工AI素养显著提升;跨部门应用场景因易用性加速落地;AI治理被推向新高度,业务部门主导的治理方案受关注。然而,企业对AI投资回报率仍信心不足,Gartner 今年1月调研显示,仅13%受访者“非常有信心计算回报”,37%信心一般,36%及4%信心较低。后续企业如何衡量AI投资,将是核心课题。 费天祺(Fay Fei)告诉智东西,Gartner已在使用深度研究类Agent工具来提升效率,其中既有Gartner内部研究用的研究工具,也有供客户使用的研究工具,这些工具已经带来明显的生产力提升。目前来看,Agent在某一个具体场景中更易落地,短期内很难做到纯通用Agent。她谈道,国内基础模型赛道已进入快速收敛阶段,大部分企业用某一两款模型,原因是投资基础大模型整体成本很高的,但商业变现路径还不明确,市场逐渐回归理性、趋于谨慎。 以下为2025年中国十大AI趋势的具体解读: 1. 开放式生成式AI模型 中国开放大模型的核心目标是生态掌控与合规自立,开源旨在保障自主可控与产业安全。DeepSeek在今年年初发布的高性能开源模型,打破了此前私有模型主导且成本高昂的市场格局,推动国内外厂商纷纷开放技术,重塑全球AI市场。 Gartner对比发现,开源与私有模型的性能差距持续缩小,过去依赖规模效应的优势减弱,开源模型也能达到类似效果,同时推理成本相对可控。国际评估显示,开源模型在文本生成、代码辅助等任务中表现突出,如DeepSeek在 Copilot 场景中排名第一,得到国际认可。 2. 自建(Build)策略倾向 中国企业的自建倾向并非重复建设,而是为控制关键环节与实现定制化创新,尤其在政企、大型国企及工业场景中趋势明显。这种策略聚焦工程工具与应用层(如智能客服)的自研,形成 “组装式平台架构”,基础设施与大模型层则多依托现有资源,以平衡自研与成本效率。 3. Agentic AI(代理式AI) Agentic AI强调具备任务感知、自主反馈能力的智能体架构,在客服机器人、数字员工等场景落地较多。调研显示,42%中国企业用户处于试点阶段,15%已生产落地,这个数据超过了去年全球的10%数据。目前以翻译、编程等垂直场景应用为主,通用智能体仍存预期差,但落地进度领先全球。 4. 节俭型AI(Frugal AI) 在资源受限背景下,企业更注重AI的性价比,通过轻量部署、边缘计算降低门槛。AI应用中的隐性成本(如算力扩容、数据治理)推动企业强化成本管控,这一趋势对中小企业尤为关键,使其能在有限资源下推进AI应用。 5. 工程能力加速AI开发 中国企业的工程能力优势显著,通过自动化微调平台、多模态框架等基础设施,加速AI从原型到生产的转化。数据显示,2024年生成式AI生产落地率为8%,2025年预计达43%,工程能力成为推动这一增长的核心动力。 6. 协同式AI安全防御 随着AI在业务侧的广泛应用,Shadow AI等风险凸显,安全防御需要IT、法律、业务部门协同构建治理框架。当前企业在工具与管理经验上仍待完善,构建端到端治理体系成为产业共识。 7. 快速增加的AI人才储备 中国AI人才储备增速明显,2022年顶级AI会议论文中中国研究者占比达47%,中小学AI教育普及强化人才梯队。企业需求从技术开发转向业务场景创意,提示工程、Agent培训等成为人才培养重点。 8. 无处不在的AI(Ubiquitous AI) 中国AI落地不一定从办公桌开始,很多发展良好的AI应用是B2C场景的、消费者导向的,汽车、可穿戴设备、手机等终端成为生成式AI爆发的重要载体。与其他国家和地区相比,中国在技术基础设施、5G覆盖、互联网的数字生态系统、完善的供应链等方面具备优势。从直播互动到智能银行,AI在消费端的应用培育了市场基础与用户习惯。 9. 包容式AI生态系统 企业从单一产品转向一体化生态布局,提供“模型、平台、工具、服务” 一站式能力,横向跨厂商集成模型,纵向整合软硬件(如AI一体机),降低企业应用门槛。这种生态模式聚焦输出结果,而非模型选择,体现了较强的实用导向。 在这个背景下,用户不关心使用哪个模型,最终是看AI输出的结果是否理想。所以对于厂商来讲,更多是找到自己的生态位、找到生态成员之间的合作,把技术能力衔接的地方抹平,让企业可以快速实现应用部署和上线。 10. 数据到AI生态体系 随着模型差距缩小,数据成为企业AI竞争的核心壁垒。数据管理与生成式AI形成闭环:一方面,数据治理提升模型输出准确性;另一方面,大模型能力优化数据管理效率,二者相互促进,推动产业向深度耦合演进。 结语:中国AI产业走向务实 从上述趋势可见,中国AI产业正沿着务实路径推进:既注重在资源约束下寻求突破,通过开源、自建等方式保障自主可控;也强调成本优化与价值落地,推动AI从技术探索向业务渗透。 未来,随着数据与AI的深度融合、协同治理体系的完善,AI产业有望逐步从分散应用走向系统协同,其发展质量的提升将更加依赖于技术落地效率与实际业务价值的平衡。
我去配了一副 AI 眼镜,发现近视不配用 AI 眼镜?|附配镜指南
智能眼镜可以算得上是 2025 年最让人「眼前一亮」的产品之一了,各种实现方案与隔壁的手机市场呈现出了截然不同的热闹景象。 然而在这个勃勃生机、万物竞发的背景下,我作为一个需要全天佩戴近视镜的用户,一款近期的智能眼镜「能不能满足我看清东西」成为了购买之前的主要考量,远远超过了各种花里胡哨的 AI 功能。 换句话说,能否「让每个视力受损的人都能享受到科技的乐趣」其实是眼部智能穿戴设备非常重要的一个因素,也是值得每一个人——包括视力正常的人——关注的,因为这背后体现的是厂商对于用户的重视程度。 图|VR 陀螺 本次我们借着手中的小米眼镜作为楔子,为大家梳理了目前市面上几款最主要的「眼部智能穿戴产品」的配镜流程,希望能够为正在犹豫的你提供一些选购上的支撑: TL;DR(太长不看版) 目前市面上绝大多数在售的智能眼镜产品都有第一方的配镜服务,合作商不尽相同 近视 -600 度、远视 +800 度是一个分水岭,超过这个度数范围后官方配镜选择会变少 大多数主流产品支持自己购买和安装第三方镜片,配镜流程和普通镜框基本相同 有特殊形态的后挂式镜片组(比如雷鸟 Air 3)第三方选择较少,部分品牌官方未给出独立购买渠道 我们配了几副 AI 眼镜,整理出这份配镜指南 首先,我需要向各位视力正常、(有幸)没有体验过医疗配镜流程的读者们大致介绍一下普通眼镜是怎么配出来的。这样才方便对比各类智能眼镜或头显的配镜流程。 以日常生活中最常见到的四类情况:近视、远视、散光、老花为例,用于处理这些视力受损情况的眼镜片通常被称为处方镜片(prescription lens),即必须要通过验光师检查和开方才有效果的镜片,也会因为其起效原理被称为屈光镜片。 与屈光镜片相对的则是平光镜片,即单纯起到保护或装饰作用、不会弯曲光线的镜片,比如常见的墨镜、运动防护眼镜、钓鱼时用于消除水面反射的偏光镜等等,都属于广泛意义上的平光镜片。 偏光眼镜的原理与相机使用的偏振镜(CPL)是相同的 而在现在的商业模式下,「配眼镜」这件事已经从曾经的在医院一站式解决变成了非常分散的商业行为,买镜框、验光和定做镜片可以是三个互不关联的环节。 比如你可以在京东买一副暴龙的纯钛镜框,然后去旁边的眼科医院预约专业验光,最终在拼多多用这份验光单去定做蔡司的泽锐镜片,把镜架寄给商家打磨并安装镜片之后就大功告成了。 在这样的基础上,我们会发现,购买智能眼镜并配镜的流程并没有真正变得更复杂。 小米智能眼镜 与目前市面上其他几款智能眼镜不同的是,小米自己也有涉猎眼镜和配镜业务,具体来说,在小米有品 app 中就可以直接购买第三方品牌的镜架和定做处方镜片,流程基本上与去医院验光后在网上买眼镜无异。 而小米智能眼镜本次也宣传与上海明月眼镜合作,包含首销期内免费验光等等福利。经过我们的考察,如果你有搭配处方镜片的需求,总共有这样几种购买和配镜的渠道: 在电商平台直接购买普通版的小米智能眼镜,收到镜框后当作普通的镜框,去医院验光、去线下定做镜片并现场打磨安装。 在电商平台的「明月眼镜」店铺中购买小米智能眼镜,只需要提供目前的验光单,就可以按照组合价购买已经装好镜片的成品眼镜,只不过可以选择的明月眼镜镜片种类比较有限。 在小米之家购买普通版的小米智能眼镜,店员会指导你拿着镜框去与小米有合作的眼镜店(比如博士眼镜),眼镜店会专门提供明月镜片,此后的流程与线下配镜无异,配镜周期为一到两周。 总的来说,小米智能眼镜的配镜流程并没有什么特殊的,你完全可以把它当作一个没有任何特殊功能的眼镜框,按照普通眼镜的流程去配镜,属于对第三方配镜非常友善的类型了。 在部分小米门店,购买镜框后店员会指引你去附近的眼镜店完成配镜 至于小米宣传的明月镜片合作,除非你已经有了非常完善的第三方验光单,并选择直接在明月眼镜的网店中购买,否则它的方便程度是不如自己配第三方镜片的,等待周期还更长,镜片类型和镀膜类型也不如自己配镜丰富。 另外,明月眼镜提供的在线配镜最高只能配到 -600 度近视镜片,如果你的近视度数超过 600,或者对瞳距、散光和镜片功能有特殊要求,那么还是直接购买眼镜后去眼镜店线下验光配镜更保险一些。 还有一点需要注意的是,小米这次推出的两款电致变色镜片都是不支持配屈光镜片的,如果有度数和变色两种需求,就只能购买普通版小米智能眼镜后,再去单独定做带度数的光致变色镜片了。 雷鸟 V3 & V3 Slim 不得不说,小米智能眼镜发布之后,雷鸟 V3 系列的声量似乎又重新上涨了不少——因为比起小米「没有设计就是最好的设计」,雷鸟显然是做了一点设计的。 雷鸟 V3 Slim(左)与小米智能眼镜(右)|Gabriel 作为一款同样没有显示功能、默认搭配平光镜片的智能眼镜,雷鸟 V3 和 V3 Slim 的配镜流程基本上与小米智能眼镜完全一致,只不过缺少了合作的眼镜店而已: 在电商平台直接购买普通版的雷鸟 V3 眼镜,收到镜框后当作普通的镜框,去医院验光、去线下定做镜片、现场打磨安装。 在京东的雷鸟旗舰店中可以购买搭配蔡司定制镜片的雷鸟 V3,直接按照验光单填写度数、瞳距、轴位和散光四种指标即可定做镜片。 可选择 1.6 和 1.67 两种折射率的镜片,价格分别为 2499 和 2749 元,收到货就是组装好镜片的成品眼镜。 与小米相比,雷鸟 V3 的线上配镜显得更加透明一些,并且能够支持的度数也比明月镜片更高,在京东上的配镜支持近视 -2000 到远视 +850 度——虽然最终的价格更高,但也更灵活性。 当然,如果你是价格敏感型用户,那么直接购买普通版镜框后线下购买镜片永远是更划算的选择,根据爱范儿采访的一位先后购买了小米和雷鸟眼镜的用户介绍,他为自己的雷鸟 V3 Slim 线下定做一副 1.56 的依视路膜洁镜片只花了 298 块钱。 Ray-Ban Meta 虽然 Ray-Ban Meta 眼镜不在国内上市,但它的配镜方式基本上与小米和雷鸟无异,同样分为「线上直接定做」和「线下自己换」两种主要路径。 除了雷朋的线下渠道之外,Meta 自己也在洛杉矶开设了一家专门售卖眼镜的实体店|Retail Dive 相比小米或雷鸟,Ray-Ban Meta 的优势在于雷朋自己就是一家专业的眼镜厂商,因此第一方可选的镜片种类要丰富许多,无论是处方镜片还是平光镜片,都有非常多不同种类和样式可选: 只不过这样一套操作下来,原价 299 美元的 Ray-Ban Meta Wayfarer 加上雷朋的处方镜片后总价会超过 450 美元,这还是在没有选择任何特殊变色工艺或镀膜的情况下——第一方配镜贵的问题仍然存在。 换句话说,Ray-Ban Meta 依然遵循只购买普通版眼镜后自己配镜并更换依然是更划算的选择,以第三方镜片厂商 VR WAVE 专为 Ray-Ban Meta 框型推出的处方镜片为例,一副仅需 90 美元: 苹果 Vision Pro,以及其他 XR 眼镜 严格来说,上面提到的小米智能眼镜、雷鸟 V3 系列和 Ray-Ban Meta 其实是相同的一类产品,即不包含显示功能的语言操作型智能眼镜。但在这之外,还有另一类以眼镜外形存在的智能设备—— 智能 XR 眼镜。 1. 苹果 Vision Pro 以其中最具标志性的苹果 Vision Pro 为代表,目前的 AR 类产品大多采用了将显示组件与屈光镜片完全分离的设计,年初比较火爆的 XREAL One、雷鸟 Air 3s 系列、魅族那个带有单色文字显示功能的 MYVU 眼镜,以及 Meta Quest 头显均属于此列: 图|苹果官网 这样完全分离设计的好处在于留给屈光镜片的空间更大,对于度数的适配范围也就更多,模块化的设计也让多人共用一台机器成为了可能——当然整机也就显得更笨重一些,并且与我们脑海中「智能眼镜」的标准形象也相去甚远。 在适配范围方面,苹果 Vision Pro 所联名的蔡司光学插件(ZEISS Optical Insert)镜片度数范围大约是近视 -1050 到远视 +625 度左右,可以直接在蔡司的官网查询度数是否支持后再选择下单配镜。 2. 雷鸟 Air 3 系列 雷鸟 Air 3s 使用的后挂式屈光镜片则是需要在电商平台下单时联系客服提供验光单,可以涵盖近视 -1000 到远视 +800 度,以及最高 200 度的散光: 图|雷鸟京东自营旗舰店 这样的后挂式镜片虽然度数涵盖更全面,但问题也是一目了然的:作为第一方配件,除非参考苹果这样单独将屈光镜片作为一种产品销售,后挂镜片后期的维护和更换就充满了未知数。 比如雷鸟就没有为 Air 3s 的屈光镜片提供单独的购买渠道,导致镜片受损或者度数发生变化后的重新配镜变成了一件不确定性很高的事情,渠道不固定、价格也不透明,第三方配镜替代品的存续时间和存货数量也很难得到保证。 图|充电头网 与「具有眼镜功能」的智能眼镜相比,智能 AR 眼镜更偏向于一块你能够戴在眼前的虚拟大屏,它们的运行方式与普通眼镜是大相径庭的,因此对于视力受损的处理方式也不尽相同,能够拥有第三方商家制作的屈光镜基本上就是最好的结果了。 3. 星纪魅族 StarV View 此外,还有一类是与魅族 StarV View 类似的,可以自行调节屈光度的 AR 眼镜。它们的问题在于往往只能兼顾近视,并且调节的范围也比较有限,通常最多只能调到 -600 度(中度与高度近视的分界线),对于散光或者联合光度较高的需求是无法满足的: 考虑到智能眼镜的重量和结构,允许自调节屈光度的方式很难称得上实用,反而更加适合 Vision Pro 和 Meta Quest 这类体积比较大的头显类产品,可以作为自身无障碍功能的延展。 然而选择自调节屈光度同时也意味着选择放弃了对于其他几种视力受损情况的照顾,并且也将产品局限在了非穿透式的全遮挡 AR 显示器领域,是没有办法直接移植到智能眼镜上的。 近视不配用 AI 眼镜?未来不应如此 以上种种,无论是来自品牌方的第一方定制服务,还是第三方商家的镜片,更多都只是初步解决了视力受损用户「能不能使用」的问题——然而,作为一款以显示为终极目标的产品,智能眼镜的参数远远不止看得清。 爱范儿主编就是一位高度近视用户,与此同时,他也是一位 Vision Pro 的重度用户——这就决定了,他作为一个必须搭配蔡司光学插件来使用 Vision Pro的用户,戴着头显设备时,蔡司镜片上「轻微的反光」,是打破他沉浸感的一大元凶。 而这已经是在 Vision Pro 本身画质和蔡司镜片的光学素质都已经处在行业顶尖的基础上的结果,比起其他 AR 眼镜的外挂镜片,还是要舒服多了。 我本身也是一位高度近视用户,在实际尝试配镜后,最终我还是放弃了购入一副 AI 眼镜。于我而言,配镜过程中发现的种种不便,彻底打消了我对 AI 眼镜美好未来的憧憬。无论是外挂镜头,还是定制镜片,只能说这是目前的最优解,但远远称不上一劳永逸。 图|iMore 只要物理学暂时还存在,我们就很难完全规避多层镜片与屏幕之间带来的反射和干扰,而类似影目 Air 3 那样根据验光数据为每一个用户蚀刻单独的阵列光波导玻璃,更是非长期的解决方案——毕竟科技的目的是范用化,而不是定制化。 图|搜狐 我们为什么应该关注智能眼镜对于视力受损人群的适配程度? 不仅是因为全球有约 22 亿人处在视力受损的状态,也不仅是因为中国青少年总体近视率达到了 51.9%,更是因为它与现在的手机无障碍操作是不同性质的问题—— 如果肢体受损,在无障碍功能的帮助下,还能多少实现一些对于手机和电脑的基本操作。 但是,在智能眼镜必将向着显示功能发展的将来,如果我们无法解决现有显示技术与屈光镜片之间的矛盾,那么这 22 亿人就有可能会变成「无法使用智能眼镜」的 22 亿人。 这个数字,是任何一种现代科技都不应该有的代价。 如果未来的智能眼镜,无法找到适配近 7 亿视力受损的中国用户的方式,那它就永远没有办法取代智能手机,成为一种真正的、普惠的、大众化的技术。 近视不配用 AI 眼镜?未来不应该如此。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。