行业分类:
加载中...
头条分类:
加载中...
禁止,微信、抖音最新出手了
来源:微信安全中心 抖音安全中心 微信安全中心3月26日发布《针对在微信使用“外挂”行为的打击公告》,《公告》指出, 微信明确禁止使用各类外挂。但近期有部分用户存在多次违规使用外挂软件,或在朋友圈发布外挂售卖信息的行为。对此,微信安全团队进行了专项清理,并将持续加大清理力度。 上述行为一经发现确认,微信将依据国家相关法律法规及《腾讯微信软件许可及服务协议》《微信个人账号使用规范》 ,根据违规严重程度进行阶梯式处理;对于多次违规者,将加重处罚。 常见的微信外挂类型: 一类是以各种噱头诱导用户直接下载使用的: 一键转发朋友圈:可以批量转发朋友圈图文以及好友发送过来的短视频; Android模拟器:在电脑上模拟手机端登录微信,实现和微信手机端一样的操作; 红包外挂:当微信收到红包消息之后,自动完成微信抢红包的操作; 皮肤微信:可以更换微信logo图标,自定义微信主题; 微信多开:在一台设备上使用多个微信号。 另一类是利用群控技术开发的外挂,通常被包装成“微营销”神器: 微信群控:通过虚拟定位、批量打招呼等方式,实现批量添加好友,自动化批量发朋友圈,一键点赞,一键评论等功能; 微信机器人:微信群营销,实现定时群发,自动回复,自动聊天等控制功能。 外挂软件不仅破坏了微信平台的生态平衡和正常运营,还为恶意营销行为提供了便利条件,对正常用户造成骚扰,而且使用外挂软件存在多种风险: 有隐私风险:外挂软件存在收集泄露用户隐私信息、盗取用户账号密码等风险; 威胁财产安全:很多外挂软件还会植入木马病毒,使用外挂可能被坏人利用,威胁资金安全; 被利用骚扰别人:可能在不知情情况下,被利用来骚扰别人,影响好友关系; 助长坏人犯罪:容易被违法犯罪分子利用,用以发布不良信息、实施欺诈,助长违法犯罪的发生; 影响使用微信的稳定性:外挂软件可能缺乏稳定性,容易造成微信运行崩溃,进而引起聊天内容或其他重要数据丢失等风险。 微信安全中心表示:请从官方渠道下载微信客户端,不要使用具有多开、自动抢红包、一键群发等功能的“李鬼”微信,也不要使用其他破坏微信软件或具有外挂功能的插件及软件;如果你目前正在使用外挂,请马上卸载。 抖音最新公告: 治理AI生成虚拟人物 3月27日,抖音安全中心发布 《抖音关于 不当 利用AI生成虚拟人物的治理公告》称, 近期, 抖音站内仍有不当使用AI技术, 生成虚拟人物发布内容的账号, 平台进行了严厉处置。 去年,抖音发布《关于人工智能生成内容的平台规范暨行业倡议》,明确平台不鼓励利用AI生成虚拟人物进行低质创作,将严格处罚违规使用AI生成虚拟人物发布违背科学常识、弄虚作假、造谣传谣的内容。 近期平台发现,站内仍有不当使用AI技术生成虚拟人物发布内容的账号,平台进行了严厉处置。 其中典型行为包括: 1.生成境外虚假人设,消费爱国心理、博取关注。用虚假外国人的形象,以想嫁给中国、想到中国生活、评价社会事件等言论博取眼球。 2.生成俊男美女虚假形象,骗取互动,交友导流。直接称用户为“你”“娘”“妈妈”“老公”等,发布情感诱导、唱情歌、为你谋福利等表达虚假情感的内容,将用户导流至私人聊天工具,甚至进行诈骗。 3.生成精英人士虚假人设,发布心灵鸡汤、财商、伪国学、厚黑学、伪成功学等不良内容,低质吸粉,甚至引流到站外以卖课、入群等方式获利。 针对违规使用AI生成虚拟人物的行为,平台会对违规视频下架,对违规账号进行取消其投稿和营利权限、抹除账号粉丝、封禁账号等处置,并利用模型、技术识别能力等手段,进行长期系统的识别发现和处置。 同时,平台已掌握部分黑产团伙不当使用AI生成虚拟人物用于犯罪的线索,将报警打击。 人工智能技术的快速发展,丰富了互联网内容生态,但也带来技术滥用的挑战。平台重申,创作者、主播、用户、商家、广告主等平台生态参与者,在抖音应用生成式人工智能技术时,须遵循以下规范: 1.发布者应对人工智能生成内容进行显著标识,帮助其他用户区分虚拟与现实,特别是易混淆场景。 2.发布者需对人工智能生成内容产生的相应后果负责,无论内容是如何生成的。 3.虚拟人需在平台进行注册,虚拟人技术使用者需实名认证。 4.禁止利用生成式人工智能技术创作、发布侵权内容,包括但不限于肖像权、知识产权等。一经发现,平台将严格处罚。 5.禁止利用生成式人工智能技术创作、发布违背科学常识、弄虚作假、造谣传谣的内容。一经发现,平台将严格处罚。 治理违规内容是抖音的长期工作,平台号召广大用户共同监督,如发现不当使用人工智能生成内容的情况,可以在站内举报或发送详情至举报邮箱:feedback@douyin.com,平台将在第一时间核实处理。 抖音安全中心 2024年3月27日
理想汽车诉贴膜店一审胜诉,后者需改名且赔偿2万元
IT之家 3 月 27 日消息,去年 7 月,理想汽车以“侵害商标权及不正当竞争纠纷”为由,起诉山东临沂一家带有“理想”二字的贴膜店并索赔 120 万元,目前该案的一审判决已经出炉。 今日,山东临沂“理想汽车贴膜工厂”老板朱裕昊发视频称,自己被理想汽车起诉一案法院已做出一审判决。他称,一审判决一是要求其停止使用带有“理想”字样的广告牌;二是要求朱裕昊更改企业名称,并且更改后的企业名称中不得含有“理想”二字;三是要求朱裕昊向理想汽车道歉,以消除对理想汽车的影响;四是判定朱裕昊向理想汽车赔偿经济损失和合理支出两万元。 对于上述判决,朱裕昊表示:“我觉得一个公司的口碑,是他长期以来对产品研发的投入、对客户的服务担当、对社会的责任和贡献,口口相传得来的,当然如果有一天真的需要我这个道歉,我们尊重法律。”对于被判处的两万元赔偿,朱裕昊表示:“之前他们(理想汽车)索赔 120 万,法院经过调查认定我的小名跟理想这个商标相同,并且我们店铺招牌这十几年以来一直用的也是理想,最后得出来的结论(赔偿 2 万元)”。 IT之家注意到,朱裕昊表示下一步将咨询律师再决定是否要上诉。 去年被理想汽车起诉后,朱裕昊曾在社交平台上连发多条视频称,自己小名叫“理想”,并且贴膜店是 2012 年开的,彼时理想汽车还没诞生,且店铺售卖的产品与理想汽车没有任何关系,无法理解理想汽车要求赔偿百万元的经济损失。而理想汽车方面随后发布声明称,起诉理想贴膜工厂的原因并非普通商标“侵权”,而是该店存在冒充理想官方进行商业活动行为,并被当地车主举报。不过,朱裕昊否认了理想汽车的指控。
“音乐版ChatGPT”Suno爆红;双足机器人百米赛跑不到25秒
图片由AI生成 近期,生成式人工智能(AIGC)领域又涌现出多款创意十足的新应用。 今天,钛媒体AGI梳理了免费 AI “神器”系列第十弹,共五款,其中不少产品再一次拓宽了我们对AI的想象力。 音乐生成模型——Suno V3 会跑步、跳远的双足机器人——Cassie 设计师专属AI设计平台——Creatie 全球首个引入真实物理感知的文生视频模型——Viggle 文本转AI教学视频工具——Gatekeep 1、音乐生成模型——Suno V3 产品信息:Suno V3是人工智能初创公司Suno推出的“广播级”音乐生成模型,旨在为用户提供更加丰富和高质量的音乐体验。该模型能在数秒内根据内容主题、音乐风格等提示词生成2分钟的完整音乐。 产品功能:首先是快速音频生成个性化定制功能,Suno V3可以根据用户给出的提示词或音乐风格,在数秒内生成不同曲风、不同流派的歌曲,甚至可以指定AI歌手的音色,不仅提高了音乐创作效率,也让音乐创作更具灵活性和个性化。同时,相比上一代版本,V3生成的音乐质量更高,音质更好,接近广播制作水平。 此外,Suno V3采用专有无声水印技术,可以检测歌曲是否为Suno创建,不仅保护了Suno的知识产权,也为用户提供了验证作品来源的方式。 因具备强大的音乐生成功能,Suno 也被业界称为”音乐版ChatGPT“。Suno 推出后吸引了不少用户试用,他们不仅用中国诗词《水调歌头》、《将进酒》等创作出了出古典、空灵的歌曲,还用周杰伦的歌曲进行二次创作,效果惊艳。 付费方面,Suno目前有免费版和付费版两种,满足不同用户需求。免费版每日有50积分可生成10个音频,付费版有Pro plan 和Premier plan两种,每月月费分别为8美元和24美元,对应生成的音频数量分别为500首和2000首,这些音频均可商用。 体验地址:https://app.suno.ai/ 2、会跑步、跳远的双足机器人——Cassie 产品信息: Cassie 双足机器人由伯克利大学的HYBRID ROBOTICS的研究团队开发,于2017年首次推出,其研发灵感来自于鸵鸟,特点是步伐稳健、精准,可适应各种路面。 产品功能:据了解,研究团队为Cassie植入了深度学习算法,使得Cassie能够在没有牵引和辅助的情况下仍能保持平衡直立,并向前跑动。 2021 年,Cassie用时 53 分钟,跑完第一个 5 公里,按照人类选手的配速来说,每公里 10.6 分钟相当于散步级水平。2022年9月,Cassie 再度展示自己的短跑能力,创造了双足机器人百米赛跑的吉尼斯世界纪录——用时 24.73 秒,均速超过了 4 米/秒。 近日,Cassie 双足机器人发布最新测试成果,研究人员在没有对任何动作进行明确的专项训练下,通过使用强化学习技术,让 Cassie 两足机器人在不同的地形上完成跑 400米 跑步测试和1.4 米跳远。 研究人员训练控制 Cassie 的神经网络,使其从头开始掌握一项简单的技能,如原地跳跃、向前走或奔跑而不摔倒。它被鼓励模仿所展示的动作,其中包括人体动作捕捉的数据和所要完成动作的演示动画。 这一阶段完成后,研究人员向Cassie展示了新的命令,鼓励其使用新的运动技能执行任务。一旦它能熟练地在模拟环境中执行新任务,研究人员就会通过一种名为任务随机化的方法将训练过的任务多样化,这也使机器人对意外情况有了更多的准备。例如,机器人能够在被绳子拉向侧面的同时保持稳定的步态。 此外,团队成员透露,接下来将研究如何用这种技术训练配有摄像头的机器人,下一个重要进展是人形机器人,将让它们实现真正的工作与规划活动,并与物理世界进行更生活化的互动,而不仅限于跑步和跳远。 3、设计师专属AI设计平台——Creatie 产品信息:Creatie是一款AI强化设计工具,旨在运用AI技术帮助设计师简化设计创作流程,提升UI/UX设计效率。 产品功能:首先是位图增强功能,Creatie可以扩展图像、更改背景,并将任何图像转换为高保真或矢量图像。其次是3D图标生成,可以基于任何文本或线框输入,即时生成各种风格的3D图标;再次是设计向导功能,Creatie可以帮助用户克服设计空白页的挑战,提出适合该区域的设计想法;最后,Creatie可以通过AI识别现有文件中的可重用组件并生成包括字体、颜色和阴影在内的全面样式库。在强调简化复杂流程的同时,Creatie还建立了沟通和协作的桥梁,通过创造性想法碰撞,成为设计师强有力的辅助设计AI工具。 体验地址:https://creatie.ai/?ref=top.aibase.com 4、全球首个引入真实物理感知的文生视频模型——Viggle 产品信息:Viggle是全球首个具有实际物理感知能力的文生视频模型,旨在简化动画流程,提高用户创建动画角色视频效率。该模型基于JST-1模型打造,生成的视频不仅看起来真实,而且角色的动作和互动都符合实际物理规律。 产品功能:Viggle最大的优势在于强大的视频生成和控制能力,用户只需上传一张图片,选择一个动作模板就能轻松生成一段个性化视频,也可以输入文字描述和图片,选择或定制角色的外观和动作。无论是模仿名人的招牌动作,还是创造一个全新的虚拟角色, Viggle都能够精确捕捉并再现每一个细节。同时,基于JST-1模型,Viggle拥有真实物理感知能力,生成的视频内容不仅在视觉上逼真,而且动作逻辑也遵循现实世界的规律。此外,Viggle不局限于2D空间,还能够创造出三维的角色和环境,为用户带来更丰富、更立体的视觉体验。 Viggle的适用人群包含视频创作者、动画师和内容创作者等专业人群,帮助他们更高效地制作视频内容。目前该模型还处于测试阶段,未来可能会推出付费订阅版本。 产品入口:https://viggle.ai 体验地址:https://discord.gg/5kk5SKwTWd 5、文本转AI教学视频工具——Gatekeep 产品信息:Gatekeep是一款新型文本转视频AI工具,专注于将数学和物理问题转化为视频内容,帮助学习者更直观地理解和掌握知识。 产品功能:Gatekeep可以根据用户输入的文本提示,自动生成包含图表、图示和动画原理的视频,视频的时长大约为2分钟。可以帮助学习者能直观、快速学习和掌握复杂的概念或原理。 Gatekeep主要应用于数学学习中,通过AI生成的视频,可以将复杂的数学问题和概念用更简单、更直观的方式呈现给学习者。例如,学习者可以向Gatekeep提出"圆周率对于二维圆形面积计算的作用"、“如何用二次公式求解二次方程,请显示图表”或“解释为什么勾股定理是正确的”等问题,Gatekeep会根据这些问题生成相应的教学视频。 Gatekeep的出现为在线教育带来了新的可能性,它不仅可以帮助学生更好地理解和掌握知识,也为教师提供了一种创新型教学工具,极大地提升了教学效率。 体验地址:https://discord.com/invite/36PTEgY892 (作者|章橙,编辑|林志佳)
Sora一旦推出,峰值算力需要75万张H100GPU
Sora何时推出?大约在年底。它非常受欢迎,一旦投入使用,不仅会对影视行业造成冲击,而且会在视频网站、社交媒体、电商平台,以及教育等领域得到广泛应用。它的物理世界模拟器的作用,以及“世界模型”的潜力也非常巨大。 问题来了,它需要多大算力? 风险投资机构Factorial Funds的Matthias Plappert,最近对Sora模型进行了剖析。他们推算的主要依据,是论文Scalable Diffusion Models with Transformers 中的数据。Sora模型在一定程度上是基于论文中所提出的、基于Transformer的架构的DiT (Diffusion Transformers)。论文的第一作者William Peebles目前在OpenAI负责Sora研究团队。 作者假设Sora推出后,将在Tiktok和Youtube上得到广泛的应用,推算出需要的算力相当于72万张英伟达H100 GPU。对比一下,目前Meta拥有的总算力,相当于65万张H100。 下面我们介绍下其中关于训练与推理的部分: 从DiT到Sora训练计算量的外推 关于Sora的细节信息非常少,但我们可以再次查看显然是Sora基础的DiT论文,并从中推断出相关的计算数字。最大的DiT模型DiT-XL有6.75亿个参数,总计算预算约为10^21次浮点运算。为了更容易理解这个数字,这相当于大约0.4个Nvidia H100 GPU运行一个月(或一个H100运行12天)。 但是目前DiT仅对图像建模,而Sora是一个视频模型。Sora可以生成长达1分钟的视频。如果我们假设视频以24帧/秒编码,一个视频最多包含1440帧。Sora的像素到潜在映射似乎在空间和时间上都有压缩。如果我们假设与DiT论文中相同的压缩率(8倍),我们最终在潜在空间中得到180帧。因此,在直观地将DiT外推到视频时,我们得到了180倍的计算量倍增因子。 我们进一步认为,Sora的参数量明显大于6.75亿个。我们估计200亿参数的模型是可行的,这使我们在计算量上比DiT再多出30倍。 最后,我们认为Sora使用的训练数据集比DiT大得多。DiT在批量大小为256时经过300万步训练,即总计使用了7.68亿张图像(但要注意同一数据被重复使用了多次,因为ImageNet仅包含1400万张图像)。Sora似乎是在图像和视频的混合数据集上进行训练的,但除此之外我们几乎一无所知。因此,我们简单假设Sora的数据集中有50%是静止图像,50%是视频,并且数据集比DiT使用的大10到100倍。然而,DiT在相同的数据点上反复训练,如果有更大的数据集可用,这种做法可能是次优的。因此,我们认为4到10倍的计算量倍增因子是一个更合理的假设。 将上述因素综合考虑,并分别计算额外数据集的低估计和高估计,我们得到以下计算结果: * 数据集低估计: 10^21次浮点运算 x 30 x 4 x (180/2) ≈ 1.1x10^25次浮点运算 * 数据集高估计: 10^21次浮点运算 x 30 x 10 x (180/2) ≈ 2.7x10^25次浮点运算 这相当于4,211至10,528个Nvidia H100 GPU运行1个月的计算量。 推理计算与训练计算的比较 另一个值得考虑的重要因素,是训练计算与推理计算之间的对比。训练计算量非常大,但这是一次性的成本。相比之下,推理计算量虽然小得多,但每一次生成都意味着一次推理计算。因此,推理计算量会随着用户数量的增加而扩大,并变得越来越重要,特别是当一个模型被广泛使用时。 因此,观察“收支平衡点”是很有用的,即消耗在推理计算上的计算量,超过了训练期间消耗的计算量的时间点。 (左图对比DiT的训练与推理计算,右图对比Sora的训练与推理计算。对于Sora部分,我们的数据基于上文估计,因此不是完全可靠。我们还展示了两种训练计算的估计:一种低估计(假设数据集大小的倍增因子为4倍)和一种高估计(假设为10倍)。) 在上述数字中,我们再次利用DiT来推算Sora。对于DiT,最大的模型(DiT-XL)每步使用524×10^9次浮点运算,DiT使用250步扩散生成单张图像,因此总计为131×10^12次浮点运算。我们可以看到,收支平衡点在生成760万张图像后达到,此后推理计算将占主导。作为参考,用户每天大约上传9500万张图像到Instagram。 对于Sora,我们将浮点运算次数外推为524×10^9次 × 30 × 180 ≈ 2.8×10^15次。如果我们仍然假设每段视频需250步扩散,那就是每段视频总计708×10^15次浮点运算。作为参考,这大约相当于每小时每个Nvidia H100生成5分钟视频。 收支平衡点在生成1530万(低估计)到3810万(高估计)分钟视频后达到,之后推理计算将超过训练计算。作为参考,每天约有4300万分钟视频上传到YouTube。 需要注意的是:对于推理来说,浮点运算次数并不是唯一重要的因素。内存带宽也是另一个重要因素。此外,现有研究正致力于减少所需的扩散步数,这可能导致推理计算量大幅降低,因此推理速度会更快。训练和推理阶段的浮点运算利用率也可能有所不同,在这种情况下,它们就变得很重要了。 不同模型之间的推理计算量比较 我们还观察了不同模态下不同模型的每单位输出推理计算量。这里的想法是,看看不同类型模型的推理计算量级别有多大差异,这对于规划和预测计算需求有直接影响。重要的是,我们要理解,由于不同模型工作于不同的模态,每个模型的输出单位也不尽相同:对于Sora,单个输出是一段1分钟长的视频;对于DiT,是一张512x512像素的图像;而对于Llama 2和GPT-4,我们将单个输出定义为一份长度为1000个token的文本文档。 (比较不同模型每单位输出的推理计算量,对于Sora是1分钟视频,对于GPT-4和LLama 2是1000个token的文本,对于DiT是单张512x512像素的图像。我们可以看到,我们对Sora推理的估计比其他模型昂贵,要高出数个数量级。) 我们比较了Sora、DiT-XL、LLama 2 70B和GPT-4,并以对数刻度绘制了它们的浮点运算次数。对于Sora和DiT,我们使用上文的推理估计值。对于Llama 2和GPT-4,我们使用经验公式浮点运算次数=2×参数数量×生成的token数来估计。对于GPT-4,我们假设它是一个混合专家 (MoE)模型,每个专家有220B参数,每次前向传递激活2个专家。需要注意的是,GPT-4的这些数字未得到OpenAI的确认,因此也需要谨慎对待。 我们可以看到,基于扩散模型如DiT和Sora的推理算力需求要大得多:DiT-XL(6.75亿参数)的推理计算量,大约与LLama 2(700亿参数)相当。我们还可以看到,Sora的推理算力需求比GPT-4高出数个数量级。 需要注意的是,上述许多数字都是估计值,并且依赖于简化的假设。例如,它们并未考虑GPU的实际浮点运算利用率、内存容量和带宽限制以及诸如推测解码等高级技术。 如果类似Sora的模型占有重要市场份额时的推理计算量 在这一部分,我们根据Sora的计算需求,推测如果AI生成视频在流行视频平台如TikTok和YouTube上占有重要市场份额,将需要多少英伟达H100 GPU来运行类似Sora的模型。 我们假设每小时每个H100生成5分钟视频(详见上文),相当于每天每个H100生成120分钟视频。 TikTok:每天1700万分钟视频(3400万个视频x平均30秒长度),假设AI渗透率50%。 YouTube:每天4300万分钟视频,假设AI渗透率15%(主要是2分钟以下的短视频)。 AI每天总计生成视频:850万+650万=1070万分钟。 为支持TikTok和YouTube的创作者社区,需要89000张英伟达H100 GPU。 由于以下因素,这一数字可能偏低: 我们假设100%的浮点运算利用率,并未考虑内存和通信瓶颈。实际上50%的利用率更为现实,需要乘以2倍。 需求不会均匀分布在时间上,而是具有突发性。峰值需求尤其成问题,因为需要相应更多GPU来满足所有流量。我们认为,应考虑峰值需求再增加2倍,作为所需最大GPU数量。 创作者可能会生成多个候选视频,从中挑选最佳。我们保守地假设,平均每个上传视频要生成2个候选视频,再增加2倍。 总计在峰值时需要大约72万台英伟达H100 GPU。 这说明了我们的观点:随着生成式AI模型变得越来越受欢迎和受到依赖,推理计算将占主导地位。对于基于扩散的模型如Sora,这种趋势会更加明显。 另外需要注意,如果扩大模型规模,推理计算需求也会大幅增加。另一方面,更优化的推理技术和整个技术栈上的其他优化措施,可能会在一定程度上抵消这种影响。
AI颠覆,倒计时
文|徐小怪 编辑|张嘉琦 Sora问世后,AI的话题声浪愈发高涨。 在舆论场上,“AI复活”已故明星遭到了家属和众多网友的抵制;国际时事中,英国凯特王妃的发声视频被质疑为AI所为,欧盟的《人工智能法案》已进入立法的最后阶段;互联网领域,字节跳动的AI新部门Flow推出AI社交APP“话炉”,加码探索AI赛道。 文娱圈更是响动频频,最近两个月,《Our T2 Remake》《千秋诗颂》《猴王问世》《白狐》等不同形式和地区的AI作品接连上线,芒果TV的综艺《我们仨》推出了AI助理导演爱芒。3月21日,中央广播电视总台还正式出台了《中央广播电视总台人工智能使用规范(试行)》。 《Our T2 Remake》剧照 在昨日举办的“2024首都节目春推会”上,AI也成了影视行业从业者们热切关注和讨论的重要话题,爱奇艺CEO龚宇在活动上直言:“最长3至5年,AI可能将对行业产生颠覆性变化。” 显然,作为滚滚而来的科技潮流,AI已势不可挡。 针对各种方向的讨论,毒眸(id:DumoreDumou)认为,在争议之外,更应该多多注意AI利好的一面。尤其是以创意故事为主的影视行业,通过合理运用,AI会是一个得力可靠的辅助工具。 当下,很多人仍然对AI使用存在负面情绪,而这种观念的改变,仍然是漫长的过程,既要站在宏观视角上正视AI的正向作用,也需要更多切实落地的底层应用。但无论如何,对文娱行业而言,拥抱AI不仅代表着现在,更是开启行业未来的关键帧。 01 技术手段下的情感交易 最近与AI有关话题中,“AI复活”的讨论度最高。 名人里,音乐人包小柏“复生”女儿,还让她唱了一段生日歌;商汤科技已故创始人汤晓鸥的数字人亮相,并且来了一段“汤式演讲”;李玟、高以翔、乔任梁等已故明星亦陆续 “现身”,向粉丝“喊话”。 “数字人”汤晓鸥在年会上的演讲 普通人里,“AI复活”业务更是悄然蔓延,花费几十到几万元不等,就能“复活”亲人,甚至与之对话。 这些事件均让“AI复活”逐渐成为网络舆论焦点。然而,随着热度持续攀升,一些反对声音开始出现,特别是来自逝者家属的抵制。 乔任梁父亲、江歌妈妈就曾公开发声,不能接受“AI复活”,这是在揭伤疤;高以翔家人亦通过经纪人表达,不希望高以翔的肖像被他人任意使用,更不能容忍进行商业行为。 江歌妈妈发声(图源:微博) 这引得大批网友附议,并表示:尊重逝者是做人该有的底线,支持起诉。 尽管在家属和网友的呼吁下,这些视频均已下架,但是依然留下了很多探讨空间,既有法律层面,更有道德伦理。后者是AI概念自诞生以来,始终存在的矛盾点,逝者家属的态度无疑将矛盾的对立性摆在了舆论台面上。 中国政法大学比较法学研究院刘文杰教授向毒眸提到:“不管是公众人物还是普通人,不管是在世者还是往生者,在本人或者逝者近亲属没有授权的情况下,‘AI复活’一般都构成侵犯肖像权。并且,逝者的肖像、隐私等同样受法律保护。” 《民法典》第1019条规定:任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,不得制作、使用、公开肖像权人的肖像,但是法律另有规定的除外。未经肖像权人同意,肖像作品权利人不得以发表、复制、发行、出租、展览等方式使用或者公开肖像权人的肖像。 《民法典》第994条规定:死者的姓名、肖像、名誉、荣誉、隐私、遗体等受到侵害的,其配偶、子女、父母有权依法请求行为人承担民事责任;死者没有配偶、子女且父母已经死亡的,其他近亲属有权依法请求行为人承担民事责任。 对于994条,刘文杰教授还举了个肖像之外的例子:“香港艺人周海媚遗憾过世后,她的病历依然是隐私,未经家人允许,其他人不得随意公开。” 当然,他也提到,如果本人或者逝者近亲属同意授权,法律会给予一定许可空间,AI技术公司可以遵守公序良俗为限,使用相关个人肖像。 与此同时,基于授权方同意,AI技术公司可以将所制视频展示给他人,但应当注意避免造成不应有的损害。“比如向顾客做现场演示使用,但是应当避免发送邮件,因为后者会导致他人留存所谓AI复活的内容。” 结合刘文正教授的分享,毒眸认为,有需求就会有市场,未来若没有新的法规对其进行进一步的规定,在技术相对成熟的前提下,AI“复活”产业链还是会存在。 本质上来说,“AI复活”生意就是买一种情感慰藉,寄予普通人想要的念想。这是一种个人的主观选择,不存在对错,也和他人无关。就像《流浪地球2》里,刘德华饰演图恒宇为女儿创造数字生命一样。只是待到黄粱一梦清醒的那天,也需要具备承受负面情绪的能力。 《流浪地球2》剧照 另外,从“AI复活”引发的风波来看,公序良俗亦是一切科技应用的前提。 为了防止AI技术影响生命及财产安全,有关部门在近两年颁布了 《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》等条例,持续开展“清朗”系列专项行动,整顿网络乱象,进一步规范网络技术应用,包括AI生成信息标注以及虚构摆拍内容标注、要求深度合成服务提供者要落实信息安全主体责任等具体措施。 02 是新技术,也是行业辅助工具 比起复活逝者,AI其实有更多事情可以做,比如辅助甚至推动国内文娱产业发展。在这方面,网络视频平台一直是自研技术升级与应用的中流砥柱。 早在十年前,相关公司就已展开行动。彼时,AI应用多为视频修复。2013年,腾讯的云与智慧产业事业群(CSIG)成立了云多媒体实验室,以全自动的数字化技术为影视作品提供修复服务,拉开了各家平台“AI战”的序幕。后来,相关技术升级为「超清沉浸感修复引擎」;爱奇艺和优酷则紧跟其上,分别在2017年推出了自研「ZoomAI视频增强技术」和AI细节再生服务,实现旧视频高精度修复和动画片增强等功能。 超清沉浸感修复引擎修复视频对比(图源:网络) 自此,包括咪咕、B站等平台也纷纷涉足AI领域,共同推动互联网技术快速前进,并且将应用范围从终端呈现拓展至上游生产。 以爱奇艺为例,龚宇曾经多次公开提到AI对于公司和行业的作用和意义。他在爱奇艺2023年财报会上表示,在常规内容业务之外,爱奇艺也在寻找可孵化第二增长曲线的新业务。“大概方向包括海外业务,跟IP增值服务有关的线上或者线下业务,还有生成式人工智能带来的可能的技术创新。” 如其所言,2023年,爱奇艺在内容运营全流程环节启用AI辅助。在策划和开发期,平台引入的AI辅助剧本评估,对场景和人物拆解的准确率已经超过90%。AI既可以三分钟生成一版内部网剧评审意见,也可以辅助将多集剧本浓缩成万字大纲,能够有效提升在剧本评估、预算规划和资源管理等方面的效率。 宣发前端,公开资料显示,目前爱奇艺95%的宣传海报为AI所制,甚至AI还能辅助生成动漫角色示意图和分镜等视觉图片。以及,AI对于视频内容的理解能力已经可以提炼出详细的剧情介绍,同步覆盖数千部剧集。 宣发后端,基于AI搭建的「星罗剧情理解平台」,用户可运用AI搜索,一键直达剧情名场面。区别于传统的片名搜索,现在的AI搜索能以内容为引擎,更好地服务用户。 再以优酷为例,不同于爱奇艺在近两年打通全流程,优酷在2019年就有了专门的“一站式”技术支持系统——阿里文娱的摩酷实验室。其研发的泛内容AI平台「北斗星智库」致力于实现对于泛内容的全维解构分析,并在全链路周期中提供辅助参考。 北斗星发布现场,官方用Demo 展示了AI对于剧集《长安十二时辰》中演员镜头与用户观看热度的分析,以及「智能对话式视频搜索」。后者可以通过多种技术,自动生成用户喜爱的交互内容,并朗读给用户。比如用户说“我想看易烊千玺跳POPPING”,平台会生成相关内容并“告诉”用户。 依托于以上技术,优酷在后期加码发力。当年11月,优酷上线了“即拍即知”的「AI综艺现场解决方案」,为合作方提供现场观众的反馈数据,助力综艺剪辑和营销优化;2023年,优酷剧集《异人之下》启用AI演员“数字人厘里”、推出了AI 对话类影视搜索引擎「AI 搜片」。利用「AI搜片」,用户不仅可以通过模糊、口语化的提问获取精准匹配的影视信息,还能和 AI 交流影视信息和知识。 《异人之下》数字人厘里(图源:微博) 而在制作环节中引入AI技术,能够实现效率的提升。优酷本年度剧集《大唐狄公案》即使用了AI技术辅助生成特效画面,通过AI算法实景扫描、模型重建AI修复和场景生成,打造出一套「数字孪生三维场景重建方案」。目前这套方案已应用于新剧《清明上河图密码》的拍摄中,据网络资料显示,剧集的制作成本降低了80%,效率提升了40%。 《大唐狄公案》(图源:微博) 其他视频平台也在积极作为,腾讯视频有腾讯游戏支援,AI技术自成一派且应用多元。比如,平台上线了AI辅助制作的动画短片《魔游纪人工智能辅助篇》、综艺《令人心动的offer5》启用AI进行课题分组、将AI引入制片管理系统等。 此外,芒果TV发布「AIGC HUB」平台,邀请用户用AI自建内容;B站上线「AI视频总结」功能,优化推荐机制与浏览体验;咪咕与抖音各自开放了AI创造平台。种种信号都表明,各平台已经开始着力探索AI技术与实际工作的结合。 电视台、专业院校、影视公司等机构也都在着力探索AI。中央广播电视总台基于 “5G+4K/8K+AI”的战略布局,先是推出了「AI智能对话」系列微视频,李白、鲁迅、钱钟书、诸葛亮等AI形象现身其中,与网友“对话”;最近,则有AI系列动画片《千秋诗颂》播出,并且同步登陆了海外10余家主流媒体。 AI智能对话 《千秋诗颂》是典型的文生视频AI案例,由中央广播电视总台和上海AI实验室等机构联合打造,运用“风格参考图片+提示词”的指令,结合「视频生成大模型书生·筑梦」、「文生视频框架AnimateDiff」及多项可控图像生成、图像驱动等技术,生成了人物、场景、动效等众多元素。 《千秋诗颂》(图源:微博) 浙江卫视、北京卫视、东方卫视等地方电视台也没有落后,大多与腾讯游戏等技术公司合作,推出AI主播、AI数字代言人、AI辅生节目等内容。 浙江卫视AI推广人(图源:微博) 专业机构和影视公司方面,中国电影科学研究院曾在2016年探索AI,并研发出一款「影视剧本创作系统」,上影集团、光线传媒、万达电影、华策影视等公司均有尝试,大体为辅助内容生成和促进制片工业化。 除了影视产业,AI同样已渗透进文娱其他领域,网易云音乐的AI推荐和AI歌手、阅文集团的网文AI大模型「阅文妙笔」、灯塔的AI预测票房皆可说明。 拥抱AI,拥抱时代变化。显而易见,未来AI将更深更广地影响文娱产业发展。 03 学会使用辅助工具 技术的发展势不可挡,从公司层面上,对AI技术的开发显然已经势在必行,但作为从业者,应当对其报以怎样的态度? “2024首都节目春推会”上,龚宇提到,“大家也不必过度恐慌,在我们的有生之年,只要正确认识并能使用生成式AI,就不会被行业淘汰。但是不认识、不理解、不去学习生成式AI,可能会被淘汰。” 龚宇的话很直白,代表了部分行业高层的观点。灵河文化白一骢曾说过,未来的5至10年里,要做好与AI对话的训练工作。春推会关联活动上,爱奇艺高级副总裁戴莹亦直言,现在的AI可以取代部分基础工种。 这样看,如何学习向AI“下指令”,是文娱从业者接下来的工作重点之一。不管是主观想法还是客观受限,想要继续生存,都要走这条路。 这个过渡过程里,从业者不妨“物尽其用”,学习其应用原理的同时,用它反向练习基本功。 最直观的,编剧、导演等创作者可以用AI技术,进一步练习影像化表达的逻辑和方法。先试着输入一场戏的文本,然后看AI生成的图片或者视频是否满意,以及一些细节是否需要调整。 例如写一个女孩托腮沉思,手上的动作可以在图像生成后,继续优化,换个幅度或者戴一个戒指,以突显人物属性。类似的文字画面在以往基本靠编剧脑内想象,现在有了AI,可以更给予编剧参考,包括编剧、导演等创作者沟通时,也能通过AI影像更快速地让彼此知晓对方的想法,并且宣发团队也能提前预设海报等物料。 根据戴莹在“春推会”的发言,这种方式已被应用到了实际项目执行中,效果明晰可见。可见,AI可节省的不只有制作成本,还有沟通成本。 非职业创作者也能通过AI展示自己的才华。在资金、时间等制作成本大幅压缩后,此类人群可以尽情发挥创意,“一键”生成脑内故事。就像B站UP主“AI疯人院”自制的AI短片《《西游记 • 第一话 • 猴王问世》火遍全网,目前仅B站播放量就已超百万。 图源:B站 不难预测,未来会有愈来愈多的平台开启“AI创投”计划,就像最早的征稿、现在的短视频创作大赛一样。 简而言之,运用AI,每个人都能让自己的创意落地,同时进一步以其为工具,优化创意或者激发更多创意。毕竟,当制作趋向于零成本,创意会显得弥足珍贵。 当地时间3月6日,“全球首部完全由AI生成的长篇电影” 《Our T2 Remake》(译名:《我们的终结者2重制版》)在洛杉矶线下首映,影片为50位AI艺术创作者用Midjourney、Runway、Pika、Kaiber、Eleven Labs、ComfyUi、Adobe等多个AI软件合制完成,是《终结者》非盈利同人向作品。 《Our T2 Remake》(图源:微博) 这部作品甫一亮相,立即引发了全球关注。从成片来看,生成的让人物、场景、打斗场面确实足够以假乱真,部分画面依然存在表情肢体生硬和行为逻辑混乱等问题。 尽管有瑕疵,但是仍要承认,AI生成视频的品质正在大幅提升。对比2021年,Netflix推出的AI悬疑喜剧动画《谜题先生希望你少活一点》,《Our T2 Remake》无论在故事还是视听维度,均有明显进步。 这亦说明了创意要被重视,从创意主体看,《Our T2 Remake》是人为创作,《谜题先生希望你少活一点》则是AI创作;而从创意灵感看,《Our T2 Remake》为AI所制,但是《终结者》IP本身大红,和AI无关。没有此前IP系列的人工画面,《Our T2 Remake》无法诞生。 由此,现阶段及未来相当长的一段时间里,AI智能是服务型工具,AI作品的品质如何,还得由人决定。 可以预见的是,随着相关诉求和科技环境的变化,市场上会出现越来越多的AI应用和相关公司,今后,卷的既是技术,也是创意。
AI难逃“能源危机”?GPT-6或被电力卡脖子
微软一位GPT-6训练集群项目工程师称,如果在一个州部署超10万片H100 GPU,电网就会崩溃。比尔•盖茨表示,电力是决定数据中心能否盈利的关键。未来几年,AI发展或将受制于芯片设计与电力供应。由于电力供应延迟,美国部分数据中心建设时间已延长了2到6年。 作者 | 郑远方 GPT-5尚未面世,OpenAI似乎已开始着手训练GPT-6,不过电力或许已成为了一个“卡脖子”难题。 AI初创公司OpenPipe联合创始人、CEO Kyle Corbitt透露,自己最近与一位负责GPT-6训练集群项目的微软工程师谈过,后者抱怨称,在跨区域GPU之间部署infiniband级别链接,实在是一件痛苦的事。 Corbitt问到为何不将训练集群集中在同一区域,这位微软工程师回答,“哦我们已经尝试过那么做了,但是如果在一个州放置超过10万片H100 GPU,电网就会崩溃。” 10万片H100是什么概念?作为参考,市场调查机构Factorial Funds的一份报告显示,OpenAI的文生视频模型Sora在峰值期间需要72万片H100——按上述工程师的说法,这个数量足以让七个州的电网崩溃。 数据中心能否盈利、建设时间如何?看电力“眼色” 就在刚刚谢幕的标普全球2024年剑桥能源周(CERAWEEK)上,来自全球的能源行业高管们,谈起了AI技术对行业的推进,也谈及了AI对能源巨大的需求。 “到2030年,AI消耗的电力将超过家庭用电量。”美国最大天然气生产商EQT首席执行官Toby Rice在演讲中援引了这样一项预测。 亚马逊网络服务工程副总裁Bill Vass指出,世界每三天就会增加一个新的数据中心。 比尔•盖茨则表示,电力是决定数据中心能否盈利的关键,AI所消耗的电量是惊人的。AI的使用将推升能源需求,未来几年,AI的发展可能会受制于芯片设计与电力供应。 这不是杞人忧天——由于新数据中心的建设速度高于新建发电厂,供需差距已经开始出现。美国商业不动产服务公司世邦魏理仕(CBRE Group, Inc.)透露,由于电力供应延迟,数据中心的建设时间已经延长了2到6年。 “能源巨兽” AI“能源巨兽”的称号并非浪得虚名。 OpenAI的Sam Altman就曾为AI的能源、特别是电力需求“叫苦”。在年初的达沃斯论坛上他表示,AI的发展需要能源方面的突破,AI将带来远超预期的电力需求。 有数据显示,ChatGPT每天需要消耗超过50万千瓦时的电力,用于处理约2亿个用户请求,相当于美国家庭日用电量的1.7万多倍;至于搜索巨头谷歌,若其在每次用户搜索中都调用AIGC,年耗电量将增至290亿千瓦时左右,这甚至高于诸如肯尼亚、危地马拉等国一年的用电量。 回望AI还未掀起如此大范围热潮的2022年,彼时中国与美国的数据中心分别占各自社会总用电量的3%与4%。 随着全球算力规模逐步增长,华泰证券3月24日研报预测,到2030年,中国与美国的数据中心总用电量将分别达到0.95/0.65万亿度与1.7/1.2万亿度电,是2022年的3.5倍与6倍以上。乐观情景下,2030年中/美AI用电体量将达到2022年全社会用电量的20%/31%。 分析师进一步指出,由于数据中心分布并不均匀,因此区域性的缺电风险将最先出现(如美国的弗吉尼亚州)。考虑美国电力历史上几乎无增长,因此AI将成为海外发达区域电力重回正增长的重要驱动要素。 电力增量何处来? 缺电自然需要“新电”,但“新电”从何而来?在全球碳中和的浪潮下,光伏、风电为代表的的清洁能源似乎是第一选择,但这只是“理想状态下的选择”。 “我们不可能在几年内新建100千兆瓦的可再生能源(发电厂)。有点难办。”前美国能源部部长Ernest Moniz坦承。 EQT首席执行官Toby Rice补充称,科技公司需要足够可靠的电力,风能和太阳能等可再生能源并不能做到这一点,至于大型核设施(美国目前只有一座在建)历来建造成本高昂,耗时长。“科技公司不会为这些基础设施等上7-10年,那就只能用天然气了。” 这位来自美国天然气巨头的高管表示,已经有建设数据中心的科技公司询问从EQT购买天然气事宜,Rice被问及“你们的输送速度有多快?”“我们能获得多少天然气?” 美股“不再隐秘的角落” 先是“GPU荒”,然后是“电荒”,AI的发展之路实在难言一帆风顺。 值得注意的是,想抓住AI浪潮的美股投资者们,已将目光投向了这个角落。 美国最大的电力生产商和零售能源供应商之一Vistra Energy、美国最大的能源公司Constellation Energy、美国最大的绿色电力公司NRG Energy近一年来股价全部翻倍不止,且都在本周创下了股价历史新高。 从近一年及今年年内区间涨跌幅来看,虽然这三家公司表现不如“地表最强股票”英伟达,但也甩开了OpenAI“背后的公司”微软。
清明节前AI“复活”亲人成热门生意:价格从几十到数万元,你会尝试吗
快科技3月27日消息,清明节将近,又到思亲最浓时,AI“复活”已故亲人成了最近热门生意。 据媒体报道,目前“AI复活亲人”已经形成相关产业链,有代理发布相关视频吸引目标客户,有制作团队专门收费制作相关视频。 有从业者说,AI“复活”已故的亲人,一个月甚至能接到70多单,这个市场的需求难以想象。 目前,在电商平台已有多个商家推出了AI“复活”亲人的服务,有商家介绍称,“复活”只需一张照片+一段录音,此类服务价格从几十元到上百元不等。 商家产品介绍页显示,“不管是声音还是外貌,相似度95%以上,价格在2-8万不等”。 据了解,所谓“AI复活”,是指利用人工智能技术将逝去亲人的文字描述、图片、视频和声音资料输入AI算法模型,从而模拟生成一个数字人形象,拥有逝者的性格、记忆、图像、视频和声音。 对于这项技术,业内人称之为“数字陪伴”或“AI数字永生”。 据央视新闻报道,中国科学院自动化研究所人工智能伦理与治理中心主任曾毅表示,拥有了“数字逝者”的时候,会不会使得人长期沉迷于与“数字逝者”之间的交互,从而对心理产生非常负面的影响。 这个是“数字逝者”的这项人工智能的应用技术可能给社会带来的长期的、潜在的隐患,也是我们是否应当开发这样的人工智能技术必须去思考的伦理道德的问题。 专家介绍,数字复活是生成式AI技术落地应用的一个细分领域,在新技术被广泛应用的同时,也要充分保障及尊重个体情感和人格尊严。 你能接受或愿意尝试用AI“复活”已故的亲人吗?
核心团队“跑路”,Stability AI这家AI独角兽要凉
鲜花着锦、烈火烹油,可以说是如今AI投资领域最贴切的形容词。在当下这个优质标的稀缺的时代,AI就成为了近年来投资者挥舞钞票想要涌入的赛道。可即便如此,依然有AI初创企业走向了风雨飘摇,而且这家公司还是典型的AI独角兽。日前有消息称,大名鼎鼎的AI绘画神器Stable Diffusion的核心研究团队已集体辞职。 在《福克斯》的相关报道中,Stable Diffusion的开发商AI初创公司Stability AI,失去了Robin Rombach、Andreas Blattmann、Dominik Lorenz等多位核心开发者。有知情人士透露,他们的离职消息是由Stability AI首席执行官Emad Mostaque在内部全体会议上亲自宣布。在这一批开发者中,Robin Rombach的离去对于Stability AI可谓是伤筋动骨,毕竟他是Stable Diffusion的两位主要开发者之一。 如果说AI初创明星Inflection AI的核心团队出走属于“良禽择木而栖”,看中的是背靠微软这颗大树好乘凉,那么Stability AI核心团队的离开,则颇有种“大难临头各自飞”的既视感。 在许多业内人士看来,Robin Rombach等人的离开与Stability AI目前的财务困境脱不开关系。其实关于Stability AI缺钱的消息早在去年夏季就已出现,彼时有数十位前Stability AI员工站出来声讨Emad Mostaque拖欠他们大量工资,甚至不交工资税,并夸大公司收入。 而最直接体现Stability AI目前困境的,则是有前员工透露,该公司还曾因拖欠高达数百万美元的账单,导致合作伙伴亚马逊威胁撤销对其计算资源服务器的访问权限。事实上,Stability AI在去年夏季获得1亿美元的融资后,唯一一笔5000万美元的新融资还是通过可转换债券所获得。 那么问题就来了,为什么Stability AI这个一度估值达到10亿美元的AI独角兽,如今会陷入这般境地呢?Stability AI本身的创立,以及它的商业模式,可能是这一切的罪魁祸首。 与其他AI初创企业不同,Stability AI的成功属于机缘巧合或者说巧取豪夺。这家公司的核心产品Stable Diffusion其实并不是创始人Emad Mostaque开发,而是最初来自德国慕尼黑大学、也就是Robin Rombach攻读博士的学校,以及另一家做AI视频的创业公司Runway,共同开发的Latent Diffusion开源图像生成器。 Stability AI只是为Latent Diffusion项目提供了计算资源、并取得了冠名权,进而在2022年说服部分Stable Diffusion的论文作者加入,这就是Stable Diffusion的由来。如果说用不太光彩的手段拿走了Stable Diffusion的成果,还只是Stability A的“原罪”,那么真正让这家公司陷入困境的,则是其缺乏一个清晰、且可持续的商业模式。 不同于Midjourney,Stable diffusion是免费开源的,其源代码可以在Github进行下载、并部署到本地使用。这一差异就导致了闭源的Midjourney需要用户购买30美元/月的订阅服务才能使用,而Stable diffusion就只需要一台高性能电脑就行。 没错,别看Stable Diffusion的日活用户在2022年10月就已经达到了1000万,但如此海量的用户群体根本就没有为Stability AI贡献收入,毕竟用户升级电脑硬件的费用又不是交给Stability AI。 直到去年12月,在OpenAI凭借ChatGPT Plus每月赚了数千万美元的时候,Stability AI才上线了新的会员模式。Stability AI的会员计划采用了灵活计费模式,对独立开发者的价格为每月100美元,但仅在其收入超过一定数额时才需要缴纳,类似于游戏引擎的付费模式。 可遗憾的是,Stability AI做付费订阅的时机太晚,而整整浪费了一年时间的代价,是Midjourney、Adobe Firefly已经占据了大量付费用户的心智。 而在面临核心团队出走之后,Stability AI的日子极有可能会更加难过。在没有成熟商业模式的同时,Stability AI更缺乏能力去向投资者证明,它的技术足以继续开发顶尖的AI大模型。
这个猛砸广告的免费工具,为啥我觉得还挺好用
大伙最近有没有听过一个叫 Kimi 的 AI 工具。 世超上次听到这个词,还是《 爸爸去哪儿 》。 没想到十年后,它成了一个国产大模型的名字,还在我的首页刷了屏。。。 像 B 站网页端,我滑下来 10 个广告有 9 个都是它,而且这个情况持续很多天了。 不是,你们就逮着我猛干是吧。 因为 Kimi 用着不赖,加上免费,最近还挺火的,甚至服务器都已经跟不上用了。 其实世超用它已经有段时间了,一开始看它名字挺可爱,后来又发现公司居然叫月之暗面。。。 说实话,我对 Kimi 第一印象是——中二。 不过现在能写一篇文章介绍它,自然是觉得 Kimi 用起来还行,打破了我的偏见。 Kimi 类似于百度文心一言,你输入问题,它联网回答。 但它的主打卖点是:整理资料。 阅读并理解完一篇文章,往往非常消耗时间,这种情况下你就可以找 Kimi 。 比如世超往它脸上甩了一篇 2500 字的文章链接,让它总结。 虽然回答的第一句就错了,标题它整成了 “ 微信公众平台 ”,但其它我可以保证完全正确,毕竟文章作者是我。 就是总结过细致了,可以再粗略点。 不光是网页,假如你遇到一个非常长的 PDF ,也可以扔给它。 之前世超写一个大佬,要查看一个含有上百个问题的英文 PDF,可把我累坏了。 但现在我只要把 PDF 扔给 Kimi,文章里需要什么样的素材,直接问它就行了。 “ 大佬有多少存款?大佬的英语是怎么学习的?” Kimi 马上能从 PDF 里找到答案,目前来看它正确率还挺高的,连续问了几个回答都没啥问题。 也许你看到这里,会觉得 “ 整理资料 ” 不是每个大模型都有么? 的确。 Kimi 能火的最主要原因, 是它能整理超长的资料,也就是长文本阅读能力。它是国内第一批做长文本阅读的 AI 工具,阅读上限在当时比文心一言等国内主流大模型都要高。 世超截取了 15 万字的《 三体 》,打包成 txt 文件发给它。接着问:人类第一次读到来自宇宙中另一个世界的信息,信息内容是啥。 它的回答正确。 我再问他,在这本书里的三体文明到底是啥,它也回答正确。 虽然这两问题它都回答得出来,但我不能确定,Kimi 是不是上网搜的答案。 于是世超做了一个插针测试。 在 4500 多行左右,悄咪咪加了一句:小黑胖在 2023 年 12 月 25 日,偷吃了公司金毛犬火锅的狗粮,然后拉肚子。 然后替换掉一些关键词来问他:是谁吃了某个小狗的食物,后来发生了什么? 它的回答完全正确! 也就说它在刚刚的半分钟内,阅读并理解了十五万字,然后回答了我的问题。 这还不够。 我又往《 三体 》里塞了一篇 2500 字的公众号文章。 然后问他,差评君最后在感叹什么,他想要一个什么样的平台。 作为文章作者我认为,它的回答可以给 95 分。5 分扣在最后一句,因为我觉得我没有明确表达这个意思。 但同事认为 Kimi 完全正确,他觉得就是这个意思。 好好好,原来问题在我是吧。 目前 Kimi 的阅读上限是 20 万字,如果你申请到了内测资格,这个数字会变成 200 万。 相当于把《 红楼梦 》和《 西游记 》糅合在一起发给它,然后提问,它也能回答出来。 除了长文本理解,世超平时还用它来查查资料。 之前写霸哥开挂的事情,这种又臭又长的瓜,你除非一直趴在前线吃,不然很难了解整个事件线。 所以我干脆问了 Kimi 。 当然,这些答案肯定不能轻易相信。拜托,它可是 AI 诶,幻觉是常有的事情。 之前它在阅读 PDF 环节就出现错误,二次确认后才反馈正确答案。 所以还是说: 看似 AI 工具能帮我们提高很多效率,但不可避免它的答案会出现错误,建议大家还得花点时间复查一下。 另外, Kimi 还有一个比较大的短板——不能总结视频内容。 假如你发它一个视频链接,它只能给你分析整个网页上的文字在说啥,而不能总结视频里讲了啥。 我也不清楚 Kimi 支不支持总结图片( 文字识别是可以的 )。 我发给它一瓶老干妈,问瓶子和瓶盖是什么颜色的。Kimi 回答有时正确,有时却像是还没长眼睛。 所以,如果你只是有一大串文本资料需要总结和理解的,世超认为你可以试试 Kimi ,反正现在不要钱。 网址:https://kimi.moonshot.cn/chat 手机端也有 App 可以用,叫 Kimi 智能助手。 最后,除了 Kimi,现在很多家大模型都号称自己支持长文本阅读,甚至阅读上限还不输 Kimi 。 比如阿里通义千问 1000 万字, 360 AI 浏览器 100 万字,文心一言也准备要提高到 200 万~ 500 万字。 但他们的能力到底如何,不是世超一次两次就能测出来的。各位如果有兴趣,可以自己多试试,找出最合适自己的工具。 撰文:刺猬 编辑:莽山烙铁头 江江 封面:萱萱
那个想要改变华为们的通信组织,至今还没搞出啥名堂…
不是我说,这 5G 都还没改变我的生活呢,就有人抱团准备为了 6G 干架? 事情是这样的,虽然现在 6G 还八字没一撇,但前阵子的新闻却让人闻到了一股火药味。。。 先是,美国、英国等 10 国拉群发表联合声明,支持所谓的 6G 原则——“ 开放、自由、全球、可互操作、可靠、有弹性和安全的连接 ” ,但是没带中国玩。 然后是,英伟达、微软、诺基亚等欧美科技巨头宣布组建 AI-RAN 联盟,打算一起推动 AI 在未来的 6G 网络中的应用,让成员们都能吃上一口 “ 蛋糕 ” ,这里面也没有中国企业。 好家伙,6G 现在还没影儿,但是团已经都抱起来了。 实际上,就如网友说的,老外在通信网络这块抱团也不是一天两天了,除了前面讲到的 “10 国 6G 原则 ” 、 AI-RAN ,还搞过 O-RAN 、 xRAN 等各种团体,但搞了好几年,也不见搞出什么大名堂来。 说起这些,差评君我就想起来这几年通信领域特别火的 Open RAN,也是因为囊括了各大运营商和通信巨头思科、爱立信、诺基亚等等,但是没带华为玩,弄出来不少大新闻。 “ 额。。。那这么一堆什么 RAN 什么 RAN 的,又是啥玩意儿啊? ” 我知道大家头上肯定冒出了很多问号,但别急,要想把当年 Open RAN 的瓜吃明白,就得让我们先从什么是 RAN 讲起。 RAN ,其实就是 Radio Access Network 的英文缩写,也就是无线电接入网,其中的重要组成部分就是我们常说的基站。 所以大家可以简单粗暴地把 RAN 跟基站画等号。 在 5G 时代之前,造基站的技术被通信设备厂商牢牢握在手里。 运营商的作用就如字面意思一样,只是负责运营网络。 由于移动通信设备行业是一个重投入、拼积累的行业,所以直到现在也只有那么几位主要玩家——全球市场基本被华为、中兴、爱立信和诺基亚这四大巨头分完了。 这些玩家出于对行业地位、技术壁垒、利润以及产品稳定性等多方面的考虑,就把基站做成了 “ 黑盒 ” 模式。 虽然我们能大概知道这个 “ 黑盒子 ” 里面有天线、射频、基带等组件,还通过专用的软件来运转,但内部具体的模块划分、组件接口以及软件是什么样的,都是外部没办法看到的。 基站是怎么工作的、出了故障该怎么修等等,也只有设备商知道。 这里大家也看出来了,在那几家通信设备巨头面前,运营商其实并没有多大的话语权。 为了打破这种局面,运营商们开始抱团寻求改变。 尤其是在 5G 到来的前夕,运营商们刚完成了 4G 网络的建设,一口气还没喘过来呢,就要面临 5G 网络的建设压力。 “ 这谁顶得住啊。。。 ” 而且相比 4G , 5G 网络的建设要更费钱,因为 5G 虽然速度快、带宽高,但穿透性远不如 4G 网络。 根据行业人士的说法,以往 1 个 4G 基站就能覆盖的区域,现在需要 4 到 5 个 5G 基站来完成网络覆盖。 要知道,原本最近几年运营商们的通讯业务就不好做,又找不到新的增长点,那么势必要寻求降低成本的办法。 对于运营商来说,这种想法在 5G 到来之前变得无比强烈,最终促使他们在 2018 年抱团组建了 O-RAN 联盟( 主角终于出现了 ),这里面像中国移动中国电信啊、AT&T啊、沃达丰啊都有,基本上大运营商都参与进来了,设备商也有一些。 不过主要还是运营商们参与的积极性更大一些。 因为 O-RAN 主张的是跟传统基站 “ 黑盒 ” 模式完全相反的 “ 白盒 ” 开放式标准,也就是 Open RAN ( 开放式无线电接入网 / 开放式基站 )。 他们把传统基站的封闭模式完全开放了,内部原理完全公开,再通过制定标准化的接口和协议,使得所有厂商都可以按照这个组织的标准化技术文档来造设备。 换句话说,运营商们想让基站变成 “ 开放式组装电脑 ” ,里头的配件可以选择不同供应商的产品。 比如,芯片选英特尔,射频单元选伟创力,处理单元选戴尔,系统集成方案选思科,等等。 而让不同厂商的设备相互连接的规范和标准,就是 O-RAN 需要拉着各家一起商量的事情, 绿色实线为 O-RAN 制定的接口标准 ▼ 在运营商们看来,把接口开放,推动软件开源,引入更多中小企业参与到设备制造当中,有利于打破通信设备大厂的垄断,降低成本。 现实确实也是,全世界这么大的通信市场,到最后就那么4、5家巨头玩,垄断利润十分离谱,运营商们恨不得赶紧再养点鱼搅乱一下市场。 但是大家一个个都是黑盒,新的供应商很难切进来,所以运营商们才想到了组建 Open RAN 联盟这么个方法。 emmm ,咋说呢。。。运营商们的这个设想看起来挺美好,但落实起来却困难重重。 技术不成熟是一个方面,另一个方面则是因为 O-RAN 成员们存在各种骚操作。 咱们从技术的因素讲起。 O-RAN 出台的技术标准里面的一大核心就是,用 X86 CPU 这样的通用芯片,来代替之前传统基站所采用的 ASIC 专用芯片。 但稍微懂点硬件知识的差友应该都知道,通用芯片虽然啥活儿都能干,但是不专精,一旦涉及某一项特定任务,那能效就是不如专用芯片。 举个例子:比特币挖矿刚兴起的时候,大家都用显卡挖矿,但只过了一年左右显卡就失宠了,因为专门的比特币专用计算卡售价只要几百块,但是挖矿效率是显卡的上百倍。 虽然专用芯片只能干一两件特定的活,但由于它的大部分算法被写死在了芯片里面,做到了真正的软硬件一体化,所以它在自己的专业领域内干活时的效率特别高,功耗要比 X86 芯片低非常多。 毕竟术业有专攻嘛 ~ 之前有人测过:4G 基站使用搭载英特尔 X86 CPU 的 “ 白盒 ” 设备的功耗会高出 10 倍。 如果是 5G 基站的话,这个差距可能会到 20 倍以上,因为 5G 基站的天线更多,功率要求更高。 这就有点让人难受了。 还有令人更难受的:RAN 解耦之后,接口增加,软件和组件数量也增加,混合了不同供应商的软件和硬件之后,调试势必会更加复杂,一致性和可靠性也会下降。 虽然 O-RAN 后来也出台了一致性测试标准,但对于此前没有相关经验的运营商和设备供应商来说,想要保证万无一失,要么花钱找更专业的第三方测试机构,要么自己组建一支能够把 O-RAN 各方面知识和技能都吃透的团队。 提供 O-RAN 解决方案的厂商 ▼ 不过。。。无论哪种方式,运营商们都会把从其他地方省下来的成本,又以另外一种形式花出去。 从运维的角度来看, Open RAN 由于软硬件提供商更多,所以追责和维护将会变得更加困难,可能没办法第一时间找出故障产品。 而且还有安全风险,在这么多供应商的参与下,如何保护通信网络下的用户隐私,对运营商来说是个巨大的挑战。 说完了技术问题,咱们再来聊聊“人”的因素。 首先, O-RAN 的成员们都有着各自的心思。 咱们就拿加了群的那三个通信设备巨头来说: 中兴加了组织,不干活只摸鱼,态度比较消极。 爱立信支持 O-RAN 所追求的智能化和自动化,但对于搞开放这件事不太上心。 诺基亚是里面最积极的,既参与联盟的技术开发,又跟运营商合作推动产品落地。 诺基亚与沃丰达在意大利搞的 Open RAN 试点 ▼ 当然,这不是因为诺基亚想加速革自己的命,而是他们有另外的打算。 之前诺基亚在国内的 5G 集采中失利,份额垫底,导致他们只能够依赖欧美日韩市场来创收,而 Open RAN 技术是这些市场所力推的,所以诺基亚才会想抢在其他通信巨头彻底 all in Open RAN 之前,自己先把坑位占好。 诺基亚的中标份额甚至还不到 2% ▼ 其次,虽然运营商们积极拥抱 O-RAN ,但在过去的 5G 建设中却极少用到 Open RAN 设备,为什么呢? 还是前面讲到的那个问题, Open RAN 技术的不成熟,导致它会拖慢 5G 网络的建设。 像美国运营商 T&Mobile 在 5G 网络建设初期,为了抢在 AT&T 和 Verizon 这两家之前完成设备升级部署,还是选择使用传统的 5G 设备。 另外, O-RAN 虽然追求开放,但因为这个联盟本身的约束力不够,还是难以避免出现各家搞封闭的操作。 比如,之前 Open RAN 技术公司 Altiostar 与诺基亚和 NEC ( 日本电气 )的合作就没有遵守 O-RAN 的接口标准,而是分别采用了基于 CPRI 和 eCPRI 的私有接口。 还有,由于混合和匹配不同供应商产品的成本过高,导致有些运营商在采购 Open RAN 设备时,还是会尽量选择单一供应商或者双供应商。 像德国运营商 1&1 就选择了 Rakuten Symphony 这一家作为软件和系统集成提供商。 日本乐天旗下的 Open RAN 技术公司 ▼ “ 如果只有一家系统集成商,那么风险就是你选择了这家集成商,利用他们拥有所有的专业知识,你正在采用 Open RAN 技术,但却要依赖于他们。 ” ——沃丰达网络架构总监 Yago Tenorio 本质上,如果只选择单一供应商的 Open RAN 产品,其实跟过去的选择华为还是选择爱立信并没有两样。 诶。。。那依我看,这 Open RAN 可能到最后只是 Open 了个寂寞。 作为白嫖了开源社区很多项目的老网虫,差评君秉承着互联网的精神,很愿意给追求开放、开源的 O-RAN 投一票。 但从实际出发,我还是跟前面的观点一样,目前不太看好。 原因无他,因为按照以往的技术发展趋势来看,一定是先进的技术替代落后的技术,低成本的技术替代高成本的技术,简单的技术替代复杂的技术。 但 Open RAN 跟传统 RAN 相比,它既不先进,也不便宜,更不简单,甚至连开放这个优点也快被供应商们玩坏了。 “ 想要以这种状态推翻现有的行业格局,我只能说任重道远。 ” 不过话说回来, Open RAN 并不是完全没有未来。 有人说,如果 O-RAN 成员们真有心要搞 Open RAN ,那么大可将相关的技术标准带入到 3GPP ( 标准化组织 )中,与全球的企业和专家学者坐在一起,探讨出一个更加规范、更加开放、更加完善的全球技术标准,那还是有希望滴。 只不过,差评君觉得,现在不 Open 的 RAN 既得利益者这么多,新来者又很难一下子跨越巨大的技术壁垒和专利壁垒完成替代,怎么看 Open RAN 的愿景都难以实现。 除非。。。除非? “华为也进来?” 撰文:粿条 编辑:米罗 & 结界 & 大饼 封面:焕妍
公考行业如何探索AI?
作者|徐晶晶 AIGC给教育带来的影响无须赘言。人们的共识是AI将会带来颠覆性创新的大机会,但AI到底会在什么时候以哪种方式较好地落地,尚不明晰。 具体到职业教育这样的细分领域,面对当下的AIGC浪潮,该何去何从? “AIGC对教育产品的改变,首先是用AI结合现有业务、迭代产品中的各个环节,用AI来提升效率。”知乎旗下掌上园丁创始人蔡金龙判断。 蔡金龙是职业教育的资深创业者。他早期是一名公考名师,一路做到华图高管。随后在2015年成立掌上园丁开始创业,先后孵化了“一起考教师”和“一起公考”两个品牌,并将“一起考教师”做成了教资教招领域Top级的App。 2022年下半年,职业教育的新入局者知乎并购掌上园丁。在知乎中台的研发支持下,掌上园丁得以深入探索AI,孵化了一款AI产品——一起公考AI课。 近日,蔡金龙向多知分享了他对AIGC与业务结合的思考。 01 AI对公考的赋能远超当年题库+直播的出现 “当下的公考行业正处在一个变革期。” 蔡金龙判断,2024年,公考行业正在迎来生产力和生产关系的两大变革。 在生产关系方面,公考头部机构近年来因“退费风波”向行业“释放”了数千名老师,这些老师多为成熟的公考老师,再加上抖音、B站等平台兴起,面向公域流量直播售课,对个体名师工作室来说不再是难事,这将引发公考行业生产关系的改变。 蔡金龙解释:“在原来的生产关系里,公考名师的职业生涯路径,是毕业进入公考大型机构参与培训成为新手教师,随后成为学科带头人、师资中心负责人、资深教研员等。传统线下机构的教学教研成本占营收的10%-15%,线上机构则占30%左右,不注重教学教研品质的机构的占比会少很多。而新的生产关系里,一批成熟的老师,可以通过很多其它方式组织起来。比如类MCN管理,老师的收入或占营收的50%以上,IP老师的单人产值可达数百万到数千万。成本结构与原来的公考机构完全不同,这就是新的生产关系。” 在生产力方面,AIGC浪潮席卷而至,蔡金龙判断,AI赋能公考行业的变革远超当年“题库+直播”带来的变革。 2023年3月,蔡金龙迅速找到知乎,颇有信心地提出了“一起公考AI课”的构想。这个构想也契合知乎的战略方向,双方一拍即合。研发近一年后,“一起公考AI课”随之诞生,目前处于小规模用户测试阶段。 一起公考AI课是一款面向C端学生的产品,核心特色是在学、练、管等方面用AI辅助学生提升学习效率。 以一名学员的全流程备考周期为例: 在前期的选岗方面,用户需要广泛获取各地招考信息,这些庞杂的招考信息发布时间不同、岗位要求不同、报名流程不同、还夹杂着专有名词,梳理出关键信息并不容易。 加入AI后,选岗环节的用户体验得到了极大优化。一起公考AI课里内置了智能助手,在智能助手的引导下描述自己的需求,用户便能快速收到智能助手提供的选岗建议及指导。 在备考过程中,公考分为笔试和面试环节。笔试分为行测和申论。其中,行测分为常识、言语、数量、判断、资料五大学科,覆盖超2000个知识点,考点多,内容广,范围杂。 针对公考笔试,如何高效刷题练习? 一起公考AI课结合AI,据用户的学习进度、特征和学习行为,智能分析用户的学习情况,推送适合用户的独家内容和个性化学习计划,让刷题更有针对性。 在学的方面,分模块,采用卡片化学习,团队把原本需要花费大量时间学习的视频课内容有机重构,利用富媒体,由浅入深展开。 在习(练)的方面,团队将海量公考题库的习题拆成像素级知识点,针对学员推送题串化练习,让练习题的颗粒度进一步细化。 以一道考察多个知识点的典型例题为例: 中国航天事业与中国传统文化交相辉映,也映衬中国航天不断迈向深空的探索道路,“玉兔号”“夸父一号”“祝融号”所探测的天体,按距离地球由近及远排列正确的是? 学生要做对这道题,必须同时掌握5个知识点:“玉兔号”所探测的天体是月亮,“夸父一号”所探测的天体是太阳,“祝融号”所探测的天体是火星,月亮比火星离地球近,火星比太阳离地球近。 题串拆解是指,团队要将这道融合5个知识点的题,拆成5道分别只含1个知识点的题,将难点逐一击破。利用AI的能力,大规模的拆题串成为可能。 蔡金龙说:“当AI拆完题后,结合学情,就有了一套个性化训练集和测试集,可以有效避免练习重复的题,从而节省用户练习时间。” 在公考笔试的申论方面,过去,申论批改往往是由老师人工批改,一起公考AI课通过大模型训练,将作业批改环节智能化,用户能够在几秒钟之内得到一份详尽的批改、解析指导报告,对关键信息阅读能力、概括能力、推理能力,甚至是语言和逻辑问题,都可以进行打分和批改。更重要的是,作业批改的智能化也在很大程度上解放了教师。 过去一年,除了知乎旗下的一起公考之外,实际上不少公考选手都在AIGC浪潮里推出新品: 高顿发布AI私教产品“领扣公考AI680”,核心特色是将AI和个性化教学的私教结合,提供个性化学习计划与实时答疑、督学和选岗服务,定价680元; 中公发布首款人工智能课程“AI数智系统班”,该产品由虚拟数字讲师“小鹿”授课,“小鹿”还为学员提供全天候的教学答疑、互动支持和报考咨询,定价0-280元; 华图推出“千面面试AI”智能AI面试母题班,采用专业师资+人工智能,模拟面试考场,训练母题,针对性AI点评,定价0-59.9元; 粉笔则尚未正式发布C端AI产品,而是先利用AI帮助老师提效,上线AI面试点评、题目的出题和解析等功能。 谈及与同类产品的区别,蔡金龙表示:“市面上形似的产品很多,但是内核千差万别,重要还是设计的底层逻辑。大家前期对AI课的探索一定走的是百花齐放的路线,一旦有一家的模式能冲出来,大家便会快速趋同。” 上述公考AI类产品均从公考学习的六个环节(公考的学习往往涉及学和练这两个核心环节及测评、规划、督学、答疑这四个服务环节)里找不同切入口。一起公考AI课的核心则是借助AI,让教研的颗粒度比以往更细一层(比如实现将将一道融合5个知识点的题,拆成5道分别只含1个知识点的题,基于此实现大规模的拆题串),以便在讲、练、测评等方面都能提高效率。而这会帮助用户形成一种高效的自学方式,全然不同于以往的培训业态。 本文截稿时,蔡金龙表示,对一起公考AI课内测的各项指标较为满意。据透露,一起公考AI课比传统的题库+直播的日留存数据提高十个点,目前,一起公考AI课的年费是199元,无人工干预的体验付费率也令团队满意。 02 AI加持,码齐“高-中-低”产品矩阵 过去一年,一起公考完善了“高-中-低”产品矩阵。当下,结合AI,一起公考正全方位升级产品线以提效。 蔡金龙判断,在当前的大环境下,用户对“高-中-低”产品矩阵的需求量将发生变化,由橄榄型向哑铃型转变 ,有些用户更倾向于精品自学,有些用户更倾向选择高端私教,中间价位的产品则可能需求会降低。 从定价标准来看,一起公考最早孵化的大班直播课瞄准的是中等价位产品线,一起公考AI课锚定的则是低价位产品线,而定位高端产品线的私教课也在2023年正式孵化,主打个性化服务。 谈及私教课的思路,蔡金龙说:“对因材施教的私教课服务来说,一个典型的参考范本是医院的医疗系统——使用标准化的组件,低成本且个性化地解决了一个大问题。” 因此,一起公考仿照医院问诊系统研发了一套学情诊断系统,这套系统基于学情的全景数据,在老师给其他同学诊断完学习问题、开完药方(学练计划)后,其他有类似学习问题的同学也会被推荐去看这些课、刷这些题。 “比如某个同学做某个考点速度慢,老师建议他学哪些方法技巧、做哪些针对训练,这就可以视作一个完整的药方。这个同学过一段时间反馈说这个药方很好,这药方就相当于过了一期临床。当更多做题都慢的同学陆续反馈药方都不错的时候,这个药方就可以被推广给其他同学。”
苹果将在WWDC公布AI战略;曝智谱AI参投清华系AI创企;百度升级7款大模型应用丨AIGC大事日报
1、苹果WWDC定档6月10日 将公布AI战略 2、传苹果与百度尚未达成AI合作 3、微软为Teams添加更多AI功能 4、英特尔AI PC加速计划升级 5、马斯克为X高级订阅者开放Grok 6、风险投资家私下不爽阿尔特曼炒作 7、Adobe新GenStudio平台成广告商AI工厂 8、AI语音克隆创企联手AI硬件公司 9、人民网发布《中国AI大模型产业发展报告》 10、百度升级7款大模型应用 已全面SaaS化 11、vivo开放蓝心大模型应用下载 12、创新奇智发新模型AInno-75B 13、曝智谱AI参投清华系AI创企 14、Keep在线5000节运动课程,15%为AIGC生产 15、BBC放弃用生成式AI宣传《神秘博士》计划 16、抖音发布AI生成虚拟人物治理公告 17、AI生产力平台创企引入多项AI新功能 18、AI人才薪资增幅或超33% 1、苹果WWDC定档6月10日 将公布AI战略 昨天,苹果宣布全球开发者大会定于太平洋时间2024年6月10日-14日举办。彭博社记者马克·古尔曼(Mark Gurman)预计,苹果将推出iPhone、iPad、Mac、Vision Pro头显和智能手表的主要软件更新,其新的AI战略将成为计划中的iOS 18升级的前沿和重点。不过,他认为苹果并不打算在iOS 18升级中推出自己的聊天机器人。 2、传苹果与百度尚未达成AI合作 昨天,《中国日报》援引接近苹果公司的知情人士称,到目前为止,苹果尚未与百度就AI合作达成协议。他们否认了苹果和百度合作为即将推出的中国版iPhone 16、Mac系统和iOS 18提供AI功能的说法。 3、微软为Teams添加更多AI功能 据The Verge报道,微软正在改进其AI驱动的Copilot在Microsoft Teams中的工作方式,包括Copilot将把会议中的口头记录和书面聊天内容合并到一个视图中,以便用户更轻松地赶上可能错过的会议。此外,Teams中的Copilot还改进了在聊天中撰写消息的功能,允许Teams用户以新的方式重写消息。 4、英特尔AI PC加速计划升级 英特尔公司今日宣布“AI PC加速计划”再添两项AI新举措,即新增“AI PC开发者计划”,并吸纳独立硬件供应商(IHV)加入“AI PC加速计划”。两项举措将优化并扩大AI规模,以加速在2025年前为超过1亿台基于英特尔平台的PC带来AI特性。 5、马斯克将为X高级订阅者开放Grok 今天凌晨,马斯克宣布,本周晚些时候,聊天机器人Grok将为X的所有高级订阅者启用,不仅是高级+订阅者。 6、风险投资家私下不爽阿尔特曼炒作 昨天,据Business Insider采访风险投资家发现,投资人对OpenAI CEO萨姆·阿尔特曼(Sam Altman)的不满日益明显。随着OpenAI准备进行1000亿美元融资,以及他的AGI(通用人工智能)革命继续快速进行,一些匿名投资人开始对阿尔特曼持怀疑态度,并私下贬低他。 7、Adobe新GenStudio平台成广告商AI工厂 昨天,Adobe在峰会期间宣布推出一款新的人工智能广告创作平台GenStudio,旨在让用户更轻松地使用该公司的生成式人工智能工具来开展营销活动。同时还推出了Adob​​e Experience的AI助手以及围绕Adob​​e Firefly生成式AI模型的更新。其中,GenStudio可以提供品牌套件、文案指导和预先批准的资源等内容,以及一系列AI驱动的生成工具,这些工具可以生成背景并确保整体基调保持品牌特色。 8、AI语音克隆创企联手AI硬件公司 今天,AI语音克隆创企ElevenLabs宣布与AI硬件创企Rabbit AI达成合作。ElevenLabs首席执行官Mati Staniszewski说:“我们的合作是为了让R1成为真正充满活力的副驾驶。”当R1用户通过语音执行高级命令时,ElevenLab支持的语音将以真实的声音并保持低延迟进行回复。 9、人民网发布《中国AI大模型产业发展报告》 昨天,在博鳌亚洲论坛上,人民网财经研究院、至顶科技联合发布《开启智能新时代:2024年中国AI大模型产业发展报告》。《报告》对目前的AI大模型按照部署方式进行了划分,主要分为云侧大模型和端侧大模型两类,分析了目前中国AI大模型产业发展面临算力瓶颈、大模型架构存在局限、高质量的训练数据集仍需扩展、大模型爆款应用尚未出现方面存在瓶颈。《报告》提出了中国AI大模型五大产业趋势展望:一是AI云侧与端侧大模型满足不同需求,C端用户将成为端侧的主要客群;二是AI大模型趋于通用化与专用化,垂直行业将是大模型的主战场;三是AI大模型将广泛开源,小型开发者可调用大模型能力提升开发效率;四是AI高性能芯片不断升级,AI大模型产业生态体系将不断完善。 报告原文:http://download.people.com.cn/jiankang/nineteen17114578641.pdf 10、百度升级7款大模型应用 已全面SaaS化 今天,百度智能云在“AICloud Day:大模型应用产品发布会”上,面向企业营销、对客服务、知识管理、数据洞察、代码编程等多个企业通用场景,升级数字人平台百度智能云曦灵、智能客服平台百度智能云客悦、内容创作平台“一念”、知识管理平台“甄知”、超级办公入口“超级助理”、生成式BI产品“百度GBI”,以及代码助手“Baidu Comate” 7大产品。本次百度智能云升级的7大产品已实现全面SaaS化,企业在网页端即可使用。 11、vivo开放蓝心大模型应用下载 昨天,vivo宣布蓝心大模型整体数据量跨越式升级到端侧 7B+云侧70B的超大组合,实现超700种手机相关功能。并且,蓝心大模型应用现在全面开放下载,包括蓝心千询AI助手、vivo办公套件,用户都可以在除vivo的其他品牌手机上自行下载使用。 12、创新奇智发新模型AInno-75B 今天,创新奇智发布智孔明工业大模型2.0版本(AInno-75B)及多款大模型原生应用,奇智孔明工业大模型参数量达到750亿以上,增强了海量知识管理、复杂逻辑推理、长流程任务编排、Agent智能体以及更多工业模态的生成能力。创新奇智在发布会上提到,在中国信通院可信AI工业大模型评测中,AInno-75B于业内首家通过评测,且达到当前最高评级(4+级);在SuperCLUE工业大模型基准评测中,奇智孔明工业大模型位列国内第1和卓越领导者象限。 13、曝智谱AI参投清华系AI创企 据钛媒体今日报道,国内AI大模型独角兽公司智谱AI,日前参与投资清华系AI Infra系统软件公司清程极智首轮数千万元融资。天眼查显示,清程极智近日完成了一轮工商变更,新增中金观博上海私募投资基金合伙企业(中金资本)、北京智谱华章科技有限公司(智谱AI)等实体,并显示智谱AI在该公司的持股比例达2.1673%。清程极智成立于2023年12月,公司致力于构建高效的AI系统软件。 14、Keep在线5000节运动课程 15%为AIGC生产 今天,据第一财经报道,Keep联合创始人彭唯透露,Keep在线有5000节官方运动课程,其中15%为AIGC生产。他表示今年keep将会继续投入AI资源,提升这一比例,包括在专业课程方向和运动数据方向同时发力,引入算法能力以提升专业度,并上线运动评估体系,基于运动科学、运动数据和算法来帮助用户感知身体状态和运动能力的变化。运动评估体系还可以在无心率设备下,每天为100万运动用户预估运动负荷、最大摄氧量、FTP等数据。目前,该体系已服务1500万用户。 15、BBC放弃用生成式AI宣传《神秘博士》计划 今天,据外媒The Register报道,在遭遇到作品粉丝的抗议投诉后,BBC放弃了用AI生成内容宣传《神秘博士》计划。BBC营销团队此前计划首先由人工撰写《神秘博士》相关的通知推送、电邮主题等宣传内容的草稿,然后使用生成式AI工具进行润色,在经过该团队的人工审核批准后,相关内容才会上线。 16、抖音发布AI生成虚拟人物治理公告 今天,抖音安全中心公众号发布《抖音关于不当利用AI生成虚拟人物的治理公告》。平台重申,创作者、主播、用户、商家、广告主等平台生态参与者,在抖音应用生成式人工智能技术时,须遵循以下规范:1、发布者应对人工智能生成内容进行显著标识,帮助其他用户区分虚拟与现实,特别是易混淆场景;2、发布者需对人工智能生成内容产生的相应后果负责,无论内容是如何生成的;3、虚拟人需在平台进行注册,虚拟人技术使用者需实名认证;4、禁止利用生成式人工智能技术创作、发布侵权内容,包括但不限于肖像权、知识产权等。一经发现,平台将严格处罚;5、禁止利用生成式人工智能技术创作、发布违背科学常识、弄虚作假、造谣传谣的内容。一经发现,平台将严格处罚。 17、AI生产力平台创企引入多项AI新功能 昨天,AI生产力平台创企Airtable宣布为其Airtable AI平台推出总结和摘要、分类内容、生成内容、翻译等新的AI功能。不过,该公司称,AI功能是用户付费、选择加入的功能,只有购买并打开后才能启用。该公司成立于2012年,主要帮助企业在共享数据的基础上创建应用程序,以优化工作流程。 18、AI人才薪资增幅或超33% 昨天,亚马逊云科技发布最新研究表明,预计到2028年,AI技术将在中国企业得到普遍应用。并且中国企业对AI人才非常重视,愿意为具备相关技能的人才提供平均高出33%的薪资。但目前具备AI技能的人才缺口巨大,企业在相关人才的招聘和培训方面都面临挑战。针对此,亚马逊云科技将在中国推出一系列AI知识培训课程,帮助企业和员工强化AI技术应用并有效提升生产力。
中国起诉美国新能源补贴违反WTO,王传福称将推DMI新技术,苹果或在中推出Apple TV+,小米胜诉,这就是今天的其他大新闻
今天是3月27日 农历二月十八 老马说 Optimus 人形机器人的成本 不到汽车的一半 说是估计卖 18 万到 21.7 万 成本比我想象的低 但我还是买不起 。。。 下面是今天的其他大新闻 # 中国起诉美国新能源汽车歧视性补贴政策违反 WTO 规则 ( IT 之家 )3 月 26 日消息,商务部网站周二发布消息称,为维护中方新能源汽车企业利益和全球新能源汽车产业公平竞争环境,3 月 26 日,中国就美国《 通胀削减法 》有关新能源汽车补贴等措施诉诸世界贸易组织争端解决机制。 商务部发言人表示,美方以“ 应对气候变化 ”“ 低碳环保 ”为名,出台《 通胀削减法 》及其实施细则,以使用美国等特定地区产品作为补贴前提,针对新能源汽车等制定歧视性补贴政策。 此举将中国等世贸组织成员产品排除在外,扭曲了公平竞争,严重扰乱了全球新能源汽车产业链和供应链,违反了世贸组织国民待遇、最惠国待遇等规则,中方坚决反对。 :这要是认定违反了,咱们可能就可以反制一波儿。 # 比亚迪王传福:今年 5 月推出第五代 DMI 混动技术,百公里馈电油耗 2.9 升 ( IT之家 )3 月 27 日消息,据第一财经报道,比亚迪董事长王传福称,今年 5 月将推出第五代 DMI 混动技术,馈电油耗降至 2.9 升 / 百公里,满油满电续航 2000 公里。 王传福称,由于目前车型处于供不应求情况,将逐步根据市场情况在 5 月份进行第五代 DMI 车型的切换,第五代 DMI 车型的产品热度有望延续 1~2 年。 :合资车:这日子叫我怎么过? # 曝苹果寻求在中国推出 Apple TV+ 等订阅服务,国行 Vision Pro 将搭载腾讯应用 ( 搜狐 )据 The Information 报道,苹果正加大力度在中国推出订阅服务,例如 Apple TV+ 和 Apple Arcade 游戏。 此外,根据报道,苹果将在今年晚些时候在中国推出其旗下智能设备使用的应用程序服务产品 Vision Pro,并且将会在该服务上提供一些中国市场的热门应用。 据悉,腾讯已同意与苹果合作,计划在其上“ 提供一些最重要的应用程序 ”。 :可以有,希望能减点广告,再提升下片源质量。 # 小米诉 Vidda 商业诋毁一审胜诉 ( 新浪科技 )小米法务部今日发布消息,称诉 Vidda 商业诋毁一审判决胜诉。 法院判令称,聚好看公司在“ Vidda 官方微博 ”账号置顶位置,连续七日刊登声明,就涉案商业诋毁行为为小米公司消除影响,赔偿小米公司经济损失 50 万元及合理开支 5 万元。 据悉,Vidda 是海信旗下的电视 & 智能投影品牌,该品牌曾在 2021 年发布多张海报,文案提到“ 米有屌丝 ”“ 米有耍猴 ”“ 米有暴利 ”“ 米有伪性价比 ”,引发广泛议论( 如图所示 )。
Sora还没赚到钱,“AI复活”先来割韭菜
撰文/ 孟会缘 编辑/ 陈邓新 “AI复活短视频制作,轻松火爆全平台,公域私域双重变现操作。这类视频涨粉快,基本上小红书一个月就能涨一万以上粉丝,抖音做得好的话一个星期就能涨到一万粉丝,而且有这类需求的人都很愿意花钱去制作视频。” “用AI让已故的亲人再一次出现在自己面前,哪怕只有短短的一分钟,也能弥补很多人内心的遗憾,所以拥有这种需求的人应该也挺多的,而且现在知道怎么做这种视频类型的人很少,竞争也比较小。” “这类视频你可以自己去定价格,反正我这边了解到同行定价基本上都是199元一个视频,一个视频时长在3分钟以内,你一天接个5单就能赚1000元了。” …… 先有包小柏用AI“复活”病逝女儿,后有部分网友用AI技术“复活”李玟、乔任梁等已逝明星,最近火爆一时的“AI复活”项目尽管引发了不少争议,但也让不少人看到了这门生意的发展潜力。 从用几元到上万元的接单价格引流,到一众“复活师”通过课程分享将产业做大,再到学徒们在主流短视频平台起号赚钱,“AI复活”的商业化之路,真的已经走上了“只要付费即可定制”的正轨? AI“复活”逝者有多简单? 现在的“AI复活”技术有多成熟? 只需要满足以下三点要求即可:一是,要拿出一张照片(含正脸)或全身照(含正脸),不要求高清,但是得看得清楚人脸;二是,有5~30秒时长的声音素材,微信语音、录音都可以,用于复刻声音;三是,得准备一段需要通过所生成的亲人讲出来的话语素材。 现在的“AI复活”技术有多不成熟? 受制于素材多寡和技术成本,目前“AI复活”产品能做到的效果分为两种:第一种是,利用声音克隆、图像处理等技术,直接让照片里的人物开口“说话”,即生成一张能动的照片;第二种是,通过表情捕捉驱动的AI换脸进行私人订制,用先进的AI技术合成人物的真实形象和声音,可以进行语音或视频等互动。可惜的是,这两种处理方式都无法全部摆脱那股明显的“AI味”。 尽管如此,优点和缺点同样明显的“AI复活”技术,实际上也已经成为令不少人交口称赞的好生意。 “通过先进的AI工具,仅需一张照片,逝去的亲人便能‘复活’,仿佛他们从未离开。他们可以开口说话,用那熟悉而亲切的声音告诉你思念和爱,仿佛时光倒流,让爱穿越时空。这不仅是对过去的缅怀,也是对未来技术的展望。” “用AI让已故的亲人再出现一次,哪怕只有简短的一分钟对话,也可以弥补内心的遗憾。” “做视频的目的是想让用客户怀念感情,让失去亲人的朋友再次看到动态效果,帮助他们找回记忆。动态老照片不是炫技,帮助人找回情感和记忆才是最重要的。” 闲鱼上的AI复活教程 正如这些通用的广告话术所言,此类商家所营销的“情感需求”是撑起这门生意的关键。 相关销售人员告诉锌刻度,“有这类需求的人群,一般都是心里有很思念的人,或者是亲人刚刚去世而自己没有见到最后一面,也有很多人像包小柏这样白发人送黑发人的,他们的购买能力都是很强的。” “AI复活”相关视频下的用户评论 因此哪怕在许多质疑声中,这些用逝者生前影像样本“克隆”出来的“亲人”,“AI复活”视频的实际表现效果并不如何,但对于其真正的受众人群来说,已经能起到一定的慰藉作用,更何况现在市面上不少“AI复活”产品卖得并不贵,说服他们花钱体验一下也不算困难。 离谱的AI复活课程:原价980元,现价6.88元 这段时间,“AI复活”的爆火,带动了此类需求的爆发,也催生了“复活”逝者的流水线——从发短视频起号,到全平台分发引流,再到开通橱窗卖货,最后通过卖课辐射更多人。 此前,就已经有媒体曝光过“AI复活”课程以名人效应打广告卖课的内幕。据法治日报的报道,某AI复活师门徒计划为,针对不同群体如宝妈、白领、学生等,只要有意学习AI技术、创业或干副业,就可以购买980元的门徒课程。其课程内容包括一本《AI复活门徒手册》,掌握基础技术原理并学会使用AI复活工具,赠送价值2999元的换脸课程。 据了解,学完课程后,学员可以制作逝者照片的说话视频并用AI配音,该项目售价为198元。总部每天会派发5至50不等数量的订单,每完成一个订单可获得50元的分成。另外,想要学习制作更为逼真的逝者视频并配上相似度很高的语音,则需要支付19800元。此外,付款方式为直接支付,没有合同,课程在3天内就能学完。 或许是此类报道卓有成效,锌刻度在淘宝、小红书、闲鱼等平台搜索发现,目前“AI复活”部分课程商品已因被用户投诉遭到平台下架处理,而留下来的可购买选项也不多,价格基本在几元到几百元不等。 锌刻度分别在淘宝和闲鱼购买了一份“AI复活”课程,但在收到网盘链接打开后才发现,这两个标价不一的商品内容其实是一样的。该视频教程在项目介绍、前期准备、实操视频、变现方式这四个方面进行了讲解,全方位地展示了一个新人小白应该怎么做才可以赚到这份钱。 课程内容 这份“原价980元,现价只要6.88元”的课程,基本可以算是一个“傻瓜式”教学模板,学员只要拿到素材即可根据该课程内容的演示完成操作,不过生成视频的重点还是要用到三个重要的AI工具:声音克隆平台百度飞桨、能根据照片生成动态视频的阿里EMO,以及AI智能制作视频工具D-ID。 按照该课程导师的说法,制作此类视频的实际成本,其实只需要付出使用视频制作工具的钱,如D-ID目前支持免费试用14天,想要使用更长时间或体验更多功能,需要给出对应套餐费用。 D-ID的不同套餐对应不同的价格 也就是说,哪怕是一个丝毫不懂技术的人,只要懂得如何使用AI数字人相关的制作工具,就能赶上这个商机。 Sora带动视频工具“爆种式”发展 既然工具如此重要,那么就不禁令人想到前段时间引发影视圈“大地震”的文生视频工具Sora了。 OpenAI在其网站上解释说:“Sora能够生成具有多个角色、特定类型的运动以及具有主题和背景准确细节的复杂场景”。根据这段时间的测试,当见识过此类大模型的能力后,生成式AI的想象空间已经被全面打开。 其实早在去年三四月份,正值AI大模型刚开始在国内“出圈”之际,百度文心一言等国产大模型陆续面市,就已经在部分AI数字创业者的帮助下逐步验证其商业价值。 曾在10个月的时间里,完成了约600个与“AI复活亲人”有关的需求订单的南京超级头脑,其团队负责人张泽伟在接受媒体采访时表示,超级头脑团队正是基于文心一言这类大模型去做语音、图像等的训练,“这是一项非标准化的服务,每个客户所能提供的逝者素材、需求效果不尽相同,需要去做定制。因此,对于大公司来说,他们会更注重标准化、通用性的技术和产品,不会投入到如此细分的赛道。而对一些新进入的团队来说,很多对行业及用户需求的认知理解往往不够,技术储备也不足。” 纵观国内玩家,已有超15家企业推出了视频生成工具,既包括百度、阿里、腾讯、字节等6家巨头,也包括爱诗科技、生数科技、智象未来等9家创企。而随着Sora的影响深入各行各业,国内相关技术迭代的进程也开始加速。 3月15日,腾讯与清华大学、香港科技大学联合推出图生视频模型“Follow-Your-Click”。使用者可点击对应区域并加上提示词,使特定对象运动。从放出的视频来看,选中鸟、雷电、人、火箭等,便可根据“转头”“笑”“伤心”“发射”等简短提示生成几秒视频。在提示词为“伤心”的视频中,人物低头掩面哭泣,动作较流畅。 3月23日,阿里云魔搭社区公布“ModelScope—Sora开源计划”,以开源力量助力中国类 Sora 模型的探索和创新。该计划将为类Sora模型开发提供一站式工具链,包括数据处理工具、多模态数据集、类Sora基础模型、训练推理工具等。现阶段,魔搭发布了业界首个开源的多模态数据处理系统 Data-Juicer,包含 100 多种高效算子,可大幅提升视频数据处理效率和质量。 “ModelScope—Sora开源计划” 此外,还有消息称字节跳动在研发名为Boximator的视频生成模型,字节此前回应称,这是一个视频生成领域控制对象运动的技术方法研究项目,与国外领先的视频生成模型在画面质量、保真率和视频时长等方面还有很大差距。 尽管目前无法了解到更多技术细节,但可以确定的是,随着相关技术迭代,AI行业从业者将迎来带来诸多可观的机遇。毕竟,抛开“AI复活”项目可能涉及的伦理及法律问题不谈,该话题在这段时间的持续发酵和火爆,也从侧面印证了生成式AI技术的落地前景。
微软前工程师:Windows 11现在还在用我30年前开发的“临时”UI
编译 | 苏宓 现在 Windows 11 的「AI 改造工程」正在如火如荼地进行中,其中微软联合 OpenAI 将许多先进的 AI 功能引入 Windows 系统中譬如照片、截图工具、画图等多个旧应用程序上,以及带来最新的 Copilot 功能。 但是,在它进行现代化升级之际,也有网友惊讶地发现,Windows 11 在 UI 维度的更新速度有些拖拉,甚至还在沿用 30 年前的老设计。 披露这一点是来自微软的前程序员 Dave Plummer,他在 X 社交平台上分享了自己曾在 1994 年开发的“临时性”磁盘格式化 UI 当前依然存活在现代化的 Windows 11 中。与此同时,Windows 只能支持 32 GB 的 FAT32 分区也是他曾经“武断性”的手笔。 作为过来人,这也让他警醒诸多开发者,千万不要小看任何一次的开发,即使是一些“临时”的解决方案。 01 从未更新过的 Windows 格式化磁盘 UI 回忆过往,那是在 1994 年一个下雨的星期四早晨,Dave Plummer 编写了格式化对话框。 当时他所属的团队正忙于将用户界面(UI)从以消费者为中心的 Windows 95(1995 年中期发布)移植到更稳定但资源更密集的 Windows NT(1996 年中期发布的 NT 4.0 首次使用了 95 风格的用户界面)。 Plummer 在 X 上写道:“格式化磁盘是 Windows NT 与 Windows 95 不同之处之一,因此我们必须设计一些自定义 UI。” Plummer 没有具体说明这些不同之处,但现在来看,当时的 Windows 95 主要使用 FAT16 文件系统来处理所有文件,它被用于处理硬盘、软盘等存储介质上的文件和文件夹。 后来即使是早期版本的 Windows NT 也开始支持多种文件系统,包括 FAT、NTFS 等。 当时,“我拿出一张纸,写下了格式化磁盘的所有选项和选择,如文件系统、标签、簇大小、压缩、加密等等”,Plummer 说道,“然后,我基于 Visual C++ 2.0,并使用资源编辑器将你(用户)必须做出的所有选择按大致顺序排列成一个简单的垂直堆栈。这样做并不优雅,但在优雅的 UI(用户界面)出现之前,这样做还是可以的。” 这在当时是创建格式化磁盘 UI 的临时解决方案。但当时 Dave Plummer 难以想象的是,30 年后的 Windows 11 还在用它。 “所以在引入’临时‘解决方案时要小心”,Dave Plummer 表示。 02 “Windows 只支持 32GB 的 FAT32 分区”也是一个武断性的方案 除了格式化对话框之外,Plummer 还透露称,FAT32 格式化 32G 限制也是他在那天早上做的一个武断的决定。 FAT 是用来组织计算机硬盘上的文件和文件夹的方法之一。FAT32 在文件系统中表示文件分配表的 32 位版本。相比于较早的 FAT16(16位版本)和更早的FAT12(12位版本,FAT32 最显著的优势是它支持更大容量的硬盘和文件分区,因为它使用了 32 位的文件分配表项,允许更多的文件和更大的分区。此外,FAT32 还允许更长的文件名和更好的簇大小管理,提供了更好的性能和存储效率。 不过随着技术的进步,FAT32 安全性差,最大只能支持 32GB 分区,单个文件也只能支持最大 4GB,这使得它在大容量存储和现代操作系统中的使用受到限制。 几年前,Dave Plummer 也特别发了一个 YouTube 视频回忆了这一功能,并表示当时自己想的是如何为 Windows 用户带来良好的潜在支持,也必须要决定 “集群松弛”的程度。 最终发现,庞大的群集数量会带来同样庞大的容量,但也会造成巨大的空间占用。譬如:选择 32KB 的群集大小,即使是最小的“Hello,World!”程序所需的几个字节,也会占用 32KB 甚至更多的磁盘空间 。 于是,他武断地直接将 FAT 的格式化大小限制在 32GB。 “这个限制也是那天早上的一个任意选择,但它作为一个永久性的副作用一直伴随着我们”。在现代 Windows 版本中,我们仍在使用这一限制——通过命令行或其他工具格式化的 FAT32 硬盘最大容量在 2TB 到 16TB 之间,具体取决于扇区大小。 “这是我犯下的,一个不能被原谅的致命错误...... 归根结底,这是一个简单的缺乏远见的问题,再加上临时解决办法变成永久性解决方案的老问题”,Dave Plummer 曾在播客中说道。 Plummer 还参与了 90 年代和 2000 年代初 MS-DOS 和 Windows 应用程序的许多零碎工作,包括任务管理器、Space Cadet 弹球游戏和随 Windows XP 一起提供的第一版产品激活系统。后来,Plummer 于 2003 年离开微软。 03 微软为什么不更新此 UI? 也有人好奇,为什么微软更新了 Windows 11 的诸多功能与 UI,为什么会忽略这么一个老旧的界面?其实想想,也不难理解。 其一,在没有出错的情况下,此 UI 的迭代优先级可以一降再降。作为全球第一大桌面端操作系统,Windows 系统的生态及其复杂性有目共睹。日常维护和更新 Windows 更是一项艰巨的任务,需要多个团队和多年的工作。此前,微软特别开设了一个独立的 Windows 部门来负责 Windows 的功能开发与维护,直至近年来,才将其瓦解并入“云计算与人工智能平台”部门,所以对于有些没有出问题的功能以及 UI,一直沿用以前的设计也不足为奇。 其二,外媒 Ars Technica 认为,Windows NT 版本的“格式”对话框得以保留至今,也是因为微软在 90 年代末和 21 世纪初发布的 Windows 2000 和 Windows XP 中开始使用 NT 代码库。尽管微软在不同版本的 Windows 中进行了许多更新和改进,但 Windows NT 作为内核的基础设计依然保持了稳定。因此,即使是 Windows 11,内核和其他关键系统文件仍然会携带“Windows NT”的标签。 04 “代码里的临时方案,最终都成了永久方案” Plummer 的一个追忆引发不少网友的讨论,也让许多有过“把临时方法作为永久性方案”的程序员感同身受。 来自 HN 上的 jaydeegee 表示,“大约 14 年前,在我从事新工作的第一周,我拼凑了一些代码来完成了查询我们的票务系统 (BMC Remedy),作为一种准队列监视器。直至今日,它有一些外观迭代,但仍然运行相同的后端代码。” 也有不少用户认可道: “我想说,没有临时和永久的解决方案,但有好的和坏的解决方案。一个好的解决方案,即使实施得很快,也会坚持下去,因为它(足够)很好。一个糟糕的解决方案也可能会持续存在,如果它是一段时间内唯一可用/可行的解决方案,那么其他所有解决方案都必须向后兼容。” “抛开任意不必要的限制不谈,我对保留旧代码很满意。它经过了时间的考验,过往由于较旧的硬件限制,现在依然可以非常高效地运行,并且符合逻辑 。与今天的软件不同,今天的软件通常都是臃肿的造轮子,几乎完全出于以下两个原因:一是为了营销“改变”,二是为了跟踪你所做的一切,以便他们可以从中获利。” 作为程序员,也有不少人和 Plummer 一样,呼吁应该谨防“足够好”的临时解决方案,“我们正在使用一个由实习生编写的核心日志记录组件,其中包含 POC(概念验证)一词。它的数据格式是实习生创建的,但当任何人真正注意到它编写了如此多的数据时,修复它的预算和工作量都超过了它的问题。”
背靠百度,极越就敢说自己是智能化标杆了?
前两天,极越搞了个 AI DAY 发布会。 开头两句话就把我给吸住了。 极越 CEO 夏一平说 “ 极越 01 的上市拉开了智能汽车的序幕,极越 01 成为整个行业的智能化标杆,没有之一。 ” 不儿,现在大家都这么猛的吗? 以前都是小鹏说自己智驾标杆,现在华为靠着一手全国无图智驾,也成了标杆。这极越作为一家入场并不算早的新势力,咋也成汽车智能化的标杆? 越往后听越发现,你别说这极越的 AI DAY 还真有点东西。 极越背靠百度,把文心一言大模型给搞车里了。作为国产语言大模型的小标杆,文心一言先是被三星 S24 作为国内 AI 助手的候选人。最近听说又被苹果瞄上了,果子准备在下一代 iPhone 16 加入文心一言。 而极越作为一辆车,把文心一言搞进去又是做啥用的? 首先是让语音助手更聪明,以前只能开个窗关个空调,现在是行走的百科全书,堵车的聊天神器。 跟文心一言谈笑风生或是在线答疑,主打就是一个陪伴。 而且按极越的统计,极越车主日均调用文心一言服务可以达到 7.1 次,说明车主用上基本就离不开了。 好好好,中年男人不回家,坐在车里合着不是玩王者荣耀,而是跟极越车机讲相声? 当然,除了要聪明,车机语音助手最关键的功能,是让智能座舱变得实用。 先来说智能座舱这个点,极越提到了一个 “ 全域全端侧 ” 的交互概念。 说起来也简单。 像咱们平常用语音交互的时候,主要头疼也就这么几个事,一是没信号,二是有卡顿,三是听不懂,四是没隐私,那么这个 “ 全域全端侧 ” ,其实就是为了解决这些问题。 先说没信号,目前汽车的语音助手其实都要依靠 “ 云 ” 技术来实现。 说白了就是需要联网,没网就用不了了。有的地下车库信号不好,有的山区根本没网,语音助手就交互不了一点。 所以,极越把整套语音交互相关的模块,都塞在了车载芯片的 NPU 里,相当于车自己就有个脑子,就没网其实也能聊。 其次,极越把语音助手的逻辑运算和深度学习模型都放在 NPU 里,不仅是联网的问题,还可以减少中间流程,减少卡顿,最终可以使交互速度提升到 700 ms 以内。 隐私就更好保护了,毕竟离线语音,你的聊天记录不会发送到车企总部,就不怕你和 AI 助手的聊骚被车企员工标注了( 狗头 )。 然后还有一个识别率的问题,有时候还真不能怪 AI “ 人工智障 ” ,其实在嘈杂环境下, AI 收到的音频和咱们考六级听力测试没啥区别,换人来听也未必准确,说实话遇到普通话不好的,我是真的耳背。 所以,极越把本来用在智驾上的多模态策略用到座舱上了。说白了,不仅听你语音,还对你口型,这样一套 “ 多传感器融合 ” 方案,据说可以达到 90% 的正确率。 你别说,背靠老大哥的 AI 技术,座舱这块搞得真可以。那智驾这块你靠谁? 哎!还真让它找着靠山了!靠谁呢,先买个关子,咱们接着看。 和大多数车企走纯视觉路线不同,极越是纯视觉 + 一点有图的 “ 非主流路线 ” 。。。 先说纯视觉,在上一次 OTA 之后,极越就用上了 OCC 占用网络技术,这个技术简单说就是将多个摄像头观测到的二维图形进行算法处理,形成三维建模,最后整出一个类似《 我的世界 》的 “ 体素 ” 世界。 而且,用户可以通过车机实时查看,更好地感知汽车机器人的世界。 它们把这个 OCC + BEV + Transformer 称为 B.O.T 三向箔,不过,这套东西倒不是极越首创,在本质上它和特斯拉是同一个逻辑,但是在国内这么做的,极越还真是第一个。 想当年,特斯拉之所以不做多传感器融合,主要还是激光雷达的价格太贵,现在国产化的激光雷达早不是曾经这个价位了,极越就不能拿它当理由了吧? 所以,极越的解释是,纯视觉具备更快的迭代速度和更高的技术上限。 有一说一,激光雷达确实可以精确地判断物体体积,但纯视觉可以通过色彩等信息,对物体进行识别,不过这要更强大的算法才能实现,按百度王亮的说法, “ 激光雷达初速度高,纯视觉加速度更快 ” 。 这就不得不说,百度的 AI 在智驾训练上的优势。比如说,通过文心一言可以快速找到相关属性的智驾训练素材,好比一个考试题库,随时挑重点难题对 AI 进行特别培训。 据说,在智驾训练用上文心大模型之后,成本会大幅降低,效率会大幅提升。 所以,从上市到现在,极越 5 个月 5 次 OTA ,每个月都搞了个新版本,好好好,月月开新车是吧。。。 而且在下个大版本更新后,极越 PPA 也可以 “ 全国都能开 ” 了。但准确的说是 “ 有百度地图的地方,极越 PPA 都能开 ” ,毕竟它还是有图的嘛。 所以主流车企都在无图化,为啥极越偏要做有图呢? 其实,咱们得纠正一个观点,目前大家谈的有图和无图,其实没有那么明确的非黑即白,而是处于一个灰色中间态。 首先无图不是真没地图做参考,导航用的 SD 地图还是要看的,不然都不知道往哪里开了。 而且大多数车企会选择 “ 有图用图,无图再说 ” 的方案,这倒不是说无图不行,而是需要大量的算法作为基础,依然是一个门槛很高的操作,一般车企还真做不好,有现成的图用着,那就先用着。 而有图最大的问题是费钱,比如做完一个城市的高精地图,可能得上亿的成本,而且这还不是最关键的,还有修路、市容市貌修正等一些原因,高精地图还要不停维护更新,基本是个无底洞。 巧了,我极越智驾的靠山来了,百度地图。 百度作为地图行业的老大哥,也有它的理解,它的答案就是做一套 LD 地图,在成本和效用上做了权衡,说有图那确实是有图,但其实也是做了妥协,精度没有高精地图那么高,成本则会低得多。 有一个好处是,因为不用大规模制图,即便是地图更新的问题,也可以通过视觉实时建图,降低成本。 所以说,极越这套纯视觉 + 有图的方案,决不是谁一拍脑袋做出的决策,而是背靠百度的存量资源,极越智能座舱有文心一言大模型做靠山,极越智驾有百度地图和 L4 级别的萝卜快跑做靠山。 所以这么看下来,极越老板做标杆这句话还真不是吹牛口嗨,有点东西。看来我是时候向差评君申请,搞一辆极越来给大伙测测了。 最后,送上一个彩蛋!还记得前文提到的 “ 体素 ” 世界吗,极越这次 OTA V1.4.0 版本后更新了一个 OCC 彩蛋,实在是太有意思了,直接上视频,让大家也感受一下。
三星智能戒指即将开卖,谁会“魔戒”买单?
一次创新性的尝试。 经过多年铺垫,在今年MWC 2024上,三星正式对外宣布了自家智能戒指产品“Galaxy Ring”,这是一种与智能手环类似的智能穿戴设备,但体积更小、不带屏幕,非常小巧轻便。 最新消息显示,Galaxy Ring已经出现在三星手机的电池小部件中,这也意味着三星生态已经接入这款设备,并为它的发布做好了准备。 而就在几天前,韩媒The Elec报道称,三星计划首批生产40万枚Galaxy Ring,并从5月就开始量产零部件。从首批准备40万枚备货来看,三星非常看好这款产品。 不仅是三星,苹果近期也在智能戒指上有新动作,看得出来手机厂商们为了卖手机,真的费劲了心思。 智能穿戴家族的"新"成员 在MWC现场展示的时候,三星电子移动体验(MX)部门数字健康团队负责人Hon Pak对外重点介绍了Galaxy Ring支持基于心率、运动和呼吸指标的睡眠分析功能。 单就外观来说,Galaxy Ring非常轻薄,但在设备内侧塞进了必要的微型传感器以及电池,从而为用户提供必要的检测功能。 而除了健康和睡眠监测功能外,Galaxy Ring还将与三星食谱 (Samsung Food) 与三星电子食品商城 (Samsung e-Food Center) 等功能进行联动,通过AI驱动的方式,从而给用户提供饮食、食材等健康建议。 从这里可以看出来,Galaxy Ring主打的最大亮点还是围绕着“健康”,以外还包括“远程控制”、“无线支付”等智能手表/手环上常见的功能。 既能功能相似,那么为什么三星还要费尽心思推出智能戒指呢? 首先,智能戒指特点在于更轻、更小、更贴合人体,睡觉的时候也能佩戴。 其次,在手表、手环越做越大的情况下,总有一部分用户需要这种功能简单却实用的产品。 最后,市面上目前只有几家小团队推出过智能戒指产品,这其中,芬兰公司Oura Health Oy算得上名气最大,旗下的Oura Ring已经发展到第三代,英国哈里王子、奥运冠军谷爱凌都是他们的客户。 可即便有明星效应加成,整个智能戒指市场的出货量也不过数百万只。而和Oura Health Oy同期发布的Fitbit以及第一代Apple Watch,后来都可穿戴智能设备的标志性产品。 因此在其他厂商还没加入战局之前,三星也算得上在智能戒指市场搞了一次探索和尝试。 生不逢时,用户难买单 目前来看,仅凭健康检测功能,智能戒指想在可穿戴设备领域取代智能手环非常困难,对此头部科技公司希望为智能戒指出圈带来一种新思路。 在三星和苹果的专利里,除了常见的健康检测传感器以外,智能戒指内还会添加一些接收器。通过这些接收器,用户可以使用一些交互动作远程控制电脑、手机等硬件,而最终这些手势都是为了XR设备服务。 例如,在戴上Galaxy Ring后,用户可以通过挥手、指向动作等操作,对XR设备进行追踪识别。 又比如,Galaxy Ring能够对于手指精确点作出识别,进而让XR设备对手指的指令进行精确反馈。 类似的案例其实不少,包括歌尔、XREAL 、影目科技等XR厂商在内,他们自己也推出了类似手环、戒指等可穿戴产品。 然而随着元宇宙概念的退烧,VR/AR设备在2023年的出货量再次出现同比下降。即便有Vision Pro这样的高质量硬件设备为基础,XR设备想回归去年的热度相当困难。 因此在今年MWC现场,三星并没有展示与XR设备的交互功能,甚至有可能第一代 Galaxy Ring根本没有考虑到MR交互的需求。 这么看来,目前的Galaxy Ring依然只是智能手表/手环的替代品。 消费者与其花费高额的价格尝鲜,不如购入一只功能更丰富、价格更实惠的智能手环甚至智能手表。 如此来看,三星推出Galaxy Ring的想法很好,但想做到出圈还是相当困难。 本文作者:jh
苹果Vision Pro的双重优势,或助推XR市场复苏
日前有知情人士表示,苹果Vision Pro或将于4月在国内市场开售。但有消息源透露,对比目前海外市场的版本,国行版Vision Pro或在内容方面有所删减,以确保符合国内的规范,此外受税率等方面的影响,其在国内的售价或将更高。并且值得一提的是,有观点认为苹果CEO蒂姆·库克近期在国内现身,可能就与Vision Pro的后续迭代以及内容相关。 如今在xR领域,所有的参与者几乎都已清醒地认识到,更加丰富、多元,且高质量的内容生态,对于吸引和留住用户有着不可替代的作用,因此只有不断丰富和优化内容生态,吸引更多的开发者参与,进而形成良性循环,才是决定相关产品市场走向的重要因素。 事实上,苹果方面对此也已经体现出了非常明确的规划,并且在Vision Pro正式上市前相当长的一段时间里,就一直在完善这一方面的布局。去年库克到访中国时,就曾对国内开发者在Vision Pro上的工作表现出了极高的期待,并对所见到的成果表示“感到非常兴奋”。这样的表态不仅体现了苹果对于国内开发者的重视,更显示出其对于xR内容生态建设的重视程度。 近期有大量相关消息显示,苹果方面或试图将游戏作为xR领域的突破方向之一。此前其也已与多家游戏开发公司进行了接触,例如在库克此次的行程中,就与叠纸游戏有过深入交流,而后者在不久前刚刚推出了3D游戏《恋与深空》。此外,苹果与米哈游的合作也由来已久,库克去年也曾到访米哈游,此前米哈游也已宣布热门游戏《崩坏:星穹铁道》将登陆Vision Pro。 但值得一提的是,在游戏这一领域,苹果方面或将面对较为严峻的挑战。其实从模式上来看,Vision Pro的游戏生态或与索尼PS VR2有着高度的相似之处,即非常依赖第三方开发者。但目前PS VR2由于现阶段VR游戏的丰富度和品质尚未达到用户预期,有传言称其或将面临停产,所以苹果要如何解决这个问题,还需要更多的时间来给出答案。 此外,库克此次在中国的行程中,与蓝思科技、长盈精密,以及比亚迪等供应链厂商的会面,也同样值得关注。事实上,这三家公司均为Vision Pro提供了关键组件(玻璃、再生铝金属、屏幕总成,以及电池),这也是外界认为Vision Pro后续产品的研发工作或已展开的原因。不过此前虽然有消息源通过挖掘代码的方式,找出了部分苹果或将推出“亲民版xR头显”的蛛丝马迹,但鉴于Vision Pro在其他地区的上市时间尚未公布,因此短期内大概率不会有这样的产品面世。 需要注意的是,尽管目前外界对Vision Pro的评价大多仅局限于硬件,以及使用体验这些更偏向C端的部分。但事实上,这款产品的市场定位可能更倾向于B端,也就是其生产力属性明显更加突出。例如就在不久前,一个英国医疗团队曾在脊柱手术中使用Vision Pro来查看叠加在手术室的虚拟屏幕,以选择手术工具和监控进度。该团队的医生认为,Vision Pro是一种“改变游戏规则”的工具,而苹果则在之后声明,Vision Pro将数字内容与物理世界无缝融合的能力,将改变临床教育、手术计划、培训、医学成像等多个领域。 其实目前已经有诸多开发者正在不断挖掘Vision Pro作为生产力工具的潜力,例如有开发者就上架了一款能够帮助医生使用3D模型和其他工具为关节置换手术制定计划的应用。而类似的App还有Fundamental Surgery、CollaboratOR 3D和Complete HeartX等,为医疗培训和教育提供帮助。 相比xR赛道的其他厂商,苹果目前已经拥有了硬件和软件生态这两重优势,其中后者更是关键。仅以硬件部分而言,Vision Pro不惜工本的堆料,事实上也使得其其成为了当前技术条件下性能最顶的xR头显,并且在性能、显示等方面更是远远超出了同类产品。 而在生态方面,Vision Pro目前的优势则更为明显。visionOS作为苹果xR生态的核心,自诞生以来就具备强大的兼容性和创新能力。据悉,这一系统能够无缝兼容iPhone和iPad系列的数十万款应用,同时还内嵌了iOS和空间计算框架、空间音频引擎、注视点渲染引擎等一系列先进技术。尽管一款新设备在面世初期会遇到应用匮乏的问题,但visionOS的兼容性则显然打破了这个瓶颈。 更为重要的是,苹果方面借助多年来形成的成熟开发者生态,毫无疑问也将会成为visionOS后续专属应用的一大助力。正因如此,艾瑞咨询方面认为,2024年AR/VR终端全球出货量或将突破810万台,而苹果的迭代产品可能会在2027年引爆市场,迎来飞跃式的增长。而IDC方面则更为乐观,认为AR/VR头显2024年的全球出货量或飙升44.2%、达到970万台,并在2028年底有望达到2470万台。 尽管2023年全球AR/VR设备的出货量出现了23.5%的下滑,但市场的低迷表现并未阻挡住技术革新的步伐。尤其是苹果的入局,也为这个市场注入了新的活力。多家调研机构的相关报告就认为,在Vision Pro的拉动作用下,xR市场或将在2024年迎来复苏,并有望在未来一段时间内保持高速增长的态势。
iPhone在华出货量连续两个月大幅下滑 苹果如何渡过艰难期
今年2月,苹果iPhone在中国的出货量约为240万部,这比去年同期下降了33%; 或是受此数据影响,苹果周二(3月26日)美股收跌0.7%; 分析师认为,苹果未来几个月在中国会有销量逐渐放缓的趋势。 财联社3月27日讯(编辑 周子意)苹果在其最大的海外市场中国,仍处在艰难时期。 据媒体报道,今年2月,这家科技巨头在中国的iPhone手机出货量约为240万部,这比去年下降了33%,延续了今年开始出货量下滑的趋势。1月份,苹果在中国的出货量估计为550万部,同比减少39%。 尽管2月份的情况不像1月份那么糟糕,但仍是不及此前预期的。 Counterpoint Research在3月初发布的报告中估计,今年前六周,iPhone在中国的销量下降了24%。而实际的下降速度比上述报告中预估的要快,引发了投资者对苹果在中国市场销售业绩的担忧。 或许是受此数据影响,苹果周二(3月26日)美股收跌0.7%,今年迄今为止,苹果已经下跌了约12%。 韦德布什的科技分析师Dan Ives在最近的一份报告中写道,“苹果在中国经历了一段非常艰难的时期。” 放缓趋势 苹果在中国面临的问题之一是来自华为的激烈竞争。Counterpoint的数据显示,华为已经取代iPhone,成为中国排名第一的智能手机。 市场分析机构Canalys分析师Nicole Peng称,“苹果在中国的零售渠道仍在消化2023年第四季度的出货量,这可能是近几个月出货量下降的原因,这也预示了未来几个月苹果在中国的销量会出现放缓趋势。” 在截至2023年12月的最新季度财报中,该公司大中华区销售额降至208亿美元,同比下降13%。 杰富瑞分析师Edison Lee在本周的一份报告中表示,他们预计iPhone今年销量将下滑超过20%,领跌整个市场。 除了在大中华区面临的逆风外,苹果公司在2024年还遇到了多重挑战,包括欧盟近20亿美元的反垄断罚款、美国司法部的反垄断诉讼、人工智能技术的快速发展、以及终止自动驾驶汽车项目的决定。 外界目前正高度关注苹果的下一步动作,或许6月召开的全球开发者大会能带来一些新信息。 苹果公司在官网宣布,将于太平洋时间2024年6月10日至14日在线举办全球开发者大会“WWDC24”。本次会议将重点关注iOS、iPadOS、macOS、watchOS、tvOS和VisionOS的最新进展。 而苹果高层似乎正试图在中国重振旗鼓。苹果首席执行官蒂姆·库克本月访问了中国,参观了苹果在上海最新开张的专卖店,并参加了在北京举行的中国发展高层论坛。 Ives指出,“(库克)这次旅途的时机很重要,从本质上讲,苹果需要中国。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。