EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
梅赛德斯-奔驰集团第二季度销售额367.4亿欧元,同比下降3.9%
IT之家 7 月 26 日消息,梅赛德斯-奔驰今天也交出了今年第二季度的“成绩单”。数据显示,集团第二季度销售额 367.4 亿欧元(IT之家备注:当前约 2884.02 亿元人民币),同比下降 3.9%,预估 372.2 亿欧元;第二季度息税前利润 40.4 亿欧元(当前约 317.13 亿元人民币),同比下降 19%,预估 39.9 亿欧元;第二季度净利润 30.6 亿欧元(当前约 240.2 亿元人民币),同比下降 16%,预估 29.3 亿欧元。 梅赛德斯-奔驰汽车第二季度的销量达到 496712 辆,环比增长 7%,得益于中国和美国产品供应量的提高。其中,顶级车型第二季度的销量与第一季度相比增长了 6%,但仍低于去年同期水平,这主要是由于车型更替和亚洲市场环境低迷所致。随着全新电动 G 级的推出,高端车型的供应情况继续改善。另外,AMG CLE53、AMG E53 和 AMG GLC43 车型也于第二季度开始销售。 中国市场方面,受价格战影响,梅赛德斯-奔驰在中国市场面临着不小的市场压力。多款车型相较于指导价都有十几万元的降价,降价幅度普遍在四成左右。 梅赛德斯-奔驰预计,下半年的单位销量将与去年持平,在所有全新 E 级和 GLC 车型全面上市以及高端汽车销量增长的推动下,2024 年下半年的整体销量将有所增长。
印度降低关税带动苹果iPhone降价,富士康首次考虑在该国组装iPad
IT之家 7 月 26 日消息,随着印度政府宣布手机进口关税从 20% 降至 15%,苹果也下调了 iPhone 系列手机在印度市场的价格,但仍远高于美国、中国等市场的价格。 其中,苹果 iPhone 13、14 和 15 系列机型降幅为 3000 卢比(IT之家备注:当前约 259 元人民币),而 iPhone 15 Pro 和 Pro Max 最高降价 6000 卢比,降价幅度约 3~4%。 此次降价标志着苹果当前一代 Pro 机型首次在印度降价,但仍旧非常非常贵,例如 iPhone 15 Pro 为 12.98 万卢比(当前约 11206 元人民币),Pro Max 为 15.4 万卢比(当前约 13296 元人民币)。 数据显示,2023 年印度 iPhone 出货量同比增长 39% 达到 920 万台,成为 iPhone 第五大市场。摩根士丹利称,印度的 iPhone 业务规模超过欧盟任何一个独立国家。 随着印度逐渐成为苹果重要海外市场之一,该公司正在不断扩大其在印度的投资。摩根士丹利的数据显示,苹果 2023 年在印度的营收同比增长 42%,达到 87 亿美元(当前约 629.52 亿元人民币)。 印度《经济时报》报道称,在 iPhone 降价的同时,苹果主要代工制造商富士康也已经在探索于泰米尔纳德邦工厂组装 iPad 的可能性,目前正与印度政府进行谈判。这标志着富士康印度在苹果代工生产行业中地位的提高,并反映出该公司对印度不断增长的供应链能力充满信心。
“专利战”再启:因知识产权侵权,中创新航遭宁德时代索赔
IT之家 7 月 26 日消息,IT之家从港交所披露易获悉,中创新航今日晚间公告称,公司于近日收到福建省福州市中级人民法院送达的民事起诉书。 诉讼基本情况如下:原告宁德时代新能源科技股份有限公司针对本公司及福州仓山埃安汽车销售服务有限公司(一家独立于本公司的汽车销售商)就 ZL201720968992.6 号实用新型专利(“涉诉专利”)提出的知识产权侵权索赔。 案件主要诉讼请求包括: 主张中创新航立即停止实施侵害原告涉诉专利权的行为,包括停止制造、销售和许诺销售侵害涉诉专利权的动力电池产品; (2) 主张福州仓山埃安汽车销售服务有限公司立即停止实施侵害原告涉诉专利权的行为,包括停止销售侵害原告专利权的产品; (3) 主张中创新航赔偿原告经济损失人民币 9200 万元; (4) 主张中创新航赔偿原告为制止侵权支出的合理费用人民币 30 万元。 中创新航方面称,目前公告涉及诉讼尚未开庭审理,无法院最终判决结果,亦不会对公司当前及未来的生产经营产生不利影响。公司将积极采取相关法律措施,保护公司合法权益,并切实维护公司和全体股东利益。 而在今年早些时候,由于涉及一项关于“防爆装置”的专利诉讼,中创新航及旗下子公司被要求停止侵权行为,并支付宁德时代 4157 万元赔偿。宁德时代自 2021 年 7 月起陆续针对中创新航提起五项专利诉讼,索赔总额高达 6.17 亿元。
苹果COO杰夫・威廉姆斯来华参观多家供应商,再度强调中国“果链”价值
IT之家 7 月 26 日消息,据界面新闻报道,苹果公司 COO 杰夫・威廉姆斯 7 月 25 日来华探访即将投运的深圳应用研究实验室,并参观了领益智造位于广东东莞的功能件及模组件生产工厂的数个智能制造产线及研发中心、富士康观澜工厂。 苹果官方数据显示,2023 年,占苹果全球 98% 供应链支出的 187 家供应商中,有 157 家在中国建有生产苹果产品的工厂。“这对我们作为一家公司来说是很重要的,没有我们在中国的制造业伙伴,是不可能做到的。”威廉姆斯表示。其中,有 70 多家主要供应商在广东布局了工厂,这决定了以深圳为中心的广东地区对苹果供应链的特殊意义。 威廉姆斯在参观富士康观澜工厂时提到,2007 年他曾亲眼见证初代 iPhone 在富士康的生产过程,因此 17 年后当他再次参观富士康观澜工厂时尤为感慨。“中国制造业的变化非常了不起,从一开始只是完成一些初级制造,到今天已经拥有了很多先进工艺。” 他表示,领益智造和富士康观澜工厂是两个非常典型的案例,过去的工人只能用马克笔在白板上写字、在生产线上进行大量重复性操作,但如今已经实现了非常高的自动化水平和智能制造水平。“过去数年内,苹果产品实现了很多新的技术发展。以 Apple Watch 为代表,很多产品的相关零部件制造工艺需要不断改进,耐受度和精密度也都要不断提升,这意味着合作伙伴的工程制造能力要跟上我们创新的步伐。我们非常高兴,看到他们确实做到了这一点。” 据IT之家昨日报道,苹果今年 3 月宣布扩大其在中国的应用研究实验室规模,包括提升上海研究中心的能力,并将于今年晚些时候在深圳开设应用研究实验室,深化与本地供应商的合作。苹果在深圳成立的应用研究实验室即将投入运行。该实验室的研究方向为 iPhone、iPad、Apple Vision Pro 等产品可靠性、质量和材料分析测试。 苹果已为其应用研究实验室投资超过 10 亿元人民币,并表示这一投资将继续增长。实验室帮助工程和设计团队测试原型、进行改进,并与供应商密切合作,帮助供应商提高效率、节省时间。
印度富士康首次拿下Pro订单:消息称苹果计划年内在印度组装iPhone 16 Pro/Max
IT之家 7 月 26 日消息,据 Moneycontrol,苹果计划通过富士康扩大在印度的生产线,包括即将推出的 iPhone 16 Pro 和 Pro Max 机型,这也是印度首次为 Pro 系列 iPhone 提供组装服务。 “苹果每年都在寻求与印度的合作伙伴深化其制造能力,而生产 Pro 机型是过去几年来一直在考虑的事情。今年,苹果将在印度制造 Pro 和 Pro Max 机型,以确保发布后在印度也能供应印度组装的 iPhone 16 Pro 机型。” ▲ iPhone 16 谍照 消息人士称,富士康位于泰米尔纳德邦斯里佩伦布杜尔的工厂将很快开始 iPhone 16 Pro 机型的“新产品导入”(NPI 流程),并在手机推出后进入量产阶段。 作为参考,苹果去年只有 iPhone 15 基础版机型是印度本土组装,且上市首日就为印度客户提供了印度产机型,后来又通过和硕科技为印度用户提供了 iPhone 15 Plus 的“国产机型”。 ▲ iPhone 16 渲染图 消息人士还表示,由于富士康拥有“广泛的能力”和“与苹果供应链的深度整合能力”,通常在新品制造方面享有优先权。 “在 iPhone 16 系列上市初期,Pro 和 Pro Max 机型可能会进口,但苹果将在本财年(IT之家注:截至 9 月 30 日)内提供印度本土制造的 Pro 机型,类似于它对 iPhone 15 Plus 所做的那样。” Counterpoint 数据显示,苹果目前在印度智能手机市场出货量占比仅有 6%,但 2023 年营收占比达 23%,超过三星的 21% 拿下第一。据称。苹果 2023 年在印度出货了超过 1000 万部 iPhone,高于 2022 年的 600 万部。 摩根大通分析师 2022 年表示,预计到 2025 年,苹果所有产品中将会有四分之一在中国以外地区生产,而当时这一数字为 5%。
谷歌AI一分之差痛失IMO金牌,19秒做一题碾压人类选手,几何AI超进化震撼评委
AI,已经斩获了IMO奥数银牌! 就在刚刚,谷歌DeepMind宣布:今年国际数学奥林匹克竞赛的真题,被自家的AI系统做出来了。 其中,AI不仅成功完成了6道题中的4道,而且每道题都获得了满分,相当于是银牌的最高分——28分。 这个成绩,距离金牌只有1分之遥! 609名参赛选手中,拿到金牌的只有58人 在正式比赛中,人类选手会分两次提交答案,每次限时4.5小时。 有趣的是,AI只用了几分钟便答出了其中一道,但剩下的问题却花了整整三天时间,可以说是严重超时了。 这次立下大功的,是两款AI系统——AlphaProof和AlphaGeometry 2。 划重点:2024 IMO并不在这两个AI的训练数据中。 其实,早在今年1月份,谷歌DeepMind的第一代AlphaGeometry就登上了Nature。当时,它做出了IMO 30个几何题中的25道。 AI工程师Devin背后创始人之一Scott Wu(IOI三枚金牌得主)感慨道,「当我还是个孩子的时候,奥林匹克竞赛就是我的全部。从来没有想过,仅仅10年后,它们就被AI解决了」。 今年的IMO竞赛上,共有六道赛题,涉及代数、组合学、几何和数论。六道做出四道,让我们感受一下AI的水平—— AI的数学推理能力,震惊评分教授 我们都知道,以前的AI在解决数学问题上一直捉襟见肘,原因在于推理能力和训练数据的限制。 而今天携手登场的两位AI选手,则打破了这种限制。它们分别是—— - AlphaProof,基于强化学习的形式数学推理新系统 - AlphaGeometry 2,第二代几何解题系统 两位AI给出的答案,由著名数学家Timothy Gowers教授(IMO金牌得主和菲尔兹奖得主)和Joseph Myers博士(两次IMO金牌得主、IMO 2024问题选择委员会主席),根据规则进行评分。 最终,AlphaProof正确做出两个代数题和一个数论题,其中一个最难的问题,在今年IMO中只有5名人类参赛者做了出来;AlphaGeometry 2则做出了一道几何题。 没有被攻克的,只有两道组合数学题。 Timothy Gowers教授在评分的过程中,也被深深地震撼了—— 程序能够提出这样一个非显而易见的解法,实在令人印象深刻,远超出我对当前技术水平的预期。 AlphaProof AlphaProof是一个能够在形式化语言Lean中证明数学命题的系统。 它结合了预训练的大语言模型和AlphaZero强化学习算法,后者曾自学掌握了国际象棋、将棋和围棋。 形式化语言的一个关键优势,就是可以对涉及数学推理的证明进行形式化验证。然而,由于人类编写的相关数据量非常有限,它们在机器学习中的应用一直受到限制。 相比之下,基于自然语言的方法尽管可以访问大量数据,但却可能产生似是而非、但不正确的中间推理步骤和解决方案。 为了克服这一点,谷歌DeepMind研究者通过微调Gemini模型,将自然语言问题陈述自动翻译成形式化陈述,建立了一个包含不同难度的形式化问题的大型库,从而在两个互补领域之间架起桥梁。 解题时,AlphaProof会生成候选的解决方案,并通过在Lean中搜索可能的证明步骤,来证明或反驳它们。 每个被找到并验证的证明,都被用于强化AlphaProof的语言模型,让它可以在后续解决更难的问题。 为了训练AlphaProof,研究者证明或反驳了几百万个问题,涵盖了从比赛前几周到比赛期间广泛的难度和数学主题领域。 在比赛期间,他们还应用了训练循环,通过强化自生成的比赛问题变体的证明,直到找到完整的解决方案。 AlphaProof强化学习训练循环的流程信息图:大约一百万个非正式数学问题由形式化网络翻译成形式化数学语言;接着,求解网络通过搜索这些问题的证明或反驳,并利用AlphaZero算法逐步训练自己,以解决更具挑战性的问题 AlphaGeometry 2 AlphaGeometry的升级版AlphaGeometry 2,是一个神经符号混合系统,基于Gemini的语言模型从头开始训练。 基于比上一代多了一个数量级的合成数据,它能够做出难度更高的几何问题,包括涉及物体运动、角度、比例和距离方程等等。 此外,它还采用了比前一代快两个数量级的符号引擎。当遇到新问题时,它会用一种新颖的知识共享机制,使不同搜索树的高级组合能够解决更复杂的问题。 在今年参赛IMO之前,AlphaGeometry 2已经战绩累累:它能做出过去25年IMO几何赛题中的83%,而第一代只能做出53%。 在这届IMO中,AlphaGeometry 2的神勇速度更是震惊了众人——在接收到形式化问题的19秒内,它就把问题4做出来了! 问题4要求证明∠KIL和∠XPY之和等于180°。AlphaGeometry 2建议在BI线上构造一个点E,使得∠AEB=90°。点E有助于确定AB的中点L,形成了许多类似的三角形对,如ABE ~ YBI和ALE ~ IPC,从而证明结论 AI的解题过程 值得一提的是,这些问题首先会被人工翻译成正式的数学语言,然后才会投给AI。 P1 一般来说,每届IMO试题中第一题(P1)相对来说,是比较容易的。 网友表示,「P1仅需要高中数学知识就够了,人类选手通常会在60分钟内完成」。 IMO 2024第一题主要考察了实数α的性质,并要求找出满足特定条件的实数α。 AI给出了正确答案——α是偶整数。那么,它具体是如何解答的呢? 解题第一步,AI先给出了一个定理,左右两边集合相等。 左边集合表示,所有满足条件的实数α,对于任何正整数n,n能整除从1到n的⌊i*α⌋;右边集合表示,存在一个整数k,k是偶数,实数α等于k。 接下来的证明中,分为两个方向。 首先证明右边集合,是左边集合的子集(简单方向)。 然后,再证明左边集合,是右边集合的子集(困难方向)。 直到代码结束时,AI提出了一个关键等式⌊(n+1)*α⌋ = ⌊α⌋+2n(l-⌊α⌋),使用等式来证明α必须是偶数。 最后,DeepMind总结了AI在解题过程中,依赖的三个公理:propext、Classical.choice,以及Quot.sound。 以下是P1的完整解题过程: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/P1/index.html P2 第二题考察的是,正整数对(a,b)的关系,涉及到最大公约数的性质。 AI求解的答案是: 定理是对于满足特定条件的正整数对(a,b),其集合只能包含(1,1)。 AI在如下的解题过程中,采取的证明策略是,首先证明(1,1)满足给定条件,然后再证明这是唯一的解。 证明(1,1)是最终解,使用g=2,N=3。 证明如果(a,b)是解,那么ab+1必须整除g。 在这一过程中,AI使用了欧拉定理,以及模运算的性质进行推理。 最后,去证明a=b=1是唯一可能的解。 如下是P2的完整解题过程: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/P2/index.html P4 P4是一道几何证明题,要求去证明一个特定的几何角度关系。 如上所述,这是由AlphaGeometry 2在19秒内完成答题,创新纪录。 根据所给的解决方案,与一代AlphaGeometry一样,所有解决方案中的辅助点都是由语言模型自动生成的。 证明中,所有的角度追踪都使用了高斯消元法(Gaussian elimination),d(AB)−d(CD)等于从AB到CD的有向角度(以π为模)。 解题过程中,AI会手动标注相似三角形和全等三角形对(以红色标注)。 接下来,就是AlphaGeometry的解题步骤了,采用了「反证法」去完成。 先用Lean完成需要证明命题的形式化,以及可视化几何构造。 证明中的关键步骤,如下所示。 完整解题过程参见下图: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/P4/index.html P6 IMO第六题便是「终极boss」,探讨了函数的性质,要求证明关于有理数的特定结论。 AI求解,c=2。 先来看定理声明是,定义了「Aquaesulian函数」的性质,并声明对于所有这样的函数,f(r)+f(-r)的取值集合最多有2个元素。 证明策略是,首先证明对于任何Aquaesulian函数,f(r)+f(-r)的取值集合最多有2个元素。然后构造一个具体的Aquaesulian函数,使得f(r)+f(-r)恰好有2个不同的值。 证明当f(0)=0时,f(x)+f(-x)最多取两个不同的值,并证明不可能存在f(0)≠0的Aquaesulian函数。 构造函数f(x)=-x+2⌈x⌉,并证明它是Aquaesulian函数。 最后,再去证明对于这个函数,f(-1)+f(1) =0和f(1/2)+f(-1/2)=2是两个不同的值。 以下是完整解题过程: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/P6/index.html 能做奥数题,但能分清9.11和9.9谁大吗? 斯坦福大学和红杉的研究员Andrew Gao肯定了这次AI突破的意义—— 关键的是,最新IMO试题不包含训练集中。这一点很重要,说明AI能够处理全新的、未见过的问题。 而且,被AI成功解出的几何问题,由于涉及空间性质(需要直观思维和空间想象力),历来都被认为是极具挑战性的。 英伟达高级科学家Jim Fan则发长文表示,大模型是神秘的存在—— 它们既能在数学奥林匹克竞赛中获得银牌,又会在「9.11和9.9哪个数字更大」这样的问题上频频出错。 不仅是Gemini,就连GPT-4o、Claude-3.5、Llama-3都无法100%正确回答。 通过训练AI模型,我们正在探索超越自身智能的广阔领域。在这个过程中,我们发现了一个非常奇特的区域——一个看起来像地球,却充满诡异山谷的系外行星 这看起来很不合理,但我们可以用训练数据分布来解释: AlphaProof和AlphaGeometry 2,是在形式化证明和特定领域的符号引擎上完成训练。在某种程度上,它们在解决专业的奥林匹克竞赛问题更出色,即使它们基于通用LLM构建的。 而GPT-4o的训练集中,混杂了大量的GitHub代码数据,可能远远超过数学数据。在软件版本中,「v9.11 > v9.9」,可能严重扭曲了数据分布。因此,这个错误在某种程度上是可以理解的。 谷歌开发者负责人表示,能够解决困难的数学、物理问题的模型,是通向AGI的关键路径,而今天我们在这条道路上又迈出了一步。 另有网友表示,这一周信息量太大了。
美国多家科技巨头自揭家底:“AI竞赛已让我们无路可退”
财联社7月26日讯(编辑 赵昊)本周早些时候,Meta Platforms首席执行官扎克伯格在一档播客节目中表示,公司一直在囤积大量的英伟达芯片,以便开发和训练先进的人工智能(AI)模型。 扎克伯格承认,AI的热潮有可能已经导致了过度投资,“我认为,现在很多公司有相当大的可能在过度建设,未来回头看时会发现,我们可能都多花了数十亿美元。” 需要指出的是,他并不是科技巨头CEO中唯一一位表达了这种观点的人。在周三Alphabet的财报电话会上,公司首席执行官皮查伊也提到,公司可能在AI基础设施上投入过多,但他认为这一做法“别无选择”。 皮查伊说道:“当经历这样的曲线时,对我们来说,投资不足的风险要远远大于投资过度的风险。”昨日OpenAI官宣正在测试AI搜索功能“SearchGPT”,这一消息危及谷歌的核心业务,令Alphabet股价承压。 除了Alphabet,特斯拉也在电话会上强调了AI建设成本之高,可以预想到,下周微软、亚马逊、Meta等也会在财报中“抱怨”这一点。 本周早些时候,Meta推出了最新的开源大模型“Llama 3.1”,尽管公司投入了大量资金,但Meta依然坚持开源。这意味着,外部的开发人员可以免费访问这项技术。 对此,扎克伯格强调,开源能够促进完整的生态系统发展,并让行业中的各类模型都保持竞争、高效和开放。而从更长远的角度来看,开源会让AI变得更安全,让系统更加透明,可以受到广泛的审查。 扎克伯格在播客节目中说道,尽管成本高昂,公司在AI投资上仍然“做出了理性的决定”,“因为落后的代价是,你将会在未来10到15年最重要的技术中处于不利位置。” 红杉资本合伙人大卫·卡恩(David Cahn)在博客文章中评论道,“微软、亚马逊和谷歌之间的军备竞赛是博弈论式的。每次只要微软升级,亚马逊都会受到压力为了跟上而升级,反之亦然。” 来源:卡恩博客 卡恩在文章中贴出了一个“囚徒困境”的博弈结构图,并解释道,“云计算巨头们将AI同时视为‘威胁’和‘机会’,在技术发展期间他们没有喘息的空间,他们必须立即行动。” “微软、亚马逊和谷歌这三家公司的总市值超过了7万亿美元,他们的每次升级周期,都只有一个简单的理由,那就是‘我们有足够的钱负担得起’。”然后,这个循环就会自我强化。 周二,特斯拉CEO马斯克也提到,由于要开发Dojo超级计算机,这家电动汽车制造商对英伟达硬件的需求也非常高,“我们别无选择。英伟达方面自然也会把GPU的价格提高到市场恰好可以承受的水平。”
踢馆Llama 3.1 “欧洲OpenAI”发布开源新模型Large 2
Meta发布最新的开源大模型Llama 3.1还不到一天,法国AI初创公司Mistral就来踢馆——7月24日,Mistral发布了其全新的旗舰模型Large 2。 Mistral AI是一家成立刚满一年的法国AI初创公司,也是截至目前欧洲范围内资金最充足、最有竞争力的AI玩家,其核心成员来自Google DeepMind等顶尖AI机构,比如联创Mensch就是对Chinchilla等大模型论文的作者,提出了包括Scaling Laws(缩放法则)在内的核心技术。 2023年6月成立后仅4周,Mistral AI便靠6人团队斩获1.05亿欧元融资。公司专注在开源大模型的研发,被法国总统马克龙赞为“新一代欧洲初创企业与美国科技巨头竞争的典范”。 2023年12月,Mistral 曾发布名为Mistral 8x7B 的开源大模型,有560亿参数,效率和表现与LLaMA-65B旗鼓相当,在大模型界一炮而红。除此之外,该公司还对标ChatGPT,推出名为 Le Chat 的多语言对话助手(官网显示仍在测试阶段,需注册并申请测试资格),用于展示公司最新的技术能力。 Mistral表示,Large 2在使用Llama 3.1 405B不到三分之一的参数,即1230亿个参数的情况下,代码生成、数学和推理能力超过了前者,在生成响应时比其他领先的AI模型也更简洁,避免了过多的冗长描述。这意味着,Large 2在成本方面更具优势,开发者在本地运行也更迅速。 和Meta 的Llama 3.1一样,Large 2也没有上多模态能力,但对话的回应准确度和可靠性上,可以向Llama“以小博大”。Mistral表示,模型的幻觉问题是在Large 2的训练过程中的重点之一。此外,在指令遵循和对话任务、处理精确指令和长时间、多轮对话方面,Large 2也有所提升。 Large 2拥有128k上下文长度,可以在单次对话中接收约等于一本300页书的字符数。此外,Large 2还支持多种语言,能够处理包括英语、法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语,以及80种代码语言。 图源:Mistral官网 需要指出的是,Mistral的模型并非传统意义上的开源模型,商用需付费。 目前,Large 2已经进驻了Google、Amazon、Azure和IBM的平台,为用户提供使用。用户也可以在Mistral的La Plateforme(简化AI应用开发的综合平台,提供预训练模型、数据处理工具和API接口)上通过“mistral-large-2407”体验,或在Le Chat上免费测试。 Mistral于今年6月完成B轮融资,共筹集了6.4亿美元,估值达60亿美元。此轮融资由General Catalyst领投,投资者还包括光速创投、安德森·霍洛维茨、英伟达、三星风险投资公司和IBM等。 Mistral AI目前约有60名员工,其中45名在法国,10名在美国,5名在英国。据《金融时报》报道,约四分之三的员工从事产品开发和研究工作。
国际奥委会:最大限度发挥AI工具影响力,体育人才选拔方式有望得到革新
IT之家 7 月 26 日消息,据新华社报道,在 24 日召开的发布会上,国际奥委会首席信息科技官伊拉里奥・科尔纳表示,已经确定了超过 180 个潜在的 AI 应用场景,要最大限度发挥它们的影响力。 据介绍,AI 工具可以在辨别体育人才方面展现价值 —— 通过相应技术,仅凭手机软件就能在世界任何地方“发现”新的体育人才。目前,国际奥委会与英特尔正共同开发相关定制化技术,旨在帮助各国和地区奥委会创新体育人才识别和投资培养方式,相关技术已在塞内加尔完成相应测试。 图源 Pexels 2026 年,塞内加尔即将迎来非洲地区首个奥林匹克赛事 —— 达喀尔青奥会。国际奥委会与英特尔、塞内加尔奥委会展开合作,在当地派驻一支体育科学专业团队进行项目试点。据悉,在参与此次项目的 1000 余名年轻人中,将有 48 名表现优异的年轻人通过相关测试选拔出来,被纳入塞内加尔奥委会主办的比赛项目,且未来有望成为奥运选手。 据IT之家此前报道,巴黎奥运会将大量采用中国 AI 技术,应用在赛事解说、360 度直播、视觉搜索等领域。将在巴黎奥运会上亮相的 AI 应用包括 360° 直播特效、黑白影像 AI 彩色修复、碳减排辅助等,由通义千问提供技术支持的首个(奥运领域)大模型应用也将上线,开放给国际奥组委官方解说员使用,辅助各项赛事解说。
大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了
继分不清9.11和9.9哪个大以后,大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”,再次引起一片讨论。 GPT-4o不仅错了还很自信。 刚出炉的Llama-3.1 405B,倒是能在验证中发现问题并改正。 比较离谱的是Claude 3.5 Sonnet,还越改越错了。 说起来这并不是最新发现的问题,只是最近新模型接连发布,非常热闹。 一个个号称自己数学涨多少分,大家就再次拿出这个问题来试验,结果很是失望。 在众多相关讨论的帖子中,还翻出一条马斯克对此现象的评论: 好吧,也许AGI比我想象的还要更远。 路遇失智AI,拼尽全力终于教会 有人发现,即使使用Few-Shot CoT,也就是“一步一步地想”大法附加一个人类操作示例,ChatGPT依然学不会: 倒是把r出现的位置都标成1,其他标成0,问题的难度下降了,但是数“1”依旧不擅长。 为了教会大模型数r,全球网友脑洞大开,开发出各种奇奇怪怪的提示词技巧。 比如让ChatGPT使用漫画《死亡笔记中》高智商角色“L”可能使用的方法。 ChatGPT想出的方法倒是也很朴素,就是分别把每个字母写出来再一个一个数并记录位置,总之终于答对了。 有Claude玩家写了整整3682个token的提示词,方法来自DeepMind的Self-Discover论文,可以说是连夜把论文给复现了。 整个方法分为两大阶段:先针对特定任务让AI自我发现推理步骤,第二阶段再具体执行。 发现推理步骤的方法简单概括就是,不光要会抽象的思维方法,也要具体问题具体分析。 这套方法下,Claude给出的答案也非常复杂。 作者补充,花这么大力气解决“数r问题”其实并不真正实用,只是在尝试复现论文方法时偶然测试到了,希望能找出一个能用来回答所有问题的通用提示词。 不过很可惜,这位网友目前还没公布完整的提示词。 还有人想到更深一层,如果要计算文档中straberry出现多少次怎么办? 他的方法是让AI想象有一个从0开始的内存计数器,每次遇到这个单词就往上加。 有人评论这种方法就像在用英语编程。 也有AI可以一次做对 那么究竟有没有大模型,可以不靠额外提示词直接答对呢? 其实不久之前有网友报告,ChatGPT是有小概率能直接答对的,只不过不常见。 谷歌Gemini 大概有三分之二的概率能答对,打开“草稿”就能发现,默认每个问题回答三次,两次对一次错。 至于国内选手,在提问方式统一、每个模型只给一次尝试机会的测试下,上次能正确判断数字大小的,这次同样稳定发挥。 字节豆包给出了正确回答,还猜测用户问这个问题是要学习单词拼写吗? 智谱清言的ChatGLM,自动触发了代码模式,直接给出正确答案“3”。 腾讯元宝像解数学题一样列方程给出了正确答案(虽然貌似没有必要)。 文心一言4.0收费版则更加详细,也是先正确理解了意图,然后掰指头挨个找出了全部的“r”。 不过有意思的是,在同一种方法下,文心一言APP中的免费版文心3.5掰指头也能数错。 讯飞星火也通过找出“r”所在位置给出了正确回答。 还是token的锅 虽然“数r”和“9.11与9.9哪个大”,看似一个是数字问题一个是字母问题,但对于大模型来说,都是token问题。 单个字符对大模型来说意义有限,使用GPT系列的Llama系列的tokenizer就会发现,20个字符的问题,在不同AI眼中是10-13个token。 其中相同之处在于,strawberry被拆成了st-,raw,-berry三个部分来理解。 换一个思路用特殊字符ⓢⓣⓡⓐⓦⓑⓔⓡⓡⓨ来提问,每一个字符对应的token也就会分开了。 面对这种问题,其实最简单的方法就是像智谱清言一样,调用代码来解决了。 可以看到,ChatGPT直接用Python语言字符串的count函数,就能简单搞定。 刚刚创业开了所学校的大神卡帕西认为,关键在于需要让AI知道自己能力的边界,才能主动去调用工具。 至于教给大模型判断自己知道不知道的方法,Meta在LLama 3.1论文中也有所涉及。 最后正如网友所说,希望OpenAI等大模型公司,都能在下个版本中解决这个问题。
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
作者 | 香草 编辑 | 李水青 智东西7月26日报道,今天一早,大模型独角兽智谱AI正式发布视频生成工具清影,可支持文生、图生6秒时长的视频,即日起在PC端、手机App端以及小程序端面向所有C端用户免费开放。 先来看看效果,以下是几个官方放出的文生和图生视频案例,覆盖人像、动物、3D卡通等场景: 从Demo来看,清影的生成效果虽然相比Sora等还有一定进步空间,但就整体而言流畅度、运动幅度等都很不错,无论是人物表情、动作,还是光影变化、镜头移动,都没有明显的卡顿和突兀感,对运动幅度的把控也恰到好处,不会看起来像PPT也不会过于夸张。 此外,虽然生成是完全免费的,但生成视频需要排队,智谱AI提供了两种加速排队的订阅方式,包括5元加速1天、199元加速1年。 清影API今天也同步上线,企业和开发者都可以通过调用API的方式,体验并使用清影的文生、图生视频能力,据称这也是国内上线的首个视频生成API。 据智谱AI CEO张鹏解读,清影基于自研的底座视频生成模型CogVideoX打造,能将文本、时间、空间三个维度融合起来。该模型参考Sora算法设计,采用了DiT架构,相比前代CogVideo模型推理速度提升了6倍。 智谱AI成立于2019年6月,起源于清华大学计算机系知识工程实验室,专注于开发新一代认知智能大模型。一直以来,智谱AI以对标OpenAI全模型产品线为线索,陆续研发了包括文本、代码、图像、Agent等方面的自研模型和产品矩阵。此次发布基于CogVideoX的清影,使其大模型矩阵又扩充类一个模态。 值得一提的是,这也是国内做语言大模型起家的大模型独角兽,首次推出视频生成产品——之前这个赛道更多的是字节、快手等短视频大厂,以及爱诗科技、生数科技等专注于视频生成模型的创企。 清影具体有哪些特点?其底层模型在哪些方面做了创新?具体效果如何?智东西第一时间上手实测了一番,有以下几点发现: 1、简短的提示词效果更好,复杂指令下会丢失细节。 2、人手仍是重灾区,容易出现画面闪烁的现象。 3、生成很快,但加上排队等待时间仍达到1-2分钟。 4、相比图生视频,文生视频的稳定性更高。 当然,有限次的体验无法做到全面,也欢迎感兴趣的读者朋友,在评论区分享体验感受和新发现~ 一、半分钟生成6秒视频,复杂指令、内容连贯 清影主要有4个特点:生成速度快、复杂指令遵从能力强、内容连贯性高以及画面调度幅度大。 首先在生成速度上,清影AI据称可以在30秒内生成一段6秒、帧率16fps、分辨率1440*960的视频。 ▲实时演示视频生成(动图有加速) 其次,在复杂指令遵从能力上,智谱AI自研了视频理解模型,用于为视频数据生成高度吻合的文本描述,进而构建了海量高质量视频文本对,提升了指令遵循度。 ▲复杂指令演示 清影的第三个特点是内容连贯性,能够比较好地还原物理世界当中的一些运动的过程。 例如基于这张大家熟悉的杜甫画作,清影让杜甫不仅动了起来,而且非常自然顺滑地端起了一杯咖啡。 ▲内容连贯性 最后在画面调度方面,清影采用文本、时间、空间融合的Diffusion Transformer架构,可生成遵循特定运动规则的动态视频。 智谱AI豪迈地放出了几十个Demo,其中不乏有一些效果惊艳,比如这个:木头上长出两朵奇特的透明塑料花。 “透明塑料花”不是真实存在的,清影的想象力和审美在这个案例中得以展现。 再比如这个:比得兔开小汽车,游走在马路上,脸上的表情充满开心喜悦,全景画面。 清影绘制的兔子表情很丰富,没有出现五官扭曲的情况,前后景别还加了景深处理。 人像案例清影也拿捏住了,比如这个提示词:油画风格,美丽的少女侧颜,光透过树形成斑驳的影子,柔光落在她脸上。 整个画面光影对比鲜明,不过漏失了“油画”、“斑驳的影子”等细节。 二、实测上手有惊艳也有翻车,付费加速有些鸡肋 官方演示虽好,但清影到底好不好用,还是得自己试一下才能知道。打开清影网页端,可以看到有文生、图生视频两种功能。 ▲清影网页端 在文生视频中,我可以选择视频风格,包括卡通3D、黑白老照片、油画等;也可以选择情感氛围,包括温馨和谐、生动活泼、紧张刺激、凄凉寂寞等;运镜方式包括水平、垂直、推近、拉远四种。 在图生视频中,我可以为图片添加文字描述,如果不知道写什么也可以空着,或是让系统随机生成一个提示词。 ▲两种模式 首先我尝试了一组动物场景的提示词,第一个为:一只蓝猫在猫爬架上,正在吃主人递过来的芝士汉堡,情感氛围选择了温馨和谐。 可以看到,清影准确理解了提示词,整体效果还是很不错的。对于提示词中细节,包括猫的品种、汉堡的种类以及“递过来”的动作等,都表达得比较精准,人手也没有翻车。 第二个提示词为:一只橘猫把鼠标推下桌子,情感氛围为生动活泼。 这次清影表现得一般,鼠标上莫名其妙拴了一只小老鼠就算了,“推下桌子”的动作也是完全没有体现。 前两个提示词都属于写实场景,第三个提示词则有些“魔幻现实”:一只白猫在车里驾驶,穿过繁忙的市区街道,背景是高楼和行人,情感氛围为紧张刺激。 清影对于这个提示词的理解和呈现都还比较准确,背景中动态场景的运动幅度、一致性也比较高,但是稳定性还有所欠缺,画面会出现抖动的情况。 第二组提示词我尝试了人物场景。首先来试试经典的吃面:一个男人坐在桌边吃面条,情感氛围为凄凉寂寞。 在这个经典难题上,清影的表现还算可以,乍一看没什么错误。但细看之下,男人吃面的餐具用的是勺子,面条的形态也有些僵硬。 第二个提示词是:一个女孩坐在米色沙发上,专心地用钩针勾着一顶浅蓝色帽子,情感氛围为温馨和谐。 这条提示词中我加入了色彩的细节,清影都准确地表现了出来。女孩的钩织动作也比较真实,就是人手非常“鬼畜”。 第三个提示词为:漂亮的水色瞳孔特写,写实风格,超清,情感氛围为凄凉寂寞。 清影生成的视频基本上满足了我的预期,不过在特写镜头下,人物的皮肤和毛发都显得有些“油腻”。 最后我尝试了让清影自己生成提示词,它直接整了这么长一段:雨天的咖啡馆,以窗户为媒介拍摄一个英式咖啡馆内部,要清晰的拍摄咖啡馆内部,捕捉咖啡馆内的温馨氛围,然后变焦,对焦在雨滴拍打的窗户上。细节上,注意捕捉顾客们的交谈和笑容,以及雨水在窗户上形成的光影效果,营造出舒适而宁静的氛围。 结果很遗憾,清影自己给自己挖了个坑,生成的不能说是视频,称之为动图都有些为难。画面仅仅是平移放大了一圈,也没能体现提示词中的大部分内容。 体验完文生视频后,我又尝试了图生视频。 首先在上传图片时,清影会提醒我对图片进行裁切,且只能裁成进行固定比例的横图,这就造成了一定的局限性。上传图片之后,我输入提示词:花瓣在风中摇动。 生成效果还是比较准确的,不过这个提示词本身的难度也不算大。 接着我上传了一张静物图,这次没有输入提示词,看看清影会如何自由发挥。 这张图上有很多独立的物体,清影并没有让它们整体运动而是为每个“小团子”添加了不同动态,整体画面比较生动活泼。 第三张图我上传了一张戴着墨镜的人像,提示词为:男孩把墨镜摘下来。 这个提示词的难度很大,而且涉及到“无中生有”的部分。清影成功表现了“摘墨镜”这一动作,不过摘了是摘了,但没完全摘,墨镜还在人脸上挂着,视频后半段还出现了人体不自然的扭曲。 如果不要求它凭空生成人脸又会如何?我有上传了一张举着摄像机的人像照片,提示词改为:男孩转身面向镜头。 结果这次清影反而整了个人脸出来,就是没有眼白有些吓人……不过忽略脸的话,这次生成的效果转身幅度更大,人物的头发也随风飘动,就是他手中的器材变了个模样,人手也有些不自然。 一番体验下来,清影生成视频的效果有的惊艳到我,比如第一个小猫吃汉堡的例子,文字理解十分准确;也有的翻车严重,比如咖啡厅、橘猫的例子中,失误都比较大。 整体来看,清影在生成速度上确实比较快,虽然较宣传的30秒还有些偏差,但差不多1分钟左右就能生成视频;在运动幅度、语义理解等方面,会比较看运气,不过这也是所有视频生成工具的通病。与市面上其他公开可用的工具相比,清影在生成时长、清晰度方面还有一定的进步空间,不支持画面比例的选择也是一大遗憾。 值得一提的是,清影目前的视频生成是完全免费的,不需要会员订阅也没有数量限制。不过在排队生成的过程中,清影提醒我可以加速。点击加速的按钮,可以看到它提供了两种订阅方式:5块钱加速1天,或是199元加速1年。 ▲加速排队 该说不说,这个价格还是很实惠的,但为啥我加完速排队时间一点也没减少呢……唯一的变化就是,从“排队中”变成了“加速排队中”。可能费用太便宜了,大家都加速就相当于没加速吧(doge)。 三、自研端到端视频模型,首个API同步上线 清影基于智谱AI自研的底层模型CogVideoX打造,具有内容连贯、可控性高等特点。 在内容连贯性方面,智谱AI自研了一个高效的三维变分自编码器结构,称之为3D VAE。它能够将原视频空间压缩至2%的大小,大大减少视频扩散生成模型的训练成本和难度,再配合3D RoPE(旋转位置编码)模块,有利于在时间维度上捕捉帧间关系,建立食品中的长程依赖。 在可控性方面,智谱AI自研了一个端到端的视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述文本,从而增强模型的文本理解和指令遵循的能力,使生成视频更符合用户的输入,理解超长的复杂指令。 在模型结构上,CogVideoX采用了将文本、时间、空间三个维度全部融合起来的Transformer架构,摒弃了传统的交叉注意力(Cross-Attention)模块,将文本和视频两个不同模态的空间进行对齐,能够更好地进行模态交互。 ▲CogVideoX特点 张鹏称,在CogVideoX的研发过程中,智谱AI有一次验证了Scaling Law在视频生成方面的有效性和可靠性,未来团队会在继续扩大数据规模和模型规模的同时,寻找更具突破式创新的模型架构。 智谱AI又一次实现了对OpenAI全模型产品线的对标。 ▲智谱AI对标OpenAI全模型产品线 在算力方面,清影是在北京亦庄AI公共算力平台上训练而来的。数据层面,智谱AI与Bilibili、华策影视等进行了合作。 张鹏谈道,虽然视频生成模型才刚刚起步,但已经受到了很多产业和客户侧的需求,涉及电商产品宣传、影视特效等领域。 今天起,清影AI也同步在智谱AI大模型开放平台上线了API,企业和开发者都可以通过调用API的方式体验并使用CogVideoX的文生、图生视频能力,据称这也是国内上线的首个视频生成API。 随着清影能力的加入,智谱AI旗下的AI助手清言App在功能的全面上再下一城,覆盖对话、生图、代码、Agent和视频。 智谱AI还准备了一个One more thing——视频生视频能力。不过准确来说,这相当于是一个手动视频生视频的能力:基于智谱AI近日开源的视频理解模型CogVLM2-Video,用户可以上传视频并提取出详细的文字描述,再将文字输入清影,实现“视频生视频”的效果。 ▲视频生视频 结语:又一强力玩家入局AI视频生成 Sora发布后,AI视频生成迎来“第二春”,无论是技术、产品的迭代,还是资本市场的关注,都达到了新的高度。光是本周,就有快手宣布全球上线、爱诗科技发布第二代模型,以及今天智谱AI入局等重磅进展。(视频生成大战2.0!大厂狂卷底层模型,创企5个月吸金44亿) 不同于此前的文本、图像模型赛道,国内长期处于追逐OpenAI等海外企业进展的状态。在视频生成领域,国内的大厂、创企在短短几个月内实现弯道超车,不仅打磨出了高质量的底层模型,而且个个公开可用甚至免费,给至今仍是期货的Sora上了一课。
TCL华星China Joy掀起屏宇宙风暴,解密电竞全家桶背后硬核黑科技
作者 | 云鹏 智东西7月26日上海报道,今天上午,中国显示巨头TCL华星在China Joy上亮出了多款电竞显示器、笔记本、游戏电视及电竞手机屏幕产品,并与三星、联想、华硕、vivo等终端厂商进行了联展。 TCL华星CEO赵军在活动现场接受媒体采访时提到,当前科技发展已经基本满足了消费者对于基础功能的需求,消费者的偏好已从“性能至上”转向“体验为王”。 ▲TCL华星CEO赵军 在今天的技术主题演讲中,TCL华星MNT产品处总监Claire详细介绍了HVA“三高一快”(高对比、高曲率、高刷新、快响应)黑科技。 在TCL华星展区开馆仪式上,不少行业头部客户为“星次元登陆计划”站台,包括TCL华星CEO赵军、TCL华星副总裁刘小兰、TCL华星副总裁李志生、联想全球供应链采购高级总监杜亮、联想全球创新中心显示业务产品营销高级总监崔希波、三星IPC常务AN YOUNG-MO等。 今天下午,TCL华星与联想联合发布了共研共创的新品拯救者24.5″ FHD 280Hz电竞显示器 R25f-30。其搭载了TCL华星HVA面板,刷新率最高280Hz,支持1ms GTG的响应时间(0.5ms MPRT)。 除了联手合作伙伴发布重磅新品,TCL华星也带来了自家的多款明星产品,包括全球最大的105″ 5K超大曲面电竞屏,其曲率为R3000,支持120Hz刷新率。 TCL华星亮出的全球首款34″ MLED 165Hz R1000可变曲面屏同样吸引了不少玩家目光。电动平曲结构可通过按键和摇杆切换R1000曲率和平面模式,临场感拉满的同时缓解视觉疲劳。MiniLED背光技术加持可以让画质表现更惊艳。 TCL华星展区还展出了14″ 2.8K 印刷OLED笔电屏、98″ 4K 165Hz 巨幕Gaming电视屏、27″ 4K HFS高对比无边框电竞屏、27″ 8K 120Hz IGZO HFS电竞屏等产品。 TCL华星展台此次还设立了三星、联想独立客户联展区,AOC&飞利浦、ASUS、iQOO独立客户联展区,从电竞屏、笔电产品,到掌机、电竞手机,屏宇宙生态进一步开枝散叶。 在交流中我们了解到,近年来,TCL华星越发重视“屏宇宙”生态的建设,重视与头部产业伙伴的战略合作。 在China Joy上,TCL华星一方面展示了其在电竞生态建设上的新成果,与众多生态伙伴共同开拓的全球电竞业务纵深,另一方面也向外界传递了他们未来希望与产业同仁一起,掀起电竞视觉革命的决心。
天猫精灵合伙人创业,用AI大模型复活毛绒玩具,被“大疆教父”相中了
作者 | 程茜 编辑 | 心缘 “爸爸我能喝咖啡吗?小狗能喝咖啡吗?小猪能喝咖啡吗?外星人能喝咖啡吗……” 将高峰从这些无从回答的问题里解救出来的正是BubblePal,一个能让毛绒玩具复活的AI硬件。BubblePal是基于AIGC技术的交互式对话玩具,可以让孩子与其进行自由对话,并且对话的角色是孩子耳熟能详的动画形象。 ▲BubblePal BubblePal背后就是成立于2021年的深圳AI硬件玩家跃然创新,目前已经拿到香港科技大学前工学院院长、半导体领域知名投资人、“大疆教父”高秉强,香港科技大学教授、大疆DJI天使投资人李泽湘旗下资金的投资,同时拿到了全球最大电子教育玩具企业Vtech和国内最大玩具上市企业Alpha Group的注资,这在国内实属少见。 其创始人高峰和李勇在智能硬件领域已经深耕数年,且名头不小。 跃然创新CEO李勇曾是天猫精灵合伙人、锤子手机首任营销总监、爱奇艺智能的CMO,并实现了天猫精灵从0到3000万台的销售突破;跃然创新COO高峰作为一名连续创业者,在电商平台兴起之时,就挣到第一桶金。 ▲跃然创新CEO李勇(左)、跃然创新COO高峰(右) 高峰认为,大模型在硬件端最先落地的商业化场景将是儿童硬件。这也是他们坚持走这条路的原因。 这一定价449元的AI交互式挂件玩具将如何在AI硬件的蓝海中打出一片天地?这两位智能硬件产业的深度参与者又将如何定义当下的AI儿童硬件市场?在大模型落地风起云涌的当下,智东西与跃然创新联合创始人COO高峰进行了一场深入的对谈。 一、相识于锤子科技,创业火苗被数次“浇灭” 跃然创新的开始,离不开高峰、李勇在智能硬件领域联手打拼多年的默契。 高峰作为一名连续创业者,2014年他刚大学毕业正值电商平台崛起,高峰开始在天猫商城卖HiFi耳机,做到了行业垂直类目第二,赚到了创业的第一桶金。 ▲HiFi耳机(图源:搜狗百科) 随后作为“罗粉”,高峰关注到了同年罗永浩为锤子科技发布的一则招聘公告,当时他的面试官就是李勇,这也是这两位创业者初次见面。 彼时,李勇已经是9年的手机行业研发老将。李勇曾经在德信无线担任手机软件开发工程师,这家公司也是当时第一家在美国纳斯达克上市的国内手机研发厂商。 在锤子科技短暂交集之后,李勇选择继续辗转于互联网大厂,高峰在2016年创业热潮涌起的背景下继续创业。当时,高峰在阿里巴巴负责天猫精灵、李勇创业做电商供应链平台。创业的萌芽出现也是在这段时间出现。 高峰清楚地记得,2017年,李勇特地从杭州赶到北京,在他的办公室里第一次向高峰透露了自己的创业想法。 李勇将天猫精灵的出货量做到2000万台之时。某日,他在后台听到一个难倒天猫精灵的问题:“妈妈爱我吗?”这让他看到了一个有潜力的市场——做孩子能用的故事机或者音箱。 有多段创业经历的高峰,火速带着李勇去见了投资人,并且已经获得了投资人认可,但因为阿里内部的工作原因,李勇决定先将天猫精灵的事情做好,创业也就暂时搁置了。 2020年,高峰和李勇再度于爱奇艺智能相遇了,开始做面向儿童的智能玩具,一步步从0-1打造爱奇艺智能旗下的奇布奇布品牌。当时他们团队打造的智能词典笔和早教机,单月销量突破1000万,一年的GMV达到1亿。 ▲爱奇艺智能奇布奇布词典笔(图源:什么值得买) 随后,蓝驰创投的投资人向他们抛出了橄榄枝,李勇内心的创业火苗又被点燃,决定与高峰一起出来单干。 2021 年 8 月,他们成立的公司叫奇布奇布,后改为跃然创新。当时奇布奇布遭遇疫情变故,线下渠道受挫导致儿童硬件的业务一度停摆。直到2022年底,ChatGPT出现,他们决定重组团队、真正转型,专注于大模型与儿童硬件,2023年正式更名为跃然创新。 正如跃然创新这一公司名字一样,让玩具“如跃然纸上一样”,这一巧思也体现在了其品牌的英文名称Haivivi上,Haivivi拆开就是“嗨”的拼音以及vivid代表生动的世界。他说,人类文明的开始就是始于语言的交流,开始打招呼。 二、坚信AI能成功商业化,先用一个硬件匹配儿童交互需求 高峰谈道,跃然创新要做的就是用AI让玩具活过来。 成立之初,他们就坚定了要做AI+原生硬件,这背后高峰认为很重要的一个问题就是:“你到底相不相信AI会走到商业化那一天?” 跃然创新的答案是相信。得益于在布局天猫精灵产品时的经验,他们清楚地认识到理解式模型和生成式模型的技术路径差距,与此同时,在爱奇艺智能做儿童玩具等的经历也使得他们更清晰看到了孩子的需求,这样一来产品市场契合点(PMF)确定,他们只需要探索技术的实现路径。 高峰看到,从工作效率或者情绪价值上而言,大模型的能力都无法完全满足成人市场需求,当这一套产品逻辑放到孩子身上,就会符合。目前为3-8岁的学龄前儿童提供交互的产品几乎为0,但孩子的好奇心旺盛需要交互,并且孩子对于产品的包容性很高,因为他们的思维并没有形成严谨的判断。并且,即便大模型生成的内容有点天马行空,也不会影响孩子使用。 让大模型复活每一个毛绒玩具并不现实,据他们调研,国内每年毛绒玩具的市场体量已经达到80亿元,相比于让这些已经存在于孩子床头的玩具复活,再造一个新的AI儿童硬件会更容易。 因此,跃然创新率先切入的就是复活所有的毛绒玩具——一个交互式AI挂件BubblePal。 BubblePal的外形以及操作方式都非常简单,其由两部分组成形似蘑菇,下面的红色底座有电源键、充电口,上面的白色“蘑菇顶”负责和孩子交流。 红色底座上的绑带可以调节大小,方便孩子将BubblePal系在自己的手上,并且只需要按压上方的白色“蘑菇顶”,就可以与之交流。高峰谈道,这种按键式触发交互的方式BubblePal,能让低龄儿童也轻松使用。他还透露,他们未来也会尝试测试语音唤醒的方式。 ▲BubblePal底部 在手机端,家长可以通过App进行控制,包括浏览孩子与BubblePal的聊天记录、自定义或者选择设定的角色。 目前,家长可以直接选择设定的角色有21个,均为孩子日常生活场景中常见的设定,既有史迪奇、 佩奇、巴斯光年、喜洋洋等耳熟能详的动画角色,还有安格斯牛肉汉堡这类食物设定。家长可以根据孩子的兴趣点以及知识储备去选择不同的角色并定义不同的角色。 除此以外,App端还允许用户自己设定角色,如超级发明家、擅长逻辑推理、擅长辩论等诸多能力各异的角色,或者在选定的角色中去切换其声音,或者可以将一些特定的需求融入进他们和孩子的交流中,如家长希望孩子“不要挑食”等。 ▲直接选定精选角色(左1)、自定义角色设置(右三张) 为了让BubblePal的输出形式更符合孩子的说话或者思维方式,针对于孩子有可能询问的超脱于其年龄或者IP角色的知识范畴,跃然创新专门进行了训练,其具体的回答逻辑是,先陈述一个浅显的概念,再将其放到与所选IP相关的具体案例中加以解释,之后抛出引导性的问题,进一步激发孩子的好奇心与想象力。 高峰解释道,他们在做的事就是让大模型成为获得奥斯卡金像奖的完美演员,用户给他剧本后,这位“演员”就可以表演出来。不同的提示词就是他的人设,让其能根据孩子的特点进行回应,例如佩奇这一角色,用户可以自定义自己所需的角色特点,以情绪安抚为主。 例如在交流过程中,不同的角色会对问题作出不同的反应,如询问“什么是量子纠缠”,爱因斯坦版BubblePal就能够给出更为准确的答案,并引导孩子进一步探索这些问题与生活的关系。 如果是安格斯牛肉汉堡版BubblePal遇到这类问题,也会忠于人设,在简要回答的基础上,最终又将话题绕回了自己。 ▲爱因斯坦(左)、安格斯牛肉汉堡(右) 跃然创新采用的大模型策略是基于开源大模型解决部分问题,同时基于云端大模型应对知识类问题。 谈到未来的规划,高峰透露,他们还会搭建一个平台,将用户构建的角色汇集到一起,供所有用户选择。 与此同时,面向孩子的产品还有一大关键就是安全,为此跃然创新为BubblePal设置了安全围栏,以保证BubblePal不会传达错误的价值观、不会提供错误的信息,据高峰透露,他们的研发团队已经进行了大量测试,没有一次可以攻破安全围栏。 这背后需要平衡孩子的想象力与安全围栏防护的关系,他们既需要让安全围栏有效,又需要让其保持恰当分寸不会扼杀孩子的想象力。 三、做AI玩具需全能型人才,未来将开放AI能力 BubblePal是跃然创新首款产品,也意味着其商业化布局的关键一步。 事实上,现在市面上做AI毛绒玩具的并不少,但已经量产落地的并不多,大多产品都停留在工程化阶段很难商业化。在高峰看来,这一定程度上就是由于其缺少全链路的研发人员。 AI相关的企业中,做AI玩具硬件的技术团队专注方向往往涉及的类型更多,也就是研发人员的链条更长,需要研发人员具备嵌入式开发、芯片代码、网络传输、应用开发、后端开发等诸多能力。由于无需自研大模型,因此这类创企对大模型本身的训练依赖并不高。 因此,合适的研发团队组成正是跃然创新能快速将BubblePal商业化的原因。目前,其团队共有23人,且研发团队有多个全能人才,具备跨学科交叉能力。 基于此,跃然创新在AI毛绒玩具领域的布局慢慢展开。 跃然创新的第一款产品并没有局限于某一固定的毛绒玩具形象,高峰解释道,这是因为首先要让AI与用户的生活建立连接,需要能高效触达用户的场景。 正如前文所述,80亿元市场规模的毛绒玩具中涉及到的形象多元,通过一个可以加持到任一毛绒玩具上的交互硬件,相比于单个毛绒玩具与孩子的连接都更为高效、频繁。 面向未来,高峰谈道,跃然创新的产品主要面向C端,他们将产品迭代分为软件和硬件两个部分,软件迭代以周为单位,在产品上线发布前以天为单位,硬件层面以年为单位,软件定义硬件就可以让产品有更大的想象空间,然后在硬件层面会多为更重大的变化,如能力升级、模态变化等。他们之后还会逐步搭建B端开放平台,将AI能力开放给所有做AI玩具硬件的玩家。 AI毛绒玩具的故事刚刚开始…… 结语:4-5年,AI毛绒玩具市场爆发期来临 随着Ai Pin、Rabbit R1等AI新硬件产品在国外崭露头角,掀起大模型智能终端的新风口,大模型与硬件如何结合成为智能硬件产业关注的一个焦点。 高峰认为,大模型在硬件端最先落地的商业化场景将是儿童硬件。 一方面,大模型能力会存在输出不准确问题,需要用户对产品的使用场景包容度极高,因此首先排除了面向B端的商业化场景,其次排除了面向C端的严肃学习场景,对于儿童而言更需要情绪价值、陪伴的场景,就是比较好的应用节点。 因此,面向儿童场景,跃然创新的策略就是,先让孩子适应接触AI新事物需要,在使用过程中产生兴趣,再去做纵向产品系列的研发。 他预计,AI毛绒玩具市场爆发可能在4-5年之后爆发,这是由于他认为多模态大模型的输入输出能力成熟大概需要3年,再加上其走向商业化逐渐成熟大概需要1-2年的时间。 当下,大模型加速落地端侧,越来越多的AI PC、AI手机、AI智能眼镜以及各色的AI新硬件如雨后春笋般冒了出来。包容度更高的儿童场景或许成为未来大模型落地的一大最佳载体。
中国黑科技,占领巴黎奥运,赢麻了
作者 | 陈骏达 编辑 | 心缘 北京时间凌晨1点半,万众瞩目的2024巴黎奥运会正式开幕。 历届奥运会都是科技创新的集中展示平台,今年也不例外。中国科技尤其刷满存在感,超过11000个小时的巴黎奥运直播内容将全部通过阿里云进行全球分发,商汤、百度、联想等将AI元素引入多个奥运项目的赛前训练,vivo、iQOO等消费电子大厂给中国国家队捐赠了上千套智能终端设备,一大波中国智造黑科技已经或即将登上巴黎奥运舞台。巴黎街头的游客还拍到小米SU7电动汽车。 早在7月14日,中国科技已经在巴黎上演了一场视觉效果震撼的“赛博烟花”大秀:来自深圳龙岗高巨创新的1100架无人机编队腾空而起,结合埃菲尔铁塔造型,挂载绽放烟花,变换出多种奥运元素图案,令法国公众大饱眼福。 ▲高巨创新的1100架无人机编队在巴黎上空演出(图源:高巨创新) 值得一提的是,本届巴黎奥运是首届大规模使用AI技术的奥运会,实现了全流程、全场景的AI技术应用。AI不仅全面融入赛前训练、赛中判罚,还被用于检测兴奋剂和保护运动员免受网暴。 中国AI大模型技术全面上阵,商汤日日新5.5帮助中国国家篮球队打造AI智慧篮球产品,百度文心大模型技术辅助中国国家跳水队训练,联想AI PC为中国国家帆船帆板队提供动作分析。 在转播方面,本届奥运超过2/3的直播信号都将经过阿里云支持的奥运转播云传向世界,商汤也将在乒乓球、射箭项目中提供智能赛事转播技术。咪咕、抖音、快手、腾讯等国内视频平台都已经拿下本届奥运的转播权。中央广播电视总台是中标巴黎奥运会转播项目最多的国际媒体。 正值中法建交60周年,中国科技力量可以说给巴黎奥运送上了一份诚意十足的科技大礼包。 不仅中国智造闪耀巴黎,中国制造也包揽奥运后方,在赛事期间大显身手。“中国屏”已经遍布塞纳河两岸,河北英利奥提供了三人制篮球和乒乓球场地地胶,红双喜打造了“会变色”的彩虹乒乓球球台,双鱼体育供应了3.4万颗乒乓球,中国厂商更是大举承包了官方周边产品。 ▲巴黎奥运会乒乓球赛场“会变色”的彩虹球台(图源:新华社) 智东西整理了本次巴黎奥运会上以AI为主线的50多项国内外黑科技,让我们来一睹为快! 一、赛前训练:AI辅助训练、VR模拟接力,黑科技助攻中国代表队冲金保银 在篮球、跳水、帆船、游泳等多个比赛项目的前期备战中,AI、VR等技术为运动员的训练立了大功。中国国家自行车队此次征战奥运会的专属“战车”,亦是由中国品牌精心打造而成。 1、篮球:AI解析运动员状态与篮球轨迹 中国国家篮球队与商汤科技建立了战略合作伙伴关系,基于商汤的“日日新SenseNova5.5”大模型技术,共同打造AI智慧篮球产品。 商汤AI智慧篮球产品能通过构建场地三维模型和3D动作捕捉算法,实时解析每位运动员的运动状态和篮球的运动轨迹,助力提升运动员训练效率,同时为竞技策略提供科学依据。 ▲商汤AI智慧篮球产品可实现实时动作捕捉和分析,呈现多维度的运动表现数据(图源:商汤科技) 该产品将在奥运盛会期间全程参与中国国家篮球队的赛事征程,提供运动数据分析、竞技策略优化支持等。 2、跳水:AI辅助训练,提供精准分析 百度为中国国家跳水队开发了基于文心一言等百度大模型技术的AI辅助训练系统,能理解和执行教练和运动员的复杂指令,及时提供准确信息,还能对跳水动作实时打分、精准量化分析,提供指导。 ▲百度的跳水AI辅助训练系统(图源:百度) 奥运冠军全红婵说平时训练时会用百度AI跳水辅助训练系统来抠动作细节。奥运冠军陈芋汐也认为这套系统能帮她更好地掌握动作要领,比如打开时间和入水控制。 3、帆船:用AI PC辅助制定训练计划 中国国家帆船帆板队在训练阶段,利用联想AI PC内置的个人智能体“小天”,辅助运动员制定专属训练计划。还能将训练过程中拍摄的视频利用联想AI PC进行肢体动作和运动轨迹分析。 4、游泳:AI辅助姿态分析,VR模拟赛场环境 为了备战巴黎奥运,美国国家游泳队与一家澳大利亚的AI运动技术公司Gerford AI展开深度合作,利用AI和计算机视觉技术辅助训练。这些技术将自动跟踪和分析游泳运动员的姿态,还会记录划水频率等其他关键指标,并为教练和工作人员提供实时可操作的数据。 ▲Gerford AI为美国国家游泳队提供的AI训练系统(图源:Gerford AI) VR技术带来的沉浸式体验能帮助运动员便捷的模拟赛场环境。澳大利亚的游泳运动员们使用VR设备分析队友的状态,理解何时才是入水的最佳时机,成功显著缩短了游泳接力赛中交棒的时间。 5、自行车:最轻“战车”征战,打破国外器材垄断 中国国家自行车队出征巴黎奥运会的“战车”是瑞豹T24场地车,由中国体育器材生产厂商泰山体育旗下山东泰山瑞豹复合材料有限公司生产。 整车使用航空级纳米碳纤维材质打造,仅重6.9千克,车架仅重1.15千克,在全球同级产品中做到最轻,是首个打破国外器材垄断登上奥运会自行车竞赛舞台的中国品牌。 6、后勤组:手机大厂捐赠智能设备,用AI技术选拔“潜力股” vivo、iQOO等国内消费电子企业向巴黎奥运会中国国家队捐赠了上千套智能终端设备,包括智能手机、平板电脑、智能手表和无线耳机等,以支持国家队的通讯和数据安全需求。 英特尔则与国际奥委会展开合作,前往塞内加尔用AI技术分析了1000多名年轻人的运动潜能,最终确定了48名表现出色的选手。这48位选手目前已经被纳入塞内加尔国家奥委会的青训计划中。 ▲英特尔在塞内加尔的人才识别计划(图源:英特尔) 二、现场观赛:绿色奥运用科技节能减排,电动汽车与AI顾及残障人群需求 巴黎奥运会现场不仅为观众和工作人员准备了电动自行车、电动汽车,而且利用数字孪生系统,为高效的现场人流管控工作提供支持,全面保障现场观众的观赛体验。 1、出行:电动车含量高,开放共享汽车服务 巴黎奥运会期间将投放15000辆电助力自行车,这些车辆来自中国的九号电动车。此外,丰田为本届奥运会提供了超过2650辆电动汽车和700个残障人士“最后一英里”解决方案,为巴黎奥运绿色出行做出贡献。 ▲丰田为巴黎奥运会提供的4款出行解决方案(图源:IOC) 丰田组建的车队中包含250辆低速、短途的无障碍电动汽车(图左下角)和500辆由氢燃料电池驱动的汽车Mirai(图左上角)。奥运会结束后,这500辆氢能汽车将加入巴黎的氢能出租车队伍。 此外,丰田还为巴黎奥运的工作人员们开放了KINTO Share汽车共享服务,只需在手机App上提交用车需求,便能很快坐上共享汽车(图右下角)。 英特尔利用AI技术构建了美国队位于巴黎的训练中心和国际残奥委会在德国波恩的总部的3D模型,让视障人士能通过手机应用进行室内语音导航。 ▲视障人士使用手机应用进行导航(图源:英特尔) 2、控流:数字孪生优化人流管控,实时更新安全状况 为践行绿色奥运的理念,本届奥运会95%的比赛场馆都是由原有旧场馆改造而来,或是在巴黎的地标建筑旁临时搭建的,但这对场馆的应急管理能力提出了较高的要求。 ▲埃菲尔铁塔下的临时沙排比赛场地(图源:IOC) 为提前规划场馆运营工作和模拟可能出现的意外情况,巴黎奥组委与一家英国活动规划企业OnePlan共同构建了本届奥运会所有场馆的数字孪生(Digital Twin)系统VenueTwin。 ▲OnePlan为巴黎奥运会提供的VenueTwin系统(图源:OnePlan) 比赛组织者可以通过这一系统模拟不同的天气、人流量状况,提前优化活动组织工作。奥运转播商可以利用系统远程尝试不同的机位,提前确定最适合的拍摄位置。运动员和志愿者则可以在虚拟世界中提前感受赛场的氛围,在比赛开始前做好心理准备。 该系统将成为奥运会工作人员的协作平台,能实现安全状况实时更新、可视化工作人员调配、规划人流管控工作等功能。 三、远程观赛:云计算代替卫星,大模型后方辅助 除了现场观众外,奥运会也要照顾到全球远程观众的观赛体验。而流畅稳定的赛事直播,离不开大量前沿科技的加持。 在巴黎奥运会上,云计算替代卫星成为奥运赛事直播的主要方式,专用5G网络基建带来了高速稳定的网络服务,智能手机也参与到转播之中,AI为高效转播捕捉精彩瞬间提供相当好用的功能,多个AI大模型上阵帮助全球人民了解奥运赛事信息。 1、通信:搭建专属5G网络,云计算代替卫星 本届巴黎奥运会的开幕式将在塞纳河上举办,对直播工作提出了很大的挑战。在5G时代之前,如果需要进行超高清的直播,必须依赖线缆传输。而塞纳河区域长达6公里,用传统线缆传输的成本和难度都很高。 ▲巴黎奥运会开幕式渲染图(图源:IOC) 为了满足开幕式直播需求,法国最大电信运营商Orange和英特尔合作,在塞纳河畔和本届奥运的主要场馆搭建了专用5G网络,为直播工作提供高速、稳定、低延迟的网络服务和超高的安全性。 ▲Orange和英特尔合作在塞纳河畔建设的5G基站(图源:BBC) 英特尔为本届奥运会提供了端到端的8K直播体验。英特尔的至强可扩展处理器和AI Deep Learning Boost技术只需几毫秒,就可以按照8K分辨率编码和压缩奥林匹克广播服务公司(OBS)提供的直播信号。 超过2/3的奥运直播信号将通过阿里云支撑的奥运转播云,从巴黎传输到全球各地。传统的卫星直播需要提前建设大量临时转播设施,不仅成本高昂,还将带来大量的能耗。 在直播信号上云后,巴黎奥运会的国际转播中心比东京奥运会缩小了13%,而电力使用更是减少了44%。国际奥委会主席巴赫称,阿里的AI技术将巴黎奥运转播带到了新高度。 ▲国际奥委会技术能源部副部长在阿里云位于巴黎国际转播中心的展台(图源:阿里云) 2、设备:智能手机乘船直播,中国巨屏扎堆塞纳河畔 三星也参与了开幕式的直播工作。开幕式上的85艘船只将安装超过200部三星Galaxy S24 Ultra手机,用于拍摄开幕式中的HDR画面,然后通过Orange的专用5G网络进行直播画面传输。 ▲巴黎奥运会开幕式船只上的三星设备(图源:三星) 直播看得爽,怎么缺得了高清大屏?塞纳河畔安设了80多个巨型屏幕,其中大多数都来自中国科技公司。深圳的艾比森将为赛事提供超过50块大屏,洲明科技为5大智慧场馆和开幕式提供超过2600平米的LED显示屏及配套解决方案。 3、转播:直播内容通过阿里云全球分发 巴黎奥运会预计将产出11000多个小时的直播内容,全部会通过阿里云进行全球分发,内容产出量比东京奥运会增长约两成。阿里还支持了面向全球媒体的OBS Content+平台,可以在直播流分发过程中实时剪辑视频,并增加了竖屏视频功能。 阿里云将在奥运会期间提供高自由度回放“子弹时间”,应用于七人制橄榄球、羽毛球、田径、篮球、沙滩排球、乒乓球、摔跤、网球、柔道、霹雳舞、BMX自由式和滑板等赛事的转播中。 通过高速摄像机阵列与先进的云计算技术,该技术将在比赛中实时捕捉的精彩瞬间在云端进行重建,并从多个角度进行回放。 ▲云上AI多镜头回放(图源:阿里云) 来自商汤科技的智慧赛事转播技术将用于本届奥运会乒乓球、射箭两个项目的全程赛事转播,为观众提供沉浸式观赛体验。这项技术能在完全无穿戴设备的情况下,利用3D无感知动作捕捉技术实现多人、大范围、多角度的场景覆盖,实时获得空间运动姿态信息。 ▲商汤的AI智慧赛事转播可实现旋转速度、方向可视化、运动轨迹描述、击球落点显示等功能(图源:商汤科技) 本届奥运会中,乒乓球的落点、转速转向和箭矢的飞行轨迹,都将通过AR的方式呈现给屏幕前的观众。 OBS基于英特尔Geti平台训练了AI自动生成精彩片段功能,可减轻现场编导人员的压力,并为全球观众提供更丰富的视频内容。 4、资讯:大模型上阵,提供即时赛事信息 谷歌近期宣布了与美国队和NBC环球的合作,他们将在NBC环球的奥运转播中融入谷歌搜索AI概述(AI Overview)功能。解说员们会利用AI概述为屏幕前的观众提供赛事信息。 NBC环球的知名主播、喜剧演员莱斯利·琼斯(Leslie Jones)则会使用谷歌的大模型Gemini了解巴黎奥运会的实时动态,并学习新运动。在国内,阿里在通义App上推出了“赛事百事通”等服务。 四、赛中判罚:AI辅助检测兴奋剂,足球植入智能芯片 在本届奥运会男足揭幕战上,阿根廷队在比赛最后一刻踢进的绝平进球引发了球场的骚乱,导致场馆清场、比赛长时间暂停,这一进球在视频助理裁判(VAR)复核后因球员越位被取消。在刚刚结束不久的德国欧洲杯上,也有不少球员的进球因“厘米级”、甚至“毫米级”越位而被取消。 这些决策背后的“火眼金睛”是半自动越位技术。今年巴黎奥运会采用的这项技术,将利用基于摄像头的光学骨架跟踪系统来准确地判断球员位置。 ▲半自动越位技术示意图(图源:FIFA) 同时,为了提高视频助理裁判(VAR)的判罚精度和速度,本届奥运会的足球内胆中配有芯片,每秒钟能记录至多达500次的触球。这个内胆产自江苏淮安的顶碁运动用品。 瑞士高端钟表制造商欧米茄(OMEGA)从1932年开始就为奥运会提供计时服务。本届奥运会上,欧米茄将采用基于单个或多个摄像头的计算机视觉技术系统,并配备针对具体运动项目专门训练的AI模型。 ▲欧米茄为奥运会提供的摄像机(图源:OMEGA) 在跳水比赛中,这一系统将全程追踪运动员的位置,并生成3D图像及入水速度等数据,部分数据将被直接用于比赛的判罚。该系统还将被运用在撑竿跳、网球、体操等项目中,为裁判员们提供之前无法获取的重要数据。 ▲欧米茄提供的计算机视觉系统在跳水比赛中的应用(图源:OMEGA) 此外,欧米茄为本届奥运提供了全球分辨率最高的终点摄像机,能在终点线上每秒捕捉多达40000张图像。捕捉的画面最终将决定本届奥运会上田径和场地自行车的官方成绩。 ▲技术进步使更精确的计时成为可能(图源:OMEGA) 富士通公司计划在巴黎奥运会上使用裁判支持系统(JSS)。这一系统使用骨骼识别技术取代3D传感器,捕捉体操运动员的动作,并将其分析为数值数据,从而帮助裁判准确判定体操比赛中肉眼难以确定的技术要素,如脚的指向、劈叉是否达到180度等。 但出于对技术可靠性的忧虑和兼顾体操判罚中艺术性的需求,国际体操联合会目前仍然限制了JSS系统的适用项目和使用场景。 柔道、摔跤项目的运动垫都来自泰山体育,采用纳米防污抗菌涂层,不易积聚微生物,而且首次使用智能芯片与柔性压电薄膜技术,可实时采集运动员力量、速度及区域信息。 在巴黎奥运会期间,世界反兴奋剂组织(WADA)还利用AI技术提升反兴奋剂检测技术的效果。目前,WADA可以通过AI模型预测比赛结果,并与比赛实际结果的交叉对比,从而更高效地进行兴奋剂测试工作。 ▲WADA给巴黎奥运会的运动员提供了各种反兴奋剂教育课程(图源:WADA) 五、赛中安保:机器狗排爆,AI防网暴 本届巴黎奥运会的安保措施对法国来说空前严格,因此法国政府不得不修改法律,允许进行部分安保和监视措施,法国政府还将首次使用AI技术进行奥运会安保工作。 在修改后的法律支持下,法国政府已经在戛纳电影节等大型活动上试用了AI监控技术。由于法律并不允许法国政府收集面部识别信息,因此这一监控技术只会用AI标记人群规模、潜在的武器使用、烟雾、火焰、无主背包等不涉及具体个人信息的内容,并提醒安保人员处理这些问题。 法国科技公司Evotech为安保人员提供了数台机器狗,帮助排爆人员检查比赛场地的安全性。这些机器狗能爬楼梯,越过沟渠,还可以在汽车下方进行搜寻,确定是否有可疑爆炸物。 ▲Evotech的机器狗曾在环法自行车赛上部署(图源:Evotech) 国际奥委会也注意到了针对运动员的网络暴力问题,将用AI系统监控主要社媒平台上的数千个账户。任何被识别为网络暴力的评论都将被标记出来,交由平台处理,以保护运动员免受网络暴力的伤害。 ▲国际奥委会使用AI系统防止网络暴力(图源:IOC) 六、赛中后勤:节能减排,绿色可持续 电力消耗是奥运会碳排放的主要来源之一,此类大型体育活动往往会采用柴油发电机进行供电。但本届巴黎奥运会中的所有临时场馆将接入电网,风能、太阳能发电站被用来取代柴油发电机。 国际奥委会还将阿里云的能耗宝(Energy Expert)部署到全部35个比赛场馆中。能耗宝可以将场馆的电力消耗、应急电力需求、场馆容量、比赛资讯和现场天气状况整合到一起,并基于云端数据及阿里云的深度学习AI模型,提供更准确的分析,并为场馆内的特定区域生成关于电力的预测和建议。 ▲阿里云能耗宝系统界面(图源:阿里云) 材料上也尽可能实现绿色可回收。例如,田径赛场跑道采用紫色调,除了配色美观外,跑道制造商蒙多(Mondo)还优先选择了天然材料,跑道中可回收材料占比达50%。 ▲巴黎奥运会场馆中的紫色跑道(图源:IOC) 来自中国河北的英利奥使用可循环橡胶材料,为巴黎奥运会提供了绿色环保、低碳可回收的三人制篮球和乒乓球场地地胶。 ▲三人制篮球场地已经铺设完毕(图源:石家庄发布) 此外,在法兰西体育场、PSG A王子公园球场、CO’Met体育馆、贝尔西体育馆、球迷观赛区、开幕式粉丝活动区、市政厅广场、国际奥委会加拿大和英国临时办公点等奥运场馆、活动、交通要塞的核心区域,都将应用“中国屏”提供赛事服务、信息发布及广告展示等。 结语:奥运会引领AI转型,AI+体育潜力巨大 巴黎奥运上的黑科技远不止于此,阿里云将修复和上色100年前上届巴黎奥运的珍贵影像,而耐克则会利用AI改进运动员的跑鞋设计。 根据市场研究机构Mordor Intelligence的测算,2024年AI+体育的市场规模大约为60亿美元。而到2029年,这一市场的规模预计将增长至210亿美元,复合年均增长率约为28.69%。 国际奥委会也注意到,虽然体育界已经自发地进行面向AI技术的转型,但仍缺乏统一的治理和监督框架。本届巴黎奥运会在国际奥委会《奥林匹克AI议程》的指导下,开启了一系列极具创新型和指导意义的技术实践,这或将给AI+体育的未来开启新的可能。
华为游戏本闪现ChinaJoy2024:疑似命名GT,外观带LOGO灯
IT之家 7 月 26 日消息,中国国际数码互动娱乐展览会(ChinaJoy)今日开幕。在本届 ChinaJoy 现场,华为一款尚未发布的 PC 新品在腾讯游戏展台闪现亮相。 根据现场曝光的产品照片,华为这款尚未发布的笔记本新品采用了全新的 ID 设计语言,最显著的变化是本代模具的 LOGO 应用了发光设计,且整机在散热方面采用了后直出风设计。这些往常在游戏本中才拥有的设计元素,首次应用在以轻薄本为主线的华为笔记本当中,或将预示着该产品将拥有更为强劲的性能表现。 此外,笔记本的底部和包装盒上还印有显眼的“GT”标识,大概率这款华为笔记本新品将以“GT”命名。在华为各产业的过往产品序列里,已经推出过 GT 手表、GT 显示器等产品,一直都是高性能作为显著的卖点。这也意味着华为这款新笔记本大概率会是以 GT 命名,且较过往的华为 PC 产品具备更强的性能表现。 值得一提的是,这款笔记本新品不仅是华为 PC 在 ChinaJoy 现场首次亮相,而且在曝光的产品照片中还有一张照片,笔记本的屏幕画面正是游戏画面。基于这些信息,IT之家分析,这应该是华为即将发布的首款高性能游戏本,此次华为新品笔记本亮相展会的动作,也可以视为是华为正式进军游戏笔记本领域的提前预热。 此前有消息称,华为将于 8 月初举办全场景发布会,而且华为已宣布将于 8 月 6 日正式发布享界 S9,不排除华为这款高性能笔记本将于 8 月 6 日同步发布。
极空间私有云“监控中心”功能上线:最多支持8路摄像头,数据本地存储
IT之家 7 月 26 日消息,极空间私有云宣布【监控中心】功能上线,通过支持 Onvif 协议的摄像头,极空间【监控中心】提供了实时观看和录制视频回放的功能,所有视频数据均存储在本地。 据介绍,ARM 平台极空间设备(老 Z2 除外)提供了 4 路摄像头支持,Z4 和 Z4S 提供了 6 路摄像头支持,Z4Pro 和 Z423 提供了 8 路摄像头支持。 兼容性方面,官方称“符合 Onvif 标准的摄像头几乎都支持”,包括海康 HIKVISION、普联 TP-LINK、水星 MERCURY、大华 dahua、宇视科技 uniview 等。 IT之家附添加摄像头教程: 让摄像头处于正常工作状态,并开启 Onvif 功能,然后在电脑 / Web 端添加摄像头了,点击添加摄像头按钮。 进入添加窗口就会自动搜索局域网内的摄像头,如果搜索不到也可以手动添加对应的摄像头。勾选需要添加的摄像头。 添加完的摄像头,可以改名,然后需要输入摄像头 Onvif 账号的用户名密码,点击测试进行验证;如果添加多只摄像头,可以勾选“下个摄像头使用相同配置”,系统将会自动使用上个摄像头的用户名和密码。 这步选择录像存储位置,会在对应存储池生成监控中心的文件夹,存放录像。请注意,开启录像后所有硬盘无法休眠。 点击完成就可以在监控中心查看对应摄像头了,手机端也可以看到添加号的摄像头,如果需要子账户也能查看,可以在监控权限中调整对应权限。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。