EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
多家自媒体被投资方要求回购、还投资款
据报道,近期,深圳市创新投资集团有限公司(下称深创投)密集向被投企业发起回购诉讼采购招标。据澎湃新闻报道,此次系深创投少数项目通过司法途径主张回购,主要因基金经营期限到期需退出。 其实投资机构起诉被投企业这种事如今早就不算新鲜事,而且似乎呈愈演愈烈之势。甚至连一些自媒体都被要求回购、还投资款了。‍‍‍‍‍‍‍‍‍ 深创投密集发布几十起诉讼法律服务采购招标邀请函 据天眼查,自2019年至今,深创投共发布了51余条诉讼法律服务采购招标邀请函;其中,仅2023年一年就达29条,2024年至今也有19条。 三言逐一整理发现,上述这51条法律服务采购招标邀请函中,2023年到2024年的48条全部是有关起诉被投企业的;而剩余的3条并不涉及起诉被投企业。 也就是说,2023年起,深创投开始密集起诉被投企业。 当然, 需要说明的是诉讼法律服务采购招标公告并不意味着已经实际发生诉讼,但是却也能说明深创投有意通过法律手段维护自身权益。 那么,这四十多起诉讼,或者说潜在诉讼都是什么缘由呢? 三言注意到,深创投发起的这40多条中,全部都是被投方触发了回购条款,但未能履行回购义务;不过,并非每一条都有明确写明回购条款具体细节,所以三言将标明了具体缘由的其中19条整理如下: 可以看出,绝大多数被投方是因为未能如约实现公司上市而触发了回购条款;此外,被投企业发展不好、经营出现问题也是触发回购条款的因素之一。 值得注意的是,在深创投这份“起诉名单”中,一家被投企业创始人出现不可调和矛盾、另一家企业创始人出现重大违法违规行为,也都使得投资方要求履行回购义务。 另一方面,三言注意到深创投起诉或者准备起诉的这些被投企业中,大部分是在2017年前后发起投资,少量在2013年左右,也有小部分投资是在2021年前后发生。 平均来看,深创投在2017年前后大量投资,然后到如今退出困难于是发起回购。不过,深创投方面也并不是被投方未能在指定时间实现经营目标就立刻起诉,平均下来也有一两年的缓冲期才会发起起诉。 值得注意的是,有两家被投方因未能如约上市,被要求按“本金+利息”的形式回购。其中一起是2018年,深创投向REGWL公司投资1300万元,截至目前剩余未回购部分本金639万元,连利本带息还有900余万元未还清;另一起是2011年,深创投向CQJQ公司投资4728万元,目前剩余未回购本金3950万元,加上多年利息成本共计将近6000万余元。 但即使如此对于失败的创业者来说,还款压力还是会如同滚雪球一般越滚越大,恐怕会越来越难还清。 回购不是“稀罕”事,连自媒体都被条款约束‍‍,家自媒体被要求还投资款‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍ 近一年拟密集发起起诉,深创投的行为看上去出乎意料,但实际上早已是当前投资圈的“常态”。甚至现在连做自媒体拿投资都要签“对赌协议”。 笔者近期还获悉有几家“自媒体”也被要求回购、还投资款了。当然,现在的自媒体多以公司为主体,也算是公司化运营。 自媒体A在业界较为知名,因为早年纸媒的采访经历,与众多大佬结下情义,其中包括一些投资界大佬。 当他出来创业后,获得了一位投资大佬的支持,大佬的公司投了一笔钱。这位大佬的投资公司早些年很知名,近年来投的项目不多,声量也小了很多。 与其他创业公司投资协议不同的是,他们的投资协议没有对赌条款,更像是大佬的倾囊相助,江湖味更重,像兄弟间的扶持,并不看投资回报。 但在今年初,大佬公司突然要求A把投资款还回去。 不过A这两年收入也下滑了,投资款还回去存在困难。双方就这么胶着着,A准备把10个人的团队砍掉一半。‍‍ 那么,如果大佬公司起诉A,以什么理由?会判决把投资款还回去吗? 另一家B也是内容创业,今年公司勉强维持,同很多自媒体一样,也有要账难的问题,但他们遇到一个问题:投资人要求回购。 具体情况是,当初接那笔投资的时候,协议上有对赌条款,达不到某个条件,要连本带利还钱。 因为有协议,打官司大概率会输,B只能想办法拓宽业务,一边维持公司运营,一边还投资人款。 这是另一种投资,有种“民间借贷”的感觉。 早期的风险投资,投资人自担风险,创业者失败了,投资款不用还给投资人,但是近些年,风险投资越来越附加创始人连带责任,加上了约束条款,比如一些风险投资设置了“多久没有上市,每年付10%利息”的条款,创投关系变成了借贷关系。 一位投资人对三言科技表示,如果他们这些年给人家投资方分红,够本金了,也好说;但投资人没参与经营,没给投资人分红,就该还人家钱的。要求还本金+利息也正常。 缺少更多退出机制‍‍‍‍ 创业者因为这种无限连带责任最终不仅创业失败,还可能导致变成“老赖”,使得很多人有苦难言,吐槽称如今没有“风投”,以为风险都被转嫁给创业者了,投资者可以说“稳赚不赔”。 去年底笔者就和一位投资机构的退出负责人就此事聊过,一般基金投后7年左右就到了退出期,2015年前后市场火热,大量基金投了多种赛道。 如今从深创投的起诉内容上看,确实符合这个说法,很多投资都发生在2017年左右,7、8年过后恰好迎来退出期。 但是站在投资人角度,他们也并不是“坐享其成”。从今天深创投这些案例可以看到,投资人某种角度上像被投方的“家长”。要全面监督、帮助被投方妥善经营,就连公司创始人闹矛盾也要“掺一手”。 但是,用回购条款或者起诉的方式多少不那么“体面”。很多创业者很努力也不一定成功,却可能因回购条款背负巨额债务。 这归根到底依然是缺乏退出机制的问题。还是那句老生常谈的话,创业有风险,行事要谨慎。
淘天大改,阿里能有点“盼头”吗?
近期阿里密集宣布了几个较为重磅的规则调整,对公司有着不小的影响,值得关注。海豚投研先精炼下几个调整的主要内容: ① 淘天包括淘宝和天猫在内的所有商家收取订单成交额 0.6% 的 “基础软件服务费”;同时于 9 月起,取消仅对天猫商家收取的分 3 万、6 万两档的年费,而已支付的 24 年年费将退还(具体细则见下文分析。) 按照阿里的这个说法,这次的这个收费主要是用来覆盖支付、ISV 独立软件供应商,以及云厂商等合作伙伴的软件服务成本。如果作为参照的话,拼多多最开始上市时所谓交易手续费(transciton service)主要就是这个支付通道费。 ② 调整流量分配的核心依据指标—“体验分”:新体验分体系包括 “店铺体验分”、“商品体验分(PXI)”,将全面替代此前的 DSR(即淘宝此前的卖家服务评价体系)。体验分体系不仅将全面应用在手淘搜索、猜你喜欢、阿里妈妈相关广告投放、活动报名等店铺经营场景,还将为商家提供退款、申诉、发货异常等售后场景下的更多处置自主权。 ③ 随着 “体验分” 的推出,淘天近期推广的 “仅退款服务”,对店铺体验分超 4.8 分的商家会进行 “松绑”,是否接受 “仅退款” 由达标的商家自行决定,平台不会主动介入支持消费者的 “仅退款” 请求。对其他分段的商家,平台将依据体验分与行业性质,分别给予不同程度的自主处置权。体验分越高,商家处置权越大。 那么以上几个举措对淘天、消费者和商家而言会产生什么样和多大的影响?以下海豚君尝试理解一下: 可以看到,阿里这次公布的一连串变动可归为两类,第一点围绕淘天对商家收费规则变化,影响的即平台的变现率(也是商家的成本),第二点则是围绕消费者体验和流量分配机制的变化。 调整对阿里的收入、利润影响多大 对第一点收费规则的影响,收费和减免同时进行,海豚君这里尝试定量测算一下实际效果: 先看减免部分:对中小商家,收到货款每年不高于 12 万元的,基础软件服务费会被返还 100% 现金;对腰部商家,确收成交金额在 12 万 - 100 万的,将获得基础软件服务费 50% 等额的广告投放优惠券;对高客单和批发等商家,在 2024 年 9 月 1 日 - 12 月 31 日期间,电脑、手机、冰箱、珠宝等 100 多个品类的商品订单,实行单笔最高 60 元封顶的收费标准。 而这些减免措施整体减免和返还的费用有数十亿元,覆盖商家超 500 万。我们取中假设总减免额度为 50 亿。不过,从口吻上似乎除了第一条对中小商家的减免外,后面两条对腰部以上商家的减免后续的实际效果以及持续性是个未知数。 同时,由于天猫不再针对商家收取 3 万和 6 万两档的年费,也需将这部原有的收入扣除。由于官方不公布准确的商户数量,海豚投研了解到天猫的商家总数大约在数十万的量级,我结合网上消息假设为 50 万。此外本次完全取消前,天猫商家的年费先前也有减免的情况(具体可见《天猫 2024 年度各类目年费类目软件服务费一览表》),我们粗略假设实际收取的比例在 50%。那么免除的天猫商家年费= 50 万商家 * 平均 4.5 万年费 * 50% 的缴费率 = 113 亿。 再看,此次变化的收费部分:此次 0.6% 的技术服务费对所有淘宝和天猫商家适用,但规则强调了仅对已确认收货了的订单才收取(和是否退货退款无关)。 出于谨慎和计算的简便,我们粗略按今年淘天国内 GMV 总额为 8 万亿人民币,其中消费者确认了收货的订单占比(无论后续是否退货)占比为 60%,那么 8 万亿 * 60% * 0.6% = 288 亿新增收费。 结合以上收、减两部分,按 288 – 50 -113 = 125 亿,再考虑到我们的假设有误差,大致推算本次规则变动后,淘天新增的收入大约在大几十亿 ~ 百亿出头之间。 那么这部分新增收入到底有多少可以转化为增量利润,这里还涉及到支付宝同步发布的一些信息: 在对应淘天新宣布的 “基础服务费”,原本支付宝针对用户用信用卡支付向商家收取的支付服务费也不再收取了。 结合海豚君的一些调研,对于这两家渊源深厚的公司一收一撤,海豚君的理解更多是理顺收费关系: 商家主要只与阿里这个电商平台产生关系,而无论是支付、云还是其他软件服务,都算是阿里提供这些服务的上游供应商。 阿里收到这个基础技术服务费之后,这些上游供应商就变成了它提供服务的成本项。当然从收费上,阿里收费是针对淘天发生支付行为的全部 GMV 来收费,而不单单是贷记卡支付的那部分 GMV。 而淘天收到这个费用之后,需要向包括支付宝在内的支付提供商结算成本,当然由于淘天对支付宝来说是绝对大客户,在结算上游费用中有绝对议价权。 海豚君这里粗略假设:这些增量收入当中,阿里需要大约将大约 50% 上下,以成本向支付宝等供应商付费的方式付出去,那么能够完全转化为阿里利润的部分大概也就是几十亿,对淘天也就是额外新增大约 3% 的利润。 弱化 “性价比”,“消费者” 和 “商家间” 的天平再平衡? 实际早几天前有已有报道声称,淘天在内部已开始弱化对绝对价格力的重视,转而更强调 GMV 和 ACC 等指标而非订单量。流量分配逻辑也不再过于强调价格力的因素。此次将流量分配的主要参考指标调整为 “服务分” 和新增 “技术服务费”,一定程度是验证了之前弱化价格力的传言。同时,抖音近期也宣布将弱化对低价产品的强调,同样转向以 GMV 为第一优先级的指标。 我们认为,无论是阿里或是抖音从低价优先向 GMV 优先的回归,一方面公司出于对股东和资本市场的负责,边际回归更有利于财报业绩的打法(做低价对订单数和用户数有利,但中短期内是不利于营收和利润的)。 另一个或许更重要的原因是,淘天和抖音本就都是以品牌商家见长,过分倾向于消费者(如仅退款等),和过分强调低价、给中小商家流量倾斜,一定程度上是损坏了两个平台核心品牌商家利益的。此次调整属于将先前过分倾斜向消费者和中小商家的天平,相回回调的举措。毕竟过于倾斜的天平显然不能长期维持。 反映到业绩上,这次的再平衡中短期内显然也是会利好淘天营收和利润的增长。
中国发布全球首个亿级参数量地震波大模型“谛听”
IT之家 7 月 29 日消息,由成都市科学技术局、成都市经济和信息化局市新经济发展委员会指导,国家超级计算成都中心、中国地震局地球物理研究所主办的“谛听大模型发布会”昨日成都顺利举行。 会上,“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆识别等关键技术方面迈出了坚实一步。 该大模型由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。 ▲ 图源:国家超算成都中心 在大模型展示环节,来自清华大学自动化系的助理研究员刘畅老师从超算平台对接、地震数据适配、算法参数调优、模型规模放大四方面介绍了大模型研发的经历。 中国科学院地质与地球物理研究所的肖卓伟博士现场演示了大模型用于前震识别和预警的示例、中国地震局地球物理研究所的副研究员赵明老师介绍了大模型在余震识别的应用与前景。 中国地震局地球物理研究所副所长陈石介绍称,“谛听”大模型依托中国地震观测网的海量数据,通过先进的人工智能技术,已经显著提升了地震信号的识别准确率和速度。 短期来看,“谛听”地震波大模型将应用于地震信号识别、地震活动监测、大地震快速响应等领域。长期来看,地震学是一门观测科学,重大的突破往往来自对观测数据的深刻理解。目前,传统方法和中小模型均无法充分利用 TB、PB 级别的地震观测数据,而这些数据蕴含许多重要的地震学问题,因此,“谛听”地震波大模型有望长期为地震科学研究带来重大突破。 据介绍,“谛听”数据集是国内首个,同时也是目前国内外最大规模、样本类型和标注最为全面的地震学专业 AI 训练数据集之一。 IT之家从官方获悉,目前该模型已可投入使用,同时十亿参数量级的版本预计 2024 年 8 月完成预训练,进一步为新时代防震减灾事业现代化提供科技支撑。 未来,该模型的应用场景还可用于矿震监测、页岩气开采、城市地下空间结构探测、海底地震监测等多个领域。
瑞幸回应酱香拿铁下架:自然消耗下市、没有制作配料就不再卖
快科技7月29日消息,据媒体报道,网络上流传着瑞幸咖啡与贵州茅台携手打造的酱香拿铁或将面临下架的传闻。 针对这一热议话题,瑞幸咖啡官方客服于近日正式回应,确认自2024年7月2日起,该饮品将在全国部分城市因自然消耗原因逐渐退出市场,即当库存原料用尽后,将不再继续制作与销售。 当前,通过瑞幸咖啡小程序观察,这一变化尚未全面铺开,部分城市门店的酱香拿铁依旧可供顾客正常下单享用。然而,在河南、湖南、陕西等省份的某些城市,已有门店显示该饮品售罄,预示着下架进程的逐步推进。 回顾往昔,酱香拿铁自2023年9月初惊艳上市以来,便以其独特的创意与卓越的品质赢得了市场的热烈反响。其定价为38元/杯,优惠期间更是低至19元/杯,亲民的价格策略进一步激发了消费者的购买热情。 上市首日,酱香拿铁便创下了单日销量突破542万杯、销售额过亿元的辉煌战绩,不仅刷新了瑞幸咖啡单品的销售记录,更在业界内外引起了广泛关注。 值得一提的是,酱香拿铁特别采用了融入53%vol贵州茅台酒的白酒风味厚奶,赋予了饮品独特的酱香风味,同时确保了酒精含量低于0.5%vol,既满足了消费者的味蕾享受,又兼顾了安全性。然而,鉴于其含有微量酒精,瑞幸咖啡也温馨提醒未成年人、孕妇、驾驶人员及酒精过敏者谨慎选择,避免饮用。
训练一次经历419次意外故障!英伟达GPU差点玩不转405B模型,全靠Meta工程师救场
原标题:训练一次经历 419 次意外故障!英伟达 GPU 也差点玩不转 405B 模型,全靠 Meta 工程师后天救场! 最近,Meta 在一份研究报告中揭示了训练 Llama 3 405B 参数模型的重大挑战:该系统在包含 16384 个 Nvidia H100 GPU 的集群上运行,在训练期间平均每三个小时就发生一次故障, 54 天内经历了 419 次意外故障。 这些故障中,有一半以上的情况都归因于 GPU 及其高带宽内存 (HBM3)。由于 GPU 训练任务的规模庞大和高度同步,Llama 3 很容易发生故障,且单个 GPU 故障就会中断整个训练过程,导致必须重新启动。 不过,据介绍,尽管存在这些问题,Llama 3 团队仍在支持自动化集群维护(例如固件和 Linux 内核升级)的同时,实现了超过 90% 的有效训练时间(有效训练时间是指实际用于有用训练的时间与经过时间的比例)。 正如一句古老的超级计算谚语所言,“大规模系统唯一可以确定的就是失败。”超级计算机是极其复杂的设备,使用数万个处理器、数十万个其他芯片和数百英里长的电缆。在复杂的超级计算机中,每隔几个小时出现故障是很正常的,而开发人员的主要诀窍就是确保系统在出现这种局部故障时仍能正常运行。 58.7% 意外中断源于 GPU,三起事件需要显著人工干预 据悉,在为期 54 天的预训练中,共有 466 次工作中断。其中,47 次是计划内中断,是由于自动化维护造成的,如固件升级或操作员发起的配置更新或数据集更新操作;419 次是意外中断,主要源于确认的硬件问题,包括 GPU、主机组件故障或疑似与硬件相关的问题,如静默数据损坏和未计划的单个主机维护事件。 GPU 问题是最主要的意外中断类别,占所有意外问题的 58.7%,包括 NVLink 等各种 GPU 故障及 HBM3 内存故障。这并不奇怪,因为 Nvidia 的 H100 GPU 消耗约 700W 并承受大量热应力。尽管出现了大量的故障,但只有三起事件需要显著的人工干预,剩下的问题均能由自动化处理。 其余 41.3% 的意外中断是由软件错误、网络电缆和网络适配器混合造成的。有趣的是,在此期间只有两个 CPU 出现故障。 为期 54 天的 Llama 3 405B 预训练期间,对意外中断的根本原因进行分类。 Llama 3 405B 大模型训练团队面临的另一个挑战是数以万计的 GPU 同时发生功耗变化,给数据中心的电网带来了压力。 在训练过程中,成千上万的 GPU 可能同时增加或减少功耗,例如等待检查点完成或集体通信结束,或者整个训练任务的启动或关闭。当这种情况发生时,会导致数据中心的功耗瞬时波动达到几十兆瓦的数量级,可能使电网不堪重负。 而这是一个持续存在的挑战,意味着 Meta 必须确保其数据中心有足够的电力,才能维护 405B 模型以及未来更大规模 Llama 模型的正常运转。随着 AI 模型复杂性的不断增长,所需的计算资源也在增加。 实现 90% 有效训练时间背后的努力 为了提高效率,Meta 开发了多种工具和优化策略,包括减少任务启动和检查点时间、广泛使用 PyTorch 内置的 NCCL 飞行记录器,以及识别滞后的 GPU。其中,NCCLX 在故障检测和定位方面发挥了至关重要的作用,尤其是对于 NVLink 和 RoCE 相关问题,与 PyTorch 的集成允许监控和自动超时由 NVLink 故障引起的通信停顿。 据了解,PyTorch 的 NCCL 飞行记录器可以将集体元数据和堆栈跟踪记录到环形缓冲区中,从而能够在大规模的情况下快速诊断和解决挂起和性能问题,尤其是与 NCCLX 相关的问题。另外,由于 Meta 在网络中混合使用了 NVLink 和 RoCE,使得大规模训练中的调试问题变得更加复杂。通过 NVLink 的数据传输通常通过 CUDA 内核发出的加载 / 存储操作完成,而远程 GPU 或 NVLink 连接的故障通常表现为 CUDA 内核内的加载 / 存储操作停滞,且不会返回明确的错误代码。 NCCLX 通过与 PyTorch 的紧密协同设计提高了故障检测和定位的速度和准确性,允许 PyTorch 访问 NCCLX 的内部状态并跟踪相关信息。虽然无法完全防止由于 NVLink 故障导致的挂起,但系统会监控通信库的状态,并在检测到此类挂起时自动超时。此外,NCCLX 还会跟踪每次 NCCLX 通信的内核和网络活动,并提供故障 NCCLX 集体的内部状态快照,包括所有等级之间已完成和待完成的数据传输。 有时,硬件问题可能会导致出现仍然运行但速度缓慢的“拖后腿者”,还很难被检测出来。而即使只有一个“拖后腿者”也可能减慢成千上万个其他 GPU 的运行速度,常常表现为正常但速度缓慢的通信。对此,Meta 开发了用于优先处理来自选定进程组的潜在问题通信的工具,从而有效检测并及时解决落后者,确保将速度减慢到最低,保持整体训练效率。 还有一个有趣的观察是,环境因素对大规模训练性能的影响。对于 Llama 3 405B,Meta 注意到一天中会有一段时间出现 1-2% 的吞吐量变化,这种波动是因为中午较高的温度影响了 GPU 的动态电压和频率调整,从而影响训练性能。但这不是什么大问题,GPU 的动态电压和频率缩放通常都会受到温度变化的影响。 结 语 考虑到一个包含 16384 个 H100 GPU 的集群在 54 天内经历了 419 次意外故障,每 24 小时 7.76 次,我们不禁想到,xAI 配备了 100000 个 H100 GPU 的孟菲斯超级计算机集群(Memphis Supercluster)发生故障的频率是多少? 上周,埃隆·马斯克(Elon Musk)在社交平台 X 上吹嘘自己启动了“世界上最强大的人工智能训练集群”,他将在今年 12 月之前创建“世界上所有指标最强大的人工智能”。据悉,孟菲斯超级计算机集群已经开始进行训练,采用了液冷散热和单一的 RDMA 网络互连架构。 按 GPU 规模比例来看,xAI 的孟菲斯超级计算机集群可能会面临指数级更高的故障率,出现故障的组件数量或会增加六倍,这给其未来的 AI 训练带来了更大的挑战。
网易庞大智:游戏业是AI最好的试验田,成本、效率、质量“不可能三角”将被打破
公司情报专家《财经涂鸦》获悉,7月26日-29日,2024中国国际数码互动娱乐展览会(2024 ChinaJoy)在上海举行。会议前夕的ChinaJoy高峰论坛CDEC中,网易公司副总裁庞大智发表主题演讲,并现场分享网易基于过去一年实践的观察。 “游戏行业一直是公认的AI技术最好的试验田,也是最早感知、适应AI冲击的前哨。”庞大智表示,当越来越多AI技术走出实验室、正式“上岗”开工,成为当下必不可少的新质生产力,行业要进一步考虑如何充分激发AI潜力,与更多产业、甚至全社会共享AI红利。 有统计数据显示,仅在开源社区GitHub,2023年发布的人工智能开源项目就有6万个,数量是2022年的3.5倍。针对如何激活“AI+游戏”潜能这一行业重要命题,庞大智从三个维度进行了实践分享。 首先, AI带来的提质、提效,有望成为游戏行业摆脱传统的增长束缚与发展路径的一种方式,打破长期以来的“不可能三角” 。 游戏行业、尤其是大家都在做持续运营的网游的中国游戏行业,是所有内容制作行业中,工业化程度、交互、实时性要求最高的。因此,这也产生了一个“不可能三角”:成本、质量、效率很难同时满足。通常一个几百人的团队、花费几个 月时间制作 的 内容,玩家消耗完 ,可能只需要两周时间 。 “但是AI的出现,给我们带来了新的思路—— 通过把AI‘开源’给玩家,让玩家更好地融入整个游戏的生态系统、形成良性反馈的同时,也扩充UGC内容板块” 。庞大智坦言,通过这种方式,可以实现从PGC主导,转型为PGC+UGC双线并行,从而缓解内容输出的难题。 这一点,网易在《蛋仔派对》、《逆水寒》手游等产品中,基于智能语音、动画、NLP等AI技术,已有不少尝试。 例如,以UGC内容创作见长的 《蛋仔派对》中,正通过AIGC,吸引、帮助更多玩家,完成从参与创作、到爱上创作、精于创作的“进阶”过程 。其中,基于AIGC打造的乐园地图“万能生成器”,已被5300万玩家所使用。在《逆水寒》手游的“剧组模式”中,玩家只需上传视频,或输入文本、语音到游戏中,就能一键生成大片。粗略统计,该功能上线仅一个多月,游戏内诞生了数百万个玩家作品,被玩家戏称是“游戏版的抖音”。 在增益游戏的同时,AI也在持续从游戏中,拾取更多的“升级资源包”。在AI技术的加持下,《逆水寒》手游玩家,可以随时“路遇”一群没有固定剧本、会自主思考的智能NPC,游戏体验感得到大幅度提升。而这些NPC,也在和玩家的不断交互中,自我学习、不断“升级”。无形之中,广大玩家群体成为了AI技术升级路上的“良师益友”。 “大胆预测, 今后我们在游戏里,碰到几乎和真人无异的AI角色,会是大概率事件 。刚刚开启公测的《永劫无间》除降低上手门槛、保留端游的战斗体验外,我们还加入了可实时语音交流的AI队友、智能语音捏脸等创新玩法。”庞大智表示,游戏行业的“不可能三角”正在被打破,当借助AI的内容海量涌现,如何把控内容质量,不断产生精品、甚至是经典,会是下半场的重要关注点。 第二,AI不仅在游戏产业“自产自销”,更需要构建跨领域生态,加速AI在千行百业的渗透落地,创造更大的技术能量。 “我们看过一个调研, 全球已经有62%的游戏从业者,正在使用AI工具制作游戏内容 。 但我们更希望看到, AI能够通过游戏这个小世界的测试,帮助人类更高效地解决现实世界中的问题,解放生产力投身到更高质量、更具创造性的事业当中”。 庞大智提及,今年网易发布了首个机器人品牌“灵动”。作为网易在AI工业领域和软硬件结合上的第一份答卷,“灵动”是网易伏羲基于自研工业大模型和AOP技术思想打造的机器人品牌,旗下挖掘机器人和装载机器人两款核心产品, 已经参与了10多个省份的50个重点建设项目 ,去过零下20度、海拔4000米的高原,也在沪通铁路上见过凌晨4点的太阳,覆盖矿山、港口、搅拌站、学校等多种应用场景。 “未来,我们也将继续深耕垂直专业领域,让AI技术下沉到不同应用场景,磨一磨、练一练,充分嵌入到各行业的链路中,打通“人工智能 +”的最后一公里”。 第三,AI的应用场景,正从行业级走向社会级,从少数人手中掌握的黑科技,成为多数人的趁手好工具。 “近年,我们基于游戏中的应用实践,将AI技术的服务对象,投向了更广泛的大众群体,尤其是那些可能需要帮助的人”。 庞大智进一步透露,比如,网易 游戏 用户体验中心利用AI图像识别与语音技术,跟踪游戏画面的变化,主动播报新消息,为视障人士铺设出一条探索游戏世界的“盲道”;把语音识别与合成工具AudioMaker从游戏场景中拿出来,免费开放给全国的听障人士,帮助他们复原人声,实现“亲口说话”的梦想。 在教育领域,网易也正持续布局、落地相关AI应用。去年,虚拟人口语私教Hi Echo正式上线了。这位“虚拟外教”基于国内首个教育大模型“子曰”打造,能够为用户提供随时随地、一对一口语练习。目前,该应用规模已达百万级别。 “自AI横空出世以来,人们对这场技术革命一直抱有复杂的情绪,对AI发展的态度也很矛盾。今天,我们重新来审视AI技术,它就像一个万能插座,当我们把它与海量内容结合,它能成为富有创造力的内容创作工具;装上机械臂膀,它能成为高效运作的生产工具;与人的感官结合,它能成为我们能力的补足和延伸。 就像乔布斯所说,技术本身并不足以改变世界,真正的变革来自于技术与人类创造力的结合 ” 。庞大智表示。
体验完小红书、抖音、B 站的 AI 搜索,我发现跟着 AI 吃喝玩乐也不会更省心
「遇事不决小红书」,吃喝玩乐、办证流程之类的问题,是小红书图文帖子的强项。近两年,小红书成为了越来越多网友的「生活搜索入口」。 同时, Perplexity 等 AI 搜索也蓬勃发展起来,我们在对话框输入问题,就能快速获取答案,以及相关的引用来源,主打一个省心又省事。 如果小红书结合 AI 搜索,我们会得到一本更聪明的生活百科全书吗? 小红书内置的「搜搜薯」和「达芬奇」,可以给我们答案。 接地气的 AI 搜索,但还不够聪明 小红书在 AI 方面的动作比较低调,基本靠用户自己的慧眼发觉。 还处于内测阶段的「搜搜薯」,在搜索框输入问题后随机出现。 搜索「港澳通行证广州办理流程」,搜搜薯会在页面顶部给出一个总结性的回答,并引用相关的帖子,点击角标跳转到帖子本身,相关内容还会暂时凸出显示。 总结回答的下面,仍然可以像以前一样,由我们亲自看帖子。 但不是所有问题都会召唤出搜搜薯,我尝试搜索「怎么买飞机票最便宜」「照片回执怎么弄」,结果没有触发。 再覆盖得全面一些,或许我的搜索习惯也就能改变了。 比起玄学的搜搜薯,小红书的聊天机器人达芬奇 AI 就靠谱得多,事事有回音,有意经营接地气的人设,自称是「掌管小红书笔记的神」。 虽然和文艺复兴时期的大画家同名,但达芬奇目前不具备生成图片的功能,就想和你当笔友。 你有什么问题,搜索到「达芬奇」账号,给它「发消息」就可以,达芬奇会搜索站内数据并直接生成答案,末尾推荐三篇左右的相关帖子,并给出你可能会追问的问题。 让它推荐广州 citywalk 路线就是一个例子,相关的帖子点击后可以丝滑跳转,节省了我们自己找帖子的功夫。 最近,小红书很多帖子把吐鲁番称为「祛湿天堂」,尤其吸引一生被说湿气重的南方人。不妨也来问问达芬奇:吐鲁番沙疗流程是怎样的? 达芬奇给的回答,可以看出至少化用了两篇小红书帖子,但沙疗什么时候埋、一次埋多久,彼此有细微的出入,让人不敢照着做。 ▲ 左,达芬奇答案;中和右,两篇小红书帖子 这就是个人生活经验和 AI 幻觉叠加的双重风险了,小红书的很多内容,不是纯粹的知识,也不是完全客观的信息,往往因人而异,需要个人谨慎判断。 互联网的流行文化几乎一周一更,问到 6 月的老梗「city 不 city」,达芬奇回答得还不错,甚至给了你一段传播学分析,同时用了大量 emoji,不愧是小红书培养的 AI。 不过,问到外国游客的「新手村」是什么意思,达芬奇就有点呆了。这个语境下的「新手村」,其实是北京、上海等更发达的大城市,达芬奇升华成,生活是一款游戏,人人都是玩家。偏题,但格局够大。 体验过程中也可以发现,达芬奇的即时性比较差,在 7 月 26 日问它下个节假日是什么时候,达芬奇回答了端午节,可能和它选择引用的帖子发布时间在 5 月甚至更早有关。 但如果规定了时间,又能找到日期符合要求的帖子和内容。 Kimi 等大模型都有小红书文案写作的功能,小红书自己的 AI 来写,结果会怎么样? 结果还是形似神不似,一口一个宝子,一段两个 emoji,但读下来没有被种草的感觉,有种 i 人强装成 e 人的别扭。 目前来说,从搜搜薯到达芬奇,AI 更多起到总结、引路的作用,不能代替帖子本身,偶尔会出小问题,但交流起来挺接地气,懂幽默,比较符合小红书的风格。保持观望和鼓励,再给它们一点成长的时间。 用 AI 做计划,还是不能偷懒 小红书有生活百科之称,是因为很多博主会用「保姆级教程」图文并茂解释一个问题,比如教你退税是从下载哪个 app 开始,然后每一步都打上标注和解读。 但旅游计划仍然需要亲力亲为,毕竟没有标准答案。小红书的帖子只能拿来参考,还要小心「照骗」。如果有 AI 能根据我们的需求,直接告诉我们怎么做,那就太节省时间和精力了。 说到旅游,最近有一款很火的 AI 旅游产品:Wanderboat,胜在图文并茂、信息丰富、个性定制,人称 AI 版小红书、马蜂窝的结合体。 难道风水轮流转,小红书取代了旅游杂志和网站,又要被 AI 后起之秀取代?不如就让 Wanderboat 和达芬奇来个同题竞赛,以一次生成的答案为准。 我输入的提示词如下:「从广州出发,去广西旅游,四天三夜,桂林市区、龙脊梯田、阳朔这三个地方必去,请给我一个旅游指南,包括景点、住宿、饮食和交通方式。」 Wanderboat 先帮我生成了一个粗糙的方案,参考了携程、马蜂窝等三个链接,看起来没什么问题,于是一键生成完整的旅游计划。 AI 生成的页面很直观,按时间线排列,罗列出了景点视频、照片、要点和注意事项。 每个景点都可以让用户微调时间,同时查看地图上的所在位置和附近的其他景点,总之让你不走冤枉路,又避免留下遗憾。 一旁还有「Ask AI」功能,你对某个景点感兴趣,就可以问 AI,这个景点有什么故事,哪里方便停车,附近有没有推荐的餐厅。我问了日月双塔文化公园附近可以吃些什么,AI 帮我找了家海底捞,怎么不算是美食呢? 点开景点,可以进一步查看详情,包括地址、营业时间、拍照地点等信息,甚至还能跳转到订票网站,有帮你一站式解决问题的意识。 虽然交互愉悦,但这个计划并不符合我的要求。最大的问题是,AI 一直围绕桂林市区打转,没有提及龙脊梯田和阳朔。其次,虽然有餐饮安排,但没有提供住宿和交通信息。细节打磨得再好,出发点错了也就没有用处。 再看达芬奇,给出的指南高度概括,更像一个大纲。景点、住宿、饮食、交通等重点都在其中,且推荐的三个帖子也比较精准,标题里就有「四天三夜」,方便我做参考。 但大纲还需要细化,于是我追问,有没有桂林市区的住宿推荐,这时候就出现了问题,美团一查,有的酒店价位上千。我的经济水平被 AI 高估了,不敢和小红书网友平起平坐。 没说明白,是我的问题。我再让 AI 推荐 400 元以下的,价位合理了,但 AI 把「雅斯特」说成了「维斯特」。转念一想,有时间验证 AI 的答案,我为什么不直接去美团找? 接下来再问交通,怎么从桂林市区到龙脊梯田,大巴需不需要提前预定,AI 有对小红书帖子照搬照抄的嫌疑,措辞基本一模一样,而且这篇帖子是 2022 年的,不够新,参考意义不大。 ▲ 左:达芬奇;右:小红书帖子 达芬奇的多轮交流能力还算不错,但体验下来可以发现,AI 只适合生成大纲,提供大方向的建议,无法代为执行脑力劳动,我们还是要追问,逼着 AI 挤牙膏。 不管是 Wanderboat 还是达芬奇,验证和补充信息都是免不了的,不存在一步到位、提起背包说走就走的潇洒。 更打动我的、我也更需要的,仍然是亲身实践之后可复制的个体经验,这和小红书常被批评的「出片至上」是两回事,出片再浮夸和没意义,它也是可以执行的指南。 app 内的搜索正在 AI 升级,可用却不好用 不只是小红书,一些国内的娱乐、知识类 app,也在优化内部的搜索。 它们都有些低调,也有些傲娇,躲在角落不让你发现,又担心你不发现。 微信读书的「AI 问书」,在搜索框输入问题后才会出现。默认情况下,微信读书按照关键词给你推书;点击「AI 问书」,AI 就会直接解答你的问题。 ▲ 左:默认结果;右:AI 问书 AI 以站内书籍为信源,还会建议你追问哪些问题。点击引用源,我们可以直接跳转到具体的某一页。 功能是实用的,但不确定 AI 引用书籍的逻辑。高情商地说,AI 旁征博引的能力很强。低情商地说,这些书看起来都很小众。 小红书、微信读书至少明确基于站内内容,但抖音的「AI 搜」有点让人摸不着头脑,参考来源是全网,主要起到一个总结的作用,倒不如在 app 内直接搜短视频来得直观。 ▲ 左:默认搜索,中和右:AI 搜 B 站的搜索 AI 助手也犹抱琵琶半遮面,需要点击搜索框旁边的「AI 小电视」召唤出来。 搜索宠物 UP 主「Q 大壮呀」,AI 强行解释,这可能是一个叫大壮的人的 QQ 昵称,但参考的链接里,确实又提到了这个 UP 主,往下拉,账号名字和相关视频也都是对的。很想问问阅卷老师,这怎么打分。 再来个 B 站应该擅长的问题——「推荐热血体育番」,AI 给出了简单回答加引用来源,下滑是相关视频,和直接搜索区别不大,我还是有必要打开 UP 主的视频看看。 ▲ 左:直接搜索,右:AI 搜索 对于内部的 AI 搜索尝试,这些 app 给出的措辞普遍很谨慎:内测、还在学习成长、内容仅供参考、希望得到你的反馈…… ▲ 小红书搜搜薯 ▲ B 站搜索 AI 助手 总体来看,它们或多或少可以节省一点检索有效内容的时间,简单解答加推荐信源,但不那么聪明,不至于颠覆使用体验,并且有擅长和不擅长的领域。 Web 1.0 时代,我们通过浏览器访问不同的网站满足信息需求。但在移动互联网时代,传统的搜索引擎变得广告多、不精准,内容被分隔在各种 app 里,信息获取更加垂直和个性化。 小红书、抖音、微博等等,无法真正代替搜索,但一定程度上满足了与日常生活场景相关联的搜索需要。我已经数不清,在小红书查找过几次洗衣机清洁之类的「小白」问题了。 所以,引入生成式 AI,更加高效地使用站内内容,其实很顺其自然。 秘塔等 AI 搜索固然也能总结和引用不同信源,覆盖到播客、学术、文库,但也没能打到 app 内部。app 们的用户,仍在不断贡献新的垂直内容,app 本身,是一个活水涌流的、无边无际的内容平台。 但 app 们所表现出的谨慎和纠结,也说明 AI 存在问题,小到信息错误,大到减少用户打开内容的动机和使用时长、破坏社区「普通人连接普通人」的活人生态。 内容获取的高效性,博主产出内容的动力,用户之间的交流和摩擦,彼此其实存在矛盾。 幸也不幸,目前 app 内的 AI 搜索只是能用,而非好用。就拿小红书的达芬奇来说,总结全是文字,少了点情绪,缺少真实感和互动感,让我必须去另行查证。 但在未来,AI 是引流,还是替代用户的内容,社区是提供真人的个人经验,还是精准的唯一解,小红书、抖音、B 站们或许需要认真考虑。
秘密打造“AI陶哲轩”震惊数学圈!谷歌IMO梦之队首曝光,菲尔兹奖得主深度点评
【新智元导读】19秒破解几何难题,谷歌AI夺得IMO银牌在业界掀起了巨震。就连菲尔兹奖得主陶哲轩,前IMO美国队负责人罗博深都对此大加赞赏。更有AI大佬高调预测,若谷歌继续加码研究,应该可以造出一个「AI陶哲轩」。 谷歌DeepMind正在做的,是要打造出世界上最强的AI数学家。 Perplexity AI的CEO对此做出了大胆预测——DeepMind继续研究下去的话,应该可以搞出一个「AI陶哲轩」了! 这个预测可谓相当大胆。 要知道,陶哲轩在IMO竞赛圈,乃至整个数学界,都是传奇般的存在。 「天才出少年」、「数学界莫扎特」,各种溢美之词放到他身上都不为过,毕竟人家首次参加IMO竞赛时只有10岁,是迄今为止最年轻的参赛者。 10岁铜牌、11岁银牌、12岁金牌,一路高歌猛进,他又成为了IMO史上最年轻的金牌得主。 AI大佬能够做出此类预测,正是基于谷歌DeepMind两大AI——AlphaProof+AlphaGeometry 2,上周在IMO 2024竞赛中取得了卓越的成绩。 6道题目中,它们一同做对4道,距金牌仅有一分之差(获得28分)。 AlphaGeometry 2效果愈加炸裂,竟可以在短短19秒里,破解了一道几何题目。 然而,这个消息至今余波未平。许多AI界和数学界的大佬们,纷纷给出了自己的思考和感悟。 数学大佬怎么看? 这边隔空被cue的陶哲轩发表了自己的看法。 但人家并不在意所谓的「AI陶哲轩」,而是延续了自己以往的关注点——分析AI和数学将怎样共同发展。 过去几周我一直在旅行,还没有时间完全消化这个消息……但可以在此记录一些初步印象 陶哲轩首先承认,DeepMind做出了一项伟大的工作,拓宽了AI辅助/全自动化方法在基准挑战上的能力边界,再次颠覆了我们的预期。 具体而言,IMO级别的几何问题,对专门的AI工具来说已经是实际可解的问题。 现在看来,能够形式化的,且可以用强化学习过程找到形式化证明的IMO问题,至少在某种程度上都可以被AI攻克(尽管目前每个问题都需要相当程度的算力,以及形式化过程中的人类协助)。 这种方法带来的好处,就是让形式数学更容易自动化,从而有助于包含形式化成分(formal components)的数学研究。 特别是,如果用这种方式创建一个含有形式化证明过程的数据库,并将其公开共享,将成为非常有用的资源。 DeepMind这次的研发路径很聪明,而且事后看来也很合理。他们更多基于强化学习而非大语言模型,有些秉承了AlphaGo的精神,并且非常强调形式化方法。 根据「AI效应」,一旦解释清楚其中的原理,AI就不再像是「类人智慧」的展现,但这依旧扩展了AI辅助工具的能力。 「AI效应」描述一种现象:一旦AI项目取得了某些成功或进展,相关任务就不再被视为AI领域的一部分。类似的还有Tesler定理:「AI是指尚未完成的事情」 值得注意的是,AlphaProof/AlphaGeometry 2与最近获得AIMO冠军的NuminaMath模型,二者不能直接比较。 NuminaMath是完全自动化的,资源效率相比DeepMind模型高了搞几个数量级,而且采用了完全不同的思路,即通过LLM生成Python代码,对数字答案进行暴力破解。 由于AIMO所有问题答案都是范围为0~999的整数,因此暴力破解是可行的,但对开放式的IMO赛题就完全不适用了。 NuminaMath也是一项非常好的工作,在数学解题的不同部分中尝试用AI协助或自动化,向我们展示了这个挑战本身的多维性质。 目前,NuminaMath这个冠军模型已经在HuggingFace上开源了7B版本。 与IMO打过多年交道的CMU数学教授罗博深(Po-Shen Loh)也发推表达了自己的震撼。用他的话说,这种感受和当年人们看到苏联第一颗人造卫星Sputnik的感觉是类似的。 他甚至表示,「人类文明需要进入高度戒备状态」。罗博深本人虽然一直期待这种水平的AI能够到来,但他曾经认为,至少还需要几年时间才能达到。 罗博深教授的「震撼」,不仅来自于他数学家的身份,更来自于他对IMO竞赛的多年了解。 1999年,时年17岁的他首次参与IMO竞赛获得银牌,2002年就进入美国IMO国家队训练营担任助理教练,开启了自己长达21年的IMO执教生涯。 2014年,罗博深被正式任命为总教练,随后带领美国队分别在2015年、2016年、2018年和2019年赢得比赛,让1994年后将近20年没有冠军的美国IMO国家队「重回巅峰」。 由于多年执教,罗博深对竞赛的出题流程非常熟悉——IMO会专门选择非标准化问题。 出题小组的重要任务之一就是避免任何类似题目。教练们甚至会翻出一些古老又不为人知的数学竞赛,然后否决掉已经提出的类似题目。 这种题目的创新性让很多人类学生都很难上手,因为学生们也习惯于从例题中学习,记住解题步骤,用来解决相似题目。 以本届IMO的6道题目为例,它们远远超出了任何课程标准。 解决这些题目最困难的部分不在于计算,而是需要找到一条解题路径。很多人即使有一整年的时间思考也只能拿到零分。 因此,DeepMind模型在IMO上的胜利和GPT-4在标准化测试上通过「模式匹配」拿到的高分有完全不同的意义。 尽管AI花费的时间远远超出比赛规定,但实现软硬件的加速只是时间问题,模型能够解决这些问题本身就是一个重大进步。 罗博深教授长期致力于数学教育,因此他也会进一步思考——AI具有如此强大的数学能力,这对我们意味着什么?我们能做些什么? 他认为,AI越强大,大幅提升人类智慧就越为重要。 首先就是对就业动态产生的影响。 AI出现以前,个别有非凡能力的人不会真正损害你的就业,因为这样的人终究只是少数。即使这些天之骄子会占据一些职位,余下的工作依旧很多。 然而,一旦AI的能力超越人类,它就可以通过大规模复制,从而夺走所有工作。这与之前的逻辑完全不同。 AlphaProof/AlphaGeometry 2在IMO中的表现已经告诉我们,AI具备了发现新事物的能力(这是最有价值的技能之一),因此整个教育方法都需要快速变革。 无法否认的是,当前的教育结构很大程度上受到考试的影响,为了测试学生在预定义标准上的熟练程度。 然而,现在的每个人都必须学会如何解决从未见过的新问题,否则就无法跟上AI的步伐。 此外,技术越强大,我们就越需要努力保持人类文明中的人性。 这意味着,我们需要建立一个让人们共同合作、互相支持的社区,而不是在「丛林竞争」中互相争斗。分裂则亡。 对我来说,这与构建人类的分析性才能密切相关,因为培养一个试图击败他人而非帮助他人的天才,很可能是有害的。 以上这些观点并非罗博深教授的「纸上谈兵」,也不仅仅停留在提出问题或理念的层面。基于数学教育领域十多年的工作经验,他对此有深入的思考,并试图提出了启发性的解决方案。 数学大佬怎么看? 在谷歌DeepMind伦敦总部的实验室,研究团队在庆祝每次AI里程碑时,内部承袭着一个传统——敲响大锣。 2016年,AlphaGo在围棋比赛中表现优异,锣声响起;2017年,当AlphaZero征服国际象棋时,锣声再次回荡。 每次一敲锣,都代表着算法击败了人类冠军。 就在AlphaProof+AlphaGeometry 2夺得了奥赛IMO 2024银牌的那天,伦敦总部再次敲响了铜锣。 纽约时报的这篇报道深入团队内部,让我们对这位AI数学家有了更深一层的了解。 文章表示,AI越来越擅长数学,并且很快就会成为人类最值得合作的伙伴。 DeepMind数学计划负责人之一Alex Davies表示,这是AI在数学推理方面,取得的重大突破。 7月11日-22日,IMO 2024在伦敦以西约100英里的巴斯大学举行,被公认为是世界上「最聪明的数学天才」参加的顶级数学竞赛。 人类选手(来自108个国家的609名高中生)赢得了58枚金牌、123枚银牌和145枚铜牌。 谷歌AI在答题的过程中,解决了6个问题中的四个,总得分28分,与金牌仅差一分。 对此,谷歌DeepMind研究副总裁Pushmeet Kohli在接受采访时表示,「这并不完美,我们没有解决所有问题。我们的目标是做到完美」。 尽管如此,Kohli博士将这一结果描述为一种「相变」(phase transition),一种革命性的变化,即在数学中使用AI,以及AI系统进行数学运算的能力。 DeepMind实验室邀请了2位独立专家,来评判AI的表现——剑桥大学数学家、菲尔兹奖得主Timothy Gowers,以及软件开发人员Joseph Myers。 他们都曾是IMO竞赛获奖者,纷纷表示对这次AI的表现印象深刻。 过去25年来,Gowers一直对AI与数学结合感兴趣,他认为,「AI已经找到了解决问题的神奇钥匙」。 铜锣敲响 每年IMO,人类选手们都要经过几个月的严格训练,去参加两场奥数考试(共9小时)。 每天仅需做答三题,涉及了代数、组合学、几何和数论。 与此同时,AI数学家也在伦敦实验室里,埋头苦干。 研究科学家David Silver说,「每次系统解决一个问题,我们就敲锣庆祝」。 IMO结果公布那天,中国队中的Haojia Shi是唯一一位获得满分(42分)的参赛者,6道题目分别拿了7分满分成绩。 总榜成绩中,美国队以192分获得第一名,中国以190分获得第二名。 这边,谷歌AI成功破解了4道题——2道代数题、1道几何题和1道数论题,得分28分。它在另外两个组合学问题上,失败了。 与人类选手不同的是,AI答题完全不限时间。 对于某些问题,AI需要长达三天的时间,而学生在每场考试中仅有4.5小时。 Silver博士解释道,「对于谷歌DeepMind团队来说,速度是整体成功的次要因素。因为这实际上只是取决于算力的投入」。 他继续称,「我们能够达到这个阈值,能够解决这些问题,这代表了数学史上的一个重大变化。但也希望能成为一个转折点,让计算机从只能证明简单问题,到证明人类无法证明的问题」。 两大团队,两个AI数学家 几年来,将AI应用于数学一直是DeepMind使命的一部分,而且通常是与世界级的研究数学家合作。 Davies博士表示,数学需要抽象、精确和创造性推理的有趣结合。 他指出,部分原因是这种能力组合,使数学成为达到所谓的AGI这一最终目标的良好试金石,而且这也是OpenAI、Meta AI、Xai等公司一直在追逐的目标。 因此,奥林匹克数学题已成为公认的一个基准。 今年年初,谷歌DeepMind首次发布AlphaGeometry,解决了奥林匹克抽样的几何问题,水平相当于人类金牌获奖者。 首席研究员Thang Luong在电子邮件中表示,AlphaGeometry2在解决IMO问题上已经超过了金牌得主。 借着这股势头,谷歌DeepMind为这项挑战组建了两个团队: 一个由伦敦的研究工程师Thomas Hubert领导,另一个团队由位于美国Mountain View实验室的Luong博士和Quoc Le领导,每个团队约有20名研究人员。 Luong博士领导的团队名为「超人类推理团队」,目前为止招募了十几名IMO奖牌获得者。 谷歌DeepMind超人类推理团队(superhuman reasoning team) 他自豪地表示,这是目前为止,谷歌内部「IMO密度最高」的团队。 大约20年前,我全身心投入奥数竞赛,在全国获得银牌(当时排名第8),但我没能进入2005年的 IMO比赛.....,时光荏苒,我非常高兴谷歌最新的AI系统(AlphaGeometry2+AlphaProof)帮我实现了「赢得」IMO奖牌的梦想! 时隔半年,谷歌推出迭代后的AlphaGeometry 2,仅用了19秒,解决了IMO 2024的几何问题。 另一波在伦敦总部的团队,由Hubert领队,开发了全新模型AlphaProof。它具有可比性,更加通用,目标是为了解决更广泛的数学问题。 背后算法揭秘 简言之,AlphaGeometry和AlphaProof利用了多种不同的AI技术。 非形式推理系统 AlphaProof是用自然语言表达的非形式推理系统(informal reasoning system)。 它基于谷歌Gemini打造,使用已公开的问题、证明等英文语料库作为训练数据。 非形式系统擅长识别模式,以及提出下一步建议。而且它富有创造性,以一种自然语言可以理解的方式谈论想法。 当然,LLM倾向于编造内容,这对诗歌可能行得通(也可能不是),但对数学肯定不行。 在数学这种情况下,大模型似乎表现出了克制。但这并不是说,它完全免疫于「幻觉」,但频率有所降低。 形式推理系统 AlphaGeometry是基于逻辑并用代码表达的形式推理系统。 它使用了名为Lean的定理证明器和证明助手软件。该软件可以确保,如果AI认为证明是正确的,那么它确实是正确的。 Hubert表示,「我们可以准确地检查证明是否正确,因为每一步都保证在逻辑上是合理的」。 而另一个关键组件是,AlphaGo和AlphaZero谱系中的强化学习算法。 谷歌DeepMind负责强化学习的副总裁Silver博士说,「AI可以自主学习,无限扩展」。 「由于RL算法不需要要老师,所以它可以不断地学习,一直学习,直到最终它能够解决人类可以解决的最困难的问题」。 这也是AlphaZero所经历的现实,从0开始学习,仅通过玩游戏,在不到一天时间内,就能重新发现国际象棋中的所有知识。 在大约一周的时间,它便发现了围棋的所有知识。所以我们想,把这个AI能力应用到数学中。 数学家,会被AI取代吗? 菲尔兹奖得主Gowers并不担心AI数学家,带来的长期后果。 我们可以假想这样一种情况,数学家基本上没有什么可做的了。如果计算机在数学家目前做的所有事情上都变得更好、更快,那就会是这种情况。 不过,在AI能够进行研究级数学之前,似乎还有很长的路要。 他补充道,「如果谷歌DeepMind能至少解决一些棘手的IMO问题,那么一个有用的研究工具就不会太遥远」。 而一个真正熟练的AI工具,可能会让数学更容易上手,加速研究过程,还能让数学家跳出固有思维。 最终,它甚至可能提出引起共鸣的新奇想法。
人人都能开发AI应用这件事,让亚马逊云科技玩明白了
作者 | ZeR0 编辑 | 漠影 帮云客户快速构建生成式AI应用这件事,正被全球最大云计算巨头亚马逊云科技做得越来越完善。 在7月11日举行的亚马逊云科技纽约峰会上,亚马逊云科技大晒生成式AI成绩单:96%的AI/ML独角兽将其业务跑在亚马逊云科技上, 2024福布斯AI 50榜单中有90%的企业使用了亚马逊云科技。 亚马逊云科技AI产品副总裁Matt Wood博士阐述了企业如何通过亚马逊云科技高效、大规模地整合过去十年的重大技术突破。据他分享,过去18个月,亚马逊云科技已发布326项生成式AI功能,所提供的正式可用的机器学习和生成式AI的产品功能数量是其他主要云服务提供商总和的两倍之多。 在此基础上,亚马逊云科技发布了一系列生成式AI技术栈的更新,进一步降低根据个性化需求定制生成式AI的门槛,让人人都能轻松构建企业级生成式AI应用。 ▲亚马逊云科技生成式AI三层技术栈 新发布包括Amazon Bedrock及Amazon Q的多项更新。其中,Amazon Bedrock更新了微调Anthropic Claude 3 Haiku、Guardrails(安全防护)和Agents(智能体)等功能;Amazon Q Apps让人人都能用自然语言指令在几秒钟内创建生成式AI应用;Amazon Q Developer集成到Amazon SageMaker Studio中并正式可用,使得机器学习模型的开发过程更加便捷。 这些更新将提供更高的生成结果准确性、更好的记忆功能、更方便的模型评估和治理、更全面的应用安全和隐私保护机制,帮助用户更加快速、安全、轻松地构建和部署生成式AI应用。 此外,亚马逊云科技还推出了一项生成式AI驱动的企业级应用Amazon App Studio的预览版,让IT项目经理、数据工程师和企业架构师等专业开发人员使用自然语言在整个组织内创建、部署和管理企业应用程序。 一、直击生成式AI应用多重痛点,构建更安全的防护措施 Amazon Bedrock是亚马逊云科技生成式AI技术栈的中间层,就像一个大模型货架般,提供了广泛的大语言模型及其他基础模型选择以及各种好用工具,使构建、部署和扩展生成式AI应用变得轻松快捷。 它已成为亚马逊云科技过去十年中增长最快的服务之一,被数万客户所使用。 针对生成式AI长期被诟病的无法获取专属知识、胡说八道的幻觉、缺乏长期记忆等应用痛点,Amazon Bedrock推出多项功能更新,以提升用户使用生成式AI应用的体验,具体包括: 1、知识库功能增强Amazon Bedrock的数据连据器范围,加入了对广泛使用的第三方Web域数据源的连接,包括Confluence、Salesforce、SharePoint上的数据都可以轻松接入到Amazon Bedrock中,使得在这些Web域中存储日常数据的用户能够更方便地将生成式AI带入日常应用场景中。 2、在Guardrails中推出基于上下文基础检查的幻觉检测功能。用户可在Guardrails中设置针对生成结果准确性的关联值,低于这一设定阈值的生成结果就会被Guardrails判定为不相关的幻觉结果并不予显示。这项功能通过对上下文的基础性检查来提供,以更好避免基础模型产生的幻觉问题。 3、推出新API服务ApplyGuardrail,用于评估所有基础模型的输入提示和响应,使得用户能够在任何基础模型上使用Guardrails,即使是那些不受Amazon Bedrock支持的基础模型。构建者都可以配置一套标准化的防护措施,以确保其应用中的模型输入提示和模型响应拥有更加一致的表现。 4、Agent功能推出跨多个交互的记忆保留特性,解决生成式AI“记不住”的问题,可记录用户之前的历史交互信息,并基于此提供更为精准的个性化服务推荐。基于该功能构建的Agent,能够随时间推移学习并适应每个用户的独特需求和偏好,同时多个记忆之间完全分离,每个用户的对话历史和上下文都会安全地存储在唯一的记忆ID之下,有助于提升复杂任务代理下的用户体验。 5、Agent功能上线代码解释,支持Agent在安全的沙箱环境中动态生成和运行代码片段,从而显著提升其处理复杂任务的能力,包括数据分析、可视化、文本处理、方程求解和优化问题等,并支持多种数据类型和格式,同时在需要时由大语言模型决定是否调用该功能,以确保灵活性和安全性。 6、推出微调Anthropic Claude 3 Haiku功能的预览版,至此Amazon Bedrock成为唯一一款可以对Anthropic Claude系列模型进行微调的全托管服务,支持开发者利用自有数据定制应用程序,或在确保私有训练数据安全的前提下,训练模型的专属副本。 与此同时,Amazon MemoryDB的向量搜索功能已正式可用。Amazon MemoryDB以最高的召回率提供最快的向量搜索性能,非常适合需要个位数毫秒延迟的使用案例。此前亚马逊云科技已在一些最受欢迎的数据服务中推出了向量搜索功能。 二、Amazon Q全面出击,让生成式AI触手可及 位于亚马逊云科技生成式AI技术栈顶端的Amazon Q,定位是一个全面的生成式AI助手,能生成精准的代码建议,还能自动执行升级Java应用程序、生成并实施新功能等复杂任务。 Amazon Q包括面向开发者的Amazon Q Developer和面向企业应用的Amazon Q Business。它可以帮助员工充分利用公司文档、系统和应用程序中的海量数据和信息,通过回答问题、提供总结、生成商业智能(BI)仪表板和报告,乃至生成自动化关键任务的应用程序。 先来看下已经集成到Amazon SageMaker Studio中的Amazon Q Developer,通过简单的聊天式交互,就能为构建机器学习模型推荐最佳工具、提供分步指导、生成入门代码、日常答疑解惑,并在遇到错误时提供故障排除帮助。它还能为开发者量身定制针对机器学习开发生命周期的详细执行计划。 机器学习模型开发过程很复杂,数据科学家往往要花费大量时间来寻找合适的工具、文档或方法。而现在借助这项服务,数据科学家有望节省数周甚至数月的工作时间。 Amazon Q Developer已经扩展到在用户自己的集成开发环境IDE中,并提供自定义功能,以在用户的IDE代码编辑器和聊天中提供基于开发者私有代码库生成的代码建议,使开发者能够更好地打造其专属的代码助手。 开发人员可在Amazon Management Console以及IntelliJ IDEA、Visual Studio、VS Code和Amazon SageMaker Studio等主流的集成开发环境中使用Amazon Q Developer,可使用内部代码库安全定制Amazon Q Developer,从而获得更相关、更有用的内联编码建议,大幅节省时间。 为了让每位员工都能轻松创建自己的生成式AI应用程序,实现任务自动化,Amazon Q Business中的Amazon Q Apps功能也正式可用。 Amazon Q Business支持软件开发、数据分析洞察和内容创作等多种生成式AI任务,Amazon Q Apps则更进一步强化这项服务的能力,使得不具备技术背景的用户也能在几秒钟内构建基于企业数据的生成式AI应用。 操作非常简便,只需用自然语言简单描述所需应用程序的功能,例如,用户提出“请从会议记录中提取行动要点”或“我需要协助撰写公司文件”,Amazon Q就能快速生成应用程序自动完成这些任务,并持续提供高效服务。 Amazon Q提供了一键生成应用程序的功能,让员工能够从现有对话中快速创建应用程序,并支持安全地将其发布到企业内部的应用程序库Amazon Q Apps Library中,并添加多个应用类型标签,从方便企业内的使用者快速查找其所需的Q Apps应用。 亚马逊云科技还推出了一款生成式AI服务Amazon App Studio的预览版,将开发企业级应用的能力扩展到开发人员之外,以便IT项目经理、数据工程师和企业架构师等专业开发人员使用自然语言在整个组织内创建、部署和管理企业应用程序。 同样,用户可以通过自然语言描述其特性和功能需求以及需要整合的数据源,App Studio便能在几分钟内构建出一个类似的应用程序,还能够通过点选式界面进行修改。相比之下,传统上专业开发人员从头开始构建,可能要花费几天。 App Studio的生成式AI助手消除了传统低代码工具的学习曲线,加速了应用程序的创建过程,并简化了设计UI、构建工作流程和测试应用程序等常见任务。每个应用程序都可以迅速扩展至数千名用户,同时由亚马逊云科技提供全面的安全管理,无需任何运营专业知识。 结语:全面加速生成式AI落地,亚马逊云科技给出参考样本 生成式AI提供了前所未有的生产力提升工具,但怎么让不具备技术背景的企业也能更快享受到生成式AI带来的便利,对云服务供应商提出不小的考验。已经稳坐全球最大云计算巨头的亚马逊云科技,同样希望成为企业构建和应用生成式AI的首选,其遍布生成式AI各技术栈的更新则正在进一步加速这一愿景的实现。 亚马逊云科技认为要让企业的所有员工能用生成式AI提升工作效率,不仅需要强大的基础模型,而且需要具备全方位的能力来构建和扩展定制化的生成式AI应用,包括内嵌生成式AI的应用程序、快速实验和构建自有生成式AI应用程序的工具、高性价比且高效的基础设施,以及严密的安全控制和防护措施。 对此,亚马逊云科技正通过构建全面的生成式AI技术栈,包揽从构建到部署过程中的常见“烦心事”,降低技术认知和实操门槛,将生成式AI落地的成本打下来,将简单留给用户。这为云计算企业如何更好服务于生成式AI落地提供了参考样本。 除了不断完善技术栈外,亚马逊云科技也通过积极拓宽合作伙伴版图,来推动对生成式AI生态的扩张。 继今年3月推出业内首个生成式AI能力认证后,亚马逊云科技在纽约峰会上宣布了全球第二批获得该能力认证的合作伙伴,其中有11家来自中国的合作伙伴,包括伊克罗德、柯基数据、八斗智能、墨奇科技、神州数码、聚云科技、神州泰岳、灵奥科技、Zilliz、跨海科技和华讯网络。 获得认证的企业在利用亚马逊云科技生成式AI技术方面拥有专业知识、实践经验和成功案例方面已经得到验证与认可。截至目前,全球有60余家合作伙伴获得了该认证。亚马逊云科技生成式AI与机器学习市场推广全球副总裁Rahul Pathak分享说,这些合作伙伴已经在全球范围内帮助客户构建和部署了许多生成式AI工作负载,取得了显著成就和积极影响。
始祖鸟推出全球首款腿上赛博外挂,4500 美元的徒步神器
你有想象过,将机械安装在身体外,帮你突破人类极限吗? 七月底,Skip 公司与始祖鸟宣布了一款新的动力外骨骼设备。 这款名为「MO/GO」的软硬混合外骨骼可以提供 40% 的力量辅助,减轻股四头肌与腘绳肌的负担,帮助穿戴者行走,同时保护膝盖关节。据 Skip 公司创始人兼 CEO Zealand 描述,饱受膝盖疼痛的人们穿上 MO/GO 原型机后,可以轻松应对行走和上下楼梯的需求。不过她也讲到: 从「实验室可行」到成为人们日常使用的消费级产品,不只是技术问题,还有很多是可穿戴性方面的挑战,并且我对时尚一窍不通。 ▲ MO/GO 原型机 为此,Skip 找到几家服装合作伙伴,考虑到服装性能与形式,他们选择了一家专业的户外服装品牌——始祖鸟,从这款动力外骨骼的名字也可以看出端倪:MO/GO,意为山羊——世界上最会攀登高山的动物之一,可以在陡峭的山岩与复杂的地形快速稳定地移动,这是人类很难做到的事。 与始祖鸟合作,一方面可以解决 Zealand 关于外观与使用的担忧:在始祖鸟的帮助下,MO/GO 的最终形态为一套只有三个按钮的外骨骼系统与一条特制的 Gamma 长裤,全套总重量为 3 千克。整套系统由碳纤维材质与电机还有电池组成,电机为外骨骼能量驱动的核心,安装在 Gamma 长裤的膝盖外侧,帮肌肉分担负重;外骨骼的三个按钮分别是开关与加减档,以便根据使用环境的不同调整支撑力度。 另一方面,还可以借助始祖鸟的户外专业性与号召力:MO/GO 将在夏末秋初进行软启动,在大峡谷等徒步旅行目的地附近通过租赁形式提供给徒步爱好者,以匿名的方式收集艰难行走环境下的性能数据,再根据丰富的数据改进技术算法实用性。 不过,哪怕是热衷于徒步的爱好者,也很难接受高达售价 4500 美元的售价——这足以配齐一整套户外生存服装与必要设备,这也是为什么先以租赁形式提供给徒步爱好者的原因。 由于高昂的价格很大程度上限制了 MO/GO 在非行动受限人士中的使用,与大多数外骨骼设备一样,Skip 的最终目标还是在医疗领域,这与 Zealand 的项目设计初衷相符——受希望帮助自己祖母的启发,给更多有行动缺陷的人带去顺畅的行走体验。 从公司角度,这也是目前外骨骼设备研发与获利的最佳渠道。 目前,Skip 已将 MO/GO 送入临床试验,测试该设备在辅助帕金森病等情况下的有效性。将 MO/GO 归类为医疗设备可能需要数年时间,这过于漫长,在短期内,Skip 希望通过 FSA 覆盖系统降低用户价格。扩大制造规模也将有助于随着时间的推移平摊研发与生产成本,进一步降低价格。 ▲ 目前动力外骨骼最广泛的民用场景:医疗 大家也许对 Skip 这家公司有些陌生,这是因为它脱胎于 Alphabet 的 X Labs 保密项目。 Zealand 于 2019 年开始带领这项动力外骨骼的技术研发,直到 2023 年,全球大幅度削减成本,作为 Google 的母公司,Alphabet 也不能幸免,X Labs 的研发预算与资源大减,Zealand 选择与风投公司合作,创建了这家名为「Skip」的衍生公司,并迅速推出了 MO/GO,直到此时,这项保密技术才公布于世。 从 1937 年,源于动物体表的那层硬壳被「太空歌剧之父」E.E.Smith 借用后,「动力外骨骼」一词正式进入人类科幻想象,往后数十年,它的身影持续活跃于科幻小说、电影与游戏中,随着传感器、控制系统和材料的进步,外骨骼逐渐变得更轻便、高效和实用,民用外骨骼市场也随之活跃起来。 动力外骨骼,这个科幻想象中的装置已经逐渐进入现实世界。 虽然与人们想象中外形炫酷、功能奇妙的形式有所不同,但能让失去行动能力的人重新散步街头、不能登山的人再度看到山巅的风景,同样是一件足够科幻的事情。
1亿元模型券来了!北京发布AI新政策,76次提及“大模型”
作者 | 李水青 编辑 | 心缘 智东西7月29日消息,7月26日,北京市发展和改革委员会、北京市经济和信息化局等多部门联合印发了《北京市推动“人工智能+”行动计划(2024-2025年)》(简称:计划),该计划76次提到了“大模型”。 计划提出,2025年底,北京要力争形成3-5个先进可用、自主可控的基础大模型产品,100个优秀的行业大模型产品和1000个行业成功案例。 具体来看,北京针对标杆应用工程、示范性应用、商业化应用和联合研发平台建设4大方面,提出了行动计划,并明确会提供资金支持等保障。 按照计划,北京将对重大标杆应用工程和示范性应用,按照项目工程投资予以一定比例支持,最高不超过5000万元。 面向商业化应用,北京对多个细分场景下的大模型应用落地项目发放模型券,当年全市模型券可兑付总额不超过1亿元。 面向人工智能应用场景联合研发平台,北京将择优按照联合研发投入予以一定比例支持,最高不超过5000万元。 其中在标杆应用工程方面,北京强调大模型与机器人、教育、医疗、文化、交通等领域的结合,比如聚焦具身智能机器人、教育大模型平台、医疗大模型平台等领域。 在示范性应用方面,北京强调大模型在科研探索、政务服务、工业智能、金融管理、空间计算、数字营销、司法服务、广电传媒、电力保障、内容安全等方面的落地,比如提出构建开放式城市大模型服务平台、金融合规大模型助手、大模型数字人交互知识库及工具、大模型电力管理与规划平台等。 在商业化应用方面,北京鼓励主体从小切口、实场景入手,面向各个行业,支持大模型企业、系统集成服务商、行业用户等开展API调用、云端模型调优,模型私有化部署以及智能体、智能助手等大模型应用研发;鼓励大模型企业与电脑、手机、家电、汽车等设备厂商结对攻关。 在联合研发平台建设方面,北京将布局建设一批北京市人工智能应用场景联合研发平台,吸引汇聚优势创新团队,共同推动人工智能行业应用及产业落地。 《北京市推动“人工智能+”行动计划(2024-2025年)》全文内容如下: 为深入落实国家“人工智能+”战略行动,贯彻实施《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》《北京市促进通用人工智能创新发展的若干措施》等文件精神,抓住人工智能大模型(以下简称大模型)技术革新机遇,以应用反哺大模型技术迭代,带动产业发展,加快培育新质生产力,全力打造全球数字经济标杆城市,根据国家和本市有关政策,市发展改革委、市经济和信息化局、市科委中关村管委会联合制定《北京市推动“人工智能+”行动计划(2024-2025年)》。 一、发展目标 充分发挥本市大模型创新动能强劲、算力保障多元、数据供给海量和应用场景丰富的综合优势,坚持政府引导、创新驱动、应用牵引、开放合作的原则,通过组织重大项目攻关、资源供需匹配和特色场景示范,显著增强大模型自主创新能力,推动形成标准化、规模化、跨界协同的应用落地路径,加快实现千行百业智能化转型。2025年底,通过实施5个对标全球领先水平的标杆型应用工程、组织10个引领全国的示范性应用项目、推广一批具有广泛应用前景的商业化应用成果,力争形成3-5个先进可用、自主可控的基础大模型产品、100个优秀的行业大模型产品和1000个行业成功案例。率先建设AI原生城市,推动本市成为具有全球影响力的人工智能创新策源地和应用高地。 二、标杆应用工程 依托首都优势行业资源和科技研发能力,围绕机器人、教育、医疗、文化、交通等领域组织实施一批综合型、标杆性重大工程,促进大模型核心理论与技术突破,增强人工智能工程化能力,提高重点行业的科技水平和服务质量,构建跨行业、跨领域协同创新组织模式,形成大模型行业应用新生态。 (一)人工智能+机器人 整合创新资源,结合真实场景需求,推出融合具身智能的机器人,以应用牵引具身智能迭代演进。搭建具身智能应用试验场,验证物流仓储、生产制造、家庭服务、医疗护理、科研探索等场景下具身智能机器人性能,持续提升具身智能的智能水平。规范具身智能训练数据采集标准,建设各细分行业真实场景的高质量数据库,持续促进具身智能自我进化。(责任单位:市经济和信息化局) (二)人工智能+教育 发挥教育资源优势,加强大模型企业、教育机构和管理部门协同联动,重点汇聚北京市优质教学案例、讲义素材、施教方法以及学生心理健康、公序良俗常识等教学知识,培育跨学科、跨学段的教育大模型平台,提供智能备课、课件生成、课程分析、学习跟踪、家校联动等辅助工具,平衡班级制授课和个性化学习,为教师减负提效。加强师生人工智能素养,探索思维培养智能体、跨学科PBL课程设计等工作。(责任单位:市教委) (三)人工智能+医疗 围绕优质医疗资源,构建医疗监管机制创新、医院与医生科研成果收益均衡以及医院信息系统智能化升级的三者合一“北京医生”医疗大模型平台,释放医院、医生、大模型企业协同创新潜力,促进医疗、医保、医药等“三医”联动,建立高质量医疗数据标注库和医疗大模型训练可信空间。探索医生与医疗智能体协同机制,优化导诊服务、在线问诊、处方生成、用药咨询、慢病管理以及家庭智能医生等医疗辅助服务,推动互联网医院向人工智能医院升级。(责任单位:市卫生健康委、市医保局) (四)人工智能+文化 基于北京深厚的历史文化和旅游资源,汇聚文学作品、历史建筑、文化遗迹、景点信息等优质文旅数据,协同旅游景点、文创单位和管理部门,推动人工智能与文旅深度融合,支撑文化大模型服务平台,为市民和游客提供个性化、高效且便捷的文旅服务,增进优秀传统文化的传播效能,弘扬社会主义核心价值观。(责任单位:市委宣传部、市文化和旅游局) (五)人工智能+交通 基于大模型生成道路、车辆、人流、天气等仿真数据,加快自动驾驶仿真训练,优化车路云网一体化技术路线,探索FSD、ASD等单车智能技术,建设智能、高效、安全的城市交通网络。依托高级别自动驾驶示范区建设,融合车载传感器、路侧视频设备、高精度地图、交通管制信息、天气环境等多源数据,构建交通大模型平台,精准预测交通流量及拥堵情况,优化交通信号灯控制机制,做好车辆出行路径的动态规划与交通引导。(责任单位:市自动驾驶办公室、市经济和信息化局、市交通委、市公安局交管局) 三、示范性应用 围绕行业典型细分领域,支持市级行业主管部门、相关区、行业应用企业与大模型企业联动结对,重点培育一批示范性行业应用,突破场景落地共性难点,探索标准化、可复制、可推广的大模型行业应用落地路径,完善基础设施、公共平台建设,培育具有首都城市特色的行业模型。 (一)科研探索 基于国际科技创新中心建设,支持北京科研院所合作,探索AI for Science大模型助力科研新模式。在新药研发、基因测序、新材料分析、气象分析等基础学科领域,探索研发一批分学科的数据库和智能体,助力科研机构提高科研能力。(责任单位:市科委中关村管委会) (二)政务服务 面向政务咨询、业务办理等场景,推进大模型技术在接诉即办智能受理、智能办理中的试点应用,准确、及时、便利回应群众办事诉求。做好政务办公助手,依托京智、京办、京通平台,接入政策问答、流程管理等领域的大模型工具。立足公共服务海量基础数据,构建开放式城市大模型服务平台,打造智慧城市大脑,提升公共服务效能。(责任单位:市政务和数据局) (三)工业智能 用好工业企业场景,发挥工业科研院所在京聚集优势,面向各细分工业领域,搭建基础软件、工业软件、研发设计、中试验证、生产制造等大模型智能平台。通过大模型自然语言处理、数据分析处理、深度学习等能力,基于海量工业数据深度挖掘潜在规律,重塑工业产品研发生产流程和方式,探索新型工业化发展范式。(责任单位:市经济和信息化局) (四)金融管理 做好金融风控,推进银行、保险、证券等金融机构建设大模型风险评估与预警系统,加强内控合规管理、客户财况评估、违约概率预测,隐性关联挖掘以及欺诈检测等工作。优化信贷工具,研发金融合规大模型助手,探索大模型辅助生成信贷调查报告和授信审查报告。(责任单位:国家金融监管总局北京监管局、市委金融办) (五)空间计算 面向北京超大规模城市治理场景,前瞻布局城市空间计算系统,探索城市智能化管理机制。构建互联网地图数据、物联网传感数据和位置服务数据等多元融合的城市时空运行数据框架,打通“人-物-场”计算环节,构建区域级大模型。利用区域级大模型计算推理能力,在产业园区、商圈展会及城市系列公共区域开展先行先试,形成持续感知、信息挖掘、态势分析、辅助决策的成套智能体系,助力城市精细化治理和规划。(责任单位:市科委中关村管委会) (六)数字营销 面向数字人直播带货、客服服务、培训管理等新场景,研发大模型数字人交互知识库及工具,培育更自然的营销体验。升级大模型个性化推荐系统,提高营销效果,强化客户黏性。构建营销广告、文案大模型创作工具。优化营销员工培训流程,基于AIGC搭建虚拟仿真培训场景。(责任单位:市经济和信息化局) (七)司法服务 建设司法大模型,集成智能化的法律法规检索、法律咨询服务、法律风险评估、法律知识管理、司法数据分析等工具,推动司法仲裁和法律服务现代化智能化进程。(责任单位:市高级人民法院) (八)广电传媒 推进央视数字视听产业园、北京广播电视台人工智能融媒创新实验室建设,推动大模型赋能“北京大视听”精品创新工作。利用大模型创作能力,集成文本创作、视频生成、影视特效处理等功能,加速AIGC创作丰富内容,在影视领域形成一批新型工具和创新成果,丰富影视作品创意,提高创作效率和质量。(责任单位:市广电局) (九)电力保障 建设大模型电力管理与规划平台,实现大模型在电力智能巡检、电力优化调度、故障诊断维护等场景应用以及夏季高峰用电分析及缺口预警、绿电使用评估、电力网络及设备规划等功能。(责任单位:市城市管理委、市国资委) (十)内容安全 搭建内容安全大模型平台,强化技术治网能力,利用大模型加强对文本、图片、音视频等多模态内容的识别精度,自动高效处理超大规模内容审核业务,大幅降低人工成本,帮助平台企业提高安全合规能力,筑牢网络安全屏障。(责任单位:市委网信办、市公安局) 四、商业化应用 从小切口、实场景入手,围绕行业热点和社会关切,充分发挥大模型技术革新对行业应用的赋能作用。面向教育、医疗、文化、交通、政务、工业、金融、营销、司法、传媒、能源、影视、游戏、园林绿化等行业细分应用场景,支持大模型企业、系统集成服务商、行业用户等开展API调用、云端模型调优,模型私有化部署以及智能体、智能助手等大模型应用研发。鼓励大模型企业与设备厂商结对攻关,围绕电脑、手机、家电、汽车等新硬件终端,开发嵌入式大模型组件及智能系统。(责任单位:市经济和信息化局) 五、联合研发平台建设 布局建设一批北京市人工智能应用场景联合研发平台,通过整合行业资源和高质量数据、开放行业场景需求、建设联合研发环境,吸引汇聚优势创新团队,共同推动人工智能行业应用及产业落地。联合研发平台主要面向行业大模型相关技术产品的场景提供方和应用方,与大模型创新企业开展联合研发,共享场景资源、业务逻辑和行业知识,共同开发深度适配行业场景特点和需求的行业大模型产品,促进大模型新应用新产品实现落地。(责任单位:市科委中关村管委会) 六、保障措施 (一)组织实施 在全市人工智能统筹机制的领导下,市发展改革委、市经济和信息化局、市科委中关村管委会会同市教委、市卫生健康委、市委宣传部等相关单位,加快推进“人工智能+”行动计划的组织实施,协调解决大模型落地难题,探索大模型数据训练、行业应用中的包容监管和分歧解决机制,促进大模型在各领域应用落地。(责任单位:市发展改革委、市经济和信息化局、市科委中关村管委会、相关区、北京经济技术开发区管委会) (二)资源保障 建设运营北京算力互联互通和运行服务平台,为企业大模型训练、用户单位大模型部署,提供便捷泛在的算力支持。依托北京数据基础制度先行区,打造安全可信数据空间,引导企事业单位开放并汇聚高价值行业数据。建设数据训练基地,为大模型训练提供算力、数据、开发工具和开源社区等资源。推动数据分类分级管控和“监管沙盒”机制。支持基础大模型在各行业领域推广应用,鼓励以自主可控的基础大模型为底座加速训练细分行业垂类大模型,完善大模型应用工具链。鼓励开源高参数自主可控基础大模型,支持搭建模型和数据集托管云服务平台,促进开发者分享和协作。(责任单位:市经济和信息化局、市发展改革委、市通信管理局、相关区、北京经济技术开发区管委会) (三)资金支持 面向标杆应用工程、示范性应用,本市采用揭榜挂帅方式,组织模型企业、软件企业和行业用户结对攻关,其中标杆应用工程遴选1支攻关团队,示范性应用遴选不超过3支攻关团队。对重大标杆应用工程和示范性应用,按照项目工程投资予以一定比例支持,最高不超过5000万元。面向商业化应用,本市对基于标杆应用工程和示范性应用项目开展的API接口调用、云端模型调优,模型私有化部署以及嵌入式小模型、智能体、智能操作系统、智能助手等细分场景下的大模型应用落地项目发放模型券。模型券采用定期兑付方式,对各细分标杆应用工程、示范性应用以及企业可兑付的模型券金额设置上限,当年全市模型券可兑付总额不超过1亿元。面向人工智能应用场景联合研发平台,择优按照联合研发投入予以一定比例支持,最高不超过5000万元。(责任单位:市发展改革委、市经济和信息化局、市科委中关村管委会) (四)场景推广 深化本市通用人工智能产业创新伙伴计划,支持参与标杆应用工程、示范性应用的企事业单位以及商业化应用企业纳入伙伴计划。发挥协会联盟、数据交易所、咨询机构等中介组织作用,在模型供给、场景建设、社会投资、数据流通等方面搭建交流合作平台,加速大模型行业应用落地和生态构建。市经济和信息化局发布行业场景应用指引,定期征集重点行业典型应用案例,对入选指引的模型产品、应用案例、开发者、应用者加大宣传推广和奖励表彰,形成规模效应。(责任单位:市发展改革委、市经济和信息化局、市科委中关村管委会) (五)人才引育 加强人工智能领域高端人才的交流引进,完善人才服务保障机制。鼓励市属高校与大模型企业合作建设大模型产教融合创新平台,探索形成大模型应用实习实训机制。做好大模型人才培训,针对大模型企业对行业不了解、用户单位对大模型赋能路径不清晰的情况,全方位、多层次组织开展模型应用能力培训和案例教学,切实解决“最后一公里”的问题。(责任单位:市人才局、市教委、市发展改革委、市经济和信息化局、市科委中关村管委会) (六)安全保障 统筹高质量发展和高水平安全,督促指导大模型企业落实国家关于生成式人工智能服务的法律要求,坚持包容审慎监管原则,加快推动本市大模型按要求上线,编制大模型分级分类管理和安全评测标准,围绕真实场景开展大模型应用质量评估、伦理对齐等方面评测,促进大模型应用安全合规发展。夯实数据安全和个人隐私保障能力,完善面向大模型行业的数据漏洞、隐私泄露等风险监测体系,支持权威机构开发大模型风险监测平台,形成“安全态势感知+风险评估预警”运作机制。压实大模型服务开发者、使用方的主体责任,引导各方依法依规使用生成式人工智能技术,注意保护个人隐私、知识产权和秘密信息,促进人工智能产业向上向善发展。(责任单位:市委网信办、市科委中关村管委会、市公安局)
始祖鸟与 Skip 联手发布动力外骨骼
你有想象过,将机械安装在身体外,帮你突破人类极限吗? 七月底,Skip 公司与始祖鸟宣布了一款新的动力外骨骼设备。 这款名为「MO/GO」的软硬混合外骨骼可以提供 40% 的力量辅助,减轻股四头肌与腘绳肌的负担,帮助穿戴者行走,同时保护膝盖关节。据 Skip 公司创始人兼 CEO Zealand 描述,饱受膝盖疼痛的人们穿上 MO/GO 原型机后,可以轻松应对行走和上下楼梯的需求。不过她也讲到: 从「实验室可行」到成为人们日常使用的消费级产品,不只是技术问题,还有很多是可穿戴性方面的挑战,并且我对时尚一窍不通。 ▲ MO/GO 原型机 为此,Skip 找到几家服装合作伙伴,考虑到服装性能与形式,他们选择了一家专业的户外服装品牌——始祖鸟,从这款动力外骨骼的名字也可以看出端倪:MO/GO,意为山羊——世界上最会攀登高山的动物之一,可以在陡峭的山岩与复杂的地形快速稳定地移动,这是人类很难做到的事。 与始祖鸟合作,一方面可以解决 Zealand 关于外观与使用的担忧:在始祖鸟的帮助下,MO/GO 的最终形态为一套只有三个按钮的外骨骼系统与一条特制的 Gamma 长裤,全套总重量为 3 千克。整套系统由碳纤维材质与电机还有电池组成,电机为外骨骼能量驱动的核心,安装在 Gamma 长裤的膝盖外侧,帮肌肉分担负重;外骨骼的三个按钮分别是开关与加减档,以便根据使用环境的不同调整支撑力度。 另一方面,还可以借助始祖鸟的户外专业性与号召力:MO/GO 将在夏末秋初进行软启动,在大峡谷等徒步旅行目的地附近通过租赁形式提供给徒步爱好者,以匿名的方式收集艰难行走环境下的性能数据,再根据丰富的数据改进技术算法实用性。 不过,哪怕是热衷于徒步的爱好者,也很难接受高达售价 4500 美元的售价——这足以配齐一整套户外生存服装与必要设备,这也是为什么先以租赁形式提供给徒步爱好者的原因。 由于高昂的价格很大程度上限制了 MO/GO 在非行动受限人士中的使用,与大多数外骨骼设备一样,Skip 的最终目标还是在医疗领域,这与 Zealand 的项目设计初衷相符——受希望帮助自己祖母的启发,给更多有行动缺陷的人带去顺畅的行走体验。 从公司角度,这也是目前外骨骼设备研发与获利的最佳渠道。 目前,Skip 已将 MO/GO 送入临床试验,测试该设备在辅助帕金森病等情况下的有效性。将 MO/GO 归类为医疗设备可能需要数年时间,这过于漫长,在短期内,Skip 希望通过 FSA 覆盖系统降低用户价格。扩大制造规模也将有助于随着时间的推移平摊研发与生产成本,进一步降低价格。 ▲ 目前动力外骨骼最广泛的民用场景:医疗 大家也许对 Skip 这家公司有些陌生,这是因为它脱胎于 Alphabet 的 X Labs 保密项目。 Zealand 于 2019 年开始带领这项动力外骨骼的技术研发,直到 2023 年,全球大幅度削减成本,作为 Google 的母公司,Alphabet 也不能幸免,X Labs 的研发预算与资源大减,Zealand 选择与风投公司合作,创建了这家名为「Skip」的衍生公司,并迅速推出了 MO/GO,直到此时,这项保密技术才公布于世。 从 1937 年,源于动物体表的那层硬壳被「太空歌剧之父」E.E.Smith 借用后,「动力外骨骼」一词正式进入人类科幻想象,往后数十年,它的身影持续活跃于科幻小说、电影与游戏中,随着传感器、控制系统和材料的进步,外骨骼逐渐变得更轻便、高效和实用,民用外骨骼市场也随之活跃起来。 动力外骨骼,这个科幻想象中的装置已经逐渐进入现实世界。 虽然与人们想象中外形炫酷、功能奇妙的形式有所不同,但能让失去行动能力的人重新散步街头、不能登山的人再度看到山巅的风景,同样是一件足够科幻的事情。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。