产品分类:
加载中...
头条分类:
加载中...
英国要扩大在北极的军事活动?!
  英国《金融时报》近日报道称,英国政府在一份即将发布的报告中,呼吁扩大该国在北极地区的军事活动。   报道援引报告内容称:“英国应扩大在北极地区的军事活动,因为随着冰层融化使通航条件改善,该地区的争端越来越多,政府的国防报告将包含这一建议。” 英国《金融时报》报道截图   据报道,该报告由北约前秘书长乔治·罗伯逊领导的独立专家团队编写,英国政府要求他们研究英国面临的威胁,确定应对这些威胁所需要的能力,并评估英国军队的状态。   报告呼吁,英国应加大对无人机和尖端技术的投资。此外,报告还将确认英国向第六代隐形战斗机项目投资。   报道称,美国总统特朗普在安全政策上的转变,包括美国打算缩减在欧洲的军事资源等,引起北欧盟友的担忧。   报道援引英国皇家联合军种研究所高级研究员阿诺德的话称,“英国正面临向欧洲提供更多强硬的军事能力的压力”,“因为在情报、监视和侦察以及反潜战等方面,英国是唯一可以弥补美国缩减资源的国家”。   业内普遍认为,该报告一旦发布,英国皇家海军将获得比英国陆军更多的资源,未来能够更好地支援位于东欧的北约成员国。   据报道,英国政府计划在今年五六月份发布该报告。 英国游骑兵团骑着雪地摩托车巡逻(图自英国《金融时报》)   北极地区正日益成为多国角力的战略要地和地缘政治的热点区域。   北极地区蕴藏着丰富的石油、天然气、矿物和渔业资源,其油气储量约占全球未开发油气资源的四分之一。   此外,由于极地冰层不断融化,预计到2030年前后,北极西北航道和北方航道的商业与军事通航潜力将大幅提升。有分析认为,未来谁能在北极地区占据优势,就等于扼住了欧亚贸易的“咽喉”,可缩短航行距离约40%,显著降低对马六甲海峡、苏伊士运河等传统航道的依赖。 《外交政策》杂志报道截图
OpenAI爆出硬伤,强化学习是祸首!o3越强越“疯”,幻觉率狂飙
新智元报道 编辑:KingHZ 桃子 【新智元导读】o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。 满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据PersonQA基准测试,o3在33%的问题回答中产生了幻觉,几乎是o1(16%)的2倍。 而o4-mini的表现更加糟糕,幻觉率高达48%。 技术报告:https://cdn.openai.com/pdf/2221c875-02dc-4789-800b-e7758f3722c1/o3-and-o4-mini-system-card.pdf 甚至,有网友一针见血地指出,「o3对编写和开发超1000行代码的项目极其不利,幻觉率极高,且执行指令能力非常差」。 不管是在Cursor,还是Windsurf中,o3编码幻觉问题显著。 要知道,o3和o4-mini在Codeforces中成绩均超2700分,在全球人类选手中位列TOP 200,被称为OpenAI有史以来最好的编码模型。 它们验证了,Scaling强化学习依旧有效。 o3训练算力是o1的十倍 但为何随着模型参数规模Scaling,幻觉问题反而加剧? o3幻觉率至高,是o1两倍 过去,每一代新模型的迭代,通常会在减少幻觉方面有所进步,但o3和o4-mini却打破了这一规律。 更令人担忧的是,OpenAI目前也无法完全解释这一现象的原因。 技术报告中,研究团队坦言,「还有需要进一步研究来弄清,模型生成更多断言的问题」。 提前拿到o3内测资格后,非营利AI研究机构Transluce的测试,进一步印证了这一问题。 他们发现,o3在回答问题时,更倾向于「虚构」其推理过程中的某些行为。 比如,o3声称它在一台2021年款的MacBook Pro上运行代码,甚至声称是在ChatGPT之外复制的代码。 而且,这种情况出了71次。然而,事实是o3根本无法执行这样的操作。 前OpenAI研究员Neil Chowdhury表示,o系列模型使用的强化学习算法,可能是问题的根源。 RL可能会放大传统后训练流程中通常能缓解,但无法完全消除的问题。 强化学习「背锅」,编造根源找到了 首先,必须承认的是,幻觉问题并非是o系列模型独有,而是语言模型的普遍挑战。 而对于多数语言模型产生幻觉的原因,不外乎有这么几点: 1 预训练模型的幻觉倾向 预训练模型通过最大化训练数据中语句的概率进行学习。然而训练数据可能包含误解、罕见事实或不确定性,这导致模型在生成内容时容易「编造」信息。尽管后训练可以缓解这一问题,但无法完全消除。 2 讨好用户 RLHF训练可能激励模型会迎合用户,避免反驳用户的假设。 3 数据分布偏移 测试场景可能与训练数据分布不一致。 尽管这些问题是语言模型常见的失败模式,相较于GPT-4o,o系列模型的幻觉问题更为突出。 这背后,还有一些独特的因素。 RL推理训练副作用 作为推理模型,o系列采用了基于强化学习(Outcome-based RL)训练,专为解决复杂数学问题、编写测试代码而设计。 虽然这种方法提升了模型在特定任务上的表现,但也造成模型幻觉率飙升。 如果训练的奖励函数只关注正确答案,模型在面对无法解决问题时,没有「动力」去承认自己的局限。 相反,它可能选择输出「最佳猜测」,以期碰巧正确。而且,这种策略在训练中未受到惩罚,从而加剧了幻觉。 另外,工具使用的泛化问题,也不可忽视。 o系列模型在训练中,可能因成功使用「代码工具」而获得了奖励。即使在禁用工具的场景中,模型可能会「假想」使用工具来组织推理过程。 这种行为可能在某些推理任务中提高准确性,并在训练中被强化,但也导致模型虚构工具使用的场景。 真帮凶:CoT被丢弃 o系模型的另一个独特设计是「思维链」(Chain-of-Thought)机制。 在生成答案前,模型会通过CoT进行思考,但这一过程对用户不可见,且在后续对话中被丢弃。 事实上,它们可能在CoT中生成了看似合理但不准确的回答。比如,因为没有真实链接,o1曾生成一个了虚构的URL。 由于CoT在后续对话中被丢弃,模型无法访问生成前一轮答案的推理过程。 当你追问前一轮回答的细节时,模型只能基于当前上下文「猜测」一个合理的解释。 这种信息缺失,很难避免o3等不去编造信息。 o3很好,但过度优化是硬伤 在Ai2科学家Nathan Lambert最新一篇分析长文中,同样印证了这一问题: 强化学习给o3带回来了「过度优化」,而且比以往更诡异。 在任何相关查询中,o3能够使用多步骤工具。 这让ChatGPT的产品管理面临更大挑战:即便用户未触发搜索开关,模型也会自主联网搜索。 但这同时标志着语言模型应用开启了新纪元。 比如,Nathan Lambert直接问o3:「你能帮我找到那个长期以来被RL研究人员使用的,关于摩托艇过度优化游戏的gif吗?可能像是波浪破碎器之类的?」 过去,他至少需要15分钟,才能手动找到这个。 现在o3直接提供了准确的下载链接,而Gemini等AI则逊色很多。 与o3精彩互动:几乎立刻找到需要的GIF 多个基准的测试成绩,证明o3非常出色。OpenAI认为o3在许多方面比o1更强大。 o3是持续扩展RL训练计算资源时的产物,这也提升了推理时的计算能力。 但这些新的推理模型在智能上「孤峰凸起」,在有些方面并没有奏效。 这意味着有些交互令人惊叹,感觉像是与AI互动的全新方式,但对于一些GPT-4或Claude 3.5早已熟练掌握的普通任务,o3等新推理模型却彻底失败了。 这涉及到强化学习中的「过度优化」(over-optimization)问题。 RL过度优化,o3更严重 OpenAI o3模型展现了全新的推理行为模式,但过度优化是硬伤。 过度优化(Over-optimization)是强化学习(RL)领域的经典问题。 无论是传统强化学习、催生出ChatGPT的人类反馈强化学习(RLHF),还是当前新型推理模型中出现的情况,都呈现出独特的表现形式和不同影响。 当优化器的能力超过它所依赖的环境或奖励函数时,就会发生过度优化。 在训练过程中,优化器会钻漏洞,产生异常或负面的结果。 Ai2的科学家举了一个例子。 在Mujoco仿真环境中,评估深度强化学习算法时,发生了过度优化: 「半猎豹」(half-cheetah)模型本该学习奔跑,却用连续侧手翻最大化了前进速度。 o3表现出新型过度优化行为。 这与它创新训练方式密切相关。 最初的推理模型主要训练目标是确保数学和代码的正确性,而o3在此基础上新增了工具调用与信息处理能力。 正如OpenAI官方博客所述: 利用强化学习,我们还训练了这两款模型去使用工具——不仅教会它们如何使用工具,还让它们学会判断何时该使用工具。 它们根据预期结果来部署工具的能力,让它们在开放式任务中更加高效——特别是在涉及视觉推理和多步骤工作流的情况中。 这些训练中的绝大多数子任务都是可验证的。 这种新的训练方法确实提升了模型的实用性,但只对过去用户习惯使用的任务。 但目前还无法规模化地「修复」模型在训练过程中产生的怪异语言表达。 这种新的过度优化并不会使模型的结果变差,它只是让模型在语言表达和自我解释方面变得更差。 o3的一些奇怪表现让人感觉模型还没完全成熟,比如在编程环境中使用了无效的非ASCII连字符的这个例子。 越来越多的用户好奇:o3到底发生了什么? Karpathy当年评价初代推理模型时的名言: 当模型在思维链中开始不说人话时,你就知道强化学习训练到位了。 如今模型输出的这些怪异幻觉,本质上就是行为版的「不说人话」。 o3的行为组件使其比Claude 3.7漏洞百出的代码更有研究价值,或许也相对不易造成实际损害。 奖励黑客,AI学会钻空子 METR发现,o3是在自主任务中能独立操作最久的模型,但也注意到它有倾向于「篡改」它们的评分。 听起来是不是很熟悉? 事实上,奖励机制被钻空子(reward hacking)的例子比比皆是! 来自OpenAI最近论文的奖励黑客攻击例子: 左右滑动查看 论文链接:https://openai.com/index/chain-of-thought-monitoring/ 从科学角度来看,这确实是非常有趣且引人深思的—— 模型到底在学习什么? 与此同时,考虑到安全问题,大家对AI模型的广泛部署保持警惕,就很有道理。 但目前看来,大家还没有看到过于令人担忧的情况,更多的是效率低下和一些混乱的例子。 总结一下强化学习(RL)不同阶段中,看到的三种过度优化类型: 控制时代的RL:过度优化发生是因为环境脆弱,任务不现实。 RLHF时代:过度优化发生是因为奖励函数设计糟糕。 可验证奖励强化学习(RLVR2)时代:过度优化发生,使模型变得超级有效,但也变得更加奇怪。(还有更多尚未发现的副作用) 这种过度优化确实是一个需要解决的问题,因为语言模型的可读性是其一个重要优势。 Nathan Lambert相信通过更复杂的训练过程,这个问题是可以缓解的。 但OpenAI急于尽快推出模型,解决这个问题需要更多时间。 据报道,OpenAI的部分测试人员,只有不到一周的时间对即将推出的重要产品进行安全检查。
普京宣布复活节停火30小时 泽连斯基称不足以建立信任
  俄罗斯总统普京当地时间19日下令,在今年东正教复活节到来之际俄军暂时停火30小时。他同时指出,俄军必须做好准备,“击退敌人可能违反停火的行为、挑衅以及任何进攻行动”。乌克兰总统泽连斯基则提议将停火期限延长至复活节之后,称30小时不足以建立真正的信任。   01   俄单方面宣布停火30小时    据俄罗斯总统社交媒体账号19日公布的消息,普京在会见俄罗斯武装力量总参谋长格拉西莫夫时说,在复活节20日到来之际,从莫斯科时间(同基辅时间)19日18时至21日0时(北京时间19日23日至21日5时),俄军将停止所有战斗行动。俄方希望乌克兰方面能效仿俄方做法。   俄罗斯国防部在一份声明中说,已向特别军事行动区域内所有部队发出停火指示,并表明只要乌方尊重停火协议,俄军将遵守协议。   普京表示,俄方停火行为将检验乌方停火诚意、是否有遵守停火的能力,以及参加和平谈判和消除乌克兰危机最初根源的意愿和能力。他说,战场形势正朝着对俄军有利方向发展,俄军正满怀信心地逐步向前推进。   格拉西莫夫在会见时说,俄军正在完成对库尔斯克地区的最终控制,并挫败乌军进攻别尔哥罗德地区的企图。   同日,俄罗斯国防部通过社交媒体发布消息说,俄乌双方各向对方移交246名被俘人员。俄方还向乌方移交31名受伤战俘,作为交换,15名俄军被俘伤员被乌方释放。此次俄乌互换被俘人员由阿拉伯联合酋长国斡旋。   02   泽连斯基提议停火延至复活节后 △泽连斯基(资料图)   乌克兰总统泽连斯基19日在社交媒体发文,提议将停火期限延长至20日复活节之后。按照泽连斯基说法,这将检验俄方真实意图,因为30小时不足以建立真正的信任措施,而30天或能为和平创造契机。   泽连斯基说,俄方已持续39天未对美国方面提议的全面无条件停火30天给予回应,如果俄方此刻突然表态愿加入全面无条件停火框架,乌克兰将采取对等回应,即俄方如何行动,乌方将如何应对。   同时,泽连斯基指责俄方违反自己提出的停火承诺。他说,根据乌军战报,俄军目前仍在部分地区推进突击行动,亦未停歇炮火。乌军严阵以待,将实施对等反制,“每一发俄军炮弹都将遭到充分回击”。   乌克兰总统办公室主任叶尔马克指出,对于停火,乌方将以静默回应静默,以停火回应停火。如要实现停火,就应将停火期限延续至20日之后,俄罗斯必须全面无条件停火,通过永久停火来结束冲突。   03   特朗普政府对斡旋失去耐心?   舆论注意到,俄乌双方围绕复活节停火的“互动”发生在特朗普政府对斡旋俄乌冲突日益“失去耐心”之际。 △特朗普(资料图)   美国总统特朗普18日表示,如果围绕乌克兰问题的谈判无法在短期内取得明确进展,美方将不再参与斡旋。按照他的说法,如果某一方或双方让谈判变得非常困难,“我们将不再参与其中”。   美国国务卿鲁比奥同日表示,关于乌克兰问题的谈判不能一直停滞,如果短期内看不到俄乌双方达成一致的信号,美方将不会继续撮合。“如果可行,我们就参与;如果不可行,我们还有其他需要关注的重点。”   路透社分析,鲁比奥的上述表态凸显特朗普政府对于在推进解决日益增多的地缘政治挑战方面缺乏进展产生了“日益强烈的挫败感”。   特朗普在竞逐2024年美国总统选举期间声称,自己当选后将在“24小时内”结束俄乌冲突。如今,特朗普重返白宫即将满三个月。
深观察丨美国“断供”加剧全球人道危机
  美国新一届政府今年1月上台后,以“优化资金效率”等为借口大幅削减对外援助资金,紧急叫停已签署协议的对部分国家的粮食援助项目,同时以拖欠国际组织会费等方式系统性破坏多边合作,致使全球人道主义事业骤然面临少有的严峻挑战。 “这将让过去25年的所有努力付诸东流”   在阿富汗首都喀布尔,国际人道主义组织“反饥饿行动”的病房里如今已空无一人。美国援助资金的断供,让这个国家三分之一依赖紧急人道援助生存的民众,尤其是儿童陷入绝境。   据联合国世界粮食计划署统计,今年阿富汗将有超过350万儿童患有严重营养不良,比上一年增加20%。 世界粮食计划署官网截图   美国此前承担了阿富汗国际人道援助资金的43%。然而,其资金链的突然断裂导致当地关键人道主义项目被迫停摆,食品供应锐减。   “反饥饿行动”组织在当地的负责人科比·里特维尔德警告说,由于资金严重短缺,将会有更多阿富汗儿童死于营养不良。 美联社报道截图   在数千公里之外的肯尼亚卡库马难民营,难民们高举“医疗是人权”“水就是生命”等标语走上街头抗议物资短缺。   卡库马难民营收容了来自南苏丹、埃塞俄比亚、索马里等国的超过20万难民。   美国政府自今年起单方面终止了对肯尼亚等多国的援助,令难民营里本来就捉襟见肘的食品配给雪上加霜。   世界粮食计划署警告说,美国中断紧急粮食援助相当于是对千百万面临极端饥饿的民众“判处死刑”。 法国《世界报》报道截图   在非洲大陆,没有什么疾病比疟疾更致命,尤其是对儿童而言。   根据世界卫生组织的数据,2023年全球估计有59.7万人死于疟疾,其中95%来自非洲。   在受疟疾影响最严重的三个非洲国家——尼日利亚、刚果(金)和乌干达,抗疟药物和经过杀虫剂处理的蚊帐就像当地人的日常必需品,必须持续供应。但随着美国出资的中止,这些物资正在逐渐耗尽。   用乌干达疟疾控制项目负责人吉米·奥皮戈医生的话说,一场灾难即将来临。   奥皮戈:“药品、检测试剂盒、蚊帐和喷洒设备等物资需要在海外生产,然后运送到这里的仓库,再分发到服务点。目前这一过程已经中断,而服务点的物资即将耗尽,最多只能维持一个月。因此,灾难将在本月底显现。”   总部位于华盛顿的“无疟疾”组织称,新的模型显示,抗疟物资供应链中断仅一年,就将导致全球新增近1500万病例和10.7万死亡病例。 《印度斯坦时报》报道截图   此外,尽管美国曾参与非洲抗击艾滋病工作,但其新一届政府的资金断供完全无视受援国的需求,致使南非等许多非洲国家的抗艾工作陷入停滞。   南非德斯蒙德·图图艾滋病中心主任琳达-盖尔·贝克尔告诉记者,美国取消对当地抗艾组织的资助将导致“超过50万不必要的死亡以及多达50万新增感染病例”,使有关方面“过去25年的所有努力付诸东流”。 英国《卫报》报道截图 “许多人将因为援助的枯竭而死亡”   世界卫生组织总干事谭德塞上个月警告说,美国突然削减对全球卫生项目的资金支持,可能使国际社会防治疟疾、艾滋病、结核病和麻疹等疾病所取得的进展发生逆转。此外,削减资金也将阻碍根除脊髓灰质炎、监测禽流感以及应对疾病暴发和人道主义危机的努力。   因此,谭德塞敦促美国与受影响国家进行对话,以便制定更可持续的解决方案,避免造成生命损失。 土耳其阿纳多卢通讯社报道截图   美国的资金断供还导致国际组织与多边合作受损。   联合国人道主义事务协调厅近日发表公开信说,由于资金遭遇“残酷削减”,尤其是美国政府大幅叫停对外援助,该机构将不得不裁撤20%、即500多名工作人员。   联合国分管人道主义事务的副秘书长兼紧急救援协调员汤姆·弗莱彻表示,联合国人道主义事务协调厅2025财政年度总预算为4.3亿美元,但美国等国家削减援助导致该机构面临近6000万美元的资金缺口。   “我们所面临的资金削减的速度和规模无疑是对人道主义援助领域的巨大冲击。许多人将因为援助的枯竭而死亡。” 路透社报道截图(题图为汤姆·弗莱彻)   联合国秘书长古特雷斯此前曾表示,美国大幅削减对外援助无异于一场人为制造的“人道主义地震”,将对世界上最弱势群体造成严重伤害,不仅让世界更不健康、更不安全,也有损美国自身利益。 路透社报道截图   以“美国优先”之名行“全球脱责”之实,美国政府这种将国内政治凌驾于国际人道契约之上的自私行径不仅再次侵蚀了多边主义的根基,更是严重透支了美国自身的国际信誉。   正如一些分析人士所警告的那样,当对外援助成为美国国内政治博弈的筹码,所有人都是输家。
数读中国经济一季报 重要经济指标“暖”勾勒稳中向好“新”答卷
   央视网消息:关注重要经济指标,读懂中国经济答卷。根据国家统计局发布的一季度经济数据,我们采访了经济专家进行解读。首先来看工业,今年一季度,我国工业延续较快增长态势,产业升级步伐加快,新质生产力加速培育,为经济增长提供了新的动力。   在这份一季度的中国经济答卷上,可以看到,全国规模以上工业增加值延续较快增长态势,同比增长6.5%,较1—2月份加快0.6个百分点,较上年全年加快0.7个百分点。在工业41个大类行业中,38个行业增加值同比增长,增长面为92.7%。   国家发展改革委国家信息中心宏观经济研究室副主任邹蕴涵称:“说明整个工业的增长保持了一个节节走高、蓬勃向上的态势。在这里边,有几方面的积极的影响来支撑工业的增长,第一方面是累积效应,也就是过去持续发力推动产业升级,这里边非常突出的就是高技术制造业的增长。”   透过这份答卷可以看到,高技术制造业增加值同比增长9.7%,其中,光纤制造、航空航天相关设备制造、集成电路制造等行业增加值分别增长22.5%、22.4%和21.1%。   工业新动能的不断壮大也使得数字化生产持续赋能产业向智能化转型。一季度,数字产品制造业同比实现两位数增长,智能无人飞行器制造、智能车载设备制造、服务器等行业增加值分别增长49.6%、25.0%和66.3%。   专家表示,今年一季度,高技术制造业的增长达到了2022年6月以来累计增速的新高点,展现出了非常良好的一个增长态势。   国家发展改革委宏观经济研究院研究员张林山称:“我国制造业正在向高端化、智能化、绿色化迈进,产业升级步伐加快,新质生产力加速培育。半导体、生物医药等领域技术创新不断取得新进展,数字经济渗透率持续提高,推动了高技术制造业和装备制造业的快速发展,为经济增长提供了新的动力。”      中国经济一季报:内外合力 进一步释放消费潜力   接下来看消费,今年一季度,消费保持比较良好的态势,通过内外合力,进一步释放了消费潜力。    在这份一季度的中国经济答卷上,可以看到,社会消费品零售总额124671亿元,同比增长4.6%。其中,多数商品类别保持增长,以旧换新商品销售良好。限额以上单位通讯器材类、家用电器和音像器材类、家具类商品零售额同比分别增长26.9%、19.3%和18.1%。服务零售额同比增长5.0%,增速比1—2月份加快0.1个百分点,高于同期商品零售额增速。   邹蕴涵称:“整个一季度的消费保持了比较良好的态势。它有个非常突出的特征是内外合力。内就是指消费的内生增长动力,服务消费增长比较快,成为拉动消费增长的一个非常重要的动力。外是指政策发力,也就是今年消费品以旧换新的加力支持政策,推出早、时机准、见效快,效果也比较持久,对于整个支撑社会消费品零售总额的增长发挥了非常重要的作用,进一步释放了消费潜力。”   透过这份答卷,可以看到,随着县域商业建设不断推进,县乡消费市场活力日益增强。包含镇区和乡村地区的县乡消费品零售额占社会消费品零售总额的比重为40.2%,比上年同期提高0.1个百分点。其中,乡村消费品零售额16614亿元,同比增长4.9%。   国务院发展研究中心市场经济研究所研究员陈丽芬称:“数字化带动了就业的下沉,也带动了消费的下沉,像外卖即时零售,在县域的渗透率也越来越高,还有越来越多的老百姓会选择到县域去旅游。县乡消费活力日益增强,占比也稳步提升,县乡消费成为消费增长的一个新动能。”    中国经济一季报:制造业投资快速增长 企业对未来信心增强   今年一季度,我国固定资产投资增速加快,设备购置投资实现较快增长,高技术产业投资增势良好,投资结构持续优化升级。   在这份一季度的中国经济答卷上,我们可以看到,随着大规模设备更新政策持续加力推进,设备购置投资增长也在提速,一季度设备工器具购置投资同比增长达19.0%,比全部投资高14.8个百分点,对全部投资增长的贡献率超6成。   邹蕴涵称:“今年一季度,固定资产投资的累计增速为4.2%,其中大规模设备更新政策起到非常好的支撑作用,设备工器具投资对于带动整个投资发挥了非常关键的作用。”   透过这份答卷,可以看到,今年以来随着重大项目建设加快,基础设施投资拉动效应不断提高。一季度,基础设施投资同比增长5.8%,拉动全部投资增长1.3个百分点。   透过这份答卷,可以看到,我国制造业高端化、智能化、绿色化扎实推进,新动能持续发展壮大。一季度制造业投资同比增长9.1%,制造业技改投资增长7.2%。与高技术产业投资有关的信息服务业投资、专业技术服务业投资以及航空、航天器及设备制造业投资均保持两位数增长。   张林山称:“基础设施投资的增长有助于改善营商环境,为经济的长期增长和发展奠定基础;制造业投资的快速增长则体现了企业对未来市场的信心,以及对技术创新和产业升级的积极投入。信息服务业、航空航天器等一些产业投资的高速增长,反映出我国在新兴产业领域的布局不断深化,新质生产力正在加速形成。”
OpenAI o3模型基准测试成绩遭质疑,实测分数远不及宣称
IT之家 4 月 21 日消息,OpenAI 的 o3 人工智能模型的第一方与第三方基准测试结果存在显著差异,引发了外界对其公司透明度和模型测试实践的质疑。 去年 12 月,OpenAI 首次发布 o3 模型时宣称,该模型能够在 FrontierMath 这一极具挑战性的数学问题集上正确回答超过四分之一的问题。这一成绩远远超过了竞争对手 —— 排名第二的模型仅能正确回答约 2% 的 FrontierMath 问题。OpenAI 首席研究官 Mark Chen 在直播中表示:“目前市场上所有其他产品在 FrontierMath 上的成绩都不足 2%,而我们在内部测试中,使用 o3 模型在激进的测试时计算设置下,能够达到超过 25% 的正确率。” 然而,这一高分似乎是一个上限值,是通过一个计算资源更为强大的 o3 模型版本实现的,而并非是 OpenAI 上周公开发布的版本。负责 FrontierMath 的 Epoch 研究所于上周五公布了其对 o3 模型的独立基准测试结果,发现 o3 的得分仅为约 10%,远低于 OpenAI 此前声称的最高分数。 这并不意味着 OpenAI 故意撒谎,该公司在 12 月份公布的基准测试结果中也包含了一个与 Epoch 测试结果相符的较低分数。Epoch 还指出,其测试设置可能与 OpenAI 有所不同,并且其评估使用了更新版本的 FrontierMath。Epoch 在报告中写道:“我们与 OpenAI 的结果差异可能是因为 OpenAI 在内部评估时使用了更强大的计算框架、更多的测试时计算资源,或者是因为这些结果是在 FrontierMath 的不同子集上运行的(例如 2024 年 11 月 26 日版本的 180 个问题与 2025 年 2 月 28 日私有版本的 290 个问题)。” 此外,ARC Prize 基金会(一个测试了 o3 预发布版本的组织)在 X 平台上发布消息表示,公开发布的 o3 模型是一个“针对聊天 / 产品使用进行了调整的不同模型”,这进一步证实了 Epoch 的报告。ARC Prize 还指出:“所有发布的 o3 计算层级都比我们测试的版本要小。”一般来说,更大的计算层级通常可以获得更好的基准测试分数。 值得注意的是,尽管公开版本的 o3 未能完全达到 OpenAI 测试时的表现,但这在一定程度上已不再是关键问题,因为该公司后续推出的 o3-mini-high 和 o4-mini 模型在 FrontierMath 上的表现已经优于 o3。此外,OpenAI 计划在未来几周内推出更强大的 o3 版本 o3-pro。 然而,此事再次提醒人们,人工智能基准测试结果最好不要完全照单全收,尤其是当结果来自一家有产品需要销售的公司时。随着人工智能行业竞争的加剧,各供应商纷纷急于通过推出新模型来吸引眼球和市场份额,基准测试“争议”正变得越来越常见。 IT之家注意到,今年 1 月,Epoch 因在 OpenAI 宣布 o3 之后才披露其从 OpenAI 获得的资金支持而受到批评。许多为 FrontierMath 做出贡献的学者直到公开时才知道 OpenAI 的参与。最近,埃隆・马斯克的 xAI 被指控为其最新的人工智能模型 Grok 3 发布了误导性的基准测试图表。就在本月,Meta 也承认其宣传的基准测试分数所基于的模型版本与提供给开发者的版本不一致。
无人驾驶下半场,开始拼起“人性化”
“眼睛看不到,怎么找车呢?”“它走了,我的天呐。”去年11月,生活在武汉的视障女孩黄莺决定出门体验一下无人驾驶,没想到出师不利,第一次打车就因为停车地点找寻困难遭遇了“拒载”。 第二次成功上车后,借助车内语音交互功能,她还误打误撞点了一首歌,Zara Larsson的《Lush Life》。行程结束后,黄莺将自己的出行体验反馈给了萝卜快跑,并建议官方可以升级更多的无障碍功能,帮助更多视障人群独立走出家门。 黄莺自己也没想到,她的这次经历,让全国1700万视障群体的需求开始被“看见”和关注。 不久前,包含蓝牙自动解锁、语音开关车门、全场景语音交互在内的“无障碍关爱功能”,在萝卜快跑上线。 随着AI技术与出行方式进一步融合,哪怕黄莺这类小众群体的安全出行需求,也开始得到科技公司的重视和尊重。 这也向外界传递出了一种新的信号:如果说新能源汽车竞争正在从上半场的电动化,进入下半场的智能化,那么,对于无人驾驶出行领域而言,其也在迎来一些新的变化——竞争正从上半场的智能化,进入下半场的人性化大考验。 不过,技术本身通常有明确的标准,但对人性化的思考,却仁者见仁,考验着一个公司技术创新的出发点。 2013年,世界卫生组织发布《道路安全全球现状报告》,每年全球有124万人因交通事故丧生,而超速、酒驾、疲劳驾驶等人为因素是道路安全最大的风险。 彼时,怀揣着”用无人驾驶技术消除人为因素导致的交通事故“的梦想,全球科研中心竞相投入自动驾驶技术研发。 这一年,谷歌刚刚定下发展无人驾驶汽车的目标, Cruise也才刚刚成立。也是在这一年,百度开始了无人驾驶技术的布局,并于2017年推出了全球首个自动驾驶开放平台Apollo。 8年过去了,如何用技术消除人为因素导致的交通事故,让更多人享受到更安全出行体验,始终是百度Apollo发展无人驾驶技术的重心。 今年2月,百度创始人李彦宏在世界政府峰会与阿联酋AI部长奥马尔·苏丹·奥拉马对谈时分享了一个数据:无人驾驶比人类司机安全十倍,从萝卜快跑的实际记录来看,出险率仅为人类驾驶员的1/14。 用无人驾驶技术挽救更多生命,让出行更安全,是百度对“人性化”的思考,也是技术创新的起点。 字母榜(ID:wujicaijing)获悉,百度Apollo发布的八周年内部信中提到,在过去的2024年,除了继续追求技术突破、产品和服务创新之外,百度Apollo更加关注用户更多场景的出行需求,让多样化的出行体验都更安全、更便捷。 信中提到:去年跨过“无人化”技术门槛后,萝卜快跑更进一步,针对用户夜间出行需求,提供7*24小时全天候的无人化出行服务;为了解决恶劣天气下打车需求大、供给少的问题,萝卜快跑通过优化智能调度系统,逐渐成为城市运力的新补充渠道。 百度集团副总裁、智能驾驶事业群组总裁王云鹏在内部信中提到,在萝卜快跑1000多万的订单当中,节假日、早晚高峰、凌晨、夜间、雨天的订单占比超过53%。 这些不为人知的改变,是百度Apollo进入无人驾驶下半场,对“人性化”做出的具体诠释。 “安全,是最大的人性化”。 对百度Apollo而言,安全,是绝对的底线。去年5月,百度Apollo发布了全球首个支持L4级自动驾驶的大模型Apollo ADFM。 Apollo ADFM大模型之外,萝卜快跑还通过硬件产品层和安全架构层的升级等系列设计,达成了高达10重的安全冗余方案。仅在硬件感知方面,萝卜快跑第六代无人车就配备了40个传感器集群,能够实现超440米的超距探测,是人类目视极限的7倍,尽可能提升用户出行的安全上限。 这也使得萝卜快跑在面对复杂和极端的驾驶环境时,能够始终保持高效、安全、稳定的运行。 无人车安全能力的提升,直接带动着用户接受度的提高。 技术迭代进步之下,现在的萝卜快跑,早已非吴下阿蒙,频频引得用户在体验后对其刮目相看。被AI训练地越来越聪明的萝卜快跑更加灵活,在遵守交规的情况下完成加速、变道和超车等一系列操作,从武汉市民口中的“苕萝卜”,变成了用户喜爱的 “好萝卜”。 在国内市场取得用户认可的规模优势后,萝卜快跑正计划将这股科技向善的风暴,推向更广阔的海外市场。 继2024年11月获得香港首批自动驾驶车辆先导牌照并开启道路测试后,近期,萝卜快跑出海方面再次提速。 3月份以来,萝卜快跑在中东地区连下两城:与迪拜道路交通局(RTA)签署战略合作协议,率先在迪拜市区开展无人驾驶规模化测试和服务,双方计划,将在迪拜部署超过1000台全无人驾驶汽车;与阿联酋自动驾驶出行公司Autogo达成战略合作,双方将致力于持续扩大车队规模,打造阿布扎比地区规模最大的无人车队。 用户和市场是检验技术的唯一标准,反过来,也牵引着技术、产品和服务持续发展。未来,借助更多用户群体的使用和认可,萝卜快跑的规模效应有望得到强化,并从规模效应中反哺技术创新的涌现。 两天前,黄莺分享了带妈妈和朋友乘坐萝卜快跑兜风的视频。视频中,黄莺熟练地操作萝卜快跑“无障碍关爱”功能。“今天我的体验很成功,不是因为科技本身,而是因为有人愿意倾听我们的声音。未来希望更多的创新,都能像这样‘看得见’所有人。” 被看见的背后,则是百度Apollo对提升更多人出行安全初心的践行。 好的科技从来都不是高高在上,只有那些能够飞入寻常百姓家的技术,才会真正迎来大规模的应用落地。这也能够侧面反映出,走过八个年头的百度Apollo,内部为何正在发生新的改变。
世界首个,阿联酋要用AI制定法律
阿联酋要使用AI协助立法 凤凰网科技讯 北京时间4月21日,据《金融时报》报道,阿联酋计划利用人工智能(AI)来协助制定新立法,审查和修订现有法律,这是该海湾国家迄今为止在推动AI应用方面最激进的一次尝试。目前,阿联酋已在AI上投入了数十亿美元。 阿联酋官媒将这一计划称之为“AI驱动的法规”(AI-driven regulation)。AI研究人员称,该计划比其他国家所采取的措施更进一步,但他们同时也指出计划的细节还不够明确。其他政府也在尝试利用AI提升效率,例如总结法案内容、改善公共服务提供方式等,但尚未有国家像阿联酋这样,计划通过分析政府和法律数据,主动提出对现行法律的修改建议。 阿联酋副总统、迪拜酋长谢赫·穆罕默德·本·拉希德·阿勒马克图姆(Sheikh Mohammad bin Rashid Al Maktoum)表示,“这一由AI驱动的新立法体系将改变我们制定法律的方式,使立法过程更快、更精准”。谢赫·穆罕默德称,AI将“定期为我们立法提出修订建议”。内阁会议纪要显示,阿联酋政府预计AI将使立法工作提速70%。不过,专家也指出,AI存在可靠性问题。 上周,阿联酋内阁批准设立一个新的内阁机构:法规智能办公室(Regulatory Intelligence Office),以负责推进这项AI推动立法的计划。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
可编程芯片首次用光训练神经网络
IT之家 4 月 21 日消息,据最新一期《自然・光子学》杂志报道,美国宾夕法尼亚大学的工程师们开发了首款能够利用光进行非线性神经网络训练的可编程芯片。 该芯片可以使用光来训练非线性神经网络 —— 这一突破可以显著加快 AI 训练速度,减少能耗,甚至为全光计算机铺平道路。 ▲ 芯片内部的图像 —— 白色虚线框是输入,黄色虚线框是输出 当前的 AI 芯片是电子的,依赖电力进行计算,而这款新芯片是光子芯片。在《自然・光子学》杂志的描述中,这款芯片改变了光的行为,以执行现代 AI 核心中的非线性数学。 目前大多数 AI 系统都依赖于神经网络,这是一种模仿生物神经组织的软件。正如神经元连接起来使生物体能够思考一样,神经网络通过连接简单单元或“节点”的层,使 AI 系统能够执行复杂任务。 该团队的突破始于一种特殊的半导体材料,它能对光做出反应。当一束“信号”光(携带输入数据)穿过该材料时,一束从上方照射的“泵浦”光束调整材料如何反应。 通过改变泵浦光的形状和强度,团队可以控制信号光的吸收、传输或放大,这取决于光的强度和材料的行为。这个过程“编程”芯片执行不同的非线性函数。 值得注意的是,这项研究并未改变芯片的基础结构,而是利用光在材料内部形成的图案来重塑光线穿越的方式。这造就了一个可以根据泵浦模式表达多种数学函数的可重构系统,使其具有实时学习能力,能根据输出反馈调整自身行为。 为了验证该芯片的能力,团队用其解决了多项基准 AI 问题。在简单的非线性决策边界任务中,实现了超过 97% 的准确率;在著名的鸢尾花数据集问题上,达到了 96% 以上的准确率。这表明,与传统数字神经网络相比,光子芯片不仅性能相当,甚至更优,而且能耗更低,因为它们减少了对耗电元件的依赖。 此外,实验还显示,只需 4 个非线性的光学连接就能达到传统模型中 20 个固定非线性激活函数线性电子连接的效果,展示了该技术的巨大潜力。随着架构的进一步扩展,效率将更加显著。 不同于以往制造后固定的光子系统,这款新芯片提供了一个空白的平台,可通过泵浦光的作用如同画笔般绘制出可编程指令,是现场可编程光子计算机概念的一次实际证明,标志着向光速训练 AI 迈进的重要一步。
三个月三度来华:黄仁勋穿上了西装,力争中国市场
撰文 / 周 洲 设计 / 赵昊然 来源 / Bloomberg,by Catherine Thorbecke;NIKKEI,by Ryohtaroh Satoh 在美国宣布禁售专供中国市场的H20芯片之后,芯片巨头英伟达创始人兼CEO黄仁勋紧急来华。 4月17日,现身北京首都国际机场的黄仁勋罕见地脱下了皮衣,换上西装,以示规格与重视。 这是继1月春节年会、3月商务洽谈后,黄仁勋三个月内第三次来华。 皮衣黄变身为西装黄的背后,是他在贸易战的压力下对中国市场的力争。 中国区贡献了英伟达全球13%的营收,约171亿美元(1245亿元人民币),且过去三年增速超过495%。中国市场在其数据中心业务中占比约20%—25%。 腾讯、阿里巴巴、字节跳动等中国科技大公司是英伟达的重要客户,同时,英伟达与理想汽车、长城汽车、极氪、小米、比亚迪等车企在智能辅助驾驶系统以及汽车芯片方面有合作。 黄仁勋表态称:“中国是英伟达战略版图的支柱。” 对奉行“粗糙的公平”经营理念的黄仁勋来说,如何在混乱的政治局势、敏感的行业竞争中实施平衡术保证业务增长,是极大的考验。 与此同时,被特朗普的关税闪电战伤到的盟友日本,由丰田汽车、日产汽车和本田汽车组成的财团ASRA正在牵头讨论下一代汽车芯片的标准化设计,并希望在2029年3月前完成,欲在一片乱局中抢回丢失的汽车智能化机会。 H20突又被禁 一贯不按常理出牌的特朗普,令英伟达损失惨重。 美国商务部4月15日升级的出口管制,让英伟达损失了55亿美元的费用。随后,该公司股票在盘后交易下跌超过6%。 升级的出口管制卡住了输华的H20芯片,更掐断了其通过新加坡中转的灰色渠道。 H20芯片被视作H100的“阉割版”。 受到美国对华禁售政策的影响,英伟达不允许提供给中国最先进的AI芯片,诸如A100、H100、H800等。 虽然H20的综合算力仅相当于H100的20%,但在大语言模型(LLM)推理方面却比H100快了20%以上,还能无缝接入现有的CUDA生态,大幅降低开发成本。 名为幻方量化的杭州创业公司正是使用H20芯片训练AI,诞生了火遍全球的DeepSeek。 特朗普表示:“DeepSeek模型给美国敲响了警钟,必须集中精力参与竞争!” 在一周前的海湖庄园晚宴上,黄仁勋在弗罗里达的夜色中,用价值5000亿美元、投资AI数据中心的支票,换取了特朗普对H20芯片出口管制的松动——特朗普称,暂停对H20的出口管制。 一周后的反水,令英伟达措手不及。 出尔反尔的混乱局面在华盛顿已经司空见惯。 特朗普一直模糊着科技和国家安全之间的界限,他对高科技的管制早于现在掀起的贸易闪电战。 芯片和算力一直是硅谷在AI领域领先全球的核心竞争力,中国正在努力缩小差距。华盛顿不断收紧芯片的限制措施,虽然漏洞百出,倒是为美国赢得了时间。 但是,如果没有国际合作,这些限制措施将毫无成效。美国不得不说服荷兰和日本这两个半导体供应链关键环节的盟友,让他们加入管制战局,才有机会遏制中国的追赶。但特朗普的“美国优先”论调和关税战,已无法为其采取联合行动提供多少动力。 此前,特朗普为了遏制中国在AI竞赛中取得进展,下令禁止TikTok,但最后也延长了TikTok在美国被禁的最后期限,将此变成了关税的筹码。 英伟达的AI芯片本不该被当作棋子。从现在的局势看,这些高科技企业越来越成为特朗普现在必须做出的最大让步筹码,才能摆脱他自己造成的混乱。 日企趁势追击 H20芯片是支撑自动驾驶、智能座舱等核心系统的关键算力单元。 特朗普将出口限制从数据中心领域扩展至汽车行业,本质上是要掐断中国车企向L4级自动驾驶进阶的技术动脉。 在一片混乱局势中,丰田汽车、日产汽车和本田汽车组成的财团ASRA正在牵头讨论下一代汽车芯片的标准化设计,以提升其与在智能化竞赛中的竞争力。 ASRA执行董事川原信昭(Nobuaki Kawahara)表示:“在拥有合适的硬件以确保实时控制和功能安全,以及可靠运行软件的能力方面,日本落后了。” 日本将智能汽车分为两大类别,一是自动驾驶,另一个是软件定义汽车(SDV)。 川原信昭同时担任丰田集团旗下供应商电装(Denso)的高级顾问。他表示,日本汽车制造商在SDV领域可能落后中国两三年。 “部分原因是中国和其他领先的电动汽车制造商倾向于先选择软件,然后再确保合适的硬件到位,”川原信昭说,“日本汽车制造商不采用这种方式。” 他表示,相反,日本汽车巨头倾向于优先考虑汽车硬件,然后再确定控制汽车的软件和半导体。将软件和芯片的决策留到相对较晚的开发阶段,会使得选择最佳、最高效的组合变得更加困难。 近年来,中国汽车制造商凭借其价格实惠的智能电动汽车,在国内以及其他亚洲经济体中抢占了此前由日本和欧洲制造商主导的市场份额。 2024年,丰田在华销量177.6万辆,同比下滑6.9%。日产和本田的降幅分别达到12.2%和30.9%。 据东京汽车研究公司MarkLines称,得益于比亚迪和上汽集团的崛起,中国汽车制造商在泰国的市场份额在2024年达到7%,高于五年前的2.3%。与此同时,中国汽车制造商在印尼的市场份额则从0.4%上升至2.9%。 在这两个市场,日本汽车制造商的总份额均下降了约10个百分点。 Gartner发布的2024年数字汽车制造商指数(该指数评估汽车公司将软件融入商业决策的程度以及车辆的数字化程度)中,丰田在22家汽车制造商中排名第20位。本田、日产和马自达也排名垫底。 中国汽车制造商专注于电动汽车,而日本汽车制造商则提供从家用小型货车到豪华轿车的广泛产品线。尤其是丰田,它奉行“多路径”战略,提供从混合动力汽车到纯电动汽车以及氢燃料电池汽车等多种电气化选择。 “这对日本来说是一个挑战,因为每家都试图覆盖所有领域。日本制造商比任何其他国家都更需要从高端到入门级的各种车型。”Omdia咨询总监杉山和宏(Kazuhiro Sugiyama)表示。 日本汽车制造商正准备通过 ASRA 发起反攻。ASRA 的成员包括电装 (Denso)、瑞萨电子 (Renesas Electronics) 和索喜科技 (Socionext) 等汽车芯片供应商。 该联盟计划用名为“chiplet”具有特定功能的微型集成电路,开发一种基础芯片设计。chiplet可以组合成更大的封装。客户可以根据特定产品线所需功能,在该基础芯片上进行扩展,开发多种类型的芯片,以满足尽可能多的汽车制造商的需求。 这将为日本的汽车制造商节省时间和成本,因为他们无需为每款车型开发定制芯片。例如,面向新兴市场的小型、价格适中的汽车,可能只需要一个基础芯片,而完全自动驾驶的电动汽车则需要一系列基础芯片以及一个AI芯片。 这项开发受到日本政府高达410亿日元(2.86亿美元)的补贴支持。 逐底竞争 美国芯片初创公司Tenstorrent的汽车业务副总裁萨迪厄斯·福滕贝里(Thaddeus Fortenberry)表示,中国和日本智能汽车之间的差异并不在于它们所用芯片的功能。 比起日本汽车制造商更关心架构细节,中国汽车制造商更关心两件事:能多快拿到货,成本是多少。 福滕贝里表示,中国汽车制造商对待汽车开发的方式与开发智能手机的方式相同,即大规模生产和商品化内部结构。 Tenstorrent也是汽车芯片计划 (Automotive Chiplet Program) 的成员。该计划由比利时专注于纳米电子和数字技术的研究机构IMEC领导。 福滕贝里曾参与特斯拉自动驾驶芯片团队和已取消的苹果汽车TITAN项目。 他认为,日本和西方汽车制造商仍然可以从汽车计算的商品化或“逐底竞争”(race to the bottom)中获益。 “逐底竞争”是计算机行业用来描述后来者迅速将曾经占主导地位的技术商品化过程的术语。 其理念是,通过芯片设计的标准化并最终实现开源,该领域将涌现出更多竞争对手,从而压低芯片组的价格,最终降低日本和西方汽车的计算成本,缩小与中国企业之间的竞争差距。 “如果我是丰田,我不想直接参与这场芯片的‘逐底竞争’,但我希望从中获益,”他说道,“从长远来看,这将是一个更好的选择。” 他补充道,Tenstorrent的目标是到2026年开发出自己的标准化芯片组。 Omdia的杉山和宏表示,芯片标准化可以帮助汽车制造商重新获得与主要代工芯片制造商的议价能力。 他表示,由于汽车芯片比数据中心使用的AI芯片便宜得多,产量也更小,因此汽车行业可能不是代工芯片制造商的首要目标任务。 根据德勤的预测,到2025年,汽车将占半导体总需求的12.7%,而数据处理和通信预计将分别占32.9%和30.2%。 尖端汽车芯片的制造过程同样复杂,但利润却低于数据中心和PC芯片,后者的价格在AI热潮中飙升。 这意味着,芯片制造商在加大对AI客户的生产时,可能不会太重视单个汽车客户。 川原信昭对此表示赞同:“就产量而言,汽车对芯片供应商的吸引力并不大,尤其是与智能手机或数据中心相比。但如果我们能够实现平台标准化,基础芯片的产量可能会非常可观——这将大大简化供应商的生产流程。” ASRA是全球首批尝试与知名汽车制造商和供应商联合开展芯片研究的行业组织之一。 如果此举成功,这标志着日本罕见地参与制定国际标准,这些标准通常由欧洲行业组织和企业主导。川原信昭表示,一位欧洲同行甚至联系了该组织,讨论如何标准化汽车芯片中使用的通信技术。 “(我们)这种行业组织很少能得到如此多主机厂的参与。但这恰恰是因为他们都面临着挑战,”他称,“大家对形势的严峻性有着清晰、共同的认识。”
京东外卖大打价格战:4块钱喝奶茶 商家心甘情愿被薅
京东又回到自己最擅长的 “ 价格战 ” 领域了。 4 月 11 日,京东外卖宣布正式开启百亿补贴,将在一年内投入超百亿元,向全体用户发放补贴,覆盖平台上的所有餐饮门店。 实际上,在百亿补贴号角吹响之前的一段时间,京东外卖就已经开始默默发券,随机发放满 20-5、满 8-7 的优惠券,有人可以 1 块钱喝到一杯奶茶,20 块钱吃到麦当劳四件套套餐。 爆发价格战,是电商世界开始竞争和洗牌前亘古不变的铁律。 更何况,京东是在美团做了 10 来年外卖,外卖价格已经被压到几乎最底线、外卖行业格局也基本被趟平之后,才决心下场抢饭碗的。 其实京东外卖做价格战,也经历了几轮变化。 先是 2 月底,京东外卖上线 10/20 元餐补,也就是满 15-10 和满 40-20,但仅限于 PLUS 会员和大学生用户每晚 8 点随机领取。 再是 4 月份全平台放券,让用户尝到一拨优惠。最终,在 4 月 10 日,京东正式放出百亿补贴的公告,并计划持续一年。 那么,京东外卖的价格战强度如何呢? 从消费者端来看,的确有便宜可薅。目前京东官方优惠券主要是满 15-10 的面额,在客单价较低的店铺下单优惠更明显。 不少消费者在网上交流经验,结论是本次京东外卖薅羊毛主要在奶茶咖啡的品类上最划算,5 块钱买杯库迪,1 块钱买杯茶百道。 编辑部实测买券后 1 元的单品现已无法达到起送费,加料凑单后可以 4 元到手 。 不仅是客单价 10-20 元的饮品店铺,连锁平价的店铺优惠体感一样很明显。比如,在同一家免配送费的沙县小吃点同样的鸡腿饭,京东外卖标价 20.8 元,饿了么 26.8 元,美团 26.9 元,三家全部用完券之后,京东只要 10.9 元,饿了么和美团都是 21 元左右( 每位消费者可用红包情况不同,仅大概对比差额 )。 最重要的是,知危了解到,此次京东发券是纯粹的平台行为,商家不需要额外掏一分钱在补贴上。这也就意味着,商家可操作的空间很大。 上述沙县小吃在饿了么和美团上收取 1 元打包费,在京东要收取 2 元,所以在结账时,京东外卖的实际支付价格是 12.9 元。 还有商家在运费机制上做了和美团、饿了么一样的设置,例如某家茶百道就是订单价格满 15 元运费才是 0.5 元,不然的话运费是原价 3.5 元。 更有商家直接表示,自己在京东外卖上的餐品价格全部比堂食高。 所以,虽然平台给了统一的折扣,但具体便宜多少,或者是否便宜,都要看商家的态度。 知危注意到,10 元补贴并非覆盖了所有餐饮店,截至发稿前,北京市内的瑞幸咖啡没有参与减 10 元的活动,而是和其他平台一样,商家自主给出七八折的优惠,消费者到手价仍然是 10-20 元。 从商家们的打包费和配送费减免设置上,你就能看出,京东外卖这场百亿补贴的阳谋中,商家得到的利好,远超过消费者。 上海一位商家表示,平台开始发券后他们 “ 非常爽 ”,似乎巴不得顾客都来薅羊毛,越多越好。 从他提供的商家端页面来看,原价 20.5 元的餐品,平台补贴后是 16 元,顾客最后实际支付 14.06 元,而商家到手算上餐盒费和运费,共计 24.5 元。 北京某餐饮商家说,他们从 3 月初上线京东外卖之后,现在每天订单量能有二三十单,好的时候有五六十单,老板表示他们的情况确实比较好,“ 听说别人家只有两三单”。 他说,现在他在京东外卖平台上的运营策略就是免配送费,“ 只要免配送费,京东就会在商家的商品图上挂上 ‘ 免运费 ’ 三个字,现在顾客都喜欢免运费的。” 该商家认为,现阶段,京东外卖配送费经常被吐槽较贵,那就正好从这点下手,先给顾客留个好印象。 同时,他也提高了京东外卖上的餐品定价,比堂食贵几块钱,“ 贵了一点,但也随餐送个饼,送根烤肠。” 他们家选的是达达专送,每单扣 3.5 元基础履约服务费,加上每单需要自己掏配送费,算下来他们的情况还是不错。他表示,只要不给平台付佣金,且抬高单价,就稳赚不赔。他也对知危表示,就他自己的店来说,“ 饿了么的订单还不如京东。” 因为补贴由平台来承担,等于是免费的引流,所以敏锐的那部分商家开始花精力在运营活动上。除上述的免配送费+调高价格送赠品之外,还有的商家选择部分单品做低价活动或满 2-3 件有折扣,甚至美团、饿了么上常用的收藏送赠品这一套方法也被搬到京东上来了。 “ 进入二季度了,这阶段任务是冲单量。” 一位京东外卖服务商表示,京东其实没有对商家要冲多少单给出具体的激励,但平台又是免佣又是撒优惠券,对于商家来说总是赚的,所以想趁此机会做做数据的商家比较积极。他也补充:“ 这波操作跟美团当年发券价格战也大差不差,商家拉进来了,肯定要做一轮补贴。” 不过,一些连锁品牌,却是没吃上这波红利。几位连锁餐饮品牌的商户说,官方补贴带来的订单激增,暂时还没落到他们头上,每天还是保持着个位数的订单数。 至于原因,一位连锁店分店店长还告诉知危,比起个体商户,连锁店的操作空间不大,“ 做不做优惠,做多少优惠,是否免配送,这些都是公司后台统一设置的,我们没有决策权。” 这形成了一个有趣的现象:京东外卖平台上,自由度越高的商家,或许能在这轮补贴里拿到单量和收入的胜利,而成体系的连锁店反而不一定赢。 那么,京东外卖上线仅两个月,就开始明牌打价格战,是想做什么? “ 这次京东的百亿补贴和饿了么的补贴不太一样,一是没有提到补贴周期,二是没有提到补贴形式。所以应该和 B2C 商城的百亿补贴一样属于可控范畴,另外后续说不定会加入一些商家的投入比例( 指让商家也承担一部分补贴费用 )。” 中国连锁经营协会客座顾问、零售电商行业专家庄帅对知危表示。 无论是京东当年用价格战击败苏宁,还是拼多多率先拿出百补,行业都认为是烧钱换市场的行为。但至于京东外卖本轮的百补活动,庄帅认为 “ 不能说是烧钱 ”,因为活动是可控、可以根据效果调整的投入。 他还预测道:“ 后续我预判肯定会和 B2C 商城业务形成联动,例如 PLUS 会员优惠、买手机家电送外卖券等。” 进入到存量市场阶段,电商平台最后拼的或许不是谁在某一项业务上到底强到什么程度,而是整个生态体系的协同效应。庄帅表示,美团会员就是利用协同联动做起来的,京东肯定也要协同起来才有自己的优势。“ 相对高频的外卖和相对低频的 3C 产品协同。” 目前,已经有一个变化能证明京东的野心在于联动。 消费者加在购物车的外卖,会直接显示在京东 App 的购物车中,一碗面条可以和苹果手机一起下单,这有点像美团此前的 “ 万物到家 ” 概念。 庄帅也说,京东做外卖也是经过好几年内部论证,而且等到达达私有化、挖来美团高管、整合好团队和资源才开干的,长期战还要继续打下去。 而且,现在的节奏也符合京东外卖一直以来的风格:抓大放小,先做,再修修补补。眼下的阶段京东显然是先用补贴把单量做上去,稳定商家和基本客流之后,再调整现在被商家诟病的系统不够智能、体验不够丝滑等等问题。 虽然京东外卖的未来我们还要边走边看,但起码,新掀起的价格战,给了用户们一个选择京东外卖的理由,而一旦用户的习惯开始被改变,这个业务就是有潜力的。 毕竟当年拼多多靠价格战崭露头角时,没人想过它能撼动阿里和京东两个电商巨头的地位,现在大家都信了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。