行业分类:
加载中...
头条分类:
加载中...
别克官微接连致敬李斌、何小鹏、华为、大疆!网友:醒醒 你不是小米
快科技4月20日消息,日前,别克汽车官微账号向王石、俞敏洪、罗振宇、李斌、何小鹏、宁德时代、华为中国、大疆、宇树科技等国内多位企业家和企业,发布了致敬文案。 别克致敬俞敏洪:当行业发生巨变,真正的强者总能在危机中找到新方向,致敬俞敏洪 这份永不言弃的坚韧,峰回路转带我们看到新境地。 别克致敬何小鹏:这是一次迟到的致敬,为“自动驾驶+AI”成为行业标配的当下,为10年前就已锚定的未来。 别克致敬李斌:当换电模式曾被质疑,用1000座换电站证明,真正的创业者敢于挑战行业惯性。 别克致敬华为:从通信巨头到智能汽车赋能者,以创新打破边界,在科技无人区持续突破,用创新改写规则!在智能科技领域这块,致敬遥遥领先的华为中国。 据了解,别克将于4月21日举办2025别克品牌日,届时,将会发布“逍遥驰骋超级融合架构”,别克官方或许想以致敬和喊话的方式,为自己的品牌日预热。 不过,对于别克品牌的这一波操作,有不少网友表示看不懂,“如果被致敬的企业家或品牌不互动的话,是不是有点尴尬了”。 还有网友更为直接,评论道:“醒醒,你不是小米”、“上一个这么玩的是小米,但小米人家是真有流量,被致敬的品牌也是赶紧回应。不过别克这么玩,可能会被认为硬蹭流量,东施效颦”。
英国要扩大在北极的军事活动?!
  英国《金融时报》近日报道称,英国政府在一份即将发布的报告中,呼吁扩大该国在北极地区的军事活动。   报道援引报告内容称:“英国应扩大在北极地区的军事活动,因为随着冰层融化使通航条件改善,该地区的争端越来越多,政府的国防报告将包含这一建议。” 英国《金融时报》报道截图   据报道,该报告由北约前秘书长乔治·罗伯逊领导的独立专家团队编写,英国政府要求他们研究英国面临的威胁,确定应对这些威胁所需要的能力,并评估英国军队的状态。   报告呼吁,英国应加大对无人机和尖端技术的投资。此外,报告还将确认英国向第六代隐形战斗机项目投资。   报道称,美国总统特朗普在安全政策上的转变,包括美国打算缩减在欧洲的军事资源等,引起北欧盟友的担忧。   报道援引英国皇家联合军种研究所高级研究员阿诺德的话称,“英国正面临向欧洲提供更多强硬的军事能力的压力”,“因为在情报、监视和侦察以及反潜战等方面,英国是唯一可以弥补美国缩减资源的国家”。   业内普遍认为,该报告一旦发布,英国皇家海军将获得比英国陆军更多的资源,未来能够更好地支援位于东欧的北约成员国。   据报道,英国政府计划在今年五六月份发布该报告。 英国游骑兵团骑着雪地摩托车巡逻(图自英国《金融时报》)   北极地区正日益成为多国角力的战略要地和地缘政治的热点区域。   北极地区蕴藏着丰富的石油、天然气、矿物和渔业资源,其油气储量约占全球未开发油气资源的四分之一。   此外,由于极地冰层不断融化,预计到2030年前后,北极西北航道和北方航道的商业与军事通航潜力将大幅提升。有分析认为,未来谁能在北极地区占据优势,就等于扼住了欧亚贸易的“咽喉”,可缩短航行距离约40%,显著降低对马六甲海峡、苏伊士运河等传统航道的依赖。 《外交政策》杂志报道截图
OpenAI爆出硬伤,强化学习是祸首!o3越强越“疯”,幻觉率狂飙
新智元报道 编辑:KingHZ 桃子 【新智元导读】o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。 满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据PersonQA基准测试,o3在33%的问题回答中产生了幻觉,几乎是o1(16%)的2倍。 而o4-mini的表现更加糟糕,幻觉率高达48%。 技术报告:https://cdn.openai.com/pdf/2221c875-02dc-4789-800b-e7758f3722c1/o3-and-o4-mini-system-card.pdf 甚至,有网友一针见血地指出,「o3对编写和开发超1000行代码的项目极其不利,幻觉率极高,且执行指令能力非常差」。 不管是在Cursor,还是Windsurf中,o3编码幻觉问题显著。 要知道,o3和o4-mini在Codeforces中成绩均超2700分,在全球人类选手中位列TOP 200,被称为OpenAI有史以来最好的编码模型。 它们验证了,Scaling强化学习依旧有效。 o3训练算力是o1的十倍 但为何随着模型参数规模Scaling,幻觉问题反而加剧? o3幻觉率至高,是o1两倍 过去,每一代新模型的迭代,通常会在减少幻觉方面有所进步,但o3和o4-mini却打破了这一规律。 更令人担忧的是,OpenAI目前也无法完全解释这一现象的原因。 技术报告中,研究团队坦言,「还有需要进一步研究来弄清,模型生成更多断言的问题」。 提前拿到o3内测资格后,非营利AI研究机构Transluce的测试,进一步印证了这一问题。 他们发现,o3在回答问题时,更倾向于「虚构」其推理过程中的某些行为。 比如,o3声称它在一台2021年款的MacBook Pro上运行代码,甚至声称是在ChatGPT之外复制的代码。 而且,这种情况出了71次。然而,事实是o3根本无法执行这样的操作。 前OpenAI研究员Neil Chowdhury表示,o系列模型使用的强化学习算法,可能是问题的根源。 RL可能会放大传统后训练流程中通常能缓解,但无法完全消除的问题。 强化学习「背锅」,编造根源找到了 首先,必须承认的是,幻觉问题并非是o系列模型独有,而是语言模型的普遍挑战。 而对于多数语言模型产生幻觉的原因,不外乎有这么几点: 1 预训练模型的幻觉倾向 预训练模型通过最大化训练数据中语句的概率进行学习。然而训练数据可能包含误解、罕见事实或不确定性,这导致模型在生成内容时容易「编造」信息。尽管后训练可以缓解这一问题,但无法完全消除。 2 讨好用户 RLHF训练可能激励模型会迎合用户,避免反驳用户的假设。 3 数据分布偏移 测试场景可能与训练数据分布不一致。 尽管这些问题是语言模型常见的失败模式,相较于GPT-4o,o系列模型的幻觉问题更为突出。 这背后,还有一些独特的因素。 RL推理训练副作用 作为推理模型,o系列采用了基于强化学习(Outcome-based RL)训练,专为解决复杂数学问题、编写测试代码而设计。 虽然这种方法提升了模型在特定任务上的表现,但也造成模型幻觉率飙升。 如果训练的奖励函数只关注正确答案,模型在面对无法解决问题时,没有「动力」去承认自己的局限。 相反,它可能选择输出「最佳猜测」,以期碰巧正确。而且,这种策略在训练中未受到惩罚,从而加剧了幻觉。 另外,工具使用的泛化问题,也不可忽视。 o系列模型在训练中,可能因成功使用「代码工具」而获得了奖励。即使在禁用工具的场景中,模型可能会「假想」使用工具来组织推理过程。 这种行为可能在某些推理任务中提高准确性,并在训练中被强化,但也导致模型虚构工具使用的场景。 真帮凶:CoT被丢弃 o系模型的另一个独特设计是「思维链」(Chain-of-Thought)机制。 在生成答案前,模型会通过CoT进行思考,但这一过程对用户不可见,且在后续对话中被丢弃。 事实上,它们可能在CoT中生成了看似合理但不准确的回答。比如,因为没有真实链接,o1曾生成一个了虚构的URL。 由于CoT在后续对话中被丢弃,模型无法访问生成前一轮答案的推理过程。 当你追问前一轮回答的细节时,模型只能基于当前上下文「猜测」一个合理的解释。 这种信息缺失,很难避免o3等不去编造信息。 o3很好,但过度优化是硬伤 在Ai2科学家Nathan Lambert最新一篇分析长文中,同样印证了这一问题: 强化学习给o3带回来了「过度优化」,而且比以往更诡异。 在任何相关查询中,o3能够使用多步骤工具。 这让ChatGPT的产品管理面临更大挑战:即便用户未触发搜索开关,模型也会自主联网搜索。 但这同时标志着语言模型应用开启了新纪元。 比如,Nathan Lambert直接问o3:「你能帮我找到那个长期以来被RL研究人员使用的,关于摩托艇过度优化游戏的gif吗?可能像是波浪破碎器之类的?」 过去,他至少需要15分钟,才能手动找到这个。 现在o3直接提供了准确的下载链接,而Gemini等AI则逊色很多。 与o3精彩互动:几乎立刻找到需要的GIF 多个基准的测试成绩,证明o3非常出色。OpenAI认为o3在许多方面比o1更强大。 o3是持续扩展RL训练计算资源时的产物,这也提升了推理时的计算能力。 但这些新的推理模型在智能上「孤峰凸起」,在有些方面并没有奏效。 这意味着有些交互令人惊叹,感觉像是与AI互动的全新方式,但对于一些GPT-4或Claude 3.5早已熟练掌握的普通任务,o3等新推理模型却彻底失败了。 这涉及到强化学习中的「过度优化」(over-optimization)问题。 RL过度优化,o3更严重 OpenAI o3模型展现了全新的推理行为模式,但过度优化是硬伤。 过度优化(Over-optimization)是强化学习(RL)领域的经典问题。 无论是传统强化学习、催生出ChatGPT的人类反馈强化学习(RLHF),还是当前新型推理模型中出现的情况,都呈现出独特的表现形式和不同影响。 当优化器的能力超过它所依赖的环境或奖励函数时,就会发生过度优化。 在训练过程中,优化器会钻漏洞,产生异常或负面的结果。 Ai2的科学家举了一个例子。 在Mujoco仿真环境中,评估深度强化学习算法时,发生了过度优化: 「半猎豹」(half-cheetah)模型本该学习奔跑,却用连续侧手翻最大化了前进速度。 o3表现出新型过度优化行为。 这与它创新训练方式密切相关。 最初的推理模型主要训练目标是确保数学和代码的正确性,而o3在此基础上新增了工具调用与信息处理能力。 正如OpenAI官方博客所述: 利用强化学习,我们还训练了这两款模型去使用工具——不仅教会它们如何使用工具,还让它们学会判断何时该使用工具。 它们根据预期结果来部署工具的能力,让它们在开放式任务中更加高效——特别是在涉及视觉推理和多步骤工作流的情况中。 这些训练中的绝大多数子任务都是可验证的。 这种新的训练方法确实提升了模型的实用性,但只对过去用户习惯使用的任务。 但目前还无法规模化地「修复」模型在训练过程中产生的怪异语言表达。 这种新的过度优化并不会使模型的结果变差,它只是让模型在语言表达和自我解释方面变得更差。 o3的一些奇怪表现让人感觉模型还没完全成熟,比如在编程环境中使用了无效的非ASCII连字符的这个例子。 越来越多的用户好奇:o3到底发生了什么? Karpathy当年评价初代推理模型时的名言: 当模型在思维链中开始不说人话时,你就知道强化学习训练到位了。 如今模型输出的这些怪异幻觉,本质上就是行为版的「不说人话」。 o3的行为组件使其比Claude 3.7漏洞百出的代码更有研究价值,或许也相对不易造成实际损害。 奖励黑客,AI学会钻空子 METR发现,o3是在自主任务中能独立操作最久的模型,但也注意到它有倾向于「篡改」它们的评分。 听起来是不是很熟悉? 事实上,奖励机制被钻空子(reward hacking)的例子比比皆是! 来自OpenAI最近论文的奖励黑客攻击例子: 左右滑动查看 论文链接:https://openai.com/index/chain-of-thought-monitoring/ 从科学角度来看,这确实是非常有趣且引人深思的—— 模型到底在学习什么? 与此同时,考虑到安全问题,大家对AI模型的广泛部署保持警惕,就很有道理。 但目前看来,大家还没有看到过于令人担忧的情况,更多的是效率低下和一些混乱的例子。 总结一下强化学习(RL)不同阶段中,看到的三种过度优化类型: 控制时代的RL:过度优化发生是因为环境脆弱,任务不现实。 RLHF时代:过度优化发生是因为奖励函数设计糟糕。 可验证奖励强化学习(RLVR2)时代:过度优化发生,使模型变得超级有效,但也变得更加奇怪。(还有更多尚未发现的副作用) 这种过度优化确实是一个需要解决的问题,因为语言模型的可读性是其一个重要优势。 Nathan Lambert相信通过更复杂的训练过程,这个问题是可以缓解的。 但OpenAI急于尽快推出模型,解决这个问题需要更多时间。 据报道,OpenAI的部分测试人员,只有不到一周的时间对即将推出的重要产品进行安全检查。
普京宣布复活节停火30小时 泽连斯基称不足以建立信任
  俄罗斯总统普京当地时间19日下令,在今年东正教复活节到来之际俄军暂时停火30小时。他同时指出,俄军必须做好准备,“击退敌人可能违反停火的行为、挑衅以及任何进攻行动”。乌克兰总统泽连斯基则提议将停火期限延长至复活节之后,称30小时不足以建立真正的信任。   01   俄单方面宣布停火30小时    据俄罗斯总统社交媒体账号19日公布的消息,普京在会见俄罗斯武装力量总参谋长格拉西莫夫时说,在复活节20日到来之际,从莫斯科时间(同基辅时间)19日18时至21日0时(北京时间19日23日至21日5时),俄军将停止所有战斗行动。俄方希望乌克兰方面能效仿俄方做法。   俄罗斯国防部在一份声明中说,已向特别军事行动区域内所有部队发出停火指示,并表明只要乌方尊重停火协议,俄军将遵守协议。   普京表示,俄方停火行为将检验乌方停火诚意、是否有遵守停火的能力,以及参加和平谈判和消除乌克兰危机最初根源的意愿和能力。他说,战场形势正朝着对俄军有利方向发展,俄军正满怀信心地逐步向前推进。   格拉西莫夫在会见时说,俄军正在完成对库尔斯克地区的最终控制,并挫败乌军进攻别尔哥罗德地区的企图。   同日,俄罗斯国防部通过社交媒体发布消息说,俄乌双方各向对方移交246名被俘人员。俄方还向乌方移交31名受伤战俘,作为交换,15名俄军被俘伤员被乌方释放。此次俄乌互换被俘人员由阿拉伯联合酋长国斡旋。   02   泽连斯基提议停火延至复活节后 △泽连斯基(资料图)   乌克兰总统泽连斯基19日在社交媒体发文,提议将停火期限延长至20日复活节之后。按照泽连斯基说法,这将检验俄方真实意图,因为30小时不足以建立真正的信任措施,而30天或能为和平创造契机。   泽连斯基说,俄方已持续39天未对美国方面提议的全面无条件停火30天给予回应,如果俄方此刻突然表态愿加入全面无条件停火框架,乌克兰将采取对等回应,即俄方如何行动,乌方将如何应对。   同时,泽连斯基指责俄方违反自己提出的停火承诺。他说,根据乌军战报,俄军目前仍在部分地区推进突击行动,亦未停歇炮火。乌军严阵以待,将实施对等反制,“每一发俄军炮弹都将遭到充分回击”。   乌克兰总统办公室主任叶尔马克指出,对于停火,乌方将以静默回应静默,以停火回应停火。如要实现停火,就应将停火期限延续至20日之后,俄罗斯必须全面无条件停火,通过永久停火来结束冲突。   03   特朗普政府对斡旋失去耐心?   舆论注意到,俄乌双方围绕复活节停火的“互动”发生在特朗普政府对斡旋俄乌冲突日益“失去耐心”之际。 △特朗普(资料图)   美国总统特朗普18日表示,如果围绕乌克兰问题的谈判无法在短期内取得明确进展,美方将不再参与斡旋。按照他的说法,如果某一方或双方让谈判变得非常困难,“我们将不再参与其中”。   美国国务卿鲁比奥同日表示,关于乌克兰问题的谈判不能一直停滞,如果短期内看不到俄乌双方达成一致的信号,美方将不会继续撮合。“如果可行,我们就参与;如果不可行,我们还有其他需要关注的重点。”   路透社分析,鲁比奥的上述表态凸显特朗普政府对于在推进解决日益增多的地缘政治挑战方面缺乏进展产生了“日益强烈的挫败感”。   特朗普在竞逐2024年美国总统选举期间声称,自己当选后将在“24小时内”结束俄乌冲突。如今,特朗普重返白宫即将满三个月。
深观察丨美国“断供”加剧全球人道危机
  美国新一届政府今年1月上台后,以“优化资金效率”等为借口大幅削减对外援助资金,紧急叫停已签署协议的对部分国家的粮食援助项目,同时以拖欠国际组织会费等方式系统性破坏多边合作,致使全球人道主义事业骤然面临少有的严峻挑战。 “这将让过去25年的所有努力付诸东流”   在阿富汗首都喀布尔,国际人道主义组织“反饥饿行动”的病房里如今已空无一人。美国援助资金的断供,让这个国家三分之一依赖紧急人道援助生存的民众,尤其是儿童陷入绝境。   据联合国世界粮食计划署统计,今年阿富汗将有超过350万儿童患有严重营养不良,比上一年增加20%。 世界粮食计划署官网截图   美国此前承担了阿富汗国际人道援助资金的43%。然而,其资金链的突然断裂导致当地关键人道主义项目被迫停摆,食品供应锐减。   “反饥饿行动”组织在当地的负责人科比·里特维尔德警告说,由于资金严重短缺,将会有更多阿富汗儿童死于营养不良。 美联社报道截图   在数千公里之外的肯尼亚卡库马难民营,难民们高举“医疗是人权”“水就是生命”等标语走上街头抗议物资短缺。   卡库马难民营收容了来自南苏丹、埃塞俄比亚、索马里等国的超过20万难民。   美国政府自今年起单方面终止了对肯尼亚等多国的援助,令难民营里本来就捉襟见肘的食品配给雪上加霜。   世界粮食计划署警告说,美国中断紧急粮食援助相当于是对千百万面临极端饥饿的民众“判处死刑”。 法国《世界报》报道截图   在非洲大陆,没有什么疾病比疟疾更致命,尤其是对儿童而言。   根据世界卫生组织的数据,2023年全球估计有59.7万人死于疟疾,其中95%来自非洲。   在受疟疾影响最严重的三个非洲国家——尼日利亚、刚果(金)和乌干达,抗疟药物和经过杀虫剂处理的蚊帐就像当地人的日常必需品,必须持续供应。但随着美国出资的中止,这些物资正在逐渐耗尽。   用乌干达疟疾控制项目负责人吉米·奥皮戈医生的话说,一场灾难即将来临。   奥皮戈:“药品、检测试剂盒、蚊帐和喷洒设备等物资需要在海外生产,然后运送到这里的仓库,再分发到服务点。目前这一过程已经中断,而服务点的物资即将耗尽,最多只能维持一个月。因此,灾难将在本月底显现。”   总部位于华盛顿的“无疟疾”组织称,新的模型显示,抗疟物资供应链中断仅一年,就将导致全球新增近1500万病例和10.7万死亡病例。 《印度斯坦时报》报道截图   此外,尽管美国曾参与非洲抗击艾滋病工作,但其新一届政府的资金断供完全无视受援国的需求,致使南非等许多非洲国家的抗艾工作陷入停滞。   南非德斯蒙德·图图艾滋病中心主任琳达-盖尔·贝克尔告诉记者,美国取消对当地抗艾组织的资助将导致“超过50万不必要的死亡以及多达50万新增感染病例”,使有关方面“过去25年的所有努力付诸东流”。 英国《卫报》报道截图 “许多人将因为援助的枯竭而死亡”   世界卫生组织总干事谭德塞上个月警告说,美国突然削减对全球卫生项目的资金支持,可能使国际社会防治疟疾、艾滋病、结核病和麻疹等疾病所取得的进展发生逆转。此外,削减资金也将阻碍根除脊髓灰质炎、监测禽流感以及应对疾病暴发和人道主义危机的努力。   因此,谭德塞敦促美国与受影响国家进行对话,以便制定更可持续的解决方案,避免造成生命损失。 土耳其阿纳多卢通讯社报道截图   美国的资金断供还导致国际组织与多边合作受损。   联合国人道主义事务协调厅近日发表公开信说,由于资金遭遇“残酷削减”,尤其是美国政府大幅叫停对外援助,该机构将不得不裁撤20%、即500多名工作人员。   联合国分管人道主义事务的副秘书长兼紧急救援协调员汤姆·弗莱彻表示,联合国人道主义事务协调厅2025财政年度总预算为4.3亿美元,但美国等国家削减援助导致该机构面临近6000万美元的资金缺口。   “我们所面临的资金削减的速度和规模无疑是对人道主义援助领域的巨大冲击。许多人将因为援助的枯竭而死亡。” 路透社报道截图(题图为汤姆·弗莱彻)   联合国秘书长古特雷斯此前曾表示,美国大幅削减对外援助无异于一场人为制造的“人道主义地震”,将对世界上最弱势群体造成严重伤害,不仅让世界更不健康、更不安全,也有损美国自身利益。 路透社报道截图   以“美国优先”之名行“全球脱责”之实,美国政府这种将国内政治凌驾于国际人道契约之上的自私行径不仅再次侵蚀了多边主义的根基,更是严重透支了美国自身的国际信誉。   正如一些分析人士所警告的那样,当对外援助成为美国国内政治博弈的筹码,所有人都是输家。
数读中国经济一季报 重要经济指标“暖”勾勒稳中向好“新”答卷
   央视网消息:关注重要经济指标,读懂中国经济答卷。根据国家统计局发布的一季度经济数据,我们采访了经济专家进行解读。首先来看工业,今年一季度,我国工业延续较快增长态势,产业升级步伐加快,新质生产力加速培育,为经济增长提供了新的动力。   在这份一季度的中国经济答卷上,可以看到,全国规模以上工业增加值延续较快增长态势,同比增长6.5%,较1—2月份加快0.6个百分点,较上年全年加快0.7个百分点。在工业41个大类行业中,38个行业增加值同比增长,增长面为92.7%。   国家发展改革委国家信息中心宏观经济研究室副主任邹蕴涵称:“说明整个工业的增长保持了一个节节走高、蓬勃向上的态势。在这里边,有几方面的积极的影响来支撑工业的增长,第一方面是累积效应,也就是过去持续发力推动产业升级,这里边非常突出的就是高技术制造业的增长。”   透过这份答卷可以看到,高技术制造业增加值同比增长9.7%,其中,光纤制造、航空航天相关设备制造、集成电路制造等行业增加值分别增长22.5%、22.4%和21.1%。   工业新动能的不断壮大也使得数字化生产持续赋能产业向智能化转型。一季度,数字产品制造业同比实现两位数增长,智能无人飞行器制造、智能车载设备制造、服务器等行业增加值分别增长49.6%、25.0%和66.3%。   专家表示,今年一季度,高技术制造业的增长达到了2022年6月以来累计增速的新高点,展现出了非常良好的一个增长态势。   国家发展改革委宏观经济研究院研究员张林山称:“我国制造业正在向高端化、智能化、绿色化迈进,产业升级步伐加快,新质生产力加速培育。半导体、生物医药等领域技术创新不断取得新进展,数字经济渗透率持续提高,推动了高技术制造业和装备制造业的快速发展,为经济增长提供了新的动力。”      中国经济一季报:内外合力 进一步释放消费潜力   接下来看消费,今年一季度,消费保持比较良好的态势,通过内外合力,进一步释放了消费潜力。    在这份一季度的中国经济答卷上,可以看到,社会消费品零售总额124671亿元,同比增长4.6%。其中,多数商品类别保持增长,以旧换新商品销售良好。限额以上单位通讯器材类、家用电器和音像器材类、家具类商品零售额同比分别增长26.9%、19.3%和18.1%。服务零售额同比增长5.0%,增速比1—2月份加快0.1个百分点,高于同期商品零售额增速。   邹蕴涵称:“整个一季度的消费保持了比较良好的态势。它有个非常突出的特征是内外合力。内就是指消费的内生增长动力,服务消费增长比较快,成为拉动消费增长的一个非常重要的动力。外是指政策发力,也就是今年消费品以旧换新的加力支持政策,推出早、时机准、见效快,效果也比较持久,对于整个支撑社会消费品零售总额的增长发挥了非常重要的作用,进一步释放了消费潜力。”   透过这份答卷,可以看到,随着县域商业建设不断推进,县乡消费市场活力日益增强。包含镇区和乡村地区的县乡消费品零售额占社会消费品零售总额的比重为40.2%,比上年同期提高0.1个百分点。其中,乡村消费品零售额16614亿元,同比增长4.9%。   国务院发展研究中心市场经济研究所研究员陈丽芬称:“数字化带动了就业的下沉,也带动了消费的下沉,像外卖即时零售,在县域的渗透率也越来越高,还有越来越多的老百姓会选择到县域去旅游。县乡消费活力日益增强,占比也稳步提升,县乡消费成为消费增长的一个新动能。”    中国经济一季报:制造业投资快速增长 企业对未来信心增强   今年一季度,我国固定资产投资增速加快,设备购置投资实现较快增长,高技术产业投资增势良好,投资结构持续优化升级。   在这份一季度的中国经济答卷上,我们可以看到,随着大规模设备更新政策持续加力推进,设备购置投资增长也在提速,一季度设备工器具购置投资同比增长达19.0%,比全部投资高14.8个百分点,对全部投资增长的贡献率超6成。   邹蕴涵称:“今年一季度,固定资产投资的累计增速为4.2%,其中大规模设备更新政策起到非常好的支撑作用,设备工器具投资对于带动整个投资发挥了非常关键的作用。”   透过这份答卷,可以看到,今年以来随着重大项目建设加快,基础设施投资拉动效应不断提高。一季度,基础设施投资同比增长5.8%,拉动全部投资增长1.3个百分点。   透过这份答卷,可以看到,我国制造业高端化、智能化、绿色化扎实推进,新动能持续发展壮大。一季度制造业投资同比增长9.1%,制造业技改投资增长7.2%。与高技术产业投资有关的信息服务业投资、专业技术服务业投资以及航空、航天器及设备制造业投资均保持两位数增长。   张林山称:“基础设施投资的增长有助于改善营商环境,为经济的长期增长和发展奠定基础;制造业投资的快速增长则体现了企业对未来市场的信心,以及对技术创新和产业升级的积极投入。信息服务业、航空航天器等一些产业投资的高速增长,反映出我国在新兴产业领域的布局不断深化,新质生产力正在加速形成。”
OpenAI o3模型基准测试成绩遭质疑,实测分数远不及宣称
IT之家 4 月 21 日消息,OpenAI 的 o3 人工智能模型的第一方与第三方基准测试结果存在显著差异,引发了外界对其公司透明度和模型测试实践的质疑。 去年 12 月,OpenAI 首次发布 o3 模型时宣称,该模型能够在 FrontierMath 这一极具挑战性的数学问题集上正确回答超过四分之一的问题。这一成绩远远超过了竞争对手 —— 排名第二的模型仅能正确回答约 2% 的 FrontierMath 问题。OpenAI 首席研究官 Mark Chen 在直播中表示:“目前市场上所有其他产品在 FrontierMath 上的成绩都不足 2%,而我们在内部测试中,使用 o3 模型在激进的测试时计算设置下,能够达到超过 25% 的正确率。” 然而,这一高分似乎是一个上限值,是通过一个计算资源更为强大的 o3 模型版本实现的,而并非是 OpenAI 上周公开发布的版本。负责 FrontierMath 的 Epoch 研究所于上周五公布了其对 o3 模型的独立基准测试结果,发现 o3 的得分仅为约 10%,远低于 OpenAI 此前声称的最高分数。 这并不意味着 OpenAI 故意撒谎,该公司在 12 月份公布的基准测试结果中也包含了一个与 Epoch 测试结果相符的较低分数。Epoch 还指出,其测试设置可能与 OpenAI 有所不同,并且其评估使用了更新版本的 FrontierMath。Epoch 在报告中写道:“我们与 OpenAI 的结果差异可能是因为 OpenAI 在内部评估时使用了更强大的计算框架、更多的测试时计算资源,或者是因为这些结果是在 FrontierMath 的不同子集上运行的(例如 2024 年 11 月 26 日版本的 180 个问题与 2025 年 2 月 28 日私有版本的 290 个问题)。” 此外,ARC Prize 基金会(一个测试了 o3 预发布版本的组织)在 X 平台上发布消息表示,公开发布的 o3 模型是一个“针对聊天 / 产品使用进行了调整的不同模型”,这进一步证实了 Epoch 的报告。ARC Prize 还指出:“所有发布的 o3 计算层级都比我们测试的版本要小。”一般来说,更大的计算层级通常可以获得更好的基准测试分数。 值得注意的是,尽管公开版本的 o3 未能完全达到 OpenAI 测试时的表现,但这在一定程度上已不再是关键问题,因为该公司后续推出的 o3-mini-high 和 o4-mini 模型在 FrontierMath 上的表现已经优于 o3。此外,OpenAI 计划在未来几周内推出更强大的 o3 版本 o3-pro。 然而,此事再次提醒人们,人工智能基准测试结果最好不要完全照单全收,尤其是当结果来自一家有产品需要销售的公司时。随着人工智能行业竞争的加剧,各供应商纷纷急于通过推出新模型来吸引眼球和市场份额,基准测试“争议”正变得越来越常见。 IT之家注意到,今年 1 月,Epoch 因在 OpenAI 宣布 o3 之后才披露其从 OpenAI 获得的资金支持而受到批评。许多为 FrontierMath 做出贡献的学者直到公开时才知道 OpenAI 的参与。最近,埃隆・马斯克的 xAI 被指控为其最新的人工智能模型 Grok 3 发布了误导性的基准测试图表。就在本月,Meta 也承认其宣传的基准测试分数所基于的模型版本与提供给开发者的版本不一致。
无人驾驶下半场,开始拼起“人性化”
“眼睛看不到,怎么找车呢?”“它走了,我的天呐。”去年11月,生活在武汉的视障女孩黄莺决定出门体验一下无人驾驶,没想到出师不利,第一次打车就因为停车地点找寻困难遭遇了“拒载”。 第二次成功上车后,借助车内语音交互功能,她还误打误撞点了一首歌,Zara Larsson的《Lush Life》。行程结束后,黄莺将自己的出行体验反馈给了萝卜快跑,并建议官方可以升级更多的无障碍功能,帮助更多视障人群独立走出家门。 黄莺自己也没想到,她的这次经历,让全国1700万视障群体的需求开始被“看见”和关注。 不久前,包含蓝牙自动解锁、语音开关车门、全场景语音交互在内的“无障碍关爱功能”,在萝卜快跑上线。 随着AI技术与出行方式进一步融合,哪怕黄莺这类小众群体的安全出行需求,也开始得到科技公司的重视和尊重。 这也向外界传递出了一种新的信号:如果说新能源汽车竞争正在从上半场的电动化,进入下半场的智能化,那么,对于无人驾驶出行领域而言,其也在迎来一些新的变化——竞争正从上半场的智能化,进入下半场的人性化大考验。 不过,技术本身通常有明确的标准,但对人性化的思考,却仁者见仁,考验着一个公司技术创新的出发点。 2013年,世界卫生组织发布《道路安全全球现状报告》,每年全球有124万人因交通事故丧生,而超速、酒驾、疲劳驾驶等人为因素是道路安全最大的风险。 彼时,怀揣着”用无人驾驶技术消除人为因素导致的交通事故“的梦想,全球科研中心竞相投入自动驾驶技术研发。 这一年,谷歌刚刚定下发展无人驾驶汽车的目标, Cruise也才刚刚成立。也是在这一年,百度开始了无人驾驶技术的布局,并于2017年推出了全球首个自动驾驶开放平台Apollo。 8年过去了,如何用技术消除人为因素导致的交通事故,让更多人享受到更安全出行体验,始终是百度Apollo发展无人驾驶技术的重心。 今年2月,百度创始人李彦宏在世界政府峰会与阿联酋AI部长奥马尔·苏丹·奥拉马对谈时分享了一个数据:无人驾驶比人类司机安全十倍,从萝卜快跑的实际记录来看,出险率仅为人类驾驶员的1/14。 用无人驾驶技术挽救更多生命,让出行更安全,是百度对“人性化”的思考,也是技术创新的起点。 字母榜(ID:wujicaijing)获悉,百度Apollo发布的八周年内部信中提到,在过去的2024年,除了继续追求技术突破、产品和服务创新之外,百度Apollo更加关注用户更多场景的出行需求,让多样化的出行体验都更安全、更便捷。 信中提到:去年跨过“无人化”技术门槛后,萝卜快跑更进一步,针对用户夜间出行需求,提供7*24小时全天候的无人化出行服务;为了解决恶劣天气下打车需求大、供给少的问题,萝卜快跑通过优化智能调度系统,逐渐成为城市运力的新补充渠道。 百度集团副总裁、智能驾驶事业群组总裁王云鹏在内部信中提到,在萝卜快跑1000多万的订单当中,节假日、早晚高峰、凌晨、夜间、雨天的订单占比超过53%。 这些不为人知的改变,是百度Apollo进入无人驾驶下半场,对“人性化”做出的具体诠释。 “安全,是最大的人性化”。 对百度Apollo而言,安全,是绝对的底线。去年5月,百度Apollo发布了全球首个支持L4级自动驾驶的大模型Apollo ADFM。 Apollo ADFM大模型之外,萝卜快跑还通过硬件产品层和安全架构层的升级等系列设计,达成了高达10重的安全冗余方案。仅在硬件感知方面,萝卜快跑第六代无人车就配备了40个传感器集群,能够实现超440米的超距探测,是人类目视极限的7倍,尽可能提升用户出行的安全上限。 这也使得萝卜快跑在面对复杂和极端的驾驶环境时,能够始终保持高效、安全、稳定的运行。 无人车安全能力的提升,直接带动着用户接受度的提高。 技术迭代进步之下,现在的萝卜快跑,早已非吴下阿蒙,频频引得用户在体验后对其刮目相看。被AI训练地越来越聪明的萝卜快跑更加灵活,在遵守交规的情况下完成加速、变道和超车等一系列操作,从武汉市民口中的“苕萝卜”,变成了用户喜爱的 “好萝卜”。 在国内市场取得用户认可的规模优势后,萝卜快跑正计划将这股科技向善的风暴,推向更广阔的海外市场。 继2024年11月获得香港首批自动驾驶车辆先导牌照并开启道路测试后,近期,萝卜快跑出海方面再次提速。 3月份以来,萝卜快跑在中东地区连下两城:与迪拜道路交通局(RTA)签署战略合作协议,率先在迪拜市区开展无人驾驶规模化测试和服务,双方计划,将在迪拜部署超过1000台全无人驾驶汽车;与阿联酋自动驾驶出行公司Autogo达成战略合作,双方将致力于持续扩大车队规模,打造阿布扎比地区规模最大的无人车队。 用户和市场是检验技术的唯一标准,反过来,也牵引着技术、产品和服务持续发展。未来,借助更多用户群体的使用和认可,萝卜快跑的规模效应有望得到强化,并从规模效应中反哺技术创新的涌现。 两天前,黄莺分享了带妈妈和朋友乘坐萝卜快跑兜风的视频。视频中,黄莺熟练地操作萝卜快跑“无障碍关爱”功能。“今天我的体验很成功,不是因为科技本身,而是因为有人愿意倾听我们的声音。未来希望更多的创新,都能像这样‘看得见’所有人。” 被看见的背后,则是百度Apollo对提升更多人出行安全初心的践行。 好的科技从来都不是高高在上,只有那些能够飞入寻常百姓家的技术,才会真正迎来大规模的应用落地。这也能够侧面反映出,走过八个年头的百度Apollo,内部为何正在发生新的改变。
世界首个,阿联酋要用AI制定法律
阿联酋要使用AI协助立法 凤凰网科技讯 北京时间4月21日,据《金融时报》报道,阿联酋计划利用人工智能(AI)来协助制定新立法,审查和修订现有法律,这是该海湾国家迄今为止在推动AI应用方面最激进的一次尝试。目前,阿联酋已在AI上投入了数十亿美元。 阿联酋官媒将这一计划称之为“AI驱动的法规”(AI-driven regulation)。AI研究人员称,该计划比其他国家所采取的措施更进一步,但他们同时也指出计划的细节还不够明确。其他政府也在尝试利用AI提升效率,例如总结法案内容、改善公共服务提供方式等,但尚未有国家像阿联酋这样,计划通过分析政府和法律数据,主动提出对现行法律的修改建议。 阿联酋副总统、迪拜酋长谢赫·穆罕默德·本·拉希德·阿勒马克图姆(Sheikh Mohammad bin Rashid Al Maktoum)表示,“这一由AI驱动的新立法体系将改变我们制定法律的方式,使立法过程更快、更精准”。谢赫·穆罕默德称,AI将“定期为我们立法提出修订建议”。内阁会议纪要显示,阿联酋政府预计AI将使立法工作提速70%。不过,专家也指出,AI存在可靠性问题。 上周,阿联酋内阁批准设立一个新的内阁机构:法规智能办公室(Regulatory Intelligence Office),以负责推进这项AI推动立法的计划。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。