行业分类:
加载中...
头条分类:
加载中...
张博恒重夺全国体操锦标赛男子个人全能冠军
  新华社南宁5月19日电(记者曹祎铭、卢羽晨)19日,在广西南宁举行的全国体操锦标赛男子个人全能比赛中,湖南高速队运动员张博恒以82.965分夺得冠军。这也是他继2022年和2023年的两连冠之后再次问鼎。 5月19日,张博恒在单杠比赛后庆祝。新华社记者 许雅楠 摄   尽管带伤参赛,张博恒仍在自由体操和跳马两个项目中拿到全场最高分。虽然鞍马出现失误,但凭借其余项目的稳定发挥,张博恒在前五轮逐步拉大分差。在最后一个单杠项目中,张博恒主动降低了动作难度,将优势保持到了最后。   赛后,张博恒用“可圈可点”来点评自己在决赛中的表现。“这几天对场地越来越适应,动作也越做越好。但是脖子受伤还是影响到了动作完成度。为了求稳,只能在最后的单杠项目中降低了难度。” 5月19日,张博恒在鞍马比赛中。新华社记者 黄孝邦 摄   卫冕冠军、江苏队侍聪以79.765分获得第二名。赛后接受记者采访时,侍聪表示自己伤后刚恢复不久,在技术上也还有欠缺,接下来的训练中将加强双杠项目。   东道主广西队选手兰星宇发挥稳定,最终以79.632分首次获得赛事全能第三名。他说:“我觉得这枚奖牌是对我这么长时间以来努力的认可。自己在决赛中发挥比较稳定,但没有拿到理想的分数,新周期将针对弱项继续补强。”   在上个奥运周期受伤后,浙江队杨皓楠在首次归来的全能预赛中发挥出色排名第二,但决赛仅获得第七名。他表示当天状态挺好,但久违赛场,在自由体操和鞍马的比赛中用力过猛,导致失误较多,“离全运会还有时间,可以再慢慢积累经验”。 5月19日,杨皓楠在吊环比赛中。新华社记者 黄孝邦 摄   比赛结束后同时决出特设项目男子鞍马吊环双杠全能的排名。江苏队老将尤浩以42.566分获得第一名,兰星宇、张博恒以41.199分和41.099分位列二、三名。   20日,本届体操全锦赛将进行女子个人全能决赛。
谷歌发布1800元/月的AI订阅,还把“通用AI”塞进了生态每个角落
软件硬件双管齐下,定义「下一代 AI 产品」怎么做。 作者|张勇毅 首先是一个冷知识:ChatGPT 中的「T」代表「Transformer」,这个概念是谷歌的一群工程师在 2017 年提出的,并发表在一篇现在已成经典的论文《Attention Is All You Need》中。 这个小细节,很大程度上能说明谷歌在 AI 领域并不是一个花架子团队,而是由一群 AI 产品业内经验最丰富的老兵组成的团队,从 Gemini 2.5 发布之后,Google 在 AI 领域的优势已经颇有点「渐入佳境」的感觉:基础模型能力的大幅提升,加上 Gemini 在谷歌软件生态内的逐渐深入,让全球数以十亿计的用户都在这个过程中,逐渐被「转化」成谷歌 AI 产品的用户。 如何「转化普通用户变成 AI 产品用户」,是这个时代几乎所有 2C AI 产品都需要回答的问题,显而易见,在这个问题上,Google 已经凭借着巨大的存量用户优势,甩开了所有竞争对手——但谷歌同样需要奔跑不停,才能在 Perplexity、OpenAI 以及微软等强大竞争对手的围剿中,留住用户的心。 Google 显然最清楚在端侧 AI 爆发的时代,谷歌的实际优势在哪里,用户同样知道谷歌知道他们想要哪些 AI 能力,出现在自己最常用的日常应用中。 这就是今年谷歌 I/O 2025 大家的共识,Google 也确实在主题演讲中,几乎全程都在介绍谷歌在这些领域中的潜力,以及向世界展示,AI 能给这些用户原本已经熟悉的使用体验带来哪些改变。 01 Google 搜索引擎 AI Mode 深入 作为目前巨头中 AI 落地成效最显著的选手,Google 毫不掩饰自己在 AI 产品商业化用户规模上的领先,上来就展示了大量 AI 能力在谷歌产品中的实际应用成果。 Google CEO 桑达尔-皮查伊 介绍,基于 Gemini 能力的 AI 总结功能现在已覆盖全球超过 15 亿用户,AI 总结功能在全球的调用次数增长已经超过 10%,而且这种增长还在持续。多模态识别能力的谷歌Lens 现在同样已经有超过 15 亿的月活用户。 桑达尔-皮查伊将其称为「搜索引擎过去十年内最成功的革命」| 图片来源:极客公园 但 AI 显然不只是能在搜索引擎上起到作用,比如谷歌同时就宣布了新的「虚拟试穿」功能,谷歌会要求你提供一张全身照片,通过大模型「理解人体和服装的细微差别,不同材料在不同身体上折叠、拉伸和垂坠。然后使用这张照片,生成你穿着你正在选购的衣服的图像。 一直传闻中的谷歌想要借助 Chrome 入局 AI 浏览器,本次 IO 中也终于崭露头角,除了 Chrome 浏览器本身更深度的整合 Gemini 接口、识别网页内容以外,谷歌还为搜索引擎调添加了全新的「AI 模式」。这个模式把类似 Gemini 或 ChatGPT 的聊天机器人功能直接带入了用户的网页搜索体验。你可以用它来找链接,但也能更快地获取信息、追问问题,让 Gemini 以平时在普通网页上找不到的方式来整合信息。 谷歌搜索的负责人甚至放出豪言:如果你想知道互联网上最重要的搜索引擎未来会变成什么样,那你就去点开「AI 模式」看看。 「AI 模式」同时也支持深度研究功能,会自动将用户的提示词转化为海量的搜索,并自动查找和整合信息,同时在这个模式下,AI 搜索还可以访问你之前的搜索记录,你也可以手动开启权限,让它可以访问你的电子邮件,以便 AI能更了解「你是谁」以及你关心什么。 把所有这些功能加起来,你就会得到一个更加灵活和个性化的 AI 搜索,无论是针对用户本身还是当前的具体查询,显然都能根据用户信息给出更加精准的回答。 Gemini 2.5 家族也同时加入了支持深度思考的版本 —— Gemini 2.5 Pro Deep Think,在 2025 年美国数学奥林匹克竞赛 (USAMO) 中取得了 40.4% 的高分,要知道这可是最难的数学基准测试之一,比之前的 2.5 Pro 版本足足提升了 10 多个百分点。同时在 LiveCodeBench 竞赛级编程难题中,它的得分更是高达 80.4%。同时,在多模态推理 MMMU 测试中,也取得了 84.0% 的成绩。 Gemini Live 的摄像头共享功能于去年在谷歌I/O 大会上首次亮相,当时它的名字还叫 Project Astra,随后作为 Gemini Live 在 Android 上正式推出。它允许谷歌Gemini「看到」您摄像头中的一切,因此您可以就周围的世界进行持续对话——例如,根据冰箱中的食材询问食谱建议。 随着谷歌在用户场景中逐渐深入,现在这一功能被直接引入搜索的 AI 模式中,通过点击「Live」图标,用户将能够与搜索共享他们的摄像头画面,并直接询问眼前的事物,例如自行车应该如何组装。并且可以自动根据上下文对你们的情况进行同步更新回答。 在现场的演示中,最令笔者印象深刻的新功能,是其新获得的主动性。可以根据它观察到的事件选择何时开口,像一个真人一样,对你的操作进行建议,例如在用户做作业时进行观察,它可能会注意到您犯了一个错误,并直接指出用户哪里错了,而不是反过来等着用户要求 AI 去执行任务。 据 DeepMind CEO Demis Hassabis 表示,教 AI 自主行动一直是计划的一部分。这些「察言观色」的技巧,是人类相对擅长但难以量化或研究的事情。 02 Android XR 明眼人看到这里已经能反映过来了:比起手机摄像头,这个如此深入现实世界的多模态 AI 功能,似乎更适合的载体是在眼镜上。 Google 显然同样想到了这一点,随即趁热打铁,宣布了 Android XR 的新进展,同时在现场展示了谷歌XR 眼镜的原型机。 在演示中,Google 强调它们是使用 Gemini 的「最佳硬件」:Google的、 展示的原型眼镜搭载有相机,麦克风和扬声器,Gemini 可以调用这些硬件,帮用户理解周围的世界。同时在显示屏上显示类似地图导航等更多信息。 目前,谷歌正通过与三星、XREAL 的合作,来研发首批搭载 Android XR 操作系统的眼镜硬件。谷歌 XR 副总裁 Shahram Izadi 表示,第一款硬件设备是三星的 Project Moohan,但那是一款更接近 Apple Vision Pro 的 XR 头显。第二款 Project Aura 属于 XREAL。定位是一款 AR 眼镜。 除了三星、XREAL 这样的硬件厂商,Google 显然也是从 Meta Ray-Ban 的大获成功中吸取到了经验,同时也宣布了与包括 Gentle Monster 在内的两家时尚眼镜巨头合作,一同将 AI 眼镜打造的更加时尚。 03 AI 创作全家桶 除了直接面向最多普通用户的 Gemini,Google 同时还针对创作者的一系列 AI 创作工具,进行了更新换代 —— 其中不仅有直接与 Sora 竞争的 Veo3、图像生成工具 image4,Lyria 2 音乐生成模型,还有全新视频创作工具 FLOW。 Veo 3 相比前代,最大的升级是它可以生成包含音效、背景噪音,甚至对话的视频。 谷歌现场演示了一段 CGI 级别的生成动画,其中动物在森林里说话。声音和视频完美同步:有声音的视频显然大大提升了 AI 生成视频的实用性。谷歌 DeepMind 首席执行官 Demis Hassabis 也表示:「我们正在走出视频生成的‘无声时代’。」 Google 同步宣布了「大杯」和「超大杯」订阅服务,AI Pro 与 AI Ultra,其中顶配的谷歌AI Ultra 要价每月 249 美元,但同时也确实提供了物超所值的服务 —— 例如几乎无限制的各项服务使用额度,以及 30TB 的谷歌Cloud 云端存储容量。 AI Ultra 计划允许用户试用 Gemini 2.5 Pro 全新的增强推理模式 Deep Think,据谷歌介绍,该模式专为「高度复杂」的数学和编程问题设计。它还提供 Chrome 中 Gemini 的早期访问权限,允许订阅者直接在浏览器中使用 AI 完成任务和总结信息。 除了这些之外,订阅用户还可以试用谷歌的 AI Agent 原型 —— Project Mariner,可以同时自动化多达 10 项任务,例如查找信息、预订和购买产品。 通过将 Gemini 能力深度融入搜索引擎、Chrome浏览器、虚拟试穿、乃至全新的Android XR生态和AI眼镜,Google不仅在提升现有产品的用户体验,同时也是在潜移默化地定义「下一代 AI 产品」怎么做。 显然,在端侧 AI 产品如何做这件事上,Google I/O 展示出的「软件硬件双管齐下」,已经足以让谷歌再次成为 AI 产品生态中最让人忌惮的选手。 *头图来源:极客公园
国安题材剧集《绝密较量》:巧妙平衡真实性与戏剧性
  图为《绝密较量》剧照 片方供图   国安题材谍战剧《绝密较量》迎来大结局,引起观众热议。该剧围绕第四代核电技术的重重博弈,通过真假难辨的人物身份与虚实交织的技术迷宫,精彩勾画新时代国家安全防线上的隐秘斗争。   传统谍战剧往往依托战争或动荡年代背景展开,敌我阵营鲜明,潜伏与交锋的张力浑然天成。当代国安工作转向信息战、科技战,其隐秘性与多维博弈向创作者抛出了更复杂的命题:如何将看不见的危机,编织成跌宕起伏的故事?   导演刘江擅长通过人物内心世界展现信仰之坚定。在《黎明之前》中,他通过漫长的铺垫与出其不意的反转,塑造了谍战剧影史上动人的牺牲瞬间。这一次,从传统谍战剧中突围,《绝密较量》给出的答案是,借鉴悬疑剧和刑侦剧的创作思路,由传统谍战剧“敌明我暗、敌强我弱”的卧底模式,转向“我明敌暗、我强敌强”的侦破模式,从而构建更为复杂的叙事结构和人物关系,升级悬念的密度与强度。   剧集通过类型融合策略,将谍战与商战、悬疑、刑侦、情感元素相结合,揭示深藏于日常生活表象之下的安全危机。一场看似正常的商业谈判或科研合作,有可能只是间谍渗透的伪装。这种处理,拓展了故事的当代性与复杂性,让观众身临其境,又常有恍然大悟之感。   剧中,“主角侦察”与“反派破坏”两条叙事线索并行推进。敌方间谍以色诱、投毒、暗杀、策反、网络入侵等多种手段渗透,主角团队通过大数据追踪、生物检测等高科技手段有力回击。你来我往、攻防交替的节奏让叙事始终紧绷,观众在敌我双方的命运之间不断切换视角,不仅关注“谁是间谍”,还会陷入对“阴谋如何发展”的持续疑问,体验如过山车般的情绪波动。   人物关系的创新,毫无疑问是这部剧最具冲击力的突破,也是持续营造紧张感的动力源。男女主角之间错综复杂的心理拉锯,扣人心弦。男主角杨光作为国安干警,冷静、坚韧、睿智,但限于身份属性,角色多面性不好充分展现。为此,创作者巧妙赋予女主角赵亚苧一个扑朔迷离的身份,并通过层层反转,不断激发观众的好奇心。   男女主角以假意试探作为交锋开端,各怀目的,攻守转换。他们的关系,也成为双方情报行动中的关键环节。随着两人情感线的推进,这一疑团激起观众复杂的情绪,期待与担忧并存。在情感与危机的多重压力下,杨光始终以坚定的职业信仰作为精神防线。这份微妙而克制的情感张力,成为“信仰力量”最生动的注脚。   《绝密较量》致敬国安英雄的信仰与守护,它的热播体现出创作者把握社会现实、捕捉审美趋势的智慧与能力,也显示了当代国安题材的创作潜力。相信未来将有更多此类作品,在叙事与人物塑造上大胆创新,巧妙平衡真实性与戏剧性,开辟谍战剧的新境界。   (作者:刘 起 单位:中国文联电影艺术中心)
谷歌AI全面进化:Gemini2.5开启“深度思考”,视频生成模型Veo 3硬刚Sora
凤凰网科技讯 5月21日,2025谷歌I/O开发者大会主论坛演讲今日凌晨举行,谷歌宣布了其在人工智能领域的最新进展,核心围绕Gemini 2.5系列模型的升级及其在多款产品中的深度整合。公司强调,AI技术的迭代速度正显著加快,旨在尽快将最先进的模型能力推向用户和开发者。 在模型层面,Gemini 2.5 Pro和2.5 Flash都迎来了能力提升。据称,自初代Gemini Pro发布以来,Elo等级分已提高300多分,目前的Gemini 2.5 Pro在LMArena排行榜上占据首位,并在流行的编码排行榜WebDev Arena上名列前茅,Elo分数为1415。此外,2.5 Pro 在与教育专家合作构建的学习模型系列LearnLM的评估中也表现出色。 针对更复杂的任务,谷歌正在探索一种名为Deep Think的实验性增强推理模式,它利用新的研究技术,使模型在回应前考虑多种假设,目前已在部分数学和编程基准测试中显示潜力,正在进行额外的安全评估。作为效率主力模型的2.5 Flash,则在推理、多模态、代码和长上下文等关键基准测试中得到改进,同时效率更高,在评估中使用的令牌数量减少了20-30%。 Gemini 2.5系列模型还引入了多项新功能。其中,原生音频输出功能和Live API的改进,支持更自然、富有表现力的对话体验,包括情感对话、主动音频和思考能力。文本转语音功能也得到增强,支持多位说话人,且能捕捉细微差别,现已在Gemini API中可用。 备受关注的Project Mariner的计算机使用功能正被引入Gemini API和Vertex AI,计划于今年夏天更广泛地推出供开发者实验。同时,模型的安全性也得到提升,显著增强了对间接提示词注入攻击等威胁的防护。开发者体验方面,模型推理摘要和推理预算功能被引入,以提供更高的透明度和控制能力。 AI能力正被深度融入谷歌的核心产品中。尤其是在搜索领域,AI Overviews已覆盖超过15亿用户,并在200个国家和地区推出。谷歌正在美国推出全新的AI Mode,为用户提供端到端、更智能的AI搜索体验,支持更长、更复杂的查询和后续提问,并计划于本周开始在美国地区的搜索中整合Gemini 2.5 模型。 Gemini应用本身也正在向通用AI助手转型。去年在研究原型 Project Astra 中首次展示的摄像头和屏幕共享功能,现已整合到Gemini Live中,并向所有Android用户开放,今日开始向iOS用户推出。应用中还将很快向订阅者推出实验性的Agent Mode,帮助用户执行多步任务,例如跨网站搜索公寓房源。 此外,谷歌正在探索利用“个人上下文”技术提升个性化体验,允许模型在用户许可下私密地访问相关个人数据(如邮件、文档),用于生成更贴合用户风格的回复,例如 Gmail中推出的个性化智能回复,预计今年晚些时候向订阅者提供。 除了核心模型和应用,谷歌还将多项前沿研究转化为实际产品。此前展示的3D视频技术Project Starline演变为Google Beam,这是一个AI驱动的视频通信平台,通过多摄像头阵列和AI生成逼真的3D体验,首批设备将于今年晚些时候与惠普合作提供给早期客户。 Google Meet也正在推出通过语音翻译打破语言障碍的功能,目前英语和西班牙语的 Beta版已向部分订阅者开放,更多语言和企业客户测试将陆续推出。 在生成式媒体领域,谷歌发布了全新视频生成模型Veo 3和图像生成模型Imagen 4。Veo 3首次实现了视频原生音频生成,可创建环境音效和角色对话,为视频创作提供了全新可能。Imagen 4则在图像质量和文字排版方面实现了跨越式提升。 Google还推出新型AI电影制作工具Flow,整合了Veo、Imagen和Gemini多个模型,旨在帮助创作者从构思到成片全流程创作,该工具已向Google AI Pro和Ultra订阅用户开放。为应对AI生成内容识别难题,谷歌继续使用SynthID为生成内容添加不可见水印,并推出专门的检测工具。 公司指出,这些进展得益于其领先的基础设施,包括专为大规模思考型和推理型 AI 工作负载设计的第七代 TPU Ironwood。数据显示,谷歌通过不同产品和API处理的token量已从去年同期的每月9.7万亿增长到目前的480万亿以上,开发者数量增长五倍。这些都表明AI正以前所未有的速度被世界各地的个人、企业和社区所拥抱。 谷歌持续在基础研究上加倍投入,致力于推动实现通用人工智能(AGI)和构建能够理解世界的“世界模型”并强调在每一步都将安全和责任置于工作的核心。
冯小刚的“怪味女性主义”
  《向阳·花》剧照   不久前和一位影评人朋友一起看了冯小刚导演的《向阳·花》,从电影院出来,进电梯间,两人都沉默无话。然后相视而笑。   “这是一部什么电影?好奇怪。”朋友说。   “前面看着还行,叙事上有着老技师的熟练沉稳,但越来越离奇,怎么越看越像张艺谋的《第二十条》?”   “因为都是赵丽颖做主演带来的混淆?”   “也不全是,你看,电影里都有一个哑巴……”   “但是《第二十条》里赵丽颖扮演的角色是哑巴,《向阳·花》里是赵丽颖扮演的高月香的伙伴黑妹是哑巴。”   “的确不一样,但都有哑巴,这个哑巴都代表了底层的失声,呈现了一种极端的生存处境。而且赵丽颖扮演的角色都有被性侵的画面。”   给人这种相似联想的地方有很多。冯小刚也曾被归为第五代导演,虽然他不是北京电影学院毕业的,不算第五代的嫡系,但代的属性仍然如此有分量,将他们绑定在一起。不曾料想到的是,在电影已经多元化发展的今天,他们仍然在用自己的作品顽强地证明着代的存在。   曾经在2000年前后,第五代导演都拍古装皇帝戏,那时候作为第五代的周晓文是先行者,他首先在上个世纪90年代中期拍摄了《秦颂》,然后陈凯歌、张艺谋、冯小刚相继拍摄了若干发生在宫廷中的故事。前些年又都筹划拍抗美援朝,冯小刚虽然没有拍成,但他拍摄抗美援朝电影的相关计划是很早的。后来张艺谋拍了司法和底层双重困境的《第二十条》,冯小刚的这部新片《向阳·花》也是类似的主题。   以前笔者提到过一个概念,叫作年龄政治。在年龄上大做文章,似乎涉嫌身份歧视。但在国内年龄分层又有其道理,不同年龄的人身上烙印着某种脱离不开的精神格调和文化范式。   只是如今时代变迁,有了新的时代精神,这些年我们文化中的女性意识变得越来越充分。已经拥有了充分文化资本的她们在这里开始变成了被审视的对象。去年出现了一个词叫“老登电影”,指向那些男性尤其是年长男性主导的电影。当然它有更复杂的内涵,也指那些饱含“男性凝视”的电影作品。   这样的思潮如此强烈,已经介入了文化产业,影响了文化生意。要想电影有票房,不让当下年轻人反感,不影响票房口碑,就要改变其惯有的文化模式,尤其是关于性别的叙事倾向。   第五代导演的剧本会上,包括一些香港老年电影导演的创作,都更加注重引入女性的声音,增加女性的顾问成分。女性的感受被更加留意了。一位老导演的新片在海外电影节受到女性的批评,在后期重新做调整时,引入了一位女性作为联合导演。   这当然可说是精神可嘉。但是这个转向也并不容易,而是异常艰难。这是所谓灵魂深处的斗争,很有点史无前例的意思。而且,这不仅仅是叙事的技术问题,还要考验灵魂的“诚与真”。   在《向阳·花》里,有一些情节让人难忘。高月香被某老板性侵——高的行动并不可信,似乎是为了情节的需要,不顾人物性格的逻辑而被强行加戏。而性侵戏,我们去年批评张艺谋电影时就表达过类似的观点:为什么女性被压迫的方式就一定是被性侵?他们对于女性命运和真实处境缺乏想象。也许电影需要这样的刺激性画面?这样的悖论之处有很多。   如果以为“秉持了一种关怀的姿态,就是关怀了”,这类伪善,大家可以迅速辨别。我对《向阳·花》最后一场戏的记忆也比较深刻:几个从监狱里面出来的女子有了自己的经济实体——她们合作经营一家洗车行,不仅盈利,还有自己强烈的道德主张:我们不惹事,但是我们也不怕事!   这样的台词很有点刻意的感觉,女性同盟和Girl helps girl(女孩帮助女孩)的意涵十分明显了。但叙事上的混杂、人物塑造的缺陷,却让这份表达打了折扣——人物如同提线木偶一样存在,失去了命运的自主性,令叙事失去了可信度。因此,影片最后刻意迎合女性叙事的“正确段落”非但没能引发共鸣,反而成了不可忍受的东西。这就像一种假酒的配方,这个添一点,那个加一点,好应付购买者的味蕾。   朋友说:“在去年‘老登电影’的列表中,其实冯小刚导演之前的作品就入列了,这次他肯定也想着改变。”   我认同:“的确,这完全可以理解。学者不是说,他们第五代——当然第四代和每一代都是历史的人质嘛,其实很多都是集体潜意识中的东西,他们自己也无法超脱,能有这样一个意识,无论如何,都是好的。”   朋友接着说:“的确如此。但问题是,过去他们消费女性,现在他们开始消费女性主义了,这是对于女性的另外一种消费。他的女性主义表述味道很怪,可以称为怪味女性主义。”   我们这么评价,会不会过于严苛了?之前我们常说,女性主义有一百种,不一定同一,若从真实的立场和真诚的心灵出发,它们就都是善的。但问题是,这里对于女性命运的刻画明显地不下功夫,不做田野,不深入,不下沉,只会使用某些流行的配方,追求刺激效果。这样的做法就是一种消费。   由于我们对于一部影片的生产机制不能够完全了解,所以我们这样的批评应该不仅仅指向导演一人,而是指向这个文本的所有写入者。而这样的文本也许有另外一种解读法:它是另外一种批判性的文本?   所谓“怪味”——怪味女性主义,怪味现实主义,最近这些年我们在电影中其实已经司空见惯。它们究竟意味着什么?这是一个值得深思的话题。(作者王小鲁 为电影评论家)
国际乒联彻查王楚钦球拍检测受损事件
  新华社多哈5月20日电(记者曹剑杰、王子江、罗晨)当地时间19日下午,在多哈世界乒乓球锦标赛混双第二轮中,中国选手王楚钦的球拍在赛前检测环节出现受损情况。中国乒协赛后向国际乒联提出抗议和申诉,国际乒联回应要彻查此事。   在与巴西组合雨果·卡尔德拉诺和布鲁纳·高桥的比赛开始前,王楚钦发现球拍海绵开裂,经过他本人和教练肖战的交涉,裁判同意他更换球拍。赛后王楚钦对球拍被损坏表达了不满,他表示检测前球拍完好无损,进场后发现海绵开了一半,“没办法打比赛”。   在当日全部比赛结束后,国际乒联与中国乒协就该事件举行了特别会议,进行沟通交流。中国乒协主席王励勤、中国乒协秘书长何潇、国际乒联竞赛团队、裁判团队以及球拍检测团队负责人参加本次会议。   王励勤表达了对该事件的关切,详细阐述了事件发生后中国乒协所采取的行动,包括第一时间询问运动员、教练员情况,并与工作人员进行交流,同时代表乒协就球拍检测受损事件提出抗议和申诉,要求调取监控并且要求调查事件原因。为避免该类事件再次发生,中国乒协提出三点意见,国际乒联一一进行回应。   ——中国乒协希望在此事件之后,能够由工作人员全程跟随球拍检测并确保没有任何无关人员可以接触到检测后的球拍。   国际乒联表示,根据赛事规则,允许各支球队派一名工作人员全程跟随。   ——中国乒协希望后续赛事更换更大且更安全的球拍检测容器。   国际乒联表示,在该事件发生后,已第一时间要求组委会提供A4尺寸的大信封,并要求所有裁判员在工作过程中小心谨慎对待球拍,同时强调球拍检测团队的操作程序是正确的。   ——中国乒协要求球拍检测过程全程录像。   国际乒联表示从本次世乒赛实际操作角度,全程录像暂时无法实现。国际乒联将在未来比赛过程中逐步推进。   经过双方充分讨论,国际乒联与中国乒协还达成以下共识:国际乒联与场馆方确认是否有监控后及时反馈。国际乒联将继续深入调查球拍受损原因,并形成书面调查报告。   国际乒联于当地时间20日凌晨发表声明表示,一直致力于维护赛事公平公正,并将以此次事件为契机,进一步完善赛事组织和管理工作,加强对运动员装备的保护,确保类似事件不再发生。同时,感谢中国乒协及广大运动员、教练员、球迷对国际乒联工作的理解与支持,共同努力推动乒乓球运动的健康发展。
王楚钦临阵换拍 世乒赛“莎头”双线告捷
  新华社多哈5月19日电(记者王子江、曹剑杰)多哈世界乒乓球锦标赛19日进入第三个比赛日,中国队选手王楚钦和孙颖莎赢得各自的单打比赛后,又联手在混双比赛中击败世界杯男单冠军雨果·卡尔德拉诺和女友布鲁纳·高桥组合,单双打都晋级第三轮。 5月19日,王楚钦(左)/孙颖莎在比赛中。新华社记者 刘续 摄   卡尔德拉诺/高桥的组合并没有像赛前预料的那样给“莎头”组合带来大的挑战。尽管遭遇球拍损坏的意外情况,但志在混双“三连冠”的“莎头”仍然仅用19分钟就以11:2、11:7、11:4战胜对手,晋级16强。   比赛开始之前,王楚钦发现球拍海绵开裂,经过他本人和教练肖战的交涉,裁判同意他更换球拍。赛后王楚钦对球拍被损坏表达了不满,他表示检测前球拍完好无损,进场后发现海绵开了一半,“没办法打比赛”。   不过对于整个比赛过程,两人都表示非常满意。孙颖莎赛后表示,比起第一轮,两人的配合和衔接更加顺畅,赛前他们对巴西组合有了一定的研究,除了第二局对手让他们有些“不舒服”外,整体发挥不错。王楚钦表示,两届冠军的成绩已经成为过去,希望让多哈成为新的开始,“全力以赴赢得下一场胜利”。 5月19日,王楚钦/孙颖莎(左)在比赛中。新华社记者 肖艺九 摄   在上午开始的单打比赛中,王楚钦迎战巴西选手莱昂纳多·饭冢。19岁的饭冢世界排名77位,曾在去年的世界青年锦标赛上获得男单铜牌,但他并没有给王楚钦制造太多麻烦。作为二号种子的王楚钦以11:3、11:3、11:5、11:4获胜,晋级32强。   女单卫冕冠军孙颖莎面对朝鲜选手边松景,以11:2、11:5拿下前两局后,在第三局遭遇强有力挑战,两人从3:3平一直打到8:8。孙颖莎关键时刻再次占据优势,以11:9拿下。之后她以11:4赢得第四局顺利晋级。   王楚钦男单第三轮将面对中国香港选手黄镇廷和法国选手泊雷特之间的胜者,孙颖莎女单比赛中的下一个对手将在两名法国选手袁嘉楠和卢茨之间产生。两人混双的下一个对手是罗马尼亚组合、15号种子约内斯库/萨马拉。
抢跑“GPT-5”!谷歌发布最强AI全家桶,史上最贵AI会员定价1800元/月
去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙击。 今年攻守之势异也。 前几天 OpenAI 透露 GPT-5 将 All in One,集成各种产品。刚刚,Google 就把这个思路贯彻到 I/O 大会,直接掏出了自家有史以来最强的 AI 全家桶。 从 Gemini 2.5 Pro/Flash 模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向开发者与创作者的 AI 套件等,Google 几乎把从模型到产品的路径都压缩到一场发布会里。 更准确地说,当下最火的 AI 应用场景,都被 Google「预埋」进了产品接口里,让人无法忽视它作为全球同时具备工程实力和生态整合能力的 AI 巨头硬实力。 也难怪许多网友调侃,将近两个小时的发布会过后,又将有一大批初创公司死于 Google 之手。 不过,也不难看出,发布会上有一些功能仍停留在「预告片」和小范围测试阶段,距离真正的落地或许还有不小的距离。 此外,Google 还正式发布了 Android XR 产品和技术线的最新一代产品:与 Xreal 共同推出的首款轻量级智能眼镜产品 Project Aura。(更多细节请留意后续的另一篇报道) 帮我「买票 + 找座 + 填表」一口气搞定,Google 新 AI 搜索卷疯了 AI 正在重写搜索的底层逻辑。 在去年的 I/O 大会上,Google 推出了 AI 概览(AI Overviews)功能,至今已拥有超过 15 亿的月活跃用户。 生成式 AI 逐渐改变了人们的搜索方式,但随之而来的却是,我们不再满足于在搜索框里输入简单的问题,而是抛出更复杂、更长、更具多模态的提问。 今天,Google 再次加码搜索与 AI 的融合,推出一种端到端的 AI 搜索体验——AI Mode。 正如 Google CEO 桑达尔·皮查伊介绍的那样,这是 Google 有史以来最强大的 AI 搜索形态,不仅具备更先进的推理能力和多模态理解能力,还支持通过上下文追问和网页链接进行深度探索。 例如,当用户面对一个需要复杂解读的搜索问题,AI Mode 可启动「深度搜索」机制,不同信息之间进行推理,并在几分钟内生成一份专家级的引用报告,为你节省数小时的研究时间。 与此同时,Google 也将 Project Astra 的多模态能力接入搜索,进一步提升搜索的实时交互性。通过 Search Live 功能,用户只需打开摄像头,即可通过画面实时提问并获得反馈。 今年是 Agent 元年,Google 也很贴心地推出了 Project Mariner Agent 功能,能帮助用户更高效地完成任务。 例如,只需一句「帮我找两张周六比赛的实惠票,位于下层座位」,AI Mode 便能自动跨多个票务平台检索选项,实时比较价格和库存,并完成表单填写等繁琐操作,大幅提升效率。 借助 Gemini 模型和 Google 购物图谱的强大支持,Google AI Mode 能够帮助你缩小商品范围并提供灵感。如果你想看看衣服穿在自己身上的效果,只需要上传一张自己的照片,就能实现虚拟试穿衣服。 此外,AI Mode 也具备强大的个性化能力,能根据用户上下文偏好给出定制化建议,还可生成图表和可视化结果,尤其在体育和金融类搜索中表现出色。 该功能今日起已在美国全面上线,未来将推广至更多地区。 会写代码、还省 Tokens,Gemini 拿到了「学霸」人设 在模型能力方面,Google 此次发布了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上独占鳌头。 现在,Gemini 2.5 Pro 引入了名为「Deep Think」的推理增强模式。这项功能可在生成答案前考虑多个假设,从而更深入地理解问题背景。 2.5 Pro Deep Think 在 2025 年美国数学奥林匹克(USAMO)以及 LiveCodeBench(编程基准)排名领先,并在 MMMU(测试多模态推理)中获得了 84.0% 的分数。 不过,Google 表示,将会花更多时间进行前沿安全评估,并征求安全专家的进一步意见。作为第一步,Deep Think 功能目前将通过 Gemini API 向小范围测试者开放。 同样得到升级的还有注重效率的 Gemini 2.5 Flash。 新版 2.5 Flash 在推理、多模态、代码和长上下文等关键基准上都有了改进,同时在效率上更高,评估中使用的 tokens 减少了 20% 至 30%。 2.5 Flash 现已在 Gemini 应用程序中向所有人开放,并将在 6 月初通过 Google AI Studio 面向开发者和 Vertex AI 向企业全面发布。 开发者体验上,2.5 Pro 和 2.5 Flash 将在 Gemini API 和 Vertex AI 中引入了「思维摘要」功能,可将模型的推理路径以标题、关键信息和调用工具等方式进行结构化呈现。 开发者也将从中受益,Google 宣布在 Gemini API 和 SDK 中正式支持 MCP 工具,让开发者可以轻松接入更多开源工具和插件生态。 音乐、电影、图像全套上线,Google 把 AI 玩出了花 本次发布会,Google 带来了新一代视频和图像模型——Veo 3 和 Imagen 4。 与传统视频生成不同,Veo 3 是一款支持音频的视频生成模型,能在城市街景中模拟交通、鸟鸣,甚至角色对话,显著提升沉浸感。 该模型不仅在文本和图像提示的基础上生成视频,还能精确实现物理环境与口型同步,极大提升了视频创作的真实感。 目前,Veo 3 已在 Gemini 应用和 Flow 平台上向 Ultra 订阅用户开放,并已在 Vertex AI 平台上为企业用户提供支持。 上文提到的 Flow 正是 Google 为创作者打造的一款 AI 电影制作工具。 用户只需用自然语言描述电影场景,即可管理演员、地点、道具和风格,自动生成叙事片段。Flow 已在美国向 Gemini Pro 和 Ultra 用户开放,全球范围的推广也在推进中。 在图像生成方面,新版 Imagen 4 提升了精度与速度,细节表现上可逼真展现织物、水滴与动物毛发,同时也能生成偏抽象类型的风格。 它支持 2K 分辨率和多种长宽比生成,在排版和拼写方面也有显著优化,适合制作贺卡、海报甚至漫画。 Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上线,据悉,未来还将推出速度快十倍的版本。 在音乐创作方面,Google 扩大了 Lyria 2 驱动的 Music AI Sandbox 的访问权限,并上线了互动式音乐生成模型 Lyria RealTime。该模型现已通过 API 和 AI Studio 向开发者开放。 考虑到由 Veo 3、Imagen 4 和 Lyria 2 生成的内容将继续带有 SynthID 水印,Google 发布了全新的 SynthID Detector。 用户只需上传文件,即可识别其中是否包含 SynthID 水印,用于防伪和追踪 AI 内容来源。 Google 要造「世界模型」,连任务都能帮你做了? Google 希望将 Gemini 打造成一个「世界模型」,既能计划、理解,也能模拟现实世界的各个方面。 Google DeepMind CEO Demis Hassabis 表示,这一方向正是 Project Astra 的核心理念之一。 过去一年里,Google 已将视频理解、屏幕共享、记忆功能等逐步集成进 Gemini Live。如今,Gemini 新的语音输出加入了原生音频,更加自然;记忆与 computer use 能力也同步增强。 此外,Google 还在探索如何利用 Agent 能力帮助人们处理多任务。 Project Mariner 就是其中之一,能够同时完成最多十项任务,比如信息查询、预订、购物与调研。已面向美国 Ultra 用户开放,并即将集成至 Gemini API 与其他核心产品中。 AI 新功能扎堆发布,会诞生真正的杀手锏吗 NotebookLM 官方昨日宣布,上线 24 小时就已经成为 App Store 中排名第 2 的生产力应用和第 9 的整体应用。 作为 Google 在 AI 笔记工具上的一次重要探索,NotebookLM 提供音频概览和思维导图等功能。 其中,音频概览目前已支持超过 80 种语言,而本周,Google 也宣布将为这一功能引入更高的可定制性,用户可根据需要选择摘要的长度,无论是快速浏览还是深入阅读都不在话下。 这项功能首先将在英语中推出,随后将扩展到更多语言。 与此同时,Google 也在回应用户对视觉呈现的诉求,即将在 NotebookLM 中加入视频概览功能,用户只需一键即可将笔记内容转化为教育类视频,用更直观的方式传递信息。 在 AI 编程领域,Google还带来了 Jules 的最新进展。 这个最初出现在 Google Labs 的自主编码助手,能够理解代码并自主完成诸如编写测试、构建功能和修复 Bug 等开发任务,如今已经正式进入公开 Beta 测试阶段。 此外,Google 还推出了全新的订阅服务 Google AI Ultra。 该计划为专业用户提供 Google 最强大模型和高级功能的无限制访问,适合电影制作人、开发者、创意工作者等专业人士,月费为 249.99 美元(折合人民币 1804 元)。 目前,该计划已经在美国上线,并将很快扩展至其他国家。 实际上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一个能嵌入日常生活、真正打进主流用户心智的「杀手级产品」。 Google 当然明白这个道理,也正全力以赴寻找答案。 因此,我们看到,在这次的发布会上,Google 几乎什么都做了,也什么都提了:从文本、图像、视频、音乐,到搜索、Agent、创作工具,一应俱全。 牌已经亮完,技术也到位,现在,Google 只差一记真正击中用户痛点的落子。
炸裂!谷歌I/O大会王者归来:Gemini“世界模型”初现,搜索“换脑”,一句话制作原声电影
刚刚!谷歌举行了I/O 2025 大会,最大的感受是谷歌重回AI领头羊位置,谷歌正在以Gemini为核心打造真正的AI操作系统,”世界模型“初现 本届谷歌I/O大会一口气更新和发布了巨量的技术 首先需要明确的是,备受期待的Gemini 2.5 Ultra模型并未如期而至。我们得到的是一个标价250美元的“Ultra会员套餐”(Ultra Tier),而非我们翘首以盼的Ultra模型本身。但是,随着Gemini 2.5 Pro “Deep Think”的推出,Pro模型迎来了一次重大革新,其实际能力已堪比Ultra级别 那么,具体有哪些新内容呢?(清单确实很长): 模型与代理工具 Gemini 2.5 Pro “Deep Think”:具备并行思考能力,专为复杂数学和编码任务设计,并提供可配置的“思考预算”以增强控制力,把Gemini 2.5 Pro 推向极致,性能表现如下: Gemini 2.5 Flash 5月20版:速度更快、更经济,并新增了“思考摘要”功能,以提高透明度,性能已经无限接近Gemini 2.5 pro Gemini Diffusion:谷歌首次将扩散技术应用于文本生成,推出了实验性模型Gemini Diffusion,速度比肩此前顶级模型快5倍 Jules:对标OpenAI的Codex,异步编码代理,可在后台处理错误修复和功能原型开发,需要注册等待才能使用 多模态能力大爆发 Google Meet:新增实时翻译功能 Veo 3:视频生成能力大幅提升,生成具有4K逼真效果的视频,并支持原生音频、对话和噪声合成 Imagen 4:对标并超越OpenAI gpt-4o的图像生成能力,但是速度快了3倍,2K图像模型,在排版和文本图像生成方面更快、更准确 Flow:全新的电影制作工具,与好莱坞导演共创“Flow”结合了Veo 3和Gemini的能力,可根据文本提示构建完整的电影场景 Flow让创作者能更直观地“导演”AI:上传自己的角色和场景素材,或用Imagen即时生成;通过精确的镜头指令,描述想要的画面,Flow会自动生成剪辑片段并保持角色和场景的一致性。你可以无限迭代、调整镜头、延长或修剪片段,就像在传统剪辑软件中一样。Flow的目标是让电影制作进入一个全新的“流动”状态,让创意自然生长,将电影创作从“按部就班”变成“灵感迸发” 谷歌搜索彻底重塑:全新的“AI模式”(AI Mode) 更复杂的查询:用户现在可以提出比传统搜索长两到三倍的复杂问题,比如“我有一张浅灰色的沙发,想找一块能提亮房间的毛毯,家里有4个活跃的孩子,经常有朋友来玩。”AI模式会动态生成图文并茂的响应,包括链接、商家信息和评分 深度研究(Deep Search):对于需要更详尽答案的问题,AI模式可以进行“深度搜索”。它能同时发出数十甚至数百个查询,整合来自全网、知识图谱、购物图谱和地图社区的数据,在几分钟内生成一份专家级的、带完整引用的报告,帮你省去大量研究时间 复杂分析与可视化:AI模式能帮你分析复杂数据并生成可视化图表。比如,你想了解使用“鱼雷球棒”的著名棒球运动员的本赛季和上赛季的击球率和上垒率,它能立刻生成表格,并根据后续问题生成图表,就像拥有一个专属的体育分析师! 搜索实时互动(Search Live):Project Astra的实时能力也融入了搜索!通过手机摄像头,你可以和搜索进行“视频通话”,让它看到你所看到的,实时给出帮助。无论是DIY家居维修、难题作业,还是学习新技能,它都能成为你的“远程专家”。 代理购物(Agentic Checkout):AI模式还能帮你完成购物任务!它会浏览多个网站,分析数百个选项,帮你完成筛选、比价甚至直接链接到结账页面,帮你秒杀门票。未来,它还将支持餐厅预订和本地服务预约 谷歌加入AI眼镜开发:AI不仅要改变数字世界,更要深刻影响物理世界 沉浸式头显:与三星合作的Project Moohan是首款Android XR设备。它能为你提供“无限屏幕”体验,在XR版谷歌地图中,你只需告诉Gemini想去哪里,就能“瞬移”到世界任何角落;你还能在MLB应用中,像坐在体育场前排一样观看比赛,同时与Gemini讨论球员数据,将于今年晚些时候上市 轻量级眼镜:谷歌展示了最新的Android XR眼镜原型,轻巧便携,可全天佩戴,集成了摄像头、麦克风和扬声器,可选的镜片内显示屏还能在你需要时私密地显示信息。这意味着你的AI助手将真正“看”和“听”到你所看到和听到的,提供实时的、上下文感知的帮助,就像戴上了“超能力眼镜”!现场演示中,它能识别咖啡杯上的咖啡店名字,帮你导航,预约咖啡,甚至进行实时跨语言翻译。谷歌宣布,Warby Parker和Gentle Monster将成为首批与Android XR合作的眼镜品牌,未来你将能戴上符合自己风格的时尚AI眼镜,开发者也将于今年晚些时候开始为眼镜平台开发 其他 Gemma 3n:一款超轻量级的多模态模型(支持文本、图像、音频、视频),专为智能手机和边缘设备打造 Lyria RealTime:交互式音乐大语言模型,支持现场表演,并可通过API进行微调 MedGemma & SignGemma:两款开放的专业模型,分别用于医学图像分析和手语翻译 Agentic Colab:一款能够自我修复代码并自动执行任务的笔记本环境 Gemini Code Assist 2.5:免费的编程助手和代码审查代理,现已支持200万token的上下文 Firebase Studio:AI工作空间,可将Figma设计稿转换为全栈应用程序,并自动设置后端 Stitch:可根据描述或图像生成UI设计和前端代码 Google AI Studio升级:在编辑器中直接集成了Gemini 2.5 Pro、Imagen 4和Veo 3,并提供了GenAI SDK 新的Gemini API功能:包括原生音频输出、实时API、异步函数调用、计算机使用API、URL上下文及MCP支持 Project Beam:Starline项目的继任者,与惠普合作开发3D视频通话硬件 Project Astra升级:一款能看、能听、能说的主动式多模态助手 以上就是谷歌本次大会发布内容简要总结 写在最后 首先,这清晰地表明了谷歌正如何倾尽全力发展其AI生态系统。如果说过去苹果公司以其卓越协调的设备生态系统著称,那么现在谷歌正通过AI将这一理念推向新的高度。具体而言:Gemini如今能在系统中主动工作 此外,得益于其跨所有产品协调的原生语言模块,Gemini已更深层次地融入几乎所有谷歌产品中。无论是谷歌手表、XR眼镜还是Pixel手机,Gemini都能完美适配,并根据设备特性提供相应的扩展功能(例如XR设备中的地图叠加功能,效果惊艳!) 因此,如果说苹果过去通过iCloud实现了所有设备的互联互通,那么现在的谷歌则更进一步 发布会中,谷歌DeepMind CEO 诺奖得住Demis Hassabis 提到正在努力将Gemini扩展成为“世界模型”。他将其定义为“一个能够通过模拟世界的各个方面来制定计划和想象新体验的模型,就像大脑一样,谷歌内部肯定已经在搞了,这是实现AGI的终极大招 谷歌,王者归来
Google 眼镜回来了,AI 时代的涅槃重生
涅槃 重生 2014 年,在 GDG Devfest 中国场的现场,我第一次戴上 Google Glass。 它被认为是世界上首款智能眼镜,当时还只是一个纯粹面向开发者的「原型产品」。它可以录像,支持语音交互,支持将一些应用通过 Mirror API「镜像」到那个不足一寸、视野并不宽的液晶覆硅 LED 屏幕上。 遗憾的是 Google Glass 极其短命,从问世到停产只有短短 2 年时间。但通过它,我认为我看到了未来。 过去十多年里,Snapchat、Oculus/Meta 和 Rayban 们,在智能眼镜/头部可穿戴产品的市场兴风作浪。然而这条赛道,似乎再也没有 Google 什么事了。 很多后续产品我也玩过,甚至成为重度用户。但时不时,我总会想起 Google Glass。 而在今天的 Google I/O 上,这家公司重新点燃了智能眼镜和头部可穿戴产品的火苗。 Google 正式发布了 Android XR 产品和技术线的最新一代产品:与 Xreal 共同推出的首款轻量级智能眼镜产品 Project Aura。 在看完 I/O 2025 主演讲后,我打开 Google Photos,回看当年佩戴这些产品的我,从青涩走向成熟。 显示和交互技术的进步,让 Android XR 终于捡起了 Google Glass 十年前丢在地上的接力棒。而 Gemini 对所有 Google 产品的彻底革新,更是让 Android XR 获得了 AI 的「魔法加成」。 走过来时的路,Google 眼镜又回来了。但这次不是 Yesterday once more,而是一个新时代的开始。 Gemini 时代的首个 Android 平台 实话来说,作为一个智能手机操作系统的 Android,已经不足以引起任何兴趣了。连 Google 自己在 I/O 2025 主演讲都没有专门留出时间。 但 Android XR 的地位完全不一样。按照 Google 的措辞,它是第一个在 Gemini 时代构建的 Android 平台。 显然,手机已然成为过去时,而头戴式智能设备,将会创造全新的交互体验,成为 Android 新的增长引擎。 这次 Google 不自己生产眼镜了,而是选择和优秀的技术合作伙伴一起发力。 Project Aura 是首款 Android XR 平台的轻量级智能眼镜,由 Google 和中国混合现实技术公司 Xreal 共同推出。 参数细节目前少得可怜,通过渲染图以及 I/O 2025 现场 demo 能够看到,这款轻量级智能眼镜: 左右两个摄像头,和中置的其他视觉传感器模组,用于拍摄照片、视频,以及更重要的——支持 Gemini 的视觉/agent 智能体能力(Google Project Astra) 有双声道立体声扬声器,以及多个麦克风组成的阵列,用于通话、录音,以及支持 Gemini 的语音交互能力。 内嵌于镜片的单屏幕显示(波导或其他实现方式未知) 这是一个仍处在测试阶段的产品,但 Google 在现场还是很勇敢地做了一些已支持功能的 demo——主要体现作为核心卖点的 Gemini 的智能体能力。 比如实时翻译/同传:现场的两位演讲者使用印地语和波斯语互相翻译,虽然其中一位的信号看起来不太好,但翻译效果还是惊人的。 翻译采用纯文本,但从早前一点的 Gemini 部分演讲中我们可以断定,Gemini 肯定是有能力直接输出音频的。Gemini 本身的自然语言交互支持 150 多个国家的 45 种语言,但截至 25 年5 月中旬的语音互译能力仅支持英-西语互译,不过未来几周内将会增加数十种语言。 这为 Android XR 眼镜赋予了强大的使用场景,无论是跨语种工作,还是出国旅游,这种翻译/同传能力使得更自然的人际互动成为可能。 打破语言的障碍,为你提供真实世界的字幕,甚至配音——这是 Android XR 和 Gemini 想做的。 现场还演示了 Android XR 眼镜的其他功效。比如,用户(特别是视障用户)可以直接通过按键或语音唤醒的方式,询问 Gemini 自己看到的东西,做搜索和解答。 这其实是 Google 将近 10 年前就在做的 Google Lens 的视觉搜索能力。但经过 Gemini 的 AI 加成,能力会更加强大。 现场女演讲者在后台和一位同事打过招呼,然后过了几分钟再唤起 Gemini,让它帮自己和刚才见过的人约个咖啡; 她还问 Gemini 记不记得刚才自己手里拿的咖啡是哪家店的,把约会定在那一家咖啡店。 Gemini 很快就完成了之前的记录调取,并设置了日历项。 ——这显示出 Android XR 智能眼镜,不仅能够准确记住用户刚才见过谁,还能够理解视觉-语音等多模态的上下文,从而准确理解用户的需求。 这些能力的背后,是 Google 在本次 I/O 2025 上升级推出的 Gemini 2.5 Pro 等新一代多模态基座大模型,以及 Project Astra 智能体助理技术的功劳。 Gemini 2.5 Pro 和 Project Astra 驱动了 Gemini Live 的实时视觉 AI 智能体助理功能,在今天也正式面向 Android 和 iOS 的 Gemini app 上线并且免费提供给所有用户。 而在 Android 手机以及 Android XR 眼镜平台上,Gemini Live 更是升格成为一个具备完全设备操控能力的全量智能体,能够基于当前看到的视觉环境上下文,以及用户的自然语音控制,去完成多步骤、复杂的任务。 Google 智能眼镜,浴火重生 当年的 Google Glass 挑战了人们的隐私认知和社交习惯,并不被市场看好,所以也可以说它死得其所。 而在人人都恨不得脑门上长摄像头的今天,智能眼镜已经不再是什么争议焦点。或许当人人都有了智能眼镜,隐私已让位与新的功能与革命性的体验。 当然,Google 仍然记得所有关于隐私的争议,因此也表示会在产品开发过程中不断收集用户和测试者的反馈,从而确保这款产品更少侵犯隐私,更多提供帮助。 Google Glass 可能死了,但 Google 一直没有停止研究智能眼镜这件事。今天,十多年来的所有努力,终于通过 Android XR 涅槃重生。 一副好的眼镜,不应该只是技术产品。Meta 和 Rayban 200 万副销售量的成功经验,给 Google 好好上了一课。 在 I/O 大会上,Google 也宣布将和 Gentle Monster、Warby Parker 两大知名眼镜品牌及零售商合作,推出既时尚也科技的 Android XR 眼镜。 作为依视路集团旗下最新的时尚品牌,Gentle Monster 在亚洲和欧美青少年群体里十分受欢迎,产品卖出远超其用料、做工和设计水准的价格。而进入 Android XR 项目之后,恐怕 Gentle Monster 的溢价只会变得更加夸张。 Warby Parker 则是在美国最近几年里流行起来的 O2O 概念眼镜品牌,用户可以用它的 app 或网站很方便地一次性订购多副镜架,试用后再退回不需要、不好看的产品即可。 毫无疑问,智能眼镜如果想要拓宽销路,演好「时尚单品」的角色是最起码的。考虑到 Rayban 和 Oakley 两大品牌都已经被 Meta 收编,Gentle Monster 和 Warby Parker 可能是剩下的最好的选择。 最后,唯一遗憾的是,考虑到 Gemini 的海外大模型身份——即便 Android XR 能够被中国设备品牌采用,中国用户可能也很难感受到硬件和模型的完美结合。 好在这次 I/O 大会上,Google 通过 Android XR 已经给厂商们打好了样。而中国大模型的精进速度,以及产品化的节奏比海外更快。 或许我们也可以期待,这一波智能眼镜的彻底爆发了。 文 | 杜晨
谷歌AI核爆:升级全系模型,Gemini 2.5双榜登顶!所有产品用AI重做,OpenAI如何接招?
作者|冬梅 通常情况下,在 I/O 大会前的几周里,外界不会听到太多 I/O 大会的消息,因为谷歌一般会把最好的模型留到 I/O 大会上发布。但在 Gemini 时代,谷歌很可能会在三月的某个周二突然发布出他们最强的人工智能模型,或者提前一周宣布像 AlphaEvolve 这样的酷炫突破。 因为大模型时代,尽快将最好的模型和产品送到用户手中,是企业技术能力的展现。 北京时间 5 月 21 日凌晨一点,随着多个产品在 2025 谷歌 I/O 大会上发布,现场响起了一波又一波热烈的掌声。 在本场发布会上,作为主题演讲嘉宾,谷歌首席执行官桑达尔·皮查伊在一个多小时的时间里紧锣密鼓地介绍着谷歌在 AI、移动操作系统、搜索等领域的众多更新,这一场发布会上初步统计,Gemini 被提及 95 次,人工智能被提及 92 次。 以下是本场发布会的几个重要更新,首先是模型层面。 为 Gemini 2.5 Pro 引入 Deep Think 推理模型和更好的 2.5 Flash 此次发布会的高潮部分,是谷歌宣布为 Gemini 2.5 Pro 引入 Deep Think 推理模型和更好的 2.5 Flash。 谷歌在大会上宣布,已开始为 Gemini 2.5 Pro 测试名为“深度思考”(Deep Think)的推理模型。DeepMind 首席执行官 Demis Hassabis 表示,该模型采用“最前沿的研究成果”,使其具备在回应查询前权衡多种假设的能力。 2.5 Pro Deep Think 在目前最难的数学基准测试之一——2025 USAMO 上取得了令人印象深刻的成绩。它在 LiveCodeBench(一项针对竞赛级编程的难度较高的基准测试)上也取得了领先,并在测试多模态推理的 MMMU 上获得了 84.0% 的分数。” 不过谷歌表示,在广泛发布前仍需进行更深入的安全评估并征求专家意见,因此将率先通过 Gemini API 向可信测试者开放。 谷歌同时发布了性能更强的 Gemini 2.5 Flash 模型,该版本在速度与效率方面实现显著优化:推理效率提升、令牌消耗减少,在多模态处理、代码生成及长文本理解等基准测试中均超越前代。 2.5 Flash 是谷歌最高效的主力模型,专为速度和低成本而设计——现在它在多个维度上都得到了提升。它在推理、多模态、代码和长上下文等关键基准上都得到了改进,同时效率进一步提升,在我们的评估中,使用的 token 减少了 20-30%。 正式版将于 6 月初推出,目前开发者可通过 Google AI Studio 预览,企业用户可通过 Vertex AI 体验,普通用户则可在 Gemini 应用中试用。 虽然 I/O 大会主要展示的是 2.5 Flash 的效能突破,但谷歌宣布将把该模型的“思考预算”(Thinking Budgets)概念引入更高阶的 2.5 Pro 版本。这项功能允许用户平衡 token 消耗与输出精度 / 速度的关系。 此外,谷歌正将"航海家计划"(Project Mariner)整合至 Gemini API 和 Vertex AI。该项目基于 Gemini 开发,能通过浏览器导航完成用户指定任务,预计今夏向开发者扩大开放。同时,谷歌还通过 Gemini API 为 2.5 Pro/Flash 模型推出文本转语音功能预览版,支持 24 种语言的两种发音人声。 值得一提的是,Gemini 2.5 系列引入了不少新功能。 首先是原生音频输出和 Live API 的改进。Live API 推出了音频视频输入和原生音频输出对话的预览版,因此您可以直接构建对话体验,使用更自然、更具表现力的 Gemini。 它还允许用户控制其语气、口音和说话风格。例如,用户可以让模型在讲故事时使用戏剧性的声音。它还支持使用工具,以便能够代表用户进行搜索。 现在,可以供用户尝试的一系列早期功能包括: 情感对话,模型可以检测用户声音中的情感并做出适当的反应。 主动音频,其中模型将忽略背景对话并知道何时做出回应。 在 Live API 中思考,其中模型利用 Gemini 的思考能力来支持更复杂的任务。 谷歌还将为 2.5 Pro 和 2.5 Flash 版本发布全新的文本转语音功能预览版。这些功能首次支持多扬声器,能够通过原生音频输出实现双声道文本转语音。 与 Native Audio 对话一样,文本转语音功能富有表现力,能够捕捉到非常细微的差别,例如低语。它支持超过 24 种语言,并可在多种语言之间无缝切换。 其次是电脑操作能力提升。谷歌正将 Project Mariner 的电脑操作能力引入 Gemini API 和 Vertex AI。支持多任务处理,最多可同时执行 10 个任务,并且新增 “Learn and Repeat” 功能,让 AI 学会自动完成重复性任务。 第三是显著增强了对安全威胁的防护,例如间接提示注入。这是指恶意指令被嵌入到 AI 模型检索的数据中。谷歌 全新的安全方法 显著提高了 Gemini 在工具使用过程中对间接提示注入攻击的防护率,使 Gemini 2.5 成为我们迄今为止最安全的模型系列。 第四是增加三大实用功能,提升开发者体验: 思维摘要功能升级。Gemini API 和 Vertex AI 现为 2.5 Pro/Flash 模型新增"思维摘要"功能,可将模型原始推理过程结构化输出为带标题、关键细节及操作说明(如工具调用时机)的清晰格式。该设计旨在帮助开发者更直观地理解模型决策逻辑,提升交互可解释性与调试效率。 思考预算机制扩展。继 2.5 Flash 之后,思考预算功能现已覆盖 2.5 Pro 模型,允许开发者通过调节令牌分配来平衡响应质量与延迟成本。用户可自由控制模型思考深度,甚至完全关闭该功能。支持全量思考预算的 Gemini 2.5 Pro 正式版将于未来数周内发布。 Gemini SDK 兼容 MCP 工具。Gemini API 新增对 MCP 的原生 SDK 支持,简化与开源工具集成。谷歌正探索部署 MCP 服务器等托管方案,加速代理应用开发。团队将持续优化模型性能与开发体验,同时加强基础研究以拓展 Gemini 能力边界,更多更新即将推出。 关于谷歌 Gemini 的下一步,谷歌 DeepMind CEO 哈萨比斯表示,他们正努力将其最优秀 Gemini 模型扩展为一个 “世界模型”,使其能像人类大脑一样通过理解和模拟世界来制定计划、想象新体验。 AI  Mode 是谷歌搜索的未来 作为谷歌最核心的业务之一,谷歌搜索的每次迭代都会引发行业关注。 谷歌表示, Gemini 模型正在帮助谷歌搜索变得更加智能、代理化和个性化。 自去年推出以来,AI 概览已覆盖超过 15 亿用户,并覆盖 200 个国家和地区。随着人们使用 AI 概览,谷歌发现他们对搜索结果更加满意,搜索频率也更高。在美国和印度等谷歌最大的市场,AI 概览推动了查询类型增长超过 10%,并且这种增长速度会随着时间的推移而持续增长。 皮查伊称,这是过去十年来搜索领域最成功的产品之一。 如今,对于想要体验端到端 AI 搜索的用户,谷歌推出了全新的 AI 模式。它彻底重塑了搜索体验。凭借更先进的推理能力,用户可以在 AI 模式下提出更长、更复杂的查询。 事实上,早期测试人员提出的查询长度是传统搜索长度的两到三倍,并且用户还可以通过后续问题进行更深入的探索。所有这些功能都可以在搜索的新标签页中直接使用。 皮查伊称:“我一直在频繁使用 Google 搜索,它彻底改变了我使用 Google 搜索的方式。我很高兴地告诉大家,AI 模式将于今天在美国面向所有用户推出。借助我们最新的 Gemini 模型,我们的 AI 响应不仅达到了您对 Google 搜索所期望的质量和准确性,而且是业内最快的。从本周开始,Gemini 2.5 也将在美国 Google 搜索中推出。” 亮相视频模型 Veo 3 在多模态方面,谷歌表示即将推出最新的先进视频模型 Veo 3,它现已具备原生音频生成功能。谷歌还将推出 Imagen 4,这是谷歌最新、功能最强大的图像生成模型。这两款模型均可在 Gemini 应用程序中使用,开启一个全新的创意世界。 谷歌通过一款名为 Flow 的新工具将这些可能性带给了电影制作人。用户可以创建电影剪辑,并将短片扩展为更长的场景。 提示词:一只睿智的老猫头鹰在高空翱翔,透过森林上方月光下的云层窥视。这只睿智的老猫头鹰小心翼翼地绕着空地盘旋,环顾着森林的地面。片刻之后,它俯冲到月光下的小路上,停在一只獾旁边。音频: 翅膀拍打声、鸟鸣声、响亮而悦耳的风沙声,以及断断续续的嗡嗡声、树枝在脚下折断的声音和呱呱的叫声。这是一段轻快的管弦乐,木管乐器贯穿始终,节奏欢快乐观,充满天真无邪的好奇心。 一只睿智的老猫头鹰和一只紧张的獾坐在月光下的林间小路上。“它们今天留下了一个一个'球’。它弹得比我跳得还高。”獾结结巴巴地说道,努力想理解这句话的意思“这是什么魔法?"猫头鹰若有所思地鸣叫着。音频: 猫头鹰的鸣叫声,獾紧张的鸣叫声,树叶的沙沙声,蟋蟀的鸣叫声。 一只睿智的老猫头鹰飞出了画框,一只紧张的小獾朝另一个方向跑了出去。背景中,一只松鼠匆匆而过,发出刮擦干枯秋叶的沙沙声。音频: 鸟鸣声、响亮的落沙沙声,以及断断续续的嗡嗡声、树枝在脚下折断的声音,还有松鼠在干枯的落叶间穿梭的声音。远处传来猫头鹰的鸣叫声、獾紧张的鸣叫声、树叶的沙沙声、蟋蟀的鸣叫声,这些声音充满了天真好奇的气息。 编码助手 Jules 开始公测 在发布会上,谷歌宣布 Jules 正式进入公测阶段,全球开发者可直接进行体验。 Jules 是一款异步代理式编码助手,可直接与开发者现有的代码库集成。它会将开发者的代码库克隆到安全的 Google Cloud 虚拟机 (VM) 中,了解项目的完整上下文,并执行以下任务:编写测试、构建新功能、提供音频更新日志、bug 修复、改变依赖版本。 Jules 异步运行,让开发者在它在后台运行时能专注于其他任务。完成后,它会展示其计划、推理过程以及所做更改的差异。Jules 默认为私有,它不会使用用户的私有代码进行训练,并且用户的数据在执行环境中保持隔离。 Jules 使用 Gemini 2.5 Pro,使其能够使用当今最先进的一些编码推理技术。结合其云虚拟机系统,它可以快速、精确地处理复杂的多文件更改和并发任务。 具体而言,Jules 能干什么? 适用于真实代码库:Jules 无需沙盒。它能够利用现有项目的完整上下文,智能地推断变更。 并行执行:任务在云虚拟机内部运行,实现并发执行。它可以同时处理多个请求。 可见的工作流程: Jules 在进行更改之前向您展示其计划和理由。 GitHub 集成:Jules 可直接在用户的 GitHub 工作流程中工作。无需上下文切换,也无需额外设置。 用户可控性:在执行之前、执行期间和执行之后修改所呈现的计划,以保持对代码的控制。 音频摘要: Jules 提供最近提交的音频变更日志,将您的项目历史记录转变为您可以收听的上下文变更日志。 Astra 项目,谷歌通用 AI 助手的雏形 去年的谷歌 I/O 开发者大会上,最有趣的演示之一是 Project Astra,它是多模态人工智能的早期版本,可以实时识别周围环境并以对话方式回答相关问题。虽然该演示让我们得以一窥谷歌打造更强大人工智能助手的计划,但该公司谨慎地指出,我们看到的只是“研究预览”。 然而,一年后,谷歌却规划了 Astra 项目的愿景,希望未来能为 Gemini 的某个版本提供动力,使其成为一个“通用 AI 助手”。为了实现这一目标,Astra 项目进行了一些重要的升级。谷歌一直在升级 Astra 的内存——我们去年看到的版本每次只能“记忆” 30 秒——并增加了计算机控制功能,使 Astra 现在可以执行更复杂的任务。 这款多模态、全视角的机器人并非真正的消费级产品,除了一小部分测试人员之外,短期内不会向任何人开放。Astra 代表着 Google 对未来人工智能如何为人类服务的最宏大、最狂野、最雄心勃勃的梦想。Google DeepMind 研究总监 Greg Wayne 表示,他认为 Astra 是“通用人工智能助手的概念车”。 最终,Astra 中可用的功能会移植到 Gemini 和其他应用中。这其中已经包含了团队在语音输出、内存以及一些基本的计算机使用功能方面的工作。随着这些功能逐渐成为主流,Astra 团队找到了新的工作方向。 Project Aura 智能眼镜又回来了 再来看看硬件方面。谷歌智能眼镜时代似乎又回来了。今天,谷歌和 Xreal 在大会上宣布建立战略合作伙伴关系,共同开发一款名为 Project Aura 的全新 Android XR 设备。 这是自去年 12 月 Android XR 平台发布以来,官方正式推出的第二款设备。第一款是 三星的 Project Moohan,但这是一款更类似于 Apple Vision Pro 的 XR 头显。而 Project Aura 则与 Xreal 的其他产品保持着密切联系。技术上准确的术语应该是“光学透视 XR”设备。更通俗地说,它是一副沉浸式智能眼镜。 Xreal 的眼镜,比如 Xreal One,就像在一副普通的太阳镜里嵌入了两台迷你电视,看起来略显笨重。Xreal 之前的眼镜可以连接手机或笔记本电脑,查看屏幕上的内容,无论是正在播放的节目,还是想在飞机上编辑的机密文件。它的优点在于,用户可以调整不透明度来查看(或遮挡)周围的世界。Project Aura 也秉持着同样的理念。 但谷歌并没有在发布会上透露出更多关于这款硬件的信息。Xreal 发言人 Ralph Jodice 表示,将在下个月的增强现实世界博览会上放出更多信息。一些已知的信息显示,它将内置 Gemini,并拥有更大的视野。在产品渲染图中,我们可以看到铰链和鼻梁架上的摄像头,以及镜腿上的麦克风和按钮。 这暗示着与 Xreal 现有设备相比,硬件将迎来升级。Project Aura 将搭载针对 XR 优化的高通芯片组。与 Project Moohan 一样,Project Aura 也希望开发者现在就开始构建应用程序和用例,以便在实际消费产品发布之前完成。说到这一点,谷歌和 Xreal 在一份新闻稿中表示,为头显开发的 Android XR 应用程序可以轻松移植到像 Project Aura 这样的其他设备。 有趣的是,谷歌对下一个智能眼镜时代的策略与其最初推出 Wear OS 时类似——谷歌提供平台,第三方负责硬件。虽然细节很少,但这将是在 Android XR 平台上推出的第二款官方设备。
抢跑GPT-5!Google 发布最强 AI 全家桶,史上最贵 AI 会员定价 1800 元/月
去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙击。 今年攻守之势异也。 前几天 OpenAI 透露 GPT-5 将 All in One,集成各种产品。刚刚,Google 就把这个思路贯彻到 I/O 大会,直接掏出了自家有史以来最强的 AI 全家桶。 从发布 Gemini 2.5 Pro 与 Flash 两款模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向开发者与创作者的 AI 套件等,Google 几乎把从模型到产品的路径都压缩到一场发布会里。 更准确地说,当下最火的 AI 应用场景,都被 Google「预埋」进了产品接口里,让人意识到它仍是全球最具工程实力和生态整合能力的 AI 巨头之一。 也难怪许多网友调侃,将近两个小时的发布会过后,又将有一大批初创公司死于 Google 之手。 不过,也不难看出,发布会上有一些功能仍停留在「预告片」和小范围测试阶段,距离真正的落地或许还有不小的距离。 帮我「买票 + 找座 + 填表」一口气搞定,Google 新 AI 搜索卷疯了 AI 正在重写搜索这件事的底层逻辑。 在去年的 I/O 大会上,Google 推出了 AI 概览(AI Overviews)功能,至今已拥有超过 15 亿的月活跃用户。 生成式 AI 逐渐改变了人们的搜索方式,但随之而来的却是,我们不再满足于在搜索框里输入简单的问题,而是抛出更复杂、更长、更具多模态的提问。 今天,Google 再次加码搜索与 AI 的融合,推出一种端到端的 AI 搜索体验——AI Mode。 正如 Google CEO 桑达尔·皮查伊介绍的那样,这是 Google 有史以来最强大的 AI 搜索形态,不仅具备更先进的推理能力和多模态理解能力,还支持通过上下文追问和网页链接进行深度探索。 例如,当用户面对一个需要复杂解读的搜索问题,AI Mode 可启动「深度搜索」机制,不同信息之间进行推理,并在几分钟内生成一份专家级的引用报告,为你节省数小时的研究时间。 与此同时,Google 也将 Project Astra 的多模态能力接入搜索,进一步提升搜索的实时交互性。通过 Search Live 功能,用户只需打开摄像头,即可通过画面实时提问并获得反馈。 今年是 Agent 元年,Google 也很贴心地推出了 Project Mariner Agent 功能,能帮助用户更高效地完成任务。 例如,只需一句「帮我找两个这个周六比赛的实惠票,位于下层座位」,AI Mode 便能自动跨多个票务平台检索选项,实时比较价格和库存,并完成表单填写等繁琐操作,大幅提升效率。 借助 Gemini 模型和 Google 购物图谱的强大支持,Google AI Mode 能够帮助你缩小商品范围并提供灵感。如果你想看看衣服穿在自己身上的效果,只需要上传一张自己的照片,就能实现虚拟试穿衣服。 此外,AI Mode 也具备强大的个性化能力,能根据用户上下文偏好给出定制化建议,还可生成图表和可视化结果,尤其在体育和金融类搜索中表现出色。 该功能今日起已在美国全面上线,未来将推广至更多地区。 会写代码、还省 Tokens,Gemini 2.5 拿到「学霸」人设 在模型能力方面,Google 此次发布了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上独占鳌头。 现在,Gemini 2.5 Pro 引入了名为「Deep Think」的推理增强模式。这项功能可在生成答案前考虑多个假设,从而更深入地理解问题背景。 2.5 Pro Deep Think 在 2025 年美国数学奥林匹克(USAMO)以及 LiveCodeBench(编程基准)排名领先,并在 MMMU(测试多模态推理)中获得了 84.0% 的分数。 不过,Google 表示,将会花更多时间进行前沿安全评估,并征求安全专家的进一步意见。作为第一步,Deep Think 功能目前将通过 Gemini API 向小范围测试者开放。 同样得到升级的还有注重效率的 Gemini 2.5 Flash。 新版 2.5 Flash 在推理、多模态、代码和长上下文等关键基准上都有了改进,同时在效率上更高,评估中使用的 tokens 减少了 20% 至 30%。 2.5 Flash 现已在 Gemini 应用程序中向所有人开放,并将在 6 月初通过 Google AI Studio 面向开发者和 Vertex AI 向企业全面发布。 开发者体验上,2.5 Pro 和 2.5 Flash 将在 Gemini API 和 Vertex AI 中引入了「思维摘要」功能,可将模型的推理路径以标题、关键信息和调用工具等方式进行结构化呈现。 开发者也将从中受益,Google 宣布在 Gemini API 和 SDK 中正式支持 MCP 工具,让开发者可以轻松接入更多开源工具和插件生态。 音乐、电影、图像全套上线,Google 把 AI 玩出了花 本次发布会,Google 带来了新一代图像和视频模型——Veo 3 和 Imagen 4。 与传统视频生成不同,Veo 3 是一款支持音频的视频生成模型,能在城市街景中模拟交通、鸟鸣,甚至角色对话,显著提升沉浸感。 该模型不仅在文本和图像提示的基础上生成视频,还能精确实现物理环境与口型同步,极大提升了视频创作的真实感。 目前,Veo 3 已在 Gemini 应用和 Flow 平台上向 Ultra 订阅用户开放,并已在 Vertex AI 平台上为企业用户提供支持。 上文提到的 Flow 正是 Google 为创作者打造的一款 AI 电影制作工具。 用户只需用自然语言描述电影场景,即可管理演员、地点、道具和风格,自动生成叙事片段。Flow 已在美国向 Gemini Pro 和 Ultra 用户开放,全球范围的推广也在推进中。 在图像生成方面,新版 Imagen 4 提升了精度与速度,细节表现上可逼真展现织物、水滴与动物毛发,同时也能生成偏抽象类型的风格。 它支持 2K 分辨率和多种长宽比生成,在排版和拼写方面也有显著优化,适合制作贺卡、海报甚至漫画。 Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上线,据悉,未来还将推出速度快十倍的版本。 在音乐创作方面,Google 扩大了 Lyria 2 驱动的 Music AI Sandbox 的访问权限,并上线了互动式音乐生成模型 Lyria RealTime。该模型现已通过 API 和 AI Studio 向开发者开放。 考虑到由 Veo 3、Imagen 4 和 Lyria 2 生成的内容将继续带有 SynthID 水印,Google 发布了全新的 SynthID Detector。 用户只需上传文件,即可识别其中是否包含 SynthID 水印,用于防伪和追踪 AI 内容来源。 Google 要造「世界模型」,连任务都能帮你做了? Google 希望将 Gemini 打造成一个「世界模型」,既能计划、理解,也能模拟现实世界的各个方面。 Google DeepMind CEO Demis Hassabis 表示,这一方向正是 Project Astra 的核心理念之一。 过去一年里,Google 已将视频理解、屏幕共享、记忆功能等逐步集成进 Gemini Live。如今,Gemini 新的语音输出加入了原生音频,更加自然;记忆与 computer use 能力也同步增强。 此外,Google 还在探索如何利用 Agent 能力帮助人们处理多任务。 Project Mariner 就是其中之一,能够同时完成最多十项任务,比如信息查询、预订、购物与调研。已面向美国 Ultra 用户开放,并即将集成至 Gemini API 与其他核心产品中。 AI 新功能扎堆发布,会诞生真正的杀手锏吗 NotebookLM 官方昨日宣布,上线 24 小时就已经成为 App Store 中排名第 2 的生产力应用和第 9 的整体应用。 作为 Google 在 AI 笔记工具上的一次重要探索,NotebookLM 提供音频概览和思维导图等功能。 其中,音频概览目前已支持超过 80 种语言,而本周,Google 也宣布将为这一功能引入更高的可定制性,用户可根据需要选择摘要的长度,无论是快速浏览还是深入阅读都不在话下。 这项功能首先将在英语中推出,随后将扩展到更多语言。 与此同时,Google 也在回应用户对视觉呈现的诉求,即将在 NotebookLM 中加入视频概览功能,用户只需一键即可将笔记内容转化为教育类视频,用更直观的方式传递信息。 在 AI 编程领域,Google还带来了 Jules 的最新进展。 这个最初出现在 Google Labs 的自主编码助手,能够理解代码并自主完成诸如编写测试、构建功能和修复 Bug 等开发任务,如今已经正式进入公开 Beta 测试阶段。 此外,Google 还推出了全新的订阅服务 Google AI Ultra。 该计划为专业用户提供 Google 最强大模型和高级功能的无限制访问,适合电影制作人、开发者、创意工作者等专业人士,月费为 249.99 美元。 目前,该计划已经在美国上线,并将很快扩展至其他国家。 实际上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一个能嵌入日常生活、真正打进主流用户心智的「杀手级产品」。 Google 当然明白这个道理,也正全力以赴寻找答案。 因此,我们看到,在这次的发布会上,Google 几乎什么都做了,也什么都提了:从文本、图像、视频、音乐,到搜索、Agent、创作工具,一应俱全。 牌已经亮完,技术也到位,现在,Google 只差一记真正击中用户痛点的落子。
胡塞武装称对以海法港实施海上封锁 释放怎样的信号?
  也门胡塞武装19日发表声明称,决定对以色列海法港实施海上封锁。   胡塞武装对以色列海法港实施海上封锁,释放怎样的信号?继埃拉特港口之后,胡塞武装再次封锁以色列重要港口,胡塞武装的实力究竟如何?   胡塞武装与加沙局势联动 对以方施压升级    总台新闻观察员 王昆鹏:也门胡塞武装正在通过不断对以色列重要目标实施袭击来向以方施压。这次是更加深入以色列北部的海法港,胡塞武装和以色列之间的冲突,实际上与加沙局势是密切相关的。自从以色列3月开始持续围困加沙地带并重启大规模军事行动以来,胡塞武装也恢复了对以色列相关目标的袭击。从胡塞武装的最新表态来看,也是点名了对海法港实施海上封锁,是对以军近期升级军事行动以及对加沙长期封锁的回应。   此外,胡塞武装挑选海法港也有回应以军近期空袭胡塞武装控制区多个港口、打击该武装燃料等关键物资运输的意味。由于巴以局势紧张以及胡塞武装的袭击,以色列南部的埃拉特港运行已经受到了影响,甚至一度停滞。如果其北部相对安全的海法港也因为袭击的威胁而时常中断,那么对于以色列的贸易、经济和能源,也将带来现实的影响。从这个意义上来讲,胡塞武装是通过真实袭击和封锁威胁来对以色列进行针锋相对的施压。   胡塞武装高超音速导弹或突破以军防御   总台新闻观察员 王昆鹏:也门胡塞武装对以色列的袭击主要是通过导弹和无人机来实现的。早在2023年的10月31日,胡塞武装就首次公开宣布对以色列发动导弹和无人机的跨境袭击。当时最早触发警报的就是港口城市埃拉特。目前来看,胡塞武装发动的高超音速导弹袭击,以军并不能完全拦截。近期以色列中部的本·古里安国际机场就是一个双方集中展开攻防的地点,5月4日的袭击就造成了多人受伤,机场也一度关闭。当然对于海法港口来说,由于其位置距离也门更远,以色列的防空系统能够有相对更多的时间进行预警和拦截。今年1月初,胡塞武装曾向海法附近的一座发电站发射了一枚高超音速导弹,以军表示他们在导弹进入领土前进行了拦截。但是考虑到美国和胡塞武装近期在红海区域达成了停火协议,实际上就造成了以前美军能够在红海帮助以色列拦截的胡塞武装的导弹,现在都要由以方来负担。那么如果胡塞武装持续提升高超音速导弹的袭击力度,不能排除海法港被击中的可能。
习近平在河南考察时强调 坚定信心推动高质量发展高效能治理 奋力谱写中原大地推进中国式现代化新篇章
   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察。   中共中央总书记、国家主席、中央军委主席习近平近日在河南考察时强调,新时代新征程,河南要认真落实党中央关于中部地区加快崛起、黄河流域生态保护和高质量发展等战略部署,坚持稳中求进工作总基调,全面深化改革开放,着力建设现代化产业体系和农业强省,着力改善民生、加强社会治理,着力加强生态环境保护,着力推动文化繁荣兴盛,以高质量发展和高效能治理奋力谱写中原大地推进中国式现代化新篇章。   5月19日至20日,习近平在河南省委书记刘宁和省长王凯陪同下,先后到洛阳、郑州考察调研。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察时,同企业职工亲切交流。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察时,同企业职工亲切交流。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察时,同企业职工在一起。   19日下午,习近平首先来到洛阳轴承集团股份有限公司考察。该公司前身为“一五”期间建成的洛阳轴承厂。在智能工厂,习近平了解企业发展历程,听取不同类型轴承产品用途和性能介绍,走近生产线察看生产流程。他对围拢过来的企业职工说,制造业是国民经济的重要支柱,推进中国式现代化必须保持制造业合理比重。现代制造业离不开科技赋能,要大力加强技术攻关,走自主创新的发展路子。他勉励职工发扬主人翁精神,在企业发展中奋发有为、多作贡献。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳白马寺考察。   随后,习近平来到始建于东汉年间的白马寺考察,详细了解佛教中国化和寺院文物保护情况。他指出,白马寺见证了佛教传入、发展并不断中国化的进程。历史证明,坚持我国宗教中国化方向是完全正确的,要积极引导宗教同中华优秀传统文化相融合、与社会主义社会相适应。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳龙门石窟考察时,同游客亲切交流。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳龙门石窟考察。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳龙门石窟考察时,同游客亲切交流。   已有1500多年历史的龙门石窟,是重要的世界文化遗产。习近平来到这里,察看石窟整体布局风貌和代表性窟龛、造像,同现场的文物保护工作者亲切交流。他强调,要把这些中华文化瑰宝保护好、传承好、传播好。游客们见到总书记,都十分欣喜,纷纷向总书记问好。习近平不时同大家交流,特别鼓励小朋友们多到实地寻溯中华文化,从小树立文化自信。他指出,文旅融合前景广阔,要推动文旅产业高质量发展,真正打造成为支柱产业、民生产业、幸福产业。   20日上午,习近平听取河南省委和省政府工作汇报,对河南各方面取得的成绩给予肯定,对下一步工作提出要求。   习近平指出,高质量发展是中国式现代化的必然要求。面对复杂的外部环境,要坚定信心,坚定不移办好自己的事,坚定不移扩大高水平对外开放,着力稳就业、稳企业、稳市场、稳预期,以高质量发展的确定性应对各种不确定性。河南作为经济大省,要进一步夯实实体经济这个根基,以科技创新为引领,因地制宜发展新质生产力,提升现代化产业体系对高质量发展的支撑能力。要加强耕地保护和建设,扛牢粮食安全责任,延伸现代农业产业链条,以城乡融合发展带动乡村全面振兴,促进城乡共同富裕。要持之以恒加强重点流域生态保护治理,深化污染防治攻坚,筑牢生态安全屏障。   习近平强调,河南人口总量、人口密度、人口流动量都比较大,社会问题复杂多样,必须扎扎实实加强社会治理。要全面落实党的领导,健全社会治理体制机制,加强新经济组织、新社会组织、新就业群体党建工作。要更好凝聚服务群众,健全群众利益协调机制,提高公共服务水平,用心用情解决群众急难愁盼问题。要突出抓基层、强基础、固根本,推动资源、服务、管理下沉,确保社会治理各项工作纵向到底、横向到边。要高度重视法治和诚信建设,发挥好法治对社会治理的规范和保障作用,加强诚实守信的价值引导,提高政府诚信、企业诚信、社会诚信水平。要盯牢风险隐患排查和治理,强化社会治安整体防控,有效防范化解重点领域风险,切实维护社会和谐稳定。各级领导干部要主动作为,善于从推进社会治理中总结新形势下党的群众工作规律,针对不同社会群体的特点把工作做细做实。要切实整治形式主义为基层减负,支持基层干部大胆干事、树立威信,支持群众依靠自身力量解决社会治理中的问题。   习近平指出,中央八项规定是党中央徙木立信之举,是新时代管党治党的标志性措施。开展深入贯彻中央八项规定精神学习教育,是今年党建工作的重点任务。要在一体推进学查改上下功夫,把党员干部个人查摆整改与组织查摆整改紧密结合起来,切实把作风硬要求变成硬措施、让铁规矩长出铁牙齿,确保学有质量、查有力度、改有成效。学习教育中央指导组要认真履职尽责,把工作重点放到推动解决问题上,精准指导、务求实效。   习近平强调,今年以来,我国一些地区出现旱情,有的还在持续,相关部门要密切配合,加强用水调度,确保城乡居民供水和农业灌溉需求。有旱就可能有涝,要严防旱涝急转。汛期已经到来,各地对防汛抗洪务必精心准备,确保预案充分、应对从容。容易突发山洪、泥石流等自然灾害的地区,要全面落实应急处置责任。   何立峰及中央和国家机关有关部门负责同志陪同考察,深入贯彻中央八项规定精神学习教育中央第二指导组负责同志参加汇报会。
深观察丨外资“倒流” 美滥施关税事与愿违
  “这就像在雾中开车:突然大雾降临,于是你不得不放慢车速。如果雾气太重,你还可能会把车停到路边并打开双闪灯。我们现在就感觉有点身处类似的境地。”   在美国商务部日前举办的“选择美国峰会”上,北卡罗来纳州商务部长李·利里如此形容海外企业对该州投资的不畅。   “选择美国峰会”是一个旨在促进外国在美投资的年度会议。然而与往年相比,今年的会议气氛要沉闷许多。   美国政府一直宣称,加征关税将为美国吸引数万亿美元的外国投资。但据美国《政治报》报道,来自美国多个州的政府官员和议员都抱怨说,白宫关税政策引发的不确定性正在阻碍外资进入美国市场。 美国《政治报》报道截图 “我知道企业最需要什么”   可以说,本届美国政府自上台以来,为了推进其关税政策已经用尽话术。其中之一就是高关税有助于迫使外国企业和跨国公司将生产线迁至美国,通过加大对美投资实现美国的制造业复兴和就业岗位井喷。   但事与愿违的是,这幅理想图景并未出现。   《政治报》的报道提到,在关税政策深陷争议的情况下,美国政府当前非常渴望对外展示“美国经济增长”的迹象,以至于一些公司只要口头表示“考虑增加在美国的产能”就能得到白宫的赞赏。但现实却是,许多白宫吹嘘的企业投资计划要么已经筹备多年,要么被人为夸大,不少还可能在未来生变。   举例来说,尽管白宫近期高调宣扬本田和斯泰兰蒂斯等车企表示会将生产线转移至美国,但美国劳工统计局的数据显示,目前美国汽车制造业提供的工作岗位反而比去年减少了20.8%。   其他行业也在关注美国国内的经济和政治气候。例如,尽管罗氏制药公司承诺对美投资500亿美元,但在白宫发布一项旨在降低药品价格的行政命令后,该公司开始重新评估此前的承诺。 美国《政治报》新闻网报道截图   目前的经济形势让美国两党议员都感到不安。   威斯康星州共和党籍联邦参议员罗恩·约翰逊就表示,他非常担心关税政策的不确定性会影响他所在的州。   “我从本州的企业、制造商以及全美制造商协会和商业圆桌会议那里听到的消息是,许多外商原定的投资计划已经被搁置。我本人来自私营企业,我知道企业最需要的就是尽可能多的确定性和稳定性。” 美国《政治报》报道截图 “捍卫欧洲的最佳方式就是采取攻势”   美国发生的一切,也被正与美就关税展开博弈的西方贸易伙伴看在眼里。   法国投资总秘书处秘书长博内尔日前表示,美国关税政策造成的不确定性最终将拖累全球对美投资,事实上法国对美投资“已经降温不少”。   与此同时,欧洲正凭借自身相对于美国的一系列优势努力吸引外来投资。   法国经济与财政部部长隆巴尔日前强调,欧洲政治和监管稳定,拥有相当健全的法治体系。其言下之意,就是欧洲在吸引外资方面胜过美国。 法国兴业银行网站报道截图(题图为隆巴尔)   欧洲央行行长拉加德日前接受采访时也表示,近期欧元对美元走强看似有悖直觉,其实源于金融市场对美国失去了信心。这是美国反复无常的关税等政策造成的,“对欧洲来说是一个机遇”。   “我们看到美国的法治和贸易规则受到挑战,不确定性持续存在。欧洲则被视为一个稳定的经济和政治区域,拥有稳健的货币和独立的央行。”   她还补充说,如果欧盟和美国的关税谈判失败,欧盟需要有强有力的应对措施。 欧洲央行官网截图   事实上,面对美国的多重关税,欧洲早已开始未雨绸缪。除了先后公布两份对美反制商品清单、加速推进与亚洲的自由贸易协定谈判等,欧盟还计划通过简化从汽车到航空等多领域的监管流程,与美国争夺投资者。   用欧盟委员会执行副主席塞茹尔内的话说,“捍卫欧洲的最佳方式就是采取攻势”。 塞茹尔内(资料图) “关税改变了全球投资者对美国经济的看法”   和欧洲一样,日本也在紧张应对美国的关税乱拳。   日本政府最初把率先与美展开关税谈判并达成协议作为优先事项,但迄今两轮谈完,尚未取得任何进展。   日美双方拟于本月在加拿大举行的七国集团(G7)财长与央行行长会议后进行第三轮关税谈判。不过,日本政府此前已多次表示,不会在谈判中作出有损国家利益的让步。   另据报道,考虑到日本是美国最大海外投资来源国,日方除考虑进一步对美开放市场等让步条件外,早期谈判方案中还包括将美国对日商品关税减免的百分点与日本企业在美投资水平挂钩。 《金融时报》报道截图   值得注意的是,在日本对美投资可能被“吓退”的同时,“逃离”美国的资金正大量涌向日本。   最新数据显示,在刚刚过去的4月,海外投资者共购买了价值高达8.21万亿日元(约合566亿美元)的日本股票和长期债券。市场服务机构美国晨星公司称,这是日本财务省1996年开始收集此项数据以来的外资最大月度净流入。   有美媒指出,虽然这一创纪录的月度外资流入与4月美国政府宣布加征“对等关税”有关,但市场观察人士仍看好日本资产前景,相信未来一段时间外资流入仍将保持强劲势头。   用野村证券外汇策略主管后藤雄二郎的话说,“关税改变了全球投资者对美国经济和资产表现的看法,从而让他们转向包括日本在内的其他主要市场”。 美国消费者新闻与商业频道报道截图
为俄乌一日三通电话 特朗普耳朵成“关键战场”?
  19日,美国总统特朗普与俄罗斯总统普京、乌克兰总统泽连斯基分别通电话,就俄乌停火谈判等问题进行沟通。其中,泽连斯基与特朗普通话两次,一次是一对一,另一次通话还叫上了部分欧洲领导人。   美国有线电视新闻网19日就此发表了一篇文章,标题是“特朗普的耳朵是俄乌冲突的新前线。”   文章说,俄乌冲突已持续超过三年,如何说服美国总统特朗普已成为俄乌以及欧洲争斗的“关键战场”。   一天三通电话 俄乌距离停火还有多远?    19日,美国总统特朗普与俄罗斯总统普京、乌克兰总统泽连斯基分别通电话,就俄乌停火谈判等问题进行沟通。其中,泽连斯基与特朗普通话两次,一次是一对一,另一次通话还叫上了部分欧洲领导人。这样密集的电话斡旋都谈了些什么?效果怎么样呢? 01 各说各话有哪些?   俄方:应消除冲突根源 找到折中方案   俄罗斯总统普京说,对俄方最重要的是“消除危机根源”,即北约东扩对俄罗斯安全构成的威胁;俄方赞成和平解决乌克兰危机,但应该确定更有效实现和平的方式。   俄罗斯总统 普京:问题在于,俄罗斯和乌克兰方面均应最大程度体现对和平的努力,并且找到让各方都满意的折中方案。   乌方:三点诉求 领土妥协与撤军“免谈”   乌克兰总统泽连斯基在两次通话后的简报会上表示,他在与特朗普的第一次通话中强调了三点关键诉求:   必须实现停火;   对俄罗斯实施制裁;   以及美国“不能在没有乌克兰参与的情况下对与乌克兰相关事宜做出任何决定”。   泽连斯基强调,乌方不会在领土问题上妥协,不会从其领土撤军。   乌克兰总统 泽连斯基:没人能从我们的领土上撤出我们的军队。保护乌克兰主权和领土完整是我的宪法职责,也是我们军队的职责。   打完三通电话后, 特朗普称,俄罗斯和乌克兰将立即启动谈判,以实现停火。 02 俄乌各执一词 话里话外有交集么?   目前,俄乌各自表态,同意就围绕两国可能达成的和平协议研究起草备忘录。   俄罗斯总统 普京:这一备忘录应该包含若干条款,比如解决危机的原则、可能达成和平协议的时间表,以及在达成相关协议的情况下临时停火。   乌克兰总统 泽连斯基:一旦我们收到俄方的备忘录或提议,我们也会根据我们的看法相应地拟定乌方版本的备忘录。   备忘录、继续谈 分歧中存少量交集   另据俄总统新闻秘书佩斯科夫20日透露,俄乌围绕两国可能达成的和平协议起草备忘录时将面临“重重困难”,因此不会设定“最后期限”。   俄乌都表示将继续接触和谈判。普京称,在土耳其伊斯坦布尔谈判的俄乌双方代表之间联系已经恢复,这表明俄乌“总的来说走在了正确道路上”。泽连斯基则在社交媒体上表示,乌方已准备好“以任何能产生结果的形式”与俄罗斯进行直接谈判。 03 接下来会发生什么?   泽连斯基:考虑举行多方高级别会议   泽连斯基表示,乌克兰正在考虑举行一次由美国、乌克兰、俄罗斯以及欧盟国家和英国参与的高级别会议,以结束冲突。他认为,美国和欧洲的代表应在“一定程度”上参与谈判过程。   乌沙科夫:俄美总统通话未就停火协议设时间表   俄总统助理尤里·乌沙科夫说,俄美总统没有就俄乌可能达成的停火协议设定具体时间框架,也没有商定俄美元首会晤的时间和地点。   美媒:特朗普的耳朵成“关键战场”   美国有线电视新闻网19日发表了一篇文章,标题是“特朗普的耳朵是俄乌冲突的新前线。”文章说,俄乌冲突已持续超过三年,如何说服美国总统特朗普已成为俄乌以及欧洲争斗的“关键战场”。而特朗普近期刚表示过,对协调俄乌停战无果而感到沮丧。    文章称,俄罗斯和乌克兰方面都试图向美国证明,对方才是和平的真正障碍,并希望至少在一段时间内令美国表态和立场向己方倾斜。俄方希望避免美方加大对乌克兰的支持,而乌方最大的担忧则是美俄两国领导人在没有乌克兰的参与下自行确定有利于俄方的和平框架,或是威胁撤回对乌克兰的军事和经济支持。   俄乌的各执一词,令特朗普对斡旋和平的努力感到越来越沮丧,他已多次表示,如果进展不力,美国要退出协调。   美国总统 特朗普:如果出于某些原因,俄乌冲突其中的一方让谈判变得非常困难,我们就不去管了。但愿我们不必这样做。   美国总统 特朗普:我认为俄乌谈判将会取得进展,而如果没有进展,我就会退出。俄乌冲突就将继续下去。   但文章最后也指出,俄罗斯和乌克兰都不愿意接受对方提出的条件,也不愿意作出让步,这可能意味着,即使美国施加压力,即使美国领导人与俄乌领导人直接通话后,俄乌冲突仍可能将继续。   在美国总统特朗普19日与俄罗斯总统普京、乌克兰总统泽连斯基分别通电话后,俄方就通话内容发表了声明。英国天空新闻频道就此称,这意味着美国方面的协调以失败告终。   英国天空新闻频道记者:美国总统特朗普无法以任何其他的方式解读俄方的声明。声明只能说明美国在协调的工作中,在针对这场冲突的外交和管理方面完全失败了。
马斯克确认推出自动驾驶出租车 未来五年继续领导特斯拉
马斯克 凤凰网科技讯 北京时间5月21日,据CNBC报道,特斯拉CEO埃隆·马斯克(Elon Musk)周二确认,该公司将于6月底在得州奥斯汀市的街道上推出自动驾驶出租车。不过,特斯拉全自动驾驶系统(FSD)的安全性问题目前正面临美国监管机构的调查。 马斯克在接受CNBC采访时表示,特斯拉一开始将在奥斯汀部分区域投放约10辆自动驾驶出租车。如果试运行顺利且未发生事故,规模将迅速扩展到数千辆车。 “我们实际上不会在整个奥斯汀地区部署,而只会在最安全的区域进行部署。所以我们会设置地理围栏(只在限定地区)。”马斯克称。在奥斯汀之后,特斯拉将把自动驾驶出租车服务扩大到洛杉矶和旧金山。 对于特斯拉来说,自动驾驶出租车的成功测试至关重要,因为在需求疲软的背景下,马斯克已将公司的重心从打造一款全新、价格更低的电动汽车平台转向推出自动驾驶出租车服务和Optimus人形机器人。特斯拉的估值在很大程度上取决于这一战略押注。 马斯克对CNBC表示:“从长期来看,唯一重要的事情就是自动驾驶和Optimus。” 授权FSD 不过,自动驾驶汽车技术的商业化一直十分困难。严格的监管和巨额投资已迫使许多公司知难而退。Waymo等公司目前仍在推进自动驾驶技术,面临日益严格的审查。 自去年10月以来,美国国家公路交通安全管理局(NHTSA)一直在调查特斯拉FSD在能见度较低路况下发生的碰撞事故。上周,NHTSA要求特斯拉就其付费自动驾驶出租车服务的推出回答相关问题,以评估这些车辆在恶劣天气中的表现。 马斯克表示,特斯拉正在与多家大型汽车制造商就授权FSD系统进行谈判。该系统预计将成为自动驾驶出租车的基础。 继续领导特斯拉 马斯克周二早些时候还表示,他致力于在未来五年内继续领导特斯拉。 “是的,毫无疑问。”马斯克在多哈举行的彭博卡塔尔经济论坛上接受视频采访时称。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。