EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
谷歌AI全面进化:Gemini2.5开启“深度思考”,视频生成模型Veo 3硬刚Sora
凤凰网科技讯 5月21日,2025谷歌I/O开发者大会主论坛演讲今日凌晨举行,谷歌宣布了其在人工智能领域的最新进展,核心围绕Gemini 2.5系列模型的升级及其在多款产品中的深度整合。公司强调,AI技术的迭代速度正显著加快,旨在尽快将最先进的模型能力推向用户和开发者。 在模型层面,Gemini 2.5 Pro和2.5 Flash都迎来了能力提升。据称,自初代Gemini Pro发布以来,Elo等级分已提高300多分,目前的Gemini 2.5 Pro在LMArena排行榜上占据首位,并在流行的编码排行榜WebDev Arena上名列前茅,Elo分数为1415。此外,2.5 Pro 在与教育专家合作构建的学习模型系列LearnLM的评估中也表现出色。 针对更复杂的任务,谷歌正在探索一种名为Deep Think的实验性增强推理模式,它利用新的研究技术,使模型在回应前考虑多种假设,目前已在部分数学和编程基准测试中显示潜力,正在进行额外的安全评估。作为效率主力模型的2.5 Flash,则在推理、多模态、代码和长上下文等关键基准测试中得到改进,同时效率更高,在评估中使用的令牌数量减少了20-30%。 Gemini 2.5系列模型还引入了多项新功能。其中,原生音频输出功能和Live API的改进,支持更自然、富有表现力的对话体验,包括情感对话、主动音频和思考能力。文本转语音功能也得到增强,支持多位说话人,且能捕捉细微差别,现已在Gemini API中可用。 备受关注的Project Mariner的计算机使用功能正被引入Gemini API和Vertex AI,计划于今年夏天更广泛地推出供开发者实验。同时,模型的安全性也得到提升,显著增强了对间接提示词注入攻击等威胁的防护。开发者体验方面,模型推理摘要和推理预算功能被引入,以提供更高的透明度和控制能力。 AI能力正被深度融入谷歌的核心产品中。尤其是在搜索领域,AI Overviews已覆盖超过15亿用户,并在200个国家和地区推出。谷歌正在美国推出全新的AI Mode,为用户提供端到端、更智能的AI搜索体验,支持更长、更复杂的查询和后续提问,并计划于本周开始在美国地区的搜索中整合Gemini 2.5 模型。 Gemini应用本身也正在向通用AI助手转型。去年在研究原型 Project Astra 中首次展示的摄像头和屏幕共享功能,现已整合到Gemini Live中,并向所有Android用户开放,今日开始向iOS用户推出。应用中还将很快向订阅者推出实验性的Agent Mode,帮助用户执行多步任务,例如跨网站搜索公寓房源。 此外,谷歌正在探索利用“个人上下文”技术提升个性化体验,允许模型在用户许可下私密地访问相关个人数据(如邮件、文档),用于生成更贴合用户风格的回复,例如 Gmail中推出的个性化智能回复,预计今年晚些时候向订阅者提供。 除了核心模型和应用,谷歌还将多项前沿研究转化为实际产品。此前展示的3D视频技术Project Starline演变为Google Beam,这是一个AI驱动的视频通信平台,通过多摄像头阵列和AI生成逼真的3D体验,首批设备将于今年晚些时候与惠普合作提供给早期客户。 Google Meet也正在推出通过语音翻译打破语言障碍的功能,目前英语和西班牙语的 Beta版已向部分订阅者开放,更多语言和企业客户测试将陆续推出。 在生成式媒体领域,谷歌发布了全新视频生成模型Veo 3和图像生成模型Imagen 4。Veo 3首次实现了视频原生音频生成,可创建环境音效和角色对话,为视频创作提供了全新可能。Imagen 4则在图像质量和文字排版方面实现了跨越式提升。 Google还推出新型AI电影制作工具Flow,整合了Veo、Imagen和Gemini多个模型,旨在帮助创作者从构思到成片全流程创作,该工具已向Google AI Pro和Ultra订阅用户开放。为应对AI生成内容识别难题,谷歌继续使用SynthID为生成内容添加不可见水印,并推出专门的检测工具。 公司指出,这些进展得益于其领先的基础设施,包括专为大规模思考型和推理型 AI 工作负载设计的第七代 TPU Ironwood。数据显示,谷歌通过不同产品和API处理的token量已从去年同期的每月9.7万亿增长到目前的480万亿以上,开发者数量增长五倍。这些都表明AI正以前所未有的速度被世界各地的个人、企业和社区所拥抱。 谷歌持续在基础研究上加倍投入,致力于推动实现通用人工智能(AGI)和构建能够理解世界的“世界模型”并强调在每一步都将安全和责任置于工作的核心。
冯小刚的“怪味女性主义”
  《向阳·花》剧照   不久前和一位影评人朋友一起看了冯小刚导演的《向阳·花》,从电影院出来,进电梯间,两人都沉默无话。然后相视而笑。   “这是一部什么电影?好奇怪。”朋友说。   “前面看着还行,叙事上有着老技师的熟练沉稳,但越来越离奇,怎么越看越像张艺谋的《第二十条》?”   “因为都是赵丽颖做主演带来的混淆?”   “也不全是,你看,电影里都有一个哑巴……”   “但是《第二十条》里赵丽颖扮演的角色是哑巴,《向阳·花》里是赵丽颖扮演的高月香的伙伴黑妹是哑巴。”   “的确不一样,但都有哑巴,这个哑巴都代表了底层的失声,呈现了一种极端的生存处境。而且赵丽颖扮演的角色都有被性侵的画面。”   给人这种相似联想的地方有很多。冯小刚也曾被归为第五代导演,虽然他不是北京电影学院毕业的,不算第五代的嫡系,但代的属性仍然如此有分量,将他们绑定在一起。不曾料想到的是,在电影已经多元化发展的今天,他们仍然在用自己的作品顽强地证明着代的存在。   曾经在2000年前后,第五代导演都拍古装皇帝戏,那时候作为第五代的周晓文是先行者,他首先在上个世纪90年代中期拍摄了《秦颂》,然后陈凯歌、张艺谋、冯小刚相继拍摄了若干发生在宫廷中的故事。前些年又都筹划拍抗美援朝,冯小刚虽然没有拍成,但他拍摄抗美援朝电影的相关计划是很早的。后来张艺谋拍了司法和底层双重困境的《第二十条》,冯小刚的这部新片《向阳·花》也是类似的主题。   以前笔者提到过一个概念,叫作年龄政治。在年龄上大做文章,似乎涉嫌身份歧视。但在国内年龄分层又有其道理,不同年龄的人身上烙印着某种脱离不开的精神格调和文化范式。   只是如今时代变迁,有了新的时代精神,这些年我们文化中的女性意识变得越来越充分。已经拥有了充分文化资本的她们在这里开始变成了被审视的对象。去年出现了一个词叫“老登电影”,指向那些男性尤其是年长男性主导的电影。当然它有更复杂的内涵,也指那些饱含“男性凝视”的电影作品。   这样的思潮如此强烈,已经介入了文化产业,影响了文化生意。要想电影有票房,不让当下年轻人反感,不影响票房口碑,就要改变其惯有的文化模式,尤其是关于性别的叙事倾向。   第五代导演的剧本会上,包括一些香港老年电影导演的创作,都更加注重引入女性的声音,增加女性的顾问成分。女性的感受被更加留意了。一位老导演的新片在海外电影节受到女性的批评,在后期重新做调整时,引入了一位女性作为联合导演。   这当然可说是精神可嘉。但是这个转向也并不容易,而是异常艰难。这是所谓灵魂深处的斗争,很有点史无前例的意思。而且,这不仅仅是叙事的技术问题,还要考验灵魂的“诚与真”。   在《向阳·花》里,有一些情节让人难忘。高月香被某老板性侵——高的行动并不可信,似乎是为了情节的需要,不顾人物性格的逻辑而被强行加戏。而性侵戏,我们去年批评张艺谋电影时就表达过类似的观点:为什么女性被压迫的方式就一定是被性侵?他们对于女性命运和真实处境缺乏想象。也许电影需要这样的刺激性画面?这样的悖论之处有很多。   如果以为“秉持了一种关怀的姿态,就是关怀了”,这类伪善,大家可以迅速辨别。我对《向阳·花》最后一场戏的记忆也比较深刻:几个从监狱里面出来的女子有了自己的经济实体——她们合作经营一家洗车行,不仅盈利,还有自己强烈的道德主张:我们不惹事,但是我们也不怕事!   这样的台词很有点刻意的感觉,女性同盟和Girl helps girl(女孩帮助女孩)的意涵十分明显了。但叙事上的混杂、人物塑造的缺陷,却让这份表达打了折扣——人物如同提线木偶一样存在,失去了命运的自主性,令叙事失去了可信度。因此,影片最后刻意迎合女性叙事的“正确段落”非但没能引发共鸣,反而成了不可忍受的东西。这就像一种假酒的配方,这个添一点,那个加一点,好应付购买者的味蕾。   朋友说:“在去年‘老登电影’的列表中,其实冯小刚导演之前的作品就入列了,这次他肯定也想着改变。”   我认同:“的确,这完全可以理解。学者不是说,他们第五代——当然第四代和每一代都是历史的人质嘛,其实很多都是集体潜意识中的东西,他们自己也无法超脱,能有这样一个意识,无论如何,都是好的。”   朋友接着说:“的确如此。但问题是,过去他们消费女性,现在他们开始消费女性主义了,这是对于女性的另外一种消费。他的女性主义表述味道很怪,可以称为怪味女性主义。”   我们这么评价,会不会过于严苛了?之前我们常说,女性主义有一百种,不一定同一,若从真实的立场和真诚的心灵出发,它们就都是善的。但问题是,这里对于女性命运的刻画明显地不下功夫,不做田野,不深入,不下沉,只会使用某些流行的配方,追求刺激效果。这样的做法就是一种消费。   由于我们对于一部影片的生产机制不能够完全了解,所以我们这样的批评应该不仅仅指向导演一人,而是指向这个文本的所有写入者。而这样的文本也许有另外一种解读法:它是另外一种批判性的文本?   所谓“怪味”——怪味女性主义,怪味现实主义,最近这些年我们在电影中其实已经司空见惯。它们究竟意味着什么?这是一个值得深思的话题。(作者王小鲁 为电影评论家)
国际乒联彻查王楚钦球拍检测受损事件
  新华社多哈5月20日电(记者曹剑杰、王子江、罗晨)当地时间19日下午,在多哈世界乒乓球锦标赛混双第二轮中,中国选手王楚钦的球拍在赛前检测环节出现受损情况。中国乒协赛后向国际乒联提出抗议和申诉,国际乒联回应要彻查此事。   在与巴西组合雨果·卡尔德拉诺和布鲁纳·高桥的比赛开始前,王楚钦发现球拍海绵开裂,经过他本人和教练肖战的交涉,裁判同意他更换球拍。赛后王楚钦对球拍被损坏表达了不满,他表示检测前球拍完好无损,进场后发现海绵开了一半,“没办法打比赛”。   在当日全部比赛结束后,国际乒联与中国乒协就该事件举行了特别会议,进行沟通交流。中国乒协主席王励勤、中国乒协秘书长何潇、国际乒联竞赛团队、裁判团队以及球拍检测团队负责人参加本次会议。   王励勤表达了对该事件的关切,详细阐述了事件发生后中国乒协所采取的行动,包括第一时间询问运动员、教练员情况,并与工作人员进行交流,同时代表乒协就球拍检测受损事件提出抗议和申诉,要求调取监控并且要求调查事件原因。为避免该类事件再次发生,中国乒协提出三点意见,国际乒联一一进行回应。   ——中国乒协希望在此事件之后,能够由工作人员全程跟随球拍检测并确保没有任何无关人员可以接触到检测后的球拍。   国际乒联表示,根据赛事规则,允许各支球队派一名工作人员全程跟随。   ——中国乒协希望后续赛事更换更大且更安全的球拍检测容器。   国际乒联表示,在该事件发生后,已第一时间要求组委会提供A4尺寸的大信封,并要求所有裁判员在工作过程中小心谨慎对待球拍,同时强调球拍检测团队的操作程序是正确的。   ——中国乒协要求球拍检测过程全程录像。   国际乒联表示从本次世乒赛实际操作角度,全程录像暂时无法实现。国际乒联将在未来比赛过程中逐步推进。   经过双方充分讨论,国际乒联与中国乒协还达成以下共识:国际乒联与场馆方确认是否有监控后及时反馈。国际乒联将继续深入调查球拍受损原因,并形成书面调查报告。   国际乒联于当地时间20日凌晨发表声明表示,一直致力于维护赛事公平公正,并将以此次事件为契机,进一步完善赛事组织和管理工作,加强对运动员装备的保护,确保类似事件不再发生。同时,感谢中国乒协及广大运动员、教练员、球迷对国际乒联工作的理解与支持,共同努力推动乒乓球运动的健康发展。
王楚钦临阵换拍 世乒赛“莎头”双线告捷
  新华社多哈5月19日电(记者王子江、曹剑杰)多哈世界乒乓球锦标赛19日进入第三个比赛日,中国队选手王楚钦和孙颖莎赢得各自的单打比赛后,又联手在混双比赛中击败世界杯男单冠军雨果·卡尔德拉诺和女友布鲁纳·高桥组合,单双打都晋级第三轮。 5月19日,王楚钦(左)/孙颖莎在比赛中。新华社记者 刘续 摄   卡尔德拉诺/高桥的组合并没有像赛前预料的那样给“莎头”组合带来大的挑战。尽管遭遇球拍损坏的意外情况,但志在混双“三连冠”的“莎头”仍然仅用19分钟就以11:2、11:7、11:4战胜对手,晋级16强。   比赛开始之前,王楚钦发现球拍海绵开裂,经过他本人和教练肖战的交涉,裁判同意他更换球拍。赛后王楚钦对球拍被损坏表达了不满,他表示检测前球拍完好无损,进场后发现海绵开了一半,“没办法打比赛”。   不过对于整个比赛过程,两人都表示非常满意。孙颖莎赛后表示,比起第一轮,两人的配合和衔接更加顺畅,赛前他们对巴西组合有了一定的研究,除了第二局对手让他们有些“不舒服”外,整体发挥不错。王楚钦表示,两届冠军的成绩已经成为过去,希望让多哈成为新的开始,“全力以赴赢得下一场胜利”。 5月19日,王楚钦/孙颖莎(左)在比赛中。新华社记者 肖艺九 摄   在上午开始的单打比赛中,王楚钦迎战巴西选手莱昂纳多·饭冢。19岁的饭冢世界排名77位,曾在去年的世界青年锦标赛上获得男单铜牌,但他并没有给王楚钦制造太多麻烦。作为二号种子的王楚钦以11:3、11:3、11:5、11:4获胜,晋级32强。   女单卫冕冠军孙颖莎面对朝鲜选手边松景,以11:2、11:5拿下前两局后,在第三局遭遇强有力挑战,两人从3:3平一直打到8:8。孙颖莎关键时刻再次占据优势,以11:9拿下。之后她以11:4赢得第四局顺利晋级。   王楚钦男单第三轮将面对中国香港选手黄镇廷和法国选手泊雷特之间的胜者,孙颖莎女单比赛中的下一个对手将在两名法国选手袁嘉楠和卢茨之间产生。两人混双的下一个对手是罗马尼亚组合、15号种子约内斯库/萨马拉。
抢跑“GPT-5”!谷歌发布最强AI全家桶,史上最贵AI会员定价1800元/月
去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙击。 今年攻守之势异也。 前几天 OpenAI 透露 GPT-5 将 All in One,集成各种产品。刚刚,Google 就把这个思路贯彻到 I/O 大会,直接掏出了自家有史以来最强的 AI 全家桶。 从 Gemini 2.5 Pro/Flash 模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向开发者与创作者的 AI 套件等,Google 几乎把从模型到产品的路径都压缩到一场发布会里。 更准确地说,当下最火的 AI 应用场景,都被 Google「预埋」进了产品接口里,让人无法忽视它作为全球同时具备工程实力和生态整合能力的 AI 巨头硬实力。 也难怪许多网友调侃,将近两个小时的发布会过后,又将有一大批初创公司死于 Google 之手。 不过,也不难看出,发布会上有一些功能仍停留在「预告片」和小范围测试阶段,距离真正的落地或许还有不小的距离。 此外,Google 还正式发布了 Android XR 产品和技术线的最新一代产品:与 Xreal 共同推出的首款轻量级智能眼镜产品 Project Aura。(更多细节请留意后续的另一篇报道) 帮我「买票 + 找座 + 填表」一口气搞定,Google 新 AI 搜索卷疯了 AI 正在重写搜索的底层逻辑。 在去年的 I/O 大会上,Google 推出了 AI 概览(AI Overviews)功能,至今已拥有超过 15 亿的月活跃用户。 生成式 AI 逐渐改变了人们的搜索方式,但随之而来的却是,我们不再满足于在搜索框里输入简单的问题,而是抛出更复杂、更长、更具多模态的提问。 今天,Google 再次加码搜索与 AI 的融合,推出一种端到端的 AI 搜索体验——AI Mode。 正如 Google CEO 桑达尔·皮查伊介绍的那样,这是 Google 有史以来最强大的 AI 搜索形态,不仅具备更先进的推理能力和多模态理解能力,还支持通过上下文追问和网页链接进行深度探索。 例如,当用户面对一个需要复杂解读的搜索问题,AI Mode 可启动「深度搜索」机制,不同信息之间进行推理,并在几分钟内生成一份专家级的引用报告,为你节省数小时的研究时间。 与此同时,Google 也将 Project Astra 的多模态能力接入搜索,进一步提升搜索的实时交互性。通过 Search Live 功能,用户只需打开摄像头,即可通过画面实时提问并获得反馈。 今年是 Agent 元年,Google 也很贴心地推出了 Project Mariner Agent 功能,能帮助用户更高效地完成任务。 例如,只需一句「帮我找两张周六比赛的实惠票,位于下层座位」,AI Mode 便能自动跨多个票务平台检索选项,实时比较价格和库存,并完成表单填写等繁琐操作,大幅提升效率。 借助 Gemini 模型和 Google 购物图谱的强大支持,Google AI Mode 能够帮助你缩小商品范围并提供灵感。如果你想看看衣服穿在自己身上的效果,只需要上传一张自己的照片,就能实现虚拟试穿衣服。 此外,AI Mode 也具备强大的个性化能力,能根据用户上下文偏好给出定制化建议,还可生成图表和可视化结果,尤其在体育和金融类搜索中表现出色。 该功能今日起已在美国全面上线,未来将推广至更多地区。 会写代码、还省 Tokens,Gemini 拿到了「学霸」人设 在模型能力方面,Google 此次发布了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上独占鳌头。 现在,Gemini 2.5 Pro 引入了名为「Deep Think」的推理增强模式。这项功能可在生成答案前考虑多个假设,从而更深入地理解问题背景。 2.5 Pro Deep Think 在 2025 年美国数学奥林匹克(USAMO)以及 LiveCodeBench(编程基准)排名领先,并在 MMMU(测试多模态推理)中获得了 84.0% 的分数。 不过,Google 表示,将会花更多时间进行前沿安全评估,并征求安全专家的进一步意见。作为第一步,Deep Think 功能目前将通过 Gemini API 向小范围测试者开放。 同样得到升级的还有注重效率的 Gemini 2.5 Flash。 新版 2.5 Flash 在推理、多模态、代码和长上下文等关键基准上都有了改进,同时在效率上更高,评估中使用的 tokens 减少了 20% 至 30%。 2.5 Flash 现已在 Gemini 应用程序中向所有人开放,并将在 6 月初通过 Google AI Studio 面向开发者和 Vertex AI 向企业全面发布。 开发者体验上,2.5 Pro 和 2.5 Flash 将在 Gemini API 和 Vertex AI 中引入了「思维摘要」功能,可将模型的推理路径以标题、关键信息和调用工具等方式进行结构化呈现。 开发者也将从中受益,Google 宣布在 Gemini API 和 SDK 中正式支持 MCP 工具,让开发者可以轻松接入更多开源工具和插件生态。 音乐、电影、图像全套上线,Google 把 AI 玩出了花 本次发布会,Google 带来了新一代视频和图像模型——Veo 3 和 Imagen 4。 与传统视频生成不同,Veo 3 是一款支持音频的视频生成模型,能在城市街景中模拟交通、鸟鸣,甚至角色对话,显著提升沉浸感。 该模型不仅在文本和图像提示的基础上生成视频,还能精确实现物理环境与口型同步,极大提升了视频创作的真实感。 目前,Veo 3 已在 Gemini 应用和 Flow 平台上向 Ultra 订阅用户开放,并已在 Vertex AI 平台上为企业用户提供支持。 上文提到的 Flow 正是 Google 为创作者打造的一款 AI 电影制作工具。 用户只需用自然语言描述电影场景,即可管理演员、地点、道具和风格,自动生成叙事片段。Flow 已在美国向 Gemini Pro 和 Ultra 用户开放,全球范围的推广也在推进中。 在图像生成方面,新版 Imagen 4 提升了精度与速度,细节表现上可逼真展现织物、水滴与动物毛发,同时也能生成偏抽象类型的风格。 它支持 2K 分辨率和多种长宽比生成,在排版和拼写方面也有显著优化,适合制作贺卡、海报甚至漫画。 Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上线,据悉,未来还将推出速度快十倍的版本。 在音乐创作方面,Google 扩大了 Lyria 2 驱动的 Music AI Sandbox 的访问权限,并上线了互动式音乐生成模型 Lyria RealTime。该模型现已通过 API 和 AI Studio 向开发者开放。 考虑到由 Veo 3、Imagen 4 和 Lyria 2 生成的内容将继续带有 SynthID 水印,Google 发布了全新的 SynthID Detector。 用户只需上传文件,即可识别其中是否包含 SynthID 水印,用于防伪和追踪 AI 内容来源。 Google 要造「世界模型」,连任务都能帮你做了? Google 希望将 Gemini 打造成一个「世界模型」,既能计划、理解,也能模拟现实世界的各个方面。 Google DeepMind CEO Demis Hassabis 表示,这一方向正是 Project Astra 的核心理念之一。 过去一年里,Google 已将视频理解、屏幕共享、记忆功能等逐步集成进 Gemini Live。如今,Gemini 新的语音输出加入了原生音频,更加自然;记忆与 computer use 能力也同步增强。 此外,Google 还在探索如何利用 Agent 能力帮助人们处理多任务。 Project Mariner 就是其中之一,能够同时完成最多十项任务,比如信息查询、预订、购物与调研。已面向美国 Ultra 用户开放,并即将集成至 Gemini API 与其他核心产品中。 AI 新功能扎堆发布,会诞生真正的杀手锏吗 NotebookLM 官方昨日宣布,上线 24 小时就已经成为 App Store 中排名第 2 的生产力应用和第 9 的整体应用。 作为 Google 在 AI 笔记工具上的一次重要探索,NotebookLM 提供音频概览和思维导图等功能。 其中,音频概览目前已支持超过 80 种语言,而本周,Google 也宣布将为这一功能引入更高的可定制性,用户可根据需要选择摘要的长度,无论是快速浏览还是深入阅读都不在话下。 这项功能首先将在英语中推出,随后将扩展到更多语言。 与此同时,Google 也在回应用户对视觉呈现的诉求,即将在 NotebookLM 中加入视频概览功能,用户只需一键即可将笔记内容转化为教育类视频,用更直观的方式传递信息。 在 AI 编程领域,Google还带来了 Jules 的最新进展。 这个最初出现在 Google Labs 的自主编码助手,能够理解代码并自主完成诸如编写测试、构建功能和修复 Bug 等开发任务,如今已经正式进入公开 Beta 测试阶段。 此外,Google 还推出了全新的订阅服务 Google AI Ultra。 该计划为专业用户提供 Google 最强大模型和高级功能的无限制访问,适合电影制作人、开发者、创意工作者等专业人士,月费为 249.99 美元(折合人民币 1804 元)。 目前,该计划已经在美国上线,并将很快扩展至其他国家。 实际上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一个能嵌入日常生活、真正打进主流用户心智的「杀手级产品」。 Google 当然明白这个道理,也正全力以赴寻找答案。 因此,我们看到,在这次的发布会上,Google 几乎什么都做了,也什么都提了:从文本、图像、视频、音乐,到搜索、Agent、创作工具,一应俱全。 牌已经亮完,技术也到位,现在,Google 只差一记真正击中用户痛点的落子。
炸裂!谷歌I/O大会王者归来:Gemini“世界模型”初现,搜索“换脑”,一句话制作原声电影
刚刚!谷歌举行了I/O 2025 大会,最大的感受是谷歌重回AI领头羊位置,谷歌正在以Gemini为核心打造真正的AI操作系统,”世界模型“初现 本届谷歌I/O大会一口气更新和发布了巨量的技术 首先需要明确的是,备受期待的Gemini 2.5 Ultra模型并未如期而至。我们得到的是一个标价250美元的“Ultra会员套餐”(Ultra Tier),而非我们翘首以盼的Ultra模型本身。但是,随着Gemini 2.5 Pro “Deep Think”的推出,Pro模型迎来了一次重大革新,其实际能力已堪比Ultra级别 那么,具体有哪些新内容呢?(清单确实很长): 模型与代理工具 Gemini 2.5 Pro “Deep Think”:具备并行思考能力,专为复杂数学和编码任务设计,并提供可配置的“思考预算”以增强控制力,把Gemini 2.5 Pro 推向极致,性能表现如下: Gemini 2.5 Flash 5月20版:速度更快、更经济,并新增了“思考摘要”功能,以提高透明度,性能已经无限接近Gemini 2.5 pro Gemini Diffusion:谷歌首次将扩散技术应用于文本生成,推出了实验性模型Gemini Diffusion,速度比肩此前顶级模型快5倍 Jules:对标OpenAI的Codex,异步编码代理,可在后台处理错误修复和功能原型开发,需要注册等待才能使用 多模态能力大爆发 Google Meet:新增实时翻译功能 Veo 3:视频生成能力大幅提升,生成具有4K逼真效果的视频,并支持原生音频、对话和噪声合成 Imagen 4:对标并超越OpenAI gpt-4o的图像生成能力,但是速度快了3倍,2K图像模型,在排版和文本图像生成方面更快、更准确 Flow:全新的电影制作工具,与好莱坞导演共创“Flow”结合了Veo 3和Gemini的能力,可根据文本提示构建完整的电影场景 Flow让创作者能更直观地“导演”AI:上传自己的角色和场景素材,或用Imagen即时生成;通过精确的镜头指令,描述想要的画面,Flow会自动生成剪辑片段并保持角色和场景的一致性。你可以无限迭代、调整镜头、延长或修剪片段,就像在传统剪辑软件中一样。Flow的目标是让电影制作进入一个全新的“流动”状态,让创意自然生长,将电影创作从“按部就班”变成“灵感迸发” 谷歌搜索彻底重塑:全新的“AI模式”(AI Mode) 更复杂的查询:用户现在可以提出比传统搜索长两到三倍的复杂问题,比如“我有一张浅灰色的沙发,想找一块能提亮房间的毛毯,家里有4个活跃的孩子,经常有朋友来玩。”AI模式会动态生成图文并茂的响应,包括链接、商家信息和评分 深度研究(Deep Search):对于需要更详尽答案的问题,AI模式可以进行“深度搜索”。它能同时发出数十甚至数百个查询,整合来自全网、知识图谱、购物图谱和地图社区的数据,在几分钟内生成一份专家级的、带完整引用的报告,帮你省去大量研究时间 复杂分析与可视化:AI模式能帮你分析复杂数据并生成可视化图表。比如,你想了解使用“鱼雷球棒”的著名棒球运动员的本赛季和上赛季的击球率和上垒率,它能立刻生成表格,并根据后续问题生成图表,就像拥有一个专属的体育分析师! 搜索实时互动(Search Live):Project Astra的实时能力也融入了搜索!通过手机摄像头,你可以和搜索进行“视频通话”,让它看到你所看到的,实时给出帮助。无论是DIY家居维修、难题作业,还是学习新技能,它都能成为你的“远程专家”。 代理购物(Agentic Checkout):AI模式还能帮你完成购物任务!它会浏览多个网站,分析数百个选项,帮你完成筛选、比价甚至直接链接到结账页面,帮你秒杀门票。未来,它还将支持餐厅预订和本地服务预约 谷歌加入AI眼镜开发:AI不仅要改变数字世界,更要深刻影响物理世界 沉浸式头显:与三星合作的Project Moohan是首款Android XR设备。它能为你提供“无限屏幕”体验,在XR版谷歌地图中,你只需告诉Gemini想去哪里,就能“瞬移”到世界任何角落;你还能在MLB应用中,像坐在体育场前排一样观看比赛,同时与Gemini讨论球员数据,将于今年晚些时候上市 轻量级眼镜:谷歌展示了最新的Android XR眼镜原型,轻巧便携,可全天佩戴,集成了摄像头、麦克风和扬声器,可选的镜片内显示屏还能在你需要时私密地显示信息。这意味着你的AI助手将真正“看”和“听”到你所看到和听到的,提供实时的、上下文感知的帮助,就像戴上了“超能力眼镜”!现场演示中,它能识别咖啡杯上的咖啡店名字,帮你导航,预约咖啡,甚至进行实时跨语言翻译。谷歌宣布,Warby Parker和Gentle Monster将成为首批与Android XR合作的眼镜品牌,未来你将能戴上符合自己风格的时尚AI眼镜,开发者也将于今年晚些时候开始为眼镜平台开发 其他 Gemma 3n:一款超轻量级的多模态模型(支持文本、图像、音频、视频),专为智能手机和边缘设备打造 Lyria RealTime:交互式音乐大语言模型,支持现场表演,并可通过API进行微调 MedGemma & SignGemma:两款开放的专业模型,分别用于医学图像分析和手语翻译 Agentic Colab:一款能够自我修复代码并自动执行任务的笔记本环境 Gemini Code Assist 2.5:免费的编程助手和代码审查代理,现已支持200万token的上下文 Firebase Studio:AI工作空间,可将Figma设计稿转换为全栈应用程序,并自动设置后端 Stitch:可根据描述或图像生成UI设计和前端代码 Google AI Studio升级:在编辑器中直接集成了Gemini 2.5 Pro、Imagen 4和Veo 3,并提供了GenAI SDK 新的Gemini API功能:包括原生音频输出、实时API、异步函数调用、计算机使用API、URL上下文及MCP支持 Project Beam:Starline项目的继任者,与惠普合作开发3D视频通话硬件 Project Astra升级:一款能看、能听、能说的主动式多模态助手 以上就是谷歌本次大会发布内容简要总结 写在最后 首先,这清晰地表明了谷歌正如何倾尽全力发展其AI生态系统。如果说过去苹果公司以其卓越协调的设备生态系统著称,那么现在谷歌正通过AI将这一理念推向新的高度。具体而言:Gemini如今能在系统中主动工作 此外,得益于其跨所有产品协调的原生语言模块,Gemini已更深层次地融入几乎所有谷歌产品中。无论是谷歌手表、XR眼镜还是Pixel手机,Gemini都能完美适配,并根据设备特性提供相应的扩展功能(例如XR设备中的地图叠加功能,效果惊艳!) 因此,如果说苹果过去通过iCloud实现了所有设备的互联互通,那么现在的谷歌则更进一步 发布会中,谷歌DeepMind CEO 诺奖得住Demis Hassabis 提到正在努力将Gemini扩展成为“世界模型”。他将其定义为“一个能够通过模拟世界的各个方面来制定计划和想象新体验的模型,就像大脑一样,谷歌内部肯定已经在搞了,这是实现AGI的终极大招 谷歌,王者归来
Google 眼镜回来了,AI 时代的涅槃重生
涅槃 重生 2014 年,在 GDG Devfest 中国场的现场,我第一次戴上 Google Glass。 它被认为是世界上首款智能眼镜,当时还只是一个纯粹面向开发者的「原型产品」。它可以录像,支持语音交互,支持将一些应用通过 Mirror API「镜像」到那个不足一寸、视野并不宽的液晶覆硅 LED 屏幕上。 遗憾的是 Google Glass 极其短命,从问世到停产只有短短 2 年时间。但通过它,我认为我看到了未来。 过去十多年里,Snapchat、Oculus/Meta 和 Rayban 们,在智能眼镜/头部可穿戴产品的市场兴风作浪。然而这条赛道,似乎再也没有 Google 什么事了。 很多后续产品我也玩过,甚至成为重度用户。但时不时,我总会想起 Google Glass。 而在今天的 Google I/O 上,这家公司重新点燃了智能眼镜和头部可穿戴产品的火苗。 Google 正式发布了 Android XR 产品和技术线的最新一代产品:与 Xreal 共同推出的首款轻量级智能眼镜产品 Project Aura。 在看完 I/O 2025 主演讲后,我打开 Google Photos,回看当年佩戴这些产品的我,从青涩走向成熟。 显示和交互技术的进步,让 Android XR 终于捡起了 Google Glass 十年前丢在地上的接力棒。而 Gemini 对所有 Google 产品的彻底革新,更是让 Android XR 获得了 AI 的「魔法加成」。 走过来时的路,Google 眼镜又回来了。但这次不是 Yesterday once more,而是一个新时代的开始。 Gemini 时代的首个 Android 平台 实话来说,作为一个智能手机操作系统的 Android,已经不足以引起任何兴趣了。连 Google 自己在 I/O 2025 主演讲都没有专门留出时间。 但 Android XR 的地位完全不一样。按照 Google 的措辞,它是第一个在 Gemini 时代构建的 Android 平台。 显然,手机已然成为过去时,而头戴式智能设备,将会创造全新的交互体验,成为 Android 新的增长引擎。 这次 Google 不自己生产眼镜了,而是选择和优秀的技术合作伙伴一起发力。 Project Aura 是首款 Android XR 平台的轻量级智能眼镜,由 Google 和中国混合现实技术公司 Xreal 共同推出。 参数细节目前少得可怜,通过渲染图以及 I/O 2025 现场 demo 能够看到,这款轻量级智能眼镜: 左右两个摄像头,和中置的其他视觉传感器模组,用于拍摄照片、视频,以及更重要的——支持 Gemini 的视觉/agent 智能体能力(Google Project Astra) 有双声道立体声扬声器,以及多个麦克风组成的阵列,用于通话、录音,以及支持 Gemini 的语音交互能力。 内嵌于镜片的单屏幕显示(波导或其他实现方式未知) 这是一个仍处在测试阶段的产品,但 Google 在现场还是很勇敢地做了一些已支持功能的 demo——主要体现作为核心卖点的 Gemini 的智能体能力。 比如实时翻译/同传:现场的两位演讲者使用印地语和波斯语互相翻译,虽然其中一位的信号看起来不太好,但翻译效果还是惊人的。 翻译采用纯文本,但从早前一点的 Gemini 部分演讲中我们可以断定,Gemini 肯定是有能力直接输出音频的。Gemini 本身的自然语言交互支持 150 多个国家的 45 种语言,但截至 25 年5 月中旬的语音互译能力仅支持英-西语互译,不过未来几周内将会增加数十种语言。 这为 Android XR 眼镜赋予了强大的使用场景,无论是跨语种工作,还是出国旅游,这种翻译/同传能力使得更自然的人际互动成为可能。 打破语言的障碍,为你提供真实世界的字幕,甚至配音——这是 Android XR 和 Gemini 想做的。 现场还演示了 Android XR 眼镜的其他功效。比如,用户(特别是视障用户)可以直接通过按键或语音唤醒的方式,询问 Gemini 自己看到的东西,做搜索和解答。 这其实是 Google 将近 10 年前就在做的 Google Lens 的视觉搜索能力。但经过 Gemini 的 AI 加成,能力会更加强大。 现场女演讲者在后台和一位同事打过招呼,然后过了几分钟再唤起 Gemini,让它帮自己和刚才见过的人约个咖啡; 她还问 Gemini 记不记得刚才自己手里拿的咖啡是哪家店的,把约会定在那一家咖啡店。 Gemini 很快就完成了之前的记录调取,并设置了日历项。 ——这显示出 Android XR 智能眼镜,不仅能够准确记住用户刚才见过谁,还能够理解视觉-语音等多模态的上下文,从而准确理解用户的需求。 这些能力的背后,是 Google 在本次 I/O 2025 上升级推出的 Gemini 2.5 Pro 等新一代多模态基座大模型,以及 Project Astra 智能体助理技术的功劳。 Gemini 2.5 Pro 和 Project Astra 驱动了 Gemini Live 的实时视觉 AI 智能体助理功能,在今天也正式面向 Android 和 iOS 的 Gemini app 上线并且免费提供给所有用户。 而在 Android 手机以及 Android XR 眼镜平台上,Gemini Live 更是升格成为一个具备完全设备操控能力的全量智能体,能够基于当前看到的视觉环境上下文,以及用户的自然语音控制,去完成多步骤、复杂的任务。 Google 智能眼镜,浴火重生 当年的 Google Glass 挑战了人们的隐私认知和社交习惯,并不被市场看好,所以也可以说它死得其所。 而在人人都恨不得脑门上长摄像头的今天,智能眼镜已经不再是什么争议焦点。或许当人人都有了智能眼镜,隐私已让位与新的功能与革命性的体验。 当然,Google 仍然记得所有关于隐私的争议,因此也表示会在产品开发过程中不断收集用户和测试者的反馈,从而确保这款产品更少侵犯隐私,更多提供帮助。 Google Glass 可能死了,但 Google 一直没有停止研究智能眼镜这件事。今天,十多年来的所有努力,终于通过 Android XR 涅槃重生。 一副好的眼镜,不应该只是技术产品。Meta 和 Rayban 200 万副销售量的成功经验,给 Google 好好上了一课。 在 I/O 大会上,Google 也宣布将和 Gentle Monster、Warby Parker 两大知名眼镜品牌及零售商合作,推出既时尚也科技的 Android XR 眼镜。 作为依视路集团旗下最新的时尚品牌,Gentle Monster 在亚洲和欧美青少年群体里十分受欢迎,产品卖出远超其用料、做工和设计水准的价格。而进入 Android XR 项目之后,恐怕 Gentle Monster 的溢价只会变得更加夸张。 Warby Parker 则是在美国最近几年里流行起来的 O2O 概念眼镜品牌,用户可以用它的 app 或网站很方便地一次性订购多副镜架,试用后再退回不需要、不好看的产品即可。 毫无疑问,智能眼镜如果想要拓宽销路,演好「时尚单品」的角色是最起码的。考虑到 Rayban 和 Oakley 两大品牌都已经被 Meta 收编,Gentle Monster 和 Warby Parker 可能是剩下的最好的选择。 最后,唯一遗憾的是,考虑到 Gemini 的海外大模型身份——即便 Android XR 能够被中国设备品牌采用,中国用户可能也很难感受到硬件和模型的完美结合。 好在这次 I/O 大会上,Google 通过 Android XR 已经给厂商们打好了样。而中国大模型的精进速度,以及产品化的节奏比海外更快。 或许我们也可以期待,这一波智能眼镜的彻底爆发了。 文 | 杜晨
谷歌AI核爆:升级全系模型,Gemini 2.5双榜登顶!所有产品用AI重做,OpenAI如何接招?
作者|冬梅 通常情况下,在 I/O 大会前的几周里,外界不会听到太多 I/O 大会的消息,因为谷歌一般会把最好的模型留到 I/O 大会上发布。但在 Gemini 时代,谷歌很可能会在三月的某个周二突然发布出他们最强的人工智能模型,或者提前一周宣布像 AlphaEvolve 这样的酷炫突破。 因为大模型时代,尽快将最好的模型和产品送到用户手中,是企业技术能力的展现。 北京时间 5 月 21 日凌晨一点,随着多个产品在 2025 谷歌 I/O 大会上发布,现场响起了一波又一波热烈的掌声。 在本场发布会上,作为主题演讲嘉宾,谷歌首席执行官桑达尔·皮查伊在一个多小时的时间里紧锣密鼓地介绍着谷歌在 AI、移动操作系统、搜索等领域的众多更新,这一场发布会上初步统计,Gemini 被提及 95 次,人工智能被提及 92 次。 以下是本场发布会的几个重要更新,首先是模型层面。 为 Gemini 2.5 Pro 引入 Deep Think 推理模型和更好的 2.5 Flash 此次发布会的高潮部分,是谷歌宣布为 Gemini 2.5 Pro 引入 Deep Think 推理模型和更好的 2.5 Flash。 谷歌在大会上宣布,已开始为 Gemini 2.5 Pro 测试名为“深度思考”(Deep Think)的推理模型。DeepMind 首席执行官 Demis Hassabis 表示,该模型采用“最前沿的研究成果”,使其具备在回应查询前权衡多种假设的能力。 2.5 Pro Deep Think 在目前最难的数学基准测试之一——2025 USAMO 上取得了令人印象深刻的成绩。它在 LiveCodeBench(一项针对竞赛级编程的难度较高的基准测试)上也取得了领先,并在测试多模态推理的 MMMU 上获得了 84.0% 的分数。” 不过谷歌表示,在广泛发布前仍需进行更深入的安全评估并征求专家意见,因此将率先通过 Gemini API 向可信测试者开放。 谷歌同时发布了性能更强的 Gemini 2.5 Flash 模型,该版本在速度与效率方面实现显著优化:推理效率提升、令牌消耗减少,在多模态处理、代码生成及长文本理解等基准测试中均超越前代。 2.5 Flash 是谷歌最高效的主力模型,专为速度和低成本而设计——现在它在多个维度上都得到了提升。它在推理、多模态、代码和长上下文等关键基准上都得到了改进,同时效率进一步提升,在我们的评估中,使用的 token 减少了 20-30%。 正式版将于 6 月初推出,目前开发者可通过 Google AI Studio 预览,企业用户可通过 Vertex AI 体验,普通用户则可在 Gemini 应用中试用。 虽然 I/O 大会主要展示的是 2.5 Flash 的效能突破,但谷歌宣布将把该模型的“思考预算”(Thinking Budgets)概念引入更高阶的 2.5 Pro 版本。这项功能允许用户平衡 token 消耗与输出精度 / 速度的关系。 此外,谷歌正将"航海家计划"(Project Mariner)整合至 Gemini API 和 Vertex AI。该项目基于 Gemini 开发,能通过浏览器导航完成用户指定任务,预计今夏向开发者扩大开放。同时,谷歌还通过 Gemini API 为 2.5 Pro/Flash 模型推出文本转语音功能预览版,支持 24 种语言的两种发音人声。 值得一提的是,Gemini 2.5 系列引入了不少新功能。 首先是原生音频输出和 Live API 的改进。Live API 推出了音频视频输入和原生音频输出对话的预览版,因此您可以直接构建对话体验,使用更自然、更具表现力的 Gemini。 它还允许用户控制其语气、口音和说话风格。例如,用户可以让模型在讲故事时使用戏剧性的声音。它还支持使用工具,以便能够代表用户进行搜索。 现在,可以供用户尝试的一系列早期功能包括: 情感对话,模型可以检测用户声音中的情感并做出适当的反应。 主动音频,其中模型将忽略背景对话并知道何时做出回应。 在 Live API 中思考,其中模型利用 Gemini 的思考能力来支持更复杂的任务。 谷歌还将为 2.5 Pro 和 2.5 Flash 版本发布全新的文本转语音功能预览版。这些功能首次支持多扬声器,能够通过原生音频输出实现双声道文本转语音。 与 Native Audio 对话一样,文本转语音功能富有表现力,能够捕捉到非常细微的差别,例如低语。它支持超过 24 种语言,并可在多种语言之间无缝切换。 其次是电脑操作能力提升。谷歌正将 Project Mariner 的电脑操作能力引入 Gemini API 和 Vertex AI。支持多任务处理,最多可同时执行 10 个任务,并且新增 “Learn and Repeat” 功能,让 AI 学会自动完成重复性任务。 第三是显著增强了对安全威胁的防护,例如间接提示注入。这是指恶意指令被嵌入到 AI 模型检索的数据中。谷歌 全新的安全方法 显著提高了 Gemini 在工具使用过程中对间接提示注入攻击的防护率,使 Gemini 2.5 成为我们迄今为止最安全的模型系列。 第四是增加三大实用功能,提升开发者体验: 思维摘要功能升级。Gemini API 和 Vertex AI 现为 2.5 Pro/Flash 模型新增"思维摘要"功能,可将模型原始推理过程结构化输出为带标题、关键细节及操作说明(如工具调用时机)的清晰格式。该设计旨在帮助开发者更直观地理解模型决策逻辑,提升交互可解释性与调试效率。 思考预算机制扩展。继 2.5 Flash 之后,思考预算功能现已覆盖 2.5 Pro 模型,允许开发者通过调节令牌分配来平衡响应质量与延迟成本。用户可自由控制模型思考深度,甚至完全关闭该功能。支持全量思考预算的 Gemini 2.5 Pro 正式版将于未来数周内发布。 Gemini SDK 兼容 MCP 工具。Gemini API 新增对 MCP 的原生 SDK 支持,简化与开源工具集成。谷歌正探索部署 MCP 服务器等托管方案,加速代理应用开发。团队将持续优化模型性能与开发体验,同时加强基础研究以拓展 Gemini 能力边界,更多更新即将推出。 关于谷歌 Gemini 的下一步,谷歌 DeepMind CEO 哈萨比斯表示,他们正努力将其最优秀 Gemini 模型扩展为一个 “世界模型”,使其能像人类大脑一样通过理解和模拟世界来制定计划、想象新体验。 AI  Mode 是谷歌搜索的未来 作为谷歌最核心的业务之一,谷歌搜索的每次迭代都会引发行业关注。 谷歌表示, Gemini 模型正在帮助谷歌搜索变得更加智能、代理化和个性化。 自去年推出以来,AI 概览已覆盖超过 15 亿用户,并覆盖 200 个国家和地区。随着人们使用 AI 概览,谷歌发现他们对搜索结果更加满意,搜索频率也更高。在美国和印度等谷歌最大的市场,AI 概览推动了查询类型增长超过 10%,并且这种增长速度会随着时间的推移而持续增长。 皮查伊称,这是过去十年来搜索领域最成功的产品之一。 如今,对于想要体验端到端 AI 搜索的用户,谷歌推出了全新的 AI 模式。它彻底重塑了搜索体验。凭借更先进的推理能力,用户可以在 AI 模式下提出更长、更复杂的查询。 事实上,早期测试人员提出的查询长度是传统搜索长度的两到三倍,并且用户还可以通过后续问题进行更深入的探索。所有这些功能都可以在搜索的新标签页中直接使用。 皮查伊称:“我一直在频繁使用 Google 搜索,它彻底改变了我使用 Google 搜索的方式。我很高兴地告诉大家,AI 模式将于今天在美国面向所有用户推出。借助我们最新的 Gemini 模型,我们的 AI 响应不仅达到了您对 Google 搜索所期望的质量和准确性,而且是业内最快的。从本周开始,Gemini 2.5 也将在美国 Google 搜索中推出。” 亮相视频模型 Veo 3 在多模态方面,谷歌表示即将推出最新的先进视频模型 Veo 3,它现已具备原生音频生成功能。谷歌还将推出 Imagen 4,这是谷歌最新、功能最强大的图像生成模型。这两款模型均可在 Gemini 应用程序中使用,开启一个全新的创意世界。 谷歌通过一款名为 Flow 的新工具将这些可能性带给了电影制作人。用户可以创建电影剪辑,并将短片扩展为更长的场景。 提示词:一只睿智的老猫头鹰在高空翱翔,透过森林上方月光下的云层窥视。这只睿智的老猫头鹰小心翼翼地绕着空地盘旋,环顾着森林的地面。片刻之后,它俯冲到月光下的小路上,停在一只獾旁边。音频: 翅膀拍打声、鸟鸣声、响亮而悦耳的风沙声,以及断断续续的嗡嗡声、树枝在脚下折断的声音和呱呱的叫声。这是一段轻快的管弦乐,木管乐器贯穿始终,节奏欢快乐观,充满天真无邪的好奇心。 一只睿智的老猫头鹰和一只紧张的獾坐在月光下的林间小路上。“它们今天留下了一个一个'球’。它弹得比我跳得还高。”獾结结巴巴地说道,努力想理解这句话的意思“这是什么魔法?"猫头鹰若有所思地鸣叫着。音频: 猫头鹰的鸣叫声,獾紧张的鸣叫声,树叶的沙沙声,蟋蟀的鸣叫声。 一只睿智的老猫头鹰飞出了画框,一只紧张的小獾朝另一个方向跑了出去。背景中,一只松鼠匆匆而过,发出刮擦干枯秋叶的沙沙声。音频: 鸟鸣声、响亮的落沙沙声,以及断断续续的嗡嗡声、树枝在脚下折断的声音,还有松鼠在干枯的落叶间穿梭的声音。远处传来猫头鹰的鸣叫声、獾紧张的鸣叫声、树叶的沙沙声、蟋蟀的鸣叫声,这些声音充满了天真好奇的气息。 编码助手 Jules 开始公测 在发布会上,谷歌宣布 Jules 正式进入公测阶段,全球开发者可直接进行体验。 Jules 是一款异步代理式编码助手,可直接与开发者现有的代码库集成。它会将开发者的代码库克隆到安全的 Google Cloud 虚拟机 (VM) 中,了解项目的完整上下文,并执行以下任务:编写测试、构建新功能、提供音频更新日志、bug 修复、改变依赖版本。 Jules 异步运行,让开发者在它在后台运行时能专注于其他任务。完成后,它会展示其计划、推理过程以及所做更改的差异。Jules 默认为私有,它不会使用用户的私有代码进行训练,并且用户的数据在执行环境中保持隔离。 Jules 使用 Gemini 2.5 Pro,使其能够使用当今最先进的一些编码推理技术。结合其云虚拟机系统,它可以快速、精确地处理复杂的多文件更改和并发任务。 具体而言,Jules 能干什么? 适用于真实代码库:Jules 无需沙盒。它能够利用现有项目的完整上下文,智能地推断变更。 并行执行:任务在云虚拟机内部运行,实现并发执行。它可以同时处理多个请求。 可见的工作流程: Jules 在进行更改之前向您展示其计划和理由。 GitHub 集成:Jules 可直接在用户的 GitHub 工作流程中工作。无需上下文切换,也无需额外设置。 用户可控性:在执行之前、执行期间和执行之后修改所呈现的计划,以保持对代码的控制。 音频摘要: Jules 提供最近提交的音频变更日志,将您的项目历史记录转变为您可以收听的上下文变更日志。 Astra 项目,谷歌通用 AI 助手的雏形 去年的谷歌 I/O 开发者大会上,最有趣的演示之一是 Project Astra,它是多模态人工智能的早期版本,可以实时识别周围环境并以对话方式回答相关问题。虽然该演示让我们得以一窥谷歌打造更强大人工智能助手的计划,但该公司谨慎地指出,我们看到的只是“研究预览”。 然而,一年后,谷歌却规划了 Astra 项目的愿景,希望未来能为 Gemini 的某个版本提供动力,使其成为一个“通用 AI 助手”。为了实现这一目标,Astra 项目进行了一些重要的升级。谷歌一直在升级 Astra 的内存——我们去年看到的版本每次只能“记忆” 30 秒——并增加了计算机控制功能,使 Astra 现在可以执行更复杂的任务。 这款多模态、全视角的机器人并非真正的消费级产品,除了一小部分测试人员之外,短期内不会向任何人开放。Astra 代表着 Google 对未来人工智能如何为人类服务的最宏大、最狂野、最雄心勃勃的梦想。Google DeepMind 研究总监 Greg Wayne 表示,他认为 Astra 是“通用人工智能助手的概念车”。 最终,Astra 中可用的功能会移植到 Gemini 和其他应用中。这其中已经包含了团队在语音输出、内存以及一些基本的计算机使用功能方面的工作。随着这些功能逐渐成为主流,Astra 团队找到了新的工作方向。 Project Aura 智能眼镜又回来了 再来看看硬件方面。谷歌智能眼镜时代似乎又回来了。今天,谷歌和 Xreal 在大会上宣布建立战略合作伙伴关系,共同开发一款名为 Project Aura 的全新 Android XR 设备。 这是自去年 12 月 Android XR 平台发布以来,官方正式推出的第二款设备。第一款是 三星的 Project Moohan,但这是一款更类似于 Apple Vision Pro 的 XR 头显。而 Project Aura 则与 Xreal 的其他产品保持着密切联系。技术上准确的术语应该是“光学透视 XR”设备。更通俗地说,它是一副沉浸式智能眼镜。 Xreal 的眼镜,比如 Xreal One,就像在一副普通的太阳镜里嵌入了两台迷你电视,看起来略显笨重。Xreal 之前的眼镜可以连接手机或笔记本电脑,查看屏幕上的内容,无论是正在播放的节目,还是想在飞机上编辑的机密文件。它的优点在于,用户可以调整不透明度来查看(或遮挡)周围的世界。Project Aura 也秉持着同样的理念。 但谷歌并没有在发布会上透露出更多关于这款硬件的信息。Xreal 发言人 Ralph Jodice 表示,将在下个月的增强现实世界博览会上放出更多信息。一些已知的信息显示,它将内置 Gemini,并拥有更大的视野。在产品渲染图中,我们可以看到铰链和鼻梁架上的摄像头,以及镜腿上的麦克风和按钮。 这暗示着与 Xreal 现有设备相比,硬件将迎来升级。Project Aura 将搭载针对 XR 优化的高通芯片组。与 Project Moohan 一样,Project Aura 也希望开发者现在就开始构建应用程序和用例,以便在实际消费产品发布之前完成。说到这一点,谷歌和 Xreal 在一份新闻稿中表示,为头显开发的 Android XR 应用程序可以轻松移植到像 Project Aura 这样的其他设备。 有趣的是,谷歌对下一个智能眼镜时代的策略与其最初推出 Wear OS 时类似——谷歌提供平台,第三方负责硬件。虽然细节很少,但这将是在 Android XR 平台上推出的第二款官方设备。
抢跑GPT-5!Google 发布最强 AI 全家桶,史上最贵 AI 会员定价 1800 元/月
去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙击。 今年攻守之势异也。 前几天 OpenAI 透露 GPT-5 将 All in One,集成各种产品。刚刚,Google 就把这个思路贯彻到 I/O 大会,直接掏出了自家有史以来最强的 AI 全家桶。 从发布 Gemini 2.5 Pro 与 Flash 两款模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向开发者与创作者的 AI 套件等,Google 几乎把从模型到产品的路径都压缩到一场发布会里。 更准确地说,当下最火的 AI 应用场景,都被 Google「预埋」进了产品接口里,让人意识到它仍是全球最具工程实力和生态整合能力的 AI 巨头之一。 也难怪许多网友调侃,将近两个小时的发布会过后,又将有一大批初创公司死于 Google 之手。 不过,也不难看出,发布会上有一些功能仍停留在「预告片」和小范围测试阶段,距离真正的落地或许还有不小的距离。 帮我「买票 + 找座 + 填表」一口气搞定,Google 新 AI 搜索卷疯了 AI 正在重写搜索这件事的底层逻辑。 在去年的 I/O 大会上,Google 推出了 AI 概览(AI Overviews)功能,至今已拥有超过 15 亿的月活跃用户。 生成式 AI 逐渐改变了人们的搜索方式,但随之而来的却是,我们不再满足于在搜索框里输入简单的问题,而是抛出更复杂、更长、更具多模态的提问。 今天,Google 再次加码搜索与 AI 的融合,推出一种端到端的 AI 搜索体验——AI Mode。 正如 Google CEO 桑达尔·皮查伊介绍的那样,这是 Google 有史以来最强大的 AI 搜索形态,不仅具备更先进的推理能力和多模态理解能力,还支持通过上下文追问和网页链接进行深度探索。 例如,当用户面对一个需要复杂解读的搜索问题,AI Mode 可启动「深度搜索」机制,不同信息之间进行推理,并在几分钟内生成一份专家级的引用报告,为你节省数小时的研究时间。 与此同时,Google 也将 Project Astra 的多模态能力接入搜索,进一步提升搜索的实时交互性。通过 Search Live 功能,用户只需打开摄像头,即可通过画面实时提问并获得反馈。 今年是 Agent 元年,Google 也很贴心地推出了 Project Mariner Agent 功能,能帮助用户更高效地完成任务。 例如,只需一句「帮我找两个这个周六比赛的实惠票,位于下层座位」,AI Mode 便能自动跨多个票务平台检索选项,实时比较价格和库存,并完成表单填写等繁琐操作,大幅提升效率。 借助 Gemini 模型和 Google 购物图谱的强大支持,Google AI Mode 能够帮助你缩小商品范围并提供灵感。如果你想看看衣服穿在自己身上的效果,只需要上传一张自己的照片,就能实现虚拟试穿衣服。 此外,AI Mode 也具备强大的个性化能力,能根据用户上下文偏好给出定制化建议,还可生成图表和可视化结果,尤其在体育和金融类搜索中表现出色。 该功能今日起已在美国全面上线,未来将推广至更多地区。 会写代码、还省 Tokens,Gemini 2.5 拿到「学霸」人设 在模型能力方面,Google 此次发布了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上独占鳌头。 现在,Gemini 2.5 Pro 引入了名为「Deep Think」的推理增强模式。这项功能可在生成答案前考虑多个假设,从而更深入地理解问题背景。 2.5 Pro Deep Think 在 2025 年美国数学奥林匹克(USAMO)以及 LiveCodeBench(编程基准)排名领先,并在 MMMU(测试多模态推理)中获得了 84.0% 的分数。 不过,Google 表示,将会花更多时间进行前沿安全评估,并征求安全专家的进一步意见。作为第一步,Deep Think 功能目前将通过 Gemini API 向小范围测试者开放。 同样得到升级的还有注重效率的 Gemini 2.5 Flash。 新版 2.5 Flash 在推理、多模态、代码和长上下文等关键基准上都有了改进,同时在效率上更高,评估中使用的 tokens 减少了 20% 至 30%。 2.5 Flash 现已在 Gemini 应用程序中向所有人开放,并将在 6 月初通过 Google AI Studio 面向开发者和 Vertex AI 向企业全面发布。 开发者体验上,2.5 Pro 和 2.5 Flash 将在 Gemini API 和 Vertex AI 中引入了「思维摘要」功能,可将模型的推理路径以标题、关键信息和调用工具等方式进行结构化呈现。 开发者也将从中受益,Google 宣布在 Gemini API 和 SDK 中正式支持 MCP 工具,让开发者可以轻松接入更多开源工具和插件生态。 音乐、电影、图像全套上线,Google 把 AI 玩出了花 本次发布会,Google 带来了新一代图像和视频模型——Veo 3 和 Imagen 4。 与传统视频生成不同,Veo 3 是一款支持音频的视频生成模型,能在城市街景中模拟交通、鸟鸣,甚至角色对话,显著提升沉浸感。 该模型不仅在文本和图像提示的基础上生成视频,还能精确实现物理环境与口型同步,极大提升了视频创作的真实感。 目前,Veo 3 已在 Gemini 应用和 Flow 平台上向 Ultra 订阅用户开放,并已在 Vertex AI 平台上为企业用户提供支持。 上文提到的 Flow 正是 Google 为创作者打造的一款 AI 电影制作工具。 用户只需用自然语言描述电影场景,即可管理演员、地点、道具和风格,自动生成叙事片段。Flow 已在美国向 Gemini Pro 和 Ultra 用户开放,全球范围的推广也在推进中。 在图像生成方面,新版 Imagen 4 提升了精度与速度,细节表现上可逼真展现织物、水滴与动物毛发,同时也能生成偏抽象类型的风格。 它支持 2K 分辨率和多种长宽比生成,在排版和拼写方面也有显著优化,适合制作贺卡、海报甚至漫画。 Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上线,据悉,未来还将推出速度快十倍的版本。 在音乐创作方面,Google 扩大了 Lyria 2 驱动的 Music AI Sandbox 的访问权限,并上线了互动式音乐生成模型 Lyria RealTime。该模型现已通过 API 和 AI Studio 向开发者开放。 考虑到由 Veo 3、Imagen 4 和 Lyria 2 生成的内容将继续带有 SynthID 水印,Google 发布了全新的 SynthID Detector。 用户只需上传文件,即可识别其中是否包含 SynthID 水印,用于防伪和追踪 AI 内容来源。 Google 要造「世界模型」,连任务都能帮你做了? Google 希望将 Gemini 打造成一个「世界模型」,既能计划、理解,也能模拟现实世界的各个方面。 Google DeepMind CEO Demis Hassabis 表示,这一方向正是 Project Astra 的核心理念之一。 过去一年里,Google 已将视频理解、屏幕共享、记忆功能等逐步集成进 Gemini Live。如今,Gemini 新的语音输出加入了原生音频,更加自然;记忆与 computer use 能力也同步增强。 此外,Google 还在探索如何利用 Agent 能力帮助人们处理多任务。 Project Mariner 就是其中之一,能够同时完成最多十项任务,比如信息查询、预订、购物与调研。已面向美国 Ultra 用户开放,并即将集成至 Gemini API 与其他核心产品中。 AI 新功能扎堆发布,会诞生真正的杀手锏吗 NotebookLM 官方昨日宣布,上线 24 小时就已经成为 App Store 中排名第 2 的生产力应用和第 9 的整体应用。 作为 Google 在 AI 笔记工具上的一次重要探索,NotebookLM 提供音频概览和思维导图等功能。 其中,音频概览目前已支持超过 80 种语言,而本周,Google 也宣布将为这一功能引入更高的可定制性,用户可根据需要选择摘要的长度,无论是快速浏览还是深入阅读都不在话下。 这项功能首先将在英语中推出,随后将扩展到更多语言。 与此同时,Google 也在回应用户对视觉呈现的诉求,即将在 NotebookLM 中加入视频概览功能,用户只需一键即可将笔记内容转化为教育类视频,用更直观的方式传递信息。 在 AI 编程领域,Google还带来了 Jules 的最新进展。 这个最初出现在 Google Labs 的自主编码助手,能够理解代码并自主完成诸如编写测试、构建功能和修复 Bug 等开发任务,如今已经正式进入公开 Beta 测试阶段。 此外,Google 还推出了全新的订阅服务 Google AI Ultra。 该计划为专业用户提供 Google 最强大模型和高级功能的无限制访问,适合电影制作人、开发者、创意工作者等专业人士,月费为 249.99 美元。 目前,该计划已经在美国上线,并将很快扩展至其他国家。 实际上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一个能嵌入日常生活、真正打进主流用户心智的「杀手级产品」。 Google 当然明白这个道理,也正全力以赴寻找答案。 因此,我们看到,在这次的发布会上,Google 几乎什么都做了,也什么都提了:从文本、图像、视频、音乐,到搜索、Agent、创作工具,一应俱全。 牌已经亮完,技术也到位,现在,Google 只差一记真正击中用户痛点的落子。
胡塞武装称对以海法港实施海上封锁 释放怎样的信号?
  也门胡塞武装19日发表声明称,决定对以色列海法港实施海上封锁。   胡塞武装对以色列海法港实施海上封锁,释放怎样的信号?继埃拉特港口之后,胡塞武装再次封锁以色列重要港口,胡塞武装的实力究竟如何?   胡塞武装与加沙局势联动 对以方施压升级    总台新闻观察员 王昆鹏:也门胡塞武装正在通过不断对以色列重要目标实施袭击来向以方施压。这次是更加深入以色列北部的海法港,胡塞武装和以色列之间的冲突,实际上与加沙局势是密切相关的。自从以色列3月开始持续围困加沙地带并重启大规模军事行动以来,胡塞武装也恢复了对以色列相关目标的袭击。从胡塞武装的最新表态来看,也是点名了对海法港实施海上封锁,是对以军近期升级军事行动以及对加沙长期封锁的回应。   此外,胡塞武装挑选海法港也有回应以军近期空袭胡塞武装控制区多个港口、打击该武装燃料等关键物资运输的意味。由于巴以局势紧张以及胡塞武装的袭击,以色列南部的埃拉特港运行已经受到了影响,甚至一度停滞。如果其北部相对安全的海法港也因为袭击的威胁而时常中断,那么对于以色列的贸易、经济和能源,也将带来现实的影响。从这个意义上来讲,胡塞武装是通过真实袭击和封锁威胁来对以色列进行针锋相对的施压。   胡塞武装高超音速导弹或突破以军防御   总台新闻观察员 王昆鹏:也门胡塞武装对以色列的袭击主要是通过导弹和无人机来实现的。早在2023年的10月31日,胡塞武装就首次公开宣布对以色列发动导弹和无人机的跨境袭击。当时最早触发警报的就是港口城市埃拉特。目前来看,胡塞武装发动的高超音速导弹袭击,以军并不能完全拦截。近期以色列中部的本·古里安国际机场就是一个双方集中展开攻防的地点,5月4日的袭击就造成了多人受伤,机场也一度关闭。当然对于海法港口来说,由于其位置距离也门更远,以色列的防空系统能够有相对更多的时间进行预警和拦截。今年1月初,胡塞武装曾向海法附近的一座发电站发射了一枚高超音速导弹,以军表示他们在导弹进入领土前进行了拦截。但是考虑到美国和胡塞武装近期在红海区域达成了停火协议,实际上就造成了以前美军能够在红海帮助以色列拦截的胡塞武装的导弹,现在都要由以方来负担。那么如果胡塞武装持续提升高超音速导弹的袭击力度,不能排除海法港被击中的可能。
习近平在河南考察时强调 坚定信心推动高质量发展高效能治理 奋力谱写中原大地推进中国式现代化新篇章
   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察。   中共中央总书记、国家主席、中央军委主席习近平近日在河南考察时强调,新时代新征程,河南要认真落实党中央关于中部地区加快崛起、黄河流域生态保护和高质量发展等战略部署,坚持稳中求进工作总基调,全面深化改革开放,着力建设现代化产业体系和农业强省,着力改善民生、加强社会治理,着力加强生态环境保护,着力推动文化繁荣兴盛,以高质量发展和高效能治理奋力谱写中原大地推进中国式现代化新篇章。   5月19日至20日,习近平在河南省委书记刘宁和省长王凯陪同下,先后到洛阳、郑州考察调研。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察时,同企业职工亲切交流。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察时,同企业职工亲切交流。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳轴承集团股份有限公司智能工厂考察时,同企业职工在一起。   19日下午,习近平首先来到洛阳轴承集团股份有限公司考察。该公司前身为“一五”期间建成的洛阳轴承厂。在智能工厂,习近平了解企业发展历程,听取不同类型轴承产品用途和性能介绍,走近生产线察看生产流程。他对围拢过来的企业职工说,制造业是国民经济的重要支柱,推进中国式现代化必须保持制造业合理比重。现代制造业离不开科技赋能,要大力加强技术攻关,走自主创新的发展路子。他勉励职工发扬主人翁精神,在企业发展中奋发有为、多作贡献。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳白马寺考察。   随后,习近平来到始建于东汉年间的白马寺考察,详细了解佛教中国化和寺院文物保护情况。他指出,白马寺见证了佛教传入、发展并不断中国化的进程。历史证明,坚持我国宗教中国化方向是完全正确的,要积极引导宗教同中华优秀传统文化相融合、与社会主义社会相适应。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳龙门石窟考察时,同游客亲切交流。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳龙门石窟考察。   5月19日至20日,中共中央总书记、国家主席、中央军委主席习近平在河南考察。这是19日下午,习近平在洛阳龙门石窟考察时,同游客亲切交流。   已有1500多年历史的龙门石窟,是重要的世界文化遗产。习近平来到这里,察看石窟整体布局风貌和代表性窟龛、造像,同现场的文物保护工作者亲切交流。他强调,要把这些中华文化瑰宝保护好、传承好、传播好。游客们见到总书记,都十分欣喜,纷纷向总书记问好。习近平不时同大家交流,特别鼓励小朋友们多到实地寻溯中华文化,从小树立文化自信。他指出,文旅融合前景广阔,要推动文旅产业高质量发展,真正打造成为支柱产业、民生产业、幸福产业。   20日上午,习近平听取河南省委和省政府工作汇报,对河南各方面取得的成绩给予肯定,对下一步工作提出要求。   习近平指出,高质量发展是中国式现代化的必然要求。面对复杂的外部环境,要坚定信心,坚定不移办好自己的事,坚定不移扩大高水平对外开放,着力稳就业、稳企业、稳市场、稳预期,以高质量发展的确定性应对各种不确定性。河南作为经济大省,要进一步夯实实体经济这个根基,以科技创新为引领,因地制宜发展新质生产力,提升现代化产业体系对高质量发展的支撑能力。要加强耕地保护和建设,扛牢粮食安全责任,延伸现代农业产业链条,以城乡融合发展带动乡村全面振兴,促进城乡共同富裕。要持之以恒加强重点流域生态保护治理,深化污染防治攻坚,筑牢生态安全屏障。   习近平强调,河南人口总量、人口密度、人口流动量都比较大,社会问题复杂多样,必须扎扎实实加强社会治理。要全面落实党的领导,健全社会治理体制机制,加强新经济组织、新社会组织、新就业群体党建工作。要更好凝聚服务群众,健全群众利益协调机制,提高公共服务水平,用心用情解决群众急难愁盼问题。要突出抓基层、强基础、固根本,推动资源、服务、管理下沉,确保社会治理各项工作纵向到底、横向到边。要高度重视法治和诚信建设,发挥好法治对社会治理的规范和保障作用,加强诚实守信的价值引导,提高政府诚信、企业诚信、社会诚信水平。要盯牢风险隐患排查和治理,强化社会治安整体防控,有效防范化解重点领域风险,切实维护社会和谐稳定。各级领导干部要主动作为,善于从推进社会治理中总结新形势下党的群众工作规律,针对不同社会群体的特点把工作做细做实。要切实整治形式主义为基层减负,支持基层干部大胆干事、树立威信,支持群众依靠自身力量解决社会治理中的问题。   习近平指出,中央八项规定是党中央徙木立信之举,是新时代管党治党的标志性措施。开展深入贯彻中央八项规定精神学习教育,是今年党建工作的重点任务。要在一体推进学查改上下功夫,把党员干部个人查摆整改与组织查摆整改紧密结合起来,切实把作风硬要求变成硬措施、让铁规矩长出铁牙齿,确保学有质量、查有力度、改有成效。学习教育中央指导组要认真履职尽责,把工作重点放到推动解决问题上,精准指导、务求实效。   习近平强调,今年以来,我国一些地区出现旱情,有的还在持续,相关部门要密切配合,加强用水调度,确保城乡居民供水和农业灌溉需求。有旱就可能有涝,要严防旱涝急转。汛期已经到来,各地对防汛抗洪务必精心准备,确保预案充分、应对从容。容易突发山洪、泥石流等自然灾害的地区,要全面落实应急处置责任。   何立峰及中央和国家机关有关部门负责同志陪同考察,深入贯彻中央八项规定精神学习教育中央第二指导组负责同志参加汇报会。
深观察丨外资“倒流” 美滥施关税事与愿违
  “这就像在雾中开车:突然大雾降临,于是你不得不放慢车速。如果雾气太重,你还可能会把车停到路边并打开双闪灯。我们现在就感觉有点身处类似的境地。”   在美国商务部日前举办的“选择美国峰会”上,北卡罗来纳州商务部长李·利里如此形容海外企业对该州投资的不畅。   “选择美国峰会”是一个旨在促进外国在美投资的年度会议。然而与往年相比,今年的会议气氛要沉闷许多。   美国政府一直宣称,加征关税将为美国吸引数万亿美元的外国投资。但据美国《政治报》报道,来自美国多个州的政府官员和议员都抱怨说,白宫关税政策引发的不确定性正在阻碍外资进入美国市场。 美国《政治报》报道截图 “我知道企业最需要什么”   可以说,本届美国政府自上台以来,为了推进其关税政策已经用尽话术。其中之一就是高关税有助于迫使外国企业和跨国公司将生产线迁至美国,通过加大对美投资实现美国的制造业复兴和就业岗位井喷。   但事与愿违的是,这幅理想图景并未出现。   《政治报》的报道提到,在关税政策深陷争议的情况下,美国政府当前非常渴望对外展示“美国经济增长”的迹象,以至于一些公司只要口头表示“考虑增加在美国的产能”就能得到白宫的赞赏。但现实却是,许多白宫吹嘘的企业投资计划要么已经筹备多年,要么被人为夸大,不少还可能在未来生变。   举例来说,尽管白宫近期高调宣扬本田和斯泰兰蒂斯等车企表示会将生产线转移至美国,但美国劳工统计局的数据显示,目前美国汽车制造业提供的工作岗位反而比去年减少了20.8%。   其他行业也在关注美国国内的经济和政治气候。例如,尽管罗氏制药公司承诺对美投资500亿美元,但在白宫发布一项旨在降低药品价格的行政命令后,该公司开始重新评估此前的承诺。 美国《政治报》新闻网报道截图   目前的经济形势让美国两党议员都感到不安。   威斯康星州共和党籍联邦参议员罗恩·约翰逊就表示,他非常担心关税政策的不确定性会影响他所在的州。   “我从本州的企业、制造商以及全美制造商协会和商业圆桌会议那里听到的消息是,许多外商原定的投资计划已经被搁置。我本人来自私营企业,我知道企业最需要的就是尽可能多的确定性和稳定性。” 美国《政治报》报道截图 “捍卫欧洲的最佳方式就是采取攻势”   美国发生的一切,也被正与美就关税展开博弈的西方贸易伙伴看在眼里。   法国投资总秘书处秘书长博内尔日前表示,美国关税政策造成的不确定性最终将拖累全球对美投资,事实上法国对美投资“已经降温不少”。   与此同时,欧洲正凭借自身相对于美国的一系列优势努力吸引外来投资。   法国经济与财政部部长隆巴尔日前强调,欧洲政治和监管稳定,拥有相当健全的法治体系。其言下之意,就是欧洲在吸引外资方面胜过美国。 法国兴业银行网站报道截图(题图为隆巴尔)   欧洲央行行长拉加德日前接受采访时也表示,近期欧元对美元走强看似有悖直觉,其实源于金融市场对美国失去了信心。这是美国反复无常的关税等政策造成的,“对欧洲来说是一个机遇”。   “我们看到美国的法治和贸易规则受到挑战,不确定性持续存在。欧洲则被视为一个稳定的经济和政治区域,拥有稳健的货币和独立的央行。”   她还补充说,如果欧盟和美国的关税谈判失败,欧盟需要有强有力的应对措施。 欧洲央行官网截图   事实上,面对美国的多重关税,欧洲早已开始未雨绸缪。除了先后公布两份对美反制商品清单、加速推进与亚洲的自由贸易协定谈判等,欧盟还计划通过简化从汽车到航空等多领域的监管流程,与美国争夺投资者。   用欧盟委员会执行副主席塞茹尔内的话说,“捍卫欧洲的最佳方式就是采取攻势”。 塞茹尔内(资料图) “关税改变了全球投资者对美国经济的看法”   和欧洲一样,日本也在紧张应对美国的关税乱拳。   日本政府最初把率先与美展开关税谈判并达成协议作为优先事项,但迄今两轮谈完,尚未取得任何进展。   日美双方拟于本月在加拿大举行的七国集团(G7)财长与央行行长会议后进行第三轮关税谈判。不过,日本政府此前已多次表示,不会在谈判中作出有损国家利益的让步。   另据报道,考虑到日本是美国最大海外投资来源国,日方除考虑进一步对美开放市场等让步条件外,早期谈判方案中还包括将美国对日商品关税减免的百分点与日本企业在美投资水平挂钩。 《金融时报》报道截图   值得注意的是,在日本对美投资可能被“吓退”的同时,“逃离”美国的资金正大量涌向日本。   最新数据显示,在刚刚过去的4月,海外投资者共购买了价值高达8.21万亿日元(约合566亿美元)的日本股票和长期债券。市场服务机构美国晨星公司称,这是日本财务省1996年开始收集此项数据以来的外资最大月度净流入。   有美媒指出,虽然这一创纪录的月度外资流入与4月美国政府宣布加征“对等关税”有关,但市场观察人士仍看好日本资产前景,相信未来一段时间外资流入仍将保持强劲势头。   用野村证券外汇策略主管后藤雄二郎的话说,“关税改变了全球投资者对美国经济和资产表现的看法,从而让他们转向包括日本在内的其他主要市场”。 美国消费者新闻与商业频道报道截图
为俄乌一日三通电话 特朗普耳朵成“关键战场”?
  19日,美国总统特朗普与俄罗斯总统普京、乌克兰总统泽连斯基分别通电话,就俄乌停火谈判等问题进行沟通。其中,泽连斯基与特朗普通话两次,一次是一对一,另一次通话还叫上了部分欧洲领导人。   美国有线电视新闻网19日就此发表了一篇文章,标题是“特朗普的耳朵是俄乌冲突的新前线。”   文章说,俄乌冲突已持续超过三年,如何说服美国总统特朗普已成为俄乌以及欧洲争斗的“关键战场”。   一天三通电话 俄乌距离停火还有多远?    19日,美国总统特朗普与俄罗斯总统普京、乌克兰总统泽连斯基分别通电话,就俄乌停火谈判等问题进行沟通。其中,泽连斯基与特朗普通话两次,一次是一对一,另一次通话还叫上了部分欧洲领导人。这样密集的电话斡旋都谈了些什么?效果怎么样呢? 01 各说各话有哪些?   俄方:应消除冲突根源 找到折中方案   俄罗斯总统普京说,对俄方最重要的是“消除危机根源”,即北约东扩对俄罗斯安全构成的威胁;俄方赞成和平解决乌克兰危机,但应该确定更有效实现和平的方式。   俄罗斯总统 普京:问题在于,俄罗斯和乌克兰方面均应最大程度体现对和平的努力,并且找到让各方都满意的折中方案。   乌方:三点诉求 领土妥协与撤军“免谈”   乌克兰总统泽连斯基在两次通话后的简报会上表示,他在与特朗普的第一次通话中强调了三点关键诉求:   必须实现停火;   对俄罗斯实施制裁;   以及美国“不能在没有乌克兰参与的情况下对与乌克兰相关事宜做出任何决定”。   泽连斯基强调,乌方不会在领土问题上妥协,不会从其领土撤军。   乌克兰总统 泽连斯基:没人能从我们的领土上撤出我们的军队。保护乌克兰主权和领土完整是我的宪法职责,也是我们军队的职责。   打完三通电话后, 特朗普称,俄罗斯和乌克兰将立即启动谈判,以实现停火。 02 俄乌各执一词 话里话外有交集么?   目前,俄乌各自表态,同意就围绕两国可能达成的和平协议研究起草备忘录。   俄罗斯总统 普京:这一备忘录应该包含若干条款,比如解决危机的原则、可能达成和平协议的时间表,以及在达成相关协议的情况下临时停火。   乌克兰总统 泽连斯基:一旦我们收到俄方的备忘录或提议,我们也会根据我们的看法相应地拟定乌方版本的备忘录。   备忘录、继续谈 分歧中存少量交集   另据俄总统新闻秘书佩斯科夫20日透露,俄乌围绕两国可能达成的和平协议起草备忘录时将面临“重重困难”,因此不会设定“最后期限”。   俄乌都表示将继续接触和谈判。普京称,在土耳其伊斯坦布尔谈判的俄乌双方代表之间联系已经恢复,这表明俄乌“总的来说走在了正确道路上”。泽连斯基则在社交媒体上表示,乌方已准备好“以任何能产生结果的形式”与俄罗斯进行直接谈判。 03 接下来会发生什么?   泽连斯基:考虑举行多方高级别会议   泽连斯基表示,乌克兰正在考虑举行一次由美国、乌克兰、俄罗斯以及欧盟国家和英国参与的高级别会议,以结束冲突。他认为,美国和欧洲的代表应在“一定程度”上参与谈判过程。   乌沙科夫:俄美总统通话未就停火协议设时间表   俄总统助理尤里·乌沙科夫说,俄美总统没有就俄乌可能达成的停火协议设定具体时间框架,也没有商定俄美元首会晤的时间和地点。   美媒:特朗普的耳朵成“关键战场”   美国有线电视新闻网19日发表了一篇文章,标题是“特朗普的耳朵是俄乌冲突的新前线。”文章说,俄乌冲突已持续超过三年,如何说服美国总统特朗普已成为俄乌以及欧洲争斗的“关键战场”。而特朗普近期刚表示过,对协调俄乌停战无果而感到沮丧。    文章称,俄罗斯和乌克兰方面都试图向美国证明,对方才是和平的真正障碍,并希望至少在一段时间内令美国表态和立场向己方倾斜。俄方希望避免美方加大对乌克兰的支持,而乌方最大的担忧则是美俄两国领导人在没有乌克兰的参与下自行确定有利于俄方的和平框架,或是威胁撤回对乌克兰的军事和经济支持。   俄乌的各执一词,令特朗普对斡旋和平的努力感到越来越沮丧,他已多次表示,如果进展不力,美国要退出协调。   美国总统 特朗普:如果出于某些原因,俄乌冲突其中的一方让谈判变得非常困难,我们就不去管了。但愿我们不必这样做。   美国总统 特朗普:我认为俄乌谈判将会取得进展,而如果没有进展,我就会退出。俄乌冲突就将继续下去。   但文章最后也指出,俄罗斯和乌克兰都不愿意接受对方提出的条件,也不愿意作出让步,这可能意味着,即使美国施加压力,即使美国领导人与俄乌领导人直接通话后,俄乌冲突仍可能将继续。   在美国总统特朗普19日与俄罗斯总统普京、乌克兰总统泽连斯基分别通电话后,俄方就通话内容发表了声明。英国天空新闻频道就此称,这意味着美国方面的协调以失败告终。   英国天空新闻频道记者:美国总统特朗普无法以任何其他的方式解读俄方的声明。声明只能说明美国在协调的工作中,在针对这场冲突的外交和管理方面完全失败了。
马斯克确认推出自动驾驶出租车 未来五年继续领导特斯拉
马斯克 凤凰网科技讯 北京时间5月21日,据CNBC报道,特斯拉CEO埃隆·马斯克(Elon Musk)周二确认,该公司将于6月底在得州奥斯汀市的街道上推出自动驾驶出租车。不过,特斯拉全自动驾驶系统(FSD)的安全性问题目前正面临美国监管机构的调查。 马斯克在接受CNBC采访时表示,特斯拉一开始将在奥斯汀部分区域投放约10辆自动驾驶出租车。如果试运行顺利且未发生事故,规模将迅速扩展到数千辆车。 “我们实际上不会在整个奥斯汀地区部署,而只会在最安全的区域进行部署。所以我们会设置地理围栏(只在限定地区)。”马斯克称。在奥斯汀之后,特斯拉将把自动驾驶出租车服务扩大到洛杉矶和旧金山。 对于特斯拉来说,自动驾驶出租车的成功测试至关重要,因为在需求疲软的背景下,马斯克已将公司的重心从打造一款全新、价格更低的电动汽车平台转向推出自动驾驶出租车服务和Optimus人形机器人。特斯拉的估值在很大程度上取决于这一战略押注。 马斯克对CNBC表示:“从长期来看,唯一重要的事情就是自动驾驶和Optimus。” 授权FSD 不过,自动驾驶汽车技术的商业化一直十分困难。严格的监管和巨额投资已迫使许多公司知难而退。Waymo等公司目前仍在推进自动驾驶技术,面临日益严格的审查。 自去年10月以来,美国国家公路交通安全管理局(NHTSA)一直在调查特斯拉FSD在能见度较低路况下发生的碰撞事故。上周,NHTSA要求特斯拉就其付费自动驾驶出租车服务的推出回答相关问题,以评估这些车辆在恶劣天气中的表现。 马斯克表示,特斯拉正在与多家大型汽车制造商就授权FSD系统进行谈判。该系统预计将成为自动驾驶出租车的基础。 继续领导特斯拉 马斯克周二早些时候还表示,他致力于在未来五年内继续领导特斯拉。 “是的,毫无疑问。”马斯克在多哈举行的彭博卡塔尔经济论坛上接受视频采访时称。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
第20届光博会点亮“世界光谷” 6.9万人次体验赛博光谷、人文之美
  原标题:创历史新高!第20届光博会点亮“世界光谷”,6.9万人次体验赛博光谷、人文之美   5月17日,第二十届“中国光谷”国际光电子博览会(以下简称“光博会”)圆满闭幕。近200位国内外专家、超300位知名企业家共聚光谷,共探产业新图景。   本届光博会首次纳入“国际光日”全球系列活动,吸引全球12个国家和地区的390家顶尖企业参展。其中,省外企业264家,占比超过76%,上市公司、专精特新“小巨人”及制造业单项冠军企业达79家,占比达22.9%。   开幕式现场,20个重大招商项目签约,涵盖光通信、集成电路、化合物半导体、新型显示、人工智能等领域,签约总金额195.2亿元,有10个重大技术贸易合作项目签约。加速汇聚全球资源转化为产业链升级的澎湃动力。   为期三天的光博会,接待专业观众6.9万人次,较上一届增长11%,创下历史新高。   如同一场全产业链大秀场   第20届光博会成为国内光电子领域首个深度融入“国际光日”的行业盛会,将中国光电子产业的开放合作推向新高度。开幕式上,东湖高新区与“国际光日”指导委员会签署战略合作备忘录。未来会通过活动联动、公众科普、主题论坛、展览展示及青少年交流活动,实现深化合作、促进跨学科研究等目标。   “光博会院士专家校园科普行”邀请了联合国教科文组织“国际光日”指导委员会主席约瑟夫·尼梅拉,英国皇家工程院院士、剑桥大学原副校长、巴斯大学校长伊恩·怀特,英国物理学会会士、国际光学工程学会会士帕尔塔・班纳吉等国际顶尖学者走进光谷中小学,为青少年种下科技创新的火种。   “在光谷参观了许多高新技术企业,这里的光电子信息产业发展前景很大,值得同学们为之努力,追求梦想。”外国专家们感受到光谷学子对前沿科技的浓厚兴趣,耐心地解答每一个问题,并鼓励他们保持好奇心,勇于探索未知领域。   本届光博会的国际化参展水平再创新高,法国的艾凯尔,美国的海洋光学、安捷伦科技,来自俄罗斯的晶体光学、激光系统等国际巨头首次集体亮相激光与光学展区,与华工科技、锐科激光、逸飞激光、苏州长光华芯、深圳创鑫激光等国内知名企业拿出各自“看家本领”同台竞技。   这让瑞典皇家工程科学院院士、查尔姆斯理工大学的彼得·安德雷克森教授感受颇深。在和国际专家组团探馆后他感叹,光博会“像一场全产业链大秀场”,完整呈现了从基础材料到终端应用的创新闭环。   韩国现代汽车参观团说,中国光谷的激光、通信产业历史悠久,这些年光电技术在新能源智能汽车上有越来越多的应用,“我们希望通过展会找到更多的具有性价比的激光、光通信、智能化的产品和解决方案”。   光博会应成为世界首发的地方   本届光博会成为全球光电子领域前沿技术的“首发首展地”,近400家展商发布的1000多项创新成果中,近百项为“首发首展”,刷新历史纪录。   代表性产品集中发布仪式上,十大产品现场首发立即引来强烈关注。“光博会应该成为世界首发的地方。”国际光学委员会(ICO)副主席、加拿大工程院院士顾波有感而发。   光迅科技发布了全球光模块领域最先进制程的“1.6T单模光模块”,将推动我国在全球AI算力竞赛中抢占技术制高点;国家数字化设计与制造创新中心发布的“吸附式移动加工机器人”,属国内首创面向大型复杂构件的吸附式移动加工机器人,将助力大型复杂构件制造模式变革,解决航空、航海制造“卡脖子”难题。   在展会现场,细分领域技术突破同样亮眼。武汉格蓝若自研高精度设备亮相,精度可以达到一两百个纳米,可应用于生物医疗、光通讯等领域,能在光纤头上打印出黄鹤楼模型,该水平属于世界领先、国内第一梯队。   华工科技展出的复杂曲面六轴激光微孔加工装备,只需2秒钟左右,脉冲激光束就能完成孔径0.3毫米、倾斜角15度的发动机气膜冷却孔加工。九峰山实验室展出藏着氮化镓芯片的AI眼镜,不仅在开会时能“提词”救场,未来还能实现佩戴者眨眼即可定格瞬间。   第三届光电子前沿科技与产业成果专场发布会上,十多项在细分领域国际领先或突破海外封锁的产品集中亮相,涵盖光通信、激光和光电融合等关键领域。   当天,武汉驿路通科技股份有限公司带来的800G/1.6T硅光引擎解决方案、长江电气自主研发的C-Smart第三代人工智能开关柜系列产品、睿创微电子(烟台)有限公司带来的行业首创新型封装技术SWLP等众多成果悉数登台亮相。   专家学者、参展商们纷纷表示,光博会不仅成为国产技术突破的展示窗口,更勾勒出中国光电子产业从基础研究到产业化落地的完整链条。   与中国企业合作成国际嘉宾共识   “你好啊,老朋友!”5月16日,第二十届光博会开幕式现场,武汉华工激光工程有限责任公司总经理邓家科远远看见从海外来的老朋友,快步上前用俄语打招呼。   莫斯科恩耐吉有限公司首席科学家阿列克谢、圣彼得堡激光系统股份有限公司高级工程师安德烈等人热情地跟邓家科握手交流。   国际科技组织俄罗斯激光协会主席科福仕教授在第十八届“中国光谷”国际激光峰会线上致辞时表示,中国光谷在光电子领域的创新生态令人瞩目,俄中在激光技术产业化应用方面合作潜力巨大。第十八届“中国光谷”国际激光峰会,来自白俄罗斯的国际嘉宾还围绕半导体设备入华、光纤传感技术等议题展开需求对接,推动跨国项目落地。   本届光博会吸引了来自美、德、法等10多个国家的33家知名企业参展,俄罗斯、新加坡、马来西亚、埃及等境外采购团还首次规模化参与,定向释放需求清单,助力企业“扬帆出海”。   光博会期间,73位来自冈比亚、马来西亚、巴拿马等国的外宾在光谷企业开放日活动中走进华工激光、锐科激光等光谷领军企业实地考察,对国产光纤激光器全产业链自主化能力给予了高度评价。多位外宾在参观后坦言,与中国企业合作已成为共识。   与光博会同期举办的2025全球孵化器大会,吸引了来自北美、欧洲、亚洲等国家和地区的顶尖孵化机构、前沿科技领军企业、投资机构和知名专家学者到场。   同天,“全球孵化网络助力企业出海发展”“科技金融和场景赋能高质量孵化”等活动上,15家中小企业与行业龙头现场达成出海合作协议,湖北联投东湖高新集团联合达晨财智、深创投等19家头部机构成立“园区孵化基金联盟”,计划重点布局人工智能、量子科技、半导体、生物医药等战略性新兴产业,加速硬科技领域“科技——产业——金融”生态闭环构建。   观众体验“赛博光谷”“人文之美”   本届光博会共设置四大展区,除了传统强势板块激光与光学、光通信展区外,首次创新推出“光+智能终端应用(无人驾控装备、机器人、AI)”融合展区及光电子信息产业成就主题展。   据不完全统计,本届光博会共接待专业观众6.9万人次,创下历史新高。在“光+智能终端应用”融合展区,人形机器人成了全场焦点。黑脑袋、蓝眼睛、黄身体的机器人伸出灵活的机械手臂,悠然自得地打起太极拳,引来阵阵喝彩。   相隔不远的武汉人工智能研究院展台前,大家排着队与虚拟数字人“小初”对话,不少人掏出手机,扫描二维码下载“紫东太初App”。   如何让AI加速走向全民普惠、如何用新技术破解老龄化社会的康养难题、如何在数字时代缩小信息鸿沟……受到中外学界、产业界广泛关注的话题,在光博会现场都能找到答案。   除了高大上的“科技之美”,光博会还带观众领略到“人文之美”。“光谷优品市集”展位一经摆出,就受到热捧。该市集由东湖高新区商务外事局统筹组织,光博会系“外贸优品光谷行”重要一站。左点、益健堂、宁美等产品在海外市场富有潜力的企业亮相优品市集,吸引了众多市民来看稀奇。   参展之余,大家还纷纷打卡独特的“科技+美食”之旅——不仅免费乘坐光谷空轨专列,还能品尝地道的武汉小龙虾。“有这么多前沿科技上的成就,才让我们有机会坐这样高科技的交通工具,非常高兴。”上海理工大学庄松林教授受邀担任中国十大光学产业技术评选活动主席,在大会结束后他和夫人史以珏老师体验“赛博光谷”时赞不绝口。   “追光逐芯”的道路上,光博会深度参与和推动了我国光电子信息领域从跟跑、并跑到领跑的发展历程。经过不懈努力,湖北省以“光芯屏端网”为特色的光电子信息产业规模迈向万亿大关。   面向未来,光博会将继续扮演全球光电子信息产业“连接器”与“加速器”的角色。正如国家制造强国建设战略咨询委员会主任、中国工程院教授周济为“中国光谷”迈向“世界光谷”所建言的,要以超常规目标、超常规决心、超常规举措、超常规努力,建设世界级光电子信息产业集群。(通讯员 张希祉 张隽玮)
解锁博物馆新玩法!2025年国际博物馆日渭南主会场活动精彩纷呈
  5 月16日,2025年国际博物馆日渭南主会场活动在渭南市博物馆举办。此次活动由渭南市文化和旅游局主办,渭南市博物馆承办,文化艺术界专家、省内书画名家、文旅系统工作人员、教育机构代表、文化志愿者等各界人士齐聚一堂,共襄文化盛宴。 签约仪式   在《大道千里——韦江凡绘画捐赠研究展》开展仪式上,嘉宾们分别从与韦江凡先生的交往经历、作品艺术风格及价值、捐赠背后的故事等方面发表讲话。渭南市博物馆副馆长薛大勇详细介绍展览情况。渭南博物馆馆长祖亮向韦江凡先生的小女儿发放捐赠证书。   据了解,韦江凡于 1922年出生于陕西省渭南市澄城县韦庄镇临皋村,早年师从赵望云,后得徐悲鸿提携、亲授。1948年加入中国共产党,毕业于国立北平艺术专科学校并留校任助教,先后任职国立北平艺专、中央美术学院、北京画院。2000年获得北京市人民政府颁发的“从艺五十周年老艺术家”荣誉,2009年获得中国文联颁发的“从事新中国文艺工作六十年”荣誉。韦江凡以画马著称,冯其庸评价“其骏在骨,其秀在神,其韵在墨”。 2016年至2025年,韦江凡子女韦新燕、韦为、韦红燕三次为渭南市博物馆捐赠韦江凡作品和名家作品总计245幅(组),实物86件(套)。    嘉宾参观书画展   活动现场,多项文旅活动集中发布。渭南市文化和旅游局相关同志就渭南市(第二届)旅游商品大赛情况并宣布获奖名单进行介绍,同时发布了“跟着文博游渭南”活动安排,18家博物馆代表上台接受打卡印章;渭南市博物馆副馆长李国栋介绍了利用博物馆资源开展教育教学工作部署。丰荫明德小学代表宣读“走进博物馆”倡议书,渭南市博物馆还与华阴市岳庙街道办事处初级中学、澄城县城关第三小学现场签订教育教学合作协议。 服装设计展演   当日,渭南市博物馆内精彩纷呈,除韦江凡绘画展外,还举办了旅游商品大赛作品展和文创产品展销,开展了文物公益鉴定活动。 服装设计作品展演   而“黄河博彩 渭耀锦裳”服装设计作品动态展演成为本次活动的一大亮点。展演中,先后展示了陕西科技大学设计与艺术学院2025届学生设计的渭南文物元素11个系列50套服装和渭南非遗元素13个系列61套服装,共计110套服装。 服装展演   设计师们以渭南厚重文化遗产为创作源泉,从澄城刺绣的丝缕缠绵到华州皮影的镂空哲思,从潼关泥沙染就的大地色系到青铜纹样的当代解构,设计师们以针为笔、以布为卷,在渭南这片文化厚土上书写着传统工艺的现代转型史诗。(文/图 吴明玲)

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。