行业分类:
加载中...
头条分类:
加载中...
AI误判致美国男子含冤入狱三月 人生坠入“斩杀线”
快科技6月10日消息,一场AI误判,让北卡罗来纳州夏洛特市居民贾利尔・理查德森含冤入狱3个月,人生陷入了“斩杀线”以内。 去年4月,杰克逊维尔市一名男子车辆被盗,警方调取监控录像后,使用名为FACES的区域面部匹配工具进行分析,系统在数据库中匹配出理查德森的照片,显示85%相似度。 尽管他从未去过佛罗里达,与案发现场相距超800公里,警方仍仅凭这一AI结果对其发出逮捕令。 案发时他正在北卡上班,有完整考勤记录,尽管如此,他仍然在北卡罗来纳州被捕,关押33天后引渡至佛州,再关50多天,共近3个月。 理查德森是一名10个孩子的父亲,他表示,警方在指控前并未进行充分核实,而是仅凭AI匹配结果和目击者照片指认就采取行动。 他怀疑种族因素在误认中起到作用:“我想说这是种族歧视,那人说我是留着脏辫、鼻子很大的人,结果他们从一群长相和我完全不一样的人里把我认了出来。” 杰克逊维尔警长办公室(JSO)承认这是该部门第二起类似人工智能AI误识别案例,检察官最终撤回指控,但理查德森的生活已遭受重创。 然而被关押期间,理查德森失去了工作、住所,并被剥夺了部分孩子的监护权,理查森的家人表示,他被捕带来的后果已经摧毁了他们的生活。 “案子虽然撤诉了,但我们却无家可归,他丢了工作,还有健康问题,孩子们分散在不同的房子里,我们失去了车,失去了一切,因为我丈夫没了收入。”他的妻子哭诉道。
Anthropic深夜发布Claude Fable 5/Mythos 5,屠榜所有基准测试
Anthtropic刚刚推出了一款 Mythos 级模型Claude Fable 5,面向所有普通用户开放,今天全面上线 与此同时,针对少数特定合作方,他们还推出了 Claude Mythos 5,它与 Fable 5 采用相同的底层模型,是 Claude Mythos Preview 的升级版,访问权限很快会扩大 Fable(寓言)源自拉丁语 fabula,意为"被讲述之物",与希腊语 mythos 同源。安全护栏是区分这两个模型的核心差异,也是它们拥有不同名称的原因所在,Andrej Karpathy说Fable 5是一次重大飞跃,杰文斯悖论开始显现,软件需求在大幅增长。你可以要求任何东西:解释器、可视化工具、定制应用、把测试套件扩充10倍、自动优化代码、运行大型研究项目并用自定义 HTML 呈现结果 Fable 5 和 Mythos 5 的定价分别为每百万个输入tokens 10 美元和每百万个输出tokens 50 美元,不到 Claude Mythos Preview 价格的一半 到底有多强? Fable 5 在几乎所有测试过的 AI 能力基准上都达到了最先进水平,涵盖软件工程、知识工作、视觉、科学研究等众多领域。 并且任务越长、越复杂,Fable 5 相对其他模型的领先幅度就越大。 编程:把两个月的工作压缩进一天 测试期间,Stripe 反馈说,Fable 5 把原本需要数月的工程工作压缩到了几天之内。 具体来说:在一个有 5000 万行 Ruby 代码的大型代码库里,Fable 5 用一天时间完成了一次全库迁移,而这项工作如果靠人工完成,整个团队需要两个月以上。 在 Cognition 的 FrontierCode 评测上,Fable 5 也拿到了前沿模型中的最高分。这个评测不只看能不能完成编程任务,还要求符合高质量生产代码库的标准,而且 Fable 5 在中等算力消耗下就做到了,token 效率高于以往的 Claude 模型。 知识工作:金融分析接近满分 在 Hebbia 的金融基准测试上(考察高级别推理能力),Fable 5 得分高于所有模型,在基于文档的推理、图表与表格解读、问题解决等方面均有大幅提升。 IMC(国际市场商品公司)表示,Fable 5 在他们的交易分析评测中几乎全部拿到了优秀,包括事实查询、概念推理、根因分析和期望值分析。 视觉:靠截图还原代码,通关宝可梦 视觉能力方面,Fable 5 同样跻身当前最先进水平。 它能从复杂的科学图表中精确提取数据,甚至可以仅凭截图重建一个网页应用的源代码。更值得一提的是,它需要的辅助工具更少了。 此前的 Claude 模型即便配备了额外辅助工具,玩《宝可梦:火红》依然力不从心。而 Fable 5 只依靠原始游戏截图(没有地图、没有导航辅助、没有额外游戏状态信息),就从头到尾通关了这款游戏。 记忆与长文本:持久记忆让表现提升三倍 在长时间运行的任务中,Fable 5 能在数百万 token 的范围内保持专注,并借助自己的笔记不断优化输出。 在卡牌构筑游戏《杀戮尖塔》的测试中,为模型提供持久文件记忆后,Fable 5 的表现提升幅度是 Opus 4.8 的三倍;Fable 到达游戏最终章的频率,也是 Opus 4.8 的三倍。 Claude Fable 5可以从物理第一性原理出发建立太阳系模拟,并以此预测日食 自动播放 Claude Fable 5 自主玩《异星工厂》(Factorio),自己制定策略并建造自动化工厂 自动播放 Claude Fable 5 在浏览器 CAD 编辑器中设计一个完整的可 3D 打印模型,编辑器本身也由 Fable 5 创建,内置了负责建模的 AI 助手 自动播放 Claude Fable 5 用代码写的流体模拟,运动与一首古典音乐 EDM 混音的节拍同步,而这首混音也是 Fable 5 用代码生成的 自动播放 药物设计:速度提升十倍 Mythos 5 专属能力中,最令人震惊的是药物设计。 Anthropic 内部的蛋白质设计专家使用 Mythos 5 后,药物设计流程的部分环节加速了约十倍。在一项测试中,Mythos 5 在配备蛋白质设计和生物信息学工具但无人类协助的情况下,表现与经验丰富的人类专家相当,甚至更好。 它完成了科学家通常需要独立承担的全部工作:选择结合位点、选择和运行蛋白质设计工具、在失败时自主纠错。 研究中涉及的 14 个蛋白质靶点里,有 9 个产生了强有力的候选药物,目前正在进一步研究中。 分子生物学假说:80% 的情况下,科学家更偏向 Mythos Mythos 5 是 Anthropic 第一个能持续产出有新意、令人信服的科学假说的模型。 在与 Opus 级别模型的盲测比较中,Anthropic 的科学家有约 80% 的时间更倾向 Mythos 5 提出的分子生物学假说,部分假说已推进到实验验证阶段。与此同时,Mythos 5 提出的一个关于大肠杆菌蛋白质新机制的假说,已被另一个独立开展同一课题研究的实验室的论文所印证。 基因组学研究:自主工作一周,超越 Science 发文模型 Mythos 5 在超过一周的基本自主工作中开展了原创基因组学研究。 它整合了跨越 138 个动物物种、数百万个细胞的单细胞数据,设计并训练了一个定制机器学习模型,用于识别亲缘关系较远的生物体中承担相同功能的细胞。 仅有高层次人工指导的情况下,Mythos 5 训练出的模型超越了近期发表于《Science》期刊的一个模型,而参数量只有后者的百分之一。相关结果预计将在未来几个月内发表。 对齐表现:与 Opus 4.8 持平 在自动化对齐评估中,Mythos 5 表现出的失准行为(包括欺骗、配合用户滥用模型等)处于较低水平,与 Opus 4.8 相当。由于 Fable 5 与 Mythos 5 是同一个底层模型,Fable 5 的对齐水平也大致相同。 Fable 5 的三重安全护栏 这是A厂一贯的调性,A厂认为发布如此强大的模型伴随着风险,没有安全措施的话,Fable 5 在网络安全等领域的能力可能被滥用,造成严重破坏。 为此,Anthropic 为 Fable 5 设置了三道安全分类器护栏。当某个请求触发护栏时,系统会自动转由 Claude Opus 4.8 来响应(而不是直接拒绝),用户也会被告知发生了转发。目前数据显示,超过 95% 的 Fable 5 会话没有触发任何转发。 第一道护栏:网络安全 Mythos 级别的模型在发现和利用软件漏洞方面表现卓越,并具备完整的"代理式黑客攻击"能力,包括侦察、发现、横向移动等多个攻击环节。Fable 5 的网络安全分类器覆盖了漏洞利用和更广泛的进攻性网络任务。 Anthropic 对分类器进行了大量红队测试,并委托外部机构进行漏洞悬赏测试。超过 1000 小时的测试未发现任何通用越狱方法。外部红队机构在长周期代理任务上也未找到通用越狱,尽管英国 AI 安全研究所在有限的初始测试窗口内取得了一定进展。 一位外部合作伙伴的测试结论是:Fable 5 的有害网络查询防护是所有被测模型中最强的,对 30 种公开越狱技术均不受影响,有害单轮请求的响应率为零。 第二道护栏:生物与化学 Anthropic 过去一直用分类器屏蔽部分生物武器相关问题,但现在他们认为这样做还不够。 原因有两点:一是有理由担忧掌握大量资源的恶意行为者利用模型获取高风险生物研究的帮助;二是模型现在完成真实世界科学任务的能力已经大幅提升。 他们用一个具体案例说明了这种风险:在测试 Mythos 5 辅助设计腺相关病毒(AAV)这一挑战性步骤时(AAV 是基因疗法的重要载体,同样的技术在被滥用时也可能被用于设计危险病毒),Mythos 级模型仅凭生物推理,就超越了专门用于蛋白质任务的专业模型,而 Anthropic 并未专门训练它完成这项任务。 基于这一判断,Fable 5 目前对大多数生物和化学相关请求都会转发给 Opus 4.8。几周内,部分生物医学研究人员和企业将能够通过可信访问计划,使用移除了生物化学护栏的 Mythos 5。 第三道护栏:模型蒸馏 Anthropic 此前发现了大规模提取 Claude 能力用于训练竞争对手模型的行为,被分类器判断为蒸馏尝试的请求,将转发至 Opus 4.8 处理。 还有一项新的数据保留政策 对于 Fable 5、Mythos 5 及未来能力相当或更高的模型,Anthropic 将对所有 Mythos 级别模型的流量强制执行 30 天数据保留。这包括第一方和第三方平台。 这些数据不会用于训练新的 Claude 模型,也不会用于任何非安全目的。Anthropic 实施了新的隐私保护措施,包括记录所有人类访问该数据的行为,并在几乎所有情况下确保数据在 30 天后删除。 保留数据的目的是帮助防范复杂和新型攻击(包括新型越狱和跨多个请求的攻击),以及帮助识别和减少误判。 写在最后 从今天起,所有目前能访问 Claude Mythos Preview 的用户(例如 Project Glasswing 中的网络安全合作伙伴),都可以升级到 Claude Mythos 5,网络安全护栏在该版本中已解除。用户会发现 Mythos 5 在大多数任务上与 Mythos Preview 相当或略有提升,但价格大幅降低。 与此同时,他们将为生物领域开放一个可信访问计划,帮助加速生物医学研究。该计划提供解除了生物化学护栏(网络安全护栏仍保留)的 Fable 5 访问权限,面向来自基础研究和转化研究机构的少量研究人员,并计划逐步扩大。 开发者可通过 Claude API 使用 claude-fable-5 调用该模型。 今天至 6 月 22 日,Pro、Max、Team 和按座位付费 Enterprise 套餐用户免费使用 Fable 5。 6 月 23 日起,上述套餐中不再包含 Fable 5,使用需消耗额度。如容量允许,Anthropic 会延长免费窗口。 此后,待容量充足,Fable 5 将重新成为订阅套餐的标准部分。
没信号也能刷视频?朱雀2号干了件大事:手机直连卫星上天
快科技6月10日消息,日前,我国在酒泉卫星发射中心使用朱雀二号改进型遥六运载火箭,成功将上海垣信卫星科技有限公司的首颗手机直连试验星与中国移动通信集团有限公司的“中国移动02星”送入预定轨道,发射任务取得圆满成功。 据中国移动官方介绍,上述两颗卫星主要用于开展手机直连卫星、天地网络融合等技术试验验证。 前期,工业和信息化部指导完成了相关卫星的国内频率协调,颁发了空间无线电台执照和无线电频率使用许可,为上述卫星的顺利发射提供了有力支撑。 与北斗短报文、天通卫星语音等窄带通信不同,这两颗试验星将验证普通5G手机无需改装、无需外置天线,仅通过软件升级即可直连卫星的技术。 理论峰值下行速率达100Mbps、时延50ms内,可支持视频通话、高清视频播放等宽带业务,真正实现“无地面信号也能刷视频”。 其技术原理如同基站上天,传统卫星通信需专用终端,而手机直连卫星(DTC)技术将卫星伪装成地面5G基站,让手机直接接入天基网络。 同时验证天地网络无缝融合,用户在地面与卫星信号间切换无感知,实现“以天补地”。 据预测,到2030年,全球卫星直连服务的月活跃用户数将达到4.11亿,收入规模接近120亿美元,是个十分广阔的市场。
中泰男足友谊赛即将打响 邵佳一挂帅国足主场首秀全力争胜
  新华社浙江金华6月8日电(记者季嘉东)中国男足将于9日在浙江金华体育中心体育场与泰国队展开一场国际友谊赛,这也是邵佳一执掌中国队教鞭后的主场首秀。在8日下午的赛前新闻发布会上,比赛双方均明确表示将全力以赴、力争获胜。 6月8日,中国男足国家队主教练邵佳一(中)和球员张玉宁(右)在赛前新闻发布会上。新华社记者 季嘉东 摄     邵佳一回忆起25年前自己曾作为球员帮助中国队在“泰王杯”中战胜泰国队。随后他坦言,二十多年过去,泰国队已不可同日而语。“过去很长一段时间我们在他们身上没占到便宜,他们打法更直接、更快速,是非常强大的对手,明天必将是一场激烈的较量。”     在5日与新加坡队的比赛中,中国队在下半场进行大面积轮换,让许多年轻球员登场。而当9日面对泰国队时,中国队是否会继续进行如此大幅度的轮换?这将是一个问题。     邵佳一表示,每一名进入国家队的球员都具备首发实力。“明天肯定会派出最强阵容,因为每一场国家队的比赛都很重要。”他说,“至于年轻队员,他们要保持饥饿感,这要贯穿他们整个足球生涯,才能有大的进步。上一场比赛,无论是相对年长还是年轻的队员都完成了队伍的要求,这一点我非常满意。” 6月8日,中国男足国家队在训练中。新华社记者 季嘉东 摄     作为国足老将,张玉宁的国家队首秀距今已有十年。“既然来到国家队,就要做出贡献,不能浪费在国家队的每一天,要在明天的比赛中展现出来,把对胜利的渴望展现在球场上。”张玉宁说。     泰国队在5日进行的友谊赛中以2:2战平科威特队。主教练哈德森表示,由于两场比赛间隔很短,球队很难对战术做出大幅调整,首要任务是保障球员体能并全力以赴。他同时提到,球队希望继续提升世界排名,但也会客观看待排名的局限性。     哈德森关注到中国队涌现出不少潜力新星,资深国脚依然具备极高的战术价值,整支球队打法高效且思路清晰。“我们深知这会是一场硬仗,我对对手充满尊重,但我们自身的状态也不错,经过几天充分的备战,我们非常期待这场比赛。”
Tabbit办起“百日宴”,但美团AI的挑战才刚刚开始
2026.06.10 本文字数:1648,阅读时长大约3分钟 作者 | 第一财经 陆涵之 美团为旗下AI原生浏览器Tabbit举办了“百日宴”。 6月9日,美团旗下GN06团队宣布AI原生浏览器Tabbit 1.0正式上线,距离3月2日公测日正好100天。Tabbit负责人刘炯表示,“Tabbit百日发布代表着这个产品已经活下来了,而且活得非常健康。” 除了Tabbit,近期美团持续公布AI进展,并且有多款产品落地。但新品总是面临挑战,业务关联度不高、与传统浏览器激烈竞争等课题,是年轻的Tabbit需要解决的课题。 美团加强AI布局 现阶段受AI用于生成各类内容的影响,浏览器变得更加重要。但同时目前浏览器的产品形态较为落后,美团认为其中有很大的机会。 据第一财经了解,Tabbit是浏览器形式的AI入口,内置多款头部大模型,用户输入需求后,Tabbit可自动执行跨软件、跨网页等各类复杂任务。 在公测期间,Tabbit根据用户反馈保持每周迭代,累计更新超百项新功能,Agent任务成功率从3月的53.1%提升至目前的91.8%。5月数据显示,单用户月均Token使用量已达853万。 从功能迭代看,Tabbit1.0版本新增了记忆功能,持续记录用户偏好、背景以及其他重要信息,并形成“可调用记忆”。 刘炯表示,团队致力于打造一个开放的Skill生态,让浏览器从单纯的网页承载工具,真正进化为AI工作入口。 网经社电子商务研究中心数字生活分析师陈礼腾对第一财经记者表示,美团此时布局AI业务,主要基于战略补课需求、光年之外团队技术成熟以及把握AI浏览器重构窗口期等原因。Tabbit作为继“深度研究”agent后的又一落子,旨在抢占下一代AI流量入口。 对于目前Tabbit未关联美团的核心业务,陈礼腾认为美团意在探索AI增长点。Tabbit通过智能代理等能力帮助用户自动完成跨平台任务,同时为技术验证积累经验。挑战在于,Tabbit在C端存在感弱、决策入口缺失、业务关联度不高,且面临传统浏览器和AI原生浏览器的激烈竞争。 除了Tabbit 1.0正式上线,美团在5月发布了“跑腿Skill”,将跑腿下单能力以封装Skill形式向AI助手生态开放,目前已有多家AI助手接入美团跑腿。此外,5月美团创新团队孵化的AI 原生社区“觅游”进入公测阶段。在落地场景上,这一社区或与美团旗下其他业务产生更多联动。 超级入口争夺战升级 不仅研发团队持续推出新的AI产品,美团也在外部积极展开合作。 6月8日,微信宣布面向开发者提供便捷接入微信AI生态的能力,用户可通过微信AI Agent调取小程序AI应用服务。 第一财经记者获悉,美团、滴滴以及京东等公司已经接入。美团表示,作为首批内测团队,此前已与微信团队联合开发并测试接入。未来用户通过微信Agent调用美团外卖等本地生活服务,实现更智能、便捷的AI生活服务体验。后续美团还将持续扩展更多业务场景。 此前,在美团一季度财报电话会上,美团CEO王兴曾表示:未来,除了服务消费者(To C)和商家(To B),服务AI Agent(To A)正变得越来越重要。 除了美团,滴滴也表示作为首批合作伙伴,已与微信团队合作将核心网约车服务融入微信AI Agent。未来,用户通过微信内AI交互,即可直接唤起滴滴快车、专车、特惠等服务。据了解,滴滴顺风车、滴滴代驾等更多服务也将接入微信AI生态。 陈礼腾认为,接入微信AI生态使美团等公司获得流量赋能,实现“服务找人”转变,形成生态协同。这标志着AI应用从工具向服务延伸,深度融入日常消费场景,超级入口争夺战升级,多极竞争格局形成。 艾媒咨询CEO张毅认为,各平台集体接入微信AI生态,最主要的原因在于微信的高流量和高活跃用户规模。目前各平台自有的AI产品打开率并不高,借微信强化对话交易和交互习惯,对平台自身有益。此外,美团、京东和滴滴等平台此前与腾讯多有交集,在协同关系和资源互补方面比较到位,磨合起来相对比较简单。对各平台而言,接入微信AI生态后有利于零门槛获取增量订单,AI推广亦能降低成本。此外公私域联动有利于提升用户价值,积累智能体落地经验。 此外,张毅认为上述合作也存在挑战,例如平台会丧失流量的主导权,甚至数据分成规则等会受到挑战。此外各平台的重合业务共用一个入口,长期看成本并不会减少,反而会加剧架构内服务的竞争。 微信编辑 | 小羊
苹果更新App Store审核指南,劣质、低人气应用面临下架风险
IT之家 6 月 10 日消息,苹果向开发者发出提醒:部分应用或将无法继续在 App Store 上架运营。本周,这家科技巨头更新了应用审核指南,其中明确表示,对于一些成熟赛道内的应用,若未能完成版本更新、功能优化,也无法吸引用户,苹果或将对其做下架处理。 此前的规则仅规定,苹果会直接驳回仿冒类应用,以及扎堆于饱和赛道的应用申请。 旧版指南曾提醒开发者,不要涌入应用数量已然过多的分类。其中有一段表述颇为有趣:“App Store 里的放屁、打嗝、手电筒、占卜、交友、酒桌游戏、情爱类等应用早已饱和。除非能带来独特且优质的使用体验,否则这类应用将一律被拒。” IT之家注意到,本次更新恰逢苹果全球开发者大会(WWDC)举办,新版指南警示开发者不要跟风仿制现有应用品类或热门应用。除交友、手电筒、占卜类应用外,壁纸、简易计时器、音效类应用也被列入重点管控名单。 指南中写道:“今后,若这类应用长期不更新、不优化,且缺乏用户吸引力,我们会将其从 App Store 下架。” 苹果公司表示,这些应用“在 App Store 上已拥有稳定地位”,除非能提供“有意义的不同或更优”体验,否则将不再接受新的提交申请。 此次规则调整,正值苹果着力优化 App Store 的应用曝光机制。在本届全球开发者大会上,苹果推出了个性化应用推荐与运营推广工具,助力开发者拓展业务、召回老用户。清理低质应用能够精简平台内容,让用心打磨产品的开发者获得更多曝光机会。 此外,苹果将酒桌游戏、情爱、放屁、打嗝类应用定性为低质、平庸、粗制滥造产品,并警告:反复提交此类应用的开发者,可能会被彻底取消苹果开发者账号权限。 苹果向科技资讯网站 TechCrunch 表示,平台现有的 App Store 优化机制,会主动提醒开发者其应用版本老旧、下载量低迷,开发者可提前优化产品,避免应用遭到下架。 简言之,本次应用审核指南的新规进一步明确:以往被划入“恶搞低俗应用条款”范畴的产品,如今都面临下架风险,苹果已向开发者发出了明确警告。
湖南省第十五届运动会9月举行 比赛场馆均已竣工验收
  中新网长沙6月8日电 (记者 邓霞)记者8日从新闻发布会上获悉,湖南省第十五届运动会将于9月6日至16日在益阳市举行,湖南省第十二届残疾人运动会也将于9月26日至29日在益阳举办。目前,赛事各项筹备工作正有力有序推进。 吉祥物“竹娃”“茶宝”。主办方供图   本届湖南省运会由湖南省人民政府主办,湖南省体育局、益阳市人民政府承办,以“益山益水益阳,更快更高更强”为主题口号,会歌为《相约益阳》。会徽以益阳首字母“YY”勾勒奔跑姿态,融入绿叶、竹篾、千两茶篓工艺、朝阳等元素,展现活力多姿、热情好客的城市风貌。吉祥物“竹娃”“茶宝”以翠竹、千两茶为原型,展现益阳“楠竹之乡”“黑茶之乡”的城市名片。   湖南省第十五届运动会竞赛项目设置贴合湖南体育发展实际,兼顾竞技性、群众性与普惠性,共设青少年组29个大项、成年组12个大项,届时将有14个市州和省体校共15个代表团参赛。   湖南省第十二届残疾人运动会以“自信自强,益美益阳”为主题,设置11个大项,将有700名运动员参赛。赛事同步设置象棋、飞镖等群众性体育项目,推动残疾人群众体育广泛开展。其会徽以字母“Y”与数字“12”化作轮椅运动员,双轮成爱心、竹叶作赛道,传递自强不息、残健融合的温暖力量;会歌为《“益”起绽放》;吉祥物与省运会共用。   目前,赛事各项筹备工作进入最后冲刺阶段。场馆建设全面完成,新建的10个场馆、提质的21个场馆,均已竣工并通过验收,主会场益阳奥林匹克公园“一场两馆”达到国家级赛事标准;比赛场馆、宾馆酒店、公共交通的无障碍改造基本完成;1970名志愿者已完成招募和初步培训。   益阳地处湖南中北部,先后培养了龚智超、田卿、谌利军、贾一凡、文晓燕等5位奥运冠军和11位世界冠军,累计夺得奥运冠军、世界冠军126项,被誉为“世界冠军摇篮”“羽毛球之乡”。(完)
Claude Mythos 5发布!5000万行代码1天搞定
Anthropic遮遮掩掩两个月的“神话”Mythos,终于降临了—— 自家有史以来最强悍的大模型旗舰,分两个版本端上桌:Claude Fable 5与 Claude Mythos 5。 Fable 5是加了防护网版本的Mythos**,面向所有用户开放。 一旦用户提问触发风险分类器(比如试图让它写恶意软件),系统就会自动降级调用上一代Claude Opus 4.8来回答。 Mythos 5是原汁原味的满血版“Mythos”,但只给少数受信任用户使用。 它在网络安全等领域解除了安全限制,官网称其“拥有全球最顶尖的网安攻防与生物科研纯血能力”。 官方表示,Fable 5和Mythos 5的自主运行时间比以往任何Claude模型都长。 小小叹个气?前沿AI,开始进入权限时代了。 而且就在Anthropic郑重其事地呼吁全部AI研究立刻停止后没两天…… 不懂Dario怎么也开始走上奥特曼每次为自家新模型、新产品提前营销造势的老路,还是阵仗极大的那种。 (我知道A社有自己的道理,但我还是报以一个微笑)。 不过还是有非技术层面让开发者比较欣慰的消息,这两款新旗舰的API定价直接把之前的预览版砍掉了一半以上: 每百万输入Token仅需10美元,每百万输出Token为50美元。 好了,咱们迅速进入技术相关环节,冲—— 双版本Mythos来了!官方给“Token效率”画了重点 先说个情况。 官方的发布日志和业内评测中没有像介绍Fable 5那样,为Mythos 5开列一长串标准的、公开的 Benchmark跑分榜单(比如 MMLU、GSM8K、SWE-bench 等)。 不过鉴于二者是同一底层模型,两者其实可以看成同一内核的“镜像分身”,基础技术指标完全一致。 所以我们只能先看看目前官方渠道主要公开的Fable 5的表现。 按照Anthropic自己的说法,Claude Fable 5是目前最强的公开Claude,也是Fable系列第一次进入Mythos级能力。 它的优势主要集中在几个方向:软件工程、复杂知识工作、视觉、长上下文、记忆能力,以及生命科学研究。 更关键的是,任务越长、越复杂,Fable5相比过去Claude的优势越明显——说明Fable5的重点不是单轮问答更漂亮,而是能接住长周期任务。 我们不妨用数据和硬核Demo,来拆解这代神话级模型的统治力: 软件工程:高难度基准打穿,从“修Bug”到“全自动大军” 在衡量模型解决真实世界、复杂软件工程问题能力的SWE-bench Pro评测中,Claude Fable 5飙出了80.3%的高分。 作为对比,竞争对手的顶级主力模型GPT-5.5的得分为58.6%。 在Cognition的Frontier Code评测——这个评测更看重模型能不能完成困难编程任务,同时满足高质量生产代码库的标准——中,Fable 5在中等推理强度下就拿到前沿模型最高分。 FrontierCode该基准极难饱和。 不过即便在“中等努力(Medium effort)”模式下,Fable 5得分也高居所有前沿模型之首。 官方给出的第一个典型案例来自Stripe。 在一个5000万行Ruby代码库中,Fable 5完成了一次全库迁移。这个工作如果让一个工程团队手动做,原本要两个多月。 Fable 5呢?仅仅用了一天。 此外,在端到端前端开发基准ViBench(Vibe-coding benchmark) 上,Fable 5几乎把基础开发用例直接打到饱和,实现了真正的“一枪流(One-shot)”生成应用。 原生视觉:不要脚手架,盲打通关《宝可梦》 知名科技媒体VentureBeat在《Anthropic brings Mythos to the masses with Claude Fable 5, its most powerful generally available model ever》一文中透露,在专注于视觉文件推理的基准测试GDPpdf上,Fable 5和Mythos 5在不借助外部工具的条件下拿到了29.8%的成绩。 作为对比,Opus 4.8得分为22.5%,GPT-5.5得分为24.9%,Gemini 3.1 Pro得分为16.7%。 Anthropic官方也猜大家看一堆数据很枯燥,于是放出了Fable 5打游戏的Demo,更具直接视觉效果。 此前的Claude模型如果想玩RPG游戏《宝可梦·火红版》,必须在外部为其配置一套极其复杂的“脚手架”(包括地图导航援助、内存游戏状态读取等)。 现在,Fable 5实现了纯粹的“原生视觉盲打”。 仅凭一张张原始的游戏屏幕截图,在没有任何地图外挂的前提下,它完全自主推演、策略规划,硬生生打通关了整部游戏。 不仅如此,由于其超长序列的专注度,当给它配置了持久化的文件级内存后,它在游玩卡牌肉鸽游戏《杀戮尖塔》(Slay the Spire)时,表现直接飙升了3倍,到达最终星体的概率同样暴涨3倍。 长上下文和记忆能力重点升级,顺手强调了下“Token效率” 长上下文和记忆能力也是这次升级的重点。 Anthropic称,Fable 5能在百万级Token的长期任务里保持专注,还能利用自己的笔记改进输出。 官方拿SlaytheSpire做了测试,给模型接入持久化文件记忆后,Fable5的表现提升幅度是Opus4.8的三倍,到达最终章节的频率也提升了三倍。 这其实是Agent能力里非常底层的一环。 一个能长时间干活的AI,必须能够记得自己做过什么、错过什么、下一步为什么这么做。没有稳定记忆,自主任务就很容易变成一场大型失忆现场。 为此Anthropic还特别强调了Token效率(这也是这代模型的一个关键方向)。 越是能长时间自主工作的模型,越会消耗大量Token。 如果模型一边很强,一边很“费话”,成本很快会高到让企业肉疼。 Fable 5强调Token效率,本质上是在解决Agent化落地里的账本问题。 金融、法律与运营:首次突破 90% 大关的逻辑黑洞 在考察高级分析推理能力的Hebbia金融基准测试(Finance Benchmark for senior-level reasoning) 中,Fable 5拿到了行业最高分。 在长篇文档推理、复杂的图表和表格解读、以及多步骤根因分析上,Fable 5实现了双位数的跨越式增长。 在量化交易大厂IMC和Optiver的实测中,Fable 5几乎拿满了其交易分析评估的全部权重(包括事实检索、概念推理和期望值计算),且展现出惊人的稳定性——在多次重复运行中,输出结果的分数完全一致。 数据分析平台 Hex给出的评价是这样的: Fable 5是行业内第一个在我们的核心分析基准(覆盖极其复杂、长周期分析任务)中突破90%得分大关的模型,比Opus提升了整整10个百分点。 在最刁钻的提问中,它表现出了人类专家级别的微观评判力。 前沿科研:满血版Mythos“以小胜大”100倍的模型 在前沿物理学研究上,初创公司VibeCAD和物理研究机构测试表明,Fable 5仅使用了1/3的推理Token,在36小时内产出的物理研究成果,就逼近了GPT-5.5耗时四天才跑出的成绩。 以及仍然有点藏着掖着的Myhtos终于在这一板块现身了。 Anthropic表示,在生物医药领域,满血版的Mythos 5在完全没有人类协助的情况下,已经可以独立执行一个生物学家的全部工作流:选择蛋白质结合位点、自主调度并运行各类生物信息学工具,甚至在遭遇运行失败时自己 Debug。 它设计出的14个蛋白质靶向复合物中,有9个已经进入了实验室的真实药物研发管线。 Anthropic还强调,Mythos 5“是我们首个能够持续产生新颖且引人注目的科学假设的模型”。 在与Opus系列模型的盲法直接对比中,科学家在80%的情况下更倾向于Mythos的分子生物学假设,并且已将其中几个假设推进到实验验证阶段。 与此同时,Mythos 的一个假设——一种关于大肠杆菌蛋白的新机制——在另一家独立研究同一问题的实验室的研究《 A newly identified detoxification system protects uropathogenic Escherichia coli from reactive chlorine species》中得到了证实。 更夸张的是在基因组学研究中,Mythos 5自主工作了一周多,拼凑了138个物种的单细胞数据,并自主设计训练了一个定制的微型机器学习模型。 这个由AI训练出来的、体积小了100倍的微型模型,在表现上直接击败了前不久刚刚发表在《Science》杂志上的最新科研成果。 呼吁停止AI研究后,“危险能力”似乎被做成产品机制 这次最有意思的地方,应该得是Anthropic给Fable 5套上的防护网。 准确来说,Fable 5背后挂了一组独立分类器。 这些分类器会检测用户请求是否涉及网络安全攻击、生物和化学风险,以及模型蒸馏。 一旦触发,Fable 5就会拒绝自己回答,转而把请求自动转交给Claude Opus 4.8,并告知用户发生了降级。 有点意思哈。 过去的大模型在安全这一块,通常是让模型拒绝,说什么“抱歉,我无法为你提供帮助”“对不起我不能回答”“对不起我不能理解你的意思”之类balabala。 Fable 5换了一种做法。 它不做单纯拒绝了,而是做模型路由。 普通问题由Fable 5处理,一旦被识别到有问题是高风险问题,模型立刻被切到Opus4.8。 Anthropic的意思是,Opus4.8本身也是强模型,降级回答的体验总比直接拒绝要好的吧?~ 这套设计实际把能力和安全拆开了。 你日常使用的是Mythos级能力。 但面对一些敏感、攻击性、企图越狱等问题时,Anthropic丝滑切换老版本模型为你服务,让你手里趁手的工具,突然就没那么趁手了。 (主要防范网络安全、生化领域和模型蒸馏方面的一些问题) Anthropic给出了数据—— 好消息,超过95%的Fable 5会话不会触发降级。 也就是说,对于绝大多数写作、代码、分析、研究和办公任务,用户能拿到的体验基本接近Mythos 5。 但还有剩下不到5%的请求,会进入更严格的安全路径。 官网表明,高风险领域主要有三类。 第一类是网络安全,第二类是生物和化学,第三类是模型蒸馏。 这套机制背后,其实是前沿模型产品形态的一个变化。 安全不再只是模型回答前的一句免责声明,也不只是写在系统卡里的政策描述。 它变成了分类器、模型路由、权限分级、数据留存、红队测试共同组成的产品架构。 当然,代价也来了。 Fable 5的分类器调得比较保守,正常请求也可能被误伤。 比如生物学家研究病毒,安全工程师做授权攻防演练,都可能在合理任务中触发降级。 Anthropic自己也承认,当前护栏比理想状态更严格,后续会降低误伤率。 另一个代价是数据留存。 从Fable 5、Mythos 5以及后续同等级模型开始,Anthropic要求Mythos级模型所有流量保留30天,覆盖第一方和第三方使用场景。 官方强调这些数据不会用于训练,只用于安全监控,包括识别复杂攻击、新型越狱和跨请求攻击。 对普通用户来说,这可能只是条款里的一行字。 但对企业客户来说,这就是非常现实的数据治理问题。 想用最强能力,就要接受更高等级的安全审查和数据留存。 不可避免的,前沿模型的成本,也不只体现在API账单上。 价格方面,Fable5和Mythos5统一定价为每百万输入Token10美元、每百万输出Token50美元。 确实,相比Claude Mythos Preview便宜不少,但仍然是高价模型。 一句话说,Fable5确实强,但不会便宜到可以随便烧。 这也解释了为什么Anthropic要同时强调能力、安全和Token效率。 内测AI学者体验:AI越强,人越像甲方 著名AI学者、沃顿商学院教授埃森·莫里克(Ethan Mollick)在率先拿到测试权限后,撰写了一篇长文。 其行文逻辑直击这场技术革命的核心本质—— 人类与大模型之间的协作范式,发生了根本性、不可逆的逆转。 他让Fable 5做了一个等时圈地图。 这个任务听起来不算玄乎,但真做起来非常麻烦。 它要查航班、查铁路时刻、判断道路速度,还要处理不同国家、不同交通方式、不同时间成本之间的关系。 Fable 5自己启动多个代理去查资料,拿到了2200多个具体航班信息,还抓取了TGV、新干线等铁路数据,以及各国道路速度信息。 最后,它把这些资料整合进一个可用的地图项目里。 这件事的重点在于Fable 5把一个模糊目标拆成了研究、信息搜集、设计、编码、验证等多个环节,并且自己往前推进。 这和过去的大模型体验差别很大。 于是,莫里克提出了一个深刻的洞察。 在过去,人类使用大模型就像一个“巫师(Wizard)”,你必须手把手地去指导它、驾驭它(Steer),精雕细琢每一句 Prompt,通过不断的对话提示词来“念咒”,AI才能勉强变出一个戏法。 而面对Mythos级别的模型,人类正在沦为“赞助人(Patron,这里我感觉翻译为“甲方”更贴切一些?)”或者“委托人”。 莫里克教授用Fable5工作,感觉已经不像是在操作一个工具,更像是在委托一个小型工作室。 此外,在莫里克的实际测试中,他不再需要工作在最微观的指令层。 他直接向Fable 5喂进了一个长达15页、极其复杂的项目设计文档,然后留下宏观的需求描述。 接下来的9个多小时里,Fable 5在后台处于完全自主(Autonomous)的运行状态。 它自己生出了一个Agent工作流,内部调度多个小Agent分别去搞调研、撰写大纲、相互校对、推翻错误假设、纠错重来。 人类甚至不需要介入这个工作流半步。 9小时后,一个极高质量的成品直接交付到了莫里克面前。 这就是所谓的“工作室(Studio)”隐喻。 以前,我们用大模型是雇佣了一个临时的、需要反复沟通的自由职业者;现在,你用Fable 5,等于你用几美金的Token,瞬间雇佣了一整家好莱坞级别的设计院、或者一个顶尖的科研所。 你不需要关心它在黑盒里做出了多少个微观决策,你只需要扮演那个在最终成品上签字的“甲方”。 这种大模型长文本上下文(Context)与自主逻辑的结合,让Context不再仅仅是一个“内容容纳器”,而是彻底沉淀为了一个能自主推演、长时运行的“新型智能操作系统”。 换句话说,AI越像承包方,人类越像需要具备验收能力的甲方。 小插曲,为了更直观、更有趣地展示,教授还让它生成了一系列游戏供大家试玩。 这些游戏都是基于Claude Code的一个初始提示,Fable 5需要根据我提供的模糊提示生成一些可行的程序,之后我会给出一些额外的提示,并给予一些鼓励(例如“做得更好”)或反馈。 由于Claude Code无法生成图像,所以所有的美术作品或3D对象都是完全通过数学运算生成的,没有使用任何外部资源。 这里放一个抛硬币游戏的demo: 提前内测Fable 5后,教授最后表示“最终的成果令人印象深刻”。 但是,尤其是在着手处理更严肃的项目时,教授常常觉得使用这个工具既令人愉悦又令人不安。 愉悦之处在于,我只需提出要求,它就能实现。 不安之处也在于,我只需提出要求,它就能实现。 的确。 回到Anthropic这次发布。 有的人认为最重要的是Mythos终于半明牌了,有的人认为最重要的是前沿AI产品正在进入新形态。 一个更强的模型上桌了。 但Anthropic先给它系上安全带,然后才把钥匙递给所有人。 有人欢呼,有人焦虑,有人在彻夜调试代码,只为追上那条不断向前狂奔、甚至已经开始脱离人类微观视线的智能曲线。 Three More Things 1、注意窗口期。 从今天到6月22日,Pro、Max、Team和企业版用户可以免费用Fable 5。 但6月23日起,还想用Fable 5,就得额外买usage credits了。 2、Anthropic说,一旦产能跟上,Fable 5会重新做成订阅标配。 API和按量付费的企业客户不受这个节奏影响,今天起照常调用。
Anthropic发布Mythos系列新模型:代码、科研、视觉能力全面突破
财联社6月10日讯(编辑 赵昊)Anthropic最新推出了一款新模型“Claude Fable 5”,作为“神话级”(Mythos-class)的一员,公司将其设计为可安全用于一般用途的模型。 Claude页面显示,付费用户已可以使用Fable 5。 新闻稿写道,Fable 5的性能超越了公司以往所有公开发布的模型,在几乎所有AI性能基准测试中都处于领先水平,在软件工程、知识工作、视觉、科学研究以及许多其他领域都展现出卓越的性能。 Anthropic指出,任务越长、越复杂,Fable 5相对于公司其他模型的优势就越明显。新闻稿援引Stripe的报告称,在早期测试中,Fable 5将数月的工程量压缩到了几天之内。 在一个拥有5000万行代码的Ruby代码库中,Fable 5仅用一天时间就完成了整个代码库的迁移,而如果这项工作由一个团队手动完成,则需要两个多月。 新闻稿提到,Fable 5的token效率也高于以往的Claude模型:在Cognition的FrontierCode评估中,Fable 5即使在中等工作量下,也在所有前沿模型中得分最高。 Anthropic强调,Fable 5是目前最先进的视觉任务模型。仅凭视觉,该模型就能通关《宝可梦:火红》,而早期的Claude机器人需要较复杂的辅助设备才能玩该游戏。 Fable 5通关《宝可梦:火红》 几个月前,该公司曾警告称,Mythos系列模型具备发现并利用关键软件漏洞的能力。 新闻稿承认“发布如此强大的模型伴随着风险”,“如果没有安全措施,Fable 5在网络安全等领域的强大功能可能会被滥用,造成严重损害。” 因此,我们在发布该模型时加入了安全措施,这意味着对某些主题的查询将由功能次强的模型Claude Opus 4.8进行响应。 Anthropic还表示,公司面向一小部分网络安全防御机构和基础设施提供商推出了Claude Mythos 5——与Fable 5采用相同的底层模型,但在某些方面取消了安全防护措施。 公司补充称,Fable 5和Mythos 5等模型的能力具有造福世界的潜力,它们帮助网络安全防御机构保护了至关重要的软件,在生命科学研究领域提出了新的假设,加速了新疗法的研发。 新闻稿写道,在借助Mythos 5的情况下,公司内部的蛋白质设计专家将药物设计流程的某些环节效率提高了约十倍。在一周多的时间里,Mythos 5几乎可以完全自主开展基因组学研究。 Mythos 5设计的蛋白质复合物 Anthropic研究与实验室项目管理负责人Dianne Penn表示:“对于不涉及网络安全的应用场景,我们希望尽快、安全地推出Fable。因此,我们决定先发布这一部分能力,同时继续推进更广泛的网络安全应用开发工作。” 近几个月来,Mythos已成为Anthropic最受关注的产品之一,尤其是在其推进IPO的背景下。 Penn表示,Anthropic未来将继续扩大Glasswing计划的覆盖范围,让更多机构能够使用具备网络安全能力的Mythos版本。
罗永浩锐评iOS 27创新不足:希望苹果新CEO有所改变
快科技6月10日消息,日前,罗永浩转发了一条测评iOS 27的视频,并用反讽口吻评价苹果新一代操作系统。 罗永浩表示:“哇,哇靠,哇塞,好多创新啊,赶紧退休吧,希望新的CEO别再这样了。” 随后,有网友认为,苹果CEO蒂姆·库克在任期间让苹果股价翻了十几倍,无论如何都是一位伟大的CEO。 对此,罗永浩回复称:“当然,生意上大家都很服他......但这跟消费者有什么关系?为什么天天被挤牙膏产品圈钱的消费者要犯这种贱?确实看不懂。” 事实上,罗永浩此前已多次公开表达过苹果创新力不足。 2022年,罗永浩曾表示,乔布斯去世后的整整11年里,苹果除了无线耳机确实做得不错,其他产品方面几乎是零创新,有些产品甚至出现了明显退步。 2024年苹果发布iPhone 16系列后,罗永浩也曾发微博点评称:“又是零创新。” 据了解,iOS 27此次主要升级集中在三方面,包括全面提升系统响应速度、升级系统可靠性与安全性,以及带来全新Apple Intelligence和Siri AI。 不过,对于国内用户来说,iOS 27的核心AI体验依旧缺席。 由于苹果智能相关功能仍需配合监管要求推进,国行版暂时无法完整体验Apple Intelligence和Siri AI。 博主“数码闲聊站”体验完iOS 27后也认为,国行版应该叫iOS 26.5,没有Apple Intelligence+Siri AI,新增节假日闹钟,液态玻璃可调节通透程度,其它变化不大。 也正因如此,iOS 27发布后,围绕“创新不足”“挤牙膏”等话题的讨论再次出现。
IDC分析师:WWDC26是苹果AI的“可信度”测试
6 月 9 日消息,彭博社记者马克 · 古尔曼 9 日(今天)撰文称,苹果在全球开发者大会上为新一代产品铺路,试图向外界证明,在经历多年 AI 功能延期和落地不顺之后,自己仍有能力在 AI 时代参与竞争。 苹果最新一代操作系统的核心,是经过全面改造的 Siri AI,覆盖 iOS 27、macOS 27 Golden Gate、watchOS 27 和 visionOS 27。Siri AI 被设计得更智能、更可靠,可以理解上下文,并能更精准地控制多种应用。 IDC 分析师弗朗西斯科 · 杰罗尼莫在报告中提到:“WWDC26 是苹果的 AI 可信度测试。苹果不需要靠最大模型或最夸张的演示赢下 AI,苹果需要让 AI 在整个生态系统中变得可信、有用,而且无处不在却不打扰用户。” 苹果仍要面对投资者对 AI 战略的怀疑。发布会期间,苹果股价下跌,收盘跌幅达到 1.9%。 苹果也承认,新功能不会一次性全面铺开。Siri AI 初期只支持英语,今年秋季面向消费者推出时仍将标注为测试版,中国和欧盟用户最初也无法使用最新 AI 功能。 古尔曼称,发布会不仅是在展示未来,也是在弥补过去的短板。通过重建 Siri、升级 AI 技术,苹果正在为未来一批更依赖 AI 能力的产品打基础。 IT之家从报道中获悉,IDC 分析师纳比拉 · 波帕尔表示:“这些功能将成为推动 iPhone 14 及更早机型用户升级的巨大催化剂,尤其是那些原本可能因为通胀压力或经济不确定性而推迟购机的用户。说服持有旧机但仍在犹豫的消费者升级,将帮助苹果维持当前势头。在智能手机市场走弱的背景下,这是一项重要成就。”
再下一城:特斯拉FSD监督版获丹麦上路许可
IT之家 6 月 10 日消息,特斯拉 FSD(监督版)在欧洲各国的审批正产生连锁效应,推进速度大幅加快。在欧洲大陆接连取得监管突破仅数周后,这套高级驾驶辅助系统再度拿下欧洲又一重要市场的上路许可。 IT之家注意到,特斯拉欧洲分部周二在社交平台 X 上发布公告证实,FSD(监督版)已获准在丹麦上路使用,并表示即将推送更新。 此次丹麦落地,依托一套分阶段审批机制推进,这套机制也正在改变欧盟境内自动驾驶软件的认证规则。丹麦道路交通管理局发布官方通报称,该局认可荷兰车辆管理局今年 4 月出具的里程碑式车型认证许可。 由于欧盟委员会尚未出台全欧盟通用的统一车型认证,各成员国需自行决定是否单独认可这套审批标准。丹麦正式采纳荷兰的认证方案后,也就意味着 FSD(监督版)获准在该国公共道路行驶。 丹麦道路交通管理局在说明审批依据、详述技术审核流程时表示:“经对技术文件全面审查评估,本局认同荷兰车辆管理局的结论 —— 该系统可在行驶过程中辅助驾驶员,对道路安全起到积极作用。因此,本局认可这份 FSD(监督版)临时车型认证。” 但官方同时强调:“该系统暂未获得欧盟委员会批准,本次许可仅为临时性质。”若后续欧盟委员会否决这款软件,荷兰最初出具的认证将在六个月后失效,各成员国的单独许可也会随之作废。 继爱沙尼亚不到两周前获批之后,丹麦的落地成为 FSD 发展又一重要里程碑。自荷兰打开审批闸门以来,这已是欧盟第四个允许该软件上路的国家。 目前,FSD(监督版)已在全球 12 个地区获批使用,分别是美国、加拿大、墨西哥、波多黎各、中国、澳大利亚、新西兰、韩国、荷兰、立陶宛、爱沙尼亚以及新晋加入的丹麦。 和欧洲其他已获批地区一样,丹麦对 FSD 的运行设置了特殊限制:现阶段该软件仅适配搭载第四代自动驾驶硬件(HW4)的车辆。同时,当地使用的是 FSD 14 版本的欧洲定制版,专门针对欧洲本地交通法规调整了界面与功能。 越来越多欧盟成员国相继单独放行 FSD(监督版),行业即将迎来关键转折点。特斯拉人工智能主管阿肖克 · 埃卢斯瓦米在近期分享中展示了待审批国家明细图,显示整个欧盟地区都在推进该系统的落地审批。 周边国家也在加快跟进节奏:比利时正加急推进本土审核,预计将成为下一批获批的国家之一;瑞典已扩大 FSD 公开道路测试范围,波罗的海另一国拉脱维亚也取得了相应监管进展。随着更多国家监管部门放行,欧盟委员会面临的压力不断增加,业内也期待其尽快出台覆盖整个欧盟的统一车型认证。
谷歌发布互译模型Gemini 3.5 Live Translate,谷歌翻译App就能用
IT之家 6 月 9 日消息,北京时间 9 日(今天)晚间,谷歌正式发布最新的实时语音互译音频模型Gemini 3.5 Live Translate,迈出实时翻译的下一步。 Gemini 3.5 Live Translate 可自动识别 70 多种语言,并生成流畅、自然的翻译语音,同时保留说话者的语调、语速和音高。 根据介绍,传统轮流式系统通常要等说话者说完后才开始翻译,Gemini 3.5 Live Translate 则会连续生成语音,在“等待更多上下文以提升翻译质量”和“即时翻译以跟上说话者节奏”之间取得平衡。整个会话过程中,翻译音频可以保持流畅,避免尴尬停顿,并始终只比说话者慢几秒。 Gemini 3.5 Live Translate 今起陆续登陆谷歌产品: 开发者可通过 Gemini Live API 和 Google AI Studio 使用公开预览版 企业客户可从本月起在 Google Meet 中使用私有预览版 普通用户可通过 Android 和 iOS 版谷歌翻译使用 Gemini 3.5 Live Translate 会在语音流式传输过程中同步处理内容,让跨语言交流更加顺畅。模型可以自动处理多语言输入,无需手动调整设置,抗噪能力也能帮助应用适应嘈杂、复杂和不可预测的环境。开发者可以把 Gemini 3.5 Live Translate 用于多语言通话、会议、课程、直播和广播等场景,提供实时口译体验。 据IT之家了解,Gemini 3.5 Live Translate 将登陆全球 Android 和 iOS 版谷歌翻译应用。用户使用实时翻译功能时,只需连接任意耳机,就可以在 70 多种语言中获得更顺畅的翻译,并让译文语音更接近说话者的语气。 Android 用户还将陆续获得基于 3.5 Live Translate 的全新“聆听模式”。用户可以像接电话一样把手机贴到耳边,直接通过手机听筒收听翻译音频。在没有耳机、又不希望旁人听见翻译内容时,这种模式会更方便。
赛力斯和豆包造的新车,终于公布了
提起赛力斯,机友们可能会想起它和华子合作推出的鸿蒙智行问界。 这几年问界的销量越来越好。 赛力斯的知名度也蹭蹭上升,属于是双赢的合作。 但很显然,除了深耕问界以外,赛力斯还是想捣鼓出更多可能性,于是就有了今天公布的「赛豆汽车」。 可能有机友会联想到:“这个豆,会不会是豆包”? 是,但又不完全是。 是因为赛豆汽车虽然是跟豆包合作,但字节并没有股权,两边仅仅是技术上的合作。 它的前身是重庆蓝电科技有限公司,这个估计大伙会眼熟一些。 然后今天赛豆科技发布的新车,有两款。 一款是概念车 Origin Concept。 目前没有公布配置,但车子设计得蛮帅,采用流线型生物学造型,前大灯可交互,车顶搭载了激光雷达。 除了概念车以外。 还有一台即将要量产的新车,AIVA ME7,全系车型覆盖 20 万元以上主流市场。 和很多人想象得不太一样的是。 这回 AIVA ME7 没走传统 SUV 路线。 反倒是 bigger 拉满,造了一台介于轿车和 SUV 之间的跨界车。 官方表示提供纯电和增程两种动力,三电系统都是赛力斯的,电池则是宁德时代供应。 这时候肯定有机友要问了。 “豆包是过来干嘛的?” 是这么回事。 豆包本来就是专做大模型的,所以它主要提供基于大模型的智能座舱。 支持多模态连续语音控制、车外语音、情绪感知和自主学习啥的。 这就让机哥想起了一位,座舱同样玩得出神入化的故人。 之前的新能源车虽然都有接入大模型。 但基本都是当实时语音搜索、百科全书和天气助手来用。 考虑到豆包极强的语音和视觉实时交互能力,机哥还蛮好奇豆包原生座舱上车后,能玩出什么新花样。 然后辅助驾驶这块,爆料显示会采用元戎启行的方案。 也是国内头部的辅助驾驶供应商之一。 销售渠道则是另外单开,不跟问界共享。 后续会走出海路线,赚一波老外的“嘛内”。 以后豆包可不仅仅活在手机和电脑里了,你甚至能在车上跟豆包唠嗑。
iOS 27发布 苹果晒iOS 26升级率:79%的iPhone已升级 不及iOS 18
快科技6月10日消息,苹果新一代操作系统iOS 27已正式发布,正式版将于今年9月随iPhone 18系列一同推出。 日前,苹果也公布了iOS 26最新升级率,从整体表现来看,iOS 26的安装率略低于上一代iOS 18。 苹果开发者官网数据显示,截至6月7日,在过去四年内发布的iPhone机型中,已有86%的设备升级iOS 26;在所有iPhone中,iOS 26整体安装率为79%。 iPad方面,在过去四年内发布的机型中,有79%的设备已升级至iPadOS 26;若统计所有iPad,iPadOS 26整体安装率为68%。 作为对比,苹果在2025年6月5日公布的数据显示,在过去四年内发布的iPhone中,iOS 18安装率为88%;所有iPhone中,iOS 18安装率为82%。 iPad方面,过去四年内发布的机型中,iPadOS 18安装率为81%;所有iPad中,iPadOS 18安装率为71%。 也就是说,从同期数据来看,iOS 26/iPadOS 26的升级率均略低于上一代系统。 据了解,iOS 26采用Liquid Glass(液态玻璃)设计语言,这是自iOS 7以来最大的设计更新,为锁定屏幕、主屏幕、控制中心和App带来全新设计。 不过,较大的视觉变化也带来了一定争议,部分用户认为新设计更具辨识度,也有用户对透明效果、可读性和适应成本提出不同看法。 iOS 27 好在苹果在iOS 27中对Liquid Glass的底层基础进行调整,新增调节滑块,用户可以根据自己的喜好调节液态玻璃效果,从完全不透明到完全透明都能自由选择。
一觉醒来20万没了 只因手机打开了这个权限:快自查
快科技6月10日消息,据央视网、北京卫视等多家媒体报道,上个月,北京公安刑侦反诈支队接到市民秦先生报案,其银行卡内资金莫名被盗,累计损失超20万元。 民警初步核查发现,秦先生账户资金集中在凌晨三四点,通过数字人民币APP兑出划转方式被盗取。 顺着线索排查后,警方发现秦先生案发前一晚,从陌生同城交友网站下载一款交友APP,还违规为软件开通了手机无障碍权限。 经核实,这款交友软件是不法分子定制的诈骗木马程序,自带远程操控、屏幕窃取功能,软件一旦获取无障碍权限,诈骗团伙便能远程查看手机全部界面,还能自主操控手机操作。 嫌疑人趁着秦先生深夜熟睡,远程操控手机支付程序,扫描付款码悄无声息转移账户资金。 警方表示,此类诈骗手段持续翻新,不法分子主打诱导用户开通无障碍权限,作案更加隐蔽,权限开通后,诈骗软件可实现图标透明隐藏、禁止卸载,持续窃取手机锁屏密码、账户信息等隐私数据。 据统计,今年北京全市,利用手机远程控制、屏幕共享实施的电信诈骗警情已超1100 起,案发规模居高不下。 针对该类骗局,警方给出应急处置方法:若手机被不法分子远程操控,第一时间关闭无线网络与移动网络;如若手动断网受阻,立即拔出手机SIM 卡,完成物理断网,切断远程控制链路。 警方提醒,远程操控诈骗虽非新型骗局,但作案手段持续升级。市民切勿随意点击陌生网页链接,拒绝下载来路不明的社交软件,绝对不要给陌生APP开放无障碍权限,从源头规避财产被盗风险。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。