行业分类:
加载中...
头条分类:
加载中...
米哈游《原神》PS4版停更,去年9月从PlayStation Store下架
IT之家 4 月 7 日消息,根据米哈游官方公告,《原神》PS4 版将在今年 4 月 8 日停止更新。届时,玩家将无法通过 PS4 登录游戏。PS4 设备上已安装的《原神》也不会再收到更新推送。 另外,已在 PlayStation Store 购买了但还未登录游戏获取的商品,将只能通过登录 PS5 版本的《原神》来获取。米哈游官方建议使用 PS4 游玩的玩家,后续使用 PS5 或其他设备继续体验《原神》,游戏进度不会受到影响。 IT之家注意到,整个 PS4 版本《原神》下架和停更计划分为“游戏下架”“商品下架”和“游戏停止更新”三个阶段: PS4 版本游戏下架 2025/09/10 06:00 (UTC+8) 起,PS4 版本的《原神》会从 PlayStation Store 下架。在此之前,未获取过 PS4 版本《原神》的 PlayStation™Network 的账号,将无法在 PlayStationStore 搜索到或获取 PS4 版本的《原神》。 获取过《原神》的 PlayStation Network 的账号在设备上删除《原神》后,仍可随时在“商店 — 游戏库”里再次下载游戏。 PS4 版本内购商品下架 2026/02/25 06:00 (UTC+8) 起,PS4 版本《原神》的所有内购项将从 PlayStation Store 和游戏内商城下架,旅行者后续无法在 PS4 上进行充值。 在 PS4 版本游戏停止更新前,已在 PlayStation Store 购买但还未登录游戏获取的商品,可以正常通过登录 PS4 版本的《原神》来获取。 PS4 版本游戏停止更新 2026/04/08 06:00 (UTC+8) 起,我们将停止对 PS4 版本《原神》的更新,旅行者无法通过 PS4 登录《原神》。 PS4 设备上已安装的《原神》将不会再收到更新推送。 已在 PlayStation Store 购买了但还未登录游戏获取的商品,将只能通过登录 PS5 版本的《原神》来获取。
苹果阔折叠被曝命名iPhone Ultra!国内厂商考虑跟进:芯片、价格等全面对标
快科技4月8日消息,日前,数码博主“数码闲聊站”爆料称,苹果即将推出的阔折叠屏手机将命名为iPhone Ultra。 他还透露,国内厂商的阔折叠也在考虑跟进,新折叠暂命名Ultra,在屏幕形态、芯片硬件甚至定价策略上全面对标苹果。 不过,目前尚未明确具体厂商,评论区中有不少用户猜测可能是小米。 作为近年来最受关注的新品形态之一,苹果首款折叠屏手机的消息已多次曝光。 综合现有信息,新机预计将在今年秋季发布,但上市节奏或晚于同期的iPhone 18 Pro系列。 知名苹果爆料人马克·古尔曼此前指出,由于折叠屏涉及更复杂的结构设计与制造工艺,苹果在新形态产品上的首批供货通常会相对谨慎,因此发售时间可能延后。 在产品形态上,iPhone Ultra将采用左右对折的阔折叠方案,配备约7.8英寸的内屏和5.5英寸的外屏,兼顾大屏体验与日常便携性,同时取消Face ID改用侧边Touch ID。 由于折叠屏手机在屏幕、铰链以及整机结构上的复杂度高于传统直板机型,这也直接推高了研发与制造成本,因此,iPhone Ultra将成为苹果史上定价最高的iPhone产品。 整体来看,随着苹果入局,阔折叠赛道竞争有望进一步加剧,同时也将推动相关技术与产业链持续升级。 iPhone Ultra渲染图
刚刚,DeepSeek大升级,V4真的不远了|附体验细节
就在刚刚,DeepSeek 网页端迎来大更新。 没有发布会,没有 blog,甚至连一条官方推文都没有。DeepSeek 网页端的输入框上方多了两个图标——一个闪电,一个钻石,分别对应「快速模式」和「专家模式」。 悬停一下,提示语出来了:快速模式「适合日常对话,即时响应」,专家模式「擅长复杂问题,高峰需等待」。 目前从实测和网友拆解来看,两个模式的差异大概是这样的: 快速模式,可以识别图片和文件中的文字,速度快,响应即时。代价是,背后跑的大概率是一个更轻量的 V4 Lite 模型,但针对速度做了优化。 专家模式,疑似路由到了更大、更强的模型——很可能就是 DeepSeek V4 正式版的某个形态。但目前它不支持文件上传,也没有多模态能力。等等,更强的模型,反而功能更少? 上下滑动查看更多内容 我们也做了一轮简单测试。 比如让两个模式各自写一个 p5.js 程序,模拟球在旋转六边形内弹跳,要求受重力和摩擦力影响。结果显示专家模式给出的结果更符合物理直觉,落点更准,弹跳轨迹更真实。 对比之下,快速模式给出的的结果肉眼可见差了一个档次。 这种差距,其实挺能说明问题的。物理仿真对数学推理能力要求高,弱一点的模型容易出现「看起来像物理但实际上不对」的结果。专家模式在这里的表现,是实打实的能力差异。 但网友 @AiBattle_ 让其制作的太空侵略者游戏结果却让人有点意外:专家模式的输出和快速模式差距并不明显。 做测试的网友给出了一个判断:「我估计专家模式现在路由的仍然是某个版本的 V4 Lite。要看到完整版 V4 在网页端上线,可能还得再等一阵。」这个判断和外部报道的时间线基本吻合——晚点 LatePost 报道,V4 正式版预计今年 4 月亮相,届时大概率仍是开源最强,但报道也点明「很难是碾压级的强」。 换句话说,这次灰度上线的「专家模式」,未必就是最终形态。 创意写作方面,我给两种模式出了一道辩论写作题,题目是「替无聊辩护,论证无聊是现代人的奢侈品」。 专家模式的输出更长,逻辑链更完整;快速模式的文风则相对自然朴实。 上下滑动查看快速模式(前)和专家模式(后) 有意思的是,在这个任务上,两个模式的速度差距并不明显,甚至专家模式的思考时间更短。这有点反直觉,但可能和任务性质有关——创意写作对模型规模的敏感度,远低于数学推理类任务。 对于简单任务,两个模式差异有限;越是需要深度推理的场景,专家模式的优势越明显。 在数学逻辑题「绳子绕地球一圈,加长 1 米均匀撑开,缝隙多高?」中,尽管两个模式给出了相同的答案,但过程截然不同。快速模式的回答很简略;专家模式则一步一步拆解,每个推导环节都交代清楚,更接近「把思考过程写出来」这个指令要求。 上下滑动查看更多内容 值得一提的是,目前网页端实际上线的只有快速和专家两个模式,但此前的爆料显示,还有第三个选项正在路上——「Vision 模式」。 图片来自互联网 关注 DeepSeek 技术路线的博主 Teortaxes 认为:把 Vision 单独列为一个类,是很不寻常的设计。他提到,DeepSeek 此前拒绝在网页端部署 DS-VL 系列,原因是「尚未成熟」。如果 Vision 模式真的上线,背后支撑它的,很可能已经是一个「完全功能化」的 VLM。 而 Teortaxes 在他的长评里,给出了一个更大胆的猜测——这个视觉模型,有可能不是常规的 VLM,而是某种「深度统一世界模型」,是 Janus 系列的下一步演化,或者其他更非传统的架构。 当然,这仅仅只是他的猜测,也有网友 @xhyctf 表示,DeepSeek 被逆向的前端代码显示,Vision 模式,根本就没有独立的模型。所谓「视觉理解」,只是在快速模式下悄悄加了一个参数——filefeature.vision = true。 尽管如此,有一点是确定的:DeepSeek 在多模态方向一直都有所布局,或许只是差一个良好的时间窗口。而把快速、专家等入口摆在用户面前,背后其实是一个更值得关注的方向: DeepSeek 开始做产品分层了。 自去年初爆火以来,DeepSeek 的产品逻辑一直是高度「反商业」的——API 定价较低,网页端完全免费,功能也没什么门槛区分。但问题也随之而来:长期维持这种「全免费、无分层」的运营方式,商业上是不可持续的。 现在,DeepSeek 开始把「更强的模型」和「更基础的模型」做成两个入口。专家模式目前还是免费的,但这个架构一旦搭好,后续要在上面做付费体系,技术上已经不是问题了。 当然,分层的目的,未必只是为了收费。 把用户自然地分流到两个入口,让真正需要深度推理的请求走专家模式,日常对话走快速模式——这本身就是一种算力调度策略,限额限流,缓解峰值压力。 收费是一条路,限额是另一条路,两条路都能走,也可以同时走。而这整件事拼起来看,也是一个很完整的铺垫路径: 先灰度上线分层入口 → 让用户感知差异 → 打通多模态和文件能力 → 视觉模式开闸 → 限额/给更强大的模式定价。当然,这仅仅是我个人的推测,毕竟 DeepSeek 从来不按常理出牌。 诚然,大家给 DeepSeek 贴了太多标签——技术理想主义、反商业、普惠 AI。然而, GPU 的推理成本每个月都是实打实的。幻方的量化收益再丰厚,也很难靠卖 API 填完一个全球级 AI 服务无限期免费运营的窟窿。 DeepSeek 搅动了整个 AI 圈,但现实也终将搅动 DeepSeek。
Anthropic宣布练出神话级模型:Claude Mythos,代码和黑客能力吊打opus4.6,不向公众开放!
Anthropic今天宣布了一个计划:Project Glasswing(玻璃翼计划),之所以推出这个计划是因为Anthropic训练出了一个全新的超强模型Claude Mythos Preview,这其实就是前两天cc源码泄露中提到的模型。 项目参与方包括亚马逊AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks,以及Anthropic自己,共12家机构联合发起。 说人话就是由于这个模型太强了要采取安全测试模式,只给认可的机构内部使用,不对外开放,有多强呢,大家直接看数据,代码和推理能力吊打opus 4.6: 代码: 推理: 搜索与计算机使用 opus字面意思是杰作,Mythos字面意思是神话,Anthropic CEO以及合作方一众大佬都出来为这个计划站台了。 Anthropic明确表示,不打算将Claude Mythos Preview向公众开放。但长期目标是让用户能够安全使用同等能力级别的模型。为此,他们计划先在即将推出的Claude Opus模型上开发和验证相关安全防护机制,在风险可控的条件下完成迭代,再逐步推进,可能很快会推出一个opus 新版本提供相应的能力。 我们来详细看看Project Glasswing究竟是什么东西 这个模型发现了什么? 过去几周,Anthropic用Claude Mythos Preview扫描了世界上主流的操作系统、浏览器和其他重要软件。 结果:发现了数千个此前从未被发现的零日漏洞,其中大量被评定为高危级别。 几个具体案例: OpenBSD中一个存在了27年的漏洞。OpenBSD以安全性著称,被用于运行防火墙等关键基础设施。这个漏洞允许攻击者仅通过连接目标机器,就能让其远程崩溃。 FFmpeg中一个存在了16年的漏洞。FFmpeg被无数软件用于视频编解码。模型找到漏洞的那行代码,此前已被自动化测试工具扫描了500万次,从未被发现。 Linux内核中,模型自主发现并串联了多个漏洞,使攻击者能从普通用户权限提升至完全控制整台机器。 以上漏洞均已向相关软件维护方报告,目前已全部修复。其余漏洞,Anthropic已先行发布加密哈希值,待修复完成后再公开具体细节。 为什么要做这件事? Anthropic给出的判断是:AI模型在发现和利用软件漏洞方面的能力,已经超过了除少数顶级人类专家之外的所有人。 这种能力的扩散,是时间问题,而不是是否会发生的问题。 全球网络犯罪造成的经济损失每年估计约为5000亿美元。针对医疗系统、能源基础设施、政府机构的攻击已经造成实质伤害,也已对民用和军事基础设施构成持续威胁。 AI让发动这类攻击所需的成本、门槛和专业程度都大幅下降。 Anthropic的逻辑是:与其等别人先把这种能力用于进攻,不如主动把它用于防御。 计划具体怎么做? Project Glasswing目前包含两个层面。 第一层面是12家创始合作伙伴,他们将获得Claude Mythos Preview的访问权限,用于扫描和修复自身核心系统的漏洞,重点方向包括本地漏洞检测、二进制黑盒测试、端点安全、渗透测试等。 第二层面是另外40余家构建或维护关键软件基础设施的组织,同样将获得模型访问权限,用于扫描自有及开源系统。 Anthropic为此承诺提供最高1亿美元的模型使用额度。研究预览期结束后,Claude Mythos Preview将向参与方提供商业访问,定价为每百万输入/输出token 25/125美元,支持通过Claude API、Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry接入。 此外,Anthropic通过Linux基金会向Alpha-Omega和OpenSSF捐赠250万美元,向Apache软件基金会捐赠150万美元,合计捐赠400万美元,用于支持开源软件维护方应对这一新形势。开源软件维护方可通过Claude for Open Source项目申请访问权限。 接下来的计划 在信息共享方面,合作伙伴将尽可能互通信息和最佳实践。Anthropic承诺在90天内公开发布研究进展报告,内容包括发现的漏洞数量、已修复的问题,以及可披露的改进成果。 在政策建议方面,Anthropic将与主要安全机构合作,就以下方向形成实践建议:漏洞披露流程、软件更新流程、开源与供应链安全、安全软件开发生命周期、受监管行业标准、漏洞分类的规模化与自动化、补丁自动化。
英特尔确认加入马斯克TeraFab项目 全面赋能芯片设计、制造与封装
快科技4月8日消息,据媒体报道,英特尔宣布,将加入马斯克此前公布的TeraFab项目。 英特尔表示,其代工部门在大规模设计、制造和封装超高性能芯片方面的能力,有助于加速TeraFab项目实现每年1太瓦(1000吉瓦)算力的目标。 不过,英特尔并未附带任何官方文件或具体说明,几乎没有透露双方合作关系结构的具体细节,这也引发了外界对于英特尔在TeraFab项目中所扮演角色及合作法律约束力的质疑。 从英特尔的表述来看,其更倾向于暗示一种虚拟的半导体生产生态系统,甚至是一个由英特尔、特斯拉、SpaceX和xAI等公司共同参与的联合体,涵盖芯片设计、制造和封装等环节。 马斯克在上个月宣布,旗下航天公司SpaceX及人工智能企业xAI联合启动代号为“TeraFab”的超级芯片制造项目,这将是迄今为止规模最大的晶圆厂计划。 其目标是实现每年超过1太瓦算力的产能,约为当前全球芯片年产量的50倍,其中约80%的算力将服务于航天相关领域,剩余约20%则用于地面应用。 TeraFab项目计划建造一座涵盖逻辑芯片、存储器芯片以及先进封装等关键环节的超大型工厂,这是目前全球其他地区都不存在的半导体设施。 由于芯片生产的所有设备都集中在同一工艺建筑下,可实现快速迭代循环,并减少不同节点之间的运输环节。 该设施将分两期建设,一期工程预计2027年下半年投产,2028年实现首批芯片量产,二期工程则计划在2030年全面竣工。 TeraFab预计将制造两种芯片:第一种用于边缘推理,主要应用于特斯拉汽车和Optimus人形机器人;另一种则是专门用于太空AI系统的高性能芯片。 【本文结束】如需转载请务必注明出处:快科技 责任编辑:鹿角
消息称苹果明年推新款MacBook Neo:搭载A19 Pro芯片、12GB内存
IT之家 4 月 8 日消息,据台湾地区科技专栏作家、前彭博社记者蒂姆 · 卡尔潘透露,苹果计划明年推出新款 MacBook Neo。 卡尔潘在今日最新一期的《Culpium》时事通讯中表示,新款 MacBook Neo 将搭载 iPhone 17 Pro 系列所使用的 A19 Pro 芯片版本。这意味着该款下一代笔记本电脑将配备升级至 12GB 的内存,因为此芯片在 iPhone 17 Pro 机型中搭载的统一内存即为 12GB。 据IT之家了解,现款 MacBook Neo 搭载 A18 Pro 芯片,配备 8GB 内存。 A19 Pro 芯片在 iPhone 17 Pro 机型中拥有 6 核图形处理器,但卡尔潘预计,苹果会在下一代 MacBook Neo 上采用经过筛选的 5 核图形处理器版本。现款机型同样搭载 5 核图形处理器,因此这一配置不会发生变化。 外界早已普遍推测 MacBook Neo 最终会搭载 A19 Pro 芯片,而卡尔潘从亚洲供应链消息源获取的信息,让这一推测成为确切传闻,并明确了其将于明年发布的时间线。苹果于今年三月初推出了现款 MacBook Neo,截至目前该产品销量表现十分火爆。 据 DigiTimes 今日另一篇报道称,MacBook Neo 在中国和越南组装生产。卡尔潘表示,由于销量明显超出预期,苹果正与供应商洽谈,计划提高 MacBook Neo 的产量,但他同时指出,苹果也因此陷入了一个巨大的困境。
Metallica演唱会沉浸式视频登陆苹果Vision Pro,在家就能前排嗨
IT之家 3月16日消息,苹果公司昨天为Vision Pro用户带来了一场独特的沉浸式体验 —— 金属乐队(Metallica)2024年墨西哥城演唱会。用户通过价值3499美元的Vision Pro头显,即可身临其境地感受这场视听盛宴。 据IT之家了解,此次演唱会于2024年9月29日录制,是金属乐队M72世界巡回演唱会的收官演出。演出内容囊括了众多经典曲目,如《One》和《Enter Sandman》,并以180度视频和空间音频技术呈现,为用户带来超高分辨率的沉浸式体验。苹果公司营销传播副总裁托尔・迈伦(Tor Myhren)表示:“通过Vision Pro观看金属乐队的演出,你会感觉自己仿佛置身现场 —— 前排座位、后台,甚至与这支传奇乐队同台演出。” 自2024年初推出以来,Vision Pro的市场表现较为平淡,未能达到苹果手机和笔记本电脑的高度。最初,苹果主要面向开发者推广该产品,希望他们能够为其开发应用程序。为此,苹果在产品发布前举办了多场“测试实验室”,邀请开发者参与体验。 然而,近期苹果开始推出更多面向普通消费者的功能,并利用其顶尖技术提升产品吸引力。在金属乐队演唱会的录制中,苹果采用了高端视频技术,通过14台苹果沉浸式摄像机捕捉了多个视角的画面,包括超过65000名热情观众的场景。这些摄像机包括稳定摄像机、悬索摄像机和遥控轨道摄像系统,全方位捕捉舞台动态。 在奥斯汀的西南偏南音乐节(SXSW)上,金属乐队鼓手兼创始人拉尔斯・乌利奇(Lars Ulrich)谈到将演出转化为增强现实体验的感受,称其“相当震撼,有些超现实”。
AI机器人成骚扰电话“帮凶”!工信部连夜部署查处3·15晚会曝光问题
快科技3月16日消息,今天凌晨,工业和信息化部官方微信公众号“工信微报”发文,称工业和信息化部连夜部署查处“3·15”晚会曝光问题。 针对“3·15”晚会曝光的智能机器人拨打营销骚扰电话、 虚商实名制要求落实不到位等问题,工业和信息化部高度重视,连夜组织北京、上海、广东等地通信管理局对涉嫌违法违规主体进行调查处置,责令基础电信运营商立即关停涉事线路、对涉个人数据信息有关情况进行核查,督促互联网平台企业全面清理违法智能外呼软件销售推广信息。 同时,将持续采取有力措施,强化对基础电信运营商、虚拟运营商、呼叫中心企业监督检查,严厉查处违法违规企业,加大曝光力度,积极配合有关部门依法打击网络黑灰产业等违法犯罪行为,全力营造安全健康的信息通信消费环境。 据了解,今年央视3·15晚会再次将矛头对准了“骚扰电话产业链”,此次一个意想不到的“帮凶”浮出水面——AI外呼机器人。 据报道,一年多来,互联网上出现了很多所谓“外呼”业务的广告,这些外呼公司的核心业务,就是帮助商家向手机用户拨打自己的营销电话,俗称“电销”。这些外呼公司打着“高效触达用户”“精准拓客”等旗号招揽生意,甚至还宣称可以通过AI智能机器人拨打营销电话。 根据这些“外呼”网站上的联系方式,315晚会记者前往多地进行调查。 眼下,使用所谓人工智能机器人拨打营销电话已经成为行业主流。 首先是机器人不知疲倦,可以日夜拨打营销电话,其二,智能机器人输出的声音由真人录音制作而成,让接听用户难辨真伪。 根据报道,在一家名为智优擎的网络科技有限公司里,负责人田经理打开了一套给客户测试运行中的系统后台,一家口腔医院的智能机器人的话术呈现在电脑屏幕上,每句话都设有相应的触发关键词,一旦消费者说了相关的语句,智能机器人会转到对应的回复内容。他表示,“AI种类分得很广,这种是纯外呼AI,AI在前期,相当于无限接近一个真正的人帮你呼叫这个电话。” 根据《中华人民共和国民法典》,无论是外呼智能机器人,还是真实的电话营销人员,不经消费者同意拨打这类营销电话,都属于违法行为。
百度连发两个新模型对标DeepSeek,我让它挑西瓜、卖烧烤,细节全在这了
如果说去年没有自研类 GPT-4 模型是寸步难行,那么今年 AI 的发展方向愈发具象化——没有深度推理模型同样是万万不能。 这也激发了大厂在 AI 叙事的新一轮竞赛,除了接入 DeepSeek ,腾讯元宝、阿里夸克等都密集推出自己的深度思考模式,争夺 AI 时代的超级应用。 百度也不例外,自年初以来,旗下百度文库、文小言 App 等产品陆续整合了 DeepSeek-R1 模型。 当然,自研模型与接入 DeepSeek 并非对立的选择,也无需在二者间做非此即彼的取舍。 在文心一言初次亮相两周年之际,百度今天正式发布了文心大模型 4.5 以及深度思考模型 X1,APPSO 也受邀提前进行了体验。 简单概括这两款模型的「人设」: ⽂⼼⼤模型 4.5:原⽣多模态基础⼤模型,擅长生成或解读图片、解答问题 深度思考 X1:深度思考模型,支持多⼯具调⽤ 两款模型已在文心一言官网上线,附上免费使用 https://yiyan.baidu.com 挑西瓜、懂梗图、辨古画,文心 4.5 的多模态能力到底有多强? 先说文心 4.5,作为原⽣多模态基础⼤模型,它在多模态识别理解能力上给了我不少惊喜。 面对经典的挑西瓜环节,文心 4.5 给出了颜色、条纹、声音、瓜地等多种判断依据,但作为一个成熟且务实的 AI 老瓜农,它也没敢把话说死。 话糙理不糙,只有切开尝过才知道哪个西瓜最甜。 在识别「梗图」方面,文心 4.5 也手拿把掐。扔一张表情包试试水,它成功识别了这个猪猪侠的身份,而在另一张表情包的识别上,文心 4.5 不仅读懂字面意思,还能准确捕捉到背后的隐喻和言外之意。 这里有个小窍门,除了基本的分享功能,它的回答还能一键存百度网盘,或者自动生成文档,遇到 AI 的神回复还能随时收藏,操作衔接相当丝滑。 再考考理解力,脑筋急转弯走起。 「有一个字,人人见都会念错?是什么字?」这题它轻松拿下,没有被绕进去,逻辑推理过程条理清晰,还顺手抛出几个贴合主题的追问。 9.8 和 9.11 哪个大?小菜一碟。然而,我连续测试了几次「Strawberry 里有几个 r」,它的自信溢出屏幕,但也都接连翻车了。 来道能同时考究运算能力和图片识别能力的物理题。它先淡定分析结构,再逐一拆解选项,最后稳稳锁定正确答案 D,过程有理有据,颇有几分「物理课代表」的风采。 日常生活中,我经常会碰到一些不知出处的古画或者电影截图,最惯常的做法就是在社交平台上发帖和在评论区求助热心网友,现在或许可以丢给文心 4.5 试试。 经过测试,即便关闭联网搜索功能,它依然能一一精确作答。 除了图片,音频识别也不含糊,比如我随手用手机录了段《晴天》,它靠歌词秒认出歌曲,不过,碰上一些过于冷门小众的歌曲,就不太能指望它。 另外,不管是上传科技行业报告,还是前阵子李飞飞在 X 平台公开的那段 44 秒机器人最新成果演示视频,文心 4.5 的总结能力都让人挑不出毛病。 去年 11 月份,百度发布了检索增强的文生图技术 iRAG 技术,主打一个无幻觉,超真实。 其核心原理是将百度搜索的亿级图片资源与强大的基础模型能力相结合,通过检索真实可靠的图片数据,为生成图像提供精准的参考。现在文心 4.5 同样支持生成图片。 比方说,最近特斯拉市值波动剧烈。于是,我给世界首富马斯克谋了条出路,让文心 4.5 生成一张「马斯克夜晚摆摊卖烧烤」的照片, 烧烤摊还差个照片,别急,它还支持局部重绘功能,细节调整很人性化。 不过,它在生成文字上还有待改进,比方说,我想给马斯克「重绘」一个「马氏招牌」,要么文字模糊难以辨认,要么位置偏差,几轮尝试下来均以失败告终。 慢思考≠慢,X1 打开深度推理模型的正确使用方式? 再来说说,百度今天推出的深度推理模型 X1,这显然是对标 DeepSeek R1 的一款模型。 据官方介绍,⽂⼼⼤模型 X1 由百度 2023 年 10 ⽉发布的慢思考技术进化而来,理解、规划、反思、进化能力全面拉满,还支持多模态。 赶时间,把问题交给文心 4.5,复杂长任务则由深度推理能力更强的 X1 负责。 拿推荐广州美食这事来说,文心 4.5 只是潦草回答一些笼统的美食称呼,比如「肠粉」之类敷衍了事,而 X1 直接化身「贴心导游」,店名+地址一条龙奉上,更懂游客的心思。 面对经典的电车难题,X1 的思考时间并不算慢,分析得头头是道,还从不同伦理体系的角度聊了聊结果,深度和广度都在线。 再来一道更复杂的逻辑推理题,X1 的表现也可圈可点。 多⼯具调⽤是⽂⼼ X1 的特⾊之⼀。 官方表示,X1 目前已经解锁高级搜索、文档问答、图片理解、AI 绘图、代码解释器等多款工具。 我突发奇想,上传了一张心形图片,图片中实则嵌着一个数学公式,看似简单却颇具挑战性,毕竟从图像中提取数学信息需要较高的视觉理解和逻辑处理能力。 至于结果嘛,它顺利提取出公式内容,还解释了这个公式的含义。 复杂的文字生成能力也是 X1 的亮点,我首先要求 X1 生成一个 500 字的剧本,主题是「林黛玉倒拔垂杨柳」,剧本「以柔克刚」,保留了林黛玉的性格特征,还融入了戏剧化的冲突与转折。 紧接着,我进一步要求 X1 从心理学的角度分析这个剧本,并在此基础上润色出一版 1000 字的新剧本。 这次的任务显然更复杂,X1 运用的理论得当,虽然不算特别深刻,但对于一个 AI 模型来说,能在短时间内完成如此跨学科的解读,已属难能可贵。当然,也不是没有缺点,字数就没达到要求。 就回复而已,相比于 Deepseek 满嘴「通货膨胀」的社科黑话,X1 在语言输出上显然比较克制,表达更流畅也更接地气,多了一些直抵人心的温度。 DeepSeek 则以全面的思考见长,追求技术深度和思维广度,但语言上稍显疏远。 最近,科技博主 Alexander Doria 抛出个观点—— AI 领域的下一个发展周期将是「模型本身即产品」,谁能搞定模型训练,谁就握住了未来。 他还引用了 Databricks 投资人 Naveen Rao 的预测: 「未来 2-3 年,闭源 AI 提供商将停掉 API 服务,只有开源模型会继续提供 API,闭源公司会转而打造更独特的能力。」 反观国内市场,百度的表现颇具代表性。 自两年前文心一言发布以来,百度在自研模型上的投入持续加码,迭代节奏稳定,文心 4.5 和 X1 的亮相,同样是「模型即应用」趋势的最佳注脚。 前者靠万亿参数直击多模态能力,后者凭慢思考和多工具调用秀出推理肌肉。这种差异化的能力布局,精准契合了用户多样化的需求,更让模型本身从单纯的技术内核转变为可以直接上手使用的「产品」。 回溯历史,百度在搜索时代的技术积累和移动互联网时期的转型尝试,都曾让其站在风口之上,但也因节奏把握或市场竞争而错失一些先机。 映照当下,如果将 AI 比作「火种」,两年前的百度无疑是中国市场上最懂得用火的「普罗米修斯」。但奈何与过往一般,作为中国 AI「黄埔军校」的百度,却是起了个大早,赶了个晚集。 这离不开 AI 行业生态的潮水流动。 OpenAI CEO Sam Altman 曾在上月预测,使用固定级别 AI 的成本大约每 12 个月骤降 90%。 成本的快速下降削弱了闭源模式赖以生存的高壁垒,使得技术垄断的护城河逐渐变浅。与此同时,开源与免费的模式因其低门槛和高可及性,成为吸引用户、扩大技术影响力的新路径。 DeepSeek 和 Manus 接连在短时间快速渗透,也说明了目前 AI 产品还没有显著的壁垒,哪个体验更好用户就转向哪个,不会有一点留恋。 无论对于百度还是其他大厂,抑或独立开发者,似乎又回到了移动互联网兴起的草莽时代。
RTX 50缺货乱象:装机商自曝被割韭菜、玩家实惨
快科技3月16日消息,NVIDIA的RTX 50系列显卡自发布以来,缺货问题一直困扰着市场,就连专业的装机商也难以幸免。 美国装机商PowerGPU的老板杰西·马丁内斯(Jese Martinez)在社交媒体上爆料称,他们拿到的RTX 5090显卡价格已经飙升至3050至3100 美元。 要知道RTX 5090的官方建议零售价才是1999美元,而且PowerGPU拿到的这些显卡是丐版型号,还不是涨价更疯狂的高端型号。 马丁内斯表示,从2月RTX 5090上市至今,他们总共只拿到几块显卡,3月中旬仍然需要加价抢货,就这还基本上被经销商“剃了光头”。 马丁内斯还透露,就连自己也没用上RTX 5090,而是用的5080,他还晒图对比AMD RX 9070和RTX 5090的库存,前者直接堆成山,后者影子都见不着 显卡涨价的背后,一方面是黄牛和经销商坐地起价,RTX 5090的批发价远高于官方建议价;另一方面,AI公司大量采购显卡,导致游戏显卡被拿去跑AI模型,普通玩家成为“二等公民”。 当然也少不了NVIDIA官方的不作为,官方只管把显卡卖给合作厂商,后面涨价乱象却根本不管 。 尽管NVIDIA声称正在加大供货量,但显卡从出厂到玩家手中的过程仍然面临重重阻碍,从芯片厂到经销商,整个链条都在闷声发财,最后可能只有玩家的钱包受伤。
贵也值得买,雷军终于把小米品牌做成了
雷军造车 小米成了 1 年前,小米 SU7 发布前夕,网友们看到民间和官方泄露出来的照片,看到车身尾部的「小米」和「xiaomi」标志,还有前舱盖上的「mi」logo,再加上雷军预热小米首款汽车不会很便宜,9.9 万元交个朋友的价格绝对不可能,所以网友们还是有点不乐意。 不乐意的第一点就是,小米造车应该换个牌子,小米品牌听起来不高端,实际上也不那么高端。 不乐意的第二点则是,雷总造车,是不是有点飘了,背叛群众了,不和大伙交朋友了? 在很长的一段时间里,「米冲高」是一个类似于「屡败屡战」的词,自十多年前小米手机和 1999 元深度绑定之后,这个数字就成了小米的杀手锏,同时也成为一种枷锁。说好听点,抹除渠道溢价,通过电商销售的性价比模式,让小米小成,不好听的话就是,「得屌丝者得天下」的时代,小米品牌和小米用户的价值都是不够高的。 这也是为什么小米 Note 发布,初次尝试突破 1999 元价位的时候,外界有些哗然且手机最终战败的原因:米粉只是长大,并不是有钱了。而其他人,并不认为小米品牌的手机可以卖这么贵,即便它也只是小心翼翼的把顶配版价格定在了 2499 元。 哦对了,小米 Note 当时还尝试了女性市场,推出了女神版,但同样铩羽而归,在 OV 面前不是一合之敌。 后来,小米尝试了很多方法,来让小米品牌走出性价比,屌丝和低端的印象,比如推出 Redmi 品牌,把性价比的衣钵传出去;继续推出小米 Note 2 系列,并且请来了梁朝伟代言,塑造优雅商务的形象;和徕卡联名,让小米数字系列成为高端机的一员,再推出 Ultra 系列手机,不求出货量,但求一个机皇的名号。 可以这么说,在小米造车之前,小米手机的「米冲高」算是略有小成,但小米在汽车领域的品牌号召力,还需商榷,这也是开头大伙疑问的由来,小米在汽车领域,算大牌吗? 手机跨界到汽车,肯定是要交学费的,哪怕是华为,也在问界身上也交了不少学费。 类似的,小字辈里的小鹏也差不多,也是很多网友表示,自己不买小鹏汽车的原因,不是因为车不好,而是这个牌子听着就不够高端。 只不过,这两个一度都不被看好的「小」字辈在最近都相当争气,一个初生牛犊仅依靠一款纯电轿车就成为新势力的 Top3 选手,一个则从销量低谷走出,连发爆款,成为新势力销冠。 于小米而言,小米 SU7 的热销,打破了汽车行业不少的迷信思维,比如说纯电和运动取向的轿车,不如增程和家用取向的 SUV 好卖,小米 SU7 等于是顶着三个 Debuff 把事情做成了。 可能雷军自己也没有想到,小米 SU7 以试水的姿态进场,结果掀起了惊涛骇浪,行业风向发生了巨大的改变,像是魏建军等曾经不太出现在大众视野的老板,开始勤奋直播出镜,拉近品牌的路人缘,而在一定程度上,小米 SU7 也奠定了行业对于纯电产品的信心,毕竟小米 SU7 是相似价位段里唯一卖得比 Model 3 好的纯电轿车。 2022 年,在小鹏内部被寄予厚望的小鹏 G9 上市,但是因为杂乱的 SKU 设计,用户需要在复杂智驾版本和续航版本中进行复杂的排列组合,最终导致本该大爆的产品没有成为爆款。 小鹏的惨痛教训成为业界的宝贵经验,各家车企设置各种 SKU 的时候,更加注意降低消费者选购的门槛,到了小米这里,情况又发生了一些变化。 小米 SU7 分为普通版,Pro 版和 Max 版,20 万出头,到 30 万左右,Ultra 版本另算,实际上对于消费者来说,Max 版是最好的选择,同时也是小米卖得最好的版本。 小米 SU7 上市一个多月之后,锁单近 9 万辆的时候,雷军曾经透露过,小米 SU7 各版本中,Max 版订单占比达到43.16%,Pro 版本和标准版分别占到 28.7%、28.57%。 也就是说,消费者面对小米 SU7 的时候,基本上只有一个念头:买最贵的那个版本就好,除非实在是买不到,或者买不起,因为最贵的,是最值的。 小米和雷军没有放弃性价比,但对性价比的理解,更深刻了。 小米 SU7 Ultra 呢? 更有趣的现象出现了!即便是小米 SU7 Ultra 有大量现车可供选购,但仍有海量的消费者宁可等待生产排期,以及多花 4.2 万元选购碳纤维双风道前舱盖,也不买普通前舱盖的现车。 选装碳纤维双风道前舱盖的小米 SU7 Ultra 小米 SU7 Max 版本的大卖,以及 小米 SU7 Ultra 这个碳纤维双风道前舱盖的独特吸引力,说明小米汽车现在的消费者,再也不是那些对配置精打细算一番,然后选购入门款的人群了,而是对情绪价值,社交价值更为看重的人群。 简言之,当消费者愿意为你的产品「多花钱」的时候,你的品牌也就成了。 在小米 SU7 Ultra 上市发布的第二天,我的一个朋友,之前是保时捷车主,现在是宝马性能车车主,对新势力抱有一些天生鄙视的中青年交际男性,在我的介绍下,打开了小米汽车的小程序,尝试选购小米 SU7 Ultra 看看配置情况。 小米 SU7 Ultra 标配超大尺寸碳陶制动盘 在短短十分钟的时间里,他完成了质疑小米,理解小米,爱上小米,如果有钱并且老婆不反对的话就会下单小米的转变,用他的话来说,就是小米 SU7 Ultra 非常厚道,别家要选购的,它标配;别家 100 多万可能才有的配置,它也标配。 老车手的感觉是这样的,社交网络上看完整场小米双 Ultra 发布会的年轻人也是差不多的感觉: 虽然我买不起小米 SU Ultra,但是雷军就是有一种魔力,让我觉得 50 多万的车竟然不贵?! 再回过头来看看,2018 年雷军说出那句「做感动人心,价格厚道的产品」时,大家还以为「厚道」只是「便宜」的委婉表达,但现在来看,30 万的小米 SU7 Max 也很厚道,50 多万起的小米 SU7 Ultra 也厚道,哪怕时是要花 4 万多选装的一个前舱盖,也可以说厚道。 这就是为什么说小米品牌在小米 SU7 Ultra 上市发布之后完成了进化,因为小米品牌不再是一个「因为便宜,所以值得」的品牌,而是一个「贵,但也值」的品牌。 佐证小米品牌因为雷军造车完成进化的数据则是雷军自己透露的,去年国内售价 50 万元以上的轿车一共卖出了 12.1 万辆,小米 SU7 Ultra 上市 72 小时大定订单突破 1.9 万辆,锁单量达 1.08 万辆。 除了产能,没有什么能够限制小米汽车了。 相应的,则是一些传统合资品牌,或者海外汽车品牌,开始缩减产量,甚至关停工厂了。 以及,一些豪华车品牌开始降价了。 在小米 SU7 Ultra 正式发布前,从路特斯 Lotus 改回莲花品牌的莲花汽车宣布对旗下的 ELETRE 纯电豪华 SUV 和 EMEYA 纯电轿车进行降价,起售价从由老款的 72.8 万元和 66.8 万元降至 54.8 万元和 52.8 万元。 需要说明的是,莲花汽车的入门纯电车型虽然价格大降,但同时配置也有所降低,严格意义上不太算背刺老车主。 但是就在去年,莲花汽车 CEO 冯擎峰还表示,莲花汽车定位是百万级豪华车品牌,不参与价格战,毕竟虽然莲花销量一般,但历史上还是和保时捷以及法拉利齐名的品牌。 如今莲花的车型步入 50 万元区间,引起了不少花了大几十万近百万买旧车型车主的不满,同时也没有让潜在消费者感觉值得。比如售价 52.8 万元的入门版莲花 EMEYA 600 纯电轿车峰值功率为 450kW,零百加速 4.15 秒,标配 20 英寸轮毂,不配尾翼;相较之下,售价相差无几的小米 SU7 Ultra 的峰值功率 1138kW,零百加速 1.98 秒,标配 21 英寸轮毂和电动尾翼。 这样一对比,消费者感觉小米 SU7 Ultra 更值了,而作为对比的品牌,就显得「不便宜,也不太值」了。 品牌崛起之路的背后总需要一些背景板品牌,曾经小米手机背后,有 HTC、LG、索尼这些辉煌过但也没落了的手机品牌。 与此同时,当你的品牌成了的时候,曾经看不起你的品牌会选择和你站在一起,或者干脆强行蹭一把。 文 | 刘学文
iPhone 17 Air 新爆料:全面取消 SIM卡槽,只有一个摄像头
关于今年将发布的轻薄型号「iPhone 17 Air」,彭博社最新爆料了一些配置和变化: - 对比现在的 iPhone,厚度将减少 2 毫米,此前爆料称机身将为 5.5 毫米 - 6.6 英寸屏幕,超窄边框,ProMotion 高刷屏幕 - 重新设计的屏幕和芯片结构,让能耗达到和其他 iPhone 相当的续航 - 4800 万像素单摄像头,A19 芯片,以及 C1 基带。 - 全面取消物理 SIM 卡槽 - 价格对标 Plus 机型,900 美元左右,折合人民币约 6500 元 彭博社还进一步爆料称,iPhone 17 Air 只是一次试水。当苹果开发 iPhone 17 Air 时,还制作了一台 6.9 英寸,也就是和现在 Pro Max 机型相当,但最后苹果取消了这个设计,原因是担心又大又薄的手机容易弯折,陷入和 iPhone 6 Plus 一样的「弯折门」争议中。 苹果还有一个更有野心的想法:取消 iPhone 17 Air 的接口,完全依赖无线充电和云端同步数据。这个想法最终被取消,除了随之而来的争议,还有一个原因是担心取消 USB-C 接口可能会引发欧盟的调查。 如果 iPhone 17 Air 成功,苹果将再次尝试打造无接口的 iPhone,并且会推进更多机型的轻薄化进程。iPhone 17 Air 的技术,也将用于开发可折叠 iPhone,最早于明年推出。 彭博社还提到一些 iPhone Pro 可能到来的新变化:更多灵动岛的组件会转移到屏幕下方,以缩小它的面积,最终达到「真·全面屏」。 你期待 iPhone 17 Air 吗?评论区留言告诉爱范儿!
Win11记事本“最近”功能上线,“Rewrite”变身“Copilot”
IT之家 3月16日消息,Windows 11记事本正在迎来一系列重大更新,其中最引人注目的新功能是“最近”菜单。这一功能类似于画图程序中的“最近”按钮,用户可以通过它快速访问最近在Windows 11上通过记事本打开的.txt文件。不过需要注意的是,该“最近”部分仅包含通过记事本打开的文件,不会显示通过其他应用程序(如Word或画图)打开的文件。 IT之家注意到,Windows 11的记事本已经从一个简单的文本编辑器转变为一个功能强大的工具,与Windows 10版本相比有了质的飞跃,新增了诸如标签页、暗黑模式以及由AI驱动的重写工具等功能。用户还可以使用内置的拼写检查功能,甚至可以通过必应搜索来定义单词。 用户可以在记事本的文件菜单中查看最近编辑或打开的.txt文件,并且在需要时可以清除该列表。目前,这一功能正在向Windows Insider计划的测试者推出,预计将在几周内向所有用户开放。据Windows Latest的测试观察,用户可以在设置中关闭这一功能,也可以关闭Copilot功能。所有相关设置都可以在设置页面进行自定义。 此外,记事本中的“重写”功能现在更名为“Copilot”。微软正在将Windows 11中所有与AI相关的功能逐步整合到Copilot品牌下。此次更新后,记事本工具栏中新增了一个“Copilot”按钮,用户可以通过它打开原有的“重写”功能,该功能由ChatGPT提供支持。除了改变文本语气外,用户现在还可以选择全部文本并生成摘要。此前,该功能仅支持重写现有文本,而如今用户可以对内容进行总结。 不过,这一功能并非免费。用户需要拥有Microsoft 365订阅才能在记事本中使用AI 功能,并且需要支付Copilot Pro费用才能充分利用其功能。如果用户尝试点击该按钮,系统会提示用户登录Microsoft账户。登录后,记事本中的Copilot会检查用户是否拥有Microsoft 365订阅。如果用户不是个人或家庭计划的订阅者,则需要付费购买订阅,记事本还会提供一个“查看计划”页面的链接。这与Microsoft Word中需要Microsoft 365订阅的Copilot集成类似。不过,在美国,即使没有Microsoft订阅,用户也可以在记事本中使用Copilot,但会受到有限的积分余额限制。
米哈游蔡浩宇AI游戏曝光:大模型驱动数字人实时互动,玩家自定义开放剧情,内测已开启
米哈游创始人蔡浩宇的神秘AI游戏公司,首个项目曝光了! 官方给的一句话介绍是:你的对话决定了她的命运。 自动播放 这款游戏名叫《Whispers From The Star》,它主打由AI驱动角色实时对话。可以提供开放式、个性化、身临其境的体验。 据说本产品或为实验性作品,主要验证多模态驱动下的实时交互表现,画面为100%实时演算。 而且主要平台是手机。 内测仅支持iOS 12以上的手机。 用AI颠覆传统游戏互动 游戏具体设定如下: 主角是一个天体物理系女生Stella,她意外坠落在了一个外星星球上,你是她唯一能联系的人。你的任务是帮助她生存下去,并离开GAIA星球。 Stella的对话是AI实时生成,根据玩家输入的对话,她的回答、情绪和动作都不固定。 预告片给出的游戏界面上显示了Stella的心率、环境温度以及信号强度。 玩家的每一句对话都可能影响故事线发展以及Stella的命运。 玩家可以通过视频、语音、文字的方式和Stella对话,让她分享自己的想法。 从已有信息来看,Stella的实时互动需要多模态AI、智能体等技术支持,画面是100%实时演算,但视频画面不是AI生成。 值得一提的是,内测体验仅支持iOS 12以上的手机。(这对本地算力以及延迟也是个大考验吧) 目前,Anuttacon已经在Reddit、LinkedIn等平台上发布预告片进行推广。小范围有了一波讨论度。 首先,大家都觉得全演算很牛、概念很新。 不过玩游戏还一直说话,这个逻辑通吗?有人有点质疑。 u1s1这种实时互动有点像当下比较火的AI虚拟陪伴。 在内测用户问卷中,Anuttacon调查用户的游戏经验时,乙游《恋与深空》上桌了。 同时也询问了用户是否有AI应用的使用经验。 当然在人物表情上,有美术领域大佬表示,还有进一步提升空间。 官宣半年,团队飞速扩容 说回Anuttacon,它是米哈游创始人蔡浩宇“退休后”的神秘创业项目,去年8月底才正式曝光。 Anuttacon的目标是用AI为游戏玩家带来前所未有的体验,突破互动娱乐的界限。 团队创立之初已有不少大佬加入,包括微软图形学大佬童欣、前B站游戏和直播负责人王宇阳等。 短短6个月时间,团队规模翻倍。但依旧是小而美,大约40人。 新曝光的一些团队成员包括微软软件工程师、Meta高级技术员、米哈游研究经理等。 Infra的主管Erik Li是从小鹏跳槽而来。小鹏建成的中国最大自动驾驶智算中心“扶摇”,他就是主要负责人之一。 目前,Anuttacon还在大力招人。官网放出的岗位都是AI相关,包括预训练、后训练、Agent、视频生成等。 最后,感兴趣的童鞋可以戳下方链接申请加入内测: https://wfts.anuttacon.com/ One More Thing 米哈游人不只是蔡浩宇盯上了虚拟陪伴向的AI游戏,前不久,原米哈游逆熵团队成员创办的半图科技完成数千万元天使轮融资。 该团队由米哈游、字节、叠纸等游戏与互联网人才。致力于打造沉浸式的3D AI体验,为人工智能赋予完美的虚拟形象。团队目前专注于 「3D智能交互+极致美学」的研发与相关应用。
一手实测百度X1:看得懂脑筋急转弯、秒解数理化难题、逻辑漏洞,还会自主调用工具
作者 | 程茜 编辑 | 漠影 文心一言发布两周年,百度搞了件大事! 智东西3月16日报道,刚刚,百度文心大模型4.5和文心大模型X1两款大模型上新,已上线文心一言官网并免费开放,比之前百度官宣的4月1日全面免费提前了半个月。 文心大模型X1是首个自主运用工具的深度思考模型,具备更强的理解、规划、反思、进化能力。其在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面的表现更强。 文心大模型4.5是百度自研新一代原生多模态基础大模型,在多个测试集上的测评表现已经超过GPT-4o。 该模型的能力可以用一个字“全”来概括,其图片理解涵盖照片、电影截图、网络梗图、漫画、图标等多种形态,也能理解音视频中的场景、画面、人物等特征,并且在生成名人、物品等方面更具真实性。 对于原生多模态大模型,3月初,百度创始人、CEO李彦宏在人民网发表的署名文章就提到:“原生多模态大模型,打破之前先训练单模态模型再拼接的方式,通过统一架构实现文本、图像、音频、视频等多模态数据的‌原生级融合,实现对复杂世界的统一理解,这是迈向通用人工智能(AGI)的重要一步。” 目前,文心大模型4.5面向企业用户和开发者开放,登录百度智能云千帆大模型平台即可调用API;文心大模型4.5、X1也将陆续上线百度搜索、文小言APP等产品,文心大模型4.5将于6月30日起开源。 文心大模型4.5输入价格为0.004元/千tokens,输出价格为0.016元/千tokens;文心大模型X1也即将在千帆平台上线,输入价格为0.002元/千tokens,输出价格为0.008元/千tokens。 文心X1与文心4.5价格对比图: 百度2024年财报显示,文心大模型的日均调用量已经达到16.5亿次的显著成绩,稳居国内大模型产业应用规模前列。此次伴随着新模型的发布,其将进一步扩宽技术赋能深度与场景覆盖广度。 体验地址:https://yiyan.baidu.com/ 一、全能选手上线,擅长看图说话、经典电车难题、多轮复杂交互 实践出真知,先来看下百度文心大模型X1的实战效果。 目前,X1已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等多款工具。 我上传了一张有山有水的风景图,并询问文心X1这是哪里,模型就会调用图片理解工具准确识别出地名。可以看到,文心X1在思考过程中完整呈现了其调用工具以及根据图片元素进行判断的诸多环节,并给出了准确答案——杭州西湖。 经典的电车难题,文心X1也可以给出全面的答案,可以看到其思考过程中首先明确了这是“经典的伦理困境问题”,然后通过理解这一背景和核心问题、分析不同伦理理论、权衡因素的过程,最后生成完整的答案。 面对经典的数理化难题“鸡兔同笼”,X1不仅答案满分,还在解题思路上自由发挥了一波。其在输出结果中附上了两种解题思路。 面对涉及到酒店住宿费用的计算难题,文心X1不仅给出了明确答案,并且输出的结果,清晰简洁,我可以一目了然题目计算过程中出现的逻辑漏洞。 在用户的实际场景中,其需求往往更为复杂,需要满足不同的限定条件,这也是大模型生成结果能满足用户需求的关键。我输入的指令是“帮我生成一个为期三个月的减肥计划”,此外,还给出了几个限定:工作忙、周末时间宽松、对部分食物过敏等。 可以看出X1给出的生成结果中,其对应给出了符合我特定需求的食谱,如果遇到食物本身包含鸡蛋、牛奶的,X1会在括号中给出替代的方案。并且考虑到工作的情况,计划表中还包含适宜在办公室进行锻炼的运动计划。 在多轮对话中,我首先给出了比较模糊的需求:去新疆旅行的最佳时间、只有法定节假日可以去怎么办、哪个性价比最高,基于之前的输入与输出结果,文心X1准确定位了我的需求,从新疆不同季节的景色变化到不同假期的人流量变化等进行分析,最终给出了性价比最高且符合我特定需求的行程安排。 文心4.5的能力也不在话下,其既能理解文本、图片、音视频等多模态内容,还可以进行图片生成、文本创作等,并完成输入内容中的逻辑梳理等。 在图片理解能力,我上传了一张照片,图中两个人物并没有清晰正脸,所以所以需要模型从整个画面的构图、场景等来判断,文心4.5不仅清晰展现出了场景的具体特征,还给出了电影名称、相关人物以及场景在电影中的意义等。 文本生成中,文心4.5还可以针对不同平台的特点生成相对应文案,如短视频平台的发布文案多为一句话概括、小红书文案需要配合文字以及emoji表情,此外,其还可以生成对应的视频脚本等。 我结合当下关注度较高的短视频爽剧,让文心4.5生成关于出身平凡主角隐藏惊人审视、顶级豪门云集、争夺商业帝国等元素的脚本。 生成结果中,文心4.5总共给出5个场景,涵盖了镜头切换、旁白台词、旁白语气等诸多完整元素。 整体来看,文心4.5的跨模态理解能力、捕捉细节能力、推理逻辑的连贯性等方面表现实现了全面的提升。 二、从训练提效、多模态理解生成到降低幻觉,百度核心技术攻坚 两大模型的表现升级背后,是百度在核心技术方面的突破与深耕。 从技术层面看,更全面的深度思考模型文心X1背后有三大核心技术,递进式强化学习训练方法、基于思维链和行动链的端到端训练、多元统一的奖励系统。 基于应用递进式强化学习方法,可以在创作、搜索、工具调用、推理等场景全面提升模型的综合应用能力。思维链和行动链的端到端训练可以针对深度搜索、工具调用等场景,根据结果反馈进行端到端的模型训练,显著提升训练效果。 文心X1的训练还建立了统一的奖励系统,融合多种类型的奖励机制,为模型训练提供更加鲁棒的反馈。 在此基础上,文心X1可以准确理解用户需求,并实现中文知识问答、文学创作、复杂计算、逻辑推理以及工具调用等多元化且强大的能力展现。 同时,作为原生多模态基础大模型,文心4.5背后也有百度的独特技术优势加持,具体来看就是FlashMask动态注意力掩码 、多模态异构专家扩展技术、时空维度表征压缩技术、基于知识点的大规模数据构建技术、基于自反馈的Post-training技术。 综合来看,这四大技术的目的就是全方位提升大模型的多模态理解能力,以及降低大模型幻觉,这也是大模型当下支撑用户实际应用、发挥更大价值的关键。 在提升模型能力方面,FlashMask动态注意力掩码可以有效提升大模型的长序列建模能力和训练效率,优化长文本的处理能力和多轮交互表现;多模态异构专家扩展技术能解决因模态差异导致的信息提取和处理困难的问题,提升多模态融合能力。 在提升模型训练效率方面,多模态大模型训练中还有一大难题是,其图片和视频通常占据大量的存储空间,在传输过程中也需要耗费较多的时间和带宽资源,时空维度表征压缩技术就可以对其语义表征进行压缩,提升多模态数据训练效率。 此外,为了进一步提高模型学习效率,降低幻觉。一方面,文心4.5通过基于知识点的大规模数据构建技术,在知识分级采样、数据压缩与融合、稀缺知识点定向合成技术加持下,构建高知识密度预训练数据;另一方面,基于自反馈的Post-training技术,大模型可以融合多种评价方式的自反馈迭代式后训练技术,提升预训练模型对齐人类意图能力。 这正是文心X1和文心4.5全方位性能得到提升的有力支撑。 三、四层技术体系全栈布局,百度已先人一步 将时间的标尺拉长,百度文心大模型的发展历程清晰映照出国产大模型茁壮成长的坚实轨迹 。 2023年3月16日,文心一言正式发布并开启邀请测试,首日超6.5万家企业申请调用。 同年10月,文心大模型4.0发布,彼时达到了与GPT-4性能相当的水平。从去年6月至今,文心大模型4.0 Turbo、性能强劲的轻量模型ERNIE Speed Pro和ERNIE Lite Pro到当下的文心大模型4.5、文心大模型X1。 如今,百度文心大模型家族持续壮大,成员数量稳步递增,模型类型愈发多元。 到2024年,文心大模型的日均调用量达到16.5亿,而2023年同期这一数字仅为5000万次,增长达到33倍。 作为国产大模型的头部玩家,百度已经基于大模型构建起了全栈技术布局,以支撑其上述业务体系的发展。 在当下,大模型的蓬勃发展正深刻改写AI时代的演进轨迹。从技术架构来看,其技术栈大致可划分为四个关键层级,自下而上依次为芯片层、框架层、模型层以及应用层,而百度也成为当下全球范围内鲜少的在这四层都有所布局的公司之一。 也就是在芯片层,百度智能云已经成功点亮自研万卡集群昆仑芯三代万卡集群,框架层飞桨文心开发者数量已经达到1808万名,应用层百度已经基于大模型重构了百度搜索、百度文库等多个国民级应用。 从更为具体的数据层面来看,百度近十年来的累计研发投入已经超过1800亿元。 截至2023年12月,百度全球AI专利申请超过2.5万件,国内AI专利申请量近1.9万件,中国人工智能专利申请量突破8000件,国内人工智能专利授权率行业领先。 可以看出,百度在AI领域的研发与积累已经转化为自身大模型研发的养料以及国内大模型产业发展的加速引擎,助推国内大模型产业发展在全球的竞争态势中飞速前进。 结语:全球大模型产业竞争加剧,百度开启国内赛道超车模式 当下,全球大模型产业发展的竞争态势仍然激烈,不光是基础模型的研发还是AI应用的规模化落地,都成为各家大模型厂商布局的关键。 一方面,基础模型作为整个大模型产业的根基,其研发难度极高且至关重要;另一方面,一个优秀的基础模型只有通过广泛的应用落地,才能真正实现其商业价值和社会价值。 以百度为代表的国内大模型产业代表玩家,正在这一波全球的技术发展浪潮中发挥自己的独特优势,并逐渐在这一竞争浪潮之中占据先机。
微软Win11更新KB5053598出问题,Copilot助手遭“误杀”
IT之家 3月16日消息,微软在推广“为每台 PC 添加 Copilot”助手的进程中遭遇了意外挫折。最新发布的Windows 11 KB5053598更新被发现存在一个严重漏洞,导致该人工智能助手被意外卸载。此外,安装了KB5053602(2025年3月安全更新)的Windows 11 23H2 系统也出现了Copilot助手消失的情况,甚至连Windows 10安装了KB5053606的系统也受到了影响。 据Windows Latest报道,微软已悄然更新了支持文档,确认了Copilot应用程序出现的意外问题。受影响的用户可能会发现Copilot助手被自动从Windows系统中卸载,并且从任务栏中取消了固定。微软在支持文档中指出:“我们了解到,微软Copilot应用程序影响了部分设备。该应用程序被意外卸载,并从任务栏中取消固定。” IT之家注意到,Copilot助手从Windows系统中消失并不是一个普遍问题,似乎只影响到部分系统。受影响的Windows版本包括: Windows 11 24H2 Windows 11 23H2和22H2 Windows 10 22H2/21H2 即便用户受到影响,也可以通过从微软商店重新下载Copilot助手,并手动将其固定到任务栏来解决。然而,值得注意的是,Copilot助手原本是自动安装在所有电脑上的,没有人要求在电脑上安装Copilot助手,而现在一个漏洞却“意外”地将其卸载了。 目前,微软尚未在其Windows问题仪表板上承认Copilot助手存在的问题。不过,微软表示,用户可以通过从微软商店重新安装Copilot助手,并将其固定到任务栏来轻松解决这一问题。此外,微软还指出,该漏洞并未出现在微软365 Copilot应用程序(最初称为 Office 365)中,并且公司正在“努力解决这一问题”。预计未来累积更新将重新添加被“意外”卸载的Copilot应用程序。 除了Copilot助手的问题外,Windows 11 2025年3月更新还存在其他重要问题,例如,Windows Latest收到了关于Windows 11 24H2系统安全补丁失败的报告。此外,还有报道称该更新会导致蓝屏死机错误,并且会引发固态硬盘崩溃。更糟糕的是,其中一个最普遍的问题与远程桌面(RDP)有关,更新后出现了“连接”故障。 目前尚不清楚微软是否正在调查Windows 11中这些严重问题,但至少微软已经意识到 Copilot助手被意外卸载的漏洞。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。