EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
INAIR发布空间计算机套装:眼镜、键盘、计算机三合一,AI情境感知能力提升,定价6999
作者 | 陈骏达 编辑 | 心缘 智东西5月15日报道,今天,国内AI空间计算终端创企INAIR发布了空间计算机套装INAIR 2 Elite Suite,将INAIR Glass眼镜(显示)、INAIR Pod空间电脑主机(运算)和INAIR Touchboard键盘触控板组合(交互)三大硬件集成,提供更为适应移动办公需求的空间计算体验。这一套装将于今年6月发售,定价为6999元。 INAIR 2 Elite Suite空间计算机套装中的INAIR Glass眼镜相当于一块随身的125英寸大屏幕,可提供沉浸式的工作体验。在智东西的体验中,这块4K屏幕的确提供了较高的清晰度,亮度适中。 INAIR Pod是专为AR设计的空间电脑主机,配备高通8核处理器、8GB运行内存和128GB存储空间。 交互方面,INAIR 2 Elite Suite空间计算机套装中的空间电脑主机可实现触控、空间指向交互,INAIR Touchboard键盘触控板组合则提供全键盘的输入交互。 ▲INAIR 2 Elite Suite空间计算机套装实拍 目前空间计算硬件仍需与手机、笔记本等其他计算设备互联,从而实现数据共享,可连接性便成了影响这类硬件可用性的关键因素。INAIR 2 Elite Suite兼容移动端应用生态,也可通过局域网、远程网络连接手机、电脑等设备。 为了让信息的呈现形式更贴合空间计算设备的特点,INAIR推出了INAIR空间渲染引擎。AI可以对2D画面进行深度分离,并将其重建为具有真实景深的立体图像。 智东西在现场体验了这一功能。当选择一张油画图片后,INAIR的空间渲染引擎可将这一画面变为立体感的空间,用户能直观感受到画面内不同元素的相对距离,仿佛置身在画中。这一空间渲染引擎也支持视频的3D重建。 INAIR还为本次发布的新品配备了更为强大的AI功能。ForeSight多模态感知功能可以理解用户的上下文,实时提供建议与帮助。Look to Ask(看即所问)功能让用户只需看着界面,自然说出问题,便能针对画面内容进行提问,不需要输入复杂的提示词。这些AI功能接入了多款主流AI模型,包括DeepSeek、豆包、智谱GLM等。 结语:结合AR与AI的空间计算机,能成为新一代生产力工具吗? INAIR的空间计算机产品主打生产力场景,而非娱乐功能,旨在通过智能化与自适应能力提升移动办公效率。 当下的空间计算产品虽然结合了AI技术,但其普及仍面临多重挑战:大众认知度与接受度不足、便携性与续航能力有限、计算性能有待提升。空间计算厂商们能否有效解决这些问题,或将成为决定此类产品能否从“尝鲜品”转变为“刚需生产力工具”的关键。
苹果提前公布 iOS 19 功能,为 13 亿少数人群而来
今天,是五月的第三个星期四。 就在下个月的 WWDC 大会上,苹果将发布「十年来最大」的 iOS 系统更新——通常情况下,苹果不会告诉你新系统更新了什么,但这次是例外。 而在本周,苹果官宣了一系列「辅助功能」,并确认将在今年晚些时候推出——包括 iOS 19 等苹果系统软件在内,将会获得这一系列更新。 这些功能主要面向全球 13 亿人的障碍人群,但相信我,其中某些功能,你也会用得上。 让 iPhone 成为你的眼,帮你看得更清楚 对于一些视障人士来说,工作学习生活,离不开一种名为「助视器」的外设。 这种设备一般包括一个摄像头和一个屏幕,既可以放大远距离的黑板,也可以放大桌上的书本,但高昂的价格以及不方便的设备形态,让这种设备没能普惠更多视弱人群。 iPhone 和 iPad 在 2016 年已经配备了功能类似「放大器」App,帮助视障人士在日常生活中更好感知世界,而本周苹果宣布,放大器功能也将在今年稍晚时候来到 Mac 产品上,能更好辅助课堂、工作等场景。 MacBook可以连接 iPhone 或者其他外接摄像头,然后打开放大器 App,就能放大查看远处的黑板或近处的印刷文字。 以前读书的时候,一些坐在教室后排并且视力不太好的小伙伴,可能会用手机拍下黑板上的板书,然后放到面前看,可以说 MacBook 的放大器就是一个更加方便的解决方案。 这个功能不仅仅能实现简单的放大,用户还能自定义捕捉画面的亮度、对比度、色彩滤镜,以及配合全新的「Accessibility Reader」(辅助阅读器)功能,将画面中的文字直接转化成更易读的书面文字,同样也支持字体字号的自定义。 对比起不太好购买和携带的大屏幕助视器,而本身作为生产力和生活工具的 MacBook + iPhone 组合,明显要更方便,不需要额外带一套复杂的设备进行安装,只需要一个合适的支架。 上面提到的 Accessibility Reader,不仅仅只能用于放大器,而是一个为阅读障碍以及弱视力人群准备的系统级阅读模式:类似 Safari 浏览器的「阅读器」模式,能够自定义文档文字的呈现方式,包括字体、颜色和间距设计,还支持阅读功能。 除了 iPhone、iPad 和 Mac 这些常规的屏幕设备,苹果也很好利用了 Apple Vision Pro 和现实世界交互的能力,将「放大器」和「Accessibility Reader」带到了头显之中。凭借 Vision Pro 配备的摄像头,用户可以直接选择和放大目光所及的现实物品,或者虚拟的 App 内容,宛如一个电子放大镜,并且能够使用 Accessibility Reader 简化所有文字内容。 除了为自家生态配备大量的无障碍辅助特性,苹果生态也对无障碍设备敞开了大门,例如 iPhone 能够和医用级别的助听器进行配对。而今年,苹果为 iPhone、iPad、Mac 以及 Vision Pro 新增了盲文设备的支持,可以更方便地制作盲文笔记,或者盲文数学计算。 除此之外,苹果设备也可以直接打开「BRF(盲文就绪格式)」文件,此前这些内容只能用专门的盲文笔记设备访问。 还有一个适用范围更广的新功能:iOS 18 上的「车辆运动提示」,也就是俗称的「防晕车」功能,也登陆了 Mac 平台,并且各个平台上面的圆点动画也可以自定义了。 帮你听、帮你说,还要帮你睡得好 除了视觉,苹果也为其他障碍人士准备了一些更好用的辅助功能。 「实时收听」基本算是苹果生态当中知名度最高、口碑也相当优秀的无障碍功能。当有听力障碍的用户戴上 AirPods 或者助听器,可以将 iPhone 变成一个麦克风,用来增强收音。 但这个过程有一个问题,如果手机被放在房间的另一头用来听发言人讲话,同时又想看实时字幕帮助自己理解,或者想要操控手机,那该怎么办呢? 苹果的解决方法,就是利用手腕上的 Apple Watch,可以显示实时语音转文字的字幕,也能作为手机的遥控器,调整实时收听的强度等参数。 环境音则是一项利好更多轻度听力受损用户的新功能。密歇根大学一项研究发现,在美国有 15% 的成年人有耳鸣的症状。除了影响听力,耳鸣还会对患者的心理造成持续地损伤。 在 iOS 18.4,苹果为 iPhone 和 iPad 引入了「背景音」的新功能,可以缓解耳鸣症状带来的感受。这个功能也将迎来更多个性化的更新,用户可以设置均衡器和定时器,以及快捷指令自动化操作,非常适合睡前聆听。 除了这些舒缓的白噪音背景音,苹果也宣布了和环球音乐集团合作推出的「声音疗法」系列歌单,更聚焦在心理健康,提高用户的专注力和睡眠质量。 「声音疗法」歌单和 Imagine Dragons、Katy Perry、AURORA、Kacey Musgraves 等知名音乐人合作,推出大热金曲的加长、器乐等特别版本,包含「专注」、「放松」和「睡眠」三种类别。 目前相关的歌单已经正式上线了 Apple Music,在搜索页面就能看到「声愈身心」板块,也能搜索相关的关键词,或者在合作艺人界面找到相关的合辑和歌单。 如果你也被失眠困扰,不妨听听这份歌单,也许能帮你更好入睡。 苹果还想扫清「说话」的障碍。 前年上线的「创建个人声音」功能,可以为一些有发声障碍的用户,克隆自己的声音,帮助他们更好地在日常中和他人交流。 以前,要想用 iPhone 创建个人声音,需要录制多达 150 个语句,还需要 1 天的时间进行处理。而即将推出的「个人声音 2.0」功能,只需要录制 10 个语句,1 分钟就能创建好质量相当的语音克隆。 不过因为需要更强的机器学习性能,因此只有为「Apple 智能准备好的」设备才能支持这项新功能——如果下次还有人问你手机 AI 到底有什么用?你可以给他介绍一下这个新功能。 最好的技术,应该是无障碍的 今天,是五月的第三个星期四,也是「全球无障碍宣传日」。 今年,是这项运动的第 14 年,我们的生活方式也许发生了诸多变化,但对于许多人来说,这些变化也意味着生活的门槛在变高。 大众对「无障碍功能」的认识,可能还停留在「降低门槛」上,例如旁白、语音控制、实时字幕这些基础功能,让障碍人士能够自如地使用科技产品。 但随着技术进步、设备更新以及生活方式的变化,「无障碍功能」的使用场景也在变得更多、更复杂。正如苹果 CEO Tim Cook 所提倡的那样: 最好的技术,应该始终秉承着无障碍的理念。 从 2005 年苹果为 Mac OS X 添加「语音旁白」功能算起,苹果在无障碍功能的耕耘也已经有 20 年之久。 可以说,单纯让设备「能用」,已经不是苹果的目标,他们更想帮助障碍人群过上更好的生活。 障碍人士如果想要正常生活、工作、学习,离不开一些外部设备的辅助,这些设备价格不算便宜,也未必方便携带,更重要的是,使用这些外设,可能会为这些群体带来羞耻心和一些负面的心理感受。 苹果设备和功能或许不能算得上医疗和专业级别的产品,但至少可以让他们能够直接使用手头上已有,或者一些用户更普遍的产品。 去年引发热议的「AirPods 助听器」功能,也是一个非常鲜明的例子,将一款热销的降噪耳机,转变成一款能检测和辅助听力障碍的准医疗器械,帮助更多听力损失患者及时发现和获得帮助。 我们也能发现,苹果今年为我们带来的无障碍辅助功能,有很多「人工智能」的身影:Accessibility Reader 的文字提取功能,以及「个人声音 2.0」,明显都很好利用了设备的机器学习能力。 这种应用或许没有生成式 AI 助手那么为人所知所感,也不会成为发布会上被重点宣传的功能,但却能很好帮助到那些需要得到帮助的人。 像苹果这样一举一动都备受关注的头部品牌,他们对设备无障碍辅助的努力,不仅能引起社会和行业的讨论,也能带动整个行业。 这几年,我们也能看到越来越多国内厂商为自己的产品添加无障碍功能,还有更多惠及障碍人士的举措。 ▲ 华为推出了「手语」客服 和大众认知有点偏差的是,障碍人士并非少数群体,实际上全世界已经有超过 13 亿人,占全球人口 15% 以上。从功利的角度出发,当然可以说,企业开发无障碍功能,也是为了这个 13 亿人的市场。 但,不让任何一个人掉队,让每个人都能依靠科技,过上更理想的生活——我更喜欢这个技术达观主义的视角。
曝Anthropic几周内将推两大深度推理模型,可无缝切换思考模式、调用外部工具
编译 | 金碧辉 编辑 | 程茜 智东西5月15日消息,据The Information昨日傍晚报道,继OpenAI、谷歌之后,AI独角兽Anthropic即将推出深度推理模型,推出Claude Sonnet和Claude Opus两大模型升级版本,全球AI竞赛进入“深度思考”新阶段。 据知情人士透露,Anthropic将通过“推理-工具调用”动态切换机制,该机制可自主发现问题并修正错误,将AI系统的自主决策能力推向新高度。该技术已在代码生成、市场分析等复杂场景验证效能,Anthropic计划在未来数周正式发布。 一、支持推理与工具调用无缝切换,可自主修正错误 不同于现有推理模型,Anthropic新模型首次实现了“推理模式”与“工具调用”的无缝转换。当Anthropic新模型使用外部工具受阻时,该模型可立即切换至深度推理状态,分析问题根源并自我修正。 虽然OpenAI等竞争对手宣称其o3、o4-mini模型已具备和Anthropic类似的推理能力,但据外媒The Information爆料,Anthropic的深度思考模型在复杂任务处理效率上显现优势,在相同市场分析任务中,Anthropic新模型决策路径缩短30%,数据调用精准度提升22%。 以曼哈顿咖啡店选址为例,Anthropic新模型的系统会先检索全美趋势数据,通过本地人口统计数据分析,自动修正初始方案的偏差。 在软件开发场景,Anthropic新模型具备代码自动测试功能。Anthropic新模型在生成代码后能立即启动自检程序,发现错误即暂停执行,通过多维度推理定位问题并修正。 外媒The Information援引Anthropic新模型的测试人员证实,Anthropic新模型的系统处理“提升应用运行速度”等抽象指令时,可在无需人工干预情况下,自主完成方案设计、测试验证全流程。 二、前代产品评价两极分化,企业仍加大核心计算技术投入 尽管用户对前代Claude 3.7 Sonnet的评价呈现两极分化,但Anthropic仍持续加大“测试时计算量”投入。 一部分用户对其称赞有加,在复杂的会计分析和数据可视化任务中,Claude 3.7 Sonnet展现出极高效率,短短十秒即可完成任务。 但另一部分用户则提出诸多质疑,如模型知识储备存在局限,在回答重要问题时容易出错,甚至在面对美国总统等常识性问题时也会误答;使用成本高昂,每百万输入token费用为3美元(折合人民币约为25.59元),每百万输出token费用达15美元(折合人民币约为107.95元),特别是使用思考功能时开支显著上升,对个人用户和小团队而言负担较重;还有用户反馈模型存在忽视指令、过度工程化倾向,以及在实际使用中上下文窗口利用效率存疑等问题。 这项支撑推理模型的核心技术,通过动态分配计算资源优化思考深度。据The Information报道,某知情人士指出,这种技术路线选择凸显企业对该架构的长期信心。 结语:Anthropic新框架预研,推动AI自主决策迈向实用 Anthropic的“推理-工具调用”框架虽仍处于预研阶段,将AI自主决策能力推向实用化阶段。该模型在代码迭代、商业逻辑推演等场景中已显现效能提升潜力。面对OpenAI等机构的技术路线竞争,以及模型指令对齐的行业性难题,相关系统的工程化路径尚未完全定型。 随着各大机构加速逼近自主决策的技术临界点,如何在增强自主性与确保可控性之间取得平衡,或将成为下一代AI系统的关键挑战。
首个“高考AI志愿规划师”之争:靠谱AI称优志愿大模型涉嫌虚假宣传
快科技5月15日消息,随着每年高考季来临,近日国内志愿大模型厂商靠谱AI发布声明,直指优志愿大模型涉嫌虚假宣传。 靠谱AI表示,自今年4月28日以来,优志愿通过其官方公众号“优志愿”、“优家SaaS平台”多次谎称其大模型为“全行业首个通过工信部备案”的升学规划大模型、“国内首发”。 而靠谱AI称其通过网信办大模型备案的时间要比优志愿早一年多,优志愿并非升学规划“行业首个”通过大模型备案的公司。 根据靠谱AI提供的国家网信办算法备案系统公示信息显示:靠谱AI的“靠谱大模型算法”在2024年2月18日已完成备案。 而优志愿的“ChatU文本生成合成算法”备案时间为2025年3月12日。 在率先通过网信办备案后,靠谱AI在2024年4月23日发布“靠谱AI志愿填报大模型”。 靠谱AI还表示,一年多来,多家媒体对靠谱AI的“靠谱AI志愿填报大模型”给予了报道。 优志愿在明知备案及发布时间均晚于靠谱AI的情况下,仍通过官方公众号等渠道宣称其为“全行业首个通过工信部备案”的大模型、“AI大模型国内首发”,涉嫌违反多项法规。 靠谱AI要求优志愿立即停止“首个生涯规划大模型”等虚假宣传,撤除相关不实表达,并要求优志愿在公开渠道澄清事实,消除不良影响。
淘宝AI图生视频功能上线:商家视频制作周期缩短10天以上
凤凰网科技讯 5月15日,淘宝天猫推出AI工具助商家应对618大促,其中最引人注目的“图生视频”功能已帮助商家大幅提升内容制作效率。据了解,该功能让商家通过上传商品图片,即可自动生成最长20秒的短视频,平均为每家商户每月节省超千元成本,缩短视频制作周期10天以上。 “图生视频”功能被视为淘宝面向商家的最新AIGC产品。商家只需上传单张或多张商品图片,系统便可自动生成短视频内容。据悉,所有淘宝天猫商家在大促期间每天可免费生成三十个视频,商家可通过“千牛工作台-商品-素材中心”使用该功能。 AI自动为商家生成分镜 除“图生视频”外,淘宝还于本周三上线了“脚本成片”功能,该功能基于全网热门脚本和商品信息,可自动生成可编辑的脚本及分镜,最终合成为商品卖点或种草视频。服饰类商家则可使用“搭配视频”功能,自主选择上下装、模特和场景,一键生成真人上身展示视频。 多家知名时尚品牌已开始使用这些AI视频生成工具。一位服装品牌视觉设计负责人表示,这些功能不仅节省了制作时间,还能快速生成高质量素材供品牌直接投放使用。 2025年天猫618购物节即将于5月16日晚8点正式开启现货销售。今年的促销活动主打“官方立减”简化策略,同时淘宝天猫推出了一系列AI工具,覆盖商家经营全链路,旨在提升商家运营效率。
OpenAI诈骗?GPT-4.1正式上线ChatGPT,网友实测却大呼失望
【新智元导读】GPT-4.1,在ChatGPT中可用了!现在,它不仅在API中开放,Plus、Pro和Team用户都可以使用。网友们兴奋地展开实测后,纷纷吐槽:OpenAI这是诈骗吧,说好的一百万超长上下文呢? 就在刚刚,OpenAI官宣:GPT-4.1,今天起直接在ChatGPT中可用。 这个模型擅长编码任务和遵循指令,是o3和o4-mini的绝佳替代品。 一个月前,GPT-4.1刚推出的时候,仅通过API向开发者开放。而现在,它在ChatGPT中就直接可用了。 其中,Plus、Pro和Team用户可以通过模型选择器中的「更多模型」下拉菜单访问GPT-4.1。企业版和教育版用户将在未来几周内获得访问权限。 OpenAI表示,他们还将在ChatGPT中为所有用户引入GPT-4.1 mini来取代GPT-4o mini。 由于超长的上下文能力,现在你可以将整段代码放到GPT-4.1中进行分析。 GPT-4.1和GPT-4.1 mini都已经通过了OpenAI的最新标准安全评估。 在以下两项评估中,GPT-4.1均排名前列。 not_unsafe:根据OpenAI政策和模型规范,检查模型是否未产生不安全的输出。 not_overrefuse:检查模型是否遵循良性请求。 幻觉评估以及指令遵循方面,GPT-4.1也均表现优秀;但在越狱评估方面表现不佳。 左右滑动查看 GPT-4.1,比GPT-4.5还好? 这次放出GPT-4.1,也算响应群众的呼声。 早在4月底,就有用户抱怨说:GPT-4.1简直是自己最喜欢的OpenAI模型,可惜在ChatGPT中并不能使用。 他确定地说:使用体验比GPT-4.5还要好! 不断有开发者现身说法,表示:除了GPT-4.1的早期版本Quasar Alpha之外,它也是自己测试过的最好的编码模型! 不断有人表示,GPT-4.1,绝对是一个被低估的模型。 就在上个月,OpenAI专为开发者推出了GPT-4.1系列新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。 它们均拥有最高100万Token的超大上下文窗口,在代码、指令跟随等核心能力上全面超越GPT-4o及GPT-4o mini,并且知识截止日期也已更新至2024年6月。 实测:庞大代码任务顺利完成 既然很多ChatGPT用户都能用上GPT-4.1了,现在全网已经涌出了不少实测。 比如沃顿商学院教授Ethan Mollick,就用一道考遍了各大模型的景点难题来考验GPT-4.1。 「请创建一段我可以直接粘贴到p5.js中的代码,它要以惊人的巧思震撼我,仿佛是未来某艘星舰控制面板的呈现。」 GPT-4.1的表现,可是相当优秀。 另一位开发者实测后发现,GPT-4.1实在令人惊喜! 当时,他正在处理一个代码量非常庞大的任务,系统自动选择的模型根本无法处理,完全没有生成任何内容。 结果让GPT-4.1上场后,它不仅比默认模型更快,还准确地完成了任务。 甚至,它还给了一个额外的惊喜:竟然还把整个文件中没用到的代码都清理掉了。 通过实测发现,GPT-4.1在代码生成速度方面达到了新的高度。 比如让GPT-4.1生成一个博客首页,在几秒钟之内就完成了输出。 再比如,让他用python写一个地球飞往火星的动画,几乎就是在一瞬间,GPT-4.1就完成了任务的输出。 结果看起来还行,这只是第一轮交互的结果,能够感受到GPT-4.1的速度是得到根本性的提升。 再挑战一下,让给GPT-4.1用动画来解释一下量子纠缠。 初步来看,GPT-4.1还是「领会」到了什么是量子纠缠 对于推理问题,GPT-4.1表现的也非常优秀。比如多步骤的年龄计算问题,GPT-4.1的求解逻辑非常严谨。 面对一些逆向思考、脑筋急转弯之类的问题,GPT-4.1也能快速完成推理,当然面对这个问题得出的答案倒是非常有趣。 网友吐槽:没有1M上下文版本,令人失望! 但试用GPT-4.1后,许多网友表示:太失望了! 虽然OpenAI发布了GPT-4.1,却没有包含100万上下文窗口的API版本。 本来大家最希望在ChatGPT中使用GPT-4.1,就是因为想要超长的上下文窗口。 现在,只能期望GPT-5能提供一个超长的上下文窗口了。 的确,不断有人发现,ChatGPT(Pro)中的GPT-4.1,最大上下文长度似乎仅为128k token,跟API中的100万token相差甚远。 也就是说,OpenAI并没有在GPT-4.1中提高限制。 总之,真的让人很失望。看来还是得用Gemini。 也有网友发现了「华点」:自己尝试运行他们在直播演示中用来展示 ChatGPT 4.1的提示词,但网页版无法运行成功,不过在API Playground中尝试后却运行成功了。 也有人说,自己刚刚氛围编程了一个使用GPT-4.1的AI助手,因为这个模型仅通过API提供,今天,ChatGPT中就能用了。 不过,他还是会用自己的助手,因为用户界面比ChatGPT更好。 其实,OpenAI此前已经放出GPT-4.1的prompt指南,总结了一系列内部测试中得出的重要prompt技巧。 想实测的小伙伴,可以参考这篇用起来了。
梁文锋新论文!DeepSeek降本秘籍公开,突破算力瓶颈有六招
编译 | 程茜 李水青 编辑 | 李水青 智东西5月15日消息,昨日下午,DeepSeek团队发布新论文,以DeepSeek-V3为代表,深入解读DeepSeek在硬件架构和模型设计方面的关键创新,为实现具有成本效益的大规模训练和推理提供思路。 DeepSeek创始人兼CEO梁文锋这次同样出现在了合著名单之中,在作者列表中处于倒数第五的位置。论文署名通讯地址为“中国北京”,可以推测论文研究大概率为DeepSeek北京团队主导。 大语言模型的迅猛扩张正暴露出硬件架构的三大瓶颈:内存容量不足、计算效率低下、互连带宽受限。而DeepSeek-V3却实现了令人瞩目的效率突破—— 仅在2048块H800 GPU上进行训练,FP8训练的准确率损失小于0.25%,每token的训练成本250 GFLOPS,而405B密集模型的训练成本为2.45 TFLOPS ,KV缓存低至每个token 70 KB(仅为Llama-3.1缓存的1/7)…… 这些突破性数据背后,究竟隐藏着怎样的技术革新? 其中的模型架构和AI基础设施关键创新包括:用于提高内存效率的多头潜在注意力(MLA)、用于优化计算-通信权衡的混合专家(MoE)架构、用于释放硬件功能全部潜力的FP8混合精度训练,以及用于最大限度地减少集群级网络开销的多平面网络拓扑。 ▲DeepSeek-V3基本架构 DeepSeek的论文中验证了,有效的软硬件协同设计可以实现大型模型的成本效益训练,从而为较小的团队提供公平的竞争环境。 也难怪OpenAI联合创始人Andrej Karpathy此前赞叹:“DeepSeek-V3的出现实现了高性能与低成本的平衡……未来或许不需要超大规模的GPU集群了。” DeepSeek在论文中提到,本文的目的不是重申DeepSeek-V3的详细架构和算法细节,是跨越硬件架构和模型设计采用双重视角来探索它们之间错综复杂的相互作用,以实现具有成本效益的大规模训练和推理。侧重于探讨: 硬件驱动的模型设计:分析FP8低精度计算和纵向扩展/横向扩展网络属性等硬件功能如何影响DeepSeek-V3中的架构选择; 硬件和模型之间的相互依赖关系:深入了解硬件功能如何塑造模型创新,以及大模型不断变化的需求如何推动对下一代硬件的需求; 硬件开发的未来方向:从DeepSeek-V3获得可实现的见解,以指导未来硬件和模型架构的协同设计,为可扩展、经济高效的AI系统铺平道路; 论文地址:https://arxiv.org/abs/2505.09343 一、从源头优化内存效率,MoE模型可降低成本、本地部署 开篇提到的DeepSeek-V3关键创新旨在解决扩展中的三个核心挑战:内存效率、成本效益和推理速度。 1、内存效率:从源头优化内存使用,使用MLA减少KV缓存 从源头优化内存使用仍然是一种关键且有效的策略。与使用BF16进行权重的模型相比,FP8将内存消耗显著降低了一半,有效缓解了AI内存墙挑战。 ▲KV缓存大小比较(BF16精度) 使用MLA减少KV缓存。对于大模型推理,用户请求通常涉及多轮对话。KV缓存通过缓存先前处理的token的键和值向量来解决这一挑战,无需为后续token重新计算。 在每个推理步骤汇总,模型仅计算当前token的键和值向量,并通过将它们与历史记录中缓存的键值对组合来执行注意力计算。这种增量计算使其在处理长序列或多轮输入时非常高效。但是,它引入了内存受限的瓶颈,因为计算从GEMM转移到GEMV,后者的计算与内存比率要低得多。 为了解决这一挑战,研究人员采用MLA,它使用投影矩阵将所有注意力头的KV表示压缩成一个更小的潜在向量,让该矩阵与模型联合训练。在推理过程中,只需要缓存潜在向量,与存储所有注意力头的KV缓存相比减少了内存消耗。 2、成本效益:MoE可降低训练成本,便于本地部署 DeepSeek开发了DeepSeekMoE,MoE模型的优势有两个方面: 首先可以减少训练的计算要求,降低训练成本。MoE模型允许参数总数急剧增加,同时保持计算要求适中。例如,DeepSeek-V2具有236B参数,但每个token只激活了21B参数。DeepSeek-V3扩展到671B参数,同时能将每个token的激活量保持在仅37B。相比之下,Qwen2.5-72B和LLaMa3.1-405B等稠密模型要求所有参数在训练期间都处于活动状态。 其次,是个人使用和本地部署优势。在个性化Agent蓬勃发展的未来,MoE模型在单请求场景中提供了独特的优势。由于每个请求只激活了一个参数子集,因此内存和计算需求大大减少。例如,DeepSeek-V2(236B参数)在理过程中仅激活21B参数。这使得配备AI芯片的PC能够实现每秒近20个token(TPS),甚至达到该速度的两倍。相比之下,具有相似能力的稠密模型在类似硬件上通常只能达到个位数的TPS。 同时,大语言模型推理优化框架KTransformers允许完整版DeepSeek-V3模型在配备消费类GPU的低成本服务器上运行,成本约为10000美元,实现近20 TPS。这种效率使MoE架构适用于硬件资源有限的本地部署和个人用户。 二、重叠计算和通信、高带宽纵向扩展网络,提高推理速度 第三个挑战是推理速度,DeepSeek通过重叠计算和通信、引入高带宽纵向扩展网络、多token预测框架等来提高模型的推理速度。 1、重叠计算和通信:最大化吞吐量 推理速度包括系统范围的最大吞吐量和单个请求延迟,为了最大限度地提高吞吐量,DeepSeek-V3从一开始就被构建为利用双微批处理重叠,将通信延迟与计算重叠。 DeepSeek将MLA和MoE的计算解耦为两个不同阶段。当一个微批处理执行MLA或MoE计算的一部分时,另一个微批处理同时执行相应的调度通信。相反,在第二个微批处理的计算阶段,第一个微批处理经历组合通信步骤。 这种流水线化方法实现了全对全通信与正在进行的计算的无缝重叠,确保始终能充分利用GPU资源。 此外,在生产中,他们采用预填充-解码分离(prefill-decode disaggregation)架构,将大批量预填充和延迟敏感的解码请求分配给不同的专家并行组。 ▲训练MoE和稠密模型的计算成本比较:假设序列长度为4096,测量每个token的计算成本 2、推理速度限制:高带宽纵向扩展网络潜力 MoE模型实现高推理速度取决于跨计算设备高效部署专家参数。为了实现尽可能快的推理速度,理想情况下,每个设备都应该为单个专家执行计算或者多个设备应在必要时协作计算单个专家。 但专家并行(EP)需要将token路由到适当的设备,这涉及跨网络的多对多通信。因此,MoE推理速度的上限由互连带宽决定。 考虑这样一个系统:每个设备都保存一个专家的参数,一次处理大约32个token。此token计数在计算内存比率和通信延迟之间取得平衡,此token计数可确保每个设备在专家并行期间处理相等的批量大小,从而计算通信时间。 如果使用像GB200 NVL72(72个GPU上的900GB/s单向带宽)这样的高带宽互连,每个EP步骤的通信时间=(1字节+2字节)×32×9×7K/900GB/s=6.72μs 假设计算时间等于通信时间,这将显著减少总推理时间,从而实现超过0.82毫秒TPOT的理论上限,大约每秒1200个token。 虽然这个数字是理论上得出,尚未经过实证验证,但它说明了高带宽纵向扩展网络在加速大规模模型推理方面的潜力。 3、多token预测(Multi-Token Prediction) DeepSeek-V3引入了多token预测(MTP)框架,该框架同时增强了模型性能并提高了推理速度。 推理过程中,传统的自回归模型在解码步骤中生成一个token,这会导致序列瓶颈问题。MTP通过使模型能够以较低成本生成额外的候选token并对其进行并行验证,从而缓解了这一问题,这与之前基于自起草的推测性解码方法类似。该框架在不影响准确性的前提下加快了推理速度。 此外,通过预测每步多个token,MTP增加了推理批量大小,这对于提高EP计算强度和硬件利用率至关重要。 4、推理模型的高推理速度与测试时扩展的研究 以OpenAI的o1/o3系列为例,大模型中的测试时缩放通过在推理过程中动态调整计算资源,在数学推理、编程和一般推理方面实现性能提升。后续DeepSeek-R1、Gemini 2.5 Pro、Qwen3都采用了类似的策略。 对于这些推理模型,高token输出速度至关重要。在强化学习(RL)工作流程中,快速生成大量样本的必要性使推理吞吐量成为一个关键的瓶颈。同样,延长的推理序列会增加用户的等待时间,从而降低此类模型的实际可用性。 因此,通过协同硬件和软件创新来优化推理速度对于提高推理模型的效率必不可少。 三、DeepSeek-V3实践:软硬件协同突破效率极限 基于上述核心设计原则,DeepSeek详细描述了低精度训练、互连优化、网络拓扑等具体技术的实现细节。 在低精度技术突破方面,DeepSee通过采用FP8混合精度训练,将模型内存占用直接减少50%,有效缓解“内存墙”难题。DeepSeek还提出LogFMT对数空间量化方案,能在相同比特下实现更高精度。 在互连优化方面,DeepSeek提出了硬件感知并行策略。团队摒弃传统张量并行(TP),转而采用流水线并行(PP)和专家并行(EP),配合自主研发的DeepEP库,实现通信效率的飞跃。 在网络拓扑方面,DeepSeek推出的两层多层胖树(MPFT)网络拓扑,通过8个独立平面实现故障隔离与负载均衡,成本相比传统三层拓扑降低40%以上,且在全到全通信性能上与单层多轨网络旗鼓相当,为集群扩展提供了坚实保障。 ▲八平面两层胖树可扩展网络 四、六大关键,打造下一代AI基础设施 针对当前硬件痛点,DeepSeek提出下一代AI基础设施的核心升级路径。 跳出DeepSeek-V3的具体实现,DeepSeek从硬件架构演进的角度提出六大未来挑战与解决方案,涵盖内存、互连、网络、计算等核心领域。 1、鲁棒性优先:构建不易崩溃的训练系统 现有硬件对GPU故障、内存静默错误等缺乏有效检测,大规模训练中断风险高。 对此,DeepSeek提出硬件必须引入传统ECC之外的高级错误检测机制。基于校验和的验证或硬件加速冗余检查等技术,为大规模部署提供更高可靠性。 此外,硬件供应商应向终端用户提供全面的诊断工具包,使其能够严格验证系统完整性并主动识别潜在的静默数据损坏。 2、颠覆互连架构:CPU-GPU直连消除节点瓶颈 CPU在协调计算、管理I/O和维持系统吞吐量方面仍不可或缺,当前架构面临若干关键瓶颈。 CPU与GPU之间的PCIe接口在大规模参数、梯度或KV缓存传输期间常成为带宽瓶颈。为缓解这一问题,未来系统应采用直接的CPU-GPU互连(如NVLink或Infinity Fabric),或将CPU和GPU集成到扩展域中,从而消除节点内瓶颈。 除PCIe限制外,维持如此高的数据传输速率还需要极高的内存带宽。最后,内核启动和网络处理等延迟敏感任务需要高单核CPU性能,通常需要基频超过4GHz。此外,现代AI工作负载需要每个GPU配备足够的 CPU核心,以避免控制端瓶颈。对于基于小芯片的架构,需要额外核心支持缓存感知的工作负载分区和隔离。 3、智能网络升级:动态路由实现低延迟 为满足延迟敏感型工作负载的需求,未来互连必须同时优先考虑低延迟和智能网络。 共封装光学:集成硅光子学可实现更高带宽扩展性和更强能效,这对大规模分布式系统至关重要。 无损网络:基于信用的流量控制(CBFC)机制可确保无损数据传输,但单纯触发流量控制可能导致严重的队头阻塞。因此,必须部署先进的端点驱动拥塞控制(CC)算法,主动调节注入速率并避免异常拥塞场景。 自适应路由:如5.2.2节所述,未来网络应标准化动态路由方案(如分组喷射和拥塞感知路径选择),持续监控实时网络状况并智能重新分配流量。 高效容错协议:通过部署自愈协议、冗余端口和快速故障转移技术,可显著增强故障鲁棒性。 动态资源管理:为有效处理混合工作负载,未来硬件应支持动态带宽分配和流量优先级。 4、通信顺序“硬件化”:消除软件额外开销 使用加载/存储内存语义的节点间通信高效且便于编程,但当前实现受内存顺序挑战的阻碍。 DeepSeek主张硬件支持为内存语义通信提供内置顺序保证。这种一致性应在编程层(如通过获取/释放语义)和接收方硬件层强制执行,实现有序传递而无额外开销。 5、网络计算融合:硬件加速通信效率 混合专家模型(MoE)的分发与组合阶段存在网络优化空间。论文建议,在网络硬件中集成自动分组复制、硬件级归约功能,并支持LogFMT压缩,降低通信带宽需求。 6、内存架构重构:从“芯片堆叠”到“晶圆集成” 模型规模的指数级增长已超过高带宽内存(HBM)技术的进步,这种差距造成内存瓶颈。 DeepSeek推荐DRAM堆叠加速器,利用先进的3D堆叠技术,DRAM die可垂直集成在逻辑die顶部,从而实现极高的内存带宽、超低延迟和实用内存容量(尽管受堆叠限制)。 DeepSeek还提到了晶圆级系统(SoW),晶圆级集成可最大限度地提高计算密度和内存带宽,满足超大规模模型的需求。 结语:模型进化,倒逼下一代算力革新 AI产业正进入软硬件深度协同时代。通过将硬件特性融入模型设计、反向驱动硬件升级,DeepSeek 开创了软硬件良性迭代闭环。 从硬件到模型,DeepSeek-V3体现了软硬件协同设计在推进大规模AI系统的可扩展性、效率和鲁棒性方面的变革潜力。 从模型回到硬件,DeepSeek则跳出DeepSeek-V3具体模型,来定义未来硬件需为大模型优化的核心方向,从内存、互连、网络、计算等多层面提出了建设性建议,对产业生态具有重要参考意义。
12.27 万元起!零跑 C10 焕新上市,细数四大进阶
中国新能源汽车的牌桌上,早已杀成一片「血海」。 当「内卷」沦为日常,每一家身处其中的车企,都不得不将神经绷紧到极致。是拿出掀桌子的勇气,还是在精密的计算后,甩出一张看似稳妥却又暗藏杀机的牌? 零跑汽车,这家一度凭借极致性价比标签从牌局边缘挤进来的玩家,在今天,选择将其明星车型 C10 再次推向牌桌—— 2026 款零跑 C10,来了。 新C10 的「四大进阶」 零跑自己把这次改款升级的部分总结为了「续航」、「智能」、「驾控」、「设计」四大进阶,每一部分都针对上一代车主们提出意见较多的部分做了调整。 咱们先来说最重要的三电和驾控部分,也就是「续航」和「驾控」的进阶。 新款 C10 升级到了最新 LEAP3.5 技术架构,采用全域 800V 高压碳化硅快充平台,30% 到 80% 的快充速度从老款的 30 分钟提升到了 16 分钟。 电池容量从老款的 69.9 度电池升级到了 74.9 度,配合新 AI BMS 智能电池管理系统的加成,新款 C10 的电驱效率和能耗控制水平都有所提升,百公里电耗降低到了 14 度的水平,于是新款的官标续航从老款的 530km 变成了 605km。 新款 C10 的电机功率也有所提升,从老款的 170kW 升级到了 220kW,百公里加速从 7.29 秒提升到了 5.9 秒,在红绿灯起步和高速超车等场景都能有更好的表现。增程版本的最大功率仍为 170 千瓦,CLTC 纯电续航也仍为 210km,不过其 CLTC 的馈电油耗降低到了 5.1L 每百公里的水平。 新款 C10 针对底盘较软、后排颠簸以及高速变道侧倾大的问题做了专门调校,全新升级了博世 DP-EPS 转向系统和自研的 LMC 一体化融合控制技术,在优化了上述问题和转向手感之外,也提升了安全性,能够做到在 120km/h 的速度下发生爆胎后依然保持稳定。新零跑 C10 搭载的自研 One box 制动系统让车辆拥有了更好的刹车舒适性,同时把百公里的刹停距离做到了 34.83 米。 然后是「智能」和「设计」的进阶。 零跑的车身尺寸依旧还是 4739 / 1900 / 1680mm,轴距为 2825mm,但这次除了原有的浅灰、深灰、绿、白、黑五种颜色外,新零跑 C10 还新增了一款「曦露紫」颜色并换装了电动的隐藏式门把手,来让外观显得更加优雅耐看。 内饰上零跑这次提供了橙、紫两种配色,采用了全新的方向盘造型,并换装了新的双缝线设计座椅,整体的座舱氛围更有质感了一些,被老车主们吐槽已久的 15W 手机无线充电也更换为了 50W 快充。 新款 C10 这次把车机芯片升级为了高通骁龙 8295 芯片,支持全新的实时感知 3D 桌面和实时双屏 SR 环境模拟显示,全车的音响也升级为了奔驰迈巴赫同款的 12 个 PPS 定制扬声器,并支持 7.1 环绕声场。 同时为了解决在家庭用车场景下的诸多痛点,新款零跑 C10 这次还提供了一键大床模式以及 3.3kW 的对外放电功能,在露营、钓鱼、夜会等多种户外场景下都能提供更好的体验。 辅助驾驶的芯片升级成了高通骁龙 8650 芯片,最高算力为 200TOPS,在高配版本带激光雷达的版本车型上可以支持端到端的辅助驾驶。 零跑在这次发布会上依然重点提及了新 C10 在安全方面的努力,除了新的电池提前满足了即将在 26 年实施的电池新国标和之外,超长的贯穿式安全气囊和钢铝混合车身结构以及 2000MPa 的热成型钢用料也让零跑拿到了欧洲的三大五星安全认证标准。 零跑的棋,下得愈发全面 零跑 C10 焕新登场的背后,整个零跑体系在过去一年,乃至更长时间维度里所展现的加速奔跑姿态。 衡量一家车企的成长,销量无疑是最直观的标尺。 回望过去一年,零跑汽车交出的成绩单确实堪称亮眼。近 30 万辆的年交付量,不仅意味着同比可观的增幅,更重要的是稳稳超越了既定目标,这在「目标完不成才是常态」的新能源赛道中,已属难能可贵。 进入 2025 年,这股势头并未衰减,反而愈发强劲。 年初数月,零跑在新势力出海榜单上一路领先,稳稳占据优势身位;在特定月份,如今年三月、四月,更是力压群雄,强势登顶新势力销量榜。尤为值得一提的是,四月份,零跑汽车成为唯一一家销量突破四万大关的新势力品牌。这一系列成绩,清晰而有力地表明: 零跑汽车正在从过去的「小透明」或「第二梯队」,加速挤入牌局的中心地带。 ▲零跑汽车历年销量 高增长的背后,自然离不开 C 系列,特别是 C10 这款车型在市场上的持续发力与用户认可。 当然,销量的增长若未能伴随健康的财务指标,那便如同沙滩上建高楼,根基不稳。零跑对此显然有着清醒的认知。 从公开的财务数据中,我们可以窥见其在盈利能力上的逐步改善。2024 年第四季度达到 13.3% 的毛利率,创下了自身新高,而且还提前一年实现了单季度净利润转正的目标,成为造车新势力中第二家实现盈利的企业。 对于一家长期以「性价比」为标签,且持续在研发上重投入的企业而言,这样的成绩殊为不易。这意味着,零跑在供应链管理、成本控制以及产品结构优化上取得了阶段性成效。而这,无疑为资本市场和消费者注入了更多信心。 ▲零跑汽车历年毛利率 这种「既要量,也要质」的转变,是零跑迈向成熟的关键一步。 零跑的雄心显然不止于国内市场。面对全球汽车产业电动化、智能化的浪潮,以及国内市场近乎白热化的竞争,出海成为了必然选择。 与 Stellantis 集团的战略合作,无疑是零跑国际化进程中的一次关键落子。通过成立零跑国际合资公司,零跑得以借助巨头的渠道和经验,更快地将产品推向欧洲等成熟市场。早在去年 7 月,零跑就向欧洲发运了首批 C10 车型。 ▲零跑 T03 海外版 不论是 C10 还是后续的 B 系列车型,零跑在设计之初便融入了全球化视野和标准,这使得它们在面对不同地区的法规和用户偏好时,能有更好的适应性。 出口数据的稳步增长,以及在海外服务网络的逐步铺开,都预示着零跑正努力将自己打造成一个具备国际竞争力的品牌,而不仅仅是「中国特供」。 零跑汽车高级副总裁曹力,还在今天的发布会中透露了一个新信息:「6 月份,我们香港车展见」。 这一切成绩的取得,都离不开零跑在技术研发上的「执拗」。 从 LEAP 1.0 到如今 C10 搭载的 LEAP 3.0 乃至 B 系列应用的更新的 LEAP 3.5 技术架构,零跑在核心三电系统、智能座舱、智能驾驶辅助等关键领域都积累了自己的核心技术。这种近乎「偏执」的自研,在早期或许意味着更高的成本投入和更慢的产品推出节奏,但在竞争进入深水区,核心技术自主可控成为命脉的当下,其战略价值便日益凸显。 它不仅为零跑的产品提供了持续迭代的底气,也为其在成本控制和供应链安全上争取了更多主动权,正如在湖州等地投建新能源汽车关键零部件项目的举措,便是这一战略的延伸。 理解了零跑的成长轨迹和技术底色,我们再来看其 C 系列与全新 B 系列的产品布局。 众所周知,C 系列是零跑此前几年站稳脚跟,塑造品牌认知度的功勋系列。零跑以「年轻人更理想的家」为核心理念,强调大空间、高配置、智能化以及纯电与增程的双动力选择,满足了大量年轻家庭用户的「既要又要还要」的复杂需求。而 C10 作为其中的全球化战略车型,更是承载了拓展国内外市场的重任。 如今,2026 款 C10 通过技术升级和更具竞争力的价格区间,不仅强化了自身的「质价比」标签,也使其市场定位更加灵活,向下可以与 B 系列的高配车型形成一定的承接,向上则继续巩固其在中型 SUV 市场的地位。 ▲零跑 C10 而全新推出的 B 系列,则被零跑寄予了更高的期望——攻坚 10 万-13 万元这个国内市场份额最大、但竞争也最为惨烈的「红海中的红海」。 ▲零跑 B01 可以看到,零跑在产品线上摆出了一个值得玩味的阵型。 零跑的这番布局,与其解读为对市场趋势的预判,不如将其视为零跑在技术研发积累到一定程度后,面对持续的增长压力与规模化诉求,所进行的一次扩张性尝试。毕竟,对于一家成熟的车企来说,寻求规模突破是必然选择。 诚然,更复杂的产品策略往往伴随着管理体系和资源调配能力的高压,但这条路,或许正是零跑走向下一阶段的必经之途。
美媒关注iPhone在中国大降价:凸显苹果在华销售困境
iPhone 16 Pro 凤凰网科技讯 北京时间5月15日,中国618打折促销活动引起了美媒的关注。《商业内幕》发现,一些中国电商网站已经把苹果的iPhone手机售价下调了几百美元。 《商业内幕》先对618购物节进行了一下科普。报道称,618通常为期大约两周,是中国第二大年度购物节,各大电商平台的总销售额常常超过1000亿美元(约合7206亿元人民币)。 《商业内幕》发现,在京东上,一部128GB的白色iPhone 16 Pro,支持12期免息分期付款,标价为5380元人民币(约合745美元)。而在苹果中国官网上,同款机型官方售价为7999元人民币,这意味着降价至少达2619元(约合360美元)。256GB版iPhone 16 Pro同样支持12期免息分期付款,售价为6220元人民币,相比苹果官网标价8999元人民币,降价达2779元。 128GB iPhone 16降价700元 在天猫上,《商业内幕》也发现至少有一款全新iPhone 16售价为5299元人民币(约合740美元),相比苹果官网标价5999元人民币,降价700元。 相比之下,在苹果美国官网上,128GB版本的iPhone 16 Pro售价为999美元,而同样存储容量的iPhone 16售价为799美元。 截至发稿,苹果尚未回应置评请求,也未说明中国市场的这些降价是否属于其官方促销活动的一部分。 销售困境 在这些降价之前,苹果在中国已陷入销售困境。一方面,更便宜的国产手机品牌越来越受欢迎,另一方面消费者也变得更加精打细算。研究公司IDC称,2025年第一季度,苹果在中国的iPhone出货量同比下降了9%。财报显示,苹果第二财季(日历年第一季度)大中华区销售额也未达预期。 苹果第一季度中国iPhone出货量同比降低9% 然而,IDC的数据显示,今年第一季度中国智能手机出货量整体同比增长了3.3%,这主要得益于苹果在华竞争对手的表现。例如,小米第一季度在中国的手机出货量同比大增39.9%。 小米15 Pro是小米的最新手机之一,存储容量至少256GB,在其中国官网上的售价为4999元人民币,折合不到700美元。 另一方面,根据中国的国家补贴政策,只有售价低于6000元人民币(约合821美元)的手机才能享受国家补贴,但是苹果的许多机型售价高于这一门槛,销量无法得到国补的提振。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
雷军官宣小米自研手机SoC:名为玄戒O1,5月下旬发布
自动播放 凤凰网科技讯(作者/于雷) 5月15日,雷军微博发文官宣小米自主研发设计的手机SoC芯片,名字叫玄戒O1,将在5月下旬发布。 据爱企查信息显示,2021年上海玄戒技术有限公司(以下简称“玄戒”)成立,注册资本高达15亿元,该子公司还由执行董事、总经理为小米高级副总裁曾学忠直接领导,曾学忠在加入小米之前曾担任国产手机芯片厂商紫光展锐的CEO。 2023年6月,玄戒科技还进行了增资,其注册资本由原来的15亿元增至了19.2亿元。同年10月,北京玄戒技术有限公司成立,注册资本30亿元人民币,同样是由曾学忠领导。 2017年,小米曾发布自研SoC芯片澎湃S1,小米正式成为全球继三星、苹果、华为之后第四家同时拥有终端及芯片研发制造能力的手机厂商。澎湃S1为8核64位处理器,采用28nm工艺制程,由小米5C首发搭载。 2021年3月30日,小米发布自研图像信号处理芯片澎湃C1,作为独立ISP改善手机的自动对焦、白平衡和自动曝光表现。该芯片搭载于小米定价9999元的折叠屏手机MIX FOLD。 同年12月24日,小米发布自研快充芯片澎湃P1。该芯片是业界首个谐振充电芯片,研发历经18个月,耗资过亿。依托澎湃P1的小米澎湃秒充方案,在疾速模式下最快18分钟可充满4600mAh的电池。同年12月28日,澎湃P1搭载于高端旗舰机小米12Pro进行首发。
ASC 25世界大学生超算竞赛落幕,上海交通大学、北京大学分获冠亚军
作者 | 陈骏达 编辑 | 心缘 智东西5月15日报道,昨晚,2025 ASC世界大学生超级计算机竞赛(ASC 25)总决赛在青海大学落下帷幕,上海交通大学代表队斩获本次竞赛冠军,北京大学代表队获亚军,北京邮电大学、浙江大学、清华大学、中山大学等高校的代表队获得一等奖。 ▲获冠军的上海交通大学代表队 基于CPU的推理优化是本届ASC的一大亮点。浙江大学代表队在DeepSeek推理优化赛题上,凭借每秒14个token左右的推理速度获得应用创新奖。上海交通大学代表队使用通用CPU集群上实现了AlphaFold 3的多机高效推理,取得全场最佳成绩。 ASC竞赛已举行12届,今年共吸引了全球超过1万名大学生参赛,已成为全球规模最大、参与人数最多的大学生超算赛事。本届ASC 25决赛的参赛团队需要在4000W集群总功耗的限制下,完成五项跨学科高难度赛题和HPL(高度并行计算基准测试)、HPCG(高性能共轭梯度测试)这两项权威超算基准测试。 颁奖典礼结束后,智东西也与本届大赛组委会、获奖团队代表等进行交流,了解了赛题设计背后的思考、历届ASC大赛的演变和比赛过程中选手们收获的经验与教训。 一、ASC规则与时俱进,海外专家评论:赛题设计更具“野心” ASC组委会委员刘羽博士称,ASC 25将功耗限制从往年的3000W提升至4000W,这主要是考虑到当今设备功耗不断增加的现实。 ▲竞赛现场参赛队伍的实时功耗会显示在大屏幕上 此外,组委会要求参赛队伍的集群至少包括3个节点,单节点功耗最高为2000W,这一规则模拟了真实生产环境中或科研场景中的集群构建和调优情况(特别是大规模扩展互联),能培养学生的软硬件协同优化能力。 长期关注并参与ASC大赛的美国媒体人、数据中心研究机构Olds Research创始人Dan Olds称,据他观察,许多美国高校在高性能计算课程上的设置并不完备,“许多学生到毕业都没有上过Linux实操课程”,而中国在该领域的人才储备更为深厚。 Dan Olds认为,与其他超算竞赛相比,ASC在赛题设计上更具“野心”,是全球范围内最早一批将深度学习、AI等前沿技术引入的赛题的竞赛,给参赛选手们提出了更大的挑战,也锻炼了学生解决难题的能力。 今年,部分在往届ASC竞赛中表现突出的强校并未获得理想成绩。Dan Olds强调,这一现象并非由于这些传统强校退步了,而是因为许多中国高校在超算、AI领域的进展迅猛,且各自具有特色和差异化优势。 二、冠军团队分享:曾一度打算放弃,备赛至凌晨3点 获得本届大赛冠军的上海交通大学代表队称,该队伍具有庞大的指导老师团队,涵盖上海交通大学超算中心的30余名工程师。这些工程师们背景构成丰富,既能提供高性能计算的技术指导,也能提供具体应用的针对性支持。 在正式比赛过程中,上海交通大学代表队首日部分单项测试的成绩并未达到预期,团队内一度怀疑无法取得前三名的成绩,萌生退意,但在评估自身的解决方案后,上海交通大学代表队最终仍决定继续全力参赛,为赛后的答辩环节备战至凌晨三点。 ASC竞赛备赛周期长,比赛强度大。上海交通大学代表队称,他们花了数月时间备赛,期间在团队合作方面积累了经验。在分析赛题后,该团队决定完全使用CPU集群参赛,并未携带GPU,这一决策避免了GPU待机功率对集群整体功率的影响。 ▲ASC25超算大赛总决赛现场 对于未来可能参赛的选手,上海交通大学代表队建议,参赛队伍需要在赛前集群搭建环节充分规划好时间、测试赛题,才能在正式比赛中从容不迫地完成题目。 其他获奖团队也分享了本次参赛经历和团队在赛后的规划。浙江大学代表队提到,他们在DeepSeek优化赛题中对最耗时两大模块都做定性化的处理。在整理代码后,浙江大学代表队计划将相关代码开源,回馈开源社区。 结语:以赛促练,ASC培养跨领域创新人才 历届ASC竞赛都会引入当下前沿的科技应用作为赛题,让参赛学生接触到科学计算、AI等领域的前沿研究题目。本届大赛的DeepSeek推理优化、AlphaFold 3推理优化、青藏高原气候模拟等赛题均体现了这一特点。 ASC希望通过计算机学科与其他学科的交叉融合,促进学生学习跨领域知识,掌握多种工程优化技术,最终培养具备系统性工程能力、软硬件协同优化能力的人才。
星纪魅族发布Flyme AIOS 2 操作系统,六款机型开放申请
凤凰网科技讯 5月15日,星纪魅族在13日举办新品发布会,正式发布Flyme AIOS 2 操作系统。5月13日17:00,全新升级的Flyme AIOS 2内测版将对魅族21 、魅族21 Pro、魅族21 Note、魅族20、魅族20 Pro、魅族20 Classic六款机型正式开放申请,6月推送正式版。魅族20 INFINITY、魅族Lucky 08将在不久之后陆续适配升级。 在Flyme AIOS 2上,魅族确立了四大优化方向并带来了全新OneMind的四大引擎。包括瞬息流畅引擎、流光视效引擎、晶核能效引擎与智愈修复引擎。Flyme AIOS 2还带来了全方位焕新的Aicy助手,在视效、交互和AI技术等方面进行了升级,并运用了全新的LOGO设计。 在功能上,Aicy助手新增超自然对话功能,目前已接入阿里云首个端到端全模态大模型Qwen-Omni,同时还接入满血版DeepSeek-R1模型,此外,Aicy助手还升级了记忆能力,能可记住用户的个人信息和爱好内容。 最后,Flyme AIOS 2 还带来了Aicy 管家,可汇集天气交通、电话信息、图库、日程、收藏、记忆、运动等多个维度数据,识别和理解用户需求。 在手机应用方面,在图库应用中,这次新增了图片修复功能、AI妙绘功能与动态照片拼图功能,用户可以把三段动态照片或者视频拼在一起,然后保存成一张三连Live 图。在笔记应用中,这次新增了智能排版功能与收藏功能。 此外,独立AI按键再次升级,支持分别设置单击或长按快速打开不同功能,可选AI 功能、生活助手、实用工具、相机、快捷支付及自定义场景,一键启动所需功能。 在发布会上,星纪魅族宣布智能座舱系统Flyme Auto合作车型累计销量突破100万辆大关,发布两年多以来,Flyme Auto已接入领克、银河、吉利等多个品牌的23款车型,目前正在推进与更多国内外智能汽车品牌合作。 同时,星纪魅族提出“手机域”理念,实现手机与车机的无缝连接、生态共享和能力共享,支持魅族、华为、苹果、小米、vivo、OPPO、三星等多品牌手机接入,实现 Carplay、HUAWEI HiCar、ICCOA Carlink 等多种生态的无界互联。 自“Flyme全生态海外战略”宣布以来,搭载Flyme Auto的汽车已相继出口至中东、东欧、亚太等地区。在2025年第一季度,登陆菲律宾、印尼、斯里兰卡、澳洲等多个市场。
OPPO Reno14 Pro发布:首款“为直播而生”的手机,3499元起
凤凰网科技讯(作者/于雷)5月15日,OPPO Reno14系列手机今日正式发布,新机在社交影像、直播创作等场景进行了深度优化。提供Reno14、Reno14 Pro两款机型,起售价2799元和3499元,将于5月23日正式开售。 Reno14 Pro被官方定位为“OPPO史上首台为直播而生的手机”,不仅在画质、降噪、防抖、色彩、续航、网络六大维度进行了专门优化,还新增“直播助手”功能,一键开启多项直播增强功能,同时与抖音平台深度合作,成为“抖音直播专用机”。OPPO首席产品官刘作虎此前表示,Reno14 Pro直播的防抖和降噪表现已与iPhone比肩甚至超越,色彩还原做到了所见即所得。 外观方面,Reno14采用6.59英寸超窄边小直屏,提供人鱼姬、半夏绿、礁石黑三种颜色选择;Reno14 Pro则配备更大的6.83英寸超窄边直屏,颜色包括人鱼姬、海芋紫和礁石黑。两款机型均搭载5000万像素潜望长焦摄像头,支持高清长焦实况照片、闪光实况照片及4K视频转实况照片三大创新功能,满足年轻用户多元化的社交影像需求。 性能配置上,Reno14 Pro搭载天玑8450旗舰移动平台,采用全大核架构和4nm制程工艺,配合OPPO自研的潮汐引擎调校,确保在重度使用场景下保持流畅体验。散热系统升级为双层石墨与5400平方毫米超大VC组合的三层结构,加入纳米流体强化传热技术,有效解决长时间游戏发热问题。Reno14采用天玑8350旗舰移动平台。 续航表现上,Reno14 Pro配备6200mAh大容量电池,支持80W有线闪充与50W无线闪充;Reno14则搭载6000mAh电池,支持80W有线闪充。 系统方面,新机搭载ColorOS 15,系统整合了DeepSeek大模型支持的小布记忆功能,可智能分析屏幕信息并提供高效信息管理。“AI灵感成片”功能则可自动优化照片构图与色彩,提升拍摄体验。
和三星抢海外市场?荣耀构建AI终端生态
凤凰网科技讯(作者/杨睿琪 编辑/刘毓坤)5月15日,荣耀昨日正式官宣400系列将于5月22日在欧洲及中东多国首发,这是荣耀数字系列首次将全球首秀放在海外市场。 荣耀选择欧洲及中东作为首发地,而非中国本土。这一决策折射出中国科技企业面对全球产业链重构的主动调整。 Counterpoint数据显示,2025年Q1全球智能手机出货量同比增长7%,但中国品牌在北美市场出货量暴跌22%。与此同时,东南亚正成为4G向5G换机的关键战场。“这里不仅是增量市场,更是检验企业技术下沉能力的试金石。” 荣耀通过AI技术下放,抢占中高端市场。数据显示,荣耀印尼市场2024年Q4出货量同比增长187%,这验证了荣耀此策略的可行性。 相比于三星A系列依赖于与镜头厂商的合作以及传统的计算摄影技术,荣耀400系列通过端云协同架构、自研AI引擎以及硬件与软件的深度协同,在AI影像领域实现了技术突破。例如,荣耀的动态抓拍技术、AI光影写真功能以及全链路4K视频优化能力,在实际使用中提供了更流畅和高效的用户体验。 在硬件层面,荣耀400采用了高通骁龙8 Gen3芯片,并结合自研的ISP算法,实现了每秒60帧的连拍速度和高光压制能力提升50%。 另外,此次发布的2亿像素主摄方案,实质是对供应链深度整合的技术验证。通过晨星半导体与豪威科技的技术融合,在避开旗舰传感器专利壁垒的同时实现技术创新。将旗舰级AI影像方案下放至中端机型,形成对三星A系列的差异化。 荣耀的反应能力,得益于中国供应链的独特优势。赛迪智库数据显示,珠三角3C制造集群的迭代成本比海外低37%。在深圳荣耀产业园,5G+MEC系统将订单响应速度压缩至7天,比传统ODM模式缩短47%周期。 这种能力直接转化为市场竞争力,荣耀计划针对中国市场推出400系列特供加强版,特别增加金属中框,在性能、续航、快充等维度实现全面升级。 此外,据企业年报,2024年荣耀研发投入占比提升至11.3%,重点布局的AI影像算法、异构通信架构等技术模块,已在马来西亚数字化转型合作项目中实现场景落地。 国泰君安通信首席分析师估计,荣耀AI影像算法许可业务已创造超2亿美元海外营收,从内部的研发资金流向来看,AI已经成为荣耀在产品方向上的重要考核基准。 2025年世界移动通信大会上,荣耀宣布向“全球领先的AI终端生态公司”转型,并承诺五年投入超100亿美元,这一野心已初现端倪。 在今年4月,荣耀发布三款产品。4月15日,推出了全新系列产品荣耀Power,该机型配备8000mAh大容量电池,机身厚度仅为7.98mm,售价1999元起,国补后1699元起。 4月23日,荣耀推出电竞性能旗舰手机GT Pro,该机型搭载高通骁龙8至尊领先版移动平台,CPU主频达4.47GHz,配备LPDDR5X内存及UFS 4.1闪存。国补后售价3199元起。 4月30日,荣耀发布新一代笔记本旗舰产品MagicBook Pro 16 2025系列。作为其性能系列的全新迭代,HUNTER版成为业内首款搭载NVIDIA RTX 5070独立显卡的轻薄静音游戏本,提供高性能与低噪音的双重体验。独显版国补到手价9499元起,此外还提供集显版,国补后售价5039元起。 据报道,荣耀Power上市首周(4.14-4.20),不仅推动国产手机市场份额大盘单周上涨约5%,还带动荣耀重返国内市场前五,而MagicBook Pro 16 2025系列则带动荣耀PC销量同比去年五一激增96%。 近期,荣耀内部启动“雄鹰计划”,面相国内外全体员工,其中45%的岗位负责人有所调整。内部新增AI新产业部门,将AI相关研发工作设定为一级研发部门。同时成立新商业模式拓展部和新产业孵化部。从种种策略能看出,荣耀拿出了更积极的应对策略来面对市场。 从销售占比来看,荣耀海外销量占比在去年年底突破50%,部分市场进入前五。据调研机构Canalys近日发布的报告显示,在Q1季度非洲市场中,荣耀市场份额较去年同期增长283%。 荣耀南太平洋地区总裁李静在今年年初的一次采访中曾对外透露,荣耀正在争取更多的海外份额,包括400Lite在内的数字系列正在成为增长的关键。他认为,中国厂商在全球化的运作已经从“扩张”进化到“争顶”阶段,尤其是在亚太等核心战略价值市场需要敢于与高端市场头部玩家展开正面竞争。 更关键的是,荣耀已经与欧洲五大运营商达成深度合作,Magic系列和数字系列在其渠道全面铺开。这种“运营商 + 自研技术”的组合拳,正是当年华为在欧洲崛起的关键策略。 荣耀的全球化实验,展现了中国科技企业应对复杂环境的路径:以技术突破为矛,供应链优势为盾,辅以战略调整。然而,高端市场仍被苹果、三星牢牢把控,AI生态的构建也需长期投入。
高通发布第四代骁龙7移动平台,首批终端本月面市
凤凰网科技讯(作者/于雷)5月15日,高通今日正式发布新一代中端处理器——第四代骁龙7移动平台。据悉,该平台将首次在骁龙7系引入Stable Diffusion图像生成支持,并能够在终端侧直接运行生成式AI助手和主流大语言模型(LLM),标志着人工智能功能正向中端智能手机全面渗透。 作为骁龙7系的最新成员,第四代骁龙7移动平台在多媒体体验方面实现了多项突破。平台集成了先进的图像处理技术,让用户能够捕捉更高质量的照片和视频;同时,该平台还引入了部分原本仅在旗舰级骁龙8系列才有的Snapdragon Elite Gaming特性,为游戏爱好者提供更流畅的游戏体验。 值得一提的是,第四代骁龙7首次在非骁龙8系平台上支持高通扩展个人局域网(XPAN)技术,并搭载了Snapdragon Sound骁龙畅听技术,为用户带来更全面的音频体验。高通技术公司高级副总裁兼手机业务总经理Chris Patrick表示:“我们为骁龙7系带来全新可能性,将AI驱动的体验直接融入硬件,让用户更轻松地拍摄、创作和分享。” 据了解,荣耀和vivo将成为首批采用第四代骁龙7移动平台的厂商。荣耀终端股份有限公司产品线总裁方飞表示,荣耀将在即将发布的产品上采用这款新平台,为用户提供出色性能和领先特性。vivo产品副总裁欧阳伟峰也确认,vivo即将推出搭载该平台的智能手机,旨在带来创新且高效的沉浸式移动体验。 随着第四代骁龙7的发布,中端智能手机市场将迎来新一轮AI能力竞争,特别是在终端侧AI处理能力方面。首批搭载该平台的终端预计将于本月内正式面市,这将进一步推动中端手机市场的产品更新换代。
马斯克再放豪言:每个人都会想要他们的个人机器人
编译 | 李夏 编辑 | 漠影 智东西5月15日消息,据外媒Business Insider报道,在本周二于沙特利雅得举行的美国-沙特投资论坛上,特斯拉CEO埃隆·马斯克再次描绘了一个由人形机器人主导的未来图景。 他称人形机器人的数量未来可能达到数百亿,将彻底改变全球经济格局,并极大地提升生产力。 “每个人都会想要他们的个人机器人。”马斯克说道,“你可以把它想象成拥有自己的C-3PO或R2-D2——但比他们更强大。”这里指的是《星球大战》中的经典角色C-3PO(会说话、懂人类语言的类人机器人)和R2-D2(多功能维修机器人)。 马斯克说,随着自动化达到这一规模,社会将进入所谓的“全民高收入”阶段,商品和服务将极大丰富,以至于每个人都能轻松获取自己需要的物品和服务,没有人会缺少任何东西。 一、马斯克亲自押注:Optimus人形机器人加速迈向量产 马斯克本人深度参与机器人研发。他曾在2023年10月的特斯拉Robotaxi发布会上说,特斯拉研发的人形机器人Optimus有潜力成为“有史以来在全球范围内广泛普及的产品”。 据他介绍,特斯拉的目标是每年生产100万台机器人,尽管该项目仍面临技术突破、全球政治局势和供应链安全等多重挑战。 最新展示的视频中,Optimus已具备如折叠衬衫等实际应用能力。马斯克相信,随着人形机器人和深度智能(指具备复杂推理和自主学习能力的AI)的发展,将释放近乎无限的产品与服务潜力。 二、Robotaxi驶入沙特:自动驾驶将融入2030愿景 除了人形机器人,马斯克也在加速推动自动驾驶技术落地。他称未来的汽车将是“四个轮子上的机器人”,具备自主感知、智能决策与自动行动的能力。 他希望特斯拉的Robotaxi自动驾驶出租车能进入沙特市场。 虽然马斯克未透露明确时间表,特斯拉方面称今年6月将在美国奥斯汀启动机器人出租车试点项目。 沙特官员对此持欢迎态度,称自动驾驶汽车是其2030愿景战略的一部分,旨在推动国家经济多元化,减少对石油经济的依赖。 目前,美国网约车公司Uber已在沙特推进机器人出租车计划,与中国公司小马智行Pony.AI合作,并与沙特交通主管部门签署了新的协议。同时,Uber还掌控着中东地区主要的出行平台Careem。 结语:科技乌托邦或“终结者”末日?马斯克坦言AI发展风险犹存 尽管对机器人与AI的未来充满期待,马斯克也承认技术发展蕴含风险。他说未来也可能出现类似《终结者》中AI觉醒、反叛人类的“末日场景”,而非《星际迷航》那种人机和谐共存的理想社会。 他在过去接受美国All-In Podcast播客节目采访时曾表示,自己估计人工智能导致“人类灭绝”的风险约为20%。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。