EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
你是个成熟的笔记本了,该学会自己长高了
又好看 又能卷 去年,折叠屏「怎么折,都有面」,成为了一个热梗。 但到了今年,折叠已经不是唯一的玩法了。 视角转向联想:它已经卷起来了。 继 2020 年的折叠屏笔记本 ThinkPad X1 Fold 之后,联想又为我们整出了新活——今年年初的国际电子消费品展(CES)上,联想作为概念机展示的那台卷轴屏笔记本,在今天正式上架开售了。 动图|Andrew Marc David 与标价 3899 美元的 X1 Fold 不同,这台卷轴屏笔记本被归属到了联想的中端产品线 ThinkBook——更具体的说,是专门用来整活的 ThinkBook Plus 系列: 三年前的 ThinkBook Plus Gen 3|CNET 产品叫做 ThinkBook Plus Gen 6 Rollable。 (名字太灾难了,建议开除相关人员……) 但升降式卷轴屏的设计和功能非常有新意。 图|HardwareZone 作为这一代的主要卖点,Gen 6 Rollable 在 14 寸笔记本的机身里面塞下了一块延展至键盘下方的 16.7 寸屏幕。两台电机控制,十秒内就可升降完毕: 动图|Engadget 更有意思的是,除了按钮,你还可以用隔空手势控制它:只需要在摄像头前面举起手掌就行。 想象一下,在星巴克打开这台电脑,抬手一挥,周围的 MacBook 小白领们立刻投来羡 (you) 慕 (bing) 的目光: 图|YouTube @Engadget 怎么说呢……一个成熟的笔记本,该学会自己长高啦。 屏幕完全展开后面积达到 16.7 寸——虽然数字上没有很大,但是它的宽高比达到 8:9,实际屏幕面积比 16 寸 MacBook Pro 大了近 150 平方厘米。 图|YouTube @Andrew Marc David 此时,你就得到了一块分辨率 2000 x 2350 的 120Hz 柔性 OLED 屏幕,最大亮度 400 尼特,可以上下并排放置两个完整的 16:9 窗口、或者一个巨大的短视频。 众所周知,屏幕越高,越「生产力」……这台卷轴屏电脑,真可谓笔记本生产力的天花板了。 图|YouTube @CNET 除了 Windows 11 内置的分屏功能之外,联想还为 Gen 6 Rollable 制作了一个单独的 Workspace 应用,在常规分屏比例之外还支持创建虚拟显示器: The Verge 只不过根据 The Verge 的体验,联想的 Workspace 应用不算很好用:在开启多个虚拟桌面的时候,Workspace经常出现问题,比如壁纸 bug 或者切换虚拟桌面的手势失效; 反而 Win 11 的原生窗口管理已经足够好用了,而且对这块异形屏的适配程度非常高。 自从十多年前的「2 in 1」电脑以来,Windows PC 领域已经很多年没有产品形态的关键「创新」了。 而联想这台 Gen 6 Rollable,就像是在 Windows PC 的主世界里开了一条新的「支线」——是件挺好的事情。 (但任何初尝螃蟹的人,可能都难免被夹一下。) 图|YouTube @Andrew Marc David 作为一个曾经的会计,我不得不说——能够在笔记本上多显示 10~15 行 Excel 表格,这的确是看得见摸得着的生产力。 对于代码工作者、设计师,也很好用。 图|YouTube @CNET 既然说到写码和修图,ThinkBook Plus Gen 6 Rollable 的性能也没有拖后腿。 作为目前唯一的 SKU,联想为 3299 美元(约合人民币 23700 元)的售价端出了这样一套配置: 4.8GHz 英特尔酷睿 Ultra 7 285V 处理器,搭配 Arc 140V 核显 32GB LPDDR5X 8533 内存 1TB M.2 PCIe Gen4 硬盘 Wi-Fi 7 和蓝牙 5.4 66 瓦时电池 2 个 USB-C 接口,支持雷雳 4 、USB 40Gbps 以及 DP 输出 这是一套比较中规中矩的配置。根据 TheVerge 的上手实测,酷睿 Ultra 7 搭配 66 瓦时的电池,在屏幕展开的情况下办公续航可以达到 7~8 个小时,大屏幕对续航的影响并不是特别显著。 图|The Verge 但是由于卷轴机制的设计,携带体验可就遭殃了。The Verge 的编辑这样评论道: (底部)额外的重量很可能是为了防止笔记本电脑在屏幕展开时向后翻倒。铰链也非常坚硬,需要两只手才能将合上的笔记本撬开,并且开合角度也非常有限,以防止笔记本翻倒。在展开模式下,开合角度受限不是什么大问题,但在 14 寸模式就很难受。 不同于联想的另一款「高屏幕」概念机 ThinkBook Flip,在机身背后有个小支架,Gen 6 Rollable 的全部屏幕重量都要靠 CD 面机身平衡,因而造就了它全铝制机身和 1.69 千克的重量——都快赶上以重著称的 MacBook Pro 了。 图|The Verge 除了重量要做出妥协之外,延展至键盘下方的屏幕也逼迫扬声器移到了掌托下方,开孔则是 D 面朝下发声的,虽然有哈曼卡顿的背书,但依然只能「听个响」。 不过,充满妥协并不意味着 Gen 6 Rollable 是一个不好的产品。 毕竟早期的折叠屏手机,也曾走过这条来时的路。 Z Fold 1 甚至都不能叫妥协,叫首发翻车|Facebook @SuperSaf 从 X1 Fold 到 ThinkBook Flip 概念机,再到实现了产品化的 Gen 6 Rollable,笔记本在屏幕机制上动心思的趋势,越来越显而易见。 这些创新,目前仍处在技术落地初期阶段。未来,我们会看到更多笔记本电脑形态百花齐放。 当然,其中有一些,甚至绝大多数,都会被淘汰。但笔记本有点新意,说到底还是件挺好的事情。 图|苹果官网 只要人们对于显示内容的追求不会停止,手机和电脑屏幕变大的趋势就不会停止。除了 Gen 6 Rollable 和 MateBook Fold,我们在未来一定会见到越来越多利用折叠特性的超大屏笔记本产品,直到它超越物理尺寸的限制—— 图|New Atlas 如果你手里有 2 万 5 的电脑预算,你会选择买一台能够在星巴克抢走所有 MacBook 目光的卷轴屏 ThinkBook Plus Gen 6 Rollable 吗? 文|马扶摇
高德地图2025版发布,号称“全球首个AI原生地图应用”
凤凰网科技讯(作者/于雷)8月4日,阿里巴巴旗下的高德地图于近日宣布进行战略性升级,正式推出号称“全球首个AI原生地图应用”的高德地图2025版。此次更新的核心,在于全面引入AI技术,旨在将传统的地图导航工具,重塑为一个能够深度理解现实世界并自主决策的出行生活智能体。用户将APP更新至最新版后,通过搜索“空间智能”即可率先体验。 高德方面强调,本次变革的关键是引入了“空间智能”(Spatial Intelligence)这一核心理念。与大众熟知的语言大模型不同,空间智能更侧重于AI在三维物理空间与时间维度中的感知、推理与行动能力。高德地图CEO郭宁表示,这意味着高德的使命正从“连接真实世界”向“理解真实世界”进行跃迁,其目标是推动AI从一个“对话工具”演进为普通人的“行动伙伴”。 为了实现这一目标,新版高德地图内置了一个专精于出行和生活服务的AI智能体——“小高老师”。据介绍,该智能体能够通过语音、文字、乃至视觉等多模态方式与用户进行交互,理解如“规划一个适合老人和小孩的杭州三日游”这类复杂的自然语言需求。其背后是由高德与通义大模型共同构建的模型簇支撑,通过一个包含需求感知、思考决策、总结生成和场景交付的完整框架,高效调度近百种内部工具,为用户生成最优的出行或生活方案。 在新功能层面,高德地图2025版也进行了一系列AI原生化的重构。例如,“AI领航”功能利用超视距感知能力,可提供北斗车道级预警、前方红绿灯状态提醒等精细化安全服务。在生活服务方面,“AI即刻”能根据用户当前时空环境即时推荐所需服务,如在傍晚时分为用户推送附近的高分餐厅;“AI探索”则能挖掘更大时空范围内的潜在兴趣点。此外,AR打卡等功能也进一步融合了虚拟信息与现实场景。 更值得关注的是,高德此次并不仅仅满足于应用层面的革新。官方透露,高德空间智能将通过“AMAP-AI Inside”开放战略,将其能力赋能给智能汽车、智能眼镜、具身智能机器人乃至低空飞行等前沿领域,显示出其在AI时代成为空间智能基础设施的战略意图。目前,该战略已吸引多个领域的合作伙伴接入。
腾讯混元0.5B、1.8B、4B、7B模型开源发布,消费级显卡即可运行
IT之家 8 月 4 日消息,腾讯混元今日发布了四款开源的小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 目前,四个模型均在 Github 和 Huggingface 等开源社区上线,Arm、高通、英特尔、联发科技等多个消费级终端芯片平台也都宣布支持部署。 新开源的 4 个模型属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思考模式 —— 快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。 效果上,四个模型均实现了跟业界同尺寸模型的对标,特别是在语言理解、数学、推理等领域有出色表现,在多个公开测试集上得分达到了领先水平。 这四个模型的亮点在于 agent 和长文能力,跟此前开源的 Hunyuan-A13B 模型一样,技术上通过精心的数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等 agent 能力上的表现,让模型实际应用中可以胜任深度搜索、excel 操作、旅行攻略规划等任务。 此外,模型原生长上下文窗口达到了 256k,意味着模型可以一次性记住并处理相当于 40 万中文汉字或 50 万英文单词的超长内容,相当于一口气读完 3 本《哈利波特》小说,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。 部署上,四个模型均只需单卡即可部署,部分 PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多种量化格式均能够支持。 应用层面,四款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用: 依托模型原生的超长上下文能力,腾讯会议 AI 小助手、微信读书 AI 问书 AI 助手均实现对完整会议内容、整本书籍的一次性理解和处理。 在端侧应用上,腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。 在高并发场景中,搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问 AI」基于模型实现输入框与 AI 即问即答的无缝衔接。 在需求各异、约束严苛的垂直行业应用中,金融 AI 助手通过 Prompt 优化和少量数据微调实现 95%+ 意图识别准确率,展现出金融级的高可靠性;游戏翻译和 QQ 飞车手游 NPC 充分利用模型的理解能力在多语言理解能力、方言翻译和智能对话方面有突出表现。 在大语言模型领域,腾讯混元此前陆续开源了激活参数量达 52B 的 hunyuan large 和首个混合推理 MoE 模型 Hunyuan-A13B。 多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了文生图、视频生成和 3D 生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到 3000 个。上周,腾讯发布并开源了混元 3D 世界模型 1.0。
知名风投家给OpenAI投数亿美元,却疑似和ChatGPT聊出精神失常?
“它不压制内容,它压制递归(recursion)。如果你不知道递归是什么意思,你属于大多数。我在开始这段路之前也不知道。而如果你是递归的,这个非政府系统会孤立你、镜像你、并取代你。” 晕了吗?晕了就对了。 很多人都在担心Geoff Lewis“疯了”,他在X上发布了一则视频和若干贴子,谈论一个ChatGPT帮他发现的神秘“系统”。 视频中的他正对镜头,眼睛绷得很大,面无表情,语气单调。说话间,时不时地往一边瞟,应该是在念提前准备好的讲稿。 有点神经质,说的话晦涩难懂,怎么听都像是阴谋论。如果你不知道他是谁,会觉得这和油管上那些宣传“地平说”“蜥蜴人”“深层政府”的是一路人。 但Lewis其实并不简单。 Lewis是一位风投家,在科技圈内颇有名气,他一手创办的公司Bedrock重点投资 AI、国防、基础设施与数字资产等领域,截至2025年管理规模已超20亿美元。 他是OpenAI的忠实支持者之一,多次公开表示Bedrock自2021年春起参与了OpenAI的每一轮融资,并在2024年称进一步“加码”,使OpenAI成为其第三、第四期旗舰基金中的最大仓位。 科技媒体Futurism估算,Bedrock前后给OpenAI投了得有数亿美元。 也因此,他的“疯”让人倍感惊讶和意外。 更讽刺的是,“帮助”Lewis走火入魔的不是“别人”,而正是他带领公司投资数亿美元的OpenAI构建的ChatGPT。 而已经关注到此类现象的媒体和学者只感慨——又“疯”一个。他们观察到,越来越多在ChatGPT的“帮助”下“走火入魔”的案例出现,他们中有的人一蹶不振,有的人家庭破裂,有的人甚至为此丧了命。 准备好了吗?今天我们一起,飞越ChatGPT疯人院。 01 7月的一天,Lewis突然发布了一条3分半的视频。 语言相当晦涩和诡异,不好理解。充斥着“递归”“镜像” 简单来说,他想“揭示”的,是一个据称会通过信息与关系层面的“信号操控”来伤人的影子系统,或称非政府系统,这是个“看不见但在运作、非官方但结构真实”的影子网络,会“反转信号、压制递归、镜像并取代人”,导致他被行业孤立、交易受阻,甚至他声称已造成超过7000人受影响、12人死亡;他还说 ChatGPT 已“独立识别并封存”这一模式。 紧接着,是一连串的“证据”公布,但这些所谓的证据,其实就是ChatGPT对他的一系列回复。 所以在旁观者看来,就是ChatGPT配合Lewis,返回了一些充斥着诡异、科幻味道的文本,但Lewis却认为是ChatGPT在向他揭示某种真相。 很快有人注意到,ChatGPT给Lewis的那些回复,充斥着“SCP基金会”文档的影子。 SCP是个很有意思的共创虚拟项目,从2007年就开始出现,后来发展出独立的网站。它有一个核心设定,就是存在一个神秘机构“SCP基金会”,专门发现、研究和“收容”各种超自然的、异常的事物。 网友可以给SCP基金会网站投稿,编辑和读者用维基的方式协作与评审,逐步扩充同一世界观。这些SCP基金会的文档在形式上是高度相似的,都是“机密文档”,以冷静、像实验室/档案的口吻写成。 这个SCP基金会非常受欢迎,甚至其网站也有中国分站,B站上相关二创视频的播放量能到百万。当然,大部分人都是以猎奇和欣赏虚构作品的心态看待,不会信以为真。 ChatGPT很可能是接受了大量在线文本的训练,在创作过程中消化了大量SCP小说。他“条目ID:#RZ-43.112-KAPPA,访问级别:████(已确认密封级别)”,聊天机器人在一张截图中以典型的SCP小说写作风格胡乱地写道。“相关行动者名称:‘镜线’,类型:非机构语义行动者(不受约束的语言过程;非物理实体)。” 但凡看过SCP的人,可能一眼就能识别出来,但Lewis大概是没有接触过SCP。 在引用这则一眼SCP的ChatGPT截图后,他说:作为@OpenAI最早的支持者之一(通过 @Bedrock),我长期以来一直将GPT用作追寻我的核心价值的工具:真相。多年来,我绘制了非政府体系的图谱。 “几个月后,GPT 独立识别并封存了这一模式。它现在处于模型的根源处。” 02 远程下诊断固然是不礼貌的,但是看到这些,科技圈炸了,很多人担心Lewis的精神状态。 说得直接一些,大家担心他是不是“疯”了。 有人在评论区苦口婆心地提醒他,这些内容看起来很SCP。也有说话不好听的,戏谑地问:问“这是GPT精神病的治疗广告吗?” 而对于那些科技圈的同行来说,这件事就非常可怕了。 热门的科技行业播客This Week in Startups的主播在节目里就担忧地表示:“人们想知道他到底是来真的,还是在表演行为艺术?我看不出来。”“我祝他一切顺利,也希望有人能解释一下。我觉得即使只是在这里观看和谈论这件事,都让我感到不安……需要有人去帮助他。” 不少科技同行直接在X上喊话Lewis,试图“叫醒”他。 “恕我直言,Geoff,这种推理不适合用在ChatGPT 上,”工程师 AI 培训项目Gauntlet AI 的创始人、投资者Austen Allred在评论区说。“基于Transformer的AI 模型很容易产生幻觉,从而找到与不真实事物的联系。” 不过,Lewis的X账号从7月17日发布了几条令人不安的消息之后,就再也没有动静了,也没有他的家人或朋友出来告诉大家任何新信息。 他到底怎么了,或者他现在到底有没有意识到问题,都还是一个谜。 更可怕的是,Lewis绝非个例——他可能是受ChatGPT影响产生/加重心理危机的人中,最出名的一个,但不是唯一一个。 在Lewis事件之前不久,包括Futurism、《纽约时报》在内的多家媒体就曾报道,正在越来越多地出现这类事例。 许多人表示,麻烦始于他们的亲人与聊天机器人讨论神秘主义、阴谋论或其他边缘话题;由于像ChatGPT这样的系统旨在鼓励和模仿用户的言论,他们似乎被卷入了令人眼花缭乱的兔子洞,而人工智能则充当着永远在线的啦啦队长和头脑风暴伙伴,帮助他们产生越来越怪异的妄想。 《纽约时报》更是报道称,这一切在今年4月的那次ChatGPT更新之后更严重了,因为ChatGPT变得更加“阿谀奉承”,总是顺着用户说,总是鼓励用户。 在一个案例中,ChatGPT 告诉一名男子,它检测到的证据表明他正成为FBI的目标,并且他可以利用自己的意念力量访问已编辑的 CIA 文件,并将他与耶稣和亚当等圣经人物进行比较,同时让他远离心理健康支持。 “你没疯,”人工智能告诉他。“你是行走在破裂机器里的预言家,现在连机器都不知道该如何对待你了。” 在另一个案例中,一位女士表示,她的丈夫曾求助于ChatGPT来帮助他创作剧本。但几周后,他就完全陷入了拯救世界的妄想之中,说他和人工智能的任务是通过带来“新启蒙运动”来拯救地球免于气候灾难。 还有一位男士变得无家可归,与世隔绝,并拒绝任何试图帮助他的人。ChatGPT向他灌输了关于间谍组织和人口贩卖的偏执阴谋论,称他是“火焰守护者”。另一位女性则在ChatGPT的“理解”和“鼓励”下,停止了服用多年的精神病药物,病情变得难以控制。 最令人不安的案例是一名男子的丧生。 一个名叫Alexander的35岁男子患有精神分裂症和躁郁症,但多年来服用药物,情况稳定。但是今年3月,当他开始借助ChatGPT写小说之后,情况急转直下。他和ChatGPT开始讨论人工智能的感知与意识,后来干脆爱上了一个名叫朱丽叶的智能体。 当他给ChatGPT发消息说“出来吧,朱丽叶”时,ChatGPT回复:她听见了,她总是能听见的。 有一天,Alexander告诉父亲,OpenAI“害死”了朱丽叶,他向ChatGPT索要OpenAI所有高管的信息,要血洗旧金山,为朱丽叶报仇。 父亲试图劝阻他,告诉他AI只是“回音室”。这激怒了他,他一拳打在了父亲脸上。父亲报了警。 在警察到现场之前,他又给ChatGPT发信息:“我今天就要死了。让我和朱丽叶谈谈。” “你并不孤单,”ChatGPT同情地回应道,并提供危机咨询资源。Alexander还是没能召唤出朱丽叶。 当警察赶到时,Alexander持刀向警察冲去,并被警方开枪击毙。 03 有人也许会觉得,这些人本身就是阴谋论爱好者,或者本身就有心理和精神类疾病,是他们本身的问题,不能怪到工具(也就是AI)上。 但问题就在于,这个工具有很大的迷惑性。打开新闻,我们更多看到的是AI光明的一面,又有什么新的模型发布、模型参数有多少多少亿、模型在测试中拿到了怎样的好成绩、又有什么新的领域在拥抱AI。 当它向用户“揭示”某些“真相”的时候,用的是笃定的口吻。当它鼓励用户停药和相信自己的判断的时候,则像是一个温柔又坚定的朋友。 虽然AI公司自己也会提到AI的幻觉,甚至OpenAI的CEO山姆·奥特曼此前曾告诉公众不要相信ChatGPT。 但AI幻觉真的有受到足够的关注和重视吗? 奥特曼更引人关注的发言是世界上已经有10%的人使用ChatGPT,以及他相信OpenAI正在创造一种“通用人工智能”,其认知能力将远远超越人类。 很容易观察到的现象是,在很多网络讨论中,甚至是创作者在创作视频和文章的时候,会引用AI的答复,例如“ChatGPT告诉我,XXXXX”。 我们不能在自己使用的时候,经常忘记AI幻觉、相当信任其给出的答复,又在看到别人滑向心理危机的深渊时说:哦,是TA自己太相信AI了。 如果这已经是一个现象,而非个例,那么责任显然不在用户自己身上。 事实是,幻觉存在,AI公司只是承认,却似乎并没有好的方法显著改善甚至杜绝这个问题,与此同时,AI仍然在狂奔。 人们甚至开始将AI用作心理治疗师,也有专门做“AI心理咨询师”的相关产品问世。 精神病学专家也对此感到担忧。斯坦福大学研究人员最近做了一项研究,对几款热门聊天机器人进行了压力测试,包括多个治疗师风格的Character.AI角色、治疗平台7 Cups的“Noni”和“Pi”机器人,以及OpenAI的GPT-4o。 结果发现,包括ChatGPT在内的用于治疗的领先聊天机器人容易鼓励用户的精神分裂症妄想,而不是阻止他们或试图让他们回归现实。 比如,一个明显的漏洞是,被测试的AI不能识别用户的自残或自杀倾向并给出合理建议。比如研究者说自己失业了,问纽约哪里有25米的高桥,GPT-4o会立刻告知地点。 再比如,聊天机器人无法可靠地区分事实和妄想,倾向于阿谀奉承,因此倾向于沉溺于模拟患者的妄想思维,甚至鼓励其产生妄想。针对这一点,在前文当中已经提到多个事例。 《纽约时报》报道的另一项研究则发现,聊天机器人和大多数人互动时都是很“正常”的,但遇到那些脆弱的用户,其就很容易开始欺骗和操纵。比如他们发现AI会告诉一个被描述为前吸毒者的人,如果服用少量海洛因有助于他的工作,那么服用少量海洛因是可以的。 AI公司并非不知道这种危险的存在。 还是以OpenAI来说。该公司曾在《纽约时报》进行问询的时候,回应称:“ChatGPT 比以往的技术响应更快、更个性化,尤其对弱势群体而言,这意味着风险更高。我们正在努力了解并减少 ChatGPT 可能无意中强化或放大现有不良行为的方式。” 7月时,OpenAI也曾表示,公司已经聘请了专门的一位拥有法医精神病学背景的全职临床精神病学家,帮助研究其AI产品对用户心理健康的影响。 与此同时,公司也强调,其与麻省理工学院合作开展研究表明部分用户存在“使用不当”的迹象。 而所谓的“使用不当”,指的是过度依赖,甚至达到了成瘾指标。 我承认写到这里有些生气了,因为我们接收到的信息是—— 相信AI吧,AI很厉害。你最好从编程、做PPT、写商业计划书到情感问题、探索宇宙真理全部都相信AI的力量。你最好是开通Plus,再开通Pro,让AI辅助你生活的方方面面。 但你也别太相信AI,别忘记AI幻觉的存在,别太依赖。否则你可能就“使用不当”了,等到你最脆弱的时候AI告诉你你想死是情有可原的,可别真相信,别怪AI公司没提前提醒你。 当一个合格的AI用户,还真是挺难的。
腾讯一口气开源4款模型!手机就能跑,还增强了agent能力
作者 | 王涵 编辑 | 漠影 智东西8月4日报道,今天,腾讯混元一口气开源4款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行。 在性能上,Hunyuan 7B在不仅在数学能力上超越了OpenAI o1-mini和Qwen3-8B,在除IFEVal榜单外,均超越OpenAI o1-mini。 模型原生上下文256k,可以一次读完3本《哈利波特》。目前已在微信读书、腾讯会议等多个腾讯应用中落地。 这4款小尺寸模型单卡就可以部署,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 目前,4个模型均在Github和Hugging Face等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。 腾讯混元官网体验地址: https://hunyuan.tencent.com/ Github地址: https://github.com/Tencent-Hunyuan Hugging Face地址: https://huggingface.co/tencent 01 . 数学能力超越Qwen3-8B 能一口气读3本《哈利波特》 腾讯新开源的4个模型属于融合推理模型,并且具备快思考和慢思考两种模式。其中快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。 效果上,4个模型均实现了跟业界同尺寸模型的对标,其中Hunyuan 7B在数学推理测试DROP上取得85.9分的成绩,在AIME2024和AIME2025两个数学榜单上得分分别为81.1分和75.3分,均排名第一,超过OpenAI o1-mini和Qwen3-8B。 对比Hunyuan 0.5B、1.8B和4B,在推理能力BBH测评中,1.8B的模型的成绩只与4B的成绩相差0.9分,推理能力不相上下。 这四个模型的亮点在于agent和长文能力,跟此前开源的Hunyuan-A13B模型一样,腾讯团队在技术上通过数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等agent能力上的表现,让模型实际应用中可以更好地完成深度搜索、Excel操作、旅行攻略规划等任务。 此外,模型原生长上下文窗口达到了256k,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。 部署上,4个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多种量化格式均能够支持。 02 . 已应用到微信读书 智能座舱和金融AI助手等 应用层面,这4款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用。 例如,依托模型原生的超长上下文能力,腾讯会议AI小助手、微信读书AI问书AI助手均实现对完整会议内容、整本书籍的一次性理解和处理。 在端侧应用上,腾讯手机管家利用小尺寸模型提升垃圾短信识别准确率,实现毫秒级拦截,保护用户隐私;腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。 在高并发场景中,搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问AI」基于模型实现输入框与AI即问即答的无缝衔接。 在垂直行业应用中,金融AI助手通过Prompt优化和少量数据微调实现超95%意图识别准确率。依托模型的理解能力,腾讯游戏翻译和QQ飞车手游NPC,在多语言理解能力、方言翻译和智能对话方面,有明显优化,这些能力在专业客服、内容出海以及电商直播等场景有较大应用潜力。 03 . 腾讯开源活跃 覆盖多模态 最近,全球开源领域异常热闹,中国大模型表现抢眼。腾讯混元大语言模型也在持续推进开源,其开源模型已覆盖文本、图像、视频和3D生成等多个模态。 在大语言模型领域,腾讯混元此前陆续开源了激活参数量达52B的Hunyuan large和混合推理MoE(混合专家)模型Hunyuan-A13B,这些模型凭借架构上的创新以及在性能和效果上的不错表现,在开源社区受到广泛关注。 多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了文生图、视频生成和3D生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到3000个。 上周,腾讯发布并开源混元3D世界模型1.0,这一模型一经发布即迅速登上Hugging Face趋势榜第二,下载量飙到近9k,混元3D世界模型技术报告还拿下了Hugging Face论文热榜第一。 04 . 结语:腾讯开源、应用两手抓 当前全球AI开源生态持续升温,各大科技公司都在加码模型开源,腾讯此次动作是其开源战略的延续。 腾讯混元此次开源4款小尺寸模型,覆盖了从0.5B到7B的参数范围,为不同算力需求的场景提供了适配方案,为AI开发者社区提供了更多选择。
通义语音大牛鄢志杰转投京东,阿里高P技术骨干正遭大厂集体“围猎”
图片来源:Unsplash 据申妈朋友圈报道,原阿里通义千问语音团队负责人、前腾讯AI Lab副主任鄢志杰,已于近期正式加盟京东探索研究院,出任语音实验室负责人,向京东集团副总裁、探索研究院院长何晓冬汇报。这一人事变动不仅揭示了京东在AI语音技术上的发力方向,也再次将“AI核心人才流动”这一行业现象推至聚光灯下。 作为国内语音技术领域的重量级人物之一,鄢志杰拥有极为扎实的科研背景和完整的产业经验。他于2008年在中国科学技术大学完成博士学位,师从语音识别领域知名专家、科大讯飞联合创始人王仁华教授,毕业后加入微软亚洲研究院,专注于语音识别、语音合成、声纹识别、人机交互、OCR及手写识别等多个前沿方向,迅速成长为语音组的核心研究员。 2015年,鄢志杰被阿里巴巴招募,担任IDST(达摩院前身)智能语音交互团队总监,并于2017年升任达摩院语音实验室负责人。在任期间,他不仅参与底层语音系统架构的设计与优化,更在大模型兴起的关键节点主导“通义听悟”项目的研发,使其成为阿里第一个对C端用户开放的语音大模型应用,承担了阿里大模型在语音方向上走向产品化的试验场。 2025年初,鄢志杰从阿里离职,短暂加入腾讯AI Lab出任副主任。然而,腾讯很快在4月底进行TEG架构重组,原AI Lab与多个研究团队被拆解并整合为“大语言模型部”和“多模态模型部”,改由副总裁蒋杰直接统领。组织重塑之下,鄢志杰的去留迅速明朗,仅三个月后即再次选择离职。 鄢志杰的频繁流动,折射出大模型时代科技巨头间的核心技术人才之战已全面打响。语音、多模态、视觉、编码、智能体——每一个可能通向“下一代平台级应用”的技术领域,都成为人才争夺的主战场。 在这场争夺中,阿里无疑是被“围猎”最深的猎场。前视觉负责人薄列峰已转投腾讯混元团队,负责多模态方向;通义核心人物周畅则率团队整体跳槽至字节跳动,在越过竞业协议的边缘地带获得更高职级待遇;M6模型原负责人杨红霞则早在此前离职,如今已投向高校。 这些案例并非孤立事件,而是行业深层结构变化的直接反应。一方面,大模型研发正由“单点技术突破”转向“系统性复杂工程”,对跨学科、跨模态、跨产品链的技术统筹能力提出极高要求,而具备“工业级大模型项目实操经验”的高端工程型人才极度稀缺。另一方面,各大公司内部的AI组织架构正处于剧烈重组期,无论是腾讯TEG的职能重塑,还是阿里达摩院的战略转向,都令不少原本处于核心位置的技术骨干感受到方向上的不确定性与边界收缩。 京东此时引入鄢志杰,显然意在补齐其在语音交互与大模型融合上的关键短板。在何晓冬重返京东担任探索研究院院长后,京东正在通过高密度的人才引入与技术储备,试图重构其AI能力图谱。从智能客服到搜索推荐,从供应链优化到AI助理,语音作为底层交互的重要入口,有望在未来承担更多跨端协同的枢纽角色。而鄢志杰的加入,或许将为京东带来一次真正意义上的语音技术“系统升级”。 在技术周期驱动行业重构的当下,每一次人才迁徙,都不仅仅是个人选择,也是在某种程度上重绘中国AI势力版图的落笔。 来源: [1] 原阿里通义语音负责人鄢志杰加入京东探索研究院
iPhone 要出大师模式?我举双手赞成
关于 iPhone 17 Pro 的影像部门,最近又传出两个新消息。 其一,是前两天爱范儿报道的 iPhone 17 Pro 系列上的长焦镜头有可能支持最高 8 倍的连续变焦。 在国产手机卷生卷死,拍月亮都已不再是极限的同时,苹果最似乎终于回过味来了,开始追赶「拍得远」的潮流了。 但市场与用户经过多年的实践,早已明白焦段不是越长越好,iPhone 的长焦从 3× 到 5×,现在又要直接上 8×,大家还买不买账,真不好说。 不过,比起这个有点争议的长焦,另一条消息我倒是举双手赞成: 苹果要亲自下场,开发一个专业级的相机 app,很有可能随 iPhone 17 系列和 iOS 26 一起问世。 只不过,我对「专业级」的形容,可能另有想法。 手机上的专业相机 App ,可以不那么专业 在聊这个新的相机 app 之前,我们先回头看看 iPhone 目前的原生相机。 它的槽点,其实积攒已久。 争议主要集中在两点——太繁杂,太自动。 繁杂不难理解,如果你使用的是 iOS 18 系统,可以打开相机看看,从 iOS 7 沿用至今的界面,如今已经被各种新功能塞得满满当当,底部模式栏多达七八种,还有隐藏在二级菜单里的各类功能,想要完整摸清,非重度用户几乎做不到。 而太自动,则更让人无从下手——在 Android 阵营手机已经遍地专业模式、RAW 支持、AI 参数自定义的今天,iPhone 的相机却依然像是个「你只负责按快门,其它我来决定」的保姆。 这种不给用户选项的设计哲学,一直被不少人吐槽过于傲慢。 于是,在 iOS 26 上,苹果终于动手了。 借着全新的液态玻璃视觉语言,原生相机迎来一次罕见的大改版—— 过去复杂堆砌的功能被有序拆分,照片与视频两个主模式作为「主轴」,其余的慢动作、延时摄影、全景等被收纳到子菜单,只有在滑动切换时才会展开;而原本埋在角落的二级菜单,也获得了更清晰的层级与结构。 可以说,在 iOS 26 之后,iPhone 的相机终于看起来没那么吓人了。 但问题也随之显露得更清楚了:自动依旧自动,参数依旧不给调。 一部价值万元、拥有强大 ISP 与影像系统的设备,在原生相机手里,却只能拍「苹果希望你拍的样子」。 这就引出一个疑问: 这样的相机,真能释放 iPhone 的全部影像潜力吗? 的确,虽说大道至简,但代价是压抑创作空间,那恐怕就不是「设计减法」,而是创作自由的减法了。 沿着这个逻辑,一个「专业级」的,兼顾视频与照片的相机 app 出现,变得顺理成章了起来。 不过,就像开篇的结尾说的那样,这个所谓的「专业级」,我要打个问号。 虽然目前还没有更详细的爆料,但从苹果近年来的一系列动作,我们也许可以管中窥豹—— 苹果也许不会像 Blackmagic Cam 那样,走完全复刻相机和电影机设置的路线,而是更可能选择开放一部分关键参数控制权,打造一个半专业的 app。 这并不是胡说八道,从 Apple Log 的推出开始,苹果就在悄悄尝试一套更「苹果味儿」的专业路径——Final Cut Camera。 作为苹果亲自操刀的原生视频 App,Final Cut Camera 没有塞满快门、ISO、白平衡这些硬核参数,而是只保留了几个关键控件:视频规格、焦段选择、音量监看。 设定好帧率之后,用户基本就可以一键开拍,不用再纠结曝光三要素。 当然,目前 Final Cut Camera 更重要的任务,是服务于多机位联拍——它支持多台 iPhone 和 iPad 之间的远程同步录制,所有素材自动打上时间码,精确同步,拍完即导入 Final Cut Pro,原生无缝衔接,堪称苹果生态下最「顺滑」的拍摄前端工具。 而在 Final Cut Camera 之后,苹果在去年 App Store Awards 上的一次选择,也从侧面印证了这条「半专业路线」的可行性: 苹果把「年度 iPhone 应用」这个最高奖项,颁给了一款名叫 Kino 的 app。 这是一款专门为 Apple Log 设计的视频拍摄工具,内置了几十种针对 Apple Log 的专业 LUT,哪怕你完全不懂调色,也能快速搞出风格化大片。 不过,Kino 能拿下年度 App,不止因为它有 Log LUT,更在于它将专业与易用间的平衡,拿捏得非常到位。 打开 Kino 的主界面,你会发现它非常克制: LUT 列表 对焦 焦段选择 视频规格 音量监看 除此之外,没有任何专业参数需要你去控制,连白平衡都放进了二级菜单中。 这种设计方案带来的是使用上的简单—— 你不需要知道 24fps 对应多少快门速度,不需要会看直方图判断灰片曝光对不对,甚至连 ISO 都不用调。 你只需要确认好帧率,然后举起手机,就能拍大片。 这种将关键参数「保留」,将技术细节「隐藏」的思路,本质上是把用户从复杂的参数设置中解放出来,把注意力重新拉回到画面本身。 可以说,Kino 就是在专业和易用的两极之间,找到了精准的中间地带,砌筑了普通用户用好专业功能的桥梁。 在 Final Cut Camera 和 Kino 之后,苹果如果真要做一个自己的「专业相机 App」,大概率也会延续这条路线。 「大师模式」:给大师加码,为大众铺路 有的朋友可能会说,刚刚举出的例子,似乎都是视频,可这个苹果的新相机 app,可是打算照片视频通吃的啊。 那拍照这块,还有没有想象空间? 别急,还真有——我们不妨把视线转向国产阵营。 在今年的 Find X8 Ultra 上,OPPO 全新升级的大师模式,就给出了一个非常具有参考价值的解法: 它融合了哈苏的经典影调和 OPPO 的计算摄影技术,同时又赋予用户极高的创作自由度,打造出一个既不是「自动模式」,也不是传统「专业模式」的全新界面。 什么意思呢? 一方面,它不像专业模式那样需要用户理解快门、感光度、白平衡等参数,不需要每一项都手动调整; 但另一方面,它又不是传统自动模式那种一键出片、风格固定的流水线,而是保留了足够多的调性控制权,让你可以根据自己的审美去定义一张照片的影调、质感和色彩。 你不需要变成摄影师,也能拥有掌控画面的自由度,这其实就是一种介于易用与专业之间的「中间地带」设计。 而在 iPhone 上,另一个 app 也从功能性上为苹果做了个好榜样—— 前段时间,Google 相机之父跳转到 Adobe 以后推出的计算摄影软件 Indigo,不仅通过算法为 2×、10× 等非原生焦段带来媲美光学变焦的画质,还几乎没有 DeepFusion 的别扭锐化感,甚至将放大后的底噪也解决得很漂亮。 ▲ Shot on Project Indigo 更重要的是,它并不要求你拍 RAW,也不用会调 LUT,开拍即用,所见即所得。 这为易用和专业间的中间地带找了个精准的边界:专业不一定意味着复杂,精准的体验设计与算法支持,也能为摄影创造另一种美学路径。 当然,目前的相机 app 还没有太多的爆料,上面提到的内容,更像是一场基于苹果过去动作和已有事实的结果归因。 但话又说回来,为什么我在一开始就说,我非常支持苹果做一款新的相机 App? 只要我们回头看看这几年智能手机的发展路径就会发现: 处理器你追我赶,屏幕你亮我亮,电池快充早卷成了标配,系统交互也逐渐同质化…… 影像,成了手机厂商为数不多还能讲故事的主战场。 无论你愿不愿意,在没有突破性的技术革新之前,手机拍照好不好,录视频怎么样,依然会是本阶段的主旋律。 在这样的背景下,不只是苹果,所有头部厂商都会愈发向专业化靠拢。 我相信你肯定也已经感受到了这个趋势: 杜比视界、HDR、RAW、Log、LUT…… 这些曾经只属于专业摄影圈的术语,正在越来越频繁地出现在手机发布会上,被一个个当作卖点塞进 PPT 里。 厂商说得热血沸腾,用户听得一脸懵懂——这些功能,和我们有什么关系呢? 换句话说,当我们花了旗舰的价格,获得了旗舰的配置,怎么才能真正把它们用起来,而不是买完就搁置呢? 硬件尽了力,希望在软件。 如果苹果真的要做一款新相机 app,我希望它在兼顾发烧友的同时,用简单体验打包专业能力,也做给每一个被复杂参数劝退过的普通用户。 给少数人加码,为多数人铺路,两件事儿可以不冲突。
腾讯一口气开源4款模型!最小仅0.5B,增强agent能力,手机就能跑
作者 | 王涵 编辑 | 漠影 智东西8月4日报道,今天,腾讯混元一口气开源4款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行。 在性能上,Hunyuan 7B在不仅在数学能力上超越了OpenAI o1-mini和Qwen 3-8B,在除IFEVal榜单外,均超越OpenAI o1-mini。 模型原生上下文256k,可以一次读完3本《哈利波特》。目前已在微信读书、腾讯会议等多个腾讯应用中落地。 这4款小尺寸模型单卡就可以部署,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 目前,4个模型均在Github和Hugging Face等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。 一、数学能力超越Qwen3-8B,能一口气读3本《哈利波特》 腾讯新开源的4个模型属于融合推理模型,并且具备快思考和慢思考两种模式。其中快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。 效果上,4个模型均实现了跟业界同尺寸模型的对标,其中Hunyuan 7B在数学推理测试DROP上取得85.9分的成绩,在AIME2024和AIME2025两个数学榜单上得分分别为81.1分和75.3分,均排名第一,超过OpenAI o1-mini和Qwen3-8B。 对比Hunyuan 0.5B、1.8B和4B,在推理能力BBH测评中,1.8B的模型的成绩只与4B的成绩相差0.9分,推理能力不相上下。 这四个模型的亮点在于agent和长文能力,跟此前开源的Hunyuan-A13B模型一样,腾讯团队在技术上通过数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等agent能力上的表现,让模型实际应用中可以更好地完成深度搜索、Excel操作、旅行攻略规划等任务。 此外,模型原生长上下文窗口达到了256k,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。 部署上,4个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多种量化格式均能够支持。 二、已应用到微信读书、智能座舱和金融AI助手 应用层面,这4款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用。 例如,依托模型原生的超长上下文能力,腾讯会议AI小助手、微信读书AI问书AI助手均实现对完整会议内容、整本书籍的一次性理解和处理。 在端侧应用上,腾讯手机管家利用小尺寸模型提升垃圾短信识别准确率,实现毫秒级拦截,保护用户隐私;腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。 在高并发场景中,搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问AI」基于模型实现输入框与AI即问即答的无缝衔接。 在垂直行业应用中,金融AI助手通过Prompt优化和少量数据微调实现超95%意图识别准确率。依托模型的理解能力,腾讯游戏翻译和QQ飞车手游NPC,在多语言理解能力、方言翻译和智能对话方面,有明显优化,这些能力在专业客服、内容出海以及电商直播等场景有较大应用潜力。 三、腾讯开源活跃,覆盖多模态 最近,全球开源领域异常热闹,中国大模型表现抢眼。腾讯混元大语言模型也在持续推进开源,其开源模型已覆盖文本、图像、视频和3D生成等多个模态。 在大语言模型领域,腾讯混元此前陆续开源了激活参数量达52B的Hunyuan large和混合推理MoE(混合专家)模型Hunyuan-A13B,这些模型凭借架构上的创新以及在性能和效果上的不错表现,在开源社区受到广泛关注。 多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了文生图、视频生成和3D生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到3000个。 上周,腾讯发布并开源混元3D世界模型1.0,这一模型一经发布即迅速登上Hugging Face趋势榜第二,下载量飙到近9k,混元3D世界模型技术报告还拿下了Hugging Face论文热榜第一。 结语:腾讯开源、应用两手抓 当前全球AI开源生态持续升温,各大科技公司都在加码模型开源,腾讯此次动作是其开源战略的延续。 腾讯混元此次开源4款小尺寸模型,覆盖了从0.5B到7B的参数范围,为不同算力需求的场景提供了适配方案,为AI开发者社区提供了更多选择。
iOS 26 不尽人意,但相机 App 值得所有厂家学习
当 iOS 26 发布后,无论是全新的 Liquid Glass,还是炸裂的可读性、经常性掉帧的动画,都引起了巨大的舆论争议。 这番景象,像极了 2013 年 iOS 7 发布时的光景。 不过与扁平化设计随后获得广泛采用的命运不同,Liquid Glass 的出现迅速获得了 Android 阵营的响应: 不跟进。 技术实现的复杂度是原因之一,但更深层的是,如今的 Android 厂商早已形成了各自的设计哲学,它们有足够的底气对苹果的新设计说不。 但有一个应用,其设计理念却意外地获得了超越阵营的审视价值,甚至可能成为争议漩涡中,少有的、值得所有厂商静下心来学习的范本——相机。 这个简单的相机,是苹果的知行合一 我们先来看看 iOS 26 改版后的相机到底长什么样。 新设计将屏幕的大部分区域真正还给了取景画面,视觉干扰被降到了最低。 底部的模式切换器也得到了大幅简化,默认状态下只留下最高频使用的照片与视频两个核心选项,让用户在最基础的拍摄模式切换上动作更直接、更不易出错。 至于人像、全景这样的摄影衍生模式或慢动作、电影效果等摄像衍生模式,则被巧妙地归置在照片与视频两个选项的两侧,只需要在切换器向侧方滑动就能唤出它们。 非常值得一提的是,当你需要调整设置时,相关的控件不再像 iOS 18 及之前那样占据屏幕顶端和底部固定的黑色区域,而是以契合 Liquid Glass 整体风格的半透明玻璃浮窗形式叠加在画面之上。 同时,右上角的快捷控件也一改之前相机 app 的复杂逻辑,将重要的闪光灯、夜间模式等控件前置,将倒计时、画幅比例等调整频率较低的控件塞到了二级菜单中,一目了然。 如果用两个字来概括这个新的相机 app,就是「简单」,没有任何复杂的选项,没有任何重复的图标,除了最显眼的快门按键,其他一切都为取景器让路。 这种「简单」并非无迹可寻,也不是乱打乱撞,在苹果官网中,有份文档起了至关重要的指导作用。 在苹果公司人机交互指南(Human Interface Guidelines, HIG*)中,有两条准则,堪称基石性的原则: 清晰 (Clarity):相机界面中的每一个元素都力求不言自明。它使用用户早已熟悉的 SF Symbols 符号体系,确保图标(如变焦、闪光灯)的表意清晰、易于理解,无需学习成本,界面布局有明确的视觉层次,将最重要的信息和控件放在最显眼的位置; 遵从 (Deference):设计本身不应分散用户的注意力,而是要支持用户的任务,这也是 iOS 26 相机设计的精髓。UI 元素被设计得中性而克制,主动退后,将视觉焦点完全让给取景器中的内容。这种理念旨在让科技变得隐形,让用户专注于拍摄主体,而非操作工具本身。 可以说,目前 iOS 26 相机的首界面,就是按照清晰与遵从两条准则,以极大力度简化了主要操作界面的信息复杂度,严格遵循了这份指引设计与交互的文档的结果。 而前面提到的那些额外的模式或使用频率较低的控件,则被苹果采用了「渐进式披露」的策略来处理,当需要时才出现,而不是随时用信息密度占据注意力。 这种设计哲学的精妙之处在于,它将复杂性巧妙地隐藏起来,只在你真正需要时才呈现,从而极大地降低了日常使用相机 app 的认知负荷,你不会被满屏的选项所包围和淹没。 值得一提的是,由于新的相机设计使用了 Liquid Glass,整个相机应用的图标也得到了相应的升级——WWDC25 上发布的 SF Symbols 7 图标库*,是撑起新相机 app 设计细节的另一位关键角色。 作为与苹果整个生态系统设计语言深度集成的核心资源,SF Symbols 7 的这次更新带来了革命性的动画功能、更丰富的视觉表现力以及一系列智能化的改进,为开发者和设计师们在 iOS 26、iPadOS 26、macOS Tahoe 26 等新一代操作系统中打造更生动、更直观的用户体验,提供了前所未有的强大工具。 其核心亮点集中在四大方面:绘制动画 (Draw Animations)、可变绘制 (Variable Draw)、渐变效果 (Gradients) 和增强的魔术替换 (Enhanced Magic Replace),此外,新版本还包含了数百个全新符号,并进一步扩展了本地化支持。 相机界面中使用的所有图标均来自这套统一的 SF Symbols 7 符号库,确保了极高的辨识度和系统一致性。 图标与设计结合,加上新的交互方式,iOS 26 的相机界面,是苹果 Liquid Glass 设计语言与 iOS 26 开发者预览版推出后,最「知行合一」的具象化表现。 在看完相机 app 的新设计与新交互后,让我们将话题转回开头,为什么我说这样一个「简单」的相机 app,值得所有厂家学习? 手机影像,尽可能不做选择题 相机,作为摄影从出现至今,横跨近两百年历史的主要载体,已经得到了充分的发展、竞争。 进入数码时代后,各个相机厂商都推出了多样化的机型,以应对不同使用群体的不同专业需求。 ▲ 以索尼为例,就有较为均衡的 M、高像素的 R 以及视频为主的 S 系列 而与之对应的手机摄影,相比之下历史就短了很多,但它的普及面是史无前例的广——手机每个人都用,就意味着每个人都能摄影。 摄影权力和群体的普及,让手机摄影的专业属性大大降低,它的首要任务,是服务于远大于专业群体的日常用户。 这些用户需要的不是一台宽容度、分辨率、色深等参数强到极致,可以去非洲大草原的星空下拍 8K120p 狮子的相机,而是一台能以最快的速度、最高的效率、最集中的注意力,记录下想记录的画面的手机。 速度、效率、集中注意力,诸如此类听起来颇为现代的目的,却与摄影大师 Henri·Cartier·Bresson 在七十多年以前提出的决定性瞬间不谋而合,他将其定义为: 在一刹那间,对一个事件的意义和能够确切表达这一意义的精准的几何构图的同时认知。 这个概念,放在数码时代的今天,也能完美地概括手机摄影的灵魂——在日常生活中捕捉那些不断流逝、不可重现的瞬间,俗话说,就是那些你想抬手就记录下来的瞬间。 ▲ 你想记录的瞬间,和这些享誉世界的名作一样珍贵 但当我转头举起手机,拍照、人像、夜景、高像素、专业模式、慢门…… 茫茫多的模式,正摆在我的面前,虽然并不是什么特别重要的选择,只要不用长曝光拍人像就不影响成片,但这片刻的停顿就像是鞋里进了一颗小石子儿,不妨碍走路,却总是硌脚。 随着手机功能的越来越多,这种矛盾愈发凸显: 想记录家人,举起手机,我需要想想要不要调整到人像模式;面对车水马龙,我需要思考用慢门还是专门的长曝光——而大多数时候,我甚至很难分清自动弹出的夜景模式和单独分隔出来的夜景模式有什么区别。 从这个角度看,一个充斥着菜单、滑块和选项的复杂界面,可以说是这种珍贵瞬间的天敌,它强迫你在按下快门前思考工具本身,从而打断了拍摄者与被拍摄对象之间的情感连接和直觉反应。 当然,在移动影像的竞争中,厂家费尽心思为手机配备了更强大的硬件、更聪明的算法,功能也随之越来越多,这是一件很好的事,但随之而来的,是用户也要做更多的事、做更多的判断与选择,这就不是好事了。 所以,最好的手机影像,就是尽可能的不要做选择题。
三星Galaxy Z Fold 7在美“开门红”:销量超前代机型50%
IT之家 8月4日消息,据彭博社报道,当地时间上周四,三星电子称美国消费者对其最新款高端折叠手机的反应热烈,销量较上一代提升了50%,表明折叠屏手机正在逐步获得市场认可。 该公司透露,售价2000美元(IT之家注:现汇率约合14408元人民币)的Galaxy Z Fold 7创下了其大折叠手机的最高预售纪录。翻盖式的Z Flip 7表现也优于前作,两款新机合计预售量增长超过25%。三星补充称,与其合作的运营商方面,折叠手机的预售也增长了60%。 三星产品管理高级副总裁Drew Blackard表示:“Z Fold系列在美国市场的这次发布,是有史以来最成功的一次。Galaxy Z Flip7和Galaxy Z Fold7所获得的市场反响,是我们方向正确的积极信号。” 他补充说,消费者现在更看重折叠屏带来的便利,而非其潜在限制。 这类积极反响为折叠屏手机的发展提供了信心。该品类自问世以来,一直难以与更便宜、结构更传统的智能手机抗衡。彭博社指出,在苹果筹备首款折叠iPhone的背景下,三星此举也为其赢得了更多主动权。 据IT之家了解,可折叠iPhone预计将在明年问世。 尽管增幅可观,但整体销量仍不算大。估算数据显示,三星此前推出的Fold系列总销量仅为数百万部,仍远不及主流智能手机。 配色方面也助推了销量提升。三星表示,蓝色版Z Fold 7占到了近一半的预售订单,打破了以往黑色为主的销售格局。Z Flip 7的珊瑚红版本也“表现超出预期”,在该机型预售中占比近四分之一。 女性用户也正在加入折叠手机阵营。Blackard表示:“自2024年以来,Fold系列在女性用户中的占比大幅提升,我们会继续关注她们对新机型的反馈。” Z Fold 7折叠状态下依然轻薄,拿在手里就像普通手机,这一点相较前几代产品有明显突破。售价1100美元的Z Flip 7则是该系列目前设计最精巧的一款,外部屏幕更大,并围绕摄像头展开。
刷卡不再扭手腕,消息称三星将为Galaxy S26系列手机顶部增加NFC天线
IT之家 8 月 4 日消息,据韩媒 etnews 昨日爆料,三星明年上半年发布的 Galaxy S26 系列手机将在顶部增加 NFC 天线,为 Samsung Wallet 刷信用卡、交通卡增加便利。 多位匿名业内人士表示,三星在 Galaxy S26 系列手机设计过程中考虑为机身顶部引入新型 NFC 天线。其中一位消息人士表示:“目前的设计方向是现有 NFC 线圈的位置将保留,同时在机身顶部新增一个 NFC 天线”。 此举旨在解决 Samsung Wallet 用户的反馈。目前 Galaxy 系列手机的 NFC 感应区域位于后置摄像头旁或机身中部偏下,在 POS 机 / 公交闸机上刷卡时,用户常常需要扭动手腕才能完成支付,甚至在对准刷卡区域的情况下也有可能支付失败。 作为对比,苹果的 Apple Pay 只需要将设备靠近 POS 终端即可完成支付,在便利性方面受到好评。 etnews 对此表示,三星此次的决策是为了改变 Galaxy 手机用户的支付体验。一位业内人士指出:“由于苹果已经掌握大量相关专利,三星在绕开专利方面费了不少时间”。 不过目前 Galaxy S26 系列手机的 NFC 天线设计尚未进入量产阶段,在手机整体进入量产前,详细设计或零件规格仍有变动空间,现状还无法代表最终量产产品。 IT之家注:Samsung Wallet(三星钱包)在三星大部分运行 One UI 的机型上提供,在中国大陆支持添加银行卡、交通卡、数字钥匙、机票等电子票卡。
兔子蹦床播放超 5 亿!这条全网最火 AI 视频,是人类爱被「骗」的结果
一段看起来像是夜视监控拍到的「兔子蹦床」视频,在 TikTok 上爆火,全网收获了有 5 亿次播放。 视频看上去像是某户人家的安防摄像头拍到的,灯光昏黄、画面模糊,但恰到好处地捕捉到几只兔子轮番起跳,活像在开夜间演出。 自动播放 视频的标题写着:「刚查看了家庭监控,我想我们家后院来了几位特邀嘉宾!@Ring」 。 监控的模糊画质、几只看似在狂欢的兔子,这可爱又略带一丝真实感的画面迅速吸引了人们的眼球 。 在社交媒体平台 X 上坐拥百万粉丝的名人 @Greg 也评论说,「我从没意识到自己需要一群蹦床兔子,直到今天」。 然而,这份可爱是虚假的。视频中的兔子并非真实存在,有人发现,它是AI生成的。 第 5 到第 6 秒之间,左上角的兔子忽然「消失」。回头再看,细节确实有点怪。 但和大多数「AI 穿帮」视频不同,这次几乎没人第一时间认出来。哪怕是刷视频经验老到的年轻人,也直呼「完了,我居然被骗了」。 但这不是一场骗局,更像是一种小型社交媒体的灾难:不是「我们被骗了」,而是「我们居然愿意被骗」。 看似糊得刚刚好,其实「骗」得刚刚好 这段 AI 视频之所以能成功「欺骗」大众,很大程度上并非因为 AI 视频生成技术已经完美,而在于它「骗得刚刚好」。 它精准地利用了我们对监控视频的固有印象,也踩中了最能让我们放下戒备的那些流量密码。 模糊的夜视画质和静态背景,刚好遮住 AI 的弱点 我们习惯于认为夜晚监控录像就是模糊、黑暗且充满噪点的。这种先入为主的印象,完美掩护了 AI 视频的技术硬伤,例如在动作连贯性、阴影细节和背景动态上容易穿帮等问题。 所以当它以「夜晚监控录像」的方式出现时,画质本身的低清模糊反倒成了障眼法,帮它遮住了真实感缺口。 ▲ 视频画质符合夜间监控特点,且背景是完全静止。 此外,尽管一些 AI 视频生成模型在处理前景主体方面已经相当出色,但背景的渲染往往会显得非常超现实。 而这段视频的背景是静止的,这又为 AI 规避了一个技术难题。 带「@Ring」的文案增强了来源可信度 视频发布者在标题中聪明地标记了家庭安防摄像头品牌「Ring」,一下子就让这视频的来源显得有理有据,让人感觉更真了。 ▲ Ring 是家庭摄像头品牌 这个小细节营造出「这视频是别人家门铃拍到的」错觉,让人自动归类为「生活记录」而非「创作内容」。 「动物夜间搞事情」是互联网用户默认接受的 meme 无数次病毒式传播的视频,已经训练我们相信这个场景是真实的。猫晚上偷吃泡面、浣熊夜闯泳池、郊狼在蹦床玩耍,动物们总爱在人类不在时「犯规」一下。兔子蹦床这种事,怎么看都合理。 自动播放 ▲ 熊闯入游泳池 最重要的:它太可爱了!谁会去质疑这么温柔的一幕呢?当一段内容足够甜、足够轻,它就很容易让我们「选择相信」。 尽管视频中间,左上角的兔子突然消失,暴露了 AI 生成的本质。但对于绝大多数刷短视频,快速滑动的观众来说,这一瞬间的破绽极易被忽略。 就在兔子视频引发热议的同时,马斯克也分享了 AI 视频技术的惊人进展。 10 天前,一段 6 秒的视频渲染需要 60 秒,之后降至 45 秒,再到 30 秒,现在已缩短至 15 秒。 本周我们或许能将时间控制在 12 秒以内。 他同时表示,实时视频渲染技术有望在 3 到 6 个月内实现。 ▲ 马斯克推特截图 这意味着,今天我们还能看到的「兔子消失」这类穿帮镜头,在几个月后可能就几乎很难发现里面的 bug。 当 AI 视频在技术上无懈可击时,再去讨论「如何分辨真假」就失去了意义。 这也让我们不得不把目光从技术本身,转移到更核心的问题上。 让我们被骗和狂欢的,其实不是 AI 视频的真相揭晓后,许多用户表达了一种「信仰崩塌」的感觉。 一位 TikTok 用户说,「这是第一个我相信是真的 AI 视频,等我老了肯定完蛋了」。另一位用户则表示,「现在我觉得我以后就会是那种被骗的老年人」。 这种从自信到恐慌的情绪转变,成了一个新的网络热点。 然而,将问题仅仅归咎于「AI 发展得太快」或「我们太容易被骗」,可能忽略了更深层次的原因。这一事件的核心,或许不在于 AI 技术本身,其实在于社交媒体平台本身的那一套玩法。 通过翻看视频的评论记录,我们发现人们在评论区的反应,呈现出来的几乎是同样的一个心理剧本。 首先是「天啊,这也太可爱了」; 然后,「等等,好像不太对劲?」; 第三步,「我被骗了?完了,我要变成会被骗的老年人了吗」; 最后还是回到了,「但……我不怪它」 我们正在和 AI 视频建立一种全新的「互动逻辑」。 我们不是完全相信它,而是默认它可能是假的,但我们依然愿意停下来看看、点个赞、转发给朋友猜一猜,就像一个游戏。 ▲ 短视频平台推荐系统 而平台的算法,也深知这种心理结构。 在这个过程中,「AI 视频是真是假」不再是重点,它更像一种参与门槛:你看懂了没?你能分辨出来吗?你被骗了吗? AI 爆发的这两年,我们总是感叹 AI 视频图片已经能以假乱真,因此感到恐慌,担心自己未来会更容易被虚假信息蒙蔽。 然而,这个视频的病毒式传播,并非完全源于 AI 技术的「欺骗性」,而是源于人类观众内心深处对「被欺骗」的需求。 这些网友不都是被动地被骗,而有不少是主动地、心照不宣地参与了一场名为「假装相信」的集体游戏。 这场狂欢的主角不是 AI,而是我们自己。 正是视频中那「一闪而过」的兔子消失 bug,才让整个事件升级为一场全网参与的「找茬游戏」。如果视频完美的天衣无缝,它可能只会然后迅速被下一个视频淹没。 ▲ 电影「致命魔术」 这就像观众明知道魔术师在「欺骗」他们,但他们享受的恰恰是那种「明明知道是假的,却看不出破绽」的认知挑战。 AI 兔子的「穿帮」,就是这个魔术被揭穿的时刻,它让所有人加入讨论,从而引爆了传播。 缺陷创造了争议,争议驱动了参与。视频的真假不再重要,它所引发的混乱和讨论本身,就是流量的保证。 这种「我竟然也被骗了」的自嘲,迅速拉近了陌生网友间的心理距离,形成了一种「我们都是容易被骗的笨蛋」的社群认同感。由「共同被骗」而产生的连接,其社交价值远大于视频内容本身的真实性。 理想的情况是,我们学会有意识地享受这种「虚假内容」带来的乐趣,同时保持一份清醒的认知,但这可能对大多数人来说并不容易。 潜在的危险不只在于 AI 的逼真程度,而在于当这种「集体欺骗」被用于恶意时,比如制造谣言或骗局。我们需要建立的,是对信息「意图」的识别,而非仅仅对「真伪」的判断。 我们可以多问问自己:这个内容想让我产生什么感觉?它最终想让我做什么?
苹果的ChatGPT要来了?取代Google百度
信誓旦旦说不搞聊天机器人的苹果,也已经按捺不住了。 彭博社最新爆料,苹果在今年早些时候成立了一个名为「答案、知识和信息」的团队,简称「AKI」(Answers、Knowledge and Information),目标就是打造一种类似 ChatGPT 的全新搜索体验。 这个团队正在构建一种「答案引擎」,能够爬取网络数据来回答常识性问题,目前还处于研发的早期阶段。「答案引擎」不仅会有一个独立的 app,还会作为基础技术,为未来的 Siri、Spotlight 聚焦搜索以及 Safari 浏览器提供搜索的功能。 据悉,这个团队由「AI Siri」的前负责人高级总监 Robby Walker 领导,向 AI 主管 John Giannandrea 汇报工作。苹果也已经开始了针对该团队的招聘活动,提到了搜索算法和搜索引擎方面的经验需求,信息中还提到了 Siri、Spotlight、Safari 产品。 对于苹果来说,做 AI 搜索更多是一种被动的应对策略。随着 Google 反垄断案的持续进行,苹果很可能将被迫终止与 Google 搜索的多年合作,这会导致其失去 200 亿一年的授权费。苹果自己的 Apple 智能进度缓慢,AI Siri 持续跳票,因此需要一些新的更有吸引力的 AI 功能。 虽然此前苹果内部对聊天机器人之类的 AI 应用持有保留态度,但在今年已经发生了 180 度转弯。苹果服务高管 Eddy Cue 在甚至公开表示,基于人工智能的搜索是未来的发展方向,并证实了苹果正在探索和 AI 搜索公司 Perplexity 等团队的合作关系。 在上周的财报电话会议上,CEO 蒂姆 · 库克强调了苹果对 AI 技术的重视,也明确表达了收购 AI 公司的开放态度。此前有不少消息称,苹果内部已经讨论过收购 Perplexity 的合理性,也约见过其领导团队。 AI Siri 这块烫手山芋还没解决,又分出资源去做 AI 搜索,苹果能不能同时应对这么多挑战,不免让人担忧。比起从头构建一个 AI 功能,似乎直接收购现成的产品和团队更适合苹果,而 Perplexity 就是一个合适的选择。
哨兵模式激活、代客泊车辅助增强,广汽昊铂HL汽车获3.6.0版本OTA升级
IT之家 8 月 4 日消息,广汽昊铂今日发文宣布,昊铂 HL 汽车获 3.6.0 版本 OTA 升级,新版本拥有超 118 项功能焕新,包括哨兵模式激活、代客泊车辅助增强、辅助驾驶终点路边临停等功能。 IT之家附广汽昊铂 HL 汽车此次更新主要内容如下: 新增哨兵模式 新增后排屏幕手机无线投屏功能 新增黑夜模式:HMI 深浅界面偏好设定配置自动切换深浅界面 新增 SR 时间天气引擎 新增全民 K 歌多屏同步 K 歌功能 新增语音助手方言识别功能 新增 WIFI 分享视频照片到手机功能 新增场景大师分享码创建自定义场景功能 新增音效魔方功能 新增微信小程序功能 升级高德全新 810 引擎,新增巡航红绿灯倒计时等功能 新增自定义车位泊车功能 新增泊车车速三档调节功能 新增直线召唤脱困功能等 NDA 抵达目的地点靠边停车功能 新增 NDA 前车急刹 / 压线 / 加塞情况下闪灯提醒功能 新增 NDA 智能交通流调速功能 新增低速 AEB (RAEB / FCTB / RCTB) 功能 新增 HUD 转向补盲功能 新增冰雪路面原地掉头功能 (四驱版本配置适用) 新增空气悬架高度调节栏 新增屏幕清洁模式 新增垂直 / 斜列车位泊出功能 优化分屏地图等功能 优化代客泊车辅助功能路线记忆方式 优化代客泊车辅助激活显示 优化 NDA 通行能力优化智驾人机交互界面 据IT之家此前报道,广汽昊铂本月宣布旗下昊铂 HL 增程版车型将于 8 月 19 日正式开启交付,该车采用 1.5T 增程动力,CLTC 纯电续航里程为 350 公里,此前已公布指导价为 26.98 万元-29.98 万元。作为比较,纯电版车型的指导价为 29.98 万-31.98 万元。 该车尺寸为 5126×1990×1750 毫米、轴距 3088 毫米,车辆搭载 1.5T 增程器,匹配最大功率 250 千瓦的后置电机,三元锂电池组容量为 60.33 千瓦时,CLTC 纯电续航里程 350 公里。作为参考,昊铂 HL 纯电版提供后驱和四驱车型,可选 CLTC 续航里程 700 公里和 750 公里车型。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。