行业分类:
加载中...
头条分类:
加载中...
iPhone 要出大师模式?我举双手赞成
关于 iPhone 17 Pro 的影像部门,最近又传出两个新消息。 其一,是前两天爱范儿报道的 iPhone 17 Pro 系列上的长焦镜头有可能支持最高 8 倍的连续变焦。 在国产手机卷生卷死,拍月亮都已不再是极限的同时,苹果最似乎终于回过味来了,开始追赶「拍得远」的潮流了。 但市场与用户经过多年的实践,早已明白焦段不是越长越好,iPhone 的长焦从 3× 到 5×,现在又要直接上 8×,大家还买不买账,真不好说。 不过,比起这个有点争议的长焦,另一条消息我倒是举双手赞成: 苹果要亲自下场,开发一个专业级的相机 app,很有可能随 iPhone 17 系列和 iOS 26 一起问世。 只不过,我对「专业级」的形容,可能另有想法。 手机上的专业相机 App ,可以不那么专业 在聊这个新的相机 app 之前,我们先回头看看 iPhone 目前的原生相机。 它的槽点,其实积攒已久。 争议主要集中在两点——太繁杂,太自动。 繁杂不难理解,如果你使用的是 iOS 18 系统,可以打开相机看看,从 iOS 7 沿用至今的界面,如今已经被各种新功能塞得满满当当,底部模式栏多达七八种,还有隐藏在二级菜单里的各类功能,想要完整摸清,非重度用户几乎做不到。 而太自动,则更让人无从下手——在 Android 阵营手机已经遍地专业模式、RAW 支持、AI 参数自定义的今天,iPhone 的相机却依然像是个「你只负责按快门,其它我来决定」的保姆。 这种不给用户选项的设计哲学,一直被不少人吐槽过于傲慢。 于是,在 iOS 26 上,苹果终于动手了。 借着全新的液态玻璃视觉语言,原生相机迎来一次罕见的大改版—— 过去复杂堆砌的功能被有序拆分,照片与视频两个主模式作为「主轴」,其余的慢动作、延时摄影、全景等被收纳到子菜单,只有在滑动切换时才会展开;而原本埋在角落的二级菜单,也获得了更清晰的层级与结构。 可以说,在 iOS 26 之后,iPhone 的相机终于看起来没那么吓人了。 但问题也随之显露得更清楚了:自动依旧自动,参数依旧不给调。 一部价值万元、拥有强大 ISP 与影像系统的设备,在原生相机手里,却只能拍「苹果希望你拍的样子」。 这就引出一个疑问: 这样的相机,真能释放 iPhone 的全部影像潜力吗? 的确,虽说大道至简,但代价是压抑创作空间,那恐怕就不是「设计减法」,而是创作自由的减法了。 沿着这个逻辑,一个「专业级」的,兼顾视频与照片的相机 app 出现,变得顺理成章了起来。 不过,就像开篇的结尾说的那样,这个所谓的「专业级」,我要打个问号。 虽然目前还没有更详细的爆料,但从苹果近年来的一系列动作,我们也许可以管中窥豹—— 苹果也许不会像 Blackmagic Cam 那样,走完全复刻相机和电影机设置的路线,而是更可能选择开放一部分关键参数控制权,打造一个半专业的 app。 这并不是胡说八道,从 Apple Log 的推出开始,苹果就在悄悄尝试一套更「苹果味儿」的专业路径——Final Cut Camera。 作为苹果亲自操刀的原生视频 App,Final Cut Camera 没有塞满快门、ISO、白平衡这些硬核参数,而是只保留了几个关键控件:视频规格、焦段选择、音量监看。 设定好帧率之后,用户基本就可以一键开拍,不用再纠结曝光三要素。 当然,目前 Final Cut Camera 更重要的任务,是服务于多机位联拍——它支持多台 iPhone 和 iPad 之间的远程同步录制,所有素材自动打上时间码,精确同步,拍完即导入 Final Cut Pro,原生无缝衔接,堪称苹果生态下最「顺滑」的拍摄前端工具。 而在 Final Cut Camera 之后,苹果在去年 App Store Awards 上的一次选择,也从侧面印证了这条「半专业路线」的可行性: 苹果把「年度 iPhone 应用」这个最高奖项,颁给了一款名叫 Kino 的 app。 这是一款专门为 Apple Log 设计的视频拍摄工具,内置了几十种针对 Apple Log 的专业 LUT,哪怕你完全不懂调色,也能快速搞出风格化大片。 不过,Kino 能拿下年度 App,不止因为它有 Log LUT,更在于它将专业与易用间的平衡,拿捏得非常到位。 打开 Kino 的主界面,你会发现它非常克制: LUT 列表 对焦 焦段选择 视频规格 音量监看 除此之外,没有任何专业参数需要你去控制,连白平衡都放进了二级菜单中。 这种设计方案带来的是使用上的简单—— 你不需要知道 24fps 对应多少快门速度,不需要会看直方图判断灰片曝光对不对,甚至连 ISO 都不用调。 你只需要确认好帧率,然后举起手机,就能拍大片。 这种将关键参数「保留」,将技术细节「隐藏」的思路,本质上是把用户从复杂的参数设置中解放出来,把注意力重新拉回到画面本身。 可以说,Kino 就是在专业和易用的两极之间,找到了精准的中间地带,砌筑了普通用户用好专业功能的桥梁。 在 Final Cut Camera 和 Kino 之后,苹果如果真要做一个自己的「专业相机 App」,大概率也会延续这条路线。 「大师模式」:给大师加码,为大众铺路 有的朋友可能会说,刚刚举出的例子,似乎都是视频,可这个苹果的新相机 app,可是打算照片视频通吃的啊。 那拍照这块,还有没有想象空间? 别急,还真有——我们不妨把视线转向国产阵营。 在今年的 Find X8 Ultra 上,OPPO 全新升级的大师模式,就给出了一个非常具有参考价值的解法: 它融合了哈苏的经典影调和 OPPO 的计算摄影技术,同时又赋予用户极高的创作自由度,打造出一个既不是「自动模式」,也不是传统「专业模式」的全新界面。 什么意思呢? 一方面,它不像专业模式那样需要用户理解快门、感光度、白平衡等参数,不需要每一项都手动调整; 但另一方面,它又不是传统自动模式那种一键出片、风格固定的流水线,而是保留了足够多的调性控制权,让你可以根据自己的审美去定义一张照片的影调、质感和色彩。 你不需要变成摄影师,也能拥有掌控画面的自由度,这其实就是一种介于易用与专业之间的「中间地带」设计。 而在 iPhone 上,另一个 app 也从功能性上为苹果做了个好榜样—— 前段时间,Google 相机之父跳转到 Adobe 以后推出的计算摄影软件 Indigo,不仅通过算法为 2×、10× 等非原生焦段带来媲美光学变焦的画质,还几乎没有 DeepFusion 的别扭锐化感,甚至将放大后的底噪也解决得很漂亮。 ▲ Shot on Project Indigo 更重要的是,它并不要求你拍 RAW,也不用会调 LUT,开拍即用,所见即所得。 这为易用和专业间的中间地带找了个精准的边界:专业不一定意味着复杂,精准的体验设计与算法支持,也能为摄影创造另一种美学路径。 当然,目前的相机 app 还没有太多的爆料,上面提到的内容,更像是一场基于苹果过去动作和已有事实的结果归因。 但话又说回来,为什么我在一开始就说,我非常支持苹果做一款新的相机 App? 只要我们回头看看这几年智能手机的发展路径就会发现: 处理器你追我赶,屏幕你亮我亮,电池快充早卷成了标配,系统交互也逐渐同质化…… 影像,成了手机厂商为数不多还能讲故事的主战场。 无论你愿不愿意,在没有突破性的技术革新之前,手机拍照好不好,录视频怎么样,依然会是本阶段的主旋律。 在这样的背景下,不只是苹果,所有头部厂商都会愈发向专业化靠拢。 我相信你肯定也已经感受到了这个趋势: 杜比视界、HDR、RAW、Log、LUT…… 这些曾经只属于专业摄影圈的术语,正在越来越频繁地出现在手机发布会上,被一个个当作卖点塞进 PPT 里。 厂商说得热血沸腾,用户听得一脸懵懂——这些功能,和我们有什么关系呢? 换句话说,当我们花了旗舰的价格,获得了旗舰的配置,怎么才能真正把它们用起来,而不是买完就搁置呢? 硬件尽了力,希望在软件。 如果苹果真的要做一款新相机 app,我希望它在兼顾发烧友的同时,用简单体验打包专业能力,也做给每一个被复杂参数劝退过的普通用户。 给少数人加码,为多数人铺路,两件事儿可以不冲突。
腾讯一口气开源4款模型!最小仅0.5B,增强agent能力,手机就能跑
作者 | 王涵 编辑 | 漠影 智东西8月4日报道,今天,腾讯混元一口气开源4款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行。 在性能上,Hunyuan 7B在不仅在数学能力上超越了OpenAI o1-mini和Qwen 3-8B,在除IFEVal榜单外,均超越OpenAI o1-mini。 模型原生上下文256k,可以一次读完3本《哈利波特》。目前已在微信读书、腾讯会议等多个腾讯应用中落地。 这4款小尺寸模型单卡就可以部署,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 目前,4个模型均在Github和Hugging Face等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。 一、数学能力超越Qwen3-8B,能一口气读3本《哈利波特》 腾讯新开源的4个模型属于融合推理模型,并且具备快思考和慢思考两种模式。其中快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。 效果上,4个模型均实现了跟业界同尺寸模型的对标,其中Hunyuan 7B在数学推理测试DROP上取得85.9分的成绩,在AIME2024和AIME2025两个数学榜单上得分分别为81.1分和75.3分,均排名第一,超过OpenAI o1-mini和Qwen3-8B。 对比Hunyuan 0.5B、1.8B和4B,在推理能力BBH测评中,1.8B的模型的成绩只与4B的成绩相差0.9分,推理能力不相上下。 这四个模型的亮点在于agent和长文能力,跟此前开源的Hunyuan-A13B模型一样,腾讯团队在技术上通过数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等agent能力上的表现,让模型实际应用中可以更好地完成深度搜索、Excel操作、旅行攻略规划等任务。 此外,模型原生长上下文窗口达到了256k,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。 部署上,4个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多种量化格式均能够支持。 二、已应用到微信读书、智能座舱和金融AI助手 应用层面,这4款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用。 例如,依托模型原生的超长上下文能力,腾讯会议AI小助手、微信读书AI问书AI助手均实现对完整会议内容、整本书籍的一次性理解和处理。 在端侧应用上,腾讯手机管家利用小尺寸模型提升垃圾短信识别准确率,实现毫秒级拦截,保护用户隐私;腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。 在高并发场景中,搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问AI」基于模型实现输入框与AI即问即答的无缝衔接。 在垂直行业应用中,金融AI助手通过Prompt优化和少量数据微调实现超95%意图识别准确率。依托模型的理解能力,腾讯游戏翻译和QQ飞车手游NPC,在多语言理解能力、方言翻译和智能对话方面,有明显优化,这些能力在专业客服、内容出海以及电商直播等场景有较大应用潜力。 三、腾讯开源活跃,覆盖多模态 最近,全球开源领域异常热闹,中国大模型表现抢眼。腾讯混元大语言模型也在持续推进开源,其开源模型已覆盖文本、图像、视频和3D生成等多个模态。 在大语言模型领域,腾讯混元此前陆续开源了激活参数量达52B的Hunyuan large和混合推理MoE(混合专家)模型Hunyuan-A13B,这些模型凭借架构上的创新以及在性能和效果上的不错表现,在开源社区受到广泛关注。 多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了文生图、视频生成和3D生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到3000个。 上周,腾讯发布并开源混元3D世界模型1.0,这一模型一经发布即迅速登上Hugging Face趋势榜第二,下载量飙到近9k,混元3D世界模型技术报告还拿下了Hugging Face论文热榜第一。 结语:腾讯开源、应用两手抓 当前全球AI开源生态持续升温,各大科技公司都在加码模型开源,腾讯此次动作是其开源战略的延续。 腾讯混元此次开源4款小尺寸模型,覆盖了从0.5B到7B的参数范围,为不同算力需求的场景提供了适配方案,为AI开发者社区提供了更多选择。
iOS 26 不尽人意,但相机 App 值得所有厂家学习
当 iOS 26 发布后,无论是全新的 Liquid Glass,还是炸裂的可读性、经常性掉帧的动画,都引起了巨大的舆论争议。 这番景象,像极了 2013 年 iOS 7 发布时的光景。 不过与扁平化设计随后获得广泛采用的命运不同,Liquid Glass 的出现迅速获得了 Android 阵营的响应: 不跟进。 技术实现的复杂度是原因之一,但更深层的是,如今的 Android 厂商早已形成了各自的设计哲学,它们有足够的底气对苹果的新设计说不。 但有一个应用,其设计理念却意外地获得了超越阵营的审视价值,甚至可能成为争议漩涡中,少有的、值得所有厂商静下心来学习的范本——相机。 这个简单的相机,是苹果的知行合一 我们先来看看 iOS 26 改版后的相机到底长什么样。 新设计将屏幕的大部分区域真正还给了取景画面,视觉干扰被降到了最低。 底部的模式切换器也得到了大幅简化,默认状态下只留下最高频使用的照片与视频两个核心选项,让用户在最基础的拍摄模式切换上动作更直接、更不易出错。 至于人像、全景这样的摄影衍生模式或慢动作、电影效果等摄像衍生模式,则被巧妙地归置在照片与视频两个选项的两侧,只需要在切换器向侧方滑动就能唤出它们。 非常值得一提的是,当你需要调整设置时,相关的控件不再像 iOS 18 及之前那样占据屏幕顶端和底部固定的黑色区域,而是以契合 Liquid Glass 整体风格的半透明玻璃浮窗形式叠加在画面之上。 同时,右上角的快捷控件也一改之前相机 app 的复杂逻辑,将重要的闪光灯、夜间模式等控件前置,将倒计时、画幅比例等调整频率较低的控件塞到了二级菜单中,一目了然。 如果用两个字来概括这个新的相机 app,就是「简单」,没有任何复杂的选项,没有任何重复的图标,除了最显眼的快门按键,其他一切都为取景器让路。 这种「简单」并非无迹可寻,也不是乱打乱撞,在苹果官网中,有份文档起了至关重要的指导作用。 在苹果公司人机交互指南(Human Interface Guidelines, HIG*)中,有两条准则,堪称基石性的原则: 清晰 (Clarity):相机界面中的每一个元素都力求不言自明。它使用用户早已熟悉的 SF Symbols 符号体系,确保图标(如变焦、闪光灯)的表意清晰、易于理解,无需学习成本,界面布局有明确的视觉层次,将最重要的信息和控件放在最显眼的位置; 遵从 (Deference):设计本身不应分散用户的注意力,而是要支持用户的任务,这也是 iOS 26 相机设计的精髓。UI 元素被设计得中性而克制,主动退后,将视觉焦点完全让给取景器中的内容。这种理念旨在让科技变得隐形,让用户专注于拍摄主体,而非操作工具本身。 可以说,目前 iOS 26 相机的首界面,就是按照清晰与遵从两条准则,以极大力度简化了主要操作界面的信息复杂度,严格遵循了这份指引设计与交互的文档的结果。 而前面提到的那些额外的模式或使用频率较低的控件,则被苹果采用了「渐进式披露」的策略来处理,当需要时才出现,而不是随时用信息密度占据注意力。 这种设计哲学的精妙之处在于,它将复杂性巧妙地隐藏起来,只在你真正需要时才呈现,从而极大地降低了日常使用相机 app 的认知负荷,你不会被满屏的选项所包围和淹没。 值得一提的是,由于新的相机设计使用了 Liquid Glass,整个相机应用的图标也得到了相应的升级——WWDC25 上发布的 SF Symbols 7 图标库*,是撑起新相机 app 设计细节的另一位关键角色。 作为与苹果整个生态系统设计语言深度集成的核心资源,SF Symbols 7 的这次更新带来了革命性的动画功能、更丰富的视觉表现力以及一系列智能化的改进,为开发者和设计师们在 iOS 26、iPadOS 26、macOS Tahoe 26 等新一代操作系统中打造更生动、更直观的用户体验,提供了前所未有的强大工具。 其核心亮点集中在四大方面:绘制动画 (Draw Animations)、可变绘制 (Variable Draw)、渐变效果 (Gradients) 和增强的魔术替换 (Enhanced Magic Replace),此外,新版本还包含了数百个全新符号,并进一步扩展了本地化支持。 相机界面中使用的所有图标均来自这套统一的 SF Symbols 7 符号库,确保了极高的辨识度和系统一致性。 图标与设计结合,加上新的交互方式,iOS 26 的相机界面,是苹果 Liquid Glass 设计语言与 iOS 26 开发者预览版推出后,最「知行合一」的具象化表现。 在看完相机 app 的新设计与新交互后,让我们将话题转回开头,为什么我说这样一个「简单」的相机 app,值得所有厂家学习? 手机影像,尽可能不做选择题 相机,作为摄影从出现至今,横跨近两百年历史的主要载体,已经得到了充分的发展、竞争。 进入数码时代后,各个相机厂商都推出了多样化的机型,以应对不同使用群体的不同专业需求。 ▲ 以索尼为例,就有较为均衡的 M、高像素的 R 以及视频为主的 S 系列 而与之对应的手机摄影,相比之下历史就短了很多,但它的普及面是史无前例的广——手机每个人都用,就意味着每个人都能摄影。 摄影权力和群体的普及,让手机摄影的专业属性大大降低,它的首要任务,是服务于远大于专业群体的日常用户。 这些用户需要的不是一台宽容度、分辨率、色深等参数强到极致,可以去非洲大草原的星空下拍 8K120p 狮子的相机,而是一台能以最快的速度、最高的效率、最集中的注意力,记录下想记录的画面的手机。 速度、效率、集中注意力,诸如此类听起来颇为现代的目的,却与摄影大师 Henri·Cartier·Bresson 在七十多年以前提出的决定性瞬间不谋而合,他将其定义为: 在一刹那间,对一个事件的意义和能够确切表达这一意义的精准的几何构图的同时认知。 这个概念,放在数码时代的今天,也能完美地概括手机摄影的灵魂——在日常生活中捕捉那些不断流逝、不可重现的瞬间,俗话说,就是那些你想抬手就记录下来的瞬间。 ▲ 你想记录的瞬间,和这些享誉世界的名作一样珍贵 但当我转头举起手机,拍照、人像、夜景、高像素、专业模式、慢门…… 茫茫多的模式,正摆在我的面前,虽然并不是什么特别重要的选择,只要不用长曝光拍人像就不影响成片,但这片刻的停顿就像是鞋里进了一颗小石子儿,不妨碍走路,却总是硌脚。 随着手机功能的越来越多,这种矛盾愈发凸显: 想记录家人,举起手机,我需要想想要不要调整到人像模式;面对车水马龙,我需要思考用慢门还是专门的长曝光——而大多数时候,我甚至很难分清自动弹出的夜景模式和单独分隔出来的夜景模式有什么区别。 从这个角度看,一个充斥着菜单、滑块和选项的复杂界面,可以说是这种珍贵瞬间的天敌,它强迫你在按下快门前思考工具本身,从而打断了拍摄者与被拍摄对象之间的情感连接和直觉反应。 当然,在移动影像的竞争中,厂家费尽心思为手机配备了更强大的硬件、更聪明的算法,功能也随之越来越多,这是一件很好的事,但随之而来的,是用户也要做更多的事、做更多的判断与选择,这就不是好事了。 所以,最好的手机影像,就是尽可能的不要做选择题。
三星Galaxy Z Fold 7在美“开门红”:销量超前代机型50%
IT之家 8月4日消息,据彭博社报道,当地时间上周四,三星电子称美国消费者对其最新款高端折叠手机的反应热烈,销量较上一代提升了50%,表明折叠屏手机正在逐步获得市场认可。 该公司透露,售价2000美元(IT之家注:现汇率约合14408元人民币)的Galaxy Z Fold 7创下了其大折叠手机的最高预售纪录。翻盖式的Z Flip 7表现也优于前作,两款新机合计预售量增长超过25%。三星补充称,与其合作的运营商方面,折叠手机的预售也增长了60%。 三星产品管理高级副总裁Drew Blackard表示:“Z Fold系列在美国市场的这次发布,是有史以来最成功的一次。Galaxy Z Flip7和Galaxy Z Fold7所获得的市场反响,是我们方向正确的积极信号。” 他补充说,消费者现在更看重折叠屏带来的便利,而非其潜在限制。 这类积极反响为折叠屏手机的发展提供了信心。该品类自问世以来,一直难以与更便宜、结构更传统的智能手机抗衡。彭博社指出,在苹果筹备首款折叠iPhone的背景下,三星此举也为其赢得了更多主动权。 据IT之家了解,可折叠iPhone预计将在明年问世。 尽管增幅可观,但整体销量仍不算大。估算数据显示,三星此前推出的Fold系列总销量仅为数百万部,仍远不及主流智能手机。 配色方面也助推了销量提升。三星表示,蓝色版Z Fold 7占到了近一半的预售订单,打破了以往黑色为主的销售格局。Z Flip 7的珊瑚红版本也“表现超出预期”,在该机型预售中占比近四分之一。 女性用户也正在加入折叠手机阵营。Blackard表示:“自2024年以来,Fold系列在女性用户中的占比大幅提升,我们会继续关注她们对新机型的反馈。” Z Fold 7折叠状态下依然轻薄,拿在手里就像普通手机,这一点相较前几代产品有明显突破。售价1100美元的Z Flip 7则是该系列目前设计最精巧的一款,外部屏幕更大,并围绕摄像头展开。
刷卡不再扭手腕,消息称三星将为Galaxy S26系列手机顶部增加NFC天线
IT之家 8 月 4 日消息,据韩媒 etnews 昨日爆料,三星明年上半年发布的 Galaxy S26 系列手机将在顶部增加 NFC 天线,为 Samsung Wallet 刷信用卡、交通卡增加便利。 多位匿名业内人士表示,三星在 Galaxy S26 系列手机设计过程中考虑为机身顶部引入新型 NFC 天线。其中一位消息人士表示:“目前的设计方向是现有 NFC 线圈的位置将保留,同时在机身顶部新增一个 NFC 天线”。 此举旨在解决 Samsung Wallet 用户的反馈。目前 Galaxy 系列手机的 NFC 感应区域位于后置摄像头旁或机身中部偏下,在 POS 机 / 公交闸机上刷卡时,用户常常需要扭动手腕才能完成支付,甚至在对准刷卡区域的情况下也有可能支付失败。 作为对比,苹果的 Apple Pay 只需要将设备靠近 POS 终端即可完成支付,在便利性方面受到好评。 etnews 对此表示,三星此次的决策是为了改变 Galaxy 手机用户的支付体验。一位业内人士指出:“由于苹果已经掌握大量相关专利,三星在绕开专利方面费了不少时间”。 不过目前 Galaxy S26 系列手机的 NFC 天线设计尚未进入量产阶段,在手机整体进入量产前,详细设计或零件规格仍有变动空间,现状还无法代表最终量产产品。 IT之家注:Samsung Wallet(三星钱包)在三星大部分运行 One UI 的机型上提供,在中国大陆支持添加银行卡、交通卡、数字钥匙、机票等电子票卡。
兔子蹦床播放超 5 亿!这条全网最火 AI 视频,是人类爱被「骗」的结果
一段看起来像是夜视监控拍到的「兔子蹦床」视频,在 TikTok 上爆火,全网收获了有 5 亿次播放。 视频看上去像是某户人家的安防摄像头拍到的,灯光昏黄、画面模糊,但恰到好处地捕捉到几只兔子轮番起跳,活像在开夜间演出。 自动播放 视频的标题写着:「刚查看了家庭监控,我想我们家后院来了几位特邀嘉宾!@Ring」 。 监控的模糊画质、几只看似在狂欢的兔子,这可爱又略带一丝真实感的画面迅速吸引了人们的眼球 。 在社交媒体平台 X 上坐拥百万粉丝的名人 @Greg 也评论说,「我从没意识到自己需要一群蹦床兔子,直到今天」。 然而,这份可爱是虚假的。视频中的兔子并非真实存在,有人发现,它是AI生成的。 第 5 到第 6 秒之间,左上角的兔子忽然「消失」。回头再看,细节确实有点怪。 但和大多数「AI 穿帮」视频不同,这次几乎没人第一时间认出来。哪怕是刷视频经验老到的年轻人,也直呼「完了,我居然被骗了」。 但这不是一场骗局,更像是一种小型社交媒体的灾难:不是「我们被骗了」,而是「我们居然愿意被骗」。 看似糊得刚刚好,其实「骗」得刚刚好 这段 AI 视频之所以能成功「欺骗」大众,很大程度上并非因为 AI 视频生成技术已经完美,而在于它「骗得刚刚好」。 它精准地利用了我们对监控视频的固有印象,也踩中了最能让我们放下戒备的那些流量密码。 模糊的夜视画质和静态背景,刚好遮住 AI 的弱点 我们习惯于认为夜晚监控录像就是模糊、黑暗且充满噪点的。这种先入为主的印象,完美掩护了 AI 视频的技术硬伤,例如在动作连贯性、阴影细节和背景动态上容易穿帮等问题。 所以当它以「夜晚监控录像」的方式出现时,画质本身的低清模糊反倒成了障眼法,帮它遮住了真实感缺口。 ▲ 视频画质符合夜间监控特点,且背景是完全静止。 此外,尽管一些 AI 视频生成模型在处理前景主体方面已经相当出色,但背景的渲染往往会显得非常超现实。 而这段视频的背景是静止的,这又为 AI 规避了一个技术难题。 带「@Ring」的文案增强了来源可信度 视频发布者在标题中聪明地标记了家庭安防摄像头品牌「Ring」,一下子就让这视频的来源显得有理有据,让人感觉更真了。 ▲ Ring 是家庭摄像头品牌 这个小细节营造出「这视频是别人家门铃拍到的」错觉,让人自动归类为「生活记录」而非「创作内容」。 「动物夜间搞事情」是互联网用户默认接受的 meme 无数次病毒式传播的视频,已经训练我们相信这个场景是真实的。猫晚上偷吃泡面、浣熊夜闯泳池、郊狼在蹦床玩耍,动物们总爱在人类不在时「犯规」一下。兔子蹦床这种事,怎么看都合理。 自动播放 ▲ 熊闯入游泳池 最重要的:它太可爱了!谁会去质疑这么温柔的一幕呢?当一段内容足够甜、足够轻,它就很容易让我们「选择相信」。 尽管视频中间,左上角的兔子突然消失,暴露了 AI 生成的本质。但对于绝大多数刷短视频,快速滑动的观众来说,这一瞬间的破绽极易被忽略。 就在兔子视频引发热议的同时,马斯克也分享了 AI 视频技术的惊人进展。 10 天前,一段 6 秒的视频渲染需要 60 秒,之后降至 45 秒,再到 30 秒,现在已缩短至 15 秒。 本周我们或许能将时间控制在 12 秒以内。 他同时表示,实时视频渲染技术有望在 3 到 6 个月内实现。 ▲ 马斯克推特截图 这意味着,今天我们还能看到的「兔子消失」这类穿帮镜头,在几个月后可能就几乎很难发现里面的 bug。 当 AI 视频在技术上无懈可击时,再去讨论「如何分辨真假」就失去了意义。 这也让我们不得不把目光从技术本身,转移到更核心的问题上。 让我们被骗和狂欢的,其实不是 AI 视频的真相揭晓后,许多用户表达了一种「信仰崩塌」的感觉。 一位 TikTok 用户说,「这是第一个我相信是真的 AI 视频,等我老了肯定完蛋了」。另一位用户则表示,「现在我觉得我以后就会是那种被骗的老年人」。 这种从自信到恐慌的情绪转变,成了一个新的网络热点。 然而,将问题仅仅归咎于「AI 发展得太快」或「我们太容易被骗」,可能忽略了更深层次的原因。这一事件的核心,或许不在于 AI 技术本身,其实在于社交媒体平台本身的那一套玩法。 通过翻看视频的评论记录,我们发现人们在评论区的反应,呈现出来的几乎是同样的一个心理剧本。 首先是「天啊,这也太可爱了」; 然后,「等等,好像不太对劲?」; 第三步,「我被骗了?完了,我要变成会被骗的老年人了吗」; 最后还是回到了,「但……我不怪它」 我们正在和 AI 视频建立一种全新的「互动逻辑」。 我们不是完全相信它,而是默认它可能是假的,但我们依然愿意停下来看看、点个赞、转发给朋友猜一猜,就像一个游戏。 ▲ 短视频平台推荐系统 而平台的算法,也深知这种心理结构。 在这个过程中,「AI 视频是真是假」不再是重点,它更像一种参与门槛:你看懂了没?你能分辨出来吗?你被骗了吗? AI 爆发的这两年,我们总是感叹 AI 视频图片已经能以假乱真,因此感到恐慌,担心自己未来会更容易被虚假信息蒙蔽。 然而,这个视频的病毒式传播,并非完全源于 AI 技术的「欺骗性」,而是源于人类观众内心深处对「被欺骗」的需求。 这些网友不都是被动地被骗,而有不少是主动地、心照不宣地参与了一场名为「假装相信」的集体游戏。 这场狂欢的主角不是 AI,而是我们自己。 正是视频中那「一闪而过」的兔子消失 bug,才让整个事件升级为一场全网参与的「找茬游戏」。如果视频完美的天衣无缝,它可能只会然后迅速被下一个视频淹没。 ▲ 电影「致命魔术」 这就像观众明知道魔术师在「欺骗」他们,但他们享受的恰恰是那种「明明知道是假的,却看不出破绽」的认知挑战。 AI 兔子的「穿帮」,就是这个魔术被揭穿的时刻,它让所有人加入讨论,从而引爆了传播。 缺陷创造了争议,争议驱动了参与。视频的真假不再重要,它所引发的混乱和讨论本身,就是流量的保证。 这种「我竟然也被骗了」的自嘲,迅速拉近了陌生网友间的心理距离,形成了一种「我们都是容易被骗的笨蛋」的社群认同感。由「共同被骗」而产生的连接,其社交价值远大于视频内容本身的真实性。 理想的情况是,我们学会有意识地享受这种「虚假内容」带来的乐趣,同时保持一份清醒的认知,但这可能对大多数人来说并不容易。 潜在的危险不只在于 AI 的逼真程度,而在于当这种「集体欺骗」被用于恶意时,比如制造谣言或骗局。我们需要建立的,是对信息「意图」的识别,而非仅仅对「真伪」的判断。 我们可以多问问自己:这个内容想让我产生什么感觉?它最终想让我做什么?
苹果的ChatGPT要来了?取代Google百度
信誓旦旦说不搞聊天机器人的苹果,也已经按捺不住了。 彭博社最新爆料,苹果在今年早些时候成立了一个名为「答案、知识和信息」的团队,简称「AKI」(Answers、Knowledge and Information),目标就是打造一种类似 ChatGPT 的全新搜索体验。 这个团队正在构建一种「答案引擎」,能够爬取网络数据来回答常识性问题,目前还处于研发的早期阶段。「答案引擎」不仅会有一个独立的 app,还会作为基础技术,为未来的 Siri、Spotlight 聚焦搜索以及 Safari 浏览器提供搜索的功能。 据悉,这个团队由「AI Siri」的前负责人高级总监 Robby Walker 领导,向 AI 主管 John Giannandrea 汇报工作。苹果也已经开始了针对该团队的招聘活动,提到了搜索算法和搜索引擎方面的经验需求,信息中还提到了 Siri、Spotlight、Safari 产品。 对于苹果来说,做 AI 搜索更多是一种被动的应对策略。随着 Google 反垄断案的持续进行,苹果很可能将被迫终止与 Google 搜索的多年合作,这会导致其失去 200 亿一年的授权费。苹果自己的 Apple 智能进度缓慢,AI Siri 持续跳票,因此需要一些新的更有吸引力的 AI 功能。 虽然此前苹果内部对聊天机器人之类的 AI 应用持有保留态度,但在今年已经发生了 180 度转弯。苹果服务高管 Eddy Cue 在甚至公开表示,基于人工智能的搜索是未来的发展方向,并证实了苹果正在探索和 AI 搜索公司 Perplexity 等团队的合作关系。 在上周的财报电话会议上,CEO 蒂姆 · 库克强调了苹果对 AI 技术的重视,也明确表达了收购 AI 公司的开放态度。此前有不少消息称,苹果内部已经讨论过收购 Perplexity 的合理性,也约见过其领导团队。 AI Siri 这块烫手山芋还没解决,又分出资源去做 AI 搜索,苹果能不能同时应对这么多挑战,不免让人担忧。比起从头构建一个 AI 功能,似乎直接收购现成的产品和团队更适合苹果,而 Perplexity 就是一个合适的选择。
哨兵模式激活、代客泊车辅助增强,广汽昊铂HL汽车获3.6.0版本OTA升级
IT之家 8 月 4 日消息,广汽昊铂今日发文宣布,昊铂 HL 汽车获 3.6.0 版本 OTA 升级,新版本拥有超 118 项功能焕新,包括哨兵模式激活、代客泊车辅助增强、辅助驾驶终点路边临停等功能。 IT之家附广汽昊铂 HL 汽车此次更新主要内容如下: 新增哨兵模式 新增后排屏幕手机无线投屏功能 新增黑夜模式:HMI 深浅界面偏好设定配置自动切换深浅界面 新增 SR 时间天气引擎 新增全民 K 歌多屏同步 K 歌功能 新增语音助手方言识别功能 新增 WIFI 分享视频照片到手机功能 新增场景大师分享码创建自定义场景功能 新增音效魔方功能 新增微信小程序功能 升级高德全新 810 引擎,新增巡航红绿灯倒计时等功能 新增自定义车位泊车功能 新增泊车车速三档调节功能 新增直线召唤脱困功能等 NDA 抵达目的地点靠边停车功能 新增 NDA 前车急刹 / 压线 / 加塞情况下闪灯提醒功能 新增 NDA 智能交通流调速功能 新增低速 AEB (RAEB / FCTB / RCTB) 功能 新增 HUD 转向补盲功能 新增冰雪路面原地掉头功能 (四驱版本配置适用) 新增空气悬架高度调节栏 新增屏幕清洁模式 新增垂直 / 斜列车位泊出功能 优化分屏地图等功能 优化代客泊车辅助功能路线记忆方式 优化代客泊车辅助激活显示 优化 NDA 通行能力优化智驾人机交互界面 据IT之家此前报道,广汽昊铂本月宣布旗下昊铂 HL 增程版车型将于 8 月 19 日正式开启交付,该车采用 1.5T 增程动力,CLTC 纯电续航里程为 350 公里,此前已公布指导价为 26.98 万元-29.98 万元。作为比较,纯电版车型的指导价为 29.98 万-31.98 万元。 该车尺寸为 5126×1990×1750 毫米、轴距 3088 毫米,车辆搭载 1.5T 增程器,匹配最大功率 250 千瓦的后置电机,三元锂电池组容量为 60.33 千瓦时,CLTC 纯电续航里程 350 公里。作为参考,昊铂 HL 纯电版提供后驱和四驱车型,可选 CLTC 续航里程 700 公里和 750 公里车型。
科学家为太阳能发电厂找到副业 用于夜间搜寻小行星
无论太阳能发电系统有多么好,它们都有一个共同的缺陷——它们在夜间无法工作。一旦太阳落山,白天的发电就结束了。系统会关闭,直到第二天日出之前,发电量为零。桑迪亚国家实验室的科学家约翰·桑达斯基正在考虑为太阳能发电厂增添一些副业。在国家太阳能热测试设施,他正在试验让定日镜在夜间搜寻小行星。 定日镜发电时间不够长这只是生活和工程中的一个现实问题。但如果有办法在夜晚利用太阳能发电厂进行一些有用的工作呢?桑达斯基在位于新墨西哥州阿尔伯克基的桑迪亚国家实验室的国家太阳热能测试设施开始测试时,就想找到这个问题的答案。 该设施是美国唯一的同类研究工厂,由一座61米高的混凝土塔组成,塔两侧安装有218面安装在定日镜上的镜子,这些镜子可以自动跟踪太阳,并将光线聚焦到塔上。该设施的反射面面积达37平方米,可发电6兆瓦。 约翰·桑达斯基站在定日镜中间 当太阳下山时,电力输出就会降至零。然而,这些定日镜的功能远不止追踪太阳。它们还可以通过编程追踪其他物体,这意味着桑达斯基可以让它们发挥更聪明的作用。 作为实验室指导研发项目的一部分,桑达斯基采用了其中一面定日镜,让它像望远镜一样追踪夜空,并将反射的能量投射到塔上的光学仪器上。这部分能量虽然只有飞瓦级,但通过让定日镜以一分钟为周期来回摆动,他创造了适合小行星探测的条件。 传统上,人们使用成熟的光学望远镜来观测小行星,这些望远镜可以捕捉几分钟或几小时的延时天空图像,并同步跟踪恒星。在这些长时间曝光的图像中,恒星会以光点的形式出现。但如果存在小行星,它会以光带的形式出现,天文学家可以确定它的存在、距离、大小和轨道。 国家太阳能热测试设施 问题在于,天空广阔,而望远镜数量有限,这就是为什么这么多小行星是由业余爱好者发现的。由于我们现在知道小行星既可以是宝贵矿物的来源,也可以是对地球的潜在威胁,天文学家们渴望拥有更多工具来提升他们的探测能力。 桑达斯基的技术不会产生带有可见条纹的图像。相反,它以亚毫赫兹的分辨率捕捉入射光的光电流功率谱。如果一颗小行星——或者一艘航天器——穿过视野,它会显示为相对于背景星光的频率偏移,表明运动角度发生了变化。 它不像照片底片上留下的痕迹那样引人注目,但足以展现利用闲置太阳能发电设施作为NASA小行星撞击地球最后预警系统(ATLAS)低成本补充的潜力。ATLAS旨在搜寻潜在危险的小行星。据桑达斯基称,它还可以用于军事用途,帮助国防机构探测在地月空间秘密运行的航天器。然而,这需要将该技术发展到实用水平。 “我们正在寻找机会,将定日镜从一台扩展到多台,并试图证明我们能够帮助寻找近地天体,”桑达斯基说。“我们还想证明,我们可以扩大这项技术的规模,以探测到更小的小行星。” 该项研究成果在国际光学与光子学学会的一次会议上发表。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。