EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
号称Elo评分“凌驾竞品”,Black Forest Labs推出文生图AI模型FLUX.1
IT之家 8 月 12 日消息,美国初创公司黑森林实验室(BlackForestLabs)在 8 月 1 日推出了 AI 文生图模型 FLUX.1,该模型据称在“潜在扩散、稳定扩散及对抗性扩散蒸馏”方面较为突出,能够即时根据用户提示词生成各种图像。 官方将该模型与其他友商产品进行比拼,结果显示系列模型的 Elo 评分(IT之家注:Elo 评分系统是一种在国际象棋等竞技游戏中广泛使用的评分方法,主要用于计算比赛对手实力等级)“凌驾” Stable Diffusion 3 Ultra、Ideogram、Midjourney 6.0、DALL・E 3 等竞品。 ▲ FLUX.1 生成的图片 IT之家获悉,FLUX.1 目前提供了三种版本以满足不同用户的需求(项目地址点此访问),用户可以通过不同平台试用这些模型,探索其在实际应用中的表现,三款模型具体如下: FLUX.1 pro:该模型定位商业版,支持企业定制解决方案,强调高精度提示遵循、出色的视觉品质、丰富的图像细节及多样化的输出格式。 FLUX.1 dev:该模型定位科研(开源)版,主要面向非商业用途,开放权重,适合研究和开发者使用。 FLUX.1 schnell:这是一款“小模型”,在 FLUX.1 基础上进行精简版,适合本地开发和个人使用,采用 Apache 2.0 授权。 官方表示,所有版本的模型均支持生成不同比例的画面,最高支持生成 200 万像素的图像。虽然目前 FLUX.1 只支持通过提示词生成图像,但官方提到他们未来计划扩展模型,让模型能够通过提示词生成视频片段。
AI应用TOP10占两,这公司成出海最大赢家,已交IPO申请
谁是今年上半年中国出海最成功的AI应用公司? 答案你绝对想不到!不是字节跳动,而是曾经的在线教育龙头——作业帮。 7月底,市场调研机构Sensor Tower发布了今年上半年美国AI产品下载量TOP10。在这次榜单中,共有三个中国公司产品入围,分别是Question.AI(第3)、Talkie(第4)以及Poly.AI(第9)。其中,AI教育应用Question.AI和AI伴侣Poly.AI均来自作业帮。 ▲注:红色应用由中国公司开发 早在今年年初,在A16z发布的《Top100生成式AI消费类应用》上,就已经出现了Poly.AI和Question.AI的身影。 随着Question.AI和Poly.AI表现越来越好,也意味着,作业帮已经成为这波国内AI出海浪潮里的最大赢家。 今年4月,作业帮被曝秘密赴美IPO。彭博社报道,该公司在与顾问讨论上市事宜,预计最快可能在今年上市。此次IPO中,作业帮计划通过发行股票筹集的资金规模可能不到1亿美元。 在AI应用出海上的领先,又是否能帮助其获得投资人更多的青睐呢?我们拭目以待。 上学解题、放假陪伴,美国学生的时间管理大师 先跟着乌鸦君来了解下作业帮这两个AI产品。 Question AI是一款去年5月上线的AI教育产品,学生可以通过扫描解决作业问题,涵盖多个学科。而Poly.AI则是一款AI伴侣产品,用户可以自行创建AI角色,并和它聊天。 从公开信息看,Poly.AI的海外主体为「CLOUD WHALE INTERACTIVE TECHNOLOGY LLC」。 据白鲸出海报道,作业帮旗下Question AI曾用过“CLOUD WHALE INTERACTIVE TECHNOLOGY LLC”作为海外主体。(不过现在Question AI海外主体信息已显示为“D3 DIMENSION TECHNOLOGY PTE. LTD”。) 基本可以确认,Poly.AI与Question AI这两个应用均来自作业帮。 虽然产品方向略有不同,但两个产品都有着不错的流量表现。 先说Question.AI,今年的2-5月,Question.AI一直牢牢占据着美国教育榜TOP3,仅次于多邻国和字节旗下的Gauth,甚至一度冲到榜首。 到了6、7月份,受暑假影响,Question.AI的日均下载量有所下滑,排名维持在25名左右。8月5日单日下载量为4.5万次。 自23年5月推出以来,Question.AI全球累计下载量2603万次,美国累计下载了590万次。从用户分布看,Question.AI主要活跃用户在美国,其中北美市场的周活跃用户接近200万。 说完Question.AI,再来说说Poly.AI。 自23年5月推出以来,Poly.AI一直不愠不火。去年10月开始,Poly.AI用户增长明显,每个月新增下载100w+,12月新增下载270w(主要来自发展中国家)。 有意思的是,随着美国进入暑假(6、7月份),Poly.AI下载量开始出现暴涨。 在苹果商店的娱乐应用榜上,Poly.AI排名从5月底之前的60名上下,最终上升到20名左右。8月5日,单日下载量为5.0万次。 从用户分布看,Poly.AI的活跃用户主要在美国、巴西和墨西哥。如今,Poly.AI全球累计下载量412万次,其中美国下载量为80万次。 起量的关键:原始产品积累+新市场新需求 之所以Question.AI和Poly.AI能够快速获得大量用户,有两个关键点: 一是,作业帮过去在搜题产品上拥有一定的积累,如今与AI技术结合,将积累经验复制到出海产品上; 二是,作业帮能够捕捉新的市场需求,并通过产品调整来满足这部分需求。 接下来,乌鸦君就结合两个产品的情况展开说说。 Question.AI:搜题产品积累+美国家教平替 国内用户对搜题类APP应该都不陌生。在线教育最火的时候,搜题APP是所有玩家争抢的重要赛道,作业帮也有布局。 Question.AI可以理解为,原有的搜题产品+AI技术,核心功能有三个: 1)拍题并解答问题 2)AI作业助手,24小时在线答疑 3)AI聊天,上传多个PDF文件(Chat PDF),自动扫描并解决PDF的多个问题 其中,第一个功能几乎就是搜题产品功能的平移,而后两个功能则结合了AI技术。也就是说,作业帮过去在搜题类APP的经验,能够平移到AI教育出海产品上。 为了感受Quetion.AI和其他出海搜题AI应用(字节Gauth、Answer.AI)的差异,乌鸦君进行了简单的对比。仅解此条题目的试用过程中,乌鸦君有以下几个维度的观察: 1.读题反应速度,Question.AI最快(用时约20s),Answer.AI与之相当,Gauth最慢(用时约40s); 2.读题识别体验,Question.AI允许直接编辑识别图片的文字(非常方便),Answer.AI可以通过复制黏贴来修改识别出来的提问文字(还行),Gauth不能编辑图片识别出的文字(不方便); 3.讲解过程,Question.AI和Answer.AI均支持延伸提问,而Gauth不支持延伸提问。 AI教育应用为什么在美国能火?一个重要的原因是,Question.AI类AI搜题应比真人私教更便宜。 家教对于美国家庭来说是一份不能忽视的支出,美国大多数地区的家教比较昂贵,同样是解决课后作业问题,Question.AI软件就比真人私教便宜得多。 美国高中的家教(普通有一定经验的非学校在职教师家教)价格在50~100美元/时,Question.AI的年费会员是58.8元,如果按照60美元/时的家教费算,这相当于1小时家教费≈1年Question.AI订阅费。 Poly.AI:学生的陪伴需求精准捕捉+无限制+IP+营销 Poly.AI挤进了A16z评选的移动端AI应用MAU Top50(统计时间截至今年1月),离不开它灵活的产品路线。 自成立以来,Poly.AI经历了多轮的产品迭代,定位也发生了很大变化。 Poly.AI在去年5月刚推出的时候,定位还是一款语言学习应用。仅一个月后,Poly.AI就转型成了AI伴侣。去年6月,它更新了角色说话的功能,并摘除了“语言学习”之类的描述。 摸索了三个月,Poly.AI在AI伴侣的这条路才算成了。去年10月27日改版后,Poly.AI不仅改成了现在的名字,还在描述里明确了产品特点: 1)仿真语音 2)热门IP角色和文娱明星 明确产品特点后,Poly.AI在TikTok渠道投放了大量的动漫博主KOL营销广告,通过“声音”玩梗,在平台上形成了大量传播。 在完成产品定位更新、营销“爆炒”后,Poly.AI又将目光锁定AI伴侣的流量大杀器——无限制聊天(无过滤器)。也就是说,用户可以随意和Poly.AI聊成人内容、恐怖话题,而不被屏蔽。 这帮助Poly.AI吸纳了一部分未被Character.AI满足的用户。有大量用户在 Reddit上认真书写了自己推荐Poly.AI的理由: Poly.AI拥有更灵活的角色创建功能、话题场景、更好的角色一致性等。 ▲Reddit上,Poly.AI的好评如潮 总体来看,虽然作业帮两个产品取得阶段性领先,但依然有很长的路要走。 如今,AI教育领域的竞争越来越激烈,Question.AI也面临着字节Gauth的挑战。对Poly.AI来说,赛道老大Charcter.AI已经作鸟兽散,AI伴侣产品赛道的前景也多少存疑。 而这些问题,都需要作业帮在后面的发展中给出答案。
除了烧钱,互联网留给大模型挥霍的“家底”不多了
在新一轮互联网创新历程中,大模型有幸成了下一个赛点,这次不再像之前的元宇宙一样稍纵即逝,而是真的在逐渐往应用层面渗透。 《2024年中国移动互联网半年报告》发布,报告显示,2024年6月,AIGC类APP的月活跃用户规模达6170万,同比增长653%。从去年开始,大模型就再次掀起互联网混战,全球科技大厂生怕错过一次重要的时代转折,无论是做游戏的、电商的、还是社交玩家,都在倾尽全力跟进大模型时代。 有机构曾预测过,未来到2025年,全球 AI 市场规模将超过6万亿美元,2017年-2025年复合增长率达30%。 诚然,互联网世界已经安静了许多年,赖以大模型,总算又热闹了一回。淘宝、支付宝、抖音等国内流量规模前20的超级APP,基本都在发力内嵌式AI应用,智能助理、智能搜索、智能导购……各类新玩法层出不穷。 在全球互联网领域失去创新能力之后,大模型真的能给予互联网新的生命力吗?这个问题值得认真思考。 创新认知正在降级,产品研发故步自封 在大模型出现之前,互联网巨头为什么迟迟没有孵化出新的创新产品? 实际上,全球科技企业都在被这个问题残忍逼问。去年1月份,英国杂志《自然》刊登了一篇论文,文中基于4500万份手稿与390万项专利发现,全球范围内的颠覆性技术都在下降。 从企业角度来看,这些年来,互联网市场从未停止过研发进度,甚至还在不断加强。只不过,大厂的研发似乎都失去了意义,长远的投入与回收不成正比,严重消耗了资本的创新热情。 这不是空穴来风。根据上海证券交易所报告,仅在2021年,国内以寒武纪为代表的一众科创板块企业的投入研发成本就高达167亿,可惜,累计亏损远远超过了这个数。统计局数据显示,从2000年到2019年,企业的投入已经超出国内研发总投入的76%,年增速度达到10%。 即便是在这几年外部环境不利好的情况下,国内企业的研发增速依旧能保持在18%以上。但研发难以增收也是不争的事实,此前,百度的李彦宏公开表示,百度研发工程师超过万人,投入一度是收入的20%,但换来的实际业绩却不理想。 如此一来,巨头公司宁愿去投资现有项目,以腾讯为例,数据显示,腾讯目前总投资企业超过800家,其中有160家为估值超过10亿美金的独角兽企业。为此,外界甚至曾流传过一种说法,巨头的投资与干预使行业内部的创新力被压缩了。 除此之外,研发换不来可观的回收,也让大厂不再一味盲目开发新产品。 这些年,小程序成品的涌现频率要高出独立APP许多,此前,阿里、腾讯、字节、百度、快手、美团、京东……陆续开发小程序,而独立APP为了节约试错成本大面积关停。统计显示,腾讯曾一年关掉了40多个项目,字节也下架了派对岛,截止目前为止,仅互联网大厂这几年关停的独立产品就高达70多款。 而这背后与整个互联网行业的盈利状态息息相关,工信部数据显示,今年第一季度,我国规模以上互联网企业营业成本同比增长5.1%,实现利润总额278.9亿元,但同比下降15.3%,利润总额增速由正转负。 大模型的出现,算是一缕照进互联网世界的曙光,苦于固步自封的大厂们一涌而上,从研发方向也能看出,大模型的确激发了巨头们的研发信心。然而,大模型所带来的创新能维持多久? 有一点需要注意,时至今日,创新疲软的互联网领域很难再出现一个现象级产品,或者领头式技术。毕竟走过微信、抖音年代,任何一点风吹草动都能引发行业内卷,正如当下,自研芯片、大数据、云计算、人工智能等技术成了所有巨头,乃至科技创业的重头戏。 同质化的戏码,从未在互联网界消失,当AI玩法在任何一个APP上都能见到,这样的创新也就不再是“创新”。 另外,虽然大模型热多少激起了一些水花,但互联网巨头曾经最担心的研发与营收不成正比的问题更为严重了。全球科技发力AI,所造就的资本支出也就越来越多。这段时间,海外巨头的财报把大模型烧钱的本质展现得淋漓尽致。 有机构分析,到了2025年和2026年,大模型训练成本会接近50-100亿美元,其中,Meta、谷歌、微软可能计划将大模型研发成本提高到500亿美元。 种种迹象显示,互联网或许从未停止创新,只是对于创新的认知下降了。 大模型应用的威力,并没预想中的强 不同于过去的几次革新,这一次互联网集体向用户提供的大模型应用,面世没多久就遇到了一些麻烦:用户需要大模型的几率大吗?就目前一系列数据来看,答案或许是比预期的要悲观一些。 红杉资本数据显示,即便是全球大模型的头部ChatGPT,其首月用户留存率也只有56%,有大约一半的用户用不到一个月就将其“搁置”了。同样的,《2024年中国移动互联网半年报告》也显示,国内AIGC用户不稳定,AIGC行业人均使用时长同比下滑了23.5%。 说到底,人工智能渗入现实生活还只是资本的“幻想”。 从用户层面来看,几乎所有主流APP上的AIGC应用的用户留存率低于传统应用,参与度也较低。7月份,贝壳财经发布了一项调查,52.05%的受访者在工作中有时使用大模型,23.97%很少使用,经常使用的受访者占20.55%,总是使用的人仅占2.05%。 从企业层面来看,华为有一组预测数据,到2026年,人工智能对企业的渗透率也只能达到20%。 为什么会出现这种情况?技术、成本、实用性、安全性其实都是原因。 以AI落地应用最广泛的文娱行业为例,前段时间,成龙新片《传说》上映,在该片上映之前,AI技术一直是影片宣传的最大噱头。据悉,博纳影业在电影里用AI还原了27岁的成龙,但买账的观众却寥寥无几。 数据显示,当前《传说》豆瓣评分5.4分,上映十几天也只有7000多万的票房。 在另外一大应用领域“广告界”的使用口碑也褒贬不一。艾瑞咨询显示,已有约半数广告主企业在线上营销活动中应用AIGC技术,其中超9成用于内容及创意场景,当前大部分互联网在自身产品里引入大模型,也是为了拉动每况愈下的广告收入。 然而,AIGC短板也开始浮出水面:例如生产素材过于公式化、AI效果令用户审美疲劳、以及众所周知的AI抄袭问题……之前,“我用 AI 五分钟生成一个广告 ,却花了五个小时去 AI 味”的文章在社交平台上产生热议。 如果大模型无法像社交通讯、短视频娱乐那样,在用户的网络生活中产生刚需效应,那大模型之于互联网进程,也就没太大的推进作用。当前,互联网领域最大的重心就是要提升AI落地的应用效率。 而资本也意识到了这一点,投资流向正从研发赛道流向应用赛道。海通国际研报称,2024年有望成为国产大模型全面商业落地的元年。 数据显示,在今年近120起全球大模型投资事件里,大模型应用企业占69%,占比超过一半,而AI Infra、通用大模型分别只占16%、11%,大模型数据服务甚至只剩下了3%。细看大模型应用领域,AI医疗健康、视觉/视频生成领域、办公助手和编程助手获得融资的企业最为密集,分别占比为15%、15%、13%、11%。 总而言之,资本正在现实世界中加速普及大模型,技术和业务需求如何匹配是大模型企业迫在眉睫的问题。也只有这样,互联网才有被“拯救”的可能,反之,失去创新力的互联网还要继续迷茫。 互联网留给大模型吃老本的“家底”不多了 有一个问题需要注意,互联网走到大模型阶段,大多数的玩法还与从前一样,要么持续打价格战,要么回身吃本身的流量“老本”。 从本质上讲,大模型的落地与古早互联网时期“圈地跑马”没什么区别。 今年5月份,国内一众大模型玩家开始官宣降价,阿里的通义千问主力大模型Qwen-Long的API价格直降97%后,文心大模型两大主力模型ERNIE Speed和ERNIE Lite全面免费,随后,科大讯飞也宣布,讯飞星火API能力免费开放。 而字节跳动这边,豆包从发布到冲上第一只用了30天的时间,据悉,豆包之所以能短时间内成为大模型“顶流”,不仅因为月活7.94亿人的抖音为其助力,新一轮的烧钱金额也达到了1.24亿元。 遥想当年,国内互联网大厂最屡试不爽的招数就是砸钱。时至今日,“圈地”的打法还适用吗? 首先,大模型在当前只能砸钱换流量的关键在于技术趋同,最终影响用户留存的也会是回归于技术,单纯降低应用成本从短期角度来看的确能增加曝光、争抢用户,但长久来看,AI技术服务不是外卖、更不是短视频,依靠烧钱无法带来良好的使用体验。 其次,大模型发展本身就是个成本巨大的资金型工程,或许对于现金流富裕的大厂而言,价格战打得起,但当前大模型盈利遥遥无期,小型企业入局的风险不可小觑,这必然会进一步降低整个行业的创新力和创造力。 事实上,大模型价格战是从海外先开始的,彼时,OpenAI和谷歌最先宣布降价。但在海外,云厂商正在脱离传统服务模式,转用其他方式来填空这一成本,以英伟达为例,5月份,英伟达公布了2025财年的第一季度数据。 英伟达方面表示,在英伟达CUDA上训练和推理AI可以推动云租赁收入的增长,每1美元的英伟达AI基础设施支出让云服务提供商有机会在四年里获得5美元的GPU即时托管收入。国内能否快速跟进这一步计划,其实还有待商榷。 当然,除了能够继续“传承”的打法,互联网这些年给大模型留下的“家底”也不多了,即便是从全球范围内来看,资金之外,大模型最需要的信息数据已出现短缺。 Similarweb的数据显示,自2023年5月ChatGPT全球访问量达到18亿次的巅峰后,其流量增长开始逐渐放缓。对此,OpenAI决定放宽对ChatGPT的限制,用户一度无需注册就能使用。 没办法,这也是当前大模型发展的困境之一:现有的互联网信息量难以支撑如此之多大模型训练。 这段时间,字节跟一众在线办公企业“喂养”大模型的事引发不少用户不满。公开资料显示,GPT-4训练涉及的数据量高达12万亿tokens,未来像GPT-5,可能需要60万亿到100万亿tokens。 根据Epoch研究所预测,到2024年年中,大模型对高质量数据的需求超过供给的可能性为50%,到2026年发生这种情况的可能性为90%,而这种数据短缺风险将延迟至2028年。 至于如何弥补这一巨大的数据缺口,渗透率逐渐触到天花板的互联网,一时间也找不到更好的办法。
AI大军接管六大科技巨头,老板打工人皆是AI!效仿微软组织结构,工作效率惊人
【新智元导读】你有没有想过,或许未来某天,AI大军完全能够承担公司重任,人类是否会沦为配角? 小扎坚信,「未来世界上AI智能体,将比人类还要多」。 那么,如果这些AI也有企业文化,会怎样? 它们是否也像人类一样,既有手握决策大权的AI,也有苦哈哈干活的AI。 几个月前,OpenAI曾被曝出,内部定义了五级AGI路线,L5——组织者:可以完成组织工作的AI。 这所说的,或许就是未来公司的组织架构图。 因为多个智能体的合作,正在崛起。 此前,一项研究表明,拥有30+AI智能体系统,在几乎任何任务中,都优于简单的LLM调用,同时还减少了幻觉,提高了准确性。 但是,多个智能体之间,应该如何进行实际协作呢? 在探索改善AI在软件工程任务中的表现的方法时,Alex Sima突然有了灵感: 如果将AI智能体之间互动机构化,让其类似于科技巨头的「组织架构图」,会怎样? 接下来,Alex让AI接管了6大科技巨头——亚马逊、谷歌、微软、苹果、Meta、Oracle,看看它们如何协作。 先来一张图,感受下。 关键要点 以下是,Alex将AI智能体,组织成类似苹果、微软、谷歌等公司结构后,得到的一些关键要点: - 有多个「竞争」团队(即竞争生产最佳最终产品)的公司,如微软、苹果,表现优于集中化的层级结构。 - 具有单点故障(比如一个领导者做出重要决策)的系统,如谷歌、亚马逊和Oracle,表现不佳。 - 大型科技公司的组织结构,对问题解决能力有适度但明显的影响。 AI智能体与科技巨头组织 之前通过简单增加AI智能体数量,来提升性能的方法,比如SWE-bench,并未取得显著的成效。 这表明,仅仅依赖数量的增加,并不能解决问题。 那么,有什么其他的方法可以让AI智能体在软件工程方面变得更好? 三周前,Alex偶然看到了James Huckle关于「康威定律」的一篇文章——软件和产品架构注定会反映创造它的组织结构。 James展示了一幅插图,揭示了亚马逊、谷歌、Facebook、微软、苹果和Oracle的戏剧化组织结构,并提出了一个想法: 就像大型科技公司中的人类一样,多智能体通信结构可能会塑造问题解决方法。 Alex受到启发,决定在SWE-bench实例上测试James的假设。 实验设置 作者将AI智能体组织成不同的公司结构,在SWE-bench-lite的13个实例「mini」子集上,评估了六种不同的组织结构。 在构建这六种组织时,他基于一些核心观察设计了多智能体组织结构: 亚马逊 顶层有一个「管理者」的二叉树。 为了复制这一结构,Alex使用了大量执行代码库搜索的智能体,和一个最终执行代码库更新的单一智能体。 谷歌 类似亚马逊的树状结构,但中间层之间有更多连接。 Alex通过在单一层内聚合复制所有智能体结果,并将其传递给下一层的智能体。 Meta(Facebook) 缺乏层级结构,但仍是一个智能体之间有许多连接的网状组织。 Alex通过增加不同智能体之间的转换可能性,来修改原始的智能体设计。 微软 强调竞争团队,每个团队有自己的层级。 本质上,Alex重新调整了亚马逊的结构(减少智能体数量),并使用向量相似性投票方法,从三次单独运行中选择「最佳」解决方案(每次运行对层级结构略有调整)。 苹果 许多小型竞争团队,每个团队都有自己的最小结构。 Alex使用了与微软相同的「最佳解决方案」方法,但进行了更多没有智能体层级的运行(每次运行有不同的转换)。 Oracle 有两个不同的团队,一个较大的「法律」二叉树和一个较小的工程树。 Alex将法律团队解释为,搜索代码库和检索关键上下文的智能体,而工程团队由实际编写代码的智能体组成。 两个团队的结构类似于亚马逊,顶层有一个单一智能体协调「法律」和「工程」之间的信息传递。 评估结果 为了评估SWE-bench上的每组patch,作者使用了SWE-bench evaluation。 结果如下: 组织结构图绩效分析 以下是作者对不同公司结构,如何影响性能的一些观察: - 有竞争力的团队增加成功机会。 表现最佳的两个(微软和苹果)都有多个团队在竞争解决问题,而其他公司似乎只有一个巨大的团队生成单一patch。 多个团队允许增加问题解决方法的多样性,提高解决问题的概率。 - 有单点故障的结构表现不佳。 提到单点故障,是指是那些有高层管理者/智能体可以完全改变运行结果的公司(如谷歌、亚马逊和甲骨文)。 在协调多个智能体之间的互动时,一个常见问题是某个智能体失败——导致可能出现一个智能体改变团队问题解决策略方向的情况。 具有单点故障的公司容易受到这些问题的影响。 另外,表现最好的两家公司,微软和苹果,恰好是世界上市值最大的两家科技公司。 事实证明,在现实世界中似乎最有效的组织结构对AI智能体也同样有效。 截图来自CompaniesMarketCap,2024年07月25日 对SWE-bench进展的思考 看着不同公司结构的结果,在这个Mini基准上是可以预料到的。 总的来说,似乎在一个像软件工程这样复杂的任务中,增加更多的智能体,或改变这些智能体的组织方式,只会带来边际性能的提高。 虽然论文More Agents Is All You Need 发现,准确率有相当大的提高(约20%),但在GSM8K(小学数学)测试中,30个智能体后性能明显趋于平缓。 研究还发现,过于复杂的任务(如SWE-bench中的任务)可能超出模型的推理能力,导致性能增益递减。 坐着在SIMA中同样验证了这一发现,最多只比基础架构提高了2-3%(使用40多个智能体)。 他预计,这种小幅提升在其他非多智能体架构中也会一致。 作者认为,若想在基准测试上取得更大进步,需要改变智能体的实际逻辑推理能力,或者它们可以采用(或被给予)的解决软件问题的策略和方法。 这可以通过更强大的基础模型(GPT-5)或给予智能体更广泛的工具来实现。 这与公司运作是一样的。 归根结底,如果你不雇用更聪明的员工,或给他们更好的资源,无论你如何组织他们或有多少人,他们的产出都不会提高。 不得不承认,13个实例的性能可能与完整基准测试的实际性能相差甚远。 仅在这个mini子集中的差异就足够显著,值得关注(从谷歌到苹果提高了约50%)。 基础模型/工具可能是智能体软件工程的限制因素,但随着基础模型的改进,探索智能体通信结构(无论是否在公司组织中)绝对应该被测试。 正如James Huckle所说,这个概念可能成为AI智能体设计中的「关键超参数」,不同的组织结构可能更适合不同的任务。
TrendForce:2024年AI SSD采购容量预计突破45EB,合约价一年涨超80%
IT之家 8 月 12 日消息,TrendForce 集邦咨询今日发布报告,由于 AI 需求大幅升温,最近两季 AI 服务器相关客户向供应商进一步要求加单 Enterprise SSD(企业级固态硬盘)。上游供应商为了满足 SSD 在 AI 应用上的供给,加速制程升级,开始规划推出 2YY 产品,预期于 2025 年量产。 报告显示,AI 服务器客户对供应商加单的情况,导致 Enterprise SSD 合约价于 2023 年第四季至 2024 年第三季间的累积涨幅超过 80%。SSD 在 AI 发展中扮演重要角色,除了在 AI 模型训练过程中,SSD 不仅负责储存模型参数,包含不断更新的权重和偏差,另一项重要应用是创建检查点 (check point),以定期保存 AI 模型训练进度,即使训练中断也能从特定点恢复。上述功能都相当依赖高速传输以及写入耐用度,因此客户主要选择使用 4TB / 8TB TLC(三层单元闪存) SSD 产品,以满足严苛的训练过程需求。 报告指出,随着更多生成信息是以影片或相片显示,其数据存储量也相应增加,因此,TLC / QLC(四层单元闪存) 16TB 以上等大容量 SSD 便成为 AI 推理主要采用的产品。 2024 年 AI 服务器 SSD 市场除了 16TB 以上产品需求自第二季大幅上升,随着 NVIDIA H100、H20 和 H200 等系列产品到货,相关客户进一步加大 TLC 4、8TB Enterprise SSD 订单需求。根据 TrendForce 集邦咨询预估,今年 AI 相关 SSD 采购容量将超过 45EB(IT之家注:1EB=1024PB≈104.8 万 TB),未来几年,AI 服务器有望推动 SSD 需求年增率平均超过 60%,而 AI SSD 需求在整个 NAND Flash(闪存)的占比有机会自 2024 年的 5%,上升至 2025 年的 9%。 在供给市场方面,由于推理服务器采用大容量 SSD 产品的趋势不变,供应商已开始加速升级制程,计划从 2025 年第一季起,量产 2YY / 3XX 层制程的产品,并推出 120TB 的 Enterprise SSD 产品。
AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图
赛博照妖镜下,AI美女全变鬼。 来看它的牙。 把图像饱和度拉满,AI人像的牙齿就会变得非常诡异,边界模糊不清。 整体图片的颜色也正常,麦克风部分更是奇怪。 对比真实人类照片,则应该是这样的。 牙齿是清晰的,图片色块都是均匀一致的。 这个工具已经开放,人人都能拿着照片去试试。 AI生成视频中的某一帧,也难逃此大法。 不漏牙的照片也会暴露问题。 不过BTW,这个工具出自Claude之手。用AI破解AI,奇妙的闭环。 有一说一,最近AI人像太逼真又引发了不小讨论,比如一组大火的“TED演讲者视频”,其实没有一个是真人。 不只是人脸难以区分,就连之前AI的短板——写字,现在都能完全以假乱真。 更关键的是,生成这样的AI人像,成本也不高。低至5分钟、每20秒1.5美元(人民币10块左右)的价格即可搞定。 这下网友们都坐不住了,纷纷搞起AI打假大赛。 近5千人来讨论,这两张图到底哪张是真人。 给出的理由五花八门。有人发现文字、花纹细节很抽象,有人则觉得人物眼神很空洞…… 最先进的AI们生成人像有啥规律,逐渐被大家摸索出来了。 不看细节已很难分辨 汇总来看,调整饱和度或许是目前最快速辨别的方法。 AI群像照在这种方法下暴露得更加彻底。 不过它存在一个问题。如果图像用JPEG算法压缩过后,该方法可能失效。 比如确定这张照片是真人照片。 但是由于画质压缩以及光线等问题,人物牙齿也有点模糊。 所以网友们还列出了更多分辨人像是否是AI合成的方法。 第一种方法,简单说就是依靠人类的知识判断。 由于AI学习图像的方式和人类并不一致,难免无法100%掌握人类视角下的视觉信息。 造成的结果就是,AI生成的图片常常包含与现实世界不符之处,这就为图像的鉴别提供了着手之处。 用开头的这张图片作为例子。 从整体上看,人物的皮肤过于光滑,看不到任何的毛孔,这种过于完美的特征反而增加了不真实感。 当然这种“不真实感”并不完全等同于“造假”,毕竟经过磨皮处理的图片同样看不到毛孔。 但这也并非唯一的判断因素,AI在图片中留下的与常识的出入也未必只有一处。 实际上,这张图只要稍微看以下细节,就能看到一个比较明显的特征——胸牌上方挂钩奇特的连接方式。 还有在高饱和度模式下露出破绽的麦克风,放大之后直接用肉眼也能看出端倪。 更为隐蔽的是,头发末端有几根毛发的位置很不合理,但这样的特征,恐怕要拥有列文虎克级别的视力才能看到了。 不过,随着生成技术的进步,能够找到的特征越来越隐蔽,也是一个无法避免的趋势。 还有一种方法是看文字,虽然AI在字型的刻画上正逐渐克服“鬼画符”的问题,但正确地渲染出有正确实际含义的文字还存在一些困难。 比如有网友发现,照片中的人佩戴的胸牌上,Google标志的下方最后一行字中的两个字母是“CA”,表示美国加州,前面的一大长串应该是城市名。 但实际上,加州根本没有名字如此之长的城市。 除了这些物体本身的细节,还有光线、阴影等信息也可以用来判断真伪。 这张图片是从一段视频当中提取的,在它所在的视频当中还有这样的一帧。 在话筒右侧的位置,有一片十分诡异的阴影,这片阴影对应的是人物的一只手,显然AI在这里处理得有所欠缺。 说到视频,由于涉及前后内容一致性,AI倒是比在静态图像中更容易露出鸡脚马脚。 还有一些特征不算“常识错误”,但也体现出了AI在生成图像时的一些偏好。 比如这四张图,都是AI合成的“普通人”(average people),有没有发现什么共同之处? 有网友表示,这四张图里的人,没有一个是笑脸,这点似乎就体现了AI生图的某种特征。 针对这几张图而言确实如此,但这样的判断方式很难形成系统,毕竟不同的AI绘图工具,特点也都不尽相同。 总之,为了应对逐渐进步的AI,一方面可以加大“列文虎克”的力度,一方面还可以引入像拉高饱和度这样的图像处理技术。 但如果这样的“量变”积累得越来越多,肉眼判断也会越来越困难,图像饱和度可能也有被AI攻破的一天。 所以人们也在转变思路,想到了“以模制模”的方法,用AI生成的图片训练检测模型,从图像中分析更多特征。 比如AI生成的图像在频谱、噪声分布等方面存在许多特点,这些特点依靠肉眼无法捕捉,但AI却能看得很清楚。 当然,也不排除检测方法落后、跟不上模型变化,甚至模型开发者专门进行对抗性开发的可能。 比如前文一直在讨论的这张图片,某AI检测工具认为它是AI合成的概率只有2%。 但AI造假和AI检测之间的博弈过程,本身就是一场“猫鼠游戏”。 所以在检测之外,可能还需要模型的开发者也负起一些责任,例如给AI生成的图片打上隐形水印,让AI造假无处遁形。 AI魔高一尺 值得一提的是,如上引发恐慌的AI人像,不少都是由最近爆火的Flux生成/参与制作。 甚至大家已经开始默认,效果太好难以分辨的,就是Flux做的。 它由Stable Diffusion原班人马打造,发布才10天就在网络上掀起轩然大波。 这些精美的假TED演讲照片,都是出自它手。 还有人用Flux和Gen-3一起做出了精美的护肤品广告。 以及多角度的各种合成效果。 它很好解决了AI画手、AI生成图片中文字等问题。 这直接导致现在人类区分AI画图,不能再直接看手和文字了,只能盯着蛛丝马迹猜。 Flux应该是在手部、文字等指标上加强了训练。 这也意味着,如果当下的AI继续在纹理细节、色彩等方面下功夫训练,等到下一代AI画图模型出来时,人类的辨认方法可能又要失效了…… 而且Flux还是开源、笔记本电脑上可运行的。不少人现在已经在Forget Midjourney了。 从Stable Diffusion到Flux,用了2年。 从“威尔史密斯吃面条”到“Tedx演讲者”,用了1年。 真不知道以后为了分辨AI生成,人类得想出哪些歪招了……
苹果被曝正开发 AI 智能眼镜,便宜版 Vision Pro 或将明年推出
Vision Pro 已经开售半年,尽管市场反响并未像 iPhone 发售时那么热烈,但苹果的 Vision Pro 团队仍在多管齐下地开发一系列新产品——目前已经被曝出来的有三款。 根据彭博社 Mark Gurman 的爆料,苹果 Vision 团队正在继续试验几种不同的穿戴式 VR/AR 眼镜产品,其中包括更平价的 Apple Vision 头显,第二代 Apple Vision Pro,以及一款类似 Ray Ban Meta 的智能眼镜。 自苹果在去年 WWDC 2023 亮相之后,Apple Vision Pro 凭借突破性的空间计算能力和沉浸式体验,迅速吸引了业界和用户的广泛关注。 可尽管技术上令人印象深刻,但其过高的价格却令很多人望而却步,发布一年来无论口碑还是销量仍然出现了高开低走的态势。 根据 IDC 最新数据显示,Apple Vision Pro 仅在发售时引发短暂热潮,但购买热情未达预期,单季度的销量均未达到 10 万台,今年第三季度在美销量与第二季度相比或将下降 75%。 不过苹果方面并未受到 Vision Pro 销量放缓的影响,负责头显设备的 Vision Products Group 事业群依然在探索不同的产品。 其中平价版 Vision Pro「最早可能在明年推出」,此前 The Information 曾报道苹果从 2022 年开始,就在计划开发一款内部代号 Project Alaska、标识为「N109」的平价头显。 它保持了 Vision Pro 的高分辨率显示屏及外观,手势 + 眼动追踪的互动方式也不会有太大差别,但重量也会有所减轻,价格也将会是现在 Vision Pro 的一半,有望被更多人接受,进而成为扩展 Vision Pro 生态的新机遇。 苹果公司据称还在开发第二代 Apple Vision Pro,或将于 2026 年正式发布。 此前曾有韩国媒体 Sisa Journal 报道,三星和 LG 已经采用串联 OLED 技术制作出 micro-OLED 显示屏的原型。而 Vision Pro 使用的正是 micro-OLED 技术,正如他们所说——「为 Apple Vision Pro 设备未来型号采用该技术铺平了道路」。 苹果在此前发布的 iPad Pro 就已经使用了这项串联 OLED 显示技术,将两个发光层堆叠在一起,与单层 OLED 相比能够有效提高亮度、功效,延长使用寿命,带来更好的沉浸感。 不过,Mark Gurman 还是表达了对 Apple Vision Pro 的前途的担忧: 重点是什么?这类设备尚未吸引消费者的想象力,而且很难说什么时候会发生。如果更便宜的型号不低于 1,500 美元,那么 Vision 设备可能仍然是小众产品。 另一方面,Mark Gurman 表示苹果团队在试验没有配备显示屏的智能眼镜,类似 Meta 与雷朋合作推出的智能眼镜。 这款产品的用户主要通过自带的摄像头及 AI 大模型加持的语音助手进行互动。 ▲ 图为 Ray Ban 眼镜 今年 5 月,苹果就曾申请过一项专利,据称具有三重显示系统、精准定位、个性化的服务与交互等特点,利用了「主辅双屏幕+LED 阵列」设计,使其具有三重显示功能: 主显示器以高分辨率占据用户主要视野,用于浏览图片、观看视频以及进行复杂的交互操作; 辅助显示器分辨率较低,负责初步展示虚拟对象,并可以在用户需要与特定对象进行深入交互时,由主显示器接管; 第三级显示器以 LED 阵列形式围绕眼镜内框,提供基本的提醒和指示功能,并能根据应用场景变换颜色与闪烁模式。 值得注意的是,苹果在智能眼镜领域的探索并非孤军奋战,Google、三星、Meta、HTC、华为、高通等巨头目前都已入场。市场已存在如 Meta 雷朋等智能眼镜产品,它们以轻量化设计、语音助手功能和 AI 辅助查询为特点,而且价格更低。 不久前 Meta 也被被曝在申请一项涉及 AR 眼镜的新专利,内置多个高清摄像头、麦克风、加速度计等传感器,还能接收来自「智能手杖」、假肢或手套的手势及触觉反馈,建立多维度感知网络,并利用机器学习、预训练的 AI Agent 等技术进一步增强用户的感知能力。 而这与 Vision Pro 在交互上有许多相似之处,颇有些「抢占先机」的意味: 这一系列技术的深度融合,将为用户带来前所未有的多元化输出体验。无论是轻松阅读路边的指示牌,还是精准感知空间的深度与广度,乃至即时识别环境中的特定对象,都将成为可能。 此前在扎克伯格和黄仁勋的对谈中也曾提到,全系眼镜离我们不会遥远。Omdia 也曾预测,到 2028 年,XR 设备出货量将会达到 1.39 亿台,作为下一代互联网的关键入口,空间计算设备俨然已经日渐成为「兵家必争之地」。 价格更亲民的平价版 Vision Pro 和苹果智能眼镜,会是苹果空间计算战役的转折点吗?
瞄准AMD?英特尔显卡要靠“性价比”杀出一条血路
就如今这显卡市场,当真是个喜忧参半的局面。 老黄这边,放在二十年前,或许连他自己都想不到,自家的显卡能在游戏外的领域这么受欢迎。 延续了十年有余的矿潮,将从GTX10系列到RTX30系列的显卡全部卷入其中,甚至一度被认为是游戏玩家救星的LHR(锁算力)显卡也同样被饥渴的矿工们破解,沦为矿场中的工具;而在挖矿的浪潮过后,这大模型的需求马上就跟上了,这也使得英伟达的显卡近年来一直都处于一种供不应求的情况。 (图片来源:英伟达) 至于苏妈这边,情况就显然没有这么好过了。 7月30日盘后,芯片/显卡制造商美国超微公司(AMD.US)公布了截至6月30日止的2024年二季度财报。公司游戏板块2Q24实现收入为6.48亿美元,同比下降59%;营业利润0.8亿美元,同比下降66%。考虑到AMD停止高端显卡产品线的发布,预计未来一段时间内游戏业务还会持续下滑。 这下苏妈背后的冷汗,怕是止不住了。 (图片来源:AMD) 到这里,有的读者可能问了:“不是,小雷,那英特尔呢?” 作为目前市面上仅有的第三家显卡厂商,英特尔在入局后确实显得十分低调,没有持续推出新品进入市场,而是专注于在驱动层面持续优化显卡在游戏上的表现,希望将显卡打造为一个重要突破口。 当然,新品还是要有的。 根据外网科技媒体WccFtech近日发布的博文,有人在最新GFX DRM日志文件中发现了一款新的英特尔Arc Battlemage显卡,正式确认了英特尔第二代独立显卡的Xe2核心数量等关键规格。 只不过,在霸主英伟达面前,英特尔的显卡能吸引到多少游戏玩家呢? 参数亮眼的新产品 掐指一算,英特尔入局独立显卡市场也有快两年时间了。 在这两年里,英特尔先后发布了A380、A770、A750和A580四张显卡,其中最贵的A770 16GB版本价格也就在2500元左右,最亲民的A380 6GB版本现在更是卖到了729元左右,基本上是市面上流通的显卡里最便宜的一批。 通过在中低端市场细分领域的耕耘,英特尔曾经一度在2022年底逼近过AMD的出货量,但是随后却因为把注意力放在驱动优化上,产品迭代缓慢导致出货量快速下滑,到今年一季度甚至已经来到了1%的新低位。 那么问题来了,新的英特尔Arc Battlemage显卡升级了什么呢? (图片来源:videocardz) 老规矩,先让我们看看videocardz汇总的曝光表格。 从表格上看,这次曝光的显卡应该是位于产品线中端的Arc B5XX显卡,预计将配备BMG-G21型GPU核心,包含14个Xe单元(最高可达16个Xe单元),由Intel的Battlemage架构提供支持。 与前代的Xe(Alchemist)系列相比,全新的Battlemage架构不仅会带来光线追踪性能的改进,还有更宽的显存位宽以及更快的显存速率,预计能够带来超1.5倍的理论性能提升。 (图片来源:Intel-GFX boot up) 在此基础上,ARC B5XX将会用上12GB GDDR6显存模块,相较于前代的,理论上显存速度能提升到19Gbps,不过显存位宽仅有192bit,这意味着它将提供456GB/s的带宽,而上一代ARC A7系列中最高带宽为512GB/s。 考虑到这张卡的定位,只有这么一点提升倒也正常。 至于显卡频率,根据这次流出的后台信息显示,该芯片的额定频率有两种,分别是1500MHz和1800MHz,这应该是ARC B5XX显卡的基础频率和加速频率,整体较低的主频和这张显卡的定位也很契合。 最后,基于这张显卡的显存配置、核心数量和峰值功耗,结合同样使用Xe2核心的Ultra系列核显跑分来看,预计这张显卡的TimeSpy图形分应该会落在9000分左右,和前代中端卡A580的分数类似,但是更精简的配置应该会相对省电不少,这也让英特尔可以在价格上大做文章。 为市场注入活力 不得不承认,对消费级市场来说,「显卡皇帝」的宝座已经被英伟达把持很多年了。 哪怕现在跑到大学里头,随便掀开一个主流玩家的PC盖板,里面塞着的八成是RTX 30/40系光追显卡,最多两成是号称自己根本不玩光追游戏的AMD用户,只有寥寥无几的玩家会用英特尔ARC显卡。 在这种情况下,难免会有人发出这样的疑问: “都已经这样了,英特尔再推出自己的显卡到底还有什么意义呢?” 别说,意义肯定是有的,在我看来,英特尔显卡的出现确实给显卡市场带来了新鲜的活力。 从显卡的大环境来看,主流玩家在挑选显卡时会考虑的因素无非就三个,到手价格、性能释放和售后服务。 没错,在老黄看不上「甜点级」显卡带来的微薄利润后,显卡价格持续走高已经是无须争辩的事实,除了原地踏步的RTX 4060系列外,正经一点的RTX 4070系列已经来到了4000元起售的水平。 (图片来源:英伟达) 然而,经过身边统计学调查,目前占据PC市场里一大部分份额的轻度用户,他们购买显卡的预算往往只有2000元左右。 这也导致,时至今日,如果拿每月Steam硬件调查榜单做参考,你会发现不仅有GTX 1060、GTX 1650等多年前入门卡长期牢居榜单前三,就连英特尔的Xe核显和UHD核显也能在前二十待着。 (图片来源:steam) 换言之,很多用户对显卡性能真没那么高需求,主打的就是一个便宜实惠。 问题是,在这个市场里,想买到一张便宜实惠的显卡并没有想象中那么简单。 作为我们熟知的两大厂商,如今的英伟达已经全身心投入到AI市场中,而AMD则出现了在独显市场摆烂的现象,低价位的新品显卡严重缺乏,这难免会让游戏玩家们尤其是轻度玩家有些不满。 在我看来,英特尔的打法其实已经很明朗了,那就是延续前代产品的性价比路线,给予轻度用户在2000元左右价位段的全新选择——一个或许游戏性能还在持续提升中,但在视频编解码这块甚至有一定的优势的新选择。 根据WccFtech早前的泄露消息表明,英特尔计划在2024年秋季之前发布其下一代GPU以赶上假日购物季,这意味着英特尔第二代GPU将比英伟达RTX 50系列显卡更早上市。 想要在英伟达的重压下觅得一线生机,英特尔就必须抓住新品上市前的这个空窗期。 (图片来源:英特尔) 当然,英特尔不会把显卡业务的未来全部赌在消费者身上。 事实上,他们还在上周发布了第一块车载独立显卡A760-A ,用于智能座舱系统,算力达到229TOPS,拥有16GB大容量显存,它的性能可以支持4K分辨率、3A游戏级别的渲染、在本地部署14B以上规模的大模型。 在大模型上车的这股风口中,英特尔希望通过将独立显卡带入汽车行业,让汽车获得运行大语言模型的能力,更要让用户在车里体验到和家里一样的PC游戏体验,凭借自己在AI领域的积累打赢一次翻身仗。 在新的大机会面前,英特尔不容有失。
iOS 18 大改的新相册,为什么遭嫌弃?
要说 iOS 18 中改动最彻底的部分,那可能非「照片」应用莫属。 但这个大改的用户满意度,或许并没能达到苹果的预期。 在社交媒体上键入「iOS 18 相册」等关键字,就会发现前两个联想为「怎么用回以前的排版」和「难用」,而下面则全是询问某某功能和某某相册在哪。 看来,这个本意是给用户呈现更多美好回忆的新照片应用,正在创造更多糟心的体验。 并不简单的新设计 随着照片 app 的功能越来越多,照片 app 的体积也在增加。所以我们创造了一个基于深度智能的简单、流线型的单一视图照片体验,旨在移除使用中的阻塞感。 关于新照片应用设计的出发点,苹果高级人机界面设计团队的总监 Billy Sorrentino 这么表示。 具体来说,苹果将旧版的 4 个不同的页面合并在一起,把曾经分属于「为你推荐」和「相簿」标签中的所有内容,塞在了图库的下方,用户要找什么主题和类型的相簿,就只能不断往下滑。 而以下的几个改变和功能,或许就是苹果眼中的「简单、流线型」。 首先,在图库中,全新的筛选功能可以直接显示特定的媒体类型,例如截图、视频、自拍等等,而不需要像以前那样点击相簿页面寻找媒体类型,还能把截图从图库里筛去。 然后是图库左右滑动的「轮播」,用户可以在上面固定自己更喜欢的相册,例如收藏和旅途,这样就不用往下滑动寻找了。 而在图库下方的各种相簿和主题,则支持自定义,用户可以选择板块进行显示,也能排序这些板块。 听着好像很自定义很利好用户,但是几乎被全网吐槽的情况说明了一切。 首先,所有板块都堆在图库的下方,导致单一页面显示的内容过于臃肿。新的 UI 需要用户不断往下划动,整个过程对用户来说几乎是未知的,用户不知道究竟还要划多久,才能划到自己想要的板块。 每个板块还显示着预览图,整个页面因此像一个长长的清单,想找什么很难一步到位。 板块顺序自定义或许能解决一部分问题,但用户未必会记得自己设置的顺序,很多不常用的板块,在需要用起来的时候,又让寻找变得充满未知。 在图库部分水平划动而出现的轮播功能,不仅与下面的「固定的相册」功能有点重叠,在图库区域左右划动的交互也不太直观,有时候用户不小心滑进了轮播中的其他板块,未必知道要怎么返回主图库。 「好看」了,难用了 2002 年,乔布斯在 MacWorld 活动中正式发布了照片管理程序「iPhoto」,可以让用户一键导出相机中的照片,形成一个易于管理的图片资料库。 更加梦幻的是,用户轻点鼠标,就能制作出配上 BGM 的照片艺术幻灯片,甚至只要把排版做好,苹果还能给你打印出一个实体的相册。 当时,产品经理 John Santoro 表示,iPhoto 的目的是让所有人成为图书出版商,用相簿去诉说自己的故事。 时过境迁,iPhotos 和苹果的照片打印服务都已经成为「时代的眼泪」,但是苹果从来没有放弃用「照片」来讲故事这个理念。 只是,「出版商」从用户变成了设备本身。现在的 iCloud 图库,不仅能自动按基础的时空间信息归类好照片,还能根据主题智能生成「回忆」,为你精选美图,替你述说故事,还配好 BGM,照片应用越来越像一本个人风格浓厚的「杂志」。 ▲ 图源:Apple Insider 这些功能在 iOS 10 就有了雏形,但随着 iOS 14 支持桌面小组件,其价值得以进一步体现。 可以轮换显示「回忆」和「精选照片」的照片组件,就像是真的在现实世界摆放了一个会呈现各种照片的魔法相框,当你偶尔看到它精选的那些美好瞬间时,总忍不住点开仔细回味。 ▲ 图源:Apple 我和身边不少 iPhone 用户选择在桌面上放置照片小组件,甚至还有从不使用 iCloud 图库的小伙伴,为了这个小组件和精选照片功能购买云端存储空间。 而 iOS 18 新照片应用给我的感觉,就像是把小组件塞入到了图库之中,目光所及都是幻灯片。 像是媒体类型这种「硬分类」,如果不进行自定义,都位于类似「回忆」、「人物」、「精选照片」板块的下方。 也就是说,新照片 App 中属于「创作工具」的功能和板块,都被精简化、边缘化,属于「内容观看」的功能成为了主角。 这么说可能还是有点抽象,举一个例子可能就非常明白了:抖音。 一打开抖音,90% 的界面都是视频画面,就算是点开账户界面,下方的视频预览画面也占了大头,而创作工具的入口则被最小化成一个「+」号,藏在了二级页面。这和抖音作为内容消费的平台,而不是一个创作者工具的定位一致。 而点开 iOS 18 新的相簿板块,你会发现有一个占据了过半空间的预览窗口,循环播放着相簿中的内容,大大降低了相簿点开时的照片密度。而且想要快速筛选照片,你需要把注意力从这个大窗口重新集中到下方小预览图。 而且每个相簿中的小预览图排列默认会以不同尺寸的照片显示,本意是想凸显出更精美的照片,先不说苹果这个自动挑选眼光如何,在需要进行多张照片快速筛选时,这种「好心」反倒成了干扰。 并且,以前的标签页模式,能够让用户快速在「图库」和「相簿」中往返操作,而现在两者都在一个界面之中,往返变得非常困难。 图库中「日」视图与「最近项目」合并成的「最近的日子」也是一个吐槽的重灾区。这个新的板块,没有「最近项目」那么便于大批量管理照片,前几个测试版还不会显示用户在外部修好导出的照片。 从 iPhotos 到 iOS 18 新照片,苹果的相册应用还是充满着人文感,用各种方式为用户呈现美好的回忆和记忆。 只是二十年间,用户与相机、相册的关系早已发生翻天覆地的变化。当今的社交媒体时代,人人都是创作者,人人都能用手机进行创作。 iPhone ,特别是 Pro 系列,也在向成为专业创作工具而努力。即使不是专业的摄影发烧友和自媒体,普通用户用 iPhone 拍 VLOG、照片的情况也非常普遍。 ▲ 有不少歌手都用 iPhone 来拍 MV 对不少人来说,快速管理、筛选出可用的素材,然后进行多个平台的分发,比照片应用会自动生成幻灯片要更刚需、更重要。 传统相册只能自赏,而现在我们更愿意把美好的事物和他人分享。iOS 18 这个新照片应用,并没有捕捉到这种时代脉搏。 工具和人文的平衡点 上面一通吐槽过后,可能会有的小伙伴觉得有点太「唯工具论」,缺乏温度,似乎和苹果新照片应用的人文初衷背道而驰。 其实我并不反对这些精选照片、回忆的功能,甚至觉得它们非常有意思,我相信不少觉得 iOS 18 照片难用的小伙伴也有同感。 苹果 CEO 蒂姆·库克说,不少消费者在试用 Vision Pro 头显的时候,总会被「空间照片」这个功能所触动。当看到已经不在身边的亲人照片,以一种栩栩如生的形式再现,使用者的双眼总会充盈泪水。 而 iOS 18 的「照片」虽然不能实现 Vision Pro 空间计算的效果,但能够整理好你和亲朋好友的温馨合照,等待有一天被发掘重温。 ▲回忆满满的一次远足 智能照片精选本身不是原罪,问题是这些功能挤占了照片应用界面的大量空间,并变更了原本效率为主的操作逻辑,和用户真正的需求发生错位。 别忘了,苹果大改照片应用的一个本意,也是为了能让用户更好管理日益庞大的照片图库。 像是增强的搜索功能则可以说「方向对了」,不仅搜图更准确,还开始能搜视频;同样好用的筛选功能则能够快速把截图直接从图库中筛走,不仅让图库看起来更赏心悦目,还能单独筛选「已编辑」的素材,利好创作者。 经过几个测试版本迭代,苹果也开始「迷途知返」,删掉了其中一个大槽点「轮播」功能;新的图库中也能显示外部保存的图片,有点改了回去,但也算是众望所归。 或许在不断调整中,苹果最终能找到那个「工具」和「人文」的平衡点,让照片应用成为一个「中转站」——用户既能在其中重温过往美好,也能更好地创造美好。
中国具身智能“顶流”群聊!20多位产学大牛暴风输出,给突破方向和难题划重点
作者 | 程茜 编辑 | 心缘 智东西8月12日报道,上周,2024科技创变者大会上,汇聚多位具身智能行业顶尖科学家、知名明星创业者、头部重磅玩家负责人,围绕着当下具身智能产业的新技术、新趋势、新场景进行了深入剖析。 北京智源人工智能研究院理事长、北大多媒体信息处理国家重点实验室主任黄铁军,华中科大机械科学与工程学院副院长、国家数控系统工程技术研究中心副主任彭芳瑜,北航机器人研究所名誉所长、中关村智友研究院院长王田苗同台,拆解了当下人形机器人的技术突破点。其中,具身智能在大脑、小脑、空间智能、肢体与上游核心部件是目前研究的热门话题,大脑层面探索专业化、多模态的轻量化模型成为一大趋势。同时,真正的智能需要实体与环境互动,从中学习进化,这也是为什么当下具身智能被认为是通往AGI(通用人工智能)的重要路径。 腾讯、宇树科技、灵心巧手、梅卡曼德等身处具身智能产业链上中下游的玩家,从机器人本体、算法、灵巧手等维度阐释了为什么具身智能是通往AGI的最佳路径之一。此前在工业场景中应用的机器人通过预编程完成操作属于零智能,只有自主学习、根据复杂任务处理问题才能实现真正智能。 更有科大讯飞、小米、富士康、银河通用、清华大学、北京大学等产学研届代表同台进行巅峰对话,从具身智能的技术发展现状与瓶颈谈到未来的潜在应用场景。具身智能比较被看好的几大场景为军工、国防等高价值场景、物流场景,如果市场规模达到上亿台级别,将会出现在To C市场。 一、智源研究院黄铁军:现在的大模型是真正智能,北大团队已开源SpikeCV脉冲视觉算法 北京智源人工智能研究院理事长、北大多媒体信息处理国家重点实验室主任黄铁军谈道,历史上符号主义、连接主义、行为主义三种流派不停争论。 让人把智能描述出来变为算法,再让机器人去执行,这种没有智能的机器就是符号主义。当下真正发挥作用的就是第二个连接主义,让神经网络训练自己学习。第三个重要的行为主义目前研究较少,真正的智能来自于实体和环境的互动过程。 他认为,今天的大模型是真正智能的,神经网络架构就是在尝试计算Token和其他所有词的可能关系,当输入语料足够多时,它就能迭代出这些节点之间的连接关系。 具身智能是一个完整的具有独立感知运动能力的智能系统,目前用大模型的技术路线训练一个运动控制模型控制身体是一个比较热门的话题。 黄铁军称,现在关于具身智能的眼睛研究并不多,摄像头并不是眼睛,其只是图像采集的传统方式。人的大脑是脉冲神经网络,眼球背后有100万根神经纤维,每一根上传输的就是神经脉冲序列信号,将光的序列变成生理上的脉冲序列。 北大发明了脉冲连续摄影原理,使得脉冲相机每个像素独立工作,可以实现超高速连续成像,即使对着太阳也能拍摄,在晃动情况下也可以清晰成像,不会被机器人移动影响。SpikeCV脉冲视觉算法已免费开源。 目前大模型表现出的是静态的智能涌现,不是机器人实时感知所需要的动态生产信息的表达和处理过程,因此,黄铁军认为,这一领域未来20年肯定会继续发展。 二、华中科大彭芳瑜:机电系统与生命系统深度融合,拆解6大关键技术趋势 华中科大机械科学与工程学院副院长、国家数控系统工程技术研究中心副主任彭芳瑜谈道,当下大模型的发展为机器人带来了机电系统和生命系统的深度融合。 人形机器人未来可能的使用场景可能包括面向特种环境应用、危险场景作业,打造特种应用场景下的高可靠机器人;在医疗领域用来做康复步态训练、陪护过程中的语义识别、情绪识别等,还有微创手术机器人基于术前的影像检查、三维空间的准确定位能力来引导医生的手术操作。 彭芳瑜认为,未来在制造业将会呈现出无处不在的机器人、无处不在的传感、无处不在的智能的新范式。 人形机器人关键技术趋势包括体能、技能、智能三大方面,其中涉及到骨骼、肌肉、下肢、上肢、大脑、神经系统不同维度。 关键技术一就是骨骼的机构与结构,技术趋势要解决轻量化,伴随着3D打印等新的技术出现,未来有望实现结构、功能、材料的高性能一体化设计。 第二个是肌肉,其核心部件包括电驱动关节、功能结构一体化液压缸、动力单元、阵列技术等。目前在肌肉核心部组件,国内采用新结构、新原理开展核心部组件进行颠覆性设计的研究团队、公司较少。 第三个是下肢,也就是动力学、强化学习,国内对端到端控制的重视程度不够。 第四个上肢主要是机械臂、灵巧手,上肢目前已经可以实现拿鸡蛋、弹钢琴,但在工程应用中主要用于替代组装工程的人,需要有两条机械臂,10个手指头,会涉及到灵巧手的设计、视觉柔性传感、抓取策略等。 最后是大脑和神经系统的感知和融合,如何实现视觉智慧感知会呈现出新的问题。 人形机器人的未来市场规模可观,下游的核心零部件厂商正逐步实现技术突破和产能提升,这对于未来人形机器人实现低成本、高可靠走进场景落地至关重要。 三、智友研究院院长王田苗:梳理4大具身智能研究热点,大模型反转小模型成趋势 机器人是物理空间的实体工具,具身智能从智能系统的角度来看,就是让物理实体与环境实现交互,通过学习推理所表现出来的泛化和适应环境的能力。具身智能就是AI+机器人构造的不可替代的工具。 北航机器人研究所名誉所长、中关村智友研究院院长王田苗谈道,目前具身智能创新研究的热点包括:大脑、小脑、空间智能、肢体与上游核心部件。其中大脑涉及到通用机器人大模型、数据模拟器、数据制造工厂、端到端算力芯片;小脑包括运动、空间智能、视觉识别获取建模理解能力;肢体相关的核心零部件研究等。 中国举国体制在组织、创新、创业孵化投资中的逻辑有两个明显的动态趋势,其中之一就是供应链依然在进化。王田苗谈道,其中包括性能与成本是基于底层创新设计出来的、工业机器人在进化、人形机器人机构与供应链有待进化、全电驱动的核心部件供应链正在进化。 此外,大模型自然语言交互能力强、泛化能力强,但视觉空间的理解能力有限,这导致其在操作的实施性和安全性、灵巧操作能力上较弱。今年大模型反卷小模型,研究人员去探索专业化、多模态的轻量化模型成为一种趋势。 人形机器人的场景还没有形成,但价格已经卷起来了。王田苗认为,一方面,颠覆性技术发生时需要泡沫,能带来各种资源投入从而加速成果转化、产品应用;另一方面,没有丰富资源的创业者应该死磕聚焦细分领域的应用,其他有丰富资源平台的创业者可以积极实现突破,并高度警惕之后没有项目投资时,该如何积累竞争优势。 具身智能的场景应用方面,他主要考虑了两大维度:痛点和成熟度、难度和规模。痛点和成熟度上商用和工业最快;难度和规模维度上,打磨、抛光、焊接、搬运等工作可以利用小模型就拥有很强的商业前景,商业前景到达L3、L4需要和大厂紧密合作。 四、腾讯张正友:真正的智能需要自主学习,提出层次化具身智能系统 腾讯首席科学家、腾讯Robotics X实验室主任张正友首先用一个函数关系表示了生成式AI,即输入X经过生成输出Y,中间的模型现在基本上都是Transformer,输入和输出的格式往往是文本、图像、音视频。 机器人的生成式AI中,输入和输出的方式更为复杂,如下图所示,其可以分别给定3D环境、本体状态、任务,输出电机力矩、子任务序列、答案等。 最初生产线上的机器人是在固定环境内完成一系列动作,是零智能;大模型时代有人认为将大模型放到机器人身上就能实现具身智能,现在相当于把20岁大脑放在3岁的身体上,因为机器人的部分操作能力仍相对较弱;真正的智能需要自主学习和处理问题,并对环境变化自动调整规划。 因此他认为,具身智能是通往AGI非常重要的过程。 具身智能通过类人的感知方式,如听觉、视觉等获取知识,并抽象成一种表达与语义来理解世界。当下,具身智能面临的挑战包括复杂的感知能力、强大的执行能力、学习能力、自适应能力、高效的多能力协作和融合、数据稀缺性和隐私保护、安全性和可靠性、社会伦理问题。要实现智能和本体有机融合,才能让机器人在环境交互中实现真正的智能。 张正友2018年就提出了A2G理论,其中ABC构成了基础能力层,D、E、F是机器人与物理世界的交互,在与环境的交流中提升能力、进行深度陪伴和沟通、灵活抓取等,G是让传感器和机器人信息互通。 他将自主机器人有两类,为反应式的自主和有意识的自主。具身智能的实现需要改变控制范式,传统范式是感知、计划、行动。 他提到了另一个S(感知)L(学习)A(行动)P(计划)范式,让机器人实现感知和行动紧密相连,实时应对不断变化的环境,让学习渗透到各个模块。 腾讯机器人研究院研发了层次化的具身智能系统,分成三个层次,最下面一层是Proprioception,是机器人对自身的感知状况和控制,第二层是Exteroception,对环境的感知,让机器人知道需要调用什么能力完成任务,最上面一层是Strategic Level planner,让机器人针对特定任务和环境做好规划并解决问题。 基于这一层次化的具身智能系统,每一个层级的知识都可以持续更新和积累,层级之间解耦,更新某个层级基本不会影响其他层级已有的知识。 六、视觉、灵巧手……核心零部件厂商群雄逐鹿 产业链中的灵巧手、视觉感知系统等玩家也是加速具身智能产业的关键一环。 1、灵心巧手周永:灵巧手需要超20个自由度,才能完全映射人类动作 灵心巧手联合创始人、CTO周永谈道,日常生活中的“灵巧操作”将成为具身智能时代真正到来的标志。具身智能下一步方向是多模态感知和交互算法,算法落地需要多模态感知能力的灵巧手。 在语言模型中很难感知到物品的纹理、密度、摩擦力等,需要视觉和触觉补充。因此具身智能下一代的灵巧手,需要满足高自由度、多传感器、结合落地场景的足够多数据,实现这三个方面才能为实现具身智能提供动力。 在自由度方面,目前人形机器人手部的自由度在6个左右,周永认为需要达到20个以上的自由度才能完全映射人类动作,多传感器需要能够感知到位、力、触、摸。 2、梅卡曼德邵天兰:多模态大模型可帮助机器人理解指令,AI应用或带来超3亿收入 梅卡曼德是以AI+3D视觉为核心的公司,该公司打造的多模态大模型MechGPT可以让机器人能理解自然语言指令,并综合视觉、图纸等多模态信息进行推理决策,智能决定如何完成任务,并且其应用不局限于某一种机器人,可为人形、服务、协作及工业机器人在内的各种机器人提供服务。 梅卡曼德创始人兼CEO邵天兰称,AI对机器人的重要性在于,他们在大量业务实践中可以通过AI解决复杂多变、不容易用规则解决的问题,今年预计有3、4亿的收入。 智能机器人批量落地面临的挑战包括,其技术链条长、很多技术仍在高速演进,但客户的要求很高。在这样的背景下,梅卡曼德的经验就是专注在传感、感知、规划领域,并且联合生态合作伙伴,最后形成技术产品业务和资本的正向循环。 3、伟景智能董霄剑:具身智能靠智能体不断成长,只有立体视觉能提供环境感知 伟景智能创始人、CEO董霄剑谈道,具身智能整个的过程是“机器-人-智能体”之间的持续学习过程,充足的传感器是机器学习的基础,所有的学习不仅是互联网上的数字样本,还需要场景的数据。具身智能是渐进化的学习过程,视觉、触觉、惯性、距离传感器等,将数据经过有用的筛选,成为智能体的一部分。 对于智能体而言,它需要收集听觉、视觉、触觉等,输出就是声音、操作、感知、运动、决策。因此他认为,具身智能的核心就是智能体的不断成长。 人形机器人重要的传感器就是视觉,而且是立体、彩色、可记忆、可逐渐深化的。他认为,只有立体数据才能为机器人提供环境的视觉感知,提供操作感知和引导。伟景智能的新一代人形机器人安装了4对立体视觉系统,可以基于所有的实际应用场景做适配。 五、具身智能是AI产业发展主流方向,跨学科交叉是研究主线 上午场最后,北京邮电大学教授方斌与清华大学教授刘华平,北京航空航天大学机械学院副教授、博士生导师陶永,浙江大学控制科学与工程学院长聘副教授高飞,北京大学助理教授、北大银河通用具身智能联合实验室主任王鹤,北大人机融合实验室智能中心主任、研究员阮乐成围绕“沸腾中的具身智能:颠覆、瓶颈与技术野望”进行了交流。 具身智能这一概念在近两年被谈论的十分火热,刘华平谈道,具身智能的火爆和AI的突破密切相关,从某种意义上讲,这些技术辐射到了机器人、自动化领域,让其再次进入人们的视野。 具身智能的爆发涉及到跨学科交叉,高飞认为,机器人本身是集电子、机械、控制等学科的交叉,具身智能是AI和传统机器人的交叉,好的成果一定需要跨学科的交叉,坚持学科交叉、多角度融合是一条主线。 对于通用机器人而言,王鹤称,通用是机器人行业的一个变革点,通用机器人可以应用于柔性更高、和人更好交互的场景。同时,周围的环境是专为人的身体设计的,通用机器人和人的身体形态保持一致,这也是人形机器人发展的一大原因。 面向当下投入具身智能的年轻研究学者,陶永给了亮点建议,首先要了解国际前沿、发展热点,其次要找准自己研究的定位,如多模态的融合、技能的学习和迁移等更为具体的研究方向。 当下,中美之间具身智能研发都处于探索阶段,阮乐成提到其中有较大的不同点为国内具身智能企业都是背靠学术机构,美国的企业多为纯公司形态。他认为应该将产学研结合混合推进研发落地。 关于具身智能是AI产业发展的主流方向,4位嘉宾都达成了共识,将从技术的突破、应用场景落地、多行业模块的融合发展、安全伦理等方向发展。 六、具身智能超级场景:上亿台市场规模一定是To C 下午场最后,国家自然基金委高技术中心研究员、科技部专业技术二级专家刘进长与清华大学自动化系研究员、机器人控制实验室主任、加速进化首席科学家赵明国,科大讯飞机器人首席科学家季超,小米手机部副总裁、小米机器人事业部总经理许多,富士康科技集团首席数字官、云智汇CEO史喆围绕“寻找超级场景:具身智能用在何处?”进行了对话。 赵明国首先区分了具身智能和人形机器人的概念,他称,具身智能是基础概念,人形机器人是产品概念,人形机器人是具身智能的载体,恰好这两者是当下业界最认可的交集。 许多还提到,人形机器人在强化学习的加持下会实现移动自由,具身智能某种程度实现了交互的自由,移动自由+交互自由使得具身融合成为可能;此外人形更能引起公众关注,这也是当下具身智能落在人形机器人上的考虑。 具身智能是平台化的虚拟概念,人形机器人是应用载体,平台+赛道的方式对应着具身智能结合人形机器人可以实现软硬一体化。季超认为。 在改造传统工业机器人方面,赵明国认为,具身智能可以解决更复杂的问题,会朝着此前单纯的控制感知、结合视觉传感器、到与环境的不确定交互这一概念往下延伸。 许多提到了解决FAE(工业产品线)成本的趋势,基于具身智能可以把FAE时间缩短,解决一定程度的跨工位迁移问题,就会让工厂管理效率极大提升。 基于具身智能辅助做优化,自动化设计上敢于用另外一种方式做这条线,工业机器人需要有感知、视觉、反馈,去搭配传统机械臂,完成复杂任务下的自动化任务。富士康科技集团首席数字官、云智汇CEO史喆称。 季超对比了通用机器人与专用机器人,通用机器人可以做多个工作流的兼容,能在牺牲了一定效率的情况下,结合先验知识解决连续性问题,实现多个任务场景下的统一。 对于当下具身智能落地很难的现状,赵明国认为,具身智能发展处于初期,没有形成完整的理论体系,再加上其本身供应链很长且涉及到的技术门类众多,处于百家争鸣的阶段。 刘进长总结说,这背后的原因是,首先大模型还不具备演绎能力,面向人形机器人或智能装备的大模型需要进一步开发,第二是投入产出比,不具备市场竞争力。 季超认为一类是军工国防等高价值场景,第二类柔性化程度高场景,代替劳动力做通用性、重复性工作。如果市场规模达到上亿台最终一定是To C逻辑,每个家里人手一台。 赵明国补充说,具身智能走向大的应用过程中首先不会在存量市场产生,因为会和传统方式直接比较,就需要有较强的技术突破。所以他认为大家最愿意买单的是新的事情出现。 七、宇树科技王兴兴:具身智能是实现AGI最有效途径,明年年底会出现通用机器人模型 具身智能发展处于起点阶段,在当下这个时间节点对于中小企业来说有更大机会。王兴兴认为具身智能是实现AGI的最有效途径。 宇树科技从2013年成立起已经发布了高性能四足机器人、人形机器人等产品,他透露,目前人形机器人H1已经小批量量产并发货,宇树科技是全球四足机器人出货量最多的公司。 去年上半年,宇树科技发布四足机器人Go2,其采用了OpenAI的接口,可以实现语音交互,大模型规划执行,但最终效果并不理想,一旦超出已经规划好的认知范围机器狗表现效果会很差。他认为,当下大语言模型不是实现AGI的最理想方式。 很多人觉得AI做控制是黑匣子,可靠性低,但他认为AI训练会比人写代码的可靠性高很多,AI做训练时其会同时做大量测试,当一个软件系统的复杂度达到一定规模,就非人力可以维护,如自动驾驶等领域。但AI只需要提供足够的算力。 未来的技术发展趋势包括深度强化学习的网络模型架构方面,并且目前通用性、微调函数等还有大量的人力工作量,以及将模型做的更加完善,端到端的感知、规划,完成更复杂的全地形运动等, 现在的大语言模型对世界的理解靠语言或语音输入,没有对真实世界的认知和理解。AGI需要有实物机器人来实物部署,实时采集最新的数据进行训练,需要参与到和整个世界的物理交互中,可以体验和理解人类的情绪和性格。 王兴兴认为,AGI的黎明已经到来,明年年底之前至少会有一个公司能实现通用的机器人模型。 结语:技术、场景、政策并行,具身智能成产业智变新引擎 具身智能作为AI的下一个浪潮,深入融合了AI和机器人等多个学科,正推动智能经济时代加速到来。在机器人领域,越来越多涉及机器人本体、核心零部件、软件算法的国产厂商涌现,并不断拿出创新成果。 当下,机器人已经深入工业等场景中实现了落地应用,但目前具身智能产业在成果转化、应用场景、商业模式等方面还有待完善。这背后与具身智能相关大模型、机器人产品的开发周期较长有关。 在这一背景下,我国在具身智能领域拥有坚实的机器人硬件制造基础、丰富多样且广阔的应用场景资源,以及政策的相应支持下,为这一最具划时代意义的技术之一具身智能拉开了大幕。
iPhone 17 Air 和 SE 4 再曝光!苹果或许比用户更需要一个大招
从年初开始,苹果可以说是一路「水逆」至今。近日发布的新财报虽然有所回暖,但是同比下降的 1% 的 iPhone 营收,和进一步走低的中国市场表现,让人不禁期待苹果有没有更多秘密武器。 爆料比较准确的科技记者 Mark Gurman 确认,苹果正在憋一个大招,但不会在今年放。 明年 iPhone 变数或许将是近年来最大的一次:「Air」有望来到 iPhone 型号上,iPhone SE 4 也将「千呼万唤始出来」。 至于还剩一个月登场的 iPhone 16 系列,最大的亮点可能只有谁都说不准好不好,并且中国用户无缘的 Apple 智能。 iPhone Air 能成功吗 据悉,iPhone 16 系列已经开始全面量产,最近也有不少机模图流出,基本符合此前的传言,即这代 iPhone 继续「挤牙膏」,肉眼可见的更新或许只有「拍照按键」;标准版再次继承上一代 Pro 新功能,这次是「操作按钮」;Pro Max 版可能还会大一圈。 ▲ iPhone 16 模具,图源:Sonny Dickons 苹果对 iPhone 16 系列态度十分值得玩味,上季度财报中并没有对新 iPhone 的销量表现作出任何预测。这可能表明,苹果也不太指望 iPhone 16 能掀起购买热潮。 而苹果对 iPhone 16 最寄予厚望的卖点,则是前两周才正式初亮相,完全体甚至不太可能和 iPhone 16 系列一起推出的 Apple 智能。 2024 年用 AI 当噱头的手机厂商不少,但是目前看来,似乎只有苹果敢说,吸引用户换新手机的主要因素是 AI 功能。 没人知道 Apple 智能的完全体究竟还有没有大招,但是就目前的体验看来,Apple 智能还在发育中,很难马上成为一个杀手级的卖点,特别是一个吸引中国用户的卖点。 比起乏善可陈的 iPhone 16,苹果把重头戏都放在了明年。 今年年中开始,不少消息来源都指出,iPhone 17 系列将包含一个全新的型号,该型号将会走一条「机身超轻薄」的路线,来吸引更多用户换机。 ▲ 根据目前爆料制作的 iPhone 17 Air 假想图 Mark Gurman 确认了这个消息,表示这款 iPhone 的定位有点类似 MacBook 和 iPad 中的 Air 系列,位于 iPhone 17 和 iPhone 17 Pro 之间。 如果用户想要一个比标准版 iPhone 更时髦、更高级的手机,但又不需要 Pro 型号过剩的性能和影像能力,那么配置和标准版一致,但又在外观上有一定区分度的 iPhone 17 Air,就能满足这部分需求。 ▲ image description. 图片来自:xxx 苹果在「第四款 iPhone」的尝试上屡战屡败,又屡败屡战。 iPhone mini 虽然价格比标准版更便宜,但小屏手机本质上还是小众需求,再加上两代 iPhone 都在续航、散热、双卡上有所缺憾,最终销量成为四款 iPhone 中的吊车尾。 iPhone Plus 的问题或许更多在定价上。价格刚好卡在标准版 iPhone 和 Pro 版之间,却只有屏幕尺寸和续航两个比较突出的卖点,比标准版贵出来的这 1000 元似乎没那么值得。 而 iPhone 17 Air,定价虽然很可能看齐 iPhone Plus 的 6999 元,但更轻薄的机身,以及其他消息称在灵动岛、后置摄像头上的设计变更,看着比 mini 和 Plus 更诱惑,但标准版的配置,又不至于对 Pro 系列造成太多威胁。 Mark Gurman 也指出,超薄 iPhone 探索不仅仅只是为了「第四款 iPhone」,未来的 Pro 型号上很可能看到同款纤薄设计,但起码要等到 2027 年。 更具竞争力的「廉价版」 在 iPhone 销量下行压力较大的当下,苹果需要更多不同的 iPhone 的型号,为他们带来更多潜在用户。 市场调研机构 CIRP 最新的报告显示,上季度购买新 iPhone 的用户中,有 17% 是从 Android 系统切换过来的,比例创新高。 这条「好消息」背后其实折射了不少问题。首先这批换新 iPhone 的 Android 用户,更青睐像是 iPhone 14 和 iPhone 13 等旧型号,而不是最新旗舰机型 15 系列。 其次,买新 iPhone 的 Android 用户比例多,不一定就是投奔 iPhone 阵营的用户多了,还有可能是 iPhone 钉子户越来越多,老 iPhone 用户越来越不愿意换新机了。 在这种情况下,苹果不仅需要保持常规新品的更新,还需要一些特别的突破口。 有望大变身的 iPhone 17 Air 是一个,iPhone SE 4 也可能比以往更重要。 ▲ 根据爆料制作的 iPhone SE 4 假想图 比起 iPhone 8 设计的 iPhone SE 3,iPhone SE 4 将会走向「现代化」,外形更接近 iPhone 14,不过配备一个全新的单摄背板。 这款售价大概 500 美元(折合人民币约 3629.65 元)的全新廉价版 iPhone,也有望搭载 Apple 智能。 比起毫无存在感的 iPhone SE 3,支持 AI 且价格更低的 iPhone SE 4,甚至比届时还在售的 iPhone 15、iPhone 14 多了一个选择的理由。 iPhone 还能改变规则吗 包括 AI 在内,iPhone 17 Air、iPhone SE 4 与其说解决了什么用户的痛点痒点,更像是苹果在努力「制造」卖点,吸引更多潜在的用户。 就像是大家都以为苹果不会下场的折叠屏,最近也频频传出消息,虽然,有望先亮相的可能是折叠 iPad,而不是折叠 iPhone。 灵动岛同理,本质上是一种屏幕形态的「藏拙」,但苹果硬是将其包装成一个吸引人的卖点。 ▲ 苹果官网 iPhone 15 介绍页面第一个亮点就是「灵动岛」 用户不一定真的需要一台超级薄的 iPhone,但是如果苹果真的造了出来,那自然不愁卖,特别是 iPhone 更新显得越发平淡的这几年。 只是,我们更期待一些「改变规则」的东西。 整合了 Apple 智能,越来越能够和 Vision Pro 头显联动的 iPhone 确实正在面向未来「厚积」,但它本身,或许还在等待一个「薄发」的时机。
纯电轿车,还是不好卖
作为华为鸿蒙智行体系内目前最旗舰的轿车,在正式发布之后的 72 小时后公布了大定数据:24 小时大定 2500 辆,72 小时大定 4800 辆。 ▲ 北汽蓝谷近日股价走势 先不说这个成绩好不好,北汽蓝谷的股价先跌为敬,没能复现赛力斯暴涨的盛况,可以认作是投资者对这个成绩不太买单。 豪华纯电轿车,不好卖啊 40 万元以上,纯电,轿车,这三个关键词组合在一起,基本上就预示这类车型注定不是大爆车型,国内汽车市场上符合这三个条件的产品寥寥无几:蔚来 ET7,特斯拉 Model S,保时捷 Taycan,奥迪 e-tron GT、宝马 i7,还有奔驰 EQS 轿车当然也算,还有刚刚宣布破产的高合旗下的 HiPhi Z 也算,这几个兄弟的国内销量加起来,预计是多少呢? 其中销量最好查的是蔚来 ET7,得益于改款的缘故,这款车 2024 年 7 月销量为 749 辆,6 月和 5 月都是刚刚破千,为 1071 辆,改款前的销量都是在 100 辆左右徘徊。 因为特斯拉不再公布 Model S 和 Model X 现在的销量,我们只能大概预估一下:2024 年二季度,特斯拉全球大概卖出了 1.2 到 1.3 万辆 Model S 和 Model X,拆分到月度,以及细分市场,Model S 在国内市场月销大概率也不会超过 1000 辆。 ▲ 奔驰新款 EQS,造型不再像「大鼠标」了 至于保时捷 Taycan、奥迪 e-tron GT、宝马 i7,还有奔驰 EQS 这些重在参与的选手,我们也找不到具体的销量数据,但在此可以大胆且大概预估:月销 2 位数。 ▲ 蔚来 ET7 简言之,虽然蔚来 ET7 卖得一般,但已经是豪华纯电轿车里面的销量天花板了。虽然享界 S9 大定数据看起来并不豪华,但是已经是这个细分市场里其他玩家望尘莫及的数字了。毕竟整个市场里面,40 万以上的纯电轿车加起来的销量,都到不了 2500 辆。 如果我们再换一个组合:40 万以上,新能源,SUV,那么就能找到更多的玩家了,最知名的当然是鸿蒙智行里的老大哥问界 M9,其大定成绩堪称骇人:2 小时大定破 10000,7 天大定破 30000,上市 6 个月大定超 10 万。 这里就出现了一个值得思索的局面:放在细分品类里,享界 S9 的大定数量相当可以了;但是和老大哥问界 M9 相比,又显得平平无奇。 那么问题出在哪儿? 价格吗? 价格贵不是产品的问题,是购买者的问题。 问题出在纯电和轿车上。 特斯拉也卖得没去年好了 这两天有泰国媒体据政府消息信源称,特斯拉放弃了在泰国建造电动汽车工厂的计划,并且特斯拉也搁置了全球其他地方建厂的计划,除了已经拥有超级工厂的中国、美国和德国,特斯拉不会在马来西亚、印尼或任何其他地方继续建厂。 不过马来西亚投资、贸易和工业部部长扎夫尔又说,特斯拉从未承诺在马来西亚建厂。接着马来西亚总理安瓦尔周五表示,特斯拉推迟在东南亚的扩张计划与马来西亚的表现或政策无关,主要是中国电动车给的竞争压力太大。 目前特斯拉一共在中美德三地有四家超级工厂,另外有计划建厂的地区是墨西哥,但也存在不确定性,之前马斯克就表示,特斯拉将在 11 月的大选结束后再做决定是否在墨西哥建厂。 相比于比亚迪在东南亚和欧洲迅猛的建厂计划,特斯拉的扩张就显得相当克制。 当然这种克制也是基于目前特斯拉的销量增长考虑:刚刚过去的 2024 年第二季度里,特斯拉营收 255 亿美元,创下历史纪录,但净利润为 14.94 亿美元,相比于去年同期下降了 45%。 更为不利的消息是,特斯拉二季度汽车总交付量为 443956 辆,同比下降 5%,上个季度特斯拉的销量也同比下滑了。 也就是说,特斯拉的车,卖得不如去年好了,因此也就没有扩产的理由。 所以说,做纯电车结果卖得不好的人也不用太灰心,毕竟行业龙头老大特斯拉也同比下滑了,学霸都考不了满分,勉强得个「良」,那众学渣们不及格也是情有可原是吧。 当然也有一些因为此前基数小,而在销量上飞速上扬的品牌,比如蔚来和极氪,纷纷从月销 1 万冲到了月销 2 万的水平,小米 SU7 初战也算大捷,给纯电市场提振了一些信心。 但还是不能有幸存者偏差,觉得别人行我也行,毕竟男怕入错行,车也怕走错道。 新能源卖得好,不意味着纯电卖得好 2024 年上半年刚刚过去,我们也可以从宏观角度来看看乘用车市场的局面: 2024 年上半年乘用车累计零售 984.1 万辆,同比增长 3.3% 其中燃油车零售 573 万辆,同比下降 13% 新能源车零售 411.1 万辆,同比增长 33.1% 这一增一降之下,就是几家欢喜几家愁:今年上半年,能够月批发销量过万的乘用车厂商有 35 家,占到了整体市场份额 96.4%。 不过其中有 22 家同比负增长,10 家同比增长超 10%,3 家同比增长超 50%。 这意味着市场正在经历优胜劣汰,头部集中的过程,乘联会表示,头部传统车企转型转型比较成功,比亚迪、奇瑞汽车、吉利汽车、长安汽车份额提升明显。 基于这些数据,我们可以得出一个结论:只搞燃油车,死路一条,转型新能源,绝处逢生。 事实上也是如此,再看 7 月数据,这个月全国新能源乘用车零售 87.8 万辆,同比增长 36.9%,月度销量首次超过燃油乘用车销量(84 万辆)。 但新能源的高增长中,主要出力的,还是混动和增程,而非纯电。 比如国内新能源一哥比亚迪,在 5 月底发布了第五代 DM-i 技术和秦 L 车型,百公里亏电油耗能做到小于 2.9L,满油满电综合续航里程超过 2300km,这款车在 7 月马上就成了整个比亚迪体系内的销量亚军,月销 32466 辆。 从销量增长上看,比亚迪上半年累计销量达 161.30 万辆,同比增长 28.46%。其中纯电动汽车销量 72.62 万辆,同比增长 17.73%;插电式混合动力车型销售 88.10 万辆,同比增长 39.54%,纯电的增速明显低于新能源整体的增速。 至于问界 M9 的销量当中,目前增程的比例占到了 80%-90%,纯电比例只有一两成。 增程这种动力形式更是在理想和问界两个品牌双双成功之后,成为了多家车企必须跟进的类型,比如即将发布的阿维塔 07,就将会采用纯电和增程两种动力形式。此前发布的奇瑞星途星纪元 ET,也是同时配备了纯电和增程两种车型。 东风汽车旗下的新品牌奕派推出的两款车型,007 和 008 也是都采用增程加纯电的产品组合。 而领克 07 和领克 08 也把自家的混动技术称为「超级增程」,虽然它们的工作原理和增程汽车并不完全一致。 此外,目前专注在纯电市场的极氪、小米、智己和小鹏,都传出了要布局增程或者混动的消息。 可以说,对于市场而言,「增程」是一个能够帮助稳定销量的关键词,但纯电意味着赌一把。 将增程带到大众消费者面前的理想汽车在此更有发言权:在理想 L789 相继成功之后,理想发布的纯电 MPV MEGA 遭遇销量滑铁卢,表现远远低于理想内部预期,理想甚至还延缓了其他纯电车型的上市节奏,转而把精力投入到了 L6 的上市销售,以及充电桩的建设上来。 哪怕是特斯拉的大本营美国也是类似的情况,纯电车型的销售增速正在放缓,而混动的销量和增速都明显高于纯电。 另外的一个基本常识是,中国乘用车市场里,SUV 的销量也是要高于轿车的,就像 Model Y 的销量高于 Model 3 一样。 因而,纯电遇上了轿车,天生就不好卖,再加上一个豪华市场,那就更意味着勇气可嘉。基于这两点,蔚来月销两万的含金量还在提升,在最难的赛道里做孤勇者。 只是对于想要参与市场竞争的玩家来说,倒是可以不必这么跟自己过不去,搞增程,做混动,都是新能源。 不过接下来还有仰望 U7、蔚来 ET9 等等百万级纯电轿车要来,这虎山,倒是真有前赴后继的用着去闯。
小米14推送Hyper OS 1.0.45.0更新:新增CarWith个性化定制等
IT之家 8 月 12 日消息,小米 14 手机现已推送 Hyper OS 1.0.45.0.UNCCNXM 版本更新,安装包体积为 389 MB。 ▲ IT之家图赏:小米 14 IT之家整理如下: 系统 优化启动动画策略,提升应用启动速度 优化应用启动流程,提升应用启动速度 修复部分游践闪退问题 自由窗口 修复横竖屏切换时,小窗视频应用显示异常的问题 修复部分游戏场景下,迷你窗挂起后尺寸异常的问题 桌面 优化应用上滑返回桌面时的动画稳定性 修复部分场景下,分身空间桌面布局出现空位的问题 万象息屏 修复部分情况下偶现闪退的问题 锁屏 新增“长按锁屏编辑样式”开关,关闭后在锁屏长按将不会触发锁屏编辑 时钟 修复闹钟设置重复周期时,切换深色模式出现勾选异常问题 设置 新增 CarWith 视觉体验的更新,重绘 6 种横竖尺寸车机样式,包含全新地图卡片、音乐卡片、小爱同学对话样式,提升界面美观度 新增 CarWith 个性化定制,支持设置车机壁纸、更换背景效果、自定义卡片排序、添加小部件等功能 优化 CarWith 导航体验,支持地图导航全屏显示,新增导航悬浮胶囊 优化 CarWith 的连接体验和稳定性 手机管家 修复自然灾害预警订阅选项异常消失的问题 更多功能与优化 修复全局搜索时,长截屏背景纯黑的问题
折叠屏手机鼻祖!柔派FlexPai 3真机现身:升降前摄真全面屏
快科技8月12日消息,日前,柔宇第三代折叠屏柔派FlexPai 3在二手平台现身,该机采用外折设计,升降式前置摄像头,屏幕无任何开孔。 据B站UP主“老朋友王海缤”介绍,柔派FlexPai 3还有一个有意思的设计,该机后摄对应的机身背部有一个可以容纳后摄的凹陷区域,用途是用来防止摄镜头被刮花。 柔派FlexPai 3采用7.2英寸超大黑边屏幕,1620*1520分辨率,60Hz刷新率,处理器为骁龙765G,镜头参数为1200万像素主摄+800万像素超广角。 柔宇原计划2021年末推出柔派FlexPai 3,然而新机还没发布就成了柔宇的最后之作。 据“老朋友王海缤”介绍,柔宇把第三代方案卖给了VERTU(纬图),柔派FlexPai 3市面流传近100台几乎全部改成了VERTU AYXTA Fold3,真正的柔派FlexPai 3全球也许只有三台。 据了解,2021年12月,柔宇科技被曝出大规模欠薪的传闻,2022年4月,柔宇独立董事刘姝威通过其个人微信公众号发文呼吁拯救柔宇,希望政府能帮助柔宇科技引进战略投资者,以缓解其资金短缺。 今年3月,外界传闻柔宇科技破产,公司于4月1日发表声明称,公司未曾主动申请破产,也未进入破产程序,目前企业仍在运营中。 今年6月6日,全国企业破产重整案件信息网显示,深圳市中级人民法院发布公告称,已于2024年5月15日裁定受理柔宇科技破产清算一案,并指定广东华商律师事务所为柔宇科技管理人。 深圳市中级人民法院将于2024年9月13日召开第一次债权人会议,依法申报债权的债权人有权参加债权人会议。 柔宇科技旗下两个全资子公司柔宇电子和柔宇显示的破产清算案也被裁定受理。 据悉,2018年,柔宇科技发布全球首款折叠屏手机——柔派FlexPai,采用柔宇科技独立研发的7.8英寸蝉翼柔性屏2代AMOLED屏,这家曾经估值超过500亿的独角兽、折叠屏手机鼻祖已成为历史。
库克新活:iPhone也快有Air了
系列全线产品都能用Apple Intelligence配备A18芯片,让AI体验更丝滑前两年很流行的玫瑰金外观颜色将回归iPhone的Air版,在路上了 ——这就是iPhone 16的最新剧透(的一部分)。 现在iPhone 16的既有生产线,都忙冒烟了! 眼看下个月就要发布了,富士康不得不紧急雇佣了5万名工人,让满负荷的iPhone 16生产线高速转起来。 彭博社的名记马克·古尔曼也冒出头来再加一把热度,表示: iPhone 16不会扩产的啦!总体还是会保持稳定的产销量。这种状况会保持到明年,等明年苹果公司推新机型的时候再说。 wow,新机型?! 除此之外,古尔曼还剧透了一些苹果产品的别的瓜: 更小的Mac mini正在开发中iOS 18的相册App有更新塑料版本的Apple Watch SE在路上了 全线配备Apple Intelligence 好,先来看看古尔曼曝光了iPhone 16的哪些消息—— 首先,从机型上来说,iPhone 16还是保持了前作系列,一共四款机型。 iPhone 16、16 Plus、16 Pro 和 16 Pro Max。 所有四种型号将配备8 GB内存(这是运行Apple Intelligence的底线)。 在电池容量和充电技术上,iPhone 16系列将有所提升,预计支持最高40W有线快充以及20W无线快充,0%~100%充电时间有望缩短到1小时以内 。 所以其实新一代iPhone的最大卖点,还是集中在它的AI功能,即Apple Intelligence方面。 iPhone 16的所有机型都将适配Apple Intelligence,而不像现在只有iPhone 15 Pro能玩。 相对应的,有报告称iPhone 16配备的A18芯片,将升级神经引擎。 如此一来,机上搭载的Apple Intelligence功能和ML任务的性能都会显著提高。 另外,屏幕大小也会发生一些变化,主要是Pro型号。 16 Pro的屏幕会从6.1英寸增加到6.3英寸; 16 Pro Max的屏幕会从6.7英寸增加到6.9英寸。 也就是说,16 Pro Max的屏幕尺寸,又将创下“有史以来最大iPhone”的纪录。 接下来聊聊物理按钮,iPhone 16系列的物理按钮主要有两处变化。 一处是非Pro版本将添加操作按钮。 这倒是意料之中,因为15系列的Pro版本们已经用上了。 不过古尔曼同时表示,苹果会在iOS 18种推出个人定制更强的控制中心,以及更改程度更灵活的锁定屏幕选项——这俩功能都可能削弱物理操作按钮的实用性。 另一处则是16系列的手机右侧,将添加一个新的相机控制按键。 当然了,苹果可能故技重施,先只添加在高端的Pros上。 这个按键的用处有点像数码单反上的按钮,轻轻按下后可触发相机的自动对焦功能,长按则触发拍照功能。 在拍照or拍视频的过程中,可以在按钮上滑动,进行画面的放大和缩小。 最后就是颜色。 Pro系列的蓝色会被拿掉,但前几年流行的玫瑰金会回归。 iPhone产品线,还得看明年的 Emmmm……是不是感觉有点一般般,都在意料之中,没什么出彩的惊喜? 古尔曼也表示,他不认为16系列会引发人们的购买热潮;而因为苹果公司对本季度的销量增长也没做出预测,所以也看不到官方的态度。 但他也不卖关子,直接说: iPhone产品线,会在明年出现大变化。 这也主要体现在两个方面。 一方面是一年后会推出的iPhone 17系列,古尔曼称17系列会出现一个前所未有的机型。 具体而言,就是Plus系列销量反应平平,因此可能将被取缔。 这意味着16 Plus将成为Plus系列的绝笔之作。 取而代之的是以“更薄的设计”为理念的新型号,类似iPhone 17介于基础版和Pro版之间的“Air”版本。 另一方面是好久不见的iPhone SE。 最早明年初,苹果将推出新款iPhone SE——上次该型号出新,还是在2022年。 它的外观可以参考iPhone 14,配备比前作更清晰的OLED显示屏,还是全覆盖那种(合理猜测物理home键可能没有了)。 而且期待一下,新SE说不定会配备Apple Intelligence。 还有哪些可期待? 好了,以上就是对iPhone 16及后续产品线的主要剧透。 除了手机以外,还有些别的推陈出新,大伙可以蹲一波: 系统方面,需要注意的是,iPhone 16系列可能不会预装Apple Intelligence,而是直接在iOS 18.1测试版中上线。 然后,iOS 18的beta 5,已经对备受吐槽的相册App进行了改版。 最初iOS 18的相册App在网格图下方增加了新的回忆相册,可进行自动/手动筛选;新增旅途回忆功能,自动汇聚不同旅程的照片,生成相册集。 但这个操作被诟病“太混乱了”。 因此,最新版本系统进行了优化,移除了轮播视图,并调整了相册的位置,使得整体界面更加整洁。 电脑方面,对Mac Mini进行改造,大小设计参考Apple TV。 新型号将比当前版本小得多——可能只有一半大小——并且有M4和M4 Pro两种版本。 其中,低端型号将于 8 月份开始从供应商向苹果发货,而 M4 Pro 版本将于 10 月份准备就绪。 这是自2010年乔布斯时代,以来Mac mini的首次改进。 MacBook Pro和iMac的更新迭代也没落下,最早今年秋季会有新品推出;与此同时,新款MacBook Air预计于明年春季上市,新的Mac Studio和Mac Pro也在开发中。 手表方面,苹果可能彻底改造Apple Watch的低端线,即SE系列。 苹果将用塑料外壳取代现在的铝制外壳。 古尔曼猜测这既是为了降低成本,也是为了出更多好看的颜色,以此吸引小朋友。 其他硬件设备方面,苹果即将推出第二代Apple Vision Pro,“目前尚不清楚苹果将采取什么措施来削减这款更便宜型号的成本”。 同时,Vision团队在试验不带显示屏的智能眼镜,类似于Meta的雷朋眼镜。 One More Thing 有意思的是,谷歌今年抢跑了! 消息显示,当地时间8月13日,谷歌就将正式拉开2024年度 “Made by Google” 大会序幕,旨在全面展示谷歌在硬件与软件领域的最新成果与创新。 今年谷歌将一改往日传统——要知道,以往这会都在10月开。 外界揣测,这个决定或许是考虑到和苹果9月发布会错峰,以及减少产品细节泄露。 与其让分析师等小嘴叭叭地告诉咱们谷歌新品都有啥,不如谷歌自己上,笑死。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。