行业分类:
加载中...
头条分类:
加载中...
美国推出喷火机器狗,火焰能喷9米远
以前觉得家里养一条会喷火的龙有点魔幻,结果现在发现还真有希望了。 虽然不是龙,但狗子已经学会喷火了,当然具体来说,是机器狗: 近几年各大公司除了热衷研究四足机器人外,还有就是搞层出不穷的脑洞给狗子后背安上外设装备。例如这只背的就是喷火器,火焰一喷贼老远: 总感觉天网反攻的时候,这东西会用火来烧我。 这只会喷火的机器狗,是美国火焰喷射器公司Throwfire推出的商品。 狗子被起名叫Thermonator,售价不算便宜,要9420美元,也就是6万8千人民币。 但如果你眼尖一点就会发现,这只机器狗有点眼熟: 如果把喷火枪拆下来,这不就是我国机器人公司宇树科技的Unitree Go2吗? 特意去官网看了一下,9997元起。 看起来应该是喷火器公司把自己的喷火产品搭载到了这款机器狗上,这下真是「中美合拍两开花」了。 所以,这个喷火狗是用来做什么的,总不会真是用来烧人的吧? Throwfire是一家专门研究火焰喷射器的公司,在设计喷火器方面确实有着不少奇思妙想。 而把喷火器放在机器狗上其实和放无人机上都是类似的思路,拓宽一下喷火器的使用场景。 所以Thermonator的主要用途本质上还是火焰喷射器那些作用,处理野火,应用于农业需求,除雪除冰。有时候防治害虫也会用到喷火器,或者在拍电影的时候负责制造火焰。 当然有了机器狗的加持,功能会更丰富一些。例如可以联网,通过手机进行远程操控: 看起来可以适应多地形行走,雪地、草地都能跑: 夜间还有激光瞄准,感觉可以用来打僵尸: 给机器狗配备的是他们家新款的ARC喷火器,主打的是点火方便,轻巧易携带,射程可以达到9.1米。 喷火的时候,机器狗还能跳跃。 机器狗这肆意喷火的样子你不说是在搞正经工作,我还以为是机器人大军打过来消灭人类了。 其实去年这家公司就发布了喷火狗子的预告,当时就引起过热议,预告的时候使用的机器狗貌似是Unitree Go1。 很多人的观点和我差不多,表示这是梦幻般的玩具,毕竟狗子学会喷火堪比养的猫学会了倒立。 但对此感到担忧的人也不少。 老话说得好,玩火尿炕。这虽然是一个工具,但搞不好就会酿成不必要的火灾。 还有人吐槽电影里的杀手公司清理尸体的方式可以更新了,让狗子直接烧了就行。 也有网友脑洞大开,搞什么喷火器,做成灭火的不是更实用吗? 你别说还真别说,宇树科技的这款Unitree B1还真有过类似的设计宣传,让机器狗配合消防员进行灭火行动。 机器狗可以跨越楼梯进行侦察环境,雷达扫描构筑建筑地图,摄像机传递火场信号,搬运救援物资等等。 其实参考Throwfire的脑洞,让机器狗背一个灭火器似乎也不是不行。 当然,大部分人感觉Throwfire的这个喷火狗就是一个潜在的战争武器。冲入敌方阵地一顿喷火,估计也有一定杀伤力。 有一说一,之前还真有人把Unitree Go1改装成可以遥控开枪的机器狗。 不同于其他正规的军火装备,俄罗斯老哥Alexander Atamanov自己就把枪改装到了机器狗身上,这操作就跟网购乐高积木然后拼出一把能用的步枪差不多。 狗子当时的表现就把网友吓了一大跳,因为这玩意是真的会开枪: 尤其是第一视角跟玩吃鸡一样,这显然会让杀戮变得更像是程序或者游戏。 但它的缺点也很明显,小身板扛不住枪的后坐力,开枪要后退好几步。 看到这些机器狗的改装,也难怪大家会害怕终结者变成纪录片了。 但我还是很好奇,什么时候搞出「导弹狗」,我还挺期待的。 (文中图片与信息素材来源自网络)
“首试者”遭遇机械故障,Neuralink计划会受影响吗?
原标题:不到100天,“首试者”遭遇机械故障!Neuralink的下一步脑机人体试验计划会受影响吗? 美西时间5月9日,距离马斯克旗下Neuralink 的首位人体试验者接受脑机设备植入手术正好过去了100天。 不过,Neuralink前一日发布博客文章中却透露,在1月对患者Noland Arbaugh进行手术后的几周内,镶嵌于脑组织中的一些接线脱落,影响了信息传输速率,丢失了部分数据,导致设备无法正常工作。 Neuralink没有透露电极线为何会意外收缩。不过,据外媒援引知情人士称,Neuralink 认为一个可能的原因是Arbaugh术后残留在其头骨中的空气可能导致其运动皮层回缩。也有专业人士认为,这一问题的出现跟植入物的连接方式有关。 对于正在寻求开展更广泛临床试验的Neuralink而言,任何故障都可能会导致美国食药监局审批流程的延误。不过截至发稿,FDA尚未对上述事件做出任何置评。 不到100天,Neuralink“首试者”植入物现故障 在5月9日的推文中,马斯克写道:“Neuralink的首个人体受试者成功度过100天。” 图片来源:X平台 Neuralink的“首试者”是29岁的Noland Arbaugh,八年前在一次意外的潜水事故中脊髓受伤。今年1月28日,他接受了Neuralink的脑机设备植入手术,植入物使用1024个电极记录神经信号,这些电极分布在64条比人类头发还细的“线”上。 Neuralink脑机接口“首试者”Noland Arbaugh 图片来源:Neuralink 不过,马斯克在推文中附上的Neuralink博客文章显示,1月份Arbaugh接受手术后,被植入受试病患的设备发生了诸多机械故障。植入人脑之后的数周,安装在人脑组织的某些电极镶钉螺纹发生脱落。2月下旬,Noland Arbaugh的植入设备捕捉到的数据开始减少。 每日峰值性能(以每秒比特数为单位) 图片来源:Neuralink博客文章 Neuralink没有透露电极线意外收缩的原因。作为解决方案,Neuralink称他们修改了记录算法,使其对神经群体信号更加敏感,改进了将信号转换为光标移动的技术,并增强了用户界面。这些修复“让BPS(每秒比特数)产生了快速而持续的改进,超出了最初植入后的表现”。 尽管植入物的功能有所下降,但Arbaugh仍可以完成下棋的现场演示。当地时间上周六晚上,Arbaugh还在X上直播,演示自己借助植入物浏览电脑屏幕,玩游戏。 Neuralink表示,尽管Arbaugh的脑组织中有一些神经线收缩,但他在工作日每天使用脑机接口系统约8小时,周末通常每天使用多达10小时。 每天脑机接口的使用时长 图片来源:Neuralink博客文章 故障为何会发生? 据《华尔街日报》,知情人士透露,Neuralink 认为一个可能的原因是Arbaugh术后残留在其头骨中的空气,即颅腔积气(pneumocephalus),可能导致Arbaugh的运动皮层回缩。这个问题似乎并未对阿博的安全构成威胁。知情人士人称,即便如此,研究人员在考虑移除阿博颅内设备的可能性。 彭博社报道则称,有专业人士分析认为,这一问题的出现可能是因为电极线连接的是位于颅骨内部的设备,而不是直接连接到脑组织表面。他们指出,脑组织在颅内空间内会发生相当大的移动,而传统上,脑植入设备是直接放置在脑组织表面上的,能够像船在水面上一样移动。“对于大脑植入物来说,电极线的回缩是不正常的。” 圣路易斯华盛顿大学医学院的神经外科医生Eric Leuthardt说:“工程师和科学家未能意识到大脑在颅内空间内移动的程度。仅仅点头或突然移动头部就可能导致几毫米的扰动。” 目前,Neuralink正试图在更多人类受试者身上植入他们的设备,其目标是在今年为10名病患植入其名为N1的大脑植入物。 然而,对于正在寻求开展更广泛临床试验的Neuralink而言,任何故障都可能会导致FDA审批流程的延误。不过截至发稿,FDA并未回复媒体针对此事的置评请求。 “人机共生”还有很长的路要走 根据Neuralink去年11月向SEC提交的最新文件,公司目前已经至少筹集了3.23亿美元的资金,这也使公司的估值超过50亿美元。Neuralink虽然是全球估值最高的脑机接口企业,但并不具有绝对领先的地位。 过去数年来,围绕Neuralink的争议也从未中断过。动物试验风险便是其一。在2023年5月获准进行人体试验前,由于实验动物死亡率高于平均值,Neuralink曾两次被FDA拒绝进行人体实验。 同年11月,四名美国议员要求美国证券交易委员会(SEC)调查马斯克是否因涉嫌误导投资者有关Neuralink正在开发的大脑植入物的安全性而犯有证券欺诈行为,因马斯克在X平台上表示“没有猴子因Neuralink的植入而死亡”。 此外,也有不少人对Neuralink的技术路径和马斯克的宏大愿景提出了批评。负责任医生委员会认为,马斯克的目标是通过Neuralink的技术“实现与人工智能的共生”,这样的路径却并不一定和治疗患者的最佳方法相一致。非侵入式的脑机接口已经证明在改善患者健康上取得了进展,Neuralink的开颅植入方法可能会带来不必要的风险。 从事脑机接口研究20年的清华大学长聘教授高小榕曾在接受媒体采访时表示,Neuralink一直没完全解决植入设备的安全问题,虽然与更早的猪试验相比,猴试验的安全性有所提升,但Neuralink没有发表论文并披露技术细节。 美国杜克大学医学院神经科学教授、被誉为“脑机接口之父”的米格尔·尼科莱利斯也曾表示,侵入式脑机接口是为了科学研究,对患者并不是最优选择,植入方法应该仅限于非常严重的病例。 据外媒报道,脑机接口技术作为一门新兴的研究领域,发展仍在早期,涉及计算机科学、神经科学、心理认知科学、生物医学工程、数学、信号处理、临床医学、自动控制等多个领域,仍有大量的问题尚待解决。比如,如何从大脑中输出正确的信息?如何将正确的信息输入到大脑? 负责输入及输出信息的是大脑神经元,而脑机接口要做的就是介入到这个过程当中。但整个大脑皮质的体积大约为50万立方毫米,在这个空间里大约有200亿个神经元细胞体,每立方毫米的皮质平均含有约4万个神经元。除此之外,大脑中还有与神经元数量差不多的胶质细胞,以及血管。每立方毫米的皮质里面的毛细血管加起来的总长度可以达到一米。 而要对大脑信号进行精准的捕捉或反馈,需要在这一立方毫米区域里面捕捉特定的一些神经元细胞体发出的信号,或刺激某些特定的细胞体发出工程师需要的信号。难度之高可见一斑。 这些都意味着,马斯克的“人机共生”还有很长的路要走。 免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。 每日经济新闻
押注端云协同,苹果选择紧抱OpenAI大腿
自ChatGPT推出以来,生成式AI大模型已经成为百度、阿里巴巴、腾讯、谷歌、Meta、OpenAI等海内外科技公司的竞争新方向。然而面对逐渐升温的生成式AI浪潮,作为全球首屈一指的科技公司,苹果存在感极低,如同一个旁观者,默默注视着事态发展。 “今年晚些时候,我将与你们分享,我们是如何在生成式AI方面开辟新天地,我们相信这项技术可以重新定义未来。” 直至今年2月,库克在苹果公司年度股东大会上的发言,才真正向外界释放了苹果全面发力生成式AI技术的信号。尽管苹果并未披露任何AI进展,但随着WWDC2024全球开发者大会的临近,越来越多关于苹果AI的相关信息被曝光。 苹果最新AI战略曝光,放弃纯本地处理 彭博社记者Mark Gurman发文称,苹果公司计划将包括M系列芯片在内的高端芯片置入云计算服务器中,用于处理计算难度大的AI功能,而相对简单的AI相关功能则直接在iPhone、iPad和Mac等终端设备进行本地处理。此外,Mark Gurman在今日公开的消息中透露,苹果已经与OpenAI达成协议,后者将为其提供云端AI技术支持。 据介绍,苹果首批AI服务器芯片采用去年发布的M2 Ultra,而近期发布的新款iPad Pro上搭载的M4芯片后续也将运用于AI服务器上。与此同时,苹果公司正在自研AI服务器的专属芯片,预计采用台积电3nm制程工艺,最快将于2025年下半年量产。 图源:苹果 独立、封闭一直是苹果生态的代名词,许多用户也是冲着这点选择了苹果产品。正因如此,苹果在内嵌生成式AI时,一直优先考虑设备本地处理的路线,以确保用户隐私安全。现阶段,手机、平板电脑等移动端设备硬件难以负荷纯端侧大模型方案带来的运算压力,苹果筹备云计算服务器这一AI战略的转变,意味着苹果将放弃纯本地处理方案,转而采用效率更高的云端结合的组合方案。 AI战略的转变不代表苹果不重视用户数据的安全性,相反,苹果过去三年为一种名为“Secure Enclave”的数据安全方案投入了数亿美元,旨在处理器内部的组件可以将数据与安全漏洞隔离,以保护用户隐私。 AI终端强敌林立,苹果靠什么实现突围 在实际应用前,我们无法得知该方案的数据安全程度,但苹果AI战略的改变很有可能是为了加快设备AI化,以追赶其他手机、电脑厂商的AI进程。 以智能手机为例,各手机厂商纷纷拥抱AI浪潮,手机端侧大模型几乎成了旗舰标配,甚至中端机、千元机中也出现了AI手机。过去,苹果iOS生态自成一系,其余厂商多采用安卓,令各家之间的区别并不明显,不过在AI浪潮大背景下,安卓阵营的厂商们纷纷着手打造自身专属的AI生态,寻求弯道超车的机会。 荣耀魔法大模型、OPPO的安第斯大模型、vivo的蓝心大模型......在国内手机市场前五名的品牌中,除了苹果外,其余品牌都已发布了自有端侧大模型产品。国内手机市场尚且如此,更别提范围更广的全球手机市场了。 图源:雷科技 苹果想要在强敌林立的AI终端市场杀出重围,重走其他厂商的老路恐怕很难实现,另辟蹊径或许是明智之举。 据行业人士透露,苹果并不打算推出一款聊天机器人与类ChatGPT大模型进行直接竞争,AI重铸后的Siri语音助手,将引入了一个新的生成式AI系统,为的是帮助Siri更好的了解用户意图,理解复杂的指令,并以一种自然的对话方式提供详细且个性化的响应。 Siri是手机中最早的一批智能助手,诞生于2011年的它智能水平还停留在过去,才会闹出诸多误解问题的笑话。因此,从底层技术开始重新改造Siri,对于志在嵌入生成式AI的苹果来说是必须经历的步骤。 图源:UNsplash 全新Siri将具备连续对话的能力,不再停留在一问一答的初级阶段。同时,Siri将整合嵌入了生成式AI功能的笔记、短信、备忘录、Safari等系统应用,方便用户更好的调用不同功能。 苹果在宣传全新Siri的时候,表示Siri处理所有的请求都将由端侧完成,也就是说苹果将全新Siri列为相对简单的AI相关功能,只需本地处理就足以应付。在5月特别活动中,苹果展示了iPad Pro在视频编辑和绘画方面的AI应用,虽然iPhone 15系列提前将内存升级到了8GB,但要iPhone独力支撑纯本地运行模型带来的压力可能会影响用户的使用体验。 这样一来,就能解释苹果为什么要采取云端结合的战略布局,或许正是为生态下其他创意工具以及生产力功能准备的。 全新Siri、创意工具、生产力功能,是苹果在AI生态的新应用方向。在AI时代,手机厂商和开发者的关系隐隐有调转的势头,之前以苹果为代表的手机厂商把握着第三方APP是否加入生态的权力,如今轮到手机厂商思考如何将更多第三方APP整合进自家大模型。延续传统智能手机时代的生态优势,将决定苹果AI能否在新一轮AI生态战脱颖而出。 苹果不甘再当旁观者,AI早有布局 事实上,虽然苹果一直游离于生成式AI的竞争,但其在AI领域已有不少布局,包括内部自研AI模型框架、收购投资、硬件采购等。 回顾苹果对生成式AI的探索,或许要追朔到2017年公布的CoreML框架,其作用在于将训练完成的AI模型部署到苹果设备中,这也被诸多媒体认为是苹果与生成式AI结缘的开端。 近两年,苹果建立大语言模型框架Ajax以及发布OpenELM自研大模型,可见苹果一直没有停下自研AI模型的脚步。不仅如此,苹果还收购投资了多家AI公司。截至2023年,苹果收购了32家AI初创公司,远超谷歌的21家和Meta的18家。通过收购诸多有前景的AI初创公司,苹果获得了核心创新技术和顶尖人才,先不说有多少AI技术被真正运用在苹果设备上,起码在收购AI初创公司这件事上,苹果称得上遥遥领先。 图源:Medium 而在硬件采购方面,苹果还在持续发挥自己的钞能力,积极采购芯片,为推进生成式AI做准备。分析师郭明錤表示,苹果投入了大量资金用于采购AI服务器,苹果2023年采购了2000~3000台,采购支出至少达到6.2亿美元;预计到2024 年,这一数字将达到47.5亿美元。计划额外采购18000~20000台,占全球AI服务器出货量的5%。 囤积AI服务器自然是为了云端计算做准备,可见苹果很早之前就已经定下了云端协同的AI战略,库克放言重新定义未来的苹果AI,不止是一句口号。 从上述布局来看,苹果正在发力追赶竞争对手,过去很长一段时间里,苹果都在忍受落后带来的影响。2024年开年不久,苹果在中国市场销量下滑24%,市场排名被vivo、华为和荣耀超越,从第一跌至第四。同时,苹果因反垄断问题在欧盟遭受20亿美元罚款,北美市场也面临三星S24系列的强劲竞争。这一系列问题凸显了苹果在全球智能手机市场面临着前所未有的挑战。 苹果弥补在人工智能领域失去的先机,摆脱“AI旁观者”的标签,决定了苹果下个十年的走向。这一切的答案,就看接下来的WWDC2024了。
美国计划升级AI技术出口管制
文 | 刘以秦 顾翎羽 编辑 | 余乐 5月8日,美国众议院一个由两党议员组成的小组公布了一项法案。如果该法案得到通过,将使拜登政府更容易对AI技术实施出口管制。 该法案名称为“增强关键出口海外限制国家框架法案”(Enhancing National Frameworks for Overseas Restriction of Critical Exports Act,简称“ENFORCE法案”),法案称要限制美国AI系统的出口,来防止外国竞争对手使用美国的AI技术。 法案中提到,“AI系统”是指AI相关的所有软件和硬件,包括AI模型和与AI技术实现相关的所有数值参数。 5月9日,中国驻美大使馆对此回应称,此举为“典型的经济胁迫和单边霸凌行为,中国坚决反对”,并补充说将采取“必要措施”保护自身利益。 据媒体报道,美国众议院提出这项新法案是因为对中国高速发展的AI技术水平感到担忧。自去年起,美国政府陆续出台相关管制政策,包括限制高性能的AI芯片出口,要求美国云计算公司在给外国客户提供大模型训练服务时上报等。但担忧依然存在。 一位美国律师向《财经》表示,法案的提出者中包括了众议院外交事务委员会主席和两党议员,且提出了被许多人认为符合美国国家利益的理由,有较大可能性通过。 据媒体报道,此次管制法案主要是针对美国公司还未发布的模型,而非现有模型。长期关注出口管制合规议题的中伦律师事务所合伙人郑孜青律师告诉《财经》,该法案目前未排入众议院或者参议院表决的时间表,距离落地尚有许多不确定性,且法案主要是赋权商务部,是否实施管制、管制如何操作预计将由美国商务部届时再决定。 5月10日,外交部发言人林剑针对这一新管制条例表示:事实证明,中美经贸投资合作互利共赢,两国和两国人民都是受益者,将经贸科技问题政治化、工具化、意识形态化,强推脱钩断链,冲击的是两国及全球的正常贸易投资往来和产供链稳定,不符合包括美国在内的任何一方的利益。林剑表示,美方应将不寻求与华脱钩、不阻碍中国发展的承诺落到实处,停止保护主义做法,停止对华的科技封锁限制,停止扰乱国际经贸秩序。中方将采取必要措施,坚定维护自身的合法权益。 美国连续升级AI管制 ENFORCE法案由美国众议院共和党议员迈克尔·麦考尔(Michael McCaul)、约翰·莫伦纳尔(John Molenaar)、马克斯·怀斯(Max Wise)和民主党议员拉贾·克里希纳莫西(Raja Krishnamoorthi)提出。麦考尔和克里希纳莫西是美国国会人工智能核心小组的成员,该小组成立的目的是为了让美国政策制定者了解AI的技术、经济和社会影响,并确保AI及相关领域的快速创新尽可能充分地惠及美国人。 法案称,目前,根据2018年的出口管制法案,美国商务部(BIS)可以停止出口用于创建AI模型的半导体以及用于创建这些半导体的工具,但美国商务部没有明确的法律权力来控制AI系统本身的转移。这意味着美国顶级AI公司可以将其最强大的AI系统出售给中国,甚至无需申请许可证。 因此,该小组成员称,新法案是对2018年出口管制法案的现代化改造,为BIS提供明确的法律授权,美国商务部可以灵活地对所涵盖的AI系统制定适当的控制措施,同时不会损害美国的创新。 美国商务部负责监管美国出口政策。但是,根据美国现行法律,美国商务部要监管开源AI模型的出口要困难得多,因为开源AI模型可以免费下载。如果上述新法案获得批准,它需要消除《国际紧急经济权力法》中包含的开源AI出口的监管障碍(只有在国家处于紧急状态下才可以实施商业限制),并赋予商务部明示授权来监管AI系统。 自去年起,AI大模型已经成为全球科技产业发展的共同目标,中美两国是最有竞争力的主角。大模型技术的爆发让美国初创公司OpenAI估值一路上涨至超过800亿美元,不到一年时间涨了3倍。微软通过对AI大模型的押注,市值超过3万亿美元,成为全球市值最高的公司。 中国科技界也在奋起直追,包括百度、阿里巴巴、字节跳动、腾讯、华为等几乎所有科技大厂均已入局。一年时间内,中国新晋大模型相关的独角兽公司(估值超过10亿美元)已有6家,其中智谱AI最新估值已经达到200亿元。 这一次的AI系统出口管制是此前美国科技制裁政策的延续。 第一波是美国对华芯片出口禁令。2022年和2023年,美国两度收紧对华AI芯片出口。大模型极度依赖高性能的AI芯片,2022年下半年开始,英伟达GPU芯片在中国市场的价格一路上涨。 2024年3月,美国再次升级芯片出口禁令,表示将对中国出口的AI半导体产品采取“逐案审查”政策规则,全面限制英伟达、AMD以及更多先进AI芯片和半导体设备售往中国。 芯片禁令后,不少中国科技公司一边囤芯片,一边大额采购包括微软云(Azure)、亚马逊云(AWS)和谷歌云在内的云服务,用来训练大模型和其他有高算力需求的业务。 2023年10月,拜登政府签署颁布《关于安全、可靠、值得信赖地开发和使用人工智能的行政命令》,其中提到“美国IaaS提供商在和外国客户交易时,需要向商务部提交报告”。 今年1月,美国商务部长吉娜·雷蒙多(Gina Raimondo)公开表示,虽然有芯片禁令,美国云计算公司的数据中心还在用芯片提供服务,要限制外国客户,尤其是中国客户使用美国云计算厂商的服务训练AI大模型的计划,“我们不能允许中国或者其他我们不希望的玩家使用我们的云服务训练他们的模型”。 再加上最新的AI模型开源管制,可以看出,美国政府想要达到从芯片、云计算到基础模型的多重管制效果。 影响几何? 目前,中国大模型产业对于美国科技公司的依赖依然存在。在算力方面,大模型主要用算力做训练和推理。训练环节是通过大量数据,不断调整参数,来提升大模型的能力,因此需要更高性能算力。推理环节则更偏向验证,输入新的数据或任务,得出结果,以此来验证大模型的能力。推理环节更注重算力的低延时属性,对于性能的要求相对低一些。 不少中国科技公司会把训练和推理环节分开处理,来优化成本和效率。通常训练环节会使用美国公司的云服务,推理环节用国产算力。 据《财经》了解,尽管此前有云服务管制要求,目前依然有不少中国公司在使用美国公司云服务,或是选择将数据中心建在海外来训练AI大模型。不过,这种监管方对外发出的信号在产业里已经产生了直接影响。一位美国云服务厂商人士向《财经》表示,产业界感到不确定性,所以即使政策并未完全锁紧,依然会让一部分中国公司在选择美国云厂商训练大模型时顾虑重重,从而放弃。 一位AI初创公司创始人告诉《财经》,目前中国GPU集群与Azure和AWS还有些差距,且短时间内很难赶超。此外,大模型相关的数据管制也可能产生影响。目前看来,高质量的知识型数据大多是英文数据。“中国的大模型产业需要重新思考一下技术路径,否则难以避免被制裁的局面。” 在开源模型方面,中国不少科技公司的模型是基于Meta于2023年2月发布的LlaMA,以及2023年7月发布的LLaMA2。 今年4月18日,Meta发布两款开源模型——Llama 3 8B与Llama 3 70B,供外部开发者免费使用。不少业内人士都评价称这是目前为止性能最强大的开源模型,开发者可以基于此做出媲美GPT-4水平的大模型产品。 此外,中国还有一些大模型是通过GPT-4生成的数据来训练。一位大厂AI技术总监告诉《财经》,这种方式的原理就是用高阶模型来训练低阶模型。大模型训练需要高质量数据,用这种方式可以减少数据处理成本,“GPT-4生成的数据大部分都比网上的数据库质量要高”。 因此,如果新法案实施,对于美国所有的大模型都增加限制,会直接造成国内部分科技公司训练大模型的成本增加,效率降低。 一位微软亚洲研究院人士告诉《财经》,针对AI的出口禁令并不可能完全将大模型出口封锁死,就像芯片禁令之后出现了一批靠倒卖英伟达芯片发财的“倒爷”,该禁令也可能会催生一批靠搬运大模型致富的群体。他认为,政策落下有实际影响,但是也不能忽视一些人在故意放大中美AI博弈的影响,“靠制造对立和焦虑来赚钱的人太多了”。 业内普遍认为,如果美国对华限制AI出口加剧,中美之间的AI技术发展分歧会越来越大。分裂的市场不仅不利于AI技术整体上的发展,且使企业开展业务变得困难,并进一步加剧中美供应链之间的隔阂。
卷价格的风还是吹到了AI大模型
作者 | 硬AI 编辑 | 硬AI 卷价格的风还是吹到了AI大模型。 近日,大模型DeepSeek-V2将每百万tokens输入/输出价格分别卷至1/2元,远低于行业平均水平。 对此,华福证券发布报告称,大模型成本优化与算力需求并不是直接的此长彼消,而是互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地,进而会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。 DeepSeek-V2是知名私募巨头幻方量化旗下AI公司深度求索(DeepSeek)发布的全新第二代MoE大模型。 华尔街见闻此前文章提到,DeepSeek-V2拥有2360亿参数,其中每个token210亿个活跃参数,相对较少,但仍然达到了开源模型中顶级的性能。 华福证券则在报告中写道,从综合性能方面来看,DeepSeek-V2位列第一梯队。在AlignBench、MT-Bench、MMLU等多个benchmark上表现出色,其中AlignBench在开源模型中居首位,与GPT-4-Turbo,文心4.0比肩。MTBench超过最强MoE开源模型Mixtral 8x22B。 01 DeepSeek-V2定价将至冰点 大模型价格战拉开序幕 DeepSeek-V2(32k)每百万tokens输入/输出价格分别为1/2元,而GPT-4-Turbo-1106分别为72/217元,DeepSeek-V2性价比显著。 相对于Claude 3 Haiku,DeepSeek-V2每百万tokens输入/输出价格也仅为其50%/22.2%。除此之外,同为32k上下文版本的moonshot-v1、SenseChat-32K、Qwen1.5 72B每百万tokens输入/输出价格分别为24/24、36/36、20/20元。 DeepSeek表示,采用8xH800 GPU的单节点峰值吞吐量可达到每秒50000多个解码token。如果仅按输出token的API的报价计算,每个节点每小时的收入就是50.4美元,假设利用率完全充分,按照一个8xH800节点的成本为每小时15美元来计算,DeepSeek每台服务器每小时的收益可达35.4美元,甚至能实现70%以上的毛利率。 有分析人士指出,即使服务器利用率不充分、批处理速度低于峰值能力,DeepSeek也有足够的盈利空间,同时颠覆其他大模型的商业逻辑。 华福证券也认为,此次DeepSeek-V2定价发布有望掀起新一轮大模型价格战,api定价有望持续走低。 02 大模型定价下降的背后离不开成本的优化 价格是怎么被打下去的?来自DeepSeek-V2的全新架构。 据悉,DeepSeek-V2采用Transformer架构,其中每个Transformer块由一个注意力模块和一个前馈网络(FFN)组成,并且在注意力机制和FFN方面,研究团队设计并采用了创新架构。 华福证券指出,目前众多大模型已经通过多种方式降低成本。 从模型压缩的方向看,可以通过量化的形式将浮点表征为低位宽模型来压缩模型存储空间,加速模型推理;从模型架构的方向看,MoE架构由于其内部的专家模型能够分配到不同设备,并可以执行并行计算,其计算效率较稠密模型显著提升,进而带来更低的成本。 从tokens量的方向来看,可以通过prompt压缩等方式直接降低输入端tokens,进而降低成本。除此之外,多种新的方案已出现在相关论文中,未来多种成本优化方案的融合将进一步加速模型成本的下降。
OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见
作者 | 香草 编辑 | 李水青 智东西5月11日消息,今天凌晨,OpenAI宣布将于美国时间13日上午10点(北京时间14日凌晨1点)在官网直播,演示ChatGPT、GPT-4的更新内容。 据外媒The Information今日报道,OpenAI正在构建具备音频和视觉理解能力的AI语音助手,其中一些功能已经开始向客户展示,可能在下周的发布活动中预览。 知情人士消息透露,OpenAI可能会在今年内完成GPT-5的开发并公开发布。此外,OpenAI还计划推出一种新的定价模式,客户通过预付费预定Token,最高可以享受50%的折扣。 此前有多家外媒和博主曝料,称OpenAI将在近日发布AI搜索引擎。其CEO阿尔特曼对此回应道:“不是GPT-5,也不是搜索引擎,但我们一直在努力开发一些我们认为会得到喜欢的新东西。” ▲阿尔特曼回应新品演示(图源:X) 值得注意的是,其竞争对手谷歌的I/O开发者大会时间定在美国时间14日上午10点(北京时间15日凌晨1点),预计可能发布Gemini大模型的重要更新。OpenAI此次发布时间没有定在之前外媒曝料的5月9日,而是“恰好”卡在I/O大会的前一天,火药味可谓浓厚。 要知道,这已经不是OpenAI第一次“卡点”狙击谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,结果没过几个小时,OpenAI就掏出文生视频“王炸”模型Sora,狠狠抢了Gemini 1.5 Pro的风头。 直播发布地址:http://openai.com 01. AI语音助手仍存在“幻觉”问题 或将集成至ChatGPT免费版 据The Information报道,阿尔特曼的终极目标是开发出类似电影《她》(Her)中,可高度响应的虚拟助手,提升苹果Siri等现有语音助手的可用程度。 ▲电影《她》剧照 OpenAI认为,具有视觉和音频功能的AI语音助手具有像智能手机一样的变革性潜力,理论上其可以做到一系列现在的AI助手无法做到的事,例如充当论文、数学问题指导老师,或是翻译交通标识、帮助解决汽车故障等。 但类似的技术目前所需硬件门槛太高,无法在个人设备上运行,用户可以在短期内使用基于云的版本来获取这些功能,例如自动化客户服务Agent。 OpenAI目前已经推出具备音频转录、文本转语音等功能的软件,不过这些功能是基于独立的对话AI模型实现,而新的语音助手则将这些功能整合在一起。据知情人士透露,该AI语音助手的音频功能能够帮助客服人员更好地理解对方的语气。 目前尚不清楚OpenAI何时向付费客户提供这些新功能,但据试用过该语音助手的人士透露,OpenAI最终的计划是将这些功能都纳入ChatGPT免费版本,目标是比目前其最先进模型GPT-4 Turbo的运行成本更低。该人士还谈道,AI语音助手在有些类型的问题上回答优于GPT-4 Turbo,但仍然存在幻觉问题。 对此,OpenAI发言人没有回应置评请求。 02. 与谷歌竞争iPhone合作位 GPT-5或于年底前发布 OpenAI推出AI语音助手主要目标是与谷歌竞争。 谷歌的AI模型Gemini能实时响应语音命令,并识别图像、视频等。不过这些功能目前仍需要研究人员附以图像和文字说明,且并不能理解许多传统的语音指令,也不能像Siri和谷歌助手等传统语音助手那样与用户对话。 ▲谷歌展示Gemini多模态功能(图源:谷歌) 另一方面,提高模型的视觉、音频能力也有助于OpenAI与苹果达成合作。 最近几个月,苹果与OpenAI就下一代iPhone操作系统如何整合OpenAI的模型进行了讨论。然而,与此同时,苹果也与谷歌进行着类似的谈判。 这场竞争的最新消息是,据彭博社今早报道,苹果已接近与OpenAI达成协议,将在下一代iPhone操作系统iOS 18中使用ChatGPT;与谷歌尚未达成协议,但谈判仍在进行中。 除了可能在下周推出的AI语音助手外,OpenAI还一直致力于构建一款AI搜索引擎,旨在与谷歌竞争。此外,其也在开发一种被称作“计算机使用Agent”的自动化软件,用来辅助软件开发和其他计算机任务。 阿尔特曼还在与iPhone开发者乔尼·艾维(Jony Ive)合作开发一款独立的AI硬件。然而,最先进的AI模型体积庞大,需要在云端运行,并需要互联网连接才能工作。要使具有视觉和听觉功能的复杂AI模型变得足够小巧,以便在设备上运行,可能需要几个月甚至几年的时间。 不过,大家最关心的可能还是GPT-5。据The Information报道,一位接近OpenAI领导人的人士称,其可能在今年年底完成GPT-5并公开发布。 OpenAI的新产品和AI模型开发工作进展得如火如荼,与此同时,其此前宣布的一些项目却变得不再那么受关注。尽管OpenAI曾向开发者承诺,会在今年第一季度推出GPT Store开发者激励计划,但目前仍没有实现。 03. 计划推出预付费定价模式 最高提供50%折扣 在定价方面,据知情人士透露,OpenAI计划推出一种新的定价模式,如果客户通过预付费预定Token,最高可以享受50%的折扣。 这样的优惠形式在云计算领域比较常见,微软Azure、谷歌云、亚马逊云服务(AWS)等都提供提前预定服务器容量折扣的方式来降低成本。 目前,按需定价提供API(应用程序接口)是OpenAI大模型的主要付费形式,通过每生成100万Tokens,向开发者收取几美分至一百多美分不等的费用,其中大客户可以享受批量折扣。 此前OpenAI已经提供了一种降低开发者成本的方式,其在4月推出Batch API,如果开发者批量上传模型查询,并接受等待最长24小时的时间,就可以获取更低的价格。 Together AI和Anyscale等AI服务器经销商曾表示,在他们的软件上运行开源模型要比使用OpenAI的模型便宜6倍。通过更灵活的定价,OpenAI与其他模型开发商的竞争将更具优势。据透露,其今年的营收可能达到数十亿美元。 04. 结语:OpenAI谷歌相争 苹果微软得利? OpenAI与谷歌之间的竞争愈发激烈,二者之间的“商战”火药味也愈发浓厚。OpenAI又一次将新品发布时间定在了谷歌重大发布时间附近,似乎执着于抢夺谷歌风头这件事。 这一边,苹果同时与OpenAI、谷歌商谈模型集成至iPhone事宜,再次加剧了两家公司之间的竞争。虽然OpenAI被曝已与苹果达成合作,但谷歌那边的谈判也仍在继续。 而另一边,微软作为OpenAI最大的财务支持者,可以优先使用其先进技术来改进自己的语音助手。而微软也并非“孤注一掷”,除了积极自研模型外,还投资了OpenAI有力竞对Mistral AI,后者成为第二家在微软Azure云平台上提供商业AI模型的公司。 下周的OpenAI新品发布和谷歌I/O大会,或许会将这场“商战”推向新高度。究竟谁的“大招”会更厉害,我们拭目以待。
“美国最该尴尬的,是今天中国开源模型们重大的贡献”
作者|张潇雪 最近在许多美国开发者的口中,一个开源模型经常被提及,它的发音听起来是“困”。乍一听到总让人一头雾水。哪个开发者天天用中文说困啊。 其实,这就是阿里的开源模型通义千问,这个取自拼音缩写的名字Qwen,被老外自成一体给了一个新发音。 除了Qwen,还有好几个国产开源大模型在海外激战正酣,并且频繁刷新各项benchmarks,呼声和反响甚至比在国内还高。这些来自中国团队的开源模型们不仅不“困”还进展飞速。 Stability AI研究主管Tanishq Mathew Abraham干脆发文提醒道:“许多最具竞争力的开源大模型,包括Owen、Yi、InternLM、Deepseek、BGE、CogVLM 等正是来自中国。关于中国在人工智能领域落后的说法完全不属实。相反,他们正在为生态系统和社区做出重大贡献。” 那到底现如今,中国的开源大模型们厉害到什么程度?下面逐一来看。 01 通义千问:登顶主流开源榜,八种尺寸个个能打 5月9日,阿里云正式发布地表最强中文开源大模型通义千问2.5。相较上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文语境下性能“全面赶超 GPT-4”。 上月底,团队刚开源了Qwen1.5系列首个千亿参数级别模型Qwen1.5-110B,能处理 32K tokens 上下文长度,支持英、中、法、西、德等多种语言。技术上采用Transformer架构,并具有高效的分组查询注意力机制。基础能力可逼近Meta-Llama3-70B和Mixtral-8x22B,在MT-Bench和AlpacaEval 2.0的聊天场景评估中也表现出色。 Liquid AI高级机器学习科学家Maxime Labonne看了表示:“太疯狂了。Qwen1.5-110B在 MMLU 上的得分竟然高于‘性能野兽’ Llama 3 70B的instruct版本。微调后它将有可能成为最强开源SOTA模型,至少能和Llama 3媲美。” Qwen1.5-110B还曾凭实力登顶Hugging Face 开源大模型榜首。 实际上,自从通义千问去年8月宣布“全模态、全尺寸”开源路线以来,就开始马不停蹄地迭代狂飙,强势闯入海外AI开发者社区的视野。 为满足不同场景需求,通义一共推出横跨5亿到1100亿参数规模的八款大模型,小尺寸如0.5B、1.8B、4B、7B、14B可以在端侧设备便捷部署;大尺寸如72B、110B能支持企业和科研级应用;而32B的中等尺寸则力求在性能、效率和内存之间找到最佳性价比。 在各种尺寸的灵活选择下,通义千问其它参数的模型性能也好评如潮。 其中Qwen-1.5 72B曾在业界兵家必争之地:LMSYS Org推出的基准测试平台Chatbot Arena上夺冠,Qwen-72B也多次进入“盲测”对战排行榜全球前十。 推特大V 、Abacus.AI公司创始人和首席执行官Bindu Reddy直接挂出Qwen-72B的基准测试成绩兴奋地说:“开源的 Qwen-72B 在一些benchmarks上击败了 GPT-4!中国正在回击困扰美国的AI公司垄断!加入全球开源革命吧!” 另有网友指出Qwen-72B基础模型在VMLU ,也就是越南语版本的MMLU上无需微调、开箱即用,即可达到与 GPT-4 相同分数的最先进水平。 较小参数的Qwen家族成员更是备受欢迎。 在Hugging Face平台上,Qwen1.5-0.5B-Chat和CodeQwen1.5-7B-Chat- GGUF上月分别获得22.6万次和20万次下载量。包括Qwen1.5-1.8B和Qwen1.5-32B在内的5个模型上月下载量都在10万次以上。(总共发布76个模型版本,也真的堪称行业劳模。) 我们还注意到,在今天很多的对模型性能进行分析的论文中,Qwen也几乎成为必选的分析标的,成为开发者和研究者默认的最有代表性的模型之一。 02 DeepSeek V2:大模型届的“拼多多” 5月6日,私募巨头幻方量化旗下的AI公司深度求索发布全新第二代MoE大模型DeepSeek-V2,模型论文双开源。 其性能在AlignBench排行榜中位列前三,超过GPT-4且接近GPT-4-Turbo。MT-Bench中属于顶尖级别,与LLaMA3-70B比肩,远胜Mixtral 8x22B。支持 128K 的上下文窗口,专精于数学、代码和推理任务。 除了采用MoE架构,DeepSeek V2还创新了Multi-Head Latent Attention机制。在总共 236B 参数中,仅激活21B 用于计算。计算资源消耗仅为Llama 3 70B 的五分之一,GPT-4 的二十之一。 除了高效推理,最炸裂的是,它实在太物美价廉了。 DeepSeek V2在能力直逼第一梯队闭源模型的前提下, API定价降到每百万tokens输入1元、输出2元(32K上下文),仅为Llama3 70B七分之一,GPT-4 Turbo的近百分之一,完全就是价格屠夫。 便宜归便宜,DeepSeek却并不赔钱。它在 8 x H800 GPU 的机器上可以实现每秒5万tokens峰值吞吐。按输出API 价格计算,相当于每个节点每小时收入50.4 美元。国内 8xH800 节点的成本约 15 美元/小时,因此假设利用率完美,DeepSeek 每台服务器每小时的利润高达 35.4 美元,毛利率可达 70% 以上。 另外DeepSeek平台还提供与OpenAI兼容的 API,注册就送500万tokens。 ——高效、好用、击穿地板的价位,不正是开源社区迫切需要的吗? 这直接引起权威半导体研究和咨询公司SemiAnalysis高度关注,5月7日发长文点名DeepSeek V2是“东方崛起的神秘力量”,凭超高性价比对其它模型实现“经济学碾压”,指出“OpenAI和微软的行业挑战可能不只来自美国。” Hugging Face技术主管Philipp Schmid在X发文,列出DeepSeek V2各项技能点向社区隆重推荐。上线仅四天,Hugging Face上的下载量已达3522次,在GitHub也瞬间收获1200颗星星。 03 面壁智能:另辟蹊径、以小博大 在通往 AGI 的路上,有的像DeepSeek这样面对算力为王,主攻经济高效;也有像通义千问那样全面开花,布局各种模型规模;但绝大多数公司的路线是遵循Scaling Law,狂卷大参数。 而面壁智能却在走一条相反的路线:尽可能把参数做小。以更低的部署门槛、更低的使用成本让模型效率最大化,“以小博大”。 今年2 月 1 日,面壁智能推出只有24亿参数量的 MiniCPM-2B模型,不仅整体领先于同级别Google Gemma 2B,还超越了性能标杆之作 Mistral-7B,且部分胜过大参数的Llama2-13B、Llama2-70B-Chat等。 在海外社区开源后,Hugging Face联合创始人Thomas Wolf紧接着发文说,“中国出现了一系列令人惊叹的技术报告和开源模型,比如 DeepSeek、MiniCPM、UltraFeedback...它们的数据和实验结果都被公开分享,这种对知识的坦诚分享在最近的西方科技模型发布中已经丢失了。” 网友转发赞同:“MiniCPM 实在令人印象深刻,拥有 20 亿参数,并从这么微小的模型中获得了最佳结果。” 另一位同读过MiniCPM模型论文的网友更是激动盛赞,“面壁智能正掀起一场改变游戏规则的革命。” “想象一下,在你口袋里拥有强大的人工智能,而不仅仅是云端。MiniCPM-2B 不是普通的模型。它只拥有 24 亿参数,却超越了自己 5 倍大的巨人!尺寸并不是唯一标准,关键在于如何利用它。这就是边缘人工智能未来的愿景,可能重新定义我们与技术的互动。” 70天后,面壁智能乘胜追击,继续发布了新一代“能跑在手机上的最强端侧多模态大模型”MiniCPM-V 2.0,参数规模 2.8B。 据其在Hugging Face上介绍,MiniCPM-V 2.0 在包括 OCRBench、TextVQA、MME在内的多个基准测试中都达到了开源社区最佳水平。在覆盖 11 个流行基准测试的OpenCompass 综合评估上,它的性能超过Qwen-VL-Chat 9.6B、CogVLM-Chat 17.4B 和 Yi-VL 34B。甚至在场景文字理解方面已接近 Gemini Pro 的性能。 04 “与Mistral们相比,中国的许多模型是真的在开源” 除了以上提到的DeepSeek、Qwen和MiniCPM,上海人工智能实验室和商汤联合研发的InternLM、零一万物的Yi系列、智谱AI的多模态大模型CogVLM等等中国的开源模型也在开发者社区里备受欢迎。 人们在推特还特别讨论到,由于中英文间的语言障碍,海外通常能看到中国大模型也只是发布的一部分,太多AI应用和集成没有被完全展现。推测这些模型在中文上表现应该比英文更好。但即便如此,它们在英文基准测试上已具备相当的有竞争力。 还有人提出,自己属实被过去一年中Arxiv上AI论文里中文署名作者的庞大数量震惊到了。 前斯坦福兼职讲师、Claypot AI联合创始人Chip Huyen在调研过900个流行开源AI工具后,在个人博客中分享自己的发现:“在GitHub排名前20的账户中,有6个源自中国。 开源的一个好处就是让阴谋论无法继续。 OpenAI早期投资人Vinod Khosla曾在X发文称,美国的开源模型都会被中国抄去。 但这番言论马上被Meta的AI教父Yann LeCun反驳:“AI不是武器。无论我们是否把技术开源,中国都不会落后。他们会掌控自己的人工智能,开发自己的本土技术堆栈。” 而且,在开源的诚意上,中国模型也开始被开发者认可。有在斯坦福读书的同学也分享到,教授在课堂上大力称赞中国开源模型,特别是开诚布公地与社区积极分享成果,跟欧美一些头顶“开源”名号的明星公司不同。有网友也表达了和这个教授相似的观点,“美国最该尴尬的,是今天中国开源模型们重大的贡献”。 大模型技术的发展中开源注定将继续扮演重要的推动角色,而且这也是首次有开源和闭源技术几乎齐头并进的景象出现。在这股浪潮里,中国的开源贡献者正在通过一个个更有诚意的开源产品给全球社区做着贡献。
生成式AI,苹果倾巢出动
作者 | 云鹏 编辑 | 李水青 智东西5月11日消息,今天一大早,苹果AI炸了锅! 一边彭博社曝出猛料:苹果马上要跟OpenAI签署协议,将ChatGPT相关技术用在iPhone里。 另一边,《纽约时报》曝出苹果Siri即将发布的一系列重磅生成式AI升级、背后研发细节,以及苹果顶层高管做出要给Siri做“大脑移植”这一决定的幕后原因。 外媒AppleInsider则报道称,苹果将把实时录音转录、文本摘要总结等标志性生成式AI功能用在语音备忘录、笔记、消息、Safari等核心系统级应用中,做“系统级AI”。 在当下这波以大语言模型为基础的生成式AI热潮中,苹果毫无疑问是落后了,以ChatGPT为代表的聊天机器人应用已经火遍全球,但苹果至今还没有明确动作。 以苹果公司CEO库克为代表的高管不停地向外界传达“苹果很重视生成式AI”这一观念,但最终大家关注的还是苹果到底要怎么做AI。 今天,关于苹果AI的更多关键问题,似乎都有了更清晰的答案。苹果的生成式AI大招,我们已经能够窥见一隅。 一、拥抱OpenAI?苹果做AI选择两条腿走路 苹果做AI到底是单干还是合作?目前来看,苹果大概率是会“两条腿走路”。 据彭博社报道,苹果即将与OpenAI达成一项协议,在iPhone上使用OpenAI的相关技术,将ChatGPT放到iPhone中(Put ChatGPT on iPhone)。根据这份协议,苹果将在未来发布的iOS 18中使用ChatGPT功能。 双方谈判仍在进行中,协议尚未最终达成。 但值得注意的是,ChatGPT此前早已在苹果的App Store中开放下载多时,iPhone用上ChatGPT,已经是过去时了,所以此次苹果与OpenAI的合作,或许更多聚焦于背后的模型层面,将更多“ChatGPT的能力”接入到iPhone中。 据彭博社报道,苹果也在与谷歌就使用Gemini大模型问题进行商谈。 二、苹果要给Siri“换脑”!从根上治病 说完了合作,我们来看看苹果自己的AI到底要怎么做。据《纽约时报》报道,Siri将会成为苹果做生成式AI的关键抓手之一。 据报道,其实从去年年初,也就是ChatGPT刚火的那阵子,苹果公司软件工程高级副总裁Craig Federighi和苹果公司机器学习和AI战略高级副总裁John Giannandrea就已经做出决定,要给Siri来个“大脑移植”。 没错,治标已经不行了,苹果要直接给Siri换个脑子。 这两位高管都是苹果发布会上的熟面孔了,也是直接向库克汇报的苹果核心高管,可以说,苹果的AI要做成什么样,库克和这两个人是最核心决策者。 据报道,这两位高管花了好几周测试OpenAI的ChatGPT,这促使他们做出了给Siri“换脑”的决定。 有熟悉Siri的苹果人士透露,当时ChatGPT写诗、写代码、回答复杂问题几乎无所不能,这让Siri看起来有些过时。 三、Siri十三年后,苹果发动十年来最大规模内部改组 2011年,Siri作为最早的一批智能助手出现在了iPhone上,只不过那时的“智能”还较为初级。十几年来,Siri一直聚焦于处理一些个人请求,不具备对话跟踪能力,误解问题是家常便饭。 什么是对话跟踪?比如你问ChatGPT旧金山天气怎样,然后紧接着问它“纽约怎么样?”,ChatGPT会明白你是在问纽约的天气,但Siri就不知道。 毫无疑问,Siri的能力已经被大幅赶超了,在技术层面,Siri已经落后了。这促使苹果这家科技巨头进行了十多年来最大规模的内部改组。 据报道,目前生成式AI在苹果内部已经成为了一个“支柱型”项目,一个“a tent pole(帐篷杆)”的项目,“帐篷杆”这个叫法是苹果内部特有的,用来组织苹果员工参与这场十年一遇的创新大项目。 可以肯定的是,苹果正全力以赴在这场AI竞赛中迎头赶上。 四、Siri将拥有一套新的生成式AI系统,端侧大模型“幻觉”或成挑战 苹果的决心我们都明白了,那“换脑”后的Siri究竟会变成什么样? 目前各路报道都认为苹果会在6月10日举办的WWDC24上发布升级版Siri,也就是苹果的重要AI大招之一。 升级后的Siri会更能聊,功能也会更加丰富。据三名相关知情人士透露,Siri的基础技术将会包括一套新的生成式AI系统,这套系统会让Siri和ChatGPT一样具备真正的“聊天”能力,而不仅仅是“一问一答”。 2018年之前一直在苹果工作的Siri联合创始人Tom Gruber说,Siri一直想拥有一个可以理解语言和上下文的对话界面,但这一直很难实现。 据三位知情人士透露,苹果并不会发布一款“类ChatGPT”应用来直接与ChatGPT竞争,苹果的重点是让Siri更好地完成手头的既有任务,比如设置计时器、创建日程安排、在购物清单上添加心仪的商品,当然,新Siri也可以总结文本信息。 苹果在宣传新Siri时,可能会更侧重标榜其“私密性”,因为Siri处理所有的请求都将是在“端侧”完成的,也就是在iPhone上处理,而不用“上云”。 这侧面可以帮苹果省下一笔不小的费用,要知道,ChatGPT每生成1000个单词就要花OpenAI 12美分。 当然,苹果这种做法不是没有弊端的,iPhone本地运行的模型规模有限,这种较小型的模型最容易出现的一个问题就是“幻觉”——编造出一些事实上本不存在的答案。 值得一提的是,苹果在iPhone 15系列上还提前把内存升级到了8GB,这被认为是给新Siri提前做的准备之一。另外苹果也在跟谷歌、OpenAI、Cohere等公司商谈AI大模型相关授权问题,提前做好准备。 五、更多重磅生成式AI功能落地系统级应用,关键功能仍需端云协同 除了Siri,据外媒AppleInsider报道,苹果准备将实时录音转录和摘要总结功能应用在多款产品中,并且这个功能会是“系统级”的,也就是说,不论是你是看视频还是开会,都可以录音并总结重点。 苹果的语音备忘录(Voice Memos)应用将是首批获得这一功能升级的应用程序之一。 此外笔记(Notes)应用也会升级,支持基本的文本摘要、总结功能,加上内置的音频录制和实时转录选项,苹果这个系统级的笔记应用可能会成为生成式AI落地的一个关键应用。 这对于学生上课记笔记以及商务人士参加会议来说都会是一大福音。 苹果希望利用AI技术提升自家几个核心应用程序的效率。目前苹果正在测试这些功能,准备在今年的iOS 18中发布,当然,这些功能也会被用于macOS以及iPadOS中。 据报道,转录和摘要功能只是苹果今年AI升级的一部分,预计类似的摘要功能也会应用于Safari浏览器、消息(Messages)应用中。 Safari将支持网页总结,而消息应用则可以提供消息内容的“浓缩版”。 虽然苹果计划在端侧运行AI,但音频转录和高级AI摘要可能暂时仍然需要云端的辅助。 六、生成式AI或颠覆iOS和安卓,苹果iPhone怕“变砖” 生成式AI新技术的到来,为何会让苹果如此“紧张”?据两位熟悉苹果高管想法的人士透露,苹果高管担心生成式AI会威胁到苹果在全球智能手机市场中的主导地位,因为生成式AI所能够创造的“新生态系统”可能会彻底取代当下的智能手机操作系统,包括iOS和安卓。 值得一提的是,目前国内有荣耀这样的手机厂商已经提出手机操作系统需要用AI“重做一遍”,可以看到,生成式AI对智能手机这类产品的影响,一定是深入操作系统底层的。在这点上,顶级科技巨头们“不谋而合”。 基于新的生成式AI技术实现的AI,如今也被称为“智能体”,这个智能体实际上就是一个“AI应用生态系统”,它可以直接帮用户打车、安排日程,调用各种服务接口、调用各种大模型能力,这会削弱苹果App Store的地位,用户可能不再需要通过下载App来获取服务了。 苹果应用商店的年销售额约为240亿美元,这对苹果来说无疑是一个“动家底”的大事。 除了担心应用商店的大蛋糕被动,苹果另一大担忧是,如果不能开发出自己的AI系统,跟其他竞争对手的产品相比,iPhone可能会失去竞争力,变成一块“笨砖头(dumb brickr)”。 目前iPhone的年销售额超过了2000亿美元,苹果一家独占全球智能手机市场85%的利润,iPhone,是苹果的根基所在。 七、内部调整聚焦AI,人才仍是苹果AI的“短板” AI掉队的这种紧迫感让苹果这一年多以来动作频频,比如此前苹果取消了耗资百亿美元的自动驾驶汽车项目,将原项目中的数百名工程师转移至AI研发团队。 据两位知情人士透露,苹果还在探索和开发使用iPhone和Mac芯片的服务器,简单来说,苹果要用自己的自研芯片做自己的AI服务器,把A系列芯片和M系列芯片用在服务器里,让未来产品所用到的云端AI功能跑在真正“可以被苹果掌控”的服务器上。 这样一来,苹果终端产品和云端服务器从硬件芯片层面来说也可以有更好的一致性。 当然,这样做也可以帮苹果省下一大笔钱。 据彭博社报道,此前苹果发布的M2 Ultra或成为苹果首个AI服务器芯片。 虽然苹果目前的节奏有些慢了,但苹果做AI的优势还是很明显的,首先,苹果在全球有20多亿部iPhone,苹果可以将新的AI产品应用在这些设备上。 同时,苹果有着强大的芯片团队,他们可以为AI功能解决算力之忧。 据报道,苹果在过去的十年里,一直在努力开发AI相关技术,建立自己的“全面的AI战略”,但Siri从发布以来就没有什么重大进展。 John Burkey曾经为苹果Siri工作了两年,离开苹果后他创立了一个生成式AI公司Brighten.ai,他说,Siri团队没有获得苹果内部其他团队所获得的那种关注和资源。“这不是苹果的基因,这是一个盲点。”Burkey说道。 多年来,苹果一直在招揽AI方面的人才,收购AI领域的高价值创企,但苹果同样面临着非常严重的AI人才流失问题。 据报道,AI人才离开的一个重要原因可能是苹果过于严格的保密措施,苹果在AI方面发表的论文要远少于谷歌、Meta、微软等公司,2020年离开苹果重返卡内基梅隆大学的顶尖AI研究员Ruslan Salakhutdinov就表达了自己当时渴望重回学术界的想法,他希望去一个研究所,去一个更“Open”的地方工作。 虽然最近几个月苹果发表的AI相关论文略有增加,但一些AI领域的大佬对这些论文的价值提出了质疑,认为这些论文更多是一些“面子工程”,而不是真正可以让苹果落地在产品中的研究。 结语:软硬件生态并行,苹果AI大招蓄势待发 从各路爆料信息来看,苹果Siri的一系列重磅生成式AI升级、iOS 18中即将加入的各类生成式AI功能,以及苹果与OpenAI、谷歌等公司的密切商谈,都表明了苹果对AI的重视,并且我们能够看到苹果做AI是多线出击、全方位布局,从软件、硬件、操作系统到三方合作,苹果都在紧锣密鼓做着准备。 Siri多年来的“不瘟不火”,或许即将成为历史,苹果将与谷歌、亚马逊等科技巨头一样,用大模型重塑智能语音助手。 接下来,苹果将在6月的WWDC上交出一份怎样的答卷,不仅关乎苹果自身AI及整个业务盘的发展,更关系到整个消费电子产业后续如何应用AI,很多企业都在以苹果为标杆。 当然,国内不少智能手机领域的头部玩家都已经行动多时,各类生成式AI功能早已落地,后来者苹果能否真正带来一些改变行业的新玩法,值得期待。
OpenAI还能领先多久?Meta、微软们正从场景、算力、成本端全面围剿
图片来源:Unsplash 要点总结 算力竞争:人工智能领域内的大型科技公司正在通过不断增加的GPU采购和开发更先进的AI模型来激烈竞争,OpenAI正在被全面围攻。 技术与成本竞争:中国公司DeepSeek通过开源高效能、低成本的AI模型正在改变市场竞争格局,为企业提供了更多自主选择和成本效益更高的解决方案。 微软是否靠得住:微软在积极发展自己的AI技术和模型,以减少对单一合作伙伴的依赖并应对潜在的控制权风险。 所有人都在关注人工智能领域无利可图的支出会持续多久。H100 的租赁价格每个月都在下降,并且中型集群的可用性正在以合理的价格快速增长。尽管如此,显然需求动力仍然强劲。虽然大型科技公司仍然是最大的买家,但全球范围内越来越多样化的买家名单仍在连续增加 GPU 采购量。 大多数繁荣并不是由于任何形式的收入增长,而是由于基于对未来业务的梦想而急于建立更大的模型。大多数人心中的明确目标是赶上甚至超越 OpenAI。如今,许多公司距离 OpenAI 在 Chatbot ELO 中最新的 GPT-4 仅有很短的距离,并且在上下文长度和视频模式等某些方面,一些公司已经处于领先地位。 资料来源:SemiAnalysis 、ArtificialAnalysis.ai 很明显,只要有足够的计算能力,最大的科技公司就可以与 OpenAI 的 GPT-4 相媲美。据传 Gemini 2 Ultra 在各方面都超越了 GPT-4 Turbo。此外,Meta 的 Llama 3 405B 在开源的同时也将与 GPT-4 相匹配,这意味着任何可以租用 H100 服务器的人都可以使用 GPT-4 级智能。 01 DeepSeek奋起直追 迅速迎头赶上的不仅仅是美国大型科技公司。中国的DeepSeek开源了一款新模型,它的运行成本比 Meta 的 Llama 3 70B 更便宜,而且性能更好。虽然该模型更适合中文查询(分词器/训练数据集)和内容审查,但它也恰好在代码(HumanEval)和数学(GSM 8k)的通用语言中获胜。 此外,定价非常便宜。Deepseek 的模型明显比任何其他竞争模型便宜。他们的定价甚至超越了正在进行的风投竞逐,这些风投投资于推理 API 提供商,而这些提供商在服务 Meta 和 Mistral 模型时赔钱。 资料来源:SemiAnalysis 、ArtificalAnalysis.ai 、各种模型基准 DeepSeek 声称,8 个H800 GPU 的单个节点可以实现每秒超过 50,000 个解码令牌的峰值吞吐量(或在具有 disagg 预填充的节点中实现 100k 预填充)。仅根据输出代币的 API 报价,每个节点每小时的收入为 50.4 美元。在中国,8xH800 节点的成本约为每小时 15 美元,因此假设利用率完美,每台服务器每小时可赚取 35.4 美元,即毛利率高达 70% 以上。 即使假设服务器从未得到完美利用,并且批量大小低于峰值能力,DeepSeek 仍有足够的赚钱空间,同时在成本上击败竞争对手。毫无疑问的是,Mixtral、Claude 3 Sonnet、Llama 3 和 DBRX 已经击败了 OpenAI 的 GPT-3.5 Turbo。 更有趣的是 DeepSeek 推向市场的新颖架构。他们没有效仿西方公司的做法。MoE、RoPE 和 Attention 都有全新的创新。他们的模型有 160 多名专家,每个前向传递有 6 个专家。总参数为 2360 亿个,每个前向传递有 210 亿个活跃参数。此外,DeepSeek 实现了一种新颖的多头潜在注意力机制,他们声称该机制比其他形式的注意力具有更好的扩展性,同时也更准确。 来源:DeepSeek 来源:DeepSeek 他们使用 8.1 万亿个代币训练模型。DeepSeek V2 能够实现令人难以置信的训练效率,其模型性能优于其他开放模型,计算量仅为 Meta 的 Llama 3 70B 的1/5 。对于那些跟踪的人来说,DeepSeek V2 训练所需的失败次数是 GPT-4 的1/20,而性能却相差不远。 资料来源:SemiAnalysis 、ArtificalAnalysis.ai 、各种模型公告 这些结果表明中国企业现在也具有国际竞争力。此外,就共享的信息和细节而言,这篇论文可能是今年最好的一篇。 虽然国外的竞争对OpenAI来说是一个挑战,但他们最大的合作伙伴也是他们最要提防的。 02 微软靠得住吗? 微软直接为 OpenAI 投入了超过 100 亿美元的资本支出,但他们并没有将大部分 GPU 能力用于 OpenAI。微软计划每年在人工智能数据中心上花费超过 500 亿美元,其中大部分将用于内部工作负载。其中大部分都是为了在自己的产品和服务中部署 OpenAI 模型进行推理,但这种情况正在发生变化。 由于 OpenAI 的怪异结构,微软被迫寻找应急计划。OpenAI 是一家非营利组织,其主要目标是创造安全且造福全人类的通用人工智能 (AGI)。OpenAI 可以而且将会打破微软能够访问 OpenAI 模型的协议,而微软的追索权为零。 虽然与 Microsoft 的合作伙伴关系包括数十亿美元的投资,但 OpenAI 仍然是一家完全独立的公司,由 OpenAI Nonprofit 管理。微软是无投票权的董事会观察员,没有控制权。 AGI 明确地包含在所有商业和知识产权许可协议中。董事会决定何时实现 AGI。再次强调,AGI 指的是一个高度自治的系统,在最具经济价值的工作中表现优于人类。此类系统不包括在与 Microsoft 签订的 IP 许可和其他商业条款中,这些条款仅适用于 AGI 之前的技术。 对于微软来说,最令人担忧的是,OpenAI 的董事会可以在没有微软任何投票参与的情况下随时决定他们已经实现了 AGI,而微软无权获得用他们的投资创建的 IP。 当你将 OpenAI 与其非营利和营利部门相关的大量治理问题叠加起来时,微软必须制定应急计划。 丨微软计划如何减少对 OpenAI 的依赖 微软正试图将其大部分推理量从 OpenAI 的模型转移到他们直接为其开发 IP 的自己的模型上。这包括 Copilot 和 Bing 计划,它们推动了微软人工智能的发展。当 OpenAI 拥有唯一的模型时,微软当然会在他们的产品中使用它,但除此之外,他们将优先考虑自己的模型来处理大多数查询。 问题是怎么做? 虽然微软在 AI 人才方面与 OpenAI 甚至与 Meta 都没有竞争力,但他们正在迅速尝试尽快培养这些技能。对 Inflection 的伪收购使他们能够快速跳转到一个不错的模型以及坚实的预训练和基础设施团队,但要实现 OpenAI 不断变化的目标,还需要做更多的事情。 资料来源:SemiAnalysis、OpenAI、Inflection AI 微软已经拥有一些强大的团队致力于合成数据,这可以被认为是下一代模型最重要的战场之一。Microsoft Phi 模型团队因使用来自大型模型的大量合成数据来训练小型模型而闻名。最新发布的 Phi-3 模型令人印象深刻。如果目标只是稍微落后于 OpenAI,那么这个策略将会奏效。 微软的另一个团队 WizardLM 创造了更令人惊奇的东西,称为“Evol-Instruct”。它是一种基于人工智能的方法,用于为大语言模型生成大量不同的指令集。目标是提高法大语言模型遵循复杂指令的能力,而不依赖于人工创建的数据,这些数据可能昂贵、耗时且缺乏数量/多样性。 相反,数据是由人工智能创建和管理的,通过与自身的模拟聊天来递归地改进自身。人工智能将判断质量并迭代以生成更好的数据。它还利用渐进式学习来改变数据组合,从简单开始,逐渐增加训练数据的难度和复杂性,因此模型可以更有效地学习。 Microsoft 目前正在通过 MAI-1 ~500B 参数 MOE 模型进行首次达到 GPT-4 级别的重大努力。它利用 Inflection 预训练团队及其数据集与微软自己的一些合成数据相结合。目标是在本月底之前从头开始拥有自己的内部 GPT-4 级模型。 我们不确定它是否会完全击中目标,但 MAI-1 计划只是积极内部建模工作漫长道路的开始。 许多公司通过 Azure 使用 OpenAI 的技术。超过 65% 的财富 500 强企业现在使用 Azure OpenAI 服务。值得注意的是,这并不是直接通过 OpenAI 实现的。如果 Google Deepmind 或 Amazon Anthropic 仅仅通过微软推出自己的模型来获得份额,OpenAI 可能会失去大量业务。 03 分销和整合为王? 随着 DeepSeek 和 Llama 3 405B 开源,企业没有理由不托管自己的模型。扎克伯格利用开源模式减缓竞争商业采用并吸引更多人才的策略正在创造奇迹。鉴于 Databricks 在从头开始训练优于 GPT 3.5 质量的通用模型方面也非常有能力,因此微调不再是一项艰巨的任务。 OpenAI 的优势之一是他们在收集使用数据方面一直处于领先地位,但这种情况很快就会改变。这是因为 Meta 和 Google 都可以更直接地接触消费者。只有四分之一的美国人曾经尝试过 ChatGPT,而且大多数人不会继续使用它。未来大多数消费者 LLM 使用将通过现有平台、Google、Instagram、WhatsApp、Facebook、iPhone/Android。 虽然 Meta 尚未找到如何将其货币化,但他们的 Meta AI 由 Llama 3 70B 提供支持,可在 Facebook、Instagram、Whatsapp 上使用。宣布的推广已扩展到包括美国在内的 14 个国家,这些国家的人口总数为 11 亿。数量惊人的用户已经可以使用比 ChatGPT 免费模型更好的模型。Meta AI 正处于其增长曲线的早期阶段,仅实现其整个 32.4 亿每日活跃用户群的 1/3。 虽然 Llama 3 70B 可能缺乏更大、功能更强的型号的大部分功能,但它可能是适合其用户的产品市场,其中包括许多新兴市场的移动中心用户,人们会假设这种以移动为中心的用户用户可能会进行较短的一般知识查询,而不是集中于高输入令牌代理用例。Meta 的部署对 Google 搜索的伤害可能比 Bing 或 Perplexity 还要大。 为了服务 3B 人群——显然需要一个小型且高效的模型来降低推理成本。要么 Meta 已经让金融数学发挥作用,要么准备投入巨资在消费者人工智能领域抢占先机。这两种情况对现任者来说都意味着灾难。 不仅仅是 Meta 正在为战斗站集结——谷歌的用户覆盖范围与 Meta 处于同一数量级。如果谷歌与苹果达成协议,让其Gemini 模型专门在 iPhone 上提供服务,那么谷歌十多年前用来巩固其在搜索市场主导地位的策略也将适用于此。 04 算力和资本为王吗? 另一个争论是计算和资本是否为王。在这种情况下,鉴于Google 的 TPU 建设步伐异常激进,他们将成为王者。讽刺的是,谷歌现在已经有了重点,并将所有大规模培训工作都集中到一个合并的 Google Deepmind 团队中,而微软则开始失去重点,将资源转移到与 OpenAI 竞争的自己的内部模型上。 这里有一个资本问题。什么时候开始不再值得投入资金? 马克·扎克伯格 OpenAI 最大的风险之一是资本游戏。如果是这样,投资最多的科技公司就是赢家。虽然微软目前的投资最多,但并没有领先 Meta、Google 和 Amazon/Anthropic。Meta 和谷歌拥有完全的焦点,而亚马逊和微软则由于缺乏对其盟友人工智能实验室的控制而不得不束手无策。 定制芯片是另一个要点,因为与购买 Nvidia 芯片相比,它可以大大降低计算成本。微软在其云中部署的定制人工智能芯片最少,而且这种情况至少持续到 2026 年。与此同时,谷歌、Meta 和亚马逊正在不同程度地增加其内部芯片的数量,这给了他们计算成本优势。
放弃吧,磁铁也救不了合盖降频的MacBook Air
Macbook Air 终于可以外接两块屏幕了,但是性能会砍半! 事情是这样的,前阵子发布的 M3 MacBook Air 支持外接双屏显示了。 没错,就是这么一个见怪不怪的功能,放在苹果这边都算是个 “ 重磅 ” 更新,甚至 Macbook Air 到今年才支持。。。 虽然这点对于 Air 系列来说,不太像刚需,但我可以不用,你不能没有,谁不想两块屏幕一目十行呢。 但其实,外接两块屏幕这事,MacBook Air 曾经是支持的,17 年后 M 芯片横空出世之前这段时间都是支持的,甚至可以两路 4K60。 当时 Intel CPU 附赠的雷电口,数据传输快、扩展支持能力又强,量大管饱,算是 MacBook 上一个相当大的卖点。 但这个优势,在 M 系列出世之后,灰飞烟灭了,搭载 M 芯片后因为处理器硬性通道限制,搞的 Air 系列只能外接一块屏幕。 当然,想用总会有办法,但只能通过无线投屏,或者接口协议转换加特定拓展坞这种略显歪门的办法。。。 而且就算成功了,效果也没有原生支持的双屏来的舒服,分辨率只能到 1080p 、残血 2K,刷新率就更不用想了。 很多小伙伴就因为这一点选择加钱上了 Pro 系列。 所以,当托尼听到 Air 系列可以外接双屏消息的时候,就算都 2024 年了,我还是开心的,谁能拒绝升级换机多了一个理由呢。 但是,当我打开官网一看,果子的防不胜防,还是吹到了心坎里。 在支持双屏的底下有一个小括号,想用上两块屏幕的前提是,闭合状态用, Macbook Air 才能外接双屏。 不是,这就没必要了吧。。。你这就多少有点刻意了,哪怕给降点分辨率也行啊。 再说了 MacBook Air 可是无风扇设计,全靠金属外壳散热,已经很勉强了,你这再盖个被。。。热量全堆积在内部,那不分分钟过热降频。 海外科技博主 Max Tech 用 3DMark 压力测试证明了这一点, Macbook Air 开盖得分 8083 分,合盖直接腰斩掉到了 5916 分。 M3 性能再强,也不能这么霍霍啊。 问题出现之后,网友发散的脑洞给出了好几个解决办法,有说接一块带鱼屏,一块顶个两块的。 也有小伙伴提出说, “ 有没有一种可能,我可以用磁铁让 MacBook Air 认为自己是合盖状态 ” 。 诶等会儿。。这个办法好像有点东西。 是这么回事儿,现代笔记本电脑是依靠一对磁力结构装置,来判断合盖的。 一面装着霍尔传感器,另一面塞一块磁铁,通过接触时的磁力作用,来通知电源管理系统,现在是合盖还是开盖状态。 理论上用磁铁蒙过霍尔传感器,确实可以做到在不牺牲性能的情况下,实现双屏自由。 但很快,就有人提出了自己的顾虑,磁铁贴着电脑,不会把电脑搞坏吗? 实际上,现在tws耳机、手机、电脑里都有磁铁的应用,磁铁都市传说早已经被时间迭代掉了,就连主人公 CRT 显示器和机械硬盘基本都退出历史舞台了。 当时的 CRT 显示器,也就是俗称的 “ 大屁股 ” 显示器,会夺此称号都是因为显示技术的限制,显像管和荧光屏之间的介质粒子会被磁力干扰,导致显示的画面扭曲变形,但现在液晶显示器 LCD、OLED 都是小灯珠的形式,不会受到磁力干扰。 同一时期的机械硬盘就更好理解了,结构件都含磁,磁头、磁头臂、磁性盘片,听上去就跟磁脱不开关系。 结构件处处都是磁,碰到磁铁肯定会有影响,有强磁铁靠的很近的时候,磁头就会找不到对应位置,从而影响到正常工作。 但想达成强磁铁贴着放的条件,可能还没摔坏它容易。。 其实,从苹果敢给手机里面内置磁铁,还推出一系列磁吸配件,就已经说明一切了。 甚至就连 MagSafe 这个名字,Magnet Safe 似乎也在暗示着 “ 磁是安全的 ” ,大可不必谈磁色变。 那么话说回来,磁铁到底能不能解决 MacBook Air 的合盖问题呢? 很遗憾,并不能,磁铁诱骗合盖对 Windows 本是有用,甚至对 19 年之前的 Macbook 来说也是有用的。 但是苹果在 19 年的时候,在转轴位置多加了一个角度感应器进去,来起到判断合盖角度,控制亮屏息屏的作用。 也就是说,磁铁大法也解决不了 MacBook Air 的合盖降频了。 但是,都看到这了,告诉你一点解决办法都没有,未免也太扎心。 今天托尼传授给大家一个极限散热办法。 冰箱贴 + 小风扇,没错就是这么个朴素的办法,让你们失望了。 角度传感器太灵敏,冰箱贴已经是极限了。。 这个姿势真的可以让 MacBook Air 保持息屏状态,同时稍微有一点点散热能力。 至于体面一点的办法,要么等苹果自己下场来一个合盖规则修改。。 要不然,只能是弃 Air 选 Pro 了。。。 撰文:小杜 编辑:米罗 & 面线 美编:
霸屏朋友圈的黏土滤镜,到底是怎么搞出来的?
一张照片,几秒钟,就能还原出你在黏土世界的样子。 就是这么一个抽象的滤镜,最近在网上火了,这两天相关的帖子,在世超的抖音小红书首页就没停过。。。 而搞出这个黏土 AI 的,是个叫Remini 的软件,秉着打不过就加入的心态,我们也找来了几张照片试了试. 这是马斯克开车的样子,别说,脸型、五官还有发型还都挺传神的。 还有这张合照,不用提示,咱们差友应该都能猜出来吧,就是皮衣黄和扎克伯格互换外套的合照。 再丢一张火锅的照片过去,整得也挺像样,就是头身的分界线,有点过于明显了。 说实话,玩着玩着还真有点上头。。。而除了黏土, Remini 里面其实还有各种千奇百怪的滤镜,像是玉石、噩梦、像素风等等。 比如玉石风的马斯克还挺眉清目秀。 像素风度的西瓜( 办公室的另外一条狗 )也挺像样的。 不过, Remini 并不是完全零门槛,只能免费试用一周,一天只有五次机会,世超再想多试试的时候,就提示要充会员了,一周68 块钱,属于是白嫖党们看了价格是两眼一抹黑的程度了。 这也让咸鱼上的二道贩子们发现了商机,整出了代做业务,一块钱一张。。。 这火爆程度,世超只能说,希望他们把握住这波赚钱的机会吧。毕竟在一周一小变,一月一大变的 AI 圈,可倒了不少曾昙花一现的 AI 初创公司,毕竟持续流量和成功的盈利模式,才是最稀缺的。 不过,这些话世超刚码出来,就立马后悔了。。。 因为我资料一查,发现你丫的 Remini 根本不是啥AI 圈儿的新人,相反这些年,他们一直就没缺过流量和票子。。。 早在 2019 年年底, Remini 就以 “ 修复旧照片 ” 的名头爆火过一次,当时的它算是刚出道就成名。 爆火程度这么说吧, “ 你前方还有 40000 人在排队 ” 、 “ 还需要等待 70 年 ” 这样的乌龙弹窗,都是 Remini 给整出来的。。。 次年年初,在被电视台给报道之后,它的流量更是勇攀高峰,用户达到了千万量级。要不是及时找到了亚马逊合作,就凭 Remini 自己的服务器,这波天降的流量他们都差点没接住。 差评的老粉可能会有点印象,四年前小辣椒还跟大伙推荐过这个工具,效果看起来挺像那么回事。 就连被盘出包浆的表情包,在它手下都能给整成高清的。 当然,这都算不上 Remini 的巅峰时刻。它抓热点、造热点的能力也是一绝,像是换发型 AI ,老钱风穿搭等等, Remini 都能在第一时间蹭上。 甚至去年年中的时候,它还凭一己之力造了个新热点——预测宝宝长相。只要上传几张双方的照片,然后选择性别就能生成,在 TikTok 上从素人火到了大 V 。 光凭这个功能,让 Remini 在 7 月份一路狂飙,头两周的全球下载量就有 4000 万次,当月还登上了美国应用软件的榜首,这时它的日活量已经超过了两千万。 并且这两千万的日活量里,舍得给 Remini 氪金的也不少。据 Insider 消息,靠会员费它一个月就赚到了700 万美元,还是刨掉了苹果应用商店30% 分成后的数字。 虽说这两年, AI 应用圈子里的大风大浪世超是没少见,但大多都是赚不了钱,快不行了的消息,像 Remini 这种活了这么久还能保持热度的,真没几个。 而且说实话, Remini 里面的各种 AI 功能在技术上门槛不算高。 像是这次黏土滤镜出圈后,美图第一时间就跟进,也已经有人在 C 站( AI 绘画模型分享平台 )炼出了两个类似的模型, Claymation-miniature 和 Clay cartoon style 。 还有预测宝宝长相的功能,在开源模型 StyleGAN 上有针对性地训练训练,就能达到同样的效果,现在有这个功能的 AI 插件、小程序更是一抓一大把。 所以 Remini 能坚持五年不掉队,世超还是打心底里佩服它的。不过更让人好奇的是,这隔段时间就能出圈一次,它背后难不成有什么 “ 高人 ” 指点。。。 世超查了一下,似乎还真有,而且前前后后还有两位,一个给它开路,一个给它加装备。 给 Remini 开路的就是创建它的 “ 亲爸爸 ” 大觥科技,这还是咱国内的一家企业。它不仅敢做第一批吃螃蟹的人,而且吃螃蟹的姿势还贼上道儿。 在 2019 就推出了 Remini ( 海外版 )和 “ 你我当年 ” ( 国内版 ),还在社交媒体上打起了 “ AI 修复明星照片 ” 的广告,噱头直接拉满。 反正一套组合拳下来,初期 Remini 就已经攒到了千万级用户。 然而在给 Remini 开完路后,作为 “ 亲爸爸 ” 的大觥科技却没能陪它一直走下去,在 2021 年,因为数据隐私的问题, Remini 被卖给了一个意大利企业 Bending Spoons 。 不过好在这个 “ 干爹 ” 肚子里的货足够多,它算是一家App 工厂,专门买市场上成熟的 App ,赚得就是运营产品的钱,像咱们比较熟的印象笔记,就是被他收购的。 而在搞营销这块儿, Bending Spoons 的手段也比大觥科技还要高明点,在之前, Remini 打的广告都是说它 AI 修复图片的功能有多强。 “ 干爹 ” 上来第二年,就打算走社媒病毒式传播那一套,给自己定位成一个 “ 发帖助手 ” 。效果怎么样,看这次黏土滤镜的反应大家就知道了。 但话说回来,在世超来看, Remini 能这么出圈,归根结底就一个秘诀,它能抓住大伙的心理需求,只要做到这点,就足以打败一大半 AI 应用了。 反正世超还挺期待 Remini 后续会整出啥花活来的。。。 撰文:松鼠 编辑:江江 封面:萱萱
Sonos回应其应用新版负面评价:重塑核心产品“需要勇气”
IT之家 5 月 11 日消息,Sonos 本周更新了旗下应用,为满足用户的个性化听觉体验,引入了可定制的主屏幕。不过该应用新版上线之后遭到很多用户负面评价,主要是删除了不少功能,还引入了几个 BUG。 网友对新版 Sonos 应用的评价是“退化”,移除了编辑歌曲队列、管理播放列表、音乐库洗牌、设置闹钟和计时器等功能,而且新版运行缓慢,系统控制难以使用,而且有用户反馈缺少无障碍功能。 Sonos 随后发布声明,回应网友投诉,称重塑核心产品“需要勇气”,IT之家翻译相关内容如下: 重新设计 Sonos 应用程序是一项雄心勃勃的事业,体现了我们对发明和再创新的认真态度。从头开始重建一个品牌的核心产品需要勇气,而且要知道可能需要退后几步才能最终跃向未来。 该应用程序的本次更新不仅是为了满足客户的短期需求,更重要的是推动 Sonos 未来几年的创新。 部分用户渴望继续使用某些功能,我们正在努力工作,以便在未来几个月内重新推出这些功能,同时还将推出其他增强功能,以提供更好的应用程序体验。 这只是 Sonos 令人兴奋的新篇章的开始,我们将以更加个性化和无缝的方式,继续听取听众的反馈,拓展其分享所有内容的途径。
这支笔,想为 7.73 亿人扫盲丨明日产品®
我们或许都曾经历过提笔忘字的尴尬瞬间。 在世界的某些角落,有一群人也遇到了类似的场景。但是这群人所面对的远不止于此,对于他们来说,写字本身就是一种挑战。 幸运的是,现在有一个「小东西」可以缓解这一困难。非营利机构世界扫盲基金会(The World Literacy Foundation)携手荷兰创意广告公司 Media.Monks,共同打造了一款教育工具 ——「识字笔」。它的目标是为了帮助全球数百万人解决文盲问题。 「识字笔」实际上并不是一个真正的笔,而是一个可以固定在笔上的小巧设备。它的大小和拇指类似,正面只有一个按钮和一个小屏幕,侧边还配备有一个用于充电的 Type-C 接口。 「识字笔」适配我们日常生活中可以见到的绝大多数笔。在机身主体下方,它有着两个用于固定在笔上的卡扣。无论是铅笔还是圆珠笔,只需轻轻一按即可完成安装。 它针对的显然是一个书写的情景。遇到不会拼写的单词,用户可以按下按钮,读出想写的单词,随后这个单词就会以一个个字母的形式出现在小屏幕上,方便用户抄写这个单词。 「识字笔」的功能极其简单,但对于扫盲推广非常有帮助。 它不需要连接任何其它 App 或设备,凭借着直观易用的特性,为全球范围内的文盲群体提供了一种前所未有的学习途径。 在全球范围内,文盲问题一直是社会发展的重大障碍。 根据联合国教科文组织的最新数据,全球有 7.73 亿成人文盲,其中大多数为妇女,这对其自我认知和发展机会有很大影响。 对于我们大多数人而言,书写或许是一种信手拈来的能力。但对于全球 7.73 亿文盲人口来说,每写一个字都是非常艰难的。「识字笔」的出现降低了学习书写的难度,使他们能够逐步克服障碍,掌握书写技能。 另外,正是因为「识字笔」的功能单一且构造简单,使得它的制作成本会相对低廉。这可以促使「识字笔」普及到全球的每一个角落,特别是那些迫切需要教育资源的贫困地区。 Media.Monks 创意总监 Tomas Almuna 称:「『识字笔』将改变因无法读写而日常生活受限的数百万人的生活。」 他还补充道:「我们以创新的方式应用基础技术开发了『识字笔』,我们希望这一工具能激发用户自主学习的热情,并为他们打开通往新机遇的大门。」
苹果眼镜新专利公布,集成三种显示效果,可玩性拉满
最近,美国专利商标局公布了苹果公司的一项专利申请,概念十分有趣,可能会应用于苹果未来的智能眼镜上。 苹果在这项专利申请中,展示了一种独特的「三重显示系统」。这套系统不是三个独立的显示器,而是巧妙地融合了三种显示形式:一个主显示器、一个辅助显示器,和一个以 LED 灯圈的形式存在的第三级显示器。 这个专利实际早在 2021 就进行了公布,而苹果这次主要是对其进行了完善。 这一系统的核心是主显示器,它以最高分辨率占据了用户的主要视野,带来优秀的清晰度。无论是浏览图片、观看视频,还是进行复杂的交互操作,主显示器都以其最好的显示效果,承担着核心的视觉呈现任务。 辅助显示器的分辨率低于主显示器,并且以物理和电子方式耦合到主显示器上。它负责初步展示虚拟对象,待用户需要与特定对象(如应用程序)进行深入交互时,再由主显示器接管。 第三级显示器以 LED 阵列的形式围绕着眼镜的内框,担当起了指示系统的角色。它可以够提供基本的提醒和指示功能,还能根据各种应用场景变换颜色与闪烁模式,从而提供更加直观和丰富的信息反馈。 其中,辅助显示器或许并不会和主显示器有物理分割,其存在形式可能和现在的 Vision Pro 类似。现在的 Vision Pro 为降低渲染压力,采用了「注视点渲染」技术。系统会选择只在用户所注视的区域进行最精细的渲染,注视区域之外则会降低分辨率渲染,形成了既保证显示质量又兼顾能效的平衡。 这个专利文件中提到了这款智能眼镜的多个使用场景,这些场景覆盖了日常生活的方方面面。 例如,在用户寻找钥匙或其他物品时,眼镜可以通过点亮 LED 阵列的部分灯光,指引用户前往正确的地点。眼镜通过配合 UWB 超宽频芯片,可以实现精确的空间定位。当然,只有物品与 AirTag 等设备连接才能带拥有交互体验。 在用户收到新消息或电子邮件时,通知信息将首先出现在辅助显示器上,提供一个不显眼的提示。之后用户可以通过触摸传感器或使用 Siri, 将通知转移到主屏幕上进行操作。这样既实现了消息查看和便捷的交互,也不会立即打断用户的视线或活动,减少了无关信息的干扰。 对于出行场景,智能眼镜可以为用户提供视觉辅助。系统会放大目标车辆或增加高亮轮廓,可以精准快速地帮助用户确定所乘坐车辆。 辅助显示器还可以作为秒表或计时器使用。在工作、烹饪或运动等场景下,用户的计时器会常驻在辅助显示器上。 它甚至还能配合 LED 阵列提醒用户关注身体状况。例如,当监测到用户心脏问题时,LED 阵列会亮起红光,为用户提供实时的健康关注。 有趣的是,这一专利还展示了一种「情绪提示」场景。在 FaceTime 通话时,LED 阵列可以根据对方的情绪状态发出不同颜色的光,使用户可以知道对方的心情。 这一功能的应用场景还有待进一步探索,毕竟大多数时候我们都能通过肉眼辨别对方的情绪。 LED 阵列的加入,为苹果的智能眼镜带来了一丝「灵气」。不过在实际使用中,这些功能是否能真的派上用场,还是一个未知数。
AI颠覆乐坛?ElevenLabs AI音乐模型早期预览亮相,在线征集网友创意生成歌曲Demo
编译 | 庞小春 编辑 | 程茜 智东西5月11日消息,昨天,语音人工智能初创公司ElevenLabs发布了音乐生成人工智能模型的早期预览,能够根据文本提示,生成带有歌词的歌曲小样。 ElevenLabs由谷歌的前机器学习工程师皮奥特·达布科夫斯基(Piotr Dabkowski)和分析软件公司Palantir的前策略分析师马蒂·斯坦尼谢夫斯基(Mati Staniszewski),其音乐大模型可用于多种场景。但模型发布以来并未受到所有人的欢迎,不少人对其使用数据的原创性和使用方式表示担忧。 一、宣传策略模仿Sora,实时征集网友创意生成音乐 ElevenLabs擅于利用机器学习(ML)进行不同语言的语音克隆和合成,该公司已推出多种语音生成功能,包括文字转语音、语音变声器、配音等。不出所料,该公司已将目光投向了音乐产业。 为了提高模型知名度,ElevenLabs采用了萨姆·奥尔特曼(Sam Altman)在推出视频大模型Sora时的宣传方式,在社交媒体上对外征集创意,并将网友提供的文本转化为音乐。 目前尚未清楚此模型可以生成音乐的时间范围,但根据该公司设计主管阿玛尔·瑞希(Ammaar Reshi)在X上发布的示例,VentureBeat猜测此模型能够为三分钟的音乐作品生成歌词。 VentureBeat在报道中列举了一些音乐大模型的使用场景:生成一首有趣的摇篮曲哄孩子们入睡、为营销活动制作一首巧妙的广告歌曲、为播客节目设计一段活泼的音乐前奏等。外媒认为,一些人或许会使用这种模型来开发下一首热门歌曲,并称目前已经涌现出大量音乐人工智能创企,包括Harmonai、Lyrical Labs、Suno AI、Loudly等。 ElevenLabs于1月份推出了名为语音库的产品,用户可以通过语音库出售这些由人工智能生成的歌曲。目前,该公司的语音库已允许用户出售自己的人工智能克隆语音,公司会对其语音的可用范围进行控制。 二、训练数据版权受质疑,还可能被用于深度伪造 然而,音乐生成技术并非受到所有人的欢迎。与所有生成式人工智能应用程序一样,ElevenLabs的问题在于是在什么样的数据基础上训练此模型的,训练数据是否包含受版权保护的内容。如果包含,ElevenLabs是否获得了内容所有者的允许,或者这些内容是否受到了合理的保护。 还有一些反对音乐生成技术的人认为,艺术家可能会失业。人工智能将会轻松复制艺术家的风格,然后代替他们推出新音乐。此类技术也有可能被用来生产深度伪造品。VentureBeat已经联系了ElevenLabs,希望该公司能够就其音乐生成模型发表更多评论,并称如果收到回复会及时更新相关媒体报道。 结语:模型尚未成熟,既有机遇也有挑战 目前,ElevenLabs的音乐生成大模型仍处于早期预览版,但是已经展现出较大的潜力和影响力。它可以快速产出音乐作品,提高音乐制作的效率,但也有可能会对传统音乐人造成一定冲击。 音乐生成模型的出现,预示着音乐产业可能会经历一场由技术驱动的变革,既带来机遇也带来挑战。
18.98 万元起!比亚迪刚发的新车,刷新了华为的一项世界纪录
去年 11 月,广州车展,比亚迪展台。一辆被幕布覆盖的 SUV 位居展台中央,光影之下,幕布也难掩它的流畅身型。 那就是海狮 07 EV。 当天,海狮 07 EV 迎来了全球首发亮相,它不仅是海洋网首款中型纯电 SUV,也是比亚迪全新 e 平台 3.0 Evo 之下的首款车型。 比亚迪汽车海洋网销售事业部总经理张卓表示,海狮和海豹,共同组成了海洋网的「双子星」。 终于在今晚,这颗「星」上市了。 海狮 07 EV 550 标准版:18.98 万元 海狮 07 EV 610 长续航版:19.98 万元 海狮 07 EV 610 智航版:21.98 万元 海狮 07 EV 550 四驱智航版:23.98 万元 果然,价格一直都是比亚迪的拿手好戏。 那么,比亚迪不擅长的是什么?不少人认为是设计。 比亚迪,也可以很好看 长期以来,比亚迪的外造型设计一直饱受诟病,网络上时常都会出现「换个设计师」的声音,但去年 11 月发布的比亚迪宋 L,成为了比亚迪设计的新起点。 ▲ 宋 L 随着比亚迪开始冲击中高端市场,其产品的设计思路逐渐从之前的「高辨识度」向更有现代感、更高级的设计倾斜。 作为王朝全新的 B 级纯电 SUV,宋 L 采用王朝网新一代「先锋龙颜美学」设计语言,内饰也更为简洁。在比亚迪眼里,宋 L 就是他们的「最美猎装 SUV」。 ▲ 宋 L 如今,在比亚迪全球造型总监沃尔夫冈 · 艾格的领导下,这个「最美称号」可能要被海狮 07 EV 抢走了。 ▲海狮 07 EV 海狮 07 EV 是比亚迪新推出的 e 平台 3.0 Evo 之下的全新车型,全新以及 CTB 电池车身一体化技术,海狮 07 EV 拥有更为协调的车身比例。以 Ocean X 概念车为基础,海狮 07 EV 进一步强化了海洋系列车型的家族化概念。 ▲海狮 07 EV 而且与海豹相比,海狮 07 EV 的前杠、翼子板和 C 柱的处理都要更为简洁,腰线也少了几分凌厉,还原了概念车的些许雅致。 另一方面,通过色调和材质的反差,海狮 07 EV 的前脸十分紧凑扎实,家族式的双 U 悬浮式头灯造型犀利,车尾层次分明,尾灯内参数化分布的点阵光源模拟了激起的浪花。 ▲海狮 07 EV 此外,和以往的比亚迪车型所有不同,海狮 07 EV 首次使用了发光尾标,可以呈现出金属质感和半透发光两种状态。 海狮 07 EV 在尺寸上和宋 L 近似,长宽高分别为 4830mm、1925mm、1620mm,2930mm 的轴距也达到了中大型 SUV 的水准,内部空间可以参考宋 L,表现应该不错。 悬架方面,海狮 07 EV 同样搭载了比亚迪汉所拥有的云辇-C 智能阻尼车身控制系统,通过控制减振器电磁阀调节阻尼,可以实现悬架阻尼的无级自适应调节。 简单来说,当车辆经过颠簸路面时,云辇-C 可以让底盘变「软」,紧急变线和加速、制动时,又能让底盘变「硬」,提升操稳性。 e 平台 3.0 支持的 iTAC 扭矩控制系统当然也没有缺席,这套诞生于 2022 年的系统就不再过多介绍了,总的来说,它可以实时调整各电机的输出扭矩,最大程度适配车辆的动力变化。 动力方面,海狮 07 EV 全系标配 23000rpm 全球量产最高转速电机,极速可达到 225km/h。而在补能上,得益于全新平台集成了比亚迪电动化核心技术,海狮 07 EV 实现了真正的「不挑桩」。 比亚迪表示,海狮 07 EV 550 在 2015 版充电国标公共直流充电桩上的最高充电功率可达 180kW,而 610 长续航版、610 智航版、550 四驱智航版可达 240kW。 作为宋 L 的兄弟车型,海狮 07 EV 的内饰布局也与前者类似,针对海洋网的内饰风格做出了相应的调整,各位自行感受。 海狮 07 EV,是海洋网转身的第一步 在新能源市场一路高歌猛进的 2021 年,比亚迪顺势推出了更年轻化的海洋网,以扩大原有的用户群体。 自首款车型海豚上市以来,海洋网已经走过了将近 3 年的时间,先后发布了海豚、海豹、海鸥、驱逐舰 05、护卫舰 07 和宋 PLUS 等车型。 ▲海豚 从产品定位来看,海洋网年轻跳脱的设计无疑比王朝网车型更为亮眼,产品线也要比王朝网更广泛,更关键的是,海洋网车型在定价方面也更加「实惠」。 产品、技术、定价上的全面领先,似乎让海洋网成为比亚迪的那个「更亲的小儿子」。 只不过,含着「金汤匙」出生的海洋网在销量上并没有达到比亚迪的预期。 ▲海豹 作为 e 平台 3.0 之下的首款车型,海豹在上市前被寄予厚望,被视作特斯拉 Model 3 的强劲对手。然而,海豹的月销在 2023 年 5 月份达到 8062 辆的峰值后持续下滑,来到了千辆水平,几乎无人问津。 另外两辆采用 DM-i 技术的轿车也没能重现王朝网的销量神话。 驱逐舰 05 自上市以来,始终未能突破月销 1 万台大关;护卫舰 07 也从刚上市时的过万月销,一路下滑至如今的千辆出头,仅占比亚迪总销量的 0.46%。 ▲驱逐舰 05 为了平衡海洋网和王朝网的销量差距,比亚迪先是从王朝网「借调」过来一个宋 PLUS 充当销量支柱,而后又在 2023 年发布了一款 7.38 万元起售的海鸥,直接拉低了比亚迪汽车的价格下限。 尽管随后推出的海豹 DM-i 凭借 14.98 万的价格,在销量上为「海豹」这个 IP 挽回了一些颜面,但该车型在车质网上面临的大量投诉,也很有可能会对该车型带来难以预料的影响。 ▲ 海豹 DM-i 比亚迪自然不会坐以待毙,缕清思路、整合产品线,是他们的第一步。 比亚迪的「出海先锋」 虽说海洋网目前实行的是海豹、海狮「双子星」路线,但「海狮」这个 IP,可不止 07 这一个产品。 总经理张卓此前透露,除海狮 05 外,海狮 06 也将在今年亮相,届时海狮产品线将涵盖紧凑型到中大型 SUV,并做到「既有 EV 也有 DM-i」。 相应的,海豹将成为轿车系列的 IP,除了目前已有的 EV 和 DM-i 车型,未来还将推出尺寸更大的 C 级轿车,也就是前一阵北京车展里的海豹 06 DM-i;而驱逐舰系列,则可能会被精简。 此外,目前海洋网旗下的宋 PLUS 系列车型并不会「回归」王朝网,而将成为海豹 IP 下的一款车型。当然了,它的名字是不会改的。 整合产品线的同时,海洋网还将成为比亚迪的「出海先锋」。 去年,继海豹借慕尼黑车展正式宣布进入欧洲后,短短一个月时间,海豹又陆续宣布已分别于巴西、哥伦比亚、泰国、智利、新加坡和中国香港、中国澳门等国家或地区上市。 不久后,比亚迪便以单日超 600 辆的销量成绩超越其他新能源品牌的销量总和。在泰国曼谷举办的海豹上市发布会上,该车型仅用 3 小时便获得了 1299 个订单,同时交付 315 辆。 随着海豹的出现,比亚迪的出海路已经不再局限于元和海豚等低价的入门车型,在国内遇冷的纯电旗舰,似乎找到了一个新出路。 2024 年 1 月 9 日,比亚迪第一艘汽车运输船「比亚迪探索者 1 号」在山东龙口交付离岗,在深圳小漠港装载汽车之后,出发前往欧洲。 在海的另一边,比亚迪也在加紧布局。 2 月 6 日,比亚迪正式与法巴安诺(ARVAL)集团签署战略合作谅解备忘录,正式建立战略合作关系。后者由法国巴黎银行集团控股,将为当地市场引入海豹、海豚等比亚迪汽车。 此外据界面新闻报道,比亚迪欧洲汽车销售事业部总经理舒酉星今日表示,比亚迪正准备在欧盟进行「巨额投资」,规模可能达到数十亿欧元,涉及工厂、分销网络和市场营销。该公司的首家欧洲汽车工厂将于明年在匈牙利投产。 说不定,今天发布的海狮 07 EV,届时会成为比亚迪在欧洲市场的一大「杀手锏」。
苹果芯片,也没办法
在苹果M3芯片发布的半年后,继任者M4突然闯入了大家的视线中,虽然是用在iPad Pro上的处理器,但性能提升一点也不算小。 根据苹果的说法,M4对比M2,CPU提升50%,GPU整体渲染提升了4倍,还能在功耗减半的情况下提供同等性能,总之又是一次苹果式的性能飞跃。 但苹果却有意无意地忽略了M3——这款可能是苹果最短命的处理器。上一款寿命如此短暂的苹果处理器可能还要追溯到A5X,这款处理器在2012年3月发售的iPad 3上首发,当年10月就宣布了搭载了A6X的iPad 4,实际寿命只有短短的7个月。 M3如今面临着和当初A5X一样的窘境,强大性能向来是消费者换机的最大动力之一,但在短短半年后,苹果就推出了更强更好的产品,最新的处理器眨眼就变成了次新的处理器,这样的迭代速度未免也有些太快了。 一个更致命的问题已经被抛出来:苹果的自研芯片,还有多少胜算? “无疾而终”的M3 去年下半年MacBook发布会上,苹果公布了采用3nm工艺的M3系列芯片,这也是首款采用3nm的M系列芯片,在发布会上,苹果也是猛吹了一波性能参数: 苹果表示,M3 芯片搭载 250 亿个晶体管——比 M2 多 50 亿个,配备采用新一代架构的 10 核图形处理器,带来比 M1 快达 65% 的图形处理性能,搭载 8 核中央处理器,包含 4 个性能核心和 4 个能效核心,与 M1 相比,可实现最高达 35% 的中央处理器性能提升,还支持最高可达 24GB 的统一内存。 M3 Pro 芯片搭载 370 亿个晶体管和一块 18 核图形处理器,与 M1 Pro 相比,图形处理器带来的速度提升最高可达 40%。对统一内存的支持提高到最高 36GB,。12 核中央处理器设计由 6 个性能核心和 6 个能效核心构成,与 M1 Pro 相比,可实现最高达 30% 的单线程性能提升。 M3 Max 芯片中的晶体管数量增加到 920 亿个, 40 核图形处理器比 M1 Max 速度最快达 50% ,还支持最高达 128GB 的统一内存, 16 核中央处理器搭载 12 个性能核心和 4 个能效核心,速度比 M1 Max 提升多达 80%。 从苹果的描述中我们可以发现,苹果在极力避免M3和M2芯片的直接性能对比,这是一件让人匪夷所思的事情,毕竟最早的M1芯片是2020年发布,2023年的芯片在升级了工艺与核心的情况下和M1系列做比较,只能说有些胜之不武了。 那么苹果为什么会在明知性能提升不大的情况下,还要推出M3芯片和对应的MacBook呢? 答案倒也很简单,就是上一代M2芯片的Mac产品销量表现过于惨淡了。 据The Elec报道,由于 PC 市场严重低迷,Mac 销量“直线下降”,苹果在2023年 1 月份完全暂停了M2 系列处理器的生产。 与A系列芯片采用扇出晶圆级封装(FO-WLP)封装,台积电称之为InFO(Integrated Fan Out)不同,M2芯片的最终加工采用的是通用倒装芯片封装工艺。一旦台积电完成预处理过程,晶圆加工产品将被送往Amkor的韩国工厂进行封装工作。而在2023年1月和2月,台积电并未送达这部分产品,产线也闲置了两个月,知情人士表示,虽然自3月以来晶圆已经陆续抵达,但数量仅为往年的一半。 苹果CEO库克也在在2023 年第一季度财报电话会议上承认,苹果在 PC 市场面临“充满挑战”的局面。“这个行业正在萎缩,”库克说,“苹果的份额较低,但我们在苹果芯片方面拥有竞争优势,因此从战略上讲,苹果在市场中处于有利地位,但短期内会有点困难。” 为了挽救搭载M2的Mac产品缺少竞争力的局面,苹果的选择是在2023年底推出用上3nm工艺的M3芯片,以及对应的MacBook。 但当苹果下定决心要在2023年就推出3nm工艺的Mac时,它遇到了新的问题——台积电的N3B工艺。 台积电在N3节点上经历了一场漫长噩梦。最初的N3即N3B,有25 个 EUV 层,几乎是 N5 的两倍,这也导致其生产难度很大,而且价格昂贵,考虑到性能、功率和密度方面的改进乏善可陈,大多数客户都不愿意支付高昂的费用。 N3 出现的问题,最终导致台积电错过了主要工艺节点的2 年升级周期,N3B最终在 2022 年第四季度投产,而N3E 则要等到 2023 年中后期投产,这不仅导致了苹果被迫延期芯片计划——其原计划在2022年iPhone上采用N3工艺,很多客户也在N3B上打起了退堂鼓,诸如Zen 5、英特尔GPU和博通定制ASIC等产品,要么继续用N5,要么转向N3E这一后续改进工艺。 事实上,除了苹果的M3系列和A17 Pro外,几乎没有厂商愿意用台积电的N3B工艺,这也为苹果和台积电之间的甜心交易(Sweetheart deal)埋下了伏笔。 2023年8月,国外科技媒体 The Information爆料称,苹果向台积电下单巨额3nm芯片订单,但要求未合格芯片需台积电承担,台积电 3nm 初期的良率大约在 70% 左右,苹果达成这样的协议后,可以节省数十亿美元。 这也形成了一道奇异的风景线,一方面是台积电的3nm独步于天下,另一方面苹果却不愿意为不合格的晶圆多付钱,与其说是苹果强硬要求,倒不如说是台积电半推半就,让苹果在N3B上形成了事实上的独占。 这种情况不禁让我们回想起了台积电的N10和N20这两个同样短命的工艺。 当时,台积电16nm/20nm制程在经历了2016年第四季度的峰值之后,有部分客户在2017年转移到了10nm上,其中包括华为海思的麒麟970,苹果的A11与A10X,其中A11是台积电10nm的主要客户。 但除了这两位外,就鲜少能听到采用10nm的台积电客户了,10nm一度在台积电财报中达到了11%的营收占比,但在2017年后,这一比例迅速下降,7nm工艺成为了更多厂商的选择。 至于台积电的20nm,更是一项臭名昭著的工艺,虽然不少处理器都用了这一工艺,如高通骁龙810、苹果A8、英伟达Tegra X1、联发科Helio X20等,但无一例外遇到了发热严重,功耗失控的问题,让大家体验了一把当初“台漏电”的恐怖。 20nm之差劲,客户要么快速迁移到接下来的16nm节点上,要么勉为其难地用回了28nm工艺,2015年不仅让手机和处理器厂商如坐针毡,也让台积电经历了至暗时刻。 如今再看台积电的N3B,大概率也会步N10和N20的后尘。根据WikiChip的说法,N3 节点似乎是一个一次性节点,台积电的工程师们在前进的道路上遇到了一些障碍,于是决定中途改变,从高层次来看,N3B具有不同的 PPA,以及该公司声称旨在提高产量的 “截然不同”的设计规则,结果就是后续的N3E 不会提供任何从 N3B 直接迁移的路径,最终 N3B 成为了设计人员的死结,这也是为什么台积电希望大多数客户使用 N3E 的原因。 问题来了,为什么台积电要特意推出一个N3B呢?简单的解释是,台积电只是为了实现对苹果这样的早期技术采用者的承诺,在今年结束后,或许N3B这一工艺就会淡出大家的视线。 当然,不止是N3B,还有用了N3B的苹果M3系列和A17 Pro,在决定采用这一短命工艺后,苹果可能早就预见了这些处理器的结局。 乏善可陈的M4 回想2020年时,苹果首款自研Mac处理器的登场之时,在科技圈与半导体圈里刮起了一场旋风,曾经不可一世的英特尔居然被苹果踢出了局,当时所有媒体都在盘点苹果从A4开始的自研之路,人人都在写苹果逆袭打破垄断的爽文。 这是苹果历史上最辉煌的时刻之一,有人列举了苹果Mac从摩托罗拉68000平台换至Power PC平台,再转至英特尔x86平台,如今选择自研的ARM的平台,试图以此来证明了一个新时代的开启。 2021 年第一季度,受疫情等因素影响,PC 行业的整体出货量同比增长了 55% ,而苹果的Mac 销量更是迎来了惊人的 111.5% 增长。在2020到2022这三年里,Windows PC市场增长6%,Mac市场却增长了60%,2022年Mac市场份额更是突破10%,达到10.8%,在苹果的大本营——美国市场中,Mac的份额还要更高一些,在2022年第四季度达到了17%。 但好消息全部都留在了逝去的三年里,从2023年初开始,苹果Mac就开始了跌跌不休:2023年Q1,Mac全球出货量481.9万台,市场份额8.7%,同比下滑34.2%;Q2,Mac全球出货量529.3万台,市场份额8.9%,同比下滑0.3%;Q3,Mac全球出货量626.6万台,市场份额9.7%,同比下滑24.2%。 在苹果2023年第三季度的财报会议中,苹果首席财务官卢卡・马埃斯特里(Luca Maestri)将Mac销量下滑归咎于过于激烈的市场竞争,以及2022年被压抑的销量释放,导致比例数据过高。 苹果CEO对CNBC表示,预计 Mac 的市场表现将在圣诞购物季期间有所改善,他认为由于苹果推出了 M3 系列芯片,以及搭载该芯片的 Mac 新品,Mac 业务在2023年第四季度会有明显好转。 不过很可惜,老谋深算的库克这一次也失算了,根据苹果2024年第一财季的财报,该季来自于Mac的营收为77.35亿美元,上一年同期为108.52亿美元,远低于分析师此前预期的96.3亿美元。 M3没带动Mac销量,出乎分析师和苹果高管的意料,也让M3 MacBook站在了风口浪尖,要知道,苹果在M3上可是花了血本的,国外分析师 Jay Goldberg表示,苹果公司为了 M3 系列芯片的流片花费了 10 亿美元,天文数字的流片费用,换来的却是远低于预期。 有意思的是,知名分析师郭明錤在2023年10月表示,如果 M3 芯片依然无法提振 MacBook 出货量,苹果可能会在 2025 年推出全新设计的 MacBook Pro,此外可能会考虑(目前尚未确定)推出低价版 MacBook,以进一步提高出货量,目标每年出货量在 800-1000 万台以上。 换句话来说,苹果这是放弃了Arm版Mac以芯片升级为主要卖点的路线,转而考虑在设计和售价做文章,是不是有些似曾相识?这正是之前英特尔版MacBook的做法,大尺寸的卖不动了?那就做个12英寸的MacBook吧,缺少升级亮点?那就加上TouchBar和蝶式键盘这样花里胡哨的硬件功能,总之没有卖点也要强行制造卖点。 此一时彼一时,当初苹果Mac在M1推出时有多得意,现在就有多失意,苹果以为自己制造了一场Arm笔记本普及的风暴,结果三年过去后发现自己只是风口上的一只猪,Mac重新回到了它原本该有的市场地位。 M1的成功,一方面是居家办公带来的需求激增,另一方面当然也有台积电的功劳,虽然前文中的台积电N3B工艺拉了一个大跨,但在2020年这一时间节点上,台积电N5相较于英特尔与三星各自的工艺,领先了好几步,这也为M1那极端优异的功耗控制立下了功劳。 如今看来,苹果M系列自研芯片颇有些“一鼓作气,再而衰,三而竭”的感觉,尽管苹果还在强调M2和M3相较于M1的提升,但市场上卖得最好认同度最高的,却依旧是M1那几款产品。 伴随着台积电N3E工艺的大规模量产,M3系列注定会成为苹果的弃子,但苹果似乎并不死心,又以相当快的速度准备了N3E的M4,用它来替代昂贵的M3,先把成本降下来后再做他想。 根据彭博社马克·古尔曼的说法,苹果的目标是从今年年底到明年年初发布Mac新品,新款 iMac、低端 14 英寸 MacBook Pro、高端 14 英寸和 16 英寸 MacBook Pro 以及 Mac mini 都将采用 M4 芯片。 古尔曼认为,苹果计划在整个 2025 年推出更多的 M4 Mac,包括在2025年春季更新的 13 英寸和 15 英寸 MacBook Air,2025年中左右更新的 Mac Studio,以及在 2025 年晚些时候更新的 Mac Pro。 其表示,M4 芯片系列包括入门级的 Donan、功能更强大的 Brava 和代号为 Hidra 的高端处理器,苹果计划强调这三款处理器的人工智能处理能力,以及它们会如何与今年夏季WWDC上发布的下一版的macOS 集成。 Donan 芯片将用于入门级 MacBook Pro、新款 MacBook Air 和低端版 Mac mini,而 Brava 芯片将用于高端 MacBook Pro 和高价版 Mac mini。至于 Mac Studio,苹果正在测试采用尚未发布的 M3 系列芯片和 M4 Brava 处理器变体的版本,Hidra 芯片则会搭载于苹果最高端的台式机 Mac Pro之上。 那么M4会比M3表现更为亮眼吗?未必见得。 首先,N3E相较于N3B并不是质的飞跃,甚至可以这样认为,两块芯片实际上是苹果的两份3nm答卷,当我们把M3和M4放在一起时会发现,即使是纸面上的提升,也有些乏善可陈。 首先是CPU部分,完整版的 M4包括 4 个性能核心和 6 个效率核心,对比 M3 多 2 个效率核心,而乞丐版的 iPad 在核心上动了刀,为3个性能核心+6个效率核心的配置,而GPU部分,M4几乎和M3保持了一致,同样是10核心,也支持M3就具有的动态缓存、光线追踪硬件加速以及网格着色等功能。 NPU部分是M4提升最大的地方,M4 的 16 核神经网络算力高达 38 TOPS,对比M3的18TOPS,高出了整整 20 TOPS,还超过了苹果A17 Pro的NPU的 35TOPS的算力,按照苹果的说法,这对于未来的AI应用帮助很大。 再来看实际跑分,在最新的GeekBench 6跑分测试中,搭载完整版M4的iPad Pro ,单核跑分为 3767 分,多核跑分为 14677 分,与上一代M3(3053)相比,单核性能提升了 25%,多核性能与最新的 11 核M3 Pro(15261)大致相当,而GPU的Metal 测试成绩为 53792 分, 比M3 (47420)提升了13.4%,没有超过规模更大的M3 Pro。需要注意的是,跑分中的iPad Pro的处理器频率拉到了4.4GHz,而频率最高的M3 Max的实际频率也不过4.1GHz左右。 而在代表NPU的 Geekbench ML 0.6.0 测试中,M4的得分为 9234,比搭载 M2 的 iPad Pro 的 7511 分高出约 22.9%,与14 英寸 MacBook Pro 的M4(8365)比较,提升幅度仅为 10.4%。 这时候大家可能觉得不对了,不是多了20TOPS算力吗,怎么跑分只提升了10.4%呢?实际上,苹果在这里玩了一个文字游戏,M3的18TOPS是在FP16精度下得出的,而M4的38TOPS是在INT8精度下得出的,后者实际上要打个对折,也就是19TOPS,这样算下来实际的TOPS提升只有5%左右。 与当初的英特尔 x86 处理器相比,M1无疑是一款跨时代处理器,但之后的M2、M3和M4,似乎都只是在M1架构的基础上不断改进,并没有巨大的提升,M4的在iPad 上的频率甚至拉到了4.4GHz,要知道M3在MacBook Pro上运行的频率也不过4.05GHz而已。 苹果为什么选择让iPad Pro来首发M4芯片呢?主要还是想推动iPad的销量。今年2月,iPad营收成为第一财季少见的亮点,苹果该季来自iPad的净营收为93.96亿美元,较2023年同期的72.48亿美元增长29.7%,超出华尔街分析师预计的77.6亿美元,东方不亮西方亮,既然M3带不动Mac的销量,那么就用M4来带动iPad的销量。 但就M4的性能提升来看,这一意图能否实现,可能要打上一个大大的问号了。 苹果也无法跨越的“鸿沟” 对于M3和M4芯片来说,其当前的局面和芯片行业大家面临的困境是一样的。例如工艺制程限制,物理定律限制,甚至光罩限制。而这些芯片如今的处境,不禁让我们想到了苹果的自研基带魔咒。 从最早爆料可能在2023年亮相,再到去年年底透露的最早2028年亮相,一眨眼,苹果就花了快10年去琢磨所谓的自研基带,数十亿乃至上百亿美元的投入之后,能否替代目前的高通基带都还是一个未知数。 还有所谓的自研无线芯片,2021年消息传出时,博通和 Skyworks Solutions 等公司的股价应声而跌,但长达3年多的时间里,该项目进展缓慢,去年年底又传出消息称,苹果无线芯片团队似乎已经停摆,自研WiFi芯片不太可能搭载于2025年的iPhone之上。 去年年底彭博爆料称,苹果还打算自研影像传感器,因为它是混合现实和自动驾驶的核心, 同时苹果自研的microLED屏幕和无创血糖检测系统也在推进之中,结果在今年,这三个计划中就有两个受阻:microLED团队被解散重组,而美国食品和药物管理局(FDA)也明确反对了无创血糖相关的设备。 伴随着着Vison Pro的热度褪去,以及苹果汽车的折戟,苹果自研影像传感器团队的未来恐怕也蒙上了一层阴霾,先不论研发进展如何,就算做出来了,又能用在哪里呢? A系列芯片的成功,让苹果对芯片充满了信心,M系列芯片的成功,让苹果的这份信心进一步膨胀,苹果或许觉得,不过几平方厘米的硅片而已,只要愿意砸下重金,就如探囊取物一般简单,再加上2019年以前与高通持续数年的交锋,也让它坚定了把芯片攥在自己手里的想法。 但事与愿违,苹果至今能称得上成功的,依旧只有A和M这两大系列的芯片,甚至后者还受困于Mac销量的持续下滑,现在要让iPad来当最后的救命稻草。 3nm芯片光是流片费用就高达十亿美元,倘若没有高销量的对应产品来摊薄这部分费用,那么当初为自研降低成本的意义又在何处呢?总不能只为了一个高大上的名号而选择自研吧,倘若M4 iPad Pro的销量依旧不尽如人意,那么苹果又要找哪一个品类来当救场呢? 或许此时可以说一句:强如苹果也无能为力。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。