行业分类:
加载中...
头条分类:
加载中...
2021年,马斯克杀死了波士顿动力
2021年的特斯拉AI Day,特斯拉PPT首发了人形机器人Tesla Bot的概念机设计方案。按照马斯克画的大饼,Tesla Bot可以完全代替人类“从事重复性/无聊的工作”。 也许是担心在场观众干看PPT无聊,马斯克请来了一位身着紧身衣的皮套人,模仿Tesla Bot尬舞了一段。 AI Day结束,科技媒体The Verge表示,马斯克的Tesla Bot就是个笑话[1]。文章还援引中央兰开夏大学机器人工程教授Carl Berry的评价:说它是马粪都算抬举它了(horse shit sounds generous, frankly)。 Carl Berry还专门搬出机器人领域的网红公司波士顿动力,认为后者正在踏踏实实的做事,而特斯拉在加深公众对机器人不切实际的幻想。 今年4月,特斯拉的皮套人尬舞再度被拉出来鞭尸。在波士顿动力展示新款机器人的视频中,机器人以一种灵活到有些诡异的方式从地上站起来。 波士顿动力也在推特上阴阳怪气了一句:“我们保证这不是一个穿着紧身衣的人。” 事情的起因是,波士顿动力宣布11岁“高龄”的人形机器人Atlas正式退休——Atlas算得上是初代机器人网红,它被波士顿动力员工一棍子撂倒,接着踉踉跄跄爬起来的视频,一度引发了“停止霸凌机器人”的后现代哲学思考。 结果Atlas领退休金的第一天,“焕新版”Atlas正式出道。最大的变化是,波士顿动力抛弃了原有的液压结构,改为电机驱动。 目前,“焕新版”Atlas的宣传片已经在YouTube上收获了500多万播放量。 相比Atlas熟悉的后空翻大劈叉,相较之下,去年年底的第二代Tesla Bot才刚学会缓慢行走和90度深蹲。 加上马斯克近几年大饼画的太多,也不难理解The Verge会提出“机器人为什么要像人”的质疑。 然而,可能恰恰是2021年PPT上的Tesla Bot和滑稽的皮套人尬舞,决定了波士顿动力的命运。 谷歌发现了什么? 相比荒诞开场的Tesla Bot,波士顿动力这家公司是机器人领域根正苗红的祖师爷。 波士顿动力成立于1992年,前身是麻省理工学院的腿部实验室,长期致力于有腿机器人的研究。 2012年,DARPA(美国国防高级研究计划局)为了推动机器人研究,资助了一场机器人挑战赛,波士顿动力由此进入美国军方的视野。 DARPA是五角大楼旗下的研究机构,和NASA一起诞生于美苏争霸的白热化时期,目的是借助国家意志确保美国在高科技领域的领先。只不过NASA负责地球以外,DARPA负责地球以内。过去几十年间,DARPA直接或间接的推动了GPS、互联网等技术的诞生。 2012年,正值DARPA在机器人、自动驾驶等领域大力投资,为了降低参赛门槛,DARPA希望能有一款标准化的人形机器人,供参赛团队编程。 在这之前,波士顿动力已经为DARPA开发了多款产品,比如外型神似野猪的LS3,能够穿梭于各种极端战场环境,快速运送物资。 波士顿动力LS3 2013年7月,在DARPA的资助下,波士顿动力打造出了身高1.88米,重达150千克的初代Atlas。这个新闻很快传到了谷歌的耳朵里,波士顿动力的命运随之改变。 当时,谷歌正在秘密筹备一个代号为“Replicant(复制人)”的机器人项目,由“安卓之父”安迪·鲁宾亲自带队。按照鲁宾的设想,谷歌将打造一个编程平台,从而推动机器人普及,最终在机器人身上复刻安卓系统的成功[3]。 为了这个庞大计划,谷歌疯狂扫货,一口气收购了九家机器人初创公司,Atlas问世不到半年,波士顿动力就被谷歌收入囊中。此后,Atlas的迭代速度也坐上了火箭。 2016年,波士顿动力毫无征兆的发布了一则新款Atlas的演示视频,视频中Atlas熟练的行走跳跃,尤其是被推倒在地后,仍能自主起身继续完成工作,整个过程栩栩如生,带给公众的震撼不亚于2022年底ChatGPT的问世。 目前,这条视频的Youtube播放量已经积累到了4059万。2017年,Atlas再接再厉,用一个精彩的后空翻再度把波士顿动力送上全球热搜。 Atlas表演后空翻,2017年 然而,就在波士顿动力风头正盛的2017年,投资了五年之久的谷歌却将其甩卖。按照彭博的说法,谷歌管理层的核心分歧在于商业化。 波士顿动力希望埋头研究,但谷歌希望尽快打造能商业化的产品:“我们不可能用30%的资源去投入一个需要10年以上的项目[4]。” 在彭博的报道中,丰田和亚马逊都是潜在的买家,但波士顿动力最终被卖给了软银,2020年又被卖给了韩国现代。 谷歌内部,安迪·鲁宾因性丑闻被扫地出门,Replicant项目也草草收场,划上一个满是遗憾的句号。 一家明星公司在当打之年被潦草脱手,谷歌内部真实的决策过程难以知晓。但在这个过程中起到决定性作用的,很可能是2017年发生在谷歌内部的另一件事。 我来组成头部 2017年6月,谷歌的8位AI科学家联名发表了一篇名为《Attention Is All You Need》的论文。这是继2012年AlexNet勇夺ImageNet挑战赛冠军之后,人工智能发展史上的又一个里程碑事件。 谷歌的科学家在论文里提出了一种“注意力机制”,并基于此开发一个名叫Transformer(变形金刚)的深度学习模型,解决了传统RNN模型的一系列问题。 2020年,谷歌又提出了Vision Transformer ( ViT )概念,赋予了Transformer处理图像的能力。 随着Transformer一口气解决了众多缺陷,它渐渐发展成了AGI领域的唯一解。 2012年的AlexNet让AI有了“感知”的能力,而Transformer和之后的大模型让AI有了“生成”的能力。换句话说,2012年的AI可以识别出各种各样的猫,2017年之后的AI已经可以自己生成猫的图片了。 因此,Transformer的推出直接开启了今天的大模型时代,2018年6月,OpenAI推出了基于Transformer模型的GPT-1,GPT里的“T”,就是Transformer的首字母。此后,OpenAI沿着这条路线持续迭代,并基于GPT模型开发了ChatGPT。 在大模型百花齐放的同时,Transformer也为人形机器人的进步打开了一扇窗户。 传统机器人大多基于特定的规划执行特定的操作,比如运输、分拣,不具备感知和决策能力。人形机器人不仅能与物理世界交互,还有感知和理解能力。 举一个不太恰当但好理解的例子:送餐机器人执行“把外卖送到1203号房”这个任务时,并不理解什么是“外卖”和“1203号房”,只是根据软件系统既定的指令和路线规划完成任务。 但人形机器人可以借由智能化,理解物理世界各种物体、语言和文字的含义,并自主规划和决策。也就是说,机器人可以不依赖预先的编程,就能完成诸如“关掉最上层抽屉”等较为模糊的指令。 波士顿动力的问题在于,无论Atlas的机械与动力结构多么优秀,都无法解决“穷举法”的问题。 Atlas的软件原理是通过摄像头与传感器输入外界环境数据,再根据提前创建的行为库,执行对应的动作。在其官方的文档里,波士顿动力坦诚了这么做的弊端: “如果盒子向一侧移动了0.5 米,那么Atlas会找到并完成跳跃;如果盒子移动得太远,那么系统将停止[5]。” 由于Atlas的所有动作都依赖提前设计的模版,那么真实环境的一点点变化,都可能让机器人无所适从。这也是为什么传统机器人只被用于环境、路线和职能极度固定的工厂、酒店送餐等场景。 而Transformer带来的思路是,只要让机器学习足够多的数据,就能拥有类人的智能,可以脱离预设的规划进行自主决策。 去年7月《纽约时报》探班谷歌实验室, 完整记录了基于RT-2模型的机器人智能闪现的瞬间: 桌子上放着一堆塑料玩具,工程师让单臂机器人“捡起灭绝的动物”,机器人拿起了恐龙。 这意味着机器人不仅能识别三种动物,也能理解“灭绝的动物”的含义,还可以完成具体的操作。 Google RT-2 Transformer的出现彻底改变了机器人的技术路径,在感知-决策-执行的完整链条中,核心能力不再是驱动机器人后空翻大劈叉的机械结构,而是组成机器人大脑的软件算法。 人工智能的进步在各行各业上演着软件对硬件的夺权,机器人只是其中之一。 另一个正在由软件定义的行业是自动驾驶,这也是为什么马斯克会说:当你能解决自动驾驶,你就能解决现实世界中的人工智能。 特斯拉的三张牌 特斯拉在AI世界的出场,常常呈现某种荒诞不经的色彩。 2022年特斯拉备受期待的Tesla Bot第一次“真人”亮相,居然要依靠三名壮汉搀扶。两个月后ChatGPT横空出世,Tesla Bot成了一块无人问津的背景板。 然而,特斯拉在机器人领域的积累,可能比任何一家公司都要深厚。 自动驾驶本质上是机器人的一个“前置产业”,两者的核心都是基于人工智能,实现感知-决策-执行的完整链条。 这就意味着无论是软件层面的算法,还是硬件层面的视觉传感器、FSD芯片等零部件,理论上都可以用于人形机器人。 特斯拉也的确是这么做的:Tesla Bot共配置有3颗摄像头,左右眼各一个,外加一颗鱼眼广角。芯片是和特斯拉电动车一模一样的FSD自动驾驶芯片。软件上,Tesla Bot也承袭了自动驾驶的技术方案。 2023年特斯拉股东大会,马斯克也确认了这一点:特斯拉已经打通了自动驾驶芯片FSD和机器人的底层模块,实现了一定程度的算法复用。 任何人工智能的发展都需要算法、算力、数据三驾马车来拉动,算法决定了计算机用什么方式识别事物;但算法又需要足够大的算力来驱动;同时,算法的提升又需要大规模高质量的数据;三者相辅相成,缺一不可。 算法和算力层面,特斯拉已经借助电动车业务,完成了从云端(D1)到终端(FSD),核心软硬件的自研。 数据层面,2022年的AI Day上,特斯拉宣称已经存储的有价值训练数据集有23.2万帧,验证数据集0.38万帧。上百万车主正在源源不断的为算法训练贡献着数据。 马斯克本人在AI领域的涉足也常被忽略,他是OpenAI的创始人之一,也是DeepMind的早期投资人。他参与的人工智能公司还有脑机芯片Neuralink、聊天机器人Grok。特斯拉每天接受并处理的视频画面超过1600亿帧,这很可能是商业公司能拥有的最大的真实世界数据集。 波士顿动力很可能意识到了这个问题,但“焕新版”Atlas最大的改变,是从液压改为全电动,最大的好处可能是降低成本。 在一次采访中,创始人Marc Raibert曾表示Atlas在一定程度上激励了马斯克制造Tesla Bot的想法。但在人工智能残酷的竞争中,波士顿动力已经落后太多。 波士顿动力的问题在于,他们用了20年的时间试图教会机器人如何“运动”,但实际上,机器人应该先学会“思考”。 或许在不久的将来,判断机器人的智能化程度,可能不是看它会不会后空翻大劈叉,而是能不能从九张图片中选出包含红绿灯或摩托车的图片,或者滑动滑块使图片位于正确的角度。
假期被“Remini”硬控五天,这就是古希腊掌管粘土人的神?
作者|椰子 你们猜此时此刻,AppStore免费软件排名第一是谁? 超越了抖音极速版、番茄小说、夸克、高德地图等一系列国民级 App 登顶 AppStore,这款名为“Remini”的App你可能没听过,但这两天应该会在社交媒体看到过这样被粘土化风格的图片。 五一假期的旅游照经过 AI 处理,几十秒就能变成一张独一无二的属于你的粘土人风格旅游照。 在芭提雅沙美岛的白色沙滩上,热风吹拂着脸颊。有几个孩子正在堆沙堡,也有情侣手牵手在沙滩上漫步。 顶着艳阳喝一杯柠檬汁不要太爽。 经过 AI 处理成粘土风格之后,你就是朋友圈最亮的仔。 这次 Remini 爆火一方面是粘土风格本身足够拟真,另一方面也来自于超高的还原度。 比如下面这张,给雷军和李想的表情还原的十分到位: 或者是甄嬛传中的宜修挠头: 和甄嬛抱被: 不管是背景还是神韵,至少能还原 80%,而且粘土风格还能平添了新的喜感。 如果是一些经典传世之作,还原度几乎能到 100%,比如The Beatles 的《Abbey Road》的专辑封面,每个人的衣服颜色、车的位置和颜色都保持了统一: Nirvana 的《Nevermind》,文字没有任何错误,而且保留了文字本身的特效样式。: 周杰伦的首张专辑《Jay》,神韵、头发和文字,几乎是一比一的还原: Remini 最早是由大觥科技开发,国内版本名为 “你我当年”,国外版本叫做“Remini”。不过在完成 0-1 的冷启动阶段后就被卖给了Bending Spoons。 Remini 在国内不太有名,但它多次在印尼 AppStore登顶,通过在 TikTok 传播获得了一次又一次的热度。 这次粘土风格先在 instagram 以#粘土加工的hashtag爆火,又被自来水转至国内的小红书和抖音。伴随五一旅游热,被大家争相用来爆改自己的旅游照。 它的功能很简单:图片/视频的图像增强、AI画像和 AI 滤镜。粘土人就是 AI 滤镜中的一种。 图像增强是前两年的重点功能,以老照片修复作为传播点: 随着生成式 AI 的爆发,Remini 也推出了 AI 画像功能,通过上传多张自己的照片,来生成一些像自己的图。类似之前爆火妙鸭相机和 InstantID。 除了粘土人滤镜之外还有些很有意思的滤镜,比如这个 GTA 罪恶都市风: 还有像素风,可以直接做 T 恤了: 目前 Remini 定价548 一年,确实略贵,美图秀秀也有同款功能(比开头那张可爱一点): 美图秀秀生成 只不过感觉比 Remini 稍微差一些,Remini 可以完全把握住 GTA 的感觉。 Remini 爆火似乎能分析出一个脉络,就像是上面提到的:它在国外有充足的用户基础以及超高还原度的生成效果。 但最关键的其实是粘土风本身。在这之前很难断言一款粘土风格的 AI 滤镜会有这么强的传播属性。 看起来 Remini 给所有文生图模型都做了一个教科书级别的传播案例。一款能吸引人的滤镜,比绞尽脑汁想创意玩梗还要好用。
AI解梦靠谱吗?学界目前进展如何?
“庄周梦胡蝶,胡蝶为庄周。”纵观东西方历史,人类对梦境有着不约而同的执念。梦境也是神秘学的重要部分,常常与预知未来、认识自己等概念联系在一起。时至今日,人类一直试图解开梦境背后的意义,经常求助于各种解释方法,甚至发展出了许多流派。 的确,梦境提供了对我们潜意识深处的一瞥,揭示了隐藏的欲望、恐惧和情绪,对我们的现实生活也不无影响。随着大模型等技术的兴起,在GPT store等平台上,也出现了声称能够通过对话解析梦境的AI助手。 ▷图1. 基于大模型的梦境解析网站:https://dreamybot.com 与民间占卜解梦不同,脑科学与梦境的相关研究首先关注的是梦境的内容,例如梦里看到的图像、听到的声音,之后才是梦境的意义。其研究对象也并非单个人的自述(轶事),而是一群人叙述的汇总及其中的统计规律。伴随技术进步,研究方法还包括了使用功能性磁共振成像(fMRI)等脑电检测,依据客观记录而不是主观描述来解析梦境。本文将从科学研究现状到商业应用前景,概述人们在“如何用AI作为工具指导人们更好地理解做梦”这件小事上做出的努力。 基于个人自述的梦境汇总, 男生女生的梦有区别吗? 梦境的内容可归因于大脑对白天收集的信息的处理和整合,这便是美国心理学家卡尔文·霍尔(Calvin Hall)提出的延续假设(continuity hypothesis)。当我们睡眠时,我们的大脑通常会从之前的记忆、经历和情感中提取片段并拼贴成一个故事。这些神经活动的复杂相互作用产生了我们在梦中遇到的生动的、有时令人费解的场景和人物。 人的大脑就像一个专长蒙太奇的导演,它采用日常经历中看似无关的事件、人物和物体,并以只有潜意识才能理解的方式将它们组合在一起。在梦里,物理和逻辑定律被扭曲,产生了脱离现实引力的奇幻景象和意识流情节,让我们常常在第二天醒来后反复琢磨前一晚梦境的深意。 然而科学研究毕竟不是奇闻怪谈的收集,不论哪个学科,科研的第一步是建立基线,也就是理解大多数人的典型状况,以便在后续尝试理解个案时,能够有一个合适的锚点。2020年的一篇发表在皇家协会开放科学(Royal Society Open Science)的期刊上的研究[1],通过自然语言处理,分析了不同年龄和性别的24000个被试自述的梦境,构建了数据库Dream Bank。研究发现,年龄,性别,过往经历(如是否当过兵)等不同因素都会对被试者的梦境产生影响(图2)。该研究基于是美国收集的数据,由于各国文化风俗上的差异,该研究的结论不适用于国内,但其研究思路是可以借鉴的。 ▷图源:参考文献[1] 不同年龄的梦境报告中攻击性的等级从20世纪60年代到现在在逐步减少,这个趋势和美国的暴力犯罪统计数据相符。 除了统计性的群体描述,这类研究还让人们可以比较和自己处境相似的人会做什么样的梦。例如在dreamcatcher中,人们可以根据自身身份查看下图中的每一个叶子(点击后对应一个梦的描述),通过了解与自身处境相似的人做了什么梦,从而缓解因梦境引发的焦虑,也可以上传自身的梦境描述,丰富数据库的内容。 ▷图3.基于自然语言处理的梦境解析和汇总网站 基于Dream Bank数据库的衍生研究[2],还包括通过GPT模型分析梦境自述文本的困惑度(Preplexity,一个衡量文本意外程度的统计量)。以维基百科的文本作为基线,研究表明梦境中的文本并非人们之前预计的那样格外不可预测,两者困惑度接近。该研究的另一个发现也符合常识,即女性对梦的描述文本困惑度更高,组间差异更大,这意味着相比女性,男性的梦更容易预测。 ▷图4.男性和女性梦境自述文本的困惑度对比,图源:参考文献[2] 科学家是如何读心的? 与上述依赖主观自述的研究不同,梦境可视化试图将人脑在潜意识或无意识状态下的内在认知活动转化为显性的图像或标签,例如做梦时看到了什么,听到了什么,有什么样的情感。这其中的研究,包括研究者要一次次的将被试从睡眠时唤醒,询问梦到了什么的实验,用以考察人们清醒后对梦的回忆。在这之中,又以清醒梦最为热门。所谓的“清醒梦”,可看成梦境与清醒的叠加态:做梦者有“正在做梦”的意识,并能描述出自己在做的梦。 梦境可视化的基础,首先是需要证明经由核磁共振成像,近红外线光谱仪及脑电图(EEG)等方法测量得到的大脑的血流,脑电及因工作而发热的变化模式,可被用以预测脑中的所思所想。19年的研究[3]根据人脑活动,复现了被试观察的影像。而23年的研究[4],基于Stable Diffusion,能够更准确地再现被试者脑中所看的画面。 对比图5和图6,可以显著的看到重塑的图像更加准确了,那这性能进步的背后,是有哪些创新促成的? ▷图5.基于脑电MRI记录,实用深度神经网络重现被试观察到的图像。图源:参考文献[3] ▷图6.被试者看到的真实图片(第一行)和模型重构的图片对比。图源:参考文献[4] 对比2019年的研究与2023年的研究,最直观的区别在于2023年的研究增加了语义解码部分。不过在谈及这一点之前,先看看23年研究的图像解码是怎么做的。在大脑处理图像的过程中,像经过有损压缩后再放大的图片一样进行操作,脑中图像会先被压缩成基本的素描形式,保留关键信息,同时形式更简洁,便于管理。这些压缩后的信息在大脑中是分布式存储的,这为科学家提供了解码的可能性。通过fMRI技术,科学家可以记录大脑活跃的部分,类似于观察一个拥有数万块硬盘的超级电脑处理特定数据时哪些硬盘处于工作状态,从而建立起一个基本的模型。 在解码大脑的实际操作中,基于fMRI数据,研究者首先根据大脑的信息压缩和分布式处理特点,构建了一个类似简笔画的初步图像。随后,在扩散过程中,模型会像绘画时一样逐步渲染上色,让图像逐渐丰富起来。然而,正如绘画时需要明确所画目标,重构大脑中想象的图像也需要利用大脑在观看图像后产生的语义信息,即大脑对图像的描述。 ▷图7.研究5的模型框架示意图。图源:参考文献[4] 根据大脑的“语义地图”[5],被试在听到某些词汇时,相关的fMRI数据显示这些词汇在大脑周围分布,而没有一个明确的语言处理区域。与此同时,与意义相关的词汇在大脑中的分布更为集中。而研究[4],则将语义信号和视觉信号分别用不同的神经网络去处理,从而用解码的语义信息来帮助图像重建。 例如,当被试者看到的是一个狗的图画,但只基于视觉信号,重建的图像可能会缺少狗的典型特征,使得重建图像看起来更像是猫;而有了语义信息的帮助,解码系统发现观察到的词汇和骨头接近,于是在潜在扩散过程丰富简笔画的时候,就会选择突出那些狗的特征。这种结合了两种模型的图像重建方法,比单一依赖语义或视觉信息的方法,能够实现更清晰、更准确的图像还原。 ▷图8. 由985个词构成的大脑语义地图。图源:参考文献[5] ▷图9. 图源:参考文献[4] 对比被试看到的原图,以及只基于图像特征(第二列),只基于语义特征(第三列)以及基于两者(第四列)的效果图。 近年来,科学家通过类似的思路,可以基于脑电数据生成被试听到的声音信号[6],从而让失语者可以说出自己脑中所想的话。此外,当前还有研究能通过脑电信号解读出被试者默念的文本[7],并重建被试观看的短视频内的场景[8]。所有这些研究,都说明了研究者目前有能力根据大脑活动读心。 但这距离解梦还有很长的距离。原因首先是梦境大多是迷幻的,跳跃的,人们会怀疑对梦境的描述更加没有逻辑,充满了离奇的意外(前述的基于梦境描述文本困惑度的[2],已提供了相反的证据);第二个原因,则在于很多梦境中包含了强烈的情绪,人们会担心梦境中强烈的情绪可能干扰其解读。 对此,24年的一项研究[9]声称可以结合个人叙事和fMRI,以此开发预测自发思维情感内容的模型,从而判断清醒梦中的主观体验是积极还是消极的。该预测模型不仅在阅读故事时能够预测被试的自我相关性和情感体验,同样适用于在自发思维(清醒梦)或休息状态下的199名参与者。 在这一研究中,研究人员监测参与者阅读故事时大脑活动,旨在解码思维的情感维度。为了捕捉各种思维模式,参与者参与了一对一访谈,以制作反映他们过去经历和情感的个性化叙事刺激。当参与者阅读他们的故事时,其大脑活动在MRI扫描仪内被记录。在fMRI扫描后,参与者再次阅读故事,并报告每个时刻感知到的自我相关性(即这些内容与他们的相关程度)和情感(即这些内容是积极还是消极)。使用每个参与者的自我相关性和情感评分的五分位数,研究团队创建了25个不同的情感和自我相关性组合,使用机器学习技术结合这些数据及49名参与者的fMRI数据来实时解码思维的情感维度。 研究发现前扣带回皮层和岛叶前部等关键大脑区域在预测个人相关性和情感调子方面至关重要。通过解码与具体情节无关的情感,该研究有助于我们理解影响主观体验的内部状态和背景,可能有助于揭示思维和情感方面的个体差异,并有助于评估心理健康。 梦境可视化的现实与理想 前述的研究都还没有直接涉及对做梦时大脑的解析,只是试图对清醒状态(或清醒梦)下受试者的所思所见进行预测。然而,有研究开始直接探索梦境中大脑的活动,并尝试将梦中的图像可视化。 例如,研究[10]依据两名受试者在fMRI下的大脑活动数据和他们自述的梦境内容,揭示了大脑在梦境中的图像处理具有层次化特点,即做梦时会激活与梦到物体相关的分层视觉特征表征。研究表明,从自做梦时大脑活动中解码的特征值与梦中物体类别相关的特征值,在在中间到高级深度神经网络中表现出正相关。这不仅提高了区分梦中物体类别的准确性,而且表明梦境中的视觉特征表征与清醒时的视觉处理相似,意味着大脑在做梦时可能和清醒时使用相同的机制,这支持了通用解码方法在不同视觉体验(清醒和梦境)中的泛化能力,从而论证了梦境解析的可行性。 ▷图10.图源:参考文献[10] 单次实验中,针对梦境在出现图片的预测,可基于较高抽象层级的特征得出。 早在2013年,研究[11]在视觉皮层区域刺激诱导的脑活动上训练的解码模型,显示出模型对梦境内容的分类能力超过随机猜测。在这项研究中,三名受试者在进行磁共振睡眠实验时,每当脑电信号被检测到,他们便被唤醒,并描述醒来前的视觉体验。为了收集充分的数据,每位受试者平均每5-6分钟就被唤醒一次,主要关注人们刚入睡阶段产生的类梦境视觉感受。在超过75%的唤醒中,受试者报告了梦中的内容。预测模型试图区分受试者梦见的是人还是椅子等物体,并在解码器的输出中使用了多个标签来提升准确性。这距离上文所讲的解码梦境中的所思所想,还相距甚远。 21年来自清华大学未来实验室的研究[12],基于11名被试者REM睡眠期的EEG数据,结合心理问卷帮助评估情绪,最终生成了梦境的抽象视觉表述。图11展示了基于EEG产生的对梦境的艺术化展示,该例中梦境的情感关键词是如释重负(relieved)。这项研究进一步说明了当前对梦境的解读,还远远做不到“像素级”的准确度,只是能够对情感进行定性的含糊描述,或者对梦境中出现的物体生成有一个比随机更准确的有根据猜测。 ▷图11.基于EEG数据对梦境中的情感产生的艺术化表征。图源:参考文献[12] 然而,前文关于清醒时大脑解析的研究,以及梦境和大脑遵循相同神经机制的研究,共同说明了梦境解析具有技术可行性,只是目前受限于当前研究条件(例如fMRI的机器噪音,实验成本,受试者过少等技术因素)还不够成熟。未来随着技术的进步,有着巨大的潜力。且梦境可视化这项技术在心理健康领域的应用具有重要意义。对梦境的理解可能带来新的治疗方法,特别是创伤后应激障碍(PTSD)、抑郁症和焦虑症等疾病。 除了心理干预,对梦境的重现还可以用于创意生成。应用创意设计等方式对梦境中的内容进行重构,可以产生更有艺术创造力的内容。此外,在科学史中,凯库勒在梦中找到了苯环的结构,门捷列夫在梦中产生了元素周期表的概念,我们不知道有多少科学上的创意,出现又无声的消失在梦中,通过对梦境的记录和解读,我们未来也许能够捡起更多这样带有科学创新点的梦。 总的来说,EEG和fMRI已经将梦境分析从纯粹的猜测转变为实证科学探索,从而得以让我们更加接近揭示梦境的真相的那一天。 梦境解析和引导的商业应用 说起解梦,人们最熟悉的是弗洛伊德-荣格的精神分析学派。虽然这一派的理论广为人知,但学术界对其有效性存在争议。随着大模型及对应智能体的成熟,市面上出现了不少号称可以解梦的聊天机器人,但这样的机器人带给笔者的个人体验并没有多么惊艳。更有一些解梦的应用,宣称结合中医典籍,对于这样有“伪科学”嫌疑的研究,读者更应该批判性地审视,不能因为大模型的套皮而轻信。 除了就梦境内容展开对话,基于梦境和AI结合还可以考虑梦境记录方面的应用。考虑到我们对梦境的记录往往出现在刚睡醒或半睡半醒间,并且很大比例的梦境会在我们醒来后消失,一个记录工具显得尤为重要。苹果平台的PlotPilot[13]可记录使用者对梦境的语音描述,并通过AI文本分析配上属于对应的背景音乐,制作成专属的有声书(现在可以根据梦境描述产生视频)。这样的工具不仅能帮助用户更好地了解自身潜意识的心理需求,还可以促进对梦境的研究。 如果说根据脑电活动预测个人的所思所想,会让人想到许多科幻小说里的场景,那么能帮助用户进入且稳定在清醒梦中的工具,则充满了《盗梦空间》的意味。2024年1月,美国初创公司“Prophetic”开发了一款名为“Morpheus-1”的新型人工智能模型,该模型可以以大脑的脑电活动作为提示词,基于多模态大模型生成与该大脑状态相互作用的形状声波。据称,输出的声波可与Prophetic计划明年春季发布的一款新头带产品“The Halo”绑定。The Halo会发送声波进入大脑,与当前的大脑状态相连接,从而使心灵进入清醒状态。据Prophetic称:“引导产生的清醒梦是一种梦者意识到自己正在睡觉的梦。”而公司设想的产品则可以让用户有效控制自己的梦境。 由于该公司成立不久,宣传的产品还没有发布,其技术的实际能力还有待进一步观察。一旦成功,此举对学界和市场都有重要的意义,引导清醒梦将有助于减少PTSD等心理疾病引发的噩梦,促进正念,为意识的神秘本质打开新的窗口。 另一方面,无论是引导还是预测梦境,这些涉及个人私人体验的应用无疑将产生大量敏感的数据。如何避免这样的技术被滥用?消费者需要提前意识到技术的双刃剑性质,有保护自身的权利和隐私的意识。在技术成熟前,不妨先通过科幻小说进行思想实验,模拟各种情况下新技术产品的推动可能对社会造成的影响:例如,如果未来的打工人要通过清醒梦来证明自己对企业的忠诚,多疑的伴侣可以偷偷记录并解析枕边人的梦境以查找出轨的证据时,社会又将成为什么样? 小结 “Life is but a dream···” 从弗洛伊德和荣格的心理学,到最新的基于脑电的读心术,以及基于大模型的海量梦境自述的文本分析,我们对大脑的理解,正在从定性转为定量,从个体案例转为群体统计,从依赖主观描述转为客观数据。随着对梦境产生机制的了解,人们也能够逐渐去控制梦的产生,从而避免或减少噩梦的出现,甚至引导清醒梦的产生。 同时,随着人们对梦境的测量和控制手段的进步,研究者得以用科学地方式去尝试回答更多之前无法解答的问题,如梦境中的情感体验究竟是什么样的?动物们在做梦时在想到了什么场景?AI是否具有做梦的能力?知识带来新的技术应用,而新技术扩展了可触及知识的边界。对梦境的研究,一旦脱离了民科和伪科学,就将踏上科学界通用的正向飞轮。
索尼 Xperia 发布会官宣,两款新品的爆料都在这了
今天,索尼 Xperia 官方账号在 X 平台上宣布,将于北京时间 5 月 15 日下午 3 点举行 Xperia 新品发布会。 这场发布会预计将发布两款手机新品:Xperia 1 VI 和 Xperia 10 VI。 Andriod Headlines 在近期分享了 Xperia 1 VI 和 Xperia 10 VI 的一些渲染图。 根据图片来看,这两款手机依然保留了宽厚的「额头」和「下巴」设计。 Xperia 1 VI 作为索尼手机的旗舰机型,预计将搭载高通骁龙 8 Gen 3 移动平台,并会配备 12GB 或更大的运行内存。 有报道称,索尼手机可能会放弃传统的 4K 屏幕和 21:9 超长屏幕纵横比。之后的机型会采用 2K 屏幕,纵横比例也将调整为 19.5:9 ,和三星 Galaxy S24 Ultra 类似。 相较于前代,Xperia 1 VI 机身宽度也会有所增加,达到了 74.5mm,比上一代增加了 3.5mm。至于机身背部,Xperia 1 VI 将提供黑、白、绿三款配色。 根据此前传言,Xperia 1 VI 将配备三个摄像头,包括一个 16 毫米超广角镜头、一个 24 毫米广角镜头以及一个 85-170 毫米长焦变焦镜头(最高支持 7 倍光学变焦)。 根据预测,Xperia 1 VI 的 24 毫米镜头将配备索尼的「Exmor T for mobile」堆叠式 CMOS 图像传感器,并且还可以裁切出一个 48 毫米镜头,以实现 2 倍变焦。 在音频方面,除了 Hi-Res Audio、Hi-Res Audio Wireless、360 Reality Audio、LDAC、DSEE Ultimate 的支持外,索尼 Xperia 1 VI 还将继续保持 3.5mm 音频插孔,并会带来一些新的音频芯片和电路方面的性能改进。 有传闻称 Xperia 1 VI 的建议零售价可能为 1224 美元(约合人民币 8870 元),相较于前代产品 Xperia 1 V 的 1288 美元,这一代旗舰手机价格下调幅度虽不大。 这场发布会上,另一个可能会发布会的新品是 Xperia 10 VI。 这一代最明显的变化,就是后置摄像头模组取消了前代的长焦镜头,只保留了主摄和超广角。不过索尼或许会为 Xperia 10 VI 的主摄进行升级,以提供 2 倍的无损变焦。 硬件方面,Xperia 10 VI 可能会配备 8GB 的运行内存。据 Geekbench 上的测试数据显示,其单核测试成绩为 934 分,多核测试成绩达到了 2816 分。 根据 Geekbench 的页面信息,Xperia 10 VI 手机型号为「XQ-ES72」,搭载高通骁龙 6 Gen 1 芯片,运行安卓 14 系统。 此前网上已有 Xperia 10 VI 的泄漏渲染图。从图片上来看,Xperia 10 VI 同样保留了 3.5mm 耳机接口,并且会拥有黑、白、蓝三种配色。 值得注意的是,索尼有可能会放弃推出摄影大师、电影大师等「大师」App,取而代之的将会是一个单一的 App。新的 App 中将包含索尼 Alpha 系列相机和 CineAlta 系列电影机的一些功能。
Beats Solo 4耳机评测:一款掉队的新耳机
Beats 在耳机行业一直是一个特立独行的品牌。在品牌创立之初,Beats 利用了创始人 Dr.Dre 在音乐人圈中的影响力,与大量著名音乐人推出联名款,将耳机从功能优先的电子消费品打造成潮流时尚单品。 但在打出 Beats 的品牌知名度后, Beats 却没有像 V-Moda 一样「两耳不闻窗外事情,一心只换耳机壳子」,反而开始在声音表现方面下起了功夫。比如 Beats 被 Apple 收购后推出的 Studio Pro、Flex 和Fit Pro,声音表现都非常不错,Studio Fit Pro 甚至是很长一段时间里小雷的首选 TWS 耳机,近几年甚至还推出了为 Android 生态适配的 Solo Buds 系列耳机。 但尽管 Beats 近乎已将 Solo 这条产品线划分到了 Android 生态中,为 Beats打下了「半壁江山」的 Beats Solo 3 却多年不见换代的消息,仿佛已经被 Beats 忘掉了一样——直到 2024 年,Beats 才终于想起了这个沉寂已久的系列,并推出了 Solo 系列的新台柱——Beats Solo 4。 图片来源:雷科技 那么这款售价 1799 元的 Beats 新台柱,能否接得住 Beats Solo 3 身上的重任,在带着 Beats Solo 系列一种新品在 Android 生态打出一片新天地呢? 很遗憾,我觉得不能。 好设计用不着常更新 配置方面,Solo 4 对 Solo 3 Wireless 的声学架构进行了升级,用上了被动调音动态振膜传感器。虽然读起来有些拗口,但这个被动调音动态振膜其实是一个非常经典、对装配精度有较高要求的方案。 一般来说,主动调音通过电子方式调整音频信号,通常涉及数字信号处理器(DSP)或其他形式的电子电路。这种技术可以在耳机放大信号之前调整频率响应,以适应特定的听音环境或用户偏好。主动调音能够动态地调整音频,提供更加精确和多样化的音频控制,常用于降噪耳机中以优化不同环境下的听音体验。 图片来源:雷科技 而被动调音通常指的是通过耳机设计本身来影响音质,如耳机的物理结构、驱动单元的设计、耳机内部材料的使用等。被动调音不依赖于外部电源或电子设备,完全依靠耳机的物理属性来调整音频输出。 而对于 Beats Solo 4 这种蓝牙有线双模耳机来说,被动调音的设计可以保证耳机在任何工况下拥有始终如一的声音表现,不至于像某些耳机那样,开降噪一种声、关降噪一种声,插耳机线使用时又是另一种声音。当然了,被动方案也是有代价的——尽管 Solo 4 售价高达 1799 元,但并没有主动降噪功能。 佩戴舒适度不错,声音还有进步空间 造型上,Beats Solo 4 延续了从 2016 年至今的设计风格。尽管头梁很薄,但下方依旧有足够厚的缓冲软垫。配合上 Solo 4 圆形而非蛋形的头梁曲线和浮动耳罩,佩戴舒适度非常不错。 图片来源:雷科技 值得一提的是,Solo 4 没有像主流耳机品牌一样全面转向耳罩式方案,而是保留了 Solo 的精髓——压耳耳罩。和全尺寸的耳罩相比,压耳头戴不会完全罩住耳朵,长时间佩戴时通风性更好,不易使耳朵感到闷热或出汗。因体积较小,耳机整体在收纳时相对耳罩方案也更加方便,同时也不容易压住眼镜腿,对戴眼镜的用户更加友好。 不过在声音方面,Solo 4 的表现却只能说「勉强使人满意」。尽管升级了声学单元,Solo 4 这套 40mm 依旧非常「挑歌」。在《BOOM》中,Solo 4 的低音取向并不激进,由于没有低频补偿等心理声学设计,Solo 4 在低频区域的衍生并不明显,低音量控制的也中规中矩,没有「True Music」「动词打次」那种「廉价感」。中低频方面,Solo 4 的表现我觉得非常不错,低频冲击的感觉也非常明显和直接,只不过在细节处理上略微有些毛刺。 图片来源:雷科技 尽管 Beats Solo 4 的中频和高频还是有些许松散,但对于大多数常见的流行曲目、甚至是偏向金属风格的华丽金属类曲目,Solo 4 都能拿捏到位。以《Cheery Pie》为例,即使不使用 Apple 后制的空间音频技术,Solo 4 依旧能提供一定的声相定位,元素复杂但不凌乱。 换句话说,Beats Solo 4 是一款综合素质不错,也依旧带着 Beats 标志性音染的耳机。用 Solo 4 听宇多田光、YOASOBI 不会有出戏的感觉,但如果想体验 Beats Solo 4 的全部表现能力,OneRepublic、Blitzkid 或 AC/DC 的曲目会是更好的选择。 但或者如果你想要「原汤化原食」,用 Beats Solo 4 来听 Dr.Dre 的 G-Funk 曲目,那当然更好不过了。 不同的生态、同样的体验 就像小雷之前体验过的 Beats Studio Pro 类似,Beats Solo 4 和 Apple 品牌的耳机一样,提供了空间音频功能,iCloud 账户快速匹配、Find My 查找网络等功能也一应俱全。 图片来源:雷科技 但由于 Solo 4 用的不是 Apple W2 芯片,所以即使在 Android 平台上,Beats Solo 4 也提供了一键配对、账户同步、设备查找等功能。考虑到大多数手机现在都不提供 3.5mm 耳机,Beats Solo 4 即使有线也能双模——用户可以同 3.5mm 耳机线或 USB-C 数据线连接 Solo 4。再加上 Solo 4 的被动调音设计,即使通过音频线连接 Solo 4,耳机的声音表现也不会出现偏差,好评。 只把声音做好,对现在的耳机而言还不够好 说完 Beats Solo 4 的优点,接下来该聊聊我对它不太满意、或者说认为还可以继续改进的地方了。 首先,我认为 Solo 4 的定价和功能严重脱节于国内市场。即使从 Beats 品牌特点的角度来考虑,一款售价 1799 元(199 美元)的蓝牙耳机,不提供主动降噪功能,放在 2024 年也是说不过去的。 尽管 Beats Solo 4 是一种「潮流符号」,但除了挂脖子上一年不给耳机开机的「潮人」,绝大多数接触、了解过国内耳机市场的消费者对 Solo 4 显然有着更高的期待。 图片来源:雷科技 当然了,Beats 可能也会从耳机「被动方案」的角度找补。但归根结底,耳机采用被动方案这本身就是一种节省成本的考虑。没错,Solo 4 因为使用被动音频方案,对耳机的装配、质检有更高的要求,但这额外的成本并没有为消费者带来更好的体验,在功能上甚至落后于其他品牌售价更低的产品。 在我看来,在这一点上,被动方案并不是 Beats Solo 4「刀法精准」的借口。当然了,Beats 也可以说「Solo 头戴数字系列从来都没有降噪」。确实,在 Beats 的产品序列中,降噪是 Pro 的独占功能。但就像 Beats Solo 系列产品开始接触 Android 生态一样,Android 的配件生态在变,Beats 也在主动求变,「祖宗的章程」不是、也不应是 Beats 不提高自身竞争力的理由。 图片来源:雷科技 同样受到「祖宗章程」限制的还有 Beats 在设计上的一些细节:作为一款在 2024 年中上市、定价 1799 元的国际大牌头戴式耳机,Beats Solo 4 还在大大咧咧使用「明线」,连接单元的线缆在头梁折叠的铰链处也没有补强设计,仅在内侧开了个小缺口,为耳机线留反复折叠的空间。 图片来源:雷科技 更不用说 Beats Solo 祖传的「收纳问题」了——因耳机采用内折收纳方案,尽管收纳体积不大,但 Solo 4 依旧不能像 AirPods Max 或 Bose 700、那样「摊平」放在飞机座椅背面的收纳槽内。 图片来源:雷科技 另外,Beats Solo 并没有在耳罩或转轴处加入佩戴传感器或折叠识别触点,这意味着 Solo 4 不能像同价位的其他耳机那样摘下或收纳自动暂停播放。在 Sony 和 Bose 在 2000 元价格区间「神仙打架」、「二线」品牌下探到千元级别,倍思、Anker 等手配品牌在千元以下「虎视眈眈」的 2024 年,Beats Solo 4 这样的产品竞争力和定价,似乎有些「过于乐观」了。 确实,Beats Solo 4 在声音上表现得还不错,在软件功能上也有自己独一无二的竞争力,但在和用户息息相关的使用体验上,Beats Solo 4 的扣分点确实有点多。相比之下,电商平台上到手价和 Solo 4 定价相差无几的 Beats Studio Pro 显然更有竞争力。 图片来源:雷科技 放在三年前,Beats Solo 4 的定价和产品力其实也还算不错,但在 2024 年的耳机市场中,如果 Beats 想用 Solo 4 吸引更多新用户,甚至是重塑大家对 Beats 的品牌认知,那 Beats 显然还需要继续努力。
华为、苹果发布会“贴脸开大”,谁遥遥领先?
作者 | 陈法善 编辑 | 刘杨 华为“最神秘发布会”撞上苹果“最早发布会”,会发生什么? 5月7日,苹果、华为相继举办产品发布会,发布平板电脑、手写笔、手表、笔记本电脑等设备。不论是时间,还是产品种类,两场发布会重合度颇高,两位老对手再次擦出浓浓的火药味。 类似的“不约而同”曾多次上演,早在2023年9月,两家公司默契选在同一天,发布各自旗舰款手机Mate 60和iPhone 15系列,被网友戏称为“华为对苹果贴脸开大”。 一直以来,华为被认为是能在高端市场挑战苹果的公司之一,虽然中途因芯片被“卡脖子”而一度被看衰,但随着Mate 60搭载麒麟9000S芯片复出,华为正抢回短暂失去的市场。而在压力之下,苹果特地将此次发布会的时间提前了约3小时至当地时间早上7点(北京时间晚上10点),以照顾国内用户作息。 在苹果销量接连受挫之际,华为在迪拜举办“创新产品发布会”暗含重启出海的雄心,两家公司从硬件设备到AI应用,将全方面对线,类似的“默契”也将继续重演。 又一场“孪生”发布会 这或许是华为近期最神秘的一场发布会。 早在4月底,网络上便透出华为将于迪拜举办发布会的消息,但直到5月7日当天,不论是新闻资讯、社交平台,还是IT行业网站,都没有关于这场发布会的最新消息。 从5月7日中午起,就不断有网友在社交媒体询问发布会时间和链接,但没有人回复。当晚8点多,仍有不少人吐槽不知道上哪儿了解发布会信息。直到晚些时候,才陆续流传出一些用户发布的现场照片和视频。 华为消费终端的一位员工对《豹变》表示,公司没通知具体的时间,按惯例一般是下午两点半开始,近期发布了很多新品,要忙着宣发,外面的消息甚至比员工知道的还准。华为云一位员工也表示不知情,称“数字中国”“华为开发者大会”是近期要举办的影响力更大的会,迪拜的发布会“不是啥大会吧”。 与华为预告的信息一致,这场发布会重点推介了全新MateBook、MatePad、Watch Fit3、第3代M-Pencil、FreeBuds 6i、自研绘画软件GoPaint天生会画等。近期热度很高的新品Pura 70手机没有出现在发布会上。 其中,MateBook X Pro 2024笔记本已经在中国开售,以980克的轻盈机身和高性能Intel Ultra 9处理器为两大卖点。而可穿戴设备Watch Fit 3采用方形表盘,配有一个醒目的红色旋转按钮和功能键,外形设计与苹果手表相似度颇高。 此外,华为还带来全新自研平板绘画软件“天生会画”,搭配第3代M-Pencil,可以使用更丰富的笔刷,为普通人创作带来更强大的绘图功能。 而Pencil也是苹果发布会的重头戏,在苹果的预告海报中,C位正是一只Pencil,也是海报上唯一能看出外型的产品。 新发布的苹果Pencil Pro堪称该产品近六年的最大升级:“挤压”新手势可以解锁签名、添加形状、贴纸等功能。同时,Pencil Pro将首次搭载震动反馈,让触控笔的书写感受更接近真实纸币。华为选择此时发布“天生会画”和第3代M-Pencil,针锋相对的意味明显。 Apple Pencil Pro 相比起华为的神秘,近年来,苹果的发布会没有秘密可言,在发布会前,产品信息就已经被剧透的差不多了。苹果这场“放飞吧”发布会,主角是iPad生态多款新品,包括iPad Pro及Air,升级的Apple Pencil Pro,以及让iPad“变身”笔记本的妙控键盘。 其中,iPad Pro直接跳过了M3芯片,搭载了苹果最新的M4处理器,将显著增强AI能力。今年2月,苹果官宣停止造车,加注AI研发,新款iPad Pro可被视作苹果进入AI时代的急先锋。 相较目前 11 英寸iPad Pro搭载 LCD屏幕、12.9英寸搭载了miniLED屏幕,新款iPad Pro两个版本同步升级至OLED屏幕。以往,购买小尺寸iPad Pro的用户只能使用被阉割的屏幕,而新款则能获得满血版的屏幕体验,对“小屏党”而言,无疑是一种利好。 iPad Air除了11英寸,还增加了13英寸版本,满足了“大屏党”的胃口,而在处理器上延续了“落后一代”的惯例,从M1升级至M2芯片。 巨头针锋相对 几乎同时举办发布会的两家公司,近期的表现截然不同。 由于股价下跌、销量下滑、被巴菲特减持,近年来,苹果公司被不少人唱衰,走得有些磕磕绊绊。 巴菲特的动向一直被市场当做投资风向标。今年一季度,巴菲特减持了约13%的苹果股票,一时间,苹果仿佛成了巴菲特“弃儿”。对此,在5月4日的巴菲特股东大会上,巴菲特表示,减持苹果是出于税收原因,因为投资获得了可观的收益,而不是基于对该股的长期看法的任何判断。即便减持后,苹果仍是伯克希尔投资规模最大的公司。 在巴菲特股东大会前一天,苹果公布了2024财年第二财季业绩,当季营收907.5亿美元,同比下降约4.3%;净利润236.4亿美元,同比下降约2.2%。iPhone在中国销量的下滑,被认为是影响苹果股价、收入的关键因素。 市场调研机构Canalys数据显示,2024年一季度,华为拿下中国智能手机市场第一,出货量1170万部,市场份额为17%;苹果手机出货量1000万部,同比下滑25%,市场份额15%,位居行业第五。 从产品售价看,华为旗舰手机Mate 60系列、Pura 70系列跟iPhone 15系列高度重合,从6000元左右的入门款,到上万元的顶配版,每个价格区间都针锋相对。在手机的较量中,华为明显更强势,这从二者的售价就能看出来。 目前,华为Mate 60、Pura 70系列仍一机难求,少有价格优惠,而iPhone 15入门款在电商平台价格已降至4600元左右,较官方定价下调约1400元。可以说,华为卷土重来后,改变了高端市场的格局。 不过由于众所周知的原因,华为Mate 60系列并没有在国外正式开售,当前的销量主要依靠国内市场。这也是近期新发布的Pura 70系列未亮相迪拜的重要原因。 一直以来,迪拜因自由开放的经贸环境、特殊的地理位置,被视为进军欧洲、非洲市场的关键枢纽。2023年12月,华为就已经在迪拜举办过新品发布会,加上此次发布会,被外界解读为华为意欲重新搭建经销渠道,为重返欧洲市场铺路。目前,Pura 70系列已经在马来西亚、欧洲开启了预售。 华为手机等产品重启海外市场的底气,除了来自突破“卡脖子”,还因为“钱袋子”鼓了。2024年一季度,华为总营收1785亿元,同比增长37%;净利润197亿元,同比增长557%。 AI变局,谁能遥遥领先? 除了争夺海外市场,华为、苹果未来的较量更看AI。 华为Pura 70一经推出,其AI功能就被网友推上了热搜,最吸引人眼球的莫过于强大的抠图功能。当用户拍了一张照片,又不想要照片上的一些画面时,可以用手指圈住,AI会将其抹除,并自动填补空白。从网友拍摄的实操视频看,Pura 70的反应速度、处理效果在同级产品中属第一梯队。 不过,这一功能被一些别有用心的人“玩坏了”:圈住女性胸口位置,这部分衣服就被P掉了。华为不得不紧急回应,这属于AI的漏洞,并迅速更新AI,禁止用户进行此类操作。 在华为线下门店,AI成了手机的重要卖点。在温州一家华为门店,Pura 70旁边摆放着一张高速旋转的光盘,肉眼无法看清光盘上的图案,但用Pura 70拍摄后,静置几秒,AI便还原出清晰的图案。这能大大提高用户在弱光、高速、手抖环境下的拍摄成功率。 在硬件配置已经堆到天花板、旗舰机型同质化的当下,AI成了手机厂商打破瓶颈的突破口。《豹变》在小米、荣耀、OPPO、VIVO等品牌门店看到,大模型成了标配,旗舰机型都搭载了AI功能,实现了人机智能交互、一键剪辑视频、生成文本等功能。 OPPO创始人兼CEO陈明甚至在全员信中称,AI手机将成为继功能机、智能机后,手机行业的第三阶段。2024是AI手机元年,未来五年,AI对手机行业的影响,完全可以比肩当年智能手机替代功能机。 当国产手机争相进入AI时代时,苹果的AI产品有些姗姗来迟。在2月官宣停止造车后,苹果将不少造车工程师转岗至AI部门,加大对生成式AI的研发投入。新款iPad Pro成了苹果AI战略的先手棋。 iPad Pro之所以一反常规跳过M3、直接使用M4芯片,就在于AI。M4搭载了为AI量身订制的神经引擎,算力较M3提升10%—15%。神经引擎主要负责图形处理、面容解锁等机器学习部分,将使得搭载M4芯片的产品在处理这些任务时,效率得到大幅提升。这些使用场景正是iPad的优势领域。 此前,每代M系列芯片的升级间隔约在一年半左右,M3芯片于2023年10月底推出,根据Canalys预测的时间表,M4系列芯片有望于2025年第一季度上线。此番M4提前上市,意味着苹果将加快AI应用的步伐。 今年2月,在苹果年度股东会上,苹果CEO库克对外界认为苹果在AI上掉队的观点进行了回应。他表示,苹果多款设备由AI驱动,正在AI领域进行重大投资,认为生成式AI具有突破潜力。 此前,苹果已经发布了基于终端硬件的OpenELM模型,AI功能在手机本地运行被认为比ChatGPT等开源的大模型更能保护信息安全和用户隐私。而将硬件、软件、服务结合,一直是苹果的强项。 不过,《豹变》在走访中与经销商、用户沟通中了解到,目前用户购买手机,主要还是看摄像、芯片、屏幕等核心配置,AI是一个卖点,但不是影响消费决策的关键变量。由此看,AI的作用不在当下,而是未来的想象力。
谷歌掏中端机杀招:自研Tensor芯片+Gemini大模型,499美元起
编译 | 一支笔 编辑 | 云鹏 智东西5月8日报道,5月7日,谷歌发布新一代平价智能手机Pixel 8A,并在当天开启预售,预计在5月14日正式发售。谷歌承诺,Pixel 8A将提供内置VPN功能以及长达7年的安全更新。手机配备128GB的存储空间,并新增256GB的选项,但仅适用于黑曜石颜色。 据报道,与Pixel 8系列一样,Pixel 8A搭载了谷歌最新自研芯片Tensor G3,配备了8GB的RAM。这意味着Pixel 8A将具备去年谷歌旗舰产品首次亮相时展示的大部分软件功能。其中,“音频魔术橡皮擦”(Audio Magic Eraser)可以消除视频片段中不需要的声音,如警报声。“最佳照片”(Best Take)能非常高效地达到最佳的合影效果,让照片中每个人的面部看起来都不错。此外,通过“魔法编辑器”(Magic Editor)功能,用户还可以移动拍摄对象,并使用软件生成背景来填充空间。 除了出色的性能和长期的软件支持,Pixel 8A在屏幕方面也进行了升级。Pixel 8A保留了与前代相同的6.1英寸屏幕尺寸,但搭载了一种谷歌称为“Actua”的新型OLED显示屏。这种新型OLED面板据称比Pixel 7A的峰值亮度高出40%,最高可达2000尼特(HDR为1400尼特)。此外,它还支持120Hz的刷新率,以实现更加平滑的滚动体验。 谷歌称Pixel 8A为“500美元以下最好的智能手机相机”。该设备配备了64兆像素主摄像头、13兆像素超宽摄像头、13兆像素自拍摄像头,为用户提供出色的拍摄体验。同时,谷歌还引入了“自然色调”(Real Tone)功能,该功能可以通过更准确的图像处理算法,使不同肤色在视频拍摄中更加真实地呈现。 在Pixel 8A手机设计方面,谷歌对该设备的盖玻璃做出了一些调整。Pixel 8A采用的是康宁公司于2013年推出的第三代大猩猩玻璃,其背面则采用了哑光塑料复合材料,并配有哑光铝框。谷歌称,手机外壳和相机杆均由100%可回收的铝制成,其后部的塑料则含有76%的可回收材料。手机依然具备IP67级防尘防水功能,因此,即使在游泳池或雨中也可以安心使用。 此外,Pixel 8A的电池容量增加至4492毫安,谷歌声称这将比7A提高15%的电池续航时间。用户可以通过Qi标准进行无线充电,也可以使用随附的USB-C电缆。 除了硬件方面的优势外,Pixel 8A还整合了谷歌的Gemini Nano大型语言模型。一旦启用Gemini Nano,用户可以在特定的设备上使用AI功能。谷歌提到,Gemini Nano功能将在未来的软件更新中提供,但Pixel 8A默认使用Google Assistant作为助手,不过用户可以轻松将其替换为Gemini助手。 结语:Pixel 8A发布,谷歌有望巩固其在智能手机市场的地位 当前,智能手机市场竞争日益激烈,各大智能手机品牌竞相推出新产品以吸引消费者。在此背景下,5月7日,谷歌Pixel 8A手机面世,这进一步增加了消费者在购买智能手机时的选择范围。 Pixel 8A的亮点之一在于长达7年的安全更新承诺,这一承诺也彰显了谷歌对用户隐私和数据安全的重视;而搭载的Tensor G3芯片和Google AI功能,则为用户带来了更加智能化的使用体验;在摄影能力、设计环保性以及电池续航方面,Pixel 8A也有着明显的竞争优势,为用户提供了更加全面的选择。 随着Pixel 8A的问世,谷歌有望进一步巩固其在智能手机市场的地位。未来,我们或许可以期待智能手机技术的持续创新和进步,以及智能手机市场走向更加多元化的发展趋势。
OpenAI媒体管理器明年投用!识别内容版权,允许创作者退出AI训练
编译 | 庞小春 编辑 | 香草 智东西5月8日消息,昨日,OpenAI宣布正在开发一款名为媒体管理器(Media Manager)的工具,旨在让创作者能够更好地控制其原创内容在生成式AI训练中的使用方式。OpenAI可以通过媒体管理器识别内容创作者的作品,并按照他们的要求将这些作品纳入或排除在AI研究或训练之外。 OpenAI计划2025年之前将该工具投入使用,可能会通过公司最近加入的C2PA(内容来源和真实性联盟)的行业指导委员会,联合创作者、内容所有者和监管机构共同制定一项标准。OpenAI在公告中写道:“作为有史以来的第一个此类工具,媒体管理器需要大量的学习研究,来帮助我们识别多个来源的受版权保护的文本、图像、音频和视频,并反映创作者的偏好。”并称随着时间的推移,他们会推出更多的选择和功能。 无论最终采用何种形式,媒体管理器似乎都是OpenAI对其开发AI的方式日益受到批评的回应,即严重依赖于从网络上收集公开可用的数据。最近,包括《芝加哥论坛报》在内的八家美国著名报纸以侵犯知识产权为由,对OpenAI提起诉讼,指控其窃取文章用于训练生成式AI模型,并且在没有补偿或署名的情况下商用。 以ChatGPT为代表的生成式AI大模型,通常都是利用来自公共网站和数据集的大量数据进行训练。这些生成式AI公司认为,基于公平使用的法律原则,他们有权从公共数据中获取并用于模型训练。但并非所有人都这样认为。 事实上,OpenAI认为,如果没有版权材料,就不可能创建有用的AI模型。但为了回应批评人士,并在未来的诉讼中为自己辩护,OpenAI已采取措施,与内容创作者达成妥协。 去年,OpenAI允许艺术家“选择退出”,对于他们不希望用于训练图像生成模型的数据进行删除。公司还允许网站所有者通过robots.txt标准对其网站内容进行指示,选择是否可以用来训练AI模型。 OpenAI将继续与新闻机构、媒体库、问答网站等海量数据管理者签订许可协议,但一些内容创作者表示,OpenAI做得还不够。艺术家们认为OpenAI的图像选择退出工作流程太过繁琐,对于要删除的图像都需要提交单独副本以及描述,并且OpenAI为授权内容支付的费用也相对较少。另外,OpenAI也在公告中承认,公司目前的解决方案无法解决创作者的作品在其他无法控制的平台上被引用、二次创作或转发的情况。 除了OpenAI之外,其他大模型公司也正在尝试为生成式AI构建来源标注和选择退出工具。初创公司Spawning与其合作伙伴Stability AI和Hugging Face等共同构建了一款应用程序,可以识别和跟踪机器人的IP地址以阻止抓取尝试,并且提供一个数据库,艺术家可以在其中注册自己的作品,阻止AI供应商用于大模型训练。Steg.AI和IMATAG公司也通过应用人眼无法察觉的水印来帮助创作者建立图像的所有权。另外,芝加哥大学开发了一种名为Nightshade的工具,可以使AI图像生成器无法使用未经许可的图像进行训练。 结语:OpenAI推出媒体管理器,助力AI训练数据应用规范化 AI大模型严重依赖大量公开可用数据,其使用方式容易侵犯内容创作者的知识产权,OpenAI推出媒体管理器,使内容创作者能够控制其作品在AI研究和训练中的使用方式。 作为AI大模型引领者,OpenAI这一做法或许会助力AI训练数据应用走向规范化,加快AI大模型迭代升级。
OpenAI推出图像检测新工具!可检测DALL·E 3生成图像,准确率达98%
编译 | 长颈鹿 编辑 | 李水青 智东西5月8日消息,5月7日,OpenAI宣布推出一个面向文生图模型DALL·E 3的图像检测分类器,该工具能帮助用户识别AI工具生成的内容。据内部测试,该工具识别DALL·E 3生成图片的准确率达到了98%。 此外,OpenAI称为了应对图片内容是否真实的挑战,公司希望与业界各方机构一起采用、开发和推广开放标准。据悉,OpenAI昨日开放了图像检测分类器的API,希望通过技术共享来提升数字内容的真实性和完整性。 5月7日,OpenAI宣布加入C2PA(内容来源和真实性联盟)指导委员会。C2PA是一个开放数据标准,其元数据(Metadata)可用以追踪数字内容的初始来源。同日,OpenAI和微软宣布推出200万美元的“社会韧性基金(Societal Resilience Fund)”,用于推动人们对AI技术的认知。 一、OpenAI加入数字内容认证机构,助力鉴别AI生成内容 OpenAI在5月7日加入了C2PA指导委员会,由多家机构共同开发的C2PA是一个被广泛使用的数字内容认证标准。这个标准可以协助用户确认内容的来源,即鉴别一张图是直接由相机拍摄的照片,还是通过像DALL·E 3这样的文生图工具创作的作品。 ▲添加了C2PA元数据的DALL·E 3 今年2月7日,OpenAI在ChatGPT和OpenAI API中为DALL·E 3创建的图像嵌入了C2PA元数据。据悉,OpenAI即将推出的视频生成模型Sora也将集成C2PA元数据。 OpenAI称用户无法轻易伪造或修改C2PA元数据。无论内容被如何传播和使用,其元数据都将保持不变,C2PA等标准能够提供关于内容来源和真实性的可靠信息。 OpenAI和微软于5月7日共同设立了一个资金规模为200万美元的基金,这个基金的目的是加强人们对AI的理解,以及推动人们理解和接受数字来源标准。这个基金支持的组织包括美国退休人员协会(AARP)、国际IDEA联盟,以及相关的AI合作伙伴。 OpenAI称实现内容真实性需要全行业的共同努力。平台、内容创作者和处理者需协作保留元数据,以确保内容来源的清晰,从而建立更真实的数字生态系统。 二、OpenAI自研图像检测工具,准确率约达98% 为了增强数字内容的完整性,OpenAI在推广C2PA认证标准的同时还在自研一款图像检测分类器。该工具有助于抵制删除或篡改内容真实来源的行为。 图像检测分类器可以识别出压缩、裁剪、更改饱和度/颜色、去除水印等常规图片操作。OpenAI称,图像检测器在内部测试中,能正确识别约98%由DALL·E 3生成的图像,有约0.5%的概率会将非AI生成的图像误判为AI生成。但其在区分DALL·E 3生成图像和其他AI模型生成图像方面性能较低,约有5-10%的误判。 OpenAI的图像检测分类器现已向AI实验室和AI初创公司开放申请,公司希望通过业内集体协作共同完善图像检测技术。 OpenAI还在其语音模型Voice Engine中引入了音频水印技术,目前处于产品预览阶段。 结语:AI强企斥资普及AI知识,发展可识别数字生态 OpenAI正积极参与构建一个标准化、可信赖的数字内容生态系统。其不仅加入C2PA指导委员会并集成C2PA元数据于DALL·E 3中,还正自研图像检测分类器。 OpenAI与微软共同推出的“社会韧性基金”进一步凸显了OpenAI对于普及AI知识、提升公众对AI技术认知的承诺。 OpenAI的这些努力将使AI生成内容向更规范、透明的方向发展。我们也希望有更多AI企业间技术共享、开放合作的行为来构建一个更加真实和可信的数字世界。
前销冠iPhone,跌出前5
作者|孙鹏越 编辑|大 风 缺席18个月的iPad终于出新了! 北京时间5月7日22点整,苹果公司正式发布新款iPad系列,iPad Pro和iPad Air分别迎来更新。 苹果CEO蒂姆•库克在发布会现场表示:“这是iPad自推出以来最重要的一天。” 新款iPad 虽然库克如此郑重其事,但显然iPad家族在苹果公司整个业务体系中,占比并不高。能抗住苹果公司大旗的,永远都是iPhone。 不幸的是,现在的iPhone早已经不是曾经的“手机扛把子”。 在2024年Q1季度的中国智能手机市场,苹果以13.7%的市场份额跌出了前五名,加入“others”(其他)行列。 这对于苹果来说,是史无前例的一次。在去年,IDC数据统计,苹果卖出2.346亿台,量占到市场份额的20.1%,取代三星成为2023年销量最高品牌。 一年时间,天翻地覆,iPhone跌掉了底裤。 集体下滑的苹果业务 在新的一年里,苹果硬件出货量不停地跌跌跌。 最令苹果肉疼的是,自家顶梁柱的核心业务,iPhone15系列,在中国大陆地区出货量大幅度暴跌。 5月6日,市场调研机构TechInsights发布最新数据,2024年Q1季度,中国智能手机出货量为6330万台,同比增长1%,结束了连续11个季度的下滑;其中,苹果以13.7%的市场份额跌出了前五名,加入“others”(其他)行列。 市场份额前五的品牌均为中国本土厂商,依次是:OPPO/一加(17.1%)、荣耀(16.7%)、华为(16.6%)、vivo(16.1%)、小米(15.0%)。 唱衰苹果的市场调研机构不止一家,最知名的Canalys在4月26日同样发布一份报告,在2024年Q1季度,苹果在头部手机厂商中跌幅最大,以1000万台的出货量排名第五,同比下降25%。 来源:网络 苹果公司在5月3日凌晨发布2024财年第二季度财报(截至2024年3月),具象化暴露出目前iPhone业务下滑的事实。 据财报显示,本季度苹果公司实现营收908亿美元,同比下滑4.3%。最核心的iPhone业务收入460亿美元,同比下滑10.5%;iPhone出货均价为917美元左右,同比下滑1.3%。 用一句话来总结如今的苹果iPhone业务,就是卖的少了、也卖的便宜了。 除了iPhone之外,连续18个月未更新的iPad家族,业务收入56亿美元,同比下滑16.7%,低于市场一致预期(59.1亿美元)。 在2023年,iPad业务就已经展现出颓势,全年卖出899.5万台iPad,同比下降10%,是所有平板品牌中下跌最大的一个。 苹果硬件业务下滑非常严重,除了Mac业务同比增长3.9%之外,iPhone、iPad、可穿戴等其他硬件业务均出现不同程度的下滑。 不再先进的iPhone 曾经的iPhone被誉为手机界的“性能天花板”,每一代A系列SoC都是一整年讨论的热点,安卓阵营集体追赶的目标。 自从苹果开始对iPhone进行分级,iPhone就彻底失去了“性能先进”的概念。 从iPhone14系列开始,普通版本只使用上一代SoC,Pro系列才使用最先进的A系列SoC。这一举措虽然帮助iPhone业务提高了毛利、增加了产品分级的购买意向,但消费者的口碑无疑是崩塌了。 《华尔街日报》就曾专门报道过,iPhone在大中华地区的“失宠”:“中国的一些消费者,不再将苹果的旗舰产品视为技术最先进的产品”、“华为在相机、电池续航、电话信号等方面,有优于苹果的表现”。 的确,在过去一年,华为Mate60系列和Pura70系列带来的超聚光伸缩摄像头、北斗卫星通信、玄武构架、昆仑玻璃等硬核技术,已经把智能手机内卷程度拉高好几个档次。 还在使用60hz屏幕的iPhone,直接和“落伍”挂钩。 除了硬件配置之外,AI在智能手机领域也是无法避开的“必选项”。 从去年的华为Mate60系列首次“登机”盘古大模型以来,各大手机品牌玩家不约而同押宝AI,或内置AI大模型、或搭载AI语音助手。 和苹果对抗多年的三星,直接将AI视为超越苹果的关键底牌。 三星Galaxy S24系列 高通总裁兼CEO克里斯蒂亚诺·阿蒙(Cristiano Amon)在接受媒体采访时表示,2024年将成为全球AI手机元年,生成式AI正在“非常快”的进入手机。 Canalys预计,到2024年,智能手机出货量中的5%将是AI手机,到2027年,这一比例将上升至45%。 在“AI=先进”这个全网公认的定论影响下,中国手机厂商从未缺席过AI的浪潮。 除了华为盘古大模型之外,目前,小米手机宣布搭载全球首套AI大模型计算摄影架构Xiaomi AISP;“蓝绿大厂”vivo和OPPO,推出了蓝心大模型和安第斯大模型,直接接入自研系统OriginOS 4.0和ColorOS 14;荣耀推出AI全场景操作系统MagicOS 8.0和魔法大模型。 不得不说,虽然手机端侧AI大模型对于普通人来说,使用感并不强。但AI最大的用途,是制造销售噱头,增加商品卖点,促使消费者更换手机。 毕竟在最近几年里,不论是iOS阵营还是安卓阵营,都集体陷入了瓶颈期,各大品牌除了日常升级SoC、摄影头、屏幕等硬件之外,再无令人眼睛一亮的颠覆性创新。 创新力匮乏意味着同质化严重,手机功能沉冗且大同小异,用户的平均换机周期已超过31个月。整个手机市场的出货量,达到了十年以来的最差水平。 而上一次智能手机的“换机热”,还要追溯到5G时代的来临。 这也是AI存在的最大意义:刺激用户消费。 落后AI的苹果还有两个底牌 在手机端侧AI大模型火热一年后,苹果才醒悟过来,主动放弃造车项目,专注于AI领域,频频在市场放出自己AI进程。 从2023年开始,苹果连续收购了30多家AI初创公司,是科技巨头中收购数量最多的一位。 知名苹果爆料专家郭明錤此前报道,预估苹果2024年将花费47.5亿美元购买超过2万台服务器,以支持其AI技术发展,这一资本开支远远超过2023年的6.2亿美元。 花钱砸人、花钱砸设备,可见苹果公司对于取得AI领先地位的决心之大。 不过对比微软、英伟达、谷歌、Meta这些AI头部玩家来说,苹果无疑就像个刚刚学习走路的婴儿。甚至在AI领域,苹果可能还不如三星。 利用AI来提高苹果所有硬件设备的出货量,对库克所说是长远计划,也是必选项。库克多次在公开场合表示:“不管iPhone、iPad、Mac,还是Vision Pro,我们都希望将AI引入其中。” 苹果CEO库克 但是长期计划对于眼下的苹果困境并无帮助,想要提高iPhone业务的整体出货量,还是得着手眼下。 还好苹果还有两个杀手锏,就是即将到来的618和9月新品发布会。 从2022年开始,618电商大促就成了苹果全年最低价的折扣日,在各大电商平台的手机销量榜单上,iPhone系列都能占据前三甲。 打折促销在任何时候都是提高出货量的最优解方案,相信在今年618之后,苹果iPhone的出货量会有极大的提高。 第二个杀手锏,就是每年9月份左右,新iPhone的发布会。 即将到来的iPhone16系列噱头十足,据说可能会搭载谷歌Gemini大模型和OpenAI ChatGPT。 如果消息属实,那么iPhone16系列将会是近些年最具卖点的苹果产品。
曝小米14系列4月销量飙升 环比增长约30% 远超13系列
小米数字系列旗舰手机凭借卓越性能和创新设计,已在高端市场占据一席之地。5月8日,CNMO注意到,有数码博主透露,小米14系列的销售表现强劲,不仅4月份的销量环比增长约30%,而且与小米13系列相比,销量更是上涨了约40%,这一成绩甚至超越了小米13系列在去年618大促期间的销量。 据该博主之前的爆料,小米14系列的激活量已接近500万台。自去年10月31日上市以来,小米14系列在短短的时间内就取得了骄人的销售成绩,截至11月10日,总销量已经达到了144.74万台。雷军此前曾表示,他相信小米14系列的销售会超过小米13系列,但没想到会超出这么多。 此外,小米集团计划在本月23日公布其第一季度的财务业绩。根据中金公司的研究报告,小米一季度的智能手机出货量增长势头强劲,但由于元器件价格的上涨,毛利率可能会出现环比下降的情况。根据Canalys的数据,小米在全球智能手机市场的出货量同比增长了33%,达到了4070万台,市场份额也提升了3个百分点,达到了14%,位居全球第三。 瑞银也预计,小米在第一季度的智能手机出货量将同比增长31%,达到3990万部,产品均价与去年同期持平,但毛利率可能会环比下降1.9个百分点,但同比增长3.3个百分点。同时,瑞银还预计小米的IoT及家居生活消费业务收入将同比增长21%,超过200亿元人民币,毛利率将同比增长3.3个百分点至19%,环比也上升5.1个百分点。
vivo X100 Ultra手机前摄搭载JN1传感器,4K60帧拍摄、自动对焦
IT之家 5 月 8 日消息,vivo 产品经理韩伯啸在微博上透露,vivo X100 Ultra 自拍也是“顶级”,行业旗舰用来做后置长焦和广角的,vivo 用来做前置,还带自动对焦。上一次 X 系列前置“登顶”已经是八年前的事情了。 在与评论区的互动中,他表明 vivo X100 Ultra 手机前摄将采用 JN1 传感器(感光面积 1/2.76 英寸,五千万像素),并称这款传感器“效果好,尺寸合适,算法成熟”。 他还提到,此前的 3200 万像素传感器经过像素四合一之后只有 800 万像素,再按视频比例裁切以后达不到 4K 分辨率,靠插值才能做 4K。而 JN1 有五千万像素,可实现真 4K60 前置。 他还表示目前 vivo 的前置“登顶”任务交给 S 系列(IT之家备注:2021 年发布的 vivo S12 Pro 前摄传感器为三星 JNV,与 JN1 尺寸相同,均为 1/2.76 英寸),由于定位不同,X100 Ultra 只能竭尽所能给好的。 vivo 影像新蓝图暨 X 系列新品发布会将于 5 月 13 日举行,vivo X100 Ultra 预计搭载高通骁龙 8 Gen 3 处理器,影像是这款新机一大亮点。该机搭载 2 亿像素蔡司 APO 超级长焦,号称为“1/1.4 英寸行业最大底长焦”,拥有 f / 2.67 光圈,物理焦距 22.48mm,高像素模式可以输出 12888 x 16320 分辨率。此外,该机还有 50MP LYT-900 主摄加持。
特斯拉自动驾驶宣传涉嫌欺诈?消息称美国检方展开调查
IT之家 5 月 8 日消息,据路透社报道,三位知情人士透露,美国检方正在调查特斯拉公司是否存在通过误导投资者和消费者其电动汽车自动驾驶功能来实施证券欺诈和电信欺诈行为。 图源 Pexels 据IT之家了解,特斯拉的 Autopilot 和 FSD 系统虽然能辅助驾驶员转向、刹车和变换车道,但并非完全自动驾驶。尽管特斯拉警告司机要时刻准备接管驾驶,但美国司法部正在审查特斯拉和首席执行官埃隆・马斯克 (Elon Musk) 此前的一些言论,这些言论暗示特斯拉的汽车可以实现自动驾驶。 美国监管机构也一直在对数百起启用 Autopilot 的特斯拉汽车发生的事故,包括致命事故,展开独立调查,并促使特斯拉进行了大规模召回。 消息人士称,调查人员正在探索特斯拉是否通过误导消费者其驾驶辅助系统功能从而实施电信欺诈(一种涉及州际通讯欺骗的犯罪行为)。其中两位消息人士还表示,检方也在审查特斯拉是否存在通过欺骗投资者实施证券欺诈的行为。 另据一位消息人士透露,美国证券交易委员会 (SEC) 也在调查特斯拉向投资者陈述的驾驶辅助系统功能。 特斯拉去年 10 月披露,司法部曾要求其提供有关 Autopilot 和 FSD 的信息。 这项调查本身并不代表特斯拉一定存在过错,可能的结果包括刑事指控、民事制裁或不采取任何行动。消息人士之一称,检察官离决定如何处理此案还有很长一段路要走,部分原因是他们正在筛选特斯拉响应传票提供的海量文件。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。