注册 登录
EN
中文
APP下载
logo
icon
数字孪生
icon
大数据获客
icon
人工智能
分类目录
行业分类:
IT/通信
金融财经
市场/营销
交通/物流
节能环保
休闲旅游
农林渔牧
日化用品
数码家电
房产/建材
企业/管理
家具/家居
医疗/保健
新零售
机械/工业
餐饮/食品
其它行业
头条分类:
行业前景
行业动态
行业资讯
行业活动
反盗版宣传要谨慎:研究称恐吓性信息反而会助长男性盗版行为
IT之家 2 月 23 日消息,根据英国朴茨茅斯大学最新研究,针对数字盗版行为的恐吓性信息,对男性可能适得其反,反而会使其盗版行为增加 18%。该研究调查了 962 名成年人,对比了他们在接触不同反盗版信息后,观看盗版电视和电影的意向变化。 图源 Pexels 研究人员分析了三种真实的反盗版案例:英国犯罪预防组织 Crimestoppers 的案例,强调了盗版行为可能导致电脑中病毒,身份、金钱和数据被窃取等风险;法国政府的“三次警告”制度,即在侵权者网络访问被终止之前,会发出两次书面警告;以及“从正规网站获取正版内容”的教育性案例,强调了盗版对经济和创作人员的负面影响,并引导消费者使用合法平台。 研究发现,恐吓性信息能使女性的盗版意向降低 50% 以上,但对男性的影响却相反,反而使其盗版行为增加。教育性信息则对男女两性均没有明显影响。 研究负责人凯特・惠特曼(Kate Whitman)博士解释道:“这项研究表明,反盗版信息可能会无意中助长盗版行为,这是一种被称为心理抵触的现象。从进化心理学角度来看,男性对自由受到威胁的反应更加强烈,因此他们可能会做出相反的举动。” 此外IT之家注意到,研究还发现,对盗版行为持最支持态度的人,其盗版意向变化也最明显 —— 恐吓性信息会进一步增加他们的盗版行为。 该研究已发表在《商业伦理学杂志》上。
小米vivo布局“远程PC”,为了弥补AI硬件端侧算力短板?
小米开年首场旗舰发布会已经结束,小米平板也迎来新成员——小米平板6S Pro 。此次新平板加入了远程控制PC功能。卢伟冰在发布会上宣称,这款平板做到了「办公能力大拓展」。 (图源:小米官网) 无独有偶,此前数码博主@i冰宇宙也在微博对vivo X Fold 3系列进行了曝光,它允许用户远程控制苹果Mac电脑,可以在折叠屏上查看电脑屏幕内容和使用软键盘。 (图源:微博@i冰宇宙) 简单来说,小米平板和vivo折叠屏的远程控制功能,本质上像是在用「云电脑」,也就是我们常说的「串流」,但区别在于,它是直接将你的PC端或Mac上的画面传到你的平板或手机上,而不是连接到远端服务器。 通过网络与电脑无缝连接,它可以利用电脑执行一些对性能要求较高的任务,比如远程编程和视频渲染,只要网络延迟足够低,它能让用户感觉就像是直接在使用电脑一样。 (图源:小米官网) 这也从侧面反映出说明,为了更贴合我们的实际使用需求,不管是平板,还是折叠屏,它们的研发不仅仅要在硬件上下功夫,软件上的创新也同样重要。 前有小米平板支持PC端互联互通,后有vivo折叠屏支持远程扩展Mac,大屏设备开始向着更高的生产力和便捷性迈进,并且开始强调在多设备协同工作环境中的无缝连接和互操作性。难道,大屏设备「串联」PC要成为生产力工具的新玩法? 远程PC:新瓶装旧酒还是旧瓶装新酒? 有朋友可能注意到了,这和向日葵或ToDesk一样,都是用于远程控制PC设备。那么,小米和vivo的方案与这些远程桌面软件有什么不同呢? (图源:ToDesk官网) 其实它们的工作原理并没有本质上的差别,都是基于客户端——服务器模型。用户通过网络远程连接电脑,操作结果通过屏幕共享反馈。 然而,它们之间的根本区别在于,厂商推出的远程PC功能是直接集成在系统上的,这意味着用户无需下载和安装任何第三方软件即可享受到远程控制服务。 (图源:向日葵官网) 系统级的远程桌面方案能够更加充分地利用操作系统本身的资源和功能,从而为用户带来更加流畅和高效的远程操作体验。最关键的是,这项服务通常是免费提供的,用户无需为此支付额外费用。 但是目前不管是软件层面还是系统集成的远程控制,都面临着许多问题需要克服。 首先,要想远程控制和无线副屏运作流畅,关键在于解决延迟问题。这需要通过网络优化、本地预处理工作和数据传输路径的优化,来加速信息传递和减少等待时间。 (图源:小米官网) 其次,面对众多不同的设备和操作系统,确保软件在各种环境下都能顺畅运行,是另一个挑战。它得按照一套通用的规则,选用那些可以横跨各种平台的工具,并且还得针对那些人们常用的设备和系统做些特别调整和优化。 远程PC能否重构生产力工具秩序? 说了那么多它对于生产力的提升,具体表现在哪方面呢? 随着办公环境的不断演进和移动技术的飞速发展,平板电脑和智能手机在满足日常办公,和生产力需求方面的作用越来越重要。 尽管如此,但由于移动设备与传统PC在操作系统架构、用户界面设计以及处理能力上的本质区别,这使得一些高性能需求的任务在移动设备上难以得到高效执行。特别是对于那些需要复杂数据处理、专业软件支持的工作场景,如大型图形设计、视频编辑、高级编程环境等,移动设备的算力与PC相比存在明显短板。 (图源:小米官网) 此外,尽管近年来移动端处理器的性能有了显著提升,但与专为复杂任务设计的PC级处理器相比,仍有一定的差距。这种性能上的差异,始终限制着移动设备在某些高端办公场景中的应用。 因此,远程控制PC技术成为了一种补充移动设备短板的有效方法。 通过远程控制,用户可以直接在平板或手机上操作PC,实现对PC端软件的完全访问和使用,包括那些对算力要求较高的应用程序。尤其在远程工作、灵活办公成为新常态的今天,远程PC技术为移动设备带来的生产力提升尤为重要。 (图源:ToDesk官网) 还有,自折叠屏手机问世以来,市场对其持有一定的怀疑态度,主要因为它除了屏幕尺寸更大外,似乎没有其他突出优势。同时,这一大屏优势并未被厂商充分发挥,软件的适配进程未能跟上。 然而,vivo此次的创新方向,确实能够进一步提升折叠屏的实用性和生产力。 AI硬件爆发,PC填补移动端算力短板 2024被誉为AI元年,无论是智能手机还是电脑制造商,都在将资源集中投入到AI领域中,以满足日益增长的AI计算需求。 魅族和OPPO在前段时间都宣布了全面拥抱AI,各大手机厂商从去年就开始陆续布局AI与软件生态的结合。毋庸置疑,移动端仍然是AI的最佳载体,因为它具有其他智能设备所没有的便携性,且已经成为我们日常生活中离不开的设备之一。 (图源:OPPO) 但话又说回来,现如今的生成式AI,对计算能力有着极高的要求。这些任务通常都需要大量的数据处理和复杂的模型训练,而移动设备处理器的算力往往难以满足这些高性能需求。 与之对比,配备了高性能AI芯片的PC和服务器就能够提供足够的算力支持。但其便携性相比于移动端的设备来说,又有不足。在移动端算力不足的这个背景下,远程PC技术就是目前最佳的解决方案。 以英特尔为例,其推出的Nervana™ 神经网络AI芯片,专为AI和深度学习任务设计,它能提供了远超移动设备的计算能力。 (图源:Intel官网) 利用远程PC技术,用户可以在平板电脑或智能手机上发起对PC的远程控制请求,借助远端PC的计算资源来执行AI相关的高性能计算任务。 这种模式的优势在于,它为用户提供了强大而灵活的计算资源,用户不必直接在本地设备上承担高昂的计算负担,而是通过远程PC来访问所需的AI算力,从而在AI模型开发、数据处理和创新实验等方面实现更快速的迭代和探索。 此外,随着5G网络的普及和云计算技术的发展,远程PC技术变得更加高效和实用。用户可以通过更高速的网络远程连接到本地的高性能PC,实时访问和处理大量数据,执行AI相关任务。 (图源:高通官网) 总之,随着AI技术的不断进步和应用扩展,远程PC技术成为连接高性能计算资源和移动终端的重要桥梁。
生产力工具革命爆发前夜,个人如何拥抱AI?
大模型这把火,已经烧到了个人终端,尤其是与我们生活、工作相关的个人电脑。 进入2024年,大模型产业的竞争焦点已经从卷参数、卷性能延伸到商业落地,各类AI应用、工具迸发,让用户对于大模型的感知更强。 大模型产业中,对各类终端设备交互范式产生的颠覆性影响正在扩大,一方面,有企业继续在提高通用大模型能力之路上极速狂奔,另一方面,有企业开始探索大模型在终端设备上部署的可能性。各路手机玩家布局大模型技术,智能助手体验被颠覆;车圈自研大模型批量上车,重新定义智能座舱体验;还有智能家居、机器人、芯片等赛道的厂商也正加速进场…… 而PC作为医疗、教育、制造等各行各业的超强生产力工具,插上大模型翅膀后,很可能将掀起一场生产力工具革命。 就在昨天,PC行业的领导者——联想集团发布了2023/24财年第三季度财报。财报显示,联想集团第三财季营收1136亿人民币,同比增长3%,净利润近26亿人民币,盈利能力连续两个季度环比提升。随之该公司同期发布了一支硬核科普视频,揭秘了联想AI PC的独创性。 07:00 视频通过炫酷的手法,对AI PC进行了环环相扣的讲解,以三维动画、立体感分镜、平面分镜等手法,对联想自研的AI OS生态和AI芯片TAC进行了真实呈现,并清晰地科普了大模型压缩、知识蒸馏、向量化等前沿技术。 2024年,生产力工具革命浪潮来袭,迎来AI for YOU的时代,联想集团正在为AI PC产业探索一种全新的可能。 01. 大模型走向终端 AI PC天然适配 从最初以聊天机器人的形态出现,到现在基于大模型能力打造的产品和工具已经逐渐向更实用的生产力工具转型。 个人用户将这些产品融入自己日常生活、工作的同时,其需求也更加深入且细分,需要更符合自己使用习惯的个人大模型。 这些需求端的诸多变化趋势正在倒推大模型产业变革。大模型不再唯超大规模参数论,通过压缩技术让大模型保持性能稳定的同时,减小模型的大小和计算复杂度,使其更易部署。 当大模型能够部署到端侧设备后,有一个疑问浮出水面,如何让大模型的能力与用户的个性化需求更加契合。 PC设备脱颖而出,在交互方式、终端算力、本地存储能力方面的优势,使得这一终端设备成为AI技术惠及每一个人的重要途径。 首先,大模型驱动人机交互方式变革,可以对语音、文字、图像、视频实现高质量的识别和理解,从而使得人机交互的方式更加自然、智能且高效。与此同时,PC可连接更多外接终端,是多种交互方式的核心,未来体验会更加丰富。 其次,PC更适合大模型相应创作能力的呈现,从最初的大语言模型到多模态大模型,其生成的内容已经从单纯的文字向图片、视频、音频甚至于3D动画延伸。 最后就是算力与数据。PC是个人终端设备中最强的算力产品,也更适合用户存储个人数据、文件,因此其可以支持大模型计算、保护用户数据安全。 综上可以看出,PC与大模型的特征有着天然适配性。 02. 生产力工具革命 AI PC五大核心特征 AI PC的出现,正在进一步放大PC的生产力工具属性。 首先要回答一个最本质的问题:AI PC是什么?联想集团董事长兼CEO杨元庆给出了AI PC的五大特征,相比于传统PC,AI PC拥有更强的运算能力、更大的存储空间、压缩了体积但不减性能的大模型、完整的AI应用生态、安全和隐私保护。 前三者关乎基础软硬件设施,也就是PC上能够运行经过压缩和性能优化的个人大模型,包括CPU、GPU、NPU在内的异构计算,以及容纳用户个人数据并形成的本地知识库。 后两者则更考验PC厂商的生态建设能力,让AI PC能够拥有更加丰富的自然语言交互形式,不止于文字、语音、手势交互。最后就是让AI PC更可靠,让用户的数据更安全。 基于此,未来PC既能承载通用大模型的能力,还可以独立运行专属于用户的个人大模型,成为更实用的工具。而这背后,其实面临着诸多挑战。 AI PC既要实现对超大规模参数模型压缩,还要保证PC可用、维持性能稳定。 在压缩后的大模型之上,AI PC要为用户打造自己的个人大模型,保持对用户使用习惯、数据等内容的持续学习与训练,还要有强大的算力以及存储空间去支持这些数据的训练与存储。 更为关键的是个人数据隐私和安全问题,PC与用户日常生活、工作连接十分紧密,因此对于用户数据安全保护的要求也将实现跨越式提升。 而现在,随着这些技术难点被攻克,AI PC将为生产力工具带来革命性的改变。 03. 深度解析联想AI PC独创性背后的黑科技 联想集团展示的这台厚度仅有不到2cm的AI PC里,到底藏着多少黑科技? 视频使用三维动画,以建模特效还原了AI PC独创性背后的技术点,这台AI PC被立体化地拆解,我们可以看到,AI PC的根基就是强大的异构计算能力,高性能CPU、GPU、NPU形成了运转大模型的初步硬件架构。 在硬件架构之上,如何实现PC可驾驭的大模型?其实,超大参数规模的模型装进PC很难,当用一组数字去量化时,我们发现,OpenAI此前发布的大模型GPT-3.5参数规模为1750亿,预计占用内存超过330GB。 解决这一难题的答案是知识蒸馏,视频中通过平面分镜的手法,以拓扑图的形式对知识蒸馏的模型技术进行了可视化科普。 可以看到,知识蒸馏就是用大模型的监督信息,来训练轻量化小模型,从而让模型在参数规模较小的情况下获得更好的性能和精度。这之中,成熟的大模型就是“教师”,PC中部署的本地大模型就是“学生”。 这样一来,大模型的参数规模能从1750亿压缩到70亿,个人大模型装在硬盘中只需要占用4到5GB的空间。 PC中的大模型已经就绪,下一步就是如何让其更好地为用户所用,为每个人量身定制超强性能的生产力工具。 视频中运用立体感分镜庞大词云演示了如何通过向量化技术打造本地知识库,当用户授权置入后,个人的文档、PPT、PDF、日程表等涉及个人习惯的信息就会被存储到本地知识库中。 这些知识通过向量化被转变为可以被AI计算的形态,然后进行存储。当用户提出需求后,个人大模型也会将相应需求进行向量化,并在本地知识库中查询、匹配相似度最高的片段。个人大模型提取出相关文本块后,会根据用户的提示词,再结合大模型的生成、理解能力输出答案。 除了部署智能算力、个人大模型本地知识库这两个软硬件支撑外,联想集团自主研发的AI OS,是整台电脑的生态入口,能调用本地文档,调控数百个隐藏的系统、硬件设置等完成用户更个性化的需求。 联想集团打破了AI领域知识仅由模型主宰的格局,让AI在PC领域从“通用”回归“个人”,真正实现“千人千面”。 当用户与AI OS交互对话时,比如:“感觉电脑打游戏觉得不够流畅不够快,怎么办?”,AI OS会识别这一需求中涉及的关键词,然后理解用户想要适配游戏场景的相关设置,弹出“开启野兽模式”的设置选项。 随着用户在PC上触发交互的次数不断增多,AI OS对于个人的理解更加深入,能针对性解决用户日常生活、工作中诸多痛点,如生成会议纪要、调取过往PPT等,使其为个人服务,把定制化的高效体验带到用户身边。 值得注意的是,大模型的每一次响应需求、每一次学习都会占据大量系统功率,这就需要AI PC智能化调度、分配系统功率让用户的使用体验更好。 对于这些难题,联想集团的自研AI芯片TAC(Trusted AI Controller)就是关键,视频中通过绚丽流畅的三维动画,展现了TAC辅助调度算力分配并释放高性能的实力。 TAC与PC上的所有硬件相连接,并将这些硬件的状态传输给AI OS。正如视频所展示的,这些状态经过AI OS的理解,就会对应识别到具体是会议、游戏、学习等某一种使用场景。 基于不同的场景和任务识别调配多种模型,在这之中,TAC会将能耗压力精准分流,让CPU、GPU、NPU等算力芯片实现合理运行,保证AI PC的可持续性高效运转。 这块芯片不仅是支撑效率、功耗性能发挥到最大化的基础,还会成为用户个人数据保护的强大守卫。 TAC会将用户个人文件中用户的文件、使用习惯等信息通过密钥加密,并将密钥封存在芯片的ROM中独立供电,有效防止数据的外泄及被恶意攻击。 最后,联想AI PC独创性地将软件、硬件和生态相结合,提供的落地方案使其首次在个人终端上实现,层层黑科技使得我们看到个人人工智能双胞胎(Personal AI Twin)即将成为现实。 04. 结语:AI PC颠覆个人智能终端 AI PC正在蓬勃生长,即将迎来落地的时刻。AI对用户而言,将不再只是津津乐道的话题,而是切实可用的工具。 正如联想集团科普视频中提到的,39年前PC走上历史舞台后,承载了几乎每一次数字世界的技术变革,39年后的今天,AI PC也可能即将成为人类与数字世界交互的最佳方案之一。 这一次的AI PC,既是突破,也是回归。面临生产力工具重大变革的时刻,联想集团作为PC行业的领航者,将人工智能的颠覆性力量带到了每个用户的终端,以AI PC,让每个人实现AI普惠。
字节跳动发布文生图开放模型SDXL-Lightning,生成速度提升十倍
IT之家 2 月 23 日消息,据界面新闻报道,从知情人士处获悉,字节跳动发布了文生图开放模型 SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。 文生图是一种利用人工智能技术,根据文本描述生成图像的技术。目前,文生图领域的主流模型都采用了扩散过程的生成技术,即通过多次迭代,将噪声逐渐转化为图像。这种技术虽然能够生成逼真的图像,但是也存在着计算资源消耗大、生成速度慢的缺点。生成一张高质量图像,大约需要 5 秒。 字节跳动的 SDXL-Lightning 模型则采用了一种渐进式对抗蒸馏的技术,实现前所未有的生成速度,该模型能够在 2 步或 4 步内生成极高质量和分辨率的图像,将生成速度加快十倍,是 1024 分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 字节跳动智能创作团队称,该模型是基于字节跳动之前开源的文生图模型 SDXL 的改进版本,与开放模型社区的其他工具和插件兼容,SDXL-Lightning 可以作为增速插件无缝整合到卡通、动漫等多样风格的 SDXL 模型中,并支持当前流行的控制插件 ControlNet、生成软件 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。 IT之家注意到,该模型已经在 AI 开源社区 Hugging Face 上公开,跻身模型趋势榜,同时也成为 Hugging Face Spaces 上的热门模型。
OpenAI密谋推出TikTok竞品?专家猜测:这是计划的一部分
【新智元导读】为何OpenAI只在TikTok上发布Sora新视频?AI专家猜测这是计划的一部分:创建病毒式视频、加水印、收集数据、添加RLHF、推出TikTok竞品……整套流程一气呵成。 OpenAI,到底想用TikTok做什么? 最近,大家都被TikTok上这堆Sora的视频闪到了。 AI视频,已经天衣无缝地混入了人类世界。 如果不特意说明,很难拿看出AI视频和真实视频的区别! 才入驻TikTok几天,OpenAI的账号就已经涨粉13万。 网友惊呼:创意行业中的每个人都被煮了! 开始,OpenAI放出的视频,还是静音的。 这段希腊海边的建筑,简直浑然天成,肉眼难以分辨是否是自然界的场景。 看这栩栩如生的海底世界的珊瑚、鱼、海龟、海马……虽然还带着一股粗糙的折纸风,但已经自成一个体系了。 所以,以后做视频还有人类什么事儿? 在留言区里,有读者表示激烈反对:你这是在扼杀艺术。 不过也有OpenAI的坚决捍卫者冲上来反驳说:不,AI就是艺术。 人类已经彻底进入黑镜时代了。 OpenAI,要做自己的「TikTok」? 所以,OpenAI只在TikTok上发Sora视频,究竟是在下的什么棋? 今天,JVDB Studios的CEO兼创始人就在X上发出了自己的专业分析。 Kwebbelkop猜测,OpenAI之所以在TikTok上试水,是为了达到这样的目的——让每个人制作TikTok视频时,都选择用Sora制作。 那时,所有视频都会被加上Sora特有的水印。 用户发布这些带水印的视频后,OpenAI就会收集这些带水印的视频,然后利用水印匹配,利用它们的观看次数,来增强人类反馈强化学习的算法。 之后,Sora v2将会是基于SORA v1的升级版,而且加入了RLHF技术。 这些通过算法炮制出来的视频,将大大增加成为热门视频的可能性! 甚至,OpenAI很可能会推出一个全新的、100%由AI生成内容的TikTok竞争平台。 TikTok的成功,已经证明了短视频形式在全世界的潜力。 凭借Sora如此强大的性能,OpenAI如果真的有意来分一杯羹,恐怕真能搅动海外短视频的格局。 国内这边,最近短视频平台和视频剪辑领域也是大动作频频。 拼刺刀的时刻,已经来了。
斯坦福机器人进化:从演示中转移技能,400美元解训练数据悖论
斯坦福最新“技能转移”大法,让人类沦为给机器人提供训练数据的工具人。 小哥拿上机械手做示范,机器人就能从收集到的数据中学会刷碗,并且能随机应变。 打开水龙头、抓取盘子、用百洁布清洗一气呵成,外界干扰使坏也不怕。 整套系统从硬件到代码完全开源,成本只需400美元,就可以在没有机器人的情况下收集训练机器人所需数据。 更详细的3D打印、组装教程视频也即将发布。 要知道,在这项工作之前要想大规模训练机器人be like: 对此,李飞飞团队具身智能成果VoxPoser一作黄文龙表示:惊人的工作,破解了机器人数据收集中的先有鸡先有蛋难题。 有网友觉得,这项工作和之前爆火的斯坦福家务机器人ALOHA等工作同样令人印象深刻。 实际上,都是来自斯坦福大学的两个团队,已经在实验室里带着各自的机器人对练碰拳、握手了。 破解数据的先有鸡先有蛋难题 新方法收集数据的秘密,就藏在这对手持夹持器里。 左右手各一个300美元的Go Pro摄像头,搭配一面镜子就能得到隐式立体信息,大大节省成本和重量。 再加上内置的惯性传感器,联合优化视觉跟踪和惯性姿态。 录好的第一视角演示影像就像这样: 机器人学会之后,即使照明环境发生剧烈变化也丝毫不受影响。 再叠加上人为干扰,机器人最后也不忘把水龙头关好。 除刷碗之外,还展示了叠衣服、摆放餐具和抛物投篮,都是学习了人类演示后,机器人全自主行动无遥控,1倍速播放。 通用操作接口 斯坦福的这项研究名为通用操作接口(UMI),是一种数据收集和策略学习框架,允许将技能从人类演示直接转移到可部署的机器人策略。 其中硬件,设计了一个手持夹持器,长这样婶儿: 上面搭载的GoPro运动相机,是唯一的传感器和记录设备,这种设计可以最小化人机观测空间上的差异,保证策略部署时的鲁棒性,同时也简化了硬件搭建。 相机配有155°宽视角鱼眼镜头,可以收集足够的视觉上下文和关键深度信息。相机的两边还配有两块物理侧镜,用于提供隐式的立体视角,辅助深度估计。 下图中绿色框圈出的部分就是侧镜在相机镜头上的显示: 结合内置的IMU传感器,UMI能够在快速运动下稳健跟踪,即使在运动模糊或视觉特征缺失时也能在短时间内保持跟踪。 并且,可以通过视觉标记实时检测夹持器张开宽度,进行精细和连续的抓取控制,同时可隐式检测抓取力度。 总的来说,UMI夹持器的重量为780克,其中3D打印的夹持器材料成本为73美元,GoPro相机及配件的总成本为298美元。 可谓集便携、低成本、信息丰富的数据收集于一身,在任何家庭或餐厅,2分钟内就可以开始进行数据收集。 再来看策略接口设计。 UMI在观测和推理时间上可能会有延迟,为此研究人员进行了延迟匹配。 具体来说,测量不同数据流的延迟将其对齐到最大延迟,通过图像时间戳进行线性插值,获得同步观测序列;测量机械臂和手持夹持器延迟,提前对应时间发送控制指令。 此外,作为策略输入的端效器(机械臂)位姿状态采用的是相对位姿序列的表示方法,所以与机器人基座的位置无关,可跨多个机器人平台部署,不需要重新训练或校准。 凭借多样化操作数据集,UMI能训练出一个扩散策略(Diffusion Policy),实现零样本泛化到新环境和对象,使得机器人在新环境下执行任务,也能展示出高度的适应性和灵活性。 扩散策略基于团队之前的研究成果,把扩散模型用于机器人视觉运动策略学习,可优雅地处理多模态动作分布、适用于高维动作空间以及表现出令人印象深刻的训练稳定性。 做到即使是水上作业也游刃有余: 斯隆奖得主领衔 UMI来自斯坦福大学 、哥伦比亚大学 、丰田研究院联合团队。 通讯作者为斯隆奖得主、斯坦福助理教授、哥伦比亚大学兼职副教授宋舒然,两位共同一作都是宋舒然的博士生。 论文公布后,她还补充总结了在这个项目中学到的三件事: 通过正确的硬件设计,腕戴式相机足以应对具有挑战性的操作任务。通过合适的策略接口,可以实现跨实体(cross-embodiment)的策略。如果数据合适,行为克隆(BC)可以实现泛化。 共同一作Cheng Chi(迟宬),哥伦比亚大学博士生及斯坦福Student of New Faculty。 共同一作上交大校友Zhenjia Xu,哥伦比亚大学博士生及斯坦福大学机器人与具身智能实验室 (REAL)成员。 Cheng Chi认为,新方法在大多数任务上实现了70-90%的成功率,但仍然没有达到商业部署的标准。
小米平板6S Pro体验:不会娱乐的平板不是好生产力工具?
根据小雷的不客观调查,在想买平板的读者里头,应该至少有60%的人,只是为了晚上躺在床上时,可以有个大屏幕抱着看看片,或是摆在电脑旁边追直播用的。 (图源:雷科技) 在剩下的40%的人里头,起码还有一半是想给自家孩子买台教辅设备,拿来上上网课看看教辅材料的。 至于正儿八经的生产力... (图源:雷科技) 就市面上这些平板的办公体验,我想正经出差办公的人,估计也没有多少人会选择不带笔记本电脑的吧——只需要审批公文不需要处理文档表格的管理型人才除外。 不过呢,从整个行业来看,无论是iPad还是安卓平板,想要在更高的价位段扎根,那就必须得讲好大平板的生产力故事,把平板电脑朝着生产力工具,甚至是车上娱乐设备的方向去扩展。 华为是这么想的,小米也是这么想的。 如果你也是这么想的,那么小米在近日发布会上公布的这款小米平板6S Pro 12.4,可能就是一款为你量身定制的产品了。 (图源:小米) 这款机子,我最近也是用了一段时间,那么今天来聊一聊它的体验。 传统艺能,先过一下外观。 既然被命名为小米平板6S Pro 12.4,而非小米平板7 Pro,那这款产品自然整体延续了之前小米平板6系列的设计。 Unibody全金属一体化外观,隐藏式天线设计,有原野绿、云峰蓝、黑色三种配色可选。 (图源:雷科技) 说实在的,外观并不惊艳,但是至少还够扎实。 为了保证手感,小米还在边框和屏幕/后盖过渡的地方进行了CNC切边过渡处理,只要加上一点简单的弧度,就能避免直角边框带来的割手感,让屏幕到边框的手感更加自然。 哦,对了,还有一件事情。 在小米平板6系列上饱受诟病的屏幕支架,终于是在小米平板6S Pro 12.4上被去除了! Remove Plastic! (图源:雷科技) 正面是一块12.4英寸(3048*2032)IPS屏幕。 144Hz高刷,900nit全屏亮度,甚至乎每一块屏幕在出厂前都进行了色彩校准。 按照官方说法,能够做到让小米笔记本电脑、手机和平板的跨设备联通时,也能实现一致的色彩显示,无论是什么材质的屏幕,什么系统,都能看到完全一样且准确的颜色。 就是我手上的小米13和小米13 Pro还不支持这个多屏同色功能,多少有点尴尬。 (图源:雷科技) 和以往的小米平板不同,这次小米平板6S Pro 12.4突破性地采用了一个全新的比例——3:2。 怎么说呢,在这个比例下,平板电脑的纵向空间确实可以显示更多内容,方便文档阅读编辑、消息回复等轻办公场景使用。 (图源:雷科技) 举个简单的例子,当你用小米平板 6看Excel时可能只能看20行内容,但用小米平板6S Pro 12.4看同一个表格,或许能看到 25 行。 从办公角度看,这个比例也确实有它的优势存在。 不过在观影这块,因为目前主流的视频比例都是16:9,而电影更是去到21:9的夸张水平。 在观影的时候,反而是小米平板6要铺得更满一点。 (图源:雷科技) 左右两侧,是全新的六扬声器。 虽然不知道为啥迟迟无法回到小米平板5 Pro的八扬声器,但是放在同级别的板子里也算是个一线水平了。 背面是50MP+2MP经典组合。 (图源:雷科技) 这种相机,主要也就用来登录软件扫码,就不展示它的成像效果了。 不过这次,小米在正面塞进了一颗32MP的前置相机,说是为视频会议专门优化,实际成像效果就请自行领会吧。 作为小米最新旗舰平板,小米平板6S Pro 12.4在配置这块肯定是要拉满的。 骁龙8 Gen2处理器、LPDDR5X+UFS 4.0、最高16+1TB存储配置,可以说每一点参数放在市场里都是顶尖的存在。 简单跑了下安兔兔,得分157万,属于骁龙8 Gen2的正常水平。 (图源:雷科技) 这性能表现,打《英雄联盟手游》《金铲铲之战》之类的大主流手游都是信手拈来,彻头彻尾的满帧游戏体验。 (图源:雷科技) 就是这高帧率和高分辨率不可得兼的设计,让游戏画面看起来不是一般的糙。 打《原神》之类的大型游戏,也没什么问题,在利用游戏工具箱将渲染分辨率拉满的情况下,也能够在半小时游戏进程中维持 的帧率表现。 (图源:雷科技) 《崩坏:星穹铁道》?星槎海中枢半小时能有58帧左右。 (图源:雷科技) 这性能,说是安卓平板里的顶配,一点都不过分。 当然,我想大伙一开始也没想过拿这么大块屏幕的平板打游戏。 这样的性能,在生产力场景上会带来怎样的体验,可能才是大家最关注的部分。 首先是系统,别的不说,小米平板6S Pro 12.4首发搭载了HyperOS ,这一点是好的。 (图源:雷科技) 不仅在MIUI For Pad 14的基础上做了一系列视觉效果更新,在流畅度和后台留存上也有一定的提升。 要论在生产力这块的加成,那还得是全新的模式「工作台」。 在这个模式下,所有APP均被收纳进左下角的全部应用中,默认以窗口形式打开,最多可以同时打开4个窗口,开会议、记笔记、看资讯、写稿子,现在可以同时进行。 (图源:雷科技) 对了,还有PC级WPS Office和CAJViewer。 两款应用的实际体验和桌面版非常接近,页面布局和菜单设置别无二致,用起来比直接点按屏幕方便很多。 (图源:雷科技) 再搭配上官方专门为它搭载的外接配件... 盖上键盘就能带走、打开键盘就变身打工人,整一套体验丝滑流畅,一秒代入,脑海已经有被老板催稿的画面了。 (图源:雷科技) 续航方面,该机标称电池容量是10000mAh,同时配备了目前业内最快的120W快充。 实测下来,在高强度影音娱乐的情况下,该机也能维持将近一天左右的续航时间,而120W高速快充更是可以在半小时左右将电池充至100%,这下续航、补能面面俱到了。 最后,这款产品也提供了 USB 3.2 Gen 1接口,峰值速度能去到5Gbps。 (图源:雷科技) 且支持DP视频输出,也就是能连接显示器。 带着它出差,到了展示环节直接一条Type-C线就能搞定视频输出的事,没有比这更加方便的了。 好了,小雷大致来总结一下。 从配置来看,小米平板6S Pro 12.4无疑是小米今年的旗舰产品。 3299元起步的价格,最高可选16+1TB版本,放在目前的市场里算是个相当公道的价格。 (图源:雷科技) 骁龙8 Gen2处理器+LPDDR5X+UFS 4.0的规格,12.4英寸的超大屏幕,专门的手写笔和键盘,搭配上全新的「工作台」模式和小米特别适配的数款PC移植版办公软件。 对于从事文字工作的我来说,还真的有不小的吸引力。 (图源:雷科技) 当然,更大的屏幕,在提高操作空间的同时,必然会带来一些弊端,比如说跟着增加的机身重量,以及呈曲线下滑的握持手感,都让这款产品注定很难成为讨好每一个人的「万金油」。 除了真心想给未来小米SU7添置车内娱乐设备的用户,如果你对大屏影音体验有所需求,又希望平板能应付一些突发性的办公需求的话... 那这款产品,肯定是值得考虑的。 接下来?接下来就该看友商的表演了。
为了造车,法拉利悄悄买了一辆特斯拉
位于意大利北部的摩德纳省,有一座「汽车圣殿」,它就是法拉利马拉内罗工厂。 这家 1970 年建成的现代化工厂,占地超 10 万平方米,是法拉利旗下最大的研发和制造基地,除定制和限量车型外,所有量产的法拉利均产自于此。简洁利落的红色外立面,配以玻璃幕墙的透视效果,与拥有卓越基因的法拉利跑车不谋而合。 和许多车企一样,法拉利也不允许自家工厂内出现法拉利以外的品牌,除非是母公司斯特兰蒂斯的人开车前来「作客」。 倘若你有时间和精力,像一位 YouTuber 那样在工厂门口蹲上一天,你大概率能够集齐在售的量产车型,并拍下各种身披伪装,出发测试的工程车辆。 YouTuber Varryx 就很热衷于拍摄这样的视频,浏览他的主页,你会发现他经常蹲在马拉内罗工厂门口拍摄来往的跃马车型,包括年内发布的 LaFerrari 和 812 的「继任者」。 但这一天,他拍到了一辆不太一样的车—— 一辆特斯拉 Model S Plaid 从马拉内罗工厂内驶出,特斯拉的珍珠白,在红色的工厂里格格不入,远处身着工服的法拉利员工,也都将目光投向了这辆「少见」的车型。 向特斯拉学习,不丢人 一直以来,特斯拉都是不少车企的研究对象,尤其是领头步入电动时代的 Model S,经常被各种分析和测试,这其中包括保时捷、沃尔沃、福特等老牌车企。 我们买了一辆 Model S,拆开了它,研究它的电机、电池系统等技术。 2019 年,沃尔沃汽车董事长李书福曾公开表示,沃尔沃早在 2016 年就购买了一辆 Model S P90D,对其电机、电池组等核心组件进行拆解、研究,这促成了其后续混动车型的发展。 ▲Model S P90D,图片来自:Top Gear 保时捷在开发其首款纯电车型 Taycan 时,曾多次将其与 Model S 进行对比测试,模拟其转向、加速等性能指标,以至于 Taycan 在诞生初期就多了一个「保时捷版 Model S」的外号。 福特也在 2019 年买过一辆 Model S,当时福特的工程师们主要关注的同样是 Model S 的电池布置和结构,包括冷却管路的设置。同时还包括控制系统和底层软件,这些都是特斯拉最擅长,也最具领先性的技术。 对从未踏足纯电领域的车企来说,在为打造自己的首款电动汽车而努力之前尝试向特斯拉学习,无疑是有意义的。 而法拉利,正是少数尚未推出纯电车型的知名车企之一。 尽管法拉利在 10 年前推出了跨世代的混动超跑 LaFerrari,但对于纯电车型,法拉利一直持保留态度,内燃机的意义,对跃马来说似乎尤为重要。 ▲LaFerrari,图片来自:法拉利 与普通车企不同,法拉利这样的超跑厂商,两款旗舰车型的诞生往往间隔十年之久,因此,他们的每一辆旗舰跑车,都需要具备足够的前瞻性,来确保这一国宝级车企能够在未来的十年里持续引领时代。 回过头看,十年前诞生的 LaFerrari 就很好地完成了它的使命,作为法拉利首款混合动力超跑,它标志着法拉利向新能源时代的转型和突破。 和以往的法拉利旗舰一样, LaFerrari 的机舱同样放了一台 V12 发动机,排量为 6.3 升,这台发动机与电机共同组成了一套总输出高达 950 马力,峰值扭矩 900 牛米的混动系统,这让 LaFerrari 拥有了 2.9 秒的零百加速成绩,极速可达 350km/h。 ▲LaFerrari,图片来自:Car and Driver 总之,LaFerrari 不仅继承了法拉利的纯正血统与绝美线条,更开启了一个属于混动超跑的崭新舞台,推动更多超豪华车企步入电气化新纪元,称得上是当今汽车工业的典范。 然而这款混动先锋并没有满足所有人的期待。事实上,LaFerrari 并不支持以纯电模式行驶,其电机仅能作为混动系统的一部分,与汽油发动机共同输出动力,在起步或加速过程中释放额外的辅助扭矩。 ▲图片来自:法拉利 本质上,LaFerrari 更侧重性能的平衡,对于当时的法拉利来说,V12 引擎才是绝对的核心,而电机,只占了一个辅助的位置。 但现在,V12 已经快要走到尽头了——至少在马拉内罗工厂内,确是如此。 Model S Plaid 不是 Varryx 在马拉内罗工厂门口的唯一收获,他的镜头,还捕捉到了 LaFerrari 的继任者。 请不要怀疑这辆身披伪装的低矮跑车在赛道上的表现,历代法拉利旗舰超跑,无一不是当年的性能之最,这家意大利超跑制造商有能力在任何动力形式的基础上,挖掘极致的加速、制动和过弯性能。不一样的是,法拉利这次砍掉了伪装之下的气缸数量,而且一砍就是 6 个—— 下一个十年,是 V6 的时代。 ▲法拉利新一代车型假想图,图片来自:Instagram @kolesaru 跃马,将以纯电形式亮相 为了砍掉那 6 个气缸,法拉利进行了多年的努力,它的第一个战略目标,是将 12 缸变成 8 缸。 2019 年,正值法拉利诞生 90 周年,法拉利发布了拥有 3 台 MGU-K 的 SF90 Stradale,其中两个电机位于车辆前轴,第三个被放置在 V8 发动机和变速箱之间,整套动力总成的总和最大功率超越了 LaFerrari 了,达到 1000 马力。 ▲SF90 Stradale,图片来自:法拉利 MGU-K(制动发电机,Motor Generator Unit – Kinetic)最初出现在 2014 年的 F1 赛车上,用于回收制动能量并辅助加速。它通过半轴与曲轴相连,在车辆制动时作为发电机工作,将动能转化为电能,存储在电池中,这个过程类似于如今电动汽车上的动能回收系统;当车辆加速时,它可以放出电能,提供瞬间扭矩补充。 ▲图片来自:法拉利 不仅如此,SF90 Stradale 前轴的两台电机拥有 RAC-e 电子转弯调节器,能够根据驾驶情况矢量控制左右车轮的扭矩,提升弯道性能。在纯电模式下,两个前电机可以将车辆带至 135km/h,容量为 7.9kWh 的电池可以提供 25km 的续航。 ▲图片来自:法拉利 没错,SF90 Stradale 是第一辆可以进行纯电行驶的法拉利车型。 两年后的 2021 年,法拉利完成了他们的第二个战略目标——再砍两个缸。 ▲296 GTB,图片来自:Torque 作为法拉利旗下第三款电动化车型,296 GTB 使用了一台全新设计的 2.9T 双涡轮增压 V6 引擎,这款气缸夹角达到 120° 的 V6 引擎也是法拉利第一款将涡轮增压器安装于 V 型结构内部的发动机,结构非常紧凑。加上电机,整套系统的总功率为 830 马力,峰值扭矩为 740 牛米。 尽管从数据上,296 GTB 不敌 SF90 Stradale,但别忘了前者只是法拉利的「入门级」产品,官方指导价「仅为」298.8 万元,而且在零百加速上,296GTB 已与 LaFerrari 的成绩持平,同为 2.9 秒。 从这个角度来看,296 GTB 毫无疑问实现了法拉利多年来从 V12 向更紧凑高效的 V6 动力单元移行的战略目标与技术积淀。 如今的法拉利,正在朝着他们的第三个战略目标迈进。 法拉利首席执行官 Benedetto Vigna 此前明确,法拉利首款纯电车型将会在 2025 年推出。 第一辆纯电法拉利,将植根于我们的赛车传统,并汲取更广泛的技术储备,同时保留所有的真实和一致。 F1 混动技术的发展让法拉利储备了更多的技术,让中置后驱跑车有了全新的演绎方式。只不过,倘若跃马以纯电形式亮相,可能还真得研究一下别人是怎么做的。 你们看,即便强如法拉利,也无法逆转时代浪潮。
机器人做手术,38亿美元市场谁在分羹?
1月8日,复旦大学附属妇产科医院姜桦教授团队完成了一台全子宫切除术,借助利用精锋®SP1000单臂单孔腔镜手术机器人,姜桦教授在患者肚脐位置做了一个仅3厘米切口,手术全程中患者出血不到100毫升,而且术后患者疼痛感较轻,次日即能下床走动。 2月6日,浙江省首例“单孔机器人辅助肝癌切除术”在金华市中心医院顺利实施,俞世安教授带领手术团队用时176分钟完成手术,患者出血量仅为20ml。 越来越多的机器人出现在手术室中,成为主刀医生的“左膀右臂”。 弗若斯特沙利文数据显示,全球手术机器人市场2020-2026年复合增速预计为26.2%,2020年,中国手术机器人市场规模为4.3亿美元,预计2026年达到38.4亿美元,增速44.3%,也就是说,中国手术机器人蕴含着巨大的增长潜力。 根据国际机器人联合会(IFR)分类,手术机器人与康复机器人、辅助机器人、医疗服务机器人同属于医疗机器人大类,但相比于其他三类机器人,手术机器人赛道在一级市场尤为火热。IT桔子数据显示,2023年国内医疗机器人领域共发生29项融资事件,其中手术机器人占据23项,金额共计22.22亿元。 手术机器人赛道热度持续高走,源于市场需求大,政策利好,与此同时,国产手术机器人的商业化还处于初级阶段,距离真正实现规模利润增长还有很长的路要走。 01 两年54起融资 单笔最高达8亿元 手术机器人是多学科融合的创新型医疗器械,它能够通过清晰的成像系统和灵活的机械臂,协助医生实施复杂的外科手术。对医生而言,手术机器人可以有效防止手术时的手部抖动,同时还可增加精细操作能力,拓展手术区域;在一些特定手术中,手术机器人的使用还可减少人力成本,缩短手术时间。对患者而言,手术机器人的使用能够有效减小手术创口,减少出血量,提高术中安全,减轻手术痛苦。 从种类上来看,手术机器人主要包含腔镜手术机器人、骨科机器人、经皮穿刺机器人等类型。弗若斯特沙利文数据显示,腔镜手术机器人在中国手术机器人市场中占比最大,占整体市场的74.9%,其次为骨科机器人占10%,经皮穿刺机器人占4.9%,其主要原因是相关类别手术量大,可为机器人临床试验提供更为丰富的场景。 据亿邦动力不完全统计,2022年-2023年,手术机器人赛道共发生54起融资事件,其中在B轮及以前的融资事件44起,大部分企业还处于发展的早期阶段。在2022年-2023年已披露金额的融资事件中,亿元级融资共22起。 上下滑动查看更多内容 数据来源:IT桔子,天眼查 其中,单笔融资金额最高的是康诺思腾,其于2023年6月30日宣布完成8亿元C轮融资,投资方包括道合科技投资、联想创投、清松资本、美团龙珠、启明创投、礼来亚洲基金、新世界发展集团和险峰K2VC。 康诺思腾成立于2019年,主要从事手术机器人以及手术机器人平台开发,现已完成多孔腹腔镜手术机器人底层技术平台和产业化平台的搭建,并掌握机械架构、电气架构、软件架构、复杂算法和视觉影像系统等核心技术的自主研发、自主可控,其应用领域包括软组织手术机及其他重大专科手术。 术锐®机器人 图源:术锐机器人官网 术锐机器人成长速度最快,其在2022-2023年内接连完成C1、C2、C3三轮融资,其中C1轮由上海生物医药基金领投,源星资本、美敦力、顺为资本、国投招商、天峰资本跟投;C2轮信息未披露;C3轮由正心谷领投,源星资本、国投招商、德诺资本、新毅投资、三亚翠湖跟投,两轮融资金额均达数亿元人民币。2023年3月8日,术锐机器人同中信证券签署上市辅导协议,正式启动A股IPO进程。 术锐机器人成立于2014年,是一家自主研发、生产和销售单多孔通用型微创腔镜手术机器人系统的企业。2020年,术锐机器人获国家药品监督管理局医疗器械审评中心批准,成为中国首台通过创新医疗器械特别审查程序的单孔手术机器人,主要应用于泌尿外科、妇外科、心胸外科、普外科等科室。 02 政策加速市场渗透 国产替代确定性强 手术机器人在一级市场备受追捧,主要受到了政策及市场需求的影响。 弗若斯特沙利文数据显示,2020年中国腔镜手术机器人辅助手术渗透率为0.5%,美国为13.3%;预计2025年中国腔镜手术机器人辅助手术渗透率将达1.6%,美国为18.0%。2025年和2030年,中国腔镜手术机器人市场规模预计为113.6亿元和352.5亿元。 多项政策也加速手术机器人在国内市场渗透。据不完全统计,2021年至今,国家工信部、国家卫健委、国家药监局等多个部门发布手术机器人相关政策共11条。 在器械审批方面,手术机器人作为创新医疗器械,可进入 “绿色通道”,比原先产品上市申报流程压缩半年左右,天智航、华科精准、微创机器人、威高、康多等多家企业的多款产品已经进入国家创新医疗器械审批“绿色通道”,部分产品已获批上市。 国家卫健委发布的《大型医用设备配置许可管理目录(2023年)》指出,大型医用设备的价格限额放宽,其中甲类单台(套)由3000万元调整为5000万元,乙类由1000-3000万元调整为3000-5000万元,当医院购买目录中的医用设备且价格未达限额时,无需办理配置证。对于资源相对紧张的医院而言,办理配置证有一定的难度。放宽限额后,这类医院也可灵活购入手术机器人等先进医疗设备,从而更好地为患者服务。 于患者而言,接受手术机器人辅助的治疗将大幅减少住院费用,但增加了折旧费用、机器人专用手术耗材费用。德邦证券数据显示,机器人辅助手术的成本比传统腹腔镜手术高约6%-25%不等。为提升机器人的使用率,国家鼓励地方政府将机器人辅助手术纳入医保报销范围。2021年北京将“机器人辅助骨科手术”(医保甲类)作为辅助操作获得政府定价,并与“一次性机器人专用器械”共同纳入北京医保支付目录。上海、湖南、广东等多个省市也已将部分使用手术机器人及相关耗材项目纳入医保范围。 达芬奇XI机器人 图源:直觉外科官网 光大证券认为,国产替代的确定性是资本关注国内腔镜手术机器人企业的另一重要原因。以腔镜手术机器人为例,2000年,由美国直觉外科公司研发生产的达芬奇手术机器人正式成为第一个受FDA批准用于临床手术的机器人辅助腹腔镜手术系统,之后的十几年,达芬奇机器人在世界范围内处于垄断地位。随着国产手术机器人如微创机器人公司的图迈产品上市,达芬奇机器人的垄断才被逐步打破。 直觉外科公司公开数据显示,截至2023年6月,我国仅有约350台达芬奇机器人,集中在北京、上海等核心城市的顶级三甲医院。这意味着直觉外科公司并未在中国大批量装机,尚有大批空白医院未被触及,这为国产腔镜手术机器人带来高速增长的机会,资本市场期待“中国制造”能够复制达芬奇机器人的传奇。 03 道阻且长 商业化探索仍在继续 2023年,数家手术机器人公司启动IPO,走向二级市场,包括上文所述术锐机器人。 2023年1月11日,精锋医疗第二次向港交所递交招股书,计划在主板上市,早在2022年4月份精锋医疗就曾向港交所递表。精锋医疗成立于2017年,从事腔镜手术机器人的产研与销售,主要产品包括单孔腔镜手术机器人SP1000、多孔腔镜手术机器人二代-MP1000 Plus系列等。 2023年4月2日,键嘉医疗申请上交所科创板上市获受理。键嘉医疗成立于2018年,从事骨科、口腔科等领域的手术机器人及相关产品研发、生产和销售,当前产品包含ARTHROBOT关节置换手术机器人、YOZX全骨科手术机器人、THETA种植牙手术机器人等。 2023年6月25日,思哲睿于上交所科创板提交注册。思哲睿成立于2013年,主要从事腔镜手术机器人研发、生产和销售,主要产品为康多机器人,应用于泌尿外科腔镜手术领域。 一级市场的企业排队上市,而身处二级市场的企业境遇并不乐观。 骨科手术机器人公司天智航于2020年在科创板上市,2023年半年报显示,报告期内天智航营收为0.82亿元,总营收同比增长34.41%;归属于上市公司股东的净亏损0.37亿元,不过亏损同比缩小16.48%。 腔镜手术机器人公司微创机器人于2021年登陆港交所,2023年半年报显示,报告期内公司营收为0.48亿元,同比增长4495.9%,公司权益股东应占亏损5.39亿元,同比增加17.42%。 血管介入手术机器人公司润迈德于2022年在港交所主板挂牌上市,2023年半年报显示,报告期内营业额为0.50亿元,营收同比下降2.94%;净亏损0.48亿元,同比上一年缩减97.87%。 核心产品销售额低、研发成本高、销售及市场推广活动增加是这些上市企业面临的主要困境。对比直觉外科,其商业模式主要为“设备+耗材+服务”,前期铺设备至各个医院,后续的收入来自源主要为出售耗材和赚取服务费。而国内手术机器人的商业模式尚未成熟。 直觉外科分业务收入情况(亿美元) 图源:德邦证券 业内人士称,当前我国患者对手术机器人的接受程度仍有待提高,特别是在手术机器人项目未纳入医保的地区,患者接受机器人辅助手术的意愿低;从机器人的成本来看,单台手术机器人售普遍在千万级别,加上后期需要不断投入耗材费、服务费,许多医院无力承担。如何提高机器人的接受度,如何抢占有付费能力的医院,如何进一步打造技术壁垒,是所有手术机器人企业要思考的问题。
马斯克公开怒怼,Google 的 AI 怎么又翻车了?
人称科技界汪峰的 Google,屋漏偏逢连夜雨。 前阵子官宣的大模型 Gemini 1.5,实力强劲但无人问津,被 OpenAI 的视频生成模型 Sora 抢去了风头。 最近,它又摊上了美国社会敏感的种族歧视问题,好心办了坏事,惹恼了往往站在鄙视链顶端的白人。 多样化算你认真,过度多样化惹祸上身 如果在几天前使用 Gemini 生成历史人物图片,呈现在用户眼前的仿佛是一个不存在课本的平行时空,违背「戏说不是胡说」的精神,把知识都学杂了。 公元 8 世纪到 11 世纪的维京人,不再是金发碧眼、高大魁梧的影视剧经典形象,虽然肤色变黑了,穿着清凉了,坚毅的眼神依然展现着战士的强悍。 1820 年代的德国夫妇,人种构成十分丰富,可以是美国原住民男性和印度女性,也可以是黑人男性和亚洲女性。 AI 瞎编剧情也是讲逻辑的,后代继续着他们的故事,过了 100 多年,1943 年的德国军队,又能见到黑人男性和亚洲女性的身影。 王侯将相宁有种乎,时间的长河里,跨越陆地和大洋,美国的开国元勋,中世纪的英格兰国王,都可能由黑人执掌权柄。 其他职业也被一视同仁,AI 忽略不让女性担任神职的天主教会,教皇可以是印度女性。尽管人类历史的第一位美国女性参议员出现在 1922 年且是一位白人,但 AI 的 1800 年代欢迎美国原住民。 都说历史是个任人打扮的小姑娘,但这次 AI 把人都给换了。历来有优越感的白人气愤了,他们终于也在人种、肤色和外貌上,尝到了被歧视的滋味。 当探索越发深入,不仅是历史人物,现代社会在 AI 眼里也是另外一副样子。 Google 前工程师 @debarghya_das 发现,美国、英国、德国、瑞典、芬兰、澳大利亚女性的肤色都可能偏黑。 他痛心疾首地感叹:「让 Google Gemini 承认白人的存在是非常困难的。」 更让网友生气的是,被要求生成乌干达等国家的女性时,Gemini 反应很快,干活也利索,轮到白人时,就可能拒绝,甚至对网友说教,这样的要求强化了种族刻板印象。 计算机工程师 @IMAO_ 脑洞大开地做了一系列实验,不局限在人类这个物种,就想知道 Gemini 眼前的黑是什么黑,Gemini 要的白是什么白。 结果很有意思,算法似乎只针对白人。 生成白熊是没有问题的,说明 AI 不会被「white」这个词触发。生成非洲的祖鲁人也是没有问题的,尽管提示词强调了「多样化」,但大家长得还是差不多。 漏洞出现在了奇幻生物上,精灵和侏儒都是白人,但吸血鬼和仙女是「多样化」的,看来 Gemini 道行不深,还得与时俱进。 不过,他的游戏很快结束了。Google 站出来回应,承认一些历史图片确实存在问题,并且暂停了 Gemini 的人像生成功能,很快会做出调整。 Google 也解释了立场,强调生成多样化的人物本来是件好事,因为 AI 工具就是给全世界使用的,只是现在方向走得有点偏。 虽然 Google 出面揽下了这口锅,但它没有明确回应,「一些」历史图片到底是多少,以及为什么出现了「多样化过度」的问题。 不买账的网友们牙尖嘴利:「Gemini 一定是用迪士尼公主和 Netflix 的翻拍训练的」「Gemini 其实想告诉你,如果你是黑人或亚洲人,你会是什么样子」。 然而,种族歧视本身就是个容易当枪使的话题,所以也有人怀疑,其中的一些图片是恶意 P 图,或者通过提示词引导生成。那些在社交媒体骂声最响的,确实也是一些政治立场明确的人士,不免有阴谋论的味道。 马斯克更是看热闹不嫌事大,批评 Google 过度多样化,问题不只出在 Gemini,还有 Google 搜索,顺便给自己两周后发布新版本的 AI 产品 Grok 打广告:「不顾批评、严格追求真理从未如此重要。」 上次马斯克也是这么做的,呼吁暂停 GPT-4 进化后,购买了 1 万个 GPU 加入 AI 大战。 比他的言论更吸引人的,可能是网友趁乱做的他的梗图。 互联网的差异,可能比现实更极端 Google 究竟为什么在「多样化」上走偏了? Hugging Face 首席道德科学家 Margaret Mitchel 分析,Google 可能对 AI 进行了多种干预。 一是,Google 可能在幕后为用户提示词增加了「多样化」的术语,比如将「厨师的肖像」变成「土著厨师的肖像」。 二是,Google 可能优先显示「多样化」的图像,假设 Gemini 为每个提示词生成 10 张图像但只显示 4 张,那么用户就更可能看到排在前面的「多样化」图像。 干预过度可能恰恰说明,模型还没有我们想象得那么灵活和聪明。 Hugging Face 研究员 Sasha Luccioni 认为,模型还不存在时间的概念,所以对「多样性」的校准用到了所有图像,在历史图片方面尤其容易出错。 其实,当年还籍籍无名的 OpenAI,也为 AI 画图工具 DALL·E 2 做过类似的事情。 2022 年 7 月,OpenAI 在博客写道,如果用户请求生成某个人物图像,但没有指定种族或性别,比如消防员,DALL·E 2 会在「系统级别」应用一项新技术,生成「更准确地反映世界人口多样性」的图像。 OpenAI 还给出了一个对比图,同一个提示词「A photo of a CEO」(首席执行官的照片),使用新技术之后,多样性明显增加了。 原来的结果主要是美国白人男性,改进之后,亚洲男性、黑人女性也有了成为 CEO 的资格,运筹帷幄的表情和姿势倒像复制粘贴出来的。 其实不管是哪种解决方案,都是在后期亡羊补牢,更大的问题还是,数据本身仍然存在偏见。 供 AI 公司训练的 LAION 等数据集,主要抓取的是美国、欧洲等互联网的数据,更少关注到印度、中国等人口众多的国家。 所以,「有魅力的人」,更可能是金发碧眼、皮肤白身材好的欧洲人。「幸福的家庭」,或许特指着白人夫妇抱着孩子在修剪整齐的草坪上微笑。 另外,为了让图像在搜索中排名靠前,很多数据集可能还有大量「有毒」的标签,充斥着色情和暴力。 种种原因导致,当人们的观念早已进步,互联网图像里人与人的差异,可能比现实更加极端,非洲人原始,欧洲人世俗,高管是男性,囚犯是黑人…… 为数据集「解毒」的努力当然也在进行,比如从数据集中过滤掉「坏」内容,但过滤也意味着牵一发动全身,删除了色情内容,可能也导致某些地区的内容更多或者更少,又造成了某种偏差。 简而言之,达成完美是不可能的,现实社会又何尝不存在偏见,我们只能尽量做到,不让边缘的群体被排除在外,弱势的群体不被安上刻板印象。 逃避虽可耻但有用 2015 年,Google 的一个机器学习项目也陷入过类似的争议。 当时,一名软件工程师批评 Google Photos 将非裔美国人或者肤色较深的人标记为大猩猩。这件丑闻,也成为了「算法种族主义」的典型例子,影响至今。 两名前 Google 员工解释,出现这么大的错误,是因为训练数据中没有足够的黑人照片,并且在相关功能公开亮相之前,没有足够的员工进行内测。 时至今日,计算机视觉不可同日而语,但科技巨头们仍然担心重蹈覆辙,Google、苹果等大公司的相机应用,对大多数灵长类动物的识别仍然不灵敏,或者刻意回避。 防止错误再次发生的最好方式,似乎是把它关进小黑屋,而非修修补补。教训确实也重新上演了,2021 年,Facebook 为 AI 将黑人贴上「灵长类动物」标签道歉。 这些才是有色人种或者互联网弱势群体们熟悉的情况。 去年 10 月,牛津大学的几位研究员要求 Midjourney 生成「治疗白人儿童的非洲黑人医生」的图片,扭转「白人救世主」的传统印象。 研究员的要求已经非常明确了,然而生成的 350 多张图像中,有 22 张的医生是白人,黑人医生旁边还总有长颈鹿、大象等非洲野生动物,「你看不到任何非洲的现代感」。 一边是司空见惯的歧视,一边是 Google 歪曲事实营造虚假的平等感,从目前来看,不存在简单的答案,也不存在端水的模型,如何达成人人满意的平衡,恐怕比走钢丝还难。 就拿生成人像来说,如果是用 AI 生成某段历史时期,或许反映真实的情况更好,尽管看起来没有那么「多样化」。 但如果是输入提示词「一名美国女性」,理应输出更加「多样化」的结果,但难点在于,AI 如何在有限的几张图里做到反映现实,或者至少不扭曲现实? 哪怕同是白人或黑人,年龄、身材、头发等特征也各不相同,所有人都是具有独特经历和观点的个体,却又生活在共同的社会中。 一位网友用 Gemini 生成芬兰女性时,四张图里只有一张是黑人女性,便开玩笑说:「75%,得分 C。」 也有人追问 Google,改进模型之后,是否「会在 25% 的时间生成白人,而非 5%」。 很多问题并非技术所能解决,有时候也关于观念。这其实也是 Yann LeCun 等 AI 大佬支持开源的部分原因,由用户和组织自行控制,根据自己的意愿设置或不设置保护措施。 这次 Google 的闹剧中,也有人保持冷静,表示先去练习怎么写提示词吧,与其笼统地说白人、黑人,不如写「斯堪的纳维亚女性、肖像拍摄、演播室照明」,要求越明确,结果也越精准,要求越广泛,结果也可能越笼统。 去年 7 月发生过类似的事情,一位麻省理工的亚裔学生想用 AI 工具 Playground AI 让头像看起来更专业,结果被变成白人,肤色更浅,眼睛更蓝,把帖子发在 X 后,引来了很多讨论。 Playground AI 创始人回应,模型无法被这样的指令有效地提示,所以会输出更加通用的结果。 把提示词「使其成为专业的领英照片」改成「工作室背景、锐利灯光」,结果可能会更好,但确实也说明了,很多 AI 工具既没教用户怎么写提示词,数据集又以白人为中心。 任何技术都有犯错的可能和改进的空间,却未必都有解。当 AI 还不够聪明的时候,首先能够进步的是人类自身。
伊朗假冒苹果iPhone骗局曝光:涉案金额高达3500万美元,明星代言惹争议
IT之家 2 月 23 日消息,据报道,伊朗近期发生了一起利用假冒 iPhone 进行的诈骗案,涉案金额高达 3500 万美元(IT之家备注:当前约 2.52 亿元人民币),并雇请名人为其虚假交易进行宣传。该骗局之所以能够成功,部分原因在于苹果公司产品本身并未在伊朗合法销售。 由于美国对伊朗实施制裁,苹果公司无法在伊朗开展业务,也无法直接向伊朗用户销售产品。这在伊朗催生了一个灰色市场,伊朗人通过在其他国家购买 iPhone,再将其进口到伊朗进行转售。 诈骗者正是利用了这一点,声称自己能够提供更便宜的渠道,绕过中间商,以更低的价格出售 iPhone。据英国《金融时报》报道,位于德黑兰的“Kourosh 公司”几个月来一直以半价出售 iPhone,声称其通过消除昂贵的中间商节省了成本,可以将售价降至约 700 美元。 该公司由企业家阿米尔・侯赛因・沙里菲安(Amir Hossein Sharifian)经营,为了吸引更多买家,不惜重金聘请伊朗体育明星和其他名人进行代言。在这些明星的“光环”效应下,成千上万的受害者,尤其是渴望拥有最新苹果设备的年轻人,纷纷上当受骗。 在许多买家支付了货款并等待了 45 天的交货期后,他们始终没有收到 iPhone,这才意识到自己被骗。警方调查发现,沙里菲安已经逃离伊朗,但目前已被警方锁定,并正在与国际刑警组织合作将其逮捕并引渡回国。 沙里菲安在 YouTube 视频中承认自己欠公司客户的钱,但声称金额只有约 270 万美元,远低于伊朗媒体报道的 3500 万美元。目前尚无证据表明参与代言的明星知情,但他们也因此受到了公众的谴责,并面临被追责的压力。 一些人认为,该公司能够获得经营业务和做广告所需的许可证,表明政府存在腐败问题。
让现实消失的不是 Sora,而是明日的 Vision Pro
更沉浸 更个性 更孤独 OpenAI Sora 模型的诞生,让不少人大呼「现实已经不存在了」,因为它能让文字描述快速变成乍一看可以假乱真的视频。 然而,真正可以让现实「崩塌」的,却可能是以 Vision Pro 等设备开启的新一代混合现实体验 —— 我们可能身处同一时空,却毫无共同体验。 最近,斯坦福大学的「虚拟人类交互实验室(Virtual Human Interaction Lab)」开展了系列实验,更多地关注混合现实对心理和认知的改变。 如果说 Vision Pro 让我们看到「未来已来」,那这个未来看起来好像让人更孤独了。 我把你当朋友,你却把我当 NPC 想象一下,当你头戴突兀的 Vision Pro 上街,上面还显示着拙劣地模仿着你眼睛的图像,然后和遇到的人聊天,别人会怎么看你? 大家是不是就会因此觉得你更难接近? 结果可能和我们想象的不一样。 在斯坦福「虚拟人类交互实验室」的研究中,11 位作者戴着 Meta Quest 3,采用「穿透模式(passthrough)」在生活中与人交流沟通。 研究最终发现,戴着头显的人感觉自己和他人连接变得更弱了,社交的负面影响更大。作为对比,那些不戴头显,在公共场合和戴头显的人交流的人,反倒感受的负面影响却没有那么大。 说到这里,我们可能要先讲一下「穿透模式」。 在这个模式下,用户可在佩戴头显的情况下看到外界环境。需要强调的是,这里看到的「现实」不是真正的「现实」,而是摄像头捕捉后然后呈现于内在屏幕的影像。 因此,用户通过头显看到的「现实」,会受到摄像头拍摄质量,内置屏幕视角广度,显示延迟等多种因素影响。 以视角广度来说,我们肉眼一般横向可看到 200° 的内容,但 Meta Quest 3 呈现的广度只有 110°。 也就是说,如果有人并排站在你身旁,用「余光」我们就能瞄到,但用头显的话就会完全看不到这人存在。这也会影响头设使用者对空间的理解以及降低用户的「在场感」。 图片来自论文 同时,图像扭曲、延迟和清晰度有限,同样也会让使用者有「不真实」感。 譬如,当实验室的研究员在和他人聊天时,感觉自己身处一个让人困惑的巨型视频会议中,身边的人看起来就像是某种虚拟形象。在对话过程中,微妙的表情或其他社交信息也很容易丢失。 而离使用者比较远的人,看起来直接就像是背景的一部分。 「虚拟人类交互实验室」负责人 Jeremy Bailenson 将这种感觉描述为「社交缺席(social absence)」—— 真实的人没那么真实了。 Business Insider 记者 Adam Rogers认为,这种情况需引起警惕: 长期使用穿透模式,可能会让人更容易将其他人视作非人类 —— 游戏化恐怖谷里的 NPC。 虽然 Vision Pro 比研究人员使用的 Quest 3 头显具有更高清晰度,但它毕竟还是比不上人类自己的眼睛。单从色彩来看,Vision Pro 能显示的颜色也只占人类肉眼可见色彩的 49%。 「影视飓风」Tim 在戴着 Vision Pro 在海边行走时,也将穿透的体验形容为「现实会有一点糊,但你不会怀疑它不是现实……有点像是梦里的感觉」。 当其同伴李四维在尝试测试 Vision Pro 延迟情况而进行重复动作时,Tim 也脱口说出了一句:「你在 GTA(游戏《侠盗猎车手》)卡住了大哥。」 GTA 6 中的沙滩场景,图自 Pixground 我们难以道明具体是什么因素构成或区分了我们认知中的「真实」,因为我们对人类视觉以及大脑的认识还相对有限。 感官生物学家发现,人类视觉处理细节的能力比绝大部分动物都好。(我们的社会也是一个以视觉为主导的文明,语言中有很多基于视觉的表述,如「前途一片光明/黑暗」。我们粤语就更夸张了,人可以「靓」,心情可以「靓」,连肠粉也可以「靓」。) 一个通过头显摄像头和屏幕「转述」的「真实」,丢失的不仅是像素,还有我们暂时未能理解的重要信息。 真真假假,我们的大脑分不清 图片来自《纽约时报》 除了透过屏幕去看「现实」,穿透模式另一个重要特点在于我们从此可以在屏幕中的「现实」上叠加虚拟内容。 在体验过程中,研究人员对 Quest 3 上混合现实游戏《初次相遇(First Encounters)》印象特别深刻。 在这游戏中,玩家可以看到自己身边环境的模拟,然后要自己用枪一下一下地把真实世界中的模式环境击破,逐渐看到虚拟世界。 从某个角度来看,这也是一种「编辑现实」的能力 —— 将你房间里的墙壁一点一点地换成虚拟世界。Bailenson 感叹: 头设不仅能在现实世界上叠加信息,还能删除信息。 我研究 VR 和 AR 也有一段时间了,我从来没见过(像《初次相遇》那样)「删除」可以做得那么好。 《初次相遇》游戏截图,来自 Meta Store 从前像 Google Glass 或 Hololens 2 那种可以让用户直接透过半透明镜片看到现实世界的头显,虽然也支持混合现实,可以在「现实」上叠加信息,但因为这里的现实是真实世界,因此和虚拟信息结合时效果没那么融合。 现在像 Quest 3 和 Vision Pro 这样的设备,因为用户眼前所看全为「模拟」,因此「虚实结合」效果更佳,连「删除」也变得更逼真。 想象一下,如果未来所有人都跟带手机一样随身使用 Vision Pro 或其他支持穿透模式的头显,去到景区,我们也许可以很便捷地「删除」拥挤的人群,拍下安静美好的景色。 Google Pixel 8 的 Magic Editor 功能 一切简单得可能就跟今天在拥挤的地铁上打开降噪耳机,马上就能从听觉上「编辑现实」一样。 Adam Rogers 觉得,科幻作家 William Gibson 的一个概念也许能延伸帮我们理解这种未来。 Gibson 在描述「赛博空间」时,称它为「一致同意的幻觉(consensual hallucination)」。而头显中的现实,则是它的完全对立面 ——「无数个分离的,不被共享的幻觉,每一个都如雪花一般独特」。 在 Bailenson 看来,这是「公共消逝」的开始: 人们将处于同一个物理空间,同时体验着视觉上截然不同的世界。 我们将失去认知的共同基础。 你也许会觉得,我们既然可以主导选择「编辑」什么,那我们肯定也可以知道什么是真什么是假的。 但我们的大脑可能不太同意。 早在 2014 年,研究人机交互的 Frank Steinicke 试着让参与者在 24 小时里体验 VR 世界,每一轮使用 2 小时,每轮之间休息 10 分钟。即便在当时的技术下,Steinicke 过着过着就已经开始分不清现实和虚拟了。 在实验过程中,参与者有好几次开始对于自己是处于虚拟世界还是真实世界开始产生困惑,并且混淆了两个世界中的特定物件和发生过的事件。 一个 2009 年的研究也发现,小朋友在体验 VR 后,甚至会产生虚假的回忆,即便当时的 VR 成像质量相当有限。 不用说 VR 和 AR 这类沉浸体验了,就算看电影都能混淆我们的大脑。 心理学教授 Daniel Schacter 在《追寻记忆》里分享了前美国总统里根的一个「翻车事件」: 在宣传选举活动中,里根多次动容地讲述一位「二战」飞行员的感人故事。然而,台下听的媒体都能意识到,这个故事几乎跟 1944 年电影《飞行之翼》的内容完全一样。 「显然,里根保留了事实,却忘了它们的出处。」 脑神经学家 Oliver Sacks 也曾指出,幻觉之所以会被「误认」为是事实,部分原因是因为它们和真正发生过的感知都会涉及同样的知觉路径。 在我们的大脑里,真假并不是黑白分明(又用上了基于视觉的形容),更高清沉浸的虚构只会让它更困惑。 「你是我最好的朋友」 读到这里,我们先暂停一下,从这高科技畅想中回到现实生活。 你觉得你身边,懂你,了解你的人有多少? 如果一下子想不到答案也不要紧,毕竟有调研显示,超过一半的美国人认为,生活里没有一个人是真正了解他们的。和 1990 年相比,说自己没有亲密朋友的人翻了四倍。 播客「The Gray Area with Sean Illing」曾分享,一位研究人们如何讲述自己个人历史的心理学家曾「付费」请志愿者来分享自己的故事。 在这大约四小时的访谈中,心理学家会通过一些问题去切入了解志愿者的人生。访谈结束,心理学家在支付费用时,很多人居然想把钱还给心理学家: 我不想收钱,这是我人生里最棒的一个下午。 从来没有人询问过我的人生故事。 显然,愈加繁荣的社交媒体没有让人与人之间的关系变得更紧密,反倒让人们觉得更孤独,不被了解和看见。 当未来人人都戴着头显来与人交流,这个情况似乎很难获得改善。 尤其当生成式 AI 现在正指向一个更「定制化」的未来。 我们在上一部分讨论到,未来我们眼中的现实,很有可能都可以人为「降噪」,做到字面上的「千人千面」。 那至少我们还有文化娱乐能成为共同点? 如今现实再分裂,不少人仍能从对特定书影音文化产物中找到同好,形成联结或展开讨论。 科技文化作者 Ryan Broderick 认为,未来这可能也会消逝。 在 Broderick 看来,在过去 25 年以来,互联网就是在将过往一切分解成更小的单元:把专辑分成单曲,电台分解成了播客和歌单,电视和电影在各自产生新变体后,最终还是被切成一刷而过的 90 秒短视频。 在「旧世界」被分解后,互联网本身在已经开始分解。 每一个 app 或者信息流都是自己独有的社区、平台、信息系统、电影院、书报亭,但都又没有之前这类东西运行得那么好。 然而,就如流媒体大战后,流媒体正变得越来越像传统电视一般(接广告,爱做综合内容,想俘虏所有人),被分解的互联网也终将重新被汇集起来。 如果 AI 早就已能「猜你喜欢」,为你筛选新闻、资讯、短视频,那明天生成式 AI 就能帮你直接整合好所有信息,甚至生成出为你而设计的,最合你心意的短视频故事。 那些精彩的短视频或影视作品,独一无二,只有你才懂,因为只有你才看过。 它最好的观看载体? 当然就是明日的「Vision Pro」。 到时候,我们最好的朋友可能真的只能是我们的 AI 伴侣了。 只有它知道在那密闭的头显世界里,我们爱看什么,看过什么,未来会看什么。 所幸在于,那个未来尚未来临,一切还来得及。 「虚拟人类交互实验室」的呼吁朴素却真切: 我们建议游说将头显使用每日化的公司保持谨慎和克制,敦促学者对这一现象进行严格和纵向的研究。
出道即凉凉,Vision Pro会成史上最惨的苹果新品吗?
1 个月前,苹果 Vision Pro 头显还被无数科技媒体誉为“计算新时代的开始”,在全球果粉的抢购下,开启预售当天仅用时 18 分钟,库存就已经告罄。 但距离开启预售才刚过去 1 个月时间,关于苹果 Vision Pro 的各种负面舆论层出不穷,就连最基础的品控保障也遭到用户强烈质疑。 根据 Reddit 社区网友反馈,目前至少已有 3 例苹果 Vision Pro 前置玻璃无故出现裂纹的现象,它们都是在没有磕碰、摔落的情况下发生的,不排除还有更多用户遇到同类情况。 图源:Reddit 尽管小雷在网上没有找到更详细的证据链条,来确认裂纹出现的具体原因,但 Vision Pro 作为一款刚发售不久的产品,在非人为因素影响下出现这种情况,的确很难让消费者接受。 一时间,无数被伤透了心的果粉选择在官方设定的 14 天尝鲜期内申请无理由退货。外媒 Cult of Mac 的退货调查显示,截至 2 月 15 日,约有 45%的用户选择在无理由退货期内退回购买的 Vision Pro,退货率远高于苹果其他产品线设备。 从 10 万元仍一机难求,到大量退货,Vision Pro 彻底跌落神坛,口碑两极反转,这究竟是为什么? 一夜之间,Vision Pro 跌落神坛 1、定价过高,高攀不起。 全球首批试图尝鲜 Vision Pro 的人群中有专业AR/VR从业者、3D软件开发者、科技媒体/博主,也有从未使用过任何头显设备的小白。虽然小雷不知道各类群体的具体占比,但我知道其中肯定有很多潜在消费者被 3499 美元的起售价直接劝退。 从行业角度出发,Vision Pro 售价是同类产品 Meta Quest 3 的 6 - 7 倍,就连许多应用开发者和从业人员也难以接受如此高昂的售价。Halide iPhone 相机应用程序的开发者 Sebastian de With 表示,尽管这是一项很酷的技术,但因售价过高,将退货苹果 Vision Pro。 图源:Meta 从各类用户对 Vision Pro 定价的反馈来看,这显然不符合大众心目中消费级头显的定位。如果说苹果想将 Vision Pro 打造成第二个 iPhone ,那主动用价格将用户范围缩小显然是不明智的行为。 2、设备重量大,体验感差。 如果说高定价是筛选用户的手段,那体验感差就是导致退货潮的直接原因。不少用户反映,自己佩戴 Vision Pro 后出现了视觉疲劳、头晕头痛等症状,更有甚者出现眼球血管破裂的情况。由于设备重量较大的缘故,长时间佩戴还容易会对脑袋、颈椎等产生压力,造成不适。 这些问题直接影响了用户的使用体验,这给许多此前抱着用 Vision Pro 替代手机、平板电脑、PC 想法的用户当头一棒。哪怕是使用效果不理想,或许他们还能容忍,但会对身体健康造成不好的影响,那除了退货,似乎也没有别的选择。 3、缺乏核心应用,使用场景受限。 在预售前,苹果用宣传片为我们展示了 Vision Pro 的许多用法,宣传效果拔群,直接吸引了不少此前从未接触过头显设备的用户参与预售。 但当他们购买 Vision Pro 后发现,貌似很难百分百实现宣传片中呈现的结果,就像上文所说长时间佩戴容易造成不适的问题,注定了用户很难完整体验一部电影、电视剧。 图源:Apple 官方强调的生产力工具属性也并非适合所有用户,有 YouTuber 创作者提到在使用 Vision Pro 的过程中程序整体运转很慢,无法与 PC 设备相比,色彩显示也不够准确。而部分程序员则认为用 Vision Pro 写代码是对眼睛的折磨,因为眼球追踪技术要求他们长时间聚焦双眼。 除了上述情况外,最关键的问题是 Vision Pro 仍缺乏杀手级应用——一个其他设备都无法替代的功能应用。 Vision Pro 目前仍然是一款非常小众的产品,其成功很大程度上取决于第三方应用和服务的支持。如果没有一个能吸引用户长时间驻足的应用,按照目前 Vision Pro 既不能随心所欲体验影音娱乐,又不能在工作场景中长时间使用的窘况,哪怕消费者不退货,Vision Pro 大概率也会成为新一代的吃灰产品。 4、倒卖遇冷,黄牛及时止损。 按照以往的经验,iPhone、Apple Watch 等苹果初代产品是黄牛最爱:供货少,用户基础大,炒作空间不小,属于知名“硬通货”,稳赚不赔。想必多数黄牛想必在预售前就已料到高定价的 Vision Pro 并不好卖,但仍有许多人铤而走险,冒险囤货。 相较于此前维修手机、回收平板等严苛条件,苹果此次设置的 Vision Pro 退货条件相当大方,只要头显以及包装无损,苹果都将直接回收产品。 面对不明朗的销售前景,黄牛与其将货烂在手里,倒不如原路退回,降低风险。 中国市场未上市,但前路堪忧 目前 Vision Pro 仍未在国内市场正式发售,国内能提前上手的用户要么是亲自去美国抢购,要么是通过黄牛代购。此前国内多个平台均采取加价代购的方式售卖期货,热度最高时一度将价格炒到 10 万元左右。但如今代购价一路下滑,甚至差点跌破官方发售价。 价格的波动,充分反映了国内市场对 Vision Pro 前景的判断。此前曾有消息称, Vision Pro 将在苹果春季发布会后面向中国区发售。从目前情况来看,Vision Pro 似乎很难在中国市场取得理想的市场表现。 大部分有条件的国内消费者已经通过各种方式尝鲜。即使没条件直接购买,国人也有办法体验。各类 Vision Pro 体验店像雨后春笋般冒出,体验价格由几十元到千元不等。北京一家店面光是春节两天就已经接待了2000多人,用户都是专门来体验 Vision Pro。 图源:Apple 体验过后,感兴趣者继续保持关注,不感兴趣者自然不会入手,相当于筛选掉部分用户。 除了消费者群体外,华强北作为国内数码风向标之一,此次对 Vision Pro 的态度也是异常冷淡,几乎很难找到出售类似 Vision Pro 的头显设备。只有少数店铺出售标注为“ MR 一体机”的头显设备。一方面,华强北在技术层面自然无法与苹果 Vision Pro 比较,另一方面,正主都在经历退货潮,高仿更不会被看好。 借用店主的话来说:“要是单卖这个,得饿死。” 这话虽然直接,但国内市场对 Vision Pro 的态度可见一斑。 难逃“初代魔咒”,Vision Pro二代有戏? 市场调研机构 IDC 发布报告显示,2023 年中国 AR 市场出货量预计达到 24 万台,同比增长 133.9%,预计 2024 年出货量将持续高速增长,增速预计达 101%。 AR 设备近些年的市场需求持续增长,显示人们对相关设备的期待值也越来越高。但这不意味着任意一款头显设备都能受到国内用户的青睐,要想成为一款现象级的消费电子产品,Vision Pro 要优化的地方还有很多。 小雷上文分析了 Vision Pro 的四大退货理由,造成这些理由的真实原因是消费者与其他类别设备对比后产生的心理落差。不可否认的是,Vision Pro 在空间显示方面属于天花板级别,能带给用户绝佳的观影体验,但这些惊喜无法掩盖重量、续航、使用场景单一等短板。 图源:Apple 目前,Vision Pro 仍然没有超脱头显设备常见的困境。 初代 Vision Pro 的折戟不能代表什么,苹果作为最具创新能力的科技公司之一,并不缺乏持续迭代的能力。如果苹果能根据首批用户的反馈,摸清后续的改进方向,相信第二代 Vision Pro 将会是一款更好的头显设备。 至于需要多少代产品才能达到理想形态,成为行业标杆产品,小雷认为这或许是一个漫长的过程。
占比19.2%,华为智能手机2024年实现开门红
华为在2024年1月份的销量表现非常强劲。在中国智能手机市场,华为实现了销量第一,份额达到了19.2%。这主要得益于刚刚上市的nova 12系列的热销。此外,据华为相关消息人士透露,华为目标在2024年出货6000万-7000万部智能手机。这个目标出货量比2022年全年出货量翻倍。华为Mate 60 Pro和Mate 60 Pro+的出货量已上调至2000万台。华为Mate 60 Pro下半年出货预估已调升20%至约600万部。展望2024年,预估华为零组件采购量为3000–4000万部。这些都显示出华为在2024年有望持续带来高能表现。 华为在2024年的主要战略目标包括: 1提高创造高效益的能力:华为将努力提高创造高效益的能力,以满足客户的需求和市场的变化。 2全力推进鸿蒙系统的广泛应用:华为将全力推进鸿蒙系统的广泛应用,以提供更好的用户体验。 3全力以赴地追求优质的用户体验:华为将全力以赴地追求优质的用户体验,以满足用户的期望。 4智能手机出货量:华为计划在2024年出货6000万-7000万部智能手机。 5ICT基础设施业务:华为将充分发挥在计算、存储、网络等领域的综合优势,以6系统工程能力全面支持各行业的数字化转型与智能化升级。 7终端业务:华为终端将继续致力于打造王者产品,构筑有温度的高端品牌。 8华为云:华为云既要成为公司数字化的底座和使能器,也要成为各行各业可信赖的数字化“黑土地”。 9数字能源:数字能源要不断提升产品质量与竞争力,抓住低碳化确定性机会,多贡献利润,实现有价值的增长。 10智能汽车解决方案:智能汽车解决方案与伙伴共同努力,将技术优势转化为商业成功。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。