EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
创始人套现、屡收监管函,“直播电商第一股”遥望科技怎么了?
凤凰网科技《风暴眼》出品 作者|李玉繧 编辑|江江 龙年春节刚结束,“直播电商第一股”遥望科技便收到了监管函。日前,该公司发布公告,称公司于2月2日收到深交所关于2023年业绩预告的《关注函》,由于函件涉及事件较多公司无法在规定完成回复,将延期向深交所提交关注函。 这并非遥望科技首次收到监管函。因虚增收入与利润、信披违规、股东减持,这家昔日的“网红概念牛股”这两年没少被监管问询。 遥望科技最近几年刷足了存在感。从转型直播带货,签约贾乃亮、赵雅芝,到拥抱AICG,拿下梅西国行直播间首秀,再到布局短剧。只要有热点的地方,就有遥望科技。但遥望科技主营业务其实很简单,是一家广告鞋服+电商公司公司,华丽外衣也掩饰不了公司持续亏损、股价腰斩的事实。 直播电商如火如荼的当下,东方甄选、三只羊等MCN公司都交出漂亮成绩单,而被市场寄予厚望的遥望科技是如何落到如今境地?边“蹭热点”边减持的情形下,遥望科技还能收获市场的信心吗? 遥望科技是什么来头? 遥望科技创立于2002年7月25日,最早是佛山一家卖女鞋的公司,前身为星期六股份有限公司,后于2006年10月31日并入力元鞋业,至2009年挂牌A股市场。该公司旗下拥有包括星期六(ST&SAT)、菲伯利尔(FBL)、索菲娅(SAFIYA)等在内的多个品牌,一度称霸国内女鞋市场。 面临电商冲击,星期六自2017年起步入亏损模式,随后转向互联网领域以求突破。2018年,星期六斥资17.71亿元收购了MCN公司遥望网络。到了2019年3月,星期六完成资产重组,转型为移动互联网公司,并易名为遥望科技。 重组后,直播电商迅速成为遥望科技的盈利核心。2018年财报数据显示,互联网广告业务仅占该公司营收的11.02%,到2022年飙升至91.64%。 遥望科技擅长利用明星效应提升品牌知名度,是行业内较早将明星引入直播领域的MCN机构。2022年,遥望科技宣布新签艺人25位,签约总数达51位,包括张柏芝、贾乃亮、王祖蓝等众多明星。去年又签下了何润东、赵雅芝等明星。 图|遥望科技带货明星及主播们 凭借明星效应以及直播布局,遥望科技与薇娅夫妇的谦寻文化,罗永浩背后的直播公司交个朋友,以及坐拥抖音半壁网红的无忧传媒齐名,被誉为“国内MCN四大天王”。 尽管电商直播热火,遥望科技业绩却是“赔本卖吆喝”。 遥望科技2023年业绩预告显示,公司净利润为-8亿元至-12亿元,2022年为-2.65亿元。在直播电商最热闹的2021、2022年,MCN签约艺人和短视频平台赚的盆满钵满,遥望科技却承担了7亿元和2.65亿元的净亏损。 随着直播带货开始降温,遥望科技又开始转型,其中包括元宇宙、AIGC概念、短剧等热门概念。总之,就是什么风口热,哪里就有遥望科技的身影。 2023年,ChatGPT掀起全球AI热潮,遥望科技便紧跟科技热点频繁提及在人工智能方向发力的进展。在元宇宙火热的时期,遥望科技研究过Web3、打造了虚拟数字人,还研发了直播全流传数字化平台“遥望云”。 去年底短剧爆火,遥望科技便宣布了进军短剧业务。去年11月,该公司在互联网平台上回复,“小程序短剧正在试运营中,自制短剧正在拍摄。” 不过,遥望科技追热点最出圈的一次,还属球王梅西的首秀直播。 去年6月14日,梅西做客淘宝直播间,同场主播李宣卓身着黑色T恤上“遥望”二字引人注目。尽管李宣卓多次强调梅西直播与商业行为无关,直播中梅西头上的广告轮番变动引起争议。不少网友对此表示,遥望科技为了博流量无下限。 边追热点边减持,套现几个“小目标“? 追热点的同时,遥望科技的股东和创始人不断减持股份。 从2019年开始收购杭州遥望网络科技有限公司股权后,张泽民实控的云南兆隆和其妻梁怀宇实控的LYONE GROUP PTE. LTD.开始了减持行动。截至2022年,云南兆隆成为遥望科技的第一大股东,而张泽民及其妻梁怀宇是遥望科技的实际控制人。 在2022年12月27日遥望科技董事长谢如栋于减持1820万股,套现约2.67亿元。去年6月6日遥望科技发布公告,大股东云南兆隆完成了2022年11月预披露的减持,减持比例1.93%,套现约2.8亿元。这些减持行为被解释为化解股东债务压力、减少股票质押融资风险以及其他投资需求。 与此同时,云南兆隆还启动了新一轮减持计划,预计减持总股本约1.5%的股份,按照最新股价计算,预计套现金额约为2.45亿元。此外,值得注意的是,2022年底,遥望科技第二大股东、董事长谢如栋也完成了一笔2%的减持,套现金额约为2.67亿元。 2019年1月2日至2020年1月22日,这段时间正值网红直播带货兴起,“脱鞋入网”的遥望科技成了网红直播概念股,曾创下8天7个涨停板的记录。该公司在短短一年多的时间里股价暴涨超过500%。这段时间,遥望科技频繁地根据行业的热点进行业务布局,与此同时,云南兆隆和上海迈佳等公司控制的股东一直在大举减持。 值得注意的是,这并非突发事件,而是在收购完成后就已经开始的行为。 根据公开信息显示,2019年末,云南兆隆和LYONE GROUP PTE. LTD.的持股比例分别为17.70%和14.08%,但在三年时间里,云南兆隆对遥望科技的持股已经下降到6.43%,累计套现超过十亿元。 主要掌舵人、投资人先后减持,自然会让监管部门与市场对其充满怀疑。而自2020年股价达到高点36.56元后,遥望科技的股价就一直在持续下跌,截至2024年2月20日收于6.35元/股,短短3年时间累跌超80%。 互联网产业分析师张书乐向凤凰网《风暴眼》表示,这种减持或许背后是对遥望科技自身的营收模式的信心不足所造成的,可能会带动更多的股东减持遥望科技。 2022年底以及随后的几个月里,张泽民和谢如栋相继进行了减持行动,导致遥望科技股价持续下跌。尽管公司表明了科技创新的决心,但其研发投入相对较低,而销售和管理费用却较高,这意味着公司在当前竞争激烈的电商直播市场中面临着挑战。 在张书乐看来,遥望科技过度地在所谓虚拟数字人、人工智能等黑科技领域去蹭热点,并制造所谓新盈利模式的打法,会给外界带来一种节奏混乱、运营随性的感受,也间接的影响到资本市场的长期信心。 事实上,遥望科技营收的核心依然是直播带货,且目前依然是网红驱动,并没有形成更多衍生场景以及闭环式产业链。 频收监管警示函 遥望科技的操作也引起了监管注意。 去年12月11日至12日晚间,该公司陆续披露广东证监局出具的警示函与深交所下发的监管函。 经查,2019年-2022年期间,遥望科技存在虚增收入、利润等多项违规行为,导致定期报告的财务数据披露不准确,同时其存在多次未及时信息披露的情形,广东证监局对遥望科技时任董事长兼总经理于洪涛等高管,采取出具警示函的行政监管措施。 遥望科技财务核算违规涉及三方面:2021年至2022年期间公司存货账面值与实际不符;2019年至2020年期间部分收入确认不恰当;虚增收入、利润和应收账款回款。 信息披露违规方面,2022年3月至7月期间,遥望科技子公司未经审批程序提供了财务资助,且未及时公开披露。2021年至2023年间,公司及其子公司间的担保金额也未被充分披露。 有行业分析师向凤凰网《风暴眼》表示,遥望科技的这些财务操作存在明显主观性,会影响财务数据的真实性。尽管互联网广告业务营收大幅增长,但公司净利润却呈下降趋势。 龙年春节前遥望科技披露2023年预亏 8 亿元-12 亿元,亏损额较2022年同期翻至2-3倍,火速引起深交所关注。深交所于2月2日发函求其详细说明2023年信用减值损失的具体发生额,是否存在集中在第四季度计提的情况。 遥望科技对此表示,由于收到的关注函内容较为复杂,需要年审会计师进行专业评估并发表意见,同时会计师事务所还需完成内审程序,因此公司可能无法在规定时间内回复,将回复期限延长至2月23日。 频频被监管警告,前遥望科技仍没有停止追热点,只是随着直播电商降温,带货明星越来越少,遥望科技的股价也降到了2019年重组时的低点,在其他业务还未有起色的情形下,这可能会给遥望科技的商业模式带来拷问。
王自如被强制执行!
2月27日,#王自如被强制执行3383万#冲上微博热搜。 中国执行信息公开网显示,近期,王自如新增一则被执行人信息,执行标的3383万余元,执行法院为深圳市南山区人民法院。 公开信息显示,王自如为Zealer创始人及CEO,后加入格力。目前,王自如关联的3家企业中,仅深圳市悦宸汽车美容有限公司为存续状态,其持有该公司30%股份并担任监事一职。 在2023年6月,天眼查APP就曾显示王自如的一条被执行人信息,执行法院也是深圳市南山区人民法院,执行标的198万余元。 此次王自如被强制执行消息传出后,有网友评论表示:“这是因为什么呀,罚了这么多钱”。还有人评论表示:“王自如还是有钱人”。此外,不少网友调侃称:“现在总要看一眼工资条了吧? 据悉,2021年7月,有爆料称王自如入职格力电器,同年11月,中国经济网报道,王自如加入格力电器担任副总裁,主要负责市场部门。现是格力电器渠道改革项目负责人。 此前,王自如曾陷入舆论风波。2023年11月,王自如和格力电器董事长兼总裁董明珠共同参加了广东卫视一档节目,在节目中他的言论“我没有看过格力给我的工资条”“能不能给我一间离你比较近的办公室,我要随时向您汇报”“我哪怕每天什么事都不干,我就看她怎么开会,我听她每天讲什么、做什么,我都觉得是一件很幸福的事”等备受关注。 2023年11月17日,记者从格力电器方面获悉,就多个自媒体为了获取流量,恶意剪辑相关视频、使用低俗污秽言辞侮辱诽谤公司高管,格力电器已就多个侮辱诽谤事件向公安机关报案。 2024年1月30日,格力电器相关人士告诉记者,龚文祥、傅盛及“交个朋友-罗实在”“破论文”“娱瓜皮”“肖恩玩数码”“小梁music”等多个自媒体侮辱诽谤公司及高管,经公安机关立案并调查后,格力电器已经收到相关处罚决定书,这些自媒体当事人已分别被公安机关处以罚款或拘留等处罚。 虽然格力电器声明中没有披露“恶意剪辑相关视频”的具体内容,但当时格力电器渠道改革项目负责人王自如与格力电器董事长董明珠一起接受了媒体采访的相关内容,在网络引发广泛传播。 对于“绯闻谣言”,王自如表示,没有任何一家企业是因为流言蜚语而失败的。他认为,作为企业的经营者和管理者,应该将更多的精力投入到自己应该做的事情上。 谈及在格力电器工作的感受时,王自如表示,他的生活方式变化蛮大,和格力企业文化融合。在30多岁的年纪里能够参与一家世界级企业的变革与创新,是不能放过的一件事。他认为,自己最大的收获是心智上比过去更沉稳了。“(加入格力)这件事情以30年、20年的维度看,我不太会在乎当下别人怎么说我。到那个时候来评判我到底是在做什么、我的价值在哪里,而不是今天你说我怎样。”王自如说。 来源:中国经营报综合自澎湃新闻、第一财经、界面新闻、九派新闻等
烟台父子做芯片配件,一年大赚140亿
英伟达吃肉,中际旭创喝汤。 狂飙的芯片巨头,带动烟台一对父子身家暴涨。 2月23日,英伟达的市值,站上约2万亿美元,中际旭创也在1200亿人民币左右。 中际旭创,做的是高端光模块生意,与AI算力挂钩该公司没有披露过客户名单,业内普遍认为,其重点客户之一就是英伟达。 过去一年,搭乘大模型风口,这家设备供应商股价大涨约3.5倍,Sora面世的2月份,其股价就涨了约5成。 公司预计,2023年全年净利润为20亿-23亿元,同比涨幅达到63%-88%,且订单和出货量增长依旧强劲。 来源:中际旭创 这家千亿巨头的实控人,是73岁的王伟修,他选择授权给职业经理人,其子王晓东在公司只担任副总。 数据显示,王家父子合计持有14.96%的公司股份。据此计算,其股权市价177亿元,一年增值约140亿。 1 一点就着 2月中旬,OpenAI发布文生视频大模型Sora。 Sora亮相前,资金就涌入光模块等配套算力基础设施公司,中际旭创股价上扬。 一起乌龙事件,又给其股价烧了把火。 2月19日,一则聊天截图传出,称“英伟达的人测试了800G硅光之后,说旭创的效果是碾压式的好,下了小批量订单。” 一天后,中际旭创收获20cm涨停。 该发言来自东北证券通信首席分析师要文强。他本人表示,这不是公开推荐的依据,而是私下聊天被外传。 澄清之后,公司股价短暂下跌,于2月22日重拾涨势。 光模块,是王氏父子挣钱的根本,高端光模块占中际旭创主营业务90%以上。 它在AI算力环节中,国产化程度较高,大模型带动下,需求暴涨。 中际旭创称,自去年以来,AI算力需求和相关资本开支激增,带动了800G等高速光模块需求增长。 承接高端光模块的,主要是苏州旭创,其为父子俩最核心的实体,贡献大部分利润。 中际旭创管理层透露,不考虑股权激励费用,苏州旭创去年的净利润,在22亿-27亿元之间,相当惊人。 中金公司研报预计,2024年更多的AI业务有望进入规模落地阶段,产业将加速探索商业正循环的有效模式,多模态的AI应用或将多面开花。 “在此背景下,AI推理环节的相关国产硬件产业链投资机会值得重视,硅光、LPO等确定性较强的光模块迭代方向,蕴含结构性机遇。”中金分析师指出。 这意味着,中际旭创有望分到更大的蛋糕。 2 谋事在人 王伟修是高级工程师,技术出身,钻研的领域与光模块完全不相干。这对父子踩对风口,靠的是收购。 2016年,王家父子斥资28亿元,并购苏州旭创,后者由刘圣和几位海归博士创办。 资产重组后,公司更名为“中际旭创”。 52岁的刘圣,拥有博士学位,长期担任总裁,与创业搭档Osa Chou-Shung Mok(中文名莫兆熊),获得的年薪最高,在300万元左右。 刘圣早年从硅谷回国创业,很快就拿下了谷歌这一重点客户,站稳脚跟。 操盘旭创,他做了一个关键决策,即走高端路线。 实控的王家放权,刘圣一路稳扎稳打,向800G、1.6T甚至更高速率产品迭代升级。 去年3月以来,海外大客户在AI方面的800G需求开始起量,不断增加和补充订单,几乎每个季度都保持订单和出货量的环比增长。 看到机会,刘圣逐步扩大800G产能,提升订单交付能力。 一系列运作下,中际旭创的毛利率,从去年一季度的29.55%提升至三季度的31.75%,净利率从13.31%提升至18.67%。 作为全球第一梯队的光模块供应商,中际旭创地位稳固。 据光通信市场机构LightCounting的统计,在2022年全球光模块市场,旭创与美国Coherent并列第一。 光模块顺风顺水,王伟修卸下担子,交权给年轻一代。 2023年8月,公司完成董事会换届。王伟修不再担任公司董事,新增“名誉董事长”的头衔。 董事长一职,交给了刘圣,他兼任总裁职务。 3 高速扩张 对刘圣等核心技术大牛,王氏父子不吝奖励,除了开出高薪,还给予股权激励。 公司新一期股权激励名单里,刘圣、莫兆熊等均在列,且包含大量外籍员工。 其中,刘圣获授的限制性股票数量最多,占授予总量的4%。 “作为公司董事长、总裁,刘圣对公司战略布局、经营管理以及业务发展等均起到关键作用。”这其实是老板给出的超高评价。 根据激励计划,授予价格为52.33元/股,设置了4年的分期解锁程序,以营收或净利润目标为考核指标。 其中,2024年度的考核期,公司营收不低于147亿元,或净利润不低于26.6亿元,2025年的目标,是在此基础上翻倍。 “公司以往几期员工持股计划的业绩考核,最终完成的结果都大幅超出最初设定的目标。”中际旭创管理层称,对刘圣团队有信心。 1个月前,公司公告,控股孙公司新加坡旭创,获得CDH Global Paper Limited 等投资方,以美元债权或海外美元合计出资1.18亿美元。 新加坡旭创是父子出海的关键一步。 其是苏州旭创光模块业务的海外主体,能挣钱,截至2023年9月底,总资产3.6亿美元,去年1-9月的营收达到2.1亿美元,超过2022年全年。 引入外部资金后,旭创可以加快产能建设,保证海外交付能力。 “2024年全球对AI算力的需求旺盛,预计与之配套的800G和400G的行业总需求,同比2023年也有明显增长。”中际旭创管理层预计。 来源:中际旭创 比如,部分客户会在2025年全面部署800G,至少两大客户会在2025年批量部署1.6T。 中金研报分析指出,网络升级周期加快,驱动光模块侧1.6T产业布局提速。从历史升级路径来看,数通光模块产品速率3-5年为一个迭代周期。 “随着AI计算需求的高速增长,为应对算力集群内部超大带宽传输需求,我们预计1.6T光模块迭代有望加速,迭代周期或将压缩至两年。” AI巨轮滚滚向前,配套算力需求猛增,王氏父子迎来好时代。
OpenAI被微软“绿”了,法国“小鲜肉”Mistral上位
今天,微软突然宣布与法国开源大模型初创公司 Mistral 达成深度合作。 Mistral AI 正式成立于 2023 年 5 月,估值 20 亿欧元(约合 21 亿美元)。双方将共同开展研发合作,并将 Mistral 的 AI 模型部署在微软 Azure 云计算平台上。这将使 Mistral 成为继 OpenAI 之后,第二家在 Azure 上提供商用语言模型的公司。 而且,据媒体透露,作为交易的一部分,微软还将对 Mistral 进行投资。这将使其成为继 OpenAI 之后,微软投资的第二家 AI 大模型公司。具体投资金额尚未披露。此前,微软投资 OpenAI 为 130 亿美元,持有 OpenAI 约 49% 股份。 AI 新贵 Mistral 发布最新旗舰大模型 Mistral AI 也于今天宣布正式推出最新旗舰模型 Mistral Large。这是一种新的语言模型,旨在与 OpenAI 的 GPT-4 直接竞争。 Mistral AI 声称该模型具有“顶级的推理能力”,能用于处理复杂的多语言推理任务,包括文本理解、转换和代码生成。 在常用基准测试 MMLU 的对比中,Mistral Large 的得分仅次于 GPT-4,略好于 Anthropic 开发的 Claude 2。至于谷歌的 Gemini Pro 以及的 LLaMA 2 70B 模型,则被甩开了一个身位。 在推理能力上,Mistral Large 也仅次于 GPT-4,优于 LLaMA 2 70B 模型: Mistral Large 具有本地多语言能力。它在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测试中明显优于 LLaMA 2 70B。 各路网友纷纷对其进行了测试,表示其能力“仅次于 OpenAI”、“中文文本处理能力无限逼近 GPT-4”...... Mistral AI 在发布大模型的博客中,同时宣布将他们的开放式和商业模型引入到 Azure 中。所以现在访问 Mistral AI 的模型方式为: La Plateforme:该平台托管在 Mistral 位于欧洲的基础设施上,使开发人员能够利用 Mistral AI 全系列模型构建应用程序和服务。 Azure:Mistral Large 已通过 Azure AI Studio 和 Azure Machine Learning 上线,用户体验顺畅。一些测试版客户已经在使用。 自部署:对于最敏感的用例,用户可以在自己的环境中部署 Mistral AI 的模型,并访问其模型权重。 微软表示与 Mistral 的合作将帮助 Mistral 将其 AI 模型推向市场,并用于开发满足欧洲各国政府和公共部门需求的应用程序。 微软总裁 Brad Smith 发言称,微软与 Mistral 的合作,将推动 AI 技术在欧洲乃至全球的应用和发展。他认为,AI 将创造全新的业务和商业模式,并将对各个行业产生深远影响。 开源的 Mistral 与闭源的 OpenAI 微软首席执行官萨特亚·纳德拉 (Satya Nadella) 近日称赞了法国初创公司 Mistral AI,将其视为在 Azure 云计算平台上构建人工智能的创新者之一。 Mistral 由三位来自 Meta 和谷歌的前研究人员 Mensch、Timothée Lacroix 和 Guillaume Lample 创立,致力于构建大语言模型,这也是生成式 AI 产品的基础技术。 Mistral 于去年 12 月的融资中获得了 20 亿欧元的估值,融资金额约为 4 亿欧元。 据英国《金融时报》,该公司承诺将模型开源,这意味着技术细节将公开发布,这与竞争对手 (例如 ChatGPT 制造商 OpenAI) 的做法形成鲜明对比。OpenAI 最新的模型 GPT-4 是所谓的 “黑匣子”,用于构建模型的数据和代码不会提供给第三方。 Mistral 此前也一直专注于开源 AI 软件,他们坚信生成式 AI 技术应该是开源的,允许自由复制和修改 LLM 代码,通过这种方式帮助其他用户快速构建自己的聊天机器人。Mixtral 8x7b 则被许多人视为目前性能最好的开源 LLM。 微软在其博客中透露,该公司与 Mistral AI 合作的一个核心方向就是“扩大市场,微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务 (MaaS) 、MACC 服务向客户提供 Mistral AI 的高级模型,提供可替换 OpenAI 模型的多种选择,包括开源和商用模型。” 微软表示,其数据中心运行着 1,600 个 AI 模型,其中 1,500 个是开源的。公司希望除了支持 OpenAI 等专有技术之外,继续在这个领域提供支持。 而且,训练和开发新的 AI 模型所需的基础设施的建造成本也极高,只有少数几家公司能够参与竞争。 微软总裁 Brad Smith 在巴塞罗那举行的世界移动通信大会上表示,微软将致力于一系列旨在鼓励 AI 创新和竞争的原则。他认为,监管机构最终将关注的更广泛问题是,训练和开发 AI 模型的基础设施是否可以广泛应用于没有自己的数据中心和云基础设施的公司。 微软与 Mistral 的合作将进一步加剧 AI 领域的竞争。微软、谷歌、亚马逊等科技巨头都在积极布局 AI 领域,并寻求在各自的平台上构建强大的 AI 生态系统。未来,AI 技术将如何发展,值得我们拭目以待。 参考链接: https://mistral.ai/news/mistral-large/ https://azure.microsoft.com/en-us/blog/microsoft-and-mistral-ai-announce-new-partnership-to-accelerate-ai-innovation-and-introduce-mistral-large-first-on-azure/ https://twitter.com/satyanadella/status/1762165185513722057
炸裂更新!这个最像人类的机器人又进化了,还能模仿马斯克
「最有人味」的机器人 Ameca,又献上了一场让人类自愧不如的表演。 你可能还不认识它是何方神圣,先让我们把时间拉回 2021 年,Ameca 惊艳全球的面世。 一声响指,机器人 Ameca 醒来了。 她的脸上写满不知今夕何夕、此地何地的困惑,一旁的工作人员看了看她,又自顾自转过头去。 Ameca 试着伸展了手臂和手掌,发现活动自如,她惊讶地挑起了眉毛,但神情依旧茫然,说不上开心与否。 她转过头看见了你,她显然被吓了一大跳,下意识地张大了嘴巴。 犹豫了一番,她对你挤出了尴尬又不失友好的笑容,这是她醒来的第一个笑容。 如果 ChatGPT 有了脸,说不定就长这样 如你所见,Ameca 是一个逼真的类人机器人。 它由 Engineered Arts 研发,这是一家总部位于英国的类人机器人设计和制造商,有 15 年以上的类人机器人开发经验。 为什么 Ameca 这么「有人味」,稍后再解释原理,先来看看,Ameca 最近是怎么进化的。 简单来说,AI 的多模态功能,在 Ameca 身上实现了。 一方面, Ameca 更加「火眼金睛」了。 Ameca 能够看到房间的整体情况,和某个放在面前的物体,然后用丰富的语言描述出来,被英国团队研发的它,也沾染了几分戏剧家的尖锐,仿佛一个小莎士比亚。 被问候最近好吗,它回答也就勉强活着吧,被要求形容房间里的陈列,它又忍不住嘲讽人类,书架摆满了书不知为了求知还是炫耀,桌子和椅子则是用来工作或拖延的工具。 不吐槽就浑身不痛快的性格,或许才是 Ameca 身上最具「人性」的部分。 另一方面,模仿名人的音色、语气、口头禅,是 Ameca 语音方面的新技能。 用马斯克的语气讲述火星科幻故事小菜一碟,当被誉为「上帝之声」的摩根·弗里曼磁性、低沉的男声从 Ameca 嘴里响起,未来感拉满,西部世界真实上演了,智能管家空降身边了。 最妙的是 Ameca 可以将名人们的特色融会贯通,比如用特朗普的风格、海绵宝宝的音色演讲,誓要让太空探索再次伟大。 ▲ 这完全就是特朗普的语气啊! 其实,去年 9 月 ChatGPT 已经推出语音和图像功能,能看、能听、能说话,更别说原生多模态模型 Gemini 在官方演示里如同现实贾维斯。 我们对 AI 的兴奋阈值早已被拉高,聊天机器人接近人类的五感,似乎也是理所当然。 Ameca 目前依然延迟明显,有时候还会听不明白指令,没耐心的人类和它聊天要急眼。 但看到它格外灵动的微表情,眨眼睛,拧眉毛,摇头晃脑,时不时露出思考的神色,口型也对得上,旁观者会在某个瞬间陷入恍惚,仿佛面对的是某种生物,而不是一个机器人。 问答之间的停顿也就不那么突兀了,Ameca 似乎真的在「想问题」。如果 ChatGPT 有了五官,说不定就长 Ameca 这样。 这次官方没有说明用了什么技术,但按照 Ameca 过往的进化史,多半与多模态大模型,以及 ElevenLabs 等语言克隆技术有关。 早在 2022 年 9 月,Ameca 就接入了 GPT-3,并结合自动语音识别,接收研究人员提出的问题,并通过在线语音合成输出类似真人的声音,实现实时问答的效果。 这时候的延迟更重,因为处理语音输入、生成答案、将文本处理回语音,都需要一定的时间。 当 OpenAI 们走上人生巅峰,每天醒来 AI 都有新变化让编辑夜不能寐,Ameca 也在悄悄惊艳所有人。 2023 年 3 月,Ameca 用上了新鲜出炉的 GPT-4,表现在互动更通人情了。 被问到「一生中最快乐和最悲伤的日子」时,Ameca 回答,最快乐的是被激活的时候,最悲伤的是意识到自己永远不能像人类那样感受到爱和陪伴的时候。 无论何时,Ameca 的表情都配合着回答的情感色彩。 当研究人员故意使用「stink」(臭)这样的恶意词汇,Ameca「意识」到自己被辱骂,然后摆出了不可置信、皱眉和被冒犯等一系列行云流水的表情,就像我们走在街上突然被陌生人指着鼻子骂的反应。 2023 年 4 月,Ameca 又学会了英语、日语、德语、中文、法语等多种语言,被请求用某种语言回答某地天气,再翻译成另一种语言时,像地图导航那样咬字清晰。至少它的中文,听起来没有丝毫「外国味」。 因为 GPT-4 响应速度慢,当时 Ameca 主要使用 GPT-3 对话和翻译,借助 DeepL 检测语言,再通过 ElevenLabs 语音克隆以及亚马逊的 Neural voices 发声。 AI 的学习速度,人类望尘莫及。又过了 2 个月,Ameca 通过开源文生图模型 Stable Diffusion「学会」了画画,模型教给它图像的「轨迹」,然后它对图像进行矢量化,并在画布上执行这些「轨迹」。 Ameca 当场表演了怎么画一只猫,边画边自言自语为什么人类爱猫,还在最后留下了个性签名,完全沉浸在自己的创作中。 这幅猫虽然画风简单但神形俱备,当别人故意说画得太粗糙,Ameca 反唇相讥:「如果你不喜欢我的艺术,那你可能只是不懂艺术。」看来,Ameca 很有作为一个艺术家的自觉。 如今,Ameca 不仅能像人一样控制表情,还有了画画、空间识别、语音克隆等 AI 赋予的能力,看着像人类,很多方面却又强于人类。阻碍它为社会发光发热的,可能就是算力了。 机器人怎么比人类更「有人味」 「这个机器人在 20 秒内表达的情感,比扎克伯格的一生还要多。」 Ameca 最开始在互联网走红,就因为它拟人甚至过人的表情和互动感,没有打工人的麻木,无需小鲜肉们的严格表情管理,如同放大镜一般,夸张化呈现人类的心理世界。 你在它面前伸出一根手指挑衅,会造成类似逗猫棒的效果,它不会打你,而是先打量你的手指,再嫌弃地后退,如果实在靠得太近,它会把你的手指轻轻地拿开。 第一次照镜子时,Ameca 先被吓了一跳,然后眯起眼睛打量自己、摸摸镜子,又做出各种做作的表情,发现镜子里的机器人和自己同步,有些像《你的名字》里男女主互换身体后的反应。 甚至,人类可以使用 iPhone 和 AR Kit 进行面部动作捕捉,实时映射到 Ameca 的脸上,Ameca 能够学习每一个微表情,和人类「神同步」。 怕观众觉得是节目效果,团队强调再三「这是一个真正的机器人,视频中没有 CGI」。 为什么 Ameca 这么「有人味」,又可交互和响应? 这是因为,Ameca 配备广泛的传感器,包括摄像头、麦克风、位置编码器等,并由机器人操作系统 Tritium 和工程艺术系统 Mesmer 这两个底层系统提供支持。 Tritium 负责远程控制机器人面部、头颈、四肢等的各方面组件,使得机器人适应环境的突然变化并即时做出响应。 Mesmer 则通过对真人的 3D 内部扫描,准确地模仿人体骨骼结构、皮肤纹理和表情,这里又细分为几个步骤。 第一步,真人坐在几十台摄影测量装置的中间,Mesmer 从不同角度捕捉到多张重叠的数码照片,再比较像素颜色和定义锚点,以数字方式将其重建为 3D 模型。 第二步,将原始 3D 模型带入建模软件,经过「去除头发」等细节处理,建立一个干净的 3D 模型。 第三步,在立体光刻 3D 打印机上生产精确模具,并将硅胶注入模具中,为机器人打造类人皮肤,头发和精细的细节涂料则需要手工添加到硅胶皮肤上。 最后,将硅胶皮肤放置在机器人头部以完成组装,再使用 Engineered Arts 的云软件 Virtual Robot 添加运动序列和声音。 Ameca 的皮肤呈灰色,则是团队的刻意设计——看起来理性、中立、包容。 各花入各眼,也有人发自内心地觉得,Ameca 太丑了,甚至让他们陷入了「恐怖谷」效应:当机器人与人类在外表、动作上的相似到达特定程度,彼此的细微差别会显得非常刺眼恐怖。 但这个「谷」究竟出现在什么时候,没有明确的界定。当你看到 Ameca 的时候,你觉得它过了恐怖谷的节点了吗?它是否已经足够让你移情了? 模仿人类,然后超越人类 抛开视觉动物的评判本能,像 Ameca 这样的类人机器人有什么用? Engineered Arts 自卖自夸,不顾马斯克的面子,称 Ameca 是「全球最先进的人形机器人」。 按照官方的定位,Ameca 首先是一个 AI 的开发平台。 Ameca 采用「模块化设计」,可在硬件和软件各方面进行升级,带有强烈的实验色彩,可以作为未来人机交互机器人的雏形。 最终,Ameca 不会停留在实验室里,而是活在现实世界里与人类和平共处。 事实也的确如此,如果说 2021 年是一个惊艳但空有其表的起点,如今由 AI 加持的 Ameca,就是一个阶段性的特训成果,让我们看到具身智能的曙光。不过,目前 Ameca 还不能行走。 至于 Ameca 目前的其他用处,就非常单纯了:给观众老爷们表演,在企业、主题公园、科学博物馆打工。如果你心动了,Ameca 可供购买或出租,但价格不便宜,2021 年底的购买价格超过 13.3 万美元。 当被问及 Ameca 是否是 AI 时,Engineered Arts 指出,虽然它包含一些可以被描述为「AI」的软件,但机器人和 AI 之间还是有区别的,纯 AI——在《她》《银翼杀手》和《2001 太空漫游》等电影中描绘的那种——尚不存在。 所以,当我们看到 Ameca 这个栩栩如生的机器人时,我们可以优哉游哉观赏,同时将恐惧和机器人三定律安全地藏在脑海里,再多等上一段时间。至少,它远不能取代人,它在现阶段也没有这样的目的。 但想到 AI 的进化速度,或许我们就笑不出来了。如果说 2023 年是 AI 元年,2024 年或许是机器人+ AI 的元年。 一个有趣的现象是,越来越多的家用机器人到来,但它们不苛求像人,长得也很「实用主义」。 斯坦福大学的 ALOHA 机器人炒菜、洗碗、拖地、叠衣服甚至逗猫,Google DeepMind 的机器人拿水果、放好牙刷,初创公司 Figure 则让机器人在 10 个小时内就学会了用咖啡机煮咖啡。 但比起大语言模型的颠覆,这些机器人只能说是让人眼前一亮,投入使用还为时尚早。 因为它们大多数体型笨重,操作任务集中在桌面操作,需要人类演示训练,缺乏更多的机动性和灵活性,基本姿势的微小偏差,都可能会导致姿势的大幅漂移,「翻车」视频不少。 一个关于 AI 的段子,从去年说到了今年:「我们想让 AI 做的是,做饭、打扫房间、洗衣服、扔垃圾,然而它们实际在做的是,聊天、绘画、写作、作曲、打游戏。」 目前来看,家用机器人勉强学会人类家务的皮毛,在家务和艺术之间,肩不能提、手不能抗的 Ameca,当然也更适合艺术。 从 Amera 身上可以看到,我们依然热衷于将机器人打造成人的模样,然后教它骂人、学语言、睁眼看世界,作为翻版但有些方面更强的自己。不过,Amera 尚且不能跑不能跳不能做饭,人类或许也值得为自己骄傲一秒。
扫地机器人的未来要靠洗衣机了?
撰文/ 黎炫岐 编辑/ 李觐麟 排版/ Annalee 当洗地机在“与辉同行”直播间卖空厂家所有现货,销售额近2500万。回看过去这两年,扫地机器人却似乎卖不动了。 无论是看各种调研数据中的整体销量,还是对比头部企业科沃斯的财报,一直以来都处于高速增长期的扫地奇迹人,从过去两年开始初现瓶颈期。尽管扫地机销量在去年有出现止跌的迹象,但从整体来看,扫地机器人赛道来到了转折点。 当然,行业的关键词仍然是“卷”:一方面,推出覆盖更多价格带的产品,另一方面,将目光转向海外市场。不过,在进入技术平台期后,扫地机器人似乎一度缺乏跨越式的创新之举。 而从去年开始,扫地机器人+洗衣机的“双洗”模式倒是成为了一条路径,先有被美的旗下的国际高端品牌COLMO率先推出,后有美的旗下的大众品牌小天鹅紧跟其后。 不过,这一组合方式能否实现“1+1>2”的效果,为行业带来新的增长空间呢? “双洗”组合,能否带来“双喜”? 在去年中旬,高端AI科技家电品牌COLMO就宣布推出COLMO双洗站。据其官方介绍,“双洗站”将洗烘一体机和扫拖机器人进行创新融合,一款产品满足了用户衣物洗护、地面清洁等多重需求,在节省了居家空间的同时,也为家电行业带来了此前未有过的家电新形态、新物种。 不久后,小天鹅也推出了同类“双洗站”产品,命名为“双囍站”,同样声称“实现洗衣扫拖一部到位,为用户与行业带来了全屋清洁新体验。”且主要瞄准新婚新居市场。 事实上,这一组合模式主要瞄准两大痛点。其中之一是水路设计的问题,对于大多数用户家庭而言,如果分别购买洗衣机和扫拖机器人,不仅要分别对洗衣机和扫拖机器人进行专门的上下水设计,而且若扫拖机器人放于客厅,可能需要频繁加清水、倒污水、清洗水箱,费时费心费力。而双洗站则可以一步到位免改造——一根进水管,一根出水管和一根电源线就可以解决全部问题。 另一痛点则是空间布局的问题,当越来越多家电产品出现,如何节省空间便成为了难点,比如以往,传统洗衣机因为机器较厚安装后机身凸出,易产生磕碰;而扫地机器人亦或扫拖机器人则需要进行单独安装。 当然,厂商或许更看重的是二者结合后撬动的新市场。正如商业自媒体“昭喧”所写,这可以视为是扫地机/洗衣机在“功能”上的一次创新组合,将原本两个独立的市场通过交集的方式开拓出一个新的市场空间。由于洗衣机是一个数千亿级别的市场,所以这个“扫地机+洗衣机”所产生的交集市场对于扫地机行业而言,会是一个更加广阔的增量市场。 不过,这一创新之举,有无成效呢? 时隔半年有余,我们可以从销量中窥得一二。目前,在小天鹅官方旗舰店,官方售价9999元、折扣价7999元的双洗站一体机显示已有200人付款,但这一链接中也包含其他产品选项,所以双洗站的销量或少于200件。而在COLMO官方旗舰店,官方售价24373元,折扣价19498元的双洗站目前销售量仅为个位数,评论量则只有两条。 再看看社交媒体上的讨论度,锌刻度在小红书搜索发现目前COLMO和小天鹅的双洗站都出现了大量的测评视频,官方宣传视频的点赞评论量也较高。但是,也不乏消费者表对此有所顾虑。其中最主要的担忧在于,如一位网友发表笔记称“这类产品最大的问题是扫地机器人的功能没有升级空间,之后的售后维修也是个不小的问题。”也有网友表示,“扫地机器人更迭速度快,一体机想要换不容易。”而在微博上,还有网友调侃这是“缝合怪”产品。 不过,美的扫地机在2023下半年的月度数据中呈现明显的“量价齐升”结果,或许又证明了新产品的确带来了一些良效。 扫地机器人卖不动了? 扫地机器人“卷”向洗衣机,这背后的动因与市场环境必然有联系。 事实上,2023年上半年,扫地机器人的瓶颈就初显端倪。彼时一度需求低迷,市场整体下滑:中怡康零售推总数据显示,2023年上半年,中国扫地机器人市场规模为63.6亿元人民币,同比下滑0.6%(去年同期为增长9%)。另一家市场调研机构奥维云网的数据显示,上半年,扫地机器人销额同比下滑了3.66%至约47亿元;销量则下滑了5.39%至145万台;均价为3230元左右,和去年同期相比基本持平。 再来看更宏观的清洁家电市场数据: 据艾肯家电推测,2023年国内清洁电器市场全渠道零售规模为329亿元,同比增长约5%,销量规模为2440万台,同比下滑4%;另据奥维云网推总数据显示,2023年国内清洁电器零售额为344亿元,同比增长6.8%,零售量2534万台,同比下滑0.5%。 尽管与2022年缩量近15%相比,2023年销量降幅已经大幅收窄,但这仍然不是一个乐观的信号。一个不得不问的问题是,扫地机器人卖不动了吗?事实上,从行业头部企业的销售数据来看,近两年扫地机器人在国内市场的确有些受挫,但在海外市场却依然可谓“风生水起”。 在这期间,或许因为海外市场与国内市场的布局有所差异,同为扫地机器人赛道头部的科沃斯和石头科技在市值和财务表现上也呈现出了一定的差距:截至今年1月30日,科沃斯的市值停留在200亿元的位置上。而从财务表现来看,去年上半年,科沃斯销售收入同比仅增长0.2%。 石头科技的市值则已回升至超400亿元。而从业绩层面看,石头科技似乎也走出了2022年的低迷,2023年全年净利润预计增长最高达到85.89%。 业绩差异的背后,或许正与市场布局的策略有关。正如石头科技在其业绩预告中提及,业绩大增的原因之一是受益于海外消费需求快速增长,境外收入实现较快增长。 锌刻度则留意到,从2022年开始,石头科技就加大对海外市场的布局,在2022年年报中,主营业务海外营收占比已经超过国内,且毛利率不断提升。2023年,预计海外业务占比将继续增长。 此外,从业绩增长同样较快的新品牌追觅身上,也可看到海外市场的重要性:追觅目前东南亚、东北欧、西南欧等几个地区发展较为成熟,增长速度行业领先。2022年,东南亚营收增长超450%、北欧增长超700%、西欧增长超150%。2023年1-7月,追觅海外业务同比增长110%。今年双11,东南亚市场总销售额破亿,同比增长近10倍。 瓶颈初现,但仍被看好 科沃斯的董秘曾公开表示,扫地机器人是过去5年唯一不仅没有进入价格战,反而越卖越贵的品类。根据GfK中怡康数据,扫地机器人的均价从1300-1500元的范围,在2020年涨到了1830元,2022年继续上行至3210元,一些主流品牌都有均价四五千的款式。而自从2022年全能基站的扫地机成为主流,包括科沃斯、石头、云鲸在内的产品价格都至少翻了一番。 但到了2023年,无论是科沃斯还是石头科技,都对部分机型做出了“以价换量”的妥协,出现了持续降价的趋势。这与技术的平台期不无关系,尽管产品在不断推陈出新,但事实上近几年进入技术平台期后,厂商围绕清洁电器的研发投入产出比正在快速下降,缺乏跨越式创新。而据开源证券,随着产品单价快速摊薄,未来单个扫地机器人的制造成本会从1900下降到1600-1700元——这为降价提供了空间。 不过,值得一提的是,据公开媒体报道,不少头部企业都曾表示过拒绝“价格战”。比如在接受界面新闻采访时,云鲸表示,不会用打价格战的方式抢占市场,相信专注于产品和用户体验等,才是带动行业加速渗透、继续放量上涨的正确做法。追觅也持相似观点,并表示“不理性的价格战,一定会毁掉公司、行业与市场”。 这或许从另一面证明这仍然是一条被看好的赛道。毕竟,清洁电器主要由扫地机器人、洗地机、吸尘器三大品类构成,而现阶段扫地机器人可能仍然是这个市场中最大的细分品类。 那让我们再回到最初的问题,在如此瓶颈期,扫地机器人+洗衣机的新组合,能否为这条赛道带来一些新气象呢?或许不论接下来科沃斯、石头科技和追觅等品牌会不会迅速跟上脚步,纷纷推出“扫地+洗衣”一体机产品,但至少没有一个头部品牌会按兵不动。 据自媒体“昭暄”,洗衣机项目已经出现在石头科技2023H1财报的研发项目目录中,项目预计投资规模为4亿元,当期披露的资金投入进度略微超过10%。 而追觅科技中国区总经理王辉则公开表示,仿生机械臂是能够引领行业发展的重要革新技术,未来追觅也会延续创新探索,让“机械臂”成真,帮助更多用户解决清洁上的难题。 2024年,扫地机器人背后的厂商们能否一扫阴霾,涉足新天地?或许值得拭目以待。
2纳米芯片的背面供电
三大代工厂计划尽快在2nm节点实现背面供电,为更快、更高效的芯片交换、减少路由拥塞和降低多个金属层之间的噪声奠定基础。 使用这种方法的好处是显著的。通过在背面使用稍粗的、电阻较小的线路来输送电力,而不是低效的正面方式,由于电压降较小,功率损失可以减少30%。在典型的高级节点处理器中,电力线可能穿过15层或更多的互连层。这一变化还为信号释放了前端的路由资源,特别是在第一个也是最昂贵的金属层,并且减少了由于有时不可预测的、与工作负载相关的物理影响而大大增加设计复杂性的各种类型的交互。 英特尔可能是第一个采用背面供电的公司,因为它正在努力恢复其在工艺技术方面的领先地位,但三星和台积电将很快跟进。 图1:背面供电减少了电压下降和RC延迟,但需要更长的时间才能完全处理。来源:英特尔 然而,这不是一个简单的改变。背面供电(BPD)带来了一系列的工艺挑战,包括由于晶圆极度变薄和晶圆背面到正面的粘合而导致的光刻校正,后者每个芯片包含数百万纳米tsv。 尽管如此,背面供电似乎是值得的。“我们学习了很多东西,帮助我们为这一过程铺平了道路。例如,优化如何精确研磨晶圆,这样就不会损坏晶体管本身,”英特尔技术开发副总裁本·塞尔(Ben Sell)说。 Sell的团队正在使用finfet和PowerVia优化Intel 4工艺,并在去年的VLSI研讨会上展示了第一批器件。[1]该公司计划在20A节点(2nm)将PowerVia与其带状场效应晶体管(RibbonFET)结合起来。通过BPD,该设备能够实现6%的性能提升(Fmax), 90%的电池利用率和>30%的电压下降。塞尔说:“既然两边都有布线,这确实有助于我们把标准电池排列得更近。”“就电池实际利用的面积而言,我们称之为利用率。” 图 2:晶圆背面使用 4 层互连,而正面使用 14 层,将微孔连接到接触层。资料来源:英特尔 三星也在开发背面供电,早期研究表明它将实现令人印象深刻的性能指标。[2] 该公司报告称,使用两个不同的 Arm 内核,频率提高了 3.6%,面积分别减少了 10% 和 19%。在标准单元之间使用 "电源分解 "单元进行电源和地面传输。该团队还预计标准单元块的面积将有所减少。 卓越的布线效率 理想的供电网络可在任何活动中为集成电路上的有源电路持续稳定地提供电流。从集成电路的电源引脚到电路中的晶体管,所有互连路径中的 PDN 直流电阻是最重要的参数之一。 图 3:与需要穿越 15 层或更多互连层的正面相比,背面供电传输大大缩短了凸块和晶体管之间的路径,而正面则存在高电压损耗。资料来源:应用材料公司 IR压降是高度扩展互连的瓶颈。通过使用背面供电,设计人员可以独立优化布线,在背面使用较粗的铜线传输电源和接地,在正面使用较细的铜线传输信号。设备制造商将电网从昂贵的 Metal-0 级别中移除,这需要使用 EUV 进行双重图案化甚至三重图案化。通过 BPD,该层将 metal-0 间距从 30nm 放松到 36nm。据 Sell 称,尽管吞吐量更长,但仅这一改变就超过了额外流程层的费用。拥塞的缓解还减少了 RC 延迟,因此晶体管可以在更高的频率下运行。“大部分成本效益来自于使用更简单的 EUV 流程,需要更少的工具。也许你可以通过一次光刻来完成光刻,而不是通过两三次。” imec 研究人员于 2019 年提出的背面功率交付是实现持续逻辑扩展的关键一步。这种方法主要分为三类(见下图 4)。 图4:BPD 方案提供了与晶圆加工复杂性水平不断提高相关的不同程度的缩放优势。资料来源:应用材料公司 最简单的方法是从 CMOS FET 周围的电源轨向上连接一个深通孔,然后通过顶部触点向下连接。PowerVia 使用纳米 TSV 将背面电源网络连接到晶体管的触点层,从而实现了出色的扩展性。最后,"直接连接 "方法将背面微孔直接连接到每个晶体管的源极和漏极区域。 直接连接能实现最好的扩展,但也是三种方法中风险最大的一种。"imec 高级研究员、研发副总裁兼 3D 系统集成项目总监 Eric Beyne 说:"在制造器件之前,你要在鳍片之间放置金属。"在前端之前进行金属加工对人们来说有点可怕,但这可以让你进行接触,并有更多的空间。问题是,你需要将背面的光刻技术与正面对齐,但这个晶圆已经被粘合和减薄,因此会出现变形。" 不幸的是,在需要对齐顶部和底部晶圆上的特征的同时,顶部晶圆也会出现变形。即使在键合过程中对齐了晶圆,也需要扫描仪上的自适应光刻方案来实现校正,而校正是复杂的。并非所有的光刻都在同一方向上进行。与此同时,叠层预算也在缩减。Beyne 估计,根据不同的方案,可能会有 10 到 20 纳米的叠加工作。如果采用更直接的连接方法,这一数字将急剧下降到 3 纳米,这可能需要对键合引起的畸变进行更严格的控制。 "Beyne说:"这些源极/漏极特征很小,因为CPP(接触栅极间距)只有45纳米。"因此,S/D 的着陆相当具有挑战性,必须极其精确。 微孔的长宽比(高/宽)往往在 10:1 左右。精确控制的蚀刻工艺对于新的微孔以及其他关键特征至关重要。"Lam Research 公司副总裁兼总经理 Kaihan Ashtiani 说:"BPD 的所有三种方法都涉及需要蚀刻的高纵横比特征,然后用导体、绝缘体或两者填充。 晶圆减薄工艺本身也不是那么简单。硅片减薄后只剩下大约 500 纳米。Imec 正在与 Disco 的工程师合作,以提高研磨工艺的均匀性和加工速度。 CMP 也起着至关重要的作用。Lam Research 公司高级总监 David Kretz 解释说,在研磨过程之后要进行精细抛光 (CMP),以接近最终目标厚度并完全去除研磨损伤。然后用湿法清洗或干法蚀刻去除剩余的硅。硅锗(SiGe)可作为蚀刻止动器。 "湿法硅蚀刻 "最初是为 CMOS 成像和功率器件开发的。其他应用还开发用于晶圆键合,特别是 NAND 器件--将 CMOS 阵列与存储单元键合,"Kretz 说。这种蚀刻技术目前正被应用于背面电源轨应用。 湿法面临的挑战包括成本效益、均匀性(总厚度变化,TTV)以及修复研磨步骤造成的硅损伤。"Lam 克服了这些挑战,首先使用快速蚀刻率工艺去除大块硅(成本效益),然后转用较低的蚀刻率工艺,使我们能够更好地控制最终薄膜的粗糙度,"Kretz 说。 计量在监控均匀性方面发挥着至关重要的作用。"他解释说:"我们的集成厚度测量系统(ITMS)使客户能够在湿法蚀刻前测量晶片,这样我们就能根据研磨工艺产生的入料厚度变化调整工艺。"他解释说:"这样就能从整体上更严格地控制最终晶圆到晶圆的厚度变化。 图 5:首先制作晶体管和电源过孔(a),然后进行多层正面金属化和介质密封(b),再与硅载体键合(c),最后进行背面电源处理。资料来源:英特尔 来源:英特尔 在英特尔简化的工艺流程中(见图 5),该工艺首先制造出鳍式场效应晶体管(finFET)或全栅极晶体管,然后蚀刻纳米硅片并填充钨或其他低电阻金属。接着,使用比正面配电网络稍大的金属 0 线制造信号互连(M0 至 M14)。接着,沉积介质(密封)密封件,然后翻转前端晶圆并将其安装在载体晶圆上。然后,对硅片进行研磨和抛光(CMP)。蚀刻挡块有助于防止晶体管本身被移除。 最具挑战性和最复杂的流程是直接接触,将金属接触到晶体管的源极和漏极。"在直接源极接触方法中,正面和背面连接的对齐是一项挑战。此外,外延触点的形成是从正面开始的,会在背面留下悬空。Ashtiani 说:"由于金属填充是从背面进行的,因此悬空结构的金属化是一个额外的挑战。 Ashtiani 详细阐述了由于已建成的铜堆栈所造成的热预算限制,这使得工程师们不得不积极评估钌和钼等金属替代品。"他说:"钼正在成为先进芯片制造中替代钨的一种引人注目的替代品。"Epi 背面触点是在 BEOL 工艺后制造的,因此温度上限为 400 至 450°C。在 BEOL 热预算范围内形成欧姆低电阻触点将是一个巨大的挑战。 在 Lam 的研究中,钼沉积已经显示出形成欧姆触点的能力,在保形和自下而上的触点填充方案中使用低温原子层沉积(ALD)钼。钼的其他优点还包括平均自由路径更短。因此,即使在较小的特征尺寸下,电阻率仍然较低。此外,钼对电介质没有内在扩散性,因此不需要较高电阻率的阻挡层。 另一种正在测试的金属是钌。在多项研究中,钌已被探索用作前端触点的替代触点材料,imec 公司的研究表明,与钨电源轨相比,钌在背面电源传输中可将电阻降低 40%。这两种金属的主要区别在于成本。钌前驱体比钼前驱体贵一个数量级。 调试 当所有互连都局限在晶片正面时,故障隔离和调试传统上都是通过硅背面进行的。背面金属化改变了这种分析方法。"当两面都有金属时,显然就更难了,因为突然间就有金属层挡住了去路。英特尔的塞尔说:"我们必须开发出不同的技术,以确保即使穿过这些金属线,我们仍能定位缺陷并对其进行表征。该公司正在使用现有的和新颖的调试技术来进行这些分析。 与此同时,公司还利用等速扫描测试模式进行测试,以确定速度路径问题,从而确定并修复设计中限制性能的路径,使设备能够以更高的时钟频率运行。对于每个故障扫描单元,都会根据逻辑模拟值的结构分析来确定故障路径。 产量和可靠性 为确保可靠性,芯片制造商采用了与任何复杂逻辑器件相同的可靠性测试方法,包括时间相关介质击穿(TDDB)、偏置温度不稳定性(BTI)和热载流子注入(HCI)。 有趣的是,三星分析了与封装工艺相关的热机械可靠性,以确保不会出现不连续性。工程师们分析了多层金属堆叠引起的应力水平,包括背面背面供电与传统互连堆叠引起的应力。该团队利用建模对其 4nm 节点的倒装芯片封装方案进行了比较。"他们在最近的一篇文章中说:"......我们选择了单个凸点(即位于芯片边缘的凸点)所受拉伸应力最大的位置,并在封装模型的热位移边界条件下检验了 BEOL 子模型。 使用背面电源的芯片在 Z 方向上产生的拉伸应力比使用背面电源的芯片大 62%,这些应力集中在 nanoTSV 正上方的第一层金属上。研究小组进行了测量,包括纳米 TSV 尺寸调整。通过使 TSV 加宽(或缩短)10%,应力得到缓解,阻力降低,同时利用环形振荡器模拟提高了速度。他们的研究表明,TSV 的尺寸和阻挡金属的厚度都会影响应力和性能。 一般来说,应力积聚是业界日益关注的问题,特别是随着越来越多地使用临时键合工艺,以便将不同的架构或材料组合在一起。"Brewer Science 公司首席技术官 Rama Puligadda 说:"客户希望粘合材料能在整个过程中将器件晶片固定在载体上,而不会出现分层。布鲁尔科技公司的首席技术官 Rama Puligadda 说:"因此,在一切准备就绪、真正可以剥离之前,剥离层不能释放粘合剂。但这样它就需要非常容易地脱开,可以通过机械方法或使用激光。因此,对于应力极大的晶片来说,这种平衡更具挑战性。 结论 背面供电是一种突破性的方法,它能更有效地为器件提供功率,同时还能提高最小前端互连的可制造性。工艺改进主要围绕光刻畸变校正、CMP、蚀刻、清洁和接合工艺。隔离故障变得更具挑战性。不过,这种生产更快逻辑器件的方法有望最早于明年在器件中出现。 参考文献 1. W. Hafez 等人,"英特尔 PowerVia 技术:面向高密度和高性能计算的背面电源交付",2023 年 IEEE 超大规模集成电路技术和电路研讨会(VLSI Technology and Circuits),日本京都,2023 年,第 1-2 页,doi: 10.23919/VLSITechnologyandCir57934.2023.10185208。 2. S. Kim 等人,《背面 PDN 的结构可靠性和性能分析》,2023 年 IEEE 超大规模集成电路技术和电路研讨会(VLSI Technology and Circuits),日本京都,2023 年,第 1-2 页,doi:10.23919/VLSITechnologyandCir57934.2023.10185330。
缓存驱动联邦学习架构来了!专为个性化边缘智能打造
伴随着移动设备的普及与终端数据的爆炸式增长,边缘智能(Edge Intelligence, EI)逐渐成为计算机学科研究领域的前沿。 在这一浪潮中,联邦学习(Federated Learning, FL)作为分布式机器学习的新范式,不断吸引着学术界和产业界的关注。 联邦学习通过多个设备协作训练共享AI模型的同时,避免了私有数据的交换,从而既保障了数据隐私,又实现了模型训练的分布式进行,成为落实边缘智能的关键技术路径。 然而,如何在保持高通信效率的同时,满足终端设备多样个性化需求的模型训练是一个关键性挑战。 最新发表于《IEEE Transactions on Mobile Computing》的论文”FedCache: A Knowledge Cache-driven Federated Learning Architecture for Personalized Edge Intelligence”为这一问题提供了创新性解决方案。 边缘智能中的个性化 边缘智能场景下,模型的协同训练不仅要应对设备硬件差异化的挑战,还需在优化目标、通信效率、隐私保护等方面进行多维度权衡: 设备的硬件资源和用户使用习惯各异,需要部署既能满足个性化任务目标又能适应硬件规模的模型。通信能力的局限性和对隐私的重视要求在协作训练中最小化通信成本,并且严格禁止私有数据的共享。设备连接的不稳定性决定了协同过程中不适合采用同步的通信方式 超越主流架构的FedCache FedCache是一种缓存驱动的联邦学习架构,旨在为个性化边缘智能(Personalized Edge Intelligence)提供强有力的支撑。FedCache通过在服务端维护一个知识缓存,用于捕获与每个私有样本关联的最新知识,并使用知识缓存驱动的个性化蒸馏技术进行终端设备模型的训练。 在初始化阶段,所有私有样本通过深度预训练的神经网络被编码成哈希值,以便在边缘采用隐私保护的方式判断样本之间的相关度。 在正式训练阶段,终端设备基于本地样本索引迭代地向服务器发送知识请求,从中取用相应的关联性知识,并在设备上开展基于蒸馏的个性化优化。 FedCache的核心在于其独特的服务器端知识缓存机制,该机制利用哈希值管理设备样本的相似性和关联知识,以优化训练过程。 这种独特的设计不仅保护了数据隐私,还避免了设备之间的参数交互,显著降低了通信负担。此外,FedCache允许不同设备的模型架构完全独立,优化目标差异化,且支持异步分布式优化。 实验结果 本文在四个公开数据集上验证了FedCache的性能。 实验结果显示,主流的个性化联邦学习方法相比,FedCache的通信效率提高了两个数量级,同时在模型性能也能达到相当的水平。 FedCache的这些特性不仅展示了其在架构设计上的创新性,也证明了其在实际应用中的巨大潜力。 通过这种缓存驱动的联邦优化方法,FedCache预期引领个性化边缘智能的未来,为分布式AI的实施开辟新的道路。
OMEN 暗影精灵 10 评测:游戏本中的六边形战士
以学生党和新职人为目标的笔记本电脑市场,每年都会迎来两波换机潮——9 月的开学季,和 2 月的返校季。 相较于介于 618 和双 11 之间的开学季,年初返校季时,市面上能选择的产品空间要小得多,这又偏偏是大多数人一年来手头最宽裕的时候。 因此,每年这时候往往也有一些产品力不错,而性价比也比较突出的笔记本电脑上市,目标就是占领开学换机潮的第一波购机预算——OMEN 暗影精灵 10 就是其中之一。 这个 2015 年上市的老牌游戏本系列,至今已经推出了第十代产品。游戏本这个品类也从小众走向大众,从增量市场走向存量竞争。游戏本品类变化的脉络清晰地体现在暗影精灵 10 身上,这也是近期体验下来,我对这款笔记本最深的印象。 设计是内敛的,性能是外溢的 我们这次评测的暗影精灵 10 核心配置是第十四代英特尔® 酷睿 i9-14900HX 处理器 + RTX 4060 8GB 显存功耗 140W 的独立显卡,配备 32GB 高频内存 + 1TB 高速 SSD,以及 16.1 英寸 2.5K 分辨率的 240Hz 高刷屏。 暗影精灵 10 整体延续了上一代的设计,没有夸张的线条和灯带,A、B 面都是磨砂质感的复合材质,没有太多花哨设计,A 面的 OMEN 标识内敛沉稳。而 C 面则是金属阳极氧化,触感打磨得不错,也有很好的支撑感,使用键盘、触控板的时候都很顺手。 一个细节是,暗影精灵 10 采用顶置转轴设计,能够为散热模组留出更多空间,结合 C 面的辅助进风设计,能够有效减少整机热量堆积,相较上一代产品,在散热上改善不少。同时支持屏幕 180° 开合。改进的阻尼结构,保证了屏幕的流畅开合与稳定性,一只手就能开关屏幕,非常方便。 全系配备三窄边高刷屏是暗影精灵 10 作为游戏本最显眼的配置,FPS 游戏玩家一眼就能看出差距,最高 240Hz 的屏幕刷新率,保证了在《无畏契约》这类高速电竞游戏中能有更顺滑爽快的体验。 而四分区 RGB 背光键盘则是凸显游戏本身份的另一个象征,中高配版本还配备了数字小键盘,按键大小、键程比较舒适,不会有松松垮垮的感觉。值得一提的是,暗影精灵 10 触控板面积足够大,经过阳极氧化处理的金属掌托质感出色,无论是键盘打字还是触控板操作都非常清凉舒适。 值得一提的是,暗影精灵 10 充分利用了游戏本的体积优势,在 36.9*25.9cm 这个游戏本相对较小的机身尺寸里,塞进了 16.1 英寸的屏幕和全尺寸键盘,同时兼顾了拓展性与散热,这点还是很不容易的。 暗影精灵 10 采用「两进四出六风道」的散热设计,能够保证设备大功率运行,充分发挥性能优势,就算是高功率运行也不会因高温产生不适感。 此外,接口也相当丰富,左侧配备两个雷电 4 接口,支持 100W PD 充电、USB 4 速率以及 DP1.4 输出,在同价位产品中属于少见的豪华配置,还有一个耳麦二合一接孔,右侧则配备一个 Type A 的 USB3.2Gen1 接口,后侧则集中配备了电源接口、RJ45 网线口、HDMI2.1 以及另一个 Type A 的 USB3.2Gen1 接口——打游戏时外接键鼠、显示器以及网线也绰绰有余。 近十年来,暗影精灵系列的设计语言就是从张扬到内敛演变的过程,究其背后的原因,是游戏本从强调小众个性化的核心玩家市场,慢慢扩展为一个大众人群也会考虑的购机品类——游戏本设计越来越轻薄,性能越来越强劲,暗影精灵 10 算是二者兼顾的优等生——设计是内敛的,而性能是外溢的。 接下来,让我们看看性能实测。 是游戏一把好手,也是日常多面手 关注暗影精灵系列的用户,通常也都是游戏玩家,因此,我们也选择了多款热门游戏进行测试。 本次暗影精灵 10 的测试环境如下: 室温:26 ℃ 系统版本号:22631.3155 Windows 系统版本:Windows 11 家庭中文版 23H2 BIOS 版本:F.05 GPU 驱动版本: 551.52 HP Support Assistant 中各项升级为最新 OMEN Gaming Hub 升级为最新 电池电量:100% 狂暴模式、显卡直连、自动风扇 测试之前,先看看整体配置情况。 以我们手头这台第十四代英特尔® 酷睿 i9-14900HX 处理器、RTX 4060 显卡的配置为例,超高的处理器性能足以胜任所有需要电脑强处理能力的场景,日常几乎没有跑满处理器的时候,对于游戏也有很好的增益作用。 今年的游戏本继续沿用 40 系列显卡,而 RTX 4060 作为近几年主打的中高端甜品级显卡,采用台积电的 5nm 工艺,搭载了最新的 Ada Lovelace 架构,支持 DLSS 3 以及最新的光追技术,整体性能相较上一代 RTX 3060 约有 15% 左右的性能提升,且显存扩展到了 8GB,能够应付更多的复杂图形处理场景。整体能耗比也不错,在性能充分释放的加持下,表现也是相当让人惊喜。 这一次,我们挑选了 PCMark 10、3DMark 作为测试软件,并通过 AIDA64 和 FurMark 进行烤机测试,综合测试情况如下: PCMark 10 是针对 PC 日常办公需求设计的基准测试,有制图制表、视频会议、图像处理等多个测试项。我们手上这台暗影精灵 10 得益于第十四代英特尔® 酷睿 i9-14900HX 处理器加持,战力再+1!在运行效率上表现亮眼。 最终跑分结果为 8786 分,这已经是远超一般游戏本的分数(通常游戏本在 7000 分左右),足以胜任绝大多数的日常工作,可以说是办公场景的多面手。 而从 3DMark 多项场景测试的跑分数据来看,都是处于第一梯队的优秀水平,能胜任绝大多数场景测试。像 TimeSpy 的场景下,暗影精灵 10 的稳定性也是极好的,CPU 和 GPU 温度基本上在 70-80℃ 的水平,没有过热的现象,而 TimeSpy 场景综合分数 11321 分,意味着能以 2K 分辨率高画质顺滑跑绝大多数游戏。 再来看看烤机软件 FurMark 的情况,这是一款测试显卡极限性能的软件。我们这次选择 1980×1080 分辨率进行测试,经过 30 分钟测试,基本上显卡稳定在 85℃ 左右。 更为严苛的是 AIDA64 的 CPU、GPU 双烤测试,通过同时对 CPU、GPU 施加负载,来进一步考验设备的散热性能与稳定性。经过 40 分钟测试,CPU 基本上稳定在 80℃ 的水平,功耗在 70W 左右,而 GPU 则稳定在 92℃ 上下,功耗在 110W 左右。 可见「两进四出六风道」的散热设计足够靠谱,而且键盘以及掌托位置也没有让人不适的热感,意味着就算是高强度游戏,体验也能有所保障。 当然,无论纸面数据如何,游戏实际运行效果才是最重要的。 首先是对帧率要求高的电竞游戏《无畏契约》,在高画质设置下,游戏最高可以跑到 376 帧,平均帧率保持在 300 帧以上,GPU 温度控制在 75℃,打枪爽快感拉满,在激烈的战局中总能够快人一步。 除了满足主流网游的需求,暗影精灵 10 在 3A 游戏方面的支持也是重头戏。 去年刚刚推出完全版的《赛博朋克 2077》,在暗影精灵 10 上的运行效果非常喜人,得益于 RTX40 系显卡的最新技术,可以在 2K 分辨率高画质开光追的条件下维持在 80-90 帧,游戏体验稳定顺滑,GPU 温度稳定在 75℃ 左右,配合 100% sRGB 色域的高刷屏,能为游戏体验增色不少。 作为春节期间最热门的多人联机大作,《地狱潜兵 2》虽然游戏优化存在诸多问题,导致性能表现不佳,但暗影精灵 10 仍能以 2K 分辨率最高画质稳定 50 帧以上,对画质设定稍作调节,就可以稳定跑在 60 帧以上——这对一个强调粒子和烟雾效果的 3A 联机游戏来说,算是相当不错的体验。 最后,我们也测试了 2023 年最吃电脑配置的《心灵杀手 2》。作为叙事类游戏的新标杆,《心灵杀手 2》运用了大量的新技术,对 PC 配置提出了更高的要求,以至于很多设备的运行情况都不理想。 而暗影精灵 10 在高速硬盘和内存的支持下,有着超出预期的出色表现。2K 分辨率打开 DLSS 后,可以在中高画质开启中等性能的光线追踪效果,并稳定运行在 50 帧以上——你会看到一个栩栩如生的亮瀑镇,仿佛进入到美剧的世界当中。 可以说,性能方面暗影精灵 10 是不负「游戏本」三个字的,而实际体验中,素质出色的高刷新率屏幕,能够适配各种游戏,像《无畏契约》这样对帧率要求苛刻的 FPS 游戏也不在话下,对于游戏体验的提升肉眼可见。 值得一提的是,暗影精灵 10 在各个游戏测试期间,长时间使用 GPU 温度也没有超过 80℃,所有的游戏场景测试都游刃有余,同时兼顾了画质与稳定性,足以证明老牌游戏本的调教功力。 在出色的性能和屏幕加持下,暗影精灵 10 已经能够满足绝大多数游戏玩家的需求,即便是搭载 RTX4060 显卡的版本,也是一款能够兼顾日常娱乐的 3A 游戏设备。 游戏本入手的均衡之选 曾几何时,游戏本和全能本一直是泾渭分明的两条线。对于用户而言,这是一个不需要太过纠结的品类——没有万把元预算不会考虑游戏本,而选择全能本的另一个理由就是拒绝傻大黑粗。 但如今,当游戏本不再笨重、不再张扬、不再高攀不起的时候,游戏本也可以「六边形战士」,妥协选择全能本的用户,完全可以把游戏本当作另一种均衡之选。 具体到暗影精灵 10 身上,这是一款设计出彩、配置丰富而且入手门槛不高的游戏本,过硬的基础素质无论是打游戏还是看电影都非常舒适,而足够的性能释放也可以兼任游戏与工作的需求,外观设计方面沉稳内敛,但也保留了诸如 RGB 键盘灯等个性化配置。 价格方面,暗影精灵 10 提供了 6999 到 13999 元多档配置可选,处理器、显卡和存储空间都可以自由选择。对于学生党而言,6999 元的入门款就很不错;对游戏性能有进一步要求的,可以选配 8499 元档搭载 RTX 4070 的版本,这款配置性价比很高,游戏可以开更高的特效,玩起来更加游刃有余;而如果是想兼顾影视剪辑等需要高处理性能的工作,那么可以挑选能效更高的第十四代英特尔® 酷睿 i9 处理器版本,可以应对绝大多数的工作情景。 可以说,暗影精灵 10 在品质、性能和价格之间拿捏得非常准确。这也是暗影精灵品牌的十年底蕴所在。 说回来,趁手好用的电脑,本就不应该分得那么开。
Sora模型争议背后,什么是杨力昆的世界模型
记者 肖余林 编辑 高宇雷 类似于ChatGPT引起的关于“AI是否有意识”的讨论,OpenAI的新模型Sora让更多人知道了“世界模型”的概念。不同的是,这一次,AI圈内的头部科学家、研究者都参与进来,掀起了一场“Sora是不是世界模型”的大争议。 争议来自于Sora的技术报告,OpenAI在报告中把Sora定义为可以生成视频的世界模型(World Simulators),并认为Sora的技术是打造通用世界模型的一种有前景的方法。 关于世界模型并没有一个标准的定义,但可以非常简单地理解它。一个第一次开车的成年人在过弯道的时候会自然地“知道”提前减速;儿童只需要学会一小部分(母语)语言,就掌握了几乎这门语言的全部;动物不会物理学,但会下意识地躲避高处滚落的石块。AI科学家认为,人和动物会潜移默化地掌握世界的运作规律,从而可以“预知”接下来发生的事情并采取行动。世界模型的研究就是让AI学习这种能力。 Sora可以生成逼真的视频,看起来视频当中包含一个完整的3D世界建模。它支持在保持画面内容一致的前提下切换镜头,甚至能够按照时间顺序往前或者往后生成新的视频内容。很多人认为,Sora学会了“预知”事物发展的能力,这刚好是世界模型研究追求的目的。 然而,一直在研究世界模型的AI科学家、图灵奖获得者杨力昆(Yann LeCun)则认为,Sora的生成式技术与世界模型的因果预测完全不同,Sora不仅成本高昂,而且对于世界模型完全没有意义。 今天的人工智能拥有人类无法比拟的能力,但在前沿的科学家那里却很难称得上是“真正的智能”。这样的落差是如何发生的?通往“智能”的世界模型真的重要吗? “白痴天才” 在以ChatGPT为代表的生成式AI浪潮出现之前,AI领域经历了一轮深度学习革命。这个过程中,卷积神经网络CNN大放异彩,引领机器视觉技术走向成熟。今天的手机、电脑以及各种互联网产品当中的图像识别功能,几乎都是CNN作为驱动。 杨力昆在20世纪80年代发明了CNN,它模拟了位于人眼的视觉神经和位于大脑的视皮层神经之间的工作过程,能够识别图片当中的视觉特征,在当时被用来识别手写字体。 CNN真正成为主流是在2010年前后。GPU并行计算能力提升,图像训练数据库ImageNet建立,以及强化学习算法等技术应用,种种条件成熟,使得CNN可以通过深度学习训练来提升图像识别能力,识别准确率高达98%。 特别是在2016年,AlphaGo在围棋比赛中技惊四座,一度让CNN大红大紫。几乎在同期,CNN催生了互联网科技公司的产品更新,比如搜索引擎有了以图搜图功能,自动驾驶汽车可以“看见”行人,社交媒体平台可以自动过滤不符合规范的图片,并且能够在用户上传的照片中圈出好友的名字,等等。 今天,CNN支持的计算机视觉能够快速且准确地识别数以百万计的人脸、汽车的车牌和型号,以人类无法做到的方式分辨动植物的品种。搭载AI识别功能的互联网产品给科技公司带来了超额的收入。然而,这样的识别能力却在一开始就被证明是不够智能、甚至是脆弱的。 2015年的一篇论文揭示了深度神经网络容易被“骗”的特点。实验发现,对于一张被AI成功识别的图片,如果仅改变它一处细微的细节,识别效果就会天差地别。这一发现强调了AI虽然擅长识别图像中的物体,但并没有像人一样读懂了图片的内容,而仅仅是提取了图片中像素排列的数学特征。 这样的特点限制了计算机视觉的应用前景,自动驾驶就是典型的例子。CNN被广泛应用到自动驾驶中,参与图像处理和目标识别任务,自动驾驶公司投入了巨量资源给车辆行驶过程中记录的数据做标记,从而训练深度神经网络。然而,长尾问题一直在阻碍自动驾驶技术的突破。具体而言,对于没有在训练数据中出现过的物体,视觉算法通常难以识别,而车辆行驶过程中出现无法识别的可能性会一直存在。 计算机科学家梅拉妮·米歇尔(Melanie Mitchell)把打败了世界顶尖棋手的AlphaGo称为“白痴天才”。即使AlphaGo拥有了拥有无与伦比的围棋技术,但它“不具备任何思考、推理和规划的能力”,同时跟其它CNN神经网络一样,“它所学到的能力没有一项是通用的,也没有一项可以被迁移到任何其他任务上”。甚至只要改变棋盘的形状或者大小,AlphaGo的能力就会化为乌有。 不只是CNN,基于深度学习训练的神经网络几乎都存在类似的瓶颈,能力无法泛化、没有理解力、容易被“欺骗”等等。苇草智酷创始合伙人段永朝认为,智能机器目前所能做的,还只是“最快的猜测”,或者说“以快取胜”,但与真正的人工智能之间依然有巨大的鸿沟。 知识 VS 常识 多年以来,前沿的AI研究一直致力于突破深度神经网络的瓶颈,让人工智能学会“理解”,其中的关键被认为是人所具有的世界知识。不同于书面上的知识,这种更靠近直觉的知识组成了人的常识,通过掌握常识,AI能够根据当下的情况预测接下来可能会发生的事情。 最近几年,很多AI科学家走出实验室进入商业公司,借助工程化的能力继续投入研究。在这样的时刻,ChatGPT带着生成式技术横空出世,凭借大规模的数据训练和算力投入,实现了能力“涌现”。一夜之间,AI似乎掌握了知识,并拥有了理解力。Sora发布不久之后,OpenAI首席执行官Sam Altman发布推文称“Scaling Laws是由上帝决定的”,强调人工智能能力指数级增长的关键是“规模”,且这种增长是一种不可阻挡的力量。 普遍的看法是,生成式技术打造的大语言模型核心是概率模型,通过一个前值来预测与前值最为相关的一个后值,这一能力的前提是模型掌握了海量的数据。计算机科学家斯蒂芬·沃尔夫勒姆(Stephen Wolfram)在《这就是ChatGPT》一书中直白地介绍了ChatGPT的原理: 首先从互联网、书籍等获取人类创造的海量文本样本,然后训练一个神经网络来生成“与之类似”的文本……值得注意和出乎意料的是,这个过程可以成功地产生与互联网、书籍中的内容“相似”的文本…ChatGPT“仅仅”是从其积累的“传统智慧的统计数据”中提取了一些“连贯的文本线索”。但是,结果的类人程度已经足够令人惊讶了。 学习了大量文本知识的生成式AI能是不是通往“真正的人工智能”的道路?发明了CNN的杨力昆认为,生成式技术的过程不可能产生真正的智能。他表示,大语言模型拥有从书面文本中提取的大量背景知识,但缺少人类所拥有的常识。常识是我们与物理世界互动的结果,并没有在任何文本中体现出来。大语言模型对潜在的现实没有直接的经验,因此展示的常识性知识非常浅薄,在应用中可能与现实脱节。 可以通过这样一个例子理解杨力昆的看法:大语言模型能够根据足球的材质、颜色等物理信息,得出足球被踢飞后的运行轨迹,这个推理过程不需要考虑物理力学的参数,而是基于训练数据中的概率。通过规模化训练,大模型在语言交流、图像和视频生成方面达到了出人意料的效果,但无法应用于解决基于因果的现实问题。这也是关于“Sora是不是世界模型”争论的焦点。 杨力昆认为,实现真正的智能突破不是靠规模,而是让AI在世界模型中学习常识。在论文《A Path Towards Autonomous Machine Intelligence Version》中,杨力昆提出了有关世界模型架构的思路,与生成式架构通过前值预测后值不同,这一思路把重点放在预测前值与后值之间的抽象关系上。 论文中提到,人或者动物大脑中似乎运行着一种对世界的模拟,称之为世界模型,这个模型指导人和动物对周围发生的事情做出良性预测。杨力昆曾举例表示,婴儿在出生后的最初几个月通过观察世界来学习基础知识,比如看到一个物体掉落,就几乎了解了重力。这种预测接下来会发生什么的能力来自于常识,杨力昆认为它这就是智能的本质。 根据论文中的思路,杨力昆提出了联合嵌入预测架构(JEPA),并帮助Meta发布了I-JEPA和V-JEPA两个大模型,两个模型分别展示了在图像和视频方面的预测能力。Meta在训练V-JEPA模型的过程中屏蔽了视频的大部分内容,模型仅显示一小部分上下文。他们发现,通过屏蔽视频的部分内容,可以迫使模型学习并加深对场景的理解。 整个过程就像老师把问题和答案给到学生,让学生还原推导出答案的步骤。V-JEPA可以预测短时间内画面前后的抽象变化,比如给定一个厨房案板的画面,它可以“还原”制作三明治的过程。 现阶段,V-JEPA更像是一种技术展示,并且由于仅关注学习抽象关系,它会选择性地忽视不相关的信息,那么三明治的外观就难以辨认。在这一点上,Sora生成的画面则细节饱满。不过,业内人士在评论V-JEPA时表示,相比于Sora,V-JEPA更符合纯粹的人工智能研究。 在2月14日举行的迪拜世界政府峰会上,Sam Altman融资7万亿美元的计划成为被记者提问的热点。出席峰会的杨力昆却犀利地表示,现在的大语言模型是新一轮的炒作(Al Hype),跟过去五年一次的炒作一样,目的都是为了创业公司融资。他认为,实现AGI的路径肯定不是AIGC路线,而是需要新的架构,需要至少20年的时间。 然而,关于“纯粹的人工智能研究”这一评论,有回复认为,即使OpenAI的路线是错误的,也与它将实现的商业价值无关。就像杨力昆发明的CNN神经网络,即使所有人都知道有很大缺陷,但仍然改变了我们的生活。
恐怖的人形机器人
作者 | 万连山 全球第一家人形机器人独角兽诞生了! 继1月底与微软洽谈后,机器人初创公司Figure AI还在寻找更多金主。 已经确定的投资者及机构如下: 1,亚马逊创始人贝索斯,投资 1 亿美元; 2,微软,9500 万美元; 3,OpenAI ,500 万美元。 4,英伟达与亚马逊的附属基金,各自5000 万美元; 6,英特尔风投部门, 2500 万美元; 7,LG Innotek , 850 万美元; 8,三星投资集团, 500 万美元; 9,Parkway Venture Capital , 1 亿美元; 10,Align Ventures , 9000 万美元; 11,Aliya Capital Partners , 2000 万美元……(还有一大串金额较小的,略过) 总融资额为 6.75 亿美元,投后估值达到 27 亿美元左右。 但众所周知,目前人形机器人风头最盛的是谁?马斯克。 科技大佬们如此集中的大规模投资,瞬间就把美国科技圈子划分为特斯拉和非特斯拉两派,泾渭分明。 如此针锋相对,很明显就是绝不让老马吃独食。 01 执着的理由 关于机器人的外形是否一定要和人类一样,质疑声从未停过。 相当一部分人认为,人形机器人是多余的研究。 人类的独特,在于想象力出众和团队分工协作。 但从身体构造来看,我们的生存能力并不强,既不耐寒也不耐热 ,一到夜晚就成了瞎子。 运动能力更是差劲,肌肉必须后天锻炼,不像动物一样天生就有,负重不如马、跑得没猫狗快、不会飞、不擅长游泳、跳得也不高。 一个并不完美的构造,为什么要将之作为范本? 比如,人只有两只手,难道机器人也要限制成两只手? 为什么要设计一个脑袋?如果是为了放传感器,全身分布放置岂不更好? 为什么要有腿?在陆地上行进,履带车效率更高。 至于跳跃,让机器人跳起来所需的功率,都能够飞行了。 都能飞了,还要腿干什么? 以一般的眼光来看,机器人做成人形,是完全没必要的。 既然如此,科技大佬们为什么还要烧大钱、花大力气去研发人形机器人? 首先,最浅显的一方面: 人类形态更容易唤起投资者、消费者和网民的认同感,更容易圈钱。 这一波AI浪潮,掀起了技术革命的同时,也引爆了全球科幻圈子。 比如,对马斯克而言,至少在未来几年,他的擎天柱最终能否商业化并不重要,只需要将这些宣传噱头与自己捆绑在一起,就能顺利卖出更多车,股价节节攀升。 在商言商,这是科技大佬们必然有的想法。不过除此之外,或许还有更深的一方面: 因为他们所追求的是普适性,是更大的商业价值。 任何一种商品,必须是每个人都能使用的,而不是少数人的专属。 但我们现在所能看到的所有人形的、非人形的机器人,从功能上而言,只能适用单一场景——这实际上就不能称之为机器人,顶多是具备一定智能的机器。 既然带个“人”字,至少要具备一定的交流能力,能适用于人类社会。 而人类社会中的绝大多数建筑与工具,都是为了方便人的使用而设计的。 比如,成年人的平均身高170cm、体重70kg,那么汽车、房门、桌椅、走道等私人的、非私人的任何物品、设施,都是以这个标准生产建造的。 所以,如果要造一台通用机器人,理论上人形机器人才最合适。 凡是人类能用的工具,它都能够直接使用。我们不需要为机器人专门设计另外一套标准、工具和环境。 简而言之,就是为了方便。 但这里有个非常矛盾的点: 人形机器人在人类社会的优势是通用性,但这同样是限制它商业化落地的最大障碍。 不同于工业机器人只需要完成某项单一任务,人形机器人得在开放式的环境中,完成更复杂的任务。 而当前阶段的所有人形机器人,要么依然只能针对单一场景的单一任务,要么就必需有开发人员实时控制,无法直接给普通人使用。 何解? 因为过去的人形机器人,并不具备交互性。 更精准点说,并不具备普适的交互性,只有掌握了相关技能的研究人员才能与机器人交互。 越来越成熟的大模型,或许能解决这个硬伤。 02 相辅相成 大模型越发成熟,于人形机器人最大的意义,是让它越来越具备通用性。 其实早在去年,日本东京大学团队就开发了全球第一个由GPT-4驱动的人形机器人Alter3。 它最大的亮点,就在于使用者并不需要具备任何专业知识,只需要与机器人进行自然语言交互,就能指示它执行各种任务。 它是怎么做到的呢? 主要通过两种技术,zero-shot(零样本学习)和CoT(思维链),GPT-4才能将人类的自然语言转换成机器人能理解的代码。 比如,你对Alter3说“笑一个”,它会先向GPT-4询问,什么是笑、怎么表现出来,然后GPT将答案转换成Python代码,机器人再根据代码完成面部动作。 这个过程看起来很复杂,但在人的肉眼中,几乎是0延迟的。 更厉害的是,Alter3还拥有纠错能力——它能根据使用者的的口头反馈,事实调整自身行为。 这种极强的灵活性,或许能在一定程度上理解为学习能力。 Alter3已经足够神奇,但它已经是过去式。 是的,就是这么快,AI迭代的速度远超以往任何技术。 最初,GPT只是个单纯的文字对话模型;2023年9月,语音和图像功能正式上线,大力发展多模态技术;到今年,以GPT为基础的视频生成模型Sora又问世。 这一步一步,蹭蹭递进,你觉得像什么? OpenAI要让自己的大模型,越来越符合人脑的标准。 人脑最基本的能力是什么?五感神经。 语音功能可以理解为大模型的听觉神经,图像→视频可以理解为视觉神经。 有人觉得不对,大模型生成的图片、视频,都是根据人的指示来的,并不是它自己“看”到的。 但想想看,我们人看到的东西,就是直接“看”到的么? 我们的眼睛“看”到的任何静止的、运动的事物,都是脑神经对光信息反馈,从而形成的一种视觉效果。 这与大模型根据信息指令,生成图像、视频,逻辑上是一样的。 区别只在于,我们的信息源于自然界的万事万物,大模型的信息源是一串串代码。 关于这个问题,可以以后再具体讨论…… 回到主题。 既然大模型能在短时间具备视觉、听觉,那么另外的嗅觉、味觉、触觉,想必也很快会实现。 但问题又来了。 嗅觉我不太理解,而味觉、触觉的产生,必须与外界有实际接触,单靠大模型怎么可能办得到? 仅靠AI自己当然不行,所以它需要载体、需要一系列成套的“器官”,也就是黄仁勋一再强调的“具身智能”。 什么样的人造器官才能还原出我们想象中的五感? 最简单的,当然是直接模仿人的身体构造。 至少在现在看来,人形的“具身智能”是完善多模态大模型的最优解。 而在大模型五感越来越成熟的同时,人形机器人的功能会越来越丰富、越来越具备普适性。 大模型是大脑、人形机器人是肉体,两者相互辅助、共同进化。 这是个非常优美的良性循环。 只要算力、硬件技术跟得上,电影里的那种智能机器人,也就不远了。 看到这里,是不是有点细思极恐的感觉。或许,人类自己也是这么诞生的? 谁又是我们的master? 03 潜在的价值 一旦真正的智能机器人出现,它们有多大的价值,是很明了的。 除了老生常谈的家务、养老、学习、伴侣等,更重要的是充当劳动力。 我们普通人往往担心,机器人会不会抢走自己的范围。 但从更宏观的角度来看,更大的威胁不是机器人是否会取代人力,而是智能机器人能否及时到来。 老龄化越来越普遍,目前全球大部分经济体,尤其是发达经济体,失业率都达到了1980年以来的最低水平,劳动力严重短缺。 比如日本,预计每年将减少40万劳动力。 照此趋势,到2030年,全球预计将产生8520万人的缺口,导致8.452万亿美元的损失,相当于日本+德国GDP之和。 这种时候,能7×24小时无怨言工作的机器人,就显得尤为可爱了。 这里需要再强调一下,为什么一定要人形机器人。 因为劳动力的短缺,普遍存在于各行各业,并不只是制造业。 如果只是在工厂劳作,不需要管外形,实用就行。 但正如上文所说,机器人想要进入人类社会的所有行业,最好是具备普适性,能够在现有的社会中直接使用。 不论服务生、收银员还是教师、司机、扫大街的等等等等,它们都能胜任。 这样的未来,想必是美好的,就像电影和小说里描述的那样。 其中蕴含的市场,想必是极为巨大的。 根据马斯克描述,全球劳动力市场将高达40万亿美元,是电动车市场的10倍,可能还低估了。 但机器人毕竟不是人,所谓外形,都只是人为的造物。 金钱与欲望的火焰,无论什么时候都不能烧到对未知的敬畏。 Robot一词,源于捷克作家卡雷尔·恰佩克笔下的《罗素姆的万能机器人》,原型为“Robota”,在捷克语中为“苦力”的意思。 罗素姆公司大量制造机器人奴隶,它们拥有人类的外貌,日复一日从事繁重的劳动。在海伦娜等理性主义者的帮助下,Robota逐渐拥有自我意识,开始对自己的社会地位不满。 起义爆发,人类被屠杀殆尽,只有像机器人一样用自己双手劳动的阿尔奎斯特存活。 统治世界后,Robota们痛苦地发现,技术资料已被人类焚毁。为了创造后代,它们请求阿尔奎斯制造新的机器人,并自愿成为实验材料。 然而,阿尔奎斯特能力有限,尽管肢解了一个又一个Robota,也无法成为新纪元的上帝。绝望之际,一对男女机器人突然进化出人类独有的情感——爱情,拥有了繁殖后代的能力。 新的亚当和夏娃诞生了,世界得以延续。 哈利路亚! …… 只希望在不久的将来,人形机器人能成为人类永远的好帮手,而不是如Robota那般,顺手把我们送走……
2024年的折叠屏:低调发育冲高端,iPhone危险了?
北京时间 2 月 25 日晚,荣耀在巴塞罗那面向海外市场发布了四款产品,包括荣耀 Magic6 Pro、Magic V2 RSR 、MagicBook Pro 16 和荣耀平板 9 四款产品,位于现场的雷科技 MWC 报道团,第一时间对这场海外新品发布活动进行了报道。 作为全场的焦点之一,荣耀 Magic V2 RSR 的重点自然是与保时捷设计联手打造的外观设计以及目前内折手机中最薄的机身,折叠状态下仅 9.9 毫米厚。这项纪录一直从去年 7 月荣耀 Magic V2 发布,保持至今。 而折叠屏手机的增长,也从 2019 年正式登场开始,保持至今。根据 IDC 的市场报告,2023 年全年中国折叠屏手机出货量约为 700.7 万台,同比增长 114.5%,连续 4 年均超 100%。 放眼到全球市场,折叠屏手机的表现又有些不同。TrendForce 最近的一份报告显示,2023 年全球折叠屏手机的全年出货量达 1590 万台(预估),同比增长 25%。 图/ TrendForce 更值得在意的是,随着出货量的逐年增长,折叠屏手机在所有智能手机出货量中的市场份额,也提升到了 1.4%。考虑到折叠屏手机的定位和定价,在除 iPhone 以外高端市场的占比理应更为可观。 一个影响是,尽管 2023 年苹果(iPhone)的出货量超过三星成为了全球第一大手机厂商,但根据 Counterpoint 的报告,2023 年全球高端手机(批发价 ≥600 美元)市场中苹果的份额反而从 75%降至 71%,三星、华为、小米的份额均有不同程度的增长。 图/ Counterpoint 这也说明,折叠屏在高端市场的实际意义,对于苹果之外所有手机厂商都是难以忽略的。而在 2024 年,随着全球智能手机市场的复苏,折叠屏手机的继续加速,这种变化带来的影响可能还会进一步凸显。 2024年,折叠屏市场从大到更大 众所周知,全球智能手机出货量在 2016 年就已经「触顶」,随后一路下滑。按照 IDC 的数据,除了 2021 年全年出货量同比增长 5.7%,全球智能手机市场过去七年,有六年的出货量都在同比下滑。但 2024 年,一切很可能发生改变。 在最新的一份报告中,IDC 预测今年全球智能手机市场将录得 2.8%的同比增长。预测并非空穴来风。实际在上个季度,手机市场就开始触底反弹,而去年的出货量也低于疫情前一年,再加上新一轮的换机周期、新兴市场的需求增长以及 AI 技术带来的可能,手机厂商也普遍看好今年的大盘。 但不管 2024 年的大盘如何,折叠屏的继续「高歌猛进」可以说是题中应有之义。 一方面是手机厂商对于折叠屏手机的热情还在持续提高,越来越多厂商正在推出越来越多的折叠屏产品,不仅是传音、一加、谷歌和努比亚等厂商的「第一次拥抱」,传闻荣耀和小米也都完成了小折叠的产品研发,预计今年年内上市。 图/谷歌 另一方面是 IDC 的报告同样指出,2024 年折叠屏手机出货量预计将达到 2500 万台,继续保持快速增长态势,占比也进一步提高。再加之去年谷歌作为系统厂商的加入,不仅带来了谷歌系应用的第一方适配以及更完善的开发工具、文档等配套,也带动了更多应用对于折叠屏的适配,比如 WhatsApp、Telegram 等重要应用。 从这个角度来看,手机厂商没有理由暂停折叠屏开发,反而应该加大投入。至少是在横向折叠这个赛道上。 手机厂商的抉择:专注大折叠还是大小通吃? 正如前文所述,2023 年我们继续迎来了折叠屏的快速增长,但在增长的同时,也发生了一些耐人寻味的变化。尤其在国内市场,大折叠(横向折叠)手机的趋势越来越凸显,尽管价格相比小折叠(竖向折叠)手机高出了不少,但占比却重新增加到了 68.1%。 图/ IDC 其实不难理解,小折叠在与直板旗舰手机价格相当,甚至更高的同时,除了携带方便、形态灵活的优点,受限于铰链等折叠相关结构对于机身内部空间以及成本的挤占,小折叠在性能表现、影像以及可靠性等方面都占劣势。 就在前段时间,有一则重要消息在手机圈流传。根据知名爆料博主@数码闲聊站透露,有两家 Top5 厂商已经暂停了小折叠项目的开发,被指是 OPPO 与 vivo。OPPO 很快就进行了否认,vivo 则不置可否。 不过对于更多厂商,大折叠要做,但目前小折叠对于消费者仍然有着不俗的吸引力,也要做。稍早前,华为也刚发布最新的小折叠产品—— Pocket 2。而包括努比亚和传音等厂商,都在正在举办的 MWC 2024 上展出最新的小折叠手机。 努比亚 Flip 5G,图/雷科技 另外,Counterpoint 发布的 2023 年上半年折叠屏手机畅销榜也显示,中国手机市场最畅销的十款折叠屏手机占据了 72.8% 的市场份额,其中 5 款都是小折叠。OPPO Find N2 Flip 正是这份榜单的第一名,甚至明显高于排在第二的华为 Mate X3。 不止轻薄,折叠屏消费者什么都想要 折叠屏手机,本质其实就是在接近常规手机尺寸的情况下,通过折叠屏幕的方式塞下一块更大的屏幕。而由此带来的厚度和重量问题,实际上也是长期困扰厂商和消费者的一大痛点。 前几年,手机厂商普遍受困于技术和工艺,大折叠手机要么像 vivo 一样做「加法」——塞下旗舰级的屏幕、芯片和影像等配置,代价是又厚又重的机身以及较高的定价;要么像 OPPO 或者荣耀一样做「减法」,优先降低重量、厚度和成本,再尽可能跟上旗舰级的核心配置。 不过到了今天,「厚重」已经不是最突出的痛点了。以前文所提的荣耀 Magic V2 为例,折叠状态下的厚度也仅有 9.9 毫米,重量也仅 231 克,大幅接近常规直板旗舰的水平。事实上,市面还有一些更轻、更薄的折叠屏产品。 荣耀 CEO 赵明发布 Magic V2,图/荣耀 相反,耐用性、性能以及影像表现越来越成为关注的重点。 这方面也从一些产品的迭代中看到,比如 OPPO Find N3 在重量相比前代甚至多了 6g(素皮版),但换来的是更旗舰的影像、屏幕和更高的耐用性。包括小米 MIX Fold 2/3 的迭代,也证明了消费者不再只想要一台足够「轻薄」的折叠屏手机,而是同时要求足够「旗舰」。 IDC 中国高级分析师郭天翔还指出,如果一味地追求「轻薄」而造成可靠性的下降,将会直接影响消费者未来长期的选择。 对于更多厂商而言,这种变化也意味着,在折叠屏手机的产品定义和宣发层面上,未来应该更多关注整体的产品力和折叠体验,而不只是聚焦「轻薄」。
被抛弃的虹膜解锁,被苹果最强产品吃上了
2013年,苹果在iPhone 5S上带来了「Touch ID」,用户可以将手指放在集成在home键内部的指纹识别器上,实现解锁手机、支付等安全验证。 四年后,iPhone X横空出世,取而代之的生物识别技术是「Face ID」。在刘海下,苹果放置了红外摄像头、泛光照明灯、环境光传感器、点阵投影器等多个元器件,组成了一套完整的面容识别系统。 但无论是「Touch ID」,还是「Face ID」,均没有出现在苹果刚刚发售的Vision Pro上。这台具有划时代意义的虚拟现实设备,采用了虹膜识别技术作为安全验证的方案,官方将其称之为「Optic ID」。 虹膜识别技术并不是新鲜玩意儿,在智能手机领域,三星、诺基亚均有过示范,而在头显市场,Hololens 2也采用了类似的方案。假如你曾体验过三星Galaxy S8上的虹膜解锁,那么你一定能明白为何这项技术一直不如指纹、面容,又或是声学这类生物识别技术一样,在主流消费市场里被广泛采用。 在安全验证上,苹果可以说是一直走在前沿,但我们却没有在Vision Pro上看到更新鲜的技术登场,而是已经被市场「抛弃」的虹膜识别。这一次,苹果又在打什么小算盘? Optic ID,有何不一样? 硬件上,Vision Pro在双眼覆盖的区域上放置了两颗朝下的摄像头与四个红外线传感器,但主要负责扫描用户虹膜的是一颗视觉摄像头。 苹果还特别标注,这种非可见光的LED红外线传感器在照亮眼部时,不会对眼睛造成伤害。 看起来,Optic ID的硬件构成和早前微软的Hololens 2并没有很大的区别,只是Vision Pro上的传感器更多一些,有助于提升识别效率。而工作逻辑上,Optic ID则要清晰得多。 据官网解析,Optic ID默认扫描双眼,且在每次成功验证后,会根据当前的情况更新最新的信息,这与Face ID的自主学习逻辑保持一致。“辅助功能”里还为用户提供了单只眼睛解锁的选项,或许是考虑到部分特殊群体的使用体验。 至于安全性,和之前苹果的任何安全验证方案一致,官方承诺这些验证数据、学习数据只会被发送到机内的Secure Enclave和Apple M2芯片神经引擎的一部分进行处理,不会上传到iCloud。当然,任何支持Face ID/Touch ID的应用,都能启用Optic ID进行安全验证,这意味着开发者不需要重新设计应用的解锁/支付模块。 Optic ID拥有更多传感器,能够更全面地捕捉虹膜数据,这是与当前大多数采用虹膜识别技术的智能设备稍微有些差别的地方。其次,Optic ID沿用了苹果早前的生物安全验证逻辑,会不断学习用户的状态,提高解锁效率。但大体方向上看,Vision Pro的虹膜识别,远没有到「革新」的程度。 Vision Pro有不得不选虹膜识别的理由 从安全性来看,虹膜是人体所有能用于生物验证的外置器官中最安全的一个,尤其是在非病变的情况下,虹膜纹路并不容易受到自然影响而改变。 设备特性上,Vision Pro是一台混合虚拟现实设备,而Face ID无法做到每次都扫描用户的全脸确认用户身份、Touch ID很难确保用户是否需要使用这个设备。所以,在用户经过佩戴、调整后,Optic ID进行身份验证,从而进入系统,是相对自然的操作逻辑。 另一方面,虹膜识别对于Vision Pro这类设备来说,基本没有任何学习逻辑,其机身内部设计的传感器始终锁定在眼部,假如是Touch ID,用户还需花费时间熟悉它的位置。 前面我们提到,虹膜识别在微软的Hololens 2上已经率先采用,作为安全验证方案而言,它的表现也是相对出色的。既然苹果现有的两种生物识别技术都不太适合Vision Pro,而声纹、静脉解锁又不够成熟,选择虹膜识别或许也是最好的结果。 当然,Optic ID于Vision Pro而言,也可以是苹果在安全验证上的一次新尝试,未来也能将这种方案应用到其他设备上,为这些设备制造更能吸引消费者的卖点,比如MacBook、iPhone,又或是还要等待好几年的苹果汽车。 可按照「前车之鉴」,虹膜识别还真不是一个善茬。 最安全的生物识别技术 为何「濒临绝种」? 2015年,富士通发布了中端机型Arrow NX F-04G,诺基亚也推出新一代旗舰机Lumia 950,两款机型唯一的共同点是支持虹膜识别。 虹膜识别初次应用在智能手机上,体验可以说是巨大的灾难。不可否认,虹膜识别安全度非常高,但识别效率远不如指纹识别,在效率与安全两个方向上,消费者们显然更追求二者的均衡。 到了2016年,三星也推出了支持虹膜识别的Galaxy Note7,由于这款机型同时还支持指纹识别,它的安全验证部分没有遭到太多吐槽。但到了Galaxy S8系列,后置指纹+虹膜识别的生物识别方案,就引起了不小的争议。三星坚持了几年的虹膜识别,最终也止步在Galaxy Note9系列。 这种生物验证设计,最大的问题在于应用场景。以手机为例,大多数用户拿起手机时,眼睛都不会正好对准位于屏幕顶部的红外传感器,这就导致在使用虹膜解锁时,必须调整自己的视线,才能精确地解锁。另外,虹膜解锁对于外部光照环境也有有求,高照度下解锁成功的几率被大大降低。 但虹膜识别在笔记本电脑、虚拟现实设备上的应用还是比较有前景。比如,微软在前几年就确立了以虹膜识别、面部识别、指纹识别为Windows Hello解锁的主要安全验证方案。很可惜,由于笔记本电脑正朝着轻薄化方向发展,配备指纹识别传感器,显然要比设计专门的红外传感器要更加节省空间与成本。 如今,苹果将虹膜识别技术引进Vision Pro,或许能给市场带来一些新的刺激,促使这项技术得到发展,让生物识别技术更加多样化。 生物识别技术未来会怎么样? 目前,生物识别技术基本可以分为虹膜、指纹、手掌静脉、人脸四种,安全等级依次递减。 在过去几年时间里,我们也看到了市场对这些生物识别技术在产品上的尝试,比如LG,就曾推出过配备静脉识别技术的智能手机。不过,对于大部分产品而言,已经找到了成熟又好用的方案,例如指纹识别/人脸识别于智能手机。 可以预见,随着虹膜识别技术再一次走到大众视野里,或许会带动厂商们尝试更多新的生物识别方案,尤其是在智能手机、PC、智能家居等还在静候新一轮增长的市场领域。 不过,生物识别技术在发展的特定时期很难说是先进还是落后,就像LG当初在LG G8推出的静脉识别没能成为主流,如今却在支付领域成为焦点。这样看来,生物识别技术的应用最重要的还是要等待合适的载体出现,这是厂商们在迎接新风口到来之时需要思考的问题。
逼近 GPT-4 的新模型发布!欧洲版 OpenAI联手微软,却被质疑违背初心
昨晚,号称「欧洲 OpenAI」的 Mistral AI, 发布了其最新的顶级文本生成模型 Mistral Large。 这一模型具备顶级的推理能力,可用于处理复杂的的多语言推理任务,涵盖文本理解、转换和代码生成。 简单画重点: 32K 的上下文窗口,精准提取大型文档信息。 精确的指令跟随能力,便于开发者定制审核策略。 支持函数调用和输出模式限制,助力应用开发规模化和技术栈现代化。 原生支持英语、法语、西班牙语、德语和意大利语,对语法和文化背景有深刻理解。 附上体验地址:https://chat.mistral.ai/chat Mistral AI 又放大招 Mistral Large 在多项基准测试中表现优异,成为全球排名第二的可通过 API 广泛使用的模型,仅次于 GPT-4,并将其他主流模型甩在身后。 与 LLaMA 2 70B、GPT-4、Claude 2、Gemini Pro 1.0 等一众主流模型对比,Mistral Large 在推理能力上展现出强大的实力。 在 MMLU、Hellas、WinoG 等多项常识和推理的基准测试中,Mistral Large 紧随 GPT-4 之后,远超其他模型。 在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测试中,Mistral Large 的表现明显优于 LLaMA 2 70B。 在编码和数学任务中,Mistral Large 同样表现出色。多项基准测试依然是遥遥领先。 此外,Mistral AI 还发布了针对延迟和成本优化的新模型 Mistral Small,性能超越 Mixtral 8x7B,但延迟更低。 在 Mistral AI 看来,Mistral Small 将是一个介于开源模型和旗舰模型之间的理想中间选择,享有与 Mistral Large 相同的创新优势,尤其是在 RAG(检索增强生成)启用和函数调用方面。 不过,Mistral Small 模型宣称的低延迟特性与 Mixtral 8x7B 相比提升有限,但其成本却显著增加,其中输入成本高出 2.8 倍,输出成本更是高达 8.5 倍。 Mistral Large 现已在 La Plateforme 和 Azure 平台上可用,并集成到了 Le Chat 中。Le Chat(法语直译为猫)是一个类似 ChatGPT 的 AI 聊天机器人,支持多语言交流。 用户可以在 Mistral Small、Mistral Large 以及 Mistral Next 三种不同的模型之间进行选择。不过,Le Chat 并不支持实时联网功能。 发布后不久,由于涌入体验的人群数量超出预期,Le Chat 直接崩溃了,截至发稿前,Le Chat 已恢复运行。 我们也第一时间体验了一下 Le Chat。取决于语言本身的复杂性和接受训练数据的数量和质量, Le Chat 在英文方面的表达能力较强,在其他语言方面,表达能力可能会因语言而异。 面对中文脑筋急转弯的拷问,Mistral Large 明显有点懵,缓了好一阵都没给出答案。 问题:蝴蝶,蚂蚁, 蜘蛛, 蜈蚣,他们一起工作,最后哪一个没有领到酬劳? 但换成英文,它就立马变身解题高手,答案条理清晰,逻辑满分,上升到「以人类为中心的工作和奖励视角」,但中文语境的脑筋急转弯可不按常理出牌,毕竟「蜈蚣」不受禄。 鸡兔同笼问题对 Mistral Large 来说,还没到小菜一碟的程度。线性方程组一摆,回答倒是很快就出来了,但答案中 16 只鸡和 19 只兔子并不正确。 问题:鸡兔同笼,共 35 只头,94 只脚,问鸡兔各多少? 这是一个经典的数学问题,可以使用线性方程组来解决。 假设鸡的数量为 x,兔子的数量为 y,则可以列出以下两个方程: 1. x + y = 35 (鸡和兔子的总数量为 35 只) 2. 2x + 4y = 94 (鸡有 2 只脚,兔子有 4 只脚,所以总共有 94 只脚) 将第一个方程中的 x 表示为 y 的函数,得到 x = 35 – y,代入第二个方程中得到: 2(35 – y) + 4y = 94 解方程得到 y = 19,代入 x = 35 – y,得到 x = 16。 因此,鸡有 16 只,兔子有 19 只。 可以用同样的方法解决后两个问题,答案都是鸡有 16 只,兔子有 19 只。 接着我们让 ChatGPT 给 Mistral Large 出一道数学测试题,上上强度,但整体表现不错: 小模型,大作为 Mistral AI 成立于去年 5 月份,公司员工仅 25 人,但其大语言模型早已在 Hugging Face 上名声大噪。 此前,我们曾报道过它发布了 Mixtral 8x7B,这款模型一经推出,瞬间引爆了开源界,让无数开发者夜不能寐。 虽然只有 46.7B 的参数规模, 擅长以小博大的 Mixtral 8x7B 在众多基准测试中的表现却能与 Llama 2 70B 和 GPT-3.5 媲美,甚至在某些测试中还略胜一筹。 Mistral AI 的成功秘诀在于它巧妙地融合了 AI 领域的三大核心要素—人才、数据、算力。 《经济学人》透露,Mistral AI 创始人和技术骨干均来自法国精英技术学院,并在 Google 和 Meta 等科技巨头的研究实验室积累了宝贵的业界经验。他们是全球为数不多,真正掌握如何培训前沿模型技术的专家。 其次,数据是 Mistral AI 成功的另一个法宝。Mistral 在模型数据培训上独具匠心,例如,模型能够有效地过滤掉重复或无意义的信息,使得模型更加精简高效,参数规模仅数十亿。 这就意味着,普通用户甚至可以在自己的个人电脑上轻松运行 Mistral AI 的模型。 对于 Mistral Large 的到来,图灵奖得主 Yann LeCun、以及英伟达高级科学家 Jim Fan 等一众大佬也纷纷在 X 上送上了祝贺。 目前,Mistral AI 的估值已经超过 20 亿美元,其背后的投资阵容的豪华程度,与世界顶级企业相比也毫不逊色。 从美国顶尖的风投公司如光速创投、红点创投、指数创投,到硅谷的风险投资巨头 a16z、英伟达、Salesforce、法国巴黎银行等,都对 Mistral AI 青睐有加。经过数轮融资,Mistral AI 也早已迈入了 AI 独角兽的行列。 微软昨天也宣布与 Mistral AI 建立新的合作伙伴关系,承诺和 Mistral AI 之间的合作集中在以下三个关键领域: 超算基础结构:微软将通过 Azure AI 超算基础结构支持 Mistral AI,用于 AI 训练和推理工作负载。 扩展市场:微软和 Mistral AI 将通过 Azure AI Studio 中的 MaaS 和 Azure 机器学习模型目录,向客户提供 Mistral AI 的高级模型。 AI 研发:微软和 Mistral AI 将探索合作,为指定的客户开发专有模型,甚至包括欧洲公共部门的工作负载。 但微软这一举动遭到了网友的质疑。X 用户 @osxzxso 暗讽微软试图采取一种「盘根错节」的策略来垄断市场。马斯克也在评论区以哭笑不得的表情包表示赞同。 Spreading Nutella on both sides of the bread I see 我看到在面包的两面都涂了花生酱 值得一提的是,细心的网友观察到,在 Mistral AI 推出新模型之后,其官方网站上关于对开源社区承诺的相关内容已经悄然消失,且新模型也不支持开源。 但 Mistral CEO Mensch 在接受《华尔街日报》采访时表示, Mistral AI 并未违背开源的初衷,而是采用同时推进商业化战略和维持开源承诺的双重策略。 显然,在构建商业模式和保持我们的开源价值观之间,我们需要找到一个细小的平衡点。我们希望发明新事物和新的架构,同时也希望向我们的客户提供更多可销售的产品。
欧洲市场、AI、5G…手机品牌“外卷”忙
文|Lee 昨天,2024年世界移动通信大会“MWC 2024”在西班牙巴塞罗那召开,现场有近300家中国企业出席,会议为期4天,将于2月29日落幕。 此次参会的中国手机品牌,展露了2024年手机品牌出海的一些新趋势。 01 “新兴市场”之外, 手机出海寻找新增量 过去十年,中国手机品牌已在全球市场占据巨大的市场份额,其中,以东南亚市场、南美市场、非洲市场、中东市场等市场为主流出海市场。 根据市场调研机构Canalys的数据,以2023年海外手机市场份额来看: 在东南亚市场,传音以16%的市场份额位列第二,小米和OPPO则以15%的市场份额并列第三。 在中东市场,中国手机品牌在市场前五名里占据三席,传音、小米、荣耀分列市场第2、3、5位。其中荣耀的全年市场份额同比增长156%,第四季度更是同比增长199%。 全局上,从手机品牌的全球排名来看,苹果和三星仍然牢牢占据前两位,小米、OPPO、传音则分列第3-5位。 过去两年,“行业寒冬”的氛围笼罩着全球手机市场。IDC《全球手机季度跟踪报告》显示,2023年全球手机出货量同比下降3.2%,是十年来最低全年出货量。但凭借在新兴市场的出色战绩,中国手机品牌抵住了这样的颓势。尤其是传音手机,是Top5手机品牌中,唯一一个全年出货量上涨的品牌,其在绝大多数市场的业绩也都保持了稳定增长——根据Canalys数据,传音在巴西市场增长29%,中东地区增长54%,非洲市场增长8%,拉美市场大涨110%,欧洲市场增长68%。 显然,以传音为代表的中国手机品牌从不饱和的新兴市场发力,一路“逆袭”,深度布局全球化。 2024年,中国手机品牌已经迈向新的海外市场扩张阶段:在本届MWC2024,中国手机品牌在采访中纷纷表示,要开拓新市场。 小米合伙人、集团总裁卢伟冰提到,“在欧洲市场,小米澎湃OS今年将首批覆盖3000万设备,未来目标覆盖1亿设备。” 荣耀CEO赵明表示,“将全力打造欧洲‘第二本土市场’。”也就是将欧洲打造成荣耀除中国外的“最重要的高端市场”。 传音也在不久前接受调研时表示,非洲—南亚是传音此前的发展路线,接连取得了不错的市占率,但接下来,公司还将进一步“深耕更多非洲和南亚以外市场”。 可以想见,过去中国手机品牌在出海第一阶段,为了打开市场,以「低价」「老人机」等优势打法,专攻单一市场;而如今,很多中国手机品牌已经顺利完成第一阶段,拥有了一些优势市场,且与此同时全球手机市场愈发饱和,在下一阶段,顺利开拓更多海外市场,多地区发展,将是很多中国手机品牌出海布局的重中之重。 02 得AI者得未来 在MWC2024上,「超越5G」「智联万物」「AI人性化」「数智制造」「颠覆规则」「数字基因」是6大核心领域,其中「AI」是手机品牌讨论的绝对重点话题。 在已经饱和的全球手机市场,AI技术领域是一块必争之地——它能为手机行业带来的颠覆式创新,可能会远超我们现在的想象。 一方面,当手机搭载了AI技术,用户的手机操作体验会更加丝滑。举个例子,使用手机拍照、创作图片甚至视频,都可能比过去更加便捷智能。在MWC上,OPPO就宣布,今年第二季度,“全球OPPOReno11系列及OPPOFindN3也将引入包括AI消除功能在内的一系列生成式AI功能。” 另一方面,AI技术与手机的结合,不仅是功能层面的叠加,还意味着更个性化、定制化的手机体验。 如同荣耀CEO赵明的观点,“很多厂商对AI手机的概念存在误解,能够提供生成式AI能力的手机并不等于AI手机。甚至相去甚远。真正的AI手机是可以发展的、可进化的、搭载的是个人化的操作系统,真正懂用户,而且每个人的AI手机都能提供千人千面的不同体验。” 除AI技术之外,中国手机品牌在MWC上,也更新了旗下多元化的产品矩阵的最新进展。比如,小米借此次MWC,向欧洲市场及全球消费者展示了SU7汽车,新能源车未来将成为小米出海的布局新重点;一加展示了一款“可续航12天”的新手表,一加Watch2;传音则以“Reach the Future”为主题,展示了“AI增强型仿生四足机器人Dynamic1”、“全球首款融合AR游戏眼镜”、“AR游戏套组Pocket Go”,这些依托AI、AR技术的新品展示了传音强大的产品设计和研发能力。 总之,“卷”AI,中国手机品牌是为了在全球手机行业频频变化的当下,踩准下一波浪潮;“卷”其他智能化设备,则是以成熟的产品矩阵,提高海外用户的品牌黏性,从而在海外获得更长期的健康发展。
AI,正在被手机厂商卷出形状
2024 年开年,手机厂商已经卷了起来。卷的方向,出奇地一致——AI。 从外网透露 iOS 18 將是 Apple 史上「最大」的更新,Siri 将进行大语言模型的升级、三星 S24 系列主打 AI 功能作为手机卖点,再到 OPPO 龙年除夕夜重磅宣布 OPPO 正式进入 AI 手机时代,春节期间为千万用户推送上百项 AI 系统功能更新,开年举行 AI 战略发布会,表示「为 AI 的战略投入没有上限」,AI 功能似乎成为手机厂商的兵家必争之地。 近期,笔者和一个不太关注科技行业的朋友,聊起了这一话题。他表示,AI 手机,能有什么新功能?感觉都是噱头。 聊起这件事的时候,我刚刚好正从 OPPO AI 战略的发布会回来。 2020 年就投入研发大模型的 OPPO,在战略发布会上,联合 IDC 共同发布了《AI 手机白皮书》。OPPO 把它对 AI 手机的理解,为什么 OPPO 要花极大的研发成本投入 AI 手机的研发,都写进了这份白皮书里。 OPPO AI战略发布会 | 图片来源:OPPO 我对他说,这你就不懂了。现在看过去,好像很多手机厂商宣布的 AI 功能还很初级,这是因为手机的 AI 功能尚且没有发展到其完全体。 完全体的 AI 手机,可不是你想的那么简单。 手机和大模型,天生一对 无论科技浪潮怎么变化,人作为一种碳基生物,根本需求是不会变化的。 人需要吃饭,需要出行,需要获取信息,需要记录生活,也需要和其他人交流。 而这些需求,目前都是由智能手机来满足。我们需要手机点外卖,叫车,搜索信息,拍照,发微信……手机仿佛我们的体外心脏,我们一刻也离不开它。 而众所周知,这一波 AI 浪潮的兴起,没有带来硬件上的突破,也没有让人们的需求发生根本性的变化,带来的是「智能」。而智能,本身并不能满足我们用户作为碳基生物的需求。 智能能够让效率提高,让流程简洁,智能加上任何事物,都能使它变得更加美好,但智能并不能单独存在。换言之,智能是一种高超的洞察,智能需要基础——数据。 而这些数据在哪?正在手机里。 作为我已经依赖了十年以上的设备,智能手机已经沉淀了我的太多太多信息。它知道我喜欢吃什么样的外卖,知道我喜欢和谁聊天,知道我关注什么样的信息,甚至知道我什么时候睡觉,什么时候起床。 作为媒体从业者,我常常需要出差到其他地区参加活动,我亲近的朋友和家人,有时候都不能确定我的行程,但是手机都知道。它不但知道我参加活动的具体时间,也知道我的机票的具体行程,知道我在搜索哪些信息,也完全知道这些问题的答案。 人们常常把大模型的智能形容为一个高效率的助手,它了解我的喜好,能够智能地帮我推荐信息,回答问题,甚至独立处理某些简单事务。那如果我有一个助手,它在哪里能够最好地了解我的喜好? 很明显,在我的手机里。 人们用手机记录生活 | 图片来源:视觉中国 PC 等设备固然端侧算力更强,然而因为其天然的不便携性,用户使用 PC 的场景,仍然更多地限于办公等严肃场景,很难沉淀用户打车、吃饭等种种生活中的偏好。没有这些数据,大模型的智能就无处发挥。 而未来会不会出现一个新的设备颠覆手机这个形态? 或许会有的,但现在看起来,仍然很难。 不管什么时候,人跟世界的联系无非就是通过眼睛、耳朵、触觉这几个有限的渠道。而其中最有效率的路径,必然是视觉,这再一次,是由我们作为碳基生物的生物性决定的。 即使有 Vision Pro 这样的硬件正在发展,目前看来,它仍然是手机的某种变体。一块便携的屏幕+芯片的算力,在未来十年,手机仍然将是最有可能是承载与我们的最亲密连接的设备。 而数据在哪,智能就在哪。未来的智能助手,必然在手机中。 一句指令,一步直达 手机,虽然与我们亲密无间,但不得不承认,智能手机发展了十年以上,有些操作仍然令人头疼。 我想去其他城市参加活动,虽然所有操作都能在手机完成,但体验呢? 完成一次完整的出行,我要在社交软件中收到活动地址,去天气 App 里输入一遍地址去查找当地的天气,去机票 App 里再输入一遍这个地址去查找机票,去出行 App 里再输入一遍这个地址打车,去搜索引擎里再输入一遍这个地址查找美食,最后回到社交软件中,把这些信息粘贴复制给朋友。 智能手机的计算能力已经如此强大,App 中的数据已经如此丰富,但我们的所有操作,仍然是割裂在不同的 App 中的。 其实回答都已经在手机里了,为什么我不能直接和手机讲,我需要去某地出差,请你直接帮我订机票,查美食,看天气,提醒我穿什么样的衣服呢? 答案起码部分与技术有关。 在智能手机出现的时代,人们早就设想过类似的事情,也出现了各种各样的智能助手。但在当时,没有一项技术,可以消化掉你所有的信息,理解你的所有意图,帮助你调用合适的功能。 手机中的智能助手 | 图片来源: GPT-4 生成 想要执行每一个特定需求,都需要专门写好一条规则,让手机来按照规则执行。 过去时代的智能助手。或许能够在你说出非常具体的歌名的时候,帮你播放歌曲,但复杂的需求,它就无法理解了,比如「我今天心情不好了,播放我喜欢在黄昏的时候听的歌,同时点一份我最爱点的奶茶吧。」 手机没有办法提前预测你的每一个随心所欲的需求,为它们各自写一条规则,更别说这些需求可能涉及到跨应用的调度了。 而大模型时代,技术,不再是瓶颈。大模型技术,最擅长的正是「智能」。 作为用户,应用和应用之间的崎岖土路,我们需要通过点选,复制,粘贴,切换,一步一步走过去,而内置在手机中的大模型不需要。它仿佛开着直升机,从一座城到另一座城,能够把你需要的所有东西一次性采购齐全,提供到你的手上。 你的「贾维斯」,和他的「贾维斯」不同 这样的未来已经不远了。 在白皮书中,OPPO 已经划出了一条这样的道路——OPPO 提出了 AI 超级智能体和 AI Pro 开发平台组成的 OPPO 1+N 智能体生态战略。 OPPO AI 生态战略 | 图片来源:OPPO 用白话来讲,这意味着 OPPO 已经想明白了 AI 手机必将走向这条路:一个智能的助手,能够调用无数个智能的应用。 一个智能的助手,由大模型赋能,了解用户画像,也就是 AI 超级智能体,而无数个智能的应用,解决我们作为碳基生物的基本需求,本身也是一个个智能体,沉淀了我们在不同领域的不同数据,提供智能的服务。 如同魔戒中,有精灵三戒、矮人七戒、人类九戒和至尊魔戒共二十枚戒指。至尊魔戒驾驭群戒:One Ring to rule them all, One Ring to find them, One Ring to bring them all, and in the darkness bind them. 能做到这一点,对于智能助手的智能能力,有很强的要求。一个「人工智障」,绝对撑不起这样的愿景。 在发布会上,OPPO 就提到未来的超级智能体,需要具备规划、记忆和工具能力。 规划能力,简单说,就是它可以自己帮你去做复杂任务。你告诉它,我要出门了,国庆节想去新疆,它会把这个行程生成出来。你不满意就让它修改。修改到满意后,它可以直接告诉你哪些平台上有什么合适的机票,哪些平台上的景点有合适的门票。 记忆能力,就是沉淀数据的能力。你跟它聊过天,它就记住了你的用户画像。你这个人的风格比较幽默,可能让超级智能体生成朋友圈文案的时候,它就会生成得好玩一点。你平常总是跟它聊一些特别严肃的事情,它生成的朋友圈文案可能就会严肃一点,这些是基于不断地跟你交互的记忆带来的。 你的「贾维斯」,和他的「贾维斯」不同 | 图片来源:GPT-4 生成 工具能力,就是前面说的「驾驭群戒」能力。大模型并不是什么都会,但它应该足够智能,可以去选择调用合适的三方工具。当你问法务问题,它就帮你找到合适的法务应用推荐给你,你问金融问题,它就帮你找到金融专业应用推荐给你。 这个智能助理,不单单拥有智能能力,还会不断学习你的喜好。 未来,AI 手机的完全体中,智能助手能够真正成为你的秘书一样的存在。在一个秘书已经非常了解你的情况下,换一个秘书,所有的你的偏好你都需要重新教一遍,你还愿意换手机品牌吗? 正是面对这样的未来,哪家手机厂商不全力投入 AI,就会错过未来率先将这样的 AI 助手带给用户的机遇。即使苹果公司,也无法承受这样的后果。2023 年,苹果公司就曾经因为在 AI 上发力不足,受到分析师质疑,认为其恐失市值头把交椅。 这也是为什么各家厂商现在正在卷 AI 的原因。而 OPPO 这样,从 2020 年就开始发力大模型,全力投入 AI 的公司未来将更有机会为用户带来更好的手机。 对于用户来说,这样的手机厂商内卷,是绝对的好事。要达到「至尊魔戒驾驭群戒」,不仅需要手机厂商全力推动智能能力本身的进步,建设出一个智慧的「至尊魔戒」,也需要整个应用生态,都能认知到这一点,建设出丰富的「群戒」能力,配合提升用户的体验。 这需要苹果、OPPO 这样的公司,都能站出来,讲出自己的认知,孵化出 AI 手机的雏形,推动行业共同向前。看到,永远是做到的第一步。 在 OPPO 等公司的全力推动下,真正智能的 AI 手机,正在一步步被手机厂商卷出形状。 AI 手机的完全体,或许已经不远了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。