行业分类:
加载中...
头条分类:
加载中...
揭秘Sora:开发团队成立不到1年,核心技术曾因“缺乏创新”遭拒绝
原标题:揭秘Sora:开发团队成立不到1年,站在谷歌肩头,核心技术曾因“缺乏创新”遭拒绝 2月16日,OpenAI的AI视频模型Sora炸裂出道,生成的视频无论是清晰度、连贯性和时间上都令人惊艳,一时间,诸如“现实不存在了!”的评论在全网刷屏。 Sora是如何实现如此颠覆性的能力的呢?这就不得不提到其背后的两项核心技术突破——Spacetime Patch(时空Patch)技术和Diffusion Transformer(DiT,或扩散型 Transformer)架构。 《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一William Peebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。 如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间还尚未超过1年。 核心突破一:时空Patch,站在谷歌肩膀上 此前,OpenAI在X平台上展示了Sora将静态图像转换为动态视频的几个案例,其逼真程度令人惊叹。Sora是如何做到这一点的呢?这就不得不提到该AI视频模型背后的两项核心技术——DiT架构和Spacetime Patch(时空Patch)。 据外媒报道,Spacetime Patch是Sora创新的核心之一,该项技术是建立在谷歌DeepMind对NaViT(原生分辨率视觉Transformer)和ViT(视觉Transformer)的早期研究基础上。 Patch可以理解为Sora的基本单元,就像GPT-4 的基本单元是Token。Token是文字的片段,Patch则是视频的片段。GPT-4被训练以处理一串Token,并预测出下一个Token。Sora遵循相同的逻辑,可以处理一系列的Patch,并预测出序列中的下一个Patch。 Sora之所以能实现突破,在于其通过Spacetime Patch将视频视为补丁序列,Sora保持了原始的宽高比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理步骤。 记者注意到,OpenAI发布的Sora技术报告中透露了Sora的主要理论基础,其中Patch的技术论文名为Patch n' Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution。记者查询预印本网站arxiv后发现,该篇研究论文是由谷歌DeepMind的科学家们于2023年7月发表的。 图片来源:arxiv.org 图片来源:Google Scholar 核心突破二:扩散型Transformer架构,相关论文曾遭拒绝 除此之外,Sora的另一个重大突破是其所使用的架构,传统的文本到视频模型(如Runway、Stable Diffusion)通常是扩散模型(Diffusion Model),文本模型例如GPT-4则是Transformer模型,而Sora则采用了DiT架构,融合了前述两者的特性。 据报道,传统的扩散模型的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片时,逐步减少噪点,直到还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。 OpenAI发布的Sora技术报告透露,Sora采用的DiT架构是基于一篇名为Scalable diffusion models with transformers的学术论文。记者查询预印本网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William (Bill) Peebles和纽约大学的一位研究人员Saining Xie共同发表。William (Bill) Peebles之后加入了OpenAI,领导Sora技术团队。 图片来源:arxiv.org 然而,戏剧化的是,Meta的AI科学家Yann LeCun在X平台上透露,“这篇论文曾在2023年的计算机视觉会议(CVR2023)上因‘缺少创新性’而遭到拒绝,但在2023年国际计算机视觉会议(ICCV2023)上被接受发表,并且构成了Sora的基础。” 图片来源:X平台 作为最懂DiT架构的人之一,在Sora发布后,Saining Xie在X平台上发表了关于Sora的一些猜想和技术解释,并表示,“Sora确实令人惊叹,它将彻底改变视频生成领域。” “当Bill和我参与DiT项目时,我们并未专注于创新,而是将重点放在了两个方面:简洁性和可扩展性。”他写道。“简洁性代表着灵活性。关于标准的ViT,人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。” 图片来源:X平台 不过,他认为,关于Sora仍有两个关键点尚未被提及。一是关于训练数据的来源和构建,这意味着数据很可能是Sora成功的关键因素;二是关于(自回归的)长视频生成,Sora的一大突破是能够生成长视频,但OpenAI尚未揭示相关的技术细节。 年轻的开发团队:应届博士带队,还有00后 随着Sora的爆火,Sora团队也来到世界舞台的中央,引发了持续的关注。记者查询OpenAI官网发现,Sora团队由William Peebles等3人领导,核心成员包括12人。从团队领导和成员的毕业和入职时间来看,这支团队成立的时间较短,尚未超过1年。 图片来源:OpenAI官网 从年龄上来看,这支团队也非常年轻,两位研究负责人都是在2023年才刚刚博士毕业。William (Bill) Peebles于去年5月毕业,其与Saining Xie合著的扩散Transformer论文成为Sora的核心理论基础。Tim Brooks于去年1月毕业,是DALL-E 3的作者之一,曾在谷歌和英伟达就职。 图片来源:William (Bill) Peebles个人主页 团队成员中甚至还有00后。团队中的Will DePue生于2003年,2022年刚从密西根大学计算机系本科毕业,在今年1月加入Sora项目组。 图片来源:Will DePue个人主页 此外,团队还有几位华人。据媒体报道,Li Jing是 DALL-E 3 的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位,于2022年加入OpenAI。Ricky Wang则是今年1月刚刚从Meta跳槽到OpenAI。其余华人员工包括Yufei Guo等尚未有太多公开资料介绍。
高合停产6个月,剩下的新能源可能也要死90%…
不知道大伙发现没,最近倒闭或者快要倒闭的车企,好像变的越来越多了。 威马前脚才刚走没多久,前两天又有媒体爆料,说中东土豪当时答应要给高合的巨额投资,压根没有谈妥。 还有许多网友曝光,说高合不仅车交不出来,员工的工资也发不出来,甚至连展厅都租不起,纯纯要跑路的节奏。 虽然之前他们辟过谣,但就在今天,高合干脆就直接宣布停工停产6个月,这可不算什么好消息。 去年六月份的时候,余大嘴在中国汽车重庆论坛上表示,到了 2030 年,中国市场的主要玩家数量会小于 5 家。 米车的雷军,零跑的朱江明甚至是高合的丁磊,其实也都说过类似的话。 反正就是不挤到头几名,日子就没法过。 合理吗,好像也合理,毕竟连高合背景这么硬的公司都快玩不下去了,说明现在的市场竞争真的是很激烈。 不合理吧,好像也不合理,毕竟现在市场上卖的还不错的车企,满打满算至少有十几二十家。随便摘出一个都是一身的绝活。 要说过个十年大多数都会消失,听起来好像也有点夸张吧? 今天脖子哥就来给大伙盘一盘,余大嘴和雷布斯的观点到底有没有道理。 要说造车这事儿,大伙可能会觉得只要钱够多,零部件都找供应商买,是个人都能干。 但放在整个制造业里来看,汽车行业的准入门槛其实相当之高,因为它不仅超级花钱,还超级花时间。 从流程上看,想把把一台车从图纸上搬到商场里,大概要经历立项、研发、验证、生产制造以及销售这几个大阶段,每个阶段还能再分成很多小项。 里头随便挑一个,背后都是几个亿甚至几十个亿的投入。 就比如研发,大众之前就说过自己研发第八代高尔夫总共花了 22 亿美元,这里头除了大头是研发人员的工资以外,像模具开发、样件制作、实验测试这些环节也都是嘎嘎费钱。 风洞知道吧,就 MEGA 和 SU7 都吹过的那个,一小时 3 万块,试验一次就得花出去一台车的钱。 最终可能就是能让后视镜的造型好看点。 生产制造环节需要的设备和材料成本就更不用说了,别看汽车的工厂里看着好像很简陋,你就站在里头随便指,甭管指到啥肯定都贵的离谱。 产线上的机械臂,差不多 100 万一个。边上那个铁坨子压铸集群,一套小几个亿。 就连地上这些个运零件的 AGV 小车。。。 都得十几二十万一个。 所以,想要自己造一个工厂基本就是几十亿打底,上不封顶,可能还得造好几座。 这还只是能花钱解决的部分,就算啥都搞定把原型车做出来了,还得把它拉到不同的实验场地做整车匹配、电气架构、动力标定、安全检查等种种验证,还有高温、高寒、高海拔地狱级耐久测试等着。 要是没过,就得打回去重做。 一来一回,打磨一个好产品大多都得花费个好几年的时间,没点家底还真就耗不起。 所以很长时间以来,汽车一直都是一个马太效应非常明显的行业,也就是强者变得越来越强,弱者变得越来越弱。 那些销量特别好的汽车集团因为能有稳定的资金收入,就能把更多的钱花在研发新产品、扩建新工厂上。 每隔一两年就能搞出用上新技术的新车型,就会吸引更多的人去买他们车,就这样一直滚雪球。 滚着滚着,那些个销量不太好、没钱搞研发、产品越来越落后的小车企就被滚没了。 运气好的,像劳斯莱斯、 mini 这些还有利用价值的就会被那些大集团收编。 运气不好的,像什么罗孚、萨博之类的,就彻底变成时代的眼泪了。 这也就导致过去几十年里,全世界的汽车品牌数量一直在减少。少到现在,就变了少数几个大集团,各自带着手下的牌子们相互竞争。 前十个销量最高的汽车品牌或者集团,就占了全球销售份额的 75% 。 真就和余大嘴说的一样,不剩几个头部玩家了。 到这肯定有朋友会说,诶,打住,这都是以前油车的历史了,现在新能源的迭代速度已经快了不少,技术门槛也没有之前高了,得按电子产品算! 那我们就来看看电子产品领域的规律是啥样的。 根据 Counterpoint 的统计, 2017 年的时候全世界一共有 720 多个手机品牌,截止去年就只剩下 250 家了,嗝屁了接近 3 分之 2 。 当年什么金立、波导、锤子,甚至连 htc 、诺基亚这些红极一时的大品牌,现在坟头草都两米高了。 为啥?原因和汽车如出一辙,就是想做小品牌实在太难。 虽说表面上造手机很简单,大家还老调侃说谁还不是个供应链整合商,但这就真只是小打小闹,根本做不成主流。 就不说苹果和华米 OV 这些大厂,每年会花上百亿千亿做研发了,单就市场上的顶级供应商,也不是想用就用的。 传说雷总当年为了拿下三星一流的屏幕供应,前后飞了好几次韩国,低声下气地才搞定了那些三星高管。 当年锤子吐槽富士康产线不行,把富士康给气走了,后面良品率就变得更低了。 所以说因为规模效应在,这些出货量贼大的大厂可以把成本控制在很低的水平,搞的现在一两千的价位里,都能见到用上 1T 内存、高性能芯片、超级快充和 1 亿像素相机的性价比怪兽了。 这让那些杂牌手机怎么玩,直接就被卷没了。 导致最后的的主流玩家,也就剩下那么几个了。 比如果子,在近十年里头的每一年,都能以不到 20% 的市场占有率,获得 80% 上下的市场利润,最恐怖的时候甚至蹦到了 91% 。 去年全球销量前 5 的手机品牌,合起来也吃下了近 7 成的市场份额。 剧情和汽车那边简直一毛一样是吧。 其实类似像手机格局的例子其实还有很多,比如汽车零部件供应商,现在说得上话的也只有博世、大陆、法雷奥这些老炮儿了; 最近几年大火的动力电池,卷到现在也马上就要变成宁德 LG 和比亚迪三足鼎立了。 所以啊,但凡是涉及到科研、生产和制造的超重资产行业,最后大概率都会变成赢家通吃的情况。 那我们再回到一开始的问题,国内的车企会不会变得越来越少呢? 我觉得是会的。 因为不管是在过去,现在还是未来,决定一个车企能不能活下去的标准是一直在变的,而且只会变得越来越严。 以前,车企能不能活只需要看政策。 就像当年的新能源国补,那直接就是把真金白银的补给车企,砸钱鼓励大家做新能源车。 只要你想做,就有补贴拿。 从 2010 开始到现在十三年,新能源国补总共补了得有 2000 多亿,最高的时候一年就补了 400 多亿,直接催生出了一大批只靠 PPT 和车模就能骗到补贴的假车企。 2018 年之后,国补开始减少下滑,到了现在彻底归零,那批车企顺道也就寄了。 现在,车企过得好不好得看自己的家底。 经过几年的大浪淘沙以后,虽然蔚小理这些品牌都活下来了,但因为像是自动驾驶、电池电驱这些技术的进步速度实在是太快,不仅每年还是要花大价钱搞研发、多建产线保证交付的速度,还得支持销售网络的日常开销。 像比亚迪,别看它去年的净利润有两三百亿,但它总的营收估计有四五千亿。 相当于每个月,都得花几百亿用于维持日常运营和产品研发。 啥概念呢,波音 737 700 的价格是 7700 万美元,比亚迪的花销一个月能买大几十台。 体量没这么大的,理想,一个季度的开支也有一百亿左右;小鹏,小几十亿;最狠的就是蔚来,每个月还得亏上个十几亿。 这么着没有上限的花钱,真不是一般品牌能顶住的。 就比如的已经破产的威马和 “ 可能 “ 就要破产的高合,就是因为一边在咔咔烧钱,另一边车子少人买,许久没能盈利,最后把底裤烧穿了。 所以大伙可以看看现在还有啥品牌是只有声量没有销量的,下一个没的可能就是它。 举个例子,比如美国在巅峰的时候,同时存在过 1500 个汽车品牌。 但最后他们因为技术路线太像,要么就是被通用和福特用技术类似、价格更低的产品挤死,要么就是成了巨头的一部分。 红极一时的普利茅斯猎兽 有幸存者吗?有,很少。 比如特斯拉,不仅活过了一轮轮的淘汰赛,还慢慢变成了全球最大的新能源车企,自己成巨头了。 要说为啥,因为它手上的技术,像自动驾驶、电路集成和材料技术,当时世界上的几个巨头手里都没有,没法用类似的产品把它卷死。 所以特斯拉不仅活下来了,甚至直接开启了世界新能源大赛的序幕。 这说明啥?说明想要从巨头的手里活下来,唯一的方法就是抢在他们前头把优势占住了,让他们无路可走。 回过头来看国内,虽然很多新势力已经赶在大集团的前面,又是搞纯电架构又是搞智能驾驶,甚至像理想这种专注家用赛道的品牌,都已经撬动 30 万以上豪华车型的基本盘了。 可只要巨头们看到哪个细分市场有价值,自己手上又有对应的技术,那往里进军肯定就只是时间问题。 还是用比亚迪举例, 2024 年比亚迪的销量目标估计会在 360 万台左右,只比去年多了 60 万台。 这么不激进的目标背后有一句潜台词,那就是它今后的方向是在稳住基本盘的时候,去拓展那些更小众的市场。 所以,现在比亚迪的下头已经分化出了了仰望、方程豹这些中高端的小众品牌,智驾智舱什么的也都安排上了。 还不止它,像吉利下面的极氪领克,最近也跟开了窍一样,搞出了好多又便宜素质又不差的车型。上汽下头的智己,马上也有大批新车加入战斗。 在这些集团慢慢拓展领土的时候,如果新势力手上没有差异化的技术,结果必然是被吞并或是消失。 所以我觉着,之前的大浪淘沙只不过是开胃小菜,新能源的决赛圈现在才刚刚开始。 2023 年淘汰了两家, 24 年可能就是 3 家甚至是 4 家。 看看现在还活着的车企们,大伙觉得,有谁是能活到最后的呢? 点击图片跳转视频! 撰文:致命空枪 编辑:脖子右拧&结界 封面:焕妍 图片资料来源: 2013-2023年全球智能手机出货量排名,明年智能手机市场将全面反弹 Nearly 500 Brands Exited Smartphone Market During 2017-2023 全球第四大汽车集团正式诞生!PSA与FCA将于本月16日完成合并 比亚迪2023年度业绩预告:盈利增长74%至86%,新能源车销量创新高 四部门发布开展私人购买新能源汽车补贴试点通知 威马破产:车机变砖、售后无门,10万车主选择自救 91%的利润流进苹果口袋 最赚钱国产手机每台仅赚100元 “炮王”的回归之路 22亿美元砸在高尔夫上 是挥霍还是质的改变? 网友爆料高合:供应商不发货,现金流也断,会是下一个威马?
惊动美国白宫、有公司被骗2亿港元,AI“深度伪造”的罪与罚
生成式人工智能(GAI)时代,似乎没有什么不能被颠覆,连人们一直坚信不疑的“眼见为实”“有图有真相”也逐渐成为空话。 今年春节期间,OpenAI发布的文生视频模型Sora横空出世,被认为是“AGI(人工通用智能)的重要里程碑”,将颠覆视频内容生成方式。Sora的出现,振奋科技圈的同时也衍生出了担忧的情绪。有专家称,这类技术可能会导致“深度伪造”视频增多,让人难以识别真伪。OpenAI自己也承认,无法预测人们使用Sora的所有有益方式,也无法预测人们滥用它的所有方式。 Sora根据提示词生成的视频画面截图 图片来源:OpenAI官网 在Sora诞生之前,AI“深度伪造”技术已经在海内外引发担忧,知名明星与跨国公司相继成为AI“深度伪造”的受害者。今年1月底,明星泰勒·斯威夫特(Taylor Swift,中文绰号“霉霉”)大量虚假“不雅照片”在社交平台上传播。此事震动美国白宫,并掀起一波关于人工智能的担忧。2月4日,据香港文汇报报道,有诈骗集团利用AI“深度伪造”技术向一家跨国公司的香港分公司实施诈骗,并成功骗走2亿港元,这也是香港迄今为止损失最大的“换脸”案例。 诸如此类的案例越来越多,人工智能带来的新型焦虑正在形成。瑞莱智慧Real AI联合创始人&算法科学家萧子豪在接受《每日经济新闻》记者采访时就表示,他们判断,2024年这种利用AI“深度伪造”技术实施的诈骗案件会进一步增加,因为“深度伪造”技术工程化落地速度很快,“即使是不了解技术的普通人,也能够制作‘深度伪造’的内容”。 娱乐还是犯罪? “深度伪造”一词译自英文“Deepfake”(deep learning和fake的组合),现亦称深度合成(Deep Synthesis)。“Deepfake”诞生于美国。2017年,美国一名为Deepfake的用户在社交网站Reddit上发布了一则与知名演员有关的伪造视频,这项技术随后被迅速应用到多个领域,包括色情、政治、广告、娱乐等。 上海合合信息科技股份有限公司(以下简称“合合信息”)图像算法研发总监郭丰俊告诉《每日经济新闻》记者,在国内,“深度伪造”技术有积极应用,也有负面应用。 积极应用往往在于:一、个人娱乐。一些APP可为用户提供艺术照模板,通过换脸形式生成用户照片,用户足不出户也能“拍”出好看照片。此外,“深度伪造”技术也可用于制作搞笑视频、模仿名人表演,但这可能涉及版权和道德等问题;二、教育。Deepfake技术合成的历史人物讲解视频让教学更有趣味性;三、影视制作。如电影、电视剧及综艺节目中演员换脸,纪录片中为保护参演者隐私和安全而换脸等;四、医疗。医院描述或诊断患者面部肌肉疾病时,如果将患者人脸打马赛克,就看不出面部症状,这时应用Deepfake技术,可把病人视频里的脸,换成一张假脸,既可以保留人脸的运动信息,亦保护了病人隐私;五、艺术。比如有美术馆利用Deepfake技术让已故的艺术家“现身”讲述自己的故事和作品等。 但现实生活中,“深度伪造”技术也被广泛应用于诈骗、色情等非法场景。比如,一些不法分子借助“深度伪造”技术散布虚假视频,甚至制造虚假新闻,危害社会;随着视频换脸技术门槛降低,别有用心之人利用“深度伪造”技术可以轻易盗用他人身份,实施商业诋毁、敲诈勒索、网络攻击和犯罪等。 记者注意到,目前,海内外均有大量由“深度伪造”技术引发的深度造假案例,这些案例普遍造成了不小的负面影响。 比如,近日被传出大量虚假“不雅照”的泰勒·斯威夫特。据九派新闻报道,泰勒·斯威夫特正考虑对生成这些图片的网站采取法律行动。1月26日的美国白宫记者会上,发言人让-皮埃尔被问及此事时表示:“我们对此类图像流传感到担忧,更确切地说,是虚假图像,这令人担忧。”据澎湃新闻报道,这不是泰勒·斯威夫特第一次被AI“造假”。在这次“不雅照”事件前不久,一则由人工智能生成的泰勒·斯威夫特带货广告在海外社交媒体上传播。这则虚假广告利用“深度伪造”技术,合成“霉霉”的声音,并将声音及她的形象和某品牌炊具广告片段拼凑在一起,以“霉霉”身份宣称免费向粉丝赠送炊具,引导受害者点击并支付9.96美元运费,但炊具不会真的送出去。 泰勒·斯威夫特深受“深度伪造”困扰的背后,女性正成为不法分子实施侵害的重要目标群体,他们利用“深度伪造”技术制造各种女性不雅视频、图片牟利。据网络安全研究机构Sensity在2020年秋季发布的报告,在Telegram的应用中,至少有10.48万名女性“被裸体”,而在分发这些照片的7个频道中,累计用户超过10万。根据Sensity的追踪调查,Telegram应用中超七成的使用者表示他们上传的照片是通过社交平台,或其他私人渠道取得的。 英国Wired杂志于2020年发布的一篇报道也曾指出,2020年7月以来,至少有10万名女性被“深度伪造”应用DeepNude(深度伪造软件,现已下架)创建了裸照,其中一些人不到18岁。 一些国家的政客也成为不法分子制造虚假视频的对象。1月21日,美国新罕布什尔州一些选民称接到了“拜登总统”的自动留言电话,告诉接听者不要在该州初选中投票。美国白宫新闻秘书卡琳·让-皮埃尔(Karine Jean-Pierre)次日回应称:“那通电话确实是假的,(拜登)总统没有录音。我可以证实这一点。” 更严重的还有,Deepfake甚至参与到了战争当中,成为“新型武器”。2022年3月,一条乌克兰总统弗拉基米尔·泽连斯基(Volodymyr Zelensky)的“视频”被广泛传播,在该视频中,泽连斯基呼吁乌克兰士兵放下武器投降。事件发生后,乌克兰国防部在其海外社交媒体官方账号发布了泽连斯基的视频,并配文称:“请注意,这是不可能的。” 在国内,中国香港近期发生了一起规模庞大的AI“深度伪造”诈骗案。诈骗者通过搜集一家跨国公司英国高层在YouTube上的公开影像,再利用AI“深度伪造”技术,给诈骗者换上公司高层的面部和声音,从而实施诈骗,并成功从香港分公司骗走2亿港元。这起巨额诈骗案发生前,今年1月中下旬,香港特别行政区行政长官李家超也成为“深度伪造”的目标。网上出现了用人工智能伪造的电视节目片段,冒称李家超向市民推介一项高回报的投资计划。特区政府立即严正澄清,称有关影片全属伪造,行政长官从未作出相关言论。 去年5月初,内蒙古包头市公安局电信网络犯罪侦查局发布一起使用智能AI技术进行电信诈骗的案件。福建省福州市某科技公司法人代表郭先生的“好友”突然通过微信视频联系他,声称自己的朋友在外地投标,需要430万元保证金,想借用郭先生公司的账户走账。基于视频聊天信任的前提,郭先生并未核实钱是否到账,就陆续转给对方共计430万元,之后郭先生才发现被骗。 个人娱乐方面,北京市中闻(长沙)律师事务所律师刘凯告诉《每日经济新闻》记者,2022年8月,成都铁路运输第一法院曾一审审理了一批使用“AI换脸”App程序侵害他人肖像权的案件。古风汉服网红魏某起诉了4家运营AI换脸软件的公司,认为对方在自己未授权的情况下上传包含她肖像的视频作品,生成AI换脸视频,侵犯了其肖像权。记者了解到,国内之前涌现过一批换脸APP,但这些APP中有部分目前已经被下架,如ZAO、去演等。 大模型技术正降低“深度伪造”门槛 “深度伪造”是指利用深度学习技术生成合成图像、音频或视频的技术。由于公众人物的视频、音频、图片资料的公开性,为AI训练提供了大量素材,因此,这些名人频繁成为AI造假的“受害者”。从技术原理上看,“深度伪造”的实现主要依赖于深度神经网络,特别是生成对抗网络(GAN)。通过训练大量的面部图像数据,“深度伪造”模型能够学习面部特征之间的潜在关系,并生成与真实面部特征高度相似的虚假面部特征。 郭丰俊告诉记者,“深度伪造”与国内常见的“AI换脸”不能等同,后者只是前者的一种典型应用形式。“当谈到Deepfake技术时,国内和国外的研究团队都已经达到相当高的技术程度。相较于国内,国外拥有更多的应用程序和网站,这些平台提供了更多Deepfake制作工具,使用户能够相对容易地生成和分享Deepfake内容。” 运用Sora也可以生成高清图像 图片来源:OpenAI官网 浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林也告诉记者,国外对此类“深度伪造”算法限制较少,应用工具较多。在工具丰富的背景下,这项技术的普及度就相对高。“国内是有一定使用限制的,我们有监管。”盘和林表示。 萧子豪则提到,其实国内通过“AI换脸”实施的诈骗还是很常见,只是大众接触到的案例较少。一方面,太多案例可能会造成大众恐慌;另一方面,这些案例广泛传播可能会给犯罪分子以诈骗“灵感”。他透露,瑞莱智慧已经帮助很多银行在金融场景抵御AI换脸诈骗的攻击。 他认为,随着AI技术的发展与普及,“深度伪造”技术在犯罪中的应用确实呈现出增加的趋势,“而且我们判断,在2024年这种利用深度伪造实施的诈骗案件会进一步增加”。萧子豪给出的理由包括,随着“深度伪造”相关软件和工具的开发普及,即使是不了解技术的普通人,也能制作深度伪造的内容。此外,AI技术的进步也让“深度伪造”内容产生的速度更快、更难被人眼识别。 “大模型技术能够用更少的人脸数据来给特定人构造高逼真的人脸模型,降低了不法分子制作人脸视频的成本。”萧子豪说。 对于“深度伪造”技术应用不当可能带来的社会危害,郭丰俊认为,虚假合成影像可能会冲击社会信任、媒体信任,严重时还会威胁社会公共安全。此外,深度造假影像还可能会让公司名誉、财产遭受损失,还能令个人名誉、财产、精神受到损害。 目前法律法规是否足够完善? 大量深度造假视频或图片的出现,让海内外衍生出新一轮AI担忧。 据央视新闻,今年1月“假拜登来电”引发美国社会关于人工智能“深度伪造”可能影响大选的讨论,同时也延伸带出美国相关的监管政策和立法跟进迟缓的质疑。美国政府监管组织“捍卫公众利益组织”负责人罗伯特·韦斯曼批评称,政治“深度伪造”时刻已经到来,政策制定者必须尽快采取保护措施,否则将面临选举混乱。“深度伪造”会播下混乱的种子,使欺诈行为永久化。美国消费者技术协会首席执行官夏皮罗认为,“政府需要在人工智能领域扮演重要角色,确保设置安全屏障和护栏,让产业内人士知道,哪些能做,哪些不能做”。 泰勒·斯威夫特AI不雅照事件发生后,盘和林曾对外发布署名文章《用AI打败AI“深度造假”》。该文章同样提到,美国虽然已经在推动AI立法,但大部分提案还停留在纸面阶段。 相对于美国,中国在“深度伪造”方面的立法走得相对靠前。记者获悉,早在2019年11月,国家互联网信息办公室、文化和旅游部、国家广播电视总局便联合印发《网络音视频信息服务管理规定》,并于2020年1月1日起施行。该规定对网络音视频服务的使用者和提供者均提出要求,即利用基于深度学习、虚拟现实等的新技术新应用制作、发布、传播非真实音视频信息的,应当以显著方式予以标识,不得利用基于深度学习、虚拟现实等的新技术新应用制作、发布、传播虚假新闻信息。 图片来源:每日经济新闻 刘国梅 摄 2022年,国家互联网信息办公室、工信部和公安部制定的《互联网信息服务深度合成管理规定》明确,深度合成服务者应采取技术或人工方式对使用者的输入数据和合成结果进行审核。去年8月,国家互联网信息办公室还在《人脸识别技术应用安全管理规定(试行)(征求意见稿)》中明确,人脸识别技术使用者应每年对图像采集设备、个人身份识别设备的安全性和可能存在的风险进行检测评估,采取有效措施保护图像采集设备、个人身份识别设备免受攻击、侵入、干扰和破坏。 刘凯向《每日经济新闻》记者表示,实际上,目前世界各国对于“人工智能/Artificial Intelligence”未有一个确定的最终定义,均是作为一类计算机应用的统称。“就我了解到的情况,目前世界上也没有国家制定一部专门针对人工智能的统一监管规则。” 不过,我国在人工智能的立法方面紧跟行业前沿,这两年陆续出台《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理办法》三部主要法规,加之此前出台的《网络安全法》等系列法律法规,可以说已经为人工智能打造了多元化监管格局,实现了多维谱系法律法规协同治理。 “对于泰勒·斯威夫特AI不雅照的深度伪造,在我国的法律规定中可适用的主要条文有:《民法典》第一千零一十九条第一款、《互联网信息服务深度合成管理规定》第十四条第二款、《生成式人工智能服务管理暂行办法》第四条第四款规定。”刘凯说。 攻与防:AI打败AI可行吗? 身处生成式AI时代,如何有效监管和减少“深度伪造”产生的虚假信息,成为全球关注的一项重要议题。盘和林在《用AI打败AI“深度造假”》一文中曾提及一个观点:“能够监管生成式AI的,不是工业时代的法律条文,而是AI技术自身。我们不但要发展AI技术,更要让正义力量尽可能多地掌握AI技术,这样才能对不法分子形成技术压制。” 那么,用AI打败AI造假可行吗? 对此,郭丰俊告诉记者,“国内做AI篡改鉴别的企业已有不少,既有如中国电信这样的央企,又有如瑞莱智慧、中科睿鉴这类大学/科学院孵化的科技公司,还有网易、合合信息这样深耕AI行业多年的企业。”他还进一步指出,国内科研团队在“深度伪造”鉴别方面已处于世界先进水平。不同的国内研究团队多次在国际知名篡改检测大赛中获得冠亚军的好名次。 以合合信息自身为例,郭丰俊透露,公司在文档/证照图像上有较多的AI篡改检测技术积累。目前,合合信息研发的针对证件及票据图片的AI篡改检测与定位技术、AI甄别伪造人脸图像的技术等已经在金融、保险行业得到广泛应用。除了金融安全场景,郭丰俊认为,虚假新闻判断、谣言识别与分析等公共安全、媒体内容安全场景也有大量的需求,合合信息正积极探索这些场景的技术应用。 萧子豪表示,瑞莱智慧从2018年开始就持续关注“深度伪造”技术,并一直投入研发资源进行“深度伪造”的检测与防御。“例如2023年,我们帮助某银行在转账业务场景下防御了上千次深度伪造攻击。” 图片来源:公司官网 他告诉记者,瑞莱智慧一直在研发迭代更先进的算法,同时也研发了一整套深度伪造攻防靶场系统,通过自动化对抗来提升防御的能力。此外,公司也密切获取不法分子最新的伪造方法,及时进行测试和防御能力增强。 “伴随新型伪造方法的层出不穷、网络传播环境的日趋复杂,加上基于深度神经网络的检测算法存在结构性缺陷等,反深伪检测技术也面临‘强对抗性’,需要持续更新与迭代优化。类似于‘猫鼠游戏’,深度合成和检测在不断学习攻防过程中会自我进化,规避上一代的对抗技术。为了能在对抗攻防中掌握主动权,未来,反深伪检测技术的发展需融合多模态内容的取证分析等多方面能力,实现伪造内容的精准识别,打造可信内容体系。”萧子豪说。
过年8天AI圈变天!56件生成式AI要闻一文看尽,OpenAI谷歌英伟达齐放大招
开工大吉! 在刚刚过去的八天春节假期里,生成式AI继续上大分。 OpenAI成为春节期间的“话题之王” 。其于2月16日凌晨推出首款文生视频大模型Sora,引来马斯克、杨立昆、贾扬清等一众大佬发声,周鸿祎称Sora意味着AGI实现缩短到一年。 同时,OpenAI CEO萨姆·阿尔特曼(Sam Altman)正洽谈数万亿美元建设AI芯片工厂,董事会主席布雷特·泰勒(Bret Taylor)、创始成员安德烈·卡帕蒂(Andrej Karpathy)的创业项目接连曝出OpenAI被曝达成年收入达20亿美元的里程碑,估值高达800亿美元。 实际上,科技巨头如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等公司,都在春节期间放出了生成式AI大招。 英伟达于2月15日登上新巅峰,市值1.83万亿美元成美股第三仅次于苹果和微软。在此期间,英伟达首次公开Eos超级计算机,发布AI聊天机器人Chat with RTX,并传出组建芯片定制新部门。 谷歌发布了其大模型矩阵的最新力作Gemini 1.5;微软被曝出投资32亿欧元建设德国AI基础设施;亚马逊推出了10亿参数文本转语音模型;苹果被曝将推出类似于微软GitHub Copilot的AI编程工具;Meta发布世界模型早期版本V-JEPA…… 创企也在春节期间大秀生成式AI肌肉,并掀起一波融资小高峰。 美国AI创企Cohere推出覆盖101种语言开源大模型Aya;Stability AI推出了消费级硬件可训的文生图模型。基础设施创企Meter融资3500万美元,生成式AI创企Rasa融资3000万美元,GPU云服务商Lambda融资3.2亿美元;此外,AI数据提供商Scale AI、AI搜索引擎创企Perplexity AI、医疗AI创企Abridge等多家AI创企已经或马上获得融资。 在这个春节假期,国内外的生成式AI的应用和监管正在加速。 在国内,处于春节假期的产业玩家进展披露不多,但我国史上AI含量最高的央视总台春晚(《十年最好看春晚,史上AI含量最高!芯片硬核霸屏,机器臂转手绢,无人机秀阵法》)火速出圈;在国外,美国FTC提出新措施打击生成式AI伪造欺诈行为,欧盟通过AI临时协议并宣布于4月推《AI法案》,都让2024龙年春节假期成为生成式AI的重要时刻。 02.10~02.17春节8天假期间的全球AIGC产业要闻如下,enjoy~ 一、大年初一(2月10日) 1、传英伟达组建芯片定制新部门 智东西2月10日消息,据路透社今日报道,知情人士透露,英伟达正在建立一个新的业务部门,专注于为微软、Meta、谷歌等云计算公司以及爱立信、任天堂等其他公司设计包括AI芯片在内的定制芯片。 2、谷歌安卓版Gemini现支持手势和按键唤醒 据社交平台Threads网友Mishaal Rahman发文,谷歌于2月10日更新了安卓版Gemini,支持用户通过上划手势或长按电源键唤醒Gemini并自动发送查询。此前,用户只能通过“Hey Google”来调用Gemini。 3、微软Win11疑似将内置AI超级分辨率功能 据The Verge报道,微软可能正在为PC游戏开发类似英伟达DLSS的AI自动超级分辨率功能。社交平台X的一位用户2月10日发文分享了其在Windows 11最新测试版本系统中发现的这一功能。该功能被描述为“利用AI让游戏在细节增强的同时运行更流畅”,听起来类似英伟达的DLSS、AMD的FSR以及英特尔的XeSS。微软还没有正式官宣这一新功能。 二、大年初二(2月11日) 1、首个登上央视春晚的AI视频制作复盘发布 据微信公众号全民熊猫计划2月11日发文,创作者海辛Hyacinth和Simon阿文复盘了其制作的首个登上央视春晚的AI视频项目。该项目使用了开源社区中最新的技术ControlNet、AnimateDiff、LCM、IPAdapter,将一段真人双人舞用AI的风格转绘成陶瓷的舞蹈。 三、大年初三(2月12日) 1、2024年科技公司因转​​向AI而裁员3.4万人 据英国《金融时报》2月12日报道,今年截至发文日共有138家科技公司裁员,波及3.4万人。分析人士称,最新的裁员潮表明企业正在重新调整资源,以便投资于生成式AI等新领域,同时也向股东表明,企业仍在继续关注成本纪律。 2、Stability AI推出文生图模型 消费级硬件可训 2月12日,美国AI创企Stability AI推出了一个文生图模型Stable Cascade预览版。Stable Cascade基于大规模文本到图像扩散模型的高效架构Würstchen,易于在消费级硬件上训练和微调。为了让大家能够更方便地使用和定制这一模型,Stability AI还发布了相应的训练和推理代码,这些代码可以在GitHub页面上找到。 GitHub地址:https://github.com/Stability-AI/StableCascade 3、亚马逊推出10亿参数文本转语音模型 根据arxiv网站,亚马逊团队于2月12日推出一个名为BASE TTS的文本转语音(TTS)模型,它代表了大规模自适应流式TTS的崭新涌现能力。作为迄今为止最大的TTS模型,BASE TTS在10万小时的公共语音数据上进行了训练,从而提高语音自然度。其工作原理是通过一个拥有10亿参数的自回归转换器,将原始文本转化为离散代码(语音代码);接着,一个基于卷积的解码器以增量的、流式的方式将这些语音代码转化为波形。值得一提的是,模型的语音编码采用了新颖的语音标记化技术,该技术具有说话人ID解纠缠和字节对编码压缩的特点。团队发现,使用10K+小时和500M+参数构建的BASE TTS变体开始在处理复杂文本句子时展现出自然韵律。 论文地址:https://arxiv.org/pdf/2402.08093.pdf 音频生成样本地址:https://amazon-ltts-paper.com 4、谷歌承诺投2500万欧元 帮欧洲人学习用AI 据路透社报道,谷歌2月12日宣布承诺投入2500万欧元(约合人民币1.93亿元)帮助欧洲人学习使用AI,这笔款项已向社会企业和非营利组织开放申请,谷歌还将运营一系列“成长学院(growth academies)” ,帮助AI公司扩大经营规模。上个月,谷歌刚刚宣布将投资10亿美元在英国伦敦建立一个数据中心,以满足该地区日益增长的互联网服务需求。 5、巴基斯坦前总理用AI克隆声音拉拢支持者 据《纽约时报》报道,巴基斯坦前总理伊姆兰·汗(Imran Khan)近几个月来,一直在狱中使用AI复制自己声音的演讲来拉拢支持者。尽管在竞选期间,官员阻止他的候选人参加竞选活动,并审查对该党的新闻报道,但据当地时间周六的官方统计信息显示,与他的政党巴基斯坦自由党(Pakistan Tehreek-e-Insaf,P.T.I.)结盟的候选人赢得了最多席位。 四、大年初四(2月13日) 1、黄仁勋:AI开发用不了7万亿美元 据彭博社报道,英伟达CEO黄仁勋在当地时间2月12日于迪拜举行的世界政府峰会上表示,预计未来几年计算机技术的进步将使AI的开发成本远低于OpenAI CEO萨姆·阿尔特曼(Sam Altman)所要筹集的7万亿美元。黄仁勋说:“你不能只考虑买更多计算机,因为计算机的性能也在增强,所需总量不会有那么多。” 黄仁勋认为芯片行业技术进步将降低AI开发的成本,但同时他也在讲话中提到未来五年,全球范围内的AI数据中心建设投入将翻一倍,达到2万亿美元。 2、OpenAI董事会主席创办AI Agent创企 由OpenAI董事会主席布雷特·泰勒(Bret Taylor)创办的AI创企Sierra,2月13日正式在其官网推出面向企业的对话式AI平台Sierra,旨在让每家公司都能够构建自己的AI代理。Sierra代理可以使用自然语言和复杂的推理来创建真实、令人满意且符合品牌调性的对话互动。目前,已经有至少4家企业通过Sierra构建自己的AI代理。 3、英伟达发布Chat with RTX 英伟达2月13日发布AI聊天机器人Chat with RTX,可让用户个性化连接到自己GPT大语言模型 (LLM),支持文档、笔记、视频或其他数据等不同形式的内容输入。只需将应用程序指向包含文件的文件夹,它就会在几秒钟内将它们加载到库中。用户可以提供YouTube播放列表的网址,应用程序可以将加载播放列表中视频转录,让用户可以查询其涵盖的内容。 4、Cohere推开源大模型Aya 覆盖101种语言 美国AI创企Cohere 2月13日推出新生成性大语言研究模型 (LLM),涵盖101种不同的语言,是现有开源模型涵盖的语言数量的两倍多。开源Aya模型以及迄今为止最大的多语言指令微调数据集,其规模为5.13亿,涵盖114种语言。该数据收集包括来自世界各地的母语人士和流利使用者的注释。 5、欧盟通过AI临时协议 将于4月推《AI法案》 据路透社报道,欧洲议会的两个关键立法者小组2月13日批准了一项关于AI规则的临时协议,之后将拟定《AI法案》,于4月份的立法会议上进行投票,这将为世界上第一个关于AI的立法。该法案旨在为广泛行业使用的技术安全护栏,涉及范围从银行到汽车以及电子产品和航空公司等。 6、微软推出新AI系列解决方案 微软2月13日在其官网宣布推出Microsoft Fabric、ESG 价值链解决方案、Microsoft Sustainability Manager等新的AI解决方。这些方案可以帮助企业借助AI能力更好做出决策。比如说,用户可通过生成式AI和自然语言查询来更快地了解数据并从数据中获得分析结果。 五、大年初五(2月14日) 1、英伟达市值超过亚马逊 截至2月13日美股收盘时间,英伟达股价下跌2.15%,股价下跌0.17%,市值达到1.78万亿美元,超过亚马逊1.75万亿美元的市值。接下来,英伟达的市值即将超越Alphabet,有望成为全球第三大公司。 2、ChatGPT记忆管理功能本周上线 OpenAI 2月14日在其官网宣布,他们正在测试ChatGPT的记忆管理功能。该功能可以记住用户在所有聊天中所讨论的内容,也可以让用户不必重复输入信息,并对以后的对话更有帮助。本周OpenAI将向一小部分ChatGPT免费版和Plus用户推出记忆管理功能。 3、OpenAI创始成员Andrej Karpathy离职 据The Information报道,OpenAI创始成员之一安德烈·卡帕蒂(Andrej Karpathy)已离开公司。离职后,他正在开发一款AI助手产品,并与OpenAI研究主管鲍勃·麦格鲁(Bob McGrew)密切合作。“安德烈将离开去追求个人项目。我们对他的贡献深表感谢,并祝他一切顺利。”OpenAI发言人Kayla Wood在一份声明中表示。“他的职责已转变为与安德烈密切合作的高级研究员。” 4、首批Gemini AI用户反馈出炉 能力和GPT-4相当 据The Information报道,近日首批Gemini AI用户反馈Gemini Ultra的使用体验与GPT-4大致相当。Gemini Ultra所支撑的Gemini聊天机器人比GPT-4所支持的ChatGPT Plus的回答速度更快、回答内容更简洁、回答语句也更客观。此外,Gemini创意讲故事能力也令其中一些用户感到惊讶。 5、OpenAI董事会主席:新公司不对OpenAI构成竞争 据彭博社报道,OpenAI董事会主席布雷特·泰勒(Bret Taylor)在宣布成立AI创企Sierra一天后,驳斥了他的新公司可能与OpenAI产生竞争的担忧。泰勒在接受采访时表示:“我真的不认为OpenAI和Sierra具有竞争……我们存在于堆栈的不同层。我们是OpenAI的客户,此外还有其他一些基础模型。” 6、基础设施创企Meter获新融资 OpenAI CEO领投 互联网基础设施的初创公司Meter 2月14日表示,已在OpenAI CEO萨姆·阿尔特曼(Sam Altman)和Stripe早期员工兼著名投资者Lachy Groom领投的新一轮融资中筹集了3500万美元。该轮融资计划投资产品、供应链并发展团队。 7、生成式AI创企Rasa完成3000万美元融资 生成式AI创企Rasa 2月14日宣布完成3000万美元的C轮融资,由StepStone Group和PayPal Ventures、Andreessen Horowitz、Accel和Basis Set Ventures共同领投。Rasa主要做开放式生成会话AI平台,用于构建和提供下一级AI助手,目前已推出了Rasa Pro和Rasa Studio等生成式AI产品。 8、AI不能成为发明人 美国专利商标局发新指南 美国专利商标局(USPTO)2月14日在其官网发布了最新指南。它指出,AI系统不能被命名为发明人,但人可以在创造专利发明的过程中使用AI工具。使用AI的人必须对发明的构思做出重大贡献。一个人如果只是要求AI系统创造一些东西并监督它,则不能成为专利申请者。 9、Salesforce旗下Slack AI上线 根据Slack官网,美国SaaS龙头Salesforce子公司Slack于2月14日推出了Slack AI服务,能力包括:搜索答案,提供个性化的、智能的问题回答服务;从可访问的通道生成关键亮点回顾;一键从大量对话中获得议程总结。围绕Slack AI的一项内测分析发现,优步(Uber)和Anthropic等客户使用Slack AI来寻找答案、提炼知识和激发创意,平均每周可以为每位用户节省约97分钟时间。Slack公司CEO丹尼斯·德雷瑟(Denise Dresser)说:“在生成式AI时代,Slack是一个值得信赖的对话平台,它将企业的每个部分联系起来,从而提高团队的生产力。” 10、诺基亚推出面向产业工人的AI助手 据路透社报道,诺基亚2月14日推出了一款AI助手,名为“MX Workmate”,该助手可以为产业工人提供信息,包括基于实时数据的故障机器警告和提高工厂产量的建议方法。 11、Adobe推出AI Artbot 已避开AI版权风险 据彭博社报道,近日设计软件巨头Adobe推出新的AI Artbot,并且表明其解决方案将提供版权保护。Adobe首席营收官斯蒂芬·弗里德 (Stephen Frieder)表示,它正在与酒店、媒体和零售领域的数十公司进行试验,并指出品牌公司现在可以合法地改变照片背景,而无需重新拍摄。 12、OpenAI CEO号召建立国际机构监督AI发展 OpenAI CEO萨姆·阿尔特曼(Sam Altman)2月14日在迪拜举行的世界政府峰会(WGS)上通过视频电话表示AI的发展速度可能远快于世界的预期,他呼吁建立一个像国际原子能机构(IAEA)这样的机构来监督AI的发展。 六、大年初六(2月15日) 1、谷歌推出Gemini 1.5 突破100万个tokens 2月15日晚间,谷歌发布其大模型矩阵的最新力作Gemini 1.5。谷歌发布的第一个用于早期测试的Gemini 1.5模型是Gemini 1.5 Pro,这是一个中型的多模态模型,针对广泛任务进行了优化,其性能与谷歌迄今最大的模型1.0 Ultra相当,同时使用了更少的计算。该模型在长语境理解方面取得突破,能显著增加模型可处理的信息量——持续运行多达100万个tokens,实现迄今任何大型基础模型中最长的上下文窗口。这意味着Gemini 1.5 Pro可一次处理大量的信息——包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。 2、英伟达市值超谷歌成美股第三 截至美股2月14日收盘,英伟达股价上涨2.46%,市值达到1.83万亿美元(约合13.2万亿元人民币),超过谷歌母公司Alphabet的1.82万亿美元,成为美股第三大公司,仅次于苹果和微软。 3、谷歌被曝内部AI大语言模型Goose 据Business Insider 2月15日报道,泄露文件显示,谷歌悄悄推出了名为“Goose”的内部AI大语言模型,以帮助员工更快地编写代码,协助开发新产品,提高工作效率。Goose“在谷歌拥有25年的工程专业知识”,仅供谷歌员工使用,“可以回答有关谷歌特定技术的问题,使用内部技术栈编写代码,并支持基于自然语言提示编辑代码等新颖功能”。一份内部文件指出,Goose是“将AI带入产品开发过程的每个阶段”计划的一部分。目前还不清楚它是否功能齐全。Goose“还计划成为谷歌批准的第一个用于内部变成的通用大语言模型”。 4、英伟达首次公开Eos超级计算机 英伟达2月15日发布了一段视频,首次向公众展示了其最新的数据中心级超级计算机Eos。Eos在全球超级计算机500强中排名第9,是一款极大规模的英伟达DGX SuperPOD,开发人员可以在Eos上使用加速计算基础设施和完全优化的软件来实现AI突破。Eos超算采用576个英伟达DGX H100系统、英伟达Quantum-2 InfiniBand网络和软件构建,共有4608个H100 GPU,可提供总计18.4EFLOPS的FP8 AI性能。 5、GPU云服务商Lambda融资3.2亿美元 2月15日,GPU云服务商Lambda宣布完成3.2亿美元C轮融资,估值达15亿美元。本轮融资由美国创新技术基金(USIT)领投,新投资者B Capital、SK Telecom、T. Rowe Price Associates以及现有投资者Crescent Cove、Mercato Partners、1517 Fund、Bloomberg Beta和Gradient Ventures等参投。新融资将用于加速其GPU云的发展,确保AI工程团队能够通过高速英伟达Quantum-2 InfiniBand网络访问数千个英伟达GPU。 6、OpenAI CEO称7万亿美元代表的是投资总额 据The Information 2月15日报道,OpenAI CEO Sam Altman私下称其引起轰动的7万亿美元芯片筹资数额代表的是此类企业参与者在一段时间内需要进行的投资总额,包括从房地产、数据中心电力到芯片制造等等。 7、传OpenAI在开发网络搜索产品 据外媒The Information报道,据了解OpenAI计划的人士透露,OpenAI一直在开发一款网络搜索产品,这将使其与谷歌展开更直接的竞争。这位人士说,搜索服务将部分由必应(Bing)提供。 8、微软将投资32亿欧元建设德国AI基础设施 据彭博社2月15日报道,微软总裁Brad Smith在一场活动中宣布计划未来两年向德国AI基础设施投资32亿欧元。这笔资金是微软在德国最大的直接投资。 9、谷歌为AI团队开设巴黎研究中心 据彭博社2月15日报道,谷歌为其AI研究团队在法国巴黎开设了一个新的研究中心。新设施将容纳总共300名科学家和工程师,他们此前分散在巴黎的其他谷歌办公室。Alphabet及谷歌CEO Sundar Pichai周四与法国总统马克龙见面讨论了计划今年举行的法国AI峰会筹备工作等主题。 10、软银联合英伟达组建AI产业联盟 据外媒NHK报道,日本电信巨头软银正在与美国芯片制造商英伟达结成联盟,利用AI来改善无线服务,目的是开发可以在手机发射塔处理数据而无需依赖数据中心的技术。该组织将被称为AI-RAN联盟,成员包括主要移动传输设备供应商瑞典爱立信和芬兰诺基亚。消息人士称,数据处理的去中心化将允许在手机上提供更高级别的AI服务,该技术还将实现基站网络操作的自动化,允许基站自动适应数据量的变化并帮助网络避免延迟。 七、大年初七(2月16日) 1、OpenAI推出首款文生视频大模型Sora 2月16日凌晨,OpenAI推出其首款文生视频大模型Sora。该模型能根据提示词生成长达1分钟的视频,或者扩展生成的视频使其更长,同时视觉质量相当惊艳。Sora不仅对文本理解更深刻,能准确地呈现提示词,而且可在一个生成的视频中创建多个镜头,准确地保留角色和视觉风格。除了支持文本指令输入外,该模型支持生成图像,也支持将现有静止图像变成视频,能对现有视频进行扩展、将两个视频衔接并填充缺失的帧。其3D仿真能力非常突出,无论是制作短视频、动画、电影画面,还是渲染视频游戏,都展示出了令人期待的落地前景。 2、Meta发布世界模型早期版本V-JEPA Meta 2月16日推出V-JEPA模型,一种通过观看视频来教机器理解和模拟物理世界的方法,以迈向利用对世界的学习理解来计划、推理和完成复杂任务的AI愿景。Meta发布了一组V-JEPA视觉模型,这些模型使用自监督学习进行了特征预测目标的训练,能够在信息有限的情况下理解和预测视频中发生的事情。它通过在其内部特征空间中预测视频中缺失或模糊的部分来学习。与填充缺失像素的生成方法不同,这种灵活的方法可以使训练和样本效率提高6倍。结果表明,其顶级V-JEPA模型在kinect-400上成绩达到82.0%,在Something-Something-v2上达到72.2%,在ImageNet1K上达到77.9%,比肩或超过此前的领先视频模型。 GitHub地址:https://github.com/facebookresearch/jepa 论文地址:https://ai.meta.com/research/publications/revisiting-feature-prediction-for-learning-visual-representations-from-video/ 3、苹果加紧开发AI功能 将推出AI编程工具 据彭博社2月16日报道,苹果正加紧开发更多AI功能,其为App开发者开发的一款关键软件工具即将完成,作为苹果旗舰编程软件Xcode下一个主要版本的一部分,计划最早于今年向第三方软件制造商发布。据悉,新系统的操作方式将类似于微软GitHub Copilot,使用AI来预测和完成代码块。苹果也在探索使用AI来生成测试应用程序的代码。 此外,苹果探索了自动创建Apple Music播放列表、Keynote制作幻灯片等AI功能,还考虑在其全系统搜索功能Spotlight的新版本引入大语言模型来回答复杂问题。苹果正持续磨练其大语言模型,以增强Siri和AppleCare支持等服务,并在将AI整合到其健康功能上投入了大量资金。 4、OpenAI申请“GPT”商标遭拒 据TechCrunch 2月16日报道,美国专利商标局拒绝了OpenAI申请“GPT”商标的尝试,裁定该术语“仅具有描述性”,不符合注册商标的标准,也不符合名称后加“TM”所提供的保护,因此无法注册。专利局指出,GPT已经在许多其他环境中使用,并被其他公司在相关环境中使用。这对OpenAI的品牌是一个打击。 5、OpenAI创业基金在Sam Altman名下 据Axios 2月16日报道,根据美国联邦证券备案文件,Sam Altman除了OpenAI CEO这个身份外,还是企业风险基金OpenAI创业基金的所有者。OpenAI创业基金于2021年底推出,主要投资其他AI初创公司和项目,但它不归OpenAI所有,而是由Altman合法拥有。 “我们希望快速启动,由于我们的结构,最简单的方法就是将其放在Sam的名字下。”OpenAI发言人告诉Axios,“我们一直希望这只是暂时的。”然而,这个“暂时”已经过去一年多了,这给OpenAI埋下了一个风险,OpenAI补充表示可能需要重新审查其治理结构,“在对基金进行任何变更之前进行”,其首要任务是“建立一个新的董事会”。 6、谷歌开源AI文件检测器Magika 谷歌2月16日开源AI驱动的文件类型识别系统Magika,以帮助更多人准确检测二进制和文本文件类型。Magika采用了一个定制的、高度优化的深度学习模型,即便在CPU上运行,也能在几毫秒内实现精确的文件识别。该工具已在谷歌内部被大规模使用,通过为Gmail、Drive和安全浏览文件规划到适当的安全和内容策略扫描器来帮助提高谷歌用户的安全性,每周平均处理数千亿个文件。与之前依赖人工规则的系统相比,Magika将文件类型识别准确率提高了50%。 GitHub地址:https://github.com/google/magika 7、谷歌宣布启动AI网络防御计划 谷歌2月16日宣布启动一项新的AI网络防御计划,以帮助改变网络安全,并利用AI来扭转被称为“防御者困境”的动态。其中包括一项拟议的政策和技术议程,该议程载于谷歌新报告《安全、授权、进步:AI如何扭转防御者的困境》。谷歌将其AI工具Magika开源,为检测恶意软件提供助力。 报告地址:https://services.google.com/fh/files/misc/how-ai-can-reverse-defenders-dilemma.pdf 8、周鸿祎:Sora意味着AGI实现缩短到1年 360集团创始人、董事长兼CEO周鸿祎分享一些观点,认为“今天Sora可能给广告业、电影预告片、短视频行业带来巨大颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具”。他谈到Sora的技术思路完全不一样,通过把大语言模型和扩散模型结合,实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的。一旦AI接上摄像头,把所有电影、YouTube和TikTok上的视频看一遍,对世界的理解将远远超过文字学习,“这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现”。周鸿祎相信OpenAI手里还藏有一些秘密武器。 9、FTC提出新措施 打击生成式AI伪造欺诈行为 美国联邦贸易委员会(FTC)2月16日发布一篇声明,就针对基于生成式AI工具的伪造欺诈行为的拟议处罚规则向公众征求意见,以确定修订后的规则是否应宣布企业(如创建图像、视频或文本的AI平台)提供其知道或有理由知道的商品或服务被用来通过冒充来伤害消费者是非法行为。FTC致力于利用其所有工具来检测、阻止和制止假冒欺诈,阻止欺诈行为,并确保受害消费者得到赔偿。 10、咨询公司Ankura推出生成式AI工具NoraGPT 据路透社报道,咨询和法务会计公司Ankura Consulting 2月16日表示已推出一款定制的生成式AI工具NoraGPT,该工具是与OpenAI合作开发的。NoraGPT正在Ankura的安全环境中使用,以确保员工和客户的数据得到保护。该平台具有类似人类的功能,如长期和“永久”记忆能力,这与Ankura自家AI解决方案相一致。它还将有助于文件管理。 八、大年初八(2月17日) 1、传OpenAI完成新交易,估值或超800亿美元 据《纽约时报》报道,据三位知情人士透露,OpenAI已完成一笔交易,使其估值达到800亿美元或以上,在不到10个月的时间里这家创企的估值几乎增加了两倍。知情人士称,该公司将通过风险投资公司Thrive Capital牵头的要约收购出售现有股份。 2、软银正为AI芯片项目寻求1000亿美元资金 据彭博社2月17日援引知情人士报道,软银集团创始人孙正义正在寻求高达1000亿美元的资金来资助一家芯片合资企业,以与英伟达公司竞争并供应AI必需的芯片。软银正在考虑向中东投资者筹集资金。该项目代号为Izanagi,孙正义希望这家芯片公司能与软银芯片设计部门Arm Holdings形成互补,帮助其打造一家AI芯片巨头公司。 3、OpenAI CEO正请求美国批准成立AI芯片公司 据彭博社2月17日报道,OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)制定了一项计划,从根本上增加可用于开发和操作AI的专用服务器的数量。知情人士称,过去几周,阿尔特曼一直在与美国、中东和亚洲的潜在投资者和合作伙伴会面,但他告诉其中一些人,如果没有华盛顿的批准,他就无法前进。据知情人士透露,阿尔特曼正在努力争取美国政府批准一项大规模合资企业,以促进AI芯片的全球制造。 4、训练GPT-3与130个美国家庭每年耗电量相近 据The Verge 2月17日报道,AI训练过程的能源消耗量极大,将比传统数据中心活动消耗更多的电力。例如,训练像GPT-3这样的大语言模型预计使用近1300MWh(兆瓦时)的电力,大约相当于130个美国家庭每年消耗的电量。如果流媒体播放一小时流媒体平台Netflix的视频需要大约0.0008MWh,这意味着用户需要观看超过162万小时视频才能消耗与训练GPT-3相同的电量。 5、神经搜索创企Jina AI推出8K长文本ColBERT模型 2月17日,神经搜索公司Jina AI宣布推出jina-ColBERT-v1-en,这是支持8K长文本的ColBERT模型,据了解,jina-ColBERT-v1-en效果可以比肩SOTA的ColBERTv2。目前,colbert和RAGatouille集成已上线。据悉,Jina AI于2020年2月成立,创始人肖涵曾就职于腾讯AI Lab,负责基于深度学习搜索项目研发。 试用地址:huggingface.co/jinaai/jina-colbert-v1-en 6、投资者热情高涨,多家AI创企获融资 据The Information报道,最近几周,投资者表现出了对AI创企的极大热情,初创公司也正在寻求资本化。据多位知情人士透露,AI高质量训练数据提供商Scale AI一直在与投资者讨论筹集更多资金的事宜;AI搜索引擎创企Perplexity AI收到主动报价,估值可能超过10亿美元;高通和Intuit已向AI创企Anthropic投入了一轮150亿美元的估值融资;医疗AI创企Abridge完成新一轮融资,投资后估值为8.5亿美元。 7、20家科技公司联合签署打击选举造假协议 2月17日,在慕尼黑安全会议(MSC)上,微软、Meta、谷歌、亚马逊、OpenAI等20家科技公司组成的集团联合承诺,在今年的选举中打击AI错误信息。微软、Meta、谷歌、亚马逊等公司共同签署了《2024年选举中打击AI欺骗使用的技术协议(A Tech Accord to Combat Deceptive Use of AI in 2024 Elections)》,该协议有八项具体承诺,包括承诺部署技术来对抗AI生成的旨在欺骗选民的有害内容;签署方承诺合作开发工具,以检测和解决此类AI内容等。它还包括一套广泛的原则,包括追踪与选举相关的欺骗性内容起源的重要性,以及提高公众对这一问题认识的必要性。 8、Reddit已签署价值6000万美元AI内容许可协议 据彭博社2月17日报道,知情人士透露,Reddit已签署一份合同,允许一家公司根据社交媒体平台的内容训练其AI模型。知情人士称,Reddit告诉潜在投资者,该公司已于今年早些时候签署了该交易,按年计算价值约为6000万美元。 9、加州议员提议成立新AI监管部门 据StataScoop报道,近日,加利福尼亚州参议员斯科特·维纳(Scott Wiener)提出了一项法案,他提议在加州科技部设立一个名为“前沿模型部门”的新办公室,负责加强AI执法,例如确保大型AI模型在到达用户之前进行强制测试。
每天还有几百人买万能充?他们都买来干嘛?
在所有中年人的青春里,都有一只万能充。 它在你的床头工作,为你的梦境增加七彩绚丽的灯光特效;在充电完成后,它甚至会响起刺破苍穹的音乐。 它无视手机品牌和电池型号,踏平正品机和山寨机的隔阂,只用两根小小触针,就能给现代生活持续注入能量。 曾经红极一时、人手一个的万能充,为什么不见了? 一代顶流万能充 总有人抱怨现在充电接头种类太多太麻烦,家里总得备好几根不同接口的充电线。 放到20年前,你怕是要疯! 20年前,国内手机市场风起云涌,涌入市场的手机品牌非常多,各家做的充电接口类型也不太一样。 那时你去别人家做客,要给手机充电,主人家可能会甩给你一捆各色充电线:喏,看看你的手机用哪条合适?(也可能最终也没翻出一条能匹配的) 来,选一根! 然后,一个当年的高中生出手了。 2002年,来自河南的陈同学不想再在一堆充电线里扒拉了,他决定制造一个适配所有手机的充电器。 从哪儿下手呢?有的手机充电口是长条形、有的是梯形、有的是圆形,没有什么形状的充电头可以适配一切充电口。 那就把手机电池抠下来,直接给电池充电! 当时手机电池可换,大家有用一块备一块的习惯。从这个思路出发,陈同学发明万能充解决了电池充电的问题。 2003年,万能充面世,立刻成了火爆一时的居家旅行必备品。 第一批出厂的几十万个万能充,在3天里就销售一空。后来生产万能充的工厂太多了,具体销量也无法准确统计,但普及程度不说一人一个,至少每家都有一个吧? 除了在国内流行,这小东西还远销海外,成了中国特产。 “我没买到合适的充电线,店员给了我个万能充,结果我再也没买过其他任何充电线。” “糟糕,被死去的记忆攻击了!我就用过这个,现在感觉自己老了。” “我朋友叫它‘螃蟹充电器。’”“现在我家某个地方还放着俩。”“我希望这东西还能用。” 话说回来,发明万能充的陈同学也过得不错,不仅申请了专利,还被保送进了清华大学。 消失得猝不及防 你回想一下,这个深受国内外群众喜爱的宝贝,是哪年开始消失的呢? 我说一个时间点:2007年。 那年,群魔乱舞的手机市场,出现了逐渐一家独大的手机品牌,就是现在的“街机”苹果。其中一个设计惊为天人:电池居然是不可拆卸的! 关于这么做的原因众说纷纭,有人说为了安全,有人说为了手机轻薄,有人说为了散热,还有人说为了防止山寨电池分一杯羹。咱们今天都不讨论,总之电池机身一体化的设计,很快就普及开来,并且渐渐垄断了市场。 你现在去商场想买可以拆电池的手机?抱歉,没有! 电池拆不出来,自然万能充也戳不到电池的正负极了,由此黯然退出世界舞台。 当然,除了电池不可拆卸外,还有很多因素导致万能充不再时尚。 第一,20年前,你也就用手机发个短信打个电话,出门都可以不带。现在的智能手机,几乎就是人的义肢,你能忍受抠下电池充电、几个小时不碰手机? 第二,就算你能忍受与手机的暂别,万能充也爱莫能助了。现在智能手机的电池容量,比20年前的手机大得多了去了,用原装的充电器,一个多小时可以充满电;如果用小功率的、针对老手机的万能充,可能得充上一整夜。充电速度还没耗电速度快,这就很尴尬了。 第三,随着手机市场的大半壁江山被几大品牌占领,手机接口形状也逐渐变少。你看街边的共享充电宝,一般来说拖3条尾巴,就可以应付一切手机了。 总之,在十几年的某一天,你再也记不起来家里的万能充放在哪儿了,也没有再去找过。 一息尚存 虽然万能充这个玩意儿,对00后、10后来说已经是古董,可能会被认成电蚊香、捕鼠夹,但实际上,它像珍稀动物一样,还在你难以发现的角落里生存着。 就在此刻,某购物软件上的一款万能充,销量6万,24小时内超过100人购买!你猜他们都买来做什么? 虽然一部智能手机能代替半数电器,但有人就是喜欢相机和CD。根据买家评论来看,有一大半的顾客是买来给相机和CD机充电的。好家伙,不说我都忘了这俩玩意儿还需要电池。 一部分怀旧的买家,用万能充给10多年前的手机充电,只为一睹当年收件箱里的情愫。你心动了吗? 一些难以归类的神奇用途…… 还有一些冒失又机智的年轻人把我搞不会了。丢了无线耳机的充电仓,直接用万能充和耳机充电触点“针尖对麦芒”,还真的管用! 最后还是要说点安全警示。 正规的、有3C认证的万能充是安全的,但野路子万能充容易用坏,短路后还有火灾风险,千万别用! 但就算用正规万能充,也要留意你的电池和电器,是不是有稳住充电电流电压的设定(在说明书里叫“限流保护”),有的话就能上万能充;要是没有的话,用几块钱的万能充搞坏了几百几千的电子产品,那就太得不偿失喽!
vivo“登顶”印度,一步之遥?
印度,一直是中国手机品牌的必争之地。 日前,Counterpoint Research发布的最新数据显示,2023年印度智能手机出货量为1.52亿部,与2022年持平,其中vivo成为增长最快的头部玩家,市场份额从15.8%涨至17%,与排名第一的三星仅有1%的差距。 这意味着,vivo向“印度一哥”之位发起冲击。 入“印”十年,vivo的日子过得到底怎么样?挑战三星,vivo胜算几何?问鼎“印度一哥”之路,vivo还将面临哪些挑战? 印度,vivo出海的“第一站” 据“人民网”报道,早在2014年,vivo创始人、总裁兼首席执行官沈炜亲自带队考察印度,考察团里除了vivo的高管外,还有与vivo合作的国内代理商,代理商们每到一处便和自己所负责代理的国内片区进行比照,凡是相似点较多的,就划为在印度拓展业务的区域。 之所以如此,与印度举足轻重的市场地位息息相关。 2023年4月,印度人口达到14.26亿人,一举成为世界人口第一大国,高基数之下顺势晋升为全球第二大智能手机市场。 更为重要的是,印度的潜力不可估量。 作为重要的新兴市场,印度的经济增长强劲,其财政部预计到2027年有望超过日本和德国成为世界第三大经济体,届时其GDP将达到5万亿美元,从而释放更大的消费潜力。 来源:中经数据 一名互联网观察人士告诉锌刻度:“中国企业早就预判了商机,不管是之前的‘中华酷联’,还是之后的‘华米OV’都纷纷涌向印度,谁也不愿意错过这块‘肥肉’。” 此背景下,三星首当其冲。 虽然,三星多年称霸印度智能手机市场,可市场份额却逐年缩水,2015年尚有30%的市场份额,2023年已降至18%,颓势肉眼可见。 与之对应的是,中国手机品牌崛起。 这其中,vivo并不是走得最快的一个,却稳打稳扎前行,不声不响逼近三星,大有取而代之的势头。 关于此,从其业绩也可见一斑。 据公开数据显示,vivo印度公司2023财年的销售收入为2987.49亿卢比,同比增长了9%,而净利润为21.1亿卢比,成功扭亏为盈;2016年4月1日至2023年3月31日,销售收入累计为1.4万亿卢比,净利润累计为38.7亿卢比。 需要注意的是,印度之外,vivo也在东南亚扎根站稳脚跟,成为马来西亚、印度尼西亚等国家智能手机市场排名前三的常客。 生根,比落地更难 vivo之所以起势,与本土化息息相关。 众所周知,出海容易落地难,比落地更难的是生根,这意味着要付出更多的智慧和心血,这是出海企业必须解决的棘手问题。 对此,vivo给出的解题思路是“More Local,More Global”。 入印之初,vivo的打法就与主流有所不同,没有采取门槛更低的合作方式,而是独自建厂、带领经销商铺设门店、从上至下聘用本土人才,以求更好地服务本土消费者。 据印度相关媒体报道,vivo的“印度制造”拟投入750亿卢比,按照计划2023年完成第一阶段350亿卢比投资,而当第二阶段投资完成之后,智能手机生产规模将接近其在中国的规模,并成为在印度投资最多的手机品牌之一,与韩国三星电子不相上下。 如此一来,vivo的竞争力也有了差异化。 对手们更侧重于线上,而vivo则更侧重于线下,其在印度拥有约7万家门店,90%销售通过线下渠道完成。 换而言之,其触角已深入印度的“神经末梢”。 更为关键的是,vivo精准迎合本土消费者,成功抢占经济型高端市场,才有了2023年的逆势增长。 Counterpoint Research的高级分析师瓦伦・米什拉:“智能手机市场的消费者购买模式发生了转变,消费者愿意花更多钱购买高质量的设备,以便延长使用寿命。” 高端手机逆势增长 通俗易懂地说,印度中产阶级的不断壮大,中高端消费市场也愈发兴旺,成为智能手机品牌的必争之地。 问题在于,中印两国的国情不同。 以2023年第三季度为例,中国手机市场智能手机均价为3480元,而印度市场为195美元,约1400元上下,即便如此也创了印度智能手机均价的历史新高。 一名业内人士告诉锌刻度:“高端化与经济性往往是对立的,可越来越多的印度消费者既渴望性能优异,又对价格敏感,vivo抓住了这个矛盾点,进而获得更多用户的青睐。” 譬如,在拓展高端客群方面,vivo没有盲目押注最新的旗舰机,而是抓住印度中产阶级的实际需求差异,围绕设计、影像、系统与性能,重点在线上推出T系列、在线下推出V29机型,双双成为销售的关键增长点。 vivo中央研究院院长胡柏山曾表示:“经营本质要求就是要跟踪用户需求变化,所以用户导向是企业一切的根本出发点,而创新也必然从用户导向出,只有这样企业才有生命力。” 不难看出,高端化成为智能手机行业的共识,但在不同国家不同地区高端化的内涵是不一样的,不能盲目套用“药方”。 从这个角度来看,2024年向三星发起挑战,vivo是有底气的。 竞争,又微妙起来 三星之外,vivo问鼎“印度一哥”之路还有其他挑战。 一方面,小米重新起势。 印度也是小米出海的“第一站”,好巧不巧同样是2014年起意的,可谓英雄所见略同,不过小米走得更快一些,早在2016年营业收入就超过10亿美元,一举成为印度最快创造该纪录的公司。 而三星,也曾是小米的“手下败将”。 2018年至2021年,小米一直是印度智能手机行业的“一哥”,如若不是2022年遭遇“黑天鹅”,也轮不到三星称王。 事实上,近年来印度频频“刁难”,外企无不噤如寒蝉。 为了破局,小米印度选择加码投资,并雇佣更多店员以增加就业机会,计划2024年底较2023年初增加两倍达到1.2万人,“经过多年对在线电商的大力押注后,小米将专注于提高印度零售店等线下渠道的销售额,以寻求重振智能手机销售。” 战略调整之后,小米显露了王者归来的迹象。 2023年第四季度,在印度智能手机市场,小米、vivo、三星的市场占有率分别为18.3%、17.3%、16.8%,竞争格局又微妙了起来。 图源:Counterpoint Research 另外一方面,荣耀重返印度市场。 随着荣耀元气复苏,扩张成为其关键词,遂进入更多海外市场:2023年上半年荣耀欧洲地区部出货量增长超过130%,中东非地区部出货量增长超130%,拉美地区部出货量增长超230%;其中,2023年前5个月的海外销量已经超过2022年全年的海外销量,预计2023年海外销量增长130%以上。 印度,自然也在荣耀的考虑之中。 有外媒报道,其计划2024年第一季度至第三季度在印度本土生产手机,并占据印度智能手机市场5%的销量份额。 随着新玩家的入局,印度智能手机市场更卷了,也存在分流的压力。 总而言之,印度市场既充满机遇也有不少挑战,2024年vivo全年反超三星悬念或不大,但小米等对手不容小觑,未来鹿死谁手尚犹未可知。 但可以确定的是,打铁唯有自身硬。
这两家手机厂商同时宣布押注 AI,却选了截然相反的方向
成为历史 或重新出发 新年开工第一天,魅族就成为了行业焦点。 星纪魅族 CEO 沈子瑜在今天上午的视频发布会中宣布,魅族将停止传统手机新项目投入,并决定「All in AI」持续推出 AI 终端产品。 这会是魅族被吉利收购后的二次重生?还是继黑鲨、锤子等品牌陨落后的又一个成为历史的小厂手机?现在还无法盖棺定论。 光从表面看,魅族的这一步,似乎是很猛甚至有点莽的抉择。 不做传统手机的魅族,准备干什么 魅族将战略性调整的目标,押注在「明日设备」 AI For New Generations,通过人工智能的产品矩阵,迈入前景广阔的 AI 科技新浪潮。 可预见的是,今年的手机行业注定会将 AI 大模型作为一大卖点,各大手机厂商从去年就陆续开始布局 AI 与软件生态的结合;没想到的是,魅族竟从根上发起改革,放弃传统手机业务的老本行,并且给出了一个颇受争议的缘由: 随着全球手机市场换机周期延长、消费创新空间有限、行业恶性竞争加剧,手机行业正面临着前所未有的挑战。同时,手机产品单纯依赖硬件升级和参数竞争,已无法满足广大消费者多样化、全面化的使用需求和使用体验,行业亟需寻找新的可持续发展方向。 昨天晚上,魅族官博已对上述内容提前预热,也犀利点评了行业现状和数位友商。 自 2022 年 ChatGPT 问世,到谷歌、亚马逊、微软等大量世界顶级科技公司选择全面押注 AI,都在预示着 AI 时代的到来,而「寻求突破」的魅族,将用 3 年时间布局生态和沉淀技术,逐步完成 All in AI 的战略目标。 沈子瑜认为,目前以 AI 功能为导向的终端产品 AI Pin 和 Rabbit 虽然已经给出了初步答案,但这样的产品还不够完美。 按照规划,魅族会在今年打造并更新面向 AI 的手机端操作系统,此外魅族首款 AI Device 硬件产品也将在今年内正式发布,并与全球顶尖的 AI Device 厂商展开正面竞争。 魅族预测 2025 年云端与侧端算力成本会下降,AI Device 将进入普及期,届时它们会迭代推出全天候的人工智能设备,并以 XR 的形态满足全天候的使用场景。 之后的 2026 年魅族将完成 AI 产品生态的构建,而且把该产品的国内市场占有率的目标,定在 TOP 1。 魅族的「雄心大志」,来源于对自家产品软硬件的自信。 沈子瑜表示,无论是硬件制造的实力,还是软件程序的开发能力,魅族都要强于上述的 AI 产品公司。 因此魅族将打造全新的 AI 设备,用 AI 原生设计重组产品形态,并用更强大的硬件算力支撑 AI 的全局调动。 Flyme 系统也会被重构,在 All in AI 中,用户会以「直觉式」的交互与 AI 互动。 之后魅族产品的硬件,会对全球大模型团队全面开放,同时也会寻求与 OpenAI 等国际团队的合作。 发布会讲到这里时的演示动画中,还藏着一个有趣的细节:下方的渐变彩色条纹和 OpenAI 官网的样式高度相似。 不知这是表明了改革的决心,还是把投名状藏在了缝隙里。 全力以赴的创新值得鼓励,但最为用户最担心的问题是原有的产品线是否会被彻底抛弃? 魅族也给自家用户拿出了「定心丸」: 1. 魅族 All In AI 过渡期内,原魅族 Flyme、Flyme Auto、Flyme AR、MYVU、PANDAER 以及无界智行业务的用户体验及服务将不会受到影响。 2. 现有在售的魅族手机产品将继续为用户提供正常的软硬件维护服务。已购买的魅族 20 系列、魅族 21 旗舰手机的用户,仍将享受原有的售后及相关服务保障。 按照 3 年的过渡期,魅族用户大概率可以把手机用到 2026 年。 不做传统手机的背后,另有隐情 看完今天的发布会和新闻通稿,许多网友都有点云里雾里,我们也一样,因为魅族也没说清楚它们今后到底要做出怎样的 AI 产品。 为什么一定要传统的智能手机,为什么一定要有屏幕?我们应该以全新的交互方式为基础,重新想象这个设备的形态。 例如沈子瑜在视频里的这段话,在批判完当下的智能手机后,也没有对全新的交互方式和重构的设备形态加以描述,因此新的产品就只能靠文中说的一样,靠「想象」脑补。 相较于发布会,这段演讲更像是一个谜题,而广大网友也给出了五花八门的解题思路,当中最大的争议点是:魅族是否真的会放弃手机业务? 在见到沈子瑜口中的「明日产品」前,我们也不好妄下定论,不过从目前魅族的市场表现和发布会的字里行间,还是能找到两种选择的理由。 选择①:还做手机,改个叫法 魅族在文章说法上玩儿了两个文字游戏。 首先,沈子瑜在今早的演讲里,再说到「魅族将停止传统智能手机新项目投入」这句话时,把重音放在了「传统」二字上,而并非「智能手机」,虽然涉嫌过度分析,但作为公司的 CEO,理应最清楚魅族今后的发展路线,即使说者无心但听者在意,潜意识的表达说不定包含了真意。 另外,今天魅族的新闻通稿和发布会里,始终都在强调「不做传统智能手机」,而并非「不做手机」,牢牢地将传统和智能手机绑定,也许是魅族新产品「断舍离」的宣发铺垫。 如果魅族继续推出全新的手机业务,刚好能在这一点上无缝衔接,并宣称全新产品并非「传统」,不仅和坎坷的过去说了再见,也在宣传上去分开了自己和其他「传统」品牌。 也有知情人士透露了一些消息,所谓的业务停止,大概率是将原来的研发机型砍掉了一些,将今年已经入网或进入流水线的产品,改成 AI 手机。 就像沈子瑜所讲的「魅族的时间和资源有限」,因此在有限的预算里,先通过发布会把 AI 概念包装到魅族的标签上,跟上业内的潮流,再在今年晚些时候用一句「我回来了」,点燃今日埋在互联网上的火种。 魅族继续做手机,对吉利的生态布局也至关重要。早有成就的华为、饱受期待的小米以及自成一派的蔚来,都是通过自家手机终端的产品布局,打造出了好用的车机互联系统。 独立的手机业务在市场上没有取得傲人的成绩,那如果以吉利汽车为中心打造的生态 AI 手机,FlymeAuto 还有可能会成为吉利汽车最新的卖点。 去年 11 月,魅族自研 AI 大模型 Aicy 还被应用到 FlymeAuto 上,对交通规则、车辆维保、深度定制行程规划等问题都能一一解答。Flyme Link 还能将手机信息直接「流转上车」,一键在车机上查看地址、发起导航。这些都是吉利收购魅族后所希望看到的效果,这当中「车机」和「手机」缺一不可。 因此从正方看,魅族极有可能会继续手机业务,通过激进的表达来宣布魅族不再是一家「传统」手机厂商,而是 AI 企业,至于已经官宣停止的魅族 21 Pro、22、23 项目,改成 Polestar Phone 或者字母系列,宣传效果也能拉满。 选择②:不做手机,另起炉灶 三年回到中高端市场 TOP5、2023 年建设 400+ 售后服务点、90-120 家集汽车/手机销售/售后一体的线下体验店、3 年内建设 1000 家线下门店。 这是沈子瑜在魅族 20 系列发布会后,对采访媒体放下豪言。 如今,魅族在线下完成了 300+ 家零售门店和 400+ 家服务门店的建设,姑且算其勉强完成目标,但最核心的手机业务却在 Others 的分类里,销声匿迹。 2022-2023 Q4 中国智能手机市场销售份额. 图片来自:Counterpoint 手机是个烧钱的业务,吉利也清楚这一点,但没想到在魅族东山再起之前,手机竟能如此烧钱。即使魅族 21 在首销期间实现了全渠道销售额「秒破一亿」的傲人成绩,但放在整个市场中却有些差强人意。 有行业人士分析,这种情况下吉利不想继续给手机业务持续「输血」,甚至有可能会开启大裁员,发布会上的 AI Device 是一个体面的离场借口,未来魅族还会继续研发 AI 技术,布局 AR 眼镜、车机大模型和新的 AI 硬件。 但有限的研发经费,魅族无法在手机重研发上投入更多,也无法带来区别于其他主流品牌的创新点,魅族 21 也就真的有可能成为绝唱,以后魅族核心任务,就是做好 FlymeAuto。 目前吉利已经达成了当年收购魅族的最大目标—— FlymeAuto 车机系统,虽说车机互联的体验从优,但这并不是新能源车最核心的卖点,一个 App 就能完成大部分的互联功能,更重要的是,后者省钱。 哪怕吉利有心让魅族继续研发全新的 AI 手机,但从今天开始的硬件空窗期中,几乎不会有新品迭代,加上市场换机率下降和其他厂商的持续更新,魅族的新机落地,还不太现实。 也就在今天, OPPO 发布了「开启 AI 手机新时代——致 OPPO 伙伴们的一封信」。 OPPO 认为手机行业即将进入继功能机、智能机之后的第三个阶段—— AI 手机。为了迎接 AI 大潮,OPPO 宣布已经专门成立了 AI 中心,今后公司的资源将向 AI 业务集中。 2024 年,手机行业在持续了近 7 年的全面屏之争后,又来到了时代的岔路口。终端功能会在今年迎来重大更新,同时也意味着行业将面临再一次的洗牌重组。 但实际上 AI 对手机的影响还没有那么大,而各家争先恐后地将大模型加入更新日志,还是因为手机存量市场竞争的态势异常凶猛,在折叠屏不成熟、旗舰机空间有限、下一次硬件技术革命到来之前,AI 就是最大的宣传点。 以 OPPO 为代表的大厂,用出众的影像、显示、设计、手感、系统以及生态,在上个阶段积累下的存量用户、市场份额和资金资源,成为了它们能够也敢于率先踏进新时代大门的资本。 魅族和 OPPO 两个手机品牌在软硬件策略上的相反举动,就是在彻底说明,「Others」类别里的公司,其实不太需要再去做手机了。
先捧后“杀”?Vision Pro难救苹果
撰文 | 张 宇 被苹果CEO蒂姆·库克赞美为“将开启空间计算时代”的Vision Pro,正在遭遇一场退货潮。 2月16日,话题#果粉们开始大批退货Vision Pro#突然登上微博热搜榜,在话题下面,不少用户纷纷发表了自己的观点:“这玩意儿现在发展得确实还没那么成熟,建议租赁”“苹果有一个14天全额退款的退货计划,随着这个时间的接近,出现一股退货潮在所难免”“一斤多的重量都堆到眼前,舒适度为零,退货也是情理之中”“不实用,一般人用不上”。 图源:微博 事实上,自Vision Pro于2月2日上市之后,用户就已在各类社交平台上吐槽Vision Pro的实际使用感受,综合而言,其槽点主要集中在:佩戴体验不舒适、实际体验与想象存在偏差、眼睛疲劳、使用场景有限、内容生态尚未构建完整等等。 Vision Pro曾一机难求。1月19日上午8点,Vision Pro准时开启预售,然而开售不到5分钟,服务器就被挤爆了,很多订单无法处理,仅仅开售半小时后后,便已显示全部售罄。因为订单较多,导致Vision Pro发货时间大幅延后,苹果官网显示,发货日期已经延至3月份,部分订单甚至已经排到了4月份。 短短一个多月的时间之后,用户对待Vision Pro的态度却发生了天壤之别的转变,对于股价接连受挫、iPhone销售情况不及预期的苹果而言,Vision Pro似乎还是难以成为苹果的第二增长曲线,Vision Pro能否力挽狂澜并帮助苹果创造新的消费电子时代,目前仍是一个未知数。 一、大批用户退货Vision Pro 东海证券研报显示,预售开启后的首个周末,苹果即售出16万台至18万台Vision Pro,预购不到10天,苹果已售出超20万台Vision Pro,但在近半个月的体验过后,不少曾经抢购Vision Pro的用户的兴奋劲已经过去了,并且发现了Vision Pro存在的诸多缺陷。 Meta CEO马克·扎克伯格在体验完Vision Pro后,在Instagram上发布了一段视频开怼Vision Pro,并将其与自家产品Quest 3进行了对比。 马克·扎克伯格在视频中表示,在使用了Vision Pro后,“我不仅认为Quest 3更具性价比,我还认为它是更好的产品,不接受反驳”。此外,他在视频中重点强调了苹果所做的妥协,认为Quest 3的重量轻了120克,更便于舒适地长时间佩戴。他还表示,由于没有有线电池组,Quest 3的运动范围更大,而且视野也比Vision Pro更宽。 特斯拉CEO埃隆·马斯克也对Vision Pro进行了吐槽。2月7日,马斯克在X平台上回应了一位用户对Vision Pro的评论,埃隆·马斯克称,“我试过Vision了,但它并没有让我震惊”。同时其还表示,“iPhone 1在我看来也不怎么样。考虑到所有因素,它的实用性比其他替代品要低,但到了iPhone 3,无疑是最好的智能手机”。 众多用户也直言Vision Pro的实际体验与想象中存在较大的偏差,而偏差主要集中在以下两个方面。 佩戴不适感是引发Vision Pro退货潮的主要原因之一。不少用户反映,Vision Pro容易导致视觉疲劳,并出现眼睛红肿现象。亦有用户表示,佩戴Vision Pro会导致头痛和晕动病。一名科技博主在YouTube发视频称,Vision Pro的重量明显是一种负担,感觉不舒服,如果用头显做在iPhone或Mac上做的事情,比如打开Safari浏览器或搜索二手车,还需要额外的步骤。 此外,Vision Pro还存在着视觉效果不佳的情况。有不少用户在社交平台上抱怨称,Vision Pro将虚拟应用覆盖在用户视线之上的能力“还不够好”,当观察真实物体时,视线在大多数照明条件下都是模糊的,比如查看电脑或iPhone时,图像质量不够清晰,无法看清屏幕上的内容,阅读小字体的论文也是如此。还有用户指出,佩戴Vision Pro时只有转动头部才能看到屏幕上的不同元素,因为屏幕周边有巨大的黑边,模糊并扭曲了20%左右的视线。 不过,也有用户站在中立的角度上,对Vision Pro遭遇退货潮进行了分析。一位科技博主在社交平台上发文称,“目前除了少数数码、科技领域等人士有幸体验过,估计国内99.99%的人都没有机会体验。到底成色如何,应该等到国内大规模上市,更多人体验过才有说服力。另外,任何产品的一代,要想达到出色、让人惊艳的程度都比较困难。经过不断迭代,后面不断改进优化,会逐渐赢得未来。” 截至目前,尽管苹果并没有对Vision Pro遭遇退货潮进行回应,但无法忽视的是,Vision Pro在上市初期就遭遇了退货潮,侧面反映出Vision Pro的市场接受度仍存在不确定性。 二、Vision Pro难成救命稻草 Vision Pro预售火爆,并被苹果视为第二增长曲线,但目前而言,Vision Pro很难成为苹果的救命稻草。 一方面,要想让用户持续使用并购买Vision Pro ,就需要建立一个丰富的内容生态,包括游戏、电影、音乐、社交等各个方面,而Vision Pro运行的是visionOS系统,此前有报道称,visionOS主要面向的目标用户是iOS开发者,但他们对空间开发环境还不熟悉,而且当前visionOS版本App的应用都还停留在2D交互层面,无法发挥Vision Pro硬件能力。 苹果确实也在努力改进Vision Pro的内容生态。2月14日,苹果全球营销高级副总裁 Greg Joswiak称,目前有1000+ App专为Vision Pro设计,远远超过产品刚发布几天上线的150多个应用程序。 尽管苹果已经构建了上千个应用程序,但仍然有用户认为,“现在没有足够多的多样化体验和多样化内容,来保证每周使用它大约两个小时”。值得注意的是,内容生态要由来自各行各业的合作伙伴共同建设,并不是短期内能迅速解决的事情。 另一方面,Vision Pro的价格对于大部分用户而言是一个重要的考虑因素,与国产AR眼镜厂商相比,动辄超过两万元的价格并不具备性价比。 2月2日,Vision Pro正式发售,起售价为3499美元,由于在中国市场未发售,导致国内价格被炒到10万元。天风国际分析师郭明錤表示,苹果Vision Pro头显的初期备货约为6万至8万台,由于备货数量并不多,在上市初期会出现脱销现象。 此外,有市场机构曾预估,Vision Pro首年销售预期约为30万至40万部,即便顺利实现这一预估目标,也只能为苹果带来14亿美元的收入,不足苹果总收入的1%。可见,现阶段Vision Pro还难以成为苹果的救命稻草。 三、Vision Pro困于小众 虽然Vision Pro在WWDC2023上发布之后变得声名大噪,但仍然是一款十分小众的产品。市场研究机构Counterpoint认为,3499美元的定价表明,Vision Pro并非针对普通消费者,而是瞄准专业用户和内容开发者。 郭明錤在最新发布的报告中指出,根据预购前的备货水准,以及出货时间,预估苹果在开放Vision Pro预购后,首周末卖出16万至18万部Vision Pro,在今年的出货量达到50万部应不难。但在预购销售一空后需求却快速下滑。郭明錤还表示,早期迹象可能意味着,市场对Vision Pro的需求正在减弱。预订开放后48小时内,那些延长的发货时间并未发生变化,这引发了一个重大担忧:即在核心粉丝和重度用户下单后,需求可能会迅速减弱。 华泰证券也在研报中指出,假设Vision Pro一代产品出货量为50万台至100万台,乐观计算第一代产品对供应链一年的拉动约为30亿美元,而iPhone对供应链的拉动约为600亿美元,明显相差较大。 不过,不少机构也对Vision Pro的发展潜力寄予厚望。1月31日,市场调查机构Statista发布报告称,彼时苹果Vision Pro销量已逼近20 万台大关。预估Vision Pro上市首年出货量为35万台,第二年将达到148万台。根据售价和预测销量简单计算,Vision Pro今年预计为苹果带来12亿美元的收入,2025年则预计带来近52亿美元的收入。 摩根士丹利预测,苹果可以在发布后的四年内将Vision Pro带来的收入提高到40亿美元,这一增速将超过AirPods刚发布的前四年,仅次于Apple Watch。 Vision Pro能否迎来爆发时刻还有待时间验证,Vision Pro虽然只是硬件,但其背后是个巨大的生态产业链,涉及到创新性技术、创新性材料、创新性内容生态等等,现阶段Vision Pro仍难撕小众标签,要想实现真正的爆发更是任重而道远。
三星电机将重点投资汽车MLCC,与日本村田竞争
集微网消息,智能手机需求持续低迷,制造多层陶瓷电容器(MLCC)的全球电子元件公司通过扩大汽车MLCC业务寻求突破,韩国领先的MLCC公司三星电机将投资重点放在汽车MLCC,该市场一直由日本企业主导。 近期,占据全球MLCC市场份额第一的日本村田最近宣布,计划投资470亿日元(约合3.14亿美元)扩大日本岛根县出云市工厂的MLCC生产设施,该设施计划于2026年3月开始运营。 业界推测,随着智能手机销量增长放缓,此次扩建旨在提高针对电动汽车(EV)市场和物联网(IoT)等市场的产能。 MLCC已广泛应用于智能手机和个人电脑(PC)等IT设备以及家用电器中。最近,电动汽车和自动驾驶汽车的出现凸显了汽车MLCC市场作为电子元件行业的新领域。汽车MLCC市场规模预计将从2023年的29亿美元增长到2026年的40亿美元。 继村田之后,日本TDK、太阳诱电、国巨等全球MLCC领先企业也将汽车MLCC作为重点竞争领域,积极投资。太阳诱电于2023年7月在江苏常州建成了MLCC生产基地,并开始量产,专注于针对中国电动汽车市场的汽车MLCC。 三星电机在去年3月的股东大会上宣布转型为汽车零部件公司,在日系企业单打独斗的情况下,加紧加强在车用MLCC市场的占有率。 根据市场研究公司TrendForce数据,自2016年开始全面生产汽车MLCC以来,三星电机的市场份额迅速增长,从2022年的4%增至2023年的13%。 同期,村田制作所(从44%下降到41%)、TDK(从20%下降到16%)、太阳诱电(从18%下降到13%)等龙头企业的市场份额有所下降。有评价称,三星电机为缩小与日本企业的市场占有率差距奠定了基础。
魅族21千里走单骑,All in AI的它将走向何方?
2月18日,新年之后开工第一天,星纪魅族CEO沈子瑜宣布,魅族决定All in AI,将停止传统「智能手机」新项目。魅族将基于AI战略布局,重构Flyme OS,打造全新AI终端设备,并将向全球大模型团队全面开放,积极拥抱OpenAI等国际顶级大模型团队,构建新的AI生态。魅族All in AI大有背水一战的决心,也让2024年的AI行业又多了无数种可能性。 随着魅族All in AI的决定落地,不少人也对魅族手机感到惋惜,尤其是去年亮相的魅族21系列,也只能是魅族21一款千里走单骑,在终章时刻来一曲华丽的绝唱。在All in AI的过渡期,魅族现有产品享有正常的软硬件维护,Flyme、Flyme Auto、Flyme AR、MYVU、PANDAER、无界智行业务持续推进,魅族线下零售服务门店将持续推进。该声明一出,也算是给老魅友们吃了一颗定心丸,起到了定军心的作用。 当然,可能有不少网友会好奇,魅族做AI为什么要停止传统智能手机新项目,难道就不能兼得吗?我在沈子瑜的视频当中也找到了一部分答案,接下来就和大家分享一下,也会就这些答案给出一些我的理解。 手机行业创新已死,与其无限内卷,不如All in AI 沈子瑜认为,手机行业变得越来越像电脑行业,主流产品已经做到流畅不卡,拍照够用,功能齐全。消费者平均51个月才换机,大家发现够用就好,手机行业的创新更像是堆叠参数的军备竞赛,加大内存、加大cmos、加大电池和快充等,而行业里获得传播的方式越来越多,互相揭短、恶意攻击、水军洗地。在一个无限内卷的环境里,用宝贵的智慧资源和创造力去对抗传统智能手机规模效应与复制粘贴,是对团队才华的浪费,所以魅族要停止传统「智能手机」新项目投入。魅族要用有限的资源和有限的时间,驶向属于魅族的伟大航路——AI。 纵观魅族发展史,其实有一次很敢的转型,曾经在MP3卖的最好的时候,魅族停产了所有MP3,开始押注智能手机,在之后的几年发展中,MP3逐步退场,智能手机迎来发展高峰。而魅族这种急流勇退的策略,也使其成为了当时国产智能手机品牌当中的佼佼者。到了如今,魅族要转型AI,需要放弃传统的智能手机,即使在2023年魅族卖出了历史最多旗舰手机,并且好评率达到98.6%。 以上是沈子瑜传递给行业和用户的信息,解释了魅族All in AI为什么要停止传统智能手机新项目。魅族做出如此决定,需要很大的勇气,相信也有万不得已,其背后的博弈可能并不是我们所了解的。就沈子瑜给出的解释,我也聊聊自己的看法。 一、手机行业创新,比拼的也是国产化率。对于任何一个品牌来说,创新始终都是向上发展的驱动力,哪怕是苹果近些年也被群嘲缺乏创新力。国产品牌近些年来竞争非常激烈,这也导致了“内卷”这个词被反复提及,背后既有创新推动,也有价格战使然。尤其是对于国产品牌来说,硬件创新已经触及到了天花板,而这块板儿并非物理意义上的天花板,而是供应侧难以绕过的天花板。以芯片为例,国产品牌难以越过高通、联发科这两个芯片供应品牌,华为虽然是特例,但是背后的伤痕累累又岂是能轻松复制?近些年来,我们也能看到国产品牌在做一些小芯片,电源管理、影像芯片等等,算是一种对创新的执着,但是大芯片这种短时间内无法逾越的技术鸿沟,使得国产品牌创新成为了一种所谓的微创新,这不仅仅是某个品牌的痛,更是产业链的痛。 二、魅族急流勇退,手机市场的竞争愈发烧钱。大家都知道,在智能手机行业,苹果是要拿走一多半的利润的,即使是华为坐稳了高度市场,面对苹果的高利润也要退避三舍,更何况其它国产品牌,本来卖一部手机就赚不到多少钱,再加上各种内卷,想盈利就更难了。这既是摆在国产品牌top5小米、荣耀、华为、vivo、OPPO面前的问题,更是others当中品牌要面临的问题。无疑,虽然去年魅族卖出了历史最多旗舰手机,但是面对彻底疯狂地友商们,还是会显得心有余而力不足。魅族在龙年开年能够宣布停止传统智能手机新项目,虽然会引起不小的争议,但却是一种体面,一种面对行业困境的一次自我救赎,是及时止损而集中力量办大事的暗区突围。曾经MP3到智能手机时代魅族成功了,现在智能手机到AI时代,相信也会让我们看到曙光。 三、国产AI一片繁荣,但是背后却始终要追赶OpenAI。在OpenAI推出ChatGPT之后,国产大模型如雨后春笋般出现,2023年也便成为了AI元年。但是繁荣背后其实是对OpenAI的不断追赶,我们真的领先了吗?可能很难这么说。尤其是在近日Sora展示了AI的视频制作能力之后,可以说是让全球不管是AI行业还是普通消费者都眼前一亮。360集团创始人、董事长周鸿祎强调称,国内大模型发展水平实际上跟国外的ChatGPT4.0比还有一年半的差距,而且OpenAI手里可能还有秘密武器,这可能会使得我们之间的差距继续加大。不得不说,魅族这种All in AI的勇气和魄力,正是基于对现实的认知。如果说未来魅族成为了国内大模型的领军企业,那么不论是智能手机行业还是智能汽车行业,亦或是其他的千行百业,又将是另一番景象。 四、软件赋能,AI使能,魅族再走一条新路子。魅族停止传统智能手机新项目,堪称是一次对过去的断舍离。虽说凡是过往皆为序章,但是魅族已经完成了重要的用户积累和软件生态积累,魅友和Flyme是魅族宝贵的财富。沈子瑜提到,三年时间,完成All in AI愿景,预研AI OS,构建AI时代操作系统基建,今年推出首款AI Device;2025年,云端与端侧算力成本下降,进入AI Device普及期,完成AI Device迭代,并且以XR形态满足全天候使用场景;2026年,魅族AI Device成为国内市场top1,市占率、产品生态完整构建,要预言前沿技术,推出AI Device Pro。魅族的AI OS或许未来也会成为连接人车家生态的重要纽带。 五、魅族老用户换机需求用什么承接?AI Device又将以什么样的形态呈现?虽然魅族说要停止传统智能手机的更新,但并未说AI Device是什么,有没有可能还是手机,只是命名为AI手机呢?如此一来依旧可以承接老用户换机需求。在开年之际,OPPO陈明永就发文要“开启AI手机新时代”,这算不算魅族和OPPO的英雄所见略同呢?其次是AI Device可能是XR眼镜,去年魅族就推出了MYVU,算是一次试水,而年底苹果也推出了Vision Pro产品,更是将XR产品带到了新的高度,凭借着All in AI的决心,魅族在XR这条赛道完全是可以做出成绩的。如果是XR设备,无法完美承担手机任务,那么魅族手机的老用户必然会流失,我觉得魅族不会眼睁睁看着这部分用户流失,应该会有相应的措施。 写在最后 当我们身处棋局,总会当局者迷,而魅族在经历过风风雨雨之后,俨然已经拥有了属于自己的上帝视角,面对行业的未知与AI的大潮,停止传统智能手机新项目可能是不得已而为之,但All in AI又何尝不是一次豪赌?以我之全力,博AI之未来,以前的魅族可能让大家以MP3、智能手机、Flyme所熟知,未来的魅族凭借不成功便成仁的勇气,势必会在AI的进化史上留下浓墨重彩的一笔。
方向错了?宝马董事长抨击车内大屏影响驾驶安全,增加事故风险
金融界2月18日消息 最近几年,汽车行业可谓是发生了翻天覆地的变化,尤其是新能源汽车崛起之后,大屏、冰箱、沙发几乎成为了标配,不过作为老牌车企的领导者,宝马汽车集团董事长齐普策对此有不同看法。 没了发动机、变速箱,只能卷大屏? 近日在参加一档访谈节目时,宝马董事长齐普策表示“数字化不是看谁家屏幕更大,代码更长”,“现在不少车企的产品提供大屏幕,这可能会分散司机的注意力,导致事故”。他还补充道:“汽车技术的发展,应该尽可能地不要让司机分心”。 齐普策的担心不无道理,如今的汽车,特别是新能源的确有屏幕越来越大的趋势,比如吉利银河E8就搭载了贯穿整个中控台的45英寸无界屏。新势力当中也有反对大屏的呼声,哪吒汽车CEO张勇曾表示“我对车里面搞一堆大屏为了孩子看视频方便,持保留态度”,“我们的车上目前没有后排放显示屏的规划”。蔚来CEO李斌也曾表示“车上其实不需要那么多大屏”。 不过消费者似乎并不这么想,去年新势力中卖的最好的理想汽车全系都标配了大屏+冰箱+沙发,2023年共交付376030辆,同比增长182.2%,创下年度销量新高。而2023年销量排名前十的新能源车型几乎都搭载了大屏,比如特斯拉Model Y搭载了15英寸中控屏幕,比亚迪宋PLUS DM-i搭载12.8英寸/15.6英寸中控屏幕,AION Y搭载了14.6英寸中控屏幕。 新能源车企也有自己的苦衷,当发动机、变速箱被取消或是不再成为重点,就必须要寻找新的卖点,于是大屏、智驾、全景天幕、隐藏式门把手、电子外后视镜等等“创新”不断涌现,如今甚至连换挡杆和转向灯拨杆也被取消,集成到了大屏和方向盘上,对开惯了传统油车的用户来说需要重新适应。 此外,使用大屏替代按键对省成本也有不小的帮助。一个实体按键的生产成本并不高,但其研发过程却非常繁琐,需要不断开模、测试,以达到最佳的手感、耐久度、灵敏度,这些工程都需要车企与供应商深度合作。而大屏省去了这些步骤,车企只需要选购想要的尺寸或者提出要求,就能够得到相应的配套。 大屏真的会影响驾驶安全? 对于大屏是否会影响驾驶安全,坊间争议已久。此前一家海外机构曾测试过大屏与实体按键使用便利性的对比测试,参加测试的车型包括特斯拉Model 3、宝马iX、大众ID.3、沃尔沃C40、奔驰GLB、沃尔沃V70(2005年发布)等。 测试项目为110km/h时速下分别手动进行打开座椅加热、空调温度调高2℃、打开除霜、打开收音机并调到指定频率、小计里程清零、仪表亮度调到最暗并关闭中控屏。结果全触屏的宝马iX花费30.4秒才完成上述操作,触屏和按键混合的奔驰GLB花费20.2秒,全部都是实体按键的沃尔沃V70仅用时10秒。特斯拉Model 3和大众ID.3的用时分别为23.5秒和25.7秒。 通过这组测试可以看出,在不使用语音操作的前提下,全按键车型更适合纯手动操作,用时最短。而全触屏和触屏+按键的车型非常考验系统的操作逻辑,某些车型仅仅是调整方向盘位置都需要在中控屏上操作好几步,非常浪费时间。比如参加测试的荣威Marvel R尽管采用了按键+触屏的组合内饰,完成测试项目却花费了足足44.9秒,比全触屏的特斯拉Model 3多出近一倍。 另一项研究则表明了行车时操作触控屏有多危险。正常驾驶状态下,驾驶员的反应时间普遍在1秒左右,如果轻微饮酒,反应时间会增加到1.4秒左右,但如果操作触控屏,反应时间会增加到1.6秒左右。也就是说,开车时操作触控屏比酒驾还要危险。 此外,根据《应用人机工程学》期刊上的研究文章,副驾屏对行车安全也会产生影响。行驶过程中,副驾屏播放的内容会引起主驾驶潜在的视觉分心和认知分心,导致车速和车道保持变差。 从研究结论来看,不管是中控大屏还是副驾大屏,一定程度上都会对驾驶安全产生影响,甚至还出现过开着智能驾驶辅助睡觉或者看剧的事件,增加了事故概率。不过车企也只是嘴上反对,身体倒是很诚实,比如前面吐槽大屏的齐普策,自家的新款宝马5系搭载了14.9英寸中控屏,后排甚至可以选装31英寸悬浮式巨幕。看来在销量面前,自家老大的脸面也不是那么重要。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。