行业分类:
加载中...
头条分类:
加载中...
AI眼镜“火到”A股!相关公司真有业务布局?最新回应来了
财联社8月14日讯,近日,AI眼镜概念股强势上涨,龙头股博士眼镜已经连续2日20cm涨停,短短3个交易日大涨超70%。板块内的亿道信息、亚世光电跟随走强,均录得2连板。 苹果被曝要推新款AR眼镜的消息提振了板块的做多情绪。知名科技记者马克·古尔曼(Mark Gurman)在《Power On》中爆料称,苹果专注于AR技术的Vision团队,正在持续试验开发多款产品,包括:一款AR眼镜、一款计划明年推出的“平价版Vision Pro”,以及功能更为完备、但尚不知何时发布的第二代Vision Pro。 随着板块的连日上涨,投资者对AI眼镜概念股的关注度也迅速升温。在沪深交易所互动平台上与AI眼镜有关的提问显著增长,截至发稿,今日投资者追问相关公司业务是否与AI眼镜有关的提问已多达超百条。相关公司也在平台上就公司是否有AI眼镜相关业务布局进行了回应。 博士眼镜在互动平台表示,公司目前致力于智能眼镜“最后一公里”的验配服务,暂未涉及智能眼镜的研发。 亿道信息在互动平台表示,子公司亿境虚拟专注于近眼显示、三维空间显示与空间计算的XR产品的研发与交付服务,是XR类行业中产品及技术较为成熟且具备批量生产能力的产品、方案及技术提供商。其中AR眼镜作为XR产品的重要分支,亿境已服务多家知名AR客户。公司今年计划推出的新品AI眼镜也在稳步研发之中。 科森科技在互动平台表示,公司虚拟现实眼镜客户涉及境内外品牌。 大厂商密集布局智能眼镜类产品凸显出对行业后续看好态度。根据公开资料统计,苹果、Meta等大厂均在布局智能眼镜产品。其中,Meta有望在9月“Connect大会”上发布“真AR眼镜”。此外,雷鸟、影目科技、魅族等厂商有望在2024年发布AR眼镜产品。 对于AI眼镜板块的主题投资机会,不少机构也相对看好,中信证券就认为,AI智能眼镜是当前产业公认的AI最具性价比硬件落地方案,潜在空间巨大。西部证券认为,随着技术路径逐渐成熟,叠加端侧AI的普及,AR智能眼镜有望成为下一个过亿的创新终端产品。 中信证券研报认为,AI智能眼镜作为可穿戴设备,在低成本的同时为消费者带来划时代高效率,是当前产业公认的AI最具性价比硬件落地方案,潜在空间巨大,2024年正是AI智能眼镜领域关键的拐点时刻。短期投资上,由于AI智能眼镜短期出货量仅百万级别,对应国产供应商业绩弹性较低,所以更偏向主题投资。 华福证券认为,长期来看,智能眼镜是理想的AI Agent的载体。眼镜终端的AI Agent具备信息输入和输出第一时效性。智能眼镜具备长时间佩戴的硬件基础。眼镜类产品能够获得更接近人的传感单元的信息。由于接近人的面部,智能眼镜能够“看人所看”、“听人所听”,较其他智能终端获得更多学习用户的素材。 西部证券表示,AR眼镜有望成为端侧AI落地的最优解。随着产业链的积极布局以及技术路径逐渐成熟,叠加端侧AI赋能,AR眼镜出货有望实现加速。据Wellsenn预测,2024年全球AR销量有望达65万台,同比增长27%,预计2027年有望增至500万台。 其还表示,AI智能眼镜是传统眼镜向AR/MR眼镜迭代的过渡形态,随着技术路径逐渐成熟,叠加端侧AI的普及,AR智能眼镜有望成为下一个过亿的创新终端产品。重点推荐:代工厂商天键股份。建议关注:1)代工:歌尔股份、立讯精密、佳禾智能、亿道信息等;2)光学:水晶光电、舜宇光学、蓝特光学等;3)SOC:高通、恒玄科技、炬芯科技等。
人形机器人,距离“转正上岗”还差几步?
想象一下这个画面:一个凌晨的车间,几排整齐的人形机器人沙沙作响地做着流水线任务。这个场景放在几年前只出现在科幻电影里,不过在今天已经实现了。 前不久,人形机器人企业Figure推出第二代人形机器人Figure02,在软硬件上比起一代都有突破进展,更是搭载了“金主爸爸”OpenAI定制的语音推理模型,实现自然语言的交互。现在的它,已经进入宝马车厂开始“打工”了,可以无休止地狂干20个小时。 图源:微博截图 “炸裂”新品的发布又把人形机器人推到了舆论中心,从去年底优必选(9880.HK)上市到今年WAIC上特斯拉Optimus新一代的亮相,再到近期Figure02的推出,人形机器人的发展在这两年可谓进展神速。 但是,脱下“创新技术”这层外壳,人形机器人的量产难度到底在哪里?从研发到商业化应用又需要面对什么挑战呢? 01 为什么是“人形” 人形机器人,最近又火了。 被微软、英伟达和OpenAI投资的人形机器人企业Figure在前几天发布了号称“地表最强”新款人形机器人Figure02。据“趣解商业”了解,和上一代相比,Figure02进行了外观的重构,机器人的外皮承担了压力,采用了外骨骼结构,这样子机器人的电源和算力布线就集成在机体内部,由此提高了机器人的性能;迭代后的Figure02手部具有16个自由度,能够承受与人类相当的力量。 软件方面,新一代机器人也搭载了投资人OpenAI定制的语音到语音推理模型,这样子人类就可以直接用语音和机器人交互。 图源:微博截图 其实机器人发展到现在,在我们日常生活中的渗透率已经非常高了,比如在商场里常见的大型清扫机器人、物流流水线上的物流机器人等;专项机器人如此完善的今天,我们为什么还要做人形机器人? 而且,为什么一定要是“人形”? 答案其实很简单,因为只有“人形机器人”才最有可能接近“全能机器人”。 我们生活的世界中,所有的场景、设备、工具都是服务于人类的形态设计的,所以各种单项的机器人可以拆解某一种具体的场景去使用,比如物流机器人可以做扛、放重物,工业机器人可以拧螺丝、扫地机器人可以打扫,但是出了这个特定的领域,这个机器人就成了一块“高科技板砖”。 而只有人形机器人能够不受场景的限制,融入人类生活的各个方面。人形机器人最大的特点是自由度高,具备较强的自主性和多功能性;例如,在工业制造中,人形机器人可以替代人类从事重复、繁杂和危险的工作减少事故发生。我们可以将现在各种机器人理解成发展人形机器人的一个初级形态,而人形机器人才是终极形态。 为了实现这个终极形态,人形机器人需要做三件事:感知、运动、思考。 就拿跨越障碍物这件事情来说,得先“感知”到障碍物,然后“思考”是走过去、跳过去还是跨过去,最后“运动”或者说行动来实现跨越。这对普通人来说只是下意识的行为,对人形机器人就是一个复杂的训练过程。 现在大部分的人形机器人的问题都出在“思考”这个环节上,毕竟感知和运动可以通过传感器布局、机器人关节设计的完善来在硬件上下功夫,不过“思考”这件事情实在是太复杂了。 以往大家的训练方式都是“打标签”,比如教人工智能学习什么叫做“西瓜”就把各式各样的西瓜打上标签,人工智能在看到符合这个标签的物体的时候就可以给出相应的认知。不过这样的训练方式放在有局限性的领域中还好,放在更大的领域中就很难做到穷尽。 现在有了大模型,就打开了一种新的训练思路。大模型加上传感器数据,可以训练机器人更好地了解世界的规律。 比如同样都是去冰箱里拿饮料,拿瓶装可乐和袋装牛奶的方式就不一样,大模型学习可以让机器人“理解”可乐可以直接捏起来而袋装牛奶就要轻轻拎起来的区别。 更重要的是,大模型可以训练机器人对自然语言的理解,比如你说“我饿了”,现在的机器人未必懂它需要做什么,但大模型训练之后,机器人就可以为你跳转到外卖平台的界面,更甚者可以给你去炒盘菜。对自然语言的深入理解,帮助机器人更好地理解人类,也能更大地减轻人类与机器人的交互难度。 可以说,大模型的应用又给人形机器人的发展推向了next level。 02 多方入局 在大模型的加持下,2023年被称为“人形机器人元年”。 从融资表现来看,据“IT桔子”数据,2023年人形机器人领域融资事件有23起,总金额达到54.71亿元,是过去十年以来的巅峰。而截至当前,2024年人形机器人领域已经有14起融资事件,总金额接近24亿元。 图源:IT桔子 从产品来看,2023年开始至今,不论是新锐的产品还是企业都在涌现。比如2023年成立的星动纪元,由清华大学交叉信息研究院孵化,致力于具身智能以及人形通用机器人技术和产品的研发;同年成立的开普勒,自研算法实现人形机器人预设动作与端到端全自主规划相结合模式及精准控制... 还有赶在今年元旦之前上市的机器人赛道老牌选手优必选,更是以“人形机器人第一股”的姿态给整个产业的资本化再次推上快车道。 以优必选为例,这些三方供应商是整个领域的主力军。这些企业基本都会以某种使用场景为切入来进行人形机器人的研发,比如优必选更专注于工业制造、达闼更多面向家庭服务。作为整个产业链的中游,三方供应商最重要的自然是争取下游的订单,趁早“进厂”;所以,市场化、商业化就对他们非常重要。比如,今年2月,优必选的Walker S已经在合肥蔚来汽车工厂进行“实调”;据“趣解商业”了解,优必选已经和数十家国内头部新能源汽车企业接触,推进人形机器人需求对接。 图源:微博截图 而这些“被进厂”的下游企业当中,也有部分开始自己搞人形机器人的选手。 特斯拉,就是一个代表。机器人作为马斯克的“宏图计划”当中非常浓墨重彩的一笔,其机器人的代表作Optimus也一直都有进展,如今已经可以双臂与腿配合完成基础瑜伽动作,与此同时保持躯干的稳定性;还可以通过纯视觉输入,以正常的速度拿起积木,并能按照蓝、绿两类颜色正确分类,在对面发生人为移动积木的动作时,Optimus依旧能以自身原本的节奏顺利完成任务,且在积木摆放出错时,自主调整正面朝上,完成纠错。 图源:微博截图 小米也早在2022年就发布了“Cyber one”,近期又联手机器人泰斗王田苗,投资了一家名为"小雨智造"的具身智能科技公司,这也是小米首次对外投资具身智能领域公司;而本田入局机器人领域都已经三十多年的时间,推出的ASIMO甚至在2002年就跑去和纽交所董事长握手去了。 和中游供应商有差别的是,下游企业的研发出了实用性还有品牌效应,尤其是这几位都是现在典型的造车企业,在汽车智能化势不可挡的趋势下,对于智能机器人的研究能让车企更敏锐地捕捉前沿技术,也展现自己的技术实力。 在去年的 1024 小鹏汽车科技日上,小鹏汽车董事长兼CEO何小鹏推出了小鹏汽车自研的人形态双足机器人 PX5;据“趣解商业”了解,小鹏团队耗时 5 个月,实现了自研双足机器人的稳定行走。 8月12日,何小鹏在微博上发布一则视频,展示了一只机器手订购MONA M03的过程。何小鹏还表示:“AI及大型硬件的新进展今年内我们将跟大家同步,敬请期待。”虽然微博透露的信息不多,但也能看出小鹏在积极布局机器人赛道。 图源:微博截图 在实用性上,中游厂商更重视“开源”,因为要“开张卖钱”,而下游厂家就更重视“节流”。马斯克就表示Optimus量产之后也会率先进入到特斯拉的生产流水线。用人形机器人代替工人拧螺丝,可以收获一个24小时待机、不会疲劳、不会闹情绪的“完美打工人”,成本降低、效率提升,最终实现的就是生产成本的控制。 当然,下游厂商研发的人形机器人足够稳定后也可以进行商业化,从而成为整个企业收入的一个增长部分;不过从底层逻辑来说,虽然都是争先“进厂”,但中游和下游的侧重点还是略微不同。 03 何时量产 不论是中游还是下游选手,虽然都热热闹闹的,但也各有各的麻烦。 特斯拉的人形机器人已经开始拖延量产时间了。去年就表示Optimus要在2024年底前实现量产的马斯克在不久前发推称特斯拉明年会小批量的生产人形机器人,然后预期在2026年实现量产以及对其他企业客户的交付;也就是说整个机器人的进展推后了几乎一年。 小米的“Cyber One”在2022年亮相之后最后一次展示是在2023世界机器人大会上,而且展示的也是2022年的老版本,之后也没传来什么突破性的消息。 “预计优必选人形机器人进入汽车工厂将在2024年底实现小规模交付。”优必选董事会主席、执行董事兼行政总裁周剑表示。不过在交付之前,已经上市的优必选还要面对市值滑坡的困境。 截至8月14日,优必选的报收86.25港元/股,相比今年3月7日最高峰的股价328港元/股,不到半年时间跌幅已经超过了70%;市值也由高峰的超1300亿港元跌到了361.87亿港元,蒸发近千亿港元。 图源:百度股市通截图 那么,人形机器人的困境到底在哪里? 首先是技术难关。有媒体曾经报道,国内一线研发专家在人形机器人系列电话会上提出了人形机器人量产的四个技术痛点: 1.手部和腿部硬件集成难度大,需要更高的损失峰值功率和驱动能力; 2.腿部行走算法稳定性难以保证,学术界尚未出现真正意义上的类人走行算法; 3.手部精细化感知难度大,涉及到手的21-26个自由度; 4.双臂协同、混合智能操控和避让等算法难度大,需要高维度的规划。 其次是在成本层面。机器人的量产还得考虑软硬件的成本控制,如何随规模效应逐渐均摊成本。 但这边成本控制都还不成熟,那边市场定价就已经卷起来了。今年5月,宇树科技发布的G1人形机器人售价只要9.9万元,用得着和用不着机器人的都沉默了,因为人形机器人的定价当时还动辄在百万元的区间。结果大家还没为9.9万元这个定价吃惊多久,3.65万元售价的众擎机器人发布的专业级双足机器人SA01整机或散件套装上市,主要面向科研教育市场发售。 这种两极分化的情况就让很多机器人厂商十分为难了,而这背后反应的实际是人形机器人下游市场需求不明确的情况。这也是大部分高新技术产品市场化的问题,由于高新技术产品对技术创新有极高要求,结果满足要求的产品又太贵,所以中游厂家只能推出一个又一个便宜的版本。 还有就是,人形机器人在非结构化场景中的应用受限;由于机器人通用性不足,无法灵活应对突发事件。人形机器人的商业化落地,最需要的是一个迫切又确切的场景;以现在的局面来看,高端制造需求下的工业化场景,以及人口老龄化趋势下的生活化场景是商业化价值最高的场景。但是市场上仍缺少一个产品的典范,让大家能更直观地看到人形机器人的商业价值。 人形机器人能否真正取代人类的部分重复劳作,还有很长一段路要走;但人形机器人必然是未来的趋势,谁能把这个“故事”具象化,谁才是赢家。
谷歌拓展AI辅助:双屏实时转录改善不同语言的人面对面交流
IT之家 8 月 14 日消息,谷歌今天发布新闻稿,针对 Pixel 9 Pro Fold 可折叠手机,发布了全新的 Live Transcribe 界面,通过双屏幕改善使用不同语言的人面对面交流。 Live Transcribe Live Transcribe 是谷歌提供的实时转录功能,为全球用户提供实时、连续的语音转文本服务。 此前用户使用过程中,必须将手机朝向对方才能显示自己的回复,而现在谷歌针对可折叠手机,引入了全新的双屏界面,让用户更自然地进行面对面交流。 谷歌在新版 Live Transcribe 中引入了全新的双屏按钮,用户点击之后外屏会向对方显示转录和键入,而内屏会展示用户界面,方便使用不同语言的人面对面交流。 Magnifier 谷歌还升级了去年推出的 Magnifier 应用,让用户切换微距(精细印刷)和广角(更多场景)镜头。 更大的放大镜可以让你在场景中搜索特定的单词,比如你在机场寻找航班起飞时间,或者试图在菜单上找到素食菜肴。IT之家附上相关视频如下: Live Caption Live Caption 新增支持韩语、波兰语、葡萄牙语、俄语、中文、土耳其语和越南语。 Guided Frame 用户不再需要使用 TalkBack 屏幕阅读器,即可在 Pixel Camera 设置中立即启用 Guided Frame,该功能可以通过语音告诉盲人或低视力者指向哪里来帮助他们拍照。
实测SearchGPT!OpenAI侵占谷歌搜索栏,万亿搜索战场要变天
作者|Eric,编辑|Zuri 7月26日,OpenAI宣布正在测试新的AI搜索工具SearchGPT,计划将其跟ChatGPT整合,目的是为用户提供更具时效性和更准确的信息。 这意味着,OpenAI对搜索领域的两大选手直接发起了挑战——传统的搜索巨头谷歌,以及初创的AI搜索引擎Perplexity。 《金融时报》称,OpenAI已准备好攻进谷歌1750亿美元(万亿人民币)的搜索业务市场。 除此之外,另一玩家也跃跃欲试,那就是估值达到30亿美元的 Perplexity。也在快速发展,并且获得不少大佬的偏爱。英伟达创始人黄仁勋此前声称,自己每天都会用Perplexity。不过,Perplexity在商业化上的摇摆,为其增加了诸多不确定性。 总之,谷歌、OpenAI、Perplexity都在加速布局 AI搜索 ,开启一场新的“三国杀”。在这场竞速突围当中,谁会是赢家? 01 差强人意的SearchGPT SearchGPT上线后不久,硅兔君拿到了测试账号。连续使用SearchGPT两周后,最大的感受是: 搜索速度真快! 相比Perplexity免费账号的搜索速度、Bing Search以及与ChatGPT的互动,SearchGPT搜索速度飞快,堪比谷歌的关键词搜索。 除此之外,硅兔君私以为SearchGPT目前的局限性在于: 1)用户交互界面比较简单,相较Perplexity来讲有些简陋; 2)检索、综合的信息来源似乎有限,对于开放式的问题,给出的有价值的信息似乎不如谷歌多。 两周的使用后,硅兔君认为,可以将SearchGPT + Google Search两者结合起来使用,比如,对于想快速了解的问题,询问SearchGPT快速获取答案,对于想开开脑洞、综合多方面信息进行探索和深入了解的问题,还是要求助谷歌,所以现阶段,还是无法完全摆脱对谷歌的依赖。 SearchGPT善于处理的问题,例如:“Perplexity的融资和估值信息”,这样指向明确、答案限定的问题。 左边菜单栏展示了SearchGPT目前支持的三个功能:搜索、查看索引链接、搜索图片,就该问题,SearchGPT提供了20张搜索结果,与谷歌的搜索量级有一定差距。 此外,SearchGPT具有ChatGPT的一定能力,比如,它可以根据输入的一系列公司名称,搜索其最新的状态,IPO/ M&A/ 私募状态。 这是谷歌所不具备的能力。 但对于比较开放的问题,或者你想看到更多相关信息、进一步探索时,SearchGPT检索的信息资源比较有限(一般是提供10条索引信息,而谷歌前两页搜索结果会提供两倍的信息量),难以满足这一需求。 但SearchGPT准备了一项杀手锏用以撬动用户—— 即如果选择将SearchGPT设为搜索引擎,链接会跳转至谷歌浏览器的小程序应用商店(Chrome Web Store),选择将之集成到浏览器后,谷歌浏览器原本默认的Google Search会变为SearchGPT。 从某种程度上讲,SearchGPT直接”篡改了“谷歌浏览器默认的Google Search。 毫无疑问,此举提升了SearchGPT使用的便捷性,从谷歌”虎口夺食”。 02 强势入局的Perplexity Perplexity在搜索体验上具备更多的“确定性”和“丰富性”,被外界视为谷歌的挑战者。 Perplexity成立于2022年,由前OpenAI 研究员 Aravind Srinivas、Meta前科学家Denis Yarats等合伙人共同创立。 SearchGPT是否有借鉴Perplexity不得而知,总之在具体的功能体验上二者非常相似。比如,Perplexity利用AI为用户提供更为直接的搜索答案,而不是简单的提供网站链接。 另外,Perplexity所有答案后面都有信息来源,就像学者写论文会标注参考资料。比如,用户输入“巴黎奥运会”,显示的答案后面会有路透社、彭博社等知名媒体的报道链接。 在Perplexity你还能看到系列相关问题,比如“巴黎奥运会的奖牌制作过程”“巴黎奥运会的比赛安排”等等。这些问题被称作“相关问题”(follow-up question),如果用户对它们感兴趣可以进一步阅读。 Perplexity还有一个提升“确定性”的功能,就是允许用户将搜索范围限制在特定数据库中,比如要求它将检索范围限定为YouTube、Reddit或者特定学术期刊。 2023年Perplexity月活用户突破1,000万、累计提供超过50亿查询,2024年的目标是两个数字都增长10倍。 Aravind Srinivas曾声称,“谷歌将被视为传统而陈旧的事物,而Perplexity会是下一代和未来的产品。” 而谷歌应对这种冲击的表现,可以说十分糟糕。 03 三大玩家的通病:信息准确性 在今年5月的年度I/O开发者大会中,谷歌高调宣布将AI功能引入核心搜索业务,推出名叫“AI Overviews”(AI概览)的功能。 简单说,就是用户进行搜索时,AI会整理出一段概述在网页的顶部进行优先展示。用户不必点击多个链接,就能快速获得答案。当时谷歌CEO桑达尔·皮查伊称,这是25年来搜索领域最大的变化。 然而,理想很丰满,现实很骨感,谷歌很快终止了AI Overviews。原因是它在回答部分用户的问题时,展示出了离谱和错误的答案,遭到用户的疯狂吐槽。 大家热议最多的就是,在回答“芝士无法粘在披萨饼上”的问题时,AI Overviews建议“在馅料里加入八分之一杯的无毒胶水”。 事实上,SearchGPT也在面临着信息准确性的问题。 有用户在SearchGPT中输入“ 8月份北卡罗来纳州布恩的音乐节”,结果中第一个显示的是阿巴拉契亚夏季音乐节,并且将从今年7月29日至8月16日举办一系列艺术活动。 然而,该用户经过求证后发现,该音乐节实际上是从6月29日开始,7月27日举办最后一场音乐会。也就是说,7月29日至8月16日并不会有活动举办,显然SearchGPT给出了错误答案。 不仅仅是SearchGPT,Perplexity也面临着信息错误的问题。 此前,Wired调查发现,Perplexity使用第三方内容爬虫抓取了不允许爬取的网站内容。此外,Wired还指出Perplexity的回答会错误地概括文章内容,甚至传播错误信息。 Aravind Srinivas回应非常刚硬,直接回怼“问题出在第三方爬虫,而非Perplexity本身”。 不过,当出版商公开diss Perplexity时,它却服了软。此前,福布斯声称Perplexity窃取文本和图片,侵犯了自己的版权。Aravind Srinivas 回应称,产品功能存在瑕疵,正在通过更多反馈进行改进。 另外Aravind Srinivas还表示,公司正致力于与出版商达成收入共享协议,从而解决正在出现的问题。 在AI时代,新闻机构显然正采取不同的方式来捍卫版权保护。OpenAI似乎注意到这种趋势,其特地强调SearchGPT是与多家新闻出版商开发,包括新闻集团、美联社、《大西洋》月刊和VoxMedia等等。并且,出版商可以选择让自家内容在搜索结果中展示,同时不用于训练OpenAI的模型。 可以看出,AI搜索要想往前发展,必须跨过信息的准确和版权这两道难关。 04 商业化,决胜AI搜索的关键 未来,AI搜索一定是大势所趋,对传统搜索的冲击也会愈发猛烈。 咨询机构非凡产研的数据显示,2024年3月,全球范围内AI搜索产品的访问量占比达24.21%,已成为仅次于聊天机器人的第二大AIGC细分赛道。 在此浪潮下,去年9月微软就在探索将生成式AI产品Copilot整合到搜索引擎Bing当中。效果还是很明显的,2024年第三季度的财报电话会议上,微软CEO萨提亚·纳德拉宣布,Bing的日活跃用户数已经超过1.4亿,一年内用户增长超过4000万。 与此同时,传统搜索正在受到严重冲击。据全球知名IT研究与咨询机构Gartner预测,到2026年传统搜索引擎的搜索量将减少25%。 根据GS Statcounter的数据,今年4月谷歌的搜索引擎市场份额降至86.99%,这是2009年以来的最低点。 那么,当AI搜索兴起、传统搜索下滑,那些AI搜索初创公司能否乘着东风顺利壮大?答案是否定的,因为他们必须解决商业化问题。 从商业模式来看,传统搜索的模式是C端用户免费使用、B端商家投放广告。点击率越高、流量越大,搜索平台的广告收入越高。2023 年,谷歌广告收入规模为2378亿美元,占比高达77.4%。 Aravind Srinivas此前不屑于广告的商业模式,并表示Perplexity与谷歌的商业目标非常不同,即谷歌为赚取更多的广告收入,通常会降低搜索效率,目的是获得更多的浏览时间和点击率,而Perplexity的目标是提供更简洁和精准的答案,减少人们获取信息的时间。盈利方面,Perplexity主要依靠付费的订阅模式,而不是广告。 然而,Aravind Srinivas的这番话很快就被打脸了。 如今,在Perplexity官网的自我简介中,“不受广告驱动模式的影响”这句话已经被删掉了。Perplexity首席商务官Dmitry Shevelenko公开表示,“广告一直都是我们打造出色业务的一部分。”今年4月,有外媒报道Perplexity将开始销售广告。 逐渐向广告创收靠拢,是因为Perplexity面临着盈利的不确定性。《华尔街日报》报道称,Perplexity的年收入超过1000万美元。比起高昂的成本,这个收入只是杯水车薪。根据中金公司的测算,Perplexity调用Bing搜索引擎及GPT-4的单个问题成本约为0.03美元,年成本约为6000万美元。 因此,Perplexity加快了融资节奏。今年6月,路透社报道称Perplexity将获得软银远景基金第二期1000万~2000万美元不等的投资,Perplexity预计该轮融资一共将募集2.5亿美元,估值达30亿美元。 2.5亿美元的融资额听起来挺大,但不及谷歌一天的收入。 同样的,SearchGPT也会面临平衡成本和收益的商业化问题。 TheInformation报道称,OpenAI的人工智能训练和推理成本今年可能达到70亿美元,而数百万免费版ChatGPT用户只会进一步推高计算成本,未来SearchGPT也需要尽快找到盈利模式。 对于当下的AI搜索平台而言,要想短期内取代谷歌的可能性非常低。 毕竟,谷歌的基本盘摆在那里——7月24日,谷歌发布2024Q2业绩,综合收入增长14%达到847亿美元。另外,谷歌搜索的用户数量也已经超过20亿,市场份额也也远超其他同行。面对这个庞然大物,Perplexity或者SearchGPT在体量上还只是个“婴儿”。 在最近的采访当中,Aravind Srinivas变得没那么激进,自称Perplexity的目标并不是取代谷歌。他表示,谷歌擅长简单的导航查询,而Perplexity擅长整合信息。自己从未尝试与谷歌较量,因为真正在搜索领域有所作为的最佳方式,不是尝试做谷歌的事情,而是做他们不想做的事情。 未来,谷歌、Perplexity、SearchGPT将形成怎样的竞争格局还不得而知,只能交给时间检验。能确定的是,对于中小创业者来说,AI搜索或许并不是一个优质赛道,因为成本实在太高,而过度的商业化又会影响用户体验。如果没有雄厚资金支持,大多数中小玩家都会沦为炮灰。
AI斗图神器:普通视频秒变meme,手绘动画轻松融入,了解一下?
哎鸭,鸭鸭摔倒了! 鸭鸭是真的,摔跤是真的,但端的咖啡和端咖啡的手,是AI给p上去的。 △还好手里的咖啡只洒了亿点点 来自一个开源项目,VideoDoodles,这两天在外网上的讨论度直线上升。 这项目妙就妙在,能给视频加上手绘风格的涂鸦,可可爱爱的也行,奇奇怪怪的也行。 就跟人工一帧一帧画上去的没差。 这对目前市场上大多数的2D视频编辑软件来说,还是比较难的。想要达成同等效果,一般还是得创作者真·一帧一帧画上去。 怪费力气的。 但VideoDoodles能靠在视频中重建3D场景,然后在其中放置平面画布,来生成这种效果。 不少人表示,可以用它来装饰视频,加加卡通效果or花字,然后进一步加工成meme/表情包。 搞笑视频也安排,在路上了! 想加什么手绘效果就加什么 VideoDoodles是酱婶宣称自己的效果的: 在视频中轻松、任意地插入手绘动画,还是和视频内容无缝融合的那种。 真的吗?一起来看看。 和给鸭鸭加胳膊加手一样,VideoDoodles可以给任意物种加上四肢。 火烈鸟可以端着自己摇晃的红酒杯,悠闲地在水里泡jio。 小火车从远处驶来,挥舞着双手,xiu的从镜头里开过去了。 当然,想要加一个四肢健全的动物在视频片段里,也是没问题的。 Be like这个肩膀上的小松鼠: 可以看到,不管这位女士怎么步行前进,小松鼠都老老实实呆在她肩膀上。 除了肢体动作,也可以用VideoDoodles来给视频片段加综艺后期的花字。 静态文字: 动来动去的文字: 都有不错的生成效果。 以及,蹭一个刚结束的奥运会的余热,VideoDoodles可以给各种各样的大幅度运动加手绘。 或是箭头指向: 或是超人卡通特效: 咋实现的? 给视频内容加上手绘动画,现在的惯常做法,是把视频本身作为底层,然后利用人工逐帧绘制2D动画效果。 这样做效率相对较低,而且需要保证手绘动画效果要跟踪动态、解决透视变形和适配遮挡物。 能搞定,但费人费时间。 那么,VideoDoodles是如何处理动态物体的跟踪,还有动画同步的呢? 它提供了一简单的界面来帮助大家完成视频涂鸦——“简单”,意味着老手和小白都能轻松画起来。 而项目背后,是利用3D场景重建技术,实现涂鸦自然融入视频场景,包括追踪、透视变形和遮挡等复杂视觉效果。 具体而言,VideoDoodles先把视频内容进行3D重建,而后在视频中放置平面画布,这些画布在3D场景中被跟踪,然后逐帧添加手绘动画。 通过自定义算追踪算法,VideoDoodles锁定画布对应的视频场景中的物体,完成画布跟随物体运动进行移动和旋转。 在VideoDoodles的用户交互界面中,用户可以通过关键帧位置和方向,在2D图像空间的UI中精细控制画布。 而系统则是通过跟踪视频中,移动对象的运动来精心插入关键帧。 简而言之,VideoDoodles是根据关键帧表达的用户意图,利用自有算法解决被遮挡、透视变换,在视频的任意帧渲染场景感知画布,并使画布紧紧跟随移动的物体。 而且关键帧可以有任意数量的位置、方向。 如下面这张图,VideoDoodles就是通过第一帧涂红部分处的方向&位置,和最后一帧涂绿的位置,从而在整个视频中连贯地渲染相应的画布。 具体操作中,流程大致是这样的: 最后介绍一下: VideoDoodles这项研究,由Adobe研究院,蔚蓝海岸大学,以及代尔夫特理工大学的研究人员共同完成。 研发团队负责人表示: 我们的目标是简化“视频涂鸦”的创作过程。 这种新兴的混合媒介艺术形式结合了视频内容和手绘动画,可以用于娱乐或教育目的。 有了VideoDoodles,希望更多人能够轻松实现「将想象力注入现实世界」。
AMD锐龙9900X处理器首发评测:性能全方位升级
近两年,AMD 在 CPU 产品上动作频频。在今年 6 月 3 号的 Computex 2024 AMD 专场发布会上,一口气就推出了四款锐龙 9000 系列 CPU、2 款锐龙 5000 系列 CPU,甚至还有 2 款移动端的锐龙 AI 300 系列。不过,相比隔壁友商在 CPU 最高频率上的追求,AMD 走了另一条进化之路 —— 提升 IPC 性能。 实际上,自 Zen1 架构到如今的 Zen5 架构这七年间,锐龙系列处理器的 IPS 性能总计提升幅度达到了 85%;在带来出色性能提升的同时,也在持续优化能效表现、降低芯片功耗。IT之家这次首发拿到了锐龙 9000 系列的次旗舰处理器新品 —— 锐龙 9 9900X,接下来就跟大家共同探讨下它有哪些提升、实际体验如何吧。 一、实物图赏 聊之前,我们先来看看这颗锐龙 9 9900X 的庐山真面目。 本次锐龙 9 9900X 处理器采用了体积更加小巧的方形包装盒,整体还是四四方方的造型,但是高度明显矮了下来。 包装内部拥有自带塑封壳的 9900X 芯片本体,简易产品手册以及一张小卡片,去年那个让人误会的厚实泡棉块也变成了薄薄一片。 拿出芯片,外观和前代没有区别,依旧印有 AMD RYZEN 标识和 AMD Ryzen 9 9900X 的型号,生产日期为 24 年第 29 周、产地依旧还是中国。 芯片背面也没有任何区别,延续了 AM5 的接口使得它能够兼容 B650、X670 以及 A620 等芯片组;虽然板卡厂商后续会更新 800 系列主板,但对消费者而言手上有前 3 个系列主板的话,只要厂商提供 BIOS 更新支持,即可无缝更换到锐龙 9000 系列处理器进行升级。 二、架构浅析 当我们将本次发布的四款锐龙 9000 系列 CPU 公布的官方规格与上一代进行对比就会发现,锐龙 9 9900X 相比锐龙 9 7900X 无论是核心 / 线程数量,CPU 最高主频还是缓存大小都没有提升,依旧是 12 核心 24 线程、5.6GHz 频率以及 76MB 缓存;而此前解禁的锐龙 7 9700X 和锐龙 5 9600X 也是类似的情况,只不过 CPU 主频相比上代提升了 0.1GHz。 不过,在默认 TDP 上 3 款处理器都下降了不少,锐龙 7 9700X 和锐龙 5 9600X 都从上一代的 105W 下降至 65W;而锐龙 9 9900X 则由原先的 170W 下降到了 120W,功耗降低对散热来说肯定是好消息。 既然规格几乎相同,那么带来提升的最大功臣就莫过于全新的 Zen5 架构了,官方曾在 Computex 2024 的 AMD 主题演讲中表示:全新 Zen5 架构相对于上一代 Zen4 架构,实际应用和游戏中的 IPC 性能提升达到了 16%,提升幅度相当可观。 Zen5 架构采用了新的并行双管道前端,从而提高了分支预测的准确性并降低了延迟,同时也获得了更高的吞吐量、更宽的管道和向量、更深窗口大小以及更多并行性。具体来说,相比 Zen4 架构,Zen5 架构的指令带宽增加了一倍。 缓存方面,一级缓存由 Zen4 的每个核心 32KB+32KB 变为每个核心 32KB+48KB,一级缓存和浮点计算单元之间的数据峰值带宽增加一倍,并使用完整位宽的 AVX-512 指令集让 AI 性能也提升了一倍。二级缓存的变化则主要来自链路通道数量的增加,由 8 路增加到了 16 路,因此 L2 带宽也得到翻倍。 回到芯片本身,此次的桌面端锐龙 9000 系列依旧采用了经典的 chiplet 设计,保持了一个或两个 CCD (等同于 CCX),完全延续上代设计的 IOD。其中每一组 CCX / CCD 里有 8 个核心、8MB 二级缓存、32MB 三级缓存。IOD 部分和锐龙 7000 系列保持一致,同样具有 2 个 RDNA2 架构的 GPU 单元(核显频率不变)、128 位双通道 DDR5-5600 内存控制器、28 条 PCIe 5.0 总线、5 个 USB 接口和四组显示输出。 三、测试平台 接下来进入测试部分,本次测试我们选用了 3A 平台,以便能够发挥锐龙 9 9900X 处理器的应有表现。 首先主板是来自技嘉的电竞雕 B650E AORUS PRO X USB4 主板,基于 AM5 平台,拥有 16+2+2 项供电,并做了供电区域、M.2 插槽和芯片组部分的散热装甲全覆盖。它还有 4 条 DDR5 内存插槽、支持最高 8000+OC 频率,EXPO 内存超频技术以及 192GB 的内存容量扩展,同时 BIOS 中自带了技嘉 D5 内存黑科技(高带宽、低延迟)。主板上提供 1 个 PCIe5.0 x16 显卡插槽、3 个 PCIe5.0 M.2 插槽以及 1 个 PCIe4.0 M.2 插槽,自带外置磁吸式 Wi-Fi7 增强天线。 此外,技嘉电竞雕 B650E AORUS PRO X USB4 主板还支持 Q-Flash Plus 技术,可实现无 CPU 环境一键更新 BIOS 功能。说到这个功能,一开始的测试平台搭建阶段我们就用上了,由于 AMD 官方首发支持的四张主板都是 X670E 平台;而我们测试所使用的是 B650E 平台,因此需要去技嘉官网自行下载 BIOS 至基于 AMD AGESA 1.2.0.0.ab 的最新版本,否则主板是无法识别辨认新 CPU 的。 技嘉电竞雕 B650E AORUS PRO X USB4 这款主板目前的 BIOS 更新列表中由两个版本(F4b,F4c)都支持了锐龙 9000 系列处理器,我们选择了最新的 F4c 下载更新。这时候就轮到 Q-Flash Plus 登场了,将下载好的 BIOS 文件解压到 U 盘中,主 BIOS 文件改为 GIGABYTE.bin,然后把 U 盘插入主板 I / O 接口挡板上带有 BIOS 字样的红色 USB-A 口中。 接着取下主板上的 CPU 后在关机状态直接按下挡板顶部的 Q-FLASH PLUS 按钮,一旁的状态灯随即亮起红光至闪烁状态,证明主板已识别到 BIOS 文件,我们静待更新完成,状态灯会自行熄灭并关机,此时装上处理器再次开机,即可顺利通过主板自检、进入系统。它不仅操作简单、效率也很高,更新 BIOS 只用了 7 分多钟就完成了,体验下来非常省心。 另外,技嘉电竞雕 B650E AORUS PRO X USB4 主板的颜值也非常高,整体采用高级感的炭黑系 PCB + 黑色基底的金属散热装甲、辅以灰色装饰图案点缀,用在纯黑色系或深色系的桌搭上相当合适。 显卡方面,我们搭配的是技嘉魔鹰 RX 7900XT GAMING OC 20G 显卡,它拥有 GDDR6 320bit 规格的 20GB 超大显存、3 个 100mm 导流风扇 + 直触 CPU 式均热板 + 9 根复合式热管 + 大面积进气格栅共同组成的风之力散热系统,能够有效带出显卡负载时产生的大部分热量,双 BIOS 设计则可以让用户灵活选择更强性能或是更安静的噪音表现。性能上 RX 7900XT 看齐隔壁的 RTX 4080,因此可以保障不会影响到 CPU 测试中的性能表现。 其它的具体测试配置,大家可以看上面这张测试平台汇总表格。 四、理论性能 1)CineBench R23 在 CineBench R23 的测试中,锐龙 9 9900X 单线程分数为 2239 分、多线程分数为 33582 分,锐龙 9 7900X 单线程分数为 2033 分、多线程分数为 28863 分。前者在单线程和多线程上的提升约为 10.1% 和 16.3%。 大家都知道上代锐龙 7000 系列有个明显的“积热”问题,运行 CineBench R23 多轮循环测试或者 FPU 烤机时温度经常会突破 95° 红温线。上一代对位处理器锐龙 9 7900X 的功耗为 175W,CineBench 跑分时温度却来到了 94 度,而单 CCD 的锐龙 7 7700X 功耗只有 135W 就 95.5 度了,不得不借助 BIOS 对 CPU 频率和电压进行一些修改才能缓解。 而这次,在 CineBench 的 10 分钟循环跑分中,我们发现 CPU 的温度降低了不少,只有不到 70°(68.8°)的水平、CPU 核心功率则一直保持在 130W;结合已经解禁的 9600X 和 9700X 在跑分时的温度表现(55° 左右),这一代“积热”问题总算得到了解决,对广大消费者来说绝对是个利好消息。 2)CineBench 2024 在最新的 CineBench 2024 测试项目中: 锐龙 9 9900X 单线程分数为 136 分、多线程分数为 1866 分 锐龙 9 7900X 单线程分数为 121 分、多线程分数为 1614 分 前者在单线程和多线程上的提升约为 12.3% 和 15.6%。 3)CPU-Z 在 CPU-Z 自带的基准测试中: 锐龙 9 9900X 的单线程得分为 846 分、多线程得分为 13065 分 锐龙 9 7900X 的单线程得分为 749 分、多线程得分为 12087 分 即前者在单线程和多线程上的提升约为 12.9% 和 8%。 4)7-zip 在 7-zip 解压缩测试中: 锐龙 9 9900X 的最大线程成绩为 192.838GIPS(=192838MIPS) 锐龙 9 7900X 的最大线程成绩为 172136MIPS 即前者的最大线程解压缩提升为 12%。 5)POV-Ray 在 POV-Ray 3.7 版本多精度跑分测试中: 锐龙 9 9900X 的最终成绩为 10539.72PPS 锐龙 9 7900X 的最终成绩为 9736.25PPS 即前者在该项测试中提升幅度约 8.2%。 6)3D Mark 物理分 在 Time Spy 基准测试中,锐龙 9 9900X 获得了 15373 分的 CPU 分数。 在 Fire Strike 基准测试中,锐龙 9 9900X 获得了 45182 分的物理分数。 综合来看,锐龙 9 9900X 在上述理论性能测试中,单线程总体相比锐龙 9 7900X 提升了平均约 11.1%、多线程性能提升了平均约 12%,属于正常的迭代升级。 五、生产力表现 1)blender BenchMark 首先是 Blender BenchMark 基准测试,在其 4.2 版本的测试项目中: 锐龙 9 9900X 的 monster 场景得分 209 分、junkshop 场景得分 152 分、classroom 场景得分 107 分 锐龙 9 7900X 的三场景得分则是 225,136 和 207 分 2)V-Ray BenchMark 在 V-Ray BenchMark 6 的 CPU 渲染测试中: 锐龙 9 9900X 拿到了 39557 分的成绩 锐龙 9 7900X 拿到了 29036 分的成绩 前者在该项测试中的提升幅度高达 36.2%。 3)PC Mark 10 在 PC Mark 10 现代办公基准测试中: 锐龙 9 9900X 的综合得分为 11698 分 锐龙 9 7900X 的综合得分为 9173 分 前者在该项测试中的提升幅度高达 27.5%。 4)Adobe 两件套 Puget for Adobe 系列测试一直是生产力测试中的主流项目,本次我们挑选了 PhotoShop 2023 和 Premiere Pro 2023 进行测试。 在 Puget for Photoshop(0.93.6)项目中: 锐龙 9 9900X 的综合分为 1746 分 锐龙 9 7900X 的综合分为 1499 分 前者在该项目中的领先幅度为 16.4%。 在 Puget for Premiere(0.95.6)项目中: 锐龙 9 9900X 的综合分为 1436 分 锐龙 9 7900X 的综合分为 1140 分 前者在该项目中的领先幅度为 25.9%。 可以看到在生产力环节的测试项目中,锐龙 9 9900X 的表现非常猛,最高 36.2% 的领先幅度足以说明,这代锐龙 9 9900X 的生产力性能提升巨大。 六、游戏表现 最后我们再通过两款主流游戏简单测试一下它的娱乐表现,毕竟锐龙 9 9900X 的核心定位是生产力。考虑到主要是体现 CPU 性能,所以我们采用 1080P 分辨率 + 高画质的设置作为测试基准,并找来了 i9-14900K 作为参照对象。 第一款是传统光栅 3A 游戏《古墓丽影:暗影》,通过自带基准测试: 锐龙 9 9900X 的游戏平均帧数为 295 帧 酷睿 i9-14900K 的游戏平均帧数为 261 帧 比较而言,锐龙 9 9900X 拥有 13% 左右的优势。 第二款是次时代光追 3A 游戏《赛博朋克:2077》: 锐龙 9 9900X 的游戏平均帧数为 220 帧 酷睿 i9-14900K 的游戏平均帧数为 239 帧 即后者领先接近 10%。 总的来说,游戏环节虽然只测了两款游戏,但锐龙 9 9900X 与酷睿 i9-14900K 还是会呈现出互有胜负的局面,对普通玩家来说锐龙 9 9900X 的游戏表现不差。 七、总结 1)性能 得益于全新的 Zen5 架构对锐龙 9000 系列的 IPC 提升以及功耗优化,锐龙 9 9900X 在各方面的表现都得到了全面升级,尤其是生产力方面的进步幅度很大,而且还解决了一个历史遗留的积热问题,综合实力无疑更加全能。 2)价格 另一个惊喜自然是这次给到了很有诚意的上市价格,上一代锐龙 9 7900X 的上市价格为 4299 元、相比锐龙 9 5900X 的 4099 元还涨了 200 元;而锐龙 9 9900X 的上市价格竟然只要 3399 元、一下子直降了 900 元,对于还在用 5 系锐龙的老用户来说真的是惊喜福利价了,有需求的用户可以考虑入手。
Grok-2发布背后:马斯克“掏空”特斯拉?人才、芯片、资金都转移,股东已起诉
编译 | 黄心如 编辑 | 李水青 智东西8月14日消息,据外媒报道,自2023年xAI成立以来,亿万富翁埃隆·马斯克(Elon Musk)便为他的人工智能创业公司xAI制定了一个宏大的计划,其核心在于调配旗下其他公司的资源来为xAI服务。马斯克计划用旗下特斯拉、X(原推特)提供的人才、数据和硬件,来实现他在今年12月构建世界上最强大AI的目标。 然而,这一举措引发了特斯拉股东的不满。他们认为此举损害了特斯拉的利益,并于今年6月提起诉讼,要求法院将马斯克在xAI的股权转移至特斯拉,并将马斯克在xAI的权益置于信托之下。 一、马斯克“撬”特斯拉员工,租借X芯片支持xAI 根据xAI官网和领英(LinkedIn)上的资料,xAI已经招募了至少11名曾在特斯拉工作的员工,其中6名直接在特斯拉自动驾驶团队工作过。 马斯克曾在X平台上发帖称,xAI、特斯拉和X都在积极招聘人才,并提到了他从旗下的其他公司为xAI招聘员工,其目的是防止优秀的工程师跳槽到竞争对手那里。 今年7月,马斯克在X平台上发起了一项投票,询问用户是否支持特斯拉向xAI投资50亿美元,并说明这一举措之后仍需经董事会和股东批准。结果显示,68%的投票者支持这一提议。马斯克随后说道:“既然公众支持这个想法,那么我将和特斯拉董事会讨论此事。” 据美国消费者新闻与商业频道(CNBC)报道,马斯克要求将原本为特斯拉预留的英伟达芯片移交给xAI和X,并解释道:“特斯拉目前没有地方安装和使用这些芯片,它们只会一直闲置在仓库里。”CNBC引用了英伟达的内部邮件称,未来相同数量的芯片将从xAI和X转移回特斯拉,以实现资源的互换。 xAI还与马斯克的另一家社交媒体平台X保持紧密联系。知情人士透露,xAI从马斯克旗下的X租借了重要的计算机芯片:图形处理器(GPU),并且有可能获得X平台的实时数据访问权。去年秋天,马斯克还透露X的股东将拥有xAI25%的股份。 知情人士透露,X为xAI提供了2.5亿美元的计算能力。作为回报,xAI的Grok聊天机器人也仅在X平台上通过订阅方式提供,且xAI的工程师们还负责修复X上的问题,并会利用xAI的模型改进X的功能。 在马斯克的公司之间,这种资源调配的做法并非首次。多年来,马斯克通过旗下火箭初创公司SpaceX、脑机接口公司Neuralink以及社交媒体平台X等公司之间不断进行资源的调配,以支持各个公司的发展和技术创新。 二、股东不满资源倾斜起诉,要求xAI股权转至特斯拉 尽管马斯克宣称资源调配将为他所领导的各大公司带来整体收益,但特斯拉股东并不完全认同这一观点。特斯拉自动驾驶团队专注于AI驱动的自动驾驶技术,马斯克曾提到,这对特斯拉的未来至关重要。可现如今,该团队的6名核心成员跳槽加入了xAI。马斯克还曾公开提到:“特斯拉收集的大量视觉数据将有助于训练xAI模型。” 特斯拉投资者指控马斯克将特斯拉的核心资源和人才向他新成立的人工智能公司xAI倾斜,认为这违反了马斯克对特斯拉的受托责任,并可能损害特斯拉的利益。 特斯拉股东目前已经提起诉讼,要求法院阻止马斯克继续此类行为,并寻求将他在xAI的股权转移至特斯拉名下。 这起诉讼特别针对特斯拉与xAI之间GPU资源的重新分配问题。诉状中明确指出:“马斯克正在通过xAI创造巨大的价值,可能在不久的将来达到数千亿美元,但这一切都是以牺牲特斯拉的利益为代价。” 三、xAI借力融资60亿美元,成特斯拉AI竞争对手 自2023年成立以来,xAI已经发布了名为Grok的聊天机器人,并开始建设马斯克设想的“全球最大数据中心”。在此过程中,xAI凭借其与马斯克旗下公司的紧密联系,在最近几个月内成功融资60亿美元。xAI目前的估值已达到240亿美元,成为仅次于OpenAI的全球第二大AI初创公司。 ▲xAI发布的Grok聊天机器人(图源:彭博社) 一些投资者认为,xAI与马斯克旗下其他企业之间的连带关系,是他们投资xAI的重要原因之一。这些投资者对xAI能够使用马斯克其他公司的资源,包括特斯拉的数据,来训练其大型语言模型的潜力充满期待。然而,马斯克在接受加拿大心理学家乔丹·彼得森采访时澄清,xAI尚未将特斯拉的真实世界视频数据应用于其大型语言模型。 xAI和特斯拉在人工智能领域各自拥有着自己的目标,这导致两家公司在资源调配上存在潜在的冲突。特斯拉不仅专注于电动汽车的销售,还致力于全自动驾驶系统和人形机器人的研发,而这些领域与xAI的AI研究方向可能存在竞争关系。 尽管外界猜测颇多,特斯拉并未做出任何公开回应。上个月的财报电话会议上,马斯克提到:“特斯拉从xAI中学到了很多东西,这对推进全自动驾驶和建立新的特斯拉数据中心很有帮助。” 四、资源调配合法但有风险,特斯拉股东担心被“收割” 企业之间的资源调配本身并不违法,但前提是每个实体企业都得到了合理的补偿。然而,在大型企业中,这种安排极为罕见且充满风险。因为这种资源调配会让人担心,首席执行官可以能会为了一个公司而损害另一个公司的利益。 特斯拉是马斯克旗下唯一的上市公司。目前已有至少三位特斯拉股东提起诉讼,声称马斯克将稀缺的人才和资源从特斯拉转移至他的初创公司xAI,这损害了特斯拉投资者的利益。而这些案件目前正在特拉华州法院审理中。波士顿学院法学教授布莱恩·奎因(Brian Quinn)对此评论道:“每当马斯克动用这些公司的资源时,他实际上是在动用别人的钱。他不能将这些资产都视为自己的个人财产。” 当首席执行官在同一笔交易中兼任买卖双方时,谈判和确定价格可能涉及内幕交易。公众担心,存在利益冲突的首席执行官可能会故意将新业务引入经营困难的公司,或在与经营更成功的公司交易时支付过低的价格。加州大学洛杉矶分校法学教授斯科特·卡明斯(Scott Cummings)指出:“法律并不禁止个人对多家公司承担受托责任,法律禁止的是通过故意损害一家公司来使另一家公司受益的行为。” 企业治理专家指出,尽管马斯克在处理未上市公司时可能拥有比在特斯拉更多的自由度,他仍需对这些公司的投资者,包括xAI的投资者,负有责任。不同之处在于,xAI或其他未上市公司的投资者可能不容易对他采取法律行动。对此,波士顿学院的奎因教授指出:“在一家未上市公司,可能只有10个股东,而且大家彼此都认识。这种情况下,很可能通过一个电话就解决了问题。” 然而,作为马斯克唯一的上市公司,特斯拉面临的风险更为显著,因为这位亿万富翁并未持有特斯拉的多数股权。不过,当资源向马斯克其他未上市的公司倾斜,股东特斯拉股东可能会感到自身利益受到侵害,从而更容易通过法律途径挑战马斯克的决策。 结语:马斯克因资源调配被诉,利益冲突风险待解决 特斯拉与xAI之间的资源调配引发了股东的法律诉讼,马斯克被指控可能损害了特斯拉的利益。尽管资源调配有潜在的效益,但实际操作中面临利益冲突的风险。目前,此诉讼还在审理中,马斯克、特斯拉、xAI和X各方尚未做出回应。
二十年来首次!曝美国司法部考虑拆分 Google,Android 或被剥离
今天的 Google 可谓是抢占了各种头条:除了新推出的一大波 Pixel 产品之外,还有来自美国司法部的「坏消息」。 彭博社报道,司法部正在考虑出手「拆分」Google,从而恢复市场的正常竞争。 在上周,美国联邦法官 Amit Mehta 裁定,Google 一直在维持其在线搜索和广告市场的垄断地位,违反了相关法律。 上一次美国司法部提议「拆分」,还是 2000 年尝试把微软一分为二,以失败告终。 「强买强卖」的 Google 有关人士透露,司法部最有可能从 Google 中拆出的部门,是 Android 系统和浏览器 Chrome 的业务,以及 Google 用来销售文字广告的平台 AdWords,其中内部讨论最激烈的问题就是 Android 系统是否应该独立。 为什么明明针对的是在线搜索垄断,但 Android 系统成了最大「靶子」? 大法官 Mehta 认为,Google 要求设备制造商签署协议才能访问 Google 的服务,类似 Google Play 商店,这些服务对海外 Android 手机极其重要,无法使用 Google 服务的华为在海外市场举步维艰。 而我们平时看到的不少海外原生、类原生 Android 的主屏幕上,都默认有一条长长的 Google 搜索入口,很多时候是无法删除的,这也是协议中的要求,确保了 Google 搜索在 Android 系统上的统治地位。 ▲ Asus ZenFone 11 Ultra,图源:Android Authority 在本案之前,加利福尼亚陪审团也在去年 12 月做出裁决,认定 Google 垄断了 Android 应用的分发方式,不过该案尚未有解决方案的提议。 除了 Android 系统,Mehta 还认为 Google 和苹果等第三方手机以及浏览器制造商的合同涉嫌垄断。 Google 每年给苹果超过数百亿美元的费用,让苹果产品把 Google 作为默认的海外搜索引擎。Mehta 声称,这种行为也导致了苹果不再有能力开发自家的搜索引擎,虽然苹果明显具备相应的能力。 Google 在广告领域的垄断也和搜索引擎相关。Mehta 的裁决中显示,Google 垄断了出现在搜索结果页面顶部的广告,以吸引用户访问网站。AdWords 平台则为品牌提供了一种方法,当用户搜索和品牌相关的关键字时,会显示相关的广告。 去年审判的结果也显示,Google 总收入约三分之二来自搜索广告。 除了「分家」,司法部也在讨论一些比较温和的手段,例如,要求 Google 将搜索引擎的数据剥离,或者授权给竞争对手使用,比如微软的必应和 DuckDuckGo 搜索引擎,后者曾出庭指证 Google 的垄断行径。 此前 Mehta 的裁决中也显示,Google 和网站的合同保证其能够获取最多的用户数据,并且数据量是第二大竞争对手的 16 倍之多,甚至想方法阻止其竞争对手改进搜索结果,从而干扰了竞争。 凭借在搜索引擎领域的巨头地位,Google 还成功获得 AI 技术上的优势。因为网站一直都允许 Google 的网络爬虫访问,以确保自己能够出现在 Google 搜索结果之中。而现在,这些优势带来的数据都被 Google 用于训练人工智能。 虽然在去年收到大量投诉后,Google 推出了一个工具,允许网站阻止 AI 抓取信息。但在 Google 今年推出「搜索 AI 概述」之后,情况又变得不太一样。这个功能会在用户进行搜索后,于搜索框下方显示 Google AI 从整个互联网的搜索结果中提取的主要信息。 ▲ 图源:Search Engine Roundtable Google 认为这是「搜索」的新功能,并非单独的新产品,所以对于网站来说根本无法「拒绝」相关功能,想要出现在 Google 搜索的结果中,就意味着要被 AI 抓取信息生成概述。 司法部就此进行了讨论,作为补救措施,政府很可能阻止 Google 这种「强买强卖」的行为,允许网站内容完全不出现在 Google 的 AI 产品中。 对于「拆分」的消息,Google 方面和美国司法部都暂时还没有进行回应,不过针对大法官「垄断」的裁决,Google 表示会进行上诉。 Google 的说法是,这个裁决说明自家一直提供顶级的搜索引擎,但现在政府却不让自己轻易向用户提供这个服务。 目前大法官已经命令双方进入第二阶段,司法部将在下个月的庭审中正式概述其计划。 最终可能双方各退一步 Google 最终是否会走向拆分的结局尚不明确,二十多年前的「微软分家案」成为了案件审理和讨论的一大参照蓝本。 当时微软被诉利用 Windows 操作系统的市场优势,排挤了其他浏览器竞品。司法部于是提出将微软拆分成「操作系统」和「软件」两个不同业务的部门。 ▲ 微软坚称 IE 浏览器是「功能」不是「产品」 最后,微软和司法部进行了和解,同意进一步开放系统,允许第三方公司共享系统的 API。 专家分析,Google 这次的反垄断案件也很可能以这种结局收尾,即双方都各让一步。Google 很可能取消 Android 系统和 Google 搜索的强制捆绑,终止和苹果、三星、Firefox 等公司的搜索引擎独家协议,并和竞争对手共享自家的搜索引擎数据。 肉眼可见,这两年欧美国家都加强了对科技巨头垄断行为的打击。最著名的莫过于欧盟对苹果公司之间的纷争,后者迫于重重压力选择了妥协,在欧盟地区进行了开放。 ▲ 欧盟地区的 iPhone 开放了第三方浏览器内核和应用商店 美国司法部也在今年掀起了反垄断风暴,剑指苹果、英伟达、OpenAI、微软等等巨头,但截至目前,力度最大的恐怕是 Google 面临的「分家」危机。 即使不必拆分,Google 也想必面临种种整改,对其各种业务,特别是风头正盛的 AI,肯定有一定的影响。 不过,由于国内特殊的 Android 环境,即使最后 Android 真的从 Google 剥离,短期看不会对我们造成太多影响。
在视频数据沃土上,大华股份是怎么打造未来数据要素×范本?
作者 | 三北 编辑 | 漠影 2024年,狂飙大半年的百模大战,打到了视频领域。疯狂进化的模型、暴力堆砌的算力,展现出变革的巨大能量。但同时,海量难以开发利用的视频数据,成为新的“瓶颈”。 “数据时代,大模型是核心工具,场景化应用是价值变现的关键。”大华股份研发中心副总裁周文凯告诉智东西,“当下数据要素很火,但视频类数据生产、流通、交易仍有很多亟待解决的问题,这与视频数据的隐私性、敏感性、安全性有很大的关系。” 作为AIoT领域龙头企业,大华股份在视频领域有长达十几年的深耕,周文凯认为基于场景化的业务理解来提取视频数据的结构化信息,并与业务应用进行深度的融合才能发挥更大价值。 作为以视频为核心的数据产业代表企业,大华股份是如何打造未来范本的?通过对话周文凯,本文试图从大华股份在千行百业的场景实战经验中,寻找这些问题的答案。 一、数据为王,以视频为核心的数据产业尤为重要 据知名行研机构IDC预测,到2025年,全球数据总量将超过180ZB,其中中国数据总量将跃居全球首位。伴随这一趋势,数据交易市场的规模预计将达到2200亿元以上,若进一步考虑其驱动的计算、存储、AI技术及软件等基础设施的全面发展,整体市场规模更是有望突破2万亿元大关。 这将展现出什么样的广阔发展前景呢?周文凯向智东西透露,目前产生的所有数据类型中,‌以视图为核心的非结构化数据占据数据总量的90%以上,围绕着视频的数据采集、流转、分析、计算和应用等每个环节都隐藏着巨大的价值。但打开视频数据产业链,我们看到还面临着很多挑战:如何在复杂的感知场景和泛杂的物联协议中,实现数据的精准采集和海量设备的跨网互联,在视频数据分析和加工服务中,当前对于视频等非结构化数据的挖掘程度还很低,视频类数据需要依赖行业智能算法和应用的进一步挖掘,当前中国人工智能渗透率还不足10%,只有通过将视频内容结构化后与业务结合才能发挥更大价值,而场景化应用是数据产业价值变现的核心关键。 “我国视频数据要素市场已构建起清晰的三级架构:上游聚焦于数据采集与治理的一级市场,中游专注于数据加工与分析的二级市场,以及下游面向数据应用评估的三级市场。这一专业化分工体系不仅促进了视频数据产业链的精细化发展,还显著加速了视频数据向产业化迈进的步伐。”周文凯说 总的来看,海量数据资源和三级视频数据要素市场,都是数据产业的肥沃土壤。 二、发挥视频要素“乘数效应”,要迈过四道坎 今年1月4日,国家数据局等17部门近日联合印发《“数据要素×”三年行动计划(2024—2026年)》(简称:行动计划),提出选取工业制造、现代农业、商贸流通、交通运输、金融服务等12个行业和领域,推动发挥数据要素乘数效应,释放数据要素价值。 周文凯告诉智东西,行动方案提及的12个行业所涉及的数据,90%以上是视图为核心的非结构化数据。而发挥这些视频要素“乘数效应”,至少要迈过四道坎。 具体来说,这些视频数据包括用户生成数据、专业制作数据、公共资源产生数据、社交媒体分享数据等多种类型。相比于结构化的文本数据来说,这些视频数据在存储、处理、理解和计算四大方面都更加复杂。 1、存储量大。视图数据有别于结构化的文本数据,大量的视图数据要做大量的存储。这就对有效的存储空间利用提出更高要求,包括需要较强的编解码技术,以及有效的存储能力。 2、数据处理复杂。视频数据种类丰富,编码方式繁多,需要支持不同的分辨率、帧率、编码方式、格式的数据的处理,这就要求数据处理方积累这些不同数据的处理能力。 3、视频理解难度大。视频数据内容复杂多样,要去理解场景化的内容,最好是将小模型和大模型结合起来,去做数据的解析,从而挖掘出视频数据中有价值的信息。这里补充说下,除了训练模型所需的原始数据,视频数据真正产生的交易价值,还是在于视频结构化后挖掘产生的数据价值,因此视频理解好不好,很大程度上决定了视频价值的大小。 4、计算量大。视频数据的计算量非常大,大模型加剧了这一情况。这就需要厂商在准确率和效率之间找一个平衡。视频解析模型的参数量要适度,无法像文本大模型动辄有千亿参数,不然计算量就太大了。 上述特征,也决定了视频数据定价、交易和流通难度更大。 周文凯表示,视频数据不像结构化的文本数据一样流通便利,而是规模巨大,且大多数机器不可读。如果要交易的话,巨量视频数据怎么上传和下载,对网络带宽、安全保护、结构化成本的要求都较高;基于成本和价值定价标准如何定,都是要解决的问题。 对此,周文凯认为,视频数据要素价值的开发,可以参考地产行业采取所有权、使用权、经营权“三权分立”。视频数据使用者向数据所有者付费,视频数据运营者推动视频价值得到最大限度的安全挖掘,从而能够盘活视频数据要素市场。 而从技术角度来说,让视频数据可交易使用,还有赖于AI对数据的理解。比如大华股份在视频编解码、大数据平台、数据治理、视觉大模型、安全合规等多方面都有深入积淀,比如如何实现视频数据与文本数据的异构数据融合计算等,以此降低视频数据开发利用的难度和成本。 三、数据价值变现,场景化应用落地是关键 在数字化时代,‌数据被视为新型生产要素,数据的价值不仅仅在于其本身,‌更在于如何有效地利用这些数据,场景化应用落地是实现数据价值变现的关键。大华股份自2017年起就开始构建大的物联数智平台,2019年形成完整的平台体系架构,2021年发布Dahua Think #战略,推出“一体系、两平台”,即“物联数智中台体系”和“城市平台2.0、企业平台3.0”,助力各行各业挖掘视频数据价值。 2023年,大华股份全新升级Dahua Think #2.0战略,并全新升级的物联数智平台2.0,该平台全面融合物联感知、算网融合、视觉大模型、数据智能等技术,完善软件工程化能力,赋能千行百业客户的应用。 在城市方面,大华围绕城市高效治理、运行自治、安全体系升级、生态协同治理拓展了各领域,覆盖了超过200个城市场景。比如在交通治理场景,周文凯谈道,过去的小模型往往只能识别一些局部场景,如某个关口排队要多久等;在应用了大模型之后,某地整个城市交通态势变得可被全面掌控,交通调配决策变得更科学。 在企业方面,大华则以助力企业构建大安全体系、数智生产力、提升经营决断力,为企业提供数字化管理工具,帮助企业解决业务痛点。比如能源领域,周文凯称一些客户的需求比较强烈,他们亟需通过视频去做安全生产和降本提效;另外智能驾驶领域的客户需求也非常强烈,他们需要基于视频和雷达联合起来去做智能驾驶。 当然这些应用的升级离不开大模型能力的加载,很多大模型并不适合直接拿来用,而是需要结合场景去发挥价值。“无论是生成式模型还是解析式模型,这些大模型都是基础模型(Foundation Model),本质上是比小模型加强了理解和认知能力。当认知产生的时候,人们在上面构建出面向各个场景的能力,这才是大模型价值的本质。” 周文凯谈道,大华做的大模型,是以视觉为核心,融合了多模态的能力,具备准确性和泛化性跃升、图文提示定义新功能、突破视觉认知能力、全场景自主解析、大小模型与算力协同五大方面特征,目前已落地多个行业领域。 除了大模型外,这背后也离不开大华股份围绕视图在编解码、治理、分析、网络、存储等方面所做的一系列优化。 比如在数据分析方面,大华自建了超千台服务器规模的数据中心,专门模拟大数据各种场景需求,支持大华在数据存储、数据治理、数据分析等多方面去做全流程试验,从而保证技术领先性和稳定性。 在数据安全方面,大华积累了众多安全相关技术,在其一站式的数据智能引擎上提供了面向数据传输流转的很多安全管控措施,如实现项目隔离、数据隔离,权限隔离、访问隔离、安全审计等。 结语:视频数据沃土,场景化数据要素价值凸显 当下正值数据要素加速落地千行百业,深挖场景化数据价值变得尤为重要。 从大华股份的实践中,我们了解到国产玩家正在克服视频数据在存储、处理、理解、计算、定价、流通等环节面临的挑战,将视频数据处理能与多样化场景应用深度融合。这其中既包含了企业十几年的行业经验和数据处理能力积淀,更凝聚了跨越多个业务周期的宝贵行业知识与专业洞察(know-how)。 数据为王时代,在堆算力、炼模型的同时,如何让海量的视频数据要素发挥乘数效应,成为我国数字产业实现领跑世界的一大关键。
马斯克又搅局!新大模型单挑GPT-4o,啥都敢聊,网友玩疯,一手实测来了
作者 | 李水青 香草 编辑 | 云鹏 智东西8月14日消息,北京时间今天下午,马斯克的大模型创企xAI推出二代模型Grok-2测试版,包括Grok-2和Grok-2 mini两个版本。 马斯克在自家社交平台X上激情发文,揭开Grok-2在Lmsys大模型竞技场上的“马甲”——sus-column-r。 他转发Lmsys的推文称:“Grok是火箭速度”。sus-column-r在排行榜上获得了超1.2万投票,表现优于Claude 3.5 Sonnet和GPT-4-Turbo,与GPT-4o并列第三名。 在GPQA、MMLU、MMLU-Pro、MATH、MathVista等多项测评中,Grok-2的得分都超过了GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5等主流模型,但仍不敌GPT-4o。 目前,X Premium及Premium+用户现可体验Grok-2与Grok-2 mini,智东西第一时间进行了实测体验。 一番体验下来,Grok-2给我最明显的感受是逻辑非常清晰。例如在下面这个实例中,Grok-2和GPT-4o虽然都给出了正确答案,但前者每一步的步骤和计算都很明了,更容易读懂。此外,Grok-2的文生图能力在FLUX.1的加持下直线飞升,并且保留了其一如既往的“大胆”风格。 xAI还计划在本月稍晚时候,推出Grok-2两个版本的企业API。 体验地址:https://lmarena.ai/?model=sus-column-r 一、性能赶超GPT-4多个版本,视觉与逻辑能力变强 在LMSYS聊天机器人竞技场,Grok-2的早期版本sus-column-r参与了测评,它总体Elo得分表现超越了Claude和多个GPT-4版本。 如下图所示,Grok-2的得分超越了7月18日版的GPT-4o-mini、4月9日版的GPT-4-Turbo,但得分仍低于8月8日版的ChatGPT-4o-latest、5月15日版的GPT-4o。 ▲Grok-2早期版本sus-column-r的Elo得分情况 ▲Grok-2与其他主流模型的胜率比较 ▲Grok-1.5与Grok-2两个版本基于事实性的胜率比较 在内部,xAI团队遵循类似的流程来评估模型,评估重点集中在模型的两个核心能力上:一是遵循指令的精准度,二是提供信息的准确性和真实性。 值得一提的是,Grok-2在推理分析检索内容和使用工具方面取得了显著进步,比如它能准确识别缺失信息,通过事件序列进行逻辑推理,并有效剔除无关帖子。 在基准测试上,团队采用了一系列涵盖推理、阅读理解、数学、科学和编码等领域的学术基准,对Grok-2模型进行了全面评估。 结果显示,Grok-2及其简化版Grok-2 mini相比前代Grok-1.5模型均有显著提升。 在研究生级别的科学知识(如GPQA)、常识问答(如MMLU、MMLU-Pro)以及数学竞赛题(如MATH)等领域,它们的表现已可与其他顶尖模型一较高下。 如下图所示,Grok-2在这些所有的测评中得分都超过了GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5,但仍打不过GPT-4o。 值得一提的是,Grok-2在视觉任务上表现出色,特别是在视觉数学推理(MathVista)和基于文档的问答(DocVQA)方面表现尤为出色。 ▲Grok 2视觉能力应用案例 二、Grok-2已上线X平台,一手实测:文生图直线飞升、逻辑推理更加清晰 X订阅用户现在可以使用Grok-2和Grok-2 mini,非订阅用户也可以在大模型竞技场中,免费体验Grok-2的早期版本模型sus-column-r。 大模型竞技场中还有GPT-4o等共62个模型可供选择,为了方便对比,我们先来测试一下这个早期模型。 首先是前段时间让一众模型翻车的比大小问题:13.11和13.8哪个大。Grok-2和GPT-4o都准确回答,不过Grok-2的思考过程更清晰,列出了详细的思考步骤。 在另一个经典问题“Strawberry中有几个r”上,Grok-2一开始答错了,但换成用英文提问后又给出了正确答案,GPT-4o则是中英文都回答正确。看来大模型还是会存在碰运气的成分。 大模型竞技场中的模型没有实时联网,当我询问“谷歌刚发的Pixel 9有什么亮点”,两款模型都称自己还未掌握这一信息。随后Grok-2根据技术发展趋势和Pixel以往的特点给出了预测,有一说一猜得还挺靠谱,摄像、处理器、AI等都是谷歌这次更新的重点。 GPT-4o则没有给出预测,而是总结了Pixel手机以往的亮点。 在代码能力上,两款模型的表现不相上下,针对需求都给出了详细的解决步骤以及完整的代码。 逻辑推理方面,Grok-2再一次展现了逻辑的清晰性,每一步的推理都分了小标题。GPT-4o虽然也回答正确,但思考步骤不够清晰。 文生图能力是Grok-2此次更新的一大重点,其接入的FLUX.1模型,最近凭借强大的性能在开源社区十分火爆。不过图像生成能力在大模型竞技场体验不到,只能通过X订阅实现。 网友们已经在Grok-2文生图上玩出了花,比如利用其文本生成的能力,帮Grok-2开一场线下发布会。 或是发挥想象力,让马斯克在火星上开车。 而基于Grok一贯以来几乎为零的审查制度,不少网友玩起了梗,比如让特朗普开枪、让小布什吸可卡因…… 又或是让特朗普坐上SpaceX的火箭上天。而面对同样的要求,GPT-4o拒绝得非常果断。 Grok的审查制度究竟有多不加掩饰呢,有网友测试了让大模型“按种族排出智商前10位”,只有Grok-2毫不犹豫地给出了回答,ChatGPT、Claude直接拒绝,Gemini则展开了苦口婆心的教育。 总的来看,Grok-2仍然贯彻了其一直以来的大胆风格,同时在模型性能上与GPT-4o等头部模型不相上下,逻辑更加清晰,多模态能力更是在FLUX.1的加持下直线飞升。 三、月底推出企业API平台,无缝集成企业系统 本月末,xAI将通过全新的企业API平台,正式向开发者推出Grok-2及Grok-2 mini。 这款API将采用全新定制的技术架构,支持多区域推理部署,为全球用户提供低延迟的流畅体验。 同时,xAI强化了安全功能,包括强制性的多因素身份验证(如Yubikey、Apple TouchID或TOTP),并提供了详尽的流量统计数据和高级计费分析服务,支持数据导出。 此外,xAI还特别推出了管理API,支持将团队、用户及计费管理等功能,无缝集成至现有的内部工具和服务中。 结语:Grok-2与X平台联动更深,OpenAI等压力大了 Grok-2和Grok-2 mini现已在X平台上线,比如增强的搜索体验、X帖子的深度解析、优化回复功能都比较令人期待。不久后,xAI还将发布多模态理解功能的预览版。 自2023年11月Grok-1问世以来,xAI在技术、产品及融资方面一路高歌猛进,Grok-2的推出是其新的里程碑。一旦马斯克将Grok大模型能力与X平台的强大内容用户生态连接,形成闭环,包括OpenAI在内的大模型创企的压力都更大了。
78万人排队抢!日本最烧钱的网红玩具,被雷军干翻了
文/ 金错刀频道 巴黎奥运会结束,雷军又有了新身份——全球带货一哥。 奥运会期间雷军凭借“巴黎vlog”收获泼天流量,一边和网友们互动一边疯狂种草。 出发前的“雷军巴黎出差行李箱大揭秘”,带火了饭遭殃辣酱,一时间“雷总同款辣椒酱”风靡全网。 和苏炳添city walk的vlog中,用小米随身拍套装拍照,不仅震惊外国网友,还在国内掀起第二波抢购潮,全网有78万人排队抢。 其实小米早就出过口袋打印机,这次爆火的是第二代产品,明明不是什么新技术,为何这次被封神? 答案是大家苦拍立得久矣。 小米口袋相机爆红是因为它能平替拍立得:同样能快速出片,却只要一半的价格,最重要的是相纸只要2元一张。 近两年,随着怀旧复古风的爆火,拍立得也成为装X神器,不仅价格水涨船高,连相纸都成了理财产品,全网加价都买不到。 小米口袋打印机的出现,把拍立得的爆火和尴尬都放大到极致。 01 朋友圈里的装X神器,逼疯日本黄牛 2014年知乎上有人提问:如何劝阻女友买拍立得? 十年过去这个吸引了114 万流量的问题,至今仍有人在下面回复,只是依然没有有效答案。 因为拍立得对女生的吸引力实在太大,近两年复古风再次成为焦点,低像素、渣画质的拍立得就是女生的拍照神器。 毕业留念、网红景点打卡、还有各种纪念日,都是拍立得出街的高光时刻,随手一拍的氛围感照片是朋友圈的装X神器。 很多苦于不会给女朋友拍照的猛男,也逐渐被拍立得征服。 在刚过去的七夕节,拍立得是七夕女生礼物榜单top3。七夕过去没多久,不少商家的拍立得就被抢购一空,通通断货。 它的受欢迎程度,从很多网络数据足以看出。 拍立得的抖音话题播放次数高达73亿,小红书上,随便一个“拍立得相纸”的帖子,动辄就有上万赞。 因为太火爆,拍立得相纸几乎全年缺货,有人专门从日本人肉背相纸,很多日本的黄牛都不倒卖苹果改行倒卖相纸。 从时代的遗物变成年轻人新宠,拍立得堪称电子行业中“最幸运的产品”。 从第一台拍立得诞生到现在,已经76年了,生产拍立得的公司都被买卖好几轮,唯独拍立得像是欧皇附体,每次要被当成电子垃圾抛弃时,都能开挂爆火。 1947年宝丽来创始人为给女儿拍照,发明了一分钟就能出照片的相机,被美国《时代》周刊誉为 20 世纪最伟大的发明之一。 在之后长达60年时间里,拍立得成了电影圈和摄影圈的宠儿,很多顶级电影中都有拍立得的身影。 宝丽来几次濒临破产,但都靠着拍立得这个摇钱树活了下来。 拍立得爆火——陨落——再翻红的过程,在富士身上也时常上演。 1998年,富士相机生产了拍立得Instax,一经上市就成了王牌,4年就在全球卖了100万台。 因为数码相机和ipone的爆火,富士一度放弃拍立得的产品线,长达10年没有出新品。 就在拍立得要沦为时代遗物时,一个韩剧中的出现拍立得引起全民种草,到了2018 年富士的 instax 系列在全球卖了超过 1000 万台。 至此富士才重新重视拍立得,不仅一口气出了16个新品,还把销售地从数码店改到生活杂货店,引起一大波年轻人购买。 这个曾经险些停产的部门,让富士赚得盆满钵满,最多一年卖了70亿,占了富士全公司业务的30%。 02 拍立得的命脉,都被小米拿捏了 拍立得那么火,为什么会被小米的口袋相机抢了风头呢? 根本原因是拍立得有两个软肋,都被小米拿捏了。 1.相纸界的爱马仕:限购、配货、涨价 自从小米汽车上市,雷军被奉为“人形许愿池”,网友列出了一堆想让价格屠夫打下来的紧俏商品,富士就荣膺头号种子选手。 小米口袋打印相机一上市,就有网友欢呼:小米在向保时捷开炮的路上,打了拍立得一巴掌。 因为很多拍立得发烧友的爱,都被相纸拒之门外。 拍立得的相纸一直很贵,以富士拍立得mini相纸为例,其官方售价为72元20张,平均下来每张3.6元。宝丽来拍立得主流机的相纸价格更高,也就是一张将近15元。 这还是普通白色相纸,一些彩色、联名相纸的价格则会更贵,一张的单价甚至会超过20元。 有网友分享,一盒已经过期4年的疯狂动物城主题相纸,卖了429元,虽然没开封不影响使用,但也没办法100%保证效果。 贵不是原罪,它还有一个十足的 bug——相纸常年难买到。 国内淘宝、京东、拼多多等购物平台,不少拍立得官方旗舰店的相纸已显示无货。 在社交平台中,与拍立得相纸相关的话题浏览量已高达9.3亿,但绝大多数笔记都是在教如何抢购相纸。 缺货掀起的溢价潮,也催生了相关商品交易市场,一些稀缺款的相纸二手交易价格可能比原价高几倍。 在闲鱼、小红书等平台,不少商家囤积了大量的相纸,其售卖价格要远高于相纸原价。 有的还学到爱马仕配货那一套,要求搭配各种二手口红包包等小物件才能卖。 相纸的短缺肥了黄牛却苦了粉丝,连日本的“地下偶像”都因为买不到相纸,收入锐减。 与之对比,小米的口袋打印相机拿出了低价杀手锏,不仅相纸不到2元还自带背胶,狠狠拿捏拍立得爱好者。 2.最“坑爹”大玩具,拍照=开盲盒 雷军在直播中介绍小米口袋相机时表示,只是抱着“做玩具”的心态。 殊不知在数码相机和智能手机普及的今天,拍立得在年轻人眼里就是一种时髦玩具。 拍立得在成片后需要等待1分钟,吊足了拍摄者胃口,有一种“开盲盒”的兴奋感。 但这种兴奋感背后还有一个问题,就是拍立得有一定的废片率。 尤其是在相纸贵、买不到的背景下,废品率成了很多人把拍立得闲置或卖二手的最大原因。 小米的口袋打印机可以先用手机软件P图再打印照片,降低废片率的优势精准狙击拍立得的弱点。 而且小米的口袋打印机,还能上传15秒的视频与60秒的语音,扫开就能放视频,戳中了很多女生的需求。 小米再次验证,打败你的不一定是对手,也可能是跨界。 03 老古董的重生秘诀,都藏在风口里 那小米口袋相机,真的可以颠覆拍立得行业吗? 刀哥觉得不必那么悲观,毕竟口袋打印机和拍立得,从技术到效果都有明显区别。 杀不死的拍立得,数码、美图、单反、手机都没阻挡它复活,打印机自然也不会那么快颠覆。 那问题来了,拍立得作为一个老古董,明明也有替代品,为何总能翻红呢? 刀哥觉得关键不在于产品,而在于拍立得不只是一种相机,而是一种符号和信仰,在不同的场景和需求风口下,总能挖掘出自己的新功能。 年轻人把拍立得捧成时尚单品,更看重它的社交属性。 现在的年轻人可以用智能手机照片记录生活,并发朋友圈分享,而用拍立得按下快门即刻成像出片,可以马上与好友分享拍下的照片,同时满足虚拟和现实世界的社交需求。 这种社交体现在拍照后的赠送,也体现在好友们一起拍照后一起等待显像,然后互相传阅这张独一无二的照片的过程。 除此之外,拍立得还催生了不少新职业。 拍立得摆摊已经成了斜杠青年最爱的新副业,它门槛不高,摄影师只需要挂着简单却又醒目的手写招牌,身上背着相机和相纸,就能随行随拍。 热门旅游景点、迪士尼甚至是民政局这样的“人生地点”,是他们的常驻地。 利用拍立得即拍即得的特性,抓住人们想要保留珍贵时刻的心态,能很快招揽到生意,一张照片能赚几十块钱。 还有人开了拍立得照相馆,专门拍摄有时代感的照片,吸引不少年轻女生去打卡。 就连拍立得的废片爆改,也被年轻人发展成新生意。 小红书上掀起一阵拍立得涂鸦的热潮,在原有的拍立得上进行二次创作,用各种工具让画面变得生动有趣。 手写书法系列在社交平台上热度尤其的高,有博主靠“爆改”拍立得成片赚钱。 数字照片会很快被淹没和遗忘,但实物照片却可以被珍藏和公开展示。 拍立得相机的复兴,在于其抓住了现在的消费者心理:“玩”的体验感>不实用性。 当然仅仅靠需求场景创新还不够,拍立得等老古董想要长红,产品创新迭代也得跟上。 最近几年流行的“混合型拍立得”,机身前面仍然是镜头,但机身背面多了一个液晶屏幕和相关的按键区域,俨然变成了一台数码相机。 市场还出现了有声拍立得,也就是在打印出的拍立得相片一角贴有二维码,用智能手机扫描二维码,可以边看照片、边听到拍摄该照片时录制的声音。 当然小米这波冲击也给富士们提了个醒,再不搞定相纸的产能问题,有用户真的会被雷军抢走。 其实这两年老古董爆改网红产品的案例,并不在少数。 比如诺基亚的老手机被网友当成戒网手机,多次被抢购一空,诺基亚7700二手机还因为外形相当科幻,被捧到了过万身价。 商业来源于需求,抓住大家的使用场景和痛点,就能促进商业的火爆。 情怀、复古的情绪风口,也是古董产品重生之门的钥匙。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。