行业分类:
加载中...
头条分类:
加载中...
华为云推出盘古5.0,大模型“军备赛”要回归主航道
6月21号,在东莞松山湖举办的华为开发者大会(HDC 2024)上,华为云官宣推出盘古大模型5.0,这是继去年7月盘古大模型3.0推出后的一次重磅升级。 就在华为开发者大会举办之时,国内大模型企业的竞争正进入白热化。5月,一些企业打响价格战,将之前业界已经建立的商业模式彻底“摧毁”。而大家也在四处出击,甚至零元争夺大项目,中标项目榜上的座次每个月都在变化。大模型舞台的机会千载难逢,但竞争刚刚开始,就变得异常惨烈。 而从这次华为释放的信息看,大模型的竞赛需要回归主航道。毕竟一方面在Scaling Law规律之下,全球前沿企业在技术上持续取得创新和进展,其中有许多隐秘、高价值的部分需要追赶;另一方面,发展新质生产力,产业AI是主战场,但在千行百业中,仍有很多难题亟待解决。 在大会中,华为常务董事、华为云CEO张平安展示了大量盘古大模型在企业核心场景的最新突破成果。张平安称,华为云与开发者一起深入到千行万业,解难题,做难事,为行业和企业带来实际价值,并强调盘古将继续在行业中攻坚克难。 01 盘古5.0三大升级,为解行业难题 大会上公布了盘古大模型5.0有三个创新升级:全系列、多模态、强思维,尤其突出了模型升级与产业之间的联系,体现“从行业中来,到行业中去”。 其中,全系列是大众在会前猜测最多的,人们认为盘古将从B端延伸到C端,但这次盘古推出了四个系列的模型,包含不同参数规格,有端侧也有云侧,体现了端云协同。比如十亿级参数的Pangu E系列可支撑手机、PC等端侧智能应用,百亿级参数的Pangu P系列适用于低时延、低成本的推理场景等。 对于多模态,这是今年非常火热的方向。虽然过去几年,业界主要聚焦在大语言模型上,但除了语言之外,还有图像、视频、音频等多模态数据,数据量是文本数据的百倍乃至千倍。业界不少企业在攻克多模态大模型,期望将不同模态的数据统一,将理解和生成统一,从而能更好的对物理世界理解、感知和决策。 从张平安的介绍来看,盘古大模型的多模态技术,与解决行业难题相关,也更多利用了华为在行业侧的资源。 它能更好、更精准地理解物理世界,包括文本、图片、视频,以及行业中更会涉及的雷达、红外、遥感等更多模态。在图片和视频识别方面,可支持10K超高分辨率。这些能力更能解决行业难题,如通过卫星遥感图像,盘古大模型就能准确分析出一个区域农作物的生长状况、收成状况,可用于农作物的产量预估、病虫害的监测等。 在内容生成方面,采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。 再如,对于图片和视频,强调可支持10K超高分辨率,因为这对精准理解和重构物理世界非常关键。 “物理世界就是多种模态的,大模型走进千行万业时,希望这些能力能带着盘古解决更多行业难题。”张平安说。 在强思维提升方面,华为云将思维链技术与一种“策略搜索”技术深度结合。业界对思维链并不陌生,它代表了大模型理解、推理的核心能力,而华为这次提出了“策略搜索”,不同于大热的“增强检索(RAG)”,RAG用于克制大模型的幻觉,而“策略搜索”是智能体用来适应变化并做出决策的过程。华为云称,两者结合,实现数学能力和复杂任务规划能力,是创造有价值行业助手的关键。 从盘古5.0升级的信息看,它紧跟了全球大模型技术前沿的潮流,但同时重在从行业出发,技术升级仍聚焦在“解行业难题”上,发挥华为在产业侧的优势。 比如,盘古5.0在演示生成能力时,不像年初Sora发布时放出的极具娱乐性和冲击性的视频,而是演示了如何重塑智能驾驶、工业设计、建筑设计等,行业人士会更体会到其中的意义。 以智能驾驶为例,有车企人士告诉数智前线,在训练过程中,车企用大模型做数据生成,这是当下一大趋势,但大都是静态数据,像交通流这些动态数据,年初Sora发布时,让他们看到了希望,但当时看还达不到要求。而在这次大会上,盘古率先演示了自动驾驶的视频生成。这重塑了自动驾驶的训练方式。 盘古大模型生成车身四周六个摄像头的视频 “盘古大模型也能生成风景视频和炫酷的科幻视频。”张平安称,“但我们努力的方向不在这里,大模型可以风花雪月,我们认为更关键的是要解决行业难题。” 大会上,张平安也介绍了华为云在具身智能上的进展。业界有一种说法,当下多模态大模型正在演化成智能体Agent,帮助人们感知、理解和决策。当数字世界的Agent进入到物理世界,与硬件结合,这就是具身智能。令业界兴奋的是,大模型给具身机器人带来了思考能力。 华为云的盘古具身智能大模型,采用了以云助端方式,能让机器人完成10步以上的复杂任务规划。比如,夸父机器人现场演示在几种物品中识别出一瓶水,然后递到现场一名工作人员的手中。而盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人。 02 盘古如何在行业中“解难题” 在盘古5.0发布之际,华为云也介绍了过去近一年,盘古在行业中的落地进展。盘古是首个定位于行业的大模型,有风向标意义。 业界看到,虽然行业是大模型落地的主战场,但相对消费类场景,行业落地很难。IDC中国高级研究经理崔粲总结,过去一年有四类应用是行业的共性方向:一是知识问答,如客服及设备管理;二是视觉模型泛化增强,如安全生产监控;三是数据分析助手;四是专业内容生成。但这些应用在很多行业人士看来,不算颠覆性。因此,目前有两种截然不同的声音,一是积极拥抱,另一是认为业务与大模型之间还较遥远。 而从华为云在大会上公布的案例看,盘古已深入到行业核心场景,如工业和制造,解决核心痛点,进展相对较快。分析多行业的案例,盘古大模型也呈现了一些典型打法和路径。 在落入一个行业之初,华为云首先与行业领军企业达成战略合作。如在钢铁这个大众眼中的传统行业,宝武钢铁集团是全球规模最大的龙头企业,在国家发展新质生产力,以及宝武集团全面推进AI战略转型的方针下,2023年,华为公司董事长梁华带队,拜访了宝武集团董事长胡望明,双方达成合作意向,提出共同研究现场痛点、难点的解决方案,形成钢铁冶金或工业领域大模型。 其次是华为技术专家下到一线。张平安介绍,过去一年,华为有超过500名专家到一线,跑工地、进车间。他们与客户专家及一线工人一起梳理需求。在宝武集团,双方决定挑战高炉炼铁和热轧钢带难题。 在热轧场景中,每次生产钢板的种类和尺寸不同时,都需要工程师重新调整参数,一次需要耗费约5天时间。客户期望通过大模型,降低热轧生产线调优时间,并提高预测精度和钢板成材率。再如,高炉被认为是“AI落地最难的应用场景”,它是5000m³的黑匣子,内部最高温度达2300℃。如果使用盘古大模型,将黑箱子变成灰箱,甚至白箱,指导高炉精准控制,每吨铁水就可减少1kg焦炭消耗,成本可降低3元,有望每年为宝钢降本超10亿元。 再次,大模型是极致的系统工程。在每个行业“解难题”时,一方面离不开通用底座和行业大模型的智慧升级,另一方面要在工程化上做得透彻,包括数据问题,都是非常系统化的工程,只有抠得很细,才能有好的效果。 目前盘古大模型已经在宝武钢铁集团1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。 在高炉场景中,双方一起在算法、数据、工程化多管齐下,解决高炉中上千种参数勾连耦合问题,以及数据误差大、高时滞性等问题,逐步将高炉变得“透明”、可控。 此外,从海内外前沿企业的探索看,大模型应用,需要构建一站式业务平台,包含高性能框架、大算力、各种大模型,以及丰富的工具。华为云也在构建这样的大平台。就在一周前,华为云宣布芜湖云节点上线,至此构建了三大核心枢纽的算力一张网,一步步解决AI自主算力供应短缺问题。 过去一年,盘古大模型保持了一定的节奏。张平安介绍,盘古已在30多个行业,落地到超过400个应用场景。从进展看,大模型目前主要还在解决核心单点问题。未来,当它从一个环节进入多环节后,将可能成为“中枢”一类的角色,连通企业的数据中台、各种业务系统和知识库,最终彻底重塑产业的流程。 03 实现行业价值,才是硬道理 最近几个月,大模型项目争夺和落地是市场的热点。一些大模型企业打响价格战。清华大学新闻学院元宇宙文化实验室主任沈阳认为,这说明各个大模型的功能和性能在快速接近,模仿GPT-4的阶段已基本告一段落,AI已从创新试验走向了大众推广阶段。随着规模急速扩张的阶段到来,市场份额成为首要关注点。“如果在这个阶段落伍的话,功能好(也)没有用了。” 一位大模型人士说,大模型价格战可能会重演安防市场的故事,“本来是很好的生意,因为价格战变得没那么好了”。另一位人士称,大家都是把最弱的模型给降下来了,性能强的模型依然很贵,这样的降价,意义不大。还有人士认为,这一轮降价基本是云厂商在打,云厂商的游戏是“羊毛出在猪身上”,哪怕API调用不赚钱,可以在其他服务上赚钱,这也逼着一些非云的大模型技术企业出走海外。 但更多的行业人士认为,大模型降价的本质不应该是价格,而是最终能让ROI为正。大模型降价,短期会推动更多的尝鲜及试用,但要想实现积极作用,还要看是否为客户实现了业务价值。 “客户对于最终产出物的核心关注点,就是ROI。”一位应用开发资深行业人士告诉数智前线,他当下正在落地多个大模型行业项目,“ROI的测算就是拿效果说话,甚至是一些较为直观的计算。比如,成本的节省数字,新客户及客户转化的量化数字,工作效率的提升数据。”毕竟大模型与早期互联网的游戏规则有很大不同。大模型的边际成本仍然非常高,每增加一个用户,基础设施所需增加的成本肉眼可见。这与互联网厂商当年靠“烧钱胜出”的情况完全不同。 而作为一种潜力巨大的新兴技术,以大模型为代表的人工智能,已成为发展新质生产力的重要引擎,尤其中国具有全球门类最齐全、体系最完整的工业体系,大模型与产业的结合,潜力更为巨大。今年开年,政府工作报告明确提出开展“人工智能+”行动。“人工智能+”已经成为国策。 从张平安的演讲中看出,华为云坚持AI for industries战略,深入行业,解决行业难题,靠价值打开巨大的产业空间,从而加速形成新质生产力。而“从产业中来,到产业中去”的路径,在当下诸多的挑战和竞争中,也更有可能把握住大模型最为关键的发展大潮。
景鲲要再造一个百度?生成式AI颠覆搜索为时尚早
这一轮生成式 AI 引发的浪潮可以说愈演愈烈,几乎每隔一段时间就会有新的 AI 公司和 AI 产品出现在我们的面前,也能看到很多已经功成名就的人选择投身 AI 创业热潮。 就在昨天,前小度 CEO 景鲲公布了离职百度后的新动态,宣布和前小度 CTO 朱凯华联合创立了 AI 创新产品公司 MainFunc,旗下首款 AI Agent 搜索产品 Genspark 已经 Beta 上线。 图/ Genspark 此外,MainFunc 还拿到了 6000 万美元(约合人民币 4.35 亿元)的种子轮融资,投后估值直接来到了 2.6 亿美元(约合人民币 18.87 亿元)。 此时距离他辞任百度集团副总裁和小度 CEO,刚刚过去 8 个月。耐人寻味地是,他在离开百度后选择的领域恰恰是百度的核心业务——搜索。 不留在百度的体系内做 AI 搜索,而是选择和前小度 CTO 一起自己做,这在一定程度上说明了百度面对 AI 搜索这个全新领域存在一些问题。但更重要的可能还是,景鲲的选择再次证明了很多人相信的一点: AI 搜索,大有前途。 但这种「前途」会彻底改变我们获取信息的方式吗?又会打破现有的搜索市场格局吗? Genspark,又一个有点不同的 AI 搜索 和所有 AI 搜索一样,Genspark 也采用了以对话为主要交互方式的设计,用户提出问题后,Genspark 会生成相关的简短回答,直接给你你可能需要的信息,而不是给你你可能需要点击、浏览、判断的「十个蓝色链接」。 此外,MainFunc 官方相信,Genspark 可以提供更高质量的搜索结果——也是回答。按照官方的说法,Genspark 使用多个专门的人工智能模型,每个模型都旨在处理特定类型的查询。 在底层,Genspark 依靠内部训练的模型以及来自 OpenAI、Anthropic 等的第三方模型来对用户的搜索查询进行分类,并确定如何组织和呈现结果。比如我们搜索「OpenAI 什么时候推出的 AI 搜索?」(实际没有推出): 图/ Genspark Genspark 的每个搜索结果页面首先会呈现 AI 生成的结果摘要,后面是指向更详细的 Sparkpage 的链接,基本上可以理解为针对问题生成的一篇完整回答。最后还有一些推荐链接,这部分就相当于传统搜索引擎的结果页面。 而 Sparkpage,也是 Genspark 区别于其他任何 AI 搜索的独特性交互设计。除了生成一个类似维基百科的详细回答,用户还可以在 Sparkpage 右侧的对话窗口,继续与 AI 进行对话,不管是针对回答的疑惑进行展开,还是针对部分内容进行深入。 图/ Genspark 针对大模型的「幻觉」问题,AI 搜索一般都采用 RAG(检索增强生成)技术降低「幻觉」的出现概率。景鲲则在 TechCrunch 的采访中另外表示,Genspark 的 AI 模型偏爱具有高权威性和流行度的网页,对过滤掉更多「外面」的信息有很大帮助。 「我们非常重视数据质量,我们相信数据质量是赢得这场比赛的关键,」景鲲强调。但现实是,在这场 AI 搜索的比赛中,重视数据质量的不仅是他们,参加比赛的对手也是层出不穷。 生成式 AI 掀起的搜索革命 曾几何时,以谷歌和百度为代表的搜索引擎可以说是整个互联网最重要的「入口」,基于搜索引擎,谷歌一直以来的使命就是:「整合全球信息,供大众使用,让人人受益。」 但在很长的时间内,搜索引擎的产品形态和商业模式并没有发生质的变化,甚至体验还有所退步。 在传统的搜索体验中,用户通常是脑中存在一个或模糊或清晰的问题和需求,然后需要将这种需求转化成一个或几个相关的关键词。 接着,搜索引擎根据关键词、索引库找出相关的网页链接,再通过算法排序的方式呈现相关程度最高的网页链接。同时,在搜索结果中还往往穿插着几个「伪装成搜索结果」的广告。 图/百度 与之相对的,得益于大语言模型实现了强大的自然语言理解能力,用户可以用最自然的自然语言进行搜索,AI 搜索也能够更准确地理解用户的提问意图。 此外,虽然 AI 搜索同样需要匹配超大规模的索引库来找到相关的网页,但在呈现上彻底改变了过去信息的组织和设计,没有「信息排序」,直接给出答案,不需要用户点击排在前的最相关链接,再找出自己真正需要的信息。 简而言之,相比传统的搜索体验,AI 搜索是一种交互和效率上质的变化,也被很多人视为搜索的未来。所以即便 AI 搜索严重挑战了现有的搜索广告商业模式,谷歌也还是推出了 AI 搜索。 今年 5 月 15 日,谷歌在 Google I/O 开发者大会上宣布将在谷歌搜索上线基于 Gemini 大模型的 AI Overviews 功能,简单来说,就是根据用户问题在搜索结果页直接生成一个简短的回答,然后才是以网页链接为主的传统搜索结果。 图/谷歌 用过 New Bing 的读者一定不陌生这种形式,事实上这也意外着谷歌搜索终于也迈出了通往「AI 搜索」的一步。 相比之下,作为全球第一大中文搜索引擎,百度同时还是国内最早推出自主训练大模型,虽然旗下也有主打 AI 搜索的「简单搜索」,但百度搜索却取消了 AI 搜索功能(文心一言推出早期有上线过)。 而与此同时,由前 OpenAI 研究科学家 Aravind Srinivas 联合几位合伙人共同创办的 Perplexity,已然成为了当下最具代表性和影响力的 AI 搜索。截至今年 1 月,Perplexity 的月活跃用户就超过了 1000 万,访问量超过 4500 万次,总搜索量超 5 亿次。 加上转型 AI 搜索的传统搜索公司,以及一大批新涌现的 AI 搜索初创公司,AI 搜索似乎已经到了「万马奔腾」,一举取代传统搜索的局面。 但 AI 搜索已经到了取代传统搜索的阶段吗?可能还为时尚早。 我放弃了把 AI 搜索作为默认搜索引擎 坦白讲,从去年开始小雷就尝试过将浏览器的默认搜索引擎换成「AI 搜索」,主要是用连英伟达 CEO 黄仁勋都在用的 Perplexity,今年还尝试过将之前中文搜索体验还不错的秘塔 AI 搜索设置成默认搜索引擎。 但现实是,我其实都用不了多久就会换回谷歌,理由并不复杂,核心是 Perplexity、秘塔 AI 搜索以及其他 AI 搜索都: 不可靠。 比如刚刚问到的回答,图/ Genspark 作为科技编辑,小雷几乎每天都需要使用搜索引擎,也严重依赖通过搜索来获取信息,同时信息的准确性也非常重要。这一点应该很好理解。 但 AI 搜索本质上是能联网的 AI,同时基于 RAG 技术,大模型会结合用户提问和相关检索信息作为 Prompt 输出回答。虽然不少观点认为 RAG 技术是当下缓解大模型幻觉的最佳解决方案,但不仅远谈不上解决,实际缓解的效果也有限。 具体到 AI 搜索体验中,小雷看到有些回答会明显怀疑一些信息的真实性,这个时候又不得不需要通过谷歌等传统搜索引擎进行检索、查证,因为 AI 搜索的来源链接也充满了幻觉。 但我又不可能每个信息都重新进行搜索、查证,否则就与「使用 AI 搜索提高搜索效率的初衷」背道而驰了。 更大的问题是,如果一些信息错得并不离谱,我对一些特定领域也并不了解,很可能不会意识到错误,甚至会直接使用了错误的信息,从而产生错误的理解和观点。 简单来讲,作为能联网的大模型,目前的 AI 搜索很多时候是存在幻觉的黑箱,我很难信任 AI 回答里面的各种信息,所以宁愿退回传统的搜索体验,使用关键词找到相关的网页,再人工寻找和判断我需要的信息。 但这不意味着我会放弃使用 AI 搜索。 首先,大模型的流行注定会改变互联网的内容生态,我们很早就在文章中表达过对生成式 AI 内容充斥互联网的担忧,今年你甚至还可以看到字节跳动、掘金等公司通过 AI 生成了海量中文网页「污染」搜索引擎。 豆包生成的就有 1560 万条,图/谷歌 而不同于传统搜索引擎的机制和交互方式,AI 搜索理论上相对更容易绕开这种「污染」,同时对话式的交互也能避免了大量无价值内容,提高效率。 其次是在「What」之外,我们经常需要向搜索引擎提出的问题还有「Why」和「How」,这方面对信息的准确性要求较低,更强调整合梳理能力,而这恰恰是大模型极其擅长的,这是小雷需要的。 同时从更长远的角度来看,大模型和生成式 AI 技术还处在快速发展的阶段,当下幻觉的问题并不意味着在不远的将来会有更好的解决方案。 写在最后 AI 搜索不是救世主。 AI 搜索的出现无疑给我们提供了一种全新的信息获取方式,也带来了不少新的思考和挑战。但在使用 AI 搜索过程中,我们能明显发现了其在准确性和可靠性上的不足带来的困扰。但这并不意味着 AI 搜索毫无价值。 相反,AI 搜索在整合信息、提升搜索效率以及避免无价值内容方面展示了巨大的潜力。随着技术的进步,生成式 AI 的能力将会更加完善,或许就能解决当前存在的问题。 所以比起一种取代传统搜索的「救世主」,我更愿意把 AI 搜索看作一种新的选择。我们在使用中需要不断探索和适应,找到最适合自己的使用方式。在这个过程中,传统搜索引擎和 AI 搜索并不是互相排斥的,而是可以相辅相成,共同改进我们的搜索体验。 或许在不久的将来,AI 搜索能够解决目前的不足,比传统的搜索方式更能「整合全球信息,供大众使用,让人人受益」,成为人类获取信息的主要方式。
永劫手游搭载首个游戏Copilot!能“听懂人话”的AI队友诞生了
AI技术正在深刻地改变着各个领域,游戏行业也不例外,只不过由于功能方向的不确定,游戏AI的发展相比其他领域较为迟滞。 目前市面上常见的游戏AI,不是简单地作为填充游戏人数的机器人,就是只有阉割后的文字对答功能,和植入一个游戏特化的百度百科没什么太大区别。 但随着多模态、AI大模型技术的不断进步,游戏AI也正朝着更加智能、更加人性化的方向发展。 6月19日,永劫手游的“定胜终测”,带着它的全球首个游戏Copilot AI,出现在了玩家们的视野里。 提到微软的Copilot,就不得不提到它的特点:这是款多模态AI。 大家耳熟能详的小爱同学,又或者前两年铺天盖地的ChatGPT(特指3.5版本及更旧的版本),在分类上都只是单模态AI,只能完成文字之间的交互,不能做到识别语音、图片、视频等信息的交互。 网易伏羲工作室研发的全球首个游戏Copilot,就是与微软Copilot同样基于多模态技术,而这项技术被使用到了网易旗下的永劫手游中,化身为与玩家并肩作战的“AI队友”。 这些AI队友并非传统意义上的NPC,而是能够与玩家进行实时语音交互并完成游戏对局各种复杂操作的“智能体”,在理解并执行复杂的语言指令的操作上,永劫手游的AI队友完成得相当出色。 在游戏中,AI队友可以与玩家进行自然流畅的语音对话,提供游戏指导、战术分析、情感交流等服务。 这项技术极大地服务了那些苦于交流障碍只能单人游戏的玩家,让玩家感受到更加人性化的陪伴。 据悉,未来AI队友还会根据玩家的游戏风格、喜好和水平,提供个性化的游戏建议和陪伴方式。 例如,对于喜欢进攻的玩家,AI队友会配合其更加激进的战术;对于喜欢防守的玩家,AI队友则会提供更加稳健的操作,当玩家坚实的后盾。 除了能够提供游戏方面的帮助,AI队友还能够与玩家进行情感交流,例如在玩家失败时给予鼓励,在玩家取得胜利时分享喜悦。 这种情感交流不仅能够增强玩家的代入感和游戏体验,同时也真正做到了AI技术的“以人为本”。 基于网易伏羲实验室对于AI语言能力的优化,永劫手游中的AI并不同于市面上的诸多AI技术,并不需要诸如“唤醒词”那样的影响代入感的操作,也没有“关键词”一类的对话学习成本。 玩家只需要通过游戏中的语音交互功能,也就是玩家口中的“开麦”,直接与AI队友沟通,它就能在极短的时间内理解并响应你的话语。 永劫手游还与高通合作,搭载高通骁龙8Gen3旗舰平台的机型,会使用芯片集成的NPU,在端侧运行语音相关AI模型推理,AI队友将具有更快的响应速度。 总的来说,永劫手游AI的推出,标志着游戏AI领域迈出了重要一步。 它不仅为玩家带来了全新的游戏体验, 也为游戏AI的未来发展指明了方向,让我们开始期待:未来,AI还能与电子游戏碰撞出怎样的火花?
巨头纷纷涌入,人形机器人将掀AI狂潮!
据媒体报道,特斯拉CEO马斯克近日宣称,明年其开发的人形机器人Optimus将实现小规模量产。特斯拉计划将该型产品首先应用于自家工厂当中,同时计划提供一项租赁服务,为用户提供更为灵活的选择方案。黄仁勋在近日接受采访时也表示,未来人形机器人将像汽车一样普及,预估100年后人形机器人将无处不在,会是产量最大的机器系统。 随着新技术、新产品、新业态的快速发展,人形机器人正在成为全球科技创新的新热点,AI大模型的渗透则被视为产业发展的分水岭,它让人形机器人拥有感知、思考、决策等能力的预期不再遥不可及。随着科技巨头的纷纷涌入,全球人形机器人产业正在按下加速键。 大厂加速人形机器人产业布局 近日,特斯拉在美国德克萨斯州奥斯汀举行2024年度股东大会。会上,马斯克充满信心地表示,到明年特斯拉将拥有1000个,甚至可能达到数千个Optimus机器人投入运行。马斯克在对比自动驾驶和人形机器人市场潜力后乐观地认为,自动驾驶产业的市场规模可能达到5万亿-7万亿美元,但人形机器人的市场潜力可能更大,高达25万亿美元。 特斯拉已经投入人形机器人领域发展多年。在2021年首届AI DAY上,特斯拉首次公布Optimus的概念图。2022年Optimus原型机实现首秀。2023年特斯拉开始使用自研的超算 Dojo为Optimus提供算力支持,加快训练速度。而特斯拉最新发布的视频中,Optimus已经具备走进工厂的工作能力。视频中,Optimus可以实现在电池流水线上进行搬运、分拣等动作,展示了在工业场景下操作熟练的运控细节和精细化工作能力。 如果说特斯拉是直接投入人形机器人进行开发与制造,英伟达则是在产业生态上进行布局。资料显示,早在十年前,即2014年,英伟达就已开始介入机器人领域。当时,黄仁勋曾亲手将一台NVIDIA DGX AI超级计算机交付给OpenAI。2023年英伟达在COMPUTEX上发布全新Jetson AGX Orin工业级计算平台。该平台可以提供更强的计算能力,意味着在农业、建筑、能源、航空抗体、卫星等极端环境中打造更强劲的机器人有了可能。2024年,英伟达围绕具身智能加速布局,宣布成立通用具身智能体研究实验室GEAR。 得益于大模型的快速发展,生成式AI技术正在加速推进人形机器人的成熟与应用。英伟达机器人和边缘计算副总裁Deepu Talla认为,大模型使机器人能够更自然地理解和响应人类指令。“鉴于这些特性,生成式AI非常适合用于机器人技术。” 大模型让“决策”更聪明 我国也在加快推进人形机器人产业的发展。去年10月,工业和信息化部印发《人形机器人创新发展指导意见》,提出到2025年人形机器人创新体系初步建立;到2027年综合实力达到世界先进水平,成为重要的经济增长新引擎。与此同时,以优必选、傅利叶、智元等为代表的初创公司也陆续面世;而以达闼、越疆、大疆等为代表的传统机器人企业则拥有多年的技术积累;小米、阿里等互联网巨头也凭借在人机交互、AI、物联网等方面的优势,强势进入新市场。 作为机器人的重要分支,人形机器人凭借“拟人”优势赋予其的功能多样性与普适性,可以适用于更加广泛的社会岗位,市场前景被寄予厚望。高盛预测,到2035年,人形机器人市场或将达到1540亿美元,成为继智能驾驶电动车后的又一AI落地场景。 AI大模型的渗透被视为人形机器人产业发展的一道分水岭,其使人形机器人拥有感知、思考、决策等能力不再遥不可及。以往受到算法模型的局限,人形机器人很难具备“泛化”能力,只能针对特定领域进行训练,满足某一特定用途,这极大限制了人形机器人的应用场景。而具备强大泛化能力的大模型出现,使人形机器人有了大幅跃升的现实基础。科大讯飞开放平台研发总监刘可为在此前演讲时指出,大模型横空出世,机器人行业迎来全新发展机遇。以具身智能为代表的人形机器人成为发展趋势。决策更聪明、功能更实用、体验更自然,应用更多样。 去年4月,AI公司Levatas便与波士顿动力合作,将ChatGPT以及谷歌公司的语音合成技术接入Spot机器狗,使其成功实现与人类的交互。多模态大模型则能让人形机器人能够通过“视觉”与外部环境交互。去年7月,谷歌DeepMind推出RT-2,这是全球首个VLA模型,可控制机器人的视觉-语言-动作。通过将 VLA预训练与机器人数据相结合,能够端到端输出机器人的控制指令。通过测试,RT-2 与之前的模型相比,在符号理解、推理和人类识别 三个方面具有更高的任务成功率以及更强的泛化和涌现能力。可以说,大模型赋予了人形机器人一个通识大脑,能够顺畅地和外部对话,还可以增加任务理解、拆分和逻辑推理等方面的决策能力。 数据与算力仍面临挑战 尽管各大巨头都在针对人形机器人进行探索,也取得了不小的成果,但就现实来看,机器人大模型距离实际应用还面临不少问题。首先面临的就是可用于机器人训练的高质量数据非常匮乏。由于机器人需要通过多种传感器感知环境状态,然后执行实际动作,完成任务,因此训练用于机器人的大模型需要用到大量机器人在真实世界中与环境进行交互的数据集。对于ChatGPT来说,公开的互联网数据十分充足,有大量的公域数据可供爬取。但现实中的人形机器人保有量却太少,可用于收集训练数据的机器人就更加稀少。如何解决机器人算法的训练需要大量数据是当前行业面临的一大挑战。 近日,英伟达宣布开源旗下Nemotron-4 340B(3400亿参数)模型,开发人员可使用该模型生成合成数据,用于大模型的训练。有观点认为,英伟达此举的目标或许就是指向人形机器人的数据集市场。由于现实数据过于稀少,因此合成数据已被视为解决机器人领域高质量训练数据不足、采集效率低下问题的重要途径。机器人智能体可以通过模仿学习在生成的数据集上进行训练。英伟达Nemotron-4 340B使用了9万亿个token对其进行训练,可以为开发人员提供一个可扩展的生成合成数据模型。此举或将进一步巩固其在人形机器人训练市场的核心地位。 另一个瓶颈则是芯片算力问题。机器人大模型对机器人行动控制的周期仍太长,无法做到实时响应。谷歌RT-2的演示视频需要2倍速播放才能实现比较流畅的机器人动作,而斯坦福大学李飞飞团队提出了智能系统 VoxPoser更是需要8倍速才能有流畅的动作表现。实时性的提升依赖于算力,对于面对高复杂性环境的人形机器人尤其重要。中科院院士姚期智在 2023 世界机器人大会的演讲中就强调,计算能力的挑战非常重要。 浙江大学教授熊蓉也在2024中国人形机器人生态大会中也指出,人形机器人的大脑执行环境感知、行为控制、人机交互等功能,小脑进行复杂运动建模与控制,肢体则进行各种命令的执行,并保持灵活稳定。人形机器人的系统研制方面,存在关节多、模块多、要求多,缺乏功能-结构-机电-材料一体化设计等方面的挑战,需要解决系统研制、稳定控制、通用智能等方面的难题。 总之,面对机器人数据、芯片算力及软硬件融合等方面的问题,各家科技巨头厂商都在进行深入探索,但距离实现真正的具身智能水平的模型还有较长的一段路要走。
外形炫酷!人形机器人现身华为开发者大会
快科技6月21日消息,华为开发者大会在今日下午正式举行,HarmonyOS NEXT面向开发者和先锋用户启动Beta。除了新系统,一款人形机器人现身大会现场。 这款人形机器人外观炫酷,多根线缆巧妙连接,展现出其高科技与未来感。机器人面前摆放着饮料、苹果等物品,预示着在发布会现场可能展示其精准的抓取能力。 值得一提的是,华为云此前已与人形机器人领域的领军企业乐聚机器人达成战略合作,双方将共同探索“华为盘古大模型+夸父人形机器人”的应用场景。这一合作标志着华为云在人形机器人领域迈出了重要一步,也预示着未来双方将共同推动人形机器人技术的创新与发展。 有业内分析人士认为,人形机器人作为未来30年内具有巨大潜力的产业,无疑将引领新一轮的技术革命。然而,人形机器人的研发与制造也面临着巨大的挑战,包括高昂的成本和持续的资金投入。目前,包括老牌企业波士顿动力在内,以及新兴势力,都面临着相似的挑战和困境。 此外,特斯拉CEO马斯克也对人形机器人的未来充满了信心。他透露,特斯拉的Optimus人形机器人预计在今年底前将具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这无疑为人形机器人的未来发展注入了强大的动力。
AI巨头暴涨,轮到博通了!
最近,英伟达的股价持续冲高,已经成为全球市值第一的企业。与此同时,黄仁勋出售股票已套现约3200万美元。AI浪潮中,英伟达被推向高峰。 虽然不像英伟达一般声名大噪,博通是AI之下闷声发大财的选手。在各大科技巨头构建数据中心的背景下,博通提供一系列用于计算和网络的组件,包括对数据中心至关重要的组件,这使它从这一AI浪潮中同样大赚。 博通的最新财报和年度预测超过预期,公司股价最近三个交易日暴涨17%,市值大涨1117亿美元(约合人民币8120亿元),最新市值突破8000亿美元大关,达到8391亿美元。 暴涨过后,博通是否有冲击万亿美元市值的可能? 01 AI之下,博通疯狂 先来看看博通的财报。 前不久,博通发布了第二季度财报。二财季净营收为124.87亿美元,超过分析师预期的 120.57 亿,与去年同期的87.33亿美元相比增长43%。 在截至10月份的整个财年内,公司营收预计将达到510亿美元左右,略高于分析师此前预计的506亿美元,也高于博通早些时候预期的接近500亿美元。 博通是通信芯片行业的龙头,业务主要分为两大块:半导体解决方案和基础设施软件。在交换芯片、Wi-Fi芯片、FC SAN等多个赛道中占据翘楚地位,其中以太网交换芯片领域,博通以七成左右的全球市占率排第一。 半导体解决方案产品主要为有线与无线通信芯片,贡献了 58% 的营收,网络、无线、存储、宽带、工业和汽车分别占比 53%、22%、11%、10%、4%。 基础设施软件贡献了 42% 的收入,主要由并购的企业组成,如提供存储区域网络的 Brocade、互联网安全技术厂商 Symantec、资讯技术管理软件 CA Technologies 及云计算和硬件虚拟化的软件和服务商 Vmware。 从24财年二季报来看,博通的半导体解决方案营收 72 亿,同比增长 5.8%,基础设施软件营收 52.85 亿,同比增长174.5%。 在博通2024财年的第二季度中,其AI收入达到31亿美元,同比增长280%。主要的增长动力是其AI网络产品,通过与Arista Networks、科技公司和Super Micro等主要网络供应商的合作实现。 回溯博通的发展史,其在2013财年后迈入高速增长阶段,2013-2022财年营收CAGR达33.17%。与此同时,2023年是博通显著受益AI相关业务赋能的第一年。博通表示去年用于生成式AI业务的以太网设备销售额从2亿美元上升到超8亿美元。 到了最近,博通甚至预测2024年半导体部门中AI整体收入将超过100亿美元,占比半导体部门收入将超过35%。 与英伟达一样,博通同样也宣布了股票拆分10比1,将于7月15日开始按拆分调整后的价格进行交易。在宣布之后,博通的股价持续上涨,创下历史新高。截止17日美股收盘,博通报1828.87美元,大涨5.41%,全天的成交量达到873.98万股,成交金额为158.68亿美元。 AI之下,博通疯狂。 02 对战英伟达的杀手锏 再来看看博通的产品。 博通在AI中的杀手锏有两个:一个是人工智能加速器,也就是我们所说的XPU。这类加速器类似于英伟达、AMD等推出的GPU、NPU、LPU,但区别在于博通为客户定制自己的“XPU”。另一个则是GPU、NPU 和 LPU 等处理器的出现需要高速连接,而这正是博通的“老本行”。 XPU:100万个GPU AI集群需求 对于AI加速器,博通非常理智。 在回答是否会与英伟达的Blackwell产品激烈竞争时,博通表示:“众所周知,GPU是商用环境中首选的AI加速器,这种模式极为强大,是英伟达所擅长的领域。他们在这方面表现得非常出色,我们根本不考虑在这一领域与他们竞争,因为这是他们的强项。” 实际上,在博通一开始就在摆脱“GPU”(英伟达的推广名称),不断强调AI加速器可以是GPU、NPU、TPU等“X”PU。 博通认为,对于一些非常特定或选择性的超大规模客户,想要定制属于自己的AI芯片方案,博通非常乐意利用自身的IP帮助定制ASIC,未来AI加速器一定会过渡到定制芯片。 目前业内对于XPU的需求如滚雪球般增长。 博通的首席运营官举了一个例子:在两年前,最先进的集群有4,096个XPU,每个XPU只有几百瓦,使用Tomahawk交换机通过单层网络层互连其中的4,000个相当简单。到了现在,博通构建了超过 10,000 个 XPU 节点的集群,需要两层 Tomahawk 或 Jericho 交换机。博通的目标是2024年,将这个数字扩大到30,000多个,最终达到 100 万个。 从博通展示的最新XPU来看,拥有12个HBM堆栈,达到台积电CoWoS-S封装的极限,超过英伟达Blackwell的8个HBM堆栈。此外,构建集群时博通也一直在强调,其XPU功耗不到600瓦,是业内最节能的加速器之一。 目前,博通的XPU服务已经有了三个客户。 第一个不必多说,正是谷歌。博通与谷歌合作推出的TPU也一直是市场上的焦点产品,目前谷歌已经发布了第六代芯片Trillium,并且在数据中心市场中,谷歌TPU占据了20%的市场份额。 对于第二、第三个客户博通并没有透露。有人推测第二位客户是 Meta,因为 Mete在过去四年来一直是博通的客户,两家合作构建了多代产品,目前已经实现量产。 第三位客户众说纷纭,诸多分析认为这位“神秘买家”很可能是字节跳动。理由是它拥有大型网络,并采用了博通的片上神经网络推理引擎,同时也是一个以消费者为导向的大型社交网络,可以通过使用更多的定制芯片而不是商业芯片来获得快速的投资回报。对此,博通暂未回应,只是暗示是来自一家大型消费级AI公司。 2024年博通半导体业务中,来自AI的营收将达到35%,其中不仅包含两大客户的定制ASIC方案量产,新的第三大客户相关产品也将在今年实现量产。 以太网交换芯片的崛起 当需要一百个以上GPU时,连接它的唯一方法就是拥有网络,也印证了一句老话:网络就是一台计算机。 华尔街的分析师都认为:博通很有可能成为美国股市万亿美元俱乐部的下一个成员。背后的原因是将以太网络视作其重要的增长动力。 以太网和AI是什么关系? 交换机为代表的组网设备是AI算力硬件的重要组成部分。AI训练中,由于GPU、网卡、内存之间需要高速传输数据,业界发明了一种名叫RDMA的技术,使网卡接管数据,在发送方和接收方的内存间直接传输数据,从而绕过缓存和操作系统。英伟达主导的IB(Infini Band)和以太网都支持RDMA。 随着大模型复杂度提升,在AI大规模集群部署方案一直有分歧,即关于Infiniband与以太网的技术路径争论。就投资而言,争论的背后本质是选择英伟达还是博通。 IB网络的成本显著高于以太网。它和英伟达的一整套解决方案绑定,网卡、交换机、光纤、光模块都要选购英伟达的,整体的成本最高可达以太网的5-10倍。 以太网支持者则认为,便宜就是硬道理,以太网不用和英伟达绑定,还可以对网络自行调优,达到和IB类似的性能。 在与英伟达Spectrum-X以太网络平台相抗衡方面,博通高层在受访时直言英伟达的新平台“毫无新意”,强调博通早已推出同类型的方案。当前,8大AI芯片丛集中有7个部署了由博通技术支持的以太网基础设施,预期明年所有超大规模AI集都将由以太网提供支持。 此外,在市场上,今年高端的以太网交换机芯片,彻底火了。自一季度以来,博通Tomahawk4系列的多款交换芯片价格迅速走高,在其官网和其他交易平台上大多显示无库存,且交货期高达50周,其中BCM56990B0KFLGG 市场报价已达4100美元左右。 03 博通的阴影 博通在AI浪潮中步步高升,然而还有一些阴影“笼罩”于博通的上空。 虽然博通的AI收入不断增长,但到2024财年,AI业务仅占总收入的20%,博通仍然有很多遗留业务线。 如果我们计算博通其他业务的增长,不包括收购VMware和AI增长的影响。可以发现,其余业务的收入从2023财年第二季度的79亿美元下降至2024财年第二季度的66亿美元,同比下降15.7%。 博通过去的收购都集中在传统软件业务上。 实际上,业内认为博通对于CA Technologies和赛门铁克的收购并不是明智之举。CA Tech服务于传统大型机市场,而赛门铁克的竞争优势正在被Palo Alto、CrowdStrike和Zscaler等新的网络安全公司所取代。赛门铁克在一些快速增长的市场(如终端安全、云和身份安全)中处于不利地位。 另一个方面,在博通收购VMware后的第一个完整季度期,VMware 的季度收入骤降了 5.8 亿美元(42.08 亿元人民币)。在博通成功收购VMware后,就开始对其进行大规模裁员、大幅度提高产品许可证价格、删除永久许可证变成订阅制等。 许多企业客户购买VMware的数据中心虚拟化是因为其永久许可模式,不需要为虚拟化服务持续付费。随着订阅模式的变化,VMware的现有客户存在潜在的续约风险。 虽然VMware收入有所下降,但博通首席执行官陈福阳还是表示:“博通正在将所有 VMware 产品转变为订阅许可模式方面取得良好进展,并且 VMware 的 10000 个最大客户中有 3000 个已经签署了多年协议。” 并且还在计划将 VMware 的年化预订额价值(衡量长期合同承诺的一个指标)不断提高,从上个季度的 12 亿美元上升到该季度的 19 亿美元。 他补充道,博通看到客户对 VMware 的产品组合“非常感兴趣”,将 VMware 产品作为构建本地私有云的一种手段,“作为公共云的一个很好的补充,甚至可能替代公共云或与公共云混合在一起。” 04 结语 在博通发布了亮眼的业绩报告之后,美银认为:博通仍有更大的潜力。在最新发布的一份报告中,美银分析师将该公司的目标价上调至2,000美元,这意味着该股还能较当前水平上涨约19%。 目前,分析师预期博通 2025 财年的营收为 584 亿,调整后净利润为 285 亿,据此计算,即使暴涨之后,博通远期市盈率也不过 28 倍,并不夸张。 总之,在定制人工智能芯片、以太网网络、VMware追加销售等方面,博通都在努力实现增长。这么来看,博通或有冲击万亿美元市值的可能。
AI批量制造“张雪峰”
撰文 | 郝 鑫 编辑 | 吴先之 “那有可能你要放弃学医了”,高考前的最后一次连麦,张雪峰上来就给咨询的农村考生浇了一盆冷水。 在张雪峰的视角里,该学生想以平时490-500分的成绩报考中医专业难度太大,更何况后期的考研和工作。基于此,张雪峰直接下了劝退令。 不过,考虑到考生的农村出身,张雪峰没有一棒子打死,而是建议她报考定向的乡村医生计划,“通过学习从农民变成医生,相比爸妈那一代,已经是一种进步了”。 有同样遭遇的网友支持张雪峰说:“普通农村家庭的孩子才懂,这样的建议真的很诚恳了。” 可惜,张雪峰的诚恳像是“限时卡”。直播结束不久,官方便上架了号称“浓缩1400个连麦家长、1万多个问题”的专业解答笔记,售价290微信豆,约为42元。截至发稿前,已有500多人付款。 针对2024届志愿填报,张雪峰公司峰学蔚来分别推出了标价为11999元的“梦想卡”和17999元的“圆梦卡”。虽然售价抵得上很多家长一个月到两个月的工资,仍抵不住焦虑的家长们。17999元的圆梦卡,2万个名额,3个小时被哄抢一空。 (图源:峰学蔚来App) 或许是同行们苦张雪峰久矣,亦或是觊觎其中商机,最近以“AI志愿填报”之名射出的子弹,每一颗都飞向了张雪峰。 百度、夸克相继推出了“免费”的AI志愿填报工具,一些创业公司冠以“AI张雪峰”的头衔来获客,还有一些喊出“单挑张雪峰”口号,用AI功能全面对标之。 一种心照不宣的默契弥漫在高考季:AI志愿填报效果好不好,无人理睬,重要的是“张雪峰们”可能要面临失业了。 AI狙击“张雪峰” 当年,张雪峰凭借“7分钟解读34所自主划线院校”的视频出圈。里面有两个点至今让人印象深刻,对高校的了解如数家珍,熟练的讲解像说相声贯口,听的人都为之捏一把汗。 张雪峰“一战封神”的背后,本质是他和团队对大学资源有横向与纵向的全面把握,在这之后才能去谈他的“语出惊人”,或者“一针见血”,亦或是“诚恳”。 张雪峰就像一个行走的“数据库”,当有家长、学生来询问时就立马启动雷达,高考填报咨询业务的本质就是赚取信息差费用。数据经过整理可以变成信息,信息的筛选可以产生有价值的认知,从而为学生和家长提供报考建议,张雪峰就是在这个过程中赚钱。 论对数据的掌握,谁都比不过机器。对张雪峰而言,AI对其最致命的打击就在于此。进一步深挖,这里面有几个因素,全面、准确的数据是基本,在这之上还要得增加不同维度的信息,做到随时更新。 靠谱AI告诉光子星球,当前,数据的搜集无法构成竞争力,“从数据来源看,大家获取的渠道都差不多,官方渠道包括大学的官网、各个教育考试院;非官网的渠道有数据供应商和靠兼职大学生人肉获取和核实”。 对张雪峰及其团队而言,前期的数据搜索和核实靠纯人工实现,真正的压力在实时和多维度信息层面。有接近夸克的人士向光子星球透露,“张雪峰的团队也会参考夸克每年更新的数据”。而日前夸克App升级高考AI搜索、智能志愿工具和独家优质内容高考信息服务时,也请来了张雪峰站台。 大厂如百度、夸克都将实时搜索的功能做进了志愿填报工具,创业公司利用RAG(检索增强生成)技术来提高实时检索能力。 实时检索能力不仅可以缩短获取最新招生动态信息的周期,还能在拿到考生授权的成绩后,参考历年的招生录取线,初步形成一个榜单。只要数据样本容量足够大,考生就能从中看到报考大学的热度、专业的热度以及竞争的激烈程度,张雪峰说得再天花乱坠,都不如这些实打实的数据有说服力。 信息维度的多寡某种程度上影响了最后选学校的标准。 以张雪峰为例,语出惊人的直播中传递着一种择校、择专业衡量标准:无论考多少分,能找到好工作,填饱肚子才是王道。这就导致张雪峰用户人群画像十分清晰,有一定信息差和鸿沟,以目的为导向,后期将考公和考编纳入到选择范围之内。 这并不适合于所有学生,AI通过扩展信息维度和个性化对话咨询服务将能弥补张雪峰的局限。 对于一些希望进入赛道的新玩家,如靠谱AI,则希望在一些“边边角角”寻求微创新。例如除了家长和学生普遍关注的分数线、专业排名和师资力量等指标外,他们还将食堂、宿舍环境这些非硬性条件纳入到了AI筛选标准中。 此外,借助AI的能力,高考志愿填报的服务链条被延长。除了模拟志愿填报,还可以做高考心理辅导、志愿规划以及职业测评规划。 打开AI志愿填报“盲盒” “AI志愿填报”不是新概念。 以大模型为分界线,之前的伪“AI”是一个类似于Excel的数据库,查询和调取得严格遵循规则,不能实时变动,只能堆人力。用户在使用时,必须被动地接受程序所设定的逻辑。 大模型落地以来,“死板”的数据库升级为了向量数据库,数据的存储范围被扩大,数字、文字、知识图谱都可以被纳入。另一方面,新增了对话咨询功能,通过数据分析,可以推算录取概率,给考生提供报考建议。 基于两个维度,目前市场上的AI高考志愿服务能够被划分为两类。一类聚焦信息价值的工具类产品,主要为家长和考生提供全面又准确的数据参考,往往不涉及填报功能,典型的代表有夸克“智能志愿工具”。剩下一类是将重点放在咨询服务方向,这类公司提供的才是名副其实的AI高考志愿填报工具。因为咨询服务是大模型带来的最大增量,所以网易有道和创业公司都挤在这个赛道。 百度近期上线的高考志愿功能涵盖了上述提到的两类,“AI志愿助手”属于提供报考信息类的工具,用户在填写志愿表信息后,能看到可报考学校和专业的概率;“AI聊志愿”则属于咨询填报工具,基于AI对考生信息的掌握,用户可以通过不限制提问问题,获得报考建议。 现在市场上具有对话推理功能的助手不在少数,光子星球尝试用Kimi、智谱清言、通义等App来填报高考志愿,出现了推荐学校分数跨越大、分数段不明确、专业与兴趣不匹配诸多问题。总的来说,没办法用上述AI智能助手报考志愿。 (图源:左:智谱清言 中:通义 右:Kimi) 高考纸鸢创始人刘瑞在接受公开采访曾表示:“用类似ChatGPT这种对话模型很难解决高考志愿填报的问题,因为高考志愿填报分为这几个部分:数据、咨询建议、带数据的填报系统。目前,ChatGPT等对话工具只能做到前两个,且大模型虽然是智能的,但它有不可避免的幻觉问题。” 光子星球了解到,高考志愿填报落地场景虽然较为垂直,但仍需做大量的训练和优化,才能达到可用的效果。 刘瑞透露,从不同渠道获取到的数据需要依次经过归纳总结、去伪存真、清洗后,才能拿去训练模型,仅数据的环节就花费了将近半年的时间。这条二次处理过程,实际上才是所有与高考志愿相关AI产品真正的核心环节。 在训练模型环节,很多公司遇到的首要问题便是,高考志愿填报场景需要哪些能力?整个摸索过程与开盲盒无异,“只能一遍遍地试”。 包括高考纸鸢和靠谱AI一些公司选择了调用不同大模型能力,在其基础上训练自身小参数模型的方案。靠谱AI称,“我们高考志愿大模型的背后,同时调用了四个大模型,分别负责语义理解、调用数据库插件、实时搜索和兜底检验”。 谁来为AI买单? 回到现实,当张雪峰被人质疑权威性,那AI接棒后,能为考生的前程买单吗? 众所周知,大模型存在幻觉问题,而且推理分析是个概率问题,再强的工具辅助,也无法完全杜绝。从数据获取到生成答案,每一个环节都可能影响最后的结果,这也是市场上纯做信息价值提供方的考量。 为了对冲潜在风险,一些公司的做法是尽可能多地列取学校,显示“可冲击”“较稳妥”和“可保底”的不同录取概率,提供给学生和家长做参考。 和张雪峰一样,大模型同样存在价值取向问题。AI的择校逻辑由人来设定,算法优化后也只能选取几个,而人的需求随时在变。AI能在多大程度上理解不同考生的实际情况,还值得商榷。 光子星球了解到,现下家长对AI高考志愿填报新事物的接受度并不高。“小部分坚决抵制志愿报考机构,受教育程度相对较高的家长在使用我们的产品”。 AI高考志愿填报的用户教育仍需时间,其商业模式也是需要思考的问题。 为了在前期获得用户,大多数AI志愿辅助功能免费提供,考生无需支付会员费或承担昂贵的咨询费用。有公司参考张雪峰的收费模式推出VIP卡试水商业化。相较于普通用户,VIP用户能享受更长时间的功能服务。最重要的是,其价格连17999元圆梦卡的零头都够不上。 张雪峰收费的溢价来自于:通过个人IP化和品牌化形成一定的信任资产,这是AI的短板所在。如果不能解决这个问题,张雪峰们的存在还是有自身的价值。 AI高考志愿填报是一锤子买卖,无论是订阅制还是销售VIP卡,一年也就一次。大厂借高考季热度引流搜索页面和应用,创业公司借张雪峰热度造势,已逐渐显现出营销战的味道。 现阶段,无论是大厂还是创业公司,入局AI高考志愿填报赛道都未能形成明显壁垒。 高考志愿填报属于非常垂类场景,数据越全越精准,对模型训练效果越有益。于是,谁能越快收获用户,积累起数据,谁就能率先迎来赛点。
英伟达暗生危机
编译 | ZeR0 编辑 | 漠影 芯东西6月20日消息,据The Information报道,据出席会议的人透露,去年圣诞节前后,英伟达创始人兼CEO黄仁勋与高管召开了一系列会议,讨论一个日益增长的担忧: 英伟达最大的客户是否会耗尽数据中心空间来部署其AI芯片,这可能会影响销售。 AWS、微软等云服务供应商最近几个季度一直在购买英伟达约一半的AI服务器芯片。黄仁勋担心这些供应商的进展速度不够快,无法建立新的数据中心和电源来容纳他们订购的芯片。 英伟达的一名员工以及几位客户和数据中心运营商称,会议结束后,英伟达经理加快了步伐,询问云提供商是否有足够的空间和电力来满足他们的订单。 数据中心提供商DataBank的首席执行官Raul Martynek称:“除非客户能够证明他们拥有放置这些GPU的数据中心容量,否则英伟达不会提供GPU。” 英伟达最新财季取得了惊人的增长和利润,市值超过3万亿美元。但在成功背后,黄仁勋和他的同事们还专注于应对英伟达的下一个威胁——对英伟达芯片的需求最终放缓的可能性。 为了防范这种可能性,英伟达已开始向AI开发人员销售更多软件,一年前甚至成立了自己的服务器租赁业务DGX Cloud。此举使其直接与大客户云供应商们竞争。DGX Cloud在从这些云供应商租赁的英伟达驱动的服务器集群上运行。然后,英伟达以更高的成本将服务器租给自己的客户,并承诺他们更好的计算性能。 这在行业内造成了紧张局势。AWS最初拒绝让英伟达在AWS数据中心内开拓自己的竞争业务。但在所有较小的竞争对手都同意英伟达的条件后,AWS让步了,表示将提供其他云供应商尚未拥有的较新英伟达AI芯片的DGX Cloud。在芯片难以获得时,AWS也可能担心会惹恼关键供应商。不过AWS发言人Patrick Neighorn称,这个说法是猜测性的,是不正确的。 当黄仁勋管理新的软件和云工作时,他仍然意识到一个可能影响销售的因素:购买他的芯片的大型科技公司正在进行大量投资,但回报不确定。 微软、Meta、马斯克的xAI以及其他公司正在使用芯片来训练实验性的新AI模型,这些模型不会立即产生收入。当Meta CEO马克·扎克伯格承认4月下旬收入的不确定性时,随着投资者对这种情况感到不满,该公司的股票大幅下跌。投资者的压力可能会促使其中一些公司撤回对芯片的购买。 考虑到这些问题,黄仁勋一直在仔细管理英伟达如何分配芯片,以免哪家公司积累太多芯片。他还试图影响客户在数据中心组装GPU的方式,促使他们遵循英伟达认为将带来更好计算性能的服务器机架设计。 但一些客户认为,如果以后这样做,遵循英伟达的建议将使客户更难改用竞争芯片。一位参与谈判的人士说,这导致与关键客户微软就云供应商计划如何安装英伟达即将推出的芯片存在周期性对峙。 英伟达还希望尽可能多地从连接其芯片的服务器的电缆、机架和其他硬件中榨取收入,这可能会牺牲服务器制造商的利益。 01. “所有杠杆” 与其核心服务器芯片业务相比,英伟达销售软件和云服务的收入微不足道。 去年8月,英伟达首席财务官Colette Kress称,新业务已经有望每年产生数亿美元的收入。3个月后,她说,2023年,新业务每年产生超过10亿美元的收入,这意味着他们现在贡献了英伟达总收入的1%左右。相比之下,其核心服务器芯片业务去年创造了475亿美元的收入。 5月,英伟达披露,它已承诺花费近90亿美元从顶级客户那里租用云服务器,主要用于内部研发,但也用于促进其云服务租赁业务。一些客户和前员工认为,这项业务最终可能会使英伟达免受芯片低迷的影响,并使租用其服务器的客户更难寻求替代芯片。 前英伟达高管、现在是风险投资公司Playground Global的合伙人Sasha Ostojic说,云计算和软件产品“被分析师和技术界低估了”,因为它每年可能产生数百亿美元的收入。他说,“英伟达拥有所有杠杆”,它需要发展与芯片互补的服务。 据参与这些讨论的一位人士透露,去年秋天,英伟达甚至考虑为DGX Cloud租赁自己的数据中心。此举将完全切断云供应商。英伟达最近还聘请了Meta高管Alexis Black Bjorlin来负责云业务,目前还不清楚英伟达是否计划为DGX Cloud建设自己的数据中心。 同时,英伟达的销售人员在不遗余力地了解客户正在使用英伟达的芯片做什么。他们最近问云供应商的问题包括他们的客户是谁、他们签署了什么样的承诺来租用这些服务器。这些答案可以帮助英伟达提前制定销售计划,也可以帮助它了解自己的云服务租赁业务的潜在客户。 除了潜在的利润丰厚的收入来源外,DGX Cloud还已成为英伟达帮助其一些客户过渡到新一代芯片的一种方式。例如,软件制造商ServiceNow过去曾为自家数据中心购买英伟达服务器,现在也直接从英伟达租用这些服务器。 去年,当对GPU的需求旺盛时,ServiceNow总裁C.J. Desai跟黄仁勋说需要更多的服务器。黄仁勋告诉他:“这完全没问题,但你应该能够将容量扩展到DGX Cloud。” Desai称,ServiceNow的AI雄心“非常依赖”英伟达的产品,包括今年早些时候推出的帮助企业在其应用程序中高效运行AI的软件。Desai不想讨论他的公司在产品上花了多少钱,只透露说金额一直在增长。ServiceNow拒绝了竞争云和芯片公司的报价,因为其工程师非常喜欢英伟达的“全栈”。 英伟达发言人说:“我们每天都向客户证明我们的价值。英伟达为客户提供最低的总拥有成本、卓越的性能和创新,在堆栈的每一层——从芯片到系统再到软件和算法。” 风险投资家Jeff Herbst认为:“英伟达从不自满。”他在英伟达工作了二十年,负责业务发展和收购,直到2021年,“你无法从会议的语气或主旨真正知道时间是好是坏。” 02. 不想像思科一样崛起又衰落 英伟达31年前开始销售用于PC游戏系统的GPU。黄仁勋在2006年推出了一种利用图形芯片提供的计算能力的编程语言CUDA,为英伟达最近的崛起奠定了基础。 CUDA通过自动化构建利用芯片的应用程序的过程来节省开发人员的时间。近年来,CUDA已成为英伟达销售的一个主要因素:数百万程序员不想费心学习如何用竞争对手的芯片编程。 在谷歌等AI开发商开始利用芯片来训练AI模型后,英伟达的销量在2010年代开始飙升。 黄仁勋也有过失误,包括为自动驾驶汽车开发软件,而不仅仅是芯片,这涉及雇用一支庞大的工程师团队。这个计划没有成功。但英伟达在2019年以70亿美元收购Mellanox Technologies后得到了提振,这使其在企业数据中心站稳了脚跟,其AI芯片越来越多地出现在企业数据中心。 OpenAI推出的ChatGPT在微软数据中心使用英伟达芯片,为这家芯片制造商引发了几乎前所未有的繁荣。大量的大型科技公司和开发人员都在争相使用GPU来开发自己的生成式AI模型。英伟达还为数十家此类开发商提供了资金,包括Mistral、Cohere、Runway、Wayve、Figure、Perplexity等。 自ChatGPT推出以来,英伟达的市值已经上涨了8倍,达到3.2万亿美元。 黄仁勋一直在管理与微软等公司的棘手关系。这些公司购买英伟达的芯片,同时试图减少对这些芯片的依赖。为一家主要云供应商工作的人以及几家数据中心运营商的高管称,微软、AWS及其他云供应商已经经历了对传统计算工作负载的需求复苏,因此他们无法承担仅仅为了容纳英伟达芯片而扩展数据中心的费用。 一次性销售芯片的业务存在固有的脆弱性:随着需求不可避免地冷却,尽管销售量迅速上升,但它们可能会下降。 对于英伟达来说,没有稳定的新利润流的未来可能并不美好:正如许多评论家所言,2000年,思科在互联网泡沫最严重的时期销售路由器,突然成为世界上市值最高的公司,当时电信公司建造了新的数据中心,但由于基于互联网的收入未能像科技高管和投资者想象的那样实现,这些中心被闲置了。随着其硬件成为一种广泛使用的商品,思科尚未从销售下降中恢复过来。 黄仁勋私下告诉同事,英伟达必须确保它不会像思科或Sun等公司那样快速崛起又衰落。 Sun在20世纪90年代成为服务器和计算机硬件的巨头,但在泡沫破裂后,该公司没有抓住微软和其他公司占领的蓬勃发展的软件市场。 过去几个月,英伟达推出了几种软件产品,希望其业务多样化。在2月份的财报电话会议上,黄仁勋将英伟达AI Enterprise业务描述为“AI操作系统”,客户可以用它来训练和运行AI。英伟达对每个GPU每年收取4500美元的软件访问费用。 “他不是在销售芯片,而是在为现代数据中心销售GPU、软件和系统。”曾是Mellanox董事会成员的风险资本家Umesh Padval说,“人们认为它只是一家GPU公司,但它远不止于此。” 可以肯定的是,英伟达的硬件销售不会面临迫在眉睫的风险。由于其先进技术,该公司在截至4月的9个月中创造了400亿美元的自由现金流,并称对今年晚些时候将推出的下一个旗舰芯片的需求正在飙升。 即使软件业务的增长速度没有英伟达希望的那么快,它也可以提高对公司芯片的忠诚度,并保护其核心业务免受更便宜的竞争对手的影响。 存储公司Box的首席执行官Aaron Levie说:“如果你是英伟达,你真正想要的是一个非常强大的更好的软件服务飞轮,让客户留在你的轨道上。”Box租用英伟达GPU并向自己的客户转售英伟达运行AI的软件。“我认为(黄仁勋)在这方面做得很好。” 在试图建立新软件业务的同时,黄仁勋正试图努力实现硬件销售增长的最大化,同时确保没有任何一个客户能够凌驾于英伟达之上。这也许可以解释上周的公告,即相对较小的云服务器供应商甲骨文将获得大量英伟达芯片,并在明年初开始将其租给微软和OpenAI。微软更愿意直接购买这些芯片,不过一位了解这笔交易的人说,它可能很难为这么多新芯片找到空间和动力。 黄仁勋还与另一家小型云供应商CoreWeave保持着特殊关系。该公司的收入从2022年的2500万美元飙升至去年的数亿美元。此前它以牺牲云大厂的利益为代价获得了大量英伟达GPU。微软还不得不从CoreWeave租用GPU服务器容量以满足其需求。 03. 与微软角力: 买英伟达设计的服务器机架 为了创造更多硬件收入,英伟达正试图对其最大客户如何购买和安装GPU产生更大影响。通常,云大厂构建自己的客户服务器机架,用于全球数据中心和各种芯片。但参与谈判的几位人士称,当英伟达就其下一个旗舰芯片GB200接洽客户时,它试图说服他们完全按照其设计购买机架。 微软和英伟达今年在这个问题上争了几周。据参与谈判的人透露,英伟达副总裁Andrew Bell要求微软的同行购买一个服务器机架设计,该设计与微软在其数据中心使用的机架尺寸相差几英寸。这种变化将阻碍微软在不同AI芯片之间轻松切换的能力。Bell称,同意购买英伟达服务器机架设计的客户可以率先获得其新芯片,但微软高管对此反对。 参与其中的一位前微软高管说,微软高管已经感到购买英伟达网络电缆的压力,因为他们认为英伟达将优先考虑此类采购,而不是只涉及其GPU的采购。截至2023年初,英伟达网络芯片和电缆约占微软在英伟达产品上支出的1/3。 其中一名参与者称,关于服务器机架设计的争议最终到达了微软首席技术官Kevin Scott和首席执行官Satya Nadella的办公桌。最后,英伟达做出让步,同意让微软为GB200芯片设计自己的定制机架。 两名英伟达员工说,谷歌和AWS预计也将为GB200生产定制机架。 但英伟达最终仍可能从小客户购买的GB200机架中赚到更多的钱。 参与该计划的两名英伟达员工透露道,英伟达今年计划设计和采购装有GB200芯片的服务器和机架的材料,然后再将它们交给建造并最终销售这些芯片的服务器制造商。 这可能会对戴尔、惠普、超微等服务器制造商的利润率带来压力。一家大型服务器汇编商的经理称,这些公司从他们设计的机架中产生的利润率高于使用英伟达的设计。 04. 结语:在城市街道上开法拉利 GPU业务还面临另一个问题。虽然大公司拥有处理英伟达先进芯片的专业知识,但许多初创公司、跨国公司、政府和学术买家没有。 在去年长期短缺后,英伟达旗舰芯片H100今年变得更容易找到。不那么老练的买家并没有按照预期的方式使用它们,就像在缓慢的城市街道上驾驶法拉利一样。 这意味着随着英伟达芯片变得更加昂贵,其中一些客户可能不想升级。运营云服务的Cloudflare首席执行官Matthew Prince说:“我们发现,通常你不需要最新一代的英伟达GPU就能获得出色的性能。” 为了缓解这种担忧,英伟达的Kress在5月份称,政府或政府支持的公司购买GPU将导致今年的销售额达到“高个位数的数十亿美元”,这意味着客户群体还有很大发展空间。 芯片研究公司SemiAnalysis的首席分析师Dylan Patel说,英伟达在云端租用H100芯片的价格在过去一年中已经下降了近30%,这可能表明市场放缓。SemiAnalysis也负责监控云供应商的价格。他说,与去年相比,公司也可以更轻松地租赁芯片,而无需与云供应商达成多年期协议。
TikTok起诉美国,小米新车路试谍照曝光,王者荣耀上线欧美日韩等市场,旅行青蛙项目组只剩不到5人,这就是今天的其他大新闻
今天是6月21日 农历五月十六 前阵子抢黑悟空实体的典藏版 我和世超把手机快按破了 也一个没抢到 今天看了下闲鱼 要加价一千以上才能买到 。。。 下面是今天的其他大新闻 # TikTok 正式起诉美国:寻求推翻该法案 前总统特朗普力挺 6 月 21 日消息,TikTok 宣布就违宪禁令提交开庭辩护状,寻求推翻“ 不卖就禁 ”法案。TikTok 在这份当地时间 6 月 20 日提交的法庭文件中表示,美国政府本可以采取限制性较小的替代措施,以解决国家安全问题。 TikTok 称,公司此前与美国政府谈判达成了一份国家安全协议( National Security Agreement ),以提供“ 多层次的保障和执行机制 ”,但美国国会在今年早些时候颁布 TikTok 禁令时无视了这一基础工作。 不过特朗普( 早已在 TikTok 注册自己的号 )公开指责拜登封禁 TikTok 是为了帮助其在 Facebook 的盟友变得更加富有,更加有影响力,从而继续开展与共和党的斗争。 :这打起官司来得有一阵子,TikTok 暂时安全了。 # 小米新车路试谍照曝光,预计 2025 年正式发布 有大量汽车博主放出了一组“ 小米汽车首款 SUV ”的路试谍照。 根据之前的爆料,小米 SUV 车型内部代号 MX11,预计将于 2025 年正式发布上市。从谍照来看,这款新车外观采用了大量伪装,车头造型较为修长,并采用了蚌壳式的前机舱盖。 这款新车的车顶上还配置了一颗激光雷达,该雷达造型与小米 SU7 上鹅卵石样式激光雷达基本一致。此外,细节上可以看到侧面摄像头、黄色卡钳及五辐式的轮圈,整体与小米 SU7 设计类似。车顶线条采用了顺滑的曲线设计,并延伸至车尾部。 :乍一看有点像 法拉利 Purosangue。 # 王者荣耀上线北美欧洲日本韩国等市场 6 月 20 日,王者荣耀国际服( Honor of Kings )上线东南亚、北美、欧洲、日本、韩国和拉丁美洲等市场,正式迈出了全球化的步伐。 游戏上线后迅速登顶印度尼西亚、菲律宾、北美、加拿大、澳大利亚、秘鲁、马来西亚、新加坡等 12 个国家和地区的免费榜。自 2023 年 3 月首站登陆巴西后,Honor of Kings 陆续在中东、北非等 50 多个地区上线,如今在北美、欧洲等多个国家和地区上线。 :LOL:你终于醒啦。 # 旅行青蛙项目组只剩不到 5 人:将继续运营 6 月 5 日,灵犀互娱的《 旅行青蛙 · 中国之旅 》官方在小红书发帖官宣为缩减运营成本,项目组已经“ 放生 ”人工客服,希望玩家予以理解。另外,官方在小红书的评论区透露,目前项目组的人数甚至都凑不满五个人,官方表示“ 少,但在努力着 ”。 对于项目目前的状况,灵犀互娱表示:“《 旅行青蛙 》是我们最初期代理的产品,团队对产品非常有感情也一直在努力维持经营,不过当前项目组确实遇到了一些挑战。但对于项目我们仍会继续投入,有版更计划。希望未来可以通过不同的商业模式让旅行青蛙一直陪伴玩家。 ” :已经想不起来上次上线是啥时候了。。。
参加华为开发者大会后,我感觉他们把系统玩明白了…
就在今晚,我们亲爱的华子召开了华为开发者大会 HDC2024 ,开了一场足足三个多小时的史诗级大会,信息量可以说是相当之大。 信息量之所以大,是因为华为这次公布了 HarmonyOS NEXT 系统、 NEXT 原生应用和盘古大模型 5.0 等等干货,从消费者到开发者再到商用端,几乎都覆盖到了。 也正是在这场大会上,之前跟大家预告过的 HarmonyOS NEXT 正式和大家见面了。 托尼也是从杭州出发,前往大名鼎鼎的松山湖畔来参加这场为期数天的开发者大会( 不是来打捞芯片的 )。 废话不多说,咱们直接进入这次的正题——HarmonyOS NEXT 。 >/ HarmonyOS NEXT 简单来讲, HarmonyOS NEXT 采用了华为自研的全新系统架构,这次真的要跟安卓说再见了。 而这也就意味着,之前说过的鸿蒙原生应用,现在成为了现实。 看看这一屏幕的小伙伴就能知道,大家常用的京东、淘宝、美团和微博等等,肯定都开发了鸿蒙原生应用。 统一的鸿蒙生态这一点,其实在现在的鸿蒙设备上就能感受到,但是这次鸿蒙更进一步,你在手机、折叠屏或者平板上面打开相同的应用时,体验是几乎一样的。 以前做不到这种程度,是因为之前只是植入了鸿蒙互联框架,运行和流转的应用本身依旧是安卓 App 。 但安卓嘛,它一开始就没有给跨硬件的无缝流转留余地,所以体验可以说是稀烂。。。 不过鸿蒙这次从设计之初就考虑到了这些问题,所以厂商们的鸿蒙原生应用体验必然是丝滑般顺畅,遥遥领先。 这些应用一出生就有对应的 “ 平板版本 ” ,不需要在平板上用别扭的手机应用了。 为了展示原生应用,华为现场还摇了不少人,比如 WPS 副总裁,他在现场就表示手机和平板 WPS 都已经适配了原生鸿蒙,而且像是账号统一、文档同步和多段协同编辑等等都已经完美适配了。 而华为生态里的经典功能之一,跨设备协作,比如把手机里的图片甩到平板上面继续编辑,也都被 WPS 玩明白了。 但在大会上,余总也表示 TOP 5000 款应用中,已经有 1500 多款上架成为了鸿蒙原生应用。 虽说已经能满足 99.9% 的用户使用时长,但还是会有边边角角照顾不到,所以华为也想了个办法,为开发者们准备了 “ 样板间 ” 。 简单来讲,样板间就是为你提供好了各种不同类型应用的模板,比如新闻、金融和政务等等,直接照着来就行。 比如人民网就用上了新闻样板间,其中有 80% 的代码都是复用的,甚至还能加入新功能,这开发速度一上去,应用的交付效率可不就起来了吗? 余承东说, HarmonyOS NEXT 在第四个季度就要商用了,也就是顺利的话可能 Mate70 首发就能用到。留给开发者们的时间不多了,加油干吧! >/ Harmony Intelligence 华子啊,你还是保守了。。。 隔壁果果都直接叫 Apple Intelligence 了,托尼一开始以为你们也直接叫 Huawei Intelligence 呢。。。 但有一说一,确实是 Harmony Intelligence 更好听。 说回正事儿,我认为 Harmony Intelligence 是这次纯血鸿蒙能明显区别于现在安卓的部分。 咱也知道,国内原生版谷歌 AI 指定用不上,所以以后国产安卓手机拥有系统层级的 AI 就挺难的。 那么这个鸿蒙原生智能都可以做些什么呢? 最基础的, AI 图像生成,可以基于照片生成不同风格的画面,还可以一键设置到华为全家桶上面,各种设备的自适应其实也有 AI 的功劳。 但真正格局打开的,还是华子对特殊人群的关心,比如 AI 声音修复。 有些特殊人群的发音比较模糊,而 AI 就可以修复声音,让声音变得更加清晰。 如果你对声音修复没概念,可以去回忆一下《 流浪地球 2 》李雪健老师的声音,其实他的声音是后期修复的。 还有对于视力障碍人群,小艺现在可以把看到的画面读出来,现场举了个例子,根据语音问题来判断冰箱里的食材新不新鲜。别说视障人群了,这个功能我也想拥有。。。 总之,华子对无障碍方面的探索确实领先,这波格局打开了。 说到小艺,就像前两天果子的 Siri 得到史诗级升级,小艺也同样如此,直接跟底部导航条合二为一,托尼感觉类似一个无处不在的超级助手。 小艺的用法很无脑,比如你想创建日程,直接把信息拖拽到底部导航条就完事儿,小艺会自动识别内容。 更无脑的方法,就是当你收到一张表格图片的时候,你只要直接把图片甩给小艺,它就会自动转换成表格。。。 差友们,这才叫真正的智能助手啊,你一句话都不用说,它就知道你要干啥。。。 小艺现在也支持多模态融合,比如你收到一条消息,上面有一个地址,你不用导航手动搜索地址,直接问小艺 “ 去这里要多久 ” 就可以,根本不用说出地址。 该说不说,要是实装的 HarmonyOS NEXT 真能有这样的效果,那托尼可太期待了。 除此之外, HarmonyOS 对隐私的管理也更加严格了。 比如直接禁止开放应用列表和通话记录等 9 种不合理权限,从源头上降低隐私泄露风险。 对于这种行为,我只能说干得漂亮。 除了这些, HarmonyOS NEXT 还有各种大大小小的新功能,华子确实是把这步给迈出去了。 要是你没看够,等我们明天在现场体验完 HarmonyOS NEXT ,立马写个文章与大家见面,差友们别急嗷。 另外, Mate60 、 Mate X5 和 MatePad Pro 13.2 三款机型今天就支持开发者和先锋用户更新 Beta 版本。 而更多机型的更新,将会和秋季的 Mate70 系列共同到来。 >/ 盘古大模型 5.0 说完了 HarmonyOS NEXT ,这个盘古大模型对于普通用户来讲就比较陌生了。 其实去年它刚亮相的时候差评也给大家介绍过,它就是华为自己的大模型,人们可以在它的基础上二次开发面向行业的应用。 我们前面提到的 HarmonyOS Next 上的小艺,就是用了盘古大模型的能力。 可它实在太低调了,蛰伏一年时间,盘古已经从 3.0 进化到了 5.0 。升级后的 5.0 更牛逼了,给大家举一些发布会上演示的例子吧。 第一个例子,可以用大模型生成不同天气和角度的视频来训练自动驾驶。。。 大家都知道训练自动驾驶需要海量的数据,各种 Conner Case ( 极端案例 )必须见过才知道怎么应对,所以这个应用可算是戳中了智驾开发者的心~ 你也可以通过大模型来帮助自己设计汽车,现场还直接展示了大模型生成的 3D 打印模型。 虽然很方便,但是怎么说呢,就是这个 B 柱的位置感觉不是很方便上车的样子。。。 但这不重要,重点是盘古大模型可以很快生成 3D 汽车模型,而且支持导出并二次编辑。嘛,能改就是好同志。 年初 OpenAI 和 Figure 合作的机器人不断刷屏,现在搭载盘古大模型的国产机器人 “ 夸父 ” 也来了。 有一说一,敢现场让机器人演示对话、拿取物品和互动还是挺自信的。 夸父取水. gif 虽然感觉这个机器人的反应稍微有点慢,不过在开发者大会上就能有这样程度的展示,也已经很不错了,托尼也很期待这位机器人大哥之后的反应可以更迅速。 另一个很实用的功能,则是通过盘古大模型 5.0 实现 AI 同声传译,现场也直接演示了一下,老外讲英语大概四五秒之后,同声传译就开始了。 有一说一,这个语气、流畅度和精准度真挺不错的,如果优化一下速度,那跟老外交流就再也不是问题了。 如果到这里,你还认为这些应用这些都是学别人,有模仿嫌疑,那接下来可是实打实的原创了。 华为分别请北京铁道所、宝钢和深圳市气象台等各种行业人士上台,就为了告诉大家盘古大模型可以提高故障识别准确率、降本增效、提升预报准确度。 怎么说呢,深圳市气象台预测上个月的 “ 龙舟水 ” 天气时,比欧洲中期天气预报中心的预报还要准。。。 最离谱的,是盘古大模型居然可以 “ 寻医问药 ” ,通过语言和药物分子大模型来优化药剂。 难道这就是传说中的赛博老中医吗。。。 现场还举了些别的例子,托尼就不一一展开了,我觉得未来也许大家会在潜移默化中有越来越多它的影子。 >/ 终 这次的开发者大会信息量还是相当大的,不仅有咱们用户关心的 HarmonyOS NEXT ,还有面向企业的盘古大模型和云服务。 说回大会的开头,余总说华为被制裁的几个月后, HarmonyOS 在 2019 年 8 月 9 号正式发布了。 而从首次发布到今天,已经经过了 1778 天,余总说这是 HarmonyOS 的 “ 轻舟已过万重山 ” 。 虽然距离我们普通人用上 HarmonyOS NEXT 还有一段时间,但最后这几个月,也是这个国产操作系统最关键的冲刺阶段。 还有多少伙伴加入这生态共建的队伍中,将直接影响人们对它的接受程度。 托尼也相当期待, HarmonyOS NEXT 再过几年逐渐普及之后,我们的生活又会发生怎样的改变。 撰文:百威 编辑:米罗 & 结界 美编:焕妍
看完这个月工信部的新车,我建议想买车的再等等
大家最近是不是看新车发布会眼睛都看花了。 这帮车企 “ 卷 ” 的吓人,出新车的速度比换季衣服都快。 这不,前两天工信部公布了第 384 批新车型公示,我看了眼,全是有意思的车。 比如进不了牛屋的乐道 L60 、宫斗个没完的领克 Z10 ,冲击低端品牌的小鹏 MONA M03 、纯电卖不动上增程的阿维塔家族、还有史上最小的方程豹豹 3 和块头最大的 smart 5 都通过了申报。 又是新一轮的新产品爆发,那话不多说,今天咱们来盘点一下。 乐道 L60 乐道在上个月中旬开了发布会,当时也没啥信息,这次上工信部爆了更多细节。 总结下来,这车有两个动力版本, 240kW 的单电机后驱,和 340kW 的双电机四驱( 前 100kW 后 240kW ),电池用的是弗迪的磷酸铁锂电池,尾部标识是 “ 蔚来乐道 ” 。 单电机和双电机的整备质量都给了两个数值,我猜可能是配置上有差异,不同的高低配版本搭配不同的轮毂和外观套件。 从图片细节看,确实也给了不同的轮毂和外饰件,选择应该挺多的。 除此之外还有亮点,就是这车比特斯拉的 Model Y 还要轻,风阻系数也低,只有 0.229 ,还用了 900V 的高压架构,所以电耗更低。轴距和空间都比 Model Y 大,之前说预售价是 21.99 万,我觉得正式上市的时候价格可能还会更低。 说实话,我看了乐道的发布会之后,觉得这车真不错,方方面面就是冲着特斯拉 Model Y 去的。不仅价格更亲民,还有第四代换电技术,现在特斯拉日子是真难过,一口气都不敢松,这不除了 Model Y , Model 3 的位置也被一直盯着呢! 领克 Z10 领克 Z10 最近在瑞典哥德堡完成了亮相,我们也去现场凑了个热闹,发布之后没多久,它就在工信部那通关了。 有三种动力可以选,分单电机后驱 200kW 的、单电机后驱 310kW 的,还有双电机四驱 580kW 的,动力够猛! 200kW 的低配版,给了两个整备重量,应该是分高低配,低配的轮毂是选不了的。 电机方面也有门道, 200kW 那个版本用的是威睿电机,其他的版本就是衢州极电的了。之前吉利说了,领克 Z10 会有 400V 和 800V 两种架构,那这么一来, 200kW 那个版本很有可能就是 400V 的,而 310kW 和 580kW 的那就是 800V 的了。 这领克 Z10 ,可不止跟 Model 3 抢生意,小米的 SU7 、蔚来的 ET5 都是它的竞争对手,甚至还得跟自家兄弟极氪 001 抢市场。有人说吉利的车都在窝里斗,但我觉得吧,领克 Z10 是三厢轿车,极氪 001 是掀背轿跑,萝卜白菜各有所爱嘛,吉利内部肯定有他们的想法。 说完销量不错的蔚来、领克,再来看看最近日子稍微难过的。 小鹏 M03 今年北京车展上,小鹏说要推出个新子品牌 MONA ,搞得大家都挺期待的。但后面一看,哎?这车尾标和 LOGO 这不还是小鹏的,那个 MONA 好像没啥动静了。 然后小鹏官方就说了, MONA 成了一个新的系列,而不是新品牌。 其实吧,我觉得小鹏这么做也挺明智的。他们这几年的车,跟蔚来和理想比起来,产品定位和细分市场感觉没那么明确,出的车型一个比一个抽象。如果小鹏自己都还没想清楚产品线该怎么打,那就别急着弄个子品牌了,不然两头都搞不好。 说回到这车,小鹏还是跟以前一样,像挤牙膏一样,一点一点往外透信息,没一下子全说出来。这次公布的车型有两个动力版本,都是单电机,低配 140kw ,高配 160kw ,高配的选装会多点。电池都是弗迪的,这挺靠谱的。 外观上看,这车比 P5 小了点,但轴距大,空间应该不错。就是前后大灯和保险杠的造型太奇怪了,像被挖掉了一部分似的。不过听网上那些大 V 说,实车比照片好看多了,我也有点想见识一下。 M03 定位在 10 ~ 15 万级别,眼看着好哥俩蔚来和理想的车越来越高端,小鹏反其道而行之,车是越做越便宜,其实做点亲民车也不错,我支持小鹏继续冲击低端市场。 说完了纯电车型,再说当下很火的增程。阿维塔家族是不好久没动静了,这次他们也开始玩增程了。 增程版的阿维塔 11/12 从外观上看,新车跟现款差别不大,就是前后保险杠稍微调整了一下,但整体还是很有特色的,一眼就能认出来。 动力上, 11 和 12 都用上了自家长安汽车的 1.5T 发动机当增程器,最大功率 115kW ,深蓝 S7 用的也是这台,出厂已经装了很多台车了,技术成熟稳定。再配合 231kw 的电机,日常用完全没问题,各种场景都能应对。 阿维塔这次及时推出增程版车型扩充产品线,绝对是个明智的选择。车本来就好看,再加上背后有长安、宁德、华为一众各领域大哥供给的优质软硬件,上市以来一直都很受关注,就是纯电版价格太贵,这上了增程顺便再调调价格,没准还真有戏。 最后咱们来看看一个很有意思的小众市场: “ 方盒子 ” 方程豹豹 3 硬派 “ 方盒子 ” 这个细分市场当然不会少了比亚迪这个卷王。 这次他们推出的豹 3 ,是方程豹家族的第三个成员,还是第一款纯电车型,它的尺寸比豹 5 要小一些,目前应该是家里最小的一台。 这次公布的配置只有一款,是双电机四驱的,前面的电机有 110kw ,后面的电机有 200kw 。外观看起来就是那种赛博朋克的机甲风格,很酷炫,后面还挂了 “ 小书包 ” ,整体看起来很粗犷,但仔细一看,小细节都处理得很好,比如隐藏式的门把手,还有内置的摄像头,都做得非常精致,整体看起来还是挺帅的。 除了豹 3 ,还有另外一个让人想不到的选手。 smart 5 哎呀,谁能想得到呀,以前那个软萌可爱的 smart 现在居然变得这么硬核了!跟豹 3 一样,也是方盒子的造型风格,不过稍微收敛了一点。这外观基本就是把之前亮相的精灵 5 概念车给搬过来了,没想到这么快就搞定量产版了。不过话说回来,这造型咋看咋像 EQB ( 狗头 )! 这次工信部公布的 smart 5 有四个动力版本: 日常通勤,有搭载 250kW 单电机的磷酸铁锂电池版本,还有 267kW 单电机搭配三元锂电池的版本。 如果你追求更高性能, smart 5 还提供了两种双电机四驱版本:一种是 165kW 与 267kW 的组合,另一种则是更强的巴博斯性能版,搭配 165kW 与 310kW 的组合,两者均采用了三元锂电池。 各种动力配置应有尽有,总有一款能满足你的驾驶需求! 不只是动力选择多,还有很多其他特色配置都可以挑,而且都挺有个性的。比如非隐私玻璃,想要更通透的视野就可以选它,还有激光雷达,车顶前照灯、摄像头、行车记录仪这些实用安全的配置。此外,车身 LOGO 、字标、外观装饰条都有不同版本可选,完全可以根据自己的喜好来定制。 smart 5 这次公布的信息挺全的,连巴博斯版都包括了,看来离正式发布也不远了。 现在方盒子这个细分市场的车型真是越来越多了, iCAR V23 、深蓝 G318 、豹 3 还有 smart 5 ,竞争也越来越激烈了。 这一批工信部公示的车型其实还有不少,我只是挑了一些大家可能比较感兴趣的给大家介绍了一波。不得不说现在这些车企出新车的速度,简直了,几乎每个月都要去工信部那刷一下名单,看来今年下半年乃至明年上半年,市场肯定还是热闹非凡,大家忙着抢地盘。 领克说了他们 2025 年还要推出 6 款 EM-P 车型,阿维塔也要加 4 款增程车到他们的生产线里,还有蔚来的萤火虫、大众的新 ID 系列等等。别说看了,光听名字都让人头晕眼花。如果你最近不着急买车的话,再等等,说不定会有更合适的选择。 撰文:大贺 编辑:脖子右拧 & 面线 美编:焕妍
一句话生成智能仓库!联想新视界推新一代产业元宇宙平台,配备自研三维引擎,从数字孪生到以虚控实
作者 | 陈骏达 编辑 | Panken 智东西6月21日报道,今日,联想旗下的产业元宇宙平台和应用服务商联想新视界发布了NovoVerse(浩界)2.0产业元宇宙平台和这一平台的人机交互界面——派中心数智专家一体机。 这一平台采用了AI+产业元宇宙的新范式,利用生成式AI、领域大模型、AI数字孪生等技术,让企业能对生产建设中的各个环节进行仿真推演,起到降本增效的目的。 NovoVerse平台集成了一整套元宇宙构建工具、创新应用和运营支撑体系,其中包括联想自研的Z-Engine空间计算和动态渲染引擎在内的技术工具。 NovoVerse能在工业、交通、智能园区等领域发挥作用。目前联想新视界已在联想天津智慧创新产业园中央仓、中烟集团某卷烟厂等相关场景中落地这些技术,助力产业升级。 而本次发布的派中心数智专家一体机则搭载了2块英伟达的中端显卡RTX 4000 Ada 20GB,能提供充足的本地渲染和推理算力。 企业可以通过上传文档直接训练专属领域大模型,而本地化的部署为企业数据安全提供了保障。在有更大的计算需求时,还可以使用本地云渲染技术对原有算力进行补充。 派中心一体机中内置了一名数字人,用户可以通过自然语言与这一系统进行交互。 一、以领域大模型+四大引擎为核心,采用自研引擎替代Unreal Engine NovoVerse产业元宇宙平台内部由数据虚实映射层、技术引擎层、工具和生态支持层及行业应用层构成。 ▲NovoVerse产业元宇宙平台(图源:人工智能+产业元宇宙白皮书) 数据虚实映射层是虚拟世界与物理世界之间的桥梁,通过边缘控制平台实现了工业生产设备的近现场采集、分析和计算。凭借这一桥梁,企业能更便捷的获取生产设备的实时状况,对生产设备进行统筹管理,还能更加及时地发现设备潜在的问题。 技术引擎层是NovoVerse平台的核心,主要包括领域大模型以及Z-Engine空间计算和动态渲染引擎、M-Engine模型引擎、I-Engine多模态仿真引擎、C-Engine智能控制引擎这四大核心技术引擎。 NovoVerse中的领域大模型应用了目前的主流开源模型,结合企业自身的实践经验,形成了企业自用模型,能够灵活调用小模型能力。 领域大模型和其它技术引擎由NovoVerse的AI大脑统一管理,用AI管理AI,精准解决企业需求。AI大脑中的中央智能编排引擎能协调和管理多个智能体,自动完成任务分配、资源调度和监控评估。 值得一提的是,Z-Engine空间计算和动态渲染引擎是联想新视界自主研发的国产三维引擎,对标Unity和Unreal等国际三维引擎。 这一引擎让NovoVerse能实现自主知识产权的实时光线追踪技术、超大规模场景的高性能高质量实时渲染、真实物理系统模拟和丰富的视觉处理特效。 ▲NovoVerse的渲染效果(图源:人工智能+产业元宇宙白皮书) Z-Engine还提供了低门槛、低代码的可视化逻辑开发系统,通过简单的拖拉拽和连线操作即可完成模块功能开发。这一引擎支持x86/x64/Arm和国产C86平台,对国产生态的适配能力不错,能在麒麟等多个操作系统上完美运行。 ▲低代码可视化逻辑开发系统(图源:人工智能+产业元宇宙白皮书) Z-engine的最大特点是其低延迟、高效率的云渲染能力。诸如3D图形渲染等重度应用可以在云端完成,这降低了对终端设备的要求,让更多企业也能用上这些应用。 平台工具和生态支持层通过统一用户入口Launcher为用户提供了可以集中获取不同应用与服务的入口。开发者可以通过AIGC应用生成器自动生成应用,也可以使用软件开发工具开发和集成智能应用。 基于以上三个层次,NovoVerse最终实现了行业应用的落地。行业应用层面向交通枢纽、煤矿+油田、离散制造、公共事业、商业&旅游、智慧农业等行业,针对不同场景提供智能化解决方案,包括客流仿真、能耗优化、大模型问答、设备巡检、碳足迹等。 二、用自然语言实现场景和应用生成,能管理智能仓库、烟草工厂 本次随NovoVerse(浩界)2.0产业元宇宙平台一同发布的,还有派中心数智专家一体机(派中心一体机),这是NovoVerse的统一人机交互界面。 派中心一体机搭载2块中端英伟达显卡RTX 4000 Ada 20GB,可同时胜任渲染和推理的任务。企业还可以通过上传文档直接训练专属领域大模型,而本地部署的算力为企业数据安全提供了保障。 ▲派中心数智专家一体机(图源:联想新视界) 在有更大的计算需求时,企业还可以使用本地云渲染技术对原有算力进行补充。 派中心一体机能以数字人的形式与用户互动,还能利用本地云渲染技术,用一台机器输出多路独立运行的数字人。 联想新视界还提供了边缘计算集群一体机这一产品。企业可以在产线、车间和工厂内部署边缘云,通过云边协同的方式实现更低成本的工业互联网改造。边缘计算集群一体机还可以实现低延迟高带宽的数据处理服务,这在远程维护、远程医疗等领域中都有重要意义。 在今天的发布会上,联想新视界也利用派中心数智专家一体机展示了NovoVerse可能的应用场景。 派中心一体机可以快速地实现AI场景生成任务。用户只需向派中心一体机中的数字人小派直接描述自己的需求,比如仓库占地面积、所能容纳的托盘数等信息,之后就能在几秒钟内获得一个仓库的数字孪生。 用户还可以调整数字孪生仓库内的各种设备,在虚拟场景中对仓库进行测试。现场演示中,工作人员向派中心一体机发出了“放入1000托盘的笔记本”的指令,派中心一体机快速反应,并计算出了所需的设备和任务耗时。 工作人员可以通过自然语言交互,关闭或开启某一设备,派中心一体机也会根据这些变量调整任务的预估完成时间。 ▲AI场景生成(立体仓库) 这一技术目前已经在联想的天津产业园落地。联想天津智慧中央仓数字孪生系统对接了立体仓库内的堆垛机、拆垛机械手和货物等设备,可实时查看设备的实际运行路线和状态信息,设备故障时可进行实时报警。 全库建模仿真让仓库管理人员可以直接查看立库整体情况,让海关查验、生产进度控制、立库整体监控等操作都变得更为便捷。 联想新视界还与中烟集团展开合作,对中烟旗下某卷烟厂的建筑空间、工艺设备、生产线、物料等现实空间资源进行虚拟映射,让产品的生命周期更为直观透明。 对生产设备的智能化改造,简化了获取生产设备状况的流程,并及时提出设备的调整和改进需求,大量减少原料的浪费,并提升产品质量。 在发布会现场,智东西让工作人员展示了这一数字孪生系统。工作人员只需向派中心一体机发出口头要求,就能获得工厂内所有设备的整体健康状态信息。还可以查看具体的设备情况,如设备生产质量、运行状况、故障和能耗的详细信息。 ▲卷烟厂数字孪生系统演示 联想新视界还在飞机制造、煤炭生产、客流仿真、智能园区等生产和应用场景中部署了NovoVerse的相关技术。 结语:AI加速元宇宙落地,为产业数字化赋能 元宇宙这一概念早在1992年便被提出,但当时元宇宙只是一个科幻小说中的虚构概念,看上去似乎遥不可及。 而随着自然语言处理、计算机视觉、生成式AI等AI技术的不断发展,元宇宙有了更丰富的交互体验,内容生成的难度也有所降低,构建一个虚拟世界已不再是天方夜谭了。 这些进步让元宇宙能渐渐找到其在真实世界中的应用场景,真真切切地为产业界的数字化变革赋能。
大厂离职成了流量密码,这些年轻人赚到钱了吗?
不懂就问,互联网大厂离职最后一步,是在小红书上发全网通告嘛? 字节、腾讯、阿里、网易、京东……这些知名互联网大厂企业文化或有不同,办公地址各有差异,但这次,它们却在互联网上以整齐划一的形态出现了。 在离职通告中,最为常见的就是 PO 工牌, PO 离职证明, PO 园区大门。 善整活者,还会以表情包和横幅添色。 工作是职场人生活的主旋律,离职发 “ 朋友圈 ” 纪念下,其实很正常。 只不过,这类内容似乎多到有点过头了,由此衍生的花活都能凑出好几个系列: 火速蹿红的大厂离职,俨然成为一个新赛道。 有自称离职博主的,有谈论离职博主赛道是否拥挤的,还有诞生了一批专门观测离职博主的博主。 互联网不缺赛道,懂科技的可以走科普赛道,对财经金融特了解的可以做财经赛道,即便只是特别能吃,也可以去吃播赛道,但大厂离职这个词太垂也太小众了,这真能成为一种有效的发财之道嘛? 我决定研究研究。 在研究是否能赚钱之前,需要弄清楚的是,为啥离职也能演变成赛道? 其实这事不难理解。 互联网大厂就是打工人的 “ 耶路撒冷 ” ,自带流量加成。 普通人对大厂薪资福利有向往,对大厂工作生活有窥视,而大厂员工离职后会迈入什么样的生活?除了千篇一律的上班以外,人生是否会有另一个问答?也是无数职场人好奇的。 如此种种,让这类内容往往阅读不俗,猛一点的,甚至点赞能成千过万。 有需求就有供给,一篇 “ 大厂拜拜,月薪 X 万,还是决定不干了 ” 火了,互联网人就会炮制百千篇同类型推文蓄势待发。 那么,这些大厂离职员工在自媒体上生存的到底好不好呢? 我点开了这些 “ 离职推文 ” 背后的账号。 账号运营者大体可以分为三类。 第一种,初窥门径,虽然靠工牌火了一把,但很多人并没有规范化运营的想法。 自媒体账号更像他们的日记本,记录自己离职后的生活。 离开大厂后,他们跟普通人没差,继续去下一家大厂打工的,出去旅游散心的,也有人正在困扰,下一份工作在哪。 有个前程序员小哥,没事还会跑跑外卖。 但大厂之间,也确有不同,字节离职员工,好像特别喜欢环游世界,给我一种 10 个离职员工 4 个在旅途中的感觉。 而腾讯的离职博主,怎么都喜欢去香港重启人生啊? 想想也是,毕竟腾讯总部在广深,不少员工之前就读于香港嘛。。。 第二种,进阶尝试,有意识的进入离职赛道,经营自己的账号。 在这一阶段,字节和阿里保持了卷王底色。 阿里的离职博主,特有运营的意识,讲究打法,有人的主页内容几乎都以大厂为主题,也有人从发的第五篇推文开始,账号栏目就已经基本设计好了。 有人在离职推文的底部,就宣告自己将通过自媒体创业,阐明自己的创业模式。有人不但宣告,还会更进一步,进行社群引流。 对于这些博主而言,最为常见的变现方式,是定位为职场博主,再通过面试辅导等变现。 而阿里非常有特色的一点是,很多离博( 离职博主简称 )的变现选择是勇闯义乌跟各种代工厂。 字节的离博,除了职场以外,比较常见的经营领域是旅游。别问,问就是环游世界,环游中国。。。 就离职推文的关注度而言,字节、腾讯、拼多多、阿里、华为的关注度都非常高,属于第一梯队。 尤其是字节的离职推文,点赞互动上千较为常见。与之对比的是,同为互联网大厂,有些离职推文比较常见的点赞互动值仅有一两百左右。 那么,他们在自媒体上生存的到底好不好? ——抱歉,这不由一篇推文决定。 的确,当 “ 大厂 ” 、 “ 月薪 X 万 ” 跟 “ 离职 ” 、 “ 裸辞 ” 以及 “ 自由 ” 这些词放在一起的时候,天然会产生矛盾感,引发羡慕、共鸣与向往。 但流量上的成功是大厂标签与算法所带来的,而不是内容本身的成果。 所以,很多因为离职推文一炮而红的博主,后续推文数据泯然众人。 更别提惨淡的商业化数据了。。。 是的,虽然大厂离职这一关键词有流量,但这一人设无法商业化。 据我观察,那些真能以离职为起点,打开自己自媒体天地的账号,都有着自己深入钻研的某个领域,这也是第三类博主。 @Claire 茶仔,从字节离开以后进入了半导体,主页虽然聊过离职,但以美妆护肤为主,笔记一口价已经卖到了 4500-5000 一条,每个月都有稳定的商业广告。 还有从阿里裸辞的 @ 卷毛小狗,她所擅长的是手工领域,离职推文的流量甚至没有平时流量多,同样每个月固定有广告投放。 更猛的还有阿里前女程序员 @ 小豆芽儿,在离职之前,她就凭借大厂女程序员 vlog 就已经收获了不少粉丝,生活记录也是超好恰饭的一个分区。 所以,即便是离职赛道,真正能赚到钱的还是那些有内容、有人设、有经营的博主,离职推文对于他们只是点缀。 自媒体到底有什么魅力,能够吸引这么多大厂离职人涌入呢? 互联网大厂的高压环境,不断加速的工作节奏,总是需要提升和复盘,一方面意味着快速成长和世俗上的体面,一方面代表着永无宁日的生活。 什么叫永无宁日呢? 在@小豆芽儿 的离职推文里是身体的亚健康状态,是 “ 频繁的胸闷胸痛喘不上气 ” ;在@库尔勒香梨 的笔下,是高强度工作后回到家的疲惫和相顾无言;还有向上管理, PUA ,嫡系,摘果实等等。。。 与其从一个大厂跳到另一个大厂,去看其他环境是否能兼顾生活和工作。 也许成为一个自媒体博主,才是脱离班味最简单的途径。 而且这活上限高,能做起来,回到每月 X 万的收入完全没问题。 在这种背景下,大厂这一身份就成一根救命稻草,每个人都想来抓一下。 但相信,很多离职博主已经深刻感受到了,赚钱哪有这么轻松? 作为一枚自媒体老司机,我也想小小提醒一下大家,如今的自媒体已经成为了一种行当。 你能想到的内容都有人在制作了,赛道拥挤,竞争激烈,其中不乏有毅力、有才华的人。 就连杀虫整活这个赛道,都有人在做 ↓ 对了,这位博主 @好奇五先生,也是大厂离职出来创业的。 其次,做自媒体根本没有大家想得那么轻松。 这个世界上的确有人天赋异禀,随便写写也能一炮而红,但对于绝大多数人,做自媒体跟上班没差:每天琢磨选题,持续产出优质内容,研究市面上的爆款话术。 而且这样的内容输出,不是一两周,而是以年为度量,写作时间久了,后期根本想不到选题,愁到拽头发。 凭借 “ 大厂、离职 ” 就能被算法临幸,收获成千上万的点赞,这事的确令人头晕目眩,能让人误以为自己站上了成功的起点。 但当你全力投入,认真产出的时候,可能会发现毫无动静的粉丝数,个位数的互动,才是多数人的常态。 那一篇的火,只不过是烟火罢了。 是算法带给你的错觉。 撰文:渡渡鸟武士 编辑:莽山烙铁头 美编:焕妍 图片、资料来源: 小红书:Mchi4sw4、弗兰克在梦游、卷心花椰菜的日记本、大厂阿璐独闯义乌、建国供应链、Will聊战略与国际化、库尔勒香梨等。 bilibili:好奇五先生 《让子弹飞》
三星 Galaxy Z Fold 6 曝光:外观更加硬朗,配置小修小补
最近,美国手机壳品牌 Thinborne 在 X 上晒出了一款新手机壳,并暗示这是为三星 Galaxy Z Fold 6 定制的手机壳 从这款手机壳能看出,三星 Galaxy Z Fold 6 的屏幕大小较前代并没有做出太多改变,主要是屏幕比例略有调整。 可以看到这代的外屏比 Galaxy Z Fold 5 稍微宽了一些,实际上用户操作的空间并没有太大变化。背部整体外观和前代类似,但设计变得更加方正,R 角更小了一些。 X 用户 @skyrajparmar 曾分享过一张 CAD 模型图,这张图片也证实了三星屏幕比例的细微变动。 早前有消息透露,三星下一次 Unpacked 大会将于 7 月 10 日在法国巴黎举行,届时会有众多三星折叠新品发布。 随着发布会的临近,三星 Galaxy Z Fold 6 的面纱也在逐渐被揭开。上周,科技媒体 Smartprix 分享了三星 Galaxy Z Fold 6 的详细参数。 三星 Galaxy Z Fold 6 配备了一块 7.6 英寸的内屏,比例为 7:6,分辨率为 2160×1856(QXGA+)。外屏尺寸则为 6.3 英寸,比例为 22:9 分辨率为 2376 x 968(HD+)。 这两块屏幕的色深达到了 16M,支持使用 S Pen 书写。而且也都支持 1-120Hz 动态刷新率,还使用了三星的「Dynamic AMOLED 2X」技术。 三星 Galaxy Z Fold6 配备了三个后置摄像头。主摄为 5000 万像素(f/1.8 光圈), 超广角摄像头为 1200 万像素(f/2.2 光圈,120 度视场角)。 长焦镜头则拥有 1000 万像素,配备 f2.4 光圈,可以提供 3 倍光学变焦以及 30 倍的数码变焦。 三星 Galaxy Z Fold 6 的后置三摄均支持 OIS 光学防抖,但从光圈参数来看,这代相机的配置和前代完全相同。 性能方面,三星 Galaxy Z Fold 6 搭载骁龙 8 Gen 3 平台,配备 12GB LPDDR5X 内存。共有 256GB、512GB 和 1TB 三种存储空间可选。 这代的电池容量也依旧是 4400mAh,与前代没有任何区别。虽然充电信息还没有泄漏,但 smartprix 猜测会和去年略有不同。 三星 Galaxy Z Fold 6 适配 Wi-Fi 6 和蓝牙 5.3,将配备双 nano SIM 卡插槽,支持 18 个 5G 频段。 同时,三星还允许用户同时使用实体 SIM 卡与 eSIM 卡,或将两张实体 SIM 卡都换成 eSIM 卡,这将给使用 eSIM 的用户带来很大的便利。 三星 Galaxy Z Fold 6 展开的厚度为 5.6 mm,折叠后厚度为 12.1 mm,重量 239 克。 作为对比,Galaxy Z Fold 5 展开厚度为 6.1 mm,折叠厚度为 13.4 mm,重量为 253 克。可以看出新款会更纤薄一些。 samptrix 称三星为 Galaxy Z Fold 6 会有海军色、银色魅影和粉色三款配色。据早前爆料显示,三星官网还会独家提供黑白两色。 预计 Galaxy Z Fold 6 在美国的起售价格为 1899.99 美元(约为 13802 元人民币),与前代产品相比,所有机型都上涨了 100 美元(约 726 元人民币)。
盘古5.0重磅发布!华为云大模型年度杀招来了,人形机器人现场整活
作者 | 李水青 编辑 | 心缘 尽管近期大模型产业打得不可开交,但华为的AI野心,与疯狂的价格战和刷榜竞赛无关! 智东西6月21日东莞报道,今日,中国南方的阳光明媚热烈,在下午开幕的华为开发者大会2024上,华为常务董事、华为云CEO张平安重磅发布盘古大模型5.0。 华为AI核弹“Harmony Intelligence(鸿蒙原生智能)”滚烫发布,呈现出华为AI“云+端”的行业独一家打法,同时盘古5.0大模型的鼎力支持更显耀眼。 盘古大模型5.0实现从十亿级到万亿级参数版本全覆盖,小到十亿级参数的Pangu E系列,可支撑手机、PC等端侧应用;大到万亿级参数的Pangu S系列,能够帮助企业处理更为复杂的跨领域多任务。 在技术能力方面,盘古大模型5.0在全系列、多模态、强思维三大方面带来全新升级,同时在现场具身智能机器人与真人交互、视频生成及AI语音合成、模型物理世界3D生成等应用展示一轮接着一轮。 ▲现场演示基于盘古大模型5.0的具身智能机器人 但更加引起关注的是,华为云一口气发布了盘古钢铁大模型、盘古高铁大模型、盘古具身智能大模型、盘古工业设计大模型、盘古安全大模型及盘古媒体大模型六大模型,通过其特有的“行业难题死磕者”气质,引得观众阵阵“遥遥领先,一直领先”呼声。 但华为云的“杀招”远不止如此。 在盘古5.0背后,华为云昇腾AI云服务已快速迭代一年,服务超100个业内主流大模型。同时,华为云ModelArts studio、CodeArts、DataArts、MetaStudio等多条生产线也基于盘古大模型实现升级,下一代云基础设施CloudMatrix助力模型训练效率提升68%,业界首创EMS弹性内存存储正式发布,都在重塑华为云服务。 此外,华为云还首次揭秘了盘古5.0诞生的背后技术,包括公布了昇腾亲和的新模型架构π、MindStar技术等十几项核心技术点,讲解了其如何实现数据高效、效率高效、参数高效。 一、从10亿到万亿参数全覆盖,多模态强思维,打造“世界模型”? 张平安宣布,盘古5.0在全系列、多模态、强思维三个方面实现全新升级。而在他近40分钟的演讲中,透露华为云不仅将热门的视觉理解与生成、复杂任务推理等高阶能力升级,还多次提及模型“遵循物理规律”,隐隐透露出华为云打造“世界模型”的野心。 1、全系列:从十亿级到万亿级参数,从手机到云全覆盖 盘古大模型5.0包含不同参数规格的模型,以适配不同的业务场景。 十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、高效率的推理场景。 千亿级参数的Pangu U系列适用于处理复杂任务;万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。 2、多模态:支持10K超图像识别,生成内容模拟物理世界 本次鸿蒙原生智能更新的小艺智能体,很多能力用到了盘古5.0多模态理解和生成能力。 盘古大模型5.0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。 在图片和视频识别方面,盘古大模型5.0可支持10K超高分辨率。比如当被问到《清明上河图》中赵太丞家有多少人,盘古5.0可以在占全图1/200的画面中,识别出细小画面和汉字,并得出“4个人”这一正确答案。 在内容生成方面,盘古大模型5.0采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。 3、强思维:思维链结合策略搜索,支持复杂推理 复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索深度结合,极大地提升了数学能力、复杂任务规划能力以及工具调用能力。但华为云今日并未公布其在各大榜单中的得分情况。 二、具身智能机器人现场“活了”,推出六大行业模型 基于盘古具身智能大模型的人形机器人首次登场,现场演示了复杂任务执行。 名为“夸父”的人形机器人能够在要求下与张平安击掌,分辨位于它面前的与华为有关的物品,并在得知主持人口渴时,将面前桌上的水递给了口渴的主持人。 去年,张平安在发布盘古3.0时称,华为云盘古大模型“不作诗,只做事”。今年,盘古5.0已经进入各行各业做事,解决行业难题。 在工业设计领域,盘古大模型可以让汽车的造型设计时间大幅缩短,助设计师直接输出成3D文件;可以支持建筑师在输入设计草图的情况下,生成彩色并带有纹理的建筑群360°实景视频。 在媒体产业,华为云推出盘古媒体大模型,通过在语音生成、视频生成和AI翻译三方面的技术创新,重塑内容生产和应用的新模式。 盘古媒体大模型在视频生成方面取得了显著成果,支持将实拍视频转换为不同风格的高清动漫,现场演示视频中演员的舞蹈、武打等大运动轨迹能保持一致视觉效果,角色的面貌特征也保持前后一致。 在语音生成方面,盘古大模型通过AI原声译制与视频生成能力,实现了将原片译制成不同语言的视频,还能同步生成新的口型。 在AI翻译方面,华为云会议基于盘古大模型实现了升级,支持同声传译,翻译准确性高于93%,时延小于5秒,解决跨语言沟通难题。参会者还基于数字人分身功能,在自己不出面的情况下,让实时合成的数字人分身来替自己发言,讲述起来流畅自然。 但真正更令现场沸腾的,是华为云盘古大模型还进入了更多专业化更强、与生产息息相关的行业。 在高铁行业,基于盘古高铁大模型,华为云为高铁检测装上了“盘古眼”,帮巡检工人减少了巨大的工作量。一列动车的3.2万个故障检测项点,本来需要4人花费2小时进行反复、细致地检查,用盘古大模型可以自动识别准确率可达99%。 再拿钢铁大模型来说,宝武集团是中国最大的钢铁集团,年钢产量超1亿吨。据称盘古钢铁大模型已经帮他们把大模型与高炉炼铁和热轧钢带环节结合了起来,通过现场学习实现实时预测最优参数,最终效率提升了数十倍。 除此之外,在气象、医药等其他行业,盘古大模型也已经在助力解决行业难题。死磕行业的打法,体现了华为云有别于很多其他大模型厂商的独特气质。 三、昇腾AI云已服务100+大模型,免费为开发者提供一台云主机 华为云的“杀招”不止于此,盘古5.0升级背后,是华为云昇腾AI云服务的一年迭代优化。 目前,华为云已经在贵安、乌兰察布和芜湖,构建了三大AI算力中心,支持大模型产业发展。 根据华为云官方数据:业界万亿参数模型训练的平均无中断时长约2.8天,昇腾AI云服务可实现40天无中断;业界平均集群故障恢复时间约60分钟,昇腾AI云服务可以缩短到10分钟。同时,昇腾AI云服务能将大模型的资源开通时间从月级缩短到天级,加速大模型的开发。 目前昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式协助客户开发、训练、托管和应用模型,打造百模千态的“黑土地”。 张平安宣布,华为发布华为开发者布道师计划,未来3年计划发展超过3000名华为开发者布道师。 了让开发者更好地学习和使用这些技术,华为云为每个新生态的开发者免费提供一台云主机、一套开发工具和5GB的云存储空间。 华为云通过全栈系统性创新结合AI重塑云服务,打造AI Native的云。 通过下一代云基础设施CloudMatrix,华为云推动单体算力向矩阵算力发展。盘古5.0在同等NPU算力基础上,CloudMatrix对比传统服务器集群实现模型训练效率提升68%。 华为云还宣布业界首创EMS弹性内存存储正式发布。通过业界首创EMS-弹性内存存储,华为云助企业打破AI内存墙,释放极致算力。 四、盘古5.0技术首揭秘:三大类技术优化,推出新模型架构π 华为云首次公布揭秘盘古5.0诞生的背后技术,涉及数据高效、效率高效、参数高效三大方面。 在数据高效方面,基于两大关键技术——数据合成和数据课程学习,华为云提升数据利用率,试用优质的数据激活盘古5.0模型更多的能力。 同时,华为云推出了昇腾亲和的新模型架构——π。一方面团队基于增广残差连接的模型增强,缓解特征坍塌;另一方面,基于级数激活函数的非线性增强,使得模型与昇腾架构更友好。 面对大集群训练千亿稠密大模型,技术挑战在于大集群训练如何提升算力利用率,华为云通过多副本并行+计算通信流水,以及大集群调度与通信优化,使得隐藏通信降低70%,通信和等待时间从30%降至10%。 在多模态上,团队主要做了两大关键技术,一是统一视觉编码器,二是采用动态分辨率,从而克服当下编码器无法兼顾自然图像和文档图表的问题。 在强思维,也就是复杂推理方面,华为云通过MindStar技术,围绕多步生成+策略搜索两大关键方法,从而将模型的推理能力提高30分,使得百亿模型达到千亿模型的能力。 五、生产线大升级,用大模型重塑华为云服务 工欲善其事,必先利其器,华为云还用大模型重塑了其多条生产线。 在模型开发方面,华为云ModelArts studio大模型即服务平台支持便捷大模型开发与应用,通过0代码、免配置完成模型开发与微调,通过多模型智能路由降低模型调用成本超25%,沉淀50+智能代理,赋能RPA、政务、会议等多个方面的企业内部助手。 继去年接入大模型后,今年华为云通过结合AI Agent能力,将CodeArts软件开发生产线从单点智能升级到项目级智能。相比业界主流方案,CodeArts在问题定位率上提升了73%,项目级问题修复成功率提升了57%,让开发者能轻松实现项目级智能。 在数据治理方面,华为云DataArts数据治理生产线也实现升级,将盘古大模型和华为18年的数据治理经验相结合,一是将沉淀在企业海量数据中的业务规则、决策流程、行业经验发掘出来,形成企业知识湖;二是基于大模型,实现数据集成、开发、治理、分析等生命周期的自动化、智能化,从而降低智能化管数、用数的门槛。 在MetaStudio数字内容生产线方面,华为云将多模态大模型和生成式AI技术相结合,基于800多万小时的音视频数据和3000多万的3D资产,打造了盘古媒体大模型;将盘古媒体大模型和华为有深厚积累的音视频编解码、3D模型物理仿真等结合用于AI内容生成,突破了当前大模型不懂物理世界的局限。 在数据库方面,华为云将产品文档、专家知识、运维经验等数据库专业数据和大模型相结合,构建盘古数据库大模型,实现了GaussDB数据库的开发、测试、迁移、运维的全生命周期智能化,提升开发人员和DBA的使用效率。 在安全方面,华为云用盘古大模型升级华为云安全服务,打造了面向安全领域的盘古安全大模型,学习了华为云每年4500亿次攻击对抗的攻防经验,600多次的护网演练流程脚本,和400多个行业的攻击场景等数据,让华为云能够快速、精准的给出安全治理咨询的专业意见。 结语:华为云AI原生布局初现,盘古5.0将大模型深扎行业 今日,中国人迎来了自己的操作系统,纯血鸿蒙正式发布,与此同时华为鸿蒙原生智能的大招炸场,背后则是华为云盘古5.0大模型的硬核支持。 去年,华为云在盘古3.0发布时提出“不作诗,只做事”,今年随着盘古5.0的发布,华为云提出“不仅要做事,还要做最难的事”,从三大技术更新到行业大模型,从车间到工地,盘古大模型正在融入更多行业解决实际难题。 当下,如火如荼的“百模大战”拼价格、比参数、刷榜单,竞赛到了白热化阶段。但与此同时,大模型是不是同质化了、停留在GPT-3.5水平了?引起产业人思考。华为云为大模型的中国方案给出了新思路,通过与千行百业的实际问题结合,大模型有望在实践中迸发新的生命力。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。