行业分类:
加载中...
头条分类:
加载中...
美团回应“30万本科生送外卖”:任何骑手学历的总量数据都无事实依据
IT之家 7 月 10 日消息,美团今日通过“小团有话说”公众号对“丁 X 昭为什么送外卖”进行回应:近期,短视频账号“丁 X 昭频道”发布多条身着美团骑手工服的视频被广泛关注:视频中,丁 X 昭自述今年 39 岁,2004 年参加高考,是清华本科、北大与牛津双硕士、南洋理工大学博士,曾任新加坡国立大学博士后研究员,目前在送外卖…… 诸多名校光环与“骑手”身份形成反差,引发网友关注。 美团方面针对丁 X 昭的学历信息进行回应:关于学历信息,必须通过学信网、教育部留学服务中心以及海外高校等官方正规渠道才能查询到最准确的信息,故无法查证丁 X 昭所说是否真实。 美团还针对该骑手的跑单情况进行了详细核实。IT之家整理如下: 今年 2 月 15 日,丁 X 昭在福建厦门注册成为美团众包骑手,其所在区域为福建省厦门市内二区前埔众包。 截至目前,他分别于 2 月 16 日、2 月 20 日、2 月 21 日、6 月 9 日、6 月 11 日、6 月 13 日上线跑单,日均跑单约2小时,每天跑单量从 3 单到 10 单不等。 6 月 14 日上线拒绝一单随即下线,此后再无上线跑单记录。 4 个多月里,他一共送达 34 单,其中 26 单的配送距离在 2 公里以内,包括奶茶店、超市便利店、药店及多个餐饮商家订单,到账收入 174.3 元。 “丁 X 昭频道”账号发布了 49 条视频,有 19 条身着美团骑手服(7 条在会员区,需付费观看),多数视频将“39 岁男博士清华北大牛津毕业生”放在封面标题。其中,高考前后(6 月 8 日到 15 日),丁 X 昭密集发布了 13 条视频(包含会员专区),视频流量明显较日常视频暴涨数倍,账号置顶的两条视频主题为“高考要放平心态”“回应学历争议”,转发量均超 10 万。最新一条视频于 7 月 1 日发布在会员区,视频中他身穿骑手服,站在外卖取餐柜前谈“跑单经验”。 官方还表示: 丁 X 昭在视频中多次谈到“送外卖可以赚钱,还能做有氧运动,锻炼身体,挺喜欢的”“送外卖服务社会、养活自家、付出汗水、拿到回报,是不错的工作”。 丁 X 昭的视频爆火后,不少自媒体开始扩散“广州美团满员,历史上第一次,本科率接近 30%”“7 万硕士,30 万本科生在美团送外卖”等不实信息,也有人来问小团,到底有多少本科生 / 研究生 / 博士在美团送外卖? 小团在此一并澄清:学历情况需要骑手本人提交相关证书到学信网 / 教育部留学服务中心 / 海外高校的官方网站进行验证,任何关于骑手学历的总量数据都没有事实依据,是为博流量而随意推理并传播的虚假信息。 大家对骑手群体的关注,不妨聚焦在骑手友好社区、新职伤保障、养老保险补贴等方面,公司会不断完善相关举措,与社会各界一道,让骑手等新就业群体获得更多保障,也获得更多收入。
全国首个985高校开源鸿蒙微专业在华中科技大学落地
IT之家 7 月 10 日消息,深开鸿与华中科技大学 7 月 9 日共同举办“智能信息系统微专业(开源鸿蒙)共建启动仪式”,这标志着全国首个 985 高校开源鸿蒙微专业正式启动。 华中科技大学电信学院教学副院长梁琨教授,微专业负责人王邦教授,以及深开鸿高级副总裁、市场体系总裁解伟俊等人共同出席共建启动仪式。 IT之家注:微专业是指在现有本科专业目录以外,围绕某个特定专业领域、研究方向或者核心素养,提炼开设的核心课程群,通过灵活、系统的培养,使学生具备相应的专业素养和专业能力,提高学生知识结构的复合性,提升与社会需求的匹配度。 深开鸿与华中科技大学联合开设的智能信息系统微专业(开源鸿蒙),聚焦开源鸿蒙生态与 AIoT 前沿技术,通过模块化课程设计和实践导向的培养模式,旨在培养具备智能技术理论基础、开源鸿蒙系统开发能力,并能运用 AI、大数据等技术进行智能信息系统设计、开发与优化的复合型人才。 双方结合行业人才需求,以就业为导向,围绕开源鸿蒙技术及应用开设系列核心课程。课程涵盖操作系统、北向应用以及南向驱动开发方向,构建起完整且系统的知识体系;同时借助开鸿智慧全场景实验箱等实践平台,让学生在实际操作中快速掌握核心知识和技能,实现学以致用,培养出具备“开源鸿蒙 +”能力的高素质专业人才。 双方计划进一步深化合作,未来双方将共建“卓越工程师学院(开鸿班)”,推进卓越工程师联合培养,定向输送华科硕博高端人才。同时,双方还将推动华中区人才认证中心落地,辐射湖北及周边地区产业需求。
AI医疗建议可靠性存疑:MIT研究揭示用户提问方式影响AI判断
IT之家 7 月 10 日消息,随着生成式人工智能(AI)技术不断演进,其应用场景已从早期的简单问答扩展到更复杂的任务。然而,对于缺乏技术背景的用户而言,如何高效、准确地使用这些 AI 工具,正变得越来越具有挑战性。 一份独立报告显示,微软 AI 部门收到的用户投诉中,最常见的一条是“Copilot 不如 ChatGPT 好用”。对此,微软迅速回应,将问题归咎于用户“提示词工程能力不佳”。为改善用户体验,微软还推出了“Copilot 学院”,帮助用户提升 AI 使用技能。 IT之家注意到,麻省理工学院(MIT)的一项最新研究(via Futurism)表明,微软将问题归咎于用户提示词能力的做法或许并非全无道理。 该研究指出,过度依赖 AI 工具获取医疗建议可能带来危险。更令人担忧的是,如果用户在提问时出现拼写错误(如单词拼错或多余空格),AI 可能会因此建议用户无需就医。此外,使用花哨语言或俚语也可能导致 AI 判断失误。 研究还发现,女性用户比男性更容易受到此类错误建议的影响,尽管这一结论仍需进一步验证。 此次研究涵盖了多个 AI 工具,包括 OpenAI 的 GPT-4、Meta 的 LLaMA-3-70B,以及一款名为 Palmyra-Med 的医疗专用 AI。研究人员模拟了数千个健康案例,数据来源包括真实患者投诉、Reddit 上的健康相关帖子,以及 AI 生成的病例。 为测试 AI 的稳定性,研究人员在数据中加入了“扰动因素”,如句子首字母大小写不一致、感叹号、情绪化语言,以及“可能”“大概”等不确定表达。结果显示,这些扰动使 AI 建议用户“无需就医”的概率上升了 7% 至 9%。 研究负责人、MIT 研究员阿比尼塔・古拉巴蒂娜(Abinitha Gourabathina)指出:“这些模型通常是在医学考试题目上训练和测试的,但实际应用场景却相差甚远,比如评估临床病例的严重程度。我们对大语言模型的理解仍然非常有限。” 这一研究结果引发了对 AI 在医疗领域应用的广泛担忧。值得注意的是,就在不久前,微软刚刚宣布其新推出的 AI 医疗工具“准确率是人类医生的 4 倍,成本却低 20%”。微软 AI 首席执行官甚至称其为“迈向医疗超级智能的真正一步”。 然而,这项研究再次提醒我们,生成式 AI 在医疗等高度复杂的领域仍远未达到完全可靠的水平。尽管技术发展迅速,但在真正投入使用前,仍需更多验证与审慎评估。
微软裁员9000人后,高管称AI节省5亿美元成本
IT之家 7 月 10 日消息,微软首席商务官贾德森・阿尔托夫(Judson Althoff)本周在一次内部演讲中表示,人工智能(AI)工具正在显著提升销售、客户服务和软件工程等领域的生产力。据彭博社报道,阿尔托夫指出,AI 的应用成效显著,仅在呼叫中心,微软去年就节省了超过 5 亿美元(IT之家注:现汇率约合 35.91 亿元人民币)的成本。 这番话发布之际,正值微软刚刚完成今年第三轮裁员,裁员总数已超过 15,000 人,其中最近一轮就有超过 9,000 名员工被裁。这一背景下,阿尔托夫强调 AI 带来的成本节约,引发部分员工和外界的质疑,认为其言论显得“麻木不仁”。 此前,Xbox Game Studios 的制作人马特・特恩布尔(Matt Turnbull)在 LinkedIn 上发布了一条现已删除的帖子,建议因裁员而感到“不堪重负”的员工可以借助 ChatGPT 和 Copilot 等 AI 工具来缓解失业带来的心理压力。这一言论也引发了广泛争议。 目前尚不清楚今年被裁的员工是否被 AI 直接取代,还是属于疫情后企业结构调整的一部分。但可以肯定的是,在公司利润创下历史新高、市值逼近 3.74 万亿美元(现汇率约合 26.86 万亿元人民币)的背景下进行大规模裁员,确实在员工中引发了争议。 微软在 2025 财年第一季度实现了 260 亿美元的利润和 700 亿美元的收入,市值也在近期超越苹果,仅次于英伟达。公司此前已明确表示,将把大量利润投入到 AI 领域。今年 1 月,微软宣布将在 2025 年前向 AI 基础设施投资 800 亿美元。 尽管微软仍在招聘部分岗位,但公司似乎更倾向于将资源集中在 AI 高端人才的引进上。业内人士指出,未来微软更可能花费数百万美元争夺顶尖 AI 研究人员,而非中层管理人员或其他传统岗位员工。
当货拉拉面临AI转型,该如何做大数据存储?
文|白 鸽 编|王一粟 当月活千万的APP面临AI转型,该怎么做数据存储? 2013年成立于大湾区的货运物流App货拉拉,目前所积累的数据量已达40PB+,在整个行业中属于中等规模,“我们现在数据量增速也非常快,每一年还会增加几PB。”货拉拉大数据专家章啸说道。 如此庞大数据量,需要一个既能够稳定、安全,又能够提高读写能力的数据存储设施。 “自建的稳定性跟云的稳定性相比,还是差一些。”章啸说道,“所以我们现在基本99%的数据都存储在云上,不过也保留了一些自建的基础设施,属于自建+云服务的混合架构体系。” 货拉拉大数据专家章啸 混合架构增加了管理难度,所以找到一朵适合自己业务的云,更加关键。 一年多前,货拉拉将40PB+数据,进行了一次大规模云上迁移,最终迁移目的地,是腾讯云。 用章啸的话说,这次迁移可谓是“开着飞机换引擎”,但最终结果是好的,0故障完成了40PB+的大数据基建搬迁。 数据迁移一年后,依托腾讯云Data Platform数据平台解决方案,货拉拉实现货运报表产出提前40分钟,让任务提速10%。 而这离不开腾讯云Data Platform数据平台解决方案旗下的两个拳头产品:对象存储 COS、元数据加速器Metadata Accelerator。 随着AI大模型时代的到来,货拉拉也在积极拥抱AI,但又面临着新的难题——AI大模型所需要的海量数据频繁访问,拉低了整个数据访问的速度。 那么,AI大模型时代,货拉拉该如何面对海量数据爆炸式增长的挑战?这也是所有面临AI转型的公司们,共同的难题。 40PB+数据的云上迁移 开着飞机换引擎 12年时间积攒的数据量,货拉拉将其一次全部迁移到了腾讯云存储系统架构中,如此大规模的数据迁移,挑战相当大。 业内皆知,企业积累的海量数据,就是一座尚未被挖掘的“金矿”,数据不光要存起来,更重要的还要能用,才能够真正发挥数据的价值。 但往往在使用数据的过程中,一方面存在着数据误删、数据勒索、机房灾难等导致核心数据丢失的情况,另一方面,海量且持续增长的视频、图片等非结构化数据,也面临着存储成本增加、传统存储架构响应慢,难以满足企业实时调用等需求。 事实上,当前货拉拉业务规模已经达到超亿级文件数量规模,在此规模下,数据存储需要保障数据可靠性满足不丢失需求的同时,还需要实现业务高可用,满足任务执行期间业务不受损。 针对这些问题,货拉拉已经形成了自建+混合云服务的大数据存储架构。 在其大数据存储架构中,底层接入层是采集用户数据层,将数据采集之后针对不同时效性要求,会经过批处理和流处理等方式,写入到在线存储或提供给业务使用。 其中,批计算主要是处理永久存储在存储系统中的数据,流计算则处理实时生成的数据,“批处理的部分我们是部署在腾讯云上,其他的板块则在其他云上。”章啸说道。 另外,针对数据灾备可能出现的核心数据丢失问题,货拉拉打造了两套体系化的数据灾备架构: 一是元初-元数据管理平台,针对七天内被误删的数据,能够通过多层防护,快速恢复数据; 二是自研灾备系统Kirk,针对数据勒索和机房灾难,可实现PB级数据灾备,并全链路灾备; 基于这两套系统的能力,货拉拉可以实现数据误删的100%召回,核心数据 100%灾备。 “随着我们与腾讯云的深入合作,最终决定将整个40PB+规模数据都迁移到了腾讯云上。”章啸说道,“腾讯云Data Platform数据平台解决方案能够提供多种能力和服务,不过我们现阶段主要使用了底层存储和元数据加速能力。” 据章啸介绍,整个数据迁移大概分为几个步骤: 首先是基于Kirk系统和数据离线开发平台做数据迁移和任务迁移,会同时在两朵云中跑任务,跑完之后会自动进行数据对比,防止数据出错。对比的结果完成后给到业务做验收。 当整个数据验收能持续验收成功,会对整个开发平台做封网,在当天把整个链路跑完后,再次对比数据准确性,确保准确之后,再将所有系统全部切换,从而完成整个云的迁移。 “我们将数据迁移过来一年多,目前没有出现由于COS这种存储所导致的问题,真正做到了0故障率,整体的建立过程也非常平稳。”章啸说道。 AI时代数据大爆炸 存储的难题怎么解? 企业面临AI业务的转型,带来了许多对数据的新需求。 最近两年,货拉拉落地了许多新的AI业务板块。 “我们现在AI业务主要有ChatBI、AI客服等相关的内容,在AI方面目前跟腾讯合作的很深入。”章啸说道。 AI应用在进行模型训练时,对数据的调用需要有高吞吐、低延时。 这就带来了新的问题——AI数据和传统大数据混合。 “我们的数据都在腾讯云上,现在存在一些模型训练的任务,会把整个桶的下行带宽持续拉满,这样会对我们整个离线链路的稳定性有很大影响。”章啸说道。 企业传统业务的大数据存储计算需要高稳定性,而AI大模型的数据训练却需要高吞吐、大带宽,两个数据存储需求相互抢占资源,又该如何在一个系统架构中实现共存? “针对这些问题,我们也跟腾讯交流分享了几次,最后提出了分桶而治,专项优化的解决方案。”章啸说道,基于腾讯云对象存储COS,是在底层做了两个存储集群,即COS桶1和COS桶2: COS桶1,专做大数据存储,上层支撑整个大数据市场相关业务; COS桶2,则写入专做AI大模型训练的数据,上层对应整个AI项目; 基于此,“存储层按照应用拆分不同桶,仅迁移单个模型下行带宽下降8%。”章啸说道,“不过,我们也明显感受到AI业务对带宽吞吐的诉求要比大数据大的多,后续也会逐步把AI业务通过这样的方式迁移过来,再进行专项优化。” 在底层COS存储设立两个桶,虽然缓解了大数据和AI大模型数据在使用时对带宽需求的压力,但AI大模型数据存储桶自身,也仍面临着需要非常高的带宽吞吐能力。 针对这一问题,货拉拉正与腾讯云基于数据加速器GooseFS进行探索。 据介绍,腾讯云数据湖存储GooseFS可支持Tbps级吞吐、千亿级元数据规模、单链接速度轻松达到 GBps 级别,相比于行业内百兆级规模提升10倍,大模型分发效率10倍跃升。 而实现数据高速调用的背后,GooseFS主要是通过对数据的亲和力调度能力,将数据调度到跟计算相关节点更近的本地磁盘上,提供Tbps级的吞吐性能。 “我们用起来体验感最好的,就是GooseFS的元数据加速能力。”章啸坦言。 最后,针对跨云的问题,章啸也表示,目前基于COS的模式进行训练,可以实现按需配置,“数据将持久化存储在COS Data Lake中,训练数据按需通过GooseFS拉取到云上或者IDC计算端,做到一份Dataset,多地训练。” 可以看到,COS作为云存储底座,为货拉拉40PB+的数据提供统一存储池,能够提供安全稳定的数据存储能力,在大幅度提升系统可用性、可靠性等性能的同时,也还可以大幅降低存储成本。 而GooseFS则提供元数据的数据缓存加速服务,能够满足大规模数据处理和训练对高性能存储的需求,帮助货拉拉落地AI应用业务。 数据万象助力企业 释放数据价值 随着企业非结构化数据不断增长,带来了AI识别难,处理速度慢等新难题。 为了让数据的价值能够释放,需要在存储端就开始做预处理。 而腾讯云数据万象,能够有效帮助企业解决这一问题。数据万象,主要包含两个功能,一个是数据管理Metalnsight,一个是数据处理Data Engine。 Data Engine,就是数据处理,把计算下沉到存储端,提供大量标准化的图片、音视频的处理能力。比如小红书用户上传图片,它能在数据层就把图片进行压缩+裁剪+上水印,在图片质量不受损的情况,提升图片访问性能,保护知识产权。 MetaInsight,通过智能检索能力为客户提供一种高效的数据管理服务,它能让用户使用自然语言快速检索海量非结构化数据(图片、音视频等)。比如网盘、手机相册中的“以文搜图”,之前找照片只能按时间一张张找,现在可以输入关键字直接搜到。 举个例子,在电商商品搜索中,基于MetaInsight的以图搜图功能,用户在上传商品图片后,系统通过特征提取与索引库中的商品图进行相似度对比,快速返回同款或相似款商品信息,解决传统关键词检索的局限性。 而在AI大模型训练场景中,MetaInsight 可对海量非结构化数据进行智能预分类,通过语义检索(如输入“雨天”“行人穿行”)快速筛选特定场景数据。相比人工标注,该方案能减少70%以上的预处理时间,同时支持跨模态检索(如图像+文本描述),帮助企业在数据清洗阶段高效构建高质量训练集。 “因为非结构化数据的日益增长,云存储平台一定要有向量化的能力。”章啸说道,“数据万象CI,就可以很好的提升对非结构化数据的管控。” 可以看到,AI大模型时代,存储不再是之前只做数据的仓库,而是结合一系列数据处理和计算的能力,成为了数据加速运转的新引擎。
2025福布斯中国最佳CEO榜单公布,腾讯马化腾、小米雷军、比亚迪王传福等入选
IT之家 7 月 10 日消息,2025 福布斯中国最佳 CEO 榜单于今日正式发布,今年一共有 25 位 CEO 首次入选,19 位 CEO 蝉联榜单席位。此外,更年轻的 80 后 CEO 人数也在本届榜单中达到了创纪录的 9 位,是两年前的三倍。 本届榜单中,50 位 CEO 所带领的公司在业绩考核期内股价平均上涨 79%,最近财务年度的净利润平均增长率也超过了 50%。 从股东回报角度看,今年最能代表阿尔法收益的 CEO 是来自于泡泡玛特的王宁。与其去年首次上榜时相比,泡泡玛特的净利润再增 3 倍达到 34 亿人民币,股价则翻了 9 倍,公司总市值跨上 3000 亿人民币大关。中国文创与 IP 经营公司们正值业绩爆发关键期,光线传媒王长田、阅文集团侯晓楠也于今年首登福布斯中国最佳 CEO 榜单。 除王宁外,今年的福布斯中国最佳 CEO 榜单还有 18 位连续入选者,其中包括小米集团雷军、美的集团方洪波、中微公司尹志尧等。 IT之家注意到,作为榜单“常客”的王传福已连续第五年蝉联“最佳 CEO”头衔。在他的带领下比亚迪还在加速向前:2025 年一季度,比亚迪实现了 1703.6 亿元人民币营收,同比增长 36%;归母净利润达到 91.6 亿元,创下单季盈利纪录。 今年榜单中一个最突出的变化是消费领域企业家的集体崛起,其中包括:老铺黄金徐高明、蜜雪集团张红甫、霸王茶姬张俊杰、古茗王云安等。他们都在过去一年里接连完成了规模不凡的 IPO,最终推动消费类 CEO 人数跃升至 9 位,霸王茶姬的张俊杰亦成为了本榜单 21 年历史上的首位 90 后入选者。 此外,今年消费科技领域也有更多明星经营者涌现,其中包括瑞声科技潘政民与九号公司王野等。王野对福布斯中国称:“科技公司持续高增长的最大保障是依靠领先的技术,去开拓今天看似不存在的市场。” 今年共有 6 位企业家重新回归“福布斯中国最佳 CEO”队列,马化腾是最重磅的一位,距离其最近一次入选已时隔 4 年。在本届榜单的考察期内 (2023 年 5 月 30 日至 2025 年 5 月 30 日),腾讯股价上涨 51.8%;最近一个财务年度的归母净利润大涨 68%,达 1940.7 亿元。 2025 福布斯中国最佳 CEO 完整名单:
年费超 2 万!马斯克刚刚发布最贵 AI ,Grok 4 号称所有领域碾压博士
马斯克憋了快半年,终于把 Grok 4 端上了台面。 这一次,他的口气依旧不小。早在发布会前就放出狠话,声称 Grok 4 要「重写人类知识库」。等到了发布会上,马斯克再次强调 Grok 4 是目前世界上最聪明的 AI。 可以,熟悉的味道,熟悉的配方。 当然,马斯克夸自家产品这事儿,大家早就见怪不怪,但正如网友所调侃的那样,你可以嘲笑 xAI 员工在办公室帐篷里睡觉或者周末工作到凌晨 4:20,但也得承认,他们的确是当下发展速度最快的 AI 实验室之一。 至于 Grok 4 能不能配得上「最聪明 AI」的称号,还得看后续的实际体验。不过,有一点是跑不了的——它已经成了市面上最贵的 AI,年订阅价格最高可达到 3000 美元,定价策略可谓是相当不讲武德。 世界上最聪明的 AI?世界上最贵的 AI! Grok 的训练路径分为两个核心阶段:预训练与强化学习。从 Grok 2 到 Grok 3,主要依赖预训练方式;而从 Grok 3 升级到 Grok 4,则大幅引入了以推理能力为核心的强化学习训练。 马斯克说得轻描淡写,但训练的动静却不小。 相比 Grok 2,Grok 4 的训练计算量提升了整整两个数量级,相当于增长了 100 倍——而且还在持续扩张。 马斯克表示,Grok 4 已在所有主要学科上超越博士水平。虽然它目前尚不具备发明新理论或提出原创技术的能力,但在他看来,这只是时间问题。 他甚至语言,今年底 Grok 可能就能发明新技术,明年几乎可以确定将具备发现新物理规律的能力。 当然,让 AI 接入现实世界,才是真正的关键。 他表示,Grok 与人形机器人 Optimus 的结合,将形成一个闭环推理系统——提出假设、验证假设、探索现实。这将开启一个智能大爆炸的时代,是人类历史上最令人激动的节点。 在产品形态上,Grok 4 是单智能体模型,而 Grok 4 Heavy 则是多智能体版本。 前者比较好理解,而后者则支持多个智能体并行思考,在推理过程中横向比对、纵向协同,调用更大规模的计算资源以完成更复杂、更精密的任务。 在现场演示中,Grok 4 Heavy 展示了多个场景能力。 比方说,让 Grok 4 Heavy 去预测今年 MLB 世界大赛(World Series)的冠军概率,它通过信息检索、数据建模、概率计算,评估洛杉矶道奇队的夺冠概率为 21.6%,并在 4.5 分钟内完整输出预测过程。 再比如,一个看似无厘头的任务:找出 xAI 团队里头像最奇怪的那一个。依托 X 平台的资料库,模型自动抓取并分析头像风格,最后锁定了联合创始人 Greg Yang。 有趣的是,虽然模型准确理解了「奇怪」这一主观概念,并能在同类中做出相对判断,但在一滑而过的演示中,我似乎看到了 Anthropic 员工 Jan Leike 的头像,看来准确率也有待提高。 除了推理和搜索,Grok 还能生成内容时间轴。 比如,根据 X 平台上的公开发帖,它能梳理出多个 AI 模型的基准测试成绩、厂商更新节奏以及社区反应。用户可以一目了然地看到 OpenAI 的分数表现、Gemini 的更新迭代,甚至是模型之间的微妙竞争态势。 换句话说,Grok 不是只会考试的书呆子,而是真正具备跨场景理解与执行能力的 AI。 目前,Grok 最大的短板依然集中在多模态理解能力,尤其是在图像理解和生成方面,能力仍有待加强。好消息是,下一阶段的基础模型训练已经在路上,预计几周内完成。 演示过程中,在测试「两个黑洞相撞过程」的可视化任务时,Grok 采用了简化的计算方式——使用后牛顿近似(Post-Newtonian approximation)替代完整的广义相对论框架。 尽管存在简化,模型依然准确地呈现了黑洞并合的关键物理阶段,包括「螺旋接近」、「合并」与「振铃阶段」,并能清晰说明所采用的近似方法。此外,它还调用了相关教材、公开搜索结果及实际物理常数进行推理支持,整体逻辑链条严谨、解释清晰。 就纸面参数而言,Grok 4 也交出了亮眼答卷。 Humanity’s Last Exam(人类最后的考试,简称:HLE,)覆盖了数学、物理、计算机、医学、人文社科等超过 100 个学科,共 2500 道闭卷题,测试难度极高,能够真实反映模型在通用知识和复杂推理上的综合表现。 根据 xAI 数据,Grok 4 在不使用任何工具的情况下,得分为 25.4%,超过了 Google Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高配版)的 21%。 而在使用工具的情况下,Grok 4 Heavy 的得分达到 44.4%,远高于使用工具后 Gemini 2.5 Pro 的 26.9%。从整体趋势来看,Grok 4 在扩展训练资源的同时,通过引入工具使用和链式思维,不仅提升了复杂任务的处理能力,也逐步缩小了模型智能与通用认知之间的差距。 非营利组织 Arc Prize 也指出,Grok 在其 ARC-AGI-2 测试中创下新纪录。这是一项视觉推理类基准测试,AI 需识别图像中的模式。Grok 的得分为 16.2%,几乎是当前排名第二的 Claude Opus 4 的两倍。 面对一些常规的基准测试中,Grok 4 Heavy 的分数几乎也快「刷满」分数。在博士级难度的问题集 GBQA 中,尽管整体难度略低于 HLE,Grok 4 Heavy 依然取得了满分成绩,展现出极强的推理与理解能力。 不仅如此,在多项编程相关测试中,Grok 4 Heavy 的表现同样抢眼。无论是 Live Coding、HMMT(麻省理工数学竞赛)还是 USAMO(美国数学奥林匹克),它都远超当前排名第二的模型,技术优势相当明显。 另外,知名分析机构 Artificial Analysis 通过对多款主流大模型在 7 个推理相关基准(MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME、MATH-500)上的综合表现进行评估。 数据显示,Grok 4 位列第一,得分为 73,是目前推理能力综合得分最高的模型。紧随其后的则是 o3-pro(估算值)71 分。 马斯克也强调: 「未来 Grok 将几乎在所有考试中答对每一个问题。而当它答不出某个问题时,它会指出题目的错误之处,或者指出问题含糊不清的地方,并给出不同情境下可能的答案。到那时,传统考试将失去意义。AI 唯一的检验标准将是现实世界:它是否能发明有用的技术,是否能推动科学的突破。所以 HLE 这类测试题库必须尽快更新,因为以当前的 AI 进展速度,它们很快就会过时。」 截至发稿前,Grok 4 和 Grok 4 Heavy 目前均已陆续上线。 目前,Grok 4 和 Grok 4 Heavy 已全面上线。用户可以通过订阅访问,不过,订阅价格就有点「不讲武德」,最高可去到 3000 美元/年档位,成了不少用户吐槽的焦点。 这么一比,OpenAI 、Anthropic 以及 Perplexity 的 200 刀/月套餐都显得实惠许多。 值得一提的是,发布后不久就有网友表示,Grok-4 与 Grok-4-Heavy 模型已经被成功「越狱」。越狱后的能力极其危险,可绕过安全护栏,输出敏感或非法信息,比如化学武器合成步骤、《星球大战1》的完整剧本(涉嫌版权)、甚至勒索病毒(恶意代码)等。 不只会说话,Grok Voice 还有了「灵魂」 除了更强的推理能力,更聪明,Grok 4 这次也在「更像人」这件事上,迈出了一大步。 跟我们熟悉的语音助手不同,xAI 全新语音助手「Eve」不只是能答话,它能表达情绪、有语调变化,甚至还能现场「唱歌」。 在直播现场的演示上,它用一口优雅的英音,唱了一首即兴创作的「Diet Coke 咏叹调」,「O Diet Coke, thou elixir divine…」听起来真的不像是 AI,像是伦敦剧场里的舞台演员在表演。 这次语音模型一共上线了五种声音,包括直播开场的「电影一般的预告男声」Sal,以及支持低延迟、自然停顿、情绪起伏等能力的 Eve。 现场还安排了一段和 ChatGPT Voice 的对比演示,两者轮流复述数字。ChatGPT 时不时「抢答」,有点像没听清就硬接话的同学。而 Grok 的表现更流畅、更贴近人类说话习惯,而且不会打断用户说话。 发布会上提到,自语音模型上线以来,Grok Voice 的端到端延迟缩短了两倍,活跃用户也增长了 10 倍。Grok Voice 正在迅速发展。 马斯克:让 Grok 去开一百万个自动售货机赚钱 几个 Grok 4 API 的应用场景让我印象非常深刻。 比如,在一项自动售货机商业模拟 Vending-Bench中,Grok 被要求自主完成:供应商协商、库存管理、定价策略,连续完成并长期保持盈利。 ▲注:Vending-Bench 是一个专门设计用于测试基于 LLM 的代理,在管理一个简单但长期运行的业务场景中的能力:运营一台自动售货机。 测试结果显示,Grok 4 不仅登顶排行榜,而且它所获得的净资产是其他模型的两倍。连马斯克都开始调侃说:「以后买显卡的钱,可以让 Grok 去部署运营一百万个自动售卖机赚回来」。 在科研领域,Grok 4 已被用于 CRISPR 基因研究和胸片 X 光分析。它能在几秒钟内读完几百万条实验记录和日志,自动筛出最有可能成功的假设。 此外,像是金融领域、游戏开发等项目,都可以通过 xAI API 来使用 Grok 4 来实现。发布会上特别提到了一个游戏设计师,他在 xAI 发布了 Grok 4 预览 API 后,就立刻参与测试。然后,他花了短短 4 小时就做出了一个第一人称射击游戏。 Grok 4 不是终点。发布会最后预告了接下来的路线图,每一项都非常值得期待。 代码模型:这次竟然没有发布 Grok Code,不过 xAI 提到正在训练了,一个「又快又聪明」的代码模型将会在几周内上线。 多模态能力:Grok 4 在图像理解上表现依旧是有限,团队也说正在以更大规模训练下一个版本,预计会在图像、视频和音频理解上迎来质变,到时 Grok 将能「像人类一样看世界」。 视频生成:xAI 说将使用大规模的算力资源,进行视频生成模型的训练。他们的最终目标是做到图生视频,生成可交互的「无尽视频流」,让用户能边看边参与剧情走向。 可能有不少朋友已经发现,这次发布会还有两个熟悉的华人面孔。他们正是 xAI 的联合创始人——吉米·巴(Jimmy Ba)和吴宇怀(Yuhuai Wu)。 其中,吴宇怀(Yuhuai Wu)本科以满绩点毕业于加拿大纽布伦斯威克大学,并在 2021 年获得多伦多大学机器学习博士学位,期间曾师从「深度学习之父」杰弗里·辛顿。 博士阶段,他还曾在 Google DeepMind 和 OpenAI 实习,毕业后在 Google 任职,并在斯坦福大学从事博士后研究。 吴宇怀的研究重点是打造具备强推理能力的人工智能系统,先后主导或参与了自训练推理模型 STAR、语言模型 Minerva 以及定理证明器 Alpha Geometry 等项目,并在《Nature》等顶刊上发表论文,推动 AI 在数学推理领域实现突破。 ▲ 吴宇怀(左二)和吉米·巴(左三) 坐在他身旁的吉米·巴(Jimmy Ba)则是多伦多大学计算机科学系的助理教授,也是吴宇怀博士时期的导师之一。 他同样出身于辛顿门下,是深度学习训练优化领域的关键人物。 最为人熟知的,是他与合作者共同提出了 Adam Optimizer(自适应矩估计优化器)——如今几乎成为深度神经网络训练的默认算法。可以说,他的博士论文为现代 AI 训练机制奠定了坚实理论基础。 不得不说,Gork 4 的到来适逢其时。 前代 Grok 3 的热度来得猛,退得也快。 根据知名市场分析机构 SimilarWeb 发布的截至 5 月 9 日的《2025年全球生成式AI行业趋势报告》,Grok 从三月流量暴涨超 100 万倍,到五月增幅跌回 5200%。 相比前代仓促上线、草草交卷的节奏,这次的 Grok 4 明显放慢了脚步,在产品打磨上也更下功夫。归根结底,马斯克的光环可以帮 Grok 带来第一波流量,但能不能留下用户,还得靠模型本身的硬实力。 只不过,我没记错的话,马斯克当初在 Grok 3 发布时,还信誓旦旦说要把 Grok 2 开源。眼看五个月过去了,这事儿却毫无动静,这次发布会上也没再提半句。 老马啊,可不能宽于律己,严以待人呀。 作者:张子豪、莫崇宇
马斯克推最强Grok 4!人类终极测试干翻OpenAI,包月费超2千元
作者 | 李水青 编辑 | 心缘 智东西7月10日报道,今日,马斯克的AI公司xAI发布其最新旗舰大模型Grok 4和多智能体版本Grok 4 Heavy,并推出史上最贵的每月300美元(约合2153元人民币)的AI订阅计划Super Grok Heavy。 在“人类的最后考试”(Humanity’s Last Exam)中,Grok 4在无需“工具”的情况下取得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%。 配备“工具”的Grok 4 Heavy获得44.4%的得分,优于配备工具的Gemini 2.5 Pro的26.9%。 ▲Grok 4在Humanity’s Last Exam测评中取得第一 “就学术问题而言,Grok 4在各个学科上都比博士水平高,无一例外。”马斯克在直播中说,“有时,它可能缺乏常识,而且它还没有发明新技术或发现新的物理学说,但这只是时间问题。” ▲埃隆·马斯克在直播中发言 xAI还推出了迄今为止最昂贵的AI订阅计划——每月300美元的Super Grok Heavy。订阅者可以抢先体验Grok 4 Heavy,并抢先体验新功能。这些新功能包括但不限于:将于8月推出的AI编码模型,9月推出的多模态智能体,以及10月推出的视频生成模型。 ▲每月300美元的Super Grok Heavy正式推出 直播结束后,马斯克在X上发文称:“你可以将整个源代码文件剪切并粘贴到Grok上的查询输入框中,然后@Grok 4 会帮你解决,比Cursor更好用。” ▲马斯克在社交平台X上发言 除此之外,xAI推出了Grok 4 API。xAI的企业部门仅成立两个月,但它计划与超大规模企业合作,通过其云平台提供 Grok。 近几个月来,xAI不仅拿下100亿美元最新融资,还收购了社交平台X,这也让最新推出的Grok 4成为产业的关注焦点。Grok 4能否成为对打OpenAI计预告今夏推出的GPT-5的有力对手?让我们来一起先睹为快。 一、Grok 4测评赶超OpenAI o3,马斯克:科研能力强过人类博士 马斯克在直播中称,在人文、语言、数学、物理、工程等多个基准测试中,Grok 4都取得了好成绩。“有些人认为AI不能推理,但Grok 4的推理能力可以超越人类水平,比几乎所有学科的研究生同时都聪明。”马斯克说。 xAI的研究人员称,Humanity’s Last Exam测试极具挑战性,总共有2500个问题,包括数学、自然科学、工程以及所有人文学科,问题广泛且都是博士甚至高级研究水平,Grok 4在这些问题上可以得到很好的分数。 Grok 4在无需“工具”的情况下,在“测试中获得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%。马斯克称,在学术问题方面,Grok 4比每个学科的博士水平都要好,现在没有例外。他预测Grok 4最快今年就能去发明新技术了,两年之内就能发现新物理学说。 在GPQA、AIME25、LCB(Jan-May)、HMMT25等多项测评中,Grok 4都超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等模型。 而在ARC-AGI-2测试中,Grok 4取得了新的最高得分,得分为16.2%。ARC-AGI-2测试是另一项高难度基准测试,包含类似谜题的问题,要求AI识别视觉模式。Grok的得分几乎是排名第二的商业AI模型Claude Opus 4得分的两倍。 二、训练量级达到Grok 2 100倍,Grok 4将与人形机器人互动 从Grok2到Grok 4,每一次迭代xAI都增加了一个数量级的训练,因此Grok 4的训练量级达到了Grok 2的100倍,这使得智力增长非常显著。 这是xAI第一次像预训练一样扩大训练规模。基于拥有10万块H100 GPU的超级算力中心,训练主要包括两种类型:一个是从Grok 2到Grok 3到的预训练,一个是从Grok 3到Grok 4在推理中投入了大量的算力。 谈及幕后,如图所示,当投入越来越多的训练算力,模型开始逐渐变得越来越聪明,最终在没有任何工具的情况下,解决了四分之一的Humanity’s Last Exam测试问题。 接下来研发人员做的是向模型中添加工具功能。与Grok 3不同的是,研发人员使其更加本地化,将工具放入训练中,从而显着提高了模型使用这些工具的能力。 马斯克透露,今年晚些时候,Grok 4还将融合有限元分析、计算流体动力学等更强大的工具进行训练,将打造非常精确的物理模拟器,比如去做提供精确的黑洞模拟等任务。最终,Grok 4最大的区别在于,其将能够通过人形机器人(如擎天柱)与现实世界互动。 马斯克说,我们正处于智能大爆炸的开端。我们需要确保AI是一个好的AI,安全最重要的事,AI需要最大限度地寻求真理。你可以把AI看作是超级天才的孩子,最终会比你聪明,但你仍然可以灌输正确的价值观并鼓励它长成想要的样子。 除了计算之外,还有一个技术问题是数据瓶颈。研发人员称,在强化学习训练过程中,他们实际上已经没有可用来测试的问题了,已有的问题对AI来说正在迅速变得微不足道。 但马斯克称,最能出色判断事物的就是现实。如果物理学是定律,最终其他一切都是建议。你不能打破物理。因此,我认为对于AI的最终测试是现实。就像你发明一项新技术,比如改进汽车或火箭,它有效吗?现实才是最终的裁判。所以这将是一个围绕现实的强化学习闭环。 三、现场演示:看论文进行现实模拟,语音模式延迟减少一半 xAI研究员在直播中演示了Grok 4回答问题的能力。 Grok 4的一大特点是能够理解世界,并通过利用工具来解决难题。比如要求Grok 4生成两个黑洞碰撞的可视化图像,它有一些清晰的思考过程,比如,为了让它真正可见,Grok 4考虑到通过海浪的形式扩放它的规模。从思考过程看,Grok 4使用了搜索,从一堆链接中收集结果,参考了现有的现实世界数据,而且还阅读了分析引力波模型的本科论文。 除此之外,xAI还演示了Grok 4解答数学问题、创建一个基于X个帖子的时间线、查看Humanity’s Last Exam测试成绩等问题。 在多模态测试方面,Grok 4分数略有下降。马斯克坦言,Grok 4的基本弱点是它部分盲目地理解图像生成偏好。Grok 4的多模态理解能力正在改进,这些问题将在几周内实现改善。 Grok 4的语音模式也进一步更新,已将延迟减少了一半。Grok 4今天推出一系列更具自然性和韵律的新声音,API版本也将发布。 四、推出Grok 4企业API,编程、多模态、视频模型在路上 xAI的企业部门仅成立两个月,但它正在通过其API发布Grok 4,已有各行业企业通过云平台使用了Grok 4。 聚焦现实的自动售货机商业场景,xAI的客户团队采用了大模型管理库存、联系供应商,大多数模型在去进行长线任务时都很困难。但使用了Grok 4 API之后,团队获得了令人印象深刻的结果。它设法运行模拟的时间翻了一倍,得分也翻了一倍,前后能保持较强一致性。 聚焦AI创作游戏方面,Grok 4可以在4个小时内制作的第一人称射击游戏。制作游戏并不一定是对游戏的核心逻辑进行编码,而是去寻找所有资源、文件素材,以创建一个具有视觉吸引力的游戏。对于开发人员来说,你可以专注于核心开发本身,让Grok 4去整理所有资产,自动化完成任务。 未来Grok 4将具有出色的视频理解和改进的工具使用能力,例如可以使用虚幻引擎生成艺术品模型,然后创建一个可在PC或手机上运行的可执行文件。xAI预计第一个真正优秀的AI视频游戏将在明年出现。 除此之外,马斯克透露,团队目前正在加大力度训练编码模型,在未来几周内将推出一个专业的编码模型。编码任务展现了Grok 4的弱点,即多模态能力。就像透过玻璃眯着眼睛看世界,看到所有模糊的特征,并试图感知它。xAI将在下一代模型中看到的最直接改进是,模型在理解图像和音频方面会能力逐步提高。 在视频模型方面,xAI将在接下来三到四周开始训练一个新的视频模型,具备出色视频生成和理解能力。 结语:抢发Grok 4,马斯克对战GPT-5 Grok 4在高难度测试中展现的“超越博士水平”的推理能力,在理解和解决复杂问题方面迈出了关键一步。其通过工具加持实现的新能力,以及雄心勃勃的多模态与视频生成路线图,展现了xAI与即将发布的OpenAI GPT-5竞赛的决心。 在To B端落地,xAI正加速将Grok 4的能力从企业应用到零售、游戏创作等领域。同时,马斯克强调的“安全至上”与“寻求真理”的AI发展原则,以及对现实世界作为最终测试场的认知,为这场席卷全球的智能爆炸提供了不可或缺的思考维度。
IDC:联想二季度PC出货量同比增长15.2%,市占率创历史新高
凤凰网科技讯 7月10日,IDC最新发布的《全球季度个人计算设备追踪报告》显示,2025年第二季度全球PC出货量达6840万台,同比增长6.5%,延续了市场回暖趋势。联想以1697万台的出货量和24.8%的市场份额位居全球首位,同比增长15.2%,增速显著超越行业平均水平。 数据显示,联想的市场份额较去年同期提升近2个百分点,创下历史新高。相比之下,排名第二的惠普出货量为1410万台,同比仅增长3.2%,市场份额为20.7%,较去年同期下降0.7个百分点。戴尔位列第三,出货量980万台,同比下降3.0%,市场份额为14.3%,同比下滑1.4个百分点。 IDC全球移动设备追踪部门研究副总裁让·菲利普·布沙尔表示,尽管美国市场因关税政策面临需求放缓压力,但全球其他地区需求依然旺盛,旧设备更新换代与Windows 11系统升级潮共同推动了市场增长。 联想在全球供应链管理方面的优势日益凸显。在权威机构Gartner发布的Top 25全球供应链排名中,联想位居第八,较去年提升2位,超越沃尔玛、宝马等跨国企业,成为唯一入榜的亚太高科技制造企业。 分析认为,联想的强劲表现得益于其“中国+N”的全球化制造布局和端到端业务模式。该公司在全球180多个国家和地区开展业务,建立了完善的销售渠道和服务网络,能够有效应对复杂多变的全球贸易环境。 在产品创新方面,联想持续推出AI PC等具有差异化优势的产品,满足消费者日益多样化的需求。同时,其高效灵活的供应链体系确保了产品的稳定供应和及时交付。
Grok4王炸,马斯克请保护好身边那俩华人
硅谷AI界真的要被华人占领了。 今天xAI开发布会,直接跳过Grok 3.5,发布Grok 4。 从现场介绍来看,这个新的旗舰模型是各种强强强——上下文窗口25.6万tokens,推理能力是前代的10倍,支持文本、图像、视频等,主打一个多模态全面发展。 在现场,xAI抛出一个又一个眼花缭乱的成绩:Grok 4每次都能拿美国高考SAT满分、 在HLE(Humanities Last Exam,人类最后的考试)中不使用工具也能拿到26.9%…… 马斯克大赞,这是“世界上最好的AI”,还自信地表示,这个模型今年就能实现科学新发现。 而坐在马斯克身边的,又是两位华人。不同于OpenAI发布会往往一人一段轮流讲的风格,xAI发布会上三个人互相接话,更像是一场既有脚本又有思维碰撞的新品讨论会。 其实今年2月的发布会,也是他俩和马斯克排排坐。 其中戴眼镜、坐在C位的是吴宇怀,蓄胡子的是Jimmy Ba。这两位华人均是xAI的创始团队成员。 有意思的是,Jimmy Ba还是吴宇怀的导师。 吴宇怀是出生于杭州建德的“95后”,今年刚满30岁。在杭州新安江一小和紫阳小学、杭州建兰中学读完小学和初中之后,就远赴加拿大读高中。 他从小就性格温和,醉心数学。这一点没变过,到现在他在X平台上的置顶消息依然是“解决数学问题,理解宇宙本质。” 2015年,吴宇怀以满绩点成绩自加拿大纽布伦斯威克大学毕业。随后他在多伦多大学攻读机器学习博士,于2021年取得学位,期间曾接受“深度学习之父” Geoffrey Hinton的指导。读博阶段,他先后在 Google DeepMind与OpenAI实习,博士毕业后加入 Google 研究院,并于斯坦福大学从事博士后工作。 2023年7月xAI成立时,吴宇怀以联合创始人的身份加入。 正是在吴宇怀在多伦多大学读博的时候,Jimmy Ba曾是他的导师之一。吴宇怀在博士论文《Neural Networks for Mathematical Reasoning(用于数学推理的神经网络)》的致谢中专门写道:“我想感谢我的博士联合导师Jimmy Ba……” Jimmy Ba是80后,关于他早年个人信息,公开资料中涉及较少。可以确认的是,他分别在2011年和2014年拿到多伦多大学的硕士与博士学位。也曾师从“AI教父”杰弗里·辛顿。 在谷歌学术中,他的论文过去五年被引用22万次之多,是当之无愧的学术大牛。其中2014年的论文《Adam: A Method for Stochastic Optimization》更是“爆款”,和 Diederik P. Kingma联合提出的‌ Adam已经是目前深度学习工作流默认引用的优化算法之一,几乎所有模型论文都会点一次名,在计算机视觉、自然语言处理等领域被广泛应用。 Jimmy Ba也因此在2025年获得ICLR时间检验奖。ICLR“时间检验奖”专门颁给10年前发表、仍在深度学习界持续产生核心影响的论文,目前只颁发过两届,含金量极高。 说起来也是很凑巧,距离马斯克官宣xAI“天团”过去整整两年了。 2023年7月公布的初创团队中包含12个人,其中5位都是华人。除了吴宇怀和Jimmy Ba,还有: 杨格,本科、硕士均毕业于哈佛大学数学系,曾在微软雷蒙德研究院当研究员。 戴子航,本科毕业于清华,硕士和博士毕业于卡耐基梅隆大学,曾是谷歌的高级研究员。 张国栋,本科毕业于浙江大学,多伦多大学博士,在进入xAI之前,曾在谷歌和DeepMind工作。 最近Meta抢人“抢红了眼”,用OpenAI CEO奥特曼(Sam Altman)的话说就是进别人家抢劫。 Meta已经抢了谷歌、Anthropic、OpenAI,这几天还把苹果负责基础模型的华人高管Rouming Pang也抢走了。 为了这场“豪夺”,Meta的CEO马克·扎克伯格(Mark Zuckerberg)亲自下场,开出四年3亿美元的薪酬,部分人甚至第一年的薪酬就高达1亿美元。 Meta目前公开的“抢”来的14个人里有9个人都是华人,而且几乎都不是在美国本土长大的,而是在中国出生、长大,而后到国外深造。这样的人才,xAI里面可不少。 很好奇小扎什么时候才能闯进xAI家里抢劫。 毕竟两年过去,xAI创始团队里的这5个华人仍然在xAI效力,在抢人大战一直很激烈的硅谷,这可以算是名为“超稳定”的战绩了。 再加上小扎和马斯克已经不对付好多年了,要是真抢到马斯克头上,恐怕又是一场腥风血雨。
Manus肖弘“超级激进”
一直留恋武汉的Manus,突然一步就迈出了中国。 “没人会比创始人肖弘更舍不得离开武汉。”Manus前员工曾正(化名)告诉字母榜,在武汉就读大学,在武汉开始创业的肖弘总给人一种不疾不徐的感觉,武汉这座常年处在夏季、通勤时间能缩短到半小时的城市,也有着区别于北上广深的生活气。 在2022年前后,彼时肖弘仍为自己的Monica寻求投资时,有一线的风投基金告诉AI科技评论,他们最终拒绝给Monica一份TS,原因是Monica是一个面向海外市场的浏览器插件,肖弘却不愿意搬离武汉。“想要做一家海外公司,第一步是要搬到北京,第二步是要搬到海外。海外市场要做大就要拿到美国的钱,我没法想象创始人在武汉怎么做(海外市场)。” 而在今年6月,Manus宣布总部前往新加坡,开启全球化进程。在6月20日前后,在新加坡开始出现Manus的广告牌,当地的程序员、工程师们被Manus的猎头接触,“他们现在在新加坡规模很小,公司的位置在city hall附近,只能说离CBD比较近,目前还在大量招人。”在新加坡工作的林芳(化名)告诉字母榜。 在新加坡,Manus为人工智能工程师和数据科学家开出每月 8000 至 16000 美元的薪资,“在新加坡,有些经验的程序员和产品经理差不多就是这个价。”薛芳补充到,Manus的薪资诱惑力不足,这也是她在被Manus的猎头接触后并未考虑更换工作的原因之一。 图注:Manus 广告牌 图源:Isaac拍摄 曾正(化名)告诉字母榜,包括他在内,不少包括产品设计等偏业务支持属性的员工拿到了赔偿,在离开Manus后也都顺利入职了新公司,“Manus名气在外,比较好找工作。”曾正补充道。 面对字节等大厂的竞争,肖弘在接受腾讯科技的采访中曾表示,创始人必须要持续创新,不仅要提前,而且“当你意识到你提前(领先)的时候,(就应该)更激进,超级激进”。 拿到Benchmark投资的肖弘如今激进一跃,跳上了全球化这艘船,但前方风急浪大,未来难以预料。 在接受腾讯科技的采访,回答全球范围内一道最喜欢的食物时,肖弘的回答是“热干面”。 出生在江西的肖弘,自从升入位于武汉的华中科技大学完成大学学业后,就似乎再未离开武汉。这也是肖弘与其他AI初创企业的不同。在AI六小龙将公司选定在北上广深时,只有肖弘对武汉“恋恋不舍”。 即便今年3月6日爆火、一码难求时,肖弘在北京的分公司选址在海淀人工智能创新街区的epark(花园路社区)。当字母榜7月10日进入这所共享办公区时,发现不少公司都仅有3-4个格子间作为办公场所,Manus在北京工区的规模并不大。 在公司里,肖弘呈现出一股低调、谨慎的风格。“刚来公司的时候,一开始都没认出来肖弘是老板,每天就是穿着T恤,”曾正告诉字母榜,一年前入职武汉Manus公司时,喜欢穿T恤的肖弘总是会隐身在码农堆里。 在夜市文化盛行的武汉,曾正们并不觉得在初创公司Manus工作非常辛苦,“武汉没有北京那么大,从公司加完班还能赶上夜宵,吃完夜宵到家十几分钟,也不会觉得太累”,没有动辄1个小时以上的通勤时间,曾正喜欢武汉这个城市,似乎,这也是肖弘留恋的原因。 在2022年创建蝴蝶效应公司时,包括肖弘在内,没有任何一个founder在海外长期生活过,“我们的英语水平大概巅峰是高中,因为大学大家的英语水平是下降的。”肖弘曾在采访中这样说道。 但肖弘又是敏锐的,对机会,他有着自己的嗅觉。早在3月回答腾讯科技怎样看待这个世界的问题时,肖弘便表示,“今天的中国创业者就应该更激进的全球化。” 对于时刻要准备应对大厂探入的创业者如肖弘而言,国内市场的竞争日趋激烈,而正如他所说,“全球市场应该更大,市场会给学费给founder去上学。” 需要注意的是,肖弘选择前往新加坡,恐怕不止全球化这一个原因。 在Manus 爆火仅四个月后,肖弘就拿到了一轮 7500 万美元的融资,这轮融资由硅谷风投公司 Benchmark 领投,借此 Manus 的估值到 5 亿美元,这似乎是促使肖弘离开武汉的直接因素。 在今年1月,美国通过了一项针对中国人工智能企业的对外投资管制规定,即限制美国对从事敏感技术研发的中国实体进行投资,从5月以来,根据外媒报道,Reverse cfius(反向美国外国投资委员会审查)便针对Manus开始进行调查,随后6月Manus 正式宣布总部迁往新加坡。 对肖弘而言,为了应对调查、拿到融资,把Manus做成一家更国际化的AI公司,搬去新加坡是一个折中的选择,这样不仅能够保持与国内技术人才的接触,还能更方便地以新加坡公司的身份进入国际市场。 在新加坡招人,在武汉裁人,原因也颇为一致。 如今,哪怕肖弘再留恋武汉的热干面,他也势必要激进而求生存。 图注:manus北京工区,字母榜并未在内找到Manus的所属工区 图源:字母榜拍摄 野心勃勃和谨慎这两种特质似乎完美地融合在肖弘身上。 作为并非出身顶级高校如清北的AI创业者,在2022年创建蝴蝶效应以前,2015年毕业于华中科技大学软件工程专业的肖弘,并没有任何AI相关的经验。 在2022年ChatGPT引爆全球AI热情之前,肖弘的创业永远懂得借力。 在校期间,肖弘等人就开发了基于彼时迅速长大的微信的华科版微信校内漂流瓶和微信上墙等功能。 2015年毕业后,肖弘创立了武汉夜莺科技有限公司,在拿到来自腾讯、真格基金等知名产业基金和投资机构数亿元投资后,基于微信生态肖弘推出了帮助微信公众号编辑的壹伴助手,以及瞄准企业微信TO B的微伴助手。 肖弘从校园到创业,几乎左右的项目都围绕着微信生态展开。瞄准场景借力做大做强,而非用技术迭代突出重围,肖弘一早就有了自己的创业逻辑,即在某个超级平台上做产品,成功几率往往会更高。 一面是持续创业的野心,一面是绑定超级平台做细分场景的谨慎,肖弘把“借力”玩出了花。 随着ChatGPT让AI成了投资人趋之若鹜的新潮流,肖弘在2022年成立了蝴蝶效应。 没有AI经验,又嗅到了创业风口,肖弘没有从零开始,他购入了一位华科学长做出的AI插件(ChatGPT for Google),将已有一定用户量的该插件作为基础,2023年推出了定位浏览器插件的Monica。 同年,当国内AI六小龙的智谱、月之暗面等都瞄准了“国产OpenAI”的定位,凭借多轮高额融资半年内突破200亿估值,闯入大模型赛道时,肖弘仍然选择了他最擅长的接力。 和Manus一样,Monica同样整合了众多AI大模型如GPT-4o、Claude 3.5的功能。主要任务就是让用户浏览网页时,可以呼唤Monica聊天和辅助办公,不用调转到GPT-4o、Claude 3.5,也能生成图片、翻译、写作、数据分析,就这样,Monica在海外积攒起了超过1千万的用户。 不像梁文锋、杨植麟这样会出现在论文中、研发一线的创始人,肖弘似乎更热衷于为当下最火热的超级平台们找场景。 这是Manus凭借通用Agent爆火的原因,也是Manus及肖弘引发争议的源点。当Manus作为各个大模型的新容器,其在垂直场景上的表现极大受制于调用的大模型时,Manus的技术护城河在哪里,也被更多的人追问。而随着肖弘前往新加坡,他势必需要拿出更有力的答案。 借力如今的大模型盛世,Manus 用通用Agent在AI应用上占据了自己的用户心智,但大厂的探入必然是肖弘要面对的问题。 无论是国内还是国外,有人、有钱的大厂在探索AI应用场景的同时,似乎也在事实上形成了对Manus的围堵。 就在肖弘推出Manus的两个月后,字节就开源了一款 Deep Research 项目,同样支持多轮对话和多轮任务执行。这个项目同样支持AI 生成计划或报告,还支持生成播客及 PPT。借助火山引擎的语音模型,能够从报告生成双人主持的播客,这对刚刚才补上了自身语言能力的Manus来说,并不是一个好消息。 而在海外,OpenAI的Deep Research尝试更早于Manus。一个是OpenAI自研的具备推理能力,能顾生成专业级研究报告的Agent,一个是接入ChatGPT、Claude的并调试的 Agent Manus,大众对于Manus智能性的怀疑浮出水面。 更不用说,对比起提出星际之门计划,拿下460亿融资的OpenAI来说,刚刚拿到融资的Manus,要守住自己的技术护城河。也要跟上OpenAI的烧钱速度。 回看3月6日Manus爆火后,接受腾讯科技的采访中,肖弘曾提到,Manus首席科学家季逸超曾问黄仁勋:接下来几年,什么事情发生会让你觉得很惊讶?彼时,黄仁勋回答:“Basically nothing”。即任何事情都有可能。 对于当时AI市场的新变化,肖弘表示,“我觉得应该用这样的心态去看这一波,最好不要做空它。” 这或许是如今外界对通用Agent争议不断时,肖弘的心里话。 参考文献: 《对Manus创始人肖弘的3小时访谈:世界不是线性外推,做博弈中的重要变量》,腾讯科技 张小珺Jùn|商业访谈录。 《29岁华科校友获数亿元投资:从华小科起步,深耕微信8年》,华中科技大学启明学院 《Manus创始人肖弘:不做第二个梁文锋》 ,湃动商业评论
天神之眼再升级,比亚迪将为智驾泊车损失兜底
在几乎靠一己之力普及智驾生态之后,比亚迪在主动承担智驾责任方面又前进了一大步。 比亚迪在 7 月 9 日发布消息称: 比亚迪率先实现媲美 L4 级智能泊车。在中国市场,比亚迪对所有天神之眼车辆在智能泊车场景下的安全及损失全面兜底。 印象里,这似乎是除了 Robotaxi 之外,第一次有车企在量产车型上提「L4」级别。 比亚迪也明白「L4 级别」的含金量,没有遮遮掩掩,直接说明: L4 可简单理解为在特定条件下,驾驶员可「脱手脱眼脱脑」,事故责任由车企承担。 这次兜底对用户而言最大的价值就是,在智能泊车中出现的损失,不用走保险流程,可以直接联系比亚迪售后处理,自然也不用担心第二年保费的上涨。 不过兜底范围也有限制,车企兜底的范围仅包括由本车承担的维修费用、第三方财产损失、人身伤害损失,不含出于和解、谅解等目的而额外支付的金额。 目前市面上除了比亚迪之外,仅有鸿蒙智行和小鹏汽车有类似的兜底服务,但都有时间限制或者需要额外购买智驾险。 去年 11 月鸿蒙智行在问界、智界和享界车型上推出了智驾无忧服务权益,权益时长为激活后 12 个月,在泊车场景以及领航辅助场景下的保障权益上限为 500 万元。 小鹏汽车则和保险公司合作,为用户推出了 239 一年的智驾险,可以不限次赔付行车全场景下以及 NGP 退出 5 秒前的车主损失。 相比较之下,比亚迪这次发布的兜底政策则无需额外付费,也没有设定时间限制。 与此同时,比亚迪还宣布将对「天神之眼」进行史上最大规模的 OTA 升级,天神之眼 A/B/C 三大平台的多款车型都将在泊车、行车、安全三大板块十余项功能上获得升级,补齐了之前的诸多短板。 这次 OTA 在泊车方面新增了三速泊车、车头泊入、偏置泊车、窄车位泊车自动收后视镜,并优化了悬空障碍物识别功能,在行车方面新覆盖了环岛通行、复杂场景连续绕行、高速施工路段借应急车道绕行、窄路多把掉头等场景,新增了前车加塞场景下的闪灯鸣笛功能,也实现了识别低矮障碍物,在夜间 80km/h 情况下可实现对两轮车侵入车道紧急刹停,120km/h 触发 AEB 并进行两段式舒适刹停等主动安全功能。 在 2 月份比亚迪宣布全系标配「天神之眼」后的一周,有机构的数据表明,比亚迪的进店量增长一倍,新增订单超过7万,比亚迪股价也来到了历史新高。 但在紧接着吉利等车企跟进之后,由于基础版本的天神之眼 C 的表现问题,「智驾平权」这张牌并未完全达到比亚迪的预期目的,在消费者的普遍认知里,比亚迪算是智驾的「普及者」,但远谈不上「领先者」。 但好在比亚迪进化的速度很快。根据比亚迪的官方微博,比亚迪 5 月销售智驾车型 231059 辆,智驾车型国内占比 79%,截止至 5 月底,比亚迪智驾车型累计已经销售超过 51 万辆,每天产生的智驾数据超过 4400 万公里。 大量的真实驾驶数据和持续多年的研发投入,终于支撑比亚迪打出了「兜底」这张爆点牌。 承诺兜底也意味着比亚迪对「天神之眼」泊车的安全性以及自己的售后体系有相当程度的自信。 这下又轮到友商们彻夜难眠了,但最终的结果必然会是跟进,不然还怎么宣传自己的智驾多先进。 社群里面有位网友看的相当清楚,「从此以后,智能驾驶这玩意儿,别再聊那些虚头巴脑的了,敢不敢负责任,才是唯一的标准。」 从「卷技术」升级到「卷责任」,这或许是比亚迪的一小步,但将推动中国车企向前一大步。
机器人第一股,稚晖君要抢在王兴兴前面了?
就在宇树科技凭借年内IPO消息振奋人心之际,同为人形机器人赛道明星公司的智元,则借助一番意料之外的收购,率先点燃了资本市场的热情。 近期,根据A股上市公司上纬新材公告,智元拟以21亿元左右现金报价,收购公司29.99%股份。后续,智元还将通过其持股平台收购公司至少63.62%、至多66.99%的股份。 一系列交易完成后,上纬新材控股股东将变更为智元恒岳,现任智元机器人董事长兼CEO的邓泰华,将成为上纬新材新的实际控制人。相比邓泰华,智元机器人核心高管中更出名的,当属顶着华为天才少年称号的稚晖君(原名彭志辉),现任智元机器人CTO。 一家估值150亿元、等待上市的具身智能公司,反向收购一家市值30亿左右的上市公司,不免被外界解读为智元想要“借壳上市”。 尽管智元对外否认借壳上市传闻,称暂无在未来12个月内对上市公司及其子公司的资产和业务进行出售、合并、与他人合资或合作的明确计划,或上市公司拟购买或置换资产的明确重组计划。 但外界已经开始将上纬新材这家跟具身智能毫无关联的公司,视为“人形机器人第一股”来看待。 7月8日晚智元收购要约发布后,连续两个交易日内,上纬新材股价接连涨停,总市值从31亿元左右,一路上涨到45亿元左右。资本市场两天内就给上纬新材送去了14亿元大礼包。 智元之前,外界唯一传出上市消息的人形机器人公司只有宇树科技。 今年5月底,宇树完成从“有限公司”向“股份有限公司”的更名,当时就被业内解读为是在为上市铺路。 7月初,《每日经济新闻》报道称,宇树科技计划在2025年底前递交IPO申请,上市地点大概率先选A股,后续再择机登陆港股。 AGI浪潮爆发3年后,被资本推向潮头的一众AI初创公司,纷纷开始在商业压力和争夺竞争空间下瞄向了IPO。 国内大模型领域的AI六小龙,在智谱AI开启IPO进程后,6月底传出MiniMax也在筹备IPO的消息。据直面AI(ID:faceaibang),六小龙中有五家其实都在筹划上市事宜。 如今,争抢IPO第一股的风向,也开始刮向人形机器人。 01 虽然稚晖君名头响亮,但操盘这起收购案的真正主角,则是邓泰华。 邓泰华并非智元机器人初创成员。2023年,稚晖君等人联合创立智元机器人,直到2025年3月,邓泰华才公开被披露为智元机器人董事长、CEO。 但邓泰华与稚晖君渊源颇深:两人不仅是电子科技大学校友,稚晖君在华为工作期间,邓泰华还是稚晖君的直属领导。 这也并非智元机器人首次对外投资和收购公司。天眼查数据显示,智元机器人成立以来共有27次对外投资出手记录。仅邓泰华上任以来,智元便相继注资了卧龙电驱旗下子公司浙江希尔机器人股份有限公司,和博众精工旗下子公司苏州灵猴机器人有限公司。 不过,直接控股一家上市公司,上纬新材还是智元投资史上的第一家,也将创下具身智能企业在科创板的首单收购案例。 上纬新材年报显示,公司专注于新材料的研发、生产与销售,主营业务涵盖环保高性能耐腐蚀材料、风电叶片用材料、新型复合材料以及循环经济材料等领域。2024年,上纬新材收入约15亿元,同比增长7%,净利润8868万元,同比增长25%。 与之前围绕机器人产业链上下游投资不同,上纬新材暂时未开展任何跟具身智能领域相关的业务,这也被外界视为智元想要借壳上市的迹象之一。 但在否认借壳上市消息中,智元官方表态,未来12个月内不会改变上市公司主营业务或者对上市公司主营业务做出重大调整,也不会在未来12个月内对上市公司及其子公司的资产和业务进行出售、合并、与他人合资或合作,或上市公司拟购买或置换资产等重组计划。 至于此次收购的原因,智元给出的解释是,认同上纬新材长期价值和A股资本市场对科技创新和产业创新的服务能力。 但同时,智元也给后续变动预留了空间。在官方公告中明确写道,如果根据上市公司实际情况,需要实施相关事项,智元届时将督促上市公司严格按照相关法律法规的要求,履行相应的法律程序以及信息披露义务,切实保护上市公司及中小投资者的合法利益。 这也意味着,只要满足一定条件,智元仍然有重组上纬新材,从而借壳上市的可能性。 值得注意的是,此次收购的21亿元左右现金,并非完全来自智元融资款。 根据财务顾问华泰联合证券披露的信息,收购资金来源于两部分——合法自有和自筹资金。其中,智元自筹资金拟通过向银行申请并购贷款取得,目前已取得银行的贷款意向函,尚未签订正式的并购贷款协议。 02 越来越难的融资环境和越来越急迫的商业变现压力,使得一众人形机器人公司使出浑身解数,来增加自己的生存概率。 据直面AI不完全统计,ChatGPT带火AI概念之后,2022年以来成立的13家明星机器人公司中,大多都被困在A轮融资中。 智元也是赶在4月份的新一轮融资中,才继宇树科技,成为唯二挺进B轮的人形机器人创企。 在云岫资本CEO高超看来,(具身智能)这一波的爆火是好事,会吸引更多资本和创业者进入,但也要理性看待,“人形机器人现在还没有PMF(产品市场匹配)”。 目前还在持续获得融资的人形机器人公司,更多处于投融资早期阶段。 在智元宣布收购上纬新材前后,星动纪元、云深处、小雨智造、它石智航相继公告融资消息,这些人形机器人公司要么还处在天使轮,要么还徘徊在A+轮融资中。 原因也不难理解。处于早期阶段的人形机器人公司,之所以还在源源不断获得融资,关键在于其早期属性带来的估值窗口期。在这个阶段,估值尚未被大幅推高,投资机构能以相对较低的成本进入,单笔投资风险相对可控。 反观智元机器人,目前已经历了9轮融资。据IT桔子数据,智元机器人在5月24日完成最新一轮B+融资后,估值达到了150亿元,与宇树科技一起并列为当前最贵的具身智能创企。 高估值之下,想要继续获取融资已变得越来越难,不仅新的投资机构难寻,想要追求更高的融资额更是难上加难。 IPO便成了融资环境变难之下,宇树科技和智元等高估值企业的一条可选路径。但另一面是,IPO周期充满种种不确定性。如今,借助对上市公司的掌控,智元不仅可以继续保持独立IPO的可能性,还留有了借壳上市这一备选方案。 更为实际的是,有了上市平台在手,智元也多了一个新的自主掌控的融资渠道。 03 争抢IPO之风,更早已经在大模型领域刮开。 4月份智谱AI开启IPO进程后,6月份MiniMax被爆出正考虑在香港进行IPO。有头部创投机构合伙人向直面AI表示,“六小龙里已经有五家在筹备上市了。” 人人都想争当各自领域的IPO第一股。移动互联网时代的经验屡次告诉人们,作为前无古人后无来者的第一股,往往会因为没有参照,而能享受极高的估值溢价,也就能挤占其他创企的生存空间。 更直观的示例,便是AI 1.0时代的四小龙(商汤、旷视、依图、云从)“AI第一股”争夺战。 从结果来看,四家企业中率先上市的商汤,不仅靠着债券市场的融资持续输血,更是将自己顺利延续到了大模型时代,并成为四家中唯一一家还能跟得上技术迭代步伐的玩家。 与之相反,多次冲击上市失败的旷视转向智能驾驶,原有业务几乎完全裁撤;云从、依图等公司业务不仅大规模收缩,还被迫进行了大裁员。 无论是“大模型第一股”,还是“人形机器人第一股”,这都将不仅是一个现成的可以讲给投资人的新故事,而且能够在实际上为各自的企业增加生存的时间和空间。 但在资本层面之外,智元等人形机器人面前横亘着一系列比大模型更难的挑战。 同样以AGI为目标,人形机器人公司技术上达成泛化性和通用性遭遇的挑战更大,难题之一便在于高水平训练数据的缺乏,不少公司不得不依赖真人动作捕捉来收集数据,成本高且效率低。 更重要的是,相比大模型,人形机器人要花钱的地方更多,既要投入软件迭代研发,又要涉足智能硬件制造。 智元,便恰恰选择了人形机器人中最难的一条路,即押注以软硬一体化的方式开发机器人,同时投资机器人硬件和软件两个方向。 “(智元)第一天就坚决认定通用机器人不是一个局部问题,而是一个系统工程。”在稚晖君看来,“如果你只做灵巧手,或者只做一个模型,你可能成为一个模块化的供应商,如果要真正做出走进我们日常生活的机器人,必须要打通从感知决策到执行,从本体到大小脑的全栈闭环链路。” 与系统工程对应的,则是不可避免的更多系统化困难的出现。收购上纬新材,成了智元不走寻常路标签的又一新佐证。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。