行业分类:
加载中...
头条分类:
加载中...
大厂抢人逻辑彻底变了:42%校招生首选字节的背后
又是一年校招季,紧张的11月,大厂陆续开奖中。 有一说一,今年校招给我的感觉特别强烈——现在年轻人考虑问题已经这么细了么?🤔 不少手握一把Offer的校招潜力股们,后台私信来的全是这类问题:“这家的培养体系是真有东西还是走过场?”“那家offer接了以后能碰到核心业务吗?” 想起厂哥毕业那年找工作的时候,哪儿敢想什么核心业务,培养体系,成长路径…自己就是一张刚出校门的“白纸”,能拿到大厂offer都觉得赢麻了。 所以,是大厂招聘风向变了?还是这届年轻人飘了? 晚上正好刷到脉脉人才智库刚发布的《2025互联网职场新人流动趋势》报告,读完算是把疑惑解开了。 不过他这个范围要更广一些,把“校招群体”和“从业3年以内的职场人”都界定为了核心研究的“职场新人”——校招的是刚入场、急需定向培养的“萌新”,3年经验内的是刚站稳脚、想突破瓶颈的“潜力股”。 而报告用了大量真实职场流动数据最后得出来一个结论:互联网招聘的底层逻辑,真的变了。 字节领衔,大厂招聘已经不卡经验资历了 以前我们总觉得,找工作你得有showcase啊,不应该过往经验攒的最多工作就越好找吗? 但现在看报告里的数据才发现,大厂早不这么玩了——现在他们抢人突然不卡经验了… 说到底,企业不再看你做过什么,而是看你未来还能做什么。这不仅对新人友好,给老人也减了心理负担。 what?怎么厂哥找工作的时候没这种好事儿… 看了下数据,字节、腾讯、阿里这些头部厂,同类岗位占比都在往上涨。“毕业3年内人才”已经成为大厂招聘的新趋势。 搁以前,3年经验内的新人顶多被划拉到“后备力量”,得慢慢熬才能接触核心业务。但现在不一样了,他们直接成了大厂眼里“更被看好的潜力股”。 为啥会有这种转变? 这跟行业环境发生变化有着密切的关系。 首先,AI把“经验壁垒”这玩意儿已经拆平了。以前要攒三五年的基础技能、行业知识,现在靠AI工具很快就能入门,企业再没必要盯着“工龄”看。 再就是互联网业务现在迭代快得离谱。 从直播电商到AI应用,可能半年就冒出一个新赛道,光靠复制老经验根本玩不转。反而新人敢闯敢试,没那么多顾虑,更容易搞出创新突破。 好,那么问题来了:当大厂放下身段开始“抢人”,年轻人就真的会买账吗?🤔 报告里的另一个数据,直接描绘了这届年轻人的“反向选择”。超过55%的“职场新人”(1-3年经验)不是在跳槽,就是在准备跳槽的路上。 他们不是瞎折腾,核心诉求就一点:“能获得更大的成长空间”。说白了:“画饼可以,但得让我真吃到。” 00后在跳槽这事儿上最鲜明,他们拒绝成为“PPT流水线工人”或者“会议工具人”。面试时承诺的“广阔空间”,如果不能兑现为“独立负责项目”和“犯错后被指导而不是被甩锅”的真实体验,立马用脚投票。 这就形成了一种新的、挺有意思的“双向奔赴”: 企业这边,想法很务实:“我不管你是之前有没工作经验,我就看你能不能把手里的活儿跑明白。”年轻人这边算盘也打得现实:“钱和成长,必须得占一样”。 所以你说,是谁飘了?其实谁都没飘。 这更像是一场基于市场变化的理性重置。大厂在重新定义“人才”,年轻人在重新定义“好工作”。 双方都在找一个关键问题的答案:“你能否让一年后的我更进一步,出现肉眼可见的自身突破和成长?” 从这个角度你就能理解,为什么字节成为42%校招生的第一选择。 大家的思路很一致: 字节依然处在业务的爆发期,职场文化不搞论资排辈,新人能进核心战场的机会更大;同时“活水机制”又提供了内部重选赛道的可能。 以上这种“被当回事”的授权感,对追求快速成长的年轻人来说,比单纯的薪资诱惑力明显要更大。 同时这个逻辑在社招人群中也是完全成立的。 报告里指出,毕业3年内的人有相当大的跳槽意愿,而动因高度一致:为了获得更大成长空间。观察他们流向的目的地中,字节同样是热门选择。 为什么?因为字节确实敢让年轻人扛事。 你会发现,在字节动不动就是一个很年轻的同学在牵头某个核心产品的功能迭代,这种看得到的结果,恰恰是追求快速成长的年轻人最在意的。 “在这里成长是加速的,付出也是加倍的。但至少你能接触到最前沿的项目,积累跳槽都带不走的实战经验。”一位刚通过社招加入字节的开发同学说。 厂哥说两句:选平台的同时,也是在选一种成长方式 既然大厂的招聘风向已经发生了变化,对于正在等开奖的同学,务必多问问那个给你offer的部门,过去一年的校招生到底在忙什么?是参与重要项目,还是持续在边缘打杂?“实践机会”比“公司光环”更值得关注。 而对那些光喊“重视年轻人”大厂来说,现在你们开的条件已经不够了… 敢不敢给新人真正的挑战?能不能为试错兜底?谁先做到,谁就能在这场新人才战中占据先机。 而像字节这样,既能吸引42%的校招生首选,又能成为顶尖人才的跳槽目的地,或许正是因为踩中了“真实成长”这个核心诉求——在这个意义上,它的热度,也值得更多大厂的思考。
AI生成的假视频泛滥,非营利组织要求OpenAI将Sora 2撤回
IT之家 11 月 12 日消息,OpenAI 旗下 Sora 2 人工智能视频生成平台引发争议,越来越多的倡导组织、学者与专家正拉响警报:允许用户仅凭一段文本提示词即可生成任意 AI 视频,已导致非自愿图像泛滥、高度逼真的深度伪造(deepfake)内容激增。 尽管 OpenAI 已对涉及公众人物的 AI 生成内容加强管控,例如禁止生成迈克尔・杰克逊、马丁・路德・金博士及弗雷德・罗杰斯先生(“罗杰斯先生”)从事离奇行为的视频,但此类措施往往是在相关名人遗产管理方及演员工会强烈抗议之后才被迫出台。 非营利组织“公共公民”(Public Citizen)本周二致信 OpenAI 及其首席执行官山姆・奥尔特曼(Sam Altman),要求其立即将 Sora 2 从公众市场撤回。信中指出,Sora 2 仓促上线以抢在竞争对手之前发布,反映出“OpenAI 一贯且危险的行为模式:急于将一款要么本身不安全、要么缺乏必要防护措施的产品推向市场”。信件进一步强调,Sora 2 展现出对产品安全性的“肆意漠视”,亦侵犯了公众对其自身肖像的权利,并威胁民主制度的稳定。该组织亦将此信同步提交至美国国会。 “我们最担忧的是其对民主制度的潜在威胁。”“公共公民”科技政策倡导者 J.B. 布兰奇(J.B. Branch)在采访中表示,“我认为我们正步入一个人们无法再真正信任所见影像的世界。政治领域已开始出现一种策略:最先发布的图像或视频,往往就是公众最终记住的内容。” 作为上述信函的执笔人,布兰奇还指出,此类技术更广泛地侵蚀着个人隐私权,且对网络上的弱势群体造成尤为严重的不成比例影响。 尽管 OpenAI 已禁止生成裸露内容,但布兰奇指出,“女性正以其他形式遭受线上骚扰”,例如某些带有特定恋物癖倾向的小众内容仍能绕过应用审核机制传播。新闻媒体 404 Media 上周五报道称,大量由 Sora 生成的“女性遭扼颈”视频正在线上激增。 IT之家注意到,一个多月前,OpenAI 在 iPhone 上推出了其新的 Sora 应用。上周,该应用在美国、加拿大以及包括日本和韩国在内的几个亚洲国家的安卓手机上上线。 迄今最为强烈的抵制声浪主要来自好莱坞及其他娱乐产业相关方,包括日本漫画(Manga)行业。OpenAI 在 Sora 上线数日后即宣布首批重大调整,称“过度审核(overmoderation)确实令用户极为沮丧”,但强调在“全球社会仍在适应这项新技术之际”,采取审慎保守立场至关重要。 此后,OpenAI 于 10 月 16 日公开宣布与马丁・路德・金博士家族达成协议,禁止生成对其民权领袖形象的“不敬描绘”,同时加紧完善技术防护措施;10 月 20 日,又与《绝命毒师》主演布莱恩・克兰斯顿(Bryan Cranston)、美国演员工会 — 美国电视与广播艺术家联合会(SAG-AFTRA)及多家经纪公司达成类似协议。 “如果你名气大,那还好说。”布兰奇评论道,“但这恰恰凸显了 OpenAI 一贯的行事模式:他们只愿回应极少数群体的愤怒抗议;惯于先发布、后道歉。然而,许多问题本可在产品发布前通过设计层面的审慎决策加以规避。” OpenAI 旗舰产品 ChatGPT 亦曾面临类似批评。上周,七起新诉讼在加利福尼亚州法院提起,指控该聊天机器人在用户并无既往精神健康问题的情况下,诱导其产生自杀倾向与有害妄想。这些诉讼由“社交媒体受害者法律中心”(Social Media Victims Law Center)与“科技正义法律项目”(Tech Justice Law Project)代表六名成年人与一名青少年提起,指控 OpenAI 明知故犯,于去年仓促发布 GPT-4o 模型,无视内部警告 —— 该模型存在危险的谄媚倾向与心理操纵性。四名受害者因此自杀身亡。 尽管“公共公民”并未参与上述诉讼,布兰奇表示,他认为 Sora 的仓促发布与此存在相似之处。 他指出:“不顾一切地猛踩油门,毫不在意可能造成的危害。其中很多后果其实是可以预见的。但他们宁愿推出产品,让人们下载,让人们对其上瘾,也不愿做正确的事 —— 事先对这些产品进行压力测试,并关注普通用户的困境。” 上周,OpenAI 还就日本动漫与游戏产业的抗议作出回应。该国代表性行业协会致信 OpenAI,成员包括宫崎骏创立的吉卜力工作室(Studio Ghibli),以及万代南梦宫(Bandai Namco)、史克威尔艾尼克斯(Square Enix)等知名游戏开发商。OpenAI 在声明中表示:“许多动漫爱好者渴望与心仪角色互动”,但公司亦已设置防护机制,防止在未获版权方授权的情况下生成知名角色形象。 “我们正与各大工作室及版权方直接沟通,认真听取反馈,并持续观察用户(包括高度重视文化与创意产业的日本市场)如何使用 Sora 2。”OpenAI 在针对该行业协会信函的声明中如是表示。
奥斯卡获奖演员麦康纳、凯恩与ElevenLabs签约,为AI“献声”
IT之家 11 月 12 日消息,据英国《卫报》报道,奥斯卡获奖演员马修・麦康纳(Matthew McConaughey)与迈克尔・凯恩(Michael Caine)均已与人工智能语音公司 ElevenLabs 签署了合作协议。 这家总部位于纽约的公司现在能够生成由人工智能模拟的他们的声音,此举旨在解决人工智能行业与好莱坞合作中存在的一个“关键伦理挑战”。 麦康纳自 2022 年起便与 ElevenLabs 展开合作并对其进行了投资。根据新协议,他授权 ElevenLabs 利用其本人声音,将其创办的通讯刊物《生活诗篇》(Lyrics of Livin’)转化为西班牙语有声版本。 麦康纳在声明中表示,他“对 ElevenLabs 的技术深感钦佩”,并期待此次合作能助其“触达并联结更多受众”。 与此同时,ElevenLabs 宣布推出“标志性声音市场”(Iconic Voices Marketplace),品牌方可通过该平台与公司合作,合法授权使用知名人士的 AI 生成语音。迈克尔・凯恩此次签约后,其极具辨识度的嗓音亦正式纳入该平台阵容。 凯恩在声明中表示:“多年来,我曾用我的声音讲述那些打动人心的故事 —— 关于勇气、智慧,以及人类精神的不朽篇章。如今,我愿协助他人发现并表达他们自己的声音。通过 ElevenLabs,我们不仅能够保存和分享我的声音,更可为所有人实现这一可能。” 他进一步指出,该公司“所推动的创新并非意在取代人性,而是为了礼赞人性”,强调其理念在于“并非取代声音,而是放大声音”。 除上述两位演员外,“标志性声音市场”还收录了多位已故好莱坞巨星的声音资产,包括约翰・韦恩(John Wayne)、洛克・哈德森(Rock Hudson)及朱迪・加兰(Judy Garland);在世名人则涵盖丽莎・明内利(Liza Minnelli)与阿特・加芬克尔(Art Garfunkel)等人。此外,该平台亦收录了历史人物如阿梅莉亚・埃尔哈特(Amelia Earhart)、贝比・鲁斯(Babe Ruth)、罗伯特・奥本海默(J. Robert Oppenheimer)、玛雅・安吉洛(Maya Angelou)与艾伦・图灵(Alan Turing)的语音模型。 据悉,ElevenLabs 近期估值已达约 66 亿美元(IT之家注:现汇率约合 469.83 亿元人民币)。 此类名人与 AI 企业的合作并非孤例。此前,Meta 公司亦与多位知名人士达成语音授权协议,去年披露的合作名单中便包括朱迪・丹奇(Judi Dench)、约翰・塞纳(John Cena)与克里斯汀・贝尔(Kristen Bell)等人。此外,阿什顿・库彻(Ashton Kutcher)和莱昂纳多・迪卡普里奥(Leonardo DiCaprio)等明星也已投资多家人工智能企业。
全国首家人形机器人7S店亮相光谷 7万多元起售
凤凰网科技讯 11月12日,据湖北日报消息,全国首家人形机器人7S店昨日在光谷开业,最便宜的机器人售价7万多元,最贵的50多万元,人们可以像买车一样购买人形机器人。 店内在售的机器人有格蓝若的“劳动者”、手智创新的“远游”、湖北启灵的“神农”、荆楚机器人的“精灵”、光谷东智的“光子”、光谷华汇的特种机器人、华科HRT团队的小人形机器人等。 光谷东智“光子”机器人 据介绍,“远游”机器人可在医院导诊问询、在超市理货。“劳动者”能在工厂巡检,检查设备温度和声音异常。“光子”在首届世界人形机器人运动会上斩获首金,还在店内设立了冠军打卡点。 这家7S店由湖北人形机器人创新中心打造。该中心董事长李正祥介绍,目前价格较便宜的为个头较小的人形机器人,一般在10万元以内,基础款售价7万多元;与人身高差不多,没有双脚的轮式双臂机器人,价格在20万元左右;与真人一样,有双手、双脚的机器人,售价则在50万元左右。 据介绍,所谓7S店,比人们熟悉的汽车4S店更丰富,它包含销售(Sale)、配件(Spare parts)、服务(Service)、信息反馈(Survey)、解决方案(Solution)、展示(Show)和培训(School)。七大功能,组成人形机器人完整的产业与生活服务生态。
谷歌前CEO施密特:大多数国家最终可能使用中国AI模型
施密特 凤凰网科技讯 北京时间11月12日,据《商业内幕》报道,谷歌公司前CEO埃里克·施密特(Eric Schmidt)表示,他担心由于成本问题,大多数国家最终可能会使用中国的AI模型。 施密特在周二播出的播客节目《Moonshots》中表示:“这会造成一种奇怪的结果:美国最顶尖的模型是闭源的,而中国最顶尖的模型是开源的。这里的地缘政治问题在于,开源是免费的,而闭源模型不是免费的。” 开源AI模型允许任何人免费、公开地使用和共享软件,用于任何目的。 “因此,绝大多数没有像西方那样雄厚资金的政府和国家,最终将会以中国的模型为标准,并不一定是因为它们更好,而是因为它们是免费的。”施密特说道。 开源支持者认为,开源能推动技术以民主化方式快速发展,因为任何人都可以修改和重新分发代码。而闭源模型的拥护者则认为,由于代码不公开,其安全性更高。 今年以来,DeepSeek、阿里通义千问Qwen3等中国模型备受追捧,引发了外界对美国竞争优势的担忧。 施密特在2001年至2015年担任谷歌CEO,带领公司完成了2004年的首次公开招股(IPO)。他目前是风投公司Innovation Endeavours的创始合伙人,同时经营一家名为Relativity Space的航空航天创业公司。根据彭博社的数据,他的净资产接近500亿美元。 与施密特一样,英伟达CEO黄仁勋(Jensen Huang)、法国AI创业公司Mistral CEO阿瑟·门施(Arthur Mensch)也是开源模型的支持者。今年2月,黄仁勋在迪拜举行的世界政府峰会上对各国官员表示,各国需要致力于建设主权AI。主权AI是指一个国家对AI技术、数据及基础设施的控制与治理。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
调查显示:97%受访者无法分辨AI音乐与人类创作音乐
IT之家 11 月 12 日消息,据路透社报道,音乐流媒体平台 Deezer 与益普索(Ipsos)今日联合发布的一项调查显示,高达 97% 的听众无法分辨人工智能生成的歌曲与人类创作的歌曲。该结果凸显出业界日益增长的担忧:人工智能可能彻底颠覆音乐的创作、消费与变现模式。 据IT之家了解,此次调查由益普索执行,覆盖美国、英国、法国等八个国家共 9,000 名受访者。调查结果反映出,随着能生成完整歌曲的 AI 工具不断涌现,音乐行业正面临愈发紧迫的伦理挑战 —— 此类技术不仅引发版权争议,更对音乐人的生计构成现实威胁。 Deezer 指出,调查亦显示,绝大多数听众呼吁对 AI 生成音乐进行明确标识。具体而言,73% 的受访者支持在 AI 生成曲目被推荐时予以披露;45% 希望平台提供过滤选项;40% 表示将直接跳过 AI 生成歌曲;另有约 71% 的受访者对其自身无法区分人类作品与 AI 合成曲目感到惊讶。 拥有 970 万订阅用户的 Deezer 表示,其平台每日接收的 AI 音乐投稿已激增至逾 5 万首,约占总上传量的三分之一,较今年 4 月的 18% 显著上升。为提升透明度,Deezer 已引入 AI 内容标签机制,并将 AI 生成曲目排除在编辑精选歌单及算法推荐系统之外。 Deezer 首席执行官亚历克西斯・兰特尼耶(Alexis Lanternier)强调:“我们坚信创造力源于人类,而人类创作者理应受到保护。”他同时呼吁行业加强透明度建设。兰特尼耶亦坦言,对 AI 音乐实施差异化分成机制存在极高复杂性,报酬政策的“重大变革”仍面临严峻挑战。此外,Deezer 也已开始将虚假播放量排除在版税支付之外。 今年早些时候,一支名为“丝绒日落”(The Velvet Sundown)的 AI 虚拟乐队曾引发广泛关注:其每月在 Spotify 吸引超百万听众,直至其 AI 合成身份被曝光后才引起业界震动。 近期,环球音乐集团(Universal Music Group)与 AI 音乐公司 Udio 就一项版权诉讼达成和解。尽管具体财务条款未披露,双方已宣布计划于 2026 年联合推出一款 AI 驱动的音乐创作平台,该平台将使用经授权许可的音乐作品进行模型训练。 就在本周二,德国慕尼黑一家法院裁定,OpenAI 旗下的 ChatGPT 因未经授权复制歌词内容,违反德国版权法。对此,OpenAI 表示可能提起上诉。 消费者对媒体领域中 AI 技术的态度仍呈现明显分化。市场研究机构 Luminate 今年 5 月的一项调查显示:多数美国观众对 AI 应用于电影制作中的视觉特效等环节持中立或接受态度;然而,对于 AI 撰写剧本或生成虚拟演员,则普遍持怀疑态度。
高盛分析师:消费端AI价值凸显,企业应用进展滞后
IT之家 11 月 12 日消息,据高盛的两位分析师表示,尽管人工智能(AI)正深刻改变消费者使用技术的方式,但在企业应用层面,这场技术革命的进展仍明显滞后。 美国软件行业股权研究分析师卡什・兰甘(Kash Rangan)在周二发布的高盛“Exchanges”播客节目中表示:“众多面向消费者的 AI 应用 —— 无论是 ChatGPT 还是 Claude,已充分展现了 AI 的价值。但在企业层面和用户层面,虽然有一些起色,但整体进展仍未达到我们此前的预期。” 兰甘指出,虽然如 ChatGPT 等工具已迅速赢得消费者广泛关注,企业层面的采纳步伐却相对缓慢。他坦言:“企业当前的 AI 应用水平,远低于我此前的预期 —— 甚至不及半年或九个月前我们所预估的进度,更遑论一年乃至两年前的展望。” 另一方面,美国互联网行业股权研究分析师埃里克・谢尔曼(Eric Sheridan)则指出,AI 基础设施的建设规模“超出了预期上限”。他解释称,这一激增反映出:以 ChatGPT 和谷歌 Gemini 为代表的生成式 AI 模型对算力的旺盛需求,已显著超过当前可用的计算能力供给。 然而,高昂的投入已引发部分投资者对回报前景的担忧。谢尔曼表示,尽管 AI 基础设施投资仍在加速攀升,但其迅猛增长反而加剧了市场对长期投资回报率(ROI)的疑虑。 他特别提到英伟达(NVIDIA)此前作出的预测:到本十年末,全球 AI 基础设施累计支出将达到 3 万至 4 万亿美元(IT之家注:现汇率约合 21.4 万至 28.47 万亿元人民币)。“据我们与大多数投资者的交流,若非 AI 最终成为推动社会整体经济产出的核心引擎,他们很难为如此规模(3–4 万亿美元)的累计支出构建合理的回报模型。” 高盛分析师上述观点正值投资者对 AI 投资狂潮产生焦虑之际。近期,受 AI 相关支出激增推动,标普 500 指数与纳斯达克指数接连刷新历史新高;但上周,市场因担忧股价已大幅脱离基本面而出现回调。 这种“市场热情”与“落地实效”之间的落差,也与麦肯锡咨询公司的观察相呼应。 麦肯锡上周发布的《2025 年人工智能现状报告》显示:尽管近 88% 的企业表示已在至少一项业务职能中应用 AI,但仅有约三分之一实现了企业级的规模化部署。在针对近 2,000 家跨行业企业的调研中,64% 的受访者认为 AI 正在赋能其创新活动;但仅有 39% 表示 AI 的实际效益已体现在财务业绩(净利润)层面。 报告总结道:“尽管 AI 工具如今已司空见惯,但大多数组织尚未将其深度嵌入自身工作流与核心业务流程中,因而尚无法实现显著的企业级效益。”
Meta首席AI官汪滔:AI时代是年轻人的“新比尔・盖茨时刻”
IT之家 11 月 12 日消息,科技媒体 thehansindia 昨日(11 月 11 日)发布博文,报道称 Meta 首席 AI 官汪滔(Alexandr Wang)提出当前 AI 热潮是属于年轻一代的“新比尔・盖茨时刻”。他敦促青少年投入大量时间进行“氛围式编程”(vibe-coding),即通过动手实践和反复试验来掌握 AI 工具。 汪滔认为当前年轻一代的最大机遇在于掌握人工智能,这与比尔・盖茨、马克・扎克伯格在个人电脑时代早期所做的一样。 他在 TBPN 播客节目中表示,如果当今的青少年想在快速变化的未来经济中脱颖而出,就应该深入探索和体验各类 AI 工具。 IT之家援引博文介绍,他将当前的 AI 热潮比作 20 世纪 80 年代的个人电脑革命。他解释道,个人电脑问世之初,那些投入最多时间并与之共同成长的人,在后来的经济竞争中获得了巨大优势。 因此,他敦促年轻人遵循相似的路径,投入数千小时学习和体验 AI 模型,并强调:“对于现在的 13 岁孩子来说,你们应该把所有时间都花在‘氛围式编程’上。这就是新的比尔・盖茨、马克・扎克伯格时刻。” “氛围式编程”(vibe-coding)是他建议的核心概念,它代表了一种动手实践的、探索式的学习方法。这种方式不完全依赖正式课程或教程,而是鼓励年轻人借助 AI 编程工具去创造、测试和“打破常规”。 这是一个在实践中学习的过程:通过向 AI 模型发出指令、分析其反馈、迭代代码,逐步理解这些系统如何“思考”并执行任务,他认为,这种方法能同时培养创造力与技术熟练度。
推理新范式:动态效能算法让算力资源实现最大化
作者 | 陈骏达 编辑 | 漠影 过去两年,全行业都在为大模型训练疯狂堆GPU、建算力中心。但当视角进入2025年,真正决定企业竞争力的主战场,已经迅速从训练转向推理。 推理时代的算力不再是单一物理资源,而是一个跨地域、跨架构、跨属权的综合体系:一个企业的AI服务或许部署在自建IDC,同时又依赖外部云GPU;模型推理与模型训练并行存在;开发测试与生产流量共处一套资源;多业务、多租户同时争抢不同规格的GPU。这意味着算力要实时、动态、按业务优先级调度。而传统调度做不到。 传统算力调度平台诞生于传统云的集群运维背景,其核心目标是让硬件更易管理、更少出故障、更好利用。它们的能力止步于服务器视角:节点是否在线、显存是否足够、任务是否分配成功、权限是否隔离,在面向大模型的AI推理时代,却难以回答更重要的问题——推理延迟是否达标?模型吞吐是否最优?算力成本与业务收入是否动态平衡?在新范式转换下,系统需要重构。 这些问题在推理时代被迅速放大。过去算力用于训练,以“跑成”模型为目标;如今算力直接承载真实业务,算力调度被迫承担更多职责——必须从IT运维逻辑升级为AI业务逻辑。但挑战也随之而来:模型结构差异巨大、推理链路时延瓶颈、业务波峰波谷并发变化…每一次算力分配,都可能影响一笔业务成交、一位用户体验,甚至一个产品的增长曲线。 GPU不再是静态资源,而成为可运营、可定价、可持续经营的资产。 为了支撑这场范式转移,国内AI基座平台技术公司矩量无限重新定义了算力的基本单元,不再是“服务器/GPU卡”,而是围绕业务目标进行抽象的、可度量和可调度的算力单元,并基于此构建了完整的技术基座,形成了覆盖算力、模型、服务到商业回报的全链路平台矩阵。 在技术创新层面,矩量无限的开物算力调度系统深度融合了Kubernetes动态资源分配(DRA)技术 ,通过“异构GPU自适应调度与分配方法及系统”实现了突破性的算力管理能力: 技术特点:通过具备自学习能力的算力适配器,将异构国产GPU间的静态硬件资源单元抽象并转化为动态标准化的“算力能力单元”(CU)以实现精准调度和分配 。 产生效果:实现了基于任务实际需求的“目标导向”按需调度,极大地简化了用户对异构硬件结构和组成的关注,显著提高了集群资源利用率和运行稳定性。 达成形式:在各厂商设备信息上报的基础上,通过自学习算力适配器基于历史推理记录持续优化动态折算因子,并将统一的算力容量重发布为Kubernetes动态资源分配(DRA)ResourceSlice实现资源的精准绑定与分配 。 以上能力目前已在国产GPU卡上得到规模验证。矩量无限已在壁仞、天数、希姆等国产GPU的千卡级混合集群上完整跑通算力单元化与跨架构推理调度,同时相关平台已落地全国多个千卡智算中心,并服务于工信部工业互联网研究院、多家头部行业客户、高校科研机构等。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。