行业分类:
加载中...
头条分类:
加载中...
华为将重新定义数据存储,聚焦六个方面创新
凤凰网科技讯(作者/刘俣辰)5月7日,2024创新数据基础设施论坛在柏林举行。期间,华为公司副总裁、数据存储产品线总裁周跃峰博士表示,具备极致性能、数据韧性、全新数据范式、高扩展性、绿色节能、数据编织能力的数据存储是AI时代存储演进的必由之路。华为将重新定义数据存储,聚焦于六个方面的创新。 华为公司副总裁、数据存储产品线总裁 周跃峰博士 1. 极致性能:超越传统存储10倍的性能,支持PB级带宽以及亿级IOPS,极大提升生成式AI全流程效率; 2. 数据韧性:通过架构和技术创新,实现99.9999%高可靠性,通过内置防勒索引擎,实现侦测准确率提升至99.99%,并将AI训练过程中CheckPoint恢复时间缩至1分钟以内; 3. 全新数据范式:使能多维“张量”格式的数据,通过智能检索引擎,具备快速的张量数据检索能力;通过内嵌知识库,利用RAG技术消除AI大模型幻觉; 4. 高扩展性:存储集群支持EB级容量横向扩展;每个引擎可支持多GPU、DPU或NPU纵向扩展,以支持近存计算; 5. 绿色节能:通过存储介质应用创新和整机硬件创新,实现小于1Watt/TB的存储能效和1PB/U的存储密度; 6. 数据编织:基于存储元数据管理及检索能力,实现全局数据可视、可管,并支持10倍的数据流动效率提升。 基于以上创新,华为推出全新A系列高性能存储OceanStor A800,其可提升AI集群可用度30%。性能方面,OceanStor A800带宽是友商同类产品的4倍,IOPS达友商的8倍;支持EB级容量扩展,最大支持扩容至4096张算力卡,512个存储控制器;从空间能耗来看,密度高达1PB/U,能耗低至0.7Watt/TB;结合向量化索引、张量格式数据、RAG知识库,使能全新数据范式;数据韧性方面,勒索攻击侦测准确率从99.9%提升至99.99%;通过数据编织能力,实现数据资产管理。 此外,存储介质创新助力可持续发展。华为新推出128TB大容量SSD盘,相比业界友商,每PB节约88%空间,节省92%能耗,相同空间实现10倍容量提升,进一步降低数据中心能耗。 同样,AI-Ready的前提是Data-Ready。DME内置的Omni-Dataverse全局文件系统实现企业全域数据资产可视、可管、可流动,构筑AI数据湖存储底座。
消息称三星组建百人工程师团队,争夺英伟达下一代人工智能芯片订单
IT之家 5 月 7 日消息,据韩国科技媒体 KED Global 报道,三星电子为了拿下英伟达下一代人工智能图形处理器 (AI GPU) 的高端内存 (HBM) 订单,组建了一支由约 100 名顶尖工程师组成的“精英团队”,他们一直致力于提高制造产量和质量,首要目标是通过英伟达的测试。 据业内人士透露,英伟达首席执行官黄仁勋对三星目前提供的 8 层和 12 层 HBM3E 内存的良品率和质量并不满意,要求三星进行改进。HBM3E 内存是英伟达下一代 Hopper H200 和 Blackwell B200 AI GPU 的关键部件,但目前主要由三星的韩国竞争对手 SK 海力士供应。 IT之家注意到,三星在 2 月份成功研发了全球首款 36GB 的 12 层 HBM3E 内存,并希望本月通过英伟达的质量测试。据报道,三星还提前预定了生产线,以期提高产量,满足英伟达不断增长的需求。 消息人士称:“三星的目标是通过快速增加对英伟达的供应,占据更高的市场份额。预计三星将在第三季度加快供货速度。” 三星芯片业务负责人、总裁兼首席执行官 Kyung Kye Hyun 表示:“我们在第一场战役中落后了,但我们必须赢得第二场。” 目前,SK 海力士正向英伟达新款 H200 和 B200 AI GPU 提供 8 层 HBM3E 内存,同时还提供了 12 层 HBM3E 样品用于性能评估,预计于 2024 年第三季度供货。
华为苹果同日对决,背后还有中韩面板之争
北京时间今天晚上(5月7日),苹果不出意外将会推出该公司史上首款配备OLED显示屏的iPad产品。而几乎在同一时间,华为也将会在迪拜举办发布会,面向全球市场推出全新MateBook系列和全新MatePad系列平板电脑,这些产品很有可能也都将搭载OLED屏幕。 根据调研机构Canalys最新发布的数据,今年一季度,苹果以35.6%的份额仍然位居全球平板市场第一,但出货量同比大跌13.9%,而华为以8.3%的份额排名第三,出货量猛涨超70%。就在上个季度,华为平板10余年来首次超越苹果成为中国市场第一,0.3个百分点的份额差距让竞争白热化。 而不为外界所熟知的是,华为苹果两家巨头同日对决背后,还隐藏着一场面板产业战争。 两个月前,三星投资超200亿的8.6代OLED面板产线举行了设备搬入仪式,想以此应对中国面板厂商的步步紧逼。而仅仅20天后,京东方投资630亿的8.6代OLED面板产线也宣布奠基,凸显出对三星的紧追不舍。而两大巨头此次投建的产线,都聚焦平板和PC等IT领域。 不仅如此,市场上近期还传出,与京东方并称“国产面板双子星”的TCL华星,也将在年内投资630亿加入8代OLED生产线的竞逐。但TCL方面5月6日回应观察者网称,该公司目前没有8代OLED产线投资计划,考虑到下游需求和产业链等因素,会秉持审慎态度推进。 华为和苹果平板产品 京东方再砸630亿,紧追三星 此次京东方630亿投建的第8.6代AMOLED产线,是中国首条高世代产线。所谓世代,指的是面板玻璃基板尺寸,世代越高尺寸越大。在此之前,京东方已在国内投建四条柔性AMOLED产线,分别是鄂尔多斯的5.5代线,以及成都、重庆和绵阳的6代线,总投资近2000亿元。 受制于良率和成本,平板和笔记本应用OLED面板要比手机更晚。直到去年9月,华为才在国内推出全球首款大尺寸柔性OLED平板,而后又在今年4月推出全球首款柔性OLED笔记本。这其中平板的屏幕由京东方和维信诺供应,市场普遍认为京东方也将供货华为OLED笔记本。 从投建时间来推断,京东方向华为、苹果、vivo等厂商供应的OLED面板,应该都来自于已投产的四条AMOLED产线。这就不免让外界产生疑问,既然这些产线已经可以为手机、平板和笔记本供货,为何还要斥巨资建设更大尺寸的8.6代生产线? 答案在于切割效率:玻璃基板面积越大,制造大尺寸面板的效率越高。也就是说,相比现有的6代线,8.6代线的切割效率更高。以13.3英寸面板为例,如果6代产线每年可以生产450万片13.3英寸平板电脑面板,那8.6代设备就可生产高达1000万片,产能实现翻番。 图源:三星官网 京东方也在公告中提及,第8.6代AMOLED生产线能大幅提升中尺寸OLED产品切割效率,降低生产成本,“通过投资本项目,京东方将建设全球首批高世代AMOLED半导体显示生产线,有望同步国际同业所推出产品,抢占高世代AMOLED半导体显示‘蓝海’的战略机遇。” 京东方所说的“国际同业”,指的应该就是韩国面板龙头三星。去年4月,三星宣布将投资4.1万亿韩元(约合人民币215亿元)建设8.6代OLED面板产线。今年3月初,三星显示举行了8.6代IT用OLED面板设备搬入仪式,计划在年内完成蒸镀机等主要设备的安装调试。 按照三星的预期,该公司第8.6代IT用OLED产线将在2026年2月量产,而京东方的产线预计将在2026年底量产,双方量产的时间差距在一年内。而三星目前的投资规模之所以小于京东方,一大原因可能是三星的产线是由过去生产液晶显示器(LCD)的生产线改造而来。 中企步步紧逼,韩国还想做“第一” 在电视用的大尺寸OLED领域,三星之前已经布局,这次投建IT用8.6代线,则有多重考虑。 一方面是想率先开拓OLED面板的更多应用领域,形成全尺寸覆盖,守好苹果这个大客户。 长期以来,苹果在新技术导入方面走在行业前列,许多中尺寸OLED技术的开发与讨论也与苹果在中尺寸产品采用OLED面板的计划高度相关。随着华为、苹果相继将OLED应用到iPad等IT产品上,面向IT用的8.6代OLED技术已成为下一个重要战场,三星自然想抢占先机。 中国电子视象协会秘书长董敏向观察者网指出,苹果和华为是全球性消费电子领导品牌,随着两家相继发布OLED平板等产品,意味着未来领先品牌的旗舰产品一定会是OLED面板。而随着三星、京东方重金投入8.6代线,未来上游和终端侧都会全力推动OLED产品的应用。 三星显示举行8.6代IT用OLED面板设备搬入仪式 调研机构Omdia数据显示,2022年OLED笔记本面板出货量约600万片,同比增长19%;2027年OLED IT市场的占比预计将提升到23.6%。DSCC的数据显示,到2026年OLED在高端IT市场将以51%的年复合增长率提升至4400万片,IT OLED市场规模预计将达36亿美元。 三星的另一考虑,则是想通过抢先布局应对中国厂商的步步紧逼。在液晶显示(LCD)领域取胜后,中国厂商正迅速攻向三星主导的OLED领域,其中手机用的小尺寸OLED首当其冲。 早在2019年,三星AMOLED智能手机面板全球市占率高达85.2%,LGD为2.7%,彼时两家韩企曾向华为P40和Mate40系列供货。然而4年过去,在京东方、维信诺、天马等中企冲击下,2023年韩企份额收缩至56.8%,中企的份额暴涨至43.2%,双方分庭抗礼之势已现。 也正因此,在去年三星宣布将投建8.6代OLED产线时,韩媒就分析称随着中企不断增强市场竞争力,三星在中小尺寸OLED方面压力骤增,三星此举意在应对中国面板厂商的挑战。 甚至韩国政府也表现出很大期待。韩国总统尹锡悦表示,该投资计划为显示行业的“新飞跃”铺平道路;三星电子会长李在镕称,三星将开拓显示行业的新未来;韩国产业通商资源部部长李昌阳更宣称,到2027年,韩国显示产业将实现世界第一,并带动显示面板出口的扩大。 但随着京东方跟进对8.6代OLED产线的投资,韩国想像的市场格局能否实现,仍存变数。 根据CINNO Research统计数据,今年一季度全球AMOLED智能手机面板出货分地区来看,韩国地区份额已缩窄至46.6%;中国厂商出货份额占比53.4%,同比增加15.6个百分点,环比增加8.5个百分点,份额首次超越五成;京东方、维信诺、TCL和天马份额之和已超三星。 不难想象,未来在平板和笔记本等IT领域,如果京东方、维信诺和华为甚至苹果等上下游厂商继续携手,很可能会复制手机OLED的格局演变,进一步挤压韩国面板企业的市场空间。 图源:CINNO Research 巨头押注,8.6代线仍是冒险一步 从行业普遍观点来看,IT用第8代OLED已经成为继刚性OLED、柔性OLED、硅基OLED、TV OLED之后,另一个崭新的行业“赛点”。但TCL华星却明确表示目前没有8代产线的投资计划,另外维信诺、天马等主要面板玩家,目前也没有明确表示会投资8.6代OLED产线。 多数玩家保持观望,首先可能是技术风险。根据行业分析,相比传统LCD在笔记本电脑上的表现,OLED寿命跟价格明显处于劣势,建设IT面板产线的技术挑战也随之升高;另外无论是IT用还是TV用,技术路线都存在不确定性,进而导致企业的“投资选择困难”,毕竟谁都不想投产即落后。 去年底,天马在回应投资者时提到,行业上8.x代OLED产线的目标市场更多聚焦IT类产品,IT等中尺寸产品向OLED技术过渡需要一定时间,这些新线产能释放速度、放量规模、良率等短期内或会存在一定不确定性,将对这些领域产品供应格局、技术规格等有一定影响。 第二大原因是投资回报难以评估。从三星和京东方来看,建设8.6代OLED产线的投资动辄数百亿元。例如,一台OLED产线的核心设备——佳能Tokki蒸镀机的价格在8000亿韩元左右(约合人民币43.2亿元),ULVAC蒸镀设备至少要5000-6000亿韩元(约合人民币30亿元)。 面对高昂投资,厂商势必要权衡未来市场潜力。目前来看,尽管IT用OLED面板增速可观,但规模总量较小,再加上OLED屏幕目前大概率还是被用于旗舰产品,导致出货量会更低。即使将华为、苹果等厂商的IT产品全部换成OLED,跟智能手机的整体市场规模也无法相比。 第三个原因是,现有5.5代或6代OLED产线虽然切割效率不如8.6代线,但也能供应IT领域。例如三星目前就是在5.5代OLED产线上生产笔记本电脑OLED面板,TCL华星也布局了5.5代印刷OLED产线。在前景不明朗的情况下,厂商对大规模投资保持谨慎也是明智之举。 “随着材料、设备等产业链合作伙伴的共同努力,印刷打印的产业准备度近几年得到提高,公司因此也推进了5.5代实验线的投建。但目前下游OLED中尺寸产品需求、印刷产业链成熟度和公司技术进展尚未达到大规模量产条件,公司会秉持审慎态度推进。”TCL方面表示。 但对肩负引领韩国显示产业重任的三星来说,为了应对中国面板厂商的竞争压力,即便缩小投资规模,也必须硬着头皮继续押注。而京东方近些年更是紧跟三星投资步伐,在三星2011年投产5.5代OLED产线后,京东方也在2013年投产全球第二条AMOLED生产线。 这次双方布局8.6代OLED产线,虽是冒险之举,但也给面板竞争带来更多看点,最终鹿死谁手仍存悬念。 而三星和京东方选择此时投资,也恰逢新一轮面板上行周期开启,业绩都恢复了增长。今年一季度,京东方实现营收458.88亿元,同比增长20.84%;净利润9.84亿元,同比增长297.8%。TCL科技实现营收399.08亿元,同比增长1.18%;归母净利润2.4亿元,同比增长143.71%。
马斯克:人工智能目前在太空探索领域表现不佳
IT之家 5 月 7 日消息,埃隆・马斯克近期参加了第 27 届米尔肯全球大会,在谈话中,这位特斯拉和 SpaceX 的 CEO 表达了对人工智能 (AI) 的看好,认为“追求真理”的人工智能可以“促进人类文明发展”。然而,当被问及人工智能是否能 “加速” 太空探索进程时,他的态度却并不那么热切。 图源 Pixabay “人工智能能帮助您更快地实现太空探索目标吗?” 主持人迈克尔・米尔肯问道。 马斯克回答说,“事实上,太空探索领域几乎没有用到人工智能。SpaceX 和 Starlink 基本不使用人工智能技术。这并不是因为我反对,而是因为目前为止我们还没找到合适的应用场景。” 马斯克表示,他曾尝试用改进的人工智能语言模型来学习太空知识,但结果并不理想。“我问过这些模型费米悖论、火箭发动机设计和电化学等方面的问题,但到目前为止,他们的回答都差强人意,” 马斯克说,费米悖论是指如果银河系中存在大量地外文明,那么我们应该很容易就能观测到它们,但现实情况却并非如此。因此,人工智能在太空探索领域还有很长的路要走。 尽管对太空探索领域的 AI 应用持保留态度,马斯克仍然通过他的初创公司 xAI 大力投资人工智能的研发。xAI 官网称,其目标是利用人工智能技术 “加速人类科学发现”。此前,马斯克曾预测人工智能将在 2026 年底超越人类智能。 在马斯克的其他公司,人工智能的应用则更加广泛。他将类似于 ChatGPT 的聊天机器人 Grok 整合到了社交媒体平台 X 当中,并考虑利用人工智能技术来帮助用户总结新闻信息。 对于特斯拉,马斯克希望打造一款名为 Optimus 的智能人形机器人,用于生产作业。不过,由于持股比例问题,特斯拉汽车业务目前暂停了人工智能的研发。马斯克在 X 平台表示,拥有 25% 的股份才能让他对特斯拉人工智能的发展方向拥有更大影响力。 IT之家注意到,除了看好人工智能的潜力,马斯克同时也对潜在的风险表示担忧,例如人工智能可能带来的虚假信息传播和广泛的自动化带来的失业问题。这位科技亿万富翁还认为,超级智能人工智能既有可能拯救人类,也有可能毁灭人类。 “我认为人工智能可能会导致人类灭亡,” 马斯克在 3 月份举办的富 Abundance 峰会“人工智能辩论”研讨会上表示,“我可能同意 Geoff Hinton 的观点,这个概率大约在 10% 到 20% 之间。” 但他同时也表示,尽管存在风险,我们仍然应该冒险。“我认为积极的可能性大于消极的可能性,” 他说道。 5 月 7 日消息,马斯克在被问及人工智能是否会加速他在太空探索方面的努力时表示:“奇怪的是,太空探索几乎没有使用人工智能。所以 SpaceX 基本上没有使用人工智能,Starlink 也没有使用人工智能。我并不反对使用它,但我们还没有看到它的用途。”马斯克说,他一直在测试改进后的人工智能语言模型,向它们提出有关太空的问题,结果令人失望。
全国首例“AI外挂”案宣判:被告人获刑三年缓刑五年
凤凰网科技讯 (作者/周文浩)5月7日,在5月6日下午,鹰潭市余江区人民法院公开宣判全国首例“AI外挂”案,对被告人王某合以提供侵入、非法控制计算机信息系统程序、工具罪判处有期徒刑三年,缓刑五年,并处罚金人民币五十万元。 经审理查明:被告人王某合为通过制作出售 “AI外挂”的方式牟利,2022年,其先后联系万某至、张某(另案处理)等人编写“AI外挂”程序。程序制作完成后,王某合利用网络平台招聘陈某勇、张某文(另案处理)等人作为代理销售程序,并通过出售“AI外挂”点卡密码等获利。至案发,王某合非法获利共计629万余元,期间支付万某至制作费用84万余元,支付张某制作费用42万余元。 经鉴定,案涉“AI外挂”中“cvc”等程序对多款游戏中游戏画面数据进行了未授权获取,对游戏中处理的鼠标数据指令进行了未授权的修改,增加了游戏中“自动瞄准”和“自动开枪”的功能,干扰了游戏的正常运行环境,属于破坏性程序。盒子程序源代码具有接收计算机USB端口传输的鼠标数据指令,并对指令进行计算解析,再将计算结果发送至计算机USB端口,从而实现控制计算机鼠标指针自动移动和点击的功能。 鹰潭市余江区人民法院认为,被告人王某合提供专门用于侵入、非法控制计算机信息系统的程序、工具,并获取巨额利润,其行为构成提供侵入、非法控制计算机信息系统程序、工具罪,且情节特别严重。被告人王某合归案后如实供述自己的罪行,属坦白,依法可以从轻处罚;其自愿认罪认罚并退缴违法所得,依法可以从宽处理。法院遂作出上述判决。 早在去年9月,警方突然接到报案,报案者声称自己在使用了几次一款AI人工智能加持的游戏外挂后,使用了十几年的游戏账号就被突然封禁了。随后警方顺藤摸瓜,组织 20余名警力分赴浙江、重庆等地开展收网行动。此次行动共抓获犯罪嫌疑人 10 名,其中“外挂”程序作者2人,总代理1人、一级代理5人、二级代理2人,涉案流水金额高达 3000万。 警方称,与一般的游戏外挂不同,利用了AI人工智能算法技术来编写的AI外挂,功能更为强大,隐蔽性也更强,但仍然无法逃脱监测。
已有人开始用AI伪造车辆事故图片骗保 足以以假乱真
近年来,随着人工智能技术(AI)的发展,照片编辑软件变得越来越强大。然而,正如大多数技术一样,AI一方面方便了人们的生活,另一方面也开始被一些人用于不法之事。 AI 据《卫报》报道,已经有诈骗者开始利用AI照片编辑软件,用来篡改照片用于保险欺诈。在一起被提及的事件中,保险公司LV=收到了一张被编辑过的货车照片,照片显示货车的前保险杠受损。该照片还附有一张假发票,声称该车辆需要超过1000英镑的维修费用。 当公司的反欺诈团队对此问题进行调查时,他们在社交媒体上找到了原始图片,从而发现这张照片是伪造的。如果LV=没有进行调查,诈骗者可能就会因为一起根本没有发生的事故而获得赔偿。 伪造车辆事故图片和原图片 这并非个别案例,保险公司Allianz和Speedclear透露,“从2022年到2023年,使用应用程序编辑现实生活中的图片、视频和文件的案件增加了300%。”上述公司还表示,通过篡改图片骗保已经显示出成为保险行业最新大型骗局的所有迹象。解决这个问题其实不难,但却非常耗时,因为保险公司可以要求当事人提供更多证据或检查所谓的受损车辆。然而,这对客户和保险公司来说都不方便。 安联保险 尽管诈骗和欺诈是生活中的事实,但它们却导致了所有人的保险成本上升。在美国,由于包括车辆日益复杂、供应链问题和技工短缺等多种因素,汽车保险费率在过去一年中上涨了22.2%,这是近五十年来最大的涨幅之一。虽然这与上述骗局无关,但它反映了保险行业面临的挑战。
月之暗面撞上算力墙?
“不好意思,刚刚和Kimi聊的人太多了。Kimi有点累了,可以晚点再问我一遍。”近期正在赶毕业论文的娄晓彤,时不时仍会收到AI助手Kimi无法使用的提示。 作为大模型初创公司月之暗面旗下的To C应用,自3月份更新成为国内首个支持200万字上下文的大模型产品后,Kimi爆火出圈,QuestMobile数据显示,Kimi 应用月活用户量在3月份飙升至589.7万,但算力焦虑也随之而来。即便距产品更新已经过去一个多月,娄晓彤的遭遇仍在部分用户身上逐一上演。 月之暗面向字母榜解释称,“其实是因为每天都有相对的高峰期和低谷期,高峰期可能会遇到(类似娄晓彤的)情况。” 每次产品更新,对大模型公司而言都是一次流量和算力的双重考验。在3月18日宣布支持200万字上下文后,彼时Kimi便遭遇一次大规模宕机:从3月21日开始,Kimi APP和小程序被爆均无法正常使用。月之暗面随后发布情况说明,“观测到Kimi的系统流量持续异常增高,流量增加的趋势远超对资源的预期规划。” 理论上,Kimi等AI助手可以支持的用户量几乎没有上限,只要大模型公司能够提供源源不断的算力供给,但这背后涉及的却是一个现实的效率平衡问题,在商业化尚未走向闭环的当下,这也是一众大模型产品的共同难题:配置冗余算力,难免带来部分时间段内的资源浪费;配置紧张算力,则不可避免会在高峰期内影响用户体验。 尚需投资储备算力资源的月之暗面,在近期被爆出创始人杨植麟通过售出个人持股已套现数千万美元消息后,更是一时间引发诸多猜测。 被商业化绊住的不止Kimi。就连行业老大哥微软推出的AI编程工具GitHub Copilot,哪怕已经坐拥180万付费用户,仍陷在入不敷出状态:去年10月,月费10美元的GitHub Copilot,被爆平均每个月在每个用户身上都要倒贴20美元,最高能达80美元。 同样困在商业变现中的OpenAI,为了尽可能追求效率平衡,在免费版ChatGPT之外,特意设计出了付费版ChatGPT Plus。高峰时段,ChatGPT Plus用户将享有优先使用权,可以获得更迅速的服务响应。 但随着用户规模暴涨,自去年2月推出付费版以来,OpenAI曾几度暂停ChatGPT Plus新用户注册,给出的理由是“需求量过大”,导致算力资源出现缺口。 大模型产品的规模效应和网络效应仍处在市场潜伏期。这也使得部分投资人开始对大模型产品去魅,典型代表如金沙江创投主管合伙人朱啸虎,其在接受腾讯科技采访中表示,从2023年下半年开始,自己便决定不再和美国同事开原定每周一次的远程例行会议,探讨两边大模型产业格局变化,“打了半年我不打了,没有意义。”相比期待大模型产品在未来某一时刻迎来“iPhone时刻”,朱啸虎更在意当下能马上变现的To B应用。 资本市场对大模型商业化的担忧更是进一步体现在刚刚发布财报的Meta身上。“即使将我们的许多现有资源转移到人工智能上,在我们从这些新产品中获得大量收入之前,我们仍然需要扩大我们的投资范围……这将是一个持续多年的投资周期。”扎克伯格宣告扩大对AI投资话音落地,当地时间4月25日,Meta股价盘后应声下跌超10%。 对于Kimi这类缺乏自身造血能力的大模型创业公司而言,相比Meta,其面临的挑战只多不少:在这场效率平衡游戏中,它们宛如行走在悬于空中的钢丝绳上的杂技演员,投资款便是平衡木,到达对岸的唯一路径,便是在投资款耗尽之前,找到能够自我造血的商业模式。 01 春节期间,娄晓彤被身边同学安利了Kimi,当时Kimi支持的上下文长度只有20万字。加上彼时还未出圈,在日常使用中,娄晓彤基本没遇过无法使用情况。 随着Kimi将上下文长度扩展到200万字,并通过在资本市场上衍生出Kimi概念股火速出圈,从3月中旬开始,娄晓彤遭遇Kimi提示“有点累了”的情况,逐渐多了起来。 娄晓彤正在遭遇的算力紧张,从Kimi诞生后便已是注定的局面。去年3月创立月之暗面后,杨植麟便定下了做产品的两大思路:只做To C,且坚持长文本路线。 图源:月之暗面官网截图 文本长度和算力成本之间不可调和的矛盾,以及To C和高额营销成本之间的取舍,成为摆在杨植麟面前的两重平衡难题。 3月份Kimi借助支持200万字上下文出圈后,新浪科技曾报道称,Kimi用户获客成本达到12元-13元,其每天获客成本超过20万元。 大模型耗钱也早在杨植麟预料之中。“它需要人才聚集、资本聚集。”杨植麟形容道。 短短一年多时间内,月之暗面已经拿下近百亿人民币投资:2023年,月之暗面完成两轮总计近20亿人民币投资;今年2月份,月之暗面完成新一轮10亿美元融资,由阿里巴巴领投,红杉中国、小红书、美团等机构跟投,投后估值超过25亿美元。 近百亿融资款,更多都被用以支付算力资源。据市界报道,新一轮10亿美元融资款中,领投方阿里出资的8亿美元并非全是现金,其中部分将以阿里云提供的算力结算。 这方面行业早有惯例。更早之前微软百亿美元投资OpenAI,其中大部分投资款便是以微软云服务提供的算力资源结算。在微软参投之前,OpenAI其实是从谷歌云服务采购算力资源。如此一来,微软投出去的钱,大部分又以云服务的方式流了回来。 更重要的是,微软还借此完成了股价飙升,总市值不仅突破3万亿美元,更是超越苹果,成为全球市值最高上市公司。 亚马逊随后便来了个有样学样。今年3月底,亚马逊正式完成对OpenAI最强对手Anthropic 40亿美元的投资。与OpenAI一样,Anthropic也需要选择亚马逊作为其主要云服务商。 02 因算力资源而导致服务中断的现象,不只发生在Kimi一家身上,包括文心一言、ChatGPT等,都曾出现过无法正常使用的情况。 据字母榜不完全统计,每次产品更新升级的节点,便是大模型产品可能迎接“崩盘”命运的开始。 去年4月份,ChatGPT付费版本推出2个月后,ChatGPT Plus被爆暂停新用户注册,OpenAI给出的理由是“需求量过大”,导致算力资源出现缺口。付费通道恢复正常后,OpenAI再次收紧GPT-4的互动次数,从每4小时100条消息降为每3小时25条消息。 7个月后的2023年11月,OpenAI在首届开发者大会上带来一系列产品更新:全新GPT-4 Turbo、自定义GPT以及上线GPT商店。在大会结束后的短短两天内,ChatGPT服务器再次崩溃:用户数量的激增又一次超过了OpenAI的算力容量。 作为OpenAI CEO的山姆·奥特曼都不得不亲自下场致歉,称新功能的热度远远超出了公司预期。“由于负载的原因,短期内可能会出现服务不稳定的情况,对不起。” 最近一次“崩盘”发生在4月份。为了再次降低使用门槛,扩大用户量,在全球185个国家/地区累积超1亿每周用户量后,OpenAI宣布用户无需注册账户就可以使用ChatGPT,“我们正在逐步推出这一功能,目的是让任何对其功能感兴趣的人都可以使用人工智能。” 在OpenAI还没来得及将上述新功能扩散到全球所有地区时,社交媒体上已经陆续有用户反馈,自己在与ChatGPT互动时又被提示“系统错误”了。 除了采购更多算力资源来提升用户体验之外,一众大模型公司也在想方设法通过降低算力成本来满足更多用户需求。 截至4月份,国内文心大模型推理性能被爆提升了105倍,推理成本降到了原来的1%。这意味着,客户原来一天调用1万次,同样成本现在可以调用100万次。 国外OpenAI的奥特曼,更是在近期接受采访时预言,“我们(OpenAI)可以将非常高质量的AI技术成本降至接近零……如果我们没有制造足够的计算资源、供应和需求失衡,或计算成本攀升,这将导致AI成本非常高。”在奥特曼看来,未来AI技术成本将会变得越来越便宜。 03 使用更高效的硬件,便是推动AI技术成本降低的直接手段。 几乎在奥特曼预测AI技术成本将变得越来越便宜的同一时期,英伟达创始人黄仁勋又来给OpenAI送芯片,这次是量产最强一代的全球第一台Nvidia DGX H200超级计算机。OpenAI总裁格雷格·布罗克曼还特意晒出了自己、奥特曼与黄仁勋的三人大合照。 但对于已经无法获得英伟达最强芯片的中国大模型公司而言,借助人才优化算法以减少算力需求,则是另一条降低AI技术成本的路径。 4月23日,界面新闻爆出杨植麟通过售出个人持股已套现数千万美元消息后,月之暗面随即对外回应称“消息不实”,并向媒体发来了一则招聘文章说明,里面重点提到,为了吸引并留住最优秀的人才,月之暗面推出全新员工激励计划,为优秀人才提供匹配其贡献的丰厚回报。“从今年开始,我们将在公司取得重要进展时发起员工期权回购计划,确保团队成员能够分享公司发展的果实(2024年底启动首次期权回购计划)。每年定期根据工作表现进行调薪和期权增发,确保薪酬和期权充分反映出员工个人的成长和贡献。” 由此,外界也猜测杨植麟团队此次套现,其中或许便包括对重要人才的贡献奖励。 在公司创立伊始,杨植麟给出的早期招人画像便是专注找对口的genius(天才)。“公司上限是由人的上限决定的……之前有对模型动手术的能力,有训练超大规模模型直接的经验,就可以很快做出来。包括Kimi发布,资本效率和组织效率其实很高。” 与国内相比,硅谷AI人才之争,更为疯狂。马斯克本人都不得不感慨:“这是我见过最疯狂的人才大战。”为了避免特斯拉人才外流,马斯克旗下的大模型公司xAI开出了不少offer。 扎克伯格更是亲力亲为,通过个人电子邮件给谷歌DeepMind团队成员发去邀请,希望他们能加入Meta与他共事。谷歌创始人谢尔盖·布林,为了挽留即将离职转投OpenAI的员工,也同样选择亲自出马,给员工加薪加福利。 人才大战之下,根据薪资数据网站 Levels.fyi数据,硅谷机器学习和AI工程师的薪酬中位数已经接近 40万美元,OpenAI总薪资中位数甚至高达92.5万美元(包括期权)。 尽管为争夺AI人才,科技巨头开支增加,但他们的一系列疯狂举动已经在股价上迎来正反馈:2024年刚过完4个月,Meta股价年内已经大涨22%,谷歌大涨19%,亚马逊大涨19%。
挑战OpenAI,微软自研5000亿参数绝密武器曝光
原标题:挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队 【新智元导读】没有OpenAI,微软还有万全之策!首个5000亿参数大模型MAl-1正在研发,前谷歌DeepMind负责人领衔,预计5月底亮相。 不需要OpenAI,微软或许也会成为AI领头羊! 外媒Information爆料称,微软内部正在开发自家首款5000亿参数的大模型MAl-1。 这恰好是,纳德拉带领团队证明自己的时候到了。 在向OpenAI投资100多亿美元之后,微软才获得了GPT-3.5/GPT-4先进模型的使用权,但终究不是长久之计。 甚至,此前有传言称,微软已经沦落为OpenAI的一个IT部门。 在过去的一年,每个人熟知的,微软在LLM方面的研究,主要集中在小体量phi的更新,比如Phi-3的开源。 而在大模型的专攻上,除了图灵系列,微软内部还未透露半点风声。 就在今天,微软首席技术官Kevin Scott证实,MAI大模型确实正在开发中。 显然,微软秘密筹备大模型的计划,是为了能够开发出一款全新LLM,能够与OpenAI、谷歌、Anthropic顶尖模型竞争。 毕竟,纳德拉曾说过,「如果OpenAI明天消失了,也无关紧要」。 「我们有的是人才、有的是算力、有的是数据,我们什么都不缺。我们在他们之下,在他们之上,在他们周围」。 看来,微软的底气,就是自己。 自研5000亿MAI-1大模型 据介绍,MAI-1大模型由前谷歌DeepMind负责人Mustafa Suleyman,负责监督。 值得一提的是,Suleyman在加入微软之前,还是AI初创Inflection AI创始人兼CEO。 创办于2022年,一年的时间,他带领团队推出了大模型Inflection(目前已更新到了2.5版本),以及日活破百万的高情商AI助手Pi。 不过因为无法找到正确的商业模式,Suleyman和另一位联创,以及大部分员工,在3月份共同加入微软。 也就是说,Suleyman和团队负责这个新项目MAI-1,会为此带来更多的前沿大模型的经验。 还是要提一句,MAI-1模型是微软自研发的,并非从Inflection模型继承而来。 据两位微软员工称,「MAI-1与Inflection之前发布的模型不同」。不过,训练过程可能会用到其训练数据和技术。 拥有5000亿参数,MAI-1的参数规模将远远超出,微软以往训练的任何小规模开源模型。 这也意味着,它将需要更多的算力、数据,训练成本也是高昂的。 为了训练这款新模型,微软已经预留了一大批配备英伟达GPU的服务器,并一直在编制训练数据以优化模型。 其中,包括来自GPT-4生成的文本,以及外部来源(互联网公共数据)的各种数据集。 大小模型,我都要 相比之下,GPT-4曾被曝出有1.8万亿参数,Meta、Mistral等AI公司发布较小开源模型,则有700亿参数。 当然,微软采取的是多管齐下的策略,即大小模型一起研发。 其中,最经典的便是Phi-3了——一个能够塞进手机的小模型,而且最小尺寸3.8B性能碾压GPT-3.5。 Phi-3 mini在量化到4bit的情况下,仅占用大约1.8GB的内存,用iPhone14每秒可生成12个token。 在网友抛出「应该用更低成本训练AI,不是更好吗」的问题后,Kevin Scott回复到: 这并不是一个非此即彼的关系。在许多AI应用中,我们结合使用大型前沿模型和更小、更有针对性的模型。我们做了大量工作,确保SLM在设备上和云中都能很好地运作。我们在训练SLM方面积累了大量经验,甚至还将其中一些工作开源,供他人研究和使用。我认为,在可预见的未来,这种大与小的结合还将继续下去。 这表明,微软既要开发成本低廉、可集成到应用中,并能在移动设备上运行的SLM,也要开发更大、更先进的AI模型。 目前,微软自称是一家「Copilot公司」。得到AI加持的Copilot聊天机器人,可以完成撰写电子邮件、快速总结文件等任务。 而未来,下一步的机会在哪? 大小模型兼顾,正体现了充满创新活力的微软,更愿意探索AI的新路径。 不给OpenAI当「IT」了? 话又说回来,自研MAI-1,并不意味着微软将会抛弃OpenAI。 首席技术官Kevin Scott在今早的帖子中首先,肯定了微软与OpenAI合作五年的坚固「友谊」。 我们一直在为合作伙伴OpenAI建造大型超算,来训练前沿的AI模型。然后,两家都会将模型,应用到自家的产品和服务中,让更多的人受益。 而且,每一代新的超算都将比上一代,更加强大,因此OpenAI训出的每个前沿模型,都要比上一个更加先进。 我们将继续沿着这条路走下去——不断构建更强大的超算,让OpenAI能够训练出引领整个行业的模型。我们的合作将会产生越来越大的影响力。 前段时间,外媒曝出了,微软和OpenAI联手打造AI超算「星际之门」,将斥资高达1150亿美元。 据称,最快将在2028年推出超算,并在2030年之前进一步扩展。 包括此前,微软工程师向创业者Kyle Corbitt爆料称,微软正在紧锣密鼓地建设10万个H100,以供OpenAI训练GPT-6。 种种迹象表明,微软与OpenAI之间合作,只会更加牢固。 此外,Scott还表示,「除了与OpenAI的合作,微软多年来一直都在让MSR和各产品团队开发AI模型」。 AI模型几乎深入到了,微软的所有产品、服务和运营过程中。团队们有时也需要进行定制化工作,不论是从零开始训模型,还是对现有模型进行微调。 未来,还会有更多类似的这样的情况。 这些模型中,一些被命名为Turing、MAI等,还有的命名为Phi,我们并将其开源。 虽然我的表达可能没有那么引人注目,但这是现实。对于我们这些极客来说,鉴于这一切在实践中的复杂性,这是一个非常令人兴奋的现实。 解密「图灵」模型 除了MAI、Phi系列模型,代号「Turing」是微软在2017年在内部开启的计划,旨在打造一款大模型,并应用到所有产品线中。 经过3年研发,他们在2020年首次发布170亿参数的T-NLG模型,创当时有史以来最大参数规模的LLM记录。 到了2021年,微软联手英伟达发布了5300亿参数的Megatron-Turing(MT-NLP),在一系列广泛的自然语言任务中表现出了「无与伦比」的准确性。 同年,视觉语言模型Turing Bletchley首次面世。 去年8月,该多模态模型已经迭代到了V3版本,而且已经整合进Bing等相关产品中,以提供更出色的图像搜索体验。 此外,微软还在2021年和2022年发布了「图灵通用语言表示模型」——T-ULRv5和T-ULRv6两个版本。 目前,「图灵」模型已经用在了,Word中的智能查询(SmartFind),Xbox中的问题匹配(Question Matching)上。 还有团队研发的图像超分辨率模型Turing Image Super-Resolution(T-ISR),已在必应地图中得到应用,可以为全球用户提高航空图像的质量。 目前,MAI-1新模型具体会在哪得到应用,还未确定,将取决于其性能表现。 顺便提一句,关于MAI-1更多的信息,可能会在5月21日-23日微软Build开发者大会上首次展示。 接下来,就是坐等MAI-1发布了。
苹果折叠屏新专利曝光:可双向灵活折叠
最近,美国专利商标局(USPTO)公布了苹果公司的一项新专利,该专利涉及一款具有独特铰链设计的折叠屏设备,给未来的 iPhone、iPad 或 Mac 的形态提供了新的可能性。 据 USPTO 公示的信息显示,苹果的这项新专利最大的亮点在于其创新的铰链设计。这一设计使得折叠屏设备能够实现双向折叠,即屏幕既可以向内折叠,也可以向外展开。 与目前市场上传统的单向折叠屏手机相比,苹果的这一设计提供了更加灵活的使用方式。 苹果的双向折叠设计采用了多个铰链连接并耦合,以实现旋转运动,使得铰链两侧的部分可以串联延伸。然而,从专利图中来看,相邻铰链连杆的整体旋转量可能会受到限制。 除了上述结构,这个专利还展示了一种齿轮状的铰链设计。 专利图中的齿轮板具有容纳轴的开口,使得齿轮板可以绕轴旋转,从而实现外壳的同步旋转。每个齿轮板还有一个月牙形槽,用于容纳导向销。 「双向折叠屏」形态并非苹果首创,已经有其他公司在这方面有所研究。在今年的 CES 2024 上,三星已经展示了多款屏幕新品,其中包括一款名为 In&Out Flip 的 OLED 屏幕。 这款原型机的铰链部分可以完成 360 度旋转,使得其屏幕既能实现内折叠,又能实现外折叠。 LG 在之前也公布过类似的「双向折叠屏」原型机,是一款 8.03 英寸 360 度可折叠 OLED 产品。 海通国际证券分析师 Jeff Pu 最近公布了一份报告,指出苹果正在加紧开发可折叠设备。报告中称,苹果将于 2025 年底开始量产 20.3 英寸的可折叠设备。 此前,郭明錤曾提及苹果正在开发一款 20.3 英寸可折叠 MacBook,预计 2027 年发布。Ross Young 也报道了苹果开发 20 英寸可折叠设备的消息,称该设备将于 2026 年或 2027 年发布。 彭博社的 Mark Gurman 也表示,苹果正在「探索一种双屏幕、可折叠的 MacBook / iPad 混合设备」。 除了大屏折叠屏外,苹果在折叠手机领域的探索也在一直前进。Jeff Pu 还在报告中提到,苹果的可折叠手机将代表「苹果的新阵容」,目标是「超高端市场」。 据报告所示,苹果正在为可折叠 iPhone 探索两种屏幕尺寸: 7.9 英寸和 8.3 英寸。这款可折叠 iPhone 据称将于 2026 年底问世。 与头戴式设备相比,手持移动设备依旧有着很大的不可替代性,这方面的创新不只是将屏幕折叠就可以完成。苹果需要思考如何更好的呈现内容,以及如何将折叠屏融入苹果生态,这些都是成为「新 iPhone」或是「新 iPad」的关键所在。
逛完北京车展的雷军,陷入了深深的绝望
雷军的 新思考 为期 10 天的北京车展结束了。 这期间,北京成为了全球汽车行业的话题中心,1500 多家企业参展、278 款新能源车型亮相、117 台新车全球首发、163 场新闻发布会,客流达到 89.2 万人次,创历史新高。 最热的展台自然是小米汽车,累计接待了超过 15 万人。车展首日就已经被挤得里三层外三层,晚到的媒体记者只能隔着人群,抱怨自己为何没有带上超长焦镜头。 发布会后,雷军本人也加入了「逛展大军」,先后拜访了数十个展台,引发现场的巨大轰动。往后几天,「跟着雷军逛北京车展」也持续霸占着热搜榜。 可让所有人都没想到的是,逛完展的雷军,陷入了深深的绝望。 在日前举办的 2024 中关村论坛年会上,逛完车展的雷军分享了自己的感受。雷军认为,现在国内车圈的卷是「同质化的卷」,他很难理解,为何中国车企要做如此多「一样的产品」。 我走访完之后挺绝望的,你们这哪是做产品,完全是在靠蒙。 诚然,雷军此番言论与其背后的企业利益是相匹配的,但他的观点本身,也不无道理。 随着国内新能源汽车产业链的日趋成熟,造车周期越来越短,门槛也越来越低。在这样的行业背景下,一些新势力车企造车就像是煮一锅「东北乱炖」,原料无非就是排骨、豆角、土豆、西红柿等,造出来的车也都大同小异。 风口之下,一些企业的开发流程愈发讲求成本和效率,PPT 上加粗的「用户需求」,沦为讲故事的工具。 贴近用户,才能赢下用户 官方数据显示,自 4 月 3 日开启交付以来,小米汽车在 28 天的时间里完成了 7058 辆交付,截至 4 月 30 日 24 时,锁单量达到 88063 辆—— 这与当前纯电市场整体增速放缓的趋势不相吻合。 人们开始思考,小米汽车为何能拥有超越行业认知的起步速度,仅凭雷军和小米的品牌积累,就足以成就这一行业奇迹吗? 回顾小米 SU7 那场持续 2 小时的产品发布会,雷军并未过多介绍产品的常规功能,诸如城市领航辅助驾驶、800V 超快充技术、3 秒内的零至百公里加速等常规亮点,都被雷军一笔带过,有些信息甚至直接通过视频展示,无需赘言。 显然,雷军的目标很明确:向观众清晰地展示小米 SU7 的独特之处。 拥有 13 年手机制造经验的小米,早已积累了大批品牌拥趸,随着小米进军汽车领域,这些用户自然成为了 SU7 的潜在客户基础。然而,这一部分用户对于汽车的产品和市场认知都较为有限,初入车圈的雷军不仅要做好一辆车,还需要通过一系列配置,把「好用」二字贴在脸上。 ——这也是小米汽车将技术内容放在 12 月单独发布原因之一。 技术决定高度,需求决定广度。从锁单用户数据来看,雷军的策略是成功的。 小米披露的数据显示,小米 SU7 的女性直接购买者占比高达 28%。雷军进一步预测,如果考虑到赠送或为家人购买的情况,女性车主的占比有望增至 40%至 50%之间。 这一比例在运动轿车市场中极为突出,甚至超过了以女性车主比例高而著称的保时捷,后者的女性车主大约占其车主总数的30%。 小橘是一位 95 后女生,原本计划购入一辆特斯拉 Model 3 长续航版,但又担心后面会降价,犹豫了许久都未下定。这时,SU7 的发布,改变了她的想法。 虽然她本人从未购买过小米手机,但作为在互联网浪潮中成长的一代,她对雷军在机圈的「江湖地位」也有所耳闻,回看小米汽车发布会后,小橘当即决定买一辆 SU7 Pro。 「其实我看到前面三分之一的时候就决定要买它了」,小橘回忆称,当时雷军刚好讲到「好看、防晒」。 事实上,无论是触手可达的雨伞槽,还是可以化身充电宝的强光手电,亦或是让女性车主摘下冰袖的遮阳伞,都是雷军触达用户「心巴」的灵感之作。那一晚,他一项又一项地缕清 SU7 的优势,并以此来体现「比 Model 3 还便宜 3 万」的诚意。 这就是雷军的高明之处。 被雷军折服的不只是那些乖乖掏钱的用户,还有许多来自海外的媒体和厂商人员,他们之中,有穿着一身笔挺西装的,也有扛着长枪短炮、背着大包小包的,还有披着一身长袍、蓄了一脸胡须的。 据北京车展组委会统计,车展首日即迎来 1148 名国外媒体记者,并有 7401 位海外经销商前来观展和洽谈合作,展会 10 天到场的国际观众累计达 2.8 万人次。中国汽车的卓越表现和创新实力赢得了他们的广泛赞誉,而小米 SU7,成为了其中的代表。 一位来自海外品牌的厂商人员对董车会表示,他和几位同事都是第一次来中国车展,中国汽车,尤其是小米汽车,给他们带来了极大的震撼。 中国以外的车企应该注意到这样一个事实:他们需要立即推出贴近用户的产品。 他面带微笑,礼貌地说出这句话,但同时眉头却不易察觉地微微皱起。 用户需要的,不止冰箱、彩电、大沙发 提到「用户」和「需求」这两个词,有一家车企是绕不开的,那便是理想汽车。「关注用户价值,超越用户需求」,是他们做产品的基本方法论。 在李想看来,超越用户需求就是回归产品的本质,真正的用户价值,一定是帮助用户解决了某个问题,或者完成了某项任务,而不是仅仅提供了某个简单的功能。 在理想汽车内部,团队所有工作的起点,都是 PEA(Product Experience Assessment,产品体验评估),无论是做一个服务,开一个发布会,还是构建一个产品功能,都需要提交 PEA 评审。 而在需求的验证方面,理想同样有一套自己的方法,其核心在于「场景」二字—— 不要凭空地说这个需求存不存在,而是到具体的场景中去验证,看场景是否足够真实,执行是否足够彻底。在这样有序的模式下,理想团队对用户需求的理解愈发透彻,「超越用户需求」这句话,自然就不会成为一纸空谈。 挖掘用户的真实需求,把别人的痛点变成自己的卖点。这是李想交付了 70 万辆车之后总结出来的方法论。 但遗憾的是,一些车企领导错误地将这条方法论错误地归纳成了三个词:冰箱、彩电、大沙发。于是乎,领导们在发布会上念着差不多的稿件,社交平台上充斥着差不多的营销内容,销售们也用差不多的话术卖着差不多的车。 主打一个「人有我有」,你做不到,就是你有问题。 更是有博主极端地认为,车是用来坐的,和现在的手机一样,最后所有的车都会变成一个所谓的「最优形态」,在空间、能耗、体验和成本上达到了最优解。 然而,现实情况是,当前手机品牌依旧保持着各自的独特性,形态上的持续创新和调校上的风格化,不断推动着手机市场的正向发展。相反,产品同质化所引发的激烈竞争,只会导致行业内的严重资源消耗。在这种情况下,价格战似乎成了企业唯一的求生之道,而个性与创新则逐渐沦为天方夜谭。 感受到雷军的绝望了吗? 倘若论资排辈,雷军和他的小米汽车确实是造车新手,但也正因如此,才能跳出传统造车思维。正如马斯克和特斯拉背后的「第一性原理」,有时候,新玩家就未必没有值得学习的地方。 雷军最近好几次提到了一个观点:把车做得尽量简单,让用户选购配件来完成自己的需求。换言之就是首先满足大部分人的口味,再在桌面上摆上一瓶辣椒酱,想吃辣的自己加—— 这是小米汽车塑造个性、打造标签的新方法,同时也是小米对于用户需求的新思考。 汽车行业,需要更多这样的新思考。
天玑 9300+ 旗舰芯片正式发布,联发科要全面助力 AI
5 月 7 日,联发科在天玑开发者大会 MDDC 2024 上发布了新款旗舰处理器 —— 天玑 9300+。这颗芯片除了在网络连接、节能低耗等方面带来升级之外,还着重在 AI 领域进行发力。 联发科是目前唯一采用全大核的手机芯片厂商,天玑 9300+ 也是沿用了这一架构。 根据联发科官方介绍,天玑 9300+ 采用台积电第三代 4nm 制程工艺,拥有四个 Cortex-x4 超大核,其中一个主频可达 3.4GHz,相比天玑 9300 的 3.25GHz 有所提升。 另外,天玑 9300+ 还有四个 2.00 GHz Cortex-A720 大核,GPU 则采用了 Arm 的 Immortalis-G720。同时,处理器内置 18MB 内容缓存,支持 LPDDR5T 与 UFS 4.0。 AI 是这次开发者大会的核心,整场大会所渲染的未来图景也都围绕着生成式 AI 展开。联发科持续在 AI 上押注,想要构建一个「生成式 AI 生态链」。 联发科总经理陈冠洲表示,「若要创造新的生成式 AI 生态链,最好的方法不是从无到有,而是在已有的基础上做升级。」 手机拥有最多的端侧算力,而且有庞大的用户规模。联发科计划利用智能手机既有的生态系统,创造完整的 AI 应用生态优势。 联发科与 Counterpoint 携手阿里云通义千问、百川大模型、OPPO、腾讯 AI Lab、vivo 等厂商,联合发布《生成式 AI 手机产业白皮书》,定义了「生成式 AI 手机」的概念和典型特征。 白皮书中提出,生成式 AI 手机需要具备如下必要特征: 支持大模型的本地部署,或是通过云端协同的方式执行复杂的生成式 AI 任务。 具备多模态能力。 确保流畅、无缝的用户体验,设备能够以自然而直观的交互方式,快速响应用户的请求。 拥有实现上述特征的硬件规格。 联发科资深副总经理徐敬全表示: 生成式 AI 手机将是智能手机进化的下一形态,移动生态正迎来远超以往的创新机遇。联发科将持续突破天玑移动平台的算力和 AI 能力,为生成式 AI 手机提供可靠、完备的解决方案,携手全球先进的 AI 大模型、开发者、终端厂商等行业生态伙伴,加速推进生成式 AI 的端侧部署和应用落地,为全球用户开启高度智能化、个性化的生成式 AI 手机新时代。 为此,联发科在天玑芯片进行硬件创新突破。 天玑 9300+ 内置「硬件级生成式 AI 引擎」,在端侧支持 AI 推测解码加速技术。 联发科已在第七代 AI 处理器(APU)上搭建了 ExecuTorch AI 框架,支持 PyTorch 开发流程,并带来了双 LoRA 融合的天玑 AI LoRA Fusion 2.0 技术。 天玑 9300+ 宣称「业界首款实现更高速 Llama 2 7B 端侧大模型运行」,速度达到了每秒 22 tokens。 未来联发科会与 Meta 继续合作,将在 ExecuTorch AI 框架上,完成 Meta Llama 3 大语言模型(LLM)8B 参数版本的布署。 游戏方面,天玑 9300+ 支持硬件级光线追踪技术,「星速引擎」也得到了全面升级。 借助这两项技术,天玑 9300+ 实现了「头部吃鸡游戏」90Hz 满帧运行一小时,功耗降低 20%。并且,联发科还与逆水寒达成了合作,也使得游戏运行功耗降低 10%。 为了获得流畅网络体验,联发科带来了「星速引擎」网络质量监测系统,能够在高帧游戏运行时有效节省功耗,并高效运用 Wi-Fi / 蜂窝网络双网并发技术,提升能效表现。 此外,联发科还将 AI 技术导入游戏交互与游戏内容生成领域,协助开发者实现大语言模型在游戏中的端侧应用。未来我们将可以在游戏中见到更拟人的 NPC,还能创造更个性化的游戏角色。 天玑 9000 系列、天玑 8000 系列平台已经支持星速引擎,稍后天玑 9300+ 平台和天玑 8250 平台也将加入。 对于开发者,联发科推出了全新的「天玑 AI 开发套件」,提供终端生成式 AI 应用开发的一站式解决方案。 「天玑 AI 开发套件」包含快速高效的 GenAI 最佳实践、覆盖全球主流大模型的 GenAI Model Hub、高效提升性能的 GenAI 优化技术和 Neuron Studio 一站式视觉化开发环境等四大模块,赋能终端生成式 AI 应用开发全流程。 此前,天玑 9300+ 的 Geekbench 和安兔兔成绩已经出现。在这两项跑分测试中,天玑 9300+ 的表现都超过了高通第三代骁龙 8。 据了解,vivo X100s 系列将首发联发科天玑 9300+,OPPO Reno 12 系列将首发天玑 8250,预计很快与大家见面。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。