EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
AI教母李飞飞:AI学术界没钱没资源!没有拨款将会凋亡
越来越多的科研人才去了科技大厂工作,从此告别科研。只因为大厂给的实在是太多了! 在计算机领域,究竟是搞工程还是做科研,一直都是一道不算容易的选择题。 不过,说到底程序员也是打工人。所以对大部分人来说,在拿更多的薪水和推动学术界进步之间,应该都会选前者。 而就收入来说,科技公司巨头从来都不吝啬给人才花钱——各种让普通打工人瞠目结舌的薪水层出不穷。这无疑会让很多有能力的人选择离开学术界,投奔大厂。 如此一来,AI教母——李飞飞可坐不住了。 大批人才流失,从做科研转到做工程,这可怎么得了! 于是她在一场演讲中,直接向美国总统拜登「谏言」:你赶紧多拨点款给科研人才吧! 多投点钱 李飞飞跟拜登说,赶紧投钱弄个全国性的算力和数据集的「大仓库」,这样AI届的研究人员才能追上科技公司的步伐。 作为斯坦福大学的教授,李飞飞肯定是时刻心系学术圈的。她也因此扛起了大旗,站在了和她观点一致的学者、政策制定者的最前列。 李飞飞的担心并非没有道理。 目前来看,全美最有钱的那一批大学,也远远比不上Meta、谷歌、微软这种科技大厂。 要知道,这些科技大厂每年在AI领域花好几十亿美元,这就和高校拉开了一道天堑。 举个例子,Meta目标要采买三十五万片定制化的芯片,也就是GPU,用来满足AI模型训练所需的巨大数目。 与之相比,斯坦福大学的自然语言处理小组,拢共只有68块GPU。 350000和68,这个差距无需赘言。 那对于高校来说,没GPU、没算力、没数据,怎么办?只能抱大厂的大腿。 一抱大腿,就看到了大厂员工数倍于自己的薪资。 不看不要紧,看完了,很多人就产生了跑路的想法。 这也就印证了李飞飞的说法:AI学术界的明星人才正在大量流失。 从结果上看,整个2022年,科技公司一共创造了32了业内知名的机器学习模型,而高校只弄出了3个。 要知道在8年前,2014年的情况还是反着的——大部分AI届的突破都是高校完成的。 研究人员从专业角度分析了这种局面未来可能的演变—— AI学者会更加在乎研究能不能落地,也就是能否商用。 上个月Meta的CEO扎克伯格宣布,公司的独立AI研究实验室会更加靠近Meta的生产团队,保证这两个部门达到某种程度上的「对齐」。 李飞飞表示,目前公共领域(即高校)的资源和人才储备远远落后于工业界。这会对整个行业的聚焦点产生深远的影响。公司都是逐利的,而公共研究更关注的是大众的福祉。 李飞飞本人一直在华盛顿,为找到新的投资努力。她和白宫科技政策办公室的Arati Prabhakar见过不少次,在高档餐厅和媒体见面,还拜访了美国国会山负责AI法律制定的官员。 不过,从大型科技公司的角度来说,他们一些时候也是乐意为国家公共项目做贡献的。 微软的首席科学家Eric Horvitz曾经就表示过,他们一直很重视和学术界同仁分享进展、共享资源。 而且美国政府也在不断努力——去年,美国国家科学基金会(National Science Foundation)就曾宣布投资1.4亿美元,成立总计7个由高校牵头办的国家人工智能研究院。 议题主要包括如何用AI来应对气候变化,减轻气候变化带来的影响,以及AI时代的教育问题等等。 不过,还是有业内学者表示,这种帮扶的力度和速度都不太够。 就拿近几年来说,科技大厂纷纷在聊天机器人和生图模型上等热门赛道上竞速,哪个公司招揽到更优秀的人才,就能在竞争中更胜一筹。 不少高校的计算机科学教授都被高薪挖了过去。而且不光是钱的事,研究的课题往往也比原先在高校里研究的东西有意思。 2023年,一份报告就显示,70%的人工智能博士进了私企。这个比例要比20年前翻了三倍多。 弊端在哪里 接着上面这个逻辑,大厂有钱和资源,高校相对匮乏,那高校就只能抱大腿。 实际上这种模式从表面上看问题并不大。 比如,2020年在全球最主要的AI会议上发表的论文,有40%的文章中至少有1名科技人员的参与。 企业也会资助高校的博士生进行相关的课题研究。 谷歌的发言人Jane Park也表示,谷歌的立场支持私营企业和高校应该携手合作,推进AI的发展。谷歌实际上也会定期公开研究成果,惠及更多的AI社群。 但是,高校对企业的依赖是程度很深的。MIT计算机科学与人工智能实验室的Neil Thompson表示,随着AI科学家不断压缩更多数据来提高模型的性能,对先进算力的需求只会扶摇直上。 而在这个事实的背后,是另一个事实——高校对企业的依赖只会越来越深。 如果没有资源、资金和数据的支持,任何研究者只会马上掉队,无缘更深入的研究。 在Meta和谷歌这种大公司里,他们自己的AI实验室的运作模式过去其实和大学是差不多的。由AI科学家来决定开展哪些项目。 过去,搞学术的员工和做工程的员工之间有明显的区分。对于重研究的员工,评判他们的标准和高校无差,都是看发表了哪些有影响力的论文,取得了哪些显著的突破。 但现在,竞争越来越激烈,同一个赛道上的竞争者数不胜数。所有科技公司都感到了未曾有过的紧迫感。 因此,学术界和产业界的泾渭愈发模糊,公司内部的研究自由受到削弱,市场主导慢慢占了上风。 简单来说就是,什么能马上落地,什么能马上为公司带来效益,就开展什么。 从实操层面,谷歌就在去年宣布把旗下两个AI研究小组合二为一,起名叫谷歌DeepMind。 而从研究方面,谷歌也把模式调整为,先转化产品,再分享论文。其后的用意不言自明。 Meta也是如此。 之前名为FAIR的基础人工智能研究团队被划到了Reality Labs,后来这个团队里的一部分研究人员又被调到了生成式人工智能的产品团队。 我们可以发现,现在的趋势就是,纯研究并不被公司所看重,或者说公司的注意力更多还是得放在实际能带来收益的产业上。 大厂员工真的赚很多吗? 现在让我们来看一看,把学术界吸引走的究竟是怎么样的高薪。 根据薪酬追踪网站Levels.fyi的数据显示,Meta公司人工智能研究科学家的薪酬中位数从2020年的256000美元攀升至2023年的335250美元。 3年里,薪资光中位数就涨了快10万美元。 而更有能力的人挣得钱肯定不止中位数,涨幅也要大得多。 AI初创公司Databricks的CEO Ali Ghodsi表示,只要有博士学位,并且有很多年开发AI模型的经验,这种资历的工程师4年甚至能拿到2000万美元的超高薪。 而就算把目光从顶薪上移开,整个计算机行业的薪资水平还是居高不下。 毕业五年内年收入的中位数,前三甲就有两个和计算机相关。 计算机工程排名第一,中位数达到8万美元。计算机科学排第三,中位数达到78000美元。 甚至多一层分析,排名第二的化学工程里,半导体也贡献了不少高收入。这也是和计算机息息相关的。
怕你的手机太好玩,它们做了款无聊手机|Feel Good 周报
就怕手机 太好玩 Feel Good 导读 苹果公司温室气体排放量已经达到减半 广汽传祺的这款新车,车中还有「车」? CASETiFY 推出地球日特别产品 喜力啤酒也做手机了 Veja:让鞋更「绿」,要从公司而非顾客角度考虑 苹果公司温室气体排放量已经达到减半 苹果在《2024 环境进展报告》中宣布,自 2015 年以来, 公司已将温室气体排放总量降低 55% 以上。 这一里程碑标志着苹果在实现 2030 目标的过程中已取得了重大进展。苹果 2030 目标的核心是在 2015 年碳排的基础上减排 75%。 苹果环境、政策与社会倡议副总裁 Lisa Jackson 表示: 我们的进展证明了苹果对环境行动的承诺:我们已经将碳排放量降低了一半以上,与此同时服务的用户人数有增无减。 与此同时,苹果也分享了材料和回收方面的创新: 去年,苹果产品使用的电池中 56% 的钴来自回收来源,是前一年的两倍多;而电池中 24% 的锂也来自经认证的回收来源。 苹果在去年出货的所有产品中,包装中只有 3% 是塑料。 去年,有近 1280 万台设备和配件通过 Apple Care 和 Apple Trade In 换购等计划送到了新机主手中,数量再创新高。 去年,100 多家供应商工厂实现节电超 20 亿千瓦时。加上其他主要与热能相关的节能措施,这些设施避免了近 170 万公吨的碳排放,比 2022 年增加了 25%。 广汽传祺的这款新车,车中还有「车」? 曾照料过老人或试过在腿脚受伤后独自上车的人会有体会,平常看似简单的「上/下车」动作也会是件难事。 最近,传祺新能源推出了一款新产品 —— 传祺新能源 E9 电动福祉版,定价 40.98 万元。 之所以叫作「福祉版」,是因为这款车型配备了一个全球首创的可分离电动福祉座椅。 福祉座椅是对行动不便人士设计的一种机械装置,该座椅可以直接从车内向外侧旋转移动到车外,并且下降到足够低的位置,让使用者可以方便地上下车。 而这次 E9 电动福祉版上的福祉座椅,不仅能为使用者提供相对方便的上下车方式,甚至还能从车身分离,成为一张独立的电动移动座椅。 据介绍,这个福祉座椅续航可达 26 公里;搭配了麦克纳姆轮,可原地掉头,即便在狭窄空间内也能灵活移动;支持车内和车外两种充电模式。 使用者可以通过 1.54 寸液晶控制器或以蓝牙连接手机 app 操作。 此外,座椅还支持个性化编程模式,可设置座椅旋转路径、前后移动、座椅靠背角度及降低高度,提升便捷性。 安全方面,福祉座椅通过了座椅动态碰撞(前冲/后冲)、整车正碰等 79 项严苛的试验,是首款通过国标测试的前装福祉座椅。 车门关闭时福祉座椅只能前后移动及缩回,突发情况无法供电时可手动收回座椅,还标配了 360° 安全气囊矩阵等,提供了多层安全保障。 CASETiFY 推出地球日特别产品 这个地球日,数码产品配件品牌 CASETiFY 以「JOURNEY TO Re/BiRTH 重塑新生之旅」为主题启动特别活动,同时和艺术家以及各地潮人合作推出了地球日特别系列。 其中包括本土环保艺术家直林,他这次打造了「大地烟火」主题保护壳,意在「用一场永恒美丽的可持续烟火为地球庆生,展现烟花绽放刹那的璀璨与浪漫」。 此外,CASETiFY 也和品牌「灵感合伙人」周雨彤再度携手,带来「春天里,拥抱地球」合作系列,透过蝴蝶、鲜花以及柠条树等灵动的元素,勾勒出对绿色星球的美好期许。 在此之前,CASETiFY 已开展「Re/CASETiFY 重塑新生」手机壳回收计划,在全球 40 余家门店内设立回收箱。 这一计划通过涵盖回收旧壳、打磨加工、再生为全新原材料「Re/CASETiFY 颗粒」和将其运用于新产品制作的四个阶段运作,打造兼具耐用性与可持续性的产品。 这次地球日的特别系列产品都也采用了回收材料「Re/CASETiFY 颗粒」打造。 喜力啤酒也做手机了,主打「无聊」 智能手机有时候真是太好玩了,所以我们想设计一个无聊的手机…… 这能让我们晚上出去玩的时候更开心。 在今年的米兰设计周上,喜力啤酒和服饰品牌 Bodega 联合推出了一款限量版「无聊手机」。 正如你想象,这款手机就是典型的「非智能手机」,没有各种社交媒体和细化的应用,只有基本功能,如电话、短信、收音机、贪吃蛇和 0.3 百万像素的相机。 这般「无聊」当然就是为了鼓励人们在和朋友社交时减少「各玩各手机」的时刻。 手机在外观设计颇吸引人,复古的翻盖交互和透明机身都相当 Y2K。 官方还格外提醒,这手机掉地了都不用担心,续航更是长达一周。 可惜的是,这款手机并不会开售,只会在设计周上限量免费送出。 不过,两个合作方倒是会在六月的时候推出一款智能手机应用,模仿「非智能手机」体验,这也算是一种特别的手机「勿扰模式」。 Veja:让鞋更「绿」,要从公司而非顾客角度考虑 当好友 Sébastian Kopp 和 François-Ghislain Morillion 在 2005 年联合创立 Veja 时,他们就决定要做一个可持续的品牌。 当时,可持续还没是个热门趋势,路径研究也较少。两人最终决定以自己的方式来边探索边学习。 一开始,我们问自己做鞋的原材料都从何而来,我们如何可以让一切更环保,以及怎样能更关注人 —— 种植棉花的农民,亚马逊收获橡胶的人,工厂里的工人,仓库里打包的人。 在这样的思考下,品牌最终决定在巴西设立制造厂,并从巴西和秘鲁采购有机和种植自恢复性农业的棉花;以市场价 2-5 倍的定价从亚马逊小公司采购野生橡胶。 产品完成后,公司会从巴西以航运的方式将产品运输到世界各地。物流上的合作方,Veja 也选择了非营利机构 Atelier Sans Frontières,后者旨在帮助残障和社会弱势群体提供工作机会。 模式走通后,Veja 开始重新审视产品制作过程中的工艺,并将原本污染性更高的染色工艺换掉,同时也为皮革寻找替代性材料。 我们不是教条主义者:我们会尝试改善我们走过的每一条道路。 对我们来说,没有绝对的好坏。只有需要改进的事物。 在开始推出鞋子回收计划后,Veja 在回收过程中发现人们丢弃的鞋子大多只是脏了或者有可修补的损害。 我们意识到我们在回收前还需要设一个步骤:修补。 在推出修补服务六年后,公司已经有 20 位专业的鞋履修复师。 截至 2024 年早期,Veja 已经修复了超过 2 万双鞋子,并在美国布鲁克林开设了首家线下鞋履修复店。 当被问及 Veja 的可持续成功之道,Sébastien Kopp 说道: 关键在于要为我们自己去做这些事情,而不是为了消费者。 如果你只为了消费者这样做,你会落后好多年。 人人都会说那走不通,没人在乎生产得更具道德的鞋子,我们都没有去听。还好我们没有听。 世界也许不完美,但总有人在努力让它变得更好。 We RISE for Good!
Marshall Major V 体验:100 小时续航!目前佩戴最舒服、续航最夸张的贴耳式头戴耳机
最舒服的 贴耳式头戴 更新了一系列便携音箱和真无线耳机之后,Marshall 将关注点放到了头戴式耳机上。 这次,Marshall 要更新的是贴耳式头戴耳机 Marshall Major。 来到第五代的它,延续了 Marshall 标志性的声音表现,获得了佩戴感最舒服的设计,以及目前最夸张的续航表现。 先从这经典的外观说起,Marshall Major V 继续沿用 Major 系列标准的方块型设计,配色首发只有黑色一种选择。耳罩外侧有 Marshall 产品最常见的荔枝皮纹理和手写体白色 Marshall LOGO,看起来不太平整的外壳在这里依旧支持无线充电。 方块尺寸是刚好能覆盖到耳朵的大小,耳罩和头梁的位置有折叠结构,日常收纳时能把耳罩折叠起来,然后直接塞进小尺寸的化妆包即可,比折叠收纳还要看方向的索尼 ULT Wear 来得方便。 Marshall 对 Major V 头梁和耳罩上的材质做了升级,这一代的材质更松软,上头的感觉基本不压耳。哪怕是我这种头比较大还要戴眼镜的胖子,Major V 的上头感也不错,眼镜腿和耳罩之间地方不夹耳朵,佩戴一整天也不累。 另外,我还让编辑部的小伙伴试一下。大家佩戴完都觉得 Major V 戴起来舒服,耳棉和头梁上的覆盖足够松软,佩戴不夹耳朵不压头,没有硬质结构和头部硬碰硬的感觉,不管是比 Major IV 、Beats Solo 系列的贴耳式,还有全包裹式的索尼 ULT WEAR 都要舒服。 当然,舒适感提升并不只是耳棉的功劳。 Major V 机身重量为 186g,放到头戴式耳机阵营里面也能算是羽量级选手,戴在头上、挂在脖子上一天不会觉得累。 按键采用朝向后侧的设计,左右两侧分别对应的是 M 键位和电源键。 电源键用了 Marshall 标志性的金色旋钮摇杆设计,除了有开关机和启动配对模式外,也整合了播放控制功能,上下推动是控制音量。按键比 M 键突出,方便用户盲操作。 M 键功能可以通过 Marshall app 进行自定义设置,如果你日常用的流媒体是 Spotify,那 Major V 也支持 Spotify Tap 功能。连接手机开启软件后,点按一下 M 键,你的 Spotify 就能够开启播放。 配置方面,Major V 支持蓝牙 5.3,能够同时连接两台设备,记住 10 台配对过的设备,之后将会通过更新支持低功耗的 LE Audio。蓝牙编码支持最常用的 AAC 和 SBC,没有支持无损规格的 LDAC 或 aptX Lossless 编码。 考虑到 Marshall 的声音特性以及 Major 系列定位,没有配备无损编码似乎也很合理。 耳机和设备最远距离为 10m,我在无线环境复杂、设备多的办公室里测试了一下,Major V 直连表现稳定,比没有用上外置接收器的 Poly 还要稳一点。 延迟我们也测了,在办公室连接电脑的状态,Major V 播放音乐和视频都没有出现明显延迟和断连,日常办公使用足够稳定。游戏的话,如果只是塔防或卡牌类游戏,Major V 也能应付。 续航方面,Major V 播放时间来到了夸张的 100 小时,是 Marshall 目前首款在没有降噪的前提下实现 100 小时续航的头戴式耳机,相信也是为数不多续航能突破到三位数的头戴式耳机。 不只是长续航,耳机的短充模式也夸张。 Major V 充满需要 3 小时,也支持充电 15 分钟最长能支持 15 小时的播放,平时只要用线充个 8-10 分钟就能够满足日常通勤使用,很少会用到完整充满的情况。 而且,这款头戴式耳机还神奇地延续了无线充电的传统,只要将它的右侧耳罩放到无线充电板上面就可以充电。那每日的充电任务可以留到睡觉前,用无线充电器充它即可,日常使用只需要用充电线小充小补即可。 声音方面,Major V 搭载了 40mm 的动圈单元,阻抗为 32Ω,灵敏度是 106dB SPL。耳机底部还附带了 3.5mm 接口,包装内也配备了 3.5mm to 3.5mm 耳机线。 要是真没电了,你也可以将耳机接到电脑、手机小尾巴和播放上继续听。 耳机蓝牙手机的时候,用户能通过 Marshall app 内的均衡器设置声音输出。app 内预留了两档设置,设置完成后可以通过 M 键切换,以对应不同类型的音乐。 Major V 的声音是标准的 Marshall 风格,拳拳到肉的鼓点表现力突出,回弹圆滑,生硬的数码味不明显。打游戏和听摇滚时的力量很充足,挺流行也能给到不错的声音厚度,完成度比在同价位上强调重低音效果的耳机都要高。 低频突出,但整体风格不会完全向着低频倾斜。整体听感清爽,低音量大但不糊,整个氛围有点像是耳机版本的 Marshall Emberton II。 Major V 的人声很特别,仔细听得话有种加了淡淡的一层类收音机效果的滤镜。 听歌时人声不会太锐利,日常喜欢斟酌歌手演唱细节的用户可能会觉得有点奇怪,但听摇滚、舞曲较多的话没有太大影响,听以 LoFi 或 Chil Pop 为背景音乐的播客会有奇效。 Major V 连接 MacBook 时的音量(我听的音量比较大,并不是这样才能驱动耳机) 还有一点要注意,Major V 并不太适合用小音量来听。耳机在音量低于 1/3 时会有声音力量不足、动态降低和声音稍稍有点疲软的情况。建议在保护听力的前提下,音量控制到 1/3 或 1/2 之上会更好。 最后来看看价格,Marshall Major V 的国行预售价为 1299 元,这样的价格放在 Marshall 头戴式耳机里还是挺惊喜的。 这样看的话,Major V 的特点也很鲜明。 1300 元的定价,你可以获得几乎是贴耳式无线头戴耳机里最好的佩戴体验以及最强的续航表现。它有 Marshall 招牌的声音和做工设计,以摇滚为主的重低音表现感拉满,Marshall 的造型设计对于年轻人来说也具备足够的时尚属性。 这样看起来,Major V 确实比一些还没有搞清方向的入门头戴式耳机,本身以穿搭属性为主、声音听起来还摸不着头脑的潮牌耳机,以及突然想起来要将重低音和潮流结合到一起做新品牌的产品要好很多。 佩戴、续航、潮流和极具个人风格的声音,Marshall Major V 能一下子满足你这四个愿望。 如果说你是喜欢摇滚乐、喜欢 Marshall 风格、追求潮流的年轻人,自身对降噪没有需求,只想要一款戴着舒服、电池也很够用的头戴式耳机,那 Major V 就很适合你。
传奇芯片Z80,面世近50年后将停产
Zilog 在 Z80 上市 48 年后即将退役。它最初是作为 Intel 8080 的一个项目开发的,最终成为游戏和通用计算设备中最受欢迎和广泛使用的 8 位 CPU 之一。 由 Federico Faggin 开发的标志性 IC 器件很快就会被淘汰,感兴趣的各方只剩下几个月的时间下订单,Zilog 的制造合作伙伴就会结束对该技术的支持。 根据 Zilog 的通知,晶圆代工制造商 (WFM) 将于 6 月中旬停止接受剩余 Z80 产品的“最后一次购买”(LTB) 订单。Zilog 将根据客户需求处理和安排 Z80 的 LTB 订单,而 WFM 将在此后提供实际交货日期。根据 LTB 的总体需求,公司可能会对最小和最大数量提出更严格的要求。 Federico Faggin 是一位 Intel 工程师,他在开发第一个 4 位 CPU Intel 4004 后于 1974 年创立了 Zilog。Zilog Z80 随后于 1976 年 7 月发布,被认为是 Intel 8080 处理器的软件兼容“扩展”和增强。 Z80 由仅 12 人的团队开发而成,取得了巨大成功,导致 Zilog 建立了自己的芯片制造工厂,并在两年内将员工规模扩大到了 1000 多名。与英特尔的同类产品一样,Z80 最初是为嵌入式系统设计的,但后来成为 20 世纪 70 年代至 80 年代中期游戏硬件的一个重要里程碑。 一些家用电脑和游戏机都是围绕 Z80 的功能构建的,包括世嘉的 Master System 和 SG-1000,以及任天堂的 Game Boy 和 Game Boy Color。许多经典街机游戏也使用了 Z80,包括原始版本的吃豆人。此外,8 位处理器在军事应用、Roland Jupiter-8 等音乐合成器以及各种其他电子设备中很常见。 Zilog 将其 Z80 技术授权给美国公司 Synertek 和 Mostek(这两家公司帮助 Faggin 的合资企业进行生产)以及欧洲制造商 SGS/STMicroElectronics。这种 CPU 设计后来被日本、东欧和苏联制造商复制,而 NEC、东芝、夏普和日立等公司也生产了自己的兼容版本的芯片。 近年来,Zilog 将 Z80 生产重新聚焦于嵌入式设备市场,提供先进的微控制器产品,保留与原始 Z80 和 Z180 设计的兼容性。
三星新款3nm Exynos 2500有望超越高通Snapdragon 8 Gen 4
【环球网科技综合报道】4月21日消息,据国外科技网站gsmarena报道,近日,有关三星新款处理器Exynos 2500的传言引起了业界的广泛关注。据称,这款采用3nm工艺技术的芯片有望在能效和原始性能方面超越其竞争对手高通的Snapdragon 8 Gen 4。如果传言属实,三星有望在2025年通过这一技术突破,在移动处理器市场上占据领先地位。 根据行业内部消息人士透露,以及PandaFlashPro在社交媒体上的发帖,Exynos 2500在能效和性能上都将展现出卓越的表现。与此相比,Snapdragon 8 Gen 4预计将继续使用4nm工艺技术,这可能在技术上使三星的新款芯片占据一定优势。 三星此前的Exynos系列在处理器性能和功效上一直面临挑战,但Exynos 2500的推出似乎标志着该公司在此领域取得了重大进展。据悉,今年的Exynos 2400已经能够跟上高通Snapdragon 8 Gen 3的步伐,而三星显然发现了更多可以改进的空间。 据了解,Exynos 2500将有两种旗舰芯片组变体:一种是为智能手机设计的Exynos 2500-A,配备八核CPU;另一种是为平板电脑和Galaxy Book笔记本电脑设计的Exynos 2500-B,配备更强大的10核CPU。这种多样化的产品设计策略显示了三星对不同设备性能需求的细致考虑。 此外,还有传言称三星可能会在其新款芯片中使用谷歌的张量处理单元,而非自家的NPU。然而,目前这一消息尚未得到官方确认,因此仍需进一步观察。
2024年第一季度印度手机市场强劲增长 三星、小米、vivo三足鼎立
【环球网科技综合报道】4月21日消息,近日,据市场研究机构Canalys最新发布的报告,2024年第一季度,印度智能手机市场表现出强劲的增长势头。在这个竞争激烈的市场中,三星、小米和vivo等顶级品牌展开了激烈的角逐,且三者之间的市场份额相差无几,形成了三足鼎立的局面。 报告显示,今年第一季度,印度智能手机市场的销量达到了3530万部,相较于2023年同期的数据,增加了近500万部,同比增长率高达15%。这一增长率反映了印度市场对智能手机的持续需求和市场的活跃度。 在各大品牌中,三星以670万部的出货量稳居榜首,小米和vivo分别以640万部和620万部的出货量紧随其后,位列第二和第三。OPPO(不包括OnePlus)和realme也取得了不俗的成绩,出货量分别达到370万部和340万部。 三星Galaxy S24的成功发布为品牌带来了更多的关注度,其强大的人工智能功能和吸引人的营销活动推动了销量的提升。而小米则凭借其Redmi 13C 5G和Redmi Note 13 5G系列等产品,成功实施了大众市场5G战略,也取得了显著的增长。 此外,报告还指出,摩托罗拉、Infinix和苹果等品牌也实现了两位数的增长。特别是苹果的iPhone 15机型,在多次降价和促销活动的推动下,成功脱颖而出,赢得了消费者的青睐。
曝iQOO 13系列采用1.5K直屏和2K曲屏 普及超大电池
【CNMO科技消息】近日,CNMO注意到,有数码博主爆料,iQOO 13系列将采用1.5K直屏和2K曲屏设计,屏幕供应链涵盖国产及三星。博主进一步透露,继成功普及超级快充技术后,iQOO 13系列再度引领潮流,普及超大电池容量,两款机型都是双芯电竞旗舰。 iQOO 12系列于去年11月份正式登场,预示着iQOO 13系列也极有可能在这个时间段与我们见面。由于距离新品发布尚早,网络上关于iQOO 13的爆料尚不算多。因此,让我们一同回顾一下iQOO 12系列的卓越配置。 iQOO 12系列搭载由第三代骁龙8移动平台、满血版LPDDR5X和UFS4.0组成的新一代“性能铁三角”,还增加了自研电竞处理器Q1和自研电竞引擎的组合。 屏幕方面,iQOO 12 Pro国内首发搭载三星2K E7144Hz全感屏,支持517 PPI、144Hz刷新率、1600nit全局峰值亮度和高达3000nit局部峰值亮度。iQOO 12则配备了一块6.78英寸的1.5K分辨率OLED屏幕,屏幕刷新率最高为144Hz,峰值亮度可达3000尼特。 iQOO 12系列还配备超极石墨电池,最高120W快充可实现快速补电。新机还提供3倍潜望式长焦镜头,集望远拍摄、长焦微距和长焦人像三种效果于一身,可实现10倍高清变焦和最大100倍变焦。 目前可以预测的是,iQOO 13系列将搭载第四代骁龙8移动平台,其性能表现将十分出色。至于影像方面,虽然可能不会达到顶尖水准,但考虑到其他配置的兼顾,依然能够保持中规中矩的表现。
外媒:苹果将在欧盟市场向第三方开放iPhone触碰支付功能
4月21日消息,据外媒报道,近日在《欧洲数字市场法案》的推动下,苹果公司上月发布的iOS 17.4系统为欧盟的iPhone用户带来了与之前大不同的改变。新系统不仅允许用户使用第三方应用商店,还能为Apple App Store之外的应用和服务付费,这一变革打破了苹果生态系统长久以来的封闭性。 这一系列的开放措施并非苹果自愿,而是在《欧洲数字市场法案》的强制要求下实现的。此前,苹果公司的“围墙花园”策略使得第三方很难进入其生态系统,尤其是在使用iPhone的NFC功能进行支付方面,苹果一直将其限制在自家的Apple Pay服务内。然而,这种情况有望在下个月得到改变。 据内部消息人士向路透社透露,欧盟委员会预计将在5月份批准苹果公司开放触碰支付NFC功能的提议。这意味着,未来第三方移动钱包也将能够使用非接触式支付功能。苹果公司在经过四年的反垄断调查后,于今年1月份首次提出这一开放提议。 若欧盟委员会批准该计划,苹果公司或将避免被发现存在不当行为,从而躲过可能高达其全球年营业额10%的巨额罚款。值得一提的是,就在上个月,苹果刚因通过应用商店限制阻碍Spotify等竞争对手的竞争,被处以18.4亿欧元的罚款,这是苹果公司首次受到欧盟的反垄断处罚。显然,苹果公司希望这是最后一次因类似问题受到处罚。 业界认为,此次开放NFC支付功能,不仅是对欧盟法规的响应,也是苹果公司在面临反垄断压力下做出的重大让步。
小米在印度推出红米Note 13 5G系列HyperOS更新
【环球网科技综合报道】4月21日消息,小米公司近日在印度正式宣布,将为红米Note 13 5G、红米Note 13 Pro 5G以及红米Note 13 Pro+ 5G等热销机型推送全新的HyperOS 1.0系统更新。这一系列设备自去年上市以来,便以其出色的性能和用户体验赢得了消费者的广泛好评,原系统基于Android 13及MIUI 14打造。 此次推送的HyperOS更新,以“全面重构”为核心理念,致力于在所有兼容设备上实现性能的优化提升。据小米介绍,HyperOS将通过改进任务调度算法,智能地在多个计算核心之间分配处理任务,从而确保设备能够以最高效率运行。此外,新系统还对底层技术栈进行了深度优化,旨在为用户带来更为流畅的操作体验。 在用户界面方面,HyperOS带来了诸多新颖的设计元素。用户将能够体验到全新的个性化锁定屏幕,控制中心的界面也得到了重新设计,去除了图标标签,使操作更为简洁直观。此外,新系统还引入了交互式通知功能,以及一系列新的应用程序图标和动画效果,大大提升了用户的视觉享受。文件管理器应用也得到了更新,新增了新的分类方式,便于用户更高效地管理手机中的文件。同时,天气应用也加入了新的动画效果,使得查看天气信息变得更加生动有趣。 小米表示,HyperOS的推送将分阶段进行,以确保更新过程的稳定性和用户体验的顺畅。因此,预计所有相关设备的用户将在接下来的几天至几周内陆续收到更新提示。公司强调,此次更新的推出标志着小米在持续提升用户体验方面的又一重要步骤。
问界 M9 推送 V4.2.1.4 更新:华为盘古大模型加持语音助手、新增误踩油门提醒等
IT之家 4 月 21 日消息,据IT之家网友反馈,问界 M9 车型现已推送 V4.2.1.4 版本更新,软件包大小 6.65 GB,新增 / 优化多项功能。 主要更新内容如下: 新增智能交互矩阵大灯情景灯语功能; 新增 ADS 双 3D 视图功能(仪表和中控屏均显示 ADS 3D 视图); 新增后视摄像头清洗功能入口; 新增对侵占车道障碍物主动避让功能; 新增误踩油门提醒功能; 新增盘古大模型加持的智慧助手小艺功能; 新增小艺全车免唤醒功能; 新增语音打开尾灯的感谢灯语功能; 新增语音控制激光投影巨幕系统的开 / 闭功能; 优化 NCA 匝道场景驾驶体验; 优化车屏互联手机反控投影巨幕功能; 优化激光投影巨幕下降受阻语音播报功能; 其他功能项和体验项优化。 AITO 问界 M9 于 2023 年 12 月 26 日上市,共推出四款车型,官方指导价区间为 46.98-56.98 万元,2 月 5 日首批车主正式开启交付。IT之家附问界 M9 主要配置: 问界 M9 长宽高分别为 5230/1999/1800 毫米,轴距为 3110 毫米;风阻系数 0.264,提供 5 款颜色,其中两款纯色,三款双拼配色。 动力方面,问界 M9 纯电版 0-100km/h加速时间仅需 4.3s,增程版为 4.9s,搭载 4 活塞固定卡钳,100-0km/h制动距离仅为 34.9m,最大扭矩分别为 673N・m 和 675N・m。问界 M9 系列搭载猫头鹰增强转向技术,转弯半径仅为 5.8 米。 问界 M9 增程版提供 52 度电和 42 度电版本,CLTC 综合续航分别达到了 1402km 和 1362km,纯电续航分别为 275km 和 225km。 问界 M9 纯电版搭载华为“巨鲸”800V 高压电池平台,充电 5 分钟续航 150km,采用 800V 高压碳化硅高效率电机,CLTC 综合续航达 630km。
刘强东数字人直播常态化,数字人成本低至真人直播的10%
京东的数字人直播正在常态化。4月22日,京东集团创始人刘强东的虚拟数字人形象“采销东哥AI数字人”在京东图书采销直播间进行了直播,也是4月16日和4月20日之后的第三场采销东哥AI数字人”直播。从变化看,本场直播中加入了数字人助理、多机位切换等多种方式,通过和采销东哥聊天的方式增加互动感。 在4月16日的第一场直播中,刘强东数字人取得了不错的效果。对此,京东云言犀算法总监在接受采访时对第一财经表示, “采销东哥AI数字人”首播后,言犀团队收到很多合作意向,不少商家包括大品牌商都主动寻求合作。此外,也有部分企业的CEO计划合作打造数字人直播。言犀算法总监表示,现在直播短视频是大趋势,目前来看,数字人直播带货有很大机会成为一个大的爆点,主要是它在内容层次上达到了一个新的水准,大家的接受度和信任度已经过了关键点了。 成本方面,京东云正在降低商家端的成本以吸引更多商家参与数字人直播。对此,京东云言犀负责人对第一财经表示,对于商家,京东数字人直播的成本目前是商家邀请真人主播直播的10%。从商业化角度看,京东618期间京东云宣布免费开放数字人直播。而从成本看,数字人直播在选品、运营等方面会出现一些额外成本。但在模型成熟的情况下,目前服务器成本不断降低。 数字人直播,如何解决交互提高互动感是重点。对此,京东云言犀算法总监表示,所有用户的问题都会以文字的方式来回复用户。口播则有自己的口播策略,会实时抓取弹幕选一些相对比较有代表性的、有特色的问题去回复。 京东云言犀负责人表示,互动的策略是直播不能经常被打断,以频率看最多可能每三十秒或每半分钟被打断,回复大家比较关注或比较有代表性的问题。选择问题上,京东云一些算法判断是否已重复问,或者与某个商品结合得非常紧密,是否能聊更多有故事性的内容,来选择是否口播回复。 从现阶段看,目前数字人直播的体验还有待提高。京东云言犀负责人表示称,目前从运营角度看,从用户接受度、从表现情况来说,用户接受度还是比较高的。“我也看了很多评论,数字人直播中运营的选品、运营调性的匹配确实很关键。我是做技术的,我们还有第三档没有做到,例如数字人是否能成为一个人的分身,比具有类似理念、思想、知识背景、生活背景,可以更长时间、更深度地与观众侃侃而谈。想象一下,如果这个大V不但只是带货蓝莓,说这个蓝莓好吃,甚至可以和观众聊聊他小时候也种过蓝莓,这样渗透感就更深了。这需要AI的大脑还需要进一步丰富、进一步成长起来,这是我们说的三步走的第一步。” 从应用方向看,数字人领域目前确实更多地是表现出来人机协作共生的价值。目前看,人机接档的直播间数据表现明显优于纯人直播间或纯数字人直播间,有条件的品牌直播间可以关注人机穿插直播模式的价值和团队打造。此外,在货架电商里面,把商品详情转化为视频化内容,发挥数字人直播的价值;并非取代真人,而是与真人接力打造日不落直播间,挖掘闲时直播的价值,目前言犀数字人提高闲时转化率超30%。 从策略看,今年京东计划推出更多数字人主播,上述负责人表示其“采销东哥AI数字人”技术代表京东云现在的通用技术,如果为其他大V或者CEO打造数字人主播可以达到同样的效果。 从行业看,虚拟人行业仍处于蓝海市场。艾媒咨询发布的《2024年中国虚拟数字人产业发展白皮书》显示,2023年中国虚拟人带动产业市场规模和核心市场规模分别为3334.7亿元和205.2亿元,预计2025年分别达到6402.7亿元和480.6亿元,呈现强劲的增长态势。应用场景方面,中国受访者常接触到的虚拟人类型有虚拟主播、虚拟偶像以及虚拟员工三种,其中虚拟主播的受众最为广泛,达81.40%。 艾媒咨询CEO张毅对第一财经表示,从用户需求、技术成熟度、电商行业需求以及政策支持方面看,数字人直播今年大有可为。近年来多个电商平台的头部主播,因为各种因素例如自身问题、薪酬问题等导致平台方和机构方较为被动,行业需要虚拟人来替代过于强势的个人主播。此外,资本的关注和投入也为整个行业提供了机会,能推动技术和应用的快速发展。与此同时,商业模式的成熟受头部企业的推动,例如京东不遗余力地推广数字人直播,其他平台例如百度和阿里也在布局这块业务。随着头部企业的推进,数字人在直播电商、娱乐、教育等方面都会有机会。不仅如此,数字人直播是解决跨境电商时差问题、语言问题、文化风俗问题以及沟通的及时性问题等的好方式。 从挑战看,张毅认为发展数字人直播的挑战主要在于当前数字人主播的互动性和优化用户体验,用户体验包括直播间的个性推荐能力,以及直播间与品牌的合作,能否让观众和高品质产品的互动等要素都十分关键。此外,数字人直播在技术、理论、伦理、内容监管以及这个新旧模式挑战方面,仍然有很多需要努力之处。数字人直播会对成熟的真人直播商业模式产生冲击,甚至对已有的主播生态解构,所以短视频平台对数字人直播较为敏感。但从行业趋势看,数字人直播的风向会持续。
这次阿里云京东云降价,为什么其他家不跟了?
作者 |叶子 编辑 |钊 进入2024年,云服务市场的开局显得格外平静。在经历了春节假期的短暂休整之后,行业在开年的两个月内并未展现出往常三四月份惯有的喧嚣与活跃。 过去,云厂商们往往会借新一年业务开展之际,祭出各类极具吸引力的降价优惠策略,以期在新财年伊始便抢占市场份额,赢得客户的青睐。 以2023年为例,阿里云在4月率先宣布了核心产品价格全线下调15%至50%的降价优惠,意图进一步扩大公共云的用户基数和规模,提升云计算的市场渗透率。而在其后腾讯云、百度云、京东云、华为云以及运营商云们纷纷跟进,纷纷推出大促活动,整个市场好不热闹。 但在2024年中,除了阿里云和京东云扔出了让用户无感的“重磅”炸弹外,毫无新意。而其他云厂商则显得十分克制,在两云争斗后近两月时间中,都没有正面“接招”的意思。 那么,往年猛打价格战的云服务市场为何会出现“阿里云进,其他云止”的情况?在降价的另一面,云厂商还应该思考什么呢? 1 阿里京东大张旗鼓,其他云企一言不发 虽说2024年选择大张旗鼓降价的云商只有阿里云与京东云两家,但并不意味着它们的降幅不够大。 2月29日,阿里云发布通告,宣布全线下调云产品官网售价。这次降价涉及计算、存储、数据库等在内的100多款产品,平均降价幅度超过20%,最高降幅达55%,属于阿里云历史上力度最大的一次,也被外界评为史上最大力度的公有云价格战。 而在国内市场外,4月8日,阿里云宣布海外市场也跟随全线降价,覆盖全球13个地域节点部署的核心云产品、500多个产品规格,平均降幅为23%,最高降幅为59%。降价后,阿里云海外市场云产品价格全面低于其他国际主流云厂商。 在此期间,在交个朋友四周年淘宝直播间,罗永浩久违现身,首度为阿里云带货,选品包括4款主要面向创业者与中小企业的云服务器和云存储产品。 在直播中,老罗称“如果你在企业不是做IT的,可以把截屏发给公司IT看一下,他看到这个价格后可能会激动起来,一定能打动他。你不知道是怎么回事,发给公司IT他直接就崩溃了,直呼‘老罗,你路子真野’。” 而在阿里云宣布全面下调云产品售价的同日晚,京东云宣布全系核心产品继续参与全网比价,喊出了“全网比价、击穿低价、再低10%、买贵就赔”的口号,且3月1日起即时生效。 在宣传口上,面对阿里云打出的老罗直播卖云牌,京东云正面强势回应,配合“现场直播比价,比特定直播间再低10%”的激进口号,让这场云服务商之间的价格战“火药味”十足。 按照往年的情况,在发令枪被打响后,又一波降价潮即将来临,然而现实却并非如此。 除去腾讯云低调宣布推出包括语音识别、语音合成、AI绘画等一系列AI产品在内的促销活动外,无论是想要通过技术获客的华为云、百度云,还是背靠运营商的天翼云与移动云,都没有任何想要跟进降价的迹象。 那么,为何半年前还在卖场式大促销的云企们,如今却能像达成默契般集体无视阿里云的降价“挑衅”呢? 2 低价难撼市场,技术创新与服务稳定决胜未来 出现这样情况的原因只有一个,那就是虽然阿里云这轮降价足够狠,但对友商造成的伤害还是不够大,即降价已经刺激不到用户们的G点了。 具体来看,虽然阿里云核心产品已经击穿了全网最低价,但这只是对于中小客户以及个人用户来说的,长期合作的大客户早已享受到了更低的合同优惠价,这样的降价根本不会对它们的成本产生任何影响。 而个人用户和中小企业的长尾市场,却并没有那么容易被简单的低价吃下。 仍在博士学习阶段的不会飞(化名)同学向奇偶派表示,由于有着在不同终端进行项目推进与相关存储的需求,他选择使用云服务器。“但像我这样的轻量级用户,各家云厂商其实都有针对高校学生可以免费使用的服务器,未来毕业后我还可以一家一家'白嫖'过去,并没有一定要去购买的说法”。 某家公司IT管理人员倪先生则向奇偶派表示,“阿里云确实是降价了,但我们今年的合同早就签过了,至于下一年是否会因成本的变动更换云服务商那也是明年的事情”,“其实经过这些年的降价,我们对价格的敏感度已经没有那么高了,反而相关技术支持会是更重要的影响因素”。 此外,阿里云此次是包年降价,目录价并未改变,也就意味着在最重要的弹性业务上并没有任何让利,受益的只有那些弹性较小的用户罢了,而这样的用户,占比又有多少呢? 在个人用户和中小企业需求挖掘难度增大之外,六年四次宕机的阿里云也让人对其服务的稳定性心存疑虑。 2022年12月,阿里云位于香港的数据中心因制冷故障发生宕机事故,造成多项服务无法使用,多个大客户受到影响。而由于没有完善的备用冗余方案,服务器宕机持续超过12个小时,成为了阿里云运营十多年来持续时间最长的一次大规模故障。 就在不足一年之后的2023年11月12日,由于云产品控制台访问及API调用出现异常,包括淘宝、闲鱼、钉钉、饿了么、菜鸟等多个阿里系App出现无法访问或服务异常的情况。 据DoNews报道,阿里云事故后,纳思云充电桩发布重要通知称,因阿里云IoT服务API接口故障,导致使用阿里云相关服务的设备无法正常使用。乐爽cooleasy发布紧急通知称“阿里云网络全国崩盘了,导致所有平台都出现问题”。 这样的情况,对于那些极度依赖云服务的企业是完全无法接受的。只要发生一次宕机,订单丢失、生产停摆、数据丢失等一系列直接经济损失就已经远远超过企业在不同云服务商之间微小的价格差异所带来的成本节省了。试问,在这样高频的事故发生之下,哪家想要上云的企业不会在心中掂量一下呢? 而从友商的角度来看,跟随阿里云降价的打法远不符合他们的投入产出模式。 阿里云在追求政企市场失败后,逐步脱离了原有的高增长轨道,只得重新切换回他们擅长的互联网模式中来,即通过低价来实现价格飞轮留住用户,未来再考虑增厚利润的打法,但这一套玩法,已经无法让友商觉得“恐惧”了。 以华为云为例,作为国内市场份额达到19%的国内第二大公有云厂商,却很少打过价格牌,其底气就是不断迭代的创新技术:比如将“突破乌江天险”的大量基础软件、软硬件开发工具上云;推出国产AI算力的昇腾AI云服务;国产数据库华为云GaussDB;全面自主可控的MetaERP等。 大家都看到了华为正向研发-生产-商业化循环的成功跑通,再结合市场对阿里云服务质量的担忧,云厂商们明白,依靠扎实的技术创新与对用户的理解,完全可以实现健康、稳定的市场增长,无需过度依赖价格战。 特别是在面对阿里云降价策略时,考虑到其在政企市场失利后的战略调整以及外界对其服务能力的持续疑虑,云厂商们更加确信,找到市场需求、强化自身核心竞争力,才是应对挑战、赢得市场的明智之举,而盲目跟风降价只会被拖到阿里云擅长的领域中不断失血,最终消亡。 3 存量时代里,云竞争只剩“阳谋” 而对于阿里云来说,大幅度降价也像一把双刃剑,在刺激市场需求、抢占市场份额的同时,正在对直销与代理团队的利益分配格局造成显著冲击。 官网直接降价使得终端客户能以更低的价格购买到相同的产品和服务,这直接导致了代理商渠道的价格竞争力下降。据雷锋网报道,有经销商表示,“上午官网发布降价消息,下午马上就有客户来找我们咨询了,问能否按照新价格执行。” 还有一些经销商对此表示担忧,“现在很多产品价格已经贴着成本线了,如果再降的话,会进一步影响我们的返佣金额”。某代理商更透露,“阿里云产品只要是低于3.8折,则没返点。”而他昨天上午查看这次降价的U1机型带宽按量的产品多年期已经没返佣了。 长期来看,若阿里云未能妥善调整直销与代理团队间的利益分配机制,持续的低价策略恐将加速代理商群体的流失。代理商作为连接阿里云与广大企业用户的桥梁,其营销网络、定制化服务及客户关系维系能力对阿里云的市场渗透至关重要。 一旦大量代理商因利益受损而选择退出,阿里云可能会面临市场触角收缩、客户服务响应能力下降以及新客户获取成本上升等问题,这对于其长远发展而言无疑是巨大的隐忧。 可以说,时至今日,哪怕对于阿里云来讲,单纯的降价也已经不再是那个百试百灵、可以拖友商“下水”的市场竞争策略,甚至成为了需谨慎权衡利弊、兼顾各方利益的复杂抉择了。 而云服务市场,也在此刻被画下一条分界线,在存量时代中,云企间的竞争正式进入“精细化”运作的阳谋阶段。 不过,也正如云与智慧产业事业群CEO汤道生所说的那样,“价格战的本质没有变化,就是‘卷’。只是现在的市场更成熟,玩家变少,客户变理智,不会单纯因价格而选择,更看重的是优质服务的能力,必须发挥技术优势,提高供应链管理效率,才能体现长期成本优势。”
新测试基准发布,最强开源Llama 3尴尬了
梦晨 发自 凹非寺 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。 Llama 3的两个指令微调版本实力到底如何,也有了最新参考。 与之前大家分数都相近的MT Bench相比,Arena-Hard区分度从22.6%提升到87.4%,孰强孰弱一目了然。 Arena-Hard利用竞技场实时人类数据构建,与人类偏好一致率也高达89.1%。 除了上面两个指标都达到SOTA之外,还有一个额外的好处: 实时更新的测试数据包含人类新想出的、AI在训练阶段从未见过的提示词,减轻潜在的数据泄露。 并且新模型发布后,无需再等待一周左右时间让人类用户参与投票,只需花费25美元快速运行测试管线,即可得到结果。 有网友评价,使用真实用户提示词而不是高中考试来测试,真的很重要。 新基准测试如何运作? 简单来说,通过大模型竞技场20万个用户查询中,挑选500个高质量提示词作为测试集。 首先,挑选过程中确保多样性,也就是测试集应涵盖广泛的现实世界话题。 为了确保这一点,团队采用BERTopic中主题建模管道,首先使用OpenAI的嵌入模型(text-embedding-3-small)转换每个提示,使用 UMAP 降低维度,并使用基于层次结构的模型聚类算法 (HDBSCAN) 来识别聚类,最后使用GPT-4-turbo进行汇总。 同时确保入选的提示词具有高质量,有七个关键指标来衡量: 具体性:提示词是否要求特定的输出? 领域知识:提示词是否涵盖一个或多个特定领域? 复杂性:提示词是否有多层推理、组成部分或变量? 解决问题:提示词是否直接让AI展示主动解决问题的能力? 创造力:提示词是否涉及解决问题的一定程度的创造力? 技术准确性:提示词是否要求响应具有技术准确性? 实际应用:提示词是否与实际应用相关? 使用GPT-3.5-Turbo和GPT-4-Turbo对每个提示进行从 0 到 7 的注释,判断满足多少个条件。然后根据提示的平均得分给每个聚类评分。 高质量的问题通常与有挑战性的话题或任务相关,比如游戏开发或数学证明。 新基准测试准吗? Arena-Hard目前还有一个弱点:使用GPT-4做裁判更偏好自己的输出。官方也给出了相应提示。 可以看出,最新两个版本的GPT-4分数高过Claude 3 Opus一大截,但在人类投票分数中差距并没有那么明显。 其实关于这一点,最近已经有研究论证,前沿模型都会偏好自己的输出。 研究团队还发现,AI天生就可以判断出一段文字是不是自己写的,经过微调后自我识别的能力还能增强,并且自我识别能力与自我偏好线性相关。 那么使用Claude 3来打分会使结果产生什么变化?LMSYS也做了相关实验。 首先,Claude系列的分数确实会提高。 但令人惊讶的是,它更喜欢几种开放模型如Mixtral和零一万物Yi,甚至对GPT-3.5的评分都有明显提高。 总体而言,使用Claude 3打分的区分度和与人类结果的一致性都不如GPT-4。 所以也有很多网友建议,使用多个大模型来综合打分。 除此之外,团队还做了更多消融实验来验证新基准测试的有效性。 比如在提示词中加入“让答案尽可能详尽”,平均输出长度更高,分数确实会提高。 但把提示词换成“喜欢闲聊”,平均输出长度也有提高,但分数提升就不明显。 此外在实验过程中还有很多有意思的发现。 比如GPT-4来打分非常严格,如果回答中有错误会狠狠扣分;而Claude 3即使识别出小错误也会宽大处理。 对于代码问题,Claude 3倾向于提供简单结构、不依赖外部代码库,能帮助人类学习编程的答案;而GPT-4-Turbo更倾向最实用的答案,不管其教育价值如何。 另外即使设置温度为0,GPT-4-Turbo也可能产生略有不同的判断。 从层次结构可视化的前64个聚类中也可以看出,大模型竞技场用户的提问质量和多样性确实是高。 这里面也许就有你的贡献。
有望打败闭源模型?阿里、百度、腾讯云厂商抢食开源Llama 3算力
Meta发布Llama 3系列两个开源大模型之后,百度、阿里、腾讯等国内云厂商迅速抢食Llama 3的算力部署需求。 今日,阿里云宣布全方位支持Llama 3系列模型的训练与推理。阿里云百炼大模型服务平台推出针对 Llama 3系列的限时免费训练、部署、推理服务。腾讯云也宣布腾讯云TI平台成为国内首批支持Llama 3全系列模型的平台之一。 而在4月19日,百度智能云千帆大模型平台已宣布成为国内首家推出针对Llama 3全系列版本训练推理方案的云厂商。亚马逊云同日宣布这两款模型已在Amazon SageMaker JumpStart中提供。 多名科技界人士此前对Llama 3系列评价颇高,认为后续可能开源的Llama 3超4000亿参数版本有望改变大模型生态,更有从业者指出,开源的Llama 3有如安卓,一夜之间打掉所有闭源手机操作系统。 随着开源潮流继续,云厂商也不再仅依托与闭源大模型厂商绑定,而走向了抢食开源大模型算力需求。 Llama 3性能几何? Llama 3已开源版本的基准测试数据亮眼。据Meta介绍,指令微调的Llama 3 8B在五项基准上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三项基准超过Gemini Pro 1.5和Claude 3 Sonnet。 这两个开源模型发布后,近日陆续还有业界人士发表对该模型的看法。360创始人、董事长周鸿祎认为,这两个开源模型性能很强,应该远远超过GPT-3.5,Llama问世再次验证了其对开源的信心。 国内则关注到Llama 3的中文能力和长文本弱点。记者在一个大模型业内人士讨论群中看到,不少大模型开发者诟病Llama 3的中文表现,有大模型开发者实测发现其中文能力不如GPT-3.5,称后续使用可以等第三方微调的中文Llama 3出来。不过有业内人士分析,Llama 3将中文能力弱化了,这不是很大的问题,好的中文模型不一定需要很大量中文数据。 Llama 3上下文窗口仅8k,落后于业内平均水平。周鸿祎表示,360的7B(70亿)参数大模型可输入长文本360k,已开源了长文本训练方法,可将这个方法用在Llama 3 8B训练,弥补该模型短板。 Llama 3开源引发开闭源路线之争讨论后,Meta CEO扎克伯格近日在一次访谈中则透露了Meta开源的想法和决心。他表示,即便一个模型研发成本达100亿美元,只要对Meta有帮助,就会开源。扎克伯格提到开源的好处时举了个例子:此前Meta开放计算项目开源,随着全行业以Meta的设计为标准,供应链基本围绕此建立,起量后为其节省了数十亿美元。 “开源可以在很多方面提供帮助,一个是人们能否找到更便宜运行模型的方法。随着时间推移,我们将在这些东西上花费几千亿美元或更多。所以如果能提高10%效率,就能节省数十亿甚至数百亿美元,它本身就可能值很多钱。”扎克伯格表示。 周鸿祎在论述Llama 3开源的意义时也提到相似观点,他曾经问过谷歌高管为什么把很多大数据项目贡献给公众,对方的回答令他惊讶。“他说软件规模非常大,靠一家公司独立维护成本非常高,开源之后就变成公共财产,形成我为人人、人人为我的文化。“周鸿祎表示。 云厂商抢食 Llama 3开源一石激起千层浪,阿里云、百度云、腾讯云也嗅到了机会,入场抢夺算力需求。 云厂商绑定大模型公司以锁定算力乃至芯片需求,以往并不少见,且云厂商由此获得的利润可观。OpenAI背后站着的投资方是微软,ChatGPT就运行在微软Azure上。有“OpenAI最强对手”之称的Anthropic,身后则站着亚马逊。 今年3月,亚马逊完成对Anthropic的40亿美元投资,双方战略合作协议内容包括,Anthropic选择亚马逊云科技作为其关键任务工作负载的主要云服务提供商,Anthropic将利用Amazon Trainium和Amazon Inferemtia芯片来构建、训练和部署未来模型。这两款芯片是亚马逊的自研芯片。今年3月,Anthropic发布最新大模型系列Claude 3,亚马逊立马宣布Amazon Bedrock可运行Claude 3系列,且是唯一一个为该系列模型提供托管服务的平台。 参考微软云服务绑定OpenAI后的收效,在截至2023年12月31日的2024财年第二季度,微软智能云营收259亿美元,剔除汇率影响后同比增长19%,AI为Azure云贡献了6个百分点的增长,其中绝大部分增量来自OpenAI在Azure云上的推理调用。亚马逊云服务AWS则在2023财年第四季度获得242.04亿美元营收,同比增长13%。亚马逊首席财务官布奥尔萨夫斯基表示,客户对AWS生成式AI产品表现出很大兴趣,虽然生成式AI服务体量相对较小,但公司相信其在未来几年将带来价值数百亿美元的收入。 国内云厂商中,不少也是大模型开发商,腾讯自研混元大模型,阿里自研通义千问,百度有文心大模型。此外,不同于一些大型互联网服务厂商自建服务器集群的情况,一些大模型创业公司还无太多余力搭建服务器集群,而是使用云厂商计算资源。有云厂商相关负责人向记者描述,大模型训练所需GPU算力,要一千张卡、一万张卡连通,这不是所有公司都能做到的,云厂商基于规模和效率优势天然更适合大模型场景。 除了自研大模型,云厂商自然不愿放过其他大模型的算力需求。百度旗下有面向企业客户的大模型平台文心千帆,支持第三方大模型能力导入,千帆ModelBuilder支持国内外第三方主流模型,总数量达79个。此外,阿里云旗下有魔搭社区,腾讯云TI平台则已接入Llama 2、Falcon、Dolly等开源模型。今年3月,阿里云魔搭发起一项开源计划,支持国内类Sora模型创新。 相比推理训练更具中心化特点的闭源模型,诸多云厂商都有机会拼抢算力分散的开源模型部署需求。而随着Grok-1、Llama 3等相继突破开源模型参数上限,潜在算力需求也在攀升。如果Llama 3 参数量超4000亿版本可以获得媲美GPT-4的性能,部署该模型的需求攀升,接入Llama 3的云厂商能吃到的算力红利可能不低于微软。 开源大模型厂商也在评估自身能否从云服务厂商相关收入中分成。 在谈到是否考虑向云厂商授权模型,以赚取可观收入时,扎克伯格表示:“希望有这样的安排,但我不知道会有多大意义。我们希望,如果他们打算把我们构建的东西转卖并从中赚钱,那么他们应该来和我们谈谈。如果你是微软Azure或亚马逊,打算转售我们的模型,那么我们应该有一些收入分成。“ 扎克伯格提到,Llama 2基本已与所有主要云计算公司达成协议,可以作为托管服务在这些云上使用,而随着发布的模型越来越大,这将成为一件大事。“如果要销售我们的模型,我们就应以某种方式分享其中的好处。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。