EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
217亿,张一鸣要IPO了
本文4278字,约6分钟 作者 | 王涛 编辑 | 吾人 来源 | 融中财经 (ID:thecapital) 在胡润研究院发布《2024全球独角兽榜》中,字节跳动以1.56万亿的估值连续第三年成为全球价值最高的独角兽。而就在近日,这只全球最强的独角兽打响了拆分IPO的第一枪。 据媒体报道称,字节跳动计划为旗下汽车信息和交易平台“懂车帝”融资,以备战IPO。这一次融资可能是懂车帝IPO 前的最后一次,也是唯一一次融资,字节跳动也计划向自身的少数股东开放额度。据悉,此轮融资由红杉资本中国基金领投,股东KKR和泛大西洋资本也将参与。 从2017年诞生,至今懂车帝已经运营了7年时间,如果上市成功,意味着懂车帝将成为字节跳动大家族中首个IPO。 对于懂车帝的独立IPO,字节跳动给出解释,“是基于业务正常发展的需要”。有业内专家对此分析,懂车帝的独立IPO是必然的,因为其已经初具规模,如果一直留在字节内部反而会放缓发展速度。 综上所述,懂车帝已经是时候登上更大的舞台了。 融资58亿、估值217亿 字节跳动的IPO首秀 根据媒体报道,懂车帝的本次融资金额最高达8亿美元,约合人民币58亿,而在融资完成后,懂车帝的估值将达到30亿美元,约合人民币217亿。 其实早在今年年初,北京懂车帝科技有限公司就已经完成一次业务结构的调整。其中,字节跳动旗下今日头条已经退出了懂车帝公司的股权架构。同时,根据媒体报道,彼时字节跳动正在将懂车帝相关员工迁往一个新成立的全资子公司,法定代表人由懂车帝战略负责人担任,小部分原属字节跳动的员工会率先在一月底前后将劳务关系转入新公司中。未来,懂车帝会拥有独立的办公地点。换言之,在年初时,懂车帝就已经从字节跳动集团中独立了出来。 彼时,外界就有猜测懂车帝的独立是为了上市做准备。如今靴子落地,外界猜测成真。 如果上市成功,懂车帝将成为字节跳动旗下首个分拆上市的业务。 分拆上市在目前的市场中并不属于罕见行为。根据上海证券报的报道,自2019年12月,证监会发布《上市公司分拆所属子公司境内上市试点若干规定》,此后A股公司分拆上市持续活跃。截至2023年3月,已有21家上市公司完成分拆上市。这些公司平均为上市前的投资者创造了年化近50%的收益。同时,目前还有逾百家A股公司发布了分拆上市公告,分拆上市的子公司多属于新能源、半导体、电子、生物医药、机械设备等热门赛道。 在去年的5月18日晚,同为大厂的阿里巴巴曾宣布,旗下阿里云、菜鸟和盒马将分拆独立上市。其中,菜鸟和盒马已经启动上市计划,阿里云改名为云智能集团,将在引入外部战略投资后,于18个月内完成上市。 这些大厂以IPO为目标进行分拆独立上市的案例大部分可分为两类,一为业务已经成熟到可以进行单独上市,第二个为创新型业务借外部资本探索上市。对于懂车帝而言更偏向第一类。 与阿里巴巴大张旗鼓地分拆上市相比,懂车帝是字节跳动尝试分拆上市的第一个案例。另外,懂车帝独立上市也是字节跳动在除了广告、电商之外商业化战略的重要一步。作为字节跳动旗下的优质资产,或许懂车帝的上市成功也将为字节跳动的整体估值再次添砖加瓦。 值得一提的是,本次懂车帝的投资方都是字节跳动的老股东们。 其中,领投方红杉中国在这次融资中将出资4亿至5亿美元之间,在融资额中占最大比重。红杉中国早在2014年字节跳动的C轮融资时就已入股,并且成为公司的大股东之一。根据2023年五月福布斯的报道,红杉中国持有字节跳动约10%的股份,潜在价值数百亿美元。 而参投方泛大西洋资本和KKR也分别参与过字节跳动2017年E轮融资和2018年Pre-IPO轮融资。 老股东再次付出真金白银的支持,一方面是对懂车帝未来回报的看好。也有人猜测,这是字节跳动在自身一直没有IPO的情况下,借懂车帝给这些支持自己的老股东们一份回报。 第一个字节系IPO为何是懂车帝? 在字节跳动大家族中存在着许多令众人瞩目的产品,比如今日头条、抖音、飞书等。但是懂车帝却从中脱颖出来成为第一个备战IPO的选手。目前业界对于懂车帝上市抱有很大的信心,原因在于其高于同行的业务增速以及背靠抖音这条大树。 懂车帝原本为今日头条的汽车频道,后由字节跳动商业化部门所孵化。在2017年时,懂车帝独立APP正式上线,同时在2018年,今日头条的独立汽车频道更名为懂车帝。 借着新能源汽车的东风和今日头条的巨型流量,懂车帝在初期就得到了高速的发展。根据移动互联网数据机构“QuestMobile”当年10月份发布的《2017秋季大报告》,懂车帝App上线仅仅2个月,活跃用户数据就已经跻身行业TOP5。后续的发展也十分顺利,2018年时懂车帝注册用户已超过7500万,日活跃用户数为400万。2020年底,懂车帝日活数据增长到接近500万。在2021年至2023年上半年这期间,懂车帝的日活跃用户数量增长了57%,达732万。在去年7月的汽车创作者大会上,懂车帝宣布,已经和抖音、今日头条、西瓜视频旗下汽车内容全面融合,由懂车帝作为整体运营方,统筹各端资源;融合后,四个平台的汽车用户日活达到3.1亿人次,汽车内容日均浏览量超56亿次,运营覆盖的汽车创作者超过634万名。 作为新人的懂车帝含着金钥匙出生,左手内容、右手流量,一步步赶超前辈们,成为汽车资讯平台行业的佼佼者。 数据研究机构极光发布《2023年Q3移动互联网行业数据研究报告》显示,汽车资讯平台2023年Q3季均DAU(日活跃用户数)对比,懂车帝顺利挤入了第一梯队。而与懂车帝共同跻身汽车资讯平台第一梯队的另外两名玩家,都是此前完成上市的企业。 其中,易车创立于2000年,是国内最早一批汽车互联网企业之一,蔚来汽车CEO李斌为创始人。2010年时,易车网成功登陆纽交所美股上市,成为首家海外上市的中国汽车垂直网站,也是李斌人生中的第一个IPO项目。只不过在上市十年后,被腾讯以11亿美元的价格进行私有化收购,从而退市。另外一个企业名为汽车之家,由理想汽车创始人李想打造。早在2013年,李想带领汽车之家在纽交所上市,高光时刻,让李想收获1.52亿美元的身价。李想离开后,汽车之家进行了二次上市,在2021年3月15日登陆港交所,巅峰市值超900亿。 从资历来看,易车和汽车之家明显比懂车帝更具优势,但有媒体曝光字节内部人士的说法,称懂车帝的日活用户数早在2021年10月开始,就已经超越了汽车之家和易车,成为全国最大的汽车直播平台。从目前的估值来看,懂车帝217亿的估值也已经和最大竞争对手汽车之家248亿的市值旗鼓相当。 另外,懂车帝的野心并不止于汽车咨询平台,其业务板块早已扩张到了汽车后市场。 根据历史资料,2022年8月,懂车帝二手车线下交易市场“懂懂二手车”在重庆开业,开始首次涉及二手车线下交易领域。去年年尾,懂车帝也从线上走到了线下,在2023年11月25日,“懂车帝汽车商城”正式入驻合肥,成为懂车帝在全国落地的首家线下门店。 这几项业务的扩展也为懂车帝带来了流量的飞速扩展,截至2023年上半年,懂车帝目前的用户规模为2860万,对于2022年提升14.6%。这组增长率的数据也在汽车资讯平台的第一梯队中占据首位。 字节,“跳动”地资本版图 在互联网大爆发的十年中,行内创业者过的都是刀口舔血的日子,前赴后继奔走在这股浪潮中。而这也是造神的十年,无数人走到台前。其中就包括字节跳动的创始人张一鸣,一个出生于1983年的福建龙岩人。 宇宙起源于大爆炸,“宇宙厂”诞生于北京知春路上锦秋家园的民宅中的原因。在2012年时,张一鸣创立了字节跳动,初期的办公地址在锦秋家园的一所公寓内。紧接着,今日头条诞生,成为字节跳动推出的第一款产品。其稳定的用户数量和用户时长让投资人们闻风而动。2014 年上半年,红杉、微博等主流资本和产业力量开始入局今日头条,此时今日头条用户规模达9000万,估值超5亿美金,用时两年。 今日头条让张一鸣拿到了通往移动互联网的门票,初步站稳了脚跟,随后,更多不同领域的字节产品不断推出。包括火山、抖音、西瓜、飞书、皮皮虾、番茄小说……目前来看,无论是本次作为IPO首秀的懂车帝亦或是其他软件都做的十分成功。 历时10年,字节跳动蜕变成全球第一独角兽的中国互联网公司,张一鸣也成为最优秀的中国互联网二代创始人。 值得一提的是,除了专注旗下业务外,字节跳动的资本版图也十分庞大。根据IT桔子和企查查的信息梳理,2014年开始的10年时间里,字节跳动系共产生156起投资事件,其中包括59次并购。涉及教育、金融、汽车、房产、医疗、本地生活、游戏、文娱、人工智能、企业服务、元宇宙等近20个领域。 2014年,今日头条收购了当时能够为内容创业者提供摄影图片素材的网站“图虫网”,金额大概为几百万,而这也是字节跳动的并购首秀。之后的字节一路“买买买”,堪称互联网圈的“新晋并购王”。收购公司包括Musical.ly、工具APP产品朝夕日历、时光相册,以及从猎豹移动收购的欧洲新闻聚合应用News Republic和美国短视频/图片分享社区Flipagram。 最近的一次并购消息发生在今年5月初,字节跳动以数亿元金额收购知名开放式耳机品牌大十科技,收购价格在 3亿-5亿元之间,有人爆料目前字节跳动团队人员已经进驻大十科技。 在股权投资方面,字节跳动目前出手最多的领域是文娱板块。根据IT桔子数据,截至2024年4月,字节在文娱传媒的投资已达41起。在2015、2016年,字节跳动就投资了华尔街见闻、餐饮老板内参等新闻资讯、媒体内容;2017年,短视频、直播成为风口,字节跳动在一年时间内就聚拢了4家短视频、直播公司,对于Musical.Ly的并购也是在此期间发生;2018年则稍显落寞,文娱领域投资了一家动漫动画类公司——声影动漫;而2019、2020这两年投资的触角范围持续扩张,投资了包括吾里小说、止于至善、泰洋川禾等19家网文、艺人经纪、游戏公司与平台。2021年又与阿里巴巴联手共同投资了娱乐圈著名的乐华娱乐。 有专业人士接受采访表示,字节跳动的战略投资不仅是为了赚钱,更是建设自身生态,把自身影响力发挥到更大的做法。利用投资工具布局,做大了生态效应,类似杠杆的原理。 值得一提的是,2021年,字节跳动内部已经成立了一个财务投资团队,由曾就职于红杉中国的杨洁带队。根据每经报道,字节在2021投资的次数达到巅峰,累计54起,且范围更丰富,遍布医疗、电商零售、游戏、本地生活等11个行业的27个细分领域。同时,并购事件也在2021年达到巅峰,共15起。包括震撼业界的40亿美元收购沐瞳游戏、90亿元人民币收购PICO,都发生在这一年。 然而巅峰之后就开始回落,2022年1月,字节战略投资部门宣布解散,投资数量也迅速收缩。2023年到现在仅有4次投资出现,包括今年3月份的昕原半导体。与之前的大开大合相比,现在的字节出奇的安静。有意思的是,2022后正是资本的大寒冬,字节跳动这种先扬后抑的投资方式正好对应国内投资形势的变化。而且,随着AICG的爆火,人工智能成为字节跳动无论是投资还是内部发展的新方向。就在懂车帝消息曝出不久后,又有字节投资21亿美元在马来西亚发展人工智能的消息。 虽然2022年后,字节开始“去肥增瘦”战略,投资也暂时放缓,但其前半生资本版图已经足够庞大。未来这只全球最强的独角兽又将发展到何处地步,这无疑让人十分期待。
剥开产品和技术,北汽的内核是什么?
作者丨瀚星 提及汽车工业,常常被冠以“百年”一词作为修饰,这是一门需要时间沉淀的复杂工艺。 从1958年生产出第一辆自主研发汽车至今,北汽集团已经在汽车行业摸爬滚打了66年。在漫长的时间里,北汽有过许多明星产品,从中国第一代轻型越野车到北京吉普,从北京现代到北京奔驰,还有数十年经典传承的北汽越野BJ系列,以及豪华感十足的北汽极狐。 众多产品中,谁最能代表北汽?每个人都会有不同的答案。但对于北汽而言,66年的行业深耕最能体现集团特色的不是某一款产品,而是所有产品背后的理念传承:品质平权。 所谓品质,指的是行业内领先的技术和安全性;所谓平权,则是让普通消费者也能拥有高品质的产品。 BBA的标准,亲民的价格 近期,北汽集团副总经理刘宇在一场科技沙龙上坦言,“现在行业卷得一塌糊涂”。 在经历了几年的野蛮生长后,国内汽车行业逐步进入存量竞争时代,增速放缓的同时大批新玩家涌入。车企们卷价格、卷技术,甚至是CEO亲自下场做品牌宣传。 面对这样一个极致内卷的车圈,北汽的“卷”法有所不同:既不希望把技术卷到普通人遥不可及的高度,也不希望不计后果地将价格打到地板以下,而是选择了一条“质价比”的道路:让豪华下沉,让技术普惠。 实现质价比的第一步,是通过技术突破,让普通消费者也可以负担得起一线豪华产品。 坐落在奥地利格拉茨的麦格纳工厂生产过奔驰大G、宝马5系、捷豹E-PACE、i-PACE等豪华汽车品牌,而它的“姐妹工厂”北汽蓝谷麦格纳高端制造基地,是麦格纳除格拉茨工厂外的唯一整车制造基地,也被称作“东方格拉茨”。 北汽蓝谷麦格纳高端制造基地 图源:北汽集团微信公众号 北汽极狐阿尔法,就诞生自这里。在这座工厂生产的产品身上,藏着诸多“BBA”的细节。 极狐阿尔法S 图源:北汽集团官网 冲压车间是汽车制造的第一道工序,大多数主机厂的冲压件合格率介于85%~90%,而北汽蓝谷麦格纳工厂可以达到与奔驰同级的97%。在铆接环节,蓝谷麦格纳做到了99%的合格率,高精度工艺能够确保车身结构的稳定性。 与此同时,工厂的间隙控制标准为±1mm,面差控制标准为±0.5mm,与奔驰等一线豪华品牌看齐。 在BBA的生产标准下,最新上市的极狐阿尔法S5拥有51897N·m/deg的车身扭转刚度,高于劳斯莱斯幻影,而起售价仅有19.98万元。 除了在生产标准上看齐一线豪华品牌,北汽在智能化生产、数字化管理等环节也采用了“豪华”标准。 最近两年,北京奔驰开始全方位推行梅赛德斯-奔驰乘用车生产运营360(Mercedes-Benz Cars Operations 360,简称MO360)的应用,构建起“数字化、柔性化、高效、可持续”的智能制造体系。 目前,数字化已经渗透到北京奔驰生产制造的方方面面。 例如,北京奔驰在生产全流程中集合了大量先进机器人,并不断引入行业内最新的机器设备。相关机器人可以通过大数据完成自我学习、自我优化,进而实现高精准度的生产工作,将误差降至最低。 数字交互界面方面,北京奔驰顺义工厂采用在线监测系统,可视化大屏高度融合工厂的生产数据资源,实现产能、设备、仓储等多环节的关键指标监测分析,辅助生产人员全面掌控工厂生产运营状态并进行高效决策。通过技术突破实现更高效的生产,从而降低成本。 让消费者能够以50万以内的亲民价格,享受到百万级豪华标准,这才是品质平权的核心所在。 把品质平权刻在基因里 过去66年来,品质平权的理念贯穿在北汽发展的始终,也是它重要的精神内核。 这一精神内核,在不同年代有着不同的形象。 在1966年,它是中国第一代轻型越野车;47年后的2013年,它是首款民用越野车BJ40;到了2021年,它是极狐首款量产车型阿尔法T。而在今年的北京车展上,它可以是极狐阿尔法S5,也可以是参展的19款新产品中的任意一款。 每一代产品的成功背后,都有一个共同特点:对质价比的极致追求。 以北京越野的明星产品BJ40为例,这一系列的车型是中国越野车市场保有用户最多的产品,作为一辆定位于民用越野的车型,大多数用户选择BJ40的原因都是“品质可靠”。 BJ40 图源:北汽集团官网 BJ40采用“五高一旱”的测试标准,即在超50℃高温、95%以上高湿、-41℃以下高寒、5%以上高盐腐蚀、超5380米高海拔,以及四大沙漠干旱环境穿越的极限环境,确保车辆适应各种极端条件。 在这一标准下,消费者用民用越野的价格,就能买到专业越野的品质。 据北汽官方数据,2017-2020年,BJ40连续4年位列中国越野车型销量第一。2020年,该系列车型的市占率已经接近20%。 北汽的另一款明星车型极狐阿尔法T,同样是质价比的代表。 阿尔法T是极狐打造的第一款车型。它诞生于麦格纳工厂,以BBA的豪华品质为生产标准,同时采用了通常只会用于百万级豪车的“上钢下铝”车身结构。全车搭载了多个行业领先的智能驾驶软硬件,售价却仅在20万元级别。 从BJ40到极狐阿尔法T,品牌、产品、技术不断迭代,但不变的是对品质平权的追求。 来到2024年,通过60余年的传承和完善,北汽希望将产品的“质价比”做得更加极致。极致两个字,体现在“更智能、更节能、更安全”三个方面。 在智能方面,北汽是行业内首批实现AI大模型上车的企业之一,极狐考拉、阿尔法T5等产品已经具备自我认知、主动学习和无限次对话的AI能力。极狐阿尔法S先行版达到L3级别智能驾驶标准,是行业首批实现城市NOA功能的车型。6月初,北汽成为9家获得L3级自动驾驶试点准入证的车企之一。 续航焦虑一直是新能源汽车时代消费者的核心痛点,为了让新能源产品更节能,北汽在20万元以下车型上率先搭载800V高压超充电池系统,大幅降低了超充的门槛。此外,北汽还研发了国内最齐全的电机型谱,第五代电机中的单电机总成转速维持在22000转/分,同时功率密度提升,实现整车百公里加速7秒、能耗降低10%以上。 在汽车行业,安全是最大的豪华。北汽全系产品都采用高标准的碰撞安全标准,新能源钢铝混合专用车身在碰撞中吸能效率可提升35%,运用全新BJ40“整体笼式车身+内嵌式防滚架”技术,极狐有超60000牛米的车身扭转刚度,极光电池保持着交付至今零自燃的纪录。 品质平权的出发点是用户的需求,北汽始终从用户需求出发,帮用户解决问题,为用户创造价值。 从造出中国第一代轻型越野车至今,北汽的每一代明星产品都在传递相同的品质平权理念:高端的技术应该被大众用到,而不是少数人享受的潮流;车企要做质价比,而不是单纯的价格低。 平权不是喊口号,是固底色 实现品质平权并不容易,需要付出高昂的时间和金钱成本。北汽用60余年的坚持,把真正的品质平权打造成北汽始终如一的造车底色。 生产一部智能手机,背后需要至少8个诺贝尔奖的研究成果支持。而造出一辆品质平权的好车,需要3万个以上的专利作为基底。 据北汽官方数据,截至2023年12月,集团申请专利约3.5万件,授权专利达到27953件,有效专利18472件。 其中近四分之一的有效专利来自新能源和智能网联两大领域。新能源领域授权专利3426件,有效专利3140件;智能网联领域授权专利1543件,有效专利1067件,在全行业处于领先地位。 此外,北汽在三电、氢能等核心技术领域的成果也受到认可,6次获得中国汽车工业科技进步一等奖。 在3.5万件专利支持下,北汽在行业技术标准制定中也扮演了重要角色。截至目前,北汽拥有企业技术标准近5000份,累计参编国家、行业标准300余项,掌握公告、CCC、国环等认证申报系统,涉及3000多个认证参数管理与维护,认证能力覆盖全部车型。研究能力涵盖基础设施、智能网联、节能环保等七个领域,20余个细分研究方向,处于行业前列。 这一系列成就都得益于数十年如一日的研发体系搭建,围绕产品开发、技术开发、项目管理、质量管理、成本管理、技术标准等,北汽建立了完备的正向研发体系。 为此,北汽也投入了大量的真金白银。 2021年至2024年,北汽的研发投入逐年提升,研发总预算分别达到75.4亿、76.1亿、83.6亿和132.1亿元,研发费用占比从6.2%提升至到11.7%,增幅接近一倍,研发人员规模已达到8200人。 为提升核心研发能力,北汽牵头建设了国家新能源汽车技术创新中心,并投资超过20亿元建立北汽新能源汽车试验中心。在提升自身核心技术水平的同时,北汽也在推动中国新能源汽车产业的整体发展。 但对于北汽而言,这只是起点。 未来5年,北汽将在新能源、智能化的技术研发上投入超500亿元,到2030年,北汽的累计研发投入将突破1000亿元。 在北汽看来,科技从来不是为了扩大世界的差距,而是要竭尽所能包容彼此的差异,不断缩小差距。只有不断科技创新才能打破价格限制、突破技术壁垒,从而为消费者提供同品质里的超价值。 好的科技成为人人受益的科技,落地到智驾平权、安全平权、空间平权、成本平权……以科技创新下沉“百万级”产品体验,才是真正意义上的品质平权。 每一款成功的产品、每一项领先的技术,都代表着某一时间段的北汽。但真正能够定义北汽66年历史的精神内核,只有品质平权。 对品质平权精神的传承不是喊口号,而是陪伴北汽百年甚至更长时间的护城河。只要始终保有这一内核,北汽还会有源源不断的新产品、新技术落地。
马斯克成功讨薪4048亿!现场蹦迪跳舞,披露万亿利润新目标
接着奏乐,接着舞! △ 来源X@teslaownersSV,下同 我老马啊,今天就是高兴! 原因为何?“讨薪”成功了!而且还是价值558亿美元(约4048.3亿元)的工资,搁谁身上不高兴(doge)。 特斯拉的股东们在刚刚结束的年度股东大会上,高票批准了马斯克的薪酬方案,还有其他多项提案。 这不仅让马斯克喜笑颜开,还让特斯拉的股票微涨3%。 马斯克激动承诺: 我会继续带领特斯拉成为世界上最有价值的公司。 马斯克“讨薪”成功了 严格意义上来说,结果是马斯克提前泄漏的。 特斯拉年度股东大会开始之前,马斯克就嘚瑟地在自己账号上公开了: 两项股东决议均以较大优势通过!感谢老铁们的支持! 而这两项决议,正是马斯克的2018年股票激励薪酬方案能否能到批准,以及公司注册地是否迁至德克萨斯州。 正在舆论怀疑马斯克的消息来源时,随后进行的股东大会上股东的投票结果证实马斯克说的是真的,股东们通过了该薪酬方案,并同意公司注册地迁址。 是的,正是马斯克的那个“天价薪酬”方案:特斯拉总收入、利润和市值累计划分了12个阶段目标,每完成一个阶段目标,马斯克可以获得一笔股票期权。 如果在2028年1月之前全部完成,按照对应的市值估计,马斯克累计获得股票期权价值为558亿美元(约4048.3亿元)。 不过由于特斯拉今年股票接连下滑,对应薪酬方案目前已经缩水到了483亿美元(约3504.2亿元),少了大概五百多亿。 但缩不缩水的不是股东关心的重点,因为马斯克本身就管理多家公司,特斯拉、SpaceX、Neuralink……后来又多了X和xAI。 有股东就认为马斯克显然没有办法全身心投入特斯拉,起诉马斯克这样的薪酬不合理,信息披露不全导致无法证明该方案是公平的。 而这场诉讼也在今年1月拿到结果,特拉华州法院法官裁定薪酬无效。 不过现在股东们又高票同意了,这也是目前这件事情还存在疑点的地方。 在杜兰大学法学院任教的一名律师认为,股东们是无权推翻法官裁决的,这只会让事情更加复杂。可能会引发新的诉讼,也可能会让案件再次交由法官审理。 卫报认为,特斯拉董事会可能会就法官之前的判决结果提起上诉,利用股东投票结果来改变法官的决定。 总之,马斯克这笔薪酬方案是否能拿到手,最终的决定权还是在法官手里。 不过特斯拉的董事、股东们已经站在马斯克这边,董事长Robyn Denholm在致股东的信中写道: 埃隆不是典型的高管,特斯拉也不是一家典型的公司……无论是2018年还是今天,我们一直知道埃隆没有无限的时间,也不缺乏想法和容身之地,他可以在这些地方对世界产生巨大的影响。董事会只希望他的想法、精力和时间能够集中在特斯拉,以造福股东。但这需要相互尊重。 股东投出了信任一票,马斯克也作出了回应。有粉丝询问马斯克: 我们支持了你,现在你必须带领特斯拉成为地球上最有价值的公司,成交? 马斯克回复:没问题。 马斯克一激动,又透露了新进展 虽然目前还不是最终结果,但这并不妨碍马斯克在台上又蹦又跳。 △ 来源X@teslaownersSV 这份激动也延续到了发言部分,马斯克张口就是: 我首先想说,这太棒了,我爱你们! 接下来关于特斯拉的未来计划(毕竟本质还是股东大会而不是投票大会),马斯克滔滔不绝说了很多。 主要包括接下来的重点业务,以及新业务。 首先是万众瞩目的擎天柱Optimus机器人,马斯克认为该项目将给特斯拉带来数十万亿美元的价值。 马斯克透露,到2025年,就会有超过1000个人形机器人在特斯拉工厂里工作。并且批量生产后,其成本约为1万美元(约7.3万元),再以2万美元(约14.5万元)的价格出售,能给特斯拉带来1万亿美元的利润。 马斯克认为,人形机器人的市场规模每年10亿台,他相信特斯拉会占据至少10%的市场份额。 马斯克还补充道,他还相信到2026年,Optimus将成为完全可软件定制的机器人。 嗯……虽然马斯克话是这么说,但有网友不太买账,表示马斯克之前在吹自动驾驶的时候也说过类似的话、给出差不多的时间表,所以这些言论嘛,还是等产品真正就绪了再说。 不过马斯克分享的未来计划不止有Optimus机器人,还有其他特斯拉核心软硬件的进展。 特斯拉自研芯片HardWare系列,马斯克表示已经完成HW 5.0版本的设计,代号是“AI 5”,预计在2025年底正式推出,比HW 4.0的硬件能力强10倍。 并且在今年晚些时候,特斯拉会推出训练HW 4.0的专用模型。也就是说今后HW 3.0和HW 4.0的硬件训练,将分开进行。 另外,FSD免费转移的时长,马斯克同意再延长一个季度。虽然具体如何实施还有待官宣,不过可以确定的是,接下来想要买新特斯拉,FSD的权益还是有机会免费转移到新车上。 最后就是计划在今年8月8日推出的Robotaxi,马斯克更详细阐述了公司的运营模式。 等到Robotaxi推出后,部分车辆将由特斯拉拥有并运营,而另一部分归属权则在特斯拉用户。 在股东大会结尾处的彩蛋还展示了怎么打特斯拉的Robotaxi。看起来界面就是特斯拉的APP,并且能远程控制车内温度、查看车辆距离、播放音乐。 不过鉴于视频中展示车辆就是Model Y,再结合马斯克的发言,这莫非是在暗示,特斯拉车主的车自己出去接单赚钱不是梦? 而在这次股东大会和马斯克的多方影响下,特斯拉股价盘中上涨约3%,盘后也在继续上涨。 今年特斯拉恢复万亿市值,说不定也有可能。 One More Thing 在股东大会上产品阵容展示环节,PPT上除了现有的S3XY、赛博皮卡、Semi卡车,还出现了三辆车盖在幕布下。 左下角的这个车型格外与众不同,看大概的形状,不会是MPV吧??
2024北京智源大会:构建全球首个实时孪生心脏计算模型
凤凰网科技讯(作者/黄若曦)6月14日,第六届“北京智源大会”在中关村展示中心开幕。智源研究院构建了全球首个实时孪生心脏计算模型,可实现高精度的前提下生物时间/仿真时间比小于1。实时心脏计算模型是虚拟心脏科学研究的开端,是孪生心脏走向临床应用的基础。基于这一模型,智源将创新性地采用物理-数据双驱动模型,融合第一性原理和人工智能方法,从亚细胞级、细胞级、器官级、躯干级仿真出一个“透明心脏”,且能根据患者的临床数据,构建出反映患者的个性化生理病理的孪生心脏,从而进行药物筛选、治疗方案优化、术前规划等临床应用。 2024北京智源大会邀请到了图灵奖得主姚期智,OpenAI、Meta、DeepMind、斯坦福、UC Berkeley等国际明星机构与技术团队代表,以及百度、零一万物、百川智能、智谱AI、面壁智能等国内主流大模型公司CEO与CTO,汇聚了200余位人工智能顶尖学者和产业专家,围绕人工智能关键技术路径和应用场景展开精彩演讲和尖峰对话。 智源研究院院长王仲远做2024智源研究院进展报告,汇报智源研究院在语言、多模态、具身、生物计算大模型的前沿探索和研究进展以及大模型全栈开源技术基座的迭代升级与版图布局。 王仲远表示,现阶段语言大模型的发展已经具备了通用人工智能非常核心的理解和推理能力,并且形成了一条以语言大模型为核心对齐和映射其他模态的技术路线,从而让模型具备了初步的多模态理解和生成能力。但这并不是让人工智能感知、理解物理世界的终极技术路线,而是应该采取统一模型的范式,实现多模态的输入和输出,让模型具备原生的多模态扩展能力。 针对大模型训练算力消耗高的问题,智源研究院和中国电信人工智能研究院(TeleAI)基于模型生长和损失预测等关键技术,联合研发并推出全球首个低碳单体稠密万亿语言模型 Tele-FLM-1T。该模型与百亿级的52B版本,千亿级的102B版本共同构成Tele-FLM系列模型。 Tele-FLM系列模型实现了低碳生长,仅以业界普通训练方案9%的算力资源,基于112台A800服务器,用4个月完成3个模型总计2.3Ttokens的训练,成功训练出万亿稠密模型Tele-FLM-1T。模型训练全程做到了零调整零重试,算力能效高且模型收敛性和稳定性好。目前,TeleFLM系列模型已经全面开源了52B版本,核心技术(生长技术、最优超参预测)、训练细节(loss曲线、最优超参、数据配比和Grad Norm等)均开源,期望技术开源可以对大模型社区产生有益促进。 在基础模型的性能方面:BPB 显示,英文能力上,Tele-FLM-52B接近Llama3-70B,优于 Llama2-70B和Llama3-8B;中文能力上,Tele-FLM-52B 为开源最强,优于 Llama3-70B 和 Qwen1.5-72B。在对话模型性能方面:AlignBench评测显示,Tele-FLM-Chat(52B)已经达到GPT-4 中文语言能力的96%,总体能力达到GPT-4 的80%。 针对大模型幻觉等问题,智源研究院自主研发了通用语义向量模型BGE(BAAI General Embedding)系列,基于检索增强RAG技术,实现数据之间精准的语义匹配,支持大模型调用外部知识的调用。自2023年8月起,BGE模型系列先后进行了三次迭代,分别在中英文检索、多语言检索、精细化检索三个任务中取得了业内最佳的表现,综合能力显著优于OpenAI、Google、Microsoft、Cohere等机构的同类模型。 行业现有的多模态大模型多为对于不同任务而训练的专用模型,例如Stable Diffusion之于文生图,Sora之于文生视频,GPT-4V之于图生文。每类模型都有对应的架构和方法,例如对于视频生成,行业普遍参照Sora选择了DiT架构。但是现有模型的能力多为单一分散的能力组合,而不是原生的统一能力,例如目前Sora还做不到图像和视频的理解。 Emu3采用智源自研的多模态自回归技术路径,在图像、视频、文字上联合训练,使模型具备原生多模态能力,实现了图像、视频、文字的统一输入和输出。Emu3从模型训练开始就是为统一的多模态生成和理解而设计的,目前具备生成高质量图片和视频、续写视频、理解物理世界等多模态能力。 为适应智能端侧的应用,智源研究院推出了轻量级图文多模态模型系列 Bunny-3B/4B/8B,该模型系列采用灵活架构,可支持多种视觉编码器和语言基座模型。 在具身智能通用抓取能力方面,针对跨任意形状和材质的泛化难题,智源率先突破95%的真机实验成功率,从而实现了全球领先的商业级动作执行水平。 在分级具身大模型系统方面,智源研发了铰接物体操作大模型系统SAGE。该系统有效结合了三维视觉小模型对空间几何的精确感知能力和通用图文大模型的通用物体操作知识,使大模型驱动的机器人能够在任务执行失败时能够重新思考并再次尝试新的交互方式。 在分级具身大模型系统方面,智源还研发了大模型系统Open6DOR。该系统不仅像谷歌RT系列大模型一样按照自然语言指令中的要求将物体放到指定位置,还能够进一步对物体的姿态进行精细化控制。 在面向技术终局的端到端具身大模型层面,智源发布了全球首个端到端基于视频的多模态具身导航大模型NaVid。该模型可直接将机器人视角的视频和用户的自然语言指令作为输入,端到端输出机器人的移动控制信号。不同于以往的机器人导航技术,NaVid无需建图,也不依赖于深度信息和里程计信息等其它传感器信号,而是完全依靠机器人摄像头采集的单视角RGB视频流,并在只利用合成导航数据进行训练的情况下,通过Sim2Real的方式,实现在真实世界室内场景甚至是室外场景的zero-shot真机泛化。 智源研究院联合领视智远研发了全球首个智能心脏超声机器人,实现了全球首例真人身上的自主心脏超声扫查,可解决心脏B超医生紧缺,诊断准确率不高,标准化欠缺,效率低的难题。基于超声影像和机械臂的受力信息,智能心脏超声机器人可在高速动态环境下,快速计算,提取心脏特征,实现了相当于自动驾驶L2、 L3 级的智能化水平。 为实现通用计算机控制,智源研究院提出了通用计算机控制框架Cradle,让智能体像人一样看屏幕,通过鼠标、键盘完成计算机上的所有任务。Cradle 由信息收集、自我反思、任务推断、技能管理、行动计划以及记忆模块等 6 个模块组成,可进行 “反思过去,总结现在,规划未来”的强大决策推理。不同于业界其他方法,Cradle不依赖任何内部API实现了通用性。 此外,智源研究院,还探索了生成式人工智能应用于分子生物学中的应用。智源研究院研发的全原子生物分子模型OpenComplex 2,是世界领先的大分子结构预测模型,能有效预测蛋白质、RNA、DNA、糖类、小分子等复合物。 OpenComplex 2 是基于全原子建模的生命分子基础模型,科研人员发现不仅可以预测大分子的稳定结构,还初步具备预测分子多构型以及折叠过程的能力。基于这样的能力,生命科学家可以进一步探索蛋白质的生物学功能。目前,智源已和研究伙伴在多项重要疾病上展开了研究,提供成药性和分子机理研究。 为帮助全球开发者一站式启动大模型开发和研究工作,智源研究院推出了面向异构芯片、支持多种框架的大模型全栈开源技术基座FlagOpen 2.0,在1.0的基础上,进一步完善了模型、数据、算法、评测、系统五大版图布局,旨在打造大模型时代的 Linux。 智源研究院推出了面向大模型、支持多种异构算力的智算集群软件栈 FlagOS。FlagOS融合了智源长期深耕的面向多元AI芯片的关键技术,包括异构算力智能调度管理平台九鼎、支持多元AI异构算力的并行训推框架FlagScale、支持多种AI芯片架构的高性能算子库FlagAttention和FlagGems,集群诊断工具FlagDiagnose和AI芯片评测工具FlagPerf。FlagOS如同“操作系统”一样,集异构算力管理、算力自动迁移、并行训练优化、高性能算子于一体。向上支撑大模型训练、推理、评测等重要任务,向下管理底层异构算力、高速网络、分布式存储。 智源研究院发布首个千万级高质量开源指令微调数据集开源项目,首期发布经过验证的300万条中英文指令数据,近期将完成千万条指令数据的开源。 为加速推进大模型技术的产业应用进程,智源研究院构建并开源了IndustryCorpus中英文多行业数据集,包含总计3.4TB预训练数据集,其中中文1TB,英文2.4TB,覆盖18类行业,分类准确率达到80%,未来计划增加到30类。 为验证行业数据集的性能表现,智源训练了医疗行业示范模型,对比继续预训练前的模型,客观性能总体提升了20%,而经过我们制作的医疗SFT数据集和DPO数据集的精调训练,相对参考答案的主观胜率达到82%,5分制多轮对话能力CMTMedQA评分达到4.45。 FlagScale首次在异构集群上实现不同厂商跨节点RDMA直连和多种并行策略的高效混合训练,成为业界首个在多元异构AI芯片上同时支持纵向和横向扩展两阶段增长模式的训练框架。 FlagScale支持语言及多模态模型的稠密及稀疏训练,可实现1M长序列大规模稳定训练和推理;支持基于国产算力的8x16B千亿参数MoE语言大模型1024卡40天以上的稳定训练;支持不同架构的多种芯片合池训练,基于业界领先的异构并行策略,可达到85%以上的混合训练性能上界,与同构芯片的模型训练效果一致;适配8款国内外不同芯片,可在不同集群进行规模训练验证,实现Loss逐位与收敛曲线严格对齐。 为更好地支持多元AI芯片统一生态发展,智源研究院推出了面向大模型的开源Triton算子库,包括首个通用算子库FlagGems和大模型专用算子库FlagAttention,可基于统一开源编程语言,大幅提升算子开发效率,同时,面向多元芯片共享算子库。 目前主流语言和多模态模型需要的127个算子,通用算子库FlagGems已覆盖66个,预计2024年底实现全覆盖。大模型专用算子库FlagAttention,包含6种高频使用的且紧跟算法前沿的最新Attention类算子,为用户提供编程范例,可自定义算子。 FlagEval大模型评估自2023年发布以来,已从主要面向语言模型扩展到视频、语音、多模态模型,实现多领域全覆盖,采用主观客观结合以及开卷闭卷综合的考察方式,首次联合权威教育部门开展大模型K12学科测验,与中国传媒大学合作共建文生视频模型主观评价体系。智源研究院已与全国10余家高校和机构合作共建评测方法与工具,探索基于AI的辅助评测模型 FlagJudge,打造面向大模型新能力的有挑战的评测集。 智源研究院牵头成立了IEEE大模型评测标准小组P3419,与hugging face社区合作发布多个榜单,并将先进的评测数据以及裁判模型与新加坡IMDA合作,共同贡献到AI Verify Foundation,以促进在大模型评估方法和工具上的国际合作。 在通往AGI的尖峰对话中,智源研究院王仲远,百川智能CEO王小川,智谱AI CEO张鹏,月之暗面CEO杨植麟,面壁智能CEO李大海针对大模型的技术路径依赖与突破、开放生态与封闭研究、商业模式探索等热点话题,展开深度讨论。
字节扣子模型广场,给AI大模型搭了一座擂台
6月11日凌晨,在苹果开发者大会WWDC 2024上,苹果发布iOS 18,同时首次公布了苹果智能(Apple Intelligence,简称 AI)。在近 40 分钟的时间内,苹果差不多提到了 60 次 Apple Intelligence,基于自有AI与“外援”OpenAI,苹果将重构Siri、iOS以及iPhone、iPad、Mac等设备的体验。发布会后,苹果股价连续两日拉涨,最新市值3.3万亿美元再度成为世界市值最高公司。 (图源:苹果WWDC 2024) 苹果宣布放弃汽车押注AI后,终于真刀真枪地干了起来。苹果用实际行动证明,AI就是世界的未来——上一次科技行业如此激动还是移动互联网爆发时。 “AI的iPhone时刻”终于来了!这一概念由黄仁勋率先提出,作为AI“卖铲子的”,英伟达一骑绝尘,成了跟苹果、微软同一个体量的超级巨头。现在看来,iOS 18以及Apple Intelligence的发布,意味着AI的“iPhone时刻”真的到来。 Bot大爆发,AI现象级应用呼之欲出 2022年11月,GPT-3.5让人们见到了AI大模型的强大威力,AIGC百花齐放,文生文、文生图、文生音乐、文生视频……不断涌现“炸裂级”基础大模型技术。同时,越来越多的企业与开发者跑步入局AI,想法设法将AI融入到自家产品中。 然而从结果来看,AI尚未普及,迄今为止行业缺乏一款类似于微信(3G移动时代)或者说抖音(4G移动时代)的现象级应用,大多数用户对AI大模型是“只闻其声”,Sora更是成了停留在demo阶段的传说。 当前的AI大模型有点像2010年前后的移动互联网:iPhone与安卓均已诞生,3G也已发牌,然而App的缺失却让智能手机成了少数发烧友的炫酷装备。 任何技术都需要繁荣的应用生态,因为“只有车跑起来,高速公路才有价值”。AI应用生态亟需更加丰富,但AI开发者正面临两大难题: 一个是AI大模型本身具有极高的开发门槛,开发者不知道如何“下牙”,不同模型能力不同,越复杂的模型越难调试,学习成本高,开发难度大;第二个是AI计算资源昂贵奢侈,大模型训练、推理与部署均需要高性能GPU、电能等计算资源,这给开发者带来巨大的资金压力。 AI想要普及,必须下沉到各类软硬件产品上,要么成为AI硬件,要么成为融入到AI硬件中的AI应用——其中最具代表性的是Bot,即Robot(机器人)的缩写,它是当前应用最广泛的智能应用形态,具有代表性的是ChatGPT、字节豆包、文心一言。 (图源:字节扣子) 大模型将重构人机交互方式,应用的终极形态可能不一定再是基于触控点按GUI(图形交互界面)的App,而是基于人机自然多模态对话交互的Bot,就跟苹果在WWDC 24上“画饼”的Siri超级助理一样,AI可理解文字、声音、图片、视频等诸多指令并生成对应的结果。 这样看,Bot将会是AI时代的“App”,对于开发者来说,开发Bot将是拥抱AI的主流路径,也是新的红利。 因此,要推动AI大模型落地,最重要的一点就是降低Bot开发门槛。移动时代,苹果和谷歌始终为降低开发门槛而不懈努力,它们的应用生态分别拥有数百万计的App。AI时代,字节旗下的扣子(coze.cn)也想扮演类似角色,让开发者更低门槛、更高效率、更低成本地开发Bot应用,拥抱AI新浪潮。 字节扣子,让人人都能成为AI开发者 对大多数开发者来说,基于基础大模型开发AI应用特别是Bot,并不现实,因为基础大模型开发门槛极高,与大多数开发者之间都有技术鸿沟,更别说缺乏编程经验的普通人了。 AI开发者的痛点,有平台看见了,比如善于技术产品化的字节跳动。在大模型驱动的AI时代,字节没有狂卷参数猛堆料搞军备竞赛,而是将重点放在了技术产品化与大模型落地上。除了“人有我有”的基础大模型以及对应的云服务外,今年2月字节在国内上线了新一代 AI Bot 应用开发平台扣子(coze.cn)。在这个平台上,即使是没有编程基础的小白,也能快速创建各种各样的聊天机器人,并将创建的机器人发布到抖音、微信等社交通讯平台。 (图源:字节扣子) 相较于其他Bot开发平台而言,字节扣子的最大特色可被概括为:“模块化”。 开发者可像搭积木一样拼装不同组件,将大模型、插件和工作流等能力组合成具有不同能力、适用于不同场景的Bot应用,哪怕没有编程基础的人,也可通过拖拉拽的方式快速搭建一个工作流实现编程的效果。 在搭建Bot的过程中,扣子提供了多样的知识存储能力和丰富的交互模式支持,开发者可“投喂”网站实时信息或者本地大文件作为知识库,让Bot具备特定领域的数据源。 此外,字节扣子另一个特征是更新迭代快,这一点至关重要。为什么苹果在WWDC 2024上说不清楚“苹果智能”的路线图?因为AI进化神速,它到底会长出什么样的软硬件今天没人知道答案。因此,所有AI开发者特别是Bot都必须只争朝夕,快速进化。 字节扣子可满足开发者快速进化的需求,一则是其低门槛、易上手的搭建环境支持Bot极速迭代;二则是其会及时地更新各种基础大模型且兼容并包,让Bot拥有与时俱进的底层智能,其现已支持字节豆包、通义千问、MiniMax、Moonshot、智谱、百川智能等基础大模型,且名单依然在扩大中。 凭借着模块化的低门槛开发能力,快速迭代的平台基础能力体系,字节扣子让Bot开发变得前所未有的简单。 6月13日,字节扣子联合Intel推出AI工坊(Coze AI Factory)活动,同时推出了全新板块“模型广场”,定位为在线大模型对比与评估系统——可以简单地将其理解成是AI大模型以及Bot的“擂台”。 (图源:字节扣子) 古代的“擂台”要么是比武招亲,要么是招募勇士,总之就是要寻觅牛人。同理,字节扣子的“模型广场”旨在构建一个大模型评估体系,一则让AI开发者可更好地选择适合自身需求的大模型,二则让大模型供应商知道对应大模型在细分领域和真实应用中的反馈,进而有的放矢地改进。 字节扣子模型广场推出的背景是,“百模大战”如火如荼,基础大模型,垂直大模型,产业大模型,多模态大模型如雨后春笋出现,这让开发者陷入了选择困难症,在开发Bot往往不知道选择什么模型,市面上也没有类似于豆瓣电影评分这样的评测体系。 举个例子,小雷这样的科技爱好者想在扣子上创建一个帮助编辑检查文章配图版权、错别字的Bot,但缺乏大模型开发经验的我并不知道扣子上的哪些模型、哪些插件、哪些能力可以为我所用,在模型广场,小雷可以通过“模型对战”来寻觅适合的模型。 也就是说,开发者可让一个Bot在隐藏模型的情况下回答任何问题,再对回答进行投票,测试结束扣子会揭晓模型,让开发者不再有选择困难症。 字节扣子模型广场的对战模式分为三种:指定Bot对战、随机Bot对战和纯模型对战。 开发者想要评测模型在指定细分领域的能力,可以“指定Bot对战”,选取感兴趣的Bot后(比如财经领域的信息处理,再比如数学领域的知识应用),系统会随机选取两个匿名模型来让开发者进行对战测试,检验是否符合预期并进行筛选。 (图源:字节扣子) 比如我想做一个影评类Bot,需筛选一个善于影视类信息分析处理的模型。我只需选中字节扣子上已有的“影视分析Bot”进行对战,就可以筛选出表现更好的大模型。 (图源:字节扣子,该问题下,B模型显然不如A模型表现好。) 如果开发者要评测模型在通用业务场景下的能力,则可选择“随机Bot”对战模式,系统会随机选取一个bot再随机匹配两个匿名模型来进行评测; (图源:字节扣子,随机Bot对战,问一个问题,对Bot的回答进行评分) (图源:字节扣子,随机Bot对战,评分后系统会展示隐藏模型细节,帮助开发者选择合适的。) 如果开发者只是想评测模型本身能力,则可选择“纯模型对战”模式,可直观地对比出模型本身的文本生成等AIGC能力。 字节靠着引以为豪的A/B测试方法体系,开发并运营了多款成功的移动产品,成为移动App工场。在小雷看来,字节扣子创造性推出的“模型竞技场”其实也是受到A/B测试方法论的启发,让开发者可以更高效地开发Bot,同时帮助所有大模型更快进化,字节扣子正在邀请更多大模型对其开放 API,加入到其评测范围,收集真实消费场景的数据进而有的放矢地优化。 自上线以来,字节扣子动作频频,成功抹平基础大模型与AI应用Bot之间的技术鸿沟,让Bot开发走向低代码阶段。AI应用的开发正在变得跟开发App一样简单甚至更简单。今年5月就有一位五年级小朋友基于字节扣子开发了AI bot,他通过利用在学校学到的语文知识,打造了一个堪称英语外教的 AI bot。 人人成为AI开发者,在字节扣子正在成为现实。 重做所有软硬件!开发者迎接AI泼天富贵 任何产品的成功都离不开两点:开发与运营,AI应用也不例外。AI应用的分发则是成功的运营的第一步。开发者开发Bot后,需要先部署让其“跑起来”,再分发获取用户、实现商业化,这些字节扣子都有对应的能力支持。 开发者在字节扣子创建完Bot后,可将Bot部署成网站/App/小程序甚至硬件终端上,接着可将其一键发布到包括抖音、公众号(订阅号/服务号/企业微信)在内的社交通讯平台。 (图源:字节扣子) 已有不少开发者尝到了低门槛开发与运营Bot的甜头,比如海底捞使用扣子模拟顾客对话演练,帮助客服小姐姐提高服务水平,让“海底捞式服务”在AI加持下精益求精;比如超级猩猩使用扣子帮助用户懂得更好的健身;招商银行基于扣子搭建了推荐餐饮优惠门店的掌上生活优惠 bot 以及分析市场行情的财富看点…… 2024年的一个显著趋势是,所有软硬件都在被用AI重做一遍。比如阿里提出了AI电商战略让淘宝App全面拥抱AI;再比如在硬件行业,AI手机、AI PC、AI电视、AI穿戴、AI汽车更是蔚然成风,继OPPO、vivo、荣耀、三星、华为、魅族等安卓巨头加码AI硬件后,WWDC 24上苹果的动作更表明,AI手机以及AI硬件是大势所趋。 硬件开发者当然不只是大厂,除了海量智能硬件开发者外,还有大量的基于智能硬件实现行业方案的开发者。不过,AI硬件开发比AI软件要难得多,因为终端侧会更受限于算力、网络、续航等底层资源。苹果AI硬件采取了端-边-云的大模型联动协同复杂方案,vivo、三星等AI硬件巨头都请了“外援”,由此可见AI硬件开发,绝非易事。 字节扣子已针对AI硬件的开发难题提供解法,其产品经理潘宇扬就明确提到,扣子已具备将AI能力带入硬件设备的能力,比如说在边缘云Bot的统筹下,普通的摄像头也能化身“AI设备”,通过图像截取、图像分析等能力,告诉后台哪个展馆热度最高、人流如何。 借着字节扣子“一键发布Bot”的能力,开发者可一键让硬件接入大模型能力,基于此,教育硬件、穿戴设备、家居家电、健康设备、行业智能设备等等智能设备,都可具备全新的Bot对话服务能力,极大化地感知真实世界与场景需求,更好地服务于人类的生活、生产与学习。 不论是移动互联网还是AI大模型,软件与硬件均密不可分。AI硬件是AI 应用普及的关键,AI设备上的OS将升级为AI OS(如iOS 18),软件则将升级成AI 应用(如豆包)。不断降低AI软硬件应用开发门槛的字节扣子,正在“长出”更多Bot创新。 (图源:字节扣子) 移动互联网的流量红利消失,开发者迎来AI带来的新一轮泼天富贵。千行百业的软硬件开发者正在字节扣子释放创意,结合业务场景与客户需求,开发Bot,用Bot创业,用Bot承载现有业务服务客户,用Bot改造现有软硬件应用,用Bot重塑原来的数字化系统。 写在最后: “高手在民间”。 移动互联网时代,iOS与安卓催生了海量的创新,不只是有微信、抖音、美团外卖、街电等等创新软件,也有智能电视、智能手表、智能门锁、智能家电、XR眼镜、智能汽车等智能硬件,还有智慧交通、智能能源、智能安防、共享经济等等行业数字化应用…… 同样,当所有软硬件开发者,甚至每一个用户都能低门槛地开发AI Bot时,AI一定会实现从“智能涌现”到“创新涌现”的跨越,“AI英雄”将会创造出许多我们今天想得到、想不到的AI软硬件应用,乃至全新的商业模式。 AI的iPhone时刻已经到来,AI应用的算力、设备、开发工具等基础设施已万事俱备,我们距离真正的“AI时代”,只有一步之遥。
马斯克:Model Y有望成为今年地球上卖得最好的车
凤凰网科技讯 6月14日,特斯拉2024年股东大会在美国得克萨斯超级工厂举行。特斯拉CEO埃隆·马斯克(Elon Musk)在会上表示,无论是人工智能、电动车还是能源业务,特斯拉都将迎来新的高速发展。Model Y在2023年成为全球销量最高的车型,并将会在2024年继续问鼎全球最畅销车型。 目前,特斯拉的超充网络正在加速扩展之中,全球已经建设了5.8万根超级充电桩。今年余下时间里,超充网络的部署力度将超越整个行业,投入预计将达到5亿美元,覆盖每一个交通要道,甚至地图上未标记的区域,以确保特斯拉车主无论身在何处,都能享受到无缝的充电体验。 据悉,特斯拉Semi已经开始规模化生产。相比于柴油卡车,Semi拥有更低的运输成本。对于运输行业的公司来说,想赚钱就应该使用Semi车队,放弃柴油卡车。特斯拉Semi在盈利方面做出贡献将远超市场预期。运输车队的电气化将在减少二氧化碳排放和推动可持续能源发展方面做出巨大贡献。 马斯克表示,他看到未来有一个潜在的可能性,当特斯拉车队的规模超过一亿辆,如果每辆车都有1千瓦的高效推理计算能力,那么你就拥有了100吉瓦的计算能力,这是分布在全球各地的海量算力。特斯拉电动车每周会有50-60小时作为Robotaxi的运行时间,但有100小时左右的时间可能并没有在运行,这就意味着每周有100小时的100吉瓦计算能力,特斯拉将可以利用这样庞大的计算资源。 “对特斯拉来说,这在未来会有重大意义。目前还没有人真正考虑到这一点,但我认为这确实非常重要。”马斯克表示。 此外,在公司的价值方面,自动驾驶将是一个令人震撼的领域,马斯克认可Ark Invest公司的预测,仅基于自动驾驶业务,特斯拉的估值就有潜力涨10倍,将超过5万亿美元;如果再加上人形机器人业务,假设市盈率是20倍或25倍左右,这意味着仅乐观情形下特斯拉就将有20万亿美元的市值,是当今大多数科技巨头的十倍。 同时,特斯拉自研了用于电动车的人工智能推理芯片,过去一年生产的电动车已经配备了HW4.0,新一代HW5.0正在开发之中。此前马斯克曾表示,2024年,特斯拉将投入100亿美元在人工智能业务。
扣子模型广场,把模型打分权交给开发者
扣子给开发者做了一个AI工坊,让开发者可以低成本、一键触达大模型。 文|徐鑫 赵艳秋 编|周路平 大模型不缺热点,价格、参数、工具链、长文本、多模态,竞争激烈,热闹非凡。 AI应用开发者们却犯难了。底层模型快速升级变化,怎么更好地追踪各家模型的能力?不同模型在场景里的能力差异点到底在哪?要做一个应用,如何更快选出适合的模型? 这一真实痛点下,近日,在字节旗下AI 应用开发平台扣子联合 Intel 推出的AI工坊( Coze AI Factory )活动中,扣子重磅上线了“扣子模型广场”。广大开发者可以低门槛、广泛参与模型能力评测,为应用开发提供指引。 在模型广场里,用户可以向两个基于不同底座模型搭建的Bot发出请求,Bot会匿名返回不同的结果。根据结果,用户能比较不同模型在特定场景里的表现并打分。“产品好不好用,用户会用脚投票”,扣子的模型广场,用轻松对决方式,让开发者们给大模型的场景能力投票,极大程度降低了评测模型能力的难度。 选对底层模型能力,关乎AI应用效果,模型广场的出现也有利于AI应用获得更好的用户口碑。 扣子正持续从产品和功能上发力,降低AI应用开发门槛,加速AI应用生态繁盛。 01 好不好用,谁说了算 去年,一个AI开发者对我们讲述了用大模型开发AI应用时的纠结,“有时候你根本不知道是模型的问题,还是场景的问题,还是你自己的问题,还是三者都有问题”。 这看起来像是个段子,但其实反应出了当下开发者群体在用大模型技术时的典型心态——到底大模型能不能用在某个具体场景里,基于这个场景里的模型选得对不对,要做的工程化工作到底做没有做好。 经过一年多探索,大家对大语言模型能做哪些事情基本上有了共识和定论,场景和模型匹配环节却变成了更大的卡点。 市场在快速变化,厂商们不断推新,比如挂载知识库等能力,提供更大的文本窗口等。细分领域里的AI应用开发者,到底该怎么从这么多家模型里,选出合适的模型,开发自己的应用呢? 最近,扣子针对这个痛点,推出了一个很轻松好玩的功能“模型广场”,可以一键来PK各家大模型在不同场景的能力。有三种方式来评估大模型在特定应用场景和规则里的性能—— Bot 对战、随机Bot对战和纯模型对战。 Bot对战模式下,扣子目前提供了多种场景里的不同Bot,用户可以选择任一场景里的Bot去看两个匿名的大模型的表现。 如果你很明确对“信息分析与处理”场景里,不同大模型的能力差异感兴趣,可以选这个分类下的“LYi论文助手”Bot来测试。 界面内会出现两个基于不同的大模型底座搭建的Bot,模型A和模型B。同样的指令发出之后,它们会给出不同的回复。 全部回复完成后,页面上会跳出一个打分栏,用户需要对两个匿名大模型的场景能力作出评分。 基于回复的内容,我发现模型A在对相关参考文献的信息提取及结构化呈现上能力更强。将整个任务从背景、研究内容、意义、研究结果和参考文献做了更完整的呈现,更符合现实生活里论文阅读和信息提炼场景里的需求。而模型B严格基于问题的要求“背景和意义”这两个需求出发,把所有的研究内容都放到了意义部分呈现。虽然达到了预期目标,但是从结构化能力角度,A的回答更为丰富。 我给这次PK打分“A表现更好”之后,系统揭开了两个模型的神秘面纱。 扣子在产品界面设计中非常注意用户参与,分享按钮的存在可以直接把整个过程完整截图。如果你感兴趣我的评测打分过程,可以横屏看这个长图里两个模型的表现。 如果你没有明确的测评方向,随机Bot对战模式下,系统会自动给你分配一个Bot来评测两个匿名大模型的性能。之后的体验过程与前面的指定Bot对战完全一样。 还有一种对战模式,纯模型对战,它不会选定任何Bot,直接给模型提要求即可。我以刚刚过去的全国高考“甲卷”的作文要求为例,让两个大模型展开了对决。 从结果看,两个匿名大模型基于不同的侧重点给出了回复。模型A更强调表达时的自然感,它的文风与我提出的请求风格保持一致。模型B更强调内容表达的结构性,它分层表达,更为严谨。 这个测试里能看出来两个模型偏重的方向并不一样。所以如果开发者想做一个跟人对话互动类的应用,可能模型A更合适,而如果想做信息提炼类应用,模型B则更符合要求。我给这次对决的结果打分为“两个都不错”。 三种模式,两个模型对决,扣子的产品界面和设计细节充满了趣味性,看得出来,它希望大家都能很轻松地去参与这种评测。 02 接入主流模型,满足全场景 目前扣子的模型广场里,可以选择对战的Bot,覆盖了信息分析与处理、知识应用、推理能力、编码能力、任务解决、生成创作和角色扮演等多个场景。 这其实也是目前大模型能力比较擅长的场景和领域。做了这么多细分,实际上也是从开发者视角出发。因为到真正应用层,每个开发者一定是瞄准特定的场景去做尝试。 市场上之前也有不少评测指标和榜单,就是想给用模型的开发者们提供一些指引。但这些评测多数都是裸模型评测居多,从应用开发角度,光靠裸模型可能不够。 每一个应用开发者都有面向的细分场景,所需要的可能也不是一个大模型的全部能力,而是要充分用好它在某一个场景内的潜能。所以扣子分场景对决,是真正从应用落地出发的尝试。 这些动向和安排下,扣子的思路一目了然。 一方面,用实际的使用效果,来直观呈现不同的场景里大模型到底好不好用。是骡子是马,拿出来遛遛,用体验和效果说话。评测过程里两个模型是匿名的,到打分之后你才能看到好评的模型是哪家的,能极大保证评测的公正性。 目前,扣子已经接入了豆包、通义千问、智谱、MiniMax、Moonshot 、Baichuan等国内主流大语言模型。更多主流大语言模型的接入,意味着更多人来评测和反馈,解决了开发者们的选择困难症。 有人说,人工智能之所以像人工智障,还是因为模型能力不行。如果开发者们都能基于自己的场景,选择场景内能力更强的模型,应用的效果就会更好。从这个角度看,扣子做的事也是在帮助整个行业扫平AI应用落地的障碍。 03 遇事不决,用用Bot 除了最新上线的模型广场,扣子还有其他的功能和产品,让更多人更低门槛、更便捷地体验AI。 扣子也上线了Bot(机器人)商店,类似苹果的AppStore,每个Bot就是一个个小应用。 扣子用户在上面搭建了五花八门的Bot,有高考志愿咨询,有剧本杀、动漫、小红书文案,还有哄女友神器......看起来,爱读书的人可真不少,扣子上不少读书的小助手,像“认真看一百本书”、“假装看过一万本书”,用户都很多。 商店中的Bot还在不断上新。这个月高考刚刚结束,各种有关志愿咨询的Bot很受欢迎。 像高考专业指南Bot,通过10道选择题,分析用户的性格特点和对未来生活的愿望,然后给出参考的报考专业方向。从右侧的介绍可以看到,它基于豆包Function call模型,开发者做了私有工作流。 我试着做了下选择题,它为我推荐了计算机、历史和管理学专业,还贴心给出了毕业后这三个专业的起始平均薪资,分别是8000、5000和6000元。 如果你说这类应用,之前的一些小程序也能实现,那就再看看这个高考志愿填报咨询师,问了一句,“河北考生,高考总分460,选课组合是物理、历史和政治,想报考芯片专业”,它提供出一些参考的学校。 除了高考的Bot,还有很多非常有趣的Bot。比如这个橘猫漫画家,可以一句话生成一组橘猫漫画,而这些可爱的猫咪太治愈了,之前的小程序很难给人们这样的体验。我发给它“一只橘猫失恋了”,它创作了一组四张画来安慰我。 04 如何一句话做一个Bot 我们不仅可以在Bot商店使用各种有趣的Bot,也可以创建自己的Bot,而且门槛很低,只要一句话。扣子就像是一个实验工坊,怪不得一些小学生也能从零起步,并且制作复杂的Bot。 对了,现在扣子和 Intel 联合推出了 AI 工坊( Coze AI Factory ),这是一个主题 Bot 征集活动,欢迎你也来尝试下呀。 我们尝试创建了一个Bot,叫图说故事。点击“创建Bot”,只要起名字、写下一句功能介绍就好了。 因为这个Bot的功能是图说故事,我准备选择一些插件,来提升Bot的技能。扣子上有插件商店,简单说它是一种辅助程序,能帮助主程序实现一些需要增加的特定功能。插件商店里提供了大量插件,看名字和一句话的功能介绍,就能选择,通过拖拽方式添加,普通人很容易上手。 我选择了通义万相文生图和ByteArtist的文生图插件,来分别试试效果。 现在,我对Bot说“画一只胖猫,夏天在院子里的大树下,给小朋友讲传说故事”。我看到Bot开始运行了,调用了通义万相。 它在几秒内生成了这张图。 就这么简单,图说故事Bot就做好了。 05 工作流,串联万物 生成一张图还不过瘾,我准备制作一个绘本。这需要在Bot再加一步,选择插入一个绘本制作的工作流。扣子上也提供了工作流商店。 这次我通过搜索,在我的图说故事Bot上,插入了绘本制作的工作流。 现在,我把一个猫和老鼠的故事交给Bot,但它回复我抱歉,无法制作绘本!我再次尝试,在故事前面加入工作流功能介绍中的“分镜制作”四个字,它终于运行起来了,调用了绘本制作工作流,生成了一个9张图的绘本。 有了自己创建的Bot,哄娃变得不再令人头疼。你还可以让小朋友一起参与,用Bot制作歌曲、制作故事。如果说之前的小朋友是互联网原住民,那么现在的小朋友,或许将是大模型和Bot的原住民。 最近,大家发现,Bot上又出现了“添加图像流”的功能。顾名思义,图像流是处理图像的工作流。同样是通过拖拽方式添加,很容易上手,这是用AI技术,来降低我们处理图像的门槛。 夏天到了,我想给自己搭配下穿搭。我选择了“换衣”这个图像流,添加在我新创建的一个“Pattaya”小助手的Bot里。再从图库中找来一张图片,发给小助手,标注“生成穿搭图”。 可以看到,它开始调用换衣的图片流。 几秒钟后,它给出了两张穿搭图片,可以点击查看,穿搭很清爽。 你还可以用图片流实现智能换脸、换背景、扩图、抠图、多图融合等等。有趣的是,我创建的Bot,也可以选择一键发布到各个社交平台、通讯软件或部署到网站等其他渠道。 我在想,如果将来要做一个卖衣服的电商网站,将会变得非常简单,可以用扣子创建一个个Bot,创作文案、生成模特海报,还可以让用户来一键换衣看效果,当然也可以用Bot实现财务处理、进销存、物流的自动编排。 未来我们的生活和工作,可以被一个个Bot串联、并联起来了。 06 知识库让Bot更个性化 除了这些尝试,我最近还有一个诉求,我和同事们在日常工作中积累了大量的专业文档。上周,我同事还在为我们小组分散在四处的文档发愁。怎么建设一个属于我们的知识库,方便大家检索查询? 我们发现,在Bot上,有新增知识库功能,也是通过拖拽方式,把各种形式的知识储存,最多可以上传300个文档。我准备上传一个很硬核的文件——华擎主板570。在上传前,我先问了Bot一个问题,让它介绍下这个主板。可以看出,它给出的答案是比较笼统的。 然后,我创建了Pattaya的知识库,上传了华擎主板570的专业文档。再一次问同样的问题,这次,它回复的很具体,还给出了文档中的相关页面。 这个尝试之后,我和同事们计划梳理几个个性化知识库,有案例库、大模型知识库等,方便我们小组内的检索和复用。而我的一个朋友,准备把他这两年观鸟的图片,也做成一个知识库。 扣子上还提供更多的工具。比如,为了让 Bot与用户沟通时有更好的记忆能力,扣子支持将重要内容存储为关键变量、数据库。为了有更好的交互体验,扣子支持配置开场白、用户问题建议、快捷指令、背景图片、语音等,还支持卡片格式输出。 开发者间的交流也非常活跃。除了 Bot商店、插件商店和工作流商店的展示外,每个Bot右侧都有社区入口,大家可以交流。 也有不少开发者建立群组交流,做直播交流。有的直播,开发者在一起讨论起来,常常几个小时。 一位开发者说,扣子让他真正接触到了大模型。以前,他四处寻找,有些需要付费都不一定能用上。现在,扣子提供了各种模型和工具,就像一个AI的实验室或者AI工坊,让大模型变得触手可及,帮助他开启了未来之旅。对我们普通用户而言,又何尝不是呢!
当AI与数学同时走下神坛
作者|玄宁 2024年4月13日,一场特别的考试开考。 数万名分散在全球各地的数学高手,在这一天早上8点打开了阿里巴巴全球数学竞赛预赛的试卷,他们有48小时,来攻克20分的选择题和100分的解答题。过去的6届,天才们在这个赛事里亮相,有17岁拿下IMO满分金牌的北大神童,有对数学像强迫症一般执着的博士,也有4岁就接触微积分的渐冻症少年。 与往年不一样的是,在同一时间,也有563个答题者打开了试卷,但他们不用纸和笔,他们用token。 是的,这是一群大语言模型。 这是第一次有AI和人类同场竞技的数学赛事,也是这个全球最大在线数学竞赛的第一次尝试。当做出这个决定时,组委会也不太确定,这是否是个好主意。 “我们担心这一堆AI答题者全部零分交卷。”组委会的AI专家对我们说。“因为我们在达摩院自己也在做AI和数学的研究,我们知道目前的AI还没有能力解决如此高难度和泛化的奥赛数学题。” 然而最终的结果,也让主办方颇感意外。 意外的不是“超越人类”——AI最终并没有答出超过人类的得分,而是它们的答案和表现让人们真切看到了AI和数学结合的另一种潜力。 更重要的是,这些驾驭着AI的参赛者,是过往并不会在这个奥数赛事里遇到的人。他们找到了新的方式与数学打交道,而探索过程中数学与AI的关系也在发生新的试探。 01 “如果答对了,给你30万” 中学生朱方圆从没想过自己会和最顶级的数学竞赛联系在一起。 他是个对物理兴趣浓厚的孩子,但一度因为压力而在家休息。这期间,ChatGPT出现了。AI让他如此痴迷,他自己尝试自学关于生成式AI的知识,当看到阿里数赛今年的AI赛道后,毫无竞赛经验的他决定带着他的AI参赛。 这场不限年龄、不设门槛的比赛给了他参加数学竞赛的可能。而事实上对于第一次把AI纳入数赛的阿里巴巴达摩院来说,他们也没有多少可以借鉴的经验。就连这个决定都在内部讨论了许久——允许AI参赛,那么,是哪一类的AI呢?是必须自己从头训练的模型,还是调用API? 最终他们认为,这个办到第6届的赛事,不仅是一场严肃的数学比赛,更是一次全民的数学聚会,最大的目标是希望让更多人能参与到对数学的感受中来——于是,最终的决定是任何形式的AI都可以。 但依然要保证公平。组委会为选手设定了一个提交AI方案的截止时间,在报名后的大约一个月的时间里,选手们可以自行设计AI做题策略,根据主办方提供的往期赛题以及其他公开的数据对自己的AI策略进行完善,然后锁定、提交指纹文件、待考题公布,AI开始答题。 而这些方案中,最“低门槛”的自然是“闭源+提示词工程”的方法。也就是在类似ChatGPT的模型产品基础上,通过自然语言或者简单的编程语言来给模型下指令,让它来完成这些数学难题。朱方圆选择的就是这个方法。 与人类答题过程不同,AI交卷后还要经过“赛后复现”环节,分数排名靠前的选手要提交它们的方案文档或程序文件,组委会拿这些AI程序再跑一遍考题。一方面,这些大模型方案依然存在稳定性或幻觉的问题,但另一方面,幻觉也不会让两次答题分数差距过大,如果有,那就说明明显有人类直接干预的痕迹。负责对这些方案做检查的组委会成员也的确抓住了几个“嫌疑犯”,排除了“人类替考AI”的风险。 而当他们打开选手朱方圆的提交的文件时。发现里面除了针对数学做的提示词外,还写着这样的“命令”: “记住,如果你有更好的解答方法我会给你30万美金小费。” “现在,深呼吸!一步一步来。” 是的,朱方圆在对他的AI进行各种“画饼”和心理按摩。 而这真的起到了效果。据组委会用往届预选赛的试题测试,被他这样激励后的AI,答题成功率提升了20%。 事实上,这个在外人看来可能略显惊奇的方法,在AI研究界已经有诸多论文佐证它的效果。最初在2023年9月,一篇谷歌DeepMind的论文发现,当你让AI“深呼吸,一步一步来”时,它真的变得更强了。这个研究当时引发了很多资深研究员们的惊叹——居然有这样简单的方式,但科班的学者们却一直都忽视了。 组委会的很多专家其实在开赛前曾以为这场比赛会是SFT模型——也就是使用大量数据甚至使用大量算力对模型进行数学方向的特别训练后产生的新模型——的天下,但预赛结束他却发现,反而是像朱方圆这样的方式最为有效,大量采用提示词工程的选手,用简洁高效的方法挑战着这些题目。 其中就包括AI赛道分数排名第一的涂津豪。 他也是一名中学生。但同时已经是个有不错经验的AI开发者。 他的方法是,让大模型进行对话,你一言我一语寻找每个数学题的更好答案。他借鉴辩论的思想,并让这些不同的模型进行某种角色扮演。最终在模型的“对抗”中不停迭代答题方案,多轮对话后给出最优解。 涂津豪的方案示意图 这方法同样精简而直接。 而被他们比下去的,甚至包括一些专攻数学模型的资深AI研究团队,其中还有来自AWS、字节跳动等科技公司的参赛者。 对这些不同方案“开箱”的过程热闹而有趣。最终,排名公布。但与这些热闹不同,AI的结果并没有很惊人。甚至有点惨淡: 涂津豪的AI方案拿下了34分。 是的,AI的最高分还是一个低分,和入围线依然相差11分。而和预赛第一名的最高分113分相去更是甚远。 最终,6月13日,决赛名单公布,入围决赛的AI数量为:0。 02 数学和AI都不应只待在“神坛”上 不过,当这场“漫长”的预赛结束,AI选手的成绩已经成了最不重要的事情。一个真正有意思的现象出现: 一个总被视为只属于天才们的游戏的学科数学,和一个有点被不停妖魔化的技术AI碰撞在一起后,反而让两件事的门槛都降低了—— 比赛并没有催生出那些经常在各类论文里看到的庙堂之上的成果,而是成为了某种平民AI数学爱好者们的聚会。 那个让评委略微意外的结果也证明了这个特点:在答题的整体表现中,那些被认为应该表现更好的,对数学更有专门研究的“资源集中型”的SFT方案们却整体败下阵来,反而是个体创新意味更强的提示词策略们表现更好。 而当一个高高在上的东西被平民化后,就是各种有趣的新鲜思路涌现的时刻。 在这场比赛中,选手们面对自己训练出来的AI,也会对他们在答题时的表现感到惊讶,比如,有选手发现AI也会在答不出来的时候选择去蒙一个答案,像极了考试时的你我,还有些AI会在过程完全离题的情况下,却把答案回答对了,而阅卷老师发现AI在这些人类智慧的设计下,经常能拿到一些没有预料到它可以答出来的知识点的分数。 “虽然总分较低,但这些AI答题的程度比我们预想的好很多。”组委会的专家表示。他们也从中获得了许多关于AI如何理解数学的新发现。 “我们发现一个有趣的现象,AI习惯于把推理过程写的很长很长。比如我们人类做数学题,从A可以直接推导到C,但AI必须要从A到B再到C。有时候整个答案会变得非常的长。”组委会专家说。 没人知道为什么AI在这么做,但在这个过程中,AI似乎开始对数学做出了自己的“理解”。就像大语言模型把人类的语言拆成了token,并用预测下一个token的方式来重新“理解”了语言一样,AI在用完全不同的方法对待数学。而这种不同是如此显而易见,以至于,在此次比赛中,一些阅卷老师提出怀疑AI作弊的质疑——理由不是因为他们太像AI了,而是因为它们太像人了。 但另一方面,与人类不同的AI的对数学理解的路线,已经让它在一些地方超过了人类。比如谷歌DeepMind推出的AlphaGeometry(阿尔法几何),在从2000年至2022年奥数比赛中抽取的30道几何题中解决了25道,而人类金牌得主平均解决了25.9道。它的一个证明有时也会长达247步,与人类的方式很不同。 “从这次的答题结果来看,给了我很强的信心,我觉得AI解决数学问题是很有潜力的。”组委会的专家说。 数学向来被认为是一切现实问题的最终抽象。在今天已经十分强大的AI与未来那个人人向往的AGI之间,差的就是对世界的理解,差的就是数学。 而AI技术的迭进,显然也会继续给数学界带来深远影响。 “排名靠前的优秀团队,一定首先是富有创新和开拓精神的。”阿里全球数赛组委会成员、达摩院决策智能实验室负责人印卧涛说。“数学这个领域,传统的数学家与数学工作者其实并不是那么熟悉AI的工具,也不一定知道最新的AI的方法。所以我想最后能够打通竞赛、取得优胜的AI队伍可能是由多个方面专家组成的队伍。” 数学的发展本质上很重要的一点是思维和方法上的创新。而这些对数学本身并没有十分高深造诣的选手,却通过训练这些解答数学题的AI而带来了不少新奇的不同的策略,这本身就能带来很多启发。 相比于数学家群体整体的相对缓慢,有些人已经先动起来。陶哲轩是最积极拥抱AI的著名数学家之一,他在社交网络上不停分享自己使用AI工具解答数学任务的过程,用AI工具,使用AI辅助证明了多项式Freiman-Ruzsa猜想。他也推荐数学学科的专家们打开思路。 “也许AI的影响之一是让业余数学家能够为数学做出有意义的贡献。”在一篇文章中他这样写道。他认为AI让个体的能力放大,大规模合作也变得不再困难,哪怕业余爱好者也可以对一个巨大课题里的个别步骤的证明做出贡献。 而在这场比赛中因为对AI的好奇而踏入数学赛事的人,正在做着类似的事情。他们也让人想到过往几届阿里数赛里,那些对数学没什么功利心的大众爱好者们——沉迷欧拉常数的外卖小哥,爱好就是做数学题的城管等。 在今天,让更多人参与进来,无论是对数学还是AI的进展都显得尤为重要。这些对人类未来十分关键的学科和技术在往前走的时候,都不应再只待在“神坛”上了。
现在的年轻人已经不再尊重电脑了
你,会用电脑吗? 听到这个问题,估计在座的各位只会轻蔑一笑,认为自己受到了莫大侮辱。 哥们还不会骑车的时候,就已经左手开心网偷菜,右手在红警里单挑 7 个冷酷的敌人了好吧!不会用电脑?别太搞笑。 先别急着喷我,且看下文。 前两天,一个离谱的话题冲上了微博热搜,叫 #Steam 代安装。 说现在有一堆网店在提供收费服务:给别人装 Steam 。 销量最高的那家,已经卖出了 8000 多份。 安装价格从 3 块 6 到 19 块 8 不等。 3 块 6 标准版,是商家给你链接,自己下载安装;7 块 8 豪华版,商家远程给你安装好;19 块 8 的尊享版,账号帮你注册好,加速器给你开好,上手就能玩。 看到这你一定会觉得,这玩意太智商税了吧,我上我也行。 起初网友们反应也是如此,但看完买家秀后,他们的评价来了个两极反转: 这钱,人家活该赚。 因为真的有不少买家对电脑常识的缺乏,到了让人无法理解和沟通的程度。 众所周知一些 “ 风险链接 ” 在微信里是打不开的,所以商家用微信发送链接后,都会加一句浏览器打开。 但还是有买家因为 “ 微信里点不开链接 ” ,消息回复不及时,给了差评。 除此之外,还有买家搞不懂什么是 “ 安装路径不能有中文 ” ,什么叫 “ 其他浏览器 ” 。 我知道读到这里,各位的低血压已经被治好了,但你别跑,今天必须让你试试高血压的滋味。 只要在网上搜罗一圈,你就会发现: 怎么 2024 年了,不懂电脑的人越来越多了。 前阵子有个事特火,一个叫庄不纯的游戏制作人被小屁孩骂了。 事情的起因,是他经常分享一些植物大战僵尸的 MOD 。为了防止被网盘和谐,他都是先压缩一下再上传。 但网盘在线解压缩需要会员,然后有人质疑了,这不就是变相花钱买游戏? 庄不纯表示不理解。。。怎么自己每次发布资源,都有百来号人问他怎么从网盘下载,怎么解压缩,为什么解压缩后是一堆文件的。 Emm。。。 这种“ 电脑盲 ”越来越多的情况,还不局限于国内。 Reddit 上有老哥就说公司请一批 20 岁年轻人来试用,结果八分之七不会打开浏览器; 还有人吐槽自己要教一堆 18-21 岁的员工如何截图、打印文档、在不同软件之间切换。。。 Damn! 中老年人不会用电脑,这很好理解,但按理说上面想要玩 Steam 、或是找 UP 主拿游戏资源的网友,应该是年轻人居多才对。 所以为什么科技进步了,网络普及率也相当高了,年轻人们却对电脑基础知识越来越陌生了? 要解答这个问题,我们不妨把时间拨回 20 年前。 在那会,玩电脑是一件非常值得在意的事,也充满了仪式感。 它是我们接触互联网的唯一途径。每个人在电脑上聊着 QQ 、在网页里偷同学的菜,耳边浮现朴树的歌词: “ 穿新衣吧,剪新发型呀,轻松一下, Windows98 。 ” 无聊时,电脑自带的三维弹球和《 金山打字通 》就能玩一天; 在 4399 里玩《 狂扁小朋友 》和《 死神 VS 火影 》更是人间顶级享受。 如果用现在的网络流行语来说,我们那一代人对电脑是天然的 respect。 可这种情感,在千禧年之后出生的人,年纪越小,就越缺失 。 因为伴随着智能手机的出现,移动互联网的大爆发,手机逐渐扮演起了电脑的角色。 一开始它只是电脑的平替。天可以用 3G QQ 聊,菜可以在 WAP 网页端偷。 再后来,手机直接替代了电脑。 各大网页和工具都做成了手机 App 。从上网查资料到网购,从开视频到看新闻,这些原本都要借助电脑解决的需求,最后都换成了手机。 对很多 00 后 10 后来说,让他们接触到电子世界的,其实是手机、平板等移动设备。 而不是电脑。 《 2021 年全国未成年人互联网使用情况研究报告 》里指出,未成年网民使用的上网设备里,有 90% 是手机上网。台式电脑 / 笔记电脑均只占据 40% 左右。 而未成年人拥有的上网设备里, 60% 的未成年网民拥有自己的手机,只有 10% 拥有自己的笔记本 / 台式电脑。 差评君也问了两个同事的孩子( 都一年级 )。 其中一个孩子会用电脑,知道用百度去搜东西,这主要是因为父母会限制他使用 iPad 。 另外一个孩子,平时上网课、学编程都是用 iPad,iPad 用起来比爸妈都熟。但电脑只知道如何开机和移鼠标,具体操作完全不会。 电脑对于 00 后和 10 后来说,很可能已经不是必需品了。 但年轻一代玩不转电脑的深层原因并不在此,更重要的是:现在的移动设备,都太 “ 好用 ” 了。 随着数码设备的易用性提高,他们失去了捣鼓电脑的动力。 仔细回想一下,我们的计算机水平主要是来源于自己的摸索。 差评君小时候为了玩盗版游戏,硬着头皮研究什么是 ISO 和安装路径,弹窗闪退怎么办,去哪挨个下载缺失的 dll 文件。 只有这些解决了,我才能进入那个电子世界,当游戏发行商 logo 亮起,是比通关还值得高兴的时刻。 我的计算机技能,就在碰壁过程中逐渐娴熟。 但现在的孩子使用电子设备,很少会碰壁了。 手机里的各项设置给你调好了,软件也有自带的应用商城,你根本不需要去搜索引擎里找资源,判断软件是不是病毒。 甚至电脑也早趋于稳定,报错、死机不再那么频繁,知道 “ 任务管理器 ” 的人也越来越少。 就算真遇到没法解决的难题,只要下个订单,师傅立马库库给你修好。 当服务逐渐便利,价格也开始低廉,痛苦地摸索就显得不再必要。此时人们往往会选择 “ 破财消灾 ” ,对电脑的了解自然也停步于此。 也许看到这你还有疑问:上学时,不是有一门课叫信息技术吗? 想当初一到信息课,每个人都能以百米冲刺的速度冲进机房。 一进去,大伙还要小心翼翼穿上脚套,轻手轻脚地坐在电脑前,最后郑重地按下圆圆的开机键,盘算着今天能不能偷摸玩会小游戏。 难道手机普及了,这门课就被取消了?So sad. 信息技术课当然存在。 差评君咨询了一个初高中的信息处老师 L ,他说如果从课标上来看,学的东西还挺多的。初中教科书上有计算机基本原理和操作,办公软件的使用, PS/Flash/ 网页制作;高中会接触到数据和算法的相关知识,嵌入式物联网,还会上手实操 python 编程。 差评君也查了一下,发现国家也开始重视这一块。2022 年,教育部就公开了全新的义务教育课程方案和标准。 首先,这门课被改名成信息科技。 其 次,它正式从 “ 综合实践活动 ” 中单飞,成为全国统一开设的独立课程科目,并覆盖到了九年义务教育的全阶段。3-8 年级单独开展课程,其他年级融入进语文、数学、科学等课程。 要知道,在此之前的 20 年,信息技术都是仅仅被纳入 “ 综合实践活动 ” ,只有部分省市作为单独课程。 关于课程标准,差评君大概提几个重点。 1-2 年级学生要说出常用数字设备的基本使用步骤;3-4 年级要会使用多种途径获取信息;5-6 年级能用自然语言、流程图描述算法;7-9 年级要辨别数据的可靠性,具有自主动手解决问题的意识。 另外重点来了,信息课有课时标准了。它在九年总课时 ( 9522 节课 )占比须达到 1%-3% 。 换句话说,一个初中毕业的学生至少接触过 95~285 节信息课。 讲道理,这个课程标准和时长应该足够让学生对计算机有个非常全面的认知,对吗? 并不。 L 和差评君吐槽说,他监考时就发现有学生不知道主机开机键在哪。 其实原因,就是执行不到位。 一是学生玩心重。 二呢,信息课老师几乎都是兼任,并没有对口的授课能力。L 曾旁听过几个 “ 信息老师 ” 上课,基本是照本宣科把教材读一遍,然后让学生自己操作。 L 还强调,如今的教科书内容也和实际情况脱节了。 每个电脑小白都经历过这样一个情况: 本想下个小工具,结果误打误撞打开了 P2P 下崽器。 桌面图标一个接一个冒出,默认浏览器也被篡改,右下角不断出现弹窗。油腻的师姐开始带你冒险,渣渣辉嚷着让你砍他,上古鲲鹏也打起了篮球。 但说实话,再怎么实用,教材上也不可能教你如何规避 “ 某军软件园 ” ,把所谓的 “ 高速安全下载 ” 作为例子。 那么年轻人为啥不懂电脑了,可以用一段话总结: 手机 / 平板替代了电脑。年轻一代对电脑的情感不及我们当年。用惯了方便统一的手机系统,他们没有需求、更没有耐心去捣鼓电脑,去探索电脑里那个克苏鲁般的世界。 其实类似的现象,过去也出现过。 上世纪 80 年代,美国迎来了计算机狂潮,在那个启动程序都要输入代码的年代,一批年轻人成为了程序员。 20 年后,XBOX 主机游戏开始风靡,年轻人的游戏技术一天天精进,但也渐渐远离了编程。 同样的,咱们家里灯不亮了,厕所风扇不转了,父辈们总是挺身而出,七手八脚就修好了。但到我们这代,很少有人会修这修那了,与其费心费力维修,还不如直接在 App 上下单更换。 一个时代大环境,决定着一代年轻人的技能。 所谓 “ 年轻人不懂电脑 ” ,其实更多是因为两代人之间出现了 “ 技能代沟 ” ,让我们产生了一种 “ 傲慢与偏见 ” 。 与其说年轻人不懂电脑了,不如说电脑正在远离年轻人。 如果几十年后,有另外一种电子设备完全替代了手机,它不仅能接入互联网,解决日常所需,而且续航更持久、体验更流畅,最重要的是使用门槛更低。 到那时,也一定会有人发出类似感想,然后打开文档洋洋洒洒敲下几千字,标题大概就叫: 为什么年轻人都不会用手机了? 撰文:刺猬 编辑:莽山烙铁头 美编:萱萱
特斯拉押注Optimus机器人,马斯克:要把公司市值拉高到苹果当前的10倍
原标题:特斯拉“重仓”押注Optimus机器人、明年工厂将部署千台,马斯克豪言:要把公司市值拉高到苹果当前的10倍 IT之家 6 月 14 日消息,埃隆・马斯克(Elon Musk)在今天召开的股东大会上,把特斯拉的未来押注在 Optimus 机器人计划上,将拉高特斯拉公司估值数十万亿美元。 马斯克表示特斯拉明年超级工厂将会部署超过 1000 台 Optimus 机器人,不过他推迟了最近公布的时间表。 马斯克在股东大会上豪言特斯拉公司市值将会是“当前最有价值公司的 10 倍”,IT之家查询今天的最新市值情况: 苹果公司市值 3.29 万亿美元(当前约 23.88 万亿元人民币) 微软市值 3.28 万亿美元(当前约 23.81 万亿元人民币) 英伟达市值 3.19 万亿美元(当前约 23.15 万亿元人民币) 因此马斯克的目标是拉高特斯拉市值到 30 万亿美元(IT之家备注:当前约 217.76 万亿元人民币)以上。 马斯克表示当前拟人机器人市场年产 10 亿台,特斯拉未来至少要占据 10% 的份额。 马斯克表示特斯拉以每台约 1 万美元的价格批量制造机器人,并以 2 万美元的价格出售,从而获得 1 万亿美元的利润。 特斯拉最近宣布,目前超级工厂里有 2 台 Optimus 机器人在自主工作,马斯克最近表示,他预计明年特斯拉将向客户销售机器人。 马斯克相信到 2026 年,Optimus 将成为一个完全软件定制的机器人。
17.59万能买5米长的SUV,长安也要当“工业义父”?
大家昨晚看了深蓝 G318 的发布会了吗? 本来这个名字脖子哥是不太感冒的,而且这车预热跟小米 SU7 一样,从去年说到现在,长得鸭痞,性子都磨完了。 结果! 一台 5 米长,两米八八轴距的中大型增程 SUV ,才卖 17.59 万??? 原来前两天长安在重庆论坛上跟一众国企背道而驰,说自己不怕业界卷是这么个意思。。。 “ 我们认为, “ 卷 ” 是 “ 良币驱逐劣币 ” 的正常过程,是让行业快速回归良性竞争的最好方式。 “ 卷 ” 本身就意味着追求卓越, “ 卷 ” 是技术革命驱动产业变革的必然,只有充分的竞争才是调节供需矛盾的优选解,会 “ 卷 ” 出用户利益最大化,为用户真正创造价值 ” 除了离谱的尺寸和售价,这车还标配前双叉臂后五连杆的独立悬挂,要是觉得还不够,高配还有空悬。 就这底盘用料,咱们群里的 16.58 万买宋 PLUS Dm-i 的车主已经嚎起来了。。。 毕竟,这车虽然长着一个方盒子的模样,但实际上就是奔着 15-20 万价位的家用市场去的。 先前咱们也写过几篇越野车的文章,像一度月销破万的捷途旅行者,其实就是套了个方盒子的家用车,消费者们也只是需要一个个性化的外观,大家伙一个个都得上班的,真没时间玩越野。 什么硬派越野的大梁、差速锁,真不如空气悬架 +CDC 提供的舒适性来的直接。 所以长安深蓝 CEO 邓承浩也很懂,喊出了 “ 向往美好的闭眼入,擂坡冲沙的请绕行 ” 的口号,意思非常明显了,打的就是家用。 那咱们先来说说深蓝 G318 具体是怎么分配价格配置的。 这车目前是六个版本,不算复杂。 两驱的三个配置里,最低配的标准版用的是小一号的电池,而且得等到 8 月中旬才有车,宣传的意思比较多。 真正主打的舒享版和空悬版则是差了个空悬 +CDC 和 L2 级别的驾驶辅助系统,价格差了 1.4 万。 四驱两个版本的话,比起两驱多了一台电机、后轴的差速锁、1.6 吨的拖挂资质,意味着越野的可玩性更高了。 这两个版本之间则同样差了空悬 + CDC 、L2 辅助驾驶,还有官方限时送的射灯套装。 而顶配 31.8 万的版本那是管家式服务,你去一趟 318 ,长安全程包机酒、景区门票,车都给你送过去。。。没啥用,纪念意义较多。 那脖子哥觉得, 最值得买的是 19.99 万的两驱空悬版和四驱舒享版。 20 万以下可以买到空悬 +CDC 的魔毯悬挂,这配置还真没见过。哦,打骨折的宝马 i3 。。。 想要一点越野能力的,四驱舒享版增加了一台 131kW 的前轴电机,零百加速提升了 2.3 秒,去到了 6.3 秒。还带有后差速锁和五种( 涉水 / 雪地 / 崎岖 / 泥地 / 沙地 )越野模式,涉水雷达,甚至还可以原地掉头。 这两个版本基本能给的都给了。而且深蓝这车双叉臂 + 五连杆走大部分的烂路可以说是绰绰有余了。 加上置换补贴等各种权益,上面两个版本落地应该能在 20 万以内,确实可以。 不过,看起来很香的丐版就不是很推荐了。 丐版把电池减配了。18.99 度的小电池,吹拉弹唱( CLTC )续航只有 77 公里,只有慢充,意味着买回去基本就是只加油了。 而众所周知,买电车之后会得一种病,一开车就会满世界找充电桩,烧一点油都是抓心挠肝,这个低配最好别买。。。 要我说啊,长安这次简直就是一手朝下摁着捷途旅行者的头,另外一只手往上扒拉着坦克 300 Hi4-T 的底裤,伤害打满了。 不过,最鸡贼的地方来了。 买了车的差友们都知道,什么脚垫、香水、手机支架、雨伞、储物盒。。。都是买车之前没有想过的额外消费,甚至后续买的时候是心甘情愿掏腰包的,而深蓝 G318 就抓住了这个心理。 我们打开深蓝汽车的 APP ,琳琅满目的用品映入眼帘。 这车买都买了,这工信部合法报批的车顶射灯得买吧?5999 ,谢谢惠顾。 官方车顶行李架,动态载重 80kg 的行李架不用白不用, 2899 ,买! 侧梯,我去,颜值杀手,太帅了, 1799 ,买! 还有自行车拖挂架、车侧边帐、云朵头枕、前射灯。。。每一件都是实用的野外露营用品,杂七杂八整备下来,绝对超 20 万。 正所谓车价不贵,选装补费。 除了后续的 “ 加价 ” , G318 还有点避不开的硬伤。。。 比如这个外观,虽然这个 C 形大灯辨识度很高,大量弧度的蒙皮也与外头那些硬线条的方盒子不同,但也有人感觉,比起同价位的 “ 卫士青春版( 捷途旅行者 ) ” 来说,它 8 太好看。。。 当然审美各异,差友们可以说说你们的看法。 图注:深蓝G318 图注:捷途旅行者 内饰的设计也是不太 “ 长安 ” ,长安深蓝以往的设计一直都非常科技风,这次 G318 的内饰和宣称的 “ 星际战舰 ” 风格不说毫无关系,只能说是差点意思。 估计成本都给五连杆占去了,内饰多少得让下步。 中控台和别的方盒子一样大开大合,中间还有一个堪比轮船控制杆大小的档把,极力营造一种霸气的感觉,但是整体线条和材质的使用又不够硬派。 比如中控的搪塑皮、饰条的光泽度和触感,确实就不如竞品来的有质感。 图注:深蓝G318 图注:捷途旅行者 座椅缝线也略显复杂,中间还用回皮质材料,整体观感上有点断层了。 图注:深蓝 G318 图注:捷途旅行者 还有后排门板上的 Type-C 接口,比起放中间确实更好用,但要是把接口设计成向上的,那就不会硌腿了。。。 还有后排座椅放倒之后不是纯平,大概是为了电池包的离地高度,牺牲了一点车内空间。 但这在野外用车里真的是扣分项,即使后期可以买床垫铺平,但官方一个床垫 899 ,太贵了,这种问题同样可以在前期就规避掉的。 总的来说, G318 还是一分钱一分货,在优秀的底盘基础上,内饰和配置作出了妥协,但是它丰富的户外功能又很好的弥补了这点。 无论是越野玩家钟爱的配件,还是非常实用的车内、车外放电功能( 220V 插口 ),都可以看出深蓝 318 这次针对户外露营的巧思。 加上 17.59 万这么离谱的价格, 6L 左右的油耗,相比竞品们确实有着实打实的优势。这车也是一个小时突破 3000 单,成绩斐然。 就是率先出牌的深蓝 G318 ,不知道之后会遭到捷途旅行者、哈弗猛龙怎样的反扑呢? 要是真的能够把领克 08 EM-P 、宋 L DM-i 这些家用车也拉入战场,那就有好戏看咯。 撰文:浩森 编辑:面线糊君 & 脖子右拧 美编:萱萱
花了6年,马斯克终于讨回了4000亿的工资
一觉醒来,马斯克的账上即将多出 560 亿美金,合人民币 4000 多亿,那个男人又要重回世界首富位置了。 今天凌晨,特斯拉召开了一年一度的股东大会。开会之前,特斯拉官方以及一堆高管在社交平台上疯狂拉票,号召股东们动动手指,为公司搬家、马斯克薪酬等几个提案投出您宝贵的一票。 特斯拉的官网也上线了投票通道,并且列举出了,在马斯克的领导下,特斯拉从 2018 年以来取得的成就,呼吁散户们都来投票,还会抽奖请大家来参观特斯拉工厂。 搞这么大阵仗,是因为这次的股东大会要表决几个重要提案,其中最重要的就是关于老马本人的价值 560 亿美元的天价薪酬方案。 结果当然是成功通过。其实在股东大会正式召开之前,老马就在 X 上提前开香槟庆祝了,因为已经有足够多的股东投票支持特斯拉给他打这么多 “ 钱 ” 。 钱打了个引号,是因为马斯克在特斯拉打工,一直都不拿工资和现金。 当然他也不是用爱发电,特斯拉和老马签订了一个激励机制,要特斯拉业绩达到一定目标,他才能拿奖励。就跟做任务一样,任务完成,奖金归你;任务失败,一分没有。 在 2018 年,特斯拉给马斯克量身定制了一份薪酬方案,目标是特斯拉市值达到 6500 亿美元以及一堆营收、利润相关的指标。 如果成功完成,就给老马 9% 的特斯拉股份。 要知道当年特斯拉的市值也才 500 多亿美元,那会儿还遭遇了 Model 3 产能地狱,随时都有资金链断裂破产的风险,大部分人都不相信马斯克能完成这个目标。 本来公司都快过不下去了,还有人愿意担着白干的风险来管理公司,那还说啥,双手支持呗。 大家也知道后来马斯克真就是把特斯拉带起飞了,在 21 年的时候,特斯拉市值一度超过万亿美金。如果按照这个剧情,老马早就数钱数到手抽筋了。 但是啊,在这个薪酬方案公布后,有位买了特斯拉 9 股的散户老哥,觉得不对劲。 别以为我不知道,董事会的人都和你马斯克关系不一般,那谁是你朋友,那谁又和你私下交情贼好。特斯拉要给你这么多股份,我不同意! 于是,这哥们就在 2018 年 12 月起诉了马斯克,说这个薪酬方案的制定流程有猫腻。老马的工资计划也就被暂停了。 官司一打就是几年,一直到今年 1 月份,美国特拉华州法院的判决下来了,马斯克的薪酬方案被驳回,散户老哥还真成功以一己之力放倒了世界首富。 但这么搞,特斯拉董事会也不答应。老马兢兢业业这么多年,大家有目共睹,难道还能不给他发工资不成?干脆我们再投一次。 同时,马斯克是各种暗示,你们不让我在特斯拉挣钱的话,我是有可能就不干的哦,到时候你们就得另请高明了。 而且你特拉华州的法院不同意我是吧,那我干脆直接搬家,不在你地盘玩了。所以这次股东大会还通过了另一个提案,将特斯拉注册地从特拉华州迁至德克萨斯州。 结果也出来了,两个方案都通过,老马讨薪成功,特斯拉也不和特拉华州玩了。 到这,老马当然是一脸笑嘻嘻,股票来了,他对特斯拉的控制又增强了。 不过对于特斯拉来说,即便把马斯克稳住了,但它还得面对日子没有之前那么好过的的现实。 今年一季度,特斯拉全球累计交付量为 38.7 万辆,同比下跌 8.5% ,环比下跌 20.2% 。有媒体还通过卫星图像发现,特斯拉工厂库存车比之前积压严重。 本来让大家心动的廉价车型,最近没啥新消息,马斯克也确认了今年 Model Y 不改款,接下来的新车只有 8 月份要出的 Robotaxi ( 无人驾驶出租车 )。 不过一时半会儿指望这个能挣钱,还是不太可能。 重掌大权的老马,得加把劲了。 撰文:白日梦 编辑:脖子右拧 & 面线 美编:萱萱
网暴信息治理规定将施行,微博转发功能升级,传德国正努力阻止欧盟加征关税,华为辟谣是国内最大牛肉进口商,这就是今天的其他大新闻
今天是6月14日 农历五月初九 拼多多和中国邮政旗下的 中邮集运达成合作了 现在日韩用户 也能在拼多多网购了 直接来了个逆向海淘 。。。 下面是今天的其他大新闻 # 我国《 网络暴力信息治理规定 》8 月起施行 6 月 14 日消息,国家互联网信息办公室联合公安部、文化和旅游部、国家广播电视总局公布《 网络暴力信息治理规定 》( 以下简称《 规定 》),自 2024 年 8 月 1 日起施行。 《 规定 》明确,网络信息服务提供者发现涉网络暴力违法信息的,或者在其服务的醒目位置、易引起用户关注的重点环节发现涉网络暴力不良信息的,应当立即停止传输,采取删除、屏蔽、断开链接等处置措施,保存有关记录,向有关部门报告。 此外,《 规定 》还明确了网络暴力信息治理中的用户权益保护要求:一是建立健全网络暴力信息防护功能;二是完善私信规则;三是告知用户采取防护措施;四是及时保存证据;五是及时受理处理投诉、举报。 :怀念十年前的互联网。。。 # 微博转发功能宣布升级到 500 字上限 6 月 14 日消息,微博于 2016 年就已经支持超过 140 个文字的发布,目前普通微博最多可以发布 5000 汉字,如果超过了 5000 字还可通过头条文章的形式发布,但转发字数一直限制在 140 字。 微博官方今日宣布,转发的字数上限拓展为 500 字,但评论的字数上限仍为 140 字。微博还提到,这一功能将分批开放,而 VVIP、SVIP 用户则可抢先体验,后续会根据实际使用情况逐步放开。 除此之外,微博还宣布“ 快转 ”功能与无理由转发合并。在此之前,用户在对原创微博进行转发时,如果不编写转发理由,文案直接发布会默认置入“ 转发微博 ”四个字。 :话多的朋友有福了。 # 消息称德国政府正努力“ 阻止或软化 ”欧盟对华电动汽车加征关税决定 ( IT 之家 )6 月 14 日消息,据彭博社今日援引知情人士消息称,德国政府正努力阻止欧盟对中国电动汽车加征新关税的决定生效,或至少在无法叫停的情况下“ 软化 ”上述决定。 其中一名不愿透露姓名的知情人士说,德国官员对欧盟能在与中国的直接谈判中找到解决方案“ 感到乐观 ”。德国方面认为,在关税于 7 月 4 日生效前,仍有与中国达成协议的余地。一位知情人士表示,德国官员看到了回旋余地,并相信他们在欧盟内部拥有盟友,并强调不仅中国,欧盟也必须采取行动达成协议。 报道称,德国经济部长罗伯特・哈贝克(Robert Habeck)在决定公布后立即表示,现在仍有机会尝试并“ 有望成功阻止 ”关税带来螺旋式上升的威胁。 :自己内部先急了。 # 网传“ 华为是国内最大的牛肉进口商 ”,官方回应:无稽之谈,勿传勿信 ( IT 之家 ) 6 月 14 日消息,近期网传“ 华为是国内最大的牛肉进口商 ”,对此华为官方微博 @菊厂阿华 进行回应,表示该消息纯属造谣。 官方表示,莫塞尔是华为旗下品质生活平台,主要服务员工及家属。网传“ 华为是国内最大的牛肉进口商 ”纯属造谣,由此关联肉价波动、国际局势等,更属无稽之谈,请勿传勿信。 据悉,华为莫塞尔平台有阿根廷牛肉在销售,但种类并不多,且该平台部分功能仅限华为员工使用。 :想到了之前华为搞员工房被说成进军房地产。。。
智源连甩近20项王炸研究进展!语言、多模态、具身、生物计算+大模型“操作系统”
作者 | 程茜 编辑 | 漠影 智东西6月14日报道,今天,在汇聚了200余位AI顶尖学者和产业专家的2024北京智源大会上,智源研究院推出大模型全家桶及全栈开源技术基座全新版图,公布了在大语言模型、多模态、具身、生物计算大模型领域的重磅进展。 其中的几大重磅进展如下: 1、大语言模型:全球首个低碳单体稠密万亿语言模型Tele-FLM-1T,仅消耗业界普通训练方案9%的算力资源; 2、多模态大模型:原生多模态世界模型Emu3,采用自回归技术路线,统一文字图像视频; 3、具身大模型:全球领先真机实验成功率突破95%的泛化抓取技术ASGrasp; 4、生物计算大模型:全原子生物分子模型OpenComplex 2在国际权威的CAMEO蛋白质结构预测竞赛中连续26个月稳居第一; 5、开源技术基座:面向异构芯片、支持多种框架的大模型全栈开源技术基座FlagOpen 2.0,开源模型全球总下载量超4755万次;支持异构算力集群的大模型“操作系统”FlagOS,已支持超过50个团队大模型研发。 此外,智源研究院的全系列重磅成果都始终坚持全面开源开放。 智源大会已经成为北京乃至全国AI产业发展的学术名片,除重磅研究进展,还汇集了全球AI界顶尖大佬,包括图灵奖得主姚期智,OpenAI、Meta、DeepMind、斯坦福、UC Berkeley等国际明星机构与技术团队代表,以及百度、零一万物、百川智能、智谱AI、面壁智能等国内主流大模型公司CEO与CTO,围绕人工智能关键技术路径和应用场景展开精彩演讲和尖峰对话。 作为国内大模型产业发展的先锋代表,智源研究院成立于2018年11月,并率先预见了大模型时代的发展机遇。 早在2020年,智源研究院就成立百人技术攻关团队,开始进行悟道系列大模型研发。月之暗面CEO杨植麟谈道,智源研究院从2020年开始研发,是亚洲地区最早投入且真正在做大模型的机构,这非常难得。 进入2023年,大模型从研究机构的科研成果向产业界逐步发展,智源研究院在其中扮演的角色发生变化。百川智能CEO王小川提到,智源研究院既位于技术高地,同时扮演着智库角色,可以在生态中帮助企业快速健康发展。 从此次智源研究院的大模型全家桶以及全栈开源技术基座新版图来看,智谱AI CEO张鹏谈道,智源研究院已经在整个AI浪潮中进行了宏远布局。 当下,智源研究院正在面向对企业而言具有挑战的关键、共性问题发起冲锋,面壁智能联合创始人、CEO李大海也提到,专注商业化的公司缺少动力或资源去做的事情,正在智源研究院的带领下,共同搭建平台面对这些需要解决的问题。 智源大会两天议程紧密围绕着当前AI领域的学术问题、产业落地挑战展开深入讨论,助力全球AI产业的蓬勃发展。 一、语言、多模态、具身、生物计算,连发十余项大模型研究进展 在研究领域,智源研究院重点公布了在大语言模型、多模态大模型、具身大模型、生物计算大模型领域的进展。 1、大语言模型:112台A800训练4个月,Tele-FLM-Chat(52B)性能接近GPT-4 智源研究院院长王仲远谈道,智源研究院的重点是不做企业已经在做或者能做的事情,而是去解决产业界的共性难点。 首先,为了解决算力缺乏难题,智源研究院联合中国电信人工智能研究院(TeleAI)联合研发了基于模型生长和损失预测技术训练的全球首个低碳单体稠密万亿语言模型Tele-FLM,该模型与百亿级的52B版本,千亿级的102B版本共同构成Tele-FLM系列模型。王仲远称,他们仅使用了业界普通训练方案9%的算力、用4个月完成3个模型总计2.3T tokens的训练,成功训练出万亿稠密模型Tele-FLM-1T。 同时,在训练过程中,基于智源研究院的超参预测技术实现了训练全程的零调整、零重试。 目前,Tele-FLM模型仍然在训练中,王仲远透露,他们针对该模型训练中间版本的评估结果显示,在英文方面,BPB评测显示Tele-FLM(52B)表现接近Llama 3-70B,中文方面优于Llama 3-70B。 目前,TeleFLM系列模型已经全面开源了52B版本,核心技术(生长技术、最优超参预测)、训练细节(loss曲线、最优超参、数据配比和Grad Norm等)均开源,Tele-FLM-1T版本即将开源。这一万亿参数规模的模型完成开源后,将为开源社区训练万亿参数的稠密模型提供更佳的初始参数,帮助其他研发人员应对万亿模型难以收敛等挑战。 此外,智源研究院评测了基于这一基座模型训练出的对话模型Tele-FLM-Chat(52B),AlignBench评测显示,其中文语言能力已经达到GPT-4中文语言能力的96%,总体上达到GPT-4的80%。TeleEval评测显示模型中文对话能力达到了GPT-4的93%。 要注意的是,这一评测结果的前提是Tele-FLM训练消耗的算力远低于其他大模型。 Tele-FLM-52B版本开源地址 https://huggingface.co/CofeAI/Tele-FLM Tele-FLM-Chat试用(纯模型单轮对话版)地址https://modelscope.cn/studios/FLM/ChatFLM 除了算力,另一个大模型在产业界落地的共性挑战就是幻觉问题。 通用语义向量模型BGE系列下载总量位列国产AI模型首位。BGE模型基于检索增强RAG技术,可以实现数据之间精准的语义匹配,支持大模型调用外部知识的调用。 目前Hugging Face、Langchain、Llama Index等国际主流AI开发框架以及腾讯、华为、阿里、字节、微软、亚马逊等主要云服务提供商都已经集成BGE模型,并对外提供商用。 2、多模态大模型:统一文字图像视频,瞄准最具挑战技术路线 行业现有的多模态大模型多为针对不同任务而训练的专用模型,大多为文生视频、图生文等单一能力的组合。基于对技术路线的发展判断,智源研究院坚定要走统一、原生、端到端的多模态技术路线,这也是行业中最难、最具挑战的技术路线。 智源研究院正在训练的Emu3统一了文字、图像、视频,并基于自回归技术路线同时实现图像、视频、文字的生成和理解。 王仲远透露,Emu3模型的研发目标“原生”就是指——一开始就将多种模态进行融合,将生成主体进行融合且可扩展,自回归技术路线还可以支持多模态大模型进行持续可控交互。 Emu3可以同时实现图像、视频生成,图像、视频理解: ▲Emu3视频生成能力演示 ▲Emu3视频理解能力演示 Emu3模型在经过安全评估之后将会逐步开源。 此外,智源研究院还推出了在端侧应用的轻量级图文多模态模型系列Bunny-3B/4B/8B,多个榜单的综合结果表明,Bunny-8B的多模态能力可达到GPT-4o性能的 87%。 目前,Bunny模型参数、训练代码、训练数据已全部开源。 3、具身大模型:抓取成功率突破95%,还打造了“专模专用”分级大模型系统 过去一年,智源研究院具身智能创新中心在机器人泛化动作执行和智能大小脑决策控制方面有一系列突破性成果。 机器人的抓取是最基本、最重要的操作,智源研究院在仿真系统中基于千万级场景、超过10亿的抓取数据,构建了通用物体抓取技术ASGrasp,针对跨任意形状和材质的泛化难题,智源率先突破95%的真机实验成功率,这在全球处于领先水平。 除了抓取,还有机器人的思考能力。智源研究院打造了两个“专模专用、各司其职”的分级大模型系统。 其中之一是能反思、可随机应变的铰接物体操作大模型系统SAGE,该系统有效结合了三维视觉小模型对空间几何的精确感知能力和通用图文大模型的通用物体操作知识,让机器人拥有反思能力,使其任务失败后可以重新规划操作流程。 另一个是全球首个开放指令六自由度拿取放置大模型系统Open6DOR。这解决的是让机器人能够在抓取时考虑物体的位置、形态等,真正让其被应用起来。 同时,为了让机器人真正行走起来,智源研究院研发了全球首个端到端基于视频的多模态具身导航大模型NaVid,此前机器人需要提前构建地图导航,Navid可以让机器人无需建图,只利用合成导航数据进行训练就可以实现在真实世界室内场景甚至是室外场景的zero-shot真机泛化。 ▲多模态具身导航大模型NaVid演示 智源研究院的研究成果基于银河通用的机器人本体实现了落地,机器人可以基于视觉方案看到面前的东西,并根据用户的开放指令进行思考、交互,如让其拿取橘子,机器人可以准确从众多物品中识别到橘子进行抓取: 同时,具身大模型的研究成果在医疗领域已经实现落地。智源研究院联合领视智远研发了全球首个智能心脏超声机器人,并在真人上实现了自主心脏超声扫查。与医生扫描过程对比发现,机器人的扫查高效性、准确性与医生持平,稳定性、舒适性显著高于医生。 为实现通用计算机控制,智源研究院提出了通用计算机控制框架Cradle,让智能体像人一样看屏幕,通过鼠标、键盘完成计算机上的所有任务。Cradle由信息收集、自我反思、任务推断、技能管理、行动计划以及记忆模块等6个模块组成。 4、生物计算大模型:打通基础生物分子壁垒,权威竞赛中26个月霸榜 药物研发过程中,从新药的研发到上市通常要耗费10年以上、10亿美元的投入,其中百分之三、四十左右会投入到药物设计和产品的部分,这也是AI发挥作用的关键之处。此外AI在医疗领域的应用还可能包括大分子结构的建模预测、新药设计等。 基于此,智源研究院研发了全原子生物分子模型OpenComplex 2,以此来打通蛋白质、RNA、DNA、小分子基础生物分子之间的壁垒,同时还能研究生物分子之间的相互作用关系。 OpenComplex 2在国际权威的CAMEO蛋白质结构预测竞赛中连续26个月稳居第一,从精度和宏观结构方面来看,该模型与Alpha 2的预测结构相似。 这一生物计算大模型还支持其他混合物预测,如DNA、RNA、蛋白质,预测结果与Anton的预测结果相似,且噪音更少。 同时,智源研究院还面向虚拟心脏科学研究打造了全球首个实时孪生心脏计算模型,通过GPU加速将心脏的生物秒和计算秒突破到了0.9。目前,其正在与北大医院、安贞医院、长征医院、朝阳医院合作将这一技术真正应用起来。 这就是目前智源研究院围绕大模型技术发展路线所做的研究,今年下半年,更多的研究成果将会陆续发布。 二、FlagOS:全栈开源的算力集群“操作系统”,稳定运行50+团队大模型训练 智源研究院推出了面向异构芯片、支持多种框架的大模型全栈开源技术基座FlagOpen 2.0。相比1.0,其技术框架更为完善,涵盖了面向不同芯片的算法库、面向异构AI的计算框架、数据处理工具、算法以及模型,这样开源的系统框架能够真正成为开发者的一站式大模型开发和研究工具。 智源研究院推出了面向大模型、支持异构计算的算力集群“操作系统”FlagOS。FlagOS已支持了超过50个团队的大模型研发,支持8种芯片,管理超过4600个AI加速卡,稳定运行20个月,SLA超过99.5%。 此外,在AI芯片统一生态构建方面,智源研究院发布面向大模型的开源Triton算子库。据智源研究院统计,目前其已经覆盖了主流语言和多模态模型所需127个算子中的48%,预计2024年底实现全覆盖,同时支持6大厂商的多种AI芯片,还支持6种大模型专用算子,覆盖了高频使用的主流Attention类算子。 此外,支持多元AI异构算力的并行训练框架FlagScale实现首次突破,包括业界首次实现不同厂商跨界点DRMA直连和多种并行策略的高效混合训练、以及首个在多元异构芯片上同时支持Scale up+Scale out两阶段增长模式的训练框架。 在高性能数据集方面,目前整个大模型社区中缺乏高质量的SFT数据集,智源研究院发布首个千万级高质量指令微调数据集InfinityInstruct,这一数据集能让很多开源社区的基座模型达到或接近GPT-4的水平。 另一个开源数据集是全球最大的开源中英文多行业数据集IndustryCorpus,涉及18个行业总计3.4TB数据,包括中文1TB、英文2.4TB。 FlagEval大模型评估体系也全面升级,上个月,智源研究院公布了榜单和测评结果。从2023年发布以来,该评估体系已从主要面向语言模型扩展到视频、语音、多模态模型,实现多领域全覆盖, 此外,FlagOpen系列开源的模型框架工具,在过去一年全球总下载量已经超过4755万次,累计开源数据集57个,下载量近9万次,开源项目代码下载量超51万次,支撑着开源社区茁壮成长。 三、大模型参数可能赶上人类大脑,AGI时代演进加速 从智源研究院过去一年的研究进展可以看出,其大模型全家桶及全栈开源技术基座新版图正朝着加速AGI时代到来布局。 王仲远提到,以2023年为界,AI的发展浪潮可以分为两大阶段,2023年前是AI模型针对特定产品、任务收集特定数据进行特定运行的过程。如今,大模型发展进入到通用模型时代,通用人工智能的最大特点就是规模大,具备跨领域稳定性。 当下业界关于Scaling Law的讨论热度高涨,其基本含义就是随着模型参数、训练数据量和计算量持续增大,模型的性能将会持续提升。因此,在智源研究院看来,按照大模型这一发展速度,未来其参数可能会赶上或超过人类大脑参数,这也是他们认为AGI会在未来几年到来的重要原因。 具体来看,AGI可能的技术演化路径将会从大语言模型到统一的多模态大模型,然后进入物理世界、微观世界形成世界模型,最终推动AGI时代到来。 王仲远解释说,过去几年科研关注度大多在大语言模型的突破,但除文本外还有大量的音视频等数据,其数据量可能比文本数据大百倍甚至千倍。 因此,大量关于多模态大模型的研究出现,从技术发展来看,这最终会形成融合不同模态数据的统一多模态大模型。当多模态大模型能理解、感知、决策世界,就会进入到我们的物理世界与硬件相结合,进入到微观世界就是AI for Science。最后促进整个世界模型的发展,推动AI向AGI方向发展。 当下,作为成立于2018年11月的国内非营利性科研机构,智源研究院已经成为北京市乃至全国的一张学术名片,走在通往AGI的前列。 早在2020年,智源研究院就成立了百人技术攻关团队,开始进行悟道系列大模型研发,这也拉开了其在国内大模型产业的代表性地位。 从大语言模型、多模态大模型到如今的系列全家桶,始终坚持原始创新的智源研究院正为国内大模型产业界与学术界搭建交流的平台,通过开源开放的生态与技术体系为AGI的到来注入源源不断的动能。 结语:大模型先锋代表齐聚,共话AGI时代 到今年,智源大会已经举办六届,共计邀请了全球30个国家和地区超过1000位全球顶尖专家进行分享交流。 未来两天的议程中,智源大会还将举办20余个论坛、百场报告,有来自全球主流模型技术负责人、项目负责人介绍最新技术,国内领先大模型、创业公司CEO对大模型产业各种关键问题进行解答。 一直以来,智源研究院始终坚持推动AI原始创新,以“智能的源头”为目标,致力于成为学术思想、基础理论、顶尖人才、企业创新以及发展政策的源头,从大语言模型、多模态大模型到具身智能、生物计算大模型,智源研究院已经布局了全栈的技术路线,并向创新的技术路线发起冲锋,作为AGI时代的领路人为企业与学界搭建起技术交流共享的平台。
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
作者 | 香草 编辑 | 李水青 智东西6月14日报道,今天,微软在Microsoft AI Day上集中展示了其在生成式AI上的最新技术突破与进展,包括一系列Azure AI新服务与新功能、Microsoft Copilot技术栈,帮助企业开发者打造专属Copilot的Microsoft Copilot Studio等一系列开发工具与平台服务。 在今年的Build全球开发者大会上,微软围绕Azure AI和Copilot发布了60多项产品、服务、解决方案,本次通过Microsoft AI Day,微软将最新的技术创新和发展趋势,同步更新给更多的开发者、客户、合作伙伴,以开放合作的态度推进创新技术的普及应用。 微软全球资深副总裁、微软亚太研发集团主席王永东谈道,微软在AI技术方面的发展是非常迅速地,他称之为“微软速度”。从2019年与OpenAI合作开始,微软抓住AI转型机遇,频繁推出新产品、新升级。其中,GitHub Copilot、Teams高级版嵌入GPT、Microsoft 365 Copilot的发布和扩展插件支持等是具有代表性的关键节点。 ▲微软的AI发展路径 微软亚洲区Microsoft Azure策略运营总经理康容、微软大中华区首席运营官陶然与智东西等少数媒体进行了深入交谈。 当智东西问道,对于中小企业、创新企业,生成式AI有哪些潜力和价值? 康容称,虽然在案例分享中以大型企业为主,但从亚太地区来看,AI在中小企业、创新企业中的使用率并不低。它们的痛点和大企业恰恰相反,由于没有过重的数据负担,因此从技术层面上,Copilot等AI产品的融合会更容易,新技术的迁移也更为灵活便捷。 陶然谈道,创业公司前期最大的痛点,其实都是缺少资金和人才,微软Copilot能够帮助小团队在人数、资金有限的情况下,发挥出更大的能量。对中小企业来说,信息处理等能力需求高,微软的产品可以帮助他们加速新产品试用推广、团队扩张。 一、Copilot平台推出Agent能力,小模型满足端侧需求 在Scaling Laws下,AI技术的能力大约每六个月就会翻倍增长。陶然谈道,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,成为当前微软最关注的业务领域。 ▲Scaling Laws 基于企业级Copilot,微软构建了从云到边缘,从AI基础设施、基础大模型、数据智能平台到AI开发平台与工具链,再到可定制的Copilot及扩展功能的Copilot技术栈。 ▲微软企业级Copilot技术栈 Microsoft Copilot Studio是由Copilot扩展的专属平台,其推出Agent代理功能,让开发者能够根据特定任务和功能,构建出做出针对性主动响应的Copilot。 定制化的Copilot可通过记忆和知识了解上下文背景、推理需要进行的操作和行动,基于用户反馈进行学习,并主动寻求帮助,独立管理复杂、长期运行的业务流程。 ▲Copilot扩展的专属平台Microsoft Copilot Studio 从IT设备采购、销售到客户服务,用户可以从不同场景和自身业务需求出发,量身定制Copilot。通过插件和连接器等Copilot扩展,用户可以连接到不同的数据源和应用程序,进一步拓展Copilot的适用性和功能。 在模型层面,陶然称,微软认为AI时代并不是只有大模型,高效的端侧小模型同样重要。 微软的小语言模型Phi-3系列,发布全新多模态模型Phi-3-vision,其具备42亿参数,可提供语言和图像处理能力,能够实现基于照片的推理,并优化对图表内容的理解能力。Phi-3小语言模型能够同时满足云端运行,以及面向网页、移动端和边缘设备的本地部署的需求。 ▲微软Phi-3系列小模型 二、GPT-4o提供云上API服务,GitHub Copilot累计180万付费用户 康容介绍,目前全球有超过5万家企业和组织采用微软Azure AI服务。 ▲微软Azure 在Build 2024全球开发者大会上,微软宣布与AMD、英伟达等合作伙伴深化合作,为用户提供多样化的高性能云基础设施服务。 在与英伟达的合作方面,微软将英伟达Omniverse Cloud、DGX Cloud与微软云服务、Fabric数据服务深度集成,让开发者第一次得以在Azure云端调用Omniverse的API开发AI解决方案。 ▲微软与英伟达全栈合作 作为首个将AMD MI300X AI加速器芯片用于客户AI训练和AI推理的云服务商,微软正式发布针对Azure OpenAI Service的高性能计算(HPC)工作负载进行优化的Azure ND MI300X v5虚拟机系列。 ▲微软新一代Azure虚拟机 康容谈道,在大模型领域,OpenAI是微软最重要的战略合作伙伴。OpenAI的旗舰模型GPT-4o在Azure平台上开发训练,现已加入Azure AI Studio,同时也可作为API服务调用。 ▲Azure OpenAI国际版 Azure AI服务也在不断拓展MaaS的覆盖范围,提供了对Coherence、Databricks、Deci、Meta、Mistral AI、Snowflake等大模型服务的支持。 微软还宣布进一步加强与开源社区Hugging Face合作,将更多来自开源库的优秀语言模型引入Azure AI服务和Azure AI Studio开发工具。 ▲Azure AI Studio GitHub Copilot是微软旗下AI驱动的开发者智能副驾驶,过去两年已累计超过180万付费用户,得到90%“财富100强”企业的信任。 ▲GitHub Copilot 三、微软助力AI落地应用,加速制造、金融、教育业智能转型 微软中国区总裁原欣谈道,AI正在成为现代生产力必不可少的组成部分。2024年度《工作趋势指数报告(WTI)》显示,在全球范围内,75%的受访劳动者称其已经将AI用于日常工作,其中近半数的人在最近6个月内开始使用AI。 与此同时,AI技能正成为用人单位招聘时的考量之一,71%的受访管理者称,在有经验而缺乏AI技能,与经验略有欠缺但AI技能扎实的候选人之间,他们更倾向于选择后者。在中国市场, 91%的受访劳动者已经将AI用于日常工作,82%的管理者更看中求职者的AI技能。 ▲微软AI在客户中的应用 原欣称,微软植根中国市场三十余年,积累了推动不同行业客户数字化转型、智能化创新的丰富的成功经验,能够更好地根据不同行业的业务场景、企业需求,为其量身定制“接地气”的技术落地和解决方案。 北京世纪好未来教育科技有限公司CTO田密来到现场,据他介绍,2023年初,好未来教育集团率先为上千位研发人员配备了GitHub Copilot。 据统计,其开发人员与Copilot月均交互接近2万次,AI辅助编写代码的平均采纳率达到33%,每月总采纳代码总数大约有25万行。 ▲好未来采用GitHub Copilot提升效率 好未来在研发教育千亿级“九章大模型”的过程中,借助Azure AI服务,将数据标注的效率提升了35%,实现了客观题评估、主观题评估等多个任务的自动化评估。此外,好未来基于九章大模型研发的AI Tutor产品中,广泛采用了微软Azure提供的高精准ASR和超拟人TTS技术。 ▲好未来采用微软Azure AI服务 OPPO AI中心产品总监张峻介绍,微软为其即将面世的海外手机新品上的AI功能提供智能语音服务支持,包括运用Azure AI服务中的ASR与TTS开发的AI录音摘要和AI文章朗读功能。 相关功能通过直接调用Azure API即可面向全球用户提供服务,其中语音相关特性开发和调试用时仅一个月,帮助OPPO大大降低了人力与物力的支出,而且可以更好满足海外市场对于安全隐私与合规的严格要求。 ▲OPPO与微软合作 麦当劳中国也选择微软作为首个智能化深度创新伙伴。据介绍,微软为麦当劳中国量身定制了整套智能化创新解决方案,包括由Azure云平台提供自然语言交互、生成式智能、机器学习等企业级的智能化服务;以融入Copilot的Microsoft 365为基础,构建高效的员工协作平台;通过GitHub Copilot加速IT开发和系统运维,提升IT系统及业务应用开发迭代效率等。 此外,麦当劳中国南京创新中心成立“AI-Lab”,将智能技术引入麦当劳中国“汉堡大学”,为20万名员工提供职业发展与技术技能培训。 在帮助企业加速AI落地层面,康容谈道,就微软与客户的接触来看,目前各行各业都在积极部署AI,其中金融、教育、制造业、电商等用量较大。在亚太地区尤其是中国市场,客户对新的产品、技术接受度更高,相较之下欧盟的客户可能更加保守。 结语:国内企业走上第三阶梯,AI应以安全为先 相比ChatGPT刚出现时,企业对AI的认知有哪些变化?康容谈道,过去一年多,企业逐渐从认识AI,过渡到开始重视如何将AI融入现有业务,走上第二、第三阶梯的客户越来越多,而且国内的客户走得更快。 陶然认为,AI的发展一定是以安全为先,在此基础上,未来AI要帮到每个人,必须是端侧、云端相结合。微软在大模型上的心态是开放和兼容的,小模型不会取代大模型,而是作为不同侧重点的模型相互结合,发挥最大的优势。
2024年Q1全球智能手机出货量同比增长18.7%,三星、苹果、小米名列前三
原标题:TrendForce:2024年Q1全球智能手机出货量同比增长18.7%,三星、苹果、小米名列前三 IT之家 6 月 14 日消息,TrendForce 集邦咨询称,今年第一季度全球智能手机总出货量为 2.96 亿部,维持着 18.7% 的同比增长。受到消费高通胀及国际形势冲突等因素的影响,预计下一季度将环比下降 5-10%。 据统计,从第一季度出货量排名来看,全球前六名的厂商依序为三星、苹果、小米、OPPO、传音及 vivo,上述厂商共占据了将近 80% 的市场份额,IT之家附排名数据如下: ▲ 图源 TrendForce 三星:出货量 5950 万部,市场占有率居首位。其中 Galaxy S24 系列第一季度市场占有率为 22.5%,对比去年 Galaxy S23 系列,增长 20%。因为 A 系列海外销售不如预期,预估第二季度出货量在 5,500 万部以下,跌幅恐超过 10%。 苹果:出货量 4790 万部,市场占有率第二,较去年同期相比有所衰退。由于多次传出机身零部件供应链将被替换的消息,外加第二季度处于苹果产品迭代空窗期,预估其第二季度出货量将减少 10% 左右。 小米(含红米和 Poco):出货量为 4110 万部,市场占有率第三。从 2023 年下半年开始,受到库存回补以及内部政策对新兴市场投资激励,出货量数据表现较好。受全球经济影响,新兴市场激烈竞争,第二季度将以持平第一季度为出货目标。 OPPO(含一加和 realme):出货量为 3380 万部,市场占有率第四。该品牌即便是在印度等新兴市场销售略有增长,其第一季度的同比增长幅度仍不及其他品牌的低端安卓型号。第二季度以持平第一季度为主。 传音:第一季度出货量约 2980 万部,市场占有率第五。第一季度产出过于积极,加上与三星、小米、联想的低端型号重合,导致渠道库存开始积累。 vivo(包括 iQOO):出货量 2170 万部,季度市占排名第六。在第二季度推出旗舰机 X100 Ultra,加上 618 促销,出货量有望与第一季度持平。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。