EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
小鹏P7雨天高速行驶碰撞起火 官方回应
原标题:一辆小鹏P7雨天高速行驶碰撞起火,知情人士称“整个车都烧成骨架”……小鹏回应:对人车损伤非常痛心 2月29日,有网传消息称苏州一辆小鹏P7在湿滑路段发生事故并起火。 视频显示,一辆粉色车辆行驶速度极快,白色车辆也紧随其后,随后,粉色车辆在一路口撞向路边障碍物失控飞出道路,车辆顿时燃起大火。据悉,起火车辆为小鹏P7,车辆破损严重,视频资料显示已有交警到场处理。 据视频拍摄车辆的行车记录仪显示,当时该车辆时速在100公里左右,但还是被两辆车轻松超过。 事发地横扇街道办事处工作人员称,公安排查情况是撞到交通标志,现场车辆破损比较严重,事故正在进一步调查处理中。 据东方财经,知情人士表示,出事故的是一辆小鹏汽车,估计司机开得太快了,“直接撞电线杆子,又撞到道路指示牌,又撞到树,都撞断。现场挺惨烈的,整个车都烧成骨架了。”此外,车主疑似当场死亡。 据红星新闻,小鹏汽车方面回应:“2月29日上午7时52分,一辆小鹏P7在江苏省苏州市吴江区苏震桃公路与思进路交叉口路段发生交通事故,对于事故造成的人员及车辆损伤我们感到非常痛心。在后台接到碰撞事故告警后,小鹏汽车第一时间进行外呼并协调当地区域人员赶赴事故现场。目前相关部门已封锁事故现场进行详细事故勘察,我们也同步配合相关部门进行事故处理,同时也对车主家属提供必要的支持及妥善安排”。
小鹏X9汽车配备可以后轮转向的MPV
原标题:行业天花板级!小鹏汽车:X9是全球唯一标配后轮转向的MPV 快科技2月29日消息,今日,“MPV采用后轮转向到底好不好”一话题引起小鹏官方的注意。 @小鹏汽车先是转载一博主的文章,随后也谈起此话题。据了解,该博主谈及网友热议的“MPV采用后轮转向到底好不好、会不会影响舒适性”话题时,表示网友共有两种观点。 一是觉得后轮转向影响第三排空间,且后轮驱动能力减弱;二是觉得不会影响,因为前后轮反向时是低速转弯,不影响舒适性。凯迪拉克CT6、奔驰S、奔驰EQS和很多三轴公交车也都采用此技术。 小鹏官方对此表示,小鹏耗费了超高的研发和试验费用,为了给鹏友们带来天花板级的后轮转向操控体验。小鹏X9是全球唯一标配后轮转向的MPV。 当你体验过开着大七座汽车,还能做到“狭窄路口灵活掉头、直角弯轻松一把过、高速变道过弯不晃悠、泊车无负担”等真香瞬间后,就知道X9有多么值得! 据悉,对于家用车来说,轻微的不足转向特性可以保证车辆行驶的稳定性,但是车辆高速转弯时往往会产生过度转向,通过后轮转向系统,可以弥补这种过度转向带来的行车危险。 同时对于中大型车以及豪华车来说,后轮转向可以使车辆在低速时更加灵活,高速过弯时也更加稳定。 而小鹏X9作为小鹏旗下首款MPV,就配备了后轮转向系统可提高车辆的操控性和稳定性,它的后轮转向角度为±5°,转弯直径为10.8米。 对比奔驰smart精灵的11米转弯直径还要小,这种设计可使小鹏X9在城市道路的转弯、掉头等操作更便捷。 此外,小鹏X9还考虑到后轮转向可能对车内空间的影响,采用了后H臂多连杆独立悬架设计,又将转向器放置在副车架前端。 这就直接避免了转向器占用后排空间的情况,保证了三排乘客头部空间和后备箱的储物能力。 根据此前报道,小鹏X9共有3个版本,低配版CLTC续航610km,售价为35.98万;顶配版CLTC续航640km,售价为41.98万。 作为小鹏的旗舰车型,小鹏X9基于扶摇架构打造,拥有前后一体式铝压铸底盘、全域800V高压平台、XNGP核心技术。 强大的产品力加上有竞争力的价格,让小鹏X9发布会刚结束就收获了5000大定订单,而且很快就突破万辆,在2024年1月份还挤压了上万个X9的订单。
小鹏G9,成了大众2026年反攻中国新能源的底气?
去年7月下旬,大众与小鹏官宣「联姻」令人意外——一位经验老到的圈内「大佬」向刚发展几年的「萌新」抛去橄榄枝,这放在哪个行业都可以上头条。 从当时公布的协议来看,双方计划面向中国的中型车市场,共同开发两款大众汽车品牌的电动车型。这两款新车将会补充到大众汽车旗下纯电动产品陈列,计划在2026年进入国内市场。 官方只是浅显地透露一下规划,但俨然吊起了消费者的「胃口」:大众和小鹏联手会打造出怎样的产品?小鹏可否拯救大众的智能化? 八个月之后的今天,大众汽车集团和小鹏汽车再度官宣进展,双方签订了平台与软件战略技术合作联合开发协议(以下简称「协议」)。协议中提到,大众汽车和小鹏汽车就双方车型及平台的共用零部件订立了联合采购计划,主要目的就是在保证产品竞争力的前提下,合力降低平台成本。 协议一签,大众汽车和小鹏汽车的合作便更深入、更细致。话虽如此,在产品准备发布之前,我们很难从官方消息找到相应的答案,但可以从其他渠道发现一些「蛛丝马迹」。 首款产品确认是SUV,更有可能是「大众版G9」? 大众汽车集团中国区董事贝瑞德在社交平台上透露,「大众和小鹏汽车的合作已经进入快车道」,其中最重要的信息是,「首款产品将会是一款SUV车型」,而且还附上了一张首款合作开发的SUV谍照。 起初公布的规划说的是两款中型车,小通还以为说的是两款中型轿车,换而言之首款产品将会定位为中型SUV。细想下来也没有太大毛病,毕竟大众的两款纯电动SUV——大众ID.4和大众ID.6,分别定位为紧凑型SUV和中大型SUV,入局中型SUV市场还能让大众汽车集团接触更多细分市场。 或许,我们能知道的消息就这么多,但小通从这款SUV谍照发现了「端倪」,不妨看小通整活。 这是贝瑞德发布的SUV谍照。 这是小鹏G9的官方侧面图。 这是小通将小鹏G9与SUV谍照相融合的图片。 不难看出,小鹏G9和这款SUV的车顶线条轮廓几乎别无二致!不过,小鹏G9的定位是中大型纯电动SUV,也就是说大众汽车和小鹏汽车合作打造的首款SUV,极有可能是在小鹏G9的基础上打造,预计车长和轴距会与小鹏G6接近。 但是,要想在国内中型纯电动SUV市场占据一席之地,即便是大众和小鹏联手,难度也并不低。 从还算畅销的产品来剖析,Model Y、腾势N7、蔚来ES6等产品位列在30万级市场,降价后的宝马iX3也顺势与这两位选手竞争,领克08 EM-P、唐新能源和小鹏G6的价格范围完全落在20万元-30万元这一区间内,宋L、零跑C11、深蓝S7将中型新能源SUV的购车门槛打到20万元以下。 就成绩而言,Model Y的成绩最为突出,月销量可以冲上3万辆,而深蓝S7、唐新能源、领克08 EM-P等排名紧随其后的车型,月销量突破万辆都有难度。 小通注意到,此次协议将「合力降低平台成本」当成主要目标,而且贝瑞德也提到「继续创造成本优势」。性价比,可能会是这款全新中型SUV的其中一个卖点。 按照大众ID.4和大众ID.6的价格来推算,大众这款全新中型SUV的价格在20万元出头会比较合理,不会蚕食到大众ID.4的市场份额。但是这样一来,全新中型SUV将会与小鹏G6的价格有一定重叠。因此小通再大胆一些,新车的定价策略可能会与零跑C11、宋L、深蓝S7相似,起售价在20万元以内。 这样的定价可能会影响到大众ID.4的销量,但对于亟需转型的大众而言,快速抢占市场是非常关键的一步,等到这款全新中型SUV站稳脚跟,大众完全可以将这套技术应用在大众ID.4、大众ID.6等其他纯电动车型上。 大众和小鹏,各有各「难念的经」 大众负责工程研发和制造,小鹏提供平台和技术,此次合作双方都找到自己的「舒适区」。 显而易见,大众看上的是小鹏的智能化技术。如今,小鹏汽车已经宣布面向智驾经验用户即刻推送无限XNGP智能辅助驾驶功能,不限城市、不限路线,几乎完全摆脱对高精地图的依赖,俨然来到智能驾驶技术层面的第一梯队。 大众汽车旗下负责车载软件开发的CARIAD部门,这几年做出了不少努力,但是发展之路依然不顺畅——负责人屡次更替,而且去年年底有外媒报道,由于软件开发不顺和成本持续增加,CARIAD软件部门还会裁员2000人。 国内纯电动车的竞争逐步白热化,大众汽车在国内的纯电动车销量开始下滑,除了持续开展促销优惠的ID.3之外,大众ID.4和大众ID.6的销量持续走低。数据显示,上汽大众ID.4 X的单月销量已经出现明显环比下滑的趋势,ID.6的月销量更是难以突破三位数。 合作的首款SUV会在2026年进入市场,以上分析只是针对品牌和车市现状进行分析。或许你可能还觉得两年之后才推出,会不会黄花菜都凉了?两年时间,足够让车市的格局迎来翻天覆地的变化,而且对于品牌的发展而言,大众汽车集团更希望从小鹏身上学到一些本领。 小鹏汽车需要面对的压力还挺大,何小鹏在年初透露了未来三年的规划,为了提高品牌竞争力,在这三年里将推出近30款新款、改款车型,今年要确保15万级新车和30万级新车的顺利上市,帮助品牌完善10万元-40万元这一价格区间内的布局。 与此同时,当其他大部分新势力还在为如何填补亏损在发愁时,小鹏汽车今年还将投入更多的研发预算,同比超过40%。 根据小鹏汽车公布的2023年第三季度财报,品牌目前的营收和交付量都处于高位,但并没有让品牌摆脱「亏损多年」的窘境。 大众与小鹏合作之后,向小鹏汽车增资约7亿美元(约合人民币50.04亿元),而且这位「圈内大佬」的加入吸引了不少投资者的青睐。这7亿美元,对小鹏汽车而言无疑是雪中送炭,但对一个汽车企业的长久发展而言来说远远不够。 三年近30款车看似有些激进,可能小鹏急了,也有可能是觉得车市竞争已经到了白热化阶段,但无论怎么样,小鹏已经抱紧了大众汽车集团的大腿,没那么容易被车市「优化」。
目标2030年前实现中国人首次登陆月球!着陆器、登月服进入研制阶段
快科技2月29日消息,今日,中国载人航天工程办公室发文称,2024年中国载人航天工程将统筹推进空间站应用与发展和载人月球探测两大任务。 其中,中国空间站应用与发展阶段各项工作正按计划稳步推进,载人月球探测工程登月阶段任务各项研制建设进展顺利。 官方表示,在精心组织实施空间站应用与发展阶段各项任务的同时,瞄准2030年前实现中国人首次登陆月球的目标,2024年载人月球探测工程登月阶段任务各项研制建设工作也将加紧推进。 目前,长征十号运载火箭、梦舟载人飞船、揽月月面着陆器、登月服等主要飞行产品全面进入初样研制阶段。 文昌发射场配套登月任务的各项测试发射设施设备也将全面启动建设,各系统相关研制建设工作正在按计划推进。 近日,中国载人月球探测任务新飞行器名称公布,新一代载人飞船命名为“梦舟”,月面着陆器命名为“揽月”。 据了解,在未来载人登月任务重,两枚长征十号运载火箭先后将“揽月”着陆器、“梦舟”飞船送至地月转移轨道。 两个飞行器在环月轨道进行交会对接,航天员进入着陆器,并由着陆器将航天员送上月面,航天员在月面按计划开展科学考察和样品采集。 完成既定任务后,航天员乘坐“揽月”着陆器上升到环月轨道,两个飞行器再次交会对接,航天员将月球样品转移到飞船,飞船由月地转移轨道返回地球。
宝马电摩终成一梦
宝马摩托车打造的概念车“Vision DC Roadster”最初亮相于2019年,与次世代电车平台概念车一同公诸于世: 身为概念车,这台电摩在沿袭传统造型的基础上还保留了油车时代元素,似乎仍在强调宝马摩托的历史传承。比如电池组取代了水平对置“拳击手”发动机并位于同一位置,但冷却翅片却向初代拳击手发动机致敬: 电机位于电池下部,通过万向轴将动力传递至后轮,动力传递形式类似于宝马汽油摩托车惯用的轴传动。 电摩当然无需油箱,但设计人员似乎对油箱造型存有执念,坚持用结构件凹一个油箱造型出来……难道就不能像脑残750那样开发成真·油箱包,掏一个放头盔的位置? 低速条件下为电池散热的真风扇,存在感比杜卡迪的装饰性道具强多了: 新上任的宝马摩托负责人Markus Flasch接受采访时称,Vision DC Roadster项目及后继产品均被叫停。尽管公司使出浑身解数将DC Roadster的续航里程提升至200公里,但公司高层认为汽油摩托车受众没有理由转投电摩,除非产业政策受到影响,否则这种情况在未来数年内不会改变。 Markus Flasch曾负责宝马M性能车部门,M3旅行版是他的得意之作。他上任不到半年就叫停了电摩项目,但电动踏板车得以保留,比如售价贵上天的CE04: 此外,末代Z4的旅行版也被确认仅停留在概念车阶段,不会量产: Z4旅行版源自现款Z4软顶敞篷版,其小丑鞋造型令人有强烈的不适感。 有报道称宝马原拟定了一个量产五十辆的商业计划,单价25万美元起,该计划最终被取消。 现款软顶Z4将追加一个手动版本,这是G29平台最后一次更新,位于奥地利格拉茨的Z4生产线将于2026年3月停止运作。
买华为问界M7,我驾照差点被吊销了
道路千万条,安全第一条。 相信道理大家都懂,但总有人不信邪。 最近,有网友发帖称,自己刚提问界M7一个月,驾照差点因为它没了。 事情是这样的,这位车主日常出门都是用智驾,喊下“小艺小艺”就能接管,非常方便。 然而,他觉得坐在那啥也不干太无聊,总是忍不住看手机。 虽然车可以自己开,问题是路上有很多摄像头在抓拍,驾驶过程中使用电子设备,违规一次扣三分。 他还配上了违章的图片,并调侃再这样下去,驾照就要被吊销了。 不得不说,Mate60的辨识度,实在是太高了。 01 被玩坏的智能驾驶 在使用智驾过程中被扣分,并不是个例。 同样是问界M7,有海南网友表示,自己天天都让小艺开长途,自己则是在玩手机。 等待着他的,同样是3分处罚。 有人被交警罚,也有人被车机系统罚。 今年春节,余承东在朋友圈分享从老家安徽霍邱驾车返回深圳的历程。 他表示,自己从出家门开始就全程一路智能驾驶,完全没有事干,很轻松。 唯一不爽的地方,就是手指头还要搭在方向盘上。 他中途双手长时间离开方向盘,结果被罚了一次三分钟不允许使用智驾功能。 后来他又被罚了一次,导致智驾无法使用,只能借着去休息区上厕所恢复。 对此余承东表示:“好想能把这个离手检测功能取消啊!” 他还在评论区吐槽,法规已经落后于技术发展了。 当然,余承东只是将手离开方向盘,有些车主的举动更加危险。 前几天,有网友拍到,一个问界M7司机,在高速打开智能驾驶后,直接睡着了。 你没看错,他是真的睡着了…… 有网友猜测,这位车主睡得如此踏实。 不仅是对问界的ADS 2.0有信心,估计对车辆质量也很放心。 毕竟,在问界M7在日系双雄夹击下,也能几乎毫发无损。 除了问界,其他品牌的车主,也有不少类似的操作。 去年有理想车主,通过一瓶矿泉水绕开了系统检测,让车辆实现“无人驾驶”,在高速飙到120码。 而驾驶员则是坐在后排拍摄,并且和副驾的乘客一起追剧。 有人看剧打发时间,也有人画画陶冶性情。 前几天,有网友晒出一段视频。 广州某高速路上,有美女边开车边画画,全程没抬头看路,还不时对着窗外笑。 后来,昊铂官方出来认领。 表示该视频是在示范区内体验L3自动驾驶,还顺手给自己打了波广告。 然而,有媒体联系到对应的监管机构。 电话那头的工作人员却表示,此行为不符合相关要求,已联系车企方面了解情况,瞬间打脸。 02 理想和现实 当下车圈最热门的概念,莫过于“智能驾驶”。 实际上,厂商们花式吹捧的智驾功能,酿成过不少事故。 2月22日,网传问界在某高速上发生事故,原因是车主过于相信车辆会自己刹停。 结果一头撞上了前方五菱,所幸双方并无大碍。 这不禁让人想起,前几年一桩事故。 知名餐饮连锁品牌创始人,驾驶蔚来ES8启动辅助驾驶功能后,在高速发生车祸,最终不幸逝世,年仅31岁。 其实,「智能驾驶」和「自动驾驶」,虽然听起来很像,却天差地别。 所谓的智能驾驶,根本就不是规范的技术用语,只是一个包装精美的商业概念。 什么NCA、NOA、NGP、NAD、ZAD……名字一个比一个复杂。 当你打开这些车企的官网,拉到最下面,就会看到密密麻麻几百字的说明。 省流概括一下:这只是辅助驾驶。 这也没错,因为按照国标的规定,L3以上才能称为自动驾驶。 而目前主流的L2,只能归类为辅助驾驶。 虽然有些品牌,会将自己的智驾称为无限接近L3的L2.999…… 但这不是数学问题,L2.9本质还是L2,一旦出了事故,负责的还是驾驶员。 至于打开智能驾驶,然后玩手机打发时间的行为。 目前的法律法规,没有明文规定不允许驾驶员双手离开方向盘。 然而,考过科目一的都应该知道。 按照《道路交通安全法》规定,开车拨打接听手持电话、观看电视等属于妨碍安全驾驶的行为。 所以说,开头的案例不仅是滥用智能驾驶功能,更是违法的危险行为,扣3分并不冤枉。 03 箭在弦上 当任何事情都有一个发展过程,上面种种状况,都是成长的烦恼。 目前智能驾驶进步的速度,超乎我们想象。 最近一段时间,包括问界、深蓝、阿维塔、长安汽车、智己、昊铂等品牌,均拿到了L3级自动驾驶的测试牌照。 不少人预计,2024年将会成为L3级自动驾驶元年。 L3之后,驾驶的主导权逐步向系统过渡,这也意味着距离想象中的自动驾驶更进一步。 或许不需要多久,科幻电影里的L5级别自动驾驶,将会成为现实。 到那时候,我们真的可以安心玩手机了。
华为云盘古气象大模型入选中国科学十大进展:支持全球气象秒级预报!
快科技2月29日消息,今日,国家自然科学基金委员发布2023年度中国科学十大进展,榜单囊括一年中最重大的科学发现、科学进展及未来趋势,华为云盘古气象大模型入选。 据介绍,华为云盘古气象大模型已正式上线欧洲中期天气预报中心和香港天文台地球官网。 盘古气象大模型能提供全球气象秒级预报,其气象预测结果包含台风路径、降水,以及位势、湿度、风速、温度、海平面气压等基础气象要素,应用于多个气象研究细分场景。 华为表示,该模型能够预报7天内的地表层和13个高空层的温度、气压、湿度、风速等气象要素。 并将全球最先进的欧洲中长期天气预报中心(ECMWF)集成预报系统的预报时效提高了0.6天左右,在热带气旋的路径预报误差相较于ECMWF预报系统降低了25%。 不仅如此,仅需10秒即可完成全球7天重要气象要素的预报,计算速度较数值方法提升1万倍以上。 盘古气象大模型的三维神经网络结构 据了解,在2023年汛期,盘古气象大模型成功预测了玛娃、泰利、杜苏芮、苏拉等影响我国的强台风路径。 值得一提的是,2023年7月5日,国际顶级学术期刊《Nature》刊发华为云盘古气象研究成果,并盛赞重新审视气象未来。 这也成为多年来第一篇由中国科技公司作为唯一署名单位发表的《自然》正刊论文。
别只盯着带货榜,小杨哥已经是青年企业家了
图源·三只羊网络 疯狂小杨哥要淡出直播带货了么? 龙年春节前后这段时间,疯狂小杨哥带货着实有点不走心。先是大杨哥放鞭炮炸了手,进医院动了手术,还连带伤了舅舅的脸。小杨哥也皮了一下,骑车掉进河里。与外界的讨论相比,此时他们更在乎自己的心情,二人似乎很享受这份久违的快乐。 小杨哥带货掉队了? 今年1月,小杨哥在直播时劝大家别发大财,发小财是最快活的,称要知足常乐。他说,“现在我啥都不能干,我以前还喜欢去酒吧蹦迪,我现在能去吗?一去又被别人说。” 类似的心声,他在直播间倾吐过多次。还有一次,小杨哥说:“现在过的一点也不开心,压力太大了,没有一点私人空间,我去幼儿园开个家长会都能上热搜,我现在更不敢去吃大排档,我现在出门都得偷偷摸摸地躲着别人。” 即便类似的言论遭受巨大的非议,但也能看得出来,大小杨哥在流量压力之下,也很希望撇开镜头前的人设,沉浸在真实的生活状态里。 紧接着,小杨哥在办公室玩起游戏直播,和大杨哥一起贡献了不少新的搞笑场面。很多人以为他这是玩票。实际上,小杨哥在成名之前就在B站做游戏主播。虽然当时粉丝少得可怜,但他还是很认真地对待每场直播,风格幽默真实。后来,他们拍摄的短视频里,也有不少关于游戏的画面。 多年后,小杨哥再次玩起游戏直播。他似乎忘了早前在某次对话节目中,信誓旦旦的表示,“有游戏公司老板找到我说大概直播玩三场游戏,一次五小时,给我2800万,但是不能搞,我的粉丝中有很多小朋友,我玩游戏不等于带他们玩了吗?” 如果找个理由解释,合理的说法是小杨哥玩的是《英雄联盟》,这是一款电竞游戏,算不得违背初衷。 当然,还有一种可能,就是与斗鱼风波有关系,最新发酵的是“一条小团团”疑似被抓。 由此,大量游戏直播用户涌向抖音,加上王者荣耀开放合作,张大仙等头部游戏主播在抖音发力,善于抓住流量风口的小杨哥,表现出“摆烂”的假想,吸引外界的关注度,以此来对冲他本人和三只羊网络带货的负面消息。 从这个角度看,小杨哥遇到的麻烦事可不少。 以最近半年为例,去年10月底,女徒弟“红绿灯的黄”(小黄)被批低俗带货,一度长时间停播。紧接着“小杨哥被指直播低俗言论比徒弟更甚”话题也登上了热搜。 期间,官方下场点名批评,给小杨哥敲响了警钟:中国消费者协会把“红绿灯的黄”列入低俗带货案例,其发布2023年“双11”消费维权舆情分析报告称:靠审丑发迹的主播,正被品牌拥趸反感。 人民网也发布网评:靠审丑、低俗的初级“老法子”,行不通了。审丑低俗收不住,带货必将成“带祸”。在中消协点名前,小杨哥因一口锅涉嫌虚假宣传才被“退一赔三”。 此后,小杨哥还曝出存在“保价协议”;2月23日,知名打假人王海再次指责小杨哥用国鼎酒冒充五粮液,涉嫌欺骗消费者。近段时间,一款西梅汁被海关总署点名,而这款西梅汁,在小杨哥直播间先后上架了两次。 可能受系列事件影响,在鞭牛士发布的抖音直播2月达人带货榜TOP20,常年稳居带货榜单前列的小杨哥受此掉榜了,甚至旗下的三只羊网络直播矩阵也没有账号入列。 据了解,自鞭牛士从2023年6月推出直播带货月榜以来,小杨哥均在榜单行列,其旗下三只羊网络也有多个账号入选。比如,去年8月的抖音直播带货榜中,疯狂小杨哥以及小杨哥公司旗下的三只羊网络分别拿下了榜单的第三和第四,销售额超过5.6 亿元。 图源·鞭牛士 前后这种巨大差别不禁让人怀疑,小杨哥的带货能力是不是“神奇消失”了?掉队了? 不少人评论称,这可能与春节假期有关。实际上,春节期间,董宇辉和与辉同行团队休息了十来天,但仍然高居该榜单第二。带货榜一的“董先生”,已连续3个月进入月榜前三。由此可以看出,抖音带货竞争的激烈,不进则退。真可谓“铁打的抖音,流水的一哥”。 此外,小杨哥直播带货表现不佳还与其直播的频次下降有关系。 此前,小杨哥在直播时就玩笑式的问他的徒弟,如果我有一天选择退网呢?这引得徒弟们一脸错愕。 但他直播的场数实在在减少,从一周直播7场变为一周2场,再到最后的只剩周六一场。有数据显示,2月小杨哥直播6场,直播时长也显著降低。比如最新的一场直播,小杨哥也是早早的在黄金时间段结束。 青年企业家小杨哥 短视频不拍了,直播频次急剧减少,这背后除了退网这类粗暴的解释,更深层次的原因在于,小杨哥正在从网红主播向青年企业家转型。 这就意味着,小杨哥将会把更多精力放在幕后的企业经营管理上。 换句话说,现在看小杨哥,不要只盯着直播间的小屏幕了,他已经是公认的青年企业家,更多要往电视上的新闻屏幕看看。 小杨哥有这样的底气。从公开的新闻报道来看,三只羊集团从2021年成立以来,已经多次获得官方认可。比如: 2023年5月5日,合肥市委常委会扩大会议上,三只羊集团创始人兼董事卢文庆作为企业代表发言。2023年6月13日,时任安徽省委常委、合肥市委书记虞爱华前往三只羊网络公司,并召开现场办公会,8家平台企业负责人作了发言。 2024年2月18日,安徽省政府在合肥召开创建一流营商环境暨推进民营经济高质量发展大会,对100家安徽省优秀民营企业和100名安徽省优秀民营企业家进行了表彰。其中,合肥三只羊网络科技有限公司在列,卢文庆也出席了当天的活动。 2024年2月21日,安徽省委书记韩俊在合肥市调研现代服务业和民营企业发展情况,其中一家就是三只羊。在调研中,韩俊实地察看三只羊企业招商部,并深入直播间了解带货情况。据安徽卫视报道,知名主播“小杨哥”全程陪同调研并与省委书记韩俊当面交流。 事实上,从拍摄搞笑短视频走红,转型电商带货,再到成立三只羊网络,小杨哥已经悄悄扩展了自己的商业版图。截至目前,张庆杨(疯狂小杨哥)和张开杨(疯狂大杨哥)共同持股的合肥领头羊文化传媒有限公司实控企业超50家。小杨哥直接或间接持股的十余家企业,已成为合肥当地直播电商的龙头企业。 其 旗下矩阵账号超过300个,垂直账号已经高达7000多个,千万级账号已经超过10个。 去年小杨哥称公司每个月发工资超5000万元,登上微博热搜。同时合肥在线报道,2022年,三只羊网络实缴税收2亿元。2023年一季度,三只羊网络营业收入3.5亿元,较上年同期增长60倍,预计全年平台销售规模达150亿元,业绩超过大多数上市公司。 值得一提的是,小杨哥团队蹚出了一条直播带货产业链共荣共生的路子:直播切片带货。 小杨哥曾发视频称,自己每周虽然只直播一场,但通过切片账号每日浏览量能有三四亿。 根据三只羊官方披露数据,2022年共有11000多人获得三只羊网络的切片授权,人均收入17000元。按照行业推算, 小杨哥靠直播切片的年分成收益也已破亿元。 客观上,直播切片带货也解决了上万人的就业问题。 除了国内市场,小杨哥还把目光投向海外。据了解,今年1月10日,三只羊网络与新加坡本地达人合作进行了首场带货直播,该场直播创下了TikTok电商板块在新加坡地区的新纪录,登上新加坡本地榜第一。按照计划,三只羊网络还将在马来西亚进行第二场海外直播。 此外,小杨哥还积极参与官方组织的助农带货,多次进行惠农、助农直播,帮助了数以万计的基层农民朋友和中小企业主。在公益捐款上也作出诸多善举。比如去年甘肃省临夏州积石山县地震,小杨哥捐款1200万善款及物资驰援震区。 这些都已经超出传统意义上对流量网红的定义范畴了,小杨哥在复刻前辈薇娅的路子,甚至走得更稳更远。 三只羊还离不开小杨哥 如今,对合肥这座城市来说,小杨哥和“三只羊集团”已经是一张重要的名片。在“小杨臻选群星演唱会”开场和结束环节,小杨哥用了大量篇幅介绍合肥,甚至向观众发出邀请:“如果你期待与优秀的人同行,合肥八方人才风华正茂,合肥想人才之所想、之将想、之未想,让大家有用武之地,无后顾之忧”。 但不可否认的是,三只羊网络还离不开小杨哥这个流量黑洞的照拂,除了更多出现在旗下达人和垂类直播间,为他们引流。小杨哥还将流量挖掘的渠道瞄准更广阔的线下市场。 去年11月,小杨哥斥资3000万举办了“小杨臻选群星演唱会”,明星阵容强大,包括朴树、詹雯婷、筷子兄弟、黄贯中、Twins、Vitas、张信哲、汪苏泷等。其最直观的收益来自账号涨粉。 有数据显示,通过这次的演唱会,抖音“小杨臻选”账号单日涨粉超410万,相比之前翻了一倍有余。“疯狂小杨哥”主账号也在这一天涨粉79万,达到1.22亿。 图源·三只羊集团 尝到甜头的小杨哥最新表示,将在今年五月,在合肥举办电音节。根据文化和旅游部公布的信息显示,此次电音节举办时间为2024年5月3日至4日,为期两天,场所为合肥骆岗公园。这对年轻用户来说,又是一大流量招牌。 相较于董宇辉“阿Q式”的回避热搜流量,小杨哥正在“去小杨哥化”的路上,为三只羊找到新的流量来源。 从在广州打拼的普通年轻人,到抖音直播带货一哥,小杨哥花了3年时间。从直播带货主播到成为一名企业家,小杨哥只花了两年时间。对于疯狂小杨哥兄弟来说,个人直播带货的数字已经不那么重要。 就像小杨哥在三只羊集团全球总部开业直播中,回应“全国第一网红”的称谓时表示,“我现在都不带干网红这些事的,现在默默地把公司做好就行了。”
这只是开始的结束
图片来源:图虫创意 当地时间2月15日,美国科技公司OpenAI、Meta和谷歌不约而同地选择在这一天发布了自己的新模型(OpenAI的Sora、Meta的V-JEPA、谷歌的Gemini Pro 1.5),这让本已高度“内卷”的AI市场的竞争达到了白热化的程度。 三款模型中,Sora可以根据文本生成远比过去同类产品惊艳的视频;V-JEPA虽然在视频生成上的表现略逊于Sora,但却号称应用了非生成式的世界模型;而Gemini Pro1.5作为一个多模态模型,其支持的上下文竟达到了惊人的1000万token(计算机运行中,文本处理的最小单位)。在如此集中的时间,AI技术竟然在三个不同的方向上取得了如此巨大的突破,实在令人惊叹。 在惊叹之余,一些老生常谈的问题又再次出现在了各大媒体。比如:这一场AI大战的终局会是如何?AI能力的突飞猛进,是否意味着“通用人工智能”(Artificial General Inteligence,简称A-GI)已经近在咫尺?在AGI到来之后,人类的命运又会走向何方? 这些问题十分重要,但是,如果我们对这些问题的讨论仅仅只是基于科幻式的想象,那么讨论本身也就会最终沦为空谈。相比之下,一种更为科学的讨论方式或许是:在思考这些新模型会带来什么影响之前,先从技术的角度弄清楚,这些模型究竟意味着什么。下面,我们就从这个理念出发,开始我们的探究之旅。 天空背后的秘密 尽管Sora、V-JEPA和Gemini Pro1.5都十分亮眼,但从原创性角度看,前两款模型的重要性似乎是更为突出的,因为它们几乎可以被视为是通向AGI的两种主要思路——生成模型和世界模型的最主要代表。Gemini Pro1.5虽然也非常出色,但它本质上是其前作Gemini Pro的升级,其突破性要稍逊一些。因此,如果要讨论新模型的影响,我们不妨将重点放在Sora和V-JEPA上。 那么,让我们先从外界关注度最高的Sora开始吧。从OpenAI公布的视频上看,这款以日文“天空”(空,そら)命名的模型表现确实非常突出:过去,文生视频模型通常只能生成几秒的视频,而Sora生成的视频则长达一分钟。不仅如此,它还可以在一定程度上呈现出因果关系和物理规律。比如,在一个视频中,画师下笔之后,纸上就出现了朵朵桃花;在另一个视频中,随着食客的一口咬下,原先完整的汉堡就缺了一角。对于类似的这些物体互相作用后改变形状的现象,过去的文生视频模型很难生成,而Sora却很好地实现了这一点。 出于维护其商业秘密的考虑,OpenAI在发布ChatGPT之后,就不再公布其产品的相关论文,这让完全破解Sora的秘密几乎成了不可能。好在OpenAI为Sora附上了一份简要的技术报告,对于了解技术概况,这份报告其实已经足够了。 按照报告,Sora在原理上可以被概括为“扩散模型+Transformer架构”的应用。 (1)扩散模型 说到扩散模型,相信很多人对这个词并不陌生。虽然这个模型的详细原理必须用数学公式才能说明,但简单来说,它可以被理解为一个降噪生成的过程。 喜欢看电视的读者想必都会有这样的经验:当电视信号遇到干扰时,原本的电视画面上就会出现一层不规则的雪花点。干扰信号越强,雪花点就越浓密。当干扰强到一定的程度,屏幕上就会只剩下雪花点。用数学的语言讲,这种在原本的图像上加入雪花点的过程就是“加噪”。 一开始,这种满是雪花点的画面会让人非常不适应。但只要看得多了,干扰的影响就会越来越小。即使电视屏幕上遍布雪花,人们也可以通过像素的运动,配合画外的声音,自动“脑补”出一幅幅清晰的画面。这样,他们的脑中就完成了一个“降噪”的过程。 为什么人脑可以开发出这样的“脑补”功能呢?归根到底,这还是一个训练的过程。当信号干扰不严重的时候,图形上的雪花并不多,这时人们可以很容易地结合先前的观看经验,联想出清晰的画面是什么样的。当人们对轻微干扰习以为常后,就可以进一步去适应更为严重的干扰——在脑中,他们可以先把被重度干扰的画面还原为轻度干扰,再将其还原为清晰画面。这样,只要观看经验足够,人们就可以在脑中训练出自动还原雪花点的功能。需要指出的是,在还原的过程中,额外信息的提示很重要。比如,面对一团模糊的雪花点,如果配上《敢问路在何方》,人们就很容易“脑补”出唐僧师徒四人跋山涉水的图像;而如果配上钢琴曲《Tom and Jerry》,他们“脑补”出的就可能是猫在追逐老鼠的场景。 上面这种从雪花点中“脑补”出图像的做法,我们也可以用AI来实现。具体来说,人们可以将大批的图片“投喂”给AI模型,然后再将这些图片“加噪”。机器通过将加噪前后的图片进行对比,就可以训练出从带噪的图片中还原出清晰图片的功能。当然,AI不可能完美复现出原图,只能根据它从样本中学习到的经验来尽可能对干扰进行修补。这时,它就已经在一定程度上具有了创作的能力。人们可以在此基础上不断加入更多的干扰,让模型从干扰中还原出图像的能力变得越来越强。最终,他们就可以得到一个能在完全由无规则雪花图上还原出图像的模型。由于还原的起点是彻底随机的,所以所谓的“还原”就变成了一种彻底的创作。要让AI明确应该往什么方向还原,就需要告诉它一定的提示词(prompt)。其道理就好像我们要从遍布雪花点的电视中“脑补”图像,需要有画外音的帮助一样。 上述这个降噪还原的过程,就是扩散模型的基本原理。随着生成式AI的火爆,它已经得到了十分广泛的应用。像Mid Journey、Stable Diffusion等文生图模型,Runway、Pika等文生视频模型,本质上都是扩散模型的应用。 在Sora之前,虽然已经有了不少基于扩散模型的文生视频的模型,但这些模型生成的视频时间都很短,呈现角度也比较单一。之所以会出现这样的问题,很大程度上是由于其训练数据导致的。受算力等因素的限制,目前用来训练文生视频的数据主要是一些时长较短的视频,这就导致了由此训练出的模型只能根据这些短小的视频来进行外推,其“脑补”能力也就受到了很大的限制。如果要生成长视频,就需要额外采用计算量巨大且速度缓慢的滑动窗口方法,从经济角度看,这是得不偿失的。 那么,Sora又是如何克服这些困难的呢?其奥秘就在于它很好地将Transformer和扩散模型结合了起来。 (2)Transformer架构 得益于GPT模型的火爆,作为其基础架构的Transformer的大名也早已被人们熟知。对于语言模型而言,Transformer是具有革命性的。过去,语言模型一直面临着一个很大的困难,即所谓的“长期记忆难题”。我们知道,一句话究竟是什么意思很大程度上取决于其上下文。比如,当某人说“我想买512G的苹果”时,他究竟是想要买一个内存为512G的苹果手机,还是想买512克的苹果,就需要看这句话出现在什么语境之中。因而,至少在理论上,要理解一句话是什么意思,就需要对其所在的整个文本进行解读。对于计算机来说,这是非常麻烦的。因为这意味着在处理文本时,只能用一种串行的方式来逐字进行解读,而难以采用并行的处理办法,处理的效率会被锁死在一定的水平。 如何才能打破这个瓶颈呢?一个思路是将句子拆分成一个个的词,分别识别出它们的含义。在完成了这些工作后,再将各词的意思整合起来,就可以得到这个句子的意思。但是,怎样才能保证对词的含义识别精准呢?那就要看一下它的相对位置。一般来说,距离一个词很近的几个词对其含义的影响是最大的。比如,如果在“苹果”这个词的附近,出现了“手机”、“芯片”等词,那么它多半就是指手机;而如果在它的附近,出现了“果汁”、“榨汁机”等词,那么它指的就多半是水果。对于一个特定的词,临近词对它的影响大小是不一的。比如,其前一个词对其含义的影响权重为0.5,其后一个词对其含义的影响为0.3。在AI中,这个权重就叫做“注意力”(attention)。通过对大样本数据的学习,AI模型可以对每一个词都给出一个完整的“注意力”表格。这样,当它再面对一个词的时候,就可以根据其在语段中与其他词的相对位置很快地识别出其最可能的含义,而不用在读完整个文本后再得出某个词的含义。通过这样的处理,AI模型就可以实现对语言模型的并行处理,从而让其处理效率得到大规模的提升。所谓的Transformer模型,就是基于以上注意力机制设计的机器学习架构。 (3)Sora是怎样工作的 虽然文生视频并不同于语言处理,但它们两者也有很多相似之处。在某种意义上,人们过去采用的文生视频技术有一点儿类似早期的语言处理,大致上是从一个画面出发,逐步根据初始的图去扩展后续的画面。很显然,这样的效率是相当有限的。怎么才能对其进行改进呢?一个现成的思路就是仿照Transformer的思路,将提示词的文本拆分,从每个词中去识别出相关的信息,并根据这些信息去标识出视频需要的空间和时间信息,即视频需要在什么时候出现什么样的图像。基于这些信息,再调用扩散模型来生成所需要的画面。在Sora当中,采用的就是这个思路。 具体来说,Sora在训练过程中会先用视频压缩技术将大量的视频材料进行压缩。经过这一步操作,庞大的视频资料就被还原成了一堆矩阵的特征值。尽管它们看起来杂乱无章,但其中却包含了关于视频变化的最重要信息。通过机器学习,模型可以将这些特征值与标识视频的文字建立起联系。这样一来,当它再看到某一个词的时候,就会猜出这个词意味着应该在哪个时间点出现怎样的画面。在Sora的技术文档中,这种标识时空信息的快照被称为“时空补丁”(Spacetime patches)。在根据文字生成视频的过程中,Sora并不和早期的文生视频模型那样直接生成视频,而是先根据提示词翻译成一系列关于时空的信息。比如,“玫瑰逐步绽放”就可能被其解读为“在视频第一帧,出现一朵玫瑰;在下一帧,这朵玫瑰的花瓣长大了一些……”当然,这些信息都是由“时空补丁”来表现的。当有了这一系列的“时空补丁”后,就相当于为有待生成的视频搭起了框架。随后,再利用扩散模型,就可以在这些时空补丁的提示之下完成每一帧的图像。而这些图像加总在一起,就构成了完整的视频。 当然,为了保证生成视频的质量,Sora还在训练时对模型进行了很多的限制。比如,为了保证视频不违背物理规律,它专门植入了相关的知识图谱。但大致上,我们可以将Sora理解为扩散模型和Transformer结合的产物。 (4)或许算力才是重要的 通过以上介绍,我们可以看到,至少在原理上,Sora并不复杂。由于我之前对生成式AI下过一些功夫,所以在阅读它的技术报告时,也基本没有遇到什么困难。 不过,在读这份报告的过程中,我却总感觉报告中阐述的技术原理和之前读过的某篇论文十分相似。很快,我就在报告的参考文献中找到了这篇文章,就是OpenAI团队在去年3月发表的《基于Transformer的可扩展扩散模型》(Scalable Diffusion Models with Transformers)。有很多网友也在第一时间发现了这一点,为此,一些人还将这篇论文的作者之一——谢赛宁,误认为了Sora的主要开发者之一,最后闹得谢赛宁本人不得不亲自出来辟谣。 在这篇论文中,早已提出了用Transformer架构来运行扩散模型的思路,即所谓的DiT。从原理上看,这几乎和Sora技术报告中公布的信息如出一辙。然而,从这篇论文给出的案例看,当时用DiT生成视频的效率和质量都完全无法和今天的Sora相比。那么,问题出在哪儿呢?凭借我个人的知识,实在是百思不得其解。直到几天之后,我在微信上看到了著名AI科学家李沐的一段评论,才恍然大悟。 李沐认为,Sora和一年前的DiT的关系,可能就好像GPT-3和GPT-2的关系。从模型的角度看,GPT-3和GPT-2并没有本质的差别,但不同的是,GPT-3的参数量要比GPT-2大得多,并且在训练GPT-3的时候,投入的算力也要比训练GPT-2时高出百倍。所谓“大力出奇迹”,很多研究已经表明,似乎正是在这种海量算力的投入导致了“涌现”现象的发生,让模型的性能出现了质的变化。有消息透露,Sora在训练时投入的算力也比之前训练几个DiT模型时高出了几百倍。如果这个消息属实,那么我们就可以猜想,此次Sora表现出的卓越性能其实也是涌现的后果——或许,这就是隐藏在天空背后的秘密。 生成模型还是世界模型? (1)Sora真的懂它在干什么吗? 在对Sora模型进行了深入分析之后,我们可以得出结论:虽然Sora的性能确实比之前的模型有了巨大飞跃,但是,这种飞跃并非源自于原理上的变革,而是由巨大算力堆出来的另一个工程奇迹。 事实上,在最初的一轮热潮退去之后,不少更为中立的分析都表明,先前人们对Sora的革命性评价似乎有些过于高估了。比如,虽然根据Sora发布的画面,它已经拥有了一定的因果识别能力,但这种表现似乎更像是来自开发者对其事先设定的知识图谱,而并非来自模型自身能力的改进。正是因为这个道理,所以不少用Sora生成的画面还会出现很多不合逻辑之处。比如,在一个老妇人吹生日蜡烛的视频中,面对吹过的气流,蜡烛上的火焰竟丝毫没有受到影响;而在另外一个投篮的视频中,篮球竟在穿过篮筐之后发生了爆炸。很显然,这些情况在现实中是不可能发生的。这只能说明Sora模型本身还并没有能力自行判断出这些简单的道理。只要人们没有人为地植入知识图谱来进行引导,它就可能犯错误。如果这些判断是正确的,那么Sora模型所代表的技术路径可能就不那么乐观。因为在现实中,经验的规则是无穷无尽的,人们几乎不可能有能力将所有的规则都设定到模型当中。 相比于中立的评论,以图灵奖得主、Meta首席人工智能专家杨立昆(Yann LeCun)为代表的一些专家对Sora的批评则更为激烈。在Sora发布之后,他就在社交媒体上对其进行了痛批,并断言Sora代表的技术路径必定失败。在圈外人士看来,杨立昆的这个批判完全是无理取闹,甚至多少有点儿有辱斯文。然而,圈内人对杨立昆的这个态度早已是见怪不怪了。从ChatGPT横空出世开始,他就在多个场合表示GPT模型,甚至更广义上的生成模型都不会是通向AGI的正确道路,最终注定不能成功。 (2)世界模型 那么,杨立昆眼中的AGI会通过怎样的技术路径实现呢?他给出的答案是“世界模型”(World Models)。 所谓“世界模型”,通俗地说,就是一种让机器能够像人类一样对真实世界有全面而准确的认知的模型。这个概念最早来自于德国的人工智能专家于尔根·施密德胡伯(Jürgen Schmidhuber)。 在阐述“世界模型”的开创性论文中,他用了一副漫画来对这类模型的基本理念进行刻画。在漫画中,一个人正在骑车,而在他的脑海中,也在想象着一个骑车的人。事实上,这就是人们在日常生活中的行动方式。正所谓“意动形随”,我们在做出某个动作(不包括下意识的动作)之前,都会先在脑海中对这个动作进行模拟,然后再根据模拟的后果来行动。显然,要实现这一切,人们就必须对其所处的世界有相当的了解。类比到AI的语境中,这就要求在AI智能体中嵌入关于外部世界的内部模型,并以此来驱动其行为。 世界模型有何优势呢? 第一,从理论层面看,它才是可以真正做到理解事物的模型。尽管现在的很多大模型在功能上已经非常强大,可以在很大程度上模拟世界的运作,但从其运作机制上看,它们并不能真正地“懂”这个世界。虽然它们可以顺畅地和用户进行交互,并根据用户的要求完成各种任务,但它们所生成的内容本质上是基于和问题之间的概率关联产出的。例如,当你向ChatGPT说“你好”时,它会礼貌地回敬你一句“你好”,这让它看起来就像一个有礼貌的老伙计。但从底层程序看,它其实并不懂这个回应的含义,只是由于它从先前学习的数据中发现,人们在被人问好时会大概率选择以“你好”作为回应。在很多AI研究者看来,想要真正达到AGI,既需要“知其然”,更需要“知其所以然”。 第二,与生成模型相比,世界模型可以用更小的成本进行训练。我们知道,模型的训练是需要耗费大量的资源的,尤其是在训练AI去完成各种任务时,就需要让它不断重复完成这个任务。比如,要训练一个文生图模型,就需要让它不断地生成图片,再对这些图片的毛病进行纠错;要训练一个能自动打游戏的AI,就需要让它不断地打游戏,然后根据每场的得分状况进行复盘。但是,这样的训练都是必须的吗?对比一下人类的学习,就会发现情况可能并不是这样。以学习写作为例,我们当然需要写作一定量的文本,但在我们已经窥得一定的写作门径之后,在多数时候就未必把文章真的写出来,而只需要在脑中对文字不断地进行打磨。所谓的“打腹稿”,就是这个意思。容易看到,这种学习方式是要比不断写成文字要更为经济和高效。 在世界模型的倡导者中,类似的过程被冠之以一个更为通俗的名字——“做梦”(dreaming)。当一个世界模型通过对样本数据的学习,总结出了一定的规律性知识后,它就可以抛开样本,通过“做梦”的方式来进行学习,从而让模型的效率得到提升。举例来说,施密德胡伯就在其论文中训练过一个会打《毁灭战士》(Doom)游戏的AI智能体。他首先对这个智能体输入了游戏的相关规则,并让其通过游戏训练建立了一定的游戏经验。这样,他就让这个智能体初步建立了关于游戏世界的认识。然后,他让智能体基于这些知识,通过“做梦”的方式进行训练。最终的测试结果表明,这确实可以让智能体获得不错的游戏表现。更为重要的是,其训练成本和训练时间都要比让智能体不断打游戏低得多。 第三,相比于生成模型,世界模型更易于调试,也可以做更好的外推。为了理解这一点,我们可以考虑一个例子,相信大家小时候画过画,比如,我小时候就特别喜欢画各种昆虫。然而,当我把画的虫子拿给大人看时,大人们经常会指出,我画的虫子的腿的数目不对——昆虫的腿有六条,但我有时会画成八条,有时会画成十条。在多次被大人指出这个错误后,我通过对昆虫进行了大量的观察,才终于悟出了原来昆虫的腿应该是六条,后来再画时,就再也没有画错昆虫的腿数。现在回想起来,我这个观察昆虫、自己总结规律,然后将它们画出来的过程,其实就类似于现在生成式AI的运作过程。虽然这也可以让我最终总结出正确的规律,“生成”出正确的内容,但这个过程是非常漫长和低效的。并且,这种基于经验和概率的知识非常容易出错。比如我在领悟出昆虫应该有六条腿这个道理后,就曾把蜘蛛画成六条腿。因为在我看来,蜘蛛和昆虫太像了,既然原来的昆虫都是六条腿,那么它也应该是六条腿。到后来上了学,学了生物的分类知识,才知道蜘蛛和昆虫并不是同类生物这些知识。如果将这个过程用AI的语言表示,那就是因为我已经掌握了世界模型,并用它来替代了原本的生成模型。 (3)Meta的世界模型 由于世界模型有上述的诸多优点,不少学者认为它才是通往AGI的正确道路。在主张世界模型的学者中,杨立昆就是最为坚定的代表。在实践中,他不仅极力对生成模型这种他眼中的“异端”大加批判,而且利用其在Meta的地位大力推动非生成式的世界模型的开发,并已经取得了一定的成就。 比如,在去年6月,杨立昆就带领其团队发布了一款名为I-JEPA的图形生成模型。所谓I-JEPA,是“基于图像的联合嵌入预测架构”(Image Joint Embedding Predictive Architecture)的简称。根据随模型发表的论文,I-JEPA模型放弃了被广泛采用的生成模型思路,转而用一种类似婴儿的方式来认识和理解世界,并基于这些学习到的认识来指导内容的生成。如前所述,生成模型的机理是将文字和像素之间的特征加以对应。举例说,如果要生成“一只正在晒太阳的大橘猫”,它们就需要先把这段文字进行拆解,找到每一个词最可能对应的像素颜色和位置,然后根据这些信息来拼接出一副图画。 然而,对于人来说,想象的过程并不是这样的。在看到“一只正在晒太阳的大橘猫”这段文字后,人们在脑海里首先浮现的是一只猫的形象,然后在这只猫的身上填上颜色,再调整其形态,最终形成对应的图像。类似的,I-JEPA模型在生成图片时,会根据它所理解的要求,将每个文字对应出一个抽象的形象,比如“猫”对应出一个猫的形象,“橘”对应出橘色,然后将这些信息组合起来,生成相关的内容。容易看到,相比于生成模型,I-JEPA模型的运作机理其实是更接近人类的,而这也是杨立昆本人最为自豪的。 在I-JEPA发布之后,杨立昆和Meta团队又进一步对视频生成模型进行了研发。本文开头提到的V-JEPA模型(它是“基于视频的联合嵌入预测架构”即Video Joint Embedding Predictive Architecture的简称)就是其最新结果。如前所述,客观上V-JEPA模型的表现也非常不错。但正所谓“不怕不识货,就怕货比货”,不知道是否是出于巧合,这个模型的发布时间正好选在了和Sora同一天,而Sora在视频生成方面的表现显然要比它更优。这款被杨立昆寄予厚望的模型不仅没有获得预想的好评,反而成了被群嘲的对象。 面对人们的嘲讽,这位高傲的图灵奖得主显然被激怒了。他在社交平台X上回应道:“我从未预料到,那么多从未对人工智能或机器学习做出任何贡献的人,其中一些人在达克效应(Dunning-Kruger effect,一种认知偏差)上已经走得很远,却告诉我,我在人工智能和机器学习方面是错误、愚蠢、盲目、无知、误导、嫉妒、偏见、脱节的……” 从这番回应可以看出,以杨立昆为代表的世界模型支持者并没有因当前的挫折而放弃自己的主张。恰恰相反,这可能会更加激发他们的创新动力,沿着他们相信的道路加速前进,从而让这个技术路线实现更多的突破。 坦然面对“奇点” 在通往AGI的道路上,生成模型和世界模型究竟谁会最终胜出?坦白说,在现在这个阶段,我们还很难得出结论。事实上,在AI发展史上,已经上演了很多次落后技术路径的赶超。不过,无论是哪种模型胜出,AGI的到来似乎都已经是非常近的事情了。 在2005年出版的《奇点将近》一书中,库茨维尔(Raymond Kurzweil)曾预言人类将在2045年前后迎来“奇点”,届时AI的智能将全方位超越人类。而在最近即将出版的一部新书中,他已经将这个时间提前到了2029年。从目前技术发展的趋势看,这个预测似乎还算是比较客观的。而这对于人类而言,确实不算是一个好消息。 幸运的是,我们还有五年左右的时间。即使“奇点”到来无法避免,至少我们还能利用这段时间来为即将到来的新时代做一些准备。在这个过程中,我们有很多需要做的,而在这些待办事宜中,有两件是特别重要的: 第一件是要重新挖掘人本身的价值。通过前面的技术拆解,我们已经看到,虽然AI模型看似强大,但归根到底,它们都是由一些十分基本的原理支配的。支配生成式模型的是概率原理;世界模型虽然可以在一定程度上了解规律,并按照规律“做梦”,但它的想象空间在本质上还是受限于训练数据和预先设定的规则。相比之下,人的想象力则要自由得多。可以预见,当人的其他能力被AI赶超后,这种自由的想象力将会变得更为宝贵。当然,除了想象力之外,像情感、意志力、决断力等,也都是AI所不具有的。关于这些品质,我们应该更为珍惜。 第二件是要教好AI。无论AI会是以生成模型,还是以世界模型来实现AGI,它们的行为特点都在很大程度上受制于人们对其的输入。人们给它学习怎样的数据,设定怎样的规则,都会最终影响AI的行为。遗憾的是,现在我们看到,很多人出于各种目的,将暴力、种族歧视、极端思想等教给了AI,并在很大程度上带偏了AI的价值观。很显然,这并不是我们愿意看到的。 或许,“奇点”即将到来,但这绝不是人类的结束,甚至也不是结束的开始,这只是开始的结束。我相信,只要我们准备得当,人类必将会在AI的帮助下,迎来一个更美好的新时代。
二次元手游大厂做了个买断制单机,结果被人喷成了“赎罪券”
自 “ 大二游 ” 时代以来,国内诸多大厂纷纷下场并且折戟沉沙,能得到玩家们认可的二游厂商始终就那么几个,鹰角作为国内二游先驱者,也是其中之一。 在同行们都在做 F2P 类型的手游赚得飞起时,鹰角却宣布自己要做一个买断制单机手游,确实有点儿逆版本了。 不过鹰角网络确实没在开玩笑,立项打磨四年之后,《 来自星尘 》终于上线了。 关注它的差友可能都知道最近的节奏,《 来自星尘 》的成品画质、建模、文案、引导等各方面都有着不小的问题。 它也因此被很多玩家戏称为 “ 信仰债券 ” ,给那些买了它的鹰角粉丝们一记重拳。 有玩家说鹰角之所以没有大规模宣发,是因为知道游戏烂完了选择秘不发丧。 游戏里的各种角色也被做成了梗图大肆宣传。 甚至在官方道歉之后,又出来一个 “ 觉醒波工作室 ” 再度道歉,被玩家认为是在进行 “ 切割 ” 。 本着没玩过就没资格评价的原则,哪怕它风评极差,小发也花了 68 买了并且进行了一波试玩。 以下就是我个人的主观游玩感受。 《 来自星尘 》是个线性剧情的单机游戏,整体的通关时间大概在 20 小时左右,就体量而言算是还可以。 它的主要玩法就是让玩家跟随剧情深入游戏,进而通过锻造莱拉键( 属性强化系统 )、解锁同轨、完善自身的技能搭配,最终挑战一个个 BOSS 。 看上去什么 “ 莱拉键 ” 、“ 同轨 ” 之类的说法很高大上,实际就是谜语人,也没交代这名字的来历,就是把别的游戏的天赋、觉醒系统之类的换了个名字罢了。 接着再讲讲画面,其实《 来自星尘 》的概念美术以及 UI 设计算是很不错的,载具、建筑的外观设计都很不错,称得上精品。 但在实际游戏中,画质确实非常拉胯,拉近之后那些山体的贴图就好像是非常廉价的公开素材包的拼凑,毫无质感可言。 建筑的内部则是非常空,没什么细节,只是起到了增加跑路时间的作用。 至于人物建模,主角团的建模确实还行,但是路人 NPC 的脸在某些角度确实很残念。 这游戏的 UI 设计虽然不错,但是也有很明显的缺点,比如核心机制 “ 莱拉键 ” ,锻造界面是和人物界面割裂的,非常迷惑。 也就是说,哪怕你有足够材料,也不能在第一时间将它转化为战力。 作为同样提升人物属性或者战斗机制的东西,为啥不一块儿做到人物界面,反而要单独做出一块工作台呢? 但这些问题其实不是不能忍受。 这个游戏最大的一口屎,藏在文案里。 先不说上来就完全没有交代双女主的背景来历,对话中的内容看着很多然而实际上根本就没有信息增量。 这也就算了,它最大的问题是不说人话。 我从一开始玩的时候就发现人物的语言中时时刻刻给我一种非常别扭的感觉,开始还没意识到,到后面才发现这是特么的翻译腔。 网上也有人对比过游戏的中日字幕对比,发现它的日语配音和字幕就完全没问题,中文甚至连机翻都不如。 作为一款单机游戏,它的文字表现纯纯就是一坨,对于游戏进程和情绪的推进毫无助益,导致我到后来都懒得看了,我只的感觉只有一句话:希望你提高下自己的语言水平。 至于引导,游戏采用的是手游惯用的强制引导,就是你不按照它的高亮区域去点就无法进行下一步。 这种引导看似很贴心,然而鉴于它谜语人一样的名词设定和解释,导致看完照样啥也不懂,对于新手玩家而言还不如不引导呢。 说实话,哪怕像我玩了这么多年游戏,面对这样的引导也需要费一番功夫去理解,成本实在是太高了。 以上都是《 来自星尘 》最明显的缺点,它为数不多剩下的 “ 优点 ” ,大概也只有战斗设计了。 为啥要在优点两个字上打引号,是因为《 来自星尘 》采用的是回合制战斗。 回合制战斗其实应该算是一个 “ 毒点 ” 了,属于是旧时代残党。 《 来自星尘 》在开发时也明白这一点,于是在回合制的基础之上加入了即时战斗的元素。 比如可以通过人物之间技能特性的连携,进行多段合击。 以及动作游戏中常见的格挡机制和动作条设定。 每次成功格挡或者攻击,都可以削减敌人的动作条,一旦动作条空了就可以对倒地的敌人进行正义的群殴。 再加上技能的连携,可以打出小技能聚怪+大招清场的效果,几十连击外加上万的伤害,确实会非常爽。 但问题在于,这同时也成了它的缺点。 首先为了突出格挡的重要性,平砍的攻击伤害数值特别低,哪怕打出一套连招也犹如刮痧。 而且怪物伤害特别高,格挡成功还好说,如果格挡失败一个角色也吃不了几下小怪的普通攻击。 回合制游戏为数不多的优点之一是可以比较放松地慢慢打,这样的设定则是让整个战斗过程都需要聚精会神。 其次遇到多只怪物的情况,哪怕有大招辅助,整个战斗过程也要持续三四分钟,而且任务的必经之路上必定会有小怪,无法躲避。 总结起来就是,虽然连招系统确实有策略性,也挺爽。 但是它没有避开回合制战斗拖沓的缺点,甚至还用格挡机制让休闲玩家的体验变得更加糟糕了。 只能说,务实一点,把回合制游戏的理念去搞搞懂先吧。 不然人家 P3R 一样也是回合制,为啥人家就是好评如潮呢? 最后,国产游戏厂商能在手游上尝试做买断制单机这种尝试,我个人觉得是很有勇气也很值得敬佩的。 可这不意味着你可以仗着自己是 “ 国产 ” 来糊弄玩家。 希望鹰角之后能多出些更新,把游戏体验给改得好一点,不然真的有点儿对不起玩家们了。 虽然说我会笑话有些人去苍蝇馆子里花 648 还吃得不好,吃得不饱。 但这不代表我花 68 买一坨屎吃还必须笑着说好吃,对吧? 撰文: 小发 编辑:面线&莽山烙铁头 封面:焕妍 图片、资料来源: 《 来自星尘 》
美法案要求字节跳动在165天内剥离TikTok 官方回应
TikTok 凤凰网科技讯 北京时间3月6日,美国两党国会议员在周二提出了一项法案,要求字节跳动公司剥离对旗下短视频应用TikTok的控制权,否则就禁止应用商店上架分发TikTok。TikTok对此回应称,该法案是在践踏美国人的第一修正案权利,剥夺小企业赖以发展的平台。 这项两党法案由美国众议院共和党籍“中国问题特设委员会”主席迈克·加拉格尔(Mike Gallagher)、该委员会民主党领袖拉贾·克里希纳莫提(Raja Krishnamoorthi)以及17名议员提出,将给予字节跳动165天的时间剥离TikTok,以避免该应用被禁。该法案还将创建一个程序,使得美国总统能够对那些由总部或注册地位于某些国家的公司控制的社交媒体应用采取行动。 美国议员此举可能对美国大选产生影响。美总统拜登的连任竞选团队已经开始使用TikTok,试图与年轻选民建立联系,尽管白宫此前曾支持一项法案,该法案将赋予商务部封禁TikTok等应用的权力。上个月,拜登竞选团队在超级碗当天发布了第一个TikTok视频,其中包括拜登的问答环节,这个视频获得了超过1000万次的浏览量。拜登竞选团队发布的大多数视频都集中在攻击前总统特朗普的心理健康和共和党的极端主义上。 TikTok对此回应称:“无论提案人如何掩饰,这项法案都是一项彻头彻尾的TikTok封禁令。这项立法将践踏1.7亿美国人的第一修正案权利,剥夺500万小企业赖以发展和创造就业的平台。” 此前,美国一些州也在试图禁止TikTok。去年,蒙大拿州州长首次签署了一项法律,禁止应用商店允许在该州下载TikTok。不过,TikTok以违宪为由胜诉,阻止了这一禁令的生效。目前,蒙大拿州正在对这一裁决提起上诉。另外,TikTok已被美国、英国、加拿大和欧盟的政府设备排除在外。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
传奇兄妹挑战奥特曼,全球最强AI大模型一夜易主
原创|Jaden 编辑|Cong 在当地时间的周一,Anthropic发布了一组Claude 3系列大模型,称其功能在各种基准测试中均优于OpenAI的GPT4和Google的Gemini 1.0 Ultra。 在模型的通用能力上,Anthropic称Claude 3系列“为广泛的认知任务设定了新的行业基准”,在分析和预测、细致内容的生成、代码生成以及包括中文在内的非英语语言对话方面,显示出更强大的能力,在任务响应上也更及时。并且允许用户根据具体的需求选择不同的解决方案,达成智能、速度和成本的最佳平衡。 此次Claude 3一次性发了三个模型:Claude 3 Haiku、Claude 3 Sonnet与Claude 3 Opus,能力从低到高,能让客户有更多选择。为了更直观地看不同模型的特点,官方贴出了Claude 3模型与多个能力基准相当的的同行模型的比较: 从这个对比上可以看到Claude在多项AI系统常用评估标准能力中的领先。三个模型中最强的Opus,所有能力皆表现优异,尤其是在研究生级别专家推理(GPQA)、数学、编码等赛道,算得上遥遥领先,完全碾压GPT-4,以及Gemini 1.0 Ultra。 不过,在关注技术领先性之外,此次Claude3的发布还有哪些值得思考的亮点? 01 出走OpenAI的分歧者 Anthropic再次重点强调了Claude大模型的安全性,这也是Anthropic的价值观。提到这一点,就不得不说Anthopic的创立。 Anthropic的创始人Dario Amodei和Daniela Amodei兄妹俩,二人原本都是OpenAI的员工。在OpenAI刚刚成立时,原来在Stripe担任CTO的Greg Brockman加入OpenAI后,先是从Google将Dario挖了过来负责AI安全,随着OpenAI的发展,Dario一路做到OpenAI研究副总裁的位置。 接着Brockman将妹妹Daniela也从Stripe挖到了OpenAI,Daniela同样也是做到了OpenAI安全和政策副总裁的位置。 兄妹俩是西方社会非常典型的理想主义者,尤其是妹妹,一直关注穷人、腐败、地球环境等等全球议题。他们加入OpenAI的原因,除了Brockman的原因,最重要的是,当初OpenAI的定位是开源的非营利机构,目标是要为人类构建安全的AGI。 不过,随着马斯克的离开和随后微软的加入,OpenAI的定位和价值观都开始发生变化。Dario和Daniela,以及OpenAI的很多员工开始与Altman的理念发生分歧,后来兄妹俩,加上曾在OpenAI负责GPT-3模型的Tom Brown一共7个人从OpenAI离开,并在2021年1月成立了Anthropic。 Anthropic的意思是“与人类有关的”,从名字就可以看到Anthropic的目标和愿景。Amodei兄妹一直强调,他们的团队有着高度一致的AI安全愿景,创始团队七个人的共同特点是重视AI安全,包括语言模型的可解释性、可控可靠,想让模型更安全,更符合人类价值观,目标是“建立有用、诚实和无害的系统”。 这些话术听上去并不陌生,因为这就是OpenAI最初广为人知的愿景的2.0版。但在卖身微软后,商业变成了OpenAI的第一要义,加上对于AI风险不加节制的态度,和宫斗后组织结构上的巨大变化,也让OpenAI和Altman的形象逐渐变得负面。 虽然Anthropic的成立时间要比OpenAI晚很多,但Claude的发布时间并不比ChatGPT晚多少,甚至开发完成的时间比ChatGPT更早。根据外媒的报道,Claude之所以没有在第一时间对外发布的最重要原因,是因为Amodei兄妹担心安全问题,认为还需要时日,确保模型安全后,才能真正向世人发布。这也给了ChatGPT和OpenAI率先引发全球关注的机会。 不管怎样,目前Claude已经成长为ChatGPT最大的对手,即便是Google,以及作为OpenAI发起人马斯克的大模型,与GPT4和Claude3还是有一段距离的。 02 安全对策:宪法AI技术 从成立之初,Anthropic就有专门的AI安全团队,专门负责降低虚假信息、生物安全滥用、选举干预、隐私等方面的风险,尽可能增强安全性的透明度。 Amodei兄妹曾经提到现有的大型语言模型“会说一些可怕、有偏见或不好的话”,比如教用户自杀或杀人,种族主义或性别歧视等等,AI安全研究需要降低甚至排除它们做坏事的可能性。 为此,他们在Claude训练中引入了一种叫做“宪法AI(Constitutional AI,CAI)”的技术。根据Anthropic的官方解释,在训练过程中,研究人员会定义一些符合人类公序良俗的原则来约束系统的行为,如不得产生威胁人身安全的内容,不得违反隐私或造成伤害等。这些原则包括联合国人权宣言、Apple服务条款的一部分、Anthropic的AI研究实验室原则等等。确保为大模型提供正确的价值观。 当然,和世界上任何一种号称要秉持公序良俗的大模型价值观一样,这些原则的选择完全是主观的,并且一定会受到训练它的研究人员的影响。Anthropic也承认这一点,但也表示绝对的公平、正确的价值观肯定是不存在的,只能是尽可能纳入更多元的文化和价值观。 该技术的关键在于,研究人员会先训练一个价值观正确的AI,再用它监督训练其他AI,通过AI模型之间的互动与反馈来优化系统,而不是人与模型的互动。该方法被称为基于AI反馈的强化学习(Reinforcement Learning from AI Feedback,RLAIF),理论上对人类更加可靠与透明。 该技术一定程度上牺牲了语言生成的自由度,但理念无疑却是比较受欢迎的,毕竟如今全球对AI的警惕也是越来越高,以马斯克为首的很多人都要求政府严格监管 AI,而且这种趋势也正在逐渐形成,各种法规也在陆续出台。 值得注意的是,RLAIF在提高大模型安全性的同时,其实还解决了生成式AI互动中的拒绝或回避的问题。 在RLAIF之前,行业训练生成式AI的方法都是“基于人类反馈的强化学习”(Reinforcement Learning from Human Feedback,RLHF),也就是我们熟知的外包人工给AI做人工筛选、标识、排序等等。但这种人工训练也会产生很多问题,比如人类普遍缺乏积极处理负面要求的能力,这就会导致AI在面对很多负面的问题,和人类的反馈一样,会说,我不知道,我不理解,或者干脆拒绝回答。 这也引发一个新问题,不能给出答案意味着没有用,但若是给出答案,又意味着有害,价值观不正确。这也是Anthropic提出RLAIF,并在此基础上训练出“宪法AI”的缘由。 在此次Claude3发布时,Anthropic解释说,此前Claude模型经常因为理解不到位,而不必要地拒绝回答。而这一次的Claude 3系列,已经在这方面取得了显著改进。在面对可能触及系统安全边界的询问时,大大减少了拒绝回应的情况。 如图所示,Claude 3模型对请求表现出更细致的理解,能够识别真正的危害,并且因为对上下文理解的增强,拒绝回答无害的提示的频率要要少得多。 03 OpenAI会收复失地吗 作为成立不过两年多的初创公司,眼下无论是规模、估值、收益等等方面,Anthropic都完全无法与OpenAI相提并论。不过,AI安全和人类的利益作为最大的亮点和卖点,这或许会帮Anthropic走出一条与OpenAI不一样的路。 虽然短期内难以全面超越OpenAI,但Anthropic的目标并不小,不包括前几轮的投资在内,Anthropic计划在未来筹集50亿美元,以与OpenAI竞争,并进入十几个行业。 Anthropic的投资人团队非常强大,包括Skype联合创始人Jaan Tallinn、Google、Salesforce、Zoom、SK和其他投资方。其中Google用3亿美元换取了该公司10%的股份。 这种关系被很多人看作最初微软和OpenAI之间的合作关系,即微软出资,用来支持OpenAI的研究。后来的事情大家也都清楚了,如马斯克的诉状中所说,GPT4本质已经变成微软的产品,OpenAI已经变成了微软的闭源子公司,OpenAI在开发且不断完善AGI以最大化微软的利润,而不是造福人类。 不过目前Google与Anthropic的关系,仍仅限于Google是Anthropic的技术支持和资金提供方,而且双方在大模型领域还是竞争对手。至于未来是否会朝微软和OpenAI的方向发生变化,一切都很难料。 Claude3发布后,立刻吸引了全球的关注,并被称行业称作“全球最强AI模型”,一夜之间就取代了GPT4的位置。有人在狂欢,为AI技术的飞速进步欢欣鼓舞;也有人为AI领域出现了另一个价值观正确、能制衡OpenAI的巨头而欣慰;当然,更多人将目光投向OpenAI,并且对GPT5寄予了很大的希望,认为GPT5极有可能收复失地,在大语言模型主战场扳回一局。 GPT5到底能有多强大?去年Altman在公开的演讲中,提到OpenAI已经开发出了比GPT4更强大、更难以想象的东西,远超人们的期待。 按Altman的说法,该模型的能力将彻底改变我们生活方式、经济和社会结构以及其他可能性限制。到时候所有人会发现眼下所发布的这些东西都一钱不值。 行业内很多人认为Altman所说的就是GPT5,当然,也有人认为他谈的是此前OpenAI宫斗中被意外暴露的Q*。其实,无论究竟是5还是Q*,都能证明OpenAI有极大的可能,已经在AGI上实现了突破。届时,Anthropic与OpenAI的竞争,就不是谁响应更快、准确性更高、记忆更好等等层面的比拼,而是不同维度的高下立见了。 当然,Anthropic也表示Claude3并不是它能力的极限,在未来几个月内还会不断发布对Claude 3模型家族的更新。届时,我们也只能以羡慕的心态隔岸看热闹,看看谁跑得更快了。
微软驳斥《纽约时报》侵权指控,称AI并非洪水猛兽
IT之家 3 月 5 日消息,微软公司针对《纽约时报》的侵权诉讼提交了驳回动议,试图驳回该案的关键部分。此前,《纽约时报》起诉微软及其合作方 OpenAI 未经许可使用其文章训练大型语言模型 (LLM),并指控其侵犯版权。 微软在文件中指责《纽约时报》散布“末日论”,称其夸大 AI 技术对独立新闻业的威胁。这一说法与 OpenAI 在 2 月份提交的类似动议遥相呼应,后者也试图驳回该案的若干重要指控。 与 OpenAI 一样,微软也指责《纽约时报》“炮制不切实际的提示词”,企图诱使基于 GPT 的语言模型生成与其内容相匹配的回应。微软还将《纽约时报》的诉讼比作好莱坞试图阻止录像机(VCR)这项“突破性新技术”,微软辩称,录像机并没有摧毁好莱坞,反而通过开拓新的收入来源,使其蓬勃发展。 微软认为,LLM 是人工智能领域的突破,公司与 OpenAI 合作,旨在“将这项非凡的力量带给公众”,因为他们 “坚定地相信 LLM 能够改善人们的生活和工作方式”。 据IT之家了解,微软要求法院驳回三项指控,其中包括一项指控其对用户使用基于 GPT 的工具造成的最终用户侵权行为负责,以及另一项指控其违反《数字千年著作权法》的指控。微软还希望法院驳回《纽约时报》指控其挪用时效性突发新闻和消费者购买建议的指控部分。例如,《纽约时报》在诉讼中辩称,如果用户要求 ChatGPT 查找其旗下网站 Wirecutter 的文章,它将失去收入,因为潜在买家将不再点击其推荐链接。但微软表示,这只是 “纽约时报担心可能会发生的事情的纯粹猜测”,并没有在其投诉中提供任何现实世界的例子。 《纽约时报》的首席律师 Ian Crosby 反驳称,微软“并未否认与 OpenAI 合作,未经许可复制了《纽约时报》的数百万份作品以训练其工具”。他表示,微软将 LLM 与录像机进行类比 “令人费解”,因为录像机制造商从未辩称需要进行大规模的版权侵权来制造他们的产品。 除了《纽约时报》的诉讼之外,OpenAI 和微软还面临着其他与训练 LLM 所使用内容相关的诉讼,很多作家都指控这些公司窃取他们的作品用于人工智能训练。
马斯克:AI已带来“芯片荒”,下一个是电力短缺
预言家马斯克最近又发话了。 这一次,特斯拉创始人兼首席执行官埃隆·马斯克把预言从人工智能带来的芯片短缺转向了电力短缺。 2月29日,在“博世互联世界2024”大会上,埃隆·马斯克远程接受了博世CEO斯特凡·哈同(Stefan Hartung)和董事长马库斯·海恩(Markus Heyn)的采访,就人工智能议题发表看法。 他指出,仅仅一年多前,业界还在为芯片短缺而苦恼,然而明年,全球或将面临电力供应的紧张局面,这可能导致无法满足所有芯片的生产需求。 回想去年此时,在一轮由Chat GPT掀起的大模型创业潮里,AI芯片成了抢手货,其中GPU最为明显。彼时,特斯拉掌门人马斯克曾经向整个科技行业发出警告,称巨大的 GPU 危机即将来临。他曾发表推文称,“如今不管是人是狗,都在疯狂购买 GPU。” 随着现象级AI产品Chat GPT的走红,马斯克当时的预言逐渐得到了验证。面对这样一场声势浩大的 AI 洪流,一时间,GPU成为了各大企业走向AI时代的唯一“硬通货”。而科技行业自此开始经受高性能GPU(特别是英伟达 H100)短缺的严重折磨。 芯片短缺之后,下一个会是谁? 马斯克在“博世互联世界2024”大会上表示,芯片短缺的情况可能已经过去,但人工智能和电动汽车正在以如此迅猛的速度扩张,明年全球将面临电力和变压器供应紧张的问题。 值得注意的是,这已经不是马斯克第一次试图引起业界对于缺电危机的更大关注。去年以来,马斯克已经多次在各个场合预警可能即将到来的电力短缺。 去年6月初,马斯克在美国得州奥斯汀举行的能源会议上预测,随着电动汽车消费的增加,2045年的电力需求较目前增加两倍。马斯克预测,到2030年,全球销售的新车中有一半将是电动汽车,同时称“我怎么强调都不为过,我们需要更多的电力。无论你认为需要多少电力,实际需要的都不止于此。” 当地时间7月14日,马斯克在xAI公司会议上预测,未来两年将经历从硅料短缺到电压器短缺,再到电力短缺,单位能源有效计算量会是最重要指标。 7月底,马斯克在太平洋瓦电公司PG&E主办的创新峰会上重申,美国2年内将爆发大缺电,到2045年美国的电力消耗将增加2倍,处理不当将阻碍人工智能(AI)、电动车发展机遇。他呼吁电企,尽快提升紧迫感,警告必须采取更快的行动。《华尔街日报》随后报道称,就像最近损害科技和汽车产业的全球芯片荒一样,缺电可能会阻碍AI的蓬勃成长,毕竟AI发展需要大量的能源。 图说:2月29日马斯克远程出席“博世互联世界2024”大会 来源:BOSCH 在最新的访谈中,马斯克谈到了自动驾驶汽车和人形机器人,并暗示了特斯拉下一步在电动汽车领域的发展——但他显然想传达最清晰的信息也向工业发出了可能的信号:继续清洁能源发电,并制造尽可能多的电力变压器。 马斯克指出,就我目力所及,我从未见过任何技术能比人工智能计算能力的发展更快,人工智能上线的算力似乎每6个月就会增加10倍。显然,这种情况不可能永远以如此高的速度持续下去,否则会超过宇宙的质量,但我从未见过任何类似的事情。这就是为什么Nvidia市值如此巨大的原因,因为他们目前拥有最好的神经网络芯片。淘“芯”热远远超过历史上所有的淘金热。 图说:随着人工智能热潮席卷华尔街,英伟达市值飙升至2万亿美元 来源:路透社 在回答斯特凡关于生成式人工智能在生产中的应用以及在支持生产方面我们可以有怎样的期待的问题时,马斯克回答道:“我认为我们确实正处于可能是有史以来最大的技术革命的边缘。你知道,据说有一句中国咒语:‘愿你生活在有趣的时代。’ 好吧,我们就生活在最有趣的时代。坦白说,有一段时间,人工智能让我有点沮丧。我想,‘好吧,他们会接管吗?我们会变得无用吗?’ 但后来,我和这个问题和解的方式是:我自问是否愿意活着看到人工智能带来的世界末日?我想,是的,我愿意看到。” 马斯克同时指出,人工智能算力的限制是可以预见的,事实上我在一年多前就预测到了这一点——一年多前的芯片短缺,神经网络芯片。然后,很容易预测,下一个短缺将是降压变压器(voltage stepdown transformers)。如果你从电力公司获得 100-300 千伏的电力,而它必须一直降压到 6 伏,这就是一个很大的降压过程。 图说:降压变压器 来源:electronicdesign 接着,马斯克讲了一个类似于中文里绕口令的段子。人们需要transformer(变压器)来运行transformer,因为在人工智能领域有一个叫transformer的东西,它是不同神经网络的结合体。这些transformer正在耗尽transformer(变压器)。 随后,他警告称:“那么,接下来短缺的将是电力。我认为明年,你会看到,没有足够的电力来运行所有的芯片。电动汽车和人工智能的同步增长,两者都需要电力,都需要变压器——我认为,正在创造对电气设备和发电的巨大需求。” 首图来源:bnnbreaking
微软将终止对Windows安卓子系统的支持,亚马逊应用商店关闭
IT之家 3 月 6 日消息,微软日前公布公告,适用于安卓的 Windows 子系统(WSA)和亚马逊应用商店将在 2025 年 3 月 5 日之后不再在 Microsoft Store 中提供。 从 2025 年 3 月 5 日开始,将不再支持 Windows 上的亚马逊应用商店以及所有依赖于 WSA 的应用程序和游戏。在此之前,仍将为客户提供技术支持。在 2024 年 3 月 5 日之前安装了亚马逊应用商店或安卓应用的客户,在 2025 年 3 月 5 日的弃用日期之前,将继续有权访问这些应用。 与此同时,亚马逊也发布通知。从 2024 年 3 月 6 日开始,亚马逊应用商店将不再提供 Windows 11 设备上的 Microsoft Store 下载服务。 2025 年 3 月 5 日之后,Windows 11 上的亚马逊应用商店和从它下载的任何应用程序将不受支持。 亚马逊表示,尽管发生了这样的变化,但亚马逊应用商店将继续在 Fire TV、Fire Tablet 和 Android 设备上提供支持。 据IT之家此前报道,微软于 2021 年 9 月宣布,允许 Epic Games、亚马逊等公司将其应用商店整合到 Microsoft Store,以便为第三方开发者提供更多选择。 微软称其致力于成为一个“面向开放平台的开放商店”,当应用管理自己的应用内支付系统时,Windows 系统的 Microsoft Store 不再要求应用开发者与微软分享收益。
炸场的Sora和冷静的同行
撰文|yuanyuan 编辑|翟文婷 Sora面世半个多月,这个深水炸弹的后续效应依然强烈。 Open AI 发布的这个文生视频模型,紧跟着 Google 发布 Gemini 1.5 的消息,让支持百万级 token 的 Gemini 黯然失色,帮助OpenAI在科技圈成功「抢 C」,一跃成为视频模型届的 GPT 3.5 时刻。 毕竟,当Runway、Pika 等同类视频模型的创作上限还在 10 秒左右时,Sora 已经能够生成 60 秒的精致视频,可以一镜到底、切换视角,无论是背景还是主人公的表情,都拥有丰富的细节。关于Sora是否会杀死剪映的舆论甚嚣尘上。 目前 Sora 还没有对公众开放,但昨天,已经有创作者拿到了测试资格,并发布了自己尝试的三个视频。 在「测评电子产品的年轻人」这个视频中,光影细腻,人物和置景真实,美中不足的是他的右手有六根手指。 此外,Sora 在理解物理时会遇到困难,特别是在腿部/行走方面。在 Sora 生成的小狗行走视频中,腿部经常交叉并合并在一起。 虽然 OpenAI 发布了 Sora 的技术报告,但其中并未涉及技术细节。 我们能知道的是,Sora 又是一次 OpenAI 式的典型胜利,是技术选型、训练数据、资源优化等各个环节的细节优化,组合成了一次效果超出预期的质变。就像 Sam Altman 之前解释为什么 GPT 会比其他的大模型更好,是因为 OpenAI 堆了「一百万个小技巧」。 去年年初,ChatGPT 发布后,海内外大厂争先恐后地发布文本大模型,热闹非凡,生怕落队;这次 Sora 发布后,只有海外版剪映、Stability AI 跟进发布了文生视频产品的测试版。 其他公司也许是暗中跟进,或是谨慎观望,除了网红李一舟蹭蹭热点,还没有谁站出来敢说,要做中国版Sora。 追,还是不追? ChatGPT 发布后,大公司和初创企业纷纷加入百模大战;现在 Sora 已经发布半个多月了,此前的盛况没有再次出现。 一周之后,Stability AI 开放了Stable Video的公测,但或许是服务器爆满的缘故,功能不够稳定。生成的视频最值得称道的是清晰度,但仍然没有大幅度的视角切换,画面主体也没有太多动作,只有背景动了起来,给人的感觉仍然是「会动的图片」。 字节剪映海外版也上线了文生视频的功能,同样反响不佳,主要是因为等待的时间过长。网友测试发现,一个视频的生成要等待 1800 分钟。 有人工智能算法工程师分析,同等参数的视频模型,比大语言模型所需要的算力要多几十倍。业界流传,Sora 的参数规模在 10B 到 30B 之间,其所需的算力或许与千亿级的大语言模型差不多。 有趣的是,腾讯和阿里巴巴虽然没有跟进视频模型的发布,却纷纷第一时间在自己的技术账号上发布了对 Sora 的技术拆解;其中,阿里巴巴达摩院所发布的文章题目叫做《复刻 Sora 有多难?》,并在文末表示,「我们期待视频生成领域的 LLaMa ,以及更加普惠的开源视频生成技术。」 AI 初创企业 Hugging Face 认为,视频模型的三大挑战是算力、数据、指令模糊性。要想做到物体和空间的一致性,往往伴随着高昂的计算成本;高质量的视觉数据集也比文本的更为稀缺。此外,生产让模型更容易理解视频的 Prompt,会比语言模型、文生图模型难度更大。 此外,Sora 是一个凭借直觉和概率驱动的模型,而不是靠精确计算的公式驱动的模型。有人总结道,「Sora 可以像一个普通人一样,通过直觉去理解物理世界,也能解决很多问题,但它没有办法像物理学家一样造出火箭这种东西。」 无论如何,Sora 跟 GPT 3.5 一样,验证了技术方向的可行性,视频模型的性能未来会随着参数量、数据大小和计算量的增加而提高。 又一次降维打击? 硅谷投资机构 a16z 统计,截止去年年底,市面上共有 21 个公开的视频模型,其中包括 Runway、Pika、Stable Video Diffusion 等等。 然而,第一个出圈的还是 Sora,核心依然是它远超预期的效果。以往几秒钟的 AI 视频,给人的感觉还是「会动的图片」,而 Sora 则展现了对真实世界的理解力和还原力,还有对虚拟场景的充沛想象力。 Sora 官网发布的几十个视频 Demo 中,有在东京街头散步的女人、在咖啡杯里航行的海盗船、在雪原上走过的猛犸、无人机视角拍摄的海浪拍打峭壁、华丽的纸艺海底世界、维多利亚冠鸽的微距特写,其视频主体和环境的一致性令人震撼。咖啡杯里航行的海盗船这个 Demo 里,水面的波纹、船的运动轨迹,很好地遵循了现实世界的物理规律。 阿里巴巴达摩院的分析认为,Sora 的智能涌现,体现在它的三位一致性、长距离连贯性和物体持久性、与世界互动的能力、对数字世界的模拟。 虽然 Sora 对复杂的物理预测还显得力不从心——比如,一个人咬了一口饼干,但饼干上并没有出现咬痕,但许多从业者认为,这是 AI 真正理解世界的开端,随着模型能力的持续提升,它对物理世界的理解和还原会更加准确。 此外,OpenAI 不仅公布了 Demo 视频,同时公布了每一个 Sora 生成视频的指令,方便大家尝试其他产品后,对比效果。 尽管外界担心其他文生视频初创企业的命运,但创始人们表现出的兴奋却远远大过恐惧。 Runway CEO Cristóbal 感慨技术进步的速度,过去需要以年计算的技术进步,现在压缩到了月的维度,他预测技术将会更快地进化,每天、甚至每个小时,都可以涌现出新的技术实现。Pika 创始人郭文景也在媒体采访中表示,「(Sora)是一个振奋人心的消息,我们准备直接冲,将直接对标Sora。」 去年 8月,OpenAI 对外披露了首次收购行为。 被收购公司 Global Illumination,开发了一款名为 Biomes 的开源大型多人在线沙盒游戏,类似于浏览器上运行的《我的世界》。当时就有人指出,借助开放式游戏中玩家的交互,OpenAI 通过这次收购,能为 AGI 构建真正的数据集;也有人猜测,OpenAI 将会推出游戏或视频模型产品。 从 Sora 的效果看,或许这次收购的确对 Sora 的训练数据优化有一些帮助。 世界模拟器? 「Sora 是能够理解和模拟现实世界的模型的基础,我们相信这一功能将成为实现 AGI 的重要里程碑。」OpenAI 在技术报告的最后写道。 ChatGPT 是思维世界的模拟器,Sora 是物理世界的模拟器,出门问问 CEO 李志飞评论,「OpenAI 的科学家们果然一直有着创世的冲动。」 有技术人员猜测,Sora之所以具备强大的能力,得益于模型和数据。 首先,与 Runway、Pika 的技术路线不同,Sora 使用了基于 Transformer 的扩散模型(Diffusion Model),可以通过自注意力机制(Self-attention)来学习视频数据中各个元素块之间的关系,并模拟数据的扩散过程,生成高质量的视频输出。 其次,Sora 能将不同类型的视觉数据,转化成统一的视觉补丁(Patch)。Patch 之于 Sora,就像 token 之于 ChatGPT。ChatGPT 把各种语言、编程代码都切分为 token,Sora 把图片、视频都切割为 patch。 OpenAI 认为,将视觉数据统一处理,将带来两点好处:首先是采样的灵活性,通过统一的数据表示,Sora 可以灵活处理不同宽高比的视频内容。其次是更好的构图效果。在原始宽高比的视觉数据上进行训练,Sora 可以更好地学习和理解构图,使得生成的内容更符合人类的视觉习惯和审美标准。 如同 ChatGPT 在专业领域的能力,还比不过详细定义规则的小模型一样,Sora 虽然对物理世界有一定理解,并拥有更强大的泛化能力,但它与此前的物理仿真模拟相比,预测价值仍然有限。 比如,物理仿真模型可以预测汽车在相撞时的反弹效果和形变,但 Sora 无法发挥这样的作用。OpenAI 官网发布的 Demo 也表现出,Sora 无法很好地模拟玻璃杯破碎时的动态,混淆了玻璃破碎和液体溢出的顺序,倒下的玻璃杯甚至与桌面融为一体。 英伟达的研究人员Jim Fan认为,这有两种可能的解释:一是模型之所以犯这样的错误,是因为它根本不学习物理,只是简单地缝合像素;二是模型实现了一个内部的物理引擎,但这个引擎还不够好,就像 Unreal Engine v1 在流体和可变形物体等物理模拟方面比 v5 要差得多,渲染效果也差得多,并且不符合物理规律。他本人更倾向于第二种解释。 但模型能力的提升是可预见的,因为人类生产视觉数据的速度前所未有地加速了:全世界遍布摄像头,每人每天都在用智能手机采集这个世界。这将成为模型理解世界的通路。此外,UE 5 也可以模拟多角度的高清视频,让模拟出来的视觉数据更加优质。 从 Sora 中我们不难看出,头部玩家 OpenAI 的思路是「集中力量办大事」:专注提高模型的能力,只进行轻度的产品化。毕竟,能生产 60s 视频的模型,要比添加了很多细碎功能、复杂按钮的视频产品震撼多了。此外,谁也无法预测模型智能程度的提升曲线,产品设计的节奏很可能追不上模型进步的速度。 当下对于大模型公司来说,模型能力才是最好的增长手段。不仅SLG(Sale-lead growth)显得过于原始,甚至PLG(Product-lead growth)也有些过时,我们正在迎来一个MLG(Model-lead growth)的时代。
魅族21 PRO成世界第一个开放硬件的手机:对所有大模型开放
快科技2月29日消息,今晚魅族发布新旗舰手——魅族21 Pro。 魅族表示,魅族 21 PRO的“O”,是智能手机时代的句号,也是一个新时代的开始。 魅族21 PRO不仅是魅族历史上第一款开放平台手机,还是全世界第一个开放硬件的手机。 魅族并不是对软件开发者开放,是对所有的大模型开放,魅族直接给开发者提供系统权限、Flyme API文档,允许LLM向用户请求数据,并开放SOC边缘AI API,让开发者拥有充分的自由度。 魅族作为一个手机品牌与手机公司,最擅长的是做好硬件和服务好用户。魅族相信能力的边界,魅族只做好硬件。AI方面魅族做开放平台,让更年轻,也更擅长的团队加入。 在魅族看来,魅族21 PRO 其实是商业战场上第一台 AI 时代的树莓派。 魅族将征求全球大模型团队的支持,邀请所有有兴趣的大模型团队,在魅族的开放平台上开发大模型应用,而且会为月活最高的大模型应用团队,提供100 万人民币的悬赏,开发者申请邮箱为openforllm@xjmz.com。 除了发布首款AI终端魅族21 PRO外,魅族还公布了All in AI战略。 据了解,魅族将从三个方面展开All in AI的战略,魅族将打造全新的AI Device,通过产品形态AI原生设计、硬件算力AI全局调用等,为用户带来更加智能、便捷、创新的AI产品体验。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。