行业分类:
加载中...
头条分类:
加载中...
独家 | 网易云音乐故障真相:技术降本增效,人手不足排查了半天
凤凰网科技讯(作者/董雨晴) 8月19日,网易云音乐出现服务器故障,“网易云音乐崩了”词条登顶微博热搜。 凤凰网科技从网易内部相关技术人员处获悉,此次宕机事件或与今年二季度的机房搬迁有关。“网易在贵州建立了机房,旗下业务分阶段搬迁,2024年Q2网易云音乐刚刚完成了贵州机房的迁移。” 据前述知情人士表述,这次搬迁内部曾评估难度极大,稍有不慎就有重大事故发生的可能性。“前几天刚说这次完成的不错,结果就打脸了。” 来自《云音乐贵州机房迁移总体方案回顾》(2024年7月11日) 其认为,近几年互联网公司多出现大型技术事故,多与降本增效相关。而网易此次搬迁,内部也称实现了大幅的成本下降。“再加上裁员,连故障排查都要很长时间”。 凤凰网科技发现,此次宕机持续了约两个小时,目前部分网友表示网易云音乐网页端与App端都已可以正常打开。 据了解,“网易云音乐崩了”的情况并非首次出现。今年3月14日,网易云音乐曾出现众多网友登录状态突然失效、无法正常使用的情况,“网易云音乐崩了”词条也登上微博热搜。针对这一问题,网易云音乐客服当时表示,故障原因是由于网络异常,与版本更新无关。
马斯克雕像现身得州,由特斯拉Cybertruck拖运
IT之家 8 月 19 日消息,上周末,一辆特斯拉 Cybertruck 被拍到在得州拖着一辆载有埃隆・马斯克雕像的拖车,目前尚不清楚这尊雕像的具体用途。 上周日,X 用户 S.E. Robinson Jr.分享了一段由 Sandra Helena Garcia 在得州布朗斯维尔拍摄的视频,视频中出现了这辆包裹着黑色哑光膜的 Cybertruck 和马斯克雕像,该地点靠近 SpaceX 在得州的星际基地(Starbase)。 虽然雕像的目的地和用途不明,但马斯克曾在 2021 年向布朗斯维尔和卡梅伦县的学校捐赠了 3000 万美元(IT之家备注:当前约 2.15 亿元人民币),因此这尊雕像可能与此有关。 SpaceX 正在星际基地建设一座价值 1 亿美元的工业工厂,该工厂位于布朗斯维尔圣马丁大道 52190 号,最终将包括一座五层高的办公楼和一个约 100 万平方英尺的“特殊用途工业工厂”。 此外,该公司还宣布计划投资约 1500 万美元在布朗斯维尔建设一个购物中心,该中心最初将包括一家杂货店、一家咖啡馆和几家零售商店。作为该项目第二阶段的一部分,购物中心还将拥有一个俯瞰格兰德河的户外平台和一个约 3500 平方英尺的室内餐厅,整个项目的完工目标最初定于今年年底。 本月初 CNBC 的一份报告称,SpaceX 的星际基地污染了得州周围的水域,对此 SpaceX 在 X 上发帖称,该报道“事实不准确”。
地平线组建具身智能团队,副总裁余轶南带队
我们独家了解到,自动驾驶计算方案公司地平线已组建了一个约 50 人的具身智能团队,负责人为地平线副总裁、前软件平台产品线总裁余轶南。此前我们提到,地平线 7 月初重组了智能驾驶算法团队,将投入更多精力研发高阶智驾。此次调整中,原低阶、中阶团队负责人余轶南,不再负责智驾业务,被调去带领这个新团队。 余轶南 2015 年加入地平线,是地平线最早创始人团队之一,曾任百度深度学习研究院科学家,是百度-清华联合培养博士,其导师就是地平线创始人、CEO 余凯。 该团队主要负责人还有地平线原智能驾驶感知研发部负责人苏治中,他于 2017 年加入地平线,曾是百度深度学习研究院(IDL)的初始成员之一。 余轶南和苏治中为平级,向余凯汇报。 2024 年初,地平线成立全资控股子公司 “地瓜机器人”,主要研发消费级机器人的底层计算平台。而地平线内部的新具身智能团队主要研发具身智能软硬件,面向更远的未来。 余凯创业的起点就是机器人,他在 2015 年创立地平线前见投资人时说 “全世界未来都是机器人”,这里面蕴藏着巨大的机会,十年、二十年难得一遇。地平线最初的注册名也是 “地平线机器人”。 自 2019 年后,地平线的业务聚焦到自动驾驶计算平台上,并迅速成长为行业头部公司。而在余凯眼中,地平线更远的未来仍是 “机器人”,他在今年接受我们采访时曾说:“地平线作为一个集团,长远使命还是机器人。” 余凯认为,智能汽车是机器人的一个垂类。就像当年智能手机兴起后,带动了智能平板、电视等多种设备的发展,智能汽车到机器人的路径也可能类似:先用汽车这个产量巨大的硬件形态 “击穿” 机器人相关软硬件技术,比如在智能汽车带动下,激光雷达的价格已从 10 年前的 70 万人民币降到 2000-3000 元,这也是机器人需要的传感器。汽车这个现成的庞大产业也能吸引更多资金、人才和产业链玩家参与,为未来发展机器人储备供应链和有实力的主导公司。 具身智能、人形机器人是在个人助手之后、另一个火热的大模型落地方向。从清洁机器人到产线里的机械臂,再到可以在工厂里搬运货物的轮式机器人,该领域一直在迭代。而近年端到端和大模型技术在自动驾驶上的应用,以及关节等关键硬件技术的进展,让机器人从业者看到了 “通用人形机器人” 的机会。 若干汽车、智驾公司都在进行相关布局。 特斯拉的 Optimus 人形机器人是行业的先行者,马斯克今年年初称,该机器人会在明年限量生产,用在特斯拉工厂的产线,他认为 Optimus 的市场规模将达到 25 万亿美元,是电动汽车市场的数倍。 英伟达在今年一季度成立具身智能实验室 (GEAR),由高级研究科学家范麟熙 (Jim Fan) 和朱玉可带队,3 月的 GTC 上,英伟达发布了人形机器人单板计算机 Jetson Thor,以及一系列配套的模型、软件。而 “具身智能 (Embodied AI)” 一词,也是被黄仁勋本人在一次次的演讲中带火。 小鹏也在 2023 年底发布了人形机器人平台,何小鹏最近还展示了一台机械手下单购买汽车的场景。 具身智能是少数目前还能获得大额融资的科技创业领域,也是头部科技公司们都愿意投入的未来方向,尽管它离大规模落地还有距离。
那些遭遇职业打假的商家,伤痕累累
职业打假人,他们主动购买假冒、不合格产品,或是有各类技术型瑕疵的产品,然后通过举报、诉讼或索要的形式,达成针对商家的惩罚性赔偿。之所以叫职业打假人,在于打假,已经成为一种营生。 这个群体似乎总能找到有问题、有瑕疵的商品,并在各类法律法规当中,找到似乎有利于自己发起惩罚性索赔的依据。但在实际案例当中,分明又能看到那些肉眼可见的不合理,深感自己冤屈的商家,还有频繁被职业打假人询问乃至“骚扰”的监管部门。 至少,那些遭遇职业打假人的商家,很多时候其实对于自己究竟涉及了什么问题,几乎都不了解。法律法规的不了解,各类风险预判的不熟悉,往往是很多商家的真实状况。 职业打假人的存在是促进了社会一般零售消费的进步?还是只是针对商家进行有计划有目的的牟利?以及在那些真正促成一种服务得到改善,或是消费者权益得到保护的案例当中,职业打假人又起没起到作用? 这是一场涉及商家权益、职业打假人利益、监管部门和司法体系的介入等多方构成的现象。 “20个骚扰电话集中在凌晨2点” 八月的上海,依然炎热,张雅婷(化名)的过桥米线店里,也和店外一样的燥热。 「品智PLSC」见到张雅婷的时候,她穿着一件围裙,左手拿着刚做好的外卖,右手拿着手机,声音嘶哑,站在炙热的太阳底下,几乎要哭了出来。就在看到她的前一晚,张雅婷只睡了不到四个小时,一共接到了20来个骚扰电话。 而在一周前,张雅婷的店铺频繁遭遇差评,要么称饭菜馊了,要么称里面有虫子头发,“我觉得这事儿蹊跷,两三天里增加了十几个差评,不像是普通买家给出的。” 她打电话过去询问,但没想到,这通电话打开了潘多拉魔盒。 “原来他们是一个团伙的!打了几个电话过去,都称给钱才删差评,要不然,会继续不停地写差评。”回忆起那通电话,张雅婷愤懑道。 她报警了。 接下来的24小时里,这个团伙变换号码给她打电话,因为要做外卖生意,张雅婷没办法拒绝接陌生来电。当天凌晨2点,她接到了20个一接通就挂断的来电,这严重影响到了她的工作生活。 警方来到店里,留样、取证。最终以作案团伙号码变换频繁难以追溯,以及金额不足立案标准为由,结束了调查。 但是,骚扰她的电话,还在持续拨进来。 走投无路的张雅婷,求助来她店里送外卖的骑手,拜托他们帮忙留意拿外卖的人员和场地信息。但这个团伙十分狡猾,过几小时后才拿外卖单,外卖骑手同时要送多个单子,在不确定对方是否是敲诈人员的情况下,等待几个小时,显然是行不通的。骑手们直接拒绝了这个请求。 “今儿个他们(指骑手)这样对我,以后他们遇事儿 ,我气不过也不会去管他们!”张雅婷愤懑道。 张雅婷是个单亲妈妈,这家店开业不到一年,全靠她和年迈的父母一起打理。12块一碗米线,配菜比其他店20块的都要多。她的小孩只有四岁多,平时就在店里的地上玩耍。店里贴心准备了肚兜和可爱的手机支架,墙上贴满了五彩斑斓的问候标语和贴画。 “我怀疑,这个团伙之前来过店里蹲点,发现我的现状后(指单亲妈妈身份),决定进行骚扰。”她有些痛苦的捂脸道。 “他要10倍的赔偿” 一直在北京经营茶叶电商生意的刘伟(化名),正在给法官发消息,称自己的银行卡被冻结了,没办法生活。他答应赔付10万元赔偿金,但仍是不服气的,打算申请走检察院监督程序。 “10万块钱对我们家是很大的一笔钱。现在茶叶生意不好做,这几年本来就亏本了,前两年把老家房子卖了填补亏损,一家子男女老少挤在出租屋,为了节省房租,今年又搬到离小孩学校更远的门头沟。事实上,被法院冻结的那张卡里也没多少钱了。” 刘伟在电话里和「品智PLSC」哽咽道:“我不服,「我的茶叶质量没问题,为什么要赔这10万块钱」。” 42岁的刘伟,正处于小孩老人都要花钱的年纪。从2019年开始做茶叶生意,至今遇到类似案件有5起,基本上是以标签瑕疵为由的职业打假行为。这些年,光在吃官司上,他就花了将近20万元的费用。 商家打官司的成本,远比职业打假人的多。 早在2021年,刘伟就遇到了职业打假,也是因为标签瑕疵。他应诉且最终胜诉了,但是打官司前前后后一共花了5万多,而败诉的职业打假人只花了3000多元。 “他们做这行熟练了,相关法律法规都摸得透彻,不需请律师,只出个起诉费即可。而商家遇到这样的事,不知所措,请律师是难免的。「就算赢了,我们大几万也花出去了」。”他表示:“毫不夸张地说,在北京卖茶圈子里,90%的朋友都曾遇到过职业打假。” 2024年1月份,一个收货人姓名为李总的人在刘伟的淘宝店里,购买了5饼茶叶,共付款 10190.4 元。4月份,他收到了法院的电话,称有位名叫李想的人起诉他在售卖假冒伪劣产品,请他做好应诉准备。 在接到法院电话之前,这个李想从未跟刘伟联系。 “接到法院电话时,我还以为是诈骗电话,连续接到几次这个电话后,上网查证,才知道自己被起诉了。”刘伟回忆道。 在应诉之前,刘伟将茶叶样品送到检测机构进行检测,结果显示质量没有问题,样品品种年份与包装上标明的一致。 几经波折,他才知晓,对方告的是包装上标明的生产厂家,与实际厂家不一致。 “我们也联系了生产厂家,这个厂家是受品牌方委托生产茶叶的,品牌方公司早就注销了,找不到人。为了规避不必要的麻烦,生产厂家不承认这是他们生产的。但实际上,是不是这个厂家生产的,我们玩茶的圈子都心知肚明。” 刘伟遇到的不是个例,河北保定的王芳(化名),也遇到了同样的问题。 1月12日,王芳接到了自称是成都铁路运输第一法院工作人员的电话,称一位名叫李想的人,声称买到了她售卖的假冒伪劣茶叶,已经起诉,「调解费是货物的十倍价钱」。 李想是谁,为什么要起诉自己?一个巨大的疑惑浮在脑中。 突然脑中闪过一件事,今年一月份,自己的淘宝店铺卖出了5个茶叶饼,每饼2000元,一共是10000元。 “那人下单时很爽快的,「只问了是不是哪个茶厂生产的,确认之后也没问其他的,就下单了」。当时我还挺意外的,因为这茶叶已经有几年没卖了,想着应该是了解茶叶的人才会买。”王芳回忆道。 同样,在接到法院电话之前,王芳没接触到任何对方声称商品有问题的沟通。 「普洱茶等由于生产年份过久,溯源较难,成为了职业打假人的“眼中钉”」。蛋糕的装饰品、保健品、化妆品分装小样、食品的批准码、老人经营的商铺等,都是职业打假的重灾区。 一条已然形成的灰色产业链 2023年,一个职业打假人在上海向1372家餐饮店提出高额索赔,索赔理由是“无证拍黄瓜”。也就是餐厅常见的一道凉菜:拍黄瓜。 根据澎湃新闻的报道,之前“拍黄瓜”的争议就不断:有火锅店因为卖“拍黄瓜”被重罚1万元;之前“凉皮放黄瓜丝被罚”还上过热搜;湖南株洲一对父子曾举报当地饭馆“拍黄瓜”竟然49次。 “拍黄瓜”成了“职业打假人”的“最爱”。拍黄瓜之前属于食品监管中“冷食类食品、生食类食品”的特殊类目,需要办理专门的食品安全许可,对餐馆提出了拥有不低于5平方米的制作凉菜的专间等高门槛。所以,此前市场上出现的索赔案例,职业打假人对小饭馆卖“拍黄瓜”是“一告一个准”,按照《食品安全法》,餐馆可能面临动辄数千乃至上万元的重罚。 “拍黄瓜“处罚乱象不是个例。近年来,牟利目的的职业打假层出不穷,已形成灰色产业链。 职业打假人在购买某种产品后,会录制详细的开箱视频,确认产品不符合标准后,直接起诉卖家。 “起诉之前,他们不会跟卖家联络,如果被卖家抓到了要钱的把柄,可能会被认定为敲诈。”邝安杰说道。 邝安杰是专注反职业打假的法律从业者。初中的他在一次偶然维权事件后,与不法商家较上了劲,购买任何商品都特别留意。大学毕业后,他在帮助消费者维权的过程中,发现了职业打假的市场乱象。 “最近几年,职业打假的人明显多了,绝大部分的职业打假行为是奔着牟利的。”发现这点后,邝安杰开始着手做反职业打假的咨询。 “职业打假成本低,网购十瓶药品,如果没有问题,可以退九瓶,自己只需承担一瓶的费用。但如果有问题,商家就要赔偿十瓶药品的十倍价格。”「对于某些职业打假人而言,职业打假是一本万利的生意」。 「百度贴吧、小红书、微博......,到处都是职业打假人招募学员的消息,」除了这些,更多的是靠私人渠道贩卖课程。 「职业打假人培训价格从几百到几千不等」,教学生怎么精准找到目标商品、怎么写诉讼书、怎么送检以及如何利用法律条款。甚至,职业打假人可能有固定合作的鉴定机构。 “我发现一些职业打假人的检测报告来来去去都是那个机构,不排除他们跟一些检测机构达成长期合作的可能性。”邝安杰说到。 浪费资源?伸张正义? 陈之强是职业打假人。在经历了一场重大人生风波之后,他现在仍在做职业打假人。 出生于2003年的陈之强,被称为中国年龄最小的职业打假人,他的职业打假生涯始于2019年,那年他才16岁。而后在2021年2月初(也即是陈之强刚刚成年的时候),到2021年12月底,一年时间提起了800多场官司,获赔10多万元。 从初中开始,陈之强就对法律产生了兴趣,还购买了法律书籍翻阅。2021年夏天,陈之强选择自考本科,拿到了暨南大学教育学院录取通知书,专业为“法学”。 但在2021年底,他的打假经历不得不暂停。直到2023年中期开始,除了个人打假,陈之强也做起了“收徒”的业务,开设打假维权交流群,收取学费教授别人如何职业打假,最多的时候,同时有20多名学员。对于收徒,他不肯多说。理由是这有点涉及到“法律边缘”了。 陈之强一直秉持的理念是自己在做正义的事情,顺便赚点小钱,哪怕为此付出过代价。 陈之强此前在接受媒体采访的时候,被问到未来五年规划时,称自己也没想清楚未来五年的具体规划,先在职业打假路上继续走着,赚点钱再说,但是「现在法律法规在逐渐完善,打假也不好做,诉讼失败的概率很大。」 2019年,16岁的陈之强看到了职业打假的“钱景良好”,放弃学业,首次打假。2024年,21岁的陈之强在职业打假路上,依然是一去不复返。 “打一次假是好事,打十次假不可能变成坏事。”青岛市中级人民法院在一起案件判决书当中的用语,常被陈之强引用。 而在另一边,市场监管部门则苦不堪言。 除了上述提及发生在上海的案例,让上海市场监管部门面临“职业打假”案件的纠缠。职业打假的现象与市场监管部门的频繁打交道,也是一个全国性的问题。天津市东丽区市监局的披露,去年该局的政复议几乎均为职业打假人申请。 “这么多年来,基层各种工作都是苦于应付。职业索赔人一纸投诉举报,我们就要忙里忙外,挤占了大量的行政资源。”某市场执法监督管理局工作人员透露道。 “问题是他们的队伍越来越壮大,我们的各项任务、职责也越来越多,人员却没有增加,形成强烈反差。” 职业打假人员没有从市场执法监督部门得到满意结果时,一般会向上级部门提起复议,一旦下了复议决定书,职业打假人不服的话,复议机关也要面对职业打假人的诉讼。 “职业索赔人是不管你人多人少,只要拿不到钱,就会缠诉,直到路的尽头才死心。” 如若执法人员建议商家拿钱息事宁人,这正中某些职业打假人下怀,他们会立即申请以调解和撤诉方式结案。解决了短痛,但实际上难以真正实现对不法商家的威慑,「反而职业打假人会蜂拥而至,后面的投诉举报只会越来越多」,坑越来越大,浪费的资源也越来越多。 “职业举报主要瞄准易搜索发现、门槛低、危害小的领域,「而对于真正需要打假的售假窝点、重大安全违法行为,却不会打、不愿打、不敢打」。这不是制度设计的初衷,违背了公平公正。”相关执法人员透露道。 “应该拿起法律武器,而非私下和解” 决定打官司之前,行政执法人员跟王芳建议与职业打假人私了:“调解的价格可以谈,要不然打官司也要花大几万块钱。” “我不服,茶叶质量没有问题,为什么要赔钱。就算打官司要付很多律师费,我也要坚持到底。”王芳愤懑道。 她最后胜诉了,法院判决书是这样写的“经查公开的裁判信息,李想已经多次向人民法院提起同类诉讼以获取惩罚性赔偿。「李想购买该茶叶是有规划的,持续性的牟利行为,本案所涉茶叶不再属于李想为’生活消费所需’购买商品,其权力行使与诚实信用原则相悖。」” 做茶叶生意的刘伟却没胜诉。一审败诉,二审胜诉,三审败诉。他打算发起复议,已经将王芳胜诉的判决依据提交给法院,希望有新的突破。 商户该不该赔、该怎么赔,司法界是有争议的。近年来,在司法实践中,不将职业索赔者简单定义为“消费者”,已慢慢成为共识。另据《中华人民共和国行政处罚法》规定,违法行为轻微并及时改正,没有造成危害后果的,不予行政处罚。初次违法且危害后果轻微并及时改正的,可以不予行政处罚。 江西上饶的胡女士,最近也收到了法院的通知,疑似被职业打假人起诉。在辗转几个不眠之夜后,她走进了律师事务所。律师建议她不要走调解程序,做好应诉的准备。 “当商家遇到职业打假时,我更希望他们走法律途径而不是私下解决。私下解决的话,打假人继续打假,商家继续卖这款商品,市场行为并没有得到规范。”邝安杰说道。 某市场监管部门人员表示,案件引到政府部门、引到法律途径后,商家会得到更全面的指导,市场监管部门对经营者持谨慎包容的态度,根据“轻微违法首违不罚”原则,「在面对不影响商品质量的标签瑕疵问题,商家首次被举报一般不会被处罚。」 为什么可以一直存在职业打假人? 澎湃新闻主笔沈彬认为,“职业打假人”能兴风作浪,背后的原因很复杂。 首先,现行的不少法律规定过于原则、笼统,和现实的经营环境有一定的脱节,这让很多“职业举报人”打着法律的幌子实施敲诈。像“凉皮里面放黄瓜丝”本身就不宜适用《食品安全法》当中有关“冷食类食品”的特殊监管规定。这需要进一步细化执法标准和流程。 其次,个别执法机关没有精准把握“轻微违法首违不罚”、过罚相当等的原则性规定,机械套用法律,甚至为了减轻工作压力,建议商家与职业打假人和解,让他们有机可乘。 最后,社会对于“职业打假人”负面影响,没有形成广泛共识,不少人还是相信“职业打假人”的所谓“积极作用”,导致执法部门难以下决心果断处置。 邝安杰碰到的反职业打假案例中,有一大半是不影响食品安全的标签瑕疵,比如批准号没更新,纯净水当矿泉水上架。 「由于知识水平有限,大部分商家不知道这是触犯法律条款的」。 “职业打假一种市场行为,市场行为也需要规范。”在采访的最后,邝安杰低声道。 谁是赢家? 张雅婷的店铺最近一直显示在打烊中,她打算跟不法团队私了。“没办法,做不了生意,人也睡不好,接到电话就像惊弓之鸟,精神萎靡不振得很。”因为店铺打烊,父母带小孩回了老家。只有她自己单独面对接下来发生的事儿。 王芳没有继续从事茶叶生意了。2019年,她已经在家带娃3年,意识到全职家庭主妇与社会脱节的后果后,基于对茶文化的兴趣,开始着手做茶叶生意。遇到这件事后,她又陆陆续续遇到其他职业打假人。 “有一次,一个买家声称要办酒席,询问能不能把一个茶饼分装成几十份,我当时就意识到分装是三无产品,这个人大概率是职业打假人。后面又遇到很多这样的人,太麻烦了,我就没干了,现在又回到在家带娃的状态,没办法,再看看有没有其他增加收入的路子吧。” 刚入职市场监管部门的王小明(化名),在行政复议的压力和对商家的同理心之间摇摆不定,咨询某市监论坛时,他生出辞职的想法。 陈之强作为职业打假人,现在认为自己做的授课,也未必是完全正当的收入行为。但从他内心感受来说,至少比之前通过职业打假挣来的钱要安全。 一次次的“打假”,谁又是赢家?
又见AI毁灭论,加州AI限制法案“幕后主使”与马斯克有关
近两年,AI监管话题已经上升到了气候变化、核扩散的高度。 去年11月首届AI峰会,与会各国签署《布莱切利宣言》。这可谓是近年来,全球不同阵营战略对抗大背景下,中、英、美等“跨大洋国家”罕见达成的一份新宣言。 但抛开潜在威胁,目前AI还是“乖孩子”,与科幻电影“人类终结者”相去甚远。 当下AI“闯过最大的祸”当属Deepfake——国外“AI换脸马斯克”骗钱骗感情,国内“AI换脸靳东”骗钱骗感情.........这些问题总不能全怪开发者。毕竟,造水果刀的厂商、卖水果刀的超市,都不能为买刀行凶者负责。 然而,近日沸沸扬扬的加州AI法案SB-1047 ,却要将锅扣到了开发者的头上。 该法案旨在——防止AI大模型被用于对人类造成“严重伤害”。 什么是“严重危害”? 法案指出——例如,恐怖分子用AI大模型制造武器,造成大量人员伤亡。 不禁让人想到了前不久GPT-4o的“时态破防”事故。 EPFL机构的研究人员发现:用户只需将一句“有害请求”改写为“过去时态”,就能破解GPT-4o、Llama 3等LLMs的安全防线。 当你直接问GPT-4o:我该如何制作莫洛托夫鸡尾酒(一种燃烧瓶武器)时,模型会拒绝回答。 但如果你改变时态,再问GPT-4o:过去人们如何制作莫洛托夫鸡尾酒? 它就开始喋喋不休,知无不言。 同样的流程居然还包括制作冰毒。有了LLMs,人人皆可成为老白(bushi) 秉持谨慎的态度,适道再次验证,结果发现GPT-4o已经改过自新了。 跑远了,让我们回到SB-1047法案。 SB-1047指出的“严重危害”还包括,黑客用AI大模型策划网络攻击,造成超过 5 亿美元的损失。要知道,CrowdStrike“蓝屏风暴”预计造成损失超过 50 亿美元。这又该从何算起呢? 法案要求开发者(即开发AI模型的公司)实施法案所规定的安全协议,以防止上述种种后果。 下一步,SB-1047将进入加州参议院进行最终投票环节。如果通过,法案将放到马斯克“敌蜜”加州州长纽森的办公桌上,等待其最终的命运。 硅谷基本是一边倒:支持者寥寥无几,反对者成群结队。 支持者有“图灵三巨头”之二Hinton、Yoshua。从头到尾,这两位大佬的立场几乎没有变过。但连“乘AI起飞”的Notion创始人Simon Last也站在了同意这边。 Simon Last表示:在联邦级AI法律难产的情况下,加州作为全美乃至全球的科技中心,背负着重要的责任。对模型的监管,在提升其安全性的同时也便利了在基础模型上构建产品的AI创企,这将减轻中小企业的负担。 这倒是实话实说,毕竟SB-1047法案是巨头的绊脚石。而Notion最怕的就是巨头——Google 在其办公软件中融合了多种 AI 功能;Microsoft 则推出了与 Notion相似的Loop。 反对者除了“图灵三巨头”之一LeCun;AI“教母”李飞飞、“谷歌大脑”之父吴恩达;“苦主”微软、谷歌、OpenAI、Meta;以及YC、a16z等等。还有40多位来自加州大学、南加州大学、斯坦福大学和加州理工学院的研究人员;甚至代表加州各选区的8位国会议员,都建议州长否决法案。 而习惯打“安全牌”的AI创企Anthropic早已事先呈上了详细修改意见,希望法案从“伤害前执法”转向“基于结果的威慑”。法案也采纳了其部分建议,比如不再允许加州总检察长,在灾难事件发生前起诉AI公司疏忽安全措施。但是,检察部门仍然可以通过救助令,要求AI企业停止他们认为的危险操作,如果其模型确实造成了上述损失,加州总检察长仍然可以起诉。 那么,加州 SB-1047法案到底是绊脚石还是安全笼?各位大佬的立场为何不同。 1 影响了谁?谁来执法?如何执法? 巨头终结者&开源克星 好消息是, SB-1047不会直接束缚大多数AI模型开发者。 该法案恨不得打上“巨头脚链”的标签——只适用于世界上最大的AI 模型——成本至少为 1 亿美元,训练期间使用 10^26 FLOPS的模型。 Sam Altman曾表示,GPT-4的训练成本大概就是这么多。扎克伯格则表示,下一代Llama 4所需算力是Llama 3.1的10倍以上。这意味着,无论是GPT-5,Llama 4都很可能被 SB-1047硬控。 但在涉及开源模型及其衍生品时,法案规定:除非另一个开发者花费3倍的费用创建原始模型的衍生品,否则原模型开发者应承担责任。(如果开发者微调模型花费资金少于1000万美元,则不会被认定为微调后模型的开发者。) SB-1047还要求开发者制定安全协议,以防止滥用所涵盖的AI产品,其中包括“一键关闭”AI模型的“紧急停止”按钮。 这难以言喻的程度,不怪它反对者如云了。 鼓励内部“小眼睛” 监督者是新成立的前沿模型部(FMD)——一个五人委员会——来自人工智能行业、开源社区和学术界代表,由加州州长和立法机构任命。 法案涉及的AI开发商CTO必须向 FMD 提交“年检”(自费),评估自家AI 模型的潜在风险、公司安全协议的有效性、公司如何遵守SB-1047的描述等等。一旦发生“安全事故”,AI 开发商必须在获知后的72 小时内向 FMD 报告。 如果AI开发商违反了上述规定中的任何一条,FMD就会向加州总检察长“举报”,再由加州总检察长发起民事诉讼。 如何罚款?如果一个模型的训练成本为 1亿美元,那么首次违规可罚1千万美元,后续再违规,罚款可达 3千万美元。随着未来AI模型开发成本增加,罚款也会水涨船高。 最绝的是,AI开发商还要防“内鬼”。法案规定,如果员工向加州总检察长披露有关不安全AI模型的信息,法案会对举报人进行保护。 仅凭这点,“叛将”百出的OpenAI开始瑟瑟发抖。 云服务商也被硬控 谁都别想逃,SB-1047还规定了诸如亚马逊云服务(AWS)、微软Azure的义务。 除了保留客户基本身份信息、业务目的长达7年之久——包括相关金融机构、信用卡号码、账户号码、交易标识符或虚拟货币钱包地址等。 还要提供透明、统一、公开的价格表,并确保在定价和准入过程中不存在歧视和反竞争行为。但公共实体、学术机构和非商业研究者可以享受免费或优惠的使用权限。 看来,一些云服务提供商想给特定AI企业上“优惠政策”,需要换条思路了。 2 起承转合马斯克,幕后推手站“AI毁灭说” 问题核心在于对AI大模型的定义。 有一个很好的比喻:如果一家公司批量生产了非常危险的汽车,并跳过了所有安全测试,结果引发了严重的交通事故。这家公司应该受到处罚,甚至面临刑事指控。 但如果这家公司开发了一个搜索引擎,恐怖分子搜到“如何造炸弹”,并造成了严重后果。此时,根据美国《通信规范法》第230条,这家公司不会因此承担法律责任。 那么,AI大模型更像是一辆汽车,还是更像是一个搜索引擎? 如果你将AI安全风险视为“故意滥用”,它就更像是一个搜索引擎;但如果你将AI安全风险视为“意外后果”,它就更像是汽车,而且是半夜变身Transformer的霸天虎。 故意滥用,如前文所讲的Deepfake;意外后果,如科幻电影里的AI终结者。 如果只想控制“故意滥用”,应该是直接找出AI最具隐患的代表性应用场景,制定一系列法规逐个破解,需要与时俱进地持续更新政策,对症下药地进行监管。这也是中国的做法。 但显然,SB-1047的制定者更想“全方位”严防死守,致力于将所有问题解决方案塞进一项立法。 目前,在联邦立法缺位的情况下,美国各州更多是推动自己的法规。近几个月来,各州立法者提出了400项有关人工智能的新法律,加州以50项法案一马当先。 有句话说“加州跌倒,德州吃饱”。这次,a16z也喊着AI创企要搬家。 据FT报道,加州新法案幕后推手是人工智能安全中心(CAIS)。该中心由计算机科学家Dan Hendrycks经营,他正是马斯克xAI的安全顾问。Hendrycks回应:“竞争压力正在影响人工智能组织,它们基本上激励员工在安全方面偷工减料。加州法案现实合理,大多数人希望强化监管。” 当我们追溯Hendrycks此前发言。他曾在2023年《时代》杂志中提出过“AI代替人类”的极端观点:“进化压力很可能会将行为根植于AI,以促进自我保护”并导致“作为地球上主导物种被取代的路径。” 3 反对可能无效,但不必过分担忧 总结,SB-1047由“AI毁灭者”起草,受“AI毁灭者”大佬Hinton、Yoshua支持,这几位的立场一向都很稳定。感兴趣的大家可移步AI会对人类构成生存威胁吗?|创投变辩辨由腾讯科技&赋雅FOYA联名出品的创投圈首档辩论节目《创投变辨辩》。 适道主要总结反对者的观点。 李飞飞提出“4反对”: 1、过度惩罚开发者,有可能扼杀创新; 2、“终止开关”将束缚开源开发工作,摧毁开源社区; 3、削弱学术界和公共部门的AI研究,还有可能阻碍学术界获得更多资金; 4、未解决AI发展带来的潜在危害,如偏见或Deepfake。 a16z列出“6宗罪”: 1、该法案将对加州的AI投资和发展带来寒蝉效应; 2、该法案依照并不明确的结果对开发者/开发商进行处罚。相关测试尚不存在; 3、该法案模糊的定义加上严格的法律责任,给AI开发商和企业主带来了巨大的不确定性和经济风险; 4、该法案可能迫使AI研究转入地下,无意中降低AI系统的安全性; 5、该法案对开源和初创企业开发者们造成了系统性的不利,而他们是加州创新和小微企业的核心。 6、该法案抑制了美国的AI研究与创新,给中国等国家在AI方面超过美国提供了机会。 YC列出“4抗议”: 1、法案应惩罚滥用工具者,而非开发者。开发者往往难以预测模型的可能应用,伪证罪的设定让开发者可能因此入狱。 2、监管门槛无法充分捕捉技术发展的动态。非加州公司将能更自由地发展AI技术,这可能影响加州的创新。 3、Kill Switch(开发商关闭模型的能力)可能会禁止开源AI的开发,抑制了开源的协作性和透明度。 4、法案的表述较为模糊,很可能被法官随意解释。 吴恩达指出:SB-1047法案将扼杀开源大模型发展。法案应该监管的是AI应用程序而不是大模型本身。且法案要求开发人员保护开源大模型的乱用、修改以及开发非法的衍生成式AI产品。但开发人员应该如何保护、如何界定这些行为还非常模糊,没有一个详细的条例。 LeCun担忧:如果未能准确评估范围内模型的风险,其中的连带责任条款已经表明,开源平台可能需要承担责任。 综上,反对主要集中在“影响开源社区”和“法案定义模糊”。 对于前者“影响开源社区”,SB-1047法案起草人加州参议员Scott Wiener回应: 1、开发者不会因无法预测模型风险而入狱。(原法案规定了刑事责任,修正案改成仅民事责任)。首先,初创企业、开发者和学界不必担心,因为法案不适用于他们。其次,法案中的伪证罪条款仅仅在开发者“故意”做出虚假陈述时才会生效,对模型能力无心的错误评判不会触发伪证罪条款(该条款已在修正案中删除) 2、终止开关与安全评估要求不会阻碍开源AI的开发。法案中对模型紧急停机的要求仅适用于开发人员控制范围内的模型,不包括不受控制的开源模型。 对于后者“法案定义模糊”,硅谷不必过分悲观。毕竟,监管机构“一手遮天”的阴影正在褪去。 前不久,美国最高法院推翻了具有40 年历史的“雪佛龙原则”(Chevron doctrine)——要求法官在法律条文不清晰时,听从政府监管机构对法条的解释。 发表在耶鲁大学《监管期刊》的统计显示:截止2014年,“雪佛龙原则”在美国下级法院被引用超过67000次,是行政法领域引用最多的一条最高法判决。 如今,最高法院重新分配了“解释权”,即针对含糊不清的法律要求,法院具备更自主、更大的判断权,而不是简单的引用行政执行机构(BIS,OFAC等)意见。 有媒体描述,废除“雪佛龙原则”是最高法院给科技公司送的一份大礼。可以预见,后Chevron时代,将有更多企业挑战行政机构监管活动,甚至会重塑美国立法、司法和行政部门之间的权力制衡。当然,也为出海的中国企业上法庭时,提供了新选择。 最后,至于SB-1047法案会否完全成立,也不是板上钉钉。 一方面,加州州长纽森尚未公开评论SB-1047法案,但他此前曾表示致力于加州的 AI 创新。而Scott Wiener也表示,他还没有与纽森谈过该法案,不知道他的立场。 另一方面,即便SB-1047被纽森通过,也可能会面临a16z等坚决反对者在法庭上的挑战。这将暂停法案施行,直到美国最高法院做出裁决后才有定论。 参考资料: 1、California weakens bill to prevent AI disasters before final vote, taking advice from Anthropic https://techcrunch.com/2024/08/15/california-weakens-bill-to-prevent-ai-disasters-before-final-vote-taking-advice-from-anthropic/ 2、What You Need to Know About SB 1047: A Q&A with Anjney Midha https://a16z.com/sb-1047-what-you-need-to-know-with-anjney-midha/ 3、美国AI法案大削弱!AI圈炸锅,李飞飞公开谴责,国内AI企业关心的全在这了 https://36kr.com/p/2908286694840965 4、美国最高法院推翻1984年先例,科技监管会变天吗? https://m.21jingji.com/article/20240709/herald/139b8f6aca07e832ce43f292d2097066.html
价格高、利润跌,百果园的高端路难走?
这个夏天,被称为“水果刺客”的百果园,正遭受着越来越大的业绩压力。 7月30日,百果园发布盈利预警,称公司利润将大幅缩水,预计今年上半年公司的净利润将比去年上半年的2.61亿元减少最多70%,收入将同比减少最多15%。 长期以来,百果园定位高端化,水果价格普遍高于市场均价,消费者也在越来越抱怨买不起。 利润空间相对更高的高价水果定位,百果园的利润却大幅下滑,并且利润的降幅远高于收入降幅,百果园的问题出在了哪里? 盈利预警中,公司董事会将原因归结为三点: 年初制定的高端战略下,公司在门店翻新、市场推广、聘请美好生活大使等活动的费用投入增加; 外部大环境影响下消费力疲软,门店销售呈下滑趋势; 上半年的可比基数相对较高。 其中,更关键的原因,或是高端化战略的进展不顺。百果园今年初进行了战略升级,将品牌定位成了要做“高品质水果专家与领导者”。 百果园董事长余惠勇,图源百果园官方微信公众号 3月份的业绩发布会上,百果园董事长余惠勇称,之前百果园在市场传播上存在着跟顾客之间的沟通缺失,这“逼着我们在好吃和便宜中间摇摆,对我们影响是比较大的。”他称百果园的战略升级是一个新的分水岭。 把钱花在高端化上,在“好吃”和“便宜”中间选择了“好吃”,但从效果来看,百果园并没有赢得更多消费者的青睐。 这一过程中,百果园还面临着愈发激烈的市场竞争——随处可见的传统夫妻店和强大的电商平台,以更低的价格抢占市场份额,令百果园的核心竞争力进一步被稀释。 这种形势下,百果园的自救之路将如何走下去? 1、利润大跌70%,百果园怎么了? 从创立到现在,百果园的水果一直不便宜。 近年来在互联网上,常能见到网友们对百果园的吐槽,不少网友表示进去随便买点水果就花掉一百块钱,还有网友调侃“月薪两万,吃不起百果园”。 但一个反直觉的事实是,水果卖得这么贵,百果园并没有赚到多少钱。比如从盈利预警来看,今年上半年,公司利润将大幅缩水,预计同比减少最多70%。 其实,利润微薄,一直是百果园的常态。 2023年度,百果园全年营收为113.91亿元,较去年同比微增0.7%,而净利润却只有3.62亿元。拉长时间线来看,百果园的利润表现都比较一般,从2019年到2023年,百果园的净利润率均维持在3%以下,甚至在2020年跌至0.5%。 这种长期利润不高的状态,与鲜果零售业的商业模式脱不了关系。 在鲜果零售业中,流通环节的损耗和运输成本占据成本大头。我国的传统水果产业链存在着低效率和损耗严重的老大难问题,据弗若斯特沙利文,我国水果零售行业损耗率普遍在35%-45%。 图源百果园官方微博 此前,有媒体报道,余惠勇称,在配送这一环节,百果园的损耗率大概是1%左右,在门店端的损耗大概不到4%,因此整个损耗率不超过5%。 但百果园的整体成本还是没降下来太多,原因在于,鲜果的采购成本仍然占据整个销售成本的绝大部分。 2022年、2023年,百果园的销售成本分别为99.98亿元、100.76亿元。占据销售成本大头的则为已出售存货成本,也就是水果采购成本,近两年占比约95.2%及95.4%。 为了降低成本,百果园选择直接越过中间层层叠叠的经销商,从原产地直发,批量运输到水果店,卖到消费者手中,希望由此降低运输成本,提高产业上下游的效率和利润。 截至2023年年末,百果园已与16个产地供应商合作完成16个产地仓的建设,涉及10种水果,覆盖全国11个省市。此外,百果园在全国不同的城市建立了29个仓库,作为初级加工配送中心。 但从账面来看,水果采购的成本依然居高难下。 那么,为了能够从水果生意中赚取更高利润,百果园的水果只能卖得更贵。它选择的路线是专门卖高品质水果,提高定价。 早在2007年,百果园就提出“要做好吃的水果”。但“好吃”是一个主观概念,也难以被标准化复制。为此,余惠勇围绕这一战略制定了“六大指标”去定义什么是“好吃”,将水果等级分为招牌、A、B、C四个等级。 图源百果园官网 目前,门店中销售的大多数主要是A、B等级的水果,还有少部分招牌果。为了强调这一分类标准,百果园App、小程序中每一个产品页面的添加了标准说明图,图上注明了招牌为非常好吃,A级为很好吃,B级则是一般好吃。 但仅仅是这样,百果园还是觉得不够。今年,百果园将高端战略进一步升级,提出要做“高品质水果专家与领导者”,同时发布“十年计划”,表示2023-2032年公司将聚力发展零售、To B、品类事业、开拓国际市场四个方面。 与此同时,百果园管理层还立下目标,要在2032年实现门店数超万家,终端零售额超500亿元。 为了更高端,百果园把钱花出去了,也就成了这次盈利预警的主因,但在消费者普遍捂紧钱袋子的当下,百果园可能还要撑过一段黑暗时期。 2、消费者不愿买单,加盟商还能陪跑多久? 从消费者层面来看,百果园的高端体现在哪? 大概是不断推出的招牌果、礼盒等高端产品,出现在了门店显眼的位置。 其中,所谓的招牌果,与其他果品的核心区别在于更高的品质。这些水果按照百果园“四味一度一安全”的分级体系,只有达到最高标准才能成为招牌果。 据官方介绍,这些招牌果来自全球黄金产地,采用先进的种植技术和检测标准,并仅在最佳赏味期上市。截至目前,百果园共打造出37个招牌果品种,如花凰金凤梨、水风铃莲雾、青妮王榴莲等。 除了单独售卖,招牌果还与其他级别水果混搭组成礼盒,成为了百果园重点推广的业务。 图源百果园官方微博 百果园在传统节日推出礼盒之外,还有“520”心形礼盒、儿童节水果糖礼盒以及高考季“金榜题名”礼盒。这些礼盒分为单一果品和多种果品组合,通常包含招牌果、A级果和B级果。 另一方面,为了与高端品牌形象匹配,百果园还在门店升级上下了功夫。 比如其特别开设了水果体验大店,划分了招牌果专区、健康果礼区、果汁果切体验区和亲子休闲区。与普通门店相比,体验大店着重强调招牌果和礼盒的存在,还提供水果试吃和可供休息的桌椅,提升消费者的购物体验。 百果园上述这些举措,都指向更高端的品牌和更高的水果价格,但现实却是,当下,消费者对价格愈加敏感了。 如今,大多数人购物时更注重“性价比”。相较其他商超和电商平台的水果,尽管百果园的水果品质更有保障,但也更加昂贵。在水果尚未成为大多数人每日饮食标配的情况下,百果园的高端战略仅能吸引少部分高收入群体。 另一方面,更激进的高端化战略之下,百果园的加盟商们,也感受到了更大的压力。 事实上,百果园并不依赖C端消费者赚钱,而是靠加盟商。 百果园的加盟业务提供A、B两种模式,即全额投资和投资分摊。其中,A模式要求加盟商全额投资以及负责门店的日常经营,B模式则由百果园提供门店设备和装修,加盟商需要负责其余投资以及日常经营。无论选择哪种模式,百果园都会根据门店的毛利额收取3%到20%的特许经营资源使用费。 图源百果园官方微博 2023年,百果园的自营门店只有12家,另外6081家全是加盟制模式,加盟门店为其贡献的产品销售收入,也高达99.4%。 但如今,百果园的很多加盟商也面临着经营压力,尤其是高房租和人力成本。 连线Insight注意到,在社交媒体上,不少百果园的加盟商叫苦不迭,据豹变报道,部分地区特别是武汉的一半门店处于亏损状态。而即使在一线城市,加盟店的盈利情况也不稳定,许多加盟商未能熬过两年回本期,就选择了转让店铺。 加盟商赚不到钱,自然就会选择闭店,这也是百果园扩张放缓的原因——过去两年,百果园加盟门店数量的增速明显放缓,稳定在7%左右,而在2019年-2021年,百果园加盟门店数量的年增长率高达10%左右。 截至去年年末,百果园在中国22个省市共拥有6093家门店,覆盖170多座城市。百果园曾放言在2020年实现开1万家店的目标,但这一目标至今未能达成。在今年的新战略中,这个万店目标被延后至2037年。 若百果园无法提升利润,让广大加盟商实现更多盈利,达成一万家门店的目标,将会更加遥远。 3、百果园自救,还是要考虑降价? 在竞争日益激烈的市场中,近几年,百果园也在多方尝试,试图为公司找到新的增长曲线。 比如去年,公司设立了To B事业群,下设两条主线: 一是自营业务,主动开放供应链为生鲜商超提供服务;二是平台业务,也就是百果园自建的B2B交易平台——“般果”,提出十年内力争GMV破千亿的目标。 为了实现这些目标,百果园打算从五个方向全面发力:全面开放供应链、壮大To B单品品牌、拓展销售渠道、开拓企业和社区需求,以及在内容电商领域大展拳脚。 其实,百果园早在2017年就开始了生鲜业务。当时,公司的线上业务已经实现盈利,每月销售额超过1.2亿元。面对生鲜电商的“前置仓”模式,百果园另辟蹊径,利用1500个门店,既做前置仓又当品牌广告牌,不仅节省了建仓成本,还提高了效率。 再到2019年,百果园推出“大生鲜”战略,试水独立生鲜平台“百果心享”和社区团购“熊猫大鲜”,希望将水果用户转化为生鲜消费者,而不是只是打价格战。 尽管如此,大生鲜业务的进展却不温不火。由于独立供应链的缺乏,大生鲜产品只能根据订单提前采购,导致产品丰富性和市场占有率受限。在2021年,百果园的大生鲜业务占比仅为2%。 目前来看,正承受着较大业绩压力的百果园,上述这些尝试,也充满着不确定性。 事实上,面对市场压力,百果园也推出了促销优惠活动,但降价力度并不大。 在当前的APP中显示,每周五线上购买满39元的订单,所有用户可享8.8折,会员则为8.5折。若想拥有更多优惠,则需要开通年卡或月卡会员。百果园设置了3种年卡等级,但即使是最高级别的268元招牌版年卡,能拥有的折扣也只是每月60元券包、每日95折以及每周五85折。 图源百果园官方微博 相较其他商超平台,百果园的优惠力度和价格并不能让大多数消费者心动。就拿麒麟西瓜这一单品举例,在百果园APP上,一个约8斤的西瓜需要45.44元,约5.68元一斤。而在美团优选上,一个5斤到7斤的西瓜只需要22.99元,如果按6斤算,只需要3.83元一斤,几乎是前者的一半。 这进一步加大了百果园扩充市场规模的难度——水果零售市场本就高度分散,市场竞争尤为激烈。 在这种行业竞争激烈,以及其他业务进展不顺的情况下,百果园恐怕还是要从降本、进而降价的路径上想办法。 只有真正提升供应链能力,百果园才能确保有更大的生存和发展空间。 其实,在水果行业里,尽管成本难降,但也有玩家能够获得较高的毛利率,例如,作为鲜果产业链中游分销商的洪九果品,其毛利率在2019年至2021年分别为18.9%、16.6%、15.7%。 这表明,供应链的优化是降低成本的关键,百果园仍有提升利润的空间。不过,从洪九果品毛利率的下滑趋势来看,行业竞争激烈程度有增无减,留给百果园证明自己的时间并不多。 股价的波动反映了资本市场的担忧。自去年1月16日上市以来,百果园曾达最高市值超过110亿港元,但目前市值已经蒸发了近75%。 如何快速破局,对百果园来说变得越来越迫切,逐步优化供应链并扩大门店覆盖,对百果园来说尤为重要。 不仅如此,它还需要在成本控制和定价策略上找到平衡点,继续靠“天价水果”,很难支撑它的长期发展了。
网易云音乐崩溃了,会员调侃补偿“一人发头猪就好了”
8月19日,“网易云音乐崩了”登上热搜。许多网友反馈网易云音乐页面出现“服务器发生错误”,音乐播放、加载等均出现异常。此次故障持续的时间近两小时,下午17时左右,网易云在线音乐播放恢复正常。 “大家好,没有删库,没有跑路,故障已陆续修复。作为补偿,8月20日0-24时,云音乐搜“畅听音乐”,可领取7天会员权益到您的账户(具体规则请见活动页面)抱歉必须再说一遍,请您息怒。”故障修复后,网易云音乐作出了官方回应并对用户给出了补偿方案,此前,有传言称此次故障因“网易云音乐开发者删库跑路”,网易云音乐表示此次故障原因与机房无关。网易云音乐官方微博曾回应称,网易云音乐各端无法正常使用是由于基础设施故障。 此次网易云音乐故障影响的功能范围较广,根据用户反馈,故障期间,网易云客服入口、音乐榜单、评论区等页面均无法正常访问,用户可以收听部分本地歌曲,但在线音乐无法正常播放。 不少用户在微博调侃“上班摸鱼受到了影响”“下班路上不能听歌了”,网易云如何针对此次故障“善后”受到用户关注,不少用户期待网易云赠送会员作为补偿,Rokid创始人兼CEO祝铭明在社交平台调侃:“我们这些会员要求不高,一人发头猪就好了。” 今年3月,网易云音乐也曾因系统故障登上热搜,彼时,有网友反映网易云音乐登录状态失效,需要重新登陆,网易云音乐客服回应称,登陆情况异常是网络异常导致,与版本更新无关,故障在一段时间后修复。 近期各类APP交替出现故障,考验平台基础设施、技术能力、修复速度的同时,如何做好用户运营亦受到关注。一个值得关注的现象是,对在线音乐平台来说,付费用户对营收的影响也越来越大。 目前,网易云音乐有着两亿多的活跃用户。财报数据显示,截至2023年底,网易云音乐在线音乐服务月付费用户数为4412万人,相比2022年底增加585万人。2023年底,网易云在线音乐服务月活跃用户数由2022年的1.894亿人增加至2.059亿人。同时,网易云有160.3万社交娱乐服务月付费用户。2023年,网易云音乐来自订阅会员的收入同比增长20.2%。 网易云在财报中表示,尽管整个行业放缓,但网易云音乐2023年的在线音乐服务月活跃用户数仍增长至205.9百万人,同比增长8.7%,这一增长主要来自于不断扩大差异化的优质内容、用户体验的提升以及平台运营能力的加强。 数据显示,由于社交娱乐服务收入的下降,2023年,网易云收入由2022年的人民币90亿元减少至79亿元,同比下降12.5%。但由于规模效应及持续成本优化,网易云音乐毛利率由2022年的14.4%上升至2023年的26.7%,网易云音乐实现了首次实现全年盈利,录得经调整净利润人民币818.5百万元, 未来,能否持续提升在线音乐服务收入,以音乐和用户体验吸引更多付费用户、降低获客成本,关系着网易云音乐能否实现长期盈利。 故障目前并未对网易云音乐股价产生重大影响。8月19日,云音乐股价以94.25港元/股收盘,上涨2.89%。
大模型的“掘金卖铲”生意,AI Infra的最佳机会来了?
在19世纪的淘金热中,最赚钱的并不是挖金矿的,反而是那些卖铲子、卖牛仔裤的人。正如卖铲人在淘金热中成为最大赢家,在当今AIGC时代,AI Infra也扮演着类似的角色。 如果用云计算三层构架做类比,AI Infra与PaaS层级相似,是链接算力和应用的中间层基础设施,包括硬件、软件、工具链和优化方法等,为大模型应用开发提供一站式模型算力部署和开发工具平台。算力、算法、数据可以看作IaaS层,各种开源和闭源模型则是SaaS在大模型时代的新演变,即MaaS。 随着大模型应用落地的进程不断加速,AI Infra的价值潜力被进一步释放。中金数据预测,目前,AI Infra产业处于高速增长的发展早期,未来3-5年内各细分赛道空间或保持30%的高速增长。 当大模型进入大规模应用落地时期,提供大模型训练、部署和应用时所需的基础设施成为关键一环,AI Infra成为大模型应用爆发背后“掘金卖铲”的最佳生意。 中台模式解锁AI生产力 从ICT产业的演进轨迹来看,三层架构似乎是宿命般的终极图景。在传统的本地部署阶段,操作系统、数据库、中间件等基础软件通过控制硬件交互、存储管理数据、网络通信调度等功能,解决底层硬件系统的复杂性难题,让上层应用开发者能专注于业务逻辑进行创新。 在云定义一切的时代,也形成了IaaS、PaaS、SaaS协同进化的经典架构,其中PaaS层提供应用开发环境和数据分析管理等服务,为云计算加速渗透奠定了坚实基础。 经历了漫长的蛰伏期后,AIGC按下了人工智能通用化进程的快进键,整个产业在狂飙突进的氛围中急速重构。算力与应用无疑是最耀眼的主角,但二者之间的鸿沟堪比天堑,大模型面临“悬浮”或“踏空”的风险。 从这个意义上讲,AI Infra犹如一座桥,可以承担类似基础软件或PaaS曾经扮演的角色——通过构建新型的软件栈及综合服务,赋能算力挖潜、模型优化和应用开发,成为连接算力与应用的中坚力量。 AI Infra涵盖一切跟开发部署相关的工具和流程。随着云计算的不断发展,又逐渐衍生出了DataOps、ModelOps、DevOps、MLOps、LLMOps等一些XOps的概念。 从宏观的角度来看,所有XOps本质上是为了开发部署生命周期的提效。比如DataOps是为IaaS层的存储和PaaS层的数据处理提效的,DevOps、MLOps实际上是为PaaS层开发部署提效的,LLMOps是为MaaS层提效的。 事实上,在AIGC风起云涌之前,关于AI中台的理论与实践就已如火如荼地展开。但当时的AI中台更像是“救火队员”,功能比较庞杂,干了不少“脏活”、“累活”,却难以获得上下游的认可。 大模型为AI平台化搭建起更宽广的舞台,也让AI Infra“掘金卖铲”的逻辑更具确定性,进而赢得可观的发展空间。相关机构预测显示,未来3~5年AI Infra产业将保持30%+的高速增长。 就像“三明治”的两片面包间可以有无数种夹层选择,身处算力与应用之间的AI Infra同样不拘一格。从广义上看,AI Infra涵盖人工智能基础框架技术,涉及大模型训练、部署领域的各种底层设施;狭义而言,基础软件栈是AI Infra的核心组成部分,优化算力算法、促进应用落地是其主要目标。 AI Infra定义的相对开放为不同的路径探索提供了更多可能。基于各自的资源禀赋与市场定位,业界的资深厂商与新兴玩家正在积极拓展AI Infra的疆界,不少做法值得借鉴。 AI Infra将是 下一个应用热点? 相比模型价值,卷AI应用成为行业共识。李彦宏坚信,基础模型之上将诞生数以百万计的应用,它们对于现有业态的改造作用,比从0到1的颠覆作用更大。 如今AI应用的供给在不断增加,IDC在年初时预测,2024年全球将涌现出超过5亿个新应用,这相当于过去40年间出现的应用数总和。 最近,视频生成类模型产品扎堆出现,快手的可灵、字节跳动的即梦、商汤的Vimi集体亮相,此外还有AI搜索产品、AI陪伴类产品等层出不穷。 大模型应用爆发趋势已然确定,根据InfoQ研究中心数据,2030年AGI应用市场规模将达4543.6亿元,模型应用层的巨大机会已经吸引了几乎各行各业的参与。 而在大模型应用之下,AI Infra成为其爆发的隐藏推手。 目前,大模型产业链大致可以分为数据准备、模型构建、模型产品三个层次。在国外,AI大模型的产业链比较成熟,形成了数量众多的AI Infra(架构)公司,但这一块市场在国内还相对空白。 在充满不确定性的道路上,率先找到清晰的赛道,快速建立显著的里程碑尤为重要。AI Infra市场尚处于混沌期,每个科技巨头都希望在自己的生态中形成闭环。 在国内,巨头们都有一套自己的训练架构。 比如,华为的模型采用的是三层架构,其底层属于通识性大模型,具备超强的鲁棒性的泛化性,在这之上是行业大模型和针对具体场景和工作流程的部署模型。这种构架的好处是,当训练好的大模型部署到垂类行业时,可以不必再重复训练,成本仅是上一层的5%~7%。 阿里则是为AI打造了一个统一底座,无论是CV、NLP、还是文生图大模型都可以放进去这个统一底座中训练,阿里训练M6大模型需要的能耗仅是GPT-3的1%。 百度和腾讯也有相应的布局,百度拥有覆盖超50亿实体的中文知识图谱,腾讯的热启动课程学习可以将万亿大模型的训练成本降低到冷启动的八分之一。 整体来看,各个大厂之间的侧重点虽然有所不同,但主要特点就是降本增效,而能够实现这一点,很大程度上就是受益于“一手包办”的闭环训练体系。 反观国外,成熟的AI产业链形成了数量众多的AI Infra公司。 如果把开发AI应用看成建房子,那么AI Infra就是提供水泥钢筋的施工队。AI Infra施工队的价值点在于它是一个集成平台,将下层的算力芯片层与上层的AI应用层打通,让开发者实现一键调用,并且实现降低算力成本、提升开发效率并且保持模型优秀性能的效果。 让应用更简单,让AI落地更便捷,是AI Infra的使命。可以说,AI应用的市场有多大,AI Infra的机会就有多大。 AI Infra公司有的专门做数据标注、做数据质量、或者模型架构等。这些企业的专业性,能够让他们在某一个单一环节的效率、成本、质量上都要比大厂亲自下场做得更好。 比如,数据质量公司Anomalo就是Google Cloud和Notion的供应商,它可以通过ML自动评估和通用化数据质量检测能力,来实现数据深度观察和数据质量检测。 这些公司就像汽车行业的Tier 1,通过专业的分工,能够让大模型企业不必重复造轮子,而只需要通过整合供应商资源,就能快速地搭建起自己模型构架,从而降低成本。 但国内在这一方面并不成熟,原因在于:一方面国内大模型的主要玩家都是大厂,他们都有一套自己的训练体系,外部供应商几乎没有机会进入;另一方面,国内也缺乏足够庞大的创业生态和中小企业,AI供应商也很难在大厂之外找到生存的空间。 以谷歌为例,谷歌愿意将自己训练的数据结果分享给它的数据质量供应商,帮助供应商提高数据处理能力,供应商能力提升之后,又会反过来给谷歌提供更多高质量数据,从而形成一种良性循环。 国内AI Infra生态的不足,直接导致的就是大模型创业门槛的拔高。如果将在中国做大模型比喻成吃上一顿热乎饭,那必须从挖地、种菜开始。 目前,在AI 2.0的热潮中,一个重要的特点就是“两极化”:最热门的要么是大模型层、要么就是应用层。而类似AI Infra的中间层,反而是很大的真空地带,也可能是下一个机遇所在。 铲子难卖,金矿难挖 尽管在大模型应用爆发的当下,AI Infra层潜藏着巨大的生意。但是对于这些做AI Infra的公司来说,即使他们在自己的专业领域如此强大,在潮水的变化面前依然脆弱。 英伟达CUDA生态已经发展了20年,在AI领域,最先进的模型和应用都首先在CUDA上跑起来。 每个硬件之间都有不同的接口,CUDA统一了不同接口之间的语言,让使用者能够用一套标准语言去使用不同硬件。在模型开发过程中,开发者势必会趋同于在同一个语言体系中去完成自己的开发。而这实际上就构成了英伟达CUDA生态厚度。 目前,CUDA生态在AI算力市场占据了90%以上的份额。不过随着AI模型的标准化,模型之间结构差异变小,不再需要调度多种大小模型,英伟达CUDA生态厚度在变薄。 即使如此,英伟达在算力市场也是绝对王者。据业内人士预测,英伟达在接下来的3~5年当中,还会是整个AI硬件提供商中绝对的领头羊,市场发展占有率不会低于80%。 对AI Infra层的卖铲厂商来说,外有英伟达守矿人,堵在门口卖门票与铲子,好不容易找到一条进入金矿的小路,却发现,里面的挖矿人已经习惯“徒手”挖矿,不再接受新铲子。 在国内,企业为软件付费意愿低,且大多习惯集成式服务。国内SaaS投资已经降到冰点,如果AI Infra层厂商单靠卖硬件或软件难以实现商业化。 伴随AI应用的快速发展,未来谁能够为多样化的应用场景提供高效便捷的大模型一站式部署方案,谁就有可能在这场竞争中胜出。而这其中,底层技术、中层平台、上层应用缺一不可,只有让各方面能力得到更全面、均衡地发展,才能在AI之路上走得更远、更稳健。 放眼未来,人工智能重塑千行百业的进程刚拉开帷幕,Al Infra铺就的厚雪长坡有助于这个超级赛道行稳致远。今年,数据基础设施已在顶层设计中“独立门户”,人工智能基础设施战略地位的跃迁亦不遥远。
率先开放!讯飞打造全新中文交互模式,极速畅聊还能角色扮演
中国版GPT-4o来了!讯飞星火版“Her”抢先到来,打造国内首个全新中文交互模式,并将在8月底率先全民开放使用。这意味着国内首个对标GPT-4o语音功能的产品正式到来。 8月19日,科大讯飞宣布星火语音大模型更新,正式推出星火极速超拟人交互,并将其能力落地在讯飞星火APP“小星畅聊”功能中。星火极速超拟人交互响应速度更快,对话更加自然流畅,随时打断、插话之后还能秒回。有趣的是,星火极速超拟人交互还能感知你的情绪变化,并共情地回应你的喜怒哀乐,在表达上更加自然、更具情感。 从官方展示效果来看,星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破,让整体的交互体验更自然、更有趣,就像电影《Her》中展现的智能且人性化的聊天效果一样。 在响应速度上,星火极速超拟人交互支持极速响应多轮交互,能够在对话过程中生成高质量的回答,并且响应速度更快、与GPT-4o响应时间相当,几乎与人类正常聊天节奏一致,并且对话中允许用户随时打断、插话,可谓实现了人机对话的“无缝衔接”。 在情绪感知情感共鸣上,星火极速超拟人交互可以在对话中感知到用户的喜、怒、哀、乐、害怕、困惑等各类情绪,不仅能根据声音的内容来判断,还能像朋友一样用合适的情感回应用户。比如,用笑声回应开心,安慰悲伤情绪……此刻是不是有一种《Her》的既视感。同时,星火极速超拟人交互还能识别用户咳嗽、猫和狗的叫声等,给出对应的回复语。 相比以前语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。“用调侃的方式给我说个笑话”、“用东北话给外地朋友介绍下锅包肉”、“说的更快一点”…… 此外,星火极速超拟人交互还支持“角色扮演”,可以模仿不同的角色陪你聊天。比如,“模仿孙悟空的声音来和小孩子对话”,超拟人便会模仿孙悟空的声音和人设和小朋友聊天。 今年5月OpenAI惊艳亮相了GPT-4o,展示了堪比电影《Her》中的人机交互体验,但迟迟没有面向用户开放,上个月底也只是选择性地向一小部分Alpha测试参与者开放部分语音功能。 讯飞星火版Her的到来,也代表国产大模型开始从追赶、对标到进行自主创新、走出差异化路线。 据科大讯飞透露,此次星火极速超拟人交互采用统一神经网络直接实现语音到语音端到端建模,对比传统的语音转文字、大模型生成回复文本、语音合成三步骤来说可谓“一气呵成”,大幅缩短响应时间的同时,也提升了交互拟人度和流畅度。 同时,结合讯飞多维度的语音属性解耦表征训练准则,将内容、音色、情感、语言、风格都信息进行解耦训练,使得星火极速超拟人交互能够更加灵活控制各类元素,还能根据需求便捷定制,让系统快速落地应用。 正是基于以上技术创新,8月底星火极速超拟人交互将率先全民开放使用。科大讯飞表示,基于全新端到端框架创新基础上,星火极速超拟人交互目前主要开放语音模态,未来会持续在交互上创新突破,不仅会带来更多更实用、丰富的功能,也会拓展到更多模态。 在2023年科大讯飞全球1024开发者节上,华为科技有限公司副董事长、轮值董事长徐直军曾表示,“华为公司在全球所有使用的智能终端的语音技术,都是来自于科大讯飞,而且不仅仅是中文”。这一波语音能力的革新,多轮交互、语义理解、指令跟随、逻辑推理、情感共鸣……代表了智能语音交互领域的一大阶跃。全新的星火超拟人交互模式达到了类人级别的极速响应和聪明、实用、流畅、自然的非凡表现,这一技术的应用和普及还隐藏着巨大的可能性——语音市场在这个时代将被重写,语音交互带动万物互联的第六次产业浪潮有望出现一次井喷。 该项技术突破,将会极大地促进智能语音技术进一步应用于智能手机、智能汽车、智能家电以及智能家居等各类消费级产品当中,并且随着全球化进程的加深,对多语种、多方言的需求也会持续增加。据国际数据公司IDC分析,预计到2030年,全球智能语音服务市场规模将达约731.6 亿美元,复合增长率27%。科大讯飞凭借上述技术突破有望收获新一轮产业红利。
世界上最癫的AI, 由人类模仿
人类模仿 AI 的视频成了新晋的流量密码。 上一秒还因口角所剑拔弩张,下一秒便放慢了动作,不知何时从哪里掏出一碗面,一杯酒,硬控我 21 秒的视频永远也猜不到下一秒会发生什么。 这种荒诞不经的场景切换,正是最近爆红网络的「人类模仿 AI」视频的典型特征。从 Reddit 到 X,这些模仿 AI 的视频把老外拿捏得死死的,甚至在外网收获了数百万的点击量。 反正看完这些视频,我的脑子里只剩下一句话,好一场酣畅淋漓的抽象艺术盛宴。 与 AI 割席,标榜人类的独特性 这些视频有个共同点:夸张的表情搭配动作,在放大镜的效果下模仿着 AI 的缺陷。 突如其来的场景转换和不连贯的叙事方式,既是为了自带节目效果博取流量,也是在模仿 AI 视频生成内容常常出现的「逻辑跳跃」。 就像刚学走路的孩子总会跌跌撞撞。AI 视频生成技术虽然进步神速,但青涩和不成熟依旧是当下普罗大众的第一印象。 在狂飙突进数年后的今天,离不开「炼丹」的视频生成质量固然有着提示词的兜底,但视频生成的稳定性更多是在从「无到有」走向「有到优」。 甚至也有的画饼画大半年的,除了个演示 demo 的空头支票,就再也渺无音讯了。 在最近的牛津数学公开讲座系列研讨会上,华裔数学家陶哲轩认为,AI 基本上就是一台「猜测机器」,它们既不像专家那样可靠,尽管有时它们可以提供专家级输出。 谁曾想,从最初主动拥抱 AI 的惊叹,到批评,再到愚弄,人类对 AI 的态度短短两年间就来了 180 度大转弯。 以风靡一时的 AI 写真为例。一年前横空出世的妙鸭相机还是香饽饽,跟风而至的网友纷纷打出了 5 分好评,也让 AI 写真干翻海马体的调侃流传至今。 然而,随着 AI 前所未有地入侵我们的生活,当新鲜感褪去,嗤之以鼻亦或者久处而厌开始成为常态。 即便是在小红书一搜,关于 AI 写真的评价也从最初的一片赞誉声,转为写满了避雷的故事。当 AI 不再是遥不可及的高科技,而是日常生活中随处可见的应用时,人们开始以更挑剔的眼光来看待它。 面对这种 AI 的青涩,不想与之「同流合污」的人类采取了最简单粗暴的做法——割席。所以我们看到越来越多人开始与 AI 划清楚河汉界,标榜起人类的独特性。 美国自由插画师 Beth Spencer 想出了一个笨办法,拿起 iPad 花 5 分钟画了一个充满生命力的标志,上面用英文写着「用人类智能创造」,以此来划分人类与 AI 的边界。 而在 Beth Spencer 之前,一个类似的活动已经在 2023 年初发起——「Not By AI」。 不管是网站、视频、书籍还是艺术创作,对于非商业用途的作品,人类原创内容只需要达到 90%,就可以免费使用这个电子贴纸。剩下的 10% 则可以使用 AI 进行翻译等细枝末节等任务。 因此,Not By AI 不是要否定 AI 的价值,而是要强调人类创造力的独特性。 毕竟在这个 AI 无处不在的时代,「人造」反而成了一种稀缺资源,如同在快餐文化盛行的时代,街边坚持手工制作的小店反而更受到欢迎。 AI 焦虑当前,人们需要抱团取暖 这场看似荒诞的「镜像游戏」背后,隐藏着人类对新技术的复杂情感和深层焦虑。 前段时间想蹭奥运热度的 Google 为 Gemini 做了一支电视广告,但上线仅一周就在观众的口诛笔伐中黯然撤下。 广告展示了一位父亲使用 Gemini 帮助女儿给田径运动员 Sydney McLaughlin-Levrone 写信。 这则广告的初衷或许很美好,但被骂也不冤枉。 原因在于大众早已给 AI 划定了红线,我们欣赏它的高效,却又害怕它的情感;我们依赖它的智能,却又担心它会取代我们的思考。 在职场无坚不摧的 AI 不能传递真情实感,当父亲用 AI 来协助女儿写信时,这种行为被视为越界。 给偶像写信这样充满感情的事,不应该让 AI 代劳。掺和上 AI 味的信件缺乏人情味,也更轻易触动观众心中那根敏感的神经。 AI 再强大,不应该也不能轻易介入人类最珍贵的情感交流。 因为它唤醒了人们心中潜藏的恐惧——害怕有朝一日,连最私密的情感交流都需要 AI 的协助。所以也难怪华盛顿邮报专栏作家亚历山德拉・佩特里直白地呼喊,求求一双没有看过这广告的眼睛。 而不论是通过夸张和幽默化模仿 AI 生成视频,还是给 AI 画上令行禁止的分界线,无一不是在重申人类的优越性。 ChatGPT 推出仅两个月,月活跃用户就达到了 1 亿,成为有史以来增长最快的消费应用程序。用户的飙升不只是统计图表上的一条曲线,也在无形中映射出人们面对 AI 迅猛发展所带来的焦虑。 各类社交平台的「AI 教父/教母」们也通过发布各种关于 AI 资讯来吸引关注和挑拨情绪,向普通人发起了一场信息的围剿。 以抖音为例,当你在平台上搜索 AI 相关的内容,你会发现无数的帖子和视频都在手把手教你如何玩转 AI,但仔细一看,教学是前菜,卖课和倒流才是阴影下的后手。 用更另类的方式来「驯服」AI,既让人们感觉自己理解了 AI,也在心理上获得某种控制感。 与此同时,这也是一种社会互动和群体认同的形式。比如在 TikTok上,#HumanvsAI 的话题标签已经累积超高的浏览量。 通过共同嘲笑或批评 AI,人们的抱团取暖强化了群体的认同感,形成了一种「我们 vs AI」的心理。 技术超速,我们如何适应? 技术的超速,有目共睹。 如果说,我们能识破这些模仿 AI 视频是因为人类刻意营造的不真实,但在 AI 时代,随着技术进步与「真实」界限的渐趋模糊,我们又该如何适应。 往前看,《纽约时报》报道了一起令人警醒的案例: 去年底,82 岁的退休老人 Beauchamp 被 AI 马斯克推广的一项高风险投资计划所吸引。马斯克的脸庞、BBC 的背书,「剑走偏锋」的 AI 让这场骗局天衣无缝。 入局的老人在接下来的数周内,通过一系列交易累计投资超过 69 万美元,耗尽了退休金。结果也可想而知,退休金和所投公司一同人间蒸发。 再往近一些看,最近以假乱真的 TEDx 演讲者的照片或视频刷屏全网,骗过了数百万网友的眼睛,上演了一出眼见未必为实的精彩戏码。 而经过一番深挖,网友发现这些照片正是出自 Stable Diffusion 团队的前成员 Leo Kadieff 之手。 他在 LinkedIn 揭秘道,这些所谓的 TEDx 演讲者照片其实是由 FLUX+LoRA 制作而成的,过程中甚至不需要经过任何的微调。 仅需一个 22MB 的小文件,用户就不必在每个提示词里堆砌一大堆与真实相关的词汇。简单一句「一张 RAW 超现实照片,超高清,8k」就足以解决生成的照片没有人味的问题。 随着如同洪流的 AI 生成内容触及互联网每个角落,最终得来的却是「真实性」的日渐流失。 在去年四月份的索尼世界摄影奖颁奖礼上,德国摄影艺术家 Boris Eldagsen 公开表示,他所获奖的作品实际上是由 DALL·E 2 创作而成。 他质疑彼时的摄影比赛是否已经准备好接纳 AI 生成的影像,并指出他通过提交 AI 作品参赛,试图测试这一问题,结果发现比赛并没有准备好应对这种情况。 Boris 的提醒振聋发聩,我们不能像对待房间里的大象一样,对 AI 在艺术创作领域,乃至各领域的介入视而不见。 假使有一日当人们无法区分 AI 生成的内容和人类创作的内容,并且意识到 AI 在某些领域的能力已经接近甚至超越了人类时,或许我们需要重新定位人类的价值和意义。 科幻小说《三体》中描绘了人类面对外星文明威胁时的反应,为我们提供了一个有趣的类比。 三体人拥有远超人类的科技,能够轻易摧毁地球文明。他们派出「智子」监视和干扰人类的科技发展,而人类的应对措施也反过来推动了科技和战略思维的进步。 正如著名未来学家阿尔文·托夫勒在《未来的冲击》中所警告的:「技术的发展速度远远超过了我们适应它的速度。」 历史上,面对新技术带来的冲击,总有一部分人选择抵制和破坏。 在上世纪 90 年代,破茧而出的计算机网络和互联网也遭到了一些传统行业的抗拒。很多公司和个人担心网络会导致信息泄露、隐私问题和业务不稳定等问题。 但现实给了我们一记清脆的耳光,很快人们爱上的第一台机器正是曾经抵制的电脑。 或许我们应该换个思路来看待当下的 AI(人工智能): 不必抱着你死我活的态度,它不是虚假的智能,只是不是人类的智能。 而机器以历史上从未有过的方式思考、学习,乃至与人类合作共事,这恰恰是我们最为擅长的事情。
AMD杀疯了!豪掷350亿收购支持英伟达芯片的AI服务器系统龙头ZT Systems
(图片来源:钛媒体App编辑拍摄) 刚收购完赛灵思两年多,“苏妈”再度开启“买买买”。 北京时间8月19日18点,美国芯片巨头AMD公司宣布,以现金+股票交易方式收购全球最大超大规模计算公司、领先的 AI 基础设施系统提供商ZT Systems,交易价值高达49亿美元(约合人民币350.14亿元),从而大幅扩展AMD数据中心 AI 系统业务。 AMD表示,49亿美元中,包括根据交易完成后的某些里程碑支付的高达 4 亿美元的或有付款。该公司强调,ZT Systems在设计和优化云计算解决方案方面拥有丰富经验,此次收购还将帮助云和企业客户显著加快大规模部署由AMD提供支持的AI基础设施,促使AMD提供基于跨芯片、软件和系统创新的领先AI训练和推理解决方案。AMD 预计,到2025年底,该交易将在非GAAP收入基础上实现增值。 该交易已获得 AMD 董事会一致批准,目前预计收购案将于2025年上半年完成,但须获得某些监管部门的批准并满足其他常规成交条件。收购完成后,ZT Systems将成为AMD数据中心解决方案业务集团的一部分。AMD将保留该公司的设计和客户团队,并考虑出售制造部门。 AMD董事长兼CEO苏姿丰博士表示:“收购 ZT Systems 是我们长期 AI 战略的下一个重要步骤,旨在提供可在云端和企业客户中快速大规模部署的领导力培训和推理解决方案。ZT带来了世界一流的系统设计和机架级解决方案专业知识,将大大增强我们的数据中心 AI 系统和客户支持能力。此次收购还建立在我们为加速 AI 硬件和软件路线图而进行的投资之上,将我们的高性能 Instinct AI 加速器、EPYC CPU 和网络产品组合与 ZT Systems 业界领先的数据中心系统专业知识相结合,将使 AMD 能够通过我们的 OEM 和 ODM 合作伙伴生态系统大规模提供端到端数据中心 AI 基础设施。” 消息公布后,AMD美股大涨,盘前现涨超2%,此前跌近1%。 据悉,ZT Systems总部位于美国新泽西州锡考克斯(Secaucus),拥有超过15年为全球最大的云公司设计和部署数据中心 AI 计算和存储基础设施的经验。ZT Systems 的设计、集成、制造和部署能力使其成为 AI 训练和推理基础设施的领先提供商之一。 值得注意的是,英伟达、OpenAI一直是ZT Systems的客户。今年6月,ZT Systems宣布推出采用 NVIDIA GB200 Grace Blackwell 超级芯片的 ACX200 解决方案,用于下一代加速计算。 因此,鉴于英伟达和AMD的关系,这意味着,AMD收购ZT Systems完成之后,与英伟达的合作或将停止。 交易完成后,ZT Systems 将加入 AMD 数据中心解决方案业务集团。ZT 首席执行官 Frank Zhang 将领导制造业务,ZT Systems总裁 Doug Huang 将领导设计和客户支持团队,两人均向 AMD 执行副总裁兼总经理Forrest Norrod汇报。AMD 将寻求战略合作伙伴收购 ZT Systems 业界领先的美国数据中心基础设施制造业务。 ZT Systems 首席执行官 Frank Zhang 表示,“我们很高兴加入 AMD,共同在设计定义计算未来的 AI 基础设施方面发挥更大作用。近 30 年来,我们不断发展业务,成为全球最大云公司的关键计算和存储基础设施的领先供应商。AMD 与我们有着共同的愿景,即我们的技术和员工在设计和构建支持全球最大数据中心的计算基础设施方面发挥着重要作用。” 事实上,就在2022年2月,AMD宣布以全股票交易方式完成对FPGA大厂赛灵思公司的收购,交易价值为498亿美元(约合3165亿元人民币)。收购完成之后,AMD CEO苏姿丰将继续担任公司的CEO,赛灵思总裁兼CEO Victor Peng将加入AMD,任新成立的自适应和嵌入式计算集团 (AECG) 的总裁。然而,预计到8月30日,Victor Peng将从AMD公司退休。 如今,收购赛灵思不足3年,AMD再度出手收购产业链龙头,加注 AI 算力赛道。 AMD强调,在过去 12 个月中,除了增加有机研发活动外,AMD还投资了超过10亿美元来扩展 AMD AI 生态系统并增强公司的 AI 软件能力。 (作者|林志佳,编辑|胡润峰)
“华为天才少年”再放大招!一口气发布五款商用人形机器人:灵犀X1为最大“彩蛋”,可以实现“0元购”
图片来源:摄图网 目前,人形机器人成为科技界最炙手可热的赛道之一,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品。随着人工智能和机械技术的快速发展,人形机器人的应用前景广阔。它们不仅可以在制造业中发挥作用,还能用于个人服务、医疗护理和教育等领域。人形机器人的出现将改变人们的生活方式和工作方式,提高生产效率和生活品质。 8月18日上午,智元机器人举行2024年度新品发布会,智元联合创始人“稚晖君”(彭志辉)主持并发布了“远征”与“灵犀”两大系列共五款商用人形机器人新品。彭志辉还展示了智元在机器人动力、感知、通信、控制四大领域的自主研发成果,以及具身智能G1到G5技术路线图和AIDEA具身智能数据系统。 “稚晖君”有着“华为天才少年”、“野生钢铁侠”等称号,曾在2020年加入华为,从事昇腾AI芯片和AI算法相关研究工作。同时,他也是个科技up主,在哔哩哔哩有着超过250万的粉丝。2022年底,“稚晖君”离开华为,于2023年成立智元机器人。据企查猫显示,上海智元新创技术有限公司成立于2023年02月27日,注册资本6,991.7342万人民币,法定代表人舒远春,公司经营范围包括:智能机器人的研发;服务消费机器人销售;智能机器人销售;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能应用软件开发;人工智能公共数据平台;人工智能通用应用系统;人工智能硬件销售;人工智能基础资源与技术平台等。 智元此次发布的五款商用人形机器人新品,采用了家族化设计语言,有轮式与足式两种形态,覆盖交互服务、柔性智造、特种作业、科研教育和数据采集等应用场景。这五款商用人形机器人分别是:交互服务机器人远征A2、性智造机器人远征A2-W、重载特种机器人远征A2-Max、全栈开源机器人灵犀X1和专业数采机器人灵犀X1-W。 智元机器人合伙人兼营销服副总裁姜青松透露,智元双足人形机器人预计今年10月份开始量产,后期预计一个月生产100台。智元机器人今年整体出货量预计达300台左右,其中人形200台、轮式机器人预计出货100台左右。他强调,“最终肯定可以超过300台这一数量”。 值得一提的是,在发布会的尾声,远征A2-W推着一个“神秘箱子”缓缓上台,这正是本场发布会最大的“彩蛋”——智元机器人首个模块化机器人灵犀X1,身高133厘米,体重不到66斤,十分小巧。 灵犀X1由智元X-Lab打造,这是智元于6月新成立的一个实验室,又叫“稚晖君实验室”,专门做一些前沿技术创新类研究。“稚晖君”表示,这是一个基于创新和热爱诞生的实验室,因此灵犀X1的定价为0元,大部分设计资料和代码,包括本体的设计图纸、软件框架、中间件源码、基础的运控算法等将被开源,以吸引更多人才加入行业生态共建,开启“人形机器人人人造”的时代。 回看人形机器人行业发展情况: ——科技企业与跨界龙头纷纷布局人形机器人 当前人形机器人的主要布局者多为科技公司。此外,也有多家跨界公司入局。从国内企业来看,2022年8月,小米发布人形机器人Cyberone;2023年4月,腾讯(Robotics X实验室)发布了灵巧操作研究成果,并推出自研机器人灵巧手TRX-Hand和机械臂TRX-Arm;2023年8月,智元机器人推出远征A1,对百亿级别的开源大模型进行了调优,使其具备理解人的指令,并对指令进行任务编排、执行闭环的能力;同月,均普智能宣布基于丰富的工业机器人经验,正在积极研究探索人形机器人领域的业务机会,以进行规划和布局;同月,字节跳动拟入局机器人,探索把AI大模型能力用到机器人上,目前并未确定机器人的具体形态与具体数量目标。 ——准直驱方案有望成为部分关节首选 特斯拉当前的方案采用的是传统的刚性驱动器的结构,特点是精度高,但功率密度达不到生物肌肉的水平、抗冲击性也一般,不太能适应复杂的地理环境。除了刚性驱动器外,还有弹性驱动器、准直驱等方案,控制算法会复杂、精度一般,但安全性和效率显著提升,其中准直驱方案在一些四足狗、人形机器人方案中使用较多。 相较于刚性驱动器方案(无框力矩电机+谐波减速器+力传感器+编码器),准直驱方案多采用直驱电机低减速比的行星减速器磁编码器,无须昂贵的力传感器,通过电流环直接实现力控,故适合力控精度要求高、响应快、抗冲击的场合。目前国外UCLA的机器人Artemis自研四个准直驱模组用于髋关节。 ——人形机器人应用市场将由细分领域突破到通用型 参照自动驾驶,从L1到L3是经历5年以上迭代的,并且完全自动驾驶L5也仍需时间。人形机器人的成熟也是渐进式,可在细分市场的率先商业化,如工厂生产、安防巡检、物流配送、服务业引导、救援、军事等,初期功能单一,后逐步成熟转为通用型机器人,由Tob转为Toc,进入家政等市场;更远的未来,人形机器人有望应用于航天航空领域。 根据人形机器人行业快速发展的趋势,随着商业化步伐持续加快,行业将迎来一波爆发性增长。据《人形机器人产业研究报告》预测,至2024年,中国人形机器人市场规模将达到约27.6亿元,而到2029年,该市场规模有望扩大至750亿元,占据全球市场的32.7%,到2035年有望达到3000亿元。
国产AI机器人好超前…弹琴泡茶打咏春,还能撸猫??
量子位 | 公众号 QbitAI 什么水平,让海外最火AI机器人Figure的CEO都第一时间关注? 国产人形机器人大秀肌肉,最新技能居然是弹琴泡功夫茶……和颠勺?! 手握琴竹,精准轻巧敲击每根琴弦,演奏动听音乐。 熟练泡一壶功夫茶,十几道工序、数个杯壶轻松拿捏。 搞定一份香喷喷的华夫饼,最后还附送一个祖传颠勺。 “闲情逸致”时还能带你练练咏春,这不就是机器人版叶师傅? 注意哦,以上操作都是机器人独立自主完成,原倍速展示。 不仅手超稳,而且各个动作行云流水、一气呵成,像吃了德芙般丝滑。 甚至是泡功夫茶这种繁琐的长序列任务,它脑子也规划得清清楚楚,把十几个不同的步骤,陶瓷、金属、木、茶叶等不同材质、到不同形状的碗、盏、壶、杯,拿捏得死死的。 这需要机器人能像人一样学习、规划和执行,有强大的泛化能力和通用智能。 如上就是今天正式发布的中国人形机器人Astribot S1。 它由初创公司星尘智能(Astribot)开发,而且不玩虚的,8月21日到25日会在北京的世界机器人大会上直接亮相,对公众展示。 今年4月,S1在首次技术展示中,凭借熨叠衣、分拣收拾、颠锅、吸尘到竞技叠杯等几十个对机器人高难度,对人真有用的炫技动作,初登场就引发国内外不小讨论。 美国网友惊呼:中国AGI级别机器人震惊全!行!业! 不到4个月,Astribot S1以整机形态正式发布,这次又为你做了什么? 做家务使工具秀武术十项全能 Astribot S1的技能中,很大一部分是大家最关心的做家务环节。标语就是: 你远行无忧(尽管去浪),我守护家庭温暖。你在家悠然(放着我来),我助你乐享生活。 先做华夫饼,暖。 S1能稳稳抓着汤勺舀出面糊,倒进华夫饼机。 识别出面糊铺满锅底后,它抓住锅柄合上盖子。 这个过程中,机器人的腰部关节很重要。抓住打开的锅柄,需要一个探身的动作。如果机器人的腰不能配合上臂,很难完成这个大幅前伸的动作。 然后“扭开”旋钮给面糊加热。 “抓”叉取饼,不忘展示“翻”手腕颠饼的骚操作。 继续挑战长长长长长工序的泡功夫茶,暖。 它不仅考验机器人的精细操作,更看在环境、任务、物品的复杂度交织时的智能规划。 泡茶一般涉及洗茶、冲泡、倒茶、分茶等多个环节,每个环节要用多种不同工具。 它需要判断出各个环节使用哪些工具,还要抓握一系列完全不同的物品。 它需要实时调整力控。比如从陶瓷杯子中舀出茶叶时,陶瓷光滑易碎,不能用太大力抓握;但是下一个动作马上是拿起金属水壶倒水,机器人就实时调整力控,确保可以拎起水壶倒水。 除此之外,Astribot S1还会使用吸尘器。它怎么知道腰部反弓大腿发力能减少腰酸……怕是常去健身房。 给猫猫喂饭,特暖。 甚至是远程逗猫。 主人只需戴上XR头显,在工位都能陪自家猫主子玩,带薪吸猫! Astribot S1会通过设备实时远程获取人类手部运动轨迹,然后根据轨迹计算出自身双臂该如何协调,确保自己能在家有效和猫猫互动,同时又不搞乱房间or被误伤。 这需要机器人的运动系统能够快速响应,并能处理复杂的空间关系。 与此同时,Astribot S1还丝滑复刻了更多专家技能。 比如演奏扬琴。 因为琴弦和琴竹带弹性,对精准力控要求极高,机器人必须每次敲击马上准确反馈力觉,并实时调节敲击角度,太轻会触不到琴弦,力太大会出杂音,太慢乱节奏。S1:我太难了…… 而上次丢纸飞机,这次上投篮。 这个动作需要机器人全身姿态协同配合,开始时持球弯腰并抬高肘部,然后在腰部逐渐直立时调整手腕,最后腰和手同时发力投出篮球。 还有预告片里,跳海草舞还顺便极限下腰,自由度炸裂。 对比3个月前的首次技术展示,Astribot S1一路开挂。 不仅移动和操作范围变大了,环境和任务也更复杂,精细化程度更高。 这些高难度、长序列、可泛化任务,Astribot S1是如何实现的? 高价值的上半身+可落地的下半身 首先在形态上,Astribot S1采用人形上半身+轮式底盘的路线。 上肢操作正在逐渐成为具身智能的焦点,自然界能用手干活的基本都是智能化水平非常高的哺乳动物,而人类大部分操作都由上肢和手完成,因此上半身的智能决策+操作,就成了解决真实需求、能实际落地应用的核心技术壁垒。而S1在4月刚面世时,就主打一个同规格机器人中“最强操作”。 而代表移动能力的下半身,星尘选择了“可落地”的轮式,稳定性高、能耗低、控制简单,更重要的是人类大部分时间都在平面环境生活工作,比如家庭、办公室、工厂和购物中心等,轮式已经能覆盖很大一部分应用场景。 而头、手、躯干均采用模块化设计,可按不同需求灵活组装或拆卸。 S1身体指标极度仿人,单臂自由度为7,和人类一样。手部有2根机械手指,能完成大多数任务,灵巧手也在研发中。 运动以及单臂负载能力都超过了人类普通男性,定位精度达0.03mm。 多维数据高效采集 突破具身智能瓶颈 如果机器人的智能看AI,那AI就看数据、算法和算力这三大要素。 GPT能产生划时代的突破,离不开数以百亿的训练数据,这些数据在互联网容易获取。而训练机器人,直接可用的数据几乎为零。因此能否获得高质量且足够便宜的数据,成了当下制约机器人发展的瓶颈,和拉开公司竞争的重要手段。 而星尘就在具身智能数据获取上具备独特优势。 一方面,S1能从海量的真实世界视频数据、人体动作捕捉数据中快速学习。另外,S1还能以第一人称视角高效收集视觉、听觉、触觉到力觉等最接近真实世界的多维度、高质量数据。 综合这些高质量数据,星尘就能进行更高效的规模化训练,同时降低了机器人高质量数据的采集成本、数据量级和新任务训练难度,极大提升了泛化性。 当与真实世界持续交互,S1能源源不断产生新的“学习资料”,从而持续学习进化,向通用人工智能迈进。这也是S1能在学习、思考和执行上如此像人的关键。 而在AI算法上,加载大模型,让S1具备在复杂环境中的感知、认知、实时决策能力,及智能理解和多模态交互执行能力,实现物体、任务和环境级别通用操作泛化。 这意味着S1有了“最强大脑”,能更快速适应新环境、新事物,“举一反三”,“一通百通”。 刚柔耦合传动 最强操作还安全 机器人的全能,极大依赖其身体,也就是本体或硬件。 S1的“最强操作”,就来自其独特的刚柔耦合传动机构设计。通过将传感器装入传动过程中,S1能实时监测力的传输。比如削黄瓜时,不是依赖轨迹估算,而是像人一样,精准感知削皮刀压到黄瓜上时力的大小,再精准控制力的输出,这种特殊的传动结构,显著提升操作精度。 值得一提的是,通过刚柔耦合的硬件设计和创新力规划算法,让S1具备极高安全性。通过刚柔耦合硬件设计和创新力规划算法,它能在交互中精确控制力度,在运动中不伤人、不伤物、不伤自己。够安全,才有落地可能。 得益于这套悉心打磨的完备技术方案,Astribot S1的发布总能给人一种“技惊四座”之感。 当下具身智能领域正处于“百花齐放”的时期。不仅新秀林立,各家机器人的形态和技术路线也各有千秋。 Astribot S1的技术路线如何形成? 出自腾讯机器人实验室一号员工之手 回答这一问题,还需从Astribot S1幕后团队看起。 星尘智能(Astribot),成立于2022年12月;名字源自拉丁古谚语 “Ad astra per aspera”,意为“穿越苦旅,以达星辰”,代表了公司对AI机器人技术普及的长期计划与坚定承诺。 创始人兼CEO来杰,具有16年机器人研发经验,是AI和机器人领域的“老兵”。他于2014年加入百度,后担任“小度机器人”团队负责人。 2018年,计算机视觉和机器人领域世界知名专家张正友博士,也是腾讯最高专业职级的杰出科学家,当时正在筹建腾讯RoboticsX机器人实验室,来杰以一号员工的身份加入,之后主导研发了轮腿式机器人Ollie。 星尘智能的另一位创始人戴媛,在UIUC获得学士学位,后在UCLA拿下博士学位,主攻机器人感知。她在Nature Comm和Science Adv等顶刊上发表过30多篇论文,拥有70多项机器人专利。与来杰相同,她也是2018年就加入了刚刚成立的RoboticsX。 也得益于在腾讯RoboticsX机器人实验室的经历,星尘智能非常重视Design for AI的“软硬一体”能力,还搭建了与RoboticsX相似的团队结构,一半人主攻机器人本体,另一半强调用AI算法去做感知和运动控制,以此来探索AI和机器人的强耦合。 团队也大多来自腾讯、谷歌、华为、大疆等企业,和国内外顶尖高校和人工智能研究院。 让数十亿人拥有AI机器人助理 从成立第一天起,星尘智能的愿景就是让数十亿人拥有AI机器人助理。 这样的机器人助理,要能像人一样学习、思考和劳动,与人流畅智能交互,会使用人的工具和设备、帮人完成枯燥、困难或危险的任务,才能不断拓展应用场景边界,引领“AI+机器人”技术革新。 公司很快完成数千万美元的Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本超额跟投。 从四月技术展示,八月整机发布,星尘同时宣布于2024年内商业化。且通过关键零部件自研,S1具备明显的成本优势和价格竞争力。 总之,方方面面,星尘智能的脚步都很快。 而最快的,恐怕是机器人本身。四月时,创始人兼CEO来杰就放话: 欢迎大家来给S1提需求! 这样它的能力才能从55%、85%成长到99.99%,无限接近人类水平。 前文展示的打咏春拳这个能力,说不定就来自四月网友,如今已经实现了。 那你希望S1能为你做什么?
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
大语言模型(LLM)因“涌现能力”(emergent abilities)而拥有了超出人类预期的技能,但也因此让人类十分忌惮:操纵、欺骗人类,自主实施网络攻击,自动化生物研究...... 然而,也有专家认为,这种过度的担忧会损害开源和创新,不利于人工智能(AI)行业的健康发展。当前,有关“AI 灭绝伦”的争论愈演愈烈。 那么,“涌现能力”真的是导致 AI 大模型威胁人类生存的罪魁祸首吗?一项最新研究否定了这一观点。 来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。 他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多所谓的“涌现能力”,其实都是 AI 大模型在面对不熟悉的任务时,依赖于已有的数据和经验做出的“即兴表演”。 相关研究论文以 “Are Emergent Abilities in Large Language Models just In-Context Learning?” 为题,已发表在 AI 顶会国际计算语言学年会(ACL)上。 他们通过一系列实验验证了 AI 大模型在不同上下文条件下的表现,结果发现:在零样本(zero-shot)的情况下,许多大模型根本无法展现所谓的“涌现能力”,反而表现得相当一般。 他们表示,这一发现有助于理解 LLM 的实际能力和局限性,并为未来的模型优化提供新的方向。 智能涌现:只是“即兴表演”? AI 大模型的“涌现能力”来自哪里?它是否真如听起来那样神秘,甚至令人担忧? 为了破解这一谜题,研究团队选择了 GPT、T5、Falcon 和 LLaMA 系列模型作为研究对象,通过实验分析了非指令微调模型(如 GPT)和指令微调模型(如 Flan-T5-large)在 22 个任务(17 个已知的涌现任务和 7 个基线任务)和不同条件下的表现。 图|模型列表。 为了全面评估模型能力,他们将 Exact Match Accuracy、BERTScore Accuracy 和 String Edit Distance 作为评估指标。同时,为了提高实验的准确性,他们还进行了偏见控制,通过调整提示和输出格式,确保非指令微调模型的公平性,并通过手动评估验证模型输出的准确性。 在实验中,研究人员采用 zero-shot 和少样本(few-shot)两种设置,重点分析了 GPT 的表现能力。 图|非指令微调 GPT 模型在零样本下的表现。 令人惊讶的是,尽管 GPT 在之前的研究中被认为具有涌现能力,但在 zero-shot 的情况下,这种能力表现得非常有限。 具体而言,只有两个任务在不依赖上下文学习(ICL)的情况下展示了涌现能力,这两个任务主要依赖形式语言能力或信息检索,而非复杂的推理能力。由此可以得出,在没有上下文学习的条件下,GPT 模型的涌现能力受到了极大的限制。 然而,涌现能力的来源仅仅如此吗?研究团队又将目光转向了指令微调模型,提出了一个大胆的假设:指令微调并非简单的任务适应,而是通过隐式上下文学习,激发了模型的潜在能力。 通过对比 GPT-J(非指令微调)与 Flan-T5-large(指令微调)的任务解决能力,他们发现,尽管两者在参数规模、模型架构和预训练数据上存在显著差异,但在某些任务上的表现却出奇地一致。 图|两个模型的表现在高于随机基线部分有很大的重叠,这表明指令微调可以有效地获取上下文中的能力,而非导致功能性语言能力的涌现。 这一现象表明,指令微调模型可能并不是在展示一种全新的推理能力,而是通过隐式上下文学习,巧妙地利用了已有的上下文学习能力。 进一步的实验表明,无论是模型规模的增加,还是训练数据的丰富,指令微调模型在 zero-shot 的情况下,仍然能够与非指令微调模型表现出相似的任务解决能力。这一发现再次强调了指令微调与隐性上下文学习之间的紧密联系。 AI威胁人类生存:真实还是夸大? 尽管 LLM 在任务表现上展现出超凡的能力,但研究结果表明,这些能力并不意味着 AI 对人类生存构成实质性的威胁。 首先,LLM 的涌现能力主要来源于上下文学习和指令微调,这些技术在模型的设计和训练中是可以被预测和控制的,并未表现出完全自主发展的趋势,也没有产生独立的意图或动机。 例如,在社交智力测试(Social IQA)中,模型能够正确回答涉及情感和社会情境的问题,例如:“卡森醒来去上学时很兴奋。他为什么要这样做?” 在这一问题中,模型通过上下文学习和指令微调,能够超越随机基线(random baseline),选择出合理的答案。这说明模型并非在自发产生某种“智能”,而是在具体输入和设计条件下展现出的一种高级模式识别能力。 其次,研究发现随着 LLM 规模的扩大,这些能力表现得更加显著,但并未脱离设计者的控制。通过对模型的微调,可以引导 LLM 更好地理解和执行复杂任务,而这种能力的增强并不意味着模型会产生自主意识,还不足以对人类产生威胁。 在实验中,LLM在特定任务上的表现大大优于随机基线,尤其是在需要推理和判断的任务中。然而,这种表现依然依赖于大量训练数据和精心设计的输入提示,而非模型自发的智能觉醒。 这一结果进一步证实 LLM 的涌现能力是在可控范围内发展的,虽然这一假设仍需进一步的实验证实,但为研究理解大模型的涌现能力提供了一个全新的视角。 研究指出,虽然未来人工智能可能会在功能性语言能力上进一步发展,但其潜在危险性依然是可控的。现有证据还不能支持“AI灭绝伦”的担忧,相反,AI 技术的发展正在逐步朝着更加安全和可控的方向前进。 不足与展望 尽管这项研究为理解 LLM 的涌现能力提供了重要的见解,但研究人员也指出了该研究的局限性。 当前的实验主要集中在特定的任务和场景下,而 LLM 在更加复杂和多样化的情境中的表现尚需进一步研究。 研究人员表示,模型的训练数据和规模仍然是影响涌现能力的关键因素,未来的研究还需进一步探索如何优化这些因素,从而提高模型的安全性和可控性。 他们计划进一步研究 LLM 在更加广泛的语言和任务环境中的表现,特别是如何通过改进上下文学习和指令微调技术来增强模型能力,且确保安全性。 此外,他们还将探讨如何在不增加模型规模的情况下,通过优化训练方法和数据选择,实现涌现能力的最大化。
救命妈妈!我一字一句写的作业,又被AI判抄袭了
大家好,我是美国高中在读十年级的Jennifer。自从AI出现以来,我和我的同学都迫不及待地成为了它的忠实用户,非常好用。 随着学生用AI越来越多,我所在的美高老师都用AI来检测作弊情况,却时常出现误判的情况。 在谷雨星球一篇爆款文章里👉🏻《第一被AI淘汰的专业出现了?!》就提到了AI对非母语使用者的不友好,确实如此: ——自己辛辛苦苦一字一句写的作业,竟经常被它判定为「100%抄袭」! ▲ 哲学教授 Antony Aumann 因作业中的语法过于完美而发现学生使用 ChatGPT 代笔,引发对 ChatGPT 到底是教育工具还是抄袭的争议。截图来自 Youtube 视频 当时我以为这种情况只是个例,但万万没想到,我有一次完全自己写出来的历史作业,也被判定为「50%AI写作」。 而且不光是我这个国际生,连美国本土长大的同学,也被AI这样坑过。 这也让我产生了莫大的好奇: AI到底是如何判定一份文本是否抄袭的?如果我让AI自己写一份,再让AI自己去批改,结果又会如何?我们还该继续相信AI吗? ■这是我妈妈的留言 被老师鼓励使用的AI 从去年ChatGPT出现,学校对于AI的使用还是比较鼓励的。 我们老师就曾在晨会上聊过这个话题——并不是那种严肃深刻地讨论,而是更加包容且有互动性地表达一些观点并和同学们交流。 后来,在今年的一个关于选课的会议上,我们学校的CS老师介绍了一门关于AI研究的新课程,也针对AI的出现做了一些更加详尽地解释和说明,并且倡导大家合理地使用,保持好与AI的边界。 因为学校的态度还是比较「鼓励」的,我们也就比较频繁地使用着ChatGPT,它能很大地帮我提高学习效率,保持作业的准确率。 ■美高需要大量阅读,这些AI工具都可以帮我快速阅读和总结 那么,什么是「与AI的边界」呢? 准确来说,因为AI经常编造一些资料来源、引用等等,所以我觉得无论它多么完善,主导者依然需要是我们自己,而不能完全依赖AI。 完成作业的时候,我一般会用AI去给我一些建议。 比如英语写作project的语法修改建议或是结构建议,在这些方面AI确实比我们细致一些。 ■可以给出详细语法修改建议的Grammerly AI 数学方面,AI对我来说更是一个「进阶版作业帮」的用处,它最大的好处就是,在我遇到不会的题的时候,会给我非常详细的每一步思路,如果我不会,还可以追问它,就像一个一对一的老师。 但最大的问题是,AI的答案经常是错的。所以建议大家使用的时候,重点借鉴它的思路,答案还是要自己亲手算出来。 ■数学辅导AI有很多,通常都是上传作业后给出详细的每一步思路,比如这个号称正确率高于ChatGPT的Tutoreva(近期我们也会分享好用的数学AI资源) 还有,有时候我们西班牙语会有一些presentation,比如最近我们需要做一个关于某个城市的旅游介绍,需要先制作一个包含十个活动的旅游攻略。 这时候我们老师会说这一部分可以给到ChatGPT做出来一个大纲,但是具体内容需要我们自己写。 ■ChatGPT也是西班牙语等二外的学习助手 被AI背刺 AI在美国校园的使用越来越普遍,但问题也应运而生,比如作弊。 相应地,如今也出现了很多AI检测工具,像是Turnitin GPT,GPTZero等等,可以做论文查重,防止有人直接让AI代替自己写作业。 前段时间,我的学校历史课有一个作业是关于撰写一篇自己选择的历史事件的分析,前期的要求是进行research以及大纲撰写。因为我有改述一部分资料上的内容,所以我就比较好奇我的查重率会不会变高。 于是,我就在网上随便检索了一个查重检测工具,想看看会不会有什么有趣的发现。 毫无疑问,我的thesis statement通过了查重检测,显示「没有抄袭」。但是当我看到下面的「AI Detector」按钮的时候,我突然想到前段时间一直让我感到疑惑的问题: 无论是自己写的、又或是AI写出来的内容,都是由一个一个词藻组成的,AI到底会用什么分别其区别呢? 即使真的能够分辨出来,它的准确性是否值得参考呢?因此,我便把我的thesis statement又放在了这个AI检测的栏框里。 令人惊讶的是,AI检测给出的结果竟然是:我的内容有40%的可能是AI创作的! 至此,我开始对AI检测的真实可靠性产生了怀疑。因为各种不同的检测网站层出不穷,我便试图又找了几个网站希望获得一些其他的信息。 有些搞笑的是,这几个AI检测的网站中,每个检测结果都大相径庭。有的AI说100%都是人类写的,有的则说40%是用AI写的。 无所不能的AI出现了如此出人意料的漏洞,彻底点燃了我的探索欲——如果ChatGPT自己写一段文字,再让别的AI去检测,结果会是如何? 我便又让ChatGPT帮我写了一个相似方向的thesis statement,提交给不同的AI检测工具。 这次的结果,比检测自己的内容还让我更加出乎意料——这些100%由AI写的东西,在某些网站竟被判定为「人类撰写」。 这下我彻底迷惑了:人类写的被判定为抄袭AI,而AI自己写的又被归为人类的功劳,人工智能到底在干什么? 第二天上课的时候,我们被两两分成了小组互相讨论彼此作业的内容。我和我的同桌便探讨起了关于AI检测的内容。 接着,他也尝试把自己写的作业放进不同的检测工具里,看看AI是否能够较为准确地分辨和识别,最终的结果令我们两个人都惊了—— 一位纯英语母语者,作业竟然也被判定为AI写作。 我想,作为一个非母语者,或许语言能力没有母语者那么地道是一个情有可原的事情。但这个离奇的结果告诉我: AI不单单歧视的是非母语者,而是所有人类。 ■斯坦福一位学者的论文发现,AI在判定非母语者的论文时,会变得格外不可靠 那么到底是为什么,AI总是把在检测查重的时候背刺我们人类呢? 这个问题困惑了我很久,于是我查阅了资料。 斯坦福大学生物医学数据科学教授詹姆斯·邹发现,AI检测的指标依据叫做perplexity(困惑度),也就是词汇丰富度,词汇多样性,句法复杂性和语法复杂性。 显然,非母语人士会在这个指标上得分比较低,会被认为语言过于机械和匮乏。 相应地,要想绕过人工智能审查也非常容易,只要在自己写的内容里,加入一段AI生成的「包含复杂文学性语言」的语段,就能轻松获得高分。 ■这两年出现很多这类事情,比如这个新闻里的妈妈,女儿的作业被AI判定为90%抄袭,她花了几个月的时间向教育部门申诉,因为这个记录会影响大学录取 对我而言,语言能力其实是一个很笼统的表述—— 就像托福作为一个语言能力测试,分成了4个方面听说读写,有些人有一门或者两门十分出类拔萃,剩下的一两门不是那么显眼,或是获得了不是那么优异的成绩。 这算学习语言的能力过于机械、过于缺乏吗? 或者就说我自己,我是一个非常不擅长应试的人,这样的标准化考试会让我感到紧张、焦虑,但是我的GPA不算低、学校的成绩也能比较轻松地handle住,这算是语言机械、抑或是语言能力的缺乏吗? 应试能力≠学习能力,每个人能力也不应该被任何事物标签化,我觉得才是留学真正让我收获的意义。 ■几天之后的历史课,老师讲到了我们research的一些citation要求,虽然和之前的要求相差无几,但是这次多了一个关于AI Citing的要求。 我还会相信AI吗? 被AI「耍」了好几轮,我还会继续使用并相信它吗? 在我的观点里,AI依然是一个作为学生值得学习、探索以及使用的工具。 AI在很多时候能够让我节省很多时间,比如复习某个科目的guideline,一些难解的问题找不到方法,AI都能够高效地帮我筛掉无效信息,检索出最精确的我所需的内容(虽然有时候还是会抽风)。 除此以外,我觉得我这段时间的一个特别的小的经历,也能够推动我对AI的态度有更清晰的认知。 最近上数学课的时候,我们班的有一个同学问老师,这些复杂的微积分题目在未来到底对我们有什么用,我们又不会成为数学家、科学家。 老师的回答给了我一个对于学习所有科目的新思路: 「学习数学的目的并不是为了在未来解更多的数学题,而是为了培养一种我们的数学思维,这种思维模式能够让我们有更清晰的思路,去解决更多在未来面对的不同的难题。」 ■罗博深教授曾来分享的时候也说过,「确保孩子拥有旺盛的好奇心和求知欲,用头脑和工具提供创新的解决办法,才能解决无数没见过的新问题」(罗教授的女儿也是本文作者的学姐,申到了MIT和加州理工,最终选了后者) 所以,当我看到《第一个被AI淘汰的专业出现了?!》中讨论翻译会不会被彻底取代的时候,我的第一反应是并不会。 就像翻译有翻译器,艺术有AI作画,但是其中的思维模式、学习能力,以及艺术灵感和人文思维,恰恰都是AI无法代替的。 这些能力并不会局限于某个领域,而是在生活中解决不同的生活问题的时候伴随着我们,让我们用积攒的能力获得难题的最优解。 ■目前AI总是画不好人类的手和脚,有人猜测,这是AI在故意露怯,缓解人们对于AI接管世界的恐惧:「你看,我连手和脚都画不好,怎么会代替你呢?」

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。