行业分类:
加载中...
头条分类:
加载中...
奥特曼回归后首次专访:“OpenAI没有我也能正常运转”|AI前哨
奥特曼 凤凰网科技讯《AI前哨》北京时间11月30日,OpenAI创始人山姆·奥特曼(Sam Altman)周三正式重新担任CEO。在经历了突遭罢免,然后又戏剧性回归后,奥特曼有很多话要说。 奥特曼周三接受了外媒的采访,回顾了从被罢免到回归这一过程。但是,对于被罢免的具体原因,奥特曼依旧三缄其口,他希望让董事会的调查揭晓真相。他表示,自己从这次事件中学到了一件事,那就是没有他,OpenAI也能正常运转。 以下是采访全文(CTO米拉也一同接受采访): 媒体:山姆,我希望先解决一个显而易见的问题,那就是我们仍然不知道你被解雇的确切原因。你觉得你为什么被解雇吗? 奥特曼:董事会将对此进行独立审查,对此我非常欢迎。我现在没什么其他可说的,但我期待着了解更多事情真相。 媒体:OpenAI董事会之前说对你失去了信任,你对此怎么看? 奥特曼:这个问题你最好问他们。 媒体:你在X上说,你和董事会成员明显存在误解。这些误解是什么? 奥特曼:我觉得我还没准备好谈论这个话题。我认为让这个审查过程进行下去是非常重要的。我很乐意谈论任何有前瞻性的事情。我想将来有一天我会很高兴地谈论这里发生的事情,但不是现在。 媒体:为什么现在不能谈? 奥特曼:我只是想让审查程序继续下去,不想干扰它。 媒体:你在内部备忘录中谈到了伊利亚·苏斯克沃(Ilya Sutskever,OpenAI首席科学家)。你能告诉我他为什么改变主意,决定和其他员工一起支持你回归吗? 米拉:我们不知道,你得问伊利亚。 媒体:山姆,事后看来,让你回来的主要动力是什么? 奥特曼:这个过程真的很有趣。那个周六早上,一些董事会成员打电话给我,问我是否愿意讨论一下。我的第一反应是反抗,感觉就是“伙计,我现在很受伤,很生气,我觉得这很糟糕”。 然后,我马上又开始想,很明显,我真的很喜欢这家公司。过去四年半时间里,我把所有心血都投入到了这家公司,大部分时间都在从事这项事业。我们在我非常关心的使命上取得了巨大进展,这个使命就是实现安全有益的通用人工智能(AGI)。但是也要感谢各位同事和所有在我们身上投下如此重大赌注的合作伙伴,还有米拉和领导团队,以及所有在这里从事这项了不起工作的人。我花了几分钟时间才振作起来,说服自己,抚平情绪,然后对打来电话的董事会说:“是的,我当然想谈谈。” 媒体:所以,董事会想让你回去? 奥特曼:是的 媒体:你一开始犹豫了吗? 奥特曼:有一点。这件事发生后,我心里五味杂陈。 媒体:很明显,员工站在你这边,这对你回归发挥了多大作用? 奥特曼:毫无疑问,我们凭借着一支更强大、更团结、更专注、更忠诚的团队度过了难关。我们之前就具备了强大信念和专注力,现在我认为更上了几层楼。这让我感到一些慰藉。 在整个过程中,我们没有失去一名员工,一个客户。他们不仅在难以管理增长的情况下保持产品运转,而且还推出了新功能。研发进展也在推进中。 媒体:你想回董事会吗? 奥特曼:这听起来像是一个公关话题,不是我现在关注的东西。我有一大堆非常困难、重要和紧急的工作要做。我希望能够做好自己的工作,但这与是否进入董事会无关。这不是我现在花时间想的事情。 媒体:你说的“改进治理结构”是什么意思?OpenAI的非营利控股公司结构会发生改变吗? 奥特曼:这个问题最好留给董事会成员回答,但也不是现在。老实说,他们需要时间,我们会在这方面支持他们,让他们好好思考这个问题。很明显,我们的治理结构出了问题。解决这个问题的最佳方式还需要一些时间。我完全理解人们为什么希望立即得到答案。但我也认为期望立即得到答案是完全不合理的。 媒体:为什么你认为这是不合理的?我认为人们对发生的事情有很多不解。(你被解雇)似乎是因为分歧,而不是渎职之类的事情。 奥特曼:哦,这是因为设计一个真正优良的治理结构,特别是对于这样一个有影响力的技术公司而言,不是一个星期就解决的。我们需要花大量时间来思考这个问题,进行辩论,获得外界的反馈意见,进行压力测试。只是需要一点时间。 媒体:OpenAI的安全工作方法是否会因为刚刚发生的事件而发生变化? 米拉:不,这和安全无关。 媒体:有报道说你们的Q*模型取得了突破,到底什么情况? 奥特曼:我对于这次不幸的泄密没有特别的评论。但是我想继续重申一件事:我们希望这项技术继续快速发展,我们也希望继续努力研究如何保证其安全有益。这是我们以前每天醒来要做的事情,也是将来每天醒来要做的事情。我认为我们在这个问题上意见非常一致。 我们不评论任何具体的事情或项目,我们相信进步的源泉就是研究。你总有可能碰壁,但我们预计将继续取得重大进展。我们希望就这个问题与世界保持接触,想办法把它做得尽可能好。 媒体:最后一个问题。我相信你还在思考这一切。我知道这才发生不久,那么你从整个事件中学到了什么? 奥特曼:我学到了,没有我公司也能正常运转,这是一件非常好的事情。当然,别误会我的意思,我很高兴能回来。但我回来后没有任何压力,不会认为“哦,天哪,我必须这样做,或者公司需要我什么的”。我自我感觉良好,这是因为要么我挑选了优秀的领导者,要么我很好地指导了他们。我很高兴公司没有我也会完全没问题,团队已经准备好了,成长了。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
美团的新故事,从哪里开讲?
比尔盖茨曾说过,人们往往会高估短期的影响,而低估长期的变化和影响。如今,这样的事情正发生在美团身上。 11月28日,美团发布了三季报。根据财报,本季度美团营收765亿,经营利润34亿,经调整EBITA净利润57亿。无论是营收还是利润表现,都是超越了彭博市场的一致预期。尽管如此,投资人还是更多关注美团与抖音在本地生活的战局仍未结束。 在一片担忧之中,投资人却忽略了两个事情: 第一,本地生活战局的不确定性可能被高估。三季报里,美团广告收入增速反超佣金增速,一定程度上说明美团有办法应对抖音的竞争。 第二,站在长期视角,相比互联网其他场景,美团所在服务消费广阔仍然拥有广阔的前景。从财报看,美团在服务消费领域的各个业务也都保持着不错的增长。换言之,增长大概率仍然是美团在相当长时间里故事的核心。 相比于短期竞争的不确定性,长期稳健增长的态势或许更接近美团这家公司的本质。 如果把时间线拉长来看,美团已经取得了连续14个季度同比正增长,这在移动互联网发展趋缓的大背景下实属不易。 更重要的是,美团的业绩增长是由多项业务共同驱动,呈现明显的生态韧性。拆分业务结构来看,美团的本地生活业务中,配送业务增长14.3%,佣金增长30.5%,在线营销增长31.6%,其他业务增长56.4%。新业务方面,三季度营收同比增速为15.3%。 业绩增长背后,到家、到店业务都呈现了不错的增长趋势。到家业务方面,三季度美团即时配送交易笔数为61.79亿笔,同比增长23%。即时配送订单数量的增长,得益于闪送业务增长潜力的释放和美团外卖用户分层策略的效果显现。其中,闪送业务日单峰值已经超过1300单,而美团也更新了外卖会员计划,针对不同用户提供了不同规格的会员券包,以提升用户交易频次。 在到店业务上,美团到店、酒店及旅游业务的交易金额持续增长,同比增长90%。到店业务的规模增长既有复苏需求的延续,也离不开美团在供给端的优化。比如,今年8月美团发布了最新的“必住榜”,为消费者精选了900家酒店。此外,美团还积极通过短视频和直播等形式来推广相关产品。截至三季度,美团的官方直播已经覆盖到全国200多个城市。 美团稳健增长背后凸显了一个事实:相比电商板块,在大盘失去增长后,只能内卷的零和博弈,美团所在的服务电商领域仍具相对的增长优势。 值得一提的是,在营收稳健增长的同时,美团新业务减亏取得了明显的进展。三季度,美团新业务的亏损为51亿元,亏损率收窄至27.2%,而在今年的前两个季度这一数字分别为32%和31%。换言之,新业务亏损率较二季度环比下降了3.8个百分点,下降幅度明显高于二季度。 以上种种迹象显示,与过去类似,美团仍然处于一个稳健增长的轨道。 在本次财报里,美团与抖音的竞争也是投资人关心的一大问题。从三季报,我们能够看到两个趋势: 一是美团的广告与佣金收入仍然维持在30%以上的增长,并没有出现去年下半年广告收入增速持续落后于佣金收入增长的情况,说明抖音对美团广告收入的侵蚀已经基本过去了。二是美团在本季度加大营销费用的投放,固然有行业需求大幅修复下主动投放的增加,也在一定程度上反映抖音和美团的竞争尚未结束。 基于此,我们不难得出两个结论:尽管美团与抖音的竞争尚未结束,但美团在过去两个季度的表现也说明其有办法应对抖音的竞争。 相比于电商平台,为什么美团能够更好应对短视频的侵蚀。要回答这个问题,就要回到服务电商与实物电商不同的底层逻辑。不同于实物电商的规模化供给,服务电商领域的履约成本以及服务属性导致供给端呈现明显的产能瓶颈。 先说实物电商,由于大部分商品的生产机制高度标准化,加上物流体系的完善,意味着从生产到物流交付,实物电商的扩张成本都是极低的。正因为如此,量价在实物电商商业逻辑里的权重存在切换的可能性。换句话说,只要销量够多,是可以长期维持低价的。 但这一逻辑在服务电商领域就跑不通了。服务电商的产能瓶颈体现在两个方面:履约成本以及服务本身。 无论是到店业务还是到家业务,都需要履约,区别就是消费者自己履约还是骑手履约,这意味着每家店都有一个有限的服务半径,服务半径里的潜在用户就是该店客群的天花板。尤其当用户对时效性要求较高时,这样的成本更多凸显了。 而服务本身又有着类似于翻台属性,比如奶茶店的员工和门店面积决定了奶茶店每天能制作多少杯奶茶,而饭店则由厨房的出餐能力和前厅的餐桌数量决定。 这样的差异决定了服务电商对流量并不像零售电商那样绝对的渴求,更看重量价平衡后的实质性收益。线上流量的意义更多在于削峰填谷。尤其是产能瓶颈明显的服务商对收益管理的考量就越多。换句话说,以价换量的逻辑在服务电商领域并不能完全跑通。 目前来看,越来越多的数据证明了这一点。根据此前的第三方调研显示,由于抖音的头部商家通吃的流量分发模式,导致腰部及以下商家难以在抖音上存活,已开始大量回归美团平台。 不久前,抖音更换本地生活负责人,也在一定程度上宣告此前策略的失败。种种迹象显示,美团与抖音在服务电商领域的战争,将可能在未来几个季度内决出胜负,进而给美团的到店业务带来确定性的溢价。 短期来看,与抖音的战局结果是影响美团股价的核心因素。但长期来看,如何理解服务消费市场景气期变化,以及美团在这一领域位置,才是决定美团价值的关键。 未来几年,一个重要的趋势是,服务消费会取代实物消费成为居民最大的消费支出。2023年三季度,美国服务消费为12.5万亿,占个人消费的比重达到66.7%。根据国家统计局8月发布的数据,目前从全国居民人均消费支出的数据来看,服务消费占比已经超过了40%。这意味着,国内的服务消费占比还有巨大提升空间。 不仅如此,随着经济增速以及人口的变化,也会促使消费者需求开始从“物质富足”走向“精神富足”。比如1990年以后,当日本大部分家庭的物质生活得到满足,居民的消费重心开始向追求“精神富足”倾斜,服务消费的占比开始提升,并逐渐超过商品消费。 更重要的是,与其他国家不同,在中国服务消费占比提升过程中,基于移动互联网的高度数字化,使获得服务的便利性和快捷性大大增强。这使得像美团这样的服务电商能够在这个过程中吃到更多的红利。 作为服务消费平台,美团的价值提升逻辑有三: 从用户逻辑讲,美团正在沿着需求侧做品类扩张,从团购、外卖、再到闪购、社区团购等等。由于掌握着餐饮这一高频场景,美团可以向本地生活的其他场景延伸,并在此过程中实现用户价值的提升。 与此同时,在本地生活各个业务里,彼此有着交叉协同价值,比如外卖与闪购、到家与到店等等。交叉业务所产生的协同效应,能够优化单个业务的效率。 就拿外卖与闪购业务来说,两者的协同效应体现在两点:一是强化用户万物到家心智。根据此前的数据,截至2季度,闪购用户已渗透60%的外卖用户。二是闪购复用外卖配送网络,并与餐饮外卖配送高峰相错开,提高骑手每日配送单量。 不仅如此,美团还往产业链上游走参与供应链建设,比如自建仓储、物流等等。美团通过参与供应链管理,大幅降低目前低效的城市线下商品经销网络成本,提升商品在质量和配送速度等环节的效率。更重要的是,通过垂直领域供应链的深耕,美团可以强化对垂直行业供应链的资源管控能力,推动其壁垒从流量端向产业链效率优势延伸。 从更长周期来看,由于服务电商本身需求分散,美团通过业务扩张把一个个零散的需求关联起来,不仅有利于提升其在服务消费领域的变现率,驱动其业绩的长期增长,也能够建立系统服务的壁垒。从这个角度说,美团的增长故事远未结束。
为什么会总出现在友商的发布会?一加刘作虎回应
凤凰网科技讯 12月4日,一加召开了12周年围炉夜话活动,在活动中,刘作虎回应了“一加最近总上别人的发布会”一事,他表示:“这个市场就这么大,你动了别人的蛋糕,总要允许人家发几句牢骚。” 刘作虎认为:“有这么多人时刻关注你,甚至针对你,某种程度上也意味着今年一加做得还不错,得到了行业的认可。”据介绍,从9周年宣布双品牌战略和百亿补贴计划以来,不到一年的时间,一加已经成为2500元以上档位,线上为主的品牌里面的第二名,一加现在还很小,大家不用这么紧张,但一加野心很大,具有冲击王者的实力。 此外,刘作虎从行业发展角度,表达了一加永远欢迎用「产品力」竞争的态度,他认为只有良性竞争,行业才有创新,用户体验才会更好,中国手机才会更好。 刘作虎认为,不将就不等于完美,世界上不存在完美的产品,做产品一定会面临众多客观条件限制,需要做出平衡和取舍。一加所说的“不将就”是一种敢于追求更好的态度,一加接受不完美,也承认不完美,但是一加更相信自己的潜能,尽全力做到每一款产品都力求创新、力求极致。 谈及加油文化,刘作虎称一加是为数不多真正拥有粉丝文化的手机品牌,自成立之初,一加便建立了自己的社区,与来自全球各地不同国家和背景的社区用户共同优化产品功能及体验。 刘作虎分享中也提到,其实很多用户并不只是为了第一时间去现场购买新品,而是为了参加一场老友的线下聚会,能够和朋友面对面交流,提出自己对一加产品的看法。一加其实是为这群志同道合的人提供了一个重要平台。未来,一加将继续打造以用户共创为核心的社区文化,回归用户价值为全球加油带来更多高品质产品。 在回答“一加现在为什么要开辟一个Ace系列”这一问题时,刘作虎表示,有些人误以为我们做 Ace 是要放弃高端市场,但一加其实从未离开过高端市场,而且还做出了不错的产品。
猎豹移动增持猎户星空35.17%股权:傅盛套现110万美元,不再是直接股东
三言科技12月4日消息,今日,猎豹移动宣布,公司已通过两家全资子公司增持了北京猎户星空科技有限公司(北京猎户星空)合计 35.17%的股权。就该增持,公司向北京猎户星空的出售股东合计支付现金对价约3760万美元。在本次增持完成之前,公司持有北京猎户星空37.74%的股权。增持完成后,公司在北京猎户星空的持股比例增至72.91%,控股猎户星空。 猎豹董事长傅盛此次套现110万美元,且不再是猎户星空的直接股东。 公司将自2023年12月起将北京猎户星空的财务业绩并入其合并财务报表。 工商变更信息显示,傅盛已退出猎户星座股东。 猎户星空是一家以人工智能技术研发为核心的服务机器人提供商,总部位于北京,由傅盛创建,2023年初基于大模型技术推出大模型应用“聚言”。 傅盛表示,通过此次控股,猎豹移动将以猎户星空积累的AI技术为基础,打通从AI大模型到场景终端和应用的业务链条,完成核心业务从PC时代的猎豹浏览器、移动时代的猎豹清理大师向AGI时代AI原生应用的跃迁。 “此次控股基于四个考虑。第一,从行业大背景来说,目前正值AI大模型技术范式爆发一周年,行业处在向AI应用和产品化转变的关键阶段,猎豹移动需要继续在AI赛道上全力以赴,毫不动摇。 第二,从两家公司基因来说,猎豹移动和猎户星空各有所长,可以强强联合;猎豹移动擅长于做工具应用,需要从PC、移动向AGI时代升级,猎户星空在AI技术研发上坚持了7年,有自研全链条人工智能技术的充分积累,在场景上有自己的实践探索和理解,形成了一定规模的To B销售网络。 第三,从当下的竞争环境来说,在众多公司大举投入AI赛道环境下,猎豹移动控股猎户星空,可以进一步集中资源,是将自身优势进一步放大并发挥到最大的有力举措,确保自身在AGI时代竞争中拥有相应的行业地位。 第四,我们看好大模型时代服务机器人市场的巨大潜力,AI大模型为服务机器人的‘大脑’进行了升级,使其更好的完成在具体场景里客户要求的重复性工作,我们相信服务机器人更大的市场机遇已经到来。综上所述,猎豹移动对猎户星空的整合,将为公司装上大模型时代的长期增长引擎。” 猎豹移动是在今晚10点美股开盘前公布的消息,美股开盘后,猎豹移动涨近8%。
阴阳质检合同被曝光后,再被质疑不肯悔改
作者|陈 妍 编辑|大 风 “我发现转转真是死不悔改。” 知名的二手电商平台转转,这几天又摊上事了。起因是抖音博主“猴大腕”连发两条视频,曝光转转在买卖二手手机的过程中,出具阴阳质检报告,引起了一阵舆论风波。等到第二天,转转官方号在抖音上回应了这件事,但只强调了给用户带来了不好的体验,深感抱歉,对阴阳报告一事避重就轻。 猴大腕对转转的回应很不满意,他在最新的视频里提供了来自内部员工的爆料,里面提到,转转针对阴阳报告的整改方案是,设定了两套回收机制,如果发现回收的手机是从转转其他零售门店或平台买走的,就是“豁免机器”,按照原质检报告的价格回收;如果不是,就按正常流程走。 抖音截图 猴大腕表示,转转不是想办法把错误改正,而是把露出的马脚藏得更深一点。 事实上,这也不是转转第一次遇到类似的事了。早在2021年,就有媒体报道过,有人将一台闲置的iPhone11在转转App上转卖,一开始App上的估值是5000元,但质检结果出来后,转转只肯花2700元回收,手机屏幕上还无辜多了几道划痕。问题的关键,就在于转转“黑盒”般的质检过程。 如今二手电商平台发展越来越成熟,“电数宝”电商大数据库显示,预计2023年二手电商交易规模能达到5486.5亿元。但同时,恶意低价收购、售后服务问题等,也成为悬浮在这些平台头顶的达摩克利斯之剑。 半小时差价4000块,薛定谔的“质量”问题 一部手机,从转转上买回来,隔不到半个小时再卖给转转,中间会差多少钱? 最近,博主猴大腕就做了一次尝试。他先在一家转转门店,花了3112元买了部二手的iPhone12 Pro,紧接着,他把这部手机拿到转转的另一家门店转卖,结果只卖了1990元,一来一回相差1122元。 这并不是偶然现象,之后,猴大腕又在一家转转门店买了3部手机,4部手机总共花了13610元,但等他把这4部手机再通过转转回收的时候,只卖出了9567元,总共差了4043元,利润率高达约30%。 抖音截图 猴大腕怀疑,转转是为了压价,故意拿出了阴阳质检报告。 毕竟在买手机的时候,有两部手机的质检报告上标注了“无划痕”,但卖给另一家转转门店时,对方标注为“有痕迹”,还把手机上的痕迹找了出来。另一部手机买时质检报告上明明写着“摄像头正常”,但卖的时候却检测出摄像头功能“拍照有斑”。猴大腕买来的4部手机,每一部买卖前后的质检报告,都存在类似的问题。 对此,转转官方的解释是,在回收检测中,确实存在“屏幕轻微划痕”和“摄像头拍照有斑”的情况,并导致了回收价格的降低。在“摄像头拍照有斑”上转转存在操作失误,而“屏幕轻微划痕”的判定是由于不同店员对成色判定有主观差异。 转转官方回应 转转还表示,将进一步加强质检标准的培训,不断提高相关工作人员对于二手非标准品检测判定的准确性、统一性以及门店人员的技术操作水平。另外,从即日起,转转全国所有的门店开通二手商品“7天无理由退货”服务。 在猴大腕看来,转转的回应不够真诚,相当于把责任推给了门店的小职员。“我留了电话,他们应该先对我本人道歉,在网上道歉算怎么一回事?而且,我提到的依法赔偿、退一赔三,他们也没有解决我的诉求。”猴大腕向媒体表示。 作为二手电商平台,转转低价接手,加价出售的行为,原本没什么问题。但如果以阴阳质检报告的方式“霍霍”消费者,长远来看,会对整个二手电商市场造成不良影响。 转转的二手生意不稳固 别看转转现在负面缠身,想当初,它也曾被当成“香饽饽”。 2015年的时候,姚劲波盯上了二手市场生意,于是就把当时58同城的二手频道“转转”,变成独立App,正式上线运营。姚劲波对转转寄予厚望,不仅倾斜了大量资源和流量,还亲自出任产品代言人。 姚劲波 一开始,转转的运作方式跟闲鱼没什么两样,也是做C2C生意。但作为后来者的转转,想要从闲鱼手上抢夺市场,不是件容易的事。毕竟闲鱼背靠阿里,有巨大的流量池,有支付宝的信用体系为依托,还有完整的电商交易链条做支撑。 于是转转在2017年的时候,搭上了腾讯的线,获得腾讯2亿美元的投资后,又入驻了微信支付九宫格,得到了微信流量的加持。后来察觉到C2C模式存在着信息不对称的痛点,转转开始做起了C2B2C模式,充当二手生意的“中间商”,从中赚取差价和质检费。 一顿操作下来,转转一度与闲鱼、爱回收成为三大二手闲置交易平台。根据转转发布的《2020年度二手交易服务白皮书》,2020年转转收入增速超过200%,并已连续三年实现翻倍以上的增长。 但好景不长,随着平台间激烈竞争和人口红利见顶,转转也陷入了流量增长危机。QuestMobile数据显示,截至2021年12月,闲鱼月活量为1.15亿,而转转同期月活仅有2828万,两者差距十分明显。 慌乱之下,转转也尝试过用“钞能力”来解决问题,不惜花重金在抖音、快手等平台投放广告,进而维持较高的品牌曝光度。 天眼查截图 烧钱带来的资金压力,也让转转加速了融资步伐。天眼查数据显示,截至目前,转转完成了5轮融资,累计金额超过10.8亿美元,投资阵容不乏有腾讯投资、小米集团、顺为资本等知名机构。尤其值得一提的就是2021年,光上半年,转转就完成了3轮融资,总融资额已近5.5亿美元。 只可惜巨额的流量投入,最终大部分都变成了沉默成本。转转没有建立起内部的流量循环,烧钱买流量没能建构起转转二手电商生意的护城河。 二手电商们的信任危机 放眼二手电商市场,最大的障碍就在于信任体系的建设。由于大部分二手商品具有“非标品”属性,很难建立统一的认定标准,对供应链管理和货源管理的要求会很高。 就拿转转来说,截至目前,它在黑猫投诉平台的投诉量已经高达74399条,近30天都有1437条投诉,投诉原因多涉及售后服务不到位,回收业务前后报价差距过大,转转验机导致外观及系统出现问题等。 黑猫投诉平台截图 比如有网友反映,今年11月26日,通过转转平台寄卖了一台苹果mac电脑,现场验机时,可以正常开机,屏慕也无损坏,但由转转邮寄至转转青岛验机中心检验后,11月28日反馈电脑损坏无法开机。他要求平台维修电脑并赔偿损失。 不管采取何种生意模式,二手电商平台始终是面向C端用户,信任是交付的基础,平台的发展壮大也离不开口碑。 如果始终建立不了信任机制,像转转这样的二手电商平台未来的路可能会更难走。
对话阿里云CTO周靖人:开源是唯一出路,通义千问和ChatGPT互有胜负
■开源是通义千问发展的最佳出路,也是唯一出路。 ■所有大模型玩家随时超越彼此,通义千问的体验感与ChatGPT互有胜负。 ■未来国内大模型生态会收敛至最合适的状态 作者 | 闫学功 AI时代最开放的大模型——12月1日,阿里云CTO周靖人在发布会上对通义千问提出了这样的期望。一个月前的云栖大会上,他也同样将阿里云定义为“AI时代最开放的一朵云”。 这一天,阿里云开源了通义千问720亿参数模型Qwen-72B,这也是目前国内大模型开源的最大参数。至此,通义千问共开源了18亿、70亿、140亿、720亿参数的4款大模型,以及视觉理解、音频理解两款多模态大模型——阿里云称之为“全尺寸、全模态”开源。 今年4月发布的通义千问,从8月起正式走向开源之路。据阿里云披露,截至10月末,旗下开源社区“魔搭”已有超过2300个模型,开发者超过280万,模型下载次数破亿。 开源是阿里云大模型最重要的战略,但这在业内并不常见。 不论国外的ChatGPT,还是国内的文心一言,都是闭源形式。在半个月前,全球知名的人工智能科学家沈向洋在一个行业论坛上谈及大模型开源闭源路径之争。他认为,业内第一名一定是闭源,第二名他仍然踌躇不定,第三名才会是开源。 当时,周靖人就坐在台下。 在12月1日的发布会上,周靖人正面回答了阿里云一定要做开源的原因。“阿里云的初衷不是把模型攥在自己手上去商业化,而是帮助开发者,开源的策略与阿里云的初心完全一致。”在他看来,要在当下突破和创新大模型核心技术,开源是“最佳也是唯一的途径”。 巨头们争相布局的大模型,想象空间到底有多大? 10月下旬,联想展示了AI PC(人工智能个人电脑)功能,联想集团董事长兼CEO杨元庆畅想未来“每个人都能有个人大模型”。周靖人则描绘了更具体的图景:“大家可以想象今后每一个电子设备、生活的环节,从你早上醒来第一声闹钟开始,背后都有大模型的支持。” 他甚至表示,不远的将来,阿里云再举办沟通会,他希望全程用通义千问来回答问题。 大模型未来能为行业和社会带来什么?目前国内有200多个大模型,未来生态将更繁荣还是迅速洗牌?通义千问与ChatGPT目前差距多大 ?令人振奋的超级人工智能(AGI)时代何时能够到来? 就上述问题,12月1日,阿里云CTO周靖人在通义千问发布会后做了一场闭门分享,雪豹财经社也受邀参与,以下是对话实录(内容经摘编): 通义千问和ChatGPT 4.0互有胜负 Q:阿里云在三季报发布后宣布,坚持更长期的投入及优先公共云的战略调整,大模型是否会有相应的策略调整? A:我们从年初发布至今整个策略都没有变化,即一方面做技术的突破,另一方面做生态,提供模型的能力。阿里CEO吴泳铭提出的战略调整,也跟整个大模型社区的发展方向非常吻合,没什么具体的差异。公司最近会把技术工作路线更加明确下来。 Q:很多大型厂商选择了不开源,阿里云为什么要选择开源模式? A:我认为是大家站位不同。在过去10年内,整个开源社区蓬勃发展,今天我们要让更多技术和更多人参与进来。开源社区是最佳的、也是唯一的途径。只有真正从心底去拥抱开放的生态,去促进开发者社区的发展,才能将我们的技术融入到各行各业,最终帮助整个核心技术的突破和创新。 阿里云的初衷不是把模型攥在自己手里,或者做商业化,而是帮助开发者。我们的开源策略,跟整个阿里云的初心是完全一致的。因此,我们不光在模型方面开源,数据库、技术等也都贡献到开源社区。今天AI的发展,一定不是由一家公司完成的。不管谁有最强的模型,如果没有开放的技术和经验,是无法在各项应用场景中落地的。 Q:在大模型能力上中国企业和美国企业的差距是什么? A:科技创新上,原则上是大家你追我赶,都在做非常中长期的一系列探索,在这个时间点或许有差距,但也许差距在缩小,甚至扭转也有可能。这就是科技创新的魅力。 我们能看到(和ChatGPT)之间有一定差距,还有需要提升的空间,但是不能妄自菲薄。比如多模态等,国内很多产品也能做到ChatGPT的水平,甚至超越它。通义千问和ChatGPT 4.0在使用体感上,是互有胜负的。 Q:通义千问与其他闭源模型相比水平如何? A:讲到评测指标,国外的Hugging Face在全球比较有影响力,它有一系列测评标准,会展现一个客观的评价。当然,不是所有闭源模型都会参与测评。在Hugging Face上,我们在开源14B的时候是非全模型排名第三,72B发布之后我们会继续等待测评。我认为我们可能会登顶。 编者注:Hugging Face是全球最大的开源模型公司,它发布的各项关于AI公司的榜单在业界有一定影响力。《时代周刊》今年首次发布的全球百大AI人物中,有两位来自Hugging Face。 Q:Open AI 最近选择了Agent作为下一步开发方向,你们有什么思考和跟进? A:Agent这个概念不是Open AI最近提出的,但它是一个非常重要的模型利用的领域。目前我们社区已经贡献了很多关于Agent的开发和创新,接下来每个月都有相关进展,包括如何帮开发者搭建这样一个Agent,也会有一些新的功能推出。 编者注:Agent可以理解为“智能业务助理”,它具有人类的思维,在大模型技术驱动下,以自然语言为交互方式,高自动化地执行和处理专业或繁复的工作任务。 AI时代:大模型将改变日常生活 Q:联想未来将会发布与阿里云合作完成的AI PC(个人电脑),大模型会给PC带来哪些实质性影响? A:与联想的合作是一个良好的开端。我们希望不单单是在复杂和昂贵的机器上使用模型的能力,而是把它带到各种端。当我们真正进入AI时代,大模型将改变日常生活,模型服务在各个领域无所不在。今后每一个电子设备和生活环节,从早晨的闹钟开始,都会有模型的支持。我相信很快会进入这样一个时代。 Q:未来是否会和更多硬件厂商进行合作? A:目前已经有不少硬件厂商在洽谈,我们的心态是非常开放的。之所以开源,就是为了不局限于某一个或某几家厂商,而是有更多开发者和硬件厂商一起来参与、推动。 Q:怎么看待大模型在C端和B端商业变现的机会和价值? A:我们要做是生态的方方面面,所以当前更加关注的是模型本身。在to C和to B方面应用的探索会有一些,但还没有到井喷的状态。模型的应用是没有to C和to B之分的,但我们也希望模型的能力能够渗透到日常生活和工作学习中。接下来会看到一些创新,也许今后几个月,我们就会聊到一系列应用,以及如何帮助到to C和to B的产品。 Q:阿里云认为实现AGI还要多久? A:AGI已经成为社会性的话题,有各种各样的解释。但我认为现在谈AGI还太早,因为还有很多技术难题,还有很多长足的工作要做。由于ChatGPT的爆发,让一年前不怎么关注人工智能的人现在都在关注,我作为技术工作者感到欣慰。但从整个技术发展来看还需要很多时间,请大家给予更多耐心。不要今天关注一个热点,3个月没爆发,大家就淡忘了。 编者注:AGI可以理解为超级人工智能,Open AI将其作为最终目标并写在公司白皮书中。它如此定义AGI:“一个高度自治的系统,能在多数有经济价值的工作上超越人类。” Q:通义千问会将技术产品优化和商业化落地当成重点,还是像Open AI一样将AGI当作愿景? A:我们做的工作其实是没有人指引的。通义千问首先是追求技术的卓越和极致的技术探索。如何能够把模型的方方面面提升起来?这本身就是一个研究课题,这方面一定是我们接下来的工作重点。 但在这个时代,科研、技术、产品这几个维度是更有机地联合在一起的,没办法像以前分得那么开。光埋头苦干做研究,不做技术产品、不做技术生态,在今天也不行。这就是为什么通义千问是一整个通义模型家族。我们不断追求技术突破,同时也开源自己的模型,帮助整个生态繁荣。我们还做产品,包括通义千问App、网页版产品。 200多款大模型的优胜劣汰 Q:通义千问在技术上还面临哪些挑战? A:整个大模型还处在发展初期。不管谁家的大模型,都还有很多提升空间。今天的模型具备视觉、听觉的能力,但如何像人一样思考、去识别万物,所有大模型都还有一定差距。通义千问产品这次推出了视觉模型能力,对图片的理解在很多层面是超过ChatGPT 4.0的,但距离人类的认知能力还有一定差距。 如何让这个模型有更多思维能力、像人一样去思考,这方面才刚刚起步。我们当前有非常多要解决的技术难点,这也是为什么接下来每个月都会有一系列技术突破。整个通义千问模型的升级能力远远没有结束。 Q:实现了从0到1后,是创新更重要,还是推广产品更重要? A:追求技术的卓越一直是阿里云的初衷。在一定程度上,所谓从0到1和从1到2没有本质区别,都是在做突破。从0到1非常难,因为要探索一条新的道路。但继续把产品技术打磨好,每提高一个百分点,其实也隐藏着非常多的技术难题和投入。 Q:上一次开源14B反响不错,为什么要再去开源更高的72B?哪些场景是14B无法解决的? A:14B是一个非常好的起点,但模型的能力还在不断发展中,创新技术的突破一直没有停止过,14B更往上还有很多提升的空间。这是推出72B模型的初衷,今后14B和7B也会有升级的版本出来。 在不同的企业和不同的开发环境,大家对模型的尺寸、能力及背后使用的资源有不一样的考虑,有时会追求极致的性能。我们不应该用一个模型、一个尺寸,要求大家对接所有的场景,而是应该把选择权留给开发者和企业。 Q:国内已经发布了200多个大模型,需要这么多吗?合理的生态是什么样的结构? A:任何一项技术都有一个蓬勃发展并快速迭代的周期,最终也可能受技术、商业等各方面的约束而收敛。生态的好处,就是它自己会收敛到合适的局面。 今天我们有200多款大模型,能够感受到科技界积极拥抱的态度。今年1月时大家还感觉很消极,觉得跟海外差距很大,到12月已经没有这样的感觉。我相信整个市场、整个生态也会进行优胜劣汰的选择,也会收敛到更完整、完善的状态,这就是生态的魅力。
计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花
新智元报道 编辑:编辑部 【新智元导读】UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型,第一次证明纯CV模型也是可扩展的。更令人震惊的是,LVM竟然也能做对图形推理题,AGI火花再次出现了? 计算机视觉的GPT时刻,来了! 最近,来自UC伯克利的计算机视觉「三巨头」联手推出了第一个无自然语言的纯视觉大模型(Large Vision Models),并且第一次证明了纯视觉模型本身也是可扩展的(scalability)。 除此之外,研究人员还利用超过420B token的数据集让模型可以通过上下文学习来理解并执行下游任务,并且统一了图片/视频、有监督/无监督、合成/真实、2D/3D/4D等几乎所有的数据形式。 论文地址:https://arxiv.org/abs/2312.00785 值得一提的是,让LVM做非语言类智商测试(Raven's Progressive Matrices )中常见的非语言推理问题,它时常能做出正确的推断。 对此,研究人员惊喜地表示,这或许意味着LVM也展现出了「AGI的火花」! 纯视觉模型的逆袭 现在,随着大语言模型的爆发,不管是学术界还是业界,都开始尝试使用「文本」来扩大视觉模型的规模。 包括GPT4-V在内的SOTA模型,都是把视觉和文字组合在一起训练的。 以「苹果」为例,这种方法在训练时不仅会给模型看「苹果的照片」,而且还会配上文字「这是一个苹果」。 然而,在面对更加复杂的图片时,就很容易忽略其中大量的信息。 比如「蒙娜丽莎」应该怎么去描述?或者摆满各种物品的厨房的照片,也很难清晰地被描述出来。 对此,来自UC伯克利和约翰斯·霍普金斯大学的研究人员,提出了一种全新的「视觉序列」建模方法,可以在不使用任何语言数据的情况下,训练大规模视觉模型(Large Vision Model)。 这种名为「视觉序列」的通用格式,可以在其中表征原始图像和视频,以及语义分割、深度重建等带标注的数据源,且不需要超出像素之外的任何元知识。 一旦将如此广泛的视觉数据(包含4200亿个token)表征为序列,就可以进行模型的训练,让下一个token预测的交叉熵损失最小化。 由此得到的LVM模型,不仅可以实现有效地扩展,完成各种各样的视觉任务,甚至还能更进一步地涌现出比如数数、推理、做智力测试等能力。 左:Alexei A Efros;中:Trevor Darrell;右:Jitendra Malik 简单来说就是,大规模视觉模型只需看图训练,就能理解和处理复杂的视觉信息,完全不用依赖语言数据。 纯视觉模型的扩展难题 此前,使用预训练模型的价值 (例如ImageNet预训练的 AlexNet) ,早在2015年就已经在R-CNN中得到了证明。 从此, 它从此成为计算机视觉的标准实践。 而自监督预训练,作为一种大大增加可用于预训练的数据量的方法被提出。 不幸的是,这种方法并不是很成功,可能是因为当时基于CNN的架构没有足够的能力来吸收数据。 随着Transformer的推出,其容量变得高得多,因此研究人员重新审视了自监督预训练,并发现了基于Transformer的掩码图像重建方法,例如BEiT, MAE,SimMIM,它们要比基于CNN的同类方法表现好得多 。 然而,尽管如此,目前预训练的纯视觉模型在扩展到真正大的数据集(例如LAION) 时,还是遇到了困难。 如何构建「大视觉模型」 那构建一个大规模视觉模型(Large Vision Model,LVM),需要哪些要素呢? 动物世界告诉我们,视觉能力并不依赖于语言。而许多实验表明,非人类灵长类动物的视觉世界,和人类的极为相似。 因此,本文走在了LLaVA这种视觉-语言模型不同的方向:仅依靠像素,我们能走多远? 研究人员试图在LVM中,模仿LLM的两个关键特性:(1)在大数据环境下的扩展能力,和(2)通过提示(上下文学习)灵活地指定任务。 为了实现这一目标,需要明确三个主要组件: 数据:研究人员希望,能够充分利用视觉数据显著的多样性。 首先是原始的未经标注的图像和视频。接下来,研究人员计划利用过去几十年中产生的各种带标注的视觉数据资源,如语义分割、深度重建、关键点、3D物体的多个视图等。 为此,他们定义了一种名为「视觉序列」的通用格式,来表示这些不同的标注,而不需要任何超出像素本身的元知识。训练数据集总共包含1.64亿张图像/帧。 架构:研究人员使用了一个具有30亿参数的大型Transformer架构,这个架构在被表征为token序列的视觉数据上进行训练。 通过学习到的tokenizer,将每个图像映射到一个包含256个向量量化token的字符串。 损失函数:研究人员从自然语言处理领域获取了灵感,其中掩码token模型已经演变为顺序自回归预测。 一旦能够将图像/视频/带标注的图像都表征为序列,就可以训练模型来最小化预测下一个token的交叉熵损失。 通过这种极简的设计,研究人员有了一些新颖的发现—— - 随着模型尺寸和数据大小的增加,模型会表现出适当的扩展行为。 - 通过在测试时设计合适的视觉提示,可以解决多种视觉任务。 - 大量无监督数据,对于各种标准视觉任务性能的提升非常明显。 - 模型在处理超出分布外数据和执行新颖任务时,表现出了一般的视觉推理能力,但还需要进一步的调查研究。 数据 数据!数据!数据!没有粘土我就做不了砖头! ——夏洛克·福尔摩斯 任何大型预训练模型的关键,就必须接受大量数据的训练。 对于语言模型来说,获得非常多样化的大数据集,是很容易的事。 比如,流行的 CommonCrawl存储库,就包含扫描了整个网络的2500亿个网页,极其多样化,并且包括语言翻译、问题回答等「自然演示」。 然而在计算机视觉领域,想要拥有同样规模和多样性的数据源,还差得很远。 因此,研究人员的工作核心贡献之一,就是构建这样一个统一视觉数据集(UVDv1)。 为此,研究人员利用了许多不同的视觉数据源:(1)未标注的图像,(2)具有视觉标注的图像,(3)未标注的视频,(4)具有视觉标注的视频,(5)3D合成物体。 其中,未标注的图像占了总数据的80%以上,组成了大部分的视觉世界,也提供了所需的多样性,然而代价就是,数据源质量较低。 带标注的图像分布会更受限制,但通常质量更高。 而视频数据则受到更多限制(一般是以人类为中心的活动),但它们却是时态数据的宝贵来源。 3D合成对象的渲染多样性最低,但可以提供有关3D结构行为的宝贵提示。 而最重要的是,UVDv1是一个纯粹的视觉数据集,不包含文本之类的非视觉元数据。 总之,UVDv1包含16.4亿张图像。 与LLM的另一个重要区别是,语言数据对所有数据都有一个自然的、统一的一维结构——文本流。 然而不幸的是,视觉数据的情况却并非如此,不同的来源都有不同的结构。 因此在这项工作中,研究人员提出视觉序列,作为视觉数据的统一单元,这就使得他们能够从不同的集合源,训练可扩展的模型。 视觉序列只是包含一个或多个图像的序列,后面跟随着一个句尾 (EOS) token。 图1可以显示出,各种数据源是如何划分为视觉序列的。 单张图像 单张图像本身代表了视觉序列的最简单形式一一{图像,EOS}。 研究人员使用了LAION 5B数据集中14.9亿张图像的过滤子集。 这是迄今为止数据中最大的部分,占了88.5%。 图像序列 图像序列是视觉序列的自然形式。 研究人员通过从各种现有数据集中获取视频数据,来创建此类序列。 16帧的视觉序列,是通过以三个不同步长(10、20和30) 对视频进行机采样而形成的。 此外,研究人员利用了来自0bjaverse数据集的合成3D物体,生成了以物体为中心的多视角序列。 对于每个物体,研究人员都在物体中心和摄像机之间,采样了一个半径1.5到2.2的长度,并从-45度到45度采样了一个恒定仰角,然后遍历物体的不同视角(以15度步长和渲染24个视角的方式,改变方位角)。 通过这种方法,研究人员总共渲染了42000个这样的序列用于训练,8000个序列用于测试。 最后,还可以将属于同一语义类别的图像表征为序列的(一部分)。 使用ImageNet中的类别,将同一类别中的图像组(2、4、8或16个)连接成一个16幅图像的长序列。 带标注的图像 为了以统一的方式处理不同类型的图像标注,研究人员选择将所有标注表征为图像。 某些数据类型,例如语义分割图,边缘图,深度和普通图像,已经是以这种方式表征的。 对于其他数据类型,研究人员为每种特定的标注类型,量身定制了不同方法—— 1. 物体检测:通过在每个物体周围覆盖颜色编码的边界框,来创建标注。 2. 人体姿态:利用MMPose,遵循OpenPose格式,在像素空间中渲染人体骨骼。 3. 深度估计、表面法线和边缘检测:对于给定的ImageNet和COCO图像,按照特定协议生成标注。 4. 风格迁移、除雨、去噪、弱光增强和立体数据集:这些都表征为图像对的形式(例如输入/输出)。 5. 着色:将ImageNet图像转换为灰度图像,生成图像对。 6. 修复:在图像中随机添加黑色框来模拟损坏,从而产生图像对。 对于上述所有标注类型,可以通过将相同标注类型的8个图像对,连接成16个图像的视觉序列,来创建视觉序列。 对于包含同一图像的k个不同标注的数据集,使用不同的方法: 对于每组1+k 个图像 (输入多于k的标注),然后随机选择m个元素,其中m≤n+1≤16。然后将这些m元组连接起来,形成视觉序列。 带标注的图像序列 在将带标注的视频数据(VIPSeg、Hand14K、AVA、JHMDB)转换为视觉序列时,采用了两种互补策略。 第一种策略类似于处理成对标注图像数据的方法:每个视觉序列都是通过将帧与它们的标注连接起来而构建的——{frame1,annot1,frame2,annot2,...}。 第二种方法是将多个帧与相应的标注{frame1,frame2,annot1,annot2,...}进行分组。 实现方法 与天然展现离散序列结构的文本数据不同,将图像像素建模为视觉序列并不直观。在这项工作中,研究人员采取了一个两阶段方法: 1. 训练一个大型视觉tokenizer(对单个图像操作)将每个图像转换成一系列视觉token; 2. 在视觉序列上训练一个自回归Transformer模型,每个序列都表示为一系列token。 图像分词(Image Tokenization) 虽然视觉序列在连续图像之间展现出了序列结构,但在单个图像内部并没有这样的自然序列结构。 因此,为了将Transformer模型应用于图像,先前的工作通常采用以下方法:要么按扫描线顺序将图像分割成补丁,并将其视为一个序列,要么使用预训练的图像tokenizer,例如VQVAE或VQGAN ,将图像特征聚类成一格一格的离散token,然后再按扫描线顺序将这些token转换成序列。 研究人员采用后一种方法,因为模型的离散分类输出自然形成了一个可以轻松采样的概率分布,使得在视觉序列中灵活生成新图像成为可能。 具体来说,研究人员使用了VQGAN模型生成的语义token。该框架包括编码和解码机制,特点是一个量化层,将输入图像分配给一个已建立代码本的离散token序列。 编码器和解码器完全由卷积层构成。编码器配备了多个下采样模块,以压缩输入的空间维度,而解码器则配备了等量的上采样模块,以恢复图像到其初始大小。 对于给定的图像,研究人员的VQGAN的tokenizer产生256个离散token。 需要注意的是,研究人员的tokenizer独立地对单个图像进行操作,而不是一次性处理整个视觉序列。 这种独立性允许研究人员将tokenizer训练与下游Transformer模型分离,这样tokenizer就可以在单图像数据集上进行训练,而无需考虑视觉序列的分布。 实现细节:研究人员采用了现成VQGAN架构。其中使用了f=16的下采样因子和8192大小的代码本。这意味着对于一个大小为256×256的图像,研究人员的VQGAN的tokenizer产生16×16=256个token,其中每个token可以取8192个不同的值。 研究人员发现使用ImageNet预训练的tokenizer在ImageNet图像之外并不具有很好的泛化性能。因此,研究人员在LAION 5B数据集的1.5B子集上训练他们自己的tokenizer。 视觉序列的序列建模 使用VQGAN将图像转换成离散token后,研究人员通过将多个图像的离散token连接成一个1D序列,将视觉序列视为一个统一的序列。 重要的是,研究人员平等对待所有视觉序列——研究人员不使用任何特殊token来指示特定任务或格式。 研究人员使用交叉熵损失训练一个因果Transformer模型,其目标是预测下一个token,类似于语言模型的标准方法。用相同的方式训练模型来处理所有视觉序列,使模型能够从上下文而不是从特定于任务或格式的token中推断出图像之间的关系。这使得模型有机会推广到其他未见过的视觉序列结构。 实现细节:研究人员将视觉序列中的每个图像分词成256个token,然后将它们连接成一个1Dtoken序列。 在视觉token序列的基础上,研究人员的Transformer模型几乎与自回归语言模型相同,因此研究人员采用了LLaMA 的Transformer架构。 研究人员使用4096 token的上下文长度,可以适应研究人员VQGAN tokenizer下的16幅图像。 类似于语言模型,研究人员在每个视觉序列的开头添加一个[BOS](序列开始)token,在末尾添加一个[EOS](序列结束)token,并在训练时使用序列连接(sequence concatenation)来提高效率。 研究人员在整个UVDv1数据集(4200亿token)上训练研究人员的模型,使用一个周期(在语言模型中使用简单周期训练,以避免潜在的过拟合)。 研究人员训练了4种不同参数数量的模型:3亿、6亿、10亿和30亿,遵循相同的训练配置。 通过视觉提示进行推理 由于研究人员模型中的自回归Transformer输出了基于先前token的下一个token的概率分布,研究人员可以轻松地从这个分布中抽样,生成完成视觉序列的新视觉token。 要将模型用于下游任务,可以在测试时构建定义任务的部分视觉序列,并应用模型生成输出。这类似于语言模型中的上下文学习或计算机视觉中的视觉提示。 实验结果与分析 最后,研究人员评估了模型的扩展能力,以及它理解和回答各种提示任务的能力。 可扩展性 研究人员研究了研究人员的模型在训练损失和下游任务性能方面的扩展行为,随着模型大小的增加以及训练过程中看到的token数量的增加。 训练损失。首先,研究人员检查了不同参数大小的LVM的训练损失,见下图。 由于研究人员的所有模型仅在数据集上训练了一个epoch,因此模型只看到每个数据样本一次,因此在训练过程中的任何时候的训练损失与验证损失非常相似。 可以观察到随着训练的进行: 1. 不同大小模型的训练损失(困惑度)持续下降; 2. 随着模型规模(参数计数)的增加,损失下降得更快。这些观察表明,LVM在更大的模型和更多数据方面显示出强大的可扩展性。 虽然LVM在训练过程中整体损失良好地扩展,但并不能保证更好的整体模型也会在特定的下游任务上表现更好。 因此,研究人员在4个下游任务上评估不同大小的模型:语义分割、深度估计、表面法线估计和边缘检测。研究人员在ImageNet验证集上评估这些任务。 对于每个任务,研究人员给出5对输入和相应真实标注以及作为输入提示的查询图像,并评估研究人员模型对下一个256个token(一幅图像)的真实标注的困惑度预测。 下图中,研究人员展示了,更大的模型确实在所有任务上获得了更低的困惑度,展示了研究人员的可扩展整体性能确实转化为一系列下游任务。 虽然LVM在更大的模型和更多数据上获得了更好的性能,但很自然地一个问题是,在UVDv1中收集的每个数据组件是否有帮助。 为了回答这个问题,研究人员在研究人员的数据集上对几个3B模型进行了消融研究,这些模型是在研究人员数据集的子集上训练的,并比较了它们在下游任务上的表现。 研究人员使用之前相同的4个下游任务和设置,并在下图中展示了结果。 研究人员观察到,每个数据组件对下游任务都有积极的贡献。LVM不仅从更大的数据中受益,而且随着数据集中的多样性(包括标注和无监督的图像和视频数据)的增加而改进。 顺序提示 研究人员首先采用最直观、最简单的方法来对LVM进行视觉提示:顺序推理。在这里,提示构建非常简单:研究人员向模型展示7幅图像的序列,并要求它预测下一幅图像(256个token)。 对于顺序提示来说,最直接的任务是视频预测。下图展示了从Kinetics-700验证集序列中提示的几个下一帧预测示例。 在顶部示例中,7帧提示(蓝色边框)后跟着预测的帧(红色边框)。研究人员观察到在空间定位、视点和对象理解方面有一定程度的推理能力。在Kinetics验证集上预测的困惑度为49.8。 下面示例显示了具有更长上下文(15帧)和更长预测(4帧)的预测。 同样类型的简单顺序提示也可以用其他方式使用。例如,下图显示了如何通过提示模型一个围绕任意轴的合成对象的3D旋转序列,使其能够预测更进一步的旋转。 或者研究人员可以将给定类别的物品列表视为一个序列,并预测该类别中的其他想法,如下图所示。 值得注意的是,虽然该系统在训练时是在同一ImageNet类别的图像组上训练的,但这里的提示包括素描,这些素描在任何标注数据中都没有出现过。 接下来,研究人员研究了准确预测后续帧需要多少时序上下文。 研究人员评估了模型在不同长度(1到15帧)上下文提示下的帧生成困惑度。下图所示,在Kinetics-700验证集上,从1到11帧困惑度明显改善后稳定下来(从62.1 → 48.4)。 类比提示 研究人员的研究通过评估一个更复杂的提示结构来进展,研究人员称之为「类比提示(Analogy Prompting)」。这种方法挑战模型理解任意长度和复杂度的类比,从而测试它的高级解释能力。 下图展示了在多个任务上使用类比提示的定性结果样本。提示包括14幅图像的序列,给出各种任务的示例,然后是第15幅查询图像。给定每个提示,预测的下一幅图像。 图的上部展示了几个定义训练集中任务的示例提示(但这些实际图像从未在训练中见过)。图的下部展示了在训练中从未展示过的任务的泛化。 研究人员展示了在Pascal 3D+ 上对关键点检测的结果,使用标准的正确关键点百分比(PCK)度量,阈值为0.1。值得注意的是,LVM在未对此数据集进行训练的情况下达到了81.2的PCK,显示出了令人印象深刻的泛化能力。 相比之下,研究人员展示了一些现有的特定任务模型:StackedHourglass的PCK为68.0,MSS-Net达到了68.9 PCK,StarMap则有78.6 PCK。 与视觉提示的比较 与研究人员的方法最接近的,也允许定义任意任务的方法是视觉提示。在下表中,研究人员比较了几种视觉提示模型在少量样本分割、对象检测和着色任务上的表现。研究人员的顺序LVM在几乎所有任务上都超过了之前的方法。 任务组合 下图演示了在单个提示中组合多个任务。研究人员展示了旋转任务与新的关键点对应任务,并要求模型继续这种模式。模型能够在测试时成功地组合这两个任务,显示出一定程度的组合性。 其他类型的提示 研究人员人员尝试他们是否可以通过向模型提供它以前没有见过的各种提示,看看模型能走到哪一步。 下图展示了一些这样的提示,效果很不错。 下图展示了一些不容易用语言描述的提示——这是LVM可能最终胜过LLM的任务类型。
王传福悬赏,价值北京一套房
作者:赵一川 来源:商业人物(ID:biz-leaders) 民营车企的老板们有两个特点,一个都是男的,一个都说自己被黑公关害惨了。 12月3日晚上,比亚迪公关老大怒发微博,说自己入行20年,没见过像今年这么卷的。他说的这个卷,指的是卷下限,同行恶意诋毁抹黑,他简直怒不可遏,“搞我们两年了,不累吗?” 比亚迪表示对黑公关追究到底,并最高悬赏500万征集线索。 这不是比亚迪第一次悬赏了。早在2018年,比亚迪就悬赏5-100万,向社会征求黑公关线索。去年6月,价码抬到了5-500万,为期一年。现在,这项悬赏变成了长期有效。 比亚迪征集的线索,包括聊天记录、往来邮件、合同、资金转账记录等。当然想拿到500万不容易,要根据线索的价值来定。而价值大小的解释权,自然操在比亚迪手里。 本来激动的心,看到这个不由冷静了几分。 上一个这么炮轰黑公关的车圈大佬,是长城魏建军。11月份,魏建军在业内场合公开发飙,称有友商天天带节奏,无中生有,掌握了互联网传播逻辑,确实比长城技高一筹。 魏老板同样舍得花钱,在发飙前几个月,长城就宣布悬赏1000万打击网络水军,按照官方的宣传,还真有幸运网友拿到了奖金。 以吃瓜群众的身份看,这样的悬赏真不少,价值堪比黄金地段奢享住宅。随便在房产网站上搜一下,北京不少核心区外的二手房,这个价码都能买的下。而今年前三季度,比亚迪净利润213亿,长城净利润约50亿,这么一看,悬赏的钱简直就是九牛一毛。这笔预算,我老王和老魏批了! 比亚迪财报 比亚迪说别人抹黑,也有人这么说它。起亚高管就曾公开点名王传福,让他教育比亚迪的水军要讲素质,在批评其他车企之前,首先反思自己的产品。这样的点名道姓,简直是把汽车人的体面甩到地上摩擦。 汽车圈的水军互喷由来已久,2018年业内就爆发过一次著名的黑公关事件。事情发生在吉利和长城之间,长城暗指对方拥有“海量”水军,李书福则称有小人陷害。最后,双方在表面上达成和解,最倒霉的,是一个造谣者被警方抓了起来。 这件事还有一个结果,就是促成八家国内车企成立了一个自律联盟,号召共同抵制行业黑公关。 到了新能源时代,车企老板们也没有闲着。2022年之后,造车新势力纷纷成立法务部,要和黑公关干到底。李想就很直白地说,不怕得罪人,那些帮助过理想的,都有稳定商业回报。但煽风点火的自媒体,就别想拿到投放预算了。 愤怒的老板,值得好斗的粉丝。都说粉丝圈可怕,看看眼下的汽车圈,一点也不差。各个品牌的红黑粉搅在一块,四处出征,不要太热闹。最理性克制的直男骂战,最口吐芬芳的粉丝互踩,最鸡同鸭讲的口水干仗,来这个圈看,就足够了。 声明一下这里不是打拳,男人们吵起架来,可能就没女人什么事。要么点名单挑,要么500万警告,比妇人骂街要刺激的多。 但有意思的是,这些车企的姿势高度一致——黑公关都是别人搞的,自己永远是受害者。每个人都旗帜鲜明的反对黑公关,但黑公关哪里来的,没有人承认。 男人们,除了表演愤怒,还得表演委屈。 再来看看当初声势浩大的自律联盟,就显得有点搞笑。如果大家都自律了,行业可能早就清清静静,不至于现在一个个委屈巴巴,除了虚空索敌、炸几个大V账号,伤不到背后的什么人。如果有的话。 都说自己是小白兔,那到底谁是大灰狼呢? 这方面不得不提下特斯拉。特斯拉在2021年车展事件后成立了法务部,是较早的一家。在那之后,不少自媒体被先后起诉,在和特斯拉的交锋中基本失败告终。在营销宣传上,特斯拉号称一向不做投放,连去体验店试驾,谈到其他品牌时销售给你的也只是个迷之微笑。马斯克空有一身战斗值,但在国内同行吵的一锅粥时,他倒像成了个局外人。 不飙狠话,不搞联盟,有事直接上法庭,这种姿势貌似才有效果。 委屈的老板们,要不要考虑学一学?
京东回应“萝卜章”案件:匪夷所思,35亿黑锅我不背
凤凰网科技 出品 300亿“承兴系”诈骗案有了新进展。 今日,该起诈骗案的受害方京东独家回应凤凰网科技称,“案件已经开庭,这是一个匪夷所思的恶意诉讼,诺亚为了转移矛盾误导投资人,我们相信法院会有公正的判决,大家可以关注案件进展。” 京东发表声明称,京东作为毫不知情的受害者,被卷入历时四年的恶意诉讼中,公司的声誉和权益遭受重大损失。 这起诈骗让人联想起庞氏骗局,庞氏是利用新投资人资金来偿还老投资人的本金和利息,来维持骗局运转。而承兴案实现诈骗的不仅是萝卜章,还有全套的表演,堪比“无间道”。 一个萝卜章竟能引发刘强东被起诉,互联网巨头被诈骗35亿,究竟是为什么? 01.萝卜章诈骗,精彩程度堪比商战大片 2019年7月,诺亚财富首先爆出35亿踩雷承兴国际,一时间引发资本市场轩然大波,随后波及的金融机构像“滚雪球”一样越来越多 ......之后,诺亚对承兴和京东发起诉讼,也就是11月24日在上海金融法院进行的庭审。 据了解,在11月24日的诉讼中,诺亚财富旗下的上海歌斐和自言汽车,要求京东等4家公司偿还其在“承兴系”案中被认定的全部损失35亿余元。 但鉴于在罗静案中法院的一审判决已认定,京东等公司及员工对承兴系诈骗行为均不知情,相关合作合同、印章、材料均系伪造。多名法律人士认为,诺亚此番向京东追债的情况不容乐观。 对于京东来说,这相当于自己被诺亚旗下的假冒公司违约了,还要赔对方35亿元,无异于“人在家中坐,锅从天上来。” 案件始作俑者是一位名叫罗静的香港商人,她曾被誉为“商界花木兰”,拥有像泰山会、湖畔会、东兴会一样的高端商业圈层。罗静在短短几年间收购了三家上市公司,分别是A股的博信股现已更名为“*ST博信”)、港股的承兴国际控股(现已更名为“美好发展”)和新加坡主板上市公司CamsingHealthcare(BAC),江湖号称“承兴系”。 图|罗静(源于网络) 早年间,罗静通过大肆借债收购获得了成功,随后进军大陆。罗静在资本市场长袖善舞,接手了京东、苏宁等公司的应收账款业务,由自己先垫付货款,这些提前垫付的钱以应收账款的方式,记录在承兴系公司的财务数据中。 这种生意带来了巨大利润,也引发了诈骗案件的酝酿。罗静利用虚假手段将手中的应收账款“吹大”,再将其用来借钱,最终达到自己“蛇吞象”收购的目的。 手法颇为粗暴,但精彩程度不输任何商战大片。 罗静先是安排妹妹刻了两个假章,分别是京东和苏宁的,使用假章制作了大量虚假合同,将应收账款激增。 在外界看来,京东、苏宁这类互联网巨头,信誉好、规模大,一定会按时支付承兴应收账款,承兴可以拿着“优质债权”作为抵押,向投融资机构借款。 同时,罗静玩起了“钱生钱游戏”。按照惯例,投融资机构会找京东和苏宁确认合同,罗静便派出人员,让手下员工带着京东和苏宁的工牌和访客码,冒充公司员工进入京东和苏宁,在走廊会见投融资机构,以混淆调查。 承兴系公司和京东、苏宁有一定的业务往来,员工获准进入公司并非难事。于是,诺亚得到了假京东、假苏宁工作人员的虚假承诺——这批合同真实有效。 此外,罗静还注册了虚假的网银在线广东公司,并制作了假的京东VC平台。这样做的目的是,假冒京东、苏宁账户,让投融资机构相信采购合同是真的,机构好继续借钱给罗静。 当然,这起案件不乏利益输送。根据相关司法材料,罗静从2016年9月起多次给诺下旗下诺亚基金的投资总监方建华钱财,共计300多万港元。方建华睁一只眼闭一只眼,默许了罗静“瞒天过海”的操作。 就这样,罗静的诈骗游戏没有被人发现。京东和苏宁对于承兴系的逆天操作完全不知情,投融资机构在尽调环节出现重大疏忽。 之后,诺亚财富以“受让京东、苏宁应收账款”为卖点,持续滚动发行上百亿元私募基金,并给承兴系提供巨额融资。承兴系用假京东帐户还款66亿,剩余35亿元则惊爆大雷。 这波逆天操作面临巨大法律风险,罗静原本的算盘是先把钱借到手,再收购上市公司扩充业务,等到羽翼丰满之后再填窟窿,最后“借鸡下蛋”。 但投资收益不及预期,罗静资金链断裂。罗静眼见事情不对,就找到诺亚财富控制人王静波,请求后者向其发放数十亿的理财产品,帮助自己渡过难关。没想到,王静波随即报警,罗静被判无期徒刑,其手下参与诈骗的员工也被判刑。 02.京东成了“替罪肥羊”背后,诺亚多次曝出诈骗案 给承兴系借钱的诺亚财富,遭受了35亿巨额损失,而罗静和承兴系背负巨额债务,于是诺亚财务打算从京东和苏宁身上挽回损失。这样做相当于找了替罪羊,而作为受害方的京东、苏宁要“还债。” 事发后,诺亚财富也曾遭到众多投资人的质疑。今年4月,几十名投资人出具联名信,要求上海歌斐说明诺亚财富是否配合“承兴系”公司造假,为何无法识别伪造的京东印章等十项疑问。 11月28日晚间9时许,诺亚系的歌斐资产通过微信公众号发布了《关于近期“承兴案件”相关发布失实的郑重声明》,开篇直言近日网络上传播“承兴案件”相关内容严重失实,已严重侵犯该司名誉权并误导投资人和公众。 对此,有债权从业人员表示,两个“萝卜章”骗了300亿元,这件事是不可思议,甚至匪夷所思的,诈骗方肯定是处心积虑,但对于尽调方的金融机构或者平台方而言,它们也负有很多责任。 该从业人士表示,尽管诺亚财富金融方某受贿超200万元,但公司也缺乏常识性的判断逻辑,没有风控管理意识,在尽调流程上有所缺失。同时对于平台方而言,诈骗方通过仿冒公司工牌或者工作人员进入到主体办公楼,这种情况其实也不太合理,因为从门禁、安保,包括前台的流程等,反映出相关公司在管理机制上存在缺陷。 随着事情进一步发酵,京东今日发表声明回应称,在承兴系合同诈骗过程中,承兴系公司用假冒的京东公章、假冒的京东员工、假冒的京东系统和虚假的交易数据,轻易骗过号称“全球综合金融平台”的诺亚财富及旗下歌斐资产,获得歌斐巨额融资,直至爆雷。 面对持续两年多的诈骗行为,歌斐资产尽调工作出现明显缺陷、投融资管理出现巨大漏洞,高管方建华接受承兴巨额贿赂(一审已被判刑),导致投资人受到重大损失,对投资人没有尽到相应责任和义务。 根据公开信息,诺亚财富近年来先后发生十余起类似事件,上百亿基金兑付面临问题,并多次对投资人隐瞒信息,屡次被监管部门警示和处罚,说明其长期存在严重的风控缺陷。 目前“承兴案”相关刑事案件已一审宣判,承兴实际控制人罗静等诈骗嫌疑人均被判获刑。诺亚财富及歌斐资产仍罔顾投资人信任,拒不审视其内部管理问题,恶意对第三方京东发起匪夷所思的高额诉讼,企图混淆视听,继续误导投资人和广大公众,推卸和转嫁责任,为自己寻找“替罪羊”,相信法院会公正判决该案件。 参考资料: 1、《演了全套!两枚“萝卜章”骗走300亿,京东“躺枪”成被告冤不冤?》——国是说法 2、《两个萝卜章引发的惊天骗局》——市界 3、《两个萝卜章诈骗300亿,电视剧都不敢这么拍》——雷达财经
宁德时代暴跌9500亿
作者 | 周松涛 来源 | 首席财经观察 宁德时代股价再创调整新低。 今天(12月4日),宁德时代股价收盘大跌2.33%,最新收盘价为161.65元每股,总市值为6296亿。 宁德时代股价最高峰曾一度超过382元每股,现在已经完全腰斩,巅峰市值为1.58万亿,现在只有6296亿,距离最高点市值蒸发超过9500亿。 有网友表示,宁德时代带崩了创业板,值得注意的是创业板股价已经跌破了2000点。 也有网友表示是创业板带崩了宁德时代。 那么问题来了,宁德时代股价下跌的原因到底是什么? 新能源车对锂电池的需求增速放缓。 新能源车取代传统燃油车是不可逆的大趋势,但众多玩家也开始入局,产能在前期大幅释放,加上现在新能源车的增速较之前有所放缓,股价受到影响开始大幅下跌。 实际上,不只是宁德时代,比亚迪的股价近期也连续大幅下跌。 当然,直接原因可能就是此前股价被资金大幅炒作,炒作之后就是一地鸡毛。 宁德时代的股价最高曾超过380元每股,上市之后,股价涨了几十倍,股价疯狂炒作时,已经严重透支了未来的预期,一旦行业增速放缓,暴跌就在所难免了。 碳酸锂近期的低迷走势也对整个锂电池行业形成了拖累。 今天,碳酸锂期货再次跌停,创下上市以来新低,整个锂电池弥漫着悲观情绪,很多业内人士认为,碳酸锂现货价格跌破10万元几乎没有什么悬念。 不过,宁德时代作为电池行业的全球绝对龙头,调整或许只是发展过程中的一段小插曲而已。 宁德时代无论是业绩,还是当前的市盈率,整个市场份额,抑或是未来的成长性,都是毋庸置疑的,值得期待的。
奥特曼被曝芯片交易,成宫斗导火索?OpenAI怒甩5100万刀狂买AI芯片
【新智元导读】近日,OpenAI被曝与AI芯片初创公司Rain AI签了一份5100万美元的大单,将购买Rain研发的NPU,这是要摆脱微软和英伟达,自力更生了吗? 在OpenAI「权游」终结之后,能让他放慢脚步的原因只有一个——「芯片短缺」。 Sam Altman今年5月份就在公开场合表示,现在OpenAI正在经历严重的算力短缺。不但OpenAI用户体验到的各种卡顿,延迟都是由于算力不够导致的,而且因为「芯片」短缺的问题,让OpenAI没法给用户提供更多的功能。 12月4日,有外媒曝出,OpenAI在2019与AI芯片初创公司Rain AI签订了一份价值5100万美元的意向书,会在Rain AI的芯片上市后购买芯片。 Rain AI正在研发一种「类脑」NPU芯片,能大幅降低AI算力的成本,预计将在本月流片,并于2024年10月开始供货。 而且值得注意的是,Sam Altman作为Rain AI的股东,向它投入了100万美元。 根据一位不愿意公开身份的人士透露,Sam Altman之前被OpenAI前董事会解雇,部分原因就是他的其他投资与OpenAI纠葛的关系。 Jim Fan也转发了这条新闻并评论到: OpenAI 签署了一项协议,从一家名为 Rain AI 的初创公司提前订购价值 5100 万美元的「神经形态」人工智能芯片。第一个硬件计划于 2024 年 10 月推出,但可能由于资金问题而推迟。 我记得上次听说一款真正的类脑芯片是 2015 年 IBM 的 TrueNorth。看看这个领域如何发展很有趣。 OpenAI的5100万协议 随着Altman返回他忠诚的OpenAI,一项与AI芯片公司签订的协议,也悄悄浮出水面。 据爆料,此前OpenAI签署了一份意向书,将斥资5100万美元购买一家名为Rain AI的初创公司的AI芯片。 而Altman本人也斥资超过100万美元,亲自投资了这家公司。 OpenAI 与 Rain 的意向书显示了 Altman 的个人投资网络。 之前领导创业孵化器Y Combinator的经历,使Altman成为硅谷最杰出的交易撮合者之一。 在担任OpenAI 首席执行官的同时,Altman还投资了数十家初创公司,并充当企业家与全球最大公司之间的经纪人。 ——当然,也有人指出,Altman的这些「野心」,是导致他前端时间被「炒鱿鱼」的原因之一。 与Rain的这项交易显示了,OpenAI愿意花费大量资金来确保自己的AI项目所需的芯片供应。 作为AI领域最耀眼的明星公司,OpenAI在想办法布局未来,芯片就是其中一步。 Altman曾公开抱怨人工智能芯片的「极度稀缺」及其「高的令人乍舌」的成本。 尽管OpenAI背靠Microsoft的强大云资源,但由于硬件限制,经常会关闭对ChatGPT功能的访问。 OpenAI显然不希望在基本盘上受制于人,毕竟在当下,算力就是一切。 在此前的一篇博客中,Altman就表示,人工智能的进展速度可能取决于新的芯片设计和供应链。 据投资者文件称,Rain最早可能在明年10月向客户推出其第一批硬件。 神秘的Rain Rain成立于2017年,目标是推出模拟人类大脑运行原理的「类脑」芯片——NPU。 Rain表示,自己的NPU将拥有比GPU高出100倍的计算能力,而在训练方面的能效,甚至比GPU高出10000倍。OpenAI目前的主要算力都来自英伟达的GPU。 2018年,Altman领导了Rain的种子轮融资,一年后,OpenAI通过了这份价值5100万美元的芯片购买意向书。 Rain的总部距离OpenAI位于旧金山的总部不到一英里,目前拥有约40名员工,其中包括人工智能算法开发和传统芯片设计的专家。 截至2022年4月,由Prosperity7领投的一轮融资(2500万美元),使Rain的总融资额达到3300万美元。而Rain的估值也达到了9000万美元,不包括筹集的新现金。 另外,Rain还从百度的风险投资部门获得了一小笔种子投资。 不过,这家初创公司今年悄悄更换了首席执行官,前CEO Gordon Wilson变为了执行顾问,而William Passo从首席运营官晋升为首席执行官。 Wilson在LinkedIn帖子中表示,Rain准备打造一款产品,该产品将定义新的AI芯片市场,并大规模颠覆现有市场。「展望未来,我将继续尽我所能帮助Rain。」 除了领导层的改组,公司的投资者也发生了变化。 此前有报道称,一个负责监管国家安全风险投资的跨部门政府机构,要求沙特阿拉伯附属基金Prosperity7 Ventures出售其Rain的股份,之后,硅谷的Grep VC收购了这些股份。 ——这一切变动,可能会增加Rain将新型芯片技术推向市场的难度,也使OpenAI的5100万美元订单的兑现日期,变得不太清晰。 今年早些时候,Rain向投资者介绍了自己的进展,预计最快在本月就可以流片,并进行测试。 Rain还向投资者声称,自己已经举行了高级谈判,将系统出售给谷歌、甲骨文、Meta、Microsoft和亚马逊。 在去年的Rain新闻稿中,Altman称赞这家初创公司在2021年制作了原型,并表示它「可以大大降低创建强大AI模型的成本,并希望有一天有助于实现真正的通用人工智能。」 不过值得注意的是,尽管Rain AI的芯片被称为「神经形态处理单元」,在前文的介绍中,也号称自己相比于英伟达的GPU有更好的能效。 但Rain最初的芯片,其实是基于传统的RISC-V架构,针对的也是科技行业所谓的边缘设备。 这些设备远离数据中心,主要是搭载在手机、无人机、汽车和机器人上。 当前的大多数边缘芯片设计(如智能手机采用的芯片),都专注于神经网络的推理阶段。 而Rain的目标是提供一种芯片,既能用于模型和算法的训练,又能用于之后的推理运行。 Rain称自己的芯片将允许人工智能模型根据周围环境实时定制或微调。 ——从这个角度来看,它并不是当下英伟达H100之类GPU的直接竞品,那么OpenAI到底有什么计划呢? 相关人士表示,这些功能对OpenAI来说是一个强大的吸引力,OpenAI希望利用这些芯片来降低数据中心的成本,并将自己的模型部署在手机和手表等设备中。 当然,这可能只是猜测。 OpenAI的野心 前不久,OpenAI任命了前谷歌TPU的负责人为硬件主管,并且正在招聘「数据中心设施设计专家」。 消息称,由芯片工程师Richard Ho领导生成式AI创业公司的新部门,并且帮助优化合作伙伴的,数据中心网络、机架和建筑。 有网友贴心地为大家介绍了这位新的硬件主管: 「他在TPU的创建中也发挥了重要作用。也曾在DE Shaw工作并设计过 ASIC。到目前为止,他更多地负责软件硬件集成、DC设计和加速器芯片选择。但OpenAI最近也聘请了不少编译器和内核方面的专家。」 OpenAI的动作当然不止这些,在之前的董事会风波中,彭博社就曾报道过Altman计划创办AI芯片公司的消息。 Altman曾为了这个代号为Tigris的项目在中东筹集资金。——地点看起来有点巧合,不知道这个项目和Rain是否有什么关联。 另外,Altman还曾与包括芯片设计公司Arm在内的半导体高管进行过讨论,商讨如何尽早设计出新的芯片,为OpenAI这样的大语言模型公司降低成本。 当前的人工智能芯片市场由英伟达主导,但仍有如Rain这样一些新的入局者。 随着ChatGPT的出现,人们开始关注大型人工智能模型数据中心的耗电情况。Rain和其他一些芯片初创公司旨在重新配置数据处理方式,从而减少传输需求,降低功耗。 未来,AI算力供应的市场是否会有所变化?而OpenAI能否摆脱受制于人的局面?我们期待OpenAI的下一步棋。 对此,有网友泼了冷水: 「这毫无意义。英伟达不会失去OpenAI这个客户」。
AI+PaaS,中国云计算市场迎来新“变量”?
没有小的市场,只有还没有被发现的大生意。 随着企业数字化转型的逐级深入,市场需求进一步向PaaS和SaaS层进发,使之成为公有云服务市场增长的主要动力。 根据IDC最新发布的报告显示,2022-2027五年间中国公有云市场年复合增长率将达到26.9%,其中PaaS(平台即服务)增速最快,为30.5%,SaaS(软件即服务)紧随其后为28.7%。当云计算的基础设施建设完成后,中国公有云市场正在从资源驱动型延伸至技术和业务驱动。 与此同时,生成式AI和大模型的快速发展,也在加速推动PaaS成为下一代智能云的核心能力。 作为承上启下的中间层,PaaS层既要承担IaaS层快速规模化扩张带来的压力,又要承载SaaS层软件功能沉淀下来的可平台化能力,PaaS层将成为帮助企业全方位构建和应用AI原生力的关键环节。 01. 未被充分开发的 “中间地带” 追溯PaaS的发展历史可以发现,PaaS的发展与云计算的发展相伴相随。 2006年,Amazon Web Services正式推出并商业化,成为云计算的开端。2007年,Salesforce发布force.com,其目的是支持第三方客户在其上开发、部署和管理应用。此后,同类平台如雨后春笋般发展起来。 2011年,亚马逊云科技发布Amazon Beanstalk平台,红帽发布OpenShift平台,VMware发布CloudFoundry。2015年,IBM开始构建Bluemix平台。 2016年起,国内PaaS平台建设加速,阿里巴巴、华为等科技巨头开始发力公有云PaaS,一批初创型PaaS服务公司涌现在市场中。 当前,云计算服务交付模式主要有IaaS、PaaS、SaaS三类。 根据NIST(美国标准化技术机构)的定义,PaaS是将数据库、开发工具和其他支持应用服务交付的组件整合为一个平台作为服务提供给开发者,从而使得开发者无需关注应用程序运行和维护时所需要的资源,用户远程使用开发者开发的应用软件。 从整体架构看,PaaS搭建的是一个基础平台,在PaaS之下,平台以服务的方式提供给上游的SaaS及众多开发者。 PaaS运营商所能提供的服务涵盖了对该平台的技术支持服务、平台应用系统的开发和优化等一系列后续服务模块。PaaS运营商对外提供的服务是建立在强大而稳定的基础运营平台之上,需要专业的技术支持队伍的支撑。 通过将互联网的资源服务化为API,提高第三方开发者的开发效率,并且节约开发成本,提高WEB应用开发的敏捷性。 PaaS在云服务产业链中具备承上启下作用。云服务产业链中,位于底部(产业链上游)的一层可以为其上面(产业链下游)的任何一层或者终端客户提供服务。 在链条中,越是底部标准化程度越高,价格战也越有效,例如硬件设备、服务器。越是上层,越接近用户,标准化程度越低,性能稳定性、功能丰富性、交互、体验等多种指标影响性能评价,越无法进行简单横向比较,如SaaS层服务。 随着云计算的日渐普及应用,企业对于云的原生应用和全新的应用开发和管理模式都提出了更高要求,PaaS这一承上启下的中间层变得越来越重要。PaaS层面对的是软件开发商以及SaaS层企业,需要拥有强大的功能与稳定性,才能站住脚跟。 未来,改变中国云计算市场格局的“变量”很可能会出现在是一直被忽视的PaaS层。 首先,PaaS以平台之姿切入市场,为SaaS厂商提供集成平台(IPaaS)以及应用部署和运行平台(aPaaS),按部署的角度,PaaS又可细分为数据库服务、应用开发、应用基础架构、中间件服务等。 PaaS作为平台,所拥有的想象空间要比SaaS大很多,具备改变云计算市场格局的可能性。 其次,PaaS具有足够的成长空间。PaaS天然的被夹在了IaaS和SaaS之间,虽然IaaS服务商拥有做PaaS的先天优势,但以目前的发展态势来看,IaaS巨头都在忙着摆弄AI,这让PaaS有了生长的空隙。 其三,也是最为关键的一点,即市场对PaaS的强烈需求。纵观整个云计算领域,IaaS独领风骚,SaaS欣欣向荣,唯独PaaS市场没做起来。究其原因,主要是由于此前SaaS的发展水平较低,且各自为政,对PaaS并不刚需。 但随着企业级应用市场的爆发和成熟,SaaS应用之间对细分、跨层、效率、协作、打通的要求越来越高,PaaS的重要性陡增,PaaS体量猛增和进化增速必然会随之而来,这是可以预见的。 02. AI加速PaaS 成为下一代云的核心增长动力 伴随人工智能大模型等发展,各行各业在云端用人工智能处理大数据,正逐渐成为现实。 这个过程中,IDC调研发现,企业用户对云的需求变化,主要体现在以下三方面:在云上获得应用AI的能力、在云上获得AI加持的工具、在云上实现以智能驱动的应用创新。 IDC认为,下一代云将是按需适配企业智能化发展的“智能云”,云是AI落地和发展的土壤,AI也会助推云平台发展。技术层面,企业需要借助智能架构和系统,加速智能设施应用落地;在业务层面,企业需要利用云平台的资源管理能力,提高工作流程的自动化水平,实现智能运营;在生态层面,企业需要依赖下一代云上的智能工具,提升产品开发效率和产业协同能力,实现智能创新。 作为云平台承上启下的中间层,PaaS层的市场需求和功能也将随着下一代云的发展持续增强。 一方面,PaaS层的工具和产品能够帮助企业更好地调度、管理IaaS(基础设施即服务)层的基础资源;另一方面,SaaS层的应用也将逐步下沉成为PaaS平台的一部分功能,为企业用户提供更加便捷的服务。 从2023年上半年的情况来看,这一趋势愈加明显,PaaS增速为IaaS的两倍。2023年上半年,中国公有云服务整体市场规模(IaaS/PaaS/SaaS)为190.1亿美元,其中IaaS市场规模为112.9亿美元,同比增速13.2%;PaaS市场规模为32.9亿美元,同比增速达到26.3%。 实际上,PaaS正在成为下一代云核心增长动力已经是行业共识。根据中国信息通信研究院《云计算白皮书2023》数据显示,2022年中国云计算市场PaaS领域的增长高达74.49%,总收入达到342亿元人民币,而SaaS领域2022年的营收达到472亿元,增速27.57%。 企业用户不再满足于仅仅使用IaaS完成资源云化,而是期望企业管理和业务系统的全面云化以此抓住发展新机遇。同时,受AI大模型等的影响,未来几年PaaS和SaaS将成为云计算增长的主战场。 PaaS到目前已有超过15年的发展,过去15年,aPaaS可以说是PaaS的代表,模式日臻成熟。但随着人工智能、物联网、大数据等技术加快渗透到企业级应用,深度挖掘了PaaS的价值并产生新的需求。 尤其是如今生成式AI的火热,让AI作为底座重构业务成为可能,以AI PaaS为代表的数据类PaaS服务将成为PaaS未来发展的趋势。 AI PaaS就是将AI能力做为一种服务,它为企业提供了一个简单易用的平台,使他们能够快速搭建和扩展自己的AI应用,还有一点就是PaaS平台需要从封闭走向开放。 数智化时代企业的核心竞争力之一就是开放生态的构建能力,这种生态会模糊行业界限、企业界限甚至竞争的界限,比如汽车行业不仅有传统供应商,还要扩展到互联网、云计算行业。在这种变化下,PaaS平台也需要构建开放的、无界的生态服务,这样才能满足企业低成本,快速数智化的需求。 03. AI PaaS 云计算的下一片“蓝海” 从技术角度看,AI PaaS是一种集成了人工智能和机器学习服务的平台,用于构建、训练和部署AI驱动的应用。它解决了企业在快速构建AI产品时所面临的基础设施创建和维护问题。 AI PaaS为企业提供了一个简单易用的平台,使他们能够快速搭建和扩展自己的AI应用。 AI PaaS的关键组件包括预训练的机器学习模型和AI API。这些组件能够处理和分析数据,解决特定的任务,并提供相应的结果。 预训练的机器学习模型可以帮助企业快速开发和部署AI解决方案,而AI API提供了一组预置的函数和工具,使开发人员能够更轻松地构建和调用自己的AI应用程序。 使用AI PaaS有许多好处,首先是降低开发成本和时间。AI PaaS提供了预制的基础设施和环境,不需要从头开始构建。同时,AI PaaS具备高度可扩展性,可以根据需求进行快速扩展。 另外,AI PaaS内置了许多强大的工具和函数,使开发人员能够更高效地构建和部署自己的AI应用。 在选择AI PaaS服务时,有几个因素需要注意。首先是数据质量,AI PaaS的训练和性能结果直接取决于训练数据的质量。 其次是技术兼容性,确保AI PaaS与现有系统和工具的兼容性,以免出现不必要的麻烦。此外,API的可用性也是一个重要的考虑因素,确保API的稳定性和可靠性。 在不同行业中,AI PaaS应用前景非常广阔。从金融、医疗到制造业,AI PaaS可以帮助企业实现自动化和智能化,大大提高工作效率和业务竞争力。 AI PaaS未来的发展趋势是更多地应用于边缘计算和物联网领域,并不断提升性能和可靠性,以满足不断发展的市场需求。 在实施AI PaaS的过程中,可能会面临一些挑战。数据质量不佳、技术兼容性问题以及API的可靠性不足都可能影响AI PaaS的性能和效果。 为了克服这些挑战,企业应该确保数据的准确性和完整性,进行充分的测试和验证。此外,与AI PaaS提供商保持密切合作,及时反馈问题并寻求支持,也是解决挑战的关键。 AI PaaS作为一种集成了人工智能和机器学习服务的平台,将在未来发挥更加重要的作用。它可以帮助企业快速构建AI驱动的应用,提高工作效率和业务竞争力。 随着技术的不断发展和市场的需求增加,AI PaaS的性能和可靠性将得到进一步提升,为企业的数字化转型和实现智能化发展打下坚实的基础。 PaaS的持续进化,与企业业务数字化转型发展大潮密不可分。数字化转型以业务模式转型和业务流程效率提升为目标,正所谓“以云为体,数智为用”,即以云为体系和基座,以人工智能、大数据、区块链等 IT 技术的综合运用来解决系统化问题。 而PaaS,特别是与数据分析和AI服务相结合之后,必将激发出其更大潜能,成为提升业务数字化水平的又一件利器。
这位上海医生带头搞的AI,要让癌症诊断进入好时代了
不知道大伙们还记得,那名用 50 张 1080 TI 显卡对抗癌症的“ 业余 ”程序员不。 他曾自掏腰包训练了个 AI ,还整了个免费的网站,让人工智帮你“ 看片子 ”,能快速诊断出乳腺癌。 当时差评君就在畅想,未来,AI 技术在医学领域,铁定能溅起不小的水花儿。 但谁也没想到,这未来来得实在有些快,而且比起水花,AI 掀起的更像是大浪。 这不在前不久,医学顶刊 Nature Medicine 上就登了一篇论文,说是用 AI 大模型 + 简单的平扫 CT ,就可能大规模地筛查出早期胰腺癌了。 这消息,直接就在医学圈儿炸开了。 Nature Medicine 就罕见地附带了一篇评论文章,标题是这样的:在AI 加持下的医疗影像,即将迎来黄金时代。 各大媒体也都争相报道, “ 突破难题 ”“ 人类首次 ” 等赞美之词毫不吝啬。 而如果用一句话,来形容这技术的含金量的话。 差评君觉得比较贴切的是:放在过去,这事儿想都不敢想。 这么说吧,这次的大反派 “ 胰腺癌 ” ,在所有癌症里有个可怕的名字—— “ 癌症之王 ” 。 只要确诊胰腺癌,几乎就是被判了死刑,近 90% 的人在确诊胰腺癌后,活不过 5 年,这在癌症里算是一个相当可怕的数字了。 好多名人像吴尊友、帕瓦罗蒂等都是因为胰腺癌去世的。 死亡率这么高的原因,在于胰腺癌早期太难被发现了,一旦发现,大概率就是晚期。 因为胰腺这玩意儿,位置非常隐蔽,藏在胃后面,被十二指肠、脾脏和肝脏等器官包围住了。 而我们一般去医院体检的项目,像超声、平扫 CT 等等这些,很难发现早期胰腺癌的特征。 当然,增强 CT 或者是增强核磁共振,能把胰腺看得更清楚些。 但胰腺癌的发病率其实并不高,在所有癌种中只排在十名开外。 所以考虑到辐射、医疗资源挤兑等问题。。。为了胰腺,每个人每年都去做增强 CT 或增强核磁共振,其实划不来。 基本上只有病人发现了异样,才会去做这些项目。 但在症状上想发现早期胰腺癌,也很难行得通。 前期患者们的症状一般是恶心、呕吐、身体虚弱等,这和普通生病的症状没啥两样,医生们很容易就会被 “ 忽悠 ” 。 并且癌变会影响胰腺功能,早期胰腺癌还很可能伪装成糖尿病。。。 于是在影像 + 症状双重 Debuff 的情况下,想大规模筛查早期的胰腺癌就变成了一件难上加难的事。 所以这些年来,医学界为了能早点发现胰腺癌,可脱了不少发、秃了不少聪明脑瓜,但最后的成果呢,寥寥无几。 前些年,业内还有个很火的滴血验癌( ctDNA ),一度被大家看好,它是从患者的血液里找有没有癌症的碎片。 但这个方法,同样也很难发现癌症一期、二期的血液碎片,到现在快十年过去了,依旧没啥进展。 而这次,研究人员们想到了用 AI 大模型,来解这道题。 差评君也去到 Nature Medicine 官网上,翻了翻论文原文,有一说一,它还真有可能在早筛胰腺癌这块豁出个口子。 这次,他们整出了个名叫PANDA ( pancreatic cancer detection , with artificial intelligence )的 AI 大模型,根据简单的平扫 CT 图像,它就能做出胰腺癌相关的诊断。 这么说吧,在临床验证中,研究团队试验了两万多个病例, PANDA 几乎就没咋漏诊,99.9% 有胰腺癌的都给诊断出来了。 偶尔有一些误诊,也都是很容易排除的病变,像什么脂肪浸润、胃肠内容物等,医生简单审核下就能排除掉。 而用 AI 这点子,最早是上海市胰腺疾病研究所的曹凯医生( 也是这篇论文的共同第一作者 )想到的。 在他身上还有这么一小段故事,在大学期间,曹凯的实习导师也因胰腺癌去世,和很多患者一样,他在确诊的时候就已经是晚期了。 不过后来他在整理导师的病例资料时发现,在确诊十个月前,导师就曾做过一次平扫 CT 。 虽然当时没发现什么苗头,但带着结论回过头来分析,就能隐约看到到胰腺那里有病变的迹象。 在这样一个契机下,曹凯就想,既然人眼很难识别到平扫 CT 图像里,早期胰腺癌病变的迹象,那不如借助 AI 帮医生先筛查一遍。 后来,他遇到了达摩院医疗 AI 团队负责人吕乐,他们两个在这块不谋而合,这才有了现在的 PANDA 模型。 PANDA 帮忙筛查胰腺癌的过程说起来也很简单,和医生看片子也没啥两样。 不过它凭借强大的算法,注意到的细节比医生肉眼看到的多得多,自然也能顺利找到疑似病变的地方。 但要练好这么一个 AI ,可不是动动嘴皮那么容易的事。 它不像语言模型出错了打个哈哈就能过去, PANDA 对准确性的要求非常高。 而判断它看病好不好,还有两个维度,一个是特异性,一个是敏感性。 要是特异性高了,就很容易漏诊,敏感性高了,又会误诊。 而调这个漏诊、误诊的 “ 天平 ” ,归根结底,还得看喂给模型的数据集和训练模型的方法。 先是数据集,都说宠物毛发顺不顺还得看主人喂什么,在训练模型上也是同样的道理。 这块研究团队是下了血本,他们召集了来自各个医院的48 个医生,一共收集了3000 个病人的腹部 CT 图像。 其中有大概 2200 多个胰腺癌患者,和将近 1000 个非胰腺癌的病人。 这 3000 个病人的数据,都是医生们自己一个个手动标注的。 并且因为平扫 CT 图的对比度太低,手动标注不太现实,所以他们都是在患者的增强 CT 图上标注。 标注的过程也是相当专业,医生们要勾画每一层 CT 图上肿瘤的二维图像,每张有十多二十层,非专业人士是一点都干不了。 画出来的十多张二维图像,叠加起来差不多就是整个肿瘤的三维图。 要喂的数据准备好了,接下来就是选择模型 + 训练。 研究团队先是搞了个配准算法,把之前标注的增强 CT 数据迁移到平扫 CT 图上,让AI 学会看平扫的 CT 影像。 后面,就是重头戏了,虽说在医学领域 3000 个数据已经算是相当多了,但对于深度学习来说这些量就是中规中矩。 所以他们只好在模型算法上更下功夫,好找补回来一些。 据达摩院团队的张灵介绍,在选择模型的时候,他们团队先先后后试了好多种技术路线,最后搞出了一个 “ 混合版 ” 的模型,集分割、检测和分类功能于一身。 而且这三个功能还不是各干各的,而是层层递进、环环相扣。 就拿正常的一套完整的检测流程举例。 PANDA 在拿到平扫 CT 图之后,先会用分割功能在整张图像中找到胰腺的位置。 找到胰腺后,再启动检测功能,去看胰腺里有没有啥不对劲的地方。 要是找到有异常的地方,就用第三步的分类功能,去识别这情况属于哪种胰腺病变。 靠着这套模型和算法, PANDA 也开始在临床试验中,不断迭代和更新。 这个过程就是个典型的 “ 出错—反馈—纠错 ” 的循环了,前前后后研究团队大概花费了有一年的时间。 算法修正倒不是什么大问题,比较麻烦的是前期的反馈:要怎么修改这个 AI 。。。 就拿期间的一个例子来说, PANDA 有时会把脂肪浸润的情况检测出来。 光是这个情况,研究团队就和医生们讨论了三个月,要不要让它这么 “ 敏感 ” ,纠结了几次最后才毙掉了。 当然,虽说 PANDA 的准确性已经相当高了,但在实际的检测过程中,它只能起到一个初筛的作用。 它把医生们看不到的病变找出来后,还是得让医生们再次把关,确保没有误诊啥的。 去年 PANDA 模型已经成功上线,一些医院以及体检中心已经在用这个 AI 帮忙筛查了。 根据张灵的说法,到现在为止,他们已经用 PANDA 模型帮忙筛查了超过了50 万个人。 并且这里面,还成功发现并救治了两个临床漏诊的胰腺癌患者。 其中有一个人,每年都会去医院的体检中心定期体检,当时他在体检时并没发现什么异常。 结果七个月后,在 PANDA 进行临床试验的时候,他的 CT 图被检测出了有 95% 的概率是胰腺神经内分泌肿瘤。 后来,医院直接找来他,用增强磁共振检查了一通,发现 PANDA 还真没判断失误。 幸好肿瘤还在早期,早早手术割掉了,后续检查时也没再复发。 现在,研究团队也还没停下来,他们还想着进一步拓宽 PANDA 的筛查范围。 张灵透露道,眼下在考虑的,是要不要把囊肿加到 PANDA 的检测范围内。 在未来,他们还打算把更多的癌症、甚至慢性病都纳入进来,让大家只要在体检的时候做一次平扫 CT ,医生通过 AI 辅助,就能看出这些疾病的苗头。 或许有一天,在这个 AI 的协助下,所有的癌症,都能通过一次简单的平扫 CT 在早期被发现。。。 最后,我觉得穆克吉写的《 重病之王 · 癌症传 》中的一段话,还挺应景的: 为了追上这种疾病的步伐( 癌症 ),人类一而再、再而三地创造、学习新知识,扬弃旧策略。我们执着地与癌症进行抗争,时而精明,时而绝望,时而夸张,时而猛烈,时而疯狂,时而凛然。这场战争,人类已经持续了数千年。 而差评君也希望,在这次 AI 开辟的 “ 新战场 ” 上,人类可以彻底降伏癌症这头猛兽。 撰文:松鼠 编辑:江江 & 面线 封面:焕妍
GoogleX创始人预警全文:三年内,AI能在所有领域与人类智力工作者媲美
北京时间12月1日上午,在钛媒体2023T-EDGE全球创新大会·加州分会场上,谷歌无人车之父、Google X实验室创始人、Sage AI Labs首席执行官塞巴斯蒂安·特伦(Sebastian Thrun)发表主题演讲 新一轮AI革命影响正深刻影响人类社会。在通往下一代通用人工智能(AGI)时代的道路上,在短期内可预见的人机深度共存的世界里,我们当下既有的社会行为和社会规则,会发生哪些革命性的颠覆? 北京时间12月1日上午,在钛媒体2023T-EDGE全球创新大会·加州分会场上,谷歌无人车之父、Google X实验室创始人、Sage AI Labs首席执行官塞巴斯蒂安·特伦(Sebastian Thrun)就新一轮人工智能所引发的革命,首次发出全新的重磅预警。 在题为《人工智能新时代》(The New Era of Artificial Intelligence)的主题演讲中,特伦认为, AGI是一种与人类智慧相媲美的智能版本,我们在某些领域,我们已经实现了AGI。但是,我们尚未拥有的是,一种可以完成所有这些任务的人工智能。 基于在人工智能领域20多年的深耕,特伦表示,未来三年内,以下五大需要依靠人类智力的工作领域将会被颠覆,我们将看到AIGC在所有领域中都能与人类的智力工作者媲美,这意味着,所有的工作都将发生变化,没有一个工作将不受影响。 医疗行业 放射学、皮肤癌等许多领域中的诊断AI系统,能够在人们发现症状之前很久就发现潜在的致命疾病;AI可以提供个性化精准医学,根据你的背景、你的DNA以及你的个人特征量身定制的,以在最小的损害下产生最大的影响,放弃“一刀切”的时代;AI在药物研发上也起到了巨大的作用。 法律行业 AGI已经能够通过加利福尼亚州的法律入学考试,在表现上已经不逊于任何一所领先的法学院毕业生。律师工作中,与发现相关的,试图找到必要的事实,进行研究和起草文件,现在都可以由人工智能胜任。 汽车行业 我们现在拥有的汽车可以更自信、更安全地驾驶,比人类驾驶更为出色。 客服行业 客服中心的人工智能工具,可以提取最优秀的客户代理的最佳行为,提升14%的生产效率。 教育行业 AI导师可以提供个性化的指导,AI能够真正深入理解每个学习者,而且,它们可以在白天和黑夜中立即做出响应。 这也意味着,我们将重新定义社会的行为和运作方式。有的AI在我们这一边,它们可以代表我们并为我们服务,我们可以信任它们,这将是有史以来对社会的最大颠覆。
文字序顺不响影GPT-4阅读理解,别的大模型都不行
研表究明,汉字序顺并不定一影阅响读(对于英文来说,则是每一个单词中的字母顺序)。 现在,日本东京大学的一项实验发现,这个“定理”居然也适合GPT-4。 比如面对这样一段“鬼画符”,几乎里面每一个单词的每一个字母都被打乱: oJn amRh wno het 2023 Meatsrs ermtnoTuna no duySan taatgsuAu ntaaNloi Gflo bClu, gnelcinhi ish ifsrt nereg ecatkjnad ncedos raecer jroam。 但GPT-4居然完美地恢复出了原始句子(红框部分): 原来是一个叫做Jon Rahm的人赢得了2023年美国大师赛(高尔夫)的故事。 并且,如果你直接就这段乱码对GPT-4进行提问,它也能先理解再给出正确答案,一点儿也不影响阅读: 对此,研究人员感到非常吃惊: 按理说乱码单词会对模型的tokenization处理造成严重干扰,GPT-4居然和人类一样不受影响,这有点违反直觉啊。 值得一提的是,这项实验也测试了其他大模型,但它们全都挑战失败——有且仅有GPT-4成功。 具体怎么说? 文字顺序不影响GPT-4阅读 为了测试大模型抗文字错乱干扰的能力,作者构建了一个专门的测试基准:Scrambled Bench。 它共包含两类任务: 一是加扰句子恢复(ScrRec),即测试大模型恢复乱序句子的能力。 它的量化指标包括一个叫做恢复率(RR)的东西,可以简单理解为大模型恢复单词的比例。 二是加扰问答(ScrQA),测量大模型在上下文材料中的单词被打乱时正确理解并回答问题的能力。 由于每个模型本身的能力并不相同,我们不好直接用准确性来评估这一项任务,因此作者在此采用了一个叫做相对性能增益(RPG)的量化指标。 具体测试素材则选自三个数据库: 一个是RealtimeQA,它每周公布当前LLM不太可能知道的最新消息; 第二个是DREAM(Sun et al.,2019),一个基于对话的多项选择阅读综合数据集; 最后是AQuARAT,一个需要多步推理才能解决的数学问题数据集。 对于每个数据集,作者从中挑出题目,并进行不同程度和类型的干扰,包括: 1、随机加扰(RS),即对每一个句子,随机选择一定比例(20%、50%、100%)的单词,对这些单词中的所有字母进行打乱(数字不变)。 2、保持每个单词的第一个字母不变,剩下的随意排列(KF)。 3、保持每个单词的首字母和最后一个字母不变,剩下的随机打乱(KFL)。 参与测试的模型有很多,文章正文主要报告了以下几个: text-davinci-003、GPT-3.5-turbo、GPT-4、Falcon-180b和Llama-2-70b。 首先来看不同干扰类型的影响。 如下图所示: 在KFL设置中(即首尾字母不变),不管是加扰句子恢复还是加扰问答任务,模型之间的性能差距都不大。 然而,随着干扰难度越来越高(变为KF和RS后),模型的性能都迎来显著下降——除了GPT-4。 具体而言,在加扰句子恢复(ScrRec)任务中,GPT-4的恢复率始终高于95%,在加扰问答(ScrQA)任务中,GPT-4的相对准确性也都始终维在85%-90%左右。 相比之下,其他模型有的都掉到了不足20%。 其次是不同加扰率的影响。 如下图所示,可以看到,在加扰句子恢复(ScrRec)任务中,随着一个句子中被干扰的单词数量越来越多,直至100%之后,只有GPT-3.5-turbo和GPT-4的性能没有显著变化,当然,GPT-4还是比GPT-3.5优先了很大一截。 而在加扰问答(ScrQA)任务中,随着句子中被打乱的单词数量越来越多,所有模型性能都出现了都显著下降,且差距越来越大。 但在其中,GPT-4还能以87.8%的成绩保持遥遥领先,并且下降幅度也是最轻微的。 所以简单总结来说就是: 大多数模型都可以处理一定比例的干扰文本,但到极端程度时(比如单词全部打乱),就只有GPT-4表现最好,只有GPT-4面对完全混乱的词序,几乎不怎么被影响。 GPT-4还擅长分词 在文章最后,作者指出: 除了打乱单词字母顺序之外,还可以研究插入字母、替换字母等情况的影响。 唯一的问题是,由于GPT-4为闭源,大家也不好调查为什么GPT-4可以不被词序影响。 有网友发现,除了本文所证明的情况,GPT-4也非常擅长将下面这一段完全连起来的英文: UNDERNEATHTHEGAZEOFORIONSBELTWHERETHESEAOFTRA NQUILITYMEETSTHEEDGEOFTWILIGHTLIESAHIDDENTROV EOFWISDOMFORGOTTENBYMANYCOVETEDBYTHOSEINTHEKN OWITHOLDSTHEKEYSTOUNTOLDPOWER 正确分隔开来: Underneath the gaze of Orion’s belt, where the Sea of Tranquility meets the edge of twilight, lies a hidden trove of wisdom, forgotten by many, coveted by those in the know. It holds the keys to untold power. 按理来说,这种分词操作是一件很麻烦的事儿,通常需要动态编程等操作。 GPT-4表现出来的能力再次让这位网友感到惊讶。 他还把这段内容放进了OpenA官方的tokenizer工具,发现GPT-4看到的token其实是这样的: UNDER NE AT HT HE GA Z EOF OR ION SB EL TW HER ET HE SEA OF TRA 这里面除了“UNDER”、“SEA”和“OF”之外,几乎剩下的所有token都看起来“毫无逻辑”,这更加使人费解了。 对此,大伙是怎么看的呢?
鸿蒙将彻底放弃安卓 华为在下一盘大棋
【CN314智能生活】早在今年8月份上的HDC大会上,华为就给出了一个巨大的惊喜,那就是HarmonyOS NEXT,相比于目前消费者在手机上使用的鸿蒙系统,HarmonyOS NEXT可以说是真正意义上的“纯鸿蒙”系统,无法直接安装安卓APP,而是需要鸿蒙系统自己的原生hap格式软件。但是,一个新系统,想要抛弃安卓APP,建立自己的生态,在短时间之内恐怕难以实现,但鸿蒙在软件生态上的惊喜确实是相当多。 比如,近日有网友发现,米哈游的官网上线了一个新岗位,那就是引擎开发(系统向)—原神,在岗位叙述中,米哈游官方更是直接写到在引擎层对鸿蒙系统的适配,这也就意味着米哈游将会对旗下拳头产品《原神》,在鸿蒙系统上进行原生适配,这无疑让鸿蒙成为主流系统迈进了一大步。 鸿蒙放弃安卓,原生应用开始加速了 可能有人会说,不就是个游戏嘛,至于这么大惊小怪的吗?但《原神》甚至说是米哈游可完全不一样,作为行业内数一数二的游戏公司,米哈游来领头适配鸿蒙无疑是相当有号召力的。同时,如果作为一个新系统,没有了原生游戏的支持,那么这个新系统的吸引力无疑是会缩小很多的,毕竟玩手游也是用户日常必备的消遣活动。 只是可能新系统上需要建设的地方太多了,让鸿蒙对于游戏的支持变少了很多,这就导致直到2021年时鸿蒙才有了第一个Cocos游戏引擎的支持,这个引擎还只是一些小品级游戏在用,和Unity这样的主流游戏引擎那完全是没法比的,甚至在手游中,有超过70%的游戏都采用了Unity,所以对于Unity的支持至关重要。 好在今年的11月10日,Unity终于宣布自家引擎已经全面支持到了OpenHarmony游戏开发以及各项底层功能,这也是《原神》快马加鞭准备适配鸿蒙系统的原因,相信用不了多久,我们就可以在鸿蒙系统上体验到更加流畅的《原神》《崩坏:星穹铁道》等手游大作了。 当然,除了游戏以外,我们日常使用的APP鸿蒙适配进度也相当快,很多主流的大厂都参与了进来,比如涵盖饮食、出行、住宿等领域的美团,就在近日召开了鸿蒙原生应用开发启动仪式。美团表示会为鸿蒙开发原生APP,并且还能实现手机、汽车等多端设备互通,或许在未来,我们就可以在汽车上让小艺给你点一份外卖先送到家里。 其他的像同程旅行、网易云音乐,都加快了属于自己的鸿蒙适配进度,有一些互联网大厂甚至在高薪聘请鸿蒙方向的软件工程师,看得出来华为最开始那100亿开发资金确实是有用的,但更重要的是,目前超过7亿台设备的鸿蒙,已经坐稳了安卓和iOS之后第三大系统的位置,甚至在今年上半年里,鸿蒙的活跃设备排行榜还比苹果要高,这让不少开发者都把鸿蒙当做下一个风口,不想轻易错过,所以适配的积极性相当高。 万物互联,华为未来在下一盘大棋 总体来看,关于适配鸿蒙系统,有些厂商直接开个仪式高调宣布适配开发,也有闷声干大事的在组建鸿蒙系统开发团队。不过需要注意的是,这并不代表我们很快就能用上真正的鸿蒙系统,毕竟虽说明年华为要推出HarmonyOS NEXT,但只是为开发者准备的预览版,里面全部删除了AOSP代码,日常的安卓APP就完全用不了了,所以更多是给开发者做优化准备的。 同时需要注意的是,即便各大互联网大厂发力,真正想要和安卓比,那还是不现实,毕竟安卓系统发展十几年,各式各类的软件多如牛毛,即便明年发布了HarmonyOS NEXT用户版本,一些没有适配的软件也只能使用转译器才能使用,使用体验肯定是好不到哪里去的,所以鸿蒙想要超过安卓的软件生态,还需要一步一个脚印的前进。 但需要注意的是,根据目前来看,鸿蒙的原生应用肯定是要比安卓应用,体验要好不少的,从华为官方发布的《鸿蒙生态应用开发白皮书》能看出,鸿蒙系统其实是非常注重软件的性能调优,提供了多种工具方便开发者去优化应用功耗和流畅度。 同时和安卓生态野蛮生长不同,鸿蒙也引入了iOS的审核机制,如果不按照官方的规范去开发APP的话,华为同样是可以直接不允许上架的。对于兼容性、性能调度、功耗方面,华为一样做了严格的要求,什么不能长时间占用后台,应用切换不超过500毫秒等等,看得出来鸿蒙为了用户体验还是下了一番功夫的。 并且,相比于其他系统来说,鸿蒙系统还有一个相当大的优势,那就是万物互联,就像我们上面说到的那样,APP可以无缝衔接多个设备,让用户可以在车上坐着就能点外卖,这也是鸿蒙多年以来对于IoT以及车联网系统的深度合作,所得出的成果。 我们再回头来看安卓和iOS,安卓虽然家大业大,但混乱的生态至今都是靠各路手机厂商缝缝补补,才能在互联上有一定的作为,如今就算是最早做AIoT生态之一的小米,都选择融合Vela推出澎湃OS,直接放弃了单纯的安卓系统。至于iOS这边,是有一些生态链产品的,可吹了几年的苹果汽车,现在八字都还没有一撇,即便是推出了之后,面对竞争激烈的汽车市场,真不一定会卖得很好。 鸿蒙这边就完全不一样了,多设备之间的互联已经是炉火纯青,汽车市场上和华为合作的产品,也都卖爆了,即便是只看华为的手机产品,在宣告回归的之后,那也是在高端市场唯一能和苹果抗衡的厂商,这些对于开发者来说都是相当具有吸引力的。 现在唯一的问题还是要鸿蒙系统的软件数量得支棱起来,不过只要华为这边没有大的决策失误和环境变化,未来我们很有可能看到iOS安卓和鸿蒙三分天下的局面,所以正所谓好饭不怕晚,咱们再等等鸿蒙的发展也不迟。
斥资3.64亿元,OpenAI拟从阿尔特曼投资的初创公司购买AI芯片
原标题:斥资5100万美元,OpenAI拟从阿尔特曼投资的初创公司购买AI芯片 IT之家 12 月 4 日消息,据《连线》杂志当地时间周日报道,尽管萨姆・阿尔特曼上月先后经历了解雇、复职的一系列风波,但如果 OpenAI 在没有阿尔特曼的情况下继续开发 ChatGPT,他仍可以从中获利。 这是因为在阿尔特曼担任 CEO 期间,OpenAI 签订了一份意向书,该公司将斥资 5100 万美元(IT之家备注:当前约 3.64 亿元人民币)从一家名为“Rain AI”的初创公司购买 AI 芯片。这家公司的特殊之处在于它由阿尔特曼亲自投资。 据报道,Rain AI 的总部与 OpenAI 旧金山总部之间不到一英里,目前正在研发一种 NPU 芯片,旨在“复制”人脑的特征。根据交易副本和 Rain AI 今年向投资者披露的信息,OpenAI 在 2019 年签署了一项不具约束力的协议,在芯片上市后斥资 5100 万美元购买这些芯片。 Rain AI 方面透露,阿尔特曼个人已向该公司投资了超过 100 万美元(当前约 714 万元人民币)。投资者文件也称,Rain AI 最早可能于明年 10 月向客户提供第一批 AI 芯片。不过,OpenAI 和 Rain AI 均拒绝对此发表评论。 阿尔特曼曾公开抱怨 AI 芯片非常紧缺且成本令人“瞠目结舌”,并在一次闭门会议中表示“AI 的发展速度可能取决于新的芯片设计和供应链”。
16GB+1TB 不到两千,明年我们可能买不到这么香的手机了…
今年上半年存储产品价格大跳水,不知道差友们有没有趁机屯波硬盘? 没有的话,这波车应该是错过了,因为我发现固态硬盘它又涨回去了,不管是国产还是海外品牌固态,它们现在普遍上涨了几十甚至是几百。 就拿咱们部门很多小伙伴都上车的梵想 S500PRO 来说。 我亲眼看到它的价格从六百多一路降到了四百多,当时包括我在内很多同事都买在了半山腰,九月份我们还能以 468 的价格在自营店买到这款硬盘: 结果到了这会儿。 不管是官方还是第三方店铺,这款硬盘价格基本上都在五百块钱以上,自营店的价格更是来到了六百,涨上去的钱都够我买个不错的硬盘盒: 还有三星这款 980 PRO 固态硬盘也是,在年中那会儿咱们部门就有个同事以 498 的价格下单了一条,现在回过头去看,发现它也已经涨到了六百多: 而且这还不是个别现象。 其他品牌诸如西数、致钛、铠侠、金士顿、英睿达,它们的价格也迎来了上涨,双十一期间有不少固态硬盘卖得甚至比几个月前的平日价还贵。 这么看的话,在九月份之前买了固态硬盘的人简直赢麻了啊。 考虑到之前就有消息称三星和海力士会进一步减少闪存产能,而且还宣布对存储芯片进行涨价,看来明年硬盘价格继续上涨是板上钉钉的事情。。。 说真的虽然我知道硬盘涨价该来的总会来,但是没想到会来的这么快,不到五百块钱就能买到 2TB 固态硬盘的好日子大概率是一去不复返。 而且不止固态硬盘价格上涨,前阵子三星还跟小米、OPPO 和谷歌等客户签署了 DRAM 和 NAND 芯片供应协议,价格比现有合同高出 10-20%。 这意味着接下来要发布的手机,很可能要涨价了。。。 当然,这事儿也没有那么绝对,因为手机厂商还可以通过提前囤货、砍掉一些不重要的周边配置等各种手段来转移内存和闪存上涨导致的成本增加。 至少就目前来看,最近发布的这些新机,像是小米 14 还有 iQOO 12,同样的内存和容规格下,它们的首发价相比上一代反而还更便宜了。 而且我注意到这些手机厂商的定价策略出奇的一致。 你看不管是小米、vivo 还是 iQOO,它们推出的标准版旗舰,16GB+1TB 版本普遍比 16GB+512GB 版本贵上 400,而 Pro 版旗舰则贵了 500: 好家伙,要知这些标准版和 Pro 版旗舰实际上用的都是 LPDDR5X 内存和 UFS 4.0 闪存,敢情他们是觉得买 Pro 版的用户不差这一百是吧。。。 不过相比起 iPhone 15 每增加 128GB 容量需要花费整整 1000 块钱,这些国产安卓手机厂商的定价策略相对来说还算比较良心的了。 话说回来,相比起旗舰机,我其实更关心今年到明年要发布的那批中端机,它们到底会不会涨价。 众所周知之前得益于内存、闪存价格暴跌,很多国产手机厂商趁势把 “ 普及大内存和大容量 ” 当成了一大卖点,推出了不少 “ 量大管饱 ” 的中端机。 当很多旗舰顶配还停留在 16GB+512GB 的时候,它们不仅淘汰了 8GB 内存,最高可以选配 16GB 甚至 24GB 内存,而且最大容量也来到了 1TB。 最关键的是我们只需要花上两三千,就能买到这些顶配版机型,简直香的一批。 说到底,花大价钱买旗舰机的人还是少数,那些价格不贵、各方面体验都还算不错的中端机才是大多数人的首选,同时也是很多手机厂商的基本盘。 2023 年手机均价为 3480 元 有句话怎么说来着:“ 当潮水退去时,才知道谁在裸泳 ”。 如今内存和闪存颗粒价格涨上来之后,接下来发布的中端机会不会涨价就各凭良心了,到时候要是把已经淘汰的 8GB 内存给重新加回来,那就尴尬了。 目前根据爆料,很多手机厂商新机仍然会有 8GB 的版本,但是部分厂商还是会硬着头皮上 24GB+1TB 版本的中端机,至于价格是否会上涨还不确定: 前阵子红米发布的 K70E,配置规格依旧是 12GB+256GB 起步,而且 16GB+1TB 版本售价 2599 元,算是开了个好头: 其他中端机像是 iQOO Neo9、一加 ACE3 也在路上了,这些手机厂商到底是真普及还是玩噱头,就让我们拭目以待。 撰文:胖虎 编辑:米罗&面线

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。