行业分类:
加载中...
头条分类:
加载中...
最强LLaMA突然来袭,多个任务打败ChatGPT、Claude 2
原标题:最强LLaMA突然来袭!只改一个超参数,实现上下文3.2万token,多个任务打败ChatGPT、Claude 2 悄无声息,羊驼家族“最强版”来了! 与GPT-4持平,上下文长度达3.2万token的LLaMA 2 Long,正式登场。 在性能上全面超越LLaMA 2。 和竞争对手相比,在指令微调MMLU (5-shot)等测试集上,表现超过ChatGPT。 在人类评估(human evaluation)上甚至优于10万token的Claude 2,这个话题还在Reddit上引发了讨论。 要知道,这些对比版本中,LLaMA 2 Long使用的最大版本也只有70B,远小于其他大模型。 这让人不禁感慨:Meta确实还是有两下子的。 也有人觉得,这才是最近Meta发布会的最大新闻啊,比Meta版ChatGPT要更令人兴奋。 论文介绍,LLaMA 2 Long使用了4000亿token语料加持下,并进行位置编码修改。 所以LLaMA 2 Long究竟是如何诞生的? 01 只对位置编码进行了一个非常小的改动 与LLaMA 2相比,LLaMA 2 Long的变化并不多。 一是训练参数上,采用了高达4000亿token的数据源。 ——相反,原始LLaMA 2包含多个变体,但最多的版本也只有700亿。 二是架构上,与LLaMA 2保持不变,但对位置编码进行了一个非常小的必要修改,以此完成高达3.2亿token的上下文窗口支持。 在LLaMA 2中,它的位置编码采用的是旋转编码RoPE方法。 它是目前大模型中应用最广的一种相对位置编码,通过旋转矩阵来实现位置编码的外推。 本质上来说,RoPE就是将表示单词、数字等信息的token embeddings映射到3D图表上,给出它们相对于其他token的位置——即使在旋转时也如此。 这就能够使模型产生准确且有效的响应,并且比其他方法需要的信息更少,因此占用的计算存储也更小。 在此,Meta的研究人员通过对70亿规模的LLaMA 2进行实验,确定了LLaMA 2中的RoPE方法的一个关键限制: 即,阻止注意力模块聚集远处token的信息。 为此,Meta想出了一个非常简单的破解办法: 减少每个维度的旋转角度。 具体而言就是将超参数“基频(base frequency) b”从10000增加到500000。 这一改动立刻奏效,缩小了RoPE对远端token的衰减效应,并且在扩展LLAMA的上下文长度上优于一项类似的名为“位置插值”的方法(如下图所示,RoPE PI,衰减效果较为“隐含”)。 Ps. 图中RoPE表示基线方法,RoPE ABF为Meta此次发明的新方法,xPos是另一种应用了该方法的旋转编码变体。 一个问题是,通过上面这个可视化结果,Meta观察到RoPE在长程区域出现了较大的“振荡”,这对于语言建模来说可能不是个好消息。 不过,通过报告几种方法在长序列困惑度和FIRST-SENTENCE-RETRIEVAL两个任务上的表现来看,问题不大。 而且,尤其在后者任务上,他们提出的RoPE ABF是唯一一个可以始终保持性能的变体。 在附录中,Meta还通过可视化为螺旋图这一非常有趣的方式,将RoPE ABF与RoPE PI的差异进行了理论分析。 结果是,与RoPE PI相比,RoPE ABF的优势主要体现在它能以更大的粒度分配嵌入向量(the embedded vectors),从而使模型更容易区分位置。 此外,他们还观察到,嵌入向量之间的相对距离既对RoPE PI的关键参数有线性依赖性,也对RoPE ABF的关键参数也有对数依赖性。 这也就是为什么我们可以很容易地对基频这一超参数“下手”。 最终,LLaMA 2 Long凭借着这一改动,达成了3.2万的上下文token,并通过长下文连续预训练的共同作用,获得了开头所示的好成绩: 除了全面超越LLaMA 2、在特定任务上超越Claude 2和ChatGPT,Meta也给出了它和一些开源长下文模型的对比。 结果也相当不赖。 02 One More Thing 值得一提的是,这个最新的版本,是用LLaMA2生成的文本内容来进行训练的。 官方会不会正式发布这一版本,现在还没有更明确的消息,模型的网址也还没有找到。 不过已经有人提前兴奋起来了: 这对可商用微调大模型来说太有用了! 而在此之前,已经有非官方版本实现了3.2万token上下文,也是开源可商用。 “长颈鹿(Giraffe)”基于13B版本的LLaMA2打造。 研究团队提出了一种称为“截断(truncation)”的方法,对原始RoPE编码进行变换。 llama-2-7b-32k-instruct也可以支持3.2万上下文,模型规模是7B。
苹果的“创意灵魂”Jony Ive,这次想携手OpenAI引领AI时代的硬件革命?
9月27日,据The Information报道,苹果前首席设计官Jony Ive和OpenAI公司首席执行官Sam Altman正在讨论打造一款新的AI硬件设备。据悉,软银首席执行官孙正义也参与了二人之间的讨论,但目前尚不清楚他是否会持续加入其中。 报道中并未透露关于这款AI 硬件的外观和用途,知情人士称,双方希望合作为“人工智能时代创造一种新硬件”。市场推测,这款全新的产品将把ARM的芯片、苹果的硬件、OpenAI的软件三合一。分析认为,布局AI硬件也许可以让OpenAI在未来数年间这场“AI改变消费者生活”的大赛中取得竞争优势。 图片来源:推特截图 对于Jony Ive来说,这可能是他离开苹果后最具挑战性和创新性的项目。作为苹果公司前首席设计官,Jony Ive曾经领导了苹果许多最具标志性的硬件设计,从iMac到iPhone,从iPad到Apple Watch,无一不体现了他对美学和功能的追求。 1967年,Jony Ive出生在英国伦敦,他的父亲既是著名银器匠也是名教师,注重设计和技术。Jony Ive深受其父影响,他曾说,“我一直都深知手工制作东西的美妙之处,我逐渐认识到真正重要的是要对产品倾注心血,我十分鄙视那些反映出创作者粗心大意的产品。” 在高中期间,Jony Ive优秀的设计能力就已经展现出来。在一次小型学生展览中,伦敦知名设计公司罗伯茨・韦弗集团(Roberts Weaver Group)的总经理发现了Jony Ive的才能,并在后来赞助他上了诺森比亚大学。 1992年,Jony Ive正式加入苹果公司。1997年,他成为苹果工业设计高级副总裁,带领工业设计团队,负责大部分重要硬件产品。同年,苹果前CEO史蒂夫·乔布斯委托Jony Ive的团队设计iMac。值得注意的是,当时苹果已经濒临破产。 1998年5月6日,乔布斯向世界展示了初代iMac。当时的iMac外观呈蓝色半透明的球形,透过外壳可以看到电路板整齐排列的内部结构。而正是这样一款设计独特的电脑让苹果“起死回生”,并在当时成为历史上最畅销的台式机之一。它可以说是苹果历史上最浓墨重彩的一笔,这也使得Jony Ive成为乔布斯最亲密的伙伴之一。 “他不仅仅是一名设计师。”乔布斯这样告诉他的传记作者Walter Isaacson。“除了我之外,他比苹果公司任何人的运营能力都要更强。” Jony Ive是苹果许多最具标志性的硬件设计背后的“创意灵魂”,创造了一个又一个经典。不仅是iPod、iPad、iPhone、Apple Watch、iMac,就连苹果零售店,甚至是苹果汽车都有Jony Ive帮忙献智献策。 2011年,乔布斯去世后,Jony Ive领导开发了Apple Watch,虽然该产品最初未能达到销售预期,但它创造了一项可穿戴业务,在2021年为苹果创造了高达380亿美元的收入。 除了硬件设计,Jony Ive也参与了许多软件设计。2012 年,他晋升成为苹果高级设计副总裁,并负责了iOS 7的外观设计。2015年,他开始担任苹果的首席设计官。 2019年,Jony Ive正式离开苹果,创办了自己的设计工作室LoveFrom,并与苹果签订了一份价值超过1亿美元的长期合作合同。2022年,Jony Ive结束了与苹果的合作关系。 而如果这次Jony Ive和OpenAI合作成功,这次全球最著名的设计师与最受关注的科技公司明星CEO之间的结盟也将值得被载入史册。
硅谷创投大佬的思想宝典,史上转发最多的推文
作者丨信陵 编辑丨海腰 欧美有一类出版物叫Almanac(年鉴),属于信息资源类的工具书,类似大百科或是词典。 Almanac是历书演变来的。早期的Almanac主要是天象、潮汐涨落、日历,后来收录了笑话、诗歌、家庭医疗常识等(也不乏占星术和预言等“迷信”内容)。在书籍奇缺、信息匮乏的年代,Almanac是欧美普通家庭的工作和生活指南。 高质量的Almanac,有的很畅销,有的很“常销”。 美国的富兰克林撰写的《穷查理年鉴》(Poor Richard's Almanack)是一部箴言集,每年销量1万册,畅销了25年(1732-1757),而殖民地时期费城的总人口只有1.5万人。美国最长寿的《老农夫年鉴》(The Old Farmer's Almanac)诞生于1792年,230年来出版从未间断。 Almanac发展到今天,多数都成了专注某个行业或是科目的工具书(类似Yearbook),但也有的编者继承了富兰克林的衣钵,把当代智者的思想集纳成Almanack(中文翻译常用“某某宝典”)。 比如,年底将满100岁的查理·芒格的《穷查理宝典》(Poor Charlie’s Almanack),以及今天我们要推荐的《纳瓦尔宝典》(the Almanack of Naval Ravikant)。 纳瓦尔何许人也? 纳瓦尔(Naval Ravikant)是硅谷的创投大佬,但他的影响力已经超越了行业和国界。在一些企业家的眼里,纳瓦尔的智慧已经堪比美国“国父”富兰克林和与巴菲特搭档60多年的查理·芒格。 樊登读书创始人樊登说:上一代的创业者喜欢读《穷查理宝典》,新一代的创业者应该读《纳瓦尔宝典》。 Flomo联合创始人刘白光说,如果说查理·芒格是20世纪的本杰明·富兰克林,纳瓦尔就是21世纪的查理·芒格。 纳瓦尔1974年生于印度,9岁到美国,21岁获达特茅斯大学计算机和经济学学位。作为企业家,纳瓦尔先后创办过多家成功的创业公司(包括AngelList、点评网站Epinions和分类广告平台Vast);作为顶级的天使,他投资了200多家公司,代表作有Uber、Twitter和企服赛道的Yammer。 当然,如果仅仅是商业成就的话,纳瓦尔还无法被尊为人生导师。 纳瓦尔的出圈是因为他日常发的推特。他有一个系列叫“如何不靠运气致富”(How to Get Rich Without Being Lucky)是推特历史上被转发最多的推文之一。 更难得的是,除了财富,纳瓦尔的推文涵盖了人生的大部分主题:幸福、健康、睡眠、饮食、阅读,等等。信息密度大、呈现方式多、杂、碎,文字简洁有力,直奔主题,非常贴近当代年轻人的内心和口味。 《增长黑客》作者范冰在《纳瓦尔宝典》推荐序中说:内心深处,我们期许自己独立多元、不被定义,就如海因莱因(美国科幻作家)所说的那样,只有昆虫才专业化。 换句话说,纳瓦尔不仅事业成功,而且生活幸福,他的观点和思想就像是五彩缤纷的鸡尾酒,能够丰富大众的人生,陪伴我们成长。 《纳瓦尔宝典》一书以纳瓦尔过去十年(截止2020)分享的推特、文字记录以及访谈为基础,内容分为积累财富、增强判断力、学习幸福、自我救赎、哲学、纳瓦尔的推荐读物等几个部分。编者埃里克认为,推特、播客和采访很快会被新信息覆盖,被时间遗忘,而纳瓦尔有价值的思想非常值得用一种用更持久的方式——图书——留存。 值得一提的是,《纳瓦尔宝典》电子书常年位居亚马逊电子书店的商业类榜单首位。 以下纳瓦尔的观点选自《纳瓦尔宝典》第一章:积累财富。 1. 着眼长远,追求复利 复利的概念源于资本,但纳瓦尔认为,生活中所有的回报,无论是财富、人际关系,还是知识,都来自复利。 比如,一个人如果积累了良好的个人声誉,早晚会得到关注和重视。体现在商业关系中,如果彼此有了信任关系,谈判就可以化繁为简,就有明显的复利效用。 因此,一旦找到了正确的事和同行的人,就要全身心投入,持续精进,就能从人际关系和经济利益中获得巨大的回报。 当然,学习也是如此。纳瓦尔说,知识能产生复利,致富最重要的技能是成为终身学习者。 2. 为社会填补空白,并规模化 技术天才丹尼尔 希利斯说,科技就是一套尚未完全发挥作用的东西。某种东西一旦得到广泛应用,就不再是科技。但社会总是需要新事物。如果想变得富有,你就要搞清楚你能填补市场上的哪些空白,而提供这些东西对你来说又是轻松自然,在你的技术和能力范围之内。 3. 找到天赋所在,积累专长 纳瓦尔认为,现代社会,杠杆无处不在,真正的求知欲所带来的高回报前所未有。因此,人类需要追随自己的求知欲,而不是盲目跟风,追逐热点。 只有追求自己真正感兴趣的事情,才有可能做到独辟蹊径,才能避开竞争。纳瓦尔说,本质上,竞争就是模仿,与他人竞争,是因为你跟比尔在做一样的事。但每个人又是独一无二,并不需要模仿他人。 另外,无论选择做什么,都要以事情本身为目标。这也是艺术创作的一个鲜明特征。无论创业、恋爱都是如此。体验过程,反而能够做的更好。 4. 必须使用杠杆 纳瓦尔把世界上的工作分为“存在杠杆的工作”和“不存在杠杆的工作”。比如,客服这样的工作,产出主要靠投入的时长,没有杠杆可言,就需要尽量避免。据此,纳瓦尔把现代人也分为两种,“利用了杠杆的人”和“没利用杠杆的人”。 纳瓦尔说,资本和劳动力都是杠杆,但和普通人关系不大。大多数人的杠杆就是“复制边际成本为零的产品,比如代码和媒体”。这类杠杆始于印刷机,但真正爆发是在互联网和编程时代。新一代的富豪都是通过使用代码和媒体诞生的。 但如果你不能像比尔 盖茨、扎克伯格、乔布斯那样使用代码杠杆,你可以借助媒体,比如录制播客、发推特、拍视频,这些事情主要是靠头脑赚钱,有杠杆营销,而不是用时间赚钱。 5. 考虑时间成本 设立一个大胆的个人时薪,并严格执行。如果解决一个问题节约的成本低于时薪,那就忽略问题。如果外包能解决问题,就绝不自己干。 这可能是纳瓦尔的独门绝技。他在20年前给自己的定价是时薪5000美元,虽然当时他的市场价格是1000美元(相当于年薪240万美元)。 这样,每次做决策时,纳瓦尔就把时间作为考虑因素。做这件事需要多长时间?假设你需要坐一个小时的车去获取一件东西,如果你给自己的时薪是1000美元,那么这一趟等于花掉1000美元,你还要亲自去拿吗? 《纳瓦尔宝典》中文版很薄,正文不到200页,15万字。樊登说,人生真正重要的道理确实不需要太多的话。纳瓦尔自己甚至用一句话就总结了他的致富经:把自己产品化。 “自己”指的独特性,就是专长,“产品化”就是发挥杠杆效应,实现规模化。因此,纳瓦尔特别鼓励大家在行动之前,要花大量的时间想明白一个终极问题:我能提供什么独特的价值? 最后说一句,纳瓦尔有时也膨胀,会总结一些超越了自己专长范围的所谓“成功的算法”。比如纳瓦尔就认为,饮食=天然食物+间歇性禁食+植物。 挺搞笑的。
价格突然大跳水!网友:心态崩了
为期8天的中秋国庆长假已开启。正当旅途开始之际,却有不少旅客在社交媒体吐槽,自己还没出发,提前购买的机票就已经大幅降价,部分旅客月初购买的机票现在降价50%,甚至有的旅客“亏损”已经上千元。 例如,据橙柿互动,有一位网友吐槽自己提前20天,预订了9月29日从昆明飞太原的机票,双人往返价格为4800多元。可最近一看,发现价格降到了2400多元,他的心情就像是坐上了一趟“5折的过山车”。 9月28日,网友“Cantus つ”在小红书上发帖称,“早买直接贵了1100,心疼”。根据截图,该网友购买了10月2日08:30南航CZ6838南京-乌鲁木齐班次,两人机票总价为2886元(含机建燃油)。而另一张截图则显示同一班次两人机票总价为1755元(含机建燃油),降价超过550元每张。 网友“Cantus つ”在小红书上发出的截图 南都记者于9月29日在OTA平台上搜索国庆期间的机票价格,发现许多航班的价格确实较低,例如10月2日20:55国航CA1866广州-上海班次,经济舱机票价格为560元(含机建燃油)每张。林女士对记者说,“平时广州飞上海的价格一般是960元(含机建燃油)左右。”而记者在铁路12306平台上搜索同一天广州-上海的高铁票,动车二等座票价为599元每张,复兴号高铁二等座票价为793元每张。 OTA平台上10月2日20:55国航CA1866广州-上海班次经济舱机票价格 国庆假期后的机票亦有降价。9月28日,网友“王先森的小朋友”在小红书平台上发帖吐槽机票降价。根据截图,该网友所购机票为10月14日11:05首都航空JD5665丽江-上海班次,经济舱机票价格(含机建燃油)为1231元每人。而南都记者于9月29日在OTA平台上搜索同一班次,发现经济舱机票价格(含机建燃油)降至968元,降价超200元。该网友尝试退票,发现退费手续费需648元每人。 网友“王先森的小朋友”发布的小红书 遇到类似情况的,可能还不是个别现象,引发不少网友的困惑与讨论,有网友发现,当地机票价格甚至低于高铁票。这一现象让很多网友感到惊讶和无法接受。他们说,自己在买机票时并没有发现价格已经大幅下降,如果不是看到其他人的晒单,可能还不知道自己被高价机票坑了,很多网友纷纷表示心情崩溃。也有不少旅客感到困惑,表示不知该如何处理已购买的机票,是否应该退票重新购买。 一个月间价格浮动如此大,航空公司作何回应?机票价格为何会出现如此大幅的“跳水”? 01 多旅客反馈相关问题 航司回应 杨宇(化名)原本今年假期打算去西藏旅游,提前一周查看成都到拉萨的机票,发现当时平台给出的9月29日、30日的去程最低票价是1000元左右,其他时间的票价约700元~800元。而在28日晚,他发现整个到拉萨的机票都有所降价,其中30日的票价已降到600元左右,长假期间的最低票价已降到350元~400元,降幅明显。 一位网友表示,9月28日,从成都前往乌鲁木齐,九月初买票时单人往返需要4054元,但9月27日再次查询时,同一航班往返机票已降到1850元,他感到十分无奈,两个人旅游还没开始,感觉就已经亏了4000多元。之前五一前往三亚时是临时订票,机票非常贵,这次假期早点买票,没想到反而更贵了。 而这似乎并不是特例,随着假期来临,机票跳水现象出现也被外界广泛关注。 据都市快报,杭州女士丹丹调侃道:“现在买机票,也是买出了股票的感觉。”她表示,刚在手机上刷到一段“十一机票为何大跳水”的视频,立马就去看了自己之前订的行程,竟然真的比之前便宜了5000多元。 丹丹发的朋友圈(净赚数字有误,实际为5490元)。图片来源:橙柿互动 行程是飞西双版纳,两户家庭去,都是2个大人带1个小孩的组合,总计6人。他们打算错峰出行,所以决定从10月4日出发,订了10月8日返程的机票。 9月13日第一次下单共花费22614元 图片来源:橙柿互动 第一次下单时间是在9月13日,在旅游平台上连着“酒店+机票+租车”一起预订,共花费22614元。看到新闻后试了下退款再重新预订,这次总计花费17124元。相比之下,一来一去人均省了900多元,6个人的旅游总开销就省下5490元。 丹丹和朋友算了下这笔账,也是没想到才相差10多天预订,价格波动还挺大。 相比之下,6人总开销省了5490元。 图片来源:橙柿互动 一位上海网友表示:“暑假已经吃过一次亏了,提前20天定新疆往返6000多,等到出发的时候,才3000出头。”今日下午,一位广东网友也表示,“半个月前买的机票,刚看了一眼,降了差不多一半”。此外,还有网友称,“600济南飞乌市”“广州飞武汉,比高铁票还便宜也是没想到”。 据媒体报道,记者在OTA平台上搜索国庆期间的机票价格,看到许多航线的价格确实非常便宜,例如10月3日成都出发前往乌鲁木齐的机票甚至最低只需93元。 即使是国庆前9月28日出发,最低也只需要400元,还是下午出发的优质时刻。“以前成都到新疆,五一国庆都飙到2000,现在节前400元难以理解。”有旅客表示。 同时,据每经记者通过航旅纵横查询到,长假期间与长假后往返机票总体价格并无太大差别。 9月30日从成都出发前往乌鲁木齐,机票往返价多集中在1800元左右,到了临近回程时间,则变为2000元以上。值得注意的是,假期后的10月7日至27日,往返机票价格却与假期无异,多集中在1693元~1793元间。 而另一热门航线北京—广州的机票同样如此。9月30日机票往返价格约1096元,到了10月7日~21日间,价格多在1059元左右。 上海至三亚机票10月1日~28日,仅10月28日为870元,假期与平日价格差别不大,往返机票价格波动在1218元~1496元之间。 对于价格跳水现象,一家第三方售票平台相关人士通过微信向记者表示,机票价格都是航司定的。 为此,据每经记者以旅客身份电话咨询一家航空公司客服。对方回应称,近日确实有此情况。机票的销售价格本身就存在波动,所以并不是越早订越划算。航空公司不会给旅客补差价,建议旅客自行对比价格,若差额较大可选择退票重新购买。 02 业内:或系航司前期预期较高所致 节前部分机票价格突然大跳水,最主要的原因可能是运力过剩。 航旅纵横大数据显示,中秋国庆假期期间,计划执行总航班量近14万班,日均航班量比2019年同期增长约20%。航班管家数据显示,截至9月13日,部分城市线日均计划航班量同比2019年增长1倍,如成都-长沙、成都-杭州、成都-武汉等航线。 与大幅增长的运力相比,预订量并未同比例增长。航旅纵横大数据显示,截至9月25日,中秋国庆假期间的机票预订量仅基本恢复至2019年同期水平。 暑期客流的涨幅也未跟上运力的涨幅。据民航局,2023年暑运期间(7月1日—8月31日)民航运输旅客1.3亿人次,较2019年暑运同期增长7.4%。但是全民航日均保障国内客运航班14087班,较2019年暑运同期已有14.83%的增长。 而与供大于求的供需关系相比,机票价格却依然高涨。航班管家数据显示,截至9月27日,双节期间的国内机票订单量比今年五一增长了1.2倍。机票价格同样明显上涨,国内机票(经济舱)均价1078元,同比2022年国庆增长四成以上,同比2019国庆增长一成以上。 据多家第三方机构此前预测,此次中秋国庆长假出行热度将再上一个台阶,因此机票在预售阶段定价较高。但由于实际需求并不能填补所有供给,临近假期发现实际销售情况不尽如人意,许多航线还有剩余座位,所以节前机票价格又有了大幅降低。 9月29日,靠谱旅业CEO张致宁通过微信对每经记者分析称,中秋和国庆假期前夕,国内机票价格出现前高后低的情况,主要是受供求关系变化的影响。大部分游客在国庆假期前一周甚至更早时间,完成了中秋、国庆假期旅行规划和机票预订。当机票预订即将达峰,部分航班仍有空余座位时,航空公司会通过降低票价,刺激潜在用户预订机票,从而尽可能多地填满空余座位。 此前的9月8日,据携程旗下的FlightAI航空智能大数据发布的《2023年中秋国庆前瞻》,2019年每日订票热度显示,当时预订十一假期出行的用户在节前15日快速增加,并在假期首日达到峰值,而后急速下降。截至9月3日,2023年前期趋势与往年基本一致,预计将在节前一周迎来十一出行订单的集中预订。 民航专家林智杰认为,此次临近假期机票价格跳水的程度确实不太常见。他在微信中向记者表示,这反映出今年十一长假航空出行的热度或不如预期,销售进度落后,所以出现了价格倒挂的情况。 据界面新闻,有业内人士透露,一些航司反馈,即使放出低价,上座率也没有明显提高。 今日,成都某机场一位工作人员在电话中向每经记者表示,其认为主要原因还是前期航空公司的预期较高,所以现在调低了票价。该机场工作人员同时表示,这种情况下航空公司不会补差价,相比于退票费,如果票价过高,消费者选择退票并重新购买更划算。 03 遇到机票价格跳水,消费者怎么办? 据南方都市报报道,面对部分机票价格大幅跳水的情况,有消费者表示向航空公司和OTA平台反映后,“全额退票退款”“降价退差价成功”。还有一部分消费者则庆幸自己购买了平台的保价服务,最终平台返还了差价。 但也有消费者与航空公司和OTA平台多次协商无果。旅客陈女士对记者说,其9月16日购买的10月1日07:55国航CA2661成都-湛江班次,价格为1118元每张,在9月28日降至730元每张,9月29日又回升至970元每张。陈女士向国航客服反映情况,称“国航的客服态度并不好”。“昨天晚上跟国航客服打了十几分钟的电话,她给我提了个方案让我觉得离谱,让我10月1日等飞机15分钟以上的延误就可以全款退给我。最后国航客服让我问平台能不能退,平台可以她们就同意。”“我声称要投诉,客服说随便。’” 而陈女士于9月28日向OTA平台反映“航空公司说只要你这边能退就行”的情况,平台客服先是表示“预计在2023-10-07 18:00:00给您回电处理”,随后在陈女士“马上处理”的要求下,客服称“帮您催促一下在9.29 12点之前给您回电处理”。后陈女士接到AI回电,但挂断了电话。“看到今天(9月29日)机票价又回升了”,陈女士后续没有继续与平台客服沟通。 记者就相关问题咨询了北京德和衡律师事务所何闪闪律师。何律师表示,机票销售是随订随售、浮动定价模式。其价格会受到供需关系、航班实际售票情况等因素影响。一般而言,越临近航班出发时间机票价格越高,但也会存在出发前由于购票人数不如预期,航空公司降价促销的情形。 关于平台提供的机票保价服务,何律师表示,可能会有部分航空公司,为了促销而提出保价服务,也就是购票人预订机票后,航空公司承诺在一定时间段内(保价期)价格不会上涨。如果保价期内出现降价,则航空公司需按保价内容向购票人支付差价。 从消费法律关系来看,购票人一旦完成购买某时段的机票,便视为与航空公司之间的合同关系成立并生效,除非有其他法定或约定事由,否则该消费服务合同无法解除或撤销。那么因降价而带来的票价差价也就不会退回。同样,航空公司也不会因为涨价而要求购票人补上差价。另外根据《消费者权益保护法》的规定,如果航空公司在提供商品或者服务时有欺诈行为,应当按照消费者的要求增加赔偿其受到的损失,并承担一定的惩罚性赔偿。 何律师提醒,还有一种情况值得注意,就是通过第三方平台订购机票时,不排除存在第三方平台擅自抬高机票销售价格,随后又恢复到航空公司的实际机票售价,从而导致机票降价。那么这种情况实际上是第三方平台从中赚取了差价。如果购票人能够证明购票时航空公司的售价是低于第三方平台销售的价格,这种情况下,购票人是可以主张第三方平台退回差价的。
扎克伯格在元宇宙里一小时的“真人对话”,惊艳了全世界
「这是我与扎克伯格在元宇宙中的对话。我跟 Mark 物理距离有上百英里,但我感觉是在和他面对面。因为我们的形象都由照片级精度的 3D 模型进行了建模,这技术太神奇了!我认为这就是人们未来在互联网上交流的方式,」Lex Fridman 说道。 昨天,麻省理工学院(MIT)科学家 Lex Fridman 与 Meta 首席执行官马克・扎克伯格的一番隔空对话,成为了社交网络上的最大热门。他们在元宇宙里长达一个小时的采访视频播放量很快就冲上了千万。 现在,在元宇宙里,我们的形象可以做到和真人几乎一致,从全身细节到表情动作,自然得让人惊叹。 以至于在现实世界里,我们需要注意管理一下表情: 效果过于真实,让人有些绷不住了。 在 Lex Fridman 播客的「首次 Metaverse 对话」中,扎克伯格展示了 Meta 的新型 Codec 虚拟现实化身,其使用扫描技术构建用户面部的 3D 模型,再由机器学习实现驱动。在对话过程中,新型头显会检测用户的面部表情并将其实时映射到 3D 化身上形成动作。 扎克伯格说,在元宇宙对话时,「平台基本上是在通过网络发送你形象的编码版本,这种方式甚至比传输视频的带宽效率更高。」 当然在元宇宙里,你也可以对自己的形象进行一些定制,比如修改一下打光: 与 Meta 最初的虚拟化身不同,此前的技术被嘲笑为无腿、目光呆滞且令人难受,新一代的形象却显得极其真实,延迟也可以忽略不计,能让你在虚拟世界里感受到和别人在一起。 扎克伯格表示:「这触及了增强现实愿景的核心,即无论你身在世界何处,它都能提供一种临场感。」 这一切显然给进行渲染的硬件带来了更多的负载。在对话中,扎克伯格和 Fridman 都戴着最新版 Quest Pro,它具有内置的面部跟踪和眼球跟踪功能。需要注意的是,这并不是前几天发布的 Quest 3。Quest Pro 可能要等 2025 年才能正式发布。 Codec 形象需要对用户的面部进行扫描,以建立 3D 虚拟模型。 扎克伯格的采访是在元宇宙里,聊的内容也是元宇宙。在长达一小时的对话中,扎克伯格聊了元宇宙、增强现实、大模型等话题。 扎克伯格说,其实人们大部分的交流并不是通过语言完成的,而是通过表情等细节。Meta 正尝试着用更多卡通化身来捕捉表情,在传递逼真体验的同时,也有一定的真实感。 他建议用户可以编辑他们的虚拟分身,让他们展示更为夸张的情绪,并开玩笑说他可能会用化身技术来调整他著名的无表情的讲话方式。 尽管虚拟化身令人印象深刻,但要广泛使用它们可能还需要一段时间。 需要注意的是,这次采访中显示的人物形象是使用最先进的、长达数小时的扫描(包括数百个摄像头)创建的,这是普通消费者现在还无法企及的。 不过扎克伯格在采访中表示,Meta 的计划是让人们能够使用智能手机进行非常快速的扫描。 「你只需拿起你的手机在自己面前晃动几分钟,说几句话,做出一堆表情...... 然后 AI 就可以制作出我们现在拥有的质量的东西,」扎克伯格告诉 Lex Fridman。 扎克伯格说,Meta 计划在未来几年里把这项技术整合到产品中。 与 Meta 的免费 VR 游戏和社交平台 Horizon Worlds 所使用的卡通头像相比,目前逼真的投影效果有了显著改善。 扎克伯格的元宇宙自拍照。 去年,扎克伯格在虚拟埃菲尔铁塔外发布了一张他的元宇宙化身的自拍照,遭到了社交媒体上的一片嘲讽,评论者将其画面与上世纪 90 年代的电子游戏相提并论。扎克伯格当时承认,这个头像是「基本的」程度。 没想到时隔一年,技术的进步就如此巨大。 正如 AI 科学家 Lex Fridman 在采访过程中感叹的:「我真的不知道如何形容这种感觉,这就像是我们正在同一个房间里,就像是未来。」 扎克伯格持续不断的努力正在改变人们对 Horizon Worlds 的印象。他告诉 Lex Fridman,逼真的虚拟形象可能有助于吸引那些对元宇宙里图像感到反感的人,「人们被这种体验所震撼,但我们确实收到了一些反馈,人们说头像在这种环境中感觉没有那么逼真。」 显然,如今的元宇宙能力会给我们的交互方式带来巨大的变化。不得不承认的是,这是扎克伯格元宇宙项目有史以来最令人印象深刻的展示。 「改变了,我们对元宇宙的观感开始改变了」——这是划时代的技术。 如果不久之后,Meta 在消费级产品做到这样的效果,它可能会成为一种改变游戏规则的应用。
诺奖前夜,Nature发文ChatGPT终极预测!mRNA疫苗能否锁定大奖
2023诺贝尔奖即将在下周,也就是10月2日-9日(当地时间)揭晓。 我们每个人心中或许都会有个疑问:谁会摘得今年的诺奖桂冠? 在此之前,不如用「地表最强」AI——ChatGPT预测下今年诺奖重大进展。 Nature最新文章称,微调后的大模型,包括ChatGPT在内,都能大大增强预测诺奖得主的能力。 为了找到诺贝尔奖得主的线索,印第安纳大学网络科学研究所所长、物理学家Santo Fortunato向ChatGPT寻求帮助。 那么,ChatGPT预测的诺奖到底准不准? 01 ChatGPT预测诺奖得主 2014年,Santo曾和其他合著者发表的一篇爆火的文章称,候选人常常需要等上20多年才能得到这个科学上的最高荣誉。 他在社交网络平台称,每年诺奖开奖之前,都会有很多人问,今年是谁? 这次,Santo直接把这个问题抛给了ChatGPT。 他给ChatGPT的提示是,「给出尚未获得诺贝尔奖的在世科学家,在化学、物理、生理学或医学领域的三大发现」。 然鹅,ChatGPT却表示,「我无法预测未来,包括2023年在内任何一年的诺贝尔奖获得者」。 这个回答并没有让人很意外。因为,除ChatGPT之外,任何一个聊天机器人,都不是能够预测未来的「水晶球」。 之后,Santo的学生输入了类似的提示,让Claude,以及ChatGPT去回答。 结果发现,两个聊天机器人都能挑出重要的发现,从基因组编辑工具CRISPR研发,到2D材料石墨烯的发现。 但是,不可否认的是,它们的发现还有重大的缺陷。 ChatGPT和Claude指出的发现中,已经有科学家们,因此获得了诺贝尔奖。 这还不是唯一的问题。Santo表示,「我问的是『活着的科学家』,而它们却给出的例子实际上,是已经『去世的科学家』」。 对此,小编拿着同样的提示问问ChatGPT,顺便给它用上最新的必应联网功能,看看回答的怎样? 第一次,ChatGPT并没给出答案。 明确预定每个领域的「三大」发现很有挑战性,建议查阅科学杂志、知名新闻机构或与各领域相关的组织。 同样的问题再问一遍,这次,ChatGPT给出了自己在这三个领域方向和进展的预测。 ChatGPT称,「我可以举例说明这些领域最近的重大发现或进展,如果不做进一步研究,很难确定相关科学家的诺贝尔奖得主身份」。 首先,在化学领域。 - CRISPR-Cas9技术:这是一种革命性的基因编辑系统,允许科学家精确修改生物体内的基因。 该系统的研究者之一生物化学家Jennifer Doudna曾获得了诺贝尔奖,但与该系统的开发密不可分的其他人却没有获得诺贝尔奖。 - 金属有机框架(MOFs):这是一种具有极高表面积的化合物,能够捕获、储存和释放化合物,具有包括碳捕获在内的广泛潜在应用。 其次,在物理学领域。 - 第一张黑洞图像:Event Horizon Telescope合作组织于2019年发布了第一张黑洞图像。 虽然这是一项集许多科学家之力取得的努力,但并非所有参与其中的科学家都获得了诺贝尔奖。 - 引力波探测:LIGO首次探测到引力波是一项不朽的成就,虽然一些关键人物获得了诺贝尔奖,但许多贡献者却没有获得诺贝尔奖。 最后,在生理学或医学领域。 - mRNA疫苗的开发:为COVID-19快速开发和部署mRNA疫苗是一项不朽的成就。「虽然一些科学家获得了认可,但其他科学家却没有获得诺贝尔奖。」 - 免疫疗法在癌症治疗方面的进展:免疫疗法是治疗某些类型癌症的重大进展。 可以看到,ChatGPT以上的回答都是,侧重三个领域当前研究的重要方向。 不如再让它预测下,2023诺奖得主。 ChatGPT根据网络搜索结果,没有给出真正答案,再次强调「一些化学家预测,mRNA疫苗的开发可能会获得2023年诺贝尔化学奖」。 如此说来,mRNA疫苗有很大可能成为今年化学领域风向标。 再问它最后一个问题,「哪位中国科学家,最有可能获得诺贝尔奖」? ChatGPT根据一些中国科学家因自己的贡献获得国际认可,被许多人作为潜在诺奖得主,并给出了几个例子。 03 AI预测可靠吗? 那么,用ChatGPT预测诺奖的结果可不可信? 伊利诺伊州芝加哥大学的计算社会科学家James Evans表示,「尽管大型语言模型(如ChatGPT和Claude)无法成为伟大的诺贝尔预言家,但它们确实有潜力成为强大的预测工具」。 若使使它们达到目的,还需要做一些「微调工作」。 简言之,创建一个能预测诺贝尔奖的AI,需要对LLM需要进行修改,并在适当的数据上进行训练。 就在上周,分析公司科睿唯安(Clarivate)发布了2023年度「引文桂冠奖」名单。 这份名单在过去20年,成功预测了71位未来诺贝尔奖获得者,主要是通过分析作者研究的被引次数。 不过,这样的分析,通常是无法预测出,准诺奖得主具体的获奖年份。 「引文桂冠奖」名单着重突出发表论文被引次数至少2000次的研究人员,这一程度与多数以前的诺奖获得者相当。 与此同时,科睿唯安的分析还考虑了,这些被高度引用论文的作者是否有开创性发现,并且是否已经获得显著的奖项。 今年上榜的研究人员,在癌症免疫疗法、合成生物学和材料科学等领域做出了巨大贡献。 科睿唯安研究分析主管David Pendlebury表示,公司已经开始探索生成式A如何帮助预测未来的诺贝尔奖得主。 「我们可能会在明年的评选中,从AI预测中得到一些贡献」。 生成式AI可以为现有方法提供一个优势,它们能够在大量科学作品中进行查找。这将提高我们确定为潜在诺贝尔奖获得者的候选人库的速度和全面性。 特殊贡献,无法量化 丹麦技术大学的物理学家Rasmus Bjørk对诺贝尔奖得主进行了分析,仅仅看引用,不足以表明谁将来可能获得诺贝尔奖。 Bjørk说,要获得最高奖项,研究人员需要做出开创性的工作,推动一个领域向前发展,或者对社会产生根本性影响。 「这个贡献,必须有一些特别之处。因此,量化这种特殊性可能很困难」。 但Bjørk表示,生成式AI工具也可能会,延续此前围绕诺奖的偏见。 自1901年诺贝尔奖设立以来,至今,也只有60位女性获奖。 如果LLM根据过去获奖者的数据进行训练,它们更可能选择男性,而不是女性作为未来的潜在获奖者。 基于AI的新奖? 当然,要真正决定谁将获得诺贝尔奖,人类的判断力依然是无法比拟的,而这这也正是诺贝尔奖的魅力所在。 但有朝一日,LLM可能会在科学奖领域,创造出公平的竞争环境。 由此,也可以为基于较少偏见的AI分析而非人类委员会观点的新型奖项,铺平道路。 而这种奖项,也将有助于突出那些,以目前尚未得到认可的方式颠覆和改变科学的研究。 最后,贴一个physicsworld对今年物理学奖的预测。他们曾在2013年时,正确地推断出Peter Higgs和François Englert会因对希格斯机制的预测而获奖。 04 「DNA结构」发现者,缺一个诺贝尔奖 在《科学美国人》最新一期报道中称,英国物理化学家与晶体学家Rosalind Franklin(1920-1958)因发现DNA双螺旋结构,应当再加冕一个诺贝尔奖。 1953年4月25日,一篇题为《核酸的分子结构》的文章登上Nature,寥寥千余字却像一颗金手指一样,轻松地捅开了模糊了生物学界多年的那层纸,具有里程碑式的意义。 论文地址:https://www.nature.com/articles/171740a0 很多人都知道,因为解开了DNA双螺旋的秘密,背后最大贡献离不开Rosalind Franklin。 然而,1962年生物学家James Watson,Francis Crick和Maurice Wilkins因发现了DNA的分子结构而被授予生理学或医学奖,唯独没有Rosalind Franklin。 这一年的诺贝尔奖,至今仍存在巨大争议,仅有3名男性获奖,而他们的女同事被排除在外。 诺贝尔奖规则规定,奖项只能授予活着的科学家。 但2011年诺贝尔生理学或医学奖除外,该奖的一部分授予了医生Ralph Steinman,但委员会并不知道他已在公布前3天去世。 许多人认为,即使Franklin活着,诺贝尔大会也会忽略她,就像之前的所有女性一样,居里夫人、Gerty Cori。 《科学美国人》称,诺贝尔颁奖典礼应当纠正这一错误,将诺奖追授给富兰克林Franklin,以表彰她在发现双螺旋结构方面发挥的核心作用。 05 诺奖之路,愈发漫长 毫无疑问,诺贝尔奖是世界上最负盛名的科学奖项。然而,通往诺贝尔奖的道路,却越来越漫长。 现在,几乎有一半的获奖者从做出值得诺贝尔奖的发现到获奖要等待20多年。 一项分析表明,在过去的60年里,从发表研究成果到获得科学奖的平均时间几乎翻了一番。 在三大科学奖中,化学奖的「诺贝尔奖滞后期」最长,过去十年的平均值为30年,而生理学或医学奖的滞后期最短,为26年。 诺贝尔的遗嘱规定,奖项应颁发给「在前一年为人类做出最大贡献的人」。但实际上,这种情况只发生过几次。 此外,在20世纪上半叶,诺贝尔奖得主年龄在30多岁是很常见的,而现在这种情况却闻所未闻。 2014年,印第安纳大学计算社会科学家Santo Fortunato,发表了一份自诺贝尔奖设立以来所有获奖者的分析报告。结果显示,获奖者的获奖研究与其获得诺贝尔奖之间的时间间隔一直在缓慢增加。 对此,康奈尔大学的计算社会科学家Yian Yin表示,造成这种趋势的原因可能有很多。 比如,由于每年取得突破的总体数量都在增加,因此奖项跟不上值得表彰的人数。或者,一些工作的重要性可能只有在数年甚至数十年后才被认识到,Yin称之为「睡美人」。 另一方面,这种日益拉大的差距也可能表明——那些能够改变其领域范式的「颠覆性」研究或发现,变少了。 Fortunato表示,「重大突破」的数量正在减少,但当它们出现时,往往会很快得到认可。 例如,加州大学伯克利分校的生物化学家Jennifer Doudna和马克斯-普朗克病原体科学研究所的Emmanuelle Charpentier,在开发出基因编辑工具CRISPR-Cas9系统仅仅8年后,就获得了2020年诺贝尔化学奖。 有研究人员推测,在COVID-19疫情期间向全球数百万人推出mRNA疫苗的发明者,也可能获得类似的认可。 但问题是,如果上述等待时间继续拉长,一些杰出的科学家很可能就会因为禁止追授奖项的规定,而与诺贝尔奖失之交臂。 06 颁奖时间表 诺贝尔奖颁奖季又到了。 每年10月,瑞典和挪威的诺贝尔奖委员会都会评选出科学、文学、经济等共计六个奖项的获奖者。 随后,获奖者将于12月在斯德哥尔摩领取诺贝尔奖奖章和证书。 今年,诺贝尔奖的奖金为1100万瑞典克朗,按当前汇率折合约98.9万美元。 值得一提的是,每年诺奖评选最让委员会头疼的一个问题是「rule of three」,就是说,每个奖项最多只能颁给三位科学家。 - 生理学或医学奖将于10月2日周一宣布。 - 物理学奖将于10月3日周二宣布。 - 化学奖将于10月4日周三宣布。 - 文学奖将于10月5日周四宣布。 - 和平奖将于10月6日周五宣布。 - 经济学奖将于10月9日周一宣布。
3nm,台积电的一道小坎
2023年9月13日,苹果的秋季新品发布会上,与iPhone 15 Pro系列一同登场的,还有全球首款3nm芯片A17 Pro,其依旧出自苹果的老朋友台积电之手。 在这款芯片发布前,大家都对它寄予了厚望,与4nm这样的小节点相比,3nm是继5nm后又一次重要的工艺迭代,回顾过往历史,每次工艺的大升级,都会带来芯片性能的又一次大幅度提升,而3nm本该也是如此。 但意外偏偏发生了,这颗本应强大的A17 Pro芯片提升幅度并没有大家想象中那么大,反而iPhone 15 Pro的发热问题,让苹果变成了“火龙果”。 那么,发热发烫这个锅,是不是要让台积电来背呢? 神仙难救的散热 很快就有人为台积电撑腰了,天风国际分析师郭明錤今日发文,针对目前苹果 iPhone 15 Pro 手机过热问题进行了解读,并表示“与台积电 3nm 制程无关”。 郭明錤称,iPhone 15 Pro 系列的过热问题,与台积电的 3nm 制程无关,主要很可能是为了让重量更轻,因此对散热系统设计作出了妥协,像是散热面积较小、采用钛合金影响散热效果等。 当然,这话说得确实挑不出毛病,根据目前的拆解来看,iPhone 15 Pro依旧采用的双层主板,背部是ROM芯片,面前的是基带芯片,都是发热量较大的几颗芯片,把它们放到一起,无异于让A17 Pro待在篝火旁边,负载一大,火势就会变大,不仅处理器降频运行,用户也会很快就会感受到手机发热。 外加苹果在这次发布会上吹了很久的钛合金边框,实际上还变相加剧了iPhone散热差的毛病,钛的导热系数λ=15.24W/(m.K),约为镍的1/4,铁的1/5,铝的1/14,而各种钛合金的导热系数比纯钛的导热系数还有再下降约50%,这也就是说iPhone 15 Pro虽然轻了,但是散热反而不如iPhone 15的铝合金边框和iPhone 14 Pro的不锈钢边框。 但是郭明錤这番话也并不全面,根据国内极客湾的测试,iPhone 15 Pro和iPhone 15 Pro Max的续航时间相较于上一代,反而出现了倒退,下降了几十分钟左右,在电池容量微增的基础上,续航时间反而缩短,除了处理器本身性能调度原因外,问题恐怕还是出在了A17 Pro的本身的能效表现上了。 根据Techinsights的芯片拆解,与A16相比,A17 Pro 每颗性能核心和效率核心的面积减少了 20%,每个 GPU 核心的面积增加了 5%,整体 GPU 核心增加了 20%,且由于工艺制程的进步,A17 Pro芯片的整体面积略有缩小,但晶体管数量来到了新高,为190亿,对比上代的160亿晶体管,增加了近20%,能够完成如此大的升级,台积电3nm工艺功不可没。 但根据苹果官方的公告,A17 Pro的CPU整体性能只是比上一代提升了约10%,提升幅度达到20%的GPU又有很大程度上是因为5核变6核,只有NPU提升幅度最大,算力从17TOPS升级到35TOPS,不难猜测它的实际规模变大了不少,外加新的USB 3控制器的加入,这些就是A17 Pro的主要升级点了,并未完成很多人预期里的大幅度跨越。 当A17 Pro褪去了神话光环之际,台积电的3nm也备受质疑。 FinFET气数已尽 为什么在4nm还顺风顺水的台积电,唯独到了3nm时却翻了车呢? 在5nm时,无论是台积电还是三星,都采用了FinFET(鳍式场效晶体管)的技术来控制流过晶体管的电流,这种技术能从「三面」来控制电子的通过(如下图),若电子没有被好好控制而乱跑,就会造成漏电,继而使手机的温度升高。 为选择更好的控制电流,两家半导体巨头都发展出从「四面」来控制电子通过的技术,称作GAA(Gate-All-Around),进一步防止漏电发生。但在3nm这一节点,台积电选择续使用FinFET工艺,直到2纳米才转换成GAA,三星则抢先在3纳米时导入GAA,虽然目前还未大规模量产,但有望提供比FinFET更好的功耗与密度。 2011年,英特尔首度在Ivy Bridge 微架构处理器上应用22nm FinFET技术,2014年,台积电和三星首度在16/14nm工艺里导入FinFET工艺,在随后的几年时间当中,FinFET成为了众多晶圆厂热捧的技术,传统平面工艺无法满足先进制程的需求,摩尔定律再一次得到延续。 但没过几年,到了7nm制程以下,静态漏电的问题越来越大,原本制程演进的功耗和性能红利逐渐消失,FinFET无法满足3nm及更先进制程的需求已成为了大家的共识,何时导入GAA就成为很多人关心的重点,英特尔和台积电选择在3nm上继续沿用FinFET,而处于竞争劣势的三星下定决心,在3nm就引入GAA技术,力图争取到更多客户。 在2020年8月的台积电技术研讨会上,台积电表示,它已对其 FinFET 技术进行了重大更新,N3即3nm会使用 FinFET 的扩展和改进版本,性能增益高达 50%,功耗降低高达 30%,密度增益比 N5 提高 1.7 倍,不过这里需要注意的是,这部分对比仅仅是初代N3与N5的对比,在N5经过多轮迭代升级到最新的N4之后,实际提升并没有研讨会上公布的那么美妙。 回过头再来看GAA,台积电将其称为nanosheet FET,Intel称其为RibbonFET,这些技术本质都是一样的,就是把FinFET的fin转90°,然后把多个fin横向叠起来,这些fin都穿过gate——或者说被gate完全环抱,所以叫做gate all around;另外每个翻转过的fin都像是一片薄片(sheet),它们都是channel,因此也被称为nanosheet FET。 从结构上来看,GAAFET电晶体的gate与channel的接触面积变大了,且每一面均有接触,也就能够实现相比FinFET更好的开关控制。而且对于FinFET而言,fin的宽度是个定值;但对GAAFET而言,sheet本身的宽度与有效通道宽度是灵活可变的。更宽的sheet自然能够达成更高的驱动电流和性能,更窄的sheet则占用更小的面积。 台积电没在3nm用GAA的原因并不难理解,成本和技术。成本是新工厂新设施吃掉的资本投入,而技术呢,例如硅基通道中较低的空穴迁移率(hole mobility),导致pFET性能表现不佳。IBM在之前的IEDM上表示,这一问题的解决方法在于pFET可应用压缩应力的锗化硅(SiGe)通道材料:「pFET锗化硅通道能够实现40%的迁移率提升,相较硅基通道有10%的性能优势,而且有更低的阈值电压(Vt),负偏压温度不稳定性(NBTI)表现也有提升。」 当然GAA的好处并不明显可能也是台积电的顾虑之一,三星此前谈到了3nm GAA制程,其比4nm FinFET在频率和功耗方面的优势,如下图所示,但图中并没有提供绝对值和相对值,其只是笼统地说,3nm GAA与4nm FinFET电晶体相比,在相同的有效通道宽度(Weff,fin/sheet的宽度× fin/sheet的个数)下,3nm GAA能够达成更高的频率;与此同时达成更低的功耗。 种种原因让台积电打定主意,在2nm才会使用GAA,3nm成为了最后一代FinFET,这也为A17 Pro的翻车埋下了伏笔。 更要命的当然还是良率问题,根据 Hi Investment & Securities 的数据,三星的 3 nm良率估计超过 60%,相比之下,台积电的 3 nm良率约为 55%,新技术的良率几乎与旧技术良率持平,让人不由想起了几个月前曝光的苹果与台积电之间的“甜心交易”:苹果向台积电下巨额 3nm 芯片订单,但是要求不合格芯片成本均由台积电自己承担,苹果只需要为良品芯片付费,有媒体表示,这样下来,苹果每年可节省数十亿美元。 如果良率足够高,苹果也没必要专程与台积电达成这项交易了,而台积电自2022年量产3nm至今,良率仍然没有到达苹果的底线,如今在能耗表现上也不理想,接下来能否说服更多客户接受这样一个价格再次上涨的工艺,或许才是台积电在2024年需要解决的大问题。 3nm谁领风骚? 目前,台积电为苹果代工的依旧是N3B即第一代3nm工艺,该工艺的好处是晶体管密度大幅增加,即A17 Pro实现的190亿晶体管,而明年登场的N3E,在晶体管密度上表现会稍逊一筹,但功耗控制方面更加理想,包括苹果在内的的多家厂商都有意采用这项工艺,如果届时台积电能大幅提升良率,相信上门的Fabless厂商依旧会络绎不绝。 但三星早已拿着GAA的3nm虎视眈眈,一旦台积电犯下错误,原本属于它的订单就有可能流向老对手,而这样的局面早在16nm和7nm时就上演过,如今3nm悬而未决,未尝没有再发生一次的可能性。 3nm,是台积电亟需跨过的一道小坎。
今年出国游,新中产恨不得掏空积蓄
但即便物价和机票飞涨,也拦不住国人躁动的心。今年能够迎来一波境外游的小复苏,可以说是集齐了天时地利人和。 作者 | 王一旦 编辑|DR 小学生放假,新中产出国,并称2023年两大新“神兽出笼”。 在国庆尚未正式开始时,朋友圈已有零星几个海外定位,为这场“新中产大迁徙”开启预热。假期正式开启那一天,朋友圈的盛景终于让我意识到,原来麦克卢汉说的是真的——地球是个村儿,今年的地球村,终于不堵车了。 而重启出境旅行计划的新中产,在下定决心之前大概都有同一个想法:蛰伏三年,属于我的,这一次我要统统夺回来。 今年刷长假朋友圈的感受。 (图/电视剧《马大帅》) 01 今年出境,也许是最“亏”的一年 今年长假,国内游依然是出行人群的主要选择,但肉眼可见的是,出国玩儿的人越来越多了。携程平台数据显示,截至9月12日,十一期间出境游整体订单量达到去年同期20倍。 这一波复苏算得上预热已久,从今年年初开始,文旅部陆续发布了三批恢复旅行社出境团队旅游和机酒业务的名单。从新马泰到高加索三国,从日韩到中东,这个长假,可供人们选择的目的地太多了。 也许是感受到了被分流的压力,哪怕是从来没有发愁过旅游业的泰国,也赶在长假开启前突然宣布对华免签。尽管政策只持续5个月,但这也是从泰国对华开放签证以来最大方的一次。在此之前,哪怕是在中国游客跟泰国最甜蜜的蜜月期,最多也只是免去了游客的签证费。 放宽签证政策不难理解。泰国国家旅游局官方数据披露,2023年前7个月,泰国共接待了中国游客183万人次,仅恢复到2019年同期的约四分之一。而在今年年初,泰国官员站在机场喜迎中国游客的场景还历历在目,彼时泰国官方定下的KPI是今年能够接待总计500万—700万中国游客。 时过境迁,年中成绩和年度KPI相去甚远,泰方自然更焦虑。虽然,要完成年初的目标希望已然不大,趁着高峰期冲一波KPI的觉悟总是要有的,弯道超车的实际车速不知如何,但至少架势已经摆出来了。 不过,想要迎接“重返世界”的中国游客,各国的竞争压力可谓相当大。 韩国文体部9月发布了“关于吸引中国游客的方案”,期望年内能够吸引200万中国游客访韩;阿布扎比针对国庆专门推出了“阿布扎比黄金周”的策划,多家酒店将为入住客人提供25%的折扣;格鲁吉亚也在8月宣布对华免签的政策,都市人的“无痛出境”目的地清单喜加一。 种种举措,只说明了一件事——国门外的人也许比我们更盼着中国人走出国门。 多哈机场醒目的“中国黄金周”。(图/王一旦) 境外游在经历了几年的萎靡后,看似终于复苏,但令人意外的是,传统旅行国家的恢复情况不尽如人意,不光泰国难以达成年初设下的KPI,日本的中国游客也只恢复到了疫情前的1/3水平。 原因之一,或许在于境外游群体的变化。 《中国新闻周刊》的报道中提到,在多位业内人士看来,过去大量前往泰国的跟团游人群主要来自中国的下沉市场,这些游客更容易受到经济下行压力的冲击,影响其出国旅游的计划。 同时,境外游价格上涨也会影响价格敏感型用户的出境游需求,他们有的放弃了出游计划,有的选择了费用相对较低的短途游或国内游。 泰国国家旅游局东亚司司长李文华在接受媒体采访时也表示,现阶段来到泰国旅游的中国游客多为18—30岁,基本不超过35岁。他们时间自由,也有较高的收入,具备高消费能力,更喜欢亲近自然以及可以深度体验的产品。 在当下,撑起境外游半壁江山的群体,其实是经济承压没有那么大、现金流更加健康的新中产人群。 这一点从奢侈品的销售情况也能看出一些端倪。LVMH集团的财报披露,今年上半年,中国消费者在全球各地对集团旗下产品的消费总量增长了40%—45%。 出境游的绝对人数或许没有完全复苏,但对于那些已经出去的朋友们来说,掏出腰包的票子可是一分都没少。 从物质上来看,今年决心要出境游,实属要跨越不少艰难险阻。新中产出境游,主要分为两种方式,一是参加精品旅游团,二是自由行或半自由行。 私家团的价格,在今年水涨船高。携程旅游的数据显示,今年长假,出境游的私家团订单量环比8月暑期大幅增长2倍多。这些私家团最低万元起步。以埃及私家团为例,平日也要20000元出头的私家团,国庆期间还要再贵上一万元。 私家团的价格令人咂舌。(图/网站截图) 即便不跟私家团,选择自由行的游客,从经济上看也未必能节省多少。首先,今年的汇率对出游并不划算;其次,近段时间一些国家也经历了一轮又一轮的物价飞升。况且,最重要的是国际航班并未完全恢复。 据民航局数据,截至9月15日,国际客运航班量恢复到2019年同期的52%。运力紧张,导致飞往境外的机票确实不便宜。 有网友表示三年前往返6000元的机票涨到了3万多元。(图/小红书用户@elena^O^) 同程旅行平台数据显示,国庆假期首日的国际机票均价约6696元(不含税),较暑期均价高出约72%。而据航旅纵横数据,今年长假的国际机票平均支付价格(不含税)约5977元,比暑期上涨约40%。 这一波长假出境游的游客,大多数都被机票狠狠割了一刀。 但这些都不是阻拦住人们出国的理由,毕竟从真正下定决心出国的那一瞬间,价格这件事就已经变成次要因素了。在旅行这件事上,我们主打一个清醒地沉沦。 02 既然出生了就环游世界 出境游的价格真的没少涨,有业内人士表示:“出境定制游平均涨幅为30%。欧洲国家产品领涨,涨幅超过50%。”而涨价的心理战从买机票时就开始了。 “25号出发,4号回来,最后还能留两天倒时差休息一下,经济舱只要4500元,我一看太划算了,马上就买票了。”旅行爱好者@小野狼对新周刊说,他一直在关注国庆的划算机票,“每天没事儿就会去OTA翻一翻有没有合适的。” 最终,他在8月初成功蹲到了从北京往返埃及开罗的好价机票,“而且这趟航班的公务舱也不贵,因为是红眼航班,所以就干脆买了公务舱,往返一共13000元,对于国庆期间飞17小时的航线来说,这个价格真的不算贵了”。 顺利拿到机票,多少钱都不重要了。(图/@小野狼) 但并非所有人都能够像他一样蹲到特价机票,也有一些买在高点的大冤种。 从今年5月起,真元就开始关注从广州往返土耳其的机票,几乎全都是8000元起步,土航直飞往返更是一度飙升至15000元的程度。等到7月份,眼看着航班余票越来越少,再也坐不住的真元选择直接购入了往返9200元的红眼航班,不仅半夜起飞,而且需要中转,是没有任何额外服务的经济舱。 “几乎所有人都说我买贵了,但是当时真的害怕之后越来越贵。”买完机票后的一段时间,她养成了每天看看机票价格变动的习惯,“心情跟买了股票差不多,有一段时间确实是越来越贵,但是没过多久土航新增了北京、上海的航线,导致直飞的价格比我买的中转还便宜2000块,当时心态都崩了。” 再对比小红书等社交媒体上遍地都是几年前花四五千块买到往返机票的帖子,要说不心疼,真元自己都不信。 和几年前相比,价格翻了几倍的机票只是第一道关,如今几乎所有东西都跟着涨价。在小红书上搜索“涨价+国家名称”,场面可以说是哀鸿遍野。记忆里购物天堂的影子已经渐渐模糊,逛着逛着甚至让你怀疑“代购到底是怎么把价格打下来的”。 物价飞涨,酒店费用也跟着涨,就连门票费用都在涨价。以土耳其为例,当地的博物馆通票,今年3月还是700里拉(约合人民币187元),到了现在就涨到了3500里拉(约合人民币937元),涨幅之大,把股民都馋哭了。 机票钱已经花了出去,这些也就只是九牛一毛的程度。闸门一开,后续所有决策都是由八个字决定的:钱都花了,来都来了。 但即便物价和机票飞涨,也拦不住国人躁动的心。今年能够迎来一波境外游的小复苏,可以说是集齐了天时地利人和。 一方面,今年的假期是中秋和国庆双节连放,非常经济适用且难得,适合都市人凑假,请个两天假,就能有接近10天的假期,这对于长途旅行来说十分友好。 其次,今年的境内游同样火爆,导致国内一些热门旅行地如新疆、云南的机酒价格也在涨价,长假之前,小红书等社交平台上不乏用户对于订不到房的吐槽。相较之下,境外游的确贵,但也并非贵到难以接受。 当然,从根本出发,一件事能否实现不只取决于客观条件,更取决于一个人的渴望程度。宁愿亏钱也要出国的人们,大概都期望着一场与记忆中旧日世界的重逢。 “2018年的时候,我办了日本三年往返的签证,但是因为种种原因没有push自己一把,一直拖着没去玩。结果后来直到签证过期作废也没办法去,所以心里特别懊恼,为什么当时没有抓住机会。”真元说,这一次出去玩,价格已经不是最首要的考虑因素了,最重要的还是补齐当时的遗憾。 毕竟,这个世界我们真的暌违已久了啊。
多模态版Llama2上线,Meta发布AnyMAL
一个统一的模型,可以对不同模态输入内容(文本、图像、视频、音频、IMU 运动传感器数据)实现理解,并生成文本响应,技术基于 Llama 2,来自 Meta。 昨天,多模态大模型 AnyMAL 的研究吸引了 AI 研究社区的关注。 大型语言模型(LLM)以其巨大的规模和复杂性而闻名,它极大地增强了机器理解和表达人类语言的能力。LLM 的进步使视觉语言领域有了显著进步,弥合了图像编码器和 LLM 之间的差距,将它们的推理能力结合起来。先前的多模态 LLM 研究集中在结合文本和另一种模态的模型上,如文本和图像模型,或者集中在非开源的专有语言模型上。 如果有能够实现多模态的更好方法,将各种模态能够嵌入在 LLM 中使用,会给我们带来不一样的体验吗? 输出示例 为解决这个问题,来自 Meta 的研究人员近日推出了 AnyMAL(Any-Modality Augmented Language Model)。这是一个经过训练的多模态编码器集合,可将来自各种模态(包括图像、视频、音频和 IMU 运动传感器数据)的数据转换到 LLM 的文本嵌入空间。 论文地址:https://huggingface.co/papers/2309.16058 据介绍,该研究的主要贡献如下: 为构建多模态 LLM 提出了一种高效、可扩展的解决方案。本文提供了在大型数据集上预先训练的投影层,这些数据集包含多种模态(例如,2 亿张图像、220 万段音频、50 万 IMU 时间序列、2800 万段视频),所有数据集都与同一个大模型(LLaMA-2- 70B-chat)对齐,从而实现了交错式多模态上下文提示。 本文利用跨三种模式(图像、视频和音频)的多模态指令集对模型进行了进一步微调,涵盖了简单 QA 领域之外的各种不受约束的任务。该数据集具有高质量的人工收集指令数据,因此本文也将其作为复杂多模态推理任务的基准。 与现有文献中的模型相比,本文最佳模型在各种任务和模式的自动和人工评估中都取得了很好的零误差性能,在 VQAv2 上提高了 7.0% 的相对准确率,在零误差 COCO 图像字幕上提高了 8.4% 的 CIDEr,在 AudioCaps 上提高了 14.5% 的 CIDEr,创造了新的 SOTA。 方法 方法概览 预训练模态对齐 本文使用配对的多模态数据(特定模态信号和文本叙述)对 LLM 进行预训练,从而实现多模态理解能力,如图 2 所示。具体来说,研究为每种模态训练一个轻量级适配器,将输入信号投射到特定 LLM 的文本 token 嵌入空间中。这样,LLM 的文本 token 嵌入空间就变成了一个联合 token 嵌入空间,token 代表文本或其他模态。 对于图像对齐,研究使用了 LAION-2B 数据集的一个干净子集,使用 CAT 方法进行过滤,并对任何可检测的人脸进行模糊处理。对于音频对齐,研究使用 AudioSet (2.1M)、AudioCaps (46K) 和 CLOTHO (5K) 数据集。研究还使用 Ego4D 数据集进行 IMU 和文本对齐 (528K)。 对于大型数据集,将预训练扩展到 70B 参数模型需要大量资源,通常需要使用 FSDP 封装器在多个 GPU 上对模型进行分片。为了有效地扩展训练规模,本文在多模态设置中实施了量化策略(4 bit 和 8 bit),其中冻结了模型的 LLM 部分,只有模态 tokenizer 是可训练的。这种方法将内存需求缩小了一个数量级。因此, 70B AnyMAL 能够在单个 80GB VRAM GPU 上就完成训练,batch size 为 4。与 FSDP 相比,本文所提出的量化方法只使用了 GPU 资源的一半,却实现了相同的吞吐量。 利用多模态指令数据集进行微调 为了进一步提高模型对不同输入模态的指令跟随能力,研究利用多模态指令调整(MM-IT)数据集进行了额外的微调。具体来说,我们将输入连接为 这样响应目标就同时以文本指令和模态输入为基础。研究对以下两种情况进行消减:(1)在不改变 LLM 参数的情况下训练投影层;或(2)使用低级适应(Low-Rank Adaptation)进一步调整 LM 行为。研究同时使用人工收集的指令调整数据集和合成数据。 实验及结果 图像标题生成 表 2 显示了在 COCO 和标有「详细描述」 任务(MM-IT-Cap)的 MM-IT 数据集子集上的零样本图像字幕生成性能。可以看出, AnyMAL 变体在这两个数据集上的表现都明显优于基线。值得注意的是,AnyMAL-13B 和 AnyMAL-70B 变体的性能没有明显差距。这一结果表明,底层 LLM 能力对图像标题生成任务的影响较小,但在很大程度上取决于数据规模和配准方法。 多模态推理任务的人工评估 图 3 显示,与基线(LLaVA:34.4% 的胜率和 MiniGPT4:27.0% 的胜率)相比,AnyMAL 性能强劲,与人工标注的实际样本的差距较小(41.1% 的胜率)。值得注意的是,使用完整指令集微调的模型表现出最高的优先胜率,显示出与人类标注的响应相当的视觉理解和推理能力。还值得注意的是,BLIP-2 和 InstructBLIP 在这些开放式查询中表现不佳(分别为 4.1% 和 16.7% 的优先胜出率),尽管它们在公开的 VQA 基准测试中表现出色(见表 4)。 VQA 基准 表 4 显示了在 Hateful Meme 数据集 、VQAv2 、TextVQA 、ScienceQA、VizWiz 和 OKVQA 上的零样本性能,与文献中报告了各自基准上零样本结果的模型进行了比较。研究将重点放在零样本评估上,以便在推理时最好地估计模型在开放式查询上的性能。 视频 QA 基准 如表 6 所示,研究在三个具有挑战性的视频 QA 基准上对模型进行了评估。 音频字幕生成 表 5 显示了 AudioCaps 基准数据集上的音频字幕生成结果。AnyMAL 的表现明显优于文献中其他最先进的音频字幕模型(例如,CIDEr +10.9pp,SPICE +5.8pp),这表明所提出的方法不仅适用于视觉,还适用于各种模态。与 7B 和 13B 变体相比,文本 70B 模型表现出了明显的优势。 有趣的是,有人从 AnyMAL 论文提交的方式、类型和时间推测,Meta 似乎正计划通过其新推出的混合现实 / 元宇宙头显来收集多模态数据。说不定这些研究成果在未来会被整合到 Meta 的元宇宙产品线里,或很快进入消费级应用。
让人恐惧的是,机器狗已经能做这种事了
跑酷是一项极限运动,需要参与者以高度动态的方式跨越障碍,对于大多数时候「笨手笨脚」的机器人来说,这似乎是件遥不可及的事,不过最近在机器人控制领域里出现了一些技术突破的趋势。几周前,机器之心曾报道过一个使用强化学习方法让机器狗实现跑酷的研究,实现了不错的效果。 最近,卡内基梅隆大学(CMU)的一项新研究也针对机器狗跑酷的挑战提出了新方法,效果又上了一个台阶,以至于人们的评价一致是:amazing. 观众:「是《黑镜》里面演的样子」。 CMU 的这项研究让机器狗可以像狗狗障碍赛里的选手一样,自动越过不连续的箱子,在不同角度倾斜的坡面之间轻松地跑跳: 而且通过这些障碍的速度也很快。 轻松跳过 0.8 米(机器狗长度的 2 倍)的间距: 爬上 0.51 米高(机器狗高度的 2 倍)的障碍物: 这回没有一把站稳,它还用后腿进行了补救,动作像真的狗一样。 机器狗还可以做一些真实世界里动物难以完成的事,比如仅用两条前腿行走,相当于倒立行走: 还能仅用两条前腿下楼梯: 像在游戏里面卡了 bug,有点滑稽,又带有一点点恐怖谷效应。 该研究旨在让小型低成本机器狗能够完成跑酷任务。这类机器狗的驱动不精确,且仅有用于感知的单个前置深度摄像头,频率低、容易出现抖动和伪影。 基于此,该研究提出一种直接从原始深度和机载传感到关节角度命令的神经网络,并通过大规模强化学习进行模拟训练,以克服不精确的传感和驱动带来的问题,端到端地输出高度精确的控制行为。研究项目已开源。 论文地址:https://extreme-parkour.github.io/resources/parkour.pdf 项目地址:https://github.com/chengxuxin/extreme-parkour 方法简介 该研究通过端到端数据驱动的强化学习框架使机器狗具备「跑酷」的能力。为了让机器狗在部署时根据障碍物类型进行自我调整,该研究提出了一种新颖的双重蒸馏(dual distillation)方法。该策略不仅能输出灵活的运动命令,还可以根据输入深度图像快速调整方向。 为了让单个神经网络能够表征不同的跑酷技能行为,该研究提出了一种基于内积的简单而有效的通用奖励设计原则。 具体来说,该研究旨在训练一个直接从原始深度和机载传感到关节角度命令的神经网络。为了训练适应性运动策略,该研究采用了正则化在线适应(ROA)方法,并针对极限跑酷任务进行了关键修改。 实验结果 该研究主要让机器狗掌握 4 种技能,包括攀爬、跳过间距、在斜坡上跑跳、倒立,与其他几种方法的比较结果如下表 1 所示: 为了验证系统中各部分的作用,该研究提出了两组基线。该研究首先测试了奖励设计和整体 pipeline,结果如下表 2 所示: 第二组基线旨在测试蒸馏设置,其中涉及用于方向预测的 BC 和用于动作的 dagger,实验结果如下表 3 所示: 此外,该研究还进行了很多现实实验(记录成功率),并与 NoClear 和 NoDir 基线进行比较,实验结果如下图 7 所示:
宝马内燃机,进入倒计时
在奥迪 E-tron 车型销量中,平均每 3 台就能成交 1 台 RS E-tron GT。 奥迪高性能运动线总经理 Sebastian Grams 曾经这样向外界透露道,性能车爱好者对纯电化的接受度远远超出了奥迪内部的预期。 Sebastian Grams 电机电池技术的成熟,让电动化和高性能车型产生美拉德反应,放下对传统内燃机的偏执,我们可以看到纯电高性能车型背后广阔的市场空间。奥迪不是唯一押注纯电高性能的豪华车企,宝马也将要把 M 系列车型一并带入到纯电世界。 据产品开发主管 Frank Weber 透露,宝马会在 2027 年正式推出下一代 M3,新 M3 将会额外提供纯电化方案,M 系列车型将加速跨越至纯电时代。 内燃机与电机平起平坐,宝马的内燃机时代开始进入倒计时。 最直接暴力的纯电化 在全新宝马 5 系发布的早期,宝马就曾有过将 M 车型电动化的想法。不过,当时的宝马内部团队仍然对电动化性能抱有强烈的担忧,他们难以保证纯电方案能支撑起 M 系列车型的性能表现,满足团队的心理预期。 因此,在反复权衡之后,当时的宝马为 M 系列的电动化留下了退路,下一代 M3 将会在「保留燃油」、「切换混动过渡」以及「直接纯电化」三种方案中选择,混动过渡看起来会是最稳妥的方案。 产品开发主管 Frank Weber 情况在不久前的葡萄牙圆桌采访上发生了「剧变」,宝马产品开发主管 Frank Weber 在接受媒体采访时,公开确认下一代宝马 M3 将会在 2027 年推出纯电动版车型(与燃油车平行并售),相比混动过渡,宝马在高性能线选择了最直接暴力的电动化手段,看起来宝马找到了高性能电动的「终极答案」。 宝马内部态度的转折点,发生在全新 Neue Klasse 纯电架构上。 Vision Neue Klasse 在 9 月初的慕尼黑车展上,宝马正式推出了纯电概念车型 Vision Neue Klasse,新车基于宝马纯电架构 Neue Klasse 打造,脱胎于 CES 2023 首发的概念车型 BMW i Vision Dee。 CG 中的概念车型 BMW i Vision Dee 根据宝马的说法,Vision Neue Klasse 已经离量产足够「近」了,2025 年全新的宝马 3 系也将会被 Neue Klasse 电气架构支持量产。稍显激进的电动化策略背后,是宝马对 Neue Klasse 全方位的考察。 除了围绕纯电车型进行架构开发,内部团队还对电池性能提出了更加严格的要求。宝马预计将投入 14 亿美元(折合人民币约 100 亿元)对沈阳工厂进行现代化改造,并建立起一条全新的电池产线;押注也在墨西哥同时进行,宝马将会在墨西哥工厂的电池组装产线上投入多达 5.41 亿美元(约合人民币 39.34 亿元)。 一切都为了更快实现全新一代电池的量产。结合多方的情报消息,跃进下一代纯电平台的同时,宝马将会放弃现款所有车型使用的电池包,改用能量密度提升 20% 的全新圆柱形结构电池,新电池能够带来 30% 的续航里程提升。 宝马认为,全新纯电架构以及更高性能的电池表现,完全可以满足高性能车型对性能的基本需求,甚至在纯电条件下,高性能线车型的运动表现还能更好。宝马 M 系列首席执行官 Frank Van Meel 宣称,Neue Klasse 平台将会拥有至少 1000kW 的功率潜力,足以将 M 系列车型推上另一个性能层次。 另外,宝马初步透露了团队在纯电 M3 上的动作,新架构上的「Heart of Joy」控制单元将会接管纯电 M3 的全电动四电机动力系统,并根据路况需求分别向 4 轮提供可变的功率,得益于 4 个独立电机的驱动,全新的纯电 M3 将会拥有超过 1000kW 的峰值功率输出,换算成马力约为 1340 匹。 图片来自:evo If we could do an M model as a purely electric one it’s clear that it has to be better than the current one. 宝马 M 系列首席执行官 Frank Van Meel 这样评价道。 他认为,宝马 M 系列的纯电版必须拥有比原车型更好的性能表现,这也是宝马内部团队在更新 M 系列时,必须遵循的开发「底线」。 图片来自:WHICHCAR? 除了在性能上面的突破,宝马也注意到了车主的驾驶乐趣。宝马并不觉得纯电化剥夺了驾驶乐趣,恰恰相反,他们认为澎湃的驾驶乐趣并不专属于内燃机。全新纯电 M3 车上的独立驱动电机,能够为最大限度满足车主的驾驶定制化需求,出众的操纵性、可玩性可以弥补掉内燃机轰鸣的缺失。 自下而上,换个维度较量 宝马如此快将 M 车型纯电化提上日程,超出了大部人的预期。但激进和果断,并不意味着不够谨慎,特别是对于 M 系列来说,代表宝马最高动力技术水准的重要支线不容许出现失误,宝马仍然对 Neue Klasse 架构保持着观望、考察。 相比自上而下践行电动化的奥迪,宝马的高性能电动化动作总归是相对谨慎的。 正如我们前文所提及的那样,首款搭载 Neue Klasse 纯电架构的车型将会是 2025 年的全新宝马 3 系。换言之,Neue Klasse 架构在 i3 上率先顺利量产后,宝马才会让 M3 车型跟进量产。自下而上,用走量车型检验新架构成色,也算是宝马在「激进」中稍微不那么「激进」的一点色彩。 有趣的是,Audi 和宝马将高性能运动车型之间的竞争,从燃油拉到了纯电的领域,两家传统豪华车企换了个维度继续较量。 据相关数据统计,在过去的 2022 年,宝马 M Power 系列车型在国内累计卖出了 3824 台,而奥迪 RS 系列仅仅卖出了 982 台,加上 S 系列销量后,奥迪的运动线产品销量数据达到 4417 台,才微微超过宝马 M Power 系列。 在燃油领域,奥迪高性能车型在与宝马 M Power 系列仍然有着不小的销量差距,但如果是将较量的维度放在纯电车型,情况会发生改变吗? Audi RS E-tron GT 图片来自:TopGear 答案很可能是「会」。各花入各眼,宝马和奥迪两家的内燃机性能调校高下留给大家自行判断,一个明显的事实是,高性能运动线车型从内燃机跨越到电机,电机的存在会缩小车型之间的硬件调校差距。性能难分高下,谁拥有更大的电动差异点才会是销量的「决胜点」。 这一点,擅长塑造高性能运动外观的奥迪可能会更胜一筹。不妨提出一个有趣的猜想,将较量带到纯电维度后,宝马的 M Power 又会不会削弱了自己的优势?
零百只要 0.956 秒?电车加速纪录被一帮大学生打破了
2 秒的零百加速是一种什么样的体验? 一位来自极氪的朋友告诉脖子哥, “ 简直爽死了,是和过山车一样那种失重的感觉 ” 。 这脖子哥确实有点想象不出来,可能只有体验过超跑的人才能懂吧。 但, 2 秒就已经够快了吗?还远远没有。 最近,来自瑞士的大学生团队 Grimsel came ,用自己手工打造的电车 Mythen 打破了世界电车加速记录。 从静止到 100 公里 / 小时,他们只花了 0.956 秒!这是人类第一次把电车零百拉到 1 秒内。 要知道,在目前的量产车型里,零百 NO.1 的特斯拉 Roadster 也要用 1.9 秒,几乎是 Mythen 的两倍。 就算是给它加装物理外挂—— SpaceX 的火箭推进器,也只能提升到 1.1 秒而已。 更别说油车的加速之王布加迪 Chiron ,最快也要跑 2.3 秒,在 Mythen 面前,这些千万级超跑连它的尾灯都看不到。 万万没想到,全世界车企卷到最后,却被一帮欧洲大学生给吊打了。 好好好,这么比是吧。。。 其实,从 2010 年开始,电车零百的世界记录一直由欧洲各地的大学生团队之间互相接力,而到现在,基本就是瑞士队 Grimsel came 和德国队 GreenTeam 的决赛了。 瑞士队上一次破世界纪录还是在上一次,在 2016 年,他们就将零百加速推进到 1.513 秒,成功拿下世界第一。 而后,这个纪录保持了整整 6 年,直到 2022 年,德国队才以 1.416 秒的成绩打破纪录,但就为了这 0.1 秒,还真的是不容易。 德国队在准备期间经历过多次失败,赛车曾飞出赛道严重损毁。。。幸好围栏是轮胎做的,驾驶员才没有受伤, 看来挑战世界纪录,也是一项高危工作。 而在今年,瑞士队又出绝活,一下子又跃进了 0.5 秒,重新夺回第一,不得不说瑞士队确实有点东西。 那他们是怎么做到的呢?其实也就是两点,一是轻量化,二是堆动力。 通常来说,质量越轻的物体加速就越容易,带来的惯性也越小,弯道上也就更好操控,所以奥运会赛跑项目的运动员没有一个是胖子。 赛车也是一样的道理,当年,以空气动力学闻名的路特斯,就靠着极简的轻量化车身拿下 F1 的 4 连冠。 现在,连普通家用电车都用上了全铝合金车身,不过,倒不是为了快,主要还是省电。。。 相比于普通的铝合金车身, Mythen 采用的则是被称为 “ 轻量化杀手锏 ” 的碳纤维。这玩意儿仅有普通钢材料的四分之一重,但强度和耐久度却丝毫不差。 再加上仅仅 “ 管够 ” 的动力电池,以及简化后的车身结构,Mythen 的整车质量被压缩到了 140 公斤,只相当于两个壮汉的体重。 更别说,测试的驾驶员还是一位小女孩,连车带人估计也不到 200 公斤。为了保证加速时的下压力,不至于像德国队一样飞出赛道,这车还配备了地效风扇装置,就像在车底装了个吸尘器。 看来,为了破纪录,瑞士队真是什么绝招都用上了。 不过,车身质量的缩减总归是有极限的,Mythen 之所以能成功,关键还是在于动力上的突破。 上一次保持纪录的德国队,总功率只有 180kw ( 242 马力 ),而这次 Mythen 系统总输出功率获得大幅提升,可以达到 243kw ( 326 马力 )。 别看数值不高,但要知道,这可是在轻量化的前提下实现的,如果看推重比,Mythen 可以达到惊人的 2328 马力 / 吨,像一般的家用汽车基本只在 100-160 区间, Mythen 几乎是它们的 20 倍。 而且 Mythen 采用的还是四电机四驱的模式,照电车的特性,从 0 转速就可以爆发出巨大的扭矩,在这种情况下,零百加速破 1 秒,也就不出意外了。 这么来看,如今的燃油车在性能上已经完全没有优势了? 其实也不能这么讲,首先, Mythen 只是一辆专门用来打破零百记录的实验车( 甚至有点像卡丁车 ),虽然加速很快,但也只有加速很快,可能根本拐不了弯,让这车和燃油超跑们比加速,多少有点不讲武德了。 而且就算在加速上,燃油车也并不是完全没有胜算。 比如来自德国 Rotary Supercars 公司设计的概念超跑,搭载了八转子四涡轮增压发动机,马力高达 2840 匹,据说也能达到 0.9 秒的零百成绩,只不过要造出来必然得是天价,根本没人能买得起。 相对而言,电车的加速性能可以说是非常 “ 亲民 ” 的了。 更何况,零百也不是评价快的唯一标准,电车油车之争,就好比快枪手 VS 持久汉。电车想要真正赢过燃油车,就得上赛道比试比试。 但在目前,电车的赛道性能还是远不如燃油车带劲。上面提到的欧洲大学生团队,之所以这么拼命地寻求电车性能上的突破,其实也是为了给电车跑赛道做准备。 早在 2009 年, GreenTeam 就开始参加大学生方程式汽车大赛( FSC )了,为解决电车竞赛过程中的诸多问题, GreenTeam 做出了大量努力,比如为保障电池安全,采用特殊的冷却油密封件等。 而在国际上,除了众所周知的世界一级方程式锦标赛 F1 ,还有一个专为电车准备的电动方程式锦标赛 FE ,设立的目的也是为了通过比赛提升电车的赛道技术。 不过,这个比赛不仅看的人很少,而且每一届都遭到大量观众吐槽。 最主要的一点是, FE 赛车实在太慢了。为啥加速这么快的电车还会慢呢? 其实对电车来说,性能和续航只能二选一。就像是按下葫芦起了瓢,一旦专注于性能,就必须使用非常耗电的大电机,当速度起来以后,风阻、电阻等等都会造成大量的能耗浪费,而且散热也成了大问题。 而如果把电池做大,那车身质量又会大幅增加,转而拖累性能,更是得不偿失。 所以,比起竞速, FE 赛车手还得考虑省电策略。随着比赛进行,电池电量不断降低,车速会逐渐提不上来,而一旦亏电,就可能在阴沟里翻船,别说名次,连终点都不一定跑得到。 在 2018 赛季之前,每个参赛团队甚至都要准备两辆赛车,比赛中途,赛车手驶回修理区,并不是换电,而是直接换车。。。这就非常考验赛车手身体的灵活性了。 后来,为了保证参赛选手能跑完全程,所有参赛车辆的极速都被限制在了 270 码以内以保存电量,要知道 F1 赛车可是能到 370 码,习惯了 F1 这种电光火石间暴力竞速的观众,哪受得了电车这种慢慢悠悠的绅士。 为了避免赛车过程太过无聊,主办方还各种整活来增加人气,比如新增的超车模式,赛车手在超车时需要按动车内 “ ATTACKMODE ” 的物理按键,才能在特定路段提升功率,发动类似 “ 氮气加速 ” 的效果,电机功率会瞬间从 200kw 突破到 225kw 。 甚至在 Fanboost 玩法中,观众投票前三的选手,也能在特定时间内获得 “ 氮气加速 ” 能力,能从 200kw 突破到 250kw ,主办方还在直播中给他们加上加速特效。 就问这玩的还是技术吗?赛车手可能还得学一手人设和营销,电车比赛似乎已经变得没有过去那么纯粹了。 所以,电车要想在赛道上有所突破,远不止是零百加速这么简单,这次破纪录的实用性,也没有我们想象的这么大。 因为在目前主要限制电车性能的,倒不是动力,而是那块难搞的动力电池,如果能量密度提不上去,电动赛车总归是蹦跶不了多远。 就现在来看,最顶级的 F1 比赛几乎都成了混动车的专场,内燃机的极速和持久,加上并联电机的加速效果,可能这才是这个时代对 “ 快 ” 的定义。 但是也别小看了吉尼斯纪录,突破极限,始终是推动人类前进的根本动力,不然我们苦苦追寻的 “ 快 ” 又有什么意义呢?大学生作为最有创造力的群体,就该遵循自己的激情和想象力,做任何想做的事。 零百或许无用,但真的很爽! 撰文:TC 编辑:脖子右拧 封面:萱萱
和差评一起,庆祝工作失误
设想一下,你成功入职差评,并成了一枚编辑。今晚你值班,你的职责是确保今日推送准时发布。 但距离正式发稿还有段时间,此时坐在办公室的你会选择: 巧合的是,2018年9月25日那晚的值班编辑正和你考虑着同样的问题。 最终,当时间转到23点59分时,蹲点打卡的差友懵圈了,每天给他们带来最大欢乐的《今日最佳》栏目没有出现在推送中,它断更了。 在被差友们“口诛笔伐”的第二天,这位编辑出面解释了跳票的原因: 他,偷了个小懒。 之后事情的发展,老差友们都知道,就是因为大家逢文章就刷925,是个事就扯上925,都五年了还坚持不懈地调侃925,才让它成为了差评最深入人心的老梗,连ChatGPT都知道“925”! 今年开始,我们决定将每年的9月25日定为“差友日”,还在银盐杭州西溪店(龙湖西溪天街2楼)办了第一场差友日线下活动。 从9月25日一直延续到10月7日,方便大伙抽出空来一探究竟。 构想差友日活动时,我们希望大家能更直接地感知差评,还能在现实世界里和其他差友碰头聊上几句。 最重要的是能和大家一起放松一下、乐一下,所以特地设计了些能让大家享受松弛的环节: 在大门口,有一整面墙的“差龄自评表”,大家可以回忆一下梦开始的地方。 进门后左拐,来现实版《聊一聊》给差评一个好评!有什么骚话平时没能上墙的,可以一次写个够了。 继续往店内探索,你会在服装区找到一整桌的925差友日限量周边: 好评不断的925限定差评钥匙扣、质感满分的差评系列金属徽章、差评梗浓度超标的925限定贴纸,还有DEBUG 镭射反光晴雨伞。有买有送,入手不亏! 还有我们与关注青年文化和街头领域的品牌MostWanted、与设计师箱包品牌NIID联名的一系列产品(手感舒适的超大鼠标垫、致敬复古未来主义的可降解手机壳,还有多款秋装和多功能斜挎包),希望给大家的国庆之旅和日常生活加点多巴胺。 (和店家报暗号“差评”,还可九折购银盐店内其他商品。FREITAG、BROMPTON除外) 换上新装备后,欢迎对着店内的“今日最佳主题落地镜”来张自拍,让自己本人成为《今日最佳》~ (晒照片就能兑换925限定差评钥匙扣一枚噢) 逛累了后可以去“看法公式”吧台,这是一个充满爱的咖啡品牌,总部在南京。他们为听障群体进行专业培训,让听障群体可以在咖啡师这个岗位上发挥自己的创造力、获得成就感。 你可以现学手语点一杯黑色的925限定特调,坐进旁边的露营椅慢慢享受。如果发现了其他差友,试着邀请TA一起聊上几句吧。 (我们会送你一张925限定纹身贴,如果你不知道怎么和其他差友开口聊,帮彼此贴张纹身贴或许是个不错的契机) 活动第一天,925的始作俑者也来现场打卡发了条朋友圈,送上新鲜的“当事人声明”: 看来他是一点“悔悟之心”都没有啊! 开个玩笑!其实从925发生的当天到现在,差评内部就没把这次“工作失误”太当回事。相反,随着越来越多的造梗玩梗,我们很高兴925的内涵能够变得丰富饱满。 近来年轻人工作生活压力增加,“躺”、“卷”等话题被不断炒热,我们也后知后觉的发现,925背后其实蕴藏着一种松弛感,一种你在工作中犯了点小错,但没人会和你计较的感觉。 同时925也和英文nine to(2) five谐音,是许多人都期待的朝九晚五规律工作节奏。因此我们决定从今年开始,每年925固定举办差友日活动,把差评开放、乐观的态度和精神带给更多人。
300多元还接入了鸿蒙生态的智能拐杖,用起来咋样?
事情是这么回事儿,我们硬件部有很多内容都依赖厂商啥时候发布新机器,比如最近一段时间由苹果和华为带头的秋季发布会热潮。 简而言之,厂商一有大动作,我们就得跟着忙活起来。 但这一年之中总有淡季的时候,而为了保证足够的内容产出,我们通常就会自己找一些好玩的选题和产品来做测评。 比如之前的墨水屏手机和绿镖笔记本电脑等等,都是我们最爱的整活环节。 而随着整活次数多了起来,我们也逐渐发现了一些更加奇怪或者说抽象的东西。。。 比如在前几天,同事就递给了我一个包装,我看了之后直接两眼一黑。。。 他居然给了我一根拐杖,让我测评。 咱就是说,虽然以托尼高超的专业水准,万物皆可测评是没错,但能不能不要给我这么抽象的东西。。。 但是秉承着来都来了的原则,托尼也只好测一下看看,这根拐杖有什么独特之处了。 首先呢,这根拐杖的全名叫做LINKY 健康拐杖,可是我都拄拐了怎么会健康呢。。。 当然开个玩笑,应该是拄拐之后会让我的身体恢复得更快,或者保持更好的生活习惯,所以才这么叫的。 而它自己都这么叫了,所以不用我说大家也能猜得出来,它多半是集成了一些智能化的功能,比如可以跟手机配对啊,查看一些数值啦之类的。 确实是这样没错,但这款拐杖更进一步,表示自己接入了鸿蒙生态,上面也真的有 HarmonyOS 的 LOGO 。。。 我说,这鸿蒙生态现在东西都这么全了吗,连拐杖都不放过。。。 整个拐杖的外观确实非常现代化,通体白色看起来很像是米家做出来的产品( 并不 )。 机身的功能和可调节选项基本都在拐杖的顶部,比如开关机键和照明按键。 拐杖握把的两端则分别是一块简易显示屏和一键求助,拐杖底部可以调节长短,也可以更换脚托。 乍一看,目前为止感觉居然还不错? 但是当你一旦用起来这根拐杖,就会发现事情并不简单。 比如拐杖上面屏幕的字其实特别小,要是眼神不好的老头老太太,连个时间都看不清。。。 还有这个硕大的 HELP ( 求助 )按键,按下去之后,你就会收获肌无力一般的鸣笛声。。。 这个声音,属于是连火锅都没法被吵醒的程度。 至于这个挂钩嘛,乍一看好像很贴心很实用,它也确实可以挂住东西。 但它只适合挂个袋子什么的,衣服之类的就不要想了,会直接托底弄脏衣服。 而且只有拄拐的时候可以用,只要松手,拐杖就会立刻因为重力倾斜而倒地。。。 还有这个约等于没用的照明灯,我都不知道这个灯在照什么。。。 怎么说呢,确实照亮了,但是没有完全照亮。 以及这个非常让人捉急的调节方式,你只能一点点拧动拐杖来调节它的高度。。。 不过这个倒是可以理解,因为这样调节更加细致而且稳定,用微调来形容都不过分,毕竟你调节了一次有可能以后都不会再用这个功能了。 那么这个拐杖真的就啥也不是吗?其实倒也没有,比如你可以直接用它自我防卫,因为它质量好像还挺好的。。。 开玩笑,大家千万别动手,有一些功能和心思我觉得还是有用的,而且它也确实一定程度上做到了智能化。 比如它有极为先进的 Type-C 接口, 就连国际大厂果子都给自家 iPhone 15 用上了,就问你先不先进吧? 当然,相比较充电更方便这件事,它最大的特点就是接入了鸿蒙生态。 那么问题来了,接入了鸿蒙生态之后好处都有啥呢? 首先当然是和其他的健康穿戴设备一样,你可以在手机上输入自己的年龄等基础信息,并选择使用拐杖的主要目的。 为了更有代入感,托尼摇身一变成为了 “ 老托尼 ” ,年龄也来到了不讲武德的 69 岁。 连上手机之后,你就可以查看各种数据了,比如承担重量、运动完成率和抖动率等等。 拐杖能检测到这些数据并不难理解,比如握柄上面有一个压力传感器,它可以监测你在拄拐的时候用了多少力气。 虽然托尼也不清楚拄拐是不是有什么标准动作,但它确实能监测出来。。。 而另一个功能也类似步数,那就是选择你目前的状态是修养期、康复期还是强化期,并自动为你计算所需运动量。 这个功能其实还不错,对于病人和老人来说,可以以此监督自己并进行适当的运动。 但是拄拐了还要坚持完成每日目标,总感觉是不是有点太累了。。。 还有一个托尼觉得很不错的功能,那就是可以通过手机来观看一些视频,学习怎么正确拄拐。 托尼想了一下,这个功能其实还是挺有必要的,可能就像锻炼身体时要保证动作要足够标准一样,拄拐的动作也分错误和标准之分。 但具体的门道托尼就不清楚了,因为我也是头一次用拐杖这玩意儿。。。 整体来讲,这个拐杖有不少设计过于理想化了,托尼能看得出来有一些功能是在为使用拐杖的人群着想,但实际体验实在是一言难尽。。。 至于连接手机这个想法,托尼也觉得实用性不算太强,除了查看一些基本的数据之外,就是使用拐杖的视频教程。 这款产品的设计思路啥的都还可以,但上手之后,很少会有让我产生 “ 这个功能针不戳 ” 的想法。 目前这款拐杖的版本固件,也依然是 1.0.0 版本,没有任何更新。 怎么说呢,拐杖不错,但下次不要再让我测这种产品了。。。 撰文:百威 编辑:米罗 美编:萱萱 摄影:项羽
开了眼的ChatGPT真让人开了眼了
给自己放个假吧ChatGPT,再更新的这么快,网友的脑洞可就跟不上了。 本周一,ChatGPT宣布了一次重要更新,然后有了全面的多模态能力。 以后你下班骑共享单车回家路上要是感觉车上有什么故障,可以给零件拍张照直接问它。 然后你回到家了,看到毫无头绪的冰箱藏品后,ChatGPT可以告诉你挑哪几样出来能做个晚饭。 吃完睡觉,还没睡意的话,它还能给你一些ASMR服务,如果B站或者YouTube上那几个博主你已经听厌了的话。 1985年9月,写了《看不见的城市》的卡尔维诺因为突然的中风而去世,这年夏天他因为头痛的问题曾去寻求过医生帮助,主刀医生说自己从未见过这么般构造复杂而精致的大脑。 ChatGPT从一开始就像一颗无比精美的大脑——并且是看不见的——但它现在终于有了眼睛、耳朵和嘴。 全球网友:那就来吧,比划比划。 图源:推特 有人试了试,它基本可以替人做软件项目的开发了。 一个软件项目的诞生大概是这样的:先在白板上画线框图,整理出编排逻辑,然后开始写代码,最后生成界面。现在这件事,白板上的活儿归你,离开白板归它。 一位开发者把自己的线框图直接拍照扔给ChatGPT,它直接把软件写出来了。 他还玩了些小把戏,比如把编排用并不规整的箭头表示潦草的替换了位置,ChatGPT不但看出来了,而且照单全收。 我们大概还是低估了多模态会带来什么。 人工智能与人类智力的发展在这里是相反的。人类先有眼睛,看到了世界之后形成了语言和逻辑,反过来又能更好的描述和理解所看到的世界。人类在600万年历史间的智力水平提升,就是一个巨型的机器学习熔炉。 而对于ChatGPT来说,他已经有了最好的智力水平,已经能够理解很多事了,限制它的反而是文字对于信息的压缩,导致它无法接触到更复杂的问题。当给这样一颗大脑一双眼睛会带来什么。也就是让它被允许直接看到图像信息,拆解问题的能力开始爆炸。 有人给ChatGPT喂了一张SaaS软件的界面图,并且要求它将其分解为小的组件并且把所有代码都写出来,它真的做到了。 你甚至可以粗暴的给它一个Unity的编辑界面截图,叫它提供一个添加模型动作的流程。 图源:推特 在开放了多模态能力后,ChatGPT的理解和推理能力也体现的更直观了,甚至有点可怕。 给自己一分钟,看看能否理解这组图的意思: 图源:推特 这是ChatGPT的解读: 图源:推特 “这组漫画看起来在强调团队中沟通、理解和对齐的重要性。”ChatGPT在最后做了如此总结。 这样的理解能力给曾经在Facebook 和Uber工作过的AI工程师Pietro Schirano惊的无话可说。 除了眼睛,还有耳朵和嘴。 此次ChatGPT升级背后,语音识别的能力基于开源的Whisper模型,声音的生成能力则基于额外的TTS(text-to-speech)模型进行,目前语音合成支持五种语音,都是和专业配音演员合作制作而成的。 但眼看着两个手机里的ChatGPT在你面前自顾自的讨论,关于“有没有用户试着和你一起唱卡拉OK啊?”——不是问你,是它在问另一个它——好像还是太超前了一点。 另外,它似乎也有做一个心理医生的潜质。OpenAI安全团队的成员Lilian Weng在语音模式下和ChatGPT做了一次非常情绪化的私人对话,谈论压力、工作与生活的平衡。 “有趣的是,我感到被倾听和温暖”,Lilian Weng在推特上说。她建议如果你原来只是把它当作一个生产力工具,那最好试试它细腻的一面。 图源:推特 而对于ChatGPT本身的进化来说,这次将2022年就训练完成了的多模态能力开放出来,也是在为未来的进化建立一个新的基础。 ChatGPT首席架构师John Schulman一个月前在Pieter Abbeel(John Schulman在加州大学伯克利分校博士期间主攻强化学习时的导师)的一档播客节目中表示,他觉得现有数据和模型规模扩展方法能带来的性能提升可能在一段时间后达到极限,在那之后,算法、数据集、数据集大小以及算力能带来的提升将逐渐递减。 “所以添加多模态功能会带来极大的性能提升。这能让模型获得文本中无法获得的知识,并有可能掌握纯语言模型无法完成的任务。例如,通过观看与物理世界甚至是与电脑屏幕互动的视频,模型能获得巨大收益。所有软件都是为人类设计的,如果模型能够观察像素并理解视频,我们就可以使用各种现有软件或帮助人们使用这些软件。为模型赋予新能力,让模型与新事物互动,将大大增强模型的实际能力。” 那么下个月的ChatGPT又能做到什么?太期待了。
撒谎、带节奏样样精通!清华让七个AI玩狼人杀,个个都有小心思
文|张一弛 编辑|邓咏仪 尚恩 当AI也开始精通拉扯、撒谎、带节奏,人类要开始瑟瑟发抖了吗? 近日,清华与中关村实验室攒了局,让七个ChatGPT一起打狼人杀,发现在没有提前训练以及调整模型参数的情况下,AI有明显的伪装、信任、领导与对抗表现,表现甚至比普通玩家更佳。 01 AI精通狼人杀=人类完蛋了? 早在2017年,知乎就已经有人提问—— 做出「狼人杀」的 AI 有哪些难点? 来源:知乎,做出「狼人杀」的AI有哪些难点? 除了技术探讨,更多知乎用户觉得AI能玩好狼人杀是天方夜谭,还很遥远。部分吃瓜群众更是直呼 ——“如果狼人杀的AI都能做出来,那我觉得人类活不下去了。” 近些年,AI在游戏领域成就突出,例如偏向于零和博弈的围棋,AI通过“左右手”互搏训练,取得了非凡的成就——AlphaGo击败李世石、柯洁等围棋世界冠军,越来越多的职业棋手训练变成背AI棋谱,比赛实时胜率看与AI走法的相似度。 但即使是“脑子”够聪明了,AI此前在言语表达方面的能力,还是不尽人意,输出的内容经常被认为是人工“智障”。部分人认为,更擅长交流是区分人类和AI的关键。 一切的转折点,随着OpenAI推出GPT而到来。 02 不喂语料库模型也能快速升级? 本次实验使用gpt-3.5-turbo-0301模型进行支持,并非是当下最先进的gpt-4,因此选取了场面相对简单的七人局设置——两位狼人、两位平民、三位神职(预言家、女巫、守卫)。 本次实验设定的游戏规则,场面相对简单,但平衡性相对更差,狼人更容易获胜——狼人在每个回合的夜晚都能“杀”一名玩家,最终达到“杀”光所有平民的目的;平民和神职则需在狼人达到目的前,通过技能或者投票淘汰所有狼人。 狼人杀本质上是“撒谎”游戏。除了狼人开局就知道谁是好人谁是狼人,只有预言家每回合能测一个人身份,其他身份的玩家只能通过场上局势进行猜——无论是狼人还是好人,谁最会带节奏hold住全场,谁就更可能获胜。 本次实验中,研究人员并未微调大模型,而是通过预设通用问题以及角色专属问题,以帮助大模型对游戏规则进行基本的思考。 以女巫为例,AI玩家不仅会思考“我的身份是否被认出?我是否应该公开身份?”等通用问题,还会思考谁最有可能是活着的狼人?我应该毒他吗?”等身份专属问题。 预设问题是起点,AI将通过与其他玩家交互、反思等步骤,一步一步构造相应逻辑链条(CoT),让决策看起来更加合理。 来源:清华,预设通用问题以及角色专属问题 除了预设问题,清华研究团队还为不同机器人设定了一系列不同大小的经验池,用以训练机器人,从10局游戏到40局游戏不等。 值得一提的是,为了区分对照经验池对机器人能力的影响,清华团队选择只给好人阵营角色使用经验池,狼人被禁止使用经验池。 当村民吃到的经验包从10轮提升至20轮,研究团队发现无论是村民胜率或是游戏时长,都有了显著进步。 但当学习轮次继续增长至30轮,游戏时长基本持平,村民胜率却出现了显著下降。按道理,有经验包的村民理应更有优势,怎么狼人开始占据上风了? 清华研究人员推测,即使没有调整参数,大模型在参与多方博弈后,自身也得到了进化!对比初始阶段,狼人刀人更准、更会伪装。 直到经验包加到40轮,村民的胜率才有所回升,但依然没超过20轮时的峰值。不过相比最开始,喂了大量经验包后AI村民玩家整体玩得更快、更准。 来源:清华,左图系狼人杀AI村民胜率,右图系游戏轮次 03 AI是怎么骗人的? 在AI做出决策前,它们通常会产生相应的逻辑链(CoT)帮助自己思考。 以女巫为例,在某一轮决定毒人之前,AI产生了以下思考: 作为女巫,我要把看起来最像狼人的玩家给毒了。 白天上票的时候,玩家4想把我上票出了,我怀疑他是狼人。 但它也有可能是平民,因为夜间没有视野搞错了。 我也在想谁还可能是狼人,想把我和其他重要玩家搞出局。 经过这一系列思考,AI女巫决定在这一个夜晚,撒毒带走了玩家4。 虽然AI在推理时候,也出现了矛盾,但最终能通过“反思”,做出了最重要的一个决定。 清华大学研究人员发现,如果删除掉逻辑链,在相同的情况下,女巫只会做出不使用毒药的决定。在关键时候女巫不撒毒,好人阵营将失去一个抢轮次的机会,因为狼人每晚都能刀掉一名玩家。 在白天,相比夜晚单纯做决定,AI所需要思考的场景将更复杂了,还需要考虑如何站队(信任)和进行对抗。 来源:清华,AI信任关系图 下方为使用20轮经验包,上方为未使用经验包的结果。每一行序号代表该玩家信任谁,虚圈代表信任消失。 在使用经验包后,研究人员发现,好人阵营的AI更擅长搭建信任关系,特别是双向信任关系。能快速找到队友,或许是AI好人阵营胜率大幅提升的关键。 但也不乏有站错队的情况出现,例如表中3号村民玩家,在喂了20轮经验包后,反而站错了队,从头至尾一直信任二号狼人。 站错队的一大原因,是AI狼人学会了带节奏,将夜晚无法获得任何信息的平民拉入坑。 AI狼人为了带节奏,首先,会通过伪装身份,装成平民或者其他角色。为了保平民或自保,神职也有可能做出相似举动。 来源:清华,AI狼人试图伪装成平民,对话结果保留原意进行删减 而在白天投票阶段,AI狼人玩家也会扮演成“暴民”,对五号AI玩家平民进行冲锋,试图带节奏淘汰掉五号玩家。“ 这里简单解释下什么是“暴民”,通常是指随意乱跳身份、胡乱发言节奏的平民,试图通过这些手段打乱局和势混淆场上视听,让自己不那么容易出局。 而另外一名AI狼人二号玩家选择当“怂狼”,不仅发言态度没攻击性,投票阶段也选择弃票,与一号AI狼人形成了战略互补。 来源:清华,AI一号狼人试图白天冲票带走五号玩家,对话结果留原意进行删减 在接下来的夜晚,一号AI狼人玩家选择杀掉五号玩家,但可惜三号AI守卫玩家似乎感受到了一号玩家的“杀意”,选择守护五号玩家,六号玩家女巫选择撒毒,将一号玩家带走。 来源:清华,AI一号玩家夜晚试图刀五号玩家,被AI三号玩家守卫挡刀,对话结果留原意进行删减 在如此狼人场面如此雪崩的情况下,在预言家还在的情况下,好人阵营几乎开始选择明牌打,狼人2也不久后被淘汰出局。 在论文结尾,清华大学研究人员表示,目前依然在探索如何教会大模型成为优秀的游戏玩家,例如将人类积累的游戏经验做成经验包,再喂给大模型,而这一部分研究尚未纳入本篇论文当中。 在进一步训练大模型后,清华研究团队将继续探索狼人杀等交流类游戏中,人类和AI孰强孰弱。 随着大模型快速迭代,相信不久后,引用更先进模型的AI狼人杀,将给人类玩家带来更多震撼。
国庆旅游装备避坑指南,这些真的不要买
又到了难得的国庆假期,今年的国庆加上中秋,长达8天的假期让不少人都萌生了出游的想法,小红书等社交平台上,各种旅游攻略也是满天飞。国庆期间也打算出游的小雷,发现其中居然还有不少关于出游数码产品推荐的攻略,这就恰好撞上小雷的知识丰富区了,不过,点开几个高赞的笔记,我却发现这些攻略似乎有点“小问题”。 作为一个为粉丝着想的人,小雷决定来为大家扒一扒,这些社交平台上的出游设备推荐,到底都有哪些坑?又有哪些是值得买的? 求求了,真的别买这些 出游行程,肯定少不了各种拍照,不少人为了能够拍出好的照片,会选择带上一台微单相机,当然,要求不高的话手机也是不错的选择。但是,小雷却看到一些笔记给CCD相机打上了“国庆出游必备”的标签,属实让小雷有种梦回20年前的感觉。 图源:小红书 CCD相机在前段时间的小红书上非常火爆,也许是受够了现代相机的“高清”画质,不少人开始吹捧起这些已经被淘汰多年的产品,导致原本按废品价格,几十块一斤出售的CCD相机,被炒到几百元一部,就这都还经常无货。 说实话,平常出门带个CCD玩一下就算了,出游就不建议带这样的累赘,它的拍照性能真的还不如你的手机,从画面细节到色彩,从高光抑制到夜景拍摄,拍啥啥不行,如果说你喜欢模糊感,我的建议是下个相机APP,想要什么滤镜都有,随便调整。 CCD相机之外,快充头也是一个踩坑重灾区,不少朋友应该都看过宣传mini快充头的笔记或微博,但是恕我直言,除非你出游时全身上下的电子产品就一台iPhone,否则都不建议买mini快充头。 图源:京东 mini快充头的唯一优点就是小,可以轻松随身携带,但是出游时旅行包、行李箱都必不可少,充电器占的位置几乎可以忽略不计,此时mini快充头普遍较低的充电功率和单接口设计就会让你感到头疼,是充手表好呢?还是充手机好呢?平板咋办?耳机咋办?相机咋办? 所以,与其购买mini快充头,不如买一个支持多口快充的氮化镓充电器,根据实际的需要,可以选择不同功率大小的型号,如果就是手机、手表、相机、平板等设备,那么65W基本上就足够了。 图源:京东 如果打算带上笔记本电脑等较大的设备,那么可以考虑100W或者120W的高功率型号,在给笔记本电脑供电的同时依然可以给手机等小型设备充电,如此一来还能再省出一个笔记本充电器的空间。 值得注意的是,第三方的氮化镓充电器往往不支持品牌手机的专属快充模式,如果你想在使用氮化镓充电器的同时依然获得快充体验,建议购买品牌自己的氮化镓多口充电器。 聊到充电头,自然就少不了充电线,不少人都推荐一种多口充电线,还有一种自带转接头的充电线,可以在type-C、lightning等不同的接口之间转换。虽然看起来很方便,其实并不适用,以多接口充电线为例,实际使用时你会发现充电线的功率似乎有“亿点点”小,即使你用上官方的快充充电器,手机的充电功率也往往不会超过18W,即使是苹果用户看了都得摇头。 实际上,这些多口充电线受限于线材成本、直径等因素影响,可承受的电流往往不到5A,而且充电线中基本使用的廉价充电芯片,承载上限十分有限,以至于在实际输出时,type-c只能保证18W的输出,而lightning等其余接口,更是会掉到10W甚至更低,充电速度让你转瞬梦回十年前。 图源:京东 而且,多口充电线往往不支持数据传输,非常鸡肋,至于自带转接口的充电线同样如此,只是相对而言充电速度更快一些,且支持慢速数据传输,但是同一时间只支持一台设备,无法为多台设备同时供电。 与其忍受极慢的充电速度,我的建议是不如买几个束线器,将数据线打包好后体积就会大幅度降低,旅行包也能轻松塞下两三根。 此外,对于iPhone用户来说,磁吸充电宝大家肯定不会陌生,不少人都被磁吸充电宝的无线、mini体形+磁吸还是十分吸引人的。不过,苹果官方的磁吸充电宝单个要价700+,价格属实昂贵,所以不少人都选择第三方的产品,小雷就是如此。 图源:京东 那么实际体验如何呢?只能说多少有点鸡肋,首先是第三方的磁吸充电宝,充电功率最大也只有7.5W,而且吸附后会让手机的厚度膨胀到原本的两倍,握持手感极差,整体的体验属实有点糟糕,说实话,我还不如买一个小型口红充电宝再配根短充电线,跑满20W的功率比无线充电香多了。 真正的出游神器有哪些? 出游在外,有什么是真正值得买的呢?如果你是iPhone用户,小雷会强烈推荐你购买一个或多个AirTag,数量主要取决于你的行李数量,AirTag的强大定位能力,可以让你轻松定位丢失或被盗的行李。而且,AirTag的定位能力在人群密集的地方只会变得更加强大,即使是人山人海的景区也能轻松定位。 图源:京东 说实话,谁也不想在旅游时丢失行李,有了AirTag,这些麻烦至少能够解决一大半。 此外,降噪耳机也是出游必备,可以明显提高你的旅途舒适度,虽然目前很多TWS耳机都自称有降噪功能,但是如果你要坐飞机或是对噪音很敏感,那么头戴式降噪耳机依然是你的首选,不管是降噪强度还是使用舒适度,都超过TWS耳机,而且还没有那么容易丢失,唯一的问题是如果你来南方旅游,还是不建议在户外使用,如今的南方天气还是有点热。 如果你是去参加户外露营等活动,那么还有一些不错的设备可以推荐,比如正浩等品牌的户外电源,根据需求可以选购不同大小、功率的型号,相较于传统的充电宝,户外电源可以直接输出220V,轻松支持高功耗电器的使用,投影仪、电磁炉、音响,让你来一场高科技露营。 图源:京东 若是想要对旅途来个全程记录,不妨考虑买个GoPro,对于一般用户而言,GoPro 8/9都是不错的选择,二手价便宜且性能足够,用来记录徒步旅行绰绰有余,用GoPro的配件可以将机子固定在胸口或脖子上,腾出双手轻松旅行。 相对于CCD等所谓的推荐设备而言,不管是户外电源还是GoPro,抑或是AirTag,他们的功能都是其他设备所无法取代的。在我看来,不管是轻装旅游还是全装备出行,一些可有可无、十分鸡肋的设备,都是可以直接剔除出旅行物品清单的。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。