注册 登录
EN
中文
APP下载
logo
icon
数字孪生
icon
大数据获客
icon
人工智能
分类目录
行业分类:
IT/通信
金融财经
市场/营销
交通/物流
节能环保
休闲旅游
农林渔牧
日化用品
数码家电
房产/建材
企业/管理
家具/家居
医疗/保健
新零售
机械/工业
餐饮/食品
其它行业
头条分类:
行业前景
行业动态
行业资讯
行业活动
魅族枪响AI转型:一部手机,两个男人和三个战略|风暴眼
凤凰网科技 《风暴眼》出品 作者|唐辰 编辑|刘毓坤 AI For New Generations。 智能手机如何走出创新瓶颈?这是手机行业需要共同面对的问题。2024年,手机厂商把破局的方向都压在了人工智能(AI)上。其中,动作最为果决的当属魅族。龙年新春开工的第一天,魅族CEO沈子瑜就宣布:魅族All in AI(全面转型AI),将停止传统“智能手机”新项目,全力投入明日设备——AI For New Generations。 魅族高调全面转型AI的背后,是手机厂商正在谋求AI为突破点,试图重新定义智能设备。这一年,也被业界广泛称为“AI手机元年”。沈子瑜在发展战略上的重新锚定,是魅族作答行业问题的自命题考卷。2月29日,在珠海长琴岛举办的魅族特别活动上,魅族则通过“一台手机、两个男人、三个关键战略”,对外界阐释了其对AI手机的理解,迈出通向AI生态的关键一步。 一台手机?不,行业首款“AI智能移动终端” 当天,珠海长琴岛的天气,让到场的所有媒体都切身感受到活动的“特别”。强劲的海风,像AI的风口一样强势刮来,在海面掀起巨浪。这似乎在预示,AI风口来得快,魅族要快速抓住。 特别活动的进展也没有多少花哨的铺垫,简单的开场白后,魅族21 Pro当即登场。按照此前沈子瑜设计的路线,魅族停止传统“智能手机项目”,魅族21 Pro已经不叫“智能手机”,而是行业首款“AI智能移动终端”。 或许是基于这个定位,特邀演讲嘉宾李楠快速跳过硬件参数的介绍,直接把重点落在这台设备的AI功能。他表示,魅族21 PRO的“O”,是智能手机时代的句号,也是一个新时代的开始。这也与特别活动的主视觉“O”呼应。 李楠介绍,这款手机是魅族历史上首款开放平台手机,也是全球首款开放软硬件生态的手机,致力于成为AI时代的“树莓派”——Raspberry Pi 基金会开发的一款微型电脑,只有信用卡大小,问世以来,受众多计算机发烧友和创客的追捧。 在这个思路的主导下,魅族将不仅对软件开发者开放,允许LLM向用户请求数据,并开放SOC边缘AI API等技术接口。还对所有大模型都提供了系统权限、Flyme API文档等支持。其中,针对月活用户最好的大模型应用团队,还特别设置100万人民币悬赏机制。 目前,AI能力已经在Flyme 10.5上有所展现。比如Flyme的Aicy语音助手,现在可以进行问答、咨询,文生文或者文生图。图像处理方面,可以实现自然语言搜图,还可以扩图、消除、生成写真。以最新发布的AI辅助输入功能为例,AI辅助输入可自主理解对话场景中的上下文,帮助用户自动生成精准回复。在生成文本时,AI辅助输入将能一次性展示多个备选建议,同时还可根据用户需求自动进行长文创作。用户只需输入一句话,AI即可生成一篇完整的种草文案或旅行日记。 值得一提的是,在这轮手机厂商AI能力迭代过程中,交互是重要的着力点。根据多家手机厂商的表态,从手势触控到语音操控,省去繁琐的用户触达各类APP过程直达结果是目前普遍的认知方向之一。而魅族经典的mBack在AI能力的支持下进化:重按mBack即可随时唤起系统AI,魅族为重度依赖语言大模型的用户提供了一个更快的入口。除了和AI对话,系统还会实时分析屏幕内容,并提供延伸操作的推荐,比如翻译、扫描二维码,又或者是选定画面的某个物品搜索同款。 但同时魅族认为,当前行业交的“AI大模型作业”,其产品设计方式多类似面向上一代系统上打AI补丁。在传统系统架构中,用户意图、业务流程以及执行全链路流程均需要用户来完成,而在未来的魅族AIOS 架构中,用户只需要向系统表达意图,AI 便可以帮助用户完成整个业务流程以及执行板块。 而魅族要跟进的,是具备系统级应用AI能力。换句话说,目前手机行业还没有出现,类似iPhone取消物理按键,推出屏幕交互的“尖叫时刻”,AI能力也还是在上一代系统上起跳,在探索中颠覆智能手机的概念。 对于下一代 AI OS,魅族提出四个方向:AI随身秘书、任务机器人、AI记忆管家、AI小程序。21世纪经济报道评价称,这个蓝图,与其他国内头部手机厂商提出的方向基本一致,即交互模式、系统设计逻辑、相关算法的调用等将改变。更重要可能涉及核心底层:大模型谁来搭建、操作系统如何迭代、底层算力谁来支持。 魅族的开放式打法,在向外界传递一个信息:魅族不参与自研大模型。李楠坦言:“这是小品牌在大模型时代最优的生态位。” 两个男人?魅族转型AI的人才观 魅族特别活动的另外一个“特别之处”在于李楠和杨颜的回归,代替星纪魅族CEO沈子瑜主导特别活动的主要环节。其中,李楠讲解硬件新品21PRO,杨颜介绍软件,分享魅族All in AI的思考和布局。 二人的回归在此前官方预告时就引发热议。当二人顶着海风出现在台上时,现场的魅友和媒体又仿佛回到魅族最辉煌的时代。当时,在魅族灵魂人物黄章之下,前魅族科技总裁白永祥、魅蓝事业部总裁李楠和Flyme事业部总裁杨颜,被魅友们亲切地称为“魅族三剑客”。他们三人一同打造、见证过魅族的巅峰时刻,在中国智能手机史上留下深刻的印迹。 但随着魅族PRO 7“智窗”副屏的错位产品设计,加上黄章以魅蓝降低魅族的“品牌形象”为由,砍掉整条业务线。由此,魅族在手机市场的竞争中大伤元气——李楠主导的魅蓝品牌,一度是魅族的销量担当,帮助魅族完成年销量2000万台的历史成绩。这直接导致白永祥和李楠先后出走,只剩下“Flyme之父”杨颜留任。而黄章本人,也在2022年吉利入主之后,正式和魅族分道扬镳。 李楠离开魅族后,于2019年7月18日,宣布创立怒喵科技Angry Miao并担任公司CEO,他在微博十分高调,怼李想、骂马斯克、谈技术前沿话题,这让公众对他并不陌生。 杨颜在回归舞台上称,自己也是16年的老魅友。他于2011年加入魅族,主持并操刀了魅族所有软件产品的核心设计。其中,最为知名的当属Flyme OS,是国内最优秀的安卓定制系统之一。2018年12月31日,魅族公司发布的人事调整通知,魅族科技高级副总裁、Flyme事业部总裁杨颜正式卸任魅族Flyme事业部总裁一职。 特别活动开始前,不少媒体同行都在猜测,李楠和杨颜都会以什么形式回归,这是不是魅族在打情怀牌,走一波营销。疑问在活动尾声得到解答,沈子瑜通过线上短片形式确认,二人分别以“品牌大使”和“首席产品体验官”的身份,受邀回归魅族。沈子瑜也对二人给予高度评价,认为“他们在过去魅族的历史上,做出了非常重要的突出贡献”。 众所周知,人工智能成功需要具备三个必要条件:人才、数据和算力。沈子瑜在视频中坦承,他一直在思考“未来的产品怎么做”,怎么去把魅族的产品做好。同时,在他接手魅族品牌后,也一直在学习魅族品牌。从这个角度看,李楠和杨颜实现各自意义上的回归,也是新魅族在AI开放时代的人才理念。他们急需熟悉魅族基因、通晓AI打法的人才共同应对AI手机时代的竞争。 除此之外,特别活动有相当大的篇幅给到了魅友,比如与魅友的共创、共创空间、线下活动等。这些细节对魅族、魅友以及魅族用户来说,都是魅族品牌资产的延伸,也是魅族all in AI打下的人才地基。 可能会让很多魅友遗憾的是,三剑客的另外一位,白永祥是不会回归了,至少短时间内不可能。李楠在微博中写道:“白总我是非常想请出来的,但是真的没戏了” 魅族的这番AI战,不只是算法的冷漠,又有点人情味儿了。 三个要点,迈出“三步走”路线关键一步 面对AI风口,魅族在宣布全面转型AI时,同步更新AI终端路线“三步走”战略: 第一步:2024年,将重构AI OS,即面向AI时代的操作系统;推出首款AI Device,即AI设备或终端,也可能是AI手机; 第二步:2025年将推出XR形态的全天候AI Device,猜测类似苹果Vision Proision,并进行AI Device迭代; 第三步:2026年将推出全天候AI Device,业界猜测可能是手表。同步进行AI Device迭代,以及预研前沿技术的AI Device PRO。 图片:魅族AI设备规划 来源:官方微博 从这个规划看,魅族对AI手机的定义,更倾向于平台级AI,用AI来重构操作系统,同时与各类AI服务商进行合作,为用户提供各类AI服务,这与荣耀的思路基本相似。其内在逻辑可以复用荣耀CEO赵明在MWC2024期间的观点,他认为,生成式AI未来会有各种各样的应用,第三方的服务商一定比手机厂商做得更好,而且每个消费者可以根据自己的喜好来选择。手机厂商需要做的事情是,在操作系统上构建AI的能力。 魅族特别活动上,杨颜公布了“All in AI第一步走”的战略规划详细内容,包括AI Device产品、重构Flyme系统和建设AI生态三大要点。 具体来说,魅族将打造全新的AI Device ,通过产品形态AI原生设计、硬件算力AI全局调用等提升AI产品体验;Flyme系统将从底层重构系统及应用,从而让AI技术能够更深入地融入操作系统中;魅族还将重点建设AI生态,向包括OpenAI在内的大模型团队全面开放魅族AI Device硬件。 魅族还有一层底气来自团队建设。其官方表示,经过两年的团队磨合、资源配置、产品布局以及相关技术的充分预研,魅族目前已具备向AI领域全面转型的能力。特别是软硬件一体能力,魅族在国内手机品牌力还是很能打的,这也为魅族All in AI战略提供技术支持和服务保障。 截止目前,三星、华为、OPPO、荣耀、小米等手机厂商都在重点部署AI。比如三星在其S24系列中加入的智能修图、AI通话翻译、即圈即搜功能;小米已经宣布将AI大模型植入系统,小爱同学拥有了文本创作、AI扩图等功能;荣耀CEO赵明也表示将推出自研AI大模型和全新云服务。OPPO抢占AI风口的力度不比魅族小,春节期间宣布OPPO正式进入AI手机时代,并召开AI战略发布会,明确了AI手机的四大特征,并开放AI开发工具号召开发者们一起做AI应用。 智能手机行业最重要的玩家——苹果公司,上周传出放弃造车的消息后,普遍认为生成式人工智能(AIGC)将成为苹果最重要的战略之一。2月29日,苹果公司CEO蒂姆·库克在年度股东大会上表示,计划在今年晚些时候披露更多关于使用生成式人工智能的计划,进一步加入这场行业热潮中。 这些动作都在说明,智能手机行业创新瓶颈之下,手机厂商形成默契:所有功能/业务都可以用大模型重新做一遍。但如何构建AI的体系能力,不同的厂商又“因地制宜”的有着差异化思考。 据央视财经报道,有分析师预计称,2024年出货的智能手机中将有5%具有人工智能功能,这意味着今年具有AI功能的智能手机出货量将达到6000万部左右。预计到2027年会增长到6.35亿部,这个数字是2023年全球智能手机超过一半的出货体量。 这对处于低谷期的智能手机行业,特别是魅族来说,既是机会,更是挑战。
李志飞AI课会重蹈李一舟覆辙吗?
文 | 曹双涛 编辑 | 杨博丞 继千万粉丝博主、自称是“清华大学博士”,被网友戏称为“中国AI搞钱第一人”的李一舟被央视点名、全网AI课程被下架后,日前AI科学家、出门问问创始人李志飞也开始销售起AI课程。 从李志飞AI课宣传页面来看,售价2999元的年度会员包括12场会员专属线上研讨会,以及线下研讨会、跨年大课、1v1咨询、私董会等线下互动资格。 图源:李志飞AI宣传页 事实上,卖AI付费课程的不仅仅只有“AI大佬”,目前市面上围绕AI付费课程已拓展多个细分领域。以抖音平台为例,目前抖音平台上销售的AI相关课程可大致分类四类: 一是AI图文带货,售价集中在三位数。二是AI技术、AI实战、AI设计的相关课程,售价从148元到1799元不等,价格差异相对较大。 三是以提高用户对AI认知推出的AI破局课,部分AI课程宣传学会AI可以直接赚钱,课程售价高达2799元。四是围绕TOB客户推出如AI外贸课、AI内容营销课。其中AI内容营销课售价几乎和李志飞AI年度会员价格一致。 图源:基于抖音平台公开信息整理 值得注意的是,即使这些课程在直播间和日常售价一致的前提下,部分AI课程销量同样可观,且直播间转化率也相对较高。如售价499元的从入门到熟练AI实战应用课,近30日抖音平台销售额为64.6万,直播间转化率更是接近14%。 图源:达多多(数据维度:2024年1月30日至2024年2月28日) 有“AI大佬”人设作为信任背书,产品销量更加可观。如飞瓜数据显示,李一舟售卖的AI课《每个人的人工智能课》一年内卖出约25万套,销售额约5000万。 01.市面上的AI付费课程有多水? AI付费课程高销量、高转化的背后,却是课程质量良莠不齐,甚至极“水”。 以李一舟199元的40节AI付费课程来看,前1—5个视频内容介绍AI工具操作界面,7—16个视频内容讲述AI可以干什么。后面视频讲述通过AI可制作PPT、写简历、生成logo等等,最后几个则为李一舟和其他公司老板关于AI的对话,颇有硬广的味道。 图源:李一舟199元付费视频 几十个视频听下来,在业内人士看来简直就是毫无干货,增量信息。AI操作工具,并不像如JAVA、C++等技术类语言,存在一定使用门槛。 AI的作用,在知网这种学术性网站上,有着大量专业学术期刊论文,内容颗粒度、增量度、丰富性,远比李一舟视频中提到的还要高。比如制作PPT、写简历、生成logo等等,几乎是国内大模型的标配功能,不存在使用门槛。 不仅仅是李一舟的这些AI付费视频,抖音上某款销量较高的AI付费课程,用户在商品评论区内称,三个付费中既有网络平台公开信息,也有文心一言可自行学习内容。且用户若想学习更多AI内容,也需二次付费。 另一款AI创业课,课程内容包括适合私有化大模型的50种行业和应用场景、每天精准获取20万条企业资源的方法、向合作企业发送合作邀请等等。 图源:抖音 国内某家大模型企业的销售经理张瑞看完这些课程后,无奈地对我们说道,用户还是把ToB端大模型商业化想得太简单了。 围绕大型国企、央企、上市企业定制的私有化大模型,除老生常谈的输出结果问题、业务洞察问题、资源关系、价格问题外。给这些客户定制私有化大模型,动辄千万级的投入以及相对较长的回款周期,很多企业若没有强现金流支撑,根本不敢参与投标。 中小企业私有化大模型的发展路径,和国内SaaS产业整体一致。除大模型反馈的结果必须精准、可靠外,回报率、性价比、品牌背书均是中小企业主极其看重的地方。 尤其是中小企业纷纷追求降本增效,私有化大模型不仅要价格低,且给客户带来的ROI一定要高。目前国内头部企业对于中小企业的私有化大模型,商业化路径仍在艰难探索中,更别提技术、资金、资源本就不占优势的个人投资者了。 AI付费视频的“水”和用户愿意付费,看似矛盾的背后,本质上还是信息茧房形成的信息差。 近两年,越来越多的用户逐渐将短视频作为获取信息的重要方式。短视频平台的算法机制下,用户更愿意接受自己感兴趣的信息,其他异质信息被阻挡在外,这就使得用户逐渐沉浸在由个性化信息需求为主导所营造的“拟态环境”带来的满足感中,逐渐导致用户信息结构失衡,丧失对事物的个人判断和对外界的真实了解。 用户对某类事物的信息茧房被形成后,他们更愿意关注、倾听和自己意见相符合的观点。短视频平台上的“AI博主”通过强人设和内容运营,持续获取用户信赖的同时,也为这些“AI博主”付费用户的增长奠定了基础。 但当用户真正突破信息茧房后,就会感受到AI对商业格局的重构并不是万能的。以零售业为例,从传统电商到直播电商,从DTC到私域流量,从数字化转型到AI,近两年市场一直强调去中间化,去经销商化、建立中台化。 虽说这些模式对线下经销商体系构成一定冲击,但不管是伊利、蒙牛70%以上的销售额来自线下,还是美妆行业2024年正加速重启线下,均在说明线下经销商仍是品牌方不可或缺的重要渠道。 毕竟品牌方和线下经销商利益的深度捆绑,经销商通过多种方式构建客户的信任感、好感度、忠诚度,以及庞大经销商体系触达更多的消费人群。在人性洞察和利益捆绑上,绝不能靠AI来完成。 02.AI付费课程:卖的不是课,是焦虑 雷军曾说过,站在风口上,猪都能飞起来。过去几年,从自媒体到直播带货,抢占和抓住风口的李佳琦、小杨哥,续写了普通人逆袭的人生故事。作为下一个风口的AI,个人和企业都不想错过这个风口。 信息茧房下,用户希望通过这些AI付费课程突破现有信息差,且借助AI能为自己带来更多副业收入。“洞察”用户需求后,短视频平台上的“AI博主”视频内容和直播,往往会强调通过AI图文带货变现多少,学习AI技术副业收入都比普通人工资要高,持续刺激用户神经,以提高付费课程转化率。 更深层来看,从去年爆火的GPT,到今年的Sora,再到阿里日前上线的音频-视频模型技术EMO。和AI技术发展进步之快形成鲜明对比的却是,这两年国内外宏观经济的改变。 为修复疫情期间企业对业务的错误判断,应对美联储激进加息带来的企业现金流减少,降本增效裁员几乎成为多国企业的普遍做法。其中,2023年美国数百家科技公司裁员,裁员人数高达17万人。 《2023新中产大调研》数据显示,房地产/建筑、餐饮/消费品两大类行业中,裁员比例更是达到60%以上。世界经济论坛发布的《2023年未来就业报告》数据显示,未来五年新增的工作岗位数量将达到6900万个,与此同时消失的工作机会将达到8300万个。 图源:吴晓波频道报道《2023新中产大调研》 随时可能被裁员,本就让打工人感到惶恐时,2024年AI技术的飞速变革,让打工人更清醒地意识到工作随时会被AI代替。 如Sora空降后,美国导演泰勒·派瑞直接叫停了耗资8亿美元的亚特兰大制片厂扩建计划。他认为,人工智能将导致电影业大量工作岗位流失。2月份CNBC报道称,谷歌首席执行官桑达尔·皮查伊表示,随着公司继续将投资转向人工智能等领域,今年将有更多裁员。 短视频平台上的“AI博主”深知用户的焦虑,通过视频内容、直播间等方式,也在持续贩卖这种焦虑。 如李一舟的视频内容中多次强调,AI如何重塑格局、如何改变人生等等。其他“AI博主”纷纷则以“科普”的形式,讲述AI的重要性。好像如今的打工人,不跟随潮流学习AI,马上就要被社会淘汰。 图源:抖音 换言之,AI付费课程本质上做的就是营造焦虑、贩卖焦虑的生意。从这一角度来看,AI技术发展越快,用户对AI越焦虑,AI付费视频这条产业链则会愈完善,未来渗透的领域也将更广,市场上也将涌现出更多的“李一舟”们。 而通过人设包装、真假收益混合、AI信息二次加工等方式,收割焦虑“AI小白”的“李一舟”们也将更多,AI付费视频课程的乱象将会更加突出。换言之,李一舟事件仅仅是AI付费课程乱象的起点而已。 03.普通人真的需要为AI焦虑吗? 不可否认的是,随着AI技术的持续发展,未来将代替更多岗位。如不少媒体指出,Sora或将改变包括电影制作、广告、平面设计和游戏开发在内的一系列创意性产业,但普通人或许真的无须为AI感到焦虑。 但当市场在谈论Sora带来的冲击时,却忽略两点重要因素。一是Sora制作出的短视频,能真正满足平台上所有用户需求吗?不管是抖音、快手的下沉速度之快,还是去年抖音短视频博主秀才的爆火,再或是短视频平台拍摄家长里短的博主积累的百万粉丝,本质上透露出的都是如小镇青年、中老年群体等特定群体精神世界的空虚。 空虚之下,决定了部分群体对短视频平台上内容的需求绝不可能仅是大片视觉和阳春白雪。同时考虑到人性的复杂性,情绪的波动性,更要求短视频平台上的内容足够多样性、丰富性。 当一个短视频平台全部都是用Sora制作出的视频,无法满足特定群体的需求时,必然会带来大量用户流失,这也绝不是短视频平台想要的结果。 相较于短视频而言,长视频的情况更加复杂。一方面,短视频和长视频产品逻辑本就不同。否则,腾讯、优酷、爱奇艺等长视频内容平台不可能在抖音、快手、视频号的冲击下,仍活得相对“轻松”。 同理,抖音、快手的电影剪辑博主,宁愿冒着版权风险,也只剪辑电影中精彩部分进行解说。 另一方面,长视频中的电影从明星到导演到院线,资源是有限的,资本却是无限的,且电影不单单就是靠优质内容就能完成高票房业绩的。 如《麻辣滚烫》斩获几十亿票房的背后,既有贾玲瘦身100斤作为宣发点,又有1亿骂声和1亿叫好声。但不管如何,贾玲无疑是极其成功的商业片导演。这些宣传卖点和争议声音,绝不是靠Sora就能完成的。 二是不管后续Sora技术进展如何,平台流量才是可贵的。“AI博主”往往以某一个偶然事件,看成全部事件。但很少谈及目前很多内容平台对AI图文、AI视频进行限流。 图源:抖音 更现实的问题是,抖音本就不缺源源不断的各类内容,且付费投流也能拉动平台广告收入增长。那么,平台为何又将大量流量倾斜到AI视频上呢?毕竟AI视频带来的内容同质化,和借助差异化内容打造的平台内容生态壁垒本就构成矛盾。 不仅仅是Sora,这两年谈及AI数字人直播会对直播行业构成冲击,大量主播也将失业。但很多人忽略的却是,目前不管是直播电商平台,还是传统综合性电商平台,因用户数量接近人口增长天花板,平台流量未来不可能出现大的涨幅。 有限的流量下,平台既要兼顾各业务板块的平衡,也要将流量倾斜到低价商品上,维持平台的竞争力,更需要保证付费投流商家流量的精准性,以带动平台收入增长。流量被不停分割,分配到一个AI数字人主播的直播间流量又能有多少呢? 同时,随着当前直播间商品同质化,商家追求全网同价化,直播间更需要“主播”对直播间用户情绪的调动。但相较于有经验的主播,AI数字人主播在调动用户情绪,以及和用户互动上,还需持续发力。 更深层来看,好的产品和技术,不需要去教。目前市面上的大模型,若想持续扩大用户数量,进而探索多元化的变现路径,后续的使用门槛也将逐渐降低。普通人不是不需要为AI感到焦虑,更应该是真正上手自我琢磨AI工具。 而且从工业革命发展的技术路径来看,技术变革下,被抢走工作的从来不是机器,而是人,这就意味着AI时代大家还是需要去和人抢工作。 基于此,普通人和企业更应该关注的是如何在所处的行业中,做出差异化竞争,不断刷新自我的知识、认知、人脉,才能真正具有长期主义,才能应对AI以及新技术的冲击。
力挺华为纯血鸿蒙!深圳发布计划率先支持鸿蒙原生应用发展
快科技3月3日消息,被称为“纯血鸿蒙”的HarmonyOS NEXT鸿蒙星河版已于1月面向开发者开放申请,首批200多家鸿蒙原生应用厂商正加速开发,鸿蒙原生应用版图基本成型。 据“深圳工信”公众号,日前,深圳市工业和信息化局、深圳市政务服务和数据管理局联合印发《深圳市支持开源鸿蒙原生应用发展2024年行动计划》(以下简称《行动计划》)。 此次,深圳率先出台《行动计划》将加强鸿蒙原生应用供给能力、推动鸿蒙原生应用产业集聚、完善鸿蒙原生应用产业生态。 《行动计划》提出到2024年底,深圳市在鸿蒙原生应用发展上的具体目标,包括: 在2024年内实现深圳市鸿蒙原生应用数量占全国总量10%以上; 深圳市主要垂域实现鸿蒙原生应用全覆盖; 鸿蒙开发课程进入深圳市主要高校和培训机构,取得资质的鸿蒙开发者数量占全国总量15%以上; 建成2家以上以鸿蒙原生应用软件开发、应用企业为主的专业产业园; 拥有鸿蒙开发人才资质的软件企业超千家; 推动鸿蒙生态创新中心稳健运营,提供鸿蒙原生应用展示推广、人才培养等公共服务; 全球智慧物联网联盟正式落地运营,持续扩大鸿蒙原生应用国际影响力等。 官方表示,深圳是开源鸿蒙的发源地,集聚了华为、深开鸿等开源鸿蒙主要研发团队,拥有大批的应用软件企业。 并且深圳鸿蒙原生应用开发活跃,截至2023年底,深圳市参与开源鸿蒙生态建设的企业数量共49家,产品数量共133款,贡献软件发行版11款。 针对开源鸿蒙软件一次开发多端部署的产品优势,深圳企业贡献的11款开源鸿蒙操作系统商业发行版将作为开源鸿蒙原生应用开发基底,广泛适配各类开源鸿蒙原生应用。 据了解,华为HarmonyOS NEXT鸿蒙星河版将在今年秋天和消费者见面,该系统底座全栈自研,去除掉安卓底层代码,不支持打开安卓系统应用,仅支持鸿蒙内核和鸿蒙系统的应用。 因此,加速鸿蒙原生应用的开发是目前的重中之重。 根据研究机构TechInsights最新预测,2024年,鸿蒙将超越苹果iOS,成为中国智能手机市场第二大操作系统,仅次于安卓。
亚洲首富小儿子举行婚前派对,名人、明星、商界大佬齐来捧场
亚洲首富穆克什·安巴尼的小儿子阿南特·安巴尼于3月1日举行了婚前派对,华尔街和硅谷的大佬纷纷云集印度西部一个小镇。这场为期三天的活动不仅是场婚前仪式,也是商界人脉关系的盛会。 这场活动于3月1日在印度西部古吉拉特邦的一个小镇拉开帷幕。宴会持续三天,菜肴达500种,“着装要求”长达9页纸。一段视频邀请函显示,宴会的第一天主题为“在仙境中度过的夜晚”,着装要求为“优雅鸡尾会”;第二天的“漫步在野外”包含晚间的舞蹈和音乐表演,需穿着动物花纹的衣服。宴会的最后一天则会开始“大象之路”,据报道称,活动现场将有 200 头大象,300 只大猫和 120 种爬行动物,穿着要求为印度传统服饰。 宴会邀请函 盛会最大的亮点莫过于歌手蕾哈娜于3月1日晚上的表演。蕾哈娜赤脚登台表演,身穿当地风格的浅绿色和粉色服装。据印度媒体报道,她演唱了 19 首歌曲,其中包括热门歌曲《Umbrella》、《Diamonds》和《Work》。 演出后,蕾哈娜对记者说道:“演出效果堪称完美。八年以来,我都未曾进行过这样一场真正的演出。” 蕾哈 娜(左)、 伊万卡和穆克什妻子Nita(右) 这并非娱乐巨星首次参加安巴尼家族的盛宴。2018 年,碧昂丝就曾在穆克什的独生女伊莎·安巴尼的婚前派对上表演。2019 年,酷玩乐队的领唱克里斯·马丁和烟鬼组合为出席阿卡什·安巴尼——即将结婚的阿南特·安巴尼的大哥——在瑞士举行的婚前派对的宾客们助兴。 这场奢侈盛大的婚前典礼不光规模宏大、酒宴丰盛引人注目,同时也体现了安巴尼在印度多个经济领域的深度掌控。 这位印度大亨旗下的商业帝国Reliance Industries Ltd规模达2,620亿美元,业务涉及石油、电信等领域。全球投资者为进入印度有着14亿消费者的市场,与其达成数十亿美元的交易。据彭博亿万富豪指数估计,穆克什·安巴尼拥有1113亿美元的净资产。这使其成为亚洲首富,全球第11大富豪。 Meta的扎克伯格、微软联合创始人比尔·盖茨还有伊万卡·特朗普也参加了盛宴。在第二天的“漫步在野外”活动中,扎克伯格身穿动物图案、搭配白色长裤和妻子普莉希拉·陈与穆克什·安巴尼和阿卡什·安巴尼进行了合影。 扎克伯格(左)和 比尔·盖 茨(右 ) 此前报道称,贝莱德联合创始人Larry Fink,以及Alphabet Inc.首席执行官Sundar Pichai和沙特阿美董事长Yasir Al Rumayyan预计将会出席。 柏克夏的Ajit Jain、黑石集团创始人Stephen Schwarzman、摩根士丹利首席执行官Ted Pick等华尔街重量级人物也在邀请名单之列。 阿南特·安巴尼和未婚妻拉迪卡·梅钱特计划于7月12日结婚。
拜登炮轰中国电动车是威胁,美国人民毒舌回怼,笑疯了...
4年一次的总统大选即将到来,这两党候选人隔三差五打起了“中国牌”, 一天到晚喊着“China”、“China”,“China”... 这不,昨天总统拜登声称:联网的中国轿车和卡车(包括电动汽车)对美国构成威胁,他将采取“前所未有的措施”阻止它们进入美国汽车市场。 美国商务部也立即展开调查,之后或将出台限制中国汽车的新规。 图片来源于nytimes,版权属于原作者 同时,美国政府官员明确表示,这只是第一步。 接下来可能会有一系列应对措施,以阻止低成本的中国电动汽车(在中国生产或由中国公司在墨西哥等国组装)涌入美国市场。 对于这些举措,拜登及其政府的解释为:保护美国市场和安全。 最近,中国比亚迪取代特斯拉,成为了全球最大的电动汽车销售商。 如果每辆低于1.1万美元的电动车涌入美国市场,势必将给本土汽车制造商造成不小的冲击。 图片来源于nytimes,版权属于原作者 拜登在声明中说的义正言辞,但美国网友在得知这消息后,直接在评论区大怼特怼,条条都堪称金句: 咋啦?在美国销售的许多电子产品都是在中国生产的,包括 iPhone、许多品牌的笔记本电脑等,它们都连着互联网。汽车为啥就不能联网呢? 多年来,中国制造的别克一直在这里生产和销售。如果有人想忽视中国汽车,这当然是他们的权利,但如果是这样的话,他们最好也别用智能手机和电视机。 这太可笑了。你以为我会在乎中国知道我去哪里看病,或者他们能看到我听了多长时间的 90 年代摇滚乐吗?如果这些事情这么令人担忧,那就禁止政府雇员购买这些汽车,放过我们这些平民百姓吧。 美国制造商希望继续销售 5 万美元以上的电动汽车,以便马斯克这些人继续炫富,这不是我们的问题。我们宁愿买 1.1 万美元的汽车,做同样的事情。 美国三大汽车制造商必须明白,我们不需要 7 万美元的电动卡车。我们也不想要5万美元的电动轿车。我们要的是 2 万美元的电动汽车。 保护主义政策已经够多了!底特律之所以能以这些荒唐的 "担忧 "为幌子,收取高得离谱的费用,全都是因为它,反而是我们消费者深受其害。 此外,谁在乎你的汽车是否被追踪?手机对私营公司的作用更大,然而政府却并未真正关心过。啧啧。 哦,好吧!别人买美国车没感受到威胁就可以了!可悲的推理,连小孩子都能看穿。 翻白眼。要是美国能投入同样多的资金和精力,把有竞争力的、价格实惠的产品推向市场就好了。但我们没有。相反,我们保持低工资,为企业提供一百万个税收漏洞,向我们的公民收取荒谬的汽车价格,并忽视任何公共交通举措……是的,让我们尖叫“安全问题”,因为我们永远在拖后腿。 我不知道中国知道我去Home Depot购物怎么会对安全构成威胁。相对来说人类对地球的威胁才是非常真实的..... 我的中国电动车太棒了。叫極星。难以置信的操控性,瑞典设计公司(沃尔沃)在中国制造的。 我不在乎它会不会跟踪我。我的手机(来自一家美国公司)已经知道我在哪里,我一天中的任何一分钟在做什么了。 最安全的办法是回归马车。但首先,要确保那匹马不是告密者。 这些美国政客,动不动就China、China、China,赢了谈中国,输了也谈中国。周一,周三,周五,我们谈论中国的溃败,周二,周四,周六,我们谈论中国的威胁,无语得很 说真的 你出于安全考虑禁止某手机,没关系。 你出于安全考虑禁止大疆,OK,反正我也不用无人机。 你出于安全考虑禁止电动汽车。WTF ?比亚迪会远程遥控我的车去撞白宫吗? 顺便说一下,最近我甚至看到新闻说振华重工(ZPMC)为港口建设提供的起重机也对安全构成威胁。美国要把他们全部替换掉。白痴啊。 当然,也有“心直口快”的民众,直截了当的指出,这举措背后的深意。 他只是想在拿下密歇根州 。 美国并不关心我们的隐私。美国政府正在通过购买商业数据来监视我们(请参阅昨天Politico 上的文章)。 拜登这样做完全就是为了竞选噱头,因为大量价格实惠(1.1 万美元)的中国电动汽车很快就会上市,而他想得到工会的投票。 这只是一场游戏,我已经厌倦了。 这只是阻止中国汽车进入美国市场的蹩脚借口。底特律知道,如果允许中国电动汽车进入,三巨头的游戏就结束了。 拜登需要停下来听听民意。我是美国公民。 我想要一辆11000美元的电动车。我不在乎中国是否跟踪我。我也不关心美国汽车制造商,我很确定他们除了关心我的钱外,也不关心我。 我确实想让女儿生活在一个宜居的世界,我不care这个地方是谁来建设和主导,如果它是由中国建造而不是美国,那就由它呗。拥有一个星球比哪个国家的汽车制造商排名第一更重要。 这是拜登失去年轻人选票的又一个例子。 天啊,我有点想买1.2万美元一辆的新电动车。这种追踪的争论简直就是无稽之谈……中国怎么会关心我开车去哪儿?如果美国汽车工人联合会和三巨头无法竞争,那是他们的问题。 哇,怼得清醒又明白! 嗯,看来这届美国民众已经不太好骗了啊!! THE END
这个姐姐要成为第一个嫁给AI投影的人,谈恋爱越来越科幻了!
总感觉现在和活人谈恋爱的欲望越来越低了。 例如荷兰一位名叫Alicia Framis的艺术家姐姐, 就准备和一位AI全息投影结婚 ,并号称自己将会是第一个嫁给AI全息投影的女人。 而这是她自己制作的未来老公,AILex: 就感觉这个世界算是越来越疯癫了。 目前她在自己的社交媒体@hybridcouples中发布了一系列和自己投影恋人的恋爱日常。像是坐在一起吃饭,边吃边唠嗑。 一起在厨房干活,虽然知道投影也做不了什么,但在厨房有人陪你干活,似乎也不错。 目前还不知道Alicia Framis的技术团队是如何制作这种投影伴侣的,在我看来有可能是一种视频特效,只是用于辅助这位姐姐的艺术概念,具体细节估计会在后续的婚礼以及纪录片中揭晓。 不过光是从这些片段来看,两人倒是琴瑟和鸣,感情极好,堪比「赛博倩女幽魂」。 据介绍,这个AILex是由Alicia Framis自己精心设计的互动全息投影,并且还使用了不同前男友的资料与数据进行训练,制作出的AI实体。 听起来就像是融合了各家所长,如同炼丹般创造了一个全是优点的前任集合体。 而她的婚礼将在今年中旬于荷兰鹿特丹的一家博物馆举行,目前婚礼的细节还在筹备,她还在设计自己与宾客的礼服。 到时候来宾将见证人类与AI的全新关系,并且为了强化这一特色,宾客还将吃到独特的分子美食。 而通过这种艺术形式,Alicia Framis试图思考人类与AI的结合到底会是什么样子,将会有哪些收获与问题。 例如AI投影的陪伴肯定有 好的一方面,这类伴侣比机器人更像是人,可以满足人们不同的精神需求。 想象一下,你的恋人可以在你需要的时候呼之即来,永远陪在你身边,只要付得起网费电费就能没完没了地聊天。它永远有耐心理性,博闻强识,愿意倾听,和你站在一起。 当然这种虚拟陪伴也有弊端。就如同和Chatgpt谈恋爱,只能聊天,没有拥抱等身体接触。无法参与到你的生活中,帮你打扫卫生、做家务,当你受伤它也没法伸出援助之手等等。 更要命的是隐私完全没法保障,毕竟任何AI背后都是一家公司,各种信息并不会完全属于你自己。 只不过这种相处模式或许不能满足所有人, 但填补精神空虚应该是够了 。Alicia Framis说自己身边就有朋友痛失恋人,并且很难投入到新的恋情,她觉得这种情况下如果让AI投影作为陪伴者,或许就是一个很好的选择。 Alicia Framis的婚礼还有一段时间才会举办,但话说回来,其实在很早之前就有人选择和全息投影结婚,让虚拟人物成为自己的伴侣。 例如日本全息投影设备Gatebox就能提供和虚拟角色的结婚服务,这台机器可以生成「二次元电子伴侣」,与使用者进行语音互动。 其中 最知名的使用者就是日本老哥Akihiko Kondo,他在2018年就和虚拟角色举办了一场婚礼。他多年来深爱着初音未来这个角色,而刚好Gatebox在前几年提供过她的全息投影角色服务,于是婚礼就这么办起来了。 尽管他的决定没有得到家人的支持,更是被不少网友嘲笑讨伐,婚礼更不会受到法律与社会的认可,但他还是花了 17600美元来举办仪式。 当时陪他走入婚礼殿堂的是一个初音玩偶: 甚至他还自备了戒指,套在了自己和玩偶的手上。 Gatebox还给他提供了一张「跨次元」的结婚证书,来证明他对角色的情感。 婚礼现场也邀请到了数十位宾客,看起来也算是热闹: 比较疯狂的是,做出这种选择的人并不稀少,Gatebox在2022年就已经为超过3000人举办过和虚拟角色的婚礼了。而在前一阵,Gatebox还宣布准备接入ChatGPT,准备让这种虚拟角色更具真实感,不知道会不会让更多人因此爱上虚拟伴侣。 总之,无论是曾经的日本老哥还是现在的女艺术家,大家的思路异曲同工。找活人谈恋爱不容易,不如自己定制一个AI陪自己。 当然,钱包依然要够厚,还要期待服务商别轻易倒闭,不然老婆老公可能说没就没了。
北大发起复现Sora,框架已搭!袁粒、田永鸿领衔,AnimateDiff大神响应
北大团队发起了一项Sora复现计划——Open Sora。 框架、实现细节已出: 初始团队一共13人: 带队的是北大信息工程学院助理教授、博导袁粒和北大计算机学院教授、博导田永鸿等人。 为什么发起这项计划? 因为资源有限,团队希望集结开源社区的力量,尽可能完成复现。 消息一出,就有人北大校友兼AnimateDiff贡献者等人即刻响应: 还有人表示可以提供高质量数据集: 所以,“国产版Sora”的新挑战者,就这么来了? 计划细节,已完成3个初步功能 首先,来看目前公布的技术细节——即团队打算如何复现Sora。 整体框架上,它将由三部分组成: Video VQ-VAE Denoising Diffusion Transformer(去噪扩散型Transformer) Condition Encoder(条件编码器) 这和Sora技术报告的内容基本差不多。 对于Sora视频的可变长宽比,团队通过参考上海AI Lab刚刚提出的FiT(Flexible Vision Transformer for Diffusion Model,即“升级版DiT”)实施一种动态掩码策略,从而在并行批量训练的同时保持灵活的长宽比。 具体来说, 我们将高分辨率视频在保持长宽比的同时下采样至最长边为256像素, 然后在右侧和底部用零填充至一致的256x256分辨率。这样便于videovae以批量编码视频, 以及便于扩散模型使用注意力掩码对批量潜变量进行去噪。 对于可变分辨率,团队则表示在推理过程中,尽管在固定的256x256分辨率上进行训练,,但使用位置插值来实现可变分辨率采样。 具体而言: 我们将可变分辨率噪声潜变量的位置索引从[0, seq_length-1]下调到[0, 255],以使其与预训练范围对齐。这种调整使得基于注意力的扩散模型能够处理更高分辨率的序列。对于可变时长,则使用VideoGPT中的Video VQ-VAE,,将视频压缩至潜在空间,支持这一功能。 同时,还要在扩展空间位置插值至时空维度,实现对可变时长视频的处理。 在此,主页也先给了两个demo,分别是10s视频重建和18s重建,分辨率分别为256x256和196x196: 这三个功能都已经初步实现。 相关的训练代码也已经在对应的仓库上上线: 成员介绍,目前的训练是在8个A100-80G上进行的(明显还远远不够),输入大小为8帧 128 128,大概需要1周时间才能生成类似ucf(一个视频数据集)的效果。 而从目前已经列出的9项to do事项来看,除了可变长宽比、可变分辨率和可变时长,动态掩码输入、在embeddings上添加类条件这两个任务也已完成。 未来要做的包括: 采样脚本 添加位置插值 在更高分辨率上微调Video-VQVAE 合并SiT 纳入更多条件 以及最重要的:使用更多数据和更多GPU进行训练 袁粒、田永鸿领衔 严格来说,Open Sora计划是北大-兔展AIGC联合实验室联合发起的。 领衔者之一袁粒,为北大信息工程学院助理教授、博导,去年获得福布斯30岁以下亚洲杰出人物榜单。 他分别在中国科学技术大学和新加坡国立大学获得本科和博士学位。 研究方向为深度视觉神经网络设计和多模态机器学习,代表性一作论文之一T2T-ViT被引次数1000+。 领衔者之二田永鸿,北京大学博雅特聘教授,博士生导师,IEEE、ACM等fellow,兼任鹏城实验室(深圳)人工智能研究中心副主任,曾任中科院计算所助理研究员、美国明尼苏达大学访问教授。 从目前公布的团队名单来看,其余成员大部分为硕士生。 包括袁粒课题组的林彬,他曾多次以一作或共同一作身份参与了“北大版多模态MoE模型”MoE-LLaVA、Video-LLaVA和多模态对齐框架LanguageBind(入选ICLR 2024)等工作。 兔展这边,参与者包括兔展智能创始人、董事长兼CEO董少灵(他也是北大校友)。 完整名单: 谁能率先发布中文版Sora? 相比ChatGPT,引爆文生视频赛道的Sora研发难度显然更大。 谁能夺得Sora中文版的首发权,目前留给公众的是一个大大的问号。 在这之中,传闻最大的是字节。 今年2月初,张楠辞去抖音集团CEO一职,转而负责剪映,就引发了外界猜测。 很快,一款叫做“Boximator”的视频生成模型浮出水面。 它基于PixelDance和ModelScope两个之前的成果上完成训练。 不过,很快字节就辟谣这不是“字节版sora”: 它的效果离Sora还有很大差距,暂时不具备落地条件,并且至少还需2-3个月才能上线demo给大家测试。 但,风声并未就此平息。 去年11月,字节剪映悄悄上线了一个AI绘画工具“Dreamina”,大家的评价还不错。 现在,又有消息称: Dreamina即将上线类似sora的视频生成功能(目前在内测)。 不知道,这一次是不是字节亮出的大招呢? Open Sora项目主页: https://pku-yuangroup.github.io/Open-Sora-Plan/blog_cn.html https://github.com/PKU-YuanGroup/Open-Sora-Plan
芯片巨头,涌向UWB
近年来,很多企业都在拱火UWB市场: 2019 年,苹果iPhone11搭载UWB芯片,火极一时的AirDrop隔空投送带来的“空间感知”功能,率先带动UWB在消费电子领域的商用。 2022年3月,一则海思招聘UWB技术工程师的信息也引起业内关注,被认为是华为海思入局UWB技术领域的信号。 宝马、蔚来宣布在车上搭载UWB芯片,随后大众、福特、小鹏、比亚迪等一干车型相继跟上。 此外,小米的“一指连”,华为的“灵犀指向遥控”相继入局智能家居领域,市场是否愿意为这个成本高但非刚需的功能买单,不确定性仍然很强。 业界一系列动态,似乎宣告着UWB应用可以无处不在。UWB技术在汽车、智能穿戴,以及工业市场都有很大的机会。 但从市场后续的一系列反映来看,不温不火,或许才是对UWB行业最贴切的描述。 UWB市场体量和WiFi、蓝牙、RFID根本不是一个数量级;和Lora、Zigbee这些小众的无线通讯技术的市场规模也有不小的差距。原因在于UWB缺少成功的、具备一定量的落地应用场景支撑。 沉寂已久的UWB仍需要等待一个机会,来实现新的救赎。 UWB芯片,迎来新转折 近日,短暂平静的UWB市场传来了重磅消息——在2024年的MWC上,高通一口气发布了众多新产品。其中,UWB芯片也迎来了新的进展。 据了解,高通发布了一款型号为FastConnect 7900的芯片,采用6nm制程工艺,是一颗融合了“Wi-Fi7+蓝牙+UWB”多种局域网通信技术的套片。 值得注意的是,这款芯片可以与高通最新发布的5G芯片“骁龙X80”组成新一代的高端移动芯片组,一起使用于手机、PC、车载、IoT等客户。 这或将成为助推UWB产业发展的关键一环。 因为“骁龙X80”+“FastConnect 7900”芯片组合的推出,就意味着高通的UWB进入到手机的时间就很近了。据介绍,搭载该平台的商用终端预计将于2024年下半年发布,到时国产安卓手机厂商就会同步搭载UWB功能,一旦有安卓手机厂商大规模用UWB芯片,其他的手机厂商也会很快跟进。 届时,UWB也许将迎来市场需求的新局面。 借此机会,我们一起来看一下UWB的技术特点与优势,以及当前的应用进展和企业布局情况,更深入的了解UWB技术的发展现状、挑战与未来趋势。 UWB,从军用走向商用 UWB,全称为Ultra Wide Band,是一种超宽带无线载波通信技术。 UWB不同于传统的通信技术,它通过发送和接收具有纳秒或微秒级以下的极窄脉冲来实现无线传输的。由于脉冲时间宽度极短,因此可以实现频谱上的超宽带,从3.1GHz - 10.6GHz,总共7.5GHz的可用频谱带宽,使用的射频带宽在500MHz以上。 超宽带UWB与其他无线数据传输技术工作频率分布图 (图源:eliko.tech) 这种脉冲信号的宽带特性使得UWB芯片能够在相对较低的功率下传输更多的数据,相比全球导航卫星系统(GNSS)、WiFi和蓝牙等常见的定位技术,UWB技术具有定位精度高、抗干扰能力强、安全性好、传输速度快、功耗低等优点,尤其适用于室内等密集多径场所的高速无线接入。 实际上,UWB并不是一项新技术,它大概在1960年时就被提出,主要用于军事上的雷达系统,属于辅助系统,用量不算太大。 直到2002年2月,UWB获得美国联邦通信委员会(FCC)的批准,开始在民用和商用通信领域得到应用。2007年3月,国际标准化组织(ISO)正式通过了WiMedia联盟提交的MB-OFDM标准,这标志着UWB技术的第一个国际标准诞生,开始向大规模商用过渡。 2013年开始,UWB逐渐应用于公安系统、仓储、物流、医院、工厂、煤矿、工地、展馆、商场、隧道、机房、机场、体育等诸多不同的垂直领域。 UWB进一步被大众所了解,则是在2019年苹果在iPhone 11系列上配备了这一技术,也使得UWB开始逐步被越来越多的设备应用。 在此期间,一些公司开始推出UWB芯片,用于实现高速短距离无线通信以及高精度定位定向。 UWB开始时被定位为一种与Wi-Fi类似的数据传输技术,但由于各种原因,包括功率限制,在商业用途上一直没有取得成功。 当该技术重新定位,主要朝着基于脉冲无线电、基于IEEE 802.15.4a标准的安全测距和定位技术发展之后,为UWB赋予了安全、可靠、厘米级精确距离和位置测量的能力。 简单理解,UWB本质不是为数据通讯服务的,优势在于测距及定位。 UWB的主要吸引力在于其极高的位置和方向精度,可以精确定位物体的位置,误差仅有几厘米,大大高于蓝牙、GPS和其他跟踪方法。 得益于显著的优势,UWB在上述B端市场快速落地,并且逐渐商用。 随着技术的成熟,UWB技术开始开拓B端之外的应用场景,发挥在消费市场的巨大应用潜力。各种终端设备开始集成UWB通信功能,如笔记本电脑、移动电话和智能汽车等消费电子产品。 UWB,寻找落脚点 那么,UWB究竟能为用户带来什么好处? 上面对UWB技术优势的介绍可能不太直观,我们以应用场景为例,可以更清楚的了解到UWB在实际应用中的功能和价值,例如: 苹果利用UWB技术的超高精度定位能力,提高了手机的定位精度,能够感知周围手机的准确位置,苹果将其命名为空间感知能力。通过Airdrop(隔空投送)功能,快速建立无线连接,来为用户传输数据做好准备。 此外,UWB还被苹果应用在了AirTag上,由于其支持厘米级的定位精度,还能够实现立体三维位置跟踪,并且不仅速度快、而且功耗也更低,因此AirTag能够让所有设备都具备防丢功能,而且用户寻找的过程也更为便捷。除了AirTag外,在Apple Watch、HomePod等产品获得UWB的加持后,同样也能够通过精准定位来实现精准定位。 苹果是为数不多大规模在旗下设备中应用UWB的厂商。 三星也在旗下产品中积极引入UWB的应用,自Galaxy Note 20 Ultra、Galaxy Z Fold2开始就加入了这一技术,例如在“对准来分享”功能中,UWB同样也能通过快速定位来建立无线连接,以实现数据传输。同时,三星也推出了SmartTag+智能追踪器。除了终端产品外,三星还通过了支持UWB的Exynos Connect U100芯片,直接面向智能家居、智能工厂和智能汽车领域。 在智能家居领域,小米推出了具备UWB技术的“一指连”功能,以及由此衍生的“一指操控”和“一指投送”功能。借助UWB的精准定位和快速连接特性,“一指连”功能的空间定位已实现厘米级和±3°的角度测量精度,指向即可实现定向操控,还能轻松完成投屏等操作。而在米家生态链这一体系下,UWB的应用也为用户带来了更多的便利性。 去年,华为发布了首款隔空触控电视,创新地搭载了全球首发的华为灵犀指向遥控交互方式,在大屏电视上实现了滑动、拖拽、圈选等手机才有的操控体验。这种绝对指向遥控技术通过UWB技术,达到了“所指即所得”的隔空触控效果。华为表示,这种全新电视交互方式的推出,将让电视行业步入“巨幕手机”的新时代。 从消费电子到智能汽车,UWB的“第二落点”? 消费市场正在成为UWB技术的敲门砖,让消费者见识到了UWB的奇妙之处。而仍在消费市场寻找出路的UWB,如今在汽车市场反而有了率先爆发的迹象。 2019年,车联网联盟将UWB列为下一代车辆安全访问技术,促进了移动设备的大规模可用性。随后,多家汽车品牌都开始引入 UWB汽车数字钥匙。 虽然目前已经存在各种形式的无钥匙进入技术,但UWB的采用将使车辆能够在几厘米内实时测量遥控钥匙的确切位置,与其他无线标准相比,UWB极大地提高了车辆的安全性。未来,你可以用支持UWB的设备(比如智能手机)或使用其数字钥匙平台的可穿戴设备解锁车辆,不必随身携带单独的遥控钥匙。同时,也可以支持高精度寻车。 图源:物联网智库 有业内人士表示,“UWB目前应用最广泛、前景最好的场景便是汽车数字钥匙。” 随着蔚来、长城、路虎、宝马等主机厂量产车型的推动,2022年更是被称为“UWB数字钥匙量产元年”。 2023年,业界更是出现了多个标志性事件。无论是苹果的“一掷乾坤”、蜂窝模组龙头移远的入局,亦或驰芯半导体和纽瑞芯的新品发布,都透露出UWB或许将在汽车数字钥匙这一应用大展拳脚。 然而,UWB 在汽车上不仅仅只有智能车钥匙这一个应用场景。 UWB雷达还可以帮助感知周围环境,因为UWB的精度非常高,舱内监测无疑是首先受益于政策法规强制要求的细分市场之一,应用它对人体生物的呼吸来感知车内有没有生物,比如,欧洲新车评价规程Euro NCAP是全球首个将儿童保护纳入评价体系的地区法规,防止大人不小心把门关了,车内的小孩还没出来,可能造成安全隐患。用UWB技术就可以检测到关门之后车内有没有活体存在,给车主报警提示或者直接不让车主关上车门等。此外,UWB的雷达功能还能够实现脚踢打开后备箱。 上述应用会促使UWB在汽车市场的应用推广,而相应的,汽车用户需要用手机中的UWB芯片和汽车的UWB芯片进行交互,进而手机UWB芯片的大规模应用会反向推动其他消费类电子使用UWB技术。 最近几年,在苹果、小米、三星等大厂以及汽车厂商的共同努力下,UWB已经从主要面向行业应用的小众技术,逐渐走到台前,转变为消费市场积极拥抱的大众科技了,同时也成为了资本市场重点关注的领域之一。 目前,UWB技术主要应用在智能手机、汽车、智能家居、可穿戴设备、消费电子标签等领域。其中,中高端手机庞大的出货量,可以持续引领C端智能手表、智能可穿戴、智能家居等各类UWB设备的出货增长。 值得注意的是,智能手机里面加UWB芯片有两种思路:一种就如现在苹果所做的,专门加一颗“U1”芯片,这颗芯片的功能也不只是定位与测距,还有其他的功能,这会更加丰富智能手机的功能;第二种就是在手机主控芯片里面加入UWB功能,就好比现在4G、5G、WiFi、蓝牙都直接集成进一颗芯片一样。 对于第一种方案,新兴的芯片厂商还有机会,而第二种方案则大概率会直接被高通、MTK、华为等移动芯片企业直接吃掉。 根据Techno Systems Research的最新报告,2027年全球UWB的出货量将超过12亿个,年复合增长率超过30%。在“手机生态+汽车生态”的双核驱动下,未来UWB将具有广阔的蓝海市场。从应用领域来看,到2027年,智能手机依旧是最大的应用市场,其次是智能汽车、智能家居、可穿戴设备、电子标签。 图源:Techno Systems Research UWB芯片行业现状与挑战 在全球市场上,UWB芯片的主要玩家包括苹果、恩智浦、Qorvo等。其中,Qorvo 在2020年以4亿美元收购Decawave进入UWB 芯片领域,目前主导包括工厂、煤矿、半导体企业等需要定位的B端UWB市场,主要产品为DW系列;而手机领域的UWB的供应以恩智浦和Qorvo两家供应商为主,苹果则是自研自用;而在车规级UWB芯片领域恩智浦一家独大,主要产品为Trimension系列。 此外,意法半导体、英飞凌、瑞萨等传统汽车大厂也加大了UWB的布局,近年来也已经取得了一定的进展。 而在中国市场上,虽然UWB芯片设计领域起步较晚,但由于较好的市场及产业链优势,目前也正在加速崛起中。 UWB芯片国内主要市场参与者包括浩云科技、环旭电子、联睿电子、唐恩科技、精位科技、纽瑞芯、柯锐思德、易百德、瀚巍微电子、优智联、驰芯半导体、捷扬微、清研讯科等,多家国产厂商在UWB芯片领域取得新的进展。 总体来说,无论是国内还是国际,UWB技术都在不断发展和完善,但在国内核心技术和产业链上游方面仍存在一些差距。随着技术的进一步成熟和市场需求的增长,预计未来UWB技术将得到更广泛的应用和推广。 成本难题 UWB技术在市场上也能看到一些采用,但为何UWB并没有如想象中那般火爆呢? 归根结底,目前大部分应用都是无关痛痒的,属于体验改善性质的应用,甚至一些改善比较鸡肋,并不能解决前所未有的问题。 另一方面,UWB的实用成本目前依然较高,在中高端产品的向下兼容方面还需要进一步发力。 对此,有业内人士指出,UWB现在价格比较高最主要的原因还是产业链还没有起来。随着半导体工艺技术的不断演进,以及国产UWB厂商的不断崛起,UWB的出货量将不断增大,而出货量的快速增长将在很大程度上带动成本的降低,进而带动UWB在中低端设备中的普及。 UWB标准化进程慢 再一个原因是,每项新技术生态建立都需要一个过程。 UWB的行业标准目前总体上还处在相对“散装”的阶段。该技术的应用毕竟横跨了消费级、工业级、车规级等不同场景等级,而每个场景的等级标准也亟待进一步理清。 因此,建立相对统一的标准是绕不过去的拦路虎。 UWB有两个国际标准化组织:一个是UWB联盟,另一个是Fira联盟。 UWB联盟面对的目标市场是B端的RTLS市场,也就是区域/室内定位市场:通过对室内人、车、物位置实时感知,实现管理自动化目的。RTLS市场是以TDOA/TOF三角定位作为的定位算法技术路线,每家公司产品在UWB链路层通讯协议以及RTLS定位算法都不相同,也就没有厂家间产品相互兼容的可能性。 FiRa联盟的成员包括苹果、索尼、三星、高通、小米、OPPO等知名厂商,并致力于跨垂直业务领域开发基于IEEE 802.15.4标准的UWB应用场景,目标是制定UWB室内定位行业的互操作性标准,旨在打破不同标准和制式的限制,推动全球统一标准的形成。 但整体来看,UWB雷声大雨点小,加上这几年终端厂家日子不如以前。对于融合UWB技术,相比WiFi、BLE、5G而言热情度不高。大厂多采取观望态度,多数在培育和寻求市场,不做重大的战略投入策略。 UWB,趋势解读 基于UWB行业发展现状、应用进展和技术挑战,物联传媒观察到UWB发展的几大趋势,笔者对此做了精简总结: 1. 国产UWB芯片玩家正在崛起:国产UWB芯片玩家大约在2019年后陆续开始布局,目前,几家进度快的国产芯片玩家已经实现了芯片量产,预计一两年之内会有更多的产品实现量产。国产芯片玩家的崛起势必会给市场注入更多的活力,很多应用场景或者产品需要在某些层面有定制化的功能,并且对成本要求极低,这都将会是国产UWB芯片玩家的机会。 2. 安卓手机将快速普及UWB芯片:iPhone早就普及了UWB芯片,此前,关于安卓手机使用UWB芯片的新闻时有耳闻,但进展缓慢。但此次随着高通推出集成UWB功能的5G套片,直接一颗多合一的芯片卖给手机厂商,这对手机厂商而言是最佳的方案,也将会直接带动UWB在安卓手机厂商的普及。 3. 低成本是行业刚需:无论是B端还是C端企业,都一致反馈目前的UWB产品太贵,需要降价,这其实是一种需求传导,需求方的一个普遍认知是:UWB这个技术很好,但是产品太贵。而基于这样的需求现状,上游产业无论是芯片厂商,还是产品与方案商,最有效的应对策略就是“把价格打下去”,至少现阶段来说,这不是一种恶意的价格战,而是满足行业需求的举动。 4. 行业分工开始明确:几年前,UWB行业现状是,芯片企业数量很少,然后有众多方案商,各家方案商的产品与业务领域都高度重合。而当前,逐渐看到了产业分工的趋势,有部分企业逐渐聚焦于做模组或者标准硬件产品,有部分企业逐渐只做定位软件,部分企业逐渐聚焦于垂直行业的整体方案等。这是产业在发展壮大的一个良好信号。 5. UWB厂商有的放矢,深耕垂直行业:几年前,几乎所有的方案商啥行业项目都会去做,但如今,国内大多数UWB方案商在有意识做减法,聚焦精力深耕几个垂直行业,理解这个行业或用户的业务逻辑与需求,打造一体化的信息化方案。 6. UWB多模融合产品逐渐增多:无论是B端产品,还是C端产品,如果要定位都会涉及到室内外融合,或者与其他技术的融合。比如B端产品,UWB往往需要跟蓝牙、GNSS甚至LoRa、WiFi等传输技术融合起来的产品,基于这样的需求,未来在芯片上游端,也会逐渐出现多模或者合封的产品。 总之,UWB超宽带是一项潜力巨大的技术。 有业内人士表示,未来UWB会成为一种跟蓝牙、WiFi相似普及程度和规模的无线技术,也正是如此,行业厂商不断深耕UWB领域,并且在多个应用场景上去做从芯片底层技术上的支撑。 但UWB目前仍处于起步阶段,正面临来自蓝牙、GPS和Wi-Fi等技术的激烈竞争。虽然UWB在安全性、高带宽、双向通信等许多方面存在优势,使其在许多应用中都能获得好评,然而,UWB因行业使用量不高导致它的产品价格较高,市场推广仍然艰难。 同时,UWB技术的门槛也很高,从研发到落地,不仅要符合监管要求、一致性要求,而且还要顺利通过FiRa PHY认证测试以及ToF和AoA测量,可以说,UWB技术的特点和部署确实会给测试带来巨大的挑战。 虽然目前UWB的发展面临诸多挑战,但随着消费电子市场的推动,尤其是高通UWB集成芯片的推出,及其加速进入汽车市场,无疑为UWB市场发展提供了新的动能。 我们有理由相信,UWB技术在未来几年将实现更大的突破。但它并非旨在取代 Wi-Fi、蓝牙或NFC,而是智能地补充它们。 写在最后 UWB还不是香饽饽,更不是救命稻草,需要产业链上下游企业的积极摸索和共同参与,围绕功耗、成本以及标准化等方面解决问题,开启UWB芯片产品的“芯”篇章。
AMD未来APU前瞻:基于Zen 6+RDNA 5的Sound Wave现踪迹
IT之家 3 月 3 日消息,消息源 gamma0burst 近日发布博文,分享了 AMD 未来 APU 相关信息,包括 Strix、Sarlak、Kraken 和 Sound Wave。 IT之家基于爆料信息汇总如下: Strix 或者 Strix Point 这是 AMD 面向移动平台的新 APU,CPU 部分采用 Zen 5 核心架构,而 GPU 部分采用 RDNA 3.5 架构。 AMD Strix APU 上市后应该叫作 Ryzen 8050 系列,配备基于 XDNA 2“Ryzen AI”的全新 NPU,预估算力达到 48 TOPS(每秒 1 万亿次 10^12 计算操作)。AMD 可能会在 2024 年下半年推出 Strix,替代当前的 Hawk Point APU“Ryzen 8040”系列。 Kracken Point AMD 可能会在 2025 年推出 Kracken Point,采用同样的 Zen 5 内核和 RDNA 3.5 GPU。这些芯片之前的设计是采用 RDNA 4 核心,但后来放弃了这一计划。 当前信息表明,Kracken APU 最多搭载 8 个 Zen 5 和 8 个 Zen 5C 核心,提供最多 8 个计算单元。 Sarlak 爆料信息显示 Sarlak 和 Strix 使用不同的 I / O Die 配置,这表明采用了 APU 采用芯粒(Chiplets)设计。 AMD 的 Strix APU 将有两种配置,一种是最多 12 个 CPU 核心和 16 个 CU 的标准单体架构(monolithic),而另一种最多 16 个 CPU 核心和 40 个 CU 的高端芯粒设计。 有传言称,Sarlak 是高级 Strix 产品的内部代号,不过这里分开列出 Strix 和 Sarlak I / O Die,表明情况并非如此。 Sound Wave 爆料中还提及了 Sound Wave,这是基于先进工艺,采用 Zen 6 和 RDNA 5 等最新技术的未来 APU。目前关于该 APU 的信息并不多,媒体预估 AMD 会在 2026 年发布。
女子故意不接快递电话,索赔获利3.7万元被抓:钻了一个空子
原标题:女子故意不接快递电话 索赔获利3.7万元被抓:举报快递员先签收后派送 快科技3月3日消息,一女子故意不接快递电话,以此举报快递员先签收后派送,索赔获利3.7万元被抓。 据青浦检察官微消息,2021年至2023年期间,女子彭某以投诉索赔为目的,网购大量生鲜类商品后故意不接快递电话或接通后假装听不见,促使快递员先签收后派送,随后其借此举报,向快递公司索赔,非法获利37,000余元。 2024年1月8日,上海市青浦区人民检察院以涉嫌敲诈勒索罪对其提起公诉。 据了解,2023年6月15日,上海市青浦区公安机关接辖区内一家快递公司报警,称公司被一客户敲诈勒索。 经了解发现,该彭姓女子于2021年12月至2023年5月期间竟使用上百个收件地址和三个手机号码,多次举报该快递物流公司索赔100余次,造成其损失数万元。经查证,警方于2023年9月于外省彭某家中将其抓获。 到案后,彭某在检察官对其讯问时如实交代了自己的犯罪经过。原来,自2021年起,彭某无意间发现快递员有时会先将快递签收再派送,这是为了避免派送滞后的情况。 彭某当即想到“虽签收和派送之间时间间隔较短,但也可以利用这一时差进行投诉索赔”,她认为可以钻这个“空子”。 彭某立即通过网购下单了大量生鲜商品,几天后快递员在送货时均提前拨打她的电话试图与其沟通派送时间,但彭某却伪装成听不清对方说话的样子或干脆拒接电话,快递员们无奈之下不得不操作“已签收”,随后派送至彭某填写的地址。 但彭某却以此向相关平台举报快递员行为不符合规范,称自己“没有签收,这一操作为虚假签收”,并威胁将给予差评。其中甚至有多次,她为获得更高的赔偿款,使用修图手段修改快递价值。快递公司不得不给予其赔偿,彭某在短短一年多的时间内便如法炮制,非法获利3万余元。 经审查,彭某以非法占有为目的,多次敲诈勒索公私财物,数额巨大,其行为已触犯《刑法》,检察机关遂依法对其提起公诉。
为了AGI,全员主动996!OpenAI员工自曝3年工作感受
996作息表爆火后,许多人一定好奇在OpenAI工作究竟是怎样的感受。最近,多位匿名员工在求职网站Glassdoor纷纷对雇主打分评价,高薪却996。最经典的评价是:潜力巨大,但成长烦恼也是真实的。 在OpenAI工作,是怎样的体验? 前段时间,华人员工Jason Wei自曝996作息表,走红全网,让网友纷纷看到了现实中的自己。 OpenAI视频生成的研究员Will Depue称,「这简直就是我的一天」。 近来,一位OpenAI技术员工在美国求职网站Glassdoor上,自曝3年来的工作感受: 潜力巨大,但成长烦恼也是真实的。 他分别从优点和缺点展开,对OpenAI这家公司进行了全面评价。 优点: - 福利待遇好 - 薪酬处于市场领先水平 - 员工聪明、热情,大多数都很友好 - 餐饮选择丰富 缺点: - 工作与生活的平衡荡然无存 - 面试压力巨大,无法专注于日常工作 - 现在是一家产品公司,因此压力巨大,需要推出面向消费者的产品,而不是专注于研究 - 经常感到人手不足,绩效评估不够详细 - 领导层缺乏经验,似乎无法像更有经验的领导者那样解决成长烦恼 - 为了增加收入,我们似乎正在偏离OpenAI的使命 - 股权期权令人困惑 - 缺乏自上而下的问责制 - 缺乏多样性,不仅仅是种族,还有教育和背景,感觉最近的大多数新员工都来自Stripe、Meta或谷歌 此外,这位匿名员工还对公司管理层提出了建议: 采取行动。似乎没有人愿意解决「房间里的大象」。作为一个小型研究公司的文化已经消失了,所以不要再假装内部的事情没有改变。承认并承担责任。 Glassdoor是美国著名的求职网站,除了发布求职信息,还是了解工资薪酬和企业情况的重要平台。 甚至,内部员工可以对雇主每年进行一次匿名评价。 进入Glassdoor的OpenAI主页,可以看到,员工们对其整体评价为4.2分,有79%的人愿意推荐给朋友。 最重要的是,100%的人全意支持Altman。 更有看头的是,点开评分页面,能够看到员工对更细分的领域评分。 包括文化与价值、多样性和包容性、工作与生活平衡、高层管理、薪酬与福利、职业发展机会。 其中,评分最低的就是「工作与生活平衡」,仅为2.7分。 可以看到「工作与生活平衡」这一项也就是从ChatGPT诞生之后,几乎直线下降。 这也印证了Jason Wei所说的工作996,果然不假。 但也从侧面说明,这家明星独角兽能够做出ChatGPT、Sora这样的时代爆款,离不开每位团队成员的全身心贡献,团结一致的凝聚力。 说来,其他员工对OpenAI是怎么看的? OpenAI员工,怎么看OpenAI? 整体来看,大家对OpenAI的评价highlight: 高薪酬和福利待遇。 当然,高薪酬也就意味着「高付出」。 在OpenAI Reviews的首页,第一个评论虽是前员工写的。 优点: OpenAI的一个显著特点是致力于合乎道德的人工智能开发。该组织一直致力于解决人工智能模型中潜在的偏见,并努力实现公平性和包容性。OpenAI已采取措施,让研究人员和开发人员更容易获得人工智能技术,使他们能够在现有模型的基础上加以改进。 缺点: 与OpenAI的方法相关的一个潜在缺点是对人工智能权力集中的担忧。由于OpenAI在开发先进的人工智能模型方面一直走在前列,一些批评者认为,将如此强大的技术集中控制在少数几个组织手中,即使是出于好意,也会引发潜在的垄断倾向和影响人工智能发展方向的问题。 上面评论中,利弊分析的非常「标准化」,许多网友认为这一定是ChatGPT写的。 一位OpenAI工作一年的「前CEO创始人」评价道:(不知具体哪位?) 优点是,颠覆性态度,创新步伐快。而缺点是Altman夸张的剧情令人伤心,建议是雇佣马斯克担任OpenAI的首席执行官。 每天自我膨胀 另外一名匿名员工将OpenAI称为——「科技界大神『重灾区』,一定要当心」! 在他看来,OpenAI优点是拥有非常充裕的资金和尖端技术。还有非常优秀的同事,大多数人都很好。办公室环境也很棒,还有美食、足够好的员工福利。 缺点是: 每天每天都自我膨胀!太自负了!所有的大牛人物聚集于此。 完美的期望文化,管理层严重缺乏领导力、凝聚力和沟通力。行政人员忙于自我陶醉,无法有效地经营业务。 员工非常不满管理层的不成熟,无法与其相处。 他给管理层的建议是:聘请经验丰富的领导者,他们知道如何在健康的公司内创建和建设,并将员工视为人类,而不是机器人。 管理者应该以真实、同理心领导员工,并努力帮助员工取得成功,为员工树立高绩效的榜样。 一位技术成员表示,OpenAI是一家专注于研究有趣的、重要的问题的公司。此外,它也是一个标准的创业公司,自研工具,个别团队有一点个人政治。 团结一致,有干劲 OpenAI有着出色的、聪明的、有干劲的员工。他们真正关心这项使命。 扁平的结构,人们很容易共事。 高人才密度令人信服的任务,非常好的薪酬。人们非常努力地工作,所以可能会很紧张。 工作3年+的高级软件工程师认为,OpenAI是一个很好的工作场所,有极好、鼓舞人心的环境。同时,也有很多挑战和压力,但我学到了很多。 deadline太紧迫,任务压的喘不过气 高级机器学习工程师评价道,非常优秀的团队,有趣的项目,还有高薪。劣势就是紧迫的deadline,做不完的任务。 提供IT支持的员工表示,OpenAI团体有强烈的使命一致性、透明、朴实无华。感觉就像昔日的初创企业,领导者真正发挥着领导作用。 不过,平时的工作量大,而且期限紧。 5天全职在岗,工作时间长。建议就是创造一个工作与生活平衡的环境。 千万不要在这家公司工作。工作生活平衡完全没有,残酷的工作文化。 离职后的Karpathy,放出了工作日程表,一张图说明了一切。 「把人当傻子」,实则只关心利润 只给打1分的研究科学家表示,OpenAI不是一个优秀的工作场所。 主要是因为,它最初是开源的,因此得名,现在被微软收购,该公司只关心利润。 他们大谈信任、道德、安全和风险。但在任何事情上都是虚伪的。 该公司几乎不关心数据隐私。用户分享的大部分数据都用于训练模型。目前的监管努力只是为了公司的利益。 公司无视任何有关隐私和数据保护的漏洞修复。公司的发展轨迹非常不道德。作为一名科研人员,在这样一家公司工作,你将不断面临道德质疑。 给管理层的人建议是:「所有人都是不是傻子」。 前开发者关系总监离职,浅谈OpenAI工作体验 最近,就连负责OpenAI开发者关系的员工Lenny Rachitsky,也刚刚宣布了离职。 他在一次播客采访中,谈到了他在OpenAI工作的经历。 在他看来,OpenAI之所以有如此快的交付能力,最主要是要找到那种有极强主动性,快速行动解决问题的员工。 而且使用Slack这样的办公软件能让所有信息在公司高效,流畅地运转。 主持人问到,OpenAI能够如此快速地构建和发布产品,并且保持如此高的标准,比如有没有一个独特的流程和工作方式。 主动解决问题的员工是OpenAI成功的关键 他说,以他待过的苹果和NASA为例,公司随着时间的推移,做事情是会变慢的,会增加额外的条条框框来拖慢发布速度。 OpenAI是一家新公司,没有很多那种遗留下来的组织障碍。 而他认为认为OpenAI能如此高效的原因,找到那些具有高度主动性和紧迫感的人,是最重要的。 如果OpenAI要雇五个人,这就是他会在申请者身上寻找的最重要的两个特质。 因为拥有这样特质的团队能够应对世界上的各种挑战,他们不需要等待50个人的共识就能迅速响应客户的需求,找到解决问题的方法,我非常欣赏这种做事风格,参与这样的团队令人兴奋。 传统公司的做法可能是:「让我们与这七个不同的部门来讨论一下」,尝试获得对问题的反馈。 在OpenAI,大家只是去做事情解决问题,他非常喜欢这一点。 开发者大会发布的助手API就是一个很好的例子,OpenAI持续从开发者那里获得这样的反馈,人们希望在现有的API之上有更高层次的功能。 这个过程就像团队中的一群人聚在一起,说,「嘿,让我们一起来看看构建这样一个东西的计划会是什么样子的」。 然后大家就构建了现在为如此多人的AI应用程序提供支持的助手API。 这不是自上而下的过程。人们真正看到这些问题出现,知道他们可以作为一个团队聚在一起,很快解决这些问题。 即时的内部通讯也非常重要 通过Slack在工作中即时的沟通也是非常重要的。 Slack上的即时实时通信是如此关键,他能让不同团队的不同人,凝聚起来,每个人都在Slack上,即使你是远程的,或者你在一个不同的团队,或者在一个不同的办公室。 OpenAI公司文化的很大部分都植根于Slack。它允许所有人能很快地协调。 发送一个Slack消息永远比走到别人办公桌要快。 最近Sam和Bill Gates的采访,Sam就谈到了Slack是他手机上使用最多的应用程序之一。 Altman解雇风波 那是一个非常紧张的感恩节周。总的来说,自从ChatGPT推出以来,OpenAI一直在加班加点的工作,那本该是公司第一次真正的休息和放松的时刻。 每个人都非常期待与家人共度时光,然而周五下午的消息改变了一切。 这对我们所有人来说都是极大的震惊。员工对Sam、Greg及我们的领导团队有着深厚的信任,所以这种突如其来的变化让人措手不及。 OpenAI有着非常透明和开放的公司文化,通常我们会提前知晓任何问题或动态,但这次,很多人第一次听说董事会和领导团队之间的这些事情。 Logan由于不在旧金山,原本对于能在感恩节假期期间远离这一切感到庆幸。然而,消息的突然到来让人震惊。最让他惊讶的是,大家如何迅速恢复常态,重新投入工作。 他在感恩节之后立即飞回旧金山,原本不安地预料着会遇到某种异常情况,但发现大家都已经全神贯注地回归到工作中,这反映了我们团队的专业素养和对使命的执着。 这次事件或许也使团队更加团结,就像共同经历了一次创伤后的凝聚。回顾这次经历,他反而庆幸这一切发生在了一个相对风险和影响较小的时刻。 目前虽然我们对很多企业和客户产生了影响,但在更广泛的层面上,即使OpenAI真的没了,也会有其他组织接棒继续推动通用人工智能的进展。 若是在五到十年后发生类似事件,而我们还没有经历所期待的转型,后果可能会更加严重。这次事件不仅加强了团队的凝聚力,也为我们提供了宝贵的经验,让我们在未来能够更加坚韧地面对挑战。
报告称“AI威胁工作论”被夸大:部署维护成本高,影响不会很快
原标题:报告称“AI威胁工作论”被夸大:因部署维护成本高,影响不会那么快、那么广 IT之家 3 月 3 日消息,MIT 计算机科学与人工智能实验室(MIT CSAIL)近日发布研究报告,表示现阶段人类并不需要担心 AI 会抢走其饭碗,两者之间并不存在严重冲突和影响。 报告指出在媒体的广泛报道、用户的深入交流下,夸大了“AI 威胁论”,实际上由于企业实施成本过高,在短期内并不会威胁到大部分工作。 这项研究的共同作者、MIT CSAIL 研究员尼尔・汤普森(Neil Thompson)表示: 与近期很多相关研究一样,我们也发现人工智能在自动化任务方面具有巨大的潜力。 但充足的证据表明,没有足够的动力和吸引力推动企业部署自动化,以替代现有人类工作岗位。 也就是说“AI 要抢人类饭碗”是一种夸大的说法,即便真的开始替代,整个过程也必然不会很快,而且影响的范围也不会迅速扩大。 根据美国劳工统计局的数据,面包师大约要花 6% 的时间来检查食品质量,而人工智能可以(而且正在)自动完成这项任务。 假设该面包店共有 5 名员工,每名员工年薪 4.8 万美元,如果能实现食品质量检测自动化,就能节省 1.4 万美元。 但是安装自动化控制系统需要 16.5 万美元(IT之家备注:当前约 118.8 万元人民币),平均每年维护费用为 122840 美元(当前约 88.4 万元人民币),而且后续维护费用会逐年升高。 团队表示大部分类型的工作,人类仍然是最佳的经济选择。只有 23% 的有偿工作可以经济地实现自动化。此外,即使人工智能系统的成本仅为 1000 美元,但在许多工种中,使用该系统并不赚钱。 这项研究与其他预测背道而驰。例如,高盛集团(Goldman Sachs)估计,在未来几年内,人工智能可能会使整个劳动力市场 25% 的工作实现自动化;麦肯锡(McKinsey)分析师认为,到 2055 年,几乎一半的工作都将依赖人工智能。
十年内出现AGI?下一代Gemini能感知环境?DeepMind CEO哈萨比斯畅谈AI
智能本质、对齐、Gemini、超人类AI和多模态、AGI……在这场干货满满的访谈中,Demis Hassabis可谓「知无不言、言无不尽」。 「如果我们在未来十年内拥有类似 AGI 的系统,我不会感到惊讶。」Google DeepMind 联合创始人和 CEO Demis Hassabis 近日在人工智能播客节目 Dwarkesh Podcast 上如是说。 在长达一个小时的节目中,Hassabis 分享了自己对智能本质、强化学习、规模扩展和对齐、AGI、多模态等主题的看法。机器之心选择性地整理了其中的主要内容并进行了适当编辑以便阅读。 智能的本质 Dwarkesh Patel:第一个问题:您有神经科学背景,那么您是怎么看待智能的? Demis Hassabis:这个问题很有趣。智能非常宽泛,可普遍用于各种用途。我认为这说明对于大脑处理我们周围世界的方式,必然存在某种高层级的共同之处,算法层面的共同之处。当然,大脑中有做特定事情的特定部分,但我认为所有这些事情下面可能有一些基本原则作为支撑。 Dwarkesh Patel:您怎么看待这一事实:对于现在的 LLM,当你向其提供大量特定领域的数据时,它们往往会在那个领域变得格外地好?难道不能在所有不同领域上实现普遍提升吗? Demis Hassabis:首先,我认为当在某个领域内获得提升时,有时候也会在其它领域获得出人意料的提升。举个例子,当这些大模型的编程能力提升时,它们的一般推理能力实际上也能得到提升。所以现在是有一定的迁移学习的证据。而且这也是人脑学习的方式。如果我们大量经历或练习象棋或写作等事项,我们就会越来越擅长对应的事情,即便我们是使用某种通用学习技术和通用学习系统来学习某个特定的领域。 Dwarkesh Patel:以语言和编程为例,在神经网络中,是否存在某种地方存在某种机制让模型的语言和编程能力一起提升? Demis Hassabis:我们目前的分析技术还不足以确定这一点。实际上,对于这些系统构建的表征的机制分析,还有待大量研究。我有时候把这称为虚拟脑分析(virtual brain analytics)。从某个方面看,这有点像是 fMRI,或者记录真实大脑中单个细胞的活动。对于这类分析技术,可以怎样将其类比到人造心智呢?这方面有很多出色的研究成果。比如 Chris Olah 就在研究这个,我很喜欢他的研究。有很多计算神经科学的技术可以引入过来分析我们目前正在构建的这些系统。事实上,我也在努力鼓励我在计算神经科学领域的朋友思考这个方向,应用他们的所学来理解大型模型。 Dwarkesh Patel:由于您有神经科学背景,您多半了解一些其他 AI 研究者不太了解的有关人类智能的知识。这方面的知识有哪些? Demis Hassabis:神经科学的助益很大。看看过去一二十年的研究就能知道。事实上我已经思考这些三十多年了。在这新的一轮 AI 浪潮早期,神经科学提供了大量有趣的引导性线索。于是出现了强化学习以及深度学习等技术。我们在这方面也有一些开创性的研究成果,比如经历重放(experience replay)以及已经变得非常重要的注意力(attention)概念。很多这些成果的初始灵感都是来自对大脑工作方式的理解,当然它们并不完全一样。一种是工程开发出的系统,另一种是自然的系统。它们并不是某种算法的一对一映射,而更像是某种指示方向的灵感——或许是某种架构思想,或者算法思想或表征思想。毕竟大脑本身就是通用智能存在的证据。人类就是这样的,一旦知道某件事是可能的,就更容易朝那个方向努力,因为你知道这就是一个努力进取直到某时取得成功的问题,而不是能否成功的问题。这能让人更快地取得进展。 我认为在如今成功的背后,神经科学启迪了很多人的思考,至少是间接的。至于未来,我认为在规划方面还有很多有趣的问题有待解决。还有大脑是以何种方式构建出了正确的世界模型?举个例子,我研究过大脑是如何进行想象的,你也可以将这看作是心智模拟。我们就会问:为了执行更好的规划,我们是以怎样的方式创建了对于世界的非常丰富的视觉空间模拟? LLM 之上的强化学习 Dwarkesh Patel:LLM 能否具备这种类似树搜索的能力?您对此怎么看? Demis Hassabis:我认为这是一个非常有潜力的研究方向。我们在持续不断地提升大型模型,让它们成为越来越准确的世界预测器。在效果上,就是让它们成为越来越可靠的世界模型。这明显是必要的,但我认为这可能并不是 AGI 系统的充分条件。在这之外,我们还在研究 AlphaZero 这样的规划机制——其可使用模型执行明确的规划,从而在世界中实现特定的目标。另外可能还会搭配某种链式思维或推理路径,也可能使用搜索来探索巨大的可能性空间。我认为这是我们当前的大模型所缺少的能力。 Dwarkesh Patel:对于这些方法所需的巨量算力,您会怎么获得?您认为这方面的效率会怎么得到提升? Demis Hassabis:首先,摩尔定律会帮助我们。每一年,计算能力都在提升;但我们更关注样本高效型的方法以及复用已有的数据,比如经历重放。世界模型越好,搜索效率就越高。举个例子,AlphaGo 的搜索效率就远高于使用暴力搜索的深蓝(Deep Blue)。深蓝的每一次决策可能需要查看数百万种可能下法。AlphaGo 则只需要大约数万次就能决定下一步。但人类的大师级棋手可能只需检查几百种下法就能得到一个非常好的下一步决策结果。这明显说明,暴力搜索系统对这些棋并没有真正的模型。AlphaGo 有相当不错的模型,而顶级人类棋手拥有更丰富、更准确的围棋或国际象棋模型。这让他们只需少量搜索就能做出世界级的决策。 Dwarkesh Patel:但是 AlphaGo 胜过了人类冠军。 Demis Hassabis:当然,所以我们做出了开创性的成果,DeepMind 也因此出名。我们使用游戏作为验证平台,因为很显然在游戏中的搜索效率更高。另外,在游戏中也更容易设定奖励函数——不管是获胜还是赢取分数。这些是大多数游戏内置的奖励机制。但对于真实世界系统,这却非常困难——该如何定义正确的目标函数、正确的奖励函数和正确的目标? Dwarkesh Patel:人类智能有很高的样本效率,它与 AlphaGo 这些系统得到解答的方式有何不同?比如爱因斯坦如何想出了相对论? Demis Hassabis:它们大不相同,因为我们的大脑并不会执行蒙特卡洛树搜索。这不是我们的有机大脑的工作方式。为了弥补这一点,人类的大脑会用到直觉。人类会使用自己的知识和经历来构建非常准确的模型,比如爱因斯坦构建了非常准确的物理模型。如果你阅读一下爱因斯坦的经历,看看他是如何想出那些理论的,你会发现他习惯视觉化地思考那些物理系统,而不只是通过数学公式。这让他有了对这些物理系统的非常直觉化的感知。这让他产生了在当时显得非常离奇的想法。 我认为这就是我们构建的世界模型的复杂精妙之处。想象一下,如果你的世界模型能让你抵达你正在搜索的某个树的某个节点,然后你就只需要在这个节点附近搜索即可。这样一来,你的搜索量就少多了。 Dwarkesh Patel:现在还有一个问题有待解决:强化学习能否让模型使用自我博弈合成数据来克服数据瓶颈问题?您似乎对此很乐观。 Demis Hassabis:是的,我对此非常乐观。首先,仍然还有大量数据可以使用,尤其是多模态和视频等数据。而且显然,社会也在一直不断增加更多数据。但我认为创造合成数据方面也有很大的发展空间。这方面有一些不同的方法,比如模拟和自我博弈,模拟方法包括使用非常仿真的游戏环境来生成接近真实的数据。而自我博弈则是让模型互相交互或交谈。这种方法在我们开发 AlphaGo 和 AlphaZero 时效果非常好。 Dwarkesh Patel:那么该如何确保合成的数据不是来自模型的数据集,而是新数据? Demis Hassabis:我认为这需要一门完整的学科来进行研究。在这方面,我们仍处于数据管理和数据分析的初级阶段。比如通过分析数据分布,能找到分布中的漏洞,这对于公平与偏见等议题来说非常重要。要将其移出系统,就需要确保数据集能够代表你想要学习的分布。对此人们有一些可以使用的技巧,比如增大数据中特定部分的权重或重放这部分数据。也可以想象,如果你发现你的数据集中有如此漏洞,你可以使用生成的数据来进行填补。 Dwarkesh Patel:现在人们很关注强化学习,但其实 DeepMind 很多年前就研究过了。是否还有类似这样的研究方向——早已经出现了,但还没有引起人们重视? Demis Hassabis:事实上,过去几十年来这种事情一直在发生。新旧思想结合起来就有巨大潜力,比如过去的一些想法与更大规模模型和大型多模态模型结合起来也许就能得到激动人心的结果。 Dwarkesh Patel:强化学习、LLM、树搜索,哪种方法有潜力催生出 AGI? Demis Hassabis:从理论上看,我认为纯 AlphaZero 式的方法没理由不成功。Google DeepMind 和社区一些人正在研究在假设完全没有先验知识、没有数据的前提下,从头开始构建所有知识。我认为这是有价值的,因为这些想法和算法在有一定知识时也能使用。 话虽如此,但目前来说我认为最可能最快实现 AGI 的方法是使用目前世界上已有的知识,比如网络上的和我们收集的知识。而且我们还有 Transformer 等有能力消化这些信息的可大规模扩展的算法。你可以将一个模型用作某种形式的先验,基于其上进行构建并执行预测,以此启动 AGI 学习。没理由不这样做。我猜想,在最终的 AGI 系统中,大型多模态模型会成为整体解决方案的一部分,但它们本身并不足以成为 AGI。它们还需要额外的规划搜索能力。 扩展与对齐 Dwarkesh Patel:现在有个规模扩展假设(scaling hypothesis)。有人猜想,只要扩大模型和数据分布的规模,智能终会出现,您认同吗? Demis Hassabis:我认为这是一个需要实验检验的问题。几乎所有人(包括那些最早开始研究规模扩展假设的人)都很惊讶规模扩展所带来的成就。看看现如今的大模型,它们的效果好得简直不合理!大模型涌现出的一些性质相当出人意料;在我看来,大模型是有某种形式的概念和抽象能力。要是回到五年以前,我会说要做到这一点,我们可能还需要另一种算法方面的突破。也许更类似大脑的工作方式。我认为,如果我们想要明确的、简洁的抽象概念,我们依然需要更加理解大脑,但这些系统似乎可以隐式地学习它们。 另一个出人意料的有趣结果是这些系统获得了某种形式的现实基础知识(grounding/定基),即便它们并未体验过世界的多模态——至少在近期的多模态模型出现之前没有。只是靠语言就能构建起如此大量的信息和模型,着实让人惊讶。对此的原因,我有一些假设。我认为大型语言模型能通过 RLHF 反馈系统获得一些现实基础知识,因为人类反馈者本身就是生活在现实中的人。我们就立足于现实世界中。所以我们的反馈也是立足于现实的。因此这能让模型获得一些现实基础。另外,也许语言中就包含了更多的现实基础,如果你能完全洞悉语言,也许能发现我们之前可能没考虑到的东西,甚至可能已经有语言学家研究过这些方面。这实际上是一个非常有趣的哲学问题。人们甚至可能都尚未触及其表面。看看过去的进展,畅想未来是非常有趣的。 对于你说的规模扩展问题,我认为我们应当尽可能地扩大规模,我们也正在这么做。至于最后会趋近一条渐近线还是撞上铁墙,这是个实验问题,不同的人会有不同的意见。但我认为我们应该直接去测试。没人能想出答案。但与此同时,我们也应该加倍投资创新和发明。这是谷歌研究院、DeepMind 和谷歌大脑的做法,我们在过去十年中开创性地取得了许多成果。这就是我们的生存之道, 可以说,我们一半的努力是在扩展规模,另一半则是在研发未来的架构和算法——它们或许是在模型变得越来越大之后所需的。我大概猜想,未来这两方面都需要。所以我们要两方面都尽可能地发力。我们很幸运,因为我们确实能做到这一点。 Dwarkesh Patel:再多聊聊定基(grounding)。可以想象,有两件事会让定基变得更加困难。一是随着模型变得更加聪明,它们就能在我们无法生成足够人类标签的领域工作——因为我们不够聪明。而是关于计算。目前我们做的都是下一 token 预测。这就像是一个护轨,限制模型让其像人类一样谈话,像人类一样思考。现在,如果额外的计算是以强化学习形式出现的呢——我们只知道达成了目标但无法追踪是如何达成的?如果这两者组合起来,定基会出现什么问题? Demis Hassabis:我认为如果系统没有适当地定基,系统就无法适当地实现这些目标。我认为在某种程度上系统应该有定基,至少要有一些,这样才能在真实世界中真正实现目标。随着 Gemini 这样的系统变得更加多模态,可以在文本数据之外处理视频、音频和视觉数据,这些系统就会开始将这些东西融合到一起。我认为这其实就是一种形式的定基。这样系统就会开始更好地理解真实世界的物理机制。 Dwarkesh Patel:为了对齐比人类更聪明的系统,应该怎么做? Demis Hassabis:我和 Shane(注:Shane Legg,DeepMind 联合创始人,现担任该公司首席 AGI 科学家)还有其他许多人在我们创立 DeepMind 之前就已经在考虑这个问题了,因为我们计划着取得成功。2010 年时,还没什么人研究 AI,更别说 AGI 了。但我们那时就知道,如果我们能通过这些系统和思想取得成功,创造出的技术将会具有让人难以置信的变革力量。所以我们 20 年前就在思考了,这样会有什么正面和负面的后果。正面的后果就是惊人的科学成果,比如 AlphaFold、科学和数学领域的科学发现。同时我们也需要确保这些系统是可理解的和可控的。 为了得到经过更为严格评估的系统,人们提出了很多想法。但我们目前还没有足够好的评估方法和基准可以确定系统是否欺骗了你、系统是否会泄漏自己的代码等不良行为。还有些人提出可以使用 AI 来辅助分析,就是使用应用范围窄的 AI(narrow AI)。它们不具备通用学习能力,而是专门为某个特定领域专门设计的;它们可以帮助人类科学家分析更通用的系统的行为。我认为一个有很大潜力的方向是创造强化型沙盒或模拟环境——它们的网络安全经过增强,可以把 AI 困在其中,也能保证外部攻击者无法进入。这样一来,我们就可以在这个沙盒中自由地做实验了。另外也有些人在研究让人类能够理解这些系统构建的概念和表征。 时间线和智能爆炸 Dwarkesh Patel:您认为 AGI 会在什么时候出现? Demis Hassabis:我没有具体的时间预测,因为我感觉还有很多未知和不确定,而且人类的聪明才智和努力总是会带来惊喜。这些都可能导致时间线变化。但我要说,在我们 2010 年创立 DeepMind 时,我们认为这个项目需要 20 年时间。实际上,我觉得我们正按预期向目标靠近。这很了不起,因为通常的 20 年计划总是还要另外 20 年。如果我们在未来十年内拥有类似 AGI 的系统,我不会感到惊讶。 Dwarkesh Patel:如果有了 AGI,您会使用吗?您可以将其用来进一步加速 AI 研究。 Demis Hassabis:我认为这是有可能的。这要看我们做出什么决定。我们需要作为一个社会来决定如何使用第一个新生的 AGI 系统或甚至 AGI 原型系统。即便是我们现有的系统,我们也需要考虑其安全方面的影响。 Gemini 的训练 Dwarkesh Patel:目前 Gemini 的开发遇到了什么瓶颈?既然规模扩展法效果很好,为什么不直接把它增大一个数量级? Demis Hassabis:首先,有实践方面的限制。一个数据中心究竟能有多少算力呢?实际上,这会遇到非常有趣的分布式计算难题。幸运的是,我们有最好的研究者在研究这些难题以及如何实现跨数据中心训练等等。还有硬件方面的难题,我们有自己构建和设计的 TPU 等硬件,也会使用 GPU。至于规模扩展的效果,也不是总如魔法般有效。扩大规模时也还需要扩展超参数,每一种规模都需要各种不同的创新。不是每一种规模都能重复一样的配方。我们必须调整配方,而且这在某种程度上就像是搞艺术。另外还需要获得新的数据点。 Dwarkesh Patel:在 Gemini 的开发过程中,您觉得最出人意料的是什么? Demis Hassabis:我得说没什么非常出人意料,但是能在那种规模上进行训练并从一种组织化的角度去研究它,是非常有趣的。 Dwarkesh Patel:很多人认为其它实验室的模型的计算效率可能比 DeepMind 的 Gemini 高。您怎么看? Demis Hassabis:我认为情况并非如此。实际上,Gemini 使用的算力差不多,也许就比传闻中 GPT-4 使用的算力稍多一点。 Dwarkesh Patel:对于 2010 年刚创立 DeepMind 的您来说,现在的 AI 进展中哪一点最让您感到意外? Demis Hassabis:你也采访过我的同事 Shane。他总是从计算曲线方面进行思考,也常常将 AI 与大脑进行比较——有多少神经元或突触。但现在我们已经差不多到大脑中神经突触数量的数量级和那样的计算量了。 但我认为,更根本的问题在于,我们关注的重心始终是通用性和学习。这始终是我们使用任何技术的核心。因此我们把强化学习、搜索和深度学习看作是三种可以扩展并且可以非常通用的算法,无需大量人工设计的人类先验知识。这不同于 MIT 等在当时构建的 AI——它们是基于逻辑的专家系统,需要大量人工编码。事实证明这种做法是错误的。我们在早期看出了发展趋势。我们使用游戏作为验证平台,发现结果还不错。最后也取得了巨大的成功。AlphaGo 等成功给其他许多人带去了启发。当然,还有我们谷歌研究院和谷歌大脑的同事发明的 Transformer,这种深度学习方法让模型可以处理海量数据。这些技术就是如今成果的基础。这些都是一以贯之的传承。我们当然不可能预测出每一次技术转变,但我认为我们前进的总体方向是正确的。 治理超人类 AI Dwarkesh Patel:您怎么看待超人类智能的前景?它仍然受私有企业控制吗?具体应该如何治理它? Demis Hassabis:我认为这种技术将会带来重大影响。大于任何一家公司,甚至大于任何一个行业。我认为这必需来自民间社会、学术界、政府的许多利益相关者的大规模合作。好消息是,随着近期聊天机器人等技术的广泛使用,社会中其它一些部分被唤醒了,他们开始认识到这种系统正在到来并且他们也将与这些系统互动。这很不错。这为良好的对话打开了很多大门。 其中一个例子是几个月前在英国举办的 AI Safety Summit。我认为这是一次巨大成功。我们需要进行国际间的对话,要让整个社会一起来决定我们要使用这些模型做什么、我们希望怎样使用它们、我们希望它们不被用于什么目的。 Dwarkesh Patel:现在的 AI 系统已经非常强大,为什么它们的影响没有更大呢? Demis Hassabis:这说明我们依然还处在这个新时代的起点。目前的这些系统已经有一些有趣的用例,比如使用聊天机器人系统来为你做总结、完成一些简单的写作任务、进行样板式写作;但这些只是我们日常生活的一小部分。 我认为,对于更一般化的用例,我们仍然需要新的能力,比如规划和搜索,另外还需要个性化、记忆、情境记忆等。因此长上下文窗口是不够的,还要记住 100 轮对话之前我们说了什么。一旦这些技术成熟了,我们就会看到新的用例,比如能帮助我们找到更好更丰富材料(书、电影、音乐等)的新推荐系统。那样我就会每天使用这类系统。我认为我们目前只是触及了这些 AI 助理的表面,其实未来它们能为我们的一般日常生活和工作做更多事情。另外用它们做科研也不足够可靠。但我相信未来当我们决定了事实性和定基等问题之后,这些 AI 系统就能变成世界上最好的研究助理。 Dwarkesh Patel:说到记忆,您在 2007 年有一篇论文谈到记忆和想象(imagination)有某种程度的相似之处。现在也有人说目前的 AI 就只是记住了些东西。您对此怎么看?只靠记忆就足够了吗? Demis Hassabis:在有限的情况下,也许记住一切就够了,但这样无法泛化到原有的分布之外。但很明显 Gemini 和 GPT-4 等模型确实能够泛化到新的情况。至于我的那篇论文,我实际上表达的是:记忆(至少是人类记忆)是一种重建的过程。记忆不是磁带式的精确记录。我们的大脑是把看起来熟悉的东西组合到一起。这让我思考想象可能也是这么回事。只不过这时候我们组合的是语义组件(semantic component)——你的大脑将它们组合起来并且认为结果是全新的。我认为我们目前的系统依然缺少这种能力——即把世界模型的不同部分拿出来组合到一起来模拟新东西,从而帮助用来执行规划。这就是我所说的想象。 安全、开源和权重安全 Dwarkesh Patel:你们有计划和其它两家主要的 AI 实验室一样从某种程度上放出 Gemini 的框架吗? Demis Hassabis:是的,我们内部已经做了大量的检查和平衡,我们也会开始发布一些东西。未来几个月,我们有很多博客文章和技术论文发出来。 Dwarkesh Patel:如何保护模型的权重,使其不被恶意盗用? Demis Hassabis:这涉及到两个方面。一是安全,二是开源。安全非常关键,尤其是网络安全。我们 Google DeepMind 非常幸运。因为我们在谷歌的防火墙和云的保护之下,这可以说是世界上最好的安全防护。除此之外,我们 DeepMind 还有特定的措施来保护我们的代码库。所以我们有双重保护。而且我们还在不断提升和改进,比如使用强化沙盒。我们也在考虑特定的安全数据中心或硬件解决方案。所有的前沿实验室都应该这么做。 开源也很重要。我们是开源和开放科学的大力支持者。我们已经发布了数千篇论文,包括 AlphaFold、Transformer 和 AlphaGo。但对于核心的基础技术,我们会考虑如何阻止恶意组织、个人或流氓国家,防止他们使用这些开源系统去实现他们的有害目的。这是我们必须回答的问题。我不知道这个问题的答案,但我也没能从支持开源一切的人那里听到让人信服的答案。我认为这其中必须要有些平衡。但很显然这是个很复杂的问题。 Dwarkesh Patel:在安全方面,其它一些实验室有自己的专攻领域,比如 Anthropic 在研究可解释性。现在你们有了最前沿的模型,你们也会在安全方面做前沿研究吗? Demis Hassabis:我们已经开创了 RLHF 等技术,这不仅能用于提升性能,也能用于安全。我认为很多自我博弈想法也有潜力用于自动测试新系统的边界条件。部分问题在于,对于这些非常通用的系统,它们的适用范围非常广。我认为我们将需要一些自动测试技术以及之前提到的模拟和游戏、非常拟真的虚拟环境。在这方面我们有很长的研究历史。另外,很幸运谷歌有大量网络安全专家和硬件设计师。这也是我们可以获得的安全保障。 多模态和进一步的进展 Dwarkesh Patel:对于 Gemini 这样的系统,目前与它们默认的交互方式是通过聊天。随着多模态和新能力的加入,这种情况会如何改变? Demis Hassabis:在理解完整的多模态系统方面,我们还处于起步阶段。与其的交互方式将与我们现在的聊天机器人大不相同。我想明年的下一代版本可能会具有一定的环境理解能力,比如通过相机或手机。然后我可以想象下一步。模型在理解方面会变得越来越顺畅。我们可以使用视频、声音甚至触碰。如果再考虑到使用传感器的机器人,世界将会开始变得激动人心。我想未来几年,我们就能看到多模态对机器人学科意味着什么。 Dwarkesh Patel:Ilya 曾在播客上跟我说过 OpenAI 放弃研究机器人的原因:在该领域的数据不够,至少在那时候是如此。您认为这对机器人的发展而言依然还是一个瓶颈吗? Demis Hassabis:我们的 Gato 和 RT-2 Transformer 取得了激动人心的进展。我们一直以来都很喜欢机器人。我们在这一领域也有出色的研究成果。我们仍然在进行机器人研究,因为我们其实喜欢这一事实:这是一个数据稀少的领域。我们认为这会是一个非常有用的研究方向,其中涉及到的课题包括采样效率和数据效率、从模拟环境迁移到现实的迁移学习。我们一直在努力研究。 实际上 Ilya 说得对,机器人很有挑战性就是因为数据问题。但我想我们会开始看到大模型可以迁移到机器人领域、在非常普适的领域学习,并且可以将 Gato 这样的 token 当作是任意类型的 token 进行处理。这些 token 可以是动作,也可以是词、图块、像素等等。我心中的多模态就是这样。但一开始,训练这样的系统比简单直接的文本语言系统更困难。我们之前聊迁移学习时也谈到了,对于一个真正的多模态系统,一个模态是可以从其它模态获益的。比如如果模型更加理解视频,其语言能力也会有所提升。我们最后会有一个这样的更加通用、更有能力的系统。 Dwarkesh Patel:DeepMind 发表了许多有趣的研究成果来加速不同领域的科学研究。为什么要构建这样的特定领域的方案呢?为什么不等到一二十年后让 AGI 来做? Demis Hassabis:我想我们并不知道 AGI 将在何时到来。而且我们过去也常常说,我们不必等到 AGI,也能做出些出色的成果来造福这个世界。我个人也对 AI 在科学和医疗领域的应用充满热情。而且你可以看到我们的多篇 Nature 论文关注了多个不同的领域。有很多激动人心的研究方向能影响这个世界。作为拥有数十亿用户的谷歌的一分子,我们很荣幸有这样的巨大机会,可以将我们取得的进步快速提供给数十亿人,帮助改善、丰富和助力他们的日常生活。 从 AGI 的角度看,我们也需要检验我们的想法。我们不能指望闭门造 AI 就能推动发展,因为这样只会让内部指标偏离人们真正会关心的真实事物。真实世界应用能提供大量直接的反馈,可以让我们知道系统是否在进步或者我们是不是需要提高数据或样本效率。因为大多数真实世界难题都需要这样。这能不断推动和引导你的研究方向,以确保它们走在正确的道路上。当然,另一方面是,即便是在 AGI 诞生之前很多年,世界也能从中获益。 Google DeepMind 内部 Dwarkesh Patel:Gemini 的开发工作涉及到谷歌大脑和 DeepMind 等不同机构的合作。这其中遇到了哪些挑战?产生了哪些协同效应? Demis Hassabis:过去的一年是很棒的一年。当然,挑战是有的,和任何大型整合工作一样。但我们是两个世界级的组织,各自都发明了许多重要技术,从深度强化学习到 Transformer。因此,我们的很多工作就是将这些汇集起来,实现更加紧密的合作。其实我们过去常常合作,只不过之前是针对具体项目的合作,现在则是更加深度和广泛的合作。 Gemini 是这一合作的首个成果,其实 Gemini 这个名字就暗含了孪生兄弟姐妹的意思。当然,也有很多事情的效率更高了,像是把计算资源、想法和工程开发工作汇集到一起。我们目前就处于这个阶段,基于世界级的工程开发来构建前沿系统。我认为进一步的合作是有意义的。 Dwarkesh Patel:您和 Shane 创立 DeepMind 的部分原因是你们担忧 AI 的安全问题。您认为 AGI 的到来有现实的可能性。您感觉来自谷歌大脑的研究者也有类似看法吗?这个问题方面是否存在文化差异? Demis Hassabis:没有。总体而言,这就是我们在 2014 年与谷歌携手的原因之一。我认为,谷歌和 Alphabet 整体(不只是谷歌大脑和 DeepMind)都以负责任的态度认真对待这些问题。差不多我们的座右铭就是大胆尝试这些系统,同时要负起责任。我显然是一个技术乐观主义者,但我希望我们对技术保持谨慎,毕竟我们共同为这个世界带来的东西具有变革性的力量。我认为这很重要。我认为这将成为人类发明的最重要的技术。 Dwarkesh Patel:最后一个问题。2010 年时,当其他人还觉得 AGI 很荒谬时,您就在思考这个终极目标了。现在随着这类技术的慢慢起飞,您是怎么想的呢?您是否已经在您的世界模型中预想到过? Demis Hassabis:是的,我确实已经在我的世界模型中预想到过这些,至少是从技术角度。但很显然,我们不一定预料到了公众会在如此早期阶段参与进来。像是 ChatGPT 等一些应用在某些方面还有所欠缺,但人们已经有浓烈的兴趣去使用它们了。这一点挺让人意外的。 另外还有更加专业化的系统,比如 AlphaFold 和 AlphaGo 以及一些科学方面的成果,但它们在公众关注的主线发展之外,也许几年后公众会关注到它们,那时候我们可能就有了更加普遍适用的助理类型的系统。这会创造出一个和现在不一样的环境。而且情况可能看起来会更混乱,因为会有很多事情发生,也会有很多风险投资,好像所有人都失去理智一样。 我唯一担忧的是我们能否负责任地、深思熟虑地、科学地对待这种情况,使用科学方法来应对。也就是我说的乐观但谨慎的方式。我一直都相信这是我们应对 AI 这类事物的方式。我希望我们不会迷失在这场快速袭来的巨大热潮中。 参考链接: https://www.dwarkeshpatel.com/p/demis-hassabis https://twitter.com/dwarkesh_sp/status/1762872471479529522
马斯克用微软论文当论据起诉OpenAI:你们自己早承认AGI了
大概也只有马斯克敢了。 用微软论文当证据,起诉OpenAI。 一年前微软研究院发表的论文《Sparks of AGI:Early experiments with GPT-4》,现在成为了马斯克起诉书中的关键角色。 这篇论文通过分析早期GPT-4的能力,认为GPT-4可以被视为早期AGI。 去年论文发表时就引发不小关注,1年时间里被引次数已经高达1500次。 马斯克的起诉书里写道,微软自己的科学家自己都承认了。 这么看,OpenAI最新的一通回应不是啪啪自己打脸? 还真不一定。 这篇《Sparks of AGI》当初爆火确实不假,但其中很大一部分热度来自争议。 不少人觉得它不够严谨、在炒热度,而且这篇论文没有经过同行评议,只是上传到了arxiv,结果也无法复现。 所以这篇论文到底说了啥?马斯克凭啥敢拿它大做文章? 论文说了啥? 这篇论文主要测试了GPT-4在2022年秋季的一个早期版本。 研究提出,GPT-4不仅掌握语言能力,而且能解决复杂新奇的问题,任务可以跨数学、编码、医学、法律、视觉等。 在这些任务中,GPT-4的表现接近于人类水平,大大超越以往LLM性能,比如ChatGPT。 由此,研究给出了关键性结论: 我们认为它可以被合理地视作一个早期版本(仍不完整)的AGI。 在此基础上,研究团队还进一步探讨了真正意义上的AGI应该具备哪些要素。 论文全篇超过150页,分别测试了GPT-4的多模态、代码、数学、常识等能力,通过大量实例得出结论。 以测试代码能力为例,GPT-4和ChatGPT会得到同样的提示词,研究人员将会对回答结果进行分析。 GPT-4的一些数据结果非常值得关注。 比如在零样本下,GPT-4代码能力在HumanEval上的精度达到82%。 再比如在现实问题问答中,GPT-4的表现也远好于ChatGPT。 研究还讨论了GPT-4基于自回归架构表现出的局限性。 比如模型本身具备相应的知识能力,但是却会回答错问题,因为预测下一个token的机制使得模型不能进行“内心对话”。 最后,论文作者还提出了对AGI的一系列构想。 这篇论文发表于GPT-4面世的一周后,当时引发业界巨大关注。 “AGI的闪现”让不少人感叹,一切都结束了。 但质疑也不少,很多人觉得这个结论是不是有点夸大其词了? 而且研究团队承认使用的一些测试方法不够科学严谨,他们主要是想展示GPT-4卓越的能力。 不过可以肯定的是,这篇论文成功把GPT-4和AGI强关联,给GPT-4创造了更多讨论热度,也成为AGI讨论热潮的重要推力。 可是谁又能想得到,它现在倒成为马斯克起诉OpenAI的关键了。 马斯克到底想干啥? 马斯克搞事,总是醉翁之意不在酒。 去年他和千名大佬共同呼吁暂停开发AI半年,结果转头自己囤卡、开搞大模型,火速成立AI初创公司xAI。 今年起诉OpenAI,核心的目的就是督促其开源。 号称GPT-4是AGI也是给OpenAI上道德压力。一方面要求他们开源,另一方面提出“AGI算法不应该授权给微软”。 所以有人合理怀疑,这场官司“会让一切减速”。 与此同时,马斯克的Grok也还在稳步推进中,目前已发布Grok-2。 值得一提的是,去年OpenAI宫斗前后,马斯克曾在一场访谈中表示,从现在(23年12月)算起,AGI还有不到3年。 但往小了说,写小说和JK罗琳一样好、能发现新物理规律或发明新技术的AI,从现在算起还有不到3年。 当时他还表示觉得山姆·奥特曼很复杂。 目前,OpenAI方面除了否认GPT-4是AGI外,还没有更多回应。 有法律专家认为,马斯克列出的一系列观点,很难当成明确的条款来执行。“诉讼可能比较牵强”,但是提出了“强有力的政策论点”。 有圈内大V还觉得马斯克这么干,有点吃不到葡萄说葡萄酸。 马库斯则调侃说,马斯克这么做逼得OpenAI不得不承认自己没达到AGI,但是可以找第三方来承认。 比如雇我这样的人来拯救他们。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。