行业分类:
加载中...
头条分类:
加载中...
腾讯首席科学家张正友内部分享:对具身智能、大模型及AGI的一些思考
人类与一个有灵魂的机器人发生故事,这个机器人“生活”在人类世界,艰难地体会着人类的喜怒哀乐……机器人的故事,是科幻剧最喜欢展现的一个题材,然而在真实世界中,我们却很难看到一个真正意义上能与人类交互的机器人。 我们在现实生活中,见到的大多还是在生产线上进行重复劳动的机器人,或者是迈着笨拙步伐,差点被绊倒的双足机器人,还有一些仅能做展示性任务(比如跳舞的机器狗)的机器人。 ● 为什么让一个机器人不被绊倒有这么难? ● 大语言模型的爆发是否能给机器人一个足够强大的大脑,让人类所期待的具身超级智能成为现实? ● 人类语言的产生晚于世界的诞生,大语言模型,真的能建立一个真正的世界模型吗? 近日在【2023年腾讯技术周】AIGC大咖面对面活动中,腾讯首席科学家、腾讯AI Lab及腾讯Robotics X实验室主任张正友博士做了主题为《迈向具身智能以及对大模型和AGI的一些思考》的分享。 在这次分享中,张正友博士提到,机器人要从自动化进阶到智能化,需要实现反应式自主和有意识自主去应对变化的、不确定的环境,需要一个新的控制范式,类似于人类的认知模式。他借鉴了心理学领域的理念,将人的思考分为两个系统,即:自动的、快速的、直觉的第一系统,以及需要专注思考的推理、复杂计算等费脑力行为的第二系统。由此,他提出,完善的机器人系统也需要由不同层级来处理不同级别的决策,或理解不同层级的感知信息。 受到这一理论的启发,他认为,AI和人未来将会是多模态的交互方式,而且AI是主动的,它能够感知周围的环境。目前的大语言模型还不能称之为完整的世界模型,多模态大模型肯定是通往AGI的必经之路,但有很多工作要做,而且很可能不是现在的多模态大模型。 以下为演讲原文: 机器人的趋势,要从自动化变成智能化。很多生产线上的机器人都是重复性地做一些预编程好的动作,而且做得非常精准。我们今天讨论的是智能机器人,要实现自主,能够在环境不确定时自动调整规划它自己的系统,来应对没有预测到的情况。 腾讯的机器人实验室是 2018 年成立的,出发点是 AI 一定要跟人协作,这是最主要的目的。所以我们做这个机器人是为了人机共存、共创、共赢的未来。实验室成立时我们提出了 A2G 理论,是这七个方向,ABCDEFG 刚好对应英语前面的字母,A 是 AI,机器人必须能看、能说、能听、能思考。B是机器人本体,要探索什么样的本体最适合人的环境,最简单的想法是人形机器人,但我认为还可能有更好的形态,所以我们要探索这个本体B,Body。C 是 Control,精准控制。ABC 属于最基础的能力,上面一层是 D,Developmental learning,发育学习。 因为机器人要在环境中不断地跟人和环境交互,在交互中可能是成功的,可能失败的,成功就要做得更好,失败就要从失败中学习,不断地演进,就像一个小孩能不断发育成长。E,EQ,因为是机器人在人机环境里跟人交互,必须要理解人的情感,同时要把它自己理解的东西呈现给人,人才能知道到底机器人有没有理解,所以这是双向的情感理解,拟人化。F 是 Flexible manipulation,灵巧操控,要掌握包括使用工具,为人类完成物理任务,否则这个机器人只是一个聊天的机器人。G 是 Guardian Angel 守护天使。这个机器人不光只是单独的一个本体,还需要跟部署在环境里的智能传感器和其他机器人、通过云跟家人和世界互联,使得机器人成为人类的保护天使。 这是我们 Robotics X 实验室一开始成立定的几个方向,今天主要讲 C 到 D。 01 完善的机器人系统 需要借鉴人类的思维模式: 分层级进行“快与慢”的理解与决策 讲到自主,有两类:一是反应式的自主。比如走路时绊了一跤,可以很快恢复平衡,不会绊倒。有意识的自主,比如各位要去开个门或者我要从上面下来,都要有一些规划。 为了实现这样的自主,传统范式是通过感知,感知环境后做一个计划,计划后面的行动,行动再到感知。传统范式有很大的致命性问题,因为它不可能解决反应式的自主,因为不可能那么快。你说我绊倒后还要在脑子里思考怎么样恢复平衡,我没时间思考。 为此,我提出了一个新的范式叫 SLAP 范式。这个名字 S 是感知、L 是学习、A 是 Action、P 是 Planning。很重要的一部分是学习,学习渗透到感知、行动、和计划。还有一个重要的部分是感知和行动紧密的连在一起。只有这样才能感知到突发事件,比如绊了一下马上就能够行动来保持平衡,同时对常规行动不需要进入上一层的规划或计划。 这个东西就可以跟人的认知相比较,这是系统 1 和系统 2,诺贝尔奖获得者卡尼曼在《思考,快与慢》这本书总结出来的,这本书提到心理学领域将人的思考分为两类:system 1,自动的、快速的、直觉的;system 2,需要专注思考的推理、复杂计算等费脑力的活动。他说人的大脑95%的时间都是在系统 1 里运作的。这非常快,是凭直觉、不需要很多思考的。当你需要或碰到难题时,才会上升到系统 2,这个花的时间大概只有 5%,就是更理性地思考、推理。我们讲的反应式自主,对应了系统 1。上面的 Plan,也就是有意识的自主就对应了系统 2。 系统 1、系统 2 前面还有一个就是感知,因为没有感知不可能做系统 1、系统 2。针对系统 1,就是刚才提到的,快的、并行的、不需要花力气的、大部分可能不是语言方面的东西。系统 2 是比较慢的思考,而且是需要花精力的,是很灵活的,有时候可能是一个规则来负责的,它负责内容、感知。有一个想象,如果完成的和你预测的一样,那很快就可以实现了,这是系统1的工作。当你预测和真正实现的东西有差别,才会上升到系统 2。 我觉得现在 Language model 还没有做到最好,因为 Language model 到目前为止还是用系统 1 的方式做系统 2,因为它是靠预测,不管你的问题难还是容易,几乎是同样的时间给你回答。但事实上真正解决问题不是这样的,容易的问题很快就可以答。复杂的问题要上升到一定高度,现在大家也有些在研究,比如反思。这都是针对目前 Language model 有些问题采取新的研究方式。 一个完善的机器人系统,同样需要借鉴人这种认知模式,由不同层级来处理不同级别的决策,或理解不同层级的感知信息;而每一层级的理解和决策,都将由一个深度神经网络来完成。就像人有小脑和大脑,小脑能自动或者快速地维持身体平衡、调节肌张力、控制步态和身体姿势、协调随意运动,而大脑既控制我们的运动和感觉也进行逻辑思维、语言、识别和理解等高级认知活动。 02 腾讯通过三层架构 实现真正自主的机器人决策控制 回到今天我要讲的机器人部分。刚才讲的为什么是反应式自主,有些是有意识的自主,因为人在发育过程中最早是一个动物,动物尽管没有语言,还是需要处理目前这个世界的。小脑几乎是所有动物都有的,小脑是非常自动快速的几乎没意识的部分,可以实现帮助动物活下来,包括人类活下来,只是需要决策时才会上升到大脑部分。 在这个情况下,我们机器人控制里也分层,第一层是本体的感知控制,我们也有神经网络到后面去实现。第二个,对环境的感知,还有一层就是策略的决策。分层后实现了机器人智能控制。 再具体一点,目前的机器人控制分三层: 1、第一层是 PLC,行为控制系统,接受本体的感知包括关节的角度,上层控制指令,比如往前、往后、往左、往右,输出的是机器人控制的力矩。 2、第二层是 ELC,环境交互的控制系统,接受环境的感知信息。比如我们要下楼梯或者上楼梯、开门,环境给我信息后我要去规划,去实现和环境相关的一些任务。 3、最上面是 SLC,策略控制系统。比如一只狗一定要把另外一只狗追上,这样的策略怎么样控制,它可以把任务信息、外部环境感知信息和本体感知信息都整合起来,输出到控制指令。 这个好处是我们已经把认知到行为三层能力进行分解,分解后每一个层都可以独立去训练,到最后可以端到端稍微微调一下,但通过分层的训练,效率、稳定性都非常高。 03 生成式模型 在机器人控制领域的应用 在 Primitive-Level Control 层面,展现出人类和动物的行为时,我们不会用规则、hard coding 的方法,我们用了目前比较流行的生成式模型,生成式模型用在这个控制里非常合适,因为前面一堆 Token 或者其他东西预测下面的东西,下面的东西就是一个运动控制指令,这是非常合适的模型。 我们机器人用的生成式模型跟现在自然语言用的生成式模型的差别在哪里?我们从一开始就是多模态的,Language model 是用文字预测文字,我们这里面输入的是内部关节角度各方面的东西,到最后是要变成一个电机力矩去控制机器狗。我们采集了真狗在跑步机上不断跑的数据,上面贴了很多点,一个 MoCap 动捕系统看它的轨迹运动方向,当然我们不知道狗到底用了多少力,所以力矩没有,只是表面的运动信息。 有了表面运动信息后,可以把这些信息 retarget 到机器人的骨骼上,因为机器人跟真狗差别非常大。然后构造了基于 MLP 的 Encoder 来压缩数据特征。我们使用了高质量的离散编码来表达真狗的运动形态。接下来是 Decoder,解码隐变量,输出电机控制。整个过程用强化学习去训练,使得机器人到最后学到的动作和真的动作形态很接近。最后部署时,去掉 encoder 就可以部署上去了。虽然我们是在虚拟环境中训练的,但能 zero-shot 部署到真机。 这里比较了一些其他方法,比如单脚离地时间、站立时间,迈步的长度、高度之类的,每一个都是不同的标准,比如第一列是单脚离地的时间。大家看到每列图有五个不同方法的比较,第一个是统计出来的真狗数据,第二个是我们自己方法学到的数据,剩下的四个是其它方法。经过我们的方法,和真实的数据几乎是一样的分布变化,其他的差别就比较大。另外,尽管我们允许的力矩是从正 15 到负 15 牛米(Nm),但最后学到的策略输出的力矩均值只需要 5Nm 上下。
终端体验加速落地,AI让PC从“工具”向“智能助手”转化
ChatGPT的问世,掀开了通用人工智能的大幕,同时也推动了AI大模型的快速发展。在此之前,PC行业一直被视为一个正在走向没落的行业。然而,现在人工智能的发展,无论成功与否,AI PC时代即将到来也为PC产业带来新的转折点。 个人电脑经历了多个时代的演进,每一次的跃迁都标志着重大的技术进步和变革。第一次跃迁是桌面互联网爆发。随着互联网连接技术的普及,个人电脑从独立的计算机系统、没有互联网连接能力,进步到互联网电脑。第二次跃迁是移动电脑的时代,随着移动计算性能的大幅提升,个人电脑便携性和移动性大大提升,笔记本电脑变得更轻,更薄,变得更加流行。 而AI的技术突破,将给PC带来智能化、创造力、个性化等全方面的创新体验。个人电脑将迎来从“工具”向“智能助手”的角色转化,这必将是一代全新的跃迁。 在人工智能的驱动下,新一代的PC硬件将具有更快的处理速度、更大的存储容量、更智能的交互方式以及更安全的数据保护。这些特点使得PC硬件成为了人工智能技术的重要载体,也为PC行业带来了新的发展方向。 当然,人工智能技术的普及和应用还需要一定的时间。但是,随着各大科技公司的不断投入和研发。在未来,我们期待看到更多的人工智能与PC硬件融合的创新产品和服务。 近日,英特尔正式启动首个“AI PC加速计划”,该计划将在2025年前为超过1亿台PC带来人工智能特性。预期在12月份发布的英特尔 酷睿 Ultra处理器,将作为“AI PC加速计划”的第一步,为PC带来高效能的AI加速和本地推理的全新体验。 除此之外,在前不久结束的2023年度Tech World大会上,联想集团董事长兼CEO杨元庆也展示了首款AI PC,并表示AI PC将是能够创建本地知识库,运行个人大模型,支持人工智能计算,运用自然交互的更强大、更具创造能力的智能生产力工具。 从左至右依次为:英特尔集团副总裁兼终端系统客户工程总经理Ken McKee、联想集团副总裁,消费与中小企业笔记本开发中心总经理马朝春、爱奇艺高级副总裁王学普 而后,联想集团方面也宣布,将于英特尔公司、爱奇艺三方联手,探索AI在应用端落地的可能性。 其实,早在今年6月,联想、英特尔和爱奇艺三方就曾发起过一轮合作,当时主要目标是探讨了打造沉浸式流媒体新体验的解决方案。彼时,联想完成了基于Intel MTL新平台的开发设备,目前已经运用于功能开发及调优测试,并在超分、弹幕性能优化等增强用户体验方面取得良好的效果。 而在本次合作上,钛媒体App了解到,三方已经实现了更先进的硬件解码技术、智能预测和生成技术,以及NPU的支持。体现在终端方面,即可以让联想的AI PC能够提供沉浸式视频流体验和最佳的显示、音频效果。在获得更优性能的同时,也实现了最佳的功耗优化。未来,三方则继续在利用 AI技术实现 MEMC、NPU上运行的手势控制以及有关的功耗优化方面展开合作。 据英特尔集团副总裁兼终端系统客户工程总经理 Ken McKee透露,在合作过程中,英特尔采用了跨CPU、GPU和NPU联合型的AI计算,这种混合计算奠定了网络流媒体体验的基础。提高视频体验方面,则依靠NPU技术实现了运动估算补偿(MEMC)和手势控制的能力。 直白来讲,通过AI能力的加持,用户通过本地化的计算的能力能够让一个播放的视频的清晰度能够加倍的提升,例如将原本720P的片源,提升到1440分辨率的效果。MEMC则可以通过法算法来实现运动补偿,运动动态插帧,提升流畅性和清晰度。 相比于云端处理的解决方案,AI PC的概念更多的是利用本地运算能力,实现更多维度的体验升级。在这个过程中,联想集团副总裁,消费与中小企业笔记本开发中心总经理 马朝春表示,对于某些推理工作,会出现功耗较高的问题,从而导致用户的使用体验比较差。因此,联想与英特尔的合作,更多集中在对于内存的占用率如何降低,如何充分利用CPU、GPU以至NPU的算力。进一步达到整个在本地端的推理更高效,然后做到体验的优化,这也是困扰AI PC真正产品化的最大难题。 至于手势操作,爱奇艺高级副总裁 王学普补充到:“隔空手势就是利用到本地化的计算推理能力,能够识别出来用户的手势,可以去控制视频的播放、暂停、快进、快退等操作。” 从本次联想集团、英特尔、爱奇艺三方的合作不难看出,各方厂商都在如今人工智能快速发展的节点,寻求更丰富的应用落地场景。 此前,字节跳动智能创作团队也与英特尔OpenVINO团队进行合作,将NPU能力打通进字节的AI推理框架ByteNN中,使得剪映开发团队能快速地完成智能抠像的优化和升级。 其实,通过应用智能感知和AI技术,未来可以实现非常丰富的智能化功能,它的优势是可以精准地判断用户的工作场景,理解用户的意图,自动调整优化自身的参数以达到最佳工作状态。 除了娱乐方面的提升外,借助算法和模型也可以在很短的时间内完成大量繁琐的计算任务。采用人工智能技术的电脑能够快速地进行复杂的运算,提高了整体的计算效率和处理速度。 据《电子时报》消息,笔电供应链表示,2023年旺季不旺已成定数,2024年展望则偏向乐观。业界认为,Chromebook、商务笔电、AI PC为2024年笔电产业的主要三大看点,尤其是AI PC,预计将成为2024下半年的重点,也是带动整体笔电产业拉升的主动能。 正如英特尔公司首席执行官帕特·基辛格所说,AI将通过与PC的紧密协作,进而从根本上改变、重塑和重构PC体验,释放人们的生产力和创造力,我们正迈向AI PC的新时代。
“一夜回到解放前”,OpenAI正在摧毁创业公司?
图片|《复仇者联盟:无限战争》电影截图 ©自象限原创 作者|程心 编辑|周游 OpenAI自横空出世那天起,就一直是创业者们头上的一把达摩克利斯之剑,如今这把剑终于落下了。 美东时间11月6日,OpenAI在镁光灯下举行了首次开发者大会,OpenAI接连放了几个大招,多模态、降价、GPTs、all tools,几乎把上半年的创业项目全都自己做了一遍,这一套连招也彻底把创业者们打懵了。 “不给第三方留后路”、“一夜回到解放前”、“搞了半年的东西在OpenAI的更新面前像个笑话”... ▲图源:即刻和朋友圈截图 与现场如春晚般的掌声和欢呼声不同的是,场外无数创业项目破碎和投资人心碎的声音。X上有网友自发组织了一场实时讨论,近百人实时讨论,当OpenAI献出“GPTs”和“all tools”时,惊现国粹“woc,这半年都白干了”。 ▲图源:X截图 而随着演讲进程的推进,Altman说出的每一个英文单词,都一片一片地击碎众多创业项目,“这是一场1挑N的碾压式比赛。”有人愁云惨淡地说道。 事实上,这并不是创业者们完全猝不及防地被OpenAI“偷袭”。 就在前一天,11月5日,在奇绩创坛举办一场关于探索Agent新范式的线上活动中,不少人都对这项技术忧心忡忡,“明天就是OpenAI的开发者大会,不知道会不会一夜之间变天。” 如今,这句话一语成谶。投资人睡醒后的第一件事,就是询问相关创业者:“你们和OpenAI所做的差异性在哪?”。创业者回复:“差异性就是比他差。” 众所周知,大模型创业有一条铁律:做OpenAI不做的事。但是现在看来,OpenAI似乎没有边界,而这对整个大模型行业来说,是福还是祸? OpenAI更新,降维打击了谁? 《三体》中,歌者文明向太阳系发射了一片二向箔,太阳系瞬间被二维化,所有的生命都变成了一幅画,地球也因此而毁灭。 降维打击由此而来,创业公司们的焦虑,也来源于一夜之间,被“二维展开”。 昨天的开发者大会,OpenAI的核心主要围绕两件事,一是工具箱all tools;二是GPT,这其中既包括对过去GPT-4的升级,也包括由GPT更迭演化而来的GPTs、Agents以及GPT Store。 ▲图源:X作者FinanceYF5 工具这条线贯穿于大会始终,覆盖了从大模型训练推理到AI Agents构建的全链条,一言以蔽之:用OpenAI就够了。 在大模型基础能力方面,TurboGPT-4 Turbo上下文窗口达到128k,是GPT-4的四倍;知识库更新到2023年4月;多模态能力上,GPT-4 Turbo的API将集成了DALL-E3,以及文生语音模型TTS(text-to-speech),开发者通过API可直接调用。 在打造个人专属GPT和构建AI agents方面,OpenAI向开发者推出了GPT Builder助手,构建过程就是和GPT Builder聊天,告诉它你想要做什么即可;即将上线Assistant API,允许AI助手执行具体任务,包含代码解释器、知识库、函数调用等一些工具,并支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。 首当其冲的是国外以LangChain为代表的一批做工具链、中间层的公司,在国内这类公司又被称为“中间件”。 以LongChain为例,它是一个基于大语言模型建立起的框架,其本身并不开发大模型,而是通过把大模型相关开发组件封装打包、链接在一起,从而来降低开发大模型应用的难度。“便捷”、“易用”成为其最大的特点,也正是踩准了大模型应用开发的风口,才让LangChain摇身一变成为了硅谷VC的“座上宾”,甚至在没有任何收入和收入计划的情况下,连续拿下了1000万美元和2000多万美元的两轮融资。 正如硬币有两面性,LangChain等中间层公司所谓的“开箱即用”,也为OpenAI原子弹式的降维打击埋下了伏笔。 此前,已经有一些开发者告诉【自象限】,在实际开发过程中他们对LangChain的使用率并没有想象中那么高,“易用也意味着不够灵活,而对很多初创公司来说,他们更愿意根据自身的业务需求,从零开始构建工具链和框架。比起LangChain,Hugging Face上还有大把的开源工具可以随意调取”。 如今来看,LangChain等公司的热度已经趋于冷却,或许击碎他们不过是早晚的事情,不是OpenAI也会有其他人。反观国内,并没有形成像LangChain一样的完整工具链,国内也有创业公司们瞄准了一个个“散装”环节,有人只做数据清洗或者embedding的过程。“通用的交给OpenAI,创业公司做垂类”,如今这样的幻想也破灭了。 更令一众尚在襁褓的初创公司胆战心惊的是,OpenAI这头永远无法餍足的狮子,也垂涎上了“AI Agents”这块肥肉。 AI Agents可能是现在大模型赛道最热的方向,早在今年三、四月份,就有过一轮AI 智能体的大爆发,短短半个月内,Camel 、BabyAGI、AutoGPT 、斯坦福西部世界小镇如雨后春笋般冒出。 据【自象限】了解,在国内,AI Agents同样是许多初创公司埋头苦干的项目,比如近期面壁智能联合清华大学NLP 实验室推出了大模型「超级英雄」——XAgent,声称在真实复杂任务的处理能力已全面超越AutoGPT。 但现阶段真正能跑出来的AI Agents还寥寥无几,核心原因有两个,一是从数据清洗、Prompt指令设置、训练、输出等各个环节都困难重重;二是,价格成本过于高昂,动辄测试跑一次5美元、3美元,根本找不到能够落地的商业场景。 “你们中的很多人已经有了建立Agents的经验,但是这过程往往很难,可能需要花费数月、几十名工程师,而且很难控制定制化过程,所以我们今天试图将其变得更简单”,Altman在发布会现场说道。 显然,早已经在各个分任务跑AI Agents的OpenAI摸准了创业者的脉。 今年加入OpenAI的前特斯拉AI总监Karpathy,曾在一次开发者活动上表示:“AI智能体,代表了AI的一种未来!” 在近期的奇绩创坛分享会上,有专家更加明确化了这种“未来”。AI agents下一步大模型与真实世界产生互动、影响的关键,“现在的格局是人作为中介,连接起大模型和真实世界,大模型尚且无法与真实环境产生互动、反馈。而未来则是人-AI agents-真实世界这样的排布,真正迈向全自动化、智能化”。 ▲图源:奇绩创坛AI agents分享会 由此可见,OpenAI的野心远不止于一场发布会,不仅想抓住现在,更想抓住未来。 OpenAI更普惠还是更垄断? 有人说OpenAI通过开放能力来完善生态,是更普惠的体现,更多人认为OpenAI并不给生态的其他玩家“留活路”,是垄断的象征。 想要搞明白OpenAI背后的大棋,还要从更宏观的视角来看这场发布会。 当我们把自己从OpenAI更新的震慑中抽离出来,冷静地去看待这场发布会,会发现OpenAI悄然间已经集齐了大模型(底层)+工具链(中间层)+Agents(应用层)的三件套,而当用户和开发者全方位依赖于OpenAI,OpenAI就做到了真正的“通吃”。 除了最引人注目的工具箱all tools和Agent,OpenAI还升级了GPT4的六大能力,包括128k长文本、全新的Assistants API以及视觉CV在内的多模态功能。这些围绕着模型层的能力让OpenAI在市场是具有了更强的竞争力,也让创业者们一直垂涎多模态能力走到台前。 ▲图源:YouTube截图 更重要的是,从ChatGPT到GPT-4,OpenAI一直掌握着“卖方优势”,只因价格太贵,导致无法大规模普及。套用马斯克用在特斯拉身上的一句话“没有人不想拥有GPT-4,只要他足够便宜。”Altman也体察到了民意,升级后的GPT-4 Turbo,不仅将性能提升了一大截,还把价格“打了下来。 ▲图源:OpenAI官网 降价后的GPT-4 Turbo 输入侧为GPT-4 的 1/3 价格,输出侧为 GPT-4 的 1/2 价格。据开发者对比过后,这个价格相比于开源生态的大模型和工具链,仍然贵了十倍级以上。 在绝对的能力差和溢价之间,企业和开发者往往会选择前者。社交平台上有人透露到:“泄露的all tools账号已经开始高价售卖了,这万众期待的阵仗就跟当年的Apple一样。” ▲图源:即刻截图 像苹果的可不止这万众期待的阵仗。在ChatGPT插件上线时,就有很多人将其比喻为安卓或者是APP Store,如今,OpenAI真的推出了GPT Store。 简单的说,就是开发者们通过OpenAI提供的工具,可以直接基于GPT-4的能力,构建一个智能化应用:GPTs。 从定制开发、收入变现到生态构建,OpenAI给出了一揽子的解决方案:在开发环节,提供GPT Builder、Assistants API生成工具,旨在让不懂编程语言的普通人也能开发出定制化GPT对话助手和AI agents分身,以此来降低开发的难度;在收入变现环节,OpenAI承诺将向建造最有用和最多使用GPTs的人支付收入,与创作者分享收入;在生态构建环节,OpenAI提出要打造类苹果的GPT商店,一旦开发者的GPT入驻,就能被更多人搜索到,并有机会跻身排行榜前列获得更多流量推荐。 ▲图源:YouTube截图 也就是说,一个属于OpenAI的开发者生态真的来了。如同 App Store 一样,商店将收录验证用户创建的 GPT 作品,可以被用户搜索到。商店也会推荐生产力、教育和好玩等类别的优秀作品,而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。 从基础大模型,到工具到底层系统,OpenAI几乎一场发布会完成了乔布斯时代的几件惊天动地的大事。 OpenAI在整个AI时代,站在了食物链最顶端。让我们简单地回顾一下苹果的发展脉络:重新定义硬件(iPhone4)、重新定义软件(App)、重新定义系统(iOS、OS),从而建立起一个“无坚不摧”的生态。 苹果定义了App的设计规则、开发者的开发规则、分成规则,当年微信和苹果的几次拉锯才在iOS系统中上线赞赏功能,甚至当智能手机日益衰退之际,苹果依然凭借着强大的生态能力“豢养”着用户,利于不败之地。 参考苹果的结果,就很容易回答,是更普惠还是更垄断的问题。 当然,在这个新时代,一切瞬息万变。 “很期待接下来Meta等开源生态的反击,OpenAI再次打响了一场战争,接下来,可能更好玩了。” ▪ 文中配图来源于网络
再次炸天的OpenAI,大模型生态初现
文|郝 鑫 编|刘雨琦 不出意外地,OpenAI的首届开发者大会,让人特别意外。 一夜醒来,大模型圈一只脚踏入了Agent的世界,另一只脚则踏入GPT Store生态的河流中。 美东时间11月6日,OpenAI开发者大会正式开启,创始人兼CEO山姆·奥特曼站在台上,45分钟的密集输出,再次展示了什么叫“遥遥领先”。 我们先简单回顾一下这场发布会的所有重点,其实无非就是三件事: 一是技术能力:GPT-4 Turbo升级了6大新能力,包括128K的上下文长度、更强的控制能力,模型的知识升级、多模态能力(语音和CV)、模型微调定制和更高速率的限制,性能升级的同时,还对API调用的价格进行了下调; 二是可复制的能力:从原来的GPT到GPTs,用户可以打造专属于自己的GPT助手,企业可通过OpenAI提供的全套工具链“all tools”在企业内部建设有价值的工具,同时也可以深入让GPTs进化为一个个Agents,为智能体做准备; 三则是生态能力:企业不仅可以打造GPTs,更能将其上架在市场内,即GPT Store,可分享给其他用户使用,以及获得分成,类App Store的商业生态由此为出发点。 正如网易有道CEO周枫所言,“这次模型上主要是性能和成本的优化,而在应用和生态方面,做了很多LangChain(开发工具链),LlamaIndex(开发数据框架)这些项目类似的工作,最终就是要实现以智能体作为AI App的愿景。” 总之,OpenAI提供的生态能力解决了当下大模型发展的几个重要难点,而在此之上,大模型的应用层将迎来进一步爆发。 “很兴奋,还有很多信息在消化。” OpenAI发布之后,光锥智能在与多位国内知名大模型创业者交流中,也感受到了大家对行业前景的期待,“OpenAI的多模态能力开放,对开发者是很大的利好,可以做的事情的边界得到进一步拓展,我预计会有很多新的玩法出现。”月之暗面创始人杨植麟对光锥智能称。 这45分钟,为大模型火箭的二级爆发,再次添加燃料。 让大模型,飞入寻常百姓家 “有需求,打造生态,找落地。”OpenAI首届开发者大会结束后,某家国内大模型明星公司 CEO 对光锥智能发表了极为简短,却信息量极大的点评。 市场对ChatGPT的需求,无疑是巨大的。在发布会的开始,奥特曼报告了 OpenAI 平台和产品的一些数据,截至目前,已经有大约200万开发人员在其API上构建各种各样的应用,超过92%的全球500强企业正使用其产品,ChatGPT的周活跃用户达到大约一亿。 自GPT3.5问世到现在,每一次的升级都引领着大模型的下一个技术方向,不过,这次OpenAI GPT-4升级后的Turbo版本更像是查漏补缺。 首先是更长的上下文本长度,GPT-4Turbo上下文任务长度扩展至128K,相当于一本书的300多页,是 GPT-4支持的8K上下文的16倍。不仅如此,奥特曼还强调在扩展文本长度的同时,还应该保持模型的准确性。 其次是弥补OpenAI一直以来的短板——安全可控和知识库更新速度。针对前者,推出了名为Json Mode的新功能,确保开发人员更容易调用API,提升对模型输入和输出的控制;即将推出“Copyright Shield”(版权保护)功能,若其企业和API用户面临版权侵权诉讼,OpenAI将为其承担相应费用。针对后者,OpenAI平台支持用户导入文档、数据库来更新大模型的认知,同时还将新升级后的GPT-4Turbo认知理解更新到了2023年4月。 最后,此次更新中,OpenAI的多模态能力开放进入到了一个全新的阶段。上一个时期,OpenAI用了一年多的时间,实现了ChatGP能说、能看、能听,而现在才到了多模态能力释放的节点。DALL-E3、文生语音模型TTS(text-to-speech)、Whisper V3都将通过API的形式开放给开发者使用。 能力升级之后,为了让更多的开发者用起来,还做了一个大降价。 奥特曼表示,不断有开发者来向其抱怨,GPT-4定价太贵,也正是基于此,OpenAI这回干脆来了个大模型降价促销。 降价后的GPT-4Turbo输入token价格是GPT-4的三分之一,输出token价格是原来的二分之一;GPT-3.5Turbo 4K 精调版本输入token价格是此前的三分之一,输出token价格是原来的二分之一;GPT-3.5Turbo 16K精调版本输入token价格是之前的四分之一。 正如奥特曼所言开发者的需求是驱动OpenAI降价的根本原因,这背后还有技术、商业等多重因素。 从技术降本看,根据外媒爆料,OpenAI此次可能将Stateless API变为Stateful API,奥特曼此前曾表示,基于Stateful API,用户不用再“重复一遍一遍地为同样的历史对话付费”,理论上Stateful API形式可将大模型应用的开销削减为原来的二十分之一。 在商业上,OpenAI也一直在寻找突破点,从API、ChatGPT个人版再到企业版,一直在探索商业化。但其对手却未给喘息的机会,微软、Salesforce、开源生态主导者Meta都在以更具性价比的方式,背后“偷袭”OpenAI,商业化的紧迫感与日俱增。 OpenAI降价的背后,也代表着国外大模型已经进入到了普惠化、追求高性价比的新时期。 对初创企业、开发者而言是落地的机会,对OpenAI这类公司也是挑战,由降价而带来的或许是技术能力、资源分配、算力等多方面的挑战。 “在综合考量后,我们优先考虑了价格,但速度却不能同时兼得,这将是接下来研究的重点”,奥特曼道。 据多名使用GPT-4开发工具的技术人员称,GPT-4速率限制已经开始加倍。 “算力应该还好,OpenAI储备足够多”,杨植麟对此发表了意见。 为创业者提供“筑梦”工具 光锥智能在与多位大模型创业者交流过程中发现,很多创业者不是缺乏好点子和创业想法,而是受困于数据、算力、工具、部署、训练、推理等一个个的技术难题。 比如,知乎上一位基于大模型开发的对话解谜小游戏的开发者,就因为游戏用户数量远超预期,导致算力不足而被迫关闭了整个游戏,留给玩家的只有一片遗憾和不舍。 同样在国内,创业者们不是不知道Agent是未来的创业方向,而是心有余力不足。一位Agent创业者告诉光锥智能,“数据清洗、长文本记忆、代码编写、运行测试、部署落地、成本等等九九八十一难,关关难过,关关卡死每一个创业公司”。 据光锥智能了解,无论国内外,Agent离落地还差得很远,目前比较确定的场景可能是Code Agent。原因在于,编码本身就属于大模型训练推理和Agent执行任务的一环,距离最近,改造也越容易。 而现在,OpenAI发布的all tools工具、assistant API(助手API)则有希望使上述这些问题迎刃而解。 assistant API 是OpenAI专门为AI Agent开发者量身打造的工具助手,涵盖了长线程(Threading)、知识库(Retrieval) 、代码解释器(Code interpreter)、函数调用(Function calling)几项工具。 持久且无限长的线程,允许开发人员将线程状态管理移交给OpenAI并解决上下文窗口约束;支持检索功能,利用模型之外的知识来增强,例如专有领域数据、产品信息或用户提供的文档;支持代码解释器功能,与ChatGPT Plus中一样,可以在沙盒执行环境中编写和运行Python代码,生成图形和图表,并处理具有多种数据和格式的文件;函数调用功能也迎来更新,现在可以一次性调用多个函数,并把响应合并到消息输出中。 总而言之,这些新功能精准切中了开发者们卡脖子的痛点,在OpenAI打造的全流程工具链上开发运行,将降低研发的门槛,缩短研发、测试周期,同时节省人力成本。 “我们对OpenAI又爱又恨,一方面它升级的工具有可能一瞬间让我们的业务跑通,但另一方面,我们也得时刻警惕被OpenAI取而代之”,一位Agent创业者道。 让我们聚焦这次发布会的主角——“Agent”。奥特曼给Agent下的定义为,人们利用工具、AI来建立更个人化和定制化的分身,这些分身可以代表个人做很多事情。用户只需询问计算机所想要的东西,Agent分身就能替你完成所有任务。 光锥智能梳理OpenAI做Agent思路后发现,Agent不是凭空而来,一切都基于GPT的大模型,在大模型基础上先是长出了GPT的分身“GPTs”,而后才是“AI Agent”。 “在OpenAI,我们一直笃定渐进的、迭代的部署是解决安全问题的最佳方式,即人工智能的安全挑战。我们认为谨慎对待面向未来Agent尤为重要,这需要大量的技术工作以及关于社会的深思熟虑,所以我们正在迈出通往未来的一小步——GPTs”,奥特曼表示道。 OpenAI通向未来Agent之路已初现雏形,正如其所言,“这还只是通向AI Agents迈出的第一步”,未来也许是多模态、多智能体。 初建大模型生态 技术的迭代固然让人兴奋,工具的推出也让开发者们更加方便快捷,但更重要的是,OpenAI凭借一己之力,让大模型的商业化进一步落地。 早在今年5月,OpenAI开放插件系统后,首批上线了70个大模型相关的应用,包括猜词、翻译、查找股票数据等等工具,彼时便有人预测到,大模型的App Store来了,但后期应用逐渐增加,却并没有跑出“爆款级”应用。 有投资人认为:现在的GPT Store很像刚刚面世时的小程序,处于能力逐步补齐中,此次升级便是逐渐走向成熟的象征,下一个微信或者抖音,很有可能在此诞生。 此次发布会中,OpenAI重新梳理了应用商店的体系,小幅调整了页面布局,将ChatGPT变成了与第三方应用并列的应用层级,并将开发范围扩大到了一个全新的范畴,按照奥特曼的说法,每一个GPT像是为ChatGPT的一个特殊目的,而量身定制的版本。 但让人更为兴奋的是,参考苹果App Store,用户可在GPT Store中搜索下载GPT应用,商店也将推荐生产力、教育和好玩等类别的优质产品,OpenAI也明确了创建者可根据自有GPT的适用人数进行分成。这意味着,基于大模型的应用有了“容器”,开发者找到了买卖的“市场”。 举个简单的例子:大模型本身一块块地皮,工具箱是锤子钉子,不同的开发者将盖不同房子,GPT Store则是一个房地产市场,也就是说,盖出来房子不仅能自用,还能租出去和卖出去。 有了商业化的“交易场”,创业者们就有了正反馈,这使得创业不再只靠激情和梦想,而是拥有了现实收益的可能。 这或许也正是大模型创业者所言的“找落地”,上半年的AI创业离不开两个字“烧钱”,5000万的融资金额对大模型创业而言简直是“沧海一瓢”,投资人不敢出手,创业者们也讲不出新故事。 在现场,OpenAI的工作人员展示了OpenAI搭建的一款旅游GPT的用法:它不仅能列出巴黎旅游建议,还能在地图上将计划中提到的地点按类别标记起来,而这完全可以对用户收费或者进行会员制。 虽然,这并不代表每一个登陆了GPT Store的应用都能赚到钱,但至少有一个窗口可以获得第一批种子用户,从而反哺产品进步,形成增长飞轮。 参考移动互联网应用爆发的年代,每一个细分领域创业者都能挖掘出无数的需求形成应用,这或许也正是创业者们为之兴奋的原因。 这时,才按下了所有APP重新做一遍的启动键。 “我们相信,AI会以一种前所未见的规模,予以个体和机构新的能力。这也将把整个人类提升到我们前所未见的规模”,奥特曼在结尾时提到。 显然,OpenAI想做的,还有更多。基础设施已经初步搭建完毕,剩下的,就是等时间和生态的其他角色,来开花结果。
微软推出“从错误中学习”模型训练法,号称可“模仿人类学习过程,改善AI推理能力”
IT之家 11 月 7 日消息,微软亚洲研究院联合北京大学、西安交通大学等高校,提出了一项名为“从错误中学习(Learning from Mistake,LeMA)”的 AI 训练方法,号称可以通过模仿人类学习知识的过程,来改进 AI 推理能力。 当下 OpenAI GPT-4 和谷歌 aLM-2 等大语言模型在自然语言处理(NLP)任务,及思维链(chain-of-thought,CoT)推理的数学难题任务中都有不错的表现。 但例如 LLaMA-2 及 Baichuan-2 等开源大模型,在处理相关问题时则有待加强。为了提升开源这些大语言模型的思维链推理能力,研究团队提出了 LeMA 方法。这种方法主要是模仿人类的学习过程,通过“从错误中学习”,以改进模型的推理能力。 ▲ 图源 相关论文 IT之家发现,研究人员的方法是使用一对包含“错误解答”与“修正后正确答案”的数据来微调相关模型。为取得相关数据,研究人员收集了 5 个不同大语言模型(包括 LLaMA 及 GPT 系列)的错误答案和推理过程,再以 GPT-4 作为“订正者”,提供修正后的正确答案。 据悉,修正后的正确答案中包含三类信息,分别是原推理过程中错误片段、原推理过程出错的原因、以及如何修正原方法以获得正确答案。 研究人员采用 GSM8K 及 MATH,来测试 LeMa 训练法对 5 个开源大模型的效果,结果显示,以改进过的 LLaMA-2-70B 为例,在 GSM8K 的准确率分别为 83.5% 及 81.4%,在 MATH 则分别为 25.0% 及 23.6%。
领克 03++,国产燃油车最后的荣光
巴音布鲁克没有海,Heroes never die。 四年前的春节档,我坐在电影院里看完了《飞驰人生》。 电影最后,张弛孤注一掷燃尽赛车的所有,冲出了巴音布鲁克赛道坠崖而去。同一时刻金光乍现,守望先锋的「天使」缓缓抬起手心,轻声唤出了在游戏里拯救过无数玩家的「Heroes Never Die」。 定格在打破次元壁的荧幕画面,一阵独属燃油赛车的畅快感直冲脑门,激起我一身鸡皮疙瘩。在那个新能源还没有崛起的 2019 年,电影的最终幕加深了高性能燃油车型在我心中的分量。 四年过去,守望先锋「凉」了,国内传统燃油车也在新能源一通高歌猛进下,显现出了些许疲态。当传统燃油的激情淡却,沉默粗暴的电机开始占得市场的「高地」,国产高性能燃油车市场却潦草地变成了一块「荒地」。 值得欣慰的是,在这块「人迹稀少」的荒地上,仍然有人在选择开荒,坚守着国产燃油车的最后荣光。 ▲ 领克 03++ 10 月 19 日,领克正式推出了国内首台高性能燃油车,领克 03++。领克在 03++ 上衍生出了两款车型,分别是四驱版本的 03+ Racing 以及几近百分百还原赛道前驱版本的 03+ TCR Cyan。在领克 03++ 的「心脏位置」,搭载了一颗 2.0T 支持机械增压的发动机,最高能够迸发出 350 匹马力,450 牛米的峰值扭矩。 有意思的是,在领克 03++ 发布的当晚,尹正(*飞驰人生主演之一)在社交平台上公开表达了对领克 03++ 的钟爱。 ▲截图来自微博@尹正 守望先锋已「死」,但国产高性能燃油还未「死」去。新能源时代下显得「平平无奇」的性能数据,无法掩盖领克 03++ 带给中国汽车工业的历史意义。 领克的原汁原味 国内能够端起「高性能燃油」饭碗的人并不多,领克就是其中之一。 2018 年,WTCC 世界房车锦标赛官宣改制,新的 TCR 赛车规范将会取代原本的 TC1 规格。改制后,WTCR 最大的变化就是参赛的厂队退出围场,转变成为「技术支援」的角色。同时,WTCR 的新规对参赛车型做出了严格的规范,现行的参赛车型必须满足以下条件: 采用前轮驱动 选用 4/5 门结构车型 强制采用进气量在 1.75-2.0 升的量产发动机 发动机输出的最高马力不得超过 350PS 简而言之,就是造车车企「退场」转为技术幕后,并将「决胜球」彻底交给车手,改制的终极目的是重新提升比赛的观赏性。 ▲ WTCR 赛事中的领克车队 图片来自-AutoSport 同年,领克发布 03 车型,并 03 的基础上改造 TCR 赛车,尤其值得一提的是,领克 03 是首款采用 CMA 架构的领克轿车车型。出色的架构兼容性为扫清了调教障碍,只用了不到半年的时间,领克 03 成就功在 2019 年的 WTCR 揭幕战亮相,成为首支参加 WTCR 世界房车锦标赛的中国品牌车队,而在 2019 年之前,WTCR 还从未有过中国汽车品牌参赛。 2019 年-2021 年,领克车队在 WTCR 赛事上取得三连冠,成为首个实现世界顶级汽车运动赛事三连冠的国产品牌,领克在汽车性能赛事上的含金量毋庸置疑。 有意思的是,得益于严格的赛制要求,比起 F1 这样的绝对顶流赛事,WTCR 反倒还不至于太魔幻,相对也更贴近现实。赛制中强制启用「量产」发动机的条件,让原汁原味的比赛车型进入现实成为可能,WTCR 反而成为了领克 03++ 的试金石。 领克 03++ 的推出,就像是领克将比赛用车从赛道搬到了日常马路上来,前驱结构、5 门的车身结构、超大碳纤维尾翼再加上货真价实的 350PS 2.0T 发动机,相比前作车型 03+ Cyan,新车减重达到 150kg,整车的热管理系统能力提升接近 60%,03++ 拥有一个更高的性能极限。从任何角度来看,领克 03++ 都是一款合格到不能再合格的「性能车」了。 然而,领克对「原汁原味」的阐释没有止步在单一的硬件素质上,在对赛道性能的诠释上,领克还想做得更极致。领克 03++ TCR Cyan 版车型彻底放弃了后排空间,内部团队在车内增加了更多的赛道元素,除了内饰大面积翻毛皮材质的使用,前排还采用了经典的赛车座椅设计。另外,最亮眼的是在后排,领克彻底放弃了后排使用空间,保留了赛道版上的原厂防滚架设计。 ▲ 03++ 前后排 后排配备原厂防滚架设计 正如尹正所说,领克 03++ 是一台「真正」的性能车,国产品牌能够凝结赛道结晶,做出这样一款出色的燃油高性能车型,极其难得。 属于小众的胜利 性能车市场,本就是极小众的。 在过去 2022 年的国内市场,宝马 M Power 系列年销量为 3824 台,奥迪运动线(S+RS)的年销量约为 4100+ 台,而卖得最好的奔驰 AMG 系列也不过是 21000 余台。 在整个市场大盘中,燃油高性能汽车占到的份额极其小,更糟糕的是在极小的份额之上,留给国产品牌的空间也相当狭窄。在新能源浪潮下,纯电车型的出现也迫使高性能燃油车市场面临着萎缩下行,领克这个时候推出 03++ 这种高性能燃油车型,显然是「吃力不讨好」。 领克内部人士曾经向外界透露过,领克曾经也有过放弃 03++ 的打算,一方面是团队也不清楚在纯电时代推出高性能燃油车到底还有没有意义,另一方面是产线和供应商的困难,为了量产 03++,领克重组了自己的供应商伙伴,所有的车辆性能配件生产线也进行了重塑,其中需要投入的成本和精力可想而知。 03++,最终还是如约出现在了我们面前,领克「偏往虎山行」的策略与自己的产品规划有关。 诞生 7 年 ,领克即将成为首个达到百万销量的中国高端(汽车)品牌。 两个月前,吉利集团副总裁林杰在领克 08 的发布会上这样说道。领克对自身的定位是有要求的,想要在做到高端豪华的同时达到百万销量,领克就需要足够「深厚」的产品矩阵。 ▲ 领克 08 发布会现场 追寻领克的产品线,我们可以发现领克对性能衍生车型异常执着,几乎每一条车型线上都有着衍生性能版本的推出。比如领克在 02 系列中推出的「小钢炮」Hatchback 车型,还有在 05 系列中衍生出 6.5s 破百的 05+。 实际上,高端豪华、年轻运动就是领克的品牌底色,03++ 填补的正好是领克在高性能燃油车产品上的空白。把话说得直白一些,03++ 承载的产品意义要比销量更重要,领克更在意 03++ 技术标杆的作用,这是领克品牌的生命力来源。 难能可贵的是,领克抛出的「技术标杆」并非高不可攀。相比一些品牌将高性能燃油产品「束之高阁」,当作是拉高格调的传家宝,领克反倒是真正关注到了 90 后、甚至是 00 后这一批极小众性能车爱好者的需求。从 03+ 之后,领克 03++ 延续了「亲民」的定价策略,其中四驱版本的 03++ 起售价为 28.58 万,TRC Cyan 版本车型起售价为 42.3 万元,可玩性出色的高性能燃油车也不再是少数爱好者的宝贝。领克 03++,是一场属于小众的胜利。 电动时代里,几乎所有同行都在全身心地投入纯电浪潮,而领克却在「荒地」里种出了新的花,我们理应向领克表达敬意。 毕竟,中国汽车工业的胜利不该只属于新能源。
一款AI检测工具被爆出!可轻易识别ChatGPT撰写的论文
财联社11月7日讯(编辑 周子意)根据周一(11月6日)发表在科学顶刊《细胞》物理子刊《Cell Reports Physical Science》上的一项研究,科学家已研究出一种机器学习工具,可以很容易地识别出使用聊天机器人ChatGPT撰写的化学论文。 该论文的合著者、美国堪萨斯大学的化学家Heather Desaire指出,“大多数文本分析领域都想要推出一种真正通用的检测器,可以适用于任何东西”。但她表示她的团队正通过制作一种专注于特定类型论文的检测工具,旨在“追求准确性”。 Desaire称,研究结果表明,开发人工智能(AI)检测器的努力可以通过定制软件来促进特定类型的论文写作,“如果你能快速而轻松地构建一项专门的工具,那么为不同的领域构建不同的工具就不是那么困难了。” 从公布的数据来看,这种专门的检测器比市面上现有的两种人工智能检测器的性能都要好,可以帮助学术出版商识别出那些由人工智能文本生成器生成的论文。 准确率惊人 Desaire和她的同事在6月份首次描述了他们研发的ChatGPT探测器,当时他们将其应用于《科学》杂志上的Perspective文章。该团队使用人工智能检测器检查写作风格的20个特征,包括句子长度的变化、某些单词和标点符号的频率等,来确定文章是有人类科学家所作还是由ChatGPT所生成的。 当时的研究结果表明,“你可以使用一小部分特征来获得高水平的准确性”。 在最新的研究中,该团队将美国化学学会(ACS)出版的十本化学期刊的论文引言部分作为人工智能探测器的训练对象。 研究人员将100篇已发表的人类撰写的引言作为比对材料,然后要求ChatGPT-3.5以ACS期刊的风格撰写200篇引言。其中100篇是研究人员向ChatGPT提供了论文标题后生成的,而另外100篇是研究人员向ChatGPT提供了论文摘要后生成的。 研究结果显示,当把人类撰写的引言和和人工智能从同一期刊上生成的介绍进行测试时,该人工智能检测器能够100%识别出由ChatGPT-3.5编写的前100篇引言(基于论文标题生成的);而对于后100篇ChatGPT-3.5生成的引言(基于论文摘要所生成的),检测的准确率略低,为98%。 此外,该工具同样适用于ChatGPT-4编写的文本。 相比之下,市场上的另两款人工智能检测器中,德国的ZeroGPT识别人工智能编写的介绍的准确率仅为35-65%,这取决于使用的ChatGPT版本以及介绍是由论文标题还是摘要生成的。而OpenAI自身的文本分类器工具也表现不佳——它能够识别人工智能编写的介绍,准确率约为10-55%。 柏林应用科技大学研究学术剽窃的计算机科学家Debora Weber-Wulff评价道,该篇论文的作者们所做的是一件“令人着迷的事情”。 她表示,许多现有的工具试图通过搜索人工智能生成的文章的预测文本模式来确定作者的身份,而不是通过观察写作风格和文体的特征。Weber-Wulff 称,“我从来没有想过在ChatGPT上使用文体计量学。”
AI加持、可在车内玩3A游戏 英特尔新一代智能座舱亮相进博会|AI前哨
凤凰网科技讯《AI前哨》11月7日,11月5日-10日,第六届进口博览会在上海举办,展会上,和汽车行业相关的新技术备受关注。英特尔展出了针对智能汽车打造的新一代酷睿核心智能座舱平台。 据悉,英特尔智能座舱平台方案通过搭载新一代酷睿核心的智能座舱平台,能为用户提供了行业领先的CPU和GPU算力以及丰富且开放的软件堆栈。英特尔强大的算力给汽车生产厂商带来创新空间,为客户提供差异化应用和体验。乘客通过全3D交互界面在座舱内享受身临其境的体验,可拓展的独立显卡可让玩家在车内可以享受3A游戏。 英特尔操作系统开发首席工程师陈鲁海表示,该性能座舱平台的AI能力让大语言模型应用和人工智能脱离云端限制、走进车内,可以使语音助手更加智能。此外,该解决方案还为用户带来更好的软件兼容性,当用户在车内使用传统安卓车机应用时也可随时实现和PC同样的办公、视频编辑、在线会议等功能。 英特尔公司副总裁、中国区本地化及车载产品总经理王军表示:汽车电动化、智能化和互联化发展已然成为整个行业的主流。作为行业领先的半导体供应商,英特尔在智驾领域不仅拥有独到优势,还始终在与众多系统集成商、软件供应商及汽车厂商进行广泛合作,以助力打造更智能、更舒适、更安全及可共享的未来软件定义汽车,加速推动汽车产业进入新的发展阶段。 本次进博会期间,英特尔还展示了在AI PC方面的创新成果,包括通过14代酷睿和锐炫显卡的硬件创新,AI模型优化和工具的软件支持,英特尔实现了生成式AI在个人电脑上的广泛应用,将前沿的AI技术应用于个人计算领域。近期,英特尔还启动了首个AI PC加速计划,希望在2025年前为超过1亿台PC实现人工智能特性。
苹果硅计划3年,当年的屠龙靓仔变了
苹果公司是在2020年的双十一,亮出的M1芯片,算下来刚好是三年。 所以苹果的“硅计划”(Apple Silicon)也刚好推出三年了,当年的M1亮相,完全是大杀四方的屠龙少年形象,5nm制程、160亿晶体管,并直接将Mac电脑的CPU性能提升3.5倍、GPU提升6倍、机器学习速度提升15倍。 更别提之后的M1 Ultra通过UltraFusion封装架构,将两颗M1 Max芯片“焊”在一起,达到了恐怖的1140 亿晶体管体量,并成为首发Mac机型Studio的主力CPU。 不过三年之后,当年的屠龙靓仔也在调整自己的节奏,这次M3系列芯片的发布就明显不一样,产品的节奏、性能、价格的设定,引起了不少用户和媒体的关注,芯东西今天结合M3 MacBook Pro的上手来聊聊M3系列芯片和苹果硅计划的变化。 ▲搭载M3 Max芯片的新款MacBook Pro 一、一场很不一样的发布和不一样的“套路” 北京时间10月31日苹果线上进行的新品发布有很多与以往不同的操作,且不说创下了史上最短苹果发布会的纪录(25分钟左右),这都是表面。 比较关键的地方还有,虽然发布的是M3系列芯片和Mac电脑产品,这次上来就讲芯片,而且是三颗芯片一起和盘托出。要知道在M1系列发布的时候,M1 Pro/Max距离M1标准版发布相距11个月,“超大杯”M1 Ultra发布则又过了5个月。 ▲搭载M3 Max芯片的新款MacBook Pro 芯东西与苹果相关人员的交流中得知,这样做的一个核心原因是有些新技术要在全线产品用到,希望更多用户能更快地用到新的先进技术,这里的新技术应该主要指动态缓存、GPU的光追功能等等。 我估计也有另一层原因是,在架构设计、量产上,已经允许做到M3、 M3 Pro和M3 Max同步实现量产。 很显然,这样做的成本投入是绝对的大手笔,这两天就有分析师估计,仅苹果M3、M3 Pro和M3 Max处理器的流片(Tape-Out)成本就达10亿美元。 还有几个用户普遍关注的问题,我们也探寻了答案,比如Mac Book Pro该不该保留8GB内存的选项,苹果方面的考虑认为,苹果的统一内存,相比传统PC内存的每个GB的意义不太一样,8GB所起到的作用可相当于其它平台16GB的表现,已经够用,不过这个当然还是要用户体验中去感受了。 二、飙涨的GPU性能为何而存在? 苹果这次M3系列芯片和Mac电脑芯片发布,与其说是在发电脑SoC,不如说在发GPU,因为这次芯片GPU提升是最明显的。 不仅这次苹果对GPU架构进行了大幅改进,还加入了全新的动态缓存技术。同时,把硬件加速光线追踪和网格着色等全新渲染功能带到了Mac平台。 所带来的变化就是渲染速度与 M1系列芯片相比最快2.5倍,至于为什么关键参数比较上,发布讲解时主要是在和M1系列相比呢? 其实很简单,他们觉得M1系列的用户可能到了换机时间,当然更多英特尔芯片的老Mac钉子户,肯定也是他们的目标,所以发布会上其实也没少提。 回到M系列芯片GPU性能的大幅提升,除了更强的图像、视频处理能力,游戏画质表现,业内也有一个越来越趋向共识的观点: 那就是苹果在为Vision Pro和AI大模型计算铺路,最近库克已经在多次采访中提及大模型,铁定苹果内部在紧锣密鼓地开展大模型开发研究,而大模型的AI训练、推理、生成运算GPU有着先天优势已经成为业内共识,所以这波M3系列芯片猛冲GPU性能也就能理解了。 ▲M3 Pro与M2 Pro的关键参数对比 ▲M3 Pro有了更细分的购买选项 不过这其中还有一个悬疑,就是为啥系列中的M3 Pro级芯片相比M2 Pro和M2 Max的差距拉大了,甚至部分参数有降级,比如M3 Pro的内存带宽为150GB/s,而M2 Pro芯片的内存带宽统一为200GB/s;M2 Pro芯片是标配8个性能核心和4个能效核心的12核中央处理器,而M2 Pro则提供了11核、12核处理器,分别对应14核GPU和18核GPU两个选项,等于是M2 Pro又分出了两档可选。 这样做很明显就是销售策略,把性能档次切分得更细了,但对用户不是很友好,肯定会有人选择上犯难。 三、M3版MacBook Pro的变与不变 上手M3 Max芯片版14英寸MacBook Pro,外观变化既一眼可辨,又能发现毫无差别。 ▲深空黑色MacBook Pro 一眼可辨的是新增的深空黑色,其实我感觉这是一种回归,早些时候Pro系列比较轻薄不是这套模具的时候,也有偏深色的可选,现在等于是一种回归,对于数码极客发烧友,深色确实能讨不少人喜欢。 其它接口、配置都没有啥变化;视网膜XDR显示屏也是笔记本电脑端的顶流配置了。 重量方面14英寸的MacBook Pro比15英寸的MacBook Air要重不到100克,从MacBook Pro换了新模具之后,就没有在重量上克制,与Air系列形成两个截然不同的路线,一个追求极致性能,一个追求极致轻便和续航。 性能上我们做了两个代表项目的跑分测试,详情如下。 性能跑分测试中,我们用到了最新版本的CINEBENCH,CINEBENCH使用针对电影电视行业开发的Cinema 4D特效软件引擎,测试CPU和显卡的性能。 找了几款有代表性的机型测试结果如下,从数据看,有几个特点,一个是M3 Max的GPU提升最为明显,二个是M2 Max和M3 Max实测差距没有想象中大,但是相比M2和M1标准版,几乎都是大几倍的性能提升,用最新版CINEBENCH甚至已经测不出初代M1芯片的GPU得分了。 接着做了一个视频工程文件导出的速度对比,视频文件有5个多G。 从实际表现看,同样是相对M2标准版,导出时间有成倍的减少,但是相比M2 Max,变化貌似没那么明显。 结语:在挤牙膏和憋大招中前行的苹果硅计划 看完这次苹果M系列芯片发布后的用户和媒体反馈我的感觉是,苹果现在所处的位置其实挺难的,在挤牙膏和憋大招中如何找到自己恰如其分的出招节奏呢? 芯片制程工艺都干到3nm了,架构、性能、能效的提升不可能按“年”为单位逆天般的升级,但用户的期待是无限的。 ▲深空黑色MacBook Pro 所以苹果这次的做法我感觉是有点策略上的调整,在CPU和GPU上各有侧重地做文章。 苹果2020年宣布M系列芯片和硅计划的时候,说的是2年全面替代英特尔芯片,现在这个目标其实已经达到了。 所以现在更像是开启了苹果硅计划的一个新征程,如何为算力猛兽Vision Pro的XR应用和AI大模型计算提供更强的算力保障,可能是苹果硅计划新的星辰大海,至于Mac电脑端的提升节奏,在一段时间内,可能就会慢一些了。
字节PICO大裁员!对话内部员工:有的N+1,有的“一锅端”
作者 | 徐珊 智东西11月7日消息,7日早上10点,国内VR巨头PICO迎来了一次生死存亡的全体员工大会,并宣布了开启大裁员模式。 对此次裁员的原因,PICO CEO周宏伟表示此前对市场判断有所失误,VR行业处于非常早期的状态,且行业和市场的发展并没有那么乐观。不仅如此,他还谈到此前的调整措施不够及时有效。 ▲PICO CEO周宏伟 据智东西了解,此次PICO裁员将涉及上千名员工,国内,海外市场均有波及,市场销售服务、Studios、视频、平台业务等团队将成为裁员的“重灾区”。此外,PICO的移动OS团队将并入字节跳动产品研发与工程架构中台,以加强OS核心技术的研发投入和统一管理。 PICO此次裁员究竟调整哪些内容?PICO员工又将何去何从?智东西独家对话10位PICO内部员工,了解到PICO裁员潮的第一手信息。 一、PICO裁员内部讲话公开:调整不够有效,移动OS团队并入字节中台 在内部会议讲话中,周宏伟谈到此次调整总体思路为更加聚焦在硬件和核心技术上,在其他方面缩小投入,保持组织的精干性。 围绕这一思路,一些非核心部分,尤其是,市场销售服务、Studios、视频、平台业务等团队的人员将面临缩减。 令人意外的是,PICO视频团队也成为裁员关键之一。加入字节跳动后,PICO视频一直是PICO打磨的关键功能亮点之一,也先后引进了火山引擎算法,字节跳动的抖音等多个团队的人才。在资金层、人力团队等多个方面,PICO投入良多。 视频团队的员工缩减,也侧面透露出,在未来一段时间内,字节跳动将不会将内容资源大力倾向PICO。 此次裁员后,PICO的团队规模将会维持在数百人左右。而在PICO加入字节跳动前,其团队规模就达到了300余人。 对于留下的PICO员工,也将迎来一次新的架构调整。其中,最为重要的变动之一是,PICO的移动OS团队将并入字节跳动产品研发与工程架构中台。 这一调整,无疑将会影响到PICO的基本盘。据PICO内部的员工告诉智东西,此次调整是PICO的研发人员将调整到字节跳动的研发与工程架构中台,但OS的产品和设计不去中台,PICO的OS将会成为长期重点投入的重点。 以下为周宏伟在PICO员工内部大会上的演讲全文: ▲PICO内部讲话实录 二、独家对话PICO员工:获N+1补偿,部分部门被“一锅端” 消息一出,行业内随之震荡。不少VR/AR企业随之发布招聘启事,开始计划从中吸纳更多的人才。在短短的三小时时间内,PICO裁员相关群的人员已经达到300余人。 智东西也随之联系了10位PICO老员工,了解到他们的最新动态。其中,市场部门部分员工受到影响较大,也有不少员工在此次裁员前就在内部动荡的过程中离开了公司。多位研发技术人员则回应到,暂未受到影响。 此外,据不完全了解,此次裁员过程中,PICO高层受到的影响仍在一定范围内,而PICO的员工则面临较为严峻的裁员形势。据脉脉上来自字节跳动员工的信息透露,部分部门将会出现“一锅端”的情况,另一部份的部门将会“有所缩减”。 ▲PICO内部员工透露裁员情况(来自:脉脉社区) 据悉,对这些已经拿到毕业通知的人,PICO将会提供公司内部转岗的机会,提供合理补偿。部分员工在脉脉上通知,他们获得的补偿金额为N+1。 三、PICO内部“抖音派”已接近解散,PICO员工数或回到加入字节前 PICO裁员的相关消息,从10月起,就开始陆续放出。10月21日,据亿欧网报道称,相关人士透露张一鸣在听取PICO负责人周宏伟的汇报工作后,因PICO成绩未达预期,计划逐步放弃PICO业务。 业内消息透露,PICO内部员工数最高时可达2000人。今年3月,PICO 开启第一轮裁员潮,裁员约为整体的20%-30%,多为市场、销售等非核心技术产品线员工。而在后续不断的优化和调整中,今年10月,PICO员工已经逐渐回落到千人团队左右。如今,第二轮裁员潮过程中,PICO将团队员工规模缩减至数百人左右。 而在2021年,加入字节跳动前,PICO CEO周宏伟曾透露,其团队规模已经达到300余人。这两年,对PICO来说,似大梦一场。 不仅如此,曾经充满信心加入PICO,来自抖音团队的高层,也各奔东西。 比如说,曾为抖音创始团队的元老,现为PICO副总裁任利锋已实际意义上处于离职状态,其手下的内容产品负责人也离开了PICO,调回抖音内部;抖音综艺负责人宋秉华在去年年底已经调岗回到抖音的综艺和娱乐部门;PICO视频直播负责人刘彧已离职。可以看出,曾加入到PICO的“抖音派”高层几乎都已经先后撤离PICO。 曾有媒体报道PICO内部党派纷争严重,面对此次裁员,很难说,是不是抖音派和PICO派党派之争两败俱伤的最终结果。 结语:VR头显市场走入低谷,PICO能否起死回生? 从奇遇VR接近关停,PICO两轮大裁员、VR头显销量同比下降80%等种种消息来看,今年国内VR头显市场明显已经进入低谷期。 无论是Meta两次万人裁员,调整Reality Labs内部结构,还是PICO两次大裁员,试图“断尾求生”,都可以看出推进一个新的品类,绝非一件易事,而迎接头显市场的爆发节点,仍是一个需要漫漫等待的过程。 在大刀阔斧地裁员后,PICO又将如何调整自己的业务重心?它将如何面对不断变化的VR市场?我们将持续关注。
X 掉蓝鸟,对标微信,马斯克收购 Twitter 一年后搞砸了吗?
我们的目标很简单:让 X 成为互联网上最酷、最令人愉快的地方。 10 月底,原来的 Twitter、现在的 X,在官方账号「开香槟」庆祝一周年。 大摇大摆扛着水槽走进 X 总部一年后,马斯克得到他想要的结果了吗?一切解释权在马斯克本人。 在一周年的全体员工会议上,马斯克表示,X 将继续向万能应用努力,社交、视频、通话、招聘、约会、支付都会纳入麾下。 或许你会觉得这像微信,但马斯克直说了,他想要超越微信。 险中求生的成绩单,雷厉风行的马斯克 一年前,马斯克以 440 亿美元的价格收购了 X,现在,X 的最新股票估值为 190 亿美元,打了个腰斩价。 泰山崩于前而色不变,然后可以制利害,马斯克在员工面前还是个「阳光开朗大男孩」。 X 在 9 月公布,每日活跃用户数量为 2.45 亿,低于马斯克在 2022 年 11 月分享的 2.594 亿,但高于马斯克收购前的、2022 年第二季度的 2.378 亿。 马斯克也在全体员工会议上说,X 每月有超过 5 亿用户,每天大约有 5 亿条帖子,每天约有 100 万新用户注册,用户使用时间有所增加,平均每天在 X 上花费超过 32 分钟。 官方散发着快活的空气,第三方数据却都在泼冷水。 Sensor Tower 统计发现,相比去年 10 月,X 今年 9 月的 app 日活用户下降了 16%。 Similarweb 的数据也显示,从网站到移动应用,X 各方面的流量总体都在下降,只有马斯克的个人主页访问量增加了,报告中还忍不住讽刺了句: 如果马斯克想为个人主页增加流量,肯定有比起 440 亿美元更便宜和简单的方法。 既然马斯克已经选择了更艰难的道路,花了大手笔买下他的玩具,该降本增效的时候自然也不留情面。 ▲以办公室睡袋照出圈的 X 主管也在 2 月被裁了. 最为直观的是,X 员工人数从去年 9 月底的 7500 名降到 4 月的 1500 名。 留下的精英以一当十,工程团队大改后台,重构了信息流和排序系统,代码从 70 万行减到了 7 万行,计算占用量减少了 50%,处理相同请求的能力提高了 80%。马斯克深感欣慰: 我对软件的总体理念是,添加一行代码得一分,删除一行代码得两分。 对于马斯克来说,裁员和改代码只是手段,把 X 打造成「数字城市广场」才是目的,他希望开源算法,驱逐机器人水军,允许人们「在法律范围内」随心所欲地发布内容。 于是,他火速开除了信任和安全团队的大部分员工,邀请特朗普重返 X,还彻底改变了验证机制,将公众人物才有的「蓝 V」,改为面向全体用户的付费订阅,只要满足状态足够活跃、提供电话号码等条件,就能享受尊贵标识和更多功能。 张信哲唱过「怎么忍心怪你犯了错,是我给你自由过了火」,固然付费认证可以区分僵尸账号,但大量冒充品牌、名人和政客的假账号也随之涌现,X 在去年 11 月叫停了「蓝 V」订阅,又在 4 月重新推出。 ▲ 冒充任天堂的账号发了竖着中指的马里奥. X 目前的付费订阅方案分为三种:每月 3 美元的 Basic、每月 8 美元的 Premium、每月 16 美元的 Premium+。 Premium 及以上的用户即有资格申请「蓝 V」,为了避免假账号再扎堆,X 还为企业、组织等推出了「金 V」或「灰 V」,与 QQ 会员的黄蓝红钻有异曲同工之妙。 广告业务是 X 最主要的衣食父母,但因为假冒账户、不良内容可能带来的品牌安全风险,不少广告商落荒而逃。 5 月,琳达·亚卡里诺代替马斯克担任 X 的 CEO,她曾在 NBCUniversal 领导全球广告业务,所以她的上任被外界解读为重建 X 和广告商的关系,同时马斯克也能腾出手来专注于产品和工程。 10 月 26 日,琳达在官方博客写道,去年排名前 100 的广告商中有 90% 回归了 X。然而今时不同往日,广告商就算回来了,预算也不复从前。 Guideline 的数据显示,自收购以来,X 的美国市场广告收入不断下降,每月同比下降至少 55%。 ▲ 图片来自:Reuters 唱衰的声音再多,马斯克「虽千万人吾往矣」,他在 7 月大刀阔斧地把 Twitter 改名为 X,新 logo 被批评是「审美大降级」。 #GoodbyeTwitter 的话题、层出不穷的梗图、骤降的下载量和激增的负面评论,成了「小蓝鸟」最后的波纹。 出走半生,归来仍是少年,种种折腾下来,X 依然是流量最大的社交网络之一。 或许最让马斯克高兴的是,Meta 在 7 月推出的 Threads 用户数量仍然远少于 X,远远不足为虑。几天前扎克伯格还因为训练伤了膝盖,两人相约的笼斗更加遥遥无期。 不让后悔的线上生活,擅长画饼的万能应用 人无法两次踏进同一条河流,我们也不能以过去的眼光看待马斯克的 X。 为了衡量一个社交平台是否成功,原来的 Twitter 首创了 mDAU(可变现的每日活跃用户)的指标。 但马斯克觉得不够,提出了一个新概念:不后悔的用户分钟数。去年 12 月,他曾公开表示,听很多人说后悔在 TikTok 上花了两个小时,不想 X 也是这样。 李佳琦的「全网最低价」是不许别人卖得更便宜,马斯克的「无悔分钟数」是尽量减少花花世界的吸引力,原地解决人们线上生活的一切。 从 8 月开始,把外部网站的新闻链接分享到 X 时,标题不再出现,有些用户可能以为刷到的只是图片。 ▲ 用户故意用造谣讽刺马斯克. 这直接影响了跳转链接的概率和新闻网站的流量,但马斯克表示是「为了美观」,并且更欢迎创作者在 X 直接发布长篇内容。 毕竟,在 X 发布多于 280 个字,就得订阅 Premium,马斯克多赚了一份钱,同时 X 在开发自己的富文本编辑器,按马斯克的话说,将支持发布「带视频的插图小说」。 为了留住用户,马斯克还押注了视频,认为「视频是消费信息的最佳方式」,他曾考虑带回 2016 年被 X 关闭的短视频应用 Vine,最近又对标了 YouTube,希望将 X 内置在电视中。 你可以观看 YouTube,也可以观看 X。 相对应地,X 改善了直播、长视频等功能,欢迎用户上传整部电影,马斯克偶尔也会用直播视频游戏的方式亲自测试。未来,X 有望提供体育比赛和火箭发射的 4K 直播,也在 YouTube、TikTok 主导的视频广告市场分一杯羹。 有了更丰富的文本和视频内容之后,X 还将大幅改进语义搜索,当用户输入搜索词,可以看到意思相符的文本、图片和视频,而不仅仅是完全的文本对应。 内容是 X 的本职,马斯克不满足于锦上添花,他要疯狂跨界,他要无限可能,他要靠一个平台就吹出人类的未来。 7 月曝光截图的音视频通话,X 最近在 iOS 推出了初期版本,很快也会发布到 Android,所有账号都可以接听电话,包括关注人或通讯录的电话,但只有 Premium 用户可以发起通话。如果呼叫他人,那么对方必须至少发来过一次私信。 音视频通话将适用于 iOS、Android、Mac 和 PC,并且类似 FaceTime,拨打可以无需知道电话号码。马斯克所希望的是,X 最终成为「全球的通讯录」。 ▲ 音视频示例. 未来的 X 全体员工会议,将每季度举行一次,下一次会议就将使用 X 的视频通话功能,甚至进行直播,让公众也可以观看。 以 PayPal 打响名声的马斯克,更是从未放弃对金融和支付业务的野心。 X 最近在新西兰和菲律宾试点,让当地用户每年支付 1 美元的服务费,简单粗暴地打击机器人,如果试点成功,以后可能会推行到更多地方。马斯克觉得,直接让用户付费,比让你找哪张图片有红绿灯的测试题更加高明。 每年 1 美元对任何人来说都微不足道,但如果想做 10 万个机器人,仍然是昂贵的,必须有 10 万美元才能获得 10 万个机器人,并且需要 10 万种付款方式。 除了把机器人拦截在平台之外,不多不少的 1 美元,也是一次投石问路,慢慢让用户习惯为 X 付费,从而为未来的金融功能做铺垫。 目前,X 还处于获取各州汇款许可证的阶段,预计在 2024 年底上线金融服务,并计划推出全球支付系统,最终「让资金像信息和对话一样自由流动」。 当我提及支付时,实际上指的是一个人的整个财务生活。不论是转账、证券还是其他,只要涉及到钱,都能在我们的平台上进行,你将不再需要银行账户。 虽然没有明确的盈利模式,职场和约会应用也在 X 的射程之内。 8 月,X 更新了隐私政策,表示可能会扩大收集的数据类型,包括工作经历、教育经历、就业偏好、求职活动、技能和优势等,为类似领英的功能作准备,并展示更多相关的广告。 马斯克认为,某人过去在 X 上发布的内容,是企业衡量人才的一项重要指标,甚至在寻找浪漫关系时也是如此。 不得不说,马斯克的知识,学得有点杂。X 仿佛微博、支付宝、YouTube 等的大杂烩,集结了社交媒体最主流的功能,兼具创作功能和商业属性,但 X 不一定能够完全消化。 别忘了,马斯克不只是「I Have a Dream」的大梦想家,也是擅长画饼的企业家。 今年 6 月,Insider 报道,X 还剩下大约 500 名工程师,他们不断地同时开展多个项目,任务往往会根据马斯克的突发奇想而迅速变化,导致他们无法完成已经开始的工作。 真假难辨的数字广场,社交媒体的宇宙中心 成大事者不拘小节,什么也无法动摇马斯克的梦想:做出一个超越微信的万能应用(everything app)。 强者不回头看爆炸,过河之人不恋逝水。2021 年,X 公开报告的财务业绩显示,广告占到收入的 90%。去年 11 月,马斯克在 X 的第一封全员信,像任正非那样将寒气传递给每一个人,直言不能太过依赖广告,订阅应占到总收入的 50%。 为了给 X 增加收入来源,马斯克可谓是费尽了心机,已经落地的订阅服务、八字还没一撇的金融服务、说不定也会付费的职场和约会服务…… 除此之外,他还联动了 AIGC。 11 月 4 日,马斯克表示,一旦结束早期测试,他旗下的 xAI 刚发布的第一款大模型产品 Grok AI,将向所有订阅 Premium+ 的 X 用户开放,Grok 还具有通过 X 获取实时信息的独特优势,看来还真想搞一个 X 系列的全家桶。 马斯克也不是非得站着才能把钱挣了,踩在前人的脚印上也很好。X 最新的赚钱方式是用户名。《福布斯》报道, X 正在制定一项计划,通过出售废弃的早期用户名创造新的收入,有的收费高达 5 万美元,仿佛竞拍 QQ 靓号的海外版。 理想是远大的,现实是骨感的。仅从市场的表现来说,订阅也好广告也罢,也没拦住 X 的估值下降。 当初马斯克宣布收购 X 时,a16z、甲骨文、红杉资本等投资大佬排队出资,银行也提供了贷款,但目前这仍然是笔赔本买卖。 但金钱对于马斯克只是一个数字,他心里还有一个「天下大同」的画面。 比如,他希望零基础的用户直播和上传视频,不必通过媒体的镜头,直接让其他人实时看到现场正在发生的事情。哪怕是文字信息,也可以从 X 直接获取,他甚至反问过「阅读 X 几天前已经发布的 1000 字」有什么意义。 新闻确实发生了深刻的转变…… 所有人类都是人类集体思想的眼睛和耳朵。 这固然符合马斯克对「数字城市广场」的展望,但他还是对人性太有信心了,副作用屡屡在 X 上演。 近几个月的战争临阵考验了 X,结果旧视频、假照片和视频游戏混淆视听,欧盟因为虚假信息和非法内容的泛滥警告了 X,连马斯克也不慎转发了两个虚假账号。 部分是因为,不在乎钱的马斯克,用钱激励着人们参与其中,重新选择 X 的主流声音。 从 X 的激励机制来看,蓝 V、广告收入分成、创作者订阅等功能,只属于订阅了 Premium 和 Premium+ 的账号,它们对帖子的回复也更容易被看到。那么从理论上说,这些账号可以通过真假难辨的、但人们更爱看的内容赚钱。 X 是所有用户的数字城市广场,但有些用户比其他用户站得更高。 马斯克最近在做客播客节目《Joe Rogan Experience》时,被问到 X 现在值多少钱,他并没有谈 X 的市场价值,而是绕了个弯子,只说它是无价的(Everything)。 沃尔特·艾萨克森的《马斯克传》里提到,马斯克对万能应用的想法已经酝酿很久了,从 X.com 和 PayPal 就开始打算,希望它们可以处理个人的所有金融交易和社交关系。 和现在杀死「小蓝鸟」和「Twitter」类似,他当时也不满意「PayPal」,认为它对小众玩家来说是更好的名字,但如果想被世界接受,那么 X 是最好的选择。 外界的各种批评声音,马斯克并非没有听到,但正如他的名言「我宁愿乐观而错误,也不愿悲观而正确」,马斯克从来不是一个技术悲观主义者,甚至大胆地设想 X 总有一天估值超过 2500 亿美元。 这篇回顾 X 一周年的文章,或许以马斯克自己的话作为结尾最为合适: 我们需要担心的时候,不是媒体报道公司濒临倒闭的时候,而是他们懒得去写这些报道的时候。
开售一周小米14销量破百万,雷军“拼命催单”安卓系全面逆袭
《科创板日报》11月7日讯(编辑 宋子乔) 今日上午,小米集团创始人、董事长兼CEO雷军在微博与网友互动时称,小米14系列销量已超过100万台,目前缺货还是严重,“我们正在拼命催单。” 这不是雷军首次回应新机缺货问题,此前11月5日他在微博发文透露,小米14 Pro钛金属特别版生产正在催单,“我们正在拼命催单!钛金属成本高、加工难,加单比较缓慢,希望大家谅解。” 小米14系列于10月26日晚发布,10月31日晚8点正式开启首销,以雷军证实小米14销量超百万台的时间点计,小米新机破百万用时一周,或创下国产手机新纪录。 此前小米14系列多个型号缺货,特别是综合性价比最高的16GB+512GB小米14白色款。 目前缺货情况如何? 据《科创板日报》统计,截至发稿,淘宝、京东等平台上,仅Pro钛金属特别版处于缺货状态,其他型号已成功补货,均显示有货。 根据官方战报,10月31日当日,小米14系列开售5分钟的销量,是上代小米13系列销量的六倍。首销4小时,就刷新了四大电商平台(天猫、京东、抖音、快手)近一年所有国产手机“首销全天销量及销售额”纪录。京东平台数据显示,小米14首销量超iPhone15Pro,打破了京东最近一年来的单品销售纪录。 14系列为什么成了爆款? 综合多个博主测评,该系列手机在设计和性能上有了很大的提升,首发搭载骁龙8Gen3芯片+自研操作系统“小米澎湃OS”,还有屏幕升级、自研龙晶玻璃、光影猎人徕卡主摄、更大的运行内存等亮点加持。 另外,与同期发布的华为、苹果高端机相比,小米新一代旗舰机更具性价比,小米14系列起售价3999元,共提供4种存储规格,最贵机型为14Pro钛金属特别版,16GB+1TB,售价6499元。 而同样规格内存的华为Mate40Pro和iPhone15Pro的售价均在万元以上。 民生证券方竞称,鉴于小米新机市场表现尚佳,出货量超预期,上修盈利预测。预计2023-2025年小米将实现营收2840.18/3004.81/3347.77亿元,归母净利润148.92/123.97/135.22亿元,对应现价PE分别为22/27/25倍。 从供应链来看,多家供应商身影已经显现,据不完全统计—— 多家券商表示韦尔股份为小米14系列提供影像传感器“光影猎人900”(豪威OV50H传感器的改名版);财联社记者从产业链获悉,小米14系列采用的LTPO OLED屏幕由TCL华星独家供应,搭载了TCL华星与小米联合研发的全新高能效C8发光材料;瑞声科技表示为小米14系列提供马达、扬声器、中框结构件。 组装方面,据中国质量认证中心信息显示,小米14新机生产厂为蓝思科技(湘潭)有限公司。 另外,据多家自媒体的拆机视频,小米14的扬声器供应商有瑞声科技、歌尔股份,PCB供应商包括胜宏科技、华通电脑,存储芯片供应商包括海力士。 ▌安卓系手机需求开始复苏 春风已至上游供应链 国元证券杨森表示,智能手机行业目前具备四重积极驱动力:1、行业销量基本触底;2、华为归来引发消费者对手机的更多关注;3、AI端侧大模型逐步搭载于更多新机,有利于创造更加丰富的AI应用生态,从而衍生出对消费者更有吸引力的应用;4、潜望式、大光圈等光学升规,利于产业链条收入提升。综上,该机构分析师认为消费电子行业目前总体处于从底部回升的阶段,未来大概率呈现振荡上行趋势。 手机市场下游需求的积极变化已经影响到了上游供应链。 招商证券鄢凡跟踪了高通2023年第四财季业绩,表示期间高通营收高于预期主要系安卓手机的需求开始复苏。国泰君安王聪称,华为mate60回归带动市场需求火爆,鲶鱼效应带动各大品牌商备库需求,手机补库需求先行,带动消费类芯片龙头收入创新高。根据三季报披露,卓胜微、艾为电子、英集芯、南芯科技等消费类芯片企业3Q23单季度收入创历史新高,增长势头强劲。 德邦证券陈海进日前发布研报称,上一波智能机销售高峰的换机周期逐渐到来,各大品牌厂适时推出重磅新品,小米14首销破纪录,持续看好双11期间安卓机销售表现。建议关注手机产业链:小米集团、立讯精密、蓝思科技、领益智造;电子顺周期:洁美科技、生益科技、三环集团;消费IC:艾为电子、芯海科技、汇顶科技。 该分析师还表示,消费电子复苏,光学是重中之重,建议关注光学镜头/模组厂商(舜宇光学、丘钛科技、欧菲光、联创电子);潜望式镜头供应商(水晶光电、蓝特光学)。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。