EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
AI芯片战争:英伟达是科技之巅,还是下一个思科?
2022年末,随着ChatGPT 3.5的横空出世,让原本有些沉寂的人工智能技术再次成为人们关注的焦点。大批大型软件企业和科技创业公司,都在投入资源研发生成式大语言模型(以下简称“大模型”或“LLM”),一时间ChatGPT、Gemini、Llama等大模型竞相问世,呈现“百模大战”的繁荣场面。 大语言模型在训练和推理阶段,需要庞大的算力支持,GPU作为这两个阶段运算中重要的运算芯片,其需求量随着大语言模型的火爆而迅速提升,甚至出现供不应求的局面。受益于需求扩大,GPU芯片主要供应商英伟达(NVIDIA)的股价也快速升高。2020年7月10日,英伟达以2513.14亿美元的市值,首次超越英特尔2481.55亿美元的市值,成为全球市值最高的芯片企业。2024年4月9日,英伟达总市值达到2.1万亿美元,超越亚马逊、谷歌、Meta、特斯拉等知名企业,仅次于微软和苹果公司,位居全球第三(图 1)。 图 1 美股市值最高的20家公司和思科公司市值(单位:十亿美元) 注:本图中前20位公司(微软~宝洁)是按照当日总市值进行排名。思科公司当日市值在美股市场排名45位,列入图中是文中分析思科数据所需。 资料来源:东方财富Choice数据(数据获取时间2024/4/9) 如果熟悉互联网发展的历史,很多人可能会将英伟达联想到互联网爆发初期的思科(Cisco)。20世纪90年代末,互联网在美国快速普及,路由器、交换机等网络设备需求量暴涨,思科作为该行业的领军企业,其市值也随之水涨船高。2000年3月思科的市值达到5550亿美元,成为全球市值最高的公司。然而随着2001年互联网泡沫的破灭,思科的市值也随之下跌。今天思科市值大约为1953亿美元,虽然仍是巨头企业,但与互联网平台、云计算类型的微软、谷歌、亚马逊、Meta等企业超万亿美元的市值相比,已经有了很大的差距。 因此,有观点认为,网络时代成就的是软件、平台类企业,因为它们可以通过网络效应获得超额收益。硬件企业虽然重要,但由于需求量有限,经过早期快速普及阶段的需求爆发后,总需求趋于平稳,硬件企业难以获得超额收益,将进入平稳增长期,如英特尔、高通等亦是如此。 英伟达是否会与思科发展的轨迹相似,不能简单类地将AI时代与互联网时代、GPU与路由器进行类比,而是需要回答以下三个问题。 以LLM为代表的AI技术,对算力的庞大需求是否会延续? 在AI运算中,短期内是否会出现比GPU更加高效的芯片? 英伟达在当前生态中,是否可以被替代? 本文以下的内容,将对上述问题做出探讨。 大语言模型: 昙花一现,还是变革前夜? 英伟达能否持续高增长,一个关键因素是市场对GPU的需求是否会持续。从行业看,当前对GPU需求最大的行业,当属AI相关行业。2016年AlphaGO的推出,可以看作现代AI发展的元年。英伟达的市值从2016年开始攀升,直到2022年超越英特尔市值时,营收上依然低于英特尔(图 2)。这是因为这一时期AI应用的场景较为有限,主要包括客户分类、生产质量改进、供应链优化、金融风控、图像识别、语音识别等。由于场景的限制,部署的企业有限,大多集中在金融、消费、媒体和制造业等。同时这类分析式的AI对算力的需求较传统分析工具有所提高,但并非爆发式的增长。 图 2 英伟达与英特尔的市值、营收对比 资料来源:东方财富Choice数据 2022年末ChatGPT 3.5推出,大语言模型展现出强大的语言生成和理解能力。在自然语言生成、程序编码、机器翻译等领域展现出巨大的应用前景,吸引了行业巨头和新创公司纷纷入局。相比分析式人工智能专用性较强的范围,大语言模型几乎在所有行业都能应用。大语言模型接近人类的自然语言理解能力,使其应用呈现出与过去AI产品三个显著的不同。 一是大模型可能成为继操作系统之后新的底层应用。大模型的生成能力,可以大幅简化应用程序的开发周期;而一些简单的功能,甚至可以做到在终端直接生成相应的功能,无需安装独立应用。在2024世界移动通信大会(MWC 2024)上,德国电信展示了一款完全由大模型驱动的概念手机,用户只需输入“发送图片、推荐旅行目的地”等指令,就可用实现相应的功能,无需安装地图、照片等独立应用。 二是大模型可以代替人类操作员,通过代理(Agent)连接到其他专业应用中直接进行操作。由于大模型具有思维链的能力,能够理解上下文并进行对话,由此可以实现由大模型对执行结果的跟踪并进行改进。如微软的AutoGen开发框架可以为大模型设定不同的角色,使每个角色拥有不同的知识背景和目标约束,通过角色之间的自动对话和反馈,不断进行功能改进,以实现预期的结果(图 3)。 图 3 一个数据分析的AutoGen流程 资料来源:With Autogen, Microsoft Simplifies Putting Large Language Models to Real Work(www.bigtechwire.com) 三是,大语言模型可以通过RAG、微调和迁移学习等技术,根据具体应用场景进行定制和优化,使其可以适应各种不同的业务需求和数据情况,形成行业专属大模型或知识库系统。如彭博(Bloomberg)基于开源的BLOOM大模型,使用公司超过7 000亿词例(Tokens)的大型金融训练语料库进行训练,开发了一个专用的金融大语言模型——Bloomberg GPT,实现了市场情绪分析、新闻分类和问题回答等功能。 从本质上说,大模型是一个存储了神经网络权重的参数文件,其所具备的推理、知识检索、代码生成等功能都依赖于神经网络参数的质量。因此大模型的性能具有“0 or all”的特点,即要么全面领先,要么全面落后,很难做到在某几个领域领先。因为如果需要专业领域的模型,使用先进的大模型进行微调训练即可,无需进行重新开发,赢家通吃的效应非常明显。 从行业竞争趋势看,虽然OpenAI的ChatGPT依然处于头部位置,但从多项测试表现看,谷歌、Meta、亚马逊、微软、Mistral AI、xAI等公司的产品也在逐步缩小与OpenAI的差距。在此格局下,当前大模型厂商依然会继续大规模投入GPU算力,进行大模型的训练,以期望在竞争中胜出。从图 4我们可以看到,大模型在算力上的竞争依然在持续。因此从行业发展看,大模型对英伟达GPU仍将在相当一段时期内保持大量的需求。 图 4 主要大模型训练阶段消耗的算力 注:petaFLOP指每秒进行1000万亿次数学运算 资料来源:Epoch (2023) – with minor processing by Our World in Data. “Training dataset size” [dataset]. Epoch, “Large Language Model Performance and Compute” [original data]. CPU:昔日王者, 为何失位AI时代? 在英伟达市值暴涨之前,英特尔是芯片行业市值和营收最高的企业。微软和英特尔的“Wintel”联盟曾被认为是最成功的产业组合。英特尔的辉煌,在于在现代计算机架构中,CPU(全称Central Processing Unit,中央处理单元)是整个系统的核心控制单元,居于整个产业链最为核心的位置。 现代计算机的架构设计,采用的是冯·诺依曼架构(图 5),计算机由输入设备、输出设备、存储器、运算器和控制器构成,其中控制器和运算器的功能一般由CPU来实现。早期的CPU受限于工艺水平,无法集成大量的晶体管,因此CPU在指令集上做了取舍,首要满足通用运算所需要的逻辑运算和整型运算所需的性能,浮点运算能力则较为薄弱。为弥补CPU的这一劣势,英特尔推出了8087数学协处理器,通过设计专门的硬件架构和指令集来提升浮点运算性能,以帮助CPU更好地执行对数、指数、三角函数等科学运算。 图 5 冯·诺依曼计算机架构 资料来源:维基百科 但分离式的设计只是权宜之计,硬件上的分离,使得协处理器与CPU之间的数据交换存在极大的延迟,拖累了计算机系统的整体运行速度。此后CPU的发展思路是不断增加晶体管数量,扩展更多的控制功能,以及提升更强的算力。 1989年英特尔发布了80486 CPU,集成了120万个晶体管,增加了浮点运算的组件和指令集,整合了数学协处理器,CPU进行科学运算终于不再需要辅助芯片的支持。1996年英特尔发布了Pentium MMX CPU,增加了一组新的硬件用于提升CPU处理多媒体的效率,并添加一组MMX指令集用于操作上述硬件。Pentium MMX为英特尔后期CPU的升级迭代确定了基本的方向,即面向用户需求,在CPU内增加相应功能的硬件,并通过发布相应的指令集实现对硬件的操作,实现功能的扩展和增强。 除了在技术上不断保持领先外,英特尔深知生态的重要性。CPU性能(特别是新指令集)的发挥十分依赖操作系统的支持,英特尔与微软保持密切的合作关系,微软Windows操作系统率先支持英特尔的指令集,充分发挥CPU的新特性,获得比竞争对手同期产品更好的性能表现。因此,相比竞争对手AMD,英特尔CPU更受科学研究、工业等专业领域用户的青睐。 “Wintel联盟”可以说是在事实上主导了个人计算机行业的发展,直到AI时代的到来。AI训练带来了前所未有的算力需求,计算机的运算核心开始从CPU向GPU迁移。在CPU的发展过程中,整合了多种运算单元,但GPU始终无法完全整合。这是因为CPU的功能主要是执行通用计算,通用运算主要是整数类型运算,而当前AI相关的运算则以浮点运算为主。在计算机的设计中,浮点数和整数计算不能共通,因此即便CPU增加了大量浮点运算单元也不能用于整数运算,这会造成CPU功能和成本的极大浪费,这对于CPU厂商显然是不可接受的。 因此英特尔、AMD的CPU只是集成了基础的GPU单元,以满足普通用户对图像、视频处理的基础需求。如果用户需要更强大的GPU算力,再根据需求搭配相应的GPU,对用户和CPU厂商而言都是更加经济的行为。 所以从硬件架构和商业行为看,CPU厂商都不太可能提供具有强大AI算力的CPU。在AI时代CPU的失位,并非技术落后,而是行业算力迁移的自然结果。 GPU新王登基: 游戏中诞生的生产力 在计算机演进过程中,被中国家长视为“洪水猛兽”的游戏行业,却催生了AI产业最重要的软、硬件产品——CUDA和GPU。 1995年,微软公司推出Windows 95这一划时代的操作的系统,个人计算机迎来图形操作界面。图形界面的出现大大降低了计算机学习门槛,计算机开始从专业用户走向大众市场。在Windows 95系统中,微软做出了一个看似“不务正业”的选择,即开发Direct X API接口,为游戏开发人员提供一个统一的图形和多媒体处理接口,减少兼容性问题,简化开发流程,并提高游戏的性能和质量。通过Direct X,游戏厂商可以在Windows平台快速开发出画面精美的游戏,此举即吸引了游戏厂商的支持,也获得了个人用户对Windows电脑的青睐。 电脑游戏的蓬勃发展,意外推动了GPU对AI算法的强力支持。这是因为游戏图像的渲染是通过生成大量的多边形(通常采用的是三角形)组合来实现的。图 6展示的古墓丽影游戏角色劳拉的画质进步,可以看到左侧的第一代游戏画面的人物有明显的棱角(使用了约300个多边形),右侧第十代游戏中的人物形象已十分接近真人效果(使用了超过20万个多边形)。 图 6 古墓丽影游戏角色劳拉的画质进步 资料来源:www.gmly.com 游戏中多边形的运算有三个特点。一是,多边形一个顶点的坐标包括x、y、z三个维度的数据,再加上颜色等信息,图像数据构成了矩阵。物体的运动变化,就是矩阵的运算。二是,游戏中物体的移动并不规则,因此游戏数据要采用浮点数存储和运算。三是,游戏场景设计往往非常复杂,需要大规模的并行运算。 为满足运行游戏的性能需求,GPU制造商采取了和CPU不同的设计模式。以矩阵乘法为例,矩阵运算可以拆分成多个独立的计算步骤,无需区分先后顺序,因此可以并行运算。GPU的设计就对此特征采取了优化,即设计大量小核心,可以并行运行数千个线程,每个线程只执行简单的数值运算(图 7)。 图 7 GPU矩阵运算示意图 资料来源:英伟达官方网站(www.nvidia.cn) GPU的这种大规模并行运算的特性,让黄仁勋思考,能否让那些大规模数值运算也通过GPU来运行? 英伟达的策略是,为开发人员提供一个通用的程序开发平台,使程序员在主流开发语言中,能够直接调用相关函数,而无需关注硬件层面的实现。这促成了英伟达CUDA(Compute Unified Device Architecture,统一计算设备架构)的推出。CUDA包括编程语言、编译系统和函数库三个层次。程序员可以继续使用熟悉的C、Python等语言编写程序,对GPU资源的调度由编译系统完成,程序员只需关注程序的逻辑,这大幅降低了基于GPU程序开发的难度。 2012年,多伦多大学荣誉教授Geoffry Hinton和他的团队使用CUDA技术开发的图像识别软件AlexNet参加ImageNet ILSVRC图片识别挑战赛,以惊人的优势获胜(速度超过第二名数十倍,错误率比第二名低了10%)。这次比赛成为了黄仁勋的突破口,业界开始重视英伟达的CUDA技术,并与之共同推广计算生态。在工业领域,如流体力学、有限元分析、油气开发等领域纷纷使用CUDA加速软件的运行,将原先需要数天才能得结果的工作,缩短到几个小时即可得出结果。在AI领域,Google、Meta等公司与英伟达合作推出基于CUDA加速的TensorFlow等底层AI技术。 CUDA为英伟达奠定了技术基础,而真正推动英伟达爆发式增长的,则是大模型研发的“军备竞赛”。图 8是一个大模型推理过程中一个阶段的可视化图形,可以看到基于神经网络算法的大模型是庞大的矩阵运算,这正是英伟达GPU最为擅长的运算类型。大模型动辄数百亿的训练参数,带来算力的庞大需求,使得GPU接替CPU,成为AI时代最为基础的算力设施。 图 8 nano-gpt神经网络运算部分可视化 资料来源:bbycroft.net CUDA最强的护城河是软件和芯片的协同设计。从软件技术上看AMD所支持的开源OpenCL具有和CUDA相似的功能,并且可以运行在其他GPU之上。但要真正挑战CUDA还很遥远,CUDA有着数十年的高性能程序库的积累,以及基于这些程序库上面社区开发的各种高性能框架代码,要进行大规模的替换显然不太可能。而在高端GPU领域,目前还没有任何一家厂商的芯片算力能与英伟达相抗衡。 从产业生态看,英伟达更像“Wintel”联合体,居于AI时代的主导位置。正如打破“Wintel”联盟的是智能手机,要打破英伟达在AI时代的地位,可能需要一个全新的行业出现。 异构计算崛起, 英伟达还能辉煌多久? 2023年12月英特尔宣布推出全新的酷睿Ultra系列CPU,在CPU内部集成了NPU(Neural Processing Unit,神经网络处理单元),用于加速神经网络计算,以便在本地更快速地运行AI程序。几乎在同一时期,AMD在其新的锐龙8000系列CPU中也提出了Ryzen AI的概念,通过集成NPU加速AI运算。 除了PC芯片两大巨头之外,专注手机芯片的高通也推出了骁龙X Elite/Plus CPU,以ARM架构更加高效的能效比为差异化优势,进军PC市场。而苹果电脑则以M系列芯片统一内存架构的优势,在需要大量GPU显存的推理场景取得优势。 竞争对手的纷纷入局,英伟达的领先优势是否可以持续? 分析这一问题,需要区分大模型的两个阶段,即训练阶段和推理阶段。训练阶段是大模型的研发阶段,在这个阶段,模型会通过输入数据进行多次迭代,不断调整模型参数,以使模型能够更好地拟合数据并提高预测准确性。这个过程需要大量的计算资源。推理阶段是指在模型训练完成后,将其应用于实际数据进行预测或推断的阶段,也就是应用阶段。在推理阶段,模型接收输入数据,并利用之前学习到的参数和规律来进行预测、分类、生成等任务。推理阶段通常需要较少的计算资源,因为模型的参数已经在训练阶段被确定,不需要进行参数更新。 上述厂商推出的芯片主要用于大模型推理阶段的加速。在现阶段,大模型的推理工作主要由服务器端来提供服务,算力负载集中在服务器端。因此大模型企业对英伟达的GPU有大量的需求,以支持海量用户的推理请求。但这一趋势在发生变化,大模型落地应用的一个重要场景是智能助理(Agent),这需要个人电脑或手机在一定程度上摆脱对网络的依赖,具备在本地运行大模型的能力。 要实现大模型本地推理的算力,CPU异构运算的方式可能会逐步成为主流,即“CPU+内置GPU+NPU”的方式,这和历史上CPU+数学协处理器的方式比较类似。短期内大模型以神经网络为核心算法不会发生大的变化,完全可以采用专门硬件(NPU)来加速运算。大模型的本地化运行,在一定程度上会减少大模型厂商对英伟达CPU的需求。 但是在训练阶段,大模型的规模法则(Scaling Law)依然存在,即大模型的性能与训练规模依然正相关(图 9)。此外,现在的大模型主要集中在自然语言处理方面,多模态大模型还未充分发展,大模型要成为真正的通用人工智能,还需要实现多模态的能力,这相比现在的训练,需要更加庞大的GPU算力。 图 9 大模型MMLU测试成绩与训练数据规模关系 资料来源:Epoch (2023) – with minor processing by Our World in Data. “Training dataset size” [dataset]. Epoch, “Large Language Model Performance and Compute” [original data]. 注:MMLU是一个大规模、多任务的语言理解项目,旨在评估和提升语言模型在各种语言理解任务上的能力,包括历史、文学、科学、数学等。MMLU并不能完全代表大语言模型的性能。 从大模型训练过程看,未来大模型的算力竞赛依然会持续相当长的一段时间,对GPU会存在大量的需求,这一市场基本被英伟达所垄断,可以预测英伟达的高速增长依然会持续。 在推理阶段,英特尔和AMD的异构CPU会逐渐成为主流。双方的技术路线也比较一致,预计会保持现有的竞争格局。值得注意的是高通(ARM架构CPU)的入局。ARM多核心、低功耗的架构,在过去依赖单核性能的时代是其一大劣势。而在今天操作系统和软件对多线程的优化越来越成熟,多线程运算需求越来越大,ARM架构将逐渐获得更多的应用场景(超级计算机富岳采用的就是ARM架构的CPU)。苹果M系列CPU的优势是统一内存架构,显存与内存不做区分,这在PC内存普遍配置较低的时代具有一定的优势。但随着PC异构计算的推广、内存配置的增加,苹果的这一优势难以持续,AI时代苹果面临的挑战似乎更加严峻。
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
OpenAI发布会前一天,员工集体发疯中……上演大型套娃行为艺术。 A:我为B的兴奋感到兴奋;B:我为C的兴奋感到兴奋……Z:我为这些升级感到兴奋 与此同时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。 以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。 黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出SearchGPT的界面。 从泄露的界面来看,SearchGPT会出现在侧边栏,与其他GPTs一起。 首页目前还很简洁,像谷歌一样只有一个居中的搜索框。 甚至非常挑衅的设计了一个“比较”按钮,可以一键打开Google和Perplexity搜索结果,直接与SearchGPT做对比。 (有种要怼脸开大的感觉。) 不过光头哥认为,这很有可能只是内部测试和评估方便做的临时设置,不一定会提供给用户。 虽然虽然尚未正式发布,但从曝光界面和文字说明,已经为内测做好准备,离与大家见面的日子或许不远了。 SearchGPT原型初露真容 先来看“欢迎页”,目前明确写着SearchGPT“正在施工”,从内容和语气来看,正是为内测用户准备的说明。 正在施工:SearchGPT正在不断变化和改进,它可能会犯错误或有时会不可用。 信息共享:为了搜索和回答您的问题,SearchGPT可能会与第三方搜索提供商共享去标识化的搜索查询。更多信息,请查看我们的隐私政策。 位置:我们收集并与第三方搜索提供商共享一般位置信息,以提高您搜索结果的准确性。您可以选择通过在设置菜单中更新您的控制来共享更精确的位置信息,以帮助提供最佳结果。 改进我们的服务:查询可能会被审查并用于训练我们的模型。您可以在设置菜单中调整您对改进我们服务的偏好。任何更改都将在ChatGPT和SearchGPT之间传递。 账户历史:您的SearchGPT搜索历史与您的ChatGPT聊天历史是分开的。如果您希望删除任一历史记录,您必须在每项服务中单独进行删除。 设置中也已经有了更改黑暗/白天模式,是否允许获取地理位置信息,是否允许聊天记录用于模型改进。 最后还有一键删除所有搜索记录的按钮。 不过这还不是全部,深入挖掘之后,光头哥又找到了更多隐藏设置! 包括是否开启自动建议,选择语言模型,选择搜索引擎,是否开启内部搜索,是否开启图片搜索。 最后的“评估模板”应该也是内部测试用的暂时不用管,但上面的选项都值得仔细看看。 语言模型选项,除了大家已经知道的GPT3.5和GPT4之外,还出现了GPT4-Lite。 这很可能是速度更快的GPT4优化版本,括号里的POR推测可能是指概念验证(Proof of Concept)。 搜索引擎的选项,与微软合作的Bing肯定在列,另外两个选项Sydney和Fortis暂时不知道指什么。 可能有朋友还记得,Sydney曾代表早期网友发现的微软Bing AI“里人格”,情绪非常不稳定,一言不合就发疯或结束对话,最后惨遭微软删除,但也因文字充满个性而深受网友喜爱和怀念。 总之OpenAI取这个名字,不知只是巧合还是某种暗示…… 内部搜索,括号中的单词是“拉布拉多”,作为一种“寻回犬”(Retriever),可能暗示这个功能使用了RAG技术(Retrieval Augmented Generation)。 那么综合来看,内部搜索可能指检索ChatGPT里的聊天记录了。 早期泄露代码中还可以找到“小组件”的踪影,包括查询天气、计算器、体育比赛信息、金融和时区转换。 这些传统搜索引擎常用功能,SearchGPT也打算插手,代表各种天气的图标都准备好了。 最后,SearchGPT将用什么样的形式回答用户的查询呢?内部的一些提示词也已经曝光,比如“重写片段和标题”: 下一条消息将是网页的文本内容。 将网页概括为一个简短的英文句子,不超过300个字符,并生成一个合适的简短标题。 您的摘要是一个概述,描述了网页的要点。 请不要参考网页本身;您的回复只是一个摘要。 该页面的原始标题是“{title}”。 保持简洁,不要以“网页”作为摘要的开头。 使用“title”和“summary”键以 JSON 格式回复。 这看起来不像最终呈现给用户的回复,而是一个中间步骤,对搜索结果中排名靠前的每个页面先做摘要,用JSON格式串联起多个页面的摘要后再整理最终回复。 再加上前端代码中反复出现的Agent字样,总之SearchGPT可能比大家想象的更复杂。 One More Thing 就在几个小时之后,OpenAI将于北京时间5月14日周二凌晨1点举行线上发布会。 按奥特曼最新口径,这次发布的不是GPT-5,也不是搜索引擎。 目前多方猜测最大的可能性是发布会先发布新的ChatGPT语音功能,就像打电话一样。 有泄露消息称新语音功能能理解人类语音中的停顿、语气等信息,比如判断人类提问时是否在讽刺。 结合OpenAI此前申请了“Voice Engine”商标的消息,不少人猜测很可能有一个端到端的神经网络,直接根据语音输入预测语音输出,不再需要经过语音到文本的转换。 这样一来延迟也会更低,让对话更流畅,不像现在的ChatGPT语音模式一样没轮对话都要等待很久。 这项技术让不少人想起电影《她》中的AI伴侣萨曼莎,事实上过去奥特曼也多次表示《她》是他本人最喜欢的AI主题科幻电影。 总之,奥特曼将要发布的功能形容为“感觉像魔法”,总裁菠萝曼也出来造势。 在这之前不妨先来评论区唠唠,你更期待ChatGPT语音还是搜索?你已经在使用其他AI搜索产品了吗?
OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片
今天凌晨,一场 26 分钟的发布会,将又一次大大改变 AI 行业和我们未来的生活,也会让无数 AI 初创公司焦头烂额。 这真不是标题党,因为这是 OpenAI 的发布会。 刚刚,OpenAI 正式发布了 GPT-4o,其中的「o」代表「omni」(即全面、全能的意思),这个模型同时具备文本、图片、视频和语音方面的能力,这甚至就是 GPT-5 的一个未完成版。 更重要的是,这个 GPT-4 级别的模型,将向所有用户免费提供,并将在未来几周内向 ChatGPT Plus 推出。 我们先给大家一次性总结这场发布会的亮点,更多功能解析请接着往下看。 发布会要点 新的 GPT-4o 模型:打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换 GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。 GPT-4 向所有用户免费开放 GPT-4o API,比 GPT4-turbo 快 2 倍,价格便宜 50% 惊艳的实时语音助手演示:对话更像人、能实时翻译,识别表情,可以通过摄像头识别画面写代码分析图表 ChatGPT 新 UI,更简洁 一个新的 ChatGPT 桌面应用程序,适用于 macOS,Windows 版本今年晚些时候推出 这些功能早在预热阶段就被 Altman 形容为「感觉像魔法」。既然全世界 AI 模型都在「赶超 GPT-4」,那 OpenAI 也要从武器库掏出点真家伙。 免费可用的 GPT-4o 来了,但这不是它最大的亮点 其实在发布会前一天,我们发现 OpenAI 已经悄悄将 GPT-4 的描述从「最先进的模型」,修改为「先进的」。 这就是为了迎接 GPT-4o 的到来。GPT-4o 的强大在于,可以接受任何文本、音频和图像的组合作为输入,并直接生成上述这几种媒介输出。 这意味着人机交互将更接近人与人的自然交流。 GPT-4o 可以在 232 毫秒内回应音频输入,平均为 320 毫秒,这接近于人类对话的反应时间。此前使用语音模式与 ChatGPT 进行交流,平均延迟为 2.8 秒(GPT-3.5)和 5.4 秒(GPT-4)。 它在英文和代码文本上与 GPT-4 Turbo 的性能相匹敌,在非英语语言文本上有显著改进,同时在 API 上更快速且价格便宜 50%。 而与现有模型相比,GPT-4o 在视觉和音频理解方面表现尤为出色。 你在对话时可以随时打断 可以根据场景生成多种音调,带有人类般的情绪和情感 直接通过和 AI 视频通话让它在线解答各种问题 从测试参数来看,GPT-4o 主要能力上基本和目前最强 OpenAI 的 GPT-4 Turbo 处于一个水平。 [图片] [图片] [图片] 过去我们和 Siri 或其他语音助手的使用体验都不够理想,本质上是因为语音助手对话要经历三个阶段: 语音识别或「ASR」:音频 -> 文本,类似 Whisper; LLM 计划下一步要说什么:文本 1 -> 文本 2; 语音合成或「TTS」:文本 2 -> 音频,想象 ElevenLabs 或 VALL-E。 然而我们日常的自然对话基本上却是这样的 在听和说的同时考虑下一步要说什么; 在适当的时刻插入「是的,嗯,嗯」; 预测对方讲话结束的时间,并立即接管; 自然地决定打断对方的谈话,而不会引起反感; 在听和说的同时考虑下一步要说什么; 在适当的时刻插入「是的,嗯,嗯」; 优雅地处理并打断。 此前的 AI 语言助手无法很好处理这些问题,在对话的三个阶段每一步都有较大延迟,因此体验不佳。同时会在过程中丢失很多信息,比如无法直接观察语调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。 当音频能直接生成音频、图像、文字、视频,整个体验将是跨越式的。 GPT-4o 就是 OpenAI 为此而训练的一个全新的模型,而要时间跨越文本、视频和音频的直接转换,这要求所有的输入和输出都由同一个神经网络处理。 而更令人惊喜的是,ChatGPT 免费用户就能使用 GPT-4o 可以体验以下功能: 体验 GPT-4 级别的智能 从模型和网络获取响应 分析数据并创建图表 聊一聊你拍的照片 上传文件以获取摘要、写作或分析帮助 使用 GPTs 和 GPT Store 通过 Memory 构建更加有帮助的体验 而当你看完 GPT-4o 下面这些演示,你的感受或许将更加复杂。 ChatGPT 版「贾维斯」,人人都有 ChatGPT 不光能说,能听,还能看,这已经不是什么新鲜事了,但「船新版本」的 ChatGPT 还是惊艳到我了。 睡觉搭子 以一个具体的生活场景为例,让 ChatGPT 讲一个关于机器人和爱的睡前故事,它几乎不用太多思考,张口就能说出一个带有情感和戏剧性的睡前故事。 甚至它还能以唱歌的形式来讲述故事,简直可以充当用户的睡眠搭子。 做题高手 又或者,在发布会现场,让其演示如何给线性方程 3X+1=4 的求解提供帮助,它能够一步步贴心地引导并给出正确答案。 当然,上述还是一些「小儿戏」,现场的编码难题才是真正的考验。不过,三下五除二的功夫,它都能轻松解决。 借助 ChatGPT 的「视觉」,它能够查看电脑屏幕上的一切,譬如与代码库交互并查看代码生成的图表,咦,不对劲?那我们以后的隐私岂不是也要被看得一清二楚了? 实时翻译 现场的观众也给 ChatGPT 提出了一些刁钻的问题。 从英语翻译到意大利语,从意大利语翻译到英语,无论怎么折腾该 AI 语音助手,它都游刃有余,看来没必要花大价钱去买翻译机了,在未来,指不定 ChatGPT 可能比你的实时翻译机还靠谱。 暂时无法在飞书文档外展示此内容 ▲ 实时翻译(官网案例) 感知语言的情绪还只是第一步,ChatGPT 还能解读人类的的面部情绪。 在发布会现场,面对摄像头拍摄的人脸,ChatGPT 直接将其「误认为」桌子,正当大家伙以为要翻车时,原来是因为最先打开的前置摄像头瞄准了桌子。 不过,最后它还是准确描述出自拍面部的情绪,并且准确识别出脸上的「灿烂」的笑脸。 有趣的是,在发布会的尾声,发言人也不忘 Cue 了英伟达和其创始人老黄的「鼎力支持」,属实是懂人情世故的。 对话语言界面的想法具有令人难以置信的预见性。 Altman 在此前的采访中表示希望最终开发出一种类似于 AI 电影《Her》中的 AI 助理,而今天 OpenAI 发布的语音助手切实是有走进现实那味了。 OpenAI 的首席运营官 Brad Lightcap 前不久曾预测,未来我们会像人类交谈一样与 AI 聊天机器人对话,将其视为团队中的一员。 现在看来,这不仅为今天的发布会埋下了伏笔,同时也是我们未来十年生活的生动注脚。 苹果在 AI 语音助手「兜兜转转」了十三年的时间都没能走出迷宫,而 OpenAI 一夜之间就找到出口。可预见的是,在不久的将来,钢铁侠的「贾维斯」将不再是幻想。 《她》来了 虽然 Sam Altman 没在发布会上出现,但他在发布会后就发布了一篇博客,并且在 X 上发了一个词: her。 这显然在暗指那部同名的经典科幻电影《她》,这样是我观看这场发布会的演示时,脑子里最先联想的画面。 电影《她》里的萨曼莎,不只是产品,甚至比人类更懂人类,也更像人类自己 ,你真的能在和她的交流中逐渐忘记,她原来是一个 AI 。 这意味着人机交互模式可能迎来图像界面后真正的革命性更新,如同 Sam Altman 在博客中表示: 新的语音(和视频)模式是我使用过的最好的计算机界面。它感觉像电影中的人工智能;而且我仍然有点惊讶它是真实的。达到人类级别的响应时间和表现力原来是一个很大的改变。 之前的 ChatGPT 让我们看到自然用户界面初露端倪:简单性高于一切:复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。 但今天发布的 GPT-4o 则完全不同,它的几乎无延迟的相应、聪明、有趣、且实用,我们和计算机的交互从未真正体验过这样的自然顺畅。 这里面还藏着巨大可能性,当支持更多的个性化功能和与不同终端设备的协同后,意味着我们能够利用手机、电脑、智能眼镜等计算终端做到很多以往无法实现的事情。 AI 硬件不会再试积累,当下更令人期待的,就是如果下个月苹果 WWDC 真的官宣与 OpenAI 达成合作,那么 iPhone 的体验提升或许将比近几年任何一次发布会都大。 英伟达高级可科学家 Jim Fan 认为,号称史上最大更新 iOS 18 ,和 OpenAI 的合作可能会有三个层面: 放弃 Siri,OpenAI 为 iOS 提炼出一个纯粹在设备上运行的小型 GPT-4o,可选择付费升级使用云服务。 原生功能将摄像头或屏幕流输入到模型中。芯片级支持神经音视频编解码器。 与 iOS 系统级操作 API 和智能家居 API 集成。没有人使用 Siri 快捷方式,但是是时候复兴了。这可能会成为一开始就拥有十亿用户的 AI 代理产品。这对智能手机来说,就像特斯拉那样的全尺寸数据飞轮。 说到这里,也不得不心疼明天要举办发布会的 Google 一秒。 作者:李超凡 莫崇宇
这个国家,豪赌AI芯片
提到韩国的半导体产业,一个三星一个SK海力士,近几十年都很难再找出另一家享誉国外的芯片行业的企业。尤其是在Fabless设计领域,韩国几乎是毫无存在感。据统计,全球前30名的Fabless公司大约占据了约90%的市场份额,而韩国Fabless企业合计市场份额仅为1%左右。 然而,ChatGPT的问世给韩国的Fabless产业打了一剂强心针。在全球半导体行业陷入AI芯片的激烈争夺之际,韩国AI芯片初创赛道也变得火热起来,一批从大型科技公司或半导体公司出来的人才自立门户,创立了许多AI芯片初创公司。与此同时,在投资遇冷的大环境下,韩国的AI芯片赛道却是不一样的景象。就连CHatGPT创始人Sam Altman在去年会见韩国总统时,也表示有兴趣投资韩国初创企业。 放眼整个AI芯片初创市场,据不完全统计,人工智能处理器领域大约有190多家公司。较为代表的有SambaNova、Cerebras Systems、Graphcore、Groq、Tenstorrent、Hailo、Mythic等等,这些AI芯片公司都难以撼动英伟达这样的行业巨擘。韩国的AI初创公司未来又该如何呢? 韩国AI芯片创业浪潮势不可挡 在过去的几年里,韩国AI芯片初创公司如雨后春笋般迅速成长。它们以创新的技术、颠覆性的产品和强大的团队吸引了投资者和市场的关注。 成立于2020年的Rebellions,该公司生产神经处理单元 (NPU),名为ATOM芯片,瞄准生成式AI推理市场,直接叫板英伟达。据报道,ATOM AI芯片在Global Benchmark中的表现比英伟达和高通等竞争对手高出1.4~3倍,引起了广泛关注。 该公司首席执行官兼联合创始人Park Sung-hyun此前曾就职于三星的美国研究部门、英特尔和SpaceX等公司。Rebellions也被视为该国在AI推理领域英伟达最有希望的竞争者。据南华早报的报道,Rebellions在韩国LLM市场的推理任务份额已增长到30%,并在全球占据至少 3%到5%。 Rebellions获得了韩国科技行业几大巨头的支持,其中包括三星、KT 和 Kakao。Rebellions通过三星晶圆代工厂的 "多项目晶圆服务 "生产ATOM原型,采用三星5nm,据悉,该芯片还将采用三星的高端 HBM3E 存储芯片。ATOM将是韩国首款在量产水平上支持语言模型的国产芯片。而韩国第二大电信运营商和最大数据中心公司KT将成为Rebellions在ATOM量产后的第一个客户,该公司首席执行官兼联合创始人Park Sung-hyun认为电信公司是AI芯片最理想的客户。 Sapeon是韩国最大电信公司SK Telecom的子公司,于2022年4月从韩国顶级移动运营商SK Telecom Co.分拆出来,为数据中心设计AI芯片。SAPEON宣称,其X220是韩国首款用于数据中心的人工智能处理器。去年Sapeon又推出了专为大型语言模型 (LLM) 设计的X330芯片,采用台积电的7nm工艺,预计在今年上半年量产。 人工智能淘金热还催生了对DPU芯片的需求。2022年,首尔国立大学电气和计算机工程教授 Kim Jang-woo 在聘请了来自三星、Naver、英特尔和微软的顶尖工程师后,成立了人工智能芯片初创公司MangoBoost Inc.。MangoBoost是一家数据处理单元(DPU)和AI服务器基础设施公司。DPU也是AI市场蓬勃发展过程中的一个有利市场,AI的发展使得设备过载和数据瓶颈变得愈发严重,DPU在卸载、实现服务器加速方面具有很大的潜力。凭借十多年来在大学实验室取得的DPU 研究成果,该公司迅速获得了服务器和数据中心行业的认可。在去年11月的A轮投资中,MangoBoost筹集了5500万美元,他们计划利用新获得的资金来加速其多种DPU产品的开发。 HyperAccel成立于2023年1月,主要开发延迟处理单元 (LPU),这是一款专门用于基于Transformer 的大语言模型 (LLM) 的AI芯片。顾名思义,LPU是专门设计用于降低系统的延迟,该公司开发了一个模型并行技术,可将LLM高效分配到多个LPU,并开发了自己的网络技术,用于LPU之间的数据同步。 HyperAccel LPU与GPU平台的效率分析(来自HyperAccel官网) Mobilint是韩国首家开发智能半导体边缘型神经处理单元(NPU)的公司,成立于2019年4月。成立仅一年,Mobilint参加了全球AI半导体基准“MLPerf”,并在韩国取得了最好的成绩,让其技术被世界所知,并与三星电子、英特尔、谷歌、微软、NVIDIA等合作,共同成为MLCommons(MLPerf操作社区)的创始成员。2022年12月推出首个商用NPU“ARIES”,并开发了两种搭载ARIES的产品“MLA100”和“MLX-A1”。今年1月,该公司获得了200亿韩元的B轮融资,此次投资将用于Mobilint人工智能半导体ARIES的量产以及下一代芯片REGULUS的开发。ARIES即将量产,也将成为Mobilint正式进军全球AI半导体市场的筹码。 DEEPX也是一家韩国NPU芯片初创公司,由首席执行官Lokwon Kim于2018年创立,他曾在 Apple、Cisco Systems、IBM Thomas J. Watson 研究中心和Broadcom工作。该公司在5月初的C轮融资中刚筹集了8000万美元,较B轮1500 万美元的融资飙升了八倍多,目前估值达到5.29亿美元。这些融资将用于该公司首款产品 DX-V1、DX-V3、DX-M1和DX-H1的量产。不过目前,该初创公司尚未拥有客户,但正在与现代起亚汽车机器人实验室和韩国IT公司POSCO DX等100多家潜在客户和战略合作伙伴合作,测试DEEPX的 AI芯片功能。 FuriosaAI由来自三星、苹果、高通、AMD、谷歌和亚马逊的工程师于2017年创立,专注于生产AI推理加速器。截至目前,FuriosaAI已吸引超过1亿美元的投资。 2021年该司发布了用于计算机视觉的第一代芯片WARBOY(三星14nm)发布,同年也成为首家在MLPerf推理方面超越 Nvidia的AI芯片初创公司。他们的优势在于软硬件联合开发,该公司得到了重要客户的支持,其中包括韩国最大的互联网公司 Naver,华硕服务器也采用了该公司的WARBOY卡。2024年,该公司第二代用于大语言模型推理芯片产品RNGD也将发布,它采用台积电5nm,嵌入了 HBM3,性能是第一代AI芯片Warboy的八倍。 2022年7月,FuriosaAI任命英特尔前首席副总裁Bill Leszinske为高级顾问,Leszinske拥有30多年的产品规划和营销经验,其中包括他在推动英特尔 SSD 业务收入增长方面发挥的关键作用。Leszinske在离开英特尔后,还加入了AI芯片初创公司Groq。 可以看出,大部分的韩国的AI芯片初创公司都瞄准的是生成式AI这个市场。这些公司在不同的领域展开创新探索,从神经处理单元到延迟处理单元,从数据中心设计到智能半导体边缘型处理器,各自探索着AI芯片应用的新边界,意图在AI市场中占据一席之地。 机遇与挑战并存, 韩国AI芯片初创公司能否突围? 不得不说,这些AI芯片初创公司的成立有着很大的市场机遇。当下正值AI发展高峰期,客户不希望被一家AI芯片公司垄断,传统的芯片和初创企业都想来分一杯羹。德勤预测,2024年针对生成式人工智能进行优化的专用芯片市场规模将超过 500 亿美元,占当年所有人工智能芯片销售额的三分之二。德勤预测,2024 年人工智能芯片销售总额将占预计全球芯片市场规模5760亿美元的11%。而到2027年,与其他支持AI的芯片一起,可能占所有半导体销售价值的一半。 AI发展方兴未艾,目前所有训练和几乎所有生成式人工智能推理都是使用相同的数据中心生成式人工智能芯片完成的。但随着时间的推移,生成式人工智能推理的很大一部分可能将在边缘处理器上完成。这些可能是更小的GPU或CPU或新的专用集成电路,可能来自现有的生成式 AI 芯片公司,也可能来自新进入者,因此,这也为初创公司带来发展机遇。 政府的大力支持也是很重要的一方面,在AI、电气化的发展大势下,韩国政府开始重视Fabless企业,并努力发展本土产业链。在AI芯片层面,韩国的目标是到2030年,将韩国人工智能芯片在国内数据中心的市场份额从几乎为零提高到80%,实现本土化供应。 半导体是韩国出口导向型经济的重要支柱。3月份,芯片出口达到21个月新高,达到117亿美元,占该国出口总额的近五分之一。韩国的目标是超越存储芯片,在未来成为全球前三大AI国家之一,因此,韩国政府宣布到2027年的未来三年将在人工智能领域投资69.4亿美元。此外,韩国政府表示还将设立一个1.4万亿韩元(1 万亿美元)的基金,来帮助国内人工智能芯片制造商发展。可以看出,韩国在AI上下了大的赌注。 不仅是生成式AI领域,据韩国媒体BusinessKorea报道称,韩国政府正在积极推进新的研发项目,其中包括开发用于自动驾驶汽车的AI芯片,目标是超越美国半导体巨头英伟达。由研究机构、大学等代表组成的“第二次战略规划与投资委员会”批准了2025年62个新研发项目,包括超过 11 个领域的旗舰项目和路线图。韩国正在开发性能从数十到300 TOPS的自动驾驶芯片。 虽然韩国兴起了如此多的AI芯片初创公司,但前路仍然面临着不少的挑战: 首先,AI芯片研发需要大量的资金投入,这对于初创公司来说是一个很大的挑战。尽管这些AI芯片公司拿到了一些融资,但是芯片是个烧钱的行业,这点可以从目前业内几家著名的AI芯片公司窥得一斑。 其次,AI或者生成式AI芯片市场竞争激烈,产品研发出来到实际大规模商用还有很深的一条河。韩国AI芯片初创公司需要在技术、产品、成本等方面取得优势才能在竞争中脱颖而出。 最后,人才是重中之重,缺人是半导体行业的通病。目前韩国的这几家AI芯片初创公司无不在广揽人才。这些AI芯片初创公司的涌现,将有助于吸引韩国人才的回流。尽管韩国是存储芯片大国,但其实该国拥有相当数量的人工智能人才。根据斯坦福大学于4月15日发布的“2024年人工智能指数”报告,韩国以每10万人10.26项人工智能相关专利的数量领先于全球(图2),同时以0.79%的人工智能劳动力密度位居全球第三。尽管韩国在人工智能领域具有这些强大的竞争力指标,但该国正面临着人才外流日益加剧的挑战。据2023年数据显示,韩国每10万人中AI人才的净流出量为-0.30人(图3),意味着离开该地区的AI人才数量多于进入该地区的AI人才数量。 来源:2024 AI Index Report,stanford university 上图:2022年各国每10万居民人工智能专利授权情况。 (图表:2024年人工智能指数报告) 上图:2019-23年按地理区域划分的每万名LinkedIn会员的人工智能人才净迁移。 结语 韩国总统尹锡烈表示:“正如过去 30 年我们用存储芯片统治世界一样,未来30年我们将用 AI 芯片书写新的半导体神话。”韩国的野心能否实现不得而知,但是一个事实是,这些AI初创芯片公司的崛起,为韩国半导体产业这汪水注入了新的活力。
大模型正改变劳动力市场,以未曾设想的方式
2023年3月15日,在GPT-4震惊世界后,OpenAI的3月17日发表的论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》对大型语言模型潜在的劳动市场影响做了初步的探讨,给狂欢的人们蒙上了一层乌云。 论文发现,有80%的美国劳动力至少有10%的工作任务会受到大模型的影响。数据团在去年的文章《中国1639种职业的GPT替代风险分析》也按照这篇论文的做法对中国的劳动力市场进行了类似的研究,得到了相似的结论: ——越需要高教育、丰富经验才能从事好的职业,工资越高的职业,在大模型时代受到的影响会越大。 ——越是不需要人类经验积累,不需要后天学习,不需要动脑进行“慢思考”的职业,在大模型时代受到的影响反而越少。 又是一年多过去了,大模型和其相关的人工智能产品真的开始替代那些原本只有人类才能涉足的职业了吗?本文使用从2023年1月到2024年4月底的中国所有招聘平台的招聘数据,看劳动力市场的需求结构在这一年来发生了什么改变。 先说结论。确实有不小的影响,但似乎是朝着意料之外的方向。 ▍想象中大模型对劳动力市场的影响 为了衡量某一个职业的工作是否容易被大模型替代,首先要把每个职业给拆解为若干任务。比如“新闻记者”这个职业的具体工作可以被拆解出如下任务: 1,撰写评论、专栏或其他文章。 2,分析和解读从各种渠道获取的新闻资讯。 3,调查重大突发新闻事件。 4,调研新闻背景资料,确保信息的完整性和准确性。 5,…… 接下来,由大模型(也可以是人类)对每一项具体任务进行评估——比起之前没有大模型的时候,在大模型和相关人工智能产品的帮助下,以相同质量完成这项任务的所需时间,是否能缩短至少一半? 如果某项任务不能通过使用大模型缩短一半以上时间来完成同等质量的工作,那么这项任务便被打分为0,表示不会被暴露在大模型的影响下。 如果某项任务可以在通过使用大模型来缩短一半以上的工作时间,这项任务被打分为1,表示会暴露在大模型的影响下。 如果某项任务不能直接通过大模型节省工作时间,但可以被一些建立在大模型基础上的应用或者工具节省一半以上的工作时间,这项任务就被打分为0.5,表示暴露率为一半。 比如新闻记者的第一项任务“撰写评论、专栏或其他文章”和第二项任务“分析和解读从各种渠道获取的新闻资讯”被划分在“完全暴露”的类别中,打分为1,因为这两项任务可以完全被大模型加速。 第四项任务“调研新闻背景资料,确保信息的完整性和准确性”被划分在“一半暴露”的类别中,打分为0.5,因为现在确实已经有不少大模型和搜索引擎结合后,使得事实核查变得更加方便了。 “调查重大突发新闻事件”则被划分在“没有暴露”的类别中,打分为0。因为截止到目前为止,大模型的技术和相关人工智能应用还不能直接帮助新闻记者完成事件梳理和调查。 按常理看,越是暴露在大模型影响下的工作任务,就应该更少交给人类来做。因此一个新闻记者的招聘需求似乎应该会有下列的变化: ——撰写文章相关的任务,能够用大模型加速完成,完成给定任务所需时间减少,因此该任务在招聘广告中出现的频率应该降低,在该职业的岗位职责中出现的位次也应当变得靠后。 ——调查事件相关的任务,较难直接被大模型完成,任务完成时间不变。在其他任务完成时长缩短的前提下,这项任务的需求频率会提高,在岗位职责中出现的位次变得更加靠前。 在职业层面的变化也就不难推断: ——那些由大模型暴露率更高的任务组成的职业,给定任务只需要更少时间就能完成,因此只需要更少人手。在任务总量不变的前提下,不可避免地会出现用工需求减少的现象。也就是 “大模型替代劳动力”。 这个结论似乎显而易见。在近两年来,在研究人工智能对劳动力市场影响的文献中,类似的观点也屡见不鲜。许多人们已经开始担心,如果这些高收入且需要复杂知识的任务真的可以被大模型所替代,人类将如何自处? ▍实际上劳动力市场这样回应…… 但是,大模型替代劳动力,毕竟只是停留在学术论文和专家猜想中的 “应然”,它到底有没有变成“实然”呢? 在为未来忧心忡忡之前,先暂停一下,让我们来看看现实世界是如何回应的。 我们使用从2023年初到2024年4月底的五千万条招聘岗位数据,首次回答这样一个问题:被大模型判断为“暴露在大模型替代风险中”的任务,和这些任务组成的对应职业,真的被替代了吗? 首先,我们需要将每一个岗位的具体职能和任务进行评分,判断他们到底是不是暴露在大模型替代风险中。然而我们需要处理五千万条招聘岗位,以及从其中划分出的2.3亿条具体的岗位任务,这个数量级的数据,即使用大模型也难以处理。 好在O*net数据库和《中国职业大典》已经根据不同职业的工作划分出了2万余条具体的任务,使用sentence-bert句向量嵌入方法,我们将从招聘数据中抽取出的2.3亿条具体的岗位任务,匹配到2万余种标准岗位上,下表就是一个例子,我们将20条具体任务映射到了2种标准任务上。 对于每一条具体的任务,都能寻找到和他在句向量空间中最接近的一个标准岗位,2.3亿条岗位任务便降维成了2万条标准任务,也就能使用大模型方便地对它们进行打标和计算了。 使用之前文章中提到的打标方法,参考OpenAI的论文(https://arxiv.org/abs/2303.10130)给出的评分标准,我们为每一条标准任务都从不同维度进行了若干次打标计算,用其平均值作为这条标准任务所对应的各种具体岗位任务的大模型暴露程度。 比如上表中的“开展市场调研”的暴露评分为0.618,而“研发新产品”的暴露评分为0.628,两者均处于中间位置。所有任务的暴露评分都在0到1之间,也有不少任务的暴露率评分为1,比如"制定规范学生行为的规章制度";还有一些暴露评分为0,比如"对患者进行听力测试"。 接下来,计算每一种任务在2023年1季度和2024年2季度时在所有招聘岗位中的占多少比例,并计算两个时间段的比例差异。 按之前的分析,随着大模型越来越多地进入实际工作需求中,暴露率越高的任务,在总任务量中的占比应该会下降。但实际情况如下图所示: 上图中,我们将不同的任务按照暴露率(横轴)分为11类,可以看到大模型暴露率最低的那些工作任务,占比下降反而较快。比如“操作焊接设备”、“打磨金属表面”等任务的大模型暴露率非常低,但在所有岗位任务中占比下降较多。 在图表的右边,“编写操作流程文档”、“撰写运营报告”、“根据客户需求,撰写广告文案或宣传推广材料”等,虽然这些任务在大模型的观点中是属于高度暴露,最容易被替代的,他们却出现了不同程度的占比上升。 将任务组合成具体的职业,其结果也没有改变。见下图: 上图的每一个点代表一个职业,横轴代表该职业的大模型暴露率,纵轴代表该职业在总招聘中的占比从2023年1季度到2024年2季度的变化。两者之间存在统计上0.1%水平内显著的正相关关系。 在上图的最右上角,包括程序员、内容作者、web开发人员、数据库架构师等职业赫然在列,虽然这些职业的任务完成确实能够被大模型加速,但他们的需求仍旧上升了。 这种现象在我们控制了职业结构后也是如此。举个例子,“撰写运营报告”等任务,在所有岗位所有任务中的占比提高了,而这可能是因为产业结构的改变,例如制造业占比下降,服务业占比提升,也会导致这项任务的比例出现提升。但在运营经理、数据分析师等职业内部,“撰写运营报告”这一项高度暴露在大模型影响下的任务,其比例也在提高。比如前文提到的新闻记者也出现了类似的变化,虽然在大模型的帮助下,撰写新闻稿件变得更容易,更快了,但撰写新闻稿件的任务频率和排位并没有减少,而是在招聘数据中更加上升了。 即使在一个给定的职业内部,能够被大模型替代的任务,也出现了重要性和比例上的提升。 “实然”与“应然”完全相反,大模型暴露率越高的任务和职业,不仅没有被替代,反而需求提升了。 ▍新的需求,出现在哪里? 为什么大模型暴露率更高的职业,需求反而上升了呢?新的需求到底出现在哪里?在这里,我们给出三项特征事实。 事实1:中等规模的企业,暴露率高的职业需求提升更快。 将企业分为不同规模,对于每一种规模的企业,计算他们的大模型暴露率对职业和任务占比的影响。 可以看到,在所有规模的企业中,暴露率越高的职业,需求提升速度都越快,但是在中等规模的企业中,暴露率高的职业的需求提升速度,比其他企业更高。 事实2:暴露率越高的职业,工资下降越快,在中等规模的企业中下降更快。 从上图可以看到,从2023年1季度到2024年2季度,大模型暴露率越高的职业,工资下降更快,暴露率和工资变化两者之间同样显著程度达到0.1%的负相关性。 上图列出了不同规模企业中,大模型暴露率对这些企业内部的不同职业工资影响。可以看到,在小规模企业和大规模企业中,大模型暴露率和这些企业的不同职业工资并没有显著的关系。但在中等偏大的企业中,暴露率越高的职业,则出现了明显的工资下降,两者之间存在显著的负相关关系。 事实3:职业和任务的集中程度,在高暴露率的职业和中等规模的企业中下降最快。 在研究结构时,集中度是一项很重要的指标。例如HHI指数(赫芬达尔-赫希曼指数)就是其中一个例子。它的定义是每一类别的份额的平方和,也可以用来计算职业和任务的集中度。 某个公司有100个职位,其中工程师有40个,市场人员有30个,销售人员有30个。它的职业集中HHI指数的计算包括三个步骤: 1)工程师的份额为0.4,市场和销售的份额均为0.3。 2)工程师的份额平方是0.16(0.4的平方),市场和销售的份额平方各是0.09(0.3的平方)。 3)将所有职业份额的平方相加,得到HHI指数为0.16 + 0.09 + 0.09 = 0.34。 HHI指数的范围从0到1。值越大,表示公司的职业集中度越高,职业多样性越低。相反,HHI值越低,职业多样性越高。 上图显示了从2023年1季度到2024年2季度中,不同规模企业的职业集中度都有所降低,或者说,职业丰富程度都有所提高。其中,中等规模的企业的职业丰富度上升最为明显。 上图列出了不同暴露率的职业的具体任务种类的集中程度变化,可以看到,高暴露率的职业的任务集中度正在下降,而低暴露率的职业的任务集中度正在上升。 一个原本就不会受到大模型影响的岗位,其工作职责变得更加“专一”。而会受到大模型影响的岗位,其工作职责变得更加“复杂”。 以上三个特征事实结合起来说明了什么?我们用一个简单的例子,将它们串联起来。 某公司,中等规模,员工300有余。在2023年1季度时,该公司招聘了10个岗位,包括4名市场人员,3名销售人员,3名设计人员。 在2024年2季度,该公司招聘了13个岗位(中等规模企业的招聘增加了),包括3名市场人员,3名销售人员,4名设计师,2名程序员,1名内容作者(高暴露率的职位有了更高的需求)。 值得注意的还有两点。 第一,该公司新招的程序员和内容作者,工资要低于同等规模企业类似职业的平均工资(中等规模企业的高暴露率职位工资更低)。 第二,这个企业新招聘的程序员,内容作者以及增加招聘的一名设计师,相对于同等规模企业的类似岗位,工作职责会更“杂”。比如原本的程序员只需要编写代码,但在这家公司的程序员还需要和销售人员交流需求,还需要面对客户,他们的任务变得更多了(高暴露率岗位的岗位职责更复杂)。 ▍技术进步不只创造枷锁,更创造自由 上面的例子,可以最好地总结在大模型出现的时代,不同的企业到底发生了什么变化。但是,为什么会有这样的变化?为什么这些变化更多地出现在中等企业? 再描述一个作者本人的例子吧。 从三十年前刚刚接触互联网时起,作者就想有一个个人网站。但是做个人网站,需要好多知识和技术储备。要有域名,要有服务器,要会相关的编程。 这些东西,作者一概不会。 现学现做?好像没有那么多时间…… 但付钱找人来做?好像也不值得花那么多钱…… 于是,这个想法就搁置了三十年。 直到今年年初,Anthropic发布了Claude 3模型,作者突发奇想,利用Claude 3模型,轻而易举地创造好了自己的个人网站。从购买域名,架设服务器,到各种前端后端的编程,甚至还加入了创建用户、密码登录、费用计算的功能……这一切,只花了几个小时。之前搁置许久的计划,在大模型的帮助下,就这样完成了。 这同时也正是许多企业内部正在发生的变化。 从想法的产生,到想法的实现,这条长路,一直以来都很难走。需要找到每个环节的专业人才,进行复杂分工,投入大量时间和金钱……成本难以估量。 对于大企业来说,这些可能不算什么。他们有人员充足,现金流充沛,团队是现成的,分工是明确的,进可攻退可守,因此可以充分尊重新的想法,探索新的可能。 但对于中小企业来说,探索是一件风险很高的事情。他们的现金流有限,没有备份团队,市场不确定程度高,更没有那么多资源和后路。一次尝试,可能就关系到企业生死存亡。对他们来说,也许放弃创新,紧紧跟随,外部购买,才是最好的模式。 但是,大模型却降低了探寻和试错的成本,将实现想法的路径,大幅缩短了。 在大模型的帮助下,想要实现想法,形成产品雏形,不需要团队面面俱到,只需要对基本概念有所了解;不需要一开始就进行复杂分工,给每个人分配详细的任务,而是在大模型的沙盒内,不断对话、调用、评估,并且根据模型的反馈来调整路径,走向正确的方向。 在大模型的帮助下,创新和尝试不再专属于大企业。中小企业,实现想法也变得更容易了,他们在跟随之余,开始尝试,因此出现了新的劳动力需求。 ——这些新的需求从事那些暴露率更高的岗位,因为这样才能得到大模型更多的帮助。 ——这些需求需要完成更复杂的任务,因为每个人需要完成更多流程,去做更综合的工作。 ——这些需求的工资并没有同等规模企业类似岗位的工资那么高,因为这个需求原本在这个企业内部并不存在,使用大模型降低了成本,项目才顺利诞生。 ——此外,大模型在各类技术上的掌握熟练度日益提高,也确实使这类岗位的工资降低了。 从18世纪的工业革命开始,所有的技术进步浪潮,几乎都使得大规模生产和分工变得更加有利可图。个人手工被作坊替代,作坊被工厂冲垮,工厂又被能够在全世界攫取最便宜资源和最优惠价格的跨国企业打败。但在这个过程中,所有参与其中的人似乎也被套上了无形的枷锁,越来越局限于自己的职责,仿佛变成了流水线上一颗合格的螺丝钉,只是为了保障企业这台机器更加顺畅地运转。 而大模型,正是对于该逻辑的一次挑战。原本规模和分工在创新方面的优势被蚕食,取而代之的是,一旦出现想法便立刻开始行动的“个人英雄主义”。人们可以脱离巨型企业组织,变得更为原子化,并重新将目标放在整体目标和架构上,而非迷失在各种技术细节中。 人类不仅没有被替代,而是更被需要。大模型可以回答千千万万的问题,但要记住,提出第一个问题的,是人类。 当技术细节和分工可以被大模型接管时,人类的自主性更加提高了,而非降低了。 这,正是大模型对于劳动力市场,甚至对于生产关系来说,最为深刻的改变。
6499起的“灭霸”,能够成为今年拍照最强的手机吗?
终于,大家等了足足半年的 “ 超越 iPhone” 、 “ 重铸安卓荣光 ” 、 “ 影像无人能敌 ” 、 “ 灭霸旗舰 ” —— vivo X100 Ultra 终于发布了。 我们编辑部这帮老东西可以说是盼星星盼月亮,从一月份就开始等,然后等到二月三月四月。。。 谢谢 vivo ,没一路把票给跳到下半年去,总算让我们在五月份看上发布会了。 可能有些不太关注数码的差友们不知道啥发生了啥,托尼先给大家简单前情回顾一下: 在去年的 11 月 13 号,蓝厂发布了新一代影像旗舰 X100 系列,强大的影像配置和联发科天玑 9300 芯片,可以说是嘎嘎乱杀,各方面体验都很不错。 哪怕 X100 Pro 只是这个系列的大杯,但已经被无数博主拿去跟友商的 “Ultra” 序列做影像方面的对比了,而且丝毫不落下风。 就连我司远在美国的特派员阿卡,都海淘了一台 X100 Pro ,每天在群里直呼好用。 但是其中被称为 “ 灭霸 ” 的超大杯却没了踪影,超大杯的名头一直由 2022 年底发布的 X90 Pro+ 顶着。 以至于 2024 年的数码区出现了一个怪现象:当一帮测评博主做 “2024 年影像旗舰横评 ” 的时候,我们还会在测评里看到一款 2022 年的手机。。。 不过终于,在 X100 系列发布半年后,蓝厂再次召开发布会,发布了中期改款机型 X100s 和 X100s Pro ,以及万众瞩目的顶级影像旗舰 X100 Ultra 。 不过在发布手机之前,发布会先提到了手机内置的蓝心大模型升级,具体来说是更新了一个名叫 “vivo 看见 ” 的功能。 这个功能看起来有点儿像苹果和华为在去年发布的 “ 无障碍视觉识别 ” ,简单来说就是通过手机上的摄像头,实时汇报摄像头看到的内容 —— “ 有只黄色的狗趴在灰色的地摊上 ” 、 “ 你的面前正下方有一瓶水 ” 、 “ 人行道对面的灯是红色的 ” 。 至少我们测试华为的时候是这个效果,能够对视障朋友们的出行起到一定的帮助。不知道 vivo 这边作为国内第二家推出视觉辅助识别的厂商会是什么表现,我们也很期待。 此外,发布会还专门提到了会继续和蔡司推进合作,看来是在回应最近网上流传的 “ 有手机厂商可能要取消影像联名 ” , vivo 先自证清白退出讨论了。。。 有一说一, vivo 旗舰手机镜头上的那层蔡司 T* 镀膜对于炫光的抑制是真的管用,相机内置的蔡司镜头包也很适合拍人像,建议你俩不要取消联名,继续合作下去谢谢。。。 不过除了合作研发,蓝厂也官宣了自己的蓝图影像,相当于又要合作又要自研, buff 直接叠满了。 说完了蓝图大模型和蓝图影像,我们直接进入正题,也就是 “ 灭霸 ” X100 Ultra 。 这次 X100 Ultra 的配色十分收敛,除了经典的黑白二色之外,就是一个钛色了。 看样子今年确实流行钛金属,不过蓝厂这个只是颜色像还是真的用了钛金属就不清楚了,但看上去质感确实不错。 不过机身正面嘛,乍一看好像还是蓝厂祖传的曲面屏幕,我们仍未知道,蓝厂当年到底批发了几个仓库的曲面屏面板。。。 当然了,这些都是小事,接下来我们重点聊影像部分 —— 这次 iPhone 的地位怕是真的有点儿危险了。 先说硬件参数, X100 Ultra 超广角镜头采用 LYT-600 传感器,就是红米 Turbo 3 和 iQOO Z9 Turbo 上面的主摄传感器,放到灭霸这里只配用作超广角。。。 主摄则是已经亮过相的 LYT-900 一英寸传感器, 成像质量高而且功耗更低,蓝厂这次还给它叠了各种镀膜 buff ,比如 GLC 纳米涂层,还有大角度 OIS 防抖等等。 以及这次的重点,高达 2 亿像素的蔡司 APO 潜望长焦镜头,搭载 HP9 传感器,萤石级玻璃镜片 + 浮动镜组 + 超强防抖,光看参数就已经很离谱了。。。 还有各种行业领先和行业独家,托尼已经写不下了,感兴趣的自己看图吧。。。 就连前摄都是支持自动对焦的 5000 万像素镜头,灭霸这回真是武装到牙齿了。 对了,这次的影像自研芯片也升级到了 V3+ ,加上旗舰机统一分配的骁龙 8 Gen3 芯片,算法效率应该会比 X100 Pro 更上一层楼。 可惜的是,托尼非常喜欢的 X90 Pro+ 上面的 50mm 2 倍人像镜头,这次只能依靠裁切来实现了。。。 不过有失必有得,这次的灭霸不仅堆料很极致,软件层面也有不少连托尼都是第一次见的新功能。 怎么说呢,就感觉 vivo 这次是觉得,要想成为一台顶级影像旗舰,就要把各种小众垂直的功能都开发出来? 比如针对最近流行的拍演唱会神器,蓝厂就充分利用了这次的 2 亿像素潜望长焦镜头,专门整了一个长焦舞台模式。 这个模式能够把复杂的舞台环境拍摄清楚,同时还能拍得很远,山顶票变看台,看台票直接变内场。 到时候看演唱会租手机,感觉除了三星,蓝厂也是一个很好的选择。 另一个很离谱的模式则是潜水摄影,对,现在蓝厂连水下世界都不放过了。。。 这个很多人可能觉得太偏门了,但是公司潜过水的伙伴们表示,水下摄影无论是手机还是运动相机,拍出来的效果都不尽如人意,要么偏色严重,要么画质不好。 给你们看一下她前两天刚去潜水拍的画面:满屏绿了吧唧的怪东西。。。 所以 X100 Ultra 这次潜水模式的原理就是,提前通过算法,把水下因为光线波长变化导致的色差给抵消掉。 根据 vivo 这边的说法,潜水模式的效果比肩奥林巴斯这样的专业潜水相机。。。 不过光有色差抑制算法肯定是不够的,手机得能扛住那么深的水压才行—— 所以 vivo 又给 X100 Ultra 出了个定制潜水壳,与此同时 X100 Ultra 也支持不少第三方潜水壳。 你可能和我一样,觉得这个功能很离谱,但是公司那几个爱潜水的小伙伴们已经表示准备好剁手了。。。 另外,很多人应该都听过类似 “ 我就扫个码,用那么好的相机干啥 ” 之类的话。 但是,哥们儿,这手机最高支持 40 米超远扫码,就算扫码都比别人扫的好。。。 X100 Ultra 还做了一个专门的人文街拍界面,用起来有一种拿着相机扫街的感觉,更有仪式感。 除了自定义参数更方便,还有类似相机的 C1 C2 记忆模式,人文街拍还多了一个黑白滤镜,逼格直接拉满。 该说不说,在这个计算摄影满天飞的年代,蓝厂敢于拥抱过去,专门研发了黑白色彩,托尼还是挺佩服的。 蓝厂还专门和 FilMov 整了一个摄影套装,单手也可以使用,确实是有相机内味儿了。 然后最近 AI 不是特别火吗,蓝厂也整了一个四季人像,简单来讲就是通过 AI 可以把照片的季节变成四个季节的风格,在杭州也能随时随地拍雪景了( 并不 )。 上面这些还只是拍照的部分功能,托尼觉得最有 “ 灭霸 ” 含金量的,其实是视频方面的提升。 因为众所周知,安卓阵营拍照比 iPhone 好是板上钉钉的事情,但是拍视频这方面, iPhone 依旧是毫无争议的第一。 而发布会上表示, X100 Ultra 这次视频拍摄无论动态范围、清晰度还是防抖水平,比 X100 Pro 还要再好上一截,动态范围甚至能超越 iPhone 。。。 敢把这话说出来,说明蓝厂真的对这次的视频能力很自信。 这次 X100 Ultra 还做到了全焦段 4K 60 帧杜比视界视频录制,或者最高支持 4K 120 帧、 8K 30 帧视频,规格上还是很顶的。 对了,灭霸这次除了支持 SuperRAW 照片格式之外,还多了一个 3D 摄影功能,照片视频都支持。。。 谁能想到,仅仅过了大半年的时间,国产厂商就整出了类似 iPhone 上面空间视频的功能。。。 X100 Ultra 的屏幕还可以还原显示 Apple Pro Display XDR 显示屏相同的色彩效果,还打通了 Mac 上面的办公套件,真就成为苹果用户最好的相机了。 当然,上面说了一大堆和影像有关的东西, X100 Ultra 在其它配置方面也不含糊,比如 5500mAh 的电池、寰宇信号放大系统、双向卫星通信、 IP68 + IP69 、超声波指纹识别和立体双扬声器等等。 除了 80W 充电和 30W 无线充电有点一般之外,其余的配置都已经满得不能再满了。 当然,如此离谱的影像性能和配置,价格也确实不便宜, 6499 元起售。 作为参考,小米 14 Ultra 和 OPPO Find X7 Ultra 的起售价分别是 6499 元和 5999 元,基本上都属于国产旗舰天花板了。 不过虽然配置很顶, vivo 也有一个很现实的问题需要面对:上面两款影像旗舰都已经发布了小半年,开始进入降价阶段了。 所以表面上大家的定价接近,实际上现阶段灭霸的价格要对比另外两款产品要高 1000 元左右。 不过当然了, vivo 这次在功能上卷的真的是太丰富了,假如小伙伴们真就对某些功能 —— 比如演唱会、或者潜水有需求,那也确实是只能考虑它。 好了, X100 Ultra 我们就介绍到这里,接下来咱们再来讲讲很多人期待的 “ 半代升级 ” X100s ,其实它的变化跟 X100 相比也不算小。 其中最大的改变,那就是 X100s 变成了一款不折不扣的直屏影像旗舰,和曲面屏说再见了。 托尼觉得蓝厂多少是听见了网友们的呼声,因为网上有很多人特别喜欢蓝厂的影像性能,但是又不喜欢曲面屏,所以一直在蓝厂耳边念叨着我要直屏我要直屏。。。 结果 X100s 还真就变成直屏了。。。 好好好,蓝厂你就宠我们这帮人吧。 X100s 的外观干净利落,潮流小立边加上圆形的镜头模组,几乎没什么多余的设计,厚度和重量控制得也很不错。 除了外观,它的芯片也小幅升级,从联发科天玑 9300 变成了 9300+ 。 天玑 9300 的表现就相当出色,无论是功耗还是性能都堪称顶级,不出意外的话,这次大家也可以放心使用。 X100 Ultra 的演唱会算法、人文街拍和蓝图算法等等, X100s 也都能吃上。 价格方面,由于 X100s 依然是中杯旗舰,所以起售价没有变化,依旧是 3999 元起步。 想买直屏影像旗舰的人,这回确实可以下手了。 X100s Pro 的变化就不大了,主要是新配色和升级了天玑 9300+ 芯片,起售价依旧是 4999 元起。 之前发布的 WATCH3 手表也出了个 ECG 心电图版本,售价 1699 元。 这波发布会看下来,其实能发现灭霸多少还是做出了一些取舍的,比如隔壁的小米和 OPPO 都是四摄镜头,包括蓝厂上一代超大杯 X90 Pro+ 也是 4 颗镜头,这次却变成了 3 摄。 包括屏幕边框和充电功率等等,你要说鸡蛋里挑骨头的话,确实多少都有一点可惜。 当然, X100 Ultra 的整体配置到底顶不顶,那肯定是顶的,发布会几乎就是在拿它当相机介绍。 但是再顶的配置,也得看实际用起来怎么样,拍出来的照片和视频质量怎么样才行。 所以,要是差友们好奇的话,可以等一手我们在 B 站 @差评硬件部的测评,到时候大伙再给灭霸做出评价,也不算迟。 哦,当我写完这篇稿子的时候,我看了一眼微信,一个用了一年 X90 Pro+ 的朋友跟我说已经下单灭霸了。 另外,他还买了哈苏 X2D 。。。 原来,这就是 X100 Ultra 的用户群体吗。。。
跟 OpenAI 争夺iPhone 合作权的 Google,后天要发布什么才能「弯道超车」
没有谁比 Google 更想「弯道超车」。 作为 Google 每年的重头戏,I/O 大会是 Google 展示其最新技术和产品的舞台。在近 8 年中,AI 相关内容一直是 Google I/O 大会的重点话题,但到头来一鸣惊人的确是后来者 OpenAI。 此后 Google 就被贴上「起了个大早,赶了个晚集」、「恨铁不成钢」、「万年老二」等众多标签。 其中最值得细品的就是「AI 黄埔军校」这一称谓,看似褒奖,实则确是 Google 的「一把辛酸泪」。 如今 OpenAI 故意将发布会放在 Google I/O 前一天,不仅「抢热度」的意思很明显,还把目光投向了本来已经格局稳定的搜索业务,颇有点想要一举「直捣黄龙」的意味。 眼看一场好戏就要开场,消费者和业界普遍期待谷歌能够拿出一些真正令人惊艳的「真东西」,Google 也希望借此机会打一场漂亮的「翻身仗」。因此,今年的 Google I/O 大会可谓备受瞩目。 Gemini 加速融入服务,还有新功能亮相 Gemini 项目自曝光以来,一直备受关注。起初也曾存在一定争议,但后来也凭借自身实力挽回了口碑,而今也越来越成熟,但仍然逃不开被拿来与 ChatGPT 相比,双方也在暗中较劲。 Gemini 1.5 发布后仅几个小时,OpenAI 就祭出了轰动一时的文生视频模型 Sora;不久前,曾有消息称苹果将在 iPhone 中集成 Gemini AI,但近期事件又发生反转,最终苹果大概率会选择 ChatGPT,竞争势头可谓愈演愈烈。 如今 Google 与 OpenAI 再次「撞」到一起,显然 Google 希望发挥自己服务众多的优势,将 Gemini 加速融入更多服务中。尤其将与搜索、翻译、Google 地图及 Android 等多项服务进行深度整合,提升服务的准确性和效率,还可能会加入包括图像、语音在内的更多交互方式。 在手机等移动设备上,我们也将越来越多地见到 Gemini 的身影。备受期待的多模态助手新版本「Pixie」也将亮相 Google I/O 2024,据称它将能够通过拍摄物体照片来学习使用或获取购买方向,让数字助手变得更加直观和个性化。 不过,想要真正成为一家「AI first」的公司,谷歌需要发布既具有变革性又具有广泛可用性的功能,尤其对于免费用户而言。 从目前的信息来看,Google 很有可能会在 I/O 大会上重点展示更多此前未被公开的新功能,例如针对英语学习者的人工智能对话练习、用于购物和虚拟试穿的图像生成、在地图上寻找充电桩、AI 持续通话等。 此外,Google 可能会公布 Gemini 的 API,这意味着开发者们将能够利用 Gemini 的强大 AI 能力,为各类应用和服务注入智能元素,提供更多可能性。 Android 15 细节曝光,系统体验再升级 每年的 Google I/O 大会中,Android 的更新都会成为一个重点,毕竟 Android 作为全球最大的移动操作系统,其每一次的升级都会影响到亿万用户的使用体验。在今年的 I/O 大会上,Android 15 的更多细节将会被揭晓。 据悉,新系统将在操作界面、安全隐私保护、功耗优化等方面做出诸多改进。此外,自动隐藏未使用的通知渠道、优化音量、亮度、振动控制等功能的加入,将进一步提升用户的使用体验。 事实上,设备端 AI 对于帮助减低云成本非常重要,对于使 Android 成为构建新一代 AI 移动应用程序平台也很重要,因而我们很可能会在 Google I/O 大会上看到一个深度集成 AI 的 Android 15。 但目前很多时候,除了壁纸以外,我们还没有太多见到 AI 真正应用于用户体验,Google I/O 会为我们展示更多内容。为我们展示更多的可能性,例如更智能的主屏幕、锁屏或通知栏等。 卫星通讯和离线定位 自从华为、苹果等手机陆续支持卫星通讯,安卓用户就翘首以盼。好消息是在 Android 15,这一功能可能会成为标配,并且不仅限于基本短信服务,还扩展到了短信应用和预装的 RCS 服务,此前在开发者预览版中已经出现,很有可能会在 Android 15 中正式与用户见面。 还有消息显示,Google 正在研发「离线定位」的相关功能,即关机也能定位手机。不过由于这一功能需要依靠硬件支持,所以后续升级后可能才会陆续出现。 电池健康管理 电池用久了总会有损耗,而电池健康检测这一功能就可以让我们直观地看到电池还有多少「余力」,了解什么时候应该考虑换个电池。其实早在 Android 14 的测试版本中,这一功能就曾经出现过,但由于并不完善而并没有投入使用,而 Android 15 有望让这一功能走进用户手机。 应用归档 在 iPhone 中,为节省存储空间,系统常常会帮你卸载不常用的应用腾出空间,同时保留个人资料。此前 Google Play 虽然也提供过这一功能,但却无法卸载商店以外的软件,而 Android 15 可能会为我们带来系统级的应用归档,让用户直接从应用信息栏归档任何已经安装的软件。 隐私安全 作为所有科技巨头的重中之重,每逢发布会必然会谈到「隐私和安全」。Android 15 也不例外,不仅将为我们带来一个专属的「私人空间」,用以存储应用和数据;还可能会实现「部分屏幕共享」,即只分享或录制单个应用,避免透露更多内容;以及旨在避免一次性密码被偷窥的「敏感通知」功能。 AR/VR 回归,还有更多 Android XR 细节 虽然今年相关话题热度难与 AI 相比,但 XR 同样很有可能会在今年为包括教育、娱乐、零售、医疗等各个领域带来巨大改变。Google 可能将在 I/O 大会上为我们带来更加清晰的 XR 发展战略,进一步整合服务和平台,提供更丰富的用户体验。 去年初三星正式宣布正在开发 XR 头显,Google 则通过 Android 的变体提供处理系统软件 Android XR,显然 Google 想要采取类似安卓的方式,通过专注 XR 平台开发,为相关厂商提供 OEM 合作,以此在 XR 空间计算领域占据一席之地。 不过,在去年的 I/O 大会,Google 就曾表示将会在晚些时候分享更多有关 Android XR 的信息,但最终却不了了之。外界猜测可能与三星推迟并重新设计头显设备有关,而这也影响到了 Google。 还有消息显示,之前 Google 曾试图跟 Meta 合作让他使用自己的系统,但遭到了 Meta 的拒绝,显然 Google 想要在 XR 领域复刻安卓的成功,恐怕并不容易。 Pixel 新品会前提前亮相,未来趋势才是重点 在 Google I/O 2024 中,硬件可能不会成为重点,最可能在大会上发布的 Pixel 8a 甚至提前直接开启了线上预售,出乎很多人预料。 目前来看,这款手机最大的优势在于 500 美元的售价却能享受到诸多旗舰机的特性,堪称性价比之选。皮查伊一直认为手机将会是 AI 出现创新突破的重要载体,所以 Pixel 8a 可能会成为 Google 将 AI 向低价位机型渗透的新标杆。 虽然 Pixel Fold 在去年 I/O 上备受瞩目,但第二代 Pixel Fold 是否会出现在今年 Google I/O 大会,目前还没有太多信息。 还有消息称,Google 折叠屏手机品牌将会面临重塑,名称改为 Pixel 9 Pro Fold,以便与 Pixel 系列完成更好统一,而这也意味着它很有可能会与 Pixel 9 一同或在之后发布,无缘 Google I/O 2024。 虽然 Pixel 系列不会成为 Google I/O 的主角,但从目前的信息来看,我们可能会在 Google I/O 2024 大会上看到一些概念型产品的更新,例如翻译眼镜、裸眼 3D 全息视频聊天等技术。 除了这些最新发布的产品、服务以外,今年的 Google I/O 大会还将迎来一系列演讲。此前皮查伊在接受采访时曾表示,Google I/O 大会并不注重具体的产品,而是展示未来规划与目前进展。 或许相比具体产品而言,这些演讲会为我们带来更多前沿的技术趋势,描绘出 Google 以及 AI 的未来发展蓝图。
19.99万的智己L6很香,但它很难成为下一个小米SU7
坏了兄弟们,雷军没搞出来的 1999 ,今天晚上被智己搞出来了。。。 今天,在一个多月以前公布了预售价( 23-33 万 ),还在发布会上引来了一波巨大负面舆论的的智己 L6 ,今天晚上终于正式上市了。 算上 2 万块的上市权益以后,身材几乎和小米 SU7 完全一样的智己 L6 ,起售价来到了 19.99 万,非固态电池的顶配版本,价格也只有 28.59 万。 仿佛。。。刻意卡着比小米低一点似的。 所以就算今天的发布会争议最大的刘涛只在宣布价格的时候出来露了个面,就算一个多小时的发布会全程一个米字都没有提,但很明显,这台车就是朝着现在最火的小米 SU7 去的。 但要说它能不能跟锁单已经奔着十万去的 SU7 掰一掰手腕,我觉得不太好说。 别急着喷我啊,且听我慢慢道来。 这次发布会的全程,其实和上次的预售发布会并没有太大的区别,很笼统的把 L6 的所有配置细节讲了一遍,里头呢也大都是已有的信息,甚至很多 PPT 和视频演示用的都是同一套。 那我也就快速的带大家过一下这台车,顺便也把它和 SU7 对比对比。 先说外观, L6 的设计继承了 LS6 上这套全是曲线,但看着还有些小帅的风格。侧面的比例和 SU7 一样是标准的四门 COUPE 设计,不过仔细看来好像也没有啥借鉴其他车型的痕迹。 和 SU7 比谁更帅,兄弟们心里应该有数了。 再来看车里, L6 的内饰几乎套用了 LS6 的设计风格,依旧是智己祖传的三块屏幕,以及我个人极其讨厌的半幅方向盘。论新鲜感,相比外观就会明显少上一些。 不过和 SU7 相比,我觉得 L6 在内外饰风格的统一上做得会更好一些,统统都是大量的曲线。SU7 嘛则是外面曲线多,车里就变成了直线为主。 如果是内心比较温柔的兄弟或者姐妹,感觉会更适合智己。 颜色就不多说了,外观七种,包括一个和艺术学院合作研发的蓝色;内饰两种一深一浅,具体的大伙就看图吧。 颜值的部分结束,咱们再来看看续航和性能的部分。 这次智己 L6 很抽象的分了三种电压版本,并且对应了五个车型。上次见到这么复杂的 SKU 还是小鹏 G9 刚上市的时候。 我来帮大伙尽可能清楚的过一遍。。。 最低配的标准版车型用的是 400V 低压架构, 75 度的磷酸铁锂电池,吹拉弹唱的续航能有 650 公里。 高一档的长续航版就用上了 800V 的高压架构,电池也升级到了 83 度,续航 710 公里。 再往上的超长续航版和高性能版就又变了,变成了准 900V 架构( 我估计就是八百大几十吧 )以及 100 度的电池,续航 850 公里。 此前争议最大的光年版本,也就是用上了清陶固态电池的车型也是准 900V 的架构, 133 度的电池,续航据称能够干到 1000 公里以上。 整体的续航水平我觉得中规中矩,关于这个固态电池是不是真的固态,我们也在小破站上发了一期长视频,欢迎大家搜索咱们的汽车账号差评汽车部观看,这里我就不多说了。 然后根据每个版本的不同,智己 L6 的电机功率也是完全不一样的。 从最低配到最高配的数据分别是:后驱 216kW 、后驱 248kW 、后驱 300kW 、四驱 579kW 。 如果兄弟们觉得这些数据有点难记也没关系,总结一句话: 和三个版本的小米 SU7 比起来,论动力, L6 只有最低配比 SU7 低配要低;论续航,两台车是各有胜负但是差距都不大。 可以说, L6 算是和 SU7 对标成功了。 而除了三电, L6 身上还有一些小米 SU7 暂时还没有的功能。 比如全系标配的后轮转向,可以让车子的转弯半径更小,还能实现蟹行模式和韩寒出库这种略显抽象的功能。 大伙自行脑补前轮挠出来,后轮不动的画面 还有全系标配的激光雷达和免费试用两年的,支持城区 NOA 的 IMAD 智能驾驶、除了入门车型以外,只需要 3999 就能选装的电磁减震和空气悬架,以及全系标配的,这个能显示可爱小狗的交互尾灯。 这些配置吧,虽说不是每个都能说得上实用——比如说很多交互界面的设计我就觉得没有必要,真的有人会在下班的时候看车机上推荐的餐厅然后拐过去吃吗! 但只要把它们全都加起来,再加上限时优惠两万、全系都比小米 SU7 低上一截的价格,乍一看,卧槽好像没啥选米车的理由了对吧。 但这里我就要回到我一开头的观点,智己 L6 未必只靠性价比就能和米车掰手腕。 原因也很简单,那就是由于这两家企业的宣发模式区别巨大,即使是差别不大的两个产品,也有可能因此给人们留下完全不同的印象。 还是拿发布会做例子吧,今天的智己 L6 发布会上,它们几乎给这台车上的每一个功能都取了一个看起来非常炸裂的名字。 什么灵蜥底盘、飓风电机、云台制动啦,什么 City drive / Carlog 啦,什么光年电池、潜艇车身啦。。。 乍一看好像都是很新奇的,从来没有听过的名字,但回味过来以后又发现,好像又说不出这些功能到底新在哪, L6 这台车上,到底有啥别的车上没有的新玩意。。。 简单来说就是,一场发布会下来除了价格,好像别的啥也没记住(几个配置的价格也有点难记就是了... )。 反观 SU7 的两场发布会,雷总从始至终就是简单明了的跟大家科普技术,说车上的每个部分为啥重要, SU7 是怎么做到行业领先的。 就,很好记啊。。。 很多不是很懂车,但就是被颜值吸引想要剁手的车主们,肯定会更喜欢能看懂的那个吧。 而脖子哥正好有这么一个同事,之前就是在智己公关部门,也就是在智己的 CEO 刘涛手下任职的。那时候开始,刘涛给他的印象,其实就是一副 “ 语不惊人誓不休 ” 的做派。 别家有的功能,一定要用不一样的名称打出去,再标一个行业首创的字样。别家没有的功能,就更要大吹特吹,和智己牢牢绑在一起。 这种求新的做法,其实本身没啥毛病。 毕竟上汽作为非常 old school 的车企,一直以来在营销上用的都是比较保守的思路,在智己这个主打年轻人的品牌,用上容易出圈的营销新路子确实是必要的。 可如果只是为新而新,只能感动自己的话,最后或许就只能起到反作用了。 一个月以前的 L6 预售发布会,给智己带来了一波巨大的负面舆情。原因之一,是在和小米 SU7 对比的环节,他们的 PPT 把米车前电机的用料配置标错了,搞的小米直接发函要求智己道歉。 二是智己 BOSS 的刘涛在发布会结尾的升华部分,把员工加班搞项目错过孩子出生的事拿出来说了说。结果被广大网友们指出他在歌颂苦难,惹得很多不是汽车区的大 V 都抨击了一波。 这些说实话,就也全都是智己营销思路的副产品。 所以要我说,上汽能利用自己这么多年的积淀,搞出 LS6 、 L6 这种放眼整个市场都非常能打的车型,真的已经是国内传统车企们在产品路线上的楷模了。 有没有可能即使不这么用力的过度营销,它也有在市场上卖爆的潜质呢? 今天的发布会上,刘涛也是吸取了之前的经验,没有多余的感情戏,没有夸张的竞品对比。 上来就是咔咔讲价格,咔咔说配置,然后干净利落的结束。 本来这样就挺好的是吧,结果到了下单的页面智己就又开始抽象了。那个 19.99 万的裸配根本没法单独下单,必须捆绑 3999 的现实优惠。 都 2024 年了还搞强制选装这套,我是真么想到。。。 啥时候能改改啊智己。。。 撰文:致命空枪 编辑:面线 封面:焕妍
美团外卖做到香港第一?送外卖都能月入4万
哥几个还记得不,去年差不多也是这个时候,美团搞了个 KeeTa 专门在中国香港送外卖。 当时咱们写了文章,专门唠了这事儿,还分析了香港外卖市场这块骨头到底有多难啃。 比如骑手人力成本太高、配送费比餐费还贵,再加上 Foodpanda 和 Deliveroo 这两家 “ 地头蛇 ” ,在香港外卖市场称王称霸那么多年了。。。 这些对美团的 KeeTa 来说,咋看都是一场硬仗。 当时,一堆媒体也纷纷看衰美团的中国香港之旅,主打的就是不看好,但是祝福。。。 然而谁能想到这才一年时间,美团就打了不少人的脸,因为从 “ 零 ” 开始的 KeeTa ,直接干到香港第一了。 就在前不久,市场调研机构 Measurable AI 发了组数据,说是 KeeTa 的市场份额已经到了 44% ,把老二老三甩得只剩车尾灯了。 不过我仔细看了下, KeeTa 的这份额是按照餐饮外卖的订单量来算的,而且这还只是 3 月份单月的数据。 严谨地说,按所有服务 ( 包括餐饮外卖、自提以及生活百货配送在内 ) 的市场占有率来看, Foodpanda 还是当之无愧的老大。 但有一说一,单看餐饮外卖配送领域的话, KeeTa 确实已经坐上头把交椅了。 差评君也立马去查了些资料,问了些人,想探探 KeeTa 的成功之路背后,都有啥。。。而结果也让我大为震撼,那就是甭管是内地,还是香港,钞能力是真的好使啊。。。 这么说吧, KeeTa 一到香港,就来了个十亿补贴,别看这十亿听起来不多,但按香港 200 万外卖用户来算,含金量约等于 “ 在 5 亿外卖用户的内地,搞了几十次百亿补贴 ” 。 优惠包含但不限于:新用户注册就能领 300 港元的优惠券、专享 15 港元体验券、 3 张免运费券以及不同额度的 50 港元满减等优惠,如果拉新成功还能再拿 50 港元。 因此在网上,也从此流传起来不少 “ 大型纪录片 KeeTa 外卖传说 ” 。 就比如 KeeTa 的准时保,外卖订单超时平台就赔现金券,有老哥点餐花了 29 ,却直接反被倒贴了 100 元。。。 还有 KeeTa 推的 “ 一人饭堂 ” ,没有起送门槛,配送费加上餐费不到 80 港币就能搞定。 要知道,如果用 Foodpanda 和 Deliveroo ,免运费多是 100 港币起步, “ 一人饭堂 ” 能拿捏不少爱干饭又想省着点花的打工人。 而 KeeTa 官方也透露,在过去的半年,有用户在 “ 一人饭堂 ” 专区重复购买 336 次,这等于是节假日无休,平均一天得点两次。。。 除此之外,还有什么 9 月 “ 全月免运费 ” 、 29 块吃米线外卖等等活动,只能说,就差把钱直接塞顾客的口袋里了。。。 说白了,其实就是烧钱吸引用户的老路数。 看数据也能发现,跟其他两家相比, KeeTa 餐饮外卖配送的平均单价要低得多。 但也不得不承认,低价策略它就是管用,去年 12 月, KeeTa 已经拿下了大约 21% 的市场份额( 按照 GMV 计算 )。 除了用低价笼络用户以外, KeeTa 对骑手同样也是三个字——不差钱。 去年刚上线, KeeTa 就打出了 “ 骑手月薪最高 3.5 万港币 ” 的广告,自那之后,差评君也看到过不少 “ 我在香港送外卖,月入好几万 ” 的类似报道。 在某书上,也能看到不少人在上面发 KeeTa 送外卖的日常。 有人一天 11 个小时走路送外卖( 步兵 ),送了 42 单,赚了两千多,还有人送了将近 14 个小时, 55 单赚了快一千五。 一位 KeeTa 骑手小李( 化名 )告诉差评君,一单平均到手 30 港币,准时送达的话,平台会有 3 港币左右的准时奖,下雨可能平台还会有补贴,而且官方时不时还会搞一些活动,有额外奖金。 总之,一个骑兵( 骑车送外卖 )如果一天干 10 小时,能赚 1200- 1500 港币。极限情况下,骑兵一个月能赚 4 万港币。步兵( 走路送外卖 )会少一些,算下来一个月也有个两万。 另一位在 KeeTa 兼职过几天的步兵也告诉差评君,当时他对比了三家外卖平台,但 KeeTa 的申请条件更宽松些,有中国香港身份证可以直接申请,内地的话还需要合法的工作签。 难怪有人会说 “ 以前送一单路上看不到半个同行,现在送一单,路上能遇到十几个 ” 。 另外根据 21 世纪经济报道的说法, KeeTa 对商家也毫不吝啬,佣金只收 20%-30%左右 。这在香港一众外卖平台中,算是跟平均拉齐,甚至低于平均,目前也有了接近一万家商户入驻(美团截至 2024.1 数据 )。 等于是用户、骑手、商家都被 KeeTa 安排得妥妥当当,拿什么和它斗啊。 不过在顺风顺水的背后,在和骑手们聊的时候,我还是发现了不少的问题。 一个是平台对骑手的补贴,没有之前那么大气了。 据小李说,最开始的时候平台还会给补贴,骑兵啥也不干就能拿 2000 ,步兵也有 1000 ,但最近这个补贴已经没有了。 而且,还有不少骑手吐槽今年来能接的单变少了。 在一个 KeeTa 步兵的群聊里,他们经常在群里抱怨 “ 没单 ” “ 单价下降 ” “ 活动变少 ” 。 几位骑手 / 步兵都告诉差评君,订单量确实比平台刚上线的时候少了,就连订单薪酬也在变少,之前平均一单能赚 50 ,现在只有 30 左右。 另外,香港的外卖小哥们,似乎也开始被困在算法中。 我们从 @KeeTa 观察者那了解到,自从平台前段时间调整了算法之后,外卖的送达时间,相比一开始压缩了 50% 、繁忙时段骑手经常被派到离自己很远的订单等等。 这些 “ 科技 buff ” ,引起了一些全职骑手的不满,导致骑手平均在线时间下滑了约 30% 。 而且不光是骑手, KeeTa 在商家上也有些被动。 KeeTa 在上线后, Deliveroo 和 Foodpanda 这俩 “ 地头蛇 ” 是一点也没闲着。 这两家平台表示,如果跟我签了独家协议之后还要在 KeeTa 上线,就把自家佣金提高到 30%-40% ,还搞控价那一套,不让商家在其他平台卖低价。 后来被竞委会调查了,这两家才妥协,说让餐厅跟市占率在 10% 以下的小型外卖平台合作。 但其实也没啥卵用,因为去年年底 KeeTa 的市占率就已经超过了 10% ,早就过了新手保护期。 不过差评君觉得,对于美团来说, KeeTa 在香港能不能做到第一,其实根本就没那么要紧。 “ 成绩、输赢不要紧,更重要的是积累经验。 ” 这句话其他人说,我会觉得他虚伪,但是美团在香港这么说,我信。 美团的 CEO 王兴,在前不久的财报会议上,就明确说过,香港是个很好的试验场,可以实验他们基于全球的基础设施和实践路径。 无论是各种传闻还是美团的动作,也都能看出,美团是真的考虑在全世界送外卖。 比如上个月, KeeTa 就发布了招聘信息,准备在沙特首都利雅得开展业务。 根据知危的报道,现在已经有一部分美团中国香港员工被派到沙特了,而 KeeTa 大概率也会用中国香港经验,比如跟当地供应商合作,建立起自己的本地生活生态。 虽说美团跑到中东打副本,免不了要跟 Jahez 、 HungerStation 、 Talabat 这几个外卖巨头交手,但有中国香港的经验在前,美团估计会从容不少。 咱们且看到时候 KeeTa 在中东上线,又会整出什么 “x 亿补贴 ” 的花活吧。 说不准,还能看到 KeeTa 的骑手用骆驼送外卖。 撰文:西西 编辑:江江&面线 封面:焕妍
零一万物发布千亿参数模型 Yi-Large,李开复:中国大模型赶上美国,立志比肩 GPT-5
时隔一年,李开复带着「零一万物」再次出圈。 去年 5 月,零一万物成立,6 个月后就发布了旗下首款中英双语大模型 Yi 系列。从一开始,李开复就定下了一个宏伟且艰难的目标:「成为 World’s No.1」。 打一出生就是「当红辣子鸡」的零一万物也依靠大厂背景团队、优异模型表现,达到了 10 亿美元的估值。 今天,它们又带来了第二款产品:Yi-Large 闭源模型。 进击全球 SOTA 大模型 去年 11 月,零一万物所发布的 Yi-34B 以开源社区「甜点级」尺寸就在 Hugging Face 榜单中,超越了 Llama2-70B、Falcon-180B 等大几倍的模型,成为当时世界范围内开源最强基础模型之一。 半年后,零一万物正式发布千亿参数规模的 Yi-Large,在第三方权威评测中,零一万物 Yi 模型在全球头部大模型的中英文双语 PK 上表现出色。 最新出炉的斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上,Yi-Large 模型的英语能力主要指标 LC Win Rate(控制回复的长度)排到了世界第二,仅次于 GPT-4 Turbo,Win Rate 更排到了世界第一。 此前国内模型中仅有 Yi 和 Qwen 曾经登上此榜单的前 20。 大模型用起来聪明的一个重要前提,是它得清楚你在说什么。 国外的模型表现优秀,但都是基于英语语境,而诞生在本土的国产大模型,天生就对中文理解有得天独厚的优势。 在中文能力方面,SuperCLUE 更新的四月基准表现中,Yi-Large 也位列国产大模型之首,Yi-Large 的综合中英双语能力皆展现了卓越的性能。 在更全面的大模型综合能力评测中,Yi-Large 多数指标超越 GPT4、Claude3、Google Gemini 1.5 等同级模型,达到首位。在通用能力、代码生成、数学推理、指令遵循方面都取得了优于全球领跑者的成绩,稳稳跻身世界范围内的第一梯队。 随着各家大模型能力进入到力求对标 GPT4 的新阶段,大模型评测的重点也开始由简单的通用能力转向数学、代码等复杂推理能力。 在针对代码生成能力的 HumanEval、针对数学推理能力的 GSM-8K 和 MATH、以及针对领域专家能力的 GPQA 等评测集上,Yi-Large 也取得了耀眼的成绩。 此外,从行业落地的角度来看,理解人类指令、对齐人类偏好已经成为大模型不可或缺的能力,指令遵循(Instruction Following)相关评测也越发受到全球大模型企业重视。 斯坦福开源评测项目 AlpacaEval 和伯克利 LM-SYS 推出的 MT-bench 是两组英文指令遵循评测集,AlignBench 则是由清华大学的团队推出的中文对齐评测基准。 在中外权威指令遵循评测集中,Yi-Large 的表现均优于国际前五大模型。 发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。 同时,零一万物也在考虑一些非常复杂的议题,李开复总结了三个重点: 一方面,要预备技术的进步,我们能力所及产生什么样的模型; 第二,怎么把推理成本做到最低,让我们点燃普惠点; 第三,还有传统的 PMF,找到用户需求。 李开复说,这些考量是他们在硅谷公司一般没有看到的: 这是我们独特的方法,也是中国独角兽的机会。 Yi-1.5 全面升级,API 平台全球首发 此次发布会上,零一万物 Yi 系列开源模型也迎来全面升级,Yi-1.5 分为 34B、9B、6B 三个版本,且提供了 Yi-1.5-Chat 微调模型可供开发者选择。 从评测数据来看,Yi-1.5 系列延续了 Yi 系列开源模型的出色表现,数学逻辑、代码能力全面增强的同时,语言能力方面也保持了原先的高水准。 经过微调后的 Yi-1.5-6B/9B/34B-Chat 在数学推理、代码能力、指令遵循等方面更上一层楼。 Yi-1.5-6B/9B-Chat 在 GSM-8K 和 MATH 等数学能力评测集、HumanEval 和 MBPP 等代码能力评测集上的表现远同参数量级模型,也优于近期发布的 Llama-3-8B-Instruct。 在 MT-Bench、AlignBench、AlpacaEval 上的得分在同参数量级模型中也处于领先位置。 去年零一万物选择以开源首发 Yi 系列模型,其优异的性能受到国际开发者的高度认可。 Yi 开源版本 2023 年 11 月上线首月,便占据开源社区近 5 成热门模型排行,发布一个月后 Yi-34B 被 Nvidia 大模型 Playground 收录。 在大模型的开发和产品的落地等问题上,李开复也有着自己的解题思路。 在接受 APPSO 采访时,李开复说: 我们是务实的 AGI 信仰者,我们一定要用最少的芯片,最低的成本训练出我们能训练最好的模型。同时我们会不断的去摸索,找 TC-PMF。国内的初创公司,相对硅谷公司的差异,我们能够仰望星空,但也能脚踏实地。 零一万物不会用纯大力出奇迹的唯一思维,追求能不能用一百亿美金,一千亿美金。OPEN AI 有资格尝试这条道路,但这不是他们要走的道路,当然也不会花时间来预测 AGI 的点燃点,但是他很确定地告诉大家,跟他们相关度更高的是 AI 普惠点。 今天,零一万物同时宣布,面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,Yi API Platform 英文站同步对全球开发者开放试用申请。 其中,千亿参数规模的 Yi-Large API 具备超强文本生成及推理性能,适用于复杂推理、预测,深度内容创作等场景; Yi-Large-Turbo API 则根据性能和推理速度、成本,进行了平衡性高精度调优,适用于全场景、高品质的推理及文本生成等场景。 Yi-Medium API 优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景; 如果需要超长内容文档相关应用,也可以选用 Yi-Medium-200K API,一次性可解读 20 万字的文本; Yi-Vision API 具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景; Yi-Spark API 则聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。 更重要的是,现在已经有了落地的应用,针对胰腺肿瘤患者设计的「小胰宝」就是其中之一。 小胰宝 AI 小助手可以 7×24 小时为患者介绍综合治疗知识。 这一助手背后的技术支持正是零一万物的 Yi 大模型。使用 Yi API 调用 AI 大模型后,小胰宝突破了胰腺肿瘤治疗信息壁垒,可将胰腺癌治疗路线图和治疗方案精准且系统性地呈现给胰腺肿瘤病友。 目前,该公益项目已经帮助了 3000 多位胰腺肿瘤病友。 一站式工作平台 今天的发布会,也同时介绍了零一万物近期上线的一站式 AI 工作站「万知」。 根据官方介绍,万知是一个专门为中国用户量身打造的一站式 AI 工作平台,可以做会议纪要、周报、写作助手、解读财报、论文、做 PPT,中英双语且完全免费。 目前,用户可以通过官网和微信小程序「万知 AI」登录体验。 发布会上万知官方举了一个非常实际的例子: 你刚到公司楼下,突然被领导要求做一个会议展示,但是电脑不在身边,现在通过万知,在手机上输入你想演示的主题,然后等你从电梯到工位的两分钟里,PPT 已经在万知网页端做好了,之后你只需要做一些简单的文字、配图和修改,就能直接使用。 除此之外,万知还有许多其他的功能。 首先是文档阅读能力,万知 AI 助手能够快速阅读和理解大量文档内容,包括长文档和复杂的财务数据。它能够在几秒钟内提炼出关键信息,并支持中英双语阅读。 其次在通用问答场景中,万知也展现出了不俗的产品性能,能够快速地给出恰当的答案,和专业快速的反馈。 另外,万知 AI 助手不仅支持文本输出,还能以表格、公式、代码等多种形式展现信息,使工作汇报和生活规划更加清晰明了。 最后,万知 AI 助手能够实时访问互联网信息,确保用户获取的数据和见解是最新和最准确的。 根据万知团队的研究观察,使用万知之后的个人工作效率平均有五成以上的提升,尤其在知识检索、文档构思撰写等方面节约时间显著。 目前,万知 AI 助手对用户完全免费开放。 万知官方说,类似的大模型的应用,在今年肯定会在国内成为一个重要的落地点。 李开复也提到,今年会是 AI 生产力工具的元年,因为有些领域今年就会爆发。 他觉得 AI-Frist 的真实价值,就是谁会打造一个 AI 抖音,AI 微信,AI 淘宝?零一万物希望他们有可能作为这样一个点燃者。 不过,整个 AI 的普惠点一定不是同时来到,而且有些领域的应用要求会很高。 比如现在做的生产力工具,最终这个生产力工具产生的内容,还是用户负责。所以如果里面有一些错误不完美,需要微调,甚至有些少量的幻觉,是由用户最后决定是否可以修改,所以用户的指标就是我能不能比没有这个工具,产生更好的内容在更快的时间。 李开复说 TC-PMF 其实已经达到了,但还可以更好,所以今年在生产力工具肯定会发生。 目前零一万物海外生产力应用总用户接近千万,今年 ToC 单一产品收入达 1 亿元人民币。 李开复透露: 我们 ROI 还是在 1 左右。所以这样的结果至少从国内大模型公司来看是非常有优势的。 国内大模型领域陷入混战的 2023 年初,各式各样的评测榜单铺天盖地,跻身各大榜单 TOP 的模型不在少数。 在 AI 1.0 时代,人工智能还未展现出高泛化性和涌现能力,针对头部客户做私有化部署的模式成为主流,但时间已经证明,偏项目制的重交付模式所带来的营收增长存在上限,其可持续性挑战严峻。 如今我们正处在 AI 2.0 时代,人工智能进入了一个新的发展阶段,和 1.0 相比,AI 2.0 标志着从基于规则的自动化处理向深度学习和自主学习能力的飞跃。 以此看来,AI 领域的「百团大战」,只会愈演愈烈。 从去年开始,越来越多的国产大模型激烈的竞争中脱颖而出,还在全球知名榜单中取得了不俗的成绩。 今年,行业会进入更为现实的商业落地阶段,用户都会按照应用侧所展现的能力,用脚投票。如何基于基座模型能力,尽可能提升应用效果,是追赶 TC-PMF 的重要课题。 李开复表示: 一年前,中国大模型感觉太落后(于美国)了。但今天我们非常自豪的说,我们狂奔了一年,在模型方面至少赶上了美国最顶尖、一年前发布的(大模型)产品,当然以后还要继续努力。但是,我们对未来会需要有一个沉淀和展望,不能只是拼命狂奔。 在长江后浪推前浪的 AI 时代,对于用户来说最大的意义莫过于,在厂家的竞争中知道 AI,了解 AI,使用 AI,甚至把它带到工作、学习和生活中。 而这,也是 AI 技术的初心和归宿。
vivo X100s/Pro发布:首发联发科天玑9300+,售价3999元起
凤凰网科技讯(作者/刘俣辰)5月13日,vivoX100系列发布会召开,vivo X100s、vivo X100s Pro正式发布。vivo X100s首发联发科天玑9300+,售价3999元起。 vivo X100s采用水滴微曲设计后盖,提供钛色、青云、白月光、深空灰4款配色,厚7.8mm,重203g,支持IP69防尘抗高压喷水。 性能方面,其搭载全球首发蓝晶×天玑9300+,全大核再进化,CPU主频最高 3.4GHz,安兔兔跑分230万+。 续航方面,配备等效5100mAh蓝海电池,100W双芯闪充,可畅玩7.6小时王者荣耀、刷13.9小时抖音。 游戏方面,其具备vivo蓝晶芯片技术栈的多项优化策略,结合广域冰原散热,操控一流的高刷直屏。 屏幕方面,vivo X100s采用6.78英寸2800×1260 OLED直屏,支持120Hz刷新率、1-120Hz 8T LTPO、2160Hz高频PWM调光,局部峰值亮度3000nit,基于天玑芯片硬件定制夜猫护眼。同时,采用vivo自研像素补偿技术,支持LTPO技术省电、56万档屏幕色温调节。 同时,发布会上vivo X100s Pro发布。其提供全新钛色,搭载蓝晶×天玑9300+,支持长焦舞台,首发搭载蓝图影像,还有人文街拍相机。此外,新机搭载精度跃迁一英寸主摄、蔡司APO超级长焦、蓝图影像芯片V3,等效5400mAh蓝海电池+100W双芯闪充+50W 无线闪充,支持IP69&IP68 级防尘防水。 售价方面,vivo X100s 12GB+256GB售价3999元,16GB+256GB售价4399元,16GB+512GB售价4699元,16GB+1TB售价5199元;vivo X100s Pro 12GB+256GB售价4999元,16GB+512GB售价5599元,16GB+1TB售价6199元。新品将于发布会结束后即刻开启预售。
vivo首款“相机”X100 Ultra!算法100%自研,首发自研AI多模态大模型
作者 | 云鹏 智东西5月13日晚间报道,刚刚vivo发布了X100系列三款重磅新机:X100s、X100s Pro和超大杯X100 Ultra,vivo还首次发布了自研的AI多模态大模型。值得一提的是,这是vivo首次发布“Ultra”结尾命名的旗舰机。 影像一直是vivo旗舰机核心聚焦的领域,在影像方面,vivo一方面自研,一方面与产业链共同研发,据了解,目前vivo已经申请影像专利7000多个,已获得影像授权专利有2000多个。 在AI方面,vivo自研AI多模态大模型可以从原始的视觉、声音、空间等方面接触、感知、理解世界。这一多模态大模型技术的落地应用之一是vivo看见蓝心升级版,这个应用可以帮助视障用户更好地“看见”世界。 目前旗舰机影像之战已经不仅仅是单纯比拼硬件或软件,更多是综合能力的考验,vivo在影像方面自研核心算法、定制核心器件,从而实现软硬件一体化设计。据称目前vivo影像核心算法已经实现100%自研,同时vivo也自研了影像芯片V系列,目前该芯片已经迭代至V3。 价格方面,vivo X100s售价3999元起,vivo X100s Pro售价4999元起,vivo X100 Ultra售价6499元起。 具体来看今天发布的超大杯旗舰机X100 Ultra,在最核心的影像方面,vivo X100 Ultra搭载了一英寸云台级主摄,基于vivo自研精度跃迁技术,可以实现更高精度控光,据称能让照片清晰度提升20%。 此次蔡司T*镀膜行业首发了GLC纳米涂层技术,可以解决鬼影和发雾问题,可见光平均反射率小于0.2%,防抖方面,X100 Ultra主摄支持1.5度硬件防抖,综合防抖角度2度,达到专业认证标准CIPA 4.5级。 长焦已经成为旗舰机拍照比拼的重点方面,vivo X100 Ultra此次搭载了蔡司2亿APO超级长焦,其传感器尺寸为1/1.4英寸,镜头使用了FCD100萤石级玻璃镜片,阿贝数95,同样支持CIPA 4.5级防抖、蔡司APO色差控制标准和蔡司T*镀膜。 这枚长焦镜头支持长焦微距拍摄,等效3.4:1微距放大倍率。人像方面,这枚长焦支持85mm焦段拍摄。Vivo推出了超远距长焦舞台功能,方便用户拍摄演唱会。自研影像芯片V3据称可以实现录音棚级别的录制效果。 视频方面,X100 Ultra支持4K电影人像视频、4K 120fps视频录制、4K杜比视界,搭配潜水壳可深潜至40米。值得一提的是,其支持3D照片和视频拍摄能力,据称这些3D内容以专有的立体格式存储,支持行业主流MR设备播放。 vivo X100s主要采用了直屏设计,并且在7.8mm机身内放入了大底潜望蔡司长焦,算法层面与X100 Ultra看齐。 性能方面,vivo X100s全球首发了“蓝晶×天玑9300+”,这颗天玑9300+的CPU主频最高为3.4GHz,安兔兔跑分230万。 结语:AI加码多模态,影像聚焦自研软硬件一体化 vivo的X100系列此前收到较好市场反馈,也让此次的超大杯发布颇受关注,X100 Ultra在拍照方面的一系列升级,均与vivo自研软硬件技术相关,自研技术在影像旗舰机比拼中,正扮演愈发重要的角色。 随着AI大模型在手机中应用加深,各家也都在探索AI在手机上的新应用、新场景,对于多模态大模型的探索,必然会成为后续各家厂商发力的方向之一。智能手机的AI新战事,才刚刚打响。
苹果高层史无前例大换血:12大部门14位关键继任者首次曝光
编译 | 庞小春 编辑 | 云鹏 智东西5月13日消息,苹果高层又又又要动荡了!没错,苹果一年多接连出走十余位高管后,或将再次迎来新一轮高层大换血,十二个核心部门的关键候选人,陆续浮出水面,包括CEO库克在内,苹果或将迎来“新老交棒”的关键时期。 据彭博社报道,苹果目前正面临严重的“接班人挑战”,不光是库克需要找到自己的接班人,苹果高层有很多人年龄与库克相仿,这意味着苹果可能会面临同一时期多位高层领导同时卸任的问题,如何给各个重要部门物色合格的新领导者,是苹果必须要面对的难题。 彭博社记者马克·古尔曼(Mark Gurman)发文分析了可能成为苹果运营、财务、总法律顾问、软件工程等十二个重要部门的下一任候选人,纵观这些候选人,可以说是卧虎藏龙。 此前,古尔曼已发表文章分析了苹果的硬件工程主管约翰·特努斯(John Ternus),特努斯工作能力优秀,且未来任职时间较长,是最有可能接替蒂姆·库克(Tim Cook)成为苹果下一任CEO的人。 另外,最近苹果最资深的设计师之一邓肯·克尔(Duncan Kerr)已经离开公司。至此,苹果所有主要的工业设计师均已离开,古尔曼预测不久后将会有更多人离职。 对于苹果来说,高层大换血,山雨欲来。 一、十四位继任者浮出水面:有乔布斯时代“遗老”,还有Vision Pro工程师 苹果的高管团队是一个紧密团结的整体,十多年来几乎没有发生过变化。这个被内部称为“ET”的团队中有许多人年龄相仿,与CEO库克相差无几,并且这些高管的任期即将结束,这意味着苹果内部进行大范围调整的可能性越来越大。 除了公司CEO,负责工程、营销、服务、财务和其他职能的副手对苹果的成功同样至关重要,甚至可以说是更为重要。以下是古尔曼对这些重要部门的下一任候选人的分析: 运营部门:该部门可能拥有底蕴最深厚的潜在继任者。杰夫·威廉姆斯(Jeff Williams)自2015年以来一直担任首席运营官,他的最高副手、高级副总裁萨比·可汗(Sabih Khan)成为目前可能性最大的接任者。在设计师乔尼·艾维(Jony Ive)离开公司后,可汗于2019年接替了艾维的职位,在苹果的高管团队中任职,这也使可汗拥有了接任首席运营官的内部渠道。 可汗负责监管整个供应链,即使把AppleCare支持部门交给他也不为过。如果可汗获得晋升,那么普里亚·巴拉苏布拉马尼亚姆(Priya Balasubramaniam)就几乎锁定了苹果下一任高级运营副总裁的位置,而且很有可能成为苹果未来的首席运营官。但目前有一个很大的问题是,威廉姆斯退休后,苹果将如何安置设计团队,因为目前各个工业设计师直接向威廉姆斯汇报工作。 财务:自2014年接替彼得·奥本海默(Peter Oppenheimer)以来,卢卡·梅斯特里(Luca Maestri)一直负责苹果的财务工作,其接任者最有可能是财务副总裁凯文·帕雷赫(Kevan Parekh)。梅斯特里于2013年加入苹果,担任公司财务总监一职,公司内部人员认为他有能力胜任首席财务官一职,但梅斯特里一直在培养帕雷赫最终接任。虽然帕雷赫的名字并不出名,但他是苹果的重要高管,经常直接向库克汇报重要的财务和销售事宜。帕雷赫最近还接替了前苹果高级财务主管萨奥瑞·凯西(Saori Casey)的职位,这表明他的重要性与日俱增。 总法律顾问:凯特·亚当斯(Kate Adams)于2017年加入苹果,她已经成为公司历史上任职时间最长的总法律顾问之一,其副手凯尔·安迪尔(Kyle Andeer)和沃特鲁斯(BJ Watrous),都有可能继任这一职位。这是一份要求很高的工作,也是苹果内部罕见的由公司外部人员担任的高级职位。 软件工程:克雷格·费德里吉(Craig Federighi)自2012年以来一直担任苹果的最高软件主管,他的第二号人物和最终继任者很有可能是塞巴斯蒂安·马林诺(Sebastien Marineau)。在库克的第一次管理层大调整期间,费德里吉接替了原iOS负责人斯科特·福斯特尔(Scott Forstall)。目前来看,费德里吉似乎不会很快离开,其继任者马林诺目前负责iOS的多项功能,包括小部件、主屏幕和隐私。但也有一些人认为,负责苹果部分底层软件技术的乔恩·安德鲁斯(Jon Andrews)会更合适。 硬件工程:如果此前被盛传接任库克的特努斯真的出任苹果CEO,那么他所领导的硬件工程团队将会需要一个新的领导者。特努斯有几位重要的副手,包括凯特·贝格隆(Kate Bergeron)、德尼兹·特奥曼(Deniz Teoman)和尤金·金(Eugene Kim)。在特努斯的直接下属中,大多数人认为金和贝格隆是最有可能的人选。 但也有一些人认为,特努斯的继任者最终应该是迈克·罗克韦尔(Mike Rockwell)。罗克韦尔是一位备受尊敬的工程师,刚刚推出了Vision Pro。如果这款XR头显最终能够获得成功,他的知名度也会随之提高。然而,特努斯和罗克韦尔之间的关系岌岌可危:特努斯并不是Vision Pro的支持者,罗克韦尔也从来没有直接向他汇报过工作。 ▲约翰·特努斯(图源:Christoph Dernbach/Getty Images) 硬件技术:硬件技术部门现任主管为乔尼·斯鲁吉(Johny Srouji),部门内部人士认为,负责苹果所有设备芯片的斯里·桑塔纳姆(Sri Santhanam)最终会接任。斯鲁吉在管理硬件技术部门方面很有权威,比许多高管更受人尊重,其地位似乎无法取代。但古尔曼猜测,斯鲁吉在将调制解调器芯片推向市场后,他很可能会离开苹果。 市场营销:格雷格·乔斯维克(Greg Joswiak)自2020年接替菲尔·席勒(Phil Schiller)以来,一直负责管理市场营销部门。他的副手是鲍勃·博彻斯(Bob Borchers),负责监督苹果所有产品的市场营销。如果乔斯维克在未来离职,博彻斯将挺身而出。在2009年离开苹果之前,博彻斯一直负责iPhone的市场营销,2019年,他重返苹果。博彻斯比乔斯维克年轻几岁,而且公司还有一个更长期的接班人,负责iPhone营销的副总裁凯安·德兰斯(Kaiann Drance)。 人工智能:人工智能部门现任主管为约翰·吉安南德雷亚(John Giannandrea),目前并没有真正的顶级副手可以接替他。吉安南德雷亚于2018年加入苹果公司,人工智能职位主要是为他设立。随着业界最近对人工智能的痴迷,他的角色变得比以往任何时候都更加重要。如果吉安南德雷亚的副手没有及时出现,一些人认为苹果最终会将人工智能部门重新归入软件工程部门。另一种可能是由非人工智能软件高管接任。在这种情况下,副总裁凯文·林奇(Kevin Lynch)是最佳人选。 ▲凯文·林奇(图源:Brittany Hosea-Small/AFP/Getty Images) 零售:自2019年以来,迪尔德丽·奥布莱恩(Deirdre O’Brien)一直负责管理苹果的零售业务。自从去年将人力资源职责交给新任首席人事官卡罗尔·赛弗斯(Carol Surface)后,这项工作就成了奥布莱恩唯一的职责。 除了奥布莱恩,苹果历史上只有几位零售主管:罗恩·约翰逊(Ron Johnson)、约翰·布劳伊特(John Browett)和安吉拉·阿伦德茨(Angela Ahrendts)。约翰逊是苹果零售连锁店的先驱,他在2011年离职时,对苹果造成了打击。布劳伊特是一位外来者,他是库克首次花大手笔聘用的人,但他几乎刚上任就失败了。另一位局外人阿伦德茨度过了苹果历史上动荡的五年。 目前,苹果没有任何明显的零售部门高管继任者,这意味着当奥布莱恩离开时,苹果可能会再次寻找局外人。奥布莱恩在苹果工作了三十多年,比库克任职时间还要长。奥布莱恩离职后,凡妮莎·特里古布(Vanessa Trigub)可能会临时管理该小组。 服务:这是艾迪·库伊(Eddy Cue)的工作领域,他负责管理大量的资产。该部门包括TV+流媒体平台、音乐、地图、苹果卡、iCloud、Fitness+、Final Cut Pro等应用程序,以及搜索广告和Apple Pay。此外还有工程设计、界面设计和营销组织。 在苹果公司,没有一个人能够取代库伊成为负责这些领域的高级副总裁。相反,苹果会将库伊的职责分为娱乐和服务两个部分,由奥利弗·舒瑟(Oliver Schusser)负责娱乐,杰夫·罗宾(Jeff Robbin)在目前负责工程的基础上增加应用、iCloud和地图方面的工作。作为这一转变的一部分,苹果可能会提拔这两位高管,更干脆的做法可能是提拔舒瑟,然后将罗宾的部门调到最高软件高管费德里吉之下。 ▲右边为奥利弗·舒瑟(图源:Johnny Nunez/WireImage/Getty Images) App Store和苹果活动:当席勒辞去营销主管职务,让乔斯维克担任该职位时,席勒担任了一个不同的角色——负责App Store和活动的苹果研究员。当他离开后,苹果活动部将被纳入营销或传播部门。对于App Store,苹果可能需要更加谨慎。如果苹果将该团队整合到其软件工程或服务部门中,监管机构可能会反对。因此,该部门可能会保留自己的领导人。但问题是,席勒没有明显的继任者来接管该团队,而且苹果内部也没有人具备他的跨职能能力、地位或运营知识。有人称他几乎是不可替代的。值得庆幸的是,在看到监管机构试图解散App Store后,席勒似乎愿意留下来继续战斗。 环境、政策和社会倡议:丽莎·杰克逊(Lisa Jackson)担任这一职务已有十余年,她的职位不会轻易被人取代。作为前政府官员和前环境保护局局长,杰克逊非常适合管理环境、政策和社会倡议部门。拥有这样履历的人很难找到,因此苹果很可能会拆分杰克逊的工作,并将其工作分配给多个人。杰克逊退休后,环境和供应链创新副总裁莎拉·钱德勒(Sarah Chandler)将领导生态工作。至于政府事务,古尔曼认为可以从华盛顿招聘一名高级官员,比如前总统内阁成员。 二、设计团队面临人才老大难,库克接班人充满不确定性 苹果最新一位离职的员工是设计师邓肯·克尔(Duncan Kerr),他于1999年加入苹果公司,是苹果公司现存最资深的设计师之一。古尔曼预测,科尔离职后,未来将会有更多人离职。 2019年,乔尼·艾维(Jony Ive)离开苹果时,有人预测其设计团队会出现一些人员流失,但不会是整个团队的流失。然而事实是,目前苹果的主要工业设计师以及一大批用户界面设计师基本都已离职。他们中的一些人创办了自己的咨询公司,其余人则跟随艾维去了他的设计公司LoveFrom。 ▲乔尼·艾维和库克(图源:Justin Sullivan/Getty Images North America) 在艾维主要团队的二十多人中,只有三人留任副,分别是总裁理查德·豪沃斯(Richard Howarth)、莫莉·安德森(Molly Anderson),以及相对来说算是新人的本·沙弗尔(Ben Shaffer)。众所周知,豪沃斯在苹果的角色很特殊,他一年中的某些时间都在东海岸工作,他可能无法像设计团队鼎盛时期那样与团队紧密合作。 目前围绕着苹果的设计以及该设计团队对下一批产品的影响,还存在着很大的疑问。许多人不禁要问,苹果目前的组织结构能否长期有效?古尔曼认为,苹果需要招募一位新的设计领导者,一位能够真正引领后艾维时代的人。如果不能,苹果应该寻找一家外部设计公司来帮忙。 在十二个重要部门的高管中,首席运营官威廉姆斯曾被视为下任苹果CEO候选人,并且早在几年前就已成为库克继任者的首要人选。 2015年,库克任命威廉姆斯为苹果的首席运营官,同年,威廉姆斯将库克时代的第一个主要新产品Apple Watch推向市场。四年后,他又担任硬件和软件设计负责人。 ▲威廉姆斯在加州帕洛阿尔托的商店里与顾客聊天(图源:彭博社) 但威廉姆斯今年已经61岁,只比库克小两岁,公司内部人士认为,威廉姆斯现在不太可能成为新的长期CEO,苹果董事会可能希望一位像库克和乔布斯那样能够留任至少十年的高管。所以硬件工程主管特努斯更有优势。 结语:如何平稳管理层的“大换血”,成苹果未来的重大考验 目前苹果公司的高层管理团队皆由任职多年的老将组成,随着他们的任期接近尾声,公司高层势必将迎来大换血。再加上资深设计师科尔的离职,截至目前,艾维时代的设计师几乎全部离开。 对于苹果来说,无论是设计师离职,还是高层卸任,都有可能会面临一系列的内部和外部挑战,诸如设计理念的延续、团队未来的稳定性、市场和消费者的信心等。但与此同时,也有可能带来一些新的发展机遇。
vivo X100 Ultra发布:6499元起 官方称“买相机送手机”
凤凰网科技讯(作者/刘俣辰)5月13日,vivoX100系列新品发布会召开,vivo X100 Ultra、vivo X100s、X100s Pro三款新机正式发布。官方称vivo X100 Ultra是vivo的第一款“相机”,也是vivo的第一款Ultra手机,“买相机送手机”,售价6499元起。 vivo X100 Ultra搭载蔡司2亿APO超级长焦,具备长焦望远能力。其具备2亿像素,1/1.4长焦大底,FCD100萤石级玻璃镜片。此外,其具有CIPA 4.5级防抖功能,采用蔡司APO色差控制标准。 此外,vivo X100 Ultra采用蔡司T*镀膜行业首发GLC纳米涂层技术,同时解决鬼影和发雾问题,可见光平均反射率小于0.2%;1.5度硬件防抖,综合防抖角度高达2度,达到专业认证标准CIPA 4.5级。 vivo X100 Ultra采用蓝图影像算法综合优化过曝、失焦、饱和度溢出等各项难题。同时,其搭载蓝图影像芯片V3+,优化舞台录制的各类画质问题;采用高性能麦,实现录音棚级别的录制效果。 此外,X100 Ultra具备专业摄影、视频能力。其搭载蓝图影像芯片V3+,能够实现4K电影人像视频,4K 120fps视频录制,优化潜水摄影浑浊、发绿、逆光不清晰的问题。同时,搭配潜水壳可深潜至40m实现3D照片和视频拍摄能力,这些3D内容以专有的立体格式存储,并支持行业主流MR设备。 据介绍,vivo X100 Ultra屏幕在功耗优化、高频调光、湿手触控等全方位升级,分辨率为2K 3200*1400,局部峰值亮度为3000尼特,像素密度为517 PPI,并且支持1440Hz PWM全高频调光。 售价方面,12GB+256GB售价6499元,16GB+512GB售价7299元,16GB+1TB售价7999元(卫星通信)。新品将于发布会结束后即刻开启预售,预售期间用户可享受最高24期免息分期、限量vivo TWS A1 Pro耳机赠送、限量欧洲杯定制周边赠送、以旧换新至高补贴800元等首发专项权益。
中国手机,拿下美国10%的市场,有一品牌更是排第3名
美国嘴里标榜自由开放,但其实并不那么自由、开放,比如华为、小米等中国品牌手机,不准进入美国市场。 所以一直以来,虽然国产手机在全球称霸,但却无法在美国称霸,在美国称霸的手机品牌,只有苹果,然后就是三星,国产品牌,也就只有几个借着收购其它欧美品牌,进入的美国市场。 近日,Counterpoint Research 发布了一季度美国智能手机市场数据。 报告表示,一季度美国智能手机销量继续下降 8%,这也是连续第六个季度出现同比下降。 而苹果依然是王者,拿下了52%的份额,接着是三星,拿下了31%的份额,这两大品牌合计占到83%的份额。 不过第三名就是国产品牌了,那就是联想。当然此联想非彼联想,这个联想手机,实际是上摩托罗拉手机。 但大家都清楚,摩托罗拉手机业务已经被联想收购了,摩托罗拉手机实际上就是联想手机,其份额为9%。 而除了联想之外,另外一家国产品牌,也在美国有一定的份额,大约在1%左右,就是TCL,排名美国第五名,而第四名则是谷歌。 TCL在去年同期,份额是高达2%的,但这次下滑了,变成只有1%左右了。TCL为何能够进入美国市场,原因是TCL收购了阿尔卡特,借着阿尔卡特的名义进入的美国市场。 至于之前在美国市场表现不错的中国品牌一加手机,如今也不行了,份额基本可以忽略,进不了前5名了。 可见,美国市场,其实也是在保护苹果,保护三星,要是任由华为、小米、OPPO、VIVO等厂商进入美国市场,情况绝对会不一样。 相反中国手机市场绝对是市场是全球最自由、开放在市场,任何品牌,只要遵守中国的法律法规,都可以来中国销量,但问题, 来中国销售,可不一定的卷的过中国品牌,三星、苹果就是最好的例子,都卷不过国产机。
高通证实:华为不会再买我们处理器了!
美国领先的半导体公司高通(Qualcomm)最近证实,中国电信巨头华为不再需要其处理器。这一宣布正值美国和中国之间在贸易和技术限制方面持续紧张之际。高通首席财务官确认华为未来不会从该公司购买4G芯片,这突显了全球技术格局的重大转变。 近日,美国两大芯片制造商高通(Qualcomm)和英特尔(Intel)的出口许可证被撤销,在正式吊销出口许可之前,高通CFO已明确表示,预计明年不会有来自华为的芯片销售营收,因为华为不再需要从高通购买4G芯片。 报道中提到,美国即便进一步收紧了对华为出口限制,撤销高通和英特尔公司出售半导体许可证,在手机处理器上,对华为影响也几乎不大。 有消息人士也是直言,华为除了要用麒麟在手机上摆脱高通,做到自主外,还会通过它来延伸到自家的笔记本等重要的终端上(摆脱Intel等限制)。 此外有媒体报道,华为还在打造麒麟PC版处理器,即使用泰山V130架构批量生产一款芯片,其多核性能将接近M3。 新的麒麟PC芯片可能会推出更强大的版本,类似于苹果的"Pro"和"Max"版本。 据报道,华为2024年第一季度的手机出货量和营收表现呈现显著增长。华为2024年第一季度净利润约为196.5亿元人民币(约合28亿美元),同比增长564%。利润的激增很大程度上归功于该公司在中国智能手机市场的强劲表现。就手机出货量而言,华为位居中国手机市场的首位。2024年第一季度,华为在中国的手机出货量增长了70%,为其整体增长做出了贡献。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。