EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
一年新招13万人,比亚迪撑起了就业市场
前两天,教育部专门发了篇文章—— 《如何避开“付费内推”“实习生套娃”求职陷阱》 要硅基君说,教育部也是被前两年毕业季的求职潮吓坏了,比如有专家说未来三年有3000万高校毕业生进入市场,其中有超过2000万人属于—— 慢就业低质量就业。 这词到底啥意思咱也不懂,但一看到“低质量”这词,应届生们能不着急么,一个宿舍四个人,就有两个半人就得戴上“低质工作”的帽子。 这时候,动辄电网烟草铁路石油这种单位的“实习、内推”机会,吸引力能不大么。 不过其实大家也不用着急,这两天各大上市公司年报都出来了,里面详细披露了过去一年员工数量的变化,大规模招聘的企业也不在少数。 硅基君从数据出发,盘点了一下去年(2023年1月1日-2024年1月1日)各个行业A股上市公司的员工人数变动, 看看大家今年投简历该往哪投。 23年员工增长数量最高的行业,仍旧是半导体相关,第二名被汽车揽下也是毫不意外。 数据显示,在A股上市的公司中,(按照万得三级行业分类)半导体产品与半导体设备行业员工人数增加最多,达到了13万多,排名第二的是汽车行业,增加了12万6千余人。 早几年,“生化环材”四大天坑专业向来是薪资低、机会少、工作环境差的代名词,可伴随着国家意志的转移,基础材料的突破被提上日程。 首当其冲的就是半导体行业对人才的极度饥渴,以往学化学专业的,最好的出路可能就是进万华化学,平均 薪资23190元。 现在不说那些国际顶级大厂,中芯国际的研发人员平均薪资也有39000元。 与之类似,中国新能源车行业领跑全球早已是共识,产业扩张之下同样也会吸纳更多就业。 在员工数量流失方面,保险、房地产管理和开发、专营零售,排名前三,员工依次减少了67686、42560、25151人。 这三个行业的惨状属于意料之内。 保险行业近几年收缩严重, 根据《险企高参》报道,保险业职工人员近四年连年下跌,总人数降幅已经超过13万。 而房地产管理和开发行业不用多说依然没回过气来。 专营零售主要是一些贩卖非必须的公司,像主营电器的苏宁易购,员工减少了13万余人。主营家装的美凯龙,员工减少了3千余人。 那选什么行业清楚了,简历具体投给哪些公司呢? 其实拆分来看,汽车行业的增长几乎就是比亚迪一家贡献的。 数据显示,汽车行业中人员流入数量TOP10的公司中,比亚迪新增员工13万余人,占比近90%,远高于第二名长安汽车的6千余人。 比亚迪这两年扩张速度堪称火箭,近五年员工数量足足增加47万人,员工总数超70万人。 排名第三、四的江淮汽车和福田汽车新增员工也来都超过了1200余人。 人员流失最多的三家上市汽车公司依次是上汽集团(-8998)、长城汽车(-4928)、广汽集团(-3296)。 如果算上在港股、美股上市的蔚小理、极氪等汽车公司,比亚迪依然是员工增长最多的。造车新势力中理想汽车员工人数增长较多,新增了1万2千余人,蔚来增长了6千余人,小鹏汽车则减少了2千余人。 不过理想最近在裁员,据说高达上万人,前段时间特斯拉也在大裁员。 所以与其说是汽车行业在扩张,不如说是比亚迪在扩张更为合适。 2023年,国内新能源车市场内卷加剧,而比亚迪迎来高峰,与昔日的竞争对手拉开了显著差距。 2023年财报显示,比亚迪营业收入6023亿元,净利润300.41亿元,同比增长80.72%,是上汽集团(141亿)的2倍还多。全年销售高达302万辆,同比激增61.9%,首次冲进“全球前十大车企”行列。 半导体行业这边,人员变动比较平均,没出现比亚迪这样的极端情况。天合光能(19954)、晶澳科技(17667)、通威股份(15192)三家公司流入员工数量TOP3。 半导体行业和汽车行业人员扩张较快的公司都有一条主线——碳达峰碳中和。 新能源车自然不用多说,而半导体行业这边的公司,基本都是光伏行业的巨头。 实现碳达峰、碳中和,是推动产业结构调整的强大推动力和倒逼力量,如今绿色能源的上下游行业、公司借着这一东风都在快速扩张。 什么类型的员工流入最多呢? ——生产员工。 优秀的技术人员虽然可以以一抵百提升效率,但真正吸纳就业的还是流水线。 数据显示,无论是汽车行业还是半导体行业,生产人员增长占比都最大。比亚迪新增了8万余生产人员,占新增员工的62%,而新增的技术人员只占21%。 中国新能源车市场常常出现冰火两重天的景象,一边是产能不足消费者提不到车,另一边是车辆库存积压,产能过剩。比亚迪就是前者,因此会大量招聘生产员工。 而其他车企产能较为稳定,因此相较于比亚迪,生产员工新增人数不多,更注重技术上的进步和突破。像长安汽车、江淮汽车、福田汽车,他们在技术人员上的投入比生产人员多。 不过真正吸纳就业的,还是那些“灵活就业”工作—— 2023年,美团骑手数量增加了114万人,是比亚迪的9倍。 全文完。
刘强东内部讲话:公司里最大的不公平,是让弱者占强者便宜
这几天,京东有两件事,在互联网上流传的特别广。 一件,是刘强东在内部讲话的视频片段。在视频片段里,他说,“如果你业绩好,永远都不用加班加点;业绩达到平均水平,你只要拼搏,公司永远不会辞退你;但是业绩不好,又从来不拼搏的人,一个都不能容忍,都会逐步通过各种手段全部淘汰出局。” 另一件,是大幅涨薪的通知。京东集团宣布,自2024年7月1日起,通过一年半时间,京东采销年度固定薪酬由16薪提升至20薪,业绩激励上不封顶。 这两件事一出来,立刻就引来了很多网友讨论。有人说,京东这是遇上了大公司病。有的人四点就下班,有的人一年代打卡将近100天,确实是该好好管管了。也有人说,拼多多势头太猛了。京东确实感到压力了,有点坐不住了。 也有同学来问我的看法。 我就不揣测京东的意图了。但是,有一个观点,也许可以和你分享:公司里最大的不公平,是让弱者占强者便宜。 什么意思? 请问,一家公司,是应该保护强者,还是保护弱者? 有的人会说,应该保护弱者。人类社会,和我们的文化,不都倾向于保护弱者吗? 其实,不是的。 社会保护的,并不是弱者,而是被不公平对待者。 什么是被不公平对待者? 我举个例子。 假如,你有这么一位同班同学,小赵。你们的家庭条件非常相似,不算富裕,也不算穷苦。你们就读的学校,任课的老师,也完全一样。 但是,等毕了业,你能通过的面试,小赵就通不过。你能完成的任务,做成的事情,小赵就是完不成,也做不成。 请问,这个时候,社会会不会给小赵“额外的照顾”呢? 不会。 因为社会只能保证大家都有接受教育的权利,并尽量保证公平。但当接受完教育,怎么走,能走多远,那是我们自己的课题。 有能力考上985、211,但因为拿不出学费,只能退学的学生,才是相对的“被不公平对待者”,他们也许会受到额外的照顾。但当大学毕业之后,能力强不强,工作顺不顺利,赚钱多不多,那就是他们自己的事情了。 所以,当“被不公平对待者”和“被公平对待者”同时出现的时候,我们会倾向于保护“被不公平对待者”。 但是,当“强者”和“弱者”同时出现的时候,我们并不倾向于保护“弱者”。 尤其是在公司中,我们非但不能保护弱者,反而更应该保护强者。 当然,这里的弱者,并不是指坏人,而是指暂时贡献还不够大的人。 可是,为什么要保护强者?他们都这么“强大”了,还需要被保护吗? 当然需要。 因为在公司里,强者经常会被弱者占便宜。 举个例子。 假如,你是一位刚入职的员工。有一个项目,上级让你和另一位同事,老王共同负责。 那就开始干吧!第一个项目,得好好表现。于是,你特别积极,这边联系供应商开会,那边组织技术交底,务必把工作做细、做到位。 可过了几天之后,你逐渐发现老王经常不干事儿。要么刷手机,要么睡觉,要么去隔壁闲聊。开会发言、总结,露脸的事,他抢着干,其他的,一律推脱。 怎么能这样呢?你越想越气,可一想自己初来乍到,直接去告状吧,显得不合群。自己闷头干了吧,又气不过。就这么忍着,干着,终于项目结束了。上级却把你叫过去,说你新来,应该多多请教老王,别什么事都自己做主,这次的奖金分成,少给你一点…… 好了。这个时候的你,会是什么样的心情?在你的公司里,有没有老王这样的同事?出现这样的情况,你会不会觉得不公平? 一家公司里,总有一些人的贡献大一点,一些人的贡献小一点。这很正常。但是,如果不能根据贡献大小区别对待,那么那些贡献大的人就会心生委屈。 凭什么?凭什么我花费了那么多精力,结果和他分到的钱差不多?为什么我们团队那么多人,其他人都不干活,就我们几个人一直在干活?那我也不干了。要么我换一家公司,要么我也和他们一样算了。 最后的结果,要么就是劣币驱逐良币,要么就是良币变成劣币。 所以,在一家公司里,强者,恰恰才是那个更需要被保护的人。 而企业管理的逻辑起点,就是把强者找出来,并保护他们,不被弱者占便宜。 怎么找? 阿里有这么一个模型。请看图。 如果用“能力”作为横轴,“态度”作为纵轴,建立一个“二维直角坐标系”的话,一家公司的员工,可以被分成四个类别。 第一类,叫做“明星”,态度好,能力强。这类人,虽然“不用加班加点”,但往往有很强的自驱力,你几乎不需要怎么在他身上,多花心思。京东的“业绩激励上不封顶”,就是为这类人准备的。 第二类,叫做“小白兔”,态度好,但能力弱。这类人,就是刘强东内部讲话中提到的“业绩达到平均水平,你只要拼搏,公司永远不会辞退你”的人。虽然还不足以独立胜任工作,但他们态度端正,也特别有热情,对团队有积极作用。所以,公司应当尽快进行培训,想办法提高他们的能力,让他们也成为“明星”。 第三类,叫做“土狗”,态度差,能力弱。这类人,就是“业绩不好,又从来不拼搏的人”。如果这类人还需要被保护的话,就是对“明星”和“小白兔”最大的打击。 第四类,叫做“野狗”,态度差,但能力很强。这类人,或许也“不用加班加点”,但他留下,会把团队的价值观搞得一塌糊涂,不少员工看到他的方法,态度,也会被影响。长久来看,他对公司造成的伤害极大。 明星。小白兔。土狗。野狗。四个类别。 作为管理者,你可以按照态度和能力把员工区分开,首先挑出“明星”员工,对他们好。“小白兔”次之,但也要重点培养。相对的,尽快和“土狗”分手,谨慎选用“野狗”。 用蒙牛创始人牛根生的话来说,就是: 有德有才,破格重用。有德无才,培养使用。有才无德,限制录用。无德无才,坚决不用。 是的。公司一定要对员工好。但是,这并不意味着,要一视同仁的“好”。 因为,对弱者的仁慈,就是对强者的打击。 把强者挑出来,给他们超出期待的奖励,保护他们不被占便宜,才是公司和管理者要做到的“好”。 毕竟,公司里最大的公平,就是保护强者不被弱者占便宜。 祝你的公司,能成为一家保护强者的优秀企业。 也祝你,能成为一位保护强者的强者。 共勉。 *个人观点,仅供参考。观点 / 刘润 主笔 / 景九 编辑 / 二蔓 版面 / 黄静
积木品牌布鲁可闯关IPO,朱伟松难解奥特曼IP依赖症
作者 | 江川 六一儿童节前夕,国产积木品牌布鲁可向港交所发起IPO冲刺。 布鲁可的创始人朱伟松,也是A股上市公司游族网络的联合创始人,在游族负责研发管理工作。 作为80后的游戏圈大佬,朱伟松曾靠减持游族网络套现逾10亿元,成功挖到人生第一桶金,此后开启创业之旅,并于2014年创立布鲁可。 截止IPO之前,朱伟松持股为54.95%;君联资本、源码资本、云锋基金、高榕资本等也是布鲁可股东。 值得注意的是,在IPO递表前一个月,朱伟松向5位投资者进行股权转让,约合套现7583.84万元。 据招股书,2021-2023年及2024年一季度,布鲁克的营收分别为3.298亿元、3.256亿元、8.767亿元及4.655亿元。 2021-2023年布鲁可持续亏损,其亏损额度分别为5.07亿元、4.23亿元、2.07亿元,三年亏损总额达11亿元;2024年第一季度,布鲁可扭亏,当期净利4370.8万元。 就产品线而言,布鲁可的玩具产品分为“拼搭角色类玩具”、”积木玩具”两类。据招股书援引弗若斯特沙利文报告,布鲁可是中国最大的拼搭角色类玩具企业,2023年实现约18亿元GMV。 截至2024年3月31日,布鲁可共有391款在售SKU,面向6至16岁人群的有243款SKU,占据大多数。 其次,面向6岁以下儿童的130款SKU,以及面向16岁以上人群的18款SKU。 拆解营收来源,布鲁可高度依赖于来自授权IP获得的收入;授权IP支撑起了布鲁可近六成产品、逾八成营收。 2022-2023年及2024年一季度,布鲁可来自授权IP获得的收入分别为1.16亿元、7.05亿元及3.82亿元,当期营收占比分别高达98.4%、91.7%、84.2%。若细分到当期的拼搭角色类玩具营收,来自授权IP获得的收入占比更是高达98.4%、91.7%、84.2%。 目前,布鲁可的授权IP超30个,包括奥特曼、变形金刚、火影忍者、漫威无限传奇、 漫威小蜘蛛、名侦探柯南、初音未来、圣斗士星矢等。 其中,奥特曼IP可谓撑起布鲁可的大部分营收。截至2024年一季度,奥特曼在售SKU占总SKU超三分之一,占授权IP在售SKU比例约58.6%。 布鲁可也在招股书坦承:于2023年及截至2024年3月31日止的三个月,基于奥特曼IP的产品占公司大部分收入。 与之鲜明对比的是,布鲁可仅有两个自有IP:儿童益智类的百变布鲁可、中国传统文化主题的英雄无限。 对于依赖授权IP所带来的风险,布鲁可也在招股书中坦承:“尽管公司旨在通过与广泛的IP版权方或授权方合作扩大IP矩阵,但公司可能无法以有利条款获得IP授权。“ “尤其是IP角色类玩具的日益普及,也可能加剧玩具公司之间对知名IP的争夺,进而对公司以有利条款从IP版权方或 授权方获得授权的能力产生不利影响。” 据悉,布鲁克的IP授权协议通常为期一至三年,一般不会自动重续。目前,撑起布鲁可营收半壁江山的奥特曼IP,在中国的授权到期时间为2027年。 若无法保证以类似条款维持或重续授权协议,布鲁可的产品布局、经营业绩等,或将遭受重大不利影响,其盈利可持续性也面临严峻挑战。 作为昔日的游戏圈大佬、现在的“积木王“,朱伟松如何化解布鲁可的奥特曼IP依赖症?
OpenAI陷史上最大公关危机,掌门人奥特曼捐出一半身家帮公司度难关
文| 陈斯达 李然 编辑|李然 OpenAI可能遇到了成立以来最大的公关危机! 而Sam Altman的应对速度之快,效果之好,绝对值得所有公司老板和公关人逐帧学习。 我们先看OpenAI最新的动作——官推5月28日突然宣布: 图源:X OpenAI董事会成立安全与安保委员会(Safety and Security Committee),将就OpenAI项目和运营的关键安全决策,向全体董事会提出建议。 同时还高调放出消息:已经开始训练其下一个前沿模型,预计”将在通向AGI的道路上再上一层楼”。 但如果只是看到OpenAI只是在进行日常的AI安全工作推进,顺便秀了一下肌肉,很多吃瓜群众可能会产生疑问——为什么成立安全委员会和新模型开始训练,两个原本完全没有联系的事情,要放在一起来说? 公告的潜台词,到底是什么? 图源:X 安全团队骨干叛逃,前董事会成员发文攻击 事情要从去年OpenAI的宫斗抓马说起,虽然“OpenAI遵义会议”最终确立了以Altman为核心的领导架构,但是公司高层对于AI安全问题的分歧却依旧没有解决。 “AI安全”这条暗线,从2015年马斯克拉人成立OpenAI时起,就已埋下。 最近,负责AI安全的“超级对齐团队”主管Ilya和Leike双双出走,又把OpenAI管理层架在火上烤了。 图源:X 而Leike转头就加入了“OpenAI复仇者联盟”——和OpenAI团队价值观不同,后来出走的两位前员工联创的Anthropic。 临走时的他,不忘对OpenAI的员工们高呼: 我想对所有OpenAI员工说: 学会感受AGI。 以与你们正在建设的事业相称的威严行事。 我相信你们能够 “推动 “所需的文化变革。 我指望着你们。 全世界都指望着你们。 图源:X 这番言论,就差指着OpenAI管理层的鼻子说——你们不重视AI安全。 据TechCrunch,Leike能向Anthropic首席科学官Jared Kaplan直接汇报,而Anthropic目前正研究可扩展监督的研究人员(以可预测和理想的方式控制大规模人工智能行为的技术)将会向 Leike 汇报。 图源:TechCrunch Leike和Ilya的出走网友也引得网友纷纷质疑,OpenAI开发AGI到底为了抢走大家饭碗,还是为了全人类的福祉? 图源:X 5月26号,OpenAI宫斗剧的始作俑者、前 OpenAI 董事会成员 Hellen Toner 和 Tasha McCauley 都站出来撰文指认Sam Altman以及他治下的OpenAI,完全不把AI安全当会事。 在这两位OpenAI的前董事会成员看来,AI公司内部完全不可能进行有效监管,外部监管势在必行。 图源:X 5月28日,播客The Ted AI Show的最新一期里 Hellen Toner 又透露:堂堂OpenAI董事会成员,居然要通过推特才能知晓ChatGPT发布! Toner强调,由于OpenAI董事会的非盈利性质,其设立是为了确保OpenAI要将公益而非利润置于首位。但鉴于Altman多次向董事会撒谎,董事会的工作也很难开展了。主持人补刀:OpenAI忘本了。 在这八方讨伐、前后受敌的背景下,我们看看Sam Altman和OpenAI教科书级别的公关组合拳。 一套组合拳,能否让OpenAI转危为机? 第一招,设立全新AI安全机构,补上“叛逃人员”出走带来的组织真空。 28日,OpenAI官宣了这两件事,我们来给大家翻译下。 OpenAI董事会成立安全与安保委员会(Safety and Security Committee),将就 OpenAI 项目和运营的关键安全决策,向全体董事会提出建议。 安全与安保委员会将由董事Bret Taylor(董事会主席)、Adam D’Angelo、Nicole Seligman和 Sam Altman领导。 ——我们有一个完整的最高层级的架构,保证OpenAI在追求AGI的过程中会充分考虑AI带来的安全问题。 同时高调放出消息: 我们已经开始训练其下一个前沿模型,预计”将在通向 AGI 的道路上再上一层楼”。 ——我们将对公众进一步增加最前沿(危险)模型的透明度,希望大家能相信我们。OpenAI不会背着全世界手搓一个核武器出来的。 公告其余内容: 安全与安保委员会的首要任务是,未来90天内,评估并进一步开发OpenAI的流程和保障措施。90天结束后,安全与安保委员会将与全体董事会分享他们的建议。经过董事会的全面审查后,OpenAI将以符合安全和安保的方式公开分享已采纳建议的最新情况。 ——委员会不是摆设,第一步就是要全面评估,OpenAI的开发流程有没有安全问题,90天为限! OpenAI 技术和政策专家 Aleksander Madry(准备负责人)、Lilian Weng(安全系统负责人)、John Schulman(对齐科学负责人)、Matt Knight(安全负责人)和 Jakub Pachocki(首席科学家)也将出席委员会。 ——委员会不都是务虚的领导,核心成员都是技术背景出身,详见下文介绍。虽然Ilya和Leike走了,但是我们OpenAI依然人才济济。 此外,OpenAI将通过保留并咨询其他安全、安保和技术专家以支持安全工作,其中包括前网络安全官员、为OpenAI提供安全建议的Rob Joyce和John Carlin。 ——我们也会充分利用外部力量,帮助好AI安全治理。AI安全不仅只有OpenAI的内部监督。 但是网友好像也没那么买账,现在完全不关注GPT是5还是6,但转而嫌弃起新的安全团队:你Altman一手遮天,又能发挥什么作用? 图源:X “你这么搞就是垂帘听政,大家不会相信你,也不会信任你组的安全团队!” 图源:X 要不说Altman是金牌公关呢,他一定能料想到网友对官方举措不一定买账,两个消息刚刚官宣,创始人IP也要继续立起来! 第二招,捐出一半身家,只为博个好名声。 同样是28日,Altman与其丈夫作为亿万富翁,已宣布加入“捐赠誓言(Giving Pledge)”,将捐赠一半以上个人财产用于改善社会。 图源:官网 在这份落款日期为18日的联合公开信中,二人表示: 如果没有许多人的辛勤工作、才华、慷慨和奉献精神来改善世界,我们就不会做出这样的捐赠承诺。因为正是这些人搭建了社会的脚手架,让我们走到了今天。我们的感激之情无以言表,只能将这份恩情记在心中,尽己所能回报社会,将这一脚手架搭得更高。 我们打算将捐赠重点,放在支持技术上,这些技术有助于为人们创造富裕,以便他们能够将脚手架搭建得更高。 Giving Pledge的发起人巴菲特、盖茨夫妇,名字都是响当当。签署了捐赠誓言,富人就相当于生前或遗嘱中,要将至少一半的财富捐给慈善机构或用于慈善事业。 据彭博社,Altman的身价至少有20亿美元。 图源:网络 第三招,将一切负面消息扼杀在摇篮中。 在5月中旬,有媒体爆出OpenAI在和员工签署的劳资合同中,明确要求离职员工不能在离职后发表不利于公司形象的言论,否则就会失去兑现自己所持OpenAI“期权”的机会。 图源:Vox 这个“霸王条款”刚被曝出来时,网上一片哗然。可舆论刚要发酵,Altman就公开表态——公司高层完全不知道有这么一条“PR条款”,现在已经将条款删除。 图源:X 高层是否知道合同中这条“PR条款”,已经无从考证。但如果“PR条款”就是公关危机的源头,那最简单的办法就是直接删除它。 这一套组合拳,有事前预防,事中应对,到事后弥补。Sam Altman和OpenAI这教科书一般的危机公关手段,让人不由得拍手叫绝。 但事情发展至此,除了看OpenAI的热闹之外,大家也一定会关心,什么样的配置,才能弥补Ilya和Leike出走带来的安全团队缺口? 技术背景雄厚,看看安委会大佬的实力 安全和安保委员会中的OpenAI 技术和政策专家,都是公司各部门的一把手(Head)。 Aleksander Madry(准备负责人) 公开照片 公告中介绍的OpenAI 技术和政策专家,Aleksander Madry被列在第一个。 个人主页介绍,Madry 是 MIT EECS 系(电气工程与计算机科学系,MIT最大的系)教授,也是CSAIL(MIT的计算科学与人工智能实验室)成员。 在X的主页上,他将自己的工作描述为“让人工智能更加可靠和安全,对社会产生积极影响”。与之呼应的,Madry 也在 MIT 担任可部署机器学习中心(致力于为真实世界部署打造稳定、可靠、安全的AI系统)的主任和人工智能政策论坛联合负责人。 图源:领英 他于 2011 年获 MIT 博士学位。但在加入 MIT 前,他还有过微软新英格兰研究院、洛桑联邦理工学院的研究、工作经历,兼具业内及学界的资深经验。 图源:领英 Lilian Weng(中文名翁荔,安全系统负责人). 公开照片 2018 年进入 OpenAI 时,翁荔并非直接负责安全相关的工作,而是担任机器人团队的技术主管,专注于训练机器人任务的算法。但OpenAI后来放弃了机器人的研究。 图源:领英 也是在 2021 年,翁荔得工作职责内开始明显涉及安全相关的内容。她在这一年建立、领导应用人工智能研究团队,开始关注安全和对齐问题。 图源:领英 2023 年,她正式开始领导致力于人工智能安全的工程师和研究人员团队。 图源:领英 翁荔本科就读于北京大学信息管理系,后于去了美国印第安纳大学伯明顿分校读计算机,之后有 affirm(金融科技)、Dropbox(云存储服务)等公司的工作经历,也在 Facebook 实习过。 图源:领英 John Schulman(对齐科学负责人) 公开照片 Schulman 是OpenAI 的联合创始人。作为后训练(post-training)团队的领导者之一,负责微调 ChatGPT 和 OpenAI API 中部署的模型。 除此之外,语言模型对齐是他的研究兴趣。他也关注模型的表现行为(behave),致力于提高模型在公众前的透明度。 此前,Schulman 在加州大学伯克利分校获得了计算机科学博士学位,从事机器人技术和强化学习工作。他在伯克利大学短暂学习过神经科学,我在加州理工学院学习物理。 图源:个人主页 Matt Knight(安全负责人) 公开照片 Knight 负责领导 OpenAI 中安全、IT 和隐私相关的工程及研究。 图源:领英 Knight 有达特茅斯学院的工程科学学士学位。 图源:领英 此前,Knight 专门从事安全嵌入式系统的开发工作,兼具软件和硬件方面的专业知识。由于Knight 对射频网络和物理层的特别兴趣,他专门基于盲信号分析(blind signal analysis),对 LoRa PHY 搭建了逆向工程。 Jakub Pachocki(首席科学家) 公开照片 突然提到 Pachocki 可能略显陌生,但他就是 Ilya 走后的接班。 我们不妨再来看看这位技术大佬的履历。 图源:领英 Pachocki 拥有卡内基梅隆大学理论计算机科学博士学位,曾担任OpenAI研究总监领导研发 GPT-4,参与过大规模 RL 和深度学习优化的基础研究。此前公告曾介绍,Pachocki 在将 OpenAI 愿景重新聚焦于扩展深度学习系统方面,发挥过重要作用。 图源:领英
“AI替代网文写手的未来已来?”华东师大王峰教授如此回应
在数字化和技术创新迅速变革的当代,人工智能(AI)在各行各业的应用已成常态,但是在创意和文艺产业,AI技术的介入则有不少的争议。华东师范大学的王峰教授和他的团队是国内较早拥抱AI文学的团队,最近,他们发布了首部人工智能完成的百万字小说《天命使徒》。 《天命使徒》是一部利用国内大语言模型和人工编辑相结合的长篇小说,旨在探索AI在文学创作中的可能性和限制。该项目采用了“国内大语言模型+提示词工程+人工后期润色”的模式,其中AI的贡献高达70%,剩余的30%由人工进行精细规划和必要润色。通过这种人机协作方式,项目团队希望实现最小化的直接干预,以展示AI生成文本的自然风貌。 王峰团队使用国产大模型创作的百万字AI小说《天命使徒》的引子。(本文配图 受访者提供) 尽管《天命使徒》的文学质量还远未能达到顶尖商业小说的水平,其创作过程本身就是对现有网络小说创作机制的一大挑战和进步。该项目不仅验证了AI在处理大量连续投入的提示词时保持输出稳定性的能力,也为未来基于AI的文学创作提供了重要的数据和经验。 随着技术的进一步成熟和应用普及,AI在网络文学中的作用可能将从单纯的辅助工具转变为合作伙伴,甚至可能成为独立的创作者。这不仅能大幅提高写作效率,还可能引领文学创作向更多样化和个性化的方向发展。《天命使徒》不只是技术的展示,更是对未来网络文学形态和创作过程的一次思考和预测。借此小说公开发表之际,澎湃新闻采访了这部小说的主要策划人,华东师范大学传播学院院长、教授王峰。 【对话】 希望网络文学人人可写,未来通过AI系统体验写作乐趣 澎湃新闻:这部小说AI的贡献高达70%?如何界定这个比例的? 王峰:从工作上说AI占百分之七十,人工百分之三十,创意和大的结构是人喂给机器的,AI的作用是丰富细节。 澎湃新闻:可以简单科普下《天命使徒》这部AI小说的生成过程吗? 王峰:首先,我们设想了小说的梗概和人物,通过给AI提示词的形式,让AI来写作,有时候AI也会优化我们的提示词,我们最终选择它写得比较好的段落组合在一起,最后再进行一遍人工润色。 澎湃新闻:这个过程的主要难点在哪里? 王峰:2024年之前,市场上的优秀大语言模型大多是基于英文的,而优秀的中文模型相对缺乏。因此,我们的首要任务是通过实验找到适合的中文大语言模型。此外,与大型模型进行有效交互通常需要计算机工程的专业背景。幸运的是,我们团队能够应对这一挑战,因为我本人具备计算机科学的学术背景和相关工作经验,团队中也有懂得机器语言的专家。在写作实验过程中,我们还发现了一个关键问题:在输入关键词时,必须为故事中的每个新人物提供清晰的身份背景。如果新人物首次出现时缺乏适当的介绍,他们的存在就会显得突兀,无法与故事环境和其他角色形成合理的联系。这一问题在实际操作中变得尤为明显,而解决它需要在后期进行大量的人工调整。 另一个挑战是,尽管我们输入了一系列提示词,AI生成的文本在不同段落之间的连贯性还是存在问题。段落之间的衔接有时流畅,有时生硬,这主要取决于AI处理和理解上下文的能力。我们最初的目标是验证AI能否处理大量的提示词,并生成相应数量的文本。例如,我们尝试输入2000至3000条提示词,目标是生成约100万字的内容。我们选择从出口端开始优化,确保整个写作流程的技术可行性。如果出口端处理能力不足,那么前端的所有工作都将白费。从理论上讲,这个过程是直接的。一旦我们验证了出口端的可行性,我们就可以进一步优化前端的工作流程,确保整个写作系统高效运作。 王峰团队的提示词参考写法 澎湃新闻:你谈到这部小说你打分61分,既然水平并不高,可能很多人会不理解,它的意义在于什么? 王峰:我完全理解并赞同一些杰出的作家认为人工智能不会对他们的创作构成威胁,甚至可能对AI写作持保留态度。事实上,AI小说目前不太可能对那些已经成名的作家产生实质性影响。这些作家凭借其早期的创作优势和成熟的写作技巧,已经确立了自己的地位。人工智能在写作领域要想达到与他们匹敌的水平,还有很长的路要走。我预计,AI要实现与中等水平的专业作家相当的写作质量,可能还需要10年的发展和完善时间。 澎湃新闻:为什么选择百万字的长篇,而没有选择短篇? 王峰:AI在创作上的主要优势体现在其高效率和强大的生产力。尽管目前AI在创意方面尚需依赖人类的输入,无法与人类的创造力相媲美,但其处理大量文本的能力是惊人的。我们选择挑战百万字的篇幅,目的是为了测试AI在效率方面的极限。结果令人震惊,AI在短短一个半月内就完成了百万字的创作,而一位成熟的网络文学作家通常需要一整年的时间来完成同样的工作量。 此外,当前市场上的生成式大模型面临的一个主要挑战是处理长文本的能力。我们之所以选择长篇小说作为AI写作的实验对象,是为了直面这一难题,并尝试提供一个可行的解决方案。 澎湃新闻:为什么选择让你的大模型去写网文?而不是其他类型的小说? 王峰:当前,生成式大模型在写作质量上尚有提升空间,它们可能还不足以应对某些类型小说的复杂性和深度,相比之下,网络文学的入门门槛相对较低。此外,网络文学领域已经有不少作者开始尝试使用AI技术来辅助创作,这已成为一种趋势。我们的目标是将这一现象公开化,并致力于推动网络文学生态的变革。 澎湃新闻:如何能够改变网络文学的生态呢? 王峰:我希望网络文学变成一个人人都能写的小说类型,希望普通人都能使用AI写作系统,体会写作的乐趣。 未来不会使用AI的文字工作者可能面临失业风险 澎湃新闻:你同时也是教育工作者,就你在一线的观察,AI对于大学教育的影响显现了吗? 王峰:我们的传播学院正考虑开展一项创新试点项目,即允许学生在撰写论文时借助人工智能技术。这一举措是为了适应当前技术发展的大趋势。鉴于许多学生已经在实践中运用AI工具,我们计划制定明确的规则:确保论文中由人工智能直接生成的内容比例不超过20%。 澎湃新闻:老师能判断出哪些是人写的,哪些是AI吗? 王峰:(笑)有经验之后你能看出来,AI文风它是鲜明的,有套路的。所以我们设计指引要小心的。 AI创作的冗余、重复描述 澎湃新闻:你未来的工作重点是什么? 王峰:我们的目标是提升小说的质量,这需要对人工智能模型进行深入训练,并增强其计算能力。我们计划在今年年底前开发出一个自动化系统,该系统将大幅减少用户输入的需求,降低人工操作的比重。通过这个系统,用户将能够轻松地完成一部20万至30万字的小说创作,目前,我们已经开始着手筹备这一自主研发系统的相关工作。 澎湃新闻:在你看来,十年内,哪些文字工作者会失业? 王峰:在不久的将来,职业市场将高度重视创意能力,将其视为一项宝贵的资产。创意是独一无二的人类特质,至今AI还未能在这个领域超越人类。因此,那些未能培养出创意思维的人可能会遭遇就业难题。同时,随着AI技术的不断进步,熟练掌握AI的使用也将成为一项关键技能。那些未能适应并有效利用AI的个人,可能会在职场竞争中落后。 正因如此,我们的教育体系应当转变,更多地鼓励学生发挥创意,而非单纯地依赖记忆和背诵。如果语文教育仍旧停留在传统的背诵和记忆细节上,那么在快速变化的未来,这将是一条行不通的道路。教育应该培养学生的创新思维和问题解决能力,以适应未来社会的需求。 澎湃新闻:听说你在华东师大开了大模型与创意写作的课程?可以谈谈这门课吗? 王峰:这学期,我已经开设了两次关于大模型与创意写作的课程。第一次是面向全校的通识选修课,第二次则是我们学院的专业选修课,大约有二十名学生选修。我给学生们布置了一项实践练习:撰写一部5万字的中篇小说。 我之所以要求他们写5万字,是因为目前的大模型技术在一次性写作中能够保持连贯性的字数大约在2万到2.7万字之间。学生们需要自己想办法继续写作,必须进行人工干预。我想我给学生们提供的最大帮助是安慰和指导。他们原本期望智能写作能够完全自动化,但我告诉他们必须放弃这种幻想。 首先,创意必须是人工提供的,这是不可或缺的。人们需要给出基本的结构,然后在大模型生成过程中进行调整。生成完毕后,还需要人工进行后期修改。如果在修正过程中出现问题,要考虑后期能否修正,以及修正的工作量大小。如果修正工作量很大,说明需要优化创作路线;如果修正工作量不大,就可以接受现状,只要建立起一个有效的工作流程即可。 我们的目标是不断优化这个工作流程,逐步减少人工干预。学生们提交的作业包括最终成品和剧本杀作品,以及他们各自的工作流程。我明确告诉课程助手,学生的成品可以公开展示,但他们的工作流程是个人知识产权,必须保密,不得对外透露。 澎湃新闻:现实地说,AI写作还有哪些局限性? 王峰:AI写作有伦理的限制,有些话题它不写,不回答。 王峰团队使用国产大模型创作的百万字AI小说的代表段落 未来的文学:经典精英作家写作和人机合作写作 澎湃新闻:在这么多的文学系的教授里面,为什么你是比较早拥抱人工智能小说的? 王峰:我本科专业是信息管理,这一领域与现代的数字人文学科紧密相关。我对文学和哲学充满热情,因此一直在寻找能够同时涉猎这两者的学科。美学成为了我的答案,我随后攻读并完成了美学研究生学业。我的学术旅程并未停歇,在博士阶段专注于文学。获得博士学位后,我加入了华东师范大学,担任中文系教职,在那里度过了将近二十年的宝贵时光。直到2021年,我转至传播学院,继续我的教育和研究工作。我的背景使我能够架起文学与计算机科学之间的桥梁,这是许多中文系教授所不具备的。我擅长与计算机工程师沟通,能够将技术语言和人文关怀结合起来,推动跨学科的对话与合作。 澎湃新闻:像你做的这个事情本身不知道在业内有没有收到过负面的评价? 王峰:关于智能小说的质量评价,我听到了不少批评的声音。然而,在质量把控上,我采取了一种审慎的态度。我并不追求过分美化或人工雕琢至完美无瑕的作品,因为智能写作技术仍在不断进步和升级中。我的愿景是逐步推出改进后的单品和系统,而不是一次性打造一个看似完美的产品。 我理解,对于中文系的教授们来说,他们习惯于阅读经典文学作品,对智能写作的成果自然有更高的期待和更严格的标准。大家对初期作品的质量不满,这种反馈是很常见的,也是我意料之中的。但目前我们所做的只是一个实验阶段。我们的目标是通过不断地实验和迭代,逐步提升智能写作的水平。 王峰团队使用国产大模型创作的百万字AI小说的代表段落 澎湃新闻:你和学生们对你的反馈主要是什么? 王峰:学生会问,老师咱们干长篇小说用途到底在哪?我说,整个社会阅读需要。 超越传统的作家不是我们的目标。我们面对的就是年轻人,比如写剧本杀什么的。 澎湃新闻:您认为AI小说将如何塑造未来文学的格局? 王峰:未来,文学创作将主要分为两大类。一类是传统意义上的经典作家创作,由精英作家独立完成,这类作品往往承载着深厚的文化底蕴和个人风格。另一类则是人机协作的创作模式,这种模式将随着智能写作技术的普及和成熟而日益增多。 我坚信,随着智能写作技术的不断进步,其作品质量也将逐步提升。当这种技术足够成熟,能够辅助作家更高效地创作时,越来越多的年轻人将会倾向于选择这种融合人工智能的写作方式。我相信这样的未来,并愿意为此付出心力。
开源鸿蒙OpenHarmony设备统一互联技术标准重磅发布!华为等共同制定
快科技5月29日消息,在5月25日举办的OpenHarmony开发者大会2024上,《OpenHarmony设备统一互联技术标准》正式发布。 这一标准由华为终端有限公司、中国科学院软件研究所等15家生态伙伴共同制定,旨在为教育、金融、交通、政务、医疗、航空等多个行业提供统一互联互通的基础标准参考,预计将极大推动OpenHarmony生态在各行业领域的发展。 OpenHarmony作为智能终端领域发展速度最快的开源操作系统,已覆盖多个行业产品,然而,不同厂家设备间的互联互通问题一直是行业发展的瓶颈。 为解决这一问题,OpenHarmony项目群生态委员会成员在2023年11月达成共建设备统一互联技术底座的产业共识,并在2024年第一季度成立了“设备统一互联技术标准筹备组”,启动了相关标准的研究工作。 该技术标准的核心是物模型的设计,它定义了普适性、模块化和可扩展三个基本原则,确保设备的基本操作能够实现互联互通。 随着OpenHarmony互联业务的不断发展,物模型将不断迭代和扩展,以满足全量互联互通的目标。 除了统一物模型,新标准还包括接入与控制接口、投屏、文件分享、符合性测试规范等系列标准,为跨行业、跨厂商设备的互联提供统一的技术规范。 这将有助于构建OpenHarmony物联网生态,实现设备间的无缝连接,并提供更流畅、更安全的用户体验。
大模型“1元购”?AI公司加速奔向应用端“大航海时代”
自字节跳动发布豆包大模型,互联网大厂纷纷就位,击穿“地板价”的打法从C端向B端拓展。这也成为今年“618”最亮眼的价格战。 5月15日,字节跳动率先宣布豆包大模型已通过火山引擎开放给企业客户,大模型定价降至0.0008元/千Tokens;5月21日,阿里云宣布0.0005元可得1000tokens,百度于同日下午直接宣布两款主力模型全面免费;5月22日,腾讯云紧随其后将主力模型之一的混元-lite模型调整为全面免费,科大讯飞也宣布讯飞星火API能力正式免费开放。 短短数日,大模型从以分计价迈向以厘计价,又跑步进入免费时代。问题是,价格战能否催化大模型的技术创新和商业化? 大厂掏出“传统艺能”, 会是杀手锏吗? 从字节跳动带头冲锋,到科技巨头集体跟进,突然而来的大模型价格战仿佛在重演消费互联网“在补贴中跑马圈地”的历史,熟悉的感觉扑面而来。 然而,对于这一轮降价潮,行业内却出现了明显的观点分化。 面对巨头们的价格战,大模型“五小龙”(智谱AI、百川智能、Minimax、月之暗面、零一万物)中,除了智谱AI早已宣布降价外,大部分玩家没有选择跟进。零一万物的创始人李开复及百川智能的创始人王小川更是分别表示“疯狂降价是双输”“百川不会掺和到价格战当中”。 那么,大厂们在打什么算盘?几家大模型明星初创公司为什么拒绝跟进? 对于资金雄厚的大厂来说,价格战这事一举三得。 首先,商业化方面低价抢市场,是互联网标准打法。 通过补贴把“蛋糕做大”,同时低价快速抢占市场,已经深深融入互联网巨头的业务决策基因了。对此,国金证券互联网传媒首席分析师陈泽敏也提出,这些公司此次选择大幅降价,是看到了大模型第一性原理——尺度定律(Scaling Laws)的释放,未来算力成本可能会更便宜。所以他们现在提前降价,先把自己的生态搭建起来。 这也说明科技巨头在经历“百模大战”的技术探索期之后,纷纷选择一边继续能力爬坡,一边加快商业化落地的步伐。而做出这样的决策,与大模型行业市场环境变化有关。根据“AI产品榜”最新发布的全球总榜,大部分头部产品都遇到了增长瓶颈,包括OpenAl在内的各个大模型App用户量增长趋缓。 尽管部分产品保持高两位数增长,但是用户总量就那么多,国内大模型遍地开花的竞争格局下,降价抢占优质开发者,以此触达更多用户,成为模型厂商不得不考虑的问题。 那么,“以价换量”好用吗? 好用。5月28日,阿里云青岛AI峰会上,阿里云智能集团副总裁、公共云华北大区总经理高飞介绍,阿里云通义大模型大降价不到一周,已得到企业和开发者的积极响应,有头部企业的调用量翻了100倍。 其次,除了上述众所周知的原因,还有一点是大模型行业的特性:调用量的大小会直接影响模型的效果。因此,价格战另一个目的就是烧钱为大模型获取更加丰富的训练数据。 在豆包大模型发布会上,火山引擎负责人谭待指出,大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。而且,如今基座大模型已经进入了稳定迭代的阶段,在模型训练和推理使用上,都还有长足的优化空间,成本下降得很快。 这一策略早就被OpenAI使用。从去年开始,OpenAI进行了4次降价,其最新模型GPT-4o不仅价格下调了50%,性能也有大幅提升。而此次国内降价潮主要面向开发者和企业,有助于国内科技公司从应用端获取反馈,以此推进基础模型的技术迭代。 最后,掀起价格战,清退一批实力不足的中小玩家,也是顺水推舟的一个因素。 大模型的训练和维护成本之高不是秘密。去年国盛证券报告《ChatGPT需要多少算力》估算,以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。 高成本壁垒,决定了资金雄厚是成为主要玩家的必要条件。换句话说,有能力以价换量,也是大厂的竞争优势。 不过,价格战不是决定最终行业格局的胜负手。 业务价值与“超级应用” 大模型商业化突围的锚点 关于大模型的商业应用,是各行各业绕不开的话题。对此,埃森哲首席执行官朱莉·斯威特指出:“我们关注的不是生成式AI本身,而是它能够实现什么。” 从2023大模型元年迈入新的一年,“基础大模型→行业大模型→终端应用”的商业化路线已经十分清晰。在大模型当前的商业化进程中,价格不是决定开发者选择的唯一要素,从模型走向产品,价值创造才是胜负手。 对此,李开复认为对需要最好模型的客户来说,购买100万个tokens的资源包,支付几元或者十几元的费用差别不大;王小川判断大厂降价实质是云厂商的新战争。大模型初创公司没有云服务的生态优势,不需要和大厂竞争价格,也不需要和其他中小企业竞争垂类赛道应用,而是要做一款超级应用;第四范式CEO戴文渊也表示,希望市场更趋于理性,回归到价值,让市场更加关注到生产力能够更好地作用于什么场景。 从上述观点中不难看出,当前市场还缺少真正的“超级应用”打开大模型商业化的新局面。 加速移动互联网普及的是微信、抖音等超级应用,大模型时代也需要超级AI原生应用让新技术走向普惠。百度创始人、董事长兼首席执行官李彦宏不久前在Viva Technology主论坛上提到,人工智能历经多次技术浪潮,但仍然未达到真正的“AGI时代”。在中国,无论是初创公司、还是互联网大厂,都在努力寻找PMF(产品市场契合度),致力于探索最能发挥生成式AI能力、能被数十亿人使用的应用形态。 而在这个过程中,价格战的真正意义在于,帮助企业更低成本地开发、试错,从而探索出一款适用于大模型时代的AI原生应用。对此,华金证券研报也表示,头部大模型官宣降价,或开启应用端“大航海时代”。 这一作用已经有所端倪。阿里云智能集团副总裁、公共云华北大区总经理高飞提到,降价后更多企业选择公共云+API的方式直接调用通义大模型,接近“免费”的调用成本,让中小企业更愿意“先跑起来”。 总之,科技大厂的价格战不会像过往的“百团大战”“网约车补贴大战”一样“威力十足”,但是会加速推动大模型在不同行业开发出高水平应用,让行业跑步进入“价值创造阶段”。最终决定这一轮价格战结果的,将是应用生态。
OpenAI让苹果决定给Siri换个脑子
作者|王艺 编辑|王博 在苹果公司取消造车计划,转而投向生成式AI后约三个月,苹果终于要在自己的终端产品上应用AI模型了。 长期跟踪苹果的彭博新闻社记者马克·古尔曼(Mark Gurman)当地时间5月26日爆料,经历了为期两个月的谈判后,苹果已与OpenAI达成协议,将后者的聊天机器人ChatGPT集成到iOS 18,双方的合作伙伴关系预计将于6月的苹果全球开发者大会(WWDC24)上官宣。由于不放心让OpenAI成为iOS一项主要新功能的单一供应商,苹果仍在努力与谷歌达成协议,希望Gemini可以作为一种选择。 此前,苹果已经推出OpenELM、MM1、Ferret、Ajax等多款AI模型,但这次古尔曼爆料的焦点并不在这些苹果自研AI模型上,似乎苹果更相信外部更成熟的AI模型及其产品。 但苹果在生成式AI时代已经迟到了。 去年5月,苹果公司CEO蒂姆·库克(Tim Cook)就曾表示,AI的潜力“非常有趣”,但他表示该技术存在“许多问题需要解决”。他解释说,在决定如何以及何时使用AI时,“深思熟虑非常重要”。 过去的一年,华尔街的分析师一直在抱怨苹果没有AI故事可讲。今年5月2日,在2024财年第2财季(今年第1季度)财报的电话会的问答环节,每一位提问的分析师都在问有关AI的问题。但除了之前的评论外,库克几乎没有透露苹果未来的AI功能或服务,也没有透露苹果如何利用它们赚钱。 “我不想抢在我们发布公告之前发表言论,”库克在电话会上说,“我们认为生成式AI是我们产品的一个关键机会,我们相信从理论上讲,我们拥有与众不同的优势。我们将在未来几周内进一步讨论这个问题。” 而库克近期在接受路透社采访时则表示:“我们仍然对生成式AI领域的机遇非常乐观,并且正在进行大量投资。”他指出,该公司过去五年已在研发上投入了1000亿美元。 尽管苹果在生成式AI时代姗姗来迟,但苹果依然拥有后发优势——庞大的用户基础、完善的产品生态以及软硬一体的范式。 在近期举办「AI创生时代——2024甲子引力X科技产业新风向」大会的巅峰论坛上,出门问问创始人兼CEO李志飞就表示:“大公司跟小公司是完全不一样的。我觉得对于大公司来说,后发可能是优势,尤其是做大模型的。” 在生成式AI领域,一方面,AI似乎有先发优势:先行者可以有数据飞轮;另一方面,AI似乎有后发优势:后来者的投入产出比更划算。 一直在AI领域占有先发优势的OpenAI,即将成为苹果后发优势中的一环,而OpenAI也想借助苹果的后发优势,寻求更大的增长机会。 1.“虽迟但到”的决定 OpenAI发布GPT-4o后,就有网友评论,苹果的语音助手Siri可以下岗了。 作为一款“原生多模态大模型”,GPT-4o所有输入和输出都由同一个神经网络处理,这使得GPT-4o能够接受文本、音频和图像的任意组合作为输入,并输出文本、音频和图像的任意组合,是兼具了“听觉”“视觉”的多模态模型,同时还支持中途打断和对话插入,且具备上下文记忆能力。 OpenAI官网博客显示,GPT-4o在谈话中对音频输入的平均响应时间为320毫秒,最短的响应时间为232毫秒,与人类的响应时间相似。 值得注意的是,OpenAI在演示GPT-4o时使用的是iPhone,以OpenAI的野心和能力,绝不仅仅只是想做一个APP,而是想进入整个苹果生态——OpenAI需要通过苹果来突破用户增长瓶颈。 OpenAI总裁格雷格·布罗克曼(Greg Brockman)演示GPT-4o功能,图片来源:OpenAI 在GPT-4o发布前,ChatGPT已经历了一年左右的流量增长困境。随着GPT-4o的发布并接入ChatGPT,ChatGPT本月有望创下网络流量的新纪录。 SimilarWeb数据显示,今年5月的前三周,ChatGPT网站平均每日访问量约为7700万次,本月总访问量有望超过23亿次,而此前的月访问量峰值为18亿次。 流量来了,OpenAI自然想趁热打铁,苹果就是其重要目标。正如英伟达高级研究科学家Jim Fan所说:“谁先赢得苹果,谁就赢得了胜利。” 不过OpenAI对端侧的“觊觎”其实早有端倪。去年秋天,科技媒体The Information就爆料,OpenAI CEO 萨姆·奥尔特曼(Sam Altman)与苹果公司原首席设计官乔纳森·伊夫(Jony Ive)正在合作开发一款的AI驱动的消费设备。这家初创公司目前正在与一些风险投资界的巨头进行融资谈判,其中包括Emerson Collective和OpenAI的主要投资者Thrive Capital。 OpenAI刚刚走出增长困境不久,苹果则还在经历增长困境。 苹果公司发布最新季度财报显示:今年前三个月,实现营收907.53亿美元,同比下降4%。 去年开始,华为、荣耀、小米、OPPO等手机厂商都开始积极尝试AI大模型落地。现如今,生成式AI已经成为手机产业链角逐的一个新赛道,而苹果这条赛道的步伐显然慢了竞争对手几步。IDC中国区副总裁王吉平曾对媒体表示:“有AI加持的手机厂商增速表现更好。” 尽管苹果与OpenAI合作的传言不断,但接入GPT-4o的ChatGPT展现出的这种令人惊叹的实时交互效果以及暴增的流量,或许是让苹果最终选择OpenAI作为合作伙伴的原因。 苹果在“深思熟虑”之后,终于要迈出AI模型落地的第一步。 2.大招背后的问题 尽管距离WWDC24还有十多天,但是外界已经心急如焚。不少人好奇,苹果和OpenAI的合作模式会是怎样的? WWDC24宣传海报,图片来源:苹果 今年WWDC24的中文海报主题是“大招码上来”,但是在苹果放大招之前,一些问题不容忽视。 尤其是模型在端侧和云侧的使用情况以及用户隐私的保护,是大家关注的焦点。 对此,Jim Fan在X上发帖进行了预测: 放弃siri。OpenAI为iOS提炼出更小型、纯设备上的GPT-4o,并可选择付费升级以使用云; 将摄像头或屏幕传输到模型的原生功能,芯片级支持神经音频/视频编解码器; 与iOS系统级操作API和智能家居API集成。 Jim Fan认为,可以通过OpenAI为苹果设备训练端侧小模型,对部分付费用户提供云侧大模型的方式进行合作,进而灵活地解决用户隐私保护的问题。 无独有偶,古尔曼此前也发文称,苹果公司计划将自研高端芯片(如M系列芯片)置入云计算服务器中,用于处理计算难度大的AI功能,而相对简单的AI功能则直接在iPhone、iPad和Mac等终端设备进行本地处理。 不过,苹果想要在自己的设备上用好OpenAI最先进的大模型,还有以下三方面的问题值得探讨。 首先是Siri用什么模型的问题。由于Siri是人机语音交互的入口,很多人好奇,苹果是会将Siri接入云端的GPT-4o模型,还是会将本地与云端模型混合使用,为Siri提供服务? 与国内手机厂商普遍采用云端处理语音助手的请求不同,Siri的唤醒和识别都是在本地进行的。但是,端侧模型对手机内存、CPU、GPU算力调度的要求更高,vivo副总裁、OS产品副总裁周围就曾直言:“性能方面,如果做输入法的出词推荐,两秒才能出一个词;功耗方面,大参数量级的大模型在端侧运行非常耗电。” 国内某手机厂商专家西风(化名)在一场专家调研会上表示,由于GPT-4o参数量巨大且依赖强算力,因此Siri在接入GPT-4o后,不会走现有的端侧识别合作路线,而是会在云端调用识别功能。 他推测,苹果唤醒可能直接使用GPT-4o的云端模型,但具体任务的调用策略需要一个系统引擎来决定何时调用云端或本地模型。对于文本处理、生成等功能,本地模型就能胜任;但对于需要细腻度和准确率更高的多模态交互(如视频功能),就需要调用云端模型来解决。 西风的推测,与古尔曼的最新爆料基本一致。古尔曼透露,苹果的iOS 18和macOS 15都将包含特定的软件,用于确定任务是在端侧还是云侧进行处理。 接近苹果的硅谷某大厂生成式AI开发者丽声(化名)则表示,由于苹果对用户隐私的极端重视,苹果跟OpenAI在大模型上的合作“只可能在云上进行”,不会让OpenAI为其定制端侧模型。“OpenAI对iPhone内应用的调用权限,也需要视用户信息的隐私程度而定。”丽声对「甲子光年」说。 其次是双方合作后,具体产品形态和落地时间的问题。苹果会不会单独为OpenAI定制一个硬件?具体的落地时间会在何时? Tayside Investments Australia的资深分析师赵冬帅认为,苹果可能会先从PC入手,先推出搭载了GPT-4o大模型的Macbook,以应对微软刚刚推出的“Copilot+PC”的挑战;同时他认为苹果会专门给GPT-4o定制一个硬件产品,以突出GPT-4o的语音和视觉交互功能。 而在西风看来,GPT-4o仍将会搭载在iPhone手机上,只是出现时间早晚的问题。他认为,GPT-4o的云端应用预计会在iOS 18发布时出现,而与硬件的充分融合则会在今年9月份的iPhone 17上体现,这也将带动国内厂商瞄准AI手机定义进行相应变革和参照。 丽声对于“苹果可能推出新硬件”的猜测持否定意见。在她看来,苹果的硬件战略是非常固定的,绝对不会因为和OpenAI合作就为其专门定制新的硬件。“苹果大概每六到七年才会出一个新的硬件产品,GPT-5可能明年年初就会发布,那如果按照这个逻辑,难道GPT每迭代一个版本,苹果就要为其定制一款硬件吗?”丽声说。 最后是接入OpenAI后用户高频使用带来的算力调度与算力成本问题。接入GPT-4o后,iPhone全球超过10亿的活跃用户会不会使苹果的云端交互变得不顺畅?苹果又该怎么解决接入GPT-4o后算力成本大幅提升的问题? 「甲子光年」了解到,一般来说,一个手机厂商每年需要向识别相关的大模型供应商付费大约8000万元左右。如果苹果接入GPT-4o,预计支付的费用会在亿元级别。 GPT-4o当前的定价,图片来源:OpenAI开发者平台 或许也正是因为未来搭载大模型的iPhone太耗费算力、太贵了,苹果在尝试一种更加便宜高效的云端算力提供方法:直接将它的PC端芯片M2 Ultra放进云端服务器。 这也意味着,为了更好地参与生成式AI的竞赛,苹果似乎瞄上了算力端,打算自己上手做云服务了。 丽声对「甲子光年」证实了这一点。她表示,之前苹果做AI相关业务的时候,算力端只是通过买显卡、买AWS云服务解决,但是作为一家软硬结合的大厂,苹果在人力、财力上都不缺,很多苹果内部员工也都倾向于自己做云服务。因此她认为,苹果未来可能不会把大模型训练和推理所用的算力像以前一样交给AWS解决,而是自己下场做云。 除了云侧算力,端侧算力同样重要。目前主流端侧模型的参数量均在百亿左右,算力需要满足实时执行这样的模型的要求,便需要扩大芯片面积来提升性能。 「甲子光年」注意到,苹果在其最新发布的iPad Pro上搭载了M4芯片,这是目前苹果性能最强的芯片。M4芯片的NPU运算速度达到了每秒38万亿次(38 TOPS),而苹果的上一代芯片M3的NPU运算速度只有每秒18万亿次(18 TOPS)。 M4芯片,图片来源:苹果 怎么理解这一数据?以自动驾驶需要的算力类比,如果要实现L2级自动驾驶,可能需要20 TOPS;L3级自动驾驶需要50—100 TOPS;L4级自动驾驶需要约2000 TOPS。也就是说,现在M4芯片相当于L2.5级自动驾驶需要的算力水平。 与OpenAI的密切接触,和对云侧、端侧算力的布局,都能看出苹果All in AI的战略野心。尽管双方合作还未官宣,尽管苹果在中国市场份额出现下降,尽管OpenAI大模型并无在华落地资质(有消息称,苹果公司正在和百度进行谈判,以便在苹果设备使用百度人工智能生成技术),但是苹果和OpenAI将如何共同塑造下一代AI手机及其影响,是安卓手机厂商不得不思考的问题。 3.苹果的后发优势 当我们把苹果入局AI放到全球手机和PC厂商的竞争生态中去考虑,就会发现有一个不得不回答的问题:苹果将大模型引入终端设备,和其他已经落地大模型的厂商相比,后发优势是什么? iPhone与Macbook,图片来源:苹果 庞大的用户基础、完善的产品生态是苹果很明显的优势。根据苹果2024 财年第1财季(2023年第4季度)的财报,包括iPhone、iPad、Mac等,全球活跃的苹果设备数量超过22亿台。而根据Asymco知名分析师霍勒斯·德迪乌(Horace Dediu)发布的数据,其中iPhone在2023年就拥有了超过10亿的活跃用户。 一方面,苹果可以通过自有的用户数据训练大模型,增强自有模型的能力;另一方面,能力更强的大模型也能反哺产品,用更强的功能吸引更多的用户,进而在产品生态中形成一个不断增长的数据飞轮。 丽声则认为,苹果做大模型,最大的优势是软硬一体。 “很多国内厂商用的是高通的芯片,来回的沟通成本、上机时间成本很高,很影响产品的快速迭代,而苹果的自研芯片则没有这种问题;此外,软硬一体的好处是苹果不用拘泥于现有的大模型架构,可以在自己的芯片上做微调进而设计创新架构,而用高通芯片的国内厂商只能根据Llama这种现有的模型架构做。”丽声告诉「甲子光年」。 尽管OpenAI即将融入到苹果的软硬一体的范式中,成为苹果后发优势中的一环,但这并不是永远不变的。 丽声还透露,这次与OpenAI的合作只是苹果在AI和大模型领域的一次“试水”,在更远的未来,苹果很有可能抛弃OpenAI,转而完全采用自研的大模型。 “苹果跟OpenAI的合作很可能不会一直延续下去,我认为这只是苹果的一次短暂的试水,把一些AI功能按部就班地加入进来,看看大家的反馈,然后再做一个属于自己的GenAI系统。毕竟要做一个顶级且安全的大模型,投入不会少,苹果作为大公司肯定能掏得起这个钱,只是因为公司体量太大业务太多,不可能短时间内投入大量人力物力财力搞大模型。按照苹果这几年的产品和经营策略——既不支持开源也很少跟外界合作,因此这次很可能也只是先试试水。”丽声说。 软硬一体的范式,带来了苹果产品中那些令人赞叹的交互功能。尽管在生成式AI时代,苹果入局较晚,但依然值得期待,毕竟有些交互体验和效果,只有苹果才能做出来。 苹果和OpenAI是否能够成功合作,苹果是否可以发挥后发优势打破增长困境、引领技术创新,还有待观察。 但对于所有的智能终端厂商来说,新的战争开始了。
AI搅乱亚马逊电子书
如果你是一个网上冲浪老手,一定还记得2000年左右在门户网站浏览新闻的体验: 你需要从一堆花花绿绿的广告当中识别真正的内容,并精准点击。看得不准,或者点得不准,都会让你被即刻送往另一个不想去的网站。可以说,识别垃圾信息、避开它们,是彼时网上冲浪的必备技能。 如今,AI的发展让人梦回千禧年,在亚马逊搜索电子书,要时刻警惕被AI生成的垃圾书骗。 食之无味就算了,有的垃圾书甚至想置人于死地。 比如在亚马逊上公开出售的电子书《野生蘑菇烹饪书:从森林到餐盘,野生蘑菇烹饪完全指南》《西南地区的顶级蘑菇野外指南》,书里明晃晃写着用“气味和味道”识别不同的蘑菇。 闻一闻或者尝一尝,就能知道蘑菇的种类啦!这种话,随便拉来一个云南人都能鉴别为一派胡言。正如蘑菇界的名言所说:所有蘑菇都是可食用的,不过有些蘑菇只能食用一次。 相关专家在接受《卫报》采访的时候几乎发出尖锐爆鸣:“这似乎在鼓励人们以品尝作为辨别方法。绝对不应该这么做。” 书中提到的一些蘑菇则“很刑”。比如上述烹饪指南中提到的“狮鬃菌”,虽然是可食用的,但在英国是受保护的物种。别问,问就是狮鬃菌尝起来像缝纫机的味道。 根据专做AI文本识别的公司Originality.ai的检测,这两本书的样本中人工智能检测得分是100%,这意味着系统很自信这些书由如ChatGPT这样的聊天机器人编写。 这些书被报道之后,纽约真菌学会都出面发X(前Twitter),呼吁人们“请只购买已知作者和美食家的书籍,这可能关系到生死”。 我们在去年2月就曾经报道过一些人开始通过ChatGPT等工具撰写书籍,并放到亚马逊等网站上售卖的现象。如今一年多过去,AI高速发展,亚马逊显然还没有找到有力的方法杜绝这一现象,这家老牌电子书网站正在被AI搅乱。 让我们来捋一下时间线。 2022年11月,ChatGPT横空出世。仅仅几个月之后,亚马逊上就开始出现一些疑似由AI撰写的书籍。除了内容和封面都粗制滥造之外,最明显的反常信号是一个作者一天出版数本书。 彼时在YouTube上已经开始有博主在视频教学如何用ChatGPT写书并在亚马逊上售卖。 从2023年年中开始,包括VICE、WIRED(《连线》)等在内的媒体开始报道“AI图书正在淹没亚马逊”的现象。 根据独立作家凯特林·林奇(Caitlyn Lynch)2023年6月的统计,彼时亚马逊上“青少年浪漫”的类型下,畅销排行榜的前100本电子书中,有约八成都是语无伦次的,看起来很像是AI生成的。 一直到如今,还不断有作者站出来公开谈论AI图书对他们个人IP的盗用与模仿。 也就是说,除了某些类型成为AI图书的重灾区之外,一些作者——尤其是有名气的作者——会被“影子图书”蹭流量。这种情况大多发生在新书发售的黄金周期内,和作者相关的传记、与新书高度相似的仿品大量出现,试图在宣传期蒙骗不明真相的用户,窃取流量。 一个新鲜的例子来自知名科技记者卡拉·斯威舍(Kara Swisher)。 卡拉在科技报道界德高望重,今年已经62岁,几乎把科技界大佬都采访了个遍。包括但不限于数次深度对话史蒂夫·乔布斯、埃隆·马斯克、马克·扎克伯格等。 今年初,卡拉出版了一本个人回忆录《燃烧的书(Burn Book)》。但她很快就发现,当她在亚马逊检索自己时,除了自己的新书,还出现了一些奇怪的东西。比如《卡拉·斯威舍:硅谷的斗牛犬》《卡拉·斯威舍:她如何成为硅谷最具影响力的记者》等,其中一本书的作者在一个月里就“写”了四本传记。 在卡拉看来,这些明显是窃取新书流量的AI图书,气愤的她甚至给亚马逊CEO安迪·杰西(Andy Jassy)发了一条短信:“这**是怎么回事?你在浪费我的钱。” 美国作家协会的CEO表示,亚马逊上的欺诈书籍其实一直都是一个问题,但最近几个月这个问题愈发尖锐,可能是因为在AI帮助下造书成本降低:“每一本新书似乎都有配套的各种书出现,试图窃取销售额。” 图书“盗窃”不仅发生在新书作者身上。另一位作家梅勒妮·米切尔(Melanle Mitchell)在2019年发表《人工智能:思考人类指南》一书,最近却发现在亚马逊搜索这本书时,出现了去年9月发表的同名电子书。 这本同名电子书只有45页,用坑坑巴巴、笨拙的语言重复米切尔的观点,看起来是一部写得不怎么样的摘要。而该书作者在亚马逊上没有头像,也没有简介,名下却有几十本类似的书,都是对其他书籍的总结式模仿。 深度伪造检测公司Reality Defender帮米切尔检测了一下,果然那本同名电子书有99%的可能是由AI生成的。 Reality Defender还顺便检测了一下“AI教母”李飞飞著作《我眼中的世界》在亚马逊上的模仿者。与米切尔的模仿书不同,在亚马逊搜索李飞飞《我眼中的世界》,会出现十几本写明自己是“摘要”的电子书。经检测,这些书也大概率是AI生成的。不过虽然写着自己是“摘要”,实际内容则更像是用AI重写了一遍原作,就像是“XXX书·儿童版”。 在《连线》杂志联系李飞飞,告知她这一现象后,她回复了一个“脑袋爆炸”的emoji表情,显然在此之前对有人在偷偷用AI模仿自己的书一无所知。 亚马逊也并不是什么都没做,但动作显得有些迟缓,效果也有限。 去年8月,简·弗里德曼(Jan Fridman)向亚马逊和美国“豆瓣”Goodreads开炮。弗里德曼是出版业的专家,曾在多家知名出版公司担任高管,也有自己的博客,时不时发布对出版业的见解和实用建议。 她在自己的博客发表文章《我宁愿看到我的书被盗版,也不愿意看到这个》,表示在亚马逊上有数本署名Jane Fridman但与她无关的书籍,更要命的是美国“豆瓣”Goodreads还将这些书籍放到了她的相关页面。 也就是说,一个不熟悉弗里德曼的读者,很有可能在对照了亚马逊和Goodreads之后,认为那些仿冒品出自她之手。而这些作品内容拙劣,足以对弗里德曼造成名誉上的打击。 更令弗里德曼不悦的是,当她联系亚马逊和Goodreads,试图让其下架仿冒书籍的时候,遭到了两个平台的拒绝。亚马逊要求她提供相关的商标注册证明,而弗里德曼被冒用的实际上是自己的名字,而她并未对自己的名字进行商标注册(谁会想到去注册自己的名字呢)。 有意思的是,在弗里德曼发表博文公开吐槽这件事后不久,亚马逊和Goodreads就悉数移除了仿冒作品。 弗里德曼感叹:“我敢肯定,这很大程度上拜赐于我在写作和出版界的知名度与名誉。如果这些情况发生在比较小的作者身上,他们(平台)会怎么做?” 弗里德曼的发声引发了一连串的反应。先是美国作家协会宣布会为作者们提供帮助,而后美国联邦贸易委员会(FTC)也发表了一篇文章,涉及生成性人工智能和图书销售,表明他们正在密切关注相关问题。 去年9月,在弗里德曼发表博文后一个月,亚马逊开始打击AI图书。它修改了规则,将自助出版(Kindle Direct Program,下称KDP)同作者每日上传书籍的数量从无限制更改为最多三本。 KDP本就是AI图书的重灾区。通过KDP,作者可以绕过传统出版途径,直接将作品发表在亚马逊上并进行销售。理论上,亚马逊一直都未禁止AI生成的文本销售,而是要求作者标明,且不能产生危害。 亚马逊还声明,正在积极监测AI的发展以及随后对阅读、写作和出版的影响。 但从今年还在不断出现作家新书被AI截胡的事件来看,亚马逊显然做得还不够好。 一个奇怪的现象是,虽然亚马逊上充斥着疑似AI生成的图书,但大部分此类图书并没有什么销量。 究竟是什么在推波助澜? 人们对AI工具的确愈发熟悉,这也就促成了一些人有了想要通过AI写书赚钱的想法。 一个有点惊人的数字是,Statista报告说,23%的美国作者在作品中使用了AI,近50%的受访作者表示他们曾用AI作语法工具,还有10%的受访者表示AI生成了他们的全部文稿。 知名媒体Vox指出,真正依靠“AI图书”赚钱的,很可能不是那些把AI图书放在亚马逊上出售的“作者”,而是开课教授“如何用AI图书赚钱”的人。 亚马逊的自出版业务KDP于2007年推出,早在2010年前后,关于如何利用自出版赚钱的课程如“自助出版革命”就如雨后春笋般冒出来。 在学习“自助出版革命”的若干学生中,有一对米科尔森(Mikkelsen)双胞胎兄弟做得很成功,他们自出版了一本又一本垃圾书,还创新地利用谷歌翻译制作外文书籍,进一步扩大了销路,收入一度达到百万美元。但最终,由于买家投诉,他们的KDP账户被封锁,于是二人创业,也开始兜售相关课程。 有意思的是,他们的课程名称一路从“有声书影响学院”“出版生活”,到如今的“AI出版学院”。兄弟俩的课程原价6000美元,但往往会“限时打折”到2000美元左右。 上过“AI出版学院”课程的学生透露,2000美元只是敲门费。一旦开始上课,就会发现后续几乎所有环节都会交费。首先,兄弟俩会收取AI撰写大纲的AI服务费,而后是人工代写费用(接活的代写公司也是由兄弟俩的学生所有),接着还会有有声书制作费用,以及刷好评的费用。 如果学生想要完整地跟完整个课程,费用会从最初的2000美元激增到7800美元。 虽然交学费前,“AI出版学院”承诺不满意就会退款,但当学生真的要退款时,学院要求其提供完成了全部课程、出版了书籍并没能把学费赚回来的证明。 根据Inc.的一篇报道,米科尔森兄弟的公司收入从2019年的30万美元,已经激增到了2022年的5000万美元。截至目前,他们的公司仍然运营着(毕竟好像的确没有违法)。 AI图书搅乱亚马逊,“坏”的却不是AI,而是背后无视规则无视道德的那批AI用户。 将视角拉远,我们正处在AI内容与人类内容混杂的时代,一场“AI狼人杀”时刻在互联网中上演。根据互联网安全公司Imperva的报告,2023年,全球互联网流量中有49.6%来自机器人,而在2019年,这个数字还只有37.2%。 高效、准确、全面地甄别AI内容已经成为一个亟待解决的难题。
英伟达将推AI PC芯片:整合Cortex-X5 CPU及Blackwell GPU内核
5月29日消息,据The register报道,近日业内有传言称,英伟达(Nvidia)正准备推出一款将下一代 Arm Cortex CPU内核与其 Blackwell GPU内核相结合的芯片,主要面向Windows on Arm的AI PC设备领域,这也意味着该市场的竞争可能会越来越激烈。 多年来,高通一直在积极推动适用于 Windows系统的Arm 架构芯片,但是并未获得成功,直到苹果基于Arm架构的M系列处理器在其Mac PC产品上大获成功之后,进一步强化了Winodows on Arm阵营的信心。在最新的微软开发者大会上,高通携手微软及OEM厂商推出了一系列基于高通骁龙X处理器和Windows系统的“Copilot+ PC”。微软也推出了基于该芯片的新一代 Surface Laptop 和 Surface Pro 平板电脑。高通表示,其 OEM 合作伙伴正准备推出 20 台“Copilot+ PC”。 不过,据此前的消息显示,微软与高通之间关于Arm平台Windows的独家合作协议将于今年到期,这也意味着微软Windows也将对其他Arm芯片厂商开放。此前已有消息称,联发科计划推出面向Windows PC的Arm芯片,在此之前联发科已经有面向的Chromebook的芯片。 最新的传闻称,英伟达也将加入这一行列。据悉,这家 GPU 巨头正在准备一款SoC,计划将Arm最新的超大核Cortex-X5 核心与其最近推出的 Blackwell 架构的 GPU IP相结合。 Arm 没有回应关于该传闻的评论请求,而英伟达则表示,我们“今天没有什么可宣布的”。 考虑到目前英伟达在云端人工智能领域的统治地位,在生成式AI开始从云端进入到边缘端的趋势之下,英伟达希望凭借其强大的GPU能力以及近年来在自研Grace Arm CPU上积累的经验,进入Arm Windows PC市场无疑是扩展业务边界的一步好棋,特别是在PC市场正面临生成式AI PC所带来的换机潮的背景之下。 然而,对于针对PC的Arm SoC来说,Blackwell GPU似乎是一个奇怪的选择,因为它是英伟达目前最新的高性能GPU设计。然而,一些报道表明,英伟达将使用迄今为止未经宣布的面向消费者的基于Blackwell 的RTX GPU,以及对于LPDDR6内存的支持。 继去年推出的Cortex-X4之后,Arm的Cortex-X5将成为其为智能手机和笔记本电脑设计的高性能核心,代号为Blackhawk,目前尚未正式宣布,但预计将比现有的Arm Cortex-X4核心“性能将大幅提高”。 今年早些时候,Moor Insights&Strategy首席执行官Patrick Moorhead在与Arm的简报后披露了Cortex-X5的早期细节。他当时写道,这将带来“五年来最大的IPC(每个周期的指令)性能同比增长”。 总结来看,英伟达确实有可能会推出面向Windows on Arm设备的PC芯片,但是该芯片最快恐怕也要等到明年才会出现。
利好消费者:美国两州禁止苹果“零件配对”做法
IT之家 5 月 29 日消息,继今年 3 月俄勒冈州出台类似禁令之后,科罗拉多州也将“零件配对”做法纳入“维修权”立法并予以禁止。 “零件配对”是指将组件(例如屏幕)的序列号与 iPhone 本身的序列号进行数字配对,即使用户将一个原装苹果组件换成另一个,由于配对不匹配,维修也无法完全成功,这可以防止使用拆解的零件进行维修。例如在 iPhone 13 上,更换屏幕会导致 Face ID 无法使用。由于必须使用苹果认可的零件,许多维修变得很昂贵。 IT之家注意到,俄勒冈州是美国第一个正式立法禁止“零件配对”的州,该法令将于 2025 年 1 月起对智能手机生效。公益组织 PIRG 报告称,科罗拉多州现在也采取了同样的措施。 科罗拉多州居民现在拥有美国最广泛的维修权利。这项新法律建立在科罗拉多州之前保护农用设备和电动轮椅维修权的法律之上。 科罗拉多州也是第二个在其电子产品立法中加入限制公司使用软件锁来限制维修(即“零件配对”)的州。州长贾里德・Polis 表示,这项法律将节省资金并减少浪费。“保护我们修理自己损坏设备的权利将节省资金、支持小型企业并减少电子产品浪费。今天,我们正在努力保护科罗拉多居民的维修权,以确保制造商无法强迫科罗拉多居民支付高额的维修费用。” 尽管苹果已经通过提供一种在维修设备时要求公司“认可”二手零件的方法软化了其对“零件配对”的立场,但俄勒冈州和科罗拉多州都更进一步,完全禁止了这种做法。9to5mac 称,其他州可能会效仿他们的做法,苹果和其他公司最终可能不得不放弃“零件配对”。 多年来,苹果一直大力游说反对“维修权”立法,无论是在州级还是联邦层面,都花钱进行抵制,试图完全阻止该立法或尽可能削弱其效力。该公司在 2021 年推出了“自助维修计划”后,立场发生了 180 度转变。与此同时,该公司停止反对“维修权”立法,并开始积极支持它们。
骁龙 8 Gen4 发布时间确定,小米或再次首发
继高通去年十月发布骁龙 8 Gen3 后,已过去了三个季度。移动端的 9300 与 8 Gen3 之争,也随着本月最后一台 8 Gen3 超大杯发布而落下帷幕。 而现在根据最新消息,骁龙 8 Gen4 已经进入到许多手机厂商的实测环节。 骁龙 8 Gen4 最大变化是采用了高通自研的 Nuvia Phoenix 架构,其中包含两个 Nuvia Phoenix 性能核心和六个 Nuvia Phoenix M 核心。 全新 Nuvia Phoenix 架构,背后的功臣是名叫 Nuvia 的公司。 2021 年,高通收购了芯片架构设计公司 Nuvia,其创始人 Gerard Williams III 曾在苹果工作九年,是苹果最重要的芯片设计师之一。 他主持设计了代号为「闪电」的 A13 处理器和苹果之前所有的 CPU 芯片,并规划了 A14 处理器以及 M1 芯片的设计。 在 Nuvia Phoenix 架构的加持下,骁龙 8 Gen4 主频能达到 4.0GHz,还有消息称甚至可以达到 4.3GHz,相比前代的 3.39GHz 有了显著提升。 这一代全新的双集群八核心 CPU 架构方案,是高通骁龙 5G SoC 史上的一次重大变化。这将大大提高芯片的计算能力,特别是在单核性能方面 。 与 Arm 公版架构相比,Nuvia Phoenix 架构在性能方面有着更高的优势,消息称高通对采用新架构的骁龙 8 Gen4 非常有信心。 凭借台积电的 3nm「N3E」工艺,骁龙 8 Gen4 将带来更高的能效和性能。不仅使芯片能够更高效地运行,还能在降低功耗的同时提供更强的计算能力。 骁龙 8 Gen4 另一个最显著的变化是引入了 Oryon 核心。这些核心基于高通的全新定制设计,采用了从 Arm 获得的指令集架构(ISA),这与苹果 A 系列芯片的设计方法类似。 Oryon 核心的出现标志着高通从过去几年使用的半定制设计转向完全定制设计,旨在提供更高的性能和更灵活的优化。 X 用户 @Revegnus 之前分享了一份骁龙 8 Gen4 的跑分,显示其在 3DMark Wild Life Extreme 的图形得分在 7200 分左右。 搭载 M2 芯片的 Mac Mini 2023 跑分一般在 6800-6925 分。相比之下,骁龙 8 Gen4 的跑分比苹果 M2 还要高出近 10%。 除了上述信息外,Bilibili UP 主 @Nonx_ 还分享了一份高通官方资料。 根据资料显示,骁龙 8 Gen4 将具有低功耗 AI 子系统,配有专用 DSP 和 Al 加速器 (eNPU) ,集成高通 WCD9395 音频编解码器,支持 Wi-Fi 7 和蓝牙 5.4。 骁龙 8 Gen 4 集成了新的 NPU,支持 LPDDR6 内存,专门用于提高 AI 计算的效率和速度,这将促使其在 AI 方面取得新进步。 其还将配备最新的骁龙 X80 5G 调制解调器,支持非地面网络(NTN)通信。不仅提高了数据传输速度和覆盖范围,还显著降低了延迟,有效优化网络体验 。 早些时候,高通高级副总裁兼首席营销官唐・莫珂东(Don McGuire)在出席 MWC 2024 时高调表示,高通将于 2024 年 10 月举办骁龙峰会,届时将发布旗舰产品骁龙 8 Gen 4 平台。 根据 X 用户 @heyitsyogesh 之前的爆料,小米很可能已经与高通签署了独家协议,依旧将首发骁龙 8 Gen4。因此,最先搭载骁龙 8 Gen4 设备可能会是小米 15 和小米 15 Pro 两款机型。 除了小米外,iQOO 13 系列和一加 13 系列也会是首批骁龙 8 Gen4 终端旗舰。 博主 @数码闲聊站 刚刚又爆料称,真我下一代旗舰命会名为 GT7 Pro,将跳过 GT6,同样会首批搭载骁龙 8 Gen4 。 在 2024 年,仿佛各家厂商都急了。面对 A18 Pro 和天玑 9400 的夹击,高通必须要拿猛料来刺激市场。 今年年底手机旗舰第一梯队,肯定会是一场「神仙打架」的局面。那么你今年有换手机的计划吗?
都“白菜价”了,大模型靠啥变现?
■ 大模型为什么会降价? ■ 还会继续降价吗? ■ 降价之外还能做什么? 作者|武占国 编辑|何玥阳 火了一年多的大模型,步入到了我们熟悉的、国内大厂擅长的经典剧情——价格战。 近日,阿里、字节、腾讯等模型厂商相继推出新模型,并宣布降价。 5月6日,国内知名私募巨头幻方量化旗下AI公司,发布DeepSeek-V2大模型,价格为GPT-4 Turbo的近百分之一; 5月9日,阿里发布通义千问2.5,个人用户可从App、官网和小程序免费使用; 5月11日,智谱大模型官宣降价,入门级产品GLM-3 Turbo模型,百万Tokens调用价格从5元降至1元,降幅高达80%; 5月15日,字节发布豆包大模型,比行业平均价格便宜99.3%,推动大模型从“以分计价”,进入“以厘计价”阶段; 5月21日,阿里宣布9款大模型降价,百度宣布文心大模型两大主力模型ERNIE Speed、ERNIE Lite全面免费时代。 5月22日,科大讯飞宣布讯飞星火Lite API永久免费开放,腾讯云公布大模型升级方案,主力模型之一调整为免费。 国内大模型厂商,迎来对B端和C端的全面降价甚至免费。 不仅是国内厂商宣布降价,近日,OpenAI也发布了对C端用户的GPT-4o免费版及B端的降价。 那么,大模型厂商为什么会降价?降价之后靠什么变现?除了降价,大模型厂商还有什么路可以走?本文将回答围绕以上三个问题展开讨论。 01 降价 为数不多可以出的牌 国内外大模型厂商降价的驱动力不完全相同:OpenAI可以出的牌有很多,而卷价格是国内厂商为数不多可以出且必须跟进的牌。 先来看国外的大模型厂商。 OpenAI在降价的同时,也在不断自我超越。 去年11月,OpenAI率先开始降价,升级后的ChatGPT-4 Turbo,速度比ChatGPT速度更快,而且价格比之前下降了近7成,同时OpenAI发布GPT-s商店,开发者可以在其平台上开发并上线AI应用,供用户使用。 今年5月14日,OpenAI发布新一代GPT-4o,功能上全面超越上一代,而且API价格再下降50%。 去年底,谷歌发布的Gemini,在多方面的性能超越ChatGPT,还支持视频输入和视频搜索,同时宣布Gemini Ultra可免费使用。 OpenAI在大模型上具有先发优势,也最早开始通过大模型实现可观的营收,截至去年10月,其收入已达13亿美元,相比上一年2800万美元的收入增长了45倍,所以OpenAI有降价扩大市场份额的资本。 今年3月,美国风险投资机构a16z发布的报告显示,排名前三的都是AI聊天机器人,ChatGPT仍是C端应用顶流,机构预计今年ChatGPT的收入是10亿美元。 排名第二的是谷歌Gemini,对C端则采取的是免费模式,所以C端暂时还未实现变现,不过在B端,5月谷歌宣布调用API开始收费。Gemini虽然未直接对谷歌贡献收入,但是间接贡献了收入,谷歌一季报提到,Gemini为谷歌的搜索业务和云业务提升了收入水平。 再来看国内的大模型厂商。 国内的大模型厂商也在不断进步,也希望通过提供更好的综合使用效果,而不是通过降价保持竞争优势。 但现实是,几天前还在持这一观点的百度,几天后就宣布两大模型免费了。 现在还持这个观点的有李开复,他的零一万物模型目前还没有加入降价战场,但他也认可“行业每年降低10倍推理成本是可以期待的,而且也是必然发生的”。 “提供更好的综合能力和使用效果”这条路不是走不通,而是解决不了当前大模型厂商面临的主要矛盾。 主要矛盾是什么? 是需要更多人应用。 现在国内的大模型,都可能在某些方面领先甚至是拔尖,但没有哪一家是公认的“领头羊”。而大模型的发展很容易出现二八分化,现在不争,以后可能就没机会了。 举个例子,针对C端用户的通用场景有很多,比如打车、订票、购物等等,现在,我们的操作是打开一个个APP或者小程序;在AI发展的过程中,我们需要的可能是一个个生活助理;而在终极形态下,我们需要的是一个管家,可以根据我们的日程、预算,安排好是打车还是其他出行方式,根据近期的口味偏好提前订好餐厅。 这就意味着在C端场景下,必然会有大的整合,应用的整合甚至是大模型厂商之间的整合。 谁的大模型能调用的应用多,谁就更有竞争优势,就更可能是整合方。 所以现在的大模型厂商在降低API调用成本,希望开发者能在自己的生态上开发出好用的AI应用,就算免费、甚至是补贴也要争。 B端应用可能会好一些,毕竟行业之间差异大,容得下更多的模型,这又涉及到另一个问题:数据。 数据是AI三要素之一。大模型通过应用与足够多的用户互动,才有机会走上价格战以外的路。 02 都免费了 还怎么变现? 大模型服务是典型的规模经济,当使用的企业和用户越多,则越能摊薄企业的研发和算力成本,在可预见的未来,算力价格会持续下降,所以这也给了国内大模型厂商降价的底气。 王小川在回应大模型厂商价格战时也表示:降价意味着,大家实在是太看好这个时代的前景了,不愿失去,侧面反映大家对这个时代AI的能力是有足够多憧憬的。 大模型厂商变现有两个途径: 第一,给企业提供模型服务,包括调用API,项目制本地模型落地等。 大模型厂商,目前向B端收取调用收费包括按照时间段、按调用量收费以及各种包含硬件的一站式解决方案等。 OpenAI推出30款左右可供用户调用的大模型,分别包括GPT-3.5 Turbo、GPT-4、GPT-4 Turbo、图像模型、音频模型等,其他厂商通过API实现调用。 实现标准化的模型调用服务,即MaaS(模型即服务),美国从SaaS到MaaS,已形成较大规模的标准化市场。国内的标准化SaaS规模还很小,大多还只是集成式的项目模式,这样的模式成本高,利润小。 国内的云厂商,正在从项目制转向标准化的SaaS服务,而大模型正是一次机会,所以大模型厂商争相降价抢夺市场。 第二,模型厂商自己做应用实现变现,探索更多的可能。 OpenAI不仅给其他应用厂商开放API,而且有自己的聊天机器人ChatGPT,也已成为现象级应用,这是国内厂商目前还不具备的能力。 同时,OpenAI上线了GPTs,从此前的插件模式升级为与开发者共享收益的模式,虽然GPTs反响一般,但提供了变现的思路。 上文提到的榜单,除了前两名的聊天机器人外,后面排第三的Character AI,便是通过调用OpenAI提供的API,利用OpenAI大模型能力开发出了受欢迎的聊天机器人。 CharacterAI,可以扮演数百名虚拟人物,既可以满足用户的情感类需求,也可以满足用户的工具型需求。比如AI可以扮演拿破仑、马斯克、居里夫人等,与用户聊天,也可以扮演心理咨询师、图书管理员、英文老师等角色,提供健身指导、知识传授等服务。 03 价格战之外的路 还有机会走吗? 场景端革新,是中国应用市场后来居上的传统优势,同时也具有反哺大模型能力的作用。 国外应用厂商大多是小而美的应用,而中国则更多的是大而全。 比如微信、支付宝、抖音等平台,除了核心的社交、支付、短视频等功能之外,还有集成了购物、支付、社交、娱乐等功能。国外的应用大多偏工具属性,比如Facebook、亚马逊、谷歌等,分别注重社交、购物和搜索,很少在应用当中集成其他功能。 第一,国内模型厂商,可根据各个大厂的优势,提供不同特色的模型。 前面我们提到,在AI发展的过程中,会出现一个个AI助理,开始的功能比较基础,是一个辅助的角色,被称为Copilot,主要是根据某个情景,提出解决问题的指导、建议,停留在“懂怎么做”的层面,现在AI助理有了更强的执行能力,进化到“会做”“能做”层面,也被称为AI Agent,可以直接解决某些问题,以后可能是一个管家可以调度很多个AI Agent,完成更复杂的任务。 就像真正提供服务的小程序折叠在微信、抖音、支付宝身后一样,Agent也可以折叠在管家后面。 在迈向终局的过程中,支付宝、抖音都可以利用其折叠能力,去调用目前的小程序,让用户通过AI告诉每个小程序执行我们的需求。 比如支付宝在灰度测试中的AI智能助理,如果早上起来对它说,半小时后打车上班,AI小助理就会调用「滴滴」的接口,帮我们预约好车。 同理,美团也可以利用生态,实现预定餐厅、买好电影票、制定路线等。 未来,大厂也可以通过开发各自的生态,更多的应用厂商,研发更多的特色应用,这是国内厂商的潜力。 第二,通过对国外先进模型的模仿和自研,实现能力的快速提升。 OpenAI最新的GPT-4o模型可以实现多模态包括音频、视觉和文本的推理,而且还可以对三者进行组合输出,平均响应时间仅为320毫秒,反应速度与人类相近。 所以,很多头部软硬件开发厂商包括微软、Salesforce、Adobe,会选择与OpenAI合作,将模型能力集成到各自的应用软件当中。 谷歌的Gemini,在搜索能力的强化上表现突出,当你录制一段视频搜索或者使用AI搜索时,它都能准确理解你的意图,通过搜索结果形成一份报告,甚至是对用户忽略问题的猜测。 有的国外大模型是开源的,也是国内大模型厂商可以利用的机会。 通过各个大厂也都在积极自研,国内的大模型厂商,一方面需要通过提升大模型能力,吸引更多的厂商入驻;另一方面,也可以依据自身做AI应用的经验,建立生态,帮助厂商研发出现象级应用。 以“应用工厂”著称的字节,通过应用的人海战术、赛马机制,让更多的应用跑出来,从而不仅让抖音成为中国现象级应用,而且Tiktok也力压硅谷各大厂成为海外现象级应用。字节虽然不是推荐引擎的首创,但是在应用场景和流量模式的创新,让抖音和Tiktok都获得了成功。 国内厂商的总体技术能力可能不及国外厂商,但AI的能力和边界,不完全由技术能力决定。
音频市场进入AI时代,开放式耳机终于迎来爆发期?
尽管有些老生常谈,但无论公正的第三方统计数据,还是极度主观的「通勤观察」,我们都能得出一个共同的结论——开放式耳机这个品类真的火了。根据洛图科技线上监测数据显示,2024 年 Q1,中国蓝牙耳机线上市场销量达到 1757 万副,同比增加 15%,销售额达到 39.1 亿元,同比增加 16%。 虽然 TWS 真无线耳机仍占据市场的主要份额,但从市场份额的角度看,传统真无线蓝牙耳机的吸引力已出现下降,从去年的 60% 以上下降到约 55%,销量增幅仅为 2%。那么这失去的市场份额究竟出现在哪里了呢?没错,被开放式耳机抢走了。 根据洛图科技的数据,开放式耳机的市场份额已经从一年前的 7% 大幅上涨至 14%,销量同比增长高达 148%,和去年年底的数据(2023Q4)相比也有将近 2% 的提升。 图片来源:洛图科技 而其中表现最好的产品当数华为在去年年底发布的 FreeClip,在具体的品牌份额中,华为在 2024Q1 获得了 2.6% 的市场份额提升,其中 22% 的份额来自其开放式无线耳机 FreeClip。 除了华为外,Bose、JBL 这两大音频品牌的市场份额上涨也离不开开放式耳机的贡献,其中 Bose 的有接近 16% 的份额来自开放式耳机。考虑到 Bose 和华为都是在去年年底才推出了自己的第一款开放式耳机,能有这样的销量表现,在我看来已经相当了不起。 图片来源:洛图科技 对比主打产品不是开放式耳机的 Apple 和 Sony,开放式耳机对市场份额的刺激作用则更加明显:在 2024Q1,Apple 和 Sony 都迎来了市场份额的下滑,其中 Apple 下降 1%、Sony 下降 0.6%。 不可否认的,这两个品牌的市占率的下跌也与品牌自身耳机更新周期有关:Apple 和 Sony 瞄准的都是高端耳机市场,但 Apple 上一次更新耳机已经是 2022 年 9 月的事情了。Sony 虽然耳机更新频率较快,但复杂的产品线让 Sony 的产品定位极为复杂,虚高的价格也进一步影响了消费者的购买意愿。 照这么看,尽管传统真无线耳机的地位在那时还无法被撼动,但随着高端真无线耳机市场内卷的进一步加剧,未来只会有越来越多的耳机品牌放弃从真无线耳机中「退圈」,加入到开放式耳机的阵营中。开放式耳机,也最有可能成为真无线耳机未来最大的「竞争对手」。 真无线耳机注定被取代? 但问题是,开放式耳机市场份额的边界在哪里?或者说,开放式耳机的市场份额有可能超越,甚至完全取代真无线耳机吗? 尽管开放式耳机近年来表现出强劲的市场增长势头,但真无线耳机不会被彻底取代,甚至连「50:50」的情况在短期内都可能都不会出现。 多年来,真无线耳机不断在主动降噪(ANC)、环境音模式、通话降噪和音质优化等方面取得进展。特别是高端真无线耳机,凭借先进的降噪技术和优质音质,甚至对更高级的头戴式降噪耳机造成了不小的威胁。 相比之下,开放式耳机由于其开放式设计,在实现高效降噪和提升音质方面面临更大挑战,因此难以在短期内超越真无线耳机的技术优势。 图片来源:雷科技 在佩戴舒适度方面,开放式耳机由于其不入耳的设计,确实在佩戴舒适度上有天然优势,特别是对于不喜欢入耳式耳机的人群。小雷有朋友就因为耳朵容易发炎的问题,至今无法使用入耳式耳机。 然而,开放式耳机也有自己的短板:这类耳机通常依靠耳挂或头戴的方式固定,长时间佩戴可能会对耳朵或头部造成压力。即使是使用分体设计的开放式耳机,因失去了耳道这一固定点,也需要用其他方式固定自己。 这导致开放式耳机通常拥有更大的体积和更高的重量,无法像高端真无线耳机那样「轻若无物」。以小雷之前在开放式耳机横评中体验过的耳机为例,尽管这些产品采用了不同的固定方式,其「存在感」都非常高。 图片来源:雷科技 在价格方面,真无线耳机市场已经形成了从入门级到高端的完整产品线,满足了不同消费者的需求。真无线耳机的广泛可选性和价格区间,使其能够覆盖更大的消费群体。但高端产品的价格较高,且目前市场选择相对有限,难以与真无线耳机的广泛覆盖相抗衡。 AI 能成为开放式耳机的下一个爆点吗? 当然了,就像之前提到的那样,尽管开放式耳机的短板非常明显,但不入耳、适合长期佩戴的特性,其实非常适合当前以自然语言为主的 AI 潮流。 首先,开放式耳机的设计本身就倾向于更自然的使用体验,结合 AI 语音助手,可以进一步提升用户体验。通过 AI 语音助手,用户可以通过简单的语音指令完成各种操作,如播放音乐、调整音量、拨打电话、查询天气等。 这种自然的交互方式不仅解放了双手,还能大大提高操作效率。此外,先进的语音识别技术和自然语言处理能力,使得 AI 语音助手能够更准确地理解用户意图,提供个性化的服务。 事实上,华为在此之前也推出过和 FreeClip 生态位类似的产品——华为智能眼镜。两款产品同样采用了开放式扬声器,也同样以长时间佩戴为产品的终极目标。不同的是,即便是华为智能眼镜 2,在产品细节上依旧和一般的眼镜有差距。而 FreeClip 从一开始就是一个合格的「耳机」和「耳饰」。 图片来源:雷科技 另一方面,智能降噪与音质优化是 AI 技术在开放式耳机中的另一大应用领域。开放式耳机由于其设计特点,在噪音隔离方面存在一定挑战。而 AI 驱动的智能降噪技术可以通过实时监测和分析环境噪音,自动调整降噪参数,有效提升降噪效果。在足够强大的算法支持下,开放式耳机完全有能力用 AI 对音质作出补偿,用软件算法弥补开放式耳机的硬件缺陷。 在 AI 发展的道路上,开放式耳机并不仅仅是追随者,也在逐步成为创新的引领者。AI 的进步将为开放式耳机带来更多可能性,使其在未来的音频市场中占据更加重要的位置。 开放式耳机的新未来在哪里? 2024 年,开放式耳机正高速增长,这样的盛况像极了三五年前的真无线耳机市场。就当前的市场情况来看,如何让消费者愿意去尝试开放式耳机仍是厂商们需要面对的首要问题。 但在我看来,「教育用户」只不过是厂商面前的一个问题。真正的挑战在于开放式耳机在「听音」之外的附加值——在价格同样为四位数的情况下,消费者为何要选择一款音质稍差,降噪功能完全没有的产品呢?在小雷看来,开放式耳机在做好自己的根本(音质、佩戴、漏音控制)外,还需要找到额外的附加值,才能支撑起四位数的售价。 在探寻「附加价值」这件事上,不同的厂商有不同的做法。比如倍思 Eli Sport 1 专精运动领域,华为 FreeClip、荣耀 TiinLab 选择围绕手机生态,将生态当作自己最大的卖点。 对于开放式耳机这种新兴的、消费者认知有限的品类来说,华为、荣耀等品牌的做法非常聪明:借助手机品牌的影响力,来自手机品牌的开放式耳机可以绕开消费者对开放式耳机的固有偏见,用生态优势抢先进入市场。 图片来源:雷科技 当然了,AI 依旧是开放式耳机未来最有前景的发展方向。在 ChatGPT4o 引爆 AGI 技术后,开放式耳机或许可结合 AI 大模型技术在空间音频技术上发力,在场景与佩戴优势的基础上,强化音质等综合实力,打造新一代 AI 开放式耳机,未来依然值得期待。 总的来说,开放式耳机和真无线耳机在未来的音频市场上都有广阔的发展前景。随着技术的进步和用户需求的变化,二者将不断进化和融合,为用户带来更加丰富和多样的听音体验。未来,我们将见证更多令人惊叹的创新和突破,共同迎接音频设备市场的美好前景。
想拥有一家属于自己的 Apple Store?或许可以试试乐高
提到乐高,很多人的第一印象是五彩斑斓的积木、飞天的巨龙,亦或是经典的乐高小人。但你有没有想过,乐高还能将你带进入苹果的世界? 是的,你没听错!一位名叫 Legotruman 的乐高玩家在 LEGO Ideas 平台上创造了一家令人惊叹的乐高版 Apple Store。 这家「Apple Store」并非在模仿某一家特定的苹果零售店,而是结合了许多著名苹果零售店的设计元素。 整个模型外观采用了全玻璃外墙设计,展示了苹果一贯的简洁和现代风格。俯瞰下去,它有着形似土耳其 Apple Bağdat Caddesi 的大型穹顶。 在门店外围,作者还精心设置了一排树木,这为整个门店增加了自然元素,而且往往只有在 Vintage D 和改造后的经典设计 Apple Store 中才能看到。 进入店内,可以看到内部的布置也同样十分考究。 两层楼的的设计不仅使得整个模型变得更为立体和丰富,也与现实中的 Apple Store 布局相符。 一楼是展示各种苹果产品的区域,标志性的木桌上陈列着最新款的 iPhone、Mac 和 Pro Display XDR。 Avenue 长廊上则悬挂着 AirPods Max,旁边还摆放有各种配件。店内所有的苹果员工都穿着蓝色的衣服,而顾客则穿着各式各样的衣服摆弄着产品。 在这里,可以体验到各种苹果产品,仿佛置身于真实的 Apple Store 一般。 通过店面侧边的楼梯到达二楼,就能看到复刻的 Forum 互动坊。这里可以让顾客参加 Today at Apple 课程,也能用作天才吧的等候区域。 而在 Forum 互动坊右侧,可以看到作者还很细心的制作了一片绿植墙,葱葱绿意让店内活力满满。在现实的 Apple Store 中,这些绿植都会使用店内的再生水来进行灌溉,这也体现了苹果的环保价值观。 在门店整体之外,Legotruman 还设计了许多经典的苹果产品。从 iMac G5 到 iPod,再从 AirPods 到 Vision Pro,每一个细节都精心雕琢,仿佛将苹果的产品历史浓缩在了这一个小小的乐高模型中。 尤其值得一提的是,Legotruman 制作模型所用到的零件,全部是乐高的基本款积木。能用普通积木再现出这些产品的外观和细节,足以展现作者的出色的创意和动手能力。 六个月内,如果这款 Apple Store 模型能在 LEGO Ideas 上获得一万名支持者,那么它将有资格接受乐高官方的审核,并有机会成为正式的套装。 当然,前提是苹果会同意这样的想法,但这可能不太容易。 事实上,利用乐高积木来制作苹果相关的模型已经不是新鲜事。自从 Apple Store 诞生后,就不断有果粉尝试复刻苹果的一切。 在 2022 年,有一位名为 603bricks 的玩家在 LEGO Ideas 平台上分享了 Apple 第五大道零售店的模型。 这个作品再现了苹果第五大道标志性的玻璃立方体设计,使用透明乐高砖块展示了几乎无缝的玻璃效果,完美体现了 Apple Store 的美学。 内部的旋转楼梯、定制的苹果员工服装以及精致的产品贴图,都让这个模型看起来栩栩如生,令人叹为观止。 十分可惜的是,这款乐高模型最后没能达到众筹目标,所以我们也无法在市场上看到这款乐高。不过,它依然是果粉和乐高爱好者心中的经典之作。 除了 Apple Store,LEGO Ideas 的创作者们还制作了许多其他苹果产品的模型。 乐高玩家 terauma 用积木复刻了一台 iMac G3 ,他专门制作了一个晶莹剔透的外壳。 透过蓝色的透明外壳,还能隐隐窥见电脑内部的精细构造,完美再现了 iMac G3 经典魅力。 另一边,玩家 Airbricks95 在最近制作了一台 Vision Pro 模型。 这个模型完成度非常高。无论是头带部分的编织细节,还是内部的透镜设计,都显示了这位作者的高超的制作水平。 除了实体积木,在 App 上,乐高也是一名积极的开发者。乐高在 visionOS、iOS 和一些主机平台上开发了「乐高建造之旅」游戏。即使手边没有积木,玩家也可以在虚拟世界中体验搭建乐高积木的乐趣。 在未来,我们或许可以通过 Vision Pro,使用虚拟乐高积木搭建一个虚拟的 Apple Store,然后在里面再购买一台虚拟的 Vision Pro。 这样的套娃式体验,也不失为一件蛮有意思的事情。
2500页文档曝谷歌搜索黑幕:用户数据被挪用、设白名单机制、品牌主宰搜索排名
编译 | 陈骏达 编辑 | 李水青 智东西5月29日消息,近日,据市场和受众研究公司SparkToro在官网博客发布的文章,一位匿名消息人士(后证实为搜索引擎优化行业资深从业者Erfan Azimi)向SparkToro公司的CEO Rand Fishkin提供了来自谷歌搜索API的大量泄露文档,这些文档揭示了谷歌搜索引擎内部排名算法的详细信息。 本次泄露文档中的部分内容与谷歌公开表态的信息以及2023年的美国司法部起诉谷歌的反垄断案件中的证词相矛盾。比如,谷歌曾一再否认使用点击导向的排名机制,否认子域名在排名中被单独考虑,否认收集或考虑域名的年限等等。但泄露文档证实,这些因素都是谷歌搜索引擎排名机制中的一环。 此次泄露的谷歌搜索API文档共计2500余页,共包含14014个属性特征。这些文档据称是谷歌内部“Content API Warehouse”的一部分,并在代码托管平台GitHub上不慎公开了一段时间。 博客作者Rand Fishkin在多位前谷歌员工的沟通中确认,泄露的文档具备谷歌内部API文档的特征。Rand Fishkin与和技术SEO(搜索引擎优化)专家Mike King进行交流,并再次验证了这些文档的真实性。 这些文档的泄露可能对搜索营销领域产生深远的影响,因为它们提供了对谷歌搜索引擎内部工作机制的前所未有的洞察,包括它如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量来影响搜索结果排名。 一、泄露文档3月底便已公开,谷歌前员工确认文档真实性 5月24日,Rand Fishkin与爆料者Erfan Azimi进行了视频通话。Erfran Azimi一开始决定以匿名的形式爆料此事,但在5月28日他决定公开自己的身份。Erfan Azimi在通话中具体展示了本次泄露的谷歌搜索API文档。根据文档的提交历史记录,这些文档于2024年3月27日上传到代码托管平台GitHub,直到2024年5月7日才被删除。 这些文档是谷歌“Content API Warehouse”的一部分,可以被视为谷歌搜索引擎团队成员的指南,就像图书馆中的书籍清单或卡片目录,告诉需要了解的员工有哪些资源可用以及如何获取这些资源。 但是与公共图书馆不同,谷歌搜索是世界上最为秘密、守卫最严密的黑箱之一。在过去的20多年里,谷歌搜索部门里从未发生过规模如此之大、内容如此之详细的泄露事件。 需要注意的是,文档并不包含搜索排名算法中特定元素的权重等内容,也不能证明排名系统中使用了哪些元素。但是,它确实显示了很多关于谷歌收集的数据的详细信息。以下是文档格式的示例: 在向Rand Fishkin介绍了其中的一些API模块后,Erfan Azimi解释了他的动机。他希望能提升谷歌搜索排名机制的透明度,让谷歌对自己的行为承担责任。Erfan Azimi也希望Rand Fishkin能发表一篇文章分享这次泄露,揭示其中包含的许多有趣的数据,并驳斥一些谷歌员工多年来一直在传播的“谎言”。 为了验证泄露文档的真实性,Rand Fishkin联系了一些前谷歌员工,向他们分享了泄露的文档,并询问了他们的想法。最终,有两位谷歌前员工对文档的真实性发表了看法: “当我在谷歌工作时,我无法访问这些代码。但文档看起来肯定是符合谷歌内部规范的。” “它具有Google内部API的所有特征。” “这是一个基于Java的API。可以看出,写这些文档的人花了很多时间遵守谷歌内部关于文档和命名的标准。” “我需要更多时间才能确定,但这与我熟悉的内部文档相符。” “从我简要的审查来看,没有发现任何不符合谷歌内部规范的迹象。” 二、谷歌搜索引擎黑幕曝光,官方表态与泄露文档自相矛盾 为进一步解读本次泄露的文档,Rand Fishkin联系了知名技术SEO专家,数字营销机构iPullRank的创始人Mike King。Mike King在iPullRank的官网博客上详细分析了泄露文件的内容,而Rand Fishkin综合爆料者透露的信息和Mike King的分析,总结出了以下5个早期发现: 1、谷歌在排名算法中使用用户交互数据 2017年,谷歌搜索关系团队(Search Relations team)的负责人John Mueller在一次采访中说道,谷歌没有直接在搜索排名算法中使用点击量数据和用户行为数据。然而2023年9月,曾在谷歌搜索质量和排名部门工作了17年的谷歌前员工Eric Lehman却在谷歌的反垄断调查听证会上作证说:“几乎所有人都知道我们(谷歌)正在搜索排名中使用点击量数据”。 本次泄露的文档进一步坐实了这一点。文档内容显示,谷歌已经将点击量数据在文档中进行了命名和描述,这说明这些数据已经成为了搜索排名算法中的衡量标准之一。 2、谷歌创建Chrome正是为了大量收集数据,优化搜索排名 John Mueller在2022年的一场活动中被问到,谷歌是否会使用Chrome收集用户数据并对搜索结果进行排名。John Mueller的回应是据他所知,谷歌不会这么做。 然而,Erfan Azimi声称,早在2005年,谷歌就希望获得数十亿互联网用户的全部点击流(clickstreams,即用户访问网站时留下的轨迹数据)。而有了Chrome,他们现在已经得到了这些数据。泄露的API文档显示,谷歌会计算几种类型的指标,这些指标可以使用与单个页面和整个域相关的Chrome视图来调用。 Rand Fishkin指出,谷歌可能会使用Chrome浏览器中页面的点击次数,并使用它来确定网站上最受欢迎或者最重要的URL,这些URL将用于计算要包含在附加链接功能中的URL。 例如,在上方的谷歌搜索截图中,谷歌会通过跟踪数十亿Chrome用户点击流,来对网站内部的页面进行排序。 Mike King在他的分析文章中也指出,泄露文件中一个与页面质量评分相关的模块包含一个基于Chrome浏览量的站点级衡量标准。另一个似乎与生成站点链接相关的模块也具有一个与Chrome相关的属性。 一份泄露的谷歌内部演示文稿也显示,早在2016年5月Chrome数据就有计划被引入谷歌搜索。 3、谷歌在某些领域执行白名单机制,值得信任的域名将获得更高排名 在本次泄露的文档中,有一个叫做优质旅游网站的模块。这一模块说明谷歌在旅游领域存在一个白名单,但目前的信息还不能证明这一白名单机制是专门针对旅游相关的搜索,还是更为广泛的网络搜索。本次泄露的文档内还有一些标签,比如“isCovidLocalAuthority”和“isElectionAuthority”。这些标签进一步说明谷歌正在将特定域名列入白名单。这可能是为了在执行一些极具争议性的查询时,提供更为准确的信息。 4、谷歌雇佣的质量评估员正直接影响搜索结果排序 谷歌长期以来一直有一个名为EWOK的质量评级平台。本次泄露的文档表明,谷歌在搜索系统中使用了质量评估器中的一些元素。EWOK的质量评估者生成的分数和数据可能直接参与谷歌的搜索系统,而不仅仅是实验的训练集。这些数据在注释和模块细节中被特别提到了。 上方图片中的内容提到了“人类评级(例如来自EWOK的评级)”,并指出它们“通常只填充在评估管道中”,这表明它们可能主要是该模块中的训练数据。 泄露的文档中也显示,谷歌调用了“每个文档的相关性评级”,该评级来自通过EWOK进行的评估。Rand Fishkin认为,虽然文档中没有详细的标注,但可以想见这些人类评级到底有多重要。 5、谷歌使用点击数据确定链接权重 Erfan Azimi指出,谷歌按照三个层级(低、中、高质量)来分类他们的链接索引。点击量数据被用于确定文档所属的链接图索引层。如果一个链接获得的点击量很小,它将进入低质量索引,这意味着链接将被忽略。但如果一个链接拥有来自可验证设备的大量点击量,它就会被归入高质量索引,这一链接也会表现出高排名信号。来而自低质量链接索引的链接不会影响网站的排名。这些链接仅仅是会被忽略。 三、泄露文件颠覆传统搜索引擎优化模式,中小企业做SEO性价比很低 谷歌本次泄露的文档展现了谷歌搜索排名算法中不为人知的一面,这对搜索引擎优化界的从业者有很好的借鉴意义。 Rand Fishkin指出,本次泄露的文档表明,在谷歌的搜索排名算法中,品牌比什么都重要。谷歌有多种方法可以识别实体、对实体进行排序、排名和过滤。 这些实体包括品牌,例如品牌名称、品牌官方网站和社交媒体账号。谷歌目前正在将大量的流量传送给主导网络的大品牌,而非规模较小的独立网站和企业。 对于大多数中小型企业和较新的创作者与出版商来说,在建立信誉、导航需求和在相当大的受众中建立良好的声誉之前,SEO的回报可能会很差。 此外,经验、专业知识、权威性和可信度(E-E-A-T)在谷歌的排名系统中并不那么重要。 目前,泄露的文档中唯一提到专业知识的领域是谷歌地图评论贡献度中的一条注释。其它涉及E-E-A-T的标记都是隐藏的、间接的,很难发现。这些因素或许并非谷歌搜索排名系统中的特定元素。 泄露的文档也显示,谷歌搜索中经典的排名因素,比如PageRank(谷歌早期衡量网页的重要性和排名的算法)、锚文本链接和文本匹配的重要性多年来一直在减弱,但是页面标题仍然非常重要。 PageRank虽然在搜索索引和排名中占有一席之地,但几乎可以肯定的是,它是从1998年的原始论文演变而来的。泄露的文档里包含了多年来创建和丢弃的多个版本的PageRank。锚文本链接虽然存在于泄露文件中,但似乎并没有特别重要。 此外,用户的交互(比如点击)在搜索排名中扮演主导性的作用。当存在清晰的用户交互模式时,内容和链接都是排名系统中的次要因素。 结语:泄露文件揭秘谷歌排名运作机制,透明度仍是谷歌的软肋 尽管谷歌多次强调其算法的公平性和中立性,但这次泄露的文件再次引发了人们对谷歌透明度的质疑。 Rand Fishkin指出,谷歌是这个星球上信息和商业传播中最强大、最有影响力的力量之一。 作为搜索引擎巨头,谷歌的排名机制直接影响着互联网上的信息流动,关乎着言论自由和公平竞争。然而,谷歌内部不透明的运作方式,无疑加剧了人们对其中立性的怀疑。 谷歌目前尚未对这一泄露事件作出任何回应,但这一事件已经在SEO从业者群体中掀起了轩然大波。目前这些泄露文档已经被公布在文件托管网站HexDocs上,或许之后会有更多细节浮出水面。
有道AI学习助手App推出!口语教练Hi Echo推儿童模式,“企业AI大脑”化身私人AI升学规划师
作者 | 香草 编辑 | 李水青 智东西5月29日报道,今天,网易有道发布了基于“子曰”教育大模型的一系列产品和应用更新,包括新一代知识库问答引擎QAnything、虚拟人口语教练Hi Echo 3.0,以及全新AI学习助手小P的手机端App。 有道于去年7月推出子曰教育大模型,目前已落地到LLM翻译、AI作文指导、有道速度、AIBox等十余场景,在方向上主要包括AI+教育、AI+效率工具、AI+在线营销、AI+娱乐。 ▲子曰大模型落地场景 此次升级,QAnything推出Agent能力、AI写手功能;Hi Echo 3.0推出新的虚拟人Hannah,上线雅思考试服务,并将于6月上线儿童模式;小P将推出手机端App,化身AI全科学习助手。 智东西等少数媒体在交流会上与网易有道CEO周枫、网易有道首席科学家段亦涛、网易有道高级副总裁吴迎晖、网易有道智能应用事业部负责人张艺进行了深入交谈。 谈及大模型价格战,周枫认为这在互联网界是很常见的现象,不是第一次也不会是最后一次。在大模型成本方面,他谈道现在成本下降速度很快,一年至少下降一半,如果按这个趋势持续发展,可能会比摩尔定律更快。 当智东西问道,现在很多AI助手都能结合语音交互和Agent能力,免费提供口语教练的功能,Hi Echo作为收费不低的付费订阅产品,差异化优势是什么? 张艺称,在口语教练赛道,有道主要的定位在于用AI把产品能力做到最好,例如提供雅思考试模拟、创新背单词等差异化能力,与通用的AI助手出发点不太一样。在定价方面,未来可能会有浮动,但目前有道在C端不会打价格战。 一、“企业AI大脑”三大能力升级,化身私人AI升学规划师 网易有道首席科学家段亦涛介绍道,基于子曰教育大模型的知识库问答引擎QAnything于今年1月开源后,在开源社区GitHub上星标超过1万,目前服务的企业客户超100家,总体用户数量超20000。 QAnything具备跨语种能力,目前支持中英日韩等多种语言问答随意切换;在检索质量上,基于有道自研的两阶段检索框架提供高质量检索;同时支持一键安装、离线使用,方便易用。 ▲QAnything主要特点 本次QAnything主要升级了三大能力,分别是领域适配能力、Agent能力以及AI写手功能。 在领域适配方面,QAnything可利用客户提供的公开+私有领域数据,高效快速地定制数字员工、智能客服、研报解读、智能写作等模块。 ▲QAnything提供场景适配能力 在Agent能力方面,用户可基于QAnything创建和定制个性化智能Bot。 例如,有道领世利用QAnything框架打造了“私人AI升学规划师”,借助升学资料、业务专家积累的经验等数据,提供志愿填报、选科咨询等场景的服务。在交互过程中,AI规划师会根据用户给出的意向为其规划志愿,最后生成意向志愿表。 ▲有道领世私人AI升学规划师 QAnything还推出AI写手功能,能够基于给定知识库范围及标题信息,快速完成写作并支持调整输出。 AI写手的工作流程主要分为定义模板、概览大纲、生成文章三个步骤,依托给定的资料和题目,自动拆解题目、生成大纲,进而生成完整的文章。 ▲AI写手 例如,用户可上传多份新能源汽车相关资料,让AI写手写一份行业发展报告。页面左侧会先给出多个大纲思路以供选择,用户也可以在生成的大纲基础上进一步修改,随后生成相应结构的文章。 ▲AI写手 在落地层面,段亦涛分享了有道与新闻平台参考消息合作的案例。基于QAnything框架,有道为其打造了一套覆盖资料分类、摘要提取、文章润色以及改写等采编流程的智能化升级私有解决方案,在实际应用中,实现智能分类准确度95.9%,工作效率提升60%。 QAnything地址:https://qanything.ai 二、Hi Echo推出雅思考试服务,儿童模式6月上线 Hi Echo是有道于去年10月推出的虚拟人口语教练,据网易有道智能应用事业部负责人张艺透露,其用户规模目前已突破100万,本次3.0升级主要分为内容、功能、教学、虚拟人四个方面。 ▲Hi Echo升级至3.0版本 内容方面,Hi Echo正式上线雅思考试服务,提供高分范文及个性化内容,口语题库也将实时更新,同时内置雅思官方打分系统,100%模拟雅思考试流程。 ▲Hi Echo提供雅思考试服务 功能方面,Hi Echo将升级背单词功能,以更加本地化的方式帮助用户记住单词。 例如,当用户需要背诵餐饮相关的词汇,系统会设置一个餐厅点餐的场景,将目标单词放在对话当中,用户可以与Echo进行角色扮演,在多轮和对话中产生更立体的联想记忆。 ▲Hi Echo角色扮演背单词功能 教学方面,中英混合教学模式升级,提供工作面试、签证面谈、餐厅点餐、自我介绍、商场购物、出国旅游、认识新朋友等7个高频使用场景,以及自由教学模式。 ▲Hi Echo中英文混合教学模式升级 虚拟人方面,Hi Echo推出新一代虚拟人形象Hannah,基于虚拟人技术的升级,Hannah在面部细节的真实度、口型准确度以及流畅度、真实度等方面都得到提升。 自动播放 ▲Hi Echo新虚拟人Hannah演示视频 Hannah现在已经上线Hi Echo应用端,不过相比以往的虚拟人可以免费试用,她需要VIP订阅才能使用。 ▲新人物Hannah与其他虚拟人对比 此外,Hi Echo还将面向启蒙阶段小朋友推出儿童模式,提供两个最新的口语搭字Alice和Seven,为小朋友量身定制对话教学,提供过程性建议,并实时互动提供激励。 ▲Hi Echo儿童模式 在口语伴读中,Hi Echo设置了“问问Echo”按钮,小朋友可以点击获得对应内容的解释和参考建议。 自动播放 ▲Hi Echo儿童模式演示视频 此外,该模式还提供故事接龙、猜一猜等趣味化场景,以寓教于乐的方式培养儿童的学习兴趣。 张艺透露,儿童模式将在6月正式上线,Hi Echo未来也计划进入电视、音箱、手表、学习机等更多智能终端设备。 三、AI学习助手App上线,全科助教、心理树洞、故事接龙 网易有道高级副总裁吴迎晖首先分享了在AI加持下,有道词典取得的成效。在V10版本上线两个月后,AI功能收入上涨150%以上,AI使用人数增加30%。 有道于今年1月在学习机上推出AI家庭教师小P,今天,吴迎晖宣布小P将推出手机端App,定位于AI全科学习助手,提供全科答疑、AI翻译、AI查词等功能。 ▲有道小P 据介绍,小P在知识极易、多模态理解、知识库扩容、逻辑推理等方面进行了定量优化,能够准确定位考核的知识点、用适合孩子当前学段和水平的方法来讲解,再进一步引导孩子主动提问,反复练习。 例如当用户输入一道数学题,小P首先用代数方法解答。随后用户说“孩子三年级,还没有学代数,如何解这道题”,小P便根据三年级的学段水平,给出了另一种解题思路。 ▲小P解答数学题 在语文、英语等文科学科中,小P也能对文言文对答如流,基于多模态能力看图解题。 ▲小P解答语文、英语题目 除了充当学科老师,小P还能化身树洞,帮同学解答心理或生活上的疑问;或是“脑洞大开”,陪孩子玩故事接龙。 ▲智东西记者现场体验小P老师多种功能 吴迎晖谈道,App并不是终点,有道未来会持续推出更多创新硬件新品。 结语:“应用为王”,有道坚持C端订阅模式路径 在会上,周枫分享了有道2024年第一季度的营收表现,其中C端AI会员收入5000万,同比增长140%;B端在线营销净收入4.9亿,同比增长125.9%,实现连续六季度增长。 在大模型落地应用层面,周枫谈道,国内目前还未出现用户量亿级的Super App(超级应用),在他看来这是很正常的发展过程,有道对超级应用未来的发展前景仍保持乐观。在商业化层面,他认为订阅服务仍是C端最好的商业模式。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。