EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
赵明谈MagicOS与苹果iOS及华为鸿蒙区别
IT之家 12 月 24 日消息,荣耀终端有限公司 CEO 赵明出席“全球产业发展论坛(GIF)2023”并发表演讲。对于 MagicOS 与苹果 iOS、华为鸿蒙的区别,他表示:荣耀的理念跟其他的厂家和品牌有所不同,荣耀要打造的是“AI 使能的个人化操作系统”,他认为这才是手机操作系统发展的核心。 我们今天的理念跟其他的厂家和品牌有所不同,大家经常会说操作系统有苹果的 iOS、华为的鸿蒙、还有安卓,但荣耀认为,未来 AI 的发展和成长应该是操作系统个人化,它应该更懂你,你越用越好用,越用越懂你,这才是手机操作系统发展的核心。 以此为方向和理念,荣耀打造了 MagicOS,我们把它叫作魔法 OS,它的逻辑是用 AI 使能操作系统的各个部件。在这个时候,其实安卓也好、鸿蒙也好,对于荣耀来讲它解决的是生态跟互联网应用的结合,但对于手机如何更好地服务于个人,这是荣耀的魔法 OS 所努力和工作的方向。 对于 AI,赵明表示,目前网络大模型有它的局限性,荣耀不可能允许网络的 AI 的能力去接触到用户个人手机的存储、照片、文档等信息,所以荣耀要坚持走的道路是未来一定是端侧的 AI、端侧的大模型与云端的大模型协同发展。 他指出,没有严格的数据保护以及隐私安全,AI 将变得毫无价值,所以 AI 一定保护个人隐私数据,更好地保护个人隐私情况下进行发展,所以荣耀要打造个性化的、更加安全可靠的 AI 的应用。 他还透露,荣耀 Magic 6 系列手机将支持 70 亿参数的端侧的 AI 大模型。IT之家从赵明之前晒出的一张演讲 PPT 中发现,荣耀端侧 AI 大模型已经可以做到 2-10B+,而云端大模型可以做到 10-100B+。 值得一提的是,荣耀 Magic 6 Pro 手机已经通过 3C 认证入网,认证名称是“卫星移动终端(5G)”,而且支持 100W 快充。 在上个月的 2023 数字生态大会卫星移动通信产业发展论坛上,荣耀终端有限公司旗舰手机总经理李坤透露了自研卫星通信技术进展。 李坤表示,荣耀自研卫星通信技术攻克了天线体积、通话续航、通信体验三大技术难题,有望提供给消费者体积最小、信号最稳、且最省电的手机卫星通信体验。 据博主 @数码闲聊站 爆料,这一卫星通信技术将在荣耀 Magic6 系列手机搭载,计划在春节前发售,拥有自研低功耗通话和散热技术。此外,OPPO Find X7 系列也将搭载卫星通信技术,发布时间接近。 相关阅读: 《消息称荣耀 Magic6 系列手机搭载卫星通信技术,MagicOS 运行端侧 AI 大模型》 《荣耀手机官方剧透:与保时捷设计合作首款产品“飞驰而来”》 广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
柔宇科技欠薪长达一年,数十名员工现场罢工讨薪
拍摄:界面新闻记者 界面新闻记者 | 徐诗琪 陆柯言 界面新闻编辑 | 宋佳楠 柔宇科技再陷欠薪危机。 12月25日,界面新闻记者在位于深圳龙岗区的柔宇国际显示基地看到,约四五十名柔宇科技(以下简称“柔宇”)员工聚集在该基地门口罢工维权,要求公司发放工资。 多名参与罢工的柔宇员工告诉界面新闻,2022年11月至今,柔宇拖欠员工薪酬已长达一年时间。此外,生产线普工、园区保安等也有超过8个月没有拿到工资。 界面新闻在现场看到,部分维权员工签署了一份名为《关于申请解决深圳市柔宇科技股份有限公司拖欠员工工资的诉求》(以下简称《诉求》)的文件。文件显示,截至2023年12月21日,柔宇已拖欠2022年11月至2023年11月的工资,共计12期(其中职员欠薪12个月,普工欠薪约8个月)。这两年间离职的近千名员工也未发放拖欠的薪资,累计欠薪金额约为4千多万元。 拍摄:界面新闻记者 《诉求》中还写道:“很多员工家里年迈的父母、年幼的子女都生病住院了,看着病床上的家人,很多员工逼不得已过上了借贷还贷的日子,身体和心理都承受着巨大的压力,不知何时最后一根弦就将绷断!我们都面临着没有钱生活、没钱回家、没钱过年的实质性困难。” 据柔宇一名工会代表透露,目前公司仅剩约200-300名在职员工,大部分为维护产线设备的工程师,业务上也仅有基础的屏幕组装业务,“收入仅够用来交社保”。 全柔性屏幕制造商柔宇科技曾是资本的宠儿,其宣称创新开发的超低温非硅制程集成技术是打破三星垄断的“国产之光”。从2012年成立到2020年,柔宇8年一共完成了13轮融资,总计98.5亿元,资方包括深创投、IDG资本、松禾资本等。 但多轮融资后,柔宇的业务始终没有形成有效的商业循环,反而不断被曝出陷入资金困局。2021年底,柔宇被曝已拖欠员工将近6个月的薪资及供应商货款。今年4月初,柔宇又被曝出仍未发放工资,甚至有部分员工“放假”,仅有一小部分产线仍在运作。 现场一名负责供应链业务的员工向界面新闻表示,欠薪期间,柔宇科技董事长兼CEO刘自鸿曾多次对员工表示,公司正在努力融资,并承诺在公司留任的员工会获得“留任奖”。不过,目前基本薪酬也未得到发放。 柔宇方面也曾多次试图争取外部援助。 时任柔宇非独立董事刘姝威曾在2022年4月发文称,2021年第四季度,深圳市政府聘请多家专业机构对柔宇科技的全柔性屏投片生产线进行现场考核,考核投片良率达81.6%。她当时表示:“建议各级政府积极帮助柔宇科技解决资金短缺,引进战略投资者,以便开拓我国柔性技术的应用市场。” 公开资料显示,柔宇旗下的类6代柔性显示屏生产线项目还曾被列入深圳市发改委公布的《深圳市2022年重大项目计划》。但据员工所述,该产线始终未有启动。 有知情人士对界面新闻称,政府方面成立了解决柔宇问题的专项工作小组,以推动柔宇债务重组事宜,但迟迟未有进展,其中一个原因是柔宇科技董事长兼CEO刘自鸿不愿放权。 界面新闻就上述一系列消息向刘自鸿方面寻求回应,截至发稿并未获得回复。 另据上述工会代表透露,今年11月,刘自鸿曾邀请柔宇科技A轮融资股东Jack and Fisher Investment Company Limited高管到公司商谈债务重组事宜。但截至目前,员工并未等到有效的方案出台。天眼查APP显示,该机构持有柔宇科技3.79%的股份。 迟迟未等到援助的柔宇已经在资金泥沼中越陷越深。中国执行信息公开网显示,11月29日,深圳市柔宇科技股份有限公司新增一则被执行人信息,执行标的3893万余元,涉及服务合同纠纷案件,执行法院为北京市朝阳区人民法院。 截至目前,柔宇存在18条被执行人信息,被执行总金额超29亿元,此外,该公司还存在多条限制消费令和终本案件信息。 天眼查APP也显示,今年8月,深圳柔宇显示技术有限公司被冻结股权数额31.1亿元,深圳柔宇电子技术有限公司被冻结股权数额5000万元,这两家公司均为柔宇科技的全资子公司。截至目前,柔宇科技已有10项股权遭冻结。
奥特曼年终17条总结爆火!OpenAI总裁:违反直觉但真实
疯狂的2023年即将进入最后一周,大佬们的年终总结也来了。 OpenAI CEO奥特曼,就给2023打上了一个新标签——“世界开始认真对待人工智能的一年”。 并将他的思考总结为17条经验,起了个标题叫《我希望有人早点告诉我这些》。 希望这对正在思考2024年该做什么的人们有帮助。 博客发出,网友们纷纷表示“学习了”,还有不少人第一时间分享了“课后笔记”。 be like: △ 来源:微博@歸藏的AI工具箱 OpenAI自家人也前往转发。OpenAI产品负责人Joanne Jang就分享说: 这就是我留在OpenAI的原因:我们的最高管理层对废话零容忍。 当然,也有兴奋的吃瓜群众又找到了新的瓜点…… 似乎读到了一点“真还传”的怨气…… 话不多说,一起来看奥特曼写下了哪些所思所想。 年终总结完整版在此 1. 乐观、执着、自信、原始驱动力和人际关系是一切的开始。 2. 有凝聚力的团队、冷静与紧迫感的恰当结合,以及对目标的超预期承诺,是完成任务的关键。长期规划往往被忽视;不必担心他人在短期内的看法,随着时间的推移,会逐渐好起来。 3. 对于团队来说,完成一件真正重要的难事比做一件无关紧要的易事更容易;大胆的想法能够激发斗志。 这一点也被OpenAI总裁Greg Brockman着重标出:“极其违反直觉但又极其真实。” 4. 激励机制是超能力;要谨慎设定。 5. 将资源集中在少数你深信不疑的事上;这话说起来容易,但做起来难。你能排除掉的东西比你想象的要多。 6. 言简意赅地交流沟通。 7. 每当遇到废话和官僚主义,都要坚决反对,并鼓励他人也这样做。不要让组织架构妨碍人们高效协同工作。 8. 结果才是最重要的;不要让好的过程成为坏结果的借口。 9. 花更多时间招聘。敢于选择那些进步飞速的高潜力人才。除智力外,还要寻找他们完成任务的证据。 10. 超级明星比你想象的更有价值,但必须根据他们对组织的真正影响来评估他们。 11. 快速迭代可以解决很多问题;一般情况下,如果你能迅速做出调整,犯错是可以接受的。计划应该以十年为单位来制定,执行则应该以周来衡量。 12. 不要挑战商业世界的基本法则。 13. 灵感易逝,生命短暂。不行动是一种特别隐蔽的风险。 14. 规模经常会带来出人意料的新特性。 OpenAI研究员Jason Wei给这一条备注的是: 阿门,无论是语言模型,还是人类。 15. 复利指数很神奇。特别是,你真的想建立一个通过规模获得复利优势的企业。 16. 跌倒了就爬起来,继续前进。 17. 与优秀的人共事是人生最美好的体验之一。 One More Thing 除了回顾2023,奥特曼随即还发布了一条推文展望2024: 想听听网友们希望OpenAI在2024构建或者是修复什么。 令他没想到的是,对AGI的呼声远比他预期的还要高: 不过嘛…… 抱歉让大家失望了,但我认为2024年我们也无法实现这一目标。
走过大模型奇点,谁在推开AI原生应用时代的大门?
最近几周,笔者参加了几场AI产业论坛,议题五花八门,嘉宾热情似火,很多行业人士研判,AI就是下一次工业革命。 以史鉴今,史学家们不会将实验室里白纸黑字的论文,作为时代的里程碑;取而代之的,永远是重塑生产关系的现象级产品——只有诞生了普世意义的“杀手级应用”,才能有理有据地回应所有人的关切与疑问。 正如百度创始人、董事长兼首席执行官李彦宏一再强调的那样:大模型时代的来临,真正的价值在于原生应用。在基础模型之上,要有千千万万甚至数以百万计的AI原生应用,大模型的价值才能被体现出来。 走过大模型的奇点,我们正站在AI原生应用时代的门前。当多数人还徘徊在固有路径依赖中时,被新周期选中的中国AI的领军者们,正以头雁之势,带动产业变局的发生。 其中,一个重要的里程碑节点,已在悄然之间出现:百度文库,一款试图以大模型原力重构办公生产关系的AI原生应用,即将徐徐呈现于所有人的视野中。 刚刚结束的2023网易未来大会,透过百度副总裁、互娱和垂类平台负责人王颖的演讲,并结合实际体验之后,我们可以笃定,百度文库将是事实意义上中国大模型AI原生应用发展历程中的一个里程碑——从用户价值到产业价值,再到社会价值,它几乎具备所有普世意义上变革型应用的特征。 新世界来了。 01 用户价值:把所有人都变强大 什么样的技术创新,可以称之为杀手级创新,亦或者技术发展的里程碑? 回顾每个技术应用创新奇点,答案均指向,其能够指数级够增强人类的自然短板:蒸汽机补强了人类的体力;电灯扩展了人类的活动空间;纸张、互联网弥合了人类记忆力与语言的差异。 这让我想起了托马斯卡莱尔的名言:“火药正真的用途,是把所有人都变强大”。 今年以来,大模型为什么能引发如此强烈的情绪价值,肯定不仅仅是“Chat”这一个功能环节;本质上,是因为人们已隐约看到了又一个技术进步奇点,所将带来的又一轮人类群体能力的指数级掇升:想要成为画家,不必学会所有色彩应用;想要成为程序员,不必掌握繁重的代码公式。 如果说大模型提供了愿景可能,那么基于大模型平台涌现的AI原生应用,即将愿景带入现实。以几乎涉及到每个人日常工作、生活场景需要的内容行业为例,百度文库之后,新世界来了。 接下来,进入实操环节: 主打“一站式AI内容创作平台”的百度文库,可以高效地协助创作者个体能力全方位、大幅度升级。笔者亲测,它的实际能力,远超人们对AI产品的刻板印象(以下均为实机演示): 在即将全面开放的“智能思维导图”功能中,当创作内容没有思路,他能帮我构建思维导图,理清思路。 图:百度文库构建智能思维导图演示 没有论点时,它可以帮我依据海量优质内容及数据提出观点、辅助阅读,整理素材(甚至可以跨语言阅读高专业性的文章) 图:百度文库跨语种智能总结演示 当我有思路但不擅长行文时,它能够快速帮我生成文本,实现所想即所得。 图:百度文库智能文本生成演示 当我不擅长编辑、汇总时,它甚至能够帮我实现多篇文档参考生成、文生图表,乃至一键形成PPT、甚至自动生成相匹配的演讲稿等等。 图:百度文库即将全面开放的“多篇文档参考生成”演示 图:百度文库文生图表演示 图:百度文库一键生成PPT演示 百度文库的一站式AI内容创作,无论是排版、阅读,甚至于生成PPT、思维导图都可以在30秒内快速实现。这些功能,几乎涵盖了我们对于内容创作的主流需求,弥补了普通人在此之前难以兼具的生产力短板。 如火药一样,百度文库让所有人在内容创作领域一样强大。这是成为杀手级应用的先决条件:它不是一个玩具,而是实打实的生产力工具。 02 产业价值:内容创作的造梦师 新古典经济学并不将企业看作一个组织,而是一个可行的生产计划集。而现代的产业发展理论,偏向于将生产计划集的概念奠定为产业,是结网、互动、相互利益勾稽的组织形式。而几乎所有真正意义上奠定时代变革的里程碑产品,都具有带动产业价值的能力。 比如蒸汽机,不仅带动了物理学和工程学渐进式的发展,也带动了物流体系,运输体系和能源体系的发展。再比如计算机,不仅带动了半导体、信息技术发展,还带动了传媒、娱乐等产业价值的提升。 我们之所以认为百度文库是中文大模型的一个里程碑产品,是因为它对内容生产、文档以及大模型行业,都具有跨越技术周期的现实产业价值。 首先,直观而言:百度文库作为一个新时代的生产力工具,对于内容生产全链路具有重塑和叠进的产业价值,解决了内容生产行业起笔难、编辑难、平台多、整理难四大难题。 不仅仅是在PC端,百度文库移动端同样可以完成各项AI创作任务,并能够与PC端协同,无缝切换。全场景的使用模式,仅需几秒就可以自动获得标题突出、要点明确、格式清晰、可直接使用的内容,将生产要素从繁重的文案工作中解放出来。 图:百度文库APP 智能文本生成演示 图:百度文库APP 智能PPT生成演示 图:百度文库APP文本排版功能演示 图:百度文库APP文本扩写功能演示 未来内容产业链可以释放更多劳动力参与前端策划,选题设置,内容交互等更具附加价值的生成环节中去。 其次,就中枢而言:它重塑了文档行业数据要素的价值,百度文库本身就拥有12亿高价值文档。文档行业曾经的数据要素是孤立的,它依赖用户搜索整理整合的能力,它的价值是线性。但是基于大模型重构后,文档行业的数据要素会相互交互,语料价值会指数级放大。 数据要素未来一定会展现更多的价值,百度文库的技术思路,产品功能会成为行业新方向。 最后,就内核而言:大模型就好比大脑,AI Native下诞生的产品就是长出的双手,就像百度文库之于文心一言一般。 人的大脑本身不具备生产属性,所有文化传承,艺术表达,劳动价值的诞生都需要五官、四肢来具象实现,空谈“缸中之脑”是没有意义的。尤其在目前芯片管制和电力成本双重压力下,卷大模型在短时期内很难有回报,是生产要素过度浪费,而AI原生应用带来的劳动力升级价值才是未经雕琢的璞玉。 如果说之前市场不认可个中逻辑,现在百度文库的成功印证了这一观点:C端用户普遍热衷AI应用带来的实际生产力,重构后的百度文库付费率提升明显,AI功能用户数和内容生产量实现了指数级的提升。 AI行业一定会从模型战争转向应用战争,是AI产业一条可借鉴的发展之路。也会让AI产业在应用层进行更多的思考,带动产业价值。 如果你的行动启迪别人做更多创想、得更多学识、做更多实践、成更多改变,那么你就是一个造梦师。而百度文库,正是这个“造梦师”,无论对于内容创作,还是AI本身。 03 社会价值:没什么能比得上一个创造未来的梦 改变时代的产品还有一层共性,那就是产品与使用场景具有天然的契合性,大多数基于语言、写作和信息传递,无论是语言软件(早期基于PostScript诞生的Adobe), chat软件(Wechat、ChatGPT)亦或是短视频。 正如保罗·科尔赫所言:“写作意味着分享,是人类本能的一种状态:分享想法,观点,意见。” 百度文库,正是大模型基于人类本能——写作分享诞生的产品。人类的悲欢或许并不相同,但百度文库在实际应用层面一定程度上填平了不同人之间的表达鸿沟,因此带了很大的社会共鸣,产生社会价值。 2023网易未来大会中,王颖也列举了大模型重构百度产品的具体案例,越来越多的新玩法也被引入到用户互动体验中——无论是基于大模型打造的百度作家平台,还是多模态能力下的百度贴吧,都能轻松实现创作效率提升和爆款内容生产,也让用户与虚拟角色直接互动,获得了用户市场更为热烈互动和反馈。 基于人类本能的分享欲和表达欲,我们当然可以给予AI重构后的百度文库更高的未来期待,因为没有什么比得上一个创造未来的梦。而对于人类,文字永远是对于“未来想象力”承载量最大的信息载体。 本质上审视,工业革命经济发展的要义就是集约、规模、效率,AI时代也不例外,能否实现软硬协同(最大化效率)和端到端的能力(规模化部署)是社会经济的重中之重。 “不能被检验的主张、无法证伪的断言是虚伪的无意义的”。 如果说百度持续多年的研发投入所构建的“AI大底座”基础设施,是抽象的技术表达;类似于百度文库这样直观展现生产力提升,行业领先的产品,便具象印证了百度构架的“AI大底座”,其实力远胜于接入API、调几个专属Token的所谓大模型产品——它具备成为我国AI应用发展的土壤的真实能力。 我们在蒸汽时代、电力时代落后世界一个身位,在信息时代、移动互联时代实现追赶,那么在未来的AI时代,我们将成为引领者。 因此我们判定兼具用户价值、产业价值和社会价值,AI重构后的百度文库会成为中文大模型发展中,一个里程碑意义的产品,一个“杀手级”的应用。 这正如麦蒂·史蒂芬尼克所言:“尽管未来听上去很远,但它现在已经开始了。”
游戏业,危机还是转机?
国家新闻出版署连续释放支持国产网游健康发展的信号,无疑有助于人们增加对上周五起草的《网络游戏管理办法》(征求意见稿)的补充理解。 首先,新闻出版署强调,将在继续听取相关部门、企业、用户等各方意见的基础上,对征求意见稿做进一步修改完善。通常来说,既然是征求意见稿,就是可以提意见、可以沟通协商的,新闻出版署在印证这个原则。这一态度非常务实,有助于增加理解,提振信心。 ▲国家新闻出版署强调,对于各方就征求意见稿第十七条、第十八条及其他一些内容提出的关切和意见,国家新闻出版署将认真研究,并将在继续听取相关部门、企业、用户等各方意见的基础上进一步修改完善。(截图:国家新闻出版署官网) 今天上午,新闻出版署又发布了新批准的105款国产游戏版号,腾讯的《逆战:未来》、网易的《萤火突击》等在列。12月国产游戏版号单次审批数量首次过百,创下新高,而且涵盖游戏企业范围更广。这些都是支持游戏产业加快发展的清晰举措。 上周五新闻出版署发布新规的征求意见稿时,市场产生了悲观情绪。客观说,这当中存在不少误读,加强政策制定与市场主体和广大投资者之间的沟通,打通信息发布和理解的堵点,防止解读的异化,已经成为当前的一项重大课题。要说,新闻出版署新规草案第十七条、第十八条想要解决的问题的确都客观存在的,公众对有必要消除网游中存在的那些弊端也有较大共识,但是市场却在第一时间对新规草案做了带有惊慌的理解。市场对政策这种正反馈不足甚至产生负反馈的情况,恐怕是市场整体信心不足的一种表现,所以相关治理一方面需要具体工作的更加细致,一方面还需要更广泛的治理和改革加以配合、支持。 ▲今天,国家新闻出版署发布了新批准的105款国产游戏版号,单次审批数量首次突破百款,所涵盖的游戏企业范围也更广,中国音像与数字出版协会游戏工委和广大游戏企业深受鼓舞。这次新批版号,是继12月22日新批准一批进口网络游戏版号后,国家新闻出版署又批准发布的一批国产网络游戏版号,有力展示了主管部门积极支持网络游戏发展的鲜明态度。(截图:国家新闻出版署官网) 网游是当下互联网经济很重要的一个支脉,GPU的设计基础就和网游有很大关系,中国不可能打击、阻碍本国游戏产业的发展,推它往前跑还来不及呢。另外,很多事情也都有消极的一面,网游导致了一些人的过度沉迷,有的人正常生活甚至被毁了,这个问题也需要在前进中不断加以缓释。为处理好这个关系,社会的积极性和资源都很多。2019年网游对未成年人做了游戏时长等限制,2021年强化了限制,但它们影响国产游戏行业了吗?显然没有。中国游戏产业的收入今年首破3000亿元,大趋势上涨良好。 ▲12月15日,2023年度中国游戏产业年会大会在广州黄埔区举办。中国音像与数字出版协会第一副理事长、游戏工委主任委员张毅君在活动上正式对外发布了《2023年中国游戏产业报告》。报告显示,国内游戏市场明显回暖,2023年国内游戏市场实际销售收入3029.64亿元,同比增长13.95%,首次突破3000亿关口。此外,有几种类型的游戏在今年获得了较好增长,包括电竞游戏、二次元移动游戏、国内休闲移动游戏与国内小程序游戏。其中,2023年国内小程序游戏市场收入200亿元,同比增长300%。(图源:网络) 老胡个人对上周五游戏板块大跌公开表达了沮丧,但是说实话,我对新规征求意见稿能够接下来得到很好沟通、整个行业和具体公司的正当利益都能得到充分保护,而且这个行业接下来能有更大发展,都是很有信心的。 老胡相信,国家监管机构与行业的大目标是高度一致的,如果市场在这当中对一些具体事情有所误读,通过增加有效沟通消除误解,也不应成为问题。尤其是在中央经济工作会议开过之后,思想进一步统一了起来,包括游戏行业在内的各个行业发展前景都应会越来越广阔,并且光明。
奥特曼遭起底“生活奢靡”!戴340万名表,开上亿豪车,买价值6亿豪宅
【新智元导读】最近,关于Altman的风波不断。有人挖出他戴着价值48万美元的奢侈品手表,开着价值上亿的豪车,而更让人瞠目结舌的,就是他奢华无比的硅谷大佬朋友圈了。 Altman被挖坟了! 最近有人注意到,在2018年的一次Wired活动中,Altman低头看了看自己的手腕。 继续扒皮后有人发现,当时他戴着一款看起来非常奢华的金表。 根据奢侈品手表网站的数据以及多方信息证实,这款腕表为高珀富斯(Greubel Forsey)在2008年出售的一款限量版手表,全球只生产了33块。 在2008年,这款手表的售价为52万瑞士法郎,按照当时的汇率,大约是48万美元。 奢侈手表网站KeepTheTime表示,这种手表很难在市面上看到,即使按照零售价购买,也很难买到,属于收藏家级别的手表。 这当然不止是Altman唯一的一款奢侈品表。 他还拥有一块百达翡丽万年历1526(Patek Philippe Perpetual Calendar 1526),其中一枚曾于2017年在佳士得以106,250美元的高价售出。 而在今年的国会听证会上,他论证对AI监管的必要性时,也是佩戴着这款手表。 随后,坊间传出更多爆料,除了佩戴48万美元手表之外,他还开着1500万美元的豪车,有多处房产。 就在这个月,人们发现他开着一辆红色迈凯轮F1上路。而这款汽车在2015年的拍卖会上,以高达1500万美元的价格出售。 据报道,Altman还拥有一辆Lexus LFA赛车,其中一辆最近在拍卖会上以110万美元的价格售出。 除此之外,在短短18月时间里,Altman已经积累了惊人的8500万美元的房产帝国。 从价值4300万美元的夏威夷历史遗产,到旧金山和纳帕(Napa)价值数百万美元的豪宅,Altman的投资组合既多样又豪华。 Business Insider此前报道称,据美国国税局的文件显示,作为OpenAI的首席执行官,他的年薪只有58,333美元,而且他在公司的股权非常少。 不过,他在9年内投资了400多家公司,设计商业飞行、大脑植入等不同领域。 Altman的夏威夷庄园紧挨着卡美哈梅哈一世(King Kamehameha I)的皇家神庙 随着Altman财富的日渐增长,他也逐渐远离「非超级富豪」的日常生活。今年3月,他的母亲告诉WSJ,Altman已经有四五年没去过杂货店了。2021年,他还聘请自己的表弟管理家族财务。 正在大家议论纷纷之际,Altman本尊居然上线回应了—— 「我认为我喜欢这些人类制造的美好东西,是对AI安全有帮助的。」 「但如果你们是想趁机黑我,我只能说很抱歉,我的品味这么好。」 对此,网友表示:显然,财富对数(logwealth)是存在的——想要让金钱带来的幸福感翻一倍,就需要将你的财富增加十倍。 从100万美元涨到1000万美元能彻底改变一个人的生活,而从1000万美元增加到2000万美元,其实只会让人感到稍微满意一些。 每逢低谷,都有硅谷大佬救场 整整三次,Altman都在自己所领导的公司中失去高层领导的信心,但是每次事件过后,他都能反弹到更高的高度。 为何每次危机,Altman都能逢凶化吉? 最近,WSJ采访了数十位高管、工程师、前任及现任员工、投资者后,发表一篇长文,揭秘了Altman躲避子弹的秘诀——那就是赢得硅谷大佬的帮助。 在Sam Altman被OpenAI董事会解雇的几分钟后,他给自己的亿万富翁朋友、Airbnb CEO Brian Chesky发了短信——「太残酷了」。 随后,当天晚些时候,Chesky告诉OpenAI最大合作伙伴微软的CEO纳德拉,「Sam得到了整个硅谷的支持。」 这种说法并不夸张。 只用了一个周末,Altman就成功召集了硅谷一些最有影响力的CEO和投资者,包括OpenAI的第一位风险投资人、Sun Microsystems的联合创始人Vinod Khosla,谷歌和Facebook的早期投资者Ron Conway,以及微软CEO纳德拉。 几天后,Altman顺利回到OpenAI,再次担任CEO。 被解雇、随后又迅速逆转自己的命运,这个故事在Altman多年的职业生涯中不断重复着。 从2005年他从斯坦福辍学起,他的故事一直遵循着这个模式,让他获得了「硅谷梦想家」的美誉。 过去的二十年中,他三次失去高层领导人的信任,又三次反转,在自己不断扩大的大佬朋友圈的帮助下,继续蜕变为更强大的角色。 2014年,Sam Altman,时任Y Combinator总裁的Altman在纽约发表演讲 在退出Y Combinator的前两个月,Altman在自己的博客中这样写道:「一个大秘密是,你可以在令人惊讶的短时间内,让整个世界屈服于你的意志。」 第一次:被员工轰下台,但董事会选择保他 19岁的Altman从斯坦福辍学后,最先创办了Loopt。 在自己的第一家创业公司Loopt,Altman就曾因「欺骗性和混乱的行为」引发了一群高级员工的不满。 有人抱怨Altman从事副业,有一次直接将工程师们调到一个「同性交友App」的工作上来,高管认为这损害了公司进展。 他们两次敦促董事会成员解雇他的CEO职位,负责集体辞职。 Loopt的首席运营官、Jimini Health的联合创始人Mark Jacobstein表示,「如果他认定某件事可以实现,在他眼里这件事就成真了。这对于想要做超级雄心勃勃事情的企业家来说,是一个非凡的特征。这可能会导致一个人过度延伸自己,从而使别人感到不舒服」。 此外,Altman在Loopt建立的最重要的关系之一是与红杉的关系,红杉的合伙人Greg McAdoo曾在Loopt的董事会任职,并对Y Combinator进行了投资。 在Loopt工作期间,Altman还成为了红衫的天使投资人,并帮助红衫对支付公司Stripe做出了首笔投资,Stripe现在是美国最有价值的创业公司之一。 在风投公司红杉资本投资者的力保下,董事会保留了Altman的职位,直到2012年,Loopt被出售。 第二次:倾向OpenAI引众怒,靠自己化险为夷 两年后,Altman出人意料地成为创业孵化器Y Combinator的负责人。 Y Combinator帮忙创建了Airbnb和Dropbox,联合创始人为Paul Graham。 Graham对于Altman大加赞赏,将他和乔布斯相提并论,称他们是少数几个意志力如此强大的人,以至于他们一定会得到自己想要的东西。 这份孵化器总裁的工作,让Altman成为了硅谷的权力中心。 正是在这里,他帮助Chesky创造了Airbnb惊人的崛起,并且发掘了众多有前途的初创公司,帮科技大亨们赚了一大笔钱。 Paul Graham在2014年力荐Altman去领导Y Combinator,这一决定让硅谷业界人士为之震惊。彼时的Altman还从未成功经营过一家初创公司。 尽管如此,阿尔特曼还是设定了一个很高的目标——将家族企业扩展为一个商业帝国。 他一天内牵线搭桥多达20次,帮助Y Combinator轨道上的人们建立联系。他曾帮助Greg Brockman,Stripe前首席技术官,成功将其股份高价出售给包括Y Combinator在内的买家。 在他的带领下,Altman将Y Combinator打造成了一个投资巨头。 在担任总裁期间,他还经营着自己的创业投资公司Hydrazine,该公司成立于2012年。 他在禁止Y Combinator的其他合伙人运营自己的投资基金后,引发了紧张局势,包括现任首席执行官Garry Tan和Reddit联合创始人Alexis Ohanian。 Altman还通过他创建的一个名为YC Research的非营利组织扩展了Y Combinator,该非营利组织是Altman自己的项目的孵化器,包括OpenAI。 自2015年成立以来,YC Research在没有公司长期合伙人参与的情况下运营,这加剧了董事会对Altman偏离公司核心业务运营的担忧。 此时,Altman认为OpenAI已经做好充分准备,将在AI领域取得重大突破,包括通用人工智能。 也就是2015年,Altman邀请在职谷歌的科学家Ilya Sutskever加入OpenAI,随后吸引了世界上优秀研究人员的加入。 知情人士透露,2018年初,Altman几乎不再出现在Y Combinator位于加利福尼亚州山景城的总部,而是将大部分精力放在了OpenAI——当时仅是一家小型研究非营利组织。 对此,Altman的行为激怒了Y Combinator的长期合作伙伴,并对其领导失去信心,集体邀请辞职。 2019年3月,Altman本人便辞去了总裁职务。 不过这次化险为夷的手段是,Altman自己提议他从总裁转任董事长,先发制人在公司网站发表了一篇博客文章,宣布了这一决定。 但是公司的合伙人从未同意过这一变动,后来这篇宣布也被从博文中删除。 第三次:宫斗大戏险出局,获95%民意支持 就在感恩节那段时间,我们见证了Altman的第三次「被放逐」。 早在10月初,OpenAI的首席科学家就一直在和董事会成员接触,建议董事会解雇Altman,并且列举了20来个Altman误导OpenAI高管的例子。 经过数周的闭门会谈后,Altman在感恩节前集体出人意料地被赶下台。 不出意料地,Altman又一次东山再起了。 被解雇后,OpenAI的大部分员工高调签署了联名信,威胁董事会自己也会辞职。 作为一名天才的交易撮合者、星探、推销员,Altman的天赋让OpenAI成为估值860亿美元的企业。显然,他成功地激发了员工们对自己的忠诚度。 目前,「宫斗」大戏暂时落下帷幕。 未来几个月内,OpenAI的管理层将受到审查。两名新董事会成员已经委托律师事务所对最近公司动荡的原因进行外部调查,包括Altman作为CEO的表现,以及董事会解雇他的原因。 OpenAI的发言人表示,「高级领导团队一致要求Sam重返CEO一职,并要求董事会辞职,超过95%的员工签署了联名信对此表示支持。得到如此多的民意支持,证明Altman是一位卓有成效的CEO」。 具体来说,在OpenAI,Altman负责招募人才、推动重要的研究突破,并从微软筹集到了130亿美元的资金。 首席科学家Sutskever负责主导大语言模型的发展,为随后风靡全球的AI聊天机器人——ChatGPT,打下了技术基础。 随着公司的扩张,针对 Altman 的管理方式的不满开始显露。 据熟悉内情的人士透露,今年秋初,身为董事会成员的Sutskever对Altman晋升Jakub Pachocki为研究总监一事表示了不满。 据知情人士透露,Sutskever将此事告知了董事会的同事,认为这件事体现了Altman一贯的做法——他倾向于让员工之间争斗,或者对两位高管同时做出资源和职责上的承诺,从而引发冲突。 代表Sutskever的律师Alex Weingarten在声明中表示:「Ilya已经对自己作为董事会成员的行为承担了责任,并且清楚地表明,他认为Sam是带领 OpenAI 前进的正确人选。」他还指出,有关Sutskever行为的一些描述是不准确的,但并未具体说明哪些描述有误。 Altman表示,自己是以一种「动态」的方式来管理OpenAI,有时会临时指派一个负责人,但随后会再聘请其他人正式接替这一岗位。据了解,他还可能会在几乎不提前通知的情况下,将计算资源从一个团队调配到另一个团队。 其他董事会成员对Altman的管理方式已经有所顾虑。比如,Tasha McCauley等人经常会与OpenAI的高层进行交流,而不会事先告知Altman。 但在疫情期间,Altman告诉董事会,如果有成员要与员工接触,他需要得到通知。而这一要求也被部分董事会成员认为是,Altman在限制董事会的权力。 在Sutskever公开表达他的不满时,知情人士称,OpenAI的独立董事会成员也从公司高层执行人员那里听到了相似的顾虑。有人甚至因为不满Altman的领导方式而考虑离职。 据知情人士透露,Altman曾误导董事会,让其中一位成员误以为另一位成员希望将Helen Toner踢出去。 董事会对Altman利用其在硅谷的影响力感到不安,因此在决定解雇他时,他们决定保守这个秘密直到最后一刻——最后几分钟才通知了OpenAI最重要的合作伙伴微软。 董事会在一份声明中指出Altman未能「始终如一地保持坦诚」,因此失去了他们的信任,但并未提供更多细节。 被开除后,Altman回到了他在旧金山俄罗斯山 (Russian Hill) 社区占地9,500平方英尺(约883平方米)、可以鸟瞰整个城市的豪宅。 不久后,作为重要盟友之一的Chesky,与Altman和主动退出公司并以此表达对Altman支持的Brockman,进行了一次视频通话。 Chesky询问了Altman被解雇的具体原因。Altman猜测,这可能与他和Toner之间的争执,或是Sutskever的不满有关。 在确认这并非涉及刑事问题后,Chesky给微软CEO Nadella打了电话。 与此同时,一小群在硅谷极具影响力的人物,包括Chesky和Conway,纷纷给Altman出谋划策,并通过电话尝试与董事会进行协商。 随后,董事会任命了来自OpenAI之外的Emmett Shear为临时CEO。 这一决定虽然让大部分员工都威胁说要辞职,但实际上,Shear正是Chesky的盟友和导师。 最终,Chesky和Shear携手合作,为Altman重返公司高层扫清了障碍。 Altman在线征集2024愿望清单 时间回到现在,正值圣诞节之际,Sam Altman还化身「圣诞老人」上线,让网友们列出他们对OpenAI下一年的愿望清单。 短短2分钟,各路网友纷纷许愿:AGI! 甚至连Altman本人也没有想到,大家对通用人工智能呼声如此之高。 不过,他表示,「很抱歉让大家失望了,我认为我们明年还无法达成这一目标……」 不久之后,Altman公布了网友们呼声最多的项目如下: - 通用人工智能(AGI)(请耐心等待) - GPT-5 - 更优质的语音模式 - 更多的请求 - 更强的GPTs - 更严密的逻辑推理 - 控制AI的「涌现程度」和行为表现 - 视频功能 - 个性化定制 - 更好的网络浏览体验 - 「使用OpenAI账户登录」 - 开源代码 他本人表示,其实还有很多其他足够能让自己觉得兴奋的事情,但这次没有提到的内容。 就比如,2021年9月,他曾预测AI和能源的成本将大幅下降。 如今,Altman称自己对这一预测感觉良好,在过去27个月里,已经有了非常明显的进展和变化。 智能和能源的成本将走向接近于零的道路。 当然,我们不可能在这十年内全部实现这一目标,但到 2030 年,人工智能革命和可再生能源+核能显然会让我们实现这一目标。
印度正测试通过AI改善天气预报精度 应对极端气候
IT之家 12 月 24 日消息,据路透社当地时间周五报道,印度正在测试使用 AI 构建气候模型,从而改善天气预报精度。当地的一名高级气象官员表示,在印度这个幅员辽阔的国家,暴雨、洪水和干旱等极端气候出现频次越来越多,正不断蔓延。 据报道,印度气象局正使用超级计算机来提供基于数学模型的预报,将 AI 与扩展的观测网络结合使用,从而能够以更低的成本生成更高质量的预报数据。 Pixabay 印度气象局的气候研究和服务部门负责人告诉路透社,该部门已经通过 AI 来生成关于高温、疟疾的公共警报,还计划增加气象观测站,提供到村庄级别的数据,从而为天气预报提供更高精度的数据。 当地政府周四表示,希望通过将 AI 融入传统模型的方式生成天气预报。印度理工学院德里分校助理教授 Saurabh Rathore 表示,“AI 模型不需要运行超级计算机所需要的高成本,它甚至可以在高性能台式机上运行。” 此外,英国气象局也表示 AI 可以“彻底改变”天气预报。报道称,目前世界各地的气象机构都在关注 AI,因为能够降低成本、提高速度。 据IT之家此前报道,本月初,中国气象局与华为技术有限公司签署深化战略合作协议,双方将推进国产化高性能计算系统在气象领域的应用、人工智能技术在气象预报服务中的应用、气象关键信息基础设施应用、气象行业深化信息技术应用创新工作以及气象服务在华为终端的应用。
Midjourney V6 这波更新可能会惹出麻烦
文章来源:阑夕 文 | 阑夕 前几天,AI 绘画工具 Midjourney 推出了 V6 版本,随后一如既往的赢得了进步巨大的盛赞。 V6 模型的最大亮点,在于它对画面真实性的理解更加透彻了,无论是在细节的处理上,还是对于提示词的敏感,相比 V5.2 都有着前所未有的提升。 但在另一方面,随着被使用规模的增加,越来越多的人发现,Midjourney V6 之所以能够拿出极其逼真的图画,可能是因为它的训练来源已经深入到了影视作品的每一帧上,而且并不掩饰生图时的一致性。 有很多用户已经发现了拟合度非常高的案例,比如下面这组对比,左边是「复仇者联盟」的电影截图,右边是 Midjourney V6 的出图: 来自 X 友 Reid Southen 以及和 2019 年上映的电影「小丑」剧照的这个对比: 来自 X 友 Min Choi 这再次触及到 AI 绘画的模糊风险:在被指控拿版权内容进行训练这件事情上,通常只能自证而非他证,AI 公司「打马虎眼」的空间相当充裕,AI 学习人类艺术是否是一项权利,也可以作为讨论议题拖延太久。 但是,重绘是一码事,叠图又是另一码事了,当你的产出里已经出现了高度拷贝原始图像的图画,由此引起的法律诉讼只会迎来爆炸式的增长。 事实上,我自己测试的结果,也能发现在那些具有高知名度、且影视素材流传极广的动画作品上,Midjourney V6 的还原度,确实非常惊人: 火影忍者 瑞克和莫蒂 进击的巨人 驯龙高手 龙珠 海贼王 小黄人 蜘蛛侠:平行宇宙 乐高蝙蝠侠 这些图片都出自 Midjourney V6,Prompt 是很简单的一句 [scene form xxx —ar 16:9 —style raw],很显然,如果不事先说明的话,将这些画面伪装成对应动画的截图,大概不会有多少人能够分辨出来。 当然,也有一些失败尝试,我的分析是,有些动画作品可能在知名度上是有的,但它的网络资源或是素材并没有那么丰富,或是样本被污染比较严重,导致 Midjourney V6 在训练时的容易走偏,所以复现效果就会变差不少: 灌篮高手 穿靴子的猫 猫和老鼠 总之就还挺迷的,作为 AI 的使用者,当然希望获得更加强大的产品能力,可是如果 AI 公司不能建立一个公允且可持续的商业模式,最后也可能会为行业遭致灾祸。 也不能完全说 AI 的拟合行为是不可容忍的,毕竟从 Prompt 来看,如果你指明让 AI 还原一部影视作品,它要是没做到这样的程度,反而会是某种意义上的失职,只是在一个非开源的、商业化的产品生态里,风险是有集中性的。 虽说给猴子一台不会坏的打印机和无限的时间,它终有一日能够打出「哈姆雷特」的全集出来,但无论是艺术还是科学,都不会膜拜这只猴子。
说到底,我们还是希望蔚来能成功
人们总是把成功当做正确,还没成功的人,却需要更多精力去解释正确。 蔚来创始人李斌就是那个经常需要去解释什么是正确的人。 2023 年下半年,国产新能源市场掀起了价格和销量的风暴,理想、小鹏等蔚来的老对手纷纷交出破纪录的月交付量,哪怕是阿维塔、岚图、智己等等后发者,也凭借并不多的车型稳步向上。 蔚来并不属于那些在下半年长舒一口气的厂商,于是很多人建议,把蔚来旗下中端品牌「阿尔卑斯」的首款车型加快节奏,当做蔚来走量车型进行销售,以求销量数字上的爆发。 但,蔚来给予的回应是,在 2023 NIO Day 年度发布会上,发布了一款行政旗舰轿车 ET9,对标的是奔驰 S,宝马 7 系,奥迪 A8L,乃至劳斯莱斯首款纯电车型「闪灵 Spectre」。 蔚来以决绝姿态,表示了这个品牌只会向上,绝不向下。 最广的边界,和最高的品牌梦 「蔚来愿意做任何事去帮助卖车,除了卖车本身」, 相比于老对手理想,蔚来实在是显得不够专注,花了太多太多精力在造车和卖车之外的事情上。 其中争议最大的是 NIO Phone,和换电站建设,当然还有不少蔚来潜在车主调侃的「我愿意终生不去牛屋(NIO House,蔚来提供给车主休息办公社交的空间),换车价少 1 万元」。 ▲ 位于杭州西湖旁的 NIO House 很多人认为,在生态,基建和服务上的过高支出,拉低了蔚来公司的毛利率,拉高了蔚来汽车的售价,导致蔚来汽车销量迟迟未能进入爆发期。 蔚来 2023 财年 Q3 财报显示,该季度毛利率为 8.0%,高于上个季度的 1% 毛利率,但低于去年 Q3 13.3% 的毛利率。 其中 2023 财年 Q3 汽车毛利率为 11.0%,也是比去年同期低,比二季度高。 就卖车而言,现阶段的蔚来仅仅称得上是差强人意,Q3 蔚来交付了 55432 辆汽车,同比增长 75.4%,创下季度交付新高。在这个季度,蔚来在中国 30 万以上的纯电汽车市场中位列第一,市场份额为 45%。 但是很明显,换电站业务远远没有到达盈亏线,第一代 NIO Phone 出货量寥寥,还处于投入阶段。 ▲ NIO Phone NIO Phone 起售价 6999 元,类似配置下,它是国产 Android 手机价格最高的,当然,它在配置和设计上确实堪称旗舰。蔚来 500 人的手机团队在第一款产品上就交出这样的答卷,已经属于超水平发挥了。 和外界预想的「买蔚来汽车,送蔚来手机」不一样,蔚来并未把手机业务当做添头生意来做,而是希望它成创造正向的利润。 在 NIO Phone 发布的时候,李斌表示,蔚来有 500 万车主,其中有一半愿意买 NIO Phone,每 3 年买一次,那么蔚来手机业务就有毛利,能持续发展。换算一下,李斌的期望中,NIO Phone 能赚钱的年出货量,大概在近 100 万左右,远期来看,也不过是一年大几十亿的生意,现在蔚来每个月卖车的收入已经达到了一两百亿人民币。 令人费解的是,当华为和小米参与到造车运动当中去时,哪怕是一直造车一直造不出来的苹果,大家都认为理所应当,合乎情理,但汽车厂商造手机却很难被大家理解。 仅从用户价值来看,同时制造手机和汽车,并打通体验和服务链路,让陪伴用户时间最长的两个产品无缝衔接,是一件没有异议的事情。 NIO Phone 可以通过 UWB 技术判断手机和汽车的距离来解锁车门,提前打开空调,打开后备箱,遥控泊车等等,通过独立的 NIO Link 车控键,用户可以实现更快捷多样的操控,以及把 NIO Phone 放在 ES8 中岛上的时候,NIO Phone 会自动变成控制屏幕,调节音乐、空调、氛围灯,此外还有导航接力,视频投屏等等无缝功能。 和鸿蒙座舱和 Flyme Auto 一起,NIO Phone 和蔚来汽车的手车互联,当属业界最佳的一档。 殊途同归。 但蔚来就是这样,做任何事情,都需要更多的解释。 比如换电。 在 2023 年 NIO Day 前夕,蔚来提前完成了 2023 年新建 1000 座换电站的承诺。位于陕西自然博物馆的年底第 1000 座换电站仿佛是给两天后在西安举办的 NIO Day 献贺礼一样,至此,蔚来累计建成 2305 座换电站,东至牡丹江、南至三亚、西至昌吉、北至大庆,用户常驻地 3 公里范围内换电站覆盖率为 80.36%。 蔚来是所有车企里自建充电站和换电站最多的厂商,到现在有 5800 座充换电站,与小鹏、特斯拉、极氪、埃安、飞凡和理想自建充电站的数量规模大概相当。 现在每个月能卖出 30 多万车的比亚迪,并未建立自营充电桩。有趣的是,蔚来对外开放的充电桩里,来充电的比亚迪汽车,和蔚来汽车数量持平。 在与长安汽车和吉利汽车分别签约换电合作协议之前,蔚来的换电生意长期不被看好。 2015 年,李斌曾去美国寻找特斯拉联合创始人 Marc Tarpenning,想让他做蔚来北美研发团队的 CEO,但他们对换电战略的分歧极大,最终两人都没能说服对方。 2013 年,特斯拉曾经在发布会演示过 Model S 的可换电功能,但最终特斯拉放弃了这个设计,变为仅充电。 其实换电并不是一件需要李斌说服 Marc Tarpenning 的事情,而是蔚来需要说服全世界的事情。 这又是一个令人费解的现象:绝大多数犹豫购买纯电车型的人,都会有里程焦虑,以及充电站排队,充电市场过长的担忧,而蔚来的换电站,是体验上最接近,甚至可以超越油车补能体验的方案。 蔚来第三代换电站标配了 2 颗目前业界最强的智能驾驶芯片 Orin-X ,还有 2 个激光雷达,以实现召唤换电与自动泊入功能,第三代换电站可以存储 21 块电池,每次换电时间仅需 5 分钟,每个换电站每天最多可以服务 408 次。第四代蔚来换电站的换电时间还会进一步减少,同时日服务次数极限能到 480 次。 如果做数字游戏的话,蔚来换电站是个美妙的生意:市面上的 120KW 充电站,配 8 个充电桩,每天最多服务不到 200 辆电车,服务能力不到蔚来第三代换电站的一半,但占地面积却是 2 倍。 一直以来,蔚来做换电,就像一种硬件上的 iOS,或者 Windows Phone 系统一样,不兼容外界,封闭,成王败寇。 要么成为能源界的 iOS,卖出更多的车,建更多的换电站,让换电站忙起来,最终实现盈亏平衡:现在蔚来换电站的平均负载(每天换电 35 次),只有盈亏线(每天需要换电 60 次)的一半左右,相当清闲。 要么成为能源界的 Windows Phone,车卖不动,换电站没人去,无法实现资金和资源的有效利用,最终成为一个失败的生态。 现在的蔚来有了第三种选择:成为能源界的 Android,开放起来,和更多的玩家一起玩。 长安汽车和吉利汽车的规模都要比蔚来大得多,它们分别在今年下半年和蔚来达成换电合作协议,将在换电电池标准、换电技术、换电服务网络建设及运营、换电车型研发及定制、电池资产管理及运营等多个领域展开全面合作,打造「私家车」和「营运车」两大换电标准体系。 显性的,在蔚来官网「不止于车」菜单下面,有 NIO House,NIO Life、NIO Power、NIO Service、NIO Phone,每一个都光鲜亮丽,是业界翘楚,传统车企视为边角料业务的周边电商业务,蔚来的 NIO Life 做到了极佳的水平,无论是商品品质还是 SKU 种类,都是业界独一档水平,不止一位参加过蔚来发布会的同事同行反馈,蔚来提供的小零食很好吃。 隐性的,蔚来跟 300 多家合作伙伴在研发方面有很多合作,投资了 80 多家公司,和几十所大学有产权合作。 比如在刚刚过去的 12 月 17 日,蔚来创始人李斌和副总裁沈斐轮流开着一辆搭载着 150KWh 电池的 ET7 ,从上海开到厦门,沿途没有充电和换电,最终跑完 1044 公里之后,电池还剩 3% 的电量。 这块电池并非来自电池大厂宁德时代或者中创新航,而是由固态电池公司北京卫蓝新能源提供,蔚来、小米、华为和吉利是背后的投资方。有业内人士估计,这块 NCM 固液混合电池的能量密度接近 360Wh/kg,是一般磷酸铁锂电池能量密度的 2 倍还要多,成本可能达到 30 万元。 显然,蔚来这场直播秀肌肉背后,是巨大的成本支出。 如此种种,看得见,看不见的地方,蔚来所做的,可以说是目前国产品牌当中边界最广的事情,当然,李斌也有着最高的品牌梦。 与其他的汽车品牌相比,蔚来的「自主性」显然要更强一些,这种自主性,以及最高品牌梦的最佳体现,自然是刚刚发布的 ET9。 不合时宜的 ET9,领先一年的发布会 一位在西安 2023 NIO Day 现场的媒体人说:当李斌说出 ET9 预售价为 80 万元的时候,全场倒吸一口凉气,仿佛要把本就寒冷的会场抽成真空。 一辆卖 80 万元的国产行政旗舰轿车,显得有点不合时宜。 什么是合乎时宜的事情呢? 是极越 01 上市 1 个月就全系降价 3 万;是 2023 款飞凡 F7 售价 27.99 万,到 2024 款就只卖 18.99 万…… 所有人都在教张小龙做产品,所有人都在教李斌做 CEO,出的点子也并不新鲜,给语音加个进度条,出点便宜车型冲冲量。 所谓 ET9 卖 80 万元感觉贵了,更像是一种感性上的不自信:我用 80 万买宝马 X5,X5 替我说话,我用 80 万买蔚来 ET9,我还得替蔚来说话。 说白了,是个面子问题,不是产品问题。 一旦聚焦到 ET9 的产品和技术上,又会发现,80 万的价格似乎合乎情理,当然正式上市的时候,预计实际售价会低于 80 万。 因为 ET9 在外观设计上的中庸平淡,显得 ET9 的发布,更像是 ET9 搭载技术的发布,展现的是蔚来的技术积累和实现能力。蔚来官方的描述是,ET9 汇聚了 100 余项全栈技术结晶和全球领先科技,包含 17 项全球首发技术、52 项同级领先技术,并有 525 项专利申请。 ▲ SkyRide 天行全主动悬架 ET9 在实车上的技术亮点也完全可以说领先时代: SkyRide 天行全主动悬架:全球首个兼顾智能化和高集成度的集成式液压主动悬架系统,领先第三代 Panamera 悬架一代。 天行底盘系统是目前全球唯一的,将三大核心硬件系统集成在一起的全线控智能底盘,由全主动悬架、线控转向和后轮转向三大核心硬件构成。 自研中国首款 5nm 高阶智驾芯片——神玑 NX903,自研的图像信号处理器 ISP,以及自研的推理加速单元 NPU,计算和储存资源完全池化,实现了智驾、座舱跨域计算资源的共享。 ET9 是全球第一辆采用全域 900V 高压平台的车型,900V 定制碳化硅电机功率密度行业最高,自研 900V 的 46105 电池包配合蔚来 640kW 液冷快充桩,可以充电 5 分钟,续航 255 公里。 此外还有不少专属行政旗舰轿车的舒适性安全性和高端性配置:四座布局,首发 MicroLED 智能高像素大灯,自正式悬浮轮标设计,滑翔式行政座椅带全身放松&全域加热&全方位按摩,主动降噪头枕,同级最大尺寸和空间,白车身扭转刚度 52600Nm/Deg,更冗余的传感器配置…… 这些领先现有产品一年乃至更多的卖点,在 2023 年确实显得略早,毕竟 ET9 也要等到 2025 年才会正式交付。 甚至 NIO Day 发布会 Keynote 的字体都是蔚来专门定制,契合蔚来品牌特点的。 第三个令人费解的现象出现了:蔚来造了一辆值 80 万的车,但是很多人觉得蔚来不配卖 80 万的车。 犹如一个鸡生蛋和蛋生鸡的矛盾,国产汽车品牌,是应该像小鹏这样从 G3 这样的低起点做起,逐步上探到 G9 和 X9,还是应该像蔚来这样,从 EP9 和 ES8 高点起步,穿插 ET5 和 ES6 这样的走量车型,再有 ET9 这样的继续向上突破车型? 答案只有时间能说明,但蔚来的尝试总有意义。 我们总是习惯了国产品牌的伏低做小,然后艰苦奋斗,慢慢出人头地,这是典型的中国式品牌突围之路。手机圈如此,华为小米 OPPO vivo 都差不多是这样,花了快 10 年的时间,终于能心安理得地把手机卖到 5000 块。 汽车也差不多,每一步往前试探都如履薄冰,吉利帝豪什么的,卖个十万出头,领克往前踏半步,大多卖个 15-20 万,再有个极氪继续混 25 万上下试试。 蔚来是最坚决想突破 30 万壁垒,和 BBA 直面的厂商,也是突破得最好的厂商之一。也许蔚来多少有点堂吉诃德式的勇气,想在每条战线上都和 BBA 交战一把。 品牌是需要凝聚的共识,品牌也是需要打破的幻象。 丰田赛那 MPV 在美国至今需要加价数千美元等待一年,在中国因为 MPV 供给的充裕,选择的众多,丰田赛那不过是众多选择的一种。 曾经雷克萨斯在中国也是需要加价等待才能提车,现如今也开启了降价之路。 只有供给和选择多了,品牌价值才会逐渐显现和回归,国产汽车已经走过了筚路蓝缕的阶段,进入了技术和产品制胜的阶段,我们还需要一些时间,来凝聚这样的品牌共识。 我们还是希望蔚来赢一把 体育圈最近流行一个梗:北伐。不少体育豪门队伍如今处在积分榜的中下游位置,比如英超的曼联和切尔西,比如湖人和勇士,球迷们希望这些豪门球队能够步步为营,场场争胜,最终跃上积分榜前列。 同时,互联网上也有另外一个「北伐」的梗,在知乎等平台上,不少人提问:如果给诸葛亮 10 万大学生,丞相能否北伐成功?/ 如果给诸葛亮无限供应方便面,丞相能否北伐成功? / 如果给诸葛亮一部全功能都正常使用的手机,丞相能否北伐成功? 蔚来似乎面临着双重的「北伐」境况:一方面在销量榜上,蔚来并不靠前;另一方面,大家太喜欢给蔚来出主意了。 有趣的是,这次 2023 NIO Day 的举办地西安,恰好就是历史上诸葛亮北伐应该到达的终点,虽然这个举办地是西安人民投出来的。 蔚来北伐,其实没有什么「子午谷奇谋」,只有「六出祁山」,屡败屡战。 在 NIO Day 之后的采访中,李斌说: 我是觉得中国汽车品牌最终一定能够实现技术向上、品牌向上,但是这个过程比大家想象的更漫长。所以一定要保持定力、保持耐心,这个过程中要杜绝折返跑。 李斌当然知道在 D 级车市场挑战 BBA 非常难,哪怕是 B 级车和 C 级车的攻伐也是碰壁连连,最近半年 ET7 的销量加起来还不到 3000 辆。 但蔚来和李斌可能是对时间最乐观的品牌和创始人,李斌觉得汽车圈的决赛圈到 2025 年才会开启,结束时间未知,到 2035 年,全球 10 大车企中国会占据 5 个,希望蔚来能有一个位置。 马斯克发表过更激进的观点:未来全球 10 大车企,可能是特斯拉领头,后面是 9 家中国车企。 同样在和蔚来一样打晋级赛,试图进入决赛圈的还有小鹏,前不久小鹏汽车创始人何小鹏发过一条朋友圈: 在汽车领域,最终大家都必须在技工贸服品财领域实现多项全能。 如果以技术,加工,贸易,服务,品牌,财务六个维度来看,其实蔚来在 2023 年的进展是比较不错的,ET9 秀技术,买下江淮工厂获得独立造车资质,国内首屈一指的服务能力,坚决向上的品牌,以及年底获得阿布扎比基金 22 亿美元的增持,还有蔚来在基建层面的疯狂投入,都算是利好消息,都是等待回报的投入。 在汽车圈,李斌和何小鹏是最意气相投的两个人,何小鹏的朋友圈好像是从另外的角度在帮李斌解释蔚来的战略和战术。 因为李斌实在解释得太多了,蔚来的边界,蔚来投入和回报的周期,蔚来对竞争态势的理解,好像最终又落在了「技工贸服品财」六个字上。 只不过蔚来选择了最难的全面出击,而不是逐个击破。 说到底,大家之所以这么喜欢教李斌当 CEO,还是希望蔚来赢一把,希望中国汽车高端化走起来,希望优雅智能的国产电动汽车跑得越多越好,跑遍世界各地。 因为正确,所以成功,而不是因为成功,所以正确。
我怎么不爱年度音乐报告了?
看着朋友圈又被网易云和 QQ 音乐的「年度音乐报告」刷屏,我意识到今年真快又要过完了。 对于很多人来说,分享「年度音乐报告」已经成了一种固定的仪式感,而这份看似为每个用户「量身生成」的报告也成为了音乐流媒体的「年度大考」—— 比创意、比设计、比传播。 然而,今年最吸引我的「年度音乐报告」不是来自最会玩 H5 的网易云,也不来自算法最厉害的 Spotify,而是来自一位小红书用户。 把年度歌单做成磁带,还是做更「好看」的年度音乐报告? 用户「鸡哥鸡哥鸡」在小红书上分享,自己从 2011 年就开始将「收藏」的歌曲刻录成一盘盘磁带,出门时可以随机拿上一盘带着听。 ▲ 图片来自小红书用户「鸡哥鸡哥鸡」 而且,他还会亲自为每一盘磁带手绘封面图。 今年下来,他刻了十多盘磁带,每个都有独特的封面,装载着不同时间的回忆。 ▲ 图片来自小红书用户「鸡哥鸡哥鸡」 我无法否认,音乐 + 回忆(年度回顾)+ 自绘封面的磁带载体,简直就击中我心中的动人三连环。 但这件事为我带来更多启发的地方在于,它提醒了我 —— 我们不必等音乐流媒体来告诉自己我们的「年度歌曲」「年度歌手」是谁,我们可以自己决定。 在他的 Walkman 里,入选年度歌曲的不必是那些在今年里被播放最多的歌曲,而是一首首他主动选择收藏,决定是喜欢的音乐。 我知道,我们原本爱看「年度音乐报告」,更多是想从数据角度去挖掘,看自己有什么连自己都没意识到的听歌习惯或喜好,顺便也进一步强化确认我们对特定歌手和音乐类型的喜欢。 但我们必须承认,这类报告诞生了 7、8 年, 它已经从单纯的「更多地发掘我自己」变成了「这是我音乐品味的体现」,我们「身份标签」的一部分。 当报告和我们自认音乐品味相契合,我们自然会很开心地去转发分享; 有时候,甚至连刷别人的年度音乐报告也能成为加强自我身份标签的方式: 22 岁的 Alfonso Velasquez 告诉 Vox,他喜欢刷别人的 Spotify 年度音乐总结,因为在和别人的音乐报告默默对比当中,他更觉得自己的音乐品味可真独立。 如果总结和自我认知两者落差过大,那大家心情就不太好了,尤其是当你的「年度歌曲」是那首某天不小心误触到单曲循环播了一晚的陌生歌曲;或者是技术错误,如今年就有用户反馈自己的报告里出现了从未听过的歌曲。 有时候,太「真实」也不是很好,譬如被人看到你其实内心很爱并不符合你「音乐人设」的高频歌曲。 甚至,国外还有不少人醉心于研究 Spotify 的年度报告背后的算法到底是什么规律,或者是平台用来做总结的数据到底是从几月算到几月。 更有甚者,还有教程会教你在 Spotify 的年度音乐总结马上就要出炉之前,找些空闲时间开着软件循环播放一些符合「音乐人设」的专辑,好让年度报告「好看」点。 从某个角度来看,你也可以说这是我们通过自己努力来「选择」自己的年度音乐总结,也可以说是和自选年度歌曲做磁带一样需要「付出」。 然而,两者间根本上的差异在于,我们选择了什么游戏规则以及是否还记得为什么。 谁在定义我们的「最爱音乐」和「回忆」? 最近,亚马逊创始人贝索斯在播客里讨论了一个很常见的误区 —— 将「真理的代理」视作「真理」。 譬如,公司里有人设下了一个 KPI,它曾经代表了亚马逊所追求的「最佳顾客体验」。 过了几年,消费者和市场都改变了,甚至员工可能也换了一批,但人们还在追求这个 KPI,甚至将完成这个 KPI 就做好了顾客体验这件事。 这时候,这个 KPI 就成了「真理的代理」。做到这个 KPI 也不意味着顾客体验很好,但大多数人都忘了这件事。 非常通俗地说,这也算是「不忘初心」理念的一种演变。 现在,很多基于数据和 AI 的内容经常会让我有这种感觉。 各家年度音乐报告在几年时间里,成为了「音乐品味」和「音乐回忆」的一种代理,但它们背后的算法逻辑通常并不透明。 资深科技行业设计师凯特·霍姆斯在《误配》提及,我们潜意识中会认为机器是公正的: 人类是不公正的,我们不可靠、容易犯错。但我们希望科技是公正的。 我们更倾向于相信没有生命的东西在很大程度上是公正且没有偏见的。 虽然现在有更多关于算法偏见的讨论,但不少时候我们还是有可能会忘记算法背后是人、规则背后本身就已是一套价值。 不仅在年度音乐报告上我们会不自觉去「努力争取」,甚至在睡眠上我们也会很「拼」。 WSJ 曾聚焦了一批「硬核」睡眠追踪软件用户,其中有人将睡眠「卷」成了竞赛体育,为了获得睡眠软件的「高分数」出尽浑身解数。 这种投入也造成了更大压力,反而影响了实际睡眠质量。 今年小范围流行的 Pokémon Sleep,一款用户靠「好好睡觉」来玩的游戏就让 28 岁的 Joshua Bryzik 有点难做: 他通常睡 7.5 小时就会自然醒,但因为游戏定义中 8.5 小时才是「最好的表现」,他不得不跟着规则走:「我会合上眼睛,希望多睡一个钟,但那通常让我在醒来之后感觉更糟。」 当然,Bryzik 面对的这个「明确规则」已经好处理多了,要去猜算法里那黑箱式的评价标准就更难了。 如果说睡眠质量还算是能做出一套基于数据和研究来评判的事情(当然,不能忽视自己的感受),那「回忆」似乎应该和「最爱音乐」一样更趋于主观情感。 前段时间苹果上线的「Journal」应用,就是结合了算法的智能「日记本」。 它能根据用户的数据提供「手记建议」,显示出你今天听过的歌,拍过的照片,走过的路,帮助你回忆今天发生过的事情,对于「空白文档恐惧症」可以说是非常友好。 但长期下来,这个友好的功能也可能会改变我们「回忆」的方式: 从前我们写日记时可能会按一天时间来回忆,或者是按情绪强度来检索,但在「手记建议」的推动下,我们记起没有任何数字痕迹(或任何能走进 Journal 算法中)的事情或想法,是不是就会更难? 老实说,我现在对过去了几年的事情的记忆,很多的确会被手机中照片记录的时刻「定义」。直到和朋友聊起更多的「当时」,我才想起原来那刻还有这么多其他事情。 那些在数据以外,没有被文字记录下来的时刻太容易溜走了。 然而,音乐和气味,它们却是尤其特别的回忆「载体」。 当我开始回想去年,我仿佛就能听到 Willis Alan Ramsey 的「Northeast Texas Women」。 自从爸爸 2022 年在车上给我播了一次后,我就一直带着这歌。 那时,我们在沙漠里,摇下车窗,空气中飘着山艾和晒过的沙尘的气味。 即便在那个时刻当下,我都开始觉得很怀念了 —— 那 5 分钟 51 秒的乡村音乐,在莫哈韦沙漠中。 对于《大西洋月刊》作者 Nancy Walecki 来说,这是她心中最重要的音乐回忆。 但在她的 Spotify 报告里,这歌当然没上榜。 它只是一次微不足道的「播放记录」。
AIGC明星独角兽被曝卖身!投资者点名CEO下台,9个月流失15名高管
作者 | 香草 编辑 | 李水青 智东西12月25日报道,近期,AI生图赛道迎来一波新的爆发期。不仅Meta、谷歌等科技巨头接连推出新的文生图模型,现象级产品Midjourney也在上周迎来今年最大的版本更新,但阵势最大、动作最密集的还是美国明星AI创企——Stability AI。 在不到一个月的时间里,Stability AI连发四款新模型,前脚在“老本行”领域推出可毫秒级实时生成图像的新模型,后脚就亮出了文生视频、图生3D、端侧轻量级模型等新成果,试图打造AI生图领域的OpenAI。 ▲Stability AI接连发布新模型(图源:Stability AI官网) 然而,在产品火爆的背后,Stability AI却疑似面临“后院起火”——被迫卖身、CEO丑闻、高管接连离职等消息不断流出。 11月30日,Stability AI被曝出,由于财务状况压力巨大正在寻求出售。此外,Stability AI的重要投资者之一、美国对冲基金Coatue Management还在10月致信管理层,要求CEO埃马德·莫斯塔克(Emad Mostaque)辞职。 虽然莫斯塔克第一时间就在社交平台X进行澄清,强调从未向任何人提出被收购的请求,还顺便预告了一波新动向。但这家名为“稳定AI”公司的“不稳定”,其实早就有迹可循。 ▲莫斯塔克在X回应称并未寻求出售(图源:X) 据智东西根据公开资料不完全统计,自今年3月以来,至少有15名高管或关键人物离开Stability AI,大部分在职时间不到一年,其中最短的仅在职2个月。 ▲Stability AI今年离职高管名单,智东西整理制表 Stability AI成立于2019年,并于2022年跻身独角兽行列,其2022年8月发布的Stable Diffusion模型曾掀起一轮AI生图的新浪潮。由于免费开源,Stable Diffusion大幅降低了AI生图的使用门槛,发展出繁荣的开发者社区,同时保持了不输闭源模型的精细度。 据Stability AI官网显示,目前其全球用户已超过1000万,建立了超30万用户、开发者和研究人员的社区,使用其API(应用程序接口)生成的图像超4亿张。 一边,是高管频频离职,重要投资者被曝退出董事会;另一边,是产品不断推陈出新,还获得了英特尔领投的5000万美元(约合人民币3.59亿元)新融资。 这不禁让我们联想到上个月刷屏的“OpenAI政变”。同样是表面上一片繁荣向好的明星AI独角兽,却疑似因为内部管理问题,上演了一出闹剧。不过比起OpenAI,Stability AI面临的处境可能更加严峻。 一、9个月流失15名高管,投资者要求CEO下台 据国际职业社交网站领英信息显示,今年3月,Stability AI首席信息官丹尼尔·杰弗里斯(Daniel Jeffries)离职,随后作为CEO加入创企Kentauros AI,专注AI Agent。 ▲杰弗里斯及其工作经历(图源:领英) 4月,Stability AI产品副总裁克里斯蒂安·坎特雷尔(Christian Cantrell)离职,创立了AIGC公司Concept.art。在加入Stability AI前,他曾在Adobe工作了近20年,担任设计原型总监。 ▲坎特雷尔及其工作经历(图源:领英) 工程副总裁斯科特·德拉维斯(Scott Draves)则于5月离职,领英信息显示,他在9月创办了一家公司,但目前以隐形模式运营。 ▲德拉维斯及其工作经历(图源:领英) 6月,研究主管戴维·哈(David Ha)与首席运营官伊藤莲(Ito Ren)相继离职。 戴维·哈在担任研究主管8个月后辞职,他曾对彭博社说,莫斯塔克“不懈追求别人不理解的想法,这让人很难弄清公司的目标到底是什么,或者计划如何实现目标”。此前,他曾在谷歌任职了6年。有外媒评价,他的离开是该公司迄今为止最引人注目的退出。 离职2个月后,他与“Transformer八子”之一的利昂·琼斯(Llion Jones)一起在日本创办了Sakana AI,公司名称来自日语中的“鱼”一词,专注于研发应用生物运动等自然原理的新AI模型。 ▲戴维·哈及其工作经历(图源:领英) 在加入Stability AI前,伊藤莲曾担任日本互联网公司Mercari欧洲分部的CEO,主导全球扩张,并在2018年成功策划了60亿美元的IPO。据彭博社报道,莫斯塔克称伊藤莲是“被解雇”的。 ▲伊藤莲及其工作经历(图源:领英) 到了7月,Stability AI“迎来”高管离职爆发期。研发副总裁帕特里克·希伯伦(Patrick Hebron)、参谋长内森·利尔(Nathan Lile)、大模型兼RLHF负责人路易斯·卡斯特里卡托(Louis Castricato)、人才招聘主管肯尼斯·李(Kenneth Lee)和首席产品经理比尔·马里诺(Bill Marino)均离开公司。 ▲从左至右依次是希伯伦、利尔、卡斯特里卡托、李、马里诺(图源:领英) 希伯伦曾在Adobe任职近5年,又在英伟达就职了1年,领英信息显示,他曾是这两家公司的“机器智能设计小组”创始人和总监。 作为参谋长,利尔在CEO办公室工作,负责领导该公司与云计算巨头AWS(亚马逊云科技)的交易。 卡斯特里卡托是Stability AI“历史最悠久”的机器学习研究科学家之一,他与其他人共同创立了研究实验室CarperAI,致力于提高偏好学习的性能。从Stability AI离职后,他再次投身于非营利组织EleutherAI的工作。 领英页面显示,马里诺是Stability AI“最高级的产品经理”,他直接向CTO汇报工作,负责将图像和语言模型转化为产品。他曾在Adobe任职近5年,担任神经滤波器首席产品经理。近日,他在领英宣布下个月开始将在剑桥大学攻读计算机科学博士学位,在AI等领域进一步深耕。 8月,大模型负责人斯坦尼斯拉夫·佛特(Stanislav Fort)离职,并于11月入职谷歌DeepMind担任高级研究科学家。 ▲佛特及其工作经历(图源:领英) 10月,首席人力官奥兹登·昂德(Ozden Onder)和总法律顾问亚当·阿夫鲁宁(Adam Avrunin)离职,两人任期均不足1年。而就在9月,Stability AI刚发布了新闻稿宣布任命昂德为首席人力官,并“带头开发人才计划”。同一篇新闻稿里,Stability AI强调阿夫鲁宁是“经验丰富的高管团队”成员之一。 同样在9月被任命为高管的还有乔丹·巴尔德斯(Jordan Valdés),她以传播、品牌、创意和社交媒体副总裁的身份加入Stability AI,曾就职于IBM、奥巴马政府。11月,外媒报道了她的离职,其社交平台X上的个人简介证实了这一消息。 ▲巴尔德斯的社交平台简介(图源:X) 11月16日,Stability AI音频副总裁埃德·纽顿·雷克斯(Ed Newton-Rex)发表公开信宣布辞职。信中提到,他不同意公司在受版权保护的作品上训练模型的行为,并认为这是对创作者的剥削。 据演讲机构Chartwell Speakers资料显示,纽顿·雷克斯以全年级第一名的成绩毕业于剑桥大学音乐系,并于2010年创立了世界上第一家AI音乐公司Jukedeck。基于Jukedeck技术创作的原创音乐超过一百万首,直到2019年,该公司被TikTok的母公司字节跳动收购。 在字节跳动,纽顿·雷克斯先是领导AI音乐实验室,然后负责TikTok在欧洲的产品工作,开发AI推荐算法。2021年7月,他加入Snapchat,担任音乐创作应用Voisey的首席产品官,该应用专注于降低音乐创作和合作的门槛,为许多用户带来了唱片合约。 2022年11月,他加入Stability AI,先是担任Harmonai的产品副总裁,随后担任音乐副总裁。 ▲纽顿·雷克斯及其部分工作经历(图源:领英) 莫斯塔克在辞职信的评论区说:“很高兴与你合作,这是一次重要的讨论。”但显然,他并没有被雷克斯说服,称公司向版权局提交了“经过深思熟虑”的意见,以说明他们为何认为“合理使用”受版权保护的作品是支持创意发展。 ▲莫斯塔克对雷克斯的回应(图源:X) 除了人才流失外,Stability AI的主要投资者对其态度转变也极为鲜明。 Coatue和光速创投(Lightspeed Venture Partners)均是Stability AI的主要投资者,在2022年10月以8900万英镑(约合人民币8亿元)领投了该公司的种子轮融资,使其以10亿美元的估值成功跻身独角兽行列。 ▲Stability AI的融资情况(图源:CrunchBase) 据彭博社11月援引知情人士消息报道,Coatue于10月退出了董事会,此次退出与英特尔的投资有关,Coatue持有英特尔竞争对手AMD的大量股份。 还有一些人士称,Coatue在10月向管理层致信,“呼吁”CEO莫斯塔克辞职。信中提到,莫斯塔克的领导导致了数名高级管理人员离职,并使这家初创公司财务状况变得脆弱。Coatue还一度寻求增加一名联合CEO或总裁。 光速创投的高拉夫·古普塔(Gaurav Gupta)也被曝出辞去了Stability AI董事会观察员的职务,因为与管理层对公司发展方向存在意见分歧。 二、学历造假、拖欠工资,创始人被指“谎话连篇” 虽然莫斯塔克称,员工流失在任何初创公司都是正常现象,因为员工和公司之间可能不存在“文化契合度”。 但根据彭博社对近二十名Stability AI现任和前任员工、投资者、供应商和承包商的采访,这家公司“组织混乱”,由一位缺乏经验的CEO领导,他有着“古怪的主张和崇高的承诺”,但并不总是能实现。 根据这些采访,莫斯塔克的古怪行为使得这家公司在关键增长时期“赶走”了一些高管和工程师。 和许多创始人一样,莫斯塔克经常用“乌托邦式”的术语谈论他的公司,但他的一些言论还是夸张到令人难以置信。彭博新闻社采访的多位人士称,莫斯塔克曾告诉他们自己担任过英国政府的秘密特工。 今年6月,福布斯曾发表一篇文章,指责了莫斯塔克通过一些误导性言论来“炒作”自己和Stability AI。 根据福布斯的报道,莫斯塔克曾这样讲述自己的故事: 埃马德·莫斯塔克是掀起AI淘金热的现代文艺复兴人。这位牛津大学硕士学位获得者是一位屡获殊荣的对冲基金经理、联合国的亲信,也是图像生成器Stable Diffusion背后的技术创始人。去年夏天,Stable Diffusion在互联网上引起了轰动,用莫斯塔克的话说,是它“迫使OpenAI推出了ChatGPT机器人”,使AI成为主流。现在,他是AIGC浪潮的代言人之一,并已获得超过1亿美元的资金,用于实现他的愿景,即建立一个真正开放的AI,他梦想这个AI将改变好莱坞、实现教育民主化并战胜PowerPoint。 而事实上,莫斯塔克只拥有牛津大学学士学位,而非硕士学位。这家“屡获殊荣”的对冲基金取得了辉煌的一年,但接下来的一年却非常糟糕,以至于几个月后就“关门大吉”。联合国也已经很多年没有与他有过合作。Stable Diffusion使Stability AI声名鹊起,但源代码是由另一组研究人员编写的。领导了Stable Diffusion研究的教授比约恩·奥默(Björn Ommer)说:“据我所知,当我们创造它时,Stability AI甚至不知道它的存在。” 一名Stability AI前员工称莫斯塔克“擅长拿走别人的作品,然后把自己的名字写在上面”。 ▲2022年12月,莫斯塔克出席《财富》杂志AI头脑风暴大会(图源:《财富》) Stability AI的宣传材料还包含其他夸张内容。在2022年5月和6月的投资者演示中,它将AI图像生成器Midjourney描述为其“生态系统”的一部分,声称“共同创建”了该产品并“组织”了其用户社区。 然而,Midjourney创始人大卫·霍尔兹(David Holz)告诉福布斯,莫斯塔克只是向Midjourney进行了“非常少量”的捐款,除此之外与他的组织没有任何关系。 财务方面,据福布斯报道,有8名前员工称,在公司内部,工资和工资税一再被拖延或拖欠,去年英国税务机构还威胁要扣押公司资产。 彭博社8月报道,至少有一家生成式AI企业指责Stability AI没有及时或全额支付7万美元的账单。AWS曾威胁要取消Stability AI对其部分GPU的使用权,因为该公司已累积数百万美元的账单,且几个月来一直未支付。 有知情人士爆料,该公司每月支出约800万美元,而收入远远达不到。莫斯塔克曾在11月于社交平台X透露,公司8月份收入为120万美元,并称本月有望通过软件和服务实现300万美元收入,但随后删帖。 莫斯塔克曾对这些争议进行了回应,但大部分澄清都有些“不痛不痒”,甚至坐实了其中一些指责,如未拿到牛津学位、对冲基金表现糟糕、拖欠工资等。 ▲莫斯塔克在个人博客上澄清争议(图源:莫斯塔克) 三、OpenAI不Open、稳定AI不稳定:AIGC创企面临的难题 Stability AI、OpenAI都是AIGC领域数一数二的“当红炸子鸡”,然而它们却接连出现种种管理问题,不禁引发我们的思考:AIGC创企都面临着哪些难题? 首先,版权问题不可忽视。今年以来,OpenAI等AIGC公司因为侵权而被屡次告上法庭,从Stability AI前音乐副总裁的辞职信也能看出,在公司内部,版权问题也存在一定的争议。大模型的训练需要大量数据来“投喂”,然而公开的无版权数据、尤其是高质量数据是非常有限的,这使得大模型公司在抓取数据时面临挑战。 其次,AI安全也是非常重要的因素。虽然OpenAI并未公开其开除CEO萨姆·阿尔特曼(Sam Altman)的原因,但根据可得到的公开信息,名为Q*的模型取得的重大技术突破可能是关键原因之一。 此外,财务显然也是关键因素之一。大模型的训练需要大量的算力支持,是一项十分“烧钱”的工作,这使得商业化落地进程十分重要。 Stability AI此前一直选择免费开源的道路,但显然对一家初创公司而言,长期的入不敷出会影响公司的稳定性。11月底,莫斯塔克宣布将推出会员模式,提到“最近几周的情况表明,商业模式的一致性在AI中非常重要”。在征求了用户意见后,他最终将会员定价为每月20美元。12月15日,Stability AI正式推出三种等级的会员制度,其中专业级月费20美元,可商用全套核心模型。 ▲Stability AI推出三种等级制的会员模式(图源:Stability AI官网) 而OpenAI这边,虽然最大的“金主”微软此前未曾得到董事会席位,但阿尔特曼最终能够回归公司,除了大量员工的支持外,主要投资者的持续施压也至关重要。 这一点也是二者之间的主要差异。与微软对OpenAI的“无条件支持”不同,Stability AI因为投资者的不信任,实际上面临更差的处境。 同样是“CEO离职”,阿尔特曼是被自家董事会开除后,被投资者力挽狂澜“捞回”;而莫斯塔克这边,则是被投资者点名下台,虽然目前他仍坐在这个位置上,但一旦与投资者之间的矛盾加深,二者之间很有可能有人要退出或出局。 结语:繁荣表象下,AIGC创企亟需“自救” 11月27日,开源平台Hugging Face的CEO克莱姆·德朗格(Clem Delangue)在社交平台X上预测,2024年会有一家“被大肆炒作的”AI公司破产,或以低得离谱的价格被收购。而好巧不巧,仅三天后,Stability AI就被曝出寻求收购。 实际上,需要“自救”的AIGC创企也不止Stability AI一家。今年7月,曾凭借“套壳GPT-3”,在18个月内从白手起家到估值15亿美元的Jasper AI宣布裁员;获得红杉资本、老虎环球投资,估值达到6亿美元的无代码AI营销平台Mutiny裁员30%;国内初代AIGC明星创企影谱科技被曝出拖欠工资、断缴社保,面临经营不善、运营停摆的窘境。 虽然莫斯塔克极力否定,且始终否认内部管理混乱的传言,但种种迹象都表明,这家明星独角兽并没有表面看起来那么“稳定”。至于它究竟会走向哪个结局,只能交给时间来证明了。
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。 腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。 切换到点云、音频、视频等其他模态,也无需改变模型结构,简单预处理即可接近甚至超越SOTA。 团队提出了专门用于大核CNN架构设计的四条guideline和一种名为UniRepLKNet的强力backbone。 只要用ImageNet-22K对其进行预训练,精度和速度就都能成为SOTA—— ImageNet达到88%,COCO达到56.4 box AP,ADE20K达到55.6 mIoU,实际测速优势很大。 在时序预测的超大数据上使用UniRepLKNet,也能达到最佳水平—— 例如在全球气温和风速预测上,它就超越了Nature子刊上基于Transformer的前SOTA。 更多细节,我们接着看作者投稿。 “Transformer时代”,为什么还需要CNN 在正式介绍UniRepLKNet的原理之前,作者首先解答了两个问题。 第一个问题是,为什么在Transformer大一统各个模态的时代还要研究CNN? 作者认为,Transformer和CNN只不过是相互交融的两种结构设计思路罢了,没有理由认为前者具有本质的优越性。 “Transformer大一统各个模态”正是研究团队试图修正的认知。 正如2022年初ConvNeXt、RepLKNet和另外一些工作问世之前,“Transformer在图像任务上吊打CNN”是主流认知。 这几项成果出现后,这一认知被修正为“CNN和Transformer在图像任务上差不多”。 本研究团队的成果将其进一步修正:在点云、音频、视频上,CNN比我们想象的强太多了。 在时序预测这种并不是CNN传统强项的领域(LSTM等曾是主流,最近两年Transformer越来越多),CNN都能超过Transformer,成功将其“偷家”。 因此,研究团队认为,CNN在大一统这一点上可能不弱于Transformer。 第二个问题是,如何将一个为图像任务设计的CNN用于音频、视频、点云、时序数据? 出于对简洁和通用性的永恒追求,将UniRepLKNet用于其他模态时,不对模型架构主体做任何改变(以下实验用的全都是UniRepLKNet-Small)。 只需要将视频、音频、点云、时序数据给处理成C×H×W的embedding map(对于图像来说,C=3),就能实现到其他模态的过渡,例如: 把音频的频谱图(Time×Frequency)看成是一幅单通道图像,即C=1,H=T,W=F; 将点云进行三视图投影,得到三幅单通道图像,C=3,H和W可以随意指定; 将视频中的各帧拼接到一起,极为简单地得到一张大图(例如,16帧的3×224×224视频拼接得到3×896×896的输入); 对时序数据,借鉴CorrFormer中的embedding layer将数据转换为隐空间中的张量然后简单粗暴地将其reshape成一幅单通道图像。 后文展示的结果将会证明,如此简单的设计产生的效果是极为优秀的。 大卷积核CNN架构设计 2022年,RepLKNet提出了用超大卷积核(从13×13到31×31)来构建现代CNN以及正确使用超大卷积核的几个设计原则。 但从架构层面看,RepLKNet只是简单地用了Swin Transformer的整体架构,并没有做什么改动。 当前大核CNN架构设计要么遵循现有的CNN设计原则,要么遵循现有的Transformer设计原则。 在传统的卷积网络架构设计中,当研究者向网络中添加一个3×3或5×5卷积层时,往往会期望它同时产生三个作用: 增大感受野 提高抽象层次,例如从线条到纹理、从纹理到物体的局部 通过增加深度而一般地提高表征能力(越深,参数越多,非线性越多,拟合能力越高) 那么,设计大卷积核CNN架构时,应该遵循怎样的原则呢? 本文指出,应该解耦上述三种要素,需要什么效果就用对应的结构来实现: 用少量大卷积核保证大感受野。 用depthwise 3×3等小卷积提高特征抽象层次。 用一些高效结构(如SE Block、Bottleneck structure等)来提高模型的深度从而增强其一般的表示能力。 这样的解耦之所以能够实现,正是大卷积核的本质优势所保证的,即不依赖深度堆叠的大感受野。 经过系统研究,本文提出了大卷积核CNN设计的四条Architectural Guidelines。 根据这些guideline,本文提出的UniRepLKNet模型结构如下—— 每个block主要由depthwise conv、SE Block和FFN三个部分组成。 其中depthwise conv可以是大卷积核(图中所示的Dilated Reparam Block,其使用膨胀卷积来辅助大核卷积来捕捉稀疏的特征而且可以通过结构重参数化方法等价转换为一个卷积层),也可以只是depthwise 3x3。 多项表现超越Transformer 作为图像模态中的老三样,ImageNet、COCO、ADE20K上的结果自然是不能少。论文中最多只用ImageNet-22K预训练,没有用更大的数据。 虽然大核CNN本来不是很重视ImageNet(因为图像分类任务对表征能力和感受野的要求不高,发挥不出大kernel的潜力),但UniRepLKNet还是超过了最新的诸多模型,其实际测速的结果尤为喜人。 例如,UniRepLKNet-XL的ImageNet精度达到88%,而且实际速度是DeiT III-L的三倍。量级较小的UniRepLKNet相对于FastViT等专门设计的轻量级模型的优势也非常明显。 在COCO目标检测任务上,UniRepLKNet最强大的竞争者是InternImage: UniRepLKNet-L在COCO上不及InternImage-L,但是UniRepLKnet-XL超过了InternImage-XL。 考虑到InternImage团队在目标检测领域的积淀非常深厚,这一效果也算很不容易了。 在ADE20K语义分割上,UniRepLKNet的优势相当显著,最高达到55.6的mIoU。与ConvNeXt-XL相比超出了整整1.6。 为了验证UniRepLKNet处理时序数据的能力,本文挑战了一个数据规模超大的《Nature》级别的任务:全球气温和风速预测。 尽管UniRepLKNet本来是为面向图像任务设计的,它却能超过为这个任务而设计的CorrFormer(前SOTA)。 这一发现尤为有趣,因为这种超大规模时间序列预测任务听起来更适合LSTM、GNN和Transformer,这次CNN却将其“偷家”了。 在音频、视频和点云任务上,本文的极简处理方法也都十分有效。 One More Thing 除了提出一种在图像上非常强力的backbone之外,本文所报告的这些发现似乎表明,大核CNN的潜力还没有得到完全开发。 即便在Transformer的理论强项——“大一统建模能力”上,大核CNN也比我们所想象的更为强大。 本文也报告了相关的证据:将kernel size从13减为11,这四个模态上的性能都发生了显著降低。 此外,作者已经放出了所有代码,并将所有模型和实验脚本开源。 — 完 —
苹果停售新款 Apple Watch,还会带来什么影响?
节日里的红色,总是代表着吉祥喜庆。但今年 Apple 在圣诞前收到的这抹红,似乎和颜色本身的积极意义,相去甚远。 10 月 26 号,美国国际贸易委员会(ITC)裁决,苹果的 Apple Watch Series 9 和 Apple Watch Ultra 2 两款手表,侵犯了医疗设备公司 Masimo 的脉搏血氧仪专利。 子弹飞了两个月,终于落在靶心。 苹果近期宣布,从本月 21 号起,这两款手表将在美国官网停止销售;24 号起,线下也将暂停涉事产品的销售。好巧不巧,这天是刚好是美国时间圣诞节的前夕。 你可能会跟我一样好奇几个问题: 强如苹果怎么也会有今天? Masimo 这家名不见经传的公司,怎么有如此大的本领? Apple Watch 为什么不能没有血氧监测? 今天用这一篇文章,尽量给你解释清楚,Apple Watch 禁售事件的始末,以及,它可能会给你带来什么影响。 一场持续了十年的纠纷 我们先来认识一下本案的关键角色,究竟是「何方神圣」。 Masimo 是一家全球性的医疗技术公司,从事非侵入性的病患监护产品的开发、制造和销售,其核心业务是「脉搏血氧定量监测系统」,我们更熟悉的名字,是运用这项技术的产品「脉搏血氧仪」,这是 Masimo 最出名的仪器,常年位居全球同类产品销冠的位置。 同时,Masimo 在全球拥有将近 600 项已颁发的专利,和 310 项正在申请中的专利。换言之,这是一家在「无创监测」特别是「血氧定量监测」领域非常有名的公司。 这次禁售风波的焦点,正是发生在 Masimo 核心技术「脉搏血氧仪」上,2012 年 Masimo 就研发出了一款可以和 iPhone 设备直接连接,并传输数据的血氧仪「iSpO2」。 2013 年,苹果正筹划新产品 Apple Watch 的发展路线时,曾与 Masimo 谈论过合作的事宜,虽不知道具体聊了些什么,但肯定是关于血氧监测功能的合作(或收购),不过会谈无疾而终。 有意思的是,苹果不久后就挖走了 Masimo 的两名高管和关键工程师,祸根就此埋下。 两年后,初代 Apple Watch 发布,苹果正式进军穿戴设备,并在 2020 年的 Apple Watch Series 6 上,首次搭载了血氧监测功能。 Masimo 在 7 年后,终于抓住了「把柄」,以 Apple Watch 侵犯该公司商业机密,连续两年将苹果起诉至美国加州中区地方法院和 ITC。 官司打了三年,终于在今年 10 月有了结果,ITC 裁决苹果侵权属实。所以,本该在圣诞节大卖的两款手表,苹果只能忍痛从美国官方渠道撤下。 两款手表的下架,估计让苹果亏损了 3-4 亿美元,相比其第四季度 120 亿美元的收入,这点伤害或许对苹果来说就像「刮痧」。不过有一点需要强调:苹果手表在美国穿戴市场的占比大约为 1/4,尽管当下的现金亏损,对全球第一市值的公司确实是九牛一毛,但如此庞大的穿戴市场受到波及,苹果很难不紧张。 ▲ Apple 各产品季度营销占比. 图片来自:ITBEAR 当然,此次禁令并不会出现美国友人「跨国买手表」的奇观,因为禁售的范围只限于苹果官方渠道,亚马逊等第三方电商平台,依然在正常售卖。但需要注意的是,美国用户仍会受到影响:在禁令生效购买的产品,无法享受苹果官方的售后服务。 另一方面来看,ITC 的裁决,对维权公司来说是一个好的开始,因为行业巨头在法律纠纷面前,不再是「必胜客」。可能更多的小企业会因此事,更有底气地抵制侵权行为。 经此风波,苹果的企业形象,也受到了不小的牵连。比起禁售一两款产品,这类影响可能是苹果更难接受的。本周一美股盘中,苹果股价跌幅高达 1.6%,不及美股大盘。而事发前,苹果公司的股价刚创下了历史新高。 回到 Apple Watch 的产品线,苹果即将在明年推出的 Apple Watch Series X(10),很可能会因为禁令让其形态功能、以及发售安排都受到牵连。 本该在第十代产品上大刀阔斧地来一次「史诗级」更新,加上 Mark Gurman 爆出苹果将在新手表中加入「睡眠呼吸暂停监测(打鼾)」和「血压测量」,现在因为侵权的裁决,两大新功能大概率会被列入禁售列表。 以上就是苹果目前所处的窘境,「血氧监测」——这场纠纷的核心,苹果宁可接受停售也要保下的技术,真的有那么重要吗? 健康监测,没有看到的那么简单 在搞懂苹果手表为何离不开「血氧监测」前,我们先来看看这项技术是什么,以及是如何实现监测。 一些传染病的专业报告指出:静息状态下指血氧饱和度 ≤93% 时,即可诊断为临床重型。长时间的血氧饱和度偏低(缺氧),会对各器官形成慢性损害,还可能引发心梗、脑梗、肺梗死等严重疾病,甚至有生命危险。 一般低于 95% 就需要警惕,低于 93% 需要立刻就医,由于缺氧很难在第一时间被我们感知,往往有反应的时候,身体已经受到了一定的伤害,因此传染病流行期,这项指数的监测十分重要。 当年 Apple Watch Series 6 的一大卖点,就是「血氧监测」,此后的每一代苹果旗舰手表,都标配了这项功能。其工作原理是:在非接触的情况下,通过红外光发射器监测人体血液中氧饱和血红蛋白的占比。 而这刚好和 Masimo 公布的相关专利文件的原理类似:基于可见光和红外光发射器,发射特定波长的光线到人的体内,由于氧合血红蛋白(携带氧气的血红蛋白)和还原血红蛋白(未携带氧气的血红蛋白)对红光和红外光的吸收率不同,通过分析这些光线的吸收情况,仪器能够估算出血液中的氧气饱和度。 可以说,这项技术是 Apple Watch 的立身之本之一,如今被动了根基的苹果,日子当然不好过。 面对禁令,苹果使出浑身解数「力挽狂澜」背后,离不开 Apple Watch 在整个苹果生态中的定位:「健康智能穿戴」。 一方面,苹果是第一个将「健康监测」的概念在手表上推广开来的企业,当年 Apple Watch Series 3 中的心率传感器和健康监测,让苹果手表成为了那几年最受消费者欢迎的穿戴设备,以至于 2017 年末,Apple Watch 以碾压之势拿到了 61% 的市场占有率。 尝到甜头的消费者自然而然地将「健康监测」和「Apple Watch」甚至是智能手表联系在了一起,因此我们得以在今天的智能手表市场中,看见「全天候心率监测」「呼吸监测」「久坐提醒」等功能逐渐成为标配。 而「先吃螃蟹」的苹果,自然不会将自己建立起来的技术市场,拱手相让。 另一方面,手表中的「健康监测」功能落地,一直以来都是一个巨大的难题。 大如苹果、华为,强如 Masimo ,都会在官方的设备介绍中附上一句「此项功能不能用于医疗用途」。大部分的设备目前宣传的功能只能作为「健康追踪」,并不能用于「诊断治疗」,但消费者又会在购买智能手表时额外关注此类功能。 不被专业的承认,又被普罗大众需要,各个品牌的手表,就这样卡在了一个十分尴尬的节点。 不能成为专业,那就无限接近专业。这是智能手表竞争的现状,也间接说明了苹果如此执着健康功能的原因:不管是出于开创者的身份,还是近十年投入的研发成本,又或是同行的竞争压力和已经拿下的市场份额…… 苹果有无数个理由,要守住这项技术,当然这些天它也没歇着。 钞能力,可能是最好的解决方案 今天是圣诞节,这也意味着,唯一能让苹果在节前重新开售手表的方法,宣告失败。 在 10 月底的禁令发出后,拜登政府或美国贸易代表在 60 天的总统审查期,有机会否定该禁令。这是一条可行的法子,因为这并不是苹果第一次通过总统的否决,来规避相应的制裁。 2013 年三星指责苹果的 iPhone 4、iPhone 3G 和 iPad 2 侵犯其「蜂窝数据」专利,最后时任总统奥巴马否决了对 iPhone 的进口禁令,理由如下: 所涉及的「蜂窝数据」芯片专利是手机必须存在的硬件 担心禁令会让三星和苹果面临不公平竞争的局面 今天的苹果,试图复现此前的方案,但对比两次事件,几乎可以认定这条路行不通。 不同于那时已经发售了 3 年的 iPhone 4,这次被禁的两款手表刚推出 3 个月,并在穿戴市场极具竞争力;另外,这次的两家都是美国本土的公司,手心手背都是肉。 ▲ Masimo W1 智能手表. 图片来自:Masimo.com 如果不着急重新上架,苹果其实还有不少「出路」: 通过软件更新,暂时移除侵权功能。最新消息是 Masimo 不同意,他们认为苹果必须将侵权硬件从手表剔除才能恢复售卖。 尽快与 Masimo 谈判,达成和解接触禁令。这其实是 Masimo 最希望看到的局面,其首席执行官 Joe Kiani 表示,他们愿意和苹果和解,甚至可以和苹果一起合作,改进现有的产品。但是聊到具体需要多少和解资金时,Joe 拒绝回答了这个问题。 熬到 2028 年,等到该项专利过期,苹果就可以正大光明地在 Apple Watch 上搭载血氧监测功能。但代价是会有 5 年的产品展示真空期,以及在第三方渠道购买了苹果手表的用户,几乎没可能在产品使用的整个生命周期获得一次官方维修。 综合看来,谈判似乎是一个更好的方式,但苹果想要的谈判,可能不会仅限于支付专利使用费,而是会开启它一直以来的传统技能:收购。 这并不是一句玩笑话,「钞能力」是苹果的常用伎俩。 截止 2023 年底,苹果已公开宣布收购了 100 多家公司。比如 2010 年买下的 Siri 陪我们走到了现在;2014 年以 30 亿美元天价收购耳机品牌 Beats,为日后的 AirPods 铺平了道路。 Masimo 会不会也被纳入果门,我们无法猜测,尽管倔强的苹果目前还暂无反应,不过从 Masimo 首席执行官 Joe Kiani 在接受采访时的话语,却耐人寻味: 他将苹果侵权禁售的事件形容成「伸到罐子里的手被抓住了」,把是否会和苹果合作的问题又比喻为「跳 Tango 需要两个人」。 ▲Joe Kiani. 图片来自:THE FORBES COLLECTION 很明显能从字里行间感受到他的那份「期待」,不过就像他自己说的那样,一个巴掌拍不响。 无论如何都不会放弃「血氧监测」的苹果,又会以怎样的姿态来参与这段二人舞? 暂时不受禁令波及的我们,大可放心看完这场跨年大戏。
对话AWS生成式AI全球副总裁:解读AWS生成式AI服务的“三板斧”
作者 | ZeR0 编辑 | 漠影 如何应用人工智能(AI)进行创新和增强业务竞争力?这是当下许多企业正在思考的方向。在生成式AI和大模型热潮驱动下,各家云计算巨头都在摩拳擦掌,从计算层、平台与工具层到应用层,提供面向企业生成式AI训练和部署的多元选项。 每年举行的云计算盛会AWS re:Invent大会,是科技行业具有参考意义的“风向标”之一。在今年11月底举行的re:Invent大会上,全球最大公有云巨头亚马逊云科技(AWS)全面披露了其生成式AI技术堆栈,并公布多项生成式AI新服务、新工具,特别是改变用户构建、部署、运维应用和工作负载方式的企业级生成式AI助手Amazon Q。 期间,AWS生成式AI全球副总裁Vasi Philomin博士接受智东西等少数媒体的采访。他告诉智东西,Amazon Q的命名来自007系列电影中给詹姆斯·邦德提供各种技术工具的著名军需官Q;而Amazon Q之所以能成为企业业务的“懂王”,实现让客户能够更轻松地探索新服务和功能、学习不熟悉的技术、构建解决方案、发现问题、升级应用程序等多种复杂的任务,其背后不是单一模型,而是多种模型的组合。 过去五年,Vasi Philomin负责推出并管理了亚马逊云科技的多项AI服务,包括语言类、视觉类、工业类AI服务以及开发者工具。在采访中,他谈论了AWS围绕生成式AI落地、监管等议题的见解,强调AWS擅长让AI技术在现实世界的商业环境中真正有用,并将其所有的AI能力提供给客户,以便企业在竞争中脱颖而出。 一、一款大模型不能包打天下,99.9%客户不应构建新的大模型 早在20世纪90年代,Vasi Philomin还在读博士时,坐拥电商平台的亚马逊已经大规模应用机器学习算法来为客户推荐书籍。如今,亚马逊有大量的AI落地用例,例如装机量超过1亿的智能语音助手Alexa,每周与用户有超过10亿次语音互动;在订单履行中心,人类与机器人协作,每天搬运上百万个包裹。 “我们知道如何利用这些东西,并将其应用于现实世界的业务问题与规模,这是我们正用通用人工智能做的事情。”Vasi Philomin说,这需要端到端的思考,在不同堆栈层上进行创新,最终客户才能真正接受你的服务。 在他看来,在提供生成式AI服务方面,AWS有三点能力与众不同: 首先,单一模型不能包揽一切,AWS提供不同种类的模型选择,能够以非常简单的方式为客户提供适合其业务工作负载的最佳模型组合。 其次,云计算企业会将相同的功能提供给所有客户,那么企业如何利用这些功能才能变得与其竞争对手不同?企业自有的数据是关键。可对托管基础模型进行访问的Amazon Bedrock平台提供了定制功能,让企业能使用自己的数据私密且安全地定制模型,构建差异化的生成式AI应用。 第三,亚马逊自研基础模型的Amazon Titan实现了多项升级,包括新增Amazon Titan Text Lite与Amazon Titan Text Express大语言模型、Amazon Titan多模态嵌入模型、Amazon Titan图像生成器模型,这些均可微调。 其中,Amazon Titan图像生产器的独特之处在于从实际用例开始逆向工作,其工作方式不是考虑需要最好的图像生成技术,而是首先了解它将用在哪里(广告或营销行业的创意人员定义新品、新公司想要创建一个品牌logo等),然后确定模型是什么、应用如何运作。AWS投入很多精力来确保现实世界的偏见不会影响生成图像。 在Vasi Philomin看来,99.9%的客户不应该尝试构建新的大模型,这是没有商业意义的,只有当你重新思考一个非常具体的业务,它才有意义。构建大模型需要花费大量资金和人才,现有定制功能可以将构建生成式AI应用的过程变得更便宜、更容易,把事情从几个月减少到几小时、从1亿美元减少到不到100万美元。 二、五个策略,确保实现负责任的AI 在取得客户信任方面,进行上述工作时,AWS始终牢记企业客户对隐私安全的需求,多年来已建立一系列安全控制,并在实现负责任AI的道路上做了五件事: 第一,护栏功能。企业可根据自身用例及负责任的AI政策,制定模型必须规避的主题,通过自动评估最终用户的输入和基础模型的回应,提高模型对应用程序中不良内容的响应方式的一致性,促进最终用户与生成式AI应用的安全交互。 第二,模型评估功能。Amazon Bedrock的模型评估包括自动和人工评估,可帮助客户评估、比较和选择在构建应用或用Agent来执行自动化工作时哪个模型更适合他们。 第三,版权赔偿。如果客户使用Amazon Titan模型或其输出内容侵犯了第三方版权,AWS将对使客户进行赔偿。客户无需担心版权诉讼。 第四,隐形水印。所有Amazon Titan模型生成的图像都包含不可见水印,这些水印被设计成“拒绝更改”,对图像被篡改具备抵抗力,有助于减少错误信息传播,确保AI技术安全、透明。 第五,服务卡(Service Card)。这比模型卡(Model Card)更有意义,Model Card只针对一个模型来记录模型档案,为安全与伦理道德提供参考,但通常使用模型前后还有一些工作要做,因此需从系统的角度来看。AWS去年定义了超越模型功能的AI Service Card概念,解释了构建模型的目的、做法、限制、原则、隐私安全、偏见与公平等等,这些都有助于客户决定如何以负责任的方式使用该模型。 “我认为我们今天所拥有的,足以让客户真正开始使用这个东西,并追求一些真正具有颠覆性的使用案例,这将改变他们今天所拥有的创新潜力。”Vasi Philomin说。 三、Agent擅长做的事,与还需解决的难题 Vasi Philomin也分享了对agent概念的理解。在他看来,GPT只是一个模型,而agent更像是一个工作流。Agent是基础模型之上的抽象,本质上是一个可以同时做两件事的数字工作者: 第一,它可以帮助你快速创建一个了解业务特定知识的数字工作者。 你可以用工作流快速教它关于业务的知识,比如AWS今年推出的Agents for Amazon Bedrock功能,可通过简单几步创建和部署完全托管式的agent,借助特定业务的知识库私有数据,动态调用API来执行复杂的业务任务。这样做能够让agent立即变成特定业务知识的专家。 第二,它可以帮你将工作自动化。 企业有很多内部API,需要调用各个API来串联业务逻辑。比如你在亚马逊电商网站上买东西,收货后想换一双同一品牌、不同颜色的鞋,亚马逊做的幕后工作是用agent实现的,其做法是创建一个agent,教agent所有内部API和文件中的知识,比如一个API可以去查询这个牌子是否有这种颜色的鞋子、一个API可以检查颜色是否可用,一个API可以进行订单交换。 现在agent会分解任务,首先用你所拥有的知识来了解业务,然后通过了解所有内部API,收集调用API所需的信息,并决定何时调用它们。Agents for Amazon Bedrock功能使生成式AI应用能够跨公司系统和数据源执行多步骤任务。 Vasi Philomin告诉智东西,要加速AI agents的应用,需要解决如下问题: 第一步,创建一个企业就绪的agent框架,制定数据安全和隐私策略,确保调用API有正确的权限,为特定应用创建的agent可访问相应信息。 下一步,今天尚且不能创建出一个可以教它100个API的agent并期望它知道调用哪些,因为其背后模型还没那么强大,如果想做更复杂的事情,需要更多的科学进步。 当前的解法是把问题分解成更小的部分,创建多个有不同功能的agent,然后把这些agent所做的工作结合起来,最终完成任务。这要求开发人员做一些软件开发工作,通过编写代码来解决每一个更小的部分再进行组合。 AWS的目标群体是企业开发人员,一直在思考客户面临的挑战以及如何使用技术来帮助他们解决,希望为不同企业客户提供解决方案,使他们尝试做的事情变得更容易或更具成本效益,或者让他们有机会做以前不可能做到的事情。 结语:推动生成式AI普惠的关键:私密安全定制,负责任地开发 围绕生成式AI模型的创新正在重塑人们在工作和家庭中交互的许多应用,提升人类的生产力。随着生成式AI日益普及,越来越多的企业关注如何在同等资源的基础上取得竞争优势,以及如何以经济有效的方式将AI大规模应用于现实世界。对此,AWS认为企业使用私有数据打造更懂得自身业务、更懂客户的生成式AI应用至为关键。 看向未来,Vasi Philomin向智东西总结了他所关注的生成式AI关键挑战:一是企业就绪,必须真正关心企业的数据和数据治理,关心谁有权利访问这些东西,与通用人工智能紧密结合,这是许多客户选择AWS的真正原因;二是取得客户信任,负责任地解决一些挑战,这仍然需要做很多工作,随着时间推移,基础模型会变得更强大,能在未来实现更复杂任务的自动化。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。