EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
外媒:苹果放宽维修政策,允许使用正品二手零件,但零部件配对机制仍存在
【环球网科技综合报道】据外媒消息,近日,苹果公司宣布将放宽其维修政策,允许在维修过程中使用经过认证的二手正品零件。此变革预计于今年秋季正式生效,并首先适用于部分iPhone机型。这一举措无疑将极大地提高资源的利用率,减少不必要的浪费,同时也为用户提供了更多的选择和更低的维修成本。 根据新的政策,如果用户的iPhone屏幕损坏,而他们手头有另一台同型号的iPhone且其显示屏完好无损,那么他们可以在面板中进行切换,经过原厂校准后,更换的二手部件将能享受到与新品同等的全部功能和安全性。此外,该计划还将涵盖电池、相机以及面部识别传感器等部件。 然而,值得注意的是,苹果仍然保留了其“部件配对”机制。这一机制可以阻止使用被盗的iPhone零件进行维修,但也可能阻止第三方替换组件的使用。苹果表示,这是为了维护iPhone的隐私和安全。如果正在修复的设备检测到替换部件是从启用了激活锁或丢失模式的设备中取出的,苹果将限制该部件的校准,可能导致其无法正常工作。 尽管这一变革可能被视为苹果试图对维修过程施加更多控制,但它也为消费者和维修店带来了便利。他们不再需要订购全新的组件,而是可以使用手头已有的正品二手零件进行修理。这不仅降低了维修成本,还有助于环保。 然而,新的政策也可能引发一些问题。尽管苹果表示支持在维修中使用第三方部件,但如何正确校准这些部件以达到与原厂部件同等的效果,仍是他们需要面对的问题。
金三银四,你的面试官可能是个AI
作者 | 唐飞 编辑 | 韦伯 当碳基遇到硅基,我们可以从多个角度来探讨这一主题。 从生命形态的角度来看,硅基生命形态的研究表明,硅和碳之间的化学性质相似性使得硅基生命在AI面试场景里具备了为提高效率的可能性。 企业的本质是效率和创新,AI面试官这种新变化不仅拓宽了我们对人工智能多样性的理解,也为商业世界探索更多AI大模型场景提供了数据基础。 今年,传统的“金三银四”招聘季已经开启,准备跳槽的打工人跃跃欲试,千万大学毕业生也已经在赶来的路上。 价值星球发现,今年有一个显著的变化就是AI技术的大规模应用,如毕业生用AI写简历、AI模拟面试、AI推荐岗位;HR们也通过AI筛选、AI调研、AI面试等提高工作效率,双方都试图在茫茫人海中找到那个“最合适的人”。 凡事有利必有弊。 AI招聘的安全性也引起了一系列问题。今年1月,根据国外科技媒体404Media报道,全球快餐连锁肯德基(KFC)所用AI招聘系统存在漏洞,黑客不仅可以窃取求职者的信息,而且还能操控该AI系统拒绝快餐店应聘者,甚至进行雇用或解雇的操作。 《新京报》指出,AI招聘可能存在“就业歧视”问题。倘若一个原本就带有性别、地域、年龄等偏见的企业招聘者,再利用这一算法系统进行简历筛选,那么客观上就在流程中创造了一个“歧视信息茧房”。未来能被算法检索和推送的,都是经过偏见过滤后的简历。这就使得原本就相对隐形的“歧视”问题变得更加难以察觉。 针对AI招聘可能出现的新问题,国家先后出台了《互联网信息服务算法推荐管理规定》和《关于加强互联网信息服务算法综合治理的指导意见》,并持续开展专项行动,深入排查整治各类企业的算法滥用现象。 在监管发力的同时,技术手段也在加强。如上海市在2021年AI科技支撑专项项目审核中,专门部署了AI社会实验体系建设专题,强调要科学评估AI的社会综合影响,有效推进AI应用的标准建设,辅助支持AI应用的公共治理的决策。 多方努力下,AI招聘已渗入到招聘和求职的各个环节,包括BOSS直聘、猎聘、拉勾等主流招聘平台和北森、海纳AI等技术提供商纷纷推出了AI招聘产品,涵盖职位推荐、AI招聘助手、AI面试官、AI教练等等服务内容。 能不能入职,AI面试官说了算 00后硕士毕业生凡凡正在积极备战今年春招,过去的三个月里,他已经有了大大小小20余次面试经验。 与学长学姐不同的是,这些00后的“新新人类”更擅长运用各类技术软件。“我的简历就是用AI优化的,包括我的求职方向也是用AI测试决定的。因为我学的物流相关专业,但是又不想从事相关工作,反而对新媒体运营感兴趣,所以先后做了多套性格测试、职业测试等试题,最终坚定了我找相关工作的决心”,凡凡说。 在进入现场面试之前,凡凡还参加过几次AI面试,打开手机屏幕对面是一位AI面试官,它会问“你简历中提到的自媒体运营实习经历,自己在其中学会了什么?运营效果如何?”等等。而凡凡也总结出自己的一套回答方法论,“AI毕竟没那么聪明,只要回答里涵盖一些关键词信息就可以得到较高的评分,我一般用做什么、怎么做、方法论三个关键点来回复AI,而且要一直看着屏幕,眼神不能躲闪。这样就能得到一个不错的初面分数了。” 所谓的AI面试,是将人工智能技术与真实面试场景进行融合,对候选人的用词、语速、动作、表情等进行分析,通过数据量化的形式对候选人才进行解析。 一个月前,杭州师范大学和浙江工业大学同时举办春季线下招聘大会,现场“AI简历门诊”“AI面试”等环节受到了毕业生的欢迎。毕业生小许说:“和AI面试官模拟了面试场景,通过几分钟的答题,系统从行为能力、成长特质、认知能力等方面智能评估面试表现,也方便我找到自己存在的问题以后进行针对性训练。”而最快的AI面试,选择职位、刷脸投递、确认信息,15秒内就可以完成一次简单的求职。 根据《2024牛客智能制造业校园招聘白皮书》,53.5%的对智能制造感兴趣的学生有参与过AI面试,而参与过AI面试的学生中有77.7%的人表示满意。 图源:艾瑞咨询 从企业角度来看,AI面试可以帮助用人单位实现人力成本的节约、分析效率的提升。猎聘公布的数据显示,其AI产品多面·Doris 8小时可完成40000人评估,可降低企业80%招聘成本。 AI面试更是成为很多大型企业的“必选项”。早在2019年,联合利华、欧莱雅、可口可乐就已采用AI进行面试,国内的中国银行、招商银行、中国移动等也在近年开启AI面试。 在知乎平台上,“AI面试”话题已经产生136万浏览量,《AI面试得分点》、《AI面试总结与注意事项》、《AI面试答题技巧与方法》等经验分享帖均有较高浏览量。 图源:受访者提供 刚刚参加了中国移动四川分公司面试的付丹称,第一次参加AI面试的她,还没来得及做自我介绍就进入了答题环节,在接连13个问题的问答过程中,大多数题都是关于职场人际关系的。“毫无准备的我,回答的稀碎。好在后来被通知通过了面试。”付丹说。 AI招聘进入平稳发展期 今年政府工作报告中提出,要深化大数据、人工智能等研发应用,开展“人工智能+”行动。 而AI面试就是“人工智能+招聘”的实际使用场景之一,采用AI和人工面试相结合的方式,先由AI面试官对求职者进行大规模筛选,再由真人面试官最终把关,从而实现效率的大幅提升。 同道猎聘集团董事会主席兼首席执行官戴科彬称,“面对组织形态和人才标准的变化,AI在组织中将承担重要角色,未来每个企业都应该有一个HR数字助理。”在他看来,AI智能面试的核心在于真正理解面试的本质,进而把线下科学规范的面试流程和技巧赋能给AI,使其具备资深面试官的人才甄别能力,而不仅仅是提供一个简单的技术工具。 如戴科彬所言,目前AI技术在招聘过程中的应用已经进入平稳发展期,多家头部平台已推出相关AI产品。如BOSS直聘就在2023年年报中提到,公司自主研发的招聘行业垂类大语言模型“南北阁”,已通过《生成式人工智能服务管理暂行办法》备案。猎聘在2023年第三季度财报中提到,公司上线了帮助企业端召回适配人才的智能化触达工具“超级聊聊”。今年3月,又上线了多面·Doris。此外,拉勾也上线了大模型HRMind,智联招聘上线了AI易面,58同城推出了AI招聘超人等等。 一位业内人士透露,现阶段AI面试的主要应用场景体现在校招、蓝领工人、销售客服以及外语岗位等,而对于如程序员、设计美工、编辑记者等需要更多创造性思维的职位,AI面试的表现平平。比如光储行业龙头企业阳光电源,去年就决定将所有管培生岗位的英语面试全部使用牛客AI面试完成。 但正如“一个硬币有两面”一样,一件事也存在两面性。在享受AI高效便捷的同时,AI面试的公平性问题也引发担心。 在极端情况下,一个原本就带有性别、地域、年龄等偏见的企业招聘者,很有可能训练出一套带有“就业歧视”的AI,而利用这一算法进行招聘势必会影响招聘的公平性。 在这样的情境之中,AI成了一个放大偏见的工具,也造成了更大范围的“职场伤害”。 因此,相关人士建议,要在AI算法规则中纳入对公平、公正的“红线”。比如,在与使用者互动中,对疑似歧视的使用行为本身进行定义、监测和限制。或者在推荐规则之中,强调实现性别、学历、区域等比例的均衡,最大程度确保每一个求职者都有被看见的机会。 另一方面,在招聘“应试化”的趋势之下,善于做攻略的面试者更容易拿到高分,而一些应聘者有可能因为“准备不充分”甚至是“社恐”而被淘汰,这可能会使招聘单位在识别和选拔人才方面的初衷受到阻碍。 目前看来,AI面试仍需大量数据积累后加以完善。 AI会取代HR吗? 价值星球判断,AI面试官成为未来趋势的可能性相当高。 AI面试系统能够更快的适应企业的用人需求,但也不可能完全取代HR的工作。因为HR最核心的工作是与人打交道,面试者的个性化和职业需求千人千面,只有人与人的深度沟通才能实现隐性信息的传递。 尽管AI面试官在招聘流程中,扮演的角色越来越重要,企业用工需求仍然需要专业HR人士的重度参与和理性判断。 去年年底,在英国举行的“人工智能安全峰会”上,Tesla创始人兼首席执行官、OpenAI联合创始人埃隆·马斯克曾表示,“人工智能将使人类达到‘不需要工作’的地步。” 而从AI在招聘领域的大范围应用来看,确实大大降低了人类的工作量。 去年,58同城推出了智能化的AI面试工具——AI招聘超人。在该产品的发布会上,相关负责人介绍了它的使用场景,在AI招聘超人输入“我要招聘会计”,就能获取相关的岗位面试题,并给出相关技能和反馈参考,供HR参考和使用;而输入“帮我写一份服务员招聘启事”,系统就能结合该行业的特色以及就求职者关注的问题,生成专业的招聘启事。 如此看来,AI招聘甚至可以在某种程度上取代真人HR,甚至有些从业者已经感到了自己职业的危机。 多面·Doris的使用者马丽说,“Doris现在的水平差不多等于一个有两三年经验的HR,但按照现在技术发展的进度,估计很快就能变成五年、十年经验,到那个时候或许真的不需要真人了。” 在马丽供职的企业里,由于人员流动较大,每年需要招聘数百人的电话客服,“按照流程和既定问题面试一个候选人大概要15分钟,然后根据内部打分情况决定是否推进下一步沟通。现在用AI面试官几分钟就可以面试完,而且7*24小时随到随面。相比起来,真人的效率实在是太低了。”马丽说。 图源:pexels 36氪《风向标》去年5月的一份调研显示,75%的受访HR认为,自己的岗位会部分被AI取代;3%的受访HR认为AI会完全取代自己的岗位。 但也有人完全不担心AI的冲击。某大型互联网企业的HR Rebecca透露,自己虽然也使用AI工具作为辅助,但并不担心被AI抢走“饭碗”。因为在面试过程中很多带有逻辑性的问题AI是问不出来的,而且很多人要真的聊了之后才能确认是否合适,AI根本判断不了“气场”这个东西。 她举例说,“我在面试一些高端职位候选人的时候,会追问他的职业规划、职业理想等问题从而判断他们对职位的热情度。有些人真的不是为了收入而跳槽的,他们的真实需求可能多种多样,比如对原企业价值观、企业文化不认同,比如原工作带不来成就感,或者原工作带不来职业技能成长等等。面对这些不确定性的需求,我们HR需要进行甄别判断,了解了他们的真实需求,才有可能在下一步的沟通中抛出具有吸引力的条件,才能发掘和留下合适的高端人才。
AI大模型,正在重塑跨境电商的未来
作者 | 陈珺 编辑 | 韦伯 从ChatGPT到Sora,AI工具的快速迭代,为跨境电商行业带来了更多可能性。 不论是精准营销、智能客服,还是数据分析,或是内容制作,在AI工具加持下,跨境电商的服务效率正在持续提升,与此同时,也为消费者带去了更优质的购物体验。 智能客服机器人可以24小时不间断地为客户提供咨询和解答问题;AI翻译工具使得跨语言沟通和商品展示变得更加容易;而Sora等AI工具或将帮助电商卖家大幅减少内容制作和营销投入,实现降本增效。 在霞光社近期举办的一场线上沙龙活动中,云杉资本合伙人杨瑜、Passioncy创始人兼CEO郭林、Kua.ai创始人龚毅就“Sora将为跨境电商带来哪些影响”进行了讨论。 杨瑜认为,随着素材库的完善和提升,AI工具助力内容生产和传播变得越来越成熟、快捷和低成本;郭林认为,对DTC品牌或原先做供应链、工厂,现在想要升级做品牌的商家来说,AI技术的发展带来了很大机遇;龚毅认为,AI工具具备发展前景的前置条件,是要找到能有效解决问题的应用场景。 图源:Pexels 随着人类大步迈入AI时代,全球跨境电商又将迎来哪些新的机遇? 今年初,OpenAI发布的文生视频大模型Sora,让科技圈为之惊叹。 用户只要输入几行文本指令,Sora就可以输出一段长达60秒的视频,其中对场景的呈现极为细致,几乎可以到达以假乱真的程度,还可以实现多角度镜头的切换。 OpenAI的官网介绍称,Sora 能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。该模型不仅能理解用户在提示中提出的要求,还能理解这些事物在物理世界中是如何存在的。 虽然目前Sora还未正式开放,但不少跨境电商从业者们已经开始尝试借助AI的力量,对跨境电商中的各个环节进行优化。 杨瑜认为,对跨境商家来说,AI带来的红利将主要体现在三个方面,即产品展示、营销,用户体验提升以及内容创新 在产品展示方面,借助Sora,商家可能只需要根据一段产品描述,就能做出吸引人的产品视频。而在过去,如果通过MCN机构或者内部员工来制作相应的内容,至少要花几天时间,一条视频的成本可能达到数千至上万元。 在产品营销方面,借助AI工具,卖家可以更快速便捷地制作符合海外目标市场相应语言、文化的营销素材。一项中文素材内容,通过AI可以一键复制出全球多种语言版本,甚至是一些难以找到合适翻译人选的小语种。 此外,AI工具还有助于用户的购物体验变得更为生动。杨瑜举例说,Sora把在线购物体验提到了一个非常高的维度,将产品特性和使用场景进行了更好的结合,帮助用户更立体地理解产品和购物场景。“这对跨境电商来说能达到更高的转化率,甚至更高的客户满意度,也可以进行更多实时动态调整,不像以前的广告视频拍出来就很难再变化。” 图源:Unsplash 对卖家来说,Sora等AI工具能够激发并支持其在内容创作方面的更多创新。 杨瑜表示,过去大多数情况下,卖家会将内容创作交给有经验的专业人才,虽然自己才是最理解内容传达目标的人,但因为需要投入大量时间、精力,且内容制作存在一定专业门槛,所以卖家参与的主观意愿比较低。 而Sora这样的工具,让卖家可以低门槛地直接使用,通过生成虚拟场景、讲故事的方式呈现产品。“对比以前许多跨境电商比较单一维度的listing,或者纯视频播放模式,是一个很大的变化和颠覆。”杨瑜说。 从以上几个维度来看,杨瑜认为Sora等AI工具为跨境电商行业带来的红利虽然才初见端倪,但趋势已非常明显。随着素材库的完善和提升,AI工具也将助力内容生产和传播变得更为成熟、快捷和低成本。 事实上,不论是在供应链管理、营销推广,或是用户行为和数据分析方面,AI技术近年已开始逐渐应用于跨境电商领域。 杨瑜举例说,目前AI技术在跨境电商行业应用较好的方向,主要有以下几个: 首先,是语言处理和机器翻译。过去,卖家拓展拉美或中东市场难度较高的其中一个原因,是当地语言内容的翻译成本比较高,也需要消耗时间。而现在借助AI工具,一键就能够在不同国家独立站或者当地电商平台同步生成内容,实现内容的快速分发,而不再受限于语言门槛。 其次,在智能客服和用户体验上,AI技术的普及,可能替代跨境电商的传统人工客服,相对来说节省成本,并能做到快速响应。“大部分欧美客户和海外客户,对售后体验和响应度要求很高的,即使不是真人回答,如果能有一个比较好的态度和反馈,总体肯定能提升客户满意度,减少退款。” 图源:Pexels 此外,在数据分析、市场洞察方面,AI的应用能够让卖家同时观测同行的发展情况,替代部分战略分析师的角色,帮助其快速反应。 随着Sora的诞生,未来AI技术或将助力跨境电商迈入一个新的阶段。对跨境电商平台和卖家来说,AI工具如果运用得当,一方面意味着更加高效的内容生产能力,另一方面也意味着同等工作量所需的生产成本的大幅降低。 郭林举例说,利用Sora等工具,小品牌不需花费很多时间和人力,也能做到以前只有大牌才能做的事情。比如制作一部讲述生动、视觉效果贴合本土风格的宣传片,过去可能要砸几万甚至十几万美元,而未来借助Sora等工具,可以很低成本做到同样或者非常近似的效果。 “原来大家要做品牌,可能前期投入就几十万美元,先要把一个大素材库做出来,然后再在各个渠道做各种市场推广。现在有了各类AI工具,成本大幅降低了,关键在于大家知不知道怎样去用这些工具,用不用得起来。”郭林说。 Kua.ai创始人龚毅则认为,目前Sora等AI内容生成工具,距离成熟应用于跨境电商内容制作和营销,还有一些差距。 “跨境电商的内容和营销其实有很复杂的规则。无论是在TikTok、Instagram或是Facebook等平台,视频想要获得流量都需要考虑到多种因素,例如是否蹭到了热点,能够产出晓之以情动之以理的内容,以及账号定位是否准确等。”龚毅说,制作满足这些条件的TOP级视频内容,其实是一项复杂的任务,单纯依靠AI生成视频,很难达到这样的水平。 龚毅认为,想要真正帮助跨境商家达成降本增效的目标,需要以AI工具为基础,有效整合多个环节。例如,通过Sora辅助生成视频空镜,用ChatGPT生成一条故事线,基于AI数据分析和学习生成一个符合账号的定位,其中还需要机器学习各行各业的专业知识。 图源:Unsplash 此外,目前的AI生成工具在信息准确性、品牌一致性,以及是否符合当地市场文化和价值观方面,也还需要人工进行把控,以避免信息错误,或是不恰当价值观表述等引发的舆论风险。 郭林也认为,AI工具应用于跨境电商领域时,对人工运营能力的要求仍然较高,需要从业者对AI有着深刻理解,且能够通过撰写精准的prompt,让AI工具产出符合人脑中设想的统一风格的视频和图片内容。 但目前AI工具的能力,还不足以匹配人们对生成内容的高需求;而人们能够轻松驾驭AI工具的能力,也需要进一步提升。这意味着,AI对跨境电商起到的降本增效效果,未来仍有很大空间有待释放。 全球互联网科技大厂纷纷加码投入AI领域,烧钱换取占位背后,AI工具的商业前景也成为从业者最为关心的话题之一。 而在场景成立的前提下,结合AI工具和其他人工等手段形成链条,解决技术bug,能让Sora或其他AI工具在其中发挥更大价值。 基于AI应用场景,龚毅指出,最近比较火的两个领域都与视频相关。 一类是长视频切短视频的工具,例如可以辅助将YouTube长视频切成YouTube SHOTS,或者放在TikTok上的工具。“在这个场景里面也不存在很明显的技术短板,证明了是可操作的。” 另一类,是部分做商品3D渲染视频的工具。虽然目前在使用过程中还需要一些人工干预,但其可将成本降至原先的约十分之一,成效显著。 杨瑜将AI时代为人类带来的改变,类比于工业革命带来的效率极大提升。虽然以Sora、ChatGPT为代表的AI工具潜力巨大,但距离普及和更好的落地应用,目前差距较大,仍是一个难点。 “毕竟AI是不会为人设定目标的,只能帮助在过程链路里节省时间,快速达成目标。所以什么是好的标准,也得人来定。”杨瑜说,Sora等作为AI的应用工具层,本质上能广泛应用的核心,还是要实现降本增效。 这可能表现为以AI取代部分的人工工作,或是节省更多时间。以跨境电商领域举例来说,以前可能需要六七个小二做店铺上新工作,但在AI工具辅助下只需要一两个小二就可以完成同样工作量;而过去需要花费大量时间和人工广泛收集的素材和文字内容,现在AI工具只需要几分钟就能完成。 AI技术革新,本质上是生产力工具的革新,随着新商业模式的应运而生,背后孕育着新的机会。 图源:Pexels 各类辅助生成文字、图片、视频等内容的AI创作工具,虽然目前还不足以帮助业务形成闭环,但短时间内可以帮助人类获得无数灵感、缩短形成思路的时间,从而快速达成目标。 杨瑜举例说,现在已经有一些AI PPT类应用,可以帮助快速生成文章大纲,甚至给出建议;AI绘画助手,能帮卖家或是有审美天分,但没有闭环能力的用户生成草图,并提供创作灵感,将创意落地;AI视频工具可以处理处理剪辑、字幕和音频,帮助卖家一键打开全球生意……相应的,在各种AI工具加持下,使用者不再需要是一个在执行方面的“全才”,而是只需要明确思路,并通过AI产出最终符合导向的结果。 “在不同场景里,都有可能诞生这种AI工具,我们觉得这可能是一个机会。虽然会有很多公司进来,但最后能沉淀下来的,一定是真正把技术用到帮大部分用户落地,并真正理解用户痛点的。”杨瑜说,这样的AI工具,未来都会有很高的商业价值。对跨境电商来说,可以利用AI技术为每个用户做定制化产品推荐,从而提高销售转化和满意度,只是创业公司仍然需要考虑成本和技术方面的难度。 郭林则认为,市场营销是AI在跨境电商领域最能发挥作用的环节,不仅可以通过优化流程实现降本增效,各个流程的细节中还潜藏着非常多的商业化机会。 “跨境电商的整体销售额很大,但其中可能一半成本都花在了市场营销上,只要稍微优化一下某个环节,就能带来巨大的价值,市场空间是很大的。”郭林说。
国产芯片全部停止自研?华为出手了,任正非宣布大量招揽人才
国产芯片自研在过去几年确实受到了政府的大力支持。 政府把自主创新和芯片研发作为国家战略,号召国内企业加强自主研发能力,把握芯片技术的发展方向,从而实现“芯片出口代替石油出口”的目标。 一、国产芯片的问题 然而,国产芯片自研的进展并不如人意,存在多方面的问题: 1、核心技术短板 国内芯片制造产业整体技术水平与国外存在相当的差距,尤其是在设计和制造工艺等核心技术方面短板较多。 2、资金投入不足 与国外大公司相比,国内大公司的技术储备和生产能力都相对不足,芯片的研发资金相对较少,这将会影响企业芯片研发的进度和水平。 3、生态系统欠缺 芯片的研发不是一项孤立的工作,需要完善的生态系统去支撑。在软件、机器学习、云计算等其它方面的建设,也必须跟上才能形成竞争优势。 综上所述,虽然国家大力支持国产芯片自研,但是现状并不容乐观,需要产业链上下游共同努力推动技术发展和创新。 二、国产芯片的现状 国产芯片自研在技术和市场上与国外相比尚有很大差距与挑战。 1.技术瓶颈 国内芯片企业在设计水平、制造工艺、封装测试等方面与国外芯片巨头相比还有明显差距。 例如,在工艺技术和设计能力上,我国很多芯片制造商还无法满足自己的生产需求,很少有企业可生产出高性能和高稳定性的芯片。 此外,还有部分企业依赖于进口关键元器件和材料,这也制约了芯片的自主研发和成本控制。 2.市场压力 全球芯片市场竞争激烈,中美贸易战以及新冠疫情的影响更是让市场竞争呈现出更加复杂的态势。 我国芯片企业需要在国际市场中立足,但当前技术和品牌的差距让他们显得有些力不从心。 3.风险压力 芯片生产需要投入巨大资金、人力和资源等,收效期较长,风险较高。而我国目前的芯片产业链环节仍大量依赖于国外技术和市场,难以避免一些政治、经济、技术上的风险,这可能导致我们在芯片领域的自给自足依然困难重重。。 随着共享汽车市场泡沫的破裂,许多共享汽车公司因为经济状况每况愈下而无法维持正常的运营。 华为是国内自研芯片的领头羊之一,备受瞩目。华为自研的“麒麟”系列芯片正逐渐走向成熟。 此外,华为还在布局自己的芯片生态系统,在推进自研芯片的同时,将自己的芯片技术与其它技术相结合,不断拓宽芯片产品的应用领域和市场。 华为招揽大量人才的行动,预计将进一步加快华为芯片的自主研发。借助于这些人才,华为有望在进一步提高自己芯片的核心技术、加强技术储备方面取得显著进展。 华为表示未来将继续加大投入,积极研发及生产高端芯片,进一步提升产品技术水平。 经过多年努力,华为的自研芯片已经取得了一定的成果。更重要的是,这也对国内芯片整个行业产生了积极向上的影响。 华为自主研发芯片的长远价值不仅在于满足自身需求,更是为中国芯片产业培养了一支高素质的研发团队,推动整个产业的进步和创新。 总体而言,华为突然宣布大量招揽人才,标志着国产芯片自研仍在持续发展。 三、自主研发才是硬道理 华为的自研成果给国内芯片产业上了一课,并为我们提供了新的思路。华为在自主芯片研发方面取得的成果,无疑是推进国内芯片产业高质量发展的一剂良好的强心针。 首先,通过自主研发,并将芯片技术与其它技术相结合,华为成为了可以提供完整芯片生态系统的厂商,实现了从芯片到终端设备的一站式服务。 其次,华为的自研芯片让我们看到了芯片产业的发展潜力。国家将芯片产业列入支持的重点产业,无论是从技术创新,还是从政策和财政上都出台了大量的支持政策。 最后,华为也展现了芯片自研所需的高质量人才和技术团队。我们也可以从招聘来的人才中看到,华为在人才选择和培养方面的良好经验。这也为国内其它芯片企业提供了参考和借鉴。 结语 随着华为在芯片领域的进一步突破,未来中国芯片的地位有望得到提升和巩固。 芯片产业对于整个国家发展来说至关重要,因此政府、企业和科研机构应该共同努力,加大投入和技术研发。 未来,希望中国芯片产业可以在华为的带领下,不断推动芯片产业提升,实现产业升级趋势,将国内芯片产业的水平推向更高的层次。
AI Agent,垂直AI重塑B2B价值链的关键
本文编译自Sangeet Paul Choudary,其以在平台经济学和网络效应方面的研究而闻名。在本文中,Choudary探讨了垂直 AI 与代理如何重塑 B2B 工作流价值链。在他看来,虽然大多数人工智能炒作都围绕水平 B2C 应用,但真正的机会在于垂直 B2B 人工智能。 Choudary认为,AI Agent创造了一个重新整合场景的可能性。它们使垂直人工智能玩家能够通过跨多个工作流程进行协调来实现水平发展,这将重塑B2B价值链。尤其在医疗保健这样的低互操作性领域,AI初创公司能够通过AI Agent这样的人工智能原生工具,作为新的控制中心来集成不同的工作流程,进而取得主导产业的枢纽地位。 / 01 / 垂直AI的短期和长期博弈 如今,大多数垂直人工智能玩家都专注于通过专有的微调模型和有针对性的用户体验来开发垂直优势。正如我在如何赢得生成人工智能中How to win at Generative AI所解释的那样,这种优势创造了一个飞轮: 与较大的基础模型相比,经过特定领域数据训练的较小模型在延迟、准确性和成本方面有更好的表现。这种垂直化有其自身的强反馈效应,你开发的模型越垂直,你在所有参数上的竞争力就越强。 随着时间的推移,模型微调得越多,未来的用户体验更改应该与模型更加深入地耦合,以便将该模型的优势传递到用户工作流程中。 垂直人工智能玩家的优势在于他们是全栈运营的——也就是说,他们提供跨接口、专有模型和专有数据的完整解决方案。这创造了上述飞轮的护城河不断增强,因为继续拥有该接口的权利赋予了紧密者不断收集专有数据的能力,从而有助于进一步微调模型。 这就是赢得垂直人工智能短期游戏的方法。但这并不能保证长期胜利。 尽管有这个飞轮,所有垂直游戏最终都会参与到别人的生态系统中。这是大量垂直解决方案最终激增的自然结果。最终用户希望通过一两个界面完成工作,而不是针对每个新用例在各个界面之间跳转。 所以,从长远来看,垂直解决方案获胜的唯一方法是横向发展。要理解垂直人工智能的机会,了解过去十年垂直 Saas 的崛起会有所帮助。垂直软件的崛起普遍遵循以下逻辑:1)抓住核心场景实现快速发展;2)围绕核心场景做场景延伸 比如,Square(以支付为起点)、Toast(以 POS 软件为起点)或 ServiceTitan(以估算为起点)等玩家都遵循此策略进行发展。 最终,所有垂直游戏都寻求横向发展。其理由如下: 大多数对现状的“破坏”都是通过深挖细分场景发生的,但大多数风险投资回报都是通过整合实现的,为了大规模获取价值,软件企业需要持续做场景延伸。 正如我在《如何在生成式人工智能中取胜》中所解释的那样: 分拆并不能获取可持续的价值。分拆会取代现有企业,但不会创建可扩展且可防御的价值池。只有通过重新捆绑涉及将多种零散的功能捆绑成一个有凝聚力、以客户为中心的产品,才能够实现价值最大化。最重要的是,在这个过程中,成功的“整合者”建立了中心地位并获得了用户关系的首要地位。 很多风险资本会追逐细分场景的创新者,因为创新者会重构产业链,并参与产业链价值的重新分配。但最终大部分利益都会被少数的“整合者”拿走,因此大多数风险资金将会受到损失。这就是垂直人工智能的最终游戏。 从这个角度上说,人工智能创造了新的场景重塑的可能。在垂直人工智能领域创造长期竞争优势的机会并不在于,深入有效地解决最初的痛点。许多参与者将成功地创建专有的、经过微调的模型来解决这个问题。这是必要的要求,但还不够。 垂直人工智能领域的长期竞争护城河是通过利用人工智能提供的独特价值重塑某个核心场景,围绕核心场景进行延伸。人工智能为场景重塑创造了一个新的可能,而那些能够有效利用它来解决特定场景问题的玩家将是有效主导垂直人工智能的人。 / 02 / 如何用人工智能重塑工作流程 业务工作流程分散在各个孤立的软件中。为了真正完成工作,必须将这些工作流程重新整合以实现业务目标。您获取工作流 X、Y 和 Z 的输出,并做出决策或采取行动以实现目标。这种针对目标的工作流程整合是由人类经理执行的。 组织中的管理者通过解决两个问题来实现这种整合:一是跨场景的工作流程协调;二是使用不同的工作流程来实现组织目标; 在当今的 B2B 工作流程中,组织中的管理资源充当重新整合的位置。但技术正在以两种非常重要的方式改变 B2B 工作流程的格局。 1)互操作性的增强 首先,随着我们越来越多地使用基于 API 的业务功能分发,不同工作流互操作性也会增强。我在DX是新的用户体验中详细解释了这一点中详细解释了这一点:: 业务能力越来越多地通过API开放给外部使用。API 提供了业务流程或功能的接口,同时还定义了参与该接口的契约。 API 是能力可以跨越企业边界流动的管道。随着这些管道的增加,它们为管道工程创造了巨大的机会。不同的管道可以通过创新的业务逻辑连接在一起,以创建全新的工作流程和功能包。因此,我们看到工作流程重新整合发生了两项重要变化。 首先,像 Salesforce 和 Hubspot 这样的公司在工作流程中处于中心位置,可以集成其他参与者以创建无缝集成的工作流程。 其次,IFTTT 和 Zapier 等公司允许用户创建基于 if-then 触发器的工作流程,跨多个工作流程进行组合。这两种解决方案都解决了协调不同工作流程的管道问题。 2)AI Agents的崛起 增强互操作性解决了管道问题,它并没有解决寻求目标的问题。这就是人工智能代理为垂直人工智能创造独特机会的地方。 人工智能代理解决了目标寻求问题。正如我在《人工智能》中解释的那样,人工智能不会吃掉你的工作,但它会吃掉你的薪水: 代理人是追求目标的,这就是他们的不同之处。虽然大多数技术旨在执行任务,但智能体超越任务来完成目标。在公司越来越多地配置 API 来服务关键资源和功能的环境中,代理执行上述三个功能,如下所示: 1)扫描环境:扫描环境,识别可供其使用的资源(包括第三方API)。 2)计划和解构:它将目标计划和解构为组成任务和执行顺序和汇总。 3)执行计划:代理利用可用的资源(包括第三方 API)执行计划以实现目标。 实际上,代理跨 API 重新整合工作流程以实现最终结果。这是一个强大的新性能向量。 垂直人工智能最强大的成果将在高度互操作性的领域中观察到,在这些领域中,复杂且训练有素的代理在开放资源上运行。智能体创建了一个新的重新整合场景。它们使垂直人工智能玩家能够通过跨多个工作流程进行协调来实现水平发展。 这已经发生了。查看 2023 年 3 月发布的关于执行 API 自学习代理 (SLAPA) 的 Twitter 帖子:This is already happening.从 2023 年 3 月开始,请查看有关执行 API 的自学习代理 (SLAPA) 的 Twitter 帖子: / 03 / AI agents的整合能力 大多数软件专注于工作流程中任务的自动化,AI代理将任务重新组合以实现目标。正如我在As I explain in 人工智能代理如何重新构建组织中所解释的那样: 每个目标都是一组任务。管理角色——负责在组织中完成工作——是一系列目标。当技术取代底层任务(下图红框)时,只要目标寻求对角色的绩效至关重要,角色的范围就基本上不受影响。 让我们以旅行计划为例。随着新工具的出现——旅行预订工具、日历管理工具、支付工具等——特定的任务得到简化,甚至被技术取代,但这些任务的目标仍然由人类管理。 人工智能代理则不同,AI agents能够直接实现目标。如果代理收到了某个目标,则该目标不再需要由工作人员执行。实际上,寻求目标的人工智能代理可以将目标与角色分开。人工智能代理创建了一个新的重新捆绑轨迹。 垂直人工智能玩家拥有独特的机会,并且该机会不仅仅限于开发专有的微调模型。这里真正的机会在于,利用人工智能代理作为新的重新捆绑点来集成不同的工作流程并协调工作流程。 / 04 / 垂直人工智能机会:赢家和输家 哪些因素决定垂直人工智能的赢家和输家?垂直人工智能——通过代理利用工作流程重新捆绑——有效地取代了组织环境中的管理资源。 要了解垂直人工智能参与者如何竞争,请考虑决定组织中任何管理资源有效性的因素:1)完成工作所需的管理能力;2)轻松访问完成工作所需的资源。 同样,垂直人工智能能否成功充当重新捆绑点的能力取决于两个关键因素:1)AI 代理的复杂性;2)相关领域中第三方资源的互操作性和开放访问程度。 因此,并非所有垂直行业都同样适合垂直人工智能机会。通过垂直人工智能创造价值的程度取决于特定用例在如下所示的竞争环境中的位置。 垂直人工智能参与者受益于具有高互操作性和高代理复杂度的领域的高重新捆绑优势 。当今大多数行业都在其他三个象限之一中运营,它们缺乏域范围的互操作性和/或代理的复杂性。 鉴于这一现实,一些行业和领域自然会青睐现有企业。在具有高互操作性的领域中,SAAS 运营商已经成功建立了枢纽地位,这种情况很可能发生。相反,垂直人工智能新贵在互操作性较低的领域有更强的切入点。 / 05 / 谁能在B2B工作流程中获胜 起始点位于左下象限,涉及这样一种情况:用户在多个彼此不交互的B2B工作流程中应用管理工作,接口和资源都存在碎片化。 随着域互操作性或代理复杂性的增加,这种碎片化由建立中心位置的特定参与者来解决。 随着互操作性的增强,中心地位是通过 API 集成实现的。随着人工智能代理的复杂性不断提高,该中心地位是通过代理接管管理工作这一事实来实现,因此用户主要通过代理参与工作流程。 最终,这些路径收敛到具有高代理复杂性和高互操作性的最终状态。 现在大多数SAAS公司已经开放 API 的领域已经拥有完善的工作流程中心。Toast、Shopify、Hubspot、Salesforce 等公司成功地确立了自己的中心地位,因为它们周围的各种功能开始以 API 的形式提供。通过获得客户关系的权利和核心数据标识符(例如Salesforce ID)的权利,他们围绕这个核心位置重新捆绑了所有其他工作流程(通过API集成)。 这些现有企业处于有利地位,可以利用其主导的枢纽地位,并在其之上捆绑人工智能代理。代理的所有资源和能力都已经很好地整合到了枢纽位置。客户关系已归工作流中心所有。代理人只是被捆绑到这个职位上以加强现任者的地位。 但这不意味着垂直AI初创公司毫无优势,恰恰相反,垂直人工智能的优势将有利于迄今为止低互操作性领域的初创公司。 在这些领域创建的高级人工智能代理改变了现状。如果这样的代理有效地吸引了客户关系,并且代理越来越多地开始作为工作流程中心运行,那么随着客户关系和工作流程开始围绕人工智能代理进行运营,其他参与者开放 API 并提供其能力和资源的动力就会增加。 例如,考虑像医疗保健这样的行业,其域互操作性非常低。为促进慢性病患者的家庭护理而出现的人工智能代理可能会产生各种参与者向此类代理开放 API 和资源所需的吸引力,以便从家庭护理市场不断增长的需求中受益。 长期来看,垂直人工智能的最终目标是发展水平优势,不是作为水平人工智能,而是作为水平枢纽位置。正如我们上面所看到的,这种枢纽地位最好通过利用代理商来建立。代理提供独特的人工智能原生工具用于重新捆绑。 正如我在As I explain in 如何赢得生成式 AI中所解释的,整体模式是这样的: 步骤 1:利用水平方向实现垂直方向 一系列“初创公司”出现在工作流程层,以垂直化这种水平模型。您需要对垂直客户问题有独特的理解才能从这里开始。 第二步:发展垂直制胜权 开发某种垂直优势(专有的微调模型、对垂直数据集的访问、特定于垂直行业的用户体验优势或上述所有优势的某种组合),并利用该优势将价值拉入垂直行业。您可以通过创建跨模型和工作流程集成的全栈垂直解决方案来建立优势。 第三步:发展横向制胜权 在发展了垂直优势后,极少数在第二步中取得成功的公司将发现自己通过垂直专业化拥有了一个关键控制点——这一优势使他们在该垂直领域获得了用户关系的首要地位。这些少数公司将利用这个新开发的控制点开始“加速”重组。人工智能在此提供的独特优势是使用人工智能代理进行重新捆绑。 第四步:利用垂直方向走向水平方向 随着控制点周围重新捆绑的进展,该玩家现在成为其他玩家连接的枢纽。它成功创建了一个协调多种功能的“顶层”层。随着代理复杂性的提高和域互操作性的提高,该玩家的水平权力就会增加。
吴恩达预言成真?这群AI“员工”狂卷KPI
【新智元导读】吴恩达认为,或许我们凭着GPT-4智能体,早已达到GPT-5。今天,他的话果然言灵了。 最近,一大波智能体的应用诞生,让全行业看到了「新大陆」。 号称世界首个AI工程师Devin,7×24小时不限时打工,能够debug、训模型、构建部署应用程序,胜任各种代码任务。 几天前的谷歌Next大会上,还发布了「智能体构建器」,可以让每个人能够用自然语言构建自己的Agent。 不难看出,智能体不仅将会成为人人可触及的一项技术,而且各行各业都将被不断升级迭代的智能体重塑。 甚至,这场AI技术+场景的爆发,还会诞生出一些「前无古人」的东西。 用大模型+智能体,对抗汽车行业内卷 如今的汽车行业,已经卷到超乎想象的程度。 用户需求的多样化,愈发丰富的触点,都需要业内人士时时翻出创新的水花。 幸运的是,飞速发展的LLM,让任何全新的视角都有了可能。 就拿一辆车的获客场景来说吧。 如今的新媒体,已经成为营销过程中的重要一环。 谁能拥有优质内容,就会拥有最大的曝光度,完成奇迹般的获客KPI。 要知道,传统的4S店,并没有专业的创意内容生产团队,视频制作、账号运营,经常都是销售人员和市场经理兼职完成,效率非常低下。 而这时,就需要非常擅长输出高质量视频、图文、海报的AI登场了! 为此,易慧智能联合推出提出了一个全新的群体智能组织孪生方案。 人类主管来定目标、审结果,而其余的活儿,包括任务分解、任务执行、任务复盘,都可以通通交给智能体! 比如,现在我们要为一个账户定个KPI:一周内涨粉500人。 目标输入系统后,智能体们就开始忙活了。 第一步,运营经理Agent会给自己的AI「同事」们进行任务拆解—— 1. 我们本周需要策划2场直播,把品牌信息传播出去,还要和用户好好互动。 2. 我们需要在抖音、快手、小红书发布5个短视频,提升品牌影响力。 3. 还要保持平台账号的活跃度,及时回复用户评论,增加他们的参与感。 「领命」后,文案策划师Agent和海报设计师Agent,会基于品牌价值观,制作出吸引眼球的文案和海报,同时还会负责传递和交付。 随后,运营专员Agent,就会把内容分发至各个平台了。 在这个过程中,唯一涉及人类的环节,就是市场部经理需要对内容进行人工确认,确保品牌形象的一致性和专业性。 活动结束后,运营经理Agent还会整体来个复盘。它会仔细分析数据,确保创意能带来实际的营销效果,为后续的内容和用户运营提供数据支持。 吴恩达看好的智能体,或许已实现GPT-5 说到智能体,就不得不提到AI大牛吴恩达,最近可谓是多次公开表示非常看好它们的发展: AI Agent工作流将在今年取得重大进步,甚至可能超越下一代「基础模型」。 他发现,基于GPT-3.5的智能体工作流在应用中,实力超越了GPT-4。 也就是,可能我们早就提前到达了GPT-5,因为在GPT-4之上构建的智能体可以实现性能跃阶。 能够取得碾压大模型惊艳效果的智能体,有四种常见的设计模式,即自我反思、工具使用、规划,以及多智能体协作。 智能体关键组件框架|来源:OpenAI科学家Lilian Wang 大模型群体智能 其中的多智能体协作,其实对我们来说并不陌生。 比如斯坦福西部小镇SmallVille,就是基于层次规划的智能体社会小镇,来实现对人类社群行为的可信模拟。 除此之外,清华自然语言处理实验室和面壁智能共同提出的ChatDev,则是基于语言交互的智能体软件开发,实现群体交互协作式任务完成。 对此,吴恩达表示:「让多个协作智能体辩论协作,要比单独使用一个智能体,可以取得更好的性能。」 不仅如此,大量的研究和实践也提到,多个智能体之间可以通过彼此交流、分享信息和策略,甚至进行「辩论」来找到更优、更有效的解决方案。 如今,一场大模型+智能体应用狂潮,即将在汽车这一垂直领域中率先爆发。 车企大模型落地新范式:组织孪生 2023年,易慧智能在走访调研了大量汽车客户后,发现了诸多痛点。比如,行业竞争白热化,降本增效压力巨大;用户媒介触点多样化;购买周期长期化等等。 与此同时,想要在这一领域直接落地传统的大模型应用,则不得不面对信息孤岛、流程复杂、成本控制和市场响应速度等难题。 而前文提到的「群体智能」,恰恰可以利用自身强大的智能协作和信息共享能力,来解决这些问题。 如今,一种基于AI Agent和群体智能技术的全新范式——「组织孪生」正在诞生。 它以数字创新为核心技术框架,主要包含了三个部分:岗位孪生、架构孪生、业务孪生。 更直白地讲,智能体贯穿到了企业整个组织工作流中。 岗位孪生 其中,数字员工是岗位孪生最直接的表现形式。 数字员工可以直接应用到行业链中,比如常见的客户服务、电话销售等等。 利用LLM创建的数字员工,能够模拟真人的交流方式,不仅包括声音、表情,还具备了高情商的智能。 我们都知道,数字员工最大的亮点便是,「工作」不限地点时间,7×24全天候提供及时、高效的服务。 凭借智能体技术,数字虚拟人可以持续学习和进化,能够具备执行任务深度反思的能力,实现在技术和服务水平上不断提升。 除此以外,数字员工可以根据企业需求,进行个性化高度定制。 架构孪生 如上,岗位孪生可以简单理解为,智能体个体在执行自己流程中的任务。 但是,如同人类协作一样,有些任务非一己之力所为,而是需要群体智能体去完成。 这时候,「架构孪生」就上场了。 它是指将真实世界中的组织架构映射到数字世界中,通过智能体网络技术定义智能体间的交流和逻辑。 举个简单例子,清华自然语言处理实验室和面壁智能联合开发的智能体平台AgentVerse中,就可以利用基础模型定制多智能体环境,以及创建刚刚提到的这些具有不同能力与身份的智能体。 其中,协同决策是最重要的一环,需要智能体之间密切交流。 AgentVerse横向沟通模型侧重的是智能体之间相互理解和协作,而纵向沟通更侧重于职责分工。 而基于易慧智能的每个单独场景,智能体之间可以实现横向和纵向沟通。 业务孪生 此外,在汽车行业中,真实的业务流程非常复杂。 就拿出差任务来说,从申请、行程安排、车票酒店预订,到事后报销等等,都需要调配大量人力物力资源。 通过整合大模型、搜索增强(RAG)、智能体构建等技术,业务孪生可实现自动执行任务,优化执行效果。 举个例子,面壁智能的AI智能体框架XAgent创新性引入了「双循环机制」。 在外循环中,XAgent对任务进行规划,在内循环,它便成为任务高效执行者。 另外,XAgent在设计过程中,还引入了专为增强人机协作的交互机制。 可见,这一框架能够为复杂的行业场景,提供一个全新数字化工作和管理方式。 LLM群体智能赋能汽车行业 有了组织孪生新范式,LLM群体智能究竟如何在汽车行业应用中发挥最大效益? 不如就拿车企营销中五大核心场景来举例。 营销五大场景 作为消费领域超级大单品,汽车的营销有着其它消费品难以企及的销售难度和销售周期。 汽车销售中最具独特地方在于,高客单价、低成交率,以及长销售生命周期。 目前,为了应对营销场景中许多困难,提高销量,汽车营销场景也积累了一套标准化、全闭环的方法论。 针对汽车营销环节长久积累的应用实践痛点,以及结合对智能体应用落地的独到理解,易慧智能基于汽车营销的核心场景增长需求,联合推出了五大场景营销解决方案。 它们分别是数智研究院场景解决方案、新媒体运营场景解决方案、用户运营场景解决方案、集约DDC场景解决方案、與情运营场景解决方案。 并且,通过群体智能技术实现汽车营销业务的组织孪生,提高行业效能。 - 集约DDC场景解决方案 汽车营销中,常见的一种模式是DCC,也就是外呼邀约客户。 它对外呼专员的工作繁琐程度、沟通能力要求多且繁杂,成为制约获客转化效率的痛点和难点。 通过对呼叫中心客服进行的组织孪生,利用LLM可以提供及时反馈能力,提升转化效率。 - 用户运营场景解决方案 同时,培育和孵化潜在客户也是一个复杂,但至关重要的环节。 利用群体智能体,可以极大地释放销售人员的客户培育的压力,提高了销售环节转换效率。 比如,在新客孵化过程中,客户分析智能体可以对客户信息的要素进行更加细致地筛选,最终产出值得孵化的客户名单。 - 数智研究院场景解决方案 消费者需求分析,竞品分析报告对于改善运营效率,优化销售和售后流程有着重要的意义。 这时据数智研究院,便可以代替人类去完成某些繁琐任务。 其间,智能体会自动收集全网数据,并对数据进行高效治理和分析,大幅缩短报告生成时间,提高了时效性和准确性。 - 舆情运营场景解决方案 除此以外,舆情对品牌形象和产品销售有着重要的影响。 有了群体智能体,一旦检测到潜在负面舆情,数字员工会直接拉群,立即通知其他员工,一起协作完成难题。 这样一来,群体智能体赋能了汽车行业中完整的营销场景,可以大大实现企业的降本增效。 智能体生态建设 但若要汽车行业实现智能最大化,仅靠一个企业是无法完成的,而需要多方团结协作。 也就是说,我们需要搭建一个「群体智能协作平台」。 这是汽车行业实现「组织孪生」的载体。 其将通用大模型、行业工具、行业解决方案、行业数据伙伴串联在一起,实现技术和能力互补。 那么,在这个群体智能体生态中,车企们如何去选择通用大模型,获取行业数据,如何应用行业工具? 当前,通用大模型遍地都是,难就难在该用哪个?哪个适合自己? 对于企业来说,选择大模型往往需要考虑以下一些因素,包括能否匹配特定需求,集成和兼容问题,成本效率,定制化和可扩展能力等等。 选好大模型,下一个问题便是数据处理和获取问题。 汽车行业中,制造商、供应商、维修服务商之间数据共享不足,导致无法形成完整的数据周期。 甚至,数据的准确性、合规性、隐私性都是亟待解决的问题。 此外,接入行业工具是群体智能技术最重要的一个环节。 汽车行业中的技术工具依然存在API开放性差、安全性差等问题。对此,急需建立一个完善的API开放机制,以及使用规范。 除了技术项的问题,还需要企业对汽车行业业务流程市场环境,以及客户需求有着深入分析。 若想攻克这些难题,实现汽车行业的组织孪生,需要全体生态伙伴不断进步与持续合作。 三巨头强强联合 有了以上对汽车行业的深刻洞察,清华自然语言处理实验室、易慧智能、面壁智能三方共同发布了《大模型驱动的汽车行业群体智能技术白皮书》,受到业内广泛关注。 有趣的是,不仅易慧智能总裁李伟毕业于清华大学自然语言处理实验室,在智能体技术领先的面壁智能也正是由清华孵化的AI公司。作为国内最早研究NLP和大模型的研究团队之一,它的影响力可见一斑。 与此同时,他们在理论和实践上也正巧能力互补。 清华自然语言处理实验室希望进行技术转化;面壁希望大模型和智能体的方案进入更多行业;易慧智能则希望技术与行业场景结合,产生更多客户价值。 于是,一拍即合,决定开启合作。 由此缔造的大模型驱动群体智能协同工作平台,无疑会将企业级AI应用和生态建设带到新的水平,帮企业智能化升级最后一公里。 在这个过程中,三方也是携手攻克了重重难关。 最显而易见的一个难题就是:大模型的幻觉问题,在智能体的应用实践中该怎样避免呢? 来自:「Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Models」 攻克重重难关 这个问题难以避免,但还是有对应的解决之道。 在这方面,清华大学教授刘知远和面壁智能联创李大海都有着丰富的经验。 首先是从模型自身的层面: 比如可以通过预训练和微调,来给模型注入领域知识,从而进行控制。 其次是在Agent的设计上: 在调用工具时,如果发现API或URL是来自幻觉,就中断执行; 设计反思机制,让模型根据出错的信息自行修正结果; 借助外部知识,通过搜索引擎或知识库,引入正确的上下文。 当然,具体落地过程中,还会有其他问题。 如果智能体之间依赖自然语言交互,交互过程就容易失控,这时就需要设计协议或给定workflow,通过Function call等方式指定输出形式。 多智能体系统成本太高,太耗费token怎么办呢? 这时,就需要综合比较workflow设计的灵活性、RAG还是微调模型、各个环节采用什么模型,并且在工程和推理中有更多策略设计。 此外,由于目前的大模型还是黑箱,最终效果难以达到预期时,还需要从算法策略上来调优,而这,就到了考验团队能力和沉淀经验的时候。 业内首份白皮书重磅发布 如今白皮书的发布,对汽车产业的智能化进程,无疑具有重大的指导价值。 对学界而言,白皮书对「大语言模型」「单体智能」「群体智能」等关键技术专题进行了深入、系统的总结和梳理,并且做了案例分析,将对相关研究提供有益参考。 它总结和展望了大模型群体智能在汽车营销领域的应用,这将对汽车行业的智能化转型意义深远。 对于业界而言,它更是首次提出了汽车营销领域的AgentVerse群体智能协同框架。从此,大模型场景化落地便有了标杆。 而这种「人机协作」的新理念,也将人的创意与大模型结合了起来。 对此,三方也非常期待,通过白皮书与业界同仁共同探索和实践,将大模型群体智能的潜力转为现实。 清华大学刘知远教授认为,「我们正步入一个由大模型驱动的「Internet of Agents」智联网时代」。通过白皮书,LLM群体智能的潜力将转化成现实,一同推动汽车行业迎接智能化的挑战和机遇。 面壁智能联创李大海同样看好三方的协力合作:「通过打造的智能体协同平台,为车企们提供群体智能与组织孪生的一站式解决方案」。 在易慧智能总裁李伟的畅想中,在20年后,自动驾驶一定已经走入我们的生活,我们的出行不再需要司机,而是虚拟个人助理和虚拟数字员工团队。 而100年后的某一天,我们大概已经进入「虚拟时代」。那时的人们不会再依赖于出行,而是「身未动,心已远」。
Kimi抢了文心一言和豆包们的故事
近日,Kimi智能助手火了。 一个明显的感知是,最近身边的大学生、职场人士都开始谈论起了Kimi。一位职场宝妈告诉派财经,她最近在尝试用Kimi辅导娃写作业,“真的很方便,都不用下载APP小程序和网页就能打开。” 根据AI产品榜aicpb.com统计,目前国内访问量前十的产品中,Kimi在3月以12.61M的访问量、环比321.58%的增长排在第二,仅次于文心一言。 成立近一年,短短五个月内Kmi的“长文本”输入量提升了10倍。 3月18日下午,月之暗面曾宣布在大模型长上下文窗口技术上取得新的突破,Kimi智能助手支持无损上下文长度从最初的20多万字,扩容到200万字。该消息公布后,Kimi关注度一路走高,一度挤爆了服务器。3月22日,月之暗面回应称,观测到Kimi系统流量持续异常增高,流量增加的趋势远超对资源的预期规划,并表示已经有多项应急措施正在实施,包括已经进行了5次扩容工作。 此前,月之暗面副总裁许欣然在会议室展示了几份用于测试的文件。几十万字的《甄嬛传》剧本,Kimi不仅能够一口气读完,而且还能根据情节准确回答出细节问题,解析人物剧情走向;在迅速学习完头部医学书籍《中医内科学》和《中医诊断学》后,便可化身“老中医”进行在线问诊。 Kimi的成功破圈,让国内一众大模型厂商感到措手不及。 Kimi,真的强吗? Kimi用户体验如何?派财经对Kimi、文心一言、通义千问和豆包做了系列小测试。分别对其资料总结能力、检索能力和创作能力进行了测验。 首先是对资料总结、财报解读能力测试: 派财经随机上传了一份阿里2024财年中期报告pdf,输入解读指令。根据生成内容来看,Kimi和通义千问给出的回答,罗列较为清晰,而文心一言则给出了概况,具体需要进一步指令才能继续解读,豆包给出了核心数据提炼回答。 其次是对用户常用的资料检索和整理功能测试: 派财经以“帮我阅读马斯克最新演讲”为指令,分别询问。根据生成内容来看,Kimi通过对7篇资料检索解读,给出了逻辑明确且详细的观点总结,豆包则直接搜索出了多个相关报道链接,文心一言和通义千问则给出了比较框架性的总结。 值得注意的是,派财经发现在已经创建的Kimi窗口上传完本地文件和网之后,智能助手会自动关闭联网模式,这一功能在其它三个智能助手界面尚未发现。 再是对创作能力,生成脚本等创作力测试: 派财经以“围绕北京文旅为主题,写一个短剧剧本”为指令,分别测试其创作能力。按照给出的基础大纲来看,通义千问、Kimi和豆包给出了较为规范的剧本大纲框架,其中Kimi给出的最为规范且细节,提到角色、场景、地点相对较详细,在取名上也较为文艺。相较之下,文心一言给出的标题则较为直接,未交待剧本角色设定,但在场景、对话和独白上更有“人味”。 综上,在文生文应用上,Kimi的效果确实是看起来更有特色。 谁在为Kimi站台? Kimi智能助手是国内大模型独角兽公司月之暗面面向C端用户推出的一项产品。 月之暗面公司成立于2023年3月,创始人杨植麟毕业于清华,博士毕业于卡内基梅隆大学计算机专业,曾就职于Google Brain和美国初创公司FAIR,师从苹果公司人工智能负责人Ruslan Salakhutdinov,有多年创业经验。 从技术能力上看,Kimi的强大基因最初就已经在创始人身上显现。杨植麟是业内公认的长文本领域专家,在近五年的自研语言处理(NLP)领域影响力颇大。 在读博士期间,杨植麟就以第一作者身份发表 Transformer-XL 和 XLNet 两项工作,在谷歌学术上被引用近两万次,并在多个NLP任务上取得了当时的最佳效果。而Transformer-XL成为首个全面超越 RNN 的注意力语言模型,XLNet则在20项顶级会议中获得最佳论文提名。在华人学者引用排名中,杨植麟的学术论文位居前10,在40岁以下排名第一。 杨植麟的学术研究能力,助力其团队创造了Kimi独特且表现优秀的无损压缩技术。 这种技术可减少参数对存储的需求、推理的算力,以及数据传输的带宽占用,从而高效率无损处理百万级的长Token。而为了快速赶上长文本热潮,其他大厂只能退而求其次,选择检索增强生成RAG技术。 Kimi的无损长上下文窗口的方案,是在逐字阅读全文后给出答案。RAG技术是对全文关键信息进行检索生成答案,但可能会丢失掉部分关键的信息。 这也就解释了为何Kimi的长文本对话回答更准确,在用户体验度上美誉颇多。 但也有小红书博主发笔记表示,在对Kimi的测试中发现,Kimi有一股RAG味。 “月之暗面”这个名字,来源于英国著名摇滚乐队Pink Floyd的专辑《The Dark Side of the Moon》,在科研之外,杨植麟也是一名摇滚发烧友,他曾在乐队中担任鼓手角色。 资本市场众星捧月。创业一年之内,月之暗面就已经完成了两笔融资。最新一轮融资是在今年2月19日,融资额度超10亿美金,投资方包括红杉中国、小红书、美团、阿里,老股东跟投。该笔融资成为国内AI大模型迄今为止单轮融资最高的金额。早在2023年6月,月之暗面就曾获得来自包括红杉中国、真格基金等头部投资公司的3亿美金融资。在两轮融资之后,当前月之暗面估值达到了25亿美元。 Kimi的走火,离不开阿里在底层的算力支持。有消息称,最新10亿美金融资中有8亿美金来自阿里,部分资金以阿里提供的算力折算。当前,Kimi借调了阿里的英伟达(NVDA.O)A800以及A100 GPU处理器的机型进行扩容,未来Kimi算力侧的支持,也将主要来自于阿里。 Kimi抢了文心一言和豆包们的故事 在对AI长文本探索上,Kimi绝对不是第一家,国内大模型头部大厂,百度文心一言、阿里通义千问和360AI早已在做长文本的探索,抖音也在去年年底发力AI工具豆包。 在其他大模型大厂还在卷参数、开源和榜单的时候,Kimi切中了一个更贴近市场刚需的应用场景。将长文本作为标签,通过大量的广告营销和用户口碑,以“长文本”概念迅速占领用户心智。上线之初,就通过突出文本处理字数,为自己贴上了“超大内存”的标签,在PC硬件时代,不少C端用户的认知是,内存越大,处理能力就越强。 在Kimi出圈之前,行业内在C端用户市场教育上,百度的文心一言一家独大,文心一言是大模型厂商中率先向社会全面开放的平台。据相关数据统计,截至2023年9月,百度文心一言App的月活量达到最高峰值710万。不过与Kimi不同的是除了2C之外,文心一言更大的精力放在研发行业大模型,垂直B端应用上。 其次是抖音的豆包在年初的初露头角。依托于抖音的流量转化池,字节跳动旗下的豆包APP在2024年1月活翻了一倍达到了400万。 而新晋“网红”Kimi的走红要更快,据Similarweb数据,Kimi Chat网页端数据最新峰值达34.6万人次。根据AI产品榜,Kimi Chat的2月访问量在国内榜排名第三,2月平均日活同比上升101.9%,全球增速榜排名第一,3月前二周继续攀升。 Kimi上线的时间是2023年10月,当时可以支持无损上下文长度最多为20万汉字。在5个月的时间内,月之暗面直接将长文本能力提高10倍。按照AI领域的计算标准,200万汉字的长度大约为400万token,在全球范围内也属于领先的标准。3月18日,月之暗面宣布在大模型长上下文窗口技术上取得新的突破,其自研的Kimi智能助手已支持200万字超长无损上下文,并于今日开启产品内测。 月之暗面方面表示,如今Kimi能够一口气精读500个甚至数量更多的文件,帮助用户快速分析所有文件的内容,并且支持通过自然语言进行信息查询和筛选,大大提高信息处理效率。 在产品定位上,Kimi足够坚定,面向C端用户,主打长文本。AI搜索+文档总结功能。 Kimi开始就为用户敞开了大门,不仅能从网页端入口进入,还能在APP和小程序端口打开,降低了使用大模型的门槛,这是业内B端大模型厂商无法匹敌的。 在选择早期产品使用者集中在科研、法律、金融、媒体等垂直领域,而这部分垂直领域的KOL为Kimi带来了自然流量与口碑积累。 Kimi在发力营销同时,也有一部分“自来水”自发为Kimi站台推广。 将互联网营销公式带入到了硬科技领域,Kimi的营销开局颇为高调。在月之暗面发布的Kimi上线官宣文标题中提到,“欢迎与Moonshot AI共同开启Looooooooooong LLM时代”,其中英文“long”用了接连十个“o”将Kimi的“长文本能力”直观呈现出来。 Kimi提供的长文本阅读能力和概括能力是两大功能,面向C端用户,致力于为用户打造一个高学习力的免费私人助手。 一份上万字的文献,投喂给Kimi,只需要几分钟就能读完全文并归纳总结出核心论点,极大程度为用户提升了阅读效率。 用户投喂的各种资料又能反哺Kimi的语意语境学习理解能力,从而在不断打磨中提高准确性。值得一提的是,在此类专业语料处理上的进步速度,Kimi甚至快于Open AI。主要由于当前Open AI对于C端用户上传文件仍然有所限制。 如果把Kimi智能助手类比做人类,它的突出之处在于具备较长时间段的记忆力,是一个记性超好的学霸,可以一次记住20万字的上下文,一口气读完一本书或者一系列文章。相较国外综合能力最强的学霸GPT4(可以记住2.5万字)。Kimi的记忆力是GPT4的8倍。 有小红书博主试着通过Kimi智能助手,训练出在自媒体领域现象级创作者咪蒙,将50个文档投喂给Kimi之后,一步步引导其分析咪蒙写作的核心特点以及对待感情态度后,下指令让其生成一篇关于“彩礼”的文章,成稿虽然简短但颇具“咪蒙味”。 在Kimi走火之后,各大模型厂商纷纷“秀肌肉”。 据第三方机构的最新统计数据显示,目前国内已经发布的大型语言模型数量已经超过了300个。这些大型模型的发布主体涵盖了科技巨头、国内顶尖的高等学府、以及各类科研机构,他们在资金投入、资源配置、人才聚集等方面都拥有绝对的优势。 国内互联网大厂火速将相关功能进行了升级,卷起了长文本“长度”。 2023年10月30日,Kimi首发不到一个月,同为清华系校友的王小川的百川智能就推出了单次处理35万汉字的Baichuan2-192K,打破了Kimi的20万字记录,随后,李开复也发布了能够处理40万字的Yi-34B。 在Kimi宣布更新200万字长文档处理能力后,阿里宣布通义千问升级,免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用;随后,百度文心一言、360智脑也都把500万字长文本提上了日程。 目前,大模型最强王者OpenAI的GPT-4 Turbo-128k可处理文本能力约为10万汉字,专攻长本文的Claude3-200K上下文处理能力约为16万汉字。 一时间,各大模型厂商比起了谁更“长”,而文本处理能力越长就能代表能力强吗? 此前,对于文本窗口的长度,杨植麟曾表示,不能只提升窗口,不能只看数字,要看它在这个窗口下能实现的推理能力、the faithfulness的能力(对原始信息的忠实度)、the instruction following的能力(遵循指令的能力)。 长文本能力能帮Kimi造血吗? Kimi火爆的表象之下,一个更为现实的问题暴露无遗,长文本能力能为Kimi造血吗? 根据新浪科技提供的数据,考虑到广告投放和算力成本,Kimi每个获客用户的成本达到12-13元,而按照近一个月将近18000的日均下载量计算,Kimi每日的获客成本高达20万元。而除了每日20万的获客成本外,Kimi需要烧钱的地方还有很多,比如不断提升信息检索能力、遵循复杂指令的能力,推动多模态模型研发,以及实现音频处理等其他需求。 接下来,付出了高额成本,能否将现有用户留住,持续转化将是对Kimi产品的一大考验。为庞大的用户群体提供稳定的服务,同样是一笔不小开支。 长文本能力短期内帮助Kimi出圈,但很难成为其独家技术壁垒。Kimi的长文本处理能力与通义千问、360智脑等AI产品相比,并没有非常明显的优势。 虽然实现造血能力难,但Kimi的C端策略也有一定意义,通过长文本先征服用户,进而让更多B端客户看到大模型底层应用能力的真正价值。 但从整体盈利角度来看,Kimi靠烧钱摸索出的获客模式很容易被复制,对于将业务重心放在B端服务的大厂们来说,获客成本反而是更低的。 行业内多数大模型公司均采取的是2B和2C两条腿走路,通过推出行业大模型直接售卖B端解决方案,或是向公司、开发者售卖API,按照调用次数收费。此外,以文心一言为代表的一种C端打法是,面向C端用户,为会员增值服务,在应用端按月/年向用户收费,当前文心一言扔在试水阶段,而后起之秀Kimi则仍然处于免费模式阶段。 不过,有声音认为,Kimi的出现对于国内大模型市场提供了新的思路,从基础大模型的训练和竞争逐步向更贴近客户的产品功能和细节需求转变。 有业内人士表示,当下这一轮人工智能革命本质上是自然语言处理(NLP)的技术革命,更是一次交互方式的革命。从文本向多模态发展是大模型必经之路。而视频处理需要更大的参数量和存储容量,对算力和算法的要求也更高。接下来Kimi的应用将从单模态,向多模态化发展,即从单一的文本处理基础上,增添声音、图像等信息处理技术。 亦有观点认为,Kimi的出圈意味着在中文领域开启了AI大模型应用元年,长文本时代已至。大模型在实现通往AGI(通用人工智能)路上又近了一步。然而需要厘清的是,长文本能力并非唯一标准,多模态学习、神经网络架构创新、应用落地与生态建设、伦理与道德框架构建等各个维度都不可或缺。 一位初入职场的金融分析师向派财经感叹道,Kimi的强大学习理解能力让人感到威胁,“可能过不了多久,向我这样的初级分析师就要被AI智能助手替代了。”这一担忧并非空穴来凤,在效率至上的资本市场,华尔街有个说法叫“20美金实习生”,时薪20美金的实习生工作未来一段时间大概率会被AI替代。 AI是否会替代职场人?在《所罗门的密码:AI时代的价值、权力与信任》中,作者奥拉夫·格罗思、马克·尼兹伯格曾给出过解释,“最终,问题不在于工作是否会改变,工人是否会被取代。这甚至不需要超级智能就会实现。问题是这些转变将会以多快的速度发生,我们能否跟上它们的步伐,特别是在教育和劳动力培训方面。正如奥莱利媒体公司的创始人兼首席执行官蒂姆·奥莱利(Tim O’Reilly),在他的视频《我们为什么永远不会失业》中所说的那样,我们的办法总比困难多。但是,适应新的工作性质需要发挥想象力并做好准备。”
我是真没想到,高阶智驾都已经比手机还便宜了…
兄弟们,你们能想象现在的智驾有多便宜吗。 没多久之前咱还在说,智能驾驶就是有钱人的玩具。车企随便整俩激光雷达就是两三万实打实的成本,车主选配两三万起步不说,结果还不一定好用。 结果没过多久,智驾硬件的价格就和脖子哥的基金一样,跌成白菜价了。 前一阵,大疆车载发布了自家 ” 成行平台 “ 的几款新产品。其中一个只用摄像头的纯视觉版本,不仅支持高速和城市 NOA 这种高阶功能,而且不依赖高精地图,功耗还贼低,基本啥车套上就能用。 重点是,价格只要不到 7000 块钱,很多车上都有的空气弹簧,差不多就是这个数。 如果我是车企,在能升高降低和高阶智能驾驶相比,我肯定无脑选后者。 但问题就在于,都说便宜没好货,同样是搞的纯视觉智能驾驶,马斯克磨了好几年搞出的 FSD ,现在还得卖大几万。刚量产智驾还没一两年的大疆,硬件便宜就算了,软件还基本不要钱。 它凭啥啊? 结果我正琢磨呢,大疆直接就是一个试驾邀请函的给,行不行的自己来试试。 这我能不去? 毕竟之前试过的大多数智驾,不说都不咋地吧,绝大部分都会时不时抽个风啥的,整的隔壁两三条车道跟着一起紧张,必须时刻盯着。 大疆这套纯视觉方案连激光雷达的深度验证都没有,大概率也是 bug 满天飞,怎么喷它我都想好了。 结果大疆只用了一圈 30 多分钟的试驾,就把我的嘴堵上了。 这次的试驾车其实就是宝骏云朵的灵犀智驾版本,区别在于它把原先车上 32 TOPS 低算力的域控制器拔了下来,插上用了高通 8650 芯片的的 100 TOPS 高算力控制器。 相比目前主流十几个摄像头 + 一两颗激光雷达 + N 个 254 TOPS 英伟达芯片的智驾方案,这套硬件甚至说得上有些寒酸。 但从体验上看,它却是我试过最好用的智驾之一。 试驾的路线,是一条经过深圳闹市区的大环线。全程 30 分钟左右,途中会经过无数个十字路口,包括几个堵车堵到发红的高峰区。 然而一圈下来,我愣是一次都没有接管过。 在比较简单的开阔路段,它的表现其实和别家没啥区别。加减速舒适,不会突然的点头和推背,变道时车内也没有很明显的拉拽感。 但在一些细节上,它就不只是及格这么简单了。 比如在遇到红灯的时候,它会先把车速刹到很低,比如 10kph 以下,然后用很慢的速度挪到靠近前车的位置再彻底刹停。 我对随车的工程师直接就是一个问,他说他们的算法标定是在摄像头正好看不见前车后轮的时候停下,大概就是间隔 3 米的距离。 这个哥们是真心喜欢,因为我平时就是这么开车的。 另一点就是对大车的避让,试驾途中经过了好几个大车密集的路段,每次大车经过或者需要超过大车的时候,车子都会小幅度的打一把方向绕开它。 而且,这个避让的幅度不是固定的,如果相对速度比较大,避让的幅度就会变得很小,甚至会变得很难察觉;如果相对速度比较小,避让的的幅度就会明显变大,有种想远远绕开的社恐感。 成行平台的算法工程师,估计没少看大车的事故集锦。。。 当然相比这些小细节,我觉得它真正封神的地方还是超快的博弈速度。 一点不纠结,贼果断。 经常开车的朋友们都知道,在一个大路口左转的时候,最难搞的就是不知道旁边的车会转到哪个车道。 要是左边的转大点,右边的转小点,那直接就是一个两面包夹芝士,必须频繁微操。 大疆这套智驾神就神在,它基本复刻了我会做的所有操作。 在左边车离得很近的时候,它会稍稍往右边靠靠;靠完以后,还会再根据右边车辆的位置,再往左边调调。 实际的体验就是,我看左边后视镜的时候它在对付左边车,我看右边后视镜的时候它也开始处理右边的车。 人车合一了属于是。 遇到行人横穿马路也是一样,其他家的智驾就是一个素质极高,一定会等在原地让行人先过。过去了还好说,要是行人素质也高打算让车,就会出现两边疯狂互让的情况,谁都过不去。。。 大疆的做法则是,你让我?那我过了。 在遇到的几次行人博弈里,如果遇到行人让车,试驾车都会很果断的加速通过,虽说看着素质没那么高,但通行效率是实打实的提升了。 然后就是我觉得最最最最厉害的地方了:后方来车规避。 试驾途中有这么一个场景,直行车道,左边突然窜出一台横穿的小电驴。这时候一般向右规避就完事对吧,但此时后方还有一辆准备加速通过的公交车,继续变道必然怼上。 这时候一般的智驾就歇菜了,停在原地需要接管,但大疆的决策是停止变道的过程,刹到安全的车速,等公交车通过之后再重新起步。 还有一个我差点就要去二次元的场景。 那时候我们需要去最右边的车道右转,我的注意力放在看它多车道变道的表现上了,完全没看见侧面有一个泥头车也要走这条右转道。 结果应该是从后摄像头里看见了,智驾直接一个大方向把车拉了回来,用很小的缝隙把泥头车让了过去。 随车的工程师一阵夸我胆大心细,其实我是真没看见啊。。。 所以一圈开下来,我会觉得成行这套系统总体来看是有细节、有操作而且表现非常稳定的,如果最后上车全量推送的版本能和这次试驾一个水平,我可能真的会在日常的驾驶里频繁的使用它。 至于为啥大疆能只用几个摄像头和这么点算力搞定高阶智驾,他们在发布会上也大概说了一下,什么算法优化好啦,感知精度高啦,比较玄乎。 里头比较有意思的是一个名叫神经网络轨迹预测的技术,就是高算力域控内置的 Transformer 模型能够根据摄像头看到的运动物体,通过 AI 预测出它的运动轨迹。 然后判断这个未来的轨迹会和行车线有啥冲突的地方,再反过来控制现在的车辆。 就... 见闻色霸气嘛。 不过相比探究他们是怎么实现的,我觉得这次试驾传递的更重要的信息是,之前车企们靠堆硬件、堆算力搞智驾的思路,可能真的错了。 很长时间以来,车企们对于智驾一直都有着很严重的 “ 火力不足恐惧症 ” ,为了尽可能多的收集路面上的信息,各种摄像头、激光雷达必须拉满,像阿维塔,一台车上光是激光雷达就有三颗。 为了设计足够多的规则算法来应对各种棘手的问题,高算力的芯片必须安上;像蔚来, 256 TOPS 算力的英伟达 OrinX 一用就是 4 块。 但其实在许多车型上,有很大一部分算力是被用来 “ 捋清问题是啥 ” 而不是 “ 解决问题 ” 。 举个例子大家就明白了。 在啥传感器都有的车上,激光雷达、摄像头和其他硬件在收集完信息以后,还有个合在一起分析的过程。不仅要把时间轴对齐,保证空间的一致,还得商量好以谁的信息为主。 比如摄像头识别横向移动过程的精准度比各种雷达强很多,而遇到粉尘、雨天等视线不太好的天气激光雷达的效果会更好。 这时就得按照不同情况,让传感器们对齐颗粒度 。 这还只是不同传感器之间的配合,就连摄像头的内部也有很多配合问题需要解决,像是识别本车道目标一般是依靠前视摄像头,如果是识别旁车道目标那就得用侧视摄像头。 要是距离太近,雷达会有回波问题,还得依靠泊车摄像头。 总之就是多传感器算法这玩意,工程师能想到的场景越多,硬件之间配合的规则就越复杂。 而就像电路设计一样,为了确保一个规则能跑通,还得设计一大堆保证它能实现的验证功能。 对于算法能力不太行的车企来说,最后大概率就会变成代码の屎山,导致很多算力被浪费。 算法能力强的最近就开始缓过神来了,屎山越高越大肯定不是事啊。 那与其用上一堆传感器搞得高不成低不就的,还不如老老实实从底层开始做优化和研发,把其中某个传感器的能力拉满。 这样不仅不用这配合那配合的,芯片也用不着那么高算力了,雷达摄像头的钱也能省下不少。 所以像是华为、大疆这些企业,最近就开始用精度更高的视觉信息为主,减少激光雷达的数量或者干脆就不用了。 而且,更低的算力和硬件功耗要求,也意味着更多便宜的车型也能智驾起来了。 就比如大众就表示自家的途观在 2025 年会用上大疆智驾,脖子哥在大众集团内部的朋友也悄咪咪地告诉我,保时捷和奥迪目前也正在考虑采用大疆或者华为的智驾方案。 或许马上,几万块的比亚迪或者五菱宏光就也能高阶智驾了。 这么一想,现在如果还有啥新车还在吹自己激光雷达用得多,那大概率是算法能力不太行,在靠堆料打肿脸充胖子呢。 说的是谁,欢迎兄弟们对号入座。 撰文:致命空枪 编辑:脖子右拧 & 面线 封面:焕妍
巴黎捡到小学生作业系编造,李彦宏称大模型开源意义不大,OPPO引入谷歌大模型,英拟禁止向未成年售手机,这就是今天的其他大新闻
今天是4月12日 农历三月初四 截至目前 魔兽国服回归预约人数 突破 200 万了 大家嘴上说着不玩了 身体还是很诚实嘛 。。。 下面是今天的其他大新闻 # “在巴黎捡到小学生秦朗寒假作业”事件系编造 ( 海报新闻 )此前,有一名千万粉丝博主发布视频称,在法国巴黎捡到两本国内一年级学生的寒假作业,并喊话 “ 一年级八班秦朗 ”。视频发布后,相关话题迅速登上热搜。 近期,公安机关在工作中发现并接到网民举报,有自媒体账号在网络发布一则 “ 在法国巴黎拾到小学生秦朗丢失的作业本 ” 的视频,涉嫌传播网络谣言。公安机关依法开展调查。 经查,为吸粉引流,网民徐某某( 女,29 岁,网名 “ Thurman 猫一杯 ”)与同事薛某( 男,30 岁 )共同策划、编造“拾到小学生秦朗丢失的作业本”系列视频脚本,后网购寒假作业本,用手机自拍、制作相关视频,并散播至多个网络平台,造成恶劣影响。目前,公安机关已依法对徐某某、薛某及二人所在公司作出行政处罚。 :我之前一直以为是真的。。。 # 李彦宏内部讲话曝光:大模型开源意义不大,百度绝不抢开发者饭碗 ( IT 之家 )在内部讲话中,李彦宏对大模型开源与闭源的路线选择以及 AI 创业者应该专注模型还是应用等业界焦点话题,发表了自己的看法。 李彦宏认为,闭源模型在能力上会持续地领先,而不是一时地领先。李彦宏认为,对于 AI 创业者来说,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要非常长时间的坚持才能跑出来。 “ 闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。 ”李彦宏表示。 :通义千问:你是在点我? # OPPO 和一加手机将引入谷歌 Gemini 大模型 ( IT 之家 )谷歌近日举办的 Cloud Next 主题演讲中,宣布和 OPPO、一加公司合作,为其 2024 款手机产品提供 Gemini AI 模型支持。 谷歌在活动中表示通过和 OPPO、一加品牌的合作,进一步在手机领域拓展 Gemini 模型,将现有 Pixel 8、Pixel 8 Pro 上的一些独占功能扩展到两家品牌的手机产品中。 谷歌在活动中透露了一些 AI 相关的功能,包括新闻摘要、录音机摘要以及“AI 工具箱”,此外 OPPO 和一加表示会通过合作进一步探索 AI 技能,包括为社交媒体平台生成内容等。 :OPPO 自己的大模型和 Gemini 比,哪个会更好用? # 英国拟立法禁止向 16 岁以下未成年人出售智能手机 (IT 之家) 4月 12 日消息,英国为了遏制青少年沉迷手机情况,拟立法规范现有销售渠道,明确不得向 16 岁以下未成年人出售智能手机,此举得到了英国大多数家长的支持。 英国政府认为通过禁止向 16 岁以下未成年人出售智能手机,可以进一步保护儿童免受社交媒体的潜在危险以及犯罪、网络欺凌、色情接触和黑客攻击等其他网络威胁。 最近对英格兰 2496 名学龄儿童家长进行的一项调查发现,58% 的家长认为政府应该禁止 16 岁以下儿童使用智能手机。 :各国家长在这方面出奇一致。
沙特的现代版“万里长城”,要缩水了…
还记得沙特王子本 · 萨勒曼,之前钦点的新未来城( NEOM )计划么。。。 可能有不少差友都忘了它有多上头,里面最大的一个项目,就是在沙漠里,建个现代版的万里长城( The Line )。 它计划全长170 公里,能解决900 万人的吃喝拉撒,还配上了超高速交通,大半个小时就能跑个来回。 而且整座城还全方位接入了 AI ,干啥都是智能的。 这还不算啥, NEOM 城里的各种技术,看得也是让人血脉喷张。有会自动调节温度的城市、解决通勤的飞行出租车、甚至还有能随时下雨的 “ Cloud Seeding ” 。 为了建成这座城,他们从 2017 年就开始搞,还说要在8 年内,投入5000 亿美元。 有科幻建筑和砸重金这两个大 BUFF , NEOM 在全球都已经是出了名的,反正在国内,它时不时就会被拉出来讨论一番。 然而,就这么一个明星级的大项目,最近却有点要缩水的迹象。 前两天,彭博社曝出了条消息,说 The Line 内部有施工队开始裁员。 而且在项目书上,他们还悄悄把 2030 年的目标改成了2.4 公里,容纳人数也从原来的150 万降到 30 万以下。 一下子缩水这么多,不少网友都坐不住了。有人开始猜测,会不会下一步就要烂尾跑路,还有网友阴阳怪气说, “ 从 The Line ( 线 )变成 The Dot ( 点 )了 ” 。 咱们也趁热乎劲,挖了挖 NEOM 的近况,发现其实它倒是挺活跃的,没大家说的烂尾那么夸张,但确实遇到了一些问题。 首先,这些年来, NEOM 的各种新建项目,还有合作和投资,就没怎么断过。 像是前两周,官网就刚官宣了个度假酒店的项目,整个建筑要架在海洋和沙漠上边,中间还连着一条 450 米长的游泳池。 还有年初,说要建一个在半山腰上的酒店,旁边是 450 米高的悬崖,脚底下就是海,讲究一个有山有水。而且这个酒店还贼隐蔽,进去不仅得走地下运河通道,还得再来个 100 米的垂直体验。 类似自动驾驶、飞行汽车,还有各种环保可持续项目的合作和投资, NEOM 也没少拉。光去年一年,它投资合作的项目就有六个。 而且去年年底,世超还看到咱中建七局中标了 NEOM 项目。 纸面上的东西确实是不少,但一看现在建造的进度,只能说他们在拖延这块儿,跟世超写稿有的一拼。 待建清单越来越长,里面的实际在造的,就没几个,很多建筑从头到尾就只有官网的一张图。 而且,其他项目没啥进展咱都能忍,最开始就大吹特吹的重头戏:The Line ,这几年的施工进度也是一拖再拖。 原本的计划是,在2025 年,就完成第一阶段的目标,从第 44 公里开始建,建 5 公里。 后面可能觉得时间有点紧张,就再多给了 5 年,到 2030 年造好 5 公里。 这次直接又把 5 公里的目标对半砍,也就是说,十多年,他们就只造两公里多。 况且这么些年来,官方统共就发过两次有关 The Line 项目的视频。世超也翻来看了下,说实话,视频里看真没看到啥进度,顶多算是两个宣传片里,夹了几秒现场施工的照片。 去年十月份的,目测还在打地基的阶段。。。 就给出的这些信息来看,很难不让人怀疑这是一张能把人噎死的大饼。 更离谱的是,沙特阿拉伯造 NEOM 城,最大的困难竟然还是钱! 作为 “ 石油爹 ” ,说缺钱,恐怕连办公室的火锅都不会信。。。 但世超查了下,发现他们压根儿就没想全掏自己的钱。 NEOM 第一阶段的计划是,沙特主权基金( PIF )会出一半的钱,然后政府再出四分之一,剩下的就全靠拉投资。 当时他们宣布这些出资结构时,还专门把像 Ray Dalio ( 桥水基金创始人 )和 Alwaleed bin Talal ( 沙特一个巨有钱的企业家 )这样的顶级豪绅邀请到了现场,官网上,投资入口也被摆在最显眼的位置上。 好家伙,小心思是全写脸上了。。。但想归想,实际搞得话就是另外一回事了。 虽然 PIF 的资产有近万亿,但手里的现金储备却少得可怜,连最新季度给 NEOM 的出资,到现在还没给批复。 另外一边, NEOM 自己的 IPO 也不如预期,原本计划今年的上市,大概率也凉了。。。 看他们自家都紧巴成这样,别的投资者就更不敢往里面投钱了。The Line 的建造进度也因此一拖再拖。 要我说, NEOM 项目筹不到什么钱还真是有原因的。 一方面,明眼人都能看出,他们整出来的这些构想,很多都是脑袋一热想出来的,可行性太低。 另一方面, NEOM 身上的 “ 黑料 ” 也是满天飞。 建筑主打的环保可持续,就有很多让人诟病的地方,它的零排放方案,具体能不能实现还是个未知数呢。 而且看着 The Line 宣传图里,那两面超长的镜面墙,不少人已经开始担心光污染和鸟撞问题了,而且 500 米的高度,还会对两侧的自然生态系统流动造成影响。 还有最常见的隐私问题, The Line 打着智慧城市的名头,可以说是被监控百分百覆盖了,一旦有啥数据安全问题,个人的隐私就全都不保。 总的来看,就目前这架势,咱也别奢望沙特能建成整座 NEOM 了,能建成规划里的一小半,就谢天谢帝了。。。 哦对了,听说 NEOM 现在为了筹钱拉投资,都开始路演了,下周就来中国。 世超倒是挺好奇,他们这回会画什么大饼给咱们吃。 撰文:松鼠 编辑:江江 封面:焕妍 图片、资料来源: X,NEOM官网 Bloomberg,Saudi Crown Prince MBS’s $100 Billion Foreign Investment Quest Falters WSJ,A Prince’s $500 Billion Desert Dream: Flying Cars, Robot Dinosaurs and a Giant Artificial Moon 36氪出海,沙特没钱建NEOM未来城?远不至于此
曝谷歌AI最高主管想离职!组织人才冲突不断,对超过OpenAI感到无望
编译 | 长颈鹿 编辑 | 李水青 智东西4月12日报道,据外媒The Information报道,谷歌DeepMind CEO的杰米斯·哈萨比斯(Demis Hassabis)曝出已对谷歌推动AI商业化的新举措感到失望,并认为谷歌的产品可能很难赶上OpenAI的Sora。 一年前,谷歌仓促地将DeepMind和谷歌大脑两个实验室合并成谷歌DeepMind,由哈萨比斯领导。然而两个实验室合并后冲突不断,哈萨比斯在与其他领导者的合作上面临着重重困难。 消息人士称,哈萨比斯几个月前将两部门的合作限制了在Gemini项目上,这或许因为无意义的组织沟通让他沮丧;与此同时,精英员工频繁被挖走也是让哈萨比斯头疼的事情。 据曝料,哈萨比斯在谷歌AI部门与DeepMind合并前曾考虑离开谷歌,转而成立一个数十亿美元的新研究实验室。如果一系列问题得不到解决,这位谷歌AI总舵手会不会真的离开谷歌创业?引起产业的关注。 一、谷歌大脑与Deepmind合并一年:组织动荡冲突不断 谷歌仍未完全消除过去阻碍其AI工作的不和谐因素。哈萨比斯的DeepMind部门长期以来一直与公司内部的另一个AI实验室谷歌大脑存在冲突。一年前,谷歌匆忙将这两个实验室合并为一个,但它们之间的矛盾却未消减。 长期以来,谷歌一直运营着两个世界上最重要的机器学习团队。Google Brain是构建语言模型方面的先驱,它还发明了Transformer技术,OpenAI的ChatGPT就是在这项技术基础上完成的。与此同时,DeepMind构建了能够在象棋和围棋等游戏中取得优势的AI。但这两个团队经常在共享代码和计算资源等方面发生冲突。虽然OpenAI的ChatGPT借鉴了谷歌的Transformer技术,但他们都没有发布像ChatGPT那样能够引起互联网轰动的产品。 因此,OpenAI聊天机器人发布后几周内,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)指示谷歌大脑和DeepMind的高管们合作开发一个AI模型Gemini,他希望两个团队能够“同仇敌忾”而不是各自为战。 但合作并没有让两个AI团队突然变得和平,即使合并后,新的AI团队有时仍会因资源问题发生冲突。谷歌将AGI(人工通用智能)的探索性研究工作中的员工分流到Gemini的研发团队中。据内部人员透露,谷歌为了Gemini项目完全关闭了一些AI工作,Gemini项目员工目前已增加了约1000人。 巨大的内部调整使不断变化科研方向的员工们渐渐滋生了幻灭感。 二、哈萨比斯的两难:困于无意义组织沟通,为人才流失头疼 据The Information报道,哈萨比斯对于谷歌新的AI方向和计划感到不适,他认为自己很难适应新的现实。 DeepMind曾经在谷歌内部以独立方式运作,使每一位员工可以一心一意地从事AI的技术研究,而不必担心AI成果的商业化问题。但是现在,哈萨比斯面临着技术商业化的压力,他必须抽出时间与其他领导者更紧密地合作,将DeepMind的技术转化为产品。据最近几个月与哈萨比斯交谈过的两位人士称,这种态势让他深感沮丧。 谷歌对于技术商业化的第一步对准了合并谷歌的两个AI部门,但哈萨比斯似乎也对此举并不兴奋。 哈萨比斯在大会后告诉一位同事,他不确定自己是否愿意领导合并后的部门,或者说,他想考虑离开谷歌并成立一个约数十亿美元的新研究实验室。他认为这会带来一个全新的开始,从而摆脱“无意义”且浪费时间的组织沟通。但是DeepMind发言人卡尔却在一次声明中否认这两个消息。 据参加某内部会议的三位人士称,哈萨比斯在会议上的表现还是让人留下了他对合并AI部门淡漠的印象。据其中一人说,就在几个月前,哈萨比斯还努力的将两个部门的合作限制在Gemini项目上。 与此同时,精英员工频繁被挖走是另一个让哈萨比斯头疼的事情。 一个事实是,OpenAI持续高薪邀请并聘用谷歌的AI成员,AI团队存在着项目负责人大量离职的情况。媒体们也抓住了这些离职事件大肆宣传。据一位最近与哈萨比斯交谈过的人士透露,他曾抱怨谷歌的薪酬制度并不能够留住AI研究人员。但好在谷歌重视了这个建议,此后提高了对DeepMind研究人员的薪酬,还动用了一个特殊的股票池。 接踵而来的各类问题让哈萨比斯压力巨大,但是纽约大学一位心理学教授马库斯判断称,如果有人有能力把新事物塑造成想要的样子,那很可能就是哈萨比斯。但谷歌也是一家大公司,因此压力是存在的。 三、Gemini:最新多模态大模型陷入争议,AI团队骨干离散严重 3月初,哈萨比斯在经历了几周的挫折之后,试图带头振作团队的精神。据相关人员的人透露,哈萨比斯告诉他的员工,谷歌全体员工需要更好地沟通,以避免发生技术失误。 这是因为,谷歌当时发布了一款采用了哈萨比斯团队的技术聊天机器人Gemini,也是谷歌认为可以赶超OpenAI的ChatGPT的最佳机会。测评人员称,Gemini模型声称能实时响应语音提示,但实际上它是在延迟状态下运行的,其产出的视频演示具有误导性。此外,Gemini还因带有种族主义的回答以及夸大其词的功能介绍而招致嘲笑。这可能是因为,展示AI进展的压力导致哈萨比斯的团队夸大了产品的工作能力。 不过最近,哈萨比斯进行了一些组织变革,以恢复谷歌AI研究的影响力。今年3月,哈萨比斯调整了内部管理团队,让更多的研究主管可以直接与他联系。现在谷歌负责不同领域AI研究的高管都直接向他汇报工作。 哈萨比斯拥有击败OpenAI所需的一切要素,他麾下有许多世界顶尖的机器学习研究人员。而且,他还在监督一个团队将DeepMind的科学进步整合到新产品Gemini中。截至三月,有36人直接监督Gemini的开发(已有两名人员辞职)。 ▲36人直接监督开发Gemini(来源:The Information) 谷歌在思考新的AI产品。Gemini项目中现在有一个专门的团队在研究代理,即可以自动执行计算机任务的软件。据一位参与该项目的人士透露,团队接连失去许多资深研究员,但也同时增添了许多有实力的新面孔。 哈萨比斯坚持认为AGI(人工通用智能)离他们并不远,是超越OpenAI的一个方向。为了更好地衡量实现其长期目标的进展情况,DeepMind的研究人员正在开发专门针对AGI的新基准。工作人员还希望Gemini能帮助他们完成另一项任务:提出新的方法和算法,以改进他们的研究。 DeepMind因Gemini的发布缩小了与OpenAI在技术上的差距,但并没有消除这种差距。虽然Gemini的某些表现要好于OpenAI的GPT-4,但OpenAI的模型早在几个月前就已经问世。哈萨比斯认为谷歌要想赶超OpenAI的AI视频服务Sora尤其困难。(另外,谷歌上周表示,如果OpenAI使用谷歌旗下的视频网站来训练Sora,将违反YouTube的规定) 结语:AI总舵手曝异心,谷歌DeepMind承压 谷歌AI团队合并后各种问题接踵而来,但合并前两个部门已拥有庞大的数据中心网络和数十亿产品用户,在AI产品的推广比同行容易得多。因此,谷歌还没有真正意义上的遇到了解决不了的困难。 哈萨比斯虽然对谷歌各类新举措和突发状况感到不满,但他仍未放弃探索超越竞争对手OpenAI。可惜的事实是,OpenAI的AI技术已研制出众多令业界惊叹的成果,谷歌却在一些基础问题上兜圈子。哈萨比斯是一个坚韧的人,平衡技术研究和公司规划知识一个时间问题。我们可以期待他带领的新谷歌AI团队为谷歌产品提供新动力,为AI未来提供新思考。
狂飙500天,国产大模型如何突破商业化之困?
作者 | 香草 编辑 | 漠影 大模型加速狂飙,AI商业化却面临巨大鸿沟。 一方面,传统企业不知道怎么将AI融入原始业务,另一方面,AI企业难以找到合适的变现方式。AI企业究竟该如何突破商业化之困?B端和C端,呈现出两种不同的路径。 纵观海外的AI玩家,已经有许多企业闯出自己的商业化道路。B端如微软、Salesforce,将AI技术集成到传统产品中并提供垂直定制服务;C端如OpenAI、Midjourney,向个人用户提供生产力解放工具,并以付费订阅模式变现。 而国内虽然起步较晚,但仍有不少企业在积极探索商业化路径,百度、阿里、字节跳动、360、讯飞等公司都在进行相关尝试。如百度在C端打造生产力工具,推出文心一言订阅模式,B端提供底层架构、解决方案;360在C端借助浏览器在PC端的场景优势,发力AI办公,B端聚焦AI安全和知识管理等场景,在ToC、ToB两端入手,寻找大模型的商业价值;讯飞则试图将大模型与自身硬件产品进行结合。 具体来看,大模型落地难在哪里?AI技术商业化道路还面临什么样的困境?国内外头部玩家是如何探索大模型变现,走出自己的差异化路径的?通过典型案例分析,智东西试图寻找这些问题的答案。 一、AI技术面临商业化鸿沟,传统企业与大模型企业“隔岸相望” “百模大战”狂飙一年多,国内早已不缺乏能比肩GPT-4的大模型,但在商业化落地层面,始终存在巨大鸿沟。 如今,除了“卷”模型以外,AI企业也开始将目光投向“卷”应用。 知名AI科学家吴恩达在今年1月的CES上谈道,作为新一代通用技术,即使AI无法继续取得技术和新进展,其商业基础也将持续壮大。 ▲吴恩达 根据人民网财经研究院3月发布的大模型产业发展报告,我国AI大模型产业呈现蓬勃发展的态势,但仍面临多方面挑战,大模型爆款应用尚未出现。 究其原因,主要在于企业尚未找到商业化思路,缺乏满足客户需求的个性化应用。 阿里前首席AI科学家贾扬清近期在一次高山书院的活动中,谈到目前大模型商业化落地过程中,市场的两个纠结点:一是营收的流向和以往不太一样,二是大模型对比传统软件,可以创造营收的时间太短。 大模型有一个特点,每次训练完一个模型后,下一次还是要从零开始训练。但同时大模型的迭代速度又很快,中间能够赚钱的时间窗口可能只有一年左右甚至更短。 具体到B端和C端,商业化面临的困境也各不相同。在B端,传统企业在采用AI技术时需要考虑ROI(投资回报率)、数据安全性等,此外将AI融入以往的工作流程以及后续维护都有较高成本。 在C端,普通消费者对AI产品的付费意愿上涨,但营收难以覆盖大模型训练和运行的高昂成本。此外,许多企业往往过于关注AI技术本身,而忽视了对消费市场的开拓和消费者需求的挖掘。 这就造成了一种进退两难的局面:大模型企业赚不到钱,传统企业找不到拥抱AI的路径,普通消费者又难以找到满足自己需求的AI应用。需求错配之下,如何找到“交集”是横亘在各家公司面前最迫切寻求的答案。 二、抓住C端用户个性化痛点,AI办公成为重点场景 它山之石可以攻玉,本文将从海外头部玩家的玩法入手,分析大模型的变现手段有哪些。 根据风险投资机构a16z于3月发布的生成式AI消费级应用Top100报告,ChatGPT仍是C端应用顶流,在网页端和移动端均排名第一,且访问量分别是第二名的5倍和2.5倍。 综合这份榜单,海外用户基数较大且已有较为成熟商业模式的C端AI产品包括聊天机器人ChatGPT、Gemini、Character AI,AI搜索平台Perplexity,图像生成/设计工具Midjourney、Firefly AI等。 ▲海外C端AI产品商业化案例 在商业模式上,这些产品大多采用月度订阅模式,其中Firefly AI同时提供点数购买制服务。 从应用场景来看,当前海外AI应用仍以通用场景为主,主要集中在聊天机器人及衍生的AI虚拟陪伴等领域,同类型产品同质竞争较为激烈。但与此同时,融合具体场景如图像设计、视频生成、办公助手等的工具类应用也逐渐涌现。 其中,AI+办公产品作为解放生产力的工具,在头部企业中加速商业化落地。微软、谷歌在去年3月、5月先后推出AI办公产品Microsoft 365 Copilot和Duet AI,体现了其对AI办公方向商业化价值的看重。 ▲谷歌、微软AI办公产品搜索指数(图源:广发证券) 国内也有一些企业积极探索C端大模型商业化落地。参考海外成熟模式最典型的是360,其选取的路径和微软Copliot、Salesforce等一样,都是在既有优势场景下进行AI化升级改造。 4月8日,360周鸿祎透露“360AI办公”产品即将上线,将AI与浏览器相结合,提供图片、写作、文档、视频、文档模板五大明星场景共100多款实用工具,旨在一站式解决多行业、多场景的AI办公和营销需求,为用户提供极大的便利性,同时也提高了用户对360AI浏览器的依赖度。 在商业化模式上,该服务将采用会员付费订阅模式,用户通过注册成为“360AI大会员”后,可以解锁并使用全部的AI办公工具。这种模式将带来持续的收入流,有助于建立长期客户关系。 在现有场景下进行AI化改造有两大优势:一方面,这更符合用户习惯,降低了用户的学习和迁移成本;另一方面,PC浏览器与办公场景天然契合,是一种全新而又务实的探索,更容易撬动付费意愿更高的办公场景。 AI办公场景的商业化价值在于提高工作效率、降低成本、增强用户体验和满足多样化的办公需求。360AI浏览器提供的AI办公工具集通过智能化大幅提高工作效率,直接转化为个人生产力。 同时,360安全浏览器在国内市场占有率第一,这为360AI浏览器的推广提供了强大的用户基础。利用这一优势,360可以通过浏览器推广AI办公服务,进一步扩大其在AI领域的市场份额,具备更高的成功性。 据介绍,360AI浏览器背后有5个场景模型,通过多个专业模型进行协作、组合工作,就能在合适的场景里把它的长处发挥到极致。 在通用聊天机器人赛道,月之暗面的Kimi智能助手在上个月推出200万字长文本功能后月访问量暴增至1219万,彰显了其技术领先性及其市场策略与用户需求的精准对接。 ▲Kimi智能助手近3个月访问量(图源:SimilarWeb) 不过,使用量的暴增也带来了算力困境。Kimi爆火后,不少用户反映时常宕机、出现大模型“说胡话”的Bug,类似的情况在OpenAI去年11月发布最新模型GPT-4 Turbo后也出现过。大模型算力成本一直居高不下,如何摊薄成本、减轻计算负担是AI厂商和云厂商共同面临的难题。 在聊天机器人衍生出的AI虚拟陪伴赛道,MiniMax的星野抓住了以国产乙女游戏用户群为核心的市场需求,还增设了抽卡系统,基于沉浸感衍生出交易体系,在聊天对话的基础上为产品带来增值收费点。 三、大模型垂直定制成为ToB赛道关键解法 与C端相比,大模型在B端的商业化进程对数据安全、部署成本等提出更多要求,同时具有高度的行业专业性和定制化需求,企业需要的是能够深入理解并解决行业特定问题的解决方案。这要求大模型不仅要有强大的通用能力,还需要能够针对特定行业进行定制化和优化。 下表列举了海外科技巨头、企业服务巨头以及AI巨头在B端的AI产品商业化案例。 其中,微软以订阅模式提供面向办公场景的365 Copilot服务,AWS(亚马逊云科技)聚焦于大模型托管服务,SaaS头部企业Salesforce和SAP则将AI技术融入企业服务产品中,OpenAI通过出售大模型API来获取收入。 ▲海外B端AI产品商业化案例 可以看出,将AI技术与原本的软件服务、云服务等传统产品相结合,并基于企业数据提供垂直定制能力,成为B端AI商业化的一大路径。 国内AI企业的ToB业务其实起步较早,以“AI四小龙”为例,其早期业务靠面向政府部门的G端起家,在大模型起飞之际也长期靠B端、G端业务存活。如商汤科技通过大装置+大模型”的深度协同,推动了自身“日日新SenseNova”大模型体系的迭代,业务板块覆盖智慧商业、智慧生活、智能汽车和智能城市。 在企业级市场,能否找到商业化路径的核心是深刻的用户洞察,背后则是在服务客户的过程中积累的经验。据周鸿祎说,360经过服务100多家客户,形成了对ToB市场深刻的需求分析,一个典型的场景便是“知识管理”——在企业内部推动知识对齐,从而保证大模型不会杜撰或产生幻觉。 周鸿祎谈道,企业做大模型需要两个基础设施:知识中枢和情报中枢,分别对应内部知识和外部知识。垂直场景加上专有知识,能够形成知识的闭环,并且持续优化企业大模型。360构建了一套知识中枢架构方案,将这4类知识收集起来,分析之后建立起一个内部的知识中枢。 ▲360知识中枢架构方案 基于这一方案,360为某大学进行了电子图书馆智能化改造,通过导入、分析、整理海量异构文档资料,实现不受页数、大小限制的文档秒级反馈,原始图文与生成内容的对比查看,并且学过的内容可以作为师生知识库沉淀,用于智能写作。 也有企业选择与OpenAI类似的道路,通过售卖大模型API接口变现。以智谱AI、百川智能为例,虽然都提供开源模型,但也都在探索商业化路径。 在上月的媒体沟通会上,智谱AI透露目前的商业模式可划分为四种:API调用、云端私有化、本地私有化以及软硬结合一体机。 百川智能目前主要是计费模式,提供通用大模型、角色大模型、知识库等API接口,按token数收费。 结语:群雄逐鹿大模型,AI商业化初现曙光 随着大模型技术的崛起,AI行业迎来了群雄逐鹿的时代。企业们在B端和C端市场中探索多样化的商业化路径,从垂直定制服务到个性化订阅模式,不断尝试和突破。尽管挑战重重,但随着技术的深入和市场的适应,AI商业化已初现曙光,预示着一个充满机遇和创新的新纪元即将到来。
这个不讲“道德”的网站,成了千万网友最爱的白嫖工具
老差友应该都知道互联网档案馆(下称 archive.org ),咱介绍好几次了。 还不知道的兄弟自己找找原因,是不是不够帅,没早关注帅逼公众号:差评。 archive.org 由 Brewster Kahle 创办,是一个非营利性的数字图书馆。 从 1996 年起,它每隔一会就会抓取各种各样的网页、视频、图片等资料,保存在 “ 图书馆 ” 。 目前图书馆里存了 8660 亿个网页,1200 万个视频,490 万张图片和 110 万个软件程序。 点进网站,从 MJ 演唱会视频,到 1999 年测试版的 Google 搜索页面,再到你多年前送给凤姐的表白,都会重新进入你的世界。 不过,今天故事的主角不是这位,而是另一个档案馆 archive.today (今日档案 )。 archive.today 于 2012 年创办。从名字和功能上看,它类似于archive.org ,可以备份网页。 但它俩之间还是有个很大区别—— archive.org 类似于搜索引擎,绝大多数资料都是爬虫自动抓取的。所以一直以来他们都遵守 robot.txt 。 robot.txt 是互联网里通行的一个君子协议。通过它,网站可以告诉搜索引擎,哪些东西它不能抓。百度里搜不到微信文章和淘宝商品,就是因为 robot.txt 。 但 archive.today 不遵守这个协议,即便网站不让它存,它也会霸王硬上弓。 不过,这也不能说 archive.today 缺德。 因为它并非自动抓取别人的网站,只有用户上传某个网页时,它才会抓取。 存档 ing..... ▼ 目前,archive.today 已经存储了 5 亿个网页。虽然远不及 archive.org ,但这种大家主动寻求备份的网页,相对来说,它的意义和价值会更大点。 就像三年前,有位吴彦祖备份了差评的官网,明显是肯定了咱们,咳咳。 除了可以备份网页,因为技术上一些细节,人们发现 archive.today 有另外一个妙用: 翻越付费墙。 对于那些订阅费动辄几百美刀的西方媒体,很多第三方世界国家的读者不光无力支付,甚至压根没有匹配的支付方式。 但自从这个功能被发现后, archive.today 成为了大家心照不宣的 “ 白嫖 ” 工具。 只要有好心人存档了付费文章和有版权的学术论文,后来的读者都可以看到。 还有不少人基于这个网站做了一些小工具,让白嫖变得更简单。 编辑部偶尔也用过它,有一些东西在这上面确实比较好找。 虽然 archive.today 管理员曾说过,翻阅付费墙不是网站本意,只是技术问题上产生的一些 “ 意外 ” 。 但想到他愿意冒着被诉讼风险默许这个情况存在,甚至教读者一些白嫖技巧。。。 差评君更愿意相信,他就是一个知识自由的支持者。 根据网站里问答纪录,2013 年的时候,存储这些档案每月要在服务器上花 300 欧元。 2014 年,随着网页越来越多,服务器成本升到了 2000 美元 / 月。 2016 年,这个数字涨到了 4000 美元。 那问题来了,这些服务器的钱谁出呢? 我们知道,archive.org 的背后是一家组织,总部在旧金山。它的年度预算有 1000 万美元,这些钱来自于它的合作赞助商和基金会。 但 archive.today 管理员说,这个网站全靠自己。 尽管网页在移动端开始投放广告,并且管理员也开放了捐赠通道,但这些只够 14% ~ 20% 的成本。 也就是说这个网站的管理员,每天在面临版权诉讼的风险下,既要维护网站日常运营,还有隔三差五回答网友各种问题,最后每个月还得掏出几千美金的服务器租金,只为维持这么一个免费网站? 并一路坚持了十多年? 这个赛博菩萨到底是谁啊? 报以好奇和敬意差评君去网上搜了一下,但发现 archive.today 的背后,是一个迷。 维基百科上关于经营者的身份,只写了一句话: 事实上,没人知道他的真实身份。 半年前一位悉尼的工程师 Jani 花了很大精力,想看看 archive.today 幕后神秘人到底是谁。 首先,网站能追溯到的第一个历史纪录是在 2012 年 5 月 16 日,网站一开始的域名叫 archive.is。 由一个来自捷克布拉格,名叫 “ Denis Petrov ” 的人注册。 Denis Petrov ,是第一个线索。 但随着调查, Jani 察觉 Denis Petrov 可能是假名。 一来这是很常见俄罗斯名字,光是在领英里就有 242 个同名好哥们。 二来 Jani 发现同样的名字和联系方式还注册了一堆乱七八糟的域名。 后来 Jani 还验证了很多带有这个名字的网站,如 denispetrov.com、denis.biz 、petrov.net。 但大部分网站都已经停运了,唯一能打开的那个,只是一位纽约程序员的博客,早在 2011 年就已停更了。 Denis Petrov 这个线索似乎断了。。。 和 Jani 一样,这些年也有其他网友探索过这位神秘人,但大多数人都停在了 “ Denis Petrov ” 的阶段。 倒是 2020 年,有另一个网友找到了神秘人的重要线索。 他发现 archive.today 里所有领英网的备份,都基于同一个登录账户。 这里我解释一下,诸如领英、 Instagram 这类应用,都要求登录账号后才能浏览详情。我猜测神秘人是用了自己账号 cookie ,来抓取领英的网页内容。 顺着线索,他找到了一个名为 Masha Rabinovich 的领英账号。账号显示,她有德国柏林某个大学的学士学位。 如果这个头像确实是本人,那说起来你可能不信,这个神秘人居然是一个留着波波头,有点娃娃脸的女生。 手动码一下 另外这个头像应该被删了,登录后就不可见 ▼ 有人把 Masha Rabinovich 放进谷歌搜索,发现了一个 2012 年帖子,基本实锤 Masha Rabinovich 就是那个神秘人。 当时一位昵称为 masharabinovich 用户发帖子,吐槽自己网站 archive.today 被恶意举报,进了黑名单。 既然名字 “ 确认 ” 了,接下来就是网友们发挥福尔摩斯天赋的时候了。 他们发现 Masha Rabinovich 曾多次参与了维基词条的编辑,最多的就是 “ 俄罗斯护照 ” ; 名字中的 “ Masha ” ( Маша )是玛丽亚的常见俄语说法, Rabinovich 是德国犹太人的姓氏; 另外 archive.today 用的分析引擎是俄国的,回答问题时会使用一些大写词汇,可能有德国背景。 基于这些信息,网友推断出,神秘人大概是一个曾在德国留学的俄罗斯人,且学识渊博,英语流利。 至于“ Masha Rabinovich ”,还不一定是其真名。也许和 Denis Petrov 一样,只是神秘人在网络世界的马甲之一。 虽然大家仍无法确定神秘人真实身份,但差评君觉得点到为止,他隐藏起来一定有自己的原因。 相比起来,我认为神秘人的个性更值得一提。 在 archive.today 的网站上,有一个基于 Tumblr 问答服务的页面。 通过这些 Q&A ,我推断神秘人是一个偏执且不喜欢被吹捧的技术极客。 首先就是我们前面说的,不遵守 robot.txt 。 其实这是个非常激进的行为,很容易被以版权法提起诉讼,或者在道德上落下风。 像 archive.org 后来也推出了手动备份的功能,但用户上传网页后,它还会检查一遍 robot.txt ,如果网站不同意被抓取, archive.org 还是会删除的。 但 archive.today 可不管这些。 我觉得这么做,是因为他创建网站的初衷就是尊重历史,保存历史。 他也说过,网站即便存档了假新闻,也不会删除。 因为 archive.today 从来不是权威的参考来源,而是历史的见证。它只是在告诉大家,在某个时刻,互联网上某一处存在过这样的页面。 这一点差评君也认可,历史不是纪录大事记就够了,它是由无数细节拼凑起来才够完整。 虽然 archive.today 看似有点极端,但也不是所有网页都一视同仁。如果存档确认为恐怖分子的宣传网页、儿童色情等,收到举报后他也会删除。 另外神秘人很低调,从不希望自己被抬得很高。 当网友把他和 archive.org 放在一起夸奖时,他都会否定,说自己没有想保存整个互联网的目标,目前只有 archive.org 的百分之一,且运作方式不同。 差评君觉得,这是每一个老板都要学习的不画大饼精神。 他知道自己一个人 / 团队的能力有限,做不到那么宏大的目标,一开始就没设想过这么多。 但 12 年了,网站帮大家存档了五亿多个网页,遇到了无数难题,并依旧坚持免费。 我觉得他和 archive.org 一样,都是令人尊敬的。 不过最近的情况,让差评君觉得网站的生存环境不容乐观。 因为神秘人回答网友问题的频率明显变低了,从两年前月均回答 40 个问题,到现在隔了好几个月才回答 2 个问题。 他也曾说网站经常被 DDOS ,时不时瘫痪。在互联网各个角落也有 “ 版权仇家 ” 在搜寻他的真实信息。至于诉讼,那也是迟早的事情。 结合历史来看,这种情况其实是必然的。 所有支持知识自由的网站,从archive.org 到 Sci-hub ,他们都遭遇过版权法的铁拳或者域名的封锁。 互联网档案馆因为把 140 万实体书扫描出来,不限量租借给读者,被四家出版商联合起诉,还有六千名作家签了请愿书支持这场诉讼。 Sci-hub 因为把 8000 多万学术论文爬取下来,免费分享给所有学者,在多个国家被出版巨头起诉。创始人 Alexandra Elbakyan 为了躲避各国引渡风险,在世界各地躲藏。 我知道,有很多人都抵制他们这种行为,认为盗版就是犯罪,不是解决问题的方式。 但世界不是非黑即白, “ 盗版 ” 就一定不被提倡吗? 这个问题几十年来一直争论不休。 90 年代,互联网上各种盗版电影和音乐横飞、破解和盗版软件横行。明明是赤裸裸的侵权,但却没有明确的法律能治一波乱象。 在这样的背景下,《 数字千年法案 》登场了。它以刑事犯罪立法的形式,希望在网络这块无主之地上,重振版权保护的权威。 毫无疑问,它保护了无数原创者的权利,让人们获得了相应的回报,也让他们的心血没有被盗版商肆意践踏。 可《 数字千年法案 》在保护版权的同时,似乎也催产了一些版权流氓到处碰瓷,让很大一批人也难以接触到优秀的作品。 如何做到版权和知识自由兼顾,很难很难。 “ 科学和教育资源,就不应该有所谓的知识产权和资本运作的存在 ” 这是 Sci-hub 传达的理念之一。 从 archive.org 到 Sci-hub 再到 archive.today ,他们把无法翻越的信息壁垒,难以打破的知识桎梏,都变成一个简单的回车键,让我们看到了世界的另外一种可能。 不管怎么说—— Brewster Kahle 、 Alexandra Elbakyan 、神秘人以及所有那些不追求利益去捍卫知识自由的人,他们都值得我们的尊重和敬佩。 撰文:刺猬 编辑:莽山烙铁头 面线 封面:焕妍
这个爆火的 AI 硬件遭首批用户大量差评,Ai Pin 把亮点做成了最大的槽点
Ai Pin 的第一批用户拿到了他们的新玩具。 自从在 MWC 2024(世界移动通信大会)亮相后,标榜要做「AI 时代的 iPhone」的 Ai Pin 终于发货,第一时间上手的外媒也抱着极大的热情和好奇,全方位体验了这款「奇葩」产品。 大家都对 Ai Pin 有着高度一致的评价: 设备做工精良,不愧是苹果前工程师的作品; 看上去比图片里的要小,佩戴很方便,有多个模块可选; 拍照质量不错; 实时翻译很好用,译文挺准确。 但如果你想知道 Ai Pin 是否值得购买,所有人也都会异口同声的叫醒你:NO 过于简陋,没多大用处。——WIRED 我真正可以依靠 Ai Pin 做的唯一一件事就是告诉我时间。——The Verge 本该是亮点的交互,成了最大缺陷 不得不先承认一点,Humane(Ai Pin 母公司)试图打造一个颠覆传统人机交互的新世界。 不管是去年的线上发布会,还是今年 MWC 的现场演示,Ai Pin 的四种核心交互方式——「语音」「触摸」「手势」「投射」——真的挺酷,还没有谁敢如此大胆激进地在一个消费级产品上,做出这样的尝试。 Ai Pin 做了,出风头了,也出问题了。 当中被诟病最多的是「手势交互」,在宣传片上手势导航本是最令人印象深刻的功能之一,和投射功能相互配合使用,很多媒体反应刚拿到的时候会被这项功能所吸引,能感到信息在指尖被拿捏。 手势导航本应该很聪明,需要准确识别用户的手势动作,比如华为 Mate 系类上的隔空手势,可以看到上翻、下翻、握拳等动作变化。 Ai Pin 对手部识别的原理类似,但它有点儿过于灵敏,甚至有些敏感。设备投射出来的内容,使手只能在特定范围内活动,加上屏幕选项之间的间距很小,手的幅度稍微大一点,就很容易跳过目标选项,点到旁边。 想做到 Humane 工作人员在现场展示的那样娴熟,甚至有点运筹帷幄的感觉,需要掌握好手势的幅度和分寸感,很像把乒乓球放在球拍上保持平衡不掉下来的感觉,要保持平衡,也要注意动作的分寸。 Engadget 反应说,哪怕习惯了这种「微操」,轻松做到指哪打哪,但在手掌来回晃动时,又会导致 Ai Pin 来回晃动,激光投射也会跟着一起摇摆。 平均而言,输入解锁设备的四位数 Pin 码,大约需要五秒钟。 你可以通过训练形成交互的肌肉记忆,但投射出来的内容又会给你带来另一个麻烦:激光墨水屏,水平有点低。 激光墨水显示屏是 Humane 另一项开创性的技术,它可以将绿色光线投射到用户的掌心,手势交互的基础也源于此。 它的好处是能与手做互动,但最麻烦的也是只能与手做互动。激光只可以投射在掌心,不能将显示内容投影到桌子或者墙上。 拿着手机滚动浏览 Instagram 可能会很累,但至少您可以将其放在桌子上并继续浏览。 但是在 Ai Pin 上,如果你的手臂没有抬起,你就看不到任何东西。 激光墨水屏的第二个缺陷是投射距离固定,使用者要尽可能地保持身体和手掌的相对静止,并且多次尝试手掌的位置以获得最佳的投影效果。这一切都会因为你的任何一次重新佩戴,而全盘重来。 而且,即使你真的能通过训练「稳如泰山」地解决上述问题,那么显示内容过小过少的问题,阁下又会如何应对? 事实上,Ai Pin 投射出来的是一块比较小的画布,Engadget 记者实测,每次大概能看到 7 行文本,每行大约有 1~3 个单词。 这意味着阅读长文本时,使用者必须将手举得更久,直到通知滚到底部。 更有意思的是,这块「较小的」投射屏幕是相对的,在 WIRED 记者 Julian 的文章里没有被提及,原因是她手比较大。 关于投射屏的最后一个缺陷,几乎出现在所有的测评文章里:无法在阳光下使用。 激光投影亮度不足以击败太阳。在评测之前,Ai Pin 只在 TED Talk 舞台和室内会议摊位等较暗的环境中公开演示过,因此激光投影在阳光直射下的表现如何是尚未解答的最大问题。——ZDNET 当你在阳光下时,投影仪基本上无法读取。——《华盛顿邮报》 走出去,您将很难阅读微弱的投影。即使在纽约阴雨天,我也几乎看不清手上的字。」——Engadget 除非你在强光下,它就几乎看不见了。」——The Verge 不知道 Humane 的产品经理看到这些反馈会作何感想,起码从目前对 Ai Pin 的了解看,这大概率是一款在户外使用频率更高的「智能产品」,但是种种原因又使得它没法在门外起作用。 在 Ai Pin 的宣传里,去屏化是一个核心概念,但目前好像它还处于「如去」的阶段——既不属于现在,也不属于未来。 不太聪明的 Ai Pin,让你也变得有点傻 Humane 将 Ai Pin 定义为人们的「第二大脑」,通过硬件和人、和周围环境的创新交互,来获得类似智能手机的体验。 可是量产后的 Ai Pin,并没有坐实智能设备的标签,甚至很像一款半成品。 The Verge 的 David Pierce 发现,虽然 Ai Pin 可以用语音做备忘录,创建待办事项,但它无法设置闹钟或计时器,也无法将事件添加到日历中。 =这么多语音助手的问题是它们能做的事情不多,而 Ai Pin 能做的事情就更少了。 好笑的是,本应该在物体识别功能上大显身手的 Ai Pin,却在所有人的手里跌了个大跟头。 WIRED 的记者 Julian Chokkattu 反应,Ai Pin 的准确性有待考量:它错误地将「高果糖玉米糖浆」判断为被加州禁止的甜味剂,但在去年加州禁止的四种甜味剂中,没有一种是高果糖玉米糖浆。 而且对街景的识别也时常与事实不符。虽然 Ai Pin 中内置了 GPS 芯片,但向它咨询附近餐厅地点时,经常会没有响应,哪怕站在标志性建筑的面前问询「这是哪里」,它也很有可能会给出错误答案。 有时候他甚至会出现幻觉。Inverse 记者使用 Ai Pin 描述以下画面: Ai Pin 的回答是: 一个男人坐在灰色的椅子上,右边的桌子上放着一把绿色的扫帚。他穿着红、白、黑格子衬衫、蓝色牛仔裤和棕色鞋子。他低头看着手里的手机。他右边的圆桌上有一张白色的纸。背景的白色桌子上有一台灰色的 iMac 电脑。背景中还有两把白色椅子。 图片中男人的衬衫上没有黑色,背景中只有一把白色椅子。 反应速度是 Ai Pin 的另一个大的扣分项,相应速度,对于 AI 能否与消费者产生共鸣至关重要,许多时候我们心中的「智能」,往往都来源于即问即答,如此才能反映出 AI 的无所不知、无所不晓。 可不知为什么,Ai Pin 竟然在响应速度上,做出了妥协。 实话讲,Ai Pin 的语音交互启用极大缩短了人们检索信息的流程:手指一碰问题一提,等待答案即可。这种「一步」的简单检索,正是 AI 时代想要拥有的去 App 化、去第三方化,和 AIGC 的聊天框,既是 Google 搜索框,又是 B 站搜索栏,还能是淘宝的识图入口。 但就连「今天天气怎么样?」这种甚至不需要 LLM 参与的问题,Ai Pin 都让你等待 6 秒多。 这些问题可能来自大模型幻觉、服务器问题等,虽然日后会得到改善,但对于一个想要走向大众的产品,这只会成为用户不买单的理由,也会让人工智能再次被嘲笑成「人工低能」。 你应该只购买当前的产品,而不是他们承诺的未来产品。 Ai Pin 的不聪明,配合上超前的交互方式,也会让你在户外使用它时,成为一个「愚蠢的显眼包」。 当有社交信息发来时,你需要把手摆在合适的位置,并且挥动手掌来导航页面,甚至要做出一些类似于结印的手势才能选择。 当你想要了解目的地信息,需要在人群中清晰地说出疑问,碰到网络不好或者设备罢工的情况,你还得再重复几次。 Humane 渴望通过 Ai Pin 提早将未来设备带到现在,但没能把以往产品的智能体验成功整合到其身上,它们反而搞砸了当下。 重走 Google 死胡同 具有讽刺意味的是,购买 699 美元的具有类似手机功能的设备,并支付 24 美元每月的人性化订阅计划,目的是减少使用手机。 总得来讲,Ai Pin 目前给人的感觉是:花钱受罪。 The Verge 对 Ai Pin 的评分为 4/10,Engadget 的评分为 5/10,CNET 甚至没有将其评论称为「评论」,因为他们觉得 Ai Pin 还没做完。 它有的功能手机几乎都有,不用额外花钱;它没的体验手机也有,还更好用。 所以相互抵消下,用 699 美元(约合人民币 5058 元)买来一块在阳光下看不见的墨水屏,一个对手势严苛的交互设备,一个反应迟钝的智慧识屏软件,一个用一会儿就会发烫的暖胸宝,并不是一笔划算的买卖。 以上,还是在没有提及 Ai Pin 隐私和安全性争议情况下,所遇到的「技术性问题」。要知道,智能手机发展了 10 余年,到今天还会受到这些话题的挑战。 因此,Ai Pin 距离真正成为 Humane 所希望的那个「环境计算可穿戴设备」,可能还需要数月甚至数年的时间,现在的 AI Pin「只是一个 party 上的话题」。 实际上,Humane 有着「王炸般」的开局: Ai Pin 的市场亮相正值智能手机热潮的低谷与人工智能热潮的波峰交汇之时; 公司创始人 Bethany Bongiorno 和 Imran Chaudhri 曾在苹果公司任职,Chaudhri 还参与设计了初代 iPhone; 公司最大股东是 ChatGPT 之父 Sam Altman; 未正式发布就被《时代》选为「2023 年度发明」的产品。 Ai Pin 几乎集齐了所有成功的要素,赶上时代风口,被风口的投资人看中,有世界顶尖的设计师,拥有先进的产品概念,可是当这位「天才选手」正式向我们走来时,为何又会变得如此糟糕? 2012 年的 Google I/O 大会,Google Glass 正式发布。 一推出,Google Glass 就被定义为:影响未来十年科技走向的产品。 它可以显示天气、消息、电话等信息,用来拍照、录视频、导航,或者唤起 Google Assistant 回答你的疑问, 三年后,Google Glass 正式宣告停产。 设备隐私性堪忧、高昂的价格以及实际使用中的局限性等等问题,使得 Google Glass 最终未能广泛普及,这场科技圈的美梦,最终成了白日梦。 当人们从兴奋的情绪里走出来,重新理性地审视这个「天才少年」,不难发现任何一台比他便宜数倍的人们智能手机都能完全胜任它的功能,对比之下,Google Glass 的缺陷也瞬间显现:功能稀少、性能羸弱、造型夸张、续航拉垮。 Ai Pin 满足以上所有的要素,Humane 只是走进了 Google 曾经来过的那条死胡同。 事后根据外媒爆料,Google X 团队和营销团队早就清楚 Google Glass 还是个半成品,还存在许多的漏洞和问题有待解决,不适合向公众曝光。 我们不清楚 Humane 是否清楚这一切,但是打一出生,它们就把 Ai Pin 放在了很高的位置上。 理念过于超前,要把人们从屏幕中解放出来,回归到当下的生活,一意孤行地取消本地 App,也不管如今人们到底有多需要这些软件,甚至放出「做 AI 时代的 iPhone」的豪言壮语。 然而当人们拿到 Ai Pin 的那一刻,不难发现这些头衔、定义的「雷声」很大,但给到用户体验的「雨点」很小,和曾经差点开启 10 年科技走向的 Google Glass,并无区别。 不过,相比于成为历史的 Google Glass ,Ai Pin 仍有希望。 它的样子讨喜,继承了苹果设计的优秀基因,在大模型的加持下,实时翻译等实用功能获得了不错的评价,更重要的是,Humane 团队对自家产品,有比较清晰的定位。 看完全文你或许会发现一个细节,Ai Pin 的「i」没有大写, 创始人 Bongiorno 解释说「这表明我们正处于人工智能的早期阶段。显然,Ai Pin 还有很长的路要走。」 也许在未来的某一天,Ai Pin 会被重新定义,但是看完首批用户的反馈后,感觉这个未来还很遥远。
国人换机周期拉长!苹果、三星下调手机全年出货预期
原标题:国人换机周期拉长!苹果、三星下调手机全年出货预期:高端机受青睐因耐用 快科技4月12日消息,根据最新的供应链消息显示,智能手机行业仍处于下行周期,尽管大家期待的换机潮尚未到来。 消息透露,手机品牌纷纷下调了全年出货预期。除了苹果已经确定下调了2024年的全年出货预期外,三星电子也做出了相应的调整。 研究机构TechInsights预测,到2023年,全球智能手机的换机周期将延长至历史上最长的51个月。在中国,消费者的换机速度稍有增加,但仍超过40个月。 由于用户换机速度的降低,市场竞争进一步加剧。与此同时,消费者的观念也在发生转变,他们更加看重手机的耐用性和实用性,而不仅仅是追求更快的换机速度,比如iPhone。 专家指出,消费者的购买预期已经转向更长时间的使用期,因此他们更愿意为性能优越、耐用的手机支付更高的价格。 在市场日益饱和的情况下,手机厂商不断努力提升产品质量,并通过提高价格获取更高的利润。 在这种情况下,消费者和厂商之间形成了“双向奔赴”的态势,导致消费者难以找到更换手机的理由,从而导致换机周期进一步延长。 在这一大背景下,更依赖线下渠道的手机厂商也面临着更大的竞争压力。那些无法获取足够利润的经销商可能会转向头部阵营,与消费者一样。
苹果 M4 芯片曝光,Mac 年底全线化身AI Mac?
发力 AI 提振销量 微软前脚刚说要在 Arm 上击败 M3 MacBook Air,后脚就传出苹果 M4 处理器要专注于人工智能了。 科技记者 Mark Gurman 最新报道称,苹果的 M4 芯片接近量产,会专注提高 AI 性能,预计 2024 年底,我们就能见到搭载这款芯片的 Mac 新品。 Mac 全线升级 M4 Mark Gurman 指出, M4 芯片将会覆盖整个 Mac 产品线。 第一批 M4 Mac 产品将会在今年年底到明年年初陆续上线,包括新的 iMac、基础版 14 英寸 MacBook Pro、高端款 14 英寸和 16 英寸 MacBook Pro,以及 Mac mini。 2025 年,这些 Mac 新品也会陆续上线:春季更新 13 英寸和 15 英寸的 MacBook Air,年中更新 Mac Studio,晚些时候更新 Mac Pro。 对于搭载苹果 M 系芯片的 MacBook Air 系列来说,这很可能是时隔最短的更新,前三款的发布时间,都各自相隔一年。 搭载 M3 处理器的 MacBook Air 而对于 Mac mini 、Mac Pro 和 Mac Studio 来说,将于明年发布的 M4 款是一代「跨代」更新,因为这三种设备的在售的最新款,依旧搭载的是 M2 系列的芯片。 不过,Mark Gurman 表示,苹果在同时测试搭载 M3 系列和 M4 系列芯片的 Mac Studio,因此不确定苹果还会不会在今年推出一款 M3 台式机产品。 据透露 M4 芯片有三个版本:代号为 Donan 的入门级版本、代号为 Brava 的加强版本以及代号为 Hidra 的高端版本。 Donan 将会用于入门级 MacBook Pro、MacBook Air 系列与低端版本的 Mac mini,Brava 芯片将用于高端 MacBook Pro 和 Mac mini,而 Mac Studio 测试的是 Brava 的改款。 Hidra 芯片则为 Mac Pro 设计,并且据悉会「加强」Mac Pro 的性能。据报道,Mac Pro 的销量在 Mac 产品线中较低,客户也向苹果抱怨其搭载的芯片规格。 Mac Pro 苹果还计划升级高端 Mac 台式机的内存至 512 GB,目前 Mac Studio 和 Mac Pro 都只支持最高 192 GB 的统一内存,远低于旧英特尔型号最高支持的 1.5 TB。 此前 MacRumors 也分析称,苹果的芯片合作伙伴台积电,预计于 2025 年下半年开始生产 2nm 工艺的芯片,因此 M4 芯片很可能继续和 M3 一样保持 3nm 工艺,有一定概率采用台积电增强版 3nm 工艺,性能和功效预计会提升。 一大波「AI Mac」即将袭来? 如果说 2024 年科技关键词,「AI」绝对是最多人提到的。不仅仅 AI 大模型和机器人继续发展,各硬件厂商都在争相推出 AI 硬件:AI 手机、AI PC,甚至 AI 智能家居...... 因此,当 Gurman 提到 M4 处理器将会突出 AI 性能时,其实没有让人感到太意外。 PC 阵营都在争相布局「AI PC」,特别是微软已经携手高通「宣战」苹果:骁龙 X Elite 的强大性能将会极大推动 Windows on Arm 的发展,搭载这款处理器的 Arm Surface 产品将击败 M3 Macbook Air。 苹果自然也不会在 AI 布局中落后,被微软宣战的 M3 MacBook Air 正是苹果第一款被正式打上「AI」标签的 Mac 产品,被苹果称为「世界上最好的消费者 AI 笔记本」。 并且,苹果今年也多次主动表示和被报道在 AI 上持续投入,即将到来的 iOS 18 和 macOS 15 预计将会非常「AI」,因此 M4 系列芯片突出 AI 性能也是可以预见的。 今年早些时候,经济日报报道,新的 M4 芯片将明显增加 AI 运算核心数及效能,NPU 数量或显著增加。 想要扭转局势,苹果要「挤爆牙膏」 目前为止的 2024 年对苹果来说绝对不是好过的一年。 被欧盟穷追不舍,取消了造车计划,产品出货量也不如以往。新款 M3 MacBook Air 上架一个月,就在海外亚马逊上打折 100 美元,全球 PC 市场萎靡,MacBook 也不能幸免。 彭博社报道,截至本周周三收盘,今年苹果股价已下降 13%。 因此在今年就推出 M4 芯片 Mac,还将为全系更新芯片,很可能就是苹果为了刺激 Mac 产品线的销量。 M3 芯片较小的提升幅度一定程度也影响了 Mac 的吸引力,不少网友称 M3 「挤牙膏」,M3 Mac 产品介绍页面的数据大部分都与 M1 比较,或多或少也暗示了 M3 对比上一代 M2 提升幅度不大。 而逐渐赶上的 Windows on Arm 阵营,预计也会给 Mac 系列进一步施压。 如果 M4 被委以提振 Mac 销量的任务,苹果这次要舍得「挤爆牙膏」,好好提升 Mac 产品性能和产品力才行,AI 或许也是一个不错的破局点。
为什么iPhone充电速度那么慢:原来有这四点原因
iPhone是全球最受欢迎的手机之一,不过,其身上也有不少槽点,除了信号问题外,快充恐怕也是很多用户难以忍受的缺点。那么,苹果为啥坚持用祖传的20W充电器?最高25W的充电速度实在不够看啊。对此,有媒体进行了分析,认为主要有以下4点原因: 1、削减成本。功率更高的充电器在研发和材料成本上都会更高,如果随机附赠,苹果更接受不了这样的“不环保”行为。 2、减少发热。安卓手机普遍采用高电流低电压的快充方案,虽然对电池本身不会造成太大的影响,但是功率越高意味着充电过程中会产生更高的发热,这个不可忽视的风险让苹果对快充保持谨慎态度。 3、20W在很多苹果用户眼中没有那么慢。20W这个数字听起来确实很低,尤其相比安卓动不动三位数的功率,但在许多苹果用户眼中,它的速度并没有那么慢。而且,iPhone电池容量的设计没有安卓手机那么激进,从长远的角度来看,苹果可能更愿意依赖小的电池容量维持现在的续航能力,随后适度提升充电功率。 4、苹果的生态布局。在苹果未来的生态布局中,有线充电很有可能会被iPhone率先抛弃。近些年,苹果不断为iPhone提升无线快充功率,还首创了吸磁充电方式。未来iPhone直接放弃充电接口也不是不可能。 媒体最后总结:说到底,快充要解决的问题还是续航问题,如果充一次电可以用一天,还有谁会真正在乎充电的时间呢?这就是iPhone的逻辑。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。