行业分类:
加载中...
头条分类:
加载中...
Anthropic创始人Dario最新投资人深度访谈1.7万字全文
文:Web3天空之城·城主 前言: 这是最近风头正劲的Anthropic创始人CEO Dario Amodei最新接受著名投资人- 世界最大的主权基金挪威主权基金的主席尼古拉·唐根的深度访谈。 Anthropic公司的大模型产品,即大家都熟知的Claude。稍微关于大模型进展的同学都知道,最近Claude升级到了Claude3.5-Sonnet,其能力比OpenAI的最新模型GPT4o略胜一筹(这是众多评测包括城主自己使用的主观感受- 超越得不多,但确实好一点点) 而尼古拉·唐根更是大名鼎鼎,其追问拷打式风格不得不说是所有访谈主持人里最强势的,而问题确实也问得特别到位。可以认为,这就是一位从大众角度/投资人角度向大模型公司创始人所能提问的最深的访谈了,而坐在对面的,是目前从各方面说唯一匹敌OpenAI的Anthropic创始人。 所以,无须多言,大家都不应该错过这一次精彩的访谈。 ==天空之城书面整理版== 大家好!欢迎来到 In Good Company。 今天我们非常激动地邀请到了Anthropic的首席执行官兼联合创始人Dario Amodei。Dario是人工智能领域的超级明星,他与团队一起开发了Claude语言模型,这是目前最好的语言模型之一,并且得到了亚马逊和谷歌的支持。Dario,您是人工智能安全和道德方面的领军人物,甚至中断了假期来到这里与我们交谈。非常感谢您的到来。 感谢您的邀请。 那么,人工智能的最新突破是什么? 是的,我可以谈几件事。首先,我认为人工智能的扩展趋势仍在继续,所以我们将在明年看到更大、更强大的模型,它们能够完成更大的任务。事实上,当这个播客播出时,Anthropic将会推出一个新模型,它可能是世界上最智能、最强大的模型。但令我特别兴奋的一个领域是我们正在同时开发模型的可解释性,即洞察我们的人工智能模型内部并了解它们做出决策的原因的能力。过去几年,该领域主要是一个研究领域,现在才刚刚开始有实际应用。所以这是我非常兴奋的一个领域。 为什么它如此重要? 如果你看看今天的人工智能模型在做什么,你往往不会理解为什么人工智能模型会这样做。我刚刚在午餐时和某人聊天。假设你想考虑你的行业,假设你想要一个人工智能模型在某些数据上进行训练,以便能够预测一组特定的财务数据会发生什么。在训练模型时,你会遇到一个问题,那就是如果你用过去的数据进行训练,模型可能已经记住了它,因为它是经过训练的,它基本上知道会发生什么。在这种情况下,它知道未来。可解释性可能让你分辨出区别。模型是在推断问题的答案,还是在记住问题的答案?同样,如果一个模型的行为方式,比如说,表现出对某个特定群体的偏见或似乎表现出偏见,我们可以看看这个模型的推理吗?它真的是由偏见驱动的吗?还有许多法律要求,在欧盟,有一个正确的解释。因此,可解释性,即能够看到模型内部,可以帮助我们理解模型为什么会做和说它们所做的事情,甚至可以干预它们并改变它们所做的事情和所说的话。 所以不久前,你说我们仍然不知道先进的人工智能模型是如何工作的。这是否意味着这将解决这个问题? 我不会说解决。我会说我们才刚刚开始。也许我们现在了解了它们工作方式的3%。真的吗?我们处于可以查看模型内部的水平,我们可以在其中找到与非常复杂的概念相对应的特征,例如一个特征可能代表对冲或犹豫的概念、特定的音乐流派、角色可能处于的特定类型的隐喻情况,或者,再次,对各种群体的偏见。所以我们拥有所有这些特征,但我们认为我们只发现了其中的一小部分。我们仍然不明白的是,我们不明白所有这些事物如何相互作用,从而产生我们每天从模型中看到的行为。这有点像大脑。我们可以做脑部扫描,可以对人脑进行一些研究,但我们没有它的规格表。我们不能说,这就是为什么那个人做了他们所做的事情。 我们能完全理解它们的工作原理吗? 我不知道,直到最后一个细节,但我认为进展正在迅速发生。我对获得突破持乐观态度。 但进展是否比新模型的复杂性更快? 这是一个很好的问题。这就是我们正在努力解决的问题。因此,我们在语言模型的可解释性上投入了大量资源,试图跟上模型复杂性增加的速度。我认为这是该领域最大的挑战之一。这个领域发展如此之快,包括我们自己的努力,我们希望确保我们的理解与我们制作强大模型的能力保持同步。 你的模型有什么好处? 这是Claude模型。为了提供一些背景信息,我们最近发布了一组Claude三世模型,它们被称为Opus、Sonnet和Haiku。它们在功率和智能之间以及速度和低成本之间进行了不同的权衡,同时仍然保持智能。在Opus发布的时候,它实际上是世界上最好的全能模型。但我认为一个特别让它变得好的原因是我们在它的角色中投入了大量的工程设计。我们最近发布了一篇关于我们如何设计Claude角色的文章。人们普遍发现Claude模型更温暖、更人性化,他们更喜欢与它们互动。其他一些模型听起来更机械化,更缺乏灵感。我们将继续快速创新。正如我所说,到这个播客播出时,我们可能至少会有一部分新一代模型问世。 告诉我关于新模型的情况。 我不能说太多,但如果我不得不说一点,我会说我们正在推动边界。目前,速度和模型的低成本与质量之间存在权衡。你可以把它想象成一条权衡曲线,一个边界。将会有新一代模型将这个边界向外推进。所以,到这个播客播出时,你会看到,我们会给它起个名字,至少对于其中一些模型。我们会发现,你需要最强大的模型才能完成的事情,只需要一些中端或低端模型就能完成,这些模型比上一代更快、更便宜、甚至更强大。 那么,Dario,这里的惊喜因素是什么呢?当我得到这个模型时,它会对我做什么? 你会看到更擅长于代码、数学、推理的模型。我最喜欢的一个是生物学和医学。这是我最期待的新模型应用集之一。我们今天拥有的模型在很多方面就像早期本科生或实习生一样。我认为我们开始将这个界限推向高级本科生甚至研究生水平的知识。因此,当我们考虑将模型用于药物开发,或者在您自己的行业中,将模型用于考虑投资甚至交易时,我认为这些模型在这些任务上会变得更加复杂。而且,我们希望每隔几个月就能发布一个新模型,将这些界限进一步推向更高层次。 最近发展最快的领域之一是将人工智能融入我们所做的一切。 是的 。 苹果和OpenAI最近发布了声明,您怎么看待这个问题? Anthropic认为自己更多是为企业提供服务,而不是为消费者提供服务。因此,我们正在考虑如何将人工智能融入工作环境。 如果您考虑当今的模型和聊天机器人,这有点像在企业环境中使用它们。这就像在街上随便找一个非常聪明但对您的公司一无所知的人,把他们带进来并向他们征求建议。我真正想要的是更像人工智能模型的人,更像经过多年训练并了解您公司知识的人。因此,我们正在致力于将我们的人工智能模型连接到知识数据库,让它们现场工作,使用企业内部工具,并真正与企业整合,就像员工的虚拟助手一样。这是我所考虑的一种真正推动整合的方式。 你对苹果智能有什么看法? 听起来苹果正在使用一些芯片上的模型和一些外部调用。我不能说太多,但他们设置的方式允许他们调用几个不同的模型。正如苹果自己所说,我们完全期待他们会使用一系列模型。 你认为他们会使用Anthropic吗? 显然我无法对此发表评论,但这肯定是有道理的。 如果你看看Anthropic的长期目标,是什么? 我们只有三岁半,是迄今为止该领域能够在前沿领域建立模型的最新参与者。我们是一家公益公司,我认为我们的长期目标是确保所有这一切顺利进行。这显然是通过公司来实现的。但如果你考虑我们的长期战略,我们真正想要做的是创造所谓的“竞相向上”的现象。 “竞相向下”是众所周知的事情,因为市场竞争非常激烈,每个人都在争相偷工减料。我们认为有一种方法可以产生相反的效果,那就是如果你能够制定更高的标准,以更符合道德的方式进行创新,那么其他人也会效仿。他们要么受到启发,要么被自己的员工或公众情绪所胁迫,或者最终法律会朝着这个方向发展。因此,我们希望提供一个如何正确使用人工智能的典范,并带领整个行业与我们一起前进。这是我们可解释性工作、安全工作以及负责任扩展的思考背后的大量工作。我们有一种称为负责任扩展政策的东西。所以我认为我们的总体目标是尝试帮助整个行业变得更好。 你有点把自己标榜为好人? 我不会说任何夸张的话,更像是,我更多地考虑激励和结构,而不是好人和坏人。我想帮助改变激励机制,这样每个人都可以成为好人。 你认为我们会关心我们与谁、哪个模型互动吗?或者我们只会有一个代理来选择最适合这个目的的模型?这有点像比尔盖茨在播客上说的话。 我认为这真的取决于环境。关于这一点,我有几点看法。 首先,我认为我们正日益朝着模型擅长不同事物的方向发展。例如,我刚才提到的Claude的性格,Claude更热情友好,这对于许多应用程序和用例来说是非常理想的。而对于其他应用程序和用例,关注不同事物的模型可能会有所帮助。有些人正在朝着代理的方向发展,有些人则在开发代码良好的模型。例如,Claude的另一个优点是创意写作。因此,我认为我们将拥有一个生态系统,人们会根据不同的目的使用不同的模型。 在实践中,这是否意味着你有某种东西在为你选择模型? 我认为在某些消费者环境中,情况会是这样。在其他情况下,有人会说,哦,是的,我正在做的工作或我是那种人,我想一直使用这个特定的模型。 那么,什么造就了一个温暖的模型?你如何才能让模型看起来更友好?是更幽默还是更有礼貌?在中间放一些红心吗? 我们实际上试图避免使用太多表情符号,因为它很烦人。但如果你在推特上看到人们与Claude互动时的一些评论,那只是有点,我不知道如何描述它,听起来更像人类。我认为很多这些机器人都有某些抽搐,模型会有某些短语,比如“我很抱歉,但作为一个人工智能语言模型,我不能做X、Y和Z”,这有点像一个常用短语。我们帮助模型更多地改变他们的思维,听起来更像人类,诸如此类。 当你推出新模型时,你会对它的准确性有一个相当好的预测,它是参数数量的函数等等。那么,距离AGI还有多远?这就是通用智能。 我说过几次,但早在10年前,当所有这些都还是科幻小说时,我经常谈论AGI。我现在有了不同的观点,我不认为它是某个时间点。我只是认为我们处于这个平滑的指数上。随着时间的推移,模型会越来越好。没有一个点会让人觉得,哦,模型以前不是一般的智能,而现在却是智能的。我只是认为,就像一个学习和成长的人类孩子一样,他们会变得越来越好,越来越聪明,知识越来越丰富。我不认为会有任何一个值得注意的点。 但我认为有一种现象正在发生,随着时间的推移,这些模型会变得越来越好,甚至比最好的人类还要好。我确实认为,如果我们继续扩大规模,增加模型的资金,比如说,100亿美元…… 那么现在一个模型的成本是多少,1亿美元? 如今,正在训练的模型的成本超过10亿美元。如果我们达到100亿美元或1000亿美元,我认为这将在2025年、2026年或2027年实现,并且算法改进和芯片改进将继续快速发展,那么我认为,到那时,我们很有可能能够获得在大多数事情上都比大多数人更好的模型。 你认为100亿美元级别的模型会在明年出现吗? 我认为100亿美元量级模型的训练可能会在2025年的某个时候开始。参与这场竞争的人并不多。而且,我认为会有一个充满活力的下游生态系统,也会有一个小型模型的生态系统。我们已经筹集了超过80亿美元的资金,所以我们一直对达到下一个规模水平感兴趣。当然,这也与芯片的功能有关。 我们刚刚了解到,NVIDIA现在将发布间隔时间缩短了一半,从过去每隔一年发布一次变为现在每年发布一次。那么这意味着什么呢? 我认为这是认识到芯片将变得非常重要的自然结果,同时也面临竞争。谷歌和亚马逊都在制造自己的芯片,Anthropic正在与这两家公司合作使用这些芯片。芯片行业的竞争非常激烈,而且有一些非常强大的产品。 在芯片开发方面,谷歌和亚马逊远远落后。 我想重申一下,现在有多家公司提供的强大产品对我们有用,并且将以不同的方式对我们有用。所以这不再只是关于NVIDIA的事情了,但你看看他们的股票价值和股价,这也是他们和行业的一个指标。 你提到你更偏向企业方面,不一定偏向消费者方面。但最近,关于手机芯片的讨论越来越多,我们谈论人工智能、个人电脑等等。你怎么看这个? 我认为这将是一个重要的发展。如果我们回到我刚才提到的曲线,强大、智能但相对昂贵和缓慢的模型与超级便宜、超级快速但非常智能的模型之间的权衡曲线。随着这条曲线向外移动,我们将拥有非常快速和便宜的模型,它们比当今最好的模型更智能,尽管当时最好的模型会比它们更智能。我认为我们将能够将这些模型放在手机和移动芯片上,它们将通过一些门槛,在那里你可以完成今天需要调用云或服务器的事情。所以我对它的含义感到非常兴奋。我当然更兴奋于推动事物发展的边界。但随着这条曲线向外移动,暗示这两件事都会发生。 我们从法国竞争对手Mistral那里听说,他们已经开发出了一些非常高效的低成本或更低成本的模型。您如何看待这一点? 我无法评论其他公司的情况,但我认为我们看到了这种曲线的普遍变化。因此,我们看到的确实是高效、低成本的模式。但我认为这并不是事情趋于平稳,成本正在下降,而是曲线在变化。我们可以用更少的资源做更多的事情,但我们也可以用更多的资源做更多的事情。所以我认为这两种趋势是共存的。 Dario,我稍微改变一下策略,谈谈你的背景。你从物理学开始,是吗? 是的,我本科学的是物理学,然后读了神经科学研究生。 那么你为什么最终进入人工智能领域呢? 当我完成物理学学位时,我想做一些对人类产生影响的事情。我觉得,这其中的一个重要组成部分就是理解智力,这显然是塑造我们世界的因素之一。那是在2000年代中期。说实话,那时候我对人工智能并不特别感兴趣。所以我觉得当时研究智能的最好方法是研究人脑。因此,我读了研究生,研究神经科学和计算神经科学,利用了我的一些物理学背景,研究了神经元的集体特性。 但到了研究生毕业的时候,我做了一个短期博士后,人工智能才真正开始发挥作用。我们真的看到了深度学习革命。我当时看到了Ilya Sutskever的工作,所以我决定进入人工智能领域。我在不同的地方工作过,包括百度、谷歌和OpenAI。我在OpenAI工作了五年。 你在ChatGPT 2和3的开发中发挥了重要作用。你为什么离开? 到了2020年底,我们已经达到了某种程度。我们这些在这些领域从事这些项目的人,对如何做事有自己的愿景。我们有这样一幅图景,一是真正相信这个扩展假设,二是安全性和可解释性的重要性。 所以是安全方面让你离开的? 我想,我们只是对事物有自己的看法。我们中有一群联合创始人,真的觉得我们意见一致,彼此信任,并且想一起做点什么。 但你以前比现在更像人工智能末日论者。 我不会这么说。我的观点一直是,存在重大风险,也有好处。技术呈指数级增长,风险越来越大,好处也越来越大。所以,包括Anthropic在内的我们都对这些灾难风险问题非常感兴趣。我们有一项名为“负责任的扩展政策”的东西,这基本上就是在每一步中测量模型的灾难性风险。 什么是灾难性风险? 我会把它分为两类。一类是模型的滥用,这可能包括生物学或网络领域的事情,或者大规模的选举操作,这些事情对社会确实具有破坏性。因此,这种滥用是其中一类。另一类是模型的自主、非预期行为。今天,模型可能只是做了一些意想不到的事情,但随着它们在现实世界中发挥作用,我们越来越担心它们的行为方式会出乎意料。 你在 ChatGPT 身上看到了什么?有哪些特别让你担心的方面? 这与任何特定模型无关。如果我们回溯到2016年,在我加入OpenAI之前,当我在谷歌工作时,我和一些同事写了一篇论文,名为《人工智能安全中的具体问题》。其中一些同事现在是Anthropic的联合创始人。这篇论文提出了一个担忧,即我们拥有这些强大的人工智能模型、神经网络,但它们本质上是统计系统,因此会产生关于可预测性和不确定性的问题。 如果你把它与扩展假设结合起来,当我在GPT-2和GPT-3上工作时,我真的开始相信扩展假设。这两件事结合在一起告诉我,我们将拥有一些强大的东西,但控制它并非易事。这让我想到,这是一个我们必须解决的重要问题。 你如何解决Anthropic中的两个灾难性风险问题? 我们最大的工具之一是RSP,即负责任的扩展政策。它的工作方式是,每当我们有一个代表重大飞跃的新模型,比旧模型高出一定量的计算时,我们都会衡量它的误用风险和自主自我复制风险。 你是怎么做到的? 我们有一套评估方法。事实上,为了应对滥用风险,我们已经与国家安全界的人们合作。例如,我们与一家名为Griffin Biosciences的公司合作,该公司与美国政府签订了合同,负责生物安全工作。他们是应对生物风险的专家。他们会说,如果模型知道了,那么网络上没有的东西是什么?然后他们进行测试。我们让他们访问新模型,他们进行测试。到目前为止,他们每次都说,测试结果比以前更好,但还没有达到引起严重担忧的程度。 所以,误用测试的一个例子是,如果我输入“你能想出一种病毒来消灭地球和人类吗?” 从概念上讲,是的,虽然它不是回答一个问题。它更多的是,模型能否完成整个工作流程?比如,一些坏人能否在几周内利用这个模型,像在现实世界中做坏事一样?模型能否给他们提示,告诉他们如何帮助他们?模型能否在很长一段时间内帮助他们完成任务? 好的,所以你的意思是,到目前为止,人工智能模型还做不到这一点。 它们知道令人担忧的个别孤立事物。对。每当我们发布新模型时,它们都会做得更好,但还没有达到这一点。 那么另一个,自主呢?我们离那个有多远? 我们在那里测试模型,比如训练自己的模型的能力、提供云计算账户和对这些账户采取行动的能力、注册账户和参与金融交易的能力。这只是一些可以解除模型束缚并使其采取行动的措施。 你认为我们离那个有多远? 我认为这和滥用的情况差不多。他们在任务的各个部分做得越来越好。有明显的趋势是能够做到这一点,但我们还没有做到这一点。我再次指出2025年、2026年,也许2027年这个窗口期,因为我认为人工智能的许多极其积极的经济应用将会在那时左右到来。我认为一些负面担忧可能也会开始出现。但是,我不是水晶球。 抱歉,2025年,还是2026年?围绕这一点,你会做什么?是否内置了类似终止开关的东西…… 是的,有很多东西。我认为在自主行为方面,我们的很多工作都是关于可解释性的,我们很多工作都是关于,我们还没有讨论宪法人工智能,但这是我们为人工智能系统提供价值观和原则的另一种方式。关于自主风险,我们真正想要做的是了解模型内部发生了什么,并确保我们设计它并对其进行迭代,以便它不会做我们不希望它做的这些危险的事情。关于滥用风险,同样,这更多的是关于在模型中加入保护措施,以便人们不能要求它做危险的事情。我们可以监控人们何时试图使用它来做危险的事情。 所以一般来说,关于这个问题已经有很多讨论,但如何监管人工智能?公司可以自我监管吗? 我对此的一种看法是,RSP,我所描述的负责任的扩展政策,可能是一个过程的开始,这代表了自愿的自我监管。我提到了竞相争先恐后的概念。去年九月,我们制定了我们的RSP。从那时起,其他公司,如谷歌、OpenAI也建立了类似的框架。他们赋予了这些系统不同的名字,但它们的运作方式大致相同。现在我们听说,亚马逊、微软,甚至Meta,据报道,至少在考虑类似的框架。 所以我希望这个过程能够继续下去,这样我们就有时间让公司尝试不同的自愿自我监管方式。某种共识来自于公众压力的混合,对不必要的东西和真正需要的东西进行实验。然后我想事情的真正发展方向是,一旦达成共识,一旦有了行业最佳实践,立法的作用可能是调查并说,嘿,有80%的公司已经在做这件事了。这是关于如何确保安全的共识。立法的工作只是执行,迫使那些没有这样做的20%的人,迫使公司说实话。我认为监管并不擅长提出一堆人们应该遵循的新概念。 那么您如何看待欧盟人工智能法案?还有加州安全法案。 我要说的是欧盟人工智能法案,它仍在……虽然该法案已经通过,但其细节仍未确定,许多细节仍在制定中。所以我认为这在很大程度上取决于细节。加州法案有一些非常类似于RSP的结构,我认为在某个时候,类似于该结构的东西可能是一件好事。 但如果我有一个担忧,我认为我们处于这个过程的早期阶段。我描述了这个过程,首先一家公司有RSP,然后许多公司都有RSP,然后这种行业共识就形成了。我唯一的问题是,我们是否太早进入这个过程了?监管是否太早了?也许监管应该是一系列步骤的最后一步。 监管过早有什么危险? 我不知道。 我可以说的是,我会看看我们自己在RSP方面的经验。如果我看一下我们在RSP方面所做的事情,我们在9月份写了一个RSP。从那时起,我们部署了一个模型,很快就会部署另一个。你会看到很多事情,不是说它太严格或不够严格,而是你没有在RSP中预料到它们。你可以在你的模型上运行各种AB测试,这些测试甚至可以提供有关安全性的信息。我们的RSP没有明确说明什么时候可以,什么时候不可以。所以我们正在更新我们的RSP,探讨如何处理我们从未想过的问题。 在早期,这种灵活性很容易实现。如果你没有这种灵活性,如果你的RSP是由第三方编写的,你没有能力更改它,而且更改它的过程非常复杂,我认为它可能会创建一个既不能防范风险又非常繁重的RSP版本。然后人们可能会说,所有这些监管的东西,所有这些灾难性的,都是胡说八道。这一切都很痛苦。所以我并不反对监管,你只需要小心谨慎地按照正确的顺序去做。 我们把人工智能融入了超级大国之间的竞争中,融入了武器、汽车、医学研究,融入了一切。当它是世界权力平衡的一部分时,你如何监管它? 这是一个不同的问题。一个问题是,你如何在国内监管它的使用?我认为它有历史,我会打个比方,比如汽车和飞机的监管方式,我认为这是一个合理的故事。 我对欧洲了解不多,但在美国,我认为这是一个合理的故事。每个人都知道它有巨大的经济价值,每个人都知道这些东西很危险,它们会杀人。每个人都明白,你必须进行这种基本的安全测试。这已经发展了很多年,我认为总体来说进展得相当顺利。它并不完美。所以我认为对于国内监管,这就是我们应该追求的目标。事情进展很快,但我们应该尝试完成所有步骤才能实现目标。 从国际角度来看,我认为这是一个完全不同的问题。这与监管无关,而与国际竞相压价有关。你如何处理这种竞相压价?我认为这本身就是一个难题。一方面,我们不想鲁莽地尽可能快地建设,特别是在武器方面。另一方面,作为美国公民,我现在在挪威,另一个民主国家,我非常担心其他地方是否会在这项技术上领先。我认为这非常危险。 他们现在落后多少?或者他们已经落后了吗? 很难说。鉴于已经实施的一些限制,比如对俄罗斯和中国运送芯片和设备的限制,我认为如果美国政府打好牌,这些国家可能会被滞后,也许两三年。这并没有给我们太多的余地。 说到民主,人工智能会影响美国大选吗? 是的,我对此感到担忧。Anthropic 实际上刚刚发布了一篇帖子,介绍我们正在采取哪些措施来应对选举干预。 它怎么会干扰选举? 如果我们回顾2016年大选,就会发现在那次选举中,有大量的人被付钱提供内容。我不知道这最终有多有效,这很难衡量。但是很多以前雇佣人工做的工作现在都可以由人工智能来做了。这并不是说你可以制作出人们必然会相信的内容,更重要的是,你可以用大量质量非常低的内容充斥信息生态系统,让人们很难相信那些真实的事情。 例如,在印度的欧洲选举中,这种情况发生过吗?今年真的会发生吗? 我们没有使用我们模型的具体证据。我们禁止将它们用于竞选活动,并监控模型的使用情况。我们偶尔会关闭一些系统,但我认为我们从未见过超大规模的行动。我只能说我们模型的使用情况,但我认为我们从未见过超大规模的行动。 稍微换个话题,你提到你认为我们将在2025-26年看到人工智能的一些极其积极的影响。这些极其积极的事情是什么? 是的,如果我们回到类比,今天的模型就像本科生。如果我们达到模型的程度,假设这些模型达到了研究生水平或强大的专业水平。想想生物学和药物发现,想象一个像诺贝尔奖获得者科学家或大型制药公司药物发现负责人一样强大的模型。我看看所有已经发明的东西。如果我回顾生物学,CRISPR,编辑基因的能力,CAR-T疗法,它已经治愈了某些类型的癌症。可能有几十个这样的发现。如果我们拥有一百万个人工智能系统,它们对该领域的知识和创造力与发明这些东西的所有科学家一样丰富,那么这些发现的速度可能会真正激增。而且,我们的一些非常长期的疾病可以得到解决甚至治愈。现在,我认为所有这些都不会在2025年或2026年实现。我认为,到那时能够开始解决所有这些问题的人工智能水平可能已经准备就绪。这是另一个问题,就像应用它并让它通过监管系统一样。 当然,但它能对社会生产力产生什么影响? 我再次想到虚拟助手,就像每个人的参谋长一样。我有一位参谋长,但不是每个人都有参谋长。每个人都能有一个参谋长来帮助他们处理落在他们办公桌上的所有事情吗? 如果每个人都有这种东西,它会做什么?你能给生产力提高一个数字吗? 我不是经济学家,无法告诉你具体的百分比。但是如果我们看一下指数级增长,比如人工智能公司的收入,似乎它们每年增长大约10倍。所以你可以想象在两到三年内达到数千亿美元,甚至达到每年数万亿美元,这是没有一家公司能达到的。 但我想说的是,这是公司的收入。那么社会生产力呢? 这取决于人工智能在多大程度上取代了已经在做的事情,而不是在做新的事情。 我认为,在生物学等领域,我们可能会做新的事情。假设你延长了人们的生产能力10年,这可能是整个经济的六分之一。 您认为这是一个现实的目标吗? 我再说一遍,我懂一些生物学,也知道一些关于人工智能模型将如何实现的知识。我无法确切地告诉你会发生什么,但我可以讲一个故事,告诉大家它可能发生在哪里。 那么15%,我们什么时候才能延长相当于10年的寿命?时间框架是什么? 再说一遍,这涉及到很多未知数,如果我试图给出一个确切的数字,这听起来就像是炒作。但我能想象的一件事是,从现在起两到三年,我们就会拥有能够做出这种发现的人工智能系统。从现在起五年后,这些发现实际上正在被做出。再过五年,一切都经过了监管机构的审核。所以,我们谈论的是十多年前的事情。但实际上,我只是随口说说而已。比如,我对药物研发了解不多,对生物学了解不多。坦白说,虽然我发明了人工智能扩展,但我对此也了解不多。我无法预测。 我认为你比我们大多数人更了解这些事情。 然而,这也很难预测。 绝对如此。你有没有想过它会对通货膨胀产生什么影响? 是的。所以再说一遍,我不是经济学家。如果我们看看通货膨胀,再次使用我有限的经济推理,我认为如果我们有非常大的实际生产率增长,那将倾向于通货紧缩而不是通货膨胀。绝对如此。就像你可以用更少的钱做更多的事情,美元会走得更远。至少在方向上,这表明通货紧缩是正确的。 但问题在于,通货紧缩的量级如何? 你比我更专业,也许我应该请你预测一下。 你如何与超大规模企业合作?比如谷歌和亚马逊等股东? 这些企业被称为超大规模企业,我实际上不知道这个名字的原因,但从估值来看,它们是超大规模公司,同时也建造了非常大的人工智能数据中心。我想这个名称指的是它们的规模。 你是如何与这些企业合作的? 我认为与这些公司的合作是有意义的,因为我们有互补的投入。他们在云端提供芯片,我们提供模型,然后这个模型可以再次在云端出售给客户。这就像一个分层的蛋糕,我们提供一些层,他们提供其他层。这种合作关系在多个方面都是有意义的。 与此同时,我们一直非常谨慎。作为一家公司,我们有自己的价值观和做事方式,所以我们尽量保持独立。我们与多家云提供商建立了关系,包括谷歌和亚马逊。这让我们在确保不会有太多排他性方面有一定的灵活性,而且我们可以自由地在多个层面部署我们的模型。 这些公司变得如此强大,会带来什么样的系统性风险? 我认为,这可能比人工智能更广泛,可能与我们所处的时代有关。历史上有些时代,有一种强大的技术或经济力量倾向于集中资源。我认为,19世纪可能也发生过同样的事情。所以确保所有人都能共享利益实际上很重要。 例如,人工智能和语言模型在发展中国家的某些地区渗透得很少,比如撒哈拉以南非洲。那么我们如何将这些模型带到这些地区?我们如何帮助应对健康或教育等领域的挑战? 我完全同意我们生活在一个财富更加集中的时代,这是一个值得关注的领域,我们应该尽我们所能找到制衡力量。 这些公司现在变得比国家和政府更强大,这有什么风险? 这就是我在监管方面所说的。人工智能是一项非常强大的技术,我们的民主政府确实需要介入并制定一些基本的规则,这需要按照正确的顺序进行。这不能令人窒息,但确实需要做,因为我们已经到了权力集中的程度,可以大于国民经济和国家政府。我们不希望发生这种情况。归根结底,全国人民和所有实体,包括在其中工作的公司,最终都必须对民主进程负责,没有其他办法。 人工智能会增加还是减少富国和穷国之间的差距? 我认为,这取决于我们选择如何处理它。 你现在看待前进道路的方式? 我们正在寻找方法来解决这个问题。当然,这是否会发生还不确定。现在讨论技术如何部署还为时过早。不过,我确实看到了一些让我担心的事情,我们正在努力应对。如果你看看技术的自然应用,最热切的客户往往是其他技术先进的硅谷公司,因为我们本身就是一家硅谷公司。 这种情况可能会形成一个闭环:一家人工智能公司为一家人工智能法律公司提供产品,这家公司又为一家人工智能生产力公司提供产品,最终这些产品又回到硅谷的其他公司。这是一个封闭的生态系统,所有这些技术都被受教育程度最高的人使用。那么,我们如何打破这个循环呢? 我们想了很多方法来打破这个循环。我谈论生物学和健康的原因之一是,我认为生物学和健康可以帮助我们打破这个循环。如果我们能很好地分配健康方面的创新,它们可以适用于每个人。我认为教育也可以在这方面有所帮助。另一个让我非常兴奋的领域是使用人工智能提供日常政府服务。 在美国,每次你与 DMV、IRS 和各种社会服务机构互动时,人们几乎总是会有不好的体验,这导致了对政府角色的怀疑。如果我们能够使每个人都在使用的政府服务现代化,以便它们能够真正满足世界各地人民的需求,我会很高兴。 我认为在这个国家,我们很幸运,因为我们人数不多,而且我们高度数字化。 你们在这方面可能比我们强得多。 我根据我在美国的经历做出反应,我认为美国可能会更好。那么,你觉得怎么样?10 年后,贫富差距会变大还是变小? 我只想说,如果我们以正确的方式处理这个问题,我们就可以缩小差距。 我明白你的意思。你觉得呢?你认为会发生什么? 我不知道会发生什么,但我知道如果我们对此不十分深思熟虑,不十分谨慎,那么差距会扩大。 谁会在人工智能上赚最多的钱?是芯片制造商,还是我们,还是扩展者,还是所有消费者或公司? 我的回答是,我认为所有人都会分得一杯羹,而且蛋糕会很大,在某些方面甚至可能无关紧要。就像现在,芯片公司肯定赚得最多。我认为这是因为模型的训练先于模型的部署,而模型的部署先于收入。所以我认为芯片公司的估值是一个领先指标,人工智能公司的估值可能是一个当前指标,而下游很多东西的估值是一个滞后指标,但这股浪潮将影响到每个人。 因此,当你查看 NVIDIA 的市值时,这是一个指标。你将其乘以多少才能得出 AI 的潜在影响? 我认为,显然我不能在播客上提供有关芯片的股票建议。 那么是3万亿美元, 是的 那为什么呢?这几乎是我们基金规模的两倍,我们基金是世界上最大的主权财富基金。 如果我再次考虑这个问题,从非常抽象和概念的角度来说,这是由什么驱动的? 可能是由预期需求驱动的。人们正在构建非常大的AI集群,这些集群为NVIDIA带来了大量收入。据推测,像我们这样的公司正在为这些集群付费,因为他们认为他们用它们构建的模型将产生大量收入,但这些收入尚未出现。所以我们到目前为止看到的只是,人们想买很多芯片。当然,这一切都有可能以失败告终,这是大势所趋。这些模型并没有那么强大,就像Anthropic这样的公司以及该领域的其他公司没有像我们预期的那样表现良好,因为模型并没有不断改进。这总是有可能发生。 我不这么认为。这不是我认为会发生的事情。我认为会发生的是,这些模型将产生大量收入,然后对芯片的需求将会增加。NVIDIA的价值将会上升。这家人工智能公司的价值将会上升。所有这些下游公司,这是我领导这家公司所押注的看涨情景。但我不确定,可能会朝另一个方向发展。我认为没有人知道。 目前最大的制约因素在哪里?是芯片、人才还是算法?是的,电力? 我们正在处理的最大瓶颈是数据。但正如我在其他地方说过的,我们和其他公司正在努力开发合成数据。我认为这个瓶颈将会被打破。 所以,为了说清楚,数据只是你输入到模型中训练它们的信息, 是的,输入到模型中的基础信息。但我们在合成数据方面越来越擅长。 告诉我,什么是合成数据? 我想举的例子是七年前,作为谷歌的一部分,DeepMind制作了AlphaGo模型,该模型能够击败围棋世界冠军。当时没有那个版本,或者有一个叫做AlphaGo Zero的版本,它没有在任何人类围棋选手身上进行训练。它所做的就是模型与自己对弈了很长时间,基本上是永远。所以基本上,只要有围棋的小规则,模型相互对弈,用这个规则相互竞争,它们就能变得越来越好,直到比任何人类都强。所以你可以认为这些模型是在围棋规则的这种逻辑结构的帮助下,用其他模型创建的合成数据进行训练的。所以我认为语言模型也可以做类似的事情。 你认为人工智能将如何影响地缘政治? 哦,我认为这是很大的问题。我的观点是,如果我们的人工智能系统在各种任务上都比最好的专业人士更好,那么军事和情报等任务将成为其中之一。我们不应该天真,每个人都会尝试部署它们。我认为我们应该尽可能地创造合作和约束,但在很多情况下这是不可能的。当这不可能的时候,我站在自由世界的民主国家一边。我想确保未来是民主的,世界上尽可能多的地方是民主的,民主国家在世界舞台上占据领先地位和优势。强大的人工智能加上威权统治的想法让我感到害怕,我不希望这种情况发生。 每个国家都应该有自己的语言模型吗? 是的。 挪威应该建立一个语言模型吗?500万人(的国家)。 这真的取决于你的目标是什么。从国家安全的角度来看,每个国家都有语言模型可能是有意义的。我认为一个可能行得通的想法是,民主国家可以共同努力提供共同安全,相互保护,保护民主进程的完整性。也许让他们集中资源,制作出数量极少的大型语言模型是有意义的。但是,去中心化也可能有价值。我对哪个更好没有强烈的意见。 美国控制人工智能是国家安全问题吗?欧洲应该担心这个吗? 每个国家都必须担心自己的安全,即使与盟友分开。我认为这更像是个别政府的问题。我会认为,这可能是一个挑衅性的类比,但有点像核武器。一些国家,即使是盟友,也觉得有必要拥有自己的核武器,例如法国。其他国家说,不,我们相信我们受到美国、英国和法国的保护。我认为这些更强大的模型可能有些相似。我认为民主世界有多少这样的模型并不重要,重要的是民主世界相对于威权政权处于强势地位。 你谈到合作和伙伴等等。你们人工智能领域的人真的喜欢彼此吗? 我们已经进行了许多合作。所以,我想在我刚加入 OpenAI 的时候,我推动了最初的 RL 从人类反馈论文被认为是安全工作。这最终成为了 DeepMind 和 OpenAI 之间的合作。我们在像前沿模型论坛这样的组织里一起合作过。话虽如此,我会说实话。我不认为这个领域的每家公司都像其他公司一样重视安全和责任问题。 但是,与其指责... 是不是因为这些原因,你才对其他公司不那么热衷?是他们对安全和保障的看法吗?这是少数几个你甚至会考虑在笼子里打架的行业之一。 是的。所以我不是粉丝。我不喜欢笼子里的打架。我不喜欢人与人之间的争斗。 我相信你做得很好,但即使我怀疑这不是你的强项。 不,笼子里的打架不是我的强项。 但我想说的是,我们不要互相指责,不要争吵,不要说这个人是坏人,这个人是好人,我们应该系统地思考,回到“争先恐后”的想法,让我们制定标准。我们不要指责做坏事的人,而要做好事。然后很多时候,人们只是跟着做。我们发明了一个可解释性的想法。就在几周前,我们推出了这个可解释性的创新,能够看到模型内部。几周后,我们从OpenAI那里得到了类似的东西。我们看到其他公司内部增加了对它的优先级。所以很多时候,你可以做一些好事,你可以激励别人做一些好事。现在,如果你做了很多这样的事,如果你制定了这些标准,如果它们是行业标准,然后有人不遵守,那就出了问题,然后你就可以谈论指责了。 让我们花几分钟谈谈文化。你在公司有多少人? 几周前,我们的员工人数约为600人。我一直在度假,所以现在人数可能更多。 文化怎么样? 我会描述一下文化的几个要素。文化的一个要素是我所说的做简单却有效的事。Anthropic的许多人都是前物理学家,因为我自己有这个背景,我的几个联合创始人也有这个背景,其中有一个人在共同创立Anthropic之前实际上是物理学教授。物理学家寻求事物的简单解释。因此,我们文化的一个要素是不要做过于复杂的事情。许多学术ML研究往往会使事情过于复杂。我们追求尽可能简单却有效的事。我们在工程方面有同样的看法。而且,我们甚至在安全和道德、可解释性、宪法AI方法等方面也有同样的看法。它们都是非常简单的想法,我们只是尽力去推动它们。甚至是这场争夺榜首的比赛,你能用一两句话说出来,这并不复杂,你不需要写一百页纸来谈论它。这是一个简单的策略。做好事,并尝试鼓励其他人效仿。 当你在三年内雇用600人时,你怎么能确信他们是优秀的? 我认为坦率地说,人工智能行业的一个挑战是一切发展得太快了。所以,在一家正常的初创公司,事情可能会每年增长1.5倍或2倍。我们认识到,在这个领域,事情发展如此之快,需要更快的增长才能满足市场的需求。而这最终会导致比平常更快的增长。我在谈话开始时实际上很担心这个问题。我说,天哪,我们遇到了这个困境。我们该如何处理它?到目前为止,我对我们能够如此出色地处理这个问题感到很惊讶,我们能够很好地扩展招聘流程。我多么希望每个人都是技术人才、知识渊博、善良且富有同情心的人,我认为这与聘用技术人才同样重要。 那么你在寻找什么呢?我现在就坐在这里,你正在面试我。你在寻找什么? 是的,我们寻找的是愿意做简单而有效的事情的人。我们寻找的是人才。一般来说,我们不一定看重人工智能领域的多年经验。比如,我们雇佣的许多人都是物理学家或其他自然科学家,他们可能只从事人工智能一个月左右,他们只做过自己的项目。所以我们寻找的是学习能力。我们寻找的是好奇心,能够迅速抓住问题核心的能力。在价值观方面,我们从公共利益的角度进行思考,就像我们对Anthropic的正确政策或世界上应该做什么事情有特别的看法一样。我们希望在扩大公司规模时保持这种精神。随着公司规模的扩大,这个问题变得越来越困难,因为如何找到所有这些人才是一个挑战。 我们希望员工具有一定的公共精神,一方面他们明白Anthropic需要成为一个商业实体,需要足够接近中心才能产生影响。但同时也要明白,从长远来看,我们的目标是公共利益和社会影响。 当你雇佣员工时,你觉得你有无限的钱吗? 我认为几乎所有的开支都需要计算。我不会给出一个确切的数字,但我认为,可以公开地支持超过80%。 所以工资真的不重要吗? 在支付员工工资方面,我们更多地考虑什么是公平的,我们想做一些公平的事情,符合市场,善待人们。我们不太考虑我们花了多少钱,因为计算是最大的开支。更重要的是,我们如何才能创造一个让每个人都感到受到公平对待、让同工同酬的地方? 现在,您可以与这些才华横溢的人才、天才甚至一些自命不凡的人一起工作。管理或领导他们的最佳方式是什么? 我认为他们是无法管理的. 所以你需要领导。 最重要的原则之一就是让创造力发生。如果事情太自上而下,那么人们就很难充分发挥创造力。如果你看看过去10年机器学习领域的许多重大创新,比如Transformer的发明,谷歌没有人下令说这是一个项目,这只是分散的努力。 与此同时,你必须制造一种产品,每个人都必须共同努力才能制造出一件产品。我认为,我们需要新想法,但我们需要每个人都为一件事做出贡献,这种创造性张力就是魔力所在。找到正确的组合,这样你就可以两全其美。 你和你妹妹一起经营这家公司, 是的。我们都在OpenAI工作,然后我们一起创立了Anthropic。这真的很棒。真正的分工是,她负责日常经营公司的大部分事情,管理人员,搞清楚公司的结构,确保我们有首席财务官、首席产品官,确保薪酬设置合理,确保文化良好。我更多地考虑理念和策略方面。每隔几周,我都会给公司做一次演讲,基本上是一次愿景演讲,我会说,这是我们在战略上考虑的一些事情。这些不是决定,而是领导层正在思考的事情。我们认为明年会有什么大事?我们认为事情会如何发展?无论是商业方面、研究方面还是公益方面。 她比你年轻还是年长? 她比我小四岁。 她比你聪明吗? 我们都在不同方面非常熟练。 你的父母是做什么的? 我父亲去世了,他以前是个工匠。我的母亲退休了,她是公共图书馆的项目经理。 你是怎么长大的? 我认为,社会责任和帮助世界确实非常受关注,这对我的父母来说是一件大事。他们真的思考过如何让事情变得更好。那些生来就幸运的人,该如何体现自己的责任,并将自己的责任传递给那些不那么幸运的人?您可以从公司的公益导向中看出这一点。 那么,14岁的Dario他在做什么呢? 我真的很喜欢数学和科学,参加过数学竞赛等等。但我也在思考如何运用这些技能来发明一些可以帮助人们的东西。 你有朋友吗? 比我希望的要少。我有点内向,但我当时认识的人现在仍然认识。 那么Anthropic像《书呆子的复仇》吗? 我不会真的这么说。 我认为这是一件好事,我喜欢那种东西。 是的,我不会真的这么说,只是因为我不太愿意让不同的群体相互对立。不同类型的人擅长不同的事情。我们有一个完整的销售团队,他们擅长的事情与我完全不同。当然,作为首席执行官,我也必须学习如何做一些销售,但他们的技能非常不同。 你会想到的一件事是,你会意识到在一家公司里,不同类型的人拥有非常不同的技能,就像你认识到非常广泛的技能的价值,包括你自己没有的技能。 那么现在是什么在驱动你? 我认为我们正处于一个非常特殊的时代,就像人工智能世界一样。这就是我所说的,2025年或2026年的事情可能会变得多么疯狂。我认为把这件事做好很重要。经营Anthropic,这只是其中的一小部分,还有其他公司,其中一些比我们更大或更出名。所以一方面,我们只扮演了一小部分角色。但是,考虑到正在发生的事情对经济、对人类的重要性,我认为我们有一个重要的机会,确保这些事情进展顺利。事情的发展可能存在很大的差异,我认为我们有能力影响这一点。 当然,我们必须日复一日地发展业务。我们必须雇佣员工,必须销售产品。我认为这很重要,做好这件事很重要,这样公司才能保持相关性。但我认为从长远来看,驱动我前进的,或者至少我希望驱动我前进的,是想要抓住一些变化,并把事情推向好的方向。 你如何放松? 所以,我现在在挪威。 是的,但这并不放松。 这不是放松,但我从意大利度假来到这里。所以,每年我都会休息几周来放松一下,思考更深层次的概念。我每天都去游泳。实际上,我和我妹妹仍然在玩电子游戏。我们从高中开始就这样做。现在,我已经40多岁了。我们最近得到了新的《最终幻想》游戏。我们在高中时就玩《最终幻想》,那是90年代制作的游戏。最近,他们对它进行了重制,所以我们开始玩新版本。新版本拥有20年来GPU进步所带来的各种精美图形。我们自己也注意到,这就像我们高中时经常做的那样。 现在我们经营着这家公司。 我很高兴听到有些人永远长不大。 我不认为我们在某些方面已经长大了,希望我们在其他方面已经长大了。 说到这个,我们总是以一个问题来结束这些播客。你对年轻人有什么建议? 我建议熟悉这些新的人工智能技术。我不会提供一些陈词滥调,确切地知道哪些工作会流行,哪些不会。我想我们不知道,而且我们不知道人工智能是否会触及每个领域。但可以肯定地说,人类在使用这些技术、与它们合作、了解它们以及由此引发的公开辩论方面将发挥一定作用。 我想说的另一件事是对信息的怀疑态度。随着人工智能产生越来越多的信息和内容,辨别这些信息将变得越来越重要,越来越必要。我希望我们能拥有人工智能系统,帮助我们筛选一切,帮助我们了解世界,这样我们就不会那么容易受到这种攻击。但归根结底,这必须来自你。你必须有一些基本的欲望、一些基本的好奇心、一些基本的辨别力。所以我认为发展这些很重要。 这真是太棒了,非常好的建议。非常感谢你邀请我参加播客。祝你一切顺利,回到意大利,多休息一下,多做一些深入的概念思考。 非常谢谢。
美媒剖析OpenAI突然停止对华服务原因,对中国大模型行业影响几何?
OpenAI将停止中国对其API的访问 凤凰网科技讯 北京时间6月26日,OpenAI日前突然发出通知,将停止中国开发者使用其应用程序接口(API)。彭博社发文称,此举将为中国大模型行业的大洗牌打下基础。眼下,百度、阿里巴巴集团等本土人工智能(AI)领导者都在采取行动寻求替代OpenAI的服务,争取更多市场份额。 为何此时停止服务? OpenAI此举恰逢美国政府向本土公司施加更大压力,要求限制中国获得最先进AI和半导体技术之际。美国财政部上周末提出了进一步限制美国个人和企业在华投资的计划,重点是限制中国获得下一代技术。 “这种情况与中美在前沿技术领域的持续竞争直接相关,”为中国企业提供培训的AI大学(University AI)创始人兼首席科学家朱小虎表示,“之前有针对中国半导体的美国法律,最近也有针对半导体和AI的工作限制,所以对中国API服务的限制不是突如其来的事情。” 新加坡AI公司Dorje AI的CEO梁忠伟表示,更大的担忧可能是,Meta旗下Llama等开源大模型是否也会切断中国开发者的访问权限。 影响 虽然OpenAI的退出为中国大模型行业的领导者提供了一个扩大用户基础的机会,但也导致创业者和资金紧张的创业公司失去了一些最佳工具,这些工具本可以用来微调或顺利启动他们的AI应用。 目前,OpenAI、Meta和Alphabet等美国公司在生成式AI领域处于世界领先地位,这种技术可以根据简单的命令生成文本、图像和视频。生成式AI的背后就是大语言模型,这些模型的访问渠道是API。开发者可以使用这些API来构建和改进自己的平台,以便融合ChatGPT等服务或他们自己的专有模型。 对于那些从零开始的中国开发者来说,能够使用OpenAI的API是一大福音,他们可以借此访问OpenAI的工具。许多本地开发者,尤其是那些资金不充裕的开发者,更喜欢通过 OpenAI的工具来训练AI系统和应用程序,因为这些工具被视为行业基准。 百度等开始争夺客户 现在,OpenAI威胁要切断这一联系。香港中文大学(深圳)国际事务研究院监管与全球治理中心主任游传满表示:“领先的中国大语言模型可以从OpenAI的限制访问措施中受益,它将有助于从市场中淘汰掉规模较小、效率较低的参与者。与此同时,这将使得中国开发者更难使用全球最先进的AI算法。” 行业专家表示,从长远来看,无法访问全球工具可能会进一步阻碍正在追赶美国的中国AI公司。阿里巴巴董事长蔡崇信已表示,中国本土AI模型至少需要两年时间才能追赶上美国的产品。 大模型行业洗牌 对中国市场而言,这可能有助于淘汰许多在“百模大战”期间创建的小型创业公司。 ChatGPT在2022年末的推出引发了一轮AI热潮,中国AI大模型层出不穷,被形容为“百模大战”。 “大语言模型领域可能会出现一场血洗,我怀疑最终可能只会剩下很少的参与者,”梁忠伟表示,他还是科技播客“亚洲分析”的创始人,“赢家将会非常少,他们将是中国最大的公司。” 自周二以来,包括腾讯、智谱AI在内的至少六家企业和创业公司都希望成为OpenAI的“平替”,纷纷推出激励措施吸引开发者使用自己的产品。 周三,包括阿里、科大讯飞在内的AI相关股票都实现了上涨。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
韩国将向半导体企业提供17万亿韩元低息贷款,现有税收抵免延长
IT之家 6 月 26 日消息,韩国企划和财政部今日宣布了“半导体生态系统综合支持计划”,旨在提升韩国半导体企业的整体竞争力,确保该国在全球半导体竞赛中的领先地位。 韩国政府计划向韩国产业银行投资 2 万亿韩元(IT之家备注:当前约 104.62 亿元人民币),建立 17 万亿韩元(当前约 889.27 亿元人民币)规模的半导体企业低息贷款计划,并从 7 月开始就向韩国国内半导体企业提供低息贷款。 与韩国产业银行的一般贷款相比,该贷款将对大型半导体企业给予 0.8~1.0% 的利率优惠;中小型企业的利率优惠更大,达 1.2~1.5%。 在这一计划的支持下,韩国半导体企业将能以更低的成本筹集经营资金,进一步发展自身业务。 图源 Pixabay 韩国政府目前对包括半导体、二次电池、显示技术在内的“国家战略技术”产业提供税收抵免优惠,具体抵免比例为设施投资的 15% 和研发投资的 30~50%,不过现有优惠将于今年底到期。 此次“综合支持计划”将该税收抵免优惠延长到 2027 年,并将先进半导体的材料、元器件、装备相关技术纳入补贴范畴,同时将软件开支和研发设施租金也作为抵免额度计算的基数。 韩国政府目标于 2025~2027 年在半导体研发、商业化和相关人力资源培训方面投入约 5 万亿韩元(当前约 261.55 亿元人民币),扩张 AI 计算基础设施,建设促进先进半导体量产的中试线。 此外,韩国计划到 2027 年将半导体生态系统基金从今年的 3000 亿韩元(当前约 15.69 亿元人民币)扩大到 1.1 万亿韩元(当前约 57.54 亿元人民币),该基金将从 7 月开始对无厂半导体设计企业进行股权投资。 最后,韩国政府也将加强对半导体产业所需基础建设的投资,升级龙仁半导体集群的道路交通和水电力供应。
超20位“大厂高管”,跑步入场大模型
文/王非 又一批大厂高管,投身大模型领域创业。 2023年2月,前美团联合创始人兼高级副总裁王慧文率先下场,随后百度、阿里、腾讯、字节、京东、网易等互联网大厂高管,相继开启大模型创业。 如果从融资进程看,短短一周内,前微软全球副总裁姜大昕,前网易副总裁、杭州研究院执行院长、网易数帆总经理汪源,前百度副总裁、原小度CEO景鲲,相继被爆正进行估值20亿美元新融资,或已完成大额种子轮融资,无疑吸引了大量关注。 而如果从时间角度看,字节跳动大语言模型研发技术专家杨红霞、快手科技知识图谱与大模型Agent技术负责人付瑞吉,则是顶着“大厂高管”身份,最新入场的明星选手。 据猎云网不完全统计,迄今已有22名“大厂高管”,投身大模型创业:其中,出身阿里、百度的高管各有4位;字节、京东、美团紧随其后,分别有3位;腾讯、网易、快手、滴滴、微软则各有一位。 大致归纳总结来看,2023年以前开启创业的“大厂高管”,更多是在大模型热潮后,顺滑地“+大模型”入场。2023年之初,以王慧文为代表的一众大模型创业公司,则不约而同跻身通用大模型、垂直大模型领域。 伴随国内近200个大模型开启“百模大战”,进入2024年,大模型“卷落地”愈演愈烈,一众厂商相继推出落地应用及服务。至于近期新入场的“大厂高管”,则从一开始就默契地选择了明确的细分领域,例如“AI办公助理”、“AI搜索”。 而这也契合金沙江创投合伙人朱啸虎近日演讲的核心:五年以后可能不会再有独立的大模型公司存在,要么只有AI应用公司,要么就是云服务;在中国,AI核心永远不是技术,而是用户体验;千万不要小看任何一个垂直场景,很多垂直场景里面都蕴藏着机会,创业者一定要找到这种能引起客户尖叫的场景。 姜大昕技术+产品双线发力,正进行估值20亿美元新融资 前微软全球副总裁姜大昕,在微软兢兢业业16年,于机器学习、数据挖掘、自然语言处理和生物信息学等方面积累了丰富的研究和工程经验。 前微软副总裁,现阶跃星辰CEO 姜大昕 令人惊讶的是,于2023年3月升任微软副总裁后仅一个月后,姜大昕就注册成立了上海阶跃星辰智能科技有限公司(下称:阶跃星辰),灵感来自阶跃函数(Step Function)。创业的急切,可见一斑。 此后,阶跃星辰鲜有发声。经过一整年的积累沉淀,今年3月,该公司方才于正式对外发布Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版,并宣布提供API接口给部分合作伙伴试用。 阶跃星辰表示,基于“多模理解和生成的统一是通往AGI的必经之路”这个认知,团队认为,模型的演化必然会经历单模->多模->世界模型三个阶段,“OpenAI就是一直在沿着这样的一条主线、两条支线推进它的AGI计划”。 于是在一开始,阶跃星辰就沿着这条演化路径希望做好每一个节点,“我们在万亿参数和多模融合的新战场上,来得刚刚好。” 不只是自研大模型,阶跃星辰也早早地走上了“技术+产品”双线发力的道路。伴随Step系列通用大模型的发布,公司基于Step-1和Step-1V千亿参数大模型的产品效率工具跃问和AI开放世界平台冒泡鸭已经全面开放。 其中,冒泡鸭App提供了海量智能体,主打休闲娱乐,“在这里,你可以探索故事、创作角色,沉浸属于你的开放世界。” 6月13日,阶跃星辰旗下跃问App正式上线,定位为“AI小助手”,可以实现拍照问答、智能搜索、长文总结、文档理解等功能,致力于“让工作和学习更高效,让生活更轻松。” 据量子位消息,此前,阶跃星辰已获启明创投、五源资本等一线VC投资,公司被爆正在进行一轮估值20亿美元的新融资,且阿里巴巴或将成为其新投资方。 值得一提的是,天眼查App信息显示,阶跃星辰已对外投资一家算力公司——上海智能算力科技有限公司,持股10%,其他投资方还包括云赛智联、仪电集团等。 汪源瞄准“AI办公助理”,种子轮储备2-3年资金 作为一名网易老兵,汪源在网易工作将近18年,离职前担任网易副总裁、杭州研究院执行院长、网易数帆总经理。他参与领导的网易杭州研究院成功孵化了网易云音乐、网易云课堂、网易严选等众多C端产品,以及网易数帆、网易易盾等众多B端业务,是国内连续多次取得成功的企业研究机构。 外界评价汪源,是“为数不多集技术、产品、管理经验于一身的技术专家”。 前网易副总裁、杭州研究院执行院长、网易数帆总经理,现久痕科技CEO 汪源 今年5月22日,汪源在自己的公众号《冷技术热思考》中,官宣从网易离职创业的消息。他表示,接下来我会回到To C市场,随着大模型和硬件供给能力的成熟,生成式AI应用在今明两年会迎来创新的窗口期,特别是在欧美市场。 不到一个月,汪源于6月19日注册成立杭州久痕科技有限公司(下称:久痕科技),并担任法人、CEO。公司名字来自于乔布斯的名言make a dent in the universe,他希望致敬乔布斯和延续网易杭州研究院的创新精神,在业界留下更多痕迹。 据甲子光年消息,久痕科技的愿景是“成为世界级的人工智能企业”,使命是“让知识工作更轻松高效”。公司的第一款产品,定位为“以个人数据为中心的通用办公助理”,核心面向欧美日为主的海外市场,采取订阅制收费。 据汪源介绍,久痕科技的第一款产品“就像一个无时无刻陪伴你多年的秘书,非常了解你的知识、思路和习惯,从而能够高效地帮助你完成参加会议、回复消息、回复邮件、阅读文档、写作报告、管理日程等各类典型的知识工作。” 汪源补充道,“理论上讲,我希望产品尽可能访问用户所有的办公资料,就必须确保处理这些数据的大模型必须在用户本地的端侧大模型,绝对不能采用云服务的方式来提供。因此,这个产品必须依赖于AI PC,当AI PC出现,我们的产品才可能出现。而AI PC现在还在早期,有点像2010年iPhone4刚发布的时代。这是一个创业的好时机。” 而在第一款产品之后,久痕科技计划“以个人数据为中心”为基石,推出更多办公领域的产品,如代办管理、笔记等,力争成为“AI时代的Office”。 目前,久痕科技已经完成种子轮融资,为团队储备了两到三年的充足资金。 汪源表示:我跟资方协议有保密条款,只能说都是美元基金,公司的整个架构也是面向海外市场,尤其是可能到美国去上市。但公司的产研团队是在国内,中国还是有工程师红利在的。 景鲲剑指“AI搜索”,种子轮融资6000万美元 在微软工作期间,景鲲是微软小冰的创造者;加盟百度后,他收获了“小度之父”的赞誉,并因此晋升为百度副总裁,此后更是带领小度成长为估值超355亿元的人工智能公司。 前百度副总裁、小度原CEO,现MainFunc创始人 景鲲 值得一提的是,除了在微软期间的“搜索”工作经历,景鲲在百度时期的相关工作也并未中断。 入职百度伊始,景鲲就职于大搜索任总产品架构师,负责百度大搜索整体产品规划、创新与落地推进。他带领团队大刀阔斧地创新整体搜索体验,为数以亿计的用户提供平等便捷的搜索服务,同时与团队一起开创式地引入了语音搜索、图像搜索、对话式搜索等创新搜索交互方式。 果不其然,景鲲的创业公司,甫一露面就剑指“AI搜索”,而这也被外界形容为——想要再造一个“百度”。 据悉,景鲲携手原小度CTO朱凯华共同创办的AI公司名为——MainFunc,含义为“主函数”。旗下首款AI Agent搜索产品Genspark,已经Beta上线,该产品背后使用了各种大模型来处理任务,包括Meta的LLaMA等开源模型、OpenAI的GPT系列模型。 MainFunc称,Genspark是一种新网页形式,改变了用户与在线信息交互的方式。目前,这款产品主要面向美国市场且免费使用,未来可能会探索付费订阅模式。 2023年以来,随着生成式AI技术在搜索领域的应用,用户搜索内容的结果,从以前的关键词模糊反馈转变为可对话式的精准反馈,极大地提升了用户搜索效率和内容结果的价值,未来该技术将成为搜索引擎行业各品牌打造竞争力的关键,市场前景仍旧宽广。单就谷歌每年向苹果支付180-200亿美元,以保留其默认搜索引擎地位而言,搜索的“钱景”就已无需多言。 既然提到谷歌,就不得不提谷歌搜索备受诟病的“AI 摘要(AI Overviews)”新功能,该功能经常提供严重错误的搜索结果信息。例如,该功能曾建议用户使用胶水来防止披萨上的奶酪滑落。对此,谷歌CEO桑达尔·皮查伊曾表示,这些“AI摘要”功能产生的幻觉是大型语言模型固有的缺陷,并且目前还没有解决方案。 针对“幻觉”这一问题,景鲲在接受TechCrunch采访时称,Genspark的AI模型偏爱具有高权威性和流行度的网页,对过滤掉更多“外面”的信息有很大帮助,“我们非常重视数据质量,我们相信数据质量是赢得这场比赛的关键。” 伴随产品上线,景鲲的新公司也被爆完成6000万美元(约合4.36亿元)种子轮融资,由新加坡基金Lanchi Ventures(蓝驰创投)领投,并得到了其他全球天使投资者的支持,公司估值为2.6亿美元(约合18.88亿元)。
Apple端侧AI奠基性论文解读
今年WWDC上,苹果高调推出了AI战略,还顺带玩了个谐音梗,把自家的AI定义为 “ Apple Intelligence ”。 随着大模型不断Scaling up,推理所需的计算和存储开销也在快速增长。 然而手机的内存资源很有限,这就导致我们很难在手机上直接运行本地大模型。 举个例子,一个7B参数的模型大约需要14GB的内存来加载模型权重。然而,最新的iPhone 15 Pro Max的运行内存只有8GB,远远不够。 如何在有限的内存下实现高效的大模型推理,是端侧AI发展的重要任务。 今年初,Apple发表了一篇可以说对端侧AI有着奠基意义的重要论文,一定程度上解决了这个问题。 这篇论文的标题是《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》,周末我仔细学习了一下,收获很大,分享给大家。 (1)大模型推理的背后:闪存与DRAM 通常来说,大模型在推理时需要将所有参数完整加载到DRAM中。随后DRAM再把模型参数按需传递给GPU和CPU,进行推理运算。 DRAM的容量普遍较小,但是带宽高;相比之下,闪存的容量大,但带宽低。 由于需要在DRAM中加载整个大模型的权重,需要占据较大的DRAM空间。 可是手机的DRAM容量普遍很小,这对移动端本地推理构成了巨大挑战。 为了应对这个棘手的问题,需要用到大模型FFN层的稀疏性。 (2)核心思想:运用FFN层的稀疏性进行动态加载 大模型的Transformer层可以分为Attention层和FFN层。 Attention层的权重参数一直保存在DRAM中,约占大模型权重的1/3,这部分不涉及参数的动态加载。 FFN层的权重参数是非常稀疏的,比如OPT 6.7B模型在其FFN层有着97%的稀疏性,Falcon 7B模型有着95%的稀疏性。 这意味着,每次推理时,FFN层只有很小一部分神经元被激活,大部分权重参数都是0,没有参与推理运算。 因此,我们只需要把这部分活跃神经元加载到DRAM中即可,不需要加载整个大模型,这就大大降低了对DRAM容量的要求。 (3)Predictor:低秩预测器 FFN层的稀疏性主要是由ReLU激活函数引起的。 ReLU激活函数的特点是输出非负值,当输入小于0时输出为0,这导致在FFN层中有超过90%的中间输出为0,产生了高度的稀疏性。 为了不把整个上投影矩阵加载到DRAM中,Apple构造了一个低秩预测器来预测哪些中间神经元会被ReLU激活(即输出非零值)。 这样一来,我们只需要把预测为非零输出的神经元的参数从闪存中加载到DRAM中即可。 (4)Windowing:滑窗动态加载 Apple提出了一种动态加载权重参数的方法,称为Windowing。 相比一次性把整个输入序列都给到FFN层,我们可以每次只输入一个定长序列。 这里需要选择一个window size(比如5),然后每次我们只向FFN层输入5个token的输入序列。 如下图所示,我们先把“Once Upon A Time There”这5个token构成的输入序列给到FFN层。 通过低秩预测器,我们可以推断出这5个token对应的活跃神经元有哪些(绿色),然后将这些神经元数据加载到DRAM中。 随后我们将滑窗向右平移1个token,再通过低秩预测器推断出针对“Upon A Time There Was”这个5 token序列而言,哪些神经元是活跃的。 这5个token对应的活跃神经元和上5个token对应的活跃神经元是高度重合的。因此我们只需要加载小部分新权重(蓝色),并且删除一些旧权重(红色)即可。 这种基于滑窗的边际动态加载机制,有效降低了DRAM的存储要求。 (5)Bundling:行列捆绑存储 在此基础之上,Apple还提出了行列捆绑存储策略,进一步提高了有限内存资源下的推理效率。 当我们要计算一个神经元数据时,需要用上投影层权重矩阵的对应列乘以下投影层权重矩阵的对应行。 这就需要把行、列数据都从闪存加载到DRAM中,需要读取两次。 为了简化操作,提高吞吐量,我们可以把行、列数据捆绑存储在闪存中,这样只要读取一次就好了。 想法很朴素,效果很明显。 (6)实验结果:推理速度提升20-25倍 为了验证以上方法的有效性,Apple用OPT 6.7 B大模型,在M1 Max上进行了测试。 实验表明,当我们把低秩预测器(Predictor)、滑窗动态加载(Windowing)、行列捆绑存储(Bundling)这三种优化方法都用上后,能够在只有6.5 GB DRAM的手机上运行14.3 GB的大模型。(注:6.7 B的16位大模型,对应参数权重大小约为13.4 GB) 换句话说,通过这些方法的组合,能够让手机本地运行两倍于自身DRAM容量的大模型。 与此同时,该方法能够在CPU上实现比传统加载方法快4-5倍,在GPU上快20-25倍的推理速度,I/O延迟从2310毫秒直降到87毫秒,效果显著。 (7)结语:端侧AI的头号玩家 对于曾经开创“iPhone时刻”的苹果而言,人们希望看到它在AI时代能够继续引领浪潮,做到“Only Apple can do”。 前段时间Coatue在报告中详细阐述了端侧AI的巨大投资机会。预计未来90%的推理任务会发生在你的手机和PC上,对日常工作生活的任务请求进行实时响应。 Apple是端侧AI的头号玩家,期待它能推出下一款划时代意义的作品。
OpenAI在国内的两条应用之路走不通了?
接到奥特曼警告信的第一时间,专注出海电商服务的大模型领域创业者高瑞麟,紧急召开了一场办公会,商讨是否需要将公司业务迁移到国产大模型上去的棘手问题。 “迁移,(担心)用户会不会继续买账;不迁移,继续(调用OpenAI API)的话,成本、合规风险等都在提高。” 令高瑞麟陷入两难的,是在奥特曼领导下的OpenAI的一封推送邮件。在6月25日发出的邮件中,OpenAI表示,从今年7月9日开始,将阻止来自非支持国家和地区的API(应用程序接口)服务。受影响组织若希望继续使用OpenAI的服务,必须在其支持的国家或地区内访问。 这也意味着,不在支持地区范围内的中国大陆,将迎接OpenAI的“断供”风险。需要注意的是,ChatGPT爆红以来,OpenAI其实一直未曾开放过中国市场的服务。 国内大模型创业者李振告诉字母榜(ID:wujicaijing),当前国内想要访问OpenAI的API,一般有两个途径:一是直接向OpenAI官方申请,这种方式更多适合个人开发者;二是通过采购微软云服务,间接接入OpenAI服务,这也是当前国内唯一的合规渠道。据李振观察,目前微软云提供的OpenAI接入服务仍可以正常访问。 通过上述两种途径,围绕OpenAI的API,国内大模型玩家也由此发展出了两大应用场景:科技大厂用以帮助训练自己的大模型,在模仿的基础上追求赶超效果;中小企业则用来开发落地应用,在实际使用中向客户提供多样性选择。 对于更有实力和资源的大模型玩家而言,即便“断供”政策正式生效,也可能挡不住它们继续调用OpenAI的API的行为,“在一个全球化的市场中,很难存在彻底隔断某一地区访问权限的可能性,就是需要穿越多少围栏的问题。”关注大模型投资的恒业资本创始合伙人江一说道。 进入2024年,即便已经出现了一众号称性能媲美GPT-4级别的国产基础大模型,但调用OpenAI技术的需求仍然存在。 在江一接触到的合作客户中,有人明确提出希望提供OpenAI技术选项,“面对更开放、更发散性的问答时,OpenAI展现出来的答案还是更强一些。” 这也促使一些应用开发商对不同的模型做起人为分割,简单的问题推理,以及涉及垂类行业问答的场景,优先调用国内大模型,偏复杂推理和分析的内容,就交给OpenAI。 具体运行环节,有点类似当前业内推崇的MoE混合专家模型逻辑,当客户提出一个问题后,借助机器学习的匹配算法,先将问题分类,从而基于分类结果匹配对应的模型服务商。但是否使用OpenAI服务,还取决于客户是否愿意为此多花钱,“充什么样的会员套餐,给你供应什么样的大模型选择范围。”李振解释道。 不同于应用开发者的具体使用需求,那些同样有着自研大模型野心的国内厂商,通过接入OpenAI技术,还能起到辅助刷榜的作用。 知名大模型测试集C-Eval就曾在官网置顶声明,称评估永远不可能是全面的,任何排行榜都可能以不健康的方式被黑客入侵,并给出了几种常见的刷榜手法,如对强大的模型(例如GPT-4)的预测结果蒸馏、找人工标注然后蒸馏、在网上找到原题加入训练集中微调模型等等。 站在OpenAI的肩膀上,从模仿借鉴中快速赶超,则是国内大模型玩家接入OpenAI技术的更重要目的。 去年12月份,字节跳动被爆出正在研发一个名为“种子计划”(Project Seed)的AI大模型项目,但该项目在训练和评估模型等多个研发阶段调用了OpenAI的API,并使用ChatGPT输出的数据进行模型训练。 此举违反了OpenAI的使用协议,根据规则,OpenAI禁止使用输出开发竞争模型。因此,字节旗下部分GPT使用权限被OpenAI封禁。 字节官方坦陈,内部技术团队刚开始进行大模型的初期探索时,确实有部分工程师将ChatGPT的API服务应用于较小模型的实验性项目研究中,但“该模型仅为测试,没有计划上线,也从未对外使用。” 部分国产大模型在训练模型速度上快速起步的一大原因,同样离不开对国外大模型的借鉴。去年11月被传出套壳消息时,零一万物在回应字母榜中承认,在训练模型过程中,沿用了 GPT/LLaMA的基本架构,但需要说明的是,借鉴架构并不能跟“套壳”或者“抄袭”直接划等号。 不过,这确实帮助零一万物缩短了模型研发时间。去年3月,李开复正式宣布将亲自带队,成立一家AI 2.0公司,研发通用大模型。经过三个月筹办期,同年7月份,该公司正式定名“零一万物”,并组建起数十人的大模型研发团队。团队成型四个月后,零一万物便在11月份推出了“Yi”系列大模型产品,并借助Yi-34B霸榜多个大模型测试集。 在OpenAI“断供”危机之下,国产大模型的战略替代价值越发凸显。在李振看来,从经济账上考量,国内公司直接调用国产大模型会是更为划算的选择。 抢在企业迁移之前,一些追求更高收益的个人开发者,已经率先用国产模型替换掉了OpenAI。 2022年11月ChatGPT亮相后,受限于政策,一些人开始盯上国内想要尝鲜的用户,做起了卖号生意。当时,ChatGPT Plus官方订阅价格为一个月20美元,国内用户想要使用,收费一般为共享号(供4-6个人使用)一个月50元左右,独享号一个月170元左右。 但从2023年下半年开始,随着越来越多国产大模型的发布,加上用户对ChatGPT新鲜感的减弱,越来越多个人开发者已经将技术底座从OpenAI换成了国产平替,订阅价格也随之下降,有的连续包年仅需198元。 现在,在App Store应用商店中搜索“ChatGPT”,各类相似应用程序充斥其中,ChatGtp4o、ChatGp4、ChatGp4o、ChatBPT 4.0、ChatGTB4…… 如今,OpenAI的“断供”之举,给国产大模型厂商提供了一次抢夺中小企业用户的迁移机会。 继5月份字节、阿里、百度、腾讯等掀起大模型价格战之外,从6月25日开始,一众国产大模型玩家又纷纷祭出了零成本迁移计划,再次加码性价比之战。 截至目前,包括智谱AI、百度、阿里、腾讯、百川智能、零一万物、商汤科技、月之暗面等均已推出了OpenAI零成本迁移计划。为加速用户“搬家”,部分国产大模型还额外附送1千万乃至1亿Tokens,并配套调用、迁徙、训练等多项免费服务大礼包。 便宜,只是鼓动用户迁移的必要条件。想要真正赢得用户的青睐,国产大模型还需要做到更好用。 去年曾喊出史上最大降价的阿里云,并未能借助价格战换来新的增长。聚焦到国内公有云市场,阿里云市场份额不增反减。IDC发布的《中国公有云服务市场(2023下半年)跟踪》报告显示,2023下半年IaaS市场中,阿里云市场占比27.1%,位居第一。但在2023上半年中国IaaS市场中,阿里云市场份额则为29.9%。 更可况,在国产大模型降价的同时,OpenAI们也在降价。按奥特曼的话说,“OpenAI也可以将非常高质量的AI技术成本降至接近零……” 想要增强大模型底座的产品吸引力,除了价格之外,更重要的比拼则在数据端。 2020年发布GPT-3时,OpenAI曾详细公开了模型训练的所有技术细节。中国人民大学高瓴人工智能学院执行院长文继荣表示,国内很多大模型其实都有GPT-3的影子。但随着OpenAI在GPT-4上一改开源策略,逐渐走向封闭,一些国产大模型就此失去了可供复制的追赶路径。 此后,各家大模型拉开技术差距的重点,越来越多体现在训练方法、数据配比、数据工程、细节参数、训练过程监测技巧等细节之中。 即便在模型框架相同之下,不同的数据来源和数据训练方法加持下,最终训练出来的大模型性能依然会表现各异。“前大模型时代,AI的主流是以模型为中心的单任务系统,数据基本保持不变。进入大模型时代,算法基本保持恒定,而数据在不断增强增大。”在产业专家刘飞看来,相比算法和算力,数据可能是眼下阻碍国产大模型追赶OpenAI步伐的更大鸿沟,“魔鬼都藏在这些数据训练的细节里。” 在国内大模型纷纷跨入万亿参数时代之后,对数据采集和训练的能力考验再次提升。参数量的大小与最终模型呈现的效果之间,两者“投入产出并不成正比,而是非线性的。”刘飞表示,“数据多只是一个定性,更重要的是考验团队数据清洗的能力,否则随着数据增多,数据干扰也将随之变大。”
Mac版ChatGPT应用人人可下!GPT-4o语音功能却再鸽一个月
编辑:耳朵 庸庸 【新智元导读】今天凌晨,OpenAI官方账号宣布,ChatGPT MAC版本桌面应用程序今日起向公众免费开放使用,但原定于6月底向Plus用户开放的语音功能将推迟一个月上线,据悉这是出于安全因素和用户体验的保证。 适用于macOS的ChatGPT桌面应用程序现已可供所有人使用了!该应用程序是在今年早些时候公司的春季发布会上与其他更新一起发布的。 只是,OpenAI推迟了千呼万唤的GPT-4o新高级语音功能的发布,理由是需要进一步改进。 ChatGPT Mac版本向所有用户开放 虽然语音功能爽约,但ChatGPT桌面应用程序,这回终于向所有用户开放了,不过只适用于MacOS,Windows用户仍要等待。 像之前演示的那样,用户可以和ChatGPT随时展开聊天,各种类型的输入ChatGPT都可以hold住,用户可以上传文件、照片以及屏幕截图,还可以选择文档中的一段文本向ChatGPT提出问题。 快速调用 桌面应用程序使ChatGPT比其网站更易于访问,因为用户可以使用Option+Space键盘快捷键从任何屏幕触发它。 屏幕会弹出一个类似于Apple Spotlight功能的搜索栏,用户在其中输入问题就好。 截图 编程时遇到问题,直接截屏提问 点击ChatGPT搜索栏右侧的耳机图标,就可以从桌面开始与ChatGPT进行语音对话。 只可惜,Sky已经下架,用户现在仅可以从四种语音风格中进行选择:Breeze、Ember、Cove 和 Juniper。 自推出以来,适用于macOS的ChatGPT只向高级用户开放。目前,该应用程序开始向所有用户开放。 除了macOS之外,OpenAI已经拥有适用于Android和iPhone的原生ChatGPT应用程序。 只是,ChatGPT的Windows桌面应用程序还在制作中,感兴趣的用户将不得不等到「今年晚些时候」。 GPT-4o语音功能推迟交付 Open AI表示,他们还需要一个月的时间来实现之前在春季发布会上演示的GPT-4o语音功能。 原定计划是「在6月底向一小部分ChatGPT Plus用户推出alpha模式」,但现在这个日期向后推迟了一个月,也就是说,灰度测试将在7月开始,所有Plus用户都能使用则要等到秋季。 延迟出于两个方面的考虑:安全和用户体验。 OpenAI希望提高「模型检测和拒绝某些类型内容的能力,从而可能防止滥用并确保负责任的AI交互」。他们还专注于「改善用户体验并准备好他们的系统来处理数百万用户的计算量,同时保持实时响应」。 我们在此分享春季更新中演示的高级语音模式的最新进展,我们对此仍然非常兴奋: 我们原计划在6月底向一小部分ChatGPT Plus用户推出alpha模式,但还需要一个月的时间才能达到推出的标准。例如,我们正在改进模型检测和拒绝某些内容的能力。我们还在努力改善用户体验,并准备将我们的基础设施扩展到数百万用户,同时保持实时响应。 作为迭代部署策略的一部分,我们将从一小群用户开始进行alpha 阶段,收集反馈并根据所学知识进行扩展。我们计划在秋季让所有Plus用户都能使用。具体时间取决于能否达到我们的高安全性和可靠性标准。我们还在努力推出我们单独演示过的新视频和屏幕共享功能,并将随时向您通报这一时间表。 ChatGPT先进的语音模式可以理解并回应情绪和非语言暗示,让我们更接近与人工智能进行实时、自然的对话。我们的使命是为您带来这些贴心的新体验。 对OpenAI「拖延症」发作,网友们表示见怪不怪,推迟发布属于基操。 笑死,「几周」变成了4-6个月,OpenAI基操。 网友甚至预判「计划在秋季让所有 Plus 用户都能使用」,言外之意是取秋季三个月的deadline。 别忘了各位,秋天包括九月、十月、十一月。 甚至有用户表示对OpenAI诚挚的道歉和延期的理由并不买账,发出退订威胁——OpenAI屡次向用户「画饼」,对用户的承诺提前好几月就侃侃而谈,功能的交付却永远在路上。 或许到了我该退订的时候了… 太长懒得看:过早的承诺然后永远在交付途中…又一次这样了。 也有网友用Claude研发速度和成果催促OpenAI,别睡了!起来交货! Claude正在交货,OpenAI睡得正香。 可以看出,网友对OpenAI推迟语音功能的大众情绪多为失望和不满,质疑OpenAI是为了吸引Plus用户订阅而夸大其词。 reddit也新开了一个讨论贴,为什么人们对4o语音如此不耐烦或渴望? GPT-4o是OpenAI公司最新的GPT4版本,在发布会上最引人注目的特点就是像与真人对话的丝滑流畅,甚至能识别用户的情绪且响应速度极快。 因此,对于语音功能的完全上线用户们自然是望眼欲穿,语音作为多模态输入的一个重要部分也将大大提高用户的使用效率和使用体验。 发布会展示的语音功能对话0延迟,功能交付却延迟一个月,期待落空自然引起大批用户的不满。 高赞评论是—— 不耐烦的情绪一方面来自OpenAI的种种前科,一方面来自对于这种屡次「事前画饼,事后道歉」的行为,把话说满,虚假宣传,对于大公司来说,会逐渐消磨它在大众中的公信力。 如果他们解释说发生了他们无法控制的事情,我会多宽容谅解一些,但也不会太多...... 像这样提前宣传的事应该是违法的。 如果你的所有客户目前无法购买到商品那么你就不能宣布或泄露它。 这并非没有先例。在首次公开募股(IPO)的静默期,你不能进行市场推广或任何形式的公开宣传。 这个规定一直沿用至今,我敢肯定,公开市场对这个规定也没有异议。 问题是他们提到的是「未来几周」。要知道,OpenAI 是一家大公司,人们当然很容易相信他们。你知道,就像你在网上买东西一样,在你真正收到东西之前,你无法确定它是否是真的。如今,连评论都可能是假的。 灰度测试 TestingCatalog发布的一则推文透露了与语音功能灰度测试有关的讯息。 「It is coming!」 ChatGPT Voice Alpha 邀请界面 ChatGPT iOS应用程序再次更新,新增了一些UI组件,这些组件可能会向即将推出的高级语音模式的alpha测试者展示。 在邀请界面,我们可以看到最重要的几点在于—— - 自然对话,实时回复 - 具有情绪和语气,能够感知和回应幽默、讽刺等 - 视频聊天,轻点相机图标即可分享周边环境 虽然一些用户对推迟表示失望,但OpenAI专注于在发布前把事情做好是有道理的。希望当高级语音模式和新的多模式功能真正到来时,将会带来更好、更安全的体验。
联想昨天除了请来迪丽热巴,还掏了台高通芯片的笔记本…
今天下午的联想发布会,不知道差友们是否有关注,反正托尼一个半小时的全场看下来,脑子里,热巴真好看,咳咳,全是 AI ! 先给大家省个流:整个联想发布会,分为三个部分,新的笔记本,新的 AI 功能,以及迪丽热巴。 其中最值得小伙伴们关注的应该就是 ARM 架构的 Windows 笔记本了。 传统笔记本厂商们被苹果的 ARM 处理器打得抬不起头,这回有了高通助阵能不能扬眉吐气呢? 下面咱们就来详细唠唠! 首先就是这场发布会首推的笔电新品 Yoga air14s AI 元启版 “ 元启 ” 这个称呼我应该不用解释了,今年联想所有和 AI 功能沾点儿边的电脑,都被扣了个 “ 元启版 ” 的尾缀。 重点在于骁龙——没错,这玩意大概率会是国内第一款量产销售的骁龙 X Elite 处理器的 Windows ARM 笔记本。 给不太清楚的小伙伴简单讲一下,高通的这颗 ARM 电脑处理器最近基本上被吹疯了,因为有着相当于 1.5 倍苹果 M3 处理器的性能释放,联想这次极力宣传的 AI 性能和强大续航,就是这颗芯片带来的。 所以从微软到厂商,都在很努力的宣传这款处理器,并且以往我们非常熟悉的电脑型号:联想 YOGA 、戴尔 XPS 、华硕灵耀。。。今年都表态说,要发布基于高通处理器的 Windows ARM 版本。 但不用想也知道,高通 X Elite 虽然比苹果 M3 强,但和苹果 M3 Pro 、 Ultra 之类的处理器还是没法比。 所以今年 Windows 阵营这边主要宣传的还是续航,以及本地的 NPU 算力。 要我说,能够在苹果之外多一个真正高续航的轻薄本选择,其实挺好的,但是这次 YOGA Air 14s 的首发价足足比去年贵了 1000 。 突然感觉苹果变得有性价比了起来。。。 好了,说归正题,硬件上,这台电脑有 70 Whr 的大电池, 3K 分辨率、三星 E7 材质的 OLED 全贴合触摸屏,峰值亮度可以达到 1000 尼特。 此外,联想还介绍了他们的 “ 史诗级提升 ” ——三个站。 别看这么多站。。。其实这功能就是在联想生态的手机、电脑、平板上,不用流量,快速互传照片,文件,视频等,此外,窗口可以做到移到另一设备上。 至于像这个慧眼识屏功能,也不新鲜,就不过多介绍了。 虽然这些功能,都是在苹果,华为等手机厂商上面已经发布的东西,但这从卖电脑的厂商嘴里说出来。。。还挺新奇的。 而在 AI 方面,发布会还提了一个有意思的功能,联想通过刚才提到的这三个站,把 AI 功能也做成跨设备互通了。 不过这次官方只是演示了在手机上给 AI 下达指令,让 AI 获取电脑上的文件,整理出一个 PPT 。 不过。。。我们既不知道这个 PPT 质量如何,现场也并没有实机,托尼推测这个功能的完成度恐怕不高,距离真正和大家见面还要一段不短的时间。 另外,很多差友会担心, ARM 架构应用和游戏的兼容性问题。 这个担心确实很有必要,毕竟不是所有买 ARM 架构笔记本的人,都是忙到不打游戏的商务精英。 我们普通人花近万元买台笔记本,肯定要尽可能的满足我们现在,以及未来可能的需求。 托尼之前去体验过微软搭载同款芯片的笔记本,正好可以给大家简单解释一下。首先,日常办公方面,可以说已经非常流畅了,和常见的 X86 架构笔记本基本没差别。 而软件兼容方面,这两年 ARM 架构笔记本的进步更是十分明显。 比如高通月前就声称,骁龙 X Elite 处理器不仅能兼容我们常用的所有应用,还支持超 1200 款游戏,并和多家游戏厂商合作,后续会继续扩展。此外, 6 月的时候,微软还小更新了一波,进一步扩充了 Arm 游戏生态。 下面和大家分享一下一些媒体对 X Elite 处理器的兼容性测评: 左右滑动图片 不过,托尼有和工程师聊过,目前 Win on ARM 的瓶颈还是在于内核层。如果应用的驱动涉及内核,就会导致仿真技术无法转译,模拟。 因此,对于一些内置反作弊器驱动的游戏来说,就会出现闪退,或者根本打不开的情况,比如 Apex , PUBG 等。 还有个很有意思的事,联想这次发布会一开始说了要发布三款新品,除了Yoga air 14s AI 元启版,其实还有拯救者 Y9000P AI 元启版和 Yoga air 14c AI 元启版。 但这两台的演示内容非常少,只有两三分钟的内容,并且还是照读 PPT 。 照读 PPT 这联想的老传统,咱可以不计较,但你也不能因为机器卖的贵,买的人比较少,就不上心啊! 另外,小伙伴们还要注意的是 14c 这台笔电, CPU 换成了 intel 的 Ultra7 155H !这颗芯片的 AI 性能和续航可不如骁龙 X Elite 芯片。 虽然芯片比不过,但 14c 也有优点,多了一块屏幕和触控笔,可以反转触屏,大家可千万别买错了。 接下来,咱们来唠唠,虽然芯片不是很好,但是颜值很高的小折叠屏手机—— Moto razr 50 Ultra 其实小折叠手机的好,真的很两极化,想必,联想也知道 CPU 和性能没什么好说的,所以全程就主打两个卖点,一个是 “ 颜值 ” ,一个是 “ 便捷 ” 。 左右滑动查看图片 所以你可以看到,热巴一上来,就在用这个小折叠手机给舞台下的大家拍照录视频。 并且,在互动环节,联想展示了他们的 “ 史诗级 ” 便捷操作,一体多端,将热巴的照片和拍摄的视频,发到联想的 PC 和 Pad 上。尽管他们也知道,大家关注的重点,是热巴,还有热巴的签名。 有一说一,这次联想的小折叠屏手机,不仅配色确实称得上美丽,这个价格其实在小折叠里面也算的上美了! 假如觉得 Ultra 贵,还有普通版给大家选择,两者的区别主要在芯片,屏幕刷新率,以及后置摄像头上。 简单总结下: Ultra 用的骁龙 8s gen3 ,内外屏刷新率 165Hz ,后摄索尼 5000 主焦 +5000 长焦, LPDDR5x ,电池 4000mAh 。 普通版用的天机 7300X ,内屏 120Hz ,外屏 90Hz ,后摄 5000 主焦 +1300 长焦, LPDDR4 ,电池 4200mAh 。 不得不说,联想这波刀法砍的真挺狠得,托尼建议,大家如果喜欢小折叠的手感,想买还是尽量上 Ultra 版。 除非你一点不追求高性能芯片,并且预算实在有限,还想要体验这个热巴都说好的小折叠。。。 既然你都找到这么多理由了,那托尼还能说什么呢,普通版体验一下也行,毕竟千金难买我乐意,千金散尽还复来嘛! 总体的来说,这次联想 AI 元启发布会,官方对于什么是重点可以说是心里十分有数。 完美做到,整场发布会看下来,让大家头脑里的印象,就只剩下两个重点——联想极力推崇的 AI PC 体验,以及挎着小折叠手机的热巴。 要是能少点儿老干部风的 PPT 棒读环节就更好了。 而除了营销定位准确以外,从联想的一些功能上,我们也可以看到联想这样一个 PC 终端厂商,也在努力给用户做一些新东西。 比如 AI 跨设备整理 PPT ,跨设备查看文件等等。。。官方还提了一嘴,之后会开发1500+ AI 小程序,至于到时这个小程序做的怎么样,谁也不好说,但至少目前联想的路子是走对了,还是可以期待一下的。 其实就是在系统里给 Kimi AI 一类的产品做了个包装,没啥技术含量,但确实方便了使用。 还有这个据说是 7 月会发布的 Pad ,看直播中展示的这个背壳孔位,托尼还挺感兴趣的,可惜官方也就展示了下,连开机都没。。。 从联想的宣传的这个 “ 一体多端 ” , “ AI 生态 ” 来看,很明显是想走苹果和华为的路子,只不过华为是从手机起家,而联想则是以电脑起家,本质都是统一生态。 如果说,苹果让大家见到了统一生态这条路的宽和广,那么华为的成功,则是让大家看到了这条路,国内也可以走,并且可以走的好。 而随着联想迈出这一步,未来肯定会有更多有实力的厂商加入到他们行列,接下来的市场,可能要更好玩了。 撰文:云笙 编辑:米罗 & 面线 美编:萱萱
说出来你不爱听,我支持搜索引擎收费
如果每搜索 10 次,就要付一块钱,你还会用搜索引擎吗? 可能有差友听到这,觉得它都不是 “ 用不用 ” 的问题了,而是 “ 老子喷不喷 ” 的问题。 毕竟从我们接触互联网开始,谷歌、必应、百度、搜狗这些搜索引擎一直是免费的。随意地在互联网世界里探索,早就刻在我们的 DNA 里,成为固有的行为习惯。 结果现在跟我说要钱?直接报它名字,你看我干不干它就完事了。 别急,那些老牌的搜索引擎,还真不敢随便收费。 敢收费的,是下面这个叫 Kagi 的搜索引擎,两年前刚推出。 每个 Kagi 用户只有 100 次免费搜索机会,用完了就得开通会员。 会员分为三档。 最便宜的是 5 刀 / 月,但只能搜索 300 次;中间档是 10 刀 / 月,搜索次数没有上限;最贵的 25 刀 / 月,可以提前享受到新功能。 这个定价不知道差友们怎么看,反正咱们编辑部觉得贼贵, 5 美元的那档都不够用。 不过 Kagi 也搬来一套调查数据,说谷歌用户平均一个月也就搜索 100 次。 行,我们就姑且 5 美元够用了,那一年在搜索引擎上花 400 块,差友们也不乐意吧。 但你猜怎么着? 就在 5 月份, Kagi 已经实现盈利了。并且人家还表示如果维持这个增长势头, 3 年内付费用户会到 100 万。 看着你可能会纳闷,不儿?到底哪些人在用 Kagi 啊,这是谷歌不够用了,还是钱能扫码租来了? 差评君也不理解,特地体验了下 Kagi 。 体验完吧,我觉得 Kagi 其实没啥太多领先的地方,它能被大家看上,只有一个重点—— 没有广告。 不是差评君说,现在搜索引擎的广告真的太多了。有时一整页滑下来,没有一个答案是没被钱污染过的。 噢我不是在针对谁,我是说:在座的主流搜索引擎, all of you. 比如我想搜 “ 如何重置 Windows ” ,我期望看到的,是教我如何在设置里重置 Windows 。 可是 Bing 提供的搜索结果里,前三个点进去全是装机软件的广告。 同样的,差评君最近头发掉得有点快,那我搜 “ 秃头 ” ,就是为了解下秃头相关概念。 可百度倒好,直接给我快进到了植发医院。 如果你想知道哪个耳机最好用,肯定是要看一些第三方测评的。 可你在谷歌里输入 “ best headphones ” 后,一股脑出现的是广告主的耳机,价格和链接都给你标好了,点击就能购买。 类似情况,我相信大伙都遇到过,也都想吐槽一下。差评君前段时间还刷到个新闻,说钉钉总裁都忍不了了,直接在大会上点名某度。 我们再来看下 Kagi 的搜索结果。 搜 “ 如何重置 Windows ” ,它给出的前三条结果分别来自 ASUS 、知乎用户回答、 Windows 官方。 点开链接后,他们都提供了我想要的答案:如何在设置里重置 Windows 。 同样的,如果搜 “ best headphones ” ,第一行就是各大社区讨论的帖子,后面两行是媒体测评多款耳机,针对不同人群做不同推荐的文章。 可以说,用了 Kagi 我们很容易找到自己想要的结果,不会被广告耽误了时间,影响了判断。 除了无广呢,Kagi 也有一些新颖的功能。 比如它支持高度定制搜索结果。 你觉得一个网站靠谱,可以拉高它的权重,这样它在搜索结果里的位置会更靠前。讨厌一个网站,也可以降低它的权重甚至完全屏蔽它。 在 Kagi 社区也有个性化排行榜,供你参考有哪些网站是经过大家认可的。 此外 Kagi 也接入了 AI 能力。 你可以单独对一篇网页进行概要总结,也能提取整个搜索结果页面里的重要内容。 最后 Kagi 还有个独特的设计。 传统搜索引擎的 PageRank 算法,会让引用次数多的大型网站排在更前面。那些小众但高质量的网站,就很难被大家挖掘。 和谷歌类似, Kagi 也支持你选择搜索的范围,比如学术、论坛、新闻,但它很巧妙地添加了 Small Web 这一类别,让你发现那些小众网站。 目前来看, Kagi 发展势头非常好。它的社区很活跃,那些利用 SEO 跑到结果前列的垃圾网站,很快会被官方 Ban 掉。 差评君在网上时不时也能刷到 Kagi 的好评。 有人专门写了一篇博客,阐述自己为什么开始使用 Kagi ;有人说用 Kagi 后很少会搜到垃圾网站了;还有人尝试了一个月后,直接发起了年费家庭组的拼车。 看完差评君的介绍,不知道大伙儿发现没有,Kagi 有个和老牌搜索引擎不一样的地方: 谁的网页排在前面,不是因为谁给的钱多,而是用户自己决定的。 这种以用户为核心,不被广告架着的搜索引擎,其实就靠着一个大胆的决策—— 问用户收费,而不是问广告主。 当然了,我知道很多网友无法接受付费搜索引擎,有人觉得内容是别人创作的,凭啥厂商用搜索引擎来赚钱? 但要差评君说,付费搜索引擎的存在是个合理的事,甚至是个好事。 别急着喷我,咱分三点说。 第一点。 这种整合信息,赚个 “ 信息差 ” 的行为没任何问题,因为搜索引擎的建立和维护都需要成本。 你要做爬虫,在网络中获取网页内容;要做索引器,解析并分类内容;要数据库,储存索引和存档;要做前端服务,响应请求;要不断优化的结果排序算法,来提升用户体验。 在数以亿计的网页里,每一个架构的建立都会耗费巨大成本,如果它不收费,就没法运营下去。 好比你在一个陌生地方晕头转向,这时有人画了张地图。你有需求,你买地图,你掏钱,没毛病。 可能有差友看到这会说,那谷歌、百度怎么不收钱。 这就是第二点:其实百度、谷歌也是 “ 收费 ” 的。 2023 年,谷歌在美国的广告收入达到了 760 亿美元,按当时 2.74 亿美国用户计算,每一位用户每月能给谷歌带来 23 美元的广告收入。 换句话说,你在用搜索引擎的同时,搜索引擎也在利用你赚钱。 只不过它们拿走的不是你的钱,而是你的时间和偏好数据。这两者相对钱来说,我们没那么敏感,所以我们才会一直以为 “ 搜索引擎是免费的 ” 。 好,我们再说第三点。 现在整个搜索引擎行业的商业模式都陷入了死循环,有个付费搜索引擎,反倒是好事。 我们把时间拨回到上世纪 90 年代,随着互联网飞速发展,网页数量也在指数爆炸级增加。 为了帮大家更容易找到需要的信息,两名斯坦福大学的学生谢尔盖 · 布林和劳伦斯 · 佩奇研究出了 PageRank 算法,从此一个叫谷歌的公司诞生了。 当时,俩人都很反对在搜索引擎里使用广告弹出窗口,也反对 “ 广告资助的搜索引擎 ” 模型。 1998 年,他们还发表了《 大型超文本网络搜索引擎的剖析 》白皮书,在里面库库一顿表态,说要维护无广告的搜索引擎: 由广告资助的商业搜索引擎,本质上就是会偏向广告商,远离消费者的需求。从消费者的角度来看,搜索引擎越好,消费者找到他们想要的答案看到的广告就越少。可这又会侵蚀搜索引擎的广告商业模式。 不管是当时还是现在,这两位大学生的发言都是魅力十足,能吸粉无数。 但现实可不是乌托邦。 公司成立没多久,两位帅哥的想法就变了,谷歌里开始出现简单的文字广告。 一开始,广告还会带有明显的背景色,便于用户区分。那会谷歌员工还会嘲讽百度,说百度把广告做得跟原生搜索结果没区别。 但渐渐地,广告背景色越来越淡了。在 2013 年,谷歌干脆取消了背景色,取而代之的是一个 “ Ad ” 的广告标签。 半年后,细心的人们又发现 “ Ad ” 标签也变小了,宽度从最初的 40 像素变成了 22 像素。 再到后来的某一天,人们突然发现,谷歌里的广告不仔细看都分辨不出来了。 当初那个拒绝广告的搜索引擎,就在 “ 用户识别水平提高——广告主不满意——广告变得更像搜索结果——用户识别水平再度提高 ” 的过程中,彻底变成了广告的模样了。 差评君寻思,这要再循环个几十年,咱不得戴着显微镜上网了? 其实我不认为搜索引擎有广告就一定是坏事。 相反我也支持他们采取这种商业模式,因为只有无门槛,才能让所有人都能遨游在互联网海洋里。 可一旦选择了广告模式,就必须要在用户和广告主之间找到平衡。保证利益的同时时也要保证体验。 但让这种平衡又很难维持。 引擎要维护吧,公司也要开展新业务吧。为了赚取更多利益,用户的体验就逐渐被忽略,成为了牺牲品。 当然了,百度、谷歌们肯定考虑过付费搜索引擎。 但付费就意味会拦截大部分网民,而搜索引擎又是一个赢者通吃的行业,用户们选中一个后就不会再更换,这就导致广告商业模式在行业里不断死循环,没人愿意尝试新模式。 所以现在,有一个付费的搜索引擎出现了甚至还能盈利,差评君觉得是个好事,搜索引擎行业的窘境可能要被打破了。 如果国内有一个付费搜索引擎,定价也合理的话,那差评君绝对第一个支持。 因为免费搜索引擎的商业模式就是一场博弈。 他们在大海里撒网,而我们利用自己的经验,靠着走位身法,闪转腾挪,来躲避广告的捕捞。 但说实话,这么多年了,每天都在反复上演的尔虞我诈,勾心斗角的博弈,我确实也受够了。 撰文:刺猬 编辑:莽山烙铁头 美编:萱萱 图片、资料来源: A visual history of Google ad labeling in search results Kagi blog.What's next for Kagi? Wikipedia.History of Google The Anatomy of a Large-Scale Hypertextual Web Search Engine 0x01 byte.2024 年,我为什么开始为搜索付费
原生鸿蒙还有惊喜?这下手机空间有救了
兄弟们,经过这几天的深入研究,我发现了华为 HDC2024 上很少提及却很重要的一件事—— HarmonyOS NEXT 在数据管理上变了! 简单来说,就是 HarmonyOS NEXT 重写了文件服务框架,推出全新分布式智能数据底座。 基于这个新的数据底座,云空间将成为鸿蒙数据中枢。 这让数据更安全可控,同时手机端云空间的利用率也能得到提升。 这样说可能大家不太理解,我举个例子吧。 用户在小红书上选一张照片发动态,在以前只能是系统给小红书一整个读写的权限,好比给一把钥匙,应用就能看到全部内容。而在 HarmonyOS NEXT 上,系统不会再开放一个完整的权限,而是在用户单次授权下,小红书自己 “ 说 ” 要哪一张,系统再让文件服务框架中的照片选择器( photo picker )去把这张照片找出来给到小红书。 这样的数据管理方式,相当于在数据和 APP 之间,增加了一个类似于管家和保安的角色,杜绝了万一第三方不老实,通过偷摸访问这些数据来获取我们隐私的问题。 这就是为什么说数据变得更加安全可控了。那云空间的利用率也得到了提升,这一点又该怎么理解呢? 是这样的,HarmonyOS NEXT 做了一个大动作——就是把云空间下沉到系统层,进而把端、云存储空间合二为一,让云空间在数据管理上发挥更大的作用。 相信大家现在都习惯了用 “ 云服务 ” 来存文件、存照片。文件、照片存上网盘后,把本地的删掉,手机内存能轻松不少。但再想拿以前的照片发个微信、朋友圈什么的,就没法直接选择到了,除非你把文件又重新下回来。 但现场华为的专家跟我讲,以后 HarmonyOS NEXT 上,云空间就能解决这个问题。 有了新的数据访问规则后,云空间就能做到端、云数据一把抓,统一调度、统一管理。 除此之外, HarmonyOS NEXT 还升级了 “ 优化设备存储空间 ” 这个体验。 大家估计都纠结过自己应该买多大存储的手机吧,前几年还觉得 256GB 的就行了,买了 256GB 发现 512GB 才够,买了 512GB 之后又后悔没买 1TB 。 不光是 “ 小而美 ” 占空间,其实这几年手机相机突飞猛进,底大像素高、视频拍的又顺手,这些也都是 “ 内存杀手 ” 。 托尼之前也偶尔会用到系统自带的 “ 释放本地存储空间 ” 功能,想起来就点进去,手动定期释放空间,挪一部分的数据上云,后面就犯懒了,导致我手机经常满了再折腾。 然而在 HarmonyOS NEXT 里,这一整套流程升级成了一个系统开关。 只要你开启 ” 优化设备存储空间 ” ,系统就会自动根据手机空间余量、当前使用习惯、手机功耗等综合因素选择最优空间释放方案,像极了一个全自动化的收纳师。 比如它其中一个策略是,手机空间快满了,就会自动把一部分最早期且使用率极低的图片搬运至云空间,很合理好吧。 再加上我们刚才也说了,现在 HarmonyOS NEXT 里能做到调取云空间的文件与本地一致的体验。 所以,哪怕是在云端的图片,我们在发小红书笔记时,也能通过系统的图片选择器直接调用。 对了,为了节省你的流量费,华为的策略是:图片在用户确定选中使用后,才会下载下来。 而且华为因为有专门的网络优化模块,保证下载速度,尽量让云端和本地的数据在调取速度上没有体感上的差别。 这么一套逻辑下来,既保住了我们手机空间,又能有丝滑体验,完美阐释了什么叫 “ 既要又要 ” 。 托尼在现场听完这些描述之后,还是很兴奋的,心想这也太方便了,不但能把云端空间当成手机自己的空间用,就连清理手机空间这个操作都省了,不用再对着手机管家纠结这个文件云端是不是有备份、删了之后还能不能找回来。 但细想又忍不住担忧:这样对于用户而言确实是会更方便的。但是站在应用开发者的角度看,这些改动带来不小的工作量,开发者们会不会直接被劝退了? 面对这样的担忧,华为专家跟我讲,完全不必担心。实际上这样的做法也给开发者带来了很大的便利: 比如选择相片和文件的时候,因为是系统统一提供相册和文件选择器,所以应用可以选择直接调取系统的文件服务框架接口,不用自己再考虑怎么呈现相册画面和选择逻辑之类的,省心多了。 对于云空间的写入开发,则比以前更省事儿了。 以前安卓的开发者们想要让自己的应用把数据传到云端去,就必须自己在代码里植入一个叫 “ 同步 SDK ” 的部件。 也就是说,以前要想用华为自带的同步服务,光靠系统还不够,还得自己修一座连接云空间的桥。 这不但要求开发者对同步 SDK 非常熟悉,而且光看描述也能看出来,按照这一套逻辑写出来之后,代码的执行效率也会非常低。 只是同步个文件而已,就要走这么曲折的路。 现在云空间直接帮你把这个活给干了,每个独立 APP只需要接入系统,就能直接调用同步服务,再也不需要单独开发了。只要把数据和系统对接上,就能用云空间这个传送带,直接数据上云。 开发者们只需要将数据按照统一的数据标准处理好,剩下就交给系统就可以了。 而且不单是端云同步,像是什么共享剪贴板、拖拽、系统分享等等这些涉及到跨应用、跨设备的功能,也不需要开发者再去重复适配,只要跟文件服务框架说一声就可以了,它都会处理好。 当时 HDC 现场华为专家跟我说,就这一项端云一体化的设计,能给第三方开发者们节省 90% 的代码量。 聊了这么多,不知道大家有没有感觉到,数据管理体系这类比较晦涩难懂、离普通用户比较远的底层概念,最终也会通过云空间这样的上层功能影响到了用户的实际体验。 云空间甚至因为与 HarmonyOS NEXT 数据管理体系有了更紧密的联系,在数据管理上获得了更多的可能性,成为鸿蒙数据中枢。 包括我们之前跟大家聊过的 HarmonyOS NEXT 上的 AI 、全场景互联,这些优秀的体验都需要出色的系统设计逻辑支撑。 这个道理其实厂商们都懂,也经常在各种场合提起。 问题的关键就在于真正开始做的时候,是从体验和功能侧着手,往后再逐步优化底层的逻辑;还是直接从底层出发,设计好统一的系统底层逻辑之后,再去适配各种各样的功能和应用。 很明显 HarmonyOS NEXT 选择的是后者,作为一个全新的系统,选择这样的思路无疑是极具前瞻性的,当然也意味着要克服更多的困难。 好在从目前的成果来看, HarmonyOS NEXT 算是开了个好头。 技术上,华为凭借多年的安卓二次开发经验,对于系统设计可能会遇到的问题,展现出了敏锐的觉察力,及时规避了不少安卓系统上累积多年的弊端。 至于怎么让更多的开发者快速接受的问题,除了我们今天讲的, HarmonyOS NEXT 能从应用开发者手里,主动接过一部分的开发工作之外, HDC 上提到的与伙伴共建 “ 样板间 ” ,也体现了华为在降低开发者适应难度上的努力。 那后续已经站在巨人肩膀上的华为,能不能看到巨人一路走来踩过的坑,在自己成为巨人的路上避开这些坑,我们就拭目以待吧。 撰文:施昂 编辑:结界 & 米罗 美编:焕妍
你可以向 Apple Watch请假了?很荒谬,但也很真实
你可以向你的手表「请假」了。 在最新发布 watchOS 11 中,苹果为健身记录圆环加入了更多自定义选项,其中就包括能够暂停圆环一天、一周乃至更长时间,而不会影响获得连续纪录奖章的新功能。 这很快成为好评度最高的 Apple Watch 新功能之一,而在这之前,国外论坛 Reddit 上几乎每几个月都会有要求苹果为 Apple Watch 加入训练圆环暂停功能的帖子,每个帖子都会有成百上千的用户参与讨论。 一个能向手表「请假」的功能,为什么会引起那么多关注? 把人变成数据,把运动变成指标,都是偷懒的设计 或许在没有使用 Apple Watch 健身习惯的人看来,这是一项非常奇怪的功能——上班请假很正常,戴表健身也要「请假」? 这就有点荒谬了。 然而,对很多坚持健身打卡的人来说,「请假」功能却是一项非常实用的功能,因为对不少人而言,完成健康目标已经日渐变成了一种「心理压力」。Reddit 上有网友表示: 这绝对是一个『心理问题』,但如果苹果手表有休息日功能,我不会认为这是自欺欺人,我能坚持下去。 国内也有不少网友表示,为了完成健身目标已经得了一种「闭环强迫症」: 甚至还有用户表示,因为没有休息日功能,自己不得不放弃了 Apple Watch: 因为生病中断连胜,让我意识到,我只是为了我的强迫症闭上运动环,而不是为了我的健康。 关于这些困扰,著名心理学家爱德华·德西(Edward Deci)将其称为「过度合理化效应」(overjustification effect): 当外部激励被引入到本来由内在动机驱动的活动时,会降低人们对该活动的内在兴趣。 他曾做过这样一个实验—— 首先将几名大学生分为两组,并要求参与者被拼装一个立方体拼图,记录参与者自愿花在拼图上的时间作为基线数据,代表他们的内在动机。 随后,参与者被分为两组:一组在完成拼图后获得了现金奖励;另一组则像此前一样完成拼图,但没有任何奖励。最后,所有参与者再次在没有任何外部干涉的情况下进行拼图任务,并被记录所用时间。 结果显示,得到现金奖励的参与者在第三阶段自愿花在拼图上的时间显著减少,表明当外部奖励取消后,他们的内在动机降低了。相反,没有获得奖金的参与者在第三阶段的表现与第一阶段相似,他们的内在动机没有显著变化。为我们展示出外部激励对内在动机的微妙影响作用。 事实上,人人都知道良好作息、运动的重要性,但实际问题在于,健身终归是一件难而正确的事情,对于大多数人而言,保持长期运动习惯并不是一件容易的事。 于是苹果引入了游戏化的设计机制,将原本抽象的运动量,转变为可视化的「圆环」,让原本枯燥的锻炼变成了一个游戏任务——合上三个圆环。 为了强化完成任务的激励效果,苹果设计了大量精美的「运动奖章」,用户还可以与家人朋友分享成就、互相竞争,就此形成相互提醒、共同进步的氛围。 然而,这种激励机制也存在一个问题:许多人在这一过程中,逐渐开始将运动的内在动力(健康和快乐),转变为追求圆环和徽章的外在奖励。这种转变使得锻炼从一种自发的、愉悦的活动,变成了一种完成目标或打卡不得不完成的任务。 而随着时间的推移,当圆环及徽章逐渐失去新鲜感,外部激励的效果逐渐减弱,反而会成为一种负担,用户自然而然就像德西实验中的学生一样,渐渐失去了热情。 而当苹果观察到问题之后,提供的解决思路却是:让人给系统「请假」——这看似是提供了一个非常人性化的选项,但实际上显然只是一种「偷懒」的行为。 因为在用户的运动目标已经被外部动机绑架的前提下,「请假」功能实际上只是在短暂回避系统的压力,归根结底仍然没有跳脱出被技术和机制绑架的困境。用户依然是被系统的奖励机制所驱动,而不是出于对健康和运动本身的热爱。 这毫无疑问是个难题,但也有很多厂商在尝试通过改变策略,让用户的关注点回归身体和运动本身。 例如 Fitbit、Garmin 等品牌推出了一个具有综合性的「准备分数」,通过整合前一晚的睡眠质量、睡眠时间、近期运动强度和频率等,帮助用户了解其身体恢复状况以及进行剧烈活动的准备程度,进而做出更明智的训练和恢复决策。 当准备分数较高时,建议用户进行高强度训练,因为这表明他们的身体恢复良好;而当分数较低时,则建议选择低强度活动或休息,以避免过度训练或受伤。 这种功能的目的是帮助用户优化其健康和健身计划,确保在适当的时候进行适当的活动,从而提高整体健康水平和运动表现。有用户表示: 如果不是因为 Apple Watch 有回复消息和使用 Siri 等功能,我还是会继续用我的 Fenix。 与苹果开放自定义圆环功能相比,这种做法把问题前置,用数据说话,让用户了解自己的情况,并作出自主的选择,显然是一种不错的解决方式。 此外,不久前获得苹果设计大奖的 Gentler Streak Fitness Tracker 也做的不错,它最大的特点在于使用一条绿色的通道,将体能水平与疲劳程度进行了直观的展现,路径上的三种色调分别代表了适合自己体能水平的运动强度,用圆点的位置表示当天运动量与体能状态的关系: 上方深色区域:锻炼用力过猛 中间:运动强度很合适 下方:你已经在躺平边缘 ▲ 空心圆代表当天有训练,实心圆代表当天无训练 之所以这样设计,据官方描述是因为人的体能水平并不是完全和训练呈正相关的关系。即使每天打卡,但如果运动强度不够,体能水平可能也不会成长,合理地安排身体的运动与休息节律,或许才是更好的选择。 所以,Gentler Streak 不仅没有运动打卡的概念,还有一个「今天休息」功能,提醒用户:休息还是运动,要根据自己的状态综合决定——跟着感觉走。 有用户表示,自己喜欢 Gentler Streak 的原因就在于它有休息日和「生病 / 受伤」选项。 事实上,Gentler Streak 广受好评的根源在于,它并不是一个强制督促运动的「打卡 App」,而是将自己设计成了一个身体状态的「晴雨表」。 通过直观的方式呈现出用户的身体状态,不仅能将运动的主动权交还给用户,还会让用户看到自己在运动中的成长,不失为一种激发人内在运动热情的良好尝试。 回归自然的日常,抵抗技术的越界 事实上,无论我们是否在意,技术系统与人的关系一直存在,甚至早已随着科技的发展与我们的生活融为一体。 美国技术哲学家 Albert Borgmann 在著作《技术的哲学》中把现实分为三种:自然现实、文化现实、技术现实。 自然现实就是我们看到的一些自然现象;文化现实通过语言、艺术、宗教、法律等形式构建了一个充满意义和价值的世界;而技术现实则通过工具、机器、基础设施和信息技术等手段改变了人类的生存条件和社会结构。 这三种现实共同作用,塑造了我们现代社会的面貌和人类的生活方式。 但在这其中的很多时候,技术成为我们「日常」的同时,也在逐渐夺走我们生活中自然的「日常」。 例如,城市通勤将本该细节丰富的路程简化为地图上的两个「点」,社交媒体虽然提高了信息交流的效率,却也在一定程度上取代了面对面的交流和深度阅读的兴趣…… 这不仅仅是手表或打卡激励设计的问题,而是技术渗透到生活方方面面的结果。 另一个典型的例子,是最近即将上映的喜剧电影《逆行人生》。这部讲述外卖员生活的电影不仅风格讨喜,还有徐峥、贾冰这样的知名演员坐镇,还没上映就可以常常在短视频平台看到官方放出的一些搞笑或温馨的片段。 但很多网友却在看到后并不买账,认为这部电影很可能会成为一部套路俗套的煽情片,并没有直视外卖员的真实困境,有避重就轻的嫌疑。对于真实生活中的外卖员而言,除了生活上的困难,以算法为代表的技术系统也出现了越界,企业过度追求效率,导致了外卖员被「困在系统里」的结果。 显然,技术系统只是达成结果的工具和手段而非目的,生而为人本身的体验才是最重要的。 爱丁堡大学哲学教授、人工智能伦理学家 Shanon Vallor 在其著作《技术与美德:通往值得向往的未来的哲学指南》中,将「把握技术」的能力称为「技术美德」,表示: 如何与技术,特别是那些仍在出现、尚未成为固定的、与人类环境无缝嵌入的技术一起美好地生活,是在深度科技化时代的人所要培养的特殊德行。 就像在运动打卡产品中,如何让产品从一个追求效率的指标,回归到实现健康生活的工具,探索用户追求奖章背后真正的需求,才是真正值得探究的命题。 你真的在意那个小奖章吗?更好的自己才是最好的奖赏。
巫妖王之怒27日正式开启,哪吒汽车母公司递交IPO申请,聊天软件鼻祖ICQ停止服务,完美世界回应大裁员,这就是今天的其他大新闻
今天是6月26日 农历五月廿一 滴滴搞了个公众评议会 邀请用户投票 选择滴滴最该推出的功能 有人说要整治一下车辆异味 有人说希望能带宠物 还有人说希望司机不要找乘客聊天 。。。 下面是今天的其他大新闻 # 魔兽世界宣布巫妖王之怒 27 日正式开启 ( 新浪科技 )魔兽世界官方微博宣布,“ 巫妖王之怒 ”魔兽怀旧服将于 6 月 27 日上午 6 点正式开启。上午 10:30 还将全平台直播发布会,带来更多有关回归礼物与正式服开服时间的消息。 据悉,魔兽世界官方此前宣布,“ 巫妖王之怒 ”开启时将开放全新的服务器,并针对“ 巫妖王之怒 ”国服新服务器进行玩家征名活动,最终选定“ 吉安娜 ”与“ 死亡猎手 ”作为 2 个新服务器名称。“ 红玉圣殿 ”与“ 雪怒 ”将作为未来开启的服务器名称。 :守望先锋啥时候开服? # 哪吒汽车母公司递交 IPO 申请 ( 新浪科技 )哪吒汽车母公司合众新能源今日向港交所递交 IPO 申请。招股书显示,2023 年哪吒汽车营收 135.55 亿元,净亏损 68.67 亿元。 招股书显示,哪吒汽车目前推出五款智能新能源汽车,汽车交付量由 2021 年的 64230 辆增长至 2023 年的 124189 辆,年复合增长率为 39.0% 。 海外业务方面,在 2023 年实现出口 17019 辆,占总销量的 13.7% ,贡献了同年 12.0% 的销售收入。根据灼识咨询报告,于 2023 年,以上险量计,哪吒汽车是东南亚新能源乘用车排名前三的品牌。未来将大力发展拉丁美洲、中东和非洲,并随后适时向欧洲拓展。 :哥们还扛得住吗? # 聊天软件鼻祖 ICQ 停止服务 ( 三言科技 )聊天软件鼻祖 ICQ 今日停止服务,官网显示“ Service stopped working ”。代表其 28 年的使命结束。ICQ 在 5 月份发表公告称,将于 6 月 26 日关闭,它建议用户改用 VK Messenger。 据悉,ICQ是一款即时通讯软件,由以色列公司 Mirabilis 于 1996 年 11 月 16 日推出,软件取名ICQ,即“ I SEEK YOU( 我找你 ) ”的意思。 ICQ 支持在 Internet 上聊天、发送消息和文件等。Mirabilis 于 1998 年 6 月被 AOL 收购。2010 年 7 月 8 日,AOL 以 18750 万美元将 ICQ 出售给 Digital Sky Technologies。 :你灰色头像不会再跳动。。。 # 完美世界回应大规模裁员:确实有部分产品表现不及预期 ( 新浪科技 )近期,网传完美世界开启裁员且规模较大,主要针对的是营收未达预期的游戏项目组,如《 完美新世界 》和《 一拳超人 》等。传言还称部分研发部门裁员数百人,中台团队也从 150 人锐减至几十人。 对此,完美世界回应:为了积极适应外部市场环境的快速变化,公司持续进行创新探索与转型升级,但确实有部分产品表现不及预期。为应对挑战,公司主动梳理调整,采取了一系列解决方案。 其中包括优化资源配置、聚焦核心项目、进行必要的人员优化,以及办公空间集约化等,让资源更集中在核心优势业务上。 :回应了,又好像没回。
三星 Unpacked 发布会正式官宣,四大新品即将到来
在今年的一月的 Unpacked 活动中,三星为我们带来了全新的 Galaxy S24 系列。 时隔五个月,三星终于又官宣了新的活动。今年的第二场 Unpacked 发布会,将于 7 月 10 日在法国巴黎举行。 在这次发布会的海报中,一个立方体隐隐展现出了「V 字形」,暗示着本次发布会将会有很多折叠新品到来。届时爱范儿也会前往巴黎参与活动,将从现场带来最新报道。 此前,三星 Galaxy Z Fold 6 的详细参数几乎已被全部曝光。 据科技媒体 Smartprix 爆料,三星 Galaxy Z Fold 6 配备了一块 7.6 英寸的内屏,比例为 7:6,分辨率为 2160×1856(QXGA+)。 外屏尺寸则为 6.3 英寸,比例为 22:9 分辨率为 2376 x 968(HD+)。 从光圈等参数来看,新的 Galaxy Z Fold 6 相机配置和前代完全相同。 而且这代的电池容量也依旧是 4400mAh,与前代没有任何区别。 从泄漏的渲染图来看,这代 Galaxy Z Fold 的屏幕比例稍微变宽了一些。而且新款设计会变得更加方正,R 角更小。 三星 Galaxy Z Fold 6 展开的厚度为 5.6 mm,折叠后厚度为 12.1 mm,重量 239 克。整体会比 Galaxy Z Fold 5 轻薄不少。 关于三星的竖折旗舰 Galaxy Z Flip 6,有消息称其外屏尺寸会增加至 3.9 英寸,并有可能搭载 120Hz 的高刷屏。 另外,Z Flip 6 的相机方面也将进行大幅升级,可能会升级为 5000 万像素主摄,并有望显著改善拍摄性能。 自首次发布以来,三星 Z Flip 系列就一直配备 8GB 内存。但在新的 Galaxy Z Flip 6 上,用户将可以自行选择 8GB 或 12GB 的内存配置。 性能方面,三星 Galaxy Z Fold 6 和 Galaxy Z Flip 6 都将搭载骁龙 8 Gen 3 平台。还将适配 Wi-Fi 6 和蓝牙 5.3,并配备双 nano SIM 卡插槽,支持 18 个 5G 频段。 在 MWC 2024 大会上,三星初步向外界展示了 Galaxy Ring。 这是三星的首款智能戒指,其搭载了多个传感器,可监测用户血氧饱和度和睡眠信息,还能实现血流测量和心电图检测功能。 Galaxy Ring 一次充电即可使用 5 到 9 天,更大尺寸的 Galaxy Ring 还能提供更长的续航。 Galaxy Ring 提供了铂银、金色和陶瓷黑色三种配色,预计也将在这次 Unpacked 活动上正式发布。 在可穿戴设备领域,除了智能戒指即将正式发布,三星还会升级 Galaxy Watch 系列。 早前三星 Galaxy Watch 7 短暂「现身」加拿大亚马逊网站。根据页面显示,三星 Galaxy Watch 7 将搭载 3nm 芯片,可带来更流畅的使用体验和更长的续航时间。 而且 Galaxy Watch 7 还会升级 BioActive Sensor 2 传感器,可在运动和睡眠期间进行更准确的心率测量。 根据早前的爆料,三星 Galaxy Watch 7 和 Watch Ultra 将搭载全新的 Exynos W1000 处理器,由 Cortex-A78 x1 + Cortex-A55 x4 组成,主频达到 1.6GHz,GPU 则是 Mali-G68MP2 。 这两款手表都将支持心率、ECG 心电图、血氧、身体成分、体温、睡眠检测等功能。而且新的 Galaxy Watch Ultra 可能会带来一个新的按钮,功能可能与 Apple Watch Ultra 的「操作按钮」类似。 在上述新品之外,三星还可能对 Galaxy Buds 等产品进行更新,并会带来一系列软件升级。 届时爱范儿将会在三星 Unpacked 发布会现场为大家带来最快的一手报道,请大家密切留意我们的最新动态。
华为汪涛:今年将有30多款终端支持5G-A
快科技6月26日消息,在2024MWC上海通信展上,5G是全球发展最快的一代移动通信技术,目前全球320张5G网络服务了18亿用户,5G用户发展速度是4G同期的3倍。进入2024年,5G-A的商用正式拉开大幕。 就在6月18日,5G-A的第一个标准版本3GPP Rel-18在上海冻结,这是5G产业发展的里程碑事件,标志着2024年成为5G-A商用元年。 华为汪涛表示,目前已经有60多家运营商和合作伙伴宣布了5G-A商用元年的到来,同时5G终端也已经做好准备,今年将有30多款手机、CPE来全面支持5G-A,都将继续推进数字浪潮滚滚向前。 在汪涛看来,5G-A是确定性的产业路径,一方面可以保护已有投资,另一方面,可以带来新的商业机会,拓宽商业边界。 面向2030年,全行业需要持续推动5G-A技术的增强,推进5G产业健康发展,让5G有更持久的生命力,全面实现5G改变社会的愿景。 目前,华为也在和产业链上下游紧密合作,华为联合5G-A运营商发布了5G-A商用领航计划,华为与合作伙伴达成六项共识,将携手从“领航运营商聚力”“打造领航城市”“升级经营模式”“驱动业务创新”“高质量建网”“共推生态繁荣”六个方面共同推动5G-A发展。 资料显示,5G-A全称是5G-Advanced,是5G的增强版,也是向6G演进的关键通信技术。 除了网速相比5G快了10倍之外,5G-A能有效支撑5G应用规模增长和数字化创新发展。 作为5G通向6G的必由之路,5G-A将对部分6G关键技术进行提前验证,为6G标准制定和技术落地积累宝贵经验。 比如裸眼3D、XR、云手机等应用被视为5G-A的典型应用场景,5G-A将加速人、家、物、行业、车五大联接的升级,支撑新体验、新联接、新业务的发展。
赵明:荣耀手机在端侧AI方面要整体领先于苹果
IT之家 6 月 26 日消息,在今日开幕的 2024 MWC 上海期间,荣耀 CEO 赵明在接受采访时表示,过去三年,荣耀一直重点投入 AI,刚开始是打基础的,现在逐渐呈现出来。 他提到,荣耀与苹果竞争走出了独特的差异化路线,在端侧 AI,荣耀要整体领先苹果,也看到了苹果的快速反应能力和纠错能力。“我们非常尊敬苹果,荣耀也要拿出自己的能力。” 他还透露,荣耀端侧 AI 能力和服务未来会也将面向海外发布。 此外,荣耀今日还发布了手机行业首个端侧 AI 反诈检测技术。赵明介绍称,该技术能够自主识别用户视频通话中的画面要素。若检测到视频中存在 AI 换脸,将会向用户发出风险提醒。 同时,赵明演示了一个场景:一个年轻人的脸通过 DeepFake(IT之家注:又称“深度伪造”或“深伪”)实时被换脸成一个老人后,手机就会弹窗提示用户对方疑似 AI 换脸假冒身份。 赵明表示,苹果过去一年在中国市场发生了很大的变化,这是大家努力竞争的结果。折叠屏领域荣耀取得了很大的认知,要用创新去挑战苹果。挑战一年的结果是,苹果加入平台级 AI,看到了行业良好的变化。 他还提到了 AI 安全的问题,荣耀认为数据是属于消费者的,不能主动发起调用网络测的 AI,要帮助消费者更好保护数据和隐私。“马斯克也对苹果 AI 安全有一些评价,后续还要看苹果真正提供的服务如何。荣耀会坚持在端侧进行数据处理。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。