行业分类:
加载中...
头条分类:
加载中...
当辛巴小杨哥们决定“退休”
文/厚码 继小杨哥之后,辛巴也宣布淡出带货直播间,两人“官宣”时间相差甚至不到10天。 3月13日,辛巴在直播间谈及辛选的直播带货情况,提及自己接下来的计划——“暂停直播,沉淀两年,学习AI,两年后再选新赛道重新开始”。无独有偶,小杨哥在之前3月5日的直播中表示,2024年娱乐直播会比较多,将减少直播带货场次;同时他也表示,如果有专场活动,考虑将自己过亿粉丝的账号直接交由徒弟使用。 虽然辛巴、小杨哥扎根于快手和抖音两个不同的直播阵地,但在过一年内,两人的带货直播场次有所减少,出镜时长也出现降低趋势。常驻抖音带货榜前十的小杨哥更是在今年2月带货月榜,而辛巴也屡屡将618、双11大促直播交给徒弟蛋蛋完成。 辛巴、小杨哥主页截图 忆往昔,曾经的直播界“四大天王”中薇娅因偷漏税被处罚,只能转型幕后;罗永浩上演“真还传”后重拾创业梦,宣布进军AR/VR/MR领域;李佳琦经历停播事件后,力捧旗下新锐助播团;而辛巴的暂停直播宣言,近似给曾经的“四大天王”故事画上一个句号。 另一个后起之秀小杨哥,与辛巴同为草根出身,凭借土味视频和下沉市场斩获流量和关注,因而被看作是“摸着辛巴过河”,却也在近期宣布淡出直播带货。 当大主播们都纷纷表态,直播带货的未来真的不值得被看好吗?“退休”进行时的陆续发布,背后的原因又是什么?而这群创造出一个个“造富神话”的逆袭者,他们的人生下半场究竟有何新航向? 01 “师傅”要退休, “徒弟们”搏上位 谢邀,人在三亚,刚下飞机。 官宣减少直播带货后没多久,小杨哥就带着多位团队主播奔赴三亚团建。坐在泳池前,小杨哥再次回应“跌出带货榜前20”的热搜话题,表示“2月份不就带了一次吗,带货带了一次就前20啦”,并推荐起自家品牌“小杨甄选”的T恤,“兄弟们,我一定把品质做好”。 值得注意的是,此次三亚团建小杨哥并没有在个人账号开播带货,而是出现在徒弟直播间。 目前,小杨哥已经收了6位徒弟,分别是“红绿灯的黄”、“七老板”、“嘴哥”、“陈意礼”等。其中,“红绿灯的黄”曾因在直播带货YSL商品时形象邋遢、表情狰狞被中消协点名通报系低俗带货。沉寂数月后,“红绿灯的黄”才再度回归直播间,甚至在今年1月达成了单场超1000万元的销售成绩。 红绿灯的黄 带货YSL直播截图 小杨哥的隐退之路能否走得顺畅,在一定程度上取决于徒弟能否承接住他的直播流量。 在抖音直播2月达人带货榜TOP20中,小杨哥首次未能上榜,同时三只羊旗下的任一矩阵账号也未登上该份榜单。 然而,“东方甄选”主账号与“与辉同行”、“东方甄选美丽生活”三个账号却都活跃在榜单前20位,“与辉同行”更以单月4.4亿的预估销售额排名第二,超越单月预估销售额为2.7亿的“东方甄选”。显然,小杨哥虽有意隐退幕后,但在量级上都难以和他本人相提并论。 小杨哥这套师徒制打法并非首创,早在辛巴建立家族模式时就已经初具规模。 目前,辛巴已经收了60位徒弟,其中比较核心的有猫妹妹、蛋蛋、时大漂亮和赵梦澈等四个。 蛋蛋快手主页 辛巴被快手官方封禁或自己宣布暂停直播的时间内,蛋蛋多次打着替辛巴出征的口号在个人账号进行直播,辛巴也时常出现在蛋蛋直播间内为其捧场引流。 据第三方发布的2023年快手直播带货预估销售额Top10账号,排名前三的分别是蛋蛋、辛巴、时大漂亮,都是辛选旗下的主播。而在整个前十名中,加上赵梦澈、猫猫、徐捷,辛选集团一共包揽了6个名次。此次辛巴宣布暂停直播转而学习AI,在一定程度上也是为了让矩阵化的直播模式更为成熟,让原先集中在辛巴直播的流量分摊至其他矩阵直播间,持续扩大生意规模。 虽然小杨哥与辛巴声称减少直播带货频次或暂停直播,但不意味着他们即刻“退圈”,从此消失于互联网视野。 小杨哥23年5月曾表明要退网 据新榜数据显示,小杨哥在3月分别进行了一场38大促带货直播与一场介绍新款长安汽车的品宣直播,累计观看人数达到7937万,直播预估销售额超过1亿元。另一边的辛巴同样在38大促开启了2024龙年的首场直播,带货近200款产品,累计预估销售额超过5.4亿元。2023年期间,辛巴大多选择在618、双11大促开播卖货,由他主导的辛选年货节总GMV超66.37亿元,同比增长66.74%,总销量超1.31亿件,同比增长超1倍。 作为各自公司的“老师傅”,小杨哥与辛巴的影响力仍然大幅领先于其他“徒弟们”。 02 从网红跑向企业家 降低直播带货频率的小杨哥,似乎有更重要的事情要做,而这也与他从网红到企业家的蜕变之路有关。 近期,小杨哥多次在直播间介绍起今年将要举办的名为DXYG-VAC的电音节,前缀为“大小杨哥”的缩写,与知名品牌VAC联名举办,首场已确认5月份落地合肥,未来会在全国各地多场次开办。小杨哥还表示,“跟上次演唱会不太一样的是,这次电音节有公开售票也有免费赠票”。 此前在去年11月,小杨哥号称花费3000万策划了一场“小杨臻选演唱会”,邀请了朴树、twins、筷子兄弟、张信哲、汪苏泷等一众歌手到场助阵。最终这场演唱会在抖音收获了近6000万观看量和超4亿的点赞,“疯狂小杨哥”和“小杨臻选”两个账号累计涨粉近500万。 小杨臻选演唱会 而这次高调举办电音节,可以看作是小杨哥扩张商业版图的一次尝试。 从演唱会到电音节,小杨哥的直播退休计划早已有迹可循。 去年11月,三只羊与知名影视公司森林影画成立合资公司合肥聚百星传媒科技有限公司,小杨哥此前也说过自己有个拍电影的梦想,而在今年1月小杨哥又发布了一张与周星驰合影的照片,同一时期,周星驰宣布和抖音联手进军短剧赛道,并且第一批作品已经在制作中。 与周星驰的此次同框,也被外界普遍认为是小杨哥进军影视行业的标志,小杨哥也在近日一次直播中透露将于3月下旬前往香港,虽然对所见之人进行了保密,但不少粉丝猜测,此行大概率是与周星驰再度见面。 大、小杨哥和周星驰合照 如果说进军影视圈是小杨哥的愿望,那么,作为三只羊的老板,小杨哥还有需要想出关于公司的更多出路。 而关于主业直播电商的布局,便是出海这条路。 今年1月,小杨哥更是将布局布局动作扩张到海外。据“Tiktok事业部(三只羊)”账号显示,三只羊网络在新加坡开启了海外首场直播带货,创下TikTok电商板块在该地区的新纪录,登上本地榜第一。为了快速打入海外市场,积累流量,三只羊更是借助切片分发这一优势在TikTok“混个脸熟”。 不只是小杨哥,辛巴也早早嗅到了海外市场的红利。 2023年5月,辛巴在泰国开播。官方数据显示,辛巴团队在泰国的首场直播中,全场带货六小时,总销售额破8.3亿,总订单量超678万单。此次出海泰国是“辛选国际出海计划”第一站,意味着辛选将正式进入海外市场。 辛巴泰国直播 相比于小杨哥,辛巴更早一步向企业家转型,他的动作也更为密集,但有些未激起水花。 早在2022年5月,辛巴宣布投资20亿在广州白云区辛选基地开了一家“辛选超市”(X-Market),在开业当天的直播里,辛巴直播间人气超过130万人在线。更有消息称,超市开业3天GMV达10亿,扬言未来要全国连锁。但除了当天高调的营业额之外,辛选超市并未引发更大规模的讨论,这家超市也更像是辛巴将直播场景搬进了自家仓库。 也因此,有业内人士认为,无论是减少或暂停直播,小杨哥与辛巴在直播之外的场域优势有限,如何将直播间原有的粉丝流量引导到新的场域,需要时间去验证。 03 “退休”命题的真假之辩 一直以来,头部主播都处于被大众讨论关注的重点地带。 刚过去的315晚会虽未提及头部主播,但3月14日发布的《直播带货消费维权舆情分析报告(2023)》中,分析了小杨哥、辛巴等17位主播情况,这些要“退休”的主播们相关维权舆情盘绕周身,小杨哥的虚假宣传舆情相对突出,而辛巴舆情占比从2021年至2023年呈现逐年下降趋势。 从某种角度来看,辛巴舆情减少也与其降低直播频率有关,其形象也更加向企业家靠拢,他创立的辛选集团定位为是一家以红人经济作为战略切入口,以供应链为核心的数字新零售企业。 辛巴 在官方宣传中,辛选集团已整合了超过3000家高规格工厂资源,用C2M(顾客对工厂)方式安排生产,从生产环节严控成本和质量,然后打通从生产到销售全产业链。目前,集团员工总数超4000人,仅选品团队就有1400人。 反观小杨哥,其自营品牌“小杨臻选”也是在走搭建供应链的相似路线,从简单的“流量—带货变现”,转向更厚重的“生产—定价—流量变现”,以获得更高的毛利率。其中,9块9的小杨臻选垃圾袋更是销售超过940万单。 在过往的故事里,辛巴也不曾一次喊出“退休”二字,但他仍旧时不时都会“复出”,而另一边的小杨哥,面临着比辛巴更焦灼的情况在于,其徒弟军团并不足以支撑起自身的“高枕无忧”,他还是需要用自己去帮三只羊赚更多的财富。 小杨哥 小杨哥与辛巴的退休命题无论真假,二人仍然把握着公司的真正命脉和未来的发展方向,只不过相比前几年带货大主播垄断流量的情况,隐退江湖或退居幕后,一定程度上,也是为了让自身和公司变得更“安全”,但面对仍是现金流倾下的直播利益,特别是在大促节点之上,大主播们的再度卖力登场,其退休论也就又会被外界看来“说说而已”。
为超越人类记忆,他们给ChatGPT配上了小抄
“读书破万卷,下笔如有神。”这一古语在现代大模型的训练过程中有了更为清晰的诠释。在足够多的训练数据基础上,AI在诸多任务上已获得了比肩人类的表现。为了方便理解,一种观点将大模型拟人化,认为大模型也与人类一样,拥有记忆,甚至拥有相似的记忆模式和机制。然而,正如不应简单将飞机类比为铁鸟,人类记忆从产生到提取的过程,都与基于上下文预测下一个词的语言模型有着本质的区别。 不过,对人类记忆的研究为我们理解大型模型的记忆机制提供了一个出发点。人类记忆分为长期记忆和短期记忆(又称工作记忆)。对于大型模型而言,其“长期记忆”存储在模型的亿万参数中,短期记忆则体现为模型一次对话中可回忆起的上下文长度的context。例如GPT-4的context是128k,这相当于可一次性输入10万汉字左右。 但这种类比真的有效吗?大语言模型与人类记忆有何异同?我们又该如何借助人类的记忆机制解决大模型应用尝试中所遇到的问题? 01 大模型的长期记忆与人类的相似 对于任何动物而言,其大脑功能都只是为了在进化的无情筛选中胜出。作为交流工具的语言也并不例外。在语言中,诸如语法结构、递归嵌套等复杂特征,探究其最底层的目的,仍在于更高效、准确地完成沟通。既如此,在一般情况下,语言就不必追求完美无缺。对于经过人类强化调整过的大模型,其本质同样是概率的、随机的。于是可以通过调整温度(用于调整模型生成时文本创作和多样性的超参数)这一参数,让模型的输出看起来更具有创造性。 就记忆而言,大模型与人类一样,呈现出首因效应和近因效应 [1],尤其是当需要记忆的事实更多时(图1)。 首因效应:primary effect,即先入为主,记忆时对第一印象念念不忘;近因效应:recency effect,即对事物的最近一次接触给人留下深刻的感知或认知。 图1:大模型的预测准确性随词汇而呈现先下降再上升,与人类记忆类似。图源:参考文献1 这一性质是模型大小达到一定阈值之后出现的涌现特征(图2),而当模型参数只有70M时,模型实际上无法预测更远的单词,所以也不会出现首因效应。 图2:不同参数大小的模型在预测不同位置单词时的准确性。图源:参考文献1 在学习过程中,人类可以通过重复来提升记忆效果,这一现象在大模型中也会出现(图3)。此外,相比于直接重复待学习的内容,将内容更改顺序后重复学习,模型的效果还会有所提升。 图3:对比模型在面对重复内容时的预测准确性。图源:参考文献1 当人类在面对相互矛盾的事实时,记忆会出现差错,这意味着遗忘的原因不在于记忆随时间衰减,而在于记忆产生时存在干扰。大模型在面对相互冲突的事实时,也会有类似的表现,当冲突越具体(例如冲突来自于同一个人而非不同国家的人),记忆的差错就越明显(图4)。 图4:在加入不同类型的干扰信息后,大模型的预测准确性显著下降。图源:参考文献1 此外,加拿大认知心理学家托尔文(Endel Tulving)认为,记忆的存储和读取是两个相互独立的过程,这一点也适合大模型,其训练和推理过程中使用的机制截然不同。托尔文将长期记忆进一步分为陈述性记忆和程序性记忆,其中陈述性记忆包括语义记忆和情景记忆。 对于大模型来说,语义记忆对应于模型通过预训练或微调过程积累的知识库,这些知识隐式地存储在其参数中。与此同时,情景记忆的对应体现在模型处理或生成文本时,依赖于特定上下文信息的能力上。然而,当生成全新内容时,所需激活的是类似于程序性记忆的能力,这超越了单纯的情景记忆。[4] 尽管在训练过程中,大模型主要涉及到显式的情景记忆的应用,程序性记忆并未显著涉及。在推理过程中,大型语言模型利用输入的上下文信息来引用先前的对话或与当前语境相关的数据,这一过程可以被视为对情景记忆的模拟调用。这表明,尽管大模型在训练过程中主要处理与特定实例相关的显式信息,它们仍能通过处理与之前交互相关的上下文信息,展现出一种类似于人类情景记忆的能力。进一步地,有研究者认为,当模型接收到足够详细和具体的上下文信息时,它能够“激活”更复杂的行为模式,类似于人类的程序性记忆,从而展现出因果推断、心智模拟等高级涌现能力。 虽然大模型和人脑在特定表现上呈现出相似性,但这并不代表两者也有着相似的信息处理机制。实际上,对于大模型为何会表现出这样的特征,学界目前也还没有明确的结论。例如上述研究中,我们并不清楚如果只考虑大模型最上层的参数,能否重现诸如首因效应的特征,也不清楚当限定上下文的范围时,模型的表现是否会改变。或许通过受限的大模型,可以更进一步定位大模型与人类记忆相似的模块,从而有助于对此现象给予解释。 02 大模型通过“外挂”增加记忆容量 理解记忆的对于拓展大模型的能力至关重要。正如解决数学难题时在草稿纸上记录步骤可增强我们的工作记忆一样,为大模型引入“记忆外挂”技术,可以帮助模型显著提升其工作记忆。 例如,通过TiM系统应用,让大模型在每次回答问题之前,都对外部的存储空间进行一定处理,包括插入、遗忘和合并(见图6)。这样,大模型在应对多轮对话或问题时,可以更有效地处理并回忆上下文信息,准确检索出所需信息。类似的方式还包括递归式生成场景记忆[6],该方法可视作让大模型在每一轮回答完问题后,总结前一轮问题包含的上下文,将其放入外置记忆中,从而避免大模型在多轮对话时忘记前几次谈话中的内容。 图6:对比大模型传统的记忆与新提出的TiM在回答问题时的表现。图源:参考文献5 为了解决长文本处理的挑战,2023年在NIPS上发表的一篇论文提出了一种名为LongMem的方法[7]。这项技术应对的问题不是多轮对话,而是一次处理一个长文本。通过将长文本切分成多个部分,每部分由固定的大模型独立处理,随后通过一个可训练的残差网络综合各部分信息,根据提问的具体内容选择最相关的部分进行回答。这样,LongMem可以让大模型更准确地提取信息。 图7:LongMem机制的运作流程示意图。图源:参考文献7 在机器人控制问题上,应用大模型同样需要给其配上记忆模块[8],这一类模型被称为具身AI。在机器人控制任务中,具身AI的“眼睛”通过处理视觉传感器的输入来产生周围环境的语言描述,之后其“神经Nerve”结合机器人的自身动作,生成以第一人称为中心的状态信息描述。这些信息随后被编码并存储于一个高级的语言处理系统中,即所谓的“大脑”。同时这个大脑还可根据导航任务,产生控制指令。 这样的运作方式,能够实现机器人与人经由自然语言的直接互动,还可利用大模型中存储的海量常识,来识别和适应环境变化,例如某些东西是有生命会运动的,我需要避开它。这样构建的机器人,就会在导航时“意识到”眼前的猫尽管趴着不动,也可能会在自己靠近后避开。这类具身AI的基础,就在于生成、存储及更新关于自身状态的记忆模型。 图8:LLM-Brain具身AI的架构。图源:参考文献8 另一个应用大模型加记忆的例子来自于搜索场景。研究者提出名为CoPS[9] 的架构,其由三个部分组成:外部记忆模块存储用户的搜索记录和行为,之后交由大模型来推断搜索用户的意图及背景,并基于推断的个人档案对传统搜索引擎给出的链接进行重现排序,从而使搜索引擎给出的结果更加个性化。由于利用了预训练的大模型,CoPS可以进行零尝试学习,即不需要招募测试用户,收集用户数据及反馈,就可以利用大模型中的知识提升搜索的准确性。 图9:CoPS架构。图源:参考文献9 通过向大模型增加外部记忆来拓展大模型的应用范围,其还有众多案例。研究表明[10],在被赋予可读写的关联性外部记忆后,当前Transformer架构的语言模型在计算上可被视作“通用图灵机”。这意味着,这些模型不仅能够处理有限长度的输入字符串,还能够模拟任何算法,处理任意大小的输入。 03 大模型的“幻觉”无需克服 认知科学家莉莎·费德曼·巴瑞特(Lisa Feldman Bartlett)指出:“记忆不是简单地重新激活无数固定的、毫无生趣的、细碎的痕迹,而是一种富有想象力的重构或者构建。”这一描述似乎对大模型也颇为适合。 理解了生物记忆的不完美,我们也许不该再将大模型的“幻觉”视为一种需要克服的顽疾,而是将其视作一种内生的、不可避免的涌现特征。就如《红楼梦》中贾宝玉所言,“古来杜撰的多了,偏我杜撰不得”。事实上,《红楼梦》的作者也践行了笔下人物的话,在书中杜撰了多个典故。可这丝毫不会影响《红楼梦》的伟大。一旦我们将大模型的幻觉视作记忆生成过程中的副产品,就不应当在大模型自身的框架内试图消除“幻觉”,而应通过外部记忆的方式解决幻觉在特定场景下带来的问题。甚至,还可以将“幻觉”视作通向AGI过程中遇到的山谷,需要先设法让模型增加幻觉,从而促进模型的创造力。 虽然无论对于大模型还是人脑,我们目前都没有完全理解其记忆的运作机制。不过,神经科学研究中有着对记忆的多种分类方式,这或许提醒大模型开发者不应只采用一种记忆模式。通过在大模型外部增加显式的记忆,可以显著提升大模型在长文本,以及多轮对话中的表现,同时扩展大模型的应用场景。这给只想通过简单扩大模型规模以卷出更好模型的开发者,提出了另一条更为经济且资源节省的优化路径。 在神经科学中,记忆是相互竞争的,这样的动态特征意味着记忆的提取、更新、强化与遗忘应当在同一框架下被审视。而在当今的大模型中,记忆的产生和读取是相互独立的。大模型不会由于反复读取某段记忆就更新对其的存储,而人类每次读取长期记忆都是一次生成式的往日再现,反复读写之后,最初的原始记忆就可能发生改变,这也是之后大模型和记忆相关研究者需要注意的差异。
Sora给你带来的真实变化
距离Sora的发布已经有一段时间,但对它的讨论还在持续。讨论话题已经从Sora会不会取代人类、现实会不会不存在、中国能不能做出来类似模型,变成了“将来如何用Sora搞钱”“AIGC赛道有没有机会创业”。 所以,在继《Sora给中国AI带来的真实变化》后,我们想要多聊一个话题,就是Sora代表的新算法、新能力,将给对AI有好奇,也有一些忐忑的你,带来什么变化。 想聊这个话题,是因为我们发现,现在规模庞大的讨论,都把这件事描绘得太复杂了,甚至有点南辕北辙的意思。 但事实上,AIGC作为一种基础技术,它的逻辑非常简单,效果显而易见。从芯片到算法,都有非常透明的信息机制,不存在巨大的信息差与行业内幕。 在我们看来,在今天过多聊Sora,聊AI大模型没有过多意义。它对于普通人来说只有两个价值,一个是等着用,一个是把它做成应用给别人用。 以极低的门槛,开发AIGC原生应用,是Sora带给普通人最大的机会,没有之一。 01 “关于AI的讨论,我有四不听” 借用短视频上“我有四不吃”“我有四不做”的这种梗,关于AI大模型的讨论,咱们也可以有四不听。 在最初的热度之后,讨论AI大模型与个体的关系,一般是面向那些想用AI创业、赚钱,或者至少让AI成为自己一技之长的人。这类受众抱着希望了解AI,利用AI的心态,所以总是希望听到一些“秘辛”,来给自己增强信息差。但有四种讨论,却是没什么必要听的。 第一种,卖课的我不听。 短视频上很多那种卖AI课程的老师,套路一般是上来一顿制造焦虑,告诉你再不学AI就晚了,就坏了,下一桶金就让情敌先赚了。你一着急,就报班交钱。但问题是,这些老师根本没有什么AI从业经验,没接触过AI项目,甚至根本都不知道AI这门技术怎么来的。听他们的讨论,本质上跟给成功学大师交钱没什么区别。 第二种,卖社群的我不听。 鄙视花钱买课的年轻人,更喜欢轻量化,分享化地加入一些AI社群,从这些社群里可以得到大量AI资源。这当然很好,也很实惠。但问题是平台和社群运营方,为了让社群持续运营,往往会不断把AI技术复杂化,抽象化。恨不得把简单的问题说得千丝万缕。同时喜欢搞资源轰炸,给你一堆学习资料,多到你根本不会打开它们。 了解AI就像对其他知识一样,切忌搞资源满足症。同时也要想想那些人天天说社群运营变现能力如何强,会不会是要把你的现金变到他的口袋里? 第三种,技术专家的我不听。 这句话说出来好像十分混蛋,技术专家的不听你想听谁?其实,这句话的意思是,对于普通人,乃至对于大多数AI开发者来说,过分底层的技术逻辑都是没有必要弄懂的。AI大模型的泛化性,带来的核心价值之一就是极低门槛开发。如果不是研发从业者,真的没有必要去比较底层的技术。 第四种,行业大咖的我不听。 最近参加了不少AI大模型的研讨、峰会,让我有一个感觉就是台上的嘉宾们在鸡同鸭讲。原因在于,Sora这类新的AI热点太新了,行业还没有真正接受。这种缺乏共识的情况下,大咖们往往会基于自己以往的业务、经验来进行判断。最后大多数变成了给自己的公司,自己的项目打广告。这种讨论看多了,不仅容易信息错落,还容易误把广告当真理。 这个也不听,那个也不听。到底应该听谁的? 其实问题在于,对于一个逻辑清晰,信息透明的事情来说,你大可以谁都不听,只相信自己。 02 准备好享受娱乐迭代了吗? 让我们回到Sora本身,它给世界带来的最大价值是什么? 是颠覆某个行业,比如偷走影视特效人员的饭碗?是强化某种体验,比如让元宇宙具有更强的个性化能力?比如在工业数字化中应用,带来更好的工业数字孪生? 这些当然都是对的,但都没有抓住问题的重点。Sora的出现,核心问题是让AIGC中的视频生成能力得到了加强,使得AIGC中视频生成这个难度最大的领域获得了突破。其所具备的多种技术特性,都可以让AIGC视频更好落地。比如通过采样灵活性的增强,Sora可以适配更多样化的屏幕尺寸,解决了同一个模型适配不同屏幕比率,不同分辨率的问题。再比如Sora提供了更强的意图理解能力,让抓取用户诉求的AIGC更具可行性。 这些能力到底有什么用?简单来说,就是会让视觉娱乐更具个性化。 回顾人类的视觉娱乐历史,会发现有两条线贯穿始终,一个是个性化,一个是廉价化。 从舞台剧、电影、电视到PC视频、移动视频+直播,再到信息流+短视频。视觉娱乐这种最能消耗人类空余时间的方式,不断变得更加唾手可得,成本更加低廉。与此同时,视觉娱乐也用增加选择的方式来提升其个性化能力。 说白了,人类努力了数千年,就是希望能以更加高效、低价的方式看一场表演。 而Sora带来的AIGC视频能力,非常符合视觉娱乐发展的轨迹。AIGC可以省略基本的演出者,让视觉娱乐成本进一步下降,甚至成本从表演者、服化道、视频编辑,直接变成了AI算力。同时,AIGC视频会让视觉娱乐的个性化能力全面升级。用户可以直接下命令来生成视频,而不是让AI通过用户的划走、留下行为来进行行为抓取。 因此,Sora的最终价值十分简单,它只会是视觉娱乐的升级。未来我们将可以命令AI来生成某种视频,或者让AI来猜测我们的喜好自动生成某类视频。颜值、演技、情节、观点,这些东西都将以非常廉价的方式进行个性化定制。 在这种模式下,你将享受源源不断的视觉娱乐。游戏里的关卡,VR里的场景,与你聊天的数字人主播,惊险刺激的短视频内容,都将来自AIGC。其实,今天你所看到的信息流与视频,也大多数是AI推荐给你的。未来AI不仅会推荐,还会顺便把内容做了,所以其实也并不差很多。 如果你不想以AI为业,那么Sora的出现只能指向着未来的新娱乐体验。 我们不用做什么,等待就好。 03 准备好成为AI开发者了吗? 但是,如果并不只想当一名用户呢?如果觉得AI是个机会,想要做一番事业呢? 我们想做一件事,就必须知道这件事到底是个什么东西,是不是跟外界说得那么玄乎,以及具体开始时,要知道它的易点和难点都是什么。 当你看到Sora时,如果想到了自己能不能用Sora当底座,去做成一些事,去赚钱,那么恭喜你,这个念头至少已经帮你走对了第一个分岔路口。这个路口就是,我们究竟该惧怕被AI抢走饭碗,还是要把AI变成饭碗? 这几年是AI大模型的集中爆发期。每次出现新技术都会有媒体宣传它要抢饭碗,于是相关职业从业者和在校学生就会担心,接着就开始看这种反面意见,讲述AI其实很弱智云云,于是感觉似乎不那么焦虑了。直到新的技术又出现了…… 如果一直处在这种循环里,那你可能确实需要考虑一下自己的工作了。不是考虑它是否被AI取代,而是它的可取代性是不是太高了?至少到目前为止,需要专业性并且有市场需求的职业,绝对无法是AI以及其他所有数字化技术可以取代的。 反过来说,能够应用AI技术开发应用,这件事本身就是足够专业且有市场的。与其考虑被AI替代,不如考虑如何让AI为自己打工。 如果让自己成为AI开发者?这就需要对这份工作的优势与劣势具备认知。 首先来说说优势。很多朋友都想知道,自己不是学AI的,甚至不是理科生,可能成为AI开发者吗?答案是可以。 AI大模型具有极好的泛化性,这意味着它对于人类指令的认知能力全面提升。大模型正在催生超低代码与无代码开发成为可能。OpenAI发力打造的GPTs就是其中的代表。因此,AI大模型应用的开发门槛会持续降低,几近于无,然后开发者之间比拼的就将不是技术能力,而是创意与执行效率。 第二点,不少人会担心美国AI公司能力更强,而且这些算法在中国不能用。这个其实非常无所谓。中美之间没有绝对的AI技术鸿沟,一种被证明有效的AI算法,中国AI行业一定可以做出来,可能效果打折,可能有诸多兼容问题,但AI技术整体的路线是透明的。 第三点,有人会觉得小团队甚至个人开发者没有机会。毕竟缺乏技术功底,也没有资本加持。但要看到的是,世界各地正在涌现大量精致小巧,且非常火爆的AI应用。很多案例证明AI反而是小团队掀翻行业桌子的机会。 甚至说,在接下来的全球AI应用涌现期,只有你有足够的视野与敏锐度,是可以“借鉴”到很多优秀AI应用的。这种模式当然并不光彩,但客观上看从PC时代到移动时代,把出色“应用”借鉴过来都是行之有效的方案。 第四点,还有人会认为学习AI,成为AI开发者太难了,没有门路,没有学习资源,于是去报课,去参加各种社群讨论。但这时很容易忽视一件事,就是国内各大厂商为了培养AI开发者,已经在过去很多年间打造了各种免费、系统且被验证过的学习路径与课程资源,大可不必被各种旁门左道的AI讲师忽悠。 当然,有好的一面就有坏的一面。AI开发者,尤其是直指大模型原生应用的AI开发者,也会面临几个巨大的问题。 首先,找到一个特别好的点子,这件事依旧很难,甚至是需要巨大运气的。AI技术将打破很多规则,在一片混沌中重新找到秩序,这件事可能拼的不仅是努力。 其次,Sora这类大模型证明了一件事,就是AI算力将越来越紧俏,甚至全面进入稀缺时代,加上地缘层面的不确定性,AI算力在可见的未来将越来越昂贵。如何应对算力成本,才是开发者需要头疼的问题。 此外,虽然目前AI原生应用一片蛮荒,大有可为,但势必会出现在某类应用走向成功后,巨头加入赛道导致洗牌。所以,AI原生应用是一个跟巨头抢时间,用间隙期极速发展,尽快上岸的游戏。 AI大模型,就像沙漠里突然涌出了一片泉水,有人想用它搞养殖,有人想用它开洗浴。大家都在想,但最先解渴的人肯定是先拿起水桶跑过去的那个。 04 大模型到应用,直线最短 最后,我想聊聊AI思维。AI思维到底是个什么思维,这件事说来就话长了,且随着技术本身的发展,相应的思维模式还在不断翻新。但有一点需要肯定,那就是AI思维肯定不是复刻思维。 目前阶段,中国科技产业对于AI大模型这轮技术热潮,还处在努力吸收消化当中。这个过程中,表现一种流量导向的思维方式,具体体现为两种。一个是尽量复刻国外的创新,最多就想在复刻的时候多搞点花样,怎么去做一个“中国版的某某某”。这件事当然很对,有中国版的Sora十分重要,但假如有超过100个中国Sora,那确实会造成巨大的浪费。另一种就是用现有的成绩去靠大模型热点,从而出现了AI PC、AI手机、AI家电等产业趋势。 但这些对大模型的思考,都是立场先行,热点先行的。举个例子,大家都是什么AI火了就想复刻什么。但AI大模型+塑料分析这种场景非常有意义,却根本没人讨论。 这种时候,我们很容易忽视最简单的问题:大模型要有大模型的用法,它作为技术创新才有意义。 所以,想要让Sora,让AI大模型对你有意义,就要摒弃外界的噪音,回归最简单的规律。从大模型能够做什么的基础问题开始思考,在这条直线上的就对,不在的就掀翻它。 我怀着巨大的信心,想要说出这么一件事:AI大模型这场游戏的最后赢家,不是现在的某家大公司,某个大项目,而是某个不知名的你。 像在杭州民用房里讨论未来的马云,像不知道创业做什么的张一鸣。 不要管大厂有什么布局,不要管前辈有什么经验,不要管网上有哪些分析,只考虑基础设施、成本和可能性,以最短路径打破常规。 你与AI之间,直线最短。 Sora,乃至发展了70年的AI技术,就是在为你提供这样一个机会。一个以直线打破所有曲线的机会。
星舰上天,Grok开源,但华尔街还是瞧不起特斯拉
今天凌晨,马斯克旗下的AI公司xAI把它的Grok大模型开源了。 往大了说,把自家花费大量资源训练出来的大模型开源,是为了让人工智能造福全人类,正如马斯克抨击OpenAI不够“Open”一样。 往小了说,开源模型更有利于开发者进行调整,构建更加繁荣的应用生态,有助于自家模型的推广。 而就今天的马斯克而言,目的似乎更加纯粹一点: 他需要赚钱。 我们先来看一下Grok开源这件事。 前不久,马斯克起诉OpenAI,并且宣布将要开源自己的Grok大模型。是冲动也好,赚取流量也罢,马斯克说到做到了。 本次开源的Grok-1是一个由xAI从头训练的混合专家模型(MoE),参数量来到了3140亿,是迄今为止参数量最大的开源大语言模型,比Llama 65B参数量大了4倍多。 在此之前,绝大多数科技巨头选择开源自家模型都走了“短小精悍”的路线,很大一部分原因是由于它们期望各种开发者能够方便快捷的“开箱即用”,以便迅速繁荣生态。 毕竟参数量越小,对设备的负担越低,调整起来也越方便,使用门槛也就越低。 像Grok这种参数量的模型,各位开发者就得好好考虑下了。 (“由于Grok-1是一个规模较大(314B 参数)的模型,因此需要有足够 GPU 内存的机器才能使用示例代码测试模型。”) 有网友算了一下,每个参数2字节的话,想要跑Grok需要628GB内存的GPU,也就是八块80G的H100,而每块H100售价35000刀,八块算下来折合人民币将近200万,这还单单只是设备成本... 在国内就更别说了。 请问一般的开发者谁能付得起这钱。 这本身就和用开源广邀天下勇士共襄大业的初衷相悖。 所以也就有位康奈尔大学的教授出来说了:“马斯克并不是为了慈善而做这件事,他想赚钱。” 问题出在特斯拉这家公司身上,现在的特斯拉似乎被投资人看成了一家汽车制造公司,而不是科技公司。 这也是资本市场做多和做空特斯拉两派的最核心矛盾,去年一年,特斯拉的股价从108涨到峰值的300美元,靠的就是FSD V12和Dojo超算。 而今年开年至今三个多月的时间里,特斯拉股价下跌34%,核心矛盾却又是“不如中国车企强”以及“纯电车正在被欧美抛弃”。 首先是特斯拉23年Q4财报发布后,有一波看空潮,不少机构下调了特斯拉的目标价。 2月15日在特斯拉财报会议后的半个多月后,摩根士丹利分析师亚当·乔纳斯在一份报告中写道,他刚刚从有史以来最悲观的特斯拉午餐会上回来。 每个人都认为特斯拉将在未来6个月内表现不佳,几乎所有人都认为该股未来一年将表现不佳。 乔纳斯列举了客户整体看空的原因,最大的一个原因是人工智能,特斯拉被排除在与人工智能相关的科技股上涨之外。投资者担心的另一个大问题是,特斯拉收入增长可能陷入停滞。 随着特斯拉股票不断下跌,马斯克失去全球亿万富翁榜首位置,让位于亚马逊创始人贝佐斯。马斯克目前净资产为1977亿美元,而贝佐斯的财富为2003亿美元。 紧接着第二天,马斯克的排名又被LV老板伯纳德·阿尔诺再挤下一位,至全球第三。 坏消息不断,3月5日,特斯拉柏林工厂疑似发生纵火案件,工厂的生产已暂停。 柏林工厂停工当天,又有多家机构对特斯拉的目标价下调,其中瑞银和富国银行在2个月内,对特斯拉评级的第二次下调。 当地时间3月13日,特斯拉股价跌超4%,创去年5月中旬来收盘新低,总市值跌破5400亿美元。 富国银行的分析师Colin Langan将特斯拉评级从“持股观望”下调为“减持”,Langan表示,特斯拉现在是一家“没有增长的增长公司”。 但也有网友表示怀疑,毕竟这个分析师的准头一直不怎么样。 Evercore分析师在参观了特斯拉位于德克萨斯州的工厂后表示,特斯拉可能还需要数年时间才能全面推出一款新的低成本车型,这将比华尔街预计的时间更长。 看空特斯拉的机构大多洋洋洒洒数十页的研报,但总结起来就一句话: 去年特斯拉车卖得不好,今年也一样,短期内找不到增长点。 为数不多的看多者也绝口不提造车业务,而是盯着其技术能力猛吹—— “木头姐”Cathie Wood旗下的ARK方舟基金决定增持特斯拉和Meta Platforms的股票,同时减持英伟达的股票。“木头姐”认为: 特斯拉不仅仅是一家电动汽车公司,其行业领先的自动驾驶软件正是人工智能领域最大的机会,未来三年特斯拉股价将上涨1140%。 事实也是如此,欧美对于纯电动车企开始失去信心,当前美股电动汽车制造商的总市值约为7000亿美元(特斯拉约占总市值的75%),较峰值市值减少了1.5 万亿美元。 反倒是被诟病电动化转型缓慢的丰田靠着混动车型大赚特赚,在从去年4月开始的9个月里,丰田的利润达到了270亿美元,大约是前一年同期利润的两倍。 如何把特斯拉变成一家科技公司?这个问题Meta早就给出了答案:
Magic6至臻版与RSR 保时捷设计齐发!荣耀多款旗舰新品亮相,赵明再谈AI战略
文 | 漠影 智东西3月18日晚间消息,今天荣耀在北京发布了多款旗舰新品,包括荣耀Magic6至臻版和荣耀Magic6 RSR保时捷设计;同时,荣耀发布了AI使能的全场景战略,定义智能终端AI四层架构。 同时发布的新品还有荣耀首款AI PC——荣耀MagicBook Pro 16,该新品兼备轻薄机身和游戏性能。 ▲荣耀Magic6至臻版 ▲Magic6 RSR保时捷设计 荣耀CEO现场分享称,在2024 MWC移动世界大会上,荣耀凭借荣耀Magic V2 RSR保时捷设计的创新和体验,及其平台级、系统级的突出AI表现,获得了MWC2024的GLOMO最佳产品大奖。此次旗舰新品的发布以及AI使能的全场景战略公布,更是表明了荣耀将中国优秀产业链资源与全球创新相结合的决心和实力。 会上,荣耀CEO赵明称:荣耀打造的是平台级的AI,这是荣耀引领这一场AI变革、面向未来构建消费者的AI体验的底层核心能力。荣耀在AI上的思考和实践将引领整个产业链。我们坚信,踏踏实实地构建底层技术优势,把中国产业链与全球创新结合在一起,用开放与封闭竞争,就能够带来突破的硬件创新以及更好的用户体验。 一、荣耀用四层AI架构,带来全新的人机交互变革 早在2016年荣耀就开始布局AI,在业内首次提出手机AI的概念,发布了Magic Live智慧系统,打开手机人工智能OS的大门,为意图识别人机交互的成形奠定了基础;到2022年,在MagicOS 7.0上,荣耀构建了平台级AI,是荣耀意图识别人机交互的进一步探索。长达7年的探索,领先行业的前瞻性使荣耀在手机AI技术领域走到了前沿。在本次发布会上,荣耀发布全新的AI使能的全场景战略,清晰的展示荣耀全新的AI战略架构。 发布会上,荣耀的AI战略将智能终端的AI分为四层,即第一层用AI使能跨系统融合,让不同的操作系统通过AI 来做决策,实现手机、平板、PC等设备之间的无缝连接和数据共享;第二层用AI重构操作系统,让手机越用越懂你、越用越好用,基于意图识别的人机交互新方式就是一个典型成果;第三层是AI在端侧的应用,比如抠图、拍照渲染、总结文档;第四层则是AI的端云协同,将网路AI大模型应用呈现。 ▲荣耀AI四层架构 作为最早布局AI的终端厂商之一,荣耀一贯坚持“开放共赢”的价值理念,通过持续创新引领全球科技合作新风潮。荣耀打造的平台级AI赋能不同的设备,包括手机、平板、笔记本、可穿戴设备等跨设备跨操作系统的平台级AI能力,使得安卓、Windows、IoT等开放的操作系统变成了整体生态。正因为荣耀这种领先的思想和战略,吸引了微软、高通、英特尔、英伟达等世界级AI企业,他们愿意把最优的技术、能力和创新分享出来,与荣耀一起推动「平台级AI」的发展,让荣耀拥有开放生态对抗封闭生态的实力,获得比肩甚至超越封闭生态的体验。 当然荣耀AI的实力离不开持续的技术深耕与投入,据了解,目前为止,荣耀AI研发费用累积已达100亿,AI专利成果超2000项。在平台级AI加持下的多模生态,利用AI驱动跨系统协作与交互,可以让不同系统的设备及应用快速识别和理解用户意图,为手机、AI PC带来引领性的体验,将AI真正引入PC端,构建全新的PC交互模式,进入AI PC新时代。 二、与全球产业链共振,荣耀旗舰手机背后的创新秘密 除了在AI战略上的引领外,荣耀在技术创新上同样处于行业引领性地位,不断创新的背后是为整个产业链带来前所未有的机遇。作为中国手机制造商中备受瞩目的品牌之一,荣耀一直以来都致力于技术创新和产品优化,不断推动手机行业的发展,并赢得了越来越多消费者的认可。 此次荣耀Magic6系列全新发布的荣耀Magic6 至臻版与荣耀Magic6 RSR 保时捷设计两款旗舰手机,在影像上的跨界联合创新堪称行业典范。荣耀将行业顶尖的自动驾驶元器件跨界应用到影像系统上,首次将自动驾驶领域的LOFIC技术及激光雷达对焦系统上实现手机影像的突破,带来单反级超动态鹰眼相机。这一创新不仅颠覆了传统创新模式,更是对手机行业产业链的一次深度整合,打破了国外高端影像元器件的垄断地位,进一步提升了国产技术在全球市场的竞争力。 ▲ 单反级超动态鹰眼相机 在屏幕技术上,荣耀Magic6 RSR 保时捷设计与京东方的紧密合作再次实现了突破,全球首发的荣耀叠光绿洲护眼屏不仅提升了手机屏幕的显示效果和用户体验,更为手机行业屏幕技术发展注入了新的活力。这款手机的独特设计理念和奢华科技元素也引起了业界和消费者的广泛关注,将保时捷的经典设计元素与荣耀的创新科技完美融合,展现了科技与奢华的完美结合。 ▲荣耀叠光绿洲护眼屏技术 荣耀Magic6系列手机作为创新集大成之作,通过自主研发和与产业链协同创新,持续引领科技创新的行业普惠,让新质生产力更富有成效。重构手机直连卫星通信解决方案的荣耀鸿燕通信、全新升级的第二代青海湖电池、超耐摔的荣耀巨犀玻璃、抓拍更强的荣耀鹰眼相机、持续引领的护眼技术,以及引领操作系统变革的魔法OS等六大行业引领技术创新。 创新的背后,是荣耀与产业链节点上的合作伙伴深度耦合、协同创新的成果。以电池为例,荣耀青海湖电池的商用不仅实现了硅碳负极国产化的技术突破,更带动了手机电池产业链的技术找到新方向,为企业发展注入了全新动力;荣耀绿洲护眼屏技术的推出也整合了行业机构、科研学术机构、医疗机构等合作伙伴的力量,共同推动屏幕健康显示的新业态发展。 ▲荣耀Magic6 RSR保时捷设计 引领产业链高质量发展的荣耀,正通过不断的技术赋能和协同创新,带领中国产业链与世界创新共振。正如荣耀CEO赵明发言时表示,“荣耀所选择的发展道路,是利用全球最优产业链资源来打造最强产品。我们要吸收科技界各种各样的知识为我所用,进而打造一个开放的体系,在规模化、产业化基础上发展成自己的能力,把中国的产业链不断夯实”。 在当前新质生产力成为中国经济发展重要引擎的背景下,技术领域的革命性突破、生产要素的创新整合以及产业的跨越式升级,正孕育出新时代的先进生产力。这一波创新浪潮的涌现,不仅加速了创新的步伐,更为整个产业链带来了前所未有的机遇。品牌独立第四年的荣耀,正通过引领全球合作与全球创新,不断的创新与突破,为产业的未来发展注入新的活力与势能,成为了新质生产力不断蓬勃发展的有力见证和推动力量;同时,引领全球合作与全球创新加速也让外界看到了“世界荣耀”的底气,展现了代表中国创新力量参与国际市场竞争,打破海外市场固化格局的时代责任。
研究:120帧是避免VR晕眩的“重要阈值”
IT之家 3 月 18 日消息,一项来自中国西交利物浦大学的研究表明,对于大多数人来说,120fps 是避免 VR 眩晕的“重要门槛”。 该研究团队长期致力于研究 VR 画面刷新率、分辨率、触觉反馈、立体视觉等因素对用户的影响,以及这些要素与模拟器适应不良 (simulator sickness) 的相关性。此次研究使用了一款支持最高 180Hz 刷新率的小派 5K Super 头显,这是目前市面上刷新率最高的 VR 设备之一。 据IT之家了解,研究招募了 32 名参与者,年龄介于 18 至 51 岁,并分为男女各半。他们分别体验了 60fps、90fps、120fps 和 180fps 的画面刷新率,研究人员对比了不同刷新率下参与者恶心感发生的概率。结果显示,120fps 是一个「重要阈值」,与 60fps 和 90fps 相比,参与者在 120fps 下的恶心感明显减轻。当刷新率提升到 180fps 时,恶心感减轻的程度微乎其微,这表明 120fps 可能就是该阈值。 不过需要指出的是,这项研究仅针对特定的头显设备进行,并不确定结果是否适用于其他设备。例如,小派 5K Super 的视野范围明显比常见 VR 头显更广,并且边缘画面存在几何畸变现象。过往研究表明,视野范围和几何畸变都会影响用户眩晕感。 目前支持 120Hz 刷新率的独立式 VR 头显包括 Quest 3 和 Quest 2,但仅限于开发者模式,且使用率极低。这是因为手机芯片的运算能力有限,这是因为手机芯片的性能限制,要在 8 毫秒内渲染每一帧画面,会严重制约游戏画质和模拟复杂度。 大多数 Quest 2 游戏均采用默认的 72Hz 刷新率,而新款的 Quest 3 则有不少游戏升级到了 90Hz。距离 120Hz 成为独立式 VR 的主流标准可能还需要很长一段时间。 对于 PC 端 VR 设备来说,使用高性能显卡可以在部分简单游戏中实现 120fps 的渲染,例如节奏游戏(Beat Saber)这类。但对于画面更复杂的模拟器游戏,则需要非常昂贵的高端硬件才能达到这一标准。例如 Valve Index 支持 144Hz 模式,而研究中使用的 Pimax 5K Plus 更是支持 180Hz。 影响帧率表现的另一个重要因素是画面插帧技术。该技术通过生成中间帧,在不增加实际渲染帧数的情况下,让画面看起来更加流畅。例如 PlayStation VR2 就广泛采用插帧技术,将许多原本 60fps 的游戏插帧到 120fps 再显示于 120Hz 的屏幕上。Quest 也支持插帧,但仅限于少数游戏,PC 端则可以通过软件在显卡负载过高时启用插帧功能。 尽管这项研究的结果是否适用于所有头显尚不明确,但它仍然为 VR 行业敲响了警钟。业界不应该仅仅满足于 Oculus Rift 和 HTC Vive 发布时所设立的 90fps 标准,更不用说 Oculus Quest 等独立式头显普及的 72fps 标准了。就如同分辨率一样,帧率也应该不断提升,这样才能尽可能减少 VR 眩晕的发生,让更多人畅快享受 VR 体验。
埃隆·马斯克开源Grok的“难言之隐”与“野望”
文 /《AI赋能超级个体》作者 翟尤 编辑 / 腾讯科技 郭晓静 2024年3月18日,马斯克兑现前几天的诺言,正式对Grok大模型进行开源。根据开源信息显示:Grok模型的Transformer达到64层,大小为314B;用户可以将Grok用于商业用途(免费),并且进行修改和分发,并没有附加条款。 首先速览一下 Grok 的参数细节: ① 模型概况:拥有3140亿个参数,成为目前参数量最大的开源模型;Grok-1 是一个基于 Transformer 的自回归模型。xAI 利用来自人类和早期 Grok-0 模型的大量反馈对模型进行了微调。初始的 Grok-1 能够处理 8192 个 token 的上下文长度,已经于 2023 年 11 月发布。 ② 特点:模型采用了混合专家架构,共有8个专家模型,其中每个数据单元(Token)由2位专家处理。这使得每次对Token的处理会涉及860亿激活参数,比目前开源的最大模型Llama-2 70B的总参数量还多。模型包含64个处理层,模型使用了48个用于处理查询的注意力机制单元和8个用于处理键/值对的注意力机制单元。模型支持8bit精度量化。 ③ 缺陷:Grok-1 语言模型不具备独立搜索网络的能力。在 Grok 中部署搜索工具和数据库可以增强模型的能力和真实性。尽管可以访问外部信息源,但模型仍会产生幻觉。 ④ 训练数据:Grok-1 发布版本所使用的训练数据来自截至 2023 年第三季度的互联网数据和 xAI 的 AI 训练师提供的数据。 再看一下各项基准测试的评分对比: 从评分上来看,没有什么惊艳之处,比不过GPT4,也比不过Palm-2及Claude3。但是xAI 表示,他们没有为应对这个考试而特别准备或调整模型。也许我们可以小小期待一下,Grok1.5 是不是会带来某些惊喜。 这次公布的开源版本,马斯克绝对会着重讽刺一下隔壁的“Closed AI”。 但是,Grok 开源,仅仅是为了讽刺 OpenAI 吗?如果坚持闭源,Grok 是不是会把自己陷入某些比较艰难的境地?大模型开源 VS 闭源,在产业生态上,分别占据什么样的位置? 01 Grok开源的难言之隐 马斯克宣布xAI开源,虽然引发了新一轮的创新竞争和争议,但从整个市场格局来看,Grok的开源也是不得已而为之的决定。 Grok是马斯克创立的AI公司X.ai推出的大模型,相比于其他大模型,Grok的与众不同之处在于使用了X平台(原名Twitter)上的语料进行训练,据称Grok还自带幽默感和怼人的风格。 虽然得到了X平台数据资源的加持,但是在大模型大爆发的当下,Grok并没有进入第一梯队。 尤其是2024年以来,Gemini、Claude3接连发布,其能力已经接近甚至超越GPT-4,三者处于第一梯队的行业格局基本确定。这还不算上Mistral AI和Inflection AI的奋起直追。因此,未来的基座大模型“虹吸效应”越发明显,留给其他玩家的机会并不多。 Grok借助埃隆·马斯克的影响力虽然得到了一定的关注度,但是在产业和用户的知名度并不高,在大模型的“军备竞赛”中并没有太多竞争优势。抛开马斯克本身与OpenAI的恩怨情仇,Grok继续叫板的意义并不大。 如果Grok继续走闭源开发的路径,基本上将成为人工智能时代的“诺基亚塞班系统”,被抛弃只是时间问题。届时Grok既不能帮助马斯克对X平台实现商业化变现,又成为昂贵的沉默成本。 因此,与其作为一个二流甚至三流的闭源大模型,倒不如破釜沉舟,通过开源为Grok杀出一条血路,在风口上为Grok谋下新的发展路径。国内大模型月之暗面CEO杨植麟也曾表达过,“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。” 02 开源是推动产业 “螺旋式成长”的必要一环 技术的发展有闭源,就必然有开源。闭源和开源两者的性能会竞相追赶,交替上升,这也是技术发展的动力之一。 移动互联网时代iOS的和Android就是闭源和开源的典型代表,因此不存在闭源一直碾压开源的现象,而是双方在不断借鉴和切磋的过程中,让更多用户在移动互联网时代获得更多收益,成果惠及社会。 同样道理,在大模型时代,如果说ChatGPT点燃大家对大模型的热情,那么开源大模型的出现则是进一步降低了创业者的门槛,让更多创业者在基础模型方面处于同一起跑线上。 甚至可以说,正是因为有了开源大模型才极大降低了大模型的开发成本。毕竟仅靠OpenAI一家公司是难以将大模型向全球生态的形态进行发展,大家也不愿意看到一家独大的局面。 例如2024年年初火爆的文生视频模型Sora引发全球轰动,业内也不短加快开源版本的研发,国内研究机构甚至推出了Open-Sora框架,并将复现成本降低46%,模型训练输入序列长度扩充至819K patches,让更多机构可以在文生视频利于获得可用的工具和方法。 同时,在企业应用大模型时,不仅关注模型的前沿能力,还需考虑数据安全隐私、成本控制等多方面因素。因此,面向企业的开源模型在许多情况下更能满足企业个性化需求,而像OpenAI这样的闭源模型公司可能无法完全满足这些需求。 未来的大模型市场,将呈现出开源模型满足基本智能需求,闭源模型满足高阶需求的互补态势。 03 开源基础上的创新, 才是“真功夫” 对于大模型而言,开源的底座只是起点,需要在这个起点上进一步创新。 尤其是当前开源大模型更新的速度不断加快,今天可能还是业内最好的模型,但是明天就有可能被超越,变成沉默成本。当模型迭代速度不断加快的今天,过去的投入很有可能就会打水漂。 因此在开源底座的基础上,做为我所用的东西更有价值。比如目前海外的开源模型发展较快,但是其模型中文能力一般,也没有丰富的行业场景,缺乏国内如此丰富的数据预训练资源,这反倒是创业的机会和宝贵的窗口期。 同时,开源模型让更多高校、科研机构、中小企业不断深入使用,并对开源模型进行不断完善改进,最终这些成果也将惠及参与开源模型的所有人。 以Meta公司开源的LLaMa 2为例,截止2023年底,Hugging Face上开源的大模型排行榜前十名中,有8个是基于LLaMa 2 打造的,使用LLaMa 2的开源大模型已经超过1500个。同时,Meta、英特尔、Stability AI、Hugging Face、耶鲁大学、康奈尔大学等57家科技公司、学术机构还在2023年下半年成立了AI联盟,旨在通过构建开源大模型生态,来推动开源工作的发展。目前AI联盟构建起从研究、评估、硬件、安全、公众参与等一整套流程。 当然,依托开源做研发并不容易,用好开源模型也是一种壁垒和门槛。 这是因为基于开源模型做开发,其后续的投入门槛并不低,对研发要求依旧很高。用开源模型做底座只是有效降低了冷启动的成本,具体来看:优秀的开源模型可能已经学习超过万亿token的数据,因此帮助创业者节省了部分成本,创业者可以在这个基础上进一步进行训练,最终将模型做到行业领先水平,这个过程中数据清洗、预训练、微调、强化学习等步骤都不能少。 04 “开源+”战略或将成为 Grok突围的新思路 1.开源+端侧实现“软硬一体化” 当前,主流大模型动辄万亿级的参数,需要海量的算力资源予以支持,但并非所有终端都能够支持这样的成本投入,而在智能手机、物联网等端侧需要小巧、灵活的轻量级模型,甚至可以在终端处于离线状态也能够使用。 因此,真正做到让AI可以“触手可及”,端侧模型落地具体需求场景更为迫切: 埃隆·马斯克在特斯拉汽车、星链卫星终端、甚至擎天柱机器人正在构建AI落地“最硬核”场景:特斯拉的Autopilot使用了AI算法来实现自动驾驶功能,将是未来智慧交通的一种重要尝试;SpaceX最近发射的星舰实现了2秒内处理所有33个发动机的数据,并且确保可以安全加速。未来基于Grok来构建软硬一体化的模型-应用生态体系,有望解决当前“基础模型和需求场景,谁来把两者衔接起来”的现实问题。更为关键的一点在于,大部分目前致力于大模型开发的公司最终将变为模型-应用一体化的企业,而且应用层的市场价值更大。 一旦通过了TMF(Technology Market Fit)、PMF(Product Market Fit)阶段,其价值将在生产力效率提升、泛娱乐、信息流转创新方面产生更大效益,而马斯克在其他产业的布局可以更好的与之发生“共振”:一方面通过Grok开源,吸引更多用户和企业的调用和接入,提升通用的智能化能力,另一方面围绕自身生态和产业场景、数据方面的优势(汽车+卫星+机器人)构建更多可落地的创新。生成式人工智能正在从超级模型向超级应用转型的新起点,与其和学霸“卷”基座大模型,不如在应用侧让Grok率先卡位。 同时,对于一直尚未进入大众视野的“大模型安全和透明度”问题,Grok的开源有望为大众理解大模型复杂性和安全挑战,提供新的视角。毕竟以目前的发展速度,大模型已经不是技术研发问题,而是一个全社会需要广泛参与和讨论的社会话题。 2.开源+闭源构建“一体两翼” 是的,开源和闭源并非死对头,老死不相往来。 事实上,在大模型领域大量科技企业已经在探索开源+闭源的双重策略。例如谷歌在发布大模型Gemini的时候,能力较为强大的Gemini Ultra是采用闭源策略,主要竞争对手是GPT-4、Claude3.0等,而Gemma2B和7B则采用了开源战略,能力稍逊一筹,但是在特定场景将有着更广泛的应用领域。 Grok可以借鉴开源与闭源混搭的思路,以“半开源”的方式一方面释放能力给更多用户和企业,另一方面借助X平台的海量优质实时数据构建自身壁垒。从而在大模型的竞争中获得一席之地。 当然并不是说开源大模型可以解决一切问题。事实上,开源大模型和闭源大模型还是有一定的差距:闭源大模型整体能力上还是高于开源模型。因为开源的大模型大多还没有经过算力验证,闭源是人才密度、资金密度、资源密度高度集中的方式,同时开源本身也避免不了中心化的风险。 对于企业来讲,希望在基座大模型上实现反超的机会已经接近尾声,但是通过选择开源模型是更加务实的选择,优化、训练出实用的模型更是真本事。基于开源,是有机会作出优秀的大模型,核心是能够拥有相对领先的认知,可以对模型能力进行持续迭代。 (本文首发:腾讯科技)
“PBE技术平台”亮相中国市场,益而益集团原晓宁:可应用于暖通、卫浴等领域
凤凰网科技讯(作者/周若楠) 3月14日,益而益集团自主研发的“PBE技术平台”亮相“AWE2024”展会现场,此次亮相是“PBE技术平台”在中国市场的首发,同时也是益而益集团为本次展会带来的最大亮点。凤凰网科技对益而益集团营销副总裁原晓宁进行采访,他表示,未来家电产品的发展一定围绕着“智能化、个性化、品质化”方向发展。越来越多的中国家电企业采用了自主品牌策略在海外拓展市场,中国家电产业正一步一步向自助品牌做转化,竞争力也正在从最初的单一成本优势,向质量、性能、技术创新上不断升级发展。 据了解,“PBE技术平台“是益而益集团最新研发升级并投放全球市场的”系统化技术平台“。产品方案主要包括PRCD(移动式剩余电流保护装置)、ALCI(设备漏电保护器)、GFCI(接地故障保护器)、LCDI(泄露电流检测保护器)等,可应用于暖通、卫浴、个人护理、厨房电器设备及其他新兴领域。“PBE技术平台”的漏电保护装置具备极其敏感的漏电检测功能,以及高灵敏度的切断电源线的反应能力,从而有效预防消费者遭遇漏电电击的风险。同时,在新能源车的移动充电枪、生物科研等领域也有所应用。 针对采访中提到的中国家电出海的环保问题,原晓宁强调保障消费者的安全需求、使用体验的同时,呼吁所有行业成员一起建立家电领域的绿色环保体系。益而益集团不断实施有强针对性的改善举措。在供应商侧,将供应商碳排放管理纳入绿色采购体系,同时还积极与供应商在新材料、新工艺方面协同创新,共同开辟环保材料应用和物料配送环节的节能降耗;在生产端,以数智化助推绿色转型,积极在苏州、温州两个制造基地推进智能工厂和数字化车间建设。通过这些措施,益而益集团的产品已经满足了全球主流的12项环保和有害物质管控要求。 对话要点总结: 1.中国目前是全球规模做大、产业配套最齐备、创新最活跃的家电制造大国。 2.中国家电产业的竞争力也正在从最初的单一成本优势,向质量、性能、技术创新上不断升级发展。 3.中国家电企业向自主品牌迈进,意味着家电企业直接面对消费者,直接承担相应的责任与义务。 4.PBE技术是益而益集团自主研发的,拥有完整的知识产权,是针对全球市场投放的一个系统化的技术平台。 5.PBE自检技术可以自动地、周期性地去检测漏电保护功能是否还有效,同时会触发报警信号进行远程通知,极大提升产品安全等级。 6.PBE集成了5项核心技术,具备很好的开放与兼容性,可配合家电产品进行灵活的集成,为消费者创造“更安全”、“更舒适”的生活体验,极大提升家电产品的整体竞争力。 7.原晓宁认为未来家电产品的发展一定围绕着“智能化、个性化、品质化”方向发展。 8.原晓宁认为消费者关于安全的需求必须得到更充分的满足,没有相匹配的安全保证,很多更智能、便捷、舒适、个性化的需求是无法实现。 9.原晓宁表示要围绕需求构建技术平台并实现有序迭代升级,重点发力智能制造,建立了全维度的服务体系。 10.家电企业的安全标准,技术标准和环保标准合规是最基础的责任,要大力进行环保发展。 以下为益而益集团原晓宁与凤凰网科技对话实录(有部分对话删减): 凤凰网科技:请您介绍一下本次展会益而益带来哪些亮点? 益而益集团原晓宁:在回答我们这次展会带来哪些亮点之前,我先简单介绍一下益而益集团成立于2000年,到现在有20多年的经营历史。产品主要覆盖四大品类,分别是漏电保护、智能家居、水泵以及电线。其中漏电保护是非常重要的一个商业模块,这个模块跟整个家电行业关系是最为紧密的。 下面我就回答关于亮点的问题,在今年的2月29号,美国拉斯维加斯举办的国际建筑材料展览会(IBS)上,我们参展发布了PBE技术平台,也是我们这个技术平台在全球市场的首发。这次参加AWE,我们同样也展示了这个技术平台,可以说是这个技术平台在中国市场的首发,我想谈到亮点,这可能是我们最大的一个亮点,那说到这里大家会好奇PBE技术平台是一个什么样的构成?那我这里也简单的介绍一下这个技术平台。 PBE是益而益自主研发的,我们拥有完整的知识产权,是针对全球市场投放的一个系统化的技术平台。首先,它是集合了我们整个集团最新的、最核心的跟漏电保护的相关技术,包括有单双压二合一保护、正反向接线保护、低线检测保护和自检技术,这些可能相对来说比较专业的术语,那我稍微展开来解释一下。 比如以自检技术为例,常规的漏电保护装置上面会有一个键叫检测键,它是通过这个检测键去模拟检测漏电保护装置是否有效,这个功能是否有效。它是必须要通过这个检测键来模拟检测的,所以说这个原理就决定如果你使用这种普通的漏电保护装置,你必须在每次使用之前,或者在使用的过程中,要定期的去按压这个键来去验证整个保护装置的漏电保护功能是否正常工作,但是这对消费者的要求就非常高了,那其实消费者在日常的使用过程中很难做到这一点,就是要定期去按压这个键,实际上做不到这一点,那这就意味着如果一旦失效了,但你并不知道,这样就存在漏电的风险。 而我们这次在PBE技术平台上,我们研发的自检技术,可以说它在不切断电源,也就是让你在正常使用的过程中,这个装置可以自动地、周期性地去检测漏电保护功能是否还有效,如果一旦检测到失效了,它会第一时间去切断电源,同时会发一个报警信号,甚至可以远程的通知,那这个就非常的有用,可以去极大提升产品安全等级。所以这是我前面讲到的关于PBE的解释,它集成了最新的、最前沿的一些技术,这是第一个特点。 第二个特点就是整个技术平台的开放性和可兼容性非常好。为什么强调这一点?因为我们这个产品它往往是跟家电的主机集成在一起的。所以我们也会考虑到整个主机产品的设计,所以PBE技术是非常容易可以跟家电的功能模块,包括电源模块、EMC模块、感应模块和智能控制模块集成在一起。那这个集成带来的好处是什么呢?就是可以帮助优化整体的设计,提高消费者的使用体验,这是它第二个特点。 第三个特点就是这个技术平台可以提供多种多样的产品解决方案,就包括PRCD(移动式剩余电流保护装置)。PRCD的应用场景是非常广泛的,比如在卫浴领域里面,智能马桶、电热毛巾架、浴室暖风机,包括厨房电器里面的集成灶、咖啡机、水龙头都可以去匹配PRCD,还有ALCI(设备漏电保护器),主要是应用在个人护理上,比如高速吹风机,现在非常受欢迎的高速风头,还有高速风枢,这些就是匹配ALCI,还有GFCI、 LCDI 这些产品,分别是匹配在比如空调以及发电机、清洗机上,当然除了家电领域之外,我们的这个PBE技术还有很多新的应用。这次展台上可以看到,比如我们可以在新能源车移动充电枪上面,这个是非常适用于PBE来进行保护的,还有一些生物科研领域的,全球现在最顶尖的生化实验室里面最精密的,比如细菌培养箱是使用了我们的产品,总之就是说我们的产品集成到家电产品以后,可以大大的提升整机产品的安全性跟舒适性,也会大大增加这些家电产品的竞争力。 凤凰网科技:那您觉得中国家电市场以及消费者的关注点未来会如何发展? 益而益集团原晓宁:其实消费者的关注点是我们非常关注的,我们也一直在不断研究分析,但是从实际操作经验来看,我们认为所有的关注都是来自于需求,这里指的是消费者的需求,消费者的显性需求是大家非常容易捕捉到的,比如现在大家对于高品质生活的追求,以及跟高品质生活追求相关联的,大家要体现自我价值,对应的大家其实都意识到整个家电产品的高端化、品质化、智能化是非常明确的。 另一方面隐性需求更应该值得重视,隐性需求我们意识到就是安全,因为安全是基础,假如消费者在安全方面的这个需求没有得到尊重跟满足。 那显性的需求是很难实现,或者说在实现的过程中有很大的安全风险。 所以说我们内部有一个主张是说显性方面可以更自由来描述这些需求,我指的消费者可以自由自在去享受符合内心价值主张的生活方式,且我们讲的更智能、更便捷、更安全,这是更自由,但我们主张说更自由的前提是更安全,因为更安全所以更自由,这个观点我们其实在很多家电的企业,因为都是我们的客户,我们在合作的过程中大家提到这一点大家都深以为然,也都对这方面有形成高度的共识。 凤凰网科技:在所处的行业内有很多同类竞品,在如此激烈的市场环境下,益而益的信心点在哪? 益而益集团原晓宁:谈到信心,或者谈到优势,或者是谈到竞争力,我觉得这些其实都是取决于我们为顾客创造的价值。当然这个价值在实际的过程,实际的运作的过程中,往往是具体的、可计算的、可对比、可衡量的。在整个构建实现交付过程中,其实对于益而益来讲,我们并没有单纯的把眼光放到这个跟同类产品的比较或者竞争上去,我们认为大家一起努力把这个行业,把中国的家电产业乃至把整个的中国的制造业做大做强,在全球获得这个竞争力,这才是经营企业运作,整个的生意的根本动力和出发点。 围绕这个目标,我们在多维度全方面打造自身的能力,因为在我们这个行业里面,有很多时候我们需要跟国外,可能他们有所谓的先发优势,或者有一定的经营历史的一些品牌,我们要去跟他做竞争。所以说作为中国的制造业,我们不畏惧这种竞争,但是我们要多维度的打造我们的能力。比如说在这个研发上,我们有一个非常全面的需求管理网络,通过这个网络我们可以对消费者的潜在中长期需求进行调研结构分析,有了这种对于需求的深入把握,我们就可以去构建我们的技术平台,并且去实现我这种技术平台的定期的升级换代。那前面讲的我们这次发布的最新的PBE就是这样的一个案例。那在制造端这边,我们是侧重于打造规模制造优势以及整个产业链的一体化,重点发力这个智能工厂、智能制造。 在生产规模上,整个全球来看,在我们所涉及的漏电保护这个领域里面,我们的规模制造是最大的。每一年在全球我们销售交付的这个路线保护装置有几千万套。我们在沟通的此时此刻,在全球有过亿个家庭就在享受(接受)我们产品的保护。 当然我们也非常重视产业链一体化,跟我们产品相关的所有的核心零部件都有非常好的供应能力,在智能制造方面也有很大的数字化方面投资。我们在苏州、温州有两个制造基地,那在这两个制造基地我们都在推动智慧工厂跟数字化车间的建设,这种建设的好处是让我们整个生产交付更加高效,质量更有保证,在市场服务端我们有非常体系的客户服务团队跟投入。现在中国的家电出海是一个很大的潮流,我们在北美、印度、东南亚,都有投资建设的物流配送系统以及客户呼叫的中心,可以让我们的客户没有后顾之忧。 凤凰网科技:在使用家电使用中,特别是水电相关的产品,咱们是如何防范漏电风险的呢? 益而益集团原晓宁:在家电的品类里面,如果我们细心地去观察分析一下,有很多产品本身的工作原理,或者说使用环境,是涉水、涉电。那这样的一些产品有一个情况,就是一旦它在使用的过程中出现了电源线的破损、在户外使用中拖来拖去的,那电源线或者你经常折弯你的电源线可能破损,这是一种情况。 还有一种情况就是使用过程中产品自身的结构老化,还有使用的环境是潮湿的,这些都会导致整个产品的绝缘的强度的下降,让漏电的风险大大提升。 那我这里举个例子,比如电吹风很多是在浴室里面,那它就很容易接触到水,可能一失手这个就掉到浴池里去,或者掉到这个洗手盆里面去了。还有一种就是浴室里面的空气潮湿,那这时候就会存在这种泄漏电流,通过人体流向大地,这就是典型的漏电电极,漏电电极的事故就会影响人的生命安全。 为了应对这样的情况,我们的PBE设计了各种各样的技术跟产品解决方案,PBE漏电保护装置可以在第一时间它非常敏锐的能够去检测到泄漏电流,检测到这种漏电的信号,同时具备敏锐切断电源线的反应能力,第一我可以检测到,第二我第一时间切断电,所以这样就可以有效地保护消费者人身安全。 那我这里可以举一个案例,还是以电吹风为例。根据美国的UL的法规,所有的电吹风必须是100%匹配ALCI漏电保护装置,在这个法规导入之前,根据CPS(CPSC)统计,每一年在全美因为电吹风漏电导致死亡还有几十起。 引入之后,现在这个数字已经下降了,每年不足不足0.3人,所以大家可以想象这个效果,原来是每年几十起,大家不要小看这个数字,几十起就是几十条人命以及背后几十个家庭,其实这个损失是非常大的。那现在我们已经降到每年不到0.3人,这个效果还是非常非常的显著。 凤凰网科技:正如您刚才所说,越来越多的企业现在开始进军国际市场了,那么请问您如何看待中国家电品牌在国际市场的竞争力? 益而益集团原晓宁:的确,这次AWE是整个中国家电企业的一次大检阅、大亮相,那毫无疑问中国的家电行业现在已经是全球最大的,那我们有最大的体量、最完备的供应链体系。我觉得一个非常好的现象,就是我们整个中国家电行业的竞争力已经从最初的单纯的成本竞争力在转向我们现在质量、性能、技术这些优势再去转变。那伴随着这种转变,我们意识到在商业模式上我们有很大的一个转变,从最初我们给别人做贴牌,按照别人的订单,按照别人的产品方案,我们单纯地做制造。现在一步一步向这个自主品牌在做转化,现在越来越多的中国家电企业采用了自主品牌策略在海外拓展市场。 事实上根据我们的观察,新冠疫情加速了全球市场家电消费从线下转向线上,改变了过去在海外很多市场里单纯依赖实体店铺销售的这样一个情况,其实这个要素对于整个家电行业的自主品牌是个很大的推动的作用,因为过去你自主品牌去海外市场拓展,你单纯的开拓线下渠道是非常费时费力的,现在有了线上,这个效率会大大的提升。 这里我想强调的是说自主品牌战略,当然好的一面是说它让企业可以享受到品牌溢价的红利,这是毋庸置疑的。但另外一方面我们想提出的是说,当你采取自主品牌销售的时候,你一定是直接面对消费者的,那也就意味着你必须直接的承担对应的职责与义务。 在海外市场合规,我这里指的是技术规范、法规的合规是最基础的责任与义务,那这方面其实是摆在大家面前的一道难题,必须跨越的难题。那从我们自身的经验来讲,因为我们从2 000年成立的时候,我们就开始操作(运作)海外市场,我们有几十年的经验,所以说我们对于海外的法规标准有着非常深入全面体系的理解。那事实上我们作为细分行业的领导品牌,我们参与到了很多海外市场的法规技术标准这样的一个讨论跟制定,所以说我们的产品我们是全面符合,包括UL、CUL,包括CE这样的一些对TOA(TUV)这项的一些标准。当然更重要的一点就是因为我们有很强大的研发能力以及供应链的能力。 所以说每次这些标准在发生变化升级的时候,我们往往是这个可以第一时间我们去推动我们产品的升级换代,然后以及整个供应链资源的升级,我们往往是这个行业里第一个推出这个符合新标准的这样的一个企业,这样的话能帮助到我们的合作伙伴,还能获得市场的先机,从而更放心、更放手的去在海外市场进行推广。 凤凰网科技:那益而益在推动行业绿色发展方面有哪些具体的举措和责任呢?您如何评价 益而益在环保方面的表现。 益而益原晓宁:事实上在整个绿色化产品上,产品绿色化欧美国家是先行的,所以说对于中国家电制造业企业,包括我们在行业中的,虽然我们不做主机,但是我们是一个重要的部件生产商,大家都要共同努力,因为在这个方面补齐甚至是超越,一定会提升整个中国家电制造行业的竞争力,这是一个很现实的一个问题。 那对于我们来说,我们有一整套完整的ESG的执行的战略,首先在另一端,我们把供应商的碳排放管理纳入了我们整个集团的绿色供应链的规划,而在具体操作中我们会跟我们的供应商密切合作,特别是在新工艺、新技术上,我们去增加我们环保材料的使用,同时整个在物料配送的全环节我们要做到节能减排。 另外一个方面,我们在对环保标准的认知上,也有体系的把握,我们在策划这个产品的时候,从产品设计开始以及整个规划、整个制造的全环节、交付的时候,我们都会把这些要素考虑在里面。那在制造端我们是用数字化来助力产品的预测转型。我们在苏州和温州两个制造基地,在大力的投资去建设我们的智慧工厂跟数字化的车间,这样的话也可以保证我们产品的绿色化的这样的进步。 所以经过这些努力,我们现在的产品是符合这个全球主流的12项,我们统计过12项主流的环保以及有害物质管控的标准,我们都是符合的。举一个例子来说,不光是产品的本身,就是我们产品的包装上的油墨都是全程受控,并且符合包装指令的。 我们也呼吁整个行业所有的成员,大家一起行动起来,做好整个我们这个行业的这样的一个碳中纪的一个认证的体系。然后去扩大加快。我们比如这个碳标签、减碳标识,整个家电产品,家电领域推广应用,这样也便于消费者可以去更好的去选择绿色产品。(编辑/刘毓坤、杨睿琪)
荣耀MagicBook Pro 16发布:旗下首款AI PC 首销5999元起
凤凰网科技讯 3月18日,荣耀MagicBook Pro 16今晚正式发布,官方表示,荣耀 MagicBook Pro 16既是轻薄本,也是游戏本。新品通过Magic Live智慧引擎加持,平台级AI全栈赋能PC,使荣耀MagicBook Pro 16具备AI智慧搜索能力,可实现文档内容搜索,并在行业内首次实现图片内容的精准搜索。荣耀MagicBook Pro提供集显版与独显版,售价6199元起,首销5999元起。 荣耀MagicBook Pro 16提供Ultra 5-125H/Ultra 7-155H两款处理器,至高可选32GB RAM及RTX4060独显,标配1TB PCIe 4.0 SSD,搭载“立体散热系统+12mm 3D复合热管”,使整机散热能力提升53%。据介绍,在平台级AI加持下,荣耀MagicBook Pro 16可实现最大140W电竞级性能释放。 荣耀MagicBook Pro 16搭载3K高分辨率LCD屏,支持165Hz电竞刷新率,屏幕响应时间低至3ms。此外拥有100% DCI-P3广色域和100% sRGB高色域,10.7亿色深,屏幕逐台调教,平均色准ΔE<0.5。 护眼层面,搭载荣耀绿洲护眼技术,通过德国莱茵硬件低蓝光、无频闪护眼认证,以及国家眼科工程中心护眼测试,荣耀自研类自然光护眼技术和支持电子书模式。 荣耀MagicBook Pro 16采用行业首发黄金智能三天线,配合荣耀LINK Turbo技术能力,进一步提升MagicBook Pro 16的通信稳定性。 此外,荣耀MagicBook Pro 16通过AI使能端云协同,带来应用交互新体验;AI文档总结、AI字幕推荐、AI笔记纪要,便捷高效助力办公学习。 在平台级AI的加持下,全新升级的MagicRing可以快速识别不同系统的设备及应用,理解用户意图,实现跨操作系统间的无缝连接,为用户带来面向未来的跨设备互联体验。 人机交互层面,荣耀 MagicBook Pro 16带来了AI文档总结、AI字幕翻译、AI笔记纪要等应用交互功能;跨设备互联生态上,MagicBook Pro 16通过MagicRing,实现跨端八业务并发的跨设备智慧互联,支持手机聊天窗口拖拽到 PC、手机图片拖拽到 PC 文档、手机网络共享给PC等功能。 接口方面,配备2个雷电接口、1个USB-A 3.2 Gen 1接口、1个HDMI 2.1 接口、1个 3.5mm 音频接口等。此外,荣耀MagicBook Pro 16也是Windows平台全球首款空间音频笔记本,搭载六扬声器和音箱级低音炮,配合自研空间音频渲染引擎,成为首款通过网易云音认证的空间音频笔记本、首款支持爱奇艺空间音频专区的笔记本。 除了荣耀MagicBook Pro 16外,荣耀还发布了AI全能轻薄本荣耀笔记本X14/16 Plus 新品,其全系搭载AMD锐龙7 8845HS标压处理器,荣耀笔记本X14 Plus配置2.8K高色域高清护眼屏,荣耀笔记本X16 Plus配置2.5K高色域高清护眼屏,新品均支持魔法AI工作台智慧搜索、文档总结、智能推荐等功能。 售价方面,荣耀MagicBook Pro 16集显版售价6199元起,首销尊享价5999元;荣耀MagicBook Pro 16独显版售价8999元起,首销尊享价8799元。3月18日21:00在荣耀商城、各大授权电商、授权零售门店开启预售,3月22日10:00正式开售。 荣耀笔记本X14 Plus首销尊享价4499元,荣耀笔记本X16 Plus首销尊享价4699元,4月1日10:00正式开售。
OpenAI首席技术官:不确定Sora的训练数据来自哪里
IT之家 3 月 18 日消息,OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。 在采访中,记者直接询问 Murati 关于 Sora 训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。” 当记者追问具体来源是否包含 YouTube 视频时,Murati 竟然表示“我实际上并不确定(I'm actually not sure about that)”,并拒绝回答有关 Instagram 或 Facebook 视频是否被纳入训练集的问题。她辩称,如果这些视频是公开可用且可以使用的,那么可能会被使用,但她本人对此并不确定。 当记者询问 OpenAI 是否与其合作伙伴图片素材公司 Shutterstock 达成过数据训练方面的合作,Murati 索性拒绝继续讨论数据来源话题。 Murati 甚至回避记者关于 OpenAI 与图片素材巨头 Shutterstock 的数据合作,拒绝透露来自该平台的视频是否被用于训练 Sora。最终,她干脆中止了相关讨论,坚称数据来源“肯定是公开可用或经过许可的”,却无法给出任何具体细节。 Murati 这番闪烁其词的做法让 OpenAI 陷入尴尬境地。此前,该公司就因数据抓取行为引发广泛争议,甚至面临多起版权诉讼,其中就包括纽约时报的指控。如今,连 CTO 都无法说清其最热门模型的训练数据来源,难免让人怀疑 OpenAI 高层对该问题的重视程度。 据报道,采访结束后,Murati 私下承认了确有使用 Shutterstock 视频训练 Sora。然而,相较于网络上浩如烟海的视频内容,来自 Shutterstock 的素材可能只是 Sora 训练数据的一小部分。 IT之家注意到,Murati 的讳莫如深引发了网友热议。不少人认为她缺乏坦诚,质疑其对自身产品的了解程度。有人直言,CTO 竟然对如此关键的问题不知情,实在令人难以置信。 然而,也有人为 Murati 辩护,认为既然内容已经发布到网络,就应该允许人工智能公司加以利用。他们认为,用户既然选择公开内容,就应该承担被使用的风险。 Murati 的回避行为究竟是为了防止更多版权纠纷,还是真的对数据来源一无所知,我们不得而知。但可以肯定的是,公众有权质疑这些“公开可用且经过许可”的 AI 训练数据究竟来自何处。未来,含糊其辞的官方说辞恐怕难以平息人们的疑虑。
生成式 AI 时代下,这颗骁龙新生代旗舰芯片,有了新的任务
想象一下,当一台手机不再只是通话和上网的工具,而是成为化身为 AI 时代万能的智能终端:它可以是你的私人智能助理,也可以是影像工作站、AI 绘画板、同传翻译官。 听起来理想很美,但这个未来其实并不遥远。一览今年众多新登场的旗舰手机时,会发现 AI 功能早已融入其中,化身为一个个标配的小功能。 2023 年开始,各大手机厂商纷纷在 AI 领域发力,力图抢占「AI 终端」这一移动产品的未来制高点。然而,这场变革的源头,其实要从芯片厂商主导的底层创新说起。作为这一变革背后的推动者,高通早已开始布局从「手机芯片」走向「智能终端芯片」,并从底层架构设计入手,为旗舰手机提供强大的 AI 算力。 如今,骁龙 8 系已成功助力众多厂商在旗舰机上实现端侧大模型部署,让 AI 手机不再只是停留在概念阶段。而这次,他们打算更进一步。 骁龙 8 系的持续进化,让手机厂商们快速踏入 AI 时代 近半年的 Android 手机新机潮可以说是十分热闹了:各大品牌的旗舰款机型抢先发布,甚至在未发布手机前,AI 功能就已先行高调发布,大家纷纷高喊出 All in AI 的口号。 这股 AI 热潮的重要推手,正是骁龙 8 系新芯片的发布。作为专为移动设备上的生成式 AI 优化的芯片,骁龙 8 系列通过软硬件层面的全方位创新,为手机厂商进军 AI 赛道提供了强劲助力。 骁龙在 AI 领域的进化,并非简单的算力提升,而是通过各个环节的底层技术革新来实现的:升级的 Hexagon 作为一块专用的 AI 神经网络处理器,在更低功耗的同时大大提升了 AI 运算性能。 骁龙 8 系列还在硬件层面引入了微切片推理(Micro Inferencing)等前沿 AI 技术,在时间轴上对神经网络的不同层次进行切分,让多个切片在同一时刻并行计算,从而确保芯片处理器始终保持高效的运转状态,极大地提高了 AI 推理效率。 2023 年 10 月,高通发布了第三代骁龙 8 芯片,AI 性能相比上一代近乎翻了一倍,支持包括 Meta Llama2、ChatGPT 等通用大模型,推理速度高达每秒 20 个 token。而在第三代骁龙 8 推出后不到 48 小时,首发搭载的小米 14 系列就正式发布,同时宣布了自研的 60 亿参数大模型已经成功跑通。升级后的小爱同学不仅能够准确理解用户的各种指令,还能完成撰写演讲稿、商品点评、拟写祝福信息等复杂任务。 骁龙 8 系列对 INT4 新特性的支持同样可以对 OPPO 的 AI 战略提供助力,OPPO 可以基于 INT4 让原本 28GB 内存的模型现在只需要不到 4GB 就能跑通,大大提升了内存带宽效率,实现高效端侧部署。2024 的开年旗舰 OPPO Find X7 Ultra 成功在本地运行了 70 亿参数的满血版 AmdesGPT 大模型,在大幅降低资源需求的同时,AI 模型的输出效果也几乎不受影响。 在第三代骁龙 8 芯片支持的新特性中,AI 照片扩展也是一大亮点,用户可以无需依赖网络和云计算,而是通过 AI 来理解图像中的细节和结构,实现智能创意的 AI 扩图。很快,这一功能也得到了普及,继小米 14 宣布支持 AI 扩图功能后,诸多厂商也纷纷跟进。 搭载第三代骁龙 8 的荣耀 Magic6 Pro 则采用了自家的「魔法大模型」。 其中「智慧成片」的功能,让用户只需要讲出想要的画面,比如「帮我做一条这个月我家猫猫的可爱回忆短片」,AI 就能自动汇总手机中的素材,智能剪辑成短片,并配上最契合情绪的配乐和文字。「一拖日程」的功能则让用户只需将包含日程信息的文字一拖至屏幕边缘,系统就能在不到 1 秒内识别用户意图并自动创建日程。 基本上,现在大家只要看到「骁龙 8」的标签,基本已经和「旗舰、顶级性能、AI 新特性」这些关键词深度绑定。 自骁龙 8 系诞生开始,几乎每款新发布的旗舰手机,都不断增加着令人惊奇的 AI 新特性。在影像、游戏、无线连接、音频等用户感知最为直观的方面,也都携手实现了跨越式的升级。 新生代的第三代骁龙 8s,有了新的任务 如果说第三代骁龙 8 的问世,是助力手机厂商一同完成了 AI 手机从无到有的突破。那新推出的第三代骁龙 8s,肩负着将生成式 AI 应用进一步带向大众的重任。 第三代骁龙 8s 继承了与第三代骁龙 8 旗舰平台相同的 CPU 架构,并同样搭载最新的 Hexagon NPU 神经网络处理器,在 AI 的性能表现上同样保持了旗舰高水准。这意味着手机厂商可以为更多定位不同的机型,配备尖端的生成式 AI 能力,真正实现生成式 AI 应用的进一步普及。 第三代骁龙 8s 支持 100 亿级别的大语言模型。并且和其他厂商的单一 AI 模块不同,高通独特的异构计算特性,能让 CPU、GPU、ISP 等各个模块都具备 AI 能力,各自负责擅长的领域,相当于举整个平台之力,来完成最佳性能的大模型 AI 计算。 目前,高通已经开始与多家中国头部手机厂商展开了深度合作,通过软硬件的联合优化,充分释放第三代骁龙 8s 在 AI 领域的潜力。可以预见在 2024 年发布的旗舰新机型中,满血版的本地大语言模型也能成为人人都能体验到的新标配,大大加速了 AI 在手机市场的渗透和落地。 手机芯片发展至今,早已从一块单独的「处理器」进化为「平台」。在第三代骁龙 8s 这个新平台的加持下,手机的影像、游戏、智能助手、连接等各项功能都得到了全面的 AI 增强。 比如第三代骁龙 8s 的感知能力,就让手机变得更加智能灵动了:不仅支持人脸解锁、扫码、移动支付等常用场景的快速响应,还能通过 AI 不断学习用户的使用习惯和偏好,让手机变得更像一个时刻陪伴并且学习的 AI 助理,真正做到「认识你也认识这个世界」了。 而在移动 AI 体验最为直观的影像、游戏等各个方面,第三代骁龙 8 都携手各大厂商实现了跨越式的升级。例如计算摄影上的 AI 分割、AI 降噪等黑科技,以及游戏领域的 AI 光追、AI 超分辨率等技术,都将移动影像和游戏的表现提升到了全新的水准。 以影像为例,第三代骁龙 8s 集成了认知 18-bit 三 ISP,可通过高达 18bit 的数据采样让摄像头每秒处理数十亿像素。搭配第二代图像分割功能,支持照片和视频实时语义分割,带来比竞品近 2.5 倍的提升。当这一切与芯片强大的 AI 处理器结合,摄像头也真正开始「看见并理解世界」,无论是暗光拍摄的画质表现,还是 AI 识图、修图、扩图等功能,都将得到质的飞跃。 当然,之所以叫「认知」,是因为其在第二代骁龙 8 时便实现了通过 Hexagon 直连的方式,将 ISP 与 Hexagon NPU 直接连接,让 ISP 具备强大 AI 分析的能力,从而在拍摄过程中将 AI 优化提前,实现实时语义分割,让甚至于眼镜反光的每个拍摄细节都能得到更为精细的优化,而且是实时的反馈,从而大大提升手机成像质量和拍摄体验。这就是高通 AI 引擎和 ISP 联手的深藏功与名之处。 作为骁龙 8 系列中的新生代旗舰平台,第三代骁龙 8s 不仅在 AI、影像、游戏、连接等多个领域提供了卓越的体验,同时它也是一款支持 Snapdragon Seamless 技术的先锋产品,加速助力各类型各品牌终端互联。 比如在影音娱乐方面,用户可以在手机上开始观看视频,Seamless 技术可以让手机与电视或平板等大屏设备无缝切换,在大屏上继续播放;在办公场景下,用户可以在手机上开始处理文档,Seamless 技术让工作状态可以无缝切换到笔记本等大屏设备继续编辑。全新顶级移动平台第三代骁龙 8、全新顶级 PC 平台骁龙 X Elite 和高通的可穿戴平台与音频平台,都已支持 Snapdragon Seamless,未来还将扩展至 XR、汽车和物联网平台。 在定位上,第三代骁龙 8s 对比第三代骁龙 8「顶级旗舰创新标杆」的定位,选择了「新生代旗舰」这一角色。正值中国手机厂商变革与端侧大模型起步发展的关键时期,这块灵活灵动、同样全能的新生代旗舰芯片,正是「AI 普及」这个宏大愿景得以实现的关键一环,加速了 AI 在中国的普及,从少数走向更多数用户。 一个可能的未来——无所不在的 AI 2023 年,你突然发现你的手机助手更好用了。许多宝妈开始用手机智能剪视频,学生们也可以用 AI 画画创作,上班族们在开会时掏出手机录音,会议纪要和重点内容转眼就整理好了。但这还远远不够。 据麦肯锡的一份《生成式人工智能的经济潜力》报告,对于许多上班族而言,未来还将有 60%-70% 的工作,都可以用 AI 替你自动完成。AI 将不再是某些特定领域或高端产品的特权,而是深度融入我们生活的方方面面。 现在,手机硬件已经进入了一个新的时代,迎来了瞬息爆发的 AI 生态,而 AI 体验的好坏也成为了厂商竞相角逐的新赛道。 在高通构想的未来图景中,大家手中的 AI 手机既可以是你的移动影像工作站,对照片视频进行智能编辑,也可以是一台 AI 绘画板,让你随手即可创作出艺术作品;同时它是一台游戏主机,带来实时光线追踪和环绕音效的沉浸体验;最后,它是一个全能的智能助手,和你一起观察学习这个世界,也时刻守护你的隐私与安全。 目前高通正在加速 AI 生态的爆发。而这个加速绝不只是在硬件层面:对于开发者而言,高通 AI Stack 和 AI Hub 的推出也极大地降低了 AI 开发的门槛。这两个功能强大的 AI 开放平台,不仅集成了自然语言处理、语音识别、计算机视觉等多个领域的 AI 能力,也包含了全面优化的生成式 AI 大语言模型库。 开发者不用再把精力消耗在各个设备平台的适配以及繁琐的 AI 性能调度上。开发者可以简单高效地在骁龙和高通平台上进行部署,借助高通 AI Hub 提供统一的开发框架和工具链,通过 NPU 等专用硬件和异构计算架构实现高性能、低功耗的 AI 计算。 简单来说,未来的软件开发者,只需要几行代码就可以玩转 AI 大模型,而不同设备的适配也简单省心,节省了大量时间和工作量,快速灵活地打造自己独特的产品。而手机厂商也能更专注于创造属于 AI 时代的全新的交互方式,同时不必受限于算力、功耗、各个传感器调度协作等问题。 在可以预见的未来,当你的车载助手也能帮你一键规划旅行安排,当你的手机就能做好公司要求的广告图,手机语音助手也开始变聪明变成百科全书,在未来你的眼镜会 24 小时做你的贴身管家提醒你重要事项。在 AI 终端的领域,或许我们不会等到所谓的「iPhone 时刻」,因为 AI 早已开始渗透到我们生活的方方面面。 当我们不再天天谈及 AI 有多么神奇,而是自然而然地享受这一切时,AI 就是真正普及到了每个人生活中。 目前,仅在中国市场,骁龙的品牌认知度就达到了 85%。在几乎所有的价位段,消费者都认为骁龙是行业领先的处理器。而作为领先者的高通,也正在为骁龙 8 系列赋予新的角色定位——成为 AI 时代万物智能的引领者,引领 AI 终端走进我们的生活。
荣耀Magic6 RSR保时捷设计发布:售价9999元起
凤凰网科技讯 3月18日,荣耀召开春季旗舰新品发布会,荣耀Magic6 RSR保时捷设计正式发布,售价9999元(24GB+1TB),3月22日正式发售。 在整机设计方面,荣耀Magic6 RSR 保时捷设计后盖中间是一条微微凸起的峰线,继承了保时捷911飞线式设计理念,后摄镜头模组则采用了保时捷标志性的六边形结构。同时,后盖与金属中框设计还借鉴了保时捷Taycan正面垂直造型美学。产品影像模组和中框还采用超跑级的钛合金材质,让强度提升150%,重量却更为轻盈。 荣耀Magic6 RSR 保时捷设计拥有玛瑙灰和冰莓粉两种配色,其中,冰莓粉配色由保时捷Taycan首发,推出后受到众多消费者追捧。 荣耀Magic6 RSR保时捷设计采用荣耀金刚巨犀玻璃,官方介绍,荣耀金刚巨犀玻璃基于第二代纳米微晶玻璃技术、全新材料氮化硅+全新镀层工艺,晶体密度提升50%,耐摔性能提升了10倍。 据介绍,荣耀Magic6 RSR保时捷采用全球首发荣耀叠光绿洲护眼屏、全球首发京东方全新K2发光材料,搭载Tandem双栈串联OLED架构,实现1800nits全局亮度、5000nits峰值亮度、1000nits手动最大亮度、HDR峰值亮度5000nits、屏幕功耗下降40%、3年屏幕衰减小于1%、寿命提升至6倍、360Hz超频同步显示技术、4320Hz PWM零风险调光、屏幕触控平均响应速度提高31%。此外,还支持4320Hz PWM零风险调光,再加上助眠显示、类自然光护眼、自然色彩显示等等,达成行业领先的护眼能力。同时支持包括杜比视界、HDR Vivid、优酷帧享、德国莱茵全局护眼3.0认证、德国莱茵无频闪认证、VICO A+视觉舒适度测试等6项权威认证支持。 在摄像方面,荣耀Magic6 RSR保时捷设计搭载了单反级超动态鹰眼相机,带来业界首款手机移动端基于LOFIC横向溢出集合电容技术的影像传感器,支持15EV手机行业最高动态范围。同时,荣耀Magic6 RSR保时捷设计配备1/1.49英寸业界领先大底长焦传感器、1.8亿像素的潜望长焦;以及5000万像素支持微距拍摄的超广角摄像头,和5000万像素+3D深感摄像头的前置影像模组。 在性能方面,荣耀Magic6 RSR 保时捷设计搭载高通第三代骁龙8旗舰芯片,配合全新AI能力加持的荣耀MagicOS 8.0操作系统,通过全新标志性的交互功能“荣耀任意门”、可理解用户意图自动剪辑成片的“智慧成片”、荣耀独有的眼动操控技术“灵动胶囊”等智慧功能。 荣耀春季旗舰新品发布会还发布了荣耀Magic6至臻版,价格方面,荣耀Magic6 至臻版提供两种存储组合可选,16GB+512GB售价6999元、16GB+1TB售价7699元,今晚开启预售,3月22日10:08正式开售。
200万字上下文!月之暗面Kimi大模型指数升级,10分钟学会开飞机、打德扑,还化身中医专家
作者 | 香草 编辑 | 李水青 智东西3月18日报道,今天,国内大模型明星创企月之暗面(Moonshot AI)宣布智能助手Kimi上下文窗口提升至10倍,即日起支持200万字超长无损上下文。 ▲Kimi升级至200万字上下文 200万字是什么概念呢?为了更直观地向我们展示,月之暗面工程副总裁许欣然在今日举办的沟通会上,接连掏出一摞摞厚重的打印纸,包括《甄嬛传》剧本、英伟达年度财报、《倚天屠龙记》、《中医内科学》等。这其中,最长的也不过百万字左右。 ▲许欣然展示百万字书籍的打印厚度 Kimi智能助手于去年10月面世,当时支持20万汉字无损上下文输入,创造了消费级AI产品所支持的上下文输入长度纪录。而如今,在短短5个月时间里,其上下文长度就提升了一个数量级。 与此次升级同步,月之暗面团队还发布了一则“低调”的更名通知:Kimi Chat、Moonshot大模型分别改名为Kimi智能助手、Kimi大模型,以后只要记住Kimi就够了。 ▲Kimi更名通知 即日起,Kimi的200万字升级开启内测,用户可登陆网页版首页申请体验。 体验地址:kimi.ai 一、10分钟速成开飞机、打德扑,挖出长篇小说深层次细节 许欣然谈道,相比20万字长度,更长的文本输入首先能带来的变化就是解锁更多超长任务、复杂任务。过去只能整理50份简历,现在可以线性增长至500份。 月之暗面团队提出“10分钟速成定律”,指的是Kimi快速学习一个新领域的能力。人类要10000小时才能成为专家的领域,AI只需要10分钟,就能接近任何一个新领域的初级专家水平。 例如,上传几十万字的德州扑克的教程文档,再提出一个比赛开局,Kimi就可以分析比赛场上的局面,并提供出牌策略的指导。 ▲Kimi速成打德扑 输入近百万字中医诊疗手册,同时描述病人的病症和提出分析步骤,Kimi立刻化身中医,给出了病因判断、治疗方法、药材配比等。 ▲Kimi速成中医 丢给Kimi一本260M的开飞机手册,再向它提出多个飞机驾驶方面的疑问,它都能一一解答。 ▲Kimi速成开飞机 除了中英文,Kimi还能直接阅读代码库文件,然后用中文写出详细清晰的代码库设计文档,即便是毫无注释的陈年老代码也能快速梳理出结构。 ▲Kimi读代码 值得一提的是,虽然对于长文本大模型,大家都比较期待其“大海捞针”压力测试的表现,但许欣然指出,一个指标一旦开始被观测,研发团队自然就会专门针对测评基准进行优化。这样一来,指标就失去了参考价值,变成了无尽的“刷榜”游戏。 另一方面,“大海捞针”测试本身其实就相当于Ctrl+F检索,对模型能力本身的要求并不高。比起定向检索,用户更需要的应该是对复杂文本的理解能力,看大模型能从长文本中学到什么。 在这方面,升级后的Kimi也进化了不少。 以经典电视剧《甄嬛传》为例,只要输入剧本,Kimi就能在不同时间段、各个场景的故事情节中,深入挖掘甄嬛、果郡王的情感线以及和他们孩子的真相,堪比一个看了好几十遍电视剧的“甄”学家。 ▲Kimi读《甄嬛传》剧本 二、用户量月增100%,复杂需求倒逼硅基生命“自卷” 当然,除了基础的文本阅读、记忆、理解等场景外,升级至200万字的Kimi必然会开辟新的应用和场景。这需要极大的想象力。 许欣然谈道,就好比内存容量的迭代,基础要素的每次提升都会带来突破想象力的新应用。 在月之暗面团队看来,无损的长文本能力也是一种基础要素,随着长度的提升,大模型的能力从简单问答、常识背诵等基础任务逐渐升级至角色扮演、长文检索、领域知识理解等。未来,必然有无限可能性还在等待着Kimi去探索。 ▲无损长文本能力增长带来的任务复杂度提升 而这条AGI探索之路,也离不开用户的共创。月之暗面联合创始人周昕宇谈道,出于用户共创的考虑,Kimi的定位比起“聊天机器人”更像一个“智能助手”,因为普通对话对大模型自身迭代的帮助有限。 Kimi自发布以来,有许多应用场景都是用户自己开拓的。如通过一定的提示词,让Kimi变身专业翻译工具、跑团主持人等。 ▲Kimi变身专业翻译工具 还有用户直接将Kimi的读论文能力封装成了工具,并开发了专门的论文网站。用户只需点击网页上的Kimi按键,就能得到论文的基本信息,包括解决了什么问题、相关研究、如何解决等。 ▲Kimi读论文工具 许欣然称,根据网站分析工具SimilarWeb数据,Kimi用户量在春节后飞速增长。此外据非官方统计数据,其用户量每个月增长率超100%。 ▲SimilarWeb数据显示Kimi用户量在春节后飞速增长 正是因为用户对Kimi发出的指令越来越复杂,因此团队也一直致力于提升Kimi能遵循的指令的复杂度、信息检索能力。同时由于用户的使用场景从工作逐渐扩展到生活的方方面面,团队在网页端之外补齐了微信小程序、iOS端以及安卓端等。 许欣然透露,Kimi充分发挥其作为“硅基生命”的优势,夜间也没在歇着,持续不断地自我进化中。 三、相同硬件条件下响应速度提3倍,年内将发多模态大模型 在沟通会上,许欣然和周昕宇向智东西等少数媒体透露了目前在做的需求池以及未来的发布计划。 如用户呼声很高的提示词教程,目前已经在准备当中,预计一个月左右发布。此外团队也一直在进行多模态能力的研发,今年内将会推出多模态大模型。音频处理能力、海外版同样在需求池内。 目前,Kimi智能助手仍完全免费。但随着用户群体的扩大和使用量的增长,难免会出现算力不足的情况。许欣然透露,今年上半年预计开启商业化模式。 与此同时,月之暗面的Infra(基础设施)团队也在持续提升能效比,据称比起刚发布时,Kimi在完全相同的硬件条件下响应速度提升了3倍。 由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”、“降采样”等技术捷径,攻克了很多底层技术难点,才取得了新的突破。 结语:长文本为AI带来更多可能性 随着Kimi智能助手上下文窗口提升至200万字,我们见证了AI领域的又一次飞跃。在数字指数级增长的背后,体现了大模型对复杂任务处理能力的显著提升。 无论是速成开飞机、打德扑,还是深入分析长篇小说的深层次细节,Kimi都能够迅速适应并提供专业级的指导和分析。这得益于月之暗面团队对长文本大模型的深入研究和不懈追求,也离不开用户对其需求产生的驱动。
第三代骁龙 8s 移动平台正式发布,卢伟冰宣布小米全球首发
今日,高通举行新品发布会,推出了第三代骁龙 (®)8s 移动平台,这也是骁龙 8 系列的一次重要迭代。 第三代骁龙 8s 移动平台汇集了一系列创新特性,包括强大的终端侧生成式 AI 能力、全天候感知的图像信号处理器(ISP)、沉浸式的移动游戏体验、革命性的连接技术以及无损高清音频体验。 这款全新旗舰级平台继续搭载高通 Kryo CPU,采用了与前代相同的全新 CPU 架构。它包含一个主频高达 3.0GHz 的超大核心、四个 2.8GHz 的性能核心以及三个 2.0GHz 的效率核心。 对比竞品,在 GeekBench 6 多线程的测试中,第三代骁龙 8s 的 CPU 性能要同比领先 20%。同时在游戏性能方面,基于八款热门手游的测试显示,其能效在游戏场景中领先竞品 15%。 AI 是第三代骁龙 8s 的一大亮点,其支持在端侧运行多模态生成式 AI 模型,且模型参数最高可达 100 亿。 同时,分布式处理架构不仅提升了第三代骁龙 8s 性能,还大幅降低了功耗。在生成式 AI 领域,该平台支持多种主流的 AI 模型,如 Baichuan-7B、Gemini Nano、Llama 2 和智谱 ChatGLM 等大型语言模型。 在物体检测、背景虚化、图像分割和语言理解等多个关键场景中,第三代骁龙 8s 移动平台均展现出了卓越的性能,大幅超越了市场上的竞品。 此外,第三代骁龙 8s 平台搭载了和第三代骁龙 8 平台一样的三枚 18-bit 认知 ISP,并与 Hexagon NPU 进行异构计算,从而实现众多智能化的影像处理。 举例来说,第三代骁龙 8s 平台能够提供照片和视频的实时语义分割功能,使得对物体和场景的识别与分割更为精确,提升了拍摄内容的质量。 第三代骁龙 8s 还引入了骁龙暗光拍摄技术。得益于 18-bit 认知三 ISP 和 Hexagon NPU 的高效加持,即使在光线不足的夜间环境下也能捕捉到美丽的画面。 性能是顶级芯片的标配。第三代骁龙 8s 不仅保持了旗舰级的影像处理能力,还全面支持 Snapdragon elite gaming,带来硬件级加速的实时光追。 这一技术能够逼真地模拟环境光遮挡和阴影效果,同时在光滑表面上实现精确的反射和高保真的软阴影渲染,极大地增强了游戏的视觉体验。 在拥挤的环境中,打电话没信号是老生常谈的话题了。但第三代骁龙 8s 在 Snapdragon Sound 技术套件的加持下,可以实现超清晰的语音和视频通话、以及无卡顿的游戏内语音聊天。即使在拥挤的射频环境也能保持稳健的链接,并支持高达 16-bit 44.1KHz CD 级无损无线音乐串流。 得益于高通 Aqstic 扬声器放大技术,第三代骁龙 8s 平台显著提升了手机的音频输出质量,能够有效降低高音量播放时的失真,同时提供了沉浸式的立体声效果。 第三代骁龙 8s 平台配备了 FastConnect 7800 连接系统,支持 Wi-Fi 7 的高频多连接并发技术。该平台能够提供支持 HBS 的极速 Wi-Fi 体验,同时确保更长的电池续航和更广泛的应用场景。 高通公司高级副总裁兼手机业务总经理 Chris Patrick 表示:「第三代骁龙 8s 凭借终端侧生成式 AI、先进影像特性等丰富特性,旨在提升用户体验,助力用户在日常生活中迸发创造力和生产力。 我们非常高兴能够扩展骁龙 8 系旗舰平台系列。作为我们最顶级的移动平台解决方案,骁龙 8 系列将为更多消费者带来一系列出色的特选功能。」 值得一提的是,小米官方刚刚宣布 Civi 4 Pro 手机全球将首发搭载第三代骁龙 8s,据介绍,这是小米与高通基于小米澎湃 OS 深度定制的芯片,预热海报更是号称「影像、性能、AI 能力全面跃升。」 对于此次合作,小米品牌总经理卢伟冰表示:「这款全新移动平台让我们能够利用生成式 AI 为用户提供顶级的个性化体验。」 荣耀、iQOO、真我 realme、Redmi 和 Xiaomi 等主要 OEM 厂商和品牌都将采用第三代骁龙 8s,首款终端预计将于 3 月面市。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。