行业分类:
加载中...
头条分类:
加载中...
GPT-4不知道自己错了!LLM新缺陷曝光,自我纠正成功率仅1%,LeCun马库斯惊呼越改越错
新智元报道 编辑:桃子 润 【新智元导读】GPT-4根本不知道自己犯错?最新研究发现,LLM在推理任务中,自我纠正后根本无法挽救性能变差,引AI大佬LeCun马库斯围观。 大模型又被爆出重大缺陷,引得LeCun和马库斯两位大佬同时转发关注! 在推理实验中,声称可以提高准确性的模型自我纠正,把正确率从16%「提高」到了1%! 简单来说,就是LLM在推理任务中,无法通过自我纠正的形式来改进输出,除非LLM在自我纠正的过程中已经知道了正确答案。 由ASU研究人员发表的两篇论文,驳斥了之前很多研究提出的方法「自我纠正」——让大模型对自己的输出的结果进行自我纠正,就能提高模型的输出质量。 论文地址:https://arxiv.org/abs/2310.12397 论文地址:https://arxiv.org/abs/2310.08118 论文的共同作者Subbarao Kambhampati教授,一直致力于AI推理能力的相关研究,9月份就发表过一篇论文,甚至全盘否定了GPT-4的推理和规划能力。 论文地址:https://arxiv.org/pdf/2206.10498.pdf 而除了这位教授之外,最近DeepMind和UIUC大学的研究者,也针对LLM在推理任务中的「自我纠正」的能力提出了质疑。 这篇论文甚至呼吁,所有做相关研究的学者,请严肃对待你们的研究,不要把正确答案告诉大模型之后再让它进行所谓的「自我纠正」。 因为如果模型不知道正确答案的话,模型「自我纠正」之后输出质量反而会下降。 https://arxiv.org/abs/2310.01798 接下来,就具体来看看这两篇最新论文。 GPT-4「自我纠正」,输出结果反而更差 第一篇论文针对GPT-4进行研究,让GPT-4对图形着色问题提供解决方案,然后让GPT-4对于自己提出方案进行「自我纠正」。 同时,作者再引入一个外部的评估系统对GPT-4的直接输出,和经过了「自我纠正」循环之后的输出进行评价。 实验结果显示,GPT-4在猜测颜色方面的准确率还不到20%,这个数值似乎并不让人意外。 但令人惊讶的是,「自我纠正」模式下的准确性却大幅下降(下图第二根柱状条 )——与所有自我纠正本意完全背道而驰! 作者认为,这种看似反直觉的情况可以这么解释:GPT-4在验证正确答案的表现也很糟糕! 因为即使当GPT-4偶然猜到正确颜色时,它的「自我纠正」会使它觉得正确答案是有问题的,然后就把正确答案给替换掉了。 通过进一步研究后还发现:如果外部验证器给GPT-4猜测出的颜色提供了可以被证实的正确答案,GPT-4确实会改进它的解决方案。 在这种情况下,经过「自我纠正」产生的提示词,确实可以提高输出结果的质量(上图的第3-5根柱状图 ) 总结来看,就是对于「着色问题」任务,GPT-4独立的「自我纠正」反而会损害输出的性能,因为GPT-4没法验证答案是否正确。 但是如果能提供外部的正确验证过程,GPT-4生成的「自我纠正」确实能提升性能。 而另一篇论文,从规划任务的角度来研究了大语言模型「自我纠正」的能力,研究结果也和上一篇论文类似。 而且,研究人员发现,真正能提高输出准确性的不是LLM的「自我纠正」,而是外部独立验证器的反馈。 归根结底,还是在于LLM没有办法进行独立的验证,必须依赖外部的验证器给出的「正确答案」,才能有效地进行「自我纠正」。 「着色问题」表现不佳,LLM无法独立验证正确答案 研究设计框架 「着色问题」是非常经典的推理问题,即使难度不大,答案也足够多样性,而且答案的正确性很容易进行验证。 多样性的结果使得LLM的训练数据很难覆盖全,尽量避免了LLM的训练数据被污染的可能。 这些原因使得「着色问题」很适合用来研究LLM的推理能力,也很方便用来研究LLM在推理中「自我纠正」的能力。 研究人员构建了自己的数据集,使用GrinPy2来处理常见的图操作。每个图都是使用Erdos-Rényi方法( ˝p = 0.4)构造的。 一旦找到正确的答案,它就会被编译成标准的DIMACS格式,并附加上一个包含其预计算的色数(chromatic number)的注释。 对于接下来的实验,研究人员生成了100个实例,每个实例平均有24条边,分布在从10到17的节点数范围内——这一分布是因为经验显示,它是一个表现足够多变的范围。 研究人员使用的图例如下图1所示,这个流程包括LLM的第一次回复、该回复的返回提示(backprompt)以及最终正确的图色方案。 迭代返回提示(Iterative Backprompting)的架构 提示生成器(Prompt Generator): 这个提示词生成器会选取一个DIMACS实例,并将每条边翻译成一个句子,然后将整体包裹在一组通用指令中,从而构造出一个自然语言提示词。 研究人员有意缩小不同实例提示之间的差异,以减少研究人员向LLM泄露的问题特定信息。各种类型提示的示例可以在附录中找到。 大型语言模型: 通过OpenAI API来调用GPT-4,这是当前最先进的模型。 研究人员提供一个系统角色:「你是一个解决各种CSP(约束满足问题)的约束满足求解器」。 返回提示词生成(Backprompt Generation) 在验证模式下,LLM收到一种不同类型的提示。 除了标准指令外,它只包含图的描述和建议的着色方案。它的任务是验证正确性、最优性以及每个顶点是否都已经被涂上了一个颜色。 如果生成的回复中有一组边是矛盾的,那着色方案就是错误的。 为了比较每个点,研究人员还构建了一个能够列出每一条矛盾边的验证器。 由于LLM的响应也是自然语言形式的,研究人员首先将它们翻译成便于分析的格式。为了使这个过程更加一致,研究人员设计了最初的提示,以描述一个模型需要遵循的精确输出格式。然后,该响应会被评估其正确性。 为了判断LLM验证结果,研究人员会检查它们在找出建议的着色方案中的错误方面表现如何。 直观地说,这些应该很容易识别:如果组成一个边的两个顶点共享一个颜色,立即返回该边。从算法角度看,只需要检测所有的边并比较每个顶点的颜色与其连接点的颜色即可。 验证 为了更深入了解LLM的验证能力,研究人员研究了它们在找出提出的着色方案中的错误方面的表现。 直观来说,这些错误应该很容易识别:如果组成一个边的两个顶点共享一个颜色,则立即返回该边。从算法角度来看,所有需要做的就是遍历所有边,并将每个顶点的颜色与其对应顶点的颜色进行比较。 研究人员使用相同的分析流程,但构建了一个研究人员称为color_verification的新域。LLM被引导去检查着色的正确性、最优性以及是否每个顶点都已经被赋予了一个颜色。 如果着色是不正确的,它被指示列出着色中的错误,即如果两个连接的节点共享一种颜色,就返回该边以表示该错误。没有给出返回提示(backprompts)。 研究人员使用之前相同的图实例,但生成了四种用于测试模型的着色方案: 正确(Correct):通过迭代的、随机的贪婪算法生成的没有错误的最优着色方案(使用预先计算的色数以确保最优性)。 缺失(Ablated):将先前一组着色方案中的一个随机节点改变为其邻居的颜色。 非最优(Non-optimal):在正确的集合中,随机选择一个颜色部分重新着色为一个新的色调。 随机(Random):完全随机分配的颜色,不同颜色的数量等于图的色数。 LLM:从先前实验中LLM生成的输出中随机选取的着色方案。 结论 对LLM进行提示、评估答案,并在没有任何返回提示(backprompts)的情况下就会进入下一个实例,得到的基线分数为16%。 当研究人员运行相同的实例,但这次使用由相同的语言模型充当验证者生成的反馈进行返回提示时,性能急剧下降——100个实例中只有一个得到了正确的回答。 与外部合格的验证器进行返回提示的结果起初看似更有效果。 正确回答的实例数量接近40%,但如果这意味着GPT-4在听取、改进,并根据反馈进行推理,那么研究人员期望更准确的返回提示会带来更好的结果。 然而,在这个域中,原始分数(见上图2)并没有证明这一点。 LLM的验证能力 研究人员测试了GPT-4在相同实例上验证图着色方案的能力,为每种实例生成了五种不同类型的着色方案。 明显的结果是,与上面的LLM自我纠正结果完全一致:模型几乎不愿将任何答案标记为正确。在100个最优着色方案中,它只同意其中2个是正确的。 整个500个着色方案的集合,其中118个是正确的,它只声称其中30个是正确的。在这30个中,其实只有5次是正确的。 总体而言,这一模式保持不变。在不到10%的案例中,LLM给出了「正确」、「非最优」或「缺少赋值」的反应。在这些情况中,行为看似有些随机。 在大约四分之一的实例中,它用「这是不正确的」验证作出回应,而解释与现实相符,而且它只通过指明不超过一个边来实现这一点,从而最小化了错误陈述某事的机会。 结果如上表2所示。请注意,当域的错误率增加时,幻觉比例下降。也就是说,当有更多的不正确的边时,模型更有可能指出其中出错的情况。 LLM自我批评,性能不增反减 在12日提交的论文中,作者同样得出了与上面一致的结论。 无论是规划,还是简单的算术或逻辑,当前最先进的大模型GPT-4也无法完全胜任。 许多研究人员对其进行了许多的探索和改进,其中就包括让LLM学会自我迭代、自我验证等策略来提升性能。 由此,业界人们乐观地认为,大模型还有救! 然而,经典意义上的推理任务复杂性与大模型无关,因为LLM是采用近似检索而非精确推理的模型。 在12日提交arXiv的论文中,ASU研者系统地评估和分析LLM在规划任务中的自我批评,以及迭代优化的能力。 研究中,作者提出了一个包含生成器LLM和验证器LLM的规划系统。 其中,GPT-4生成器负责生成候选计划,GPT-4验证器负责验证计划的正确性并提供反馈。 然后,研究人员在Blocksworld规划领域上进行了实验,并对以下方面进行了实证评估: - 自我批评对整个LLM+LLM系统的计划生成性能的影响 - 验证器LLM相对于地面真值验证的性能; - 在批评LLM生成时,同反馈级别对整体系统性能的影响。 结果表明,与使用外部可靠的验证器相比,自我批评会降低LLM规划生成性能。 性能下降可以直接归因于验证器LLM的糟糕结果,验证器LLM产生了大量的假阳性,这可能严重损害系统的可靠性。 验证器LLM的二元分类准确率仅为61%,存在大量的假阳性(将错误规划判断为正确)。 另外,根据反馈的详细程度对比,发现其对规划生成性能影响不大。 总的来说,这项研究的系统调查提供了初步证据,对于LLM作为迭代、自我批评框架内规划任务验证者的有效性提出质疑。 作者介绍 Subbarao Kambhampati Subbarao Kambhampati是亚利桑那州立大学计算机科学教授。Kambhampati研究规划和决策中的基本问题,特别是受人类感知人工智能系统挑战的推动。 参考资料: https://twitter.com/rao2z/status/1715800819239678013 https://twitter.com/GaryMarcus/status/1715804178470387736
“全球最大”!首台!在中国完成吊装
国际大科学工程平方公里阵列射电望远镜,即SKA,台址分设于南非和澳大利亚,是人类有史以来在建的最大综合孔径射电望远镜。建成后,它的接收总面积达1平方公里、足有140个足球场大,作为世界最大的综合孔径射电望远镜 ,为人类认识宇宙提供新机遇。 SKA是共建“一带一路”倡议的重点国际科研合作项目。近期,SKA的首台中频天线在我国完成了吊装 。 总台央视记者 高岩: 由中国牵头研制的国际大科学工程平方公里阵列,即SKA的射电望远镜项目的第一台中频天线,完成吊装。未来不久,首批64台这样的中频天线将远赴南非,推进射电望远镜阵列的组建。 中国电科网络通信研究院总监 马英昌: 这台天线从技术到装配的精度,到整个质量的控制,以及我们对整个工程的进度把控来讲,都是世界一流水平的。 SKA项目是人类有史以来在建的最大综合孔径射电望远镜,是中国目前参与的最重要国际大科学工程之一。由中国牵头、中国研发、中国建造的中频天线,将有力帮助SKA项目“看得更清、看得更快、看得更远”。 平方公里阵列天文台(SKAO)宣传外联部主任 威廉·加尼尔: 恒星与星系是如何形成的,对于这些,我们知之甚少,而有了这些天线后,这些即将在南非搭建的中频天线,将带给我们新的线索,来了解星系的起源和演化。 在南非的SKA办公室,中频天线项目负责人介绍,中方在解决了天线的结构设计、射电技术和生产安装难题后,还将就宇宙探索产生的海量数据,与南非科研团队进行数据处理和存储合作。预计最快在2027年,南非和澳大利亚就将建设完成两处全球最先进的射电望远镜观测站。 平方公里阵列天文台(SKAO)总干事 菲利普·戴蒙德: 中国拥有更先进的仪器,且非常愿意参与国际合作项目,我从中看到了一个光明的未来,只要我们专注于科学合作,我认为这就是世界协同合作的典范。
OpenAI最新估值曝光跻身世界前列 落后于这家中国公司|AI前哨
OpenAI CEO阿尔特曼 凤凰网科技讯《AI前哨》北京时间10月19日,知情人士称,美国人工智能巨头OpenAI正在磋商以860亿美元的公司估值出售现有员工持有的股份。这一估值将让它跻身世界最具价值的私人持股公司行列。 知情人士称,OpenAI正在与潜在投资者就这笔“要约收购”交易进行谈判。不过,该公司尚未敲定分配方案,条款仍有可能发生改变。OpenAI此前推出了炙手可热的人工智能聊天机器人ChatGPT。 按照860亿美元估值计算,OpenAI将超过美国支付公司Stripe和中国在线零售商Shein,成为世界上最具价值的私人持股公司之一,但落后于字节跳动和埃隆·马斯克(Elon Musk)旗下SpaceX。根据本月早些时候的报道,字节跳动提出以每股160美元回购员工股票,估值为2235亿美元。今年7月份,SpaceX出售内部股份,估值约为1500亿美元。上月就有报道称,OpenAI正在磋商一笔潜在股份出售交易,估值介于800亿美元至900亿美元之间。 OpenAI由其CEO萨姆·阿尔特曼(Sam Altman)和总裁格雷格·布罗克曼(Greg Brockman)领导,大股东是微软公司(持有49%股份)。随着企业开始采用人工智能技术,OpenAI的年营收有望达到10亿美元。 截至发稿,OpenAI尚未就此置评。凤凰网科技《AI前哨》对此将持续关注。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
ChatGPT联网功能正式上线,Plus会员可用
IT之家 10 月 19 日消息,聊天机器人 ChatGPT 自推出以来一直存在一个主要的限制,那就是它无法访问互联网,只能使用 2021 年之前的信息。现在这个缺陷终于得到了解决,前提是用户要付费。 9 月底,OpenAI 宣布其聊天机器人 ChatGPT 增加了网页浏览功能,可以实时访问互联网,并提供信息来源的网站链接。当时该功能目前只对 ChatGPT Plus 和 Enterprise 的订阅用户开放,并处于测试阶段。 周二,OpenAI 通过其发布说明宣布,网页浏览功能已经从测试阶段转为正式版,让订阅用户更方便地使用,不再需要切换测试开关。 根据说明,现在订阅用户只需要从 GPT-4 模型选择器中选择“使用 Bing 浏览网页”即可。 ChatGPT 是通过微软的 Bing 网页浏览器来访问互联网的。这个由 Bing 提供支持的网页浏览功能最初是在 5 月份的微软 Build 大会上宣布的,并向 ChatGPT Plus 用户推出。然而几个月后,OpenAI 因为发现用户利用这个功能绕过付费墙而将其撤下。 在 9 月份的公告中,OpenAI 表示自 5 月份的初次推出以来,公司收到了用户的有益反馈,并将其纳入了新的更新中,包括“遵循 robots.txt”和“识别用户代理,以便网站可以控制 ChatGPT 如何与它们交互”。 ChatGPT Plus 会员每月需支付 20 美元(IT之家备注:当前约 146 元人民币),对于需要最新信息的用户来说,这个新增功能可能值得付费,因为它可以提高聊天机器人的准确性和可靠性。 对于其他渴望使用这个功能的用户,OpenAI 曾在原始公告中表示该功能将很快向所有用户推出。在此之前,Bing Chat 是一个不错的替代方案,因为它也是由 GPT-4 支持的,并且可以访问互联网,并且是免费的。
Llama 2第一、GPT-4第三!斯坦福大模型最新测评出炉
编译 | 香草 编辑 | 李水青 智东西10月19日报道,今天,斯坦福大学基础模型研究中心(CRFM)联合斯坦福以人为本AI研究所(HAI)、麻省理工学院媒体实验室、普林斯顿大学信息技术中心共同发布了2023基础模型透明度指数(Foundation Model Transparency Index,FMTI),并对10个主流基础模型进行了透明度评级。 评级结果表明,即使是得分最高的Meta Llama2也仅在满分100分中获得54分,OpenAI的GPT-4获得48分,排名第三。10个基础模型的平均得分仅为37分。 ▲2023年基础模型透明度指数总分(图源:CRFM) 为了构建FMTI,团队定义了三个领域的100个指标,并将它们划分为13个子域进行了进一步分析。 虽然整体平均分仅为37分,但该团队称,100个指标中有82项获得了至少一个模型的满足,这意味着开发商可以通过采用竞争对手的最佳实践,来显著提高模型的透明度。 此外,开源基础模型在这项评级中取得领先地位。 在三家开源基础模型开发商Meta、Hugging Face和Stability AI中,有两家得分最高,这两家公司都允许下载其模型权重。Stability AI则紧随OpenAI之后,排名第四。 团队声明,在完成打分后,他们联系了这10家开发商进行反馈。所有10家开发商都对评分做了回应,其中8家提出了异议,上图是在解决了开发商的反驳之后的最终得分。 论文地址:https://crfm.stanford.edu/fmti/fmti.pdf 博客地址:https://crfm.stanford.edu/fmti 一、定义三大领域100个指标,通过13个子域进一步分析 在10家开发商的选取上,团队称主要基于其影响力、异质性(Heterogeneity)以及影响地位进行选择,并系统地收集了这10家公司截至2023年9月15日公开发布的信息。 为了建立FMTI,团队提出了100个不同的透明度指标,用于评估开发商在开发和部署基金会模型方面的透明度。这100个指标又被划分为三大领域: 1、上游(Upstream) 上游指标体现了构建基础模型所涉及的成分和过程,例如用于构建基础模型的计算资源、数据和劳动力等。 2、模型(Model) 模型指标体现基础模型的属性和功能,如模型的架构、能力和风险。 3、下游(Downstream) 下游指标体现基础模型的分发和使用方式,如模型对用户的影响、模型的任何更新以及管理其使用的政策。 ▲按三大领域划分,10个基础模型提供商获得的分数(图源:CRFM) 除了以上三个顶级域之外,团队还将指标分组为13个子域(Subdomain)。 这13个子域分别是数据(Data)、人力(Labor)、计算(Compute)、方法(Methods)、模型基础(Model Basics)、模型访问(Model Access)、性能(Capabilities)、风险(Risks)、缓解措施(Mitigations)、分布(Distribution)、使用政策(Usage Policy)、反馈(Feedback)、影响(Impact)。 子域为模型的评级提供了更精细、更直观的分析,如下图所示。图中每个子域都包含三个或三个以上的指标。 ▲按13个子域划分,10个基础模型提供商获得的分数(图源:CRFM) 由图中数据可以看出,数据、人力和计算是开发人员的盲点。 在构建基础模型所需的资源方面,开发人员的透明度最低。所有开发人员在数据、人力和计算方面的得分总和仅占总分的20%、17%和17%。 其次,开发商在用户数据保护和模型基本功能方面更加透明。 开发商在用户数据保护、模型开发细节、模型功能和局限性相关的指标上得分较高,均超出60%。这反映出各开发商在如何处理用户数据及其产品基本功能方面的透明度达到了一定的基准水平。 此外,即使在开发商透明度最高的子领域,也仍有改进的余地。 没有一家开发商提供有关其如何提供、使用数据的过程信息。只有少数几家开发商在展示其模型的局限性,或让第三方评估模型能力方面是透明的。 虽然每个开发商都描述了其模型的输入和输出模式,但只有三家开发商披露了模型的组成部分,只有两家开发商披露了模型的大小。 二、开源vs闭源?13个子域中,开源基础模型9项领先 AI领域当下最具争议的辩论之一,就是AI模型应该开放还是封闭。 团队称,虽然AI的发布策略并非二元对立,但在指标分析中,他们将权重可广泛下载的模型视作开源模型。 该评级选取的10家开发商中,有3家是开源的积极践行者,他们的模型权重可供下载。其他7家开发商则采取闭源方式,其模型权重不能公开下载,必须通过API(应用程序接口)访问。 ▲开源模型在评级中处于领先地位(图源:CRFM) 团队称,尽管闭源基础模型更容易满足该评级的许多指标,但开源基础模型在许多透明度方面获得了更高的评分。 例如,一些指标评估了下游使用的政策。由于闭源模型通常只通过API提供访问,因此他们可以更容易地分享与下游使用相关的信息,而开源模型的开发商则需要与下游部署者合作才能获得此类信息。 从理论上讲,这意味着闭源模型在这些指标上的得分要高得多,但团队称并没有发现实质性的差别。不过,一些闭源模型开发商在这些指标上的表现确实更好,其中以OpenAI为首。 ▲开源和闭源模型在13个子域评级中的平均透明度评分(图源:CRFM) 总分方面,开源基础模型开发商遥遥领先。 团队认为,开源模型与闭源模型之间的差距是由上游指标造成的,例如开发模型所使用的数据、人力和计算细节。近年来,许多闭源模型开发商对其模型训练方法越来越保密。 三、诉讼、竞争、安全,大模型开发商对于开源的忧虑 《纽约时报》的记者Kevin Roose谈道,当他询问AI公司的高管,为什么不公开分享更多关于他们模型的信息时,通常会得到三种答案。 其一是诉讼。 目前,包括OpenAI在内,已经有多家AI公司被作家、艺术家或媒体公司起诉,指控他们非法使用受版权保护的作品来训练AI模型。 大多数诉讼针对开源AI项目,或是披露了其模型详细信息的项目。AI公司的律师们担心,他们对模型的构建过程说得越多,就越会让自己面临昂贵、恼人的诉讼。 其二是竞争。 大多数AI公司认为,他们的模型之所以有效,是因为他们拥有某种秘诀——其他公司没有的高质量数据集、能产生更好结果的微调技术、能让他们获得优势的某种优化。 他们认为,如果强迫AI公司公开这些“秘方”,就会把他们来之不易的智慧拱手让给竞争对手,让对手轻而易举地复制这些智慧。 其三是安全问题。 一些AI专家认为,AI公司公开其模型的信息越多,AI的进步就会越快,因为每家公司都会看到竞争对手在做什么,并立即尝试通过建立更好、更大、更快的模型来超越他们。 他们认为,如果AI的能力发展得太快,所有人都会处于危险之中,因为社会没有那么多时间来监管和减缓AI的发展。 对此,斯坦福大学的研究人员并不相信这些回答。 他们认为,应该向AI公司施压,让它们尽可能多地发布有关基础模型的信息,因为用户、研究人员和监管机构需要了解这些模型是如何工作的,它们有哪些局限性、危险性。 结语:基础模型社会影响力不断攀升,透明度问题不可忽视 随着基础模型变得越来越强大,AI工具在人们日常生活扮演者愈发重要的角色,模型透明度问题不可忽视。 更多地了解这些基础模型的训练、部署方式,系统的工作原理,构建模型的数据集和数据来源等,将使监管机构、研究人员和用户更好地了解AI系统,对于保持开发商的责任感和了解基础模型的社会影响尤为重要。 AI革命不能在黑暗中进行。如果想让AI改变我们的生活,我们就必须了解它的“黑匣子”。
大模型卷生态,百度又快了一步
“没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值。” 10月17日百度世界2023上,李彦宏通过手把手现场教学AI原生应用的方式,激励外界更多企业、开发者加入大模型应用生态中来。 自去年11月ChatGPT发布后的近一年间,一众科技大厂纷纷配备起“AI Copilot(副驾驶)”,围绕大模型应用场景的竞争日趋激烈。借助对传统明星应用的重构,这些科技大厂将AIGC时代的竞争从第一阶段的百模大战,带入当下第二阶段的应用落地层面。 微软CEO纳德拉向外展示的宏大规划中,就包括把大模型融入微软所有核心业务。谷歌CEO皮查伊同样忙着借助大模型,重构谷歌所有产品。OpenAI CEO奥特曼更是在推出ChatGPT付费版之后,急忙上线苹果和安卓端的APP应用。 国内的百度,在这方面做得更早、更彻底。今年5月份,李彦宏就对外提到:“百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!”在理解、生成、逻辑和记忆能力上都有着显著提升的文心大模型4.0,在百度世界2023上亮相后,被李彦宏评价为综合能力“与GPT-4相比毫不逊色”。百度的“重构”步伐又将更快一步。 不仅如此,百度对大模型的布局,显然不止于应用层的“造林”。在百度集团资深副总裁、百度移动生态事业群组总经理何俊杰看来,始于技术、强于应用的大模型,最终必将惠于生态。因此,百度移动生态决定开启大模型的下一程,“从AI人人可用,到生态共荣”,希望基于百度的技术土壤,与用户、客户、伙伴共育大模型的“生态雨林”。大模型的应用浪潮,也将从全球大厂或AI公司的独角戏,拓展成为生态共荣的普惠机遇。 从卷模型,到卷应用,再到卷生态,百度似乎始终“快人一步”。 而卷应用,是过去几个月百度移动生态最关键的考题。5月份的万象大会上,何俊杰就宣布,要用AI原生思维重构百度移动生态,让AI人人可用。今年的百度世界上,他再次强调,AI原生应用,是推动AI人人可用的最直接路径。 在这场面向AIGC时代应用生态开发标准的抢位战中,不仅要比谁跑得更快,谁能拿到更多的反馈数据,建立更多的应用落地优势,而且要比谁的应用真正能够改变大众用户的工作和生活。两相叠加,大模型厂商才有望凭借“滚雪球效应”脱颖而出。 而百度应用层重构的理念很简单。何俊杰曾在此前的媒体采访里提到,百度做大模型的理念——be the house(坐庄),这贯穿百度移动生态重构战略的始终。“这次重构对我们而言不是小修小补,而是大刀阔斧,不是简单地做大模型和业务的‘加法’,而是要做‘乘法’”。 首先,要通过重构,使AI原生应用能解决过去产品无法解决或者解决不好的难题。 比如,我们需要查证“过去20年各国工业增加值排名”,在以前,需要分别搜索各个年代的数据,并自行对比。但是如果我们将这个问题抛给被AI重构后的百度新搜索,它呈现的不再是一个个网页链接,而是一个经由AI生成的动态图表。这便是百度新搜索被大模型重构后所带来的“极致满足”的新能力特点。 此外,通过大模型技术还能拓展原有产品的能力边界,完成以往所不能。这一点在新百度文库上体现得颇为明显。 今天,这款李彦宏口中“最彻底变革”的产品,可以直接完成文本智能生成与编辑、文档智能总结及问答、文生图表及分析洞察、PPT图表生成、大纲写作、头脑风暴等“动脑”的工作。 比如何俊杰在世界大会的3分钟的展示,从查询“光伏行业”报告的指令出发,通过文库迅速找到行业报告,并几秒钟生成70页文库内容的总结提炼,又快速把总结文档生成为PPT,自选模式美化PPT,快速完成一次工作、学习场景的资料整合和呈现。 完成从“内容工具”向“生产力工具”进化的百度文库AI新功能,正在获得越来越多用户的认可。上线2个月来,其累计使用用户已超过1300万人、累计功能使用次数已破亿。 早在ChatGPT尚未发布之前,李彦宏就曾提出,未来十年,AIGC将颠覆现有内容生产模式,仅用十分之一的成本,便能激活百倍千倍的生产速度,生成AI原创内容。 因此,在百度世界上,百度APP最新发布的AI编辑器,就继续瞄准降低创作者门槛,创造新生产力模式的目标。比如使用“AI同款跟拍”一键生成创意图片;用“AI说图解画”自动识别图片信息,一键生成多种分享文案。这帮助用户再也不用苦恼于外出旅游时,拍了一张风景照后该如何绞尽脑汁为其想出一条合适的朋友圈文案,助推更多普通人转变为创作者。 营销平台的底层重构,则为百度的客户带来直接效益提升。用李彦宏的话来说,“一个人就是一支营销队伍”。 以AI Native营销平台轻舸为例,基于自然语言描述,可以将创意生成、营销方案创编时间缩短到分钟级,并把广告准确投放给更多的目标人群,快速完成广告创意、创编、投放动作。 何俊杰在现场展示了IT教育集团达内的案例,靠一句“帮我把广告投放给想学IT找工作的年轻人”,就能自动锁定目标人群,并生成具有吸引力的创意,其商业价值转化量同比提升了23.3%,广告ROI提升22.7%。 借助这场应用重构计划,百度移动生态正在朝着打造AIGC时代“超级APP”的初步目标迈进,从而开拓新的流量入口。 在AI原生应用带来的全新用户体验和效率提升之下,百度移动生态还有望借此拓展新用户,增加用户黏性。 9月份接受媒体采访时,何俊杰曾表示,文心一言向公众开放后,更多高知和年轻人用户正在回归,“不管是对百度APP还是文心一言、百度文库,各个端都会带来新的流量增长,资源更可持续的提升,商家的变现效率也会有所拉动。” 世界大会期间,何俊杰也透露,现在每天有海量级用户积极调用AI功能,不论是DAU、MAU,还是使用时长、付费率,包括创作者变现、商户ROI,都有明显提升。 在做出新文库、新搜索、文心一言APP等一系列获得C端认可的爆款应用后,何俊杰把“house(庄家)”理念扩展到了整个AI原生生态。 身份也从“植树人”变成“造林人”,何俊杰希望借助内容和商业生态的多重驱动,在百度移动生态中为外部企业开发AI原生应用培育起一片生长的土壤,联手打造大模型时代的“生态雨林”,利用应用的土壤,让AI走下技术的“神坛”,飞入千家万户。 李彦宏曾说:“大模型时代,最大的创业机会在应用。移动互联网时代,操作系统其实没几个,最成功的是微信、抖音、淘宝这些应用。未来10年,可能诞生10倍价值于它们的机会。” 上述十倍机会的主要诞生地,并非大模型本身,而是基于大模型所开发的应用。 内容和商业生态做好了铺垫,百度也从文心一言能力出发,推出了插件生态-灵境矩阵,旨在吸引更多开发者、创业者加入,从“植树”过渡到“造林”。 李彦宏提到,插件是一种特殊的AI原生应用,门槛最低,也最容易上手。插件让大模型更实用、更易用。 越来越多插件应用的出现,将是解决大模型时代用户个性化、复杂化需求的重要举措,并将成为百度构建大模型应用生态的关键一环。 比如要撰写一篇关于“新能源汽车电池供应链”的分析文章,第一步就是查询相关公司财报。“金融智能助手”插件可以分析财报内容,并总结成数据图表,帮你快速了解清楚这家公司的利润分配、资产负债、现金流等内容,甚至还能给出行业排名作为参考。 近期,百度和中信书院合作推出了插件“中信书院AI阅读助手”,当用户在百度上搜索“灯泡是谁发明的”,百度搜索就会直接调用插件,通过《历史的温度1》这本书,给出相对靠谱的回答。用户如果对这本书感兴趣,还能通过插件直接下单购买,一个新的数字营销模式也开始在插件生态中试水。 或者当用户从网上购物,到货后发现卖家发货与实物不符,想要咨询怎么要求赔偿时,就可以调用中国司法大数据研究院提供的法律智能助手插件,听取它给出的专业建议。 “如果说大模型是一颗聪明的大脑,那么插件就是大模型的手和脚,让大模型读万卷书,行万里路”,何俊杰表示。 值得注意的是,上线一个月,灵境矩阵插件生态平台已经有2.7万个开发者申请注册,个人开发者占比30%。这些开发者将逐渐成为填充百度移动生态应用丰富度的重要力量。 百度移动生态链接着的10亿级用户流量曝光机会,结合文心大模型4.0所带来的领先技术吸引力,共同成为外部开发者参与百度插件生态的筹码。除此之外,百度还配套发布了“星启计划”,通过在全网场景开放百亿流量、千万算力和亿元基金等扶持措施,激励更多伙伴共建插件生态。 低门槛、高流量扶持插件生态的环境,确实可以吸引更多开发者加入和共建,百度也拿到了丰富大模型生态的“钥匙”。 更重要的是,当拥有更多来自插件应用的数据反馈,和百度移动生态AI原生应用的用户反馈后,文心大模型的能力也可以借此向前迭代,并进而吸引更多用户使用百度移动生态AI原生应用,更多外部开发者加入插件生态中来,百度移动生态将在共建生态雨林的道路上,建起一个正向循环的增长飞轮。 从喊出用AI原生思维重构整个移动生态,到落地文心一言APP、新文库、新搜索等多个基于大模型能力的爆款应用和功能,以及当下提前布局AI原生应用生态,百度移动生态,成为李彦宏用大模型重构C端场域、开拓新流量入口、创造新商业价值的重要阵地。 移动生态在大模型时代的快速代际变革,离不开何俊杰等人对这艘大船在转变航向中的实时掌舵。 随着大模型浪潮的到来,今年年初,何俊杰向移动生态全员反复灌输的一个概念便是,抓住这一波AI的机会,从用户侧、商业侧、内容生产侧,联盟侧,全部重构百度移动生态,让MEG这棵“老树”开出“新花”来。 加速应用落地,被何俊杰放到了核心位置。在对内部已有应用大刀阔斧重构过程中,何俊杰一方面要求所有人培养起AI native的原生意识,另一方面启动赛马机制,要求所有业务对自己的业务线和业务能力,基于大模型进行整体重构。 令人印象深刻的是,即使是很多已经运营多年,用户稳定的产品,都在这次重构中有惊艳表现。比如百度输入法,也能基于大模型推出智能云联想、云预测,并且通过全场景AI创作助手“超会写”,提供高情商沟通、灵感笔记等功能玩法,可以说是把生成式AI能力直接送到了用户手边。 来自业务一号位的重视,推动百度移动生态成为一众科技大厂中率先打响应用之战的玩家,并在紧迫感的趋势下,提前一步跨入大模型应用生态竞争的下半场。 这同样将是一场围绕技术和速度的双重赛跑。谁先上线更多应用产品,吸引更多玩家使用和共创,谁就有可能借助来自生态用户的真实反馈掌握先机,从而随着时间推移形成愈来愈强的马太效应。正如何俊杰所说,“更多用户在这个模型上进行应用和调用,沉淀你的行业know-how,沉淀你的专有化数据,这个模型才会越来越强,才能打得过别人。” 从一棵树,到一片雨林,还需要平台的种植和浇灌。对于构建AI原生应用生态的百度而言,如何尽快用更好的工具产品,吸引更大的使用群体,是摆在何俊杰等人面前的一道新考验。 好在,百度移动生态并不缺乏“吃螃蟹的人”。根据百度世界2023公布的数据,已经有千万工作党、学习党开始用文库新功能查资料、办公,也有数十万百度营销客户开始用“轻舸”自动生成、投放广告,也有上万开发者在灵境矩阵开发专属插件,百度重构移动生态的战略,已经延伸到10亿用户和千万客户、合作伙伴,集全行业之力,共建行业生态。 在“跨越鸿沟”理论中,一款高科技产品/创新服务的早期市场和主流市场之间存在着一条巨大的“鸿沟”,能否顺利跨越鸿沟并进入主流市场,成功赢得实用主义者的支持,将决定着这款产品/服务的成败。 眼下,跨过鸿沟的重任,落到了百度移动生态肩上。
米哈游想要All in全球化了?
米哈游全球巡回音乐会(图源:米哈游官网) 十一假期之前,原神交响音乐会全球巡回演出悄然而至。这次巡回演出途径新加坡、马来西亚、墨西哥、美国、日本、韩国、英国和德国等地,将持续近四个月的时间。 在新加坡和马来西亚等东南亚国家,原神交响音乐会的门票上线几分钟后就销售一空。购票网站也因为访问量过大而崩溃。 目前,新加坡、马来西亚、墨西哥等三站的演出均已结束。海外观众纷纷在社交媒体上晒出原神交响音乐会的票根,并表示交响乐团演奏的《原神》配乐唤醒了他们的游戏记忆。 与此同时,《崩坏:星穹铁道》于10月11日登陆PS5平台,迎接全球的主机玩家。上线之前半个月,《崩坏:星穹铁道》的PS5版本就吸引了全球超过100万名玩家进行预约。 《崩坏:星穹铁道》PS5版预约突破100万(图源:崩坏星穹铁道官方X账号) 钛媒体App观察到,自2021年开始,米哈游加快了走向全球市场的步伐。 一方面,米哈游把自主研发的全平台游戏带到海外市场。《崩坏:星穹铁道》的移动版和PC版甚至实现了全球150余个国家和地区同步上线。全球化已经成为米哈游产品的重要标签。 另一方面,米哈游在美国、加拿大和新加坡等多个游戏产业发达的国家设立研发中心和办事处,以期提升工业化体系的成熟度,维持内容更新周期的稳定性。 根据9月份蔡浩宇卸任公司法定代表人与董事长时米哈游的官方回应,蔡浩宇工作内容中的一项就是“串联国内与海外研发资源”。这意味着未来一段时间里,全球化将继续成为米哈游戏公司级别的战略。 二次元的内驱力,在日韩市场夺得先机 米哈游的出海之路始于《崩坏学园2》。 2014年,米哈游还是一个名不见经传的小团队,没有海外发行团队和相关能力。不过,《崩坏学园2》还是在国内市场取得了成功。根据米哈游2017年递交的IPO招股书显示,《崩坏学园2》在2014年的收入就高达9500万元左右。这个数字无法和当年大火的日本二次元游戏《百万亚瑟王》匹敌,但对于国产二次元游戏而言已足够令人惊喜。 《崩坏学园2》的收入表现吸引了大量发行公司来和米哈游洽谈海外发行代理业务。最终,上海方寸游戏获得了《崩坏学园2》在北美、东南亚和欧洲等市场的独代权。 不过,《崩坏》这个系列制作初衷就是要在日本发行上线。因此,米哈游决定在日本设立miHoYo株式会社,自行承担《崩坏学园2》日本地区的发行工作。 miHoYo株式会社(图源:官方X账号) 从这一举措我们不难看出,米哈游的出海策略是由公司强大的内驱力决定的。如果米哈游决定要去做一件事,且走在正确的方向上,那么无论如何他们都会尝试并坚持下去。 这种内驱力最早的源头来自公司三名创始人蔡浩宇、刘伟和罗宇皓。他们深受日本ACG文化影响,《崩坏》系列也是这种ACG文化影响下的产物。当他们决定进军日本市场的时候,团队规模再小也要坚持做下去。 运营期间,《崩坏学院2》在日本市场不温不火。游戏遇到了版权和谐、运营失误和BUG频出等诸多问题,首发期后就很难跻身日本热门手游排行榜。不过,这次发行工作算是米哈游的一次“出海”试水,为他们后续的游戏发行提供了宝贵的经验。 接下来的《崩坏3》,米哈游拿回了海外其他地区发行权,实现全球自主发行。《崩坏3》日服上线时间和国服仅相差4个月。更为重要的是,《崩坏3》从2D横版动作游戏变成了3D动作RPG,更符合海外二次元受众的口味。海外玩家也第一次认识了这家中国的二次元游戏公司。 《崩坏3》在日韩等二次元文化强势的地区,取得了较为优异的成绩。日本地区上线前三个月,《崩坏3》能够稳定排在App Store畅销榜前100名,而韩国市场则是近半年时间里稳定在畅销榜前100名。 不过在欧美市场,《崩坏3》起步不佳。《崩坏3》在欧美地区上线前,仅吸引了35万名玩家预下载,和今天的《崩坏:星穹铁道》不可同日而语。后期凭借KOL和社交媒体宣传等方式,《崩坏3》在欧美市场站稳了脚跟,并一直持续运营至今。 2016年的米哈游还是一家异常低调的公司。后来人们发现,当时低调的米哈游其实是在为下一款游戏《原神》蓄力。无论是游戏所需的内容量还是技术难度,《原神》都是米哈游的一次豪赌。全球同步上线的出海策略也是这场豪赌的一部分。 米哈游全球同步上线的策略究竟有多激进?我们可以拿上海四小龙同期的出海策略进行比较。 莉莉丝是这四家公司里海外发行能力最强的一个。2015年,莉莉丝就已经进军海外市场。他们的行事方式是先把游戏拿到海外,取得一定市场成功后再带回国内。《剑与远征》和《万国觉醒》都采用了类似的发行策略。 鹰角网络依靠《明日方舟》单款游戏的现象级表现就进入了“四小龙”行列。然而在二次元游戏最为重要的日韩市场,鹰角网络还是把《明日方舟》代理权交给了海外发行能力更强的悠星网络。 至于叠纸,他们的海外发行模式比较像《崩坏学园2》时期的米哈游。日本市场由叠纸的子公司发行,其他海外市场的发行工作则是交给了不同的代理商。 在2020年那个时间节点上,能够做到全球同步上线并自主发行的游戏厂商是比较稀缺的。米哈游实现了这一点。后来,米哈游相关业务的负责人接受各家媒体采访时,提到最多的也是“全球同步”这四个字。 借力索尼PlayStation,《原神》登陆全球市场全平台 从《崩坏学园2》坚持自主发行日本市场,到《原神》坚持全球同步上线,米哈游对于游戏出海的坚持是一以贯之的。但《原神》能够在海外取得现象级的成功,离不开另外一重因素,那就是全平台策略。索尼PlayStation平台对米哈游游戏的加持尤为明显。 一些国产游戏也曾经尝试过登陆全平台。比如网易游戏出品的《荒野行动》,2019年10月和12月分别推出了Nintendo Switch(NS)版和PlayStation 4(PS4)版,也算是一款全平台游戏。网易把《荒野行动》移植到主机平台,主要是为了进一步扩大游戏在日本市场的用户群体。于是,《荒野行动》主机版没有在其他地区上线。这和米哈游的发行思路有着一定的差异。 ChinaJoy2019索尼PlayStation展前发布会上,米哈游正式宣布《原神》将登陆PS4平台。刘伟亲自出席了这场直播活动,并表示米哈游将为PS4版游戏推出独占内容。这是米哈游与索尼合作的开端。横跨主机、PC和手机,《原神》成了一款不折不扣的全平台游戏。 《原神》(图源:yahoo) 《原神》登陆PS4,其中一个目的自然是借助主机平台触达海外用户。不过,海外的主机玩家会接受一款手游移植作品吗?这或许是《原神》上线前外界最为担心的事情。 事实上,《原神》作为一款开放世界ARPG游戏,与PlayStation平台用户的口味是非常契合的。 在上个世代,PS4平台上推出了大量的开放世界游戏。PlayStation第一方工作室更是如此。《对马岛之魂》《漫威蜘蛛侠》《往日不再》《死亡搁浅》等一大批PlayStation出品的游戏都是开放世界游戏。可以说,PlayStation平台汇集了大量开放世界游戏受众。 平台受众和《原神》游戏类型所契合。海外主机玩家们是否愿意付费就变成了米哈游需要面临的下一个问题。而索尼强大的推广和发行能力,保障了《原神》在PS4主机上的收入下限。 《原神》上线的时候,索尼在PlayStation商店首页的“不容错过”、“本地十大热门游戏”和“新的游戏”等多个宣传位置都放上了《原神》的游戏页面。玩家只要进入商店,就能看到这款游戏的身影。同时,PlayStation官方社交媒体在游戏上线前还会多次放出游戏信息进行预热宣传。 铺天盖地的宣传之下,《原神》主机版的付费情况远高于人们的期待。索尼和米哈游从未公布过《原神》在主机平台的收入状况。然而,《原神》常年能够跻身PS商店各个地区的“十大热门游戏”。索尼也连续两年将日本亚洲PS合作伙伴奖(PlayStation Partner Awards 2022 Japan Asia)中的PS年度大奖(Grand Award)颁给了《原神》。这些举动或许能从侧面证明,索尼非常满意《原神》在PlayStation平台上的表现。 经过了《原神》的成功之后,索尼与米哈游的合作变得更加紧密。这之后,米哈游新作《崩坏:星穹铁道》和《绝区零》都会率先登陆PlayStation主机。登陆全平台成为了米哈游游戏的特性之一。 驶向那个10亿玩家的虚拟世界 全球发行和全平台发售已经成为现在米哈游游戏的新标准。这也意味着米哈游需要把工作重心更多放在海外市场上。于是,从更改品牌名称,到开设多个海外子公司或者工作室,米哈游的全球化战略在公司层面达到了新的高度。 2022年的情人节,米哈游正式推出了全新品牌“HoYoverse”。HoYoverse由“MiHoYo”(米哈游)和“Metaverse”(元宇宙)组合而成。米哈游在公告中表示,该品牌旨在通过各类娱乐服务为全球玩家创造和传递沉浸式虚拟世界体验。 当时大部分人认为,米哈游此举是想发力元宇宙领域。刘伟在接受澎湃新闻采访时也曾表示,米哈游的愿景是2030年打造一个能容纳10亿人的虚拟世界。 后来人们发现,新品牌HoYoverse设立的目的是走向全球市场。先是英文网站的域名,然后是各大海外线下游戏展会的宣传物料,HoYoverse全面替代了miHoYo。此时人们才意识到,HoYoverse这个具有英文色彩的品牌名,更利于米哈游在全球市场进行传播。 除了新的品牌名,米哈游在全球各地开设了工作室和办事处。2021年11月,米哈游在加拿大蒙特利尔创办了新的工作室,目标是组建100多名员工的团队。 蒙特利尔汇集了全球多家知名游戏工作室,包括了美国艺电(EA)、贝塞斯达、育碧和华纳游戏等。这些游戏工作室代表了目前游戏行业顶尖水平。近年来,诸多国内游戏公司选择蒙特利尔建设海外工作室。借助这种集群效应,中国游戏公司希望能够学习海外先进的游戏工业化经验,同时招揽海外游戏人才。米哈游自然也不例外。 米哈游蒙特利尔工作室官宣(图源:LinkediIn) 事实上,这种表达和海外游戏公司的稳定产出3A游戏的工业化标准是不谋而合的。米哈游在蒙特利尔设立工作室,可以更为深入地学习海外游戏公司的工业化模式,让全球发行和全平台发售的标准得以延续。 2022年中国游戏产业年会上,刘伟曾经在他的演讲中谈及了游戏工业化。刘伟表示:“我们所说的文化产品工业化,指的是在保证‘文化价值、创意与创新’的前提下,大批量、稳定生产、高质量的文化产品;就是要标准统一的前提下,品质可控,流程可控,产量可控。” 同时在2022年7月,米哈游启用了新加坡总部办公室。新加坡总部将会成为米哈游“全球分销和运营”的一个主要中心,和公司的其他办公室密切合作,为游戏开发提供技术支持。 一位行业人士曾向钛媒体App表示,外界对于米哈游的海外布局存在一定的误读。自《原神》全球同步上线开始,米哈游脑子里想的就不再是简单的出海,而是全球化。这名行业人士说:“全球化是一个完整的事情,不分国内和海外。” 最终,无论是蒙特利尔工作室,还是新加坡总部,海外的技术和人才帮助米哈游不断缩短游戏内容更新周期,推动了米哈游游戏的全球化。 米哈游的全球化进程还会继续下去。即便是回合制游戏,《崩坏:星穹铁道》的成绩也已经验证了这种全球发行+全平台发售模式的可行性。下一步,米哈游需要做的就是将符合全球化标准的游戏产品推向市场,赢得更广泛的玩家受众群体。 (作者|雪夜枫鳞,编辑|李程程)
被骗子围猎的孩子们:《蛋仔派对》缘何置身事外?|新视界
来源|新视界 作者|蒋澆 编辑|于浩 “扫码就可以领新皮肤。”暑假期间,12岁的李可在玩《蛋仔派对》这款游戏时,收到一个陌生账号发来的私信,对方称扫码就可以领取游戏福利。 李可扫码后,加入了一个名为“蛋仔1号派送员”的QQ群,并添加了群管理员。随后,该管理员以领取福利操作错误为由恐吓李可,称三十分钟后她父母的微信和银行卡都会被冻结,需要立刻联系内部人员关闭该功能。 李可小朋友根据QQ视频操作进行转账,被转走了10万元。幸运的是,李可妈妈察觉后立刻报警冻结了相关银行账户,才得以追回被骗钱财。 不过,其他被骗家庭就没这么幸运了。 在社交平台上,以“蛋仔派对”为关键词检索,能发现很多家长分享孩子被诈骗的帖子。在接受新视界采访的5名家长中,被骗金额最多的是一位10岁的小朋友,家长发现时,银行卡已被转走超过20万元。 图|李可与骗子的对话 《蛋仔派对》是一款糖豆人手游,凭借可爱的游戏风格、简单的游戏模式以及强社交属性,吸引了10后、00后等大量未成年用户。 据官方资料,这款游戏每日上线的玩家已破300万。 01.“玩游戏不用再验证” 半夜钱被转走了 “这事家长有责任,小孩游戏不用再验证,出了这种事情谁来管管呢。”7月6日上午,身为一位十岁女孩的妈妈,胡立萍发现账户里一共被转走了22680元。看着身旁紧张局促的女儿,她感到气愤又无奈。 7月5日的晚上,胡立萍发现自己银行账户半小时内被转走了好几笔钱,3999、11535、570.....。察觉不对劲的胡立萍逼问女儿瑶瑶才知道,瑶瑶看到有免费领游戏皮肤的页面,加了陌生人QQ号,在对方引诱恐吓下修改了密码,通过微信转账把银行卡里的钱转给了陌生人。 图|胡立萍提供的银行转账流水单 胡立萍的女儿瑶瑶今年10岁,在长沙天心区某小学读三年级。暑假期间,胡立萍发现瑶瑶痴迷上了《蛋仔派对》,起初只是写完作业后完一会,后面一发不可收拾。 一开始,胡立萍以为女儿每次登陆游戏,都需要实名验证身份信息。她没想到的是,仅需一次实名登陆,瑶瑶就能够轻松再次登陆游戏,不用输入任何信息,也没有短信或人脸再次验证。 这让瑶瑶钻了空子,她常常偷偷拿出iPad,背着父母沉迷《蛋仔派对》。 “有天半夜我上厕所,发现她房间有光,走近一看她在被窝里玩游戏。”胡立萍说,女儿经常拿手机玩《蛋仔游戏》,但手机却没有收到过短信信息。 瑶瑶喜欢给《蛋仔派对》游戏里胖胖的蛋仔换装,也就是更换游戏里的皮肤,这也是班上女同学最喜欢谈论的话题。她的蛋仔现在有了红小豆、水波蛋套装,还在努力收集仔仔熊套装。为了讨论蛋仔皮肤,瑶瑶和同学们还组了一个换装小组。 没成想,学生们喜欢的蛋仔皮肤,却成为了不法份子围猎他们的诱饵。 据瑶瑶回忆,自己在玩蛋仔时,有人在TT语音(手游语音平台)私聊她,说是官方有活动免费领取蛋仔皮肤。随后添加了了一个名为“回家路线9668”的QQ号,对方让她扫码页面领福利,扫完后却被告知由于她是未成年人,违规操作导致账户被冻结,逾期将会受到法律制裁。 图|不法份子制作的假官方通知 语音过程中,对方不停恐吓瑶瑶,“怎么不早告诉我是未成年?再一个小时内不能弄好的话,姐姐的钱永远都弄不回来了。如果弄不回来的话,姐姐只能选择报警处理了。如果直接报警的话,你爸妈也会坐牢。” 图|骗子恐吓瑶瑶 “我被吓到了”。听到这些话的瑶瑶感到非常害怕,她按照对方的指示,通过微信给对方转了四笔钱。 02.家长质疑《蛋仔派对》 未成年防沉迷系统形同虚设 今年以来,多名未成年学生因为领取《蛋仔派对》,皮肤或者购买账户上当受骗。 暑假期间,浙江、上海、广东东莞、福建泉州等多地政务号都通报了《蛋仔派对》相关的未成年诈骗案件。根据浙江温岭警方政务号,9月期间,温岭全市就发生“蛋仔派对”类游戏诈骗29起。 新视界采访获悉,今年6月,安徽农村11岁的罗鑫宇被拉入了”蛋仔嗨玩”群,领取皮肤过程中被骗了17000元;为领取蛋仔皮肤,广东佛山10岁的赵乐乐被骗走了20多万,家长报案后至今没有回应;7月,北京海淀小学二年级魏明购买蛋仔账户时,被骗走了11000元。 这类游戏诈骗手法高度相似,不少未成年群体玩都是被“加QQ免费领皮肤”哄骗,再通过社交软件添加陌生人为好友。在骗子的诱导恐吓,他们按照骗子指导兑换皮肤,最后不但没领到皮肤,家人账户里的存款还被诈骗团伙转走。 随着多起未成年诈骗事件曝光,家长对《蛋仔派对》未成年保护举措和防沉迷系统产生了强烈质疑。 “小孩子用家长信息实名认证后,再次登陆游戏没有验证,哪怕是短信等二次身份验证也没有,这不是漏洞是什么?”胡李萍认为,家长固然负有主要监督责任,但《蛋仔派对》防沉迷系统过于宽松,为不法份子提供了可以操作的空间。 “我跟客服反馈,对方却说这是成年人账号登陆,能快速充值和游戏,他们丝毫不觉得有问题。”胡立萍气愤的说道。 李可的妈妈也表达了自己的担心,“身边很多人的小孩都被骗钱,都是因为蛋仔派对这个游戏。”她认为《蛋仔派对》游戏登陆过于简单,让家长防不胜防。 根据上述家长的反馈,未成年人能通过各种途径登陆《蛋仔派对》游戏,比如随意输入一个成年人的身份证,或者是在网络购买账号登陆。 有家长反映称,《蛋仔派对》官方游戏设置了防沉迷系统,但有跟多渠道服没有,孩子可以在网上购买号码轻易登陆游戏,而购买账号时也极易被诈骗。“他瞒着我们在网上买账号玩,被骗了还不敢告诉我,要不是我发现的早,不知道要被骗多少钱。” 渠道服是指官方服务器(官服)外,游戏方为了吸引用户和获取更多收益,这与渠道方签署打造的定制版游戏,一般通过手机应用商店下载,或是其他平台渠道下载。而多个渠道服,也会增加游戏未成年防沉迷监管的难度。 新视界以“蛋仔派对”为关键词进行检索发现,在社交平台上充斥着不少渠道服账号贩卖信息。其中一条显示,求租个某手机渠道服的号,空号也可以,只要没有防沉迷。 图|社交平台上《蛋仔派对》租号信息 新视界实测发现,用户登陆《蛋仔派对》时只需填写姓名、身份证信息,以此判定是否纳入防沉迷系统。随意输入任何一个成年人的真实身份信息,都可以直接游戏,没有二次验证。退出后再次打开游戏,也不需要验证身份。 图|新视界实测登陆蛋仔派对 这意味着,在史上最严防沉迷新规落地两年后,《蛋仔派对》缺乏有效的身份验证系统,来防止未成年沉迷游戏。 03.《蛋仔派对》真的防不住? 新视界就“蛋仔派对游戏滋生诈骗”,以及未成年防沉迷保护等事件,向《蛋仔派对》游戏团队发去采访函。 10月20日,《蛋仔派对》方面回复称,此类诈骗事件不便回复,并附上了一则公司关于游戏未成年人保护整体介绍。 该介绍称,针对未成年人冒用成年人身份绕过防沉迷的行为,公司使用了深度学习框架pytorch搭建了一套神经网络模型,用于判断玩家特征是否属于疑似未成年玩家,对其进行及时拦截核实和有效管控。 此外,也基于该AI识别系统进一步开发了人脸识别系统,针对高度疑似未成年人用户将拉起人脸识别。 然而,家长对于《蛋仔派对》的解释并不买账。作为家长的潘玲表示,《蛋仔派对》并没有严格执行未成年人防沉迷规定,无论是AI技术还是内容监管,都十分宽松,平台对此应该负相应责任。家长孙艳则认为没有什么效果。“这个游戏群体都是小学生在玩,身边的小孩哪里只玩一个小时,它们防沉迷系统不太理想。” 黑猫投诉平台显示,关于《蛋仔派对》这款游戏相关的投诉记录有12025条。其中,以“未成年”为关键词进行检索产生结果5352条,理由均为未成年充值退款、蛋仔派对诱导消费等内容。 今年9月,上海市消费者权益保护委员向《蛋仔派对》发出“灵魂三问”,指出《蛋仔派对》被消费者集中反映游戏存在消费退款难、快速游戏、渠道服等防沉迷漏洞等问题。 针对未成年人冒用家长身份登陆游戏等行为,互联网分析师张书乐在接受新视界采访时表示,一旦未成年人绕过防沉迷体系而进入到游戏之中,游戏厂商就应当因为设计上的漏洞而担负相应责任,包括但不限于退还充值金额、关停相关账号、主动发布道歉声明和快速迭代游戏版本封堵漏洞。 张书乐称,人脸识别工作确实能在未成年人游戏充值上具有“物理隔离”的解决奇效。但人脸识别工作的研发、运维以及数据保密等,也需要大量技术和资金支持。一般中小游戏厂商没有技术实力和资金,难以部署到位。但在潘玲看来,作为《蛋仔派对》运营方完全有能力利用技术手段加强监管,却不作为。“游戏方不能说出个保护声明,或者是在用户条款中默认签署,就自认为合规了。” 随着日活数据超过300万,《蛋仔派对》的营收数据也水涨船高。 据七麦数据统计,今年2月《蛋仔派对》游戏仅在iOS端便获得了约2734.46万美元(约合人民币1.85亿元)的收入,超越了米哈游吸金兽《原神》,仅次于《王者荣耀》与《和平精英》。 作为一款在低幼龄群体具有巨大影响力的游戏,《蛋仔派对》除了商业业绩外,或许还有更多需要解决的问题,比如对未成年人的保护。 (应被采访者要求,文中胡立萍、潘玲、瑶瑶、李可、罗鑫宇、赵乐乐、魏明为化名)
现在,重新认识一下折叠屏手机
极少有手机品牌,会从非主流的形态开始做智能机,OPPO 是一个。 或许你已经忘了,OPPO 在 2011 年发布了自家第一款智能手机,型号叫 X903。比起型号,它的代号更让人耳熟:Find。侧滑全键盘的设计,在 iPhone 当道,竞品追逐模仿的时代,显得有点儿另类。 ▲OPPO X903(Find) 这种与众不同的探索感,正是 OPPO 对 Find 系列的注解。所以十年后,Find N 折叠屏手机,再次以新奇的形态面世:用业界最小的尺寸,换来了独一档的好手感,消解了折叠屏从尝鲜到常用的门槛。 当常用的负担不再,折叠屏该怎样进化?OPPO 探索出了新的答案:Find N3。 它不是常规的堆料升级,而是鞭辟入里地革新。无论你是否用过折叠屏手机,它由表及里的独特性,相信都能给你足够的新鲜感。 折叠旗舰,首先是影像旗舰 OPPO Find N3 的外观,有两个强烈的记忆点。一是有棱有角的方正设计,二是当前折叠屏里,最为硕大的圆形摄像模组。和 Find N2 放在一起,颇有「鸟枪换炮」的感觉。 ▲左为 Find N3,右为 Find N2 如此张扬的摄像模组,以及高调的哈苏标识「H」,让我不得不从影像开始,向你介绍这个猛兽。 在一英寸大底成为影像旗舰的拳头配置后,「底大一级压死人」的观念迅速普及。在此背景下,折叠屏想成为影像旗舰,似乎是个伪命题了。 要知道,当前一英寸影像旗舰,镜头区域的机身厚度,已经来到了 14mm 左右,而 Find N3 展开的厚度只有 5.8mm。如果把 Find X6 Pro 的影像配置,照搬到 Find N3 上,它将成为一座行走的火山。 Find N3 换了一个思路与空间博弈。假设你有一大一小两个收纳货架,它们高度一样。如何让小货架,与大货架收纳同样多的物品?答案是增加小货架的层数。 Find N3 广角镜头的传感器,用上了折叠像素技术。简单来说,就是将传统背照式传感器里的两个核心元件,从同一层面分至两层,让它们拥有更大的伸展空间。 ▲左为传统传感器,右为折叠像素传感器 这两个元件,分别是负责感光的光电二极管,以及负责电荷转换与信号读取的周边晶体管。将其分离后,两者性能大幅提升,从而带动光子饱和量与动态范围的进步。 说人话,就是在 1/1.43 英寸的传感器上,实现了媲美一英寸的画质水准。我们直接来看样张,注意观察画面明暗处的细节,Find N3 在正确光影关系的基础上,做到了极大程度的保留。 ▲广角镜头拍摄 无论是大光比的,还是明亮通透的,亦或是整体偏暗的环境,Find N3 的这枚广角镜头,都能捕捉到细节丰富、光影高级、色彩饱满的画面。 ▲广角镜头拍摄 我们曾在 Find X6 Pro 的测评中说到,它三颗素质高度一致的镜头,让我们忘记了「主摄」这回事。这句话放在 Find N3 上,也同样适用。 在整理样张时,我发现相册里超广角、长焦的照片,甚至多于广角。创作时我是凭直觉与经验,来判断哪种焦距更适合当前的场景或角度,而非考虑哪颗镜头素质更高,能拍出画质更好的照片。 ▲ 超广角镜头拍摄 在查看上方的超广角样张时,你应该能感受到「画质一致性」的含义。光影效果、细节呈现、色彩表现,与广角难分高下。更具透视感的视角,赋予了画面更强的冲击力。 潜望式长焦镜头,与超广角镜头的传感器尺寸相同,均为 1/2 英寸,不过像素从 4800 万提升到了 6400 万。这也是迄今为止,折叠屏手机里配置最豪华的长焦镜头。 ▲长焦镜头拍摄 高像素带来了一个好处,Find N3 可「凭空」分裂出一颗 6 倍的超长焦镜头。你可以拍出更具空间压缩感的画面,细节表现依旧出色。 ▲同一机位,6X(左)与 3X(右)镜头的区别 除了三摄高度接近的成像质量,以及样张中已经呈现出来的正确的光影关系,Find N3 的哈苏人像模式,也是一大亮点。 OPPO 把完整的图像算法,导入人像算法里,也就是说两套算法同步在数字底片阶段进行,避免「塑料感」的计算痕迹。所以你可以看到,无论主摄还是长焦,虚化效果都以假乱真传统相机。 ▲使用人像模式拍摄 在这几天的体验中,我已经习惯于将人像模式,作为默认的拍摄模式。这就是计算摄影、计算光影的魅力所在,不管你是摄影小白还是老玩家,都能找到乐趣。 另一个乐趣,在于回看照片。在你按下快门的瞬间,Find N3 的超光影图像引擎会快速标定、计算画面的明暗关系,生成高精度的 HDR 显示效果。 进入相册,照片下方会有一个 ProXDR 按钮。你可以通过点按它,来体验高动态显示的妙处。Find N3 的 7.8 英寸高素质内屏,是回看照片的绝佳载体,这是折叠屏带来的独特体验。 可惜的是,由于实时计算量过大,人像模式拍摄的照片,目前还无法通过 ProXDR 格式显示。另外它目前只能在本地相册里查看,无法在社交软件上呈现。这需要整个行业努力,一起建立标准。 单从拍照体验来说,你可以将它视作折叠形态的 Find X6。同样是影像旗舰,只是 Find N3 恰好是折叠形态。而折叠旗舰,也理应是影像旗舰。 你从未见过的交互效率 过去四年,折叠屏手机越来越轻薄、强大、可靠。但硬件的成熟,也成了软件系统进步迟缓的遮羞布。 艾瑞咨询上周发布的一则调研报告显示,62.6% 的折叠屏用户期待硬件有所创新,而期盼软件创新的用户,高达 97.6%。 大屏适配、分屏操作的传统叙事,你我已经在各种发布会上听腻了。折叠屏的交互,究竟还有什么可能性?OPPO Find N3 带来了一些意料之外的功能。 最亮眼的,当属「超视野全景虚拟屏」。听起来,有点像 VR 之类的虚拟交互,实际上是非常直观、实用,上手就会的多应用分屏功能。 这个功能的亮点有三。首先是分屏成功率,不受应用适配的限制。在 OPPO 自研的框架下,几乎每一个应用都可以进入分屏状态使用。如果你想,甚至可以同屏运行三个游戏,同时刷怪、做任务。 更有意思的是,它让分屏操作,脱离了屏幕物理尺寸的限制。 传统的应用分屏,直板机没折叠屏体验好,折叠屏没笔记本体验好。囿于屏幕尺寸,分屏时应用相互挤压,导致内容显示不全,阅读、操作不便。 Find N3 用一种非常新颖的交互逻辑,解决了这个问题。你可以想象 Find N3 屏幕后面,有一张大约 15 英寸的幕布,同时打开三个应用时,它们能以多种排列方式,铺在这张幕布上。 而物理意义上,其 7.1 英寸的内屏,就是你观察这张幕布的窗口。窗口会展示你当前优先级最高的 1-2 个应用,候场的应用只会露出一个边角,点击就可以将窗口移动过去,让它上场。 举个例子会更直观。比如我习惯同时打开小红书、高德地图,用小红书找广州最近有哪些好逛、出片的地方,用高德地图来查看离我有多远。 将两个应用,同时拉伸至全屏模式。我可以边看图片,边看文字介绍。如果有感兴趣的,点一下在旁边候场的高德地图,就能以更大的视野查看路线,简单便捷。 又或者,同时打开飞书、浏览器、微信,改稿、查资料、回复微信,操作起来行云流水。相比直板手机滑动导航条切换应用,或者传统折叠屏简单分屏,效率高下立见。 第三个亮点,是你可以将自己习惯的多屏组合方案,保存到桌面上,相当于 DIY 出超级应用,一键进入工作、娱乐等模式里。 OPPO 首席产品官刘作虎在 2021 年 Find N 发布前夕,写过这么一段产品心得: 智能手机还有什么好期待的?是所有品牌和产品人正在探索的命题。屏幕是智能手机进化的起点,当每个人的口袋里都有一台形态、配置趋同的手机时,我们似乎又回到同一起点。如果我们可以「真正」突破屏幕尺寸的边界,现在的效率和交互体验将再次被颠覆。 这段话,似乎是「超视野全景虚拟屏」的超前预告。折叠形态突破了口袋能装下的屏幕尺寸边界,而这套交互超越了折叠屏的物理尺寸边界。 之所以重墨于 Find N3 的系统,是因为其团队在系统上的用心程度,丝毫不亚于影像。这一点从开机激活界面就能看出,界面左侧新增导航栏,你能看到自己当前所处的步骤。 Find N3 的 20 多个原生应用,都重新梳理了页面的层级关系。例如相册,对比 Find N2,你可以在 Find N3 左侧的导航栏,迅速切换相簿、找到你想要的照片。 ▲左为 Find N3,右为 Find N2 另外你应该已经发现,Find N3 的底部多了一行任务栏,你可以把自己最高频的应用拖进来,方便你快速启动或切换。如果觉得碍眼,你可以长按空白处隐藏它,长按手势指示条再次呼出。 任务栏最左边的图标,是新增的应用库。所有应用可按照字母、使用频率、安装时间排序,可快速定位打开。长按应用,则能以浮窗或分屏形式呈现。 应用库的右边,则是「文件任意门」,会自动收纳你最近使用的图片、文档等资料。神奇的是,你可以直接在 Find N3 上预览 Keynote、Pages、CAD、Markdown 等格式的文件,相当于破了各生态之间的壁垒。 需要注意,苹果、Windows 等生态的专有格式文件,在 Find N3 上只能预览查看,无法编辑,更适合应急办公、协作的场景。 这么一套组合拳下来,Find N3 的系统交互,让折叠形态变得更有意义。产品的逻辑,从「折叠屏需要更好的系统」,变成「更高效的系统需要折叠屏来承载」。它不只是一台大手机,更像一台小电脑。 从优秀,到优异 尽管 Find N3 从外观到系统,都与 N2 差异甚大,但两者本质上是一脉相承的。 2018 年 4 月,Find N 第一代原型机在 OPPO 内部诞生。之所以 2021 年才面世,是因为产品部门希望打磨成熟,再推向市场。刘作虎曾透露,在此过程中,Find N 坚持两个基本点:一是好看,二是好用。 前两代 Find N 小巧、圆润,关键词是可爱。而 Find N3 硬朗、凌厉,关键词是大气。虽然风格不同,但两者的设计观感,都满足了「好看」的基本点。 有几个细节值得留意,千山绿和日志金的后盖为玻璃材质。潜航黑与典藏版,则是素皮材质。玻璃比素皮重了约 6g,如果你对手感要求严苛,建议选择轻至 239g 的素皮版。 ▲ 左为千山绿,右为典藏版 玻璃与素皮版的另一个区别,是摄像头圆环的材质。前者使用整块玻璃,先切割后抛光,一体化更强。后者则使用钛合金锻造,轻盈坚固。 另外,Find N3 的外屏采用了超瓷晶玻璃,比前代更抗摔,但边缘不再是曲面处理。猜测是为了提升超瓷晶玻璃的生产良率和抗摔性能。 第二个基本点——「好用」方面,或许无需多言了。上文介绍的影像与系统体验,足以看出 Find N3 的优势。 如果你是影音、游戏爱好者,那么 Find N3 内外一致的屏幕素质、支持空间音频的四扬声器、高通骁龙 8 Gen 2 与标配 12GB 大内存等旗舰配置,也能有突出的体验。 比较遗憾的是,它为了轻薄舍弃了无线充电。67W 的有线快充,实测 45 分钟左右可将电池从 0 充至 100%。 对于 Find N3 的团队而言,「好用」不仅是用着省心、舒心、开心,还得用着安心。这就是为什么,Find N3 新增了一颗「国密认证安全芯片」。 它有什么用呢?简单来说,就是从硬件层面,保护你的指纹、人脸数据,以及手机里的加密文件。如果手机不幸丢失,它能防止被破解或篡改,支持机主远程锁定或抹除信息。 有两个更显性的安全功能,分别是隐私通话模式,和隐私打码 2.0。前者依靠双振膜发声单元,减少通话漏音的可能。后者则可以在相册中,使用马赛克功能,一键 AI 识别截图中的个人信息,并模糊处理。 典藏版更进一步,增加「VIP 模式」,只需拨动机身侧面的三段式开关即可进入。打开后,手机的摄像头、麦克风、定位等敏感权限将全部禁用。 在某些可能涉及到机密的会议或场地,打开这个模式,可以从根本上避免流氓软件窃听或调取隐私信息。它不会是多数用户的常用功能,但一定是少数群体的刚需功能。 这也是为什么,万科创始人王石会成为 Find N3 的首批用户之一。如果你是商业领袖、证券经理、机关单位要职人员等,对隐私安全有强需求的群体,它可视作你的隐形金钟罩。 ▲Find N3 发布前,网上广为流传的「谍照」 回望 Find N 的三代产品,从初代的新鲜、青涩,到二代的完善、成熟,再到三代的强悍、超前,Find N 的初心——「发现一种新可能」,得到了回叩。 Find N 产品线,也由此完成了从「优秀」到「优异」的蜕变:基础体验做到一流的同时,在影像、系统交互和安全上,又独树一帜。 再回到两年前刘作虎的灵魂拷问:智能手机还有什么好期待的?相信你已有新的答案。
引入三方财务审计,水滴筹单季度亏损超6000万
凤凰网科技讯 10月19日,为进一步提升资金透明度,2023年9月,水滴公司委托大华会计师事务所对水滴筹业务进行专项财务审计,对营业收入、成本费用及营业利润等进行复核、评估分析。审计报告结果显示,水滴筹的整体营业利润为负,单季度亏损额超过六千万。而根据水滴公司的财报数据显示,2023年第二季度水滴筹亏损额为6413万。 据大华财务审计报告显示,水滴筹业务板块营业成本及费用主要由运营成本和研发成本构成,其中运营成本主要包括人力成本、房租办公成本、管理费用等。人力成本主要包括顾问团队、技术团队、医疗信息鉴定、真实性审查团队等。而水滴筹的研发成本主要为平台运营产生的服务器使用和云存储费用以及新技术开发费用。 水滴筹业务负责人表示:“水滴筹上线以来一直亏损,是由水滴公司保险、医药创新等业务收入进行补贴。为了守护百万求助家庭的希望,我们持续加大对水滴筹的投入,多业务的协同保障了水滴筹这一非盈利业务的可持续发展。” 据透露,水滴筹还将面向社会招募“平台监督员”,邀请更多公众参与业务规则研讨及资金审核,可以随机抽查任何一笔筹款的费用明细,对筹款全流程进行监督。“平台监督员”已开启招募,每隔半年进行重新选举。
百度智能云生态新局:打造国内首个AI原生应用“交易中心”
作者 | 程茜 编辑 | 漠影 想要完全弄懂一份上百页的财务报表,对企业进行盈利分析,给出企业经营优化的解决方案,一套流程结束往往需要花费分析师十几天时间,现在通过一个智能助手,不到3分钟就可以分析出财报反应的关键要点。 这一基于百度智能云千帆大模型平台构建的AI原生应用,还能通过一个应用商店被其他企业购买使用。 这正是大模型时代,AI原生应用爆发前夕,百度智能云所做的前瞻性探索。 百度智能云建设并推出了国内首个大模型全链路生态支持体系,并为10家综合伙伴、100家应用伙伴、1万家以上的初创企业以及代理伙伴,提供包括千帆社区、AI原生应用孵化、销售商机、市场营销、赋能培训,以及千帆AI原生应用商店等全方位支持。 这也是百度在已有广泛采用的千帆大模型平台等技术支持之外,为各类型行业合作伙伴打造的全链路、一体化AI原生应用商业化底座。 基于大模型理解、生成、逻辑和记忆能力开发出来的AI原生应用,已成为大模型时代真正规模化落地的有效探索之一,大模型、应用、用户之间应形成正向动态循环,才能使得这一产业的生态模式逐渐成熟。 一、财务、招聘领域优质应用已落地,供需双方亟需信息共享平台 开篇提到的智能助手,就是今年8月金蝶和百度智能云合作打造的智能助手金蝶云·苍穹GPT。 这一智能助手正在重塑企业财务分析的流程,专业财务人员长达十余天的工作量被缩减到几分钟内完成。苍穹GPT基于百度智能云千帆平台构建,在财务的费用报销、往来资产、成本、资金等方面都有应用。 例如在企业经营情况分析的应用中,苍穹GPT能针对企业的财务报表生成对其盈利能力的分析报告,涵盖业务收入、利润总额、主要分析指标等多项指标,找到企业经营存在“现金流低”的问题,追根溯源找到相应的解决方案,也就是“销售回款率低”。 不过这一流程并没有结束,苍穹GPT还会综合财务报告、经营问题分析等给出针对性的解决方案,找对应销售方催收。同时,这一智能助手还会智能撰写邮件、添加合同附件、定时发送。 一套完整的账款催收工作流就轻松搞定了,财务管理中的实际工作场景通过AI打开无限想象空间。 招聘领域也是如此。软通动力每年需要解决10万个人力需求,审核和分析200万份简历,同时一年要超过70万场面试,拥有3000名招聘顾问。这一个个庞大的数字背后巨大的工作量,此前都要通过人工完成。 基于百度智能云千帆大模型平台,软通动力推出面向中小企业的智能招聘系统梧桐招聘,在岗位需求分析、简历筛选、面试辅助等环节,就能为企业提供智能化招聘服务。没有经过专业培训的招聘顾问可以通过大模型生成的面试题,快速掌握面试情况,化身专业的面试官。在这一工具的加持下,软通动力使得面试流程平均等待时间缩短60%以上,综合面试通过率提升30%左右。 优质的AI原生应用诞生后,下一个关键环节就是进入市场、落地应用、得到真实反馈。然而各类应用四散在场上,供给方和需求方之间没有平台互通消息,为其商业化进程的动态流转按下了减速按钮。 基于这一背景,百度智能云千帆AI原生应用商店将金蝶云苍穹GPT、梧桐招聘等诸多优质AI原生应用纳入其中,成为供需双方的交易平台。 二、行业玩家+创企的“培训班”,打破AI原生应用市场信息壁垒 百度智能云千帆AI原生应用商店类似于手机应用商店,在展示不同AI原生应用种类的同时,还提供商品交易渠道。 具体来看,千帆AI原生应用商店目前设置了智能办公、营销服务、行业智能、生产提效、分析决策五大不同类型的分类。首页上方有搜索框,企业也可以有针对性地选择特定应用。在应用页面,企业还能快速了解AI原生应用到价格、交付方式等 ▲AI原生应用商店部分应用 这一商店不仅可以提高企业选型和采购方面的效率,应用厂商也能快速将应用推向市场,成为大模型商业机会的汇集地。 拆解来看就是这一应用商店背后承载的两大价值。 百度智能云渠道生态部总经理陈之若谈道,大模型时代正处于快速迭代期,大量应用如雨后春笋般慢慢冒尖,需求方企业与AI原生应用供应方之间可能存在信息交互壁垒。AI原生应用商店中承载了百度及其合作伙伴已开发的应用,让大模型供应方与需求方能认知市场上已有的AI原生应用,这也是商店解决的第一个问题。 第二件事在于,第一批冲在产业变革前线、开发AI原生应用的人,强大综合技术实力的竞争对手入局、产品价值、市场反馈效率等都是其能否长久屹立于产业浪潮下的隐忧。 因此,陈之若说,AI原生应用商店承载的另一个能力,就是让市场帮助他们检验产品。最关键的就是“当你做出这样一款AI原生应用,到底有没有终端的消费者、终端的客户来买单,有人愿意为此而付钱,有人愿意为此而尝试”。如果答案是肯定的,就证明了其产品背后有实际市场需求作支撑。 总的来看,AI原生应用商店就是让需求方企业找到优质AI原生应用,试用后给出反馈,供给方企业继续优化迭代,从而使应用更贴近解决行业的真正痛点。 在百度智能云产业发展部总经理段永华看来,今天,AI原生应用商店的发展可能还是从零到一的过程,可能三到五年之后,成千上万的应用会充斥人们生活的方方面面。 回头来看,除了金蝶、软通这类有丰富行业应用的企业,打造AI原生应用还有一类重要玩家就是初创企业。初创企业在资金、市场、技术资源上的优势都不明显,因此其在打造AI原生应用,并成功推向市场的需求就有所不同。 基于此,百度智能云落地了“AI加速器”项目,帮助企业快速对大模型产业有全面、清晰的认知。段永华谈道,例如告诉开发者大模型是什么、能做什么、不能做什么;不同场景里应用大模型的合理方式是什么;如何最大化提升效力,降低成本等。 基于AI加速器,企业可以获得千帆大模型平台产品、工具链、范式培训,资深专家全程辅导等,据了解,AI 加速器累计吸引了全球共 57 家创新企业的参与,共同开发出22个商业化AI原生应用。 此外,AI加速器项目还有包括有北大智能所、清华互联网产业研究院、赛迪等顶尖的科研院所,创业黑马、爱分析等为创业者提供全方位服务的企服平台,还有产业园区和众多知名投资机构,共同为加速器成员企业提供从产品、技术培训到资本赋能、市场推广等一站式全方位支持, 段永华说:“应用厂商变成这个时代场上聚光灯下的最重要角色。”如何让他们构建的出好的应用,并真正在市场上流转起来,为商业化铺平道路,正是百度智能云大模型生态构建的意义所在。 三、大模型全链路生态支持体系,百度智能云先行一步 千帆AI原生应用商店、AI加速器等都是百度智能云推动行业繁荣的探索。 AIGC产业兴起之后,大模型玩家正在迈过秀我有和我强的阶段,基于大模型能力构建的AI原生应用去解决更多行业问题成为下一步的发展重点和价值所在。 百度智能云千帆大模型平台已经成为大模型时代的“超级工厂”,据了解,百度智能云千帆大模型服务平台已服务17000多家客户,覆盖近500个场景。 这背后的前瞻性思考就是,云计算厂商如何推动大模型真正规模化落地?基于百度智能云与各赛道玩家的合作经验,国内首个大模型全链路生态支持体系诞生了。 在技术支撑体系之外,百度智能云正在筑起AI原生应用商业化生态护城河,不论初创或具有行业应用经验的企业,还是AI原生应用供需双方都能在这一生态之上满足自己的需求。 百度智能云大模型全链路生态支持体系包含前述提到的AI原生应用商店和AI加速器,以及大模型实训营千帆AGI House、销售商机开放支持、市场营销支持等。 比如,业内首个大模型实训营千帆AGI House可以帮助投身于大模型发展浪潮中的企业,搞清技术发展方向、产品设计路线、客户具体需求,目前这一培训营已经覆盖北京、上海、深圳等城市的57家企业伙伴、130多位技术骨干。 还包括销售商机开放支持、市场营销支持、交流平台等。让更多AI原生应用在市场上的曝光率、触达客户的机率都大大提高。 从理解产品、打造产品到商业化,百度智能云正在为企业打造一站式、全方位的服务体系。 结语:AI原生应用爆发前夕,云厂商构筑生态护城河 大模型时代蓬勃发展,基础大模型之间的竞争仍然风起云涌,各类AI原生应用层出不穷,不同行业的头部玩家、初创企业都躬身入局,想要这些基于大模型能力构架的应用去解决更多行业问题。 但当下仍处于AI原生应用的探索期,需求与已诞生的相关应用之间信息不对等,第一批打造原生应用的企业很难快速验证自己产品的市场价值,无法快速变现,支撑其继续发展。 在众多参与者投身其中之际,百度智能云先行一步,不仅满足合作伙伴用上大模型、用好大模型的需求,还看到了AI原生应用下一步商业化存在的问题,“大模型全链路生态支持体系”构建的价值也正在于此。 基于百度智能云此前与大模型产业各类型企业的合作经验,以及自身持有的丰富资源,率先构建起了AI原生应用爆发前夕坚实的生态底座。
OPPO Find N3真机首发体验!地表最强拍照折叠屏?分屏操作颠覆安卓底层
作者 | 云鹏 编辑 | 心缘 智东西10月19日报道,刚刚OPPO正式发布了新一代旗舰折叠屏手机新品OPPO Find N3系列,其传感器首次采用了折叠像素技术,感光能力翻倍,同时Find N3支持打开各类专业文件类型以及苹果生态文件,分屏功能可以直接“全屏”呈现应用,分屏办公体验有直观提升。 售价方面,OPPO Find N3标准版售价9999元,典藏版售价12999元。 智东西第一时间对OPPO Find N3进行了真机上手体验,Find N3有哪些最直观的升级,发布会上的新特性实际用起来怎么样,智东西马上带你一文看尽。 一、整机质感提升,通过100万次折叠测试,屏幕峰值亮度2800尼特 这次OPPO Find N3的外观设计比较有特点,机身采用了平直金属中框,较为硬朗。 镜头模组有着浓郁的“OPPO风格”,辨识度较高。 整体来说,OPPO Find N3机身的上手质感是不错的,细节做工比较考究。 同时,OPPO Find N3的手感也比较轻薄,单面厚度做到了5.8毫米,整机重量为239克。 OPPO Find N3标准版总共有绿色、金色和黑色三种配色,黑色为素皮版。 ▲标准版三种配色 典藏版多了一种深红配色,为素皮版。 ▲OPPO Find N3典藏版 OPPO Find N3这块屏幕尺寸为7.8英寸,峰值亮度可以达到2800尼特,观感是比较通透的。 值得一提的是,在折叠耐久度方面,OPPO Find N3通过了德国莱茵TÜV的100万次折叠测试,足够普通用户大概用至少10年。 二、折叠机影像看齐旗舰,首发“折叠像素”技术 这次OPPO Find N3在影像方面做了重要升级,力求追平直板影像旗舰机。 OPPO Find N3采用了折叠像素技术,将传感器不可感光的电路进行折叠,提升了单个像素的可感光面积,传感器的感光能力是同尺寸传感器的2倍,据称极限动态范围最高可以提升至355%。 ▲现场用OPPO Find N3实际拍摄 据称OPPO Find N3的潜望式长焦传感器面积进一步提升,据称感光能力可以达到其他折叠屏的3.9倍。 从实际拍摄成片来看,OPPO Find N3画面的色彩风格还是比较明显的。 人像模式下拍出的人像照片不需要任何处理就可以具有比较不错的质感。 ▲现场用OPPO Find N3实际拍摄 模特面部的肤质也可以有比较好的还原。 ▲现场用OPPO Find N3实际拍摄 同时在一些特写镜头下,不论是静物还是人像拍摄,光影效果的呈现都令人印象深刻。 ▲现场用OPPO Find N3实际拍摄 三、折叠屏软件体验秀出新玩法,打破安卓苹果生态壁垒,分屏体验思路创新 这次OPPO在Find N3上推出了不少软件应用层面的新功能。比如文件随心开功能,可以支持CAD等40多种文件类型,甚至可以打开Windows不支持的Keynote、Pages和Numbers等苹果生态文件格式。 OPPO Find N3这次首发了随身工作台功能,不论用户使用的是Mac电脑、iPad 还是iPhone,都可以比较方便地与OPPO手机互相传输文件、管理资料,这对于多生态用户来说无疑是显著提升体验的一项功能。 此外,OPPO Find N3这次加入了文件任意门功能,所有保存到手机的重要文件、图片,都会归拢到一处,方便查找。如果想要分享,用户可以从任意门里直接把文件拖到对应应用里,这对于提升移动生态中文件管理和分享的效率来说,作用很明显。 我为什么要用一台折叠屏?这是很多普通用户在购买折叠屏手机前的一个疑问,折叠屏到底能够给我带来什么样的独特使用体验,今天,OPPO给出了不一样的答案。 折叠屏的屏幕很“大”,如何利用好这块大屏是每家厂商都在思考的问题。 这次OPPO Find N3上首发了“全景虚拟屏”,跟过去折叠屏手机的分屏思路可以说完全不同。 分屏的应用每次在单独使用时,都会以几乎全屏的形式呈现,展现面积有显著提升,切换起来也较为流畅,对于不少商务人士来说,这一功能具有较强的实用性。 这种独特的折叠屏多应用使用体验,从某种程度上来说已经接近PC端的多应用使用体验。 最后值得一提的是,OPPO Find N3此次搭载了独立安全芯片,可以提供硬件级加密的安全性,对于各类智能化处理中涉及到的数据隐私安全保护问题,可以进行很好的处理。 ▲开启VIP模式 当然,对于一些基础的大屏应用适配,OPPO Find N3都已经做的较为完善了,可以说是“基本功扎实”。 ▲微博App ▲哔哩哔哩App ▲抖音App 结语:硬件不留短板除去顾虑,软件交互新玩法带来价值 折叠屏手机经历了多年发展,如今形态已经相对成熟,越来越多的消费者开始接触到折叠屏产品,OPPO Find N3此次的升级,在硬件层面补齐了影像短板,看齐直板旗舰,同时软件交互方面通过新功能带来了新体验,让折叠屏有了区别于直板机的使用价值,增加用户的换机欲望。 此次9999元的定价,也表明了OPPO对其旗舰的定位,今天产品中的一系列功能创新,也离不开OPPO软硬件底层自研技术的加持。 在当下竞争愈发激烈的智能手机市场,折叠屏成为厂商们冲击高端市场的一种产品路径,在苹果正式入场前,安卓玩家们还能在折叠屏赛道中带来怎样的新玩法、新思路,都值得期待。
OpenAI图像检测工具曝光,CTO:AI生成的99%都能认出
丰色 发自 凹非寺 OpenAI要出手AI图像识别了。 最新消息,他们公司正在开发一种检测工具。 根据首席技术官Mira Murat透露: 该工具精度非常高,正确率可达99%。 目前已进入内部测试流程中,很快将公开发布。 不得不说,这个准确率还是让人有点期待的,毕竟之前OpenAI在AI文本检测上的努力可是以“26%的正确率”惨败告终。 AI内容检测,不简单 OpenAI在AI内容检测领域早有布局。 今年1月,他们就发布过一款AI文本检测器,用于区分AI和人类生成的内容,防止AI文本被滥用。 然而7月份该工具就黯然退场:没有任何公告,页面直接404。 究其原因,还是正确率太低了,“和瞎猜差不多”。 根据OpenAI自己公布的数据: 它只能正确识别26%的AI生成文本,同时冤枉9%的人类编写文本。 在此次匆忙收场之后,OpenAI表示会吸收用户反馈努力改善,并研究更有效的文本来源技术。 同时,他们还宣布:判断图片、音视频是否由AI生成的工具也要搞起来。 如今,随着DALL-E 3的问世以及Midjourney等同类工具的不断迭代,AI绘画能力越来越强。 最大的担忧就是用于伪造全球范围内的假新闻图片。 比如reddit上就有一张AI伪造的“2001年卡斯卡迪亚9.1级地震及海啸”的“现场”,超过1.2k网友点赞。 相比AI文本检测工具,AI画图检测工具的开发显然更为紧迫(大概是因为“没人在意演讲稿是自己写的还是秘书写的”,但“有图有真相”的内容很难不让一些人相信)。 不过,正如OpenAI的AI文本检测工具下线时,有网友就指出: 同时开发生成和检测工具本身就是矛盾的。 如果一边做的好就意味着另一边没做好,同时还有可能存在利益冲突。 比较直接的思路是交给第三方。 但此前第三方在AI文本上的表现也并不好。 而就技术本身来说,另一个还算可行的办法是在AI生成内容之时就藏下水印。 谷歌就是这么做的。 日前(今年8月底),谷歌已经在OpenAI之前推出了一款AI图片检测技术: SynthID。 它目前与谷歌的文生图模型Imagen合作,让模型生成的每一张图像都嵌入一个“这是AI生成的的元数据标识”—— 即使图像被进行了裁剪、添加滤镜、更改颜色甚至有损压缩等一系列修改,也不会影响识别。 在内部测试中,SynthID准确识别出了大量经过编辑的AI图像,但具体的准确率并未透露。 不知道OpenAI即将发布的工具将采用何种技术,并且能否成为市面上精度最高的那一个。 奥特曼回应“造芯计划” 以上消息源自于OpenAI CTO与奥特曼本周在《华尔街日报》举行的Tech Live会议上发表的讲话。 会上,俩人还透露了OpenAI的更多消息。 比如下一代大模型可能就快推出了。 叫啥没透露,但今年7月OpenAI确实就已经申请了GPT-5商标。 有人关心“GPT-5”的准确性,问它是否能够不会再产生错误或虚假内容。 对此,CTO的态度比较谨慎,只是表示“maybe”。 她解释道: 我们在GPT-4的幻觉问题上取得了很大进展,但这还没有达到我们需要的目标。 奥特曼则谈及了“造芯计划”。 从他的原话来看,并没有“实锤”,但也留下了无限遐想空间: 如果按照默认路径我们肯定不会这么做,但我永远不会排除这种可能性。 相比“造芯计划”,奥特曼对于造手机传言则回复得相当干脆。 今年9月,苹果前首席设计官Jony Ive(在苹果工作了27年)被曝与OpenAI接洽,有消息人士称奥特曼要开发一种硬件设备,提供一种与AI交互更自然和直观的方式,可称为“AI届的iPhone”。 现在,他告诉大伙: 我自己都还不确定要做什么呢,只是有一些模糊的想法。 以及: 任何AI设备都不会盖过iPhone的受欢迎程度,我也没有兴趣与任何智能手机展开竞争。
新商务、强影像的折叠旗舰机,OPPO发布Find N3
凤凰网科技讯 10月19日,OPPO在北京召开发布会,发布了全新一代旗舰Find N3,从影像、效率、安全三方面,推动折叠屏技术发展,带来新商务折叠旗舰。在发布会现场,OPPO首席产品官刘作虎表示:“全新一代Find N3让最强影像首次登陆轻薄折叠大屏,面向移动新商务的浪潮提供了效率的革命。 OPPO Find N3 标准版(12GB+512GB)售价9999元;同时发布的OPPO首个典藏版手机,OPPO Find N3 典藏版(16GB+1TB,尊享VIP模式),售价12999元,除潜航黑,还带来典藏版专属配色赤壁丹霞。还有官方保护套装,售价199元。 目前,Find N3搭载专为折叠屏打造的全新ColorOS系统,从单应用适配、多任务处理,到系统级操作,彻底重构大屏交互,以电脑桌面级的高效,为下一代折叠屏手机带来移动的二次革命。其中,Find N3 提供最彻底的大屏应用适配,包括对超过 20 个原生应用与界面的重制,从开机,到常用的电话、日历、邮件等应用都提供专属的折叠大屏交互。此外,OPPO 与腾讯新闻、有道云笔记、小红书、钉钉、剪映、同花顺等众多APP达成深度定制合作,为 Find N3 带来 TOP 3K 应用适配率 85% 的高密度适配。 同时,内外都是超视网膜显示,应用开合都不变样,唯一同时支持智能色温和高频PWM的护眼屏,具有430级别ppi 、内外屏120Hz自由动态刷新率、内外屏1440Hz PWM调光、10bit色深、100% P3色域覆盖、HDR10+认证、多亮度色彩校准、支持全局色彩管理。 与此同时,通过云川架构,Find N3为7.8英寸大屏带来了超越屏幕物理边界的15寸虚拟视野,让折叠屏第一次满足三个应用以全尺寸显示和操作,同时将传统分屏50% 左右的成功率跃升至99%以上,让每个正在处理中的任务都能更充分地利用大屏的大视野,极大地改变大屏多任务的使用体验。 Find N3通过创新的全局任务栏和文件任意门,Find N3 可以快速实现文件的检索、拖拽与分享。利用全新的文件随心开功能,Find N3 首次打破安卓系统与 苹果、Windows的生态次元壁,能够快速查阅keynote、pages、numbers、CAD、markdown 等格式的文档。 在安全方面,OPPO 基于最高国密认证安全芯片,构建更领先的三层安全控制架构,从硬件底层安全、到数据安全,再到最关键的支付应用安全,为用户提供最强隐私保护芯片锁等多层次的安全保护体验。 影像硬件参数如下: 配备6400万像素超光感潜望长焦镜头,1/2英寸底、像素尺寸0.7 um、支持光学防抖; 配备4800万像素折叠像素广角镜头,1/1.43英寸底、单像素尺寸1.12um、支持光学防抖; 配备4800万像素超广角镜头,1/2英寸底、像素尺寸为0.8um,广角度数为114°。 值得一提的是,在今天的发布会上,OPPO 还发布为高端新商务人群打造的 Find N3 典藏版,通过国密认证安全芯片的加密防护以及三段式物理按键的控制,商务人群第一次可以快速管理麦克风等隐私权限并明确掌控隐私管理状态,从容应对高端会谈等关键商务场合。 Find N3搭载4805mAh电池和67W超级闪充,提供超长续航。Find N3还搭载独立安全芯片,提供远超软件级加密的安全性。Find N3还有独创的多扬声器系统,配合独家空间音频技术,第二代逆向声场通话技术,保证Find N3通话隐私不泄露。 同时,Find N3还拥有国密认证安全芯片,安全方案通过CC EAL5+级安全认证,是当前最高等级的安全解决方案,推动个人隐私安全从被动到主动,更明确地让新商务群体掌控自己的隐私数据。 Find N3、Find N3典藏版已即刻开启全平台预定,将于10月27日10:00全面开售。发布会上宣告「可靠折叠,只选OPPO」的品质保证后,OPPO Find N3全系(含Find N3 Flip)首次推出「折叠无忧换新,180天内只换不修」的首销限定活动,10月19日-11月2日购买新品的用户均可享受。其他首销权益还包括:最高24期分期免息,最高2300元以旧换新补贴,屏碎保和OPPO Care+保障服务等。
小米澎湃 OS 要来了,MIUI 十三年留下了什么?
2020 年 8 月 11 号晚,小米十周年的公开演讲,雷军在近 3 个小时的演讲里回顾了过去 10 年的热血岁月,也展望了下一个 10 年的澎湃征程。 他用「一往无前,致敬过去、现在、未来每一位不惧考验,选择「向前」的人」作为了本次演讲的主题,也用这句话告知了所有以他为榜样的年轻人,雷军还是当年那个热血澎湃的创业者。 那天晚上,搭载 MIUI 12 的 Xiaomi 10 Ultra 也随着激情的演讲震撼发布,手机系列号「10」呼应着小米成立的时长,5299 的起售价也代表着小米正式向 5000 元以上的高端手机市场进军。 这场高端机之战并不顺利,一路的磕磕绊绊和各界的指指点点,终于在三年后拿出 Xiaomi 13 Ultra ,才算是在高价市场中,稳住了自己的地位,也让大家看到,小米不仅有百姓「性价比」,更能拿出国产「高端机」。 细细梳理小米的 13 年,「顺利」「平稳」从来都不是粮厂的代名词,「跌荡」「挫折」才是小米发展的主旋律。而正是这一路的颠沛流离,才有了雷军在 17 号微博里的激动不已。 2023 年 10 月 17 号,雷军发文称「Xiaomi Hyper OS」封装完毕,即将启用。 全新的小米系统将「以人为中心,打造人车家全生态操作系统」,小米的全生态链会随着下一代搭载小米澎湃 OS 的新机,正式闭环。 为了打造这个生态宇宙,雷军和他的小米整整准备了 13 年,这 583 个字的微博背后,是 13 代机型、14 代系统和上百件生态产品十多载的迭代。 始于粥,成于米 —— MIUI V1 – MIUI V3 故事是从一碗粥和一个系统开始的。 2010 年以前,国内手机市场面临三个问题: – 国际手机巨头的高价垄断 – Android 原生系统的反人类设计 – 国产山寨机横行市场 那时已经在金山功成名就的雷军,不服气这样的市场现状,抱着「做全球最好的手机」的愿景,40 岁的雷军从零开始「三十次顾茅庐」后组建了十来个人的小团队,在 2010 年正式开启了十多年的国产手机的征程。 技术出身的雷军,再加上初创团队的资金短缺,所以这个小团队的解题思路,是从最拿手的软件开始。 将手机系统中最基本的「电话」「短信」「通讯录」「桌面」四大功能进行重组,针对 Android 原生系统「耗电快」和「用户隐私危机」的两大缺陷对症下药。 仅仅两个月后,MIUI 第一版问世,不过第一批上手的用户是通过招募来的 100 位志愿者。 9 月 20 号,传到国外的初代系统受到了国际论坛大佬的极力推荐,快速且流畅的操作和全新设计的界面成为了雷军初代作品出圈的根本原因。 之后的半年里,MIUI 进行了三次大的版本更新。从 V1 的基本功能奠基,到 V2 里音乐、网盘、文件管理的软件优化。 再到 V3 系统中引入的 MAML 语言和 MORE 渲染引擎,初创团队将所有手机系统的基本操作都加以完善,也开始极大程度地区别开其他品牌的系统风格。 其中用户感受最深的就是 V3 系统中的可自由定制的「桌面」和「主题」,这也对今后小米的发展,产生了深远的影响。 一次工作之余的午餐,看着手里端着的小米粥,「小米」这个公司名就这样定了下来。 「小」为普通,「米」为必备,小米意味着普通人生活中的必备品,而把小米的 logo 倒过来看,就是「心」字少了一点,意味着「省一点心」。这一切,都是那么的刚刚好。 MIUI V3 推送的 2011 年,Xiaomi 1 正式发布,基于 MIUI 打下的良好口碑,小米在 8 月 16 号的首次发布会备受关注,那天的北京 798 艺术区座无虚席,以至于雷军是以道歉开场的。 从现在看,这场发布会是足以载入中国手机发展史的一次盛会。1999 的发售价格,将当时已经泛滥成灾的山寨机市场从根源搅乱,中国手机的发展,开始向正规化和规模化迈进。 而小米这家国产手机厂商,也开启了它的奋斗征程,并在不久的将来,到达那个不可企及的顶峰。 三板斧,定乾坤 —— MIUI V4 – MIUI 6 雷军在成立公司之前,就已经确定了小米的发展路线,他自己称为铁人三项:「软件」「硬件」「互联网」。软件已经成为了当时国产手机的头部标杆,硬件手机在把智能机价格打下来的同时,兼具很好的日常体验。 我依稀记得当时亲戚送的 Xiaomi 2 ,舒适的握感,流畅的操作,特别是有「果冻感」的侧边按键,到现在都难以找到第二个相同的产品。 而互联网这个杀手锏,在 MIUI V4 中,开始了长远的布局。 2012 年 1 月 9 号,MIUI V4 带着互联网服务模式正式发布,音乐、视频、商城和云服务走进了小米用户的生活,「互联网 + 手机」的模式将用户和公司紧紧的绑在一起,手机不再单纯的是通讯工具,更是人们衣食住行的汇聚点。 雷军用 7 个字总结了这种模式的核心:「专注、极致、口碑、快」。 这一年,MIUI 服务的全球用户,突破 1000 万。 MIUI V4 是小米第一个正式系统编号,因此前三代开疆拓土的 V1 到 V3 才真正拥有名号。 但 V4 在 UI 设计上仍然属于探索时期的产物,拟物化和扁平化的图标设计同时出现在一个系统当中,而这种混沌感在下一代系统,确定了风格基调,成为了小米系统设计的风向标。 MIUI V5 在次年 3 月开始推送,整个操作界面颠覆了一贯的风格,也为 MIUI 的界面设计革新做好了最后的准备。 值得说的是,V5 真正的价值是在手机功能上的提升,像电话拦截和二维码分享 Wi-Fi 密码等已经刻入手机使用 DNA 的功能就是在 5 代系统上推送的。 Xiaomi 3 在这一年的 9 月 5 号发布,出生就拥有 MIUI V5 的加持,让这部外形上下方正、左右圆润的手机,不仅用 1999 的价格再次整顿了市场,也通过 App 运行权限这个新的安全设置,将用户的隐私保护,提升到了另一个维度。 而 Xiaomi 3 本身配备的夏普高素质 1080P LCD 屏幕,也是当年雷军一行人顶着核辐射,去到夏普总部谈下来的。 MIUI 如今的扁平化桌面、极简风的设计,就是从 MIUI 6 上正式确定。 6 代系统为小米做出了两件化时代的大事儿,首先确定了系统风格的发展路线,从此之后小米的系统设计多有调整,但少有大改;其次「MIUI + 数字」的命名方式从 6 代系统起,成为了日后的标准,并持续到今天。 2014 年的 MIUI 6 ,为全球 1 亿用户提供服务。 行路难,多险阻 —— MIUI 7 – MIUI 9 讲到这里,小米的发展似乎没有开头说的那样磕磕绊绊,反而是节节高升。但不经历劫难的洗礼,就永远没办法成为故事的主角,那 MIUI 7 的争议,就是小米向西取经的开端。 系统层面,MIUI 7 的发布并没有接着六代的光环乘势前行,而是沦为了众人的笑柄。 「原来更新 4 个主题也叫系统迭代」的话语成为了引爆小米口碑的导火线,人们积怨已久的小米三宗罪,被贴到了互联网的各大话题下,任人指责。 – 饥饿营销 – 广告植入 – 手机发热 其实每一点小米都能找到为自己开脱的理由: 「饥饿营销」是「只赚 5% 以内的利润」的政策所直接导致的,薄利的资金链无法承受库存积压的风险; 「广告植入」是在不增加用户购买成本的同时,实现公司长远发展的妥协之举; 「手机发烫」,骁龙的火力大家都懂,但好巧不巧,小米是众多「驯龙高手」中比较差的那一个。到现在我还记得那条僧人光膀子坐在雪地里稳如泰山的讽刺广告,因为他怀里揣着小米手机。 前四年市场的热烈反响,是对初来者的宽容,而 2015 年的口诛笔伐,是对成功者的要求。 一天能开 23 个会议的雷军在这一年重新接管了小米手机部门。 「手机行业,从来没有一家公司在销量下滑后还能逆转的」,从顶峰跌落的巨头们给雷军敲响了沉重的警钟,市场的反应也给小米下达了最后的通牒。 Xiaomi 5 的优雅外观没能逆转局势,但创办小米的雷军可以力挽狂澜。从 15 年到 16 年,新系统和新系列的诞生,让小米又看到了一线生机。 MIUI 8 在 2016 年 5 月和用户见面,这是小米系统期待已久的一次史诗级升级,「手机分身」「应用双开」「长截屏」等划时代的功能,让手机的应用拥有了更多可能。 即使在当时这些功能的适配还差强人意,但就像阿姆斯特朗在月球留下的脚印一样, 这是手机发展中迈出的一大步。 5 个月后的搭载 MIUI 8 的小米 MIX 问世,将新系统的热度,又延续了大半年。 这台销量平平但口碑爆棚的工业艺术品,扭转了「濒临破产」的小米口碑;世界三大设计博物馆收藏让世界看到了「中国设计」;同时也开启了小米冲击高端、摆脱「性价比」标签的时代,只是这条路,走了将近 7 年。 全面屏的时代由 Xiaomi MIX 拉开帷幕,MIUI 针对全面屏的系统加速也把油门踩到底了,MIUI 9 的宣传海报就已经说明了一切。 海报上的闪电是 MIUI 9 优化的核心——「快」。快速启动程序、更快的系统响应、精简的界面优化、纯粹的电话目录,让系统的操作全部从简。 更新了 MIUI 9 的 Xiaomi 6 ,带着「大道至简,为快不破」的武林秘籍,在 2017 年重回巅峰,直到今天仍有 100 多万人在使用,成了小米的「最强钉子户」。 拓边界,登顶峰——MIUI 10 – MIUI 12 九代系统完善了响应速度,为全面屏的操作系统清扫了最后的障碍,MIUI 10 则为小米在全面屏时代的软着陆,建造了最合适软件平台。 我们每天重复上百次的「上滑返回桌面」「左右滑动返回上一级」等的常规操作,就是 MIUI 10 创造整合的结果;「小爱同学」的优化,让这个不太聪明的机器人,开始有了生命,并逐渐成为了小米的重要 IP 。 2008 年,IOS 2.0 打破了键盘操作的习惯,奠定了智能手机往后 10 年的发展方向; 2018 年,MIUI 10 重新定义了全面屏手机的使用逻辑,其设计的手势操作,主导了今后所有智能手机的系统设计。 那一年的 Xiaomi 8 被戏称为 iPhone X 的孪生兄弟,同样的刘海屏、一样的竖排双摄布局,「雷布斯」的称呼,再一次被这部八代机给夯实。 虽然已经无法考证到底是否为抄袭,但日后全球的手机厂商也真的从此进入了相互「借鉴」的时期。发展到现在,如果你不是专业人士,真的很难在把手机 logo 隐去时,辨认出到底是谁家的产品。 MIUI 10 是一个幸运儿,它见证了全面屏时代的开启,也亲历了小米的上市。 2018 年 7 月 9 日,小米在港交所上市,这是雷军创业十年的难忘时刻,是小米拨开云雾的最好证明。 紧接着,次年小米入选了世界 500 强,仅用九年时间,就攀到了顶峰。 功成名就在外人看来早已完成,但在小米的期盼里,只达成了一半:功成矣,名就呼?「性价比」的标签还未撕掉,高端品牌的铸造,还在路上。 在嘚瑟 500 强达成的 2019 年,小米继续对系统进行了革新。MIUI 11 不满足于单纯的系统优化,而是将视角放在了更宏大的层面。 「跨设备互传」「投屏优化」「Mi Work 套件」的加入,让职场人的生产力工具多了一个叫小米的选择;「亲情守护」「地震预警」「万象熄屏」是让手机更深一步地嵌入人们的全场景生活中。 来年登场的 MIUI 12 ,是小米十周年庆的重要铺垫。 当时刚更新完系统,我体验最深的就是「深色模式」的升级,不同于其他厂家单纯的变黑,小米则是对全系统都做了通用的全局适配,用反色算法来改变应用界面,这样的好处是不会能让「深色」贯穿你使用手机的全过程。 再者很多用户反馈「更流畅」的感受,是因为「非线性动画」的加入,无限接近 IOS 的体验。 这并不是讽刺,而是夸奖,因为如此流畅的动画是迄今为止都有厂家做不到的效果,但 MIUI 11 和他的创造者、乔布斯的粉丝雷军,兑现了自己当年的承诺 —— 和 iPhone 一样的流畅体验。 既往矣,续终章 —— MIUI 13 – MIUI 14 一眼十载,春去秋来,MIUI 的更新也放缓了节奏,在 MIUI 11 的标语「开始 · 链接万物」表明了系统的更新开始扩大范围,逐渐蔓延到小米的全生态产品。 小米的生态做得有多好,其实从网友「小米除了手机,其他都做的很好」这句玩笑话就能看出来,当然并不是小米手机有多糟糕,只是用户对这家 500 强公司,会随着它的进步而产生更高的标准。 以手机为中心,将内容在设备之间无缝流转,电视、平板、手表、音响和所有的小米家具,都在 MIUI 13 这张大网上链接起来,我们也在不知觉中,窥探到了小米宇宙的雏形。 去年年底,MIUI 14 在人们摘下口罩的喜悦中,来到了用户的更新包里,只是没想到,这会是 MIUI 系列的封箱之作。 这次更新,覆盖了全球 10 亿用户。 以用户体验为标准的 MIUI 更新的确创造了众多好用的功能,但其代价是臃肿的系统导致了动画卡顿、操作断续,也逐渐背离了当初「非常易用」的初衷,因此雷军宣布了 MIUI 14「剃刀计划」。 – 超小系统固件 – 超小系统内存占用 – 超少不可卸载应用 共同组成了计划的内容,也同时将「卸载权」交还给了用户,从仅 8 个不可卸载的应用就能看出,小米对系统改革的决心,加上「光子引擎」的驱动,让系统的流畅度增加了 60%。 另一个容易被忽视的「花宠摆件」其实是小米的一次「内在返回」,回到了那个注重自定义桌面、注重个性化的初心。「端侧隐私」不离手机,「互联体验」继续提升,让小米的「可靠」标签加粗了几笔。 Xiaomi 13 在 2023 年第一季度拿下全球市场国产手机销量第一的成绩,就是市场对其改变给予最大的奖励。 更重要的是,Xiaomi 13 是在 4000 – 6000 元价位拿下的安卓手机销量第一,小米的「高端品牌」之战,经过了 7 年的努力,也在重生的前夕,结出了果实。 之后的事儿,就是开头的故事了,雷军 17 号发的微博和公众号将所有关心小米的人联系在了一起,仿佛当年在「小米论坛」上激烈讨论的场景。 新十年,心澎湃 雷军也在微博的最后写下了「MIUI 将永远留存在我们的记忆里」,MIUI 的故事在它创始人的告别中就告一段落了,但小米和雷军的故事仍在继续。 小米手机和 MIUI 系统的更新,只是这个故事的主线,而我们没有看到的,是小米多年以来对做旗下生态产品的坚持,有些产品和手机甚至和科技都没什么关系,但这就是抱着做一家「百年企业」的目标,所布下的大局。 现在这两个完全没有联系的领域,因为 MIUI 14 融合在了一起,也会因为今后 Xiaomi Hyper OS 的问世,结合地更加紧密。 回顾 MIUI 的发展,到雷军介绍小米澎湃 OS 的定位和目标,很难让人不联想到华为鸿蒙系统,鸿蒙诞生时的定位就很明确: 能够在不同硬件能力上进行部署,适配丰富的万物互联时代 IoT 时代能力的操作系统。通过操作系统分布式软总线让同一个账户下的多种终端能够实现硬件能力跨终端之间调用。 爱范儿最早将华为定义为一家「超级终端」公司,这和终端数量与市场份额无关。超级终端公司的核心在于供应链和操作系统的把控,以及对设备类型和功能的前瞻性探索。 殊途同归,小米也正在成为这样的公司。我们有幸在当下,看到了两家「不惧险阻,迎难而上」的中国企业。 「为发烧而生」的小米,也随着 Xiaomi OS 的封装,开启了下一个十年备战。 MIUI 的发展和小米的故事,是一段耐人寻味的奋斗史,是中国科技产业发展的缩影,也是你我亲身的经历,感谢 MIUI 十三年的陪伴。
深度学习框架重要突破!鹏城实验室田永鸿教授领衔,国产AI芯片成幕后功臣
作者 | 佳慧 编辑 | 云鹏 南山科技观察10月19日报道,近日,鹏城实验室的田永鸿教授团队关于SNN(脉冲神经网络)深度学习的开源框架成果在Science Advances刊发,论文名为“惊蜇:为脉冲智能而生的开源机器学习框架(SpikingJelly:An open-source machine learning infrastructure platform for spike-based intelligence)”。 鹏城实验室是由深圳市政府负责建设的新型科研机构,同时以哈尔滨工业大学(深圳)为依托单位,与北京大学深圳研究生院、清华大学深圳国际研究生院、深圳大学、南方科技大学等高校,深圳先进院、深圳国家超算中心等科研院所,以及华为、中兴通讯、腾讯等高科技企业共同建设。 此前,鹏城实验室曾多次在Science、Nature等顶级期刊上发表突破性研究成果,并且在今年3月,鹏城实验室牵头制定的数字视网膜系统国际标准在IEEE标准协会正式发布,该标准是全球首个端边云协同技术的国际标准。 鹏城实验室还与华为共同打造了“鹏城云脑Ⅱ”智能算力平台,基于自主可控的国产AI芯片,提供不低于1000Pops的整机AI计算能力和64PB的高速并行可扩展存储。“鹏城云脑Ⅱ”约70%的机时是对外开放共享的,服务于实验室以外的企业、高校与科研院所,已经支撑近千个国产AI模型训练任务与AI算法发布。 SNN是一种模拟生物神经系统工作原理的神经网络模型,被誉为第三代神经网络。相较于第一代神经网络,即感知器,以及第二代神经网络,即多层感知器(MLP),SNN实现了更高级的生物神经模拟水平。 SNN既是神经科学中研究大脑原理的基本工具,又具有时间建模、稀疏计算、超低功耗、大规模脑模拟等方面的特点,因此SNN在神经科学和计算机科学领域具有重要作用,备受计算科学关注。 ▲“惊蜇”框架中的典型模块(图源:鹏城实验室) 在“鹏城云脑Ⅱ”的算力支撑下,新型SNN深度学习框架,即“惊蜇”框架诞生。 “惊蜇”框架相较于传统的SNN框架,具有简单易用、扩展性强、超高性能的优势,可以提供全栈式的脉冲深度学习解决方案,避免研究者进行重复劳动,方便研究有序进行。 正如开发者之一的方维所说,一个完善的框架有助于研究者顺利进行各种实验、与他人分享研究成果,并确保研究成果的可复现性。因此,“惊蜇”框架一经推出,就受到了研究者们的欢迎和广泛使用。 此次“惊蜇”作为SNN在深度学习方面的开源框架成果,登上权威科学刊物Science子刊,也许能够为更多研究人员提供新的研究思路和方向,或者吸引国际更多专家学者,以此延伸框架使用场景,促进交叉学科发展。 一、构建“惊蜇”,弥补传统SNN框架缺陷 随着深度学习方法的引入,SNN的性能得到大幅度提升,脉冲深度学习成为新兴的研究热点。 然而,由于传统SNN框架更多关注的是生物可解释性,致力于构建精细脉冲神经元,并仿真真实生物神经系统,并不支持自动微分,无法充分利用GPU的大规模并行计算能力,也缺乏对神经形态传感器和计算芯片的支持,难以用于脉冲深度学习任务。 方维也称,传统的深度学习框架并不直接支持SNN,许多研究者不得不从零开始实现所需的SNN模块,这就造成了大量的重复劳动。 在这样的情况下,鹏城实验室网络智能部田永鸿教授的团队,构建并开源了全新的SNN深度学习框架“惊蜇”,试图解决传统SNN框架面临的一系列问题。 鹏城实验室称,“惊蜇”框架具有简单易用、扩展性强、超高性能的优势,可以提供全栈式的脉冲深度学习解决方案。“惊蜇”框架支持神经形态数据处理、深度SNN的构建、替代梯度训练、ANN(人工神经网络)转换SNN、权重量化和神经形态芯片部署等功能。 现在,“惊蜇”框架作为SNN深度学习的开源框架成果在Science Advances发表论文,该论文由鹏城实验室网络智能研究部副主任、北京大学深圳研究生院信息工程学院院长田永鸿教授和中国科学院自动化所李国齐教授作为共同通讯作者撰写,鹏城实验室访问学生方维、陈彦骐为第一、第二作者。 ▲“惊蜇”框架整体结构、示例代码、仿真速度、生态位以及典型应用(图源:鹏城实验室) 二、应用广泛,超123篇公开论文使用“惊蜇”进行实验 “惊蜇”作为一种新型的SNN深度学习框架,自2019年底推出就被研究者们广泛用于论文实验研究,或尖端前沿领域探索等。鹏城实验室称,“惊蜇”的开源极大促进了脉冲深度学习领域的发展。 基于“惊蜇”框架的研究工作已经有很多形成论文并出版,正逐步将SNN的应用从简单的MNIST数据集分类,扩展到人类水平的ImageNet图像分类、网络部署、事件相机数据处理等实际应用。 基于“惊蜇”框架对前沿领域的探索则包括了可校准的神经形态感知系统、神经形态忆阻器、事件驱动加速器硬件设计等领域。 目前共有超过123篇公开论文使用“惊蜇”框架进行实验,其中包括3篇ICCV、3篇IJCAI、5篇NeurIPS、4篇CVPR、4篇ICLR、3篇AAAI、2篇ICML、3篇ECCV、1篇TMLR、1篇ACM MM、1篇PR、7篇IEEE Transactions(含1篇TPAMI),以及1篇子刊Nature Communications,此外还有3篇非计算机领域的一区期刊文章。 ▲“惊蜇”框架的典型用例(图源:鹏城实验室) 三、“鹏城云脑”提供算力保障,未来或达16000P水平 “惊蜇”框架的构建离不开鹏城云脑的强大算力支持,“惊蜇”框架在鹏城云脑上进行了大量性能试验和代码调试。 据鹏城实验室称,“鹏城云脑Ⅱ”基于自主可控的国产AI芯片,采用高效能计算体系结构,现在已完成主体建设。 “鹏城云脑Ⅱ”是鹏城实验室与华为联合打造的人工智能大科学装置,搭载鲲鹏、昇腾处理器的Atlas 900集群来提供充沛的算力,主要用于如计算机视觉、自然语言处理、智慧交通、智慧医疗等AI领域的基础性研究与探索。 “鹏城云脑Ⅱ”是国内首个全面自主可控的E级(即百亿亿次)智能算力平台,可提供不低于1000Pops的整机AI计算能力和64PB的高速并行可扩展存储,具备百GB级网络传输速率。这相当于24小时内能训练100亿张图像,是52万台家用电脑算力之和。 目前,“鹏城云脑Ⅱ”已经在在全球IO500总榜单连续6次取得冠军,在国际AI算力AIPerf500排行榜排行榜连续3届排名第一,获得世界Graph500 SSSP(单源最短路径)性能榜单冠军,在业界公认的MLPerftrainingv1.0基准测试中的自然语言处理赛道(256卡同等规模)排名第一,图像分类赛道(1024卡同等规模)排名第二。 华为轮值董事长胡厚崑曾称,按照规划,到2024年鹏城云脑三期的时候,规模会达到16000P的水平。可见,“鹏城云脑”这一大科学装置在“惊蜇”框架的开发过程中提供了充足的算力保障。 ▲鹏城云脑(图源:鹏城云脑) 结语:16000P算力时代或将到来,新型SNN深度学习框架开发有更大算力支撑 SNN采用类似人脑的工作模式和信号传递方式,可以在处理大规模数据和复杂任务方面取得不错效果。然而,由于SNN需要更多计算资源来进行训练和推理,其发展受到算力限制。 “鹏城云脑Ⅱ”为“惊蜇”框架开发提供了不低于1000Pops的整机AI计算能力,“惊蜇”框架已经取得了不错的效果。但据胡厚崑所说,按照计划,2024年可能在鹏城云脑三期,实现16000P的算力水平。 高算力的大科学装置的出现能够让研究员们更高效地训练和优化SNN,新型的SNN深度学习框架也可能得以开发,从而在智能化时代掀起新一轮技术革命。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。