行业分类:
加载中...
头条分类:
加载中...
AI聊天机器人大战升温:谷歌Gemini预告片展示惊艳语音视频交互能力
IT之家 5 月 14 日消息,人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。 这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。 整个对话过程自然流畅,Gemini 还会询问用户注意到的细节,成功识别出了该活动为谷歌 I / O 开发者大会,并进行了简要介绍。 谷歌发布该预告片的时机非常巧妙,恰好在 OpenAI 有关 ChatGPT 的发布会前几个小时,OpenAI 在此发布会上推出了全新的 ChatGPT-4o 大模型,其理解和对话的流畅性以及连贯性方面都达到了无与伦比的水平。 虽然过去的一些演示视频让外界对这类内容持有一定的怀疑态度,但今天展示的案例无疑证实了人工智能聊天机器人可以无缝集成语音和视频输入。这种多模态能力,加上非常自然的对话流,让我们仿佛看到了未来人工智能交互的一瞥。
苹果高层或将大换血,库克继承人有两大候选
如果你经常关注苹果发布会,可能会记得不少熟面孔:被誉为「苹果最帅男人」的 Craig Federighi,一周工作 80 小时的 Phil Schiller,为 Apple Watch 带来心电图功能的 Jeff Williams,更不用提每次都在开头和结尾登场的 CEO 蒂姆·库克(Tim Cook)。 ▲ 从左到右:Craig Federighi、 Phil Schiller、Jeff Williams、Tim Cook 不过,据彭博社的最新报道,包括这些熟面孔在内,许多苹果高管都已经度过了很长的任期,很有可能会在几年内同时从一线退下。 也就是说,苹果高层很有可能会经历一次集体大换血,包括 CEO 在内,不少高管职位都会出现人员变动。 接班库克的两大人选 库克去年在接受采访时谈到,自己还会在苹果「干一段时间」,言下之意是,库克也许还没那么快「退休」。 和库克关系比较密切的消息人士透露,库克至少会在苹果再干 3 年的时间。 不过,今年 63 岁的库克,已经比不少同行要更加年长。掌管了苹果 13 年,库克也大概率走到了任期的尾声阶段。 彭博社的 Mark Gurman 从几个熟悉苹果内部运作的人士中,获取到了几个候选人的名字。 如果库克很快退休,那么首席运营官(COO)Jeff Williams 极有可能取代他的位置。 ▲ Jeff Williams 2015 年,库克任命了 Williams 为自己之后的首个 COO,也是那一年,Williams 推出了库克时代第一个主要新产品——Apple Watch,并在 3 年后的发布会上介绍了 Apple Watch 上的 ECG 心电监测功能。 在首席设计师 Jony Ive 高调离开苹果后,Williams 还接替了他成为硬件和软件设计的主要负责人。 Williams 是一位强有力的竞争者,不过他的 CEO 之路有一个最大的障碍:这位「老」将今年 61 岁,只比库克年轻 2 岁,而苹果董事会希望下一位 CEO 能够跟乔布斯和库克一样,至少出任十年。 当然,川普都能在 70 岁当上美国总统,63 岁的库克和 61 岁的 Williams 继续在苹果继续任职几年也不成问题。但如果库克选择在 CEO 的位置上多干几年,Williams 接替他的可能性只会越来越小。 内部人士这时提到了另一个更年轻的名字:硬件工程高级副总裁 John Ternus,这位今年 49 岁的高管,在最近的「放飞吧」发布会上,介绍了 iPad Air 和 iPad Pro 新品。 Ternus 负责苹果众多的硬件工程,包括 iPhone、iPad、Mac、AirPods,直接向库克汇报。最近,Apple Watch 团队也开始向他汇报,而不是此前的 Williams。 据悉,Ternus 在苹果内部很受欢迎,库克和 Williams 等一众高管都对他非常尊重。 近年来,Ternus 也在各大场合频繁「刷脸」。除了「放飞吧」发布会,他去年还在欧洲讨论了库克重视的苹果环保问题,年底在美国电视上接受了关于苹果芯片的采访,而这实际上不算是他专门负责的领域。他还在今年的苹果私人高管会议中首次主持了演讲。 当然,Ternus 在公司内部也有反对者。有些批评者认为 Ternus 比较保守,几乎不参与苹果近几年重大产品决定,比如说他只参与了 Apple Watch 的后续开发,也没有参与苹果进军机器人领域的构思。 而 Ternus 接管 Mac 后推出的 Touch Bar,很难称得上是一个成功的功能,并且也已经在最新的 MacBook 产品上彻底绝迹。 ▲ Touch Bar 那么,其他高管怎么样呢? 由于在发布会上「造梗」能力十足,并且外形条件也不错的软件工程主管 Craig Federighi 收获了民间的极大支持,他也对职权之外的公司问题十分熟悉。 ▲ 去年 WWDC 上的「经典一幕」 不过,内部人士表示,这位人气高管不太可能成为 CEO 的继任者。 管理层可能面临大洗牌 苹果目前的高管团队是一个紧密的团体,其中不少人都是随着库克出任 CEO 上任的,在十几年间变化较少,大部分人也和库克的年龄相仿。 这也意味着,大部分高管都经历了一个较长的任期,并且内部人士透露,许多高层领导都会在同一时间卸任,这也意味着苹果高层团队在这几年内会迎来一次大更新。 Mark Gurman 对工程、运用、服务、财务、软件等部门的接班人都进行了分析和讨论。 运营部门,不管 Jeff Williams 接任 CEO 或者退休,其副手,也就是运营高级副总裁 Sabih Khan 都很有可能接替他。目前,他负责监管整个供应链,最近还开始接受个别工业设计师的汇报。 ▲ Sabih Khan 不过,当 Williams 离任 COO 后,目前直接向他汇报的设计团队会被安置到何处,目前还是一个疑问。 Craig Federighi 自 2012 开始担任苹果最高级别的软件高管,当时他接替了著名的 iOS 前负责人 Scott Forstall。Craig 可能不会很快离任,他的接班人有两位候选者:目前负责 iOS 小部件、主屏幕和隐私等功能的主管 Sebastien Marineau,或者负责底层软件技术的 Jon Andrews。 ▲ 出身自黑莓公司的 Sebastien Marineau,2013 年加入了苹果 如果 John Ternus 出任 CEO,硬件工程部门也会迎来新的高管,其继任者可能是推出了 Vision Pro 的主管 Mike Rockwell。 ▲ Mike Rockwell 负责了 Vision Pro 的开发 但据悉,Ternus 和 Rockwell 之间的关系相当「微妙」。Ternus 并非 Vision Pro 的支持者,Rockwell 也并不向 Ternus 直接汇报。 也有几个部门,由于目前负责人个人实力过硬,或者工作特殊性,还没有比较适合的接班人选,或者可能会在高管离任后进行改组。 被誉为库克「知己」的服务部门领导人 Eddy Cue 就是一位难以替代的人物,他负责的项目范围十分广泛,包括流媒体、音乐、地图、支付等多个方面。如果他卸任,他的职务可能会被拆分,苹果音乐负责人 Oliver Schusser 和 iTunes 首席开发人员 Jeff Robbin 很可能接过娱乐和服务的业务。 ▲老将 Eddy Cue 而负责 App Store 的 Phil Schiller 同样也难以找到替代人选,不过由于近几年欧盟和美国监管部门对 App Store 的持续施压,这位原本即将退休的老将似乎将继续留任来应对挑战。今年三月,《华尔街日报》对 Schiller 进行了人物报道,称 Schiller 最近每周工作时间约 80 小时。 ▲ Phill Schiller 人工智能团队负责人 John Giannandrea 于 2018 年加入苹果,由于团队特殊性,目前无明确接班人选,如果 Giannandrea 离任,AI 团队可能会重新并入软件工程部门。 苹果近年来持续发力的环保领域负责人 Lisa Jackson 由于拥有在政府工作和环保局局长的任职经历,也难以找到比较合适的接班人。 对苹果「变化」的期待 虽然苹果高管变动目前还只是一个预想,甚至没有吹起说明风声,不过网友们在相关新闻的评论中可以看出来,大家对这家科技巨头可能即将发生的重大变化都非常期待。 ▲ John Ternus 对于「搞硬件」的 John Ternus 接管 CEO,网友们意见不一。有的人赞同,认为硬件负责人会为这家「挤牙膏」许久的公司,带来更强产品力和创新力的硬件新品。不少网友也期待这位硬件主管上任后能够打破「8GB+256GB 起步」的「传统」。 ▲ IT 之家网友的高赞评论 不过也有网友认为并不乐观,既然 Ternus 一直负责硬件,目前苹果硬件上的种种遗憾说不定正是他带来的。而且,由搞硬件的接管苹果,感觉有违「文科生」乔布斯的理念。 当然,在相关讨论中,网友们也绝对不会忘记提到这个名字:Craig。 ▲ 相关新闻下,微博网友对 Craig 表示支持 库克究竟算不算一个好 CEO,争论至今也没有定论。 支持者们认为库克在任内把苹果市值扩大了十倍,功不可没;反对者则认为库克带领下的苹果毫无创新可言,苹果也从乔布斯时代下灵感和美感并存的品牌,转型成追逐商业的企业。 特别是库克近几年大肆宣扬绿色环保,虽然理念值得认同,也拿出了实际的成效,但是也有反对者认为,环保把苹果「带偏了」。 沃伦·巴菲特(Warren Buffett)前段时间这样评价库克:能很好的驾驭商业,是乔布斯之后的「最佳合作伙伴」。 网友们对于苹果新 CEO 的种种期待,其实是希望这家近年来难称惊艳的公司,能够发生一些「变化」,希望苹果能回到乔布斯时代那种,时不时在发布会上拿出「One More Thing」震惊世界的状态。 以及对这家有点傲慢的公司「放下身段」,更多倾听用户意见的期待。
高通重新设计骁龙8 Gen4,只为在AI上力压苹果?
算算时间,骁龙8Gen3已经发布超过半年了,按照以往的惯例,骁龙8Gen4应该已经差不多完成设计,并准备进入测试阶段。 不过,今年似乎出现了一些变化,根据最新的爆料,高通决定重新设计骁龙8 Gen4,让其“更具竞争力”。 (图源:X) 对于这个消息,小雷其实并不觉得意外,随着联发科、苹果的下一代处理器数据陆续曝光,从骁龙8 Gen4此前泄露的数据来看,想要在竞争中取得优势并不容易。 以联发科为例,早在4月份就有消息称天玑9400将会延续激进的全大核设计,为用户提供强大的性能支持。而苹果的A18/Pro,虽然目前曝光的传统性能数据并不算出色,但是苹果一直在暗示A18系列处理器将更多地专注于AI功能的提升。 比如A18 Pro就被曝光已经重新回滚到设计阶段,苹果正在对这颗全新的旗舰处理器做更多的调整,以增加神经引擎的内核核心数量,让A18 Pro在AI性能上可以与上一代处理器有着显著区别。 显然,骁龙8 Gen4的重新设计,与A18 Pro曝光出来的信息有着不少关联。不管是高通还是苹果,两者显然都希望可以在AI领域取得更多的优势。 新一轮ARM芯片角力 近两年以来,手机芯片的性能涨幅超过了许多人的预料,以骁龙系列为例,骁龙8 Gen1到骁龙8 Gen3的性能提升已经接近200%。 从Geekbench 6的测试数据中,可以看到骁龙8 Gen1时单核性能仅为1229,多核性能则是3828。两年后发布的骁龙8 Gen3,已经将性能提升到单核超过2300,多核超7400的水平,即使在实际使用中受到功耗、散热等限制,实机单核性能也在2200以上,多核性能则在7000以上。 而在此前曝光的数据中,骁龙8 Gen4的单核性能为2845,多核性能则高达10628,相较于骁龙8 Gen3在多核性能上的进步非常明显,但是单核性能的提升却不及预期,与苹果A18 Pro曝光的单核3500得分对比,更是有着明显的差距。 (图源:cnbeta) 为了尽量弥补单核性能上的差距,爆料人称高通重新设计的骁龙8 Gen4将会把目标频率定为4.26GHz,根据此前曝光的超大核主频为4.3GHz来看,小雷猜测重新设计目标频率的应该是大核。 考虑到骁龙8 Gen4将回归骁龙自研的全大核架构(2超大核+6大核),那么新版的骁龙8 Gen4将会是一个采用2*4.30GHz超大核+6*4.26GHz大核设计的“大宝贝”。 预计重新设计后的骁龙8 Gen4,在多核性能上还会进一步提升,有网友猜测最终成品的理论多核性能可能会超过11000分。 单从纸面数据来看,骁龙8 Gen4即使对比骁龙X Elite也不遑多让,后者作为一颗PC处理器,在Geekbench 6中的单核跑分为2774,多核跑分为14254,这还是得益于比骁龙8 Gen4多50%的核心数。 (图源:PC World) 如果将骁龙8 Gen4放到最近两年的移动PC处理器中做对比,你会发现其性能已经相当于2023年第一季度发布的i7-1360P。在ARM处理器的疯狂内卷下,PC端与手机端的处理器性能似乎已经走到了一个历史性的交汇点。 虽然骁龙8 Gen4、天玑9400和苹果A18 Pro都尚未正式发布,但是战争的硝烟气息已经开始弥漫。 一切为了AI? 众所周知,AI已经成为下一代智能手机的核心,AI性能在某种程度上,其重要性甚至超过了传统运算性能。对于多数用户而言,目前的旗舰处理器在传统性能上已然过剩,而AI性能却方兴未艾。 对于旗舰手机而言,AI性能已经成为竞争的核心。而手机SoC的AI性能往往由三部分决定:CPU、GPU和NPU,其中NPU的占比最高,同时也是最难在设计中途就进行修改的。 (图源:知乎) 因为NPU与CPU、GPU等传统运算核心不同,其并非简单地靠核心主频来提升、降低性能,而是更多地依赖于架构优化和核心数量。 这就不难解释,为什么高通想提升AI性能,却没有选择改动NPU,而是选择了曲线救国的方法,转而提升CPU的整体性能。前面我们提到,AI性能是三个运算核心的计算能力总和,虽然CPU在排位中低于NPU和GPU,但是却充当着系统中枢的作用。 一方面,CPU可以通过异构计算将部分性能提供给NPU进行辅助计算,另一方面,足够的多核性能也让CPU可以更快速地分配任务,动态协调整个系统的算力。 随着AI在手机系统中的占比越来越多,在日常使用中系统需要同时调动的AI功能也随之增加,如何更好地分配这些任务,也会成为需要考虑的问题。 故此,我认为高通也是在有意推动手机SoC的多核性能上涨,以此与苹果的A18 Pro形成鲜明对比,因为后者受限于单核性能过高所导致的核心功耗问题,选择了降低多核性能的方式来保证整体功耗在可控范围内。 (图源:X) 如果苹果A18 Pro的性能如之前曝光的一样,那么仅在多核性能上,骁龙8 Gen4就有望领先其20%以上,在面对多任务需求时的表现会明显优于A18 Pro。 毫无疑问,今年的手机市场将迎来一次质的变化,高通、联发科和苹果的角力,将会让今年的旗舰手机在AI性能上与前代有着断层般的差距,配合手机厂商在AI上的发力,小雷可以预见一场手机市场的风暴,已在酝酿之中。
腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,可免费商用
作者 | ZeR0 编辑 | 漠影 智东西5月15日报道,腾讯文生图负责人芦清林周二宣布腾讯混元文生图大模型全面开源。 该模型已在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,与腾讯混元文生图产品最新版本完全一致,基于腾讯海量应用场景训练,可供企业与个人开发者免费商用。 这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。 跟其他业界开源模型对比,混元DiT在多个维度上无短板,并在美学和清晰度维度上具有一定优势。其综合指标在所有开源和闭源算法中排名第三,实现开源版本中的SOTA。 评测数据显示,腾讯混元文生图模型效果远超开源的Stable Diffusion模型及其他开源文生图模型,是目前效果最好的开源文生图模型;整体能力属于国际领先水平。 升级后的混元文生图大模型采用了与Sora、Stable Diffusion 3一致的DiT架构,可支持文生图,也可作为视频等多模态视觉生成的基础。 混元文生图整体模型主要由3个部分组成:a)多模态大语言模型,支持用户文本改写以及多轮绘画;b)双语文本编码器,构建中英文双语CLIP理解文本,同时具备双语生成能力;c)生成模型,从U-Net升级为DiT,采用隐空间模型,生成多分辨率的图像,确保图像整体的稳定结构。 GitHub项目页面建议使用具有32GB内存的GPU运行模型,以获得更好的生成质量。 在芦清林看来,此前开源与闭源文生图模型的差距逐渐拉大,他希望腾讯混元文生图大模型的开源后能够将差距缩小。 腾讯混元已面向社会全面开放,企业级用户或开发者可通过腾讯云使用腾讯混元大模型,个人用户可通过网页端与小程序体现腾讯混元的能力。 官网:http://dit.hunyuan.tencent.com/ 代码:https://github.com/Tencent/HunyuanDiT 模型:https://huggingface.co/Tencent-Hunyuan/HunyuanDi 论文:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf 一、更懂中文的开源文生图大模型:基于DiT架构,多轮对话能力增强 过去,视觉生成扩散模型主要基于U-Net架构,但随着参数量提升,基于Transformer架构的扩散模型(DiT)展现出了更好的扩展性。 U-Net只懂图片,遇到难题易卡壳,而Transfomer能懂不同模态信息,参数/数据量越多越厉害。DiT是结合扩散模型和Transformer架构的创新技术,有高扩展和低损失的优势,更易扩展,有助于提升模型的生成质量及效率。 该架构通过Transformer block堆叠,可极大提升模型性能,并最大程度缓解U-Net下采样引入的信息压缩,提升图像生成精度和创造力。 据腾讯文生图负责人芦清林分享,在原始DiT架构之上,混元DiT有三大升级: 一是强大建模能力,将文生图架构从自研U-Net架构升级为更大参数的DiT模型,提升图像质量和扩展能力,让DiT架构具备了长文本理解能力,支持最长256个字符的图片生成指令;同时利用多模态大语言模型,对简单/抽象的用户指令文本进行强化,转写成更丰富/具象的画面文本描述,最终提升文生图的生成效果。 二是增加中文原生的理解能力,自主训练中文原生文本编码器,让中文语义理解能力更强,对中文新概念学习速度更快,对中文认知更深刻,同时让模型更细致地分辨不同粒度文本信息。 三是增强多轮对话能力,与自研大语言模型结合,让模型具备上下文连贯的理解能力,同时通过技术手段控制同一话题与主体下图片主体的一致性。 1、升级一:核心算子升级,从UNet升级到DiT 学术界去年提出基础DiT架构,混元DiT在此之上进一步升级,有更强语义编码,针对更长、更复杂的文本能理解得更准确,原生中英双语支持,尺寸更易扩展。 混元DiT架构具备更稳定的训练过程,通过优化模型结构,支持数十亿参数和1024分辨率的模型稳定训练。它还拥有更好的生态兼容性,可灵活支持ControlNet、LoRA、IP-Adapter、Photomaker等Stable Diffusion社区的插件。 同时,该架构支持输出多分辨率图像,提升不同分辨率生成图像的质量,包括1:1、4:3、2:4、16:9、9:16等多种分辨率,支持768~1280分辨率图像生成。 2、升级二:语言编码器升级-支持原生中文理解能力 混元文生图是首个中文原生的DiT模型,具备中英文双语理解及生成能力,在古诗词、俚语、传统建筑、中华美食等中国元素生成上表现出色。 通过语言编码器升级,混元DiT架构对中文的认知更加深刻,相比核心数据集以英文为主的Stable Diffusion等主流开源模型,能更好理解中国的语言、美食、文化、习俗、地标等。 比如在生成昆曲艺术家表演的图像时,混元文生图在理解昆曲艺术方面明显比其他国外主流文生图模型更准确。 升级的混元文生图能更细致地分辨不同信息。其训练方式是把数据做成正负样本,对比学习损失,让模型学会什么是对、什么是错,做到理解和表达更细致的属性。 比如输入一段涉及大量细节描述的文字,混元文生图能够精细理解文字要求,生成符合各种细节的图像。 3、升级点3:多轮绘图和对话能力增强 混元文生图在算法层面创新实现了多轮生图和对话能力,可在一张初始生成图片的基础上通过自然语言描述进行调整,达到更满意的效果。 比如起初输入指令“生成一朵长在森林中的白色玫瑰”,再要求“改成百合花”、“改成粉色”、“改成动漫风格”;起初输入指令“画一只色彩斑斓的折纸小狐狸折纸”,再要求“把背景换成沙漠”、“把狐狸换成小狗”。 模型交互难度进一步降低,用户无需进行复杂生图提示词指令编写。混元文生图能实现多轮图文指令理解,支持多轮交互式图片编辑生成,支持十轮以上的对话。 二、去年7月投入DiT研发,从零开始训练,全链路自研 腾讯混元团队认为基于Transformer架构的扩散模型(如DiT)具有更大的可扩展性,很可能成为文生图、生视频、生3D等多模态视觉生成的统一架构。 2023年7月起,业界研究DiT的团队还不多,当时混元文生图就明确了基于DiT架构的模型方向,并启动了长达半年的研发、优化、打磨。今年年初,混元文生图大模型已全面升级为DiT架构,并在多个评测维度超越了基于U-Net的文生图模型。 数据显示,在通用场景下,基于DiT视觉生成模型的文生图效果,相比前代视觉生成整体效果提升20%,画面真实感、质感与细节、空间构图等全面提升,并在细粒度、多轮对话等场景下效果提升明显。 这里面存在极大难点:首先,Transformer架构本身并不具备用户语言生图能力;其次,DiT本身对算力和数据量要求极高,文生图领域缺乏高质量的图片描述与图像样本训练数据。 腾讯混元团队在算法层面优化了模型的长文本理解能力,能够支持最多256个字符的内容输入(业界主流是77个),从零开始训练,做到全链路自研,在模型算法、训练数据集与工程加速多个层面进行了系统化的创新研发。 针对文生图训练数据缺乏、普遍质量不高的问题,腾讯混元团队通过优化图片描述能力、样本评估机制等提升文生图训练数据的规模和质量,同时利用多模态大语言模型强化与丰富用户指令文本,从而提升最终文生图效果。 混元文生图大模型基于腾讯自研的Angel机器学习平台进行训练,大幅提升了训练效率。为了更好地提升模型训练与运行效率,提升算力资源利用率,团队为该模型构建专属工程加速工具库。 三、开源领域自主可控,填补中文原生DiT文生图架构空白 为什么选择在这个节点开源?在媒体交流环节,芦清林谈到这主要出于两点考虑,一是在业界投入DiT研发的时间早,经历长时间的打磨,成熟度达到开源条件;二是看到业界需要开源中文原生DiT文生图模型。 过去业界文生图大多基于Stable Diffusion,开源社区有数量庞大的开发者和创作者,基于Stable Diffusion精调出了丰富的垂直场景模型,同时衍生出大量国内外模型分享与流通社区。 主要的文生图开源社区依然主要基于U-Net架构模型进行开发,仍未有比较先进的DiT架构充分开源。而无论Stable Diffusion 3还是Sora都采用DiT架构来构建下一代图像/视频生成能力。开源社区缺乏先进/成熟的DiT架构开源利用,业界也难以快速吸收学术界大模型前沿技术。 中文原生的DiT文生图架构同样是缺失的。在中文场景,很多团队基于翻译+英文开源Stable Diffusion模型,导致在中文特有的场景、人物、事物上表现比较差。 还有一些团队基于少量的中文数据在一些特殊的场景做了微调,让模型去适配某个特殊的领域或者风格。但直接用英文预训练的模型+中文小数据微调也存在对中文理解不足和不通用的问题。 即使国外有些论文公开,这些架构更多偏英文,对中文理解差,而且没在大众中做验证,在中文应用场景受限。由中文翻译成英文可能会导致出图有歧义,比如中文“一只很热的狗在餐厅”翻译成英文“A very hot dog in the restaurant”就变味了,会生成“一盘热狗(hot dog)”图。 而开源DiT研发成果,意味着全球个人和企业开发者都能直接都能直接用上了最先进的架构,不用自己重新研发和训练,大大降低了AI使用门槛,也节省了人力物力。 基于腾讯此次开源的文生图模型,开发者及企业无需重头训练,即可直接用于推理,并可基于混元文生图打造专属的AI绘画应用及服务,能够节约大量人力及算力。透明公开的算法也让模型的安全性和可靠性得到保障。 基于开放的混元文生图基础模型,还有利于在以Stable Diffusion等为主的英文开源社区之外丰富以中文为主的文生图开源生态,形成更多样的原生插件,推动中文文生图技术研发和应用。 腾讯已开源超170个优质项目,均来源于腾讯真实业务场景,覆盖微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等核心业务板块,目前在Github上已累计获得超47万开发者关注及点赞。 结语:全面开源,惠及行业,已在探索更大参数量的模型 此前的开源生态、数据集均以英文为主,建设中文原生的文生图开源模型、中文的文生图开源生态,是十分必要的。 此次把最新一代模型完整开源出来,腾讯混元团队希望与行业共享在文生图领域的实践经验和研究成果,丰富中文文生图开源生态,共建下一代视觉生成开源生态,推动大模型行业加速发展。 芦清林分享说,混元文生图的后续优化方向包括提升技术能力和在更广泛的场景中应用。 腾讯混元文生图能力已广泛被用于素材创作、商品合成、游戏出图等多项业务及场景中。今年初,腾讯广告基于腾讯混元大模型发布了一站式AI广告创意平台腾讯广告妙思。《央视新闻》《新华日报》等20余家媒体也已经将腾讯混元文生图用于新闻内容生产。 据芦清林透露,目前混元文生图大模型的参数规模是15亿,同时团队已经在探索参数量更大的模型。他坦言模型在写中文文字的效果上还没做到非常成熟,等做好后也会拿出来分享。
荣耀 Magic6 系列的设计,和苹果三星华为旗舰机有什么不同?
荣耀 Magic6 系列在主流手机品牌旗舰系列里是一个非常特殊的存在,无论是华为 Mate 或是 Pura,小米数字系列,还是 vivo X 系列,OPPO Find 系列,每一代旗舰系列的设计主题几乎只有 1 个,顶多就是小米的 Ultra 线以数字系列之名独立推出。但这一代的荣耀 Magic6 系列,4 款机型,却出现了 3 种设计主题。 大规模工业制成品的规律就是 SKU 越少,供应链管理和生产成本越低,4 款机型,3 种设计,怎么看都有点反主流,但对于荣耀而言,却有一个重大的议题,需要通过设计来实现。 荣耀独立,需要设计的独立 在很长一段时间里的智能手机出货量前三甲,影响了整个行业的设计风格取向。 这三家企业分别是三星,苹果和华为。 在旗舰上,我们看到的大部分设计风格,都可以归到这三类:三星风格,苹果风格和华为风格。 ▲ 三星 S24 Ultra 三星旗舰手机的摄像头模组的「纽扣式」排布风格如今在用的主要是三星自己,和三星曾经的坚定盟友:魅族。 而小米这几年的数字系列(不包括 Ultra)背部摄像头模组的处理,以及边框直角化,屏幕直屏化的改变,则明显和 iPhone 在趋同。 ▲ 小米 13 系列 而在很长的一段时间里,在背部放一个「麻将块」又是通用解决方案,无论是「二饼」、「三筒」或者「浴霸」,都是殊途同归,当时大多数 Android 手机采用了这种方案。 至于 OPPO 和 vivo 的旗舰机,在这两年也纷纷改为「天圆地方」的设计风格,背部硕大的圆形摄像头模块居中,主力机型辅以素皮材质,突出机身质感和拍摄能力。 ▲ 华为 Mate 60 Pro 而把这一风格发扬光大的,自然是华为 Mate 系列。 注意,这里并不讨论模仿与否的话题,比如「天圆地方」的设计风格的显要元素,就是居中且凸起的超大圆形摄像头模组,这也不是华为首创,更早可以追溯到诺基亚 Lumia 1020,当时人们把这个模块称之为「奥利奥」。 这里讨论的是,哪个品牌对消费者的影响力更大,对行业的影响力更大,从而能够驱动行业在设计和审美上进行转向。 比如惯常认知里苹果对设计有很大追求,但在 iPhone 6 和 iPhone 6 Plus 这一代,消费者对大屏的需求远远超过了对背后那几条「注塑带」的抵触,所以苹果才有底气推出这一代设计难言好看的 iPhone。 但在当时,一体金属机身又是相当先进的,于是我们就看到了魅族 PRO 6 和锤子 smartisan T2 手机的继承和改良,分别砍掉了两条注塑带,以及消灭了金属中框的注塑断点。 ▲ iPhone 15 Pro 准确来说,苹果和三星都是遵循「形式追随功能」的准则,没有对摄像头模组进行更多的美学遮掩,也没有考虑太多摄像头模组与机身背部之间的关系,所以就能看到纽扣越摆越多,方框越过中线的现象。 销售主阵地在中国的品牌倾向于讲述更多的设计故事,融入更多的设计理念,以及把手机和个人审美,以及个人生活工作联系在一起。 就好像「天圆地方」带来的稳重感,素皮材质带来的轻奢感,更符合商务人士的需求。 在这场潜移默化的设计趋同潮流,大家一起寻找设计和大众认同最优解的过程中,想要推陈出新,又被大众接受,其实是一件极难的事情。 荣耀在 2020 年年底独立之后,经历了非常长时间的低谷,尤其是在 2021 年上半年,月出货量常常只有几十万台,已经是市场里面的 Others 一员了,已然是风雨飘摇的景象了。 解决了供应链问题之后的荣耀又迅速拉起了出货量,在国内稳定在了前五的位置,时常还能当一下季度出货量第一或者第二。 也是独立之后,荣耀在竞争层面的主要任务变了。 之前在华为体系内的时候,荣耀的主要任务是走线上渠道,布局中低端,以及和小米竞争,所以很长一段时间里,小米以及 Redmi 和荣耀品牌之间的舆论交锋很多。 但是这两年荣耀对外发声,就绝口不提小米和 Redmi,而是把对标对象换成了苹果和三星,甚至华为也被列为了直接竞争对手。 不过在荣耀品牌独立后的两代产品上,我们还是在设计上看到了与华为设计的趋同。 ▲ 荣耀 Magic3 Pro 比如荣耀 50 系列就和华为 P50 系列在摄像头模组处理上非常相似,均采用了「双环」设计,而 Magic3 系列和 Magic4 系列,则和华为 Mate40 系列的风格颇为相似。 这个做法不难理解,「独立」是一个状态,更是一个过程。刚刚从华为体系内走出来的荣耀,在大众认知里实际上也没有马上和华为彼此忘却,这种认知惯性下,二者的相似性,其实有利于荣耀在消费端的表现。 另外,荣耀内部也有两句话广为流传:「永远不要忘记,你曾经是华为人」,「要时刻记住,你已经不是华为人了」。 但认知惯性总有消失的一天,荣耀的独立,除了品牌的独立,经营的独立,供应链的独立,也要包含设计上的独立。 ▲ 荣耀 Magic6 Pro 我们可以从另外一个侧面,来看待这种独立。 小米,是国内所有消费品牌不能忽略的对手,无论是手机、电视还是汽车,对标小米,绑定小米,是一种获得舆论热度和关注度的捷径,简言之,小米自带流量,对标小米就能分得流量。 在一加和极氪之前,和小米贴身肉搏的品牌,正是荣耀。 但荣耀独立之后,就几乎不再提及小米,把对手假定在了苹果三星和华为。 如前面所言,这三家恰好是对手机设计影响最大的三个品牌,所以荣耀如若真如所言那样,以这三家为对手,那么设计上也必须跳脱出这三家的窠臼。 点,线,与面 归纳当下手机设计的风格,正面已经没什么可以说道的了,无非就是曲面屏和直屏的选择,边框能做得多窄,四边能否等宽,正面玻璃是否采用 2.5D 或者 3D 玻璃等等。 手机正面设计的矛盾,一度是追求高屏占比,与生物识别硬件必需占用正面空间的矛盾,比如指纹识别模块,3D 结构光面部识别模块,以及前置摄像头。于是乎,我们就看到了屏下指纹,灵动岛,屏下摄像头和微孔摄像头等解决方案。 手机背部留给设计发挥的空间则要更大一些,围绕着 CMF 三要素展开,于是我们看到了层出不穷的新配色,金属,玻璃,素皮、竹、木、塑料等材质百花齐放,还有 AG 玻璃,阳极氧化铝,闪光砂,微晶陶瓷等等针对特定材质的具体处理工艺。 但越往后,背部设计的主要矛盾,就变成了如何处理越来越多的摄像头和怎么让背部看起来美观之间的矛盾。 解决矛盾的方法论,我们可以大道至简地归纳为「点」和「面」的区分。 ▲ 魅族 21 Pro 三星把摄像头当做「点」,毗邻排布,魅族更进一步,把环状闪光灯模块也作为「点」,串成「糖葫芦」。 而苹果和小米旗舰机的风格是把摄像头纳入到方形之中,华为 Mate、 OPPO Find 和 vivo X 的旗舰机背部则是圆形,而华为 Pura 自我革新,把模组变为了三角形。 小学知识来了,三角形,四边形和圆形,就是三种最基本的「面」。 前面提到的,三星旗舰背部「纽扣」越来越多,iPhone 背部方块越来越大,其实也可以用「点」越来越多,「面」越来越大来概括。 我们之前聊华为 Pura70 的设计的自我突破,是选择了方与圆之外的三角形,并且把三角形处理得很好。 荣耀 Magic6 系列的设计突破,理念又不一样,而是在「点」和「面」之外,选择了「线」作为破局点。 手机厂商之所以把心思都花在摄像头模块上,是因为这个模块几乎就是用户的第一视觉重点,于是,不少设计师也想过制造第二视觉重点来增加背部的辨识度和趣味性。比如早先 OPPO Reno 4 上的大字母,华为 Mate50 Pro+ 上的「一笔丹青」,vivo X90 系列的「缎带云阶」,OPPO Find X5 和 X6 系列大漠银月配色的撞色设计等等。 荣耀 Magic6 系列 4 款机型实际上做出设计突破尝试,是 Magic6 至臻版和 Magic RSR 版(保时捷设计版),而 Magic6 和 Magic Pro 实际上还是在承续此前 Magic 5 系列的风格。 ▲ 荣耀 Magic6 至臻版 在 Magic6 至臻版上,素皮材质之中,竖置上下两条「金属饰带」,线状饰带各自延伸之后,又与摄像头模组的边框交汇,形成一种「面是线的交集,线是面的延展」的观感。 虽然荣耀说它的设计灵感来源于「祁连天池」,线条展现的是山和湖的绵延至美,但这属于你不说,用户很难去想到的意象。不过以我而言,它给我第一眼的视觉重点,就是两条线,和一个面,至于位于面中间的三个摄像头,则被完全忽略。 ▲ Porsche Design 的 logo,由 P 和 D 两个字母结合而来 在第一次看到荣耀 Magic6 至臻版,我还直接把它当做了保时捷设计版,原因是背部线条的轮廓,和保时捷设计(Porsche Design)Logo 的形状非常类似,让我以为是把保时捷设计以这种方式融入到了手机之中。 ▲ 荣耀 Magic6 RSR 真正的保时捷设计版是 Magic6 RSR。 相比于至臻版,Magic6 RSR 的设计反而更为简单,作为设计精髓出现的「线」,也仅有一条。 在设计里,做简单反而是件复杂的事情。 实际上,荣耀设计着重强调「线」,并不是从 Magic6 系列开始,而是在荣耀 100 Pro 就已有尝试。 ▲ 荣耀 100 Pro 在荣耀 100 Pro 的蓝色和紫色版本上,荣耀设计师用一条曲线,把后盖分割成了两部分,分别是覆盖上了玻璃和素皮,其中紫色版本还是压花素皮。 我会认为这样的设计略微繁复,玻璃和素皮的处理方式也有待商榷,不过荣耀 100 Pro 主打时尚轻薄,设计上往轻奢风靠近也是合理选择。 诚然,在生产制造环节,制造曲线的难度,总是要大于直线,以至于「直线属于人类,曲线属于上帝」都快被引用烂了。 不过,直也有直的好。 Magic6 RSR 化用了保时捷跑车上经典的「飞线」设计,所谓「飞线」就是用来在车身侧面呈现向车尾下行的溜背式造型的线条。这款手机机身背部中间的棱线自摄像头模块下方而起,往下延伸,因为棱线略微凸起,就把机身背部两边分为了两个斜面,这样即便背部玻璃是极细磨砂质感,但也能借助光线,呈现出含蓄但明确的一线两面。 随着中间棱线继续往下,末端凸起消失,线条有归于无,至此,在 Magic6 RSR 上,设计师用一条线撬动了面,加上摄像头模组以黑色呈现,以哑光钛合金做框,虽然是特立独行的六边形,但还是刻意降低了存在感。所以,视觉重点所属,还是这条简单的「流云飞线」。 ▲ 荣耀折叠屏手机 Magic V2s RSR 更早的荣耀折叠屏手机 Magic V2s RSR 保时捷设计版上,也有类似的「飞线」元素,而且这款手机的摄像头模块也标新立异地用了不规则的梯形,而非方圆。 至此,我们可以看到,荣耀开始大规模地在高端系列里融入「线」的元素,并把这个元素在视觉和理念上的优先级提到了更高的位置。 与保时捷设计的联名合作,也让「线」变得师出有名,且理念高远。 之所以在前面花了大量篇幅来讲述如今手机设计的概况,大致流派,以及荣耀独立的背景,也是为了让荣耀这几款手机的设计显得更为合理。 荣耀尝试在高端系列里,尤其是保时捷设计联名款手机里,以「线」为核心,做到了与苹果三星华为截然不同设计,也让荣耀的设计独立了起来。 这就是荣耀手机目前在设计上的现状,一方面主力出货机型设计上还是「稳」字为主,不求别出心裁,但求大众喜欢,而在最贵的,代表品牌调性和产品设计能力的产品上,荣耀已经尽可能地在做新的尝试,走出一条设计独立之路。 这就是为什么 Magic6 系列 4 款机型,出现了 3 种设计的原因。
这场发布会上,vivo 发布了一个相机,还有一个影像新品牌
对于 vivo X100 Ultra 这款手机,vivo 可以说是信心十足:在一年前就已经开始预热;以漫威电影最强反派角色「灭霸」为代号,有种「横扫一切」的意味;联合国家航天局拍摄火箭发射的样张…… 一波操作下来,外界对「灭霸」的期待值简直拉满。 终于,在 5 月 13 日晚上,vivo 召开了影像新蓝图暨 X 系列新品发布会,正式带来了 vivo X100 Ultra 手机,以及 X100s 和 X100s Pro 两款旗舰新品,还顺势推出了影像品牌「蓝图影像」。 这篇文章,带你看看这个「灭霸」的强悍,以及 vivo 在影像上的坚守和创新。 vivo X100 Ultra:vivo 的首款「相机」 vivo X100 Ultra 是 vivo 史上首款被冠以「Ultra」之名的手机,足以看出其重量级的地位。 作为主打影像的 X 系列,vivo X100 Ultra 这次的主要发力点为手机与相机差距巨大的「长焦」能力,并拿出了行业领先的长焦水平。 vivo X 系列产品线总监赵典也在调侃道,今天发的是 vivo 的首款「相机」。 在一篇预热中,vivo 提到,vivo X100 Ultra 有六大长焦极限:高速运动、暗光人像、极地星空、极限微距、长焦悬日,以及长焦舞台(演唱会神器)。 其中,「演唱会」是最复杂的场景:离舞台远,灯光多变,空间拥挤,暗光场景,歌手艺人还「变幻莫测」…… 因此征服了演唱会,基本上所有场景都能轻松应对。 为了成为「超级演唱会神器」,vivo X100 Ultra 带来了 2 亿像素的蔡司全色校正(apochromatic,APO)超级长焦,号称是世界上最强的色差校正潜望长焦,增强清晰锐度,还原自然色彩,让 2 亿像素是「真正」的 2 亿像素。 这枚 APO 长焦传感器不仅是行业最大像素,还拥有主摄级行业最大底 1/1.4 英寸, 以及一个 f/2.67 大光圈。 发布会上还提到了一个非常特别的长焦使用场景:扫码。凭借 2 亿像素长焦,vivo X100 Ultra 可以实现 40 米外扫码,在人眼看清二维码之前,X100 Ultra 就已经完成了扫码。 这下,说手机摄像头「只用来扫码」的用户,也多了一个购买 vivo X100 Ultra 的理由。 「灭霸」的主摄镜头在实力上也不遑多让。一英寸的主摄镜头,配备了云台级别防抖,汇聚「行业独家精度跃迁」(超高精度控光)、「行业最大角度 OIS 防抖」、「全球首发 GLC(防鬼影发雾镀膜)」三大独家技术,号称打造「行业最强一英寸」。 应该有不少小伙伴在夜间拍照的时候,都遇到过灯光在摄像头上形成的「鬼影」或者「发雾」,影响成像通透度。而 vivo X100 Ultra 摄像头配备了蔡司 T*镀膜,号称「行业最强抗眩光鬼影能力」,夜间拍照无惧恼人鬼影和发雾。 不少主打影像的 Android 旗舰手机,努力在照片拍摄上进行突破,但是视频拍摄能力却一直原地踏步。既然要成为「演唱会神机」,vivo X100 Ultra 自然不可能忽视视频拍摄能力。 在 vivo 自研蓝图影像芯片 V3+ 加持下,vivo X100 Ultra 也补全了视频拍摄的短板,2 亿像素加持下清晰度足以支持 30 倍变焦录像,录音上还配备高性能麦克风和录音变焦功能,全方位提升视频拍摄素质。 除了常规的照片+视频常规拍摄场景,vivo X100 Ultra 还推出了「潜水摄影」和「3D 拍摄能力」两大功能,给用户更自由的玩法。 当然,作为顶级旗舰,vivo X100 Ultra 不做「偏科生」,影像之外的配置也完全属于顶级。 作为一款影像旗舰,拍了好照片,当然需要一个好的屏幕显示。vivo X100 Ultra 搭载一块 6.78 英寸 2K E7 超色准屏,还配备了 vivo 自研图层级色彩管理技术。 性能方面,vivo X100 Ultra 自然搭载了高通旗舰级处理器第三代骁龙 8 移动平台,提供当前最顶尖的 Android 性能体验。 其他配置上,vivo X100 Ultra 搭载了 5500 mAh 蓝海电池和 80W 有线、30W 无线闪充,支持双向卫星通信。 这些配置既是为各种摄影场景准备,也体现了 vivo X100 Ultra 作为一款顶级旗舰应有的配置。 vivo X100 Ultra 提供三款配色:钛色、白月光、深空灰,12GB+256GB 版本售价 6499 元起。 总的来说,vivo X100 Ultra 在各项配置拉满的基础上,特别突出了影像的「硬」实力,行业首发了不少技术,参数上完全不负「灭霸」之名。 当然,好的影像实力,硬件只是一半,而更重要的算法和调校,以及现在越来越重要的「影调」,将在下文继续介绍。 vivo X100s:直屏旗舰「版本答案」 上完「灭霸」大菜,vivo X100s 和 X100s Pro 似乎显得不够惊艳?实际上,这两台配置更加均衡的手机也有着不少亮点。甚至可以说,比起「秀肌肉」的 Ultra,也许这两款手机会是不少人更趁手的选择。 vivo 产品副总裁黄韬表示,vivo 听到了「直屏党」的呼唤,推出了 X100s 系列,作为直屏手机「版本答案」。 vivo X100s 如何成为直屏党「版本答案」?vivo X100s 做到了「该有的都有」:不仅手机厚度做到 7.8 毫米的轻薄,手感和质感优秀,在配置上也一点都不少。 首先在屏幕上,vivo X100s 搭载 6.78 英寸 OLED 超清原色护眼屏,不仅只卷「三高」(高刷 高亮 高清),还搭载了 8T LTPO 技术,护眼上配备了蓝厂自研的护眼技术,屏幕自适应色温调节上领先 Android 阵营。 作为一款「手机」,信号这件事,vivo 表示自己是认真的。vivo X100s 基于直屏设计重新设计了信号天线,并搭载全新「寰宇信号放大系统」,即使身处万人演唱会,也能实现快速分享视频和照片。 机圈有这么一句俗话「天玑调校看蓝厂」,指 vivo 在联发科天玑处理器调校上一直保持着优秀的水平。这次 vivo X100s 首发了天玑 9300+ ,配合 vivo 自家的「蓝晶」调校,以及「超级稳帧」技术,《王者荣耀》实现 119.85 平均帧率,均方差 0.91,机身最高温度 43.4 度。 影像当然也是 vivo X100s 的舒适区,主摄为 1/1.49 英寸级别 5000 万像素,搭载「超强感光」技术,进光量提升 24.2%。 长焦则为 6400 万像素,支持 100 倍超清变焦,并且还搭载了「灭霸」同款「长焦舞台」算法,因此 vivo X100s 同样也能成为「演唱会神器」。 vivo X100s 的三颗镜头也配备了「灭霸」同款蔡司 T* 镀膜,有效减少杂光鬼影,还搭载了 vivo 自研的蓝图影像芯片 V2。 续航上,vivo X100s 搭载了 5100 mAh 蓝海电池以及 100W 有线闪充。 除了「灭霸同款」的钛色、白月光和深空灰配色,vivo X100s 还多了一款「青云」配色,12GB+256GB 配置售价 3999 元。 而 vivo X100s Pro 则号称「年度影像旗舰」,配置在 X100S 基础上继续升级,搭载了 6.78 英寸超清原色双曲面屏。 影像上则升级为蔡司 APO 超级长焦,搭载「精度跃迁」一英寸主摄,以及蓝图影像芯片 V3。 续航上升级为 5400mAh 蓝海电池和 100W 有线、50W 无线闪充。 vivo X100s Pro 提供白月光、钛色、晨夜黑三种配色,12GB+256GB 配置 4999 元起。 「灭霸」vivo X100 Ultra 固然打出了影像能力的王炸,但是对一些用户而言,手机并不需要这么强大的影像能力,更低的价格和更好的手感更为重要。 vivo X100s 能收割更多直屏党,而 vivo X100s Pro 为想用一款影像优秀的均衡「手机」用户提供选择。 「蓝图影像」品牌发布:「软硬一体化」的影像之路 除了三款手机芯片,vivo 还在发布会上带来了影像品牌「蓝图影像」。 蓝图影像,代表了 vivo 影像在关键场景的认知与积累,是 vivo 自研传感器技术、自研算法、自研影像芯片等影像技术的集合。 vivo 认为,移动影像的理想状态应该是「软硬一体化设计」,这也是蓝图影像正在实现的目标。 事实上,整场发布会上,「软硬一体化」几乎是被提到最多的关键词之一。 从 2017 年开始,vivo 就选定了「影像」为长期赛道,坚持影像「自研」+「共研」:在算法和部分零部件技术上自研,与国内高校和蔡司光学合作共研,目标是实现移动影像 No.1。 「蓝图影像」的成果也在三款新品上得以体现:X100 Ultra 上搭载的是与蔡司合作共研的顶级传感器,三款手机都搭载了自研蓝图影像芯片,以及自研的「长焦舞台」算法,等等。 蓝图影像不仅仅在底层软硬件上为蓝厂的影像能力保驾护航,还带来了 vivo 独特的影调。 这次在三款新品上首发的「人文街拍相机」,在 UI 和功能上尽力还原握持单反相机的感觉,用户可以快速调整快门参数,拍下关键瞬间。 在拍摄模式上,人文街拍相机推出质感色彩、黑白色彩、鲜明与自然色彩等多种模式,以及 24mm/28mm/5mm /50mm/85mm 五大「人文焦段」,以色彩和焦段表达不同的情绪。 在一切都跟 AI 深度融合的 2024 年,「AI 摄影」的玩法 vivo 肯定也不会错过。这次 vivo 推出了一个「黑科技」:四季人像。 「四季人像」能够在保留照片主要元素的基础上,通过 AI 来生成春夏秋冬四季场景,改换照片背景为不同季节的风格。 值得一提的新功能和新产品 除了三款手机和影像品牌的「主菜」,蓝厂这次还准备了一些「甜点」。 vivo 自研的蓝心大模型正式宣布升级为「自研 AI 多模态大模型」,多模态技术让大模型能够从视觉声音、空间等方面接触和理解世界。 vivo 还行业首发带来了多模态大模型技术应用「vivo 看见-蓝心升级版」,基于自研 AI 多模态大模型,帮助视障用户更好看见世界。 而全新的蓝心 AI 录音机支持根据录音内容,自动生成录音文件名,还能一键转文本,并接入了 QQ、微信、钉钉等第三方软件。 vivo 办公套件支持包括 Windows、Mac 在内的五屏无缝协同,万能文档支持打开包括 Pages、Numbers、CAD 在内 57 种专业文件格式。黄韬戏称,vivo X100s 正式加入「苹果全家桶」。 发布会上还带来了智能手表产品 vivo WATCH 3 的全新 ECG 版,内置高精度心电检测传感器,30 秒完成对窦性心律或房颤、房性早搏、室性早搏等指标的提示,搭配 vivo 健康 App 可以生成心电图报告,售价为 1699 元,在 5 月 31 日前与 X 系列组合购买还有 200 元优惠。 在发布会尾声,黄韬给出了 vivo 产品的选购思路: – 直屏党选购 vivo x100s – 想要轻薄的折叠屏,选购 vivo X Fold3 – 想要影像最旗舰,选购 vivo X100s Pro – 折叠屏和影像全都要,选购 vivo X Fold3 Pro – 想要一台打电话的「相机」,选购 vivo X100 Ultra vivo X100s 和 vivo X100s Pro 将于 5 月 17 日正式开售,vivo X100 Ultra 将于 5 月 28 日正式开售。 从「逆光也清晰,照亮你的美」这句 slogan 开始,vivo 开启了布局影像之路。 而在这 7 年间,国产 Android 旗舰也都不约而同加入了「卷影像」的赛道,不少 Android 顶级旗舰,都主打影像这一卖点。 而 vivo 由于早布局和坚持自研+共研,如今靠着核心技术杀出了一条血路,凭借一台预热了超过一年的「灭霸」,以及多款行业首发技术,再一次技惊四座。
19.99 万元起!智己 L6 正式发布 ,不提小米的智己选择做自己
上个月,成立 4 年的智己,终于等来它的「高光时刻」。 在当时的智己 L6 预售发布会上,智己联席 CEO 刘涛似乎在模仿手机圈的营销套路,上演了一次全面「对标」友商的戏码,多次讽刺小米「没有真智能」、「设计靠模仿」。 令人大跌眼镜的是,在智己 L6 超强性能版和小米 SU7 Max 的三电参数对比出现了失实性问题,被小米抓住了辫子,后者连发了三条微博进行抗议。 最终,这场闹剧随着智己致歉函的发布而宣告结束。 俗话说「黑红也是红」,我们很难判断这一轮负面传播对智己是来说赚还是亏,但对于当晚的主角智己 L6 而言,肯定是亏麻了。 实事求是地讲,智己 L6 在产品层面确实称得上是小米 SU7 的强劲对手,尤其是当我们得知它的起售价只有 21.99 万元后—— 今晚,智己 L6 终于正式上市,共计 5 款车的上市权益价也悉数公布: 标准版:19.99 万元 长续航版:23.99 万元 超长续航版:25.59 万元 超强性能版:28.59 万元 光年版:32.59 万元 不得不说,智己这回是真和小米「杠」上了。 所以,智己硬气在哪? 如果忽略刘涛,这是一辆好车 「智己 L6 是上汽新能源科技「十年磨一剑」的最新成果,同时集成了行业尖端智能科技。」智己汽车称。 L6 这把剑是不是真的磨了十年不好说,但这句话的后半句确实是可以肯定的,凭借全新上车的「灵蜥数字底盘」,智己 L6 成为了全国首辆拥有「蟹行能力」的轿车。 智己认为,这是 L6 的「最强王牌」。 提起智己,想必不少人都会想到底盘和驾控,这是智己品牌一直在坚持的产品调性,在首款产品智己 L7 上,智己就请来了威廉姆斯前瞻工程团队来进行调教,还顺手拿下了一个「电动汽车漂移距离最长吉尼斯世界纪录」。 虽然有点「噱头大于实际」,但这还是说明了一些问题的。 在智己 L6 上,智己通过智能化数字管理,为车辆增加了一个「小脑」——灵蜥数字底盘,将车辆的驾控性能拉升到了一个新的维度,甚至能让它「横着走」。 首先是四轮转向。配备这一功能的通常有两种类型的产品,一是轴距过长,需要通过四轮转向来缩短转弯半径的,如宝马 750Li、小鹏 X9 等;第二种是强调运动性能的车型,用以提升高速过弯的稳定性,如保时捷 911、兰博基尼 Huracan Evo。 那智己 L6 属于哪一类呢?事实上,两种作用它都有所兼顾。 低速行驶时,智己 L6 的转弯半径低至 4.99 米,掉头和 Polo 一样灵活。要知道,这辆纯电轿车的尺寸并不算小,轴距达到了 2950mm,与特斯拉 Model S 近似,而后者的转弯半径需要 6.15 米。 对于智己 L6 来说,双向两车道一把过,完全不是问题。 而在高速避险时,智己 L6 的后轮又能让车尾迅速跟上,提高车辆响应速度。智己表示,在四轮转向的加持下,智己 L6 的车身响应速度比 ESP 快了 30%。如果用麋鹿测试成绩来量化它的能力,那便是 90.96km/h,远高于特斯拉 Model S Plaid 的 84.9km/h 和保时捷 Taycan 的 84.3km/h。 这是全世界唯一一辆麋鹿测试突破 85km/h 的车型。 不过,这样的优势用户往往难以感知,智己有做出什么实用的显性功能吗?当然有。 用一个具体场景来举例。 你准备从一个侧方车位泊出,但你发现前后车离你都太近了,需要辗转腾挪好几把,才能驶离车位。这时候你可以点击控制面板上的「一键脱困」,车头便会在轮速差的作用下朝外摆出,随后直接驶离即可。 事实上,智己 L6 的「灵蜥数字底盘」不只有四轮转向这一个功能亮点,它将空气悬挂、扭矩矢量控制等多项系统的控制模块融合上收,由算法中央集控,实现了所有维度的联调联控。 支持全生命周期 OTA,越用越好用。 智己在发布会中表示,他们还会在今年二季度之内推送云台车身控制功能,通过对空气弹簧和阻尼减振器的毫秒级介入,实现高速大角度过弯时的车身侧倾,提升驾乘舒适度。 除灵蜥数字底盘外,智己在发布会上还着重介绍了颇为实用的雨夜模式。 在雨夜模式下,智己 L6 的车载摄像头会增强对于道路的捕捉,并通过 AI 算力去除雨水和雾气的干扰,弥补人眼在恶劣天气时的薄弱点。 总之,我们不难发现,驾驶这件事,依旧是智己最为重视的主打卖点。 也正因如此,智己 L6 延续了 LS6 上的「飓风电机」,其转速可达 21000rpm,峰值功率 579kw,扭矩 800N·m,零百加速 2.74 秒,极速可达 308km/h。 刘涛学会了「管住嘴」 虽然产品可圈可点,但一直以来,智己都是一个没有太多存在感的品牌,最让人印象深刻的,反而是他们的 CEO 刘涛。 刘涛干过不少「雷人」的事。 比如在高速应急车道上测加速、在车里直播包饺子、在发布会上直言「BBA 车主很悲惨」等等。 最近的一次各位应该也有印象:在上个月的智己 L6 预售发布会里,不仅在「碰瓷」小米时写错小米的配置,同时刘涛的一番言论还让智己的品牌形象受到了不小影响: 我们的同学,(忙起来)甚至连自己小孩子的出生都会错过。 我们也有小伙伴连续四次阳,还坚守在工作的第一线。 我们有同学一狠心,把自己年幼的孩子送去了寄宿制学校。 以至于有网友调侃:少买一台智己,就有一个员工少受罪。就连同为上汽集团旗下的兄弟品牌荣威,都要过来踩一脚。 智己后续的操作更是令人迷惑,在小米汽车已经偃旗息鼓,不再回应之时,智己又在次日下午再度「致歉」,不无继续「蹭流量」之嫌。 虽说「黑红也是红」,但对于汽车这样涉及人身安全的大宗消费品来说,「黑红」不仅不会给智己带来积极影响,智己反而会因企业形象的下滑而失去部分潜在用户。 除了智己与小米的这次风波,智己 L6 所搭载的电池也掀起了不小的风波。 智己在发布会中表示,智己 L6 搭载「准 900V 超快充光年固态电池」,可以实现超过 1000 公里的超长续航里程,但随后大家发现,这并非真正的固态电池。 众所周知,目前电动汽车常用的三元锂电池和磷酸铁锂电池都是液态锂离子电池,在过冲、挤压或短路等情况下,都可能发生热失控从而导致起火。 而固态电池使用了固态电解质来取代之前的液态电解质,由此解决了因外力挤压、刺穿、短路所导致的电池起火问题。此外,因其能量密度要远高于液态电池,车辆的续航里程也得到了大幅提升。 可由于固态电池尚有许多技术难题仍未攻克,因此一直没有正式上车,此前只有蔚来在直播测试了他们的 150kW 半固态电池。 「非常难量产,产量比较低,良率也很有挑战。」这是蔚来 CEO 李斌对于半固态电池的评价。 就在大家以为背靠上汽集团的智己实现了新突破时,发现真相并非如此。 根据刘涛和清陶能源总经理李铮对 L6 所搭载的固态电池的描述,L6 的电池采用三元高镍正极以及碳硅负极,电解质中液体含量为 5%-10%,以氧化物电解质为主,添加了聚合物形成复合电解质(IPC),工艺上采用纳米固态电解质涂覆以及固态电解质层成型。 而清陶能源的产品规划显示,这只是他们的第一代产品,要实现真正的全固态,还得等到第三代。 这意味这,智己 L6 所搭载的「固态电池」,实际上是半固态电池。 另外要注意的是,只有上市权益价 32.59 万元的智己 L6 Max 光年版才配备这款半固态电池,该车型比搭载双电机的 L6 Max 超强性能版要贵了 4 万元—— 成本和产能,依旧是半固态电池绕不过的坎,通过高昂售价来规避成本和产能问题的同时,将「固态电池」这一标签与智己 L6 进行绑定。 刘涛这波在大气层。 在今晚的发布会之前,不少人都担心,刘涛今晚会不会又讲出什么令人匪夷所思的话,再「冲」一次微博热搜。 好消息是,智己这次终于有所克制,刘涛不再是发布会的主讲人,本场发布会也没有提到小米汽车,只是在讲转弯半径时,找了宝马这样的「软柿子」轻轻捏一下。 感谢小米,和现在的李想一样,刘涛也学会了「管住嘴」。
官方试探?苹果小折叠屏新机谍照曝光,外屏超大
【CNMO科技消息】近期,网络上再次流传出一张疑似苹果即将推出的折叠屏手机的谍照,引起网友关注。有知名数码博主分析,近期关于苹果折叠屏手机的信息不断,这张谍照极有可能是苹果官方有意为之,意在试探市场反应与公众期待值。不论如何,观察目前市场上即将面世的折叠屏手机均趋向于追求极致的全面屏体验,力求扩大外屏占比,无论是苹果还是其他品牌如荣耀近期频繁曝光的折叠屏新机信息,都是如此。 苹果小折叠屏新机谍照 美国专利商标局(USPTO)最新公示的文件显示,苹果公司又添新专利。这项专利聚焦于折叠屏手机的创新铰链机制,与市面上普遍采用单一折叠方向的设计截然不同,苹果独辟蹊径,提出了一种屏幕既可向内折又能向外双方向折叠的灵活设计,这不仅拓宽了设备的使用形态,也为用户提供了前所未有的便利性。现今市场上的主流折叠屏手机大多局限于向内折叠或单一的外折,苹果的双向折叠专利是在探索一种更加多元化的使用可能性。 此外,业内还流传着一个重量级消息,即苹果与三星之间已经低调达成合作协议,三星将为苹果即将推出的折叠设备提供其尖端显示屏技术。这一合作若属实,无疑预示着苹果折叠屏手机的发布已箭在弦上,今年或许就能亮相。
仅售379元,诺基亚新机成为小红书的流量密码?
上周,诺基亚为了纪念3210诞生25周年,推出了全新3210 4G复刻版本。与初代相比,复刻版在造型上几乎没有太大的变化,但配色更多,还加入了4G网络的支持。尽管诺基亚3210 4G看上去平平无奇,但却引发了全网抢购潮。 (图源:微博) 诺基亚抖音官方直播间上架3210 4G的首个小时库存就被全部清空,小雷观察了淘宝、京东两个官方渠道的电商平台,前者显示无货,后者显示采购中。 (图源:抖音) 3210 4G的「主战场」其实在小红书,作为一个种草平台,几乎任何产品都能被挖掘出闪光点,就连一款按键手机也不例外。截至目前,已经有非常多笔记分享了诺基亚3210 4G的体验报告,但好评并不多。在小雷看来,诺基亚3210 4G的爆火,大部分原因还是网友们给予了太高的期待,不少用户认为这是一款复古味十足的「玩具」,也有部分网友先入为主地认为3210 4G会成为平价版CCD相机。 无论如何,诺基亚的确靠一台3210复刻版抓住了大家的眼球。 复古是真复古,没用是真没用 诺基亚3210 4G出圈的第一个原因是「复古」,作为一款25年前爆款机型的复刻版,即便是迎合时代地多做了些鲜明的配色,也难掩其千禧年代的老旧气息。恰逢近些年来Y2K(Year 2000 Kilo,千禧年代风格)潮流兴起,一切与复古相关的产品、服饰、音乐,都成为时尚风向标。 (图源:Nokia) 但3210 4G注定是一个复古造型的小玩具,一方面,它的确不是智能手机,没法自由地安装第三方应用,即便是作为备用机也很难覆盖到当代生活的大部分需求;另一方面,它是一款按键手机,这意味着对于很多用户来说,还需要重新适应操作逻辑,这并不是一件简单的事情。 至于它的售价,虽然3210 4G只售379元人民币,但对于一款可有可无的小玩具而言,价格还是略贵了些。 真正推动诺基亚3210 4G卖到断货的,其实是「平替CCD相机」的宣传口号。在小红书上随手点开与这款手机相关的笔记,你会发现大多数用户都在讨论它的拍照水平。诺基亚3210 4G配备了一颗200万像素的单摄镜头,配有LED闪光灯,是的,在这个亿级像素遍地开花、超大底传感器四处横行的年代里,竟有一款手机因配备了足够低像素的传感器而受追捧。 (图源:小红书) 诺基亚3210 4G能不能成为平价版CCD相机呢?当然不能。 CCD是一种传感器类型,在CMOS出现之前,一直是相机的主流传感器,而由于这种传感器的物理限制,往往不会配备太高像素,这才有了所谓「复古」的感觉。尽管CCD卡片机、CCD单反通常不会有太高像素,但普遍也来到了千万级左右,再加上相机传感器面积一般比移动设备上的要大,成像的质量还是有明显差距的。 (图源:小红书) 因此,诺基亚3210 4G那颗仅200万像素的主镜头想要实现平替CCD的效果,难度不小。更值得一提的是,「CCD相机」的精髓在于闪光灯,诺基亚3210 4G随配备的LED闪光灯显然无法承担起这样的重任。 这就不难理解,诺基亚3210 4G虽然大热卖,但大多数用户收到货之后都表示了十分失望,这其实也是大家对这台按键手机的期望过高,又或者说给予了与产品定位不匹配的希望。假如回到这款手机原本的定位——可更换电池、支持蓝牙5.0和FM收音机、支持付款码出示、还有4G网络的「老人机」,是不是瞬间觉得性价比还不错? 复刻,可能是一盘好生意 HMD在接手诺基亚手机业务之后,也曾声势浩大地推出过几代旗舰机型,例如Nokia 9 PureView,这是一款搭载了骁龙8系旗舰芯片和五摄系统的旗舰机。但从无论是口碑还是销量,诺基亚的表现都十分一般。 但在非智能机市场里诺基亚的势头就非常猛,数据显示,HMD Global(Nokia)至2020年中期已经占据全球超90%的非智能机市场,主要集中在印度、非洲等欠发达国家及地区。这样的表现,让诺基亚找回了自己的主场,开始更猛烈地向非智能手机市场发起进攻。 诺基亚在非智能手机市场的打法主要是「复刻」,即找回之前的热销机型,更新部分硬件和新的网络支持,让这些机型有更新的吸引力,例如近期热卖的诺基亚3210 4G,就是诺基亚3210的复刻版本。此外,诺基亚复刻的1100 4G,也在2023年实现了2.5亿的总销量,进入手机历史销量榜前十。 (图源:京东) 当然,诺基亚的「复刻」也在不断根据消费者的需求优化,例如移动支付的加入,让用户至少能够在当下电子钱包盛行的时代里满足支付需求;又或是升级到USB-C接口,不至于出行时连借充电宝的权利都没有。基于此,「复刻」虽然是一盘好生意,但似乎也不适合所有手机厂商。 举个例子,当前手机市场里呼声最高的就是小米手机6的复刻版本,不少用户对这款手机的造型、手感和使用体验相当满意,假如能够升级一些性能和网络,或许会引发新一轮的抢购热潮。但从现实角度来看,小米手机6这类机型即便是配上最新的处理器和5.5G网络,受众范围还是相对较窄。 (图源:Nokia) 另外,对于诺基亚而言,「复刻」更像是一种无奈之举,并非主动选择。 诺基亚3210,到底适合谁? 复刻经典机型让诺基亚迎来了泼天的富贵,但或许诺基亚自身也没有作好爆红的准备,第一批库存在开售的几个小时内已经全部清空。据诺基亚官方微博透露,3210 4G的下一轮抢购要等5月31日,你没有听错,诺基亚终于也到了「抢购」的份上了。 但诺基亚3210 4G真的值得抢购吗? 首先,假如你想要把诺基亚3210 4G当成「CCD平替」,那么可以暂时收起抢购的念头了,按已购用户分享的经验来看,它基本无法达到那种水平。更重要的是,由于它并不支持微信登录,这意味着你需要通过蓝牙或数据线的方式导出照片,过程还是相当痛苦的。 (图源:Nokia) 其次,诺基亚3210 4G并没有非常重磅的特色功能,如果你并非对这个型号情有独钟,那么诺基亚在售的220 4G、8800 4G都是不错的选择,实在没必要按时按点去抢购3210 4G。 最后也是最关键的一点:诺基亚3210 4G作为一款玩具或紧急备用机的确是够用的,但只要你有更高一些的要求,比如需要微信交流、拍照等,那么它都不太适合成为你的选择。 无论如何,诺基亚3210 4G本质上是一款耐用、续航好、便携的按键手机,不少用户至今仍有频繁收发短信、接打电话的需求,而像这样一台手机也的确非常适合他们使用。至于想要把它当成「CCD平替」的消费者,那小雷在这里还是要劝诫一句:别对它抱有期待。
谷歌Pixel 9系列真机照曝光 外观大改 搭载Tensor G4
【CNMO科技消息】5月14日,CNMO从外媒了解到,谷歌即将推出的Pixel 9系列在最新泄露的现场手持图片中悉数亮相。上个月已有Pixel 9 Pro的现场图片流出,而现在同一可靠来源再次带来最新消息,不仅详细展示了Pixel 9 Pro的特点,还揭开了Pixel 9和Pixel 9 Pro XL这两款新机的神秘面纱。 值得注意的是,Pixel 9 Pro XL这一命名尚未得到谷歌的官方确认。但根据目前的消息,谷歌计划在今年推出三款高端直板手机,我们暂时将其称为Pixel 9、Pixel 9 Pro以及Pixel 9 Pro XL。其中,Pixel 9作为Pixel 8的升级版本,Pixel 9 Pro XL则继承了Pixel 8 Pro的精髓,而Pixel 9 Pro则是一款在性能上接近XL,但尺寸更接近于Pixel 9的机型。 从泄露的现场图片来看,谷歌Pixel 9系列在设计上摒弃了前代产品的边缘“护目镜”式摄像头模组设计,采用了全新的全平面框架设计。 此外,谷歌Pixel 9原型机配备了12GB RAM,而Pixel 9 Pro和Pixel 9 Pro XL均搭载了16GB RAM。三款手机均提供128GB存储空间,但这些数据在量产阶段可能会有所调整。预计屏幕尺寸将保持不变,Pixel 9为6.24英寸,Pixel 9 Pro为6.34英寸,Pixel 9 XL则达到6.73英寸。 尺寸上,Pixel 9和Pixel 9 Pro相同,但屏幕差异源于Pixel 9拥有较大的边框。Pixel 9 Pro和Pro XL均配备三颗5000万像素后置摄像头,而Pixel 9则仅搭载主摄像头和超广角镜头。Pixel 9 Pro和Pro XL还额外配备了潜望式长焦镜头,支持5倍光学变焦。 三款手机均搭载谷歌自家研发的Tensor G4 SoC处理器,而Pixel 9 Pro和Pro XL还支持超宽带(UWB)技术,但标准版Pixel 9并不支持。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。