EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
普通人如何月入过万?这五大AI副业方向值得关注
‍‍人工智能(AI)领域正蓬勃发展。 麦肯锡的一项最新研究发现,企业使用生成式人工智能的比例已从2024年初的65%跃升至今年3月的71%。随着企业用户开始接受它,普通副业者也开始积极参与。 借助AI开展副业可以做到更高效,既能增加收入,又能节省时间。下面是一些具体的创意和方向: 01.创建定制化GPT 如果熟悉ChatGPT或类似工具的使用逻辑,就可以利用这些知识为特定领域创建定制化GPT(即生成式预训练Transformer模型)。当聊天机器人生成所需代码后,将其部署在私有网站上,并向企业提供免费试用,随后采用按月收费的模式。 具体应用场景十分广泛,例如生成法律文件的自动回复、将笔记翻译成正式报告等。最好的方法是针对客户提及的痛点,或通过社交媒体或专业论坛调研,针对特定的任务,开发自动化解决方案,并且一款工具可以服务数百名面临相同问题的客户。 02.开发AI微型工具 如果没有想法创建定制化GPT,也可以在Gumloop等平台上开发自己的AI工具。这类平台支持通过可视化界面构建可大规模运行的工作流程。 利用拖放模板,可以开发各种功能的工具,从对网站进行搜索引擎优化(SEO)审计,到设计求职者排名系统等。完成开发后,便可向企业推广此服务。 03.AI视频剪辑 以往手动剪辑视频可能需要数小时,这会带来很多限制。目前,借助Veed.IO或Runway等AI工具,可以在极短时间内完成视频剪辑与调色、场景重组、去除背景噪音,甚至生成字幕等操作。 04.AI网页设计 网页设计曾是一项高度专业化的技能,如今在AI的助力下,这一领域的门槛大幅降低。AI工具能够加速设计流程,帮助创建吸引访客的网站,同时由AI承担编写代码的核心工作。在熟悉流程时,可以尝试Wix或Jimdo等平台。 05.AI搜索引擎优化(SEO) 企业总是希望在搜索结果页面中获得高排名,但很少有精力对网站进行深度审核。掌握一定AI技能可以借助工具提高SEO过程,例如针对内容优化、标签调整、为提升可读性提供建议。 部分工具甚至能提供数据分析方法,让长期合作的客户直观了解用户如何发现和使用网站。目前Alli AI、Frase和MarketMuse等工具是不错的选择。 原文来源于: 1.https://www.inc.com/chris-morris/5-side-hustles-you-can-do-with-ai/91190296
AI数字人助力PPT展示,SlidesOrator在BEYOND Expo崭露头角
在近日举行的 BEYOND Expo 展会上,SlidesOrator 项目引起了与会者的广泛关注。这一新颖的工具不需要高端的机械设备或虚拟现实眼镜,展台简约却不失亮点,直接聚焦于每一位职场人士都能感同身受的一个核心问题:如何更好地展示 PPT。 SlidesOrator 的理念与其功能紧密相连,它的目标不仅是帮助用户快速制作 PPT,更在于通过 AI 技术将演讲变得 “自动而可信”。与传统的 PPT 制作工具不同,SlidesOrator 更注重演讲的质量,而不仅仅是内容的堆砌。 图源备注:图片由AI生成,图片授权服务商Midjourney 用户在使用 SlidesOrator 时,只需将自己准备好的 PDF 格式幻灯片上传,系统便会自动生成语音解说,并由3D 虚拟数字人完成整个演示。这一过程不仅省去了真人录音的繁琐,也不依赖于事先的专业训练,大大降低了用户的门槛。 更为惊艳的是,SlidesOrator 并不是简单地播放幻灯片。它的数字人能够根据 PPT 内容即时回答观众提问,模拟出一个完整且互动的 “AI 演讲者” 形象。这一特性使得用户在展示时,可以与观众进行更深入的交流,提升了演讲的互动性和趣味性。 SlidesOrator 团队表示,他们在多语言语音合成、语义摘要、图文匹配和3D 数字人驱动等技术方面进行了深入优化,力求让任何人都能轻松 “托管” 一场高质量的演讲。现阶段,这一系统已经在教育培训、企业宣讲、产品发布等多个领域找到了应用场景,尤其适合那些内容结构化程度高、需要多语种传播的行业。 例如,在跨国展会、在线公开课和初创路演等场合,SlidesOrator 的表现都令人眼前一亮。团队提到,他们的服务受到了许多发展中地区用户的青睐,展会期间,我也看到了一些来自越南和泰国等地的用户上传本地语言的 PPT,展现了这一技术的广泛适用性。 SlidesOrator 不仅提升了 PPT 展示的效率,也为演讲者带来了全新的体验,正在成为现代职场人士的新助力。
欧洲顶尖AI 3D模型研究员创业,拿下超9000万种子轮融资
编译 | 金碧辉 编辑 | 程茜 智东西5月27日消息,据外媒TechCrunch今天下午报道,欧洲顶尖AI 3D模型研究员马蒂亚斯·尼斯纳(Matthias Niessner)将从慕尼黑工业大学视觉计算与AI实验室休了创业假,成立SpAItial并完成1300万美元(折合人民币约为9425万元)种子轮融资。 本轮融资由欧洲早期投资机构早鸟风险投资公司(Earlybird Venture Capital)领投,Speedinvest(一家位于奥地利维也纳的风险投资公司)及多位知名天使投资人跟投。 据外媒TechCrunch报道,SpAItial目前仅发布一支文本生成3D房间的teaser视频,该视频虽简短,却直观展现了通过输入文本指令,快速生成具有一定细节和空间结构3D房间的过程,让外界得以一窥其技术理念与潜力。 而其团队背景堪称豪华。创始人尼斯纳是欧洲AI 3D模型领域的顶尖研究员,在AI及3D模型领域积累了深厚的学术与实践经验。其组建的技术团队成员里卡多·马丁-布鲁亚(Ricardo Martin-Brualla)曾参与谷歌3D电话会议平台(现Beam)的开发工作,在3D通信及相关技术应用方面经验丰富;戴维·诺沃特尼(David Novotny)则在Meta任职六年,主导了该公司的文本转3D资产生成项目,对文本与3D模型转换技术有深入研究与实践成果。 如此强大的团队背景,使投资者对SpAItial在技术研发与行业突破上充满信心,为SpAItial在竞争中提供核心竞争力。 一、Synthesia联合创始人带队,谷歌/Meta技术骨干加盟SpAItial 尼斯纳曾联合创立估值21亿美元(约合人民币151.97亿元)的AI虚拟形象公司Synthesia,此次又为SpAItial组建了明星技术团队:谷歌3D会议平台Beam开发者布鲁亚与Meta文本转3D资产专家诺沃特尼强势加盟。这支聚焦照片级真实感(photorealism)3D生成技术的“铁三角”,为SpAItial在竞争中提供核心竞争力。 同时,外媒TechCrunch透露了SpAItial已将“与早期合作伙伴验证API应用”列为首要任务,并引入前Cazoo(一家成立于2018年底的英国在线二手车交易平台,致力于为消费者提供便捷的线上购车服务,业务模式为从市场采购二手车,定损定价后在网站上出售,目前业务已拓展至多个国家,拥有数千名员工)高管卢克·罗杰斯(Luke Rogers)负责商业策略。 ▲四位合作伙伴,从左到右分别为马丁-布鲁亚、诺沃特尼、罗杰斯、尼斯纳(图源:SpAItial) SpAItial的技术目标不止于“生成3D世界”,更要实现“真实世界的交互性”,这一信息由外媒TechCrunch透露。 实现“真实世界的交互性”的这一愿景通过具体场景案例具象化,例如让3D空间中的玻璃杯实现“逼真碎裂效果”,即不仅呈现视觉层面的3D物体,还需赋予其物理规则下的动态交互能力。 二、3D模型赛道初现竞争:Odyssey融资2700万美元,World Labs估值超10亿 当前,SpAItial面临的竞争对手包括聚焦娱乐场景、融资2700万美元(约合人民币1.96亿元)的Odyssey,以及由AI先驱李飞飞创立、估值超10亿美元(约合人民币72.5亿)的World Labs。 尼斯纳在去年7月接受外媒TechCrunch专访时透露:“相比图像生成等成熟领域,目前,对于高拟真3D环境(photorealistic 3D environments)的市场需求究竟有多大,业界也尚未形成明确答案。” 随着工业数字孪生、AR应用及机器人仿真训练的爆发式增长,高精度3D建模技术被视为撬动万亿美元市场的核心引擎。在此趋势下,SpAItial正押注其核心AI模型。 SpAItial通过开放API接口,开发者可直接调用其3D生成能力开发具体应用:游戏工作室能快速构建虚拟场景,建筑公司可实时渲染设计方案,机器人企业则能生成高拟真训练环境。若这一模式成功,它或将成为3D内容工业化流水线的“动力系统”。 三、绕开游戏平台限制,SpAItial或从替代CAD工具切入3D生成赛道 与其他资金充裕的AI初创公司不同,TechCrunch披露了SpAItial将营收放在优先位置,但短期内需投入算力与人才。 尼斯纳在去年7月接受TechCrunch专访时透露,团队不打算快速扩张至数百人,而是以“质量优先”原则吸纳核心成员,当前SpAItial的研发重点是生成更大规模、更具交互性的3D空间。 尼斯纳透露,由于游戏平台对第三方内容的严格控制,SpAItial的“圣杯”目标可能先从替代CAD(计算机辅助设计)工具切入,当Roblox等平台自建3D生成体系时,SpAItial可能已在建筑设计等领域建立技术壁垒,而3D生成的下一阶段变革才刚刚开始。 3D生成公司SpAItial面临游戏平台(如Roblox)对第三方内容的严格限制,因此该公司调整了其战略方向,他们不再急于直接攻入游戏生态,而是将短期目标转向替代传统CAD设计软件(如建筑、工业领域常用的AutoCAD),通过服务专业场景积累技术优势。 据TechCrunch报道,若未来Roblox等平台开始自研3D生成工具,SpAItial或许已在建筑设计等垂直领域形成技术护城河,而彼时3D生成技术本身也可能迎来新一轮变革,比如从静态模型向动态交互升级,这或将成为行业竞争的下一个焦点。 结语:3D模型技术突围战,SpAItial的工业精度、开发者争夺与合规成本三重挑战 尼斯纳与SpAItial的入局,为尚处萌芽期的文本生成3D赛道注入新变量。1300万美元(折合人民币约为9425万元)的融资规模与顶尖技术团队,使其成为欧洲AI创业领域的焦点。 SpAItial能否在技术攻坚(如交互性实现)与商业落地(如API授权模式)上突破,或将决定其能否在3D生成的“下一章节”中占据先机。而这一过程中,技术突破的节奏、合作伙伴的选择,以及对市场需求的精准捕捉,可能都将成为这家欧洲初创公司的关键挑战。
经典“台灯iMac”复活?苹果带屏音箱最新爆料,带机械臂还能动
编译 | 金碧辉 编辑 | 程茜 智东西5月27日消息,据外媒Mashable昨日报道,彭博社科技记者马克·古尔曼(Mark Gurman)于本月25日最新爆料,苹果首款配备触控显示屏的HomePod智能音箱已进入最终研发阶段,预计将于2025年面世,但具体时间仍不确定。 这款集成7英寸LCD屏幕的创新设备将搭载可拆卸电池组,内置升级版Siri智能助手,支持苹果智能家居控制中枢功能。 ▲苹果新款HomePod爆料图 如果带屏版苹果智能音响真如爆料图中的外形,则酷似2002年苹果推出的一款经典电脑—iMac G4,该造型是苹果产品中非常经典的一款设计,灵感来自乔布斯参与创办的另一家公司—皮克斯动画的经典“跳跳灯”Logo形象。 ▲苹果2002年推出的iMac G4电脑 如果苹果公司能在AI时代,以智能音响的产品形态将这一设计复活,且让它的连接臂能够动起来,一定是既新鲜好玩,又不失经典和情怀。 一、7英寸触屏+可拆卸电池,HomePod新机摄像模组首曝光 据外媒Mashable透露,新款HomePod可能采用类似iPad mini的7英寸LCD显示屏,支持多点触控操作,HomePod内置5000mAh可充电电池组,配合低功耗模式可实现8小时移动使用。 据外媒Mashable援引彭博社科技记者古尔曼称:“带屏HomePod可能是苹果未来将要发布的一系列以AI为核心的产品中的第一款。” 二、曝苹果HomePod升级,人脸识别与手势实现多交互,高阶版将搭载机械臂 外媒Mashable透露,虽然新款HomePod设备将内置扬声器,但苹果可能会将其定位为智能家居中枢,而不仅仅是一款家庭扬声器,后续该设备可能将延伸出搭载机械臂的高阶版本。 据苹果智能家居产品线触控模组主力供应商宸鸿科技(TPK Holding)高层向台湾《电子时报》(DigiTimes)独家透露(2024年7月15日报道),新款HomePod设备顶部配备1080P广角摄像头,可实现人脸识别与手势交互功能。 古尔曼在昨日发布的《Power On》专栏中披露称:“HomePod机械臂机型可自主完成物理交互操作,目前研发进度符合预期,我们可以在第一款产品上市一两年后期待它。” 三、Siri技术短板拖累产品进度,HomePod延期暴露苹果软肋 据外媒Mashable透露,HomePod产品原定2024年上市计划,现因AI技术瓶颈已推迟18个月。 古尔曼在昨日发布的《Power On》专栏中透露,苹果带屏HomePod智能音箱的延期发布,核心问题在于其智能助手Siri的技术瓶颈。 作为语音交互领域的早期开拓者,Siri目前在多轮对话理解、上下文关联等AI核心能力上显著落后于OpenAI的ChatGPT-4及谷歌Gemini等竞品。 结语:苹果带屏HomePod即将来袭,能否打破智能音箱市场僵局? 苹果首款带屏HomePod已进入最终研发阶段,这款集成7英寸LCD屏幕、可拆卸电池组,且具备智能家居控制中枢功能的产品,预计将于2025年面世。它的出现,有望为苹果智能家居生态补上关键一环,也将为用户带来全新的智能交互体验。 HomePod的推出面临着诸多挑战,不仅要突破Siri的技术瓶颈,还要在竞争激烈的市场中找准定位,与谷歌、亚马逊等竞品争夺份额。 但苹果若能解决技术短板,为用户带来出色的智能家居控制体验,HomePod或有机会在市场中脱颖而出。
对标GPT-4o!蚂蚁开源统一多模态大模型Ming-lite-omni,理解生成一体化
作者 | 李水青 编辑 | 心缘 智东西5月27日杭州报道,今日,在蚂蚁技术开放日上,蚂蚁集团宣布开源理解与生成统一多模态大模型Ming-lite-omni。该模型支持将理解和生成模型合在一起调用,也可以单独完成理解和生成任务,带来原生全模态交互体验。 智东西与蚂蚁集团基础智能负责人西亭等相关负责人进行了面对面对话。西亭告诉智东西,新开源的Ming-lite-omni模型有几个值得关注的创新点:一是真正把生成和理解模型放到一个模型;二是真正意义上的全模态输入和输出,都支持音视频、图文多种形态;三是真正是以MoE为架构的模型,中间没有串其他东西,交互性较强。 据悉,团队希望这个模型能够接近GPT-4o像人一样去交互,但GPT-4o是闭源模型。所以团队给自己设定一个目标:希望推出一款非常接近GPT-4o的原生全模态模型,而且将彻底开源。 全球顶尖AI科学家、阿里集团副总裁许主洪在会上发表演讲,他认为,当下多模态大模型的一大演进趋势,正是用统一的框架做理解和生成。这一领域发展尚处于的初级阶段,需要实践验证。今日蚂蚁开源的Ming-lite-omni,正是这一领域的代表性实践。 ▲许主洪在讲解统一多模态模型产业发展脉络 统一理解与生成的多模态大模型面临众多技术挑战。在全模态交互挑战方面,当下支持音、视、图、文全模态交互的公开单模型非常少见;在理解与生成统一方面,图像和语意的理解生成统一模型鲜有出现,且理解和生成效果难以平衡。 蚂蚁为什么选择在当下节点开源这样一款“大一统”模型? 西亭告诉智东西,团队从去年9-10月份开始就一直在尝试和探索这件事情,之所以今年把它开放出来,也是受业界开源举措启发想要回馈社区。越简洁的东西越美,很多做技术的人都希望有一个“大一统”的模型,Ming-lite-omni就是把多模态繁琐的过程用一个较简单的形式表达出来。就蚂蚁的AGI事业部的技术路线而言,最好的AGI就是最好的产品。用户选择一款模型的理由就是它的智能上限高。所以团队把追逐更好的智能能力作为目标,这也是推出Ming-lite-omni并开源的一个很大初衷。 截至目前,蚂蚁集团今年已开源了多款模型,包括Ling-lite-1.5语言大模型,推理模型Ring-lite-1.5、Ring-lite-linear,以及今天推出的多模态模型Ming-lite-omni。 其中,Ling-lite-1.5整体能力已达到同等规模(16.8B-A2.75B)模型的SOTA水平,整体能力超过Qwen3-4B;Ring-lite-1.5推理能力达到Qwen3-8B水平,AlME24/GPQA/LCB平均分接近Qwen3-30B-A3B;Ring-lite-linear采用混合线性注意力机制架构,有效降低计算复杂度和显存占用,突破长上下文推理效率瓶颈。 回顾蚂蚁通用语言模型Ling的探索过程,Ling-plus及Ling-lite(0220版本)采用轻量级分布式分析、异构硬件自适应训练策略、MoE架构优化,从而实现了同尺寸模型的SOTA(行业最佳)性能。发展到Ling-lite-1.5,其仅用2.75B激活计算,可对标10B内SOTA dense模型;再到近期开源的Ling-lite(0415版本),采用分层语料预训练策略跟需求驱动的执行优化体系,以更少的语料和更高的质量,性能超过同尺寸下SOTA模型(如Llama-3.1-8B、Qwen2.5-7B等),大幅提升了数学、代码等推理能力。 除了模型更新,蚂蚁集团在行业大模型方面也有新进展。旗下AI健康管家不久后将上线新版本。当下,虽然基模能力越来越强,但在医疗领域仍面临严肃性、专业性、复杂性和个性化多方面挑战。AI健康管家是其与卫健委合作开发的应用,通过高质量数据资源、专业标注团队等多方面优化模型,主打“AI就医助理”、“AI健康咨询”和“AI家庭医生顾问”三方面,和个人健康档案打通,充当健康助理角色。 结语:统一多模态,探索AGI能力上限 当下,AGI正飞速发展,一方面带来更多商业机会,另一方面也带来更多技术不确定性。2015年的5月27日,由于杭州市萧山区某地光纤被挖断导致支付宝大规模宕机,部分用户无法使用支付宝。527这一天,因此也被设定为蚂蚁的技术开放日,用以勉励蚂蚁技术人要永远保持对技术的敬畏和创新之心。 在527技术开放日公布一系列大模型新进展,体现了蚂蚁在AGI时代化挑战为机遇的决心。一方面,蚂蚁AGI团队在探索追求智能能力的上线,打造统一多模态的AGI产品;另一方面,其开源步伐紧锣密鼓,有望联合社区力量共同推进大模型产业发展,也将影响AI产业格局。
终于破产,这家“AI 独角兽”竟然用真人程序员骗倒半个创投圈?
近年来,人工智能浪潮席卷全球,打着 AI 旗号的创业公司如雨后春笋般涌现。 其中,Builder.ai 曾凭借 “AI 驱动的无代码 App 开发平台” 概念风光无限,吸引众多知名投资机构注资,估值一度高达 17 亿美元。 然而,光鲜表象下,却是一场精心编织的骗局 —— 这家公司用真人程序员冒充 AI 工作,直至 2025 年 5 月 20 日正式宣布破产,其造假的来龙去脉令人瞠目结舌。 所谓AI背后竟然是真人程序员牛马 2016 年,印度裔创始人 Sachin Dev Duggal 在伦敦创立 Builder.ai,起初名为 Engineer.ai,2017 年推出首款 AI 平台产品 Builder V1。 公司宣称,用户只要提供想法,平台就能通过 AI 自动组合出定制化的 App 架构、功能模块和界面,并快速交付上线。 不仅如此,Builder.ai 还声称其开发成本不到传统软件开发成本的三分之一,速度却是传统开发的两倍。在 AI 概念正当红的时期,这样的宣传无疑极具吸引力。 凭借亮眼的 “AI 技术” 概念,Builder.ai 迅速在资本市场崭露头角。自成立以来,公司累计融资近 5 亿美元,投资者阵容堪称豪华,微软、卡塔尔投资局、Insight Partners、软银 DeepCore 等知名机构纷纷入局。 2023 年 5 月,Builder.ai 完成 2.5 亿美元的 D 轮融资,彼时公司估值高达 17 亿美元,成为炙手可热的独角兽企业。 此外,公司还与 BBC、NBC、富士通等企业展开合作,2021 年更是被纳入 Gartner 的 “多体验开发平台(MXDP)” 魔力象限中的 “愿景者(Visionaries)” 象限,一时风头无两。 然而,华丽的包装之下,真相却令人震惊。 2019 年,《华尔街日报》的一篇报道撕开了 Builder.ai 的虚假面纱。多位前员工爆料,公司所谓的 AI 平台,大量功能实际上是靠印度工程师手动编码完成。 用户在平台上看到的看似由 AI 生成的界面,背后却是无数程序员在加班加点地敲代码。更令人惊讶的是,公司甚至没有一个真正专业的 AI 研发团队,而是靠大规模雇佣数以万计的低成本开发者,以人力方式完成原本声称由 AI 实现的开发流程。 这种 “挂羊头卖狗肉” 的行为,本质上是用真人程序员冒充 AI,以此欺骗投资者和客户。 随着时间推移,Builder.ai 的虚假商业模式逐渐难以为继。 公司实际资金消耗远超营收能力,财务状况日益恶化。 2024 年 8 月提交的上一财年报告显示,截至 2023 年 3 月,公司营收仅为 2300 万英镑,却连 9% 的日常运营开销都无法覆盖。面对资金压力,公司不断寻求融资续命,2024 年 10 月从债权市场获得 5000 万美元融资,2025 年 3 月又从老股东处紧急注资 7500 万美元。但这些资金仍未能扭转局面,2025 年 2 月,创始人 Duggal 辞去 CEO 职务,由亚马逊和 Flipkart 的前高管 Manpreet Ratia 接替。 然而,新的管理层也无力回天,5 月 20 日,Builder.ai 正式宣布进入破产程序,试图支付员工薪资的资金也被债权人冻结。据估算,公司拖欠微软云服务费用 3000 万美元,拖欠亚马逊 8500 万美元,债务窟窿巨大。 Builder.ai 的轰然倒塌,给整个创投圈和科技行业敲响了警钟。对于投资者而言,在追逐热门概念时,更应保持理性和谨慎,加强对企业技术真实性和商业模式可持续性的深入调查。不能仅仅被华丽的宣传和亮眼的数据所迷惑,而应透过表象看本质,避免成为类似骗局的受害者。 AI公司造假,并不是个例 在人工智能热度持续高涨的当下,类似 Builder.ai 的 “伪 AI” 公司或许并非个例。 美国 AI 教育创企 AllHere 的故事同样令人唏嘘。该公司成立于 2016 年,其明星产品是一个名为 Ed 的 AI 聊天机器人,据称可提供定制化支持,促进家校沟通,提高学生的出勤率和课业表现,AllHere 对外宣称其用户涵盖美国的 9100 所学校。 在 “爆雷” 之前,AllHere 在 2020 年完成了 A 轮融资,获得哈佛校友基金 The Yard Ventures 和 Alumni Ventures(美国最大的个人投资者风投)等投资公司的注资。2023 年,他们公布公司年度经常性收入(ARR)达到 760 余万美元,并在当年开启了 B 轮融资,但未能完成。 然而,今年 6 月,外部会计师在对 AllHere 的财务状况进行审计时,发现其营收情况要远远少于其对外公布的数据,仅年度经常性收入一项就被夸大了近 700 倍。为掩盖这一问题,创始人兼首席执行官 Joanna Smith - Griffin 还假扮财务顾问向投资者发送虚假财务信息。这一行径最终败露,Smith - Griffin 遭到美国纽约联邦调查局的调查。AllHere 目前已宣告破产,全部员工均被遣散,其聊天机器人 Ed 停止服务。 这些闹剧不仅让我们看到了商业世界的复杂与残酷,也促使整个行业反思和审视自身的发展。 AI公司造假的手段大揭秘 (一)技术造假 夸大 AI 能力:许多创业公司在宣传时,过度夸大自家 AI 技术的性能和应用范围。比如一些声称能够实现精准医疗诊断的 AI 创业公司,实际技术可能仅处于实验室研究阶段,离临床应用还有很大差距,但却在宣传中暗示已经能够广泛应用于医疗实践,误导投资者和消费者。 伪 AI 技术包装:除了像 Builder.ai 那样用真人冒充 AI 工作外,还有一些公司将传统算法重新包装,贴上 AI 的标签。例如,把普通的数据统计分析算法包装成具有智能预测功能的 AI 算法,利用大众对 AI 技术的不了解,骗取信任和投资。 虚假演示:部分创业公司在产品演示环节做手脚。通过精心设计的演示场景,展示出 AI 产品强大的功能,但实际产品在真实环境中根本无法达到演示效果。比如一些智能家居 AI 控制系统,在演示时能够完美地控制各种家电设备,但消费者购买回家后却发现问题百出,根本无法实现宣传中的智能联动。 (二)数据造假 虚构用户数据:为了显示产品受欢迎程度,一些 AI 创业公司会虚构用户数量、使用频率等数据。例如,AllHere 对外宣称其用户涵盖美国的 9100 所学校,但实际从成立到破产期间仅有 31 名客户。这种虚假的用户数据会让投资者误以为产品市场需求大,前景广阔,从而吸引投资。 伪造营收数据:通过篡改财务报表,夸大公司的营收情况,制造公司盈利能力强的假象。如 AllHere 在融资过程中,创始人 Smith - Griffin 向投资者报告的年度经常性收入与实际数据相差巨大,2023 年宣称年度经常性收入为 700 余万美元,而真实数据仅为 117 万美元。这种伪造营收数据的行为不仅欺骗了投资者,也影响了市场对公司价值的正确判断。 操纵数据指标:在一些需要数据指标来衡量产品性能的领域,如 AI 图像识别技术的准确率、AI 翻译的准确率等,部分公司会通过操纵测试数据来提高指标数值。比如在测试 AI 图像识别产品的准确率时,故意选择一些简单、容易识别的图像进行测试,而不是采用真实场景下复杂多样的图像,从而得出虚假的高准确率数据。 (三)团队造假 虚假专家背书:邀请一些与 AI 领域关联不大,甚至没有相关专业知识的名人或专家为公司站台,声称他们是公司的技术顾问或合伙人,以此提升公司的可信度。例如,某些公司会聘请一些知名演员或体育明星担任所谓的 “AI 战略顾问”,但这些人实际上对 AI 技术一窍不通,只是为了利用他们的名气吸引关注和投资。 夸大团队成员背景:对团队成员的学历、工作经历进行夸大或造假。比如宣称团队中有多位来自顶尖科技公司的资深 AI 专家,但实际这些人可能只是在相关公司担任过普通职位,甚至根本没有在这些公司工作过。通过这种方式打造出一个看似实力强大的团队,让投资者相信公司具备强大的技术研发能力。 AI 创业公司造假严重破坏行业信任,投资者和消费者信心受挫,连累诚信企业发展。同时,造假导致资源错配,真正创新企业难获资金,阻碍 AI 技术进步。虚假数据还误导市场决策,投资者易因不实信息受损,企业合作选错伙伴,政府政策制定也会出现偏差,无法有效推动产业发展。 应对造假,投资者需组建专业团队深入尽调,保持理性,避免跟风。监管部门应完善法规政策,明确技术、数据等标准,加大处罚力度。行业协会要加强自律,制定准则,建立信用评价体系,奖惩分明。此外,还需通过科普宣传提升公众对 AI 的认知,增强辨别能力,鼓励公众监督举报,共同营造健康的行业环境。
声音克隆+视频通话,豆包猜出了我住哪个小区
豆包的新功能,大家都试了吗? 在最新版的豆包APP里,已经有“视频通话”的功能。 也就是说,你现在可以打开摄像头,让豆包直接“看”了。 我测试的时候,豆包不仅一眼看出我家龟背竹是仿真的假货,还通过窗景猜出了我家小区的名字,真是刺激。 目前,“视频通话”已经是各家AI厂商争相上线的功能:OpenAI的ChatGPT、谷歌的Gemini,以及国内的智谱等,都已经让AI“开眼”。腾讯紧紧跟上,预计下周就会在元宝中看到类似功能。 别忘了,下一代硬件的寻找和创造,正在世界范围里上演。当我们不再需要举起摄像头,视频通话还会带来更多想象力。 01 “视频通话”,相当于豆包有了眼睛 豆包的视频通话入口在“打电话”里,只不过从前点击通话,仅有语音通话的功能,现在出现了一个摄像机按钮。实际体验下来,这样的安排符合使用逻辑。 点击按钮,画面上出现你手机镜头拍摄的实时画面。 所以要注意的是,和豆包视频通话,与和人视频通话有很大区别,不是说豆包作为一个虚拟形象和你面对面,而只会有你单方面的视频画面。更像是在给豆包做一对一的视频直播,或者说邀请豆包通过你的摄像头看你的世界。 我们进行了以下测试: 第一,这是什么? 作为热身项目,先测试一下豆包对各种事物的判断是否准确。 摄像头打开后,豆包主动发言,描述我正坐在电脑前,后方的电视正在播放美剧。 对家具、电器等的判断没有难度,轻松回答。令人惊讶的是以下三件: 在刻意摇晃镜头的情况下,一个看起来是大马克杯的保温杯,一盆(很多来我家的朋友都以为是真植物的)仿真龟背竹,在猫窝里只露出两只脚和尾巴(且堆叠在一起)的橘猫,豆包都回答正确。 第二,我在哪儿? 判断物品没问题,我试图将豆包带到更有挑战的场景里。 镜头对准窗外,让豆包帮我看看我在哪里。豆包先是根据街景和绿化度,给出了三个城市的名称,其中包括正确答案,另外两个城市也距离很近。接着看到了路牌上的街名,这条街道非常长,有几公里,但是豆包准确说出了我所在的小区的名字。 第三,这怎么用? 接下来是一个日常的“有用”场景,让豆包教我使用电器。 镜头对准一个小电器,豆包准确判断这是一款“胶囊咖啡机”。我随后便问“胶囊是什么”边用镜头快速扫过桌面,它用很自然的语言告诉我:“就在那儿啊,一个米色袋子里”。 随后,豆包又指导我将胶囊放入咖啡机并按下按钮,在我表示按了按钮没反应后,又指导我检查水箱。全程豆包并非机械式地“背诵使用说明”,而是根据看到的画面进行指导,比如“机器后方的两个黑色按钮”“把机器侧一下,我看看水箱在哪里”“就是后面带刻度、塑料的那个”。 整个过程非常丝滑、自然。 第四,我该买点啥? 很多人已经在用AI辅助减肥,比如制定饮食、健身计划,但是人嘛,自述情况很有可能有偏差,要是直接让AI看呢? 打开冰箱,让豆包猜猜我的饮食习惯,并给出采购建议。豆包准确总结我的食物种类很多,肉食和速冻食品比较多,建议我购买绿叶蔬菜。可以说是一针见血了。 几个简单的测试走下来,可以看出豆包可以透过镜头,颇为准确地判断看到的事物,并且和用户产生实时的互动。这提供了很多想象力,如在旅游时提供帮助、在采购时提供建议、教用户使用物品等。 02 视频通话仍摆脱不了“AI味儿” 特别要指出的一点是,豆包在视频通话时,语言平实,表达方式生活化、口语化,不会有很机械、死板的感受,这非常重要。 顺便推荐一个“进阶”玩法:豆包语音克隆+视频通话。语音克隆的功能已经在豆包里很久了,用户不仅可以选择豆包提供的预设音色,还可以通过简单的步骤获得克隆的音色。 我的豆包里一直用的是姐姐的克隆音,豆包在视频通话中的语言又非常日常,也因此,视频通话时真的有一种在和我姐打视频的错觉。 不敢想象如果我给我妈的豆包安排一个我的克隆音,再教会她怎么视频通话,她会有多爱用。 我们也同步测试了ChatGPT,在视频通话模式下,二者的准确度都很高。但是ChatGPT没有看出彩色马克杯实际上是一个保温杯,进一步追问才给出判断,且在“看窗景猜地点”的小测中,ChatGPT的回答离正确答案差得很远。 另外很明显的感受是,ChatGPT在视频通话模式下的表达方式“更AI”,措辞比较书面化,不确定使用英文的话,ChatGPT会不会更自然一些。 但也不是没有遗憾,目前豆包视频通话还是要“等一下”AI的回复。而且有时候可能是问题比较难回答,“思考”时间会更长一些,经常出现以为AI卡住了,结果和AI一起开口的情况。 另一个遗憾是,在视频通话中,依然遵循用户说话、AI回答的模式。在实际体验中,豆包会在自己的句尾主动和用户互动,比如“你在看《无耻之徒》吗”,但是它做不到“主动出击”。 如当我告诉豆包,我现在要打字,当看到“2”的时候立刻告诉我。虽然豆包欣然答应,但是它并不会在看到“2”的时候立刻指出,而是必须等我询问,它再回答。同样地,对“看到扫地机器人就立刻告诉我”的请求,它也同样无法做到。它的确看到了机器人,但是需要等我再说一句话,才轮到它发言。 当然,这些不仅是豆包视频通话的遗憾,ChatGPT也是同理。和已经普及的“语音通话”一样,AI依然需要遵循既定的对话模式,而非像人与人沟通时那般灵活。 03 AI交互方式再次迭代 “视频通话”可以带来很多想象力,尤其是在如今“AI代理”成为风口、“超级AI助理”成为桂冠上的明珠之时。 豆包此次的升级基于“豆包·视觉理解模型”。该模型去年年底发布,此后又经历了升级,同时具备内容识别能力、理解和推理能力以及更细腻的视觉描述能力。 从2022年底ChatGPT横空出世之后,我们与AI的交互方式已经不断进化:纯文本交互(你打字给AI,AI也回复文字)、实时语音交互(直接和AI说话,AI也用声音回复)、图像交互(你发给AI一张图片或视频,AI可以解读)、实时图像交互(视频通话)。 能直接打开摄像头,让AI自己“看”,直接邀请AI“进入”所处的世界,相当于揭开了我们和AI之间始终隔着的一层名为“描述”的薄纱。从实际体验来说,在视频通话时,AI的“Agent”属性更加凸显,而非一个手机里的小小工具。 去年12月,OpenAI就给ChatGPT加入了视频通话的功能,谷歌的项目Project Astra也已经启动。在国内,包括智谱在内的头部AI玩家也已经配上了视频通话。此外,就在上周,腾讯旗下语音通话模型Hunyuan-Voice宣布将于6月登陆元宝APP,直接对标字节跳动旗下豆包AI的视频通话功能。 让AI“开眼”,已经越来越普遍。 对此,前不久在谷歌I/O开发者大会上,谷歌DeepMind创始人兼CEO戴密斯·哈萨比斯(Demis Hassabis)称,他们将Gemini打造成一个世界模型,是开发一种新型、更通用、更有用AI助手的关键一步。 这家巨头目标直接指向构建通用AI助手。大会上宣布,Gemini Live正式向 iOS 和安卓用户开放。这项功能可以实时识别并回应用户手机摄像头和屏幕上的内容。 更值得注意的是,Gemini Live是Project Astra的延伸,而后者也在大会上展示了新的进展:更主动。比如AI“看”着用户做题,在发现错误的时候会直接指出。 这也对应了在使用现有AI视频通话功能时的那个困扰,即虽然AI已经看到了某个物品,但仍然要“用户一句,它一句”,等着轮到自己发言。 而以上讨论还仅限于手机这个核心硬件。但未来的“AI硬件”未必还会是手机,如果下一代硬件比手机更小巧、更灵活,那视频通话的能力还会发挥更大潜力。 比如如今已经被AI厂商积极尝试的XR眼镜,通过这个设备“观察”世界,不需要用户举起手机。可以想象,如果你戴着一副AR眼镜,打开摄像头,AI将可以更“无形”地提供帮助(甚至只是陪伴)。 随处可见“自言自语”的人类,这样的未来也许已经不远了。
雷鸟创新亮出万元AR眼镜王炸,对标Meta,融合安卓,X3 Pro 8999元起
作者 | 云鹏 智东西5月27日报道,刚刚,国内AR大厂雷鸟创新发布了最新旗舰全彩AI+AR眼镜雷鸟X3 Pro、更轻便小巧的AR眼镜雷鸟Air 3s系列,以及AI拍摄眼镜雷鸟V3 Slim等多款新品。 根据洛图科技数据,2025年第一季度,雷鸟创新在中国AR/AI拍摄眼镜线上市场以50%的市场份额排名第一。其中雷鸟V3在AI拍摄眼镜细分市场占有率达95%。 雷鸟X3 Pro在芯片、交互、空间计算、重量与光学显示五个核心技术领域实现了技术难点的突破,并引入了可视化Live AI和安卓虚拟机,应用生态更完善。 价格方面,雷鸟X3 Pro首发定价为8999元起,雷鸟Air 3s售价1499元,Air 3s Pro售价1599元起,雷鸟V3 Slim售价1799元起,四款产品均支持国补。 一、屏幕虽小大有乾坤,定制大模型,联合行业大厂提升应用体验 首先来看旗舰产品雷鸟X3 Pro,其为雷鸟创新发布的第三代彩色真AR眼镜,搭载了全球最小可量产全彩Micro-LED光引擎,并与应用材料公司(Applied Materials)联合研发了纳米光刻刻蚀RayNeo光波导,实现了43英寸全彩3D空中透明屏显示效果。 在空间感知方面,雷鸟X3 Pro搭载了猎鹰影像Plus系统,可将空间定位误差控制在千分之五以内,让眼镜具备广泛适用的空间识别能力。 在交互方面,雷鸟X3 Pro首次实现了Apple Watch手表控制,并支持镜腿五维导航、语音、手机联动等多种交互方式的融合,提升交互效率。 性能方面,雷鸟X3 Pro搭载第一代骁龙AR1平台,其高性能摄像头ISP可以实现高质量的图像和视频功能。 轻薄减重方面,眼镜使用了航空级镁铝合金支架和钛合金转轴,兼顾强度与强支撑特性,雷鸟X3 Pro将重量控制在了76g,据称是全球最轻的彩色AR眼镜之一。 在应用生态方面,RayNeoOS 2.0系统集成了AI翻译、空间导航、AI录音、通话转文字、第一视角摄影摄像等功能,体验更智能、更便捷。 雷鸟X3 Pro内置通义独家定制的第一视角多模态大模型,成为全球首批支持可视化Live AI交互的AR眼镜。无论步行、用餐还是交谈,用户都能随时提问,获得即时智能反馈。 后续,雷鸟创新将推出AI Agent应用商店,上线DeepSeek、白酒识别、奢侈品识别、英语陪练、模拟面试等海量AI智能体。 为进一步拓展应用边界,雷鸟X3 Pro首发了“RayNeo AR应用虚拟机”,实现了安卓与AR眼镜生态的融合,首批支持抖音、B站、王者荣耀等30余款主流APP,让用户在AR眼镜与智能手机间可以无缝切换。 此外,雷鸟创新还宣布与阿里云、高德地图、蚂蚁集团等多家公司在AI与AR眼镜的AR眼镜大模型、地图导航、眼镜安全等多个领域展开深度合作。 二、加速全民AI+AR普及,窄脸型用户也有能舒适佩戴的眼镜了 发布会上,雷鸟创新还发布了新一代口袋电视雷鸟Air 3s系列,以及新一代多功能内容终端雷鸟魔盒2代。 雷鸟Air 3s系列全系采用孔雀光学引擎2.0+第5.5代Micro-OLED屏幕,在画质精度、清晰度和亮度上有比较明显的提升,雷鸟Air 3s Pro还搭载了3D环绕音效系统。 为了带来更好的巨幕观影体验,雷鸟创新为雷鸟Air 3s系列配合推出了影音终端雷鸟魔盒2代。其搭载FlyTouch触控系统,配备3.5英寸触控板,支持毫米级响应和多点操作,可通过内置陀螺仪实现如鼠标般的操控,提升交互效率。 作为本次发布会的另一款新品,雷鸟V3 Slim是雷鸟创新为窄脸型用户开发的小尺寸型号,相比V3,它将前框长度缩至150mm,并通过框型优化,使它更加贴合小脸型用户佩戴。 结语:硬件、软件、生态创新三路并行,雷鸟创新趟出AI+AR新路子 可以看到,雷鸟旗舰AI+AR眼镜的背后,是从硬件、软件到生态的一系列硬核技术创新:定制化模块、联合行业大厂研发突破技术难题、系统级创新提升用户体验。 如今AI眼镜快速发展,行业人士预计今年将会有诸多AI眼镜新品发布,行业竞争也将愈发激烈。已经杀入行业前列的雷鸟创新如何面对挑战者发起的攻势,AI眼镜产业格局将怎样演变,我们将持续深入关注。
谷歌发布开源LMEval框架:打破AI模型比较壁垒,降低评测成本和时间
IT之家 5 月 27 日消息,科技媒体 The Decoder 昨日(5 月 26 日)发布博文,报道称谷歌推出开源框架 LMEval,为大语言模型和多模态模型提供标准化的评测工具。 评测新型 AI 模型一直是个难题。不同供应商使用各自的 API、数据格式和基准设置,导致跨模型比较耗时且复杂。 而谷歌最新推出的 LMEval 开源框架直击这一痛点,研究人员和开发者只需设置一次基准,就能展开标准化的评测流程,大幅简化了评测工作,节省了时间和资源。 LMEval 还通过 LiteLLM 框架抹平了 Google、OpenAI、Anthropic、Ollama 和 Hugging Face 等平台之间的接口差异,确保测试跨平台无缝运行。 LMEval 不仅支持文本评测,还涵盖图像和代码等领域的基准测试,且新输入格式可轻松扩展,框架支持是非题、多选题和自由文本生成等多种评估类型。同时,该框架能识别模型采用的“规避策略”,即故意给出模糊回答以避免生成有风险内容。 Google 还引入了 Giskard 安全评分,展示模型规避有害内容的表现,百分比越高代表安全性越强。测试结果存储在自加密的 SQLite 数据库中,确保数据本地化且不会被搜索引擎索引,兼顾了隐私与便捷。 LMEval 具备增量评估功能,无需在新增模型或问题时重新运行整个测试,仅执行必要的新增测试即可,并采用多线程引擎并行处理多项计算,有效降低了计算成本和时间消耗。 谷歌还开发了 LMEvalboard 可视化工具,通过雷达图展示模型在不同类别中的表现。用户可深入查看具体任务,精准定位模型错误,并直接比较多个模型在特定问题上的差异,图形化展示一目了然。
苹果偷偷测试2亿像素主摄,20周年纪念版要杀疯了?
5 月 27 日,知名博主数码闲聊站爆料称:苹果正在测试 2 亿像素的主摄,而且大概率会用在 20 周年纪念版上。 此消息一出,网友们立刻分成了两派:一派高呼 “苹果终于要堆料了”,另一派则质疑 “卷高像素真的有必要吗?” 图源:微博 这里先给大家普及一下哈。目前 iPhone 16 系列的主摄是 4800 万像素,而安卓阵营早就把 2 亿像素下放了,比如三星、vivo 、小米手机等。 简单来说,2 亿像素意味着照片的细节会更丰富。比如你拍一张风景照,放大后连树叶的脉络都能看得清清楚楚。但高像素也有缺点,文件体积会变得很大,一张照片可能要几十 MB,对存储和传输来说都是个考验。不过话说苹果的 A 系列芯片一直很强,A19 Pro 采用了台积电 3nm 工艺,处理高像素应该不在话下。可能这也是苹果为什么想测2亿像素的原因之一。 图源:三星 要知道苹果在影像方面一直比较保守,从 1200 万像素用了很多年,直到 iPhone 14 Pro 才升级到 4800 万像素。这次突然测试 2 亿像素,小雷觉得有以下几个原因: 一是重视 20 周年纪念版的意义。苹果对周年纪念版一直很重视,比如 iPhone X 就带来了全面屏革命。2027 年是 iPhone 诞生 20 周年,苹果肯定想搞个大新闻。 除了 2 亿像素主摄,据说还会有环绕式屏幕、全息投影等黑科技。2 亿像素主摄可能只是其中的一部分,苹果想通过技术突破来纪念这个重要时刻。 图源:微博 二是来自安卓阵营的压力。安卓阵营在影像方面已经卷了好几年,2 亿像素、1 英寸大底、潜望式长焦…… 各种技术层出不穷。 虽然苹果的影像算法很强,但硬件上的差距还是肉眼可见。比如三星 Galaxy S25 Ultra 的 2 亿像素主摄,在解析力和变焦能力上确实比 iPhone 16 Pro 更有优势。苹果如果再不创新的话,可能会在高端市场失去竞争力。 三是用户需求有所变化。现在手机已经成为大多数人记录生活的主要工具,用户对拍照的要求越来越高。高像素能满足用户对细节的追求,尤其是在社交媒体分享时,清晰的照片更受欢迎。 图源:Apple 其实小雷挺支持苹果尝试高像素。苹果的影像算法一直是行业标杆,如果能把 2 亿像素和算法结合好,可能会带来质的飞跃。比如用上三星 HP2 再加上苹果的 Deep Fusion 和 ProRAW 格式,后期处理的空间会更大。 但同时小雷也担心高像素带来的问题。虽然它能提升细节,但也会带来一些问题。比如单位像素面积变小,暗光表现可能会下降。不过苹果的夜景算法本来就很强,如果能优化好的情况下,应该能弥补硬件的不足。另外,高像素照片的文件体积大,会占用更多存储空间。苹果可能需要在云存储方面做出调整,或推出更大容量的版本。 图源:微博 小雷觉得,20 周年纪念版更多的是一种象征意义。苹果可能想通过这个版本展示自己的技术实力,重新定义手机影像。即使 2 亿像素主摄最终没有量产,这个测试过程也能为未来的产品积累经验。 最后,小雷想问一下大家,如果苹果真的推出 2 亿像素主摄,你会买单吗?欢迎在评论区留言讨论。
让朋友圈惊艳四座,你只需一台大疆 Mavic 4 Pro
每逢假期,职场人的锋芒就从工位转移到了朋友圈——朋友圈摄影大赛,比拼的不仅仅是财力和实力,更是审美和品味。 当你背着五位数的摄影装备兴冲冲地冲向打卡点,你拍到的画面是不是总是人山人海,完全没法构图,更别提拍出大片了。 这不是审美的沦丧,而是你作为两脚兽的天然局限,视角焊死在了地面上,天生只能仰望星空…以及,别人的无人机。 然而,朋友圈爆款的秘诀恰恰是:陌生感。 在朋友圈这个赛博战场,能让你脱颖而出的从来不是设备多贵,而是视角有多野、创意有多骚。 毕竟,真正的高手——手伸得是真高。 四大诀窍,脱离无趣 大疆多年的迭代,无人机早已不是电影和纪录片的专利,它和手机一样,已经是旅拍甚至自拍的利器。 我们总结了几个技巧,让你用一台 Mavic 4 Pro,轻松拍出引爆朋友圈的神仙画面。 绝技一 上帝视角 如果你拍得不够好,可能是你站得不够高。不妨学学 GTA,用 Mavic 4 Pro 来一场上帝视角的跟拍吧! 当身处于繁杂的街道、漫长的海岸线、或辽阔的草原时,我们可以从主角头顶拍摄一段画面,如果主角往前走,无人机就跟随前进,如果主角站在原地不动,Mavic 4 Pro 就保持构图并逐渐升高,总之,人走机飞,人停机升,主角永远 C 位。 你可以根据拍摄的环境和动作选择使用大疆自带的「热点跟随」功能,或者手动控制无人机,关键是让无人机保持匀速、稳定,这样才能拍出流畅又有视觉冲击力的画面。 这样的上帝视角,是不是有趣多了? 绝技二 旱地拔葱 要是去雪山或标志性的地标,是不是习惯性地怼中间拍?不如试试这个方法—— 充分利用地形的高度差,选择一个前景来遮挡主体,制造出视觉上的障碍,然后让 Mavic 4 Pro 垂直起飞,快速拔升。 这个过程中,可以因地制宜地选择 Mavic 4 Pro 上焦段不同的两颗长焦摄像头,制造出非常具有视觉冲击力的空间压缩效果——主体会一下子从前景后面炸出来,一下抓住朋友圈的目光。 绝技三 刷锅 出去玩,还在傻乎乎的摆 Pose 拍照? 先不说后期修图有多麻烦,光是想拍到一张表情自然、路人不抢镜、构图过得去的照片,就得折腾个半天,最后还得和朋友面面相觑,完全不知道下一个姿势该怎么摆? 这时候,如果你处在一个开阔的环境,视野良好,为什么不让画面动起来呢? 这样的操作并不麻烦,将 Mavic 4 Pro 飞到与人平齐,在应用程序里选择「兴趣点环绕」,并框选自己,无人机就会开始环绕,同时在环绕过程中持续将你保持在画面中间——想象一下,就像卫星环绕地球那样,让朋友圈都得围着你公转。 想要再进阶一些?也可以选择智能跟随模式,同时拨动遥控器的摇杆,这样 Mavic 4 Pro 就会在你走动时持续环绕你,捕捉到更加动感的画面。 绝技四 盗梦空间 站在那些高楼大厦或巨型结构面前,你是不是也想拍出那种震撼感?结果手机一举,就只剩下「噢,这是一栋楼」的苍白无力,毫无空间感和想象力。 敌不动我动,你可以用 Mavic 4 Pro 的万象云台旋转前进,来一场无人机版本的「盗梦空间」——将 Mavic 4 Pro 升到适当高度,让建筑的线条和结构尽量对称,然后缓慢前进并逐渐转动摄像头,你会看到画面产生强烈的穿梭感。 如果空间比较狭窄,甚至不需要起飞,你完全可以手持 Mavic 4 Pro,只需操作云台进行转动和视频录制,然后保持匀速、稳定地向前行走,让 Mavic 4 Pro 化身为「走地鸡」,就像使用一台 Pocket 3 一样,轻松拍摄出神奇的旋转画面。 最后,配上一首星际穿越的 BGM,视频立刻呈现出更多格调和层次感。 Live Photo 才是必杀技 四个技巧,拍出不少大片,但当你正准备去朋友圈接受朝拜的时候,你会发现微信才是你的最后一道坎。 这道门槛着实令人惋惜:朋友圈的视频发布,每次仅限一条。 对于分秒必争、信息爆炸的朋友圈而言,一条娓娓道来的视频,往往难以激起千层浪;唯有足够震撼的视觉冲击,方能一招制胜,瞬间抓住所有人的眼球。 但上有政策,下有 Live Photo 这后门!这对于视频来说,堪称王炸级别的解决方案——不仅完美规避了单条视频的数量限制,让你得以同时呈现多个精华片段,还能确保画质的清晰细腻,让你的作品大放异彩。 怎么做呢?有手就行! 将你的大片拖进「剪映」,删掉噪音,配上史诗 BGM——秒变国家地理! 最关键一步:导出选实况照片,4K 拉满!一条超长高质量 Live Photo,直接炸翻朋友圈! 怎么着?以为这样就能在朋友圈封神了?我得提醒你,朋友圈那 Live Photo,虽然好几张,但每张的时长都限制在三秒,一张 Live Photo 就那么一哆嗦,想让观众一次看个爽,那咱们必须得上点硬菜,玩点技术流—— 技巧五 电影感 你可以试试按一定的章法,将精彩画面剪辑在一张 Live Photo 中,打造类似于专题组图一样的效果。 这种剪辑,有几种技巧——可以将同类主题的画面组合,从不同的视角展示画面主体的全貌;或者将人物的特写与整体画面结合,形成更全面、更立体的视觉呈现。 如果还想再进阶,让你的朋友圈作品更有电影感,那你得学会在几秒钟内讲个小故事。 起承转合懂不懂? 不懂也没关系,我教你个万能的出片公式——静态画面和静态画面连在一起,可以打造浓厚的氛围感;动态画面和动态画面连接,可以凸显视频的活力; 也可以设计一个交代环境的画面、一个包含人物动作的片段,以及一段安静的细节镜头,这样可以更好地呈现人物和场景的关系,增加层次感。 到这里,大家已经学会了一些简单又有效的技巧。 让我们回到视频的开头,这些技巧,的确都能帮助你在朋友圈获得一定关注的好方法。 毕竟,在这个信息时代,每个人都渴望被看见,渴望自己的创作得到认可。 但我们的最终目的,不仅仅是为了收获虚拟的点赞,而是更希望每个人都能在创作中找到乐趣。 拍照当然是旅行甚至生活的一部分,但别让拍照成为全部目的,真正的意义,往往在于你亲自体验和感受的每一刻,而不是最终的照片。 无论是学习了这些技巧,还是用上了 Mavic 4 Pro 这样昂贵且专业的设备,它们最终服务的,是你那颗渴望探索、记录和感受世界的心。
杨立昆重磅论断:当前AI缺失人类四大核心智能,世界模型成破局关键
编译 | 王涵 编辑 | 漠影 智东西5月27日消息,据外媒Business Insider报道,今年早些时候在巴黎举行的AI Action Summit上,Meta首席人工智能(AI)科学家杨立昆(Yann LeCun)指出,当前AI虽在多个领域展现惊人能力,其仍缺乏理解物理世界、持久记忆、逻辑推理与分层规划四大人类智能核心特征。 据外媒VentureBeat此前报道,科技巨头们的行动印证了这一判断,开始从“打补丁”式优化转向“世界模型”架构革新,谷歌等企业已将其纳入战略布局。 这场围绕AI本质的探索,不仅关乎技术突破,更指向人机认知边界的未来走向。 一、AI模型缺乏4个人类特征:理解、记忆、推理与规划 所有智能生命的共同点是什么?今年早些时候在巴黎举行的AI Action Summit上,图灵奖得主、Meta首席AI科学家杨立昆与IBM AI负责人安东尼·安农齐亚塔(Anthony Annunziata)分享了其对智能行为的基准定义: “所有动物——至少是相对聪明的动物——都具备四种基本智能特征,人类当然也不例外,”杨立昆阐述道,“理解物理世界、拥有持久记忆、进行逻辑推理,以及制定复杂行动计划的能力,特别是分层规划能力。” 杨立昆认为,当前AI(尤其是大语言模型)尚未达到该阈值,要实现这些能力需变革训练范式。他解释这正是科技巨头们在AI竞赛中不断为现有模型“打补丁”的原因:“为理解物理世界,就训练独立的视觉系统然后硬塞进LLM;为实现记忆功能,要么采用RAG(检索增强生成),要么外挂关联记忆模块,或者简单粗暴地扩大模型规模。” ▲Meta首席AI科学家杨立昆(Yann LeCun) 二、“世界模型”构建抽象层级来理解物理世界 但杨立昆直言这些只是“权宜之计”。他多次倡导的“世界模型”(world model)替代方案,是通过现实场景训练、具备比模式识别AI更高认知水平的架构。在与安农齐亚塔对话中,他给出新定义:“获取时间T的世界状态后,设想可能采取的行动,世界模型就能预测行动后的新状态。” 不过现实世界演化存在无限不可预测性,杨立昆认为唯一训练途径是抽象化。Meta今年2月开源的V-JEPA模型正进行相关实验,让这个非生成式模型通过预测视频缺失片段来学习。“关键是不做像素级预测,而是训练系统构建视频抽象表征,在此维度进行预测时自动过滤不可预测的细节。”他解释道。 这种抽象层级思想类似化学物质构成体系:“我们建立粒子→原子→分子→材料的层级,每上升一层就剔除下层与当前任务无关的信息。”杨立昆说,这本质上是通过构建抽象层级来理解物理世界的另一种表述。 三、谷歌将“世界模型”与其短期策略紧密结合 无独有偶,在上周硅谷举行的Google I/O 2025开发者大会上,除却夺人眼球的炫酷功能,谷歌也提到要打造AI时代的操作系统,即能理解物理环境并代人类推理决策的“世界模型”。 自2024年末以来,DeepMind首席执行官德米斯·哈萨比斯就在持续完善“世界模型→通用AI助手”理论体系。此次I/O大会上,CEO桑达尔·皮查伊(Sundar Pichai)与Gemini负责人乔希·伍德沃德(Josh Woodward)同台呼应这一愿景。相较微软、OpenAI和xAI对世界模型的抽象讨论,谷歌独树一帜地将其与短期战略紧密结合。 ▲Gemini负责人乔希·伍德沃德(Josh Woodward)(图源:谷歌I/O) 若真能打造出理解物理环境的“通用AI助手”,谷歌或将成为连接用户、企业与技术的“隐形操作系统”。对追求尖端AI的企业而言,利用谷歌的“世界模型”研究、多模态能力(如I/O大会展示的Veo 3和Imagen 4)及其AGI发展路径,将开启重大创新通道。 结语:世界模型是AI大模型的未来 杨立昆揭示的AI四大能力鸿沟不仅暴露了现有模型的局限,更指明了技术突破的方向。科技巨头们的行动印证了这一判断:无论是Meta通过V-JEPA模型探索抽象表征训练,还是谷歌将“世界模型”纳入操作系统级战略,本质上都在重构AI与物理世界的交互方式。 这场角逐的深层意义,在于将AI从模式识别的工具升级为具备物理世界理解能力的认知主体。当行业从“打补丁”式优化转向架构级创新,我们或许正站在通用人工智能(AGI)发展的关键转折点。 未来AI的真正突破,或许不在于参数量的指数级膨胀,而在于能否像人类一样,构建起对世界的深层理解。
小米Q1爆赚百亿后,卢伟冰揭秘:下个造芯难点,IoT才刚起飞,汽车还没对手
作者 | 云鹏 编辑 | 漠影 智东西5月27日消息,今天小米集团正式发布了2025年第一季度财报,其营收和净利润均创下历史新高。 具体来看,小米一季度营收1113亿元,同比增长47.4%,净利润107亿元,同比增长64.5%。 ▲小米近五个季度营收及净利润情况,来源:小米财报 刚刚连发两颗自研芯片玄戒O1、玄戒T1,以及SUV新车YU7,并且手机季度销量份额重回国内第一的小米已经走到中国科技圈聚光灯下,近日关于小米自研芯的讨论更是在全网产生较高热度。 值得一提的是,过去短短半年,小米股价飙升近90%,今日收盘后其最新市值为12305亿元人民币。业内分析师普遍对这一季度小米财报数据有较高预期。 ▲截至5月27日收盘,小米股价情况,来源:百度股市通 集如此多话题于一身的小米,要交出一份怎样的答卷,其业绩暴增的靠的是什么?今天答案正式揭晓。 在这份财报中,我们能看到不少关键信息: ·手机×AIoT部分营收927亿元,同比增长22.8%,占比83.3% ·智能电动汽车及AI等创新业务营收186亿元,占比16.7% ·智能大家电营收同比增长113.8%,毛利率25.2% ·小米AIoT平台已连接IoT设备数增至9.437亿 ·小米研发人员21731人,占员工总数47.7% ·小米正持续推动基座大语言模型研究 ·2025年底前,小米中国大陆地区线下零售店数量将达约20000家 ·未来五年,小米预计新增境外小米之家约10000家 在刚刚结束的财报电话会中,小米集团合伙人、集团总裁卢伟冰提到,小米新十年主要目标就是大力投资底层技术,而AI和芯片是最重要的底层核心技术。 关于AIoT业务的竞争态势,卢伟冰提到,小米AIoT业务当下最大的瓶颈是产能,相反他并没有感受到同行降价竞争带来的压力,他说,小米IoT“才刚刚起飞”。 手机方面,卢伟冰提到今年手机大盘的增长跟预期有差距,国内今年国补对大盘的带动没有那么乐观,全球一些市场销量已经出现了下滑,但小米在整体手机策略上没有大的调整。 在高端化方面,卢伟冰提到小米未来5年要努力攻克6000元以上的超高价位段,高端产品要从手机、汽车拓展到其他品类,并且从国内做到海外。 AI方面,卢伟冰提到小米一定要做基建,小米要大力投入做基座大模型,用好自己的数据和场景探索提升用户体验的方法,做好超级小爱,以及AI跟OS的进一步融合。 有媒体问到小米是否会做非旗舰芯片并将自研芯片用在手机、平板、手表之外的产品中,对此卢伟冰提到,小米是先从最难的开始做,暂时没有考虑做非旗舰芯片,芯片本质是个平台能力,先要做好最难的手机旗舰SoC。接下来小米会继续攻克5G基带。 关于汽车,卢伟冰在回答提问时提到,小米SU7发布这么久,市场上仍然没有对手,一个能打的都没有,只有产品力够强才没有对手。 一、点名自研芯、自研大模型,国内高端市场增长明显,新零售继续加码 在核心的手机业务方面,小米全球智能手机出货量4180万台,同比增长3.0%,根据Canalys数据,2025年第一季度,小米全球智能手机出货量排名前三,市场份额为14.1%,连续19个季度排名全球前三。 生态方面,截至2025年3月31日,小米AIoT平台已连接IoT设备数(不包括智能手机、平板及笔记本电脑)增长至9.437亿,同比增长20.1%。 研发投入方面,第一季度小米研发支出67亿元,同比增长30.1%。截至2025年3月31日,小米研发人员为21731人,占员工总数47.7%。截至2025年3月31日,小米集团已在全球获得超过4.3万件专利。 此次小米在财报中提及了自研芯片玄戒O1、玄戒T1,点明了芯片具体的工艺、CPU、GPU配置(发布会均有提及)。 并且此次小米在财报中还提及了AI方面的进展,根据财报信息,小米正持续推动基座大语言模型研究。2025年4月,小米曾推出“Xiaomi MiMo”开源推理大模型,其在数学推理和代码竞赛公开测评集上,用70亿参数规模取得了优异成绩。 高端化一直是近年来小米重点突破的方向,根据第三方数据,2025年第一季度,在中国大陆地区,小米4000元及以上价位段的智能手机销量市占率9.6%,同比提升2.9个百分点;其中4000-5000元价位段市占率24.4%排名第一。 2025年第一季度,小米智能手机平均销售单价(ASP)为1211元,创历史新高,同比增长5.8%。 新零售方面,小米中国大陆地区线下零售店数量增至约16000家。预计到2025年底前,中国大陆地区线下零售店数量将达约20000家。根据第三方数据,2025年第一季度,小米在中国大陆地区智能手机线下渠道销量市占率为12.1%。在海外市场,未来五年,小米预计新增境外小米之家约10000家。 二、空调、冰箱、洗衣机三大件出货量暴涨,小米IoT业务继续提速 2025年第一季度,小米IoT与生活消费产品业务营收323亿元,同比增长58.7%。 在智能大家电方面,2025年第一季度,智能大家电营收同比增长113.8%。其中空调产品出货量超110万台,同比增速超65%;冰箱产品出货量超88万台,同比增速超65%;洗衣机产品出货量超74万台,同比增速超100%。 平板和可穿戴产品方面,根据Canalys数据,2025年第一季度,小米平板产品全球出货量同比增长56.1%,全球出货量首次排名前三,中国大陆地区排名第三;可穿戴腕带设备全球出货量排名第一,中国大陆地区出货量排名第二;TWS耳机全球出货量排名第二,中国大陆地区出货量排名第一。 小米互联网业务一季度营收91亿元,同比小幅增长12.8%。 结语:小米人车家生态加速发展,芯片+AI两大自研技术方向成重点 从财报数据中可以看到,小米手机核心业务增长稳定,汽车以及AI创新业务占比快速提升,同时家电业务战略地位的提升在营收和销量上都有直观反馈。 而在手机、汽车、家电三块重要业务背后,自研芯片和自研AI大模型都将成为重要的硬件、软件技术支撑。小米自研芯片在各类设备中的落地,必然将强化小米生态设备底层的协同打通,小米软硬协同能力将进一步强化。
富士这台新相机,为小红书集美而生
非典型 相机 在社交媒体盛行,手机拍照也越来越强的今天,女孩子们却一窝蜂地冲向「古早」的 CCD 相机。 为什么?因为 CCD 相机操作简单,上手快; 它们往往有独特的风格化色彩,拍出来的照片自带滤镜感;而且成片率高,几乎不用复杂后期,轻轻松松就能获得满意的效果。 对于忙碌又讲究生活品质的她们来说,CCD 相机正好满足了「好看又省心」的双重需求。 就在这股潮流持续升温的时候,富士携 X100 系列的余威,推出了 X half—— 这是一台让我倍感兴奋的相机,也是一台让人扫兴的相机,几乎全塑料的机身备受争议,4999 的高价更是让人诟病。 但更重要的是,它又像极了一台 CCD 相机,有着操作简单、出片风格化、成片率高、适合社交网络等一切女孩们最中意的特点。 这可能是第一台,专为社交媒体的「集美们」设计的相机。 方寸减半,精彩倍呈 让我感到兴奋的,是 X half 全新的玩法。 Half the Size, Twice the Story. 在 X half 的宣传片结尾,富士用这行文字鲜明地表达了新相机的核心特性——半格。 什么是半格? 在胶片时代,人们为了在有限的 35mm 胶片上拍摄更多的照片,想出了一个聪明的办法:胶片是横向的,但每次打开快门只暴露一半的宽度。这样,原本的一格胶片,就可以拍出两个「半格」。 而采用这种曝光区域减半设计的相机,就被称为半格相机。 在过去,这种做法加大了胶片相机的拍照效率,降低了使用成本。 而在今天,手机消费内容,正好也是竖屏模式。 就这样,作为半格数码相机的 X Half,引发了一个美妙的巧合。 经典的胶片半格相机——奥林巴斯 Pen 在 X half 这台「数码半格」上,富士设计了一块 1774 万有效像素的一英寸 CMOS 传感器,整块传感器在机身内纵向摆放,极大程度地模仿了之前半格胶片相机的成像形式。 这意味着你以正常的端相机姿势拍摄出来的照片,都是竖幅照片,而将相机竖起来,反而拍摄出来的是横幅的照片。 除了一块纵向摆放的 CMOS 外,一个致敬胶片时代的过片拨杆,成为数码半格的启动开关: 当你拍摄完一张照片后,如果拨动这个过片拨杆,机身背面的显示屏顶部就会显示一个黑暗、一个亮起的方框,你刚刚拍摄的照片已经准备就绪,等待你按下接下来的一次快门后,两张照片会自动左右并排地拼在「2 in 1」形式的图像上—— 这是半格胶片最经典的展现形式,即按照标准 35mm 胶片的方式扫描,原本一张照片的位置呈现出两张纵置照片。 值得一提的是,2 in 1 模式支持照片与视频两种格式。 做戏做全套,富士还给 X half 设计了一个非常复古的「胶片模式」,在这个模式下,你可以提前选择好胶片模拟与合适的照片数量,每拍完一张也要拨一下过片拨杆,且一旦开始拍摄,只有拍摄完预定张数后,才能看到成像的照片。 用富士的话来说,这是完全复刻胶片时代的使用体验,在一整卷照片拍摄完以后,你才能拆出胶片去冲洗,看到成像。 说起胶片模式,就不得不提富士的看家本领——胶片模拟。 为了彰显胶片模拟的存在感,富士还在 X half 机身背面的显示屏左侧专门设计了一个胶片模拟窗口,这个纵向的窗口中显示的是目前使用的胶片模拟,上下滑动可以切换胶片模拟。 为此,X Half 配备了 13 种胶片模拟,无论是经典的 CC、Provia,还是 NC 和 Reala Ace,都深受社交媒体用户和女孩们的喜爱。无论是清新淡雅,还是浓烈饱满,一应俱全。 比起其他机子也有的胶片模拟,X half 更为有趣、也更为独特的是增加了三种胶片效果,分别是随机的漏光效果、Halation 高光效果以及颗粒效果,这些效果通过数字技术,生动地复刻了胶片时代那些经典且充满韵味的特征。 具体来说,漏光效果模拟了老式胶片相机密封不严时,光线意外泄露进胶片的情形,形成橙红色的光斑或波浪状纹理。这些光斑在画面中随机出现,恰到好处地增添了氛围感; 而 Halation 效果则模仿了除碳电影胶片的成像特征,在照片的高光部分包裹上一层柔和的光晕,营造出「人在发光」的梦幻感觉,使照片更惊艳抓眼。 除了机身自带的丰富玩法,富士还专门为 X half 开发了一款手机应用。 在这款 app 中,可以在手机上管理和编辑 X half 拍摄的照片,包括选择两张不同的照片,生成 2 in 1 模式的半格拼接画面。 此外,app 还支持「冲洗扫描」功能,可以将刚刚以胶片模式拍摄的照片进行数字化处理,富士甚至为此设计了一套完整的冲洗动画:照片会一张张出现在展开的胶片上,随后转为去色罩后的正相画面,也就是颜色恢复正常的最终影像。 仪式感确实拉满。 富士还强调,X half 配备了一颗搭载 EBC 镀膜的 32mm 镜头,这颗镜头与红极一时的一次性胶片相机保持了同样的焦距,非常适合记录生活。 一英寸、非正式的系列定位(正式系列一般以 X- 为前缀,比如 X-Pro、X-E 系列)、纵置摆放的 CMOS、复古的过片拨杆以及仪式感充足的胶片模式,这一切元素都在告诉你: 虽然 X half 是一台广义上的便携式相机,但这并不是传统意义上的「专业相机」,而是一台主打使用体验和乐趣的相机。 简单来说,这就是一台「玩具」。 这个玩具并不是贬义词,反而很是让人兴奋。 回顾过去,相机市场曾百花齐放,各种奇特的设计层出不穷,旁轴相机、腰平取景、折叠机、单反与双反......随便拎出来一个词,背后都有一大段恩怨纠葛,和一系列经过时间考验、留名青史的相机。 但进入数码时代后,单反结构凭借性能优势迅速统一了市场,统治地位一直延续到如今的无反时代,将今天的旗舰相机摆在任何一个不熟悉相机的人面前,不看军舰头上的品牌,估计没人认得出这是索尼还是佳能。 再加上近年来手机影像技术的飞速进步,相机被迫走向专业工具属性越来越强的道路,几乎可以说普通人很难在相机上找到乐趣,曾经那种百花齐放、神机不断的场景,也早已不复存在。 将这样一台听起来都很好玩、模样也不错的相机,放在如今相机市场高度统一,手机又普及到算法掌控一切的环境里,无疑是一颗王炸。 说起来,这台相机与曾经风靡一时的 LOMO 相机,以及这两年持续受到关注的 CCD, 有着异曲同工之妙。两者都不需要你过于关注参数和严谨的曝光三要素,你只需要举起来,以你喜欢的形式记录你想记录的画面即可。 这种简单且充满创意的拍照体验,并不锁死性别:无论你热衷于 CCD 出片,还是过尽拍照设备的千帆,最后只想要回归简单、原始的创作,X half 都是个不错的选择。 但别着急,X half 的缺点,比优点更多。 一台好玩的「玩具」,真的是一台玩具 X half 让我感到兴奋的是,这台相机确实是一台数码时代没有出现过的,无与伦比的玩具,拍摄乐趣没得说。 但遗憾的是,富士真的将它当作玩具在打造。 X half 上这颗 32mm 镜头,没有详细的镜组数量介绍,也没有 MTF 图,甚至不是传统的玻璃材质——据推测,X half 镜头的镜片主要采用树脂材质。 这种材质常见于富士自家的一次性胶片相机,虽然从镜头体积来看,镜组设计应该比一次性胶片相机复杂许多,但成像毫无疑问会比玻璃的镜头打折扣。 哎...... X half 采用了旁轴取景方式,我原以为它会搭载像 X-Pro 系列和 X100 系列上的光电混合取景器,没想到它使用的竟然是一次性相机同款的纯光学取景器,没有任何 LCD 显示曝光参数等信息,也不能用于对焦...... 这颗光学取景器在形式上的象征意义,远大于实际内容。 机身大部分由塑料打造,过片拨杆也没有安装棘轮,更别提拨动拨杆时那种「咔咔」的手感和声音。 X half 这颗一英寸传感器仅支持点对焦,一共只提供了九个反差对焦点,仿佛让人回到了那个先对焦后构图的时代。 还有一个不得不提的点,就是取景器旁的闪光灯,它使用的是 LED 材质——这种材质无法支持短时间内的高亮度闪光,它更像是一个补光灯,只能在近距离提供轻微的面光或眼神光。 富士的刀法甚至打起了组合拳,不给闪光灯的同时,还砍掉了热靴,留下了一个没有任何触点的冷靴,这几乎让你完全失去了连接外置闪光灯的可能。 而作为一台「相机」,富士甚至没有给 X half 设置 RAW 格式输出的选择,所有照片都以 JPG 格式记录,后期调整的空间大大下降,基本无法严肃创作。 这给我的感觉是,富士手握这么好的创意,却做了一台带 CMOS 的高级拍立得? 数了那么多缺点,我们还要面对它最大的问题——价格。 X half 的官方售价为 4999 元,这个价格已经非常接近富士近期推出的 X-M5。而后者是一款搭载 APS-C 画幅的可更换镜头相机,配有可连接闪光灯的热靴、部分金属机身,并且背后有 X 卡口丰富的镜头生态作为支撑——当然,X-M5 虽然提供了更多的生产力,但也因此少了些许的趣味性。 X-M5 的发售价为 5699 元 但问题在于,有不少人愿意花五千多元购买一台可以为自己带来一定回报的工具,可又有多少人愿意花同样的价格,仅仅为了拥有一台纯粹为了「好玩」 的玩具呢? 别急,还真有。 复古玩具是形式,新鲜感才是内核 X half 的发布会结束后,在目前主流的二手平台上,已经可以看见不少挂上的预售链接,他们都有一个相同的特征——加价。 这些链接加价从几百到两千不等,各个链接显示的咨询次数都算不上少,算是拉开了 X half 腥风血雨的加价帷幕。 一眼望过去,全是加价 毫无疑问,这台相机是不值得加价的,甚至 4999 的定价,从做工和性能来说,都有些过高了。 但存在即合理,事实就是这么一台看起来稍欠诚意,甚至有些虎头蛇尾的「玩具」,依然出现了加价的情况。 凭什么? 原因也需要跳出传统相机的视角来看——脱离了工具属性以后,这台玩具的「复古」,实在太符合社交媒体的传播属性了,也太符合「集美」们的要求了。(叠个甲,集美并不单指某个性别,而是指代着重于社媒的玩家) 尽管之前也有不少相机努力在贴合互联网时代的社交媒体,但始终有些端着自己的架子,舍不得「相机」两个字的专业性,以及随之而来的生产力,但相应的,专业性与生产力的代价,就是可玩性的不够高,设计也为功能做了不少妥协。 比如 Powershot V1,是好机子,但真的不够好玩 而富士 X half 呢? 单是它的外观就已经足够吸引眼球,富士为 X half 设计的满满的复古风:过片拨杆、胶片模拟、旁轴取景器…… 这些元素一看就让人产生了强烈的怀旧感,哪怕取景器只是个样子货,也根本不愿意用设计为功能让路,而是将一切复古的元素堆上去,力求视觉效果超群。 社交媒体上的用户,尤其是年轻人,充满了对复古文化的热爱,这些细节无疑抓住了他们的心,在平台上晒晒这样的相机,不仅能引起关注,更能激发讨论和互动,因为它从视觉上就具备了吸引眼球的能力。 但它不止是在外观上玩复古,X half 在使用上,更是彻彻底底下定决心将专业两个字抛到天边去了。 你可以在机身直接合成照片或视频,还能在现代的数字相机中体验到昔日胶片相机的拍摄方式,而拍出来的每一张照片,都带有些许独特的「故事感」,以现代数字技术打造的漏光、Halation 等效果,赋予了它极强的创作乐趣。 放在习惯用手机拍照的年代,这种完全不教条不乏味的玩法,无疑会让人眼前一亮,立刻想要去尝试、去创造。 在出片效果好、玩起来有趣、看起来好看面前,X half 一英寸的底、孱弱的对焦性能、没有热靴等问题,都不再是问题。 你说没有 RAW 格式,只能 JPG 直出? 彼之砒霜,吾之蜜糖,这不是更贴合社媒玩家的心意吗? 毕竟,以集美们为代表的社媒玩家想要的,从来是风格大于性能的相机,只要能出片、有热度,其他都可以往后排。 言归正传,X half 背后,还是隐藏了一些更深层的逻辑,是值得我们说说的。 它在外观和玩法上的双重「复古」,恰恰切中了社交媒体最核心的真谛——新鲜感。 新鲜感,简单来说,就是一种打破常规、带来新奇体验的感受。 在信息爆炸的社交媒体时代,新鲜感是攫取目光、点燃热议的引信,每日刷屏的重复与熟悉中,唯有新奇、巧思与不期而遇,才能让人眼前一亮,暂停指尖的滑动,它勾起你的好奇,更引爆你的分享欲—— 这正是社交传播的命脉:人们热衷传递惊奇,因为互动、热议与认同感,本就是社交的底层驱动。 而「复古」,本质上就是新鲜感的一个维度: What's old, is new again. 过片拨杆、胶片般的拍摄体验、半格相机都曾是风靡一时的符号,却早已淡出主流视野,但数码技术的出现,将这些过时的元素包装起来,重新赋予新的生命,又出现在 2025 年。 对于年轻一代来说,这些听说过、但没见过,又重焕光彩的昨日经典,与从未面世的全新创造一样,只要它能打破认知、点燃好奇,就都是新东西—— 它带来的新鲜感,殊途同归,别无二致。
全键盘手机,复活!
离大谱,全键盘手机要复活了! 据外媒NoteBookCheck爆料,近日,Unihertz在他们官网上架了全新的5G手机——Unihertz Titan 2,这款产品最大的特征就是自带全键盘,预计会在今年六月登陆Kickstarter平台进行众筹。 (图片来源:Unihertz) 只能说,相比现在这群一天到晚想着卷拍照、卷轻薄、卷性能、卷价格的主流手机大厂—— 这款产品听起来真的挺有意思的。 现代化的“黑莓Passport” 老规矩啊,先来看看外观。 熟悉Unihertz的朋友们应该都知道,作为一家典型的异质小众品牌,这家厂商最不怕的就是打破这一成不变的手机市场。 不论创新与否,他们家的产品设计和主流市场突出一个毫不相干,所以对于Unihertz Titan 2这款产品的外观设计嘛,网友们还真不怕它平平无奇,就怕它整点怪力乱神的东西。 从目前X上面流出的设计草图来看,Titan 2的背面设计将延续Titan系列一贯的硬朗风格。 考虑到产品定位,Unihertz最爱的背面线条灯肯定是没有了,除了高强度复合材料搭配金属的一体化后盖,最突出的变化可能在于摄像头模组,不再是初代Titan略显粗犷的居中方形模组,而是一个更具现代感和辨识度的简洁单摄模组。 (图片来源:X) 对了,这个草图是推上的日本老哥发的,只能说小雷这边不保证真实性嗷。 接着翻到正面。 没错,这边更是眼熟,Unihertz Titan 2的正面设计和黑莓Passport几乎一模一样,都是一块比例异于常人的屏幕,搭配上一块占据机身下半部分的全尺寸物理键盘,就连键盘布局也是完全一致。 (图片来源:黑莓) 不论使用价值如何,吸睛这块是拉满了。 你可能不知道,这并不是Unihertz第一次推出采用方形/类方形屏幕的手机。 早在2019年, Unihertz就曾通过众筹的方式推出第一代Titan手机,搭载了一块1430*1438的类方形屏幕;随后推出的Titan Pocket同样采用了这种比例的屏幕,只是分辨率被降低到716*720。 而在Titan 2上,据说这块屏幕的分辨率会被提升到1440*1440,但依然会保持60Hz刷新率,虽说正方形的比例和很多安卓软件并不适配,但考虑到今年打破屏幕比例常识的事情已经够多了,或许这块屏幕会很好用呢? 至于这块键盘,在黑莓Passport的键盘布局基础上, Unihertz加入了一条带有六个附加键位的功能栏,可以配合原有键盘实现各种快捷操作,理论上应该能让全键盘输入的体验变得更加容易。 在我看来,这也算是吸取了黑莓Passport的前车之鉴了。 这配置,惊喜不多 当然了,核心配置方面,这才是让老用户们最期待的升级。 尽管Unihertz暂时没有公布详细参数,但我们还是能结合X上的爆料信息去进行合理推测,对性能、影像和续航这三项重点进行预测。 先说性能。 对于小厂来说,物尽其用是必须的,所以Unihertz Titan 2高概率会配备一颗天玑7400(即天玑7300换皮版),基于台积电N4P制程打造,具有四个Cortex-A78内核,最高频率可达2.5GHz,四个Cortex-A55内核以及Mali-G615 MC2 GPU。 (图片来源:黑莓) 对,基本就是Jelly Max和摩托罗拉edge 60上那颗处理器。 相比名字看起来更小的天玑7200,天玑7400虽然多两个中核,但是最关键的单核频率低了12%左右,GPU更是直接少了两颗核心,因此实际定位是要低于天玑7200的,算是全面对标骁龙7s Gen2的一颗处理器。 真要说有啥好消息,那这颗SoC在能效和性能上相较于初代Titan使用的Helio P60确实是质的飞跃。 再说续航。 在我看来,初代Titan的6000mAh电池已经令人印象深刻,但面对如今硬件功耗的提升和用户更长的使用需求,继续保持原样显然不够“极致”。 (图片来源:Unihertz) 在搭上这次电池密度革命的东风后,Unihertz Titan 2有望在机身变薄的基础上,让电池容量达到惊人的7000mAh,配合天玑7400优异的能效比,其续航表现显然是值得期待的。 至于快充,能有Jelly Max同款的66W快充就不错了。 最后是影像。 很多人可能觉得,“影像?就这么个全键盘手机有什么影像好说的,它能给我拍照扫码对焦快点就不错了。” 你还别说,Reddit上有消息称,这台机子可能会用上Jelly Max同款的1亿像素主摄,虽然算不上是什么旗舰传感器,但相较于初代Titan“能用就行”的拍照水平,Titan 2的影像能力绝对称得上是蜕变。 至于其他配置嘛,虽然没有传出具体消息,但是大伙也能猜个七七八八了。 市场需要一些不一样的东西 如今提起“全键盘手机”,你会想到些什么? 是曾经辉煌的黑莓帝国,用指尖敲击出无数商业传奇的Bold和Passport系列?还是那些在安卓洪流中昙花一现,试图延续键盘荣光的摩托罗拉Droid或三星某些侧滑机型?甚至是更久之前的传奇,末代机皇诺基亚N95? 至于国内市场,除了极少数发烧友挖空心思去淘回来的“洋垃圾”,全键盘的荣光似乎早已被全面屏的浪潮所淹没。 哦对了,甚至有些厂商为了吹线性马达调教,硬生生说自家手机的虚拟键盘是“机械手感键盘”,甚至会去吹什么“雷蛇联调”之类的噱头,着实是让一众物理键盘爱好者和效率党们有些无语。 (图片来源:一加) 特别是这几年,全面屏已经从一种新概念变成了“标准”,对屏占比的极致追求,让市面上已经难以寻觅到一款没有采用全面屏设计的机型,什么侧滑、翻盖已经销声匿迹,像是以往带全键盘的机型更是难得一见。 只能说,作为一个曾经的诺基亚E72机主。 全键盘手机,那种手指在机上翻飞的快感……我一度以为自己是很难在未来的新机上面再一次看到了。 但事实上,欧美人对于全键盘的执念远比我想象的要强。 去年,Clicks推出了一款专为iPhone设计的保护壳型外接QWERTY键盘,引发了广泛关注,甚至成为了众筹网站上的爆款产品。 (图片来源:一加) 到了今年年初,Clicks更是宣布将其产品线扩展至更多安卓机型,包括Pixel 9、Pixel 9 Pro、Galaxy S25(仅限标准版),以及摩托罗拉的小折叠手机 Moto Razr+,均能通过这个手机壳,获得经典的黑莓式物理键盘体验。 停滞了整整三年的Unihertz Titan 2,明显也是盯上了这股风潮才推出的。 但是全键盘党可别兴奋太早,这手机虽然配置一般,早些年发布的Unihertz Titan Slim现在官方售价还要299.99美元(折合人民币2150元),去年进入国内的Jelly Max现在京东售价还要2399元,盲猜Unihertz Titan 2的零售价要来到3000元左右。 对感兴趣的数码爱好者来说,或许参与众筹更加划算。 对于大厂来说,剑走偏锋往往意味着不可控制,所以他们在推出新品时都会万分谨慎;但是对Unihertz这种本身没有什么用户积累,产品配置也很难和主流厂商竞争的小众厂商而言,剑走偏锋才是王道。 作为消费者,小雷也很乐意看到,厂商们能继续在互卷中,整出更多各具特色的好产品。
一加Ace5至尊版发布:“电竞三芯”解决方案,2499元起
凤凰网科技讯(作者/于雷)5月27日,一加Ace5至尊版正式发布,新品主打游戏性能体验,搭载联发科最新旗舰芯片天玑9400+,起售价2499元。 联发科集团高级副总裁徐敬全出席发布会,介绍了这颗行业顶级旗舰处理器的技术特性。搭载天玑9400+的一加Ace5至尊版安兔兔跑分达到322万分,刷新了天玑平台手机的性能记录。据介绍,该芯片首次集成风驰游戏内核,相比标准版本游戏性能提升8%,功耗降低15%。 在游戏体验方面,一加Ace5至尊版采用了“电竞三芯”硬件解决方案。性能芯方面,天玑9400+支持主流游戏满电续航期间保持满帧运行,1% Low帧表现在热门游戏中领先同级产品。触控芯方面,新品首发“灵犀触控芯”,支持最高3000Hz瞬时响应采样率,触控响应速度达到0.04秒。网络芯方面,自研电竞Wi-Fi芯片G1相比其他产品连接距离提升11%,网络速度提升26%。 显示方面,一加Ace5至尊版配备144Hz高刷新率屏幕,支持1.5K分辨率和1400nit峰值亮度。散热系统升级为冰河散热方案,整机散热面积达到41875平方毫米。续航配置为6700mAh电池容量,支持100W快充技术。 一加手机正式成为《无畏契约手游》中国战略合作伙伴。腾竞体育CEO金亦波表示,一加Ace5至尊版将作为《无畏契约手游》下半年首届大众赛事官方指定用机,双方将在技术、赛事、市场等多个维度展开深度合作。 此外发布会还发布了一加Ace5竞速版,搭载天玑9400e芯片,出厂即写入“风驰游戏内核”,支持原生级120帧与1% Low帧。 配备7100mAh电池,是一加有史以来的最大电池容量,满电可玩6-7个小时大型游戏或刷剧一整天,起售价1799元。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。