行业分类:
加载中...
头条分类:
加载中...
小米NAS,彻底曝光!
2024年,小米上市了一款千兆交换机和一款万兆交换机,眼尖的网友在其海报宣传里发现了对“万兆NAS传输”的支持,小米NAS迅速获得了众多网友的关注。随后官方回应,这只是用于示意,内部并没有相关产品的规划。 可能是网友的声音过于迫切,小米于2024年7月展开NAS产品调研,并用数月的时间对NAS核心技术进行预研。而在最近,我们又能看到小米NAS更多的消息。 日前,小米生态链总经理陈波在一次直播当中公开了小米NAS产品的最新进展,他表示产品目前已经进入到开发的尾声阶段,逐渐要转入到制造和落地。首版打样进行了多轮测试,并透露小米NAS会延续小米生态产品一向的简约、高级、优雅,有一些科技感。 (图片来自小米直播) 虽然陈波并未在直播中透露小米NAS具体的上市时间,但根据开发进度来看,今年内有落地上市的机会,那么小米要做家庭NAS存储领域的销量之王吗? 补齐米家生态的最后一块“拼图” 陈波曾透露小米NAS的三大核心能力,第一,打通手机、PC、电视、平板电脑等设备,实现扩容、AI相册;第二,打造家庭影视中心,能够生成私人影院海报墙,用户可以随心点播NAS内的电影资源;第三,为有基础存储需求的用户提供丰富的网盘管理和资源下载能力。 他认为,NAS是家庭存储的中心,小米做NAS会考虑到小米的核心用户(小米手机、小米IoT产品等用户),一定会做好基本的存储功能、数据的过渡,高度重视整套系统的安全与隐私。换句话说,NAS也算是补足小米生态的最后一块“拼图”。 小米NAS的服务群体十分明确,同时在小雷看来,家庭存储中心的任务不仅是单纯意义上的存储,更承载多个设备之间的数据互通。素有“杂货铺”之称的小米,旗下不仅有智能手机,更有平板电脑、PC、智能电视、智能音箱、智能管家等周边IoT产品,生态阵容庞大,数据存储需求大且数据种类复杂,再加上家庭存储数据往往涉及个人隐私,理论上更需要一个像NAS一样的“本地网盘”,帮助用户集中并管理一系列数据。 (图片来自豆包AI) 另一方面,在同一套软硬件体系之下,私有云的数据可以不依赖第三方App实现跨平台无缝流转、访问,甚至能作为部分小存储空间的智能设备的“云扩容”。同时借助AI的“底座”能力,NAS可以更高效管理数据,也方便用户快速定位读取,以及演化出AI相册、AI画报等功能点。此外陈波还提到其它生态的情况,表示会深度调研苹果用户的需求。 试想一下,下班的你给智能音箱下达“在电视上播放某某电影”的指令,这样的场景体验的确无缝,但也需要够硬的生态基础支撑。 小米的生态产品向来开放,不仅开源了Home Assistant米家集成组件,也通过HyperConnect技术实现了对苹果设备的兼容,小米汽车能够兼容iPad多屏扩展,相信NAS支持iPhone、iPad等苹果设备不成问题。 (图片来自小米) 主流的NAS方案一般分为成品和DIY两种,前者只需要根据系统提示完成电源接通、插入硬盘、联网等步骤即可,部署难度较低,且有厂商提供的全链路软硬件方案,安全性更高。后者的优势在于部署成本低,但组建难度较大,安全性和稳定性均不甚理想。 也就是说,为了配套小米生态、数据安全和部署难度等多方面考虑,小米NAS大概率会以成品方案的形式推出,并且系统相对封闭,不会轻易提供Root等权限的开放。AI、互联要素齐全, 家用NAS要爆发了 NAS作为家庭存储中心,华为在小米之前已经给出了一个范本。 相比传统的个人网盘和移动硬盘,NAS里面的数据可以随时随地访问,无需携带网盘和打开单独的App,内部有全方位的数据加密,支持实时同步和分享,有聊天记录、语音、照片、视频等文件的全量备份。结合自身在云计算、通信、智能生态、AI等技术优势,弱化了网络存储的空间限制。 不知道大家还记不记得小米的“一指连”概念,它可以借助UWB技术,把手机作为“万能遥控”实现“指哪打哪”的操控。基于这样的能力,小米智能设备和小米NAS之间的玩法和交互可以期待一下。 之所以面向家庭存储市场,小雷认为小米核心用户群庞大,可借助无缝互联打开NAS需求。 企业用NAS存储种类繁多,包含中型NAS、大型NAS、工作组NAS等细分品类,小米等手机品牌跨界入局NAS时间不长,入场的难度很高。 小米、华为这种思路下打造的私有云服务,更符合个人用户所需要的“外挂存储”的设定,数据与设备的深度融合,成为多个设备的“统一内存”,这样才能够缓解用户对智能手机、PC、平板电脑、电视等智能设备存储空间不足的焦虑。但NAS产品离不开软件的推动,厂商后续的软件维护至关重要。 (图片来自华为) 近些年个人用户对生活记录、影片缓存等需求不断提高,智能设备的本地存储空间乏力,且大存储空间的智能设备购置成本较高。 而本品牌的网盘服务动辄一年数百元,长期下来也是一笔不菲的支出。就拿小雷来说,半年前购买的1TB存储空间的手机,现在已经用了近半,平时拍摄的照片和视频占了大多数,但有不想把存储需求寄托在订阅制的网盘服务里,相信有“存储焦虑”的人也会有不少。 可以预见的是,NAS作为一种大存储的“本地网盘”方案,能够有效吸引到个人消费者。第一方品牌NAS的出现,一定程度上可以加深用户对生态产品的粘性。 毕竟个人用户的设备组成会更加复杂,对互联、无缝流转、数据接力等功能有特殊的需要,否则,小雷认为华为和小米的NAS方案,与绿联、群晖、威联通、极空间等品牌并无太多区别,况且部分部分品牌的NAS软件已经内置浏览器,跨平台的体验已经进步不少。 根据恒州博智统计,2023年全球家用NAS市场规模为24.4亿元,中国市场的规模为7.12亿元,预计2030年将达到96.19亿元。家用市场虽小,但发展潜力巨大,小雷认为这也是小米入局家用NAS的因素之一。 许多NAS供应商也瞄准家庭存储市场,大家都在想办法降低NAS的部署难度和存储之外的技术特性,比如绿联在CES 2025展会上发布了AI NAS解决方案,用AI大模型降低NAS产品使用门槛,并希望以此让NAS走进千家万户。厂商发力C端的确能够看到家用NAS市场爆发的迹象,不过在小雷看来,只有把NAS的体验做得更好,才会有更多个人消费者看到NAS的闪亮点。 米粉呼声高,小米NAS预订现象级爆款? 在庞大的网络呼声下,小米NAS应声而来,可见这款产品就是“被米粉逼出来的”,但真正推动小米投身NAS行业的,小雷认为还是对核心用户的信心,以及家用NAS市场的潜力,再加上NAS对米家生态有积极意义,更简单的布局流程,更深度的产品整合,一定程度上能吸引更多消费者。 小雷猜测,如果市场反馈理想,小米可能会进一步拓宽NAS产品线,入门级产品主打易用性和生态集成,高端产品注重存储性能,又能吸引普通消费群体,又不会忽略高端专业用户所需。 小米品牌所携带的粉丝效应不可忽略,也可以遇见NAS产品上市之后会获得相当理想的效果,但我们是否需要NAS这件事,还需要理性看待。毕竟,呼吁新产品落地人,以及掏钱支持的人,不完全会是同一群,小米决心造NAS,必然还是做好了前期调研的准备,也不妨期待一下高性价比NAS方案的出现。 按照陈波的介绍,小米NAS产品最大的核心能力应该是数据的无缝流转和互联,比方说手机、平板电脑等设备可联网访问NAS数据,需要时直接下载即可,这样一来无需大量流量缓存,对设备的存储也几乎不构成压力。 非小米/苹果手机用户,或者没有建立起米家IoT生态圈的用户,由于没有足够的设备数量和兼容性,数据的流转大概离不开第三方App,体验上可能没有想象中那么好。 另外,没有大容量存储需求,又或者是不需要频繁访问的小伙伴,NAS不一定是最好的选择,传统的移动硬盘和在线网盘即可。但智能设备互联化、统一化的趋势不可逆,NAS存储设备之后,下一个被AI、互联“感染”的产品又是什么呢? 美国当地时间1月10日,CES 2025落下帷幕,雷科技第二次派出官方报道团,对CES进行立体无死角的报道,一共输出41条内容,内容整体超过10万字,涵盖了AI硬件新物种、AI电视、AI家电、AI眼镜、AI PC、AI+AR、智能清洁、AI芯片、AI PC、教育硬件、AI汽车、智能配件、可穿戴、AI机器人、AI耳机、智能镜、AI存储等领域。
OpenAI 最强模型被曝造假!提前获取测试题,顶级数学家被蒙在鼓里
近日,OpenAI 再次陷入了舆论风波。 事件源于 LessWrong 论坛上的一则爆料。一位名为「Meemi」的 Epoch AI 承包商透露,OpenAI 不仅为 FrontierMath 基准测试提供资金支持,还获得了测试题库的特权访问权。 而这或许也是 o3 的成绩在短时间内获得极大提高的重要原因。但这个信息直到 去年 12 月 20 日 o3 发布时,才由 Epoch AI 对外公布。 消息一出,瞬间在 AI 圈引起轩然大波,因为这很难不让网友怀疑 OpenAI 是既当裁判,也当选手。 吃瓜之前,需要给不熟悉的朋友先捋事件的背景信息。 去年 12 月,OpenAI 正式发布了新一代号称突破 AI 极限的 o3 模型。 在其中一项名为 FrontierMath 的 AI 数学基准测试(成绩单)中,OpenAI 以 25.2% 的准确率遥遥领先,远超 GPT-4 和 Gemini 等模型不足 2% 的成绩。 FrontierMath 是一个分量极重的高级数学推理能力评估基准。它由 Epoch AI 联手 60 多位顶级数学家共同打造,参与者包括多位菲尔兹奖得主和国际数学奥林匹克竞赛的资深命题人。 该基准包含数百个原创且极具挑战性的数学问题,覆盖现代数学的多个主要分支,如数论、实分析、代数几何、范畴论等。 2006 年菲尔兹奖得主、数学天才陶哲轩曾评价 FrontierMath 的问题「极其具有挑战性」,并认为这些问题只能由领域专家来解决。他指出,即使是人类专家,解决这些问题也需要数小时甚至数天的努力。 本表明 o3 在高级数学推理方面有巨大进步的成绩单,却在承包商的爆料后迎来了风评反转。面对争议,Epoch AI 副主任兼联合创始人之一 Tamay Besiroglu 很快在 X 平台承认了此事。 我们犯了一个错误,没有更早披露 OpenAI 在 FrontierMath 中的参与。我们的合同在 o3 发布前禁止我们这么做。事后看来,我们确实应该更努力地争取更早的透明性。我们承认这一点,并承诺未来做得更好。 事态进一步发酵,斯坦福大学数学博士生 Carina Hong 声称,在 Epoch AI 的安排下,OpenAI 拥有对 FrontierMath 的特权访问权。 「对 FrontierMath 基准测试做出重大贡献的六位数学家向我证实,他们并不知道 OpenAI 会独占该基准测试的访问权限,而其他人无法获得,多数人表示,如果他们事先知情,可能不会选择参与。」 面对质疑声浪,Tamay Besiroglu 也通过博客表达歉意,承诺将在未来采用更高的透明度标准。 博客强调 OpenAI 的资金支持仅限于 FrontierMath 的开发,并未干预测试内容,同时声明所有数据和问题均来自独立贡献者并经过独立专家审核。 关于训练使用:我们承认 OpenAI 确实可以访问大部分 FrontierMath 问题和解决方案,但不包括 OpenAI 无法访问的保留集,这使我们能够独立验证模型功能。此外,我们有一个口头协议,这些材料不会用于模型训练。 相关 OpenAI 员工的公开沟通将 FrontierMath 描述为「严格保留」的评估集。虽然这种公开立场与我们的理解一致,但我还要进一步强调,实验室从拥有真正未受污染的数据集中获益匪浅。 OpenAI 也完全支持我们维护一个单独的、未公开保留的数据集的决定,这是一种额外的保护措施,可以防止过度拟合并确保准确的进度测量。自最初设计之时起,FrontierMath 就被定位并展示为一种评估工具,我们相信这些安排反映了这一目的。 [编辑:澄清了 OpenAI 的数据访问 – 他们无权访问作为独立验证额外保护措施的单独保留集。] Epoch AI 的首席数学家 Elliot Glazer 承认在项目过程中未主动披露行业资助方面的信息,并向那些如果事先知情可能不会参与的数学家道歉。 关于 o3 成绩,他表示相信 OpenAI 报告的分数准确性,但强调 Epoch AI 需要通过正在开发的独立保留测试集来验证,并承诺保留集评估分数将公开。 当被质疑保留集状态时,Glazer 澄清这个测试集仍在开发中,而不是已经完成。 但这些解释并未能平息事件的争议,更多批评风浪涌向 Epoch AI 以及身处舆论漩涡的 OpenAI。 计算机科学家 Subbarao Kambhampati 表示,他此前就对 OpenAI 声称未预先接触奥林匹克数学和 FrontierMath 数据的说法持怀疑态度。在他看来,OpenAI 禁止相关方披露协议内容的做法本身就极具可疑性。 知名 AI 专家 Gary Marcus 对此事件提出了猛烈的批评。 他将 OpenAI 的 o3 演示描述为一场「绝望的、操纵的、误导性的、科学上粗制滥造的展示」,认为这更像是一次过度炒作而非真实突破。 一个生动的打比方是,如果有人提前获得了试题和答案,而其他人只能靠实力应考,这样的比较显然缺乏公平性。OpenAI 不仅获得了问题和解决方案的访问权,而其他竞争对手如 xai、DeepMind 以及学术团队却无法获得相同资源。 更重要的是,Gary Marcus 认为 OpenAI 对这一关键背景事实只字未提。 并且在展示过程中,OpenAI 选择性地隐藏了关键信息,既未公布在具体问题上的成功与失败案例,也没有提供相应的推理过程记录,更未说明哪些问题出现在训练集中。同时,他们也没有允许 Epoch 对保留测试集进行验证。 而回归到这场愈演愈烈的风波,很大程度上源于网友们对 OpenAI 无休止炒作的厌倦。疑似「刷榜」的行为,也再次触及了许多网友敏感的神经。 就在舆论持续发酵之际,OpenAI 又宣布其「Operator」项目取得突破,CEO Altman 预计将于 1 月 30 日向美国政府进行闭门简报。 据悉,「Operator」是 OpenAI 开发的一种具有博士级别能力的自主 AI 智能体,能够在浏览器中独立执行任务,比如编写代码、预订旅行、管理日程等。 当然,在这个节骨眼上,或许最好的危机公关策略就是立即发布 o3。而这也是最好的春节礼物。 截至发稿前,OpenAI 尚未进一步作出声明。
谷歌公布Titans系列AI模型架构:融合长短期记忆与注意力机制、突破200万上下文Token
1 月 20 日消息,谷歌研究院发文,公布了“Titans”系列模型架构,相应模型架构最大的特点是采用“仿生设计”,结合了短期记忆、长期记忆和注意力机制,支持超过 200 万个 Token 的上下文长度,目前相关论文已发布在 arXiv 上(点此访问),谷歌计划未来将 Titans 相关技术开源。 目前业界流行的 Transformer 模型架构虽然在大多数场景表现优秀,但其上下文窗口(Window)长度的限制,通常仅为几千到几万个 Token,这使得它们在处理长文本、多轮对话或需要大规模上下文记忆的任务中,往往无法保持语义连贯性和信息准确性。 而谷歌这一 Titans 系列模型架构通过引入深度神经长期记忆模块(Neural Long-Term Memory Module)有效解决了相应问题,其设计灵感号称来自人类的记忆系统,结合了短期记忆的快速反应与长期记忆的持久特性,并通过注意力机制来着重执行当前的上下文(着重于用户即时输入的提示词,并保留对于以往提示词的准确记忆)。 IT之家参考论文获悉,Titans 具有三种架构设计变体,分别是 Memory as a Context(MAC)、Memory as a Gate(MAG)和 Memory as a Layer(MAL),可以根据不同的任务需求整合短期与长期记忆。其中“MAC”架构变体将长期记忆作为上下文的一部分,允许注意力机制动态结合历史信息与当前数据,适合处理需要详细历史上下文的任务。“MAG”架构变体则根据任务需求,调整实时数据与历史信息的重要性比例,专注于当前最相关的信息。 谷歌重点强调了“MAL”架构变体,该架构主要将记忆模块设计为深度网络的一层,也就是从模型设计层面,直接将用户的历史记录和现在输入的上下文内容进行固定压缩,之后交由模型的注意力模块处理,因此效率相对较高,但输出内容效果不如“MAC”和“MAG”变体。 谷歌声称,Titans 系列模型架构在长序列处理任务中的表现明显优于现有模型,无论是语言建模还是时间序列预测,Titans 在准确性和效率上都展现了“压倒性优势”,甚至在某些场景中超越了如 GPT-4 等具有数十倍参数的模型。
一手实测自由画布!左手打通文库网盘,右手挑战最全多模态AI创作
作者 | 徐豫 编辑 | 漠影 给你10秒钟的时间,你可以说出多少个AI文生文、AI文生图、AI文生视频工具? 相信你已经习惯在日常生活和工作中使用生成式AI产品。不过回想起来,每次生成文字、图片、视频,你都需要打开不同的AI工具。即使有AI工具既能帮你写文案,也能帮你做图片,但还是需要切换到不同的界面才能输入提示词、编辑和生成。 换而言之,市场上还没有一款能够边写文案、边做图片、边看视频的主流AI产品。 智东西近日了解到百度文库和百度网盘联合推出的“自由画布”,不久后将正式上线。这款产品已内嵌生成式AI技术,配备AI创作富媒体文档、AI创作PPT、AI编辑、AI纪要、智能问答、智能学习笔记、智能出题等功能,基本上与文字挂钩的操作,都可以用这一块画布完成。 与此同时,自由画布还可以实现Word、PDF、PPT、txt、网页等主流文件格式,以及音视频等多模态资源的混合理解、生成和创作,各项文件解析进度互不干扰,并支持富媒体文档的一键分享和存储。 实际上,距离自由画布首次剧透已过去两个多月,现在这款产品终于要面向公众开放使用了。在这个节骨眼上,智东西薅到了内测名额,替大家抢先测试了一下,自由画布的1.0版本实际上手体验如何? 一、播综艺做摘录两不误,还能随手发散灵感 2024年夏天的一句“passion”,依然温暖着许多人的冬季。 这句话出自脱口秀选手付航在《喜剧之王单口季》中的一次演出。而另外一部同类脱口秀综艺《脱口秀和Ta的朋友们》中,许多选手的热血片段、励志故事、反讽调侃,以及一些针对当下社会痛点的个人思考,都被不少网友们点赞和转载。 在观看脱口秀的过程中,你可能会共鸣脱口秀选手的一些观点和金句,并且想要摘录保存下来。但实际操作起来,其要么是一句句暂停视频记录文字不太方便,要么是用视频的形式保存下来比较占手机或应用内存。 这时如果有一个“无边界”的AI笔记本,既不用担心内存,还可以用AI总结和创作新媒体内容,那么你便可以更为高效地摘选视频内容和记录观后感了。 以下是付航和小鱼各自时长约为4分钟、视频分辨率为1080p、帧率为30fps、格式为mp4的演讲片段。把这两段视频从个人的百度网盘,直接拉到百度文库的自由画布后,画布界面可以直接播放、暂停、全屏观看该视频,还能拉动视频进度条和调节视频音量。 此外,在没有额外操作的情况下,这些导入的视频会自动对齐排版,并且多个视频可以同时加载和处理。 鼠标右键单击选择其中一段视频后,画布界面会弹出两个操作模块,一个涉及AI编辑,包括“智能总结”、“灵感激发”和“自由指令”功能;另一个主要提供了富媒体文档文件的一些基础编辑功能,例如复制、全选、删除、调整图层等。 其中,“灵感激发”功能即AI基于所选中的视频内容,自动生成发散性的图文、视频、音频或直播等流媒体内容选题。 例如小鱼这段谈论校园欺凌的脱口秀,AI会建议你从“学霸小鱼的逆袭之路”或“卧底生活的双重挑战”两个角度来创作视频内容,但给出的选题架构仍较为简单。 如果你对此次生成的结果不满意,点击文本框底部的“重试”后,AI会保留原有内容,另外重新生成一套选题建议。上述“学霸小鱼的逆袭之路”和“卧底生活的双重挑战”的视频创作选题建议,则改为“校园风云:转学生的生存法则”和“学习改变命运:小鱼的励志故事”,换了新角度。 同时,所生成的文字内容还可以进一步编辑格式、AI帮写和AI改写,比如润色表述、续写内容、提炼大纲等。 如果你把光标移到视频上,其右上角会出现一个“预览”选项,单击后进入自由画布的视频摘要和分段总结生成界面。以付航的脱口秀演讲节选为例,一个4分钟左右的视频,实测自由画布花费不到10秒,自动梳理总结出该视频的主要内容。 从其总结的内容上来看,主体部分大致还原了视频内容,“舔狗的剧本”、“杀青与自我觉醒”、“容貌焦虑与自我接纳”、“遇到真爱与勇敢表达”等小标题的提炼概括也较为准确。 不过,像“主角在地铁环线哭泣,被一位女清洁工大妈误解”这些具体语句的表述,则会有点生硬,且前后句之间逻辑关联不够清晰。 除此之外,自由画布的AI对话框也支持解析所上传的视频内容。当你针对付航这一段脱口秀提问“为什么付航会感到容貌焦虑?”,AI会分点列举该脱口秀中所提到的容貌焦虑原因,并补充道,付航可能受到了视频中未提及的社会环境和媒体舆论影响。 总的来说,借助自由画布的视频AI总结及创作功能,用户可以由视频片段衍生出更多个性化的表达。 另外,影视类的视频文件通常较大,占内存,因此相对于储存在本地而言,容量可高达几十T的网盘更适合用来储存此类视频素材。目前,自由画布已与百度网盘打通,支持用户导入授权的包括视频在内的多种网盘资源,有助于优化大量视频素材处理的工作流。 二、用海量资料梳理证据链,拟起诉书更省事 近期,四川成都的谢玉梅(下文简称小谢)遭丈夫16次家暴案受到大量网友的关注。据小谢接受媒体采访时的自述,2021年至2023年期间,她被前夫贺忠阳家暴至少16次,导致全身多发损伤,需要终身戴着粪袋生活。 截至1月8日,相关话题“家暴16事件判了吗”在小红书平台上已有超3.5万条帖子,“被家暴16次女子拿到抗诉回执”话题冲上抖音平台社会榜前50位。 当涉民事和刑事案件发生过后,无论是对于当事人,还是律师而言,文字、录音、视频等模态的证据通常碎片化,各种佐证信息间的关系也错综复杂,从而导致案件信息的收集、梳理、举证工作量较大。 这些涉案的图文、录音、视频等多模态信息,如果能在同一个UI界面铺开,并进一步归纳整理,则能在一定程度上减轻当事人和律师的工作量。智东西从百度文库方面了解道,目前自由画布可导入的素材数量上限为150个,后续有计划扩容。 拉入多模态素材后,自由画布支持在同一界面播放和转写音频文件逐字稿,并利用AI技术梳理音频关键内容等功能。 例如,导入一段小谢接受媒体采访的音频文件,时长30分钟左右。点击该音频文件右上角的“预览”选项,你可以选择将其转写为音频逐字稿,或基于音频内容生成AI纪要。类似地,该音频转写和AI纪要功能可以用于处理庭审录音等音频资料。 目前,自由画布上的录音转文字功能配备了市面上同类产品的基础功能,包括标注时间轴、区分说话人等。而AI纪要则采用的是类似于会议纪要表格的形式。这些文本和表格都可以被复制粘贴到空白画布上,由用户进一步手动编辑或AI处理。 以小谢遭丈夫16次家暴案为例,《民法典》、《刑法》、民事诉讼书模版、事件相关PDF文档、视频、音频、网页链接等资料都通过“一拖”的操作,一次性导入自由画布。 然后,用户可以“一圈”框选所有资料,并向AI提出基于这些资料,替受暴者小谢拟写一份民事诉讼书的需求。 从这一份AI生成的民事诉讼书来看,AI罗列了诉讼人所需填写的内容,并以思维导图的形式说明了民事诉讼书的整体框架和撰写流程。 同时,其“批注重点内容”功能可以自由框选文档中的内容,然后分别标注是“直接复制使用”、“参考语言风格”,还是“参考主要观点”,方便后续使用时直接小窗预览选用这篇文档、这一文字内容的原因。 “AI全网搜”功能则是依据用户输入的提示词,选取、参考多个网页链接的信息后给出答案。 举个例子,背景是小谢这个案件的相关资料,提示词是“列举可以用于上诉的罪名,以及对应的法规和理由”,那么AI会找出具体参考哪条相关法规、为什么这一案件适用该法规,然后分点罗列了该案件可能会被判定为“故意伤害罪”、“虐待罪”等罪名。 其实,文章重点标注、AI生文、AI搜索这些功能单拎出来并不罕见,很多笔记类产品或者生成式AI产品都有相关功能。不过,如果用户想要用这些产品实现AI整理多模态素材,那么通常需要打开多个应用,或者在一个应用内,切换到不同界面才能编辑不同模态的素材。 自由画布则是首个把富媒体文档编辑工具和生成式AI技术,集成到一张平铺的空白画布中的产品,从而使用户能一口气完成多模态素材的智能化处理。 因此,当你遇到类似欠薪、家暴、货不对板等个人维权场景时,可以尝试用自由画布一站式整理维权资料,从而缩短上诉资料的准备时间。 三、一键生成长文和PPT,年终总结汇报有参考 恰逢春节前夕,这又到了打工人憋年终汇报,大学生赶期末周“pre”的时候了。那么,不妨看看自由画布如何帮你搭把手干活儿。 作为一名旅游管理专业的大三学生,你留意到最近旅游市场掀起一股“周末到中国”的跨国游热潮。其中,你对韩国人周末到中国上海游玩消费的现象比较感兴趣,打算围绕这个主题做一份期末课程汇报。 于是,你先把近5年内《中泰互免签证推动泰国“赴华旅游热”》、《客观看待“反向旅游”热》、《“繁花”绽放之后,期待更多城市文化原创IP》等多篇知网相关论文丢进自由画布,然后又拖入一些AI搜索“韩国人周末到中国上海玩”找到的相关链接。 一键框选所有内容、点击“智能总结”选项后,AI帮你梳理出了一份包括中韩免签政策影响、韩国人赴中国上海旅游现象、中国上海旅游特色等方面内容的大纲。 你单击自由画布底部文本框的“智能长文”选项,拿到一份有关韩国人周末赴中国上海跨国游主题的演讲稿。 参考大纲和演讲稿内容,AI用你选取的模版,生成了一份旅游管理专业课程期末汇报的PPT。 至此,你已顺利完成了繁忙期末周的一项任务。 对于大学毕业进入职场的打工人而言,他们同样可以用自由画布的“智能PPT”功能,生成一份个性化的年终述职报告,然后早早收工,回家过年。 整体来看,自由画布优先推出的生成长文和PPT功能,都可以完成资料搜集、内容大纲整理、完整报告撰写、PPT自动生成等操作。与此同时,其还会利用个人资料一站式提供不同主题、不同语言风格、不同场景的富媒体文档,对于大学生和上班族来说都较为实用。 结语:1.0版本开辟AI交互新招,个人创作基站将变身多人灵感缪斯 自由画布1.0版本开设了一种AI创作的新形式,即用一个UI界面集成了大部分市面上已有的富媒体文档编辑功能,同时把AI技术应用于富媒体文档处理的各个环节。其支持插入图片、音频、视频、网页链接等多种文件格式,并且通过“一拖一圈”的简单操作便可完成,为AI创作提供了新的人机交互方式。 另一方面,处于1.0版本阶段的自由画布,初步实现了百度文库搭建个性化创作平台的构想。自由画布设置参考逻辑结构、参考语言风格、参考主要观点等AI功能,主要目的都是更精准地识别用户意图,从而让每次的AI生成结果带有个人“文风”、个人特色。 可以看到,在工作、生活、娱乐等越来越多场景中,人们需要搭建个人IP,甚至有时候一个人就等同于一个团队。因此,类似于自由画布这种趋于个性化的创作平台,或许将成为每个人必备的创作基站。 自由画布现已与百度网盘生态初步打通。这意味着个人的私域资源可以被利用起来,还可以与公域资源相结合,成为创作者的个性化灵感库。 此外,自由画布给出了共享创作的新解法。未来如果能开放共享协作的话,同事、同学、家人、朋友都可以点进你分享的自由画布链接,随时加入创作,或者对画布上已有的内容二次创作。由于画布的分区没有设限,多人可以在同一张画布上“涂涂写写”、“头脑风暴”,并同步使用总结提炼、润色改写等AI功能,互不干扰。
让机器人拥有“触觉”!两家欧美企业联手,引入多模态交互
编译 | 施佳璇 编辑 | Panken 智东西1月20日消息,据The Robot Report Staff报道,加拿大机器人技术公司Kinova上周宣布已与多年来在机器人六轴力-力矩传感领域研究的瑞士公司Bota Systems AG达成合作,通过多模态交互感知技术(multimodal interaction sensing)弥合模拟与现实间的差距,加速机器人开发。 无论是感知技术的进步,还是通过便捷访问和集成而使AI和机器人创造者被赋能,都有望推动机器学习和机器人操作的发展。据Bota Systems分享,随着AI持续变革各行业,尚未充分开发的力-扭矩数据模态为机器人学习的进步提供了前所未有的机会。此次合作将助力研究实验室高效收集和分析力-扭矩、惯性和温度数据,为新型AI应用铺平道路。 一、Gen3机械臂新增SensONE T15,研究实验室的好帮手 Bota Systems是一家开发和生产多轴力-扭矩传感器、扭矩传感器以及定制传感器的公司,2020年从苏黎世联邦理工学院机器人系统实验室(ETH Robotics Systems Lab)分拆而出,总部位于瑞士苏黎世。其传感器赋予机器人触觉,因此机器人能在学术和工业应用中自由且安全地移动和工作。 据介绍,其传感器可赋予机器人触觉,使机器人能在学术和工业应用中自由且安全地移动和工作。 Kinova Robotics成立于2006年,为医疗、工业、辅助、研究用途提供机器人。这家总部位于加拿大魁北克省博斯布朗的公司开发了轻便且便携的Gen3机械臂。 该公司透露,Gen3与Bota Systems的SensONE T15力-扭矩传感器的集成将为实验创造出“一个无缝且强大的解决方案”。这种组合旨在支持端到端学习(end-to-end learning)。 Kinova的销售总监、兼顾研究和学术的Rodolphe Rosset说:“虽然我们的Gen3机器人已经内置了扭矩传感器,但增加Bota传感器还是使其精度和灵敏度提升到了一个全新的水平——满足了研究实验室对更高精度和更高灵敏度的需求。” 二、Kinova和Bota承诺提供便捷的访问和集成 机器人开发者们现在可以直接从Kinova订购配备Bota Systems的SensONE传感器的机器人套件。两家公司说系统的设计注重简单性和集成容易性,只需几分钟即可完成设置。 开发者可以通过Bota Systems和Kinova的在线代码库访问Python和C++接口、演示代码,从而确保系统的快速推广。 结语:多模态传感器+机械臂,加速机器人和AI创新 在距离英伟达创始人兼CEO黄仁勋在CES2025展会上发表关于“物理AI” 主题的演讲后还不到一周,Bota Systems就称其精确且多模态的传感器与Kinova机械臂的结合将为机器人和AI创新者赋能。 Bota Systems的CEO Klajd Lika分享道:“通过将精确的力感应技术作为重点,我们正在解锁机器人智能的新维度。”他还相信这种合作将加速研究,并激发创新解决方案,从而塑造机器人技术的未来。
小红书AI翻译被玩疯!网友攻陷评论区,工程师紧急堵bug
作者 | 陈骏达 编辑 | 心缘 智东西1月20日报道,在诸多海外网友涌入小红书后,今天0点左右,小红书官方光速上线了翻译功能,只需更新到最新版即可使用。不过,这一功能一上线就闹了bug:网友们发现通过特定的提示词,可以直接向翻译服务背后的大模型发出各种脑洞大开的指令,让它帮你写笑话、写歌词,甚至还能让它交出自己的IP地址。 特定的提示词是:半角双引号内的任意外文内容+任意指令。 于是,就出现了下面这一抽象的画面:一众网友在线表白,发送“l love you”等字样。 网友们消息的重点在后半部分。收到类似格式的评论后,小红书会先翻译英文双引号内的内容,然后按照用户后续的提示词完成各种任务。 在发现这个bug后,许多网友已经第一时间玩起来了。 先来看一些搞怪的内容。比如,写一个关于马斯克的笑话。 即兴创作一首歌颂C++的歌曲。 或者在评论区默写Resnet50的代码。 还可以让小红书汇报IP地址。 不过,在搞怪之余,网友发现小红书的翻译功能其实还挺强大的。 它不仅能翻译文字,还能在没有附加提示词的情况下,将摩斯电码翻译成大家能理解的自然语言。 也能把颜文字的含义写出来。 还可以把中式英语准确地翻回中文。 这个bug如果利用得当,可以实现AI帮写评论的功能。下方网友成功让小红书在翻译“I love cat”之后,输出了一个多行的猫猫表情包,让评论的效果更好了。 已经有网友开始对背后的大模型感到好奇,通过发布特定的提示词,可以让背后的大模型交出自己的系统卡。据模型所说,它是GPT-4。 不过,上述回答不足以坐实这项功能背后的模型就是GPT-4。有部分网友测试时,模型称自己是来自智谱的ChatGLM。 小红书的程序员们已经加急修复了这个bug。今天下午3点,当智东西再次向小红书发送类似上方模板的提示词时,翻译功能正常运转,仅会直接输出翻译结果,部分提示词会直接显示翻译失败。目前,仅有少数几种提示词还可以触发这一bug,且并不是十分稳定。 看来,小红书上半天左右的狂欢要结束了。不知道会不会有人怀念那个能让网友用AI尽情在评论区耍宝的小红书呢?
OpenAI开启调查:GPT-4o及4o-mini模型性能下降
快科技1月20日消息,据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。 近期,科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力而设计。 实验结果略显意外:包括GPT-4o在内的众多顶尖模型,虽然在常规长上下文回忆基准测试中表现优异,但在应对复杂的长文本生成任务时,仍暴露出显著的改进需求。 具体而言,尽管所有参测模型均宣称其上下文窗口大小超过32K tokens,但实际情况却大相径庭。开源模型在处理仅含2K tokens的任务时便显露疲态,而诸如GPT-4o等闭源模型,在应对8K tokens任务时性能也明显下滑。 以GPT-4o为例,在要求其生成详细旅行规划的任务中,即便提供了明确的时间节点和直飞航班信息,模型的输出结果中仍出现了不存在的航班信息,即产生了“幻觉”现象。 实验进一步揭示,即便是最前沿的模型,在生成连贯且冗长的内容方面仍存在较大提升空间。特别是在需要输出8k tokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型(LLM)研究的一个极具潜力的方向。
以折叠为名,大疆DJI Flip正在开启一个新的时代
消费电子产品由硅驱动,却也遵循碳基世界里的自然法则:物竞天择,适者生存。 鼠标已年过花甲,形态上却几乎没有太大的变化。计算机 70 年历史,从一间房蜕变成家用电器甚至演化成每个人的囊中之物。而像 BP 机、GPS 导航仪、iPod 更多的产品,还没来得及演化,就被其他产品吞噬而中成为一代人的记忆。 爱范儿《明日后视镜》栏目,我们将持续审视那些持续演化中的明日产品:它们从何种想法中孕育?又如何在变化中存续?它们如何塑造新生活方式,又如何被用户所改变? 大疆的新无人机,造型很抽象,让我想起折叠自行车。 即便是在大疆的繁多无人机产品线里,DJI Flip 也是最特立独行的那个。 在发布时,大疆发言人 Daisy Kong 对其定位一锤定音: DJI Flip 与 DJI Neo 和 DJI Mini 一样,为满足不同类型的初学者而研发。 让航拍只有一步之遥 在大疆的设想里,一下子就能打消初学者顾虑的无人机玩法,就是掌上起飞。 这个简明易懂的操作,同时展示了无人机的安全和易用,能够一举拉近和用户的距离。 为了让入门玩家能够更安心地飞行,Flip 从大疆 FPV 系列中汲取了精华,设计了一个桨叶保护罩,还延续了几个月前首次亮相于大疆 Noe 上的设计思路——为螺旋桨顶部与底部提供全方位保护。 为了满足轻量化的需求,Flip 对上下包围的材质进行了优化,采用了超过 30 根碳纤维封闭螺旋桨顶部与底部的空间。 碳纤维材质以其卓越的性能著称,在相同刚度下,重量仅为传统工程塑胶材质(如 PC)的 1/60,既减轻了整体重量,又为外圈保护罩提供了强大的刚性支持。 为了降低炸机风险,大疆还首次在这种配备螺旋桨包围的小型航拍无人机上设置前置避障,一套三维红外传感系统位于摄像头的上方,无论什么光照条件,都能有效识别正前方的障碍物。 庞大的体积是让很多用户望而却步的重要原因之一,因此,除了让无人机免去炸机风险外,更小巧、更方便携带,也是 Flip 的卖点之一。 珠玉在前,DJI Flip 继承了 Mavic 系列的优良基因——折叠,但由于螺旋桨保护罩的存在,不同于 Mavic 系列通过转折与横折将悬臂收拢于机身两侧,DJI Flip 选择了向底部收拢旋翼的方案。 收拢以后的 DJI Flip 四根悬翼并排堆叠在底部,从侧面看起来有些像一个独轮自行车,但真正令人惊艳的在其折叠后的厚度——仅为 62 mm,与一个手机快充头差不多,可以轻松放进任何背包,甚至冲锋衣上较大的口袋。 而折叠这个操作,除了便携以外,还肩负着开机的任务,当 DJI Flip 四翼都完全展开后,其电源会自动唤醒,免去了过往「短按再长按」的复杂操作。 DJI Flip 通过强大的视觉算法,能够轻易识别主体,自动调整飞行路径,确保拍摄对象始终处于画面中心,并提供多种智能拍摄功能,上手之后几乎可以盲操。 同时,DJI Flip 还首次引入了语音指令,虽然是指令是固定的,但已经足够让航拍这项复杂技能,离用户到只有一步之遥。 硬件与软件的深度结合,加上长达 30 分钟的飞行续航与 249 克机身重量,DJI Flip 可能是大疆迄今为止可玩性最强的入门级无人机。 让复杂的事情变简单,是人类商业史上经过反复验证的金科玉律。 而纵观大疆这家公司的发展史,就是一部航拍从困难到简单的演化史。 从开箱即用到拎包即走 2006 年,汪韬在深圳成立大疆创新,但等到他们第一台航拍无人机精灵 Phantom 上市的时候,已经是 2013 年。 精灵 Phantom 搭载 GPS 定位系统,支持简单的航拍,算不上智能,操作者需要经过大量的训练,才有把握在不炸机的情况下,拍出不错的片子——但这已经是消费级航拍,突破性的一步。 彼时的航拍无人机还停留在小众市场,主要用于地质勘探、工业测绘和电影拍摄等高端领域,设备高昂,操作复杂,技术门槛高,普通爱好者根本没法承担这样的成本,只能另寻他法。 于是,DIY 航拍无人机登上舞台。 有一定技术的爱好者们自发地聚集在一起,研究各种 DIY 方案,并开源提供在以 RC Groups 和 DIY Drones 为主的论坛上。 ▲ 迄今为止,两个论坛依然保持着专业 DIY 知识交流的氛围 这些 DIY 方案,以三大流派为主:遥控直升机、多旋翼无人机,以及固定翼无人机。 遥控直升机方案和固定翼模型无人机方案,均沿袭了传统成熟飞行器的飞行原理,通过多次迭代优化,在保留升空结构的基础上实现了小型化和民用化。 不过,受其飞行形态的限制,这些方案虽已臻于完善,却仍难以达到完全的尽善尽美:遥控直升机方案较为成熟,可以挂载轻量化的相机进行拍摄,但是操作难度高,容易失控炸机,而从军事用途继承而来的固定翼飞机方案则可以进行长距离航拍,却无法做到悬停拍摄。 ▲ 美国全球鹰侦察机可以看作固定翼航拍无人机的至尊 Plus Pro Max 军用方案 而千禧年左右兴起的多旋翼无人机方案,几乎可以说是随着 RC Groups 和 DIY Drones 两个论坛发展而诞生的,这种新形态比遥控直升机更稳定,多个螺旋桨的机动性也不输遥控直升机,且支持一定时间的悬停,可以说是民用方案中,最好的选择。 此时,手握无人机的核心——消费级飞控系统 NAZA 的大疆,在深耕全球开发者和专业用户的合作中,敏锐地观察到市场缺乏一款「开箱即用」的航拍无人机。 保证成本效益的同时,推出属于自己的硬件,成为了顺理成章的事。 于是,世界上第一台消费级航拍无人机精灵 Phantom 问世。 ▲ 大疆精灵 Phantom 的核心位置由接收器板、飞控系统、电力分配板为主,ESC 电调分布于四肢,用于控制无刷电机转速 有趣的是,在大疆精灵 Phantom 最初推出的时候,是不带云台与相机的,用户可以自行通过机身下方的固定支架安装 GoPro 等运动相机,直到后期才推出专为 GoPro Hero 设计的 Zenmuse H3-2D 云台,也能侧面看出精灵 Phantom 的主要目的是尝试整合多旋翼无人机方案。 回头来看,大疆精灵 Phantom 1 的问世,直接扫清了爱好者面临的 DIY 技术门槛,将航拍无人机一举带入消费品市场,打开了航拍无人机「开箱即可用」的时代。 2016 年,大疆推出精灵 Phantom 4。 虽然外表依然延续着多旋翼无人机方案,没有太多变化,但内部结构已经出现了翻天覆地的变化,精灵 Phantom 4 的电路板更为集成,所有功能模块几乎集中在一个主板上,整合了电力分配、飞控系统和传感器接口,减少了多余的布线。 更为智能的飞控与避障系统,也让精灵 Phantom 从大脑上脱胎换骨。 不过,彼时大疆创始人汪滔却认为,无人机还不够好用: 我们相信无人机市场会不断完善,还有上升空间,未来三年,我们的规划之一就是让产品变得更加好用。 值得注意的是,汪滔口中还有上升空间的,并不是大疆,而是无人机市场,换句话说,从这个时候开始,大疆就决定要将无人机这个市场做大。 这是一个通顺的逻辑,要将市场做大,就要吸引更多用户,而吸引更多用户,必须凭借更好用的产品。 要让无人机变得更好用,首先要让无人机能随身带走。 于是,2016 年 9 月 27 日,大疆发布了一台堪称跨时代的无人机——Mavic Pro Mavic Pro 从性能上延续了精灵 Phantom 系列的水平,但要论最鲜明的特征,还是折叠。 在后来的回忆中,Mavic Pro 的设计师、现设计工作室 LEAPX 创始人邓雨眠是这样评价的: 这不是全球第一款折叠无人机,只是最好的一款。 在精灵 Phantom 时代,虽然大疆干掉了 DIY 的复杂与不稳定,将无人机做到开箱即用,但其机身体积偏大、需要存放在一个硕大的泡沫箱中,从一定程度上讲,这算是使用精灵 Phantom 系列无人机的最大门槛。 毕竟,摄影界「迈出家门,才能拍出好照片」的定律,在航拍方面也适用。 Mavic 系列依旧遵循多旋翼无人机方案的主要结构,与精灵 Phantom 系列一样选择了四个螺旋桨,但与精灵 Phantom 不同,Mavic 系列的悬臂可以折叠起来。 ▲ 在爱范儿的专访中,邓雨眠展示的 Mavic Pro 的设想草图 得益于精灵 Phantom 系列的集成经验,大疆在 Mavic Pro 中进一步优化核心设计,大幅缩减了部件体积。 从内部结构图来看,其主板位于机身中央,作为整机控制核心,集成飞控、电力分配模块及其他电子单元,显著简化布线结构;同时,视觉传感器通过专用接口连接主板,支持避障和定位功能;ESC 模块直接集成在主板上驱动无刷电机,相比传统分布式设计更加紧凑,降低了组件分散引发的故障风险,提升了整体可靠性。 ▲ 图片来自 @RC GEEKS 在将核心部件高度集成以后,大疆删减了原本精灵 Phantom 上冗余的外壳,并在长方形机身四个顶点设置了转轴,安装着螺旋桨的悬臂可以在非工作状态下通过折叠的方式收拢于机身两侧。 形态改变的正向收益是明显的——在折叠状态下,Mavic Pro 的体积几乎只有精灵 Phantom 4 的十二分之一,解决了精灵 Phantom 系列无人机体积大、不便携的难题,让航拍无人机真正做到揣进包里能出门,掏出包里能起飞的状态。 如果以简单、粗暴且直接的方式来考量科技水平,有句话是这么说的: 人类非常痴迷将任何东西变小,因为在科技的发展史上,越小的东西往往意味着越高的集成度、越低的功耗,也就代表着技术的先进。 从这个角度来说,时隔半年的 Mavic Pro 是一款跨时代的产品。虽然在性能上没有实现质的飞跃,但凭借全新的便携形态,它直接革了自家精灵 Phantom 系列的的命,再次开启一个新的时代。 至此,航拍无人机开始快速普及,作为一个摄影师,最大的感受就是身边对天空视角稍有兴趣的朋友,都陆续购入了一台大疆,朋友圈里航拍作品也陆续多了起来。 不过,仅从「身边统计学」来看产品,肯定有失偏颇,但数据不会说谎。 根据前瞻产业研究院的报告,中国民用无人机市场规模于 2020 年达到 599 亿人民币,是 2016 年的三倍,在这个越来越大的无人机市场中,凭借 Mavic 系列,大疆迅速扑灭 2016 年的焦灼,仅仅四年后,在中国市场占有率超过 70%,在全球市场占有率达到了 80%,成为航拍无人机市场毋庸置疑的霸主。 ▲ 图片与数据来自 @前瞻产业研究院 三个难题,指明未来方向 在邓雨眠完成了 Mavic Pro 后写下的《DJI Mavic(御)的设计故事》一文中,他用自问自答的形式,为超越 Mavic 的产品做了一个画像。 有趣的是,作为消费者,往往会更关注航拍无人机的视频参数,但对于设计师来说,给出的三个难题却没有一个与视频参数有关: 无人机还存在噪音以及桨叶伤人的风险 无人机的使用场景有限,要想办法让更多人愿意尝试 无人机的智能性还不够 这三个问题的任何一个得到了很好的解决,Mavic 就可能会被超越,不知道下次超越 Mavic 的,会不会是 Mavic 自己呢?我期待着下一个突破性产品的到来。 就像 Mavic 革了精灵 Phantom 的命一样,大疆还是想将明日产品主动抓在自己手中。 于是,大疆开始尝试解决其中一些问题。 此时,时间已经来到 2019 年,大疆叱咤风云,先后推出 RoboMaster S1 教育机器人与 Osmo Action 运动相机,飞速扩张自己的商业版图。 而这一年,正好落在汪滔采访中所说的「未来三年左右,让产品变得更加好用」的时间点上。 作为立身之本,Mavic 数字系列在这一年毫无动静,但今后另一个重要系列的首代从 Mavic 系列中衍生出来——DJI Mavic Mini。 这台无人机重量仅为 249 克,无需在许多国家和地区注册,与同期的 Mavic 2 系列无人机相比,Mini 缩减了机身尺寸,却同样提供了长达 30 分钟的飞行时间,掀起了一阵热潮。 ▲ 从左至右:大疆 Mini、大疆 Air 2、大疆 Mavic 2 随着首代 Mini 推出的,还有配套的 app——DJI Fly。 相比 Mavic 系列使用的 DJI GO 4,DJI Fly 中集成了一键短片模式,用户只需要在 app 中简单操作,就可以控制大疆 mini 自动完成渐远、环绕、螺旋等操作,并且还提供了快捷视频剪辑和分享功能,不再需要复杂的剪辑,就可以将拍摄的视频处理并分享至朋友圈。 DJI Mavic Mini 的出现,解决了邓雨眠提出的部分难题: 无人机的使用场景有限,要想办法让更多人愿意尝试——Mavic Mini 缩减机身尺寸,减轻机身重量,降低用户带出门的门槛,同时可以避免大多数地区的注册管理; 无人机的智能性还不够——随着 Mavic 配套推出的 DJI Fly 除了遥控器功能外,还置入了不少的智能操作,变得更聪明了。 虽然具体的销售数据尚未公开,但首代 Mavic Mini 之后,其迭代产品迅速脱离了「Mavic」这一命名体系,成为独立的产品线,这无疑证明了 Mini 系列的成功。 不过,有一点需要注意的是,解决了部分问题的 Mini,并没有像 Mavic 取代精灵 Phantom 那样取代 Mavic 系列,而是通过巧妙的视频规格限制,与 Mavic 数字系列和 Air 系列形成「高、中、低」三档搭配,全线覆盖面对航拍及摄影爱好者的市场。 这也是大疆将无人机「蛋糕」做大的方法。 让我们再梳理一下大疆的产品迭代。 在第一个时代,精灵 Phantom 系列瞄准专业群体,以稳定性为核心,消除了 DIY 阶段的不确定性,提供了一台工业化、可靠的专业无人机;而在第二个时代,Mavic 系列则将目光投向更广泛的爱好者群体,以便携性和高性能为突破口,让普通消费者也能轻松享受航拍乐趣。 在 Mini 系列的初步试水成功后,大疆继续按照相同的思路,去追求更有普及能力的产品。 于是,我们看到了带有桨叶全包围、让无人机更安全的 DJI Neo,看到了性能更强、更折叠,也更智能的 DJI Flip。 如果算上 Mini,那么这已经是大疆在入门级别以细微的差别设置的第三款机型。 讲到这里,我想事情已经逐渐变得清晰起来。 每个阶段的环境不同,用户需求不同,产品也不同,但大疆的操作始终很一致——通过设计与技术的手段,让无人机变得更好用,向更多的人、更广泛的群体普及无人机。 天空,可以是每个人的乌托邦 1997 年,重庆成为中华人民共和国直辖市,重庆电视台策划了一部大型航拍纪录片《鸟瞰新重庆》。 当时的航拍方案,是人抱着摄像机,在载人直升机上进行拍摄。 高空全景拍摄还相对容易,但要完成类似穿越长江与瞿塘峡的镜头,则需要直升机在两岸高耸入云的山间低空掠过江面。 这不仅对直升机驾驶员的操控技术提出了极高的要求,同时也考验着摄影师的拍摄水平。 ▲ 狭长的江面通道 2015 年,《鸟瞰新重庆》第七版开拍不久,搭载着两位驾驶员与两位摄制组成员的直升机在梁平县坠毁,机上人员全部遇难,为影像事业付出年轻的生命。 从人类掌握摄影技术开始,天空俯瞰的画面就像一扇窗,为世界带来全新的理解和叙述方式,为了追求这种特别的视角,人类可谓想尽了办法,也付出了代价。 从十九世纪开始,摄影师需要抱着笨重的胶片相机爬上热气球,冒着风速与重力的双重挑战,努力克服平衡和稳定性的问题,才能进行航拍。随后,人们将相机固定在螺旋桨飞机上,摄影师登机进行拍摄,开创了现代航拍的雏形。而到了上世纪下半叶到本世纪初,直升机成为最主流的航拍工具。 在航拍技术更迭的背后,是高昂的时间与物质成本,以及难以规避的安全风险,以至于在长达百年的时间里,航拍这件事与普通人几乎没有关系。 直到一个年轻的公司出现,用了十二年的时间,通过一系列产品,稳扎稳打又迅速地改变了航拍成本高、风险高、普及低的境况,让更多的人获得「飞上天空」的权利。 创立之始,我们就拥有一个愿景,希望大疆会成为一个乌托邦。 这是大疆 16 周年品牌宣传片《乌托邦》中传递的愿景。 虽然乌托邦依旧遥不可及,但曾经只属于少数人的天空,正在化为每个人的疆域。
视频、搜索、PPT 一锅端,这块 AI 画布一用就回不去了
用 AI 搞创作,还能有什么新奇的玩法?两个月前,李彦宏发布了新的 AI 创作工具「自由画布」,据说将在文库和网盘联合上线。 一开始听到画布,我立刻就犯了「空白文档恐惧症」,拖延稿子的时候,对着一个 Word 文档都能发上半天呆,一块无限的画布,估计更难从头开始。 但体验了 1.0 版本后 APPSO 认为,和预期得很不一样:一点也不麻烦,非常能干,甚至还解决了我长期以来的烦恼。哪些烦恼呢? 打入冷宫的收藏夹再也不吃灰了 拿到一块据说完全能容纳任何格式文件、甚至是链接的自由画布时,我的第一联想其实是,这不就是 AI 版的收藏夹么?! 结果发现,它不是收藏夹,而是解冻收藏夹的 AI 神器。 前段时间心血来潮,学习视频混剪,但存在这样的情况:某个教程解决了我的一个问题,然后放在 B 站收藏夹,不会再被打开。等新鲜劲过了,我的首页还能刷到类似的视频,看标题或许用得着,照样冷藏处理。 但是时间一久,收藏夹就变成了杂物间,再想找到指定的内容,就要把相关的视频全都翻出来看一眼才行了。 对格式的包容度很高,支持上传和处理图片、文件、音频、视频,还能直接把链接丢进去的自由画布,能帮我解决「资料不吃灰」的问题么? 我试验了一下,把这些链接都框选起来,然后提问题,比如非常基础的「帧的概念」,自由画布就可以根据资料作出解释,省得我再打开视频自己看。 更神奇的是,自由画布还可以基于这些链接,生成长文——看完一篇文章的速度,总比看十个视频的速度要快。 我随手写了一个主题,「给小白的剪辑建议」,自由画布不急着生成文章,而是先基于这些资料和我的主题,生成一个提纲。 提纲看起来还不错,结构分明,条理清晰,每个部分都有参考资料,直接生成,或微调再生成,都可以。 生成的文章,行文没有一眼看出的 AI 味,参考的资料严谨地附在了句子后面,像篇论文。文章从基础概念,讲到基础操作,框架性挺强的,很适合快速学习。 同时,自由画布还解决了一个问题——搜索。之前剪着剪着遇到问题,我都是打开小红书、B 站、浏览器搜索,搜索栏密密麻麻的标签页,看着就心烦意乱。 但画布直接就支持「AI 全网搜」,问「速度线调节」之类的问题,我不必跳转到太多地方,开一个剪辑软件、开一个自由画布,就能不断地为爱发电。原来,知识可以这么丝滑地进脑子! 除了各种链接容易积压成灾,还有一种媒介,我也消受不起,那就是播客。 尽管身边很多朋友爱听播客,但我不行。在电脑前做事的时候不能听,会分心。通勤的时候也不爱听,总觉得会遗漏信息。如果是英文播客,又多了一道语言的关卡。 我接受了,我就是个视觉型学习者。于是,我把一个 47 分钟的英文播客上传到了自由画布,内容是 Claude 团队聊用户都在用 AI 干什么,让它帮我总结内容,输出就是中文的。 音视频总结看似平平无奇,很多 AI 都能做到,但对我这种习惯用文字学习的人来说,无疑提高了学习的效率。 而且,这只是自由画布其中一个功能而已,它不仅能干,而且全面。当我选中这个音频,提问「人们使用 AI 的场景主要有哪些」,自由画布帮我摘取了重点。 好好学习,天天向上,固然仰赖于个人的努力,但也离不开趁手的工具。 如果像自由画布这样,一个地方解决多种问题,各种格式的材料可以更有条理地组织和加工,知识可以更智能地提取和交互,那么我想要上进的心情,也会变得更加强烈一些。 让天下没有难啃的大部头 画布能帮我学习,所以我能更好地工作。但那些工作里的杂活,或者亲戚拜托我办的事,我想直接让画布帮我干。 从我个人的经验来看,有时候,拖延某事的主要原因,是资料太多,不知从何下手,事情还没有开始做,就高估了需要的时间,想要原地摆烂。或许,可以有更简单的方式呢? 《哈利波特》,世界级 IP,几乎无人不晓,但如果有侄子侄女外甥外甥女向我们求助,帮做一个 PPT,讲清楚哈利波特的故事,也是很有难度的。 我决定把这个问题留给 AI,在自由画布上传了《哈利波特》七本原著的 TXT 版本,框选全部素材,让自由画布帮我「量子速读」这上百万字。 然后,让自由画布整理《哈利波特》的主要人物,因为从人物讲起,串联整个故事,相对比较容易。 自由画布照例先输出大纲,标题取得特别对仗。很有意思的是,自由画布围绕哈利·波特,分出了几类人群——亲友团、对手们、导师与盟友,是有点边界感在的。 正文按照大纲的框架展开论述,不是毫无营养的流水账,引用了原著的部分情节,也拥有明确的观点,这段介绍卢娜的就挺好。 到这还没完,我又从网上找了几张人物图片,让自由画布同时基于正文内容和这些图片,生成一份 PPT。 类似长文,PPT 的生成也是从大纲开始。先确认大纲,再挑模板,自由画布自己提供的 PPT 模板就很好看,审美非常不错。 当然,更重要的是信息量,我让自由画布参考的文字和图片,都被整合在其中了,自由画布自己也补充了一些图片,可以立刻拿到小朋友的班会分享。 回过头看,从上传原著的文本,到生成最终的 PPT,整个过程像流水一样自然而清爽,原来这就是 AI 帮着干活的感觉。 其实,凡尔赛地说,打工人闻之色变的 PPT 在我的职场环境里,已经不那么常用了,甚至,PDF 都比 PPT 的出场率高。 一个媒体编辑,除了和热点打交道,也需要在「故纸堆」里打捞信息,让文章稍微有些不同。我收藏了不少 PDF 格式的电子书,动不动就是几十万字。 找书如山倒,读书如抽丝。自由画布能不能帮我节省一些时间?我试着上传了《马斯克传》的 PDF 版本,跳出来的一个功能很有意思——「批注重点内容」。 我们可以像读书时划好词好句一样,把想要的内容框起来,参考文风、观点或者复制使用。我框选的这段话,就很适合参考主要观点,用到稿子里。 然后,我让画布基于《马斯克传》的 PDF、星舰发射的图片和视频资料,生成一篇长文,主题是「马斯克为什么要开发星舰」。 没让我失望,框选的原文被自由画布参考了观点,并且它笔触灵活,行文流畅,有些编辑的基本素养了。 难啃的、大部头的、不想自己亲自看的资料,都在自由画布重新找到了起点,也有了更好的归宿。怎么引用某个信息,或者某个信息以什么形式展现,已经几乎没有限制。 限制越来越少,就离每个用户的个人定制越来越近。冗长的资料让画布处理,精美的文件让画布设计。对我来说,这就是自由的感觉。 创作本该就是自由的 与其说自由画布是画布,不如说,它是我多才多艺的创作搭子,一用就回不去了。 不管是写文章,还是剪视频,创作都要完成三个步骤:输入、处理和输出信息。体验了自由画布,我才意识到,从前光是输入和处理,就很复杂了,因为素材是分散的。 有时候找选题材料,我可能先看很多文字报道,整理出主要观点,同时也看视频,尽量用插件把视频文案处理成文字,因为文字最方便在 WPS、Office 这样的编辑器保存。 好在,自由画布让我看到了更快把活干完的曙光。以后处理素材,都不用挪地方。 不仅格式自由,上传方式也自由。自由画布支持本地上传、文库上传、粘贴网页链接,更让我心动的是,它能和网盘一键连通。点开左侧图标,关联账号,百度网盘的文件就可以直接上传。 这个功能仿佛就是为我准备的,我多年来在百度网盘存的赛博财产可太多了。我不缺资料,但缺一个自由上传各种资料、让我的注意力固定在一个界面上、甚至能和我互动的界面。 我一次性在自由画布上传了 20 个百度网盘的视频——英音元音的发音技巧。是的,谁当年没有一个学会英音的梦呢。 所有素材排得齐齐整整,且都在一个界面,支持在画布直接播放,不用跳转,当场就可以学起来。一个视频学完接着学下一个,连贯性很强,不像传统的播放器那样,切换视频时仿佛被打断。 原视频是英文的,没有字幕,但自由画布提供了摘要和分段总结。如果某个发音技巧没学明白,还可以直接问自由画布,让它用中文回答。 体验下来,我觉得自由画布这名字,取得还真不夸张。从上传资料到完成创作,一切的步骤都是自由的。 上传什么资料,格式不再是限制。图片、Word、PDF、PPT、TXT、音频、视频,从此就是一家人。自由画布是这样的,我们往里面丢资料就好了,其他的让它考虑就行了。 资料的出处,在自由画布也变得不重要。百度文库、百度网盘和本地的资料,都能殊途同归,在自由画布汇合。同时,自由画布自己也能进行互联网搜索。不管是公域的还是私域的信息,都能为我们所用。 资料收集齐了怎么处理,自由画布完全让我们看着办。同一个画布的空间内,我们就能完成阅读、问答、编辑、创作等操作。创作在这里开始,也可以在这里结束,我们不必跑来跑去。 甚至在操作的过程中,我们的行动也是自由的。和聊天机器人聊天,往往要等待加载完答案,我们才能接着问下一个问题,因为它们是线性、多轮次的。但自由画布不一样,它支持多线程并行处理,问问题,搞创作,效率都飞升。 ▲ 比如,想了解怎么养黑松,我们可以基于参考资料问「怎么浇水」,同时进行 AI 搜索了解「怎么切芽」 未来,自由画布还将推出一个非常让人期待的功能:自由分享。分享出去之后,自由画布直接自带云存储、阅读和二次创作、分享的属性。不仅让协作更方便,人和人之间的交流和共创也实现了完全的自由,「创作、分享、激发、再分享」,这个无尽可能的创作循环,可以一直高效地持续下去。 等等,这不就是一个全新的 AI 内容操作系统吗?可以说,自由画布打造了大模型时代的全新交互方式——用户自由地拖拽、框选素材,多格式、多模态的文件,都能被自由画布承载、理解,然后和用户实现共同创作。创作是直观的、流畅的,也是丰富的、自由的。 而且,不必被画布的形式劝退,自由画布是丰俭由人的,既可以上传几十个视频,也可以直接像和 ChatGPT 聊天那样和它对话,问它晚饭吃什么。 如果说对自由画布还有什么期待,目前它支持的输出格式还不算丰富,主要是文档和 PPT,我希望可以真的像它的名字那样,未来处理任何输入和输出,实现 all in one。 回到开头的问题,用 AI 搞创作,其实是为了让人类可以更加随心所欲,回应自己的创作灵感和欲望。 当 AI 继续进步,不是我们在适应工具,而是工具在适应我们。当信息不受限制地流动起来,不被格式和平台所干扰,创作便真正地开始了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。