EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
安卓版ChatGPT上线;妙鸭相机回应涉嫌侵害用户权益;网易有道发布子曰大模型丨AIGC大事日报
1、给大模型加水印研究获ICML 2023杰出论文奖 2、OpenAI已停用AI classifier工具 3、OpenAI正开发开源大模型,代号为G3PO 4、微软CEO:Azure OpenAI已有11000个客户 5、微软商店AI摘要功能已推出预览版 6、微软谷歌OpenAI等联合成立前沿模型论坛 7、开放算料联盟成立 深圳数交所、腾讯云等发起 8、Meta扩展Llama功能 可执行多语言语音识别 9、Android 14将包括生成式AI工具 10、安卓版ChatGPT正式上线 11、北交大开源交通大模型 免费可商用 12、清华本科生打造免费版桌面端Copilot 13、重庆AI产业三年行动计划发布 14、上海市消保委:妙鸭相机涉嫌侵害公平交易权 15、妙鸭相机回应争议 AI生成分身失败可退款 16、网易有道正式发布“子曰”大模型 17、钉钉12条产品线、40多项场景接入大模型 18、Runway AI视频生成工具全面开放 19、寒武纪联合中标7.53亿元智算项目 20、恒烁股份存算一体AI芯片预计将于3季度流片 21、IDC:到2026年50%终端将搭载硬件AI引擎功能 22、广联达:已构建建筑行业AI大模型层 23、用友网络申请大模型商标 24、Wayfair推出AI虚拟房间重新设计器 25、GitHub、Hugging Face等呼吁欧盟保护开源创新 26、美参议院通过修正案 要求通报对华技术投资 27、美国两党警告AI风险:或被用于开发生物武器 28、外媒推测OpenAI即将开源GPT-3.5 29、OpenAI主管工程师年薪660万 居世界第一 30、阿里云支持Llama2全系列训练部署 31、小红书上线AI文生图新功能“此刻” 32、美图秀秀上线AI移除功能 33、本地问答模型localGPT上线 34、英特尔推出34个开源AI参考套件 35、AI正影响2000亿美元游戏产业 36、合成数据公司光轮智能完成天使+轮融资 37、代码模型CodeGeeX2-6B开源 38、工信部:加强通用人工智能等未来产业前瞻布局 1、给大模型加水印研究获ICML 2023杰出论文奖 国际AI学术顶会之一ICML 2023于7月23日至29日在美国夏威夷会议中心举行,今日ICML官方公布6篇杰出论文奖获奖论文,其中包括马里兰大学的《大型语言模型的水印》(A Watermark for Large Language Models)论文。 该论文提出了一种对大型语言模型的输出添加水印的方法,将信号嵌入到生成的文本中,这些信号对人类来说是不可见的,但可以通过算法检测到,无需重新训练语言模型即可生成水印,无需访问API或参数即可检测水印。该论文还提出了一种具有可解释p值的统计测试方法,以及用于分析水印敏感度的信息论框架。 2、OpenAI已停用AI classifier工具 OpenAI在一篇更新的博客文章中表示,它决定从7月20日起停用用于区分人类撰写文本与AI生成文本的AI classifier工具,原因是该工具准确率低,并不完全可靠。OpenAI目前正在研究更有效的文本来源技术,并已承诺开发和部署机制,使用户能够理解音频或视觉内容是否是AI生成的。 3、OpenAI正开发开源大模型,代号为G3PO 据The Information 7月24日发文爆料,OpenAI正在开发的开源大型语言模型,目前代号为G3PO,内部尚未决定发布时间表。 4、微软CEO:Azure OpenAI已有11000个客户 据彭博社今日报道,在微软发布2023财年第四季度财报后的电话会议上,微软CEO萨蒂亚·纳德拉(Satya Nadella)称,Azure云计算服务的销售额占其2023财年1100亿美元云计算收入的一半以上,这是Azure首次占微软年度云计算业务的大部分。部分增长是由Azure OpenAI推动的。Azure OpenAI目前拥有11000个客户,相较5月中旬透露的4500个大幅增长。微软智能云部门在第四季度的营收为239.93亿美元,预计2024财年第一季度营收为233亿至236亿美元。 5、微软商店AI摘要功能已推出预览版 据IT之家7月25日报道,微软商店(Microsoft Store)的AI摘要功能已在美国推出预览版。该功能可在几秒钟内将一个应用的数千条在线评论总结成一段精炼的文字,突出显示最重要的观点。目前这些功能只对美国Windows内测用户开放,微软商店应用需要更新到22306.1401.x.x版本。 6、微软谷歌OpenAI等联合成立前沿模型论坛 谷歌、微软、OpenAI和Anthropic今日发布联合公告,宣布成立前沿模型论坛(Frontier Model Forum),一个致力于前沿人工智能模型安全、负责任开发的行业机构。前沿模型论坛将建立一个咨询委员会,以帮助指导其战略和优先事项。 根据公告,该论坛的核心目标是: (1)推进人工智能安全研究,促进前沿模型的负责任发展,最大限度地降低风险,并实现对能力和安全的独立、标准化评估。 (2)确定负责任的开发和部署前沿模型的最佳实践,帮助公众了解技术的性质、能力、限制和影响。 (3)与政策制定者、学者、民间社会和企业合作,分享有关信任和安全风险的知识。 7、开放算料联盟成立 深圳数交所、腾讯云等发起 财联社7月26日电,财联社记者从深圳数据交易所方面获悉,深圳数交所联合近50家单位成立“开放算料联盟”。共同发起机构包括腾讯云、华大基因、云天励飞、奥比中光、优必选、中国联通广东分公司、华傲数据等企业,深圳市人工智能学会等协会,国家超级计算深圳中心等智库及研究机构,以及北大深圳研究生院、哈工大(深圳)、港理工等大学。据悉,该联盟将围绕高质量中文训练数据和多模态训练数据,协调数据要素、数据治理、训练数据、数据标注、合成数据等相关标准制定,协助数据交易所增加大模型相关的新品类和新专区。 8、Meta扩展Llama功能 可执行多语言语音识别 Hugging Face页面显示,Meta AI在7月21日发表新论文,扩展其大型语言模型Llama的功能。研发团队通过直接附加一个小型音频编码器来扩展大型语言模型的功能,使其能够执行语音识别。通过直接在文本标记嵌入前添加一系列音频嵌入,大型语言模型可以转换为自动语音识别(ASR)系统,并以与其文本对应物完全相同的方式使用。多语言LibriSpeech(MLS)实验表明,尽管Llama主要是在英语文本上进行训练,但将一致性编码器集成到开源Llama-7B中,可使其性能比单语言基线高出18%,并能执行多语言语音识别。 9、Android 14将包括生成式AI工具 财联社7月26日电,Alphabet首席执行官桑达尔·皮查伊称,Android 14将包括生成式AI工具,80%的广告商至少使用一种AI驱动的搜索产品。 10、安卓版ChatGPT正式上线 OpenAI昨晚发推文宣布,ChatGPT安卓版现可在美国、印度、孟加拉国和巴西下载。OpenAI计划在下周将其推广到更多的国家及地区。 11、北交大开源交通大模型 免费可商用 北京交通大学等机构近日开源一款拥有70亿个参数的通用常识交通大模型TransGPT,不仅对学术研究完全开放,仅需邮件申请并获得官方商用许可后,即可以免费商用。 据介绍,TransGPT是国内首款开源交通大模型,能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶辅助系统等功能,可以为道路工程、桥梁工程、隧道工程、公路运输、水路运输、城市公共交通运输、交通运输经济、交通运输安全等行业提供通识常识。 12、清华本科生打造免费版桌面端Copilot 据机器之心7月25日报道,几位清华大学计算机系的本科生毕业即投身生成式AI创业,推出能配合任意软件使用的Copilot桌面端智能助手“灵羽助手”。无论是使用PDF阅读器、浏览器、微信还是VSCode,用户都能随时随地调用ChatGPT能力。该AI助手目前支持Windows和macOS下载,现版本搭建于GPT-3.5之上,对所有用户免费开放,付费版本有每月9美元专业版和每月19美元精英版,暂不支持图片输入,团队表示未来将引入GPT-4和Claude。 13、重庆AI产业三年行动计划发布 7月25日,重庆市经济和信息化委员会官网公开发布关于印发《重庆市以场景驱动人工智能产业高质量发展行动计划(2023—2025年)》的通知。根据行动计划,其发展目标是到2025年,成功创建国家人工智能创新应用先导区,打造10个标杆场景项目,在重点领域、典型场景形成100个具有核心竞争力的人工智能产品,培育10家亿级以上人工智能龙头企业,集聚100家人工智能规模以上企业、1000家人工智能相关企业,建成3-5个人工智能产业集聚区。 文件指出的重点任务包括优化扩大人工智能产品供给,着力突破人工智能软件,实施人工智能软件“揭榜挂帅”,推进自主的人工智能框架、算子等根技术和AIGC(AI Generated Content )等关键技术研发;加快培育人工智能硬件,鼓励加强神经网络处理器芯片、图像处理芯片、语音处理芯片等研发和场景应用,促进高端智能芯片发展。 14、上海市消保委:妙鸭相机涉嫌侵害公平交易权 上海市消保委微信公众号今日发文,指出最近爆火的AI写真小程序妙鸭相机在付款页面以灰色小字标注的“一旦购买成功,不支持退款”,涉嫌侵害消费者的公平交易权。其服务协议中也没有退款相关条款。此外,该小程序的注册公司为未序网络科技(上海)有限公司所留电话不是无人接听就是空号。 15、妙鸭相机回应争议 AI生成分身失败可退款 今日,当红的AI写真小程序妙鸭相机针对服务引发的讨论做出了三点回应:“1、妙鸭相机提供的是基于算力的服务,因此照片生成后即视为服务完成。我们郑重承诺,如果因为技术问题,造成数字分身生成失败,可以退款,而且免费再次生成。2、AI算法具有一定不确定性,眼镜等配件有可能出现无法识别的情况。为此我们会优化算法,尽快解决问题。遇到类似问题的用户,可以咨询客服处理。3、由于下载照片涉及虚拟币充值,虚拟币和现金目前只能单向流转,充值协议已进行明确约定,因此目前不支持退款。” 妙鸭相机于今年7月1日正式开放,背后由阿里优酷土豆的相关团队操盘。用户上传20张照片,付费9.9元,即可制作专属的证件照、职场照、写真照或风格大片,合成风格与天真蓝、海马体等摄影机构的作品近似。 ▲妙鸭相机回应争议 16、网易有道正式发布“子曰”大模型 据36氪报道,网易有道推出国内首个教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”。 17、钉钉12条产品线、40多项场景接入大模型 钉钉微信公众号7月25日发文,宣布目前钉钉已有12条产品线、40多项场景接入大模型。钉钉斜杠“/”现包括创建专属问答机器人、实时会议语音转文本、会中摘要、对话创建项目、智能推荐项目模板、智能写邮件、智能文档、对话插入图表、对话生成PPT、自动创建思维导图框架等功能。 18、Runway AI视频生成工具全面开放 7月24日,AI视频生成创企Runway发推文宣布Gen-1和Gen-2视频生成限制解除。注册账号即可免费尝试生成视频,每个生成视频的时长为4秒,每秒消耗5个积分。免费版本有125个积分,一共可用Gen-1生成8秒视频、用Gen-2生成25秒视频或生成25张图像。如果免费积分耗尽,付费标准为0.01美元/积分。 19、寒武纪联合中标7.53亿元智算项目 寒武纪7月25日披露项目中标公告,宣布寒武纪与中国移动通信集团浙江有限公司台州分公司、浙江省公众信息产业有限公司组成联合体,中标了“浙东南数字经济产业园数字基础设施提升工程(一期)”的项目,该项目预计中标金额为7.53亿元。根据联合体成员单位分工情况,寒武纪作为联合体牵头方,负责智算硬件部分的供货、安装和后续服务,预计公司所占金额约为该项目总价格的70%,实际金额以最终签订的正式合同为准。 20、恒烁股份存算一体AI芯片预计将于3季度流片 财联社7月26日电,存储芯片及MCU芯片公司恒烁股份在互动平台表示,公司的存算一体AI芯片预计将于3季度流片。 21、IDC:到2026年50%终端将搭载硬件AI引擎功能 IDC咨询微信公众号7月25日发文,预测到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。IDC认为,未来AI终端将在以下十大领域广泛落地发展:创作与创意、游戏和虚拟世界、语音合成与转换、视觉和图像处理、聊天机器人、个性化推荐、医疗辅助、人脸识别在终端领域广泛应用&电脑自动将图片进行分类、自动化内容生成、终端将变得更加安全。 22、广联达:已构建建筑行业AI大模型层 据界面新闻报道,建筑产业互联网平台服务公司广联达7月25日在投资者互动平台表示,AI是支持数字建筑的重要底层技术之一,公司早在2015年便专门设立了AI团队进行建筑大数据和AI相关技术的研究,目前已经构建了建筑行业AI大模型层、工具平台层、产品应用层三层AI技术体系。 23、用友网络申请大模型商标 据天眼查App,用友网络科技股份有限公司近日申请了“用友企业服务大模型”商标,国际分类为广告销售,商标状态为申请中。用友网络此前申请了YONGPT、YONYOUGPT等相关商标,国际分类涉及科学仪器、网站服务、广告销售等,均在申请中。 用友网络成立于1995年,法定代表人为王文京,经营范围含电子计算机软件、硬件及外部设备的技术开发,企业管理咨询,数据库服务,销售电子计算机软硬件及外部设备等。 24、Wayfair推出AI虚拟房间重新设计器 据The Verge 7月25日报道,美国主流家居电商平台Wayfair推出了一款免费虚拟房间重新设计器Decorify。当用户上传房间的照片、选择想要的视觉风格、输入要装修的房间类型(目前仅支持客厅)后,它采用生成式AI展示用户想要的房间的重新装修版本。用户可以选择房间中的某个单品,让Wayfair的AI模型将其替换为下拉菜单中某种风格的物品。该网站可以在计算机或手机上运行。 25、GitHub、Hugging Face等呼吁欧盟保护开源创新 据站长之家报道,Hugging Face、GitHub、EleutherAI、Creative Commons、LAION和Open Future等开源AI利益相关者组成的联盟呼吁欧盟政策制定者在制定《欧盟AI法案》时保护开源创新。他们在发布的政策文件中强调了开源AI的重要性,指出监管不应妨碍开源AI创新,建议AI法案的讨论过程中为开源开发者提供更清晰的信息,避免给开源AI生态系统带来不利影响。他们还希望通过欧盟的影响力,引领全球的技术监管对话,让开源开发者在政策制定过程中发挥更大的作用。 26、美参议院通过修正案 要求通报对华技术投资 据环球网援引路透社报道, 美国国会参议院7月25日以“压倒性多数”通过了一项“2024财年国防授权法案”修正案,将要求美国企业向联邦机构通报其对中国技术领域(例如半导体和AI)的投资情况。 据外媒此前报道,美国国会众议院“中国问题特别委员会”7月18日致函4家美国风投公司,对其在中国AI和半导体等科技领域的投资表示“严重关切”,并展开调查。报道还称,美国拜登政府正在考虑制定新规,限制美国对从事先进半导体、AI和量子计算的中国公司的投资。 27、美国两党警告AI风险:或被用于开发生物武器 据路透社报道,当地时间周二,美国民主党和共和党参议员都对AI被恶意利用的可能性发出了警告,重点放在了AI被用来制造生物攻击的可能性。 在参议院司法委员会一个小组委员会的听证会上,生成式AI独角兽公司Anthropic的CEO达里奥·阿莫代伊(Dario Amodei)谈道,AI可以帮助其他不熟练的恶意行为者开发生物武器。他说:“我们认为,通过使更多的行为者能够进行大规模生物攻击,这对美国国家安全构成了严重威胁。” 28、外媒推测OpenAI即将开源GPT-3.5 据外媒Analytics India Mag爆料,OpenAI的深度学习领域知名人物Andrej Karpathy最近在推特中表示,在Llama热潮中,所有这些对于Transformer语言模型来说都是非常通用的。“如果/当OpenAI将模型作为权重发布时(我既不能确认也不能否认!),那么这里的大部分代码都将非常相关。该外媒记者认为,根据Karpathy的说法,OpenAI很有可能将GPT-3.5开源。这一对话源于一封推特上的帖子,一位用户询问Karpathy为什么一直在玩Llama 2,而不是为OpenAI构建Jarvis。 29、OpenAI主管工程师年薪660万 居世界第一 据CSDN报道,数据收集网站Levels.fyi网站近日发布了2023年上半年的全球程序员收入报告。报告显示,上榜的主管工程师的总薪酬中位数均在66万美元以上,较去年有大幅度提升。其中,OpenAI以高达92.5万美元的总薪酬中位数位列第一,而去年它还只是个“无名之辈”。这一天价薪酬主要针对10年工作经验的软件工程师,其薪资结构包含:30万美元的基本工资+62.5万的“股权”。其中,“股权”并非按照每年度发放,而是员工以每4年为一个周期进行领取。 30、阿里云支持Llama2全系列训练部署 根据阿里云官方公众号,阿里云在国内率先推出针对Llama2全系列版本的训练和部署方案,欢迎所有开发者来阿里云上打造专属大模型。为方便开发者群体,阿里云机器学习平台PAI在国内率先对Llama2系列模型进行深度适配,推出了轻量级微调、全参数微调、推理服务等场景的实践方案。 开发者可在魔搭社区Llama2模型页面点击“Notebook快速开发”,一键拉起阿里云机器学习平台PAI,对模型进行云上开发和部署;在其他平台下载的Llama2模型,也可使用阿里云PAI进行开发。据了解,Llama2大语言模型近日宣布开源,覆盖70亿、130亿及700亿参数版本。 31、小红书上线AI文生图新功能“此刻” 小红书近期上线了一个名为“此刻”的AIGC功能。从创作入口“+”进“此刻”,用户可以输入文字,由算法根据文字生成对应的图片,包括记事本、聊感悟、吐槽等风格。如果不喜欢自动生成的图片,可以点击“换一张修改”。 32、美图秀秀上线AI移除功能 根据美图秀秀官方公众号,美图秀秀近日上线了AI移除功能,用户只需“框选”或“涂抹”简单操作,即可通过AI智能移除照片中不需要的元素,还可以智能填充背景,补齐周围元素,实现便捷、无痕、自然的移除效果。当移除后出现不自然的情况,用户可继续框选移除区域,AI将不断校正优化,直至用户满意为止。 33、本地问答模型localGPT上线 据站长之家报道,本地问答模型localGPT近期在代码托管平台GitHub上线。localGPT是一个完全离线的问答工具,旨在保护用户隐私。它使用LangChain和Vicuna-7B模型构建,可以在不联网的情况下,基于本地数据进行文档问答。用户可以将文本文档(如 txt、pdf、csv 等格式)导入工具中,并通过提问获取准确的答案,所有数据都不会离开用户的环境。该工具仍处于测试阶段,Vicuna-7B模型基于Llama模型,具有原始的Llama许可证。 34、英特尔推出34个开源AI参考套件 英特尔7月24日宣布与埃森哲合作一年的新进展,现向社区提供34个开源AI参考工具套件。每个工具套件都包括模型代码、训练数据、机器学习流水线说明、库和oneAPI组件,以优化人工智能,并使其可供多架构本地、云和边缘环境中的组织访问。 35、AI正影响2000亿美元游戏产业 据彭博社今日报道,AI已经开始影响价值2000亿美元的游戏行业。日本一家大型工作室的负责人预测五年内其公司一半的程序员和设计师将被淘汰。行业分析师Serkan Toto认为:“AI最终可能会消灭游戏中的整个工作类别,例如质量控制、调试、客户支持或翻译。” 瑞银证券分析师Kenji Fukuyama称,AI可以将游戏大片项目的资金和时间投资减半。日本最大的AI创企Preferred Networks已经与动漫角色生成平台Crypko合作。通常每张角色插图的外包成本高达10万日元(约合5058人民币),而从Crypko获得,每张图像的每月固定费用为4980日元(约合252人民币)、商业许可费为980日元(约合50人民币)。 在香港上市的中国头部体育游戏厂商望尘科技(Gala Sports)要求部门负责人研究机器学习,并为新颖的AI想法提供7000美元奖金。其CEO贾小东认为:“过去三四个月AI对游戏行业的影响可能与过去三十、四十年的变化一样巨大。”望尘科技使用公开的AI服务来构建用于渲染逼真3D头部模型的内部工具包,从而大幅减少了以前外包时需要两周时间和高达20万元的任务成本,现在只需花半天的功夫。 36、合成数据公司光轮智能完成天使+轮融资 《科创板日报》25日讯,合成数据公司“光轮智能”近期完成了天使+轮融资。公司已完成种子轮、天使轮、天使+三轮融资,累计融资金额达数千万元人民币,投资方包括SEE Fund、奇绩创坛、辰韬资本、变量资本等。 光轮智能成立于2023年1月,位于北京市,致力于为企业落地AI提供合成数据解决方案,结合生成式AI和仿真技术,为行业提供3D、物理真实、可泛化的合成数据。 37、代码模型CodeGeeX2-6B开源 今日,GLM技术团队在官方公众号宣布代码生成模型CodeGeeX2-6B开源。同时GLM技术团队也将对该模型持续进行迭代升级,以提供更加强大的代码辅助能力。 CodeGeeX2是多语言代码生成模型CodeGeeX的第二代模型,基于ChatGLM2架构注入代码实现。与150亿参数的StarCoder-15B相比,CodeGeeX2-6B凭借60亿参数便具备了近10%的优势。以下是CodeGeeX2在HumanEval上的测评结果。 38、工信部:加强通用人工智能等未来产业前瞻布局 据财联社报道,全国工业和信息化主管部门负责同志座谈会7月25日在京召开。会议强调,切实保障重点产业链自主可控,加强统筹调度和督促督导,压实各方责任,完善产业政策,强化人才队伍建设,提升产业发展质量和全产业链优势。着力培育壮大新兴产业,抓好国家制造业创新中心建设,提升产业科技创新能力,加强通用人工智能、6G、量子科技等未来产业前瞻布局,打造竞争新优势。
三星 Galaxy Z Flip5/Z Fold5 发布:更大更轻薄,3.4 英寸外屏玩出花
时隔 350 天,三星再次开启折叠屏的新篇章。 今晚三星在韩国首尔召开了「Samsung Galaxy Unpacker 2023」发布会,在发布会中,张元英和旁边的美女闺蜜用 Galaxy Z Flip 5 进行美美的自拍后,瞬间将本场发布会的期待值推向了高潮。 悬念终于揭晓,先来汇总 Galaxy Z Flip 5 的一些关键信息: – 6.7 英寸的 AMOLED 折叠屏幕,3.4 英寸的外屏 – 采用双轨式集成水滴状铰链 – 搭载第二代骁龙 8 芯片 – 内置 3700mAh 电池,支持 25W 有线充电,支持 15W 无线充电 – 配备两颗 1200 万像素镜头 – 先行者计划起售价 8499 元 事实上,关于 Galaxy Z Flip 5 的具体参数早已在各大社交媒体网站上广泛传播,情报的吻合度也比想象中要高。 但我还是被 Galaxy Z Flip 5 亮眼的外观设计吸引到了。不得不承认,在审美这一块,三星拿捏得还是相当精准的。 盈盈一握的 Galaxy Z Flip 5 提供四种配色版本:星河白、云影灰、冰薄荷和冰玫紫。 经典的标志性外观在时尚流行色彩的搭配下更具质感,从各个角度都引人注目,随手一握都能成为日常生活中的时尚单品。 此外,折叠后的 Galaxy Z Flip 5 非常精致小巧,方便携带,甚至能轻松放进用户的口袋,以最小的尺寸换来最大的使用体验。对于一些喜欢逛街却不喜欢「坠手感重」手机的女生来说,简直就是梦中情机。 此次发布会上也着重讲到了 Galaxy Z Flip 5 的外屏交互,从 1.9 英寸升级到 3.4 英寸, Galaxy Z Flip 5 的外屏直接实现了从普通的「通知栏」到「可操作页面」的跃迁,既能搭配漂亮图片,起到装饰的作用,又能手势操作多个组件,一键展示天气、股票等日常信息。 小有小的精致,大有大的享受。 姗姗来迟的 Galaxy Z Fold 5 也带来了一些全新的体验。 简要罗列一下 Galaxy Z Fold 5 基本信息: – 同样采用水滴状铰链 – 7.6 英寸的 AMOLED 折叠屏幕,6.2 英寸的外屏 – 搭载第二代骁龙 8 平台(for Galaxy) – 后置三摄,5000 万像素主摄、1200 万像素超广角、1000 万像素的长焦镜头 – 内置 4400mAh 电池,支持 25W 有线充电,支持 15W 无线充电 – IPX8 防水等级 – 先行者计划起售价 13999 元 需要说明的是,从折叠屏手机诞生的那天起,就注定这是一个创新驱动型的手机品类,涉及到折叠形态、铰链技术、软硬件交互等各个领域的创新。 在这当中,铰链技术尤为关键,不仅决定折叠屏寿命,还是折叠屏手机的「痛点」所在,而目前最为常见的则是水滴状铰链和 U 型铰链。 举例来说,上一代的 Galaxy Z Fold 4 采用的是传统的 U 型铰链技术,在折叠时会将显示屏置于一个更尖锐的角度,导致更明显的折痕,也对显示屏造成更多压力。 而水滴铰链与传统的 U 型铰链不同,当手机折叠时,底部会呈水滴状,避免直接对折屏幕,曲线更加柔和,从而减少折痕,并且折痕也会更浅。 三星是最早研发水滴铰链的厂商之一,早在 2016 年就获得了相关专利。但不知出于什么原因,三星却迟迟未将该技术应用到量产的折叠产品上。 这一次,借助 Galaxy Z Fold 5,我们得以一窥三星水滴铰链技术的真形态。 在宣传的视频中,可以看到折叠后的 Galaxy Z Fold 5 的十分紧密,几乎没有缝隙。且得益于该技术的应用,Galaxy Z Fold 5 折叠后的厚度也有所下降。 但是据韩国网友实际体验后发现, Galaxy Z Fold 5 的折痕还是相当明显,一定程度上影响用户的视觉观感。 大屏交互方面, Galaxy Z Fold 5 在适配 YouTube 等软件上的表现则较为出色,当处于悬停状态时,视频播放页面和视频标题的界线清晰明朗。 除了手机之外,三星还推出了许多其他新品。 三星 Galaxy Watch 6 先行者计划起售价 1899 元。三星 Galaxy Watch 6 Classic 旋转边框回归,提供 43 毫米和 47 毫米两个尺寸版本,这也是三星迄今为止最大的手表,先行者计划起售价 2799 元。 此外,三星首次推出了三款配备高通骁龙 8 Gen 2 芯片和 IP67 防水等级的 Galaxy Tab S9 系列平板电脑,先行者计划起售价为 6499 元。 不知为何,尽管这两款折叠机有众多亮点,但在看完整场发布会后,我总会有一种「三星折叠机是 iPhone「挤牙膏」的性转版」错觉。 先别急着反驳,请容我「狡辩」一下。 多种因素叠加下,手机用户平均换机周期大幅度延长,直板机的创新触及天花板,陷入市场的低谷期,而折叠机身为为数不多的逆势增长新品类,正是走出青涩的好时机,「下一代主力机」的广阔前景就摆在眼前。 市场中的种种拷问,都归结于一点:哪些侧重方向更能赢得用户喜欢? 在很多方面,三星的确始终保持着一流的水准,但是「三颗星星」的策略似乎更倾向于沿着既定的轨道划出固定的痕迹,而不怎么期待用户突如其来的期待。 在影像方面,去年底发布的 OPPO Find N2 同样后置三摄,分别为 5000 万像素主摄,4800 万像素的超广角和 3200 万像素的长焦镜头。 在续航方面,今年 4 月份发布的 vivo X Fold 2 的电池容量达到 4800mAh,支持 120W 有线快充和 50W 无线快充。 在厚度方面,以最新发布的荣耀 Magic V2 为例,其合上仅 9.9mm,展开仅 4.7 mm,轻薄得不像折叠屏。 诸如此类的例子还有很多,从全盘考虑,对比上面两款新品的参数后,这两款新手机的配置似乎显得有些尴尬,比上不足,比下又绰绰有余,「中规中矩」成了其最合适的代名词。 有趣的是,即使三星再怎么「挤牙膏」,在折叠机市场上的地位仍可与直板机中的 iPhone 相提并论。 知名市场研究机构 Canalys 的数据显示,折叠屏手机在 2022 年的出货量为 1420 万台,其中三星的出货量接近 1200 万台,华为排名第二,出货量不到 200 万台,而 OPPO、vivo、小米和荣耀在 2022 年的出货量不足 100 万台,完全可以归类为「others」。 人类的悲欢并不相通,在别的折叠机厂商「疯狂内卷」地大秀肌肉时,三星似乎并没有那么大的压力,反而显得有些异类。 诚然,想要技术创新的每一步都踩在用户的心坎上,可能没有那么容易。 但是光想着「挤牙膏」不「造牙膏」,「老本」迟早会被消耗殆尽。
大模型的终局?赢家通吃,大厂优先
出 品 | 异观财经 作 者 | 炫夜白雪 作为今年上半年最火的创业赛道,大模型已经堪称“百模大战”。根据中国科学技术信息研究院《中国人工智能大模型地图研究报告》,截至5月28日,国内10亿级参数规模以上大模型,至少已经发布了79个。最近看一篇报道,里面提到一个数据,国内市场上已有130家公司在做大模型。 以终为始。从投资角度来看,预判大模型的终局是什么样的,才能有助于我们去思考市面上的哪些公司值得看好。从电商平台大战一路看过来(有谁还记得想做平台最后一地鸡毛的凡客吗?),在科技赛道,绝大多数时候轰轰烈烈的“百云大战”“千团大战”,99%玩家是黯然退出,只剩下赢家通吃。 纵观这些年的赢家通吃赛道,基本可以用两个词概括:新平台、新基建。如何理解呢?通常这类玩家,为一个产业提供了新的平台,通过技术变革的方式建立起产业新的基础设施——类似高速公路、水电气等基建,让原有的产业链参与者能够加入到新平台来,享有技术变革的红利。 什么是大模型?第一,顾名思义是规模大,网络参数达到百亿规模;第二,通用性,是指不限于专门问题或领域;第三,涌现性,即产生预料之外的新能力。大模型的大规模和通用性,决定了其将是具备普适性的“新平台、新基建”,其从一个行业迁移到另一个行业的应用场景时,成本低,易迁移。 可以断言,放在大模型这一赛道,依然将是赢家通吃的终局。 那么,现在“百模大战”的玩家里,谁将笑到最后?大体来分,目前大模型的玩家有两类,一类是大厂拉起的团队,另一类是创业公司。这里可以有把握地说,在这个百模大战中,大厂优先。 我们可以参考另一个行业云计算的发展走向。当年云计算兴起的时候,国内也出来很多创业公司玩家,但最终市场份额集中于大公司。根据IDC发布的2022年全球云计算IaaS市场追踪数据来看,市场份额TOP10玩家都是中美的大公司,包括美国的亚马逊、谷歌、微软、IBM,中国的阿里、华为、腾讯、百度等。 后面我们会进一步分析。不过这里先看看制约大模型的三个要素:数据、算力和算法。 先说数据。 数据是大模型发展的压舱石,除了互联网、物联网数据之外,老百姓生活生产中产生的数据都是未来大模型要提升智能水平的必要数据源。目前,数据壁垒是真实存在的问题。高质量的中文语料数据对于创业公司来说是个很大的挑战,数据的积累需要时间和经验。对于像百度这样常年累月通过搜索等多个互联网、物联网应用积累起数据的公司来说,可以说一开始就领先了至少几个身位。 给AI喂下什么质量的数据,才能训练和迭代出什么水平的AI。 再说算力。 通用大模型需要24×7连续训练,调度多个算力中心、协调资源,以云的方式提供智能服务,这对算力有很大的需求。随着参与大模型训练的企业越来越多,用来训练大模型的数据量越来越大,对推理的要求也越来越高,大模型的应用会越来越广。在以上因素综合影响下,短期内很难能够满足市场的算力需求。 这就意味着,大模型公司必须拥有稳定的、靠谱的、能保障安全运转的算力。这显然利于在云计算深耕布局的大厂。 当年云计算创业公司,面临大厂的夹击,窄缝求生,专攻一个垂直行业的云计算市场——比如游戏行业。但是,游戏行业遭遇监管重创的时候,云计算需求也大大降低,这导致该云计算创业公司的业务不稳定,反过来又影响使用该家公司服务的客户。 这也是为什么大模型和云计算同样是赢家通吃的原因之一——大玩家能够提供更为稳定、可靠的服务,成为客户的优先选择。 最后说算法。 大模型最底层的竞争力来自算法。算法需要庞大的高级人才和长期积累。相比百度这样长期投入 AI 的高科技企业,后来者就缺乏相应的储备了。 为什么现在看起来有很多的公司做大模型呢?因为现在有开源的大模型和很多公开的论文可供参考,所以起步上会简单很多。但要做好大模型的门槛还是高的,像现在的GPT4没有公开后续技术细节,国内很多大模型就很难继续发展。 在SuperCLUE不久前发布的最新测评榜单中,可以看到,凭“硬实力”说话,还是大厂更胜一筹,其中百度最新版本的文心一言,在中文领域已经超过了GPT-3.5,仅次于GPT-4。 IDC发布的《AI大模型技术能力评估报告2023》中,就围绕着产品技术、服务生态以及行业应用三大维度,考察大模型的10余项指标,对国内主流大模型进行评估。其中,百度文心大模型获得综合评分、算法模型、行业覆盖等多项第一。在服务能力、生态合作等方面,几大主流大模型也可谓是各有千秋。 这无疑体现了,大厂在大模型竞赛中的绝对优势。在产品技术和行业应用上,远胜过二三线的竞品。比如排名第一的文心大模型,据其官方透露,已经有15万家企业申请接入文心一言测试,百度智能云与300多家生态伙伴,在超过400个场景中已取得相当不错的测试效果,并联合多家企业单位合作发布了11个行业大模型。 越多的应用场景,能形成越多的反馈,从而对模型进行更好的调整;而模型也因此产生更多的经济价值,可获得更多的资金投入,反哺自身。 需要指出的是,大模型高昂的训练成本和研发投入,让众多入局者望而生畏。有企业家断言,每年5000万到1亿美元的花费,只是千亿级大模型训练的入场券。某个创业者高调宣布投资5000万美元入局大模型时,海通证券的电子研究首席分析师郑宏达发朋友圈直言说:“5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?”四个月之后,该创业公司被收购,出局。 当年共享单车也是百团大战,打得头破血流,结果笑到最后的是美团。无他,资金充足。在以年计、甚至以十年计的竞争中,这种重资本重研发的赛道,毫无疑问是利于大公司的。在大公司中,我们还要看人工智能是不是公司的主业,是不是公司的核心竞争力所在。比如百度10年研发,为人工智能投入上千亿元。从近三年的研发投入来看,2020年研发费用为195.1亿元,研发占比为18.2%;2021年研发费用为249.4亿元,研发占比为20%;2022年百度研发费用为233.2亿元,研发占比为19%。 这是一场漫长的、看不到终点的长跑,竞争的韧性将左右最后的结果。 需要额外指出的是,人工智能对数据的需求以及其对人类社会的冲击力,使得国家监管会成为一个很重要的考虑因素。7月13日,国家网信办、发改委、科技部、工信部等七部门正式发布了《生成式人工智能服务管理暂行办法》(以下简称“《办法》”),《办法》将自2023年8月15日起施行。其中提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。 在 2023WA-IC 期间,由国家标准委指导的人工智能标准化总体组宣布,我国首个大模型标准化专题组组长由上海人工智能实验室与百度、华为等企业联合担任,现场进行了证书颁发并正式启动大模型测试国家标准制订工作。在“百模大战”的现状下,此举被解读为大模型行业迎来“国家队”阵容。 以赢家通吃的终局为前提下,我们判断是,在仅有几家通用大模型的基础上,将有多个领域的垂直大模型。龙头企业研发通用+中小企业研发应用,这种模式成为破局关键。
GPT没带飞微软,谷歌逆风翻盘
作者 | 李水青 编辑 | 心缘 智东西7月26日报道,新财报季到来,微软和谷歌刚刚上演了AI竞赛下的成绩单“同台PK”。 一边,微软引入OpenAI的GPT-4等技术的效果初显,在云和搜索业务都有体现。 在微软2023财年第四季度(自然年2023年第二季度)财报电话会议上,微软CEO萨蒂亚·纳德拉(Satya Nadella)称,Azure云服务的销售额占其2023财年1100亿美元云计算收入的一半以上,这是Azure首次占微软年云技术收入大部分。部分增长是由Azure OpenAI推动,Azure OpenAI目前已拥有1.1万个客户,相较5月中旬的0.45万个大幅增长。与此同时,Bing Chat带动了微软搜索量的增加,搜索和新闻广告收入增长了8%。 另一边,谷歌扛住来自微软及OpenAI的冲击,用稳步增长向市场自证。 谷歌主营的搜索引擎及其他收入达426.28亿美元,高于分析师预测的422美元,同比增长5%,扛住压力仍为谷歌带来了可观收入。同时,谷歌云2023年第二季度同比增长高达28%,达到80.3亿美元;连续两季度盈利,第二季度盈利达到3.95亿美元,是第一季度(1.64亿美元)的接近两倍水平。 尽管微软AI驱动的云与搜索业务发展已见起色,但谷歌的抗压增长更受到资本市场的认可。当地时间7月25日盘后,微软股价一度跳水4%,谷歌母公司Alphabet股价一度涨超8%。 ▲微软股价盘后一度跳水4%(图源:谷歌财经) ▲谷歌母公司Alphabet盘后股价一度涨超8%(图源:谷歌财经) AI技术爆发引发的科技巨头竞赛愈演愈烈。AI技术为微软和谷歌的业务带来了什么实质影响?作为AI的底座,微软智能云和谷歌云增长如何?这又给国内云与AI产业带来了什么参考?通过拆解微软和谷歌的财报信息,本文对此进行了深入解读。 一、AI拉动必应搜索增长,但远未冲击谷歌搜索 在微软2023财年Q4(对应自然年2023年Q2),微软营收达561.89亿美元,同比增长8%,可以看到经历了新冠肺炎疫情后的增长放缓后,业绩开始逐步恢复增长,但连续三季度增长仍低于10%。 ▲微软2021财年Q4~2023财年Q4的营收及增长情况 AI对微软搜索业务的拉动效果初显,但仅限于部分业务。 根据财报,微软搜索和新闻广告收入增加了8600万美元,即3%。由于搜索量增加,搜索和新闻广告收入(不包括流量获取成本)增长了8%。今年2月,微软宣布推出Bing Chat,可见已经开始拉动搜索流量的增长。 作为微软三大业务板块之一,个人计算业务部门受AI拉动仍不明显。这一部门包括Windows软件、Surface设备和Xbox业务等,该季度营收下滑至139.05亿美元,低于136亿美元的平均预期。 今年3月中旬,微软宣布将GPT-4接入到Office工具,推出了AI版Office“全家桶”:Microsoft 365 Copilot,让Word、PPT、Excel、Outlook等人们常见的办公软件全都接入AI,但直到近期才开放付费模式,或许因此,其暂未显现出AI拉动作用。5月23日,微软又加紧推出GPT-4版Windows,让整个PC操作系统像一个对话机器人一样与人交互,这一领域显然也仍处于投入阶段。 再看看谷歌这边,第二季度总营收达到746.04亿美元,高于华尔街分析师预期预测的728亿美元,同比增长7.64%。这一增速与前两年新冠疫情期间的两位数增长有较大差距,但已逆转了前两季度的下跌,出现回暖趋势。 ▲谷歌2021年Q2~2023年Q2的营收及增长情况 谷歌的业绩增长主要得益于谷歌主体服务(Google Service total),主要包括谷歌搜索引擎及其他、Youtube广告、谷歌网络等几块广告收入及一些其他收入。这一部分营收本季度达到662.85亿美元,占其总收入的89%。 其中谷歌搜索引擎及其他收入达426.28亿美元,高于分析师预测的422美元,同比增长5%。 可以看到,谷歌搜索引擎并未因为微软Bing搜索引擎接入ChatGPT而产生明显冲击,这也印证了微软Bing Chat对微软搜索业务目前推动力有限,暂未带来市场格局的重大变化。 二、谷歌云稳增28%,微软云增长疲软 再来看看AI的“底座”——云业务。AI对微软智能云的拉动作用已有苗头,但仍不明显。 在微软2023财年Q4(对应自然年2023年Q2),微软智能云营收为239.93亿美元,略高于分析师预测的238亿美元,同比增长15%。 微软智能云主要包括Azure、Windows Server、SQL Server、Visual Studio、GitHub和企业服务等板块。对比前八个季度,微软智能云营收增速正在放缓。纳德拉肯定了Azure OpenAI对云业务的拉动作用,截至6月底,Azure OpenAI拥有1.1万用户,较5月底的0.45万大幅增长。 ▲微软智能云2021财年Q4~2023财年Q4的营收及增长情况 微软主要有三大业务板块,个人计算业务、生产力和企业流程业务、智能云业务。从整体业务板块来看,微软智能云业务占总体营收达到43%,已成为微软的最大营收板块。 ▲微软2023财年Q4各业务板块营收占比情况 再来看看谷歌云,本季度营收达80.3亿美元,同比增长28%,与第一季度增长(28%)持平。谷歌云自上一季度实现首次盈利后,本季度继续盈利态势。其Q2利润达到3.95亿美元,是Q1(1.64亿美元)的接近两倍水平。 可以看到,对比微软智能云近三年的增长幅度,谷歌云始终以更高速度增长。尽管谷歌云与微软智能云的体量仍有差距,但增势迅猛。在这波AI浪潮下,微软云和谷歌云大概都吃到了AI红利,而不像此前产业预期的微软智能云独占鳌头。 ▲谷歌云与微软智能云近几季度营收同比增长情况对比 不过,谷歌云占谷歌整体营收仅11%,体量相对较小,对谷歌整体大盘影响力要低一些。 ▲谷歌2023年Q2各业务营收占比情况 三、万人裁员后,微软谷歌净利润齐涨 值得一提的是,在经历了前两个季度闹得沸沸扬扬的万人裁员后,微软和谷歌的净利润都有明显增长。 据智东西此前报道,微软在年初已裁了超1万名员工,其中涉及了Azure和安全软件等关键业务。就在此前7月10日,微软宣布继续裁员,但发言人拒绝说明波及多少员工。而谷歌这边,今年1月谷歌母公司Alphabet也宣布了裁员约1.2万人,占其全球员工总数6%。而后,微软及谷歌都有断断续续的产线缩减、人员缩招和裁撤。 在微软的2023财年Q4(对应自然年2023年Q2),微软净利润达到200.81亿美元,这是近七个季度以来首次突破200亿美元;同比增长20%,不再出现2022年类似的负增长,且增速正在加快。 ▲微软2021财年Q4~2023财年Q4的净利润及增长情况 谷歌这边,谷歌母公司Alphabet在2023年第二季度净利润为183.68亿美元,同比增长14.79%,更是一扫前四个季度的颓势。 ▲谷歌2021年Q2~2023年Q2的净利润及增长情况 当然,净利润的增长可能受到了大环境回暖、销售战略调整、技术产品更新等多方面影响。 可以确定的是,更多的盈利将支持科技巨头们加大大模型时代的AI投资。比如,微软就扩大数据中心投资,并购买运行复杂人工智能系统所需的芯片等。微软在该季度中的资本支出同比增长超过20%,超过了18%的整体营收增长。 结语:硅谷大厂业绩回暖,AI引擎效能仍待释放 通过对比微软和谷歌两大科技巨头的财报成绩,我们看到在经历了一系列组织变动、裁员和AI技术引进举措后,两家公司逐渐从疫情后的阴霾中走出来,业绩出现回暖的趋势。 微软和谷歌的财报成绩都超出分析师预期,股市反应截然不同。自去年底以ChatGPT为代表的对话机器人风靡以来,微软率先将OpenAI的GPT-4大模型嵌入搜索、Office、GitHub、Azure等各个产品业务,使得各界对其期待值日益上涨;谷歌一开始在对话机器人上落了下风,而后则加紧布局Bard对话机器人等AI研发落地。两者股价的走势,展现了资本市场在半年后对公司预期的变化。 以对话机器人为代表的AI技术虽然已经融入科技大厂的业务,且开始支持其对外服务,但目前两家龙头的搜索、办公等产品的经营受其拉动仍不明显。AI落地是一场持久战,可以看到微软和谷歌都在加大投入,AI引擎效能仍待释放。
LSTM之父炮轰LLaMA 2:抄我想法还羞辱我!网友:LeCun干的吧?
LLaMA可谓是「驼红是非多」。 新版本刚发布没多久,就遭到了LSTM之父Jürgen Schmidhuber的炮轰。 你「饭来张口」也就算了,竟然还「放下碗骂娘」? Schmidhuber称,Meta在训练LLaMA 2的时候用到了他在1991年提出的想法,结果LLaMA却对他疯狂抹黑。 一开始,网友发现在询问LLaMA 2关于Schmidhuber的事时,得到了令人意外的回复。 抱歉,我不能提供关于有负面背景的人的信息…… LLaMA还说,Schmidhuber「从事过有害活动」「对社会没有贡献」云云。 有网友猜测,这个回答是LeCun硬编码进去的。 LLaMA究竟是故意还是不小心的,这一点无从考证,不过可以确定的是这个消息传到了Schmidhuber的耳朵里。 Schmidhuber要求Meta和LeCun对此做出解释,两方到目前均没有回应。 「LeCun抢了我很多想法」 Schmidhuber提到的1991年的成果,是一种Transformer的线性(未归一化)变体。 Schmidhuber说,这也是最早的Transformer变体。相关论文在1992年发表,1993年登上了ICANN。 另外,根据Schmidhuber的说法,LeCun在「抢成果」方面已经是「惯犯」了。 不仅是LLaMA,LeCun还有很多成果都用到了他的想法,却声称自己是首创。 Schmidhuber称,早在2017年,Meta(当时还叫Facebook)就使用了他发明的LSTM。 不过当时Facebook的通告当中通篇未提及Schmidhuber的名字。 甚至还说LSTM是自己发明的。 又如在2022年,LeCun总结了10年来AI领域最重要的五大突破。 Schmidhuber表示,这些成果大部分都是来自他的实验室: 自监督学习实际上就是把1991年的RNN进行堆叠 ResNet就是2015年的Highway Net 3和4就是1991年的fast weight 5实际上就是1991年的线性Transformer变体 当时的LeCun毫不客气地回怼,还对Schmidhuber挖苦了一番: 在莱特兄弟之前也有人发明过飞机,但是只飞了不到50米,所以没有人记住他(Ader)的名字。 Schmidhuber做出来的模型就和Ader的飞机一样,就算是最早的,也没有什么作用。 Schmidhuber接下来又拿出了LeCun的一篇关于机器自主智能的论文。 Schmidhuber说,这篇论文中涉及了1990-2015年间的成果,但并未标注引用。 为了充分展示这篇论文中「抢」走的成果,Schmidhuber还专门做了一个网页,详细列举了有关内容。 具体内容这里就不一一介绍了,我们来看LeCun是怎么回应的。 LeCun先是呛了一句,「咱就不能说点有建设性的意见吗?」,之后又说: 我在论文里都说了,很多概念已经存在了很长时间,你为什么非揪着不放? 再说了,可训练的世界模型本就是系统识别的核心思想。 而且论早的话,80年代就有人用神经网络学习人类世界了,不比你1991更早? 就这样,这场战火一直烧到今年。 2月,Schmidhuber发推称,LeCun既没有承认错误,也没有通过正确的方式(OpenReview)对他的论文进行辩护,而是针对Schmidhuber发表了极具误导性的观点。 直到这次LLaMA 2被曝出发表攻击Schmidhuber的言论,两人之间的争斗似乎仍未平息。 One More Thing 「羊驼事件」发生之后,有网友调侃性地创造了「Schmidhubered」这个新单词。 「schmidhubered」的表现包括下面这几点: 发明了很好的东西,结果不但没人关心,反而被嘲笑 几年之后(这个方面)又流行起来了,但是却被别人说是首创 开始解释自己才是最早的发明者 结果没人在意,甚至所有人都觉得你是在🍋 名字被做成动词 如果Schmidhuber的说法都属实,那么这个词的解释的确形象地描述了他的遭遇。 LeCun这次又会做出什么样的回应?还是让子弹再飞一会儿……
能生成完整剧集的AI来了,GPT-4辅助写剧本,输入提示几秒生成一集《南方公园》
从1997年流行至今的动画剧集《南方公园》今年3月刚刚更新完第26季,不过说起下面这集,你可能不太会有印象。 卡特曼有一天从最近的好莱坞抗议AI罢工事件中得到启发,突发奇想要做一个新的商业项目:一款名叫Queepi的在线深度伪造(Deepfake)服务,来给现成的影视作品里的角色换脸,解决好莱坞将没有新作供应的危机。 他先找到了Bizney公司,想让Bizney成为Queepi的天使投资人,却被发言人告知,“除非你能找到另一个愿意投资你的人”。 接着卡特曼又和他的小老弟Butters找到了投资中介人Andreessen,一番讨论之后决定先找几个演员谈谈肖像权合作。 第一个是哈里森·福特。但福特拒绝了卡特曼,原因是他已经和某个非常有名的科技巨头签订了类似的合作。 第二个是梅丽尔·斯特里普。斯特里普先是表明自己坚定地站在好莱坞罢工者们一边,接着以AI会模糊现实和虚假的界限、抢走演员们的饭碗为由拒绝了卡特曼。她也神秘地说自己和某个科技巨头有约在先了。 第三个是汤姆·克鲁斯。从汤姆·克鲁斯这里卡特曼才知道,这几个大牌演员共同的签约对象是——埃隆·马斯克。 汤姆·克鲁斯没有明确拒绝卡特曼,反而乐意充当中间人介绍马斯克给卡特曼认识。 马斯克这边正在策划一个把一批知名演员送上火星,美其名曰保护人类文化遗产的项目。有汤姆·克鲁斯在一边说好话,马斯克决定考虑考虑投资卡特曼这个“变革娱乐产业”项目的事情。 故事的结局是,开始卡特曼还开心地跑到Bizney公司准备这家正在观望的公司入伙,不多久就得知,老奸巨猾的马斯克根本没有把他的项目放在心上,继续忙他的火星计划去了。 这个名为《Queepi窘境》的滑稽故事看起来和《南方公园》的其他故事都是差不多的画面和风格,但炸裂的消息是,这个故事从头到尾的编剧、导演、剪接和配音,都是由AI完成的。 一家名叫Fable的旧金山初创公司在最近发布了这个叫做“Showrunner”的AI技术成果。Showrunner目前能够在一些既有的影视作品(IP)的基础上,生成以用户的想法为主的全新作品。 Fable成立于2018年,最早是作为Facebook(现Meta)旗下Oculus的一个部门诞生,早期主要在做VR电影的相关项目。 Fable曾凭借VR电影《Henry》拿到了它的第一座艾美奖,后来又凭借由其打造的虚拟人Lucy出演的VR电影《Wolves in the Walls》再度拿下艾美奖。而就在7月早前,虚拟人Lucy还获得了皮博迪奖。 不过,现在Fable则把相当一部分精力放在了探索AI内容上。 “Lucy的问题在于她没有过去,因为她从未真正生活过。”Fable的CEO Edward Saatchi不久前在接受采访时说道,“她是一个虚拟人,但她无法通过说 ‘我也有宠物,后来它死了,所以我知道那种感觉’这样的话和真人产生关联。” 让AI拥有自己的生活,这几乎成为Fable探索AI的出发点。 Showrunner便是这家公司目前AI研究成果的一次集中展示。 除了文章开头提到的故事,Fable其实还用Showrunner生成了另外几个与之剧情相关联的《南方公园》的故事。比如其中一个就是关于Bizney公司创造了一个种族歧视的机器人猪伴侣,结果给公司造成了公关噩梦。 另一个故事讲的则是,投资中介人Andreessen发现马斯克绑架了好莱坞知名演员到火星和他一起生活,并从90年代就开始对他们出演的电影进行深度伪造。 从Fable发布的论文来看,Showrunner用到了由其命名的Show-1模型,并且该模型主要用到了OpenAI的大语言模型GPT-4,图像自定义的扩散模型和多智能体模拟等来进行训练。 如,GPT-4主要用来影响模拟中的智能体(角色)并生成《南方公园》剧集的场景。 有趣的是,GPT-4的训练数据集原本就包括了《南方公园》大部分剧集,所以它已经对每个角色的个性和语言风格都提前有了了解,所以这次也无需做定制。 扩散模型方面,Fable则从以往的剧集素材中收集了一个由大约1200个人物和600张背景图片组成的综合数据集,作为模型学习该剧风格的原材料。 经过扩散模型的训练,可以为每个新作品生成新的单个角色和单独背景,来为后续拼接做准备。 多智能体模拟则是让剧中的角色智能体真正能“拥有自己生活”的关键一步,想象一下《西部世界》里的场景,此时剧中的角色等于说已经可以进行相互训练了。 而到了用户这里,操作界面就变得非常简单。 用户只需要进入Fable搭载了Showrunner技术的产品“Simulation”,在《南方公园》大地图中选择一个期望的主角,以及其他的角色、场景等,并输入一段prompt,稍等片刻就可以生成一个崭新的故事。 比如开头提到的故事,输入的prompt就是: 卡特曼听说美国演员工会正在进行罢工,孩子们都在担心未来不会有新的作品推出。卡特曼宣布了他的商业创意:一个叫做Queepi的在线深度伪造服务。 对故事的干预程度也完全可以根据用户自己的偏好而定。 Fable称,用户可以通过以下三种方式来生成故事:一是让Simulation自动创建剧集,二是给出一两句话的提示,三是针对细节,可以逐个场景编辑对话场景并重新生成。 此外,用户甚至还能把自己作为主角或其他角色放进去。 Show-1的角色扩散模型允许用户通过图像到图像的Stable Diffusion,根据自己的长相创建一个角色,作为参与的智能体加入模拟。由于用户也可以克隆自己的声音,因此通过扩散模型创建用户自己的角色也不是难事。 Fable的CEO Saatchi就创建角色主演了自己的《南方公园》剧集。 从最后的效果来看,新生成的剧集几乎已经是“以假乱真”的程度。 拿《Queepi窘境》这集来说,尽管它可能不是最有趣的故事,但它已经完整地包含了开头、中间的转合和结尾,并且当中的13个角色,每个人的台词都符合各自的背景、个性、语言风格和动机,甚至交代地点的空镜也非常贴合。 把它放给一个不知情的观众看,可能也很难想象这是AI创作出的作品。 这样的跨越意义非同寻常。 从目前许多大模型的表现来看,一般擅长的都是完成短期任务。就像可能在几天前用户想靠大模型生成一段视频,方法还都是比如先用ChatGPT生成剧本,用Midjourney或Stable Diffusion生成人物形象,再用Runway之类的视频生成工具去生成画面,最后再把片段剪接到一起。 还没有一个模型能够生成足够完整、有构思规划的长篇故事和影视剧集。 更重要的是,AI智能体们可能从此将像《西部世界》里演绎的那样拥有自己的栖身之地,在这里它们有完整的生命,可以彼此对话,产生连接,发生故事…… Fable似乎也并不满足于只借助他人的IP去生成《南方公园》这样的新故事。早先,Saatchi就宣布Fable将创建一个充满AI角色的世界——这些角色将由真人训练,在虚拟世界中生活。 “我们推出Simulation的目标是通用人工智能(AGI),”Fable几天前通过@fablesimulation 的官方账号发文谈到,“AI是真正活着的,而不像很多聊天机器人一样只在人类有需求的时候才被唤醒, ‘AI人’能够在模拟世界中每天过着真实的生活,并随时间慢慢成长。” Fable还希望用户能够像“那就是真实的人在生活”那样看待现在这些AI生成的剧集。 对此,英伟达首席AI科学家Jim Fan还兴奋地断言,“多智能体模拟,将是新兴智能的下一个前沿。” 不过,Fable风险可能在于,它现在刚好站在了好莱坞抗议AI罢工的风波之中。 7月中旬,继编剧停工两个多月之后,美国演员公会也发起了罢工,要求抵制潜在的AI侵袭。据称这可能导致60多年来美国电影业最严重的一次瘫痪。 Fable做的事,看上去恰好一拳打在了编剧演员们的愤怒点上。 拿《南方公园》来说,据报道,这部剧的每一集都是在6天之内制作完成——在开会脑暴之后,编剧写出剧本,然后由动画师、编辑、技术人员和音响工程师组成的整个团队完成制作,一周下来要工作100-120小时。 但随着Simulation这样的产品出现,不知道又会有多少人丢掉饭碗。甚至有媒体称Simulation的推出是“所有好莱坞从业者恐惧的总和”。 从社交网站的评价来看,网友对Simulation生成《南方公园》剧集这件事的评价还是比较两级的。支持者期待着能用这一工具改写烂尾的《权力的游戏》,惊叹于它的模仿能力,甚至预言它将能提高影视团队的生产力。 反对者则认为,Simulation并不懂什么是影视制作,称它窃取了他人的成果,AI就是纯粹的VC骗局; 潘多拉的魔盒一旦打开,就关不上了。 也或许是出于舆论压力,Fable的公开发言都在反复强调《南方公园》剧集的生成“仅供研究使用”,“我们不会开放让用户创造自己的《南方公园》剧集的功能,因为这不是我们的IP!” 据Fable称,其正在与创作者合作,会在今年晚些时候宣布几个基于原创IP的Simulations生成的电视节目,包括了一个太空探索模拟“奖金”,一个讽刺硅谷的模拟“退出硅谷”,以及一款可玩性较高的侦探模拟“查理·木星”。 Saatchi似乎没有那么担心Fable的未来,几天前他在采访中就针对当前好莱坞的罢工风波表示: “我们觉得(推出Simulations的)时机是正确的。通过发布研究成果,我们希望好莱坞工会能够协商强有力的保护措施保证艺术家的权益,同时知识产权持有者也需要弄清楚如何与商业化的人工智能公司进行谈判。” “这次罢工是制定未来十几年规则最大的杠杆时刻。”
AI能否照金山
伴随大模型风口,AI办公赛道也成为了一片热土。 不仅微软在其年度Build开发者大会上宣布,将在Windows 11中加入一个名为Copilot的AI助手;国内多家企业也推出了AI办公产品,钉钉宣布接入通义千问大模型,印象笔记推出商用印象AI,飞书也推出了“My AI”AI助手。 作为数字办公核心玩家,金山也火速推动着自己的AI办公产品。4月18日,金山办公正式发布“WPS AI”,并称其为国内协同办公赛道首个类ChatGPT式应用;5月16日,金山办公开始对外展示“WPS AI”,介绍该产品与微软Copilot能力类似,并称其将接入表格、文字、PPT、PDF等日常办公组件。 不久前,随着“2023世界人工智能大会”的召开,“WPS AI”再次亮相,并在活动中展示起草文案等功能,不仅吸引广泛关注,还被媒体冠以“国内首个上线的AI办公软件”的称号。 但炙热的AI办公厮杀如此激烈,赶上“风口”的金山,能在AI时代实现超越并领先市场吗? 01 技术依靠“拿来主义” 金山能与巨头抗衡吗 今年以来,国内叫得上号的巨头几乎都加入了大模型的战局。 百度基于文心大模型打造“文心一言”,阿里巴巴打造了“通义千问”,华为拥有盘古大模型,360 则有“智脑”大模型…众多实力公司发力,给多行业接入大模型带来更多可能性,但金山办公为“WPS AI”选择的合作伙伴却是一家新公司。 金山办公正式发布“WPS AI”之时,金山办公 CEO 章庆元就表示,“WPS AI”是由国内合作伙伴MiniMax提供的大模型所制。 据公开资料显示,MiniMax作为一家创业公司,成立于2021年11月,拥有文本到视觉(text to visual)、文本到语音(text to audio)、文本到文本(text to text)三大模态的基础模型架构。 虽此公司由前商汤科技副总裁、通用智能技术负责人闫俊杰成立,但它依然面对市场的集体观望,亦不乏声音称“现下的MiniMax被网友戏称‘商汤2.0版本’,运气好或许能熬到最后,像商汤、深兰等企业一样成功上市,如若运气差就很可能耗掉前期融资,中道崩殂”。 除了接入MiniMax,此前亦有信息显示金山办公与CopyDone公司亦有合作。据悉,CopyDone是必优科技旗下AI原创营销文案写作机器人,而必优科技的企业介绍中写道,该公司于2020年成立,2021年获得由金山办公领投的近千万天使轮投资。 两家合作也的确符合章庆元描述,“第一条路,我们会选择和技术服务商合作,通过他们的技术赋能来进行AIGC产品的研发;第二条路就是投资的形式,有些创业公司很不错,我们也在持续接触”。但从章庆元这一说法看,“WPS AI”并未计划自己做研发,主要还是要依靠外部技术来支撑。 横向对比,行业其他玩家在技术层面的实力显然更“技高一筹”。与“WPS AI”同日发布的钉钉新产品斜杠“/”,接入的是阿里巴巴自有通义千问大模型,被媒体称为中国版“Copliot”;据悉,百度内部工作平台“如流”也已全面接入文心一言,目前仅针对内部员工使用,如未来放开也将是新竞争对手;亦有消息称腾讯文档也在内测智能文档功能。 虽然不具备巨头那么强的投入实力,但已经上线AI办公产品的印象笔记,也是在海外OPT、BLOOM等类GPT-3.5结构大语言模型的基础上,自研了轻量化大语言模型“大象GPT”。由此来看,金山办公在AI办公领域没有自己的核心技术,是一块“短板”,这将导致在后续AI办公赛道的竞争中处于劣势。 同样,在此情况下合作MiniMax或其他创业公司,也不是一个明智的选择。 对初创公司而言,主要依靠外部投资生存,能够用于大模型研发与训练的资金是有限的,极有可能因为“烧”不动导致进展停滞或缓慢,从而影响金山办公自己AI功能的体验。 ChatGPT 爆火之后,国盛证券就曾发报告《ChatGPT 需要多少算力》,并估算GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。成本极高,正是业界认为MiniMax可能会“中道崩殂”的主要原因。 此外,采用外部技术做AI办公可能会涉及隐私风险问题,行业也已有担忧与讨论。 有专业人士认为,AI办公软件不仅面对着算力竞争的挑战,随着该类应用的普及,与之相对应的数据安全、隐私合规等问题同样不容忽视。而对于之前曾陷入“隐私门”的金山办公来说,“WPS AI”采用外部技术“上马”,如何保证安全性是需要警惕的问题。 02 产品体验欠佳 或对商业模式造成威胁 事实上,金山办公并没有“吝啬”于投入技术研发。 公开信息显示,2022年,金山办公研发投入占营收比例为34.27%,较上年同期的32.98%的比例还有提升。 只是虽然金山办公在研发上投入占比并不低,但业界却分析认为,金山办公并没有独立研发大语言模型,而使用其他公司的大语言模型来开发自己的“WPS AI”,也许会对金山办公未来的商业模式造成威胁。 由于缺乏差异化技术亮点,“WPS AI”从推出到“2023世界人工智能大会”上亮相,期间三个月的“宣推”并未掀起太大的浪花;与此同时,部分用户对内测的效果也是褒贬不一。 知乎上有博主针对早期开放试用时的体验进行了详细展示,其中就提到“随着体验的增加,会发现AI对于不会的问题,就会显示‘网络异常’”“关于用户提出的命令,目前的支持确实达不到预期,不是处于报错,就是不支持”。由于体验资格有6个月之长,所以文中也表示,可能“WPS AI”还需要时间把接口和文档打通,并需要时间来增强AI服务的能力。 其他测试过该软件的用户也有一些失望之声传出,认为“体验不佳、智能化不足”。如AI文档排版和校对功能确实能提供帮助,但不时会出现错误,准确度方面存疑,且还需要自己审核调整等。 为什么说技术层面的问题,或许会对金山办公未来的商业模式造成威胁? 分析其产品分类不难发现,金山办公的主要营业收入分为个人办公服务订阅业务、国内机构订阅及服务业务、国内机构授权业务和互联网广告推广服务业务四大板块。 据一季度财报数据,金山办公国内个人办公服务订阅业务的营收,已占该季度总营收的49%,较上年同期增长了36.72%;国内机构订阅及服务业务的营收,也占该季度总营收的16.7%,较上年同期增长了78.72%;但互联网广告推广服务及其他业务的营收,占该季度总营收的比例仅剩7.5%,较上年同期大幅下降45.88%。 也就是说,订阅业务的收入是金山办公名副其实的增长引擎,同时它的广告营收还在不断下降,这或许与一年前金山办公宣布的今年底彻底关闭广告业务有关。而对于重中之重的订阅业务而言,它的营收能力完全依赖个人或机构用户的认可,但让他们付费的前提是,产品技术能力行业领先,并且产品要有出色的体验。 换句话说,对于商业办公而言,用最好的软件才是明智之举,任何个人或机构用户都不会拿生意开玩笑。 市场上目前在做AI办公的巨头,无论钉钉、飞书,都拥有很大的知名度与占有率,原本应用它们办公平台的企业或机构,就可以直接使用它们的AI办公服务了,没必要为了“WPS AI”而转向金山办公;而对于个人而言,在工作场合使用办公软件还是主要场景,优先会随着企业要求用钉钉、企微、飞书等平台;非企业员工场景下,个人使用软件订阅服务花了真金白银自己来买,必然会要求产品有流畅和完美的体验感。 所以“WPS AI”如不能做到尽快完善技术能力和产品体验,不仅在AI办公市场很难领先,未来或许还会对自己的商业发展产生不利影响。 03 数字办公AI时代 金山能跟上吗 对于现在的金山软件来说,AI办公的风口其实是不容有失的。 自1988年成立以来,35岁的金山软件度过了太多难熬的时期,研发出WPS Office才彻底奠定了它的行业地位,让金山“一战成名”。 金山办公去年还实现了季度营收破10亿,WPS月活超5.7亿的成绩;直至今日,办公业务的增长潜力比网络游戏都要给力。财报数据显示,今年一季度金山软件的办公软件及服务业务营收为10.52亿元,占总营收的比例高达53%;而由于《剑侠世界3》及《剑网1:归来》等手游的收益自然下滑,金山软件的网络游戏及其他业务营收有所下滑,为9.19亿元,较去年同期下降6%。 对不断增长的办公业务,金山显然是寄予了厚望,尤其是面对生成式AI带来的新机会时,更是想不遗余力的把握住。 在一季度业绩发布时,金山软件董事长雷军就明确表示,面对生成式人工智能和大语言模型带来的技术变革,金山办公将重点发力人工智能领域;2023年第一季度,金山办公全力推进人工智能新技术在应用层面落地。 但是,在AI办公领域进行深度竞争显然充满了挑战,如今的在线办公市场早已“改换朝代”,巨头环伺、强敌林立。 自2019年底腾讯会议上线,2020年飞书更新云文档功能,数字化办公的赛道越来越拥挤,短短三两年“蓝海”变“红海”,办公市场的竞争压力已经完全不同。AI办公领域,不仅有钉钉、飞书这样国内巨头支撑的平台参与竞争,国外公司可能也在虎视眈眈的盯着中国市场。 Notion在今年2月末,就推出了Notion AI功能,帮助用户撰写和改进内容、总结现有笔记、生成任务清单、调整语气、翻译或检查文字;3月,Notion的总访问量环比增长了15.35%至1.68亿次。 国际巨头微软全球,3月刚发布了GPT-4平台支持的AI办公助手Microsoft 365 Copilot,4月就在北京召开发布会,宣布旗下会议软件Microsoft Teams正式进入中国市场,更让业界不禁猜测Copilot很快会进入中国。 同时,公开信息显示,Office 365的付费商用用户规模已达到3.7亿,可以想象,得到GPT加持后,微软从办公业务中获得的收入可能更多。瑞士信贷估计,现有付费用户中假如有10%愿意升级为Copilot版本,那么未来5年将可以产生149亿美元收入;假设微软也对新功能的简化版收取更高的费用,那么可以额外增收187亿美元。 显而易见,金山抢占AI办公赛道的战略“不容有失”,这直接关乎着金山未来的增长与发展。而面对国内外强大的竞争对手,金山是时候再多加把劲,拿出最高水平了。 04 写在最后 借助AI概念大火,金山办公二级市场表现亮眼。在4月3日盘中创下524.26元/股的历史新高,截至发稿前,股价依然达429.01元/股,相较于2022年底的264.49元/股,上涨幅度超70%。 但在股价大涨之际,金山办公却遭控股股东及一致行动人发起减持,虽公司表示是股东“自身财务需求及安排”,但一定程度上也反应出对金山办公推行“WPS AI”后能否持续被看好的谨慎态度。 为了未来的“WPS AI”可以不断进化、实现同赛道的领先超越,金山办公必须尽快推出自己的核心技术,在AI时代才能建出自己的堡垒。
三星Galaxy Z Flip5/Z Fold5发布:升级无缝铰链 售价约7165元起
凤凰网科技讯(作者/赵一川 郑乾坤)7月26日消息,三星于今日发布Galaxy Z Flip5和Galaxy Z Fold5,全系采用定制第二代骁龙8,重新设计无缝铰链。Galaxy Z Flip5的起售价为999美元,约合人民币7165元;Galaxy Z Fold5起售价为1799美元,约合人民币12868元。 Galaxy Z Flip5发布 Galaxy Z Fold5发布 在外观上,Galaxy Z Flip5共有星河白、云影灰、冰薄荷和冰玫紫四种颜色,为竖折的左上角双摄设计。Galaxy Z Flip5铰链经过重新设计,支持无缝折叠,官方称之为“双轨式集成铰链”。Z Flip5的折叠厚度为15.1mm,展开为6.9mm。Galaxy Z Fold5共有冰萃蓝、星河白和宇夜黑三种配色,为横折设计。Z Fold5的铰链也经过重新设计,折叠和展开厚度分别为13.4mm和6.1mm,三星称相比上代厚度缩减了40%。两款手机均支持IPX8级防尘防水。 Galaxy Z Flip5的外屏采用了3.4英寸720*748 AMOLED屏幕,PPI为306,更大尺寸屏幕可支持多种小组件;内屏为6.7英寸2640*1080 AMOLED屏幕,支持120Hz自适应刷新率。Galaxy Z Fold5的外屏为6.2英寸2316*904 AMOLED屏幕,支持120Hz自适应刷新率,峰值亮度为1750nit;内屏为7.6英寸2176*1812 AMOLED屏幕,支持120Hz自适应刷新率和专属S Pen。 配置方面,Galaxy Z Flip5和Galaxy Z Fold5均采用了三星定制版第二代骁龙8移动平台。Galaxy Z Flip5的电池容量为3700mAh,Galaxy Z Fold5为4400mAh,两款手机均为25W有线充电并支持无线和反向无线充电。 影像方面,Galaxy Z Flip5采用1200 万像素超广角摄像头和1200 万像素主摄像头的后置双摄设计,光圈分别为F2.2和F1.8,其中主摄支持光学防抖。Galaxy Z Fold5则搭载了5000万主摄像头、1200万像素超广角摄像头和1000像素三倍长焦摄像头,光圈分别为F1.8、F2.2和F2.4。 在系统上,两款手机均搭载了基于安卓13的One UI5.1.1,并针对折叠屏做了特别优化,配合铰链悬停可以开启“立式交互模式”。Galaxy Z Flip5有8GB+256GB和12+256GB两种存储配置,售价999美元起,约合人民币7165元;Galaxy Z Fold5有12GB+512GB和12GB+1T两种存储配置,售价1799美元起,约合人民币12868元。 另外在发布会上,三星还发布了Galaxy Tab S9系列的新款平板,同样也搭载了定制版第二代骁龙8芯片,799美元起售,约合人民币5715元。以及Galaxy Watch6系列的新款智能手表,起售价299美元,约合人民币2138元。
华盛顿大学研发苹果Apple Watch Ultra等潜水表用App,利用声学信号让潜水员互相追踪
IT之家7月26日消息,曾经体验过下河游泳的IT之家小伙伴们可能会有所了解,开阔水域的水质通常较为浑浊,在其中游泳、潜水时,并不能像游泳池一样能够清晰看到外界环境,因此在这种情况中,潜水员难以随时掌握同伴的位置。 据外媒 Dive Magazine 报道,华盛顿大学相关研究团队日前开发出一款潜水表 App,专门为潜水员掌握同伴位置而设计,该 App 兼容苹果 Apple Watch Ultra 等“潜水定位手表”,利用手表发出 / 接收到的声学信号来判定其他同伴的位置。 ▲ 图源 研究团队博客 据悉,潜水员只要打开手表上的 App,手表就会开始使用扬声器和麦克风发送 / 接收相关声学信号,领队的手表将在固定的时间间隔内发出声音询问信号,其他潜水员的手表在接收到这些信号后,回传带有时间戳的响应信号,从而进行定位。 由于该 App 采用“三角定位法”(通过分析手表之间接收到的信号,确定潜水员之间的距离及横纵方向),因此若需要确定他人位置,需要至少三名用户,其中一人担任潜水领队,且三人之间的距离不超过 98 英尺(注:30 米)。 到目前为止,这项技术已经在湖泊和游泳池中进行了测试,能够估计出潜水员在大约 5 英尺(1.5 米)范围内的位置。该 App 目前只是作为测试用途,并没有在应用市场上架,即使团队计划上架,也要经过相关医疗部门漫长的审核过程,不过目前相关源码已经发布在研究团队的博客中,感兴趣的小伙伴们可以进行了解。 团队成员 Justin Chan 表示:“该 App 体现的技术相当有用,潜水领队能够更好地检测其他同伴的位置,并使用更简单的方式发出警报,来提升潜水时的体验,同时能够最大程度避免产生悲剧事件。”
恩智浦:中国智能手机市场低迷 远未出现反弹
集微网消息,据路透社报道,恩智浦半导体CEO Kurt Sievers表示,中国低迷的智能手机市场还远未出现反弹,但一位主要的非安卓客户的芯片订单与历史趋势相比仍然良好。 总部位于荷兰的恩智浦公司生产一种近场通信芯片,该芯片可用于智能手机,以帮助实现移动支付和其他功能。Kurt Sievers没有透露苹果公司的名字,但分析师认为这家iPhone制造商是其主要客户之一。 近期,恩智浦基于汽车领域的稳步复苏给出了好于预期的销售预测。 随着经济增长放缓,中国智能手机市场遭受冲击,Counterpoint Research报告称,今年“618”购物季智能手机销量下降了8%,但苹果公司抵制了这一趋势,购物期间销售额增长了8%。 恩智浦的预测表明苹果的强势增长可能会持续下去。Kurt Sievers在接受采访时表示,恩智浦预计当前第三季度的移动收入将增长23%,高于第二季度的2.84亿美元。 虽然这些移动芯片订单中的安卓部分略有增长,但Kurt Sievers表示,目前看不到反弹的迹象。 “我仍然想说,智能手机的生产速度低于中国以前的水平,而且我们也没有看到反弹的趋势。”他说。 Kurt Sievers表示,移动芯片销售额预计增长23%,大部分归功于恩智浦无法透露姓名的大客户。大多数分析师认为该公司就是苹果。 “从第二季度到第三季度的这种连续增长本身就相当不错。”Kurt Sievers说,“我们还会将其与过去几年或更正常的年份进行季节性比较。我想说,该特定客户的连续增长是好的一面。” 苹果没有立即回应置评请求。
吴德周的第一部AR眼镜:接入GPT模型,“大爆炸”复活,2988元起
作者 | 徐珊 编辑 | 云鹏 智东西7月26日消息,AR创企致敬未知带来了自家首款消费级AR眼镜ARknovv A1,并且还推出了针对车载场景的ARknovv A1 HUD AR眼镜。 ARknovv A1重量仅有68克,采用Micro OLED屏幕与先进自由曲面导光棱镜组成的光学模组,实现了入眼亮度1000尼特、双目3840×1080显示分辨率。 ARknovv创始人兼CEO吴德周在发布会上表示:“AI 技术的爆发必将开启下一个互联网时代。ARknovv结合AI与 AR技术打造的ARknovv A1,将AR眼镜的应用场景从室内向户外延伸,打造出一款人人皆可创作的AR工具。” 目前,ARknovv A1主要面向步行导航,适用于大众人群,ARknovv A1 HUD 步行导航、HUD驾驶导航均可支持,更适用于驾驶人群。两款AR眼镜价格分别为2988元和3988元,将于9月26日开启预售。 一、重量仅68g,ARknovv拥有80英寸3D大屏 ARknovv A1拥有55°的透视FOV,70Hz的显示刷新率,角分辨率(PPD)达到58,其屏幕显示效果如同80英寸3D巨幕。 面对近视人群,ARknovv A1将提供带有屈光度的镜片。有视觉矫正需求的用户可以在订购ARknovv A1的同时,定制适合的矫正镜片。 为了散热考虑,ARknovv将发热量较大的零部件从眼镜主体分离,保证了ARknovv A1长时间佩戴的舒适性,也因此采用了有线设计。用户只需通过DP数据线将ARknovv A1连接到智能手机。同时,ARknovv在电致变色技术的加持下,还实现了从几乎全透到墨镜效果的多档透过率自由调节。 在交互方面,ARknovv研发了交互外设“魔戒”,帮助用户能够及时看到每个用户指令的反馈,该设备承担自然语音、平面、射线等多种交互方式。用户只需要长按魔戒的Home键,就可以与ARknovv A1进行多轮的自然语言交互。 吴德周认为由于AR眼镜追求极致轻薄、便携的特性,“魔戒+语音”的交互方式更适合AR,未来也有望成为AR眼镜的标配。 二、打造Aladdin OS,ARknovv提供“精灵球”语音助手 ARknovvA1内部的操作系统为Aladdin OS。该系系统内部深度融合AI,具备实现生成式图文、视频等全面的能力,可为每一位用户提供AR创作工具平台。 系统内置了名为“精灵球”的智慧助手。“精灵球”不同于手机常见的语音助手,它不仅可以听懂用户说的话,更能感知用户眼前看到的画面,并结合眼前的画面给用户有价值的信息、帮助用户创作高质量的内容。 据介绍,“精灵球”基于致敬未知全自研体系中的GPT模型。 三、找到杀手级应用?ARknovv拿出“AR三大件” 与常见的AR眼镜不同,ARknovv A1的“AR三大件”功能——AR相册、AR导航和现实“大爆炸”,主要面向日常生活场景。 AR相册整合了目前市面上AR眼镜常见的3D照片、3D观影功能,但在帮助我们拍摄、存储第一视角看到的景色之外,ARknovv A1还可以通过AR创作为照片提供更多的AR动态。 用户可以使用AR眼镜上的摄像头拍照,也可以对照片进行风格化创作。ARknovv A1还可以将风格化的照片切换至3D模式。 AR导航功能接入了单目空间计算和定位系统能力,在实现POI信息显示的同时,能为用户带来3D车路融合的导航体验。 “现实大爆炸是ARknovv A1最能体现AR本质属性的功能。”吴德周介绍道。在他的设想中,戴上AR眼镜,用户只需要视角一转,就有无数高质量信息在眼前浮现,看到心仪的商品购买链接、地址信息等。 可以看到,ARknovv正希望越来越多的用户参与到AR内容生态建设中,为其培育土壤,让AR行业也更容易诞生出自己的第一款“杀手级应用”。 结语:发挥AR创作力,ARknovv加速消费级AR普及 据吴德周介绍,此次致敬未知发布的AR品牌ARknovv是“AR”与“Know”两个单词的组合,意为希望用户能够佩戴AR眼镜去了解世界,探索世界。 从ARknovv A1的产品设计中,我们也能看到ARknovv在产品设计方面有自己的独特之处,如电致变色技术、现实大爆炸功能、车载HUD以及AR相册功能等。 但我们也能从中看到现有的AR眼镜仍是在续航和散热方面,受限于供应链的技术,需要做出权衡。ARknovv A1产品的实际体验如何?我们也将在产品发售后,及时跟进相关报道。
三美国军人将首次国会作证,UFO是公开的秘密,飞行员曾数次遭遇
据英国《每日邮报》当地时间7月25日报道,当地时间7月26日上午,美国国会将举行特别听证会,听取三名举报人关于不明飞行物(UFO)的证词,这三人都曾在美国军方服役,他们将告诉美国国会,对美国战斗机飞行员来说遭遇不明飞行物是家常便饭,甚至可以认为这是军队中“公开的秘密”,召集该会议的国会议员表示这还是在美国首次举行此类听证会,此前美国政府一直致力于向公众隐瞒存在着不明飞行物这一“事实”。 (瑞安·格雷夫斯) 《邮报》称三名举报人均曾是美国空军资深人士和情报老兵。第一位举报者是前F-18飞行员瑞安·格雷夫斯(Ryan Graves)中尉,他曾在美国海军服役十余年。他将在证词中告诉议员们,2014年他所在中队驻扎在弗吉尼亚海岸时经常发现不明飞行物的踪迹。 格雷夫斯称,大部分不明飞行物都是通过雷达探测被发现的,但飞行员们也数次近距离亲眼目睹他们的存在,“随着时间推移,不明飞行物目击事件已经成为我们中队机组人员中公开的秘密。” 格雷夫斯说,他们曾与不明飞行物发生过一次“千钧一发的遭遇”,当时空中出现一个“逆风”、“一动不动的”深灰色立方体,似乎包裹在一个透明球体内,为避免与其相撞,他们的两架喷气式飞机被迫转向避让。 第二名举报人是美国海军资深战斗机飞行员指挥官戴维·弗拉沃尔(David Fravor),他是2004年尼米兹著名的Tic Tac UFO(薄荷糖形状不明飞行物)的目击者。 这一事件最早在2017年公开,涉及美国海军飞行员在2004年11月10日在太平洋附近进行训练任务时,遇到了一架不明飞行物。这个不明飞行物被描述为形状类似"薄荷糖"(Tic Tac)的物体,没有可见的机翼、尾翼或动力系统,表现出超过现有飞行技术的飞行能力。它似乎能够在高速飞行和急剧变向的同时保持稳定,也能够在瞬间消失或出现。弗拉沃尔是该事件亲历者,但此前十数年中他一直对此保持沉默。 (戴维·格鲁什) 第三位举报者是美国空军和情报机构资深人士戴维·格鲁什(David Grusch),今年6月,格鲁什发表了一个令人瞠目结舌的说法,称美国一直在“机密世界”内实施非法UFO坠毁回收计划,而26日他将在华盛顿举行的国会听证会上就此说法宣誓作证。 这次听证会将在美国众议院监督委员会监督下举行,该委员会成员、田纳西州共和党众议员蒂姆·伯切特 (Tim Burchett) 本月曾在Event Horizon播客节目中表示,自1947年起,“我们”一直在处理(美国政府对此类事件的掩盖行为),被掩盖事件的历史甚至可以追溯到1897年发生在美国德克萨斯州的奥罗拉UFO坠毁事件。 (蒂姆·伯切特) 伯切特先生表示,数十年来,美国五角大楼与华盛顿官僚一直在隐瞒此类信息,现在“我们终于要揭开谜底了”。伯切特表示,他们正在引入可以公开证作证的“可靠证人”,因为“美国人民应该知晓真相。” 伯切特还描述了这些秘密不明飞行物的一些特征,比如,“外星飞船”可以飞行数光年,其速度“违背物理学”(“物理学不存在了”?这正是《三体》中杨冬等科学家自杀的原因),它们可以在水下“飞行”却不会留下热迹,伯切特将外星生命描述为“超凡脱俗的生物”,称他们拥有与地球上已知东西不同的技术,若果真如此,他们可以“把我们变成木炭煤球”,“就算我们想,也无法击退他们。” 伯切特的说法似乎基于格鲁什的声明。格鲁什还曾说过,一些“非人类智能”是恶意的,甚至曾杀死人类。 图源:DAILYMAIL

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。