行业分类:
加载中...
头条分类:
加载中...
全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1
作者 | 三北 编辑 | 漠影 云计算“春晚”云栖大会开幕,通义千问大模型再次燃爆全场! 智东西9月19日杭州报道,今日,阿里云推出全球最强开源大模型Qwen2.5-72B,性能“跨量级”超越Llama3.1-405B,再登全球开源大模型王座。 ▲Qwen2.5-72B在多项权威测试中超越Llama-405B 同时,一大串Qwen2.5系列模型随之开源,包括:语言模型Qwen2.5、视觉语言模型Qwen2-VL-72B、编程模型Qwen2.5-Coder、数学模型Qwen2.5-Math等,累计上架超100个,部分性能赶超GPT-4o,刷新世界纪录。 “今天是疯狂星期四”、“史诗级产品”……发布几个小时里,Qwen2.5在海内外社交媒体上掀起讨论热潮,全球开发者纷纷加入试用测试队伍。 ▲Qwen2.5在海内外社交媒体上掀起讨论热潮 智东西也第一时间在魔搭平台上试用了Qwen2.5,以结合视觉识别的Qwen2.5-Math为例,当输入一张几何相似选择题截图,Qwen2.5-Math快速识别题意,并给出了正确的解题过程和答案“B”,准确与速度都不错。 ▲智东西试用Qwen2.5-Math 自2023年4月以来短短一年半时间,通义千问Qwen已长成仅次于Llama的世界级模型群。 根据阿里云CTO周靖人公布的最新数据,截至2024年9月中旬,通义千问开源模型累计下载量已突破4000万,衍生大模型超5万个。 ▲Qwen系列衍生大模型超5万个 Qwen2.5在性能上具体有哪些提升?超100个新上架开源模型有哪些亮点?智东西抵达杭州云栖大会现场为大家揭秘。 博客地址:https://qwenlm.github.io/blog/qwen2.5/ 项目地址:https://huggingface.co/spaces/Qwen/Qwen2.5 ▲官方博客发布阿里云Qwen2.5模型族群 一、再登全球榜首,Qwen2.5跨量级赶超Llama3.1-405B 具体来看看Qwen2.5的性能。 Qwen2.5模型支持高达128K的上下文长度,可生成最多8K内容,支持超29种语言,这意味着能帮用户胜任万字文章撰写。 不仅如此,基于18T token数据预训练,相比Qwen2,Qwen2.5整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。 ▲阿里云CTO周靖人在讲解Qwen2.5 据悉,旗舰模型Qwen2.5-72B模型在MMLU-rudex基准(考察通用知识)、MBPP 基准(考察代码能力)和MATH基准(考察数学能力)的得分高达86.8、88.2、83.1。 720亿参数的Qwen2.5,甚至“跨数量级”超越4050亿巨量参数的Llama3.1-405B。 Llama3.1-405B由Meta于2024年7月发布,在150多个基准测试集中追平甚至超越了当时SOTA(业界最佳)模型GPT-4o,引发“最强开源模型即最强模型”论断。 Qwen2.5指令跟随版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等权威测评中,超越Llama3.1-405B。 ▲Qwen2.5-72B模型测评情况 Qwen2.5再次坐稳全球最强开源大模型位置,助推“开源超闭源”行业趋势。 这是阿里云继今年6月开源通义千问Qwen2系列、赶超当时的最强开源模型Llama3-70B后,再次推出开源系列版本。 每一个新王出现后,很快就会被通义新版本超越,这已成为AI开发者圈熟悉的节奏。 9月18日晚间Qwen2.5开放后,不少开发者激动地觉都不睡了,先试再说。 ▲海内外开发者热议Qwen2.5 二、史上最大模型族群诞生,开源模型上架超百个 Qwen2.5开源模型数量史无前例。 阿里云CTO周靖人在云栖大会上宣布,Qwen2.5系列总计上架开源模型超过100个,充分适配各种场景的开发者和中小企业需求。 这响应了众多开发者的呼声,他们已经在各大社交媒体“催更”多时。 ▲海内外开发者催更Qwen2.5 1、语言模型:从0.5B到72B七个尺寸,从端侧到工业级场景全覆盖 Qwen2.5开源了7个尺寸语言模型,包括0.5B、1.5B、3B、7B、14B、32B、72B,均在对应赛道实现了SOTA成绩。 ▲多个尺寸Qwen2.5满足多样化场景需求 这些版本助开发者兼顾模型能力和成本,适配多种场景需求,比如,3B是适配手机等端侧设备的黄金尺寸,32B是最受开发者期待的“性价比之王”,72B是足够用于工业级、科研级场景的性能王者。 博客地址: https://qwenlm.github.io/zh/blog/qwen2.5-llm/ 2、多模态模型:视觉模型理解20分钟视频,音语言模型支持8种语言 备受期待的大规模视觉语言模型Qwen2-VL-72B,今日正式开源。 Qwen2-VL能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备调节手机和设备的视觉智能体能力,视觉理解能力超越GPT-4o水平。 ▲大规模视觉语言模型Qwen2-VL-72B开源 在全球权威测评LMSYS Chatbot Arena Leaderboard上,Qwen2-VL-72B成为得分最高的开源视觉理解模型。 ▲Qwen2-VL-72B成为得分最高的开源视觉理解模型 Qwen2-Audio大规模音频语言模型则是一款能听懂人声、音乐、自然声音的开源模型,支持语音聊天、音频信息分析,支持超8种语言和方言,在主流测评指标上全球领先。 博客地址: http://qwenlm.github.io/blog/qwen2-vl/ 3、专项模型:最先进开源数学模型亮相,赶超GPT-4o 用于编程的Qwen2.5-Coder、用于数学的Qwen2.5-Math,也于本次云栖大会宣告开源。 其中,Qwen2.5-Math是迄今为止最先进的开源数学模型系列,本次开源了1.5B、7B、72B三个尺寸和数学奖励模型Qwen2.5-Math-RM。 ▲Qwen2.5-Math开源 旗舰模型Qwen2-Math-72B-Instruct在数学相关的下游任务中,表现优于GPT-4o和Claude 3.5等专有模型。 Qwen2.5-Coder在多达5.5T tokens的编程相关数据上作了训练,当天开源1.5B和7B版本,未来还将开源32B版本。 ▲Qwen2.5-Coder开源 博客地址: https://qwenlm.github.io/zh/blog/qwen2.5-math/ https://qwenlm.github.io/zh/blog/qwen2.5-coder/ 此外值得一提的是,通义千问旗舰模型Qwen-Max也实现了全面升级,在MMLU-Pro、MATH等十多个权威基准上接近甚至赶超GPT-4o,上线通义千问官网和通义APP。用户也可通过阿里云百炼平台调用Qwen-Max的API。 ▲Qwen-Max实现全面升级 自2023年4月初代通义千问大模型发布以来,阿里云让中国企业低成本用上大模型,反过来也推动今天的Qwen2.5系列“越用越好用”。 Qwen2.5系列模型涵盖基础版本、指令跟随版本、量化版本,正是在实战场景中迭代而来。 三、通义千问Qwen下载破4000万,“产仔”超5万个 狂飙一年半,通义千问已成为仅次于Llama的世界级模型群。 周靖人公布的两组最新数据对此进行了印证: 一是模型下载量,截至2024年9月初,通义千问开源模型累计下载量已经突破4000万,这是开发者和中小企业用脚投票的结果; 二是衍生模型数量,截至9月初,通义原生模型和衍生模型总数超过5万个,仅次于Llama。 ▲通义千问开源模型累计下载量突破4000万 至此,“万模同源”已成为中国大模型产业发展的显著趋势。 什么概念?国产开源不仅在性能上稳居全球榜首,并且在生态上开疆扩土。海内外的开源社区、生态伙伴、开发者成为通义千问的“自来水”,通义千问成为很多企业采用的第一款大模型,也是用得最久的大模型。 早在2023年8月,阿里云就开源通义千问70亿参数模型至免费可商用,再到今年的Qwen1.5、Qwen2、Qwen2.5接连发布,让开发者快速用上最先进模型的同时,获得更大控制权和调优空间,从而成为更多企业的首选。 7月初,全球最大开源社区Hugging Face的工程师曾发推认证,通义是中国最卷的大模型。而通过阿里云,通义大模型已经服务了各行各业的30多万客户。在刚刚过去的2024年第二季度(对应阿里巴巴2025财年Q1),阿里云AI相关产品收入实现三位数增长。 ▲通义大模型服务超30万客户 阿里云做对了什么? 笔者认为,不同于国外大厂微软与ChatGPT强绑定、亚马逊AWS汇聚三方模型做底层基础设施,阿里云综合两者优势,一开始就选择了AI基础设施服务和自研大模型两手抓。 聚焦自研模型方面,阿里云是国内唯一坚定明确模型开源开放的云巨头,在模型突破、生态兼容、开发者服务等方面都不遗余力地做出了巨大投入,从而让通义大模型一步步走进世界AI竞争的核心圈。 结语:万模同源,行业分水岭时刻 开源模型正追平甚至赶超闭源模型。从7月Meta的Llama-405B到今天阿里云的Qwen2.5-72B,“万源同模”景观正在形成。通义千问大模型的一年半狂飙,让众多行业和企业实现更低成本AI规模化落地,行业正进入新的分水岭时刻。
这家靠滤镜火遍全球的公司,抢先 Meta 苹果推出新一代 AR 智能眼镜,8400 元租一年
即使没有用过,你也很可能对外网的热门拍照社交平台 Snapchat 有所耳闻。 这个拍摄平台以搞怪和丰富的动态滤镜闻名,算是 AR 技术的一种早期应用形式。 它的开发商 Snap 公司野心不仅仅在于做一个热门应用。2021 年,这家公司推出了首款 AR 眼镜——第四代 Spectacles,成为该领域的先锋。 而在近日举办的 2024 Snap 全球生态合作伙伴大会上,Snap 带来了第五代 Spectacles 智能眼镜,也是第二代 AR 眼镜。 这不仅是一个比上一代更好用的 AR 设备,还是一个面向未来的 AR 软件+硬件平台。 更好的 AR 眼镜 前三代的 Spectacles 眼镜主要还是一个自带摄像头、能发 Snapchat 短视频的眼镜「时尚单品」,采用了多彩的镜框和圆形的镜片,看起来就像一个度假用的墨镜。 ▲ 图源:Engadget 正式进军 AR 领域的第四代 Spectacles 眼镜一改活泼的外观,看起来相当严肃:厚厚的黑色镜框,以及棱角分明的镜片,像是一个更具份量的 3D 眼镜。 ▲ 第四代 Spectacles,图源:The Verge 全新的第五代 Spectacles 大体延续了这一设计语言,只是总体要更圆润,眼镜柄要更粗。 ▲ 第五代 Spectacles 虽然造型不如苹果 Vision Pro、Meta Quest 等头显设备那么夸张,但戴在头上,还是会因为太大而显得有点不协调。 226 克的重量也不算轻,相当于将一台国产大折叠手机挂脸上,比上一代的 134 克足足重了将近 70%。 大幅增重带来了更多的功能。上一代仅支持手势操作,这一代不仅新增了语音输入,还能在手机上安装 App 进行联动,不过依旧不支持眼动追踪,也不支持音频播放。 用户在手机上安装 Snapchat 应用后,就可以把手机当作 Spectacle 的「手柄」,可以用来当作直升机游戏的操纵台,或者高尔夫模拟器中的球杆。 除此之外,没有佩戴眼镜的用户,也可以通过手机摄像头,看看对面戴着眼镜的小伙伴在对着空气做什么了。 ▲ 图源:CNET 上一代被诟病的续航也有了增加,从 30 分钟提升到 45 分钟,虽然提升幅度高达 50%,但依旧不算是优秀的水平。 不少外网评测者还提到一个喜闻乐见的升级:第 5 代 Spectacles 发热对比上一代大大减少。The Verge 表示,即使带它到气温三十多摄氏度的洛杉矶市区,眼镜也不会像以前那样因为过热崩溃了。 作为一个用来看的设备,新一代 Spectacles 最重要的提升是显示的视野范围大幅提升,从 26.3 度提升到 46 度的对角线视野,相当于距离 3 米的距离看一块又长又窄的 100 英寸(2.54 米)屏幕。 ▲ 图源:CNET 考虑到用户已经把接近半斤重的设备夹在了脸上,这个大小其实是远远未能满足需求,跟苹果 Vision Pro 在现实世界变出 IMAX 大屏的效果比,更是相形见绌。 The Verge 尝试用 Spectacles 玩模拟高尔夫游戏,出来的效果很难称得上「未来感」。 ▲ 图源:The Verge 不过,眼镜形态的 Spectacles 的一大优势是不需要通过摄像头捕捉外界环境,也不会遮住眼睛,和现实世界以及身边人没有那么强的「断连」感,因此也很适合协作。 CNET 评测者和一名 Snap 团队的成员尝试了使用 Spectacles 进行协作,眼镜可以识别附近的另一位佩戴者,然后进行体验的共享,并且还会利用多个摄像头,把房间扫描成一个混合现实的网格。 ▲ 戴着眼镜就可以一起下棋,或者观棋 具体体验而言,即使是酒店环境这种小环境,两台眼镜之间的连接也不够实时。Snap 的目标是将连接体验拓展到更大的环境,例如户外,美术馆,或者展览会场。 面向未来的 AR 平台 和第五代 Spectacles 眼镜一起发布的,还有其搭载的全新「Snap OS」操作系统。 Snap OS 和 Vision Pro 上的 visionOS 类似,有一个在用户手上展开的主菜单界面,用户通过手势或者语音打开各种各样的应用。 ▲ Snap OS 自带的网页浏览器,图源:The Verge Snap 希望借助这个操作系统,吸引更多开发者为 Spectacles 平台开发 AR 应用,特别是能够协作、共享体验的 AR 应用。 Snapchat 应用有一个名为「Lens Studio」的创作平台,主要用于滤镜的开发。而全新的 Lens Studio 5.0 平台,则增强了 AR 开发能力。 开发者不仅可以跳过繁琐的编译环节,快速将项目推送至 Spectacles 眼镜,还能使用官方的 Spectacles 交互工具包快速构建应用体验,而不是从零开始设计软件交互。 Snap 机器学习(SnapML)平台还允许开发者直接在应用中使用自定义的机器学习模型,来识别、追踪和增强物体。 对于这些 AR、VR 或者 XR 平台来说,内容和应用是始终绕不开的坎。苹果通过和多家应用和应用提供商联手,并直接支持 iPad 的海量应用,尽可能让这个新生的平台快速成熟。 Snap 也走了类似的道路,和其他品牌合作推出了应用体验,比如乐高官方的「BRICKTACULAR」游戏,允许用户一起搭积木,未来还会有《星球大战》IP 的更多内容。 除此之外,Snap 比苹果 Vision Pro 和 Meta Quest 走得更远,愿意为大模型开发者提供比较敏感的摄像头、麦克风的权限,让他们为 Spectacles 添加多模态大模型,直接看用户所看,听用户所听。 Snap 本身也和 OpenAI 合作,Spectacles 集成了自家基于 ChatGPT 打造的「My AI」聊天机器人, 也引入了 OpenAI 的多模态 AI 模型。 CNET 测试了一下 Spectacles 的 AI 功能,尝试生成一些「3D Emoji」,发现机器人反应比较慢,也不能总是清晰理解用户的要求。 Spectacles 的提供方式类似订阅制,开发者计划需要每个月 99 美元(折合人民币约 702.16)的费用,并且需要一次订阅一年,也就是一次需要缴费 1188 美元(折合人民币约 8425.89 元),停止订阅后,需要将眼镜寄回 Snap 公司。 除了这个方案之外,Spectacles 不对外销售,普通消费者无法在市场买到这款产品。 也就是说,对于开发者来说,他们不仅需要支付高昂的费用测试 Spectacles 软件,短期内也无法收到来自用户的反馈,更不用提收入转化。 关于 Spectacles 对开发者的吸引力,Snap CEO Evan Spiegel 的看法是这样的: 我认为这与开发人员对早期台式计算机或早期智能手机真正兴奋的原因是一样的。我认为这是一群有远见的技术专家,他们对未来感到非常兴奋。 在 Snap 预想中, AR 生态构建是一个十分长久的过程,Spiegel 认为,在这个世纪的末尾,Spectacles 才会成为一项真正有意义的业务。 ▲ Snap CEO Evan Spiegel 从这个设计不够轻便简洁,显示效果还比较局限,生态依赖开发者积极性的第五代 Spectacles 来看,Snap 确实还有很长的路要走。 但或许他们要进一步加快脚步了。Meta 有望在下周推出全新智能眼镜产品,CEO 扎克伯格声称,这将是一副「无可挑剔」的 AR 眼镜。 根据彭博社 Mark Gurman 的爆料,苹果 Vision 团队正在继续试验几种不同的穿戴式 VR/AR 眼镜产品,其中一款类似 Ray-Ban Meta 的智能眼镜。 实力和资源都要更强的玩家在后面追赶,曾经的领头羊 Snap,或许需要拿出比目前更好的产品和方案。
阿里CEO吴泳铭:先进模型投入门槛将提升至几十上百亿美金
编辑 | Panken 智东西9月19日报道,今日,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在2024云栖大会上发表主题演讲。他认为,过去22个月,AI发展的速度超过任何历史时期,但我们依然还处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。 吴泳铭核心观点如下—— 1、AI发展速度已经超过任何历史时期,但依然处于AGI变革的早期。 2、下一阶段先进模型的投入门槛是几十亿、几百亿美金级别。 3、生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。 4、机器人将是下一个迎来巨变的行业。未来所有能移动的物体都会变成智能机器人。 5、未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。 6、过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。 7、人们对新技术革命,往往对短期高估,又对长期低估,但它会在你的怀疑中成长,在你在迟疑中错过大趋势。 以下是吴泳铭演讲全文: 欢迎来到2024云栖大会。在刚刚过去的夏天,阿里云全面支撑巴黎奥运会实现了历史性突破,云计算首次超越卫星,成为奥运主要转播方式。AI也首次广泛应用于奥运会。今天,云栖大会的焦点也是AI。我主要分享三点内容: 第一,过去22个月,AI发展的速度超过任何历史时期,但我们现在依然还处于AGI变革的早期阶段。 大模型技术快速迭代,技术可用性大幅提升。大模型已经具备了文本、语音、视觉的多模态能力,能够开始完成复杂指令。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。 同时,模型推理成本指数级下降,已经远远超过摩尔定律。一年来,通义千问API在阿里云百炼上的调用价格下降了97%,百万Tokens调用花费最低已经降到了5毛钱。推理成本是应用爆发的关键问题,阿里云会努力把成本继续降下去。 开源生态蓬勃发展。今年6月,通义千问开源Qwen2,迅速登顶Huggingface的全球开源模型排行榜。在Huggingface上,Qwen的原生和衍生模型接近5万个,排名全球第二。阿里云魔搭社区上有超过1万个模型、服务了超过690万开发者。 这一切才刚刚开始,要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。 AI具备创造能力、帮助人类解决复杂问题的路径清晰可见,也打开了AI在各行业场景中广泛应用的可能性。 第二,AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界。 今天很多行业内人士一直在想AI最大的应用是什么,可能一直在想手机上有什么AI时代创新的超级APP。但我们认为AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界,这才是AI最大的想象力。 我们不能只停在移动互联网的视角看未来。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。 过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。 我们认为生成式AI将逐渐渗透数字世界,并接管数字世界,物理世界的大部分事物都会具备AI能力,形成下一代的具备AI能力的全新产品,并与云端AI驱动的数字世界连接产生协同效应。 很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式AI的崛起,带来了质的飞跃,AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。 生成式AI让世界有了一个统一的语言——Token。它可以是任何文字、代码、图像、视频、声音,或者是人类千百年来的思考。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务。这将带来新的产业革命。 我们看到,汽车行业正在发生这样的变革。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。 机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。 未来,工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。 可以想见,AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。 第三,AI计算正在加速演进,成为计算体系的主导。 无论是我们看到端侧的计算,还是云端的世界,这都是一个非常明显的趋势。生成式AI对数字世界和物理世界的重构,将带来计算架构的根本性变化。过去几十年,CPU主导的计算体系,正在加速向GPU主导的AI计算体系转移。未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。 我们看到,在新增算力市场上,超过50%的新需求由AI驱动产生,AI算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。 今天我们接触到的所有客户、所有开发者、所有CTO,几乎都在用AI重构自己的产品。大量新增需求正在由GPU算力驱动,大量存量应用也在用GPU重新改写。在汽车、生物医药、工业仿真、气象预测、教育、企业软件、移动APP、游戏等行业,AI计算正在加速渗透。在各行各业,看不见的新产业革命正在悄然演进。 所有行业,都需要性能更强、规模更大、更适应AI需求的基础设施。 阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。我们的单网络集群已拓展至十万卡级别,正在从芯片、服务器、网络、存储到散热、供电、数据中心等方方面面,重新打造面向未来的AI先进基础设施。 从历史经验来看,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,让很多人在迟疑中错过。 站在AI时代浪潮的开端,我感到无比兴奋。今天,我们请到大模型、自动驾驶和机器人三个领域的企业家和科学家。他们正在飞奔着用AI重构我们的世界,期待他们的精彩分享。谢谢大家。希望大家度过一个充实、愉快的云栖。
部分iPhone机型升至iOS 18后,可通过Thread协议掌控智能家居设备
原标题:部分 iPhone 机型升至苹果 iOS 18 后,可通过 Thread 协议直接掌控智能家居设备 IT之家 9 月 19 日消息,科技媒体 AppleInsider 昨日(9 月 18 日)发布博文,报道称部分 iPhone 机型升级 iOS 18 系统之后,可以启用并通过 Thread 协议,直接控制 Apple Home 和 Matter 智能家居设备。 Thread 协议简介 Thread 是一种基于 IP 的新型智能家居连接标准,近年来其采用率逐渐上升。作为 Wi-Fi、蓝牙或 Zigbee 的替代方案,Thread 具有极低的功耗和快速的特点。 Thread 首次亮相于 HomePod mini 和几款 Nanoleaf 智能灯具中,但如今已有多种智能家居产品采用了这一技术。 IT之家曾于 9 月 6 日报道,Thread Group 正式发布了 Thread 智能家居无线网络协议的 1.4 版规范,对终端设备和 Thread 边界路由器添加入现有网络的过程实现了标准化。 Thread 1.4 更新主要体现在以下几个方面: 更加简单的单一 Mesh 网络:无论品牌、智能家居平台或移动操作系统,添加新 Thread 终端设备或边界路由器时会自动加入现有网络而不是创建新网络,可提升 Mesh 网络范围和可靠性; 云连接:支持 Thread 1.4 的边界路由器将获得一条明确的标准互联网路径,可为设备带来系列动态功能,如接收软件更新、根据天气变化自行调节百叶窗开闭; 更高的可靠性、稳定性,更大的覆盖范围,更低的复杂性:新增的 Thread over Infrastructure 功能允许边界路由器使用 Wi-Fi 和以太网连接来扩展 Thread Mesh 网络; 更轻松的测试和故障排除:借助 Thread 设备提供网络配置和状态数据的新标准化方法,产品开发人员和安装人员可以更深入地了解 Thread 网络,提供了高级故障排除功能; 适用于难以到达位置的安全无线调试:Thread 的批量调试功能简化了在难以到达的位置预装设备的无线调试过程。安装者可通过带有证书的 TLS 实现 Thread 调试,无需扫描物理安装代码。 适用机型 IT之家附上适用的 iPhone 机型如下 iPhone 15 Pro iPhone 15 Pro Max iPhone 16 iPhone 16 Plus iPhone 16 Pro iPhone 16 Pro Max 上述设备升级到 iOS 18 系统之后,能够直接连接到 Thread 设备,加快 Thread 配件的响应时间,并使其对消费者更加友好。 最新的 Mac 电脑和 iPad 在内,其它苹果产品也配备了 Thread 无线电。但截至目前,苹果尚未在这些设备上启用 Thread 无线电功能,也未将其列入兼容性列表中。
苹果iOS 18被曝新BUG:导致双方Messages应用循环崩溃
原标题:苹果 iOS 18 被曝新 BUG:导致双方 Messages 应用循环崩溃,现有修复方案会丢失数据 IT之家 9 月 19 日消息,科技媒体 9to5Mac 昨日(9 月 18 日)发布博文,报道称苹果 iOS 18 系统中的 Messages 应用存在 BUG,会导致应用崩溃,而现阶段的修复方式将导致数据丢失。 如何避免 iOS 18 上的 Message 崩溃 BUG 读者 Alex 率先发现了该漏洞,该媒体随后成功复现了该漏洞。 复现操作步骤比较简单,在他人从 Apple Watch 向你分享表盘之后,请勿在会话模式(threaded)下回复消息。 BUG 情况 Apple Watch 包含一项功能,支持用户直接通过 watchOS 在“信息”(Messages)或“邮件”(Mail)中轻松分享表盘,此功能旨在分享个性化表盘配置。 用户如果直接在会话界面中回复信息,就会触发该 BUG,会导致 Message 应用反复崩溃。 IT之家援引媒体报道,该 BUG 会影响双方用户。iOS 18 用户分享表盘会触发该 BUG,此外 iOS 18.1 发送分享表盘并不会触发该 BUG。 另外在接收方,包括 iOS 18.1 测试版、iPadOS 18.1 测试版及 macOS 15.1 测试版在内,用户在会话模式下回复分享的表盘,Messages 应用均会崩溃。 修复需清除聊天记录 iOS 18 用户一旦遇到这个问题,双方均无法在 Messages 应用中打开对话,目前的解决方案就是删除对话记录。但由于 Messages 应用处于循环崩溃状态,这个操作过程也比较困难。 此解决方案导致所有对话历史记录被删除,包括未在“信息”应用外保存的照片和视频等附件。 从 Messages 应用中的“最近删除”位置恢复已删除的对话线程会重新引入崩溃错误。苹果可能需要在 iOS 18、macOS 15、watchOS 11 及未来苹果预发布软件的测试版更新中修复此错误。
奥迪比利时工厂预计2025年停产,消息称蔚来汽车有意收购
IT之家 9 月 19 日消息,据比利时当地媒体 De Tijd 当地时间 18 日报道,奥迪正在积极寻找位于比利时布鲁塞尔福斯特(Vorst)地区工厂的买家。由于大众决定在明年生产完最后一批电动 SUV Q8 e-tron 后不再在福斯特生产汽车,故工厂关闭的可能性与日俱增。如果工厂关闭,2910 名员工将面临失业。 报道称,在过去数周之内,蔚来汽车的一支代表团访问了这家工厂。目前,蔚来正在准备一份竞标书,且必须在下周一之前提交至大众集团。 蔚来承诺建立一个广泛的换电网络,用户可以在几分钟内将耗尽的电池换成满电的电池。蔚来希望通过将电动汽车与电池订阅服务捆绑销售的方式,降低汽车的购买价格。 蔚来对奥迪工厂的兴趣“尤为引人注目”,因为两家品牌今年年初曾在德国法院对簿公堂。奥迪起诉蔚来,称其车型名称 ES6 和 ES7 与奥迪 A6 和 A7 运动版 S6 和 S7 过于相似。最终奥迪胜诉,蔚来不得不在欧洲为其车型寻找新的命名方式。自那以后,蔚来当地车型的名称以“EL”和“ET”(IT之家注:分别对应 SUV 及轿车)开头。 与此同时,奥迪布鲁塞尔工厂的潜在关闭引发了政界的关注。在比利时议会社会事务委员会访问工厂时,议员 Vincent Van Quickenborne 和其他成员呼吁在议会举行工厂管理层的听证会。 工会对蔚来的兴趣持谨慎乐观态度。ACV-Metea 工会的首席代表 Ronny Liedts 表示:“蔚来是中国的汽车制造商并不是问题,关键是能够最大限度地保住尽可能多的工作岗位。” 尽管工人对工厂未来的不确定性持续存在,奥迪布鲁塞尔工厂在停产两个月后,于上周二恢复了两班生产。今年 7 月初,奥迪宣布将对其布鲁塞尔工厂进行重大重组,然而该举措存在导致工厂关闭的风险。也正是自那以后,员工们几乎认为工厂关闭已成定局。
全球eVTOL第一股,把航空器卖到乡镇去了
作者 | 许丽思 编辑 | 漠影 2009年,美国国家航空航天局NASA发布了一个关于Puffin eVTOL的CG动画视频,eVTOL的概念开始真正出现。 eVTOL,就是依靠电力驱动、能够垂直起降的新型飞行器。相较于传统的直升机,eVTOL安静无音、维护成本低、安全性高。 在视频里,飞行器能够在城市中狭小的空间内起飞和着陆,在城市的高楼大厦之间飞行,与城市的建筑、桥梁等基础设施相互交织,人们可以这种飞行器轻松跨越拥堵区域,完成日常的通勤。 “低空经济”听起来很高大上,“打飞的”出行看起来遥不可及,但对亿航智能来说,他们想要做的,就是把“打飞的”变成公众的日常,让eVTOL能够融入到人们的日常通勤、物流运输、应急救援等各种场景中。 总而言之,他们想让eVTOL这种东西,在未来变得像自来水一样普遍,实现普惠。 2013年,亿航智能创始人胡华智萌生了造出安全、有别于过去传统飞行方式的航空器的想法。于是,他来到了广州,创办了亿航智能设备(广州)有限公司。 2016年,胡华智带着全球第一款无人驾驶载人航空器——EH184在美国拉斯维加斯消费电子展上亮相,震惊世界,引得美国《时代》、《VOGUE》、《大众机械》等杂志争相报道。 2019年,亿航智能在美国纳斯达克上市,成为“全球自动驾驶载人飞行器第一股”。但同时,亿航也面临着要“搞技术”还是“搞适航取证”的发展路线抉择。 最终,亿航智能选择了后者。EH184的升级版—— EH216-S,也陆续取得了全球首张载人无人驾驶航空器型号合格证、全球首张载人无人驾驶航空器标准适航证、全球首张无人驾驶载人航空器生产许可证,成为全球首个获得适航 “三大通行证” 的载人无人驾驶电动垂直起降航空器。 今年8月底,亿航发布了二季度财报,二季度营收1.02亿元,同比增长919%,创历史新高。而这一增长,就与EH216-S获获得“三大通行证”、顺利进入规模化量产紧密相关。 最近,科创南方来到广州黄埔区的联动U谷亿航智能科技园,在这里找到了亿航智能副总裁贺天星。在他的讲述里,我们深入了解这家“全球自动驾驶载人飞行器第一股”十余年来的发展故事,以及让低空飞行融入公众日常生活的孜孜不倦追求。 一、创造安全的低空间飞行方式 2013年,胡华智开始计划筹备创办一家制造飞机的公司,想着坐着自己造的飞机去实现飞行的梦想。 在这之前,他有过一段做大型计算机指挥控制系统的创业经历,还相继承接过2008年北京奥运会、2010年上海世博会、2010年广州亚运会的指挥调度系统项目。 就读于清华大学计算机专业的他,从十几岁的时候就开始接触航模,考过通航飞机的相关驾照,还和朋友在北京成立一家航空航天模型博物馆。 然而,身边的飞行挚友和金牌教练员都在某次飞行时意外发生事故,给了胡华智很大的触动。要造出一个真正安全、既环保又能无人驾驶,且有别于过去传统通航的载人航空器,这样的念头在他的心头萌生。 贺天星介绍,在亿航的早期创业团队里,做信息化管理和开发的人占了大多数,这背后的原因,便与公司创始人胡华智坚持从做飞机先做“安全”的出发点有关。 “保障无人驾驶载人航空器安全飞行的关键,是要实现精准、有序的飞行保障。”这就需要搭建一套安全的飞行管理系统。胡华智发挥自己的计算机专业所长,在行业内率先打造了一整套数字化系统,完成航空器的安全管理、指挥调度、监测预警等工作。 胡华智希望打造的无人驾驶载人航空器,不仅要实现安全飞行,还能在城市内实现规模化应用,解决城市内地面已趋于饱和的交通难题,拓展低空出行,推动城市构型的发展变革。 2014年,亿航智能在广州成立。贺天星介绍,成立之初,亿航智能就确定了三个核心发展方向: 一是新型智能绿色低空飞行,围绕低空空域以载人交通以及物流运输为核心场景,打造一个全新的城市空中交通模式。 二是围绕智能化、数字化、网联化,以我们的无人驾驶航空器为核心,加上集群化的调度系统,建立一个全新的地空一体化的城市立体交通体系。 三是想要创造一种社会经济新业态。当时像低空经济这种比较系统性的提法还是较少,但是我们觉得这样的全新的交通方式,必将带来新的经济增量,推动社会的变革发展,塑造新的人居环境。 成立之初,除过做无人驾驶载人航空器,亿航也在消费级无人机开拓了一定市场。 2014年5月,亿航推出了Ghost无人机。采用手机操控,让非专业人士也能做到上手即飞,当时在海外众筹中便获得86万美元佳绩。 除了售卖,消费级无人机的核心职责,其实是是在帮助“验证”未来低空大交通的集群化发展。 “当时做消费级无人机,我们想要用它来验证数字化管理是可以介入到这种规模化、集群化的飞行器当中的,验证我们的指挥调度平台是能够管理大规模的无人机、甚至载人航空器的安全有序飞行。”贺天星表示。 二、啃难啃的硬骨头,创造全球先例 在亿航的展厅里,机器人前沿看到了2016年《大众机械》杂志刊登了EH184的杂志封面。 2016年1月,胡华智带着全球第一款无人驾驶载人电动垂直起降航空器——EH184在美国拉斯维加斯消费电子展上亮相。当时可以说是震惊了世界,美国《时代》、《VOGUE》、《大众机械》等知名杂志都用大量篇幅介绍了EH184。 EH184,“1”表示可坐1个人,“8”表示有8个螺旋桨,“4”表示有4个机臂。这架航空器的体型很小,可以在很多地方完成起飞和降落。 自此,以eVTOL为代表的城市空中交通领域的研究与应用场景创新和畅想,开始成为风靡全球的话题和投资界热衷的蓝海。 时间来到2018年,亿航在EH184的基础上,升级推出EH216-S(“2”即可坐2个人,“16”即有16个旋翼)。公司也在2019年登陆美国纳斯达克、成为全球城市空中交通第一股,随后亿航开始其创造奇迹的三年适航之路。 “无人驾驶载人飞行器的适航取证在全球范围内都没有先例,也没有完全可以借鉴的标准,连民航局都觉得这件事情非常有挑战。”贺天星说,“但是我们最终把这个难啃的硬骨头啃下来了。” 2023 年 10 月,EH216-S 获得了中国民航局颁发的全球首张载人无人驾驶航空器型号合格证,标志着 EH216-S 具备了开启载人运营的安全资质。 同年12月,亿航再次获颁全球首张载人无人驾驶航空器标准适航证。2024 年 4 月 ,亿航获得全球首张无人驾驶载人航空器生产许可证。这意味着, EH216-S 成为全球首个获得 “三大通行证” 的载人无人驾驶电动垂直起降航空器。 为什么一定要做无人驾驶的航空器呢? “航空领域大部分事故背后都是人为原因造成的,所以要先尽量剔除人为因素的干扰,在低空这样相对纯净的环境里,‘无人’比‘有人’会更安全、更高效、更便于管理。每架航空器自动按照固定的航线飞行,避免人为失误操作带来的影响,很大程度能降低事故的发生概率。 此外,低空经济未来的发展量级可能是几十万台、甚至上百万台。当上百万台航空器在天空飞行,还要给它们配备上百万个飞行员,这其中的不确定性实在是太大了,无人化才是最好的管理模式。”贺天星解释。 三、全球首款获得三大通行证的载人eVTOL,核心其实在C端 “它就是新质生产力的典型代表,是低空经济实现规模化价值的关键所在。”提到eVTOL相较于过去的航空器的特点,贺天星总结道。 一方面,eVTOL采用的是多个电动发动机分布式布局,也运用了较为先进的飞行控制系统和传感器技术,具备比以往航空器更高的安全性。 另一方面,垂直起降、小体型的特点,也使得eVTOL的起降地点更为灵活,可以更高效、快速地为人们提供空中交通服务,并且eVTOL的噪音更小、对环境造成污染也更少。 更重要的是,eVTOL是电动航空,能够有效地开展智能化、数字化、网联化的管理,以此来实现规模化的运行飞行,带动航空业的智能普惠发展。 据了解,为了保障安全性,EH216-S的设计融合了IT领域的“全备份”理念,所有关键飞行部件都采用全备份设计,包括飞控系统、各类传感器、动力系统、电池等。 同时,通过高速网络连接,EH216-S可以与地面指挥调度系统实时联动,系统可以远程与EH216-S进行实时数据传输与交互,科学的规划与管理航空器,实现集群管理、智慧调度,未来可以更有效的接入到智慧城市和立体交通的管理网络。 目前,EH216-S是全球首款也是唯一一款获得型号合格证、标准适航证、生产许可证这三大“通行证”的载人eVTOL。 值得注意的是,在今年8月底,亿航发布了2024年二季度财报,二季度营收1.02亿元,同比增长919.6%,创历史新高。而这一增长,就与EH216-S完成适航三证的获取,顺利进入规模化量产紧密相关。 前阵子,亿航就向太原西山生态文旅投资建设有限公司交付的首批了 10 架 EH216-S无人驾驶载人航空器,并在山西太原完成载人首飞。西山文旅目前一共向亿航订购了50架EH216-S,计划将在未来2年内额外采购450架EH216-S,用于旅游观光、载人交通等低空场景。 “我们的购买方大部分是B端、G端,但核心都是服务于C端,真正要做的是为消费者提供服务。未来会有很多新型城市航空运营公司出现,为公众提供低空出行服务,推动低空飞行像汽车出行一样的常态化交通形式。”贺天星说道。 除了载人的EH216-S,亿航还推出了用于高层消防救援的EH216-F、用于物流配送的EH216-L及城际长航距无人驾驶载人航空器VT30。 ▲用于消防救援的EH216-F与用于物流运输的EH216-L(机器人前沿摄) 四、从科普、普及到普惠,加快eVTOL商业化运营 eVTOL的出现,预示着空中通勤、紧急救援、货物运输乃至个人出行方式的全面革新,将极大地提升城市交通的效率,是全球争相布局、积极抢占发展制高点的重要领域。 对亿航来说,加快推动eVTOL商业化运营的步伐也在不断提速。 在今年7月,亿航旗下专门从事UAM运营服务的全资子公司亿航通航及其在合肥的合资运营公司合翼航空,分别向中国民航局递交了民用无人驾驶载人航空器运营合格证(OC),并已获得受理,文件审查已经完成,正在开展现场审查工作。 这是全球首个获得受理并开始正式审查的无人驾驶载人电动垂直起降航空器OC审定项目,也意味着全球首个载人eVTOL运营标准体系即将诞生。 贺天星透露,OC有望在今年年底取得。拥有了OC,意味着运营主体公司可以在规定的范围内开展民用无人驾驶载人航空器的载人商业化运营活动。 “全球首个无人驾驶载人航空器OC审定项目的正式受理和开展审查,对eVTOL行业具有开创性的意义。这也是城市空中交通正式迈入大众消费阶段的最后一关。我们期待全球首个无人驾驶载人eVTOL商业运营标准体系和OC的颁发,让低空经济普惠大众。”胡华智曾在媒体报道中表示。 贺天星介绍说,亿航的发展规划可以分为三个阶段,分别是科普阶段、普及阶段和普惠阶段。 在科普阶段,亿航在全球进行了大量的飞行,并在城市固定航线交通、城市观光、空中游览等场景中,向公众开放飞行体验名额,让公众认识、了解无人驾驶航空产品,安心、舒心、放心地乘坐。 “等拿到OC证之后,我们就要进入到普及阶段。现在亿航已经在全国筹建了几十个运营点,随着后续每一个运营点OC的颁发,我们会开通大量低空飞行航线,商业化的运营就会在全国各地陆续开始启动。”贺天星说。 而在普惠阶段,随着亿航大量运营点的建设完成和各个城市区域配套基础设施的完善,低空域数字化飞行管理平台的应用,一个全新的、立体化的城市空中交通运输网络将会形成。这个时候,公众可以像打出租车一样便利地“打飞的”,轻松地在城际之间或城市内实现日常通勤,这一阶段也将会是低空经济迈向万亿市值规模的时期。 据了解,除了亿航通航和合翼航空之外,亿航在广州、深圳、珠海、太原、无锡、文成等城市的合作伙伴也在同步筹备,积极推进OC审定申请,加快推动EH216-S在当地低空经济商业运营示范样板建设。 贺天星还提到,亿航一直在大力推动与相关领域的合作,从生产制造、场景应用到商业运营等环节,不断将低空经济的触角和服务延伸至更多领域。 之前,亿航与广汽集团孵化的巨湾技研达成合作,共同研发全球首款eVTOL航空器超快/极快充电池,双方还将超充桩、超充站等基础设施建设方面开展合作。 亿航还和南航通航在飞行运营、综合保障等方面开展合作,计划在珠海九洲机场、长隆海洋世界等景区,建立EH216-S低空游览运行示范点。 在今年7月的广东省低空经济高质量发展大会上,亿航与广汽集团签署战略合作协议,探讨成立合资公司,共同实现无人驾驶载人航空器产品生产及推广应用。 五、让低空经济变得像“自来水”一样 今年,毫无疑问可以说是“低空经济元年”。但对亿航来说,则是“低空经济商业化”的元年。 “低空经济”在今年3月的全国两会上首次被写入政府工作报告,紧接着国家多部委联合发布《通用航空装备创新应用实施方案(2024‑2030年)》,明确提出到2030年,低空经济将达万亿级市场规模。 各地也积极竞逐这一万亿赛道,有约30个省市将低空经济写入了当地政府工作报告,前有广东和北京率先发布了各自的《低空经济高质量发展行动方案》,后有上海出台《上海市低空经济产业高质量发展行动方案(2024-2027年)》,深圳更是把自己定位为“低空经济之城”,从市到区马不停蹄出台了一系列政策指导。 一个全新的经济增长极呼之欲出了。其中,eVTOL更是核心赛道,也是低空经济领域成熟和扩展的标志。2023年,中国eVTOL产业规模达到9.8亿元人民币,同比增长77.3%。 “在推动社会经济的发展过程中,载人交通和物流运输是两个巨大的增长引擎,而这也是低空经济特别是eVTOL发展和应用的核心方向。就像俗话说的‘要致富,先修路’,eVTOL不仅是这个‘路’,而且也是这个产业体量化发展的开路先锋。”贺天星说。 在他的设想里,等到低空经济常态化之后,人们像地面打出租车一样去乘坐eVTOL,而eVTOL会逐渐比肩甚至超过传统的航空工业。而中国所蕴含的巨大市场潜力和消费场景,让贺天星觉得,中国会成为eVTOL产业里全球最大的市场。 “eVTOL 可以有效解决国内交通拥堵问题,满足人们对于高效出行的需求,在低空旅游、日常通勤等领域具有广阔的应用前景,它还能在物流运输、应急救援、航空医疗、电力巡检、警务航空等多个领域发挥作用,这些多元化的应用场景都为eVTOL的发展提供了广阔空间。”贺天星说。 低空经济离人们的生活越来越近了。 贺天星提起来,前阵子亿航向浙江温州文成县交付了几十架EH216-S的航空器,开展低空游览和城市空中交通。 “县域低空经济的发展,决定了未来低空经济的市场规模和普惠程度。低空经济也将会不断下沉,向更多的区域渗透,辐射到社会的各层面。它会变得像自来水一样,彻底融入到我们的日常生活里,飞入到寻常百姓家。”他说。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。