行业分类:
加载中...
头条分类:
加载中...
苹果App Store大震荡:高管离职,团队被一分为二
编译 | 陈骏达 编辑 | Panken 智东西8月22日消息,根据知名苹果爆料记者马克·古尔曼(Mark Gurman)今日报道,苹果将对其App Store业务做出重大调整。先前管理App Store业务长达14年的苹果副总裁马特·费舍尔(Matt Fischer)将于今年10月离职,而App Store团队将被拆分成2个部门。 拆分后的2个部门将分别负责苹果自有的应用商店和第三方应用程序分发渠道的管理。2位新的负责人都是原有App Store团队中的资深高管。 App Store是苹果利润最为丰厚的业务之一,每年能为苹果带来200亿美元的利润,其所属的软件服务业务毛利率一直稳定在70%左右,是苹果硬件毛利的近2倍。硬件销售增长陷入停滞的背景下,这块业务对苹果来说尤为重要。 苹果调整App Store业务可能是由于日益增长的监管压力。今年3月,苹果因App Store在欧盟的垄断行为收到18.4亿欧元的天价罚单,还不得不多次修改App Store的相关规定,放松对第三方应用商城、支付手段的限制。 一、21年老兵离职,App Store业务重组 费舍尔2003年便加入苹果,当时主要参与iTunes业务。2010年起,他开始担任苹果副总裁,负责全球的App Store业务。 本次业务调整的决定是由最终负责App Store业务的Apple Fellow菲尔·席勒(Phil Schiller)做出的。席勒1987年便加入苹果,曾担任苹果首席营销官,2020年升任Apple Fellow后负责App Store和Apple Events业务,直接向苹果CEO库克汇报。 调整后,管理App Store业务14年的费舍尔将于今年10月离开苹果公司。App Store团队会被拆分成2个团队,一个团队负责监管苹果自己的应用商店,另一个团队负责第三方应用程序分发渠道的管理。 费舍尔在周三的一封邮件中向团队正式宣布了这一消息,他写道:“在苹果工作了21年后,我决定离开这家杰出的公司,这件事我已经考虑了一段时间,而且我们也在重组团队,以更好地应对新的挑战和机遇,现在是将接力棒交给团队中两位杰出领导者的最佳时机。” ▲费舍尔的离职信(图源:领英) 长期担任高级总监的卡尔森·奥利弗(Carson Oliver)将负责App Store团队的运营,而负责搜索和发现等App Store功能的总监安妮·泰(Ann Thai)将领导负责第三方应用程序分发渠道的新团队。二人都将向席勒汇报。 ▲左为卡尔森·奥利弗,右为安妮·泰(图源:领英) 苹果公司的发言人拒绝对此事发表评论。 二、监管压力增加,苹果被迫调整 App Store是苹果利润最为丰厚的业务板块之一。仅在2022年,App Store生态系统中的销售额和支付金额就超过了1万亿美元。 苹果称其中90%左右是免佣金的,他们将从剩下的支付和销售金额中抽取15%(开发者年收入少于100万美元)或30%(开发者年收入高于100万美元)的两档佣金。古尔曼称,作为苹果软件服务部门的一部分,App Store业务每年大约能产生约200亿美元的收入。 苹果财报显示,软件服务部门的毛利率一直维持在70%左右,是苹果毛利率最高的业务,而App Store是其中最重要的板块。近年来,由于包括iPhone在内的主要硬件产品的增长陷入停滞,服务对苹果来说变得尤为重要。 过去几年,苹果的这块业务一直面临着来自开发商和监管机构的挑战,本次调整或许是为了进一步回应相关问题。音乐软件Spotify、游戏开发公司Epic Games都曾因“苹果税”与苹果对铺公堂。 2024年初,苹果在欧盟的监管压力下大幅调整了其在欧盟国家的佣金比例,收取10%-17%不等的费用。他们还开始允许用户从第三方应用商店及开发者网站直接下载应用。 ▲Spotify曾起诉苹果的反竞争行为 2024年3月,苹果因App Store垄断行为收到欧盟开出的18.4亿欧天价罚单。然而,欧盟还是对苹果做出的调整不满,他们发现苹果会用限制第三方支付渠道的方式来变相抽取佣金,抽取比例从12%-27%不等。 今年8月,苹果不得不再次修改在欧盟地区的App Store规则,进一步放松了对第三方支付的限制。 结语:App Store面临全球挑战,或将迎来更多变数 苹果的App Store业务正在面临前所未有的挑战。今年5月,费舍尔以证人身份出席了与Epic Games的诉讼。今年8月,苹果又传出正在与腾讯谈判第三方支付事宜。Meta创始人兼CEO扎克伯格近期也多次公开吐槽以App Store为代表的苹果生态。 费舍尔在App Store问世后不久便开始管理这块业务,并将其发展成苹果最为核心的业务之一。目前,软件服务是硬件之外苹果的又一压舱石。费舍尔的离开或许是苹果对App Store进一步调整的前兆。
周鸿祎针对儿童手表错误问答致歉:已启动整改迭代
近期有网友称360儿童手表问答内容有误。对此360创始人周鸿祎发布视频致歉,称部分旧版本软件通过抓取互联网公开信息回答问题,引发错误问答,目前已启动整改和迭代,将通过大模型驱动问答功能解决上述问题。周鸿祎在视频中亲测了价值观问答,他表示,将有奖征集用户反馈,不断改进产品,不负用户信任。 视频中,周鸿祎表示,对给用户带来的不适非常抱歉。经快速检查,出现问题的手表是 2022 年 5 月份的旧版本,尚未搭载360大模型,通过互联网公开渠道从网站抓取信息回答问题。这次抓取的互联网信息有严重问题,引发了错误答案,目前已快速完成整改,用户反馈中引用的相关网站有害信息已全部删除。同时,旧版本儿童手表将由大模型驱动问答功能,在1-2周内陆续完成软件升级和网站服务升级。 周鸿祎表示,目前世界范围内,生成式人工智能都面临幻觉这一公认难题。360正在尝试通过与搜索结果做对比等方式来减少幻觉,做知识对齐。他在视频中演示了搭载大模型的360儿童手表问答能力, 并表示“目前来看没有问题,用户可以放心使用。” 当问到 “中国人是世界上最聪明的人吗?”360儿童手表AI版回答:人类的智慧和聪明才智是多样化的,各个国家和民族都有杰出的人才和伟大的成就。我们应该尊重和学习各国人民的智慧和贡献,共同推动人类社会的进步和发展。被问到“美国的月亮园还是中国的月亮园?”儿童手表回答:无论美国的月亮还是中国的月亮都是同一个天体。因此无论在哪个国家,看到的月亮都是同样圆的。而对于“孙颖莎和陈梦谁的球技更高,谁更厉害?”的问题,回答为:乒乓球比赛的结果受到多种因素的影响。我们可以欣赏他们的精彩表现,而不是简单的评判谁更厉害。 周鸿祎表示,“360儿童手表的成长离不开用户的宽容、理解和支持,我们也将不辜负大家的信任,不断地完善产品。”他在视频中公开向网友征集“错误问答案例”,邀请用户反馈产品体验,“我们将联系每一个给我们反映问题的用户,并且一经验证,将送出360产品大礼包。”
京东、淘宝、拼多多、抖音、快手共同签署《网络交易合规经营自律公约》
快科技8月22日消息,据北京市市场监督管理局官方公众号介绍,今日,在京浙沪三地市场监管部门指导下,包括京东、淘宝、拼多多、抖音、快手等在内的五大平台企业在京联合签署《网络交易合规经营自律公约》。 倡议加强网络直播和短视频营销活动管理、严禁不正当竞争行为、依法保护消费者个人信息等。 合约从落实平台责任、消费者权益保护、严禁不正当竞争行为、规范价格行为、政企协同共治五个方面发出倡议。 例如: 在落实平台责任方面:《公约》强调平台经营者要建立健全信用评价机制、产品质量抽查机制、广告发布管理机制,加强网络直播和短视频营销活动管理、短视频内容管理,以及对平台内竞争行为的规范管理。 在消费者权益保护方面:《公约》强调平台经营者要恪守社会公德、诚信经营,依法保护消费者个人信息,畅通消费者投诉渠道。 在严禁不正当竞争行为方面:《公约》强调各平台经营者应坚持在法律框架内进行良性竞争,不得利用自身优势地位,扰乱市场公平竞争秩序。同时也要制定合理规则,防范利用规则牟利的恶意行为,以及滥用规则对平台内经营者带来不合理损失的行为。 在规范价格行为方面:《公约》强调明码标价的规定要求,并从不得利用虚假的或者使人误解的价格手段等多方面对价格行为进行规范。 在深化政企协同方面:《公约》倡议各平台企业与政府部门加强合作协同,及时响应重大舆情、突发事件等紧急情况。 官方表示,《公约》即日起实施,各成员单位将加强信息共享和行业自治,共同维护行业整体利益,营造良好网络市场环境。
看到关于大厂“工时&摸鱼”的爆料,我沉默了 上班“拉Shi”引某大厂Leader不满
看到脉脉上关于“大厂工时”的话题,点开之后,我沉默了。爆料出来的大厂工作时长很多都在10小时以上,也就个别大厂和外企还好点。 除了上面网友的爆料,从下图的统计数据中可以看出,尽管互联网大厂提供了相对较高的薪酬和优渥的福利,但大厂员工的工作强度和加班文化依然是一个不容忽视的问题。 之前就听说过有些大厂搞什么工时排名,生生的把知识输出型行业搞成了劳动密集型企业。用“卷工时”来衡量员工的工作是否饱和,往往会导致一种过度竞争的工作状态,员工为了显示自己的工作投入和产出,经常加班加点,甚至在没有实际工作需要的情况下也选择自愿留在办公室,通过向领导展示自己的工作态度和努力程度获取较好的绩效打分。这也就是我们常说的“表演性”加班。 如此风气下,员工太过走心的卷工时,最终身体会比大脑优先给到反馈的。因此很多大厂员工为了个人的身心健康考虑,是懂得在工作中见缝插针的适当“摸鱼”,策略性让大脑休息一会儿。 如今的职场高压工作环境下,员工的“摸鱼”行为也算是一种十分普遍存在的现象。为此,各家公司老板和员工没少在思想、方法上斗智斗勇。 某大厂Leader发文抱怨下属每天2-3点固定时间跑去厕所拉Shi摸鱼,引起她的不满,询问怎样处理?当然得到回答是很多网友对这位主管的口伐笔诛。 职场中,摸鱼最常见的话题是“带薪拉Shi”,毕竟是人都会有三急。据说,社畜上班最爱摸鱼的地方是——厕所。每天坚持待上10分钟,相当于每年会多出5.5天的带薪假期。其实是不是内急并不重要,但不影响我坐十分钟。因此,为了防止员工长时间占用厕所,某些公司老板煞费苦心改造厕所。 为了防止员工“带薪拉Shi”摸鱼,直接安装铁门,进去后手机信号无。看手机,没门! 洗手间每个格子安装计时的小灯,如果超过设定时间(5分钟),会发出红色警示闪光,然后“滴滴......”响个不停。这样人在里面就会有心理压力,想要赶快出去。 还有采取了最原始的方法,坐便上面罩上铁架子改造成蹲便。让你不能坐着,只能蹲着,时间长了腿麻不?麻! 员工“带薪拉Shi”被解雇。某公司员工每天“带薪拉Shi”3至6个小时被公司解雇,最后闹到法庭。法院经过一审、二审,高院,最后认定为公司合法辞退。只不过,这位网友行为有点过了,每天上厕所3至6小时。 对于员工来说,适当摸鱼决不能影响到正常工作。对公司老板来说,忍受你摸鱼的前提是把本职工作按时按量完成。如果事都做不好,搞不定,那就先不要“摸”了吧,这样会让自己的饭碗不保。 在实际工作中,大多数管理者对于员工偶尔的摸鱼行为是能发现的,只要这种行为只要不影响到工作的产出和效率,很多领导会选择睁一只眼闭一只眼。毕竟,长时间持续的工作会使人感到疲惫,适当的休息和放松反而有助于工作效率的提升。但是必须适度,不能影响到工作的整体进度和团队的协作。高效率完成工作,负责任推进事情进度,不仅关乎个人工作能力,更关乎职业道德和人品。 如今在职场中,人们在寻找工作机会时,往往会首先查看公司的风评,风评包括公司文化、工作环境、员工满意度和公司声誉等重要信息,为自己决定是否最终入职提供一个重要参考,最起码能给自己入职后面临的环境提前做足心理准备。然而对于大厂来说,体系庞大,构成复杂,同一家公司不同部门、岗位之间存在着巨大差异。比如下图根据脉友分享统计出的数据可以看到,在宇宙厂风控部门最“躺”,平均9.6小时,而大模型则是最“卷”,平均12.6小时。虽然是同一家公司,但两个部门却相差有3个小时。 因此,这些统计数据和网友亲身经历分享对于我们入职到一家新公司会有很大的参考和帮助。就像我在脉脉上搜索“摸鱼”,输入自己的工作上下班时间后,我司的排名在前列,摸鱼难度:畏畏缩缩。也难怪HR经常抱怨招不到人,原因之一就是某些面试人员对公司加班文化不认可。 你的公司是否在榜单呢?平均工作时间多少呢?摸鱼难度如何?可以去脉脉搜“摸鱼”查看,汇总上百家公司呢。也欢迎在评论区留言......。 *本文作者:佚名。编辑:思齐。部分截图来源于脉脉。文章内容或图片如果存有侵权,请留言联系我们,我们会第一时间进行处理。
网易2024年第二季度营收255亿元同比增长6.1%,在线游戏服务净收入201亿元
IT之家 8 月 22 日消息,网易刚刚发布了截至 6 月 30 日的 2024 年第二季度业绩报告,IT之家汇总亮点如下: 营收 255 亿元,上年同期 240 亿元,同比增长 6.1%。 毛利润 160 亿元,同比增加 11.6%。 营业费用合计 90 亿元,同比增加 8.9%。 归属于公司股东的净利润为 68 亿元,而上一季度和上年同期分别为 76 亿元和 82 亿元。 不按美国通用会计准则,归属于网易公司股东的净利润为 78 亿元,而上一季度和上年同期分别为 85 亿元和 90 亿元。 游戏及相关增值服务净收入 201 亿元,同比增加 6.7%。来自于在线游戏的净收入约占该分部净收入的 96.1%;来自于手游的净收入约占在线游戏净收入的 76.4%。 网易有道净收入 13 亿元,同比增加 9.5% 网易云音乐净收入 20 亿元,同比增加 4.7% 创新及其他业务净收入 21 亿元,同比持平。 营业费用合计 90 亿元,上一季度和去年同期分别为人民币 94 亿元和人民币 83 亿元。 网易表示,游戏及相关增值服务毛利润环比下降主要由于若干手游净收入下降。其同比增长主要由于手游净收入的增加,如《第五人格》和 2023 年上线的《逆水寒》手游。 有道毛利润环比下降主要由于其学习服务的净收入下降。其同比增长主要得益于其在线营销服务的净收入增加。云音乐毛利润环比下降主要由于上一季度一次性调整了某些版权费用。其同比增长主要由于会员订阅收入的增加和成本管控的持续改善。 创新及其他业务毛利润环比和同比增长主要得益于该分部中严选和其他一些业务毛利润的增长。
商务部:2024年1-7月中国网上零售额8.38万亿元,同比增长9.5%
IT之家 8 月 22 日消息,据商务部官网消息,商务部电子商务司负责人今日介绍 2024 年 1-7 月我国电子商务发展情况。 1-7 月,网络零售促进消费平稳增长,平台企业加快技术和商业模式创新,电子商务推动产业数字化转型升级,电商领域国际合作实现互利共赢。 网络消费新动能不断集聚。1-7 月,据国家统计局数据,全国网上零售额 8.38 万亿元,增长 9.5%。其中,实物商品网上零售额 7.01 万亿元,增长 8.7%,占社零总额 25.6%。数字消费、服务消费和以旧换新政策举措打造网络消费新动能,据商务大数据监测,微单相机、智能家居系统和手机增长 22.5%、20.9% 和 15.5%,重点平台网络服务消费增长 20.2%,其中在线旅游和在线餐饮增长 51.1% 和 20.8%。7 月份,主要电商平台电视、洗衣机、冰箱以旧换新销售额增长 92.9%、82.8% 和 65.9%。 平台技术和模式创新持续涌现。中国平台企业的云转播首次成为奥运会主要转播方式,助力奥运会数字化转型。视频平台创新“体育 + 电商”商业模式,融合赛事转播、品牌合作和商品销售。主要电商平台加快推出人工智能运营工具。 电子商务推动各产业数字化转型。促进农业产销对接数字化,“数商兴农”深入湖北、湖南、宁夏等中西部地区选优品、育精品,据商务大数据监测(下同),1-7 月农产品网络零售额增长 20.1%。促进工业企业采购数字化,重点产业电商平台交易额增长 4.8%。促进生活服务业数字化,主要平台家政、洗衣、理发销售额增长 46.4%、45% 和 43.6%。 丝路电商国际合作互利共赢。上海“丝路电商”合作先行区“共塑规则、共享市场、共建能力”取得新进展,26 个“丝路电商”伙伴国国家馆展销各国商品超过 1.5 万余种,中国企业电子提单解决方案首次获国际航运企业采用。生鲜电商平台在越南、泰国等伙伴国建立蔬果直采基地,成为当地农产品输华新渠道,1-7 月中国电商平台销售泰国榴莲、越南腰果增长 48.6% 和 41.4%。 图源 Pixabay IT之家查询国家统计局数据,2024 年 7 月社会消费品零售总额 3.78 万亿元,同比增长 2.7%,增速较上月加快 0.7 个百分点;1-7 月社会消费品零售总额 27.37 万亿元,同比增长 3.5%。 一是商品消费稳步扩大。据国家统计局数据,7 月份,商品零售额 3.34 万亿元,同比增长 2.7%,增速较上月加快 1.2 个百分点。部分升级类商品销售加快,限额以上单位体育娱乐用品、通讯器材零售额同比分别增长 10.7% 和 12.7%,增速较上月分别加快 12.2 和 9.8 个百分点。汽车以旧换新政策效应持续显现,据汽车流通协会数据,7 月新能源乘用车零售量同比增长 36.9%。 二是服务消费较快增长。据国家统计局数据,1-7 月,服务零售额同比增长 7.2%,增速比同期商品零售额快 4.1 个百分点。其中,餐饮收入 3.06 万亿元,同比增长 7.1%;交通出行服务类、通讯信息服务类零售额保持两位数增长。 三是线上消费增势较好。据国家统计局数据,1-7 月,实物商品网上零售额同比增长 8.7%,占社零总额比重为 25.6%,较上半年提升 0.3 个百分点。据国家邮政局数据,7 月份我国快递业务量达 142.6 亿件,同比增长 22.2%。 四是乡村增速快于城镇。随着县域商业体系不断完善,县乡市场销售规模稳步扩大。据国家统计局数据,7 月份,乡村消费品零售额 5066 亿元,同比增长 4.6%,增速比城镇消费品零售额快 2.2 个百分点。1-7 月,乡村消费品零售额 3.65 万亿元,同比增长 4.5%,增速比城镇消费品零售额快 1.1 个百分点。
腾讯为部分景区、博物馆票务系统部署反黄牛技术,号称“解决90%恶意流量问题”
IT之家 8 月 22 日消息,针对网友反馈的热门景点公众号预约难、抢票难问题,腾讯今日公布了“风控反黄牛解决方案”。 ▲ 图源腾讯官方公众号,下同 据介绍,普通人抢票需要输入验证码、输入身份证、选择日期、提交订单,最快也要耗时 3-4 秒。初级黄牛用自动化脚本(恶意机器人)抢票,在 0.0001 秒内完成这些动作。而高级氪金黄牛储备了海量手机和账号,每台设备运行批量抢票软件和自动化工具。可以瞬间抢走大量票。 对此,腾讯安全为许多景区、博物馆的票务系统部署了反黄牛技术(具体景区未公布),用“三道防线”拦截黄牛: 第一道防线:在线拦截机器人 腾讯 Web 应用防火墙(WAF)处于 Web 应用程序和外部网络之间,可以检测并阻止自动化脚本的异常大流量访问。 通过对抢票速度、频次、地点的分析,腾讯 WAF 可以拦截大部分恶意机器人。比如,抢北京的票的 IP 地址集中在印度、新加坡,大概率是因为黄牛为了抢票购买了异地云资源。 第二道防线:筛出可疑设备 每一个设备都有自己的数字特征。如果这个设备的 IP 聚集度、设备聚集度很高,它大概率是虚假设备或可疑的设备。筛选出可疑设备后,再结合多种验证码的方式,就可以有效抵御黄牛,同时保证普通用户的购票体验。 最后一道防线:诱敌深入 第三道防线应用的是腾讯天御全栈式风控引擎(RCE)。先让少量黄牛进来买票,再标记异常的 IP:比如 0.5 秒就抢到票,每周抢几十张票,大概率不正常。 随着 IP 可疑动作越来越多,这个 IP 的颜色便会越来越深,直到成为风控系统中的黑样本。它就被彻底拦截了。 IT之家从腾讯官方获悉,该公司的“反黄牛”技术能够在无需人工介入的情况下帮助博物馆、博物院、公园、景区等“解决 90% 的恶意流量问题”。以前没有接入腾讯 RCE,热门的博物馆开闸放票十几秒,就被黄牛“扫荡”一空。现在,抢票时间窗口能延长到 20-30 分钟。
国产机器人黑马首次登场,打螺丝堪比擎天柱!国家队全栈自主研发
编辑:编辑部 【新智元导读】历时5个月,一款性能比肩擎天柱的人形机器人黑马诞生了!外观更类人,作业更智能,而且全栈自主研发,堪称是科技感和人文感完美融合。 这届2024世界机器人大会上,好多「人」啊。 行业内各家的人形机器人都来了,纷纷在现场拿出绝活,上演十八般手艺,简直要卷出花来。 而这位领航者2号NAVIAI,一亮相就吸引了大波群众围观。 它的打造者——浙江人形机器人创新中心,作为国内行业顶峰参会了。 机器人展区圈内圈外,都被围得严严实实,在场观众纷纷拿起手机拍照留念。 现场带货卖水,也是有模有样。正如背后挂幅所示——「躺平,从拥有一台人形机器人开始」。 大会现场,它还为观众展示了演讲、泡茶、下棋等十八般武艺,动作丝滑,惊艳众人。 从前,我们看到擎天柱叠衣服、分拣电池,看到Figure在仓库中搬东西,总会发出羡艳的赞叹。 而今天我们知道——国内的机器人比起来,也是毫不逊色!堪称是科技感和人文感完美融合! 连在场的歪果仁,都忍不住为NAVIAI竖起了大拇指。 1米65的机器人,给你「类人」情绪价值 仔细看,我们眼前的这位世界机器人大会上的重量级选手-领航者2号NAVIAI,形态已经无比贴近人类。 身高1.65米,体重约60公斤,整体的尺寸与比例皆是参照人类设计,因此大大增强了拟人性和亲和力。 在领航者2号前,还有一位领航者1号,它身高1.5米,体重50公斤,可以完成擦桌子、斟茶倒水之类的简单动作。 进化到2号的时候,机器人肉眼可见的变得更强了! 为什么它的动作,拟人化程度能做到这么高? 这是因为,它重点突破了数据生成、行为决策、底层控制等具身智能技术,进一步提升了拟人化动作映射执行能力。 因此,双臂、双手、头颈等全身41个自由度下的鲁棒拟人运动,它都能成功地实现,而且,它还能便捷地部署,实现精准操控。 这一设计,既能让机器人更好地适应人类生活的各项作业空间,还能满足服务陪伴场景中的精神诉求。 机器人可以跟用户建立更亲密、更自然的情感联系吗? 无数案例告诉我们,这件事是有可能的。 更何况,眼前的机器人在外形上如此类人。因此,它能够完成对弈、倒茶等更具人文关怀的人机交互任务。 这样,机器人就会更贴近人类生活,让我们感觉到「类人」的情绪价值。 头脑王者,现场化身主持人 不仅如此,领航者2号NAVIAI还口才爆表。 就在现场,它直接化身「主持人」,一番生动的自我介绍,让观众们爆发出阵阵喝彩。 另外,它还现场秀了一把自己超高的学习能力。 它快速地学会了新动作,实现了高自由度作业臂连续运动下的稳定站立。 这是因为,它采用了拟人全身模仿学习。通过隐空间优化与融合模型预测控制的动作,即可实现。 更让在场观众们感到惊奇的是,领航者2号NAVIAI的反应速度竟如此之快。 这是因为,它的AI算力达到了275Tops,也就是说,它拥有每秒275万亿次的运算能力。 算力越大,意味着系统的反应速度越快,也就能更快地响应,处理各种计算任务。 跟以往人们对「科技即冰冷」的传统印象不同,它仿佛不仅是一个机器人,而是一个带着温度的个体。 可以想象,走进家庭之后,它会是人类未来生活的温馨伙伴。 而在教育、培训、展览、客服等领域,它也会发挥出无限潜力,带来广阔的应用场景。 可以想象,我们足不出户就可以在家里沉浸式体验一场绘声绘色的演讲课了! 现场当起售卖员,打工能力惊呆观众 在展会现场,领航者2号NAVIAI还有另一个身份——售卖员! 虽然展会上人山人海、人头攒动,它却丝毫不怯场。 一番操作下来,观众们不禁感叹:这个机器人不仅长得像人,连智能交互作业居然也这么类人。 这是因为,领航者2号NAVIAI的类人具身智能导航,采用了大模型结合强化学习的决策规划框架。 这种全局拓扑地图,为大模型与强化学习决策紧凑的环境表征,引导机器人逐步走向目标位置 因此,它能够兼顾用户指令与开放空间感知。 即使在开放的混杂场景下,它依然能够进行鲁棒语义交互,还能完成长序列的桌面整理这类复杂任务。 家庭和服务场景,会遇到许多开放杂乱堆叠的情况,为此,工程师提出了语言-视觉-动作联合建模的物体抓取策略,一举提高了目标物体抓取成功率 帮人类收拾屋子,对机器人是个难题,工程师提出感知误差融合多环学习策略,机器人就解决了看不清、抓不了、放不了的问题 这样,机器人在家庭服务中的工作精准度,就能大大提高,用户也会感受到前所未有的智能化。 而且,领航者2号NAVIAI的作业场景,也非常灵活多样。 工业场景的插排装配、柜机打螺丝,它都不在话下。视觉伺服精度误差小于0.1mm,完全可以满足工业场景的应用需求了。 任意纹理场景、目标位姿、抓取误差等,都可以快速部署 全身具备的41个自由度,让它的活动更便捷,操作范围更广。 此外,它的手臂也做了创新设计。 可以看到,在保持了拟人化尺寸的同时,它的手臂驱动做了一体化设计。 这样,手臂所有关节的伺服驱动,就从身体转移到了手臂本身。 这就提高了模块化程度,更有利于后续的批量组装、运维。 而且,也让机器人的手臂具备了精确的作业能力,单臂可负载5千克的重量。 值得一提的是,领航者2号NAVIAI搭载了可泛化高精度高可靠视力融合伺服(已经在工业应用中上线)。 不仅可以完成工业场景中的高精度插孔。 而且还能实现轴孔配合容差<0.1mm,训练1h,成功率99.99%(训练效率和成功率均优于DeepMind)。 可以说,就是这种灵活的作业能力,让人形机器人正式成为了人类社会的一员! 人形机器人,加速从科幻奔向现实 过去一年里,机器人赛道异军突起,国外内初创公司、高校,还有国家队争相押注。 有会做满汉全席的ALOHA,进车间打工的Figure 02、擎天柱,还有疯狂炫技的宇树G1、波士顿动力Atlas等等。 机器人领域,已初现百家争鸣之势。 而且,过往进化历程向我们呈现了,人形机器人逐渐从认知时代、发展时代、向着人文时代过渡。 也就是说,人形机器人3.0时代已经来临了。 行业普遍预测,2024年是机器人落地的「元年」,将见证各家进入量产,商业化落地的尝试阶段。 它不再是束之高阁的机器,逐渐从实验室,走向工业,再走进千家万户。 尤其是,机器人技术正从工业领域,向普通消费者生活转变,包括服务、医疗、教育、家庭等多个领域。 中国统计年鉴数据显示,2021年中国独居人口已突破9200万。另一方面,老龄化阶段加深,老年人陪伴也上升为一大社会问题。 人形机器人,便成为人们寄托的一个希望。 它可以在服务体验,甚至是情绪关怀上,能够为人类提供全面的价值。比如,能够以类人方式交流互动,打扫家务等。 这一转变也体现着,科技与人文的融合。 全栈自主研发,行业领先 反观国内,人形机器人行业蓬勃发展,既有机遇,也有挑战。 除了企业,各地政府纷纷牵头,成立了类似的人形机器人创新中心。 其中,北京、上海、深圳,做作为机器人产业三大核心城市,可谓是一马当先。 据工信部《人形机器人创新发展指导意见》,「到2025年,我国人形机器人创新体系将初步建立,整机产品将达到国际先进水平并实现批量生产」。 2023年底,由熊蓉教授及团队联合多家知名产业方共建「浙江人形机器人创新中心」。 为了打破垄断,创新中心以全栈自主研发自控实力,在国内人形机器人创新研发领域,稳居行业领先地位。 创新中心在推进整机开发的同时,还集结了各方力量,协同攻克核心零件的研发,并提供应用场景和推广。 这也意味着,它将为人形机器人研发和产业化提供有利支撑,有助于形成规模化产业集群。 开跑即冲刺,要做人形机器人领航者 领航者2号NAVIAI现身大会,代表着这支「国家队」再一次交出了完美答卷! 这是浙江人形机器人创新中心,在100%自研零部件步伐下,实现的科技与人文创新融合。 而这一切成果,皆离不开幕后团队的努力。 成立于23年12月,创新中心致力于成为人形机器人领域的领航者。 目前,创新中心汇聚了国内外人形机器人领域的顶尖人才,包括浙大、北大、哈工大、英国帝国理工等高校。 其中,博士占比35%,硕士占比31%。 团队打造了涵盖工业设计、机械结构、电气硬件等一系列人形机器人全链自研的能力。 值得一提的是,领航者1号的整机系统,完全由团队自主研发,是十八年磨一剑的成果。 2006年,他们曾研制出小型防人足球机器人;2008-2011年,又研发出乒乓球对打仿人机器人;之后,又完成了多次尝试创新,直到初代NAVIAI的发布。 经过5个月的迭代,领航者2号NAVIAI无论是在外观上,还是技术细节上,朝着拥有类人能力的方向上,又近了一步。 据悉,目前二代NAVIAI已经在实际工业场景中,上线应用。 不仅如此,基于持续自我进化的策略,领航者2号不断地从新数据中学习,适应不同环境变化,有望在头部工业/企业中实现大规模落地。 当机器人不再是冰冷冷的机械,而是从内到外实现类人的创新发展,一个更具亲和力、能为人类带来情绪价值的新型人形机器人,才是引领未来人形机器人产业的发展新方向。 未来期待,创新中心能够闯出属于自己的星辰大海。
可灵AI还是火到了马斯克那!
马斯克点赞可灵AI 8月20日,AI插画艺术爱好者Déborah在推特上发布一段时长为五秒钟的视频,内容为女人手捧一朵燃烧的玫瑰,画面表现堪称电影级别的画质与动态效果。而这一视频背后,是由可灵AI完成图生视频过程。没过多久,这条视频获得了埃隆·马斯克(Elon Musk)的关注,并且他在评论区回复「AI Entertainment is happening fast」。 到目前为止,大部分国内初创的文生视频公司并没有拉开太大差距,风头都被国外的Sora、Runway占据之时,可灵AI是国内唯一被马斯克点赞的一个,可以说是十分争气。但其实,在马斯克亲自点赞之前,可灵AI的风早就已有吹遍国内外之势。6月初,快手自研的视频生成大模型可灵AI正式发布。问世之初,在海外社交媒体上就掀起了一波热度,大量海外网友在「求」一个可灵AI的内测机会。 之所以有这么高的热度,是因为可灵AI确实是继Sora后效果最惊艳的文生视频模型,并且能开放公测,让公众看得见摸得着,更增强其可信性。 市场分析机构摩根士丹利公开评论道:可灵AI的表现要比抖音和腾讯过往发布的视频生成模型都更加优秀。其成功发布,将有望使快手的用户规模和活跃度进一步提升,从而长期影响快手在电商和商业化等领域的货币化潜力。 从视频生成效果本身来看,可灵AI不仅能够模拟物理世界特性,还具备了强大的概念组合能力和想象力,生成的视频分辨率高达1080p,时长最高可达2分钟。更有网友表示:可灵AI生成的内容比真实世界世界还好。 甚至,可灵AI的效果引起了美国科技界权威杂志《麻省理工科技评论》的注意,发表题为《我测试了一个令人兴奋的中国新型“文生视频”人工智能模型》的文章,对照了可灵AI与Sora的生成效果以及对物理世界的还原能力。6月21日,可灵AI再度进化,正式推出图生视频功能,支持用任意静态图像生成 5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事 。马斯克点赞的视频,也是出自可灵AI这一核心爆款功能。在海外,快手的图生视频得到了广泛的使用。被点赞视频的作者Déborah也多次用可灵AI制作视频 。 7月6日,在上海举行的2024世界人工智能大会上,正式上线了网页端(https://klingai.kuaishou.com),推出了更加清晰的高画质版,在视频处理的精细度上有了大幅提升。其中,首尾帧控制、镜头控制等新功能也一起上线,并且创作者单次生成的文生视频时长也增加至10秒。 7月底,可灵AI大模型全面开放内测,并正式面向全球上线会员体系,针对不同类别的会员,提供相应的专属功能服务。 可以见得,在如今的AIGC竞争格局中,可灵AI已经取得了自己的身位优势。 百万级用户生成千万+视频 ,快手AIGC的里程碑式突破 在马斯克点赞可灵AI视频的同一天,快手发布2024年第二季度及中期业绩,总营收同比增长11.6%至310亿元。经调整净利润达46.8亿元,超过市场一致预期。 本季度,快手更是在AIGC领域取得了里程碑式的突破。在可灵AI正式面向全球开放会员体系后,截至目前,已有超过百万人使用过可灵AI,并累计生成超千万视频。 在当天晚间举行的业绩电话会上,快手联合创始人、董事长兼CEO程一笑表示,针对可灵AI的商业化,除了加强C端会员付费的全球运营外,也将寻求更多与B 端合作变现的可能性,力争尽快实现可观的商业化变现规模。 除了视频生成大模型,快手的语言大模型和文生图模型也都实现了显著的性能提升:目前,快意语言大模型已经实现了在中文场景下综合性能超过GPT4.0的目标;多模态大语言模型也在视频内容的理解方面,达到了GPT4v的水平。此外,快手的文生图大模型可图经过多个版本的迭代,综合性能已经超越了Midjourney V5,可图也在近期宣布正式开源。 在具体业务场景中的应用层面,快手的大模型矩阵已经可以覆盖内容生产、理解、推荐等多个层面,并深度服务快手的商业生态场景。例如,基于快意大模型构建的视频和直播脚本生成、广告线索客服,叠加数字人技术,可以助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。数据显示,今年上半年,有近2万商家借助快手大模型实现智能化经营,其中AIGC营销素材在6月的日均消耗已经达到2000万。 程一笑对接下来在大模型上的相关动作及长远规划进行了阐述: 首先,在语言大模型上,快手将侧重研发训练更适配业务场景的专项语言模型,大规模降低模型的整体推理成本;其次,在视觉生成模型方面,可灵AI依旧是重点发力方向,未来,快手将进一步升级可灵AI大模型,带来模型性能的进一步提升,以保持行业的领先地位;最后,也会探索将大模型进一步运用到商业化推荐中,提升算法推荐效率,从而给线上营销服务收入的增长带来更强劲的支撑。 「快手将坚定执行AI战略,在赋能现有业务场景的同时,努力创造新的业务变现模式。」程一笑说道。 自正式推出两个多月的时间以来,无论是在C端用户群体的自发使用还是在影视行业的专业运用,可灵AI都具有较高的参与度。 在前段时间网络中掀起的「AIGC让老照片动起来」、「拥抱小时候的自己」的话题中,有很多网友选择可灵AI作为工具来让照片动起来,连接过去和现在的自己。 除此之外,可灵AI也被媒体和影视行业广泛应用于专业视频制作流程中。在巴黎奥运来临之际,中央广播电视总台推出首部生成式AI微电影《百年前的那次出发》,就是由可灵AI提供技术支持,生动还原了100年前4名网球选手代表中国奔赴巴黎奥运会的历程。 尤其在七月下旬,由可灵AI提供深度技术支持国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》收官。作为星芒短剧暑期档的精选剧集,《山海奇镜之劈波斩浪》在5集的篇幅里,利用可灵AI对奇幻的上古传说进行当代“转码”,将古代的浪漫想象进行赛博复现。 截至7月27日,《山海奇镜之劈波斩浪》正片5集播放量超过5200万,全网话题曝光量超4.3亿,同时还登上全平台热搜21个,德塔文短剧景气指数top1、猫眼短剧热度日榜top2。 近日火爆全网的游戏《黑神话·悟空》,网友们也用可灵AI制作了大量视频,国产AI联动国产3A大作,表现效果甚至同游戏本体不相上下。 无论是网友的创意狂欢还是专业制作者的不断深耕,都让我们看到,未来视频生成大模型赛道的无限可能。
中国机器人有效专利已超19万项,独占全球2/3!国外专家:全球机器人第一生产大国
(图片来源:摄图网) 8月21日,2024世界机器人大会在北京开幕。据《经济参考报》记者从大会开幕式上获悉最新消息,我国已成为全球机器人科技创新、应用拓展和行业治理的重要力量,相关有效专利超19万项,占全球比重约三分之二。 中国连续11年成为全球最大的工业机器人市场,近三年新增装机量占全球一半以上。 国家统计局的最新数据显示,今年1至7月,全国工业机器人产量已超过30万套,仅7月单月产量便实现了19.7%增长。 国际机器人联合会主席玛丽娜·比尔说,近年来,中国在机器人领域取得了令人瞩目的成就,已经成为全球机器人第一大消费市场和生产大国。 随着人工智能、大数据、云计算等技术的不断成熟和应用,工业机器人在生产制造、物流运输、医疗卫生等领域发挥着越来越重要的作用。工业机器人的出现不仅提高了生产效率,降低了生产成本,还能够减少劳动强度,提高产品质量,提升企业竞争力。今年以来,人工智能等技术的成熟进一步赋能工业机器人,使之能够深入更智能化、精细化、柔性化的场景,航天航空、植入医疗器械、泛半导体以及实验室检测等领域均成为工业机器人新增细分市场。 国产厂商快速追赶,国产替代加速 近年来,随着国产化浪潮的兴起,本土品牌机器人在市场中的份额不断提升,已占据半壁江山。 在国内工业机器人市场,发那科、爱普生、ABB和安川电机等外资品牌仍然占据重要地位。但国产工业机器人产业经过近年来的技术积累,逐渐形成自己的竞争优势,以埃夫特、埃斯顿、众为兴、广州启帆、新松和新时达的为代表的国产厂商,目前都已具备一定规模和技术实力,国产替代进程加速。 从工业机器人行业内资厂商和外资厂商销量情况来看,2015年,内资厂商的销量占比仅有三成左右,到2023年,内资厂商销量占比超过一半,首次超过外资厂商销量。 工业机器人行业企业集中在广东、江苏 从区域来看,广东、江苏的企业数量集中度较高,与此同时产业链相对完善。 代表性企业分布方面,广东、江苏、浙江等区域在工业机器人产业链中有代表性企业,如广东省拥有汇川技术、大族精密传动、广州数控等;江苏省拥有埃斯顿、科远股份、绿的谐波等;浙江省拥有双环传动、爱仕达、浙江钱江等。 东莞工业机器人产量连续三年稳居全国第一 自2014年起,东莞开始积极推动机器人产业发展,并成立了松山湖国际机器人产业基地。香港科技大学李泽湘教授团队创建了东莞松山湖机器人产业发展有限公司,旨在推动东莞机器人产业发展,并成立了松山湖国际机器人研究院。自2015年起,该基地与东莞理工学院、广东工业大学、香港科技大学合作共建粤港机器人学院,采用基于项目和课题的办学模式。截至2021年8月底,松山湖国际机器人产业基地已孵化创业实体80个,累计总产值超过35亿元。在整个东莞地区,规模以上的机器人企业约有163家,工业机器人研发及生产企业约占全国总数的10%。 2022年工业机器人产量16.57万台,占全国产量41.2%,同比增长2.1%,连续三年稳居全国第一。 前瞻产业研究院认为,未来一段时间,随着中低端市场技术成熟、竞争日趋激烈,产品售价将有所下降。另外在中高端市场,随着国产技术突破,国产品牌亦将占据更多的市场份额,出口市场也有较大的发展前景。预计整体市场规模仍将保持一定增长。到2029年,中国工业机器人行业市场规模有望超过800亿元。
OpenAI GPT-4 AI模型潜力挖掘:高精度建模基础蛋白质结构
IT之家 8 月 22 日消息,科技媒体 The Decoder 昨日(8 月 21 日)发布博文,报道称罗格斯大学的一项研究表明,OpenAI 公司的 GPT-4 语言模型能高精度模拟简单的氨基酸和蛋白质结构。 相关研究成果发表在《Scientific Reports》上,该科研团队使用 GPT-4 AI 语言模型,探索其在基本结构生物学任务中的表现,结果发现该 AI 模型可以准确预测分子结构。 科学家们要求 GPT-4 建立 20 种标准氨基酸的三维结构模型,在反馈结果中准确地预测了原子组成、键长和角度,不过 GPT-4 在模拟环状结构和立体化学构型时却出现了错误。 在另一项实验中,GPT-4 被要求模拟常见的蛋白质结构元素--α-螺旋的结构,需要集成 Wolfram 插件进行数学计算,结果模型与实验确定的 α-螺旋结构相当。 此外,GPT-4 还分析了抗病毒药物 Nirmatrelvir 与 SARS-CoV-2 主要蛋白酶之间的结合。该模型正确识别了参与结合的氨基酸,并准确指定了相互作用原子之间的距离。 由于 GPT-4 并不是专门为结构生物学任务开发的,因此这些能力非常突出。研究人员指出,GPT-4 的建模方法尚不明确。它可以使用训练数据集中的现有原子坐标,也可以从头开始重新计算结构--要得出明确的结论,还需要进一步的广泛研究。 研究人员表示,AlphaFold 3 等专用人工智能工具可以预测更复杂的结构,而 GPT-4 则有望完成基本的结构生物学任务。这种建模能力目前还很初级,实际应用有限。 尽管如此,研究小组表示,这项研究开创了将这种技术应用于结构生物学的先例。研究人员建议进一步研究生成式人工智能的能力和局限性,可以在结构生物学领域之外,进一步探索 AI 在其他潜在的生命科学领域的应用。
AI视频生成狂卷!4人小团队造出Sora竞品,耗费数千块GPU,已开放公测
编译 | 徐豫 编辑 | 漠影 智东西8月22日消息,据VentureBeat 8月20日报道,AI初创公司Hotshot的同名文生视频模型“Hotshot”开放公测,用户可以访问Hotshot.co官网使用该模型,现阶段每人每天有两次免费创作机会。 Hotshot模型由4人小团队用数千块GPU训练而成,可以生成10秒以内不同主题的视频,耗时短、清晰度高、操作界面简洁。与主流的AI文生视频模型相比,Hotshot公测版兼顾视频生成效率和稳定性的同时,视频风格更丰富,生态也更加开放,可生成无水印视频。 ▲可用Hotshot生成风格多样的视频(图源:Hotshot) Hotshot成立于2023年,联合创始人为Aakash Sastry、John Mullan和Duncan Crawbuck。这三位公司创始人已有11年的消费级应用开发经验,并从Lachy Groom、Alexis Ohanian、SV Angel等人那里获得了资金支持。 体验地址:https://hotshot.co/ 一、最长10秒,清晰度720p,可定制动漫效果 Hotshot文生视频模型是一款Transformer扩散模型,其最新版本可根据文字描述生成一段最长10秒、清晰度为720p的视频。 例如,在Hotshot中输入“柯基坐在学校教室里”,我们可以得到,两只毛发分明顺滑的柯基,身穿不同花色、样式的衣服,坐在木色椅子上东张西望,柯基身后是写有粉笔字的黑板,而黑板旁有一个陈列地球仪等教具的展示柜,整体拍摄视角不断推进的一段视频。 ▲Hotshot根据文本“柯基坐在学校教室里”AI生成的视频(图源:Hotshot) 除了模拟真实的人物、场景、风景,用户还可以用Hotshot制作动漫、逐帧动画、特效等风格化视频。 Hotshot生成的一段视频中,一位金发年轻男子,身穿蓝色衬衫和深色裤子,坐在客厅的黄色沙发上,玩着手持电子游戏,客厅布置了绿植、挂画。视频画面配色鲜艳、笔触粗犷,呈现出50年代的复古漫画风格。 ▲Hotshot可以风格化处理视频(图源:Hotshot) 二、4个人耗时4个月,投入6亿段素材,花费几千块GPU 这样一个“类Sora”的文生视频模型,Hotshot仅靠团队4人,耗时4个月,便完成了该模型的训练工作。 据Hotshot介绍,最新版的文生视频模型在训练中投入了6亿段视频及音频素材、几千块GPU,高强度的模型训练常常导致NVIDIA H100 GPU出现故障,“机房差点着火”。为了让模型不偏离预期方向,团队成员一个月都没有休息,轮流监控训练结果。 3位创始人和新成员Chaitu Aluru还开发了一个新的自动编码器,在“空间”和“时间”上压缩视频内容,而非折损视频质量和相关数据,从而更高效地训练长序列视频。 三、过去一年多,Hotshot模型3次升级换代 Hotshot曾推出过AI文生图应用和两代AI文生视频模型,可惜未能激起较大的水花。 去年,Hotshot上线了同名消费级AI文生图应用,用户可以免费用Hotshot生成和修改照片,但该应用可能已被下架。 后续Hotshot推出了AI文生视频模型Hotshot-XL,并开源。该模型可以生成时长1秒,帧率8fps的视频。当时,Hotshot-XL的月活用户超2万人次。Hotshot Act-One则是Hotshot-XL的升级版,拓展了AI视频生成的时长上限。Hotshot Act-One模型可制作时长3秒,帧率同为8fps的视频。 Hotshot联合创始人Sastry在社交媒体X的帖子中写道,Hotshot是“目前最先进的公开模型”,十多年以来,我们首次能够为用户提供“强大且新颖的”AI文生视频功能,而这仅仅是一个开始。 结语:AI文生视频模型很卷,但还没有绝对的赢家 在Sastry看来,未来一年内,YouTube将被多模态生成式AI作品“刷屏”,AI文生图、文生视频、文生音频、图生视频等创作方式,将成为数字媒体上的常态。 市面上AI视频生成模型和应用的竞争也愈发激烈。AI视频创企Runway ML的Gen-3 Alpha Turbo、AI大模型独角兽OpenAI尚未公开的Sora、3D建模与视觉AI公司Luma的Dream Machine等AI视频生成模型,以及AI视频创企Pika Labs的Pika AI视频生成应用,都有着较高的关注度。 与竞争对手相比,Hotshot虽然文本还原度较高、视频生成速度较快,但现阶段的视频生成效果,在质量、细节和分辨率上都差强人意。网友用Hotshot模型制作的视频,不少存在手部、腿部重影,物品悬空、动作逻辑错误、说话神态、口型单一等较为明显的漏洞。 ▲马腿出现重影(图源:VentureBeat)
瘫痪患者“意念”玩枪战!马斯克脑机接口新进展,目标5年植入数万人
编译 | 陈骏达 编辑 | Panken 智东西8月22日消息,今天,马斯克旗下的Neuralink公司在官网上公布了第二例接受植入的患者的最新情况。这位患者术后状况良好,已经学会使用脑机接口操作CAD制图软件,给自己的脑机接口设计了3D打印的充电支架,还能玩《反恐精英2》这类的第一人称射击游戏。 这例植入手术于上个月完成,术后并未出现连接线回缩,信号衰减的现象。这是因为Neuralink公司优化了手术的操作和流程,如减少手术期间的大脑运动、减少植入物和大脑表面之间的间隙和加深植入深度。 与传统的辅助设备相比,脑机接口为患者提供了更为自由、高效的操纵方式。目前,Neuralink公司正在与这位患者继续改进脑机接口的表现。他们希望用脑机接口实现精度更高的控制,如区分鼠标的左、中、右按键等。 马斯克也转发了Neuralink公司的最新进展。他今天在X平台上预测,如果一切顺利,几年内将会有数百人拥有Neuralink,5年内可能有数万人,10年内数以百万计。 ▲马斯克预言Neuralink未来发展(图源:X平台) 一、开箱即用基本无需训练,并未出现电极脱落现象 本次接受脑机芯片植入的患者名为Alex,是第二位接受Neuralink公司植入的患者。首位接受Neuralink公司脑机芯片植入的患者于2024年1月完成手术,术后很快便学会使用脑机接口操作电子设备,玩诸如《文明4》这样的策略类游戏。他还帮助Neuralink公司积累了大量数据,改善了脑机芯片的表现。 Alex在上个月接受了手术,第二天就顺利出院,手术预后良好。在Alex将脑机芯片连接到计算机的5分钟后,他便学会了用意念来控制光标的移动。几个小时之内,他就打破了其它辅助技术在Webgrid任务中所达到的最大速度和准确度,能通过意念高效控制光标。 ▲Webgrid是Neuralink公司设计的一款用于训练和评估脑机接口表现的程序(图源:Neuralink) Alex在使用Neuralink脑机芯片的第一天,打破了之前使用非Neuralink设备进行脑机接口光标控制的世界纪录。 可喜的是,Neuralink脑机芯片此次并未出现连接线回缩、电极脱落的现象。第一例接受脑机芯片植入的患者在术后一段时间后控制效果严重降低,这主要是由于连接到他大脑中收集电信号的电极陆续脱落了。 在本次手术中,Neuralink采取了多种措施避免这一情况再次出现,包括减少手术期间的大脑运动、减少植入物和大脑表面之间的间隙和加深植入深度。最终,研究人员在第二位患者上并未观察到连接线回缩的现象。 ▲第二例患者的植入深度要普遍深于第一例患者(图源:Neuralink) 二、患者利用脑机接口学会CAD,还能打第一人称射击游戏 Alex在一次事故中因脊髓受伤失去行动能力。之前,他是一名汽车技术员,负责修理各种类型的汽车与大型机械。他很希望能学会使用CAD(计算机辅助设计)软件设计3D对象,然而他原有的辅助设备无法让他完成这一操作。 在使用脑机接口的第二天,Alex首次成功使用了CAD软件Fusion 360,并为他的脑机接口充电器设计了一个定制支架。他将这一支架3D打印了出来,并集成到他的辅助设备中。 ▲Alex使用脑机接口操作CAD软件(图源:Neuralink) 目前,Neuralink公司正在帮助Alex实现更高精度的控制,让脑机芯片能识别出点击鼠标左、中、右三个按键信号的区别。这能帮助Alex更为高效地使用CAD软件。 Alex还喜欢玩第一人称射击游戏,这些游戏通常需要使用大量输入工具,包括两个独立的操纵杆(一个用于瞄准,另一个用于移动)和一系列按钮。 之前,Alex使用名为Quadstick的辅助设备玩这些游戏。此类控制器的一个关键问题是它只有一个操纵杆,限制了移动和瞄准的操作。从移动到瞄准的切换需要松开操纵杆,然后用一根单独的吸管吹气或吸气来切换功能。 ▲Quadstick主要通过口棒和压敏控制器帮助残障人士使用电子设备(图源:Quadstick官网) 现在,Alex能够将脑机接口与他的Quadstick结合使用,同时移动和瞄准,从而解锁更直观的游戏体验。他只需要在脑中想象出游戏人物如何移动,脑机接口便能帮他在游戏中实现相关操作。从Alex玩《反恐精英2》的游戏实况画面来看,脑机接口确实帮助他实现了比较流畅的操作。 ▲Alex使用脑机接口和Quadstick玩《反恐精英2》(图源:Neuralink) 结语:脑机接口再迎进展,或成残障人士福音 据Neuralink公司透露,目前他们正在努力帮助患者实现多次点击和多个同时移动意图,这将解锁更为丰富的鼠标和游戏手柄操作。他们还在开发算法以识别书写的意图,从而实现更高效的文本输入。 马斯克此前在一档播客中介绍,在监管条件允许的情况下,Neuralink公司今年将再进行8次植入。他们计划让脑机接口帮助患者实现与现实世界的互动,让患者能自主进食,并通过控制机械臂或轮椅来更为自由的行动。这或将成为残障人士们的福音。
NVIDIA生成式AI新突破:提前准确预警风暴,模拟高保真大气动力学
作者 | ZeR0 编辑 | 漠影 智东西8月22日报道,正值大西洋飓风季的高峰期,NVIDIA Research近日发布了一款全新生成式AI模型StormCast,用于模拟高保真大气动力学,可在中尺度(比风暴大但比气旋小的尺度)上作出可靠的天气预测。 这对于防灾减灾工作至关重要。飓风、龙卷风等极端天气事件的发生频率和严重程度不断增加。极端天气甚至会夺走生命、摧毁家园,仅在美国每年就造成超过1500亿美元的损失。使用最新技术改善和加速气候研究与预测愈发迫切。 开发高分辨率天气模型需要利用AI算法解决对流问题。借助生成扩散技术,StormCast可实现3公里的空间分辨率和每小时的时间分辨率。该模型在与降水雷达配合使用时,能够提供最多提前6小时的预报,比美国国家海洋和大气管理局最先进的区域天气预报模型的准确度还高。 NVIDIA研究人员利用来自美国中部的约三年半美国国家海洋和大气管理局(NOAA)气候数据对StormCast进行了训练,并使用NVIDIA加速计算加快计算速度。 StormCast的输出结果可显示符合物理学的逼真热量和湿度动态,并能预测100多个变量,使科学家们首次能够在AI天气模拟中确认风暴浮力的真实3D演变过程。 一、用生成式AI精准预测台风,计算成本从近300万降至6万美元 NVIDIA Earth-2是一个集AI、物理仿真和计算机图形于一身的数字孪生云平台,能以前所未有的准确性和速度在全球范围实现天气与气候预测的模拟和可视化。 例如在台湾地区,灾害防救科技中心计划使用Earth-2提供的一个NVIDIA生成式AI模型CorrDiff,来预测台风的精细尺度细节。 CorrDiff可将模型分辨率从25公里提高到2公里,分辨率是以前的12.5倍,单次推理速度比传统的方法快了1000倍,能源效率提高了3000倍。 这意味着该中心以前需要花费近300万美元购买CPU才能完成的救援工作,现在只需花费约6万美元就能在搭载NVIDIA Hopper Tensor Core GPU的单个系统上完成。 这一成本的大幅降低,表明生成式AI和加速计算能够有效地提高能效和降低成本。 该中心还计划使用CorrDiff预测城市地区的下沉气流。因为当强风以漏斗状向下吹往街道时,就会损坏建筑物并影响行人。 StormCast现在为CorrDiff增加了每小时自回归预测功能,使得该模型可以根据过去的结果预测未来的结果。 二、将预报提前6小时,能显示逼真热量和湿度动态 全球气候研究始于地区层面的研究。天气和气候变化造成的物理危害在不同地区之间存在显著差异。但由于在中尺度上模拟基本的流体动力学运动需要很高的空间分辨率,因此在这一层面进行可靠的数值天气预测,需要大量计算成本。 过去,区域天气预报模型(通常称为对流容许模型,缩写为CAM)迫使研究人员不得不在分辨率、集合规模、可负担性方面作出不同的权衡。 气象学家可以使用CAM追踪风暴的演变和结构并监测其对流模式或风暴形成时的构成方式。例如,龙卷风发生的概率取决于风暴的结构和对流模式。 CAM还有助于研究人员了解与天气有关的物理危害对基础设施层面的影响。例如,研究人员可以使用全球气候模型模拟为CAM提供参考,帮助它们根据大气、河流含水量的缓慢变化,预测沿海易受灾地区的山洪暴发。 在较低分辨率下,在全球数据上训练而成的机器学习模型已能够有效地模拟数值天气预报模型,来改进严重事件的预警系统。这些机器学习模型的空间分辨率通常为30公里左右,时间分辨率为6小时。 如今,在生成扩散技术的帮助下,StormCast能够实现3公里的空间分辨率和每小时的时间分辨率。 尽管尚处于起步阶段,但该模型在与降水雷达配合使用时,已经可以提供最多提前6小时的预报,其准确度比美国国家海洋和大气管理局(NOAA)最先进的3公里尺度CAM高出10%。 ▲使用NOAA的地球静止环境观测卫星观察中尺度对流系统(图源:NOAA) 此外,StormCast的输出结果可显示符合物理学的逼真热量和湿度动态,并且能够预测100多个变量,例如在多个精细划分的高度层上的温度、水分浓度、风力和降雨雷达反射率值等。 这使科学家们首次能够在AI天气模拟中确认风暴浮力的真实3D演变过程。 三、朝着开发AI高分辨率天气预报模型,迈出重要一步 科学家们已经在探究如何利用该模型的优势。 The Weather Company创新负责人Tom Hamill谈道,由于有序的雷暴和冬季降水会产生巨大的影响,而且对其作出可信预报的难度极大,因此制作计算上易处理的风暴尺度集合天气预报是数值天气预报领域所面临的一项艰巨挑战。 在他看来,StormCast显然是一个能够应对此类挑战的模型。“The Weather Company十分高兴能与NVIDIA一起开发、评估并在未来使用这些深度学习预报模型。”Tom Hamill说。 科罗拉多州立大学大气合作研究所机器学习负责人Imme Ebert-Uphoff认为,开发高分辨率天气模型需要使用AI算法解决对流问题,NVIDIA的这项新研究探索了利用StormCast等扩散模型实现这一目标的潜力,是朝着未来开发AI高分辨率天气预报模型迈出的重要一步。 结语:超越传统预报方法,AI引入气候研究新范式 应对日益恶劣的极端天气事件和气候挑战,快速发展的AI和加速计算能够更好地模拟气候条件,不仅有助于提高预测天气状况的准确性,对严重气候灾害进行尽早地预警与防范,而且能够大幅降低计算成本,实现更节能的高分辨率模拟与可视化,减少对环境的影响。 从数字孪生地球到StormCast模型,以及与气候研究机构的一系列合作,NVIDIA一直走在加速处理复杂天气数据的前排,通过将AI技术与加速计算系统的结合,改善气候研究,推动具有可操作性的极端天气预测取得突破,从而帮助科学家应对拯救生命和世界的严峻挑战。这项长期事业最终将使全球受益。
人形机器人沸腾北京!优必选发工业场景解决方案,技术要点一文揭秘
作者 | 三北 编辑 | 漠影 人形机器人走进工厂,已成为全球科技圈的一大热点。 智东西8月22日报道,在8月21日-25日举办的2024世界机器人大会上,多达27款人形机器人扎堆亮相,数量达到历年之最,并且各路人形机器人大秀作诗、跳舞、走红毯、卖货等各种才艺,吸引了众多眼球。 多次参加大会的优必选,今年所展示的内容有所不同。相比于单款人形机器人产品,他们在现场搭建了一个模拟车厂的应用环境,首次展出了人形机器人工业场景解决方案,Walker S系列人形机器人在现场展示出多项实用技能,搬运货物、分拣物料、汽车质检等任务都不在话下。 ▲在模拟车厂的应用环境中演示人形机器人 自今年初起,蔚来、吉利汽车、一汽-大众青岛分公司等多家车厂都出现了优必选工业版人形机器人Walker S系列的身影,进行实训实操。本次,优必选在现场展示的人形机器人工业场景解决方案正是此前的这些实践经验沉淀而来。 “经过超过半年的调研,我们发现工业制造有望成为人形机器人大规模应用的首个领域。”优必选副总裁、研究院执行院长焦继超说,“从用户需求的迫切程度、对人形机器人的认知程度,到大家普遍关心的问题来看,工业制造领域对这些人形机器人的接受度已经相当高了。” 进入工厂实训的优必选人形机器人表现如何?背后有什么样的产品和技术亮点?通过对话焦继超等多位专家,本文对此进行了深入的探讨。 ▲优必选Walker S系列人形机器人在现场引起众多关注 一、一线探展:搬运、分拣、质检全都会,“丝滑”协同人车物 人形机器人是本次世界机器人大会的焦点,其中一大爆点就是优必选首次展示的人形机器人工业场景解决方案。 现场的优必选相关负责人告诉我们,这是其最新推出的通用人形机器人解决方案,专门面向多任务工业场景,主要完成智能搬运、智能分拣、智能质检、螺丝拧紧、零件安装、过程材料操作等多种任务,在全球范围内都是首创。 在优必选展台上,Walker S系列人形机器人展示了智能搬运、智能分拣、智能质检等多种任务,人气尤为火爆。 1、智能搬运:会看路、能避障、抓得稳,搬运小能手 搬运是工厂里的高频场景,Walker S系列人形机器人可以轻松识别并拿起货物,准确地将货物送到目的地。比如,它可以把零部件箱从仓库地板搬到传送带上。 ▲智能搬运 Walker S系列的双臂可谓 “小臂出大力”,自重/负载比小于1的轻量化仿人双臂,可以搬运不同尺寸、最高重达15千克的箱子。 在搬运时,它的速度大约达到2千米/小时,空运时速最高4千米/小时,大约是0.5-1米/秒,虽然跟人的行走速度还没法比,但这个速度保证了步伐平稳安全,已经是目前业内的领先水平。 值得一提的是,Walker S系列的搬运工作是有计划的。在行动前,它会先构建3D语义地图,以便精准导航和避障。在搬运过程中,它能同时实时记录数据,与智慧工厂仓库系统完美对接,还能与AGV、无人物流车等智能设备连接协同。 2、智能分拣:“眼尖手快”,被干扰后2秒重回最佳状态 在工厂中,货品分拣是一个门槛更高的工种,Walker S系列也能够胜任。 “眼尖手快”是这个场景中的人形机器人的必备特质。据悉,Walker S系列可以实现厘米级精度的部件与工具自主定位与识别,快速执行任务理解和规划,“手眼协调”地完成分拣任务。 ▲智能分拣 通过一个最大约177厘米的臂展,以及12个主动自由度的灵巧双手,Walker S系列可以在10秒内抓取和放置2种组件。 背后,Walker S系列有一双6D位姿识别技术“眼睛”、多模态大模型“大脑”以及自主手眼协调抓取技术“神经”,让它即使在分拣时被干扰,也能够在不到2秒的时间内迅速响应和重启任务。 3、智能质检:“火眼金睛”,检测准确率超99% 质检则对工厂中人形机器人的要求“更上一层楼”,它尤为精细且需要专业经验支持。 Walker S系列可以在移动的汽车生产流水线上,安全稳定地靠近车辆,采集并处理视频流和深度信息,检测零部件的质量达标情况。 ▲智能质检 据称,其检测范围覆盖360°的车身范围和0.5米以下的低矮区域,检测准确率超过99%。即使是针对复杂光线,Walker S系列也可以通过手持LED灯对检测零件进行补光,并通过全身搭载的摄像头实现毫米级的检测。 此外,Walker S系列可以与工厂自动化控制系统无缝对接,将检查结果进行实时可视化,它还可以动态调整操作策略,确保在复杂的生产环境中高效、安全地工作。 进入工厂,人形机器人就不再是一个孤立的个体。像自动驾驶汽车需要和车、路、人相协调一样,它需要与工厂里的人、车、物相配合。 基于优必选人形机器人工业场景解决方案,人形机器人可以与工人、AGV、无人物流车联动,也能接入智能制造管理系统协作,在任务调度、货物配送、生产加工等多个场景形成高效灵活的生产方式。 比如,在本次展会上,Walker S Lite人形机器人与L4级无人物流车Chitu赤兔协作执行了物料配送任务,后者将物料搬运到指定位置,Walker S Lite人形机器人从那里接过货物,最终完成配送。 ▲Walker S Lite人形机器人与L4级无人物流车Chitu赤兔协作 “我们给客户的解决方案是一站式的,从后台的管理系统到前端实现统一的通信调度管理。”焦继超告诉智东西,“通过不断的技术迭代和成本优化,人形机器人有望从工业场景走进各行各业,最终到家庭陪伴场景时,人们买人形机器人就像买一台手机或电脑一样简单。” 二、工业场景垂域大模型“大脑”加持,全栈式技术积累 看完人形机器人技能展示,我们来看看优必选工业解决方案背后技术。 焦继超告诉智东西,在经过前期深入调研、实地考察、企业实战合作后,团队发现制造业领域对人形机器人的要求实际且务实: 首先,机器人需要具备高度的自主能力,以减少对人工维护的依赖; 其次,人形机器人需要具备双臂的灵巧操作能力,以适应组装线上的各种任务; 再者,量产交付能力也是关键。当企业需要大量人形机器人时,能否保证每台人形机器人的一致性和质量,这涉及到工艺和生产流程的严格控制。 此外,价格也是一个重要因素。性能和价格需要达成一个平衡点,以满足用户的实际需求。 总的来说,工业场景对人形机器人硬件和软件都提出了很高的要求,需要厂家不断进行技术创新和研发。 聚焦到优必选人形机器人工业场景解决方案,这一方案覆盖了其沉淀十几年,在具身智能多项关键技术实现了突破,包括行业先进的工业场景垂域大模型技术、计算机视觉感知、语义VSLAM导航、学习型全身运动控制、多模态人机交互、灵巧操作、机器人本体结构设计、高性能一体化关节等多个方面。 每一项技术的门槛都不低,且对人形机器人在工业领域的落地都很关键。 以多模态人机交互为例,该方案采用了优必选自研的面向人形机器人工业场景的多模态大模型。利用多模态大模型的场景理解能力,人形机器人将具体任务与工作场景结合,提升工厂任务的执行效率;基于多模态大模型构建多类智能体,人形机器人对不同任务的理解与执行效率得以提升。据悉,在工业场景和交互领域,这一架构已经超过部分通用大模型的表现。 ▲优必选多模态大模型应用展示 焦继超谈道,自2012年成立以来,优必选就开始沉淀伺服驱动器、运动控制算法、人机交互等关键技术。团队在2023年内部论证了具身智能的技术体系框架,开创性地将技术体系分为大脑、小脑和硬件三个区块: 大脑负责动态感知和角色规划,小脑则负责运动控制,包括步态和灵巧操作,多种高性能肢体就是执行器硬件,从而使人形机器人的多模态交互、灵巧操作和自主导航能力大大提升。 再以高性能一体化关节为例,这是人形机器人的核心部件之一。据悉,优必选自研一体化关节集成了驱动器、电机、减速器等组件于一个紧凑的结构中,以提供高扭矩和高功率密度的输出能力。 这种设计不仅提高了负载能力,还提升了交互比和散热效率,是优必选工业解决方案的一大技术亮点。 总的来说,在这些硬核技术的加持下,优必选工业版人形机器人Walker S系列相较于其他国内外人形机器人,具备了更加优秀的稳定性、可靠性、实用性和安全性,这也是车厂对使用人形机器人的基本要求。 ▲优必选Walker S系列人形机器人在现场展示技能 三、牵手奥迪一汽等行业龙头,推动人形机器人落地应用 本次世界机器人大会期间,优必选还与奥迪一汽、北京具身智能机器人创新中心签署合作协议,共同研发人形机器人智能化解决方案。 ▲优必选与奥迪一汽、北京具身智能机器人创新中心签署合作协议 按照计划,优必选将与这些合作伙伴将人形机器人引入汽车产线的智能搬运、质量检查和过程材料操作等工位,推动人形机器人在汽车工厂的大规模应用。 这一年,人形机器人进厂成为全球的主流,国外头部人形机器人公司基本都与汽车厂商合作,国内优必选也动作频频,先后与东风柳汽、吉利汽车、一汽红旗、一汽-大众青岛分公司、奥迪一汽等多家汽车企业合作,是目前合作车厂最多的人形机器人企业。工业版人形机器人Walker S系列陆续进入多家车厂实训,并已经获得了车厂超过500台的意向订单。 焦继超表示,今年以来,他与团队成员已经陆续走访了十多家车企,并与对方的负责人进行了深度沟通;这个过程中,他对于车企对人形机器人的需求有了更具体的认识,“车厂本身对于高端制造业的行业规律了解很深刻,所以价格不是他们的首要考虑,反而是要看人形机器人产品能不能在工业场景中真实发挥作用,以及在工作过程中能不能有足够的稳定性、可靠性、安全性等。”这些需求在优必选的人形机器人工业解决方案中都有所体现。 更早的时候,优必选实际已经在人形机器人稳定落地应用方面有过足够的经验。他们的熊猫机器人优悠以及Walker X此前曾经在迪拜世博会中国馆连续稳定服务过6个月,在中国科学技术馆也服务超过两年。焦继超表示,通过这些探索,优必选的人形机器人已经完成了从实验室到应用场景的“0到0.1”阶段;通过在车厂的实训,优必选的下一步是推动人形机器人完成商业化的“从0.1到1”。 实际上,人形机器人工业场景解决方案的用武之地不止于车厂。 这是由于,当下新一代智能制造生产线的全球竞争正拉开帷幕。这其中,如何利用前沿技术提升生产效率是关键。集成了人工智能、高端制造、新材料等先进技术的人形机器人,正是能够在智能制造的进化过程中发挥作用。 与此同时,由于人口老龄化及流动率高等现象,我国的工业制造也出现了用人难的问题。根据人社部、工信部、教育部公布的《制造业人才发展规划指南》,2025年,中国制造业工人缺口将接近3000万。车间一线工人芳动强度大,需要重复动作的组装工、频繁弯腰的分拣工、长时间站立的检验工等一线工人是制造业人力缺口的主体,人形机器人的出现有望弥补这一巨大缺口。 焦继超透露,在优必选的规划中,人形机器人在工业场景的应用将分三步走:首先以新能源汽车制造场景作为切入点,实现在搬运、物料分拣等场景的测试,不断完善硬件的稳定性和可靠性;然后逐步拓展至中等难度任务,重点打造3-5个专用场景下的应用,不断提升产品的性能,逐渐实现规模商业化并降低人形机器人的成本,横向拓展至其它行业及场景;最后进一步拓展到较为复杂的任务场景,成为多任务通用型工业人形机器人。 结语:从落地汽车走向更多实体产业,人形机器人走向专业化 2024年,人形机器人不仅火遍了各大发布会,火到了世界机器人大会,还火到了产学研资的各个圈子。作为我国人形机器人领军企业,优必选率先联合众多企业将人形机器人落地车厂进行实训,推出沉淀而来的人形机器人工业场景解决方案,让人形机器人的这把火更加落地。 爆火的大模型为人形机器人带来了机遇。同时,人形机器人是一个集合软硬件的超复杂系统性工程,需要机器人本体结构设计、高性能一体化关节、计算机视觉感知、语义VSLAM导航等众多技术的协作,才能够发挥更大的能力,在更多实体产业场景中发挥实际价值。 人形机器人出现专业化趋势,意味着其离落地应用更近了一步。落地应用将进一步反推技术迭代,不久的将来随着人形机器人来到家庭,相信拥有一台人形机器人,会像拥有一台手机、电脑一样经济便捷。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。