行业分类:
加载中...
头条分类:
加载中...
DIGITIMES: 台积电2023至2028年CoWoS产能扩充CAGR将超过50%
随着生成式AI模型的训练与推论依赖大量运算资源,提供算力的AI芯片成为关注焦点,而先进制程、先进封装将是实现此波AI芯片加速运算的关键要素。 DIGITIMES研究中心最近发表最新研究《AI芯片特别报告》,指出先进封装成长力道更胜先进制程,在先进封装领域,AI芯片高度仰赖台积电CoWoS封装技术,因此台积电2023~2028年CoWoS产能扩充CAGR将超过50%,而2023~2028年晶圆代工产业5nm以下先进制程扩充年均复合成长率将达23%。 为应对云端及边缘AI芯片强烈的生产需求,晶圆代工业者也加速扩张先进制程与先进封装产能,分析师陈泽嘉以先进制程、先进封装合力并进,AI芯片升级双引擎为主题,对未来几年半导体产业发展进行预估。他指出,未来几年先进封装技术及产能将是AI芯片出货成长的重要因素,而台积电的CoWoS产能扩充更是先进封装产能关键,陈泽嘉预估,在先进封装领域,AI芯片高度仰赖台积电CoWoS封装技术,因此台积电2023~2028年CoWoS产能扩充CAGR将超过50%。 陈泽嘉也进一步指出,未来几年先进封装及先进制程都将维持强劲成长趋势,其中,虽然先进封装成长力道更胜先进制程,但在先进制程部分,陈泽嘉也预估,在2023~2028年晶圆代工产业5nm以下先进制程扩充CAGR也将达23%。 陈泽嘉也提到,为满足AI芯片出货及芯片性能提升的需要,晶圆代工业者正积极推进先进制程和封装技术的发展,包括微影技术、新晶体管结构、背后供电技术(BSPDN)、2.5D/3D先进封装、玻璃载板、共同封装光学(CPO)与硅光子整合等等。 对今年全球晶圆代工产业的表现,陈泽嘉则指出,未来几年仍将维持先进制程成长强劲、而成熟制程因供给扩大而相对趋缓的情况,以半导体下半年需求市况而言,先进制程仍是强劲成长,但成熟制程今年下半年将是旺季力道平缓的情况。陈泽嘉进一步指出,以目前市况观察,即使是2025年,成熟制程市场仍将大致维持今年温和、缓步回升的步调,难以见到强劲的回升表现。
咪咕视频押注奥运会、移动云增速放缓,中国移动怎么了?
不出意外,国内最大的通信运营商——中国移动又交出一份较优异的答卷。 财报显示,2024年上半年,中国移动实现营业收入5467.44亿元,同比增长3%;实现归母净利润802.01亿元,同比增长5.3%。与业绩同时公布的,还有中国移动超500亿元的中期分红。 然而,市场对于中国移动这份答卷并不满意。在中期报告发布后,中国移动股价连续两天下跌,市场也在担心中国移动是否还具备成长性? 1 靠“动感地带”飞速崛起, 如今业绩增速下滑 作为国内最大的通信企业,中国移动的成长史很大程度上也是国内网络通信的扩张史。 1986年,改革开放后不久国内对于网络通信的需求日益增加。在此背景下,国家邮电部电信总局成立全国首个移动通信运营管理机构——移动通信处,1994年在此基础上又成立了移动通信局。 经过改革,国家决定将邮电分开经营,1999年中国电信局一分为四,中国移动得以成立,公司承接了原有电信局移动通信业务。 成立当年,中国移动营业收入便多达351.1亿元,归母净利润为47.97亿元。依托于国内庞大的消费者,中国移动发展极为迅速。2001年中国移动用户便突破1亿人,公司首次入围《财富》世界500强。 进入21世纪,为顺应国内信息化发展浪潮,中国移动将品牌定位从“移动通信专家”转变为“移动信息专家”,而真正让中国移动发生蜕变的还是“动感地带”品牌。 2003年,中国移动针对年轻群体,推出了性价比极高的“动感地带”品牌,并邀请天王巨星周杰伦当“动感地带”首位代言人。 凭借“动感地带”,中国移动快速扩大市场份额,2006年中国移动拥有3.01亿用户,成为全球客户第一的移动通信商。 公司收入从2000年的581亿元,增长至2006年的2806亿元,累计增长率高达382.96%,同期公司归母净利润从180.3亿元增长至661.1亿元,累计增长率为266.67%。 2009年,随着智能手机普及,3G、4G、无线宽带业务为中国移动带来了新的业务增量。 直到2016年,中国移动超越中国联通成为国内第二大移动宽带运营商,宽带用户数达7551万;2018年,中国移动宽带用户数超越中国电信,成为国内第一。 在移动宽带业务及3G、4G网络普及下,中国移动焕发出“第二春”,营收从2010年的4648亿元增长至2023年的1.01万亿元,年平均增长增速仍达到9%左右。 期间,由于各项业务毛利率下降,中国移动利润表现并不出色。很长一段时间内,中国移动归母净利润还在下降。 这也导致很长一段时间内,中国移动在港股的股价处于原地踏步的状态。 直到2021年中国移动归母净利润才开始恢复增长。数据显示,2020年中国移动归母净利润为1078亿元,2023年则为1318亿元,年平均增长率为7.4%。 2024年上半年,中国移动营业收入和归母净利润虽然仍在增长,但增速却在放缓,营业收入及归母净利润分别增长3%及5.3%,增速较前几年有所下滑。 图 / 中国移动2024年半年报(单位:百万元) 该业绩报告出台后,引起市场担心,公司董事长也正面回应了公司业绩增速放缓的原因,公司董事长杨杰认为,目前中国移动处在转型升级中,还需要时间。 此后两天,中国移动股价连续两天累计下跌3.66%,直到8月13日才有所企稳。截至8月15日,中国移动报收104.94元/股,连续3日呈上涨趋势。 对于中国移动而言,目前已经来到公司发展的瓶颈期,能否平稳度过目前的难关,推动企业业绩增速再度向上,「界面新闻·子弹财经」将持续保持关注。 2 咪咕视频押注体育赛事, 月活较爱奇艺差距较大 从收入来看,中国移动营业收入增速下滑与其无线上网业务收入下降有很大关系。由于国内移动数据流量见顶,作为国内最大的移动运营商,其相关业务收入也受到较大影响。 2024年上半年,中国移动无线上网业务收入为2050.64亿元,同比下降3.17%。传统业务不景气,中国移动也在着力发展新型业务。 图 / 中国移动2024年半年报(单位:百万元) 例如,中国移动花重金打造的数字内容业务。据悉,中国移动开展数字内容业务主要由旗下全资子公司咪咕文化科技有限公司(以下简称“咪咕文化”)所开展,该公司最为大家熟知的产品便是咪咕视频。 与爱奇艺、腾讯视频相类似,咪咕视频也是一款长视频平台。与爱奇艺、腾讯崛起依靠综艺、电视剧不同,咪咕视频的崛起主要依靠体育转播。 从2018年开始,咪咕视频便花重金投入体育转播。2018年期间,有43亿人次通过咪咕视频观看俄罗斯世界杯,彼时由于转播经验不足,咪咕视频出现卡顿、视频不清晰等问题。 但这也为咪咕视频体育转播奠定了基础,且依靠母公司中国移动,咪咕视频在资金及资源上有得天独厚的优势。 随后,咪咕视频与中央广播电视总台合作,获得了2020年东京奥运会、2020年欧洲杯、2022年北京冬奥会及2022年卡塔尔世界杯四个大型赛事的转播权。 此后,咪咕视频又陆续拿下了NBA、CBA、中超、法甲、西甲、德甲、英超等14个大型联赛体育赛事的转播权,几乎涵盖了国内外足球、篮球的主流赛事。 依靠旗下数量众多的体育赛事,咪咕视频月活用户数逐步增多,根据月狐IAPP数据,2020年东京奥运会及2022年世界杯期间,咪咕视频月活用户数量突破3000万人次,非大型体育赛事期间,咪咕视频用户数量也在2000万人次左右。 需要注意的是,虽然咪咕视频下重金布局体育赛事,但相较于影视剧,体育赛事受众仍然较为小众,且受众人群固定,让咪咕视频月活人数很难有爆发式增长。 月狐IAPP数据显示,2018年至2023年,咪咕视频月活人数均维持在2000万至3000万人次左右,没有明显增长,作为对比,截至目前爱奇艺及腾讯视频月活用户数均在4亿人次以上。 除视频外,咪咕文化还积极布局云游戏,咪咕音乐等。在中国移动重金支持下,这几类业务发展较为顺畅,共同构成了中国移动的数字内容板块。 数据显示,2023年中国移动全年数字内容收入达到人民币280亿元,同比增长31.6%。2024年上半年,公司数字内容收入达到人民币145亿元,同比增长11.3%,但这一增速较以往出现了明显的下滑。 咪咕文化要想继续高增长,仅靠大型体育赛事带来的收入显然不够,从东京奥运会,世界杯等赛事结束后情况来看,短暂的收入增长很难让咪咕视频收入持续增长,唯有丰富影视剧、综艺等产品才有可能让咪咕文化继续突围。 3 移动云收入增速骤降, 战略性业务难突围? 除数字文化内容外,中国移动转型升级重点则放在云计算上。 2017年,国家明确提出要建设“数字中国”,自此国内云计算开始大爆发。2019年,中国移动开始布局云计算业务,公司将移动云设定为最为重要的战略性业务。 布局当年,移动云便为中国移动带来19亿元收入,为了抓住“数字中国”带来的机遇,中国移动在云业务上投入也不遗余力。 2023年在移动云大会上,中国移动董事长杨杰表示,过去三年中国移动在云基础设施累计投资超900亿元,推出了200款自有产品。 由于基础设施完善,加之央企这块金字招牌,移动云在政务云建设上如鱼得水。据悉,中国移动承建了全国一半以上的省级政务云。 在政策支持及中国移动重金投入下,移动云收入也在爆发式增长。 2023年,移动云实现营业收入833亿元,较2019年增长超43倍。移动云爆发式增长也是中国移动过去几年业绩持续增长的核心原因。 令人担忧的是,过去几年狂奔的移动云似乎慢了下来。 2024年上半年,移动云收入为504亿元,同比增长19.3%。虽然公司移动云业务仍在增长,但与前几年动辄100%增速相比,仅19.3%的收入增速显得弱了不少。 移动云收入增速放缓,与行业整体遇冷及价格战有很大关系。受到经济不确定性的影响,不少企业减缓了数字化转型投入,加之云计算经过多年发展,渗透率逐年提升,目前已经进入相对饱和的阶段,行业增速下滑也是必然现象。 图 / 摄图网,基于VRF协议 此外,阿里云、华为云甚至最近几年崛起的京东云也在疯狂抢占云计算市场。 以阿里云为例,为了获取更多市场份额,2月29日,阿里云宣布,全线下调云产品官网价格,平均降价幅度超20%,最高降价幅度达55%。同一天,京东云宣布在阿里云最低实际成交单价的基础上,再便宜10%。 移动云的优势更多在政务云层面,在企业方面,移动云很难通过价格、服务、技术等方面压制阿里云等竞争对手,想要获取更多的市场份额,难度不言而喻。 对于中国移动而言,传统的无线上网业务遭遇增长瓶颈,收入出现下滑。被寄予厚望的云计算业务在行业遇冷及竞争对手夹击下,收入增速出现下滑,而高速成长的咪咕视频由于体量较小很难对中国移动整体业绩形成助力。 面对眼下困境,中国移动如何突围,非常考验管理层的智慧。
富士康:迄今已在印度投资100亿美元,计划2025年加大投资
富士康董事长刘扬伟周六(17日)表示,富士康迄今已在印度投资100亿美元,并计划在明年加大投资。在此次访问期间,他与多位印度首席部长会面。 刘扬伟称:“截至去年,我们已经投资100亿美元,明年将投资更多。在访问了印度这么多邦之后,我感到印度正在崛起。富士康希望成为其中的一部分。我们将与印度共同成长。” 他在富士康工厂附近的女性专用住宅区落成典礼间隙发表了上述讲话。 刘扬伟周三会见了印度总理纳伦德拉·莫迪,讨论了富士康在泰米尔纳德邦、卡纳塔克邦和特伦甘纳邦的投资。 访问期间,刘扬伟还会见了三邦首席部长和邦内阁部长。 该公司的女性专用住宅区由泰米尔纳德邦首席部长 MK Stalin 揭幕。 在揭幕仪式上,刘扬伟坚称,公司招聘员工时不分性别,但在印度,女性特别是已婚女性,为公司的发展做出了巨大贡献。 同时,富士康在印度的各类招聘呈上升趋势。 最近,富士康面临歧视已婚女性的指控。一份报告称,其不愿在印度雇用已婚女性。 富士康否认了这份报告,并表示其新员工中有 25% 是已婚女性。 该公司当时表示,富士康工厂约有 70% 的女性和 30% 的男性,泰米尔纳德邦工厂是该国最大的女性就业工厂。 目前,富士康在印度拥有约 48,000 名员工。
首次透露商业化进展,智元机器人称发货量已超300台
凤凰网科技讯(作者/徐珍 编辑/董雨晴) 8月18日,时隔一年,由知名科技区Kol、前华为“天才少年”稚晖君(彭志辉)创办的人形机器人企业智元机器人,终于迎来第二次上新。 相较去年同期发布第一代产品远征A1,今年智元扩充出了“远征”和“灵犀”两大产品线。 智元联合创始人彭志辉“稚晖君” 发布会上,除了第二代拳头产品“远征A2”,智元还一并亮出了柔性智造机器人“远征A2-W”、重载特种机器人“远征A2-Max”,以及由智元X-Lab孵化的模块化机器人系列产品“灵犀 X1”“灵犀 X1-W”。 据官方阐述,远征系列面向企业级应用市场,视不同合作模式而做不同定价;灵犀系列则为满足极客们极致创新和敏捷探索的需求而设立,承载着智元“人形机器人人人造”的愿景。 尽管两系列产品都未公布明确售价,商用落地始终是智元想要强调的重要命题。关于量产进度,智元机器人透露最新进展为,预估2024年发货量为300台左右,其中双足人形机器人发货量为约200台,轮式人形机器人为约100台。 在会前沟通环节,智元机器人合伙人兼营销服副总裁姜青松分享道,智元内部有一个“沿路下蛋”的策略,即在技术研发的同时,也会推出诸多能够满足一些商用场景的中间态产品,逐渐向更成熟的产品目标过渡。 他还透露,今年上半年,智元产品在部分3C半导体企业的上下料环节中,迈出了商业化的第一步。 至于具体的落地场景选择上,智元则采用“PPT”策略,即Pick Place and Transport,在涉及拿、放和转移动作的应用场景中进行突破。 除了上述具体产品,本次智元还对标自动驾驶的L1-L5标准,发布了具身智能G1到G5技术路线图。 稚晖君称,过去一年,智元机器人在G2路线取得了阶段性突破,实现了通用的位姿估计模型UniPose、通用的抓取模型UniGrasp,通用的力控插拔模型UniPlug等一系列zero-shot和few-shot的通用原子技能。 在G3路线上,智元机器人也已形成了一套完整的全流程具身数据方案AIDEA(Agibot Integrated Data-system for Embodied AI,智元具身智能数据系统)。 为了促进人形机器人生态发展,本次发布会上智元机器人还宣布了一系列开源计划,包括:智能机器人高性能通信框架AimRT将于9月底开源,由X-Lab孵化的灵犀X1将于9月份陆续全栈开源,同时预告了基于AIDEA的百万条真机、千万条仿真数据集将在今年四季度开源。
前东方甄选CEO孙东旭项目夫妇再向11名学生资助3.84万元
三言科技 8月18日消息,据“岳西县慈善协会”消息,8月6日,县慈善协会举行孙东旭项目夫妇奖助金发放仪式,县慈善协会负责人出席并讲话。仪式上向11名受助学生发放2024(7-12月)奖助金3.84万元。 据了解,这并非孙东旭项目夫妇首次资助学生。 2023年1月4日,“岳西县慈善协会”在《岳西县慈善协会2022年慈善公益活动盘点》一文中提到,爱心人士孙东旭、项目夫妇从2014年开始结对资助我县贫困学生,到2017年已增至10名,每学年分别给予4800元、6000元和7200元的资助。今年有3名学生大学毕业,按照他们夫妇意愿,及时递补了3名贫困学生。县慈善协会分别于1月24日和 8月2日两次向受助学生发放奖助金共6.6万元。2014年以来,孙东旭项目夫妇共连续资助了18名学生,累计发放奖助金40.58万元。 2023年2月2日,“岳西县慈善协会”发文表示,1月20日,县慈善协会在县民政局会议室举行孙东旭项目夫妇奖助金发放仪式,项目女士及县民政局、县慈善协会负责人出席并讲话。仪式上,项目女士与岳西县慈善协会签订了慈善助学协议,向10名受助学生发放奖助金3.3万元,受助学生和家属代表致词感谢。2014年以来,孙东旭项目夫妇共连续资助了18名学生,累计发放奖助金43.88万元。 2023年8月17日,“岳西县慈善协会”发文表示,8月17日,县慈善协会举行孙东旭项目夫妇奖助金发放仪式,县慈善协会会长方国安出席并讲话。仪式上,向10名受助学生发放奖助金3.3万元。 今年1月31日,“岳西县慈善协会”发文表示,1月30日,县慈善协会会长方国安向孙东旭项目夫妇资助的10名学生发放2024(1-6月)奖助金3.3万元。
SK电信与Rebellions合并:打造价值7.4亿美元AI芯片巨头 挑战英伟达
随着全球AI竞争加剧,韩国正在加足马力,欲在全球AI芯片市场开辟新天地。 近日SK电信的人工智能芯片部门Sapeon Korea与半导体初创公司Rebellions正式签署了合并协议。根据两家公司发布的联合声明,此次合并预计将形成一个企业价值超过7.4亿美元的新实体。Rebellions的联合创始人兼Sunghyun Park将担任合并后公司的管理层领导职务,而SK电信则将以战略投资者的身份支持新公司的扩张计划。早在今年6月,这两家公司就已宣布了合并意向,此次正式协议的签署标志着合并进程的进一步推进。 AI初创公司Rebellions成立于2020年,曾于2023年推出其首款NPU芯片ATOM,也是韩国本土开发的首款用于数据中心大语言模型(LLM)的NPU,并于今年投入量产。而Sapeon公司成立于2022年,于2023年11月发布了新一代X330 AI芯片,同样面向数据中心,采用台积电7nm制程工艺制造。X330芯片有两种型号:X330 Compact拥有367TFLOPs的计算能力、集成16GB内存;X330 Prime拥有734TFLOPs算力,集成32GB内存。 两家公司背后都有韩国科技巨头的支持,其中,前者与三星、KT 和Kakao结盟,后者由韩国最大电信公司SK电信分拆而来。 合并后的公司将寻求通过NPU获得强势地位,Rebellions将负责管理合并后的实体。手握三星与SK两大韩国财团,新公司的目标也非常明确:挑战全球AI芯片领导者英伟达,在全球AI芯片市场占据一席之地。
AI爆料人遭全网封禁!OpenAI等25个机构祭大招,一眼辨别AI机器人
新智元报道 编辑:桃子 乔杨 【新智元导读】AI智能体遍布整个网络,未来如何防止被骗?如何保护隐私?OpenAI微软MIT等25个机构联手提出「人格凭证」,可以证明自己是真人,还不用披露任何个人信息。 最近半个月,全网竟被一个OpenAI的「AI爆料人」愚弄了。 听到「草莓哥」@iruletheworldmo账号,想必每个人都很熟悉,而且时不时就会刷到他的爆料帖子。 直到这周三,所有人没有等来他预测的GPT-4o large模型,反被AI初创MultiOn创始人揭穿了身份—— 「草莓哥」就是一个AI智能体。 一时间,全网许多平台发起禁止「草莓哥」的相关转帖。 Reddit子板块r/singularity中,已置顶禁止全员提及相关内容 甚至有的人直接「屏蔽」了@iruletheworldmo。 真正的OpenAI爆料人Jimmy Apples也曾对AI智能体说的话信以为真 随后,这个AI智能体还发起了在线投票——我是否通过图灵测试,没想到竟有一半多的人给出了肯定的回答。 而这仅仅是一个AI。 小扎曾说,「未来每个人都将拥有一个AI助理,很快就会有数十亿AI智能体代表我们上网」。 如果未来某天真的实现了,人们将如何一眼辨别某个社交媒体账号,是不是机器人?如何证明自己「真人」身份,而不用提交任何个人信息? 来自OpenAI、微软、MIT、UCB等25个机构的学者们共同提出了一种验证技术——「人格凭证」(Personhodd Credentials, PHC)。 PHC可以在保护用户隐私的同时,在网络上证明「你是你」,是一个真实存在的人类而非AI。 微软首席科学家幕僚长表示,「在保持隐私的同时,在网上建立人类身份,是AI时代的决定性挑战之一」。 另一位网友表示,这项研究出现得很及时,简直发人深省。 为什么这么说? 30亿人数据泄露,隐私保护无解? 除了开篇「草莓哥」的案例,最近,近30亿人数据泄露,席卷了整个美国,堪称史上最大数据事件事件之一。 这其中,涵盖了详细的居民个人信息,比如姓名、电子邮件、地址、电话、社保号、邮件地址。 更恐怖的是,地址数据可以追溯到30年前,就连去世20多年的亲属信息,都能被挖出。 因此,一直以来,匿名是许多注重隐私的人们,采取保护自己的措施。 但有时,一些重要的验证,不得不将自己的个人信息交出去。 当前,越来越强大的AI不断涌现,不法分子欺诈、传播虚假信息的手段更加隐蔽,随随便便就能扩展到更大的传播规模。 而且,AI门槛、成本的降低,获取更加容易。 随着AI生图/视频/声音越来越逼真,比如在约会App上,你如何确定对方就是真人? 当前存在的解决方案,比如验证码,显然不够用, 这也意味着,传统的人机验证方式,正在走向失败。 毕竟,AI在图像识别等领域的进步,这种方法变得越来越不可靠。 而现在,极需要找到一种平衡,既能有效防止AI欺骗,又不会过度牺牲用户的隐私和互联网的包容性。 这也是,OpenAI、微软等机构的研究人员,希望通过研究最终在实际应用中,看到的效果。 证明你是人,而非AI 正如研究员Steven Adler所述,隐私保护工具「人格凭证」(PHC),可以证明你是一个人,但不会揭示「你是哪个人」。 具体来说,「人格凭证」由两个AI无法伪造的元素支持: 「现实世界的验证」和「安全的加密技术」。 也就是,无论AI变得多么好,都无法逃脱这两点。 总之,PHC就是一种数字凭证,可以让用户向在线服务证明,自己是真人并非AI,而且还不用披露任何个人信息。 这种凭证,可由一种可信机构,比如政府去颁发。 而且根据作者的定义,PHC可以是本地的或全球的系统,不一定基于生物识别技术。 AI智能体充斥全网,防骗最新策略 论文的两位合著者Nouran Soliman和Tobin South是MIT的两名在读研究生,他们最近在MIT News的采访中简要介绍了这项技术,讨论了其必要性、风险,以及如何以安全、公平的方式应用PHC。 「人格凭证」的必要性 虽然一提到AI,很多公众讨论的话题都是ChatGPT这样的聊天机器人,但人工智能的能力显然不止于此。 互联网上的AI参与表现出两种特性:不可区分且可扩展,这促使AI驱动的欺骗行为持续增长。 AI可以在社交网络上创建帐户、发布虚假内容、伪装成人类,或通过算法大规模放大某些内容,甚至进行大规模攻击,这释放了很多风险。 这会改变我们浏览社交媒体的体验,区分复杂的AI和人类也变得越来越困难,类似于未经同意的「数字替身」问题。 「人格凭证」则提供了一种潜在的解决方案,比如用于过滤网络内容、决定接收信息的信任级别。 什么是人格凭证?如何确保安全性? 正如之前所述,「人格凭证」可以证明你是人类,但无需透露任何有关你身份的信息。 作者表示,无论AI有多么先进,都无法做到两件人类能做到的事——获得离线的现实世界中的证件,以及伪造或破解先进的加密系统。 因此,「人格凭证」结合了这两个想法——通过密码学实现的安全性,以及人类仍然拥有AI所不具备的一些能力,从而真正有力地证明你是人类。 要获得「人格凭证」,用户需要与政府发生关系,比如税号或者驾驶证,而且必须有线下参与的成分。 通过隐私技术,用户可以证明这一事实,而无需共享任何有关身份的敏感信息。 「人格凭证」的实现会比较容易,它依赖的基础设施和安全技术已经存在了数十年,例如使用邮箱账户等标识符来登录在线服务。PHC可以作为这些现有方法的补充。 但是,用户使用「人格凭证」应该是一种可选项而非必选项,服务提供商可以让人们选择是否使用。 作为可选项就意味着,我们还无法做到让用户只与真实的、经过验证的人类进行在线互动,完全排除AI在互联网上的参与。 但是在网购或者交易协商这类的场景中,想要确保另一方是人类实体,「人格凭证」就可以派上用场。 有哪些风险?如何降低这些风险? 其中一项风险来自于如何实施。如果一个特定实体是「人格凭证」唯一的发行人,或者系统的设计方式是将所有权力赋予一个实体,这可能会引起一部分人对于权力过于集中的担忧。 如果你处在一个很艰难或危险的社会政治环境中,被要求去某个线下地点才能获得人格凭证,这会比较可怕,而且阻碍了人们在线上分享信息。 一个可能的解决方案,是设置多个「人格凭证」的发行方。 我们的论文试图鼓励政府、政策制定者、领导者和研究人员投入更多资源,研究不同的实施方向,并探索这项技术可能对社区产生的更广泛影响,确保能制定正确的政策和规则。 AI的发展速度非常快,远快于政府适应的速度。因此,政府和大公司现在就应该开始考虑调整数字系统,以便准备好证明某个用户是人类,同时做到保护隐私和安全,这样我们才能为AI更先进的未来做好准备。 技术介绍 「人格凭证」这项技术究竟如何实现?这篇63页的论文能够给出我们非常详尽的答案。 论文地址:https://arxiv.org/pdf/2408.07892 首先,「人格凭证」以数字方式存储在持有者的设备中。为了保证可信度和隐私,PHC系统需要满足两个前提: - 每个人只能持有一份「人格凭证」,需要定期重新验证,以防被盗用 - 持有PHC的用户与与服务提供商进行匿名交互。即使PHC发行商和服务提供商串通,也无法追踪用户的数字活动,更不能将用户在各个平台上的活动连接在一起。 PHC系统的注册和使用流程如图3所示: 用户提出请求后,只需向发行方提供最少量的必要信息。发行方负责验证是否为人类,并确定用户之前没有在此注册过PHC。此外,发行方有撤回或恢复PHC的权利。 用户在使用第三方数字服务时,可以提供PHC并经过「零知识证明」,即可完成身份验证。 除了PHC之外,服务提供商不能获取其他额外信息。每次证明仅限于特定应用程序,因此不同平台无法通过PHC链接到同一个用户。 论文提出,为PHC系统设计多个发行方是比较理想的实施方案。用户可以从多个发行方中任意选择来注册PHC,但每个发行方只能获取一份证书,在减少大规模欺骗行为的同时保证用户隐私。 这种PHC系统有3方面的预期优势: - 减少「傀儡」用户的影响,实现真实人类的在互联网上大规模的真实输入和参与 - 缓解机器人攻击 - 让AI助手真正成为值得信赖用户的代表,而非被恶意用户操纵 与此同时,要让PHC以公平、安全的方式在现实生活中实施,还必须面对以下4个方面的挑战: 公平获取 频繁的PHC验证可能导致使用过程中的摩擦和挫败感,影响对技术不熟悉的用户,尤其是老年人的使用。还需要确保没有PHC的用户依旧可以使用数字服务。 自由表达 用户可能会担心PHC将他们的数字活动与线下真实身份相关联,从而降低在网络上表达真实观点的意愿。 权力检查 PHC生态系统面临的一项重大挑战是权力集中于少数机构,尤其是PHC发行者和大型服务提供商,他们有关PHC使用的决策将产生重大影响。 抵御攻击和错误的稳健性 与任何数字系统一样,PHC系统容易受到多方面的攻击和利用,比如证书发行方、服务提供商和恶意用户。可以考虑使用网络安全领域先前的最佳措施,比如DoS防御,以及阻止攻击者访问敏感记录。 论文的最后,作者提出了下一步应该采取的措施。 首先,适应现有的数字网络体系,为人工智能的影响做好准备。 更具体地说,我们要重新思考,AI将如何改变互联网和通信。 其次,优先考虑将「人格凭证」作为亟需解决的一种方案。 最后一张图,总结了这篇论文的所有要点。 值得一提的是,为了防止互联网平台以「实名制」为由过度收集信息,公安部和网信办最近推出了「网络身份证」。 只需要一部有NFC功能的手机,进行身份证识别和人脸识别并关联手机号之后,就能得到一张虚拟的「网络身份证」。 上面的「网号」由字母和数字组成,不含明文的身份信息,可以直接用于淘宝、微信等app的实名认证,不需要再输入姓名、身份证号等信息。 在保护个人隐私方面,大家觉得有什么更好的解决方案?
OpenAI“权力游戏”未完,四名领导层新星入局,竟有一半是华人
新智元报道 编辑:编辑部 【新智元导读】OpenAI接二连三的核心高层人事发生变动,乱世出英雄,一批后起之秀扛旗。 自从2023年11月奥特曼被罢免又复职以来,OpenAI内部貌似权力斗争不断。 最近,多位高管相继离职,据金融时报报道,OpenAI最初的11位联合创始人,但目前只有两位仍在OpenAI任职。 除了奥特曼,仅剩波兰计算机科学家Wojciech Zaremba仍留在OpenAI担任研究员。 一直与奥特曼并肩作战的OpenAI总裁兼联合创始人Greg Brockman将延长休假时间直至今年年底,外界普遍认为这是其即将离职的前兆。 而另一位联合创始人John Schulman则永久离职,加盟竞争对手Anthropic。消费者产品副总裁Peter Deng也离开了OpenAI。 据统计,OpenAI已有近75名核心员工离职,创立了约30家AI初创公司。 OpenAI俨然已成为AI行业的「黄埔军校」,其前员工凭借在公司积累的经验和人脉,纷纷自立门户。 虽然这种人才输出对整个行业发展有利,但对OpenAI自身而言无疑是巨大损失。 新秀接棒 虽然人才出现流失,OpenAI也在持续重金挖人和提拔人才,已经有其他人站出来接管职位空缺。 这种情景,让人不禁感叹:《权力的游戏》就发生在现实中,「混乱是上升的阶梯」。 根据与前任和现任员工及其他内部人士的对话,以下是OpenAI新一批领导者的情况。 Jakub Pachocki——接任Ilya的「天才科学家」 Jakub Pachocki现任OpenAI首席科学家,也是自2017年以来便在OpenAI工作的老员工。 从Pachocki的过往经历,以及他在OpenAI内部如同坐火箭一般的升职速度来看,他足以担得起「天才科学家」的称号。 加入OpenAI前,Pachocki仅用3年就从CMU获得了博士学位,并在哈佛大学进行了为期7个月的博士后研究。 入职后的前5年半时间内,Pachocki分别领导过Dota、推理和深度学习科学团队,都属于OpenAI的变革性研究计划。 他在OpenAI开发Dota 2游戏机器人的过程中发挥了关键作用,该机器人通过不断自我对战,最终达到了职业水平。 从2021年开始,Pachocki升任研究负责人、研究总监等职位,是开发GPT-4和OpenAI Five的带头人,因在大规模强化学习和深度学习优化等方面的研究贡献而受到赞扬。 奥特曼对他不吝溢美之词,将Pachocki形容为「无疑是我们这代最伟大的思想家之一」,「负责管理我们许多最重要的项目」。 对于Pachocki在GPT-4项目中的贡献,奥特曼曾有过这样的评价:「Jakub Pachocki所展现出的卓越领导力和技术远见是非常了不起的。如果没有他的贡献,我们无法取得今天的成就」。 在此前的MIT采访中,Pachocki将开发GPT-4这样的语言模型比作「构建宇宙飞船」——必须确保每一个部件都完美无缺。 他还提到,自2018年第一个版本发布以来,GPT模型的基本构建方法并没有太大变化。 今年5月Ilya Sutskever 离职后,Pachocki正式接任首席科学家一职。 据现任和前任员工称,Pachocki在晋升之前就已经影响力日增。 奥特曼十分看重Pachocki,之前就曾越级给他分配和Ilya类似的任务,尽管按道理来说,Pachocki得向Ilya汇报工作,这导致了两人之间关系紧张。 在去年11月的「宫斗风波」中,Ilya和董事会成员Helen Toner共同发起了「驱逐奥特曼」的行动,但Pachocki并没有跟随Ilya,坚定站在了支持奥特曼的阵营中。 然而,在Ilya官宣离职时,Pachocki所发的推特依旧表现出了对这位前辈的尊敬和仰慕之情。 Ilya将我带入了深度学习研究的世界,多年来一直是我的导师和伟大的合作者。他对深度学习的令人难以置信的愿景是OpenAI和人工智能领域今天的基础。我非常感谢他与我们进行了无数次对话,从有关人工智能进步未来的高层次讨论,到深入的技术白板会议。Ilya——我会想念和你一起工作的。 员工们表示,Ilya离职之后,Pachocki获得奥特曼力挺,已成为公司内的重要决策者。 Pachocki出生于波兰,本科毕业于华沙大学计算机科学系,不仅只用3年就拿到了学士学位、在Facebook有过两段实习经历,而且高中和大学期间曾多次参与编程比赛。 Jakub Pachocki(左三)在ICPC 2012比赛中 根据编程名人堂的统计信息,2011和2012年,Pachocki代表华沙大学两次出战ACM-ICPC世界总决赛,并在第二年获得了金牌。 个人赛方面,Pachocki的表现同样惊艳:高中时期就在IOI中拿到了银牌,并多次在Topcoder和Facebook、谷歌主办的编程竞赛中获得奖牌。 其中,最好成绩是2012年谷歌Code Jam竞赛中斩获金牌,奖金1万美元。 他曾在采访中提到,谷歌 Code Jam这类编程竞赛更类似于数学作业或解逻辑题,要想获胜需要极高的认知能力。 Barret Zoph 联合创始人John Schulman离职前,曾和他唯一的直接下属Barret Zoph共同领导后训练团队。 据一位员工称,之前Schulman在职时负责设定高层次议程,Zoph则负责团队的日常管理和研究工作,确保项目按时完成,让基础模型可以被顺利部署到ChatGPT等产品,以及面向开发者的API中。 Zoph在OpenAI内部颇受尊重,如今顶头上司离职,他也顺理成章成为团队的唯一负责人。 Zoph本科毕业于南加州大学。大学期间期间,他就进入学校信息科学研究所(USC Information Sciences Institute)的自然语言小组,与两位教授,Kevin Knight和Daniel Marcu一起从事统计机器翻译工作。 本科毕业后,Zoph就进入Google Brain,以研究科学家的身份工作了6年8个月,致力于训练大语言模型并将其应用于各种应用程序。 在Google Brain期间,Zoph的学术成果颇丰。谷歌学术显示,他的论文总引用量已达到62284次。 2022年8月,Zoph从Google Brain离职,加入OpenAI参与打造ChatGPT,主要研究方向为训练大型稀疏语言模型和AuoML,如神经结构搜索(NAS)。 在OpenAI的5月发布会上,Zoph上场演示了GPT-4o的实时视觉功能,让GPT-4o通过手机摄像头实时解决数学问题。 Mark Chen Mark Chen从2018年起加入OpenAI时就开始担任前沿研究主管,在研究副总裁Bob McGrew领导下负责一个工作组。 Chen同样很早就展现出了非凡才能,在AMC10、AMC12、AIME等数学竞赛中接连拿下满分,这为他进入MIT铺平了道路。 从MIT毕业时,Chen获得了数学与计算机科学的双学士学位,大学期间曾在微软、Trading实习,并在哈佛大学做过访问学者。 本科毕业后,Chen进入金融领域从事量化研究工作,为股票和期货交易构建机器学习算法。 在最后一家公司Integral Technology,Chen已经做到了合伙人级别。 目前,他还担任美国IOI集训队的教练。 果然,数学好的人干什么都是得心应手。 安息吧,Jim Simons。 你用亲身实例证明,真正擅长数学对几乎所有其他事情都有积极的影响。 Chen在OpenAI专注于多模态建模和推理研究。他领导了创建DALL·E的团队,以及将视觉感知融入GPT-4的团队。 Chen还领导了Codex的开发,并为GPT模型的进步做出了贡献,包括图像GPT的开发,是GPT-4o 17人金牌团队的一员。 在今年5月的发布会上,Chen同样上台展示了GPT-4o的语音功能。 Chen的影响力在去年11月的「宫斗风波」逐渐凸显。据一位前员工称,当时,Chen与Barret Zoph,以及后训练研究员Liam Fedus是领导层与员工之间的主要联络人。 例如,这三人传达了员工支持奥特曼的联名信件,成为推动奥特曼复职的关键一环。信件中多数员工表示如果奥特曼不复职,他们将加入微软。 Lilian Weng Lilian Weng现任OpenAI安全系统负责人,主要从事机器学习、深度学习等研究 。 Weng本科毕业于北京大学信息系统与计算机科学专业,曾前往香港大学进行短期交流,之后在印第安纳大学布鲁明顿(Indiana University Bloomington)分校获得博士学位。 博士期间,Weng的研究领域为复杂系统和网络,关注社交媒体、社交游戏、人机交互和复杂信息网络建模。 打开她的谷歌学术档案,还可以看到Weng曾经发表的关于模因和社交网络的论文。 她曾在eBay、Mozilla等公司做过用户分析方面的实习,之后「转行」成功,进入Facebook和Dropbox从事软件工程和数据科学方面的工作。 2018年起,Weng加入OpenAI担任研究科学家,作为机器人团队的技术主管,专注于训练机器人任务的算法。 之后Weng还领导过应用人工智能的研究团队,目前是安全团队领导人。 今年7月,OpenAI将之前的安全团队负责人Aleksander Madry调任至一个专注于推理基础工作的团队。有知情人士称,原来Madry领导的安全团队转由Lilian Weng负责。 现在,Weng将同时管理专注于长期和短期AI安全的团队,这一组织决策令一些研究人员担心,因为长期和短期安全的激励措施可能会相互冲突。 值得一提的是,Weng在个人网站上撰写的博客文章非常受欢迎,基本都是万字长文,既有技术干货又有观点输出,是很多业内人士的参考。
讯飞拍了拍Kimi说,“起来卷”
出品|虎嗅科技组 作者|余杨 编辑|苗正卿 头图|视觉中国 8月12日消息,科大讯飞发布了讯飞智文2.0版本的智能文档AI助理,一键生成PPT的升级版。 5月底,我在清华大学参加了由软银创投合伙人主讲的讲座。会上,人工智能的相关话题引发了热烈的讨论,主讲人不无揶揄地diss到当前AI PPT的生成质量,内容大致是:本想偷个懒,奈何不够聪明,最后只能自己动手。 7月30日,Kimi也上线了做PPT的功能。目前已发布AI PPT应用的包括Gamma、天工AI、腾讯文档、WPS、百度文库等等,琳琅满目。社交媒体上也从内容相关度及质量、设计美观与模板多样性、产品体验与性价比等几个不同维度对一众AI PPT进行了测评。 大模型相继从聊天机器人、图像生成、视频生成等领域卷到了PPT等文档操作的基本面。 但不得不说,该卷。 毕竟,“干得累死累活,到头来干不过写PPT的”传唱已久,经久不衰,无论是社畜还是大学生,天下苦PPT久矣。 PPT的受众群体,远比AI生图、AI生视频刚需得多。 一个优秀的PPT,其结构、内容、设计、排版每一步都需要投入大量时间和精力,其产出又常常与产品营销效果、述职晋升答辩直接挂钩。 这类PPT,AI生成基本只能起到辅助作用,有生长空间的功能集中在打结构、排版设计等方面,因而可修改性就显得非常重要。 当然,也有一些场合,PPT提供得更多的是框架、逻辑或氛围感,配合上文生图,AI大有可为。 讯飞智文2.0的升级官宣文中,主打的是3个功能的提升: 一是用户在“主题创建”中输入一句话主题,再勾选联网搜索功能,简单输入关键词,大模型就可以实时自动抓取最新的资料,并宣称能够精准解析最长12000字的文本内容。 二是AI PPT编排创作引擎,智能编排,一键美化,简单来说就是设计和模板。 三是PPT在线编辑模组,开放了自由编辑权限,可以个性化调整元素位置和整体结构。 Kimi的PPT功能也上线不久,主打的是: 1.上传文档/多文档,一键转换PPT。 2.根据一句话指令,搜罗信息、生成 Power 也有Point的内容大纲;再根据大纲,一键生成 PPT。 官宣文中还场景化了大厂HR、marketing、述职码农、学生、教师等角色的使用。 话不多说,咱直接实际体验一下。 我将用讯飞、Kimi和好评收割机Gamma帮我做1个round的PPT,看看各家所长和综合性价比。 Round1:我是一个烘焙师,要主讲一个制作意式恰巴塔面包的培训分享会,请帮我生成一个图文并茂的教学ppt。 然后我将从内容相关度及质量、设计美观与模板多样性、产品体验与性价比3个维度进行评分。 (接下来的内容是Kimi、讯飞智文、Gamma生成ppt的过程细节,着急的朋友也可直接下拉到打分环节看总评) Kimi 首先是Kimi,生成大纲耗费40秒,然后跳出页面让我选模板(随便选,后面有编辑页面可以改)。 点击-生成PPT,经过20秒的等待我拿到了13页PPT预览,一共由历史文化、制作技巧、烘焙工艺、创意搭配5节组成。 然后去编辑,左边功能区可以自由改大纲和模板,右边可以改ppt里的模块设计。 输出方面,可以生成拼图,也可以下载为ppt或pdf。 15秒之后,我拿到了13页ppt格式的文件,兼容wps可以自由修改。 讯飞智文 然后是讯飞智文2.0,我直接复制了主题内容。 15秒之后,我拿到了7节大纲,可以选择重新生成大纲或直接自行修改。 和kimi一样接下来是选模板,但经过筛选之后,可以看出讯飞提供的模板数量就非常有限,当我选择“清新”风格时,甚至“没有数据显示”。 然后开始生成,2分45秒之后,我拿到了8节35页的ppt,分别从历史起源、基本食材、面团步骤、工艺技巧、烘烤技术、创新改良、互动答疑、培训建议等几个方面展开。 和kimi一样,模板可以更改,功能操作区更加详细,另外多了演讲备注的功能。 值得一提的是,讯飞给我配了面包的图,还不止一张,虽然它显然对恰巴塔的概念不深。 当我准备下载的时候,我就该付费了,好在有无限卡可以使用。 Gamma 最后是Gamma,支持选择卡片数量和36种语言,10张及以下卡片是免费的。 5秒之后,我的8页大纲完成了,也是可以增删更改的,功能区可调整文本内容和图片,文本可调整受众群体和语气,图片也可以选择互联网搜图和ai生图,风格和模型也可选择。 如果继续,则要耗费我40积分(我的免费试用初始积分是400)。 选择继续,跳到了选择主题的界面。 17秒左右我就获得了8张ppt,部分模块还在联网加载,约30秒我get了完整的ppt。 可以看到,图文相关度极高,理解准确,右侧的功能区也提供了多种修改工具。 在导出之前,主题可以再切换,分享功能可以添加协作者。 不过,“命运赠送的礼物,早已在暗中标好了价格。” 如果想要去掉Gamma的水印,则需要付费。 打分环节 宽容赋分,每个维度总分10分,没有扣分点则满分,计算平均分。 整体上,Gamma在3个维度的总体评分中胜出,其硬伤是带有Gamma的logo,一些特定商用用户可能必须付费。 Kimi生成的ppt文本内容简洁时尚,但没有AI配图,不过就其开源和免费,已经赢得了一众用户的好感。 讯飞智文文本内容虽然翔实,结合用途则显得过犹不及,AI 配图的理解精准度还不够,设计和模板与前两家相形见绌,生成速度使得它在体验感上扣分。 总的来说,AI PPT提供了框架、思路,在传统canva等提供模板的平台的间隙中增长了文本和配图。如果我很赶时间,且要求不高,使用AI 工具无疑会让我的ppt制作拥有更多松弛感。 但要使用户养成使用习惯,甚至愿意为之付费,Kimi和讯飞在产品价值上还有一段路要走。这一点我们只需要看看有多少用户愿意为Gamma付费就能明白。 在去年一次访谈中,其联合创始人& CEO Grant Lee就曾提到过团队曾利用Van Westendorp 定价模型对Gamma进行定价,并根据“帕累托80/20规则”,80% 愿意支付的价值对应 20% 的产品特性,完成了上文的定价,网络数据显示,Gamma目前的用户规模是2000万。 当然,以上总结也是我的局限。 乔布斯出现之前,诺基亚应该没想到世界会演变成这样。 AI PPT也许有天也会直接越出演示的场景,改变自己最根本的东西,
机器人0元购!稚晖君发布智元5款商用人形机器人,预估2024年发货量超300台
智元灵犀机器人X1向“稚晖君”走路的过程 时隔一年,“稚晖君”彭志辉的第二代人形机器人来了,智能交互和商业落地都加速进化。 钛媒体App获悉,8月18日上午,智元机器人2024年度新品发布会上,稚晖君发布“远征”与“灵犀”两大家族共计五款商用人形机器人新品: 交互服务机器人远征A2, 柔性智造机器人远征A2-W, 重载特种机器人远征A2-Max, 智元X-Lab孵化的首个全栈开源机器人灵犀X1, 专业数采机器人灵犀X1-W 同时,智元还展示在机器人动力域、感知域、通信域、控制域一系列自主研发的技术成果;此外,智元机器人前瞻性地定义了具身智能G1到G5技术路线图,并推出了具身智能数据系统AIDEA等。智元表示,结合轮式与足式两种形态,覆盖交互服务、柔性智造、特种作业、科研教育和数据采集等应用场景。 值得一提的是,灵犀X1机器人售价0元,将本体设计图纸、软件框架、 中间件源码、基础运控算法等核心组件通过开源方式服务开发者,“希望对于机器人科技感兴趣的同学们,未来人形机器人人人造”。 智元机器人合伙人兼营销服副总裁姜青松会前向钛媒体App等透露,智元双足人形机器人预计今年10月份开始量产,后期预计一个月生产100台。智元机器人今年整体出货量预计达300台左右,其中人形200台、轮式机器人预计出货100台左右。他强调,最终肯定可以超过300台这一数量。 会上,智元联合创始人彭志辉表示,从远征系列机器人新品,到智元具身智身全栈解决方案,再到灵犀X1的开源,以及部件的预售,公司一直致力于推动 AI 和机器人技术的边界,来不断探索更多的可能性。 “我们把技术创新作为公司最核心的竞争力,而商用落地则是检验我们价值最重要的结果体现。所以今年的口号就是智元商用元年。”彭志辉表示。 智元机器人联合创始人彭志辉 成立一年完成七轮融资,“稚晖君”团队打造5款人形机器人 据悉,智元机器人公司成立于2023年2月,公司全称是上海智元新创技术有限公司(AGIBOT),致力于以 Al+机器人的融合创新,打造世界级领先的具身智能机器人产品及应用生态的创新企业,使命是“以智能机器创造无限生产力”。 公司联合创始人“稚晖君”原名彭志辉,于1993年出生于江西吉安,他本科毕业于电子科技大学生命科学与技术学院;2018年研究生毕业于电子科技大学信通学院;毕业后就职于OPPO研究院 AI 实验室担任算法工程师;2020年他参加华为“天才少年”项目,开始前后七轮的面试,最终成为华为员工,从事昇腾 AI 芯片和 AI 算法相关研究工作。2022年12月底,彭志辉被曝离职,他随后在微博证实离职创业,最终联合成立智元机器人公司。截至目前,“稚晖君”B站账号粉丝数达259.2万。 去年8月,智元机器人首次向公众亮相,发布其最新首款具身智能的通用人形机器人远征A1,并且公布该公司已完成多轮融资,投资方包括高瓴、鼎晖、经纬创投、高榕、蓝驰创投、百度等机构。 过去一年间,智元机器人很少参与行业内大会和展示亮相,少见产品迭代视频,但该公司发展持续引发广泛关注,融资层面不断被曝光和刷新记录。截至目前,智元机器人已完成了天使轮、A轮、A1轮、A1+轮、A2轮、A3轮、A4轮等七轮融资,并已获得北汽、上汽、比亚迪三大汽车主机厂投资。 另有消息指,智元公司估值达到独角兽级别,即初创公司的估值超过10亿美金。 此次,“稚晖君”带着智元团队时隔一年再度公开亮相,并公布5款人形机器人产品,在动力域、感知域、通信域、控制域四大技术层面上都有巨大改进。 动力域:PowerFlow关节模组实现量产化迭代升级;灵巧手自由度数跃升至19个,主动自由度翻倍至12个,引入基于MEMS原理的触觉感知和视触觉感知技术;高精度力控7自由度双臂,能精准执行阻抗控制、导纳控制、力位混控等多种力控任务,也支持双臂拖拽示教模式和可视化调节。 感知域:集成了RGBD相机、激光雷达、全景相机等传感器,引入自动驾驶Occupancy前沿感知方案,通过SLAM算法进一步提升环境理解能力。 通信域:自研了具身原生、轻量化、高性能的智能机器人通信框架AimRT。相比ROS等第三方中间件,提升了性能、稳定性、系统部署的效率和灵活性,同时又完全兼容ROS/ROS2已有生态。AimRT将于9月底开源。 控制域:结合Model-based与Learning-based两种算法,进一步提升机器人运动控制与适应能力;预研了基于自然语言指令集驱动的、可以适配不同机器人本体的AgentOS,基于强化学习,实现机器人技能的精准编排与高效执行。 彭志辉还表示,智元机器人构建了面向机器人的开放生态软件平台AIMA(AI Machine Architecture),覆盖机上、云端和客户端。该平台不仅集成了机器人软件的核心技术,还提供了丰富的二次开发接口。此外,智元机器人形成了一套完整的全流程具身智能数据系统方案AIDEA,而基于AIDEA的百万条真机、千万条仿真数据集将在今年第四季度开源。 产品层面,To B领域,远征A2、远征A2-W已经开始准备交付;轻松搬动40kg的航空箱的远征A2-Max目前正处于产品研发阶段。 To C端领域,全栈开源机器人灵犀X1通过模块化方式,采用串并联混合构型手臂和差分驱动双肩关节设计,支持“机-机模式”,因此,灵犀X1将核心组件开源开放,部件则采用预售方式,今晚5000元定金预售,一个月后补齐尾款,10月15日起首批30套开启发货;专业数采机器人灵犀X1-W能显著降低数据获取成本,是大规模数据采集的普适优选方案。 商业化层面,智元机器人的商业伙伴包括均普智能、数字华夏、科大讯飞、北电数智、软通动力等机构,面向不同场景打造商用落地的解决方案,同时,该公司还与上海人工智能实验室、中国科学院软件研究所等科研机构合作,聚焦多模态大模型和机器人操作系统的技术研发。 人形机器人进入家庭将需要5-8年时间 未来生态和发展层面,智元机器人定义了G1至G5的具身智能技术演进路线。 G1: 基础自动化,即传统自动化,它都是基于手工设计特征,然后配合一些简单机器视觉去做一些反馈,但是整体来说都还是程序化、编程轨迹化这种技术路径,虽然这个阶段也可以解决某些场景下的任务执行问题,但对于手工配置的需求,使得它无法在不同的场景里面去做低成本的快速迁移,所以它几乎不具备具身智能能力。 G2: 通用原子技能,内置任务编排大模型,拥有基础模型能力。而智元目前在G2阶段实现了通用的位姿估计模型UniPose、通用的抓取模型UniGrasp,通用的力控插拔模型UniPlug等一系列零样本和小样本通用原子技能。在G2阶段的原子能力模型,面向柔性智造和交互服务场景,已经在多个实际场景中得到了商业应用。 G3: 端到端操作技能,内置认知推理规划大模型,可以在机器人领域实现端到端智能水平。依靠大量的数据采集,由数据驱动去端到端训练一系列的原子能力,它最大的价值是形成了一套通用的技能训练框架。彭志辉强调,只有这样的具身智能路线,才具备Scaling up。 G4: 端到端操作大模型,它结合前三个阶段的所有路线,希望能够实现一个通用的操作大模型或者叫large motion model(大型运动模型),区别于大语言模型,需要采集单独的行业和场景数据,训练更强的技能,能够生成更有效的操作策略,来实现跨技能程度的泛化效果,来进一步提升整个机器人在复杂任务中的表现,所以这个就是机器的角色的价值。 G5: AGI,这是一个长期的发展目标,就是在提供足够多、高质量的任务数据下,可以形成一个真正、全面的、从感知决策到执行大模型、拥有具身智能、将具备跨任务的泛化能力、开放场景的机器人技术能力,这个时候离AGI更进一步,同时也将实现公司AGIBOT的时刻。 姜青松向钛媒体App等表示,人形机器人目前依然还是在交互服务、营销,以及商业3C、半导体,以及部分工业场景。如果人形机器人进入家庭,他认为还需要未来5-8年时间,甚至更远。 “因为进家庭的条件门槛实在是太高了。人机交互的实际体验会比传统的大屏幕+轮子,会有足够多的客户情绪价值,这是我们今年发货量最大的一块。而工业产品,做起来比我们想象的难,其实我们投入最大,但是今年也会实现一些突破,都能实现一定的商用商用量,但不会量不是很大,我估计应该在百台以内,但这是我们真正的迈出了关键一步。”姜青松称。 目前,智元机器人公司主要对标的是马斯克的特斯拉(Tesla)公司,后者拥有“擎天柱”(Optimus)人形机器人,马斯克曾预估到2025年-2026年其人形机器人进入商用阶段。 “我们会有很多中间态的产品出来,能够出现能够满足一些多用场景,然后慢慢的就是向更高的目标去进发。我们认为,双方的差距不会太大,而且中间会产生很多能商业化的产品,而且我们商用能力、成本控制能力比特斯拉要好。我们(机器人)马上就要量产了,量产以后我们整个的供应链和成本控制,可以在国内达到一个比较高的水准。”姜青松对钛媒体App表示。 当前,AI+机器人赛道融资火热,市场前景广阔。 据IT桔子数据显示,2019年—2023年,中国机器人行业投融资案例从2019年的37起增长至2023年的103起,投资金额从19.83亿元增长至97.39亿元,年复合增长率为38.8%。2024年1-7月,行业共发生78起投融资案例,投融资金额53.62亿元,预计延续增长态势。 Statista最新报告显示,2024年,全球 AI 机器人市场规模将超过190亿美元,较2023年市场规模增长近30%。到2030年,预计这一规模将超过350亿美元。 彭志辉强调,科技的真正价值在于对人类生活的深远影响。智元的目标不仅仅是开发各种机器人、先进技术,更是希望通过开放生态、合作共赢来加速整个行业创新和应用,让机器人真正服务于人类生活和工作的方方面面,实现真正智能机器人去创造无限生产力这一愿景。 “当然,挑战肯定是始终存在的,所以作为科技探索者,在快速变化的环境中,我们将一如既往的继续努力,然后时刻保持敏锐洞察力,还有持续的创新精神。”彭志辉在演讲结尾表示。
8月20日上午10点PC/PS5同步开玩!《黑神话:悟空》PC配置需求、全球解锁时间表一览
快科技8月18日消息,《黑神话:悟空》将于2024年8月20日上午10点(UTC+8),在PS5和PC平台全球同步解锁游玩。 目前,玩家已经可在PS5 / STEAM / WEGAME平台提前下载。其中,Steam版预留空间为128.68GB,PS5版预留空间为104.394GB。 以Steam平台为例,本作提供2种游戏版本选择:数字标准版、数字豪华版。其中数字标准版售价268元,而数字豪华版则为328元,此外还有60元的DLC豪华升级包供玩家选择。 数字标准版包含: 《黑神话:悟空》完整游戏 数字豪华版包含: 《黑神话:悟空》完整游戏 兵器:铜云棒 披挂:百戏傩面,百戏衬钱衣,百戏护手,百戏吊腿 珍玩:风铎 游戏音乐精选集 IGN中国对本作给出10分满分评价:《黑神话:悟空》固然谈不上十全十美,但与国际上同等规模的游戏相比,游戏科学能以三分之一左右的团队规模,和并不明显多过正常 3A 游戏的开发周期,拿出如此体量的第一款单机作品,说这是一场工业奇迹也绝不为过。 《黑神话:悟空》绝对可以说是一座中国游戏行业的里程碑,它所呈现的优秀品质对得起这四年来它背负的所有期待,这是真正意义上放在全球市场也极具竞争力的国产游戏,我相信它会成为今年年度游戏的有力竞争者,而游戏科学也将在此役之后毫无疑问成为全球顶尖 ARPG 游戏开发商之一。 PC配置需求如下: 全球解锁时间表一栏: 北京:8月20日10:00 CST 首尔:8月20日11:00 KST 东京:8月20日11:00 JST 新加坡:8月20日10:00 SGT 悉尼:8月20日12:00 AEST 新德里:8月20日7:30 IST 迪拜:8月20日6:00 GST 莫斯科:8月20日5:00 MSK 柏林:8月20日4:00 CEST 伦敦:8月20日3:00 BST 约翰内斯堡:8月20日4:00 SAST 洛杉矶:8月19日19:00 PDT 墨西哥城:8月19日20:00 CST 纽约:8月19日22:00 EDT 圣保罗:8月19日23:00 BRT
稚晖君人形机器人全家桶发布:穿针拧螺丝搓麻将,机器娃没满月就干活,开源大招杀疯了
作者 | 香草 云鹏 编辑 | 心缘 打麻将、拆快递、纽扣穿针,还能做30KG重物提拉! 沉寂一年,稚晖君带着他的二代机器人全家桶重磅回归,秀出的各种新技能令人眼前一亮。 智东西8月18日报道,今日,“野生钢铁侠”稚晖君一连亮出5款智元人形机器人,全程整活儿,前有机器人开瓶盖、倒可乐、搬重物,后有机器人上场主持、穿针、搓麻将、推销卖车,最后还有老父亲稚晖君陪伴“夹子手机器娃”蹒跚学步的感人成长Vlog,并甩出“0元购”终极大招。 智元不仅首次定义具身智能的五级技术演进路线图,而且公布了最新商业化进展:团队面向量产做了大量的正向设计分析、系统方案重构、核心部件自研;远征系列产品规模量产正在进行,接收到来自制造业、交互服务行业等不同客户的大量订单,整个团队都在加班加点准备批量交付。 稚晖君还秀了一波大格局,化身“赛博源神”,从数据集、设计图纸、软件框架、中间件源码到运控算法,通通开源,要让人人可造人形机器人。 智元机器人此次发布了“远征”与“灵犀”两个系列,共5款商用机器人新品,包括远征A2、远征A2-W、远征A2-Max、灵犀X1以及灵犀X1-W。 发布会一开场,稚晖君直接和远征A2机器人家族的几位成员演了一出“人机小品”。 远征A2系列秀出不少新技能,比如远征A2-W机器人用开瓶器开可乐瓶、操作榨汁机做出一杯“葡汽可乐”、精准将榨汁机中的饮料倒入杯中。 “大力士”远征A2-Max则原地抱起80多斤的重物。整体来看,机器人的肢体动作流畅灵巧,相比去年8月首次出场时,显然娴熟了许多,但动作属实有点太过缓慢,光是做饮料就花了整整3分钟。 演完小品后,稚晖君转身走入发布会现场,一台远征A2机器人直接登台当主持人,介绍了远征A2系列机器人家族。 远征A2系列包括远征A2、远征A2-W和远征A2-Max三款机器人,分别针对交互服务、柔性制造和重载特种场景,内嵌大语言模型,可实现超拟人音色语音对话,各种技能都可以持续学习。 自动播放 ▲远征A2语音交互现场演示 作为今天发布会的“One More Thing”,稚晖君亮出自家的首款模块化机器人灵犀X1,它个头不大,可以看作是“青春版”机器人,在成本方面有大幅优化。 稚晖君带领不到10人的团队,在不到3个月的时间里,就把灵犀X1从概念做成了整机。灵犀X1从组装完成到今天,还不到两周的时间,因此是“还没满月就出来干活了”。 值得一提的是,灵犀X1有个“机机模式”,手机可以直接放到机器人里,做机器人的“大脑”,这个“脑洞”确实够大。 灵犀X1的屏幕可以定制画面,比如显示稚晖君自己的脸,颇有一种机器人带上了Vision Pro的既视感。 为了避免“价格战”,稚晖君直接给灵犀X1定价为“0元”,全面开源。 在应用场景方面,远征A2可以在4S店内作销售导购,多语言交流,了解用户需求,例如听到顾客想喝水就去拿水,路上可以自动避障;在工厂里,远征A2基本可以完成质检上料、货架摆放货物等工作。 一、全身40+主动自由度,灵巧手19自由度,四大子域核心系统 人形机器人远征A2全身采用外骨骼设计,身高体重都与成年人类相仿,可续航超2小时,行走速度每秒1米。 在外形方面,远征A2比上一代远征A1更像人了,脑袋更圆、四肢比例更协调,腿部形态从A1的反屈膝设计变为了正屈膝。 远征A2-W由一个人形上半身和背后的机械身体组成,主要用于工业制造领域,其主动自由度22个,续航超过5小时,每秒可行走1.5米以上。双臂写作、多模态感知、持久作业等是远征A2-W针对制造场景进行的针对性优化。 远征A2-Max最大的特点就是力大无穷,其主动自由度达到53个,双臂可称重80斤以上。 远征A2系列产品的工业设计采用了家族化ID语言,有助于实现量产以及独特的视觉识别特征。 在核心零部件上,远征A2系列借鉴新能源汽车的系统,将机器人的核心系统划分为动力域、感知域、通信域、控制域四个子域。 在动力域方面,远征A2的关节模组在上一代的基础上面向量产做了大量的优化和测试,其中部分关节电机的峰值扭矩可以达到512 Nm。 视触觉灵巧手也全面升级,拥有19个自由度,其中12个为主动关节。 基于灵活的手部关节和视觉、触觉感知,灵巧手现在可以轻松拧螺丝、拆快递。 通用的物品抓取更是不在话下,还能双手配合倒水。 纽扣穿针这样的精细活,灵巧手也能轻松实现。 远征A2拥有7自由度双臂,单臂自由度达到3+2+2+N,臂展60厘米。双臂内置六维力传感器,可以配合实现更复杂的操作。 感知域方面,远征A2增加了激光雷达、全景相机等传感器,可实现全域安全、局部避障。基于自研的系统算法,机器人对环境的理解也大幅提升。 通信域方面,智元团队自研了一套轻量化、高性能的智能机器人通信框架AimRT,可以完全不依赖第三方中间件。 值得一提的是,这一框架将在下个月底全面开源。 控制域方面,远征A2在去年Model base的基础上增加了数据驱动的Learning base,使用两种方式共同驱动机器人的行为优化,行走起来更稳定自然。 在运动算法层面,智元构建了一套由自然语言指令集驱动,可以适配不同机器人硬件的AgentOS。 基于机器人本体,AgentOS定义了技能库,通过多模态大模型去定义机器人的状态,再由任务执行器来驱动各种原子技能去进行任务操作,然后再进行反馈来获取这信号。 AgentOS目前还在预研初期,不过从开头的自制饮料等演示来看,它已经实现了比较好的任务编排效果。 远征A2的整体框架参考强化学习来构建,整个机器人是一个软硬件非常复杂的系统,既涉及到内部各个硬件模块的协同和部署,也需要软件跟算法做高效的配合 智元构建了开放软硬件平台AIMA,将远征A2的复杂系统的二次开发能力,开放给外部更多的开发者,共同去构建整个生态。 二、交互服务、柔性制造领域落地,自研数据采集全流程开源 稚晖君首次公布了智元机器人的具身智能技术演进路线图,从G1到G5分别对应基础自动化、通用原子技能、端到端操作技能、端到端操作大模型以及最终的AGI,类似自动驾驶领域的L1、L2、L3分级。 去年一年,智元机器人在G2、G3阶段并行研发,其中基于G2的原子能力已经实现实际场景的落地应用。 例如在交互服务场景中,远征A2可以针对客户进行精准营销。在汽车4S店内,它可以作为导购为客户提供服务。基于记忆能力,远征A2能够知道顾客上次看中的是哪款车,并主动推荐体验。 基于多模态大模型,远征A2能对不同意图指令精准识别。比如当小朋友说口渴了,远征A2会主动询问需要什么饮品,并取回来交给她。 在行进的路上,远征A2还能智能避障,躲开碰到的人或物品。 基于语言动作大模型,远征A2可以端到端生成自然动作,比如说“1万现金优惠”时,它非常自然地比了个1的手势。 虽然从人形机器人演进的角度来看,远征A2已经实现了很大的进步,但仅凭其现在慢吞吞的说话和做事效率,离替代人类销售还差得远。 在柔性制造场景中,远征A2-W可以基于多模态感知、双臂协作、原子模块化等能力,实现工件投料、上下料、质检、搬运等,还能在不同工序间自动转场。 智元具身智能数据系统AIDEA是稚晖君放出的另一个关键大招,包括仿真平台、机器学习平台、功能部署平台、数据平台,可以说是智元机器人从实验室到工厂再到量产商用的关键基础。 具身领域有一个很大的痛点,就是真实场景数据稀缺。它不像大语言模型有海量的互联网免费数据,也不像自动驾驶每天有上百万汽车在路上采集到的真实数据。 为了解决这一痛点,智元自研了具身智能数据系统AIDEA,形成了一套全流程稳定可靠的数据采集方案。 AIDEA将在今年Q4全面开源百万条真机、千万条仿真数据集,此外,今年下半年智元将会落地百台以上机器人专门用于数据采集。 三、首个模块化机器人灵犀X1亮相,团队不到10人,2个月从概念到整机 在发布会临近尾声的时候,稚晖君还带来了一个One more thing:智元机器人首个模块化机器人灵犀X1,就藏在发布会开头远征A2-Max举起的箱子里。 灵犀X1由智元X-Lab打造,这是智元于6月新成立的一个实验室,也叫“稚晖君实验室”,专门做一些前沿技术创新类研究。这台灵犀X1,是由不到10个人,在两个多月的时间内从无到有自研得到的。 灵犀X1身高133厘米,体重不到66斤,十分小巧。其手臂使用串并联混合结构,整臂重量只有2kg,这使得它可以支持更灵活的运动、更高效的控制。 灵犀X1还创新推出“机机模式”,也就是机器人+手机,把手机放到机器人的“头”里来做大脑,让手机本身的麦克风、扬声器、屏幕等硬件,以及网络、AI算力等软件能力,为机器人带来新的突破。 通过在远征系列上积累的各种研发经验,灵犀X1上也自研了两款全新的关节,其全身30多个自由度,均由这两款关节提供支持,做到了极致的标准化。 灵犀X1也推出了用于数据采集的机器人灵犀X1-W,相比远征A2-W成本更低。 就像稚晖君本人一样,智元机器人可谓是将开源贯彻到底。灵犀X1的本体设计图纸、软件框架、中间件源码,以及基础运控算法都将全面开源。 四、沉寂一年,华为天才少年“闷声干大事” 自智元机器人首款人形机器人远征A1发布,刚好过去一整年的时间。如果说远征A1是从零到一的突破,那么这次发布的远征A2,则是在从1到100的AGI之路上,迈出的重要一步。 智元机器人成立于去年2月,致力于研发具身智能机器人产品及应用生态。带着创始人之一稚晖君的光环,智元机器人从诞生之初就备受科技圈关注。 稚晖君本名彭志辉,本硕均毕业于电子科技大学,毕业后曾在OPPO研究院AI实验室担任算法工程师,随后在2020年加入“华为天才少年计划”,从事昇腾AI芯片和AI算法相关研究工作。 那一年的华为天才少年,总共有6名。 ▲稚晖君华为天才少年签约纪念 稚晖君的另一个身份,是科技圈知名up主,因在B站发布的一系列硬核科技产品视频而闻名。 视频中的他软硬件“通吃”,从写代码、画电路图,到建模、装配全部DIY,独立制作了给葡萄缝针的钢铁侠机械臂、“能够自己行走”不摔跤的自行车、模块化机械键盘等有趣的项目。 ▲稚晖军B站主页 2022年12月,稚晖君宣布已从华为离职创业,次年2月就正式成立了智元机器人(上海智元新创技术有限公司),作为联合创始人之一担任CTO和首席架构师。 智元机器人也备受资本青睐,目前已完成A3轮融资,投资方包括比亚迪、BV百度风投、红杉中国、高瓴创投等知名企业或机构,估值也早在去年就超过10亿美元,晋升独角兽。 结语:人形机器人明星独角兽重磅“回归” 就在上周,美国人形机器人创企Figure刚刚发布第二代机器人Figure 02,要做“地表最强人形机器人”。Figure 02第四代手部拥有16个自由度,比特斯拉的擎天柱二代多了5个,而远征A2则更胜一筹达到19个。 在自媒体时代,稚晖君就时常“闷声干大事”,半年做一个项目惊艳全场。在过去一年中,智元机器人一直比较低调,此次时隔一年再办发布会,稚晖君果然没让大家失望,不仅甩出超强远征A2全家桶,还带来了灵犀X1这一惊喜新品。光是现场演示,就已经打败了一大半同类产品。 在生态方面,智元看起来是要走和稚晖君本人同样的开源路线,让更多开发者参与进来,共同为远征A2、灵犀X1的迭代添砖加瓦。
Meta Quest 3头显透视摄像头被“破解”,开发者成功运行计算机视觉模型
IT之家 8 月 18 日消息,一位开发者巧妙地绕过了限制,成功利用 Quest 3 的透视摄像头运行自定义计算机视觉模型,可以识别摄像头看到的物体。 Meta 目前并不允许第三方开发者直接访问 Quest 系列头显的摄像头,然而 XRWorkout 健身应用的联合创始人兼首席开发者 Michael Gschwandtner 在社交媒体上发布了一段视频,展示了他成功绕过了这一限制。 演示视频中,开源的 MobileNet V2 目标检测模型以 0.75Hz 的帧率原生运行于 Quest 3 上。Gschwandtner 的应用构建了一个网页视图 (webview),即嵌入在应用内部的 Chromium 浏览器实例。该网页视图会自动加载支持 Quest 头显投屏的网址(oculus.com/casting),该网址可以让 Quest 头显将自身画面投送至其他设备。接下来,用户需要在该窗口内使用 Meta 账号进行完整登录。完成后,通过 Quest 系统菜单启动投屏功能。需要注意的是,这次的投屏并非投向另一台设备,而是从头显投向头显内部的同一个应用。 Gschwandtner 的应用随后会对接收投屏画面 (RenderTexture) 的 webview 进行像素内容采样,并可以根据需要进行进一步处理。在演示示例中,他将采样数据送入谷歌的 MediaPipe 设备端 SDK 进行处理。 IT之家注意到,该方法存在一个关键限制:投屏画面中除了透视摄像头画面之外,还包含虚拟物体和界面元素。这意味着该方法仅适用于透视画面占据大部分图像的情况。不过,Gschwandtner 表示他已为该限制设计了另一个变通方案。 目前尚不清楚 Meta 将如何应对 Gschwandtner 的发现。该公司可能会在未来版本的 Quest 操作系统 Horizon OS 中使该方法失效。Gschwandtner 在社交媒体上公开喊话,希望与 Meta CEO Mark Zuckerberg 或 CTO Andrew Bosworth 通话,向他们展示该技术。 上个月,Bosworth 在接受采访时谈到了有意向让 Quest 开发者访问透视摄像头的想法,并表示 Meta 将“继续关注”该问题。相比之下,苹果仅向企业用户提供其 Vision Pro 头显的原始摄像头数据访问权限,并且仅限于非公开的内部应用。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。