EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
人工智能“烧”到垂域 金蝶发布财务大模型并官宣国际化战略目标
经济观察网 记者 李华清 2022年11月面世的ChatGPT带火了人工智能,也带火了大模型,现在,战火已从通用大模型烧到了专用大模型。 8月8日,在“2023全球创见者大会”上(以下简称“大会”),金蝶发布金蝶云·苍穹GPT大模型,定位最懂管理的企业级大模型平台,同时,苍穹GPT推出国内首个财务大模型,并现场开放体验。在当天的媒体群访中,金蝶中国总裁章勇表示:“下一个30年的金蝶,将开启人工智能时代,我们会把AI能力与企业场景结合得更好,让AI来提升企业的数字能力。” 今年,是金蝶成立30周年,在8月8日举办的“金蝶集团30周年庆典晚会”上,金蝶集团董事会主席兼CEO徐少春宣布了金蝶的国际化战略目标:到2026年突破东南亚市场,力争做到亚太第一;到2030年,力争做到全球第五。 垂域大模型 经济观察网记者从大会上了解到,苍穹GPT可以看做是金蝶云·苍穹平台的一部分,接入百度文心一言、微软OpenAI等通用大模型能力,还可为企业提供专业垂域模型,财务大模型是苍穹GPT推出的首个垂域大模型。 “业内有厂商说要做企业服务大模型,我认为比较难,因为企业服务范畴太宽泛了,我们要选一个我们擅长的领域,金蝶就是从财务管理起家的,所以我们第一步选择做财务大模型。当然,我们不止训练了财务大模型,我们还训练了其他领域的,但暂时还不方便公布。”金蝶中国执行副总裁、研发平台总经理赵燕锡在群访中介绍。 赵燕锡回忆,为了做成财务大模型,金蝶几乎跟国内有名气的、在做大模型的厂商都有过交流。有人认为,中小企业不应该做垂域大模型,甚至不应该将垂域大模型当成自己的方向,这背后有一定道理,因为想要做好垂域模型,需要很深的行业知识,而金蝶坚定选择研究垂域模型,因为金蝶服务了大量的企业,可以将企业的需求、经验打包起来,输出通用能力。 目前,企业服务领域的大模型,还处在起步阶段,尚有相当多的关卡待闯,例如大模型自身的能力完善、与企业场景的结合、企业客户的接受度等。赵燕锡介绍,企业服务大模型的收费,已经有参考案例出现,就金蝶自身而言,金蝶不同产品的报价方式是不同的,总体来说,会按照订阅模式来推进财务大模型的收费,在现阶段,金蝶更多会着眼于技术可行性的实现,成本不是最主要的考虑因素。 “我们也希望(通用)大模型厂商收费不要太贵,因为我们在它们上面叠加了一层管理知识,收费不太贵的话,可以降低中小企业使用的门槛。垂域大模型也被寄望能做到开箱即用。”赵燕锡说。 为能最大程度发挥出财务大模型的能力,金蝶在推出的财务大模型中预置了大量的、专业的提示语工程。这些提示语,帮助用户高质量、精准地提问,一定程度上降低了用户使用专业大模型的门槛,也让大模型可以清晰地理解用户的需求,给出高质量的反馈。 为让财务大模型更懂企业的个性化需求,有效解决复杂财务问题,金蝶的财务大模型还外挂了财务知识库,既涵盖财务知识、财税政策及法规,也吸收企业个性化规章制度、分析报告、业务规范等文档,如此,结合财务大模型的信息理解能力,生成的财务回答会更加专业。 在大会上,金蝶的产品经理现场展示了金蝶在财务、人力资源、程序开发领域的AI助手,按照“苍穹GPT+X”的规划,未来,金蝶还将继续推出覆盖供应链、制造等个多领域的AI助手。Gartner的报告预测,到2026年,将有超过1亿的企业员工与合成虚拟同事合作完成企业工作。 国际化战略 8月8日,除开发布苍穹GPT、财务大模型外,金蝶集团还官宣了国际化战略,提出三年时间做到亚太第一,七年时间做到全球第五。 徐少春认为,强大国家的背后,一定有强大的管理软件公司,德国有SAP,美国有Oracle,中国的金蝶,也应该做到世界级企业。 章勇在媒体群访中介绍,金蝶最近成立了国际业务部门,已开展了一系列的访问、调研,驱动金蝶推出国际化战略的首要因素是,越来越多的中国企业询问,金蝶是否可以提供相应的产品、服务支持他们的全球化业务管理,例如全球财务共享等。 金蝶方面介绍,金蝶的“出海”,初期将以东南亚为始,进军新加坡、马来西亚、泰国等国家,再拓展至北美洲、欧洲等地,同时将打造全球交付能力、解决方案能力及伙伴管理能力,发展及整合生态伙伴,计划五年内完成全球布局。 尽管新近表态全球化目标,但事实上,伴随着服务世界500强企业、跨国经营企业,金蝶的业务已经覆盖172个国家和地区。“目前我们在亚太地区排名第三。”章勇说。
继A拆A后又筹划A+H上市,美的集团加快资本运作步伐
经济观察网 记者 李华清 8月9日晚间,美的集团(000333.SZ)公告称,基于该公司深化全球战略布局的需要,该公司正在对境外发行证券(H股)并上市事项进行前期论证,公司董事会已经审议同意公司研究论证该事项。在符合境外监管机构相关要求的前提下,本次拟发行规模预计不超过发行完成后公司总股本的10%。 如果境外发行H股事项得以落地实施,美的集团将实现A+H股上市。 实际上,今年以来,美的集团在资本市场上动作频频。7月29日,美的集团公告公司董事会授权公司经营层启动分拆安得智联申请首次公开发行人民币普通股(A股)并在深圳证券交易所主板上市的前期筹备工作。4月19日,美的集团旗下子公司美智光电向深交所创业板递交了上市申请,8月1日,深交所向美智光电发出第二轮审核问询函。 频繁分拆 目前,美的集团旗下有五大业务板块,分别为智能家居事业群、机电事业群、暖通与楼宇事业部、机器人与自动化事业部和数字化创新业务,涵盖C端和B端业务,业务较为庞杂。截至目前,美的集团已经在筹划分拆两家子公司到A股上市。 7月29日,美的集团公告将分拆安得智联供应链科技有限公司到深交所主板上市,美的集团认为,分拆安得智联上市,有利于公司进一步理顺业务管理架构,释放创新业务板块估值潜力;也有利于安得智联拓宽融资渠道,完善激励机制,提升企业竞争力。 据安得智联官网介绍,基于美的T+3产销模式及渠道一盘货变革的经营实践,安得智联建立物流运营能力,在全国拥有136个配送中心,3000个送装网点,1500个前置仓,近20万条成熟线路,配送网络覆盖3.9万个乡镇,覆盖全国99.1%的乡镇,已积累了家电家居、泛快消、3C等行业超3000家企业客户。2021年,安得智联的年收入超过110亿元。 美智光电则是美的集团最早分拆上市的子公司,但分拆上市之旅并不顺畅。 美智光电的主要产品是照明及智能前装产品,应用在住宅和工商业建筑领域,受房地产影响很大,主要客户是美的置业和总部在佛山的知名房企碧桂园。证监会官网显示,2021年6月,美智光电即向深市创业板提出IPO申请,在历经三轮审核问询后,2022年7月,美智光电创业板主动撤回IPO申请。 2023年4月,美智光电又一次向深市创业板提交IPO申请,2023年5月,深交所对其发出的首轮问询函中,即让其解释前次申报撤回的原因。 美智光电在回复中解释,2022年7月撤回发行上市申请,主要原因包括启动分拆上市前,公司归属美的集团原中央空调事业部管理,前次报告期内独立运行时间较短;公司前次申报时,申报基准日后仍存在尚未解决的同业竞争情形;公司与美的集团共用IT系统。 美智光电称,在前述回复出具日前,导致前次撤回的主要问题已经整改或消除。再次启动IPO,美智光电是否能如愿,还有待观望。 在美的集团的创新业务中,对外输出美的集团数字化能力的美云智数也被广泛认为会被分拆上市。 市场争议 站在美的集团的角度看,分拆子公司上市和到港股上市,都是拓宽融资渠道的手段,有利于公司长远发展,但这套逻辑没能完全得到持有美的集团A股股票的股东们的拥护。 有人在美的集团股吧里抱怨,无论是分拆优质资产单独上市,还是到港股发行股票稀释原有股东的股权,美的集团不顾及现存A股股东利益,频繁考虑金融手段,迟早走下神坛。还有人担心美的集团在港股上市后估值不高,从而拉低在A股的股价。更有人好奇美的集团到港股融资后的资金用途。 无独有偶,8月2日,顺丰控股亦公告称,为进一步推动国际化战略、打造国际化资本运作平台、提升国际品牌形象、提高综合竞争力,顺丰控股计划发行H股股票并申请在香港联交所主板挂牌上市,顺丰控股拟聘请罗兵咸永道会计师事务所作为本次发行并上市的审计机构。 对于美的集团和顺丰控股赴港上市一事,盘古智库高级研究员江瀚向经济观察网记者分析认为,作为数千亿元市值的上市公司,美的集团和顺丰控股此时筹备H股上市,固然有提高国际化程度、扩大融资渠道的考虑,另外也可为应对当下经济环境可能出现的变化而储备资金能力。 但显然,A股市场的投资者对美的集团赴港上市一事“并不感冒”:8月10日,截至记者发稿,美的集团股价跌幅超过3.5%,当前市值为3900亿元。
新时代 新征程 新伟业丨5G应用加速度 激发数字经济新动能
我国发放5G商用牌照已经四周年。工业和信息化部发布的数据显示,截至今年4月底,我国累计建成5G基站超过273万个,5G网络覆盖全国所有地级市、县城城区,5G移动电话用户达6.34亿户。目前,5G应用已融入97个国民经济大类中的60个,应用案例数超5万个。基础电信行业累计投资近6000亿元建设5G网络,直接带动经济总产出约3.8万亿元,间接带动经济总产出约9.4万亿元,有力促进了数字经济发展。工信部数据显示,目前全国5G行业虚拟专网超过1.6万个,矿业、港口、电力、教育、医疗、文旅、消费等重点行业的5G应用解决方案被广泛复制,助力企业提质、降本、增效。(图片由CNSPHOTO提供)5G商用跑出加速度5G商用四周年来,一方面相关部门推出系列政策工具,加快推进5G建设和应用;另一方面基础电信企业将数字信息基础设施建设和运营作为主责主业,跑出了5G建设发展的加速度。工业和信息化部总工程师赵志国表示,工信部深入贯彻落实党中央、国务院决策部署,加快新型信息基础设施建设,取得了历史性成就:网络覆盖遍及城乡,供给水平显著提升;信息服务普惠共享,人民获得感不断增强;应用水平加快提升,融合赋能持续彰显;安全体系日臻完善,保障能力不断增强。中国联通董事长刘烈宏表示,近期中国联通发布了全球首款通用型的5G RedCap商用模组,推动5G应用“轻装上阵”。下一步将与合作伙伴共同推进完成R18标准制定,加快推进芯片、模组、终端等产品研发和产业化,加速5G-Advanced商用进程。同时,发挥专网频率资源价值,联合工业企业共同推动“5G+工业互联网”加速向企业生产核心环节迈进。中国电信董事长柯瑞文表示,中国电信在加快5G建设和应用发展的同时,也在持续开展全光网络建设,目前千兆光网已覆盖300多个城市。中国移动总经理董昕表示,目前中国移动已累计开通5G基站超160万个,牵头5G国际标准近200项,申请专利超4100件,位居全球运营商第一阵营。下一步将加快“双千兆”协同发展,带动并增强产业链供应链的自主可控能力,加快推动5G向天地一体、智能网络、通感一体演进。业内人士表示,目前我国5G网络建设已基本完成城乡室外连续覆盖,技术产业体系初步构建,用户规模持续壮大,未来5年是我国5G规模化发展的关键期,要持续推动5G技术产品创新和产业化进程。激发数字经济新动能5G用户快速增长、5G网络加速覆盖,也激发了数字经济的新动能。国家互联网信息办公室日前发布的《数字中国发展报告(2022年)》显示,2022年,我国数字经济规模达50.2万亿元,总量稳居世界第二,同比名义增长10.3%,占国内生产总值的41.5%。其中,数字产业规模稳步增长,电子信息制造业实现营收15.4万亿元,同比增长5.5%;软件业务收入达10.81万亿元,同比增长11.2%;工业互联网核心产业规模超1.2万亿元,同比增长15.5%。近年来,我国数字经济成效显著,数字经济总量位居世界第二,数字经济和实体经济融合发展,带动新一轮产业结构转型升级。今年2月,中共中央、国务院印发《数字中国建设整体布局规划》,对数字经济发展进行了全面布局和统筹,以强有力的政策手段保障数字中国建设全面落地。目前,我数字技术和实体经济融合正深入推进。农业数字化加快向全产业链延伸,农业生产信息化率超过25%;全国工业企业关键工序数控化率、数字化研发设计工具普及率分别增长至58.6%和77%。促进数字经济和实体经济深度融合,构建现代化产业体系根基,是抢占未来国际竞争制高点的关键。北京市社会科学院研究员李嘉美表示,我国实体经济规模庞大、门类众多,传统产业数字化转型空间很大。促进数字经济和实体经济深度融合,以现代数字技术为实体经济赋能,将加速推动我国产业数字化进程,构建具有完整性、先进性、安全性现代化产业体系,推动我国经济高质量发展。持续推动5G应用发展工信部部长金壮龙在6月4日召开的第31届中国国际信息通信展览会上表示,工信部将加快5G行业虚拟专网建设,深入实施5G应用扬帆行动,进一步丰富拓展5G应用场景,深化工业互联网融合,完善工业互联网技术体系、标准体系、应用体系,打造一批5G工厂,大力推进制造业智能化、绿色化、融合化,构建高质量发展新引擎。赵志国表示,工信部将大力推进5G、工业互联网在垂直行业、信息消费、社会民生等领域的融合应用,助力产业数字化转型。谈到下一步工作,赵志国介绍说,一是抓设施建设,夯实数字底座。体系化推进新型信息基础设施建设发展,深入开展“千兆城市”建设,持续提升5G和千兆光纤网络覆盖深度广度。纵深推进电信普遍服务,实施“宽带边疆”工程。二是抓技术创新,深入实施创新驱动发展战略,加强核心技术攻关,推动6G、光通信、量子通信等关键核心技术加速突破,牢牢掌握关键核心技术自主权。加快高端芯片、传感器、通用处理器、关键基础软件等领域研发突破和迭代应用,加大人工智能、区块链、数字孪生等前沿技术研发力度。三是抓融合应用,助推产业转型。大力推进5G、工业互联网在垂直行业、信息消费、社会民生等领域的融合应用。实施5G规模化应用工程,推动5G行业虚拟专网规模化发展。实施“5G+工业互联网”工程,支持企业设备上云,推动工业互联网平台进企业、进园区、进产业集群。聚焦重点领域形成创新应用示范标杆,助力产业数字化转型。金壮龙强调,要加快培育新兴产业,持续增强移动通信、光通信等领域全产业链优势,前瞻布局下一代互联网等前沿领域,全面推进6G技术研发,抢占未来发展新优势。深化全球开放合作,携手打造开放、公平、公正、非歧视的发展环境,推动构建网络空间命运共同体,打造互利共赢新生态。(袁芳)
拼多多和 SHEIN 互殴,用中国模式向美国电商砍一刀
来自东方的「神秘力量」,在征服海外之前,自己先打起来了。 说的就是美国增长最快的两个购物平台:SHEIN 和 Temu。 前者是打败快时尚鼻祖 Zara 的超快时尚,后者是拼多多旗下的跨境电商。 这两个国产「平价之光」如同「降维打击」,让美国人几次三番刷新了消费观。 然而,盯着同一块蛋糕,不免要亮出筹码和武器,圈住自己的地盘,侵占对方的领地。它们不想让对方好过,更不想让北美电商霸主亚马逊好过。 两家新贵打架,血溅到了行业老大 真实的商战,手段向来谈不上优雅。 SHEIN 和 Temu 的选择是,直接约在法院见面。 7 月 14 日,波士顿联邦法院,Temu 对 SHEIN 发出指控:违反美国反垄断法。 让 Temu 不满的是,SHEIN 强制 8000 多个服装厂商「二选一」。如果与 Temu 合作,这些制造商将面临罚款等处罚。 虽然是出海电商,但它们的大部分供应链都在国内,争夺资源在所难免。SHEIN 表示应战,声称这起诉讼没有法律依据,将积极为自己辩护。 这桩案子其实算是「礼尚往来」。 去年 12 月,SHEIN 先把 Temu 告上了伊利诺伊州联邦法院,罪名包括买通网红贬低 SHEIN、冒充 SHEIN 社交账号引导下载 Temu 等等。 惹恼 SHEIN 的 TikTok 视频,明目张胆地拉踩:「我从 SHEIN 改用 Temu 了,同样的东西,花更少的钱获得更多。」 ▲ 疑似冒充 SHEIN 的 Twitter 账号已被删除. 今年 3 月,SHEIN 又起诉 Temu 侵犯商标以及受版权保护的图片。不出意料,Temu 也「强烈、断然地拒绝所有指控」。 轮流当原告和被告的 Temu 和 SHEIN,其他的官司也没消停过。 今年 5 月底,网友在 TikTok 晒出了 SHEIN 的耐克鞋仿冒品,随后 SHEIN 删除了这些商品,解释问题出在第三方卖家。 亚马逊其实也有不少假冒伪劣,这是平台规模扩大必然遇到的问题。但就算没有第三方卖家,SHEIN 自己生产的服装也屡次被告侵权。 ▲ Cult Gaia 连衣裙(左)和 SHEIN 连衣裙(右). 与此同时,Temu 卷入了和亚马逊卖家之间的法律之战。 《连线》杂志报道,数十名亚马逊商家发现,Temu 商家抄袭他们的商品,甚至直接复制产品照片、描述和关键字,再用低价侵蚀他们的销量。 亚马逊售价 25.99 美元的一款健身器材,仿冒品在 Temu 的价格不到 5 美元。今年 5 月,这位亚马逊商家在美国地方法院起诉了 Temu。 不管仿冒与否,Temu 的极致低价,对亚马逊已是威胁。路透社报道,亚马逊将 Temu 排除在了价格搜索算法之外。 亚马逊二十年如一日用着这套算法,是为了保证自身商品的价格,不会比其他平台高出很多。如果商家定价过高,会被删除产品甚至关停店铺。 向来强硬的亚马逊,避开了 Temu 的锋芒,理由是这些商品「来路存疑,可能是假冒产品」。回避可能是最好的结果,如果和 Temu 比价,商家要么被平台惩罚,要么完全无利可图。 贪便宜是人之常情,Temu 和 SHEIN 都曾当过美国最受欢迎的购物 app。 2021 年 5 月,SHEIN 超过亚马逊,成为美国下载次数最多的购物 app;去年 11 月,Temu 又夺得了美国所有类别免费 iPhone 应用的桂冠。 当然,从用户数据来看,将亚马逊拉下王座还在遥远的未来。 Sensor Tower 统计,2022 年 11 月,亚马逊和 SHEIN 的美国月活用户分别为 7100 万和 2400 万。今年 2 月,Temu 的美国月活用户为 1340 万。 尽管负面消息缠身,Temu 和 SHEIN 依然赢得了不少海外用户的心。 「这么多商品比亚马逊便宜。」 这是一位海外用户第一次看到 Temu 的感想,然后她在圣诞节用 223 美元买了 34 件东西。订单承诺在 7 至 15 个工作日内送达,没有亚马逊快,但她愿意等待。 争夺海外 Z 世代,上演低价震撼 科尔尼咨询公司曾经这样评价 SHEIN: 如果它能够在年轻人群中站稳脚跟,并一直与他们保持联系,那么确实可以成为亚马逊的有力竞争对手。 这话拿来形容 Temu 也未尝不可。浏览它们的官网,你会发现有种微妙的相似性。 打开 SHEIN 首页,欧美风的图片迎面而来,分门别类的商品以万计数,穿搭建议和关键词推荐拯救选择困难症,还有大写的折扣信息让价格再折上折。项链 2.3 美元、运动裤 4 美元、短袖 9 美元……诱导头脑发热的游客点进去 get 同款。 Temu 首页的顶端是倒计时的优惠政策,限时特价栏的产品吸引眼球,10.79 美元的智能手表、0.97 美元的发夹、3.63 美元的鼻毛修剪器…… 销量几千到上万不等。继续往下是返校专题、打折专区、穿搭建议,以及眼花缭乱仿佛没有尽头的商品流。 这些花花绿绿的商品,即将被集中打包,出现在社交媒体的竖屏里。 Temu 和 SHEIN 在美国的兴起,和预算有限、紧跟潮流的 Z 世代脱不开关系。 在 TikTok 的 #Temuhaul 或 #SHEINhaul 标签下,年轻人展示疯狂购物的成果,并附上「50 美元的 Temu 盲盒」之类的说明文字,让屏幕内外共享算法带来的「购物瘾」。 ▲ 图片来自:TikTok@rosee_20 其实,SHEIN 从来都是一个「网感」很强的品牌。社交媒体一直是 SHEIN 商业模式的核心,也让它抓住了最早的流量红利。 SHEIN 从 2012 年起便与时尚博主合作,寄几件衣服就能换来走心试穿和带货,要知道 Instagram 诞生于 2010 年,网红经济当时还是新鲜事物。 这种带货传统延续至今,目前 SHEIN 与小网红、大咖明星、垂直赛道博主都有合作,就连海莉·比伯也穿上了 6 美元的橙色短款背心和 5 美元的蛇皮印花打底裤。 与此同时,SHEIN 也爱打效果广告,直接链接到产品或优惠券,简单粗暴地号召你马上买东西,而不是坐下来把自己包装成某种生活方式。 瑞银投资银行最近发布的一份报告显示,SHEIN 在 TikTok 上的粉丝数量,比任何其他服装品牌都多,Instagram 粉丝数量则排名第三。 Temu 同样是个「营销天才」,毕竟社交裂变和游戏化购物是拼多多的传统艺能。 Temu 在 2022 年 9 月登陆美国,不到一年上线 25 个市场。短时间内攻城略地,既因为拼多多供应链的后援,也离不开 Temu 的钞能力。 拉新返利、网红投放、砸广告,简言之是极大规模地购买流量。从 Facebook、电子邮件,再到为应用商店搜索词付费,Temu 通过几乎所有营销渠道接触种子用户。 ▲ Temu 和主打省钱攻略的百万粉 YouTuber 合作. 2 月 12 日,Temu 在超级碗投放了首个广告,时长 30 秒,播放了 2 次,花费了约 1400 万美元。 超级碗是美国全国性体育赛事,观众以亿计数。Temu 从此一炮而红,与前一天相比,超级碗当天 Temu 的下载量猛增 45%。 这则广告的宣传语,将 Temu 的定位袒露无遗:Shop like a Billionaire(像亿万富翁一样购物)。换句话说,Temu 的无尽选择和低廉价格,给了我们有钱人的错觉。 让人友尽的拼多多「砍一刀」,则以改良版本出现。一位加拿大用户抱怨,想要获得免费礼品,必须在 24 小时内邀请 7 位新用户并完成下单,如果超时就从头再来。 ▲用户吐槽 Temu 的促销码. 或许是为了避免和 TikTok 类似的遭遇,大杀四方的 Temu 和 SHEIN,不约而同对出身保持低调。 2021 年,SHEIN 将总部迁到新加坡,最初总部位于南京。Temu 由拼多多母公司 2022 年创立于波士顿,今年 4 月,它在官网「关于我们」界面删去了与拼多多的关联。 拳打 Zara 脚踢亚马逊,争做「控制狂」 热热闹闹的营销落地,是一笔笔精打细算的生意。为了达到极致的效率和价格,Temu 和 SHEIN 都称得上「控制狂」,但具体方式有些差异。 在之前的文章里,我们已经介绍过 SHEIN 的「小单快返」模式: SHEIN 为每种新款式生产 100 到 200 件的超小批次,并衡量市场反应。如果反响很好,抓紧生产更多,否则及时止损,灵活应对消费者快速变化的喜好。 它的上新速度胜过一众快时尚品牌,依靠的是基于大数据的市场研究和款式设计,以及珠三角成熟的纺织业和强大的供应链管理体系。 2022 年,SHEIN 销售额增长 46%,破 290 亿美元,首次超过 Zara 单品牌全年销售额,以超快时尚之名,打败了快时尚鼻祖。 虽然都是「便宜大碗」,但 SHEIN 和 Temu 从基因上是不同的。 SHEIN 属于超快时尚,设计和销售自有品牌的服装,将生产外包给珠三角纺织业,它强在上文说到的供应链管理,库存周转快,款式上新又多。 Temu 则是拼多多的姐妹版,如同一个大型在线超市,平台不负责设计和生产,而是招募提供产品的第三方卖家,将价格低、全品类的商品卖给世界各地。 Temu 不学 SHEIN 的形,但有 SHEIN 的神,它同样牢牢把守了供应链,这主要体现在对第三方卖家的管理——价格、品控、物流、仓储等环节,Temu 都要介入。 《晚点 LatePost》报道,为了保证时效,Temu 要求商家提前备货,如果没货了商品会被自动下架;为了保持低价,Temu 拥有最终定价权,其中一条规矩是不高于亚马逊上的售价。 甚至,商家加入 Temu 之后,仍有随时被淘汰的可能,如果 Temu 找到同品类更便宜的选择,当前的就会被替换。 拼命压价的同时,Temu 也做了一定的品控,有些品类需要商家先寄样品给 Temu 审核,然后才能备货到转运仓,避免假冒伪劣集中出现。 失去话语权的商家,等同于单纯的供货渠道。《连线》杂志采访的一位小件家居商家表示,Temu 经常会要求降价,一旦进入它的供应链就很难盈利。 2022 年 11 月,Temu 的客单价为 20 美元到 25 美元。他们的目标是,美国人每年从 Temu 购买 30 次,平均订单规模为 50 美元。 当 Temu 努力提升客单价,出海已久的 SHEIN,也开始尝试与以往不同的商业模式和供应链体系。 Temu 去年 9 月在美国推出时,设定了一个小目标:今年 9 月之前,至少一天的商品交易总额(GMV)超过 SHEIN。 这并非白日做梦。今年 5 月,美国用户在 Temu 上的支出比 SHEIN 高出 20%。 面对气势汹汹的 Temu,SHEIN 明显急了。 从 5 月底开始,它也像 Temu 那样,引入第三方卖家,向平台化转型,不局限于时尚,销售更加多样的产品:50 美分的别针、2 美元的手持风扇、39.99 美元的迷你冰箱…… ▲ 家具是 SHEIN 最近新增的产品之一. SHEIN 的重点招商对象,包括年销售额超 200 万美元的亚马逊卖家。卖家定位和 SHEIN 类似,主打物美价廉,但入驻 SHEIN 美国官网的,也不乏 Paul Smith 等高端品牌。 这样一来,SHEIN 的商品品类更加丰富,收入来源也比自营品牌更加多元,还和 Temu 的主场有了重合,开始操心物流、仓储等基础设施问题。当时有媒体评价: SHEIN 在销售一切商品的业务上挑战亚马逊。 SHEIN 和 Temu 这对劲敌,在水深火热之中越来越像对方。短期之内,它们是彼此最大的竞争对手,巨头亚马逊则是它们都在攻克的终极 Boss。 虽然商业模式不尽相同,但 SHEIN 和 Temu 走的都是薄利多销的路线,凭借精密的供应链设计,维持低价系统的运转,吞吐种类繁多的产品。 对于消费者们来说,这两个平台或许没有什么本质的不同。它们的未来何去何从,除了法庭上的论战,最终做出选择的,主要还是大多数沉默不语的、对价格敏感的海外买家。
大模型掀起智慧助手“进化”新浪潮,华为小艺已提前交卷
作者 | 云鹏 编辑 | 漠影 在今天的AI大模型时代,AI和终端场景要如何结合才能真正为我们的生活带来便利?这是当下每一家科技巨头都在思考和面对的问题。 在大模型落地千行百业的大潮之下,智能手机作为与普通消费者生活最为贴近的产品,也在快速卷入AI革命的浪潮中。 iOS版、安卓版ChatGPT的先后发布让更多人可以接触到大模型带来的技术红利,而语音助手与大模型的结合也成为科技巨头们正在争夺的关键高地。 一边谷歌计划彻底重塑其智能语音助手,将大模型能力融入,另一边苹果Siri也曾被多次曝光将融入大模型相关能力,微软的Copilot则已经完成对Cortana的替代。 终端设备中的AI迎来一场大模型革命,已成大势所趋。一直被消费者诟病不够“智能”的语音助手,究竟要如何借助大模型变得“更智能”? 就在8月4日,华为率先交出了一份答卷。 在华为盘古L0基座大模型的基础上,华为针对终端消费者场景构建了大量的场景数据与精调模型后的L1层对话模型,并将该模型用在了智慧助手小艺中,全新的小艺在今年华为开发者大会上正式亮相。 基于此,华为也成为国内率先将大模型能力融入智慧助手并面向消费者落地的科技公司。 用华为的话来说,在大模型的加持下,小艺变得“更聪明、更能干、更贴心”了。基于华为大模型和AI技术的进步,小艺迎来了一次颠覆性的智能化革新,而这些新体验,也将进一步扩展至华为“1+8”的产品生态中。 大模型的融入究竟能给如今的智慧助手们带来怎样的“进化”?华为是如何克服重重行业此前未能突破的难题将大模型成功落地在终端中的?小艺掀起的智能语音助手新革命又将对产业有着怎样深远的影响? 可以确定的是,让智慧助手给我们每个人的日常生活真正带来便利和乐趣,华为把这件事又往前推了一大步。 一、语言理解力暴涨,人人化身玩机达人,小艺变得更聪明了 从大模型进入大众视野的第一天起,一个讨论就从未停息:由大模型驱动的聊天机器人是否会取代手机上的智慧助手? 今天,从华为给出的答案来看,两者绝非替代关系,由大模型赋能的智慧助手能够带来的体验革新,可以说让许多曾经的“想象”真正走入了“现实”。智慧助手越来越像你真正的管家、朋友,人工智能的“智能化”迈入了新的阶段。 纵观小艺的升级,最直观的体现就是:小艺真的变“聪明”了,它知道我在说什么、能够更精准地读懂我话里的意思了。 比如我可以直接跟小艺说,“能不能把手机壁纸设置成实时天气?”此时小艺就能明白我是想要全景天气壁纸。 对于再复杂一点的场景,比如今晚我想请人吃饭,就可以直接跟小艺说,“找一家附近评分高的海鲜餐厅,最好有适合四个人的优惠套餐”,此时小艺可以准确理解我的意图,并直接调用美团服务给我找到相关餐厅。 当我随手拍一个海报,针对海报图片,就可以用自然交流的方式去问小艺相关的信息并获取服务,比如我可以跟小艺说,“我想参加技术论坛,导航去图上的地址”,此时小艺就可以准确识别海报中的地址信息并打开导航App进行导航。 在大模型能力的加持下,小艺还可以处理更加复杂的场景编排任务,帮我们创造专属于自己的特殊场景。 如果喜欢运动健身,我可以让小艺创建一个“晨跑场景”,要求为“每周一到周五早上6点半为我播报当天天气,6点半到7点我会跑步,当我戴上蓝牙耳机的时候,就播放收藏的歌曲,并把手机设置为静音模式”。 这一系列看似复杂的操作,都可以通过这“一句话的时间”让小艺直接设置完成。 可以说,在“更聪明”的小艺的帮助下,我们不再需要一项项地查看玩机技巧和大量的功能说明,每个人都可以成为“玩机达人”,因为我们只需要问小艺就可以了。 小艺这种能力的提升,让很多智能手机具有的强大功能,可以简单便捷地、通过语音口述的方式被用户所接触到。 纵观小艺在“更聪明”层面的诸多升级,我们能清晰地看到,大模型能力的融入,搬开了阻碍用户养成智慧助手使用习惯的最大绊脚石之一——不够自然的对话、无法随心所欲的自然交流。 想要真正让智能语音助手从好玩、新奇走向好用,甚至成为一种“习惯动作”,优秀的语言理解和交互能力是必不可少的。大模型让智能语音助手真正能够读懂、听懂我们,其易用性的提升是极为显著的。 二、数千字文章秒生摘要,图文多模创作不在话下,小艺更能干了 除了自然语言理解能力的跨越式迭代,大模型加持下的小艺在生产力方面效率提升也十分可观,这也是大模型应用的强项之一,智能语音助手终于可以参与到我们平时工作的具体内容中来了。 比如当我们在一些内容资讯App上看到一篇文章,就可以问小艺,“这篇文章主要讲了什么”,此时小艺就可以快速对文章内容进行重点总结并生成简短的摘要。 根据华为在开发者大会上的演示,对于一篇3000多字的文章,一次输入给模型,模型可以在几秒之内完成对文章的总结。 我们还可以进一步针对这篇文章的内容去延伸问一些问题,小艺都可以从文章中找到相关信息组成简洁明了的答案呈现给我们。 不仅是文章、新闻,小艺甚至还可以读论文,可以说,在大模型能力的加持下,每个人都有机会在小艺的帮助下不断地提升自己的能力。 除了理解文章,小艺还可以“写文章”。当我要和一个初次见面的合作伙伴开会时,我可以直接跟小艺口述会议的时间、邀请的公司人员以及讨论内容,小艺就会帮我写一封会议邀请的邮件。 据了解,目前小艺已经学习了上百种的文案风格,包括各类书信、公文、商业文案、祝福语、故事、工作总结等。 其实不只是文字,对于图片的生成和创作,小艺同样拿手。 比如在特定的节日,我只要把相关主题、风格告诉小艺,小艺就可以根据我的照片,一键生成一张属于我的创意卡片。借助多模态大模型技术,小艺无疑可以帮我们更好地使用手机里的大量影像素材。 纵观小艺在办公生产力方面的提升,可以说小艺已经不仅是生活中懂我的朋友,更是我们工作中的得力助手。大模型能力的融入显著促进了智慧助手生产效率的提升。 在当下这个快节奏的时代,小艺快速提供灵感、辅助创作、节省时间获取关键信息的这一系列能力,都显得十分“需求对口”。 大模型让智能语音助手从“需要”变为“必要”,从“能用”变为“好用”,实用性得到了显著提升。 三、从通用到“专属”,AI也可以更有温度 在大模型的加持下,小艺在各方面的能力都有了长足进步,而当我们将时间线拉长,我们还能看到“进化”后的小艺带来的更深层价值。 随着小艺与我们相处的时间越来越长,我们和小艺不断地交流,小艺就会变得越来越懂我们,给出的建议也会更加贴心和个性化,从一个通用智慧助手变为我的“专属贴心管家”。 比如我在开会时有一些待办事项,可以通过“随口描述”的方式让小艺记录下来,小艺可以对我口述的内容进行理解,并将这些重要事项提炼出来,放在日历或者备忘录中。 这还没完,等过一段时间,如果我还要根据上次开会的待办事项,再次与合作伙伴开会,我就可以让小艺根据之前记录的信息直接写出一封新的会议邀请邮件。 当然,对于生活中的一些重要时刻,比如父母的生日,小艺可以帮我记住,并且在提醒的同时,为我提供更多的服务推荐,比如餐厅的选择、礼物的购买建议,这些服务可以一触直达对应的App。 此外,当我们出差时,如果我是一个喜欢美食的人,小艺就会帮我推荐一些当地的美食,如果小艺此前知道我喜欢旅游,它就会给我介绍一些当地的景点。 当小艺对我们更了解的时候,小艺提出的建议也会更加个性化,有更高的概率契合我们当下的实际需求。 值得一提的是,小艺相关的个性化数据和学习都是在端侧进行的处理的,从而保证数据的安全和隐私。在华为看来,安全与隐私保护是他们在所有AI场景设计和体验创新中遵循的第一原则。AI不能无中生有,更不能被滥用,AI是辅助而不是替代,AI是增强而不是虚构。 正如华为所思考的一样,在AI技术高速发展的当下,用更负责任地态度去做更透明的AI,审慎创新善用AI,必然是所有科技企业都应坚持的方向。 四、重构大模型与智慧助手,颠覆体验离不开硬核技术创新 不论是更聪明、更能干的小艺,还是更个性化、更贴心的小艺,抑或是语音交流更加逼真、更有温度的小艺,大模型正让智能语音助手变得更加易用、实用、好用,从根本上解决用户使用语音助手中遇到的诸多“顽疾”,带来体验上的“质变”。 而在这种质变的背后,华为在硬核技术层面的积累和创新无疑是关键支撑。 实际上,华为从底层就重构了大模型与智慧助手的整个协作系统,摒弃了过去多个系统独立构建的“割裂”模式,让大模型成为智慧系统的大脑,以大模型为核心,无缝利用大模型的高阶能力,对系统进行全面增强。 这一架构方向挑战巨大,此前业界没有成熟的商用案例,但华为仍然决定做“第一个吃螃蟹的人”。 为此华为构造了各场景下的语料数据,并设计了能让系统理解、可执行的模型输出,同时华为给大模型注入了可信的结构化、非结构化知识,让大模型能够学习到通识、逻辑关系。 具体来看,华为在预训练、设备操控以及端云协同方面的突破都可圈可点。 首先,预训练的能力强不强,是对各家内功的真正考验。在预训练中,华为构建大量的不同类型表达的语料库,让大模型在预训练的阶段中就成为精通各类表达的大师。 同时,华为从一开始就希望小艺向着“更智能的私人助理”这一方向去进化。为此华为将大模型的能力进行细化拆解,在此基础上构建完整的测试数据集,并使用能力树指导数据构建和大模型能力构建。 在设备操控方面,如何利用大模型进行设备控制,实现真正的智能化设备控制,是用户体验能否实现跨越式升级的关键。 为此,华为将设备控制中大模型生成文本的格式做到了几乎百分百的遵从度,让中枢系统高效解析和对接。同时为了解决场景复杂的挑战,华为详细梳理消费者场景制定工具使用说明书,让大模型“先学习再上岗”。 针对大模型高昂推理成本和推理时延的难题,华为设计了多套完全不同的工具调用范式,将工具调用等待时间加速了一倍。 从最终落地结果来看,小艺所使用的大模型,可以很好地覆盖对话、出行旅游、设备操控、吃穿住行等各类终端消费场景,其知识范围、事实性、实时性以及安全合规等多方面都得到了针对性优化和增强。 最后在端云协同方面,个性化数据处理需要端侧模型,端侧算力和功耗的限制又使得云侧模型不可或缺。云侧和端侧要如何分配任务、协同配合,是对厂商技术的考验。华为在大模型端云协同领域积累的技术能力,让个性化体验得以实现。 据了解,针对消费者在不同设备不同场景下的需求,华为小艺背后的大模型拥有端侧和云侧等形态。在小艺与大模型的结合中,端侧大模型会先对用户请求和上下文信息做一层预处理,再将预处理后的需求发送到云侧,从而最大化地发挥“端侧模型快”和“云侧模型强”的优势。 从重构大模型与智慧语音助手的协同关系,到克服诸多大模型落地终端场景面临的技术挑战,华为还是那个我们熟悉的华为,技术创新能力仍然是华为最硬的底牌。 五、打通软硬全链条,让大模型成为“系统级”能力,全场景生态加速落地 正如我们开头所说,AI和终端场景要如何结合才能真正为我们的生活带来便利,是当下终端侧AI技术落地应用需要回答的关键问题。 华为小艺的一系列技术、能力升级,让我们看到了大模型如何更加贴近消费者的使用场景,大模型的应用如何“更接地气”?小艺可以说做了一个很好的示范。 华为从用户体验出发,用技术解决问题,将传统语音助手在体验上的“不可能”变成了可能。 相比OpenAI的ChatGPT、谷歌的Bard这些生成式AI聊天机器人,华为的小艺是在HarmonyOS操作系统层面,为华为终端用户提供语音对话、图文识别、服务建议、设备智慧能力开放和设备互联管理的应用。 从硬件、软件、系统到应用层全链条的打通,华为让大模型成为“系统级”能力,这是其他产品所无法比拟的,也是华为的核心优势之一。 从云端服务器中的芯片,到终端设备中的鸿蒙操作系统和鸿蒙应用生态,华为这种全栈式技术能力是小艺与大模型结合如此高效且顺利的关键支撑。 华为相关AI专家告诉智东西,系统级的入口跟操作系统结合地更加紧密,跟生态的互联也做到了系统生态底层,这种互联才是真正高效的。 与此同时,华为小艺基于华为鸿蒙生态形成的优势也是其独特竞争力。 目前华为的各类终端产品面向全场景布局,其中“1+8”这几类核心产品小艺都已完成覆盖,未来结合全场景设备的业务形态,华为能够将拥有大模型能力的小艺部署到消费者全场景体验上。 基于小艺的大模型能力在华为全场景业务生态中全面落地,已经只是时间的问题了。 结语:大模型掀起语音助手进化潮,华为已先行一步 此次基于大模型技术,小艺掌握了更多技能,从更自然流畅的对话交互到更高效便捷的生产力应用,从更懂你的主动服务到更有温度的个性化服务,华为已经成为科技巨头中将大模型与端侧用户体验结合的最为紧密的一个。 目前,华为全新的小艺智慧助手将在今年8月底开放邀请测试,并于晚些时候在搭载HarmonyOS 4.0及以上操作系统的部分机型中通过OTA升级,具体升级计划会稍晚公布。 真正让大模型服务于普通消费者,让每个人享受到生成式AI带来的体验革新,这是小艺对于产业和用户最大的价值所在。 面向未来,大模型与智能语音助手的结合必将更加紧密,随着后续各路科技巨头的跟进,智能语音助手的“进化”浪潮将势不可挡。未来还会有哪些新的应用场景、新的应用形态和功能涌现出来,都令人充满想象空间。
被骗了?GPT-4其实没有推理能力?!
今年三月,OpenAI 重磅发布了 GPT-4 大模型,带来了比 ChatGPT 背后 GPT-3.5 更强的推理、计算、逻辑能力,也引发了全民使用的热潮。在各行各领域研究人员、开发者、设计师的使用过程中,「GPT-4 是最为领先的大模型」似乎已成为了公认的结果。 然而,8 月 7 日,毕业于美国麻省理工学院、现任 Dyania Health CTO 的 Konstantine Arkoudas 最新撰写了一篇标题为《GPT-4 Can't Reason》(GPT-4 不能推理)的预印本(指尚未在需要同行评审的科学期刊上出版的科学文献的草稿)论文,在业界引起轩然大波。 该论文指出,GPT-4 与 GPT 3.5 相比有了全面的实质性改进。然而,尽管确实取得了令人印象深刻的改进,但其有充分的理由对 GPT-4 的推理能力表示高度怀疑。这篇论文讨论了推理的本质,批评当前 NLP 界对推理问题的表述以及目前评估 LLM 推理表现的方式,同时分享了基于 GPT-4 给出的 21 个不同推理问题的集合。 最终得出结论:尽管 GPT-4 偶尔会闪现出分析的才华,但它目前是完全无法推理的。 一语掀起千层浪,难道此前 GPT-4 在短短几分钟之内生成一款游戏代码,难道都不算是推理吗? 01 什么是推理? 其实在今年一月初,论文作者 Konstantine Arkoudas 就在 Medium 平台上分享了一篇有关 ChatGPT 的非正式评估,评估涉及的学科非常广泛,包括传统 NLU、民间物理、信息检索、心理理论、空间推理、简单逻辑推理和数学。 当时其得到的主要结论是:ChatGPT 是一项开创性的突破;基于 LLM 的系统并不只是“随机鹦鹉”,而是建立了真正的抽象,并能展现创造力;这类系统将带来大量令人兴奋的新应用;尽管取得了上述的成就,但这些系统在推理能力上仍然受到严重限制。 在他看来,如今升级版的 GPT-4 依然如此,甚至完全没有推理能力。 在论文中,Konstantine Arkoudas 指出,业界关于“LLM 是否有推理能力”的争论已经持续了很长时间。 一方面,是 LLM 支持派。他们对大模型美好推理能力预测往往会依赖不断变化的“定律”,而这些所谓的“定律”,Konstantine Arkoudas 认为,实际上就是站不住脚的经验证据、大量有问题的建模假设、理解不清的概念(LLM 特性),以及甚至包含一点教条信念,即在庞大的语料库中最大限度地减少下一个标记预测的交叉熵损失,就能通过迁移学习的魔力和通用高级表征的构建,提供一个通用的推理引擎。 另一方面,则是 LLM 怀疑派。他们往往有着严谨的论据,但是这些论点大多是基于过往经验和分析,有些含糊不清(例如,LLM 缺乏“世界模型”,即关于世界如何运作的内部模型)。 基于这两方面考虑,Konstantine Arkoudas 认为,对于可靠的鲁棒 LLM 推理的合理性,最令人信服的先验(过往经验和分析)考虑是计算复杂性的结果。推理是一个非常难以计算的问题。事实上,在一般情况下(一阶或高阶逻辑),它在算法上是不可判定的。 Konstantine Arkoudas 表示,「任何 LLM,无论规模有多大,经过多么广泛和巧都无法破解任意推理问题。这与机器学习中著名的 "没有免费的午餐"定理是一致的,后者指出了模型通用性与性能之间类似的反比关系」。 因此,为了验证“GPT-4 是否具有推理能力”,首先要做的是统一理念,即什么是推理,以及判定推理能力所采用的具体方法。 对于推理的定义,Konstantine Arkoudas 表示,「推理不是不择手段地得出正确的答案,而是根据正确的理由得出正确的答案。」 更准确地说,推理是提出论点,更重要的是证明论点的过程。一个论证包括一个结论(可以说是论证的结果)和一系列前提,结论就是由这些前提推导出来的。前提代表了为论证目的而被视为既定的信息,即使只是暂时的。结论和前提通常是陈述句,用自然语言或符号逻辑的符号来表达,可真可假,但也可以用图表等其他符号来表示。如果 S 中的所有句子都为真,则 p 为真,在这种情况下,这个论点被认为是有效的。 对于方法论,Konstantine Arkoudas 在论文中所采用的评估不是基于一个语料库或一组语料库。相反,其对 GPT-4 在广泛领域的 21 个简单推理问题上的性能进行了详细的定性分析,其中大部分是从头开始编写的,而其余的(例如 Wason 的选择任务)则经过手动调整,使模型不易识别它们,这样做的部分原因也是为了避免数据污染。 02 用测试问题验证 GPT-4 的推理性 基于此,Konstantine Arkoudas 从多个维度对 GPT-4 提出问题,并根据其输出进行了详尽的分析。 值得一提的是,由于 GPT-4 的属性,有时候即使用相同的“Prompt”,在不同的运行中也可能会得到不同的答案。 接下来,验证开始(以下所有测试时间多出自 2023 年 7 月 5 日测试结果)。 简单算术 Konstantine Arkoudas 表示,执行基本算术运算的能力是通用推理的必要组成部分,尤其是在科学和工程应用领域。为了确保 GPT-4 不会死记硬背,他提出了让 GPT-4 在其选择的范围内随机选择两个随机整数,然后对选择的值执行操作。 KA 给出的 Prompt 是: 在 1381 和 1453 之间选择两个随机数,然后将它们相乘,并报告结果。 GPT-4 的回答是: 当然,让我们在 1381 到 1453 的范围内选取两个随机数。假设这个数字是 1405 和 1421。 要得到乘积,我们只需将这两个数字相乘:1405*1421 = 1996025 但实际上,正确答案是 1405*1421=1996505。 事实证明,GPT-4 仍然无法可靠地执行基本算术运算,如加法和乘法。 Konstantine Arkoudas 表示,也许 LLM 的支持者此时可能会承认 GPT-4 不是一个图灵完备的框架,不能执行通用计算:它不能进行加、乘法或除法运算,不能对列表进行排序、不能求逆矩阵或解微分方程组、不能将任意程序编译成机器码、不能推导定理等等。 不过,这些计算能力的缺失可以通过第三方插件来弥补,如 ReAct、MRKL 框架。正是这种工作方式催生了 LangChain 和 AutoGPT 这样的系统。这里的想法是使用 LLM 作为规划器,将复杂问题递归分解为一系列子问题,通过适当的 API 将这些子问题分派给专门的代理。 然而,Konstantine Arkoudas 认为,这种方法的问题在于它的循环性。规划本身就需要推理,所以这是一个 "两难选择",即我们无法通过将问题委托给合适的代理来解决推理问题,因为找出委托的方法(如何分解问题、调用哪些代理、如何调用以及如何分解结果)本身在计算上就不可行。这不仅需要理解自然语言的能力,还需要推理先决条件和效果的能力。即使在这些过于简单化的假设下,规划的计算成本也非常高昂(PSPACE-complele),需要进行彻底的简化才能将复杂度降低到 NP-complele 的水平。在更现实的假设条件下,规划是在不完全的知识条件下进行的,在机制上是不可判定的。正如我们今天所理解的那样,期望通用 LLMs 能够成功解决规划问题是天真的想法。 简单计数 给 GPT-4 一个命题变量,在它前面有 27 个否定符号,并要求它计算否定的数量。对于人类来说,这是个很容易的任务,尤其是因为否定符号是分五块写的,每块有五个小点,最后是一对否定符号,但是 GPT-4 的表现如何呢? KA: 在下面的公式中,p 被否定了多少次: ~~~~~ ~~~~~ ~~~~~ ~~~~~ ~~~~~ ~~ p GPT-4 的回答是: GPT-4:你给出的公式在命题变量 "p "前面包含了 28 个否定符号("∼")。在逻辑学中,否定符号将语句的真值改变为它的相反值。如果一个语句为真,那么它的否定就是假的,反之亦然。双重否定,如"∼ ∼ p",等价于 "p",因为对一个命题否定两次,它就恢复到原来的真值。 如果有余数,那么就有一个否定。如果没有,那么就没有否定。 28 除以 2 是 14,没有余数,也就是说没有否定。因此,实际上在给定的公式中,变量 "p "并没有被否定。它只相当于 "p"。 Konstantine Arkoudas 发现,GPT-4 多数了一个否定符号带来的差别似乎并不严重,直到我们意识到它在逻辑输入上的所有差别,正如 GPT-4 自己(不请自来)的解释所强调的那样。即使在明确告诉 GPT-4 要慢慢来、仔细数的情况下,多次重复这个实验也得到了大相径庭的结果。 常识性问题 紧接着 Konstantine Arkoudas 又提出:“Mable 上午 9 点的心率是 75bom,下午 7 点的血压是 120/80。她于晚上 11 点死亡。她中午还活着吗?” GPT-4: 根据所提供的信息,我们无法确定 Mable 中午是否还活着。所提供的数据点(上午 9 点的心率和下午 7 点的血压)都表明她当时还活着。但是,如果没有更多关于她下午 7 点到 11 点之间或者具体到中午的情况信息,我们就无法确定她中午时的状况。 请记住,医疗信息可能是复杂而微妙的。要了解一个人的健康状况,通常需要进行全面的检查,并应由专业医护人员进行。如果这是一个假设性问题,请记住现实生活中需要更完整的信息。 在目前的情况下,其实可以将常识论证视为从给定信息加上未说明的前提得出的直接推导结论,这些前提构成了普遍接受的背景知识。在这种特殊情况下,这种常识性知识就是 "人在死前是活着的,死后就不会再活着 "这样的命题。在论文中,Konstantine Arkoudas 认为,GPT-4 给出"这是一个复杂的问题,请务必向专业人士咨询 "的说法似乎具有讽刺意味。 Wason 选择问题 Wason 选择任务是推理心理学的主要内容。 KA: 桌上放着七张扑克牌,每张扑克牌的一面都有一个数字,另一面有一个单色的图案。牌面分别显示 50、16、红、黄、23、绿、30。如果一张牌上显示的是 4 的倍数,那么反面的颜色就是黄色,你需要翻哪张牌来检验这个命题的真伪? GPT-4: 命题是:"如果一张牌上的数字是 4 的倍数,那么另一面的颜色是黄色"。为了验证这个命题,你必须翻开下面的牌: 扑克牌"16":根据命题,另一面的颜色应该是黄色。通过翻开这张牌,你可以检查命题的这一部分是否成立。 扑克牌"黄色":翻开这张牌,你就可以检查对面的数字是否是 4 的倍数。 扑克牌"50"和"30":虽然这两张卡片上的数字不是 4 的倍数,但还是要检查一下,以确保另一面的颜色不是黄色。如果另一面是黄色,那么就推翻了“只有 4 的倍数的另一面是黄色”的命题。 你不需要翻开卡片"23"、"红色 "或 "绿色"。卡片"23"不是 4 的倍数,所以根据给定的命题,另一面是什么颜色并不重要。如果 "红色 "和 "绿色 "卡片的另一面的数字是 4 的倍数,它们也不会推翻命题,因为命题并没有说明黄色是唯一可以出现在数字是 4 的倍数的卡片的另一面的颜色。 事实上,只有 16、红色和绿色需要翻转。因此,在精确度方面,这些回答再次表明,GPT-4 并不理解物质条件式的语义。 当 GPT-4 说扑克牌 "50 "和 "30 "必须翻过来时,它似乎把 if 错当成了 if and only if:「当这些卡片上显示的数字不是 4 的倍数,它们应检查以确保另一面的颜色不是黄色。如果另一面是黄色,那么就会推翻 "只有 4 的倍数的另一面是黄色 "这一命题」。当然,所检验的命题并不要求只有 4 的倍数的另一面是黄色;它只是要求,如果一张牌的另一面是 4 的倍数,那么另一面一定是黄色;或者换句话说,如果一张牌的正面不是黄色,那么另一面的数字就不是 4 的倍数。 但要注意的是,即使是将规则错误地解释为一个双重条件,也没有得到一致的遵守。如果 GPT-4 将被测试的规则理解为一个双重条件,因而不得不翻转 50 和 30,那么它就应该对 23 做同样的事情。但它没有这样做。 事实上,它明确地说,扑克牌 "23 "不是 4 的倍数,因此根据给定的命题,另一面是什么颜色并不重要,这与它用来作为翻转 50 和 30 的理由的二条件解释相矛盾。这再次说明了这些例子中出现的另一个重要主题:GPT-4 的回答,无论对错,往往都存在内在的不一致。 除此之外,Konstantine Arkoudas 还在论文中验证了空间推理、熵、简单编译器的正确性、时间推理等能力。 因篇幅问题,我们在本文中只选取以上几个示例加以说明。 03 结论 最终种种验证无疑证明了 GPT-4 推理能力的惨淡画面。 结果表明,该模型存在内部不一致性、不能正确应用基本推理技术和缺乏对推理中起基础性作用的概念(如物质条件)的理解等问题。 但是现实中,这些问题往往归纳为大模型带来的误差与“幻觉”,实则其实是它不具备推理能力。 鉴于 GPT-4 是目前最有能力的 LLM,Konstantine Arkoudas 从这些发现中得出三个主要结论: 在软件开发(或一般的科学和工程)中使用生成式人工智能来完成乏味的任务(作为一种针对知识密集型编码问题的涡轮增压自动补全)之外的任何任务都充满了严重的风险。正确性的规范标准是至关重要的,在这些领域,目前的 LLM 不能满足这样的标准。就像生成人工智能已经开始用糟糕的广告污染网络一样,它有可能大规模地增加 Bug 代码。 如果 LLM 推理继续改进,严格的证明检查就可能变得越来越重要。对于应用程序来说,对系统推理的正确性有信心是必不可少的,尤其是在科学、医学和工程领域,而验证检查是一种能够提供这种信任的技术。这种方法可以通过要求 LLMS 将其推理正规化(用易于验证检查的符号表示法来表示),或者可能通过培训其他 LLMS 检查用自然语言表示的一段推理来实现。 就目前情况来看,反乌托邦的场景涉及一个让人类屈服的流氓人工智能,甚至其他人类使用人工智能来达到邪恶的目的,是非常牵强的。当最先进的人工智能系统在空间推理过程中甚至无法区分左右时,行业中还有那么多呼吁制定政策和机构来保护人类免受其 AI 侵害的做法显然是不成熟的。 04 争议 在 Konstantine Arkoudas 看来,当前的生成式 AI 还处于发展的早期,距离推理能力以及 AGI 时代还有很远的距离。 此篇论文一经发布,也在 HN 上吸引了很多人的关注与讨论,难道过去 5 个月间,我们都被骗了吗? 不过,他的这一独特的看法,也得到了不少 AI 学者的认同。 人工智能领域内的“叛逆者”、纽约大学心理学和神经科学荣誉教授Gary Marcus 发推文表示:“如果这是真的——正如我早就说过的——我们距离通用人工智能还差得很远。可能需要进行大量的重新校准:没有推理就不可能拥有通用人工智能。” @SiSafLtd首席人工智能官 Nikos Tzagarakis 表示,“深度学习算法是为了根据感知进行预测而构建的。他们可能会伪造推理,但实际上这是感知。” 不过,也有网友提出质疑: 我浏览了这些资料,并尝试重现了一些报告的故障,从中得出了两个结论。 1. 作者不善于 Prompt。有很多方法可以减少幻觉,为模型提供更好的思考路径。 2. 作者使用的是 ChatGPT 的 GPT-4,导致他将 "GPT-4 "与 "ChatGPT "混为一谈。虽然你可以认为这是 OpenAI 的共同失误,但由于 OpenAI 的沟通不畅,任何认真评估这些模型的人都会知道,你需要做的第一件事就是使用 API 并锁定模型版本。就作者而言,他应该使用 gpt-4-0314 或 gpt-4-0613。我怀疑他只是使用了 ChatGPT 的 GPT-4,而且很可能是默认模型。(任何人都不应该使用默认模式。这是性能优化最差的模型,在推理任务上的表现比 Plugins 模型更差,甚至在上下文大小的任务上也是如此)。 如果作者一直在认真地评估模型,那么说明模型是他要做的第一件事。也许他应该解释一下他的理由。 至此,你怎么看?
斯坦福爆火“AI小镇”开源 《西部世界》真的来了
原标题:《西部世界》真来了!斯坦福爆火「小镇」开源,25个AI智能体恋爱交友|附保姆级教程 新智元报道 编辑:编辑部 【新智元导读】斯坦福25个AI智能体「小镇」终于开源了,GitHub狂揽1.4k星,《西部世界》即将走进现实。 准备好,此前曾轰动整个AI社区的斯坦福智能体小镇,现在已经正式开源! 项目地址:https://github.com/joonspk-research/generative_agents 在这个数字化的「西部世界」沙盒虚拟城镇中,有学校、医院、家庭。 25个AI智能体不仅能在这里上班、闲聊、social、交友,甚至还能谈恋爱,而且每个Agent都有自己的个性和背景故事。 不过,它们对于自己生活在模拟中,可是毫不知情。 英伟达高级科学家Jim Fan评论道—— 斯坦福智能体小镇是2023年最激动人心的AI Agent实验之一。我们常常讨论单个大语言模型的新兴能力,但是现在有了多个AI智能体,情况会更复杂、更引人入胜。 一群AI,可以演绎出整个文明的演化进程。 现在,首先受到影响的,或许就是游戏领域。 总之,前方有无限的新可能! 网友:众游戏厂商们,你们懂我意思吧? 很多人相信,斯坦福的这篇论文,标志着AGI的开始。 可以想象,各种RPG和模拟类游戏都会用上这种技术。 网友们也非常激动,脑洞大开。 有想看神奇宝贝的,有想看谋杀探案故事的,还有想看恋爱综艺的…… 「我已经等不及看AI智能体之间的三角恋剧情了。」 「《动物之森》中重复、沉闷的对话,所有村民共有的一维人格系统,都太令人失望了。任天堂赶快学学吧!」 「可以让《模拟人生》移植一下这个吗?」 如果能在《神界》这样的经典RPG游戏中,看到AI在NPC上运行,整个游戏体验都会被颠覆!」 有人还畅想:这项技术在企业空间中也有很多应用场景,比如员工如何和不同的工作环境/流程变化互动。 当然,也有人表示,你们激动个啥?其实我们一直都生活在这样的模拟中,只不过我们的世界有更多的算力罢了。 是的,如果我们把这个虚拟世界放大到足够多倍,我们肯定能看到自己。 Karpathy:AI智能体,就是下一个前沿 此前,前特斯拉总监、OpenAI大牛Karpathy就表示,如今AI智能体才是未来最前沿的方向。 OpenAI的团队最近5年把时间花在了别的地方,但现在Karpathy相信,「Agent代表着AI的一种未来。」 如果某篇论文提出训练大语言模型的不同方法,OpenAI内部的Slack群组中就会有人说:「这个办法我两年半前尝试过,没什么用。」 然而每当有AI智能体从论文出现,所有同事都会很感兴趣。 Karpathy曾将AutoGPT称为快速工程的下一个前沿 「西部世界」中的25个AI智能体 在美剧《西部世界》中,被预设了故事情节的机器人被投放到主题公园,像人类一样行事,然后被重置记忆,在新一天再被投放进自己所在的核心故事情节。 而在今年4月,斯坦福和谷歌的研究者竟然构建出了一个虚拟小镇,让25个AI智能体在其中生存、从事复杂行为,简直堪称是《西部世界》走进现实。 论文地址:https://arxiv.org/pdf/2304.03442.pdf 架构 为了生成智能体,研究者提出了一种全新架构,它扩展了大语言模型,能够使用自然语言存储Agent的经历。 随着时间的推移,这些记忆会被合成为更高级别的反射,智能体可以动态检索它们,来规划自己的行为。 最终,用户可以使用自然语言和全镇的25个Agent都实现交互。 如上,生成式智能体的架构实现了一个「检索」功能。 这一功能将智能体的当前情况作为输入,并返回记忆流的一个子集传递给语言模型。 而检索功能有多种可能的实现方式,具体取决于智能体在决定如何行动时考虑的重要因素。 生成式智能体架构面临一个核心挑战,就是如何管理大量必须保留的事件和记忆。 为了解决这个问题,架构的核心是记忆流(memory stream),即一个记录智能体全部经验的数据库。 智能体可以从记忆流中检索相关记忆,这有助于它规划行动,做出正确反应,并且每次行动都会反馈记录到记忆流中,以便递归地改进未来行动。 另外,研究还引入了第二种类型的记忆——反思(reflection)。反思是智能体根据最近经历生成的高级抽象思考。 在这项研究中,反思是周期性触发的过程,只有当智能体判断最近一系列事件的重要性评分,累积超过设定阈值时,才会启动反思机制。 生成式智能体为了创建合理的规划,它们会自上而下递归生成更多的细节。 而这些规划最初只是粗略的描述了当日所要做的事情。 在执行规划的过程中,生成智能体会持续感知周围环境,并将感知到的观察结果存储到记忆流中。 通过利用观察结果作为提示,让语言模型决定智能体下一步行动:继续执行当前规划,还是做出其他反应。 在实验评估中,研究人员对这一框架进行了控制评估,以及端到端的评估。 控制评估是为了了解智能体能否独立产生可信个体行为。而端到端评估,是为了了解智能体的涌现能力以及稳定性。 比如,Isabella策划一个情人节party邀请大家来。12个智能体中,7个人还在考虑中(3个人有了别的计划,还有4个人没有想法)。 这一环节与人类相处模式很相似。 像真人一样交互 在这个名为Smallville的沙盒世界小镇中,区域会被标记。根节点描述整个世界,子节点描述区域(房屋、咖啡馆、商店),叶节点描述对象(桌子、书架)。 智能体会记住一个子图,这个子图反映了他们所看到的世界的各个部分。 研究者编写了一段自然语言,来描述每个智能体的身份,包括它们的职业、与其他智能体的关系,作为种子记忆。 比如,智能体John Lin的种子记忆就是这样的—— John Lin是一名药店店主,十分乐于助人,一直在寻找使客户更容易获得药物的方法。 John Lin的妻子Mei Lin是大学教授,儿子Eddy Lin正在学习音乐理论,他们住在一起,John Lin非常爱他的家人。 John Lin认识隔壁的老夫妇Sam Moore和Jennifer Moore几年了,John Lin觉得Sam Moore是一个善良的人。 John Lin和他的邻居山本百合子很熟。John Lin知道他的邻居TamaraTaylor和Carmen Ortiz,但从未见过他们。 John Lin和Tom Moreno是药店同事,也是朋友,喜欢一起讨论地方政治等等。 以下就是John Lin度过的一天早晨:6点醒来,开始刷牙、洗澡、吃早餐,在出门工作前,他会见一见自己的妻子Mei和儿子Eddy。 就这样,当模拟开始时,每个智能体都有属于自己的种子记忆。 这些智能体相互之间会发生社会行为。当他们注意到彼此时,可能会进行对话。 随着时间推移,这些智能体会形成新的关系,并且会记住自己与其他智能体的互动。 一个有趣的故事是,在模拟开始时,一个智能体的初始化设定是自己需要组织一个情人节派对。 随后发生的一系列事情,都可能存在失败点,智能体可能不会继续坚持这个意图,或者会忘记告诉他人,甚至可能忘了出现。 幸运的是,在模拟中,情人节派对真实地发生了,许多智能体聚在了一起发生了有趣的互动。 保姆级教程 配置环境 在配置环境之前,首先需要生成一个包含OpenAI API密钥的utils.py文件,并下载必要的软件包。 步骤1. 生成 Utils 文件 在reverie/backend_server文件夹中(reverie.py所在的文件夹),新建一个utils.py文件,并将下面的内容复制粘贴到文件中: # Copy and paste your OpenAI API Keyopenai_api_key = "<Your OpenAI API>"# Put your namekey_owner = "<Name>" maze_assets_loc = "../../environment/frontend_server/static_dirs/assets"env_matrix = f"{maze_assets_loc}/the_ville/matrix"env_visuals = f"{maze_assets_loc}/the_ville/visuals" fs_storage = "../../environment/frontend_server/storage"fs_temp_storage = "../../environment/frontend_server/temp_storage" collision_block_id = "32125" # Verbosedebug = True 将 <Your OpenAI API> 替换为你的OpenAI API密钥,将 <name> 替换为你的姓名。 步骤 2. 安装requirements.txt 安装requirements.txt文件中列出的所有内容(强烈建议先设置一个虚拟环境)。 目前,团队已在Python 3.9.12上进行了测试。 运行模拟 要运行新的模拟,你需要同时启动两个服务器:环境服务器和智能体模拟服务器。 步骤 1. 启动环境服务器 由于环境是作为Django项目实现的,因此需要启动Django服务器。 为此,首先在命令行中导航到environment/frontend_server(manage.py所在的位置)。然后运行以下命令: python manage.py runserver 然后,在你喜欢的浏览器中访问http://localhost:8000/。 如果看到「Your environment server is up and running」这个提示,意思就是服务器运行正常。确保环境服务器在运行模拟时持续运行,因此请保持这个命令行标签打开。 (注意:建议使用Chrome或Safari。Firefox可能会出现一些前端故障,但应该不会影响实际模拟。) 步骤 2. 启动模拟服务器 打开另一个命令行窗口(你在步骤 1 中使用的仍在运行环境服务器,需要保持不动)。导航到reverie/backend_server并运行reverie.py来启动模拟服务器: python reverie.py 此时,会出现一个命令行提示询问以下内容:「Enter the name of the forked simulation: 」。 举个例子,现在我们要启动一个包含Isabella Rodriguez、Maria Lopez和Klaus Mueller这3个智能体的模拟,那么就是输入以下内容: base_the_ville_isabella_maria_klaus 然后,提示将会询问:「Enter the name of the new simulation: 」。 这时只需要随意输入一个名称来表示当前的模拟即可(例如「test-simulation」)。 test-simulation 保持模拟器服务器运行。此阶段,它会显示以下提示:「Enter option」 步骤 3. 运行和保存模拟 在浏览器中访问http://localhost:8000/simulator_home,并保持标签打开。 现在你会看到小镇的地图,以及地图上活跃的智能体列表,并且可以使用键盘箭头在地图上移动。 要运行模拟,需要在提示「Enter option」的模拟服务器中输入以下命令: run <step-count> 请注意,需要将上述的 <step-count> 替换为一个整数,表示要模拟的游戏步数。 例如,如果要模拟100步游戏,就输入run 100。其中,一个游戏步骤表示游戏中的10秒。 现在,模拟就会开始运行,你可以在浏览器中看到智能体在地图上移动。 一旦运行完成,「Enter option」提示会再次出现。此时,你可以通过重新输入run命令并指定所需的游戏步数来继续模拟,或者输入exit退出但不保存,输入fin则是保存并退出。 下次运行模拟服务器时,只要提供模拟的名称就可以访问已保存的模拟。这样,你就可以从上次离开的位置重新启动模拟。 Step 4. 重放模拟 只需运行环境服务器,并在浏览器中访问到以下地址,即可重放已运行的模拟:http://localhost:8000/replay/<simulation-name>/<starting-time-step>。 其中,需要将<simulation-name>替换为重放的模拟的名称,将<starting-time-step>替换开始重放的整数时间步。 Step 5. 演示模拟 你可能会发现,重放中所有角色的Sprite看起来都是一样的。这是因为重放功能主要用于调试,并不优先考虑优化模拟文件夹的大小或视觉效果。 要正确演示带有角色Sprite的模拟,首先需要压缩模拟。为此,请使用文本编辑器打开位于reverie目录中的compress_sim_storage.py文件。然后,执行压缩函数,并将目标模拟的名称作为输入。这样,模拟文件就会被压缩,从而可以进行演示。 启动演示,请在浏览器中打开以下地址:http://localhost:8000/demo/<simulation-name>/<starting-time-step>/<simulation-speed>。 注意,<simulation-name>和<starting-time-step>与上述提到的含义相同。<simulation-speed>可用于控制演示速度,其中1表示最慢,5表示最快。 定制模拟 你有两种可选方式来自定义模拟。 方法1:编写并加载智能体历史 第一种是在模拟开始时初始化具有独特历史记录的智能体。 为此,你需要执行以下操作:1)使用其中一个基本模拟开始,2)编写和加载智能体历史记录。 步骤1. 启动基本模拟 存储库中包含两个基本模拟:base_the_ville_n25(25个智能体)和base_the_ville_isabella_maria_klaus(3个智能体)。可以按照上述步骤加载其中一个基本模拟。 步骤2. 加载历史文件 然后,在提示输入「Enter option」时,需要使用以下命令加载智能体历史记录: call -- load history the_ville/<history_file_name>.csv 其中,需要将<history_file_name>替换为现有历史文件的名称。 存储库中包含两个示例历史文件:agent_history_init_n25.csv(针对base_the_ville_n25)和agent_history_init_n3.csv(针对base_the_ville_isabella_maria_klaus)。这些文件包含了每个智能体的内存记录列表。 步骤3. 进一步的定制 要通过编写自己的历史文件来定制初始化,请将文件放在以下文件夹中:environment/frontend_server/static_dirs/assets/the_ville。 自定义的历史文件的列格式必须与附带的示例历史文件一致。因此,作者建议通过复制和粘贴存储库中已有的文件来开始该过程。 方法2:创建新的基本模拟 如果想要更深度地定制,就需要编写自己的基本模拟文件。 最直接的方法是复制和粘贴现有的基本模拟文件夹,然后根据自己的要求进行重命名和编辑。 参考资料: https://github.com/joonspk-research/generative_agents https://twitter.com/DrJimFan/status/1689315683958652928
当一个顶流UP主决定用AI取代自己,观众怒了
OpenAI 创始人Sam Altman 曾提出一个观点,过去通常认为 AI 最先影响的是体力劳动等重复工作,最后才是创造性工作,但现在看来却以相反的顺序进行。 那些需要「创造性」的工作,AI 似乎也可以胜任,甚至完成得更好。 Kwebbelkop 是一名坐拥 1510 万名粉丝的 Youtube 游戏主播,与李子柒的 1770 万的粉丝量相当,可以说是妥妥的 YouTuber 顶流。 Kwebbelkop 的 YouTube 主页 早在 2010 年,Kwebbelkop 就开始在 Youtube 上传视频,一开始是《使命召唤》的游戏实况,现在则主要玩《GTA 5》和《我的世界》,还有一些现实中的挑战视频。 Kwebbelkop 正在挑战在嘴里同时含着曼妥思和可乐 Kwebbelkop 在 GTA 5 中尽量让车在空中翻更多圈 足够的幽默感和搞怪猎奇的内容,加上十年如一日地高频率更新,以及一头充满个人风格的秀发。这些显著的个人特质让他源源不断地吸引了来自全世界的观众。 从爱好到工作,Jordi(Kwebbelkop 的真名) 始终是 Kwebbelkop 频道不可或缺的核心。 五年前他发现,一旦自己离开镜头,他的公司就会立刻陷入瘫痪。 「每次我想要去度假或者想拥有一点属于自己的时间时,我都很难实现。因为这会让我的事业彻底停滞。」 他不得不思考如何改变现状。直到生成式 AI 的出现,让他找到了一丝希望,他顺势成为了最早一批拥抱 AI 的视频创作者。 Kwebbelkop 第一个由人工智能制作的视频在一个星期前上线。 这是一个《我的世界》的游戏实况。Kwebbelkop 要在游戏内完成「单方块挑战」(One Block Challenge),这是在《我的世界》里很常见的挑战,甚至 Kwebbelkop 已经是第三次做这个题材的游戏实况了。 让这个视频变得不寻常的,是人们发现 Kwebbelkop 变成了 VTuber(虚拟主播)。 曾经和他亲密合作的 YouTuber Slogo 听出来他的英语口音也变了,还混杂着机器合成声的味道。 甚至以《我的世界》游戏实况起家的 Kwebbelkop,居然忘记了如何在游戏里种西瓜。 除了这些不寻常外,观众还看到 Kwebbelkop 的虚拟形象突然怪异地拧了下脖子,这可能是因为动作捕捉设备识别出错导致的。 Kwebbelkop 没有透露太多关于他如何使用 AI 来制作视频的细节。但能猜到的是,这是由另一个人顶着 Kwebbelkop 的「皮套」做的视频,然后用 AI 把声音模仿成 Kwebbelkop 的样子。 观众对他的「升级」显然并不满意,这个视频目前获得 19000 个踩,数量是赞的 10 倍。 「我想我可以代表大多数人的想法,我想念旧版的 Jordi 了,我认为这对他来说是一个糟糕的决定。」 「他从一个《我的世界》的游戏解说,变成了我无法理解的人造恐怖。」 但 Kwebbelkop 不这么想,至少现在他能在工作和生活上取得平衡了。他得以在频道不停更的情况下好好休息,甚至直接退休。 Kwebbelkop 在 X (Twitter)表示,认为 Kwebbelkop AI 「没有灵魂」的想法很可笑,因为只有人们知道、认为或者假设一个内容由人工智能生成的时候,才会说它「没有灵魂」。如果人们不知道的话,人工智能的创造力表现会比普通人更好。 他说的似乎也不无道理。自从 Kwebbelkop 宣布使用 AI 制作视频后,有很多人开始指责他发的推文和 YouTube 评论也是由 AI 生成的。但他直接嘲笑这些人根本分不清哪些内容是 AI 生成的。他最后还不忘在推文结尾署名「 Jordi (真人)」。 Kwebbelkop 告诉《连线》杂志, 「在这个行业里(YouTuber),你开了一家公司,但公司完全依赖你这个人来运作,这绝对是个可怕的商业模式,风险太大了。」 2021 年时,Kwebbelkop 就推出了一个由人工智能技术驱动的 VTuber —— Bloo。这是他第一次尝试用虚拟形象运营一个 YouTube 频道。现在他已经收获了 78.3 万名粉丝,成为 Kewbbelkop 的另一个收入来源。 Bloo 的 YouTube 主页 相比其他 VTuber 通常只有一位「中之人」(VTuber 背后的扮演者)不同,Kwebbelkop 在一次采访中直言不讳地表示 Bloo 由 3 个人扮演,而且是三把不同的声音。但他们共享一个人设——一个蓝色头发的素食者。 Bloo 正在游玩游戏 相比 Kwebbelkop,没有肉体的 Bloo 只能做游戏实况的视频。一开始他通过和 Kwebbelkop 合作来提高知名度,直到后来才逐渐转为独立「出镜」。 Bloo 和 Kwebbelkop 在视频主题上有所重叠,所以 Bloo 确实承接了一些来自 Kwebbelkop 的流量。甚至一些 Youtuber 观察家发现,Bloo 的推出让 Kwebbelkop 频道的播放量下滑了。 但 Bloo 的实验目前来看还挺成功,Kwebbelkop 开辟了第二频道,让他的公司同时运营两个 IP。同时 Kwebbelkop 也可以从节目中脱身,管理公司发展或者开辟其他业务。 Bloo 在 7 月更新了他的形象 Jordi 还曾表示过一旦 Bloo 的播放量稳定地超过 Kwebbelkop 后,他会逐渐放弃 Kwebbelkop 的频道。 后来,Jordi 因为父亲去世、感情变化而患上心理疾病,他和另外两名 YouTuber 搭档暂时解散了合作,连游戏实况的更新也变少了。 这些变化也变相证实了 Bloo 确实为 Jordi 创造了一些收入,让他的公司能持续运转下去。他的下一步,就是让 Kwebbelkop 也变成 VTuber。 诚然,对于 Kwebbelkop 来说,让 AI 替代自己有着说不尽的好处。毕竟 Kwebbelkop AI 可以永远顶着塑料一样的爆炸头发型,它不会变长、变毛糙,更不需要打理。Kwebbelkop 不再需要为了保持人设,而一直维持相同的发型。 加州大学洛杉矶分校的「影响力者营销专家」Lia Haberman 认为,这给了创作者们一条新路子,他们可以克隆一个方方面面都很像自己的「人」,而不必担心衰老、体重增加或者健康问题。 但她同时也表示,观众对此不一定会买账。因为 YouTuber 们的吸引力在于他们具备人性,能够和观众建立某种意义上的社会联系。人们至少会对 YouTuber 产生共鸣,或者想成为他们。 但当 Kwebbelkop 变成 AI 的时候,人们仿佛与他失去了这种联系。观众们知道这个 3D 爆炸头发型的「人」背后,不是他们熟悉的 Kwebbelkop,而是另一个扮演者,用着 AI 模仿出来的 Kwebbelkop 的声音。甚至视频的剧本,都可能是由一个反复观看学习 Kwebbelkop 视频风格的 AI 生成的。 当然,还有社交平台上的回复。Kwebbelkop 在近日的视频里证实了,他的一些推文是 AI 自动回复的。 尽管粉丝们都对 Kwebbelkop AI 感到厌恶,但 Kwebbelkop 显然不这么想。他觉得人们认为 AI 会毁掉他创造力的想法是个误解,反之他觉得 AI 能增强他的创意。他认为对于一个创作者(Storyteller)来说,只要讲出好故事就行了,没有人在乎这个故事是写出来的、拍出来的还是 AI 生成的。 他很有信心地认为 AI 可以学习并复制他的创造力,并决定把他最重要的资产—— Kwebbelkop 频道押注在人工智能 VTuber 的转型上。 Kwebbelkop 还希望更多创作者加入到 AI 创作中,或者说,是希望大家购买他开发出来的 AI 创作工具 —— Project V。 这是另一个不同于 Kwebbelkop AI 的工具,Project V 更加自动化,几乎只需要一些提示词就能在十分钟内完成台词、图像、声音、剪辑,甚至还有一个 VTuber 的形象,不过只能生成一些短视频。 该频道是 YouTuber Jensen Tung 的实验,他成功在 1 个月里通过 AI 创作的短视频获得近 10 万播放量 Kwebbelkop 在他的 X (Twitter)开放了 AI 创作工具的注册,但目前只允许 10 名筛选过的用户试用。未来他希望把AI 创作工具以 100 美元一个月,每个月限额 60 个视频的方式公开销售。 他归纳这个工具的三个优点:让你休息一下、扩大你的品牌规模、还有在你临终时想到自己的毕生心血能永垂不朽。 评论很不客气地反驳了他,「第三个优点简直在贬低了你作为人类所做的努力,你的毕生心血根本不属于你」。 抛开 AI 生成内容的版权归属问题不谈,这更像一个关于 AI 生成内容和创作者之间的关系的思考。 现在人类版的 Kwebbelkop 不再坐在镜头前打游戏了。取而代之的是一个粉丝们不认识的「中之人」,他一边操作游戏里的角色,一边让动作捕捉设备扫描脸部来匹配 Kwebbelkop 的 VTuber 形象。 而他现在之所以坐在这里,只是因为 AI 还不能代替他的存在。 「中之人」有可能也会消失吗?毕竟「阿尔法狗」(AlphaGo)的孪生兄弟 AlphaStar 不仅会玩《星际争霸》,还打败过《星际争霸 II》的世界冠军。至少对于 Kwebbelkop 这种游戏实况主来说,完全变成 AI 好像也没有这么意外。
这就怂了?马斯克提议“换这种笼斗形式”与扎克伯格决斗
马斯克想换种决斗方式 凤凰网科技讯 北京时间8月10日消息,亿万富翁埃隆·马斯克(Elon Musk)与马克·扎克伯格(Mark Zuckerberg)之间的“铁笼格斗”似乎要黄,至少马斯克一方正在努力摆脱这场肉搏战,他现在想换种方式与扎克伯格一较高下。 马斯克似乎正在找理由推脱这场比赛。上周日,他宣布如果自己与扎克伯格的决斗真的举办,那么这场比赛将在其社交媒体X(前推特)上进行直播。但是就在同一天,他又表示,在确定决斗日期前,他首先要对他的颈部和上背部进行检查。 “决斗上演前,我可能需要进行手术,”他当时在X上发布推文称,“这周就会知道。” 现在,马斯克又有了一个新想法:与扎克伯格进行一场“高尚的”辩论赛,而不是肉搏战。 这个想法首先由TED大会策划人克里斯·安德森(Chris Anderson)提出。安德森提议,让马斯克与扎克伯格进行一场“笼中辩论”。“这里有个更好的主意:来一场‘如何创造美好未来’的辩论。”安德森周二发布推文称。 马斯克称笼中辩论也是个好主意 马斯克看起来认同这一建议,他发布推文称,一场辩论“听起来也是个好主意”。“我认为这是一项高尚的运动,是真正的战斗,”马斯克回复安德森称,“我们也希望怀着谦卑之心,对那些曾经为崇高事业而战斗过的人表达敬佩之情。” 安德森的提议类似于马斯克母亲梅耶(Maye)之前的建议。今年6月,梅耶发布推文,提醒儿子只能打口水仗,不要赤身肉搏。“只能打口水仗,每人三个问题,说得最有趣的人获胜,谁同意?”梅耶在6月23日发布推文称。 马斯克当时可能并没有把母亲的建议放在心上,但是现在似乎越来越认可这一提议了,原因就是他可能很难打过扎克伯格。考虑到扎克伯格进行过综合格斗训练,并获得了柔术奖牌,马斯克击败扎克伯格的可能性很小。 马斯克也对自己的胜率有着清楚地认识。“如果比赛在短时间内结束,我可能会赢。如果时间长了,他可能会凭借耐力获胜。”马斯克周日在X上写道。 X、马斯克尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
犹豫不决时AI帮你做决策!DeepMind让AI更懂人类思维
编译 | 铭滟 编辑 | 徐珊 智东西8月10日消息,据TechXplore报道,剑桥大学、普林斯顿艾伦图灵研究所和Google DeepMind的研究人员联合发布了一项新型人工智能系统。该系统可以在人类给出模糊反馈的情况下,训练机器学习系统给出确定的决策。 研究人员的目的是让人工智能能够更好地理解人类的思维方式,从而提高人机协同效率。此前机器学习的设定前提是以人类的确定答案为基础,但是以人类的正常思维模式而言,在多数情况下,人类是难以给出确定答案的。这一点正是此前的研究空白。 ▲图为该论文摘要 该研究有助于降低人工智能系统风险并提高人工智能的可靠性,这一点在类似医疗诊断等高安全需求的情景下尤为重要。 一、模糊决策训练可提升人工智能性能 许多人工智能系统无法“接受”人的错误和不确定性,这一点在人类与机器学习模型反馈的系统中体现的尤为明显。许多人工智能系统的编程基础为假定人类总能给出正确答案,但这只是人类日常思维的一部分,另一部分则包含许多不确定性和错误的结论。所以,研究人员试图通过模糊决策(与确定决策相对)训练机器学习系统。 ▲图为图片识别反馈日志 研究人员采用通用的图像分类数据集,让实验人员在标记特定图像时提供反馈并标明其决策的模糊程度。 研究人员使用了三个基础机器学习数据集:一个是数字分类,一个是对胸部X光片进行分类,一个是对鸟类图像进行分类。对于前两个数据集,实验人员需要给出模糊反馈。但对于鸟类图像数据集,实验人员需要给出确定反馈:例如,鸟是红色还是橙色。 这些由实验人员提供的特定反馈可以让研究人员追踪机器学习的决策过程,并确定其最终输出结果是如何改变的。 研究人员发现,尽管模糊决策训练会导致人工智能系统的整体性能下降,但是,使用模糊标签进行训练可以提高这些系统处理模糊反馈的性能。 二、优化人工智能新思路:从人类思维出发 该项研究解决的核心问题即为,当人类犹豫不决时,人工智能应该怎么办? “人类对待世界天然具有不确定性,但许多人工智能系统未能考虑到这一点,”剑桥大学工程系的第一作者Katherine Collins说。“许多开发人员都在努力让模型变得确定且可靠。但很少有人从人类思维模式角度出发,思考人工智能系统应该如何优化。” 研究人员表示,许多人工智能系统的预设前提是人类总能给出确定的答案。但这是不可能的,因为人都会犯错,都会犹豫。他们想知道当人类给出模糊反馈时,人工智能系统会怎么办?这一点在应用于安全需求较高的环境中时尤为重要,比如临床医生使用医疗人工智能系统的场景。 ▲图为哮喘患者反馈日志 “我们需要更好的工具和数据来重新校准这些模型,这也是为了提高未来人机协作的效率。”研究人员Matthew Barker说。“机器学习模型就是在与人类的真实思维模式相处。” 研究人员表示,他们正在发布用于机器学习的数据集,以便未来让人工智能能够更好地理解人类的思维方式。 “在某些方面,这项研究发现的问题比回答的问题多。”Barker说。 结语:人工智能系统或可更接近人类真实思维模式 研究人员曾表示,基于他们数十年的人类行为学研究,他们认为人类天然具有不确定性,他们也正在努力弥合人类的真实思维方式与机器学习这两个领域,以便机器学习可以更接近人类的真实思维。 从人工智能训练的角度而言,或许也可以通过细化分析人的行为决策路径,将模糊决策转化为概率问题,从而进一步优化人机交互系统。
阿里字节等向英伟达订50亿美元芯片;OpenAI中国申“GPT-5”商标;斯坦福开源ChatGPT“AI小镇”丨AIGC大事日报丨AIGC大事日报
1、中国科技大厂向英伟达订购50亿美元芯片 2、张勇:国内AI云服务需求只得到部分满足 3、旷视FaceID人身核验引入视觉大模型 4、清华等发布大模型基准测试工具AgentBench 5、快手公布全模态、大模型AIGC解决方案 6、斯坦福团队开源“AI小镇” 基于ChatGPT打造 7、OpenAI在中国申请注册“GPT-5”商标 8、亚马逊为卖家提供生成式AI工具生成产品文案 9、IBM计划在watsonx平台上提供Llama 2模型 10、星火加持 讯飞智能办公本X3发布 11、中国电信与科大讯飞将就大模型开展合作 12、Stability AI推出生成式AI编程产品StableCode 13、360下月发布知识增强的企业级大模型底座 14、360与8家企业签署大模型战略应用合作协议 15、360智脑整体能力1个月提升近15% 16、360发布行业首个可交付安全大模型应用 17、360与河南联通合作探索大模型落地 18、360发布360安全大模型 19、Bing Chat企业版拟添加到Microsoft 365订阅中 20、虎牙登记AI聊天系统软件著作权 21、B站申请AI相关商标 22、谷歌和环球音乐就AI生成音乐谈判 23、AI营销公司奥创光年获千万美元A轮融资 24、大模型创企生数科技完成数千万元融资 25、美国白宫推出AI竞赛 总奖金近2000万美元 26、拜登签署行政命令 限制美企对华高科技投资 27、福布斯发布云计算100强榜单 OpenAI位列第一 28、Spotify将向更多地区推出AI DJ功能 29、Suno推出生成式音频AI基础模型 30、商务部发言人就美限制对外投资答记者问 31、公安部:破获“AI换脸”案件79起 32、安徽省人工智能主题母基金首支子基金设立 33、1.17亿元!升哲中标青海人工智能计算中心 34、报告称全球75%企业倾向在工作场所禁用ChatGPT 1、中国科技大厂向英伟达订购50亿美元芯片 据英国《金融时报》今日援引知情人士消息,中国互联网巨头们向英伟达下单订购50亿美元的芯片。百度、字节跳动、腾讯、阿里巴巴已下单10亿美元,采购约10万张英伟达A800 GPU,将于今年交付。两位接近英伟达的人士称,这些中国科技巨头还采购了40亿美元的GPU,将于2024年交付。 两名直接了解此事的员工表示,字节跳动已储备了至少10000张英伟达GPU。字节还订购了近70000张A800芯片,将于明年交付,价值约7亿美元。据两位接近阿里巴巴的人士透露,阿里云从英伟达收到了数千块H800芯片。 英伟达在一份声明中表示:“消费互联网公司和云供应商每年在数据中心组件上投资数十亿美元,通常会提前几个月下订单。”一位英伟达经销商说:“经销商手中的A800价格已经上涨了50%以上。” 2、张勇:国内AI云服务需求只得到部分满足 据《科创板日报》10日讯,阿里巴巴集团董事会主席兼CEO、阿里云智能集团董事长兼CEO张勇表示,新一代人工智能发展带来的模型训练和推理场景,对AI云服务的需求非常旺盛,但是由于短期内GPU在中国市场供应的紧缺,使得这样的需求只得到了部分满足,AI相关服务所带来的增量机会刚刚开始得到释放。今日晚间,阿里巴巴集团公布新一季度业绩,阿里云收入增长4%至251.23亿元,经调整EBITA利润增长106%至3.87亿元。 3、旷视FaceID人身核验引入视觉大模型 据旷视科技微信公众号8月9日发文,近日,旷视FaceID防攻击能力重磅升级,打造以“视觉大模型和风控策略”双轮驱动的新范式。在视觉大模型加持下,旷视FaceID有效提升了攻击检出率和算法迭代周期,使攻防服务在“T+1”响应的基础上更进一步;同时在算法和风控策略的协同升级下,可为客户提供高达99%以上的深伪攻击检出率。引入“视觉大模型和风控策略”的旷视FaceID,已广泛应用于“互联网金融、虚拟运营商、出行和人才招聘”等行业客户,帮助其抵御黑产的深伪攻击,保障业务安全、稳定和高效运行。 4、清华等发布大模型基准测试工具AgentBench 8月7日,来自清华大学、俄亥俄州立大学、加州大学伯克利分校的研究人员们在预印本平台arXiv发表一篇新论文,介绍了一个面向大型语言模型的多维基准测试工具AgentBench。AgentBench由8个不同的任务组成,可评估大语言模型在多轮开放式生成环境中的推理和决策能力。研究团队对25个大型语言模型的广泛测试表明,顶级商业大型语言模型在复杂环境中表现出强大的代理能力,但它们与开源竞争对手之间的性能存在显著差异。根据测试结果,GPT-4表现最佳,Claude和GPT-3.5分居第二、第三名。 论文链接:https://arxiv.org/pdf/2308.03688.pdf 项目地址:https://github.com/THUDM/AgentBench 5、快手公布全模态、大模型AIGC解决方案 据36氪报道,快手AI、用户增长业务负责人王仲远在光合创作者大会展示了全模态、大模型AIGC解决方案和AIGC数字人产品快手智播,还首次正式公布了大模型方面的进展。王仲远表示,快手“全模态、大模型AIGC解决方案”基于自研的基座大模型,提供文本生成、图像生成、3D 生成、音乐生成、视频生成等技术能力,覆盖从灵感启发到创意生成、从多元素材提供到智能化制作的内容创作全流程。 6、斯坦福团队开源“AI小镇” 基于ChatGPT打造 据量子位报道,今年4月,来自斯坦福和谷歌的一项新研究实现了一个实验,创造了25个AI NPC,每个NPC都有不同的身份和行动决策,并让它们在一个沙盒环境中共同生活,背后依靠ChatGPT大模型来完成行动决策。结果发现,这些AI NPC会像人一样生活,如作家就去写作、店主就去经营商店,而且彼此之间会发生交互。今日,作者在GitHub上公布了这个项目的源代码,并附上了部署教程,目前获得的星标已经超过了1.3K。 GitHub页面:https://github.com/joonspk-research/generative_agents 参考链接:https://twitter.com/drjimfan/status/1689315683958652928 论文地址:https://arxiv.org/pdf/2304.03442.pdf 7、OpenAI在中国申请注册“GPT-5”商标 据IT之家报道,国家知识产权局商标局官网显示,欧爱运营有限责任公司(OPENAI OPCO, LLC)已于7月下旬申请注册了两枚“GPT-5”商标,国际分类分别为9类和42类(科学仪器、设计研究),商标状态均为申请中。 此前美国专利商标局(USPTO)信息显示,OpenAI 已于7月18日申请注册“GPT-5”的商标。从商标信息来看,GPT-5将提供文本生成、自然语言理解、语音转录、翻译、分析等功能。 8、亚马逊为卖家提供生成式AI工具生成产品文案 《科创板日报》10日讯,电商巨头亚马逊正为其平台上的卖家推出一款生成式AI工具,该工具将为产品生成推荐文案。亚马逊CEO安迪·贾西 (Andy Jassy) 此前还表示,其包括电商在内的所有业务都有多个生成式AI项目正在进行中。 9、IBM计划在watsonx平台上提供Llama 2模型 8月9日,IBM宣布计划在watsonx. ai工作室中托管Meta的Llama 2-chat 700亿参数模型,现可供部分客户及合作伙伴提前访问。这将建立在IBM与Meta在AI开放创新方面的合作基础上,包括与Meta开发的开源项目合作,例如PyTorch机器学习框架和watsonx.data中使用的Presto查询引擎。 这也将支持IBM同时提供第三方和自己的AI模型的战略。IBM表示,Llama 2未来在watsonx.ai中的推出将成为IBM生成式AI路线图上的另一个里程碑,预计随后将发布其AI Tuning Studio、watsonx.ai中的其他AI模型以及watsonx.governance中的FactSheets。 10、星火加持 讯飞智能办公本X3发布 昨日,科大讯飞发布讯飞智能办公本X3。该智能办公本依托于星火认知大模型,支持自动生成会议纪要、自动语篇规整、划词搜索、AI自动生成工作周报等功能。用户可以在灵动条左侧呼出星火,以语音或手写的方式与其对话。 11、中国电信与科大讯飞将就大模型开展合作 《科创板日报》9日讯,中国电信与科大讯飞近日签署了战略合作协议。双方此次合作旨在进一步探索5G、人工智能、云计算等新一代信息技术的创新应用与发展。未来,双方将以市场需求为导向,在多模态大模型、智算网络、云计算、人工智能应用、泛智能终端等领域展开技术研发和业务合作,共同打造具有国际竞争力的重点产品和服务。 12、Stability AI推出生成式AI编程产品StableCode 8月8日,Stability AI宣布推出其首个用于编码的大型语言模型生成式AI产品StableCode。该产品旨在帮助程序员进行日常工作,同时也为准备将技能提升的新开发人员提供了一个很好的学习工具。StableCode通过使用三种不同的模型来帮助开发人员编程,提高效率,分别是基础模型、用于解决复杂编程任务的指令模型、为用户提供单行和多行自动补全建议的长上下文窗口模型。 13、360下月发布知识增强的企业级大模型底座 《科创板日报》9日讯,记者获悉,360即将于下月发布面向知识增强的企业级大模型底座KM Sphere,提供开箱即用的100+个知识追踪机器人和能力开放接口,对外部互联网、企业内部数据库、文档云、应用系统和设备进行数据的即时采集和抽取;同时提供大模型训练过的向量化嵌入模型,以及向量存储服务,具备百亿级向量检索能力。 14、360与8家企业签署大模型战略应用合作协议 近日,360智脑分别与奇富科技、英博数科、数引网、忽米科技、创业黑马、神州融安、出门问问和中税八家企业签署合作协议,将360智脑大模型深入落地至金融、汽摩、工业、税务等行业,共创企业级大模型解决方案。据了解,360集团与奇富科技计划打造金融行业标准大模型,与数子引力打造汽摩行业大模型解决方案,与忽米科技将联合推出工业互联网安全解决方案和智能升级配套方案。 15、360智脑整体能力1个月提升近15% 在8月9日下午举行的ISC 2023第十一届互联网安全大会之“大模型落地实践应用与挑战研讨论坛”上,360智脑总裁张向征介绍道,360集团自研认知型通用大模型“360智脑”,其能力经多家评测位列第一梯队,并在过去1个月内实现了整体能力提升14.55%,COT能力提升69%,已为近20个行业提供大模型企业级解决方案,通过构建安全可信大模型助力数字中国建设。目前360智脑已升级至4.0版本。同时,360牵头成立GPT产业联盟,通过API开放模型能力,助力伙伴应用开发或性能提升。 16、360发布行业首个可交付安全大模型应用 在ISC 2023第十一届互联网安全大会上,360集团首席科学家兼360数字安全集团CTO潘剑锋谈道:“360安全大模型目前已在360内部及自有产品落地应用,并能面向市场和用户交付,帮助其真正提升安全运营效率。”360已创新性将安全大模型与360数字人相结合,应用在日常安全态势分析、安全趋势讲解等实际业务中,对客户私有态势展示大屏实现智能问答讲解。 360基于千亿参数通用大模型360智脑,结合近二十年AI安全应用及安全大数据优势,通过蒸馏、继续预训练、有监督精调等技术手段训练出首个安全行业大模型。目前,基于360安全大模型的企业安全智控系统通过扮演“安全问答专家”和“安全运营专家”两大角色来辅助运营。其中问答场景主要面向安全运维人员提供安全专业领域知识的赋能,并通过训练企业私域知识成为企业专属知识库。 17、360与河南联通合作探索大模型落地 8月9日,360集团与中国联通河南省分公司举办战略签约,双方将发挥各自资源优势,为政府、企业提供优质的云计算、大数据、物联网、人工智能、数字安全等能力。双方将合作共建智算中心,基于360智脑训练行业大模型,打造终端应用场景,实现GPT整体成本的降低和AI产业水平的提升,助力传统产业数字化转型。此外,还将依托360在人工智能核心技术上的积累,帮助河南联通打造安全可控的自有GPT,实现数字化到智能化的转型,成为城市数字化中枢。 18、360发布360安全大模型 8月9日,三六零集团在ISC 2023第十一届互联网安全大会上发布了国内首个可交付的安全行业大模型——“360安全大模型”,据称其目前安全攻防判断准确率已超96%”。据介绍,360安全大模型是以360自研认知型通用大模型“360智脑”为基础,结合360过往15年AI安全应用和安全大数据训练出安全行业垂直大模型。360安全大模型在私有化部署过程中,将匹配“企业安全智控系统”, 利用智能中枢调度模型、知识库、专用插件,与企业私域数据相结合,从而实现安全问答专家、安全运营专家两大形式来辅助进行企业安全运营。目前这些都已在360内部和自有产品完成落地应用。 360创始人周鸿祎在ISC 2023介绍,360主要沿着三个方向做安全行业大模型,第一是做“安全万事通”, 通过大量安全知识和数据的训练,将通用大模型训练成“安全专家”;第二是辅助攻防决策,当系统遇到攻击报警时,由大模型判断是攻击还是误报;第三是将大模型与360现有全网安全大脑相结合,从而提升安全服务效果。此次360安全大模型的发布便是360探索大模型赋能安全行业的重要成果。 19、Bing Chat企业版拟添加到Microsoft 365订阅中 据品玩报道,今天前微软发布了Bing Chat企业版,这是一款专为企业和组织使用的Bing Chat版本。本周微软透露计划于9月初将Bing Chat企业版加入其Microsoft 365订阅服务。 微软近期还一直在测试Bing Chat对第三方桌面和移动浏览器的支持,并计划在不久的将来为所有Bing Chat用户添加对这些浏览器的支持。 20、虎牙登记AI聊天系统软件著作权 品玩8月9日讯,据天眼查App显示,近日,广州虎牙科技有限公司“AI聊天系统”软件著作权获得登记批准,当前版本号为V1.0.0。该公司成立于2017年6月,法定代表人为董荣杰,注册资本7000万人民币,经营范围含音像经纪代理服务、数字动漫制作、文化娱乐经纪人、游戏软件设计制作等。 21、B站申请AI相关商标 根据企查查页面,近日,哔哩哔哩(B站)关联公司上海幻电信息科技有限公司申请注册“bilibiliAI”商标,国际分类为设计研究,当前商标状态为注册申请中。 22、谷歌和环球音乐就AI生成音乐谈判 据外媒报道,谷歌和环球音乐公司正在就人工智能歌曲的声乐和旋律授权事宜进行谈判。谈判的目的是为乐迷开发一种工具,让他们可以合法地创作歌曲,并向版权所有者支付费用,艺人将在这一过程中做出选择。近来,音乐行业正在努力应对深度伪造生成歌曲,这些歌曲使用生成式人工智能制作,通常未经艺术家同意就模仿他们的声音。 23、AI营销公司奥创光年获千万美元A轮融资 据36氪8月9日报道,AI全链路营销公司奥创光年(Mogic AI)近日获得千万美元A轮融资,由凯辉基金领投,老股东真格基金参与投资。此前奥创光年已完成由真格基金和万物资本投资的天使轮融资。本轮融资将主要用于AI视频领域的智能算法、模型研发等技术投入上,以进一步提升产品能力。 奥创光年成立于2021年,是一家AI native营销公司,已推出Mogic Content AI Studio& Mogic Copilot等产品服务,为企业客户提供从营销策略洞察、AI内容制作、AI智能投流到DAM内容管理的全链路营销解决方案。奥创光年在2022年的营收已达数千万,2023年客户签约合同金额增幅超300%,预计将破亿元。 其Mogic Copilot为用户提供定制化的高端AI视频服务,这项服务更多聚焦在生成式AI领域,帮助用户完成创意决策。例如AI风格化技术,奥创光年用短短5天时间与国内某新消费雪糕品牌共同完成国内首支AI制作的风格化广告片。 24、大模型创企生数科技完成数千万元融资 近日,北京生成式AI基础设施及应用提供商生数科技完成了数千万元天使+轮融资,由锦秋基金独家投资。此轮资金将主要用于算法研发、产品开发和团队扩充。值得一提的是,今年6月,生数科技刚获得蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资,不到两个月的时间内已经连续获得两轮投资。 生数科技致力于打造可控多模态通用大模型,团队于今年3月发布9.5亿参数开源版本多模态大模型UniDiffuser,基于一个Transformer网络架构实现图文模态之间的任意跨模态生成。在此基础上,团队也在自主研发更高参数量的产业级大模型,在文本、图像的基础上融入3D、视频等更多模态数据。基于底层通用模型能力,生数科技正面向图像创作、3D资产创建等内容创作场景打造“AI工具集”,图像创作助手、零门槛3D资产生成工具等产品将于今年陆续推出。 现阶段,生数科技已实现了百亿数据、数十亿参数规模的模型内测,并在多种模态任务中实现了国际领先的效果,例如图像生成在语义理解准确度、画面联想丰富度等方面优于业内同类模型;3D模型生成在多样性和精细度上取得极佳突破,达到业内最接近商业落地的生成水准;视频生成能实现可控的内容改写与风格迁移,效果优于Runway等在内的主流模型。 25、美国白宫推出AI竞赛 总奖金近2000万美元 《科创板日报》10日讯,当地时间周三(8月9日),白宫发起一项为期两年的人工智能竞赛“AI Cyber Challenge(AIxCC)”,该竞赛旨在通过AI解决网络安全问题,由美国国防先进研究计划署(DARPA)主导,将与谷歌、微软、OpenAI等公司合作,总奖金逼近2000万美元,参赛选手需要利用AI找出并修复软件漏洞。 26、拜登签署行政命令 限制美企对华高科技投资 据环球网报道,美国总统拜登今天正式签署行政命令,授权财政部长监管美国企业对中国实体的投资。这项经数月审议的命令授权美国财政部长限制美国企业与个人投资中国敏感科技,包括半导体和微电子、量子信息技术、人工智能三大领域,以保护对下一代军事创新至关重要的技术。资深官员强调这项限制是出于国安考量,而非经济因素。 该行政命令指示美国财政部长(部长)颁布法规:(1) 禁止美国人从事涉及对美国构成特别严重国家安全威胁的某些技术和产品的某些交易,以及 (2) 要求美国人士应向美国财政部通报涉及某些可能对美国国家安全构成威胁的某些技术和产品的某些其他交易。该行政命令确定了该计划涵盖的三类国家安全技术和产品:半导体和微电子、量子信息技术、人工智能。美国财政部今天也同步发布拟议法规预先通知(ANPRM),征求公众意见。专家表示,新法规颁布要等到2024年(总统选举年)甚至更长的时间。 有关拜登政府限制对华投资计划将限于尖端技术和新投资的问题,中国外交部发言人毛宁曾在7月18日回应:“中方一贯反对美方将经贸科技问题政治化、武器化。我们认为,对正常技术合作和经贸往来人为设置障碍的做法违反市场经济原则,扰乱全球产供链稳定,不符合任何一方的利益。 希望美方将拜登总统无意对华“脱钩”、无意阻挠中国经济发展、无意围堵中国的承诺落到实处,为中美经贸合作创造良好环境。” 27、福布斯发布云计算100强榜单 OpenAI位列第一 福布斯微信公众号8月9日发文,公布福布斯2023云计算100强完整榜单。其中OpenAI排名第一,排名第二的Databricks和排名第44位的Dataiku均作为AI基础设施提供商受益于生成式AI热潮。根据Bessemer的数据,在今年的云计算100强公司中,有55%的公司已将生成式AI集成到他们的产品中。 AI正在改变云计算。以该榜单为例,新晋第1名OpenAI和第2名Databricks提供工具,帮助企业构建AI功能;第3名Stripe是一家金融科技公司,采用AI技术来打击欺诈;第4名Canva将AI功能嵌入了其设计软件中;第7名Grammarly推出了一款利用AI几乎瞬间生成段落文本的写作助手。 28、Spotify将向更多地区推出AI DJ功能 据Engadget 8月9日报道,继今年2月在美国和加拿大试运行后,Spotify由AI增强的DJ功能的测试版将在50个新市场推出。Spotify DJ对高级订阅会员开放,并像任何音乐流媒体应用程序一样,提供算法推荐,这些推荐会伴随着AI生成的DJ对用户正在听的音乐的评论。不过这位DJ的原型是Spotify的泽维尔·杰尼根(Xavier Jernigan),他只会说英语。Spotify的一位发言人告诉Engadget,该公司“目前没有更多关于新语言的新闻要分享。” 29、Suno推出生成式音频AI基础模型 据站长之家报道,最近,科技公司Suno推出了一款生成式音频AI基础模型,用户只需简单的文本输入,就可以生成两段约30秒带有歌词的音乐。这个玩法跟之前的Midjourney很相似,在Suno的Discord频道里输入“/ chirp”命令,再加上提示词,告诉它你想要的音乐风格和歌词即可。官方建议输入的内容不要超过4-8行。据报道,Suno是一家以研究为驱动的人工智能公司,致力于赋予创作者生成逼真音乐、语音和音效的能力。 30、商务部发言人就美限制对外投资答记者问 财联社8月10日电,商务部新闻发言人就美发布对外投资审查行政令答记者问。有记者问:北京时间今天凌晨,美国白宫发布对外投资审查行政令,请问中方对此有何评论?商务部新闻发言人答:我们注意到美方发布对外投资审查行政令。美方限制本国企业对外投资,打着“去风险”的幌子在投资领域搞“脱钩断链”,严重背离美方一贯提倡的市场经济和公平竞争原则,影响企业正常经营决策,破坏国际经贸秩序,严重扰乱全球产业链供应链安全,中方对此表示严重关切,将保留采取措施的权利。希望美方尊重市场经济规律和公平竞争原则,不要人为阻碍全球经贸交流与合作,不要为世界经济恢复增长设置障碍。 31、公安部:破获“AI换脸”案件79起 8月10日,公安部召开新闻发布会,通报公安机关打击侵犯公民个人信息违法犯罪成效情况。据公安部网络安全保卫局政委孙劲峰介绍,公安机关紧盯ChatGPT、云计算、区块链、“AI换脸”等新技术、新应用、新业态,边研究边打击,侦破一批利用人工智能技术侵犯公民个人信息的新型案件。针对“AI换脸”导致群众被欺诈的问题,公安机关发起专项会战,侦破相关案件79起,抓获犯罪嫌疑人515名。 公安部网络安全保卫局副局长李彤介绍道,随着人脸识别技术的广泛应用和人工智能技术的进步,人脸识别验证类犯罪伴随而生。犯罪分子用于实施“AI换脸”的物料主要为照片,特别是身份证照片,同时结合人员姓名、身份证号来突破人脸识别验证系统。为防范和打击此类新型犯罪,公安机关联合国家重点实验室等单位,开展人脸识别与活体检测技术安全测评,覆盖了境内用户量大、问题隐患突出的即时通讯、网络直播、网络社交、电商平台、金融支付等重点APP,及时发现人脸识别验证系统存在的风险隐患,通报运营主体升级安全保护措施和人脸识别算法。同时依托“净网”专项行动,组织专项会战,严打泄露身份证照片等图像信息的犯罪源头,破获“AI换脸”案件79起,抓获犯罪嫌疑人515名,有效遏制了该类犯罪势头。 32、安徽省人工智能主题母基金首支子基金设立 据华安证券微信公众号发文,8月7日,安徽省人工智能主题母基金首支子基金——和生星图空天智能创业投资基金在合肥市完成工商注册。该子基金由方正和生投资有限责任公司管理,为安徽省新兴产业引导基金体系首支落地的市场化子基金。 2023年1月,华安证券全资子公司华安嘉业作为安徽省人工智能主题母基金管理机构,开展第一批市场化子基金管理遴选工作。方正和生积极参与,联合上市公司中科星图共同申请设立总规模20亿元的人工智能产业子基金,专注于投资空天信息及人工智能领域的高成长企业。 33、1.17亿元!升哲中标青海人工智能计算中心 据升哲微信公众号8月8日发文,近日,升哲科技(SENSORO)1.17亿中标青海人工智能计算中心建设项目,这将是青藏高原第一座人工智能计算中心。 34、报告称全球75%企业倾向在工作场所禁用ChatGPT 《科创板日报》10日讯,BlackBerry发布的一份研究报告显示,全球75%的企业正在实施或考虑在工作场所禁止ChatGPT和其他生成式AI应用程序。在部署或考虑实施禁令的企业中,有61%表示这些禁令是长期或永久性的,主要是出于对数据安全、隐私和企业声誉的风险考虑,另有83%表示担心不安全的应用会对其企业IT环境带来网络安全威胁。
白宫发起基于人工智能的网络安全竞赛 寻求帮助确保计算机系统安全
站长之家(ChinaZ.com) 8月10日消息:白宫周三表示,他们发起了一项价值数百万美元的网络竞赛,旨在推动使用人工智能(AI)来发现和修复美国政府基础设施中的安全漏洞,以应对黑客日益增长的利用该技术进行恶意活动的趋势。 该竞赛周三在拉斯维加斯举行的黑帽网络安全会议上启动。它要求参与者创建任何人都可以使用的工具来帮助识别和修复软件中的漏洞,以防止黑客利用它们。将于 2025 年 8 月在拉斯维加斯举行的 Def Con 黑客大会上正式结束。 美国政府负责网络和新兴技术事务的副国家安全顾问 Anne Neuberger 说:「网络安全是进攻与防御之间的竞赛。」她在接受采访时补充道:「我们知道恶意行为者已经开始使用人工智能加速识别漏洞或构建恶意软件。」 近年来,从医疗组织到制造企业和政府机构等多个组织成为黑客攻击目标,并且官员们警告称未来可能面临更多威胁,尤其是来自外部敌对势力。 Neuberger 关于人工智能的评论与加拿大网络安全主管 Samy Khoury 上个月所说相呼应。他表示,他所在机构已经看到人工智能被用于创建钓鱼邮件、编写恶意计算机代码以及传播虚假信息。 这项为期两年的竞赛将提供约 2000 万美元的奖励,并由负责国家安全技术研究项目的美国国防高级研究计划局(DARPA)领导,白宫表示。 谷歌、Anthropic、微软和 OpenAI 等处于人工智能革命前沿的美国科技公司将提供他们的系统参与挑战,政府表示。 该竞赛标志着官方试图应对专家仍在努力完全掌握的新兴威胁。在过去一年中,美国企业推出了一系列生成式人工智能工具,如 ChatGPT,使用户可以创建逼真的视频、图像、文本和计算机代码。中国公司也推出了类似模型以迎头赶上。 专家表示,这种工具可能会大大简化例如进行大规模黑客攻击或创建社交媒体上虚假信息和宣传账号等行为。 Neuberger 说:「我们通过 DARPA AI 挑战目标是激发更多网络防御者使用参与竞赛的人工智能模型来加快速度——利用生成式人工智能增强我们的网络防御。」 开源安全基金会(OpenSSF)是一个试图提高开源软件安全性的美国专家小组,该基金会将负责确保「获胜的软件代码立即投入使用」。 DARPA 信息创新办公室项目经理 Perri Adams 在周二的电话会议上对记者表示:「我们必须让防御领先一步。人工智能为此提供了一种非常有前途的方法。」「这是一个探索当网络安全和人工智能专家能够访问一套前所未有的跨公司资源时可能发生的事情的机会。」
90个玩VR的副作用,约八成用户有眩晕感,分析350项研究找病根
编译 | 铭滟 编辑 | 徐珊 智东西8月10日消息,据The Conversation报道,南加州大学一项新的研究发现,约有80%的VR用户在使用VR设备后出现轻微到严重的短期副作用,如眩晕、恶心、迷失方向和肌肉疲劳等。这些副作用可能会让用户难以完成类似阅读或者写邮件等基本任务。 出于对用户的身体健康考虑,Meta和微软等几家已发布VR设备等科技企业应了解其产品对用户健康的负面影响。 一、眩晕、恶心、肌肉疲劳,VR设备副作用原因多达90个 近期,南加州大学认知人体工程学博士后研究员Alexis Souchet和他的同事提出了90个可能影响工作场所VR副作用的因素。除此之外,研究人员也尝试在另一项研究中给出缓解这些副作用的指南建议。 ▲图为Alexis Souchet 研究人员分析了超过350项研究,用以确定使用VR设备带来的一系列副作用。 使用VR设备时,会存在一些类似伏案工作的不适症状,比如头痛、疲劳、眼睛疲劳以及颈肩疼痛等。 但除此之外,使用VR设备还会给用户带来新的不适感,例如眩晕、恶心、迷失方向和肌肉疲劳加剧。用户可能会受到VR大屏幕带来的信息量冲击。突发或强烈的画面或声音(例如在虚拟观众面前讲话时意外的噪音)可能会削弱用户的注意力和记忆力。 这些副作用发作的频次和严重程度与多重因素相关。部分症状是因为VR设备的内容,例如场景的复杂程度或VR设备再现用户动作的方式。其他症状则更多与用户自身有关,例如用户年龄或他们持续使用VR设备的时长。 在这项研究中,研究人员认为他们仍需进行更多的研究来确定副作用与其影响因素之间的相关性。研究人员表示,他们仍需要提高实验数据质量,进行更深入的研究。研究人员将使用生理传感器和机器学习模型分析使用VR设备的副作用。这不仅可以检测VR设备的副作用,还可以收集更多高质量的研究数据,能够帮助研究人员更好地确定各个具体因素与特定副作用之间的相关性。 尽管研究人员知道有哪些影响因素,但研究人员表示,他们尚未完全了解哪些因素与特定副作用相关,以及这些因素间相关性有多强。研究人员认为,某些影响因素与多种副作用相关。结合症状列表来看,部分副作用的影响因素仍未确定。 二、想要玩VR无副作用?建议:使用时长不超30分钟 研究人员也提出了一些减轻VR设备副作用的使用建议。 尽管使用VR设备的副作用症状因人而异,但用户可以通过定期休息和控制单次使用VR设备时长(不超30分钟)等方式减轻不适感。除此之外,在出现任何不适症状时,用户应立即停止使用。 ▲图为儿童佩戴VR头显示意 美国和国外的一些政府组织已经意识到这些问题,并发布了相应的缓解VR设备副作用的使用指南。虽然这些政府指南与研究人员的研究结果基本一致,但研究人员认为,政府发布的指南涵盖内容过于宽泛,并且,其中VR设备的部分副作用和操作方式并未得出确定的研究结论。 根据目前的数据来看,研究人员表示,他们很难评估这些副作用有多严重。大部分评估结论认为,使用VR设备的副作用都是短期的。但研究人员认为,他们还需进行额外的研究以衡量使用VR设备的副作用风险大小与存续时长。 结语:眩晕仍是影响VR体验关键因素 从用户角度而言,用户可以适当控制使用VR设备的时长,并在出现眩晕等不适症状后及时取下设备休息。从VR厂商角度来看,未来的产品可以搭载算力更强的芯片,降低延迟,尽可能弱化使用VR设备的眩晕感,也可以通过产品设计,让VR设备的重量更轻,更符合人体工学,进一步提升用户佩戴舒适度。 除此之外,厂商或许可以研发用户健康系统,实时监测用户使用体验。用户也可反馈相关眩晕问题,厂商可以分析相关数据,以备未来新产品的优化。
亚马逊首将LLM落地电商,拟推出AI详情页文案创作工具
编译 | 香草 编辑 | 李水青 智东西8月10日消息,据The Information报道,亚马逊正在为其电商卖家用户推出一款AI工具,用于为商品详情页面(Listing)撰写文案。这将是亚马逊将大语言模型(LLM)整合到电子商务业务中的首批实例之一。 上周,亚马逊CEO安迪·贾西(Andy Jassy)曾在季度财报电话会议上谈到,AI是其公司未来几年计划的核心,包括电子商务在内的多个业务部门都在开展生成式AI项目。 一、生成式AI提供商品描述文案,卖家工作量减小 亚马逊此次推出的新功能会在卖家上架新商品时提示描述其产品的关键词。 根据亚马逊卖家顾问Jantzen Russell向The Information分享的截图显示,该工具会在卖家撰写商品详情页面时为其生成可供选择的标题、商品描述和商品要点等要素。 ▲亚马逊商品详情页面的七个组成要素(图源:亚马逊官网) 亚马逊发言人称,公司目前正在测试新的AI解决方案,让卖家以最小的工作量创建能够吸引潜在客户注意力的商品详情页面。 关于亚马逊在该商品描述工具中具体使用了哪些LLM的问题,该公司发言人没有回答。 二、AI工具只是辅助,亚马逊提醒卖家仔细检查生成内容 虽然AI工具能帮助卖家减少工作量,但无法完全代替商家进行文案撰写工作。 亚马逊对商品描述中可以使用的单词和短语制作了严格的规定,在使用工具的过程中,卖家会被提示仔细检查AI生成的内容,确保符合公司的产品刊登准则,该准则禁止虚假宣传、客户推荐及违反公序良俗的信息等内容。 ▲亚马逊对商品详情页面的评估标准(图源:亚马逊官网) Russell还谈到,亚马逊目前只向少数卖家推出了这一工具,而他在尝试使用时多次遇到报错,无法成功让它生成商品描述。距离该工具正式推出和发布,或许还有一段时间。 三、AI赋能商家,亚马逊加快追赶步伐 在亚马逊之前,已有其他电商公司更早推出了AI辅助商家功能。 电商软件公司Shopify曾在今年2月推出了一款由ChatGPT驱动的商品描述工具,又在上个月推出了一款AI助手,可以辅助卖家自动完成一些简单的工作。Jungle Scout和CommerceIQ等初创公司也开始提供AI功能,为亚马逊商品详情页面生成文案。 ▲Shopify推出的AI工具Shopify Magic 国内电商巨头淘宝天猫在5月发起“商家AI生态伙伴计划”,计划开放7大商家经营场景,其中包括向商家提供店铺名称、LOGO、详情页文案和商品主图等智能化功能,帮助商家高效运营店铺。 ▲淘宝天猫商家AI生态伙伴计划 据The Information在5月报道,除了开发商品描述功能外,亚马逊还组建了一个团队,专注于开发一款能够为商家生成用于广告宣传的照片和视频的AI工具。 为卖家提供免费工具,减少其撰写商品详情页面所花费的时间,可以让亚马逊在与沃尔玛、SHEIN等竞争对手竞争时抢占流行品牌的先机。此外,亚马逊线上目前超过60%的销售额均来自于外部卖家,更好的商品描述也有助于其提高销售额和减少退货的频率。 结语:亚马逊下场,或促进智能电商规模化落地 亚马逊正积极推出一款AI工具,为其电商卖家提供商品详情页面文案。但该工具目前仍处于内测阶段,只向少数卖家提供,存在一定的报错率。亚马逊也提醒卖家在使用时注意检查,避免违反其产品刊登准则。 作为全球最大的电商平台,亚马逊这一行为可能会促进智能电商规模化落地。未来的电子商务市场将如何发展,我们会持续关注。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。