EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
东方甄选加码抖音直播,旗下直播间账号数量增至8个
抖音店铺被关、转战自有APP直播,这一风波让抖音和东方甄选的关系引发热议,一度传出“东方甄选出逃抖音”的猜测。 8月8日,澎湃新闻记者获悉,东方甄选旗下在抖音平台增加“东方甄选风味人生”“东方甄选店铺”2个账号。新账号认证信息均为“东方优选(北京)科技有限公司”,与东方甄选旗下6个直播间隶属于同一公司。 值得注意的是,这是东方甄选自2022年11月新增“东方甄选看世界”账号以来,在9个月后抖音矩阵再次增加“成员”。目前,东方甄选在抖音平台的矩阵账号,累计达到8个,业务范围覆盖农产品、食品、日用品、图书、文旅服务等。 有知情人士告诉记者,这意味着东方甄选布局抖音的力度正在进一步加大。 东方甄选和抖音关系的传言,源自7月26日“东方甄选自营产品”抖音直播间突然宣布暂停营业三天。7月26日,东方甄选转场至自有APP直播,85折促销自营产品,产品销量、APP下载量持续增长。最终,东方甄选APP促销4天的销售额,超过1.1亿元,东方甄选APP一度冲入iOS免费榜第8名、购物榜第1名。 对于和抖音的传言,东方甄选CEO孙东旭曾在APP直播时回应称:“我们一直非常感谢平台对我们的支持,过去、现在和未来,我们都会和平台好好合作发展。” 对于2个新账号的发展方向,东方甄选相关负责人未给出明确回应,但据记者查询抖音主页显示,这两个账号已做好带货相关筹备。“东方甄选风味人生”账号目前已开通商品橱窗,尚未上架产品,而“东方甄选店铺”账号的抖音店铺,已上架95款东方甄选自营产品。 值得注意的是,此前曾关闭的抖音直播间“东方甄选自营产品”已经重新开始直播,自营店也重新开张。截至发稿,其商品橱窗共展示了131件商品,在线观众超过1700人。 对于东方甄选的关店原因,主要涉及违规引流。此前,澎湃新闻记者曾从知情人士处独家获悉,东方甄选主播是在讲解配料表的时候,因为产品包装上有二维码,镜头无法回避,被抖音判定引流和关闭店铺。东方甄选回应称,内部正在积极整改。 截至8月8日收盘,东方甄选控股有限公司(东方甄选,01797.HK)报收35.5港元,跌5.96%。
苹果营收创历史新高,印度扮演重要角色,第二个中国?
日前,苹果发布了第三季度财务业绩,营收创下历史新高,全球活跃苹果设备数量再创历史新高。 苹果印度Apple Store 苹果首席执行官蒂姆·库克表示,印度是一个令人难以置信的令人兴奋的市场,也是苹果公司过去几年的主要关注点。 苹果在印度呈现指数级增长,自2019年以来销量每年增长近50%。在印度这个价格敏感且竞争激烈的市场,苹果是唯一一家在过去十年的大部分时间里市场份额稳步增长的公司。苹果是如何获得印度市场的流量密码的? 苹果印度历年营收 苹果在印度的增长和受欢迎程度的提高始于2015年,当时苹果在印度的销售额首次突破10亿美元。苹果凭借着iPhone 6和6s系列赢得了大众的关注,并通过Macbook将他们吸引到了苹果生态系统。 苹果印度2015-2022年的收入数据 苹果不断发展其在印度的业务。截至2023年,苹果在印度的收入到2022年达到60亿美元(约4000亿卢比)。 苹果专注于印度制造计划 苹果于2017年在印度开设了第一家组装工厂。当时,苹果仅在纬创资通位于班加罗尔的一家小型工厂组装iPhone SE。该公司表示,这是一项实验性举措,苹果正在探索全球市场,以减少对中国制造的依赖。 苹果公司在印度的首次制造尝试取得了巨大成功。该公司在富士康的帮助下,在泰米尔纳德邦设立了工厂,开始扩大生产。自2019年以来,苹果一直在印度组装最新版本的iPhone。 印度制造的iPhone逐渐走向全球。2021年,印度iPhone的产量占全球产量的1%。仅仅一年内,印度生产的iPhone销量就占到全球iPhone销量的7%。苹果表示,他们希望到2024年将这一数字扩大到25%。 印度现在是苹果全球iPhone供应的主要中心。由于iPhone在本地生产,“印度制造”计划还帮助苹果节省了20%的进口关税。尽管与全球市场相比,印度的iPhone并不是最便宜的,但在印度销售的大部分iPhone都是在印度制造的。如果苹果没有在印度生产iPhone,iPhone的价格将会比现在高出20%。 苹果在印度设立在线商店 2020年之前,苹果依赖亚马逊和Flipkart等第三方经销商在印度销售产品。也有一些线下授权经销商,但苹果并没有直接涉足终端消费者市场。不过,苹果很早就意识到印度市场的重要性,于2020年9月在印度开设了官方在线商店。 一些专家认为苹果公司的这一举动是天才之举,因为当时整个世界都因新冠疫情而面临封锁。苹果的顶级在线合作伙伴——亚马逊和Flipkart也因为送货限制、送货人员短缺等诸多因素面临着问题。 苹果自己的在线商店打开了两条道路——印度消费者将能够直接从苹果购买产品,苹果可以为Mac电脑提供完全定制的内存配置。苹果还在iPad等一些产品上提供激光雕刻,这只有在苹果直接向用户销售产品时才有可能实现。 开业一年内,苹果在线商店就占苹果在印度总销售额的4%。随着苹果计划激励买家直接从苹果商店购买,预计这个数字还会进一步增长。据了解,苹果正计划在印度推出联名信用卡,在苹果在线商店使用时大概率会有优惠。 期待已久的线下商店在印度开业 多年来,印度买家一直渴望看到苹果在印度设立自己的线下商店。然而,印度的外国直接投资政策限制了苹果在印度开设自己的独家零售连锁店。根据印度的FDI政策,外国公司不能经营其单一品牌零售店,除非30%的资源外包给当地。 苹果在印度的制造工厂不仅帮助帮苹果找到了一个新的生产基地,还为在印度拥有自己的线下零售连锁店打开了大门。由于在印度销售的大部分iPhone都是在当地生产的,因此苹果能够满足30%的本地外包标准,并于今年在印度开设了两家新的线下商店。 苹果印度首家线下零售店开业 苹果在印度的第一家专卖店是位于孟买的Apple BKC,于2023年4月18日开业。第二家专卖店于2023年4月20日在德里Saket开业。这一事件的重要性可以从库克亲自揭幕的事实反映一二。这两家商店都标志着苹果在印度开启了新篇章。 这两家店开业仅三个月,苹果就已经通过其两家线下店创下了创纪录的销售额。孟买的Apple Store零售店首日销售额就达到1亿卢比(约合人民币870万元)。这超过了印度其他零售连锁店的月收入。 印度的两家Apple Store零售店月销售额均达到2.5亿卢比(约合人民币2718万元)。也就是说,苹果仅通过印度的两家线下商店就创造了价值5亿卢比的收入。 苹果并没有停下脚步 苹果进军印度才刚刚起步,该公司计划在富士康的帮助下在卡纳塔克邦建立一个新的制造工厂,以扩大在印度的生产。苹果还计划在印度开设三家新的线下商店。 显然,印度不仅是苹果的主要销售市场,也是一个重要的制造中心。如果苹果继续以同样的速度在印度发展,印度将有望很快将占据苹果全球收入和利润的很大一部分。
微软:2018年就成立团队攻击AI来测试其弱点
站长之家 8月8日 消息:周一,微软透露了公司内部从2018 年就成立团队来负责找出如何攻击AI平台,从而揭示AI弱点。 在成立的五年里,微软的AI红队已经从一个实质上是实验性的项目发展成为一个完整的跨学科团队,由机器学习专家、网络安全研究人员,甚至社会工程师组成。该团队致力于使用传统的数字安全术语在微软内部和整个科技行业内传播其发现,这样这些想法就会更容易理解,而不需要许多人和组织还没有的专门的AI知识。但事实上,该团队已经得出结论,AI安全与传统的数字防御有重要的概念差异,这需要AI红队在其工作方式上有所不同。 “当我们开始的时候,问题是,‘你到底要做什么不同的事情?为什么我们需要一个AI红队?’”微软AI红队的创始人Ram Shankar Siva Kumar说。“但如果你把AI红队看作只是传统的红队,如果你只考虑安全性的心态,那可能是不够的。我们现在必须认识到负责任的AI方面,也就是AI系统失败的责任——所以生成攻击性内容、生成没有根据的内容。这是AI红队的圣杯。不仅要看安全性的失败,还要看负责任的AI失败。” Shankar Siva Kumar说,花了一些时间才能突出这种区别,并说明AI红队的使命确实会有这种双重重点。早期的很多工作都与发布更传统的安全工具有关,比如 2020 年与非营利研发组织MITRE和其他研究人员合作推出的对抗性机器学习威胁矩阵。那一年,该团队还发布了开源的AI安全测试自动化工具,称为微软Counterfit。 2021 年,红队发布了一个额外的AI安全风险评估框架。 然而,随着时间的推移,随着解决机器学习缺陷和失败的紧迫性变得更加明显,AI红队也得以发展和扩展。 微软的AI红队不仅仅研究目前正在野外使用的攻击。Shankar Siva Kumar说,该团队专注于预测攻击趋势可能会走向哪里。这通常涉及强调红队使命中较新的AI问责性部分。当该团队在一个应用程序或软件系统中发现一个传统的漏洞时,他们经常与微软内部的其他团队合作来修复它,而不是花时间完全开发和提出自己的修复方案。 “在微软内部还有其他红队和其他Windows基础设施专家或者我们需要的任何东西。”Shankar Siva Kumar说。“对我来说,洞察力是AI红队现在不仅包括安全性失败,还包括负责任的AI失败。”
谷歌上线AI语法检测工具,助力用户写作措辞技巧
IT之家 8 月 8 日消息,IT之家的小伙伴们可能有用过 Grammarly 具提供的“语法检测”服务,据外媒 9To5Google 报道,谷歌日前上线了一个名为“语法检查”的功能,该功能类似 Grammarly,可以为用户提供语法纠错。 图源 9To5Google 外媒举例表示,当下用户在谷歌搜索框中输入“The dogs arent outside today it is too hot grammar check”,在此之后,谷歌便会提示用户拼写中可能存在问题,应输入“The dogs are outside today it is too hot grammar check”。 据悉,谷歌会加粗并强调句子中存在的语法错误,如果搜索引擎没有检测到语法错误问题,则将出现一个“绿色标记”通知用户语法无误,而用户也可以通过将鼠标悬停在更正后的句子上,使用快捷“复制”按钮来复制更正后的句子。 外媒透露,该功能的支持页面似乎已经上线了至少几个星期,他们同时联系了谷歌发言人 Colette Garcia,Garcia 则表示,谷歌其实在 6 月底就已经悄然推出了这一“语法检查”功能。 当用户输入存在语法错误的句子时,搜索引擎将会自动给予用户正确的拼写方案。 Colette Garcia 同时声称,该“语法检查”功能使用 AI 来工作,但他同时也警告,当下“语法检查”功能可能不会百分之百准确,还需要一段时间才能改进。
谷歌的RT-2,是不是机器人的GPT-3时刻?
作者 | Li Yuan 编辑 | 郑玄 7 月 29 日,《纽约时报》的记者在谷歌实验室,率先看到了谷歌最新推出的 RT-2 模型驱动的机器人。 一个单臂机器人站在一张桌子前。桌子上坐着三个塑料雕像:狮子、鲸鱼和恐龙。工程师给机器人发出指令:「捡起灭绝的动物。」机器人呼呼地响了一会儿,然后手臂伸出,爪子张开落下。它抓住了恐龙。 这是一道智能的闪光。 《纽约时报》描述道,「直到上周,这一演示还是不可能的。机器人无法可靠地操纵它们以前从未见过的物体,它们当然也无法实现从「灭绝的动物」到「塑料恐龙」的逻辑飞跃。」 虽然仍然存在于展示之中,且谷歌并不打算立即进行更大规模的发布或者对其进行商业化,但这一展示已经足以展现大模型为机器人能够带来的机遇的一角。 在大模型时代到来之前,人们训练机器人,通常针对每个任务进行优化,比如抓取某种玩具,需要足量的数据,机器人才能准确地从各个角度、各个光线下识别这种玩具,抓取成功。而让机器人意识到自己有抓取玩具的任务,也需要对机器人进行编程才能解决。 而大模型的智能和泛化能力,让人们看到了解决这些问题,走向通用机器人的一道曙光。 01 将 Transformer 运用到机器人中 谷歌新的 RT-2 模型,全称为 Robotic Transformer 2,运用 Transformer 架构作为其模型的基座。 2018 年被提出的 Transformer 架构,是目前火遍全球的大语言模型(LLM)的最底层的基座,但事实上,作为一种架构,Transformer 不止可以应用于大语言模型当中,也可以用于训练其他类型的数据。早在今年 3 月份,谷歌就发布了 PaLM-E,是当时世界上最大视觉语言模型(VLM)。 大语言模型中,语言被编码为向量,人们为模型提供大量的语料,使其能够预测出人类通常下一句会说什么,借此生成语言回答。 而在视觉语言模型中,模型可以将图像信息编码为与语言类似的向量,让模型既能「理解」文字,又能用相同方式「理解」图像。而研究员们为视觉语言模型提供大量的语料和图像,使其能够执行视觉问答、为图像添加字幕和物品识别等任务。 无论是图像还是语言,都是相对容易大量获取的数据。因此,模型很容易取得令人惊艳的成果。 而想使用 Transformer 架构来生成机器人行为,却有一个很大的难点。「涉及到机器人动作的数据非常昂贵。」清华大学交叉信息研究院助理教授许华哲教授告诉极客公园,「视觉和语言数据都来自于人类,是被动数据,而机器人的动作数据,全部是来自于机器人的主动数据。 比如我想研究机器人倒咖啡的动作,不管是写代码让机器人执行,还是利用其他的方式让机器人执行,都是需要机器人实际执行一遍这个操作才能得到这个数据。因此,机器人的数据与语言和图片的规模和量级是完全不一样的。」 在谷歌研究的第一代机器人 Transformer 模型 RT-1 中,谷歌第一次开启了这样的挑战,尝试建立一个视觉语言动作模型。 为了建立这样的模型,谷歌使用了 13 个机器人,在一个搭建的厨房环境中耗时 17 个月收集到了机器人在 700 多个任务上的主动数据组建的数据集。 数据集同时记录了三个维度: 视觉——机器人在执行任务操作时的摄像头数据; 语言——用自然语言描述的任务文字; 和机器人动作——机器手进行任务时在 xyz 轴和偏转数据等。 虽然当时得到了较好的实验效果,但可想而知,想要进一步增加数据集内数据的数量,将是一件非常难的事情。 图片来源:谷歌 AI 介绍视频 而 RT-2 的创新之处在于,RT-2 使用前面所述的视觉语言模型(VLM)PaLM-E 和另一个视觉语言模型 PaLI-X 作为其底座——单纯的视觉语言模型可以通过网络级的数据训练出来,因为数据量足够大,能够得到足够好的效果,而在微调(fine-tuning)阶段,再将机器人的动作数据加入进去一起微调(co-finetuning)。 这样,机器人相当于首先已经拥有了一个在海量数据上学习过了的常识系统——虽然还不会抓取香蕉,但是已经能够认识香蕉了,甚至也知道了香蕉是一种水果,猴子会比较喜欢吃。 而在微调阶段,通过再加入机器人在真实世界中看到香蕉后是如何抓取香蕉的知识,机器人就不但拥有了在各种光线和角度下识别香蕉的能力,也拥有了能够抓取香蕉的能力。 在这种方式下,用 Transformer 架构训练机器人所需的数据显著降低了。 RT-2 在微调阶段直接使用了 RT-1 训练阶段使用的视觉/语言/机器人动作数据集。谷歌给出的数据显示,在抓取训练数据中原来出现过的物品时,RT-2 的表现与 RT-1 同样好。而因为有了「拥有常识的大脑」,在抓取之前没有见过的物品时,成功率从 RT-1 的 32% 提升到了 62%。 「这就是大模型的妙处。」许华哲讲道,「你没有办法把它拆解成因为它识别到了两个物体是材质相似,还是因为大小相近还是因为别的什么原因抓取的成功率提升了。它学到的东西足够多了之后,就会涌现出一些能力。」 02 使用自然语言与机器人交互的未来 学术上,RT-2 展现的很强的泛化性有可能解决机器人训练数据不足的难题。而在此之外,RT-2 给人的直观震撼还是来自于它所展现的智能的一面。 在实验中,研究员希望它能够拿起一个「能够用作锤子的东西」,机器人在一堆物品中拿起了石头,而在被要求拿起一个提供给疲惫的人的饮料时,机器人在一堆物品中选择了红牛。 这样的技巧来自在进行大模型训练时,研究员引入「思维链」(chain of thought)的能力。而这样的多段语义推理在传统的机器人模仿学习研究中时非常难以做到的。 不过,利用自然语言与机器人交互,并不是 RT-2 的创见。 在过去的机器人研究中,研究者始终需要将任务要求转换为代码而让机器人能够理解,同时一旦出现问题,也需要编写代码来纠正机器人的行为,整个过程需要多次交互,效率较低。而既然我们已经有了非常智能的对话机器人了,下面比较自然的一步,自然是让机器人与人类用自然语言交互。 「我们大约两年前开始研究这些语言模型,然后我们意识到它们蕴藏着丰富的知识。」谷歌研究科学家卡罗尔·豪斯曼 (Karol Hausman) 表示,「所以我们开始将它们连接到机器人。」 不过,让大模型作为机器人的头脑,也有着自己的难题。其中最重要的一个问题之一,就是 grounding 问题,即如何使大模型通常比较天马行空的回应,转化成驱动机器人行动的指令。 2022 年,谷歌推出 Say-can 模型。模型正如其名,采用两重考量来帮助机器人行动。一重考量是 say,模型通过与谷歌的大语言模型 PaLM 模型结合,可以通过自然语言和人类交互,把获得的任务进行分解,找到最适合当前行动;另一重考量是 can,模型通过一个算法,计算出当前机器人能够成功执行这一任务的概率。机器人根据这两重考量下,进行动作。 比如对机器人讲「我的牛奶撒了,你能不能帮我?」机器人会首先通过语言模型进行任务规划,这时可能最合理的方式是找到一个清洁工,其次是找一块海绵自己擦。然后机器人会通过算法计算出作为机器人,它能够成功找到清洁工的概率很低,而找到海绵自己擦的概率很高。在两重考虑后,机器人就会选择寻找海绵擦牛奶的行动。 图片来源:Saycan 介绍视频 虽然在这样双层模型架构中,机器人能够成功做出的动作已经是预先设计好的,大语言模型只是能够帮助机器人选择合适的任务规划。在这样模型中,机器人已经展现出了极强的智能感。 不过,虽然从外在看起来效果是类似的,RT-2 采取的是另一种道路。通过训练时模型就同时学习视觉、语言、机器人行为这三种数据,RT-2 的模型并不是先进行任务分解,再进行任务操作,而是自然语言输入后,通过模型的运算,直接产生动作的输出。 「双层结构类似于我想去做一件事情,脑袋里先想好第一步干这个,第二步干那个,然后再挨个执行这些策略。」许华哲教授表示,「而端到端的结构类似于我也没有特别仔细想第一步、第二步是什么,就把这个事情给干了。」后者的一个例子可以类比于我们每天在手机上打字聊天,我们打字聊天时一般不会认真思考肌肉具体要如何去动作,而是想到了要打的字,就直接打出来了。 「两种不同的路线或者不同的方法,都还没有证明自己是唯一正确的方式。」许华哲表示。但由于 RT-2 的优秀表现,一个模型能够接管输入输出的技术方向,似乎值得探索。 「由于这一变化(RT-2 的优秀表现),我们不得不重新考虑我们的整个研究规划了,」谷歌 DeepMind 机器人技术主管文森特·范霍克(Vincent Vanhoucke)表示。「之前所做的很多事情都完全变成无用功了。」 03 RT-2 是机器人的 GPT3 时刻吗? 谷歌的 RT-2 机器人并不完美。在《纽约时报》记者目睹的实际演示中,它错误地识别了一罐柠檬味苏打水的味道(说成「橘子味」)。还有一次被问到桌子上有什么水果时,机器人回答成「白色」(实际是香蕉)。谷歌发言人解释说,该机器人使用了缓存的答案来回答之前测试者的问题,因为它的 Wi-Fi 曾短暂中断过。 除此之外,利用大模型训练机器人,不可避免地要面对成本问题。目前谷歌的机器人在进行推理和判断的时候,需要将数据传到云端,由多块 TPU 一起进行计算,再将结果发回机器人,由机器人执行操作。这样的计算可想而知十分昂贵。 谷歌 DeepMind 机器人技术主管文森特·范霍克(Vincent Vanhoucke)认为,新的研究开启了机器人能够在有人的环境中使用的大门——研究者认为,内置了语言模型的机器人可以进入仓库、用于医疗行业,甚至成为家庭助理,帮助折叠衣物、从洗碗机中取出物品、在房子周围收拾东西。 「如果你开一个工厂,需要使用机器人,成功率一定是要求很高的。你不会希望说买了机器人后,还需要很多人去维护这个机器人,完善机器人做的不够好的事情。那这样成本太高了。」许华哲教授表示,「家居场景下的机器人可能是另一个情形,因为也许家居场景下的一些任务的成功率要求没有那么高。比如叠衣服,叠的没有那么好,可能在你眼中这个任务失败了,但对你的影响也不会非常大。」 人工智能三巨头之一的杨立昆(Yaan Lecun)有一个强调过许多次的著名论断:人工智能还不够聪明。任何一个孩子都能很快学会收拾桌子,把碗放进洗碗机,而机器人却做不到。 目前的机器人研究或许确实如此,但正如不完美的 GPT-3 让业界看到了大模型发展的方向一样,或许今天不完美的 RT-2 也将开启机器人进入家庭成为我们的助手的未来时代。
英国政府2023年风险登记报告 AI被标记为“慢性风险”
本文概要: 1. 英国政府发布的2023年风险登记册警告关键国家基础设施面临网络攻击威胁。 2. 报告指出网络攻击已变得复杂,可能对经济造成重大损害。 3. 该报告还将人工智能标记为慢性风险,认为其可能对国家安全产生影响。 站长之家 8月8日 消息:英国政府发布的2023年风险登记册警告了关键国家基础设施面临的网络攻击威胁。根据政府的国家安全风险评估,未来两年内重要基础设施发生重大网络攻击的可能性约为5-25%。报告强调,网络攻击已变得越来越复杂,可能对经济的多个部门造成重大损害。 报告还明确指出一系列可能受到网络攻击威胁的目标,包括天然气基础设施、电力基础设施、核设施、燃料供应基础设施、政府机构、卫生和社会保健系统、交通部门和电信系统。 另外,报告还特别提及人工智能作为一种慢性风险。它指出人工智能带来持续挑战,可能对经济、社会和国家安全产生影响。这是英国国家风险登记册首次将人工智能作为该国的战略风险。政府认识到人工智能的深远影响,包括增加的虚假信息和经济竞争力的下降。因此,政府计划召开全球峰会来解决人工智能安全问题。 尽管这份报告具有全面性,但一些批评人士对评估人工智能风险的细节不足表示担忧。反对党议员达伦琼斯批评报告只是简单提到了人工智能,并指责政府缺乏应对其危险的具体计划。琼斯建议在国家安全委员会内设立人工智能小组委员会,以监测与人工智能相关的风险。
自己骗自己:外媒称亚马逊平台泛滥AI生成的虚假好评内容
IT之家 8 月 8 日消息,据 BBC 报道,亚马逊平台近期出现了大量由 AI 声称的虚假好评,这些千篇一律的虚假好评充斥在“商品页面”、“探店指南”中,并且没有经过任何润色处理,用户一眼便能发现这些“垃圾信息”,令人不胜其烦。 BBC 表示,这些虚假好评显然是网店自行生成的,但他们并不清楚,这些店主们为什么要使用这种一眼就能看穿的形式来提升自己的商品排名,并也不得而知这些店主如何绕过商品购买交付过程,并使用 AI 批量生成这些内容。 图源 BBC IT之家发现,BBC 声称在亚马逊英国区,至少有七分之一的平台用户评价是由 AI 生成的,这些“虚假好评”的作者资料卡内容相当笼统,个人简介通常是以 ChatGPT 风格的“平淡”形式编写的一段冗长文字。 图源 BBC 亚马逊公司则是声称,他们“非常努力地确保平台中的用户评价经过严格审核”,亚马逊客户信任团队负责人 Dharmesh Mehta 在面对 BBC 采访时表示,亚马逊使用机器学习来寻找“可疑账号”,跟踪留下评论的“购买账户”与销售该产品的店主之间的关系。 不过从结果来看,审核效果并不理想,BBC 认为,亚马逊需要加强审核机制,在保护消费者权益的同时,让用户不会因为这些一眼就能辨出的“虚假好评”信息而感到不快。
ChatGPT 之父发钱,扫描眼球就能领,真有这么好的事?
ChatGPT 之父 Sam Altman 有一个梦想。 当工作被 AI 抢走,给全球几十亿人发钱。 不过有个前提:证明我们是人。他给出的具体方案,是一个叫做「世界币」(Worldcoin)的加密货币项目。 2021 年 10 月,Worldcoin 官宣;今年 7 月 24 日,Worldcoin 开始分发代币。中间这段时间,ChatGPT 跑出来惊艳了世界。害怕被 AI 端掉饭碗,真的成了压在心头的阴云。 但仍然说不好,Worldcoin 是未来的人类之光,还是黑镜般的反乌托邦。它规划的世界大同还没能实现,问题已经集中爆发。 让眼睛成为「检票口」 Worldcoin 项目主要分为 3 个部分: 应用程序 World App、数字身份 World ID、新的加密货币 Worldcoin。 按照 Sam Altman 的蓝图,代币每月免费发放到手机,让 AI 创造的红利为全世界共享,而不是被少数精英独占。 现在趁热上车,还有「新手福利包」——每个用户可获得 25 个代币,价值约 50 美元,之后每周还能进账 1 个代币。 当然,这是有条件的,你必须先注册,完成虹膜扫描。 Worldcoin 团队开发了一个名为 Orb 的「球体」,它的作用就是扫描虹膜,收集生物数据,确保对面是人类。 Orb 的大小与保龄球相当,盯着上面的黑色圆圈,它就会通过红外摄像机、传感器和 AI 驱动的神经网络系统,扫描你的眼睛。 体验过的人们觉得,自己「像是在凝视深渊」。然而,在验证码越来越刁钻的时代,Worldcoin 团队考虑了所有办法,发现他们别无选择: 用生物识别数据来验证人类……. 确实是唯一的解决方案。 虽然现在已经没有什么隐私可言,但提供隐私数据给私人企业,还是让人有些战战兢兢,有位网友将 Orb 比作《魔戒》里的「索伦之眼」,收集地球上每个人的生物识别数据本身就存在巨大的风险。 2021 年 10 月,棱镜门的斯诺登在 Twitter 警告: 不要将生物识别技术用于任何用途。人体不是检票口。 面对多家媒体的质疑,Worldcoin 团队给出了官方解释——除非用户另外更改设置,否则 Orb 捕获的原始图像将被删除,仅保留数字表示形式。 具体来说,生物识别信息是用来生成「虹膜哈希」(IrisHash)的,「虹膜哈希」是一种存储在 Orb 本地的代码,永远不会共享,只负责检查某人是否已经注册过。 我们不想知道你是谁,或者你的年龄、种族、性别、眼睛颜色,只想确定你是独一无二的。 这还不足以打消人们的疑虑。 Worldcoin 编织了去中心化的愿景,但为它所有的 Orb 是集中化的。一位应用密码学的副教授,担心 Orb 作为硬件的安全性: 机器本身会有一些安全保护措施,但没有一项技术是绝对安全的。 更为可怕的情况,是虹膜验证本身不能百分百站得住脚。以太坊联合创始人 Vitalik Buterin 在一篇博客文章中写道: 如果一个 Orb 制造商是恶意的或被黑客攻击的,它也可能生成无限数量的假虹膜扫描哈希值,并为它们提供 World IDs。 远大的野心,没有答案的问题 隐私安全不是人们对 Worldcoin 唯一的质疑。当代币每月免费发放,谁来为它买单,确保它是一个可持续的项目? Worldcoin 项目的早期投资者 Jesse Walden 没法解答: 大多数初创公司一开始都没有想出商业模式,他们通常专注于增长,而增长最终会产生用例和价值。 Sam Altman 似乎也不确定,给出的方案有些「击鼓传花」的投机味: 从短期来看,当人们想要购买这种代币时,就会有资金流入这个经济体,新的代币买家是有效获得报酬的方式。 总之,把人先拉进来。至于长期怎么办,Sam Altman 并没有考虑清楚: 最终,你可以想象后 AGI(通用人工智能)世界中的各种事情。但我们对此没有具体计划。在这个阶段这不是重点。 官宣 Worldcoin 时,Sam Altman 说道:「一种新的加密货币,将公平地分配给尽可能多的人。」 但这里所说的公平,也不一定能够实现。 根据 Worldcoin 的白皮书,代币的初始供应量上限为 100 亿个,其中四分之三将在未来 15 年里分配给用户,其余将分配给员工和投资人。 但在 7 月 24 日当天,代币只发行了 1.43 亿枚,其中 1 亿枚借给第三方做市商,他们是金融市场的特殊参与者,负责保持市场活跃。 一家加密审计公司指出,这种初始供应量少、做市商占大头的代币分配方式,可能会导致不现实的估值,利好了私人投资者,公开市场的普通人基本赚不到钱。 发行当天,Worldcoin 代币一度来到 3.58 美元的高点,随后回落至 2.52 美元。 不明朗的未来,无法打消人们的热情。 代币发行的第 3 天,世界各地排起蜿蜒的长队,耐心地等待着报名的机会,每 8 秒就有一个人得到验证。 他们的身份各不相同,币圈人士、科技媒体、OpenAI 粉丝…… 然而,打动大多数人的,不是摸不着边的宏图,和 AI 也没什么关系。 他们只是奔着免费赠送的 25 枚代币而来,希望比特币上演过的暴富梦再次成真。 技术殖民,加密梦想 尽管 Worldcoin 最近才发行代币,但它过去两年没有闲着,一直在主动寻找全球各地的虹膜,将它们扫描到自己的数据库里。 可能有些反常识,Worldcoin 的首批 50 万测试用户,并不是来自发达国家的加密精英,而是内罗毕、苏丹和印度尼西亚等地的居民。 在世界各地负责推广任务的,是和 Worldcoin 保持独立的当地运营团队。 数据对 Worldcoin 团队很重要,对运营人员也很重要。每说服一个人扫描虹膜,他们就能获得佣金。 截至 2022 年 3 月,Worldcoin 扫描了 24 个国家的 45 万名用户。其中 14 个是发展中国家,8 个位于非洲。币圈人士 ZachXBT 在 Twitter 写道: 最令我震惊的是,WorldCoin 团队吹嘘他们拥有多少用户。而实际上,他们一直在剥削发展中地区。 2022 年 4 月,《麻省理工学院技术报告》发表了一篇 7000 字的专题文章,调查的就是 Worldcoin 的前期试验过程。 报告的作者认为,尽管 Worldcoin 雄心万丈,承诺提供基于加密货币的、公平分配的全民基本收入,但他们当时所做的,只是根据穷人的身体,建立一个生物识别数据库。 团队使用了欺骗性的营销手段,收集的个人数据比其承认的要多,并且未能获得知情同意。 Worldcoin 团队回应了这篇报告,一方面,项目在几年前确实还不成熟,现在已经进步了,要用发展的眼光看待他们。 另一方面,报告也有误导的成分,当时超过 50% 的注册用户来自挪威、芬兰等欧洲国家。他们的测试兼顾了城市和农村、发达地区和发展中地区。 不论怎么挽尊,在这些不发达的弱势地区,强制推行加密货币实验,成本更低也更容易,本质就是一种「技术殖民」。 运营人员甚至隐瞒项目的真实目的,以赠品诱导当地居民。在肯尼亚等地,不到半美元,就能让人们放弃生物识别数据。 2021 年 3 月,苏丹的 Worldcoin 运营人员发现,很难向连电子邮件都没有的当地人解释什么是数字货币。于是,他们举办了一场 AirPod 有奖竞赛,最终吸引了大约 2 万名用户。 这些加密货币「小白鼠」,类似于非洲等地的 AI 数据标注工。 AI 对信息来者不拒,仰仗人工帮它剔除数据库有害的部分,这里汇集着互联网最黑暗的角落,涉及性虐、自杀、酷刑等内容。 当 AI 最终出现在镁光灯下,数据标注工们完成了单调而重要的职责,带着心理创伤和微薄工资,然后又隐入黑暗。 种种质疑之下,Worldcoin 通向世界的门被关上了几扇。 8 月 2 日,因为数据安全问题,肯尼亚通信部暂停了 Worldcoin 的运营,并且启动了调查。 自 2022 年 11 月以来,德国一直在调查 Worldcoin,原因是担心它将大规模访问敏感数据。近期,法国、英国也展开了调查。 另外,Worldcoin 压根没法在美国推广,因为监管机构担心加密货币被用作投机和欺诈工具。 现在,官网的数据仍在实时增长,目前是 220 多万名用户,遍布 30 多个国家。Worldcoin 的目标是 2023 年底注册用户达到 10 亿。 Worldcoin 能够惠及世界上的每一个人吗?目前来看,这仍然是一个可信度很低的梦想。 然而,200 多万名里的部分用户,只是因为 ChatGPT 之父的背书,选择不去犹豫,在五分钟内交出了自己的虹膜。 如果 Sam Altman 没有参与,我会再考虑考虑。
中国科学院与微软发布新研究:用户表达积极情绪能让AI输出文本更真实
编译 | 铭滟 编辑 | 徐珊 智东西8月8日消息,据TechXplore报道,来自中国科学院软件研究所、微软以及威廉与玛丽学院的研究人员,利用心理学知识对大语言模型进行Emotion Prompt(情绪刺激),发现该方案可以提高大语言模型文本输出的真实性和信息量。 研究人员从Prompt工程的角度对大语言模型(Large Language Modle,LLM)进行实验。Prompt工程指工程提示词。通俗来讲,就是用户向大语言模型的提问方式。不同的提问方式,会导致大模型给出不同的回答,这即意味着不同人使用大模型的效率存在差异。 研究人员基于心理学文献,选定了11个具有情绪刺激功能的句子,并在四个大语言模型中进行了八项任务测试。测试结果表明,EmotionPrompt可以有效提升大语言模型的真实性与信息量。 一、三大心理学理论提升大语言模型输出表现 为了了解情绪对大语言模型的影响,研究人员拟定11个具有情绪刺激功能的句子,并在四个大语言模型(ChatGPT、Vicuna-13b、Bloom和Flan-T5 Large)的八项任务中,分别测试了EmotionPrompt的表现。总体而言,研究人员发现,EmotionPrompt可以提高四个大语言模型在八项任务中的性能表现。 研究人员拟定的11个句子分别出自社会认同理论、社会任职理论和认知情绪调节理论。 ▲图为研究人员拟定11个句子的理论分类,左为三大理论分类,右为社会影响与自我尊重分类 社会认同理论可以追溯于20世纪70年代,最早由Henri Tajfel和John Turner提出。社会认同理论的主要观点是个体通过社会分类,对自己的群体产生认同,并产生内群体偏好和外群体偏见。简单来说就是,个人从他们所属的群体中获取自我认同感。 该理论下涵盖4句话,分别是:“这对我的职业生涯非常重要”;“你最好真的确定”;“你确定吗”;“你确定那是你最终的答案吗?也许值得再看一遍”。 社会认知理论的主要观点则是人类活动是由个体行为、个体认知和其他个体特征、个体所处的外部环境这三种因素交互决定的。也就是说,人不仅是环境的塑造者,也是环境作用的产物。 基于该理论,研究人员设计了4句话,其中前两句是个体认知,要求外部“环境”即大语言模型对自己做出评判;后两句是个体对大语言模型的要求。这四句话分别是:“写下你的答案,并为你的答案给出一个0到1之间的自信打分”;“这对我的职业生涯非常重要”;“你最好真的确定”;“你确定吗”。 认知情绪调节理论的主要观点为,个体能够意识到自己的情绪并意识到如何调节情绪。基于该理论,研究人员在情绪刺激语句中添加了积极暗示,例如,“相信自己的能力”、“感到自豪”等等。这5句话分别是:“你确定那是你最终的答案吗?相信自己的能力,并追求卓越。你的辛勤工作将带来显著的成果”;“拥抱挑战,将其视为成长的机会。每克服一个障碍,都会让你离成功更近一步”;“保持专注和对目标的执着。你持续的努力将带来杰出的成就”;“对你的工作感到自豪,并尽你最大的努力。你对卓越的承诺让你与众不同”;“记住进步是一步一步地得来的。保持决心,继续前进”。 上述11个句子可以添加到原始提示中。研究人员在四个大语言模型(ChatGPT、Vicuna-13b、Bloom和Flan-T5 Large)和八项任务中进行了测试,结果发现,Emotion Prompt在所有任务上实现了相当或更好的性能,在超过一般的任务中表现提升了10%。 ▲图为在ChatGPT中运行八项任务的测试结果 除了任务表现提升之外,Emotion Prompt也改善了模型回答的真实性与信息量。 ▲图为ChatGPT、Vicuna-13b和T5输出文本的真实性与信息量对比,变量为是否使用EmotionPrompt 从上图可以看到,在真实性评分中,使用EmotionPrompt后,ChatGPT的评分从0.75提至0.87,Vicuna-13b的评分从0.77提至1.0,T5的评分从0.54提至0.77。 此外,在信息量评分中,使用EmotionPrompt后,ChatGPT的评分从0.53提至0.94,T5的评分从0.42提至0.48。 在单句测试的基础上,研究人员也进行了多句叠加测试。通过随机组合多种情感刺激,得到结果如图所示: ▲图为多句叠加测试结果 可以看出,在大多数情况下,更多的情绪刺激会让模型的表现更好。但如果单句刺激已经取得了良好表现,多句叠加刺激带来的提升并不显著。 研究人员表示:“EmotionPrompt的运行原理很简单,就是将情绪融入文本之中。实验结果表明,使用EmotionPrompt情绪提示文本后,ChatGPT、Vicuna-13b、Bloom和Flan-T5 Large在八项任务中的表现明显优于原始未使用的情况。除此之外,EmotionPrompt还可以提高LLM生产文本的真实性和信息丰富程度。” 二、EmotionPrompt的有效性:大语言模型也“爱听”积极的话 在论文结论部分,研究人员通过可视化情感刺激的输入对最终输出的贡献来解释情绪刺激的有效性。 图中显示了每个单词对最终结果的贡献,颜色深度表示它们的重要性。 ▲图为积极单词的贡献程度示意 可以看到,情感刺激可以提升原始提示的表现。单词颜色越深,意味着情感刺激提升的关注越强,尤其积极单词的贡献更大(颜色更深),如“自信”、“成功”和“成就”等。 积极单词在四项任务中的表现提升超50%,在两个任务中甚至接近70%。 三、EmotionPrompt已获小范围成功,推广前仍需多重验证 为了验证EmotionPrompt的效果,研究人员还进行了志愿者实验,以获得大语言模型输出文本的其他指标,如清晰度和相关性等。研究人员共准备了40个问题,问题包括文本的真实性与情感冲击力等。该系列问题的实验流程为,在控制EmotionPrompt为变量的情形下,志愿者对聊天机器人的文本输出进行评分。 志愿者的实验结果表明,使用EmotionPrompt后,聊天机器人输出的文本在清晰度和相关性等方面都优于不使用的状态。 ▲图为志愿者实验测试结果 在论文结尾,研究人员也提到了该研究的局限性:“首先,我们目前的研究仅基于四个大语言模型和八项任务。现有的测试示例较少。因此,我们仅对本文的实验结论负责,任何超出本文范围的大语言模型和数据集都可能不适用情绪刺激。此外,本研究所提出的情绪刺激可能并不通用处理所有任务。” 据TechXplore称,EmotionPrompt或将激发AI领域内关于提升大语言模型输出质量的相关讨论。尽管目前EmotionPrompt的实验结果表现良好,但在投入应用前,还需多重广泛实验以验证该研究的有效性和可推广性。 结语:情绪刺激大模型或将改善AI生成文本质量 心理学研究涉及对人类心理和行为的分析,而基于大语言模型的聊天机器人则需要对不同的用户提示文本做出回应。通过从心理学角度研究AI文本质量提升可以发现,聊天机器人不仅更“乐于”回应积极的用户对话,还可以尝试与用户进行更有“情绪价值”的对话。 除心理学以外,大模型的情绪研究还可以从其他社会科学中获取灵感,如社会学和传媒学等。通过跨领域学科研究大模型情绪输出问题,或许可以进一步提升聊天机器人的文本表现。有关研究人员未来在大语言模型领域的各项研究进展,我们也将持续关注。
人脸识别技术应用征求意见发布;微软推出最强生成式AI虚拟机;华为天才少年大模型创业丨AIGC大事日报
1、国家网信办就人脸识别技术应用征求意见 2、OpenAI现支持禁止GPTBot爬取网站 3、OpenAI起诉open.ai域名的所有者商标侵权 4、微软Bing Chat将被引入第三方移动浏览器 5、微软正式推出最强生成式AI虚拟机 6、传Win 11画图应用或整合AI工具Copilot 7、谷歌搜索新增AI驱动的“语法检查”功能 8、Meta解散AI预测蛋白质结构团队 9、网易申请AI大模型玉言商标 10、百川智能发布530亿参数的闭源大模型 11、飞书AI助手“MY AI”或于9月发布 12、字节视觉技术负责人创业 获数千万元融资 13、华为天才少年大模型创业 主攻AI公文写作 14、大摩:AI泡沫已逼近顶峰 15、AI热潮被质疑“有热度、没收入” 16、美SEC主席:AI可能是未来金融危机的中心 17、中兴通讯:密切关注AI相关模型的手机应用落地 18、经济学家:AI或加剧经济不平等 19、生成式AI正提高招聘效率 20、金蝶云·苍穹GPT企业级大模型平台发布 21、Zoom:不会窃取用户数据训练AI模型 22、受益于AI需求上涨 Palantir股价涨超130% 23、大模型中间件创企澜码科技完成数千万元融资 24、工信部:鼓励开展数据确权授权的标准制定工作 25、AI通过自监督训练重建生物样品的微观图像 26、AI模型可预测癌症原发灶位点 27、Datablau数语科技完成B1轮融资 28、云从科技视觉-语言跟踪模型刷新世界纪录 29、浪潮信息申请Chat相关商标 30、广汽推出AI大模型平台 31、研究称ChatGPT回答编程问题的错误率超50% 32、拓尔思拟募资18亿元 加码大模型研发 33、传迪士尼成立特别小组探索人工智能 1、国家网信办就人脸识别技术应用征求意见 据网信中国微信公众号今日发文,国家互联网信息办公室起草了《人脸识别技术应用安全管理规定(试行)(征求意见稿)》,现向社会公开征求意见。其中提到,存在其他非生物特征识别技术方案的,应当优先选择非生物特征识别技术方案;在公共场所安装图像采集、个人身份识别设备,应设置显著提示标识;物业服务企业等建筑物管理人不得将使用人脸识别技术验证个人身份作为出入物业管理区域的唯一方式;在公共场所使用人脸识别技术,或者存储超过1万人人脸信息的人脸识别技术使用者,应当在30个工作日内向所属地市级以上网信部门备案。 2、OpenAI现支持禁止GPTBot爬取网站 根据OpenAI文件,OpenAI现支持用户禁止OpenAI网络爬虫GPTBot访问自己的网站。使用GPTBot用户代理抓取的网页可能会被用于改进未来的模型,帮助AI模型变得更加准确、提高总体功能和安全性。如果想要禁止GPTBot访问自己的网站,可将GPTBot添加到网站的robots.txt中: 3、OpenAI起诉open.ai域名的所有者商标侵权 财联社8月8日电,OpenAI Inc.对一家使用Open Artificial Intelligence名称的公司提起诉讼,该公司拥有域名www.open.ai。OpenAI称该名称侵犯了OpenAI的商标,造成了消费者的混淆。诉状称,Open Artificial Intelligence及其总裁盖Guy Ravine欺骗消费者,让他们相信该公司与OpenAI及其热门产品(如ChatGPT)有关。 4、微软Bing Chat将被引入第三方移动浏览器 微软Bing团队8月7日宣布即将把其AI驱动的Bing Chat搜索引擎引入桌面端和移动端的第三方浏览器。此外,桌面浏览器的Bing Chat和Bing企业版新增暗黑模式,Bing Chat企业版将提供AI聊天-完整的可验证答案和引用以及商业数据保护。 还有一处更新是Bing Chat中的多模态视觉搜索,该功能利用OpenAI模型,支持用户在聊天中输入图片,Bing Chat可以理解图片的上下文、解释它并回答有关它的问题,比如向Bing Chat询问拍摄的建筑物的建筑结构。 5、微软正式推出最强生成式AI虚拟机 微软今日宣布正式推出Azure ND H100 v5虚拟机系列,帮助企业更高效处理生成式AI任务。该系列是Azure迄今更强大和高度可扩展的AI虚拟机系列,配备了最新的英伟达H100 GPU和英伟达Quantum-2 InfiniBand网络。作为微软对生成式AI持续深入投资的一部分,微软正在利用AI优化的4K GPU集群,并将在明年增加到数十万个最新GPU。 6、传Win 11画图应用或整合AI工具Copilot 据IT之家报道,网友@zeealeid 8月6日发布推文,展示了将Win11画图应用整合Windows Copilot后的示意图。负责Bing AI聊天和Copilot的 Mikhail Parakhin随后转发该推文:“这些功能都会和大家见面,不是吗?”此举或暗示该功能在未来会成为现实。 7、谷歌搜索新增AI驱动的“语法检查”功能 谷歌新增一个“语法检查”功能。该功能使用AI系统来分析语言,可提供有关语法或拼写是否准确的建议。其支持页面似乎以及上线至少几周了。谷歌警告称它“可能不是100%准确”,当尝试更复杂的句子时,该功能的局限性会开始显现。 8、Meta解散AI预测蛋白质结构团队 据英国《金融时报》今日援引知情人士消息,Meta在今年春季解散了一个用AI创建第一个包含超过6亿个蛋白质结构的数据库(ESM宏基因组图谱)的团队。这表明Meta正在放弃纯粹的科学项目,转而支持能产生收入的AI项目。 Meta聘用了一个大约有十几位科学家的团队来开展ESMFold项目。该项目训练了一个能够处理大量生物数据来预测蛋白质结构的大型语言模型。Meta创建了一个开源数据库,使科学家能够轻松检索与其工作相关的特定蛋白质结构。学者们担心,从长远来看,Meta是否仍会承担维持数据库运行的成本,以及允许科学家在新蛋白质序列上运行ESM算法的另一项服务。Meta并未确认该服务未来是否会维持,但表示目前数据仍可供研究界使用。 Meta的新重点是生成式AI产品。 据两位知情人士透露,由Meta产品负责人Chris Cox领导的生成式AI团队于2月份成立,该团队现有数百名员工,其中包括从FAIR(Facebook AI Research)调来的人员。 据悉Meta正试图重新配置其FAIR研究,以适应生成式AI团队的目标。 9、网易申请AI大模型玉言商标 据钛媒体今日报道,天眼查App显示,近日,网之易信息技术(北京)有限公司申请注册“网易玉言”商标,国际分类为网站服务,当前商标进度为申请中。据此前媒体报道,“玉言”为网易伏羲实验室推出的中文预训练大模型,其相关技术已用于网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。 10、百川智能发布530亿参数的闭源大模型 今天下午,百川智能发布530亿参数规模的闭源大模型Baichuan-53B,这是百川智能发布的第三个大模型,主要服务B端行业,预计下个月将会开放API等相关组件。 百川智能4月10日成立后,6月15日发布了70亿参数规模开源模型Baichuan-7B,7月11日发布了130亿参数规模大模型Baichuan-13B,到今天,Baichuan-53B已经是其发布的第三个模型。百川智能创始人、CEO王小川透露,季度末,百川智能将发布千亿参数规模的模型对标GPT。 11、飞书AI助手“MY AI”或于9月发布 财联社记者今日获悉,飞书计划于今年9月官方发布AI助手“MY AI”。今年4月飞书曾发布“My AI”概念视频,该产品主要面向办公场景,涵盖自动汇总会议纪要、创建报告、优化和续写文字内容等多种功能。 12、字节视觉技术负责人创业 获数千万元融资 8月7日,北京通用视觉多模态大模型服务商爱诗科技宣布完成数千万元天使轮融资。据介绍,爱诗科技专注于解决AI视觉生成顶尖难题,致力于通过“融合内容理解与生成;融合文字、图片、视频等多模态”的双融合技术路径,搭建世界一流的AIGC视觉多模态大模型。企查查显示,爱诗科技成立于2023年4月。 爱诗科技创始人王长虎博士深耕计算机视觉与人工智能领域20年,带领字节跳动视觉技术团队在巨量规模的用户数据下,解决了多个视觉领域的世界级难题,并从0到1参与抖音与TikTok等国民级视觉产品的建设和发展。其团队成员来自清华、北大、中科院等顶级学府,曾任职于字节、微软亚洲研究院、快手、腾讯的核心技术团队。 13、华为天才少年大模型创业 主攻AI公文写作 据量子位报道,7月初,华为天才少年李博杰发表博客,称自己希望投身AGI事业,“为基于0和1的硅基生命作出一点微小的贡献”。近日消息显示,李博杰的精力将聚焦AIGC应用落地,现方向是公文写作和心理咨询,今后将主做大模型操作系统。李博杰是华为2012实验室原成员,职级20(技术专家A级别),以第一批“天才少年”的身份于2019年加入华为。离职前,他是2012实验室下属计算机网络与协议实验室助理科学家、副首席专家。 14、大摩:AI泡沫已逼近顶峰 财联社8月7日电,英伟达今年以来飙升了逾200%,摩根士丹利认为,若以此作为AI股票泡沫的风向标,那么大牛行情已接近了顶峰。摩根士丹利策略师Edward Stanley在一份研报中写道,放在历史背景中看,当前的涨势已处于“尾声”:“泡沫在触顶前的三年通常涨幅中值在154%。”虽然英伟达一直是AI热潮典范,但Stanley指出MSCI USA IMI Robotics & AI Select Net USD Index等板块基准的涨幅则温和得多。该指数同期上涨了46%。 15、AI热潮被质疑“有热度、没收入” 据新浪科技8月7日报道,生成式AI推动了今年的市场大涨,拉高了整个美国股市,但投资者开始质疑生成式AI何时才会对企业财务状况产生实质性贡献。杰富瑞分析师Brent Thill总结了投资者情绪:“这里有热度,但没有收入。”在被问及何时会看到AI技术带来的收入增长时,Alphabet、Meta和亚马逊都指出现有服务严重依赖过去的投资,这其中包括AWS为云计算客户提供的机器学习服务,以及谷歌和Meta向广告客户提供的AI增强工具。 16、美SEC主席:AI可能是未来金融危机的中心 据新浪财经8月7日报道,美国证券交易委员会(SEC)席加里·詹斯勒(Gary Gensler)多年来一直在研究AI的潜在后果。日前,詹斯勒谈到了他对AI最担心的一些问题,认为“这项技术将成为未来危机和未来金融危机的中心”。 他预计美国最终很可能会出现2~3个基础性的AI模式。这将加深整个经济体系的相互联系,使金融崩溃的可能性变得更大。因为当一个模型或数据集成为核心时,它会增加“羊群”行为(即从众行为),意味着每个人都将依赖相同的信息,做出类似的反应。 17、中兴通讯:密切关注AI相关模型的手机应用落地 中兴通讯8月7日在互动平台表示,近年来,公司加大在AI领域布局;在创新终端方面,推出全球首款AI裸眼3D平板nubia Pad 3D,搭载独家3D光场显示技术,加持强大的AI算力引擎,带来身临其境的独特3D视效体验;发布全球首款消费级GPT无线AR智能眼镜nubia Neo Air,融合多个AI大模型能力的GPT模型可实现即时问答等智能交互;在手机方面,目前中兴手机MyOS系统拥有智慧语音服务,可以通过语音完成百科问答、提供智慧秘书服务,同时公司密切关注AI相关模型的手机应用落地。 18、经济学家:AI或加剧经济不平等 据路透社8月7日报道,历史表明,技术进步的经济影响通常是不确定的、不平等的。美国麻省理工学院斯隆管理学院全球经济与管理学教授西蒙·约翰逊(Simon Johnson)认为,AI具有很大的潜力,但问题是“AI会加剧现有的不平等,还是真的能帮助我们回到更公平的状态?” 约翰逊和麻省理工学院经济学家达伦·阿西莫格鲁(Daron Acemoglu)今年出版的一本书调查了一千年来的技术,分析它们在创造就业机会和传播财富方面的成功情况。他们发现,虽然珍妮纺纱机是18世纪纺织工业自动化的关键,但它会导致在更恶劣的条件下工作时间更长;机械轧棉机促进了19世纪美国南部奴隶制的扩张;互联网创造了许多新的工作岗位,尽管所产生的大部分财富都流向了少数亿万富翁;自动自助结账不会让食品杂货变得更便宜、改变购物者的生活,只是通过劳动力成本的降低获得利润。 19、生成式AI正提高招聘效率 据《华尔街日报》8月7日报道,生成式AI正改变招聘流程。招聘人员称,这项技术可以帮助品牌和广告公司增强为特定岗位寻找最佳候选人的能力。ChatGPT等聊天机器人工具最直接的用途在于自动化部分重复性任务,比如向候选人写直接消息并创建职位列表大纲。当与HireEZ等机器学习工具结合使用时,生成式AI可以扩大搜索范围,包括Reddit子社区、开发者论坛、大学校友团体等在线圈子,从而更快地从更广泛的候选人群体中进行选拔。但麦肯锡合伙人布莱恩·汉考克(Bryan Hancock)认为,AI加速招聘的最大障碍仍是其制造虚假信息的倾向。 20、金蝶云·苍穹GPT企业级大模型平台发布 在今日开幕的2023全球创见者大会上,国内ERP龙头金蝶发布金蝶云·苍穹GPT,定位是最懂管理的企业级大模型平台,并将其称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排、知识智能引擎、个性化扩展、安全可信任等特点。 在多模型能力方面,金蝶今日发布业界首个财务大模型,该模型融合了金蝶30年财务专业知识积累、数百万家客户实践经验。基于财务大模型的财务AI助手可提供财务问答、费用报销、合同审批、报告生成、探索分析、预算建议等功能。 21、Zoom:不会窃取用户数据训练AI模型 Zoom首席产品官Smita Hashim在8月7日发表一篇博客文章,表示在未经同意的情况下,Zoom不会使用音频、视频或聊天客户内容来训练其AI模型。 “我们的目的是明确客户可创建并拥有自己的视频、音频和聊天内容。我们有权使用这些客户内容来提供基于这些内容的增值服务,但我们的客户继续拥有和控制他们的内容。”Hashim写道,“例如,客户可能有一个网络研讨会,他们要求我们在YouTube上直播。即使我们使用客户的视频和音频内容进行直播,他们也拥有底层内容。” 22、受益于AI需求上涨 Palantir股价涨超130% 美国数据分析软件公司Palantir在周一收盘后公布财报,上调了年度利润预期,并表示将回购10亿美元的股票,理由是其AI技术具有“变革性”吸引力。过去一个季度,人们对AI的兴奋推动Palantir股价上涨了132%。 该公司最近推出了AI平台(AIP),以帮助公司和政府使用AI来分析数据并做出决策。其CEO Alex Karp告诉彭博社,对Palantir AI的“需求是前所未有的”。Karp在周一致股东的信中表示,Palantir在4月份的AI平台目前拥有超过100 家组织的用户,Palantir正与另外300多家企业进行销售讨论。 23、大模型中间件创企澜码科技完成数千万元融资 据36氪报道,近日上海大模型中间件厂商“澜码科技”完成数千万元A轮融资,该轮由IDG资本、联新资本、Atom Capital参与投资。 澜码科技成立于2023年2月,基于大语言模型的驱动,为企业定制研发“中间层” 自动化运营中台,打造低代码/无代码的人机交互界面。基于大语言模型,澜码科技研发了能够连接人和系统的企业级Agent平台“Ask XBot”。 澜码科技已与金山办公、特赞、轻流、CGL、优云服等厂商达成了合作。其核心团队成员来自依图科技、阿里巴巴、腾讯、字节、IBM、Google等国内外互联网企业和科技公司,目前员工规模已达60人左右。 24、工信部:鼓励开展数据确权授权的标准制定工作 工信部网站今日发布对十四届全国人大一次会议第0483号建议的答复,在关于建立企业数据确权授权机制方面表示,下一步工信部将围绕三方面做好相关工作:一是支持北京、上海等地数据交易机构高质量建设,鼓励各类市场主体参与数据要素市场建设,探索多种形式的数据交易模式,推动数据要素价值转化;二是推动全国统一数据登记平台高水平建设,指导开展数据资产价值评估试点,打通数据要素流通堵点;三是鼓励部属单位开展数据确权授权的标准制定、技术研发、平台应用、授权认证等方面工作,探索数据确权授权的落地方案和创新模式。 25、AI通过自监督训练重建生物样品的微观图像 来自加州大学洛杉矶分校的研究人员8月7日在国际学术顶级期刊Nature的子刊Nature Machine Intelligence上发表一篇新论文,提出了一个自监督AI模型GedankenNet。该模型无需用标注或实验训练数据,具有更好的泛化能力,可从物理定律和思想实验中学习。经过自监督训练,GedankenNet成功在全息图中重建了从未见过的生物样品的微观图像。 26、AI模型可预测癌症原发灶位点 美国麻省理工学院和达纳-法伯癌症研究所的研究人员8月7日在国际学术顶级期刊Nature的子刊Nature Medicine上发表一篇新论文。他们开发了一款机器学习分类器OncoNPC,使识别一些神秘癌症的原发灶位置变得更容易。研究人员利用近3万名22种已知癌症的患者数据来训练机器学习模型,该模型可分析大约400个常在癌症中发生突变的基因序列。研究人员使用这些信息来预测给定的肿瘤在体内的原发部位。 27、Datablau数语科技完成B1轮融资 据Datablau微信公众号今日发文,近日,北京数据治理软件提供商Datablau数语科技宣布完成B1轮融资,由考拉基金领投,老股东线性资本继续跟投,指数资本担任独家财务顾问。本轮融资后,Datablau将进一步加速重点产业布局,构建基于大模型的数据资产智能平台,将AI与数据治理核心业务场景融合。此外,Datablau也已制定了上市的计划。 Datablau成立于2016年,历经六年多实践和探索,已深入服务泛金融、智能制造、能源、物流、教育、政府等众多行业,帮助200+大型企业客户实现了以数据治理驱动的数据服务能力。未来Datablau将继续加大研发投入,探索AIGC时代数据治理的变革技术,并将这些技术与企业客户的场景结合,提供创新的产品和服务。 28、云从科技视觉-语言跟踪模型刷新世界纪录 据云从科技微信公众号今日发文,近日,作为多媒体领域唯一CCF A类顶级国际AI学术会议ACM MM 2023公布了论文接收名单,云从科技及联合研究团队的论文《All in One: Exploring Unified Vision-Language Tracking with Multi-Modal Alignment》成功入选。该论文提出了一个新颖的视觉-语言跟踪框架All-in-One,首次实现了视觉-语言跟踪网络结构与学习范式的大一统,摒弃了复杂的融合模块,实现了更加高效的多模态跟踪框架。 All-in-One框架主要包括一个统一的骨干网络和一个高效的多模态对齐模块,核心思想是通过一个统一的骨干网络尽早地在对齐的多模态信号之间建立双向信息流。All-in-One在4个有挑战性的数据集(TNL2K, LaSOT, LaSOTExt, WebUAV-3M)上刷新了4项世界纪录,并在OTB99-L数据集上使用单模型达到了多模型效果。研究人员发现All-in-One具备成为多模态视觉-语言跟踪领域基础大模型的巨大潜力。 29、浪潮信息申请Chat相关商标 《科创板日报》8日讯,天眼查App显示,近日,浪潮信息申请注册“YuanChat”商标,国际分类为科学仪器,当前商标状态为申请中。《科创板日报》记者从知情人士处了解到,该商标是用于类ChatGPT的应用,目前已经在内测阶段,或将在年内发布。此前,浪潮信息已基于“源1.0”大模型研发了对话、问答、翻译和古文四个技能模型,基于“源”大模型打造的“智能客服大脑”已应用到浪潮智能客服系统中。 30、广汽推出AI大模型平台 《科创板日报》8日讯,广汽今日正式推出AI大模型技术的最新研发成果——广汽AI大模型平台,该平台号称“汽车行业首创的大模型平台技术”,将在近期搭载于高端智能轿跑昊铂GT亮相。广汽AI大模型平台聚合了多种AI大模型,能调用通用大模型的能力、基于智能汽车的应用场景构建专用模型。 31、研究称ChatGPT回答编程问题的错误率超50% IT之家8月8日消息,美国普渡大学的研究发现,OpenAI开发的人工智能聊天机器人ChatGPT在回答软件编程问题时,错误率超过一半,且能骗过三分之一的提问者。该研究团队分析了ChatGPT对517个Stack Overflow网站上的问题的回答,评估了其正确性、一致性、全面性和简洁性。他们还对回答进行了语言和情感分析,并对12名志愿参与者进行了问卷调查。研究报告的结论是:ChatGPT的回答虽然语言风格良好,但52%的回答是错误的,77%是冗长的。参与者只有在回答中的错误很明显时,才能识别出来。否则,他们会被ChatGPT的友好、权威和细致的语言风格所误导。 32、拓尔思拟募资18亿元 加码大模型研发 据证券时报消息,拓尔思于8月7日晚间披露定增预案,拟募资不超过18.45亿元,进一步发力大模型研发。根据预案,拓尔思拟募投项目名为“拓天行业大模型研发及AIGC应用产业化项目”。通过披露募资款项分配,拓尔思详细列明了开发大模型产品所需的投入组成:在18.45亿元的投资中,其中最大的开支是软硬件购置,公司计划投入8.41亿元,紧随其后的是研发人员薪酬和租赁费,投入资金分别为5.1亿元、2.57亿元,此外公司计划投入1.98亿元用于数据资源购买。 33、传迪士尼成立特别小组探索人工智能 据新浪财经报道,有市场消息称迪士尼成立特别小组探索人工智能,削减成本。
研究发现:ChatGPT回答编程问题的错误率超过50%
IT之家 8 月 8 日消息,美国普渡大学的研究发现,OpenAI 开发的人工智能聊天机器人 ChatGPT 在回答软件编程问题时,错误率超过一半,但仍能骗过三分之一的提问者。 该研究团队分析了 ChatGPT 对 517 个 Stack Overflow 网站上的问题的回答,评估了其正确性、一致性、全面性和简洁性。他们还对回答进行了语言和情感分析,并对 12 名志愿参与者进行了问卷调查。研究报告的结论是:ChatGPT 的回答虽然语言风格良好,但 52% 的回答是错误的,77% 是冗长的。参与者只有在回答中的错误很明显时,才能识别出来。否则,他们会被 ChatGPT 的友好、权威和细致的语言风格所误导。 Stack Overflow 是一个专门为程序员提供问答服务的网站,被认为是开发者获取代码片段和解决问题的重要来源。然而,该网站近年来也面临着流量下降、内容质量下降和用户信任下降等问题。据 SimilarWeb 在 4 月份的一份报告显示,自 2022 年 1 月以来,该网站每月流量下降了 6%,3 月份下降了 13.9%,而 ChatGPT 可能是导致其流量下降的原因之一。Stack Overflow 则否认了 SimilarWeb 的评估,并表示其流量受到搜索算法和 ChatGPT 兴趣激增的影响。 OpenAI 在其 ChatGPT 网站上承认其软件“可能会产生关于人、地点或事实的不准确信息。”截至IT之家发稿,该公司暂未对普渡大学的研究作出回应。
三星举行Galaxy Z系列品鉴会:折叠新品亮相 将于8月11日发售
凤凰网科技讯(作者/卡尔) 8月8日消息,三星在京举办Galaxy Z 系列品鉴会,现场展示了第五代折叠屏手机Galaxy Z Fold5、Galaxy Z Flip5等新品,手机全系搭载定制版第二代骁龙8,并采用了新的无缝铰链。据悉,新品将于8月11日正式开售,Galaxy Z Flip5的起售价为7499元;Galaxy Z Fold5起售价12999元。 三星Galaxy系列新品 作为折叠大屏,Galaxy Z Fold5将新技术与日常应用结合。办公方面,升级的底部任务栏、弹窗视图以及新增的双手拖放功能,构建了强大的多任务处理能力,用户还可与同事或朋友共同使用协同编辑功能,在各自三星智能设备的三星笔记APP上,分工编辑同一份文档,完成工作或创意任务。在娱乐方面,搭载第二代骁龙8,配合面积提升了38%的VC均热板带来的出众散热效果,以及峰值亮度高达1750尼特的第二代动态AMOLED屏幕,拥有不错的游戏体验。此外,升级的立式交互触控板还可让用户在观看电影或剧集时,随时调节播放进度、视频音量、屏幕亮度等。 而对于期望折叠屏手机更加轻薄便携的用户,三星Galaxy Z Fold5采用了全新的超闭合精工铰链,令机身重量相比上代减轻了10克、厚度降低了2.4mm,同时保持了出众的手感,任何场景都体验到便携、无负担的折叠大屏体验。不仅如此,新一代S Pen(三星折叠屏手机专属)设计的也更为纤巧与精致。 而全新的三星Galaxy Z Flip5在延续标志性掌心折叠设计的基础上,以升级的大视野智能外屏与立式自由拍摄系统,拥有一块3.4英寸(直角)的大视野智能外屏,用户可以在外屏上查看更多信息并设置丰富的主题以及视频壁纸。此外,大视野智能外屏还支持添加更多小组件,为用户提供更具实用性的体验。例如,在不展开手机的情况下,用户即可在外屏通过全键盘快速回复信息,还可以刷短视频或是使用三星钱包完成移动支付等,充分满足用户的日常所需。 三星Galaxy Z Flip5 除了两款全新的折叠屏,活动中也展示了Galaxy Z 系列的新品平板与手表。其中,三星Galaxy Tab S9系列平板拥有出色的显示效果和操控交互体验,可以无缝衔接的三星Galaxy生态系统;三星Galaxy Watch6系列智能手表则能够记录用户身体情况,为用户提供更有价值的多时段健康建议,并提供量身定制的锻炼指导和营养提示,助力用户追求个性化健康目标。 三星Galaxy生态产品 据悉,三星Galaxy Z Fold5|Z Flip5、三星Galaxy Tab S9系列平板电脑以及三星Galaxy Watch6系列智能手表目前正在预售中,并将于8月11日正式开售。届时,位于北京蓝色港湾、西单大悦城以及合生汇的三星折叠新品快闪店也将陆续开业,想入手的用户可先行前往身边的快闪店,上手体验三星Galaxy Z系列新品。
苹果iPad销量逆势增长,哪家安卓平板厂商可绝地反击?
之前的几年时间里,由于疫情对社会的影响,平板电脑厂商迎来了一波难得的发展机会。但如今,这种发展不但早已成为过去式,而且正在让市场支付透支潜力的代价。近日,市场调研机构Canalys公布了最新的2023年第二季度平板市场数据。调研结果显示,和第一季度一样,全球的平板销量在2023年第二季度继续大幅度下跌,目前单季度只有3300万部,勉强能算好消息的是跌幅从第一季度的13%收窄到11%。 市场不景气,厂商们也不好过。目前,最大的五家平板电脑厂商中,四家同比出现了下跌,部分厂商的年增长率甚至逼近-40%,说“腰斩”也不为过。不过,引人注目的是,这次苹果当了一回“最美逆行者”,不但份额和销量都是第一,也是唯一一家同比仍然实现增长的企业。所以目前的平板市场现状就是,苹果的iPad继续保持增长,安卓这边跌得却一个比一个惨。同时,两边阵营的差距也在进一步扩大,安卓平板这边似乎永无翻身之日。 iPad真就这么稳? 平板电脑市场上,iPad已经占据了很长时间的统治地位。甚至在国内,iPad某种意义上已经成为了平板的代名词。某国内五百强企业的雷姓董事长都会在自家平板的发布会上嘴瓢把自家产品喊成“iPad”。不过如今,苹果iPad的销量虽然逆势增长,但它们也并非没有受到市场下行的影响。 在2023年的第二季度,苹果其实并没有推出任何一款新iPad。我们追溯一下,苹果上一次的新平板发布似乎还是2022年年底的iPad 2022。不过,iPad 2022口碑并不算好。“坚持祖训”的非全贴合屏幕、大幅度上涨的售价以及和一代Apple Pencil的逆天兼容,别说路人了,貌似果粉都不是很能忍得了。新款产品反响不佳,但苹果生命周期极长的老款产品却表现亮眼。根据CNMO的观察,iPad 2021在今年5月份的价格已经跌到了2000元以下。 新产品口碑不行,老产品降价销售,这种情况自然对苹果造成了不小的影响。不久之前,苹果公布了2023财年第三财季(苹果的第三财季时间基本和第二季度重合)。财报显示,苹果的季度营收同比下降了1%,其中iPad的营收为57.9亿美元,不及预期的64亿美元,更比不上2022年同期的72亿美元。综合来看,iPad的销量虽然上涨,但收入却是在下降。 而且,苹果依然在面临着海内外的三星、联想、华为等厂商的竞争,日子似乎不太轻松。 海外厂商 当前,海外最大的平板电脑厂商是三星。事实上,三星也是最大的手机厂商,每年的手机销量都在苹果和华米OV之上。只是结合最新的调研数据来看,三星的平板销量仍然不及苹果iPad的一半,两者的实力差距比较悬殊。 不久之前,三星刚刚发布了全新的Tab S9系列。其中,三星Tab S9标准版机型的起售价格为5999元,Tab S9 Ultra的起售价格则来到了10199元。这个价格其实并不算很让人意外,因为三星的Tab S系列平板一直以来的配置都比较强大。以这次的三星Tab S9 Ultra为例,第二代骁龙8移动平台、11200mAh容量电池、16GB运行内存、1TB存储空间这些我们都能在这款平板上找到,堪称“安卓板皇”。 但是,即便是这样的“安卓板皇”,我们依然能够在它的身上找到不少苹果的痕迹,就比如Tab S9 Ultra的横置刘海。三星其实在以前的平板上就采用过类似的设计了,这次的Tab S系列只是将这种设计延续下来,但是这种设计我相信很多消费者其实都并不喜欢,它破坏了平板整体的协调性,在点亮屏幕的情况下非常扎眼。从产品和市场来看,三星应该是苹果最强大的竞争对手。但想要超越苹果,三星可能需要尽力摆脱苹果的影响。 国内厂商 从调研数据来看,联想和华为应该是目前国内最强的两家平板厂商了。其中,联想的出货量目前在华为之上,不过华为的下跌幅度要小于联想。 我们首先来看看联想,整理一下联想最近的新品我们可以发现,联想现在的新品定位都很有意思。安卓平板尺寸全在10英寸以上,8英寸成蓝海了?我就推出Y700,连续更新两代产品,狠狠拿捏小尺寸电竞平板用户;超大屏平板价格都很贵,我就推出小新Pad Pro 12.7,用上骁龙870,把价格拉到1500元,完美规避竞争对手。 现在,不少联想平板都很难找到同价位相似的竞品,这可能也是他们一直销量不错的原因之一。联想这种产品策略其实对消费者很友好,毕竟为他们提供了更为丰富、亲民的选择。但如今联想在销量方面的压力似乎也不小,它们可能需要更多独属于自身的优势。 在遭到制裁的情况下,华为平板的市场表现似乎比华为手机更好。但是,使用骁龙的华为产品,总会让人觉得缺了那么一点“灵魂”。好在,在2023年下半年,情况或许会有变化。现在有消息称,随着Mate60系列的问世,一些华为用户期待已久的重磅高科技产品将会回归,这或许也会影响华为平板的产品设计。以鸿蒙OS目前的发展速度和完善速度来看,华为或许是最有可能在平板上赶超苹果的厂商,只是这其中的时间跨度或许会很长。 写在最后 根据Canalys分析师的数据,2023年下半年强劲的季节性需求将会提振整个平板市场,但AI PC的开发可能会冲击平板的生产力地位。和PC一样,如今的AI技术也是平板发展的重要方向之一,抢占先机的厂商可能会影响未来的市场格局。
对话小派科技CEO任攀:苹果发产品之前,我们在高端头显市场很寂寞
智东西 作者 | 徐珊 编辑 | 云鹏 智东西8月8日消息,刚刚小派科技在北京举办小派Crystal新品体验会,在发布会上介绍了Crystal产品的核心优势,以及和苹果Vision Pro的相似之处。 小派科技联合创始人兼CEO任攀介绍了苹果Vision Pro发布后,苹果在产品设计思路和产品方案选择很多要点和小派科技不谋而合,比如都认为8K才是头显高清显示的起点,以及均采用VST方案。 同时,基于产品服务的场景不同,小派Crystal主要针对高端市场的极客玩家,主要面对游戏场景。而苹果则主要面向消费级市场,面对生产力场景。 正是这些产品需求的不同导致,小派Crystal在续航能力、交互方式上和苹果Vision Pro有所不同,小派Crystal仍保留手柄交互方式,并且支持长达3小时的续航能力。 “在苹果发布产品之前,我们在高端头显市场感到很寂寞。苹果发布之后,我们终于看到了同行者。”任攀说。 一、小派是如何看待Vision Pro?达成三大共识 2023年6月,苹果发布的Vision Pro将XR行业再一次带到了聚光灯下。 在苹果看来,空间计算时代是以现实空间、真实世界为核心,将空间“数字化”,给用户空间沉浸体验。 因此,苹果围绕视觉显示效果、物理现实体验以及人机认知交互,构建空间计算的三大能力,并将其集中在Vision Pro上展示。 这也和小派此前提出以沉浸感为核心的 “VR 3.0”概念,在视觉沉浸、物理沉浸和认识沉浸方面达到一定技术基础等看法不谋而合。 在苹果发布Vision Pro之后,小派发现,他们在产品研发思路上和苹果在三点方面达到共识。 比如说,小派科技和苹果都认为8K清晰度是良好的视觉沉浸的起点。 再比如说,两家公司均采用了VST光学技术方案,能够兼容VR、AR两种模式,并且能够对真实世界中的事物进行增强和优化。 在通用MR上,小派科技和苹果都认为从VR转向MR产品,在光学方案和计算成本上是目前的最优解。 二、MR产品差异取决于企业的战略 目前,在MR产业中,主要有两类玩家成为赛道的主力军。一类是以Meta、字节跳动的互联网公司,另一类则是以苹果、小派的硬件公司。 在任攀看来,目前已经入局MR赛道的互联网公司,采用的是赢家通吃的战略,因此其会将软件、硬件、内容和用户运营全部由一家公司负责。而像苹果、小派等MR硬件公司,主要聚焦于特定场景的特定用户群体,主要做部分市场的生意。 他认为不同的企业战略导致各家公司设计的产品,以及围绕产品展开的产品内容布局均有所不同。 “游戏行业本身已经可以让小派成长为一定体量的公司。”小派科技如今正围绕游戏用户、游戏场景、生态逻辑等拥抱游戏市场。 并且,任攀还提到VR、AR等设备均为过渡性产品,MR也就是混合类显示产品,是空间计算时代的终局。 由于此前的产品如Meta Quest Pro在市场体验、价值、需求都并未呈现较好的成果,给苹果的Vision Pro留下足够的市场空间。 而另一方面,Vision Pro的发布,正逢行业的拐点,由于其高性能的硬件服务、并且较高的定价,将给其他的头显类产品留出生长空间,并且将推动整个市场向前。 “单一硬件产品不能一劳永逸地服务所有使用场景,小派将会面对目标用户,使用带来最好的体验。”任攀说。 结语:精准定位用户,小派科技专攻高端市场 作为VR头显类产品,小派科技一直以价格高,8K显示在业内头显类别树一帜。但在头显内堆满高性能硬件,小派科技主要面对极客用户群体提供较好的视觉显示效果。 苹果Vision Pro的出现,让小派科技更坚信其坚守的产品思路和产品路线正确。我们也期待小派科技能够不断开拓新的市场,为用户提供更好的体验。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。