行业分类:
加载中...
头条分类:
加载中...
Funtouch OS 14 在海外正式发布,国内的 vivo 用户终于跑在了前面
2020 年 11 月 18 号,vivo 在深圳 iADC 设计博物馆正式推出全新的操作系统—— Origin OS,因为桌面和图标的高度自定义,以及界面设计的独特性,还有颠覆性的系统名称更改,让那一年的「OriginOS」受尽了行业关注。 将近三年的时间,华容网格、原子设计体系、变形器等特色功能,使得 Origin OS 成为了时尚、设计、个性化、年轻等的代名词,在各家系统趋同化的今天,也能一定程度上保留自己的特色。 当年的前身 Funtouch OS 在更名之后瞬间消失在了那年秋天,甚至连这个名字也只有早些年的 vivo 用户还会留下点印象。其实 Funtouch OS 在被弃用改名之后,并没有完全消失,而是成为了 vivo 海外系统的沿用名称,不仅活得好好的,就在昨天还发布了全新版本,并即将大范围推送给海外用户。 10 月 7 号,Funtouch OS 14 在海外正式发布,并且列出了在印度符合升级条件的 vivo 设备列表和具体推送时间。可以看到,包括 vivo X90 和 X90 Pro 在内的旗舰机型,将会是第一批体验到全新版本的设备,其他的机型也将在 2024 年 4 月之前陆续收到更新推送。 在 vivo 官方账号的推送中,还有一张设计感十足的更新推送表,更具年轻和动感范儿,仔细看看里面的涉及机型,确信 iQOO 系列也将参与到这次重大更新当中。一家人就要齐齐整整,一个不落。 届时,大部分 vivo 的海外用户将会拥有一次史诗级的系统更新体验。 一般能让广大用户感受到的更新,是将整个 IU 都进行了全新的设计,或加入了新主题,或换了些新图标,亦或改变了系统原有的布局和字体。尽管这些都是最表面的变化,但是「interface」永远都是最先 face 用户的部分。 Funtouch OS 14 就属于这种显著的更新。 全面迭代,五管齐下 Funtouch OS 14 的更新内容总结一句话就是:从头到脚换新装。用 vivo 官方发布的报告来说,主要集中在五个方面: – 个性化定制 – 生产力优化 – 多任务处理 – 流畅性提升 – 隐私保护增强 点亮屏幕,有 3 种完全不同的「时钟布局」和 8 种「字体样式」摆在你眼前选用,字体的改变因人而异,但能够定制锁屏界面的时间位置,确实解决了很多人选择壁纸的痛点——封面的人物脸上,再也不用长数字了。 虽说这回的常亮模式增加到了 90 多种式,但最独特的并不是那些五彩缤纷的搭配,而是被称为「Monochromatic colour palette」的「单色调色板」,统一的颜色,没有过多的选择,好像能在这个充满诱惑的世界里,给你提供一丝宁静。虽然不知道这样的主题对选择困难症的患者有没有疗效,但似乎对手机续航会有一点点正面的影响。 高达 4K 分辨率、60FPS 视频的导出,外加 25 种视频编辑新滤镜,共同构成了新系统的生产力工具。 在多任务处理方面,新系统加入了,或者说终于加入了迷你窗口,不过依托的运行内存,可以同时间最多可以在后台激活 12 个小窗口。当然了这些小窗的功能与操作,和 Origin OS 以及其他家的窗口,不能说是一模一样,只能说是完美复刻。 基于高性能的 RAM Saver 和 Extend RAM 3.0,不仅能让搭载 Funtouch OS 4 的新设备拥有强大的多任务处理能力,允许你在 12 GB RAM 的后台同时运行 36 个应用程序(8 GB RAM 同样条件下为 27 个),还能通过「动态模糊」和「App Retainer」技术,大幅提升系统操作的流畅体验。 其实「App Retainer」早在 iQOO Neo 7 Pro 上就已经开始应用,这项技术能确保 100 多个在后台且未手动关闭的应用程序,能够恢复到使用的最后界面,属实是流畅和安全兼具的最佳拍档。 隐私保护方面,Funtouch OS 14 最大的改变,是将「屏幕镜像」的功能优化,在投屏时能阻止弹窗信息在公屏上显示,将工作和生活完美分割,互不影响。当然这样做,也避免了许多没必要的误会和尴尬。 如此更新,我们终于跑在了前面 其实在视频编辑器的更新里,有一个功能并没有在上文展示:新系统的相册可以调整视频播放速度、循环播放和截图。因为我不知道这个原本就应该有的基础功能到底算不算更新范畴。 的确,五大方面的更新从纸面数据看从头到脚、面面俱到,但相信不少朋友看完这些个新功能后,应该和我有同感,“就这?”“没啦?”“不早就?”。我们可能会羡慕海外用户更新系统后那种把玩的新鲜感,因为我们已经很长时间没有感受过这种手机系统「颠覆性」的更新,所带来的兴奋感了。 随着 Funtouch OS 14 的发布,另一个在过去不敢想,如今已然成为常态的事实,也被更多的人察觉:我们好像真的在「遥遥领先」。 2022 年 11 月底,Origin OS 3 正式推送,超级小窗、图标模式、原地复活机制、动效运动模糊等功能全盘托出,上述的名称实际上是 Funtouch OS 14 中五大更新的本地叫法。而海外版本的迭代,足足比国内慢了一年,操作系统的先享福利,在近五年国内手机市场的激烈竞争和内卷中,也渐渐回归到国内用户手中。 的确网上会有很多关于「基于 Android」的批评声音,但如果真的花时间体验一下 Android 的原生操作系统,你会发现并且感慨国内厂商为了优化这个「基于」到底做出了多少努力。而结果就是,当你放眼全球去对比 Android 阵营的操作系统时,你又会发现,当下这些早都习以为常并融入日常生活的基础功能,是多少非国内的厂商还没写上日程表的更新计划。 如果说当年国产手机对 Android 系统的优化被形容成在毛坯房里搞装修,那现在则是在自家搭建的生态精装房里买家具。 再往大一点看,vivo 在 2023 年第二季度 1140 万台的出货量为国内市场第一,如此大体量的终端和用户群体,国内用户想当然的会最先体验到最新的功能。 无独有偶,vivo 和国内的友商一起在今年的第三季度共同拿下了全球手机市场 30% 以上的出货份额,的确从全球市场来对比,和三星、苹果的比例还有一定的差距,但在一个国家,有多个手机品牌的横向竞争,和单个品牌延伸出的「高端-下沉」垂直竞争,在世界上都属于独一份。 体量的庞大,竞争的残酷,才会催生出 Origin OS 等一批好看、实用的国产系统生态,也会出现海外市场系统延时更新的巨大反差。Funtouch OS 14 的迟到更新,很好的说明了国内手机厂商的努力得到了应有的回报。 而国内的消费者,在众多优秀产品的选择上,也渐渐拥有了甜蜜的烦恼。起码在手机这个细分的领域,我们的体验感,这回真的跑在了行业的第一梯队。
Chiplet:实现AI大模型算力跨越的关键之道
集微网报道 (文/陈炳欣)以ChatGPT为代表的AI应用蓬勃发展,对上游AI芯片算力提出了更高的要求。半导体大厂通过不断提升制程工艺和扩大芯片面积,推出更高算力的芯片产品加以应对。研究显示,当5nm芯片的面积达到200mm2以上,采用Chiplet方案成本将低于单颗SoC,同时也减少了因芯片面积增加而带来的良率损失。除了成本和良率的优势,Chiplet技术还带来了高速的Die to Die互连,使得芯片设计厂商可以将多颗芯粒集成在一块芯片之中,实现算力上的大幅提升。对此,有越来越多厂商意识到,Chiplet将是AI芯片实现算力跨越的破局之道。 Chiplet为算力增长赋能 Chiplet通常被翻译为“芯粒”或“小芯片”,通过将原来集成在一颗系统级单芯片中的多个单元分拆开来,独立成为多个具特定功能的芯粒,分开制造后再通过先进封装技术将彼此互联,最终集成封装为一个系统芯片组。对此,芯和半导体联合创始人、高级副总裁代文亮指出,Chiplet是先进工艺制程逼近物理极限,芯片PPA(性能、功耗、尺寸)提升放缓,经济效益降低的大背景下,应运而生的。 目前,芯片面积已经接近光罩尺寸的极限,单芯片尺寸不能超过1个光罩面积800mm2。同时,芯片的尺寸越大,落入晶圆坏点位置的概率也就越高,良率越低。更小的芯粒尺寸可以带来更高的良率,突破光罩尺寸限制,降低制造成本。芯粒还拥有更多工艺节点可以选择,可以将最佳节点实现的芯粒进行混合集成,从而提高研发效率,摊薄NRE(一次性工程费用)成本,缩短上市周期。人们大多听说过“摩尔定律”。实际上,戈登·摩尔在1965年还有一个预言:“事实可能会证明,用小型功能构建大型系统,分别进行封装和互连,性价比会更高。” 当GPT-4首次支持多模态后,文本、图像、视频及更多形态的数据都成为用于模型训练的数据。从训练到推理,从数据中心到边缘,AI引爆的数据多模态化浪潮使得业界意识到原有的算力明显不够。如果说过去对算力的需求是以倍数增长,现在就是呈现指数级态势。这就对半导体行业提出更高挑战。 从当前的发展态势来看,Chiplet或许正是满足当下算力需求的关键技术。一方面,通过Die to Die互联和Fabric互联网络,能够将更多算力单元高密度、高效率、低功耗地连接在一起,从而实现超大规模计算。另一方面,通过将CPU、GPU、NPU高速连接在同一个系统中,实现芯片级异构,可以极大提高异构核之间的传输速率,降低数据访问功耗,提高数据的处理速度,降低存储访问功耗,满足大模型参数需求。 进入规模化应用阶段 Chiplet技术方兴未艾,全球半导体顶尖公司都在积极推出自己的产品。特斯拉Dojo深度学习和模型训练芯片,采用Chiplet进行系统垂直重构,每个训练Computing Tile含25颗D1 Chiplet,6个Tile+20个接口处理器形成Dojo一个Tray。AMD MI300 APU加速显卡为全球首个CPU+GPU Chiplet,利用3D封装技术将CPU和加速计算单元集成在一起,整颗芯片集成1460亿颗晶体管,5种/21颗Chiplet。英伟达的Ampere A100 GPU采用GPU+6xHBM,通过封装技术在中介层实现GPU和HBM之间的高速互联。超摩科技联合创始人、技术市场副总裁邹桐表示,ChipLet已经进入规模化应用阶段,应用于高性能计算芯片当中。 值得注意的是,在边缘侧大模型推理,对于边缘算力的需求也是未来一大趋势。与云计算的数据中心架构相比,大模型在边缘端的智能计算是在一个已经训练好、有基本智能水平的模型基础上,当边缘端具备多模态大模型的离线学习进化能力时,本地模型将变得私人定制化,数据也无需上传云端。这部分推理与训练微调过程主要依赖边缘大模型的AI算力。 根据原粒半导体联合创始人原钢的介绍,针对边缘侧单任务的大模型场景,可以把模型切分到不同Chiplet进行并行计算,通过在预训练模型的基础上进行额外训练,使其适应特定任务。大模型的边缘端微调,可使用本地存储的私有数据,或者本地新采集的数据。“SoC主控+AI Chiplet”组合可有效复用芯片主控,显著降低成本,快速满足各类规格需求。这将是未来该领域的重要发展方向。 核心目标是降成本提性能 当前,Chiplet应用的局限性依然明显。根据中兴微高速互联总工程师吴枫介绍,目前Chiplet仍以国际大厂的垂直体系为主,每个厂家都在依照自己的产品体系,设计相关封闭的系统。如果想要实现不同平台间的Die to Die互联,仍然有待完善互联标准。此外,Chiplet初期成本依然高企,需要有确定和相当的市场容量才能支撑。代文亮也指出,存在Die互连、先进封装3D异构集成、设计流程及工具等挑战,是Chiplet实现的核心问题。 Die-to-Die互连是一项核心工作。标准协议统一化是行业发展的大趋势。Chiplet增加了互连的复杂性,但只有实现了Chiplet之间的标准化,才能有效扩大生态圈,提高复用并降低成本。对此,吴枫认为,要加强通用的Die to Die PHY IP的开发,为Chiplet提供高带宽,低功耗、低延迟的物理层连接。在生态建设层面,应设立物理层标准,规范尺寸、摆放方式、电气、逻辑层协议、帧格式、流程等,加强一致性和兼容性。在生态方面,应加强IP供应商、EDA设计、验证和仿真工具、测试方案和测试工具的协同。系统级/Chiplet是多团队、多芯粒、多厂商、多工艺节点、多功能模块、多材料、多工具等要素融合的产品设计,需要从顶层出发协同优化整个系统。 代文亮则强调,要加强先进封装3D异构集成技术的研发。3D异构集成是Chiplet实现的基础,面临诸多设计挑战,比如互连、散热、良率、翘曲、无源器件集成、寄生效率、成本、可靠性等。通过封装技术才能有效实现多Chiplet的集成,包括高密度先进封装的设计、生产、验证,高速通道的设计、验证,供电方案、散热方案、应力方案、可靠性等,为Chiplet之间提供高密度高速的互联,支持大电流供电。 应用Chiplet技术的核心目的是降低成本与提高性能。在降低成本方面,Chiplet复用是降低成本的有效手段。在提高性能方面,核心则是重构系统,将计算、存储模块拉近,实现系统设计、软件适配等多方面的优化。借助Chiplet技术进行系统级协同设计,可以在多样化的场景和需求下,实现整个芯片/系统的PPA最优化。开发流程需要匹配Chiplet架构,Chiplet之间需要协同设计、仿真、验证,进而提高交付效率和交付质量。
元宇宙熄火,AR重生!2023 XR行业乱局与三大趋势
作者 | 徐珊 编辑 | 云鹏 2023年,大模型的热浪给狂热的元宇宙风口泼了一盆冷水,让整个产业开始冷静下来。紧随其后的,是与元宇宙关系紧密的XR产业,逐渐认清现实。 VR头显厂商不再做着明天销量就能突破百万台的美梦,清楚地看到产品和市场成熟度与预期之间的差距,XR(扩展现实)产业在渐渐走入了产业冷静期。不知何时起,PICO遍布一线城市黄金点位的巨幅广告越来越少见。打开手机,人们鲜少看到某某金牌大V玩VR的视频,再不见打卡返现等花式宣传。AR眼镜玩家们不再大张旗鼓地宣传今年618战报,省去了为争抢各项榜单“第一”绞尽脑汁的烦恼。 ▲奇遇VR系列曾采取打卡返现的方式推广 更有意思的是,行业备受关注的巨头苹果终于发布其首款空间计算头显Vision Pro后,产业内各方人士在对产品热议一段时间后,行业的热议话题突然进入了“真空期”,各方厂商都开始对下一步发展缄默不语。 一时间,仿佛空气中都回响着一句问句:“当前头显天花板放在这了,然后呢?” 很显然,最先回过神来的是一些AR/VR头显厂商。他们做的第一件事就是产品称呼上和苹果对齐,一时间,VR头显不再是VR头显,成为了MR头显。XR赛道内本就难以分清的产品品类,再次重新分类。 其次,各大厂商开始来到证明题,先后论证同一命题,“苹果Vision Pro有的特性,我也有。”有的厂商甚至还开始多证一步,“不但苹果Vision Pro有的特性,我也有,而且我还比它便宜,甚至现货发售。” ▲苹果Vision Pro发布 但最终XR产业见多识广的老炮们,可能是最清醒的一批人,不约而同地发出感叹:“三年内,苹果Vision Pro无人能够赶超。”甚至,还有一位资深产业人士形象地打了个比方,说道:“苹果Vision Pro就像远处的灯塔,大家都能看到灯塔就在那,但是大家都不知道如何去到那里。”就连曾经在主导整个行业的Meta,其内部人士也告诉彭博社:“我们正处于‘害怕苹果’的阶段。” 热议、争辩和沉默之中,XR产业悄无声息地开始了新一轮的洗牌。 在这一轮洗牌中,我们看到国内销量排名前二的VR头显公司梦想绽放跌倒,看到曾经被誉为“元宇宙第一股”的Robolox股价大跌70%,看到曾经句句离不开“元宇宙”的Meta不间断裁掉近两万人后,不断强调着AI大模型的重要性。微软、谷歌、腾讯、百度……越来越多的巨头撤离XR赛道桌前,选择遥遥观望。曾经壮志凌云的高管人才们要么选择另寻出路,要么转换赛道拥抱AI,曾经拥挤的XR赛道桌上,如今稳打稳坐的玩家已不剩几位。 但在用沙子搭建的高楼逐步崩塌时,我们仍能看到一小批初创企业正坚守着其初心,坚守在XR赛道中。他们不但延续去年的产品迭代速度,而且还开辟了一些新的玩法,有的AR眼镜厂商选择研发新的产品形态,有的VR头显选择在交互上继续创新。外面的纷纷扰扰,对他们似乎只是一场热闹活动,看完了又重新走回在自己的道路上继续前行。当然,如果有合适的蹭热点,他们也不会放过。 今年夏天,智东西的记者在十余场活动中,与数十位XR赛道里的产业玩家交流,从上游供应链到下游终端,再到开发者群体,从他们的眼中、口中,以及神情中,感受XR行业这一场动荡的AB面。 连续四季度出货量下滑的VR头显,和同期出货增长140%的AR眼镜的鲜明对比,是否意味着VR和AR之争,终于将有胜负?接连解散团队的巨头们,和跑步进场的XR创企们究竟如何看待当下产业的机遇和挑战?2023年,最受各大厂商欢迎的内容开发者们又为何在研发XR内容的大门前徘徊不前?XR行业的AB面图景,今天徐徐展开在大家面前。 一、硬件产品的AB面:连连后撤的VR VS 高歌猛进的AR 今年,VR头显的“寒冷”和AR赛道的“热闹”形成鲜明对比,让不少人唏嘘不已。 我们先来看两组来自IDC的最新数据: (1)最新数据显示,2023年上半年,中国AR/VR头显出货32.8万台,同比下滑44%。其中AR出货6.8万台,同比上涨142%;VR出货26万台,同比下滑53.3%。 (2)最新数据显示,2023年第二季度全球AR/VR头显出货量连续第四季度下降,出货量同比下降44.6%,出货量前五分别是Meta(50.2%)、索尼(1%)、字节跳动PICO(9.6%)、Xreal(略高于2%)和大朋VR(略高于2%)。目前,AR/VR头显在2023年Q2销量仅略高于2017年,IDC预计今年将出货850万台。 从年出货量百万台,到半年出货量不到30万台,可以看出VR头显的销量正在呈现断崖式下跌。但回想起今年上半年VR头显赛道的情况,不少产业内人士表示并不意外。 ▲2022Q1-2023Q2中国VR/AR出货量(来源:IDC) 首先是被给予厚望,但转眼间大厦倾塌的梦想绽放。要知道去年全年,梦想绽放的奇遇VR头显系列,都拿下国内前二的好成绩,在国内VR头显第一梯队站稳。今年5月,智东西还曾收到梦想绽放新品发布会的邀请,但随后我们看到的是梦想绽放的CEO离开公司,发布会取消,新品再不见踪影。 至今我们仍未知道,8亿融资、总部搬迁青岛、打卡返现计划……谁是压垮梦想绽放的最后一根稻草,但很显然的是,国内XR赛道又少了一位具有竞争力的玩家。 相较于去年的高举高打策略,今年PICO明显对市场呈现的姿态谦虚了很多。随着PICO首届开发者大会的举办,PICO今年的重心似乎开始从消费级端转向企业端。一方面,PICO 4的市场反馈让字节跳动的百万出货美梦瞬间清醒,对市场的认知更加客观。另一方面,按照PICO的产品迭代周期,显然今年PICO将不会有新的产品推出,业务重心也有所调整。 同时,我们可以看到索尼PS VR2的出场,影响了PICO在全球VR/AR头显市场的份额,从去年同期的11.2%下降到9.6%。 ▲2023上半年中国VR市场厂商份额(来源:IDC) 整体看来,今年VR头显市场的新品重点或许还要寄托在Quest 3上,但对于Quest 3能否复制Quest 2千万台出货量的成功之路,苹果分析师郭明錤率先发出不看好的信号。 他表示Quest 3最初在2023年下半年的出货预期为超过700万部以上,但因预期需求疲软,故目前对今年下半年出货预估调整为200–250万部,2024年出货量则约100万部。也就是说,两年加起来,Quest 3的出货量将不超过350万台,这距离Quest 2的千万台出货量仍有很大差距。 ▲郭明錤在社交媒体X上给出有关Meta头显的最新预测 而在未来的产品路线上,已然入局的苹果和Meta两大巨头似乎也选择了截然不同的道路。 据彭博社报道,苹果和Meta都已经开始下一代头显类产品的研发,但有所不同的是,苹果将重视头显的轻薄化。据悉,在测试中,曾有人因为Vision Pro的尺寸和重量颈部拉伤。而Meta则希望降低未来产品的价格,让头显的价格回归到300美元的价格档位,帮助推广头显市场。 据报道,Meta计划明年推出一款更便宜的MR头显,外观和Quest 3相似,但硬件配置更低,在产品发布后,Meta将Quest 3重新定位为其中端产品。 ▲Meta Quest 3 除了降低硬件配置外,Meta还想了一个妙招,试图降低头显价格——把手柄单独作为配件出售,不再和头显一起出货。不得不说,这招真是妙呀。(狗头) 与VR头显相对的是,AR眼镜今年热闹不断,产品出货量也在大幅上涨。近两个月来,AR眼镜新品更是扎堆出现。尤其Xreal、雷鸟创新、Rokid、影目等明星AR企业更是更是先后发布自己的AR眼镜新品。 ▲今年上半年国内AR眼镜产商们推出的新品,从左到右分别是:Xreal Air 2、雷鸟X2、Rokid AR Studio、影目Go 在这些新品中,我们有幸体验了其中的部分产品,能够明显看到现在的AR创企公司正在沿着两种研发路径推出相应的产品。一种是是开拓新AR眼镜产品方向,像是雷鸟创新和影目分别针对波导类眼镜,以及轻量化AR眼镜方向做出创新性产品,同时也打出差异化。相较之下,Rokid和Xreal则是选择用软件重新定义产品交互的方法,基于此前的硬件产品做二次升级。 同时,一些成立于2022年的新AR创企玩家们,也先后交上了自己的首份答卷。致敬未知在今年7月底推出了自己的A1系列。 ▲致敬未知ARknovv A1 可以明显看出,在AR眼镜前期产品形态探索阶段,不同AR眼镜创企已经不再像是去年一般在同一产品方向卷起价格战,而是开始探索AR眼镜不同形态的可能性,并通过量产产品验证这一方案的可行性,也迅速推进产品的迭代。 很显然,今年VR的冷清和AR热闹的鲜明对比,并非是因为VR和AR技术之争有了胜负,而是由于一些产品研发周期的空白期,以及部分企业的自身运营,市场对产品的反馈等多重综合原因导致了两大产品情况有所差异。 尽管如此,VR头显的出货规模仍是要高于AR眼镜产品数倍,因此,两大产品方向都还在迅速推进的过程中,产品形态均还没走到稳定阶段,留给未来的想象空间还比较多。 二、企业布局的AB面:巨头退守观望 VS 创企跑步进场 在行业动荡之中,有人选择激流勇进顺势向前,而有人决定选择在动荡中寻找机遇,乘势而上。 自从2023年开年以来,各大科技巨头齐调转船头的动作就更为明显。微软的工业元宇宙部门解散,产品线重新收归于其云产品线下。谷歌的AR眼镜产品研发遇阻,研发产品团队解散。腾讯XR团队解散重组,曾经的百度希壤一把手高管马杰选择了离开。来来去去之间,各大科技巨头都将曾经放出单独成立的XR的部门收回,规整至其创新业务或者是原有部门之下,相应的投资资源和培养计划也成了一张白纸。 在风口不断转变之时,我们很难再见有科技巨头像苹果那样坚定在XR头显赛道默不作声的研发近八年。 与之略显不同的是,作为当前的主要智能终端产品手机的巨头企业们,仍对XR赛道保持着较高的行业敏感度。无论是华为、小米,还是vivo以及荣耀,都在密切关注XR赛道的产业链动向,技术突破等。小米一直通过其先锋探索版“汇报”自己的研发进展。据了解,华为内部也有专门的团队一直在研发不同形态的AR眼镜,探索合适的产品形态和功能。vivo更是在其创新研究院内部不断迭代其头显和AR眼镜产品。 ▲华为智能眼镜 平静的水面下,是各方人马都在紧锣密鼓地筹备着技术武器库,然后静静等待着爆发时刻的来临。 当然也有人不愿意做跟随者,不少创企抱着一往无前地态势向前推进产品、技术的落地,希望能通过提前布局成为行业的引领者。 这其中不止有此前提到的终端厂商,还有上游供应链的光学模组玩家们。在前不久的光博会上,至格科技、鲲游光电、灵犀微光、珑璟光电等企业前挤满了咨询围观的人士,纷纷对产品的最新性能、产品体验一探究竟。 ▲MicroLED微显示器制造商JBD在光博会上展示其新一代小尺寸光机 在交流的过程中,我们了解到,大部分的产业内人士都认为AR眼镜将代替手机,成为下一代终端产品。但同时,他们也在心中又一个大致的时间表,认为2025年,整个XR行业将会迎来市场新曙光,而2028年,整个行业将会迎来一个全面爆发节点。在多方走访下,不少供应链企业也比较同意这一时间预估,认为尽管产业起步随晚,但是整个AR的增速还是比较迅速,并且产品迭代的速度也非常快。“黎明就在前方。”一位AR光学创始人说道。 在这轮的动荡中,我们看到的不少AR初创者逆流而上的身影,选择做新时代的引领者,也见证了不同科技巨头在该领域权衡考量下做出的冷静思考,保持者长期投入研发,迭代产品,但不量产的节奏安排。 三、内容研发的AB面:赚不到钱的XR内容开发者 VS 等不到内容更新的用户 随着疫情好转,人们对VR内容的感兴趣程度再次下降。不知道是否是受苹果的开发者计划的影响。今年,各大终端厂商明显对开发者的重视程度再次提高,先后推出开发者计划,给出各种简单易上手的开发者工具,吸引开发者创作内容。 PICO中国区游戏商务负责人郭文山曾简要给出目前国内XR内容创作者画像:热爱VR技术的游戏开发者、创业者以及行业开发者。 热爱VR技术的游戏开发者可能在2015年和2016年第一波VR时代就已经开始XR内容方向的研发。他们往往都有游戏研发背景,其中一部分持续在做To C(面向消费者)的产品,另一部分可能转向偏向To B(面向企业)的项目。而创业者在Meta、苹果等公司的号召下,一些有创业经验的人开始涌入XR行业。他们对新技术、新趋势敏感,可能之前并非从事XR行业。最后是来自行业的开发者,比如曾经做2D应用的公司,像爱奇艺、哔哩哔哩等大公司。 ▲PICO应用商店盈利情况 但让人意想不到的是,无论是XR内容创业团队,还是动手能力极强的DIY博主,都对XR内容开发的热情并不高。 在多方走访后,不少内容开发者表示现阶段无论是VR头显,还是AR眼镜,产品形态都不稳定,并且迭代速度很快。而一个内容精良的游戏制作周期也往往比较长,因此他们会担心等到游戏研发出来,以当下的产品性能是否能够运转游戏,游戏是否还具有竞争力等等。“这其中的不确定性太大了,很难保证可以成功。” 另一方面,他们还提到目前的XR市场规模较小,整个市场加起来的年出货量都不到百万台,其中活跃用户则更少,因此很难在内容上获得盈利。而面对已经成熟度的手机、平板、电脑市场,足够大的用户群体能够撑起其盈利预期。 这也就导致了我们经常会在XR设备中体验到有一些不错的应用,但是其长期不更新应用内容,对一些的使用BUG也无法及时修正。最后,等到失望的用户们,只好默默收起了自己的设备,再留下一句:“我觉得没什么好玩的内容。”随后,未获得用户正面反馈的终端厂商又开始新一轮的迭代设备,以求给内容研发方提供更好的硬件支撑。 结语:水深火热的XR产业,考验各方玩家关键判断力 当下,随着人们越来越关注空间互联网的到来,国内也开始涌现出不少XR赛道创业玩家,产品也逐渐进入市场验证阶段。近两年内,XR赛道创业的玩家们有的乘势而起,率先抢占用户心智,也有的一招不慎,落得满盘皆输的结果。 内容场景,一直是XR赛道玩家们重视的应用场景之一,如今如何让终端厂商、内容开发者和用户都能满足自己的需求,还是一个需要长期博弈、各方携手攻克的难题。 下一步,XR赛道的市场是否能像产业预期一样,在2025年迎来一波新高潮,引爆市场,我们将持续关注。
因妨碍广告投放,谷歌YouTube开始屏蔽微软Edge浏览器“严格”跟踪保护模式
IT之家 10 月 10 日消息,个性化广告是一种强大的宣传利器。对用户来说,它可以提高广告的相关性,从而提高用户点击率;对广告客户而言,它可以提高投资回报率;而这种广告往往需要根据用户的访问数据来实现定位并向用户展示与他们更为相关的广告内容。 图源 Pexels 简单来说,部分网站会使用跟踪器收集用户的浏览信息,这类信息将用于改进网站服务并向用户投放个性化广告等内容。不过,也有某些跟踪器也会将收集到的信息发送到另一家网站上。 针对这一问题,微软 Edge 等主流浏览器都提供了基本、平衡(默认)和严格三种跟踪保护模式,其中严格模式会阻止来自所有站点的大多数跟踪器,因此很多广告的个性化服务难以为继,这也导致部分站点可能无法正常访问。 现有大量用户反馈称,如果 Microsoft Edge 启用了“严格”跟踪保护模式,谷歌将阻止他们观看 YouTube 视频。 IT之家查询发现,早在 2023 年 5 月,就有报道称谷歌一直在为 YouTube 测试一项反广告拦截实验特性,当其检测到部分用户使用了广告拦截程序时会弹窗提醒,除非用户禁用广告拦截器或订阅 YouTube Premium,否则将无法访问该网站。例如这位用户就被弹窗提醒:视频播放器将在 3 个视频后终止。 实际上,谷歌很早的时候就已经开始与广告拦截器展开斗争,例如在 2016 年初曾短暂禁止广告拦截器上架 Play 商店,但不久后又恢复了原本策略。但很显然,这件事并没有就此停止。 随着谷歌逐渐加强反反跟踪器功能,越来越多的 YouTube 用户都开始看到这一警告和弹窗,而这次甚至直接与浏览器的可选跟踪保护模式进行对抗。 从谷歌提示中我们可以看到,谷歌坚称“广告拦截器违反了 YouTube 的服务条款”: 您可能激活了广告拦截器。您必须允许 YouTube 或关闭广告拦截器才能继续播放视频。 广告可以让全球用户访问 YouTube。 为了获得无广告的体验,用户可以选择 YouTube Premium,确保内容创作者仍然获得报酬。 因此,用户只有两种选择:允许 YouTube 广告或购买 YouTube Premium 订阅服务。不过好在这一问题并未影响到所有用户,这说明谷歌仍在灰度测试中,希望后面会进行调整。
设计圈年会迎来重磅核弹!Adobe推出三个AI新模型 图片编辑功能获全面升级
财联社10月11日讯(编辑 赵昊)当地时间周二(10月10日),有“设计圈年会”之称的“Adobe Max 2023”正式召开。在序幕活动中,软件巨头Adobe推出了三个新的生成式人工智能模型,为Photoshop等图片编辑软件增添了强大的功能。 据Adobe介绍,这三个新模型分别为“第二代萤火虫图片模型”(Firefly Image 2 Model)、“萤火虫矢量模型”(Firefly Vector Model)和“萤火虫设计模型”(Firefly Design Model)。 Adobe表示,与前一代相比,第二代萤火虫图片模型可以生成质量更高的图像,在渲染逼真的人体时,涉及皮肤纹理、头发、手部和面部特征等高频细节更逼真。生成的图像不仅具有更高的分辨率,还具有更鲜艳的色彩和对比度。 另外,Image 2模型还引入了新的AI编辑功能,帮助用户定制图片生成结果。用户可以通过设置调整图片的景深、运动模糊和视野FOV,就像手动相机控制一样。模型还添加了“提示指导”功能,可帮助用户改进文本措辞,也能自动完成提示以提高效率。 除此以外,Adobe还引入了“生成匹配”(Generative Match)功能,可以将图片匹配为用户选定的风格。用户可以从图像案例列表中进行选择,或上传自己的参考来复制样式,并使用滑块控制相似程度。 不过,目前Image 2只能通过“Firefly beta”网站使用。虽然将很快推出到Creative Cloud应用程序中,但Photoshop用户可能还需等待一段时间。 同时,Adobe还推出了适用于Illustrator的“萤火虫矢量模型”,公司称这是“世界上第一个矢量图形的生成式AI模型”,用户可使用文本提示创建可编辑的矢量图像,并自动将图形的每个元素拆分为“逻辑组”和图层。 据了解,与传统的JPEG和PNG图像文件不同,矢量图像(SVG文件)可以缩小到移动设备屏幕大小,也可以放大到广告牌大小,都不会影响整体图像质量,始终清晰。而Illustrator是Adobe旗下、基于矢量的图形软件。 Adobe表示,由于是在公共领域内容上进行训练的,“萤火虫矢量模型”在推出正式版后可安全用于商业用途。而“萤火虫设计模型”则可以为印刷品、社交帖子、在线广告、视频等生成可定制的模板。 Adobe高管David Wadhwani在新闻稿中写道,自三月份发布初代Firefly图像模型以来,社区热烈异常的反应让公司感到惊讶。Wadhwani透露,模型已生成了超过30亿张图像,这种成绩是很不寻常的。
TechInsights:索尼CIS对苹果强烈依赖,超过55%的智能手机收入来自后者
IT之家 10 月 9 日消息,根据 Techlnsights 的最新报告,索尼半导体在日本长崎工厂生产的苹果 iPhone 15 系列相机中使用了先进的图像传感器技术,预计索尼 CIS 出货量需求将进一步增加,来满足苹果对最新 iPhone 系列的 CIS 需求。  图源 TechInsights,下同 报告显示,苹果在 iPhone 15 和 iPhone 15 Pro 系列的后置广角镜头上采用了索尼的 4800 万像素的 CIS,推动了索尼在 4800 像素以上高分辨率的细分市场的份额。索尼 4800 万像素 IMX803 传感器在去年 iPhone 14 Pro 系列首次使用,是 2023 年上半年智能手机 CIS 图像传感器型号出货量前二十的型号之一。 此外,苹果还在 iPhone 15 Pro Max 系列的潜望式长焦镜头应用中采用了索尼新的 1200 万 IMX913 CIS,并使用了索尼的 IMX591 升级其激光雷达(LiDAR)。 IT之家从报告中获悉,智能手机图像传感器市场的年增长率为 2%,而索尼半导体在 2023 年上半年将其市场份额增长到 56%,索尼超过 55% 的智能手机 CIS 收入来自苹果,该公司有望实现今年智能手机 CIS 销售额 80 亿美元的目标。 报告还指出,鉴于对苹果的强烈依赖,索尼将通过提供大幅面 CIS 和定制 CIS 解决方案,继续向其他领先的智能手机 OEM 厂商以及他们的关键高端产品积极推动其 CIS 产品组合。
小鹏反腐打虎:采购副总裁被停职
小鹏汽车,组织变革刚刚曝出新进展。 在针对供应链、采购环节的反腐中,负责人被停职、多层级多员工被约谈,甚至警方都已经介入。 这些新进展也侧面得到了小鹏汽车的证实,回应称是:不影响正常经营。 所以,究竟发生了什么事? 小鹏内部反腐,采购负责人被停职 据财新网消息,小鹏近日内部宣布和公示了内部供应链的反腐调查结果。 在这次结果中,供应链环节上的采购一把手李丰,已被停职,并且还有多名员工被要求配合调查。 实际上,小鹏汽车内部反腐行动,早有征兆。 据称,在今年年初的高管会议上,何小鹏就明确对小鹏汽车的“成本控制和廉洁”等问题表示了不满。 21世纪商业评论爆料,今年年初,小鹏汽车在内部开始“抓蛀虫”。甚至当时有员工还在上班途中,被带走调查。 而被带走的员工,集中在采购业务板块,调查涉及供应商合同问题。 现在,采购线上的大老虎,负责人李丰,也被内部停职了。 李丰,小鹏汽车副总裁,负责供应链业务,直接向何小鹏汇报。 该业务原本由联合创始人、高级副总裁何涛负责,但在G9首发上市失利后,小鹏汽车内部开启了组织架构调整,何涛负责的业务被整合和分权。 王凤英空降后,有消息称小鹏原先的供应链服务部、营销服务采购部和零部件采购三个部门已经三合一,而这个整合之后的新部门,由李丰担任一把手。 一度非常低调、几乎没有公开信息和履历的李丰,也因此开始来到台前,并在今年上半年多次公开露面。 比如中国汽车重庆论坛、世界新汽车技术合作生态展签约仪式,还有和汽车供应链相关的活动,李丰均代表小鹏汽车出席并发言。 包括在中国汽车工程学会筹备成立汽车供应链创新分会时,李丰作为副主任委员,出现在拟任职人员名单中。 以及G6上市前,李丰也和何小鹏、王凤英一起,参加了供应商大会。 然而万万没想到,最新的反腐结果中,李丰被曝停职。 虽然具体原因和后果尚未公开,但可以确定的是,这应该依然是小鹏G9第一次上市滑铁卢之后,带来的余波。 G9首发滑铁卢,小鹏改革自救 去年9月21日,小鹏G9作为新旗舰车型发布上市。 但就在上市当天,车型配置复杂被批评吐槽,低配连个基本的ACC都没有更被认为是“让出智能化高地”的重大失误。 虽然小鹏立刻根据反馈作出调整,降价增配,但此番出师不利已经难以挽回。 后续小鹏汽车股价一度下跌至八成,今年上半年月销量也一直在1万辆以下。 小鹏汽车不得不启动内部改革,开始自救。 其中最明确的就是对组织结构进行大调整。 成立战略、产规、技术规划、产销平衡、OTA五大委员会,E、F、H三大车型平台,并且在日常运营中设立五大体系,提升协作效率、建立业务闭环。 公司也迎来多项人事变动,最核心的莫过于王凤英空降总裁,负责公司的产品规划、产品组合整理和销售业务,授予各项大权。 而王凤英加盟后,继续对小鹏汽车展开多项调整和改革,整合直营和加盟两套销售体系,拉齐产品规划、产供销平衡和大产品矩阵。 最直观的体现,就是王凤英在小鹏汽车降本方面发挥的作用。 何小鹏透露,新G9产品汇报时,王凤英一下就知道座椅成本高出了不少,她认为有几个功能没必要上,最后仅座椅成本这一项就省掉一千多元。 还有Nappa真皮包裹的问题,据说王凤英调整了覆盖率的问题,体验不降,成本还下去了。 体现在产品上,就是小鹏汽车用G6和G9打了一场漂亮的翻身仗。 G6继续突出智能化标签:标配高速NGP和自主泊车、顶配还有城市NGP,北上广深交付即用;电动化方面也把行业领先技术800V高压系统上车,续航够久(580km-755km)…… 同时辅以颇有诚意的价格:20.99万-26.79万,市场了也给出正面反馈:上市两个月累计交付就超过1.1万台。 而新款G9,SKU精简,全系5款车型;800V平台、高速NGP、城市NGP应上尽上;续航570km起步;还减掉许多用户“低感知配置”,新的扶摇架构也帮助新车进一步降本,最终比老款便宜4.6万,26.39万-35.99万开卖。 实际订单也证明,新款小鹏G9这一步走对了:上市15天,大定破1.5万台。 而这些,都是对供应链和成本重新严管之后的结果。或者也可以说,是找到了一个真正懂行的汽车老资历后,带来的成果。 但组织变革、人事调整、供应链采购重新严格管理,必然带来之前问题、内部腐败的曝光。 而负责采购的副总裁被动刀,似乎也就只是时间问题了。 悬而未决的是,这位采购一把手的停职后果,直接原因是G9第一次发布之前,还是G9第一次发布之后? 如果是第一次发布之前,那就说明当时定价40万的G9,供应采购当中的寻租油水深得吓人。如果是之后,那说明即便现如今小鹏汽车新产品20万-30万的区间定位,供应体系上依然有利可图…… 当然,最后损失的还是小鹏汽车本身,最后都会体现到“卖一辆亏多少”的问题上。 有意思的是,在何小鹏告别阿里巴巴,以“小鹏汽车董事长”第一次内部全员亮相会上,他除了对全员晓之以梦想、动之以使命愿景,最后还格外告诫—— 务必要警惕内部贪腐。
三星电子芯片部门持续亏损,带动总体利润暴跌80%
快科技10月10日消息,作为全球最大的内存芯片、智能手机和电视制造商,三星电子将在本周三公布第三季度初步业绩。 根据伦敦证交所19位分析师的预测,三星电子7-9月份的利润可能同比下降80%至2.1万亿韩元(约合114亿元人民币),与此对应的2022年第三季度其营业利润为10.8万亿韩元(约合562亿元人民币)。 而根据三星第二季度财报,2023年第二季度三星营业利润为6685亿韩元(约合35.7亿元人民币),同比暴跌95%,为14年来最低水平。 三星营业利润大幅下滑主要原因是,受到全球芯片市场持续供应过剩的冲击,三星电子的“摇钱树”芯片部门在第三季度持续亏损。 在今年4月份三星宣布削减芯片产量后,其第三季度削减了更多的产量以应对芯片供应过剩现象。 这一做法在降低了其规模经济的同时,还提高了单个芯片的平均制造成本。据分析师表示,三星的芯片部门在三季度可能出现3万亿至4万亿韩元(约合162.6亿至216.8亿元人民币)的亏损。 不过有分析师表示,目前下游厂商的芯片库存已经足够低了,预计芯片需求将会在明年初反弹。这对于三星等芯片厂商来说是一个好消息。 另外,根据五位分析师预测的平均值,三季度三星移动业务的利润或达到3万亿韩元(约合162.6亿元人民币),这主要归功于其在本季度推出的Fold5等可高端折叠手机。
特斯拉回应状告小米持股国产零部件公司:研发人员涉嫌泄露技术秘密
快科技10月10日消息,特斯拉官方对“起诉小米持股公司侵害技术秘密”事件进行回应。 特斯拉称,原特斯拉研发人员顾某在职期间,利用职务便利违规下载了大量特斯拉车辆技术秘密,并私下为冰零智能科技(常州)有限公司提供技术服务,涉嫌泄露特斯拉公司的技术秘密。 经调查,特斯拉公司于2022年9月对顾某予以开除处理,并决定向顾某及冰零科技一并提起诉讼,目前案件正在审理中。 事件回顾: 上个月,天眼查方面曝光的信息显示,特斯拉(上海)有限公司作为原告,起诉冰零智能科技(常州)有限公司,案由为侵害技术秘密及不正当竞争纠纷,将于2023年10月10日在上海知识产权法院开庭审理。 很多人对冰零智能科技感到陌生,主要因为它体量小,而且是供应链公司,很少走到台前,资料显示,该公司成立于2022年5月,法定代表人为贾永平,注册资本约328万人民币,经营范围含集成电路芯片设计及服务,集成电路芯片及产品制造、销售,汽车零部件及配件制造,汽车零部件研发等。 据上海证券报报道,新能源关键的传感器和控制器产品市场份额,主要被外资品牌占据,车规级传感器国产化空间很大,而冰零科技去年5月才成立,据称当年就实现了1500万订单,如此业绩,也是新创办的供应链公司中罕见的。 而更进一步让冰零科技引起关注是小米的入股,今年3月,小米旗下智造股权投资基金入股了冰零智能,持股比例为11.86%,股权比重仅次于创始人贾永平,成为第一大外部股东,这也是小米官宣造车以来,投资的又一家汽车产业链公司。
赵长鹏如何将失败的代币ICO转变为数十亿的意外之财?
虽然崛起的神话令人印象深刻,但赵长鹏所创立的世界最大加密货币交易所正摇摇欲坠。《福布斯》的一项调查显示,2017年币安的首次代币发行(ICO)实际上是失败的,却悄悄利用这次代币发行积累了足以产生丰厚利润的加密货币资产。从福布斯的调查看,当时促使这家公司“胜利”的诸多原因也创造了其当下所处的极端困境。 文|Javier Paz 首席执行官赵长鹏描述称,币安(Binance)首次发行代币——币安币(BNB)“大获成功”。 区块链数据却给出了另一种解释。 01 福布斯调查: 对BNB首次代币发行的分析 币安前竞争对手FTX的创始人山姆-班克曼-弗里德(Sam Bankman-Fried)已经名声扫地,并因欺诈和洗钱罪正在纽约受审。与此同时,全球最大的加密货币交易所币安也面临着生存危机。币安已招致美国证券交易委员会(SEC)和商品期货交易委员会(CFTC)的起诉,指控该交易所欺诈客户和欺骗监管机构。 上周,支付处理商Paysafe“突然决定”停止为币安处理欧元交易,币安还退出了包括荷兰在内的欧洲市场。此外,该公司还受到全球范围内关键员工外流问题的困扰。 《福布斯》多次邀请币安就这些问题进行回应,币安方面未尝置评,但该公司已采取行动申请驳回CFTC的诉讼,称其起诉内容存在多处错误,并表示SEC的起诉内容过于宽泛。 尽管如此,币安面临的最大问题可能还是交易量的减少,因为从2022年开始一直到现在,数字资产市场仍在加密货币的寒冬中挣扎。这为币安发行的加密货币BNB带来了沉重的压力,自2021年5月达到历史高价675美元以来,BNB的贬值幅度已达68%。 当前估值为330亿美元的BNB长期以来都是币安运营模式的重要组成部分,仔细研究其2017年的首次代币发行(ICO)就会发现,币安早年走过的道路比人们普遍认为的要坎坷许多。 币安创始人赵长鹏表示,发行币安自己的代币这一想法源于2017年6月14日四川成都的一次晚宴。当年6月18日,他即公布了一份长达17页的白皮书,这是加密货币领域中类似于项目章程一样的基础性文件。这份白皮书中包含了一份快速启动运营的时间表,详细说明了BNB这种新的数字代币,并称其将通过为期三周的拍卖进行发行。与总部位于美国的竞争对手Coinbase不同,币安不接受美元等法定货币或传统货币。币安交易所平台将仅用于加密货币交易,并宣称其配备的引擎每秒可处理140万个订单。 当时正是进入新兴加密货币市场的好时机。比特币的价格在前一年里翻了两番,达到近2800美元,随着数百种数字货币ICO成功,这位视频游戏玩家出身的企业家在白皮书中提出许多值得推敲的想法,并从中大举牟利。2017年上半年,加密货币市场规模增长了五倍,达到1000多亿美元。 这个总部位于上海的项目从2017年6月中旬才开始运营,但进展很快。据赵长鹏在领英发布的帖子可知(他现在是亿万富豪,绰号C.Z.。),这个1亿代币的ICO于7月3日完成。他宣布那次拍卖取得了“巨大的成功”,并且在那份帖子中声称已经筹集了1500万美元,也就是每个BNB代币的平均价格为15美分。新代币的部分收益将用于建立交易所的平台,但大部分收益将用于币安的品牌推广和市场营销。基于以太坊的BNB代币可以像股票一样进行交易,尽管它们不必向所有者提供股权。 进行交易的代币是一种奇怪的产物,比起公司的股票,它们更像是航空公司用于培养顾客忠诚度的里程,主要用于向交易或招募新账户的客户提供折扣奖励。然而,与股票一样,它们也可以作为一种企业货币。去年在加密货币危机期间,币安利用其持有的BNB代币购买了具有发展前景的初创公司的股份。根据币安白皮书,实际发行的BNB有2亿枚,但在ICO中只向公众提供了1亿枚。币安内部人士将保留8000万枚,另外2000万枚将分配给天使投资人,如Bloq创始人马特·罗斯扎克(Matt Roszak)、早期的比特币投资人罗杰·维尔(Roger Ver)和NEO联合创始人达鸿飞。此外,币安承诺,随着时间的推移,它将回收或销毁最初铸造的1亿代币。 超过2万名加密货币粉丝登记参与了BNB的拍卖,赵长鹏说,许多人提前存入了资金。当时,赵长鹏预计其中一些资金将留在币安的交易账户中。2017年7月,赵长鹏在领英上写道:“我们在核心目标市场开展大量公关,让币安品牌广为人知,同时也获得了投资。作为一个新平台,取得这样的成就,还有什么好要求的呢?” 赵长鹏对其ICO成功的乐观态度广受好评。这些代币最初的交易价格为每枚15美分,现在的售价为213美元,在2021年,其售价甚至一度飙升至675美元。如今,BNB已成为全球第四大最有价值的数字资产,价值330亿美元。根据福布斯的计算,创始人赵长鹏的身家为100亿美元,但我们的计算反映的是其商业价值,并不包括他可能拥有的大量BNB代币。 福布斯在加密货币分析公司Gray Wolf Analytics和Inca Digital的协助下进行了一项调查,结果显示,币安的ICO实际上是一场失败。 事实上,币安在首次发行代币时并未售出1亿个代币。对其加密货币钱包的分析显示,在2017年夏天,转移给参与其公开ICO的投资者的BNB代币数量不超过1078万枚,另外的2000万枚代币似乎已经被悄悄转移给了天使投资人,这使他们的所拥有的分配额翻了一番,达到4000万枚。总而言之,币安在发行过程中筹集到的资金可能不到500万美元,而赵长鹏曾声称以15美分的隐含价格筹集到了1500万美元。 尽管福布斯多次提出要求,但币安仍拒绝回答有关其2017年ICO的相关问题,也拒绝提供其持有的BNB的详细账目。 发行人保留拍卖未售出的剩余部分并不违法,前提是该公司披露了这样的做法,但币安的白皮书并未提及如果ICO销售不足会发生什么。这个问题并非币安独有。 《金融市场与投资组合管理》(Financial Markets and Portfolio Management)于2020年发布了一份报告,回顾了2016年3月至2018年3月间的306次ICO,其中45%的发行者保留了未售出的代币,其余的发行人要么按比例将代币分发给投资者,要么将代币永久性地从流通中移除。 很少有人知道BNB最初的失败,部分原因是加密货币的ICO不受监管,也不用向美国证券交易委员会提交任何形式的披露文件。但币安的ICO问题似乎为其创始人带来了一些另外的收获。截至2018年9月,包括赵长鹏在内的该交易所创始人还留有剩下的1.45亿个BNB代币,而不是最初计划的8000万个。在ICO时,6500万未售出的代币价值不到1000万美元,而如今它们的价值约为140亿美元。 根据来自区块链数据的取证分析(见下文第二部分),币安控制着许多大型加密钱包,其中存储了数百万BNB代币,并不时转入转出。此外,美国商品期货委员会(CFTC)曾在2023年3月对币安提起诉讼,称赵长鹏直接或间接控制着300个不同的加密货币账户,且这些账户正在交易包括BNB在内的加密货币。(币安目前申请驳回CFTC的诉讼,称监管机构越权)。 BNB自推出以来的价格 币安是否真如美国证交会在6月份的诉讼中所指控的那样,正利用其BNB代币在账户之间进行所谓的“洗盘交易”,从而抬高BNB的价格?自2019年以来,BNB的交易一直很活跃,尤其是在2019年,当时BNB代币转移到了币安自己的Beacon区块链,此前两年则是基于以太坊区块链。不过,币安在9月21日的一份法庭文件中表示,这些洗盘交易的指控“没有事实依据”。 根据Pitchbook数据显示,自2017年成立以来,币安通过其风险投资部门币安实验室(Binance Labs)收购了至少199家公司的股份,包括著名的FTX、Trust Wallet、Coinmarket Cap、GOPAX和Tokcrypto。BNB代币也成为了促成其中一些交易的有利条件。2018年5月30日,币安还利用BNB成立了一只10亿美元的基金,该基金由币安实验室管理。 目前有多少BNB代币尚未发行?根据币安跟踪BNB流通的网站,目前有1.54亿枚BNB代币未发行。因此在过去的六年里,交易所已经毁掉了4800万枚代币。根据GrayWolf的取证分析,我们确定,截止2023年8月31日,币安已控制了近1.17亿代币,占总流通量的76%。这个数字是我们通过结合创始团队发行的公开代币数量与专有概率分析得出的,并且该项分析已经确定,存放客户资金和完成其他公司用途的秘密钱包的确存在。 如果觉得追踪币安的BNB代币令人头疼,不止你一个人有这样的感受。然而,有一点是明确的。BNB代币是币安崛起成为全球主要加密货币市场的关键,而保持货币强大的竞争力一直是其成功的核心。就像FTX一样,其FTT代币被证明是其最终偿付能力的关键。 以下就是福布斯对BNB首次代币发行的分析,以及ICO后几年代币在钱包之间的流动情况。 02 币安ICO数据分析 它是如何呈现的 ICO在2017-2018年期间大行其道,当时有数百个项目(包括大量骗局)通过出售凭空创造的代币从投资者那里筹集了数十亿美元。它们可能看起来类似于股票的IPO,但在投资者信息披露和保护方面却无法与IPO相提并论。 币安于2017年6月14日宣布进行ICO,目标是从可能成为其平台活跃交易者的投资者那里筹集1500万美元。12天后,拍卖于6月26日启动,比白皮书中规定的时间提前了5天,并于7月3日提前18天完成。 币安的创世神话 来自Binance.com网站的存档文章显示了该交易所及其BNB代币在2017年6月和7月的快速发展。 币安的ICO流程年表。图片来源:INTERNETARCHIVE'SWAYBACKMACHINE 更令人困惑的是,该交易所在Binance.com上的声明称,本次ICO“已在3分钟内”完成(该声明已被删除,但仍可在互联网档案馆的Wayback Machine上看到)。币安在小字中表示:“此页面是我们ICO期间的首页,现在保存在这里供您查看。”Binance.com上大部分(如果不是全部的话)与ICO相关的页面都已删除,包括最初的白皮书。 三分钟英雄 存档的Binance.com帖子称,BNB的首次代币发行在三分钟内售罄,而不是计划的三周。 币安在ICO期间的首页。图片来源:INTERNETARCHIVE'SWAYBACKMACHINE ICO流程 首次代币发行(ICO)中发行的代币通常来自所谓的部署者钱包,这是计算机代码的通用术语,用于制造新的代币,然后将其发送到数字钱包,每个数字钱包都有一个唯一的长字母数字标识符。Gray Wolf表示,在拍卖启动时,所有2亿个BNB“代币都被铸造了出来,并被发送到“0x00C5E04176d95A286fccE0E68c683Ca0bfec8454”这个由币安控制的地址"。这些代币代表了BNB的全部初始供应量。 有了部署者钱包中的代币,ICO的下一步将是币安将拍卖中赢得的代币分发给买家。《福布斯》使用区块链记录跟踪了接收的钱包,并分析了它们的概况。Gray Wolf和Inca Digital对福布斯的审计方法和单个钱包的数据进行了审查和验证。 根据白皮书,《福布斯》预计在ICO结束后不久,将有1亿枚代币流向ICO参与者,2000万枚代币流向币安的天使投资人,总计1.2亿枚代币。币安于7月7日开始发行代币,但预期的1.2亿枚代币中只有5500万枚流动了起来,随后发行冻结了一年多。“这5500万枚是在2017年7月6日至8月14日期间通过13笔交易发放的,”Gray Wolf说。“这些交易是币安部署人员在2017年7月至2018年8月期间发送BNB的仅有交易,在此期间,约有1.45亿BNB被控制在币安部署人员的地址中。” 尽管《福布斯》和Gray Wolf认为不太可能,但未分发的代币有可能是在2017年7月14日开始运营的币安交易所上代表购买者持有的。通常的做法是将代币发送到外部钱包,因为投资者通常不希望将其保存在安全性尚未建立的交易所中。或者,币安也可能已经为代币开具了非区块链收据,这是一种非常不寻常的做法,而且第三方无法验证。 哪些钱包得到了代币 以下是对直接从部署者那里接收BNB的主要钱包的分析。除了识别每个钱包的字母数字字符串之外,区块链上没有任何关于其所有者的其他信息,尽管有时我们可以通过其他途径了解到一些事实。因此,将钱包所有者与特定钱包联系起来往往是一种艺术与科学的结合。钱包的大小、转账频率、转账日期以及代币的来源和去向都可以说明所有者的情况。 币安天使钱包1(2000万枚)。《福布斯》、Gray Wolf和Inca Digital都认定这个钱包是分发给最早投资者的代币来源,因为它收到的金额和随后的交易都以高价值转移为主。在ICO月份(2017年7月),币安从这个钱包中分发了1784万枚BNB代币到678个不同的地址。从2017年8月到11月,该交易所向226个不同的地址分发了额外的215万个代币。 天使钱包1 向904个钱包地址分发了2000万枚BNB 币安天使钱包2(2007万枚)。我们将这个钱包称之为天使钱包2,在2017年7月中旬币安交易所启动后的头两天内,该钱包通过三次转账(2000万+ 69,420 + 20)从部署者那里收到了20,069,440个代币。虽然这个钱包收到的代币略多于发送给天使钱包1的2000万整数,但我们猜测这些代币也是分配给天使投资人的,因为下一个图表中详细介绍了类似的数字和后续分配模式。对于加密货币侦探来说,值得注意的是,在天使钱包2和代币接收者之间存在一个中介钱包,但为了让表述尽可能简单,我们仍将称之为天使钱包2。在转入天使钱包2的2007万枚BNB代币中,币安在2017年7月向531个钱包分发了1740万BNB。2017年8月至12月期间,该交易所向79个钱包又分发了266万枚BNB。 天使钱包2 向610个钱包地址分发了2007万枚BNB 币安9钱包:这个钱包的名字出现在Etherscan区块链分析服务上,它陆续从部署者那里收到了剩余的1500万个代币。截至7月底,币安只向这个钱包提供了1100万个代币。在1100万枚BNB代币中,我们认为币安向多达400个假定的散户钱包发送了1078万枚BNB,因为大部分支付都是小额的。然后,从2017年8月到2022年7月,该交易所向31个钱包发送了剩余的代币。 在ICO结束后的第一个月内,我们对其天使投资人和散户投资者的综合考察只统计到了不到2000个地址,约占赵长鹏声称在交易所注册的20,000名用户的10%。 币安9钱包 2017年,该钱包向大约431个地址分发了BNB代币,其中大部分似乎由散户投资者拥有。 BNB大乱炖 虽然参与ICO的币安天使投资人和散户投资者的最大数量似乎不到2000人,但各种钱包之间存在大量重叠、钱包间转移和混合,因此很难确定每组参与者的确切数量。 例如,2017年7月,有56名接收者从两个币安天使钱包中获得了转账,共计398万枚代币。如果将币安9钱包也纳入在内,那么共有22名收款人收到了来自三个钱包的代币,总计294万枚BNB。此外,天使钱包2向币安发送了近100万枚代币,而根据该公司的计划,币安打算在首次季度销毁操作中将这些代币送去销毁,最终将供应量削减至1亿枚。 向币安9钱包转移100万代币的行为是表明这些钱包被用于多种目的的数十起类似行为之一。例如,我们发现在三笔交易中,有500万BNB代币通过一个单独的中介钱包从币安9钱包转移到了币安5钱包(该钱包的实际所有人是该交易所本身)。此外,币安还将合计410万枚代币从币安5钱包和币安6钱包(另一个钱包)退出流通。这种做法让外部观察者很难分辨用户和交易所拥有的代币之间的区别。 未售出的ICO代币的命运 下表显示,从2017年9月到2018年8月,部署者钱包的支出为零。在这张表中还可以看到,币安在2018年让其部署者钱包向币安5钱包发送了近6500万枚BNB代币,这些代币似乎是那些在ICO中未售出的代币。这使得该钱包持有9940万枚BNB,占总供应量的一半。根据白皮书的条款,币安及其高管本应额外持有8000万枚代币。 部署者钱包(来自币安部署者钱包的BNB交易列表,包括在ICO一年多后的2018年9月转移了近6500万枚代币。) BNB首次发行的受益者钱包一览。 图片来源:ETHERSCAN Gray Wolf总结道:“白皮书中所述内容与实际链上交易量之间的差异,再加上ICO时间表上相互矛盾的文件,勾勒出一幅令人困惑的图景。利益相关者和更广泛的加密社区不禁要问,ICO进展的真实性质、报告交易量的真实性以及消费者保护的充分性到底如何。这些挥之不去的问题凸显了区块链技术在提高加密货币生态系统的透明度和问责制方面的关键作用,在这个生态系统中,信任是绝对必要的。” Inca Digital首席执行官Adam Zarazinski补充说:“币安声称已经完全实现了他们为ICO设定的所有目标,但实际上,区块链上的数据表明,1.2亿代币中只有不到一半被分发,然后在多个可能由币安控制的钱包之间流通。有关实际ICO结果的误导性信息的传播使BNB投资者对该代币的未来成功产生了过于乐观的看法,从而使币安有可能维持BNB的人为抬高的价格。” 预期与实际的BNB ICO分发量 以百万代币为单位的数据表明,此次发售的代币数量远远少于币安白皮书中概述的数量。 币安声称它在2017年7月筹集了1500万美元,这让人难以置信。如果币安以仅15美分的挂牌价格出售了约1100万枚BNB代币,那么它在ICO中就从散户投资者那里筹集165万美元。如果币安天使投资人以同样的价格购买了4000万枚代币,那么币安可以从他们那里筹集600万美元,仍低于1500万美元。所有这一切的结果就是,从低价ICO中以几乎零成本获得的额外6500万枚代币,使币安拥有了一个黑暗的可自由支配的资产池,其最高价值超过400亿美元。 币安BNB持有总量 关于币安持有的BNB总量,几乎没有可证实的信息。截至9月1日,该公司声称拥有3030万代币的净客户余额,由交易所持有的3450万代币支持,这是一个略微超额的抵押。该公司的储备证明网页称,这些金额不包括币安公司持有的BNB。 福布斯和Gray Wolf开发了一种方法来识别币安上所有包含BNB的钱包,包括客户资金和交易所资金,以验证这些数字。该方法包括跟踪BNB在币安生态系统中三个区块链上的创建和移动情况、量化代币流量、识别钱包,并根据独特的特征确定钱包功能和可能的所有权。 值得注意的是,我们在下文中的分析涉及币安专有区块链BNB Beacon Chain和BNB Smart Chain上存在的钱包,BNB分别于2019年和2020年转移到这两个区块链上。我们将币安上的BNB钱包分为交易所披露的钱包,交易所称这些钱包完全由公司及其创始人拥有的代币组成,然后是平台上的一系列热钱包和冷钱包,这些钱包可能混合了客户和交易所的代币。例如,在下面的图表中,作为FTX加密货币帝国崩溃后增强加密货币交易所透明度的一部分,赵长鹏于2022年11月公开披露了四个币安团队钱包。他说,这些钱包总共控制了2200万个代币。截至10月1日,已知的币安钱包持有5380万份BNB,价值116亿美元。 表格底部的钱包没有被该交易所披露,但我们与Gray Wolf合作,根据概率分析,考虑到它们与Genesis钱包——以太坊部署者钱包的后继者——的直接联系、持有量、交易模式、互动的主要钱包和其他因素,确定它们很可能位于币安平台上。币安冷钱包1-3总共持有5150万枚代币,价值115亿美元。用加密货币的术语来说,钱包通常分为冷钱包和热钱包。冷钱包通常更安全,因为它们没有直接连接到互联网,因为被用来持有更多的资产,使用频率较低。热钱包连接到互联网,通常有助于更频繁和小额的转账。 像币安这样的交易所通常会在热钱包和冷钱包之间循环资产。客户存款通常首先进入热钱包,然后转移到冷钱包进行长期存储。另一方面,交易所可能会将资金从冷钱包转移到热钱包,以满足提款激增带来的需求。对于交易所来说,最佳做法是在热钱包中保留不超过日常流动性所需的资金。在图表的底部,我们发现了多个热钱包,其中第20个是迄今为止最大的,拥有1100万BNB。一些热钱包在我们提取快照的当天什么里面都没有。 我们列出的所有疑似币安钱包都持有6310万份BNB,价值157亿美元。加上已知钱包中持有的资产,币安控制着1.169亿个代币,价值273亿美元。 本文译自 https://www.forbes.com/sites/digital-assets/2023/10/05/how-binance-turned-its-failed-token-ico-into-a-billion-dollar-windfall/?sh=48cf0abe529b
Meta开源新的AI图像水印技术,但真的靠谱吗?
图片来源:由无界AI生成 AI 驱动的图像生成正在蓬勃发展,这是有充分理由的:它有趣且易于使用。虽然这些模型带来了新的创意可能性,但它们可能会引起人们对不良行为者潜在滥用的担忧,这些不良行为者可能会故意生成图像来欺骗人们。即使是为了好玩而创作的图像也可能会像病毒一样传播并可能误导人们。例如,今年早些时候,教皇方济各穿着一件华丽的白色蓬松夹克的图片在网上疯传,特朗普被逮捕的照片引发热议。这些图像不是真实的照片,但很多人都被愚弄了,因为没有任何明确的指标来区分这些内容是由生成式 AI 创建的。 Meta 研究人员近日发布了一篇新的研究论文和技术代码,详细介绍了一种为 AI 图片添加隐形水印的技术,用于区分开源生成式 AI 模型何时创建的图像。隐形水印将信息合并到数字内容中。这些水印肉眼看不见,但可以通过算法检测到——即使人们重新编辑了图像。虽然围绕水印还有其他研究方向,但许多现有方法在生成 AI 图像后创建水印。 据 Everypixel Journal 报道,用户已经使用三个开源存储库的模型创建了超过 110 亿张图像。在这种情况下,只需删除生成水印的行即可删除不可见水印。Stable Signature 提出了一种方法来避免水印被删除。 01 Stable Signature 方法的工作原理 论文地址: https://arxiv.org/abs/2303.15435 Github 地址: https://github.com/facebookresearch/stable_signature Stable Signature 通过将水印扎根于模型中,并使用可追溯到图像创建位置的水印,消除了删除水印的可能性。 让我们通过下面的图表来看看这个过程是如何工作的。 Alice 训练了一个主生成模型。在分发之前,她对模型的一小部分(称为解码器)进行了微调,从而为 Bob 生成给定的水印。该水印可以标识型号版本、公司、用户等。 Bob 收到他的模型版本并生成图像。生成的图像将带有 Bob 的水印。Alice 或第三方可以对它们进行分析,看看图像是否是由使用生成式 AI 模型的 Bob 生成的。 这通过两步来实现: 1. 联合训练两个卷积神经网络。 一种将图像和随机消息编码为水印图像,另一种则从水印图像的增强版本中提取消息。目标是使编码和提取的消息匹配。训练后,只保留水印提取器。 2. 对生成模型的潜在解码器进行微调以生成包含固定签名的图像。在此微调过程中,会对批量图像进行编码、解码和优化,以最大限度地减少提取的消息与目标消息之间的差异,并保持感知图像质量。这种优化过程快速有效,只需要小批量和很短的时间即可获得高质量的结果。 02 评估 Stable Signature 的性能 我们知道人们喜欢分享和转发图像。如果 Bob 与 10 个朋友分享了他创建的图像,然后每个朋友又与另外 10 个朋友分享了该图像,结果会怎样?在此期间,有人可能会更改图像,例如裁剪、压缩或更改颜色。研究人员构建了Stable Signature以应对这些变化。无论人们如何转换图像,原始水印都可能保留在数字数据中,并且可以追溯到创建它的生成模型。 研究人员发现 Stable Signature 相对于被动检测方法的两大优势: 首先,能够控制和减少误报的产生,当将人类生成的图像误认为是 AI 生成的图像时,就会发生误报。考虑到在线共享的非 AI 生成图像的盛行,这一点至关重要。例如,最有效的现有检测方法可以发现大约 50% 的编辑生成图像,但仍会产生大约 1/100 的误报率。换句话说,在每天接收 10 亿张图像的用户生成内容平台上,大约 1000 万张图像将被错误标记,从而仅检测到一半的 AI 生成图像。 另一方面,Stable Signature 以 1e-10 的误报率(可以设置为特定的期望值)以相同的精度检测图像。此外,这种水印方法允许追踪同一模型的不同版本的图像——这是被动技术无法实现的能力。 03 如果一个大模型经过了微调, Stable Signature 如何检测到微调版本生成的图像? AI 大模型的一种常见做法是采用基础模型并对其进行微调,以处理有时甚至为一个人量身定制的特定用例。例如,可以向模型显示 Alice 的狗的图像,然后 Alice 可以要求模型生成她的狗在海滩的图像。这是通过 DreamBooth、Textual Inversion 和 ControlNet 等方法完成的。这些方法作用于潜在模型级别,并且不会更改解码器。这意味着我们的水印方法不受这些微调的影响。 总体而言,Stable Signature 与矢量量化图像建模(如 VQGAN)和潜在扩散模型(如 Stable Diffusion)配合良好。由于这种方法不修改扩散生成过程,因此它与上述流行模型兼容。通过一些调整,稳定签名也可以应用于其他建模方法。 04 AI 水印真的靠谱吗? 通过添加隐形水印的方式来识别 AI 生成图像的技术最近受到很多争议。Google DeepMind 最近宣布针对图像生成推出一种添加水印的工具 SynthID,同时识别 AI 生成的图像。通过扫描图像中的数字水印,SynthID 可以评估图像是由 Imagen 模型生成的可能性。 但 AI 水印是否能够被轻易去除?据外媒 Engadget、Wired 等报道,美国马里兰大学的一个研究小组对 AI 生成内容的“数字水印”技术可靠性进行研究,发现这一技术可被轻易破解。 该校计算机科学教授 Soheil Feizi 面对 AI 生成图像的水印现状时直言不讳:“目前我们没有任何可靠的水印技术,我们破解了所有的水印。” 在测试过程中,研究人员可轻松避开现有的水印方法,并发现在非 AI 生成的图像上添加“假水印”更为容易。同时,该团队还开发出了一种“几乎无法”从图像中去除的水印技术,且不会完全损害图像的知识产权。 AI 水印这种方式仍旧不过成熟,并不能成为百分百有效的工具。我们需要期待未来能够出现新的技术来为生成式 AI 图像保驾护航,避免虚假图片泛滥,避免版权侵害。
无需机器学习专业知识,Amazon SageMaker Canvas从产品评论中挖掘商机
站长之家(ChinaZ.com)10月10日 消息:根据Gartner的数据,85%的软件购买者信任在线评论,就像他们信任个人推荐一样。顾客提供了关于他们购买的产品的反馈和评论,这些反馈来自多种渠道,包括评论网站、供应商网站、销售电话、社交媒体等。然而,随着多渠道评论数据的增加,企业需要寻找一种方法来处理和分析这些数据,以获取有价值的洞见。这就是Amazon SageMaker Canvas发挥作用的地方。 Amazon SageMaker Canvas是一个专为业务分析师设计的工具,它允许用户在不编写代码或需要机器学习专业知识的情况下,对表格数据进行即席分析。该工具提供了现成的人工智能模型和自定义模型解决方案,以满足不同的业务需求。使用SageMaker Canvas,用户可以生成准确的机器学习预测,无论是互动性的预测还是对大规模数据集的批处理评分。 Amazon SageMaker Canvas如何进行情感分析和文本分析,以从产品评论中获得有价值的信息呢?首先,使用情感分析模型来确定产品评论的情感,然后,将训练一个自定义文本分析模型,以根据产品类型对评论进行分类。 情感分析是一种自然语言处理模型,用于分析文本的情感。它可以帮助企业了解顾客对其产品的情感是积极的、消极的、混合的还是中性的。另一方面,文本分析模型可以帮助企业根据文本的内容将评论分类为不同的产品类型,从而更好地理解顾客对不同产品的看法。 使用Amazon SageMaker Canvas,企业不再需要拥有机器学习专业知识或雇佣数据科学家来进行这些任务。业务分析师可以轻松地使用这个无代码机器学习工具,从产品评论中获取有关客户情感和产品分类的有用信息,以指导业务决策和改进产品和服务。不仅如此,SageMaker Canvas还提供了完整的自定义模型训练流程,以适应特定的业务需求。 Amazon SageMaker Canvas使业务分析师能够轻松进行无代码机器学习,从而从产品评论中获得宝贵的洞见,提升产品质量,满足客户需求,推动业务增长。不需要机器学习专业知识,任何企业都可以受益于这个强大的工具,提高竞争力并提供更好的客户体验。
挑战GPT-4V!清华开源多模态14边形战士问世:在线可玩
看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。 但是最新开源的国产多模态模型CogVLM-17B,就能看出另有玄机。 甚至能区分在图中完整可见的有3个和部分可见的有1个。 CogVLM由清华和智谱AI合作开发,通讯作者为唐杰和丁铭,论文和开源代码已上传到GitHub。 除这个单独案例之外,CogVLM-17B还在10项权威跨模态基准上取得了SOTA性能。 另外在VQAv2, OKVQA, TextVQA, COCO captioning取得第二,超越或匹配谷歌的PaLI-X 55B。 与之前的开源多模态大模型相比,可以算是14边形战士。 雷达图中包含13个基准,最后一个TDIUC单独展现。 CogVLM可以回答各种类型的视觉问题,比如从马斯克的阴阳怪气中推理出小扎假装去旅行了,回避约架。 认出照片中的C罗,并回答他在2018年世界杯中有多少进球。 带图的编程题也能给出代码了。 甚至能完成复杂的目标检测,并打上标签,自动数据标注成了。 从浅层对齐到深度融合 CogVLM模型包含4个基本组件 ViT编码器 MLP适配器 大型预训练语言模型 视觉专家模块 其中,每层中都添加了可训练的视觉专家模块,以实现图像特征和文本特征的深度对齐,而不会牺牲任何NLP任务的性能。 之前主流的浅层对齐方法,如BLIP-2,图像特征和语言模型之间缺乏深度融合,导致性能不佳。 但微调语言模型的全部参数又会损害其NLP能力。 CogVLM的方法可以说是改变了视觉语言模型的训练范式,从浅层对齐转向深度融合。 另外值得注意的是,CogVLM训练数据中没有专门的OCR数据,但表现出了很强的文字识别能力。 CogVLM开源并给出了在线试玩。 不过目前仅支持英文,后续会提供中英双语版本支持,可以持续关注。 试玩地址:http://36.103.203.44:7861 开源及论文地址:https://github.com/THUDM/CogVLM
90后AI天才的大模型首战
采访|邓咏仪 杨轩 文|邓咏仪 编辑|杨轩 苏建勋 站在核爆中心圈,是一种什么样的体验? 在这次ChatGPT引发的AI大爆炸中,做了十年堪称冷门的NLP(自然语言处理)的杨植麟,就处在这样一个位置。这位保送清华、程序设计课程满分的“少年天才”,在卡耐基梅隆大学读博士时,就已经作为第一作者发表的关于Transformer-XL与XLNet的两篇论文,成为本次AI大模型技术能够突破的重要一环。 “先是非常激动,好像被苹果砸中一样,”杨植麟对36氪说,随即又陷入沮丧,再想到可干的事情还很多,又“兴奋起来”。 这也是他新创办的第二家AI公司“月之暗面(Moonshot)”的由来。Moonshot这个名字,则来自英国著名摇滚乐队Pink Floyd的专辑《Dark Side of the Moon》。 杨植麟认为,做大模型如同登月工程一样,“月之暗面”意味着神秘,令人好奇和向往,同时又极具挑战难度。 事实上,月之暗面的核心团队曾参与到Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发中——这是一支在“登月”道路上已探索多年的队伍。而AI大模型,目前还在一个以技术能力定成败的阶段。 在这半年的国内大模型市场中,Moonshot显得尤为沉默,但并不妨碍投资人的蜂拥而至。36氪最新获得的消息是,月之暗面已经完成一轮超过2亿美元的融资,目前身处中国大模型创业公司融资额第一梯队。 成立半年多后,10月9日,Moonshot终于推出了首款大模型产品:智能助手Kimi Chat。这也是Moonshot在大模型领域做To C超级应用的第一次尝试。 Kimi Chat支持输入20万汉字,这是目前全球大模型产品中所能支持的最长上下文输入长度。这也代表着,Moonshot在长文本技术的探索突破到了一个新高度——对比当前市面上几家主流模型,Kimi Chat的上下文长度是Claude 100k的2.5倍(实测约8万字),GPT-4-32k的8倍(实测约2.5万字)。 如今市面上的大模型产品繁多,拓展了上下文长度的Kimi Chat,在使用上有什么不同? 最明显的是,你可以一次性给模型输入大量的信息,由模型理解进行问答和信息处理,有效减少幻觉问题。 比如,公众号的长文也可以交给Kimi Chat ,让它帮你总结分析: 发现了新的算法论文时,Kimi能够直接帮你根据论文复现代码: 快要考试了,直接把一整本教材交给Kimi,就可以让它陪你准备考试: 甚至,也可以只用一个链接就让它来扮演你喜爱的游戏角色,和你对话: 目前,Moonshot AI 的智能助手产品Kimi Chat已开放了内测。访问Moonshot.cn(或于文末扫描二维码),即可加入内测计划。 长文本:大模型落地的另一瓶颈 值得关注的一点是,不同于其他大模型公司拼参数、展示各种各样的行业案例,在Moonshot的首次发布会上,“长文本”成了绝对的主角。 “无论是文字、语音还是视频,对海量数据的无损压缩可以实现高程度的智能。而要有效提升大模型的性能,不仅要扩大模型参数,更要提升上下文长度,两者同样重要。”杨植麟表示。 大模型之所以能在智能水平有质的飞跃,是因为通过扩大参数规模,突破到了千亿级别,才能够让智能“涌现”(Emergence,指模型自主产生出复杂行为或特性)。 但如今,大模型落地更重要的瓶颈不是模型大小,而是在于上下文不够,文本长度不足会带来对模型能力的严重束缚。 一个典型问题是,如果遇到多轮对话或者需要复杂步骤的场景,往往会出现模型记不住的情况——讲了具体设定,但下一回合就忘记。比如,Character AI的用户就经常吐槽模型记不住关键信息: 这与计算机运行的原理类似:计算机依靠CPU进行计算;内存则存放了临时计算的数据,决定其运行速度。“如果说参数量决定了大模型支持多复杂的‘计算’,而能够接收多少文本输入(即长文本技术)则决定了大模型有多大的‘内存’,两者共同决定模型的应用效果。”他解释道。 这也是Moonshot在保持模型拥有千亿级参数的同时,首先将上下文长度先“拉满”的原因。 要想做到拓宽上下文长度(Context),在模型训练和推理侧都存在算力+显存的双重挑战。 比如,计算量会随着上下文长度的增加呈平方级增长——比如上下文增加32倍时,计算量实际会增长1000倍;而在推理方面,目前最高单机配置 80 GiB * 8 在面对 GPT-3 这类千亿参数级别的模型时,最多只能推理约5万字上下文长度。 但在Kimi Chat上,Moonshot团队通过创新的网络结构、改进算法策略等等,对模型训练的各个环节进行了上百项的优化,从而在千亿级参数下可以实现对超长文本的全文理解。 简单而言,Moonshot AI并不通过当前滑动窗口、降采样、小模型等对效果损害较大的“技术捷径”来实现长文本,而是研发基于大模型的长程注意力,以实现真正可用的超长文本技术。 让模型“记性”更好,会让大模型未来的应用场景拓宽不少。比如,律师、分析师等职业,就能让大模型分析长篇报告;像狼人杀这样需要基于大量信息来推理的游戏,大模型也能够胜任。 而在本次产品发布前,36氪曾与杨植麟进行过一次深谈。作为站在这次技术核爆中心圈的人,杨植麟谈起AI大模型,有种笃定感。对于产品之外的技术展望,他会不时用轻松的语气,抛出一些让人一愣的断言。 比如,“Next token prediction(预测下一个字段)是唯一的问题。”“只要一条道走到黑,就能实现通用泛化的智能。” 比如:“五年之内,大模型将持续保持较强的技术壁垒,不会Commoditize(变成平价的、没有壁垒的商品)。” 从LLM(大语言模型)到LLLM(长文本大语言模型),Kimi Chat只是Moonshot的第一步。不过,如今的Moonshot已经寄托着杨植麟对未来的一些很“黑镜”的预想:在未来,如果机器能够掌握一个人一生的信息,人们就会拥有自己的AI分身,这个AI分身共享了你的所有记忆,无异于另一个你。 以下为36氪与杨植麟的对话实录,经36氪编辑整理: 时隔七年,两次AI创业 36氪:先来聊聊这次产品发布吧。很多大厂、创业公司都会选择先发一个具体的大模型,开源或者闭源的都有。大模型已经火了半年后,Moonshot如今选择先发一个To C的智能助手产品。为什么? 杨植麟:因为我始终坚信以终为始,只有当大模型被多数人使用时,才会涌现出最多的智能。Moonshot会秉承以应用为导向的模型开发,我们并不想只是发布一个模型,以迅速获得科技圈可能的短期技术关注。 比如,“长上下文”这个技术的价值,可能很难第一时间让用户感知到。但通过Kimi智能助手,就可以直接触达用户。我们希望让技术成为用户日常生活中一旦接触就不可或缺的助手,以真实的反馈做来迭代模型,尽早地创造实际价值。 36氪:ChatGPT出来之后,这半年你的心情是怎么样的? 杨植麟:这一年来,我是百感交集。如果是什么可控核聚变的突破,那其实跟我也没什么关系,但这个事情(大语言模型)是我做了十年的事情,我觉得就好像是被苹果砸中一样。 ChatGPT刚发的时候,我非常激动,我好奇这个世界到底能做什么样的AI,我能多大程度去复制、甚至做得比人脑更好。 同时,我也陷入到非常沮丧的状态——因为这个事情也不是你做出来的对吧?我会开始想在这个浪潮里我还能贡献什么,又开始兴奋起来:现在是非常好的timing,不管发生什么,一定要做。 36氪:所以,ChatGPT算是直接促使你创立新公司“月之暗面”? 杨植麟:对。从一开始的激动到沮丧,再决定创业之后,我逐渐恢复理性思考,思考想要什么样的团队来做,现在是技术演进过程里的什么阶段,我们要做什么? 然后再开始焦虑——铺天盖地地,所有人都说要做大模型,那大模型到底能不能做?是不是做不了? 最后又会回到理性。我会去更长期地看这些个事情,短期内的大模型进展,比如东边发一个模型,西边发一个,其实都是噪音。GPT-4的水平在这儿(高一截),其他模型都是在下面,其实大家现在说“我比你高”“你比我高”,没什么意义。 我这半年都在思考底层逻辑,最后发现这件事还是很适合我们来做。 36氪:适合在什么地方? 杨植麟:每一次技术突破里会有三层的机会。 第一层机会,是被第一个找到第一性原则的人抓住,那就是OpenAI。这需要很强大的vision,非常高瞻远瞩,这是靠经验所支撑的。 第二层机会就是在技术创新期,能解决一些技术方向性的问题——比如long context(长上下文对话窗口)怎么做?能把技术做好的团队能抓住。 第三层是纯应用的机会,就是技术已经全部清楚了,不再需要考虑技术层面的事情,只做应用。我们可以抓住的是第二层机会,在这个层面我们拥有很好的积累和优势。 36氪:月之暗面想做的大模型,是怎么样的? 杨植麟:我们希望先把模型能力做到世界领先水平,同时也会聚焦C端的超级应用,通过产品连接技术与用户,从而共同创造通用智能,Kimi Chat只是我们的第一个产品尝试。 我们现在做的模型已经到千亿级,未来会是一个多模态大模型,当前会先把语言模型做好。 36氪:在做应用上,你们大概思考的方向是怎么样的? 杨植麟:我们还处在技术创新的阶段,所以我们会先持续追求世界级的技术突破,比如长上下文、多模态等。 而在产品层面,我们肯定是坚定在To C这一侧,希望能做头部的Super App。以ChatGPT和Character.ai为例,这两个产品已经积累了大量的数据和用户反馈,有大量的迹象证明已经通过这种的产品产生了新的入口,新一代AI在“有用“和”有趣“两个方向上,都会有巨大潜力。 我相信,无论是智能助手还是情感陪伴,我们都能通过技术为更多人解决工作和生活中的实际问题。 36氪:什么样的是真需求? 杨植麟:比如Character.AI的情感更多元化,他其实底层满足的是人的征服欲,我觉得征服是一个真正的刚需。 AI最后不会是一个完全同质化的东西。它不像电,在新加坡充电和中国充电是一样的。所以像Character.AI最后所实现智能可能比其他公司会更强,因为他们有数据能一直积累,后面可以做一些专业化,这也导致以后AI的毛利率会比以前的云计算要高。 36氪:好多大模型公司忙着在硅谷挖人,比如从OpenAI、Google、微软。你是怎么组建起月之暗面的团队的? 杨植麟:我们很多人还是重新招的。我们更多是找这种30岁左右,有很多一手实践经验的人。从去年12月开始,我就去了一趟海外,开始为招人做储备了。 36氪:海外的AI人才愿意回来吗? 杨植麟:我们在海外有office,其实两边还是可以相结合的。 36氪:现在月之暗面团队有多少人?你预想中的团队,会是什么样子? 杨植麟:我们的团队约60人,有很多技术专家,每个月都有在全球某个领域有显著影响力的人加入,我们在努力打造大模型公司里产品人才密度最高的团队。 互联网时代的技术和产品已经成熟分工,但我们希望产品团队能更直接地参与模型优化,大幅缩短创新周期。智能时代无论技术、产品、增长还是商业化,都存在创新的机会。我们的愿景是建立一个全新的组织,能与用户共情,也能用客观数据来定义美和智能标准,将科技与人文融为一体。 36氪:OpenAI会是这种组织的理想状态吗? 杨植麟:我觉得他们提供了很多很好的实践。比如他们就不搞赛马,这是非常重要的例子。 这并不是因为他们资源或者人不够。他们资源挺多,但是会把资源放到一个统一的scope下面。 比如,他们希望花10%的精力去探索一些新的东西,那会有一个团队在做这个事情,主线永远就只有这一个——这是非常重要的。并且,他们鼓励底层创新,每个人贡献想法。 36氪:现在不少人关注成本问题,这直接关系到工程化的成本,还有后续的商业化进展。现阶段,你最关注的是什么因素? 杨植麟:就是能不能尽快找到PMF,这是第一优先级。 36氪:现在不少大厂、创业公司都在发开源模型,Moonshot有开源计划吗?你怎么思考这个问题? 杨植麟:我们目前没有开源计划。我认为,开源和闭源在整个生态里面会扮演不同的角色,开源很大一个作用是在To B端的获客,如果想做头部的Super App,大家肯定都是用闭源模型去做的,在开源模型上做C端应用很难做出差异化。 36氪:你从博士阶段就已经开始创业,之前创立第一家AI公司“循环智能”的经验,会给你什么启发? 杨植麟:现在月之暗面还是处在第一阶段,更重要的任务是降低不可预测性等偏技术上的工作,其实不会太受到外部因素的影响。 但从大环境上来说,不可预测性肯定是要比之前更多了。几年前的年景更好,可以顺着市场做扩张,做营收;但市场不好时,反而是需要做成本控制、降低烧钱速度。这也是我从上一段创业经验学到最多的。 大模型很烧钱,把握好投入的速度,同时还要保证自己还是要拿出东西,有产品数据,是非常关键的问题。 预测下一个token是唯一问题 36氪:AI领域有几大方向:图像识别(CV)、自然语言处理(NLP)、机器学习(ML)。前几年CV方向更热闹,上一波AI四小龙(商汤、旷视、云从、依图)也都是这个方向。你的研究方向一直集中在NLP,为什么? 杨植麟:抛开偶然因素,还是有一些必然的原因。我觉得,Vision(视觉)方向其实更早地看到一些产业成果,但NLP可以去解决更多认知类的问题,让AI真正实现价值。 36氪:NLP怎么让AI真正发挥价值? 杨植麟:NLP相当于是从视觉的感知层面,进化到更有认知的层面。 像Midjourney这种AI绘画产品,它可能生成的图片特别好看,但它本质是一个没有大脑的画家——你不知道中美关系怎么样,不知道印第安人以前是怎么被奴役的。你需要知道这些历史,才有可能成为一个顶级画家。甚至最后不光只是画画,你还要做很多画画之外的事情。 从这个点来说,NLP会解决更难的、更有挑战性的问题,比如推理,它的存在会让AI的版图更加完整。 36氪:Transformer是你主攻的研究方向,它也是ChatGPT诞生的基础。Transformer的革命性意义在什么地方? 杨植麟:我比较幸运的地方在于,我博士有一半时间是在2017年之后。因为2017年Transformer出来了,这是一个超级巨大的分水岭。 Transformer架构的出现让整个NLP领域都发生了巨大的认知变化。有了这个东西之后,你就发现这里面可以做的东西实在太多了,突然一下子就给大家指明了方向。有很多之前完全无法实现的东西,它现在变得有可能了。 36氪:怎么理解这个“认知层面的变化”? 杨植麟:AI领域对语言模型的认知,存在三个阶段的变化: 2017年前,大家觉得语言模型有一些有限的作用,比如在这些语音识别、排序、语法、拼写等等小的场景里面可以做辅助,但用例(Use Case)都很小; 第二个阶段:Transformer、Bard出现后,语言模型可以做绝大部分的任务,但它还是一个辅助的角色——我有一个语言模型,AI工程师微调一下任务就好了; 到第三阶段,整个AI领域发展到最后,大家的认知会变成:所有东西其实都是语言模型,语言模型是唯一的问题,或者说是next token prediction(预测下一个字段)是唯一的问题。 这个世界其实就是一个硬盘模型,当人类文明数字化之后,所有人类文明之和就是硬盘的总和。输入的Token是语言,或者也可以是别的东西——只要能预测下一个Token是什么,那我就能实现了智能。 从思想到系统的层面,其实技术发生了非常大的变化,这里面有很多变量。然后你就可以在这个空间里面去看,怎么把这些技术做的更好。 36氪:从2017年Transformer出现到今年ChatGPT爆火,中间还有五年的时间。这五年里,你的重要工作——有关Transformer-XLNet的论文,其实也有被拒稿过。中间有过对自己研究路线的怀疑吗? 杨植麟:这个很有意思。当因为行业发生认知变化,而变化还没有调整过来的时候,会存在非共识。 部分人觉得非共识是错的,但其实他实际上是对的。OpenAI在这里面绝对是一个先驱,因为他们最早有这种正确的非共识,最早看到“语言模型是唯一的问题”这一点。 我们当时的研究效果非常好,能实现当时全世界最好的效果。但评审就问我们一个问题:就是说语言模型有什么用?你们好像没有证明他有用。 但是这个时候其实你要做的事情并不是说去寻求认同,而是说你要把真把那个事儿给做出来。 36氪:你说“唯一重要的问题就是预测下一个字段。”这个事儿在当时如果是非共识的话,你是怎么意识到这一点,并且坚信的? 杨植麟:坦白说,我在那个时候还没有完全坚信这个事情,直到现在我觉得它也不一定是个共识,而是在逐渐变成共识的过程中。 36氪:什么叫“预测下一个字段”,应该要怎么理解? 杨植麟:本质上,做下一个token的预测,其实等价于“对整个世界的这个概率去进行建模”,就是现在给你任何一个东西,你都能给他估算一个概率。 这个世界本来就是一个巨大的概率分布,里面有一些是不可建模的不确定性,你不知道下面会发生什么。但有一些是你能确定的,能排除掉一些东西的,这是一个通用的、对世界去进行建模的模型。有很多历史学家来对这个事情做过研究,比如Density Estimation(密度统计),大模型本质是在做这样一个事情。 但当时我只意识到这是个重要的问题,而没有意识到是唯一要解决的问题。 36氪:那是什么时候让你改变主意了? 杨植麟:2020年GPT-3出来的时候,那个时候有了更明确的证据。OpenAI的人最厉害的点是,他们观察到了更多的数据,再更早的时候真正去把模型参数、训练规模扩大,所以他们更早地知道只要一直scale(扩大规模),就可能解决所有的问题。 36氪:知道它是如此重要之后,这会怎么影响你的技术路线? 杨植麟:回到刚刚那一点,如果这个世界只有一个问题:要预测下一个字段,那么输入和输出其实是一样的——也就是“理解”和“生成”其实也是同一个问题。 几年前,我们自己也会区分,到底是要做理解模型还是生成模型,但现在不需要了。 36氪:不过,现在有很多团队的技术路线,可能会先做文字理解,在理解这一端做得更多些,生成可能会靠后一点。 杨植麟:这些思考方向不够本质。现在任何说“只能做理解而非生成”都是错误的方向。正确的方向应该是:理解和生成就是一个问题。如果能做很好的理解,那能做很好的生成,这两个应该是完全等价的。 36氪:相当于这两者无法分开来。 杨植麟:对的。现在就只有一个问题。比如说我能够去生成接下来10秒钟的视频,我那我必须对之前的这个视频有很好的理解,你得知道他发生了什么,这是一个什么样的story,接下来很有可能是什么样的演进,它是分不开的。 36氪:你对实现AGI(通用泛化的智能)有信心吗? 杨植麟:有没有信心取决于它的第一性原理,我觉得大家现在已经明白原理了,只有一个问题:就是预测下一个字段。一条道走到黑的话,我觉得就能实现。 但确实还存在一些“第二层面”问题,也就是具体的技术方向难题。但是这些都是小问题,并非原则性的,第二个层面就是我们要去攻克的。 人的一生不过是大量的信息 36氪:用一句简短的话来描述月之暗面的目标跟远景,你会怎么说? 杨植麟:长期的几个目标是:探索智能的极限,让AI有用,以及让每个人都能拥有真正普惠的AI。 36氪:“普惠的AI”怎么理解? 杨植麟:现在的一个问题是,很多时候AI的价值观是被一个处于中心的机构控制。一个模型表现成什么样子,完全是由平台来决定——TA觉得什么是“好的”,什么是价值观正确的答案。 但每个人会有自己的价值观。价值观是更底层的东西,它其实还包含很多可能——你的偏好,也就是你认为什么是对的,什么是错的。 每个人都应该要有这种个性化定制的机会,所以以后的AI也应该要拥有“对齐”的机会。(对齐Alignment,指确保AI系统的行为匹配预期的人类价值观和目标的过程)。当然,我们肯定要去设置安全底线,以及监管层面的东西。在这个底线的基础上,我们可以有很多个性化AI的机会。 36氪:个性化的AI,它的实现路径是什么?每个人都能训练一个代表自己的AI模型吗? 杨植麟:你刚说的训练是一种方式,但我认为可能后面也许不需要去训练,也许直接设置就可以了。 最终的一个可能形态是,AI会数字化的所有东西全部记录下来,你的手机、电脑上会有一个和你共生的AI Agent(AI代理、AI分身),它会知道所有一切你能知道的东西。 36氪:你在你的个人主页上写,你的所有的工作目标都是“让AI价值最大化”。这指的是什么? 杨植麟:最大的价值就是,最终每个人不用做自己不想做的事情,保留人性里面最精华的部分。 比如,我们这次谈话也可以不用面对面,而是有更高效的方式——比如由我们的AI Agent直接对话。在公司也是一样,现在的组织要花时间去定绩效、考核。其实这都会非常花时间。以后我们也许就不需要公司了,一个人的效率会高很多,也不用为了赚一点钱就非得要去上班,可以用AI来做很多工作。 要达到这样的效果肯定很难,但最终人类有可能实现生产最大化。最后,也许真正的共产主义会出现。 36氪:如果让你现在对未来做一个预测的话,你觉得十年之后我们这个社会会有什么样的变化?或者说AI对这个社会最大的变革,你觉得会来自什么方面? 杨植麟:十年有点难,五年可以说一说。 我觉得至少五年内大模型技术不会commoditize(指技术还会有壁垒,不会变成廉价的商品)。因为至少还有一大批模型没有出来,我们还没有真正看到视频大模型。 我觉得这两年可能是文本模型持续迭代的窗口。后再过三年,是视频模型持续迭代的窗口,这里始终是有技术壁垒的。 36氪:所以,视频大模型会是关键性的节点? 杨植麟:对的,这些节点都迈过后,会出现一个巨大的变革。 美国有一个公司叫Rewind(主打“记录一切”,让人类搜索一切在上看见过的所有内容),现在的产品能实现的效果,可能只是能问它:我上个月做了什么?它会记录下来,现在的效果还是比较浅层的。 以后的AI Agent会更加深度地实现个性化。比如,大模型会和你有共享的记忆,知道你所有的价值偏好,所有的价值取向。如果你让他写一个Q3的规划,他会基于已知的这些东西直接去写规划,而不需要知道Q2做了什么东西。 36氪:从文字到图片,再到视频大模型、Agent,要实现的关键是什么? 杨植麟:是context(上下文长度,也可以理解为模型单次能处理的信息量),这基本决定了AI能产生价值的上限。 如果大模型的context就是你的全部记忆,理论上,那它就可以做你现在做的全部事情。 对于大模型来说,最关键的一点就是,你到底能有多少context被捕捉到。这取决于视频模型的能力,如果模型能力很强,理论上你的手机和电脑加起来就差不多是你完整的context。 人的一生也不过是如此,我们每天就活在数字世界里面。可能除了我们现在这种线下对话,他可能捕捉不到,其他大部分都是都ok的。 36氪:如果真的达到这种状态,人类应该要怎么和机器共存? 杨植麟:我自己是比较乐观,就是说他在提供更多生产力的同时,他应该会创造很多新的岗位。 视频现在是大家花时间最多的地方,所以他肯定会对生产关系产生很大的影响。所以每个人可能都可以生产(视频),很多价值会被重新分配。 但这是一个反馈闭环时间比较长的事情。挑战在于,当前替代现有岗位的速度比创造新岗位的速度更快。核心问题在于,在理想的岗位没有被创造出来之前,我们如何解决一些社会问题。 36氪:普通人怎么去面对这次技术变革?这种变化继续下去,普通人应该做点什么? 杨植麟:我觉得最重要还是学习。不光是普通人,我觉得所有人,拥有最强终身学习的能力的人,以后才能够实现自己真正的价值。 另外一点是要open minded。我四五年就找过很多人说,要不要来一起做大模型,当时他们说我现在要做数字人,你不要跟我讲这些东西(笑)。所以人确实有时候还是会被自己认知所局限。无论我们对技术的态度如何,历史的发展都是超出个人意志的。因此,我们要不断的自我迭代,适应这个世界唯一不变的,就是变化本身。
人工智能时代:为何强监管是关键?
我们有理由相信,人类将能够引导这场科技革命走向更加明亮、公正和有益的未来。 想象一下,有一个超级助手,它能在瞬间为你推荐理想的餐馆,解答复杂的问题,甚至为你创作动听的歌曲。没错,那就是人工智能——我们时代的神奇之力,在短短的时间内闯入各个行业,宛如“超级英雄”般为我们创造了前所未有的价值。 与此同时,人们对人工智能的担忧也悄悄累积。它会不会误传假消息?我们的工作还安全吗?它会不会在未来某一天,突然宣布“你的工作,我来做”?或者更让人心悸的,它会不会变得聪明到超越人类,成为地球上的新霸主?如何给这位“超级英雄”制定规则,设定边界,确保它为人类服务而非反其道而行之,已经成为全球范围内的热门议题。 2023年6月12日,联合国秘书长古特雷斯表示,响应一些人工智能行业高管的提议,成立一个像国际原子能机构的国际人工智能监管机构。此外,他还透露,计划在今年年底前启动一个高级人工智能咨询机构,定期评估人工智能的管理措施,并就如何使人工智能与人权、法治和人类的共同利益保持一致提出建议。 2023年7月6日,2023世界人工智能大会(简称WAIC)在上海开幕。在开幕式上,特斯拉首席执行官埃隆·马斯克发表视频讲话:“我们需要一些监管措施对人工智能进行监督。考虑到深度人工智能所可能展现出的超越人类的能力,它可能引领我们进入一个积极的未来,也有可能导致某些不太乐观的结果。我们的目标应该是确保走向那个光明的未来。” 2023年9月13日,美国参议院多数党领袖查尔斯·舒默(Charles Schumer)主持召开首届“人工智能洞察论坛”,科技界领袖们应邀参加。这场为期一天的闭门会议的核心议题是:如何为日益强大的人工智能技术制定法规,确保人类能够掌控这项技术,而不是被它掌控。 当你看到参会者名单时,你可能会为他们的实力而震惊:特斯拉的埃隆·马斯克、Meta的马克·扎克伯格、Alphabet的桑达尔·皮查伊、Open AI的萨姆·阿尔特曼、英伟达的黄仁勋、微软现任首席执行官萨蒂亚·纳德拉和前首席执行官比尔·盖茨,还有IBM的阿文德·克里希纳。这群科技巨头的总身价已经接近5500亿美元,这是一个惊人的数字,大约相当于4万亿元人民币。 会议结束后,舒默向在场的记者分享了一个观察:当他提及“政府是否应该在人工智能的监管中扮演角色”这一问题时,场中的每一个人都举起了手(表示同意)。尽管他们的具体观点有所不同,但对于监管的必要性,已经形成普遍共识。 通过上述几则新闻,我们可以发现,对人工智能进行必要的监管,无论是政治家、科学家,还是企业家,大家都有了共鸣。人工智能的进步在为我们带来诸多便利的同时,也带来了前所未有的挑战。只有通过明确的规范和指导,我们才能确保这一技术走向成熟,而不是失控;确保人工智能真正为人类的未来服务,而不是对其构成威胁。那么,人工智能目前到底存在哪些问题呢? 2023年2月16日,怀孕8个月的32岁美国女子Porcha Woodruff,遭到了一个意想不到的打击,她被人脸识别技术错误地标记为犯罪嫌疑人。那天清晨,当Porcha正忙于送孩子上学时,6名警察突然出现在她家门口。他们手持逮捕令,指控Porcha涉及一宗抢劫案。这起事件始于一个月前,当时一名受害人向警方报告了抢劫案件。为了查找嫌疑人,警方使用了人脸识别技术分析了相关的监控录像。结果,系统提供的6张疑似嫌疑人的照片中包括了Porcha Woodruff,更不幸的是,受害者错误地确认了她。Porcha不甘于这一荒唐的误判,她选择起诉底特律警局,并最终成功为自己伸张正义。这得益于她当时的身孕状况,可以证明她不可能是这起案件的真正罪犯。 上述这个案例,揭示的就是人工智能存在的偏见与歧视问题。人工智能很大程度上依赖数据来学习和作出判断。但如果训练数据本身存在偏见,那么算法模型可能会放大这种偏见,比如种族和性别歧视。以人脸识别技术为例,一些系统在识别非白种人面孔时出现了问题,因为训练数据主要基于白种人的面部数据。 Porcha Woodruff事件只是人工智能带来的诸多问题中的一个。在信息传播方面,人工智能存在的问题,是“人工智能幻觉”(AI hallucination)和深度伪造(Deepfake)技术。Deepfake是英文“deep learning”(深度学习)和“fake”(伪造)的混成词。 以ChatGPT为代表的大模型的一个明显缺点,是人工智能幻觉,有时它会一本正经地胡说八道。它总能就用户提出的问题或请求,作出“信誓旦旦”的答复。但用户必须警惕,这可能是生成式人工智能(AIGC)为了取悦你而说出的“谎言”。有报道称,当询问一个大模型关于历史事件的详情时,它可能会添加一些不真实或夸张的细节。 6月22日,美国纽约联邦法官作出一项判决,Levidow,Levidow&Oberman律师事务所引用了ChatGPT撰写的一份由虚假案例引证的法庭简报,行为恶劣,对其处以罚款5000美元。受到处罚的律师事后表示,他反复询问ChatGPT那几起不存在的案例是否是真的,而ChatGPT给出肯定的回复,还称可以在多个法律资料库找到。 除了胡说八道,被人诟病的还有深度伪造技术。2023年1月,全球第一部运用深度伪造技术,实现人工智能合成名人面孔的节目——《深度伪造邻居之战》(Deep Fake Neighbor Wars),在英国电视公司ITV的流媒体平台上线。在这部没有明星实际出演的喜剧中,一群在替身演员基础上由人工智能合成的“名人”成了邻居,在一起插科打诨。 今年早些时候,当美国前总统特朗普在纽约接受审查时,社交媒体上充斥着许多由人工智能生成的伪造图像,似乎显示他与警察发生肢体冲突。如果这种技术被用来伪造政治家或公众人物的言论或行为视频,那么可能给他们的声誉带来深远的负面影响。在此背景下,我们不得不思考:当名人的面孔被人工智能技术合成使用时,他们能否主张其肖像权受到侵犯?他们是否有权获得相应的报酬?制作这类内容的节目或平台需承担何种法律责任?对于这种技术生成的内容,政府有没有相关的监管措施? 另一个关键问题,是人工智能决策的透明度和可解释性。众所周知,许多深度学习模型因其复杂性而被视为“黑箱”。这意味着,尽管这些模型在各种任务上展现出了惊人的准确率,但其内部工作原理和决策机制往往对算法开发者自己都显得难以捉摸。例如,当某人工智能系统拒绝某人的贷款申请时,我们如何确定它是基于客观的信用评分、收入资料,还是其他不那么明确的因素作出的判断?这种不透明性可能导致决策偏见,并在某些情况下产生不公正的结果。 此外,当人们依赖某家企业提供的算法模型作决策,如果由于模型的不准确性导致的失误引发了经济损失或其他负面影响,那我们不得不思考:是模型还是使用者应承担责任?或者说,企业是否有义务在提供模型时明确其可能的风险和局限性? 在医疗领域,当人工智能医疗系统为医生提供疾病诊断建议时,医生往往会思考这些建议的来源以及其背后的数据和推理逻辑。这不仅是医生的问题,也是患者的问题,因为在关乎健康,甚至生命的重要决策中,信任是关键。但是,如果人工智能模型的工作方式像一个“黑箱”,那么如何确保我们不被其可能存在的误导性输出所欺骗呢?当我们开始过度依赖机器作出关键的医疗决策时,我们就面临失控的风险,谁敢保证这个系统每一次都能作出正确决定? 隐私泄露也是一个日益突出的问题。为了提供个性化的服务或优化其模型,众多公司不惜采集大量的用户数据。但随之而来的是这些敏感数据可能面临被非法窃取或被不当使用的风险。据此前媒体曝光,5000万脸书(Facebook)用户的信息,在用户不知情的情况下,被剑桥分析公司违规滥用。这家公司据此向目标用户投放了高度定制的政治广告,旨在2016年美国总统大选中为特朗普的竞选团队拉票。这起事件凸显了我们在数字时代中面临的隐私挑战和企业使用数据的道德界限。 这些问题仅仅是冰山之尖。随着技术进步的脚步,我们可能会面临更多尚未预见的挑战和困境。为应对这些情况,各国正在加强监管力度,不断探索有效的应对策略和前瞻性的解决之道。 早在2021年9月25日,中国国家新一代人工智能治理专业委员会就发布了《新一代人工智能伦理规范》,旨在将伦理道德融入人工智能全生命周期,为从事人工智能相关活动的自然人、法人和其他相关机构等提供伦理指引。这里面的第12条,提到了增强安全透明。在算法设计、实现、应用等环节,提升透明性、可解释性、可理解性、可靠性、可控性,增强人工智能系统的韧性、自适应性和抗干扰能力,逐步实现可验证、可审核、可监督、可追溯、可预测、可信赖。第13条提到了避免偏见歧视。在数据采集和算法开发中,加强伦理审查,充分考虑差异化诉求,避免可能存在的数据与算法偏见,努力实现人工智能系统的普惠性、公平性和非歧视性。 从2021年,中国陆续发布三部重要的部门规章:《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》,从算法、深度伪造、生成式人工智能等方面对相关技术的发布者提出监管要求。 这三部规范,也确立了中国将采取“包容审慎的分类分级监管”原则。有关主管部门针对生成式人工智能技术特点及其在有关行业和领域的服务应用,将制定相应的分类分级监管规则或者指引。 欧盟的人工智能监管路径,主张“以人为本(human-centric)”,在促进人工智能发展与创新的同时,构建监管体系以防范风险、保护公民基本权利和安全。2022年12月15日,欧盟委员会主席、欧洲议会和理事会主席共同签署并发布了《欧洲数字权利和原则宣言》。《宣言》强调人工智能应该是人类的工具,最终目的是增进人类福祉。每个人都有权从算法和人工智能系统的优势中受益,包括在数字环境中做出自己的知情选择,同时保护自己的健康、安全和基本权利免受风险和损害。 《宣言》要求技术公司承诺建设以人为本、值得信赖和合乎道德的人工智能系统。这需要他们做到“六个确保”。 1.确保在使用算法和人工智能方面有足够的透明度。 2.确保人们有能力使用它们,并在与它们互动时获得信息。 3.确保算法系统基于足够的数据集,以避免歧视,并使人们能够监督影响人们的所有结果。 4.确保人工智能等技术不被用来抢夺人们的选择,例如,在健康、教育、就业和其他方面。 5.确保人工智能和数字系统在任何时候都是安全的,并在使用时充分尊重基本权利。 6.确保人工智能的研究尊重最高的道德标准和相关的欧盟法律。 美国则主张,监管的核心目标应当是促进人工智能的负责任创新(responsible innovation)。为实现此目标,美国认为应通过一系列的监管和非监管措施,最大限度地减少对人工智能开发和部署的不必要制约。2022年10月,美国白宫发布了《人工智能权利法案蓝图》,列出了五项核心原则,提出负责任地使用人工智能路线图。该综合文件为指导和管理人工智能系统的有效开发与实施提供了方向,其中尤其强调了防范对公民权利和人权的潜在侵犯。 至于具体的监管架构,美国目前并没有设立专门针对人工智能的独立监管机构。而是采取了部门分工的方式,让各个领域的主管部门在其职责范围内对人工智能进行相关的管理和监督。以此为例,美国食品药品管理局(FDA)负责医疗领域的人工智能产品,而美国交通部则对自动驾驶汽车的人工智能技术进行监管。 日本对人工智能的治理,提出了“以人为本的人工智能社会原则”。该原则包括以人为本、教育、隐私保护、确保安全、公平竞争、公平、问责制和透明度、创新七个原则。然而,日本并没有单纯选择政府为唯一主导的传统治理方式来设定、监督和执行人工智能的相关规则。相反,他们选择了一种被称为“敏捷治理”(agile governance)的模式,鼓励多个利益相关方共同参与和决策。在这种治理框架下,政府、企业、公众及社区等多方共同分析当前社会环境,明确意图实现的目标,制定策略以实现这些目标,并持续地评估与优化已实施的措施。 随着人工智能技术的深入渗透,我们共同认识到了其带来的巨大潜力与同样突出的风险,从人工智能幻觉到深度伪造,从隐私泄露到决策的透明性,这些问题都让我们反思与警视。值得欣慰的是,全球对于强化人工智能的监管达成了共识。各国纷纷挥笔立法,以期为这一技术巨兽划定明确的边界,确保它为人类的未来发展提供助力,而不是成为威胁。 我们有理由相信,人类将能够引导这场科技革命走向更加明亮、公正和有益的未来。正如人类曾成功地驾驭蒸汽机、电力和互联网,我们同样有能力确保人工智能成为下一个改变历史的、有益的工具。
麦当劳和可乐们最大的威胁,居然是减肥药
都说爱喝冰美式的韩国人进化掉了睡眠,什么能减掉肥胖的美国人对垃圾食品的欲望? 最近,摩根士丹利给出了一份长达 82 页的报告,解答了这个问题。 可乐、奥利奥、麦当劳们,可能因为当下最火的「减肥神针」不好卖了。 麦当劳和可乐的「宿敌」,居然是「减肥药」 这里的「减肥药」,主要指的是丹麦制药巨头诺和诺德的 Wegovy 和 Ozempic。 前者是肥胖和超重人群的减肥药,后者是 2 型糖尿病药物。然而,体重正常的非糖尿病人群也对它们趋之若鹜,想尽办法开到处方药。 这是因为,它们拥有同一种活性成分,可以模拟人体内的激素 GLP-1,减缓消化并降低食欲。 饱腹感强了,对食物的欲望降低了,不必考验意志力了,不就能轻松瘦下来了吗? 尽管效果因人而异,副作用有待研究,朴素的道理吸引着海量的信徒,GLP-1 药物从 2020 年到 2022 年在美国的销量猛增了 300%。 就连马斯克也为它们背书,现身说法成为甩掉肥肉的成功案例。 拥趸多了,情况也更加复杂起来。降低食欲不仅意味着少吃东西,也很可能导致饮食习惯的变化,化身一只扇动翅膀的蝴蝶,威胁到食品巨头的未来。 今年夏天,摩根士丹利对 300 名用药者的一项研究调查显示,GLP-1 药物每天可以减少 20% 至 30% 的卡路里摄入量。 如果以 1 天摄入 2000 卡路里衡量,约等于少吃了 100 克的薯片。 问题来了,卡路里具体是从哪里减少的? 三分之二的受访者开始少吃糖果、含糖饮料和烘焙食品。除了包装食品,70% 以上的受访者去快餐店和披萨店的频率也变低了。 同时,GLP-1 药物也有助于抑制吸烟、饮酒等某些成瘾行为,受访者中的 60% 以上减少了饮酒,近 25% 完全戒酒。 虽然调查样本较小,但面对总值接近 1 万亿美元的美国食品业,任何风吹草动都可能酝酿一场大风暴,更别说美国的肥胖率接近 43%,减肥药市场远远没有封顶。 摩根士丹利预计,到 2035 年,7% 的美国人口(2400 万人)可能会服用 GLP-1 减肥药。 以此为前提,美国消费者预计减少摄入 1% 到 2% 的卡路里,汽水、糖果、烘焙食品和咸味零食的消费量下降 3%,酒类的消费量下降 2%,连锁快餐的销售额减少 1% 至 2%。 仅次于汇丰的英国第二大银行巴克莱,也给出了和摩根士丹利类似的分析,认为 GLP-1 药物的流行可能会削弱对百事可乐、麦当劳等公司的需求。 这些结论对诺和诺德、礼来等制药公司来说是个好消息,却在食品行业头上架了一把刀。 不说未来 10 年,沃尔玛已经从当下的业绩里察觉到了变化。 沃尔玛的美国业务 CEO John Furner 在接受彭博社采访时说,减肥药正在让人们减少购买食品,「单位食品更少,卡路里也稍微减少」。 健康热潮千变万化,食品巨头云淡风轻 不过,食品行业的趋势变化,从来不等于「斩立决」。 看到减肥药可能的蝴蝶效应,生产汽水、零食、罐头的品牌们,保持观察但依然乐观,觉得情况依然可控,做出决定还为时过早。 让安迪·沃霍尔画出著名波普作品的金宝汤,对制药公司的迅速崛起有些震惊,但不觉得自己的产品线会全面溃败。 不确定消费者行为到底有多大变化,品牌们的动作就像那张著名的表情包,一只白鹭伸出单脚,在海浪边优雅而谨慎地试探。 沃尔玛的零食虽然卖得少了,但因为旗下药房也卖 GLP-1 药物,赚的钱反而更多了。 今年 8 月,沃尔玛告诉分析师,食品、消耗品和保健产品在下半年的销售额将增长一个百分点,主要是由于 GLP-1 药物的普及。 服用减肥药的顾客总体倾向于在我们这里花更多的钱,尽管他们买的食物更少。 拥有奥利奥等产品的亿滋,则计划推出更小包装的零食,热量为 200 卡路里或更少,并且采用独立包装。 这几年来,百事等巨头收购更加健康也更加小众的新兴品牌,让产品组合更加多样、绿色和全球化,我们更是早已见怪不怪。 与其说品牌是为了避免被减肥药割脖子,毋宁说「健康」本来就是心照不宣的大趋势。 摩根士丹利的报告里也提到了,用药者会吃更多的水果、蔬菜、家禽和鱼类,以及蛋白棒和营养奶昔等体重管理产品,可以说一点也不意外。 食品品牌们保持谨慎也有道理,历史上「狼来了」的故事演得太多,有时候他们是被骗的跟风村民,有时候他们就是大言不惭的孩子。就像食品品牌 Saffron Road 的 CEO 所说: 我们总是经历一种新的神奇药物、一种新的神奇食品成分的循环。 20 世纪 70 年代,天然食品热潮兴起。「你即你吃的食物」(You are what you eat)在 1960 年代为嬉皮士所拥护,被用作健康饮食的口号。 20 世纪 90 年代,Olestra(一种脂肪替代品)横空出世,一度作为食品添加剂获得极高的存在感,人们想以此少吃黄油和起酥油。 但事实证明,Olestra 太过「贪婪」,不仅去除了不需要的脂肪,还削弱了身体吸收必需维生素的能力,最终由于痉挛、胀气、腹泻等副作用而被淘汰。 ▲含有 Olestra 的薯片. 21 世纪初,阿特金斯饮食法(Atkins Diet)又流行起来,它认为减重的关键是限制碳水化合物的摄入、多吃高蛋白的食品,也因此推动了各种低碳水产品的诞生。 2004 年,一家奶油蛋糕制造商在申请破产时提到了阿特金斯饮食法。然而,到了 2005 年,因为无法证明对减肥长期有效,这种方法被认为是「食物盲从」,渐渐失去了光环。 ▲典型的阿特金斯减肥餐. 图片来自:wiki 追求健康的意识有了,但定义却依然模糊。这些昙花一现的健康趋势,谁也不知道什么时候局面反转。讽刺的是,不同类别的零食潮起潮落,但包装食品行业只会变得更大更强。 食品巨头们不相信,减肥药会真的颠覆人类的本性。在他们看来,沉默的大多数依然「口嫌体正直」。美国食品和饮料产品制造商 Smucker 指出: 消费者将继续通过多种方式吃零食,寻求所有不同类型的零食,甜食也将继续受到关注。 不过,这次的趋势还是有些不一样。食品工业之外,倡导节食减肥的公司也被影响到了。 摩根士丹利的数据显示,一旦开始服用 GLP-1 药物,订阅减肥计划的人数比例就会从 29% 下降到 20%。 今年 3 月,美国知名轻体公司 WeightWatchers 斥资 1.06 亿美元收购了远程医疗平台 Sequence,从而为会员提供开出减肥药处方的订阅服务。 几十年来,这家公司的理念是减肥全靠意志力,让节食和锻炼不够的人很有压力,但现在因为减肥药的流行,他们转而支持肥胖是一种疾病。 某种程度上,这也是健康意识的「去伪存真」。诺和诺德不是第一家用基于 GLP-1 的研究做出糖尿病药的公司,但它是第一家科学家们成功说服他人用它治疗肥胖症的公司。 健康又愉快地减肥,门槛依然很高 曾用 Wegovy 和 Ozempic 减肥的马斯克,很为它们影响沃尔玛而惊讶,还在 10 月 7 日发了条推文为减肥药说话: 药物都有副作用,但几乎可以肯定,与肥胖相关的健康问题超过 GLP-1 药物的风险。 从健康的角度看或许没错,然而马斯克可能没注意,摩根士丹利的报告里,还有一个和食品不那么相关的细节:许多人压根负担不起 GLP-1 药物,只有一半的患者享受保险。 在美国,一支 Ozempic 注射笔,通常可以使用大约一个月,医保前的费用约为 900 美元,高昂的价格导致部分保险公司不承保。 与此同时,GLP-1 药物供应有限,过载的需求让药店不堪重负,真正需要 Ozempic 的患者很难按时买到。 恰恰是因为这些「场外因素」,让华尔街的分析师们觉得,目前 GLP-1 药物对食品行业来说还不是大问题。 这些药物仍然昂贵,许多人无法获得,而且不能保证广泛或长期采用。 长期用得起 Ozempic 的,已经属于收入不错的一类人群。所以,摩根士丹利的调查可能掉进了「幸存者偏差」。加拿大皇家银行分析师 Nik Modi 敏锐地抓住了这一点: 低收入人群对咸味零食等垃圾食品的消费普遍过高,而他们不太可能成为这些药物的主要使用者。 另外,最近出现了不少关于副作用的报道,为过热的减肥事业泼泼冷水。 不列颠哥伦比亚大学的一项研究发现,使用 GLP-1 药物减肥,可能会增加患胰腺炎、肠梗阻和胃麻痹的风险。9 月,FDA 也更新了 Ozempic 的标签,警告其可能出现肠阻塞。 对副作用的研究是必要的,这些信息其实都表明,GLP-1 药物应该谨慎使用,也应该遵循医嘱,给到最需要他们的人。开发 Wegovy 和 Ozempic 的诺和诺德指出: 我们对 Wegovy 的临床试验数据表明,患者一旦停止服药,体重就会恢复,这并不出人意料。这支持了一种信念:肥胖是需要长期管理的慢性疾病,大多数患者都会长期接受治疗。 减肥是艰苦卓绝的长期斗争,减肥药物提供了类似捷径的幻觉,但其实仍然是一条漫漫长路,少有人有资格走上这条路,超市的零食货架也不可能在一夜之间重新装修。 摩根士丹利不全然唱衰垃圾食品和连锁快餐品牌,它还在报告里提到: 餐厅从来不仅仅是食物。他们在有限服务的情况下出售便利,在全面服务的情况下出售体验。 这就像国内打工人们的预制菜和白人饭趋势,「科技与狠活」的工业调料包带来味觉的刺激,不开火的简单做法更方便地摄入营养维持生命体征,先求饿不死,再说营养和健康。 你吃白人饭,我吃预制菜,有专业营养师和私人教练的马斯克靠减肥药瘦下来了,食品巨头们几十年如一日揣摩着如何让配料表更加好看,大家都有光明的未来。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。