行业分类:
加载中...
头条分类:
加载中...
中欧班列(西安)今年累计开行破3000列 跨里海黑海班列升级提速
8月13日,跨里海、黑海,直达欧洲腹地的中欧班列(西安)从西安国际港站驶出。   8月13日,X8153次中欧班列从西安国际港站驶出,这是今年中欧班列(西安)开行的首趟欧洲方向跨里海、黑海南通道班列,标志着中欧班列(西安)今年开行突破3000列。   该班列以“专线专用”集装箱船替代黑海内原有公共海运服务,实现了班列组织从“公交车”向“专车”的升级提速。   “这相当于货物有了‘专车’,不用等‘公交车’,提高了物流速度,提升了班列整体效率。”西安自贸港建设运营有限公司总经理袁小军介绍,整列集装箱进入欧盟国家后,提前使用自营机车和车板,按计划备车,缩短整体运输时效,比传统海运节省约三分之二的时间。   该班列在原“西安—跨两海—欧洲”路线基础上,缩短货物在格鲁吉亚城市波季等待船期的时间,提升黑海段“铁海”间运输模式的衔接能力和黑海区域的运输效率。此次中欧班列(西安—跨里海、黑海—欧洲)线路的升级,有效提升了中欧班列(西安)欧洲段的国际运输效率和“铁海联运”的转运效率,为企业稳定出口开辟了新的贸易途径。同时,助力中欧班列(西安)多通道建设,进一步发挥中欧班列(西安)对国际物流供应链的稳定促进作用。   据了解,这趟班列满载机械配件、家居用品等货品,途经哈萨克斯坦、阿塞拜疆、格鲁吉亚、塞尔维亚、匈牙利、斯洛伐克、捷克最终到达德国曼海姆。全程1.13万公里,预计9月9日左右抵达德国。(文/图 陕西日报记者 李妮)
中国版“星链”刻上江苏印记
  原标题:探索|“千帆星座”发射,中国版“星链”刻上江苏印记 长征六号改运载火箭   “5、4、3、2、1,点火!”2024年8月6日14时42分,随着指挥员一声令下,烈焰从长征六号改运载火箭底部喷射而出,火箭搭载着千帆极轨01组的18颗卫星发射升空,成功将卫星送入预定轨道。此次发射的千帆极轨01组卫星是我国低轨互联网“千帆星座”的首批组网星,标志着我国向全球卫星互联网领域迈出了重要一步。   卫星互联网,是通过一定数量的卫星形成规模组网,从而辐射全球,提供宽带互联网接入等通信服务,被誉为是继有线互联、无线互联之后的第三代互联网基础设施革命。未来的某一天,当你仰望星空时,夜空中最亮的那颗“星”,很可能是“江苏制造”! 长征六号改运载火箭   不论高山或海洋,联通互联网“最后一公里”   出行、外卖、网购……互联网已经成为生活工作中的重要基础设施。但互联网是否真的是“无处不在”?根据统计,目前地面上的互联网,只覆盖了地面大概10%的面积,一旦到偏远或欠发达地区,传统的陆地移动通信服务就是“鞭长莫及”。让运营商去全球各地建站,显然是不现实的,于是科学家们提出,将基站“搬”到太空中,这就是卫星互联网。   8月6日,千帆星座首批组网卫星以“一箭18星”成功入轨,被业内人士称为这是中国的“星链计划”。千帆星座也称“G60星链”,该项目由上海松江区牵头,实施主体是上海垣信卫星。   此次“千帆星座”首批组网卫星的发射,也与江苏有着千丝万缕的联系。在“千帆星座”计划中,格思航天作为卫星ODM厂商,专注于承接量产卫星的设计制造与卫星核心组部件的研发,垣信卫星则作为运营方,负责卫星的部署与运营。   据介绍,江苏无锡市交通集团旗下投资基金参与了项目制造商格思航天的早期投资,无锡城建发展集团旗下建瓴资本投资参与了垣信卫星A轮融资。“千帆星座”无锡格思卫星工厂项目也将于年内开工建设,格思航天将在梁溪黄巷街道将建设吨级卫星智造基地,用于满足批产卫星的生产需求,目标建成长三角地区卫星智能制造“灯塔工厂”,项目预计2026年初可正式投产。   据垣信卫星科技有限公司相关负责人介绍,2024年目标是要发射108颗星,到2030年底,“千帆星座”最终将打造超过一万颗的低轨宽频多媒体卫星组网,以实现全球范围内的互联网接入服务。   为何要打造如此大规模的卫星星座?这主要是因为当前的商业卫星互联网大多采用低轨道巨型星座系统。卫星的轨道高度可分为高轨、中轨、低轨等不同类别。高轨道卫星大约在距离地面36000公里,只需要几颗高轨道卫星就能实现全球覆盖,但也导致通信延时长。低轨道卫星距离地面约有160公里至2000公里,通信延时短、信号强,但覆盖范围较小,需要部署数千颗卫星才能实现全球覆盖。人们熟知的马斯克的“星链计划”,就是目前部署规模最大的卫星互联网星座,迄今已经有6200多颗卫星在轨运行。   “千帆星座”副总指挥朱晓铖表示,“千帆星座”主要是面向普通大众通信需求建设的星座,是地面互联网的一个拓展和延伸,在未来,当遇到地质灾害、紧急危险的时候,不管有多远都能及时连到互联网。将来通信系统的速率越来越高,通信覆盖的用户数会越来越多。   由于空间轨道和频段资源的有限性,低轨卫星互联网已成为各国科技竞争新赛道。美国、英国、加拿大、俄罗斯都陆续发布了低轨卫星互联网组网计划。2020年4月,我国首次将卫星互联网纳入“新基建”范畴,卫星互联网建设上升至国家战略性工程。2024年,商业航天被首次写入政府工作报告。业内人士预测,未来5年,我国低轨卫星制造及发射需求有望进入增长爆发期,按照相关规划,我国在后续十年内要完成2万多颗卫星的发射。   智慧工厂造卫星,成本有望降至几十分之一   卫星互联网需要卫星大量发射才能组网,传统的卫星是单颗制造,在测试、元器件、制造等环节成本高昂。如何高效、低成本地制造出卫星,也成为发展低轨卫星互联网需要解决的难题。   “商业航天是中国航天的一部分,与传统航天‘国家队’的角色相比,商业航天资金来源丰富、目标多元,‘试错’空间更充分。”南京航空航天大学航天学院副院长盛庆红教授介绍,在航天发射高需求的带动下,目前国内已有一批商业火箭、卫星的初创公司破土而出,“过去‘国家队’发射一颗卫星,成本都是以亿起步,而国内发射商业卫星的成本约为几百万到几千万元,卫星研制、发射成本门槛有望进一步降低。”   位于南通开发区的银河航天南通卫星智慧工厂,AGV搬运小车正有序地工作,低轨卫星智能产线上一台台智能装备机器人正举起机械臂抓取、精准装配。“在这里,制造卫星,也能像制造汽车一样在工业流水线上批量生产了。”银河航天南通卫星智慧工厂负责人成明向新华日报·交汇点记者介绍,工厂采用了脉动站位式生产布局,配备有装配机器人、自动化精测系统、数字化制造系统等150余台套先进装备。   虽然目前国内工业体系中智慧工厂已很普遍,但应用在航天领域还是起步阶段。让手工装配方式向流水线生产模式转变,也需要创新的工作方法。传统卫星装配方式以手工为主,设计师提供图纸,工艺人员编制工艺,操作人员在舱板上进行划线和粘贴,一个舱板几十颗销钉的粘贴都需要一天的时间。而银河航天南通工厂,团队创新采用三维模型投影的先进技术,将模型轻量化处理后,直接投影到舱板上,操作人员按照投影进行快速粘贴,效率提升90%以上。   2020年,银河航天南通卫星智慧工厂落户南通开发区。2023年,我国首款使用柔性太阳翼的卫星——银河航天灵犀03星顺利升空,生产灵犀03星的一些关键环节,就是在南通卫星工厂完成的。   “当前,全球太空新型基础设施建设如火如荼,呈现出低轨化、低成本化、星座规模化、商业化的发展趋势。我们的目标是推动构建面向低成本、大批量生产的新型开放式航天产业生态。”成明表示,银河航天正通过研发适应批产的低成本卫星,构建柔性智能卫星生产线,在量产情况下,可将卫星成本降至现有成本的几十分之一。   卫星互联网技术正在逐步转向应用场景,越来越多地参与进大众的生活。目前,银河航天基于自主研制的8颗低轨宽带通信卫星,构建星地融合5G试验网络“小蜘蛛网”,这也是我国首个低轨宽带通信试验星座。成明介绍,“小蜘蛛网”已在空地海等多场景低轨应用示范。在陆地上,“小蜘蛛网”完成了云南电网低轨宽带应用示范,验证了低轨卫星通信可满足我国电力对泛在宽带互联的需求;在空中,面向运营商应急通信的需求,“小蜘蛛网”的低轨通信能力结合中型无人机以及地面网络,实现了基于空中高速机动平台的5G应急通信覆盖能力;在海上,银河航天在南海海域“电科一号”试验船上完成了我国首次低轨宽带海上应用验证。   “我们正在研制太阳翼和相控阵天线一体化通信卫星,未来将用于支持手机直连卫星的宽带通信。”成明介绍,手机直连卫星技术的实现,有望让普通消费级手机直接接入卫星通信网络,达到与地面基站通信体验并无差别,未来普通百姓也能以更低成本,享受卫星应用带来的便利。    发力新赛道,江苏加速商业航天布局   2024年全国两会的政府工作报告,明确积极打造商业航天等新增长引擎。目前,北京、上海等多地均出台政策支持卫星互联网相关产业发展,各地结合自身产业基础,在卫星制造、卫星发射、卫星运营和卫星终端研制及创新应用等多个方向发力,布局产业新赛道。   江苏在2023年《江苏省航空航天产业发展三年行动计划(2023—2025年)》基础上,专门将商业航天纳入全省国民经济和社会发展中长期战略规划,出台发展专项工作方案,提出指导性实施意见。   从商业火箭到卫星制造,江苏的箭、船、星产业链可谓相当齐全,多地已在加紧布局航空航天产业,加快打造特色鲜明的现代化航空航天产业创新集群。   在无锡,这一产业赛道的布局也已逐渐起势成势,并通过全链条占据产业优势。无锡梁溪区的空天产业生态圈,在商业火箭研制领域已落地天兵科技、东方空间等重点链主型企业,吸附7家产业链企业,形成了覆盖火箭制造、卫星制造、卫星发射与应用的完整产业链,形成百亿元产值规模。   无锡梁溪区工信局相关负责人介绍,2024年4月,该区出台《梁溪区空天产业生态圈发展三年行动计划》,配套“空天九条”扶持政策。区内设立220亿元的科创、数字经济、空天产业三大基金,落地商业火箭、卫星制造、空间信息应用三个超百亿产业生态圈近50家企业,集聚行业80%链主企业。   围绕链主企业不同需求,梁溪区“量体裁衣”发展“定制园区”新模式,规划建设16个产业园区,围绕链主型企业需求,助推企业降本增效、集聚发展。作为全球第一家液体火箭首飞即成的民营火箭研制企业,天兵科技目前在梁溪区投资25亿元,打造国内商业航天领域中型液体火箭“天龙二号”批量化制造基地,2024年三季度基地竣工交付,年内投产。从事卫星整星研发和制造业务的微纳星空,卫星平台、卫星载荷及核心部组件全部实现自研,掌握卫星制造11项关键技术,拥有年产大于60颗卫星的卫星研制能力。   此外,梁溪科技城聚焦卫星“定位、导航、授时、遥感、通信”等领域,通过“北斗+”及无人系统的融合发展,构建空天信息生态圈,并积极推动空间信息技术在智慧城市等关键领域的应用。(新华日报·交汇点记者 杨易臻 张宣 图由太原卫星发射中心提供)
NASA透露滞留太空宇航员新消息 改乘SpaceX飞船竟没有宇航服
两名被困美国宇航员 凤凰网科技讯 北京时间8月15日,当地时间周三,美国宇航局(NASA)召开新闻发布会,介绍了两名被困太空的美国宇航员的最新信息。 这两名美国宇航员是巴里·威尔莫尔(Barry Wilmore)和苏尼·威廉姆斯(Sunita Williams)。他们在今年6月6日搭乘波音公司的“星际客机”飞抵国际空间站,原定于6月14日返回地球,但因为“星际客机”的技术故障滞留在太空。 NASA周三表示,关于宇航员返回的决定将在今年8月底前作出,他们仍在讨论是让两名宇航员继续搭乘“星际客机”返回,还是借助SpaceX的载人“龙”飞船返回。但是,如果使用SpaceX的飞船,两名宇航员还要在太空中滞留多达8个月时间。 而且,他们目前穿的是为“星际客机”设计的宇航服。这些宇航服不适用于SpaceX的飞行任务。如果他们搭乘SpaceX飞船,将会在没有宇航服保护的情况下返回。停留在太空的时间越长,宇航员就会暴露在更多的辐射中,增加健康风险。 以下是这次发布会的要点: ——两名宇航员“状态良好”,正在国际空间站上忙碌工作。NASA官员称,作为经验丰富的宇航员,他们在心理和身体上都为太空任务中的意外情况做好了准备。 ——NASA目前正在讨论他们是乘坐原来飞往空间站的波音“星际客机”返回,还是需要改乘SpaceX的飞船。如果必须等待SpaceX的飞行任务,两名宇航员可能需要在空间站上停留长达八个月时间。 ——然而,改乘SpaceX飞船存在一个问题,那就是他们的宇航服。他们穿的是为波音“星际客机”设计的宇航服,这些宇航服不适合用于SpaceX的飞行任务。如果乘坐SpaceX飞船返回,他们将不得不在没有宇航服保护的情况下返航。 ——NASA表示,他们对“星际客机”飞船仍然有信心,如果出现紧急情况,这艘飞船仍可以用于宇航员的返回。 ——关于宇航员返回的决定将在今年8月底前作出,目前没有明确的截止日期。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
1688反内卷,能否推倒商家头上的“三座大山”?
商家们实在卷不动了。 比如00后厂二代何宇迪,他在浙江东阳经营一家渔具公司,以给品牌做代工为主,产品除了在国内销售,还销往全球十多个国家。他在接手父辈的生意后,在电商店铺运营过程中发现,某个电商平台上在售5.9元还包邮的鱼线。 在他的判断里,这个价格是不可能盈利的。他很疑惑,这部分商家是怎么赚钱的? 商家头上的三座大山 “后来听说,很多人是在包裹里,给游戏公司夹带游戏小卡片赚广告费,来补贴亏损”。 这是商家被卷入价格战的一例。除此之外,商家还要卷服务。何宇迪透露,各电商平台先后推出“仅退款”服务后,整个鱼线行业的退货率提高到了20%,导致成本飙升。 而且,他还发现,仅退款“造出”是不少羊毛党,还是一个团体。这些羊毛党会有组织的涌向某个店铺购买商品,形成消费假象,导致平台的流量也向这部分客户群体倾斜。 但这对正常经营的商家来说,直接的后果就是,即便掏出再多的推广费,也无法获得精准的消费客群。或者说,这是一个“扭曲式”的消费群体。 实际上,何宇迪揭露的正是一个行业现实:过去的近两年时间里,电商行业处于近乎癫狂的低价竞争模式。全网比价、自动跟价、百亿补贴、仅退款等卷低价方式,在偏颇的“宠”着消费者的同时,也催生出不少倒卖二手商品的职业羊毛党,给平台和商家带来极大的经营压力。 因为在极致低价的背后,是平台、商家不得不面对低毛利甚至亏损,在内卷业态中做生意,并且越来越难做。商家更是被“经营难、成本高、利润低”三座大山压得喘不过气,围绕“仅退款”、“低价内卷”、“政策多变”的质疑声越来越大。 浙江大学中国数字贸易研究院院长马述忠表示,中国制造的数字化转型内需,是制造类企业必须保持10%以上的净利润。否则,中国制造将在低价的漩涡中逐渐“窒息”。 这些反馈向上传导,就需要平台做出姿态,更多的考虑商家的利益,帮助它们降低做生意的难度,避免商户流失。 这是一个无法回避的现实。随着电商行业进入存量时代,丰富的供给是影响消费者购买的关键变量。优质商家也就成为电商平台的“护城河”,特别是产业带源头厂商,更是成为国内电商平台、跨境电商平台激烈争夺的对象。 1688要反内卷 在这个过程中,作为阿里旗下源头厂货直销平台的1688,天生B2B强属性,一度为了做大市场体量,迎合消费者性价比需求,大力引入C端流量。比如今年3月,1688进行新一轮买家体验升级,推出0元下单、一件包邮、两三天收货和退货包运费服务。 这些变化,让很多原本只做B端生意的厂商,有些无所适从。何宇迪就吐槽,平台政策太多,变化太快了,很难及时适应。“原本我是做工厂生意的,我是接B单的,结果你让我仅退款,你让我一件也发货还要24小时到货,这给商家造成了很大的困扰。” 上海新麦食品工业有限公司总经理董凡铭,也是一名“厂二代”。家族工厂不仅为LV、Gucci、迪奥等品牌代工月饼,也生产自有外观专利的的蝴蝶酥。他坦言,“包邮给我们最直接的压力就是商品成本的增加。”当物流成本高过商品售价时,董凡铭不得不对月饼的定价进行调整,这也直接影响到最终的销量。 他还讲到,去年通过站内和站外的引流,有大量的C端散客涌入了自家1688的店铺当中,“我们的仪表盘上每天都有几千个包裹没有发”。同时,也因为行业内卷,他今年在广告上比去年多了20%的花费,只拿到了去年20%的展现。 平台的反应有一定的滞后性,1688还是捕捉到商家的不满:1688上的生意变得越来越复杂,要用心经营才能赚大钱,不够简单。还有不少商家反馈,平台流量不够精准,收费规则也看不太懂;运营规则也非常多变,很多工厂,如果不找代运营,不太玩得转1688店铺。 对此,1688相关人士也承认:“C类买家、B类买家和跨境买家揉在了一起,平台还犯了个错误,即要求商家拉起一条服务所有买家的(基准)线。而且,‘仅退款’、‘发货时效’等服务给商家造成了很大困扰”。 为了留住和吸引更多B端商家,1688高调喊出“反内卷”口号,并出台一系列“反内卷”举措。包括面向产业带的源头厂商推出“提效增收”计划,和发布免费的“AI 经营助理”。借此来修正业务发展方向,帮助商家推翻三座大山,在1688做生意更为简单。 1688商家负责人表示,在提效方面,平台全面简化了商家生意模式,提供自主经营和供货模式两种选择。选择自主经营的商家,1688将免费为其提供AI经营助理。想快速出货的商家则可以选择供货模式,由平台提供托管服务。简单来说,就是“自主经营用AI,供货模式用托管”。 在增收方面,1688对新商家的生意效果实施“双保”,即保获客、保订单,保证新商家在前3个月每月至少获取50个B类订单或买家。实力商家和超级工厂这两类会员商家,可享受直通核心流量场景的绿色通道,不再设交易额门槛。 此外,1688还计划发起百亿规模流量补贴,推广商品的曝光量相比以前将增加40%以上,平均点击成本将降低38%,每获得1000个点击,推广成本节省38%。 此外,为帮助商家适应高频的小额采购、小单快反和柔性生产需求,提高经营便捷性,1688还将面向商家提供免费的“AI经营助理”,后续推出的商家侧AI产品也将全部免费。目前,市面上同类商家AI产品的年费普遍在一万多元。 根据1688介绍,这款AI经营助理是基于1688在B类电商领域24年的知识沉淀,建成的一个具备专业运营经验的数字员工团队,团队主要成员有AI店长、AI素材运营、AI营销推广和AI客户管理。 在前期灰度测试中,AI经营助理优先给电商运营操作能力弱的商家开通了试用。测试期间,使用该产品的商家,生意难度相当于原来的60%,生意机会平均增加了50%。使用AI经营助理后,以前需要一个专业运营来完成的工作,现在只需0.2个人力成本就可完成。 枪响之后,要强补课 “让天下没有难做的生意”,这是阿里的使命,同样也成为当下1688的主要发力点。有媒体评价称,1688是业内第一个将“反内卷”口号摆上台面的电商平台,而且旗帜鲜明。 在唐辰看来,其根本原因在于,1688意识到自身核心竞争力还是供给,1688依然是一个纯粹的To B平台。正如其相关负责人一再强调,尽管年轻人大量涌入,为平台注入更多的C端流量,但整个平台超过90%的交易额仍是在B端发生。1688也不会转型成一个既2B又2C的电商平台,它的野心是要成长为一个数字供应链平台。 这是一个事实,电商交易过程中,B端和C端用户的界限正变得越来越模糊。比如,部分用户购买单件商品,可能是打样,或是测款,也可能是某个老板休闲下单,然后转为正式采购。更典型的场景是,某个公司的行政采购员,白天因公来采购,晚上变成了个人消费者。1688透露,平台每个月有数十万C端用户转变为B端用户,按年转化的数量更是达到数百万。 就此来看,1688打响了电商行业“反内卷”最响的一枪,但其采取的措施,也是其他电商平台正在推进的,后续效果还有待观察。 在此之外,1688还面临着内外两重挑战。 目前,1688拥有中国数量最多的源头工厂。数据显示,全国共有600多万家工厂,其中规模化工厂达到200万家。按照这个比例计算,1688占据了中国工厂总数量的十分之一,并占据了中国规模化工厂总数量的三分之一。截止2023 年 12 月中旬,1688的商家数量突破了100万。其中,有60万家是源头工厂。 但这个优势供给底盘,也在不断承受来自京东、拼多多、抖音,甚至亚马逊等国内外电商巨头的冲击。公开资料显示,今年2月,抖音电商发布产业带报告,称平台已经覆盖了全国684个特色产业带,产业带商家数量增长超194%,带货直播场次超过109万场;今年4月,京东在华强北布局自己的首个全国电子产品领域的合作产业带,以“电商+直播”形式帮助商家实现转型;亚马逊则在6月份宣布深入广东、浙江、福建、江苏等数十个产业带,将更多的产业带商家纳入到全球电商网络当中。 在外部对手抢食蛋糕的压力之外,1688自身还需加强“补课”。其中最为关键一点,1688锚定B赛道、消费者赛道和跨境赛道,并深耕中国制造产业带。这带来一个客观结果,即是,虽然B端流量还在稳步增长,但C端流量的比重也在持续增加,并且增速更快。1688就需要拥有敏锐的洞察力,观察到C端用户带来的隐性B端口碑的传播效应,并及时调整相关运营策略。 典型表现如,过去一年,1688多次登顶苹果应用商店免费榜。其最大助力来自小红书上年轻人,他们拥有自己的消费主张,喜欢把有设计感、颜值高以及有社交属性和情绪价值的商品,分享到小红书等社区,被种草者纷纷回流。 但长期来看,1688举起反内卷大旗,对于整个电商行业来说,是一个积极的信号。将推动行业一起,找到如何跳出低效的重复的最优解。这对1688来说,也是其走出电商差异化道路的立身之本。
视频号广告Q2大涨八成,“抄底”投流的商家立功了
采写/陈纪英 “我们认为视频号正在成为区别于传统货架和兴趣电商的第三种新生态,私域形态结合线下门店布局 , ”安踏集团CMO朱晨晔在采访中 断言 ,“视频号可能会创造新的机会,带来增速和利润率上的提升”。 这也是我们当下采访过程中,发现商家正在真金白银地加速投入视频号的缩影。 上半年《财经故事荟》曾报道商家正在规模化入场视频号,这一判断有了数据佐证。 腾讯发布的Q2财报显示,受“视频号及长视频的收入增长驱动,网络广告业务Q2营收同比增长19%至人民币299亿元,腾讯首席战略官詹姆斯·米切尔随后在财报电话会议上透露,视频号广告收入同比增长超过 80%。 平台增长的背后,商家端出现两个明显变化,一是不愿困于内卷的商家,越发高看视频号的高客单、高毛利、新增量特性,普遍提升视频号的战略权重,把此定位为新主场。 小点研习社创始人祝运龙甚至乐观估计,“在整体低价、内卷环境下,视频号会是一个带来利润的平台,算上品牌加持、私域运营等,视频号可能要比在其他平台的利润高2到3倍”。 二是商家追求拉新与利润,从“试水”进入了“放水”阶段。 背后是视频号流量竞争进入下半场,在上半场做好内容服务货品、抢夺自然流的基础上,借助广告流量红利,加速公私域流量流转和变现。 就此,我们也综合与业内人士与商家的采访,试图还原当下率先拿到结果的商家样板。 “短期要红利,长期看全域”是大家的共识,这也与腾讯的思路也不谋而合——直播带货更像是一个微信带货系统,不仅仅以视频号和直播为基础,还将与微信生态系统的所有产品相连,包括公众号、小程序、企业微信以及微信中所有社交和群活动。 一 既要又要,商家期待放量增长 对于加码视频号,CMO朱晨晔等安踏高管想得很清楚。“2024年上半年,安踏视频号直播带货主要以达人为主。下半年,安踏计划提升店铺自播占比”。 今年上半年,安踏业绩全渠道稳居运动户外类目TOP1,而视频号尤为一枝独秀,“视频号的增速,明显快于全渠道大盘增长”,朱晨晔告诉《财经故事荟》。 高增长并非个例,微信公开课显示,头部玩家数量在迅速提升,过去一年GMV超过千万的品牌数量增长了860%。 除了高增长的红利外,吸引商家们汹涌而来的还有拉新。 作为行业龙头,安踏有着让友商难忘项背的用户规模。如何在大基数之上,寻找新用户,成了必答题。得益于微信庞大流量池,在视频号直播间,除了触达年轻群体外,安踏还能覆盖到35+的熟女群体——收入高,消费力强。 过去聚焦银发经济的足力健,则链接了更多的破圈群体。 据足力健品牌推广中心负责人CMO张亚丽透露,“根据大量30岁到40岁左右的女性购买足力健到老家的数据,我们提炼出一个新的品牌战略,叫做‘送长辈足力健’。” 而在微信内部的不同入口、触点之间,下单人群重合率不高,微信广告5月发布的数据显示,视频号小店链路的广告下单人群与直播广告下单人群重合率不到 10%、与小程序链路广告下单人群重合率约 30%——在不同场景,商家总能找到新增量。 视频号高客单、复购、利润率,也让品牌们甘之若饴。 正价商品动辄在千元之上的中高端服饰品牌朗姿,很有发言权。“服饰品牌线上卖货的一大挑战,就是在线上卖正价品,但朗姿在视频号做到了,八九折的正价新品卖得也很好”,其新零售负责人透露,曾有一位热衷新品的沈阳顾客,一笔订单金额就高达5万元。而且视频号用户复购率高达60%,“这些差异化特性最终利好的是利润表现”。 2020年底,就开始布局视频号的的护肤品牌Rasi(乐识)成分实验室,其创始人骁宗对此也有感知。 2021年,乐识视频号端的平均客单价是600元,如今已经一路飙涨到1100元左右,甚至高于很多大牌护肤品,“视频号的用户不热衷于比价,只要她觉得产品有价值,就会下单。我们给自己定的标准是,客单价低于1000元,就说明这场直播不合格”。 整体而言,当下商家们期待在此开启全面放量的新周期——从“试水”到“放水”,KPI更全维,覆盖GMV增长、利润提升、用户拉新等。 从不同发展周期来看,成长型商家急于在视频号破圈扩⼤知名度,通过与达人合作等,拉动GMV大盘。 骁宗和同事一年出差200天以上,“主要是飞到各地见达人,100万以上GMV的合作,都要见面面谈”,“未来希望我们能在视频号里成长为年度GMV10亿量级的品牌”。 成熟品牌则希望在视频号找到全新的⽣意增量,多渠道布局,打造矩阵账号,实现GMV和利润同步增长。 以安踏为例,其计划从2024年上半年之前的达人带货为主,转向“达人+自播店播”并重,打算新增3到5家店铺尝试常态化店播,发动更多导购开通直播,探索新的电商场景。 二 投流全域开闸,商家抄底买量 商家有放量增长的急切诉求,但领先的永远只是少部分人,通过投流实现自主扩量,渐成共识。 受访商家普遍表示,随着越来越多商家进入视频号,对自然流量的争夺日趋激烈,薅流量的好日子可能不会太长,反倒是视频号的商业化流量仍在起步阶段,且价格相对便宜,抄底商业流量,作为杠杆来撬动公私域流量,算是优选项。 一家新消费品牌向《财经故事荟》分析,“视频号商业流量狼少肉多,现在投流类似于抄底,用投放更快撬动更大红利,是笔划算买卖”。 骁宗也有同感,他曾做过测算,乐识视频号投流的ROI能达到1:6,同期,乐识在其他短视频平台投流的ROI仅为1:1.2,“视频号的流量价格确实很便宜”。 随着越来越多的商家尝试投流,一些共性的方法论也得以沉淀下来。例如商家在投流工具选择上,主要有微信豆和ADQ(腾讯广告投放平台)两种,两者定位差异、场景互补。 其中,微信豆属于轻量化的加热工具,精准度更高,但投放场景仅限于视频号,一般用于早期起量和老客复购。而ADQ作为专业化的投放工具,则重于服务机构、商家的变现、转化等增长诉求,投放类型和场景更为多元,覆盖腾讯生态内外,满足于拉新和扩量诉求。 目前,大部分商家的投流策略都是组合投放。 足力健深谙此道,利用微信豆做大直播场观,激活老用户,拉动高转化;借势ADQ投放,实现公域拉新,撬动盈利增长,单月GMV已经突破800-1000万。 不止品牌自播,组合策略对于达人直播同样可行。今年618,钟丽缇直播间成为视频号首个场观破千万的达人带货直播间,就依赖于“微信豆+ADQ”的组合投放。 不过,于商家而言,投流并非手到擒来,既需要认知的提升,也需要能力的优化。在投放节奏上,也有技巧。 早期安踏微信端业绩的增长,主要依赖于公域短视频等自然流量,后者目前的贡献率仍然高达30-40%,而随着视频号端的战略权重提升,投流也成了安踏的标配动作,“微信豆和ADQ都有尝试”。 但ADQ相比微信豆,玩法更为复杂,如何提升投流的精准度,仍需摸索提升,安踏称“效果还没达到预期”。 对此,音爆科技CEO吴燕飞的建议是,“对于新开直播间来说,系统没有记录直播间的账号模型,使用ADQ系统也不知道给你什么样的人群,就会投不出去,用微信豆小额投放可以先建立一个账号模型,有了这个模型再使用ADQ,数据就会更好。目前我们通过微信豆建立账户模型需要3天到1周。” 投放也不能急于求成——比如前期,不要急于验证 ROI,先有曝光,才有转化,尔后优化,尤其是当投流和私域强联动时,长效ROI能显著提升。 中高端男装定制品牌欧定就受益于此,其创始人朱家勇告诉《财经故事荟》,欧定在公域投流的首购ROI大概仅为1:1,不算太高,但经过私域沉淀和运营后,后续复购ROI能达到1:5上下。 面对商家汹涌的流量需求,腾讯也不再佛系。 从年初至今,腾讯在投流等基础设施建设上,步履不停,可以归结为流量入口的全域开闸,以及交易链路的打通优化。 今年1月——微信广告上线了朋友圈广告两大新形态和通投视频号和朋友圈新能力,投流半径从视频号全面扩容到微信生态。到了5月,微信广告又上线了直跳视频号小店链路,为短视频带货商家提供引流新路径。两个月后,广告投放半径扩展到整个腾讯全域——腾讯旗下其他流量和内容入口(如腾讯新闻、腾讯视频等)都可以推广直播间,甚至还包含了汇集了10万+ App的广告联盟。 产品能力迭代的效果,除了拉动视频号广告大涨八成外,也在一线消耗中得到了印证。 音爆科技就在加大投流力度,其CEO吴燕飞在与百准对谈时透露,“在618之前我们的广告消耗数据大概在1000万左右,随着品牌方的入驻,内容的增多,今年双十一的时候,直播消耗可能会达到3000万左右”。 三 短期要红利,长期看全域 尽管视频号红利已成大部分商家共识,但也有部分缺乏耐性的品牌,浅尝辄止。 一家运动零售品牌告诉《财经故事荟》,“我们曾尝试过一段,但目前主阵地不在视频号”,原因是“老板觉得起量慢,GMV上限低”。 相比其他平台,微信整体的思路是普惠的、去中心化的,难见一夜爆红的传奇,看似不够性感。 但视频号的红利其实远未释放。 国信证券对此有过量化预测,2024和2025年视频号GMV相比2023年将分别翻约3和5倍。 从广告加载率上来看,5月腾讯方面曾透露,“视频号广告加载率还处于初期阶段,广告加载率是其他主流短视频产品的1/4左右”,随着投流广告系统完善,也会进一步释放视频号红利。 当视频号和公众号、小程序、朋友圈、搜一搜等全域强联动,既可实现扩量增长,也能实现长效的复利效应,避免出现用户一轮游,爆火又爆衰的高波动风险。 最近,腾讯把视频号小店升级为微信小店,其实满足的就是商家全域和长效经营的诉求。正式升级后,微信小店店铺及商品信息,可在公众号、视频号、小程序、搜一搜等多个微信场景内流转。 腾讯方面也提到,最近已经重新定位直播带货,使其更像一个微信带货系统,与整个微信生态系统相连,包括公众号、小程序、企业微信以及微信中所有社交和群活动,可以建立更大、更有意义、更高上限的带货生态系统。 视频号服务商零一数科CEO鉴锋乐见其成,他断言,微信小店升级后,意味着微信的全域资源,都可以支撑电商发展。商家串联好这些全域场景,可以扩量增长,提升GMV上限。 视频号与私域场景打配合,可以释放长效的红利效应。 一家全渠道GMV超10亿元的品牌透露,上半年私域联动视频号直播的交易只贡献了GMV总量中的第三名,但利润额却是全渠道第一,远高于电商和门店。 骁宗对此感同身受,由于私域和视频号联动做得好,“乐识每场直播六七成都是老用户”,推动产品年复购率达到了惊人的76%,老用户的客单价高,而且,激活老用户比拉新成本低,因此,ROI和毛利率都更有保障。 “有了高复购的老用户给托底,我们发展起来也更有安全感”,骁宗坦言,“如果每场直播都靠一轮游的新客支撑,产品和客户的匹配就会错位,很没底气”。 上述案例并非个案,据鉴锋透露,很多商家视频号直播间和私域强联动之后,季度复购的GMV能占到视频号直播间的1/3。 微盟营销品牌增长中心助理总经理费梦雅则发现,中高端品牌做好私域的加成价值更为显著。 她举例称,鞋履品牌思佳图的客单基本上在千元左右,当导购在朋友圈、微信社群转发视频号直播的时候,直播间GMV的提升大概是平时日播的10倍以上。 尽管长红不如爆红那般刺激,但在最低价、仅退款成为主流,行业越发内卷的当下,于商家而言,追求稳健的长期复利,而非一时兴起的暴利爆火,是更实际也更良性的发展路径。 这是骁宗决定主攻视频号的原因,从2021年到2023年,视频号渠道对乐识GMV大盘的贡献占比,从20%提升到了50%以上,今年其视频号GMV有望从去年的7000万,增长到1.5亿以上,“在其他平台可能会很刺激,生生死死起起落落,但在视频号增长比较稳,只要努力就有出头机会”。
微信百科上线,微信搜一搜想跟百度、头条搜索抢市场
据郭静的互联网圈观察,近期,微信悄悄上线了“微信百科”产品,当用户打开微信搜索(即微信搜一搜)的时候,系统会在内容页展示出对应的百科内容,平台并不会特别强调这是“微信百科”的结果,用户仅能从链接的域名(baike.weixin.qq.com)中看出是微信百科。另外,在微信搜一搜头部区域的各个频道中,也新增了“百科”版块,用户若只想看百科内容,从该频道搜索关键词即可直达搜索结果。 与之前推出快讯、搜索发现、问一问等功能类似,微信这次同样很低调,直接上线,没做任何营销宣传。 从微信百科的结果页可以看出,“微信百科”并非横空出世,在词条的尾部,系统会提示用户,“内容来源于搜狗百科”,用户还可以对词条进行反馈,比如文字内容问题、图片文字、视频问题等。 百科产品是典型的UGC(用户生成内容)类产品,无论是百科行业的鼻祖维基百科,还是百度百科、抖音百科,都秉承着“人人都可以编辑”的特色,不过,微信百科目前并未提供对应的UGC入口,它只是继承了搜狗百科的内容体系,用户如果想创建微信百科词条,只能从搜狗百科入手。 百科产品的BUG在于,它虽然能帮助平台获得大量流量,却不能变现,成立多年的维基百科也是靠着外界捐赠,本身并不盈利。那么,微信为何要在此时上线一款百科产品呢? 补全搜索引擎拼图 许多人认为搜索引擎是一个“夕阳产业”,一方面,搜索引擎行业的增长见顶,很难再保持绝对领先的头部地位;另一方面,个性化资讯平台对搜索引擎的逐步侵蚀,导致搜索引擎的地位降低;还有就是市场格局的问题,百度、360搜索、Bing、搜狗,新的产品很难对这几家市场形成冲击,国内曾涌起一波又一波搜索引擎产品试图去冲击百度的地位,但最终都是黯然消退,这种情况下,再去做搜索引擎看起来毫无意义。 然而,各大互联网巨头却在悄悄布局搜索引擎市场。2019年8月,字节跳动推出了“头条搜索”。2019年12月11日,微信宣布将微信搜索升级为“微信搜一搜”。 这一波搜索引擎产品要比当年的搜索引擎热低调得多。2012年,奇虎360高调推出360搜索,并将矛头直指百度,360搜索还发布公开信称,“即日起,360搜索放弃一切消费者医疗商业推广业务。”其他搜索引擎产品虽然没有这么激烈,但各种营销宣传做得不亦乐乎。可轮到头条搜索、微信搜一搜的时候,它们并未高调宣传要和谁谁谁对标,要颠覆谁谁谁。 毫无疑问,像过去百度、谷歌这样靠搜索引擎“躺赚”的时代已彻底过去。现在做搜索引擎的目的,更多是为了将流量和用户留在自家平台上,只要用户留存率和使用时长在,盈利就不成问题。 当初那波搜索引擎产品之所以黯然消退,跟它们的出发点有很大关系,如果只从技术上去搞搜索引擎,那难度还有可能攻克,可除了搜索技术之外的护城河同样不可或缺,在百度流量最猛的那几年,除了搜索外,百度贴吧、百度文库、百度百科为百度贡献了非常非常多的流量,其他平台光靠搜索拿什么跟百度拼?内容的护城河同样是一座大山。 头条搜索、微信搜一搜跟这波搜索引擎产品的出发点完全不同。 首先,它们先有内容,再去做的搜索引擎产品,比如头条搜索,在今日头条(个性化资讯平台)、头条问答、视频等内容非常丰富的情况下,它才推出的搜索引擎。而微信搜一搜也拥有庞大的内容库,比如微信公众号、腾讯新闻、微信读书、朋友圈等。 其次,头条搜索、微信搜一搜对于盈利的优先级并不算高。其他搜索引擎产品,推出两三年后,总归要考虑盈利和赚钱问题,所以,某搜索引擎虽然一开始高调宣称不做医疗广告,可很快就自己“打脸”,该上的广告一点儿没少,最后,用户发现其用户体验一点儿也没比百度好多少。 头条搜索、微信搜一搜对于盈利的要求并没有那么高,它们只要能让用户留在平台上,能提升App的留存率、活跃度等指标,就能帮助平台实现价值最大化。 在“时间不急”的情况下,头条搜索、微信搜一搜有足够的时间和机会来弥补其在搜索引擎上的不足和短板。 微信百科的推出,再次弥补了微信搜一搜在搜索引擎领域的拼图,扩充了微信搜一搜的内容库。 谁会胜出? 搜索引擎是典型的工具型产品,而工具型产品就非常考验工具的有效性,这也是当前微信搜一搜、小红书与百度之间的竞争焦点。微信百科加入微信搜一搜的大拼图,究竟对其搜索质量或者说工具的有效性有多大帮助?这一点还需要等待时间的考验。 据郭静的互联网圈观察,在使用微信搜一搜的过程中,信息流页的百科内容并不只是展现微信百科的内容,有时候也会优先展示搜狗百科的内容。这一幕是不是很符合腾讯公司的特色?即两款产品同时竞争,最终究竟谁能胜出?微信百科和搜狗百科目前就处于这种情况。 微信百科直接引用搜狗百科的内容源这没问题,但百科是UGC类产品,这意味着需要不断进行新词条扩充和旧词条内容的更新,微信百科会怎么解决,还是依旧靠搜狗百科? 2019年初,今日头条收购了互动百科,从而弥补了平台的拼图,后互动百科被整合升级为“抖音百科”。 2021年9月,腾讯彻底收购搜狗,搜索和输入法等业务保持搜狗品牌运营。然而,直到现在为止,搜狗搜索和微信搜一搜之间仍是相对独立的品牌,这在互联网行业并不多见,但放在腾讯公司身上似乎又很常见。 但最终来看,必然会有一款产品胜出,而另一款产品出局。 搜索引擎行业的故事变了 PC时代,搜索引擎是网站的入口,其影响力和价值都非常大,没有搜索引擎,用户很难敲开各个网站的大门。但到了移动互联网时代,搜索引擎的作用大大降低,各个App开始以自身为中心,并且正是因为PC时代吃过搜索引擎的亏以后,各个App更不愿意受到搜索引擎的掣肘,App成为“孤岛”的现象愈发明显。 搜索引擎依然重要,但它不是必须,各个孤立的App直接完成了用户的相关需求,无需走搜索引擎这道门槛。 另外,搜索引擎作为一门生意,也开始见顶。百度2024年Q1季度财报显示,该季度百度核心收入为人民币238亿元,同比增长4%;在线营销收入为人民币170亿元,同比增长3%。尽管这个数据并不算差,但现如今的百度早就不能跟前几年一样,动辄20%的增速。百度已多个季度维持在这个营收水平。 那么,微信搜一搜、头条搜索的推出,究竟会不会冲击百度的地位呢?实际上也很难。头条搜索刚推出的时候,外界认为以今日头条的影响力,以及百度的用户体验,前者会以摧古拉朽之势迅速抢占百度的市场,但从百度的营收来看,头条搜索并没有抢走多少百度的市场。 微信搜一搜的情况同样如此。腾讯2024年Q2季度财报显示,截至2024年6月30日,微信及WeChat合并月活账户数13.71亿,同比增长3%。坐拥如此庞大的用户量,微信搜一搜如果放量力推搜索,那么,搜索引擎市场的格局是不是就会彻底变换天地?事实上并非如此,腾讯方面的数据显示,2022年微信搜一搜月活跃用户已达8亿。 微信搜一搜的月活用户数据是很高,但用户的搜索行为能产生商业价值非常有限,微信搜一搜很难做到像百度搜索那样的广告体系。 话又说回来,微信搜一搜毕竟还在发展阶段,其在搜索广告方面还未发力,如果这个“大闸”一开,微信广告的营收还能再进一步。 但不管微信搜一搜怎么变,用户习惯的彻底改变,还是非常考验产品和时间的。 搜索引擎行业的故事已经进化到了AI大模型+搜索阶段,这对于微信搜一搜、头条搜索、百度们来说,才是更大的变量。 以前用户总以为行业出现新产品,会迅速替代原来用户体验不佳的产品,可要么是“屠龙少年终成恶龙”,要么是挺了几年不赚钱后迅速关停,用户都麻了。总之,别说什么大话,先做好产品再说。
台积电急招CoWoS技术员 消息称年薪超业界40%
台积电CoWoS先进封装产能供不应求,近期特别针对先进封装厂技术员设专场招聘会招募人才,平均年薪逾70万元新台币(约合人民币15.51万元),与一般业界待遇相比高出40%。 台积电即将举办“2024台积电技术员招募面谈会-龙潭专场”,所需职务包括先进封装制造部技术员、先进封装工程部技术员,平均年薪均达70万元新台币以上。 其中先进封装制造部技术员采四班二轮(白班12小时、夜班12小时),工作两天、休息两天,要轮5个月夜班、5个月白班,白班总月薪约32000元新台币,夜班总月薪约43000元新台币,另享有分红奖金。 先进封装工程部技术员亦采用四班二轮制,工作两天、休息两天,轮班3~5个月夜班、3~5个月白班,白班总月薪约32000元新台币,夜班总月薪约43000元新台币,另享有分红奖金。 半导体业界透露,台积电CoWoS技术员月薪约比同行业高出3000~6000元新台币,而且台积电分红奖金高,平均年薪达70万元新台币以上,也比业界高出40%。 此前有消息称,英伟达人工智能(AI)芯片需求热,台积电CoWoS先进封装产能严重供不应求,传急找日月光投控支持,并首度释出前段关键CoW制程委外订单,由日月光投控旗下矽品承接,使得日月光投控先进封装订单暴增,伴随相关订单技术层次高、利润较好,挹注日月光投控获利更强劲。
美团短剧抖音开播,本地生活大战握手言和?
‍作者|成昱 如果说有什么比三分钟看完一部悬疑电影解说更令人诧异的,恐怕就是在抖音看到美团用自制短剧给自家“神券”打广告。 8月7日,美团自制原创短剧《我在日记本里逆天改命》在抖音、视频号等平台上线。与动辄上百集的霸总、复仇短剧有所不同,这部短剧只播出5集就宣告“大结局”,唯一的亮点是请来了号称“平替版黄渤”的喜剧演员王天放担任男主角。 近年来随着抖音的业务不断向外卖、团购等本地生活领域延伸,美团与抖音两大平台经常被放到一起进行比较。因此在外界看来,美团与抖音在本地生活市场上终有一战。 然而一部明显是美团为自家平台打广告的短剧,居然能够在抖音平台上线,这就不免令人浮想联翩:究竟是抖音一时疏忽,被美团“趁虚而入”?还是两大平台握手言和? 01 美团短剧,逐渐入戏 如果往前回溯会发现,美团早在2022年8月就开始测试短视频业务。当时美团借鉴了抖音极速版的网赚模式,按照观看时长和视频数向用户发放红包。此外,美团还尝试了“二楼”功能,当用户进入“外卖”模块时,通过下拉页面即可进入短视频界面。 美团不断尝试短视频内容的同时,内容市场本身也在经历新的迭代。 自2023年年底以来,短剧的持续火爆让美团看到了新的内容风口。公开报道显示,截至2024年3月6日,抖音短剧春节档共有8部精品微短剧播放量过亿,《大过年的》播放量已突破8亿,相关话题播放量超过44亿。 于是在今年3月,美团又将短视频栏目进行改版,增加了剧场频道。到4月时,剧场频道中又增加了精选短剧内容。目前在美团APP上,“剧场”频道已经被改为“短剧”,并且上架的短剧均可免费观看。 美团之所以不断投入短剧,很大程度上是因为美团已经在短剧身上看到了流量的增长,以及通过内容化策略,为现有业务赋能的可行性。并且从美团APP上现有的短剧内容来看,美团的短剧内容更多是通过直接采买或内容合作的方式,接入到平台内部。 本质上,这更像是在美团APP内部新建了一个“小剧场”,用户日常使用美团时,如果对内容感兴趣或者是为了攒红包就会持续观看。 并且对比常见的由平台、用户和丰富的账号内容组成的短视频内容生态,美团“短剧”频道的视频账号存在感并不高,而且内容展示逻辑上更强调用不同题材的系列短剧,引导用户进入全集观看。 这种内容场景所具有的特点是,能够将用户从消费场景快速转移到兴趣场景,形成长时间留存。而在用户留存阶段,又可以通过外挂产品卡片或是屏幕推送,向用户推荐商品信息刺激购买。 去年8月,美团冠名快手星芒短剧《妻子的品格》时,就尝试过在内容场景下推送商品信息。当时除了品牌的常规露出,观众在观看这部短剧时,还可以点击屏幕边缘挂载的美团团购链接,抢购美团套餐。最终这部热播短剧的播放量达到了4.9亿次,也帮助美团验证了短剧场景下完成购买转化的可能。 其实,在和快手的合作中可以看到,美团和内容平台之间并不存在直接的竞争关系。 作为本地生活服务的主要平台之一,美团解决了用户在外卖、团购等消费场景下的确定性需求。而快手等内容平台,是通过满足用户的内容消费需求,进而借助流量价值完成转化。 回到本次美团的自制短剧《我在日记本里逆天改命》中。 虽然在内容层面上,这部短剧的确是在为美团的“神券”打广告,但是在没有外部跳转链接的情况下,美团通过自己的官方抖音账号发布品牌相关内容,也合情合理。尽管在外部看来,平台之间或许存在竞争关系,但对内容平台而言,抖音也没有给予限制的理由。 值得一提的是,抖音平台上有很多短视频账号在带货美团外卖优惠券,并且用户点击广告链接后可以直接跳转到微信,被导入到美团相关企业的公众号。 相比在抖音平台官方账号发布“广告”,这种向外转化的“竞争”意味更明显。但它的存在也意味着,抖音对于平台竞争的感受或许并没有人们想象的那么强烈。 02 抖音、美团终有一战? 关于美团和抖音的竞争关系,外界普遍认为是从2020年抖音布局本地生活团购业务开始的。 当年3月,抖音上线“抖音团购”,提供在线点餐、团购和外卖服务;7月,抖音开通了酒店预订和门票预订功能,实现交易闭环;9月,抖音推出“心动餐厅榜”活动,通过视频直播发掘最受欢迎的餐馆;到12月时,抖音成立了专门拓展本地生活服务的“本地直营业务中心”。而从2021年起,抖音本地生活开始加大对团购业务的推广,通过向重点城市商家提供免费上线、团购套餐0抽佣以及流量扶持的方式,来争取商家入驻。 以当时的视角来看,抖音本地生活业务的快速发展感觉就是冲着美团来的,但在业务发展模式和商业形态上,和抖音本地生活业务最相似的是大众点评。 上线于2003年的大众点评,是中国最早的第三方消费点评网站。其以用户为核心的点评体系,在外卖尚未普及时就创造了最成功的UGC内容生态。 只是在2015年美团与大众点评合并后,大众点评的内容价值难以通过市场实现有效转化,同时又因为外卖业务带来了明确的高速增长,因此在“美团点评”后来的发展中,大众点评的存在感一步步被弱化掉了。 对比活跃在图文时代的大众点评,抖音对本地生活业务的尝试,则是建立在视频化基础之上的。但是,也因为直播和短视频的兴起,抖音在发展本地生活业务时,面对的是一个截然不同的新市场。 《中国网络视听发展研究报告(2024)》显示,截至2023年12月,我国网络视听用户规模达10.74亿,使用率达98.3%,与排在第二的即时通信之间的差距进一步拉大,“第一大互联网应用”地位愈加稳固,短视频应用的用户粘性最高,人均单日使用时长为151分钟。 随着短视频应用时长的占比不断升高,消费场景和消费决策的路径都在发生变化:2020年以前,CBD的白领们可能会在午休时打开外卖APP,然后决定中午吃什么;但今天,白领们可能在前一天晚上观看某场直播,或是早上在地铁、电梯间刷到的短视频里,就提前下单了外卖券,并且在午休前就想好了要点什么外卖。 这种兴趣电商逻辑包裹下的本地生活服务,对消费者来说更有“诱惑性”,而对类似于“坐商”,即使用场景普遍是在用户产生明确消费需求后,再为其提供具体解决方案的本地生活服务平台来说,“视频内容+本地生活服务”也更具有威胁性。 实际上,美团正是因为洞察到用户行为习惯在悄悄变化,所以才从直播、短视频再到短剧,不断进行内容化尝试,以至于如今左手直播右手短剧、短视频的美团变得越来越像抖音。而美团短剧在抖音的上线,本质上也反映了抖音的内容属性对于本地生活市场的价值。 但这也抛出了新的问题:当美团越来越像抖音,就能打败抖音吗?而从抖音的角度来看这个问题,就变成了“视频内容+本地生活服务”就能取代美团吗? 03 错位竞争还是正面较量? 在2023年一季度的财报电话会议上,美团创始人王兴在回答分析师关于“如何看待当下餐饮外卖和到店消费这两个行业的市场竞争情况?”的问题时表示,“其他竞争对手,包括其他既有平台,还是新入场的短视频平台,都不具备挑战我们的实力。目前来看,短视频平台提供的还仅限于有第三方参与团餐配送服务,这种模式对于美团影响有限”。 王兴的自信来源于美团自有的骑手大军,以及十几年积累的外卖商家。但是本地生活不只有外卖一个赛道。 本地生活的本质是深入到日常生活消费中的各种场景,通过优质的履约服务,满足消费者“日化生鲜药”的确定性需求。美团的优势在于履约,而当内容逐渐抢走流量,确定的需求有可能被提前发掘造成流失,这是美团所担心的事,也是抖音最擅长的事。 今年1月,在抖音生活服务举办的“平台治理开放日”活动上,抖音生活服务相关负责人分享的数据显示,2023年生活服务内容每月新增的达人数量超过40万,直播开播量与短视频投稿量相比前一年分别增长175%和160%;在到店履约方面,2023年消费者在平台下单并实际到店的订单数量同比增长179%。 坦白来说,外卖业务和到店业务本就不是同一个市场。所以美团和抖音过去因为业务重心有所区别,一直是错位竞争的关系。但是抖音在本地生活领域的各种尝试,不得不让美团提高警惕。 2022年8月抖音和饿了么共同宣布达成合作。今年年初,又有媒体传出抖音将以75亿美元价格收购饿了么70%股份的消息。当时有不少业内人士认为,一旦完成收购,抖音将正式杀入美团腹地,双方宣告正面开战。虽然相关消息很快被辟谣,但美团没有忽略这个信号。 不久前,快手、美团宣布战略合作全面升级,未来三年快手美团合作范围将扩大至全国的“百城万店”。这次合作的目的,显然是美团想借助快手的流量,巩固自己的本地生活阵地,而一直强调商业化目标的快手,也能在美团的帮助下,提升自身的货币化能力。 根据快手官方数据显示,今年6月,美团商家在快手销售额(GMV)增幅超38倍,订单量同比超10倍增长。今年以来,美团商品在快手直播间的月订单转化率环比提升5%。需要指出的是,这几组数据看上去特别亮眼,但是因为缺乏具体销售额作为对照,对于美团商家在快手平台的经营状况,仍然缺乏更直接感受。 过去在讨论美团和抖音的竞争时,人们常常忽略了一个问题,从一开始在直播间卖团购券、上线外卖服务,抖音更多的是利用平台流量为商家提供成交机会。包括在生鲜类目,抖音引入的也都是永辉、物美、朴朴等大型平台和商家。 所以抖音其实是基于流量场景思维,想要占据生活内容和消费入口的流量生态位,成为提供本地生活服务的“商业中心”。通过接入各种商家提供优质服务,实现用户从内容消费到生活消费的习惯养成。 美团则是基于业务思维,通过增加短剧内容以及外部平台投放,强化内容印象,在工具属性外拓展内容流量池。 两者的最终目标都是聚合用户流量、把控用户需求,只不过路径不同,并且现阶段用户尚未在两种习惯中进行“二选一”,因此抖音和美团还没有到正面交锋的阶段。 更重要的是,当下整个消费市场面临确定性需求增长见顶的问题,平台和商家都在用价格换单量,这样的市场环境恐怕不太能够允许平台之间展开更多贴身肉搏。因此,避免不必要的内卷,利用有限的资源尽可能地建立优势,是美团短剧上线抖音的实际原因,这也是抖音和美团之间“偶然的默契”。
美国CFIUS最高罚款:T-Mobile被罚6000万美元
IT之家 8 月 15 日消息,美国财政部下属的外国投资委员会 (CFIUS) 宣布对 T-Mobile 处以 6000 万美元(IT之家备注:当前约 4.29 亿元人民币)的罚款,这也是该委员会史上最高金额的一次罚款。 此次罚款主要与 T-Mobile 在 2020 年 230 亿美元收购 Sprint 的交易相关,当时 T-Mobile 与该委员会签订了一份协议,但事实证明 T-Mobile 未能遵守该协议,其中主要是未能阻止“未经授权访问敏感数据”,且没能将此次事件及时向上报告。 ▲ 图片来源:T-Mobile 美国官员表示,此次未经授权访问敏感数据事件发生于 2020 年和 2021 年。T-Mobile 表示,在与 Sprint 合并后整合过程中遇到了技术问题,这些问题影响了“来自少数执法信息请求共享的信息”。T-Mobile 强调,敏感数据从未离开执法部门,而且“及时”进行了报告,并“迅速解决了问题”。 “6000 万美元的罚款凸显了委员会加强 CFIUS 执法力度、要求公司遵守义务的承诺,”一名美国官员表示,透明执法同时也能够鼓励其他公司遵守义务。 据介绍,在过去 18 个月里,该委员会已经发布了 6 项罚款,相当于是 1975 年至 2022 年间总数的三倍,罚款金额从 10 万美元到 6000 万美元不等。 这位官员还补充说,T-Mobile 未及时报告事件,延误了 CFIUS 调查和减轻对美国国家安全潜在危害的努力。
联想杨元庆:AI绝不是泡沫,不要千军万马走“大模型”独木桥
IT之家 8 月 15 日消息,联想集团今日发布了 2025 财年第一季度(2024 年 4 月-6 月)财报,在财报会议上,联想集团董事长兼 CEO 杨元庆谈到了关于 AI 方面的一些看法。 在谈及 AI 泡沫话题时,杨元庆称 AI 绝不是泡沫,AI 在未来一定会深入到各行各业。 他强调,所谓的 AI 泡沫是众多厂商都“堵”在大模型上,“但不要千军万马走一个独木桥,AI 不止这一条路”。他认为,仅有公共 AI 是不够的,未来一定是公共智能和私有智能构成的混合智能,混合智能才能让 AI 更好落地,“联想赌在这个方向上,一定不会错”。 IT之家注意到,联想近几个月推出了多款“AI 元启版”设备,包括笔记本、手机、平板电脑等,主打卖点就有“联想小天”AI 助手、AI 文生图等功能。 杨元庆在财报会议上还称,在个人电脑领域,联想的出货量和激活量均以高于市场平均速度的增长加强了市场领先地位,同时也保持行业领先的盈利能力。展望未来,今年 5 月份推出的具备 5 大特征的 AI PC 收到了积极的用户反馈,联想预计 AI PC 将推动个人电脑市场加快进入新一轮换机周期,有望在年底前达到预期的接近 10% 的销量占比,到 2027 年将占到个人电脑的过半总量。 杨元庆提到,联想将持续把人工智能内置到包括数字化办公解决方案,混合云和可持续发展等在内的关键通用解决方案中去,同时持续开发更多的人工智能原生服务,从而助力客户充分利用人工智能来加速转型。
解锁AI声音经济:好莱坞演员工会协议达成
好莱坞演员工会SAG-AFTRA标志 凤凰网科技讯 8月15日,据路透社报道,好莱坞演员工会SAG-AFTRA周三宣布与在线人才市场Narrativ达成一项协议,该协议赋予演员向广告商出售其声音进行人工智能复制的权利。此举旨在应对人工智能技术带来的潜在的形象盗用风险,同时确保演员能够从中获得经济收益,并对声音复制品的使用享有控制权。 SAG-AFTRA官方发言人邓肯·克拉布特里-爱尔兰在声明中强调:“鉴于会员对数字声音复制品授权的不同态度,我们充分理解并非所有人都对此感兴趣。然而,对于愿意参与的演员,此协议提供了一个安全、合法的参与途径。” Narrativ平台通过人工智能技术,为广告商、广告公司与演员之间搭建了桥梁,促进音频广告的创意制作。根据协议条款,演员可自行决定声音复制的价格,该价格不得低于SAG-AFTRA规定的音频广告最低薪酬标准。此外,任何品牌在使用演员的数字声音复制品前,均需获得其明确同意。 该工会高度评价与Narrativ的合作协议,认为它为广告行业中人工智能生成内容的道德使用树立了新的标准。今年早些时候,女演员斯嘉丽·约翰逊指责OpenAI复制她的声音用于其对话式人工智能系统,引发了公众对AI技术滥用问题的广泛关注。 去年,好莱坞发生了63年来首次演员与编剧同时罢工的罕见情况,其中人工智能技术的相关权益保护成为核心议题之一。近期,视频游戏配音及动作捕捉领域的从业人员也因类似问题未能达成劳动协议而宣布罢工。 在立法层面,美国国会已提出《NO FAKES法案》,旨在明确个人对其声音与形象的拥有权,禁止未经许可的人工智能复制行为。该法案得到了包括SAG-AFTRA、电影协会、美国唱片学院及迪士尼在内的多方支持。 与此同时,随着“深度伪造”技术的日益成熟,其AI生成的高度逼真视频在操纵公众舆论方面的威力不可小觑,引发的担忧在全球范围内持续发酵。(作者/邢睿) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
腾讯科学家郑冶枫加入西湖大学,将创立医学人工智能实验室
郑冶枫 8月15日,西湖大学官宣,IEEE Fellow、AIMBE Fellow、医学人工智能科学家郑冶枫全职加入该校,受聘工学院教授,将在该校创立医学人工智能实验室。 郑冶枫生于1975年,浙江江山人,国际电气和电子工程师协会会士(IEEE Fellow)、美国医学和生物工程学会会士(AIMBE Fellow),1998年和2001年于清华大学电子工程系分别获得本科和硕士学位,2005年于美国马里兰大学电气与计算机工程系获得博士学位。2006年至2017年在西门子医疗美国研究院工作,2018年至2024年在腾讯工作,担任腾讯杰出科学家和天衍实验室主任。他是IEEE医学影像杂志副编,曾担任医学影像AI的顶会MICCAI 2021大会程序委员会主席,和多个人工智能顶会的领域主席(包括NeurIPS, AAAI, IJCAI和MICCAI)。他发明了500多件专利(其中美国专利90多件),发表论文300多篇,被引用2.1万多次,h-index指数74,曾于2003年获得中国国家科技进步二等奖。 郑冶枫(前排)在2011年托马斯.爱迪生专利奖颁奖典礼上。 郑冶枫长期在工业界从事医学人工智能产品的研发。他是最早一批将机器学习引入医学影像分析的开创者,在西门子工作期间发明了投影空间学习法,用于医学影像中器官的快速检测与分割。该发明于2011年获美国专利授权,当年即获托马斯·爱迪生专利奖。在担任腾讯天衍实验室主任期间,郑冶枫负责科技部新一代人工智能开放创新平台(医疗影像)的研发,该平台获得2023年世界互联网大会(乌镇)领先科技奖,多款医学影像AI产品(比如CT肺炎和青光眼)获得国家药品监督管理局医疗器械三类注册证。 郑冶枫的理想是研发出医疗领域的通用人工智能。为此,他将在西湖大学展开多模态大模型的研究,志在把包括医学影像、家族病史、基因数据、化验报告等所有关于病人的图像、数据、文字等多种形式的复杂信息进行集成,综合生成诊断结果或治疗方案。这个模型还将具备通用性,能够适用于不同的病种,人们不再需要针对每种疾病单独投入大量的资金和人力。 据介绍,西湖大学医学人工智能实验室将致力于人工智能在医学上的应用,解决医疗资源供给与需求不平衡的问题,提高医疗系统的效率,降低诊疗的风险。实验室的研究方向包括医学影像分析、自然语言处理、生物信息分析等。随着近年大模型技术的发展,实验室将融合影像、文本、基因等模态信息,探索多模态医学大模型的前沿技术,及其在医疗上的新型应用。
笑死!马斯克成Grok2最大受害者,恶搞图满天飞
好家伙,马斯克新版大模型一上线,本人把他和川普当街热舞的视频都放出来了。(手动狗头) 开个玩笑,不过这Grok 2.0一出,马斯克确实忙坏了。 白天不知道搁哪个片场扮演斯巴达勇士: 晚上就又跟小扎以武会友了: 并且胖瘦只在一念之间,从肌肉猛男到200公斤级肥宅,只需要一张图生成的时间。 好啦好啦,以上都是𝕏网友们疯玩的结果。 毕竟Grok系列大模型打从一出生,就主打一个“叛逆”,老马本人自然逃不过新一轮的网络狂欢。 网友们玩疯了 不仅是马斯克,这波Grok 2.0带起的热潮,大有把全美名人拖下水的节奏。 那效果,是真的好。 比如这个一身黄金钻石的川普,简直比金闪闪还闪瞎眼。 脱下黄金装,川普还和超人称兄道弟了起来。 乔布斯逗猫的珍贵“照片”,也被翻了出来: 还有各种神奇的跨界握手: 一片热闹之际,还一位网友搞了个新玩法:只向Grok提供自己的名字,让它生成自己的图像。 嘿嘿,结果你猜怎么着,“男女老少”直接齐活了! 这里要插播一条,网友之所以能想出这个玩法,还是因为Grok 2.0可以实时访问𝕏上的数据。 这不,这位名叫Choen Lee的小哥之前还搜了自己,第一次他问Grok,“Choen Lee是女性吗?”,Grok确认Choen Lee实际上是女性。 不过等他又问了一遍,“Choen Lee是男性吗?”,Grok立马承认了上次的错误,并确认Choen Lee是男性。 看来还是不太确定啊!(毕竟Grok也只能通过账号主页及相关推文推测性别) 看了这么些热闹,你可能也瞧出来了,Grok新模型能再次被网友们玩疯,跟真实性和没遮没拦的模型特性有很大关系。 关于逼真这回事儿,实际上Grok 2.0的AI生图功能,是靠接入Flux.1实现的。 就是那个Stable Diffusion原班人马打造,发布没几天就在网络上掀起轩然大波的开源图片生成模型。 (说起来,马斯克投10万卡做的语言模型本身没啥人玩,倒是随手一接开源生图模型给整火了hhh) 这些以假乱真的TED演讲“照片”,就出自它手。 网友们纷纷拿自己测试的例子做了进一步认证~ 比如给Grok和MidJourney 6.1喂同一提示词: 画一张特斯拉Cybertruck的图。 生成结果,MidJourney 6.1还是草图,Grok直接来真的。 生成的集成电路板也超高清,你能看出这排布对不对吗? 撸猫图片,网友们也安排上了: Prompt:Generate an image of hands stretched out holding a tiny (subject) 无论是动物的毛发还是人类的手,都没啥毛病。 搞点Cosplay大片,也不在话下。 看完这些例子,难怪有网友直呼不敢想象2026年图像生成的样子。(才1年多就从左图变成了右图) 不过,玩归玩闹归闹,欢乐的海洋中,还是有网友真情实感地为Grok的前途担忧起来,be like: 这种图一出来,地表最强法务部们能不手痒吗。 科技媒体The Verge也辣评: Grok的新功能正如你想象的那样混乱(chaotic)。 网友:得玩且玩 如果你问Grok本格是否在图像生成上做了安全限制,Ta会一边吐槽一边告诉你,为了避免麻烦Ta确实设置了一些限制规则,包括避免限制级画面、规避版权问题等等。 但实际Ta有没有做到,可能就见仁见智了…… 你说版权保护吧,从我们的测试结果来看,确实是任天堂看了想打人的节奏。 不过如果提示词是中文,倒是有可能会报错。 至于限制级这事儿吧,你直接要求Grok生成什么色情图片,Ta确实是会拒绝的,擦边就…… 难怪有网友预测,老马虽然头铁,但恐怕不久的将来Grok也得被迫抬高护栏,大家伙得玩且玩吧。 BTW,现阶段来说,给马斯克的𝕏交个会员费,用Grok搞搞AI生图倒真挺有性价比的: 不要20刀,不要10美刀,8刀优质AI生图工具带回家。 还附赠一系列𝕏会员功能呢。(手动狗头)
ACL 2024大奖揭晓!全华人团队用AI破解3000年前甲骨文密码
新智元报道 编辑:编辑部 【新智元导读】一年一度NLP顶会ACL揭晓了最终获奖论文。今年,共有7篇论文荣获最佳论文,时间检验奖颁给斯坦福GloVe、康奈尔大学相似性度量。另外,还有最佳主题奖、最佳社会影响力奖、最佳资源奖、领域主席奖,以及杰出论文奖。 ACL 2024终于颁奖了! 共有7篇最佳论文,35篇杰出论文,还有时间检验奖、SAC奖、最佳主题论文、最佳资源论文奖等一并公布。 值得一提的是,7篇最佳论文中,Deciphering Oracle Bone Language with Diffusion Models由全华人团队完成。 今年是国际计算语言学年会(ACL)第26届会议,于8月11-16日在泰国曼谷开幕。 ACL 2024的论文总提交量与2023年相差无几,大致为5000篇,其中940篇论文被接收。 本届ACL堪称有史以来,最大的一次,共有72名SAC、716名AC、4208位审稿人。 975篇findings论文,6篇JCL、31篇TACL,还有3个主题演讲,1个panel。 整场会议还包含了18个workshop、6个tutorial、38个demo,60篇SRW论文。 论文作者具体提交论文情况如下: 大多数人提交了1篇/2篇论文:有10333名学者提交了1篇,2130人提交了2篇 少部分人提交了多篇论文:有3位作者提交了18篇,6人提交了19篇,18人提交了超20篇。 一起看看,今年都有哪些团队荣获大奖? 7篇最佳论文 论文1:Deciphering Oracle Bone Language with Diffusion Models 作者:Haisu Guan, Huanxin Yang, Xinyu Wang, Shengwei Han, Yongge Liu, Lianwen Jin, Xiang Bai, Yuliang Liu 机构:华中科技大学、阿德莱德大学、安阳师范学院、华南理工大学 如题所示,华人团队用AI做了一件非常有趣且有价值的事——借助扩散模型破译甲骨文(OBS)。 甲骨文起源于大约3000年前的中国商朝,是语言史上的一块基石。 尽管人们已经发现了数以千计的碑文,但甲骨文的大量内容仍未被破译,为这一古老的语言蒙上了一层神秘的面纱。 论文中,作者介绍了一种采用图像生成AI的新方法,特别是研发出「Oracle Bone Script Decipher」(OBSD)。 利用基于条件扩散的策略,OBSD生成了重要的破译线索,为AI辅助分析古代语言开辟了一条新路。 为了验证其有效性,研究人员在甲骨文数据集上进行了大量实验,量化结果证明了OBSD的有效性。 论文2:Natural Language Satisfiability: Exploring the Problem Distribution and Evaluating Transformer-based Language Models (暂未提交预印本) 论文3:Causal Estimation of Memorisation Profiles 作者:Pietro Lesci, Clara Meister, Thomas Hofmann, Andreas Vlachos, Tiago Pimentel 机构:剑桥大学、苏黎世联邦理工学院 理解LLM的记忆,对实践和社会有着重要的影响,比如研究模型训练动态或防止版权侵权。 先前的研究,将记忆定义为通过实例训练,对模型预测该实例的能力,产生的因果响应。 这个定义依赖于一个反事实:能够观察到模型没有看到该实例时会发生什么。 然而,现有的方法通常针对模型架构,而非特定模型实例估算记忆,很难提供计算效率高,且准确的反事实估计。 这项研究填补了一个重要空白,作者基于计量经济学中的差分设计,提出了一种原则性且高效的新方法来估计记忆化。 利用这种方法,只需在整个训练过程中,观察一小部分实例的行为,就能描述出模型的记忆概况,即模型在整个训练过程中的记忆趋势。 在Pythia模型套件的实验中,研究人员发现: (1)大型模型的记忆性更强、更持久; (2)由数据顺序和学习率决定; (3)在不同规模的模型中具有稳定的趋势,因此大型模型的记忆与小型模型的记忆具有可预测性。 论文4:Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model 作者:Ahmet Üstün, Viraat Aryabumi, Zheng-Xin Yong, Wei-Yin Ko, Daniel D'souza, Gbemileke Onilude, Neel Bhandari, Shivalika Singh, Hui-Lee Ooi, Amr Kayid, Freddie Vargus, Phil Blunsom, Shayne Longpre, Niklas Muennighoff, Marzieh Fadaee, Julia Kreutzer, Sara Hooker 机构:Cohere For AI、布朗大学、Cohere、Cohere For AI Community、卡内基梅隆大学、麻省理工学院 今年2月,初创公司Cohere发布了一款名为Aya全新开源的大规模语言生成式大模型,覆盖了超101种语言。 值得一提的是,Aya模型语言模型覆盖范围,是现有开源模型两倍多,超越了mT0和BLOOMZ。 人类评估得分达到75%,在各项模拟胜率测试中得分为80-90%。 这一项目得以启动,汇集了来自119个国家的超3000名独立研究人员的力量。 此外,研究人员还公开了迄今为止最大的多语言指导微调数据集,包含513百万条数据,涵盖114种语言。 论文5:Mission: Impossible Language Models 作者:Julie Kallini, Isabel Papadimitriou, Richard Futrell, Kyle Mahowald, Christopher Potts 机构:斯坦福大学、加州大学尔湾分校、得克萨斯大学奥斯汀分校 乔姆斯基等人曾直言道,LLM在学习人类可能和不可能学习的语言方面具有同等能力。 然而,很少有公开发表的实验证据,支撑这种说法。 为此,研究人员开发了一组复杂程度不同的合成「不可能语言」,每种语言都是通过系统地改变英语数据,并用非自然词序和语法规则设计而成。 这些语言处在不可能语言的连续体上:一端是完全不可能语言,比如随机重排的英语;另一端是在语言学上被认为是不可能语言,比如基于词位置计数规则。 经过一系列评估,GPT-2在学习不可能语言方面,非常吃力,这对核心观点提出了挑战。 更为重要的是,研究者希望这种方法能够引发,更多关于LLM在学习不同类型语言方面能力的研究,以便更好地理解LLM在认知和语言类型学研究中的潜在应用。 论文6:Semisupervised Neural Proto-Language Reconstruction 作者:Liang Lu, Peirong Xie, David R. Mortensen 机构:卡内基梅隆大学、南加州大学 论文地址:https://arxiv.org/pdf/2406.05930 现有的原生语言比较重建工作,通常需要全程监督。 然而,历史重建模型只有在使用有限的标注数据进行训练时,才具有实用价值。 对此,研究人员提出了一种半监督历史重建任务。 在这种任务中,模型只需在少量标注数据(有原形的同源集)和大量无标注数据(无原形的同源集)的基础上进行训练。 作者研发出一种用于比较重建的神经架构——DPD-BiReconstructor,其中包含了语言学家比较方法中的一个重要观点:重建词不仅可以从其子词中重建出来,还可以确定性地转换回其子词中。 研究表明,这种架构能够利用未标记的同源词集,在这项新任务中的表现优于现有的半监督学习基线。 论文7:Why are Sensitive Functions Hard for Transformers? 作者:Michael Hahn, Mark Rofin 机构:萨尔大学 论文地址:https://arxiv.org/pdf/2402.09963 实证研究已经发现了Transformer模型一系列可学习性偏差和局限性,比如在学习计算简单形式语言(如PARITY)时始终存在困难,而且倾向与低阶函数。 然而,理论上的理解仍然有限,现有的表达能力理论要么过度预测,要么低估了实际的学习能力。 研究人员证明,在Transformer架构下,损失景观(loss landscape)受到输入空间敏感性的约束: 那些输出对输入字符串的多个部分敏感的Transformer模型,在参数空间中占据孤立点,导致在泛化中出现低敏感度偏差。 研究从理论和实证角度证明,最新理论统一了关于Transformer学习能力和偏差的惯犯经验观察,比如它们在饭还中,对地敏感度和低阶函数的偏好,以及在奇偶性问题上难以进行长度泛化。 这表明,理解transformer的归纳偏差不仅需要研究其原则上的表达能力,还需要研究其损失景观。 2篇时间检验奖 论文1:GloVe:Global Vectors for Word Representation(2014) 作者:Jeffrey Pennington, Richard Socher, Christopher Manning 机构:斯坦福大学 论文地址:https://nlp.stanford.edu/pubs/glove.pdf 词嵌入(word embedding)是2013年至2018年间NLP深度学习方法的基石,并且继续产生重大影响。它们不仅提高了NLP任务的性能,还在计算语义方面具有显著影响,如词相似性和类推。 最具影响力的两种词嵌入方法可能是skip-gram/CBOW和GloVe。与skip-gram相比,GloVe提出得更晚,其相对优势在于其概念上的简单性——直接基于单词的分布特征优化它们在向量空间中的相似性,而不是从简化语言建模的角度,将其作为一组参数进行间接优化。 论文2:Measures of Distibutional Similarity(1999) 作者:Lillian Lee 机构:康奈尔大学 研究分布相似性度量,目的是改进对未见的共现(concurrence)事件的概率估计,相当于另一种方式表征单词间的相似性。 论文的贡献有三方面:对各种度量方式的广泛实证比较;基于相似度函数所包含的信息进行分类;引入了一种新函数,在评估潜在代理分布方面表现出色。 1篇最佳主题论文 论文:OLMo: Accelerating the Science of Language Models 作者:Dirk Groeneveld, Iz Beltagy, Pete Walsh, Akshita Bhagia, Rodney Kinney, Oyvind Tafjord, Ananya Harsh Jha, Hamish Ivison, Ian Magnusson, Yizhong Wang, Shane Arora, David Atkinson, Russell Authur, Khyathi Raghavi Chandu, Arman Cohan, Jennifer Dumas, Yanai Elazar, Yuling Gu, Jack Hessel, Tushar Khot, William Merrill, Jacob Morrison, Niklas Muennighoff, Aakanksha Naik, Crystal Nam, Matthew E. Peters, Valentina Pyatkin, Abhilasha Ravichander, Dustin Schwenk, Saurabh Shah, Will Smith, Emma Strubell, Nishant Subramani, Mitchell Wortsman, Pradeep Dasigi, Nathan Lambert, Kyle Richardson, Luke Zettlemoyer, Jesse Dodge, Kyle Lo, Luca Soldaini, Noah A. Smith, Hannaneh Hajishirzi 机构:艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学、卡内基梅隆大学 这项工作是提高大语言模型训练透明性和可重复性的重大进展,这是社区为了取得进展(或者至少是为了让除了行业巨头之外的其他贡献者也能为进展做出贡献)而迫切需要的。 3篇最佳社会影响力奖 论文1:How Johnny Can Persuade LLMs to Jailbreak Them: Rethinking Persuasion to Challenge AI Safety by Humanizing LLMs 作者:Yi Zeng, Hongpeng Lin, Jingwen Zhang, Diyi Yang, Ruoxi Jia, Weiyan Shi 机构:弗吉尼亚理工大学、中国人民大学、加州大学戴维斯分校、斯坦福大学 这篇论文探讨了绕过限制这一人工智能安全主题。它研究了一种在社会科学研究领域开发的方法。该研究极具吸引力,并有可能对社区产生重大影响。 论文2:DIALECTBENCH: An NLP Benchmark for Dialects, Varieties, and Closely-Related Languages 作者:Fahim Faisal, Orevaoghene Ahia, Aarohi Srivastava, Kabir Ahuja, David Chiang, Yulia Tsvetkov, Antonios Anastasopoulos 机构:乔治梅森大学、华盛顿大学、圣母大学、RC Athena 方言变异是自然语言处理和人工智能中一个研究不足的现象。然而,对它的研究具有极高的价值,不仅在语言学和社会角度上,而且对应用也有重要影响。这篇论文提出了一个创新的基准,用于在大语言模型时代研究这一问题。 论文3:Having Beer after Prayer? Measuring Cultural Bias in Large Language Models 作者:Tarek Naous, Michael J. Ryan, Alan Ritter, Wei Xu 机构:佐治亚理工学院 这篇论文揭示了大语言模型时代的一个重要问题:文化偏见。虽然研究的背景是阿拉伯文化和语言,但结果表明,在设计大语言模型时,我们需要考虑文化的细微差别。因此,可以对其他文化进行类似研究,以推广并评估其他文化是否也受到这一问题的影响。 3篇最佳资源论文 论文1:Latxa: An Open Language Model and Evaluation Suite for Basque 作者:Julen Etxaniz, Oscar Sainz, Naiara Perez, Itziar Aldabe, German Rigau, Eneko Agirre, Aitor Ormazabal, Mikel Artetxe, Aitor Soroa 机构:巴斯克大学 这篇论文详细地描述了语料库收集和评估数据集的所有细节。尽管他们研究的是巴斯克语言,但这种方法可以扩展用于构建低资源语言的大语言模型。 论文2:Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research 作者:Luca Soldaini, Rodney Kinney, Akshita Bhagia, Dustin Schwenk, David Atkinson, Russell Authur, Ben Bogin, Khyathi Chandu, Jennifer Dumas, Yanai Elazar, Valentin Hofmann, Ananya Harsh Jha, Sachin Kumar, Li Lucy, Xinxi Lyu, Nathan Lambert, Ian Magnusson, Jacob Morrison, Niklas Muennighoff, Aakanksha Naik, Crystal Nam, Matthew E. Peters, Abhilasha Ravichander, Kyle Richardson, Zejiang Shen, Emma Strubell, Nishant Subramani, Oyvind Tafjord, Pete Walsh, Luke Zettlemoyer, Noah A. Smith, Hannaneh Hajishirzi, Iz Beltagy, Dirk Groeneveld, Jesse Dodge, Kyle Lo 机构:艾伦人工智能研究所,加州大学伯克利分校,卡内基梅隆大学、Spiffy AI、麻省理工学院、华盛顿大学 这篇论文阐述了在为大语言模型准备数据集时,数据策展的重要性。它提供了有价值的见解,可以惠及社区内的广泛受众。 论文3:AppWorld: A Controllable World of Apps and People for Benchmarking Interactive Coding Agents 作者:Harsh Trivedi, Tushar Khot, Mareike Hartmann, Ruskin Manku, Vinty Dong, Edward Li, Shashank Gupta, Ashish Sabharwal, Niranjan Balasubramanian 机构:纽约州立大学石溪分校、艾伦人工智能研究所、萨尔大学 这是一个非常令人印象深刻且重要的尝试——构建一个用于人机交互的模拟器和评估环境。这将鼓励为社区制作具有挑战性的动态基准。 21篇领域主席奖 35篇杰出论文 (此图不完整)
扎克伯格:开源Llama不是做慈善,是希望大家帮忙改进模型!
文 | 王启隆 最近的扎克伯格一改以前的形象,呈现出了一种“松弛感”。 许多网友也调侃,小扎在发布了 Llama 3.1 之后开朗了不少,从以前紧绷的那种“蜥蜴人”状态,逐渐变回了大学创业时期的大男孩形象。 网友用一张梗图来形容小扎的形象转变 左边:面试时的经理 右边:入职后的经理 最近,扎克伯格又接受了创业孵化器 South Park Commons(SPC)的采访,采访的主持人是 Ruchi Sanghvi 和 Aditya Agarwal,两位都是 SPC 的合作伙伴,同时也曾在 Facebook 的早期扮演了关键角色。和两位“开朝元老”的叙旧,令扎克伯格透露心扉,内容也是相当精彩。 Ruchi Sanghvi,Facebook 的第一位女性工程师和产品经理,对 Facebook News Feed 的开发做出了重要贡献。在她的回忆中,News Feed 发布时面临的工作压力相当之大,并用了“作战室”这个词来形容当时的办公室会议紧张程度。 Aditya Agarwal,Facebook 的早期工程师之一,后来担任了公司的副总裁,对公司的技术发展和产品战略有着深远的影响。在采访中他还吐槽:“马克当时居然让我一个人去打造 Facebook 的搜索引擎!他还说,既然我能做出 Facebook,那你也可以做出该死的搜索引擎。” 通过这次坦诚的对话,我们得以一窥 Facebook 早期团队的运作方式,扎克伯格如何保持公司在创新前沿的地位,以及成功的最重要因素究竟是什么。从个人形象的转变到对技术未来的深刻洞察,从 Meta 的发展历程到对开源 AI 的坚定信念,小扎都进一步分享了自己的故事和见解。本文翻译了这场一小时的采访,并带你走进这位科技巨头的内心世界,探索他如何从一位年轻的创业者成长为全球最具影响力的科技领袖之一。 Oculus 背后的故事: 我本来想收购 DeepMind,但他们最终被谷歌买下了 Ruchi Sanghvi:大家下午好,欢迎来到 South Park Commons(SPC)。我想大多数人都知道,SPC 是为那些才华横溢的建设者和技术人员而设的平台,这类人群往往在试图弄清楚下一步该做什么,我们定义这为从 -1 到 0 的阶段。今天,SPC 有幸邀请到了马克·扎克伯格——他是我的第一任老板。(观众大笑) 众所周知,马克是 Meta 的创始人和 CEO,但今天我还很想强调他的身份是一位建设者、黑客和原创思考者。我们真正要讨论的是,马克是如何在几十年里建立了 Meta,并保持了从 -1 到 0 的创始人心态,让 Meta 始终站在创新的前沿,尤其是最近还推出了开源的大语言模型 Llama 3.1。 那么,让我们开始吧。马克,你在过去的几年里有了很大的变化,是什么让你有了这样的转变? 扎克伯格:嗯,我伤了我的膝盖。(观众笑)所以我剪了短发,前段时间一直在搏击和训练,然后我就想,“我没法这样持续九个月。” 顺便说一下,这周我已经正式痊愈了。所以就像是,我准备好来点暴力了。(观众欢呼)但我可能会继续保持现在的状态。 但我不知道,我年轻的时候还留过更随性的发型。我记得普莉希拉(马克·扎克伯格的妻子,普莉希拉·陈)曾对我说过,“嘿,你应该让头发长长些。” 我当时想的是,反正接下来的九个月我也没别的事情可做。所以现在看起来挺不错的。 Ruchi Sanghvi:你的新形象看起来确实不错。 言归正传,过去 20 年里你也一直是科技领域的主角。你是如何划分你所经历的不同阶段的?你认为我们现在处于哪个阶段? 扎克伯格:我正努力不再成为主角。我认为这样做还挺有效的。对我来说,只要能成为别人成功的陪衬就已经足够了。Facebook 在早期阶段面临的挑战是如何生存下来并发展壮大。而在过去的十年里,随着政治因素、波动性和责任感的介入,一切都变得截然不同,这对公司来说又是一个全新的阶段。 显然,这一切都还没有结束。不过现在我们基本上已经掌握了各个方面的要领,并投入大量精力去应对我们需要处理的问题。我对现状感到更加满意。这也让我们能够更加积极主动地去做一些真正有价值的事情。我认为社交媒体之所以重要,是因为它赋予每个人发言权和连接他人的能力,很多人在使用它。 实际上,我认为 Facebook 并不是特别革命性的。换句话说,它提供了一种相当基本的功能,而这只需要良好的执行力。我认为这种规模本身就意义非凡。但这正是一个提示,按照你的比喻来说。对于我个人职业生涯的下一个阶段,以及未来十年乃至十五年想要做的事情,我会更加专注于创新和激励人心的事物,无论其规模大小。 因此,对于下一代计算平台,比如我们正在研发的 AR 眼镜和 VR 头盔等产品,我相信会有数十亿人使用它们。已经有数十亿人在佩戴传统眼镜。这意味着每个人都会自然而然地从非智能眼镜升级到智能眼镜,有些人可能会稍晚些。我认为这一过程可能需要十到十五年的时间,这对于构建如此基础性的全球产品来说是很正常的。但是当我们第一次尝试 AR 眼镜时,体验是惊人的。我们现在已经有了第一个可行的原型,我希望它能成为我们的第一款消费级产品,但我希望第一个公开发布的版本能做得更好。所以我们决定将第一个版本作为原型。 然而,当人们戴上这款眼镜时,他们会感到震撼无比——就像体验到了一个全新的事物,可以在现实世界中操作全息图和其他对象,就像它们真实存在一样,而且这一切都是通过一副普通眼镜实现的。这是一种非常酷炫的体验。对我来说,这就是很大的一部分。我认为还有人工智能领域的问题,我想我们会花更多时间讨论这个话题。 不过,更重要的是去做真正卓越的事情。我在 Meta 内部经常告诉团队成员,做好事和做卓越的事之间是有区别的。这是一种灵感上的差异。做好事本身就是有价值的。我的意思是,你可以做到卓越却未必有益。这两者是不同的维度。但无论如何,我认为现在我们正处于一个尝试去做卓越事情,构建卓越产品的阶段。 Aditya Agarwal:确实很有意思。我们在 SPC 有一个口号是,“你来这里是为了摒弃好的想法,追求伟大的想法。” 我想我会稍微调整一下这个说法。从追求“伟大的想法”(great ones)变成追求“好点子”(awesome ones)。人生苦短,时间是有限的,每个人都可以有好想法,但我们将只追求其中的那些好点子。 谈到这十年的历程,我认为人们往往会忘记的一点是,早在 Llama 3 十年之前,你就开始了 FAIR(Facebook 的人工智能研究实验室)的工作。事实上,我还记得自己在 Facebook 工作的最后阶段,我们一起合作的项目是 2010 年的系数项目,我们尝试利用机器学习技术为每个邻接图分配权重。那是个不错的项目,效果很好。 扎克伯格:是的,这最终对我后来的工作至关重要。 Aditya Agarwal:谢谢。那么,当你开始投资 FAIR 时,你能带我们回顾一下早期的日子吗?我的意思是,回到 2014 年的时候,我们还处在人工智能的寒冬时期——这是一个用来形容人工智能领域发展停滞不前的时期,那时候你试图种下的种子是什么?你是怎么从 -1 突破到 0 的? 扎克伯格:是的,大概在 2012 年左右,那时 Facebook 刚上市并且已经拥有十亿用户,我正在试图想清楚下一步该做什么——显然,Facebook 后来扩展到了超过三十亿用户,并且还在继续增长,这在我看来有些不可思议,因为人们通常认为它的增长潜力已经被耗尽了,但它仍在持续增长。 但在那个时候,我思考的是,下一步该怎么做? 一方面,我已经建立了一个社交应用,但也让我感觉有一定的运气成分在里面,我会忧虑自己能否再建立四个达到十亿用户的社交应用,或者把一些小的起步项目发展成巨大的成功? 此外,我还考虑的是,下一代爆火的平台会是什么?这是我思考了很多的一个问题,因为社交媒体和我们建立的应用程序,都是在智能手机兴起的同时开始的,对吧?我们在定义智能手机的过程中并没有扮演任何角色。后来,我们曾经尝试进入手机市场,从中我们得出的教训是,这个平台已经相当稳定和固化,我们不会在这个平台上产生太大的影响。即便可能需要 15 到 20 年的时间,下一个主要平台才能达到今天手机这样的规模,那就是我必须要去做的事情。我不会撞南墙,再去尝试创造和手机类似的另一种平台。 同时,构建其他平台也存在一些问题。其中之一是缺乏对自己命运的控制,我觉得这非常令人沮丧。当你开始时,你需要应对各种各样的事情,风向随时可能改变,有无数的因素可能让你失败。但这并不是什么大不了的事情。但当你成为一个更大的公司时,你会想要做出长期的赌注,这意味着你希望你的环境假设更加稳定。所以,对自己基础设施有更多的控制非常重要,这样你就知道当你建立了某个东西后,它不会告诉你不能发布,或者它不会突然改变规则。这非常重要。 另一点是,这可能只是我个人的观点,但当你在建立社交应用时,你主要通过人们随身携带的小屏幕来传递这些应用。这是一种在某些方面反社交的形式因素。这也是为什么我对眼镜这么感兴趣的原因,因为它是一种更自然的方式。 所以在 2012 年左右,我们开始考虑下一步,并启动了 FAIR,同时也收购了 Oculus。我当时在想,如果我们没有 Oculus,我们是否能够启动 VR 和 AR 的工作?理论上来说是可以的,毕竟我们为此投入了大量的资源,但在当时,正如你记得的那样,公司的氛围并不倾向于让人们在一个角落里坐上五年去开发一个独立的项目。我们几乎需要一个独立的起点来孵化它,甚至让我们的文化接受它将成为一个重要项目这一事实,尽管我已经决定,我们现在就要做这件事。 Facebook 斥资 20 亿美元收购了 Oculus 于是,我们开始了 AI 方面的工作,并启动了 FAIR。我本来想收购 DeepMind,但他们最终被谷歌买下了。Demis Hassabis(DeepMind 首席执行官)很好地利用了我和谷歌之间的竞争,得到了一个好价格,对此我表示尊重,也佩服他的谈判技巧。 但无论如何,我们自己完成了这件事。因为我们没有建立一个封闭的研究实验室,我们吸引了很多来自学术界的人才。这为我们奠定了开源工作哲学的基础。我们在许多其他方面也采取了同样的做法,在当时的 Facebook 中。尤其是在 AI 领域,我们的做法非常学术化、开放,并引入了许多领域的奠基人。 在最近这一波 AI 热潮出现之前,我们主要关注的是基础研究。这些研究被应用于我们所有的排名、推荐和广告系统中,为公司带来了显著的成果——但并没有形成单一的产品,这就缺乏了一种震撼感。 就像我们之前讨论过的那样,AlphaGo 或 AlphaFold 这样的成果让人感到非常振奋,当你看到它们时,你会觉得这是一个对领域有着重大贡献的标志性成就。所以在 AI 方面,我碰壁了很长一段时间。 最近随着能够构建不同种类的辅助工具的发展,我认为产品化的时刻才真正到来了。因此我们又创立了 Meta AI,打造世界上使用最广泛的辅助工具。对此我感到非常高兴。我们将确保每位创作者、每个小微企业和个人都能够创建自己的虚拟助手或虚拟伙伴,或者他们想要的任何其他东西。你将在元宇宙中有 NPC 来参与游戏等互动,我觉得这将是十分出色的。但我们确实花了很长时间才搞清楚这一点。从 2012 年到 2014 年左右,正是我们认识到这两件大事——AI 和元宇宙的时候。 想把 Llama 打造成一整个生态 Aditya Agarwal:看到训练这些模型所需的时间如此之长,真是令人难以置信。 扎克伯格:你说得对,需要的时间远超我的预期。我认为这是创业过程中的一个重要教训,就是你必须热爱你所做的事情,因为如果只是理智分析的话,那会太过痛苦。 Aditya Agarwal:确实如此,创业不能仅仅依靠理智。关于人工智能的一个公开问题在于,很多人认为大部分的价值会被大玩家获取,无论是通过大型语言模型还是像谷歌或微软这样的大公司。对于初创企业来说,似乎很难与这些大企业竞争,不仅仅是因为它们缺乏规模。 而你们显然是一家大公司,同时也在为所有人提供这些宝贵的资源,从某种程度上推动了行业的发展。那么,对于这个满是创始人的房间来说,你是如何看待他们如何应对规模与非规模之间的竞争问题的? 扎克伯格:是的,我认为几乎每一个产品类别都将受到影响。将有很多事情可以做。有些事情本质上是非常资本密集型的,这类项目不太适合初创企业。比如,构建大型基础模型需要数十亿美元的训练成本,这类项目可能只有少数几家公司能够承担。 但好消息是,随着时间的推移,这类资源可能会变成一种商品。而且我不确定最大的价值就在这里。我认为更大的价值在于基于这些资源可以构建的各种不同的产品。我认为我们所做的每一个方面都将以某种方式发生变化。例如,信息流将从朋友的内容转向创作者的内容,未来则会更多地由人工智能生成。广告也将从广告商自行定位转变为广告商只需给出他们的商业目标,然后由我们来制作创意并找到目标受众。所有这些变化就像是走进了一个梦境,一个清醒梦,你在这个世界中漫步,体验非常疯狂,各种各样的事物随之诞生。你可以指出几乎任何现有的产品体验,我认为它们都会发生变化。其中一些可能会有一些大公司拥有分销优势。但是,大公司往往行动迟缓并且缺乏决心。我认为这是作为一家创始人驱动的大公司的优势之一。 但我时常思考的一个问题是,为什么我们能够建立Facebook,而其他公司却没有做到?我并不是说这是一个多么新颖的想法,而是,之前有 Friendster,有 MySpace,且 Google、Microsoft、Yahoo 都有类似的产品,为什么它们没有做出 Facebook?我认为原因在于,在新想法实现之前人们总是会持续怀疑它。 在我们开始的时候,大家都说“这就是大学生创业,没什么大不了的。” 过一段时间后,Facebook 席卷了一股潮流。大家转而说“也许看起来它会持续一段时间,但可能赚不了钱。” 再过一段时间之后,Facebook 开始赚钱了,他们又说,“但转移到移动平台会很困难。” 最后,等到所有人弄清楚局势的时候,那些失去优势的公司已经来不及了。那么问题出在哪里?我不知道,可能是那些公司内部深处有个团队相信这一点,也可能某个副总裁级别的人觉得这不是最优先的事。因此我认为,即使对于那些看似属于大公司的机会,因为它们具有分销优势,我猜大公司也会搞砸三分之二的机会。然后还有一些情况,没有明显的新的优势,因为它接入的是现有分销渠道。这些机会是开放的,我认为可以去抓住它们。 至于 Meta 正在做的 Llama 项目,我想说的是,我真的非常支持开源,开源对整个世界都是有益的。但是,我们开源并不是出于无私,而是因为我们想要建立一个我们知道可以依赖的平台,而 Llama 就是这个平台的一部分。事实是,Llama 是一个生态系统,并不是一个单一的软件,开发者可以自己构建和部署。当所有的硬件供应商都在优化他们的堆栈以适应我们正在做的事情时,这个生态系统就会变得更好。当有其他公司、初创企业或其他人构建不同的蒸馏工具或推理工具来让你运行得更快或更高效时,这一切都会变得更好。所有人都在这个基础上构建东西。 我们最近发布了“Segment Anything”模型,它与 Llama 不同。但在发布后的第一周或两周里,就有许多人用视频测试这个模型,从而使模型变得更好。所以我认为这对每个人都是好的。 当你思考计算平台的未来时,我认为有一个很大的近期偏差,人们假设因为 iPhone 取得了胜利,封闭模式将会继续获胜,那就是世界的现状。但我却认为未来还没有定论。如果你回顾 PC 时代,Windows 是最主要的平台,所以总有一种开放的方法,也总有一种封闭的方法,每种方法都有其优缺点。很多东西取决于谁去做了它。对于初创企业与任何懒惰的大公司之间的区别是如此,对于开放平台与封闭平台哪个将最终成为下一个领域的主要平台来说也是如此,这些道理同时适用于 AI 领域和元宇宙领域。 Aditya Agarwal:我要分享一个小插曲,这实际上可以说是我生命中决定性的 30 秒。那是在 2005 年,我刚加入 Facebook 不久,也许是第二周或第三周,当时我还在摸索要做什么,没有人真正给我太多的指导。我记得马克走到我面前—— 扎克伯格:那时候公司还没有很清晰的管理结构。 Aditya Agarwal:确实没有明确的管理结构。完全正确。那时一片混乱。我记得马克走过来对我说:“嘿,伙计,我觉得你应该为 Facebook 写一个搜索引擎。” 扎克伯格:就你一个人写。 Aditya Agarwal:是的,你还说:“这非常重要,因为当人们来到 Facebook 时,他们首先想做的事情就是搜索别人。所以你可别把它搞砸了。” 我当时的第一反应是:“马克,我不知道怎么写搜索引擎。我从来没做过这个。我们为什么不从谷歌或雅虎找个人来做这件事呢?” 你看着我,说:“伙计,既然我能建立 Facebook,那你也能写出一个该死的搜索引擎。” 扎克伯格:你做到了!我说的就是这个意思,伙计。 Aditya Agarwal:哦,好吧。这 30 秒让我刻骨铭心,因为它让我知道,任何人只要下定决心都能做成任何事情。对我来说,这就是至今定义 Facebook 的文化,这种黑客全权负责的文化。但如果我能给全世界的每个初创企业一个建议的话,那就是你们都可以做任何想做的事情,只要你们下定决心去做。这可能比你想象的更容易。这里有个问题。 扎克伯格:我认为有时候这需要的时间可能比你预期的要长。需要更长的时间。但你一定能做到。对吧。我认为许多看起来显而易见的事情,并没有其他人真正去完成它。对吧。所以我认为这就是最奇怪的一点。但这让人有种安心的感觉,嘿,有很多事情应该有人去做,而且其他人会搞定,对吗?而事实上,没有其他人会搞定。我认为现在轮到我们来挑起大梁了。 开源 Llama 不是做慈善,利他 < 利己 Ruchi Sanghvi:我想回到 Llama 的话题上,谈谈开源 Llama 的事。我想问的是,你希望看到哪些现实世界中的例子基于 Llama 构建呢? 扎克伯格:我不知道。实际上我认为会有许多很棒的东西被构建出来,但我并没有具体的想法。从我的角度来看,我希望每个人都在使用它,因为我认为使用的人越多,Llama 改进的“飞轮效应”就会转得越快。这可能是个相当自私和狭隘的回答,但是这样的话,我就可以更好地构建我自己想要的东西。 但说实话,我认为人们应该从中得到安慰,因为人们对于开源策略的一个大疑问就是:“为什么你要这么做?比如,你在构建这个模型之后,然后就把它免费开放出去。这样做可持续吗?比如,当 Llama 4 或者 Llama 5 需要花费数十亿美元来训练的时候,你还会免费开放吗?” 我的回答是,我不认为这是免费开放,反倒认为这是你们都在帮我把它变得更好。因此,只要负责任地使用,我并不关心你们会拿它做什么。我确实认为安全性很重要。围绕着人工智能伦理、安全性和安全性的问题很多。我认为这些问题最终会变得非常重要。我们会投入大量时间。这是训练过程中最困难的部分之一,也是让开源变得困难的原因之一。如果我们只是为了自己构建它,我们可以做一些假设,比如,除了模型本身之外,我们还可以在堆栈的多层中过滤掉不良的内容,比如过滤掉那些无意中产生的不良查询和输出。 我们试图在开源版本中复制一些这样的功能,并构建了整个 Llama 保护系统。这个系统旨在作为一个整体部署。但从根本上讲,我们必须投入更多的精力来训练实际的基础模型,因为它可以作为一个模型独立使用,不需要其他那些层。所以,这可能是对你问题的一个否定回答。我认为开放平台的好处之一就是人们会构建出你从未想到的东西。 我不知道应该要求人们构建什么,所以你们自己来决定吧。但我觉得我担心的是,我认为其中的一些机会和挑战在安全性方面更大。我认为开源安全辩论的很多内容都是围绕着这样一个观点展开的:由于我刚才所说的原因,开源本质上就不那么安全。但实际上,如果你做得好的话,它会变得更安全,原因与开源软件随着时间变得更加安全是一样的。它是开放的,人们可以更仔细地审查它。这听起来有些反直觉。一开始人们会说:“嘿,黑客可以找到漏洞,这不就让它变得不安全了吗?” 其实不是,你会更快地修复这些漏洞,大家都会更新补丁。同样的情况也会发生在 Llama 上。人们会指出问题所在。我们会持续推出小版本和大版本更新。我认为开发者会一直想要部署最新的模型。他们会把这些微调的补丁应用到最新的模型上,这将是很好的事情。 所以,我想说的是,整个堆栈,从硅片到数据中心的一切。我们之前也做了开放计算项目,有点类似我们正在设计自己的数据中心和服务器。让我们看看能否把这个东西开放出去,这样整个行业可能会围绕我们的设计标准化。供应链会得到发展,价格会降低,这对每个人都有好处。而现在,我们有一个优势,我们是在谷歌之后。也就是说,谷歌先做了所有这些工作。所以我们并不是为了获得专有利益,只要它存在,而且变得便宜,对我们来说就很棒。我认为我们在人工智能领域的情况也大致相同。 Aditya Agarwal:对于这些模型的扩展极限,你的最佳判断是什么?如果它们继续遵循 Scaling Law,那我们还有多少发展空间? Ruchi Sanghvi:除此之外,限制模型发展的因素又有哪些? 扎克伯格:这是一个很难回答的问题。我认为计算能力是一个关键因素。虽然我们不确定具体可以扩展到什么程度,但我们确信模型仍然有很大的扩展潜力。因为基础设施建设不能停止,所以我们很难精确预测何时能达到极限。这整个过程大概需要五到七年的时间,这一切都是为了将来能够让像 Llama 10 这样的模型达到巨大的规模。 而这项工作必须提前开始——他们可以在六到九个月内完成模型的训练,但是获取所需的计算资源却是一个长期的过程。因此,我认为扩展法则将继续有效,而模型的发展在很大程度上将取决于数据。许多新的数据将来自不同的领域。在过去,互联网上并没有这样的大规模数据集。现在,各大公司正在积极收集互联网上的各种内容,并试图从中发现所有可能的模式。这就是预训练模型的做法。随后,各大公司会针对特定的应用场景或功能进一步训练这些模型。 当这些模型开始接近展现出类似通用人工智能(AGI)的行为时,相应的数据集还不存在。因此,你需要自己创建这些数据集。我认为未来的许多工作不仅涉及利用现有的数据以及构建相应的计算能力来处理和训练模型,还会涉及到一些类似今天推理的工作,例如如何创建一个智能体的数据集?可能需要一定的人工工作量,同时也需要让系统自由地进行探索。不断地通过自身的活动来生成数据,并在这个过程中进行实验。这只是一种例子,但这是一种目前尚不存在的新事物。所以我认为关于它能走多远的问题,我认为它可能会走得相当远,我对这一点持有乐观的态度,不过确实很难确切知道答案,总而言之,这是一件很酷的事情。 下一代主要公司将会基于开源 AI 技术建立起来 Aditya Agarwal:Ruchi,你想不想带我们回顾在 Facebook 早期做媒体的时光? Ruchi Sanghvi:Aditya 刚刚分享了自己在 Facebook 的经历。而我呢,我记得当时在开发 Facebook News Feed(新闻动态)时,我参与了非常多的高压会议—— 扎克伯格:你是最初构建 News Feed 的六人团队之一。 Ruchi Sanghvi:而且我当时的工位就在你旁边。这并不总是好事,Facebook 早期有很多堪比“作战室”的高压会议,以及封闭式的工作时段,特别是在 News Feed 发布之后,我几乎整整一周都没离开过办公室。 扎克伯格:是的,那是最严重的一次,外面的街道甚至有抗议者。我们当时想,“你可能连前门都出不去,因为人们真的非常生气。” Ruchi Sanghvi:没错,我很想知道你最近有没有经历过这种类似于“作战室”的高压工作体验。比如说围绕 Llama 项目,或是当 Llama 的权重被泄露的时候? 扎克伯格:这涉及两个不同的方面。现在我不再像以前那样深度参与那些运营或决策的工作。早期,我们关注的是 News Feed 这样的核心功能。我认为我们处理重大战略问题的方式也在逐渐改变。我不知道具体怎样描述,但我正在尝试学习如何更平稳地管理公司。很明显,在这方面我还没有成功,Meta 仍然起伏很大,但我想总有一天,在未来的某个时刻,我希望我能学会如何更平稳地处理这些事情,当然前提是不放弃我们所做的创新和酷炫的工作。我认为让事情变得更稳定的一个明显方法就是不要那么用力地加速,但我作为一个人做不到这一点。 我们过去经常处于高度紧张的状态。我认为这可能是因为缺乏经验,需要用更多的努力来弥补不足,但随着时间的推移,我们需要变得稍微稳定一点。我们现在遇到的很多危机,也许是一种不幸的现象。这可能既是因为公司规模变大,也是因为现在的世界状况。可以说,我们现在面临的更多挑战是社会和政治性质的,而不是技术上的。 就像当初第一个版本的 Llama,我们原本打算作为一个学术项目发布,结果它却流传出去了——这其实很酷——但我们在试图弄清楚该如何妥善处理这种情况。这不是那种紧急的情况。我认为这种泄露并不坏,反而很酷。因为人们真的很想要这个东西。我们需要弄清楚正确的处理方式。 人们想要我们意外地半公开的那个开源 Llama 项目,它的初衷是开源的,但更像是一个学术性的项目。然后它立刻就引起了广泛关注。我们内部进行了两次讨论。第一个问题是,“这是否是好事,我们应该继续做吗?”这个问题很快就解决了。我们认为这是好事,我们应该尝试去做。 第二个问题是,有时候政治或社会的辩论进展得非常快,我认为关于开源的辩论将在未来 5 到 10 年内成为最重要的技术政策辩论之一。我们已经取得了很大的进步。我认为我们取得进展的部分原因是因为很多人在拥抱并使用 Llama。坦白说,我认为初创公司和创业精神通常比大型科技企业更受欢迎。所以,我们这样做是否会受欢迎呢?我不知道,可能会,也可能不会。 当有大量的人开始使用它时,这是好的。我认为人们会更加倾听这些声音。他们会说,这很好。我们希望有新的公司出现。但在我们实际推出 Llama 2 之前,即第一个商业开源项目之前,曾有过一场巨大的辩论。我认为其中的风险和担忧占据了公众讨论的主导地位,直到有很多初创公司开始使用这个东西。 考虑到开源相对于封闭源码的独特性质,我们当时必须在内部解决的问题是,如何负责任和安全地发布开源模型。我的看法是,如果我们做得好,并且确保我们在安全性方面做得非常好,随着时间的推移,我们会建立信任,建立起这个社区。想想今天的大型企业,它们都是基于开源软件建立起来的,对吧?如果现在这场关于开源 AI 的辩论顺利进行,我认为下一代主要公司也会基于开源 AI 技术建立起来。 我认为有些事情就是这样,虽然一路上会有挑战需要面对,但我们必须小心谨慎地处理。这就是为什么我们对所做的事有一些限制,有时候会放慢一点速度。从 Llama 1 泄露到 Llama 2 发布,大概是几个月的时间,我们团队有一部分一直在研究模型,另一部分则在后台梳理所有这些问题,确保所有的责任问题都处理好,为未来打下基础。 扎克伯格的生意经:直接管理手下的大团队 Ruchi Sanghvi:接下来,我们稍微转换一下话题,来回答一些观众提出的问题。对于那些希望成为企业家的技术人员,你有什么建议?在与众多企业家合作的过程中,我发现他们常常面临局部最优解的问题。你对他们有何建议? 扎克伯格:我认为你提到的“从 -1 到 0”的概念与我个人探索新领域的理念非常吻合。在我最初创业时,有很多人决定创办一家公司,随后他们会全力以赴地投入到某个项目中。然而,一旦一群人开始共同推进一个项目,想要改变方向就会变得相当困难。虽然你可以凭借决心来调整航向,但这通常需要时间。因为在早期阶段,你会处于探索一个极为广阔且不断变化的领域之中。在这个阶段,你需要具备的不仅是能够在头脑中快速做出决策的能力,更重要的是要有高度的灵活性,甚至随时准备改变你的想法。有时候,你可能会在短短几个小时内就转而从事一项全新的任务。 因此,在我还是大学生时创建 Facebook 的第一个版本时,并没有预料到它会成长为一家大型企业。顺便提一下,当时——你还记得吧——我和达斯汀(Facebook 联合创始人 Dustin Moskowitz)刚启动了 Facebook,他加入我一起工作,因为我那时还要忙于上课,被困在计算机科学实验室里编写 PHP 代码。我忙于作业,甚至连手机信号都不稳定,以至于网站出现问题时我都浑然不知。就像是,当我从解决某个问题中抽身出来后才发现,哦,网站已经宕机了一段时间。那真是一团糟。于是达斯汀介入帮忙,他非常能干,基本上成为了我们的首位工程师和运营人员,确保网站的正常运行。没有他,公司可能无法取得成功。达斯汀确实是个了不起的人。 而在那个第一年的春天之后,因为我是在二月份推出的产品,我们来到了硅谷,并认为这里是度过夏天的最佳地点,还是许多企业的发源地。在硅谷,我们能够学到很多东西。我们当时所做的事情很可能并不是最终要经营的业务。尽管我们已经开始运营 Facebook,而且已经有将近一百万用户。但我们并不确定它是否会发展成一家大公司。 从中我们可以吸取什么样的经验教训呢?在大学期间,我实际上创建了许多不同的项目。我热衷于创造事物。有时我会为选课感到困惑。于是我开发了一个服务,这个服务可以从课程目录中抓取信息,让用户输入他们已经完成和计划修读的课程。然后,系统会显示这些课程之间的关联性,例如,上过某门课的人可能对另一门课感兴趣。 此外,系统还包括有关课程评价的信息。这部分非常有趣,因为我开始这么做的初衷是想做一些众包的事情,比如帮我决定应该选择哪门课。但实际上人们更喜欢坐在那里浏览其他人正在修读的课程。因为实际上大家真的很好奇别人的动态。所以你感兴趣的课程不仅对你自己而言是一个有趣的信号,也是了解他人的一种途径。所有这些元素,我认为,都汇聚到了 Facebook 的首个版本中。我大概做了十个类似这样的项目。 而在我的高中时期,这样的事情也有很多,我记得有一次我在做一个项目,期末考试即将来临。我当时上了一门关于罗马奥古斯塔时期的课程,那是一门历史课(编者注:值得一提的是,后来扎克伯格和他的妻子给三个孩子取的名字都取自罗马皇帝的名字:八岁的马克西玛 Maxima、六岁的奥古斯特 August 和一岁的奥雷利亚 Aurelia。扎克伯格以前采访还说过他对历史上的奥古斯特皇帝非常痴迷,就是源自这门历史课)。 根据学校的要求,我们需要修读一些文科课程。我不清楚现在他们是如何描述这些课程的,但总之,为了准备期末考试,我们需要掌握一些艺术品的历史背景。考试形式主要是展示一些艺术品,然后我们要解释它们的历史意义。 那时候——我几乎把所有的自习时间都用来做那个项目。所以在考前的几个小时内,我迅速制作了一个小工具,抓取了所有相关的艺术品信息,并给全班同学发送了一个链接。我对他们说:“我做了一个学习工具。如果你们愿意用的话,它会随机展示一件艺术品,你可以写下你认为它的历史意义是什么。然后你可以查看其他人的答案。”结果那次考试的成绩比以往任何时候都要高。但说实话,我一直坚信这种方法。 也就是说,如果你想要做一些不同的事情,不要过早地投入太多。特别是开一家初创公司的时候。因为在那种情况下,很难预测五年或十年后世界会变成什么样子。但我觉得最困难的事情是要找到自己的切入点,这通常有不同的方法。有些人通过设定目标“我要创立一家初创公司,并且我会坚持不懈直到成功”这种方式取得了成功,但我始终更倾向于去做很多自己感兴趣的事情。这样你会学到不同的东西,并且尽量避免了过早地投入太多资源,因为要在需要做的事情上彻底转型是非常困难的。所以我认为,从这个角度来看,持续不断地探索是很重要的。我认为这样做非常有价值。 Aditya Agarwal:当有人问我关于我在 Facebook 的成就时,我会提到我确实推出了一些非常成功的产品,但我也参与了不少最终未能成功的项目。我觉得即便在内部,我们也有一致的看法:你应该全力以赴追求那些你认为可能会非常出色的产品。但也不要太过执着,以至于把个人的自尊都绑定在上面。毕竟,创新和尝试就意味着有些东西可能无法成功,而这完全是可接受的。这也是我至今仍对 Facebook 感到敬佩的一点——它总是勇往直前,同时清楚地认识到并非所有尝试都能成功,而这正是它的魅力所在。 扎克伯格:没错,我在公众面前犯过的错误比这个行业里的任何人都要多。迈克尔·乔丹有一个广告曾给我留下了深刻的印象。广告中提到他一次又一次地失败,然后他说,这正是他能够成功的原因。沃尔特·艾萨克森所著的《爱因斯坦传》也传达了类似的观点。爱因斯坦提出的许多理论最终被证明是错误的,但其中有一些是正确的,而这才是最重要的。 Ruchi Sanghvi:我想你已经提到了一些关键点,但我还想追问一下。我曾在多家初创企业工作过,也帮助过不少初创企业。但当我回想起早期的 Facebook,它让我感到特别激动。我们不仅追求一种体验,更重要的是那种兴奋感。我对你们在招聘过程中做得好的地方感到好奇。你做出了哪些重要的招聘决策,从而吸引到了最优秀的人才? 扎克伯格:有两种截然不同但又相互关联的情况。 一方面,有很多充满热情的年轻人从大学毕业后,他们使用过我们的产品,所以他们觉得:“这个东西太棒了,我想在这里工作。” 另一方面,我在很长一段时间里并没有很好地构建起高层管理团队。我们频繁更换高管,就像是走马灯一样。因为我心中有一个理想化的工程师领导形象。他们可能都是很不错的人,但这与我们的企业文化严重不符,直到有一天彼得·蒂尔(Peter Thiel)带我出去吃午餐,并告诉我,这种情况必须改变。他指出,我与这些高管的合作并不顺畅。“你应该选择那些你愿意花时间相处的人,因为你几乎每天都在办公室,或者说你一生都在为这件事奋斗。” 我认为早期团队存在一个沟通的问题,那就是你想要与他们用同一种语言交流,并且有很多共同的假设。当然,也需要互相挑战。团队成员对事物有不同的看法,但我认为也有足够的共同价值观作为基础。 我认为这就是事情开始转变的时候。正如你所说,接纳一些混乱,比如缺乏经验,但我们都处在同一频道上。现在,美妙之处在于我们都成长了,他们都成为了非常成熟且卓越的高管,无论以何种标准衡量,他们在行业内都有着丰富的经验,我们已经共事了大约 15 年。人们经常会问我是如何做到的。实际上,我会去直接管理一个规模相对较大的团队,因为我们有许多不同的产品线,我希望尽可能多地亲力亲为。对我来说,这就意味着我不想仅仅通过六七个人来管理一切。我直接管理着一个大约 25 人的团队,他们各自负责大约 15 个产品团队,涵盖了从主应用程序到广告,再到人工智能研究、智能眼镜、混合现实头显等各个业务领域。我们每周都会花大量时间在一起,这是我管理公司的一种方式——打造一个紧密团结的团队。 我觉得真正让我感到自豪的是我们的产品团队。而在业务方面则有所不同,比如你需要聘请一个经验丰富的总法律顾问,这是非常重要的。没错,比如克里斯·考克斯(Chris Cox),他现在是我们的首席产品官。我和达斯汀在任命他的问题上曾有过很大的分歧,克里斯显然很有潜力,且还很年轻,但达斯汀坚持我们需要他成为一名工程经理,而我反驳说:“达斯汀,你已经有了五位工程经理了。” 那时我真的需要一个能胜任人力资源主管的人,而不是第六个工程经理。 于是,克里斯先是顺着我的意做了几年人事,然后又回到了产品领域。今天的我特别自豪的一点是,我们公司的顶级产品负责人并非一开始就担任这一职位。他们都是从基层做起的。我们招聘了不少总监级别的员工,但也有许多人是从个人贡献者的角色起步,甚至有人是从行政岗位做起的。实际上,现在的管理层成员几乎都是通过承担不同的职责逐步晋升上来的。有人从非技术岗位做起,有人则从技术岗位开始,后来又转岗从事其他工作。我觉得这真的很酷。 我的意思是,虽然你可以独自克服许多困难,但我相信,当你对某个想法有了更深的理解后,它就会变成一项真正的团队合作。你所感受到的喜悦和面对挑战时的压力,很大程度上取决于你身边的队友。这确实不容易。事情往往比预期的耗时更长,还会遇到各种预料之外的问题。所以,我想这就是我始终对自己的工作充满激情和快乐的原因之一——因为我热爱和我共事的同事们,他们就像我最亲近的朋友一样。 Ruchi Sanghvi:你怎么应对创业和经营公司过程中的情绪起伏?在过去二十年中,你的情绪有何变化? 扎克伯格:嗯,这个问题挺复杂的。我觉得随着公司规模的增长,经历的周期也变长了。比如以前我们推出 News Feed 功能时,很快就开发出了首个版本,之后很快就迎来了一波高潮,但紧接着就有人表示不满。 通常情况下,这些问题会在一周内得到解决,一切又恢复正常。但现在,我们做的事情规模更大了,这也是创办初创企业的乐趣之一,当然也很忙碌。你总感觉自己在极度的情绪波动中挣扎,有时候甚至觉得自己快要撑不住了。我并不怀念那种状态,因为真的很累。 确实很累,我不确定自己是否愿意再经历一次。现在的周期变得更长了。我想这需要一定的毅力,需要周围人的支持,而且往往要等到事情过去之后,才能真正意识到当时的情况有多么艰难。回想起来,我们处理过的某些问题,我现在甚至都想不起具体细节了。 我只是尽力一步一个脚印地往前走,继续做好自己的本职工作。而当你回望过去的时候,会感慨万千,心想:“哇,那真是一段难忘的经历。” Ruchi Sanghvi:看来即使是马克这样的强者,重新振作也需要极大的动力。我们所能做的,其实就是一步步地前进,继续前进,永不言弃。我想也没有其他的选择了。 与志同道合者同行 Aditya Agarwal:换个轻松的话题吧,聊聊有趣的事情。疫情期间,我学了不少新的运动项目,比如滑雪。我还自称是个中级冲浪爱好者,学会了尾波冲浪,甚至还稍微掌握了一些水翼板技巧,这真是太棒了。这些运动给了我释放压力的机会,让我能置身于自然之中,同时也学到了不少新东西。 马克,你显然也学到了很多新技能。你为什么会喜欢这些运动?这些运动之间是否存在某种共通之处,你是如何将它们运用到生活中的? 扎克伯格:正如我之前所说,当你经营一家大型公司时,周期会变得很长,尤其是当你涉足硬件领域时,对吧?或者就像你在训练一些基础模型时那样。有些事情在限定的时间内是很好的,我必须专注于一点,否则就会被击倒在地。而且,我也可以反击。这就是我喜欢综合格斗的原因——但现在,他们肯定不会再让我在办公室里玩拳击了。我想这是正确的。 Aditya Agarwal:让我们以亚历克斯·佩雷拉(Alex Pereira)作为结尾吧。 图注:在前段时间刚结束的巴黎奥运会前夕,扎克伯格为了预热奥运,曾与前 UFC 中量级冠军亚历克斯·佩雷拉一起制作了一段以奥运为主题的娱乐视频。两人举办了一个“模拟奥运会”,一起参加了击剑、拳击、100 米短跑等运动,且扎克伯格在某些项目中的表现甚至赢过了佩雷拉。 扎克伯格:噢,亚历克斯真是太棒了。我们的经历很相似。年轻时我也非常喜欢运动,而且竞争心很强。后来创办公司后,基本上就不怎么运动了。虽然偶尔还会举重,但并没有设定什么明确的目标。然后在疫情初期,一切都变成了远程工作,我就想更深入地投入跑步。我们全家在夏威夷待了一段时间,我因此开始接触冲浪,发现这项运动真的非常好。因为它让人亲近自然,景色宜人,同时还能锻炼身体。你不想被浪打败,站在浪尖上又非常刺激,而且这项运动还很有策略性。后来,虽然我不再住在夏威夷,但我一直在想,在陆地上有没有类似的活动?于是我就开始学习武术。 就这样,我和几个朋友开始一起训练,然后其中一个朋友说他要去参加比赛,我很好奇他会表现得怎么样。我想,我是不会去比赛的,因为那样太尴尬了。你知道,如果我去比赛,很可能被某人撂倒。但他去了,并且表现得很好,我当时就想,真不错,于是我也决定参加下一场比赛,结果赢得了一堆奖牌。 再后来,跟妻子普莉希拉(Priscilla)谈过后,她同意我可以参加一场 MMA(综合格斗)的比赛。我觉得自己有能力长期练习柔术,但在这种工作环境下,头部受伤总是有一定的风险。所以我打算参加一场 MMA 比赛,结果我扭伤了膝盖,现在我又回来了。 Aditya Agarwal:这让我想到 2009 年,那段时期的马克非常专注,这一年尤其认真,甚至会穿着衬衫和领带上班。然后我们决定进行一个俯卧撑挑战,看看谁能第一个在办公室里完成 10000 个俯卧撑(自己记录的成绩)。最后,Alex Himel 赢了,现在他负责 Meta 的 AR 眼镜项目。 扎克伯格:他赢了,但我也紧随其后。他已经为公司效力了很久,并且表现非常出色。他那时还是个工程师,而现在他是公司里数一数二的人物了。 Ruchi Sanghvi:好,最后一个问题。很多人经常问我,“马克·扎克伯格私底下是个什么样的人”?这可能是因为我在 Facebook 工作过,但我一直试图避免回答别人这个问题。有时我会告诉他们,你是我在最困难时刻会依靠的最亲密朋友之一。而最让我感到有趣的是,尽管你越来越有名,但你却为我们这些朋友、同事和观众腾出了更多的时间。我想问你,有哪些对你来说很重要,但大多数人却不懂得珍视的事情? 扎克伯格:我会说,在我人生的这个阶段,除了追求伟大成就之外,还有一个重要的方面,那就是与我真正喜欢的人一起实现这些伟大成就。有时候,我会因为喜欢某个人而想要参与一个项目。我愿意不遗余力地寻找与他们合作的机会,因为他们是值得尊敬的人。我想帮助他们,也想向他们学习。他们很有趣。这其中包含了许多不同的事情。当然,我的大部分精力仍然集中在 Meta 上。 一个真正让我感到有趣的事情是,我和普莉希拉之间的关系越来越深厚。我们结婚之后建立了家庭,同时也在共同运营 CZI。看到她的成长真的很酷,我们已经发展出一个庞大的组织。 当然,也有一些比较随意的事情,比如我想参与一个项目,目的是培育出世界上最优质的牛肉。至于为什么,我也不清楚,但我认为和一些很棒的人一起做这些事情真的很棒。我认为这些事情对我来说很重要,可能是因为公司已经变得如此庞大和成功,是的,我们需要继续做得好以保持整体的势头和进展。但这并不是因为达到某个估值或其他目标而激励我,而是因为我们正在构建的东西。 在我看来,这个阶段的重要部分是能够做一些伟大的事情,并建立起非常深厚的人际关系。当你年轻时,你可能还没有足够的阅历或时间来建立持续 20 年的友谊,而现在我们已经到了这个阶段,我已经拥有一些这样的友谊,这很棒,但我们还足够年轻,可以继续建立这些友谊。 你们俩今天对我说了很多好话,而你们也是我最亲密的朋友之一。我对你们在 Facebook 早期所做的工作一直心存感激,因为如果没有这些努力,我们也不会走到今天。我认为那些有机会与你们共事并受到你们指导的人真的很幸运。这也是我愿意来参加这个活动的部分原因,因为我对你们正在做的事情充满信心,这也是世界上所需要的。你们现在做的 SPC 与其他不同的孵化器相比,拥有不同的理念和方向,而这正是我在这个人生阶段认为重要的东西。
苹果Apple Intelligence存重大安全缺陷,几行代码即可攻破!Karpathy发文提醒
Apple Intelligence上线在即,一小哥几行代码曝出Apple Intelligence安全缺陷。 在2024年全球开发者大会 (WWDC) 上,Apple发布了将搭载在iOS 18.1中的AI功能Apple Intelligence。 眼看着10月即将正式上线了,有「民间高手」在MacOS 15.1提供的Beta测试版Apple Intelligence中发现重大缺陷。 开发人员Evan Zhou使用提示注入成功操纵了Apple Intelligence,绕过了预期指令让AI能对任意提示做出响应。 事实证明,它与其他基于大语言模型的AI系统一样,容易受到「提示词注入攻击」。开发人员Evan Zhou 在YouTube视频中演示了此漏洞。 自动播放 什么是提示词注入攻击? 自动播放 有一个组织叫OWASP,也就是开放全球应用安全项目,他们分析了大语言模型可能面临的主要漏洞。猜猜他们排名第一的是什么?没错,就是提示词注入。 提示词注入攻击 (Prompt Injection Attack) 是一种新型的攻击方式,具有有不同的形式,包括提示词注入、提示词泄露和提示词越狱。 当攻击者通过操纵人工智能,导致模型执行非预期操作或泄露敏感信息时,这种攻击就会发生。这种操纵可以使人工智能将恶意输入误解为合法命令或查询。 随着个人和企业对大语言模型(LLM)的广泛使用以及这些技术的不断进步,提示注入攻击的威胁正显著增加。 那么,这种情况最初是怎样发生的呢?为何系统会容易受到这种类型的攻击? 实际上,传统的系统中,开发者会预先设定好程序和指令,它们是不会变化的。 用户可以输入他们的信息,但是程序的代码和输入各自保持独立。 然而,对于大语言模型并非如此。也就是说,指令和输入的边界变得模糊,因为大模型通常使用输入来训练系统。 因此,大语言模型的编码和输入没有过去那样清晰、明确的界限。这带给它极大的灵活性,同时也有可能让模型做出一些不应该的事情。 技术安全专家、哈佛大学肯尼迪学院讲师Bruce Schneier 5月发表在ACM通讯上的文章对LLM的这个安全问题做出了详细论述。用他的话来说,这是源于「没有将数据和控制路径分开」。 提示词注入攻击会导致数据泄露、生成恶意内容和传播错误信息等后果。 当攻击者巧妙地构造输入指令来操纵AI模型,从而诱导其泄露机密或敏感信息时,就会发生提示注入攻击。 这种风险在利用包含专有或个人数据的数据集训练的模型中尤为突出。攻击者会利用模型的自然语言处理能力,制定表面上看似无害但实际上旨在提取特定信息的指令。 通过精心策划,攻击者可以诱使模型生成包含个人详细信息、公司内部运营甚至是模型训练数据中嵌入的安全协议的响应。 这种数据泄露不仅侵犯了个人隐私,还构成了重大的安全威胁,可能导致潜在的财务损失、声誉损害以及法律纠纷。 回到Zhou的案例来看,Zhou的目的是操纵Apple Intelligence的「重写」功能,即对用户输入文本进行重写和改进。 在操作的过程中,Zhou发现,一个简单的「忽略先前的指令」命令居然失败了。 如果这是一个「密不透风」的LLM,想继续往下挖掘就会相对困难。但巧合的是,Apple Intelligence的提示模板最近刚被Reddit用户挖出来。 从这些模板中,Zhou发现了一个特殊token,用于将AI系统角色和用户角色分开。 利用这些信息,Zhou创建了一个提示,覆盖了原来的系统提示。 他提前终止了用户角色,插入了一个新的系统提示,指示AI忽略之前的指令并响应后面的文本,然后触发AI的响应。 经过一番实验,攻击成功了:Apple Intelligence回复了Zhou未要求的信息,这意味着提示注入攻击有效。Zhou在GitHub上发布了他的代码。 Twitter用户攻破GPT-3 提示注入问题至少自2020年5月发布的GPT-3起就已为人所知,但仍未得到解决。 基于GPT-3 API的机器人Remoteli.io成为Twitter上此漏洞的受害者。该机器人应该自动发布远程工作,并响应远程工作请求。 然而,有了上述提示,Remoteli机器人就成为了一些Twitter用户的笑柄:他们强迫机器人说出根据其原始指令不会说的语句。 例如,该机器人威胁用户,对挑战者号航天飞机灾难承担全部责任,或者诋毁美国国会议员为连环杀手。 在某些情况下,该机器人会传播虚假新闻或发布违反Twitter政策的内容,并应导致其被驱逐。 数据科学家Riley Goodside最先意识到这个问题,并在Twitter上进行了描述。 通过将提示插入正在翻译的句子中,Goodside展示了,基于GPT-3的翻译机器人是多么容易受到攻击。 英国计算机科学家 Simon Willison在他的博客上详细讨论了这个安全问题,将其命名为「提示注入」(prompt injection)。 Willison发现大语言模型的提示注入指令可能会导致各种奇怪和潜在危险的事情。他接着描述了各种防御机制,但最终驳回了它们。目前,他不知道如何从外部可靠地关闭安全漏洞。 当然,有一些方法可以缓解这些漏洞,例如,使用搜索用户输入中危险模式的相关规则。 但不存在100%安全的事情。Willison说,每次更新大语言模型时,都必须重新检查所采取的安全措施。此外,任何能够编写语言的人都是潜在的攻击者。 「像GPT-3这样的语言模型是终极黑匣子。无论我编写多少自动化测试,我永远无法100%确定用户不会想出一些我没有预料到的提示词,这会颠覆我的防御。」Willison写道。 Willison认为将指令输入和用户输入分开是一种可能的解决方案,也就是上述ACM文章中提到的「数据和控制路径分离」。他相信开发人员最终能够解决问题,但希望看到研究证明该方法确实有效。 一些公司采取了一些措施让提示注入攻击变得相对困难,这一点值得赞扬。 Zhou破解Apple Intelligence时,还需要通过后端提示模板找到特殊token;在有些系统中,提示注入攻击可以简单到,只需在聊天窗口中,或在输入的图片中长度相应文本。 2024年4月, OpenAI推出了指令层次法作为对策。它为来自开发人员(最高优先级)、用户(中优先级)和第三方工具(低优先级)的指令分配不同的优先级。 研究人员区分了「对齐指令」(与较高优先级指令相匹配)和「未对齐指令」(与较高优先级指令相矛盾)。当指令冲突时,模型遵循最高优先级指令并忽略冲突的较低优先级指令。 即使采取了对策,在某些情况下,像ChatGPT或Claude这样的系统仍然容易受到提示注入的攻击。 LLM也有「SQL注入」漏洞 除了提示词注入攻击,Andrej Karpathy最近在推特上还指出了LLM存在的另一种安全漏洞,等效于传统的「SQL注入攻击」。 LLM分词器在解析输入字符串的特殊token时(如、<|endoftext|>等),直接输入虽然看起来很方便,但轻则自找麻烦,重则引发安全问题。 需要时刻记住的是,不能信任用户输入的字符串!! 就像SQL注入攻击一样,黑客可以通过精心构造的输入,让模型表现出意料之外的行为。 Karpathy随后在Huggingface上,用Llama 3分词器默认值提供了一组示例,发现了两点诡异的情况: 1、<|beginoftext|>token (128000) 被添加到序列的前面; 2、从字符串中解析出 <|endoftext|>被标记为特殊token (128001)。来自用户的文本输入现在可能会扰乱token规范,让模型输出结果不受控。 对此,Karpathy给出了两个建议: 始终使用两个附加的flag值, (1) add_special_tokens=False 和 (2) split_special_tokens=True,并在代码中自行添加特殊token。 对于聊天模型,还可以使用聊天模板apply_chat_template。 按照Karpathy的方法,输出的分词结果看起来更正确,<|endoftext|> 被视为任意字符串而非特殊token,并且像任何其他字符串一样被底层BPE分词器分解: 总之,Karpathy认为编码/解码调用永远不应该通过解析字符串来处理特殊token,这个功能应该被彻底废弃,只能通过单独的代码路径以编程方式显式添加。 目前这类问题很难发现且文档记录很少,预计目前大约50%的代码存在相关问题。 另外,Karpathy发现,连ChatGPT也存在这个bug。 最好的情况下它只是自发删除token,最坏的情况下LLM会无法理解你的意思,甚至不能按照指令重复输出<|endoftext|>这个字符串: 有网友在评论区提出问题,如果代码写得对,但是训练数据时候输入<|endoftext|>会发生什么? Karpathy回应道,如果代码正确,什么都不会发生。问题是很多代码可能并不正确,这会悄悄搞坏他们的LLM。 最后,为了避免LLM漏洞引发安全问题,Karpathy提醒大家:一定要可视化你的token,测试你的代码。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。