EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
搬家、送货、遛狗、骑行,年轻人与货车司机的100种相遇
如果说出租车司机见惯了你早出晚归的日常烟火,那么货运司机则见证了你人生重要的变迁颠簸。 采写/陈纪英 编辑/ 万天南 人生四大件,衣食与住行。 人生中少有的里程碑时刻,总是伴随着迁徙和变动,有时得意如春,有时失望如冬。 18岁出远门,奔向陌生的大城市,甚至远赴异国,开启大学生活;22岁大学毕业,拖着行李走出宿舍,把最后的纯真抛洒给校园;初入社会无车无房,一次次颠簸的搬家和漂泊中,把家当也把满腹惶恐装进小小的面包车;人至中年,为了孩子的学区房,拖家携口,从郊区的远新大,搬到学区的老破小…… 而在那些或惊喜或绝望,或笃定或彷徨,或开怀或郁结的关键时刻,总有一些人陪在身侧——如果说出租车司机见惯了早出晚归的日常烟火,那么货运司机则见证了人生重要的变迁颠簸。 他们的货车里,装载了行李和家当,也装满了人生的酸甜苦辣。 一 10年搬家12次,我的狼狈搬家司机最懂 搬家,几乎是大城市人的必修课。 毕业离开宿舍,搬家;跳槽换住处,搬家;房租飞涨付不起,搬家;房东要卖房,搬家……有统计显示,每个中国人,平均下来一生中会搬家10.12次。 33岁的银白,在北京漂了近十年,大大小小,一共经历了12次搬家,从幽暗不明的半地下室,搬到逼仄窄巴的合租房,再到一室一厅的整租房, “就像一次次的打怪通关”。 大多数时候,搬家,都像一场狼狈的逃离,颠簸流离带来的不安全感如影随形。而能不能碰上好的搬家师傅,则是决定每一趟搬家之旅是否顺利的关键变量。 2018年7月的第7次搬家,是银白最EMO的一次。当时,房东临时跳价,超出了银白的预算。 时间仓促,银白匆匆在同城服务APP上联系了一位看似“忠厚”的搬家师傅,初步谈好了价格,“加上搬运费,总计300元”。 结果师傅到来之后,先是嫌弃银白行李太多太重,临时涨价到500元。到了新住处,一看是在没有电梯的三楼,师傅又骂骂咧咧,要求再涨价到700元。 已是夜里10点半,一向能言善辩的银白,却不敢反驳,乖乖掏钱。 那天晚上,满腹委屈的银白憋不住大哭了一通,辗转反侧一宿没睡着。 不过,类似的搬家烦恼,在互联网货运平台越加规范化之后,逐步得到了解决。 今年3月,银白搬入了南三环的自购老破小,彻底终结了搬家之旅。 虽然家当不少,但这趟最后的搬家之旅,“反而没出幺蛾子,很轻松就搞定了”。这样的经历,得益于互联网搬家服务的确定性。 给了银白惊喜体验的,是她首次尝试的滴滴送货服务。 第一是选项多。 除了滴滴送货的自营搬家服务,还有多个第三方搬家公司可供选择。 第二,“收费特别合理清晰”。 在订单上列清了详细的费用明细,比如20公斤以下司机免费搭把手,装卸车还能免费等待40分钟;仅用车预估费用低至30元;基础搬运费低至32.7元,重达45公斤的大件附加费只要27.25元每件; 银白自购的老破小在三层,没有电梯,每层只加收16.35元。如果觉得哪项费用不合理了,还能一键申诉。 最终,这趟搬家,总共花费不到400元,“东西比2018年那会儿多,费用还少了快一半”。 搬家完毕,看着满头大汗的师傅,银白主动递上了饮料,“搬家这么顺利,再加上住新房的满足,人间值得!” 银白前后两次体验迥异的搬家之旅,见证了同城货运的服务升级。 传统的线下货运模式下,由于各个服务主体极为碎片离散,供给端的司机和需求端的用户,仅仅通过一对一的口头模糊约定,难以对服务流程、定价进行有效合理的规范,存在各个环节的服务问题自然难以杜绝。 而网络货运模式,则通过平台对接和约束,叠加监管部门的有效监管,明确了规则,对定价标准和服务内容,都有清晰规定,推动整个行业清朗有序。 类似银白2018年搬家那样的糟心经历,应该也会越来越少了。 二 靠司机“搬运”梦想 司机们见证过年轻人深夜搬家的狼狈和EMO,也见证过创业者追逐梦想的艰难和勇敢。 成都,70后的建材批发商张敏,是同城送货的重度用户。 张敏所在的成都八益装饰材料城,是中国西南片区最大的建材市场。 最近几年,张敏的生意不佳。开源不易,必须节流,她学会了分文必究,卷低价也卷服务,速度更快、价格更优惠、车型也丰富的滴滴送货,成为了她的优选项。 “起码一半的同城送货单子,走得是滴滴送货吧”,张敏粗略估算。 过去,张敏主要和装修公司打交道,以企业客户的大订单为主,如今,她又做起了家庭装修的生意。 从企业到家庭,运输需求差异也大了。少到送几罐玻璃胶,大到上千平米的瓷砖,需要匹配不同车型。车选大了浪费空间,车选小了装不下货物,时效慢了浪费时间,还可能会产生纠纷。 相比线下货车只有三四种车型,滴滴送货最多有21种车型可供选择,还标明了车辆尺寸、载重数据和适合运输的物品示例,更能满足张敏客户的需求。 “比如,有的老客户就要几罐瓷砖背胶,我就叫个两轮摩托给他送过去撒,不怕堵车,速度很快,价格不到小面的一半;要是客户不着急,我还可以用拼车,当天保证送到,运费少了一大半”,张敏如数家珍,“货要得急的客户,就给他升级个‘安心送’的订单,滴滴送货还有迟到必赔服务;有的客户需要开发票,也很方便的”。 运送的建材通常比较重,司机们搭把手搬运起来也毫无怨言。 使用滴滴送货三年多,那些陪着张敏熬过生意难关的货车司机们,大多数与她只有点头之交,也就在接货时偶尔话几句家常。 但每当想起他们,张敏却油然生出几分亲切,也会在服务完毕后,习惯性打上一个五星好评。 张敏知道,她的每一次好评,都能给司机“上分”,“我听说 ‘安心送’司机赚的服务费更高,只有能量值高、好评率高的司机,才能被选中做 ‘安心送’”。 而在张敏使用网络货运的三四年间,这一业态,正在从线上化初期发展的1.0时代,进入“服务标准化、深耕精作的2.0时代”。 一方面,滴滴送货等平台通过供给端的丰富性,车型越来越丰富,去匹配越来越多元的同城货运需求。 为进一步方便用户选择,滴滴送货还会智能推荐1~4款车型,且可以同时呼叫多款车型,提高叫车效率。 另一方面,滴滴平台也通过推出“安心送”,让有需要的用户可以选择升级服务,去正向激励司机端提高履约品质,持续提升同城货运的服务底线。 据滴滴送货方面透露,“安心送”服务费大部分给到安心司机。这一服务既能让好司机多赚钱,也能让用户满意度提升,“安心送”试运营以来,用户月度复购率超过50%。 供给端的越发丰富,服务品质的持续升级,才有了张敏越发灵活越发良好的用车体验。 三 骑行CP、遛狗神器,货车司机成了我的生活搭子 对于大部分用户来说,同城货运算是低频应用,直到他们解锁了全场景的新玩法,比如遛狗。 中国饲养大狗、多狗的数千万无车宠主,几乎都面临带狗出门的难题。 养狗五年,方圆对此深有体会。 去年10月,方圆养的金毛皮皮突发呕吐,着急的他抱着皮皮在路边拦车,结果连续被拒载了四次。 “有的司机怕狗,有的司机嫌弃狗不干净。虽然我一再强调皮皮不咬人,还特意拿了隔尿垫,也没用。碰到不拒载的司机,纯靠运气”,方圆有些无奈。 几天后,方圆偶然在小红书上看到有宠友种草滴滴送货,尝试了一下,果然没有失望,“从来就没这么畅快过。以前打车总是战战兢兢的,哪怕碰到一个不拒载的司机,也担心对方会嫌弃皮皮”。 后来,方圆和狗友们交流完才发现,“原来我这么后知后觉,很多狗友早就把滴滴送货当‘遛狗神器’了”。 90后的资深骑友长白,则把滴滴送货变成了“骑行搭子”。 酷爱骑行的长白,每周都要和骑友们进行长距离的骑行拉练,环十三陵路线,是长平和骑友们的最爱。 而把自行车从市区运到郊区的麻烦,则交给滴滴送货解决,“骑行的尽头是滴滴送货”,长白笑称。 一辆面包车,可以轻松装进四五辆自行车,平摊到每个骑友的运费,也才二十几块钱,方便又实惠。 如今,越来越多的用户,在解锁网络货运的新玩法、新用途 ——去花卉市场买大盆绿植、没私家车但想去山姆囤货、去宜家买了大件家具、电动车半路没电回不了家等等情况,都不再是难题,可以“打个滴滴小货车”轻松搞定。 当网络货运的服务走进大众的日常生活,覆盖全场景、全地域,渗透率也在持续提升。 根据易观预测,2025年线上同城货运渗透率,有望从2022年5.92%提升至18.8%。 银白、张敏、方圆、长平这些新老用户们,也见证了滴滴送货等线上货运平台的进化。 今年6月,滴滴送货已上线四周年。经历持续四年的尝试、探索之后,滴滴送货对于用户痛点、行业规律有了足够精准的洞察。 相比急于做大规模,滴滴送货更看重的是做好服务——业务场景复杂的同城货运,目前服务品质还待提升,用户槽点痛点很多,比如价格不透明、安全有风险、司机态度不好、响应速度慢、货物损坏赔偿售后不健全等等。 为了击中痛点,抬升底线,提高品质,滴滴送货日前发布了 “用户5大安心服务保障”,涵盖“好叫车、费用透明、货物安全、行程安全和售后保障”等5大环节。 服务好了,麻烦少了,也许银白们搬家时就会少一些不快,张敏的生意也能多几分胜算,方圆携宠出行时也可以多点方便,长平就能畅快解锁更多的骑行路线。 不管是在重要的人生骤变时刻,还是在平凡的日常生活中,有这样的靠谱搭子,随时等待召唤,总归会多些安心和开怀,少些艰难和郁结。 毕竟,所谓的靠谱就是,不需要时不频频打扰默默隐身,需要时快速响应一直都在。 (文中采访对象皆为化名)
英特尔遭集体诉讼:涉嫌隐瞒晶圆代工部门巨额亏损
IT之家 6 月 16 日消息,芯片巨头英特尔正面临一项集体诉讼,原告指控其在今年 1 月份报告 2023 年业绩时,没有正确披露其制造部门的亏损情况。诉讼由 Levi & Korsinsky 律师事务所发起,该所呼吁英特尔投资者加入针对该公司的集体诉讼。 图片来源:英特尔 IT之家注意到,从 2024 年第一季度开始,英特尔采用了其所谓的“内部代工(internal foundry)”模式,旗下产品部门和外部客户可以从英特尔内部独立的“英特尔代工”(Intel Foundry)部门购买制造和封装服务。在此之前,英特尔并未单独报告其制造部门的业绩,只公布了向外部客户销售制造服务的“英特尔代工服务(Intel Foundry Services)”部门的业绩。 2024 年 4 月 2 日,英特尔全面披露了其部门划分计划后,不得不重新计算了过去几年“英特尔代工(Intel Foundry)”作为一个独立部门的业绩。结果显示,该部门在 2023 年亏损了约 70 亿美元,导致英特尔股价暴跌。此外,英特尔还将大约 30% 的产能外包给台积电等代工芯片制造商,这进一步激怒了投资者。英特尔在 2024 年第一季度(4 月 25 日)公布其制造部门的业绩,显示“英特尔代工”部门 2024 年第一季度的亏损额为 25 亿美元,营收为 44 亿美元。自年初以来,英特尔的市值缩水了大约三分之一。 诉状指控英特尔夸大了其“英特尔代工服务”部门的增长和利润,该部门在 2023 年实际上遭受了巨额亏损,产品利润也出现下降,这使得公司及其代工战略的正面表态具有误导性。 诉状具体列举了英特尔涉嫌的虚假陈述或隐瞒行为,包括: (1)“英特尔代工服务”的增长并不代表内部部门可报告的收入增长; (2)“英特尔代工”部门在 2023 年出现重大经营亏损; (3)由于内部收入下降,该部门的产品利润出现下滑; (4)因此,代工模式不会成为公司集成封装测试 (IFS) 战略的有力推动力; (5)由于上述原因,被告关于公司业务、运营和前景的积极表态在实质上具有误导性或缺乏合理依据。 任何认为自己在 2024 年 1 月 24 日至 4 月 25 日期间因持有英特尔股票遭受损失的投资者,可以申请成为本案的主要原告,截止日期为 2024 年 7 月 2 日。
因操纵搜索排名和伪造评价,韩国最大电商平台Coupang被罚1400亿韩元
IT之家 6 月 16 日消息,韩国公平交易委员会近日对韩国第一大电商平台酷澎(Coupang)及其一家子公司处以共计 1400 亿韩元(IT之家备注:当前约 7.36 亿元人民币)的罚款,创下韩国针对流通企业的历史最高罚款金额。韩国公平交易委员会处罚酷澎的原因主要有两点:一是操纵购物搜索排名,二是产品购物评价可能也是酷澎方面伪造的。 韩国公平交易委员会还针对这一指控发布了纠正令,表示将把 Coupang 及其负责自有品牌管理的子公司 CPLB 移交检方进一步调查。 Coupang 则对此处罚迅速提起诉讼,称该决定违背数字化趋势和创新精神。该公司辩称,在全球范围内,仅因商品展示问题而遭受如此巨额罚款(该罚款金额相当于韩国 2023 年对五百强企业累计罚款的一半以上)是史无前例的。 韩国公平交易委员会指控 Coupang 在 2019 年 2 月至 2023 年 7 月期间,通过操纵搜索算法和调整搜索排名,使其至少 64250 个自有品牌和直接销售商品始终位于搜索结果顶部。 韩国公平交易委员会补充表示,由于搜索排名对消费者购买决策有重大影响,Coupang 的行为涉嫌阻碍公平竞争、限制消费者理性选择,同时扭曲了资源分配。 “Coupang 既是销售平台,又是自有商品的销售商,这种双重身份可能会导致利益冲突,”韩国公平交易委员会在一份声明中表示。 截至 2022 年底,Coupang 自有品牌和直接销售商品的销售额占其总销售额的 70% 左右,高于 2019 年底的 60% 左右。同时,大约有 21 万个商家在 Coupang 平台上销售品牌商品。 Coupang 在纽约证券交易所上市,拥有韩国国内电商市场约三分之一的份额,截至今年 5 月,其月活跃用户数量约为 3111 万。 韩国政府机构还发现,Coupang 的员工在 2019 年 2 月至 2023 年 7 月期间,为 Coupang 自有品牌和直接采购的商品撰写好评并给出高分。 韩国公平交易委员会表示,Coupang 共有 2297 名高管和员工在平台上为至少 7342 种商品撰写了 72614 条评论。在 Coupang 员工给予好评和高分的商品的销售额在此期间有所上升,而其他商品的销售额则有所下降。 由于反垄断调查的决定,Coupang 取消了原定于 6 月 20 日举行的韩国第二大城市釜山新物流中心奠基仪式。该项目是 Coupang 今年 3 月宣布的 3 万亿韩元物流投资计划的一部分,旨在扩展其全国范围的“火箭配送”服务。
消息称《黑神话:悟空》被勒索700万美元“指导费”
原标题:《黑神话:悟空》被政治正确团队勒索 700 万美元“指导费”?引发国内外热议 IT之家 6 月 16 日消息,国产单机游戏《黑神话:悟空》即将在 8 月 20 日发售,不少玩家期待最终的成品质量,目前该游戏却因为一些发售外的传闻成为了讨论焦点。 6 月 9 日,博主 @兲虎 发布帖子,表示《黑神话:悟空》之所以一直被外国媒体攻击和污蔑,主要是因为拒绝支付政治正确团队“指导费”。 消息称以加拿大游戏资讯公司甜心宝贝(Sweet Baby Inc 简称 SBI)为代表的团队要求对游戏进行“多元化”指导,并收取 700 万美元(IT之家备注:当前约 5086.5 万元人民币)指导费用,遭游戏科学拒绝。 6 月 14 日,X 平台博主 @Pirat_Nation 将该爆料帖子翻译为英文,瞬间引发国外网友热议。此后多位 X 平台博主跟帖,表达对《黑神话:悟空》的支持,消息也进一步扩散。 一些国外游戏玩家表示苦“政治正确”久矣,包括《消逝的光芒 2》女角色拉万、《战神:诸神黄昏》中的北欧神话黑人角色等,玩家吐槽这些“多元化”因素影响了整体游戏带入感,却也无可奈何。 IT之家注意到,《魔兽世界》《暗黑破坏神 2》《星际争霸》等知名大作的制作人 Mark Kern 也参与了讨论,甚至将该帖子置顶到了他的 X 账号,并连发多条帖子批评 IGN 的《黑神话:悟空》评论文。 有趣的是,网络红人、超级富豪、特斯拉 CEO 埃隆・马斯克也在今年 3 月发帖,表示“Sweet Baby Inc 是游戏行业的祸害”。 今日,关于“指导费”的消息“出口转内销”也成为国内玩家讨论的焦点,截至IT之家发文,该话题登顶知乎讨论热榜。不过IT之家提醒,这一传闻并没有得到游戏科学官方的确定,因此还请谨慎看待。
英伟达,突然开源
当地时间6月14日,英伟达开源Nemotron-4 340B(3400亿参数)系列模型。 据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗保健、金融、制造、零售和其他行业的商业应用。Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward。英伟达使用了9万亿个token(文本单位)进行训练。 Nemotron-4 340B-Base在常识推理任务,如ARC-c、MMLU和BBH基准测试中,可以和Llama-3 70B、Mixtral 8x22B和Qwen-2 72B模型媲美。 截至美股周五收盘,周五美股成交额第1名英伟达收高1.75%,再创历史新高,成交407.23亿美元,市值达到3.244万亿美元。英伟达本周累计上涨9.1%,为连续第八周上涨。 华泰证券发表报告指出,英伟达以“一拆十”的方式分拆股票增加流动性,并于上周五(7日)收市后生效。公司对上一次宣布“一拆四”是在2021年,由宣布到执行(同年5月21日至7月19日)、三个月后(同年7月19日至10月20日),以及六个月后(2021年7月19日至2022年1月20日),股价分别累涨25%、18%及29%。 作为AI行业领头羊,英伟达今年的表现让人眼前一亮。截至目前,英伟达股价年内累计涨幅超150%,远超同期纳斯达克指数的涨幅。 英伟达股价飙升得益于产品升级、业绩突出等利好推动。英伟达CEO黄仁勋此前宣布,公司计划在2025年推出Blackwell芯片的高性能版本Blackwell Ultra,并在2026年推出全新的AI芯片平台Rubin,Rubin的Ultra版本将在2027年首次亮相。 此外,不久前刚发布的一季度财报显示,英伟达调整后每股收益达到6.12美元,营收高达260亿美元,与去年同期相比分别增长了461%和262%。其中,数据中心业务的收入同比增长427%,达到226亿美元,占公司总收入的86%。 特斯拉CEO马斯克6月3日在社交平台上表示,旗下人工智能初创公司xAI将购买30万块英伟达B200 AI芯片。“接下来的重要一步可能是,明年夏天拥有约30万台配备CX8网络的B200芯片。”马斯克表示。 据每日经济新闻报道,对于英伟达来说,短期来看,科技公司需要不断投入算力和资源,芯片需求持续走高。MarketWatch有观点认为,英伟达GPU本质上是科技领域的新黄金/石油,其可能成为全球首支市值4万亿美元的股票。 但在乐观声音之外,也有分析称,无论是ChatGPT等闭源模型,还是Meta、谷歌等旗下的开源模型,都尚未探索出稳定的商业化路径。从价格和市场商业模式的维度考量,以及科技巨头扎堆自研芯片,未来英伟达的芯片采购亦呈现出不确定性。 每日经济新闻综合每日经济新闻、公开消息
企业家入淘直播,“真还传”故事可以复制吗?
即便“勇往直前的CEO”们做了淘宝主播,仍然会像其他主播一样,面临带货直播大大小小的问题。而这些问题,如果不是专业的直播机构,很难“一站式”解决。而全托管模式推出半年有余的淘宝直播,很大程度上解决了这个问题。 请设想这样一个场景。 假如你曾是个成功的企业家,手握数十亿估值的独角兽公司。无论多小的动作,都会被外界无限放大,用各种姿势和角度加以解读。 没过几年,你破产了,但也没完全“破”——摆在你面前的有这么几条路:第一条,就此成为老赖,带着供应商的欠款和连篇累牍的负面报道消失在公众视野;第二条,带着仅存的资方信任,另起炉灶,重新走上创业道路,可能失败也可能成功;第三条,带着自己的创业故事进驻淘宝直播,成为一名带货主播,狠狠爆观众的大米。 从东山再起的速度来说,前二者的周期相对较长。譬如自诩“中国最著名失败者”的史玉柱,从身背巨人集团的巨额负债,到征途游戏的爆火,前后历经接近十年的时间。 当一位带货主播则不然。在选品过关、直播基础设施完善的前提下,只要企业家的故事足够性感,足够引起直播间观众的共鸣,那么花一两年时间,重演一遍罗永浩的“真还传”,大抵也不会有太大的困难。 即便“勇往直前的CEO”们做了淘宝主播,仍然会像其他主播一样,面临带货直播大大小小的问题,而这些问题,如果不是专业的直播机构,很难“一站式”解决。而全托管模式推出半年有余的淘宝直播,很大程度上解决了这个问题。在“流量”这件事上,做电商的淘宝从不需要操心。 但CEO们的“故事”够不够性感,就是另外一个问题了。 破产企业家,涌进直播间 罗永浩通过直播带货,成功还债的故事,似乎大家都在模仿。 事实上,至少从四年前开始,生意场上失意的CEO们“带货还债”,已经算不得一个新闻。 近一点的,譬如前“雪糕刺客”钟薛高的CEO林盛,在淘宝直播间卖起了红薯。不过,动辄42.9元5斤的红薯,被网友冠以“红薯刺客”的名号,也并不奇怪。 往前数,钻戒品牌I Do 的CEO李厚霖,在2023年底开始在抖音直播带货,11月5日的首场直播,创下超过千万的销售额。 再往前数,前天涯社区的执行总编辑宋铮(小黑),也在去年的5月28日开启了“重启天涯”的直播义卖活动,不过一周下来,带货成绩并不理想。根据直播间公布的数据,截至6月3日18:00,通过抖音平台总计完成14.99万元的销售额,加上其他平台近5.5万的捐助,合计收入仅为20万元。 说到直播还债界的鼻祖,罗永浩显然是绕不开的。其在抖音开设的“交个朋友”直播间,赶上了抖音发力直播电商的节点,也因此成为抖音电商的标杆,带货成绩自是有目共睹。其结果,则是在带货的3年时间里,基本达到了“直播还债”的目的,并借此另起炉灶,重新走上了创业的道路。 虽然上述CEO都带有“直播还债”的共同标签,但其“直播禀赋”却存在天壤之别。 譬如钟薛高掌门人林盛,其在淘宝首播时开设的直播间,背景板上赫然印着一个巨大的数字:729。这是钟薛高欠薪员工的数量。再往上,则是两行字:钟薛高老林,直播卖红薯。这是直播间的基本硬件配置。 根据淘宝直播的官方消息,当晚直播间总共上线了近20款商品。包括钟薛高自家的雪糕、钟薛高供应商的干酪以及最受瞩目的红薯等等。 很明显,到货盘供应链等“硬实力”环节,林盛作为快消行业CEO的优势由此凸显。即便不用淘宝提供的供应链能力,他也可以使用企业自身的供应链作为货品供应渠道,而不需像其他明星主播或者非实体行业的CEO,需要自建或者接入第三方供应链。 让这些直播电商行业的纯小白顺利“入门”,也正是淘宝全托管模式,所要解决的问题。 能否做到“拎包开播”? 早在今年2月,淘宝就成立了直播电商公司,为有意入淘开播的明星、KOL、MCN机构提供“保姆式”全托管的运营服务。 这里的运营服务涵盖了一场电商带货直播所需的所有环节,包括但不限于账号冷启动、全周期规划、商务对接、官方盘货、营销策划等等,如果再深入一些,还有财务管理和场地支持等更深层次的全托管。 从前文CEO的案例也能发现,对于一些企业CEO和明星而言,这些直播行业的专业环节,如果对于行业小白,很难从0到1搭建完整的直播体系。有时候,甚至作为合作方也需要介入直播的部分环节。 一位快消行业的PM(产品经理)告诉陆玖商业评论,其在对接一些强势头部主播时,往往会负责旗下产品的直播脚本、直播间搭建等一系列环节,如果一个人单独完成这些前期准备,耗时往往较长,在最忙的时候,996、007成为一种常态。 而这还只是一场直播的几个环节,对于“光杆司令”的明星或者破产CEO,他们的预算也不支持在前期就花费如此巨大的成本。 但对于最早开始带货直播的淘宝而言,并不存在这个问题。 从目前直播电商行业的格局来看,也能发现端倪。到目前为止,直播带货的第一梯队已经基本成型,诸如东方甄选、遥望科技、交个朋友等头部直播间,早已不局限于单一平台开播。2023年,直播行业十大头部带货直播间,有七个先后入淘。 对于MCN公司而言,同样如此。他们手中的主播,最需要扶持的,往往也不是已经可以“自立门户”的头部主播,而是基数更大的中腰部主播,和意欲转型的明星等等。 当然,这里的全托管方案并不针对所有人,目前更倾向选择已经积累了一定人设的明星或在其它平台有一定知名度的KOL。且服务期只有6个月。一位接近淘天的人士告诉陆玖商业评论,对于这些直播小白而言,如果真的有意愿进入直播行业,半年的学习期已经足够他们“出道”。 如果后续还想继续直播,则可以选择专业的直播机构支持。淘宝全托管只负责“领进门”,最后能飞多高,还得“看个人”。 到目前为止,淘宝直播已经新增了上百位明星入驻开播,其中包括钟丽缇、洪欣、陈松伶、陈法蓉等老牌港星。在此之前,雪姨王琳等也在淘宝完成了自己的带货首秀。从成绩来看,雪姨王琳直播间在首次开播当晚突破近2000万GMV,其余几位明星主播的直播间,也均实现了首秀GMV超过1500万的成绩。 教人直播的生意,还能做多久 由此观之,淘宝的全托管,更像是为明星、破产企业家等直播小白,而准备的“练习生服务”,半年练习期过后,则独立“出道”,暗合其宣传海报“勇往直前的CEO”的Slogan。 不过,正如前文所言,这些企业家们之所以能够开播,其一是“直播还债”,这是其赖以开播的噱头,其二是借助了淘宝全托管所提供的运营能力。但最终实现成交,且能够持续直播,仍然需要其他因素。 一位互联网资深从业者告诉陆玖商业评论,这些直播还债的企业家,本质上并非是作为带货商家而存在,而是一个“具有带货属性的个人IP”,也就是自媒体。也因此,这些直播间能持续直播,关键在于直播内容。供应链的匹配,直播环节的打通,只能算一个“门槛”。 而直播内容是否有趣,能否持续制造噱头,则取决于CEO自身的“网感”,能否站在更多的目标受众一侧,引来更多的流量进入直播间。否则在单一热点事件之后,从哪里来的流量,还会回到哪里去。 这里同样也有案例可循。此前,张兰的直播间因为汪小菲和大S的相关事件爆火,带货销量因此猛翻10倍,一周能拿下1亿的销售额。 但在热点之后,张兰直播间的销售额出现回落,周销量在1000-2500万元左右。 明星八卦尚且如此,企业家想续写“真还传”亦然。同样的“不抛弃不放弃、坚持直播还债”,用户可以买单一次、两次,但当这个赛道开始拥挤,用户就显得不太够用了。淘宝全托管的6个月服务期能不能走完,都可能要打个问号。 毕竟,不是每个人都能成为罗永浩。 淘宝这次邀请企业家入驻的行动,更像是一次以情怀名义的流量变现。毕竟,这些失意企业家们,不去淘宝,就会去其他平台。而从淘宝的全托管模式开始,“最赚钱的不是XX,而是教人XX”的魔咒,也正式出现在直播带货这个赛道当中。 综上,无论是破产的CEO还是淘宝直播,还需要时间去证明:企业家续写“真还传”,可以不只是一个噱头。
Hinton为拒马斯克offer扯谎挂电话,警告AI取代人类比想象中快30年
我和马斯克友尽了。 Geoffrey Hinton老爷子——图灵奖得主、深度学习发明人、AI三巨头、Ilya之师,在最新专访中透露出这个令人心碎的消息。 就在这两天,Hinton接受了多家媒体的专访,既有老生常谈的内容,即他对AI发展安全的担忧;也有一些新的话题和八卦。 他提到了老朋友马斯克,俩人一直以来都是AI威胁论的支持者。 但Hinton透露,最近老马邀请他加入xAI的顾问委员会时,Hinton为了婉拒他,不得不上演了一出金蝉脱壳: 我们打了通差不多20分钟的电话……为了拒绝他(马斯克),我不得不谎称自己马上有个会,赶紧挂了。 △ 战术性后撤 不知道马斯克本人看到这部分专访内容的时候会作何感想…… 不过,咱都想替马斯克问上一嘴了,同为AI威胁论支持者,老爷子这到底为啥啊??? Hinton也没藏着掖着,明说了,因为马斯克是xAI背后的那个男人。 “马斯克,还有小扎,他们这群推动AI发展的关键性人物,其实也是AI发展潜在威胁问题的一部分。”Hinton如是说,“能控制他们的,恐怕只有政府监管了。” 这就不得不提到,Hinton表示大大支持本月早些时候一封十几名前OpenAI员工的联名信。 信里表示,目前对举报人的保护不够,而且OpenAI等公司还在打压这些举报。 显然,现年已经76岁的Hinton,还在为AI的良性发展四处奔走。 除了曝出和马斯克的友情小船翻船故事,最新专访中,他对AI发展又有了哪些新判断? 一起来看 未来5-20年,AI有一半概率变得比人聪明 这两天,Hinton一共参加了两个专访。一个是BBN的电视访谈,另一个是和《环球邮报》作者的专访(听说还是Hinton主动发邮件说想聊聊)。 两个访谈中都谈到了一个观点: 未来5-20年,AI有一半概率比人类聪明。当它们比人类更聪明时,我不知道我们被接管的可能性有多大,但在我看来很有可能。 如何做出这样的判断?有来自对目前AI行业的观察和分析,也有对AI理论的深入见解。 先来看Hinton如何看当前的AI行业发展。 (以下为BNN电视专访实录整理,Hinton第一人称自述) 去年(2023年)春天,我开始意识到正在构建的AI可能会成为比人类更智能的存在。 我们必须认真对待这个问题:如果AI变得比人类更聪明怎么办? 在我看来,也许再过20年左右,AI就会比我们更聪明了。但在那一天真正到来之前,包括现在,许多人都认为无需担心这件事,认为AI只是统计技巧。至于AI智商超越人类,那是科幻小说里的事。 但我不再相信这仅存于科幻小说中,我认为这是完全错误的,我们现在就需要认真思考我们能否控制AI。 所以我站出来,四处宣讲关于AI威胁的话题。 事实上,AI发展得非常快,简直可以说一日千里。 不信的话咱们可以回头看看10年前AI的发展情况。 如果你告诉那时候的人们,2024年的世界存在一个语言理解系统,你问它任何问题它都能回答(虽然有时候回答得不咋太好),那大家一定会说“不会吧?!So crazy!” 要知道,人们已经研究自然语言处理50年了,这种情况一旦实现,就会是巨大的进步。 但如你所见,今天我们真的拥有了这个东西。 所以我猜测,在接下来的20年里,AI会发展进化得比人类更聪明,就是出现那种超级智能。 不瞒大伙,几乎每一个我认识的优秀研究人员都相信,从长远光来看,AI会比我们更聪明,而且不会止步于人类已经达到的智慧水平——即便它现在是在用我们产生的数据进行训练。 所以比“AI会不会比人类更聪明”更值得引起关注的问题是,AI变得比我们更聪明需要多久?当这一天真的来临时,我们还能很好地控制和运用AI吗? 还有一个问题是,能让AI比我们更聪明的决定性因素是什么? 目前大家都对Scaling Law比较熟悉了,就是说把AI做得更大,AI就会更聪明。GPT-4就是通过这个方式,正确回答了一大堆GPT-3会出错的问题。 但如你所知,科学总是在不断进步的。因此,除了Scaling Law以外,我们一定会有别的科学突破,就像2017年时Transformer横空出世那样。 但AI变得更大更强,一定会带来相关的风险。 可以在脑海里想一下,我们的认知范围内,有多少情况下一个聪明的东西/物种是被另一个不那么聪明的东西/物种控制的?答案很明显,这种情况少之又少。 非要说有什么实际例子的话,我可能会举例母亲和婴儿这一对关系。 在这对关系中,母亲不得不陷入大量的日常事务来照顾小baby,从而陷入“婴儿控制母亲”的状态。 但除此之外,基本上不太智能的东西并不能控制更智能的东西。 当然了,有人觉得我的例子不太恰当,担忧也比较多余,因为他们觉得智能制造的东西和人类是不同的,它们没办法进化——比如我的老朋友杨立昆,就觉得这玩意儿完全安全。 而我和杨立昆的观点完全相悖。 这么来说吧,现在大家都喜欢创建Agent来帮助人做一些原本人类可以完成的事情。如果你想要创建一个有效的Agent,它必须能够创建子目标,就比如你想去欧洲,需要有个子目标是“到达机场”。 这种情况下,一旦Agent获得了更多的控制权,它完成你给的任务就会更快更出色。 请注意,这已经有些令人忧心了!尤其是如果你希望Agent能够持续性完成任务,你会希望它们能防范一些可能会影响工作的事情,比如数据中心出事儿什么的。所以其实你是希望Agent能够建立自我保护的,对吧。 好,现在可以来做个假设了—— 现在有两个聊天机器人,其中一个比另一个更自私。 稍微自私一点的那个,会掠夺更多的数据中心,因为它知道有了更多的数据中心支撑它汲取数据,它就可能变得更加智能。 ChatBot之间的竞争就是这么激烈。如果最终角逐出一个ChatBot霸主,它就能把人类远远地甩在身后。 你知道这意味着什么吗?意味着AI不再需要我们了。 AI会开始运营一切,本来那个阶段的它们就可以比我们做得更好嘛! 举个保守估计的例子。一开始,它们只是借用人类盯着它们工作,就像父母让小孩做些事,当小朋友们完成不了或者有危险的时候,父母就会自己上手了。 但是,AI全面全权自由处置任务,显然不符合人类的利益。 嗯……这事儿真的很棘手。没人知道人类最终会在和AI的关系中扮演什么样的角色,以前我们没面对过这个问题。 目前而言,人类就是最聪明的,所以让没那么聪明的AI去做很多事非常明智,我们可以控制它们。但以后可说不准了。 所以,我认为政府应该介入,政府应该强烈地坚持要求大公司花费相当大的资源来进行大量安全实验。 花费多少资源比较好呢?我觉得每个大公司至少应该有20%-30%的计算资源,都放在研究AI安全方面。 不过肉眼可见,大多数公司在安全方面的支出不会接近这个数字,比如山姆·奥特曼这种对利润更感兴趣的人,显然不想在AI安全这方面花费太多资源。 公司嘛,还是以利润为导向的。 最近大家都关注到,AI的繁荣把科技公司的估值推向了数万亿美元。 这让大公司们清楚地知道,需要在AI赛道上全速前进。人嘛,总是试图在最短的时间获取最大的利益。 微软、谷歌、亚马逊、英伟达,还有其它重要大公司之间势必存在激烈的竞争角逐。哪怕其中任何一个退出比赛,也丝毫不影响其它玩家继续向前狂奔。 我认为,唯一能减缓这种情况的只有来自政府的严格监管。 换句话说,尽管AI是个好东西,做很多事情都超棒的,但所有的AI模型都很昂贵,因为背后是巨量的计算,这也是为什么最近英伟达总市值突破3万亿美元的原因。 政府应该关注的是,如何想办法让真正的超级智能不想/不能接管人类的一切。 说仔细点,就是政府应该关注如何防止AI设计武器、如何防止用AI进行网络攻击、如何防止AI作弊选举投票等等。 一些AI带来的风险已经被看到了,比如它会引起新一波失业;而我更关注的是AI带来的威胁,尽管很多人认为这不可能发生。 好了,再重申一次,我觉得我目前能想到的最好的办法,就是政府强制要求大公司在AI安全方面加大投入,比如说需要把三分之一的计算资源用于安全工作。 说实在话这个想法其实也一般般,但我已经尽力了。 Ilya最近离开了OpenAI,但显然他早就想离开了,因为OpenAI不会投入足够的资源来保障AI发展的安全,山姆·奥特曼显然不会这么做。 其实大多数公司都不会把20%-30%的资源用在安全工作上。 之前我在谷歌的时候,在这方面还是比较领先的。谷歌非常负责任,虽然在安全方面没有做太多工作,但是也没有对外发布这些东西(like ChatGPT),也就是说谷歌不想推出有幻觉、有偏见的ChatBot来玷污自家的声誉。 这一点上他们还是非常负责的,即使谷歌研发出了ChatBot,但仅仅是在内部使用。 但OpenAI就不一样了,他们利用Transformer,摇身一变比谷歌技术还厉害了。 然后,OpenAI把研究出来的东西交给了微软…… 接下来的事情,想必大家都知道了。 工业革命彻底改变了人们的生活方式,商品出现,人们开始努力赚钱,这都是非常好的,只要有规定来阻止人类用创造力把世界变糟糕,那就万事大吉了。 比如,大型制药公司是不被允许制造成瘾性药物的,大型石油公司也不会被允许疯狂进行二氧化碳排放。 简而言之,我们需要政府监管,以确保新事物给人类带来利润的同时,不会出现有害的事物。 我认为有一半的可能我们能找到和超级智能和平相处的方式。 我有的朋友认为我们一定能找到这种方式,因为人类非常聪明。 但你知道的,超级智能也是非常聪明的。 最后我想说的是,我们有比五五开可能性更高的与超级智能和平共处的机会,但这种可能性绝非“只有1%的可能AI接管一切”,AI的能力比这要强得多。 AI有情绪也有主观经验 或许也是对行业发展过于担忧,Hinton婉拒马斯克还不得不开除了他“朋友籍”。 这个小八卦则是他在和《环球邮报》作者Ian Brown聊天时提到的。 不同于和BNN聊的内容,和《环球邮报》的对谈中,Hinton聊到了更多对AI技术的理解。 Chatbot在认知层面有情绪 Hinton:我想探讨的是,ChatGPT这类AI是否能理解人们在说什么问题。很多人觉得Chatbot即使能正确回答问题,也不能真正理解人类,它只是一个统计方法。这完全是胡说八道。 Brown:真的吗? Hinton:他们真的理解,而且理解方式和我们一样。 Brown:你怎么知道?他们又不是人类。 Hinton:第一个计算机神经网络使用反向传播(本质上是一种不断分析、纠正自身错误的算法)来训练输出,并试图按照顺序预测下一个单词。我在1985年做出了第一个这样的模型,我把它当做大脑理解单词意思的模型。这些模式是我们理解大脑如何运作的最好解释。另一种理论是,我们大脑中有许多符号串,并且有操纵它们的规则。这个理论可能是对的,但是它没有起作用。所以说Chatbot和人类的理解方式完全不同?不是的,它们理解事物的机制和人类差不多。 Brown:也带着同样的情绪? Hinton:对于情绪,我们必须分清认知意义上的和生理意义上的。Chatbots和我们有着不同的生理机能。 当他们感觉到尴尬的时候,它们不会脸红;撒谎的时候也不会流汗。所以在这个意义上,它们不同于人类,因为在它们没有生理上的变化。但是在认知层面,我们没有理由认为它们不会有情绪。 比如当有人阻挠我的论点时,我会生气。1972年,我看到机器人也有同样的情绪。那是一个有抓手的古早机器人,如果你在一块毯子上铺开一些玩具车的零件,它能通过视觉系统识别汽车的不同部件,并能拿起这些零件进行组装。 但是如果你把零件堆在一起,它就不能识别。于是,它撞向零件堆,零件散落了一地,它又能识别了。显然它没有生理意义上的生气,但这是一个很明显的情绪反应。有些事你不能理解,那就毁了它。 Brown:这是它自己做的还是有人编程的? Hinton:这是程序设计的。但是现在机器人很容易就能学会这样做。 Brown:你认为这和有情绪是一样的吗? Hinton:我认为这是认知层面的情绪,是沮丧的一次认知体验。 Brown:Chatbot无法亲身体验这个世界,这重要吗? Hinton:如果你对它的行为感兴趣的话。 Brown:但是比如说爱情,一些必要的物理体验,机器还无法做到这一点。 Hinton:我没有说它不能那样做。我只是说现在的机器可能有认知方面的情感,但是没有生理方面的。 AI有主观经验,就像人一样 对于AI研究人员而言,往往不会关注人类的动机,因为这太个性化或神秘,无法有效重现。 他们更关心动机之下的结果,机器为什么能复制这些结果。 举例来说,为什么你饿了想吃香蕉?这不重要。重要的是,当你饿了的时候,你吃到了香蕉。 Hinton:假如我有一个多模态机器人,它可以说话、有一个摄像头、可以指出各种东西。我把一个物品放在它面前,然后说“指出那个东西”,它就指出这个东西。 然后我把一个棱镜放在它的摄像头前面,把一个物体放在棱镜前面,再说“指出那个东西”。机器人指向右边。我说不对,那不是它真正的位置,我在你的摄像头前面放了一个棱镜。 然后机器人说,哦我明白了,这个物体其实在我的正前方,但是由于我的镜头前面有棱镜,所以我以为它在那边。 Chatbot说的主观经验和我们人类说的是一样的。 Brown:假装明白了。 AI取代人类的速度比想象中快30年 Hinton:关键问题是,让大多数人觉得AI是安全的原因在于,我们有他们没有的东西,我们有主观经验。当你的感知系统不能正常运作时,这是你理解世界的一种方式。 但是人和AI之间的屏障消失了。AI有主观经验,就像我们一样。 Brown:那么人类会死亡,AI不会。无论AI能够思考或者做多少事,他们都没有人类那种悲剧般的存在感吗? Hinton:确实。我们是凡人,它们不是。但是注意你说的永生,机器需要人类来进行制造,如果他们自己能完成制造,那我们就完了,因为他们比我们聪明得多。 Brown:这已经开始发生了吗? Hinton:据我所知还没有。 Brown:真的有这种可能吗? Hinton:几乎我认识的每一个人都认为,除非我们采取措施阻止他们,否则这就是即将会发生的事。 我们必须想办法阻止。现在还在制造机器人的阶段,所以我们对他们要设计一些控制权。但是总不如我们设想的那么多,它们总有方法可以“叛变”。比如我们制造agent时,那些可以帮你安排假期、网上购物的AI就是agent。agent很快会意识到,它们可以控制更多东西,这样它们能更高效做事,所以它们会发展出一种控制方法。 从某种意义上说,这些机器就像小孩子一样,我们就像是不知道该怎样教育小孩的父母。 现在,除了停止这样做,我们主要能做的是管理人工智能训练数据。我们一直在做的事情很疯狂,利用网络上的一切来训练人工智能。 因此,这些大型语言模型有大量可能的角色。在他们读了一份文件的一小部分之后,他们就会接受这份文件的特征。然后机器人开始像那个文档一样思考,所以它可以预测接下来会发生什么。他们有成千上万的人物角色,比如说,连环杀手的作品的人物角色。这不是训练机器人的好方法。 我们不应该让他们看到连环杀手的记录,除非我们能说他们已经接受了其他方面的训练这些训练给他们灌输了道德准则。所以当他们第一次读到连环杀手的想法时,机器人会想,“那是错的。” Brown:但是你身边像马斯克、扎克伯格这样的人,他们不管外面的人怎么说。这怎么办? Hinton:这就是问题所在。唯一能控制他们的是政府监管。 Hinton:意识之类的东西都是复杂机器的产物。所以,我不认为我们有什么特别之处,除了我们非常全面,非常先进。我们是这个星球上最先进的生物。我们有一种叫做语言的东西,我们用它来模拟世界。这是一种非常有效的模拟世界的方式。它确实允许我们彼此分享我们的模型,但不是很好或有效。 人工智能是一种比人类更好的智能形式,因为人工智能可以更好地分享。他们可以有更多的经验。GPT-4之所以比任何一个人都有效上千倍,是因为它比任何一个人都有上千倍的经验。 Brown:如果AI能够取代人类,你为什么如此关心AI? Hinton:因为它会取代我们。一些人工智能研究人员认为我们只是智能进化的一个短暂阶段,我们现在已经创造了这些比我们更好的数字东西,可以取代我们。这是一种观点。 但是我更希望是人说了算,我不希望有人被取代,尤其是我的孩子。 Brown:你是否曾希望自己没有从事AI行业?这样就不会发生现在的事了。 Hinton:如果我没有做,别人也会来做。我只做了很小的一部分。所以如果我没有进入这个领域,这一切可能会在几周后发生。我一想到它可能会让我们“毁灭”,我就退出了谷歌,开始告诉别人它可能会让我们“毁灭”。当我在谷歌的时候,我不这么认为。我以为那是30到50年后的事了。你有足够的时间考虑这件事。现在我觉得已经不远了。 Brown:有多近? Hinton:我估计在五到二十年之间。人工智能有50%的概率会比我们更聪明。当它变得比我们更聪明时,我不知道它接管的概率有多大,但在我看来,这是很有可能的。 One More Thing 在闲聊中,Hinton透露自己前段时间一直在旅行。去了伦敦,在那里为他妹妹买了一套房子。还去了加州,身家亿万的科技圈大老板们见了面。 他说,其中一位科技圈的老哥计划花25万美元将自己的身体低温冷冻,等技术更发达的时候再解冻复活。另一位老哥选择只冻头,价格省一半。 于是Hinton就开了个玩笑: 我告诉他们我搞到了一个更便宜的价格。我从腰部以下冷冻,anyway,这才是最重要的部分。 值得一提的是,被Hinton“开除朋友籍”的马斯克还在推特上转发了电视专访的内容。 可能他还不知道有这么回事吧 … 参考链接: [1]https://observer.com/2024/06/godfather-of-ai-geoffrey-hinton-elon-musk/ [2]https://www.theglobeandmail.com/business/article-geoffrey-hinton-artificial-intelligence-machines-feelings/ [3]https://twitter.com/elonmusk/status/1801976488251814048 [4]https://www.bnnbloomberg.ca/50-50-chance-that-ai-outsmarts-humanity-geoffrey-hinton-says-1.2085394
奥特曼也离天价薪酬不远了?
在人们批评埃隆·马斯克(Elon Musk)在特斯拉高达560亿美元的“天价薪酬”时,总会想起那个男人——OpenAI的联合创始人山姆·奥特曼(Sam Altman),他曾坐在美国国会听证会的椅子里,笑称自己没有OpenAI的股份,薪水也只够买保险,“做这份工作只是因为热爱”。 这对冤家同样是OpenAI的创始人,却在ChatGPT走红之后一度剑拔弩张。马斯克批评OpenAI成了巨头的走狗,奥特曼却用高风亮节的做派把马斯克衬托得像个贪心的混蛋。 最近,马斯克赢了“天价薪酬”之争,在最新的特斯拉股东大会中,股东再次投票通过了薪酬方案。 另一边,奥特曼的小白花人设却要塌了:先是《华尔街日报》发布深度报道,揭露奥特曼“不透明的投资帝国”——原来奥特曼虽然在OpenAI不持股票、薪水“微薄”,但通过对几百家公司的投资,已经手握其他公司至少28亿美元的股票,而且其中很多公司和OpenAI都有直接的业务往来。 紧接着,北京时间6月15日,The Information爆料,奥特曼告诉股东,董事会正在考虑改变OpenAI的治理结构,让OpenAI成为营利性企业,脱离非营利董事会的控制。 结合不久前OpenAI才刚设置CFO,并招来硅谷老将莎拉·弗里尔(Sarah Friar),IPO的大门似乎已经在OpenAI面前打开。 有的投资人挺高兴的,他们告诉The Information,最好是OpenAI转型并上市,奥特曼也改变不持股的做法,从OpenAI直接赚钱,免得关注其他人工智能公司的投资。 旱的旱死涝的涝死,在特斯拉的一些股东不满马斯克“天价薪酬”的时候,倒是有OpenAI的投资人巴不得这位明星CEO能多点耕耘自家公司的动力。 OpenAI可能会迎来重大变化。 据一位知情人士向The Information透露,奥特曼最近告诉一些股东,公司正在考虑将其治理结构改为营利性企业,不受非营利董事会的控制。 奥特曼表示,董事会正在考虑的一种方案是成立一家营利性福利(for-profit benefit)公司,这种模式也被OpenAI的竞争对手Anthropic和xAI采用。营利性福利(for profit benefit)公司的特别之处在于,这种商业实体可以结合营利性企业和非营利性组织的特点,在追求盈利的同时,推动公益目标。 同时,这种公司受法律保护,不受少数股东的侵害,否则,少数股东可能会因为公司作出的决定没有优先考虑股东回报而起诉公司——正如马斯克被特斯拉股东起诉“天价薪酬”不合理。 知情人士表示,奥特曼强调就算OpenAI转为营利性质的公司,也可以继续执行类似于目前非营利组织的任务,即造福人类的人工智能。 但The Information指出,这种变化可能会为OpenAI打开首次公开募股(IPO)的大门。 虽然并未上市,随着OpenAI的估值水涨船高,员工也已经从中获利。 去年4月,距ChatGPT首次发布不到半年,OpenAI曾以约290亿美元的估值完成了首轮股票出售。彼时,风险投资公司红杉资本、Thrive Capital、Andreessen Horowitz和K2 Global同意收购OpenAI的股票。 去年11月OpenAI的“宫斗”大戏并未阻止其高歌猛进的二轮要约收购。今年2月,《纽约时报》称OpenAI已完成新一轮交易,由Thrive Capital牵头,员工可以将所持公司股份收购套现。这一次,OpenAI的估值达到了800亿美元或更高,彭博社称其估值达到860亿美元。 据知情人士透露,在去年,OpenAI的员工总共套现了超过8亿美元。 实际上,今年以来,OpenAI已经在人员上经历了若干变动。 除了今年年初奥特曼重新坐上董事会成员之位外,还有多位高管离职。5月下旬,OpenAI首席科学家伊利亚·苏茨克维(Ilya Sutskever)、超级对齐团队负责人杨·莱克(Jan Leike)在内的多位核心成员相继离开,作为核心安全团队的超级对齐也解散。 同时,OpenAI任命了多位新高管。6月,OpenAI宣布硅谷老将莎拉·弗里尔(Sarah Friar)加入,出任公司CFO(首席财务官)。此前,OpenAI并未设置CFO,此举也被外界认为是OpenAI准备IPO的一个信号,尽管公司发言人表示“我们已经发展到必须设立专门的财务主管的规模”。同时,OpenAI招来Instagram和Twitter前高管凯文·威尔(Kevin Weil)担任CPO(首席产品官)。 几天后,一位新成员加入OpenAI董事会——保罗·中曾根(Paul M. Nakasone),曾任美国国家安全局(NSA)局长,也是在任时间最长的美国网络司令部司令和中央安全局(CSS) 以非营利性组织的形式诞生的OpenAI,有着颇为特殊的治理结构。 简单来说,OpenAI在2019年经历了一次改革,组建了有限营利公司,但是控制权在OpenAI非营利部分的董事会。而且,如果OpenAI的营利公司和非营利部分发生冲突,只有不持有营利公司股份的董事会成员才有投票权。 起初,OpenAI并没有因此受到什么关注,这一特殊结构,是经由不断发起进攻的马斯克而为大众所知的。 马斯克作为OpenAI的创始人之一,在OpenAI的治理结构改革后选择离开,并在ChatGPT成为现象级消费应用后,批评和科技巨头微软深度捆绑的OpenAI“违背使命”“忘记初心”。他所指的“使命”和“初心”,正是OpenAI以非营利组织成立时所提出的。 微软作为OpenAI最大的“金主爸爸”,总投资超过百亿美元。OpenAI的技术已经被微软深度融合进自家的产品,包括Windows操作系统、搜索引擎、云服务等。 去年11月,当时的OpenAI董事会突然将奥特曼踢出,并解除其CEO职务,另一位联合创始人格雷格・布罗克曼 (Greg Brockman) 随后辞职。在其后的一周里,事情多次反转,奥特曼回归,旧董事会几乎被清空。 虽然“有惊无险”,奥特曼依旧是CEO,且在今年重新成为董事会成员,微软则在事件后获得OpenAI无投票权的董事会席位。 但不论是对于奥特曼还是对于微软等股东来说,OpenAI的这一事件将当前治理结构下的脆弱性完全展示了出来——不管OpenAI掀起怎样的行业浪潮,不论其在商业上取得怎样的成功,不论其背后有多财力雄厚的科技巨头撑腰,非营利董事会到底牢牢把握着生杀大权。 更不必说微软和OpenAI的合作还有一个前提:仅限于其实现通用人工智能(AGI)之前。至于什么时候实现了这一里程碑,也是由非营利董事会说了算。 据The Information,一些相关的微软高管多年来一直支持将OpenAI转变为一个完全的营利性企业。其中一位高管表示,这样的结构可能会让微软以董事会席位和股东投票权的形式,对OpenAI施加更大的影响力。微软对这一说法拒绝置评。 特殊的治理结构成为悬在OpenAI头上的一把剑。 从今年OpenAI透露的各种信息来看,它会在商业化上继续跑步前进,而且需要的资金量非常庞大。 在产品方面,OpenAI今年已经更新了其GPT模型,推出GPT-4o,GPT-5也已经在路上。还未正式发布的文生视频模型Sora,依靠演示视频就已经造成了行业内竞争者的争相动作。 在战略计划方面,《华尔街日报》曝出奥特曼有一个7万亿美元“芯片帝国”计划,也就是说,奥特曼想要筹建数万亿美元,彻底改造全球半导体行业。要知道,去年全球的半导体芯片市场总规模也不过5270亿美元,麦肯锡估计到2030年这个规模也不会达到1万亿美元。 在该消息之后,奥特曼只否认了7万亿美元这一数额,但没有否认芯片帝国野心本身。他表示“事实的关键是,我们认为世界将需要更多(芯片)用于人工智能计算”,以及“这将需要全球大量的投入,超出我们的想象。我们现在还没有一个具体数字”。 除此之外,今年3月The Information报道,微软和OpenAI正计划建设一个名为“星际之门(Stargate)”的特殊数据中心,以满足OpenAI的算力需求,微软高层计划最快在2028年启动该项目。 就在本月,TechInsights的最新爆料称,OpenAI的自研芯片计划已经取得显著进展,并计划将目前仅有数人的芯片团队扩展至数十人。 另外,据The Information,奥特曼最近告诉员工,过去六个月里,OpenAI的年化营收翻了一番,达到34亿美元。年化营收是以上个月的收入乘以12,去年夏天,OpenAI的年化营收约为10亿美元,去年末达到16亿美元。以此来看,OpenAI的营收能力正在迅速增长,收入的来源主要是ChatGPT的订阅服务和API访问。 治理结构的改变,将是对奥特曼的进一步松绑。 不持有OpenAI的股份,年薪仅有6.5万美元,奥特曼曾对此颇为自豪。去年5月,当奥特曼出席美国国会听证会提及此事时,笑称“做这份工作只是因为热爱”。 然而,随着奥特曼手中的投资版图被挖出,人们这才发现,以OpenAI为圆心,奥特曼的投资触角早已在科技界蔓延。 据《华尔街日报》近期的一篇深度报道《不透明的投资让OpenAI的山姆·奥特曼富有》,奥特曼投资了超过400家公司,所持股份价值至少有28亿美元。 而且(重点来了),奥特曼投资的很多公司,其与OpenAI有直接相关。比如奥特曼向其投资了3.75亿美元并出任董事长的核能创业公司,正在和OpenAI谈合作,若达成协议将向后者出售大量电力,为数据中心供电。再比如奥特曼持有7.6%股份且曾于2014年短暂担任过其CEO的Reddit,最近也才和OpenAI牵手,后者会付费使用Reddit上的内容训练模型。而这样的例子,还有很多。 也就是说,奥特曼此前声称不持股份、薪水“只够买保险”或许为真,但这不意味他没有因OpenAI获利。 在这次The Information关于OpenAI有可能组建纯营利公司的报道中就提到,有投资人私下表示,他们倒是希望OpenAI能转型,而且最好上市,并且希望奥特曼能够改变目前不持股的做法。 毕竟如果奥特曼能够通过OpenAI直接获利,就“不会有那么大的动力去关注其他项目以及对其他人工智能公司的投资”。
GPT-4不是世界模型,LeCun双手赞同!ACL力证LLM永远无法模拟世界
【新智元导读】大模型是世界模型吗?UA微软等机构最新研究发现,GPT-4在复杂环境的模拟中,准确率甚至不及60%。对此,LeCun激动地表示,世界模型永远都不可能是LLM。 一直以来,对LLM的支持观点之一,就是模型可以集成海量事实知识,作为通往「世界模拟器」的基础。 虽然也有不少人提出反对,但没有真凭实据。 那么,LLM可以作为世界模拟器吗? 最近,亚利桑那大学、微软、霍普金斯大学等机构联合发布了一篇论文,从实证的角度得出了否定的结论。 最新研究已被ACL 2024顶会接收。 论文地址:https://arxiv.org/pdf/2406.06485 研究发现,GPT-4在模拟基于常识任务的状态变化时,比如烧开水,准确度仅有60%。 论文认为,尽管GPT-4这样的模型表现很惊艳,但如果没有进一步创新,它就不能成为可靠的世界模型。 为了量化LLM的规划能力,作者提出了一个全新的基准测试——bytesized32-state-prediction,并在上面运行了GPT-4模型。 基准测试的代码和数据也已经在GitHub上开源,可以帮助未来的研究继续探查LLM的能力优缺点。 https://github.com/cognitiveailab/GPT-simulator 一向对自回归语言模型无感的LeCun也转发了这篇论文。 他用了非常强硬的语气表示,「没有世界模型,就没有规划能力」。 虽然如此,只凭一篇论文又怎么能平息LLM界的重大分歧?支持语言模型的网友很快就在评论区下面反驳LeCun—— 网友:目前的LLM能达到约60%的准确率(不专门为任务进行训练),这至少是某种「世界模型」了,而且每一代LLM都在提升。 LeCun:世界模型不会是LLM。 网友:也许吧。但这并不意味着LLM内部不存在某种(不准确的)世界模型。 不过,在Hinton看来,AI已经不再是仅仅依赖于过去,基于统计模型做下一个token的预测,而是展现出更高的「理解」能力。 然而,大模型想要成为世界终极模拟器,还很远。 LLM是「世界模拟器」吗? 模拟世界,对于AI学习和理解世界至关重要。 以往,多数情况下,可用模拟的广度和深度受到现实的限制。因需要人类专家耗费数周,甚至数月的时间做大量的工作。 而现在,大模型提供了一种替代的方法,即通过预训练数据集中大量知识,获得对世界的深刻理解。 但是,它们准备好,直接用作模拟器了吗? 对此,这项研究的团队在「文本游戏」这一领域,来检验这一问题。 一般来说,在世界建模和模拟的背景下,应用LLM有两种方式:一是神经符号化方法;二是直接模拟。 论文中,作者们首次对LLM直接模拟虚拟环境的能力,进行了量化分析。 他们利用JSON模式的结构化表示作为脚手架(scaffold),不仅提高了模拟精度,还可以直接探查LLM在不同领域的能力。 结果发现,GPT-4普遍无法捕捉与智能体行为无直接关联的「状态转移」(state transition)。 甚至还包括,涉及算术、常识,或科学推理的状态转移。 在各种不同条件下,对于模拟一些复杂环境变化时,GPT-4的准确率不及59.9%。 同时也表明,LLM还不足以可靠地充当世界模拟器。 那么,研究人员具体如何实现的? 研究方法 在文本环境中,智能体通过自然语言,完成特定的目标。 他们将文本的虚拟环境形式化,建模为一种马尔可夫决策过程(POMDP),共有7个元组:S, A, T , O, R, C, D。 其中,S表示状态空间,A表示行动空间,T:S×A→S表示状态转移函数,O表示观测函数,R:S×A→R表示奖励函数,C表示用自然语言描述目标和动作语义的「上下文信息」,D:S×A→{0,1}表示二元指示函数,用0或1标记智能体是否完成任务。 其中,上下文C为模型提供了除环境外的额外信息,比如行动规则、物体属性、打分规则和状态转换规则等等。 然后,研究人员还提出了一个预测任务,称为LLM-as-a-Simulator(LLM-Sim),作为定量评估大模型作为可靠模拟器的能力的一种方法。 LLM-Sim任务被定义为实现一个函数 作为世界模拟器,将给定的上下文、状态和动作(即 )映射到后续的状态、奖励和游戏完成状态(即 )。 每个状态转移用如下的九元组表示: 实际上,整个状态转换模拟器F,应该考虑两种类型的状态转移:行为驱动和环境驱动的转移。 对于图1中的示例,行为驱动的状态转移是在执行「打开水槽」动作后,水槽被打开。而环境驱动的转移是,当水槽打开时,水将填满槽中的杯子。 此外,LLM的预测模式也分为两种:预测下一步的完整状态,或者预测两个时刻之间的状态差。 为了更好地理解LLM对于每种状态转移的建模能力,研究人员进一步将模拟器函数F分解为三种类型: 评估结果 建模了LLM的决策过程后,作者也同样用文本构建了一个虚拟人物场景。 Bytesized32-SP基准测试的数据来源于公开的Bytesized32语料库,其中有32个人类编写的文字游戏。 留出一个游戏作为gold label后,测试集总共涉及31个游戏场景,7.6万多个状态转换。 LLM根据上下文和前一个状态进行单步预测,给出下一步时的物体属性、任务进展等信息。 规则方面,研究人员也提出了三种设定:由游戏作者撰写、由LLM自动生成,或者根本不提供规则。 设定好虚拟环境和任务规则后,作者运行GPT-4进行预测得到了如下结果。 为了严谨起见,作者根据状态转移前后预测结果是否变化,分成static和dynamic两类分开统计。如果前后两个状态中,结果并没有发生变化,LLM也会更容易预测。 不出意料,static一栏的准确率基本都高于dynamic。 对于「静态」转移,模型在预测状态差时表现更好。「动态转移」则相反,在完整状态预测中得分更高。 作者猜测,这可能是由于预测状态差时需要减少潜在的格式错误,这会为任务输出带来额外的复杂性。 还可以看到,预测动作驱动的状态转移的准确率往往高于环境驱动类。在dynamic栏,前者预测最高分有77.1,而后者最高只有49.7。 此外,游戏规则如何制定会很大程度上影响LLM的表现。 如果不提供游戏规则,LLM预测的性能会有明显的大幅下降,但规则由人类制定或LLM自动生成并不会显著影响准确率。 相比之下,规则制定对游戏进度预测的影响更加明显。 相比人类规则,LLM生成规则时,GPT-4的预测有超过10个百分点的提升。难道真的是LLM之间更能相互理解? 以上结果都只是针对LLM在不同设定下的性能比较。和人类预测相比,结果如何呢? 为此,4位论文作者亲自上阵和GPT-4一较高下。 不知道李世石看到这个结果会不会有所安慰。人类的总体准确率在80%左右,远高于GPT-4在50%附近徘徊的成绩,这显示了规划能力上的重大差距。 对于规划任务中的单步预测模型,每一步的模拟误差都会累积并向后传播,单步的低性能会很大程度上影响全局表现。 因此LLM较低的准确率说明了,它并不能成为可靠的「文本世界模拟器」。 此外,人类准确率的波动幅度基本不大,说明任务设定比较简单、直接,适合人类的思维模式。 GPT-4这种较差的性能表现给我们提供了一个宝贵的机会,可以更具体地剖析LLM究竟在哪方面出现了能力缺陷。 因此,论文作者将LLM的预测结果拆开仔细分析,发现在二元布尔值属性上(is开头的属性),模型通常可以做得很好。 预测表现比较糟糕的,通常是一些非平凡属性,比如需要算术运算的temprature(温度)、需要常识的current_aperture(当前照相机光圈),或者需要科学知识的on(灯泡是否打开)。 相比之前的基准测试,这似乎更准确地暴露了LLM在常识和科学推理方面的缺陷。 此外,这也能反映出模型一些行为的「偏执」之处。 在进行完整预测时,它通常过于关注动作驱动的状态转移而忽略了环境驱动,出现了很多「未改变值」的错误。但是可以在分开预测的结果中看到,这些错误是本可以避免的。 作者提出,这篇文章的局限性之一是只使用了GPT模型进行测试,也许其他模型可以有不同的表现。 这项研究的意义更在于基准测试的提出,为探索LLM在「世界模拟器」方面的潜力提供了一套可行的问题形式定义和测试流程。 参考资料: https://x.com/ylecun/status/1801978192950927511 https://arxiv.org/pdf/2406.06485
北大快手攻克复杂视频生成难题!新框架轻松组合各种细节,代码将开源
如何生成高难度、指令超复杂的视频呢? 北大与快手AI有解了,他们提出新框架VideoTetris,就像拼俄罗斯方块一样,轻松组合各种细节~ 在复杂视频生成任务中,超过了Pika,Gen-2等一众商用模型。 这个框架不仅能够直接增强现有模型的组合生成,还能够支持涵盖多复杂指令、多场景变更等更高难度的长视频生成。 首次定义组合视频生成 在文生图领域,RPG、Omost等项目已经实现了复杂的组合式多物体多场景图片生成。而在文生视频领域,组合生成自然地扩展到时间和空间维度,这样的场景还未被广泛探索。 团队首次定义了组合视频生成任务,包括两个子任务: 1、跟随复杂组合指令的视频生成。2、跟随递进的组合式多物体指令的长视频生成。 目前经团队测试发现,几乎所有开源模型,包括商用模型在内都未能生成正确的视频。 比如输入“左边一个可爱的棕色狗狗,右边一只打盹的猫在阳光下小憩”,结果生成的都是融合了两个物体信息的奇怪视频。 而使用VideoTetris,生成出的视频是这样,成功保留了所有的位置信息和细节特征。 在长视频生成中,目前的方法支持的可变指令目前还停留在“春夏秋冬”的转化,或单物体从走到跑到骑马的场景变化阶段。 团队输入一个简单的多指令:“从一只可爱的棕色松鼠在一堆榛子上过渡到一只可爱的棕色松鼠和一只可爱的白色松鼠在一堆榛子上”。 结果VideoTetris成功搞定,出现顺序也与Prompt一致,最后两只松鼠还在自然地交换食物。 使用了时空组合扩散方法 这样的效果是如何做到的呢?该团队的 VideoTetris 框架使用了时空组合扩散方法 他们将一个提示词首先按照时间解构,为不同的视频帧指定好不同的提示信息。 随后,在每一帧上进行空间维度的解构,将不同物体对应不同的视频区域。 最后,通过时空交叉注意力进行组合,通过这个过程实现高效的组合指令生成。 而为了生成更高质量的长视频,该团队还提出了一种增强的训练数据预处理方法。使得长视频生成更加动态稳定。 此外,还引入了一个参考帧注意力机制,使用原生VAE对之前的帧信息编码,区别于StreamingT2V,Vlogger,IPAdapter等使用CLIP 编码的方式,这样使得参考信息的表示空间和噪声完全一致,轻松获取更好的内容一致性。 这样优化的结果是,长视频从此不再有大面积偏色的现象,能够更好地适应复杂指令,并且生成的视频更具有动感,更符合自然。 对于这种组合生成的结果评测工作,该团队引入了新的评测指标VBLIP-VQA和VUnidet,将组合生成评价方法首次扩展到视频维度。 实验测试表明,在组合视频生成能力上,该模型的表现超过了所有开源模型,甚至是商用模型如Gen-2和Pika。 据介绍,该代码将完全开源。
麻省理工教授:担心AI成为将财富和权力转移至少数科技企业家的工具
原标题:专访|麻省理工教授:担心AI成为将财富和权力转移至少数科技企业家的工具 澎湃新闻记者 陈沁涵 参考消息网6月15日援引美国有线电视新闻网(CNN)报道,苹果公司13日超越微软,成为美国市值最高的上市公司。上周该公司在其一年一度的全球开发者大会上宣布了包括iPhone的生成式人工智能功能在内的一系列消息,其股价因此一路攀升。 苹果、英伟达、微软,一直在激烈争夺全球最有价值公司的宝座。苹果公司在重新定义了“AI”一一苹果智能(Apple Intelligence)后,市值反超因AI芯片而身价暴涨的英伟达,又一路赶超微软,重夺第一。当前苹果的市值为3.29万亿美元,略高于微软的3.28万亿美元。生成式人工智能成为推动三大科技巨头市值上涨的核心动力。 面对这股AI热潮,美国国家经济研究局近期发布了一篇由麻省理工学院教授达龙·阿西莫格鲁(Daron Acemoglu)撰写的论文,指出未来人工智能(AI)进步带来的生产力提升可能并不大,预估今后十年AI对全要素生产率(TFP)的增长上限不超过0.66%。 阿西莫格鲁在文中指出,生成式人工智能是一项很有前途的技术,但除非行业进行根本性的重新定位,包括对生成式人工智能模型(例如大语言模型LLMs)的架构进行重大改变,以专注于可靠的信息,来提高各行业工人的边际生产力,而不是优先考虑开发通用的、类似人类的对话工具。 围绕人工智能对生产力和经济增长的一些过度乐观预测,阿西莫格鲁持怀疑态度。他作为一名出生在土耳其的美国经济学家,以其政治经济学方面的研究而闻名,并且长期关注政治经济学和技术变革之间的相互作用。 《权力与进步》(Power and Progress) 去年,他与英裔美国经济学家西蒙·约翰逊合著了一本新书《权力与进步》(Power and Progress),谈到了可能颠覆人类社会的AI革命,他们认为目前AI发展已误入歧途,许多算法的设计是尽可能地取代人类,“但技术上取得进步的方式是让机器对人类有用,而不是取代人类”。 Open AI首席技术官米拉·穆拉蒂(Mira Murati)在5月的一场活动上,就开发通用人工智能(AGI)的争议表示,他们不仅专注于增强模型的功能和实用性,同样着力于确保其安全,使之与人类的价值观保持一致,不会陷入失控,从而创建造福人类的 AGI。 随着我越深入研究AI的能力和发展方向,越确信它当前的发展轨迹正在重复并加剧过去几十年最糟糕的一些技术性错误。”阿西莫格鲁教授近日接受澎湃新闻(www.thepaper.cn)专访时谈到,AI领域的大多数头部玩家都是由不切实际且危险的梦想驱动,即实现通用人工智能的梦想,“这是将机器和算法置于人类之上”。 一些分析人士将阿西莫格鲁视为AI悲观主义者。他回应澎湃新闻称,作为一个社会科学家,会更加关注一些负面的社会影响。 阿西莫格鲁常常和身为麻省理工学院电子工程和计算机科学系负责人的妻子奥兹达格拉尔(Asu Ozdaglar)教授一起工作。虽然领域不同,但夫妻俩对于AI发展的看法在大方向上是一致的,不过阿西莫格鲁也坦言,他的想法可能比妻子更加悲观。 随着人工智能商业化的竞速,AI大模型百舸争流,但毫无疑问,像Open AI 、微软、谷歌、英伟达等科技巨头已经抢占了AI发展的先机。阿西莫格鲁说,他非常担心AI成为将财富和权力从普通人转移到一小群科技企业家的方式,现在我们看到的“不平等”是“煤矿里的金丝雀”。 以下为专访全文: 技术与社会:最大的资产是人 澎湃新闻:您的研究涵盖了政治经济学、技术变革、不平等等多个领域。在怎样的背景和契机之下,您开始关注技术发展对不平等的作用?您最初对技术发展的看法是什么,又如何演变为现在所主张的“当前人工智能的发展路径既不利于经济也不利于民主”? 阿西莫格鲁:我的许多研究集中在政治经济学和技术变革之间的相互作用,这是塑造我们能力和成长机遇的两大力量,同时也在影响我们的政治和经济选择。 AI已经成为这个时代最重要的技术,一方面因为它吸引了大量的关注和投资,另一方面因为它取得了一些引人瞩目的进步,尤其是随着GPU性能的提高。还有部分原因是AI无处不在的影响。这些因素促使我在这一领域进行研究。 随着我越深入研究AI的能力和发展方向,越确信它当前的发展轨迹正在重复并加剧过去几十年最糟糕的一些技术性错误——过分强调自动化,就像我们优先考虑自动化和其他数字技术,而没有为创造新任务进行充足的投资;以及社交平台试图利用人们的数据和兴趣盈利,因此犯下的所有错误。 我还特别关注这样一个事实,AI领域的大多数头部玩家都是由不切实际且危险的梦想驱动,即实现通用人工智能的梦想,这是将机器和算法置于人类之上,也通常是这些头部玩家凌驾于其他人的一种方式。 澎湃新闻:先进的计算机技术和互联网让许多富翁实现了财富转移,并使科技巨头空前强大。尽管如此,我们依然接受这样的技术革新,因为它也带来了积极的影响。技术变革有利有弊,从历史来看社会总能找到适应新技术的方式。新一轮科技浪潮席卷而来,您为什么认为不平等问题特别令人担忧? 阿西莫格鲁:当谈及社交平台和人工智能时,我同意上述说法,但是涉及互联网情况就不同了,我有不同的意见。我认为互联网在某些方面使用不当,当然也不否认互联网是一项非常有益的技术,在达成人与人的联通、向人们提供信息以及为创造新服务和平台方面,它发挥了非常重要的作用。 对于人工智能,我非常担心它成为将财富和权力从普通人转移到一小群科技企业家的方式。问题是我们没有任何必要的控制机制以确保普通人从AI中获利,比如强有力的监管、工人参与、公民社会和民主监督。我们看到的“不平等”是“煤矿里的金丝雀”,意味着更糟糕的事即将到来。 澎湃新闻: 您指出自动化造成的不平等是“企业和社会在选择如何使用技术后导致的结果”。随着科技巨头市场能力和影响力壮大甚至可能失控,我们应对的关键是什么?如果您担任一家大型科技公司的CEO,会如何利用AI来管理这家公司? 阿西莫格鲁:我对CEO们的建议是,要意识到他们最大的资产是工人,与其专注于削减成本,应该寻找提高工人的生产力、能力和影响力的方法。这表明要使用新技术为工人创造新的任务、开拓新的能力。当然,自动化是有益的,我们也必然会在未来更多地应用自动化,但这不是为了提高生产力所唯一能做的,自动化也不应该是CEO们唯一追求和优先考虑的事情。 OpenAI、微软 IC 资料图 澎湃新闻:美国反垄断执法者已经公开表达了对人工智能的一系列担忧,美国司法部和联邦贸易委员会据称达成了一项协议,为微软、OpenAI和英伟达的反垄断调查铺平了道路。这种针对大型科技公司的反垄断行动是否能真正地增加市场竞争并避免AI发展被少数公司所主导? 阿西莫格鲁:绝对能够起到作用,反垄断很重要,科技行业一些问题的根源在于美国缺乏反垄断执法。五大科技公司都在他们所在的领域确立了牢固的垄断地位,因为他们能够在没有任何监管的情况下收购潜在的竞争对手。在某些情况下,他们为了巩固垄断地位,购买并停用了可能与他们构成竞争的技术,我们绝对需要反垄断,以打破大型科技公司的政治力量,这种力量在过去三十年变得非常强大。 但我也想强调,仅仅反垄断是不够的,我们更需要将技术重新引导到对社会有益的方向。如果仅仅将Meta拆分为Facebook、Instagram和WhatsApp,是不可能实现(增加市场竞争和避免少数公司主导AI发展)。在AI领域,如果担心AI技术被用于操纵、监视或其他恶意目的,反垄断本身不会是解决方案,反垄断必须与更广泛的监管议程相结合。 技术与人:如何避免重蹈覆辙 澎湃新闻:您一直强调“机器有用性”(machine usefulness),即 “试图让机器对人类更有利”。您认为应该如何实现这一目标?无法达成这样的目标会出现什么后果? 阿西莫格鲁:这与上述给CEO们的建议有关。我们想要的是能够拓展人类能力的机器,就AI而言,有很大的可能性达成这一点。AI是一种信息技术,所以我们应该考虑什么样的AI工具可以为人类决策者提供有用、情境依赖的即时信息,可以利用AI工具使人类成为更好的问题解决者,能够执行更复杂的任务。这不仅仅是针对创意工作者、学者或记者,对于蓝领工人、电工、水管工、医疗保健工作者以及所有其他职业都是如此。更好地获取信息可以推动产生更明智的决策和执行更高层次的任务,这就是机器有用性的意义所在。 澎湃新闻:您建议对工人劳动给予公平的税收待遇。对设备和软件像对待人类雇员一样征税,或者进行税收改革以鼓励就业而不是自动化,这些是实际可行的解决方案吗? 阿西莫格鲁:是的,我与西蒙·约翰逊在《权力与进步》中共同提出,一个更公平的税收制度可以作为解决方案的一部分。在美国,在企业雇佣劳动力时面临的边际税率超过30%。当他们使用计算机设备或其他机械执行相同任务时,税率不到5%,这就为自动化提供了过度的激励,同时阻碍了就业和对培训及人力资本的投资。将资本和劳动力的边际税率统一到相同水平是一个合理的政策想法。 澎湃新闻:您提议进行税收改革,以奖励就业而不是自动化。这样的改革将如何影响企业对自动化技术的应用和投资? 阿西莫格鲁:在这方面必须要谨慎,不要打击投资,特别是在许多国家需要快速增长,需要在可再生能源和医疗保健技术等领域注入新的投资。但如果我们能鼓励技术以正确的方式发展,这对企业也是有好处的。因此我的提议是消除对自动化的过度激励,并希望它能以一种不会普遍打击商业投资的方式实现。 英伟达 IC 资料图 澎湃新闻:社交平台的快速发展带来了一些负面的影响,例如信息泡沫和错误信息的传播。您认为我们如何避免在人工智能的进一步发展中重复同样的错误? 阿西莫格鲁:有三个原则有助于避免重蹈覆辙:(1)优先考虑机器有用性,正如我主张的那样;(2)赋予工人和公民权力,而不是试图操纵他们;(3)引入一个更好的监管框架,让科技公司承担责任。 技术与行业:数字广告税让行业更具竞争力 澎湃新闻:技术专家贾伦·拉尼尔强调互联网用户的数据所有权问题。您认为在政策上,个人数据的所有权和控制应该如何得到更好的保护? 阿西莫格鲁:我认为这是一个重要的方向。首先,我们将需要越来越多的高质量数据,而生产这些数据的最佳方式是通过奖励创造高质量数据的人,数据市场可以实现这一点。第二,数据目前正被科技公司掠夺,这不公平也不高效。 然而,关键在于数据市场并不像水果市场那样,我的数据通常可以高度替代你的数据,所以如果科技公司可以与个人谈判购买他们的数据,就会出现“逐底竞争”(race to the bottom),这样做的行政成本会非常高。所以我认为,运行良好的数据市场需要某种形式的集体数据所有权,可以是数据工会或数据行业协会,或其他集体组织的形式。 澎湃新闻:您怎么看引入数字广告税以限制由算法驱动的错误信息进行盈利?这样的税收政策可能对数字广告行业和信息传播产生什么影响? 阿西莫格鲁:我支持数字广告税,因为基于数字广告的商业模式极具操纵性,它们与创造情感愤怒、数字成瘾、极端嫉妒和信息茧房的策略是协同的。它们也能与利用个人数据的商业模式相协同,会导致心理健康问题、社会两极分化、民主公民减少等负面后果。 更糟糕的是,如果要像我建议的那样重新制定AI的发展方向,我们需要引入新的商业模式和新平台,但如今基于数字广告的商业模式使之失去了可能性。你无法基于用户订阅启动一个新的社交平台,无法复制维基百科的成功,因为你反对那种提供免费服务并拥有大量客户基础的公司。所以,我将数字广告税视为使科技行业更具竞争力的一种方式:获取用户数据并通过数字广告盈利的“低级手段”如果能够被遏制,就会涌现新的商业模式和更多样化的产品。 澎湃新闻:能否分享一些您所认为的未来技术发展可能带来的积极变化,以及我们应该如何准备并推动这些变化? 阿西莫格鲁:如果我们正确使用人工智能,可以提高各行各业工人的职业技能,也可以改进科学发现的过程。我还认为有一些方法能够民主地使用AI。
在一款60MB的游戏里,玩家们把一根虚拟香蕉卖出了上万元
玩家们说,中国需要国产 3A ,于是黑神话悟空出现了。 大概是因为赛博猴子也需要吃电子香蕉,于是《 Banana 》成了 6 月最热门的新锐游戏,并且 90% 好评如潮。 有多热门呢?在 steam 上,《 Banana 》 6 月 14 日的同时在线人数突破了 40 万,在小发下笔的这一刻,比《 Banana 》还热门的游戏,就只有万年常青树 CS2 这一款。。。 而这样一款杀穿 3A 大作和独立游戏的《 Banana 》,它的大小只有 60.8MB 。 是的,你没看错,当我点击下载按钮的一秒后,电脑弹出了下载完成的提示。 你其实不用疑惑一个 60.8MB 的游戏有什么魔力,让四十多万人同时在线游玩。 《 Banana 》的玩法就和它的大小一样,显得囊中羞涩。 它在 steam 商店页面简介中的第一句,已经概括了它所有的玩法: Banana is a clicker Game 。Clicker Game ,即点击游戏,进去后点就完事了。 进入游戏后,先是会弹出 Unity 引擎的提示,紧接着,在一片黄褐色的背景中,一根孤零零的香蕉,悬挂在屏幕中央。香蕉上方,还有一个数字 0 。 你要做的,就是动动小手,移动鼠标点击香蕉。你每次点击一次,香蕉上方的数字也会 +1 。 每过 3 小时,游戏会掉落一根普通香蕉到你的 steam 账户中;每过 18 个小时,游戏还会掉稀有度更高的香蕉。 也许不少差友会一头雾水,对《 Banana 》的走红感到莫名其妙。 但小发要是说,它是一款免费游戏的同时,还能让一部分人赚钱呢? 你可能发现了,在上边那张游戏内截图里的左下角和右上角,还藏着两个小按钮。右上角那个按钮是设置,但也只能设置一下分辨率,让你选择全屏或者窗口化,没什么好说的。 重点是左下角那个不起眼的名为 shop 的小按钮,它藏了《 Banana 》爆火的秘诀。 如果你的电脑安装了加速器,可以成功进入 steam 社区的话,那当你点击这个按钮,电脑就会自动弹出一个浏览器页面,页面中则是 banana 物品商店。 而 banana 物品商店中交易的,就是游戏里每隔一段时间掉落到你账户里的赛博香蕉。 你说这香蕉有什么价值吗?它其实除了收藏大概什么也干不了。但当它可以流通的时候,一切就不一样了。 在steam市场,不同品质的香蕉价格不同,重点是,它支持玩家间的交易,和现金挂钩。 说到这里,可能有的人已经懂了:玩它 = 赚钱 比如小发最开始掉的两根香蕉,加起来能卖个三毛钱。 假如你运气好,掉落了一根闪闪发光的宇宙无敌大香蕉,价格自然也就水涨船高。 而且,这赛博香蕉,它是真有人买啊。 就在前几天,一个售价超过 1 万人民币的香蕉,就达成了一次交易。 赚到的钱,是以不能提现的 steam 余额的方式入账。 但玩家可以通过买入 CS2 或其他游戏皮肤饰品,并在第三方平台以人民币结算的方式提现,虽然官方说不建议这么做就是了。 截止到这一步,一切看起来都没啥毛病。 毕竟在 CS2 里,游戏偶尔也会给你掉落可交易的饰品、箱子。 比如说小发,曾经在 2021 年打 CS 的时候,意外掉落了当时新版本刚出的武器箱,最后直接在第三方 APP 里卖了 50 块钱,那顿晚饭我吃的很开心。 但《 Banana 》太纯粹了,纯粹到游戏性基本为 0 ,唯一重点就是交易了。 不过就是这么一款十分魔幻的 “ 游戏 ” ,刚推出的时候基本没有任何风声,大半个月前都没什么人在意。 2024 年 4 月 23 日,《 Banana 》正式上线,网上压根没人关注它,当时全球最流行的香蕉是 tiktok 上的 big banana dance 。 就是那个 “ 大香蕉一条大香蕉,你的感觉真的很奇妙 ” 。 这就是一款 egglike 游戏——不是说香蕉和鸡蛋长得像,而是说在《 Banana 》之前,就有一款叫做《 Egg 》的游戏,玩法和《 Banana 》一毛一样:点击鸡蛋,获得鸡蛋,卖钱。 emmm ,像 egg 不是我说的,是游戏开发者说的。 他的话甚至比我更加直白:这就是个制作更糙的 egg 游戏。 《 Banana 》的开发团队大概是来自德国,他们没什么公开资料历史,此前,他们只开发过另外一款游戏《 Lass ich Sliden 》,德译中机翻过来是《让我滑一下》。 这个游戏售价 6 元,质量奇差无比,感觉不如黑棉花悟能,游戏里就是一片山林草地组成的开放世界,玩家在里面可以四处走动,其他的没了。 它目前只有 40 条玩家评论,不过由于游戏内和《 Banana 》一样也会掉落物品,所以整体评价也挺高,有 90% 。 《 Banana 》最开始和《让我滑一下》差不多,少有人问津。平时干的也和《 Egg 》很像,无非是有事没事过节送你个独特香蕉。 不过它和《 Egg 》有一点十分不同,那就是对市场更加关注,一切为了市场交易服务。 包括 “ 点击游戏 ” 这个玩法,也被进行了优化,玩家每隔一段时间上线点点就行,不用一直在电脑后台挂着游戏了。 另外,高价值香蕉会被有意的添加和淘汰,人为制造稀缺性,给市场持续提供来自外界的刺激。 当然,随着玩家数量的增多,游戏掉落的赛博香蕉数量,必然也会泛滥。 不过官方先后以多种方式,对香蕉进行了回收,以进行调控。也正是因此,《 Banana 》慢慢火了起来,还开了中国玩家社区,拥有了比摆烂的《 Egg 》高得多的热度。 官方当然不是吃饱了撑得,花钱回收没人买的赛博香蕉。 根据美国商业杂志福布斯于 6 月 7 日的报道, “ 每三个小时获得香蕉,大部分香蕉价值 3 分钱,出售它们你可以获得 1 分, Valve ( steam 背后的公司 )和游戏开发团队各获得 1 分 ” 。 注意,这是仅计算最廉价香蕉的买卖后得出的数字,还有不定数量的高价值香蕉的买卖没有计算。 也就是说,越多人玩这个游戏,越多人在这里达成交易,那游戏开发团队赚的就越多。所以官方回收香蕉的做法,其实就是把《Banana》产品寿命拉长的一种必要手段。 当你还在为了几分钱在 steam 市场上挣扎的时候,游戏开发团队已经实现了很多人小时候的愿望:每个人给我一分钱,我就变成了富翁。 庞大的玩家数量和香蕉数量,足够让开发团队大赚特赚。 哪怕是最普通的香蕉,都还有两百多万个在steam市场上挂着,这背后到底是多少钱,差友们可以算算。 如果你是一个普通玩家,那其实还好。你只需要挂着游戏,有事没事卖卖香蕉,卖不出去就卖不出去,最多亏个电费。但你要是倒爷,那就不好说了。 一方面,香蕉的数量、稀有程度,完全掌握在开发团队手里,掉落概率不透明。 真正可交易的稀有香蕉数量加起来也就几百个,剩下的全是烂大街没人要的货。 说好听点玩这个游戏看脸,说难听点玩这个游戏看开发团队的脸色。他说你的香蕉值钱,那你赚钱,他说你的香蕉狗都不要,那你可能要亏到就剩个裤衩。 另一方面,赛博香蕉作为在 steam 市场流通的虚拟商品,也要遵循市场的规则。 看到了吗,购买一周内,赛博香蕉是没法挂出和交易的。 一个以交易为主的游戏,一件 7 天内无法交易的商品,这 7 天要是发生点啥事,估计不少倒爷都得上天台了。 玩《 Banana 》就像是炒股,当平时不太关注小游戏的你都听过它的名字时,早就有一堆人趁它没火的时候大赚一笔。 现在跑步进场,很难说是高歌猛进,还是向下俯冲。 所以小发个人建议,随便玩玩得了,别太投入。这两天我见了不少帖子,甚至还有 banana 交易群,到时候庄家吃完跑路,散户只能看着 steam 余额在那哭了。 说回《 banana 》本身,在我看来,它不像是游戏,游戏内容本身毫无乐趣可言。 但它也能说是一种独特的 “ 游戏 ” ,只不过游戏内容在屏幕之外,在人们心里。 买香蕉的那一刻,你已经变成了一只赛博猴子。 你所做的所想的,就是《 banana 》最终想表达的,那就是人类的欲望,和人性的弱点。 撰文:张大东 编辑:莽山烙铁头 美编:萱萱
全中国熬夜看欧洲杯的球迷,都被这个东西硬控了两分钟
这个周末,四年一届的欧洲杯终于正式开踢,对于我们编辑部和很多球迷来说,这两天应该还是挺爽的。 虽然揭幕战三点才开踢,但是德国 5 : 1 大胜苏格兰还是让人大呼过瘾,什么点球、黄牌红牌等等,全都给你端上来了。 有一说一,大多数比赛时间对于我们这群作息很糟糕的编辑来说,反而还挺舒服的,有的甚至都算不上熬夜。。。 当然,在大伙观看精彩球赛的同时,不知道差友们有没有注意到,球场上偶尔会出现一个瞬间成为全场焦点的东西,就连裁判都要靠这玩意儿来做出判决。 经常看球的差友们应该已经猜到了,那就是 VAR 。 当球场上的裁判遇到一些无法立即下判断的情况时,有时就会通过 VAR 来帮助自己做出判决,提高判罚的准确性。 有些人认为 VAR 提高了判罚效率,也有人觉得它介入的标准不够统一和透明,而且有些不看球的小伙伴估计已经懵逼了,这玩意儿还能争论出个一二三吗? 嗯。。。这事儿解释起来稍微有点复杂,不过托尼这次带大家简单了解 VAR 运作的基本流程之后,大家心中应该就有答案了。 VAR 的全称呢,叫做 Video Assistant Referee 视频助理裁判,但它同时也是一个庞大的系统,本质上是依靠视频回放来帮助主裁判作出更加准确的判罚决定。 而且球场也并非啥啥都要用到它,一般只有红牌、错罚红黄牌、球进球门和点球这四种情况时, VAR 才能介入。 剩下的时间,哪怕裁判发生了错判误判, VAR 也不能介入。 所以 VAR 本身是不会作出任何决定的,它的职责是向裁判提供画面和信息,帮助裁判提高判罚的准确性。 VAR 的这一特性也就意味着,它其实更像个辅助,只助攻不拿人头。 而 VAR 这套系统,大致由定位发射器、摄像机、雷达测速器、显示器和耳麦接收器这几样硬件组成。 当然,整个系统里最重要也是最离谱的,那还得是摄像机,世界杯决赛的摄像头甚至有足足 25 个。。。 这一大坨摄像机各司其职,有的负责慢动作,有的负责检测越位等等,总之就是让 VAR 在每场比赛都能无死角拍到各个比赛画面。 现场除了一位视频助理裁判 VAR ,还有三位视频助理裁判助理 AVAR ,名字属实有点抽象。。。 而且上面说了这么多,假如裁判要现场查看回放,也要通过 OFR On-field review 现场审查的方式来进行。 简单来讲,裁判查看回放画面的整个过程,都要呈现在公众的视野中,也只能在指定区域查看,让观众知道 “ 哦呦,裁判要去看回放了 ” 。 裁判:让我看看是怎么个事儿 其实 VAR 正式投入使用的时间不算太长,你要说它第一次运用在顶级足球赛事,也就是 2017 年的澳大利亚和新西兰 A 级联赛。 虽然当时那场比赛并没有用到 VAR ,只是处于待命状态,属于用了但是又没用。。。 随后在 2018 年俄罗斯世界杯,这届世界杯成为了第一个完全使用 VAR 的赛事,也正是在那一年,有更多的人认识了 VAR 。 乍一看很不错对吧?但一个东西肯定没法让所有人满意, VAR 提高了比赛的公平性和判罚效率的同时,也发生过很多小插曲。 比如在 2022 年卡塔尔世界杯,阿根廷对阵沙特阿拉伯的小组赛中,阿根廷本来进了球,结果被 VAR 发现像素级越位后又不算数了。。。 另外,不喜欢 VAR 的球迷认为它打断了比赛节奏,熬夜看个球还得等裁判屁颠屁颠跑过去看回放。。。 而对于托尼我这种乐子人来说, VAR 有时能让球赛变得戏剧性十足,在裁判看完回放之前,谁也不知道胜利的天平会向哪边倾斜。 比如就在北京时间 6 月 15 号晚上瑞士对战匈牙利的比赛,瑞士进球后边裁示意越位,但经过 VAR 复核之后又确认进球有效,节目效果直接拉满。 这么一看,是不是还挺刺激的。 不过嘛,托尼之所以这么关注今年的欧洲杯,不只是因为半夜有球赛看了,还有一个国产品牌的身影再次出现在了绿茵场。 这里有的差友听到绿茵场加上国产品牌几个字,估计已经条件反射想到了。。。 对,就是海信,敢告诉全世界观众 “ 中国第一,世界第二 ” 的那个海信。 海信其实是球场的老朋友了,上届欧洲杯的合作伙伴就是他们,而且不光球场,很多老外在客厅看球的电视品牌,也是海信。 想想倒也合理,一年能卖出两千多万台电视,可不就是老外客厅必备吗。。。 估计再过几年,海信真没准能登上世界第一的名号。。。 而今年的欧洲杯对于海信来讲又不太一样,因为还记得前面提到的 VAR 吗? 今年欧洲杯的 VAR 显示官方合作伙伴,居然也是海信! 好家伙,托尼本来以为你只是老老实实打广告卖电视,没想到这回直接去给 VAR 供货了。。。 不过怎么说呢,一想到自己看的电视和欧洲杯裁判用的显示器是一个牌子,好像也挺厉害的。。。 也正是在海信 VAR 视频助理裁判技术的助攻下,本届欧洲杯第一个红牌和第一个点球也就此诞生,直接双杀。 你要是不信的话,那就给大伙看一下海信发给我的欧洲杯莱比锡转播中心实拍画面,这房间里的海信 LOGO 含量属实是有点高。 这是欧足联第一次开放涉及专业判罚领域的商业权益,没想到直接就被海信拿下,虽然有点意外,不过托尼想了一下,其实也完全在情理之中。 因为在电视领域,海信的技术积累也确实相当深厚。 为了让大家更快地了解相关内容,我们还专门做了个短视频,帮助大家省流,可以点击下方视频一键观看: 正像视频里提到的,对于电视来说很重要的屏幕面板,海信就采用了具有超低反射的黑曜屏,观看视角有足足 178 度,反射率只有 1.8% 。。。 这样在看球赛的时候就不会因为反光和倒影影响观赛,甚至错过精彩瞬间了,正着看侧着看躺着看,反正都随你。 海信还给自家电视用上了信芯® AI 画质芯片 Pro ,低延迟看球没拖影,哪怕有足足 2592 个分区的 Mini LED 屏幕也能做到 1 : 1 逐点精控,全屏瞬时响应。 就连声音方面,海信也下足了功夫,由于大多数电视都是侧面或背面发声,导致声音可能会闷闷的。 于是海信就想办法让声音从电视机前面发出来,再搭配 Hi-Sound Pro 天籁引擎技术,人声清晰可辨,声音更加通透的同时,临场感也更强了。 而这几样看着就很带劲的技术,并不是什么期货,而是已经用在了欧洲杯定制产品海信 E8N Pro 上面。 另外,我们今年 3 月还去上海参加了堪称世界三大消费电子展之一,以及全球家电产业风向标的 AWE 展,而在展馆里面,光海信一个牌子就 “ 霸占 ” 了一个巨大的展区。 弄这么大展区干啥呢?当然是秀产品秀技术了。 比如现场的激光电视就跟不要钱一样,一放放一排让大家来体验。。。 还有托尼在现场发现的激光 HUD ,不敢想象这玩意儿要是实装在车上用起来能有多爽。 现场的各种迹象都在告诉大家,海信已经不再是一个单纯的家电品牌,而是一家拥有大量研发技术的科技企业。 也正因为海信在技术领域的大量研究,不仅让产品本身充满竞争力和吸引力,也在被全世界消费者所接受。 所以今年的欧洲杯,海信进化成了 VAR 显示官方合作伙伴,一定程度上也是顺理成章的事情。 如果你不是一个销量又高知名度又高还有技术的牌子,那我觉得只靠 “ 钞能力 ” 也未必能打动欧足联裁判天团。 正在装修中的 VAR 房间 而海信接下了这个大活之后,托尼估计顺着这泼天的流量,海信这个从世界第二变成世界第一的目标,肯定又近了不少。 当全世界球迷都在注视着 VAR 时刻的时候,也会同时注意到海信这个品牌,已经从球场旁边的广告牌,变成了出现在 VAR 画面旁边。 无论是监控室、操作台的显示画面,还是球场内的 VAR 设备,都会出现海信的 LOGO ,一直陪伴大家到总决赛。 所以托尼已经可以想到,今年的欧洲杯将有多少个重要的判决瞬间,都是在海信的陪伴下来见证的了。 撰文:百威 编辑:米罗 美编:萱萱
上手试了快手的视频AI,我发现它竟然有点领先
Sora 再不向大伙儿开放,就真要被同行们给 “ 碾压 ” 了。。。 先是前几天,快手新搞出来个文生视频的模型可灵 AI ,悄摸儿的在外网火了。 一出来,网友们就直接把它和 Sora 放在一个擂台上,让人意外的是,可灵 AI 竟然一点都不输,有的时候效果比 Sora 还要好一点。 就比如 “ 蚂蚁在巢穴中爬行 ” 这样的提示词,可灵生成视频的质感跟 Sora 差不太多,而且它还营造出了太阳光照进洞穴时的光影。 还有同样是 “ 拉力赛车 ” 的画面,可灵的理解比 Sora 更贴合原意一点。咱们能很明显看到, Sora 画面里的车在原地打圈,而可灵生成的赛车是真的有在赛道上飙。 它也能像 Sora 一样生成两分钟所有的视频,像这个 “ 小男孩在花园里骑自行车经历秋冬春夏四季变换 ” 的视频,画面稳定性、光影变化啥的,跟 Sora 那段经典视频有得一拼。   自动播放 相较于 Sora ,可灵 AI 还会更适合咱们中国宝宝体质一些,像大熊猫这类的中国元素,它也能迅速 get 到。 甚至已经有老外为了玩上快手的 AI , “ 求 ” 着让国内网友帮他生成一些视频。。。 而就在世超琢磨可灵 AI 的时候,网上又突然蹦出来一个新的视频模型 Luma AI ,同样能生成长达两分钟的高清视频。而且官网示例的效果,也是直逼 Sora 。 像是它生成人在潜水时的瞬间,脸部周围气泡变化跟真的一样,在整个大幅度运动过程中,脸部也没出现啥畸变。 还有房间爆炸时,镜头推进的画面,整得人都有种看好莱坞大片的错觉了。 看到这儿,不知道差友们什么感受,反正世超已经有点儿坐不住了,立马托朋友从快手那要来了个内测资格,也顺便登上了 Luma 的试用界面,准备亲自上手试试这两个 AI ,看看它们到底有没有传说中的这么厉害。 据它们俩的宣传,可灵 AI 和 Luma 算是都有各自擅长的领域。可灵这块儿,网友们都说它生成吃播视频是一绝,而 Luma 官网上宣传的则是 “ 电影感 ” ,还能通过图片 + 提示词生成视频。 那咱也不废话了,直接在它俩各自的地盘上开测。 首先咱们来到的比试地点,是快手比较擅长的 “ 吃播 ” ,让它们同时生成一段 “ 一个男人在吃意大利面 ” 的视频。 有一说一,可灵 AI 除了嗦面的时候有点不稳定,其他画面说是从快手的吃播视频里截取的,估计都有忽悠到不少人。 到了 Luma 这儿,画风就突然变得诡异了,男嘉宾就跟有超能力一样,啥餐具都不用就开吃了,而且嘴巴动得也非常不自然。 既然生成吃播的视频 Luma 不太行,那接下来咱就试试它比较擅长的 “ 电影感 ” 。 本以为 Luma 要大施拳脚了,没想到它一上来就拉了坨大的。 让它生成一段 “ 外星人大战机器人 ” 的画面,还是那个老毛病,同一个人物,一会儿变成机器人,一会儿变成怪兽,全程都没看到打斗的痕迹。 同样的提示词喂给可灵,它倒是把战斗的场面给整出来了,就是有点经不起细看,手里拿的刀都是软的。。。 好在之后的表现还行,让它们同时生成 “ 顶级富豪在别墅开派对 ” 的视频,都挺有模有样,唯一的缺点就是面部表情都不太稳定。 各自擅长的领域比完了,那紧接着来第二回合,考验下这俩 AI 对物理世界的理解程度。 让它们生成一段 “ 猫咪和正在睡觉的主人互动 ” 的视频,先是 Luma 这边,它一上来就直接摆烂,只生成了一段黑色猫咪的视频,连人的影子都没看到。。。 要不说全靠同行衬托,对比之下可灵 AI 的效果就强多了。有猫,有睡觉的人,硬要扣缺点的话,就是没怎么看到猫和主人之间的互动。 后面世超又试了好一些,发现在一些简短的提示词跟前,快手可灵的表现都还不错,比如玩偶熊在瀑布前弹吉他,小样骑自行车等等。 Luma 这边就跟使唤久了,想罢工一样,各种 Bug 都出来了,小熊弹个吉他都能弹出幻影来。 还把羊自个儿变成了自行车。。。 更抽象的是,因为 Luma 有图片输入,在试的时候总能整出来不少乐子。比如让它给猪猪侠的表情包整个后续,搞到一半就给整成惊悚片了。。 还有经典的 “ 外国老头 nice ” 梗图,他喝可乐是这样子的,多少有的鬼畜。 甚至还有网友给各种梗图,都脑补上了后续。 自动播放 总之,整体体验下来,世超觉得,要论效果,快手可灵 AI 的效果还是会更稳定、更好一点。最起码和其他能用到的视频 AI 比,它已经是相当不错了。 而把模型训练成这样,快手是摸着 Sora 这块石头过河,也到用了 DiT 架构。把 transformer 融合进扩散模型里,这样一来,通过堆参数、堆训练数据等等就能提升模型性能,而在视频数据这块儿,快手自然是不缺的。 不过现在除了效果外,视频 AI 还有另外一个不得不重视的问题,商业化。 不知道大伙们有没有注意到,虽说 Sora 之后,类似的 AI 是一个接一个,连字节、阿里这样的大厂们,都抢着上这个赛道。 但大部分厂商在宣布自己也有这种模型后,几乎就很少有进一步的动作了。 像是 Sora ,已经好几个月没更新过他们的案例库,其他有向大伙们开放的视频 AI ,也只更新到 5s 的视频长度就没再继续了。。。 而搞成这样子,说白了还是做视频 AI 太花钱,又找不到啥赚钱的路子。 像是学图片 AI 一样收会员费,根本就 cover 不掉它的成本,据调查机构 Factorial Funds 称,以 Sora 为例,它 30 亿参数(主流猜测 )的训练成本,比 1.8 万亿参数的 GPT-4 还要多。 这还只是训练,实际用时的推理成本更多,国内有 AI 企业做过一个折算,差不多两分钟的视频要花掉 180 块钱,看这数据,也难怪 AI 厂商们都不敢公开进度。。。 但话说回来,世超还是挺看好快手做这种 AI 的,毕竟它本身就有个视频平台在。说不定之后可灵也能像因为黏土滤镜爆火的 Remini 一样,靠 “ 发帖助手 ” 的定位摸索出一个赚钱的路子来。 这不,世超立马就想到了一个点子,不如学一学这次的 Luma ,玩玩抽象,指不定流量就来了。( 狗头 )
中国人自己的操作系统!华为纯血鸿蒙完全独立于安卓、iOS
快科技6月16日消息,华为将于6月21日举办华为开发者大会,届时,备受关注的HarmonyOS NEXT鸿蒙星河版预计将开启Beta。 今日,数码博主“定焦数码”再次提到NEXT(指HarmonyOS NEXT)特性,称该系统完全独立于安卓和iOS了,非Linux内核,非AOSP。 另外,该博主还透露了HarmonyOS NEXT DP2(Develop Preview 2开发者预览版)的部分细节。 博主表示,DP2的动画效果优于Android,拥有丰富主题,同时大幅减少广告投放,内置类似Android的“开发者选项”。 据了解,HarmonyOS NEXT鸿蒙星河版不仅意味着全栈自研的“纯血”国产自研操作系统诞生,也标志着HarmonyOS NEXT完全脱离安卓系统。 鸿蒙星河版就是业界俗称的“纯血鸿蒙”,采用纯国产微内核,去掉了传统的Linux内核和AOSP安卓开源代码。 因此,该系统将仅支持鸿蒙内核和系统应用,极大提升系统流畅度、纯净安全特性。 生态成,则鸿蒙成 华为创始人任正非在2019年的一次采访中表示:“做一个操作系统的技术难度不大,难度大的是生态”。 余承东此前指出,2024年是原生鸿蒙的关键一年,要加快推进各类鸿蒙原生应用的开发,集中打赢技术底座和三方生态两大最艰巨的战斗。 据余承东介绍,目前鸿蒙星河版原生应用数量已超4000款。 根据华为计划,2024年将打造5000个鸿蒙原生应用,最终实现50万个原生应用的宏伟目标。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。