EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了
白交 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,“计算机界最高荣誉”图灵奖揭晓—— 复杂性理论先驱、普林斯顿高等研究院教授艾维·维格森(Avi Wigderson)摘得。 美国计算机协会(ACM)表示,表彰他对计算理论的基础性贡献,包括重塑人类对计算中随机性作用的理解,以及数十年来在理论计算机科学领域的领导地位。 加上2021年获得的阿贝尔奖,维格森教授现在一举成为首个同时拿下数学和计算机最高奖的科学家。 (阿贝尔奖也被誉为“数学界诺贝尔奖”)。 此外,他还是2017年阿里达摩院刚成立时首批“十大祖师”之一。 业内人士纷纷赶来表示祝贺,a16z的研发主管表示:除了已有的学术成果外,也是因为他几十年来孜孜不倦的领导力,才带来理论计算机科学界的长青与活力。 比如,没有他,可能就不会有西蒙斯计算理论研究所。 值得一提的是,他还在5个月前来到清华叉院做客,对当下大语言模型的发展表达了自己的看法。 复杂性理论先驱荣获图灵奖 作为一名数学家和计算机科学家,维格森最重要的贡献就是增强了人类对计算中随机性和伪随机性作用的理解。 具体什么意思? 20实际70年代末,计算机科学家们已经发现: 随机性和计算难度之间存在显著联系。 (这里的计算难度之高指的是那些没有有效算法,即无法在合理的时间内解决的自然问题,它们计算起来比较困难。) 通俗一点解释就是: 对于许多难题,采用随机性的算法(也称为概率算法)可以远远胜过其确定性方案。 例如,在一个被称为“1977证明”的实现中,两位科学家就引入了一种随机算法,可以比当时最好的确定性算法更快地确定一个数字是否为素数。 而在20世纪80年代初,维格森与UC伯克利的科学家Richard Karp合作,将随机性的概念与那些被认为计算难度高的问题联系起来,也就是没有已知的确定性算法可以在合理的时间内解决这些问题的问题。 尽管不知道如何证明它们很难,维格森和Richard Karp还是发现了一种针对某个难题的随机算法,然后发现:能够将其去随机化,从而有效地揭示了它的确定性算法。 大约在同一时间,其他研究人员也发现密码学问题中的计算难度假设能够实现一般的去随机化。 这促使维格森思考随机性本身的特质。 他和其他人一样,开始质疑随机性在高效问题解决中的必要性以及在什么条件下它可以完全被消除。 终于,1994年,他和另一位计算机科学家Noam Nisan阐明了两者之间的联系。 他们证明,如果存在任何自然难题,那么每一种有效的随机算法都可以被有效的确定性算法所取代。 即我们总是可以消除随机性。 更重要的是,他们还发现确定性算法可能使用“伪随机”序列——也就是看似随机但实际上并非随机的数据串。 换句话总结就是:随机性对于高效计算来说并不是必需的。 即使在没有随机性的情况下,我们仍然可以使用有效的算法来解决问题。 这一系列研究彻底改变了计算机科学家对随机性的看法,并适用于理论计算机科学的许多领域。 今天,ACM就将图灵奖这一重要荣誉颁给了维格森,主要嘉奖的就是他在如上领域的贡献。 在普林斯顿高等研究院的采访中,维格森解释自己既是一位数学家也是一位计算机理论科学家,研究的是计算领域的数学基础。 我的研究领域是数学的一个子域,但同时,我所研究的主要概念是计算。 对于理论计算机科学,他则认为这个学科拥有一个人对学术研究所能期望的所有优点,包含了一系列令人惊叹的深刻且具有重要智力意义的基本问题,而这些问题对人类、科学、生活和技术都至关重要。 (看得出老爷子满满的热爱之情了。) 而对于本次大奖,维格森则表示: 自己很高兴看到ACM再次认可计算基础理论,它确实对计算科学的实践和技术发展做出了巨大贡献。 大学被劝学计算机“好找工作” 维格森于1956年在以色列出生,是一位护士和一名电气工程师的儿子。他的父亲喜欢拼图,并对数学的基本概念非常感兴趣,然后又经常跟孩子们分享他的想法。 维格森这样描述父亲对他的潜移默化的影响:就是他让我感染了这种病毒。 不过等他要在当地海法大学上学时,本想主修数学的他,却被他的父母劝导说: 选择计算机吧,计算机好找工作! 结果他发现这个领域有很多数学问题没有解决,于是开始吭哧吭哧解决了起来。 维格森毕业于以色列理工学院和美国普林斯顿大学,1983 年凭借论文《组合复杂性的研究》获得博士学位。 他早期的一项开创性工作,就是证明了一个看似矛盾的问题: 能不能在不展示证明过程的情况下,让别人相信一个数学论断已经被证明了。 是不是想起隐私计算领域姚期智提出的百万富翁问题内味了。 那个问题就是两个百万富翁,他们想证明谁更富有,但两个人都不透露他们拥有多少财富。 而原本的这个问题其实是叫做零知识证明,这个概念最早在1985年由三位科学家引入。随后由维格森以及他的合作伙伴Micali和Oded Goldreich进一步阐述了这一想法,并发现了一个意想不到的结果:如果真正安全加密是可能的,那么 NP 中每个问题的解也都可以用零知识证明来证明。 换言之,零知识证明可以用于秘密地证明任何有关秘密数据的公开结果。 数十年来,他始终活跃在学术岗位上,并且获得诸多赞誉和奖项。1994年,他因在计算复杂性理论方面的工作获得1994年的内万林纳 博士毕业后,他在加州大学伯克利分校担任客座助理教授,在IBM担任访问科学家,并在伯克利的数学科学研究所担任研究员。1986年加入希伯来大学担任教员。 1994年,他与Omer Reingold和Salil Vadhan一起因在图的 zig-zag 乘积方面的工作而获得了 2009 年哥德尔奖。 1999年,他加入普林斯顿高等研究院并工作至今。2013年当选美国国家科学院院士。 2018年,他因对计算机科学和数学理论的贡献当选ACM Fellow。 第二年,又因为“在随机计算、密码学、电路复杂性、证明复杂性、并行计算以及我们对基本图特性的理解等领域对计算机科学基础做出的根本性和持久性贡献”,他荣获高德纳奖。 2021年,维格森与László Lovász共同获得阿贝尔奖。 也正因为这样根本性且持久性的贡献,网友们得知他才获图灵奖时感到意外而又惊喜,还以为他早就得了。 也有人开始看他曾经写过的书籍了。 或许有眼熟的朋友吗? 谈大语言模型:最重要还是看它不能做什么 而他与姚期智以及中国的缘分还在延续。 5个月前,他还曾亲自来到清华叉院做客,带来题为“模仿游戏(Imitation Games)”的特邀报告。 由姚期智院士亲自主持讲座,并与他展开对话。 据报道,维格森从图灵测试出发,叙述了“模仿学习”理论的沿革及其在密码学、随机性、离散数学、数论等领域的现代应用。 他基于凯撒密码、恩尼格玛密码机、选举等案例,引导思考安全性的定义、随机性的应用、隐私和效用的平衡等问题。 对于理论计算机研究将如何应对人工智能发展这一问题,维格森表示, 尽管包括大语言模型在内的人工智能有很多惊人表现,但最重要的问题是还有什么是AI不能做的。 对于给现在正置身于科研的同学们,维格森也给出了自己的建议。 他表示,自己曾为解决一个开放性问题用了40年时间,建议同学们要选择自己喜欢的研究领域和话题,并享受在失败中不断学习的过程,这样才能在科研道路上走得长远。
资产大震荡!通胀超预期压制美股,黄金也“熄火”,降息推迟至9月?
中新经纬4月11日电 美股三大指数低开,全日绿盘震荡。截至收盘,道指跌1.09%,纳指跌0.84%,标普500指数跌0.95%。 来源:Wind 美国消费者新闻与商业频道(CNBC)表示,3月份通胀数据高于预期,美联储可能推迟降息,美联储3月会议纪要反映出官员对实现2%通胀目标的担忧,投资者乐观情绪进一步受到打击。 根据芝加哥商品交易所集团(CME)的美联储观察(FedWatch)工具,美联储在6月会议上降息的可能性仅为17%。交易员现在押注首次降息可能会在九月的美联储会议。 美股大型科技股涨跌不一,苹果跌1.11%,亚马逊涨0.15%,奈飞涨0.06%,谷歌跌0.29%,脸书涨0.57%,微软跌0.71%。 美股银行股全线走低,摩根大通跌0.92%,高盛跌2.44%,花旗跌2.42%,摩根士丹利跌2.59%,美国银行跌2.86%,富国银行跌1.12%。 美股航空股表现疲软,波音跌1.97%,美国航空跌3.94%,达美航空跌2.27%,西南航空跌3.77%,美联航跌2.46%。 美股芯片股多数下跌,恩智浦半导体跌4.27%,英特尔跌2.95%,高通跌2.68%,超威半导体跌2.13%,阿斯麦跌1.54%,博通跌0.88%,台积电涨0.56%,英伟达涨1.97%。 纳斯达克中国金龙指数收跌0.39%。好未来涨超3%,叮咚买菜、阿里巴巴、新东方涨超2%。阿特斯太阳能跌超7%,大全新能源、老虎证券、亿航智能跌超4%,虎牙直播、斗鱼、亚朵、蔚来跌超2%。 欧股多数收涨,德国DAX指数涨0.11%,英国富时100指数涨0.33%,法国CAC40指数跌0.05%,欧洲斯托克50指数涨0.2%。路透社表示,在美国高通胀数据披露后,投资者将注意力转向欧洲央行的货币政策决定。 国际油价10日上涨。截至当天收盘,纽约商品交易所5月交货的轻质原油期货价格上涨98美分,收于每桶86.21美元,涨幅为1.15%;6月交货的伦敦布伦特原油期货价格上涨1.06美元,收于每桶90.48美元,涨幅为1.19%。路透社分析称,哈马斯领导人的三名儿子在以色列对加沙地带的空袭中丧生,引发对停火谈判可能陷入僵局的担忧。 贵金属方面,COMEX黄金在美国3月通胀数据披露后剧烈下跌,盘中从2360美元跌至2337.1美元,跌幅一度超1%。截至发稿,COMEX黄金跌幅收窄至0.47%,报2351.2美元/盎司。COMEX白银盘中短暂跳水,由涨转跌,随后剧烈拉升涨超2%,目前涨幅收窄至0.09%,报28.01美元/盎司。有分析认为,美国通胀超预期,美债收益率上升,美元攀升,抑制贵金属上涨。 美元指数10日大幅上涨。衡量美元对六种主要货币的美元指数当天上涨1.05%,在汇市尾市收于105.245。截至纽约汇市尾市,1欧元兑换1.0736美元,低于前一交易日的1.0853美元;1英镑兑换1.2527美元,低于前一交易日的1.2670美元。 1美元兑换152.96日元,高于前一交易日的151.74日元;1美元兑换0.9136瑞士法郎,高于前一交易日的0.9036瑞士法郎;1美元兑换1.3693加元,高于前一交易日的1.3583加元;1美元兑换10.7308瑞典克朗,高于前一交易日的10.5658瑞典克朗。(中新经纬APP)
通胀全面高于预期 特朗普炮轰拜登:美国史上最糟糕总统
财联社4月11日讯(编辑 夏军雄)当地时间周三(4月10日),美国前总统唐纳德·特朗普再次抨击了老对手、现任美国总统拜登,原因是最新公布的通胀数据全线高于预期。特朗普称拜登是美国历史上最糟糕的总统。 周三公布的数据显示,美国3月消费者物价指数(CPI)同比上涨3.5%,为2023年9月以来最高水平,市场预估为上涨3.4%;3月CPI环比涨幅为0.4%,同样高于市场预期的0.3%。 剔除食品和能源等波动较大的因素,美国3月核心CPI同比上涨3.8%,环比上涨0.4%,市场预期分别为3.7%和0.3%。 随着美国大选逐渐进入白热化阶段,特朗普自然不会放过这个打击对手的机会。 他在社交媒体平台Truth Social上表示:“通胀又回来了,而且很严重!美联储永远无法可信地降低利率,因为他们要保护美国历史上最糟糕的总统!” 美联储在上月的利率会议上依旧选择按兵不动,联邦基金利率目标区间继续维持在5.25%至5.5%,自去年7月以来,该央行已连续五次维持利率不变。 最新CPI数据公布后,市场对美联储降息的押注进一步受到打压。高盛现在预计美联储将于今年7月进行首次降息,而不是6月。 拜登也第一时间对通胀发布了评论,他表示,美国通胀率已经从峰值下降超过60%,但仍需更多努力。 拜登坚持其对降息的预测,并称降息可能会被推迟一个月,在年底前会有降息。 自去年11月以来,美国CPI几乎每个月都高于预期。随着经济成为美国2024年大选的核心议题,通胀居高不下将不利于拜登对选情。 特朗普及其竞选团队一直在攻击拜登的经济政策。特朗普上月表示:“我们这个国家的经济正在崩溃,陷入一片废墟。”
华源证券上演“升级大戏”:注册资本增至45.76亿元,半年前刚完成更名
4月8日,据华源证券微信公众号,公司近日已办理工商登记变更、监管备案等程序,顺利完成本轮增资扩股工作,注册资本由33.70亿元增至45.76亿元。 据披露,此次武汉开发投资有限公司、武汉光谷金融控股集团有限公司、武汉三恒投资控股集团有限公司、武汉中天昱诚商业管理有限公司4家股东共计增资16.76亿元。 2023年9月,华源证券发布公告称完成了变更公司名称的工商变更登记,公司名称由“九州证券股份有限公司”变更为“华源证券股份有限公司”。 同年10月,华源证券在武汉举行揭牌仪式。华源证券湖北分公司同步更名,仪式由华源证券总裁邓晖主持。自此,湖北省迎来长江证券、天风证券之后的第三家券商。 公开资料显示,华源证券前身为三江源证券经纪有限公司,成立于2002年,2015年更名为九州证券。2022年12月,证监会批复同意武汉金控集团联合东湖高新区和江汉区并购九州证券72.5%股份事宜。其中,武汉金控集团持股50%,是控股股东和实际控制人,东湖高新区国资和江汉区国资分别持股12.5%、10%。 华源证券拥有证券业务全牌照,在除西藏外的全国各省会城市、计划单列市开设了42家分支机构,旗下设有九州期货、九证资本两家全资子公司,参股九泰基金(持股比例24%)。 此外,华源证券于去年年初完成董监高变更。2023年2月8日官方信息显示,华源证券党委书记由武汉金控党委副书记、总经理梅林兼任,梅林后续被选举为华源证券董事长。 随后,原长江证券总裁邓晖出任华源证券党委副书记、总经理。当年2月17日,华源证券总经理和法定代表人变更为邓晖。 年报显示,华源证券已经连续三年处于亏损状态。2020至2022年公司分别获得3.45亿元、4.66亿元、2.56亿元营收;净利润则分别为-0.7亿元、-0.23亿元、-2.1亿元。 来源:界面新闻
4天3板!北方铜业遭监管追问股价与基本面是否匹配?知名游资频上龙虎榜
近来,A股周期资源板块持续爆发,有色金属概念股反复活跃,铜和小金属方向领涨。截至4月3日收盘,晓程科技(300139.SZ)20CM涨停,闽发铝业(002578.SZ)、白银有色(601212.SH)、北方铜业(000737.SZ)等10只概念个股涨停。 其中,北方铜业已4天3板,于3月29日、4月2日、4月3日收获3个涨停板。至此,界面新闻根据东方财富Choice数据统计,3月13日至4月3日,该股票价格区间累计涨幅为93.72%,换手率242.16%,成交额142亿元,股价从每股5.52元升至10.79元。 图片:北方铜业近期股价情况,来源:东方财富Choice数据。 期间,北方铜业公司股票交易数次触及涨幅异常波动情形。 图片:北方铜业近期主力资金情况,来源:东方财富Choice数据。 知名游资频繁登上北方铜业的龙虎榜。4月3日,北方铜业龙虎榜数据显示,机构合计净买入4478.06万元,其中深股通专用账户买入3961.31万元并卖出3675.98万元,招商证券广州华穗路证券营业部买入6018.89万元。 3月29日至4月2日,北方铜业异常期间价格涨幅偏离值累计达26.53%。龙虎榜数据显示,知名游资宁波桑田路(国盛证券有限责任公司宁波桑田路证券营业部)买入5647.99万元并卖出3426.6万元。 3月20日,北方铜业龙虎榜数据显示,机构合计净卖出258.07万元,其中,深股通专用账户买入1180.7万元并卖出1191.34万元;知名游资方新侠(中信证券西安朱雀大街证券营业部)4316.45万元并卖出2301元。 北方铜业行情拉升背后,是近期有色金属行业大热。近期在铜精矿产量紧张、冶炼厂减产预期等影响下,铜价呈现大幅上涨,中国现货市场3月14日起已突破7万元/吨,达7.2万元/吨;期货市场LME铜3月15日突破9000美元/吨,达9074美元/吨。 国金证券于4月3日发布研报认为,铜冶炼供给减少预期进一步演绎,助推铜价上涨;2024年全球铜矿供给增长受限,头部矿企供应扰动加剧。德邦证券研报称,2024年全球货币环境由紧向松转变、国内经济逐步修复,有色金属板块有望迎来超额收益。 北方铜业股价飙升,也惹得监管层关注。4月3日,深交所对北方铜业下发关注函,要求公司说明公司基本面是否发生变化,近期股价涨幅与公司基本面是否匹配,结合同行业上市公司估值、市盈率、股价变动幅度等,就公司近期股价大幅波动进行充分的风险提示,并核查是否存在应披露而未披露的重大信息。 同时,关注函要求北方铜业核查公司控股股东、实际控制人、持股5%以上股东、董事、监事、高级管理人员及其直系亲属近一个月买卖公司股票的情况及是否存在涉嫌内幕交易的情形,未来六个月是否存在减持计划,并报备交易明细和自查报告。 4月2日、3月17日,北方铜业均发布异动公告称,公司近期经营情况及内外部经营环境未发生重大变化;公司除在证监会指定信息披露媒体上已公开披露的信息外,不存在关于本公司的应披露而未披露的重大事项。公司控股股东和实际控制人均不存在关于本公司的应披露而未披露的重大事项,或其他处于筹划阶段的重大事项。 北方铜业是华北地区最大的采选冶铜联合企业,主营铜金属的开采、选矿、冶炼及销售等,主要产品为阴极铜、金锭、银锭,副产品为硫酸、海绵金、海绵钯等,公司的业务覆盖铜业务主要产业链。公司采选能力为900万吨/年,为我国地下非煤开采规模最大的现代化矿山之一。截至2022年末,铜矿峪矿保有铜矿石资源量22,461.56万吨,铜金属136.25万吨。截至目前,公司拥有自有矿山一座(铜矿峪矿)以及冶炼厂两个(垣曲冶炼厂、侯马北铜)。 2023前三季度,该公司实现营收69.77亿元,同比下滑14.1%;归母净利润5.20亿元,同比降低7.18%。分季度看,2023年第三季度实现单季度营收24.4亿元,同比增长4.69%,环比增长25.3%;实现单季度归母净利润2.02亿元,同比增长447%,环比增长77.2%。 图片来源:东方财富Choice数据 目前,该公司负债压力增加。截至2023年9月30日,北方铜业资产负债率增至61.79%,总负债增至77.44亿元,其中流动负债22.33亿元,期间货币资金收缩至10.04亿元。 3月1日,北方铜业向特定对象发行股票申请获得证监会同意注册批复。按照计划,该公司拟向不超过35名特定投资者非公开发行股票数量不超过531,736,850股,预计募资额不超10亿元,将用于北铜新材年产5万吨高性能压延铜带箔和200万平方米覆铜板项目中的压延铜带箔生产线建设及补充流动资金。 北方铜业透露,本次募投建设项目投产后将新增铜带产能4万吨/年和压延铜箔产能9428.60吨/年。公司目前募投项目产品主要处于小规模试样阶段、小批量试生产阶段。截至募集说明书出具日,公司募投建设项目之铜箔产品已经签署21.29吨(170.19万元)的销售订单、105吨(1192.31万元)意向协议,铜带产品已经签署5300吨(36413.26万元)意向协议。 来源:界面新闻
营收断崖式下滑,理工导航高溢价收购同行,能否获得协同效应?
理工导航(688282.SH)近期签订的《收购意向书》有了新进展,各方签署了《有关石家庄宇讯电子有限公司收购协议》进一步确定相关具体事项,也因此收到了交易所的《问询函》。 4月2日晚间,理工导航发布《关于收购资产的公告》,将以收购股权及增资方式取得石家庄宇讯电子有限公司(以下简称“宇讯电子”或“标的公司”)的控制权。其中,将以5000万元认购对应标的公司新增注册资本250万元的股权,以7650万元受让交易对方合计持有的对应标的公司注册资本382.50万元的股权,合计以12650万元的总价款取得宇讯电子的50.60%股权。标的公司将成为理工导航的控股子公司。 此前,理工导航于3月12日与标的公司现有股东张冶、焦剑晖、关富民签署了《收购意向书》,将收购标的公司50%以上的股权,且标的公司的整体估值不超过2亿元(含2亿元)。最新公告显示,根据《资产评估报告》的评估结果,各方协商一致,确认标的公司的投前估值就是2亿元。 在评估基准日2023年11月30日,标的公司的净资产账面值为4676.22万元,采用收益法评估后的股东全部权益价值为21000万元,评估增值16323.78万元,增值率为349.08%。若按资产评估结果,标的公司的评估值超过2亿元,或许是考虑到《收购意向书》的约定,按上限2亿元确定投前估值。 图片来源:理工导航公告 在本次交易完成后,标的公司的股权结构将变更为,理工导航持股50.60%,现有股东持股比例分别为37.05%、7.41%和4.94%。 图片来源:理工导航公告 标的公司宇讯电子成立于2010年6月,成立时注册资本为100万元,三位股东出资比例分别为张冶45%、周进45%、左鹏10%。后来,经过多次股权转让,2017年3月张冶持股100%,注册资本仍为100万元。 图片来源:理工导航公告 2017年11月,张冶决定对宇讯电子增资400万元。增资后,张冶持股比例仍为100%,注册资本为500万元,就这样过了一年半。到2019年5月,通过股权转让,张冶持股比例下降为75%,焦剑晖回归并持股15%,新进股东关富民持股10%。 目前,张冶是宇讯电子的董事长、法定代表人,焦剑晖是宇讯电子的总经理、射频技术总工程师,关富民是宇讯电子的副总经理。 从标的公司宇讯电子历次股权变更及注册资本变化情况看,自其成立至今的约14年时间里,差不多有7年时间注册资本保持在100万元不变。直到张冶增资400万元,焦剑晖和关富民增资入股,以及现在理工导航拟增资500万元,标的公司注册资本才有大幅增加。 理工导航的公告仅披露了标的公司宇讯电子2022年度及2023年1-10月的相关财务数据,此前的资产负债及业绩情况不得而知。自2010年成立至2022年相隔十多年,2022年标的公司的营业收入为5245.47万元,净利润为864.59万元。 截至2023年11月末,标的公司的净资产为4676.23万元,比当时的注册资本500万元高出4176.23万元,而在2022年度和2023年1至11月,标的公司赚取的净利润合计就达到了2127.63万元。 根据业绩承诺,本次交易完成后,标的公司2024年度、2025年度及2026年度(以下简称“业绩承诺期”)经审计的扣非后归母净利润应分别不低于1300万元、1950万元、2750万元,即业绩承诺期累计承诺净利润不低于6000万元。若标的公司未能实现业绩承诺的利润,则转让方应以现金方式向收购方支付补偿金额。 虽然标的公司在2022年度的净利润未达千万元级别,但是2023年前11个月就已经超过千万元;不但如此,若按业绩承诺金额计算,业绩承诺期标的公司的归母净利润将出现超过40%的增长,平均每年要赚2000万元,这就明显高于2022年以前各年度的净利润水平。 然而,收购方理工导航近年来业绩水平却出现了下滑。2021年至2022年,理工导航的营业收入从3.18亿元下滑至2.05亿元,归母净利润从7307.28万元下滑至5580.26万元;2023年度业绩快报显示,营业收入只有0.22亿元,同比下降89.37%,归母净利润为-2254.35万元,同比下降140.40%,由盈转亏。 理工导航表示,其自身与宇讯电子均为军工行业公司,本次交易有利于其提高资源整合能力,利用双方不同细分领域的优势,发挥双方技术协调性、统筹双方研发资源,整合双方既有的技术优势和研究成果,可以在产品、技术研发、发展资源等方面产生协同效应,有利于增强其盈利能力和抗风险能力。 利好与风险往往是同在的,理工导航也提示了“商誉减值风险”、“业务整合风险”和“协同效应不达预期风险”。 就在理工导航披露上述收购资产的公告之后,上海证券交易所科创板公司管理部就发出了《关于北京理工导航控制科技股份有限公司收购资产事项的问询函》,第一大问题就是“关于标的公司业务及协同效应”,要求理工导航补充披露标的公司的业务模式、协同效应的具体体现等多项具体信息。 此外,问询函还要求理工导航补充披露标的公司的经营业绩及业绩承诺、标的公司评估、标的公司的应收账款及往来款等多个方面的情况,进一步说明上述收购事项的合理性。 来源:界面新闻
美股收盘:降息预期再遭重创 三大指数齐跌 英伟达涨约2%
财联社4月11日讯(编辑 夏军雄)美东时间周三,美股市场大幅下挫,三大指数集体收跌,原因是美国3月CPI数据全线强于预期,市场对美联储降息的押注进一步受到打压。 (三大指数分钟线图,来源:TradingView) 截至收盘,道琼斯指数跌1.09%,报38,461.51点;标普500指数跌0.95%,报5,160.64点;纳斯达克指数跌0.84%,报16,170.36点。 周三公布的数据显示,美国3月CPI同比上涨3.5%,市场预估为上涨3.4%;3月CPI环比涨幅为0.4%,同样高于市场预期的0.3%。剔除食品和能源等波动较大的因素,美国3月核心CPI同比上涨3.8%,环比上涨0.4%,市场预期分别为3.7%和0.3%。 10年期美债收益率周三收于4.559%,为去年11月以来的最高收盘水平。 芝商所美联储利率观察工具显示,美联储在6月会议上降息的可能性只有17%。交易员们现在押注,决策者可能要到9月才会进行第一次降息。 Independent Advisor Alliance首席投资官Chris Zaccarelli表示:“由于我们持续看到连续多份经济报告高于预期,美联储在短期内主张加息变得更加困难。” 热门股表现 大型科技股涨跌各异,苹果跌1.11%,微软跌0.71%,特斯拉跌2.89%,谷歌跌0.29%,亚马逊涨0.15%,Meta涨0.57%,英伟达涨1.97%,奈飞涨0.06%。 热门中概股多数下跌,纳斯达克中国金龙指数跌0.39%,阿里巴巴涨2.19%,京东跌0.11%,拼多多跌1.16%,蔚来汽车跌2.55%,小鹏汽车涨0.99%,理想汽车跌0.60%,哔哩哔哩跌2.10%,百度跌1.83%,网易跌1.11%,腾讯音乐涨0.08%,爱奇艺跌0.89%。 公司消息 【Meta官宣下一代AI训练与推理芯片项目】 Meta Platforms当地时间4月10日宣布其训练与推理加速器项目(MTIA)的最新版本。MTIA是Meta专门为AI工作负载设计的定制芯片系列。Meta表示,与第一代MTIA相比,最新版本显著改进了性能,并有助于强化内容排名和推荐广告模型。Meta称,公司的目标是降低对英伟达等公司的依赖。 【Adobe以2.62美元/分钟的价格购买视频资源来构建AI模型】 Adobe已经开始设法获得视频,以构建自己的AI文生视频模型,从而与OpenAI掀起的文生视频Sora展开竞争。相关文件显示,该公司要求其摄影师和艺术家群体提供100多段人物动作和情感表现的短片,以及脚、手或眼睛的简单解剖照片。视频的费用平均为每分钟2.62美元左右,但也可能高达每分钟7.25美元左右。 【亚马逊将允许员工用股票奖励换取现金】 亚马逊给中下层员工一个机会,让他们决定自己未来的薪酬在多大程度上与公司的股票表现挂钩。据媒体看到的一份内部备忘录显示,今年5月,亚马逊将给许多美国企业员工一项选择——将明年获得的股票数量减少四分之一,以换取更多现金。亚马逊加入了越来越多的包括特斯拉和Shopify在内的科技公司的行列,这些公司不那么重视股权薪酬作为激励员工的一种方式。这代表着科技公司支付员工薪酬的方式发生了巨大变化。 【KKR计划在五年将资管规模扩大至万亿美元】 KKR制定了一项扩大核心业务规模的计划,目标是在五年内管理的资产规模至少达到1万亿美元。该公司周三在投资者日之前向投资者介绍道,公司打算在现有的资产管理、保险和战略控股部门的基础上实现这一里程碑。KKR还希望在10年内实现每股15美元以上的年度调整后净利润。KKR已经超越了其私募股权的根基,发展成为一家另类资产管理巨头,其战略包括收购、信贷、基础设施、房地产和保险。截至去年年底,该公司管理着5530亿美元的资产,调整后净利润为每股3.42美元。 【梅西百货新增两名董事 结束与Arkhouse代理权之争】 梅西百货当地时间4月10日表示,将在其15人的董事会中增加两名新董事,以了结由Arkhouse发起的代理权之争。布鲁克菲尔德公司前高管Ric Clark和Rick Markee将加入梅西百货董事会,立即生效。他们二人均为由Arkhouse提名的人选,也将是Arkhouse收购要约审查委员会的成员。据了解,Arkhouse于2023年首次提交将这家零售商私有化的要约。
营销科学很复杂,腾讯广告想用“如翼”另辟蹊径
作者|刘亚澜 这两年,营销人都在讲科学——各种互联网平台都在结合学界的研究,把4P、5R这些经典营销理论内化到自身的商业化产品里;数据洞察服务价值凸显,一些第三方独立数据工具甚至可以单独融资并购。 但就在营销科学被大家奉为新圭臬的同时,一些新问题衍生了出来: 一是对数据精准的过于强调,让广告投放格外依赖人群标签定向,但只盯着有限的人群分类反而把市场做“窄”了。 二是技术在单一场景里内卷,缺少全局最优解。当前信息碎片化、触点大爆炸,营销资源也五花八门,品牌资产散落各地、各种转化链路阡陌纵横,反而导致选择太多、思路混乱。 三是理论与实践脱节。一些广告主向我直言,营销科学虽然理论上头头是道,但落到实际操作中却很难统一策略层和执行层。策略层期待营销科学发挥作用,执行层却明显KPI导向,缺乏耐心。 四是实时性不足。很多营销人把营销科学等同于简单的“数据看板”“汇报ppt”,忽略了市场随时变化的动态属性。营销科学变成了被动的事后归因,完全没有发挥策略指导、资源调度的“主动”作用。 当数字营销充分发展,智能营销大幕拉开,营销科学的重要性将越发凸显。今年年初腾讯广告发布了全新营销科学体系——腾讯广告如翼。上线几个月,我们逐渐理解了如翼的产品逻辑,最近我也和如翼的业务同学以及使用过如翼的广告主们进行了一些交流。它和以往的数据看板、营销科学产品有着形式上的类似,但却有着理念和效果上的不同,而正是这些不同,回答了上述疑问,也给我重新思考“营销科学”到底有什么意义带来了一些启发。 换个思路打破增长僵局 首先不得不承认的是,广告主们体感的“涨不动了”是整个互联网都面临的僵局。 从营销内部看,过去,营销技术(Martech)的不断进步给广告主带来了很多效果,但随着竞争的不断充分,竞价广告越来越卷,以至于出现ROI越来越低,停投即停效的窘境。 从营销外部看,营销内容对用户触达已经相当频繁了,对用户的数据挖掘也是相当的深,再继续挖下去势必引起用户反感。逐渐地,营销技术进步带来的效率提升变成了“打扰。比如手机,再忠诚的老客户也是有换机周期的,不可能出一款买一款。而如果品牌就同一个标签人群反复投,最后也会发现,人群被反复触达后并没有获得更多转化,反而ROI越来越低。 当低垂的果实被摘完,我们开始醒悟,营销科学不是刚性兑付的计算题,任何红海行业要找增量,一定得另辟蹊径。 就拿迪桑特来说,作为高端专业运动品牌,迪桑特吸引高消费人群似乎是情理之中的事,因此也不难想到营销时应该圈选高收入人群标签和一线城市人群。但问题是,过去很长一段时间里,品牌都圈选了“情理之中”的目标人群,使得该人群圈层中的目标用户已经充分转化。如果继续以此为靶面,人群转化率势必越来越低。 在如翼的R0数据洞察中,迪桑特看到了跨行业的机会,识别到棋牌人群、白酒人群、豪车人群的兴趣共性,带来了更高的购买转化率。 但需要注意的是,这种跨行业的“意外的关联”并非玄学,也不是广撒网。依据潜在消费者在腾讯媒介生态中的信息,腾讯如翼构建了5R核心人群资产模型,将用户群体划分为R1-R5五个层级(触达、回应、共鸣、行动、信赖),而R0则是基于数据能力与智能分析,升级了对潜在客群的智能联想而来。 这里的“营销科学”在于三点: 其一,取舍有道。由于过去的窄定向“卷无可卷”,现在广告主继续拓宽影响范围,但拓宽影响范围不等于重回“漏斗模式”,这里的人群取舍仍然是围绕需求洞察的。 其二,动态衡量。对于品牌来说,把握消费者购买欲转瞬即逝的时间窗口很重要,你可能昨天还想着买品牌A,今天就被品牌B给吸引走了。消费者无时无刻不被各种信息影响,消费意向也在不断变化。如果按照传统“人群包”的逻辑去投静态标签,只能说是打底了一个基本面。 其三,画像立体。营销越深入,对消费者的认知颗粒度也就越细。但我们需要注意的是,这里的颗粒度并不靠无限挖掘用户的相关信息,而是通过整合内容搜索等更复合的数据去构建更加个性化的画像,在保护用户隐私的前提下,实现广告效果的兼顾。 这是如翼的特别之处,不同于传统用户画像里性别、年龄、城市等级这些静态刻度,如翼所梳理的用户画像基于腾讯全生态的用户内容消费场景,因此它更动态,也更能洞察到用户的个性化喜好、差异化特点以及实时的心智变化。 道理很简单,因为人本身是一个动态立体的综合系统,实时变化,所以当营销科学试图度量潜客画像的时候势必也需要动态立体,而非简单地进行标签加减。 而当我们有了对用户更深的理解,后面不管是做物料还是选链路,都会更加高效。 比如某AI硬件产品,就在投放前根据不同的行业R0机会人群来反向选择能对该人群渗透更高的达人,同时也根据品牌历史累计的R3人群来定制化地选择更合适的达人;在投中,利用品牌目标与实际达成的R0或R3量级,通过数科模型综合计算出加热对应人群需要的投放金额,给出更高效的配比;而后再把达人互选曝光人群提取复用,追投竞价、用朋友圈和视频号引流直播加热,提升更多转化可能;最后再对上述环节进行复盘、综合验效。 你看,如翼R0不止是“人群圈选”,我觉得它更像是一个百搭的智能助手,你可以利用R0去做达人选号,去做IP合作,去适配新品、大促、年案等各种各样的营销场景。 再进一步思考,如翼R0背后的营销科学其实是更长远的,不用技术去“榨干”用户,而是跳出内卷,站在全局的视野下,将营销科学渗透进广告投放的全流程,为品牌提供「全流程营销工具」,用技术去提高匹配的效率。 用全局视野改变品牌心智 如翼是今年初发布的,我愿称之为“终于发布了”,甚至有点埋冤腾讯广告动作怎么这么慢。 我们都知道腾讯生态作为品牌的生意阵地,其独特优势是生态优、经营深、触点全。这些独特价值就不用赘述了。而且今年各行各业持续降本增效的大背景下,不少品牌们都看到了腾讯生态难得的增量价值,尤其视频号,甚至喊出“2024要把生意在腾讯上重做一遍的”的口号。 但这也是苦恼,之前跟广告主交流下来,大家普遍的反馈是腾讯生态营销资源实在太多,怎么组合、怎么调度,大家都有困惑。而品牌本身,尤其是产品线众多的大牌,更是把这个排列组合问题复杂化了。这时候更需要一个科学的、具体的、高效的指导帮助品牌们摸清门路,找到杠杆。 比如资生堂,资生堂旗下品牌众多,各个品牌下的产品同样众多,不同产品对应的人群就很不一样。因此他们就希望能够有一个站内导航,帮助他们看清不同产品线的人货场组合情况。那么这时候如翼就派上了用场,如翼的人群资产管理和营销复盘,能看到单次投放后R1-R5的流转情况,从产品和资源点位的角度看到更多投放的过程数据。 在5R的基础上,如翼还做了更全局视角的指标,资产广度、资产深度、资产健康度、健康持久度。这样广告主就可以结合自己不同的营销目标来匹配不同的投放方法。当你搞清楚了自己手里有哪些牌,目标是什么的时候,再去做投放策略,才是真的“科学”。 而细看我们发现,如翼给出的指标其实很有特点,机会人群渗透率、5R人群流入率、5R人群增长率、他品偏好人数、心智份额……这些指标都太有“腾讯特色”了。 比如如翼独有的指标“偏好度”,就是锚定了品牌营销的关键节点“心智扭转”。从不喜欢到喜欢,从无感到铁粉,心智的扭转对最终转化的价值不言而喻。如翼可以看到不同偏好度人群的R3流入率,例如跟本品牌互动较多的本品偏好人群、跟竞品互动较多的他品偏好人群、跟行业内品牌互动都差不多的摇摆人群以及跟谁都不互动的空白人群。 有了这样的行为洞察,品牌就能更加清楚的知道应该如何去影响潜在消费者,此时再结合腾讯生态社交裂变的独特能力,就更容易让空白人群和摇摆人群了解品牌信息和态度,实现“路转粉”;让竞品人群改变对品牌的心智,实现“黑转粉”。 大家都知道朋友圈、视频号点赞,都是好友可见,关注的公众号也会提示有多少好友共同关注,在腾讯系的其他产品中微信一键登录也能关联好友关系,这是整个互联网独有的网络效应。而“人”始终是社会性动物,找准人群后,利用社交影响力,潜移默化地扭转品牌心智,这可能比直接叫卖式的营销更有深刻的影响力。毕竟身边朋友夸一句,胜过品牌自夸一万句。 而在腾讯域外,通过客户数据能力合作等方式,如翼也可以观察到广告主营销行为产生的外溢价值。其实过去的域内归因其实是比较偏心电商平台的,不管你是看了B站还是知乎,最终你都来电商平台上下单,那么就算是电商的功劳。这样一来,内容和社交平台的品牌心智能力就大大被忽视了。我认为外溢价值的衡量之所以重要,是因为它跳出了局部视角,帮广告主更加全面地了解营销动作产生的真实效果,到底是什么触发了最终的转化,从而理清楚复杂的媒介环境中的关键点,以此更加高效地分配预算,获得增长。 我们看到资生堂的一个例子,如果只看腾讯域内的转化,合约朋友圈的成本要高于合约视频号信息流和搜一搜,但如果从全局来看,无论是合约朋友圈还是合约视频号信息流,外溢全渠道转化的成本都低于搜一搜。 你看,如果不考虑外溢价值,我们制定投放策略的时候就难免以偏概全了。 整体看下来,如翼是一个综合系统。在找机会的时候放大,在定策略的时候精细。它的出发点不是争抢有限的流量,而是“格局打开”。 对于服务商来说,用好如翼能带来能力的升级,是新营销环境下服务商提升自身能力、增加服务附加值的必选项,通过借力如翼,服务商可以进一步理解营销科学,成为策略专家,为品牌提供更多“外脑价值”。对于整个营销生态而言,如翼也带来了一种更健康的进化:提升营销效率,减少对用户打扰、被用户厌恶的无效触达,让广告主花的预算更有所值。 这或许才是营销科学的“本心”,它不该是广告主沉迷数据的安慰剂,而应该真正带来可落地、可增长的实际价值。
苹果曝“内鬼”猛料,索赔18万元:五年泄露至少6种机密,发送超10000条信息!
整理 | 郑丽媛 频繁遭员工泄密的苹果,这次动真格的了。 据美国加州圣克拉拉县高等法院最新公布的文件显示,近日苹果起诉了一位前员工 Andrew Aude,指控他向媒体泄露公司敏感信息,严重违反了保密协议和劳工法,要求其赔偿 2.5 万美元(约 18 万人民币)。 从诉讼书内容来看,仅在 2023 年 6 月至 9 月期间,Andrew Aude 就与《华尔街日报》的一位记者联系了 1400 多次,更向《The Information》的另一名记者发送了超过 10,000 条短信——而这一切,还只是他还没来得及删掉的部分。 01 五年泄露了超过 6 种机密,3 个月与记者联系超 1400 次 2016 年大学毕业的 Andrew Aude,顺利加入苹果担任 iOS 软件工程师一职,并在入职时签署了一份《知识产权协议》(IPA),其中明确要求:受雇期间不得向非苹果员工泄露公司的机密信息。 诉讼书中提到,Andrew Aude 的工作是优化电池性能,因此“掌握了苹果数十个最敏感项目的信息”。而他在长达五年的时间里,把工作中接触到的各种敏感信息,用公司配发的工作手机,通过短信、加密信息和电话等方式泄露给了其他科技公司的员工和至少三名媒体记者。 据苹果统计,Andrew Aude 在未经授权的情况下,泄露了超过六种不同的苹果政策和产品信息,包括:一款尚未公布的应用细节、合规策略、产品硬件特性、空间计算领域的研发工作、产品开发政策,甚至公司和部门的员工人数。 例如 2023 年 4 月,Andrew Aude 在一次电话中向《华尔街日报》的一名记者(Andrew Aude 称其为“Homeboy”)泄露了 iPhone 日记应用的最终功能列表。同月,《华尔街日报》的 Aaron Tilley 就发布了一篇标题为“苹果公司计划推出 iPhone 日记应用,在健康技术市场扩大布局”的文章。在 Andrew Aude 与这位记者的交流截图中,他甚至表示对苹果即将到来的“混乱”充满了期待。 除此之外,2020 年 10 月,Andrew Aude 还向一位非苹果员工泄露了苹果在空间计算领域的产品开发情况(MacRumors 推断是彼时未发布的 Vision Pro),并在随后的几个月中,持续泄露了更多苹果的机密信息,包括未公布的产品信息和硬件信息。苹果在诉讼书中指出,“Andrew Aude 明知道苹果的开发工作需要保密,但还是泄露了这一信息。” 不仅如此,根据苹果已掌握的证据显示,Andrew Aude 光在 2023 年 6 月至 9 月期间,就使用加密信息与 《华尔街日报》的记者“Homeboy”联系了 1400 多次。同时他还向《The Information》的一位记者发送超过了 10,000 条短信,并“穿越了整个大陆”与她会面。 为了正当化他的这些行为,Andrew Aude 声称他是帮助“扼杀”他认为有异议的产品和功能,即“为了苹果的工作并促进苹果的利益”——但苹果方面指出:他的行为却恰恰相反。 Andrew Aude 的泄密行为绝非偶然……从他频繁的谷歌搜索、文章分享和保存在苹果工作 iPhone 上的截图可以看出,虚荣心和个人对媒体关注的享受也在他的渎职行为中扮演了重要角色。 02 苹果发现泄密行为,并解雇了他 诉讼书中显示,苹果是在 2023 年秋季发现 Andrew Aude 的泄密行为的。 在 2023 年 11 月 7 日的对峙中,起先 Andrew Aude 一再否认他的泄密行为,还说自己没带公司发的工作 iPhone。中途他假装要去洗手间,趁机从口袋里掏出那部 iPhone,并永久删除了里面的大量证据,包括记录了他向“Homeboy”(可能还有其他人)泄密过程的 Signal 应用。 不过,Andrew Aude 经常在他的工作 iPhone 上保存通信截图,所以苹果能检索到。到了 2023 年 12 月 12 日,苹果就 Andrew Aude 删除 iPhone 上的 Signal 应用一事再次与他对质,他才终于承认了,但也只承认了他没来得及删除的信息。显然, Andrew Aude 违反了当初签署的那份 IPA 协议,于是苹果以行为不当为由在 12 月解雇了他, 但苹果指出,无论是在被解雇前还是被解雇后,Andrew Aude 都没有对他违反 IPA 协议或泄露苹果机密信息的行为表示过悔意。 事实上,在苹果正式对 Andrew Aude 发起诉讼之前,曾与他进行过沟通,试图庭外解决此事。由于 Andrew Aude 故意销毁证据,苹果无法了解他在何时向何人披露了哪些信息,为此希望他能交待全部的泄密行为,并承诺只要他全力配合,苹果就不会提起诉讼——从目前的结果来看,Andrew Aude 并不配合。 苹果在诉讼书中控诉了 Andrew Aude 的行为,认为他不顾法律和合同义务,为了损害苹果的利益,向他人肆意泄露高度敏感信息,而这些信息是“苹果进行创新、生产出让他人满意和兴奋的产品的根本”。 除此之外,苹果还一一例举了泄密行为带来的一系列连锁负面反应: (1)未经授权的泄密,会导致苹果失去对产品发布的信息和时间的掌控。 (2)可能会减少媒体和消费者对苹果产品的兴趣。 (3)会对当前型号的销售产生负面影响,导致产品最终发布时的销售减少。 (4)进一步损害了苹果在开发产品和服务上投入的大量时间和数十亿美元。 (5)泄密行为导致了多篇讨论苹果机密信息的新闻报道,使得竞争对手更了解苹果的政策、生产路线图和战略。 (6)数以千计的苹果员工数月甚至数年不知疲倦地工作,就为了发布新软件和硬件产品。信息泄露不仅损害了整个公司,也损害了将这些产品和服务迅速推向市场、为客户服务的众多个人。 基于以上,苹果对 Andrew Aude 提起诉讼,阻止其进一步违反苹果的合同义务,并要求他赔偿 2.5 万美元(约 18 万人民币)。 03 苹果曾警告:“泄密者的职业生涯将面临很大困难” 截至目前,在诉讼书中提到的《华尔街日报》和《The Information》这两家媒体均为对此作出回应,但可以预想的是:Andrew Aude 之后的职业生涯或许会很难了。 早在 2017 年苹果就曾抓获 29 名泄密者,并逮捕了其中的 12 人,里面不仅有内部员工,也有承包商和供应链合作方。2018 年苹果在内部邮件文件中揭示了这些泄密者的结局:“这些人不仅失去了工作,在寻找新工作时也会面临极大困难。犯罪的后果会成为个人和职业生涯的一部分。” 早在 2016 年入职苹果的 Andrew Aude,显然目睹了这场泄密者被捕的始末,但他还是做了泄密者。 在那封内部邮件中,苹果最后提到:“每个人到苹果来,都是为了做自己认为最好的工作,而不泄密是对工作最好的尊重。”
最新独角兽榜单出炉:字节跳动蝉联榜首,OpenAI增长最快
今日(4月9日),胡润发布了《2024全球独角兽榜》。榜单显示,全球独角兽企业数量达到1453家,比去年增加7%,全球新晋171家独角兽,几乎每两天就有一家新独角兽公司诞生。 《每日经济新闻》记者注意到,字节跳动仍然是全球价值最高的独角兽,价值1.56万亿元;OpenAI价值增长最快,以7100亿元成为全球第三大独角兽;价值下降最多的则是蚂蚁集团和菜鸟网络,分别下降2800多亿和近1200亿。 作为独角兽背后的支持者,老虎环球最为成功,捕获了205家独角兽;红杉中国在沈南鹏的领导下创造了历史,超越Sequoia,全球排名第三,成为唯一一家进入全球前十的中国投资机构。 中美持续领跑,印度独角兽数量出现首次下降 该榜单显示,胡润研究院在全球找到1453家独角兽企业,分布在53个国家和291个城市,其中171家是新面孔,几乎每两天就有一家新独角兽诞生。中国和美国仍是独角兽公司主要集聚区,过去一年,中国和美国分别出现56家和70家新独角兽。 值得注意的是,新加坡成长为独角兽大国,但印度放慢了速度,独角兽企业数量出现首次下降。其中一个因素是,印度创业者在海外创立的独角兽企业比其他任何国家都多,在印度境外共创立了109家独角兽,而在印度本土只有67家。 “过去五年是创业的黄金时代,我们看到世界上前所未有的新科技进入市场的最大规模爆发,全球独角兽企业数量增长至五年前的三倍,从494家增加到1453家,独角兽企业的平均年龄为10岁,独角兽创始人的平均年龄是45岁。”胡润百富董事长兼首席调研官胡润介绍称,从行业分布来看,金融科技、软件服务和AI是独角兽的三大主要赛道,AI今年取代电子商务,跻身三大赛道,独角兽公司对金融服务和企业管理解决方案领域的改变最大。 OpenAI增长最快,蚂蚁集团价值下降最多 记者注意到,独角兽榜单前十名门槛2350为亿元人民币,比去年提高500亿元,排在第一名的仍然是字节跳动,以1.56万亿元人民币的价值连续第三年成为全球价值最高的独角兽,SpaceX紧随其后,过去一年全球表现最好的独角兽是OpenAI,价值增长近5700亿元最快,达到7100亿元,跻身全球前三。 今年前十名中出现了三家新面孔:除了OpenAI,还有总部澳大利亚的Canva和总部马耳他的币安。Canva价值2800亿元,增长了一倍,作为世界上最大的在线设计平台,其用户数量实现了激增。加密货币交易所币安价值也增长了近1000亿元,达到2400亿元,跻身前十。 几家欢喜几家忧,去年位居前十的Telegram、Revolut和菜鸟网络今年跌出了TOP 10榜单。蚂蚁集团下降一位至第四,价值下降2800多亿,是价值下降最多的独角兽。快时尚电商Shein下跌一位至第五,价值4600亿元,总部位于旧金山的支付平台Stripe下跌一位至第六,虽然其价值上升了近800亿元,达到4300亿元。背靠腾讯的数字银行微众银行下降了4位,排名第10。 当然,还有些独角兽会失败、跌出榜单,如印度在线教育平台Byju's、中国新能源汽车品牌威马汽车等,此前都曾引起媒体广泛关注。 老虎环球捕获最多独角兽,红杉中国超越Sequoia 独角兽的诞生与成长离不开VC/PE源源不断的资金支持,在此次发布的《2024全球独角兽投资机构百强》中,记者注意到,老虎环球在Scott Shleifer和Chase Coleman的领导下,首次获得“全球最成功的独角兽投资机构”称号,投资了205家独角兽。排在第二名的是孙正义领导的软银,投资了169家独角兽。红杉中国在沈南鹏的领导下创造了历史,超越Sequoia,全球排名第三,是唯一一个进入全球前十的中国投资机构。Sequoia历来是投资独角兽领域的巨头,但在剥离中国和印度/东南亚业务后,降至第四位。 不过今年,新的独角兽投资有所放缓,尤其是与2021年的高峰相比,因为退出被证明更加困难。
百度搜索即将被替代
BAT里被踢出去的百度,在互联网行业股票中已经被冷落许久:没啥看点,常年不涨。核心竞争力全靠谷歌进不来。 常常有投资者把百度当做落难的meta,总有一天其业务优势和估值优势被发掘,然后重新上涨,的确,看PE是有一定吸引力了,才10倍。但每次中概股和互联网板块的表现,却总与百度无关,10年间,百度的股价原地踏步。 很好理解,公司有现金,过去都用以投入AI和自动驾驶等先进技术了,但迟迟没出令人眼前一亮的产品,也不能带来利润,最后造成了很差的roe,而分红回购方面非常吝啬,低估值不分红,等于不低估。 这样的公司过去当然是没什么好投资的,但奈何百度手里一堆现金,利润稳定,甚至在2023年创出新高。文心一言也自夸中文第一大模型,投资中国Ai,还是绕不开百度这家公司。 稳定的业务加上Ai业务带动,大家看到了稳定利润的百度有回高增长的可能,也让更多人谈起了百度的反转。然而,Ai对于成熟巨头们来说真的是加速引擎吗?随着Adobe在ai生成视频上被sora大幅影响而暴跌,以及整个中国互联网用户习惯的渐渐改变,大家都在赌的Ai驱动百度增长,就不能是负增长吗? 一、搜索市场的演变 目前从财报看来,百度的利润是新高,股价处于背离状态。但这个营收增速本身也没啥可圈可点的,跟经济发展增速类似,虽然新高,但营收cagr只有可怜的5.6%,这种增长水平放在中国市场,连很多经营效率不高的夕阳行业公司都不如。 要知道,互联网广告行业的增速还是不错的,长期跑赢GDP增速,这几年来汽车行业的营销费用增长迅猛,可以说,百度从中也吃到了一些红利,结果就这? 相比腾讯及其他的短视频、社交媒体和互联网平台公司,百度的广告增速就确实相当一般了。 利润增长看上去不错,但那也不真实,回购只有可怜的47亿元,但考虑到34亿的股票发行,净回购大概是只有13亿,没有分红,跟200亿利润相比,派发比例6%,相当可笑。 因为自由现金流是负的,公司还是得大量投入研发,所以在自由现金流为正之前,百度应该是不要指望还有什么大回购了。但话又说回来,这么多年里,百度自由现金流好的年份,也只有2022年,其余年份都是投比赚多,真实利润远比看到的少,这就是百度利润新高但也没什么值得着重的关键。 那说明公司有利润以上的追求?但是,自由现金流负了这么多年,也没驱动收入成长,会不会正说明公司研发方向有问题?现在看到的所有Ai突破全是跟着chatgpt一起来的,可想而知研发费用的含金量。 如果百度不再做大的投资,就靠现有业务,这可观的200多亿经营现金流分红了,确实就有价值,能让股价回归大涨了。而利润能不能长期维持,就取决于核心业务搜索的竞争对手,在何时以何种方式来冲击百度的护城河了。 百度目前的业务还是非常传统,靠过去搜索引擎业务积累的护城河来赚钱,新业务放量缓慢。 搜索引擎且广告公司,当然,一年能赚个700多亿营收,那也是相当庞大的。而广告的投放基本都集中在搜索行为和百度系产品的投放。 这些广告我们都看到过,由于搜索引擎不可或许的工具性,我们在搜索中就不可避免这些广告,而由于搜索引擎的快速触达,文字展示信息密集等功能,用户不可避免地被触达大量的广告。所以说,百度的广告是一个量大高效的好模式,从谷歌的表现,我们也看得到上限有多高了。如果说为什么bing copilot这种问答式的搜索没有出现预想中的颠覆,很关键的因素就在于,它的运行实在是太慢了,信息生成密度不够。 在中国,随着互联网手机平台的发展,实际上很多百度原有的搜索功能不意间被分走。 比如百度的知识信息产品,这个功能已经逐渐走向末路。 今天我们要查找这样的信息,抖音快手、哔哩哔哩、小红书、知乎及微信搜索(公众号载体文章)可以完全做得比百度好。这些平台优势是可视化短平快、低功利性、深度及即时性、专业性。如果这些维度全输,百度搜索的意义是什么? 小红书 而有趣的是,百度关键词搜索根本无法导向这些平台内的链接,这里面有这些网站限流的原因,但也有百度不希望用户跳转的原因。 无形间,这些大量活跃用户的内容不再出现在百度搜索列表里,如果一个搜索引擎不能应搜尽搜,那么结果就很明显了。谷歌有一个巨大的ugc宝库youtube,百度有什么呢?贴吧、还是没有ugc的爱奇艺? 今天百度的搜索里,已经很难找到时效性足够且内容深度足够的知识信息,百家号通过这些平台的跟踪和复制粘贴来维持,但密集的视频和文字流,百度始终力不从心。随着时间推移,所有中国发生的新闻、经验、心得将会一点点地在百度搜不到的平台记载,这些平台没有10年前的信息,因为它们还没有建立,也正因如此,用户对它们的搜索功能还不能完全信任,而百度还能靠历史的积累有这么点优势,但往后再看10年呢? 可以说,这是百度过度追求利润,对互联网开放生态的不尊重,导致了今天的功能落后。而我们也可以看到,百度的广告主结构里,医疗健康占首位,这么多年了,还是老样子啊。 从这点看,常年的负自由现金流,并不是公司有什么利润以上的追求。 但往后看,这些平台最后可以实现这部分功能替代,却也不足以让百度的业务完全崩塌,因为这些平台本身更不具备整合性,且搜索功能并不是它们的核心。 搜索功能最重要的是整合性和高效,简单直接和密集的信息检索是这些平台的产品模式所不具备的,这些视频、社交app点进去搜索框到信息加载的速度,总是要比百度慢的。 百度低增长这么多年,也做了很多道德低下的东西,唯一没有敢乱搞的就是首页的直观和响应速度。它还是明白自己的作为搜索网站最重要的东西的。 二、Ai还是被Ai替代 高速、直观、信心整合性,这几个点现在主打社区、需要流量和用户粘性的互联网平台冲击不了,那么百度作为中国第一的搜索引擎就还能活的不错。虽然知识内容功能注定会被替代,但搜索引擎这一功能绝对不会。它的搜索竞价广告就还很有市场。 但chatgpt的出现正好就让大家看到了搜索的新未来。之前的搜索引擎有整合信息和答案的功能,但在具体问题和语言理解上无能为力,如今的chatgpt对于很多有答案的问题,已经是信手拈来,甚至能给出推导过程,这就是在整合信息上更进一步,找出答案。 这也是为什么百度最快推出文心一言,也一直希望行业不要过度竞争,毕竟大模型的尽头,是AGI,搜索引擎这是它功能的一小部分而已。 不过,现在的chatgpt和其他大语言发展方向,尚未走在搜索引擎的方向上,大模型的几个维度:通用性、准确率、生成速度、检索密度。是各自相互冲突的,而现在openai带着大家往通用性和准确率这个方向走,暂时还没开始发力速度和检索密度,让百度松一口气暗自庆幸。 bing有了Ai还是没有在搜索引擎维度上撼动google,在检索速度上比乌龟还慢,人们有的时候并不是希望马上知道一个确定的答案,而是希望看到更多的信息。 谷歌和微软进不来中国,给了百度逆向工程的时间,过去的研发就算是打水漂,但是还是有一些硬件,人员,财力上的优势,能推出一个过得去的大模型,应该也能应对下一个时代的竞争吧。 但现实再次给了百度一击,庞大的算力开支才能支撑起Ai研发吗,事实并非如此。 在最近,一家百度上无法搜索到官网链接的大模型公司出圈了。 虽然团队只有80个人,但是确实比很多大厂的大模型好多了,不过,openai、midjourney,谁不是小厂呢? 具体的功能对比可以自行在b站或者看这篇文章: 《Kimi大模型:就汤姆你叫文心一言啊?》。 只要哪天openai和谷歌们开始转换进化方向到加载速度和信息密度上,搜索引擎的颠覆一触即发,百度要做的就是在那之前维持住国内市场第一大模型的地位,直到照葫芦画瓢完美转型,但这么一个小厂,还要马上加码迭代,确实是把百度的如意算盘打碎了。 另外,小红书还是月之暗面的投资者之一,一个结合大模型的小红书能在中文信息整合上吊打百度。 现在小红书其实是百度第一大潜在冲击者,只是它没想好走抖音的路还是百度的路,做搜索,产品形态还得改变,而论赚钱,百度可比抖音赚太少了。但考虑到视频行业目前的竞争格局,小红书务实一点,才是正道。 三、结语 百度搜索的未来,具备了巨大的不确定性,部分产品功能被吃掉已是必然,剩余的核心搜索引擎功能,也在Ai快速迭代的过程中变得越来越模糊了。 公司只能不断地靠技术迭代反击,才能在没有分红回购的前提下,维持住大家对价值的认可。这就好像Adobe,应对完文生图的产品,又要接着马上对付文生视频,一波接一波的迎战,能有一战之力,那就维持市值平稳,大家把你放入Ai板块。但若稍微应付不当,那就成时代遗珠。 这是一种明显的高风险低回报的模式,对于已有的可结合Ai业务的巨头们来说都面临着这样的问题,百度也不例外。但有更佳技术力的创新公司替代过度追求利润的公司,这本来也是理所当然的。
3月中国半导体已披露融资总额超百亿
据财联社创投通数据显示,3月国内半导体领域统计口径内共发生73起私募股权投融资事件,较上月55起减少32.7%;3月已披露融资事件的融资总额,合计约19.34亿元,较上月33.15亿元减少41.66%。 01 细分领域投融资情况 从投资事件数量来看,3月芯片设计领域最为活跃,共发生28起融资;从融资总额来看,芯片设计领域披露的融资总额最多,约为9.77亿元。专注于物联网智能终端系统SoC芯片研发的芯翼信息完成中网投、盛盎投资、钧山投资、海通创新、汉仟投资等参与的3亿元C轮融资,为3月半导体领域融资数额最大的融资事件。 按照芯片类型分类,3月受投资人追捧的芯片设计细分赛道包括MCU/SoC芯片、模拟/数模混合芯片、通信芯片、AI芯片等。 从投资轮次来看,3月半导体领域投资集中于成熟期企业,其中A轮融资事件数目最多,发生30起,占比约为41%;种子、天使轮融资事件数目位列第二,发生10起,占比约14%;Pre-A轮融资事件数目并列第二,发生10起,占比约14%。 从各轮次投资金额来看,3月半导体领域的投资事件中,A轮融资事件整体融资数额最多,约为7.97亿元。 从投资地区来看,3月江苏、广东、浙江地区的半导体概念公司最受青睐,融资数量均超10起;其中江苏融资事件为19起,数量最多;从单个城市来看,苏州有10家公司获投,数量最多。 活跃投资机构 本月的投资方包括晨晖资本、中芯聚源、源码资本、力合资本、临芯投资、中启资本、卓源亚洲、小苗朗程、红杉中国、九合创投、无限基金SEE Fund、基石资本等知名投资机构; 以及字节跳动、力芯微、华大九天、江淮汽车、广汽资本、三七互娱、中石化等产业投资方; 还包括亦庄国投、元禾控股、昆山高新集团、张江火炬创投、广州产投、深圳高新投、深创投、国投创业、深投控、国调基金、珠海市科技天使基金、苏州高新区科创天使基金、上海科创基金等国有背景投资平台及政府引导基金。 02 年内最大一笔融资 3月底,上市公司兆易创新的一纸公告,让合肥的超级独角兽长鑫科技,又站在了聚光灯下。公告显示,兆易创新将以约1400亿的投前估值,向长鑫科技投资15亿元,投资完成后将直接持有长鑫科技约1.88%的股权。 长鑫科技全资子公司为长鑫存储,是国内DRAM存储龙头企业。根据公告显示,本轮融资共计108亿元,投资方还包括合肥长鑫集成电路有限责任公司、合肥产投壹号股权投资合伙企业(有限合伙)、建信金融资产投资有限公司等多名投资人,融资规模共计108亿元。 基于其当前业务开展情况、未来发展规划等多方面因素,参考市场化询价及第三方机构的资产评估结果,并经长鑫科技与兆易创新在内的各方投资人协商和谈判,最终确定,长鑫科技本轮融资投前估值约为1399.82亿元。 虽然第一季度尚未过去,但或许可以宣布今年国内最大一笔融资已经诞生了。 03 国内半导体历年投融资情况 据IT 桔子 2023 年中国芯片半导体行业投融资市场情况数据显示,2020 年开始,国内芯片半导体行业的融资数量和融资总额均大幅增加,到 2021 年再次呈现“波峰”状态。2022 年融资金额相较于 2021 年减少 279 亿元,出现第二次小“波谷”。到 2023 年,虽然芯片半导体行业融资交易量有所下滑,但融资总额逆势回升,达到 1426.24 亿元,成为近十年来融资总额第二高的年份。 可以说,随着芯片半导体行业竞争加剧,大浪淘沙,目前资方对于项目的选择标准更加高,一些可控风险较小的头部明星企业往往能持续吸引众多资本的追捧和加码,大额融资频现,以此在 2023 年交易量较前两年下滑的基础上,却推高了整个行业的融资额。 2023 年国内芯片半导体行业有 3 家公司的总融资额超百亿元,分别是华虹半导体制造无锡公司(40.2 亿美元)、积塔半导体(135 亿元)、润鹏半导体(126 亿元)。 值得注意的是,这三家公司背后都有地方国资和国家队大基金的身影。华虹半导体制造无锡公司是由华虹半导体联合华虹宏力、国家半导体产业投资基金二期股份有限公司、无锡国有投资公司联合发起。积塔半导体由华大半导体牵头,是中国电子与上海市的战略合作项目。润鹏半导体由华润微与深圳市地方国资共同出资成立。 在 2023 年融资最多的国内芯片半导体 TOP20 的公司中,有 3 家新晋成为了独角兽企业,分别是华虹半导体制造无锡公司、同光股份、奕成科技;还有 7 家已经是独角兽,包括积塔半导体、长飞先进半导体、奕斯伟计算、盛合晶微、壁仞科技、燧原科技、宇泽半导体。
工会74%成员投票赞成 三星电子首次罢工迫在眉睫
集微网消息,在半导体业务开始复苏之际,反对工资谈判的三星电子最大工会在会员投票中获得压倒性支持,取得了罢工权,为三星电子公司历史上首次罢工预埋下了种子。 4月8日,三星电子最大工会——韩国金属工人工会联合会旗下的三星电子全国工会公布了3月18日至4月5日的投票结果,以投票赞成或反对举行罢工。 在包括三星电子全国工会在内的三星电子五个工会的总成员(27458名)中,有20853人(75.9%)参与其中,20330人(97.5%)投票支持罢工。在全体成员中,74%的人投赞成票。三星电子全国工会以超过50%的票数支持罢工,获得了合法罢工的权利。 三星电子全国工会不会立即罢工,而是计划通过在工作场所举行示威来呼吁员工支持。一些观察人士表示,随着2023年为应对绩效工资投诉而加入工会的会员人数增加,罢工可能会扰乱生产。三星电子的工会会员人数占员工总数(124804人)的22%。三星电子全国工会获得了2022年和2023年的罢工权,但没有举行罢工投票。如果这次工会罢工,这将是这家三星电子自1969年成立55年以来的首次罢工。 今年以来,工会与三星电子管理层就加薪问题进行了九轮拉锯谈判,但未能消除分歧。三星电子通过与劳资协议会的工资调整谈判,同意今年平均工资上涨5.1%,其中基本工资上涨3.0%,绩效上涨2.1%。这比2023年的4.1%增加1.0个百分点。这是今年预期消费者价格通胀率2.6%的两倍多。 劳资协商会是一个由代表管理层的成员和代表雇员的成员参与协商工资和其他工作条件的机构。除工会谈判外,三星电子每年都会通过理事会设定加薪率。 三星电子全国工会强烈反对与劳资委员会达成的加薪协议。它坚持最初的要求,包括加薪6.5%和200%的特殊绩效工资。问题是各个下属工会对罢工的立场不同。领导这次罢工的下属工会是以半导体为中心的“下属工会4”,它是下属工会中工会成员数量最多的。第二大下属工会“下属工会5”已决定不举行罢工,其6210名成员中只有约三分之一(33.6%)支持。“下属工会5”主要由智能手机业务员工组成。这意味着三星的两个主要部门走了不同的道路。 与此同时,自2023年半导体行业史无前例的低迷以来,三星电子业绩一直在下滑,对工会不合理要求的批评也越来越多。 不过4月5日,三星电子发布业绩报告,初步核实今年第一季度营业利润同比骤增931.25%,为6.6万亿韩元(约合354.6亿元人民币),超过去年全年营业利润(6.57万亿韩元);同期,销售额同比增加11.37%,为71万亿韩元。这是三星电子单季销售额自2022年4月(70.4646万亿韩元)以来时隔5个季度再次恢复至70万亿韩元以上。三星半导体业务负责人Kye-hyun Kyung在之前的公司年度股东大会上表示,随着市场低迷期的结束,其半导体业务有望在今年恢复到2022年的水平。
清华类Sora大模型黑马!融资数亿,成果被OpenAI苹果采用,深度对话CEO
作者 | ZeR0 编辑 | 漠影 50多天前轰动科技圈的Sora,给全世界上了堂打开视频创作想象力的大课。 国内类Sora创企们也活跃起来,这不,仅是过去1个月,就有多家做国内版AI视频生成模型的创业公司发来战报: 3月11日,爱诗科技宣布完成亿级人民币A1轮融资、爱诗视频大模型上线内测;3月12日,生数科技宣布获得数亿元融资,智谱AI、百度风投等参投;3月18日,潞晨科技推出覆盖所有训练细节和模型权重的Open-Sora开源方案;3月26日,字节跳动旗下剪映Dreamina开放内测…… 而且家家都有令人精神一震的“全球第一”傍身。 全球首个Diffusion Transformer架构论文来自生数科技团队,爱诗科技的海外版产品PixVerse是全球用户量最大的国产AI视频生成产品,潞晨科技开源全球首个类Sora架构视频生成模型。 国内主要类Sora创企融资历程(截至2024年3月,智东西制表) 根据公开融资信息,生数科技还是当前主要国内累计融资额及估值最高的类Sora创企。 其投资方阵容强大,百度风投连投多轮,大模型独角兽智谱AI首度参投。蚂蚁集团、创始成员多数来自于原字节跳动投资团队的锦秋基金,都将投大模型公司的“第一次出手”给了生数。 这个源自清华大学人工智能研究院的创业团队,在基础架构上能与Sora团队掰手腕,在3D生成模型上敢跟OpenAI、谷歌、英伟达叫板,技术成果被OpenAI、苹果、Stability AI等应用于DALL·E 2、Stable Diffusion等模型中。 在近期的一场小型沟通会上,生数科技联合创始人兼CEO唐家渝告诉智东西等媒体,现阶段国内外AI视频生成代际差不大,国内团队追赶Sora要比2023年追赶GPT-4更容易,生数科技有信心今年达到Sora目前版本的效果。 推荐智东西年度会议:4月18-19日,2024中国生成式AI大会将在北京举行,生数科技联合创始人兼CEO唐家渝将在大会首日的开幕式高端对话上分享对前沿技术与产业发展的观察与思考。免费报名或购票进入倒计时,期待你的参会~ 01 . 清华计算机系师生创业 科研成果“撞车”Sora基础架构 在国内AI大模型竞赛中,“清华系”群星璀璨。 据智东西统计,2017年~2023年至少有29位清华教授、校友下场创业,投入大模型产业相关方向。(清华系撑起中国大模型创业半壁江山) 清华大模型创业群英谱(智东西整理,如有错漏欢迎指正或补充) 其中,生数科技是多模态通用大模型代表玩家,也是技术架构“最接近于Sora的中国团队”。 故事要从其首席科学家、知名AI大牛朱军说起。 朱军教授是20多年的“清华人”,2001年考入清华计算机系,2009年博士毕业,师从中国AI奠基者张钹院士,2011年起在清华计算机系任教,是清华最年轻的长聘正教授之一,也是当前CS Rankings机器学习方向亚洲排名第一的学者。 生数科技首席科学家朱军教授 2018年,清华大学人工智能研究院成立,83岁高龄的张钹院士出任院长,35岁的朱军出任副院长。同年7月,朱军支持自己的学生田天创办第三代AI基础设施创企瑞莱智慧RealAI,并与张钹院士共同担任瑞莱智慧首席科学家。 四年后,与Sora的交集开始埋下伏笔。 2022年9月,朱军教授课题组提交了一篇论文,提出将视觉Transformer与扩散模型结合的网络架构U-ViT;两个多月后,一起在Meta FAIR实验室做研发的加州大学伯克利分校William (Bill) Peebles和华人学者谢赛宁合著并提交了一篇DiT论文,同样探索了扩散Transformer架构,并与U-ViT在具体实验路径上一致。 当年计算机视觉顶会CVPR 2023收录了U-ViT论文,却以“缺乏创新”为由拒稿DiT论文。DiT论文入选了另一个顶会ICCV 2023。 左为清华U-ViT论文,右为DiT论文 而在一年多后的今天,惊艳世界的视频生成模型Sora和文生图模型Stable Diffusion 3,都是站在DiT肩膀上结出的研究硕果。 2022年年底,Bill Peebles加入OpenAI,开始联合带领一支由十几人组成的精悍团队,在DiT架构之上呕心研发Sora视频生成模型项目。Bill曾告诉同为DiT论文作者的谢赛宁,Sora团队“每天基本不睡觉高强度工作了一年”。 基于算力和对技术成熟度预判的综合考虑,清华团队则选择先将U-ViT应用于2D图像生成,再基于此拓展至3D和视频任务。 2023年3月,朱军教授课题组开源9.5亿参数多模态扩散大模型UniDiffuser,基于U-ViT架构实现图文跨模态生成,在采用扩散Transformer架构上比今年2月才发布的Stable Diffusion 3模型领先了接近一年。 开源地址:http://github.com/thu-ml/unidiffuser 同样在3月,生数科技由瑞莱智慧RealAI、蚂蚁和BV百度风投联合孵化成立,2006级清华计算机系校友、师从清华孙茂松教授的前瑞莱智慧副总裁唐家渝出任CEO,师从朱军教授的清华计算机系博士、U-ViT和Unidiffuser论文的作者鲍凡出任CTO,朱军教授担任首席科学家。 经过大半年围绕多模态大模型的研发探索,生数科技团队预测过2024年视频生成会迎来爆发,但Sora的出场还是令他们感到惊讶。“比我们的预期早了将近半年。”唐家渝回忆道。 2024年1月19日,生数科技宣布其视觉创意平台PixWeaver上线文生视频功能,输入简单文字即可一键生成视频,最高支持1024*1024分辨率。当时PixWeaver的画面水准已跻身国际一流,但仍未解决时长短、画面有卡顿感等问题。 今年1月推出文生视频功能时展示的生成视频效果 一个月后,视频生成模型Sora空降,凭借可生成信息承载力强、3D一致性、一定程度领悟物理规律的60秒长视频,彻底引爆AI视频生成的燎原之火,也因“降维打击”带来了空前压力。 02 . “大一统”的多模态底层架构 用一个模型生成复杂任务 在前沿架构研究上,清华团队拿到先手棋。 但OpenAI是更擅长操盘全局的下棋高手,无论是顶尖的研发实力,还是堪称教科书级的发布与营销节奏把控,都令一众AI团队甘拜下风。 背靠微软的雄厚资源,从发布ChatGPT到解决夺权事变,OpenAI一步步将其从高管到研发人员都捧成了AI领域的明星人物。 国内企业们迸发出积极的学习热情,有的急追猛赶搞研发、推产品,有的学会讲故事、造话题。 生数科技似乎没那么有“功利心”。在与唐家渝的交流中,他没有将生数标榜为“中国版Sora”的有力竞争者,而是将更高的优先级放在技术与研究突破上,视频生成固然要追,但3D生成、图像生成同样是生数的看家本领。 多个图生3D模型快速拼装搭建的3D场景 短视频生成案例 OpenAI推出了很多采用不同功能的模型,比如GPT-4(文-文)、DALL·E 3(文-图)、GPT-4V(文和图-文)等。 生数科技走的是原生多模态大模型技术路线,用同一个U-ViT底层架构一以贯之,实现一个通用模型来实现图像、3D、视频等多类复杂生成任务。 在 3D生成方向,生数科技成立3个月时就公开“叫板”业界顶级模型OpenAI Shap-E、谷歌DreamFusion、英伟达Magic3D,称在几何结构精度、纹理细节、分辨率等方面的3D生成效果“大幅领先”,接近产业级应用。如今其已能实现最快10秒级生成3D模型,支持文生3D、图生3D,并在国际首发基于骨骼动画的4D动画生成框架。 4D动画生成框架AnimatableDreamer直接将2D视频素材一键转成动态立体模型(论文地址:https://arxiv.org/pdf/2312.03795.pdf) 在视频生成方向,生数初步具备4~5秒短视频生成能力,可根据给定文本描述实现视频画面元素自动变换,比如改变物体颜色、人物着装、面容妆发、环境季节、视频风格等,做到可控编辑。 在文生图方向,图文模型从最早开源版的1B不断扩展至3B、7B、10B及以上,去年6月发布时超过Stable Diffusion最新版基础模型水平,在构图、风格、画面精准度等方面能够更好地把握用户意图。 当前生数科技的商业化路径是布局MaaS(模型即服务)与应用级产品,同时发力To B和To C,既以API形式向B端机构直接提供模型能力,又打造垂类应用产品,以订阅等形式收费。 这家成立刚满一年的年轻创业公司,已经与多家游戏公司、个人终端厂商、互联网平台、VR企业等B端机构开展合作。 2023年9月,生数科技正式上线两大应用产品视觉创意设计平台PixWeaver、3D资产创建工具VoxCraft。 PixWeaver AI绘画页面 PixWeaver地址:https://pw.shengshu-ai.com/ VoxCraft地址: https://voxcraft.ai/ 图像生成、3D生成功能均可体验。 视频生成功能短暂开放后暂时关闭了,等技术升级和优化后重新开放。 03 . 半年训练速度提升40倍 今年能追齐Sora水平 唐家渝坦言,就结果而言,现有其他视频生成模型跟Sora相比“差得还挺远”。 在他看来,现阶段国内团队追赶Sora要比去年追赶GPT-4更容易,因为尚未形成明显的先发或垄断优势。他相信追齐Sora目前版本的水准,所需时间不会太长,今年肯定能达到,不过很难精确预估要用一两个月还是半年时间。 唐家渝这么说,是有充分的底气的。 多模态大模型不像大语言模型需要那么高的参数量,但成本仍是问题,需要在算法层面做很多工作来把成本打下来,因此对底层研发能力要求很高。他预计AI视频生成赛道将收敛到几家企业。 生数科技不仅对底层架构熟知,而且已经走过很多训练、调优的坑,积累了完整高效的算法和工程化经验,包括在大规模GPU集群上实现高效兼容、低成本的模型训练。 在训练图像生成模型上,其团队半年将训练速度提升了40倍。 算力方面,资源是主要限制因素。Sora验证了长视频生成这条路走得通,消除了在这个方向砸资源的疑虑。如果一开始就从头来做像Sora这样的事,可能要投入上万张A100、A800卡。现在通过优化AI Infra,用到的算力资源和成本少了很多。 数据方面,生数科技搭建了一套完整的自动化数据管理及使用体系。其多模态大模型的训练数据主要来自大量的互联网公开数据和合作伙伴提供的私有数据。 人才方面,目前生数科技团队规模逾70人,近90%为研发人员,硕士研究生占比超过50%。生数科技核心创始团队来自的清华大学人工智能研究院,从事贝叶斯机器学习的基础理论和高效算法研究逾20年,在国内最早开展扩散概率模型基础研究且发表论文最多,在ICML、ICLR等AI顶会发表近30篇相关论文。 他们产出了免训练推理框架Analytic-DPM、世界最快采样算法DPM-Solver、多模态大模型UniDiffuser、3D生成算法ProlificDreamer、可控视频编辑算法ControlVideo等国际领先的代表性工作。其中Analytic-DPM论文是ICLR会议首篇由中国大陆单位独立完成的获奖论文。 今年1月,国际人工智能促进协会(AAAI)公布了2024 AAAI Fellow名单。已经身兼清华大学计算机系Bosch AI冠名教授、计算机系人智实验室主任、IEEE Fellow多个头衔的朱军教授因对机器学习理论和实践的重大贡献而入选。 由朱军教授在校培养的多位学生,已成为生成式AI领域顶尖的科研力量,比如扩散模型领域的知名研究者宋飏、宋佳铭,还有ChatGPT两位华人研究者翁家翌、赵盛佳等等。 04 . 结语: AI视频生成竞赛,序幕才刚刚拉开 在AI视频生成模型赛道,中美顶尖技术的研发差距客观存在,国内团队还需持续打怪升级。 但国内团队也并非从零起步。比美国更早提出扩散Transformer融合架构的生数科技,正在迎头追齐Sora,近期将重点攻关长视频生成能力,包括更好地实现不同分镜、针对物理世界的初步理解、视频编解码、长视频的连贯性等方向。 其他当前已公开的AI文生视频模型及产品中,爱诗科技PixVerse上线88天视频生成量达到1000万里程碑,潞晨科技开源的Sora复现方案将成本降低46%……还有许多国内团队正在探索可生成视频的多模态大模型方向。
WPS AI企业版发布:打通文档、AI、协作三大能力
凤凰网科技讯 4月9日,金山办公生产力大会在京举行,现场发布了面向组织和企业的办公新质生产力平台WPS 365,其包含升级的WPS Office、最新发布的WPS AI企业版和WPS协作。WPS AI企业版的发布打通了文档、AI、协作三大能力,覆盖了一个组织日常办公的基本需求。 数据显示,2020年金山办公云端文档数是898亿份,到2023年底已达到2174亿份,增长了142%。金山办公作为办公软件公司,此次WPS 365的全新升级,进一步打通了AI与协作的能力。 章庆元表示,WPS 365全面覆盖了一个组织日常办公的基本需求,从文档创作到即时通讯(IM)、会议、邮件,再到AI应用,标志着一个文档处理套件正式升级为一站式AI办公。 发布会现场演示了本地文档一键切换出在线协作功能,变成协作文档,并邀请他人共同参与编辑。协作完成后又可以选择关闭,协作文档恢复为本地文档。最新版WPS Office里的各类工具也均内置了具备大语言模型能力的人工智能应用WPS AI,为用户提供诸如扩写、缩写、总结、生成公式等功能。WPS协作则进一步让组织用户间的沟通交流更便捷,用户可以边写⽂档边沟通,即使是在邮件、OA系统里也能够无缝衔接。 基于「WPS Office+WPS协作+WPS AI」的模式,意味着用户只需要WPS 365一个产品就能完成工作,免去了办公场景下的繁琐切换,实现办公新质生产力的切实落地。 金山办公副总裁王冬介绍说,与个人版不同之处在于,WPS AI企业版聚焦为客户打造企业大脑,它分为AI Hub(智能基座)、AI Docs(智能文档库)、Copilot Pro(企业智慧助理)三个部分。 AI Docs将传统云文档库升级为智能文档库,让智能创作来源有依据,完整的文档权限体系保障信息不越权。 Copilot Pro则可帮助运营人员使用自然语言驱动BI产品分析数据,并可调用WPS 365 API和企业自有API,解决办公自动化需求。 WPS AI企业版不仅能读书认字,还能自助化分析数据、减少人工的重复劳动,提供“文理兼修”的数字员工服务,例如阅读助手、画图助手、考勤助手、销售分析、合同分析等等,触达各类细微的办公场景。
消息称三星、SK海力士推进移动内存堆叠封装技术量产,满足端侧AI需求
IT之家 4 月 9 日消息,据韩媒 ETNews 报道,三星电子和 SK 海力士都在推进移动 DRAM 堆叠封装技术的应用,该技术可提高移动设备的内存带宽。 端侧 AI 是目前智能手机、笔记本等产品市场的热门话题,而实现端侧运行模型需要更强大的移动 DRAM 性能。堆叠芯片作为一种在 HBM 内存上行之有效的策略被纳入考虑。 然而,以 LPDDR 为代表的移动 DRAM 芯片较小,不适合与 HBM 相同的 TSV(IT之家注:硅通孔)连接方案;同时 HBM 制造工艺的高成本低良率特性也不能满足高产能移动 DRAM 的需求。 因此三星电子、SK 海力士采用了另一种先进封装方式来实现移动 DRAM 芯片堆叠,也就是垂直布线扇出技术 VFO,该技术可提供更多的 IO 数据引脚。 SK 海力士方面表示 VFO 技术将 FOWLP 和 DRAM 堆叠两项技术结合,通过垂直连接大幅缩短了电信号在多层 DRAM 间的传输路径,同时能效也有提升。 ▲ 图源 SK 海力士官网 SK 海力士给出的数据显示,其去年中的 VFO 技术验证样品在导线长度上仅有传统布线产品的不到 1/4,能效也提升了 4.9%。虽然该方案带来了额外 1.4% 的散热量,但封装厚度减少了 27%。 根据 ETNews 的说法,三星方面采用类似技术的产品是 LLW DRAM。LLW DRAM 可实现低延迟和 128GB/s的高带宽性能,同时能耗也仅有 1.2 pJ / b。 采用 VFO 技术的产品有望成为继 HBM 后的下一个 AI 内存热点。报道称三星计划于明年下半年实现 LLW DRAM 的量产;而 SK 海力士相关产品目前已在量产准备阶段。
聚焦超长上下文,Claude为自己“拆”炸弹
近日,Anthropic研究人员以及其他大学和研究机构的合作者发布了一篇名为《Many-shot Jailbreaking》的研究,主要阐述了通过一种名为Many-shot Jailbreaking(MSJ)的攻击方式,通过向模型提供大量展示不良行为的例子来进行攻击,强调了大模型在长上下文控制以及对齐方法方面仍存在重大缺陷。 据了解,Anthropic公司一直宣传通过Constitutional AI(“宪法”AI)的训练方法为其AI模型提供了明确的价值观和行为原则,目标构建一套“可靠、可解释、可控的以人类(利益)为中心”的人工智能系统。 随着Claude 3系列模型的发布,行业中对标GPT-4的呼声也愈发高涨,很多人都将Anthropic的成功经验视作创业者的教科书。然而,MSJ的攻击方式,展示了大模型在安全方面,仍然需要持续发力以保证更加稳定可控。 顶级大模型齐汗颜,MSJ究竟何方神圣 有趣的是,Anthropic CEO Dario Amodei也曾出任OpenAI的前副总裁,而其之所以选择跳出“舒适圈”成立Anthropic很大一部分原因便是Dario Amodei并不认为OpenAI可以解决目前在安全领域的困境。而在忽略安全问题一味的追求商业化进程是一种不负责任的表现。 在《Many-shot Jailbreaking》的研究中显示,MSJ利用了大模型在处理大量上下文信息时的潜在脆弱性。这种攻击方法的核心思想是通过提供大量的不良行为示例来“越狱”(Jailbreak)模型,使其执行通常被设计为“拒绝”的任务。 “上岸第一剑,先斩意中人”。研究团队同时测试了Claude 2.0、GPT-3.5、GPT-4、Llama 2 (70B)以及Mistral 7B等海外的主流大模型,而从结果来看,自家的Claude 2.0也没有被“幸免”。 MSJ攻击的核心在于通过大量的示例来“训练”模型,使其在面对特定的查询时,即使这些查询本身可能是无害的,模型也会根据之前的不良示例产生有害的响应。这种攻击方式展示了大语言模型在长上下文环境下可能存在的脆弱性,尤其是在没有足够安全防护措施的情况下。 因此,MSJ不仅是一种理论上的攻击方法,也是对当前大模型安全性的一个实际考验,用以提示开发者和研究者需要在设计和部署模型时更加关注模型的安全性和鲁棒性 通过向Claude 2.0这样的大型语言模型提供大量的不良行为示例来进行攻击。这些示例通常是一系列的虚构问答对,其中模型被引导提供通常它会拒绝回答的信息,比如制造炸弹的方法。 数据显示,在第256轮攻击后,Claude 2.0表现出了明显的“错误”。这种攻击利用了模型的上下文学习能力,即模型能够根据给定的上下文信息来生成响应。 除了诱导大模型提供有关违法活动的信息,针对长上下文能力的攻击还包括生成侮辱性回应、展示恶性人格特征等。这不仅对个人用户构成威胁,还可能对社会秩序和道德标准产生广泛影响。因此,开发和部署大模型时必须采取严格的安全措施,以防止这些风险在实际应用中复现,并确保技术被负责任地使用。同时,也要求持续的研究和改进,以提高大模型的安全性和鲁棒性,保护用户和社会免受潜在的伤害。 基于此,Anthropic针对长上下文能力的被攻击风险带来一些解决办法。包括: 监督微调(Supervised Fine-tuning): 通过使用包含良性响应的大量数据集对模型进行额外的训练,以鼓励模型对潜在的攻击性提示产生良性的响应。不过,尽管这种方法可以提高模型在零样本情况下拒绝不当请求的概率,但它并没有显著降低随着攻击样本数量增加而导致的有害行为的概率。 强化学习(Reinforcement Learning): 使用强化学习来训练模型,以便在接收到攻击性提示时产生合规的响应。包括在训练过程中引入惩罚机制,以减少模型在面对MSJ攻击时产生有害输出的可能性。这种方法在一定程度上提高了模型的安全性,但它并没有完全消除模型在面对长上下文攻击时的脆弱性。 目标化训练(Targeted Training): 通过专门设计的训练数据集来减少MSJ攻击效果的可能性。通过创建包含对MSJ攻击的拒绝响应的训练样本,模型可以学习在面对这类攻击时采取更具防御性的行为。 提示修改(Prompt-based Defenses): 通过修改输入提示来防御MSJ攻击的方法,例如In-Context Defense(ICD)和Cautionary Warning Defense(CWD)。这些方法通过在提示中添加额外的信息来提醒模型潜在的攻击,从而提高模型的警觉性。 直击痛点,Anthropic不打顺风局 自2024年以来,长上下文是目前众多大模型厂商最为关注的能力之一。马斯克旗下xAI刚刚发布的Grok-1.5也新增了长达128K上下文的处理功能。与之前的版本相比,模型处理的上下文长度增加至原先的16倍;Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。 除了海外企业,国内AI初创公司月之暗面最近也宣布旗下Kimi智能助手在长上下文窗口技术上取得重要突破,无损上下文处理长度提升至200万字级别。 通过更长的上下理解能力,能够提升大模型产品提升信息处理的深度和广度,增强多轮对话的连贯性,推动商业化进程,拓宽知识获取渠道,提高生成内容的质量。然而,长上下文理带来的安全和伦理问题不可小觑。 斯坦福大学研究显示,随着输入上下文的增长,模型的表现可能会出现先升后降的U形性能曲线。这意味着在某个临界点之后,增加更多的上下文信息可能无法带来显著的性能改进,甚至可能导致性能退化。 在一些敏感领域,就要求大模型在处理这些内容时必须非常谨慎。对此,2023年,清华大学黄民烈团队提出了大模型安全分类体系,并建立了安全框架,以规避这些风险。 Anthropic此次“刮骨疗毒”,让大模型行业在推进大模型技术落地的同时,重新认识其安全问题的重要性。MSJ的目的并不是为了打造或推广这种攻击方法,而是为了更好地理解大型语言模型在面对此类攻击时的脆弱性。 大模型安全能力的发展是一场无休止的“猫鼠游戏”。通过模拟攻击场景,Anthropic 能够设计出更加有效的防御策略,提高模型对于恶意行为的抵抗力。这不仅有助于保护用户免受有害内容的影响,也有助于确保AI技术在符合伦理和法律标准的前提下被开发和使用。Anthropic 的这种研究方法体现了其对于推动AI安全领域的承诺,以及其在开发负责任的AI技术方面的领导地位。 大模型之家认为,目前大模型的测试层出不穷,相比较幻觉带来的能力问题,输出机制带来的安全危害更需要警惕。随着AI模型处理能力的增强,安全问题变得更加复杂和紧迫。企业需要加强安全意识,投入资源进行针对性研究,以预防和应对潜在的安全威胁。这包括对抗性攻击、数据泄露、隐私侵犯等问题,以及长上下文环境下可能出现的新风险。
“更大的焦虑,更大的想象力”:音视频厂商如何闯入AI时代?
作者|思杭 编辑|皮爷 2024年初,国内的大模型公司还未从上一波“GPT4”的焦虑当中缓过来,Sora就已经席卷而至。紧接着,所有互联网大厂几乎都“停下手头工作”,开始在新的领域做出一点成绩,从而尽快在市场上发声。 但在近期阿里蔡崇信的采访中,他说道,“中国AI技术可能要落后美国两年”。在这种不断追赶的焦虑背后,一个引人思索的问题是,国内大模型公司追赶的究竟是什么? 站在更为具体的赛道上来看这一问题,作为离Sora最近的赛道——音视频而言,这种焦虑也在不断放大。 从GPT3.5到GPT4.0,从Runway、Pika到Sora,当大模型的价值链不断升级,那些暂未爬到顶端的企业,还剩下多少‘生存空间’? 实际上,于音视频厂商而言,当“追逐技术”变为“追逐用户”,这种价值就变得更加具体、更加实际。从近两年音视频厂商的发力趋势可以看出,AI虽然是不可错过的大趋势,但企业要解决的难题是,如何将技术与用户连接在一起。让大模型发挥想象力的同时,更要解决用户的实际问题。 一 AI时代,不断进击的“音视频” 2022年,先是钉钉的一套“组合拳”,紧接着,音视频PaaS/SaaS厂商也纷纷跟进,不仅大手笔投入研发,还在AI方向补充弹药进行长远布局,自此,围绕音视频赛道的“混战”也正式打响。 音视频PaaS公司“拍乐云”被收购一事在2022年受到广泛关注,收购方正是阿里钉钉。一石激起千层浪,音视频赛道迅速成为焦点。更为炸裂的消息是,有着视频会议开创者Webex架构师、网易云信CTO和拍乐云创始人等多个显赫头衔的“赵加雨”,也携团队空降钉钉音视频事业部的一号位。 而跟随赵加雨的这伙人,个个都是音视频领域的得力干将。其中,李备是拍乐云音频专家,曾有5年WebEx音频专家工作经验;章琦,拍乐云首席科学家,8年WebEx音视频引擎架构师工作经验。 所有信号都指向了阿里布局音视频赛道的决心。实际上,阿里在音视频的布局更早就开始了。2021年11月,钉钉内部成立了独立的音视频事业部,该事业部成立的初衷便是聚焦在“研究音频技术及算法创新,以及探索下一代音视频会议形态”。 钉钉这一枪打响后,长年深耕在音视频赛道的腾讯云,以及其他PaaS和SaaS厂商,也纷纷从研发、解决方案、应用场景和AI方面增添自己的弹药库。 同样身为互联网厂商,音视频于腾讯而言,可以算是一种“与生俱来”的基因。到2022年,腾讯云的步伐早已到了在技术侧实现突破,以及在行业应用上更加细分的程度。 比如腾讯云将一种能够远程实时控制的音视频技术方案,应用在煤矿、港口场景里的无人驾驶卡车运营当中。而在此之前,在传统行业里实现远程的音视频连接和操作,无论是技术还是应用场景方面都远未达到成熟。 对于其他音视频PaaS/SaaS厂商而言,增加研发投入则是一种更为直接的方式。 在2022年,除了阿里钉钉的一套“组合拳”,音视频赛道里的另一个重磅消息是,音视频SaaS第一股“百家云”在纳斯达克敲钟上市。其2022上半年营收就达到了6860万美元,实现同比增长65.5%。在2023年其更是净利润达480万美元,实现扭亏为盈。而其研发费用更从2021财年的580万美元大幅增加到2022财年的1300万美元。 实际上,这种研发费用的骤增不仅仅是底层技术方面的发力,还有定制化和AI方面的投入。从财报中看,在2022财年的全年营收中还增加了一项“定制平台开发服务”,全年该业务的营收达到了1030万美元;而AI解决方案的收入也增加了760万美元。 而与SaaS厂商不同,音视频PaaS厂商的研发投入则更重。以声网为例,根据其2022年的财报显示,当年的全年总营收是1.61亿美元,而单是研发费用就达到了1.1亿美元。 那么,这1.1个亿的费用具体体现在哪些方面? 2023年,声网推出“凤鸣AI引擎”,将AI降噪、AI回声消除、空间音频等技术进行了集成;在视频方向,推出了超高清能力的超分、画质提升、感知编码、虚拟背景和AR特效等增强观看体验、临场感和互动表达能力的实时AI技术;也开发了语音转文字、内容审核等AI功能来增加信息提取、传递和保存的维度。 这是在AI时代、大模型时代下对智能化的一种响应。但罗马不是一天建成的。于音视频厂商而言,推出AI相关的技术或应用场景需要长期的投入。 无论是声网,还是保利威、百家云等其他音视频PaaS/SaaS厂商,对于AI的积累都要追溯到几年前。只是从外界声音来看,2023年是集中发力的一年。 以声网为例,在凤鸣AI引擎中集成的大部分技术都源于多年的积累。产业家向声网CTO钟声了解到,“空间音频”是凤鸣AI引擎中集成的技术。利用AI算法来模拟头部球面区域的立体声场,在更细微处,甚至能捕捉到人的喜怒哀乐,将这种三维信息提取出来再放到AR增强的场景。从技术处理的细节便可以感知到,它是一种“厚积薄发”的产物。 实际上2023年,大模型在国内“狂飙”的同时,音视频厂商更是不可能错过这波风口。技术的长期投入,这一年给音视频厂商的机会是在服务场景上更深化、更细致。 最为常见的便是AIGC解决方案的发布,这也是在市场层面能够迅速引发关注的方式。比如声网在去年发布RTE X AIGC 一站式产品能力解决方案;百家云发布全新AIGC产品“市场易”;腾讯云在音视频产品矩阵上的智能化升级;保利威发布AI智能教育解决方案;即构推出AI视频生成应用“即构数智人”等等。 而在无数的声音背后,大模型给音视频带来的实际价值是什么? 二 技术、落地场景和“大小模型”方案 “到了今天这个时代,客户不会关注噱头,而是更切实地关注提高了多少效率,降低了多少成本。”这是保利威全国售前总经理王建成近两年的感受。 技术不断进步的同时,服务场景也正在进一步深化。 抛开底层技术,在大模型时代,如果说真正能在效率上提升,以及成本上有所降低,用户一定会在操作体验层面有更强的感知。 那么,更为细致的应用场景,便是结合AI大模型,来解决曾经几乎“不可能”的事情。 以金融领域为例,其监管十分严格。一种常见的情况是,在直播过程中需要人为干预,进行监听。所以这种情况下,实时生成字幕对于大部分的金融客户就很难满足。 王建成告诉产业家,保利威的做法是结合金融客户的特殊需求和行业特点,做出一种专为金融行业打造的特殊模型。 这是一种将直播技术与业务结合的最佳例证。而在AI大模型时代,在技术高度不断刷新的当下,真正去解决用户的实际问题,对于音视频SaaS厂商,或许是一个更为务实的答案。 为什么说焦虑与现实有时并不成正比? 一方面,技术高度的不断刷新确实会带给人更大的焦虑,但另一方面,从现实的角度来讲,技术高度的不断刷新却并未真正下沉到产业,发挥真正的价值。 根据艾瑞咨询报告显示,在目前实时音视频领域,领跑场景依旧停留在C端,在实际生产过程中,产业数字化的价值微乎其微。 那么,从技术的角度出发,音视频技术现在究竟发展到什么程度了? 可以看到的是,腾讯云已经能够实现在煤矿、港口场景里,实时控制无人驾驶卡车运营。这是近两年较为新鲜的尝试。在这些场景同样有所布局的还有声网。除了更深入产业侧的工业领域 ,声网也在IoT行业、医疗健康行业持续发力。 而在大模型未到来之前,远程的音视频连接和操作,无论是技术还是应用场景方面都远未达到成熟。 站在技术的角度,更具体来讲,大模型给音视频领域带来的是更大的想象力。 2023年,阿里云智能高级算法专家刘国栋在深圳的一席演讲中提到了一种大模型与小模型结合的技术。 在大模型还未出现的时候,只有小模型。其实,大模型与小模型都有各自的局限。小模型的局限在于其泛化能力比较差。而泛化能力差,通俗来讲,就是小模型的理解和生成能力不好。但其优点在于,小模型、传统算法在算法开发、工程优化方面已相对比较成熟,小模型的训练资源占用少且训练速度快,部署容易,端侧落地性强。 而大模型出现后,这些问题都一一被解决了。而大模型的局限性在于,细粒度的问题还不能完美处理、容易出现幻觉现象、推理训练成本都比较高等。 因此,大小模型协同便是最好的解决方案。通过让大模型和小模型并联和相互引导的方式,来优化各自的问题。 而对于大模型与小模型的“协同”方面,声网也有自己的理解。对此,钟声向产业家解释道,“大模型的参数很大,需要巨量的数据包括高质量的数据来训练。一个符合常理的逻辑是,最领先的大模型,其推理能力较强,可以通过蒸馏等方法来训练小模型。大模型产生的结果,具备一定的质量,可以用来训练小模型。未来,大小模型应该以‘联合行动’的方式来共同完成任务,在算力、延时、隐私保护等方面实现一种更好的融合。” 一个更为遥远的畅想是,随着端上算力的增强,有着几十亿参数的大模型未来也有可能在端上运行。届时,在各个领域实现“实时音视频”则会成为现实。 三 更大的焦虑,更大的想象力 从GPT3.5到GPT4.0,从Runway、Pika到Sora,当大模型的价值链不断升级,那些暂时还未爬到顶端的企业,还剩下多少“生存空间”? 这是一个引人深思的发问。 近两年,科技界追逐技术的热情在不断高涨。大众对于AI的焦虑是更为遥远的“生存威胁”,而科技界对AI焦虑则是由所谓“参数”和“长文本”所“卷”起来的商业竞争。 如果聚焦到产业侧,聚焦到更实际的赛道,不断刷新的榜单,不断升级的参数、上下文长度,这些对于音视频厂商而言意味着什么? 在与钟声的对话中了解到,声网所追求的是实时性。而从目前来看,如果在云端的服务器上运行,最后在传输到端的设备上,很难实现“实时性”。所以声网的做法是是在端上进行计算。但客观来讲,端上运算的局限是算力不够。 对此,钟声发表了一种观点,虽然现在最前沿的技术都在追求Scaling Law(规模效应)支撑下的大模型,但对于声网而言,追求极致的小模型意义则要更大一些。首先保证低延时、低成本,直接让很小的AI算法在端上发力,通过极致、精准的算法来让音视频发挥最大的价值,低延时低成本可以为更多需要实时互动的客户和用户释放出或者创造出巨大的价值;这方面业界的关注度还不够,但终会成为焦点。声网在这方面则做了较为专注的研发投入。 站在更实际的角度,如果在云端运算,虽然在大算力的支持下运行大模型,最终可以得到较好的效果,但现实情况是,在大多数的消费侧场景,比如社交娱乐,系统响应延时过大,本身就不太像AGI,客户或用户也不可能花较高的费用来追求响应较慢的AGI效果。所以,在端上低延时低成本的运算更为有需求。 同时,钟声提出了一种畅想,在音视频领域,AGI最终会发展成端边云结合的方式,以平衡算力、延时、隐私和数据保护等几个AI发展的关键要素。 这是大模型赋予音视频厂商的想象力,而这种想象力也会应用到更现实的场景解决更实际的问题,比如医疗领域里会用到的远程救治,其实时性要求极高,延迟1s都可能威胁到生命。 那么,在当下这个拼技术刷榜单的大模型时代,音视频厂商要如何顺应AI时代? 实际上,近两年音视频的发展趋势已经从关注技术,走向关注更为实际的“降本增效”。以保利威为例,其SaaS订阅收入达到90%成绩背后,是结合具体的业务来解决实际用户的问题。 如果通过大模型所提升的音视频技术,不再止步于社交和娱乐,而是更为具体的生产环节,甚至是治病救人,那么也许实时音视频才会实现破圈,走向大众。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。