EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代
就在刚刚,Meta 如期发布了 Llama 3.1 模型。 简单来说,最新发布的 Llama 3.1 405B 是 Meta 迄今为止最强大的模型,也是全球目前最强大的开源大模型,更是全球最强的大模型。 从今天起,不需要再争论开源大模型与闭源大模型的孰优孰劣,因为 Llama 3.1 405B 用无可辩驳的实力证明路线之争并不影响最终的技术实力。 先给大家总结一下 Llama 3.1 模型的特点: 包含 8B、70B 和 405B 三个尺寸,最大上下文提升到了 128K,支持多语言,代码生成性能优秀,具有复杂的推理能力和工具使用技巧 从基准测试结果来看,Llama 3.1 超过了 GPT-4 0125,与 GPT-4o、Claude 3.5 互有胜负 提供开放/免费的模型权重和代码,许可证允许用户进行微调,将模型蒸馏到其他形式,并支持在任何地方部署 提供 Llama Stack API,便于集成使用,支持协调多个组件,包括调用外部工具 超大杯登顶全球最强大模型,中杯大杯藏惊喜 本次发布的 Llama 3.1 共有 8B、70B 和 405B 三个尺寸版本。 从基准测试结果来看,超大杯 Llama 3.1 405B 全方位耐压了 GPT-3.5 Turbo、大部分基准测试得分超过了 GPT-4 0125。 而面对 OpenAI 此前发布的最强闭源大模型 GPT-4o 和第一梯队的 Claude 3.5 Sonnet,超大杯依然有着一战之力,甚至可以仅从纸面参数上说,Llama 3.1 405B 标志着开源大模型首次追上了闭源大模型。 具体细分到基准测试结果,Llama 3.1 405B 在 NIH/Multi-needle 基准测试的得分为 98.1,虽然比不上 GPT-4o,但也表明其在处理复杂信息的能力上堪称完美。 并且 Llama 3.1 405B 在 ZeroSCROLLS/QUALITY 基准测试的得分为 95.2,也意味着其具有强大整合大量文本信息的能力,这些结果表明,LLaMA3.1 405B 模型在处理长文本方面出色,对于关注 LLM 在 RAG 方面性能的 AI 应用开发者来说,可谓是相当友好。 尤为关注的是,Human-Eval 主要是负责测试模型在理解和生成代码、解决抽象逻辑能力的基准测试,而 Llama 3.1 405B 在与其他大模型的比拼中也是稍占上风。 除了主菜 Llama 3.1 405B,虽为配菜的 Llama 3.1 8B 和 Llama 3.1 70B 也上演了一出「以小胜大」的好戏。 就基准测试结果来看,Llama 3.1 8B 几乎碾压了 Gemma 2 9B 1T,以及 Mistral 7B Instruct,整体性能甚至比 Llama 3 8B 都有显著提升。Llama 3.1 70B 更是能越级战胜 GPT-3.5 Turbo 以及性能表现优异的 Mixtral 8×7B 模型。 据官方介绍,在这次发布的版本中,Llama 研究团队在 150 多个涵盖多种语言的基准数据集上对模型性能进行了评估,以及团队还进行了大量的人工评估。 最终得出的结论是: 我们的旗舰模型在多种任务上与顶尖的基础模型,如 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 等,具有竞争力。同时,我们的小型模型在与参数数量相近的封闭和开放模型相比时,也展现出了竞争力。 Llama 3.1 405B 是如何炼成的 那 Llama 3.1 405B 是怎么训练的呢? 据官方博客介绍,作为 Meta 迄今为止最大的模型,Llama 3.1 405B 使用了超过 15 万亿个 token 进行训练。 为了实现这种规模的训练并在短时间内达到预期的效果,研究团队也优化了整个训练堆栈,在超过 16000 个 H100 GPU 上进行训练,这也是第一个在如此大规模上训练的 Llama 模型。 团队也在训练过程中做了一些优化,重点是保持模型开发过程的可扩展性和简单性: 选择了仅进行少量调整的标准解码器 Transformer 模型架构,而不是混合专家模型,以最大限度地提高训练稳定性。 采用了一种迭代后训练程序,每一轮都使用监督微调和直接偏好优化。这使得研究团队能够为每轮创建最高质量的合成数据,并提升每项功能的性能。 相较于旧版 Llama 模型,研究团队改进了用于预训练和后训练的数据数量和质量,包括为预训练数据开发更预处理和管理管道,为后训练数据开发更严格的质量保证与过滤方法。 Meta 官方表示,在 Scaling Law 的影响之下,新的旗舰模型在性能上超过了使用相同方法训练的小型模型。 研究团队还利用了 405B 参数模型来提升小型模型的训练后质量。 为了支持 405B 规模模型的大规模生产推理,研究团队将模型从 16 位(BF16)精度量化到 8 位(FP8)精度,这样做有效减少了所需的计算资源,并使得模型能够在单个服务器节点内运行。 Llama 3.1 405B 还有一些值得发掘的细节,比如其在设计上注重实用性和安全性,使其能够更好地理解和执行用户的指令。 通过监督微调、拒绝采样和直接偏好优化等方法,在预训练模型基础上进行多轮对齐,构建聊天模型,Llama 3.1 405B 也能够更精确地适应特定的使用场景和用户需求,提高实际应用的表现。 值得一提的是,Llama 研究团队使用合成数据生成来产生绝大多数 SFT 示例,这意味着他们不是依赖真实世界的数据,而是通过算法生成的数据来训练模型。 此外,研究团队团队通过多次迭代过程,不断改进合成数据的质量。为了确保合成数据的高质量,研究团队采用了多种数据处理技术进行数据过滤和优化。 通过这些技术,团队能够扩展微调数据量,使其不仅适用于单一功能,而是可以跨多个功能使用,增加了模型的适用性和灵活性。 简单来说,这种合成数据的生成和处理技术的应用,其作用在于创建大量高质量的训练数据,从而有助于提升模型的泛化能力和准确性。 作为开源模型路线的拥趸,Meta 也在 Llama 模型的「配套设施」上给足了诚意。 Llama 模型作为 AI 系统的一部分,支持协调多个组件,包括调用外部工具。 发布参考系统和开源示例应用程序,鼓励社区参与和合作,定义组件接口。 通过「Llama Stack」标准化接口,促进工具链组件和智能体应用程序的互操作性。 模型发布后,所有高级功能对开发者开放,包括合成数据生成等高级工作流。 Llama 3.1 405B 内置工具大礼包,包含关键项目,简化从开发到部署的流程。 值得注意的是,新开源协议里,Meta 不再禁止用 Llama 3 来改进其他模型了,这其中也包括最强的 Llama 3.1 405B,真·开源大善人。 一个由开源引领的新时代 网友 @ZHOZHO672070 也火速在 Hugging Chat 上测试了一下 Llama 3.1 405B Instruct FP8 对两个经典问题的回答情况。 遗憾的的是, Llama 3.1 405B 在解决「9.11 和 9.9 谁更大」的难题上遭遇翻车,不过再次尝试之下,又给出了正确答案。而在「我一把把把住了」的拼音标注上,其表现也尚可。 网友更是只用了不到 10 分钟的时间,就使用 Llama 3.1 模型快速构建和部署了一个聊天机器人。 另外,Llama 内部科学家 @astonzhangAZ 也在 X 上透露,其研究团队目前正在考虑将图像、视频和语音功能集成到 Llama 3 之中。 开源和闭源之争,在大模型时代依然延续着,但今天 Meta Llama 3.1 新模型的发布为这场辩论画上了句号。 Meta 官方表示,「到目前为止,开源大型语言模型在功能和性能方面大多落后于封闭式模型。现在,我们正迎来一个由开源引领的新时代。」 Meta Llama 3.1 405B 的诞生证明了一件事情,模型的能力不在于开或闭,而是在于资源的投入、在于背后的人和团队等等,Meta 选择开源或许出于很多因素,但总会有人扛起这面大旗。 而作为第一个吃螃蟹的巨头,Meta 也因此收获了首个超越最强闭源大模型的 SOTA 称号。 Meta CEO 扎克伯格在今天发布的长文《Open Source AI Is the Path Forward》中写道: 「从明年开始,我们预计未来的 Llama 将成为业内最先进的。但在此之前,Llama 已经在开源性、可修改性和成本效率方面领先。」 开源 AI 模型或许也志不在超越闭源,或出于技术平权,不会让其成为少数人牟利的手段,或出于众人拾柴火焰高,推动 AI 生态的繁荣发展。 正如扎克伯格在其长文末尾所描述的愿景那样: 我相信 Llama 3.1 版本将成为行业的一个转折点,大多数开发人员将开始转向主要使用开源技术,我期待这一趋势从现在开始持续发展……共同致力于将 AI 的福祉带给全球的每一个人。
视频生成大战2.0!大厂狂卷底层模型,创企5个月吸金44亿
智东西(公众号:zhidxcom) 作者 | 香草 编辑 | 李水青 要说2024年大模型最火的赛道,视频生成一定榜上有名。 继2月Sora开启AI视频生成新时代之后,今年6月密集的模型发布,又将视频生成大战推向了新的高潮。 “AI影视的下一个代际来了”、“太卷了,简直是你方唱罢我方登场”、“终于有希望摆脱PPT时代了”、“看样子很快就能用AI制作MV了”……在AI视频创作者或从业者当中,我们能看到最多的情绪是“兴奋”。 自Sora发布以来,超8家国内外AI企业陆续推出新产品或模型,动辄生成10秒以上视频且公开可用,有的据称已实现长达2分钟的超长视频生成,AI视频生成赛道掀起热火朝天的2.0大战。 这边,字节抢先上线AI视频生成产品即梦,将视频生成时长从常见的3-4秒拉长到12秒;沉寂许久的快手突然发布可灵大模型,惊艳的效果引发全网热议,排队人数一度接近100万。 ▲快手可灵排队申请人数 那边,创企Luma AI“弃3D投视频”,发布Dream Machine高调入局;老玩家Runway也不甘示弱,甩出新一代Gen-3模型,将物理模拟能力推向新的高度。 ▲Gen-3视频生成效果 融资战场上,战火同样炽烈。国内,爱诗科技、生数科技自3月起接连斩获亿级融资;海外,Pika在6月获得8000万美元融资,估值翻倍至5亿美元,而Runway则被曝正在筹备一笔高达4.5亿美元的融资。 Sora如同一颗重磅炸弹,震撼了AI视频生成界。如今经过5个月的激烈追赶,海内外AI视频生成产品究竟进展如何?它们能否与Sora一较高下?又将面临哪些挑战?通过对可用产品的横向体验,以及与从业者、创作者的探讨,智东西深入分析了这些问题。 在实测中,我能明显感受到视频生成的速度变快、“翻车”现象大幅减少,从简单的“PPT式”平移进化为有角度、动作变化的运动。整体体验下来,免费可用的产品中效果最佳的是即梦和可灵,无论是时长、稳定性还是物理模拟都实现领跑。 在融资方面,与Sora发布前相比,AI视频生成相关的融资密度和金额都大幅上涨,5个月内吸金超44亿,还带动视频制作流程“上下游”的其他产品如AI剪辑、AI灯光等获得资本青睐。此外还有多个新玩家入局,有的还没发布任何产品或技术就已经融到亿级资金。 一、技术之战:卷时长、卷高清、卷物理模拟 2月16日,OpenAI发布Sora,一夜颠覆了AI视频生成赛道格局。然而5个月过去,Sora仍是一款期货产品,什么时候能为普罗大众所用,看起来也遥遥无期。 这期间,国内外的大厂、创企争相发布新产品或模型升级,且大多数都已向全体用户开放,其中不乏效果惊艳的产品,这也让AI视频生成的格局再次发生改变。毕竟,Sora再好,用不上又有什么价值呢? 据智东西不完全统计,Sora发布以来国内外至少有8家公司发布新产品或模型,其中除生数科技的Vidu之外均公开可用。 ▲AI视频生成产品发布/模型升级(智东西制表) 2月21日,Stability AI正式上线了AI视频生成产品Stable Video网页版,且面向所有用户开放。虽然其底层模型Stable Video Diffusion于去年11月便已开源发布,但作为模型仍有一定的部署和使用门槛,打包成网页版发布后让更多用户可以简单便捷地上手使用。 4月27日,生数科技联合清华大学发布长时长、高一致性、高动态性视频大模型Vidu,据称可生成长达16秒、分辨率1080P的视频,并且能够模仿真实物理世界。 从放出的Demo来看,Vidu确实在清晰度、运动幅度、物理模拟等方面取得了很好的效果,不过遗憾的是,Vidu与Sora一样尚未开放。智东西向生数科技询问得知,产品将于近期开启内测。 ▲生数科技Vidu视频Demo 5月9日,字节剪映旗下AI创作平台Dreamina更名“即梦”,并上线AI作图和AI视频生成功能,最长支持生成12秒的视频。 6月6日,快手发布AI视频大模型可灵,并上线快影App,用户只需填写问卷即可申请使用。可灵大模型主打对物理世界特性的高强度模拟,例如难倒众多AI的“吃面条”等问题,在其提供的视频案例中均有体现。 目前,可灵支持生成5秒、10秒固定时长的视频。据其官网介绍,模型最高能生成2分钟、帧率30fps、分辨率1080P的视频,后续将上线视频续写等功能。 6月13日,此前主要做AI生成3D的创企Luma AI宣布推出视频生成工具Dream Machine,支持文本、图像生成5秒长度的视频,同时提供视频延长功能,可基于已生成的视频一次延长5秒。 6月17日,Runway发布新一代模型Gen-3 Alpha版本,并于7月2日面向所有用户付费开放,订阅费最低为每月15美元。Gen-3目前支持基于文本生成5秒、10秒长度的视频,图生视频以及其他可控工具暂未开放。 ▲Gen-3 Alpha生成视频效果 7月6日,智象未来(HiDream)在WAIC上发布了智象大模型2.0,提供5、10、15秒三种视频生成时长,并增加文字嵌入生成、剧本多镜头视频生成、IP连贯一致性等能力。 7月17日,此前专注AI 3D重建的英国AI创企Haiper AI,宣布旗下AI视频生成产品Haiper升级至v1.5,时长延长到8秒,且提供视频延长、画质增强等功能。 下表展示了这些模型的生成时长、分辨率、帧率等参数,以及除基础生成外的附加能力。 ▲升级的AI视频生成产品参数(智东西制表) 从参数上看,这些AI视频生成产品首先在生成时长上实现了明显进步,基础生成时长从此前的2-4秒延长到5秒,并且有一半以上都支持超10秒的时长,还有部分产品提供了延长功能。目前免费可用的产品中,生成视频最长的为即梦的12秒。 在视觉效果方面,分辨率、帧率都有较大提升,支持720P及以上的产品更多了,帧率也向24/30fps靠拢,此前的产品生成视频分辨率大多在1024*576左右,帧率多为8-12fps。 二、产品之战:上手实测6款免费“现货”,“抖快”领跑 Sora刚发布时,智东西曾对国内可用的8款AI视频生成工具进行了深度体验,当时差距还比较明显,“翻车”情况较多。(全网首个“中国版Sora”横评!15家企业对决,字节领跑) 那么经过几个月的迭代升级,已经交出新答卷的这些玩家表现如何?智东西对新发布或升级的AI视频生成产品进行了体验,为公平起见,统一只试用免费能力,且均选取第一次生成的视频。 需要注意的是,视频生成本身就有类似于“抽卡”的运气成分在内,且和提示词的撰写也有很大关系,因此少量的案例并不完全代表模型能力。 第一关我选择了静物场景,提示词为:郁金香沐浴在夕阳暖光中的特写。 Stable Video在这个提示上表现出很高的稳定性,同时画面清晰度、色彩的丰富程度都比较高,在运动上以镜头的运动为主。 ▲Stable Video生成视频 Dream Machine的画面清晰度明显掉了一个档次,不过在对提示词的表现上还是比较准确的,运动同样以镜头的平移为主。 ▲Dream Machine生成视频 Haiper生成的视频视觉效果很好,但是运动幅度略小。 ▲Haiper生成视频 智象大模型的表现也不错,画面有很强的景深效果,但细看花瓣会发现存在细节上的缺陷和不稳定。 ▲智象大模型生成视频 即梦生成的是固定镜头的画面,运动方面以郁金香的晃动为主,整体效果比较稳定。 可灵生成的视频把“特写”这一提示词展现到了极致,同时画面清晰度较高,还刻画出了花瓣上的纹理。不过话说回来,对“郁金香的特写”该如何理解,本身也不是一个有固定答案的问题,所以也说不上谁对谁错。 自动播放 ▲可灵生成视频 整体来看,各路玩家在静物场景上的表现都很稳定,生成视频的可用程度很高。 第二关我选择了动物场景,且增加了风格化和动态动作的元素,提示词为:一只卡通袋鼠在跳迪斯科。这其实是Sora提供的案例中的一个,首先我们来看一下Sora的打样。 自动播放 ▲Sora生成视频案例 Stable Video在这一关“扑街”。第一帧画面很完美——这或许与Stable Video在生成视频时选取的路径有关,在生成流程中,它会先生成4张图像供用户选择,再根据用户选择的图像生成视频——随后袋鼠的全身都开始扭曲变形。 比较有趣的是画面背景中的人物和拟人化的动物并没有太大的问题,不知道是不是“跳迪斯科”这个动作把Stable Video给难倒了。 ▲Stable Video生成视频效果 Dream Machine生成的视频整体稳定性不错,但在袋鼠的脚部、手部等细节上会有稳定性的缺失。在运动幅度上,除了袋鼠本身的运动外,它还进行了从特写到全景的镜头推移。 我又试用了Dream Machine的视频延长功能,视频后5秒是其延长生成的内容。可以看到它并没有局限在单一镜头,而是进行了从全身到上半身近景的镜头切换。不过延长的视频中虽然背景中的人物群像稳定性较高,但袋鼠更加不稳定了。 自动播放 ▲Dream Machine生成视频效果 Haiper生成的袋鼠有一定程度扭曲,且没有体现“跳迪斯科”这一关键词。 ▲Haiper生成视频 智象大模型在这一关翻车比较严重,和Stable Video一样出现了画面主体大幅度扭曲的问题,并且也没有体现“跳迪斯科”。 ▲智象大模型生成视频效果 即梦生成的视频整体视觉效果比较好,清晰度、色彩丰富程度很高。稳定性方面,前几秒还比较正常,但在后3秒左右出现了明显的扭曲,扭曲程度与Dream Machine差不多。 在语义理解上,画面有体现一定的“跳舞”动作,但和“迪斯科”关系不大。此外,画面背景中的文字看起来像是“鬼画符”。 自动播放 ▲即梦生成视频效果 可灵生成的视频整体比较稳定,主要的问题集中在手部和眼球。但在语义理解方面,并没有体现出“跳迪斯科”这一关键词。 自动播放 ▲可灵生成视频效果 这一关整体来看,Dream Machine、即梦、可灵的表现更胜一筹,但都无法达到Sora的水准。此外,这个提示词也展现了各个模型在审美上的差异,包括色彩的倾向、风格的选择、镜头的切换等。 第三关设置为人物特写,使用的提示词为:一个宇航员在空间站外漂浮的特写镜头,背景中有地球和月亮,星星在头盔面罩上反射。 Stable Video在这一关的表现还不错,准确地描绘了“宇航员”、“地球”、“月亮”、“星星反射”等关键词,稳定性也很高。运动方面不是简单的镜头平移,而是画面主体相对背景的运动。 ▲Stable Video生成视频 Dream Machine则大翻车,完全把“宇航员”给丢在了脑后,绘制了一幅宇宙场景。 ▲Dream Machine生成视频 Haiper在这一关表现不错,虽然漏掉了“月亮”,但其他关键词都有体现,头盔中的倒影也很自然。 ▲Haiper生成视频 智象大模型起初拒绝生成该提示词,显示存在敏感内容。在多次删减后,我终于用“一个男子在空间站外漂浮的特写镜头”生成了一段视频。 画面整体效果比较真实,虽然最终用的提示词里只有“空间站”这一个体现内容的关键词,其还是描绘了地球、航天服等元素。不过这位主人公并没有戴航天头盔,不知道是怎么呼吸甚至讲话的(doge)。 ▲智象大模型生成视频效果 即梦在人物细节的刻画上较为优秀,人脸、服装都比较精致,稳定性也很高,但是画面背景中似乎出现了第二个“地球”,此外镜头相较于“特写”更偏向“近景”。 自动播放 ▲即梦生成视频 可灵生成的视频画面中一开始没有出现人物,随后宇航员缓慢进入镜头当中,但背景又是静止的,看起来有种淡淡的幽默。不过画面本身的准确度和稳定性还是很高的,体现了每一个关键词,还描绘了部分选手遗漏的“空间站”。 自动播放 ▲可灵生成视频 人物关的整体表现虽然不如静物场景稳定,但相比上一关效果好了不少,可能和训练数据丰富、运动幅度小有关系。这一关表现更好的是Stable Video、Haiper、即梦和可灵。 总体来看,在智东西本次体验的6款AI视频生成产品中,即梦、可灵的生成效果优势比较明显,无论是在时长还是稳定性上都达到不错的能力。此外国内的Morph Studio、NeverEnds等产品效果也很不错,但由于其未在Sora发布后有新的产品或模型升级,因此不在本次体验范围内。 三、资本之战:5个月吸金44亿,新玩家涌现 Sora发布时,如当初的GPT-4一样再度掀起生成式AI热潮,引发文生视频概念股集体涨停。 一级市场也迎来一波新的狂欢。据智东西不完全统计,Sora发布至今5个月以来,至少有5家AI视频生成赛道的创企获得超亿元融资,累计约12亿元,此外还有Runway被曝正在洽谈4.5亿美元(约合人民币32.68亿元)新融资。 ▲AI视频生成相关大额投融资(智东西制表) 国内,爱诗科技分别于3月、4月接连融到两笔亿级资金,且得到蚂蚁等知名投资方的青睐,此前其仅在去年8月获得一笔数千万元的天使轮融资。 今年1月,爱诗科技上线海外版AI视频生成产品PixVerse,当时成为与Pika、Runway竞争的有力黑马。Sora发布后,其创始人王长虎曾称将在3-6个月内实现赶超。 目前5个月过去,爱诗科技尚未发布底层模型的迭代更新,不过陆续推出了角色一致性、运动笔刷等新功能。智东西向其询问产品进展得知,其新一代模型及新功能“文生视频故事片”将在本周发布,可生成时长8秒的视频,并且能一次性生成3-5段内容连续的有声视频。 ▲PixVerse上线运动笔刷功能(图源:爱诗科技) 生数科技也在短短3个月内连续获得两笔数亿元融资,其中百度风投作为老股东持续加投。此前,生数科技共获得2轮累计超一亿元融资。 三呆科技(Sand AI)则是一家近期刚刚走入大众视野的创企,目前并未有产品发布。7月10日,Sand AI被曝于5月获得今日资本领投的数千万美元A轮融资。 Sand AI成立于2023年10月,主要开发类似Sora的视频生成技术。值得注意的是,其创始人曹越是光年之外联合创始人之一,曾任北京智源AI研究院视觉模型研究中心负责人、微软亚洲研究院主管研究员。 公开信息显示,曹越本科、博士均毕业于清华大学,曾获得计算机视觉顶会ICCV的最佳论文奖马尔奖,谷歌学术被引超4万次。 ▲曹越(图源其个人主页) Haiper AI也是一家新入局视频生成的创企。该公司成立于2022年,位于英国伦敦,此前专注基于AI的3D重建方向。 据外媒3月报道,Haiper AI获得1380万美元(约合人民币1亿元)的种子轮融资,此前曾于2022年4月筹集了540万美元资金。 Haiper AI的创始团队是两位华人,Yishu Miao曾在TikTok全球信任与安全团队任职,Ziyu Wang曾在DeepMind担任研究科学家。去年晚些时候,Haiper AI团队决定专注于视频生成,并在去年12月发布了首款同名视频生成产品的测试版。 ▲Haiper发布同名产品测试版 Pika于6月宣布获得新一轮约8000万美元(约合人民币5.81亿元)融资,估值翻倍至近5亿美元。去年11月,Pika宣布完成累计完成5500万美元的融资,估值在2-3亿美元。 7月2日,AI视频生成赛道的“老玩家”Runway被曝出正在洽谈4.5亿美元(约合人民币32.68亿元)的新融资,估值达到40亿美元。 Runway的上一笔融资完成于去年6月,投资方包括谷歌、英伟达等,并以1.41亿美元的资金达到15亿美元融资,累计融资2.37亿美元。如果本轮融资落地,无论是融资额还是估值都达到两倍以上。 总的来看,在Sora发布后的这几个月,一级市场不断有新的AI视频生成融资出现,不仅频率更加频繁,金额也大幅上涨,单次融资额都超过此前的融资总额。即使部分创企没有产品发布或模型升级,也没能阻挡投资方的热情。 四、AI视频大战150天,从“PPT”变成真正的“视频” Sora“隐身”的150天,在众多大厂和创企的“围攻”下,主流AI视频生成产品与Sora的差距已经大幅缩短,并且还有至关重要的一点——可上手使用,甚至不少功能还是免费。 目前来看,头部AI视频生成产品已经实现了不错的时长和稳定性,下一步迭代的重点方向是物理模拟。从官方展示的Demo来看,Gen-3、可灵、即梦、Vidu对真实世界的模拟程度较高,经过筛选过的案例已经与Sora放出的案例效果相差无几。 那么从创作者的视角来看,现阶段的产品使用体验如何呢? 近日,导演、AI影视创作者陈坤(闲人一坤)制作了其AI短剧《山海奇镜》预告片的重制版,并与原版进行了对比。 在该短剧的首映会上,他向智东西等媒体谈道,半年时间内AI的进步还是非常明显的,尤其是物理模拟方面,在他看来已经实现了“代际性”的迭代。具体来说,现阶段可灵等视频生成模型已经实现了原生高清,不再是切片式的画面内容驱动,主体运动合理,动作幅度不但大还流畅,且对提示词响应积极。但同时,现在AI视频生成技术仍面临几大痛点:人物一致性、场景一致性、人物表演、动作交互、运动幅度。 ▲《山海奇镜》预告片重制版与原版对比 从应用的角度来看,在影视制作等场景中,AI目前还处于追赶传统影视的过程中。 在一个完整的制作流程中,AI仍是一个辅助的手段而非主要工具,如剧本、配音、剪辑、后期等环节,目前还没有能达到生产力水准的产品出现。 但在成本上,包括人效比等方面,基于AI的流程已经实现大幅压缩,达到传统制作流程的1/4以下。 ▲陈坤在点映会上接受采访 在WAIC 2024上,爱诗科技联合创始人谢旭璋谈道,现在我们所说的“视频生成”其实只是视频素材的生成,只是完整视频制作流程中的一小部分,没有声音、剪辑、转场、剧本等,无论是从技术还是业务上,还有非常长的路要走。 这也是除了继续迭代底层模型克服视频生成现有痛点外,AI视频发展的另一重要方向。 市面上也有不少公司正在各个视频制作流程中进行尝试,同样得到一级市场的青睐。仅最近一周内,就有AI驱动的视频编辑工具Captions、AI虚拟环境提供照明和合成工具Beeble分别获得6000万美元和475万美元融资。 结语:AI视频生成,等待一个GPT-4时刻 Sora的发布点燃了国内外大厂团队和创业者的热情,不过整体来看还处于早期阶段,技术路线尚未达成共识,生成效果离商业标准也有一定距离。至于具体处在什么阶段,有不少行业人士将其与语言、图像模型的早期阶段作类比,如“GPT-3时代”、“图像生成的2022年前夕”等。 但可以肯定的是,AI视频生成技术正在指数级飞速发展,不断有新的产品和技术问世。尽管存在一些技术痛点和挑战,但随着技术的迭代和市场的推动,这一领域有望实现更多的突破和应用。 AI视频生成大战不仅是技术的较量,更是资本的角逐。在这场狂卷吸金的风暴中,谁能笑到最后,我们拭目以待。
特斯拉第二季度净利润大跌45% 确定自动驾驶出租车发布时间
特斯拉 凤凰网科技讯 北京时间7月24日,特斯拉公司(NASDAQ: TSLA)今天发布了截至6月30日的2024财年第二季度财报。财报显示,按照美国通用会计准则(GAAP)计算,特斯拉第二季度总营收为255.00亿美元,较上年同期的249.27亿美元增长2%;归属于特斯拉普通股股东的净利润为14.78亿美元,较上年同期的27.03亿美元大跌45%。 特斯拉CEO埃隆·马斯克(Elon Musk)在电话会议上确认,自动驾驶出租车发布会推迟到今年10月10日,这一调整将能够让公司改进自动驾驶出租车,并在产品发布时增加“另外一些东西”。 马斯克还表示,将在明年上半年推出一款更实惠车型。 股价表现: 特斯拉第二季度营收好于预期,但每股收益连续第四个季度不及预期,股价在盘后交易中下跌逾3%。 特斯拉股价盘后下跌3.26% 特斯拉周二在纳斯达克交易所的开盘价为253.45美元。截至周二收盘,特斯拉股价下跌5.13美元,报收于246.38美元,跌幅为2.04%。截至发稿,特斯拉股价在盘后交易中下跌8.04美元至238.35美元,跌幅为3.26%。过去52周,特斯拉股价最高为278.98美元,最低为138.80美元。 第二季度运营要点: ——总汽车产量为410,831辆,较上年同期的479,700辆下降14%;其中,Model 3/Y产量为386,576辆,较上年同期的460,211辆下降16%;其他车型产量为24,255辆,较上年同期的19,489辆增长24%; ——总汽车交付量为443,956辆,较上年同期的466,140辆下降5%;其中,Model 3/Y交付量为422,405辆,较上年同期的446,915辆下降5%;其他车型交付量为21,551辆,较上年同期的19,225辆增长12%。 第二季度财务业绩: ——总营收为255.00亿美元,较上年同期的249.27亿美元增长2%; ·总汽车业务营收为198.78亿美元,较上年同期的212.68亿美元下降7%; ·能源生成和存储业务营收为30.14亿美元,较上年同期的15.09亿美元增长100%; ·服务和其他业务营收为26.08亿美元,较上年同期的21.50亿美元增长21%。 ——总毛利润为45.78亿美元,较上年同期的45.33亿美元增长1%;总毛利率为18.0%,较上年同期的18.2%下降0.2个百分点; ——营业费用为29.73亿美元,较上年同期的21.34亿美元增长39%; ——营业利润为16.05亿美元,较上年同期的23.99亿美元下降33%;营业利润率为6.3%,较上年同期的9.6%下降3.3个百分点; ——调整后的息税、折旧以及摊销前利润(EBITDA)为36.74亿美元,较上年同期的46.53亿美元下降21%;调整后的EBITDA利润率为14.4%,较上年同期的18.7%下降4.3个百分点; ——归属于特斯拉普通股股东的净利润为14.78亿美元,较上年同期的27.03亿美元大跌45%;按非美国通用会计准则(non-GAAP),归属于特斯拉普通股股东的净利润为18.12亿美元,较上年同期的31.48亿美元下降42%; ——归属于特斯拉普通股股东的每股摊薄收益为0.42美元,较上年同期的0.78美元下降46%;按非美国通用会计准则,归属于特斯拉普通股股东的每股摊薄收益为0.52美元,较上年同期的0.91美元下降43%; ——运营活动提供的净现金为36.12亿美元,较上年同期的30.65亿美元增长18%;资本支出为22.70亿美元,较上年同期的20.60亿美元增长10%;自由现金流为13.42亿美元,较上年同期的10.05亿美元增长34%;现金、现金等价物以及投资总额为307.20亿美元,较上年同期的230.75亿美元增长33%。 展望: ——交付量:特斯拉称,公司目前正处于两大增长浪潮之间:第一个浪潮开始于Model 3/Y平台的全球扩张,下一个增长浪潮将由自动驾驶的进步和新产品的推出发起,包括基于下一代汽车平台的车型。2024年,特斯拉的汽车交付量增长率可能明显低于2023年的增长率,因为团队正在得州超级工厂为下一代汽车和其他产品的推出而工作。2024年,储能业务的部署和营收增速应该能超过汽车业务。 ——现金:特斯拉有充足的流动性来资助其产品路线图、长期产能扩张计划以及其他费用;此外,特斯拉将管理好业务,从而在这一不确定时期保持强劲的资产负债表。 ——利润:随着特斯拉继续加大创新以降低制造和运营成本,公司预计,随着时间的推移,其硬件相关利润将伴随着人工智能、软件以及车队相关利润加速增长。 ——产品:包括更便宜车型在内的新款汽车依旧按计划在2025年上半年开始生产,将利用下一代平台的特性以及当前平台的特性,可以使用当前车型的相同生产线生产。 此举可能导致成本降低的幅度不及先前预期,但能够在不确定的时期以更加高效的资本支出方式谨慎提高车辆产量。这将帮助特斯拉充分利用当前预期的最大产能,也就是接近三百万辆车,在不投资新的生产线前实现汽车产量较2023年增长50%以上。 特斯拉专门设计的自动驾驶出租车产品将继续追求一种革命性的“开箱”(Unboxed)制造工艺。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
马斯克:预计特斯拉FSD于2024年年底前在华获批
IT之家 7 月 24 日消息,经过长达半年的讨论和期待,特斯拉 FSD(全自动驾驶系统)进入中国市场的进程似乎即将迎来一个关键阶段。 特斯拉 CEO 埃隆・马斯克在今天举行的财报电话会上提到,将在欧洲和中国申请监管批准以实施监督下的 FSD,预计在今年年底前获得批准。 今年 6 月,上海临港新片区开始推动特斯拉 FSD(全自动驾驶系统)的落地试点,涉及 10 辆特斯拉车辆将在上海开展路测。 虽然特斯拉 FSD 还未在中国市场推送,但早在 Model 3 发售时就已随车销售,国内售价 6.4 万元,而后续可能还会推出订阅制,价格可能在每月 98 美元(IT之家备注:当前约 711 元人民币)左右。 路透社 5 月底也表示特斯拉中国正在准备向有关部门备案其 FSD 功能,以便在今年推送这一功能。特斯拉正努力将 FSD V12 引入中国,上个月已经有特斯拉中国员工的车载系统中出现了相关字样。 特斯拉还考虑向中国其他汽车制造商授权 FSD,FSD 在中国的销售将为特斯拉开辟新的收入来源。由于中国电动汽车制造商的竞争,2024 年一至四月特斯拉在中国的销量下降了 7.6%。 4 月 28 日,中国汽车工业协会、国家计算机网络应急技术处理协调中心发布《关于汽车数据处理 4 项安全要求检测情况的通报(第一批)》,其中提到特斯拉上海超级工厂生产的车型全部符合合规要求,是唯一一家符合合规要求的外资企业。
连续10季度亏损,冻结高管年薪,韩国电池巨头咋变这样了?
所有高管级别的员工年薪全部冻结,并宣布从 7 月 7 日起,公司进入 “ 紧急管理状态 ” 。 全球第四大电池制造商 SK On ,彻底坐不住了。。。 据金融时报消息,它自从 2021 年单独成立公司之后,已经连着10 个季度亏损,这几年几乎就没怎么赚过钱。 而且净债务也是越背越多,相较于去年同一时期,已经从2.9 万亿韩元增长到了 15.6 万亿韩元,足足有五倍多。 在相关新闻一出来后,不少网友都猜测, SK On 是不是要不行了。 SK 集团差友们应该都不陌生,它是韩国三大财阀之一,资源、背景啥的,那都没话说。 而作为他们旗下的子公司,还是一成立就被寄予厚望的 SK On ,却把自己搞成了如今这副模样,说实话世超是挺震惊的,也挺好奇的。 趁着这个契机,我们去翻了翻关于 SK On 的过往资料,发现它能走到今天这个地步,自个儿倒是 “ 功不可没 ” 。 其中最大的一个原因就是它压错注了。在 SK On 刚拆分出来那几年,是新能源车势头正猛的时候,它也因此拿下了 1000 GWh 的订单。 不过彼时的 SK On ,只有几十 GWh 的产能,要满足这些订单量,还远远不够。于是它就做了个在现在看来,不是那么明智的举动:扩大产能,但是在欧美。。。 在当时做出这个选择,其实也不难理解,毕竟前几年欧美对外营造出来的形象,就是贼拉看重新能源车。 美国为了把整个产业链盘活,通过了一条 “ 新能源汽车税收抵免 ” 的法案。惹得 SK On 和福特、现代汽车等达成合作,先后要在那边建 5 个工厂。 另外,拜登政府还推出了《 通胀削减法案 》,让包括 SK On 在内的非中国电池企业,拿到了数十亿美元的补贴,更是为它在欧美扩大产能添了一把火。 据天风证券消息,到目前为止, SK On 给欧洲规划了 92 GWh ,给美国规划了 150 GWh ,而对于占了六成新能源车份额的中国,只给了 77 GWh 的产能。 然而,还没等这些工厂都建成投产呢,美国的新能源市场就萎了。。。 今年第一季度的数据就是一记重棒,在电动车整体市场都有 5% 增长的前提下,美国市场就只有 2.7% 。 更具体一点, SK On 的一大客户通用汽车,在去年还信心十足,预测自个儿的电动车销量,在 2025 年达到 100 万辆。 结果今年第二季度的数据一出来,大伙都傻眼了,电动车才卖出了 2.193 万辆。 合着这需求就只是纸面上激增,实际销量是一点没怎么涨。。。 可能是察觉到市场不会有啥起色,欧美汽车厂商们直接开始集体摆烂,福特、通用汽车和特斯拉等全都暂停了扩大电动汽车产能的计划。 而这盆冷水自然也会浇到电池产业上,像是 SK On 的重要客户福特,在去年 10 月份,就暂停了电动汽车的 500 亿美元的投资,它们计划合资建的第二家电池厂也因此推迟了。 此时的 SK On 就像一个鸡娃没成效的家长,原来的投资现在全变成负债了,这才有了开头 “ 高管停薪自救 ” 的那一幕。。。 当然,除了欧美市场不给力之外, SK On 的技术路线也有不少问题。 目前他们主要的产品是以三元锂电池为主的软包电池,虽说它能量密度贼优秀,但相较于宁德时代、比亚迪都在做的磷酸铁锂电池,它还有一个最大的缺陷,原料的成本太高( 有钴等贵重金属元素 )。 而这在新能源车企都在卷价格的现在,谁更有优势自然也不用多废话了。 像是特斯拉的 Model 3 和 Model Y ,用的就是宁德时代的磷酸铁锂电池,因为电池成本降了,这两款车型也跟着降了好几次价。 连宝马、福特、现代、雷诺等车企也都考虑改用性价比更高的磷酸铁锂电池。 SK On 显然也意识到这个问题了,一边在研发无钴三元锂电池,一边在布局磷酸铁锂电池。不过这也都是后话了,要量产磷酸铁锂电池至少也得两年后,到时性价比更高的固态电池落地了也不是没可能。 反正 SK On 现在的处境就是内忧外患,但如果要就此下定论说 SK On 不行了,估计还早着呢。 而且整个市场不景气,是所有电池企业都会面临的问题。像是宁德时代,今年第一季度的营业收入,也同比下降了 10% ,还有 LG 能源,营收同比下滑了 30% 。 只不过 SK On 因为自己的规划问题,受到的影响可能会更大一些。 但即便这样,它去年电池业务的销售额也有 12.9 万亿韩元,创下了历史最高,再加上之前积压的订单,保守估计也还有 400 万亿韩元。 况且它背后还有强大的 SK 集团给兜底呢。。。 就在前几天, SK 集团官方就宣布,要把 SK On 的母公司 SK Innovation 可能要和它的能源子公司 SK E&S 合并,整一个资产达 5240 亿人民币的公司。 这么做,就是为了让持续亏损的 SK On 继续吸血。。。 而这个血它还能吸多久,能不能帮它挺过这段时期,就看下半年的表现了。 至少 SK On 这边的 Flag 是立下来了,要在今年下半年实现盈亏平衡。 撰文:松鼠 编辑:江江、面线 美编:焕妍 图片、资料来源: 超电实验室,冻结所有高管年薪,韩国电池厂陷入绝境,CEO:已经走投无路 电动车公社,负债822亿!是谁杀死了全球第四大动力电池企业? 电池网,韩系电池三巨头2023年业绩出炉:一公司积压订单超400万亿韩元 Financial Times,Battery maker SK On declares ‘emergency’ as EV sales disappoint
美军公布最新《欺骗》条令 谣言战争扰乱世界和平
  据美国“军事”网站报道,美国海军陆战队上个月公布了新版《欺骗》条令,这也是海军陆战队12年来首次更新了关于如何使用“欺骗”战略的官方条令。   报道称,从2023年开始,美军确定有必要制定连贯的欺骗战略。新版《欺骗》条令中提到,美军的新型欺骗行为包括干扰敌军的雷达、通信系统等电子设备,操控电磁环境,使其失去对战场态势的准确判断;利用电子伪装和欺骗手段,制造虚假的电磁信号,误导敌军的指挥和决策等。   根据这项条令,美军应通过真真假假的信息吹嘘其实力强大,设法打击对手部队和民众的士气,或者诱导对手投降。   近年来,美军在信息领域的欺骗行为不断被揭露出来。报道举例称,在2020年新冠肺炎疫情最严重的时候,五角大楼在菲律宾进行了一场秘密的舆论战,至少300个美军操纵的社交媒体虚假账号诋毁中国生产的疫苗,诱导菲律宾民众对中国疫苗及中国供应的物资产生怀疑,而当时菲律宾是东南亚地区疫苗接种率最低的国家之一。此事曝光后,五角大楼发言人莉萨·劳伦斯没有否认相关报道。   美国欺骗成性 捏造谎言早有前科   事实上,美国在多领域捏造的谎言早已不乏“前科”。   2003年2月,时任美国国务卿鲍威尔在联合国安理会的会议上拿出一个装有白色粉末的试管,声称试管里装的就是伊拉克正在研制化学武器的证据。六周之后,美国便发动了伊拉克战争,造成大量平民伤亡、无数家庭破碎——但后来的事实证明,美方所谓情报是杜撰的。   俄罗斯总统普京谈到这一话题时曾调侃说,当时鲍威尔试管里的可能是洗衣粉。   俄罗斯总统 普京(2014年6月):我们看到,全世界也都曾看到,2003年时任美国国务卿鲍威尔在联合国安理会展示所谓“伊拉克拥有大规模杀伤性武器”的证据,他拿出了装有不明物质的试管,里面搞不好是洗衣粉。   曾担任中情局局长的美国前国务卿蓬佩奥,更是一语中的,自己揭开了美国情报部门的黑幕。   时任美国国务卿 蓬佩奥(2019年4月15日):我们撒谎,我们欺骗,我们偷窃。我们还有一门课程专门来教这些,这才是美国不断探索进取的荣耀。   美国开启谣言战争 搅乱世界和平   那么,美国通过这种“欺骗”的方式想要达成什么目的呢?   总台记者 魏东旭:美国军方开启了一场谣言战争,针对他眼中的战略对手进行肆意的抹黑,利用互联网传递和传播虚假信息,针对其他国家进行这种恶毒的攻击。   总台记者 魏东旭:这个谣言战争落实到美国的对外策略方面,就成了离间计,成了信息战,成了大规模的宣传战,针对其他国家的形象进行肆意的抹黑,可以说是用心险恶,居心不良。那么谣言战争,包括进行欺诈、欺骗,同样也会成为美国对外寻求开战,或者说发起冲突的一些借口。通过谣言战争的方式,美国把这个世界搅得更加的不安宁。   总台记者 魏东旭:现在美国海军陆战队也要完善他的欺骗和欺诈的战术和战法,那么落实在具体的军事行动层面,主要是在亚太的范围内进行一些战术的佯动,进行一些虚假的动作,去配合美国其他的进攻性的作战行动。在兵力的运用层面,也会采取隐真示假的方式欺骗对手,去强化自身的突袭能力和偷袭能力。与此同时,在谣言战争当中,美国军方,尤其是他的网络作战部队,可能也会有一些更多的暗中手段,针对其他国家的一些正常行为,正义行为或者是友善的行为进行肆意的抹黑,这同样也是谣言战争。
1500亿打造的原创影视剧没人看?苹果开始省钱了
苹果流媒体视频服务Apple TV+ 凤凰网科技讯 北京时间7月22日,据彭博社报道,苹果公司投入了逾200亿美元(约合1454亿元人民币)制作原创电视剧和电影,但是却没多少人看。现在,苹果开始调整其好莱坞战略,收缩支出。 根据彭博社对包括苹果前员工、现任员工和商业伙伴在内的十几人的采访,苹果服务部门主管埃迪·库伊(Eddy Cue)一直在与工作室负责人扎克·范安伯格(Zack Van Amburg)、杰米·埃尔利特(Jamie Erlicht)进行定期会面,审查预算,敦促他们对项目支出施加更多控制。据这些人透露,范安伯格和埃尔利特已经告诉他们的一些顶级创意合作伙伴,他们希望改变自身作为行业最大支出者的声誉。 在好莱坞,苹果还不是采购影视剧内容最多的公司,这个头衔仍属于Netflix。但是,苹果在个别影视剧上也是烧钱无数。苹果在马丁·斯科塞斯(Martin Scorsese)、雷德利·斯科特(Ridley Scott)和马修·沃恩(Matthew Vaughn)导演的电影上总共花费了5亿多美元,在第二次世界大战的迷你剧《空战群英》上花费了2.5亿多美元。 然而,这些电影的票房收入都令人失望,只有《花月杀手》在尼尔森最受欢迎的流媒体电影排行榜上名列前茅。尼尔森的数据显示,《空战群英》在美国的观众人数低于Netflix的日剧《忍者之家》。即便如此,《空战群英》也是今年唯一一部出现在尼尔森排行榜上的新苹果影视剧。 苹果每年在原创节目上的花费达到数以十亿计美元,这些节目备受好评,并获得了许多奖项提名。然而,它的流媒体服务在美国的电视观看份额仅为0.2%。Apple TV+一个月的观看量还不及Netflix一天的观看量。 “订阅用户增长乏力,Apple TV+的原创内容和竞争对手相比真是小巫见大巫。”彭博行业研究分析师吉塔·兰甘纳桑(Geetha Ranganathan)和凯文·尼尔(Kevin Near)在最近的一份报告中称。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
微软发言人:与欧盟达成的协议限制了公司加强Windows的安全性
IT之家 7 月 22 日消息,上周安全软件公司 CrowdStrike 的一次更新引发了全球性的 IT 灾难,导致约 850 万台 Windows 电脑蓝屏死机。这一事件造成航空、医疗、零售等多个行业陷入瘫痪,甚至连部分紧急救援电话都无法接通。 IT之家注意到,苹果电脑在这场危机中毫发无损,原因在于苹果公司对安全软件的权限限制更为严格。苹果操作系统本身负责大部分安全监控工作,第三方安全软件只能查看监控结果,无法直接干涉系统核心。 而 Windows 系统则允许安全软件深入操作系统内核进行检测,这也导致了此次大规模故障。CrowdStrike 的更新出现逻辑错误,引发系统崩溃和蓝屏(BSOD)。 据《华尔街日报》报道,对此,微软公司发言人表示由于欧盟的反垄断规定,无法限制安全软件的系统访问权限。微软曾在 2009 年与欧盟达成协议,承诺给予所有安全软件与微软自身软件相同的系统访问权限。这一决定导致安全软件厂商拥有更大的权限,也增加了系统出错的可能性。近期 CrowdStrike 导致 850 万台 Windows 电脑瘫痪的事件便是典型案例。 虽然这一规定确保了公平竞争,但同时也牺牲了系统安全性。与之形成鲜明对比的是,苹果和谷歌并未受到类似限制。苹果在 2020 年停止向开发者提供内核级访问权限,虽然给开发者带来不便,但也提升了系统稳定性。
拼多多上半年出海战绩:GMV约200亿美金,超2023全年
今年9月上线将满两年,拼多多旗下跨境电商Temu还保持着狂飙速度吗? 答案是肯定的。 36氪独家获悉,Temu今年上半年的销售额猛增到约200亿美金,一个对比,2023年Temu的销售额为180亿美金。 置放于更宽阔的“出海四小龙”坐标里,2021年,SHEIN销售额达到200亿美元,彼时距其成立已过去九年;2023年,TikTok电商交易额200亿美元,用了三年时间。 站点开拓上,Temu的步伐相对慢了下来,但在新进入的国家里,Temu延续了迅猛的增长态势,比如巴西上线仅一个多月,就成为本地下载量最高的应用程序,而在过去30天时间里,巴西是Temu应用下载量第二高的市场,超过500万次,仅次于美国。 Temu上演的依然是一个关于中国企业出海疾速航行的故事,但叙事方式正在由”全托管”逐渐转向“半托管”。 36氪了解到,7月上旬,经过不到四个月的投入,Temu在美国的“半托管”销售额占比已经达到20%。 今年3月15日Temu在美国站点上线半托管模式,物流履约不再像全托管那样由平台负责,而是需要商家自己解决。 对于平台而言,从很多角度来看,这都是一种优于全托管的模式。 比如解决了全托管只能做小件物品的丰富度限制,有助于平台做到更大体量;平台无需再承担高昂履约成本,利于减亏。 Temu的发展离不开一个关键要素——美国的“最低限度条款”关税豁免政策,该规则的核心是美国个人消费者只要购买价值800美元或以下的进口商品,就可以免除关税。 无论Temu还是SHEIN,都是这项豁免规则的最大受益者。美国海关数据显示,2023年高达10亿个包裹通过“最低限度条款”进入美国,其中三分之一来自Temu和SHEIN。 随着特朗普重回白宫的确定性愈来愈大,这扇为全托管提供了优势的大门随时可能会关闭。而不走免税路径的半托管,或许是化解隐患的方式。 降低美国市场的比重也是今年Temu的重点,以减少对单一市场的依赖,根据此前The information报道,Temu希望今年将美国的GMV占比从60%降到30%。 根据36氪了解,Temu二季度GMV在120亿美金左右,美国市场占比大概45%左右,计算下来,半托管销售额不到11亿美金。 看起来并不是一个诱人的数字,但从Temu今年的目标出发,年销售额600亿美金,其中,半托管要达到200亿,比重超过30%。以此为参照,20%美国销售额来自半托管的成绩已经是一个很大的变化。 当然,这样的结果集结了平台不遗余力的投入,1000多位半托管买手进行招商,平台自然流量几乎倾斜给半托管商品。100件推荐商产品里,带有local warehouse的半托管商品可以占到85件,哪怕这件商品销量为零,也能和销量数万的全托管商品享受同样的流量分配,甚至更高。 根据一份专家纪要估算,中国在美国做亚马逊、做独立站的商家,以及做线下批发的商家,每年至少有300亿美金以上的清货需求,而Temu半托管可以拿到其中50亿美金的规模。 半托管在美国的初见眉目,对于Temu至关重要。36氪了解到,Temu的计划就是先在美国打样,如果进展顺利的话就将这一模式推广至欧洲以及全球。 实际上,Temu也正在这样做。 7月19日,Temu在深圳召开了一场主题为“欧洲半拖首秀”的招商会,Temu高级副总裁大将出现了在会场,开启了半托管商家在“欧区五国”——英国、德国、法国、意大利、西班牙的入驻。 美国市场的缩减,需要欧洲的增长去平衡,未来,Temu希望欧洲市场份额能达到50%,因此相比其他市场投入也能大,据36氪了解,欧洲市场主要由葡萄负责。 因为半托管需要商家具有海外发货的能力,而在物流和仓储上已经练就一身本领的亚马逊商家是Temu觊觎的主要对象。 由于很多亚马逊大卖只是把Temu当作清库存的渠道,目前Temu的半托管不少都是没有跨境电商经验的商家,他们需要自己找海外仓,发DHL、UPS等小包,履约效率并不高,且经常出现丢件、漏发的状况。 所以过去一个月,Temu也在加速官方合作海外仓的招募,已由原来的7家扩至20多家,包括大方广、万邑通、跨境兴运等。据36氪了解,成为Temu认定合作海外仓,不仅能获取平台免费的流量,而且还可以接入Temu的尾程账号(FedEx、UPS、DHL等快递账号),可以享受到尾程快递折扣。 随着Temu深入亚马逊腹地,后者也开始做出反击,不久前推出了“低价商店”,和Temu全托管类似,商家只需要把货发送到亚马逊在中国的仓库,再统一运送到海外。 除了愈加激烈的正面硬刚,亚马逊这一举动争抢的还有本就供应不足的空运运力,这意味着干线成本也会更高。 据36氪了解,Temu全托管的履约成本一直没有得到有效改善,而运输时间太长的海运进展也比较缓慢。 显然,如何快速将半托管做大做强成了Temu眼下更加急迫的事情。 对于以上数据,拼多多官方予以否认。
奥运史上AI首秀,谷歌Gemini将亮相巴黎,打造AI观赛新体验
巴黎奥运会期间,谷歌将首次携NBCUniversal,利用Gemini让AI技术走进赛场,为观众带来前所未有的观赛体验。 距离巴黎奥运会还有不到一周,四年一度暑期档最精彩的体育竞技厮杀即将开幕。 吃着冰西瓜,吹着空调,看奥运健儿拿金牌,刷社交媒体看乐子的好日子又要来了! 这次巴黎奥运会又出新花样,谷歌的Gemini AI技术也将登上体育赛场。 周四,NBCUniversal和美国奥林匹克与残奥委员会(USOPC)一起宣布,谷歌将把人工智能融入巴黎奥运会转播中,并且将使用AI解说。 同时,谷歌的合作也包括了出战奥运的美国国家队,成为「美国队官方AI赞助商」。 可想而知,奥运会这种面向全世界转播的大型国际赛事,也将成为谷歌AI技术展示的大舞台。 USOPC首席执行官Sarah Hirshland表示,「我们很高兴宣布美国队与谷歌建立合作伙伴关系。这次合作不仅仅是赞助,这是一个强大的联盟,汇集了最好的技术和体育运动。」 「通过与谷歌和NBCUniversal合作,我们确保以最具活力和吸引力的方式讲述运动员的故事。这种伙伴关系将激励数百万人,并积极展示美国队在体育竞技世界舞台上的风采。」 谷歌与NBCUniversal的合作,将通过转播内容的无缝集成,将巴黎奥运会的比赛和运动员的故事一起带入媒体。 这个过程将利用谷歌的一系列应用程序产品,包括搜索、地图和 Gemini,以及各个方面的AI新技术。 和谷歌的合作也是NBCUniversal自身战略的一部分,他们正在对自己的奥运转播和报道进行现代化改造,来吸引不观看电视直播的年轻观众。 NBCUniversal总裁Dan Lovinger表示,「我们非常高兴能够与谷歌合作,提供创新且高度吸引人的科技元素,从而优化对巴黎奥运会的报道,让每位观众感觉仿佛身临其境。」 「这种独一无二的合作伙伴关系,展示了将创新技术与优质内容结合,吸引所有年龄段粉丝的观看。」 个性定制赛事回顾 NBC在6月就预告,将推出由AI生成的个性化的每日赛事回顾,由体育评论员Al Michaels的「AI版本」进行叙述。 观众只要在Peacock应用程序中设置「您的每日奥运回顾」,提供姓名并选择最多三种感兴趣的运动类型(例如,兵乓球比赛和进球时刻精彩集锦)。 然后,每天早上,用户都会收到由Al Michaels亲切声音播报的每日看点。 为了防止人工智能播报出错,NBC表示,编辑团队将审查所有内容,包括音频和剪辑,以确保质量和准确性,然后再向用户提供音频。 个性化回顾将于7月28日开始,第一版回顾将首先为观众介绍开幕式的亮点。 谷歌搜索解释赛事 NBCUniversal创建了「解释奥运会」板块,它将展示如何用AI进行谷歌搜索。 在NBCU的日间和黄金时段报道期间,NBC奥运会播音员将演示如何快速搜索快照和链接,帮助观众通过搜索来解答自己对比赛内容的疑问。 谷歌搜索还能让观众快速了解喜爱的运动,搜集到关于他们的更多信息。 例如,泳道分配的重要性、奥运会篮球的不同规则,或获取有关残奥会田径运动员的信息。 「解释奥运会」将扩展到NBCUniversal的社交媒体账户,进一步扩大其影响力,帮助体育迷快速获取信息,并提供社交讨论的平台。 与Gemini趣味互动 喜剧演员Leslie Jones也将惊喜助阵巴黎奥运会,使用谷歌的Gemini AI模型来学习新的体育项目。 作为喜剧演员,Leslie Jones凭借其独特的幽默感和敏锐的观察力,曾经赢得了无数观众的喜爱。 这次以新身份——NBC「首席超级球迷评论员」亮相,Leslie Jones将充分利用Gemini,带领观众对巴黎奥运会和美国队的赛事日常进行独家探秘。 在比赛间隙,她会与Gemini AI进行有趣的互动对话,让观众在轻松愉快的氛围中了解更多关于奥运会的幕后故事和趣闻轶事。 「嘿,Gemini AI,你觉得这位跳远选手能跳出多远?」 「根据我的数据分析,我打赌他有可能打破世界纪录哦!」Gemini AI的回答既有大数据支持的专业,又有互动的生动幽默,大大丰富了奥运会观赛体验。 沉浸式巴黎一日游 巴黎是今年奥运会和残奥会的举办地,埃菲尔铁塔和罗兰加洛斯球场等地标建筑也都是这次赛事的举办场地。 五位奥运会和残奥会选手将在社交视频和宣传片中亮相,他们将使用谷歌 Lens、Circle to Search、谷歌地图等应用,利用沉浸式视图和Gemini,根据个人兴趣探索场地,欣赏巴黎风光。 线上用户们也可以跟随他们,一同「云游览」巴黎地标建筑,感受古老巴黎与新兴科技碰撞的魅力。 3D广播身临其境 谷歌地图的3D实景可提供世界各地位置的3D视图,这个功能也将在奥运转播期间得到全方位展示。 观众将看到巴黎标志性奥运场馆,如凡尔赛宫、罗兰·加洛斯球场和水上运动中心,能够以3D 方式身临其境。 此外,还可以直接在地图中了解到每个地点的活动花絮,给观众带来「模拟城市」巴黎版的新奇体验。
一个奇怪的现象出现了:骂小米的越多,小米卖的越好
近日,各大机构发布了全球市场、中国市场,以及印度市场的智能的手机数据。 不得不说,小米又是大赢家,先看全球手机数据,小米虽然排第三,没有超过苹果,但和苹果的距离又近了,只差1%的份额,销量差额是290万台。 同时小米是前5大厂商中,增长率最高的,达到了27.4%,远比三星、苹果增长率高,按照这种速度,说不定下个季度就全球第二名了。 再看中国市场数据,小米已经是国内第二名,增长率高达19.65%,也是前5大厂商中,增长率第二名的,华为是第一,增长率高达42.53%,但华为因为去年销量低,基数低。 很明显,小米在中国市场二季度表现也是非常给力的,堪称大赢家,要知道一季度小米才排国内第6名。 最后看看印度市场数据,二季度的时候,小米已经成为了第一名,增长主旨24%,也是前五大厂商中增长率最高的。 而去年同期,小米还是印度第在殒呢,这次直接成为第一名,又是大赢家。 但是虽然小米手机这一季度是大赢家,但其实如果大家关注网络,会发现这一季度,吐槽小米的可是不少,各种吐槽声不绝于耳。 所以这真的是一个奇怪的现象,那就是骂小米的越多,似乎小米卖的越好。 不仅是手机如此,小米汽车也是如此,自从小米发布SU7以来,骂小米SU7的声音也非常多,各种抹黑、吐槽,感觉买小米SU7就是蠢,就是不懂车。 但是呢?小米43天交付超过1万,72天交付量超2万,然后6月份的月交付量已经超过了1万辆,全年交付量能超过10万,冲刺12万。 这些纪录都是前无古人的,目前如果你订购小米SU7,最快也要半年之后才能交车,慢的要8-10个月,这种热度,估计从来没有一款车能够达到吧。 所以说,骂小米汽车的越多,似乎小米汽车也是卖的越好。 为何会这样呢?其实我们可以反过来看,那就是小米卖的越好,骂的越多。 因为小米影响到太多厂商的利益了,小米主打性价比,向高溢价开炮,导致友商们不得不降价应对,影响到大家的营收、利润了。 于是很多人吐槽、抹黑,希望能够影响到小米的销量,不遗余力的打压小米,但事实证明,只要产品真的好,消费者就一定会买单,抹黑、吐槽是没有用的。
完美世界总裁下场内部创业,新公司坐标杭州,瞄准小游戏
作者 | 董子博 编辑 | 林觉民 雷峰网独家获悉,完美世界集团总裁佟庆,在前段时间赴杭州内部创业,开办了一家发行公司,瞄准的正是当下炙手可热的小游戏品类,还带走了不少本部的技术中台。 2024年,完美世界正逢多事之秋——裁员2000人,《一拳超人:世界》等项目关停,营收下降态势明显,股价自年初下跌36%。 当下的游戏圈,APP 端游戏开发成本正被越卷越高。2年前,公认的游戏项目开发成本门槛,就已经达到了1500万-2000万;而到了今天,不少游戏圈的创业者对雷峰网表示,这个数字则达到了3000-4000万。 而开发一款小游戏,即使加上市场费用,100万已经算是行业内成本的高点。而在《寻道大千》、《羊了个羊》、《这城有良田》、《指尖无双》等出众项目的带动下,不少公司看到了在这个赛道,赚到真金白银的希望。 而以微信、抖音、快手为代表的社交平台,也正在争夺这块仍然充满机遇的蓝海市场。在这周微信小游戏开发者大会上,腾讯给到小游戏的支持和激励不可谓不多。 其中最令人震惊的,是微信把混合变现小游戏内购的周转账期压缩到了“T+1”,广告收入的小游戏可以预支未来三个月的广告金,摆明了要和游戏渠道商争个高下。 当下,APP 游戏显然已是一片红海,头部效应极为明显,完美世界作为老牌大厂,规模效应和开发实力已经并没有明显优势。 而佟庆作为完美世界的集团总裁,有过《天龙八部 3D》、《诛仙》手游等项目经验,亲自下场,更是有带头转型冲锋的意味在其中。 都知道完美要过“苦日子”,但“埋头吃苦,不问前程”却并不能给他们带来生路。 当下,在游戏行业卷到极致高压的今天,转型或许是每家公司所面临的必然未来。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。