EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
OpenAI员工自曝作息时间:背公司章程,向优化之神祈祷;他们也搞996?
OpenAI这几天的热度居高不下。 继Sora震惊整个科技圈后,OpenAI的工作强度也引发大量关注。 今天凌晨,OpenAI的研究人员Jason Wei自曝每日作息时间,不少网友感叹,原来不只国内卷,OpenAI也搞“996”。 那OpenAI的“996”是怎样的?跟国内有何不同? 从起床到睡觉横跨16个小时 除了吃饭、通勤、睡觉,都在说工作 网友:平均月入8万刀就问你们卷不卷 我们先来看下Jason Wei的作息时间: [9:00am] 起床; [9:30am] 搭乘Waymo前往Mission SF,途中在Tartine买个牛油果吐司; [9:45am] 背诵OpenAI章程,向优化之神祈祷,学习《The Bitter Lession》; [10:00am] 在Google Meet上开会,讨论如何在更多数据上训练更大的模型; [11:00am] 敲代码,在更多数据上训练更大的模型; [12:00pm] 去食堂吃午饭(素食,无麸质); [1:00pm] 真正开始在大量数据上训练大模型; [2:00pm] 调试基础设施问题; [3:00pm] 监控模型训练进度,顺便玩一下Sora; [4:00pm] 对前面提到的训练的模型进行提示工程; [4:30pm] 短暂休息,坐在牛油果椅子上,思考Gemini Ultra的性能到底有多强; [5:00pm] 头脑风暴,思考改进模型的潜在算法; [5:05pm] 得出结论:修改算法风险太高,只扩展计算和数据更安全; [6:00pm] 吃完饭; [7:00pm] 通勤回家; [8:00pm] 喝一杯酒,继续写代码,鲍尔默峰即将到来; [9:00pm] 分析实验结果; [10:00pm] 启动实验,让其运行一晚上,第二天查看结果; [1:00am] 实验真正开始运行; [1:15am] 上床睡觉;在纳德拉和黄仁勋的守护下入梦。压缩才是关键。晚安 单从时间来看,Jason Wei从起床到睡觉,横跨了16个小时多,除了吃饭、通勤、睡觉,都在说工作,称其“卷”并不过分。 不过,有很多网友认为此“卷”非彼“卷”。 “平均月入8万刀就问你们卷不卷吧” “被迫内卷表演式加班和发自内心做事是天差地别” “可是openai招聘开发人员的工资是80万美刀一年” “仔细看了之后发现他一天只工作了6个小时” “9点才起床,还有路上的时间,我们的996是纯工时” 那Jason Wei的工作时间到底有多少,他的薪酬如何? 至少7小时50分在工作 年薪或达数十万美元 从Jason Wei公布的内容来看,他上午正式开始工作时9:45,一直到中午12:00,一共2小时15分。 下午从1:00开始,工作到4:30,休息半小时后开始5分钟的头脑风暴,并得出结论,一共3小时35分钟。6点开始吃晚饭,5:05-6:00中间的55分钟是否在工作未知。 晚上8:00喝一杯开始工作,到10:00启动实验,共两个小时,凌晨1:00实验真正开始运行,晚上10:00-凌晨1:00这三个小时Jason Wei是否仍在工作也未知。 如此看来,可以确定的是至少有7小时50分是在工作,有3小时55分不清楚是否在工作。 而薪酬方面,Jason Wei应该也是拿很高薪资的。 去年11月,美国科技公司数据收集网站发布的报告显示,OpenAI软件工程师的中位数年薪高达92.5万美元(约合673.4万元人民币)。 据悉,这是OpenAI的五级软件工程师获得的工资,包括30万美元的基本工资和62.5万美元的股票补偿,五级软件工程师大约有10年的工作经验。 报告提到的最低工资是一名有两到四年工作经验的工程师,年薪为21万美元,这个数字不包括股票补偿。 此外,还有消息称,OpenAI的一些高级软件工程师每年的收入高达140万美元。 12月,又有一张美国科技大厂的薪酬表流出,其中,OpenAI位居榜首。 数据来源:Rora Research(薪酬谈判公司) 从图中可以看出,OpenAI的为员工提供的年薪高达86.6万美元,底薪为66.5万美元,薪资增幅可达30%。 虽然无法确认哪个数据更准确,但至少能反映出OpenAI的薪酬绝对不低。 而Jason Wei在加入OpenAI之前,曾在谷歌任职,他还是思维链概念开山之作 ——「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」的第一作者。 Jason Wei在回答网友问题是曾表示,他从2017年开始就一直在从事AI领域的工作。 Jason Wei称,他在大一的时候(2017年)通过其母亲的朋友结识了一家AI创业公司,然后和这家公司展开了合作。 后来,他获得了Google AI Residency项目的邀请,为期18个月。这个AI项目可能是他职业生涯迄今为止最大的跳板。 在2020年毕业后,他在谷歌工作了两年多,从事大型语言模型研究。 从Jason Wei的履历来看,他大概率不会是拿最低工资的工程师。 多方称OpenAI高强度工作 事实上,有关OpenAI的高强度工作,早已被多次提及。 此前,OpenAI前员工、Codex团队成员Lenny Bogdonoff的离职声明中提到,从入职起,他每周在办公室工作6天,每天的工作时间从早上8点一直持续到深夜。 Sora推出以后,有自媒体发文称,Sora发明者之一是毕业于上海交大的天才少年谢赛宁。谢赛宁本人在朋友圈辟谣时表示,Sora跟他一点关系都没有,Sora是bill他们在openai的呕心之作,bill称他们每天基本不睡觉高强度工作了一年。 据OpenAI发布的Sora技术报告显示,Sora团队仅13人,TimBrooks、Bill Peebles以及ConnorHolmes等是核心成员。 国内“996”现状: 有网友吐槽加班 有公司告别内卷 “996”这一概念是在国内火起来的,指的是早上9点上班、晚上9点下班,中午和傍晚休息1小时(或不到),总计工作10小时以上,并且一周工作6天的工作制度。 这一制度,反映了中国“互联网”企业盛行的加班文化。 2019年4月11日,人民日报针对“996工作制”发表评论员文章《强制加班不应成为企业文化》。 2021年3月,有媒体表示,现行《中华人民共和国劳动法》明确规定,劳动者每日的工作时间不能超过8小时,平均每周的工作时间不能超过44小时。不管是996,还是007,都是违法行为。 8月,最高人民法院与人力资源和社会保障部联合发布了超时加班典型案例,明确规定996工作制严重违反法律关于延长工作时间上限的规定,应认定为无效。 不过,这并没能阻止“内卷”的继续,在很多公司里“996”、“007”等加班文化依旧盛行。 时至今日,仍有很多网友会时不时在社交平台吐槽下加班。 但是,近年来也有公司开始告别内卷。 比如,自2023年1月1日起,乐视宣布将实施每周四天半工作制。每周三实行弹性的半天工作制,考勤时间调整为连续5小时。 4月14日,在乐迷节分享会上,乐视品牌负责人谈及此事表示,体感非常好,有了更多时间照顾家庭。 去年5月31日,网红考研导师张雪峰宣布其公司峰学蔚来施行上四休三,引发网友热议。 6月2日,张雪峰又在微博发文表示,这只是其中一部分福利,他们公司还有寒暑假。 其实,高强度的工作是不是“卷”,因人而异。 很多大佬至今仍每天坚持高强度的工作,对他们而言,他们的出发点是要做成什么事,工作了多长时间不重要。 而对大多数的“打工人”而言,他们更关心的是加班能带来多少薪酬上的回报。如果没有好的回报,可能他们的加班效率也不高。 如果报酬足够丰厚,相信有大量的“打工人”会抢着要加班。
大佬的2023|余承东得意
过去一年,没有人比余承东更得意。 当然,也没有人比手持Mate 60,握着问界M9方向盘的他更有资本去得意。 自从余大嘴把遥遥领先喊成个人符号,关于这位华为话事人的争议就像华为黑科技一样不断冒出:有人说他吹牛、装X,说他表演型人格;也有人翻着余承东的履历,感叹他真是华为手机业务和汽车业务的功臣。 若是能让这样一个习惯招摇、习惯激进、习惯成为赢家的人略显低沉,那绝对是遇到了什么从未有过的极端困境。比如掘地三尺也挖不出来一块芯片之类的。 四年前9月10日的开发者大会,距离华为高端芯片完全断供仅剩五天时间,时任公司消费者业务CEO余承东站在台上,面前是上百位开发者。背后屏幕打出一行字:每一位开发者,都是华为要汇聚的星星之火。 星星之火,可以燎原。余承东说,没有人能够熄灭满天星光。 但喊话归喊话,再顶尖的设计没有供应链也做不出来。 此后几年业绩倾颓,外界听见余承东说“遥遥领先”的次数越来越少:2021年P50手机发布,余承东说出“我们的5G芯片只能当4G用”之时,从无奈中挤出了一点笑容;Mate50发布推迟到2022年,介绍芯片时用英文一笔带过,余承东只说它们性能“依然不错,挺好”。 围观者指着余大嘴笑:你不爱吹牛X么,这回彻底栽了。 后来央视有段采访,主持人提到很多人说Mate50肯定失败、铁定失败,很容易动摇,余承东没有否认:“我内心痛苦的时候,一个人夜里在外面走,走到天快亮就回来,到公司上班去了。” 2023年,天亮了。 轻舟已过万重山 自Mate50发布会结尾说出那句“跨越山海,终见曙光”之后,余承东在手机圈子的发言大多集中在鸿蒙系统相关生态,不再过多提及硬件,高呼领先。 5G是个坎,没说话的时候,余承东一直在研究怎么迈过这个坎。 去年6月的上海世界移动通信大会,华为高层演讲时引用了《时间之书》中的一句话:“做三四月的事,八九月自有答案”。 或许只是演讲,或许真是预告,华为5G回归的消息随即在市场传开。至于芯片参数制程,新机何时发布,猜来猜去的结果是众说纷纭。 8月4日下午的鸿蒙4.0发布会,华为先带来了数据层面的好消息:二季度华为在中国高端市场份额第二,增幅高达76.1%。余承东并未回应有关5G手机的猜测,只是说鸿蒙生态经历了艰难的四年,但轻舟已过万重山。 华为旗舰手机,正在回归的路上。 余承东确实留了一手,避开所有人的预判:新手机何时发布?不发了,直接卖吧: 25天之后,8月29日中午12点,《致华为用户的一封信》空降华为终端官微:我们推出了HUAWEI Mate 60 Pro先锋计划,Mate 60 Pro直接上架华为官方商城销售。 万人空巷的抢购之后,网友翻出了余承东当年说过的那句“能打败华为Mate的只有华为Mate”,翻看回复,清一色的“遥遥领先”。 遥遥领先、继续领先、领先一代以上。 围观者傻眼了:余大嘴确实爱吹牛,但要命的是他不仅总能吹,还总能兑现。 等到正式的秋季新品发布会,在余承东开始演讲之前,台下遥遥领先的呼喊已然此起彼伏。据粗略计数,余承东当天个人只说了五次遥遥领先,还有二十多次其他各种领先。 除了与刘德华共同发布超高端品牌“非凡大师”系列产品时出现了Mate 60 RS手机之外,关于这款5G“争气机”的详细介绍和麒麟9000s芯片,余承东一反常态,只字未提。 有人说余承东变了,开始收敛锋芒了,但谈起自家的新平板、手表、智慧屏、智能眼镜时,余大嘴还是一副领先一切的架势。友商?一个能打的都没有。更合理的解释,是保密且自信: “他们明明就在搞5G,镜头却只对着摇曳的灯影。” 有些话是在不言中,但从“鸿蒙生态走过了艰难的四年”到“感谢广大消费者对我们的支持和厚爱”,身为公司主要话事人的余承东自然深知其中不易,转机难得。 Mate60系列的热潮一并拉升了华为P系列以及折叠屏产品线的销量。2023年第四季度,华为手机业务市场份额为13.9%,相比2022年第四季度的10.3%同比增长36.2%,成为中国手机市场前五厂商中唯一正增长的厂商。这也是华为时隔多年首次重返市场前五。 旗舰机、折叠屏、平板电脑、手表耳机等产品接连推陈出新,华为收复失地的进程从2023年正式开始。 图片来自网络 那个习惯将遥遥领先挂在嘴边的余承东,果然回来了。 重启的车轮 华为手机业务重回正轨,让余承东有精力抽出手来,捞起自己的另一个身份——那个身为智能汽车解决方案BU 董事长的余承东。 比起5G芯片单方面受到的外部承压,“不造车”的华为在造车方面出现的问题多少显得有些“自扰”。 至少,在上半年接到那封《关于华为不造车的决议》内部信的一刻,余承东内心想必是五味杂陈。 2023年伊始,问界并未能够延续前一年单月过万的月销量,从2022年12月的单月10134台暴跌至单月4475台。而后大半年时间里,问界月销先是跌至三千,然后慢慢爬升到5000、6000,却再未能重现此前月销过万的盛况。 余承东当然想救问界,他给出的解决办法是在宣发中是将问界和华为绑定,靠华为的品牌力拉拢市场,甚至在部分海报中已经出现了“HUAWEI 问界”的字样。 无奈任正非亲自下场,以内部信的形式重申华为不造车是死命令,余大嘴也只得作罢。 如何在不带华为标的前提下,让华为二字渗透潜在车主的心智?解法,还是用“华为”。 Mate 60系列争气机的平地惊雷,让2023下半年的消费者对余承东和华为两个IP的认可程度空前高涨,以至于和二者有关的一切都自然划归“遥遥领先”级别。所以,那场华为秋季新品发布会,余承东给问界品牌,特别是新款M7留了不少时间。 对,就是那个曾经把理想“打残了”的车型——它更新换代了,还跟着Mate 60的热度先后发布了。 上市仅25之后,M7收获了超过50000台大定客户。余承东在朋友圈庆祝之余写下一行感慨: 起死回生,真不容易。 但国内新能源车本就是红海一片,余承东开着问界在圈内狂飙,友商的利益被冲撞就不可避免。 第一个翻车的,是小鹏。 彼时,余承东正借着华为黑科技的春风大秀问界智驾系统,何小鹏突然在朋友圈阴阳了一句“友商讲AEB,我认为99%都是假的……根本不能开,路上误刹车的情况太多了”,直接撞在余承东的枪口。 一句“连AEB是什么,居然有车企的一把手还根本没有搞懂”就差指名道姓,“要么让手下忽悠了,要么是对汽车行业的发展缺乏最基本的认知”把问题上升到质疑对方是否真的懂车,余承东显然不打算给何小鹏留什么没必要的面子。 第三方机构的测试进一步帮余承东撑腰:在包含问界M5、小鹏G6、阿维塔11等几款车型,的30km/h—80km/h AEB测试中,问界M5在业界通过了30—80km/h各个速度的AEB测试,小鹏G6则在30km/h时速下AEB都没能发挥作用,直接撞上测试假车。 就像是何小鹏自己撞上余承东那样,突然且完败。 若不是前者随即上门求和,还配文称“和老余一起讨论了一下技术路线,感谢老余的建议和大度”,估计余承东的炮火还会一波接着一波。 逆风局都能翻盘,何况2023年这般属于华为、属于余承东的顺风。 大年初三,余大嘴切换到了余疯子的账号,换个角度鼓吹自家的智能驾驶:2月12日,余承东在朋友圈分享自己驾驶问界 M9 回深圳的经历,表示路程全程 1314 公里,靠智能驾驶已经开了 400 公里,中途却因为方向盘长时间离手而被系统处罚禁用。 法规好烦啊,想取消,余承东是这么说的。 手机业务起死回生,汽车业务回到正轨,过去一年的余承东,赢了,也飘了。对于他本人和手中经管的业务来说,无疑像是一次走过绝境的涅槃,好在余承东不认命,华为也不认输。 因为不易,所以难得。
诺基亚宣布与英伟达合作,以Cloud RAN和AI实现移动网络变革
IT之家 2 月 21 日消息,诺基亚今天宣布与 NVIDIA 合作,旨在利用 NVIDIA 提供支持的 Cloud RAN 和 AI 技术彻底改变移动网络的未来,进一步增强了诺基亚的 anyRAN 解决方案。 据介绍,诺基亚将与 NVIDIA 合作开发 Cloud RAN 解决方案,该解决方案将利用 NVIDIA Grace CPU 超级芯片进行 Layer 2+ 处理,还将采用诺基亚 In-Line Layer 1 (L1) 加速器技术和云 RAN 软件。IT之家注意到,诺基亚还将使用英伟达 GPU 用于 AI 应用和 vRAN 加速,希望为 AI-RAN 铺平道路。 去年年底,诺基亚宣布与 Arm 和 HPE 在位于得克萨斯州达拉斯的诺基亚开放云 RAN 创新中心完成了云 RAN 的在线加速联合实验室试验。此次试验成功完成了端到端 Cloud RAN L3 数据呼叫,展示了诺基亚云 RAN 解决方案的灵活性,该解决方案使用 In-Line 加速器架构,可以在多个硅架构上无缝工作。这进一步证明了诺基亚 anyRAN 方案的可行性,该方法确保了 Cloud RAN 与专用 RAN 的功能性能一致性,同时为运营商构建 Cloud RAN 网络提供了更多选择。 诺基亚介绍称,anyRAN 旨在帮助移动运营商和企业扩展其构建和发展 RAN 的选项。除了诺基亚的 AirScale 基站和诺基亚 AirFrame 服务器之外,该方案还可以在任何合作伙伴的云和服务器基础设施上运行,允许混合使用专门构建的、混合的和完全基于云的 RAN 解决方案,从而降低了部署的复杂性,从而在云基础设施层和数据中心(服务器)硬件层实现深度多层级的解耦。
孙正义千亿美元豪赌!AI芯片被Sora彻底引爆了?
不知不觉间,距离ARM登陆纳斯达克,已经过去5个月了。 作为半导体行业史上最大规模IPO,虽然ARM上市后股价略有起伏,整体走势还是令人满意。截至发稿时,ARM股价徘徊在121美元左右,总市值达1252亿美元。赌赢ARM这一场硬仗的软银,赚得盆满钵满,很大程度弥补了在WeWork与中概股上的亏空。 现在满血复活的软银打算再战半导体,并将枪口对准时下最热的AI芯片产业。 据彭博社报道,孙正义正计划筹集1000亿美元投资AI芯片企业。据悉,这个新项目命名为“Izanagi”,灵感来自日本传统文化中的创造与生命之神“伊扎纳吉”,其英文译名中则包含“AGI”这个关键词,醉翁之意不言而喻。 回顾孙正义和软银的投资历史,追风口向来是重要策略之一。有ARM珠玉在前,软银对半导体产业的信心也更足了一些。 不过AI芯片这个风口,实在是太热了。在软银入局之前,传统的半导体巨头,互联网大厂,以及初创企业几股势力早已杀红了眼。野心勃勃的孙正义旨在挑战英伟达的老大宝座,但这段历程注定将充满坎坷。 (图片来自UNsplash) 满血复活,软银再续芯片梦 “Izanagi”项目刚刚曝光,软银并未作出官方回应,外界对该项目的了解也相当有限。从仅有的消息来看,投资规模、投资方式和专注AI芯片领域这几点是可以确定的。 据悉,网传的1000亿美元并非全部由孙正义自掏腰包,软银直接出资约300亿美元,其余部分将由其他投资机构承担。目前尚不清楚软银会拉拢哪些资本大鳄参与该项目,但有消息称来自中东的资本最有可能下场。 该消息也并非空穴来风,皆因软银和中东资本向来合作无间,过往有过不少成功的投资案例。比如大家都非常熟悉的软银愿景基金,背后就有沙特、阿布扎比两大主权财富基金的鼎力支持。 当然,双方的合作过程中也不乏惨痛教训。在2022财年,愿景基金亏掉了大约320亿美元,其主要出资方沙特公共投资基金的综合亏损也高达156亿美元,甚至迫使孙正义亲自出面道歉。好消息是,中东资本正着力推动全球化投资策略,对科技行业充满野心,即便过往有过不少失败案例也未曾动摇。 除了中东老铁的支持,软银自身业绩的反弹也坚定了孙正义再战半导体产业的决心。 最新财报显示,软银2023财年第三财季(自然年2023年四季度)实现净利润64亿美元,接近市场预期的两倍,也是2022年三季度以来首次扭亏为盈。其中,愿景基金一期(SVF1)单季投资收益53亿美元,光是转让部分ARM股权就获得了55亿美元收益。 (图片来自软银财报) 早在去年二季度,SVF1就率先一步实现盈利,是软银最可靠的支柱。该基金的后续走势被广泛看好,则和其持仓组合有直接联系。财报显示,四季度SVF1持仓标的的公允价值环比上涨了4.2%。在其投资组合中,字节跳动、滴滴等互联网企业的表现固然令人欣喜,但估值上涨的首功之臣还是非ARM莫属。 ARM此前发布的财报显示,去年四季度营收、经调整运营利润分别录得8.24亿和3.38亿美元,均远超市场预期(预期为7.6亿和2.7亿美元),带动其股价在三个交易日内暴涨近90%。与此同时,软银的股价也在2月13日创下2021年5月以来的最高水平。 孙正义对ARM的重视程度毋庸置疑,毕竟这是软银在半导体行业的代表作。豪赌ARM成功,给孙正义带来了足够的信心,此次挑战AI芯片,想必也会全力以赴。 按照以往惯例,软银大概率会在全球范围内寻找有潜力的芯片企业,谨慎分配这1000亿美元赌注。不过目前外界尚未清楚资金将如何分配,也还没有潜在猎物浮出水面,这项高达千亿美元的投资大计仍有诸多细节需要厘清。 但可以肯定的是,软银这次是有备而来,且弹药充足。本就十分拥挤的AI芯片产业,将迎来更激烈的混战。 群雄逐鹿AI芯,群狼环伺英伟达 软银什么时候正式出手还不好说,AI芯片赛道里反正是杀红了眼,主要三个派系:1、传统半导体巨头;2、互联网科技大厂;3、各路初创企业在资本与巨头支持下蠢蠢欲动。 广义上的AI芯片,可以划分为GPU、FPGA和ASIC三种,其中又以GPU应用范围最广、性能最强,也有着最高的市场需求。IDC的统计则显示,英伟达在AI芯片行业的统治地位十分稳固,和AMD几乎瓜分了全球独显GPU市场的所有份额,占有率超过80%。 AMD、英特尔为首的半导体巨头,一直在努力提高算力,试图缩短和英伟达之间的差距。这当中,又以AMD最有希望突围而出。 AMD的最新代表作,是去年12月底在加州Advancing AI大会上发布的Instinct MI300X和MI300A两款芯片,前者是专为生成式AI打造的数据中心GPU,对标英伟达H100,后者则是为超算场景设计的升级版APU。据悉,MI300X的晶体管数量达到1530亿,较英伟达H100的800亿有明显优势,内存容量也超过了后者。 然而,英伟达的优势仍是全方位的。先不说H100的FLOPS(每秒浮点运算次数)不输任何同类竞品,光是英伟达的配套设施也足够秒杀一众同行。而且MI300X没有内置Transformer加速引擎,训练大模型的时间预计也会比H100更长,并不符合经济效益。 而对于互联网科技大厂来说,情况更复杂一些:它们一方面离不开英伟达的供应,另一方面又在努力挣脱束缚,发力自研。 作为硅谷的“囤货王”,Meta一边提前采购了大量H100,一边早早开始了自研之路。 2月上旬,Meta官方发言人透露其第二代自研AI芯片Artemis将在今年内正式投产,预计首先应用于数据中心。不过Meta自研芯片的产能、算力短时间内还无法跟上需求,未来一段时间会和英伟达的GPU搭配使用。扎克伯格则透露,会在今年年底前部署35万颗H100 GPU,总应用GPU数量届时将超过60万颗。 微软和谷歌这对老冤家,同样是你追我赶。 谷歌同样在去年12月发布了自研芯片TPU v5p,FLOPS和高带宽内存比上一代产品分别提升了2倍和3倍,训练大模型的速度则提高了2.8倍。绕开GPU这个兵家必争之地将重心放在TPU身上,是谷歌坚持近十年的长期战略,如今也看到了收获的曙光。除此之外,谷歌在CPU、VCU等领域也有广泛涉猎,后者对于视频处理大有帮助,在Sora爆火的当下,具有更高的战略意义。 微软更自信,去年11月当着黄仁勋面发布了用于云端训练及推理的AI专用芯片Azure Maia 100,优先应用于Azure云服务领域。微软CEO纳德拉透露,搭载该芯片的部分产品将在今年陆续上市,并声称这是“所有云计算供应商中速度最快的CPU”。 软银来得晚一些,好在弹药充足。如果真能如期筹集到1000亿美元资金,孙正义加入AI芯片大乱战还是有机会成为Tier1玩家的。 跑在前面的英伟达,努力跑得更快 想追上英伟达,软银、谷歌、微软、OpenAI、Meta、Intel、AMD等AI芯片跟随者还要付出更多心血。 就在孙正义筹集弹药的同时,英伟达黄仁勋也在酝酿反击。 一方面,是努力提高产能,满足客户需求。 据瑞银分析师透露,英伟达近期将AI GPU交付周期从此前的8-11个月大幅缩短至3-4个月。机构分析称,此举或是英伟达产能提升,能够在更短的时间内处理挤压订单,又或者正规划新的产能方案,以应对未来更高的供货需求。 但无论出于哪个原因,都能证明英伟达的产能潜力超过市场预期。H100的需求是不用怀疑的,产能上来了,英伟达就能吃下更多市场份额。瑞银也在研报中将英伟达的目标价上调至850美元,充分表明资本市场对其前景的信赖。 另一方面,则是扩大势力范围,向AI芯片产业链上下游延伸。 2月初,有消息称英伟达将入局数据中心定制芯片赛道,并在内部成立了专门的团队。除此之外,英伟达过去一段时间还有不少重要操作:推出AI聊天机器人“Chat With RTX”, 在CES上推出三款新芯片发力AI PC业务,接连投资Runway、Cohere等AI企业,涉及的细分领域包括AI视频生成、云计算、基础大模型等。 扩展势力版图后,英伟达可以发挥上下游协同优势,让客户更依赖自己的产品和配套设施。受限于技术壁垒,互联网大厂是很难无法模仿这种做法的,大概率还要被英伟达精准拿捏。 挑战英伟达,是业内共同选择。想赢很难,也是共识。然而,2024年AGI引爆了AI算力需求,AI芯片的蛋糕正在巨量膨胀,即便不能赶上英伟达,AI芯片也有机会分到一杯羹。 Sora踢开AGI大门,AI芯片需求正爆炸式增长 进入到2024年后,AI大模型的热度没有丝毫下滑迹象,反倒愈发火热。OpenAI发布了文生视频工具Sora,尽管这并非行业首创,但作为AGI的“开宗立派”者的旗舰产品,Sora依然震撼了科技产业。除了引爆科技圈热议外,媒体、文娱等等相关产业均对Sora高度关注,更有消息称“开工第一天,所有VC都在开会讨论Sora”。 在Sora问世之后,马斯克急得像热锅上的蚂蚁,只因Sora是当下最接近AGI概念的产品,而AGI又是马斯克心心念念的蓝海市场。 AGI,即Artificial General Intelligence,又称人工通用智能,是指能够完全模仿人类情感、行为,实现自我学习、自我改进、自我修正的智能计算机系统。尽管Sora当前只展示了其在视频,又或是内容创作上的能力,但其对于真实世界的理解,已经展现出强悍的实力。 为什么三六零周鸿祎说Sora让AGI时代到来的时间从十年缩短至一年?归根结底就是其对现实世界强大的理解能力。AGI最大的特点在于对真实世界的规则,尤其是物理状态、自然规律、化学变化等等因素的反馈。Sora虽然只在内容创作上带来帮助,但谁能确保经过足够的训练,OpenAI不会基于此推出真正意义上的AGI产品呢? 不过,Sora代表的AGI“世界模拟器”要运转,离不开算力基础设施。正如全球化人工智能企业APUS董事长兼CEO李涛所言,每一个深度学习的人工智能模型,都离不开背后强大算力的支持,Sora亦是如此。OpenAI CEO Altman曾公开表示,其工作与产品仍需更多算力提供帮助,目前公司所使用的还远远不够。OpenAI已展开自有芯片布局,早在去年10月,路透社就曾报道OpenAI已经参与投资至少三家半导体设计公司,其中Cerebras更是一家初创型企业。 随着AGI的爆发,世界对AI算力的需求将进一步井喷。一方面,文生视频类应用的算力需求,将是ChatGPT文生图类的成百上千倍。另一方面,AGI技术正在进入更多场景,更多AI软硬件产品和消费/行业向应用会出现,进而形成更巨大的算力需求。 新年伊始,就有大量企业喊出向AI转型乃至“All In AI”的口号,投入力度相较去年有增无减。雷科技此前的报道《OPPO魅族梭哈!2024成“AI硬件元年”?》中统计道,截止目前已有OPPO、魅族、联想、小鹏、吉利等各个行业的头部企业发声表示加大AI投入。 其中,联想通过社交媒体为即将推出的AI PC联想小新进行预热,并在内部宣布全面加速AI化转型,发力AI内嵌智能终端、AI导向基础设施和AI原生方案服务。魅族定下“三年之约”,宣布叫停传统智能手机项目,全力投入AI硬件新赛道。OPPO CEO陈明永则表示,其战略是做AI手机的引领者和普及者,还成立了专门的 AI中心。 中原证券去年年底的一份研报中援引的数据显示,2023年全球AI芯片市场规模约为450亿美元,预计到2027年将达到4000亿美元,未来5年的年均复合增长率超过70%。 在智能Pro看来,震惊人类的Sora横空出世表明,文生视频技术进展比人们预期的快,AGI时代的来临从10年压缩到1年。因此,2023年关于AI算力需求的研报数据已完全不合时宜,真正的算力需求是人们此前预测的成百上千倍。 正是瞄准这一点,软银才会豪掷千亿美元豪赌AI芯片,因为市场机会依然充沛,这样看,对所有AI芯片玩家来说,能否超越英伟达,也不是什么重要的命题。
因为360,火绒干掉了win 10的电脑桌面
不知道差友们现在还有多少人还在用 Win 10 呢? 前两天 Win10 20H2 的系统更新出事了,不少小伙伴更新完之后跑到知乎上大喊: 我桌面呢??? 图片源自知乎 @ 风筝 这些丢了桌面的小伙伴一番摸索之后发现,自己电脑上的 explorer.exe 程序不见了。 给不知道的小伙伴解释一下,在 win11 之前, explorer 这个系统程序总管电脑里的任务栏、桌面、开始菜单、以及文件管理器。 它没了,桌面自然就没了。 再一番追查之后,大家发现这个系统组件居然是被自己装的第三方杀毒软件火绒给杀掉的! 好好的,为啥原本该给系统当保安的火绒会突然开始反过来攻击 “ 自己人 ” ,把更新之后的系统组件给删了呢? 抱着好奇,世超接着往下翻,看看有没有大佬来分析一下到底是怎么回事。 结果不看不要紧,一看更迷惑了——这整个乌龙事件里,不仅涉及到刚才我们谈到的主角 Windows 和火绒,竟然还有一个看起来八竿子打不着的 360 。 不知道大家有没有注意过,从 Win 10 开始,底部任务栏默认状态下会有一个搜索框。 显然 Windows 并不满足于任务栏搜索之前的功能,所以在里面加入了不少资讯、兴趣类的内容。 360 也看上了任务栏这个 “ 好地段 ” ,强行往任务栏里也塞入了自己的搜索栏。 图片源自知乎@大贤者初春令月 一山肯定不能容二虎,任务栏就这么大, 360 再强插一脚进来很难不出现问题。 据有的小伙伴儿说,这两个功能都启用的时候,会有概率死机、崩溃。 Windows 自然不能放着这样的事情不管,但它不知道出于什么原因,没有对 360 重拳出击,反而是出了个补丁,来避让 360 。 根据知乎用户 @Henryzhao 分析, Windows 的这个补丁特地在任务栏里做了一个叫 “ IsHijackingProcessRunning ” ( 劫持程序是否运行 )的函数检查 360 进程运行情况。 大家可以看一下截图中的检测函数代码。 它扫描的 360 Safe 、 ZhuDongFangYu 这些,都是 360 系程序的经典进程。 如果检测到 360 的产品正在运行,就会主动让 Windows 自己的任务栏资讯功能停止工作,也就是代码中的 SellFeedsCampain = 0 。 这样做避免了出现 360 的搜索栏和 Windows 任务栏相互冲突的情况。 但是 Windows 的这段代码,本身就是新加入的内容,实现的又是检测其他进程这么敏感的动作,加上名字里 “ 劫持 ” 这个词听起来也很敏感,所有的因素叠加起来很自然就引起了火绒的注意。 最后的结果就是杀毒软件火绒把 Windows 的这个补丁行为直接当成了病毒来处理,给杀掉了。 然后大家的桌面就没了。。。 不过火绒这边的动作也非常快,很快就发了公告,更新完特征库了。 所以大家现在可以放心更新系统了。 回过头来看,整个事情无非是 360 想要强行在系统任务栏里贴赚流量,结果和微软自家搞的流量口子冲突了。 微软想着给 360 擦屁股,反而被火绒打了手。 说来也巧,这种系统给应用擦屁股的行为其实并不是第一次出现。 我们大家熟悉的 iPhone 和微信,也有过这么一档子乐子。 苹果之前就发现,微信的性能监控方案里调用了一个系统功能 API —— stack _ logging _ enable _ logging 。 这个 API 在很早之前的 iOS 版本当中可以启用堆栈日志,但是后来苹果把这个功能迁移到了别的 API 上, stack _ logging 这个 API 就没有任何实际意义了。 然而微信的程序员并没有随着苹果在系统中做出的调整来调整自己的代码,依旧会在微信中调用 stack _ logging 。 结果就导致苹果的遥测后台会收到大量的 “ 无效 API 调用 ” 报错。 虽然这个报错不会对 App 的正常使用造成任何影响,但估计全中国 2 亿多的 iPhone 用户都在跟苹果 “ 报错 ” ,把苹果后端的工程师也给看无语了,所以后来的 iOS 更新当中,又特地把这个 API 作为一个 “ 空壳子 ” 加了回来。。。 这一次,苹果工程师直接把 stack _ logging _ enable _ logging 的注释改成了:这串 API 什么用也没有,鬼知道为什么微信还在调用它。 然后把包含这个 API 更新的文件命名为了 “make tapi happy” ( 让腾讯 API 开心 ) 很明显,这次 Windows 和 360 并没有像苹果和微信一样获得一个 “ 开心 ” 的结局,反而把火绒也卷了进来,闹了一个大笑话。 这里面有两家在遇到冲突的时候,没有沟通好的原因。 假如, Windows 能够及时告知 360 并制止它这样的行为,而不是吭哧吭哧地给它打补丁擦屁股。 可能就不会有这样的笑话了。 再退一步,如果 Windows 和 360 都不往任务栏里加搜索、资讯这些牛皮癣一样的内容,问题是不是就在源头解决了呢? 撰文:施 昂 编辑:米 罗 美编:焕 妍
AI界的“印度神猴”横空出世!亚洲首富倾力打造的大模型下月发布
财联社2月21日讯(编辑 潇湘)AI界的印度“神猴”即将横空出世…… 据当地媒体报道,由亚洲首富安巴尼(Mukesh Ambani)旗下的印度信实工业和印度顶尖工程院校共同组建的研究联盟BharatGPT,计划在下个月推出首个类似ChatGPT的服务产品,这将是印度在人工智能领域迈出的重要一步。 BharatGPT在当地时间周二于孟买举行的一次技术会议上向外界展示了其大语言模型(LLM)的功能。该模型以印度教神话中的神猴哈奴曼(Hanooman)命名。 BharatGPT设想该模型在当前阶段,可通过11种当地语言在四个主要领域发挥作用:医疗保健、治理、金融服务和教育。 信实工业与孟买等地的八所印度理工学院合作开发了这一模型,并得到了信实旗下印度电信巨头Reliance Jio和印度政府的支持。 印度理工学院孟买分校计算机科学与工程系主任Ganesh Ramakrishnan介绍称,“这是一种完全不同类型的LLM。” 他在接受采访时称,Hanooman将提供语音转文字功能,使其更加方便用户使用。 印度有着非常复杂的语言系统,据统计,该国一共有1652种语言和方言,其中使用人数超过百万就有33种。印度宪法规定了18种语言作为联邦官方语言,另外还使用英语作为行政、司法用语。 同时,印度约有3亿文盲,是世界上成年人文盲人口最多的国家。这使得传统的AI模型,对于不少印度民众而言未必能够很好地适用。 而BharatGPT显然致力于解决这一困扰。BharatGPT表示,其模型目前可以支持11种印度语言,包括印地语、泰米尔语、泰卢固语、马拉雅拉姆语和马拉地语,研发者还希望可以扩展至22种印度语言。 在周二向与会代表播放的一段视频中,印度南部的一名摩托车修理工用母语泰米尔语向人工智能机器人提问;一名银行家则用印地语与该工具对话,而印度第六大城市海德拉巴的一名开发人员则用它编写了计算机代码。 研发者与信实工业的合作,包括在电信和零售等领域的行业应用模型。Ramakrishnan表示,Reliance Jio将为特定用途定制模型。该公司已经在开发“Jio大脑”,这是一个在拥有约4.5亿用户的网络中使用人工智能的平台。 分析人士表示,如果Hanooman可以取得成功,将标志着印度在加速开发具有潜在变革意义的人工智能技术的竞赛中,取得了长足进步。 事实上,亚洲首富安巴尼致力于打造印度自己的基础大型语言模型的消息,在去年三季度就曾被外界报道过。 英伟达去年9月曾在官网上发布公告称,将与安巴尼的信实工业集团建立AI合作伙伴关系,双方合作开发大型语言模型,该模型将基于该国的多种语言进行训练,并且为生成式AI的应用量身定制,让AI技术更好地为14亿印度人服务。 英伟达当时还宣布将向信实提供最先进的GH200超级芯片,同时也将向合作伙伴开放接入DGX AI算力云服务。
马上评|AI的尽头是卖课?
某电商平台上售卖Sora教程的截图 Sora还未正式开放,卖课的已经盈利了。据媒体报道,继2023年文生文大语言模型震撼业界后,2024年春节期间,OpenAI推出的文生视频大模型Sora又一次让人看到了科技进步的魅力。与此同时,各种卖课、教程也开始涌现出来,赚得盆满钵满,但质量却让人一言难尽。 比如有记者购买了其中一份“教程”发现,“教程”是一份在线文档,其主要的内容包括Sora的介绍、生成的视频、还包含大段的其他媒体、自媒体发布的解读文章,其中90%的内容都是能够在网络上公开找到的资料。此外,还有些视频、直播付费课程,但不少上了课的学员直呼上当:不过是简单科普和基础操作,实在没什么含金量。 有一位“讲师”的话很值得玩味:“我实际上不懂AI,像我们这样的普通人不需要特别懂AI,但依然能通过AI赚到钱。”这或许很能代表当前AI卖课的整体面貌,很多是一种跟风投机,将网络信息包装一下,赚一波快钱。 当然,卖课之所以火爆,更大的原因还是很多人都笼罩在一种AI焦虑中——人们希望抓住新的风口,也害怕被技术演进取代。AI本身的技术展示,加之媒体的分析解读,确实制造了一种“科技巨变前夜”的氛围。人们试图在巨变到来前尝鲜,毋宁说也是一种本能。 也正因为这种焦虑,才给了各种卖课趁虚而入的机会。现在人们不妨冷静一下也清醒一点,既然连Sora都只有极少量的测试名额,大多数人面对AI的信息差都是差不多,那些平台上一搜一大把、从0.1元到199元不等的课程,不过是水课甚至骗局。 面对这种AI未动、卖课先行的局面,其实舆论也颇为反感和无奈。在网上这两天流传着一张图——所谓“中美两大AI巨头”,就是把OpenAI首席执行官山姆奥特曼和国内某从事知识付费的网红放到一起对比。 这当然是一个玩笑,但其实也反映了社会的某种情绪。当AI这个有科技革命意味的技术兴起,迅速出现的是一波连蒙带骗的卖课潮,总是令人心情复杂。 AI的尽头是什么,人们理想中当然是行业颠覆、产能释放、社会重塑等等这些宏观的远景。人们也希望在AI大发展的趋势面前,行业内能有更多的科研和应用领域的布局,去直面这波冲击;而不是集中于卖课这种边缘、下游产业链,变着法子收割普通大众。 当然,AI的门槛确实存在,未见得人人都能快速上手,所以作为一种知识普及,课程自然是需要的,卖课也很正常,但人们至少希望这些课程能够真正起到填补信息差的作用。现阶段很多注水严重的课程,底色依然是一种跟风炒作、赚快钱的模式,难以让人满意。这种浮躁的风气,人们从直觉上就能感觉出,这和长期投入的科研叙事是相悖的。 也希望关于卖课的讨论可以引发社会的思考,真正的AI研发和AI应用到底应该建构于怎样的生态之上,这也是人们面对AI冲击的一堂必修课。
AI工作站面世 未来人类即将进军AI本行列
随着AI趋势逐渐浮出水面,自ChatGPT的出现将AI重新推回风口浪尖,电子产品硬件在构架AI适配型机型上已经开始蠢蠢欲动了。尽管AI老生常谈,却也在10年前并未对生活运用产生大范围的影响,浮于表面AI理解终于是在大量AI作图,AI视频软件,AI语音识别等云端软件开放使用后形势变得明朗,本地化AI使用将成为新的笔电赛道,未来人类会踏入这片新的领域,推出专为AI软件工作使用的新系列笔记本。 虽然构筑在AI之上的笔电,传统厂商将其定义为轻薄本转化的AI本,所以现有的厂商仅仅是在轻薄本的基础上迭代了Intel推出的AI级别CPU Ultra系列。未来人类在这一思路上持有不同的想法,性能将是衡量AI本的先决条件,在采用Intel Ultra系列CPU的同时,加入了独立显卡,以完成AI渲染所需的硬件支持。 在NPU模块提出之后,笔电厂商通常在关注单一的CPU可以承担AI工具的使用,然而事实是AI工具尤其是视频制作与图像渲染方面仍然需要独立显卡去承担主要的工作,NPU的调动还处于初始阶段,不可否认本地AI工具将在未来不断加强NPU的适配性,但是同时也将依赖GPU的共同工作,甚至是交替工作,让AI本的使用范围更加宽泛,而非简单的AI云端使用。 本次未来人类AI工作站,将定义为S4与S6机型代号,从两款机型代号我们也能知晓,会有14英寸与16英寸两个尺寸规格的AI工作站将会面世,其中CPU会采用IntelUltra系列处理器,并且将搭载英伟达4060和4070独立显卡。 屏幕分辨率将有120Hz与240Hz两个选项,同时为保证AI软件运行至高可选配64GB,硬盘存储也将可以选择最高2T,创造一款适合当下也面向未来AI大趋势的全能AI笔记本电脑。 通过独特的眼光,突出与众不同的AI工作站是未来人类对于当下AI形势的判断,也将带给所有想要使用AI工具去进行生产力创造的用户一个全新的体验,在AI工具不断更新适配NPU运用之后,这款AI工作站将全面发挥其AI使用体验。
知名AI创企被曝停工停产6个月!已获D轮融资,最新回应来了
作者 | 程茜 编辑 | 李水青 智东西2月22日报道,昨日晚间,AI平台创企竹间智能被曝部分部门和岗位将停工停产长达六个月。网传截图显示部分业务及岗位将从2月20日起停工,并进行重组,停工时间从2024年2月20日10时至2024年8月19日19时。 ▲网传竹间智能停工停产截图(图源:企服科学) 智东西第一时间向竹间智能相关负责人询问得知,网传截图为部分业务线给个人的通知,非面向全公司范围。停工停产面向的是部分岗位,主要停掉了一些亏损、交付重的业务。目前该公司的举措是先停工然后重组,以保证所有资源聚焦做好客户售后服务。 此外,竹间智能新的数字人相关产品开发工作仍在继续进行。 竹间智能或于今天白天发布正式声明回应网传相关截图。 在网传的截图中提到竹间智能下发停工停产通知的原因是:“由于公司所处的经营环境艰难,受到多方不利影响,自2023年起,业务需求大幅减少,给公司带来了严重的现金流压力和挑战。为了应对当前局势,确保公司长期发展,我们正在对业务方向进行调整,在此期间将优先保障对客户提供高品质的服务,并提升我们的交付质量,旨在提升客户满意度,加强在新技术和新产品的探索。” 停工放假期间的工资标准为,从停工放假第一天起算到满一个月止为一个工资支付周期内,按照约定支付员工的工资。放假满一个月视为超过一个工资支付周期,公司根据规定支付上海市最低工资标准。 并且停工放假期间,该公司将按照上海市有关规定继续为员工缴纳社会保险、住房公积金。 竹间智能成立于2015年,创始人是前微软(亚洲)互联网工程院副院长简仁贤,该公司核心业务为基于情感计算、自然语言处理、深度学习、知识工程、文本处理等AI技术,将AI能力整合到企业业务中。 目前,竹间智能已经建立起六大自动化AI平台,包括Bot Factory对话式AI平台,Gemini知识工程平台、 AICC+解决方案平台。目前业务覆盖领域涵盖AI+金融、AI+企业、AI+健康医疗、AI+制造、AI+智能终端、AI+政务等。 据企查查的公开数据显示,竹间智能已经完成7轮融资,已披露的融资总额达数亿人民币。最新已披露具体信息的融资事件为,2022底完成约亿元D轮融资。
手机十年来的大更新,即将到来
科幻小说《三体》中存在一个乱纪元的状态,当行星在三颗太阳的引力间波动,进行不规律运动时,会发生各种无法预测的变化。 AIGC 的爆发让硅基世界迎来乱纪元,我们似乎处于一个奇点元年,竭力去理解这个新世界,度过一个新文明的前夜。 在刚刚过去的春节假期里,我们就见证了 AI 行业的疯狂进化。 OpenAI 推出 AI 视频生成模型 Sora ,通过简单的提示词就生成一分钟视频,这可能是通向 AGI 的重要基础。 Google 接连上线 Gemini Ultra1.0 和 Gemini Pro 1.5,实现 100 万 token 上下文能力,多模态能力进一步提升。 英伟达发布了本地 AI 聊天机器人 Chat with RTX,最大的「AI 军火商」也加入到 AI 应用的市场 就在除夕夜,OPPO 也举办一场史上最短的发布会,宣布进入 AI 手机时代,并推送了 ColorOS AI 新春版。 在昨天的 OPPO AI 战略会上,OPPO 首席产品官刘作虎也进一步阐述了对于 AI 手机的理解,他表示: AI 手机将是继功能机、智能机之后,手机行业的第三个重大的变革阶段。 这和 OpenAI CEO Sam Altman 此前一个观点形成了有趣的互文:AI 将像手机那样改变世界。 而在 AI 改变世界之前,人们争先想给 AI 找到一个硬件载体。 AI Pin 和 Rabbit R1 都是有趣的尝试,不过你也会发现这些 AI 原生设备,实现的功能场景和交互效率似乎并没超过现有的硬件。 这样不代表 AI 硬件就是伪命题, 2024 的确会成为 AI 硬件元年,但未来几年内最适合作为 AI 终端设备的,还是智能手机。 智能手机依然是最好的 AI 载体 OPPO 将 AI 手机的影响视为从功能机到智能手机的演变,这个分水岭其实就是 iPhone ,都说乔布斯重新发明了手机,他到底发明了什么?AI 手机的参考答案就在里面。 回到 2007 年的初代 iPhone 发布会上,乔布斯为了解释 iPhone 与其他手机的不同,用易用性和智能化为坐标系画了一个象限图,给智能手机下了新的定义:智能手机=更易用+高智能。 智能手机对比功能机的易用性体现在多点触控和大屏,这两者是相辅相成的,双指滑动操作的交互更加高效,滑动解锁的操作符合直觉,实体键盘的取消给屏幕的更大的空间,一块大屏意味着更好的信息输出效果。 至于智能化,用乔布斯的原话说,「这是一个革命性突破,将真正的互联网带到手机上。」正是在 4G 和智能手机的撬动下,才有个过去十几年兴起的移动互联网时代。 那么当我们在谈论 AI 硬件的时候,这样的衡量维度失效了吗?答案是否定的。 今天我们所处的数字世界,其实也是 UI 的海洋。从 PC 到 手机,每一代通用计算平台带来的根本性的改变,其实通过改变人机交互的方式,提升世界的数据化程度和传输速度。 因此,如果要说 AI 硬件对比现有的产品应该带来什么升级,也离不开下列几个维度: 交互效率(输入和输出) 智能程度 -便携性 综合这些维度,我们就不难发现,我们未必需要重新造一个 AI 原生设备,智能手机就是当下最适合的载体。 昨天 OPPO 对外公布 AI 战略后,刘作虎在介绍采访时也认为,至少 10 年以内,手机还是 AI 硬件的最重要一环。 就拿手机的相册来举例,最近我用 Find X7 拍照后我经常会使用 AI 消除功能,只要滑动手指圈一圈,就能将路人或杂物消除,基本不用再进行后期。 不用切换其他 app,手指滑动代替鼠标的圈选,提升了我的交互效率。而基于 AI 消除的精准度,则是智能化更高的体现。 ChatGPT 的出现让我们看到更符合直觉的交互——自然语言。相比 GUI 所见即所得的触控、点击,原来我们还能以一种更简单的方式进行交互。 这种交互逻辑可以称之为自然用户界面(Natural user interface, NUI),早在 2008 年微软首席 UI 设计总监 August de los Reye 曾公开指出,GUI 未来演进的方向就是 NUI。 高算力的大模型和自然语言的交互,正是 AI 让智能手机在易用性和智能化两个坐标轴再次大幅提升的杠杆。这是影像能力、屏幕材质、处理器这些方面提升到什么程度都难以实现的。 将大模型塞入手机也已经成为现实。比如在 Find X7 系列上,OPPO 首次实现端侧应用 70 亿参数的大模型,将 AndesGPT 的 Tiny 模型放进了手机之中,模型在手机运行所需的内存正在快速降低。 70 亿大模型正常的模型大小是 28GB,为了真正在端侧部署,OPPO 用高精度 4 比特来对模型进行压缩和轻量化,从 28GB 最终可以压缩到 3.9GB 左右,无论是存储还是内存占用都是这个量级。 英伟达高级 AI 科学家 Jim Fan 认为,我们正在进入一个新时代。移动芯片的性能不再通过 GHz 来衡量,而是通过 tokens 生成速度来衡量。 大语言模型是新的智能手机操作系统。 或许未来某一天,智能手机的形态会将被新一代计算平台取代,但我们这代人大多会从智能手机上开始感受 AI 对生活带来的变化。 一部 AI 手机应该是怎么样的 2024 年,我们已经看到 OPPO 等主流手机厂商正在拥抱 AI,那么一部 AI 手机应该是怎么样的? 昨天 OPPO 和 IDC 联合发布的首个 AI 手机白皮书,提到了 AI 手机的四大特征: 首先要能够高效地利用计算资源,以满足 AI 时代下生成式 AI 的计算需要; 要能敏锐地感知真实世界,了解用户与环境的复杂信息; 还需要拥有强大的自学习能力; 此外,AI 手机还将具备更充沛的创作能力,为用户提供持续的灵感与知识支持。 AI 手机的体验同样是软硬件的结合,但逻辑和现在的智能手机有所不同。 依托于大模型的 OS 通过内嵌智能体,将能高效地处理复杂任务,并能主动创作,提供更符合直觉的多模态交互。 而硬件架构有了新的衡量标准:高效能的 AI 算力底座、模型库的管理优化以及智慧仿生感知能力。 OpenAI 应用研究主管 Lilian Weng 曾在一篇文章中指出, Agent(智能体)= LLM(大语言模型)+ 记忆(Memory)+ 规划技能(Planning)+ 工具使用(Tool Use)。 这是模仿了人类执行任务过程的四个组件,LLM 作为智能体的大脑,其他的关键组件执行任务。 拆解和规划任务的分配 模拟人的记忆类型进行获取、存储、保留并检索信息 调用外部 API 扩展模型能力 其实 OPPO 对 AI 手机的定义和 Lilian Weng 关于 Agent 的研究不谋而合,OPPO AI 中心产品总监张峻也跟爱范儿进一步介绍了 OPPO AI 超级智能体的核心逻辑。 智能体会变成智慧 OS 的大脑和核心,但是我们想做的是全栈的 AI 变化,比如说大家很熟悉的屏幕、麦克风这些器件,OS 中的组件,我们都希望将其 AI 化。 这个智能体首先也是基于知识图谱、文档数据以及搜索引擎来理解用户意图。同时基于对用户的长期记忆以及当下的实时交互语境,针对每个用户的需求,调用多种多样的工具提供服务,这是和过去的智能手机最大不同。 很多人认为 AI 手机等同于大模型+手机,其实更准确的说法,应该是 AI Agent 和智能手机的结合。 当 AI 可以理解用户的自然语言,基于本地的数据训练逐渐理解用户的意图,过去应用提供的服务和功都能无缝整合到系统中调用,吃穿住行娱乐工作所有场景,用户只要说出需求即可。 按照这个逻辑,应用的形态也将完全改变。整个交互界面本身就是一个超级 app,使用和开发应用的方式也会完全不同,AI 手机要迈向的就是这个未来。 至于什么时候才会看到真正的 AI 旗舰,恐怕还得等等,但我们已经可以在 Find X7 等部分旗舰上看到 AI 手机的雏形。 比如在打电话时,AI 智能通话摘要功能可以帮我们梳理出通话内容的重点,并且准确地以文档的方式输出带有主题、要点、待办事项的内容摘要,对我这样经常电话采访和开线上会议的职场人就很实用。 春节期间推送的新小布助手,选择「连麦」在对话时的体验也更接近真人,甚至可以模拟不同的角色,比如给你推荐最近的上映电影和搜集影评,语音记录自动转换文字方便收藏转发,更接近一个高级的私人助理。 而前面提到的 AI 消除功能,OPPO 称推送以来人均每日使用次数已经达到 15 次,这也意味着用户对 AI 的体验开始从尝鲜转入常用。这也是交互效率、智能程度和便携性几个要素共同作用带来的结果。 从这些功能,我们也能窥见 OPPO 做 AI 手机的理念和路线:以产品驱动技术。 如何利用多模态的能力解决用户高频高感知复杂任务场景,基于场景和需求来调整大模型的训练模式,调用不同的算力,也将是 AI 手机能否真的区别于目前智能手机,带来更好体验的关键。 2024 ,AI 手机的奇点元年 2023 年可以说是大模型元年,ChatGPT 和一众大模型让我们看到了一个新的可能性,那就是人人都可以拥有贾维斯那样的超级 AI 助理。 可即便 ChatGPT 有了手机 app,还是无法真正成为贾维斯,因为很多需求的执行聊天框里还无法处理,所以 OpenAI 才推出了 GPTs,让更多人开发属于自己的智能体。 但就像我们前面所说的,智能体最适合的硬件载体目前还是智能手机。智能手机从系统开始适配智能体,并衍生出新的应用生态,体验会更加丝滑。 目前 AI 手机所需的条件也逐渐成熟,一方面算力成本不菲的通用大模型和行业大模型,都开始需要寻找落地的场景产品化。同时端侧模型在移动设备的运行问题逐步被解决,能力更小的内存运行更大参数规模的大模型。 这也是为什么 2024 年,会被称为 AI 手机元年。 其实无论哪个时代,用户需求应该是被发现,而非凭空创造的,好产品都应该是能洞察不同时代趋势下的用户需求。 正如 Google 前 CEO 埃里克·施密特在的《重新定义公司》一书中的观点:「技术的未来在于,预测用户的需求并在用户意识到这些需求之前就满足它们。」 爱范儿曾在一篇文章中指出,AIGC 正在推动社会进入一个「智力盈余」时代。每个人都有机会,拥有无限的「外部智力」,成为超级个体。 因此,我们的随身设备应该就是最强外脑的载体。让每个人口袋里都有专属的超级助理,实现 AI 普惠,也是 OPPO 做 AI 手机最大的动力,洞察的是 AIGC 时代的最大需求。 过去 20 年,OPPO 是为数不多穿越周期的消费电子品牌。从功能机到智能手机时代,OPPO 的核心竞争力从来不是单点的技术、设计或者功能,而是透视时代的需求,洞察流行本质,不随波逐流的能力。 这意味着你无法亦步亦趋,必须主动去做有一定失败风险的事情。 率先定义音乐手机品类的 A103,是在便携式媒体播放器流行的功能机年代,看懂了小镇青年的娱乐和社交方式 在智能手机时代,从第一款真正意义上主打自拍美颜的 Ulike U701, 到 Find X7 上和哈苏宣布打造新一代超光影影像系统,代表了不同时代的情感和个性表达,人们从追逐浮夸的「美颜滤镜」到欣赏更真实自然的状态。 当 AIGC 浪潮来临,跟随者蜂拥而至,国产大模型就有 200 多个。率先喊出 AI 手机并非一定赢得头彩,反而可能被认为质疑跟风,但 OPPO 在 AI 布局其实比我们想象中要早得多。 早在 2020 年,OPPO 就推出了首个 AI 大模型,并持续进行投入,去年 OPPO 发布自主训练的安第斯大模型(AndesGPT),其实也是之前的技术积累,在 Super CLUE 知识与百科能力排行榜上仅次于 GPT 4。 在昨天的 OPPO AI 战略发布会上,虽然刘作虎没有正面回应在 AI 上投入的资金,但他告诉爱范儿,「在投入上,我们可以说是没有上限」。 今年 1 月 OPPO 成立了 AI 中心,把产品、研发、运营、研究院、数字工程、软件工程的骨干聚合在一起,得以像做互联网产品一样快速迭代。 年初发布的 Find X7 是首款在端侧应用 70 亿模型的手机,在处理能力、处理时延、视觉生成响应等方面都是 Android 旗舰的第一梯队。 OPPO 目前一方面通过量化等技术大幅降低模型在手机运行所需的内存,同时利用自建的 OPPO AI 滨海湾数据中心部署 Titan、Turbo、Tiny 三个级别的模型来处理不同的场景需求。 端云协同也是目前手机部署 AI 大模型兼顾效率和性能最理想的方式,端侧计算可更好保证实时性与隐私保护,云端更强的计算能力则能够完成像 AI 消除等更复杂的任务。 IDC 预计, 2024 年全球新一代 AI 手机出货量将达到 1.7 亿部,占智能手机整体出货量的 15%。中国市场 AI 手机份额也将迅速增长,到 2027 年将占比超过 50%。 不过要让 AI 体验像影像一样成为影响用户消费决策,也不会一蹴而就。 大模型催生出新的数字化时代,我们的文化、经济甚至是身份认同都在经历重塑,AI 手机作为这一变革的重要载体,需要更多 OPPO 这类主流厂商作为贡献者和普及者,让更多用户感受到 AI 带来的改变,直到与人们的日常生活融为一体。 过去几十年,计算设备一直在追求着这样的未来:自动感知和响应人们的需求,提供智能化的、自然的和无缝的用户体验。 从 PC、智能手机到打造空间计算的 Vision Pro,都在接力让我们离这个终点更近一点。现在,AI 手机要开始接过这个历史任务了。
华为鸿蒙智行再添享界,一上来就要卖 40 万元
继问界和智界后,又多了一个享界。 华为的老伙伴北汽蓝谷,最近在回答投资者提问时透露,其与华为在智选模式合作下打造的「享界」即将问世,首款产品是一辆面向高端市场的智能轿车。 北汽蓝谷表示,目前正在加速推进「享界」项目,计划在 2024 年于亚洲和欧洲市场建立分销和服务网络,把这辆高端轿车推至海外市场。 北汽蓝谷还提到,华为智选车项目的供应商大会已于 1 月 26 日在北京召开,华为常务董事、终端业务 CEO、智能汽车解决方案 BU 董事长余承东亲自出席了本次会议,去年广州车展上他就提到,除问界与智界外,还有来自北汽和江淮的另外两个界。 招商证券去年 12 月发布的一则关于华为与车企合作造车的调研报告提到了这两界。 在江淮一栏中可以看到,与华为合作的这台新车代号为 X6,车型为轿车,定位对标迈巴赫,售价高达百万级,将于 2024 年第四季度上市;上方的北汽一栏,则是一辆售价 30-40 万元的行政轿车,预计将在今年 4 月举办的北京车展中亮相。 关于享界的造型设计,我们可以在此前曝光的谍照中窥之一二。 可以看到,享界有着一个低趴扁平的造型,修长的前盖符合许多消费者对于行政轿车的预期。 新车内部采用浅色内饰,仪表台采用双层设计,硕大的中控屏后方疑似还有一条横贯仪表台的长条状屏幕,其余部分的布局与此前发布的智界 S7 近似,但享界有着更高的定位,内饰用料和舒适性配置估计会与智界拉开差距。 从测试车辆的轮毂中可以看到,享界的英文名为「STELATO」。此前,华为技术有限公司曾向北汽新能源汽车股份有限公司转让了「STELATO」商标,转让申请已经得到相关单位的核准。 尽管产品还未正式推出,但制造事宜已在紧锣密鼓地筹备当中。北汽新能源计划升级改造位于北京市密云区的工厂,专门用来生产享界车型。 北汽蓝谷筹建高端智能生态工厂的想法可以追溯到 2018 年,但由于北汽新能源近年销量遇阻,该项目一度搁置,直到去年才重新启动,工期预计将在 10 个月内,预计总投资为 16.12 万元。 根据北汽新能源工厂建设项目的提案,北汽将购买北汽福田汽车股份有限公司在北京的多功能设备资产,并进行技术改造,同时租赁密云工厂的土地、厂房以及附属设施。 从北汽蓝谷积极布局的态度来看,该公司十分看重此次与华为的新合作,这与北汽新能源背负销量压力不无关系。 2023 年,北汽蓝谷全年销量为 92172 辆,同比增长 83.69%,看似增长迅猛,但若将这个销量数据放至整个新能源汽车市场,并不可观。更何况,这其中绝大部分都来自以 B 端投放为主的 BEIJING 品牌纯电车型,主打 C 端市场的极狐汽车的销量仅有 30016 辆,占比仅 32%。 根据北汽蓝谷公布的 2023 年度预亏公告,经初步测算,预计该公司的年度归母净利润为-57 亿元至-52 亿元,扣除非经常性损益后的净利润预计为-62 亿元至-57 亿元。 如果梳理北汽蓝谷近 4 年的业绩表现,该公司已经累计亏损超过 220 亿元,结合销量,北汽蓝谷销售均价 10 万元左右新能源车型,每卖出一辆车要亏 5 万元以上。 对于持续的巨额亏损,北汽蓝谷给出了两个原因。 一是新能源汽车市场的竞争愈发激烈,公司为不断提升综合实力,在积极开拓市场,在技术研发、品牌渠道建设等能上持续投入,对公司短期业绩产生了一定影响;其次是公司产品销量仍处于提升期,规模效应暂未显现,导致产品成本阶段性偏高。 说了很多,但总结起来就是销量上的不如意,正因如此,华为的「界」字东风,对于北汽蓝谷来说非常重要。但考虑到享界的高端定位,该系列车型所能产生的规模效应十分有限,仅能为北汽蓝谷完善产品结构,锐化品牌形象。 北汽蓝谷也明白这一点,享界新工厂的规划年产能仅在 5 万辆左右,只能作为北汽入局智选模式的基础,问界的成功,享界恐怕难以复制。
14代i9游戏本值得买吗?测完暗影精灵10后,我有话要说
去年 12 月份,有差友留言问:啥时候来个年底游戏本推荐? 说实话哈,当时不是没考虑过,但后来仔细一想,托尼还是建议大家做个等等党。 因为 2024 年的游戏本市场会有新的变化。 跟以往不一样的是,英特尔在 14 代酷睿移动端这个节骨眼走到了一个岔路口,划分出了卷能效和 AI 的第一代 “ 酷睿 Ultra” 系列和卷性能的 “H” 系列两条主线。 这一下,就让 OEM 厂商们的打法更加灵活了。 毕竟牙膏厂能挤的 “ 牙膏 ” 又多了一管。( 狗头 ) 咱们就拿 OMEN 暗影精灵 10 游戏本来举例,他们根据 14 代酷睿的特点,划分出了搭载酷睿 Ultra 处理器,主打AI 和全能的暗影精灵 10 SLIM 14 ,以及最高第十四代英特尔® 酷睿™ i9-14900HX 处理器,主打性能释放的暗影精灵 10 。 关于酷睿 Ultra ,其实我们之前已经出过相关文章和视频了,感兴趣的小伙伴可以往前翻翻,这里就不再赘述了。 但对于 14 代酷睿 HX 处理器,我们还没给大家好好测过。 正好这次春节假期,我们同事把仓库里的暗影精灵 10 借回家打游戏了。 于是。。。就让他顺便把这台机器的评测给做了吧。 既然话都如此了,那咱们还是先来看看这台机器的处理器吧。 相比上一代,这颗第十四代英特尔® 酷睿™ i9-14900HX 处理器的核心规格没有什么变化,依旧是 8 个 P 核 + 16 个 E 核。 不过, P 核最高睿频从之前的 5.6GHz 提升到了 5.8GHz , E 核最高频率从 3.9 GHz 提升到了 4.0 GHz 。 可以看出,在架构没有大改的情况下,英特尔选择拉高核心频率来提升性能。 但性能具体如何,咱们还是要用跑分软件来做参考。 先是 CPU-Z 测试,这颗 14900HX 的单核分数为 911.2 ,多核分数为 11781.4 。 单核和多核均领先桌面端的 14600K 。 甚至。。。单核还小幅度赢了桌面端的 13900K 。 大家说,假如 14900HX 的 E 核最高频率,也能提升到跟 13900K 一样的 4.3 GHz ,那么它的多核跑分是不是也会追平 13900K ? 欸 ~ 只可惜要不得。。。 而在 R23 单轮测试中, 14900HX 的单核跑分为 2210 ,多核为 26500 。 作为参考, 13900HX 的 R23 单核和多核分数分别为 1998 和 25085 。 经过一番简单的计算后可得出,这代 14900HX 的单核提升了 11% ,多核提升了 6% 。 开诚布公地说,单核的提升幅度确实能算得上及格,但多核还是前面说的那样——因为 E 核的频率拉得不够高,所以呈现出来的跑分就会差点意思。 而作为目前移动端中的性能第一梯队, 14900HX 可以满足大部分办公生产力场景的需求,凭借出色的单核 / 多核性能,它在处理视频剪辑、后期处理等重负载任务时,也能提供更加稳定、流畅的表现。 至于这台游戏本上跟 14900HX 搭档的 RTX 4060 Laptop 独显,相信大家已经看过很多遍了,咱们就把这块放到游戏环节一起聊。 这里咱们先来聊聊暗影 10 的外观和配置。 虽然外观整体改动不大,而且 B 面还依旧保留了下巴,但它的屏幕确实是有点说法的。 面板来自京东方,在 2560*1440 分辨率的基础上,做到了 240Hz 高刷,以及支持 100% sRGB 色域。 各方面素质都算不错,很难让人挑得出毛病。 另外,这块屏幕还支持了英伟达的 G-SYNC 技术。 简单来说,有了这个技术,画面的响应更快,延时更短,在游戏场景中可以很好地避免画面撕裂现象。 除了屏幕,听官方说这代的散热模组也有点意思。 所以托尼也拆了后盖跟暗影 9 对比了一下,发现暗影 10 在前代 “ 双风扇、 5 热管、 6 风道 ” 的基础上,加强了南桥区域的散热。 前阵子看到暗影精灵的官方号整了一个活儿, 48 小时直播双烤测试,并且四台机器全都通关了。 既然暗影精灵他们这么自信,那咱们在测试时自然也没手软。 话不多说,咱们把烤机时间统一设置为 1 小时后,就直接开始测试。 先是单烤 GPU ,在 FurMark 上把设置调整为 1080P 分辨率 + 2X MSAA 之后,开始 “ 烤甜甜圈 ” 。 可以看到, GPU 的功耗依旧能维持在 140W 左右,而且也没有出现过热导致性能受限的情况。 看到 GPU 单烤没啥问题,托尼在等待机器散热回归正常温度后,就打开了 AIDA64 开始单烤 FPU 。 一轮烤机测试下来, CPU 的封装功耗来到了 90W 左右,跟官方宣称的差不多。 再来看看双烤,这次官方说暗影 10 相比前代,整机的功耗释放提升 15W , 达到了 185W 。 为此,托尼也专门照着官网的指南,在 OMEN Gaming Hub 性能菜单的高级设置中,把性能上限拉到了 15W ,解锁了 185W 的最高整机功耗。 因为这样,我也发现了这个 OMEN Gaming Hub 还挺实用的,除了可以切换性能模式外,还提供了降电压、网络加速以及灯光控制等多种功能,感觉买了这台机器的小伙伴可以慢慢探索。 稍微扯远了,咱们说回正题。 在双烤测试中,它的 CPU 封装功耗为 45.947W , GPU 功耗达到了 139.197W ,这两个值相加确实是 185W 左右。 不过,托尼也要提醒大家, 185W 的功耗释放意味着风扇也是满转速的。 如果是日常使用的话,建议还是选平衡模式,兼顾性能和噪声。 在拓展接口这个方面,暗影 10 可能不是最多的,但也属于是该有的都有了。 左侧给了 2 个雷电 4 和 1 个 3.5 mm 接口,后侧从左到右分别是电源接口、 HDMI 2.1 、有线网口以及 USB-A ,而右侧则只有一个 USB-A 口。 好,讲完了前面的东西,咱们接下来说说游戏本最核心的问题——游戏性能怎么样? 在开始游戏环节之前,托尼先跟大家交代下测试的前期条件:BIOS 版本为 F.05 ,显卡驱动更新至 551.23 版本,独显直连,狂暴模式。 接下来,咱们直接 3DMark 启动! 在 Time Spy 跑分中,暗影 10 的这块满血移动版 4060 直接拿到了 10689 的分数。 跟 10583 这个平均分数相比,暗影 10 的 4060 移动版确实是在及格线以上。 不过, 3DMark 的理论性能跑分也只能当个参考,更具体的还是要看游戏实测结果。 先说网游这块, LOL 这种对配置要求不高的游戏,暗影 10 确实是轻松拿捏。 在 2K 高画质下跑到了 443.5 帧, 1% Low 帧也有 242.3 帧。 去年暗影精灵成了《 无畏契约 》的合作伙伴,那么在这款游戏上,暗影 10 的表现又怎么样呢? 托尼只能说真的很稳。 同样是 2K 高画质,一把游戏下来,平均帧可以稳在 407.5 ,并且 1% Low 帧有 189.7 。 emmm 。。。感觉还是没压力呀,咱们来稍微上点强度吧。 开一把最近同事们开黑最爱的幻兽帕鲁,在 2K 分辨率 + 默认高画质 + DLSS 性能的设置下,平均帧能维持在 104.3 , 1% Low 也有 68 帧。 这个帧率满足大家在帕鲁世界里畅快玩耍是没啥问题的了。 除了帕鲁外,托尼前阵子看小发在玩的雾锁王国,同样也是生存建造类的沙盒游戏,于是也测了一下。 这个游戏的画风偏写实,而且地图巨大,小发说他玩了几个小时也才探索了一小部分。 托尼原本感觉这个游戏应该对显卡的负担挺重的。 但没想到,在 2K 分辨率 + DLSS 平衡 + 分辨率刻度 75% + 垂直同步的设置下,游戏的平均帧可以达到 105.8 ,而且 1% Low 有 59.1 帧。 看来游戏优化做得还可以。 诶。。。说到这,咱就必须得请出那个有着优化黑洞之称的赛博朋克 2077 了。 在 2K + 高画质 + DLSS 性能的条件下,平均帧达到了 110.09 , 最小帧还有 57.96 。 那要是开了光追,帧率会怎么样呢? 在前面条件的基础上,托尼开启了光追,然后把光照设置为中等,又跑了一轮基准测试。 结果也还行, 90.31 的平均帧,以及 48.06 的最小帧。 托尼觉得玩 2077 如果想兼顾下画质和帧率的话,这个设置或许可以参考下。 最后,咱们来稍微总结下吧。 如果未来英特尔的 “HX” 系列 CPU 还是走卷单核性能、卷频率的路线,那么对于游戏本来说,卷散热和功耗释放就是一个收益非常高的方向。 这次的暗影精灵 10 给托尼的感觉就是,他们已经在朝着这个方向走了。 除此之外,暗影 10 还提供了其他配置版本选择,基本覆盖了 6499 到 13999 这个价位段。 如果你除了玩游戏之外,还想兼顾下生产力,那么我们今天聊的这款 14900HX + 4060 的暗影 10 就很合适。 如果你觉得用不着第十四代英特尔® 酷睿™ i9-14900HX 处理器这么强的性能,那可以选择 i7 的。 对显卡性能要求不高,可以选 i7 + 4050 的版本,想要畅玩 3A 大作的话,就选 i7 HX + 4070 的版本。 当然,如果你恰巧财力雄厚,那也可以直接一步到位,选择 CPU 和显卡性能都很顶的十四代 i9 HX + 4080 版本。 而且购买 4080 版本还赠送 HyperX 耳机,有点香的。 目前,有官方的 48 小时直播烤机测试打底,看起来这台暗影 10 还是挺稳的,我们会持续用用看,感兴趣的小伙伴也可以戳下方的链接(或阅读原文)了解哦 ~ 撰文:粿条 编辑:米罗 拍摄:James 美编:焕妍
2.5万元的苹果VR能否让蓝思科技“渡劫”?
吊足“果粉”胃口的苹果混合现实(MR)头显Vision Pro 终于来了,背后沉寂许久的果链企业也再次回到了聚光灯之下。 在“Apple的200家主要供应商中,有151家在中国生产”——在不久前的首届中国国际供应链促进博览会的苹果公司展台上,这是一条最醒目的标语。 在过去的十几年里,以苹果为代表的跨国企业,既受益于中国供应链,也推动了中国供应链的蓬勃发展。背后的供应链企业自从“傍上”苹果后,股价与业绩齐飞,在A股备受追捧。 但近年来,全球消费电子行业遇冷,和苹果之间相互成就的果链企业也“一损俱损”。 2021年以来,果链几大巨头——立讯精密(002475.SZ)、蓝思科技(300433.SZ)、歌尔股份(002241.SZ)、领益智造(002600.SZ)的最新市值距最高点缩水54%至73%不等,49家苹果概念股总市值缩水超8000亿元,且无改善的迹象,许多果链企业还出现明显的净利润下滑。 以蓝思科技为例,自2012年起,苹果就是蓝思科技的第一大客户,多年来随着苹果手机的爆销,蓝思科技的营收和市值也一路水涨船高。 2015年3月18日,蓝思科技成功登陆资本市场,上市9年来,蓝思科技股价一度高达40.75元/股,市值突破2030亿;而截至今年2月21日,股价为11.57元/股,其总市值只有576.56亿。 近日,备受瞩目的苹果Vision Pro在美国太平洋时间1月19日5点开始接受预订,2月2日正式发售。参与制造的蓝思科技股价应声上涨,当日股价最高达到11.93元/股。 然而在苹果“吃肉”供应链“喝汤”的合作模式下,不止蓝思科技,大家无一例外依旧焦虑。 01 果链企业能否“狂欢”的隐忧 “iPhone将人们引入移动时代,VisionPro将标志着空间计算的时代到来。”苹果公司CEO蒂姆·库克在Vision Pro发布会上强调了其重要意义。 作为库克十分看重的最新品类,起售价高达3499美元的苹果Vision Pro距离正式发售的节点也越来越近。 库克早就开始调动各方人马为Vision Pro发售备战。为了打好这一战,苹果正从硬件生态联动、丰富软件应用以及确保供应链三方面提供保驾护航。 据多家消费电子供应链公司的人士透露,苹果新一代MR产品Vision Pro的首批备货40万左右,2024年的销量目标是100万台,第三年达到1000万台。 从数据来说,苹果的这个备货计划对于整个“果链”的所有企业而言,无疑都是一个特大的利好消息。 2023年以来受消费者预期、经济复苏乏力等因素影响,消费电子行业下滑趋势并未得到彻底扭转。在这种情况下,消费电子代工龙头企业如蓝思科技等也都遭遇了重创,业绩、股价全面下调,持续暴跌三年,营收、利润双降,患有“果链依赖症”的企业更是哀鸿遍野,陷入亏损局面。 站在产业层面来说,围绕苹果的整个消费电子产业界,更希望能够从苹果的新产品中,发现消费电子新周期开启的信号,进而为下一个阶段的发展蓄力。 产业链消息显示,与中国供应链在苹果iPhone 15产品占比较低不同,中国供应链在苹果VisionPro的占比高达60%。 因此,国内不少“果链”企业已经开始“认领”Vision Pro制造商身份。 蓝思科技相关负责人就表示,在MR头显领域,公司与多家大客户都在协同开展相关外观、结构、光学部件的研发生产,公司的新技术、新材料、新设备得到深度应用。据公开信息显示,Vision Pro的部件中,包括前盖玻璃、摄像头镜片、透镜膜等正是由蓝思科技供应。 但从2016的“VR元年”以来,这个行业就在“风口”和“寒冬”的两极中周而复始。 干了那么多年的Pico“收缩过冬”;谷歌、微软、三星等科技巨头,在VR领域进进出出;Meta的很多AR/VR投资也被离职员工吐槽是“乱花钱”…… 虽然万众期盼的苹果提出一个新概念——混合现实,押注“空间计算”。但实际上,苹果仍承受了不小的压力,因为苹果不仅仅是想要推出一个新产品,更希望打造一个新的终端标杆,开启一个引领性的消费电子新时代。 苹果在消费电子行业的地位一时难以撼动,但Vision Pro的创新不是颠覆性的,只不过是以更成熟的产品化、工程化优势,形态和Oculus Quest类似,“徒手互动”背后的手势识别技术也曾在部分主流头显设备上试水。 对于消费者和从业者而言,不能高估苹果Vision Pro所带来的技术革命;而对于蓝思科技这样产业链端企业来说,显然,也不能低估苹果Vision Pro失败的可能性。 02 果链巨头的踌躇时刻: 逃离还是更坚定绑定苹果? 作为果链企业中的重要企业,蓝思科技也有“苹果依赖症”。 这一点从创始人的发家经历就能看出:从一个从打工妹到中国女首富,周群飞的故事堪称逆袭。 早年,中学辍学在主营手表玻璃的澳亚光学玻璃制品厂打工,后与家人开启了手表玻璃行业的创业之路,机缘巧合之下,周群飞接下了TCL手机订单,然后业务版图逐渐扩大,打入摩托罗拉供应商体系,再到位初代iPhone供货,与苹果搭上了线。 成为“果链”的一员后,蓝思科技走上了狂飙之路。 2014年,成为全球最大的触控功能玻璃面板生产商,占据全球一半以上市场份额。 2015年,创业板上市,市值一度超过千亿,周群飞一举成为当年的中国女首富,蓝思科技此时从苹果供应商的幕后走到了台前,站在了聚光灯下。 随着与苹果合作的加深,蓝思科技与苹果的“捆绑”也越来越紧。 2017年至2020年,苹果订单在蓝思科技营收占比维持在50%左右,到2021年这一比例达到66%,2022年更是超过70%。 在外界看来,成为与苹果深度捆绑的一员,也意味着越来越被动的姿态,以及“更多鸡蛋放在同一个篮子里”的隐患。 但这一颇具上帝视角的论断,既低估了其对大客户的依赖,也忽略果链的复杂性。 以另一家果链企业——立讯精密为例,为了更好的服务好苹果,上市以来,立讯精密接连收购了昆山联涛电子、苏州美特、江苏玮创、昆山玮新和高伟电子等企业,切入了苹果iPad连接线供应链、苹果声学器件领域、苹果手机的组装业务和摄像头模组业务等。 这点上,蓝思科技也如出一辙。 近年来,蓝思科技在深耕手机盖板玻璃业务的同时,也在不断拓展金属、蓝宝石等多种材料的外观件、结构件,并积极布局下游的组装业务。 其中,2020年,蓝思科技耗资94亿收购了智能手机金属机壳厂商可胜科技与可利科技,由此获得了金属结构件供应能力。这两家公司主要为苹果产品代工的金属中框业务,也就是为iPhone、MacBook等产品做金属外壳等。 现在来看,“逃离苹果”,或者说鸡蛋不放在同一个篮子里,成为了外界评判果链企业未来成长性的一个重要指标。 事实上,没有人比果链企业更了解自身隐忧所在——价值感低、议价权缺失、受制于产品或政策变化、业绩增长缺乏支撑力。 这极其考验一家公司的远见和魄力。 所以在未有明确方向之前,宁可与苹果绑的更深,也不会迈出冒险的一步,哪怕是一小步。这也几乎是所有果链企业身上的通病。 03 新能源车和光伏有可能是果链的解药吗? 另一个比较有意思的现象是,或为了摆脱苹果,又或是寻找下一个苹果,“果链”巨头们近年来也纷纷开启了多元化的转型。 和苹果绑定最深的立讯精密,早年间就在汽车领域布局业务,在2021年明确提出了“三个五年”的战略,最终目标是在第三个五年内成为全球零部件Tier1领导厂商。 歌尔股份从2012年开始布局VR为代表的智能硬件业务,先后成为索尼旗下PSVR、Meta旗下Oculus和字节旗下Pico的重要供应商; 前果链企业欧菲光进军新能源汽车影像模组领域,领益智造则在电子及通讯业务外选择发力汽车和光伏赛道,2021年以来先后投资数十亿元于新能源汽车领域的多个项目。 蓝思科技也不例外,但显然走的更远一些。 早在2015年,蓝思科技就开始布局新能源汽车领域。2021年底,蓝思科技智能汽车组件与电子信息综合研发生产基地项目落地上海临港新片区,成为上海临港以汽车电子为主要发展方向的重大项目。同时,蓝思科技位于黄花园区的车载募投项目也在2022年底建设完成。 蓝思科技在汽车电子领域的产品主要有车载触控显示面板、新型B柱、新型汽车玻璃、充电桩等。 与此同时,2021年11月,蓝思科技斥资10亿设立了全资子公司湖南蓝思新能源有限公司,主要从事光伏玻璃产品、光伏设备及元器件、光伏发电项目等业务。去年4月又成立了湖南蓝晶光伏科技有限公司,主要生产光伏电池。 客观而言,无论是新能源车还是光伏,两者都是充满前景的赛道。 一方面,经过几十年的发展,在智能电动汽车方面积累了先发优势,无论是产品、技术还是用户体验,中国的高端智能电动汽车品牌对于海外的豪华品牌已经形成了超越,这种领先优势在全球汽车产业电动化和智能化趋势的推动下也越发明显。 另一方面,近年来,我国光伏产业发展迅猛,高原、沙漠甚至是海上,都能看到光伏电池板的身影。核心技术的突破,也让中国的光伏产品走向了更大的市场。 在庞大的市场需求背后,汽车玻璃和光伏玻璃都有可能为蓝思科技打开新的成长空间。但要说是蓝思科技摆脱“苹果依赖症”的解药,那可能还为时过早。 就比如光伏玻璃的门槛极高,为了保证高透光率,玻璃含铁量要低于0.015%,普通玻璃的这一数值通常在0.2%以上,同时,光伏玻璃还要耐腐蚀、耐高温、抗辐射,光伏玻璃的制作难度可想而知。 也正是因为如此,信义光能和福莱特这两个光伏玻璃龙头,凭借着技术壁垒(接近80%的良率)和极强的成本控制能力(30%左右的毛利率),携手占据了超过60%的市场份额。 果链企业背后有一个“链主”——苹果,它在带着、推动着整个供应链往前跑。但换道之后的新能源车和光伏领域早已经巨头林立,更是不乏创新力十足的供应链代工企业。 在一个行业的上游“躺赢”久了蓝思科技能否实现突破,其实难度不小。 立讯精密董事长兼总经理王来春曾给企业未来做了一个定义——立志做一个“摆渡人”,而不是“淘金人”。在她看来,淘金人的收成很大部分取决于运气,而摆渡人的收成完全取决于自己有多勤奋。 但在一号公司看来,果链企业恰恰是要跳脱出做勤奋的“摆渡人”的思想桎梏,争做有远见能找到金子的“淘金者”,有时候选择比努力更重要。
ChatGPT大范围出现幻觉;传谷歌视频模型负责人加入字节;OpenAI工程师曝工作时间表丨AIGC大事日报
1、OpenAI工程师曝工作时间表 2、OpenAI开通TikTok 5天涨粉10万 3、OpenAI联创离职后推出分词器公开课 4、Sora带火一年前论文 DiT连登热榜 5、微软高管称Sora会整合至Copilot 6、ChatGPT大范围“胡言乱语” 7、传谷歌视频大模型VideoPoet负责人加入TikTok 8、Adobe为PDF阅读软件推出对话式AI功能 9、Anthropic一年内融资73亿美元 10、浪潮信息发布智能AI助手YuanChat 11、SuperCLUE代码能力测评基准发布 12、10家央企签订倡议书 向社会开放AI应用场景 13、美国将成立特别工作组推动AI立法 14、报告称2027年印度AI市场规模将达170亿美元 1、OpenAI工程师曝工作时间表 今日,OpenAI研究员Jason Wei在社交平台X上分享了自己工作的一天:9点起床,10点开会,6点吃完饭,7点回家后继续写代码、做实验,直到凌晨1点15就寝。 Meta FAIR研究院研究员、高级经理田渊栋对此评价:都说国外没有996,其实真正可怕的是自我驱动的卷。 2、OpenAI开通TikTok 5天涨粉10万 OpenAI近日开通了社交平台TikTok官方账号,专门发布由Sora生成的视频,在5天内涨粉10万+,截至目前共发布20个视频,获得52.3万赞。 3、OpenAI联创离职后推出分词器公开课 今日,于上周离职的OpenAI联合创始人安德烈·卡帕蒂(Andrej Karpathy)发布了新的AI讲座,时长2小时13分,手把手教学如何构建GPT Tokenizer(分词器)。 课程地址: https://www.youtube.com/watch?v=zduSFxRajkE 4、Sora带火一年前论文 DiT连登热榜 近日OpenAI文生视频模型Sora爆火,其研发负责人之一比尔·皮布尔斯(Bill Peebles)与纽约大学助理教授谢赛宁在2022年12月发表的DiT(扩散 Transformer)论文也收获大量关注。该论文被认为是Sora背后的重要技术基础之一,其项目出现在AI论文网站PapersWithCode和开源社区GitHub的趋势榜单上,星标数量每日数百增长,总量均已超过3000。 5、微软高管称Sora会整合至Copilot 昨日,微软广告和网络服务部门CEO米哈伊尔·帕拉欣(Mikhail Parakhin)在社交平台X上回复网友评论,称OpenAI的文生视频模型Sora最终会与微软的聊天机器人Copilot整合,但需要一定的时间。 6、ChatGPT大范围“胡言乱语” 据社交平台X网友@seanw_m今日发文,ChatGPT最近开始胡言乱语,在社区内出现大量相关反馈,如突然开始说西班牙语、威胁用户、疯狂重复一句话等。 太平洋时间20日下午4点(北京时间今早8点)左右,OpenAI更新状态称已确认问题并正在进行补救。 7、传谷歌视频大模型VideoPoet负责人加入TikTok 据甲子光年今日报道,谷歌高级科学家、卡内基梅隆大学(CMU)计算机学院兼职教授蒋路已经加入TikTok。据悉,蒋路是谷歌视频大模型VideoPoet项目负责人,该模型于2023年12月推出。蒋路于2017年毕业后加入谷歌,是谷歌云AI的创始成员,也是李佳博士和李飞飞博士首次聘请的研究员。蒋路的研究曾被应用到谷歌多个产品,包括YouTube、云服务、云AutoML、广告、Waymo和翻译服务等。 8、Adobe为PDF阅读软件推出对话式AI功能 当地时间20日,Adobe为旗下PDF阅读软件Reader及Acrobat推出AI助手测试版,提供对话式AI功能,可从长文档中快速生成摘要和见解、回答问题并格式化信息以在电子邮件、报告和演示文稿中共享。 9、Anthropic一年内融资73亿美元 据《纽约时报》今日报道,Anthropic成为AI领域最热门的创企之一,该公司在过去一年中筹集了73亿美元,投资者包括谷歌、亚马逊、Salesforce等。除了融资速度快、规模大以外,它还采取了不同寻常的融资方式。在其中一项交易中,Anthropic同意使用投资者的芯片和云服务,这意味着它筹集的部分资金将被重新注入投资者手中。知情人士透露,该公司去年的月收入约为800万美元,今年预计增长8倍左右。 10、浪潮信息发布智能AI助手YuanChat 据浪潮服务器微信公众号发文,昨日,基于Yuan2.0-2B模型的智能AI助手YuanChat发布,其可以在Windows电脑上本地化部署。据介绍,YuanChat是专为源2.0大模型设计的客户端应用,集成了模型推理服务和聊天交互界面,具备代码生成、代码解析、数学计算、逻辑推理、知识问答、文案创作等能力。 11、SuperCLUE代码能力测评基准发布 今日,中文语言理解测评基准SuperCLUE发布了针对中文大模型代码生成能力的测评集和基准SuperCLUE-Code3。据介绍,这是HumanEval的中文升级版,具备中文原生环境测试、全面的任务类型、多级难度评估等特点。在此次测评中,GPT-4-0125-preview国际大模型表现突出,所有模型在初级难度得分上的表现普遍不错,国内小模型在中等难度上有潜力,高级难度的得分在各模型间表现出较大差异,此外部分国际模型中文代码能力表现不足,仍有改进空间。 12、10家央企签订倡议书 向社会开放AI应用场景 据国务院国资委发文,2月19日,国务院国资委召开中央企业AI专题推进会。会议强调,中央企业要把发展AI放在全局工作中统筹谋划,夯实发展基础底座,加快建设一批智能算力中心,进一步深化开放合作,更好发挥跨央企协同创新平台作用。开展AI+专项行动,强化需求牵引,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态。会上,10家中央企业签订倡议书,表示将主动向社会开放AI应用场景。 13、美国将成立特别工作组推动AI立法 据路透社报道,美国众议院领导人于当地时间周二称,他们正在组建一个特别工作组,讨论AI相关立法,该工作组的报告将详细说明“保护消费者、促进AI持续投资和创新所需的监管标准和国会行动”。 14、报告称2027年印度AI市场规模将达170亿美元 据路透社报道,IT行业机构Nasscom和咨询公司BCG周二援引一份研究印度AI技术的联合报告称,到2027年,印度AI市场规模预计达到170亿美元,在2024年至2027年间的年增长率为25%-35%。报告称,这一增长主要得益于企业技术支出的增加、该国不断扩大的AI人才库以及AI投资的增加。
为了获得流量,外国人开始把真视频伪装成“Sora生成”
要说这段时间,Sora 的热度有多离谱。 我觉得丝毫不亚于 ChatGPT 刚面世那会。 前脚刚出,后脚我们就回到了去年那个 “ 日日工业革命、夜夜文艺复兴 ” 的场景,视频全网疯传,人人担心饭碗。 毕竟只要给 Sara 几句提示词,它就能生成一段肉眼难以分辨真假的视频。 即便是图 2 的翻车视频,画面效果也是足以把其他 AI 视频前吊起来打的水平。 但,Sora 并未公测。 放眼整个太阳系,能用上 Sora 的,只有 OpenAI 内部员工、授权的艺术家、红队测试人员。 红队测试是为了评估 AI 在关键领域的危害,只有这些领域里有资质的人才可能获得测试资格。 如果你有幸获得了资格,别说是女神了,连借你二十块至今不还的小学同桌,都想偷偷过来一睹芳容。 所以目前来说,我们能看到的所有 Sora 视频,都是 OpenAI 官方人员发出的。 他们发的 Sora 帖子往往有几个明显特征:十几秒的视频,一段提示词,一句 “ 由 Sora 生成 ” 。 因为 Sora 过于顶流,这些视频一经发出,都能在互联网平台掀起一阵旋风。播放量百万起步,把我们差评编辑部羡慕哭。 但于此同时,社交媒体的另一端也掀起了一股 “ Sora 视频浪潮 ” 。 可能是为了巨大的流量曝光,可能是为了好玩,很多网友开始放上一段真实视频,说是由 Sora 生成。 接着,视频就爆了。 为了让一切更加真实,他们还会煞有介事地配上一段AI 提示词,就跟你在数学暑假作业上乱填一些公式一样。 随着这类视频被疯狂转发,播放量动辄百万级别,除了普通网友,各路大 V 也都加入进来整活。 很快噢,这个梗就风靡了起来。现在即便是正常分享一个视频,大家也要用上这个句式。 经过观察,我发现这些伪装成 Sora 生成的视频里,出现次数最多,并且难以辨别真假的是印度电影。 毕竟三哥拍起来电影来,甭管是逻辑还是特效,很像 AI 出现幻觉生成的。 我们先看下印度神剧里的镜头是怎样的。 物理学不存在了。 特效不花钱就这么用的。 再来看 Sora 翻车视频,也同样的物理学不存在了。 还有这个篮球入框时烧起来是怎么回事,特效也不要钱了,致敬《 篮球火 》是吧。 所以用印度电影来佯装 Sora 视频,往往会更有迷惑性。 比如这个用手直接把人拖下来,不符合物理规则的操作,就和 Sora 如出一辙。 这种变成巨人的违和特效,也有一股 AI 生成的味道。 下面这个极速交换镜头,男女主互相掌掴后十秒和好,也像是 AI 才能生成的剧情。 最骚的是下面这个视频。女主上穿网球服,下穿瑜伽裤,在高尔夫球场,用篮球的玩法在玩足球。 能在十几秒里展现出这么多混乱元素的,貌似也只有AI 生成的了。。。 该说不说,这些印度电影乍一看确实是像 Sora 翻车视频。 甚至很多人真的误以为,这就是 Sora 生成的。 你别不信。 刚才那个印度警察徒手把人从车里拽下来的视频,已经出现了背景信息提示,防止误导更多的人。 在博主 Nora 发的视频评论区,也有不少人没发现这就是在玩梗。。。 而这两天,网上又开始流传一个威尔史密斯再度吃面的视频。 其实这是他本人整活拍的视频,但仅仅因为一句 “ AI Video now ” ,很多人以为下面视频是用 Sora 生成的。 出现这种情况,我并不意外,因为AI 发展速度太快了。 如果你在一个星期前决定不刷手机,那么此时的你,就会感觉自己在深山老林蹲了十几年。 那些几分钟就能生成的有运镜、有水面反射、有光影效果、画面轻松碾压电影的 AI 视频,会给你的认知带来很大的冲击。 一时间,很多人都没法判断或者没有找到技巧去判断,一个视频到底是真的还是假的。 所以未来某一天, Sora 公测了,真真假假的视频混在网络里,我们真的要迎来一次新挑战了。 这个挑战是好是坏,谁也不敢说。 毋庸置疑,网络上会有更多难以分辨真假的谣言。但于此同时,也会有越来越多的人,开始对任何事情抱着审慎的态度去对待了。 撰文:刺猬 编辑:莽山烙铁头 封面:焕妍
开年抢跑AI赛道,Sora“截胡”字节
最近,国内的大公司在AI赛道上被Sora抢占了风头。 在2024年2月初,此前在大模型领域保持低调的字节跳动终于有了新动作,上线了“Coze扣子”AI Bot开发平台,据Coze官方介绍,Coze可以让用户快速创建各种由AI提供支持的问答Bot,且可以将Bot发布到各种应用程序,从而促进与这些应用程序上的用户的动态交互。 简单来说,Coze的特点是,可以让用户创建个人定制版Bot,实现“0代码”开发。 这倒也并非创新之举。早在2023年末,OpenAI发布的GPTs也是旨在“每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。”但对于字节跳动而言,这多少算个大动作,毕竟此前它在大模型领域沉寂已久。 不过,还未等Coze掀起太大的水花,OpenAI发布的Sora直接“王炸”,抢走风头,引发热议。 定制Chatbot,从求职到小红书文案 “Coze是一个一站式AI机器人开发平台。” 据Coze官网,为了促进和简化AI机器人的开发过程,Coze目前集成了60多个插件,增强了Bot在信息检索、旅行协助、生产力、图像理解等领域的功能,“你可以直接将这些插件添加到Bot中,丰富Bot能力。例如使用新闻插件,打造一个可以播报最新时事新闻的AI新闻播音员。”用户也可以通过指定现有API的输入和输出来快速创建自定义插件。 此外,Coze支持为Bot创建定时任务。Coze官网介绍称,用户无需编写任何复杂的代码,只需一个简单的描述,Bot就可以按需完成工作。例如,可以配置为:每天早上 9:00 向您发送个性化新闻。提醒您每天早上7:00查看今天的天气预报和日程。 锌刻度体验Coze时发现,目前Coze的Bot商店内已有各种场景的预置Bot,其中包括女生头像生成器、小红书文案输出大师、求职助手等,而根据官网介绍,选择预生成Bot后,用户会被引导到该Bot的配置页面。在这里,你可以查看这个Bot的配置信息,与这个Bot进行交互,体验它提供的能力。 经体验,锌刻度留意到,目前的预置Bot多搭载云雀大模型。其中,“求职助手”可以提供求职建议、推荐工作机会。 Coze Bot商店内的“求职助手”界面 而部分Bot或许还有一定完善和提升空间。比如,在体验“小红书文案输出大师”时,锌刻度分别提出“帮我列出送妈妈的礼物清单”和“帮我列出送奶奶的礼物清单”的需求,但得到的回答基本相同。这一问题在“春联大王”这一Bot也出现,据钛媒体,要求bot帮助写一个关于雪的春联,经过两次追加不一样的提示词(Prompt),最后生成的两副春联竟是一模一样的,并未如预期出现不同的回答。 值得一提的是,除了可以体验这些预置Bot,用户也可复制一个预置的Bot,并根据你的具体需求对其进行修改。 至于Coze背后的开发团队,据界面新闻报道,Coze由2023年11月字节跳动成立的AI创新业务部门Flow研发而成的,该部门业务主要聚焦于AI应用层,由字节跳动技术副总裁洪定坤担任技术负责人,原今日头条CEO朱文佳担任字节大模型团队业务负责人。 不过,Coze官网链接的企业为“北京春田知韵科技有限公司”,天眼查显示,该公司成立于2023年7月,由北京抖音信息服务有限公司100%持股。 字节猛追进度 在发布Coze之前,字节跳动在AI赛道上一度“掉队”。 在字节跳动2024年全员会上,字节跳动CEO梁汝波表示,字节跳动存在低效和迟钝现象,并直言,“字节对于大模型领域的反应过于迟钝,直到2023年中才出现跟GPT相关的讨论,而GPT-1在2018年就发布了,且业内做得比较好的大模型创业公司也基本在2018-2021年间创立。” 回顾此前,直到去年8月,字节跳动基于云雀大模型开发的AI聊天机器人“豆包”才开始公测,面向C端市场发力AI应用。与此同时,还在国外发布了基于CPT模型训练的Cici,后者目前已经在超过30个国家和地区上线。 字节跳动“豆包” 与此同时,国内大公司纷纷在这个赛道发力:从2023年的3月到9月,从百度的大语言模型“文心一言”、360的智脑大模型,到阿里巴巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头“BAT”悉数下场。 手机厂商也未缺席,华为、小米、OPPO、vivo、荣耀都先后在赛道亮相;五科研院所和初创企业不甘示弱,北京智源人工智能研究院发布了“悟道”大模型,上海人工智能实验室推出了“书生”大模型,鹏城实验室研发了“鹏城·脑海”大模型;京东、携程、好未来等也相继召开发布会;甚至连移动、联通、电信三大运营商,长虹等家电生产企业也欲分一杯羹…… 更不用提诸多风云人物对此的讨论不断。其中,据财经网,华为创始人任正非3月中旬参加华为 “难题揭榜火花奖” 颁奖座谈会时称,华为会做底层算力平台:“未来AI大模型会风起云涌,不只微软一家。ChatGPT把计算、管道流量撑大,华为的产品就有了机会。”同月月底,腾讯总裁刘炽平在财报电话会上说,生成式人工智能可成为腾讯已有业务,如社交、游戏的 “倍增器”,也可帮助开拓数字助手、搜索等新增长线。此外,《张朝阳的物理课》直播结束后会自动生成字幕:“‘社交互动’‘算法推荐以及AIGC’‘自媒体’,是这些年来互联网的三个线索。” 数据则更为直观,据“趣解商业”,2023年5月的中关村论坛上,专家口中中国“10亿级参数规模以上”大模型的发布数量尚为79个;而《2023中国新一代人工智能科技产业发展报告》显示,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,国内大模型总数达238个;而据GitHub的统计数据,到2023年底国内已经发布的大语言模型接近300个。 所以,当“百模大战”如火如荼时,在2024年初发布Coze的字节跳动,与其说是抢跑,可能更精确的说法是“奋起直追”。 OpenAI抢占风头,字节又该如何应对? 字节跳动或许本想着在2024年初抢先崭露头角,却不料OpenAI再放“狠招”,直接“王炸”,抢占了风头。就在Coze上线后不久,Sora横空出世。 2月16日,OpenAI推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。据介绍,Sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。Sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。此外,Sora可以一次性生成整个视频,也可以扩展生成的视频,使其 Sora技术报告 这意味着,OpenAI已然在人工智能赛道上迈入下半场,国内外大模型的差距更明显了。当OpenAI官方公布长达60秒未经修改的AI视频,国内也有AI团队紧急上线相关“文字生成视频”大模型,但与国外主流AI视频模型能力相仿,均暂时无法超越Sora的水平。 不过,当OpenAI已经开始深耕文生视频的大模型,字节跳动却似乎如梦初醒,刚刚开始追赶对话问答大模型的进度。 日前虽有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。但对此,字节跳动相关人士回应新浪科技称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。 事实上,字节跳动的Coze也多少有些亦步亦趋,早在Coze发布之前,其实在2023年11月的OpenAI首届开发者大会上,GPTs就已经发布,而根据当时的介绍,GPTs无需编程技巧,可以让用户用自己的自然语言来创建“个人版ChatGPT”,实现全程“0代码”开发。 用OpenAI CEO奥尔特曼的话说,每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。那时候,外界讨论,GPTs搭配GPT Store,很可能会在AI应用生态中诞生下一个苹果。 彼时,华西证券研报曾评价,类比App Store,GPT Store将成为OpenAI生态重要一环。 按照研报的说法,对初创公司来说,GPTs本身就是一个值得挖掘的AI应用项目;而对于现有的互联网应用来说,GPT Store是一个优质的流量入口,GPTs要实现复杂功能普遍需调用外部API,若现有App能充分利用GPTs的高智能、高灵活性,并与自身应用进行结合,有望为现有互联网生态注入新鲜血液,“AI+一切”已近在咫尺。 显然,Coze的设定与此相同。 只不过,当字节跳动这次试图紧跟OpenAI脚步时,还是稍有差距。可以预想的是,国内或许很快也将掀起文生视频大模型的新浪潮,而字节跳动又该如何应对呢?

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。