EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
我玩了一盘赌命的俄罗斯轮盘,并且赢了一箱子美金
这天醒来的时候,我发现自己在一个陌生的撤硕里。 我是谁?我在哪?我要去干嘛? 就在这种迷糊的状态下,我来到了厕所对面的房间里,一进门就看到个长得歪七竖八的哥们站我对面,丢出一张合同让我签字。 合同上大概内容是我要和对面这位大头哥玩一场类似 “ 俄罗斯轮盘 ” 的赌命决斗,赢了我就可以拿钱,而且是 dollar 。 游戏的规则是每一轮会给出随机数量的子弹,有实弹也有空包弹,按照随机的顺序装填进霰弹枪后,轮流发射,看谁能活到最后。 我寻思我现在一无所有,出去了也是给人家打工拿命换钱,不如搏一手,更何况我从小到大吃了那么多东西,唯独没吃过枪子儿,怪馋的。 接下来就进入了正式的赌命游戏环节。 第一次玩这种游戏,说不紧张那是不可能的,但是三分之二的概率,我总觉得第一枪肯定没子弹,于是我决定先喂自己一发。 但这第二次中弹概率可就是 50% 了,我寻思我运气应该不是太差,那么。。。我赌你的枪里没有子弹! 砰一声巨响,我当时就两眼一黑趴下了,我差点以为这就直接 GG 了。 你别说,这地方虽然看着破旧,但是医疗技术属实先进,哪怕一不留神被喷子爆了头,一个电疗也能给我救回来,只不过每次都要消耗一定的电量。 到最后,谁的电量先用完,谁就彻底嗝屁了。 结结实实吃了一发枪子的我也不敢大意了,在经过一番激烈的厮杀后,我都快被电熟了,总算是技高一筹,把大头哥一枪打爆。 最终,我赢下了一箱子 dollar 和一辆破二手车,走上了人生巅峰。 上面这个游戏就是最近在各个视频平台都很火的《 Buckshot Roulette 》,不管是在抖音还是 B 站都有非常高的播放量。 这个游戏的灵感来源于真实存在的赌命游戏 “ 俄罗斯轮盘 ” ,很多电影里都出现过,你时不时就能看到某个主角拿起个左轮就往自己脑袋上来一枪来凸显戏剧性。 不过,《 Buckshot Roulette 》里游戏的规则是有一定的改变的,这也让它成为了一个略微带点策略而不是纯看运气的游戏。 一般俄罗斯轮盘的规则,是随机装入子弹后每个人轮流朝自己开一枪,直到有人主动退出或者中枪倒下剩最后一人。 《 Buckshot Roulette 》中,我们可以选择朝自己或者朝对面开枪,朝对面开枪的话,不管是不是空包弹,下一轮发射权都将转交给对面。 但如果朝自己开枪,并且这一发刚好是空包弹,则可以获得额外的一次发射机会。 而且这还只是第一轮的规则而已。 到了第二轮游戏后,双方的电量会增加到四格,算下来可以硬挨 4 次子弹,如果只是像第一轮那样打来打去会非常地。。。无聊。 于是游戏在这里增加了一个新的规则:每局游戏之前,双方可以从一个盲盒里拿两个道具,这些道具分别是锯子、放大镜、香烟、饮料和手铐。 这些道具的设计非常巧妙,可以说没有一个是废物。 比如放大镜,它的效果是可以在使用后看到枪的下一发子弹是什么。 锯子则是可以将霰弹枪的枪管锯短,增加威力,一次打两格 “ 血量 ” ,当然,如果是空包弹就没伤害。 这俩道具就可以形成一个丝滑小连招:先拿放大镜看子弹,如果是红的直接就上锯子,搂他! 其他的道具也都很有用处,甚至可以成为我们绝地翻盘的关键。 手铐可以限制对面一回合,也就是无论如何自己都有两次开枪机会;香烟可以回一格电量;饮料则是可以跳过当前的子弹,直接使用下一颗。 由于每一局开始前的子弹数量是固定的,在游戏中期,如果你算准了子弹数量,那么就可以轻松避免伤害或者给对面造成伤害。 而到了第三轮,每局之前我们可以拿的道具增加到了 4 个,而双方则是会多出两格空心的续命用的电量。 如果一方被打掉四格电量,那么他的电量就会变成乱码,意味着这是他最后一格血。 这种情况下不管咋抽烟都是不会恢复电量的,只要一枪就可以解决,当然,他自己打自己也算。 根据我玩了几盘的经验来看,基本上任何一个有点游戏基础的玩家都可以在三局游戏内通关,难度是相当低的。 说实话,这个游戏的画面、建模很一般,但是它的道具设计确实蛮有意思的,让原本的运气游戏变成了一个带策略的游戏。 当然,这个游戏的缺点也很明显,就是对面大头恶魔的 AI 有时候挺智障的,动不动就给自己来一枪。 好端端一个紧张刺激的搏命游戏,被大头哥这么一整就很容易打破气氛,给爷逗笑了。 如果各位差友对这个游戏有兴趣的话,可以去独立游戏网站 https : //itch.io/ 下载,只要付 1.2 美元就能买到,也算是支持一下作者的创意了。 撰文:小发 编辑:莽山烙铁头 封面:焕妍
用了几天Vision Pro,我们成功让它“运行”了Windows
前两天我们不是整了几天苹果的新品——空间计算设备 Vision Pro 吗,并且拜托了驻美前线记者阿卡帮我们深度体验了一波新设备。 具体的详细测评,大家可以去哔哩哔哩 @ 差评硬件部观看完整体验,相信看完这个视频后,你一定会对 Vision Pro 有一个全面的了解。 但是,这对于我们这帮天天折腾数码的老玩家来说,只是体验这款几万块的新品显然不够,编辑部这帮人肯定是要开始整活的。 而在众多奇思妙想中,托尼最关心的就是:如此强大的混合显示头戴设备,只能和苹果设备互动有点太浪费了。。。 那么有没有一种可能,我们可以让 Vision Pro 突破生态限制,让它成为 Windows 平台的头显设备呢? 一不做二不休,我们立马进行了一个跨国跨时区沟通,开始整起了活儿。 先给大家一个祖传省流结论:答案是可以,但是比较折腾,而且不太好用。 这时聪明的差友肯定已经冒出了这样的疑问:果子是出了名的生态封闭,那该怎么才能让 Vision Pro 显示 Windows 上面的画面捏? 托尼在这里给大家进行一波简单的推理,首先已知, Vision Pro 的系统 VisionOS 是 iPadOS 的魔改版,商店里也可以搜索到 iPad 版本的 App 。 到这里,如果你是一个喜欢折腾的数码爱好者,应该已经猜到了,那就是Moonlight 。 至于这个 Moonlight 是个什么来头,还要从我们熟悉的显卡巨头英伟达说起。。。 英伟达有一个叫做 GameStream 的串流协议,比如本身运行游戏的是你的电脑和显卡,但通过串流就可以把画面传输到客厅电视、轻薄笔记本电脑、甚至是平板电脑上等等。 但英伟达这里吧,就有点小心眼儿,这玩儿只给自家的神盾 SHIELD 系列安卓掌机、平板以及电视盒子内置了 GameStream 的串流 App 用,其他安卓和 iPhone 用户们就只能干瞪眼。。。 于是就有个第三方爱好者团队站出来破解了老黄的 GameStream 串流协议,并且在这个基础上制作了一款名叫 Moonlight 的串流 App 。 只要你电脑上装了 NVIDIA 的驱动和软件,它就能扫描到并且激活和电脑的串流,可以说是拯救了一大批串流玩家。 这下问题迎刃而解,即使是在安卓手机或者苹果的设备,现在只要使用 Moonlight 也可以串流玩耍电脑上面的游戏了。 抛开实际游玩的画质、延迟和流畅度等情况,这确实是一个可以远程游玩 Windows 上面的游戏的方法之一。 到了这里,步骤其实就清晰了许多,既然 VisionOS 是基于 iPadOS 的魔改,那我们。。。 在 Vision Pro 上面下载一个 Moonlight ,是不是就可以把苹果的头显变成 Windows 的扩展屏幕了? 嗯。。。有何不可? 这里已经可以看到 Moonlight 扫描完了电脑里的游戏,那咱们就先拿打游戏来简单测试一下效果。 先试试串流 Epic 上面的《 心灵杀手 2 》,怎么说呢,玩是能玩,但是画面上下这两个大黑边属实是绷不住了。。。 其实这个倒也合理,毕竟 iPad 分辨率是 4 : 3 ,所以玩 PC 游戏肯定会有大黑边,但这个倒不太影响游玩,顶多看着有点膈应人。 真正让游戏体验打折扣的,是顿卡。。。 而且经过了一番排查,很不幸,卡顿的罪魁祸首应该是 Vision Pro 本身。。。 因为 WiFi 6E 的网络环境没问题,阿卡自己的电脑是 4090 显卡,所以也不会有性能瓶颈。 问题可能出在 Vision Pro 本身的网络策略上。阿卡家的 WiFi 是双频合一,也就是 2.4G 和 5G 频率共用一个 WiFi 名。 但是 Vision Pro 目前的 WiFi 切换逻辑貌似有点问题,有一定概率切到 2.4G 之后就不回去了。。。 阿卡后来跟我说,他通过开关 WiFi 把 Vision Pro 卡回 5G 之后,画面瞬间就流畅了。。。 网络环境对于 Vision Pro 来说还是挺重要的,希望果果能赶紧把这个 Bug 修了吧。 说回串流这事儿,这里差友可能会想到直接用 Steam 官方的串流软件 Steam Link 试试,不仅能玩游戏,而且 A 卡 I 卡也能用。 这个我们也试了,不得不说官方出的软件体验确实好不少,菜单界面都是专门的大屏幕模式。 不过话又说回来,其实 Moonlight 也不是只能给英伟达显卡用,我们用一些生活小妙招,就可以让 AMD 和英特尔显卡也能做到类似的效果。 这是因为 Moonlight 团队在研发完 Moonlight 软件之后,扭头就又开发了个名叫Sunshine 的服务器端程序,可以替代英伟达原本的串流服务器。 不仅如此,他们还贴心地内置了 AMD 和 Intel 版本的编解码器。。。 新世纪赛博菩萨也不过如此吧,我哭死。 而且这里我们可以利用 Moonlight 搭配 Sunshine 的桌面豁免选项,拿过来通过 Vision Pro 来实现桌面投屏。 也就是大家期待已久的,用 Vision Pro 投屏 Windows ! 于是你就可以看到一个非常 NTR 的情节,戴着 Vision Pro 操作 Windows 打开 Word 文档办公。。。 但是整个体验算不上特别好,比如一开始鼠标失灵,把屏幕分辨率倍数放大到 175% 之后才有反应,而且画面上下依旧有两个大黑边。。。 当然如果你不嫌折腾,还可以通过 HDMI 诱骗器搭配显示器,实现双屏投屏。。。 要知道, Vision Pro 就连自家 MacBook 也只能投一个屏。。。 不过 HDMI 诱骗器稍微有点儿不优雅,所以我也帮你们看了看 Duet 等等投屏软件啥的。 但它们一个是要钱,另一个是好像还不如 Moonlight 流畅。。。 到这里,似乎该讲的都讲清楚了,但是!我们还有最后一个彩蛋,请看: 别问,问就是科技与狠活。 当然这里要叠个甲,我们只是为了测试,正经玩游戏还是会用 Switch 的,没有挑衅东半球最强法务部的意思。。。 最后的最后总结一下,想用 Vision Pro 使用 Windows 是可行的,而且算不上什么新鲜玩法,体验也还算符合预期,就是 Vision Pro 这个 WiFi 的问题整得我们有点儿恶心。。。 想玩的,可以等等过段时间再试试。 与其有这功夫,不如直接游玩刚上架 VisionOS 的《 崩坏:星穹铁道 》,起码不用折腾就能直接玩。 不多说了,星铁,启动!
苹果正研发GitHub Copilot竞品:Xcode AI可帮开发者生成代码
原标题:苹果正研发GitHub Copilot竞品:Xcode AI可帮开发者转换、调试、生成代码 IT之家 2 月 16 日消息,根据彭博社报道,苹果公司正研发升级版 Xcode,其亮点在于整合多项 AI 功能,其中之一可以为开发者生成相关的代码。 报道称该人工智能工具将类似于微软的 GitHub Copilot,可以根据自然语言请求生成代码,并将代码从一种编程语言转换为另一种编程语言。 IT之家注:GitHub Copilot 是 GitHub 和 OpenAI 合作开发的一个人工智能工具,用户在使用 Visual Studio Code、Microsoft Visual Studio、Vim、Cursor 或 JetBrains 集成开发环境时可以通过 GitHub Copilot 自动补全代码。 Xcode AI 工具将能够预测和完成代码块,让开发者能够简化应用创建流程。苹果公司目前正在内部测试这一功能,并计划“今年年底前”向第三方软件开发商发布。 苹果公司还在测试人工智能生成的应用测试代码,并要求一些工程师在内部试用这些功能。 据彭博社报道,苹果软件主管克雷格-费德里吉(Craig Federighi)已要求员工为 iOS 18、iPadOS 18 和 macOS 15 创建尽可能多的新人工智能功能。 苹果计划推出“大量新的人工智能功能”,而 iOS 18 将被宣传为 iPhone 推出以来最大的更新之一。部分人工智能功能将出现在 macOS 上,但苹果计划“采取渐进的方式进行人工智能开发”,有些功能需要长达数年的开发。
美媒:太阳能电池板成本比美国低,中国是如何做到的?
参考消息网2月15日报道 美国《华尔街日报》网站2月13日以《美国能否打破中国对太阳能产业的掌控?》为题发表报道。报道称,太阳能电池板的制造过程漫长而复杂,中国在其中主导了每一个环节。 报道指出,中国之所以能在20年间建立起主导地位,部分原因是中国从电力到劳动力的成本都比美国或欧洲等地便宜得多。最近,中国大规模的太阳能制造业务已成为一种优势,吸引了人才、研究资金和供应商生态系统。 据报道,随着对可再生能源的需求激增,美国正试图建立自己的太阳能制造供应链,并为该计划提供大量补贴,但这一切几乎是从零开始。 2022年美国安装的太阳能电池板有四分之三以上由多晶硅制成。多晶硅的生产是太阳能发电设备生产过程中的重要环节,由于在提炼过程中需要达到的高温以及需要使用的昂贵设备,这也是最耗费能源和资金的环节之一。直到2005年左右,多晶硅的生产还是由美国、欧洲和日本公司主导。但随着中国在太阳能领域的大规模扩张和投资,情况发生了翻天覆地的变化。到2023年,大约91%的太阳能电池板所用的多晶硅都是中国生产的。 报道称,中国在太阳能领域的整个生产过程中都能实现成本控制。美国正试图在生产过程的各主要阶段提供大额激励,以缩小美中在太阳能发电设备生产方面的差距。 行业制造商表示,近年来通过通胀削减法案提供的补贴首次使在美国建厂在经济上变得可行。然而,并非供应链的所有环节都有资格获得支持。 与此同时,企业指出,由于通胀以及资金成本不断提升,再加上中国光伏产品价格的大幅下降,成本差距正再次拉大。 报道称,根据标普全球大宗商品公司的数据,总体来看,中国制造太阳能电池板的成本比美国低44%。 2023年11月24日,在淮北市烈山经济开发区一家光伏面板生产企业车间,工人在生产线上忙碌。(新华社)
中国驻多国使领馆举办春节招待会
  正值春节期间,我驻多国使领馆举办了春节招待会,当地华侨华人、各界人士共聚一堂,通过丰富多彩的活动,共同庆祝甲辰龙年的到来。   近日,中国驻俄罗斯使馆举行“温暖迎春·共庆中国年”旅俄中国同胞新春招待会。活动现场,中资机构儿童合唱团、华侨代表以及留俄学生带来歌曲和舞蹈等文艺演出。   春节期间,中国驻俄罗斯使馆还举行了2024年留俄学生春节联欢会暨招待会。   俄罗斯教育部副部长 格里博夫:我祝愿所有中国学生、所有在俄中国公民在新年里实现他们的愿望,祝愿他们身体健康。   中国驻德国使馆在柏林爱乐举办“欢乐春节”新春招待会。德国各界人士参与活动,并共同观看中央民族乐团“中国春节民族音乐会”。   近日,中国驻印度使馆举办“温暖迎春·共庆中国年”新春招待会。招待会上,来自中印两国的嘉宾携手同台献艺,节目精彩纷呈。   中国驻拉脱维亚使馆、拉脱维亚华侨华人联合会近日在拉脱维亚首都里加共同举办“温暖迎春·共庆中国年”旅拉中国同胞新春招待会。   此外,春节期间,我驻厄瓜多尔使馆、驻塞浦路斯使馆和我驻开普敦总领馆、驻曼彻斯特总领馆、驻孟买总领馆都举行了热闹非凡的春节招待会。招待会上,节目精彩纷呈,氛围热烈友好。
普京:俄即将研制出癌症疫苗
参考消息网2月15日报道 据路透社2月14日报道,俄罗斯总统普京今天说,俄罗斯科学家已接近研制出癌症疫苗,很快就可供患者使用。 普京在电视讲话中说:“我们已经非常接近研制出所谓的癌症疫苗和新一代免疫调节药物。” 他在莫斯科一个关于未来技术的论坛上发表了讲话。他又说:“我希望它们很快就能被有效地用作个体治疗方法。” 普京没有具体说明这种疫苗将预防哪种类型的癌症,也没有说明如何预防。 报道称,许多国家和企业正在研究癌症疫苗。 去年,英国政府与总部位于德国的百欧恩泰公司签署了一项协议,以启动提供“个性化癌症治疗手段”的临床试验,目标是到2030年惠及1万名患者。 莫德纳公司和默克公司这两家制药企业正在开发一种实验性癌症疫苗。一项中期研究显示,经过3年治疗,这种疫苗可以将黑色素瘤(一种致命的皮肤癌)的复发率或死亡率降低一半。 世界卫生组织的资料显示,目前有六种获得许可的针对人乳头状瘤病毒(HPV)的疫苗(HPV会导致包括宫颈癌在内的许多癌症),以及一些针对乙型肝炎病毒(HBV)的疫苗,HBV可能导致肝癌。 在新冠疫情期间,俄罗斯开发了自己的新冠疫苗“卫星-V”。 普京本人说,他曾接种“卫星”疫苗,这是为了向人们展示它的有效性和安全性。(编译/朱捷)
人均分红55万元?疑似华为员工吐槽:10年老员工才能拿的到
2月6日,华为内部发布了董秘1号文件,公布 2023 年年度分红方案:ESOP 每股分红 1.5 元。由于华为是 100% 由员工持有的民营企业。 华为目前总股本约为513亿股。根据截至 2022 年底,参与分红人数142315人估算,本次分红需要向员工支付513.9亿*1.5 = 770.85亿元。按照142315名员工计算,平均每人可获得接近55万元,可谓是羡煞旁人,该消息也引发了众多媒体的报道。 不过,近日,知乎上有疑似华为员工则对此发文吐槽称,“外面不懂的人到处吹,内部论坛上都骂惨了。” 该知乎网友称,随着2023年下半年Mate 60系列的大卖,以及利润率较高的nova系列新机的开售,员工对今年的分红数据有着极高的期待。但最终2023年每股分红只有1.5元,这也是近三年来的最低,比制裁后最艰苦的2021年每股分红1.58元还要低。 其次,华为内部收入差距非常大,人均36万股,55万元的分红数据没有意义。华为每个级别配股数量都有上限,员工首次配股的时间大概在入职三年左右,根据绩效配不同数量股票,一般一次2-6万股。入职不满三年的新员工,除非很优秀否则很难配股,身边大部分三年的员工都没有股票。要想拿到36万股均值的股票,基本上要18级(校招本硕13-15级,博士16级)了,很多17级老员工都没有30万股的股票。一般员工入职8年能升到17级,18级是个槛,要么专家、项目经理,要么领导了。假设员工入职三年首次配股,按每年配5万股计算,能拿到35万股基本上都要10年老员工了。也就是说公司干活的主力15-17级员工根本达不到这个均值,13-14级员工基本上0配股。更何况从前几年开始,为了降本增效,各个部门招都了大批外包,他们更没有股票。 另外,即使可以拿到股票,也不是免费授予,而是员工花了7.85元一股另加放弃年假买回来的。 具体内容可以移步知乎自行查看。 值得注意的是,在华为内部论坛——心声社区上,也有华为员工吐槽称,在华为工作10年了也没达到平均分红,我得反思了。”
马斯克多次评价OpenAI新模型:人类被AI增强就能创造最佳作品
原标题:马斯克多次评价 OpenAI 新模型:人类 gg 了 / 人类被 AI 增强就能创造最佳作品 IT之家 2 月 16 日消息,今天早些时候,OpenAI 发布了最新的视频生成模型 Sora,其能够根据用户输入的文本描述,生成一段视频内容。同时,OpenAI 还放出了数段演示视频,譬如摩登女郎在东京街头散步、长毛象行走在雪地里等等,IT之家已进行详细报道。 随后,埃隆・马斯克多次对 OpenAI 的新模型发表了评价。推特网友“贝夫・杰索斯”转发了一段 Sora 的演示视频,配文声称“gg Pixar”,马斯克今天下午便在这条推文下方表示,“gg humans”。 IT之家注:上文中的 Pixar 即皮克斯动画工作室,是迪士尼旗下电脑动画制片厂。gg 则是网络用语“good games”的缩写,多用于败方表示自己“输得心服口服”这一情境。 没过多久,又有一名网友 Grimes 谈到了 OpenAI 的新模型(未直呼其名,但话题指向影视行业):“…… 电影行业肯定会对这种技术作出严厉反应,希望法规不会失控。”“…… 与大多数类型 AI 创作不同,我认为生成式艺术不会抑制人类的精神。” 马斯克也对这条推文发表了回应:由人工智能增强的人类,将会在未来几年之内创作出最杰出的作品。 对此,有不少网友表示赞同,但也有网友担忧“AI 是否会拿起武器”。
59亿美元!又一起EDA领域的大并购!
继不久前EDA大厂Synopsys(新思科技)宣布以350亿美元收购另一家EDA大厂Ansys之后,近日,又一家EDA厂商Altium被瑞萨电子以约59亿美元收购。 2023年7月,瑞萨电子与Altium宣布合作开发PCB工具和云平台 瑞萨电子59亿美元收购Altium 2024年2月14日,瑞萨电子和全球电子自动化设计(EDA)厂商Altium Limited Systems (以下简称“Altium”)联合宣布,他们已签订计划实施协议(“SIA”),瑞萨电子将根据澳大利亚法律通过安排计划收购 Altium。根据交易条款,在满足多项条件的前提下,瑞萨电子将以每股 68.50 澳元的现金价格收购 Altium 的所有已发行股票,较Altium周三收盘价溢价34%,比 Altium 一个月成交量加权平均价溢价约 39%,相当于股权总价值约 91 亿澳元(约合 8879 亿日元、59亿美元)。 瑞萨电子表示,此次收购使两家行业领导者能够联手建立一个集成的开放式电子系统设计和生命周期管理平台,从而实现跨组件、子系统和系统级设计的协作。该交易与瑞萨的数字化战略高度一致,代表着该公司在为电子系统设计师带来增强的用户体验和系统级创新方面迈出的重要一步。 随着技术的进步,电子系统的设计和集成变得越来越复杂。当前的电子系统设计流程是一个复杂的迭代过程,涉及多个利益相关方和设计步骤,包括仿真和PCB物理设计的元件选择和评估。工程师必须能够在缩短的开发周期下设计出不仅实用,而且高效、经济的系统。 Altium的产品主要是面向印刷电路板 (PCB)的EDA工具,但是其在电子电路设计中发挥着举足轻重的作用,包括电路板布局、布线、验证、生产等工作无不依赖这类软件程序,是工程师创建电路原理图不可或缺的。 在共同的愿景下,瑞萨和Altium旨在构建一个集成的开放式电子系统设计和生命周期管理平台,在系统层面上统一这些步骤。此次收购将Altium先进的云平台功能与瑞萨强大的嵌入式解决方案组合结合在一起,将高性能处理器、模拟、电源和连接性结合在一起。该组合还将实现与整个生态系统中第三方供应商的集成,以便在云上无缝执行所有电子设计步骤。电子系统设计和生命周期管理平台将提供各种电子设计数据和功能的集成和标准化以及增强的组件生命周期管理,同时实现设计流程的无缝数字迭代以提高整体生产率。这大大加快了创新速度,并通过减少开发资源和低效率降低了系统设计人员的准入门槛。 “开发过程继续发展和加速。瑞萨首席执行官柴田秀俊表示:“我们的目标是‘让我们的生活更轻松’,我们的愿景是让电子设计进入更广阔的市场,通过基于云的平台实现更多创新。”“Altium的加入将使我们能够提供一个集成的开放式开发平台,使各种规模和行业的企业更容易构建和扩展其系统。我们期待与Altium才华横溢的团队合作,继续投资并推动我们的组合平台为客户带来更高的价值。” “我坚信,电子行业是建设智能和可持续发展世界的最重要行业。瑞萨的远见卓识和让所有人都能使用电子产品的承诺引起了Altium的强烈共鸣。Altium的行业转型愿景在服务瑞萨的宏伟愿景中得到了最充分的体现。“作为瑞萨的合作伙伴,我们已经与瑞萨紧密合作了近两年,在我们继续成功执行和发展的过程中,我们很高兴成为瑞萨团队的一员。” 瑞萨电子计划通过银行贷款和库存现金为此次交易融资,且该交易不受任何融资条件的约束。目前,该交易已获得两家公司董事会的一致批准,预计将于 2024 年下半年完成。不过,交易的完成还需获得 Altium 股东的批准、澳大利亚法院的批准以及监管部门的批准和其他惯例成交状况。 板级EDA市场的领导厂商 资料显示,Altium创始于1985年,是一家在电子设计自动化(EDA)领域具有领先地位的澳大利亚跨国软件公司,专注于印刷电路板 (PCB) 设计、电子设计和嵌入式系统开发。经过多年的发展,该公司已成为全球市场领导者,拥有当今最流行的 PCB 软件工具。其软件工具使 PCB 设计人员、零件供应商和制造商能够将其联系起来,从而更快、更高效地开发和制造电子产品。Altium的PCB设计软件添加了世界上第一个用于设计和实现电子硬件的数字平台Altium 365,在整个 PCB 设计过程中实现了无缝协作。 根据 ESD 统计,2021 年全球 EDA 的市场规模约为 132 亿美元,同比增长约 15.11%,预计 2026 年全球 EDA 市场规模可以达到183.34 亿美元左右。而EDA 市场又可分为 CAE、Physical Design &Verification、PCB&MCM、SIP 及 Services 五大板块。其中, PCB&MCM 板块在全球EDA 市场的占比约为 9%。PCB&MCM 板块的市场规模由 2017 年的 7.90 亿美元增长至 2021 年的 12.06 亿美元,年复合增长率达 11.16%。 根据第三方的统计数据显示,在面向PCB的板级EDA工具市场,主要由Siemens EDA (Mentor Graphics)、 Cadence、Zuken和Altium主导,他们在2019年集体占据了该细分市场69%的份额。疫情前Siemens EDA以37%的份额领跑全球板级PCB设计工具市场,紧随其后的是Cadence(17%)、Altium(12%)。Altium在过去十年中迅速成为领主要的PCB供应商之一。截止到2023年第一季度,国外的三家板级EDA工具,占据了中国80%以上的份额。 图片来源:EDA365 2023 年 6 月,瑞萨电子曾宣布在 Altium 的 Altium 365 云平台上实现了所有 PCB 设计的标准化开发。瑞萨电子一直与 Altium 合作,将其所有产品的 ECAD 库发布到 Altium Public Vault。借助 Altium365 上的制造商零件搜索等功能,客户可以直接从 Altium 库中选择瑞萨电子零件,以加快上市速度。 为何要收购Altium? 关于收购Altium的原因,瑞萨电子在新闻中列出了六大因素: 平台整合:瑞萨和Altium希望通过整合各自的解决方案,建立一个电子系统和生命周期管理平台,实现跨组件、子系统、系统级别设计的协作,符合瑞萨的数字化转型战略。 优势互补:Altium拥有先进的云平台能力,而瑞萨在嵌入式解决方案方面有强大组合,双方通过优势互补可以加速创新。 财务实力加强:Altium为瑞萨带来了2.63亿美元的收入,36.5%的EBITDA利润率,以及77%的经常性收入,有利于增强瑞萨的财务实力。 系统级设计体验:此次收购标志着瑞萨首次在系统级别为电子系统设计人员带来增强的用户体验和创新,符合瑞萨的战略方向。 平台愿景:两家公司共同致力于构建一个集成的开放式电子系统设计和生命周期管理平台,统一系统级别的设计流程,提高生产力。 协同效应:整合双方优势有望实现营收和成本协同效应,增强整体盈利能力。 综上所述,瑞萨电子认为,收购Altium是为了实现平台整合,优势互补,加强财务实力,并符合其数字化转型战略和为系统设计人员提供更好体验的目标。 Altium 董事会一致建议 Altium 股东在没有更好的提案的情况下投票支持该计划,并取决于独立专家得出的结论(并将继续得出结论)该计划符合 Altium 股东的最佳利益。根据这些相同的资格,每位 Altium 董事打算对其持有或控制的所有 Altium 股份进行投票或促使投票支持该计划。Altium 作为瑞萨电子的全资子公司,将继续由首席执行官 Aram Mirkazemi 领导。 瑞萨电子表示,此次收购增强了瑞萨电子的财务状况,并通过加速瑞萨电子的数字化战略为股东提供了巨大的价值。瑞萨电子预计在交易完成后 3 年内将其净债务/非 GAAP EBITDA 倍数降低至 <1.0 倍。
效果炸裂!OpenAI首个视频生成模型发布,网友:整个行业RIP
原标题:效果炸裂!OpenAI首个视频生成模型发布,1分钟流畅高清,网友:整个行业RIP 刚刚,奥特曼发布OpenAI首个视频生成模型Sora。 完美继承DALL·E 3的画质和遵循指令能力,能生成长达1分钟的高清视频。 AI想象中的龙年春节,红旗招展人山人海。 有紧跟舞龙队伍抬头好奇官网的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。 雨后东京街头,潮湿地面反射霓虹灯光影效果堪比RTX ON。 行驶中的列车窗外偶遇遮挡,车内人物倒影短暂出现非常惊艳。 也可以来一段好莱坞大片质感的电影预告片: 竖屏超近景视角下,这只蜥蜴细节拉满: 网友直呼game over,工作要丢了: 甚至有人已经开始“悼念”一整个行业: AI理解运动中的物理世界 OpenAI表示,正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题 根据文本提示生成视频,仅仅是整个计划其中的一步。 目前Sora已经能生成具有多个角色、包含特定运动的复杂场景,不仅能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。 比如一大群纸飞机在树林中飞过,Sora知道碰撞后会发生什么,并表现其中的光影变化。
奥尔特曼选取网友提示词,用OpenAI新款大模型Sora生成视频
2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。 目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。 一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的城市标志。 一名年约三十的宇航员戴着红色针织摩托头盔展开冒险之旅,电影预告片呈现其穿梭于蓝天白云与盐湖沙漠之间的精彩瞬间,独特的电影风格、采用35毫米胶片拍摄,色彩鲜艳。 竖屏超近景视角下,这只蜥蜴细节拉满: OpenAI表示,公司正在教授人工智能理解和模拟运动中的物理世界,目标是训练出能够帮助人们解决需要与现实世界互动的问题的模型。在此,隆重推出文本到视频模型——Sora。Sora可以生成长达一分钟的视频,同时保证视觉质量和符合用户提示的要求。 OpenAI创始人兼CEOSam Altman(奥尔特曼)太会玩了,让网友评论回复Prompt(大语言模型中的提示词),他选一些用Sora生成视频。截至发稿,奥尔特曼连发多条根据网友提示词生成的视频,包括不同动物在海上进行自行车比赛、发布自制面疙瘩烹饪教学视频的祖母、两只金毛犬在山顶做播客、日落时分火星上进行的一场无人机竞赛等。但这些视频时长为9秒至17秒不等。 技术层面,Sora采用扩散模型(diffusion probabilistic models)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力机制,可以使用更少的算力,生成高分辨率图像。此前Midjourney与Stable Diffusion的图像与视频生成器同样基于扩散模型。 同时,Sora也存在一定的技术不成熟之处。OpenAI表示,Sora可能难以准确模拟复杂场景的物理原理,可能无法理解因果关系,可能混淆提示的空间细节,可能难以精确描述随着时间推移发生的事件,如遵循特定的相机轨迹等。 根据OpenAI关于Sora的技术报告《Video generation models as world simulators》(以下简称报告),跟大语言模型一样,Sora也有涌现的模拟能力。 OpenAI方面在技术报告中表示,并未将Sora单纯视作视频模型,而是将视频生成模型作为“世界模拟器”,不仅可以在不同设备的原生宽高比直接创建内容,而且展示了一些有趣的模拟能力,如3D一致性、长期一致性和对象持久性等。目前Sora能够生成一分钟的高保真视频,OpenAI认为扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。 报告指出,OpenAI研究了在视频数据上进行大规模训练的生成模型。具体而言,联合训练了文本条件扩散模型,该模型可处理不同持续时间、分辨率和长宽比的视频和图像。OpenAI利用了一种基于时空补丁的视频和图像潜在代码的变压器架构。最大的模型Sora能够生成一分钟的高保真视频。结果表明,扩展视频生成模型是构建通用物理世界模拟器的有前途的途径。 报告重点介绍了OpenAI将各类型视觉数据转化为统一表示的方法,这种方法能够对生成模型进行大规模训练,并对Sora的能力与局限进行定性评估。先前的大量研究已经探索了使用多种方法对视频数据进行生成建模,包括循环网络、生成对抗网络、自回归转换器和扩散模型。这些研究往往只关注于狭窄类别的视觉数据、较短的视频或固定大小的视频。而Sora是一个通用的视觉数据模型,它能够生成跨越不同时长、纵横比和分辨率的视频和图像,甚至能够生成长达一分钟的高清视频。 OpenAI从大型语言模型中汲取灵感,这些模型通过训练互联网规模的数据获得通用能力。LLM范式的成功在一定程度上得益于令牌的使用,这些令牌巧妙地统一了文本的不同模式——代码、数学和各种自然语言。在这项工作中,OpenAI考虑视觉数据的生成模型如何继承这些优势。虽然LLM有文本令牌,但Sora有视觉补丁。之前已经证明,补丁是视觉数据模型的有效表示。补丁是一种高度可扩展且有效的表示,可用于在多种类型的视频和图像上训练生成模型。 Sora支持采样多种分辨率视频,包括1920x1080p的宽屏视频、1080x1920的竖屏视频以及介于两者之间的所有分辨率。这使得Sora能够直接以原生纵横比为不同的设备创建内容。同时,它还允许在生成全分辨率内容之前,使用相同的模型快速制作较小尺寸的内容原型。
OpenAI“AI视频”工具出炉:别争了,“视频GPT”还是我的
2 月 16 日凌晨,OpenAI 在官网博客中介绍了最新的 AI 模型——文生视频模型 Sora,它可以根据人们的文本描述生成原始视频。 在放出的演示视频中,Sora 可以生成清晰准确的角色,远景、近景交错但主题一致的视频,并且,已经能一次性生成最长 60s 的视频。看着这些视频,AI 根据剧本自动生成好莱坞电影,似乎已经向我们走来。 一经发布,社交平台 X 上,和 AI 以及视频相关的创业者坐不住了。 YouTube 头部网红 MrBeast 回应 Sam Altman 发布 Sora 模型的推特时,打趣道:Sam,请不要让我无家可归。 Runway 联合创始人、CEO Cris Valenzuela 发推称:比赛开始了。 但 OpenAI 没有拘泥于在花哨的视频本身中,对于 Sora 文生视频,OpenAI 表示:这是通向 AGI 的里程碑事件。 01 60s、语言理解、物理世界交互 据 OpenAI 官网,Sora 模型的目标是「理解和模拟运动中的物理世界」。当前,它的最大亮点是可以生成长达 1 分钟的视频,并且,在这 1 分钟的视频中,可以保证视觉质量,遵守用户提示词。举例来说,Sora 可以生成一系列复杂场景的视频,包括多个角色、特定类型的运动、以及在特定主题和背景下的精确细节等。 输入如下提示词,Sora 生成的视频:美丽、白雪皑皑的东京城市熙熙攘攘。镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天,在附近的摊位上购物。绚丽的樱花花瓣随着雪花在风中飞舞。|来源:OpenAI Sora 模型根据提示词,可以生成如此程度的准确视频,意味着它对语言的理解能力出众。 它不仅理解用户在提示词中想要什么,还理解这些东西应该如何在物理世界中存在。相应地,Sora 可以基于对提示词的理解,精确阐述、演绎提示词,生成恰当的角色来表达极具张力的情绪。 如下提示词 Sora 生成的视频:一个美丽的自制视频,展示了 2056 年尼日利亚拉各斯(Lagos)的人们,用手机相机拍摄的。|来源:OpenAI 在一众的演示视频中,你会发现,Sora 还可以在一个生成的视频中创建多个镜头。不仅如此,即便在近景、远景、不同角度的镜头下,也能保持角色和视觉风格的一致性。 当然,OpenAI 也在官网承认,Sora 还远非完美。它可能难以准确地模拟复杂场景下的物理世界,也可能无法理解一些场景下的因果关系,比如,一个人可能咬了一口饼干,但之后,饼干上可能没有咬痕。 此外,Sora 还可能混淆提示词里诸如「左、右」一样的空间细节,并且可能难以精确描述随时间发生的事件。 OpenAI 没有透露 Sora 模型何时公开,但表示将与有限数量的外部人士分享。当地时间 2 月 15 日一整天,OpenAI CEO Sam Altman 都在他的 X 社交媒体账户上发布 Sora 生成的视频。他让粉丝给出提示词,他发布该提示词下 Sora 生成的视频。 OpenAI 称,尽早分享研究进展是为了与外界展开合作、获得反馈,也让公众了解 AI 的进展。「我们也让一些视觉艺术家、设计师和电影制作人访问,以获得推进该模型以对创意专业人士最有帮助的反馈」。 除此之外,用来评估 Sora 危害或风险的「红队」(red teamers)可以提前测试该模型。这里的红队是指,错误信息、仇恨内容和偏见等领域的专家,他们将对抗性地测试该模型,从而评估如何防止 Sora 被滥用来制造错误信息或其他有害内容。 OpenAI 表示,在把 Sora 应用于 OpenAI 的产品之前,将采取一些重要的安全措施。 02「物理世界 GPT」 官方博客中,OpenAI 称 Sora 的目标是「理解和模拟现实」,这也是是英伟达 Omniverse 多年来押注的未来。看到 Sora 的能力,英伟达高级科学家,AI Agent 负责人 Jim Fan 盛赞其强大模型背后的技术突破。 Jim Fan 在 X 社交媒体发表上述观点|来源:twitter.com 他称,「如果你认为 OpenAI Sora 是一个像 DALLE 一样的创意玩具……再想想。Sora 是一个数据驱动的物理引擎,是对现实或幻想世界的模拟。这一模拟器通过去噪和梯度数学,来学习复杂渲染、『直觉』物理(「intuitive」physics)、长视野推理(long-horizon reasoning)和语义基础。」 在其背后的技术实现上,Jim Fan 认为,Sora 一定使用了 Unreal Engine 5 生成的大量合成数据来训练。 在技术声明中,OpenAI 尚未介绍 Sora 模型的训练数据等细节,称将在 2 月 16 日晚些时候,发布技术论文。 在已公布的信息中,Sora 是一个扩散模型,从一个看起来像静态噪声的视频开始,通过许多步骤去除噪声来逐渐形成最终视频。并且,Sora 能够一次性生成整个视频,或者扩展已生成的视频使其更长。 OpenAI 称,通过赋予模型一次预测许多帧的能力,解决了一个具有挑战性的问题,即确保一个主题即使暂时消失在视野之外也保持不变。 与 GPT 模型类似,Sora 使用 Transformer 架构,具备卓越的缩放性能。 对于 Sora 模型的重要意义,OpenAI 在官方博客结尾指出,「Sora 作为能够理解和模拟现实世界的模型基础,我们相信这一能力将是实现 AGI 的重要里程碑。」 显然,OpenAI 的目标依旧是 AGI 的实现,在这个恢弘的目标下,其在集结资源和自身能力上的领先优势,又一次体现出超越一般创业公司的综合实力。 此前,Pika 联合创始人 Demi Guo 在接受极客公园的采访时表示,在文生视频赛道,相比基于现有模型能力做功能优化、打补丁,模型能力本身才是决定文生视频产品成败最关键的因素。 一经发布,OpenAI 的 Sora 模型再次刷新 AI 文生视频的超能力,显然对这个赛道那些已经发布产品的初创公司形成了巨大压力:Runway、Synthesia、Pika、Rephrase.ai…… 就像 Runway 联合创始人、CEO Cristóbal Valenzuela 在几个小时前说的那样:比赛开始了。 其实,这句看起来「不服输」的话,并不准确。Sora 的出现,让「视频生成赛道」基于上一代模型技术的产品比赛,已经结束了。现在开始的,将是一场全新的技术比赛,而不只是产品的比拼。
AMD显卡可以原生跑NVIDIA CUDA应用了!速度还挺快
快科技2月16日消息,NVIDIA CUDA通过多年耕耘,铸就了牢不可破的生态壁垒,外人各种尝试都无法进入,包括AMD ROCm开发平台,但其实也不是没有办法。 开发者Andrzej Janik就凭借一己之力,借助Intel oneAPI,开发了CUDA兼容方案“ZLUDA”,能够在Intel硬件上原生运行CUDA应用,后来就被停了,原因你懂的。 之后在AMD的支持下,ZLUDA重启了该项目,能够让AMD显卡原生运行CUDA应用,不需要任何转移,也不需要调整代码。 唯一要做的,就是用ZLUDA库替代CUDA。 虽然它不能保证每一款CUDA应用都跑起来,但已经是以一个巨大的突破。 非常可惜,AMD支持这一项目做了两年,也给停了——不知道是不是受到了NVIDIA的压力。 幸运的是,ZLUDA项目并未彻底消散,已经免费开源,感兴趣有能力的开发者都可以使用,而且确认可以在AMD ROCm平台上无缝运行CUDA应用。 比如说,可以将CUDA作为Blender 4.0或者V-Ray的渲染API,尤其是Blender本来就有Radeon HIP计算渲染器,如今跑在ZLUDA上速度还会更快。 Andrzej Janik也在继续研究ZLUDA,其中一个目标就是要让AMD显卡运行NVIDIA DLSS。 内部测试表明,对比OpenCL方案,其性能大部分时候都更好,最多可以领先超过75%,但因为还在开发之中,部分时候效率反而更低。
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制
文 | 周鑫雨 编辑 | 苏建勋 2023年4月,成立于纽约的Runway AI发布了一段用AI生成的视频:模糊卡顿、物体扭曲,且仅4秒; 四个月后,Runway将文生视频的视频效果拉到了4K的超逼着高度,实现了镜头的连贯稳定。而视频的最大长度也从4秒,提升到了18秒——这也是2023年文生视频的“时长天花板”。 然而,就在北京时间2024年2月16日凌晨,“天花板”又被打破——OpenAI又出王炸,发布了可以生成60秒视频的AI模型Sora。 OpenAI官宣Sora 同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5,则被Sora迅速夺走了关注度。 网友为Gemini和Sora制作的梗图 根据OpenAI官方发布的推文和技术报告,Sora能力的革命性可以被提炼为:最长生成60s视频、镜头的前后一致性、超逼真。 从官方发布的视频demo而言,Sora只需要输入包含“构成元素、环境、行为及发生顺序、视频风格”等关键因素的Prompt(提示词),就能生成不同风格的高清、连贯,且具有丰富运镜和转场的60s级视频。 比如生成包含人物和城市元素的视频: 提示词:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。 Sora生成视频。图源:OpenAI Sora也能生成动物和自然风光: 提示词:几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近,它们长长的毛茸茸的皮毛在风中轻轻飘动,远处覆盖着积雪的树木和雄伟的雪山,午后的阳光下有缕缕云彩,太阳高高地挂在空中距离产生温暖的光芒,低相机视角令人惊叹地捕捉到大型毛茸茸的哺乳动物,具有美丽的摄影和景深。 Sora生成视频(画质受gif大小限制有所压缩)。图源:OpenAI Sora生成的视频已经能够达到逼真的效果。不过,用3D和动漫风格生成虚拟场景对Sora而言也不在话下: 提示词:动画场景的特写是一个毛茸茸的小怪物跪在融化的红蜡烛旁边。艺术风格是 3D 和现实的,重点是灯光和纹理。这幅画的气氛是一种惊奇和好奇,怪物睁大眼睛、张开嘴巴凝视着火焰。它的姿势和表情传达出一种天真和俏皮的感觉,就好像它第一次探索周围的世界一样。暖色调和戏剧性灯光的使用进一步增强了图像的舒适氛围。 Sora生成视频(画质受gif大小限制有所压缩)。图源:OpenAI 突破时长和逼真的瓶颈, Sora摸着DALL-E过河 在半年前,在保证生成画质的前提下时长仅仅是突破10秒,对于多数视频模型而言都是难以企及的高度。 这是由于循环网络、生成对抗网络、Diffusion模型等主流视频建模范式,通常只能学习某一小类的视觉数据、较短的视频或者固定大小的视频。 这意味着,此前主流范式下的视频生成模型对训练数据有较高的要求,需要将训练数据处理为具有标准大小、裁剪尺寸的视频。 Sora的技术报告显示,为了构建Sora,OpenAI创新性地采用了文生图模型DALL-E 3的相关技术:将Diffusion模型(可以将随机像素大致转换为图像)与Transformer神经网络(支持处理长数据序列)相结合。 这意味着,Sora可以像处理文字和图像数据一样,对视觉数据进行分块式地理解分析,不用进行标准化的预先处理。 比如对应大语言模型中将文本分割为最小的处理单位Token,Sora也通过压缩视频到较低维度,将视觉数据分割为可分块处理的补丁(patch)。并且随着训练计算量的规模式(Scaling)提升,视频生成质量会显著提高。 基于基础计算量生成的样本效果。图源:OpenAI 基于4倍计算量生成的样本效果。图源:OpenAI 基于16倍计算量生成的样本效果。图源:OpenAI 基于原始数据而非标准化处理数据的训练,不仅可以让Sora初步拥有理解真实或虚拟世界的能力,还能灵活生成时长不同、分辨率和尺寸各异的视频(目前可生成的尺寸范围是:宽屏1920x1080p~竖屏1080x1920p),以适应不同场景和设备的使用需求。 Sora生成不同尺寸下的同主题视频。图源:OpenAI 不过,仍有不少专家以审慎的态度看待这次技术突破。伊利诺伊大学厄巴纳-尚佩恩分校信息科学教授Ted Underwood在华盛顿邮报的采访中表示,OpenAI可能会挑选可以展示模型最佳表现的一些视频。 再比如,普林斯顿大学计算机科学教授 Arvind Narayanan在X推文中指出,Sora生成的时尚女子在东京街头行走的视频中,女子的左右腿交换了位置,背景中的人物在被前进物体短暂遮挡后消失了。 Arvind Narayanan的推文 OpenAI官方也放出了一些“Sora翻车视频”,展示了Sora在理解复杂场景的物理原理、因果关系、空间细节、时间推移上的弱点。比如,它搞反了人在跑步机上跑步的方向。 Sora生成的视频截图 Sora杀死Runway们, 伦理安全引发大众担忧 2022年,TikTok观看量Top 10的视频平均时长为44.2秒,最长的一个视频长达2分16秒; 广告分析公司Integral Ad Science的统计数据显示,移动网络展示广告和移动应用的广告平均时长分别为15.6秒和20.2秒。 这意味着,一旦文生视频模型突破了60s的时长瓶颈、画质达到商用级别,对于用户的生产和娱乐方式,都会产生巨大的影响。《马戏之王》导演Michael Gracey告诉华盛顿邮报:“电影制作者不再需要一个由 100 或 200 名艺术家组成的团队,在三年内制作他们的动画长片。这让我很兴奋。” 然而,他依然对AI工具可能会造成的版权争议、失业问题而感到担忧:“它(AI)剥夺了其他人的创造力、工作、想法和执行力,却没有给予他们应有的荣誉和经济报酬时,那就不好了。” 由于Sora生成的视频质量远高于多数视频生成模型,尤其现实风格让人真假难辨,不少专家也表达了对视频深度伪造(Deepfake)的担忧。政治竞选虚假信息识别组织True Media创始人、华盛顿大学教授Oren Etzioni在纽约时报的采访中表示:“我非常害怕这种事情会影响一场势均力敌的选举。” 目前,OpenAI为Sora生成的视频自动添加了水印标记,以表明由AI生成。OpenAI创始人兼CEO Sam Altman在X上表示,目前Sora正在展开红队测试(Red-Teaming,一种安全评估方法),并只对少数人开放测试。 Sam Altman的推文 不过,即便尚未正式对公众开放,Sora的能力已经引起了不少视频模型创业者的恐慌。 “当一个质量更好、时长更长、应用场景更广泛的视频模型摆在面前,没有人还想用‘Runway们’。”一名AI创业者告诉36氪,“对模型层创业者来说,当务之急还是赶紧找场景、做应用。”
太炸了!OpenAI深夜发布,文字直接生成视频!网友:我要失业了
2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。 目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。 例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。 在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。 电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。 AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。 竖屏超近景视角下,这只蜥蜴细节拉满: 网友直呼game over,工作要丢了: 甚至有人已经开始“悼念”一整个行业: 还有网友表示,电影业要彻底颠覆了。 一位YouTube博主Paddy Galloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。” 对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。 例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。 该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。 如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。 OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。 随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。 视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。 Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。 如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。