注册 登录
EN
中文
APP下载
logo
icon
数字孪生
icon
大数据获客
icon
人工智能
分类目录
行业分类:
IT/通信
金融财经
市场/营销
交通/物流
节能环保
休闲旅游
农林渔牧
日化用品
数码家电
房产/建材
企业/管理
家具/家居
医疗/保健
新零售
机械/工业
餐饮/食品
其它行业
头条分类:
行业前景
行业动态
行业资讯
行业活动
美法案要求字节跳动在165天内剥离TikTok 官方回应
TikTok 凤凰网科技讯 北京时间3月6日,美国两党国会议员在周二提出了一项法案,要求字节跳动公司剥离对旗下短视频应用TikTok的控制权,否则就禁止应用商店上架分发TikTok。TikTok对此回应称,该法案是在践踏美国人的第一修正案权利,剥夺小企业赖以发展的平台。 这项两党法案由美国众议院共和党籍“中国问题特设委员会”主席迈克·加拉格尔(Mike Gallagher)、该委员会民主党领袖拉贾·克里希纳莫提(Raja Krishnamoorthi)以及17名议员提出,将给予字节跳动165天的时间剥离TikTok,以避免该应用被禁。该法案还将创建一个程序,使得美国总统能够对那些由总部或注册地位于某些国家的公司控制的社交媒体应用采取行动。 美国议员此举可能对美国大选产生影响。美总统拜登的连任竞选团队已经开始使用TikTok,试图与年轻选民建立联系,尽管白宫此前曾支持一项法案,该法案将赋予商务部封禁TikTok等应用的权力。上个月,拜登竞选团队在超级碗当天发布了第一个TikTok视频,其中包括拜登的问答环节,这个视频获得了超过1000万次的浏览量。拜登竞选团队发布的大多数视频都集中在攻击前总统特朗普的心理健康和共和党的极端主义上。 TikTok对此回应称:“无论提案人如何掩饰,这项法案都是一项彻头彻尾的TikTok封禁令。这项立法将践踏1.7亿美国人的第一修正案权利,剥夺500万小企业赖以发展和创造就业的平台。” 此前,美国一些州也在试图禁止TikTok。去年,蒙大拿州州长首次签署了一项法律,禁止应用商店允许在该州下载TikTok。不过,TikTok以违宪为由胜诉,阻止了这一禁令的生效。目前,蒙大拿州正在对这一裁决提起上诉。另外,TikTok已被美国、英国、加拿大和欧盟的政府设备排除在外。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
传奇兄妹挑战奥特曼,全球最强AI大模型一夜易主
原创|Jaden 编辑|Cong 在当地时间的周一,Anthropic发布了一组Claude 3系列大模型,称其功能在各种基准测试中均优于OpenAI的GPT4和Google的Gemini 1.0 Ultra。 在模型的通用能力上,Anthropic称Claude 3系列“为广泛的认知任务设定了新的行业基准”,在分析和预测、细致内容的生成、代码生成以及包括中文在内的非英语语言对话方面,显示出更强大的能力,在任务响应上也更及时。并且允许用户根据具体的需求选择不同的解决方案,达成智能、速度和成本的最佳平衡。 此次Claude 3一次性发了三个模型:Claude 3 Haiku、Claude 3 Sonnet与Claude 3 Opus,能力从低到高,能让客户有更多选择。为了更直观地看不同模型的特点,官方贴出了Claude 3模型与多个能力基准相当的的同行模型的比较: 从这个对比上可以看到Claude在多项AI系统常用评估标准能力中的领先。三个模型中最强的Opus,所有能力皆表现优异,尤其是在研究生级别专家推理(GPQA)、数学、编码等赛道,算得上遥遥领先,完全碾压GPT-4,以及Gemini 1.0 Ultra。 不过,在关注技术领先性之外,此次Claude3的发布还有哪些值得思考的亮点? 01 出走OpenAI的分歧者 Anthropic再次重点强调了Claude大模型的安全性,这也是Anthropic的价值观。提到这一点,就不得不说Anthopic的创立。 Anthropic的创始人Dario Amodei和Daniela Amodei兄妹俩,二人原本都是OpenAI的员工。在OpenAI刚刚成立时,原来在Stripe担任CTO的Greg Brockman加入OpenAI后,先是从Google将Dario挖了过来负责AI安全,随着OpenAI的发展,Dario一路做到OpenAI研究副总裁的位置。 接着Brockman将妹妹Daniela也从Stripe挖到了OpenAI,Daniela同样也是做到了OpenAI安全和政策副总裁的位置。 兄妹俩是西方社会非常典型的理想主义者,尤其是妹妹,一直关注穷人、腐败、地球环境等等全球议题。他们加入OpenAI的原因,除了Brockman的原因,最重要的是,当初OpenAI的定位是开源的非营利机构,目标是要为人类构建安全的AGI。 不过,随着马斯克的离开和随后微软的加入,OpenAI的定位和价值观都开始发生变化。Dario和Daniela,以及OpenAI的很多员工开始与Altman的理念发生分歧,后来兄妹俩,加上曾在OpenAI负责GPT-3模型的Tom Brown一共7个人从OpenAI离开,并在2021年1月成立了Anthropic。 Anthropic的意思是“与人类有关的”,从名字就可以看到Anthropic的目标和愿景。Amodei兄妹一直强调,他们的团队有着高度一致的AI安全愿景,创始团队七个人的共同特点是重视AI安全,包括语言模型的可解释性、可控可靠,想让模型更安全,更符合人类价值观,目标是“建立有用、诚实和无害的系统”。 这些话术听上去并不陌生,因为这就是OpenAI最初广为人知的愿景的2.0版。但在卖身微软后,商业变成了OpenAI的第一要义,加上对于AI风险不加节制的态度,和宫斗后组织结构上的巨大变化,也让OpenAI和Altman的形象逐渐变得负面。 虽然Anthropic的成立时间要比OpenAI晚很多,但Claude的发布时间并不比ChatGPT晚多少,甚至开发完成的时间比ChatGPT更早。根据外媒的报道,Claude之所以没有在第一时间对外发布的最重要原因,是因为Amodei兄妹担心安全问题,认为还需要时日,确保模型安全后,才能真正向世人发布。这也给了ChatGPT和OpenAI率先引发全球关注的机会。 不管怎样,目前Claude已经成长为ChatGPT最大的对手,即便是Google,以及作为OpenAI发起人马斯克的大模型,与GPT4和Claude3还是有一段距离的。 02 安全对策:宪法AI技术 从成立之初,Anthropic就有专门的AI安全团队,专门负责降低虚假信息、生物安全滥用、选举干预、隐私等方面的风险,尽可能增强安全性的透明度。 Amodei兄妹曾经提到现有的大型语言模型“会说一些可怕、有偏见或不好的话”,比如教用户自杀或杀人,种族主义或性别歧视等等,AI安全研究需要降低甚至排除它们做坏事的可能性。 为此,他们在Claude训练中引入了一种叫做“宪法AI(Constitutional AI,CAI)”的技术。根据Anthropic的官方解释,在训练过程中,研究人员会定义一些符合人类公序良俗的原则来约束系统的行为,如不得产生威胁人身安全的内容,不得违反隐私或造成伤害等。这些原则包括联合国人权宣言、Apple服务条款的一部分、Anthropic的AI研究实验室原则等等。确保为大模型提供正确的价值观。 当然,和世界上任何一种号称要秉持公序良俗的大模型价值观一样,这些原则的选择完全是主观的,并且一定会受到训练它的研究人员的影响。Anthropic也承认这一点,但也表示绝对的公平、正确的价值观肯定是不存在的,只能是尽可能纳入更多元的文化和价值观。 该技术的关键在于,研究人员会先训练一个价值观正确的AI,再用它监督训练其他AI,通过AI模型之间的互动与反馈来优化系统,而不是人与模型的互动。该方法被称为基于AI反馈的强化学习(Reinforcement Learning from AI Feedback,RLAIF),理论上对人类更加可靠与透明。 该技术一定程度上牺牲了语言生成的自由度,但理念无疑却是比较受欢迎的,毕竟如今全球对AI的警惕也是越来越高,以马斯克为首的很多人都要求政府严格监管 AI,而且这种趋势也正在逐渐形成,各种法规也在陆续出台。 值得注意的是,RLAIF在提高大模型安全性的同时,其实还解决了生成式AI互动中的拒绝或回避的问题。 在RLAIF之前,行业训练生成式AI的方法都是“基于人类反馈的强化学习”(Reinforcement Learning from Human Feedback,RLHF),也就是我们熟知的外包人工给AI做人工筛选、标识、排序等等。但这种人工训练也会产生很多问题,比如人类普遍缺乏积极处理负面要求的能力,这就会导致AI在面对很多负面的问题,和人类的反馈一样,会说,我不知道,我不理解,或者干脆拒绝回答。 这也引发一个新问题,不能给出答案意味着没有用,但若是给出答案,又意味着有害,价值观不正确。这也是Anthropic提出RLAIF,并在此基础上训练出“宪法AI”的缘由。 在此次Claude3发布时,Anthropic解释说,此前Claude模型经常因为理解不到位,而不必要地拒绝回答。而这一次的Claude 3系列,已经在这方面取得了显著改进。在面对可能触及系统安全边界的询问时,大大减少了拒绝回应的情况。 如图所示,Claude 3模型对请求表现出更细致的理解,能够识别真正的危害,并且因为对上下文理解的增强,拒绝回答无害的提示的频率要要少得多。 03 OpenAI会收复失地吗 作为成立不过两年多的初创公司,眼下无论是规模、估值、收益等等方面,Anthropic都完全无法与OpenAI相提并论。不过,AI安全和人类的利益作为最大的亮点和卖点,这或许会帮Anthropic走出一条与OpenAI不一样的路。 虽然短期内难以全面超越OpenAI,但Anthropic的目标并不小,不包括前几轮的投资在内,Anthropic计划在未来筹集50亿美元,以与OpenAI竞争,并进入十几个行业。 Anthropic的投资人团队非常强大,包括Skype联合创始人Jaan Tallinn、Google、Salesforce、Zoom、SK和其他投资方。其中Google用3亿美元换取了该公司10%的股份。 这种关系被很多人看作最初微软和OpenAI之间的合作关系,即微软出资,用来支持OpenAI的研究。后来的事情大家也都清楚了,如马斯克的诉状中所说,GPT4本质已经变成微软的产品,OpenAI已经变成了微软的闭源子公司,OpenAI在开发且不断完善AGI以最大化微软的利润,而不是造福人类。 不过目前Google与Anthropic的关系,仍仅限于Google是Anthropic的技术支持和资金提供方,而且双方在大模型领域还是竞争对手。至于未来是否会朝微软和OpenAI的方向发生变化,一切都很难料。 Claude3发布后,立刻吸引了全球的关注,并被称行业称作“全球最强AI模型”,一夜之间就取代了GPT4的位置。有人在狂欢,为AI技术的飞速进步欢欣鼓舞;也有人为AI领域出现了另一个价值观正确、能制衡OpenAI的巨头而欣慰;当然,更多人将目光投向OpenAI,并且对GPT5寄予了很大的希望,认为GPT5极有可能收复失地,在大语言模型主战场扳回一局。 GPT5到底能有多强大?去年Altman在公开的演讲中,提到OpenAI已经开发出了比GPT4更强大、更难以想象的东西,远超人们的期待。 按Altman的说法,该模型的能力将彻底改变我们生活方式、经济和社会结构以及其他可能性限制。到时候所有人会发现眼下所发布的这些东西都一钱不值。 行业内很多人认为Altman所说的就是GPT5,当然,也有人认为他谈的是此前OpenAI宫斗中被意外暴露的Q*。其实,无论究竟是5还是Q*,都能证明OpenAI有极大的可能,已经在AGI上实现了突破。届时,Anthropic与OpenAI的竞争,就不是谁响应更快、准确性更高、记忆更好等等层面的比拼,而是不同维度的高下立见了。 当然,Anthropic也表示Claude3并不是它能力的极限,在未来几个月内还会不断发布对Claude 3模型家族的更新。届时,我们也只能以羡慕的心态隔岸看热闹,看看谁跑得更快了。
微软驳斥《纽约时报》侵权指控,称AI并非洪水猛兽
IT之家 3 月 5 日消息,微软公司针对《纽约时报》的侵权诉讼提交了驳回动议,试图驳回该案的关键部分。此前,《纽约时报》起诉微软及其合作方 OpenAI 未经许可使用其文章训练大型语言模型 (LLM),并指控其侵犯版权。 微软在文件中指责《纽约时报》散布“末日论”,称其夸大 AI 技术对独立新闻业的威胁。这一说法与 OpenAI 在 2 月份提交的类似动议遥相呼应,后者也试图驳回该案的若干重要指控。 与 OpenAI 一样,微软也指责《纽约时报》“炮制不切实际的提示词”,企图诱使基于 GPT 的语言模型生成与其内容相匹配的回应。微软还将《纽约时报》的诉讼比作好莱坞试图阻止录像机(VCR)这项“突破性新技术”,微软辩称,录像机并没有摧毁好莱坞,反而通过开拓新的收入来源,使其蓬勃发展。 微软认为,LLM 是人工智能领域的突破,公司与 OpenAI 合作,旨在“将这项非凡的力量带给公众”,因为他们 “坚定地相信 LLM 能够改善人们的生活和工作方式”。 据IT之家了解,微软要求法院驳回三项指控,其中包括一项指控其对用户使用基于 GPT 的工具造成的最终用户侵权行为负责,以及另一项指控其违反《数字千年著作权法》的指控。微软还希望法院驳回《纽约时报》指控其挪用时效性突发新闻和消费者购买建议的指控部分。例如,《纽约时报》在诉讼中辩称,如果用户要求 ChatGPT 查找其旗下网站 Wirecutter 的文章,它将失去收入,因为潜在买家将不再点击其推荐链接。但微软表示,这只是 “纽约时报担心可能会发生的事情的纯粹猜测”,并没有在其投诉中提供任何现实世界的例子。 《纽约时报》的首席律师 Ian Crosby 反驳称,微软“并未否认与 OpenAI 合作,未经许可复制了《纽约时报》的数百万份作品以训练其工具”。他表示,微软将 LLM 与录像机进行类比 “令人费解”,因为录像机制造商从未辩称需要进行大规模的版权侵权来制造他们的产品。 除了《纽约时报》的诉讼之外,OpenAI 和微软还面临着其他与训练 LLM 所使用内容相关的诉讼,很多作家都指控这些公司窃取他们的作品用于人工智能训练。
马斯克:AI已带来“芯片荒”,下一个是电力短缺
预言家马斯克最近又发话了。 这一次,特斯拉创始人兼首席执行官埃隆·马斯克把预言从人工智能带来的芯片短缺转向了电力短缺。 2月29日,在“博世互联世界2024”大会上,埃隆·马斯克远程接受了博世CEO斯特凡·哈同(Stefan Hartung)和董事长马库斯·海恩(Markus Heyn)的采访,就人工智能议题发表看法。 他指出,仅仅一年多前,业界还在为芯片短缺而苦恼,然而明年,全球或将面临电力供应的紧张局面,这可能导致无法满足所有芯片的生产需求。 回想去年此时,在一轮由Chat GPT掀起的大模型创业潮里,AI芯片成了抢手货,其中GPU最为明显。彼时,特斯拉掌门人马斯克曾经向整个科技行业发出警告,称巨大的 GPU 危机即将来临。他曾发表推文称,“如今不管是人是狗,都在疯狂购买 GPU。” 随着现象级AI产品Chat GPT的走红,马斯克当时的预言逐渐得到了验证。面对这样一场声势浩大的 AI 洪流,一时间,GPU成为了各大企业走向AI时代的唯一“硬通货”。而科技行业自此开始经受高性能GPU(特别是英伟达 H100)短缺的严重折磨。 芯片短缺之后,下一个会是谁? 马斯克在“博世互联世界2024”大会上表示,芯片短缺的情况可能已经过去,但人工智能和电动汽车正在以如此迅猛的速度扩张,明年全球将面临电力和变压器供应紧张的问题。 值得注意的是,这已经不是马斯克第一次试图引起业界对于缺电危机的更大关注。去年以来,马斯克已经多次在各个场合预警可能即将到来的电力短缺。 去年6月初,马斯克在美国得州奥斯汀举行的能源会议上预测,随着电动汽车消费的增加,2045年的电力需求较目前增加两倍。马斯克预测,到2030年,全球销售的新车中有一半将是电动汽车,同时称“我怎么强调都不为过,我们需要更多的电力。无论你认为需要多少电力,实际需要的都不止于此。” 当地时间7月14日,马斯克在xAI公司会议上预测,未来两年将经历从硅料短缺到电压器短缺,再到电力短缺,单位能源有效计算量会是最重要指标。 7月底,马斯克在太平洋瓦电公司PG&E主办的创新峰会上重申,美国2年内将爆发大缺电,到2045年美国的电力消耗将增加2倍,处理不当将阻碍人工智能(AI)、电动车发展机遇。他呼吁电企,尽快提升紧迫感,警告必须采取更快的行动。《华尔街日报》随后报道称,就像最近损害科技和汽车产业的全球芯片荒一样,缺电可能会阻碍AI的蓬勃成长,毕竟AI发展需要大量的能源。 图说:2月29日马斯克远程出席“博世互联世界2024”大会 来源:BOSCH 在最新的访谈中,马斯克谈到了自动驾驶汽车和人形机器人,并暗示了特斯拉下一步在电动汽车领域的发展——但他显然想传达最清晰的信息也向工业发出了可能的信号:继续清洁能源发电,并制造尽可能多的电力变压器。 马斯克指出,就我目力所及,我从未见过任何技术能比人工智能计算能力的发展更快,人工智能上线的算力似乎每6个月就会增加10倍。显然,这种情况不可能永远以如此高的速度持续下去,否则会超过宇宙的质量,但我从未见过任何类似的事情。这就是为什么Nvidia市值如此巨大的原因,因为他们目前拥有最好的神经网络芯片。淘“芯”热远远超过历史上所有的淘金热。 图说:随着人工智能热潮席卷华尔街,英伟达市值飙升至2万亿美元 来源:路透社 在回答斯特凡关于生成式人工智能在生产中的应用以及在支持生产方面我们可以有怎样的期待的问题时,马斯克回答道:“我认为我们确实正处于可能是有史以来最大的技术革命的边缘。你知道,据说有一句中国咒语:‘愿你生活在有趣的时代。’ 好吧,我们就生活在最有趣的时代。坦白说,有一段时间,人工智能让我有点沮丧。我想,‘好吧,他们会接管吗?我们会变得无用吗?’ 但后来,我和这个问题和解的方式是:我自问是否愿意活着看到人工智能带来的世界末日?我想,是的,我愿意看到。” 马斯克同时指出,人工智能算力的限制是可以预见的,事实上我在一年多前就预测到了这一点——一年多前的芯片短缺,神经网络芯片。然后,很容易预测,下一个短缺将是降压变压器(voltage stepdown transformers)。如果你从电力公司获得 100-300 千伏的电力,而它必须一直降压到 6 伏,这就是一个很大的降压过程。 图说:降压变压器 来源:electronicdesign 接着,马斯克讲了一个类似于中文里绕口令的段子。人们需要transformer(变压器)来运行transformer,因为在人工智能领域有一个叫transformer的东西,它是不同神经网络的结合体。这些transformer正在耗尽transformer(变压器)。 随后,他警告称:“那么,接下来短缺的将是电力。我认为明年,你会看到,没有足够的电力来运行所有的芯片。电动汽车和人工智能的同步增长,两者都需要电力,都需要变压器——我认为,正在创造对电气设备和发电的巨大需求。” 首图来源:bnnbreaking
微软将终止对Windows安卓子系统的支持,亚马逊应用商店关闭
IT之家 3 月 6 日消息,微软日前公布公告,适用于安卓的 Windows 子系统(WSA)和亚马逊应用商店将在 2025 年 3 月 5 日之后不再在 Microsoft Store 中提供。 从 2025 年 3 月 5 日开始,将不再支持 Windows 上的亚马逊应用商店以及所有依赖于 WSA 的应用程序和游戏。在此之前,仍将为客户提供技术支持。在 2024 年 3 月 5 日之前安装了亚马逊应用商店或安卓应用的客户,在 2025 年 3 月 5 日的弃用日期之前,将继续有权访问这些应用。 与此同时,亚马逊也发布通知。从 2024 年 3 月 6 日开始,亚马逊应用商店将不再提供 Windows 11 设备上的 Microsoft Store 下载服务。 2025 年 3 月 5 日之后,Windows 11 上的亚马逊应用商店和从它下载的任何应用程序将不受支持。 亚马逊表示,尽管发生了这样的变化,但亚马逊应用商店将继续在 Fire TV、Fire Tablet 和 Android 设备上提供支持。 据IT之家此前报道,微软于 2021 年 9 月宣布,允许 Epic Games、亚马逊等公司将其应用商店整合到 Microsoft Store,以便为第三方开发者提供更多选择。 微软称其致力于成为一个“面向开放平台的开放商店”,当应用管理自己的应用内支付系统时,Windows 系统的 Microsoft Store 不再要求应用开发者与微软分享收益。
炸场的Sora和冷静的同行
撰文|yuanyuan 编辑|翟文婷 Sora面世半个多月,这个深水炸弹的后续效应依然强烈。 Open AI 发布的这个文生视频模型,紧跟着 Google 发布 Gemini 1.5 的消息,让支持百万级 token 的 Gemini 黯然失色,帮助OpenAI在科技圈成功「抢 C」,一跃成为视频模型届的 GPT 3.5 时刻。 毕竟,当Runway、Pika 等同类视频模型的创作上限还在 10 秒左右时,Sora 已经能够生成 60 秒的精致视频,可以一镜到底、切换视角,无论是背景还是主人公的表情,都拥有丰富的细节。关于Sora是否会杀死剪映的舆论甚嚣尘上。 目前 Sora 还没有对公众开放,但昨天,已经有创作者拿到了测试资格,并发布了自己尝试的三个视频。 在「测评电子产品的年轻人」这个视频中,光影细腻,人物和置景真实,美中不足的是他的右手有六根手指。 此外,Sora 在理解物理时会遇到困难,特别是在腿部/行走方面。在 Sora 生成的小狗行走视频中,腿部经常交叉并合并在一起。 虽然 OpenAI 发布了 Sora 的技术报告,但其中并未涉及技术细节。 我们能知道的是,Sora 又是一次 OpenAI 式的典型胜利,是技术选型、训练数据、资源优化等各个环节的细节优化,组合成了一次效果超出预期的质变。就像 Sam Altman 之前解释为什么 GPT 会比其他的大模型更好,是因为 OpenAI 堆了「一百万个小技巧」。 去年年初,ChatGPT 发布后,海内外大厂争先恐后地发布文本大模型,热闹非凡,生怕落队;这次 Sora 发布后,只有海外版剪映、Stability AI 跟进发布了文生视频产品的测试版。 其他公司也许是暗中跟进,或是谨慎观望,除了网红李一舟蹭蹭热点,还没有谁站出来敢说,要做中国版Sora。 追,还是不追? ChatGPT 发布后,大公司和初创企业纷纷加入百模大战;现在 Sora 已经发布半个多月了,此前的盛况没有再次出现。 一周之后,Stability AI 开放了Stable Video的公测,但或许是服务器爆满的缘故,功能不够稳定。生成的视频最值得称道的是清晰度,但仍然没有大幅度的视角切换,画面主体也没有太多动作,只有背景动了起来,给人的感觉仍然是「会动的图片」。 字节剪映海外版也上线了文生视频的功能,同样反响不佳,主要是因为等待的时间过长。网友测试发现,一个视频的生成要等待 1800 分钟。 有人工智能算法工程师分析,同等参数的视频模型,比大语言模型所需要的算力要多几十倍。业界流传,Sora 的参数规模在 10B 到 30B 之间,其所需的算力或许与千亿级的大语言模型差不多。 有趣的是,腾讯和阿里巴巴虽然没有跟进视频模型的发布,却纷纷第一时间在自己的技术账号上发布了对 Sora 的技术拆解;其中,阿里巴巴达摩院所发布的文章题目叫做《复刻 Sora 有多难?》,并在文末表示,「我们期待视频生成领域的 LLaMa ,以及更加普惠的开源视频生成技术。」 AI 初创企业 Hugging Face 认为,视频模型的三大挑战是算力、数据、指令模糊性。要想做到物体和空间的一致性,往往伴随着高昂的计算成本;高质量的视觉数据集也比文本的更为稀缺。此外,生产让模型更容易理解视频的 Prompt,会比语言模型、文生图模型难度更大。 此外,Sora 是一个凭借直觉和概率驱动的模型,而不是靠精确计算的公式驱动的模型。有人总结道,「Sora 可以像一个普通人一样,通过直觉去理解物理世界,也能解决很多问题,但它没有办法像物理学家一样造出火箭这种东西。」 无论如何,Sora 跟 GPT 3.5 一样,验证了技术方向的可行性,视频模型的性能未来会随着参数量、数据大小和计算量的增加而提高。 又一次降维打击? 硅谷投资机构 a16z 统计,截止去年年底,市面上共有 21 个公开的视频模型,其中包括 Runway、Pika、Stable Video Diffusion 等等。 然而,第一个出圈的还是 Sora,核心依然是它远超预期的效果。以往几秒钟的 AI 视频,给人的感觉还是「会动的图片」,而 Sora 则展现了对真实世界的理解力和还原力,还有对虚拟场景的充沛想象力。 Sora 官网发布的几十个视频 Demo 中,有在东京街头散步的女人、在咖啡杯里航行的海盗船、在雪原上走过的猛犸、无人机视角拍摄的海浪拍打峭壁、华丽的纸艺海底世界、维多利亚冠鸽的微距特写,其视频主体和环境的一致性令人震撼。咖啡杯里航行的海盗船这个 Demo 里,水面的波纹、船的运动轨迹,很好地遵循了现实世界的物理规律。 阿里巴巴达摩院的分析认为,Sora 的智能涌现,体现在它的三位一致性、长距离连贯性和物体持久性、与世界互动的能力、对数字世界的模拟。 虽然 Sora 对复杂的物理预测还显得力不从心——比如,一个人咬了一口饼干,但饼干上并没有出现咬痕,但许多从业者认为,这是 AI 真正理解世界的开端,随着模型能力的持续提升,它对物理世界的理解和还原会更加准确。 此外,OpenAI 不仅公布了 Demo 视频,同时公布了每一个 Sora 生成视频的指令,方便大家尝试其他产品后,对比效果。 尽管外界担心其他文生视频初创企业的命运,但创始人们表现出的兴奋却远远大过恐惧。 Runway CEO Cristóbal 感慨技术进步的速度,过去需要以年计算的技术进步,现在压缩到了月的维度,他预测技术将会更快地进化,每天、甚至每个小时,都可以涌现出新的技术实现。Pika 创始人郭文景也在媒体采访中表示,「(Sora)是一个振奋人心的消息,我们准备直接冲,将直接对标Sora。」 去年 8月,OpenAI 对外披露了首次收购行为。 被收购公司 Global Illumination,开发了一款名为 Biomes 的开源大型多人在线沙盒游戏,类似于浏览器上运行的《我的世界》。当时就有人指出,借助开放式游戏中玩家的交互,OpenAI 通过这次收购,能为 AGI 构建真正的数据集;也有人猜测,OpenAI 将会推出游戏或视频模型产品。 从 Sora 的效果看,或许这次收购的确对 Sora 的训练数据优化有一些帮助。 世界模拟器? 「Sora 是能够理解和模拟现实世界的模型的基础,我们相信这一功能将成为实现 AGI 的重要里程碑。」OpenAI 在技术报告的最后写道。 ChatGPT 是思维世界的模拟器,Sora 是物理世界的模拟器,出门问问 CEO 李志飞评论,「OpenAI 的科学家们果然一直有着创世的冲动。」 有技术人员猜测,Sora之所以具备强大的能力,得益于模型和数据。 首先,与 Runway、Pika 的技术路线不同,Sora 使用了基于 Transformer 的扩散模型(Diffusion Model),可以通过自注意力机制(Self-attention)来学习视频数据中各个元素块之间的关系,并模拟数据的扩散过程,生成高质量的视频输出。 其次,Sora 能将不同类型的视觉数据,转化成统一的视觉补丁(Patch)。Patch 之于 Sora,就像 token 之于 ChatGPT。ChatGPT 把各种语言、编程代码都切分为 token,Sora 把图片、视频都切割为 patch。 OpenAI 认为,将视觉数据统一处理,将带来两点好处:首先是采样的灵活性,通过统一的数据表示,Sora 可以灵活处理不同宽高比的视频内容。其次是更好的构图效果。在原始宽高比的视觉数据上进行训练,Sora 可以更好地学习和理解构图,使得生成的内容更符合人类的视觉习惯和审美标准。 如同 ChatGPT 在专业领域的能力,还比不过详细定义规则的小模型一样,Sora 虽然对物理世界有一定理解,并拥有更强大的泛化能力,但它与此前的物理仿真模拟相比,预测价值仍然有限。 比如,物理仿真模型可以预测汽车在相撞时的反弹效果和形变,但 Sora 无法发挥这样的作用。OpenAI 官网发布的 Demo 也表现出,Sora 无法很好地模拟玻璃杯破碎时的动态,混淆了玻璃破碎和液体溢出的顺序,倒下的玻璃杯甚至与桌面融为一体。 英伟达的研究人员Jim Fan认为,这有两种可能的解释:一是模型之所以犯这样的错误,是因为它根本不学习物理,只是简单地缝合像素;二是模型实现了一个内部的物理引擎,但这个引擎还不够好,就像 Unreal Engine v1 在流体和可变形物体等物理模拟方面比 v5 要差得多,渲染效果也差得多,并且不符合物理规律。他本人更倾向于第二种解释。 但模型能力的提升是可预见的,因为人类生产视觉数据的速度前所未有地加速了:全世界遍布摄像头,每人每天都在用智能手机采集这个世界。这将成为模型理解世界的通路。此外,UE 5 也可以模拟多角度的高清视频,让模拟出来的视觉数据更加优质。 从 Sora 中我们不难看出,头部玩家 OpenAI 的思路是「集中力量办大事」:专注提高模型的能力,只进行轻度的产品化。毕竟,能生产 60s 视频的模型,要比添加了很多细碎功能、复杂按钮的视频产品震撼多了。此外,谁也无法预测模型智能程度的提升曲线,产品设计的节奏很可能追不上模型进步的速度。 当下对于大模型公司来说,模型能力才是最好的增长手段。不仅SLG(Sale-lead growth)显得过于原始,甚至PLG(Product-lead growth)也有些过时,我们正在迎来一个MLG(Model-lead growth)的时代。
魅族21 PRO成世界第一个开放硬件的手机:对所有大模型开放
快科技2月29日消息,今晚魅族发布新旗舰手——魅族21 Pro。 魅族表示,魅族 21 PRO的“O”,是智能手机时代的句号,也是一个新时代的开始。 魅族21 PRO不仅是魅族历史上第一款开放平台手机,还是全世界第一个开放硬件的手机。 魅族并不是对软件开发者开放,是对所有的大模型开放,魅族直接给开发者提供系统权限、Flyme API文档,允许LLM向用户请求数据,并开放SOC边缘AI API,让开发者拥有充分的自由度。 魅族作为一个手机品牌与手机公司,最擅长的是做好硬件和服务好用户。魅族相信能力的边界,魅族只做好硬件。AI方面魅族做开放平台,让更年轻,也更擅长的团队加入。 在魅族看来,魅族21 PRO 其实是商业战场上第一台 AI 时代的树莓派。 魅族将征求全球大模型团队的支持,邀请所有有兴趣的大模型团队,在魅族的开放平台上开发大模型应用,而且会为月活最高的大模型应用团队,提供100 万人民币的悬赏,开发者申请邮箱为openforllm@xjmz.com。 除了发布首款AI终端魅族21 PRO外,魅族还公布了All in AI战略。 据了解,魅族将从三个方面展开All in AI的战略,魅族将打造全新的AI Device,通过产品形态AI原生设计、硬件算力AI全局调用等,为用户带来更加智能、便捷、创新的AI产品体验。
海外车企巨头正对中国新能源汽车进行防御反击
图片来源@视觉中国 近日梅赛德斯-奔驰宣布放弃在2030年实现全面电动化,而是规划电动车的销量仅占其总销量的50%,并声称已做好了继续生产内燃机汽车的准备,计划在未来十年内更新其内燃机技术。而在2022年时,奔驰计划在2030年实现全面电动化,并在2039年实现新车产品阵容的碳中和。奔驰此次的战略计划改变无疑会造成重大的影响力,作为知名的老牌车企,在新能源汽车市场渗透率大幅提升的背景下却突然刹车。 与奔驰相似,作为传统汽车巨头的宝马和丰田此前也声称放弃了全面销售电动化的目标。并且在前几天,苹果公司也正式宣布放弃电动汽车的开发,该项目的部分员工转至人工智能的研究。在新能源汽车渗透率不断上涨的现阶段,为何这些巨头踩下了刹车? 本土新能源汽车竞争优势较大,带动我国超过日本成为世界最大的汽车出口国 在全球的新能源汽车市场规模上,我国可以说是遥遥领先。2023年我国新能源汽车产销累计分别达到958.7万辆和949.5万辆,同比分别增长35.8%和37.9%,渗透率为31.6%,同比增长5.9个百分点。其中渗透率远高于美国的7.7%以及欧洲的15.7%,并且本土销量也远超美国的110余万辆以及整个欧洲的200余万辆。所有国家中我国是新能源汽车最大的消费市场。 目前中国自主电车品牌竞争优势明显,占据本土市场份额较大,海外市场竞争力较强。最新数据显示,2023年中国品牌新能源乘用车市场份额达80.6%,在国内各厂家激烈竞争的同时,海外新能源电车在中国的市场份额不断降低。与此同时,中国品牌新能源汽车在扩大本土的市场份额外,出口量也在大增。2023年我国新能源汽车出口120.3万辆,同比增长77.6%。在东盟国家中,我国生产的电动汽车的市场占有率飙升至46.1%,并超过韩国占据首位。在欧洲和美国上,我国新能源汽车也在加速提高市场份额。目前我国已超过日本成为世界最大的汽车出口国。 海外电车影响力在减弱,选择推迟完全电动化进行防御 不同于油车,中国电动汽车制造的快速崛起已经严重压缩海外品牌在中国的电车销售量。在中国的电车市场,海外品牌电车难以有着油车的影响力。同时,在中国品牌电车出口量不断剧增的同时,也引起了海外汽车品牌的深深担忧。斯特兰蒂斯首席执行官Carlos Tavares上此前就表示,人们完全认识到未来不适合面对中国竞争的公司将陷入困境,如果不适应,欧洲汽车业将面临“血洗”。 全球汽车巨头推迟完全电动化可以看做一次“防御”的策略。首先在中国电车市场竞争优势减弱的局面短时间难以改变,无论是成本还是技术中国车企已经具有较大的优势。因此对于这些海外品牌来讲,守住本土市场将是重点的战略方向。与中国不同,欧美市场新能源电车渗透率增长较缓,并且市占率仍处于较低水平,加上很多国家陆续退出了“巴黎协定”,其整体对于减少碳排放的决心相对中国较少。油车仍是未来短期内欧美市场最大的选择。除此之外,相对较大的成本问题也一直困扰着这些公司,除去生产成本相对较大外,现阶段价格战的蔓延也导致了部分车型利润的下降,以奔驰为例,其车型EQE和EQC的近期降价幅度都超过20万元。 部分巨头选择“抱团”对抗中国新能源汽车 在一些公司进行防御策略时,部分公司也选择通过抱团对抗中国新能源品牌。例如欧洲汽车巨头大众汽车、雷诺和斯特兰蒂斯正在准备建立合作关系,应对来自中国电动汽车制造商和特斯拉的日益严重的威胁,并且据外媒记者表示,这种关系可能是在汽车合作深度上是前所未有的。除此之外,福特公司也在计划与一些车企合作,增加自身竞争力。 除去这些车企的反击外,欧美的一些政策也在配合打压我国新能源汽车的出口。例如去年的9月份,欧盟理事会主席冯德莱恩表示将对中国电动汽车进行反补贴调查,并强调此举意在保护欧盟车企不受中国新能源电动车的冲击。而近期美国拜登政府也正在考虑采用关税以外的方式,限制对中国“智能汽车”及相关零部件的进口,并声称是因为个人数据的保护。 总体来看,海外车企的一系列措施代表了我国新能源车的强势崛起的同时,也说明未来我国新能源汽车出口的竞争压力将加大。对此许海东表示在外部环境严峻的情况下仍对我国新能源汽车出口充满信心,预计2024年出口量将达到550万辆。
苹果头显 “笨重”前行
北京时间2月29日,知名苹果分析师郭明錤发布消息,备受关注的苹果头显Vision Pro可能要到2027年才能迎来重大硬件升级。郭明錤表示:“苹果已在收集使用者回馈以规划Vision Pro产品蓝图。目前预估Vision Pro规格显著变化的新机种,可能要到2027年才会量产。” 苹果头显发售不到一个月,其市场“热度”与“退货”相关传闻持续引发关注。 贝壳财经记者在国外社交平台上注意到,苹果头显的使用者表示,虽然有许多惊喜,但同时也存在着佩戴体验不佳、超重、续航短、应用少、生态不够丰富等问题。 多位接受新京报贝壳财经记者采访的业内人士表示,苹果头显以空间计算技术为基础的新交互形态,给行业带来相当于里程碑式的启示和引导。但是苹果头显的技术和产品还处于早期,存在许多不足,如果类比苹果手机,预计在第三四代产品才会有规模化可能,预计需要6-8年进行迭代完善。 苹果头显Vision Pro。图/苹果官网 01 有用户吐槽体验,退货成争议焦点 “当我从设备里出来,虽然没有眩晕,但是眼睛感觉到精疲力竭。”贝壳记者在多个社交平台注意到,有不少用户吐槽这款设备带来的不佳感受。 一位体验者说,毕竟该产品重量超600克。甚至有用户称,长时间佩戴Vision Pro“导致眼球血管破裂”。还有苹果用户评价道:它看起来不太酷,这与其他强调风格和美学的苹果产品明显不同。 网络上持续爆出“苹果头显退货”相关信息。一些用户赶在收货达14天最后期限前申请寄回产品。重点关注苹果公司消息的网站Cult of Mac面向读者和社交平台发布了两份民意调查,分别有76%及45%的受访者表示将退回Vision Pro。 另一个不足是其内置应用和内容太少。虽然官方声称这款头显发售首日已提供600个原生应用。研究使用虚拟现实社交应用的清博智能副总裁、创新院院长李祖希对记者表示,苹果Vision Pro“体验很好,但应用比较少,所以导致不少退货情况。” VR内容研发公司杭州虚拟人科技创始人倪志力告诉记者,苹果这款头显现在可以支持的开发条件比较有限,内容量少,还有较大的开发空间。“设备在头戴模式和体验上也还有不少用户无法适应,这也是新产品的常见问题。” 除了娱乐,这款设备充当生产力上也还没有宣传的那样强大。比如工作时持续盯着虚拟屏幕并不舒服,虚拟键盘也不如实物键盘顺手。“目前技术尚不成熟,无法让头显设备无缝融入大多数人的工作生活。”一位用户总结称。 价格也是一个无法忽略的因素。一位用户表示,“它没有做任何事情证明3500美元的起价合理。”国内闲鱼上的行情也出现了变化,大多数售价仍和此前一样为3-4万元,但是1T版本最高价格从10万元降到了6.5万元。 有业内人士提醒要理性看待退货现象。诠视科技是一家专注空间感知与交互的解决方案提供商,提供AR、VR眼镜的底层技术及系统产品,公司创始人、董事长兼CEO林瓊近期也在美国当地体验了苹果头显产品,他告诉记者,苹果头显退货并不是什么稀奇的事情,整体退货率和苹果手机刚发布时差别不大。“也有很多不负责任的消费者,利用这个机会尝试新产品,但实际上并没有真正购货意愿。大可不必借此吐槽产品”。 郭明錤发文表示,根据对维修/整新产线的调查,目前Vision Pro的退货率低于1%,此结果并无异常。在远程用户中,有大约20%–30%是因为不知道如何设置 Vision Pro(而退货)。 不过郭明錤也认为,除非Vision Pro降价或有更多吸引人的应用,否则美国市场出货增长有限。今年美国市场出货量约20-25万台。 “苹果头显Vision Pro是目前‘市面上最强的存在’,但是它并不完美,比如太重、续航不足,还需要改进。”WitDisplay首席分析师林芝对记者表示,苹果头显的体验没有达到理想预期。 Canalys首席分析师刘健森分析称,Vision Pro的定位主要吸引一部分高价值、想尝鲜的忠实苹果用户以及对VR/XR 感兴趣的用户和开发者。整体而言,AR/VR目前还是小众。 “苹果第一代头显设备当前销量与核心能力有限,普通用户市场化的商业模式并不完善,如果类比苹果手机,预计在第三四代产品才会有规模化可能,预计需要6-8年进行迭代完善。”倪志力说。 02 “依然是行业里程碑式的启示和引导” 在虚拟空间玩纸牌游戏,烹饪时随手设置虚拟计时、打扫卫生时叠加“消消乐”,沉浸式观影娱乐,在虚拟空间与亲友视频等......Vision Pro的消费者在家里、街上、地铁里等场景不断尝试新玩法。 “虚拟现实令人难以置信地身临其境。”一位用户首次使用时,感觉完全脱离了现实。“人们永远不会想把它摘下来。我们将真正生活在电影《玩家1号》中看到的世界。” 倪志力认为,虽然苹果头显的实用性还比较有限,但其机能定位更广且显示交互表现远超同类。林瓊则表示,苹果用VST(视频透视)方式推出MR头显,实际上在行业里是教科书级产品,其低延时、3D视频的成像和呈现能力,以及和苹果生态的打通,可以说是空前的。相较而言,国内很多产品还有许多短板和不足。 “苹果这次产品的推出,是一个交互理念的提升,也即眼控和手势,还包括这种以空间计算技术为基础的新交互形态,这款产品给行业带来相当于里程碑式的一个启示和未来方向的引导。”林瓊说。 中信证券指出,Vision Pro硬件端创新点涉及芯片、显示、交互、光学和声学等多个领域。 东海证券TMT团队方霁指出,Vision Pro硬件素质和成本堆料远超竞品,高昂售价注定其主要目标客户将以开发者为主,但其对MR行业硬件标准的引领性意义不容忽视。 公开资料显示,1月19日预售开启后的首个周末,苹果即售出16-18万台Vision Pro。预购不到10天,苹果即已售出超20万台Vision Pro。 但是也正如上述一些用户不佳的体验感受,这款产品还有许多待完善的地方。中信证券指出,二代及后续产品可能的升级方向包括降低AVP主体重量;进一步升级VST功能,视场角仍有提升空间;提升续航水平;适配近视用户,提升佩戴体验;硬件端降本等。 03 短期无法成苹果新增长利器 苹果头显是库克极为重视的一款产品,他宣称,这款设备标志着计算技术新时代的开端,“如同Mac将我们带入个人计算时代,iPhone将我们带入移动计算时代,Apple Vision Pro将带我们进入空间计算时代。” 记者注意到,有不少企业和机构已经或即将推出面向Vision Pro的相关应用,包括钉钉、携程、米哈游、芒果TV、TikTok等。2月22日,招商银行宣布,已登录苹果Vision Pro头显,成为国内首家适配visionOS的银行App。苹果公司则在官网中提到,“期待着在今年晚些时候将Apple Vision Pro推向更多国家。” 在林瓊看来,随着Vision Pro的推出,人机交互技术进入一个无时无刻、无处不有的沉浸式和3D交互的时代,“可以回想苹果手机2014年刚推出时,那时候可能也觉着是小儿科,但现在它的整个操作系统、功能、可扩展性和生态,都达到了相当的水平,我想,再过五年到八年,Vision Pro也会达到同样境界。” 不过从目前的消费者和行业期待来看,苹果公司距离这款产品的最终设想还有很长的路要走,正如iPhone的迭代进步一样。“这款产品不需要比太阳镜更大和更重。”一位消费者说。李祖希也表示,苹果头显的技术和产品还处于早期,“还需要很多年才能普及。” 林芝也认为,短期内Vision Pro无法成为苹果新增长的利器,“它更偏向B2B产品或者面向开发者产品,很难在普通消费者群体普及,而且从目前产业链产能规划来看,Vision Pro还很难支撑大规模市场爆发。” 刘健森对记者说,XR在特定应用场景下有明显的价值和优势,但是目前这方面的需求都小众。想要成为下一代计算平台,苹果和第三方开发者需要打造平台的killer app(杀手级应用),也得持续降低门槛,从价格到佩戴舒适度和便利性。 IDC中国高级分析师赵思泉表示,目前的Apple Vision Pro已经是当前技术水平下硬件产品的最优表现,后期预计会推出低价位版本。“Apple Vision Pro被苹果寄予厚望,但是第一批出货量来看相对较少,接受的市场检验还有限,在之后陆续上线其他国家的过程中会得到更好的反馈。” 倪志力看好这款苹果空间设备,在他看来,这款设备可以真正看到空间计算与工作生活结合的雏形,“苹果是一家精益求精、贴近市场、迭代创新的公司。但如果以苹果每代设备3到4年研发时间的节奏,这款设备的市场化成熟的时间可能要延长到6到8年。相对而言,我更看好Meta与pico在3到5年内更有市场爆发的可能。”
维信诺:屏幕高端技术产品已供货多个品牌客户折叠产品
集微网消息,近日,维信诺在接受机构调研时表示,目前公司搭载Hybrid-TFT技术、COE(无偏光片技术)等屏幕高端技术产品,已供货多个品牌客户的多款折叠产品,包括内折、外折、横向折叠、竖向折叠等多种形态。 维信诺指出,公司重视折叠产品,看好折叠市场的发展前景,把折叠屏幕的轻薄化、低功耗、改善折叠和降本增效等方面作为重点研发方向,储备较多领先技术。公司将积极推进更多量产供货,抓住折叠手机的机遇期,进一步提升公司产品的市场份额。 在更高世代产线规划方面,维信诺称,OLED具有显示效果好、反应速度快、能耗低、更轻薄、形态可变等特点,在中尺寸领域市场具有较大的潜力。公司在中尺寸领域有充足的技术储备,并持续进行技术创新。近期中尺寸IT及车载市场OLED的渗透率正在持续提升,具有较大的拓展空间,行业内正在规划适合中尺寸市场需求的高世代线。公司将持续关注产业动向,根据市场需求和公司发展规划,审慎推进相关项目。 另外,对于近期OLED价格变化情况,维信诺表示,2023年,国内OLED产能加速释放,在中低端智能手机OLED产品出货价格出现剧烈波动。根据市场情况,公司调整产品策略,持续优化产品结构,产品开发与产能释放加速匹配中高端智能手机机型。公司积极供应头部品牌客户旗舰系列产品上市,并成功拓展更多头部客户机型的产品导入,市场份额将显著提升。2023年四季度以来,随着消费电子行业景气度逐步提升,主流品牌新一代旗舰机型的热销及年终促销季的带动,OLED产品价格有所上涨。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。