EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
OpenAI获《金融时报》内容授权:可训练模型和实时调用
编译 | 长颈鹿 编辑 | 李水青 智东西4月30日报道,OpenAI与英国《金融时报》于4月29日宣布达成战略合作伙伴。两家机构签署了一项许可协议,未来将通过将《金融时报》的新闻内容集成到ChatGPT模型中,来提升模型的实用性和新闻内容的可访问性。 根据双方签订的协议,OpenAI的ChatGPT平台已获得权限,可以从《金融时报》的文章中提取简短摘要来回答问题。因此,ChatGPT的用户现在能够访问到《金融时报》新闻内容摘要、相关引述以及直接指向《金融时报》新闻网页的链接。 《金融时报》集团首席执行官约翰·里丁(John Ridding)在声明中强调了合作的行业意义,他认为AI平台为使用出版商内容而支付费用是值得提倡的商业行为。 他称,这项协议不仅肯定了《金融时报》新闻报道的价值,也为《金融时报》在AI内容展示领域的早期探索提供了机会。《金融时报》将能更广泛地扩展其新闻作品的影响力,并更深入地洞察读者的需求和兴趣。他还提到,《金融时报》将以开放的心态和审慎的态度,积极适应技术变革带来的新机遇。 此前,《纽约时报》曾在去年12月对OpenAI和微软提起诉讼,该集团投诉这两家公司在构建ChatGPT模型时未经授权使用了其大量文章内容。 OpenAI的首席运营官布拉德·莱特卡普(Brad Lightcap)称,与《金融时报》的合作将为新闻机构和记者提供更具创造性和效率的工作方式,同时丰富ChatGPT的用户体验,使全球数百万用户能够实时接收到《金融时报》的新闻报道。 今年年初,《金融时报》成为ChatGPT企业版的客户,为其所有员工提供了AI技术的访问权限。 据《金融时报》透露,此次双方的合作是OpenAI在过去一年内达成的第五项类似协议,OpenAI已与美联社(Associated Press)、德国的Axel Springer、法国的Le Monde和西班牙的Prisa Media等新闻出版集团建立了合作关系。然而,这些协议的财务细节并未对外披露。
李未可科技古鉴:发布自研多模态大模型WAKE-AI,三大优化让AI眼镜交互体验升级 丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会第一天的主会场大模型专场,李未可科技合伙人兼AI负责人古鉴以《WAKE-AI打造室外AI硬件交互新路径》为题发表演讲。 李未可科技一直在摸索AI适合什么样的室外场景。古鉴分享说,相比手机和新型硬件,智能眼镜是更适合AI的载体,它能带来极致的轻薄,更适合室外场景的AI落地。大模型至少会为XR及AI眼镜等带来三方面的提升,包括交互更自然、陪伴更人性化、服务更精准。 古鉴在会上正式宣布,李未可科技发布针对“AI+终端”定向优化研发的多模态AI大模型平台WAKE-AI。WAKE-AI具备文本生成、语言理解、图像识别及视频生成等多模态交互能力,针对眼镜端用户的使用方式、场景等进行了优化。 古鉴认为在语音层面上,大模型整体反馈速度技能指令小于500毫秒,大模型层面小于2秒,这样用户才会觉得这个反馈是足够快的,而且它的反馈足够及时,才能够为用户提供户外运动、文化旅行、日程管理及实时翻译等多种多模态AI服务。古鉴还透露道,李未可科技的WAKE-AI就是以此为优化方向,并即将推出搭载WAKE-AI的终端新品。 以下为古鉴的演讲实录: 我今天主要跟大家分享《WAKE-AI打造室外AI硬件交互新路径》。李未可公司是2021年成立的,我们主要专注于以AR等眼镜形态的硬件为基础的AI研究以及产品,我本身也从事AI算法和AR算法大概超过十年。 一、智能眼镜是室外AI最适合的载体:轻薄、极致、续航长 首先跟大家分享一下,随着AI的爆发和发展,大家都在寻找AI的落地场景,什么样的落地场景最适合AI?比如有AI+Car、AI+PC,但是在室外什么样的场景最合适?我们一直在摸索。 AI在室外首先要轻、薄,要能随时交互,要方便,要看得清楚,这些都是AI对硬件的要求。我们在这方面做了很多调研,发现可能有三种方式在室外可以用作AI的主要交互方式。 第一种,手机。手机的接收方式是大家普遍可以接受的,每个人都有。但是它在某种程度上不是为AI设计的,所以在外面需要打开手机,需要拍照,需要打开语音助手跟它聊天,这不是一种很方便的交互方式。 第二种,最近比如Ai Pin,针对AI设计的硬件研发出来,我们发现这种硬件在用户接受程度上有一定挑战。毕竟是一个价格不菲新增的品类,目前从海外第一批用户的体验反馈来看,Ai Pin也是偏过渡的形式。 聚焦在硬件产品以后,我们发现以眼镜为基础的形态,其实既能被用户接受,又有广泛的使用场景。将眼镜戴在脸上,用户跟它沟通交流很方便。而且从传统的眼镜到智能眼镜,到AI眼镜,就是一个逐渐过渡的过程。 我们认为,智能眼镜是AI最适合的载体,尤其室外。我们做了很长时间的眼镜,从现在的趋势来看,以眼镜为基础分两条路线。 第一条路偏向室内场景,以办公、游戏等为主,要求沉浸的体验、极致的MR(混合现实)感觉。比如苹果Vision Pro很重,不适合带到室外,但是它的体验非常极致。 另一条路线偏向室外,比如本地生活、出行、旅游,这类场景下(用户)对AI眼镜的要求主要是信息的显示,你能实时交互、导航,能够听一些讲解,听音乐,而且有些蓝牙交互,这是我们定义信息屏的显示。AI的爆发,更加推动了这种形态眼镜的生长。 我们定义为室外要极致的轻薄、极致的AI,而且续航时间要足够长。室内要极致的沉浸,极致的AR、MR的感觉。 我们在去年发布了一款眼镜Meta Lens S3,这是一款针对室外场景发布的一款尝试性AR眼镜,具有语音交互功能,包括室外拍照功能、室外录像、蓝牙语音接电话、使用光波导双目显示等。这款眼镜已经售卖给消费者,取得了非常好的评价。 疫情结束以后,旅游场景有一个很大的爆发,很多年轻人喜欢出游,Citywalk(城市漫步)成为新的生活方式。我们有硬件基础,随着AI能力的爆发增长,我们能把硬件体验提升到非常好的程度;再加上我们的室外垂直场景,这对于我们来说,包括很多生态来说,都是非常好的机遇。 二、AI带来智能眼镜三大提升:更自然的交互、更人性化的陪伴、更精准的服务 AI到底能给我们的硬件,包括我们的用户交互体验带来哪些提升? 我认为有三个部分:第一,给我们带来更自然的交互;第二,有更人性化的陪伴;第三,在精准度和信息数量上能够提供更好的服务。 我们通过三种方式,能够不断地提升AI效果。 第一,我们使用定向优化的分发大模型,帮助快速地分发用户的指令,比如我要听歌,我要跟语音助手聊一聊。 第二,情感大模型,在人和冰冷的机器之间,我们需要有一份情感,有这份信任以后,用户才能够深深地信任这个硬件,才能让它去执行很多任务,才能把邮件系统开放给助手,让它理解邮件。 第三,针对室外场景需要大量的数据,包括使用多模态的VQA(视觉问答)模型,让用户可以指哪问哪,通过图片的方式得到相对应的信息,这也是我们重要的创新。 三、通过定向优化的分发大模型,满足更自然的交互 要满足更自然的交互,AI硬件首先需要什么样的特点? 首先,用户在眼镜上对回答的容忍度比在手机上容忍度低。我测试了很多语音大模型在手机上的反馈,包括豆包、海螺问问等,它的反馈时间都在5秒左右,我觉得这个反馈时间其实在眼镜上面无法接受。 我们认为在语音层面上,大模型整体反馈速度技能指令小于500毫秒,大模型层面小于3秒,这样用户才会觉得这个反馈是足够快的,而且它的反馈足够及时,才能解决用户的问题。 第二,室外场景的噪音比较多。我们定位室外场景,噪音场景很多,包括多人对话、汽车、骑车的声音。我们认为3A算法,比如回声消除、主动降噪、自动增益、通话降噪可能都是AI硬件需要满足的。在-5db情况下语音准确度大于90%,才能满足AI交互的基本需求,-10db的情况下(语音准确度要)大于85%。 另外,收音和ASR(自动语音识别)的效果需要保证。很多语音类的对话机器人其实ASR的效果都不是特别好,但是大模型的效果很好,把很多问题纠正了。 我认为ASR涉及很多的指令,ASR的字错率要低于2%,字准率大于98%,这些标准跟在VR行业内整体渲染速度要在20毫秒以内的标准类似。我认为这是一个室外AI硬件的基础标准。 在大模型还没有爆发之前,我们使用传统的算法时会面临很多解决不了的问题。 比如表达“我吃饭了,我要运动”,用户会加入很多自己的语言,但是他的意图可能是最后我要运动,怎么把这些泛化的问题解决,这些是难点之一;第二,“帮我打开导航,我要运动”,用户是想要导航还是想要运动,这本身就是涉及多意图的理解;第三,实现Agent(智能体)的能力,怎么调用App、调用Agent解决用户对应的意图;第四,多轮聊天的能力,上下文的指代消解,传统方法做得非常不好;另外,知识储备的有限,一些无法回答等。 这些都是大模型的优势。我们希望使用大模型的快速分发能力,包括使用轻量级模型,快速给用户一个反馈,能够达到很好的分发用户意图的效果。另外,大模型能支持AI Agent的能力,快速执行用户的买票、导航等意图。我们希望基于大模型回答用户高质量的问题,包括使用RAG(检索增强生成)进行搜索、判断等,这些都是分发大模型需要具备的。 基于AI眼镜的设计思路,其中包含了Memory模块、分发大模型模块。分发大模型主要通过语音输入来快速分发,比如聊天、信息搜索或指令,比如“我要听歌”或者“声音大一点”,通过这些分配来反馈到情感大模型的结果里。待会儿我会提到情感大模型和我们的Memory模块。在情感大模型里,我们会融入角色的设置,让用户的反馈会更加地拟真。 另外,我们有一个单独的Agent模块执行用户的指令,比如导航、买票、备忘录,这些可能都是用户的刚需。这是整体设计的框架,慢慢地,我们要转入如何让用户和机器建立情感的连接。 四、通过情感大模型及长记忆,提供更好的陪伴 我很喜欢的一部电影《她》(Her)。当这个人启动OS1系统的时候,他的第一感觉是,为什么这个跟人一样的声音是从机器里发出来的?这种情感连接在第一时间就快速地建立起来。我认为AI硬件尤其要跟人产生关联的时候,首先要考虑到的就是情感连接,比如它必须得像人,它能够知道喜好,能跟用户有深度的聊天。 我在很多对话机器人上聊差不多10轮到15轮以后,聊得非常尴尬,很多问题会聊不下去。如何进行有深度的聊天?包括角色的概念和不同Agent解决对应的问题,其中很重要的对《她》这部片子的感觉,AI助手一直在帮男人解决交流的问题,一直在帮他想各种各样的办法。这其实就是最后AI要帮助人交互、要解决的问题。 我们要有拟人化的DTS(数字化影院系统音频技术),要有长记忆的系统,要预训练一些知识,比如历史的信息、人物性格的定义,还有一些情感类Agent的调用,这些都是我们正在做和我们将要做的一些东西。 重点跟大家谈一下长记忆的这套系统。我跟我们的对话机器人聊的一段,其中有两块比较值得关注,一是根据之前我跟它聊天它得到的信息,它能知道我喜欢什么样的咖啡豆;二是它能够把它的知识库里大量的小众数据,融入到它的对话系统里,给我一个惊艳的反馈。 这就是我们期望用户能够天天使用AI眼镜的核心基础,通过核心记忆和长期记忆,不断更新用户的画像。 核心记忆主要用于不断得到用户的年龄、喜好等信息。长期记忆是把用户的很多信息进行构建索引后,最终存到长期记忆库里面,在长期记忆库里不断检索,最终汇总到核心记忆,到补充记忆信息的Prompt(提示词)里面。这样在每次对话中,系统就可以理解用户想要什么,还有一些记住的事情,慢慢地情感就会建立起来。 五、Citywalk户外多模态大模型,打造更精准的服务 第三部分,使用我们的眼镜去做Citywalk,这是年轻人尤其喜欢的一个室外项目。很多年轻人戴着我们的眼镜,尤其喜欢去拍第一视角视频,包括AI语音可以支持用户询问周边的信息。 我们跟杭州的学研机构联合研发了一条路线,以孤山为基础,在这条路线上,有很多小朋友戴着眼镜沿着不同的景点,去询问,学到很多知识。这条路线受到学研机构的大力推广和很多小朋友的喜爱,现在依然在运营,有兴趣体验的人可以联系我们去孤山体验。 我们的“旅游助手+城市漫游系统”,核心是数据内容,以景区作为核心供给,现在大概有2000多个景区数据。另外,我们从小红书、去哪儿网获取了小众的特色地点和路线,还有当地人会去的一些美食餐厅,通过人工和半自动的方式来吸收这些数据,不断整理,形成我们的路线、推荐、游览攻略。 最终给到用户的核心体验,一是景点游览,用户在景区可以问比如“岳王庙的历史”等问题;还有自动巡航系统,使用到VQA系统,当用户问“岳王庙里的碑写的到底是什么”,可以用手指点去询问,这也用到了多模态+LBS的系统;三是地点弹幕,用户根据LBS的地点信息,可以留言、发布一些相关到此一游的相关信息,你的朋友看到了可能会联系你。 多模态大模型可以做到“指哪儿问哪儿”,小朋友非常喜欢这样的体验。整体使用多模态+GPS跨模态向量的系统,最终使用了多模态大语言模型生成了相对应的内容。 之前我们也做过很多跟SLAM(同时定位与地图构建)相关的技术,通过用户第一视角的视频先用SLAM生成相对应的视频,再通过视频生成的方式,让用户觉得在骑行或者走路过程中整体第一视角的视频非常酷炫,这也是眼镜里提供的视频后处理中很有特色的功能。 再加上我们可以通过游记的方式进行生成,当游览完整个路线以后,你可以自动生成路线,可以通过这个路线把视频、图片、游记快速分享出来,这是整个旅游的一套行程系统。 六、发布多模态大模型平台WAKE-AI,共建室外AI+AR眼镜生态 这是WAKE-AI整体大模型的框架,我们希望把这个框架分享给大家,跟大家一起来建设AR眼镜+AI能力、在室外等多个场景的生态。 我们把WAKE-AI整套系统输入到李未可App的开发平台,用户可使用自定义的编排逻辑,包括可以通过我们的平台编辑你想在眼镜上显示什么样的位置等信息,同时发布到李未可的“AI Store”上,通过终端眼镜显示出来。 我们希望和大家一起去共建这个生态,也希望逐步开放出很多算法能力,这样才能够一起把AI真正落地。李未可AI平台也开放了特邀群,大家感兴趣的话可以加入进来,我们一起探讨,逐步释放我们的能力。 同时,我们也在4月底正式发布李未可AI眼镜,很多功能可以在这款眼镜上体现出来。售价定为699元,非常友好的价格,让大家去体验新一代的AI交互。 以上是古鉴演讲内容的完整整理。
爱诗科技王长虎:全球用户量最大的国产AI视频生成产品,是怎么炼成的?丨GenAICon 2024
2024中国生成式AI大会于4月18-19日在北京举行,在大会首日的主会场开幕式上,爱诗科技创始人兼CEO王长虎博士以《AI视频生成——用像素构建星辰大海》为题发表演讲。 王长虎深耕计算机视觉与AI领域20年,曾任微软亚洲研究院主管研究员,2017年初加入字节跳动,而后担任字节跳动AI Lab总监,从0到1支撑了抖音、TikTok等国民级视频产品的建设与发展。2023年4月,他创办AI视频大模型创企爱诗科技。 爱诗科技在今年1月上线的海外版产品PixVerse,是当前全球用户量最大的国产AI视频生成产品,国内版(爱诗视频大模型)也在今年3月上线内测。上线88天,PixVerse达成了一千万次视频生成量的里程碑。 今年2月,Sora横空出世,点燃了大众对视频生成的热情,也为深耕该领域的从业者带来了前所未有的机遇和挑战。在技术层面上,Sora验证了DiT架构在视频生成中的Scaling Law(规模定律),并证实了这个方向的可行性。在王长虎看来,追赶Sora的窗口期在一年前,也就是爱诗科技成立的2023年。 过去一年,视频大模型经历着量变到质变。王长虎认为,中国在短视频领域领先全球,同时短视频也是最贴近用户的内容形态。目前视频生成技术还没有到ChatGPT时刻,他称自己有一支在全球AI视频领域最能打硬仗、打胜仗的团队,希望最大程度降低视频创作门槛,实现技术普惠。 以下为王长虎的演讲实录: 过去这一年,视频生成领域进展迅速,从无人问津到众所周知。今天借这个机会,希望能跟大家聊一聊过去一年我的一些体会和浅见。 大家应该非常熟悉这个视频了。今年大年初七凌晨,Sora横空出世,进一步激发了大众对AI视频生成的热情。很多评论、解读铺天盖地而来,很多大V、大佬们也纷纷发言,包括马斯克、周鸿祎以及各种媒体。 大年初七一大早,我被微信吵醒了,很多投资人、朋友、家人、同事纷纷发来问候,好像又碰到那句话:“元芳你怎么看?” 当时最令我开心的是这条,我们公司一位优秀的候选人第一时间给我发信息,说“我要加入你们”,因为视频生成这件事“太大了、太重要了,时不我待”。 这是一张当时在国外互联网上广为流传图片——一众视频生成模型膜拜“新王”Sora。看到这张图后,我的心情很复杂。 我们的产品叫PixVerse,很荣幸“跪”在了第一排,跟Runway、Pika、SVD等当时最好的视频生成产品放到一起,也是这张图里面唯一一家中国公司。 但另一方面,我们前面有一个巨人,还需要进一步超越它。 有人问我,Sora出现之后你会不会焦虑?中美之间的视频大模型差距会不会越来越大?爱诗作为创业公司,接下来路怎么走? 在我看来,Sora的出现是2024年春节期间我收到的最好的礼物。 一、Sora验证了DiT架构,追赶Sora的窗口期在一年前 我们是在去年整个视频生成行业还非常冷的时候,加入这个赛道的,并且在Sora出来之前,产品实测效果已经走到全球视频生成第一梯队。 这就像一个人在戈壁徒步,已经走在最前面,需要继续探索的时候,突然看到前面有一些脚印,那时候的感觉一定是非常开心。 一方面,这验证了这个方向大概率是对的;另一方面,前面还有一个人能让你继续超越。因此,强大的对手是沙漠中的水源。 对于Sora的解读非常多,我就不详细展开了。在我看来,Sora最大的贡献就是验证了DiT(Diffusion Transformer)在视频生成中的Scaling Law(规模定律)。 在基础计算量的时候,AI生成的视频惨不忍睹,随着计算量加倍至32倍,生成视频几乎可以以假乱真,这更坚定了我们做视频生成的信心。 毋庸置疑,Sora的出现推动了整个行业的进步和发展。但是很遗憾,至今为止我也没有机会试一下Sora,我们想在座的绝大多数人都没有试过。 当前,Sora只是一场“卖家秀”,也特别期待有一天我们可以看到更多的“买家秀”。Sora出来之后,我们可以看到很多大厂、初创公司都去做视频生成了,要超越Sora。 有人问我,超越、追赶Sora的最佳窗口期是多长时间? 在我看来,追赶Sora的窗口期是在过去这一年,是在视频生成行业很冷的那一年,是在Sora出来之前,整个业界对这个方向还不那么认可的一年。 二、视频生成去年不被看好,仍带领抖音AI视频团队All in 回到一年前,我们可以看一下这个行业有多冷。 一年前的今天,OpenAI、Anthropic分别获得了100亿美金、10亿美金的融资,国内的很多大语言模型创企也纷纷拿到第一桶金数亿美金,更大的一笔钱还在融资计划中。 再看视频大模型。一年前,做视频大模型的公司,一只手都可以数得出来。国外Runway已经成立五年,拿到2亿美元融资;Pika刚刚出现,拿到2000万美金;爱诗拿到数百万美元融资。 视频大模型和大语言模型相比,就像蚂蚁和大象一样。 去年上半年,我们聊了一些投资人。一位行业大佬第一时间打钱,成为了我们的天使领投,但更多投资人对这个方向可能看的还不是很清楚,也不是很认可。我们得到一些非常现实的建议,有人说大模型在中国没前途,还不如回家上班,或者建议尽快变现。 当时确实有非常多的选择,是继续创业还是回家?如果创业选择哪个赛道?是先做文生图,还是先做文生视频? 那时候,视频生成没有什么开源模型,需要从头去建设,且生成质量惨不忍睹。而AI图片生成产品Midjourney已经走出来了,每个月有数千万美元MRR(月度经常性收入),有开源模型,所以很多创业公司都去做文生图。 如果选择视频生成,是做大模型还是做应用层?当时很多朋友找到我,说可以一起做游戏、电商、广告,能够很快变现。 但是在我看来,视频是最重要、也是离用户最近的一类内容。过去若干年,我们可以看到抖音、TikTok这样的短视频产品,已经成为全球最重要、用户量最大的国民级产品,无论是下载量还是使用时长。 我们都知道抖音、TikTok是中国团队做出来的,服务于全球。很有幸我和我的核心伙伴们从2017年开始,从0到1支撑了抖音、TikTok这些产品背后的视频AI。所以在AI视频生成领域,我们是全球最能打硬仗、打胜仗的团队,于是决定是All in AI视频生成。 三、给初创公司取个浪漫的名字,想用AI做最高级的内容 去年这个时候,在Sora出来之前,引用张一鸣的说法,这是一种“务实的浪漫”。我们没有选择最容易的事情,而是选择当时可能非主流、非共识,但我们认为是正确的事情。做视频大模型是有生命力的,是面向未来的。 我们公司也取了一个有点浪漫的名字——爱诗,“爱”是AI的意思,“诗”是可以流芳千古的、最高级的内容,“爱诗”的意思是用AI做最高级的内容。 去年4月份我们公司成立,7月份开始训练大模型,经过大约几个月的时间,技术上已经成为全球第一梯队。今年1月份我们的产品PixVerse在海外上线,发展很快速。Sora出来之前,我们在年前已经拿到了数亿元的第二轮融资。 这是去年8月,我们第一次训练好的一个完整模型生成的视频,时间很短,动作也很小,但是对我们来说是一大步。 有人问我,大语言模型跟视频大模型区别在什么地方? 在我看来,语言和视觉是两类完全不同的内容,语言是在人类出现之后才出现的,是人类文明的结晶,它已经对信息做了高度抽象和概括;而视觉在人类出现之前,山在那里、水在那里,它是更原始的东西。 当大模型出现之后,人们对大模型的期待是模拟人脑,是新的硅基生命,是人内部的东西。而视频生成大模型出现之后,人们的期待是什么?是对世界进行模拟、建模。 视频生成本质上是理解这个世界,然后做影像呈现,这种呈现经历了从记录到生成的演进过程,这里我们列举了三个影像记录历史中很重要的时刻。 在三万多年前,人类已经在岩壁上去呈现自己看过的一些群狮奔跑的画面;1826年,法国的摄影先驱制作了第一张可以长期展现的照片;1872年,人类历史上第一个视频出现了,它源于两个美国人关于马飞奔过程中蹄子是否同时腾空的探讨。从视觉的呈现到视频的生成看起来很远,事实上离我们很近。 小时候过年,我的父亲总会给我做各种各样的灯,其中有一种灯叫“走马灯”。我们要点燃蜡烛,蜡烛推动热气上升,带动轴轮的转动,轴轮上面会绑上一些剪纸,烛光通过剪纸映射到最外边一层的屏上,走马灯就呈现了这样动态的效果。右边的连环画是我很快乐的童年记忆,也是一种原始的“视频生成”。 当抖音、快手这样的短视频产品逐渐成为主流,越来越频繁影响我们的生活的时候,我们可以看到视频生成技术也逐渐出现了。 最早期阶段是检索生成,即视频里的每一个片段都是从海量数据中检索而来,不是纯粹生成的,通过自动或者人工方式拼接在一起,现在在短视频平台里面也可以看到这样的视频。 第二阶段是部分生成,我们在玩抖音、TikTok的时候会看到里面有很多特效,其中有一个特效“控雨”,用户录制视频的时候用手掌可以控制雨让它停掉,并且有一些微动。这类视频总是有一个原始的视频,在这个基础上做一些局部生成,包括特效里面的美颜、动漫风、换个狗头、加个猫耳朵都是这样。 最后是我们现在提到的真正意义上的视频生成,是凭空生成的。 视频生成技术可以追溯到十年前,GAN(生成对抗网络)的出现开始。之后的若干年,局部生成领域大放异彩,虽然有很多通用生成、文生视频的技术出现,但是效果也很差。 直到Diffusion扩散模型的成功,2023年出现了非常多的文生视频的技术、产品,有谷歌的VideoPoet、英伟达的Video LDM、Runway的GEN-2,还有Pika以及我们的PixVerse。 但是2024年Sora出现,表明过去这一年无论是数据量、计算量还是参数量都有非常大的提升。 这里我选了几个模型,2023年7月份发布的AnimateDiff、2023年12月发布的VideoPoet以及2024年2月发布的Sora,其中关于Sora参数都是道听途说,有可能不准,也有可能比较保守。我们看到一年之内,这些参数都有巨大的提升,这也带来了视频生成产品的提升。 四、上线88天生成1000万次,PixVerse已解决多镜头一致性问题 我们在去年11月份初发布了PixVerse测试版,今年1月份正式发布了Web UI的版本,提供了文生视频、图生视频以及我们首创的Character to Video,用户只要上传一张照片就可以成为视频的主角,可以解决多镜头的一致性问题。 最后一张视频大家能看出是谁吗?这是我们开发出这个模型之后生成的第一个视频,我自拍一下输进去,让它生成一个我在跑步的视频,“他”的身材比我好多了。生成后我第一时间发到我们健身群里面,告诉大家我的“健身效果显著”。 现在已经有很多的创作者用PixVerse替代摄像机、演员、布景来创作大片。中间一张图是一个俄罗斯用户在今年1月份创作的一个AI科幻片Last Mission,每个镜头都是PixVerse做的,这也是在海内外有广泛影响的影片。 很多国内用户也在用我们的产品。前段时间我们受邀到一个省级电视台去交流,惊讶地发现有很多编导已经在用PixVerse做AI视频。他们也很惊讶这个产品团队居然就在在国内。 下面这个视频是国内一个导演“闲人一坤”,利用PixVerse创作出来的中式奇幻片《山海奇镜之劈波斩浪》,也是国内播放量最大、影响力最大的AI视频之一。《山海奇镜之劈波斩浪》已经被快手平台采购,据悉将在5月上线。 PixVerse发布之后,我们跟创作者交流过程中,也遇到很多感人的瞬间。 这是国内一个54岁的老大哥给我们发的一封邮件,他想申请加入我们的创作者计划,说他前些天戴着老花镜花了一整天时间,用PixVerse和剪映做成第一条AI片子。他说,使用PixVerse的过程中让他享受了创作的愉悦,并且跟我们分享了一些他的故事。这是意料之外的感动。我们看到自己的产品不仅有导演、专业创作者用起来,普通用户也能受益。 还有一位乌克兰导演,因为宏观经济原因失业了。他用了PixVerse觉得非常棒,想为我们社区发展助力。他当时创作了第一个关于香水的广告大片,在海外很火,很多商家看到了,付费让他帮忙创作广告,之后他又创作了一系列啤酒、钻石等广告,获得了收入。这里面每个镜头都是通过PixVerse做出来的。 前几天我发了一个朋友圈,纪念我们一千万次视频生成。我想每一个视频背后都可能有一个故事,但这也只是我们的一小步,希望未来能够服务于更多的用户。 现在视频生成技术还没有到ChatGPT时刻,还在快速发展过程中。但是我们已经欣喜地看到专业创作者们,在应用我们产品来替代镜头、演员、场景来生成大片,逐渐地去改变原有的视频生产创作工作流,我们也期待未来有更多的行业,游戏、动漫、教育、影视等受益于视频生成技术的发展。 当然,我们也希望能够在最大程度上降低使用的门槛,不仅创作者们能够用起来,每天玩抖音、玩TikTok的普通消费者们也能够用我们的产品,轻松地使用AI视频生成产品将创意转变为现实。我们希望能够做到技术普惠。 我们的产品名字叫PixVerse,Pix(Pixel)代表像素,Verse(Universe)代表宇宙。AI视频生成,就是“用像素构建星辰大海”。 以上是王长虎演讲内容的完整整理。
国产大模型之光!伯克利最新基准发布,智谱AI打赢GPT-4和Llama 3
作者 | 香草 编辑 | 漠影 近日,Meta开源Llama 3系列模型,引发开源社区沸腾。 同时也有唱衰国产大模型的声音出现,认为Llama 3的开源“又”将为国产大模型带来“新突破”。但事实果真如此吗? 智东西4月30日报道,上周,来自UC伯克利等机构的团队LMSYS开源了大模型基准测试Arena-Hard,以高度的人类偏好一致性、可分性为优势,同时测试数据集更新频率高,具备优秀的开放性、动态性、科学性和权威性。 根据该基准测试,国产大模型ChatGLM3、GLM-4排名仅次于GPT-4 Turbo和Claude 3 Opus,在国内外模型中均处于领先地位。 同样在上周发布的还有《SuperBench大模型综合能力评测报告》,由清华大学基础模型研究中心联合中关村实验室研制。在语义、代码、对齐、智能体和安全五个榜单中,GLM-4有3项排名国内第一,其中语义理解能力更是仅次于Claude 3位列全球第二。 GLM系列模型是智谱AI自研的基座大模型,其中GLM-4是其在今年1月推出的最新一代,具备多模态、长文本、智能体等能力。 这表明,国产大模型在技术层面上早已不输国外,站在全球大模型竞争的第一梯队,追赶GPT-4或是Claude 3也不再是遥遥无期之事。同时在落地层面,智谱AI在B端、C端全面布局,走出了一条产学研用深度融合的道路。 一、人类偏好一致率近九成,GLM权威测评超越Llama 3 Arena-Hard使用大模型竞技场(Chatbot Arena)的实时数据构建,从20万用户查询中挑选500个高质量提示词作为测试集,并由GPT-4 Turbo作为“裁判”评判输出。 所谓大模型竞技场,是LMSYS构建的模型测评系统,其采用众包方式进行匿名、随机化的大模型对战,根据用户对回答的反馈进行评分。 Arena-Hard从七个指标来衡量大模型能力,包括具体性、领域知识、复杂性、解决问题、创造力、技术准确性以及实际应用,具有两大SOTA(当前指标最优)优势:人类偏好一致性、可分性。 由于测评数据来源于人类真实反馈,其得分与人类偏好高度一致,达到89.1%;与模型分数都相近的基准MT Bench相比,其区分度从22.6%提升至87.4%。 此外,Arena-Hard的测试数据频繁更新,也减轻了数据泄露带来的“刷榜”等潜在问题。 在Arena-Hard基准上,智谱AI自研的ChatGLM3、GLM-4以54.7、53.9的评分,力压Llama 3 70B、Mixtral 8x22B等前沿模型分数30%以上,排名仅次于GPT-4 Turbo和Claude 3 Opus,在国内外模型中均处于领先地位。 ▲Arena-Hard评测结果(图源:智谱AI) ChatGLM3、GLM-4与Claude 3 Opus的分差极小,此外GPT-4作为评委,会更偏好自己的输出,因此其分数有一定程度虚高。在此基础上,GLM系列模型与GPT-4 Turbo之间的分差进一步缩小。 GLM系列模型并不算是“黑马”。 早在2022年11月,GLM-130B就在斯坦福大学大模型中心发布的报告中,成为30个全球主流大模型评测中唯一入选的亚洲模型。评测结果显示,其准确性、公平性与GPT-3持平,鲁棒性、校准误差和无偏性优于GPT-3,且鲁棒性、校准误差在所有模型中表现排名前三。 ▲斯坦福报告对30个模型的测评,其中上箭头表示数值越高越好,下箭头反之,davinci即GPT-3(图源:斯坦福) 今年1月,上海AI实验室发布了大模型开源开放评测体系司南OpenCompass2.0,同时揭晓了2023年度大模型公开评测榜单,智谱AI新一代基座大模型GLM-4总排名第二,位居国内榜首。 ▲2023年度大模型公开评测榜单(图源:上海AI实验室) 同样在上周,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,发布了3月版《SuperBench大模型综合能力评测报告》。 在语义、代码、对齐、智能体和安全五个榜单中,GLM-4均跻身全球第一梯队,其中语义理解仅次于Claude 3位列第二,其余四项能力排名第四;在代码、智能体能力上更是力压一众竞争对手,成为国内第一。 二、清华系学院派出身,竞逐OpenAI“向AGI发起冲锋” 过去一年多,国内诞生了多家大模型独角兽,互联网大厂等也在加速自研大模型的开发。为什么智谱AI能在其中脱颖而出,在技术层面达成领先优势和国际认可? 这离不开其背后的初创团队和明确的路线选择。 成立于2019年的智谱AI,起源于清华大学计算机系知识工程实验室。该实验室于1996年成立,二十多年来一直进行机器学习、数据挖掘等AI方向的研究、工程化和应用转化,因此在成立之初,智谱AI就已经是一家“有团队、有技术、有客户”的“完成时”企业。 在大模型技术路线上,智谱AI选择自研GLM(General Language Model)路线,而非主流的GPT(Generative Pre-trained Transformer)路线,原因是希望把不同预训练模型的优势组合到一起。 另一方面,国内缺乏自己的预训练模型框架。无论是GPT、BERT,还是T5,都是西方科学家提出的底层技术,路径是被西方垄断的状态,智谱AI希望通过独特的底层框架来打破这一垄断。 在技术选型和解决方案方面,智谱AI选择直接对标OpenAI。 以基座模型GLM-4为核心,智谱AI从对话模型ChatGLM、代码模型CodeGeeX、搜索增强模型WebGLM等语言模型,到文生图模型CogView、图片理解模型CogVLM、文生视频CogVideo等多模态模型,全产品线对标OpenAI进行布局。 ▲智谱AI在对话、文生图、代码等方向布局(图源:智谱AI) 但对标不等于模仿。在生态层面,智谱AI选择开闭源同时存在的打法,既通过开源收获大量社区参与推动大模型发展,保证产品的迭代和创新力;又通过闭源满足商业化需求,提供稳定、安全的企业服务。 在上个月的媒体沟通会上,智谱AI CEO张鹏谈道,之所以对标OpenAI,是因为二者追求AGI(通用人工智能)的目标是一致的。 谈及技术革新,张鹏称,在大模型时代,技术的领先性可能比过去任何一个时代中都具有更明显的碾压式效果。基于通用大模型的能力提升衍生能力,有助于找到“大模型原生应用”或者“大模型原生场景”。 近日他在央视《对话》栏目上说,今年将成为向AGI发起冲锋的起始年份,大概率可以看到比较实在的、能够解决衣食住行等现实问题的应用出现。 三、产学研用深度融合,智谱AI“三管齐下”走商业化道路 在战略布局方面,智谱AI走的是技术研发、行业落地和企业服务“三驾并驱”的道路。 在大模型时代,“产学研用”这件事被极度压缩,表现为周期变短、距离变近。张鹏在去年9月的采访中谈道,公司选择把研究和工程放在相对平等的位置上,“一边做核心的技术,一边去拓展市场。” 在学术方面,除了以平均三个月一代的速度迭代基座模型外,智谱AI团队也在不断探索不同模态的前沿技术。 上个月,智谱AI团队在最新研究成果中提出了对大模型涌现能力(Emergent)的新解读,认为涌现主要与预训练模型的损失相关,并不是大模型的专属能力,与模型大小没有直接关系。 ▲智谱AI发表大模型涌现能力研究论文(图源:arXiv) 在B端,智谱AI目前已拥有超2000家生态合作伙伴、超1000个规模化应用以及200多家深度共创客户,覆盖智能汽车、金融、咨询、数字营销等行业的头部企业,从生产、营销、综合投放、销售,到转化、服务、用户体验、售后等,每个环节都积累了许多落地案例。 例如,德勤中国通过云私有部署智谱GLM系列大模型,实现智能文档解析、数据切分、信息提取等,整体员工工作效率提升10%;上汽集团基于GLM打造汽车维修AI助手,实时与维修人员交互,单轮对话抽取达到业务人员准确率的80%,多轮对话修正后达到90%准确率。 据透露,智谱AI主要采取三种方式来实现商业化落地:标准化API调取、云端私有化、完全私有化,分别面向不同类型的企业客户。智谱大模型开放平台则面向全球开发者,提供一键部署、调用、微调的能力。 在C端,智谱AI也在持续布局,其于去年8月上线的智谱清言是全国首批通过认证、面向公众开放服务的大模型应用之一,智谱大模型在开发者社群也广受好评。 今年1月,智谱AI上线了智谱清言GLMs个性化智能体定制功能,能够根据用户意图,自动理解、规划指令以完成复杂任务,用户通过简单的提示词指令即可创建属于自己的GLM智能体,大幅降低了大模型开发的门槛。 无论是B端、C端还是学术领域,大模型在本质上面临的仍是技术上的挑战。智谱AI在模型、商业、学术上多条腿走路,也赢得了市场和资本的青睐,除了阿里、腾讯、小米、腾讯等大厂加注外,还成为北京市AI产业投资基金投资的首家大模型公司。 结语:国产大模型技术创新值得期待 国产大模型正在狂秀肌肉。除了GLM系列模型外,文心一言在SuperBench测评基准上也取得了超越Llama 3的成绩;同为清华系出身的生数科技,上周刚刚推出16秒时长的高一致性、高动态性视频大模型Vidu;在Sora发布之前,已有不少国内创企率先采用了DiT架构。 近日在生成式AI大会上,许多嘉宾都谈到同一个话题:在技术创新层面,国内公司并不落后于海外,但往往最后会演变成某项技术先在国外活了,随后才被国内市场、投资领域注意到。 作为产业观察者和消费者,我们也应当更多关注国产技术的创新,期待国产大模型未来能涌现出更多适合本土用户的能力和应用。
新 iPad Pro 会用上 M4 芯片?我们收集了这些证据
2021 年起,iPad Pro 就开始享受跟 Mac 同级别待遇——搭载 M 系列芯片。而最近的传言显示,iPad 可能要「越级」了。 M2 版 iPad Pro 发布至今,已满十八个月。苹果将在 5 月 7 日的发布会上推出新款 iPad Pro,也已几乎是板上钉钉的事。不过,彭博社记者 Mark Gurman 带来了一个意外的消息: 新 iPad Pro 可能跳过 M3 ,直接搭载苹果全新的 M4 芯片。 Mark Gurman 称,M4 系列芯片包括内部代号为「Donan」的基础版、更强大的「Brava」,以及代号为「Hidra」的高端版本。而新款 iPad Pro,将首发基础款 M4。 从现在流传的消息来看,M4 芯片将继续采用台积电 3nm 制程,主要提升在于神经网络引擎性能,有望带来更流畅的 AI 体验。现阶段可以让 iPad Pro 的人脸识别等功能得到改进。 iPad Pro 将要搭载 M4 的消息并不是空穴来风。 前不久,9to5Mac 在 iOS 17.5 Beta 固件的代码中,发现了四款未发布的 iPad 型号标识符。 苹果会为每一款产品分配一个唯一的型号标识符,它通常由产品名称加上两组数字组成。以图上的标识符为例: 「iPad」表示这是一款 iPad 产品。 第一组数字(这里是 16)代表产品线。 逗号后面的数字(3、4、5、6)代表具体的型号。 根据苹果过去的型号标识符命名习惯,标识符中的「iPad16」对应的大概率就是新款 iPad Pro。但是,和之前不一样的是,iPad 这次似乎跳过了一个版本号。 此前,搭载 M2 的设备标识符为「14」(如 2022 款 iPad Pro 的「iPad14,3」和 2022 款 MacBook Air 的「Mac14,5」),M3 设备会使用「15」作为标识符(目前只有 Mac 使用)。 新款 iPad Pro 使用的标识符为「iPad16,x」而不是「iPad15,x」,可能表明新款 iPad Pro 并没有采用 M3 芯片,而是直接搭载了尚未发布的 M4 芯片。 另外一则消息也证实了这一可能。 最近,一位匿名泄密者在 X 上发布了一份「苹果芯片发展路线图」。据爆料者称,新款 iPad Air 将搭载代号为「t8112」的芯片,即 M2。 不过,新款 iPad Pro 却拥有一颗未知的「t8132」芯片。参考目前 M3 的代号是「t8122」,这颗未知的芯片更能说明 iPad Pro 搭载 M4 的可能性。 在最开始,苹果一直极力避免在各种产品的描述中使用「AI」或「人工智能」。 直到今年新款 Macbook Air 正式发布,苹果的宣传文案里才出现「AI」一词。 Mark Gurman 在《Power On》时事通讯中提到,他相信苹果会把 iPad Pro 作为「首款真正由人工智能驱动的设备」来销售。 并且在此之后,「苹果会把每一款新产品都作为人工智能设备来宣传」。 不过,五月的「放飞吧」线上发布会中的大部分内容,可能只是对 iPad Pro 硬件部分的介绍。关于苹果具体在人工智能领域的重大更新,还是要等到六月的 WWDC 开发者大会上才能知晓。 除了新芯片之外,下一代 iPad Pro 预计还将首次配备 OLED 显示屏,并可能会采用更纤薄的设计。 Mark Gurman 在此之前一直表示,这次的 iPad Pro 在外观上会是自 2018 年以来最大的更新。 从今年 2 月份流出的 CAD 图可以看出,新款 iPad Pro 的边角过渡会更加圆润、机身也会更加轻薄。 苹果在 5 月 7 日的发布会上还会有其他值得期待的新品。此前已有消息称,苹果这次将推出两款不同尺寸的 iPad Air,分别是 11 英寸版本和 12.9 英寸版本。 并且 iPad 配件也会获得更新。妙控键盘被重新设计,将配备更大的触摸板。新款 Apple Pencil 则会更新查找功能和「挤压」手势,还将新增「触感反馈」,使用上会更为便利。 近期准备购买 iPad 的朋友们,请稍事等待。
华为Pura 70系列开售半月:备货充足 “黄牛”割肉出货
财联社4月30日讯(记者 唐植潇),距离华为Pura 70系列产品正式发售已经过去了近半个月时间。 据财联社记者一线采访获悉,Pura 70系列并没有出现华为发布的Mate 60系列和Mate X5系列时长时间多平台缺货的情况。同时,在二手平台上不少卖家选择降价出售。 根据IDC最新发布的报告,在国内市场中2024年第一季度华为的市场份额为17.1%,与荣耀并列第一。有分析师预测,华为Pura 70系列的出货量在2024年可能会同比增长230%。 Pura 70系列备货充足,二手卖家“割肉”出手 4月15日,华为官宣P系列品牌升级为Pura。升级后的华为Pura 70系列也将成为新系列的第一款产品;4月18日华为官宣Pura 70系列开启先锋计划正式开售,与Mate 60系列一样并没有举办发布会。 在Pura 70系列发售当日,多地门店排起长队,Pura 70系列手机在首日出现了缺货的情况,有部分抢到了首发机器的消费者将机器加价了200-500元不等,上架二手平台。 然而该情况并未持续太久,不到三日时间,二手平台上Pura 70系列溢价情况已经消失,甚至出现了部分卖家降价出售的情况。 据财联社记者了解,从Pura 70系列上线发售开始,华为每日都会在官方线上商城开放一批手机销售。除了官方线上渠道之外,Pura 70系列产品还上线了京东和拼多多等电商平台,其中拼多多上4个版本都有货,只是配色和内存版本不齐。 日前,财联社记者走访了深圳地区的华为线下授权门店,店内销售告诉记者:“每个门店的不同配色和版本的手机配货有所差别,一般而言直营店的货最为齐全,但也不能保证买到某一特定版本的产品。” 随后他补充道,店内基本每隔几日都会补货,手机并不难抢,如果看好了想要的版本,不需要定金可以直接预约登记。 同时,财联社记者还了解到,此前Mate 60系列和Mate X5系列捆绑其他产品和延长保服务的情况,也不再出现。 有消费者对财联社记者表示,本来计划去华为线下门店购买Pura 70 Ultra,但是店内并没有心仪的配色,最终选择在二手平台上购买。“现在平台上的手机基本都没有溢价了。” 财联社记者注意到,以Pura 70 Ultra 1TB 顶配版为例,目前在二手交易平台上,已经拆封和激活版本售价已经跌至1万元左右,相较于官方定价的10999元,跌去了近千元。 线上卖家告诉财联社记者:“首发线下购买的(消费者)仅能购入一部,并且都需要拆封激活之后,才能提走,可能为了防止黄牛。本想着能够溢价卖出的,但过了几天一直都无人问津,只能‘割肉’降价出手。” 华为重回国内市场份额首位 根据IDC的最新报告,2024年第一季度,中国智能手机市场出货量约为6926万台,同比增长了6.5%。在该季度,荣耀和华为的市场份额均为17.1%,并列第一。其中华为Mate 60系列继续供不应求,nova 12系列占据华为全季度出货量的三分之一。 对于华为市场份额的强势上升,IDC认为,供应问题依然是限制华为出货量更进一步的关键因素。随着华为P系列全面升级为Huawei Pura,有望帮助华为出货量继续快速提升。 民生证券指出,Pura70 系列定位高端摄像,内嵌自研盘古模型,预计以AI摄影为核心亮点,因此摄像零部件有较大升级,包括镜头、旋涂滤光片、微稜镜、马达等。同时,华为在CIS图像传感器、射频芯片、卫星通信功能以及模拟芯片等方面的国产化进程也将加快,这将进一步推动相关产业链企业的成长。 根据官方信息显示,本次发布的Pura 70系列共有四款机型,分别是华为Pura 70 Ultra、华为Pura 70 Pro+、华为Pura 70 Pro和华为Pura 70标准版。其中Pura 70 Ultra在摄像头方面最为先进,后置主摄为5000万像素、1英寸底、伸缩镜头,具备传感器防抖和F1.6-F4.0可变光圈。 Pura 70 Ultra支持天通卫星通信和北斗消息,并且北斗消息支持发送图片信息。Pro+支持天通卫星通信,Pro支持北斗卫星消息,而标准版没有卫星通信功能。 据天风国际证券分析师郭明錤预测,华为Pura 70系列的出货量在2024年可能会同比增长230%,达到1300万至1500万部。即使需求有所放缓,出货量仍有望同比增长150%,达到1000万至1200万部。
新 iPad Pro 会用上 M4 芯片?我们发现了这些新细节
2021 年起,iPad Pro 就开始享受跟 Mac 同级别待遇——搭载 M 系列芯片。而最近的传言显示,iPad 可能要「越级」了。 M2 版 iPad Pro 发布至今,已满十八个月。苹果将在 5 月 7 日的发布会上推出新款 iPad Pro,也已几乎是板上钉钉的事。不过,彭博社记者 Mark Gurman 带来了一个意外的消息: 新 iPad Pro 可能跳过 M3 ,直接搭载苹果全新的 M4 芯片。 Mark Gurman 称,M4 系列芯片包括内部代号为「Donan」的基础版、更强大的「Brava」,以及代号为「Hidra」的高端版本。而新款 iPad Pro,将首发基础款 M4。 从现在流传的消息来看,M4 芯片将继续采用台积电 3nm 制程,主要提升在于神经网络引擎性能,有望带来更流畅的 AI 体验。现阶段可以让 iPad Pro 的人脸识别等功能得到改进。 iPad Pro 将要搭载 M4 的消息并不是空穴来风。 前不久,9to5Mac 在 iOS 17.5 Beta 固件的代码中,发现了四款未发布的 iPad 型号标识符。 苹果会为每一款产品分配一个唯一的型号标识符,它通常由产品名称加上两组数字组成。以图上的标识符为例: 「iPad」表示这是一款 iPad 产品。 第一组数字(这里是 16)代表产品线。 逗号后面的数字(3、4、5、6)代表具体的型号。 根据苹果过去的型号标识符命名习惯,标识符中的「iPad16」对应的大概率就是新款 iPad Pro。但是,和之前不一样的是,iPad 这次似乎跳过了一个版本号。 此前,搭载 M2 的设备标识符为「14」(如 2022 款 iPad Pro 的「iPad14,3」和 2022 款 MacBook Air 的「Mac14,5」),M3 设备会使用「15」作为标识符(目前只有 Mac 使用)。 新款 iPad Pro 使用的标识符为「iPad16,x」而不是「iPad15,x」,可能表明新款 iPad Pro 并没有采用 M3 芯片,而是直接搭载了尚未发布的 M4 芯片。 另外一则消息也证实了这一可能。 最近,一位匿名泄密者在 X 上发布了一份「苹果芯片发展路线图」。据爆料者称,新款 iPad Air 将搭载代号为「t8112」的芯片,即 M2。 不过,新款 iPad Pro 却拥有一颗未知的「t8132」芯片。参考目前 M3 的代号是「t8122」,这颗未知的芯片更能说明 iPad Pro 搭载 M4 的可能性。 在最开始,苹果一直极力避免在各种产品的描述中使用「AI」或「人工智能」。 直到今年新款 Macbook Air 正式发布,苹果的宣传文案里才出现「AI」一词。 Mark Gurman 在《Power On》时事通讯中提到,他相信苹果会把 iPad Pro 作为「首款真正由人工智能驱动的设备」来销售。 并且在此之后,「苹果会把每一款新产品都作为人工智能设备来宣传」。 不过,五月的「放飞吧」线上发布会中的大部分内容,可能只是对 iPad Pro 硬件部分的介绍。关于苹果具体在人工智能领域的重大更新,还是要等到六月的 WWDC 开发者大会上才能知晓。 除了新芯片之外,下一代 iPad Pro 预计还将首次配备 OLED 显示屏,并可能会采用更纤薄的设计。 Mark Gurman 在此之前一直表示,这次的 iPad Pro 在外观上会是自 2018 年以来最大的更新。 从今年 2 月份流出的 CAD 图可以看出,新款 iPad Pro 的边角过渡会更加圆润、机身也会更加轻薄。 苹果在 5 月 7 日的发布会上还会有其他值得期待的新品。此前已有消息称,苹果这次将推出两款不同尺寸的 iPad Air,分别是 11 英寸版本和 12.9 英寸版本。 并且 iPad 配件也会获得更新。妙控键盘被重新设计,将配备更大的触摸板。新款 Apple Pencil 则会更新查找功能和「挤压」手势,还将新增「触感反馈」,使用上会更为便利。 近期准备购买 iPad 的朋友们,请稍事等待。
华为Pura 70系列手机现身马来西亚SIRIM认证网站,暗示将在海外发售
IT之家 4 月 30 日消息,据 TechNave 报道,华为 Pura 70 系列标准版和 Pro 版出现在了马来西亚 SIRIM 认证网站上。此前该系列手机已经在国内发售,此次亮相马来西亚认证网站似乎暗示新机将在全球市场推出。 SIRIM 认证是马来西亚的一项强制性产品安全认证,涵盖电气和数字设备的安全标准。此次获得 SIRIM 认证的型号分别为标准版的 ADY-LX9 和 Pro 版的 HBN-LX9。这或许意味着该系列将率先登陆马来西亚市场,随后陆续在全球其他地区上市。至于 Pro + 和 Ultra 版本是否会在全球上市,目前尚不明确。 IT之家需要指出的是,华为尚未正式宣布 Pura 70 系列的全球上市日期,但从其现身 SIRIM 认证来看,新款旗舰手机有望很快在海外市场发售。 华为 Pura 70 系列的标准版和 Pro 版都将采用 OLED 显示屏,屏幕尺寸分别为 6.6 英寸和 6.8 英寸,并支持 120Hz 刷新率。同时还将配备昆仑玻璃,拥有出众的抗摔能力。 华为 Pura 70 标准版在相机方面采用后置 5000 万像素主摄 + 1300 万像素超广角 + 1200 万像素潜望式长焦的组合,前置则为 1300 万像素超广角摄像头。此外还配备 4900mAh 电池,支持 66W 超级快充。Pro 版后置三摄由 5000 万像素主摄 + 1250 万像素超广角 + 4800 万像素潜望式微距镜头组成,支持 3.5 倍光学变焦和 100 倍数字变焦。
三大机构排名各异:荣耀、华为、vivo谁才是手机销量第一
快科技4月30日消息,近日,IDC、Canalys、Counterpoint这三大市场调研机构先后发布了一季度中国智能手机销量及市占率数据。 然而,这三家的排名却不尽相同,根据IDC的数据,市占率前5分别是荣耀、华为、OPPO、苹果、vivo。 Canalys发布的前5分别是华为、OPPO、荣耀、vivo、苹果;而Counterpoint发布的前6则分别是vivo、荣耀、苹果、华为、OPPO、小米。 三个不同的排名也让大家一头雾水,到底谁才是国内市占率最大的手机品牌? 其实造成数据差别较大的主要原因之一,就是不同市场调研机构的统计口径不同。 据了解,IDC和Canalys统计的是sell in数据,即厂商向大商或者省代的出货量;而Counterpoint统计的是Sell Through数据,可以理解为激活量。 不过虽然三家机构对于谁是“第一”有所分歧,但有几点却达成了统一。 首先就是华为手机的大幅度增长,根据IDC数据,一季度华为手机的增幅量达到了110%;Canalys统计的华为也是大幅增长70%,和Counterpoint统计的69.7%的增幅接近。 还有就是对苹果手机在中国市场的“溃败”也是意见统一,在IDC、Canalys 、Counterpoint的统计中,苹果一季度在中国市场市占率同比跌幅分别为6.6%、25%、19.1%。 从左到右分别为IDC、Canalys、Counterpoint的统计数据
三星电子在德国被判侵犯大唐网络技术专利,面临市场驱逐风险
【环球网科技综合报道】近日,慕尼黑地方法院就一起专利侵权案件作出裁决,认定三星电子侵犯了中国大唐集团所持有的一项重要网络技术专利。这一判决意味着三星电子可能面临被驱逐出德国智能手机市场的风险。 图片来源:三星 根据4月29日由业内人士披露的消息,该法院于4月12日正式裁定,三星在德国销售的支持LTE的移动设备确实侵犯了大唐在德国的专利技术,因此,法院责令三星处置所有侵权机型。值得注意的是,不仅三星电子,包括苹果在内的多家公司的LTE智能手机都采用了这一专利技术。 据了解,该专利技术主要涉及时分双工(TDD)技术,它能确保用户在移动过程中,智能手机与基站之间能保持无缝连接。此技术被视为LTE(第四代)标准的必要组成部分,且已在欧洲电信标准协会(ETSI)注册,允许在遵守与专利持有人协议的前提下合理使用。 在诉讼过程中,三星电子曾主张“FRAND条款”,即“公平、合理和非歧视”原则,意在防止专利持有人提出不合理要求,阻碍其他公司产品的生产。然而,法院并未接受这一辩护。 据悉,三星电子与大唐自2020年起就4G和5G国际标准专利的使用进行了多轮谈判,但因双方分歧较大,三年多来一直未能达成协议。 在此次判决中,慕尼黑地方法院将三星电子认定为“不愿意的被许可方”,并判决三星必须对自2021年8月21日起在德国销售的所有LTE智能手机型号支付赔偿,并对所有已发布的市场型号进行处置。 业界人士认为,此判决可能对三星在德国智能手机市场的地位产生重大影响。由于三星可能对一审判决提起上诉,其市场影响力或许会暂时得以维持。但这一事件无疑给三星电子带来了严峻的挑战,并可能对其在全球范围内的商业布局产生深远影响。
再度跳票 三星S25 Ultra仍未搭载叠片式电池 都怪高通?
作为三星下一代旗舰机型,三星S25系列按照计划可能会在明年1月左右亮相,相比于当前的S24系列,此前新机所透露的一大关注点就是将搭载全新的叠片式电池,从而提升S25 Ultra的电池容量。不过根据最新的消息,该技术可能在S25 Ultra上再度跳票。 三星S24 Ultra 有海外博主表示,出于整机成本考虑,三星无奈延后推出叠片式电池,三星S25 Ultra依旧为5000mAh+45W规格。而所以要节省成本,是因为高通将对下一代芯片骁龙8 Gen4进行涨价。根据此前消息,三星将会在S25系列上采用双芯片的策略,部分机型上使用Exynos 2500处理器,而在Ultra版本上都将使用骁龙8 Gen4。 由于下代高通将在8 Gen4采用定制的Oryon内核,因此新移动平台也将有着更高的价格,据称起售价已经达到了200美元。除非三星也再度涨价,否则将会影响到公司利润。因此为了控制成本,三星不得不放弃使用新的叠片式电池技术,可能会在S26系列上再出现。 据了解,叠片式电池主要应用于电动汽车领域,这种新的设计不仅能提高安全性,减少鼓包等现象,而且在相同重量和体积下,可以让电池容量增加10%。此前曾有消息称该技术最早将会在S24系列上出现,但是可能是因为供应方面的问题,最终还是未能实现。
前4月主流国产机型全汇总:小米仅两款 vivo月月有新机
随着手机市场的回暖,国产手机市场在今年迎来了新一轮的机型发布潮。据网友汇总的“2024年主流国产机型发布统计”图表,今年1至4月间,国内各大手机厂商纷纷推出了各具特色的新机型,其中vivo表现尤为抢眼,月月都有新机问世。而小米虽然只有2款新机问世,但市场表现依然稳定。 小米手机 从统计表中可以看出,华为等厂商在年初率先行动,发布了多款机型,如畅享70 Pro。整个一季度过后,Redmi才在4月推出了一款机型——Turbo 3。相比之下,vivo则展现出了强大的产品更新能力,做到了每个月都有新机推出,如1月的G2 5G、2月的Y100t、3月的X Fold 3系列以及4月的Y200i等,产品线覆盖多个价位段,满足了不同用户的需求。 荣耀、OPPO、一加等品牌在前四个月内也均有所动作。其中,荣耀在1月发布了Magic6系列等多款机型,OPPO则推出了Find X7系列,一加则带来了Ace 3新品。此外,realme和iQOO也各自推出了多款新品,其中,realme在2-4月均有新机推出,而iQOO直到4月才一口气发布Z9系列3款机型。 vivo手机 整体来看,今年前四个月国产手机市场呈现出百花齐放的态势,各大厂商纷纷推出新品,竞争激烈程度不减当年。可以肯定的是,随着技术的不断进步和市场的不断变化,5月及之后的国产手机市场将迎来更多精彩纷呈的机型。
非洲之王传音业绩炸裂,利润翻倍,出货量全球第四
文|胡依婷 编辑|彭孝秋 2023年,“非洲之王”传音强势翻身。 其近日公布的年报显示,全年营收为622.9亿元,同比增长33.69%;净利润为55.3亿元,同比增长122.93%,颇为亮眼。 其中,手机业务仍占传音总营收的大头,占比超九成。去年其全球出货量约为1.94亿部,手机的收入便已达到573.4亿元。 从市场来看,传音“非洲之王”的地位依旧稳固。2023年非洲智能机市占率超过40%,位居第一,与第二名的三星拉开较大差距。非洲之外,传音在巴基斯坦和孟加拉国的市占也较高,均排名第一;在竞争激烈的印度排名第六。 依靠智能手机在非洲站稳后,传音也不出所料开始拓宽业务并进入新兴市场。除TECNO、itel、Infinix三大手机品牌外,传音还创办数码配件品牌oraimo,售后服务品牌Carlcare和家用电器品牌Syinix,寻求新的增长。 截至目前,传音已进入全球超过70个国家和地区,覆盖非洲、南亚、东南亚、中东和拉美等新兴市场。这类市场人口基数超过40亿,智能手机行业发展稍显滞后,于擅长性价比与本土化的传音而言,空间颇大。 逆势复苏 近两年,全球手机行业呈下行态势,传音也经历了较大起伏。 2022年,传音全球出货量同比减少了超4千万部,净利润同比下滑36.46%。面对行业普遍的增长乏力,传音选择打开更多市场,提升整体出货量。 去年,其深入南亚、东南亚下沉市场;同时,传音也试探中高端市场,推出了Phantom VFold折叠屏手机和TECON品牌的手机AIOS,并与谷歌、联发科等第三方合作。 多处发力,半年就让出货量同比增长20%。这一显著增速也使传音首次超越vivo,成为全球智能手机出货量前五名,并逐渐逼近第四的OPPO。与同期的三星、苹果、小米和OPPO相比,传音还是Q2唯一增长厂商。 此后的Q3、Q4,传音主场非洲强势复苏。公司也实现了出货量大幅增长:Q4智能手机出货量达到2820万部,同比增长68.6%,首次跃升全球第四。业绩上,这两个季度,传音的营收均保持同比超30%的高速增长,净利润增速翻倍。 把市场铺大的同时,传音还做到了控制毛利以提升赚钱效率。去年全球手机业务的毛利率为24.18%,同比提升3%,比小米的14.6%高出不少。 不同产品营收情况,图源企业 毛利提升有赖于传音在生产等环节的成本控制。近些年传音对供应链进行了调整:除华勤、龙旗和闻泰手机代工“三巨头”外,传音的三大手机品牌还与MobiWire和Innovatech这类二级ODM厂商合作,议价权提升的同时部分生产制造成本也被转移。 跟随非洲复苏趋势,传音对外加大出货量,通过内部的成本调控,实现营收与净利润的大幅增长。 深入南亚、中东和拉美 增长的野心尚未满足。传音将目光从遥远的非洲投回了竞争更为复杂的亚洲、被众多企业垂涎的中东和拉美。 传音公布其在印度市占已升至第六。获得增长固然可喜,但这片贸易保护已较为显现的南亚大陆,或许并不算新兴与稳定。 小米、vivo和OPPO等在2014年前后便已进入印度,与三星一同占据着市场主导地位。Canalys数据指出,2023年三星、vivo和小米排名前三,其中三星以19%的市场份额位居榜首。 除头部品牌已经产生外,印度政府对外国厂商的排斥与打压也使营商环境更趋恶化。2022年,印度政府对小米实施了65.3亿卢比(约合5.6亿人民币)的罚款,此后还指控其非法汇款,冻结其约48亿元银行资金。除小米外,vivo、OPPO和传音也被指控逃税、避税,强制缴纳税款与罚金。 在已然产生的罚没成本外,传音或许还面临核心价位产品被禁售风险。据报道,印度计划限制售价在12000卢比(约合150美元)以下的中国手机设备。而传音的机型价格大多处于这一区间,若该计划实施,传音在印度的销量或面临崩盘。 即使目前靴子还未落地,但始终悬在传音等中国企业的头顶。 与印度相比,拉美地区可能更适合传音长期深探。 当下,这类新兴市场尚处于功能机向智能机过渡阶段。此前传音在非洲已积累较深的生产与销售经验。 这类市场普遍存在电力供应不稳定、网络信号不佳、流量成本高等问题,功能机由此仍占据较大市场份额。为适应当地需求并推动智能机份额提升,传音研发了流量节省、弱网络连接、内存融合、本地化小语种语音识别、语音降噪等技术;针对不同肤色人种,其对屏幕显示的色彩科学进行研究,以满足当地消费者的视觉习惯。 2023年,传音凭借在智利、墨西哥和秘鲁等核心市场的布局,年增长率已经达到159%,紧跟拉美整体手机出货量复苏的趋势。 而在中东,传音与小米分食着当地的中低端市场,并逐步提升中高端比重,尝试进入三星和苹果统治区。 Canalys数据显示,去年中东手机总出货量也同比上涨,其中三星的市占高达34%,并与苹果拿下超90%的高端手机市场;传音和小米分列第二与第三,目前销量集中在中低价位。 拉美、中东已经成为中国手机厂商普遍认定的掘金方向。传音已在远端的非洲大陆蓄足弹药,其将与全球老牌手机厂商在新的市场再度角逐。
两起事故三人死亡:福特“脱手驾驶”辅助系统被盯上
快科技4月30日消息,据美媒报道,美国汽车行业的最高监管机构国家公路交通安全管理局(NHTSA)周一在官网公开的文件显示,该机构已于上周开始对福特汽车公司的BlueCruise驾驶系统启动初步调查。 据了解,福特BlueCruise驾驶系统和特斯拉Autopilot类似,也是L2级别的自动驾驶辅助系统,最大的卖点在于允许驾驶员双手脱离方向盘,让车辆自动驾驶(包括自适应续航、变道辅助、车道居中等),目前这套系统搭载于福特电马和其他SUV之上。 福特官方还标注了这套系统可使用的范围,也就是“蓝区”,目前在美国和加拿大有97%的高速公路均可以使用,在英国也有95%的高速可用。 那么为何NHTSA会盯上福特呢?原因和特斯拉的AP类似,也出现了严重事故。 据悉,今年2月和4月初,在得克萨斯州和宾夕法尼亚州发生两起事故中,涉事的两辆野马Mach-E在撞击时均开启了BlueCruise,并且均是在夜间行驶时撞上了停在高速路上的汽车,两起事故共导致3人死亡。 资料显示,福特于2021年推出BlueCruise,仅在预先测绘过的高速公路上可用,其虽然允许驾驶员双手从方向盘上拿开,但这套驾驶系统与监控驾驶员的摄像头配对,实时检查驾驶员的眼睛是否仍盯着道路,一旦检测到驾驶员不再关注道路,系统就会发出警报,若驾驶员无视警告,系统则会“踩刹车”减速进行提醒。
车模有什么好看的
十多年前,一场国际车展还没结束,车模先火了; 十多年后,车模几乎彻底消失。 2024北京国际车展,就连陈小春、张智霖、金晨等大牌明星都没引起太多关注,媒体的镜头追踪的是雷军、周鸿祎、李想、李斌、魏建军、张建勇等企业家的行程。 拼尽全力的CEO与老板们,将车展的“卷”推向极致。这真的是最“卷”的一届车展:不仅要卷价格、卷产品、卷技术、卷流量,还要卷老板。 不过,行业大佬的走红算得上一件好事。在这些企业家背后,是中国正在崛起的新能源汽车产业。2024北京国际车展上,外国友人、合资品牌大佬们开始驻足于中国品牌的展台,并惊叹于中国在智能电动车领域突飞猛进的发展。 “这是车展该有的样子,关心新车,关心中国汽车制造,关心中国的企业家们。”一位从事汽车行业报道近二十年的媒体人这样感慨。 卷老板:个人魅力与流量焦虑 本届北京车展,身着绿色T恤的小米创始人雷军和身着红衣的360集团创始人周鸿祎成了最大的流量明星。 雷军在车展上公布了小米SU7正式发布28天后的成绩:锁单量75723台,已交付 5781台,创下了业内新品牌首款车型上市首月的交付量新纪录。雷军甚至直接在车展现场开启全球招聘:“诚邀天下英才,打造梦想之车,为中国汽车工业崛起而奋斗。”颇有当年马斯克的风范。 图片来源:广汽集团 同时,雷军的车展行程被全程关注,他除了参观了理想新车,还去了比亚迪、蔚来、小鹏以及广汽等车企的展台,都受到了友商高管热烈欢迎。4月26日,雷军在社交平台发视频称,这2天在车展走了近5万步,看展非常开心。他称在车展被这么多人围着,还是挺紧张的。 另一边,车展上爬上车顶的周鸿祎获得了本届车展“最老车模”的头衔。流量带来的关注度让周鸿祎顺势大赚一笔。4月28日晚,“卖掉迈巴赫,拥抱国产新能源”为主题的周鸿祎卖车拍卖会在北京三六零总部举办。周鸿祎迈巴赫以600元起拍,最终以990万元成交,最高价较起拍价涨幅远超10000倍。拍卖会当天,三六零大厦楼下停放了理想、小鹏、长城、小米、哪吒等多款车型。周鸿祎凭借一己之力,撬动了半个车圈品牌赶来助阵。 当科技企业大佬投身汽车圈,卷老板、卷流量的焦虑也被一起带来。事实上,在小米SU 7上市后,不少车企高管就意识到了老板个人魅力所带来的流量对于产品推广乃至最终销量的重要作用。 62岁的奇瑞董事长尹同跃在直播间感叹:向余承东学习,向雷军学习。60岁的长城汽车董事长魏建军近期更是一改此前的低调形象,走进了直播间,开始直播长城全场景NOA。魏建军在北京车展期间感慨,“最近我适应镜头的能力有所增长。” 对于小米、华为等科技企业如今在造车领域飞速的发展,上汽大众总经理贾健旭向中国新闻周刊表示,“他们对软件的理解远远超过我们,但是我们可以成为一个Fast Follower(快速跟随者),紧紧地赶上他们。” “不要看了别人的想去复制它,扔掉我们现在有的,那是很大失误,所以我们一定要有定力,同时要看见自己之美,不要妄自菲薄,尊重别人之美,美美与共。”贾健旭如是说。 而目前汽车行业的流量焦虑几乎影响着身在其中的每一家企业。“应该说有(指流量焦虑)吧。”smart品牌全球公司CEO 佟湘北向中国新闻周刊表示,“互联网的打法和传统造车的互联网打法是不一样的,有的很值得我们学习借鉴,但是也有很多是超乎我们想象的。”佟湘北直言,在宣传和推广方面确实需要学习。 卷价格:国内比低价,出海卷高价 从去年年初开始的汽车价格战持续至今,同等级别、同等性能的产品在国内售价越来越便宜。不过,在中国汽车品牌的出海浪潮中,不少品牌在尝试品牌形象的高端化,希望将产品卖出更好的价格。 据不完全统计,进入4月以来先后有超过30家车企宣布了降价优惠信息。2024北京车展前,理想也官宣了价格调整信息。理想L7和L8的低配Pro版降价1.8万元,Max和Ultra降价2万元;理想L9全系降价2万元。而理想MEGA作为一款全新纯电MPV,上市不到两个月,官降3万元。合资品牌方面,广汽丰田2024款赛那也在上市环节全系官降2.5万元,新车售价区间为28.48万-39.58万元。 “电动化、智能化的变革,从一个维度上来讲,已经把品牌格局、市场格局完全打碎,现在也不敢有哪个品牌说有牢固的品牌溢价。”长城汽车总裁穆峰告诉中国新闻周刊,根据2023年全年价格走势追踪,无论是BBA还是传统一线合资品牌,都稳不住价。 “现在中国市场很卷,大家堆砌配置堆料,同时降价。”在佟湘北看来,这种模式是不可持续的,“在这样局势下,我们不堆料,而是根据用户习惯和需求量体裁衣,这是我们的策略。” 在以往,豪华品牌及一线品牌的降价,势必将压力传导给中国品牌。不过,如今不少中国品牌在压力中实现了品牌的向上跃迁。穆峰表示:“整个一季度,我们车的平均价格有了很好的一个提升。均价提升了,营收就提升了。”财报数据显示,长城汽车一季度实现营业收入428.6亿元,同比增长47.6%;净利润32.28亿元,同比增长1752.55%。“长城汽车追求有质量的市场占有率。既要看当下也要看未来,不盲目内卷。长期主义和价值主义是长城汽车品牌发展核心。”穆峰说。 在国内价格极度内卷的今天,海外市场为中国品牌提供了广阔的发展空间。魏牌CEO刘艳钊告诉中国新闻周刊:“我们在欧洲的定价与BBA品牌直接竞争,价格区间从四万几欧元到六万欧元,在长城汽车子品牌里面,魏牌新能源应该说是新能源、智能化技术的双料先锋,在内部定位是长城最高端的技术赋能品牌,所以魏牌走向全球市场,也代表着GWM技术和产品体验的新高度。”行业内卷同时带来行业的深度变革,这将是一次大洗牌,也蕴含着发展机会。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。