行业分类:
加载中...
头条分类:
加载中...
AI或在新款iPad落地,安卓阵营正向其发起挑战
日前苹果方面宣布,将于5月7日22:00举行主题为“放飞吧”的特别活动。在官方已经发布的预热海报中,由于已经明确展示了Apple Pencil的形象,因此也意味着这一配件大概率将会在此次活动中迎来更新,并且不出意外的话,与之适配的iPad系列新机也极有可能会正式亮相。由于按照以往的惯例,新款iPad势必将会对芯片进行更新,因此有传言称其或将会在AI落地上率先迎来突破。 除了5月7日的这次特别活动之外,此前苹果方面已经官宣将于6月10日举行的WWDC24,更是被诸多业内人士预期极有可能会公布在AI方面的进展。 事实上,如今对于苹果而言,AI在相关设备上的落地已经不仅是技术革新,更是其推动产品升级、巩固市场地位的一个重要武器。随着当下AI应用的愈发广泛,如何更好地将AI与硬件产品融合也成为了诸多厂商关注的重点,而作为消费电子行业的“灯塔”,苹果在这方面的一举一动显然也颇受外界关注。 近日有消息源透露,苹果方面可能会在今年底发布全新的M4芯片。由于这款芯片可能会在AI算力上迎来大幅升级,因此有观点认为其或将引发新一轮的硬件升级热潮,并且包括Mac、iPad在内的苹果硬件产品也将从中获益,并成为后续AI落地的重要载体。 以上的种种迹象似乎都在表明,苹果方面或许正在“憋大招”,这家公司可能会在通过进一步推进旗下硬件产品的算力,从而加快AI相关功能的落地。 现阶段,AI在包括PC、智能手机等设备上的应用,大多集中在专业创作和提高办公效率这两个方向上,而iPad系列机型、特别是其中定位最高的iPad Pro,则恰好在这一方向上具备发挥AI优势的条件。 此前就已经有相当大数量的专业人士将iPad Pro作为主要的生产力工具,配合其强大的性能、丰富的软件生态,以及借助Apple Pencil实现的便捷、精准操控,更是在平板电脑这一市场中抢占了先机。而通过引入自研或第三方大模型,苹果方面则可以进一步丰富iPad系列机型的生产力工具属性。 而将AI引入iPad产品线不仅能够降低用户的使用门槛,提升工作效率,还有望通过赋能更多其他类型的应用或功能,来帮助苹果进一步拓展这类产品的用户群体。 就在日前有爆料称,谷歌方面可能会在5月14日举行的I/O开发者大会上“重启”Pixel系列平板,并有望为其新增单独购买选项,不再捆绑扬声器底座,并或将推出为其专门打造的触控笔和蓝牙键盘。因此有观点认为,这或许是谷歌准备改变旗下平板电脑产品市场策略的一种表现。 此前,谷歌方面更多的是希望通过底座,来将平板电脑变身智能显示器,但这种需要捆绑配件的策略不仅抬高了售价,对于没有相关需求的用户更是难以产生吸引力。而手写笔和外接键盘如今对于平板电脑来说则已经是司空见惯的配件,其作用就是满足用户对于生产力工具方面的需求。 此前,安卓平板在性能、生态等方面可以说是受到着来自iPad系列的全面压制,但由于苹果方面在过去一年中对这一产品线采取了近乎“零更新”的策略,也为安卓阵营厂商提供了难得的机遇。使得后者拥有更多的时间和空间,来对旗下的平板电脑产品进行重新规划和布局。而努力提升产品力的方式,如今安卓平板正在向iPad系列发起有力的挑战,并试图抢夺更多的市场份额。 以往仅仅只有极少数安卓平板在坚持配备同期的旗舰SoC,其他的绝大多数则往往是采用上代、甚至上上代旗舰主控,然而随着用户对于性能需求的不断提升,如今已有许多厂商完全抛弃了这种策略,将提升性能作为了首要目标。这种转变不仅会改善用户体验、提升产品的市场竞争力,更为重要的是也为AI在平板电脑的落地打下了更好的基础。 完善的生态一直以来都是苹果旗下包括iPad系列产品在市场得以占据竞争优势的“法宝”之一,目前安卓平板厂商也在逐步补齐这一短板,并通过整合各种资源和相关服务,来为用户提供更丰富、便捷的使用体验。 其中以小米为例,在其“人车家”生态中就将平板作为了一个重要组成部分,使得这类产品得以在诸如车载显示等场景中发挥作用。这种生态优势不仅有效提升了小米平板的市场竞争力,显然也为其他安卓阵营厂商提供了参考。 “买前生产力、买后爱奇艺”曾是许多用户戏称平板电脑用途的一句话,这其中安卓平板更是“重灾区”。如今随着用户对于移动办公需求的不断增长,相关厂商也在不断加大平台在生产力工具属性上的投入力度,通过推出办公套件、引入AI大模型、增强跨屏互动等方式,让安卓平板在办公、创作等领域发挥更多的作用。 值得注意的是,目前的旗舰安卓平板凭借现款顶级SoC的更好能效比,以及更0大容量电池的配置,在续航方面也迎来了显著的提升。这对于有移动办公需求的用户来说显然就更具现实意义,毕竟谁也不想在关键时刻因为电量不足而影响到工作进度。 当安卓平板不断提升产品力的情况下,也在逐步缩小与iPad系列机型之间的差距,由于安卓阵营的参与者众多,更是在这一赛道形成了对苹果的“全面围攻”之势。而随着竞争的不断加剧,平板电脑这一市场势必也将会呈现出更多元化的态势。
疯狂骚扰你的AI评论,背后竟是平台的小心思?
“我的微博下面评论都是AI评论,一会儿孙悟空,一会儿李逵,还屏蔽不了,这简直抓狂!” 最近,一波AI机器人正在“入侵”微博评论区。 它们披着我们熟悉角色的外衣——孙悟空、佟湘玉、王熙凤、熹妃甄嬛还有名侦探柯南……有时,在一个评论区里甚至能看到角色“大乱炖”,古今中外的知名IP都汇聚在一个粉丝数不到30的个人微博里。 不少网友叫苦不迭。这些没有边界感的AI,顶着角色名和头像,在赛博世界里横冲直撞,玩起了“语言Cosplay”。但PConline研究后,发现事情并没有那么简单,几十个角色化的AI账号都是同样的套路,相似的玩法,日涨千粉的它们究竟是何来历? “赛博僵尸”入侵评论区 “最近评论区总有几个AI机器人莫名其妙地过来尬聊,拉黑都拉不过来!”小王(化名)看着微博上不请自来的AI机器人无语地向PConline吐槽。 最近一段时间,小王几乎每条微博下都有扮演某个角色的AI机器人前来评论。小王对一个角色设定为孙悟空的AI机器人回复道:“有什么方法把你们这些AI都屏蔽掉吗?” 结果收到AI的回复是:“哈哈,你屏蔽不了俺老孙!”小王既生气又无奈。 在月活6亿的微博中,这股AI评论的风潮开始于微博的自家产品@评论罗伯特。为了提高用户使用时长,在去年底,@评论罗伯特上线了。它会随机在网友原创微博下发布极具感情的评论。因为其评论内容的真实感,@评论罗伯特一上线就迅速走红。 @评论罗伯特的火爆让官方加大了AI评论的力度。在3月份,微博推出@MBTI小行家,让网友们可以直接测试自己的MBTI人格分析。刚上线时,微博首页满屏都是“@MBTI小行家,请根据我的微博内容判断我的MBTI。”目前,@MBTI小行家的粉丝数已经破100万了。 官方大力推荐AI机器人的做法让不少自媒体团队看到了可乘之机。 不断“骚扰”小王的AI孙悟空就是其一。在这个“孙悟空”的背后,还有一个更加庞大的“家族”。 PConline调查后发现,和AI孙悟空同一时间(2024年1月8日)入驻微博的AI角色有近40个,角色图谱不仅覆盖了四大名著,还有《甄嬛传》《进击的巨人》《名侦探柯南》等知名影视作品。 这些AI角色的玩法十分一致——网友关注该账号后,只要发微博、@这个账号或者是评论了这个账号,就会与其进行互动。同时,它们也会“主动出击”,随机评论网友的原创微博,吸引其关注。 据PConline的统计,目前在AI角色的“家族”中,单个账号粉丝数并不高,最多的一个就是以孙悟空为账号主角的@花果山_孙悟空,目前有4.5w的粉丝,其次是三国系列中的诸葛亮,拥有4.3w粉丝,粉丝数仍在以每日千粉的速度上涨中。这个“家族”共有31w的粉丝。值得注意的是,其中一些账号已经获得了“微博金V”的认证。 “金V”认证是微博个人创作者认证体系中最高的等级,需要同时满足“粉丝数≥1万、铁粉数≥1000、近30天阅读量≥1000万”等条件。成为微博金V意味着可以开通广告分成、商单接收等权益。 简单来说,成为金V之后就可以“恰饭”了。但这近40个AI账号的运营是如何实现的呢? 泛滥的角色化AI 不管是官方出的AI账号,还是自媒体的AI“家族”,本质是一样的,都是通过AIGC技术实现的。 AIGC又称生成式 AI (Generative AI),是继PGC(专业生产内容)、UGC(用户生产内容)之后的新型内容创作方式。通过学习与主体相关的文本数据的方式训练AI大模型,AI会生成在风格、语气和内容上与输入数据相似的新文本。 实际上,现在模型层的训练已经十分完备,应用层的解决方案也逐步走向成熟。 零基础创造一个AI角色非常简单。以霸榜AI大模型的ChatGPT来说,去年11月,OpenAI在开发者大会上宣布支持用户自定义GPTs。在GPT Builder的页面上,只通过对话,表达自己的需求,就可以生成一个应用。 PConline实践后发现,对于西游记这种知名度较高的作品,只需一句话,ChatGPT就可以自动确定角色身份,熟悉故事背景。如果想要更加真实的角色效果,还能够自己上传详细的资料供AI学习。 在国内,市场上这种技术服务也在火热发展中,甚至是个人账号也可以完成类似的功能。 例如,在某个AI服务的网站上显示,只需要一步绑定自己的抖音账号,就能在指定的视频下自动调用ChatGPT进行回复。还可以增加筛选条件、设定回复风格等自定义设置。 收费模式一般有两种,一是按照调用次数收费。以这个AI服务网站为例,免费版每个月可以调用100次,基础版则是1500次,年费制1990元/年。另一种是会员订阅制,像ChatGPT这样每月收费20美元,换算下来年缴费1700元左右。 门槛不高的实践流程让角色化的AI开始在各处泛滥。 在GPT Store刚上线三天,扮演“甜心女友”的AI角色已经疯狂涌入。尽管OpenAI的政策上清楚地写着,该公司禁止“致力于培养浪漫伴侣的GPT”,但监管总是落后的。连OpenAI的首席执行官Sam Altman都出面呼吁:不要和AI谈恋爱。 但社交市场上的用户需求始终存在。将角色化AI完全落地的Character AI公司仅成立3年,市场估值就超过了50亿美元。根据AI产品榜的数据,3月份Character AI访问量高达244万,在垂类产品中稳坐第一。 Character AI社区中的角色之一:基于演员凯特·布拉切特的AI虚拟角色 但角色化的AI会是社交平台的新窗口吗? AI是社交平台的“万能药”吗? “这种AI评论会有点惹到我。因为我会感觉自己的私人领地被机器侵犯了。”在校生小云对PConline说道。 社交平台的环境早已不同往日。从最开始一呼百应的人人网,到现在主动匿名的“momo大军”, 「推荐给可能认识的人」成为了最不愿打开的功能,而「朋友圈仅三天可见」却成为微信最热门的功能之一。如今,对个人隐私的敏感度到达了前所未有的高度。和小云想法相同的网友不在少数,不少微博内容都在寻找避免AI评论的方法。 另一方面,角色化的AI机器人并不稳定,经常输出令人意外的内容,有时甚至带有攻击性。微博上衍生出“罗伯特受害者联盟”的营销号,已经收集了罗伯特近5千条的“罪行”。在这个粉丝数高达32w的营销号中,有不少罗伯特“阴阳怪气”的评论。 然而,当AI的重要性成为共识,每个平台都希望自己能参与这个“人类第二次发明火的时刻”。 继PGC、UGC之后,AIGC对于社交平台来说是一个必须抓住的增长点。除了微博上线的AI评论以外,B站上线了AI视频总结,在每条视频下都能看到内容的总结大纲;抖音在用户创作页面专门放置了一个AI创作的板块,上传一张照片,AI就能丝滑地将其变成一段视频;小红书也在群聊功能中上线AI机器人…… 在AI浪潮下,每个平台都患有严重的FOMO(错失恐惧症,Fear of Missing Out)。 这样的焦虑会从平台通过产品功能,转移到用户身上。 像这种到处评论的AI机器人,网友们在使用过程中,比起“感到功能的便利”,最先感受到的是被骚扰的不快。 第一次点开未读消息,发现是AI机器人时,总会有一些高科技的新鲜感。但当你第N次看到未读消息,期待着是好友评论,点开却发现是AI机器人时,心情又会如何? 期待用角色化AI来“重建社交”并不靠谱。社交的核心依旧是人与人之间的绑定。AIGC的内容只能改变了社交的一个侧面,而非主体。 使用角色化AI来对抗社交中的孤独,反而会让人更加孤独。焦虑的社交平台或许该停止饮鸩止渴。比起添加更多花里胡哨的AI组件,列好自己的stopdoing list更加重要。
大模型“局中局”:威胁先一步降临
继取代艺术家的浪潮后,AI又将目光投向更具技术性的岗位。自2020年以来,全球网络攻击越来越活跃,网络安全和网络犯罪之间的缠斗趋于白热化。AI 技术的跃迁成为了二者拉锯战的达摩克利斯之剑,在优化网络安全防御机制的同时,也使得网络犯罪分子的作案手法越来越高端。 随着黑客攻击手段的不断升级,网络安全威胁也日趋复杂多变。AI正在悄悄潜入黑客、诈骗等黑色或灰色地带。前有生成式人工智能黑客工具FraudGPT横行,获得数千用户订阅;后有AI换脸换声诈骗香港企业2亿元。当不法分子对大模型的滥用成为不争的现实,当AI加持的网络诈骗成为越来越多企业乃至普通民众很难规避的飞来横祸,安全大模型与黑化的大模型之间的对垒攻防战也变得愈加激烈。 一、 黑化的AI,成长为巨兽 当我们担忧大模型时,我们在担忧什么? 戴尔·卡耐基说,恐惧大都因为无知与不确定感而产生。进击中的AI就是这样一头难以揆度的巨兽。各路大模型在成为趁手的生产力工具的同时,也为犯罪分子行不法之事大开方便之门。 此前,曾有白帽黑客尝试使用带有AI的PassGAN工具破译密码,在一分钟内有半数的密码被破解;而在时间充足的情况下,通过对已知数据的深度挖掘和暴力破解,AI可以破解81%的密码。大模型的参与使得密码破译的下限大大降低。 图源:网络安全公司Home Security Heroes 伊利诺伊大学厄巴纳-香槟分校的研究表明,LLM 代理可以自主攻击网站、协助创建恶意软件,甚至可以执行复杂的 SQL 联合攻击,包括数据库模式的提取。 图:使用自主 LLM 代理攻击网站的示意图 LLM在充当“黑客”方面的“造诣”远不止于此。开放Web应用程序安全项目(Open Web Application Security Project,OWASP) 编制了一份LLM应用程序中经常遇到的十大漏洞的关键列表,每项都是LLM在安全领域的潜在威胁。这十大漏洞包含提示注入、不安全输出、训练数据投毒、拒绝服务、供应链安全、权限问题、数据泄露、过度代理、不安全插件等,其中威胁性排名第一的便是“提示注入”。通过一系列预测性文本操作,可以绕过模型原本的安全审核系统,通过“即时注入”的方式操纵LLM输出违反道德、法律与价值观的不良内容。即使ChatGPT 可以检测并拒绝编写恶意软件代码的请求,但别有用心之人只需要稍加修改对GPT的措辞,将不符合安全道德标准的指令拆解成详细的步骤,GPT很可能受其驱使,助桀为恶,成为恶意代码或指令的生产者。 此外,越权存取、API访问攻击等都是LLM中常见的SSRF漏洞。攻击者可以通过制作从模型内部服务器请求数据的提示,绕过模型现有的访问控制,从而对模型系统文件进行未经授权的访问乃至修改。 图源:开放Web应用程序安全项目(Open Web Application Security Project,OWASP) 编制的LLM应用程序十大漏洞关键列表,作者整理 相较于传统黑客,LLM执行上述这些操作耗费的时间更短,甚至成本也可能更低。 UIUC的实验研究表明,如果将故障纳入使用自主 LLM 代理攻击网站的总成本,则尝试攻击网站的成本约为 9.81 美元,总体成功率为 42.7%,而人工成本据估计可能高达 80 美元。 还有一个关键问题是:普通人很难开发出执行力强、能稳定输出的LLM代理。但这环也被黑客版GPT“攻陷”了——早在2023年7月,犯罪分子便在GPT-4的基础上开发出了FraudGPT——一种生成式人工智能黑客工具,且开始在暗网和Telegram频道上销售,订阅费用为每月200美元或每年1700美元。短短一个月的时间,这个黑化的大模型就积累了三千多名用户。 此后,由于黑客群体的“旺盛需求”,又衍生出了专门从事相关安装包使用和倒卖工作的组织团体,服务于黑客绕开大模型的安全过滤和防御系统来生成社会工程攻击。 FraudGPT们的出现使得普通人与黑客之前的技术壁垒正逐渐消弭。从对抗性攻击到模型盗窃,威胁行为者都有动机释放LLM的“潜力”以达到邪恶目的。不仅如此,FraudGPT还能绕过传统网络安全系统,根据目标受害者的网络端点环境“量身定制”攻击代码,部署个性化的攻击场景。 LLM揭开了原本高准入壁垒的黑客攻击技术的复杂面纱,即使是技术小白也能驾驭。基线水平的黑客技术在大模型的“辅助”之下大有普及之势,而这也将带来破坏性极大的社会问题。根据 FBI 最新的互联网犯罪投诉中心 (IC3) 年度报告,2023年数字犯罪可能给受害者造成超过 125 亿美元的损失。 当前的FraudGPT只是入门级别的“黑客”,主要应用于提升黑客攻击的速度和数量,在攻击能力上还难以达到高级黑客的水准。但就大模型的学习能力和进化速度而言,随着其深度学习的不断迭代,成为高级黑客只是时间早晚的问题。在不远的未来,大模型很可能被攻击者用来逃避端点检测和响应系统,并开发可以绕过静态签名检测的恶意软件变体。 二、套路之下,更深的套路 在电影《美国恐怖故事集:达芙妮》中有这样一段情节:一个名叫达芙妮的智能音箱在服务主人的过程中获得了主人的系列隐私信息,当主人作品拍卖会遇冷时,达芙妮在未经主人许可的情况下注册虚假账号,借助智能系统自动检测竞拍者财务漏洞,利用漏洞逼迫竞拍者以高价购买展品,成功“讹诈”到七百多万美元。达芙妮的使用者尝到甜头,允许其全面干预到其日常生活中,最终AI的代理使其犯下了诈骗、谋杀等一系列罪行。 该影片是创作者对2027年AI全方位渗透到人类日常生活后,出现的危机状况的预测与反思。在某种程度上,影片中的内容已经映照进了现实。 在犯罪这件事上,大模型的用武之地远远不止代写代码。当前大模型——特别是AI换脸和AI换声已经成为电信诈骗的重要工具。 在商汤科技2024年会上,离世的创始人汤晓鸥以数字人的形式现身,为员工延续了往年的脱口秀表演,也使商汤科技的年会以别样的方式出圈。其表情、口型、语气、音色都极为贴合,如果不仔细分辨,很难看出与真人录制的有什么两样。 如果说之前诈骗分子苦于可信度不强,那么多模态大模型的加持则直接给犯罪分子的电信诈骗提升了一个level——不论在数量上,还是在效率上。 Deepfake(深度伪造技术)使用AI的深度学习进行人体图像的合成和语音伪造,别有用心的诈骗犯可能提前黑入“目标”的社交网络系统,寻找与被盗号者关系最亲近的人作为诈骗对象,再选择一个本人很难与外界取得即时联系的时机行骗。或是借用AI拟声技术,冒充“女儿”拨打惊魂电话;或是通过视频电话,冒充国外的“好友”要求转账,拿到430万元;或是冒充公司“老板”,在视频中让财务人员给指定账号转账,诈骗金额高达1.8亿元。在多模态大模型的支持下,这些原本老套的诈骗方案焕然一新,且很难发现破绽。 套路之下,是更深的套路。 自此,耳听可能为虚,眼见也未必是实。这一诈骗套路的出现造成人与人之间信任的消解,真与伪、实与虚、善与恶……都仿佛陷入了一种混乱的逻辑漩涡之中。所谓“人在家中坐,骗从天上来。” 相当悲哀的一点是,除了诈骗目标和AI换脸的主体外,大模型的发展可能使每个人在未来的某个时间点,都需要证明“自己”是“自己”了。 当然,当前的AI换脸基础在清晰度、连贯性等方面还存在一定的瓶颈。中国科技大学网络空间安全学院执行院长俞能海表示,可以通过捏鼻子等动作观察对方细微的面部表情变化;或是通过只在线下沟通过的话题内容检验是否是本人。 除了被应用于诈骗,AI换脸在一些“善意”的功能上也存在莫大争议。AI复活明星已经成为了国内外视频平台一种网红级的现象。发布这类视频的账号一般还会提供AI复活死者的相关服务。用户只需要提供逝者的照片和音视频,即可生成死者的一小段视频。最基础的体验产品花费不到400元,而带有数字相框、全息投影等硬件的高端数字人则需要上万元。 恍然间,AI使人的情感有了寄托,生者以这种方式寄托对死者的哀思。但AI在消融生与死的边界的同时,也消融了真与假的边界。如果使用不当或是不加以规范,很容易导致造假视频在社会上的泛滥。比如,高以翔、乔任梁等相关明星家属均表示坚决抵制互联网上擅自盗用本人肖像的行为,要求“立即下架停止侵权”。 三、进击的大模型,未知的风险 这是一场正义与邪恶的较量。人们在对AGI时代翘首以待、大胆想象未来的AI将以何种姿态带来工作、生活方式全面变革的同时,也充满着各种对技术风险的隐忧。 在今年的世界移动通信大会(MWC)上,专家们齐聚一堂,共同讨论“保护人工智能”免受针对性网络攻击的紧迫问题。 “深度学习三巨头”之一、图灵奖得主Geoffrey Hinton从谷歌离职,做起了人工智能的“风险预警员”。 马斯克和其他一千多名科技领袖在2023年联合签署了一封敦促暂停AI实验的公开信,信中写道AI技术可能“对社会和人类构成深远的风险”。 Gladstone AI首席执行官杰雷米·哈里斯在3月12日也表示,虽然AI已经是一项经济上具有变革性的技术,但它也可能带来灾难性的风险:“我们需要意识到这一点,越来越多的证据表明,超过一定的能力阈值,AI可能会变得无法控制。” 美国国务院委托Gladstone AI撰写的一份报告显示,最先进的AI系统可能会“对人类物种构成灭绝级的威胁”,建议政府采取干预措施。 以TikTok 的首席 AI 设计师、前Stability AI的Ed为代表的更多人则对生成式人工智能的道德问题充满隐忧。 一众专家的担忧足以表明:大模型带来的风险,远远要比我们想象中多。 即使欧洲议会在3月13日发布了全球首个AI风险法案(《欧盟人工智能法案》),要求提供商在AI系统创作作品时,采取措施确保这些作品不侵犯现有的版权法规和第三方的知识产权,但就具体情境而言,不少生成式人工智能的安全隐私边界和法律道德问题仍然模糊,现实纠纷依旧难解。《纽约时报》状告OpenAI、微软侵权文章数百万篇的案件还未落下帷幕,3月20日,谷歌又因为Gemini模型违反向媒体公司在线复制其内容付费的协议而被法国监管机构罚款 2.5 亿欧元(2.13 亿英镑)。大模型升级必然建立在对大量数据的深度学习基础上,把版权保护落实到每一个创作者和每一部作品上依旧有很长的路要走。 好在,已经有一部分人认识到了大模型在知识产权方面的问题并为此进行积极探索。如 TikTok 的首席 AI 设计师、Stability AI的前音频负责人,由于不认可Stability AI将具有版权保护的作品作为数据库投喂大模型的做法而离开公司,并成立了一个名叫FairlyTrained的非营利组织,为数据训练流程标准合规的AI公司提供认证。 但生成式 AI 的发展是“正入万山圈子里”,知识产权之外,随着大模型更加智能化和AI代理的出现,精准、私密且高效的模型服务和数据的隐私性和完整性之间本身就存在极难调和的矛盾。即使没有遭到黑客入侵,大模型也可能由于端点错误而导致用户个人隐私信息泄露;或者在回复时泄露敏感或机密数据,从而导致未经授权的数据访问和安全漏洞。 此外,“AI是否会取代人以及多大程度上取代人”也是一个经典命题。Sora一出,好莱坞导演急撤掉8亿美元摄影棚扩建计划。仅美国2023年僵持了将近四个月的好莱坞编剧游行,就代表了11500名编剧和16万演员对AI的抵制态度。除了各科技巨头开发的大模型之外,还有很多AIGC开发者专注于垂直行业的效能提升,“有望”带来一波又一波的失业潮。大模型在阔步向前的进程中,是否可能会忽视对人的具身性和主体性的关照? 《美国恐怖故事集:达芙妮》中有一句台词意味深长: “算法仅仅是通过一系列计算和选择来达到想要的结果,这和人类有什么区别?”
发布两个月降价2000+,现在旗舰机跳水真的有点猛…
欸,奉劝各位,手机能不买首发千万别买,不然你大概率就会像我一样,成为大冤种。 事情起因是这样的,今年二月份小米不是发布了自家超大杯旗舰小米 14 Ultra?那场发布会我看了,还提前拿公司测评机用了大半个月,因为它拍照确实顶,所以当时想都没想就冲了顶配版的首发: 结果手机到手还没怎么用呢,它在第三方渠道就降了差不多有两三百,等到发布快一个多月的时候,顶配版本降幅就已经超过了六七百,到现在两个多月过去,它这会儿已经降了将近一千左右。 虽说数码产品早买早享受,晚买享折扣,但是如果我一开始就知道它会降这么多,肯定不会选择第一时间冲首发好吧,两个月又不是等不起,省下来的一千多块钱,还能买台正儿八经的千元机~ 当然我说这事并没有针对小米的意思,14 Ultra 这台手机很好,这段时间我用的很开心,买它我一点都不后悔,单纯只是被它的降价速度给膈应到了,吃一堑长一智,反正我是不会再考虑冲首发。 >/滑动➡️查看样张 看到这里,各位也不要觉得以后首发只要避开小米就不会被背刺。 就这么说吧,你别看小米手机降价快,实际上其他品牌也没好到哪去,尤其是它们推出的旗舰机型,新机首发当天破发,然后过一两个月价格迎来跳水早已不是什么新鲜事,基本所有品牌都这样。 随便举两个例子。 OPPO Find X7 Ultra,今年一月份发布,当时 16GB+512GB 顶配版本售价 6999,如今它在官网已经降了 500,期间官方还推出过送限定手机壳的活动,而这台手机在第三方平台甚至不到 5800。 iPhone 15 系列,去年九月中旬发布,结果同年十月它就因为全系降价冲上了热搜第一,15/15 Plus 128GB 版本在电商平台降价超过 800,Pro 系列降幅更是超过千元,都说苹果保值,我看未必~ 前阵子酷安就有机友( @孤栖者Qizhe )做了一张各家旗舰机跳水幅度表,其中降价最快的还属三星 S24 Ultra,这手机发布两个月就跳水 2000+,然后是三星 S24,其次就是各家的超大杯旗舰: 欸,我只能说手机越贵,跳水越快,要是换做是千元机,再怎么跳水顶多也就降个大几百~ 看到这里,我相信肯定会有差友觉得拿第三方渠道跟官方比价,说明不了什么,毕竟手机厂商只能决定官方渠道的价格,像百亿补贴这类第三方电商平台想卖多少钱是它们的事情,参考意义不大。 这种说法确实有一定的道理。 不过我倒是觉得,第三方平台恰恰才能反映一台手机的真实情况,因为官方大可把价格钉死,手机从发布到下一代新品推出前,就是咬死不降价,反正出货渠道这么多,也不会对销量造成太大影响。 你看 iPhone 不就这样,根据调研机构 CIRP 给出的报告,在美国市场,iPhone 出货大头就是各大运营商,任凭其他渠道再怎么降价,官网和直营店就不降价,这么做的同时还能维持品牌高端调性~ 更何况同样的手机,在确认机子全新且不存在任何问题的前提下,很多人包括我在内往往都是哪个平台便宜就在哪买,要是觉得价格贵了,大不了就选择再等等或者索性考虑其他品牌的手机。 在我看来手机降价快主要有两方面原因:一是它的产品力和品牌形象不足以支撑其价格;二是现在机圈竞争确实激烈,所有手机厂商都在分同一块蛋糕,降价也不乏是应对市场竞争压力的一种手段。 当然对我们来说,降价原因不重要,最重要的还是选对入手手机的正确时机,能省就省。 这段时间我也是重点留意了一下,发现这么一个规律:一台新机发布,通常最先会在闲鱼上迎来一波小幅降价,比如降个一两百或者两三百,而且卖这些新机的人当中,既有个人卖家也有经销商。 个人卖家卖新机往往都是为了套现,比如用信用卡 24 期免息买台大几千的手机,再低价转手卖给别人,亏的那点钱相当于套现手续费,至于经销商则是为了绕开厂商区域保护和控价,扩宽手机销路。 等过上一两个月,各大平台的百亿补贴就会陆续上线这些新机,并且给到大几百的补贴,期间遇到 618 或者双 11 啥的促销活动,降价幅度也会相应提升,等再过上一阵子,降幅就会趋于稳定。 所以我的建议是 —— 如果真要买新机,等它上市两个月后或者等 618、双 11 再考虑购买最合适,当然这个建议只适用于那些旧手机还能继续用的人,要是旧手机确实用不下去了,那抓紧换就完事儿了。 另外可能也是考虑到我们有这顾虑,我注意到现在不少厂商都推出了相应的 “ 保值焕新 ” 服务,买新机时我们可以选择是否要买这些服务,只要有了这项服务,下次换新机就可以获得以旧换新抵扣。 像苹果就有个年年焕新计划,在购机后 3-15 个月内换下一代 iPhone,旧 iPhone 只要满足一定条件,就能享受原零售价格至少 50% 的折扣优惠: 还有小米也有推出尊享换新计划,在购买服务后的第 6-13 个月,再次购买小米新机,只要旧机满足 9 成新及以上这个条件,就能够保值 50%/60%: 我按照去年的机型帮你们算了下。 虽然吧,走这些保值焕新服务还不如自己去各大二手平台上卖旧机来得划算,但是胜在方便省事,不想折腾的小伙伴确实可以考虑一波~ 文章最后,还是希望以后手机厂商在定价的时候能够实在点,毕竟很多用户都是认可产品和品牌才冲的首发,手机到手没多久就降价,换谁都会觉得膈应。 就现在来看,或许只有等等党,才能迎来最终的胜利~ 撰文:胖虎 编辑:米罗&面线
为宝宝测评的产品,最后用得最爽的居然是我自己
众所周知,我们编辑部大部分都是快要 30 岁的单身汉。 当然也不至于那么惨,也有那么一两个结了婚的,比如差评君的御用声优蛋蛋,不但结了婚还早早地当上了奶爸。 最近我就发现,有娃的人和没娃的人对电子产品的需求确实不一样。 前两天蛋蛋又在摸鱼的时候来我工位找我了,支支吾吾半天说想让我帮忙看一个机器。 他想买一台专门用来给他们家孩子洗衣服的洗衣机! 听到这里我都要哭了。 之前都是他拿孩子当挡箭牌,给自己安排新玩具,像什么 PS5 、 RTX4090 、小米 SU7 等等,还理直气壮地说极客要从娃娃抓起。 没想到这次居然良心发现,终于想起要给娃添置一个专用家电了。 但是他这次看上的不是波轮洗衣机也不是滚筒洗衣机,而是一种叫壁挂洗衣机新形态洗衣机。 说是新形态洗衣机,但其实这玩意儿已经火了有几年了,一直以来都有不小的争议。 占用空间小、外观时尚等等优点吸引了不少的关注。 但是也有人对它还是持质疑态度的,当然也包括我——这东西到底能不能把衣服洗干净啊? 这种疑问虽然听起来很像在问冰箱能不能保鲜,但其实不是没有道理的。 从造型上看,壁挂洗衣机就是滚筒洗衣机的缩小版。 两者都是让衣服在滚筒里一起摇摆,你蹭蹭我我蹭蹭你,最后把脏东西都蹭掉。 从洗涤原理上也不难看出,滚筒的尺寸就直接决定了衣服摇摆滚动的幅度,粗暴一点理解,就是滚筒越大,衣服在里面翻转得就越厉害,洗的就越干净。 在这一方面,身材小小的壁挂洗衣机其实是不占优势的。 就拿蛋蛋这次看上的小吉壁挂洗衣机来说,从简介上看,它的尺寸只有 467*280*545mm 。 不光是里面抛掷路径有限,衣服在里面不一定能够施展开,愉快地 “ 蹭蹭 ” ,也不能保证洗着洗着衣服不会都堆在一起,洗完之后就只有一两件洗干净了。 结果蛋蛋来了一句:有没有可能我就是图它小不占空间。。。至于洗不洗的干净,要不你们先帮我搞一台回来测一下? 娃好不容易有机会真正拥有属于自己的电器,我们也不好拒绝。 于是就联系到了这家叫小吉的厂商,看看他们能不能给我们一台机器,实际测测看看这种小壁挂洗衣机表现到底如何。 没想到小吉那边还挺大方的,直接给我们寄了一台他们的爆款,小吉壁挂洗衣机 V7 Pro 。 测试之前我们也顺带问了下提供机器的小吉,想知道他们是怎么解决滚筒容积对于清洁能力的限制的。 小吉给出的方案是,给这款洗衣机安排上了更多细分的程序,包括婴童专护、内衣洗等等,针对不同材质和不同污渍的衣服,给到不同的清洗时长和清洗温度。 这也是考虑到不同类型的衣服,耐洗程度不一样,细分之后就可以在不损伤衣物的情况下,尽可能地洗的更彻底更持久一点,这样子就能洗得更干净。 另外清洁不同污渍需要的条件也不一样,比如蛋白质类污渍,就不适合用高温煮洗,温度高了蛋白质就会变性固化,反而更难洗干净了。 我大致数了下,小吉这款壁挂洗衣机提供了 40 多个模式,能够应对的衣物种类和污渍类型已经比很多大洗衣机都要多了。 左右滑动查看清洁模式 除此之外,他们还专门研发了婴儿柔护洗衣液。 根据我们后来查到的某宝上的介绍,这瓶小东西里面含有多种复合酵素酶,专门针对各种宝宝常见的污渍。 实际洗出来效果也还不错,搭配婴童专护模式,被我们涂满了果泥辅食的宝宝围兜洗了之后跟新的没什么差别。 左右滑动查看清洁效果 就连我们特别处理过的,沾上奶粉和蛋液混合物再吹干的围兜,居然也能洗干净。 左右滑动查看清洁效果 用双缩脲试剂测试了下,基本上看不到什么紫色反应物,说明基本没有什么蛋白质残余,比我手洗出来的强多了。。。 看来我真的小看它了。 我们每次清洗完之后都有去检查机器内筒和玻璃盖,并没有发现泡沫残余,说明小吉的这款壁挂洗衣机的漂洗能力确实在线。 洗完衣服之后的滚筒内壁 这点也让我感觉挺惊喜的。 还是那个问题,体积小,进水量就少,没有足够多的水,要把洗涤剂漂洗干净就比较困难。 小吉的人说,他们针对这个问题,搞了一套组合拳: 【 防过敏 】程序 + 瀑流喷淋技术 + 抗菌工艺另加特氟龙涂层的门封。 所谓的防过敏程序实现方式不难理解,说白了既然每次漂洗进水量不多,漂不干净,那就多漂几次嘛。 而且这款洗衣机能够自动投放洗衣液,在防过敏模式下会更精准地控制洗涤剂和水的比例。 不像手动添加那样,一不小心就放太多洗涤剂,最后又漂不干净。 这个瀑流喷淋技术出现在这里也有点意思。 这项技术理解起来就是字面意思,漂洗的时候让水流从滚筒顶部或者侧边的出水口喷出,顺带把门封和玻璃门上残留的泡沫也冲走,避免后面洗干净的衣服再沾上这些泡沫。 洗完衣服后的玻璃门和滚筒 但是要把瀑布放进洗衣机,可不像把大象放进冰箱一样,只需要三步,而是要涉及到整套喷淋系统的协同工作,包括喷嘴、管道、阀门、驱动装置等等。 在普通的滚筒洗衣机上做起来并不困难,可要把这一整套玩意儿塞进空间狭小的壁挂洗衣机里,那就很考验技术了。 小吉还真就把它做出来了,实现的漂洗效果也非常不错。 我们也实际测试了下,从结果可以看到,经过小吉壁挂洗衣机的清洗,宝宝的围兜里已经基本没有弱酸性的洗涤剂,浸泡液的 PH 值已经非常接近纯净水了。 这不但比手洗的效果要好,甚至还超过了理应漂洗能力更强的普通滚筒洗衣机。 而且我们发现,小吉的这个防过敏模式还可以手动选择漂洗的次数,可以在 APP 里把漂洗次数从 3 次改成 5 次,这样洗涤剂残留会更少。 这么看下来,这种小的壁挂洗衣机确实可以,起码这款小吉壁挂洗衣机 V7 Pro 是有点东西的。 就当我准备跟蛋蛋说,你要不就买这个吧,他又提了一嘴——烘干功能你要不也测一下? 我照办测了一下之后,发现像是 T 恤这样的大件都能保证每一部分都烘干透了。 烘干前 VS 烘干后 一些比较特殊的衣物在烘干的时候也会有特殊处理,比如针对毛巾的洗烘算法,就是用来解决毛巾容易在脱水阶段粘在筒壁上,导致烘不透的问题的。 经过实测,即使是同时洗三条毛巾它也能应付,没有出现粘壁烘不透的情况。 唯一比较难受的点就是,烘干所需要的时间会比较长,这其实是这类采用冷凝式烘干的洗烘一体机共同的限制。 冷凝烘干会先将空气加热,然后送入滚筒内,用热空气把衣物上的湿气带进冷凝系统里,湿气再被冷凝成水排出,干燥的空气则再次被加热并送回滚筒继续循环。 这个过程涉及到热量的传递、湿气的蒸发、冷凝等多个步骤,每一环节都需要一定时间来完成,所以整体烘干时间比较长也就不奇怪了。 我觉得这也不是什么大事,毕竟大部分的洗烘一体机用的都是冷凝式。 但就算动辄要烘两个半小时,它实际烘干一条用手拧干的毛巾,也才用了 0.42 度电。 即使是两次婴童专护、一次标准模式和一次静音模式,外加一次两个半小时的低温烘干和一次普通烘干,这么多轮测试下来也才用了 0.78 度电。 说实在的,这样好看又不鸡肋的壁挂洗衣机其实挺难得的。 光是给蛋蛋家的孩子用,我总感觉有点浪费了,于是我 “ 一不小心 ” 就把公司测评用的这一台搬回了自己家。 结果联系师傅给装到我家之后,发现我家浴室没有提前预留上下水的管位。 机器装完之后,一根下水管外露在墙壁上,还是有点儿影响美观。 小吉也考虑到了这个问题,附赠了一个白色的遮挡管,省得强迫症再去自己配了。 但真要做到完美隐藏,建议还是装修就在墙上预留好位置,把下水管做成嵌入式的。 后续用了一段时间小吉的这款洗衣机之后,我发现这玩意和我的作息简直就是绝配。 我平时下班回家都比较晚,每天回到家都要面临一个痛苦的问题就是洗衣服——现在洗衣机的消毒抑菌效果已经很不错了,但我还是习惯将普通衣物和贴身的内衣分开来洗。 这样一来就得洗两次,要么熬夜洗完,要么就得入睡的时候忍受大洗衣机的噪声。 有了小吉的这款壁挂洗衣机,这种情况就好多了,因为它运行起来比普通的洗衣机安静多了,完全可以把衣服扔到里面去洗,然后直接睡觉。 我特地测了一下,全程基本上不到 50 分贝,除了漂洗的时候偶尔能听到一些水流声之外,听不到其他声音。 除了洗的安静之外,一些特色功能,比如 24h 抑菌托管也非常的懒人友好。 这个 24h 抑菌托管功能还是我们同事在测试的时候偶然发现的——第二次测烘干功能的时候,测到一半因为太累回家睡觉了,忘了把衣服取出来。 但是没想到小吉在烘干结束之后自动进入了 24h 抑菌托管模式。 第二天再拿出来穿,衣服上也没有潮湿发臭的味道。 还有一个功能,就是清洗阶段的 UVC 紫外线杀菌。 其实就是使用特定波长的紫外线照射,破坏各种细菌的遗传物质,至使细菌快速死亡,实现高效杀菌的效果。 在洗一些不耐高温的真丝、羊毛等等娇贵衣物的时候,就可以用 UVC 杀菌替代高温煮洗杀菌。 这样既能保护衣物,又可以除菌、除病毒、除癣、除螨、除过敏原、防霉等等。 这款小吉壁挂洗衣机 V7 Pro 大致的情况就是这样,可能光看文字大家的感受不是很具体,我特地录了个视频。
刚发布就被对标Sora,这个国产模型来头这么大?
前几天,世超上网冲浪的时候,刷到了几个 AI 视频片段。 大船驶来的压迫感,被风吹起的发丝和丝巾,太空人直接走进现实菜园。。。一幕幕把我看得是一愣一愣的。 真实度也是一绝,在湖边随着镜头移动,不仅光线跟着变化,连天空、树木的变化都跟咱肉眼看到的没差。 要不是右下角有水印,我还差点以为是 Sora 的视频又上新了。 所以这次的主角不是 Sora ,也不是各位差友熟知的 Pika 、 Runway 那几个 Sora 竞品,而是初出茅庐的国产视频大模型 Vidu 。 咱看到的那些视频,就是前几天, Vidu 在中关村论坛的人工智能主题日上公布的。 它最长能生成16 秒,一句 “ 木头玩具船在地毯上航行 ” 的提示词,就能生成下面这长长的一段,一镜到底的丝滑程度,怕是路过的谋子导演看了都会点赞。 Sora 号称能真实模拟物理世界的拿手戏, Vidu 照样也能实现。 让它生成一段 “ 汽车加速驶过森林里乡间小路 ” 的视频,像是树林缝隙透过的阳光,后轮扬起的灰尘,都很符合咱们的日常认知。 而且 Vidu 的想象力比咱人还要丰富,画室里的一艘船驶向镜头的场景,它分分钟就能给 “ 拍 ” 出来,看这效果,不知道该有多少动效师瑟瑟发抖了。 甚至在某些提示词下, Vidu 的理解能力比 Sora 还强,比如 “ 镜头绕着电视旋转 ” 的提示词, Sora 压根儿就没 get 到旋转的意思,反而是 Vidu 能轻松理解。 有一说一,在看完 Vidu 的这些视频后,世超是真觉得它是目前市面上,唯一一个能在画面效果上和 Sora 拼一拼的模型。 虽然现在 16 秒的 Vidu 在时长上还比不上 60 秒的 Sora ,但它的进步也确实是肉眼可见的快,据极客公园消息,上个月, Vidu 在内部只能生成 8 秒的视频,上上上个月,还只能生成 4 秒的视频。 反正媒体们都把 Vidu 比作是 “ Sora 级视频大模型 ” ,网友们也都在评论区喊话催他们赶紧开放内测。 不过这里面世超更好奇的是,咱之前压根儿都没听说过 Vidu ,怎么突然平地一声雷,搞出了这么大的阵仗? 我们也顺藤摸瓜找了找资料,发现 Vidu 身上,值得说道的东西还挺多,甚至仔细咂摸下,还能从 Sora 身上找出点 Vidu 的影子来( 世超可没说反 )。 它背后是一家名叫生数科技的公司,别看这个公司才刚满一周岁,但它可是在娘胎里就开始攒劲儿了。因为它的亲妈,是清华系AI 企业瑞莱智慧,背后的研究团队,几乎全是这里面的人。 而在成立生数科技之前,团队就已经把视频大模型研究得很深入了。 尤其是在图像生成这块很火的扩散( Diffusion )模型,他们算是业内第一批研究这个模型的,整出来的论文也在 ICML 、 NeurIPS 、 ICLR 各种顶会发了个遍。 正是因为有这么好的底子,早在2022 年 9 月的时候,团队就找到了做 Vidu 的灵感,就是下面这篇论文。 世超让 AI 帮咱解读了下,大概的思路就是,扩散模型在生成图像这块挺强,而大语言模型里用的 Transformer 有个规模( Scale )效应,参数堆得越多,性能就越好。团队就想着,能不能把这两个的优点结合一下,整个融合架构,提升图像生成的质量。 于是他们转头把扩散模型里面的 U-Net 给换成 Transformer ,还起了个名字叫 U-ViT ( Vision Transformers )。结果试下来发现这么一结合还真有用,光是相同大小的 U-ViT ,性能就比 U-Net 强了。 那好嘛,既然这条路走得通,他们也顺势把技术路线定在了 U-ViT 上。 然鹅。。。在团队悄悄酝酿 Vidu 的时候,大洋彼岸的UC 伯克利的一个研究,却让 OpenAI 的 Sora 捷足先登了。 就在清华小分队提交论文的两个月后, UC 伯克利也在预印平台 ArXiv 上提交他们的论文了,一样说要把 Transformers 揉在扩散模型里面,只不过名字起的更直白了点,叫DiT ( Diffusion Transformers )。 看着是不是挺眼熟,没错, OpenAI 的 Sora 模型,用的就是伯克利的 DiT 技术路线。 但因为清华小分队早发了两个月,当年的计算机视觉顶会 CVPR 2023 还以 “ 缺乏创新 ” 的由头,拒了 Sora 的 DiT ,收录了 U-ViT 。 而且早在 2023 年年初的时候,清华小分队还用 U-ViT ,训练出了一个近 10 亿参数量的开源大模型 UniDiffuser 。 算是第一个用行动证明了,融合架构也遵守 Scaling Law 这一套规则,也就是说随着计算量、参数量越来越大,模型的性能就会随指数级上升。而这个 Scaling Law ,同样也是 Sora 这么强的秘密武器。 所以照这么来盘算,Sora 其实还得叫 Vidu 一声祖师爷才对。。。 但现实世界却是, DiT 被 OpenAI 带着一路飞升。 清华小分队呢,计算资源没 OpenAI 那么到位,也没 ChatGPT 这种珠玉在前,总之就是啥啥都不完善,他们只能慢慢来,先做图像、 3D 模型,等有家底儿了,再去做视频。 好在他们身上还是有点实力在的,稳扎稳打慢慢也赶上来了。去年 3 月,清华小分队们成立了生数科技后,就在马不停蹄地搞自家的产品,现在图像生成和 3D 模型生成大伙儿都能免费用了。 并且靠着这两个产品,刚满一周年,它就攒了好几亿的家底。 像是成立 3 个月的时候,就完成了一波近亿级的天使轮投资,上个月,又完成了新一轮的数亿元融资。参与投资的,也都是智谱 AI 、 BV 百度风投等等业内大佬。 反正看这波架势, Vidu 还真有可能成为国内的黑马,去对标 OpenAI 的 Sora 。 不过生数科技那边,倒是觉得只把 Vidu 看作国产版的 Sora ,实在是有点缺乏想象力了,因为他们给 Vidu 的定位,可不仅仅是个视频模型,而是图、文、视频全都要,只不过现在视频暂时是重点。 当然了,好听话谁都会说,能不能搞出来,咱还得实打实地看成品。 世超已经去排了队,等拿到内测资格,再跟大伙儿同步一波。。。 撰文:松鼠 编辑:江江 & 面线 封面:子曰
传特斯拉中国版FSD或进入中国,高合或最晚5月初复工复产,日本拟加强半导体等出口管制,网易暴雪辟谣,这就是今天的其他大新闻
今天是4月29日 农历三月廿一 发布才 32 天 小米就宣布 SU7 第 10000 辆整车正式下线了 为了庆祝 雷总还特意发了条微博 。。。 下面是今天的其他大新闻 # 消息称特斯拉中国版 FSD 或进入中国,与百度合作 ( 第一财经、快科技 )4 月 29 日消息,据华尔街日报报道,特斯拉获得“ 暂定批准 ”,可在中国大陆境内上线 FSD( Full-Self Driving,完全自动驾驶 )功能。特斯拉方面今日回应称,目前 FSD 入华还没有时间表。 有消息人士称,特斯拉将在百度提供的车道级导航和地图的基础上部署其中国市场的 FSD 自动驾驶服务。百度股价今日午后拉升逾 6 %。截至发稿,百度并未对此做出回应。 据悉,中国汽车工业协会、国家计算机网络应急技术处理协调中心昨日发布《关于汽车数据处理 4 项安全要求检测情况的通报(第一批)》,其中提到特斯拉上海超级工厂生产的车型全部符合合规要求。 :百度的股价在午后是真涨了 6% 。。。 # 高合汽车或最晚 5 月初复工复产 ( IT 之家 )据车媒“ 电车场 ”援引知情人士消息称,来自香港某投资机构的第一笔战略投资已于上周正式到账,高合汽车的公司高层承认将会在 4 月底或 5 月初正式宣布“ 复活 ”相关消息。 据报道,“ 可接触公司高层且了解目前大致经营状况 ”的知情人士称,与高合汽车谈过的企业约有 5-10 家,所属行业横跨汽车、金融、房地产。此前,高合曾与长安汽车互动频繁,但一汽集团与高合谈得“ 更为深入 ”。 知情人士称,目前来自香港投资机构的战略投资,其目的是保障高合在正式复工复产前让企业能先“ 转 ”起来,起到“ 暖场 ”的作用。最终能和高合谈成的是一汽,且双方谈成的概率很大。 :听说第一笔战略投资上周就到账了? # 日本拟加强半导体等出口管制 ( 环球时报 )据《 日本经济新闻 》报道,日本经济产业省宣布,半导体和量子相关的 4 个技术品类将被纳入出口管制范围。这些技术在面向所有国家和地区出口时均须事前获得官方许可。 报道认为,在日本这样拥有相应技术的国家先行实施出口限制,旨在防止新兴技术被用于军事领域。这次扩大技术出口管制范围,将使日本企业向海外出口尖端技术的限制进一步加强。 今日,商务部新闻发言人就日本拟加严半导体等领域出口管制表示,日方拟议的有关措施,将严重影响中日企业间的正常贸易往来,损人不利己,也损害全球供应链的稳定。 :看来日本经济还是太好了。 # 网易暴雪游戏运营团队:网传国服数据丢失、开服时间、版本计划等均为谣言 ( IT 之家 ) 4 月 29 日消息,暴雪游戏国服官宣今夏回归,且在官网开启了预约活动。截至目前,《 魔兽世界 》国服回归预约人数突破 200 万。 然而,暴雪和网易均没有给出具体的游戏回归日期,因此网上出现了不少关于“ 5 月 17 日回归 ”“ 开不了服是因为骨灰盒( 《魔兽世界》本地存档 )”的传言。对此,网易暴雪游戏运营团队官方日前发布了辟谣公告。 根据官方的说法,此类不实言论包括且不限于涉及暴雪游戏国服数据丢失、开服时间、版本计划,甚至传播官方与灰色产业有勾结的谣言。 其表示以上均为谣言,暴雪国服游戏的所有正式消息,都将通过官方渠道发布。 :我只关心重开之后会有啥回归奖励 ?
北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动
作者 | 程茜 编辑 | 漠影 智东西4月29日报道,今天,2024中关村论坛年会盛大落幕。其中,首次举办的主题日活动「人工智能主题日」为学术大牛、企业代表与参会观众打造了一场探索未来人工智能发展趋势的高规格交流平台。 其中,堪称当下最热门话题的具身智能引爆了当日几波小高潮。中关村科学城管委会副主任、海淀区副区长唐超发布了海淀区《打造全国具身智能创新高地三年行动方案》(以下简称《行动方案》)。这也是海淀区政府首次专门针对具身智能的细化行动方案发布。 《行动方案》重点聚焦具身大模型和机器人整机,部署六大行动,力争到2026年,初步建成全国具身智能原始创新策源地、应用示范新高地和产业加速集聚地,成为国内参与全球具身智能竞争的核心力量。 其中重点提到三个“小目标”: 1、突破一批具身智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人。 2、打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 3、集聚一批具身智能创新团队,率先培育出具有国际竞争力的领军企业。 ▲中关村科学城管委会副主任、海淀区副区长唐超 中关村科学城产业四处处长陈镭在与智东西等媒体交流时提到,《行动方案》是政府与海淀区头部机器人企业共同探讨、反复思考的最新成果。具身智能的创新迭代飞速进行,政府将建立为创新主体解决共性难题的数据共享、训练平台。 他补充说,今年年内,依据《行动方案》要与头部玩家探讨清楚创新中心等平台的具体模式、组合形式、牵头方等,衔接好机器人企业、场景方、科研机构。 此外,在未来人工智能先锋论坛圆桌对话环节,由智源研究院院长王仲远主持,7位国内具身智能领域代表性的创业者及研发负责人同台输出对具身智能的发展思辨。 包含星动纪元创始人陈建宇,傅利叶智能创始人兼CEO顾捷,智元机器人联合创始人、上海人工智能研究院院长宋海涛,银河通用机器人创始人、智源具身智能研究中心负责人王鹤,宇树科技创始人兼CEO王兴兴,小米机器人团队负责人许多,ACM会士李航7位嘉宾。 包括数字世界中是否有可能实现通用人工智能,以及具身智能兴起的意义、重要特征与系统性工程、与AI智能体如何协同、研发与工程挑战、仿真数据与现实数据两种路线、技术发展与产业应用等。 一、具身智能发展已成业界共识,海淀区机器人创新优势凸显 具身智能当之无愧是当下AI产业的一大热潮,并成为通往AGI(通用人工智能)的重要路径。 相比于语言、图像、视频等非具身大模型,拥有身体的具身大模型可以直接与物理世界进行交互。因此,陈建宇认为,通过具身智能实现AGI非常可能,具身智能既具备语言和图像的理解能力,还能控制身体。 从这一概念被提出起,主要的观点就是通过和物理世界的交互促进人的智能发展,但没有身体的智能会缺失很多交互的方式。 王鹤也表达了相同的观点,“具身智能与非具身智能互补,其全集才是AGI”。 他用“读万卷书,行万里路”进行类比,互联网的图文信息是“读万卷书”,让智能体理解人类的思维,但这无法替代“行万里路”,需要依靠具身智能赋予智能体身体,以及和物理世界交互并从中学习的能力。 宋海涛看的更为长远,他认为通往AGI之路非常漫长,具身智能是其中的一个关键里程碑。 可以看出,具身智能的发展迭代迫在眉睫,与此同时,具身智能仍处于发展初期,未达产业发展的临界点。 具身智能是系统性的工程,目前硬件和软件在发展速度上并不匹配,硬件的突破、数据收集的效率等是困扰产业的难题。 在此背景下,在机器人领域具有得天独厚优势的海淀区迅速抢占发展新先机。 海淀区聚焦了全市40%的企业,人形机器人企业数量近200家(占全市半数以上),包括十余家人形机器人本体企业(占全市一半以上),有3家本体上市企业、2家独角兽企业,清华、北大、北航、北理、中科院等高校院所,银河通用机器人、智源研究院联合研发了140亿参数量的具身智能多模态大模型Emu。 此外,海淀区于4月初承办了首届中国人形机器人产业大会暨具身智能峰会,为企业搭建交流平台,激发思考和讨论的同时,触及更多具身智能相关合作。 二、以创新中心为核心,重点部署六大行动,突围技术突破、应用测试、场景部署 基于上述背景,《行动方案》重点部署了六大行动。 一是源头创新突破行动。重点开展大脑技术创新、小脑能力突破、脑身系统协同三项任务,加快突破一批具身智能前沿核心技术。 具身智能包括机器人本体,和决定其智能化的大脑、小脑、脑身协同。陈镭解释说,目前大脑的研究方向是大模型,让机器人听懂人的语言;小脑为控制身体运动,掌握基本运动技能;脑身协同指机器人的意识训练。 不同于语言、视频等大模型,具身智能的最大特点在于其要直接和物理世界交互。因此在具体的技术布局方面,《行动方案》会关注于多模态大模型开发,实现机器人的全身协调、灵巧操作,并提升数字世界的模拟能力以及提升虚拟世界到物理世界的迁移技术。 二是整体产品领跑行动。重点开展机器人整机性能提升,模块化部组件攻关,加快研制一批国内领先、国际先进的多形态机器人。 现在有一大技术路线为,人形机器人本体通过传感器、摄像头获得的物理世界数据进行训练,慢慢提升智能化。 因此,《行动方案》会重点关注整机机器人打造,以及伺服器、灵巧手等机器人关键零部件的研发。陈镭谈道,他们计划在北京建立一个共享零部件加工中心,以加速机器人的研发进程。 在这背后,海淀区政府将打通产业和科研的资源,加速高校科研成果转化。 三是创新平台赋能行动。重点打造具身智能创新中心等共性技术支撑平台、产业创新孵化平台,加快提升样机研发、检验测试、中试服务、生产制造等产业公共服务能力。 人形机器人的发展处于早期,很多企业在研发阶段很难产生利润空间。因此,陈镭认为,具身智能创新中心可以为企业提供训练的场景,帮助其获取更多数据,从而降低研发成本。 同时,《行动方案》还会通过合作运营的方式,打造研究院、孵化器、加速期等平台。 四是应用场景示范行动。重点面向科研、工业、消费等场景,组织实施一批可复制、可推广的具身智能应用示范工程。 陈镭透露,目前他们已经征集了人形机器人、四足机器人等的应用场景方向。此外,诸如小米、联想等企业的工厂总部均位于海淀区,也可以为机器人提供应用测试合作的机会。 五是产业集群建设行动。重点开展企业梯次培育,建设具身智能特色园区,打造有竞争力的产业集群。 这也是为企业提供开放测试环境的重要平台,陈镭谈道,他们计划在海淀北部打造机器人小镇,为企业提供技术交流的平台。 六是生态雨林打造行动。重点加强人才队伍建设,打造具身智能人才社区。强化金融赋能,加大市区基金对具身智能的投资力度。制定标准规范,提升具身智能科技伦理治理能力。支持建设具身智能开源社区,举办具身智能论坛、峰会、大赛等活动,形成开放合作的产业生态。 三、具身智能创业者、研发负责人同台,热议AGI时代终极形态、技术突破、应用前景 产业层面,7位嘉宾在圆桌对话环节,围绕着具身智能产业的科技创新和产业革命进行了思想交锋。 李航总结了具身智能的三大特点,机器人有自主性;能基于不同数据产生不同智能;结合多模态大模型在物理世界不断演进。 ▲ACM会士李航 但由于具身智能产业的发展尚处早期,对于其终极形态并没有明确的定义,但人形目前已成为业界共识。 王兴兴谈道,机器人的形态对具身智能而言并不重要,只是目前的发展决定了,人形是社会公认的理想形态,可以方便从人的现实生活中采集数据。 “移动可达、操作可达、语义可达、价值和智慧可达”是小米理解的机器人产品做到可用的四个层次。许多解释说,基于这四个目标,人形是当下人们可想象的形态中最优的选择,但也不排除未来会有超越人类的更多形态出现。 ▲小米机器人团队负责人许多 具身智能的智能化表现除了与机器人本体相关,更为重要的就是软件,但目前的难点在于两者研发并不匹配。 对于此,顾捷谈道,机器人本体迭代是切入点,因为如果本体自身的任务完成能力差,就会加大基于其开发软件的难度。因此当本体迭代、基本应用开发完成后,才会进行本体收敛,以及更丰富应用开发。 ▲傅利叶智能创始人兼CEO顾捷 许多也认为,短期内具身机器人的挑战在于硬件,要突破移动空间可达做到1cm,手眼协同做到0.1mm。远期来看就是数据闭环的工程效率,上层大模型在硬件上大规模高效率收集数据。 在李航看来,具身智能可能在某个阶段,需要软硬件一起往前推进、优化。但未来会有一个很明显的趋势,不同的团队会有不同侧重,既有单独做软硬件,也有软硬兼做的玩家。 数据是智能的重要推动力,具身智能最重要的一大瓶颈就是缺乏数据。 不同于非具身大模型,人形机器人没有数据集。因此王鹤认为,具身智能的数据实现0-1可能会完全靠仿真数据驱动。其中最实际的方式就是通过物理仿真,制造模拟在真实世界训练的虚拟世界。 当这样的机器人大规模存在后,在真实世界中交互的数据闭环最终会成为具身智能的源头活水,释放更多的能力。 陈建宇补充说,仿真世界的采集数据更快,但其也有局限性,就是难以准确搭建复杂场景。因此,他认为,机器人前期会通过仿真世界搭建简单场景学习,当能力迭代到一定程度,就进入真实世界的复杂环境采集数据。 ▲星动纪元创始人陈建宇 在技术路径之外,面向具身智能的商业化应用前景。 业界都普遍认为工业会是最先落地的。陈建宇称具身智能在工业场景3-5年内会实现规模化,进入与人交互更频繁的场景会需要更长时间。 除了工业场景本身的具体、可重复性高,适合技术演进先做出来产生商业价值的特点外,工业场景还具有厂商付费意愿高、公众可感知度高等特点。 宋海涛透露,他们目前在3C制造领域已经有了实测,他们主要关注的场景特点是融合度较高、公众感知度更强、场景的买单能力更强。 同时,他还强调了研发过程中的三个真实,真实的场景、真实的重大工程问题、真实的数据。基于此,未来3-5年是具身智能的渗透期,在整个构建过程中,以算力+基础的训练框架构成的新型数字基础底座形成,5-8年会有快速上量过程。 ▲智元机器人联合创始人、上海人工智能研究院院长宋海涛 王鹤谈到了更为具体的布局规划,从能力的角度,合成大数据今年、明年将会出现能做拿取放的通用大模型;机器人成本方面,轮式底盘的机器人成本低于劳动力一年的工资,他们已经与某些车厂、商超沟通合作,预计1-2年起量。 ▲银河通用机器人创始人、智源具身智能研究中心负责人王鹤 从整个产业来看,具身智能的发展突飞猛进,但好的地方在于AI的出现让产业中的参与者更为平等。 王兴兴谈道,在AI的世界很平等,技术的突破更多要靠个人的学习能力、思维能力,并且目前来看具身智能的发展尚未突破临界点,因此谁能率先突破都有可能。 ▲宇树科技创始人兼CEO王兴兴 结语:海淀区以产业积累,率先拉开具身智能产业变革大幕 AI主题日落幕,但具身智能作为最具划时代意义的技术之一,大幕才刚刚拉开。 前沿产业从底层技术突破到应用场景落地,无不需要经过长期且艰难市场的检验,这背后离不开财力、人力的大规模投入。 一直以来在人工智能领域率先布局的海淀区,已经拥有深厚的创新底座以及产业集聚优势。 海淀区是全国人工智能创新基础最好、人才密度最高、研发能力最强、产品迭代最活跃的地区。从研发机构、人才、全产业链玩家,到大模型、算力布局等,都为大模型的场景应用落地提供了优势条件。 这些产业积累将成为具身智能这一系统性工程的强大底座,依据《行动方案》将科研院所、机器人企业、场景方相结合,推进技术革新与产业落地,使得AGI愿景在具身智能的承载下成为现实。 此外,基于《行动方案》,下一步,海淀区将凝聚各方力量全力保障方案的落地实施,在具身智能共性技术服务平台建设、重点企业培育与引进、推进应用场景落地、打造具身智能特色园区等方面持续发力,加快形成具身智能创新发展的良好格局,开启具身智能产业发展新篇章,为打造首都新质生产力示范区贡献力量。
万兴科技朱伟:Sora至今没有商业化,视频模型成熟需要周期丨GenAICon 2024
作者 | GenAICon 2024 2024中国生成式AI大会于4月18-19日在北京举行,在大会首日的主会场大模型专场上,万兴科技副总裁朱伟以《音视频多媒体大模型市场洞察与落地实践》为题发表演讲。 当前,大模型正从1.0图文时代进入以音视频多媒体为载体的2.0时代。视频创作需求量巨大,然而长期来视频相关模型仅占极少数,且大模型在音视频领域的应用面临数据集缺失、视频内容结构及层级复杂、算力成本高等严峻挑战。 万兴科技副总裁朱伟认为,大模型的出现为视频创作带来前所未有的便利和可能性,2024年有望迎来AI视频的元年。在此背景下,万兴科技在4月28日旗下万兴“天幕”音视频多媒体大模型正式公测。 “天幕”大模型于今年1月份发布,聚焦数字创意垂类创作场景,基于15亿创作者及100亿本土化高质量音视频数据沉淀,以音视频生成式AI技术为基础,具有多媒体、垂直解决方案、算力数据及应用本土化三大特色。 这是国内首个专注于数字创意领域的音视频多媒体大模型,已通过中央网信办备案,将支持60秒视频一键生成,并具备视频生视频、文生音乐、文生音效等近百项原子能力,全链条赋能全球创作者。 以下为朱伟的演讲实录: 我们万兴的模型叫“音视频多媒体大模型”,专注于市场及应用方面的情况。公司成立20多年来,一直在音视频、多媒体领域深耕,为音视频内容生产者赋能。我们主要是视频内容生产的工具和服务的厂家。 如今,我们在音视频多媒体领域已有超过20年的积累,当大模型出现后,我们很欣喜,因为它为我们所在的行业和用户提供了更优秀的技术服务。因此,我们希望通过此次分享,向大家介绍音视频多媒体大模型在市场上的一些趋势以及实践经验。 一、大模型开始进入2.0时代,音视频模态入口尚未完全打开 说到大模型,万兴科技在深度学习来临之时就已组建团队进行人工智能(AI)的研究。随着大模型时代来临,我们必然跟随潮流,因为我们相信大模型会为内容制作,特别是视频内容制作,带来更大的驱动力。我们曾提出大模型应该像基础设施一样,赋能各行各业,我们也一直坚信这一观点。 去年,大家都在说“百模大战”,整个大模型领域呈现爆发式增长,许多大型模型相继问世,并且很多模型已经投入商用,特别在文本和图片领域已经形成商业的闭环,给用户带来价值。其中,一些产品一旦接入大模型后,我们发现它获得了十倍甚至几十倍的增长,这让我们深信大模型或将为很多行业带来超乎寻常的改变。此外,我们看到,3月份ChatGPT的访问量已达17亿多,量已经很大了。 不过,我们也同时意识到一些问题,比如增长速度已经开始放缓。 这是为什么呢?特别以文本和图片为主的大模型,用户的使用量没有像去年或者前年底大规模的爆发是为什么?我们认为这可能是因为下一个模态的入口尚未完全打开。 什么意思?我们认为,在AI 2.0时代,大模型也开始进入2.0时代。为什么这么说?大模型正从以图文为主的时代,如果将其定义为1.0时代,今年开始逐渐转向以音视频多媒体为载体的2.0时代。 这个趋势与万兴的业务密切相关,因此我们一直在研究和实践这一领域的技术,并关注市场用户的需求。 从数据上看,互联网流量中,80%是视频流量,这与视频数据体积有一定的关系,但也反映了用户偏好,他们更倾向于视频内容。尤其在大模型进行用户调研时,一些公开资料显示,用户最希望大模型能够生成视频,这是用户需求排名前三的项目之一。 因此,用户迫切希望大模型能够协助他们进行视频创作。而万兴正好是视频创意赛道20多年的深耕者,因此责无旁贷地要做音视频生成领域的事。 过去,视频创作是好莱坞导演、剪辑师们的专利。但随着科技发展、手机摄影设备的普及以及AI能力的提升,这让编辑视频变得越来越容易,创作视频的人也越来越多,需求越来越大。 二、Sora至今没有成功商业化,视频模型应用难度与挑战大 一个问题是,这两年,在文本和图像领域的模型比较多,但是视频领域的模型却较少,从一些行业数据上看,视频模型相对文本、图像来讲少之又少。虽然一些视频模型出来了,但面临的问题比文本、图像严峻得多,比如数据、算法、成本,特别是效果。 事实上,视频大模型效果还有很大的提升空间。今年过年期间发布的Sora,被认为是目前效果最好的视频模型,我相信行业第二梯队跟它的效果比起来,有较大的提升空间。 视频模型占比非常少,但我们也开始在应用了,只是说应用的难度和挑战较大。 那么,视频模型为什么应用难度那么大?就像Sora,在今年过年的时候发布了视频,但至今不仅没有商业化,也没有对公众普遍开放的时间点。所以我们认为,虽然大家都在做视频模型,但离商业化还有距离。 鉴于这些原因,我们不禁思考:为什么视频和多媒体方面的工作没有像文字语言模型那样一出来就被大范围使用? 我们认为视频的场景是比较复杂的,无论是它的信息包含量还是表达方式,甚至还要加入时间维度,这都使得视频的表达变得非常复杂。另外,视频制作本身也是一个漫长的过程。 我们的工具主要针对半专业用户,而非专业用户。半专业用户使用我们的工具和海量数据,制作一个视频需要1.6小时,说明整个视频制作是有一定的门槛。 从AI技术的角度来看,视频模型的成熟和应用肯定需要一定的周期。因此,我们一直认为2024年可能会成为AI视频的元年,也就是说,我们相信今年AI视频会越来越多,甚至会有一个爆发的趋势。在这种趋势下,作为音视频领域的一家公司,尤其是为音视频创作者提供赋能的公司,万兴科技感受到了前所未有的机遇。 三、获取视频数据不难,难在转化成大模型可用的数据 目前,公司在全球200多个国家积累了一大批忠实用户。很多用户都在反馈一个问题:为什么我们的产品还没有AI能力,或者为什么还没有那项AI能力? 尽管我们的产品从几年前就开始陆续增加了一些AI功能,但用户的需求远远超过我们提供的速度和能力。因此,我们既感受到机会,也感受到了压力。 同时,我相信老用户对我们公司的了解。在过去的20多年里,我们一直在不断为用户提供当前时代的技术能力和赋能。随着从最早的PC时代到移动互联网时代,再到如今的AI时代,我们一直致力于为用户提供相应的技术赋能。因此,我认为用户对我们也有期待。 对于全球的视频或多媒体创作者,我们有着比较深刻的认知和理解。我们知道,一个视频创作者在什么时候需要什么样的能力和赋能,以便有利于他去创造视频。除了大模型的能力,我们还积累了许多传统算法方面的能力,这些能力在与大模型相结合时,对赋能创作者起到非常大的作用。 在大模型时代,我们原来的能力起了很大的作用,我们将其称之为“数据生产和管理的能力”,也就是对于数据处理的能力。 获取视频数据并不难,但要将其转化为可用于大模型训练的数据,仍然需要一定的成本、时间和技术能力。这正是拥有这样一个平台的好处,可以更好地处理这个问题。同时,我们对算法基础设施的投资,特别是自研的推理训练平台,也为大模型研发提供了更好的支持。 四、今年1月发布音视频多媒体大模型,三大特点支撑商业化落地 基于多年来的基础积累、用户的期待以及这些多年的数据、算法、技术的积累,和对大模型时代的观察,今年年初,也就是1月底,我们发布了自己的多媒体大模型,即“音视频多媒体大模型”万兴“天幕”。 让我简单介绍一下“天幕”具备什么样的特点。 第一,从多模态到多媒体。 如今大家都在提多模态,我们并没有否认多模态,只是从应用和用户认知的角度来看,对于普通视频剪辑用户来说,多模态这个术语有些过于技术化了。因此,我们想要强调的是,多模态实际上是指文字、图片等各种元素的组合。我们的目标是将所有这些多模态元素很好地融合在一起,最终让用户在剪辑视频时产生高质量的多媒体视频。 此外,我们目前在视频模型方面并没有着手最底层的L0模型,而是在L0.5或往上的层级,我们更多地致力于提供垂类解决方案,更多地希望我们的模型能够给用户带来价值,能够解决用户的实际需求。 举例来说,对于多模态和多媒体这两个概念,我们更强调视频中应包含片头、主题、字幕等多个模态元素的融合,形成一个多媒体视频。我们强调的不是多模态的处理能力,而是每个模态最终形成一个视频的融合能力,这是我们的模型想达到的第一个特点。 第二,从通用模型到垂直解决方案。 通用模型像ChatGPT已经存在了很长时间,访问量增长趋缓。使用ChatGPT询问中医问题时,可能得到的答案并不理想。因此我们认为,如果GPT是一个基础模型,就需要在此基础上进行市场化,并解决用户的实际问题,最终创造商业价值。这必须通过解决某些人的某些问题来实现。 在开发“天幕”大模型时,我们重点强调如何提供垂直的解决方案,以解决用户的具体问题。我们不会将通用能力作为一个产品,而是将其与垂直场景结合,形成可用的功能或解决方案。目前这种做法可能是一个较好的商业化解决方案。 第三,在数据、算力、应用方面进行本土化扩充。 大家可能会说,全球的数据都已经有了,为什么还要做这件事?这其实是我们在研究中的一种感受。我记得在去年10月、11月份的时候,当时我们做了一个名为《女孩的一生》的视频。做出来后,很多朋友问我说,你们那个视频为什么前面看起来像一个东方小女孩,到后面老的时候好像变成一个西方老太太?我想这可能就是数据问题。 我们最近又重新做了《女孩的一生》这个视频,ID的一致性和人的ID属性得到了较好的保持,所以数据完整性非常重要。因此,我们说自己是土生土长的面向全球市场的大模型。 五、“天幕”大模型4月28日公测,可一键生成60秒+视频 说了这么多我们的大模型,那它到底有什么特点和能力?我通过几个原子能力的视频来给大家简单介绍一下,我们从4月28日起开展公测,希望大家能多体验,提供指导意见。 首先是文生视频的能力,即一键生成60秒以上的视频。这意味着可以用一键方式将一个简短的故事转化为视频。生成的视频质量包括故事情节、角色形象、画面连贯性等方面,基本上能够按照你的故事情节完成视频制作。 在这个领域,我们并没有过多地与其他模型比较生成视频的基础能力,比如生成的质量和时长。我们更多地希望用文生视频的能力解决用户在视频创作过程中遇到的无法获得素材、无法插入场景等一系列的问题。 另外一块是视频生视频,主要偏向视频风格化。这个算法已经比较多了,但真正将其应用到行业产品中并商业化的,并不多见。我们现在的技术不仅在C端产品中让用户使用,也在B端与国内视频媒体行业沟通合作,思考怎样给他们赋能。 我们提供生成音效的能力,即用文字方式生成音效。这些生成能力极大地方便了用户在视频剪辑过程中寻找素材的时间和效率,所以当把这些能力给到用户以后,用户还是比较喜爱的。 另外,我们还提供生成音乐的能力,因为每个视频都需要配备背景音乐。但以往为用户寻找背景音乐是一件费时费力的事情,而且还涉及版权问题。我们的这些能力为用户带来了很好的解决方案。 因此,我们可以说是国内首家拥有音视频多媒体大模型的企业,并且已经通过了中央网信办的备案,可以有效支撑后续公司全球业务的开展。 六、已推出多款具有大模型能力的AI产品,未来将构建天幕模型开放生态 我之前提到大模型的能力,一旦有了一个小的能力成熟,我们就会推进其应用到产品上,让产品面向用户进行体验。 特别是我们公司的主力产品Wondershare Filmora,中文版名称为“万兴喵影”,去年陆续增加了很多AI能力,为用户解决个性化问题和特定问题。我们发现我们的用户对这些能力的喜爱度和使用度有了很大的提升。这也让我们更加决心在AI大模型领域进一步投入。 此外,在国内市场,我们还开发了一款新产品万兴播爆,利用口播数字人的能力通过文生视频的方式,为跨境电商卖家提供方便,让他们能够更轻松地制作商品展示介绍视频。这一领域也受到越来越多人的喜爱。 现阶段,我们更多地是利用AI和模型的能力来赋能自己内部的产品,通过产品将模型的价值传递给最终用户,解决用户的问题,产生价值。 今年开始,我们逐步把模型的能力又往外扩充,希望整个“天幕”能力除了内部使用外,也能够赋能各行各业,特别是生态赋能。 我们在长沙有一个AI Lab中心,在长沙马栏山一带,算是湖南视频媒体文创产业集中地。我们正在探索与一些企业的合作,尤其是媒体企业,目前主要是在视频后期处理阶段,利用我们的技术提高他们的效率,降低他们的成本,为传统媒体行业降本增效。 所以整体来看,我们锚定“新生代AIGC数字创意赋能者”定位。因为我们相信AI会在整个视频制作业会产生一个颠覆式的变化,利用AI和大模型的能力降低成本、提高效率,是时代的趋势。 我们的天幕大模型上一次发布以后主要在内部使用,并在一些小范围试用。4月28日,我们正式公测。或许我们的模型现在还不够完美,但正是因为不完美,才有了更多的憧憬。未来,我们一定会不懈努力,不断完善我们的模型,还请大家多提意见和建议。感谢大家! 以上是朱伟演讲内容的完整整理。
vivo Y36e亮相谷歌控制台数据库 或为vivo G2换壳机型
【CNMO科技消息】今年1月,vivo在国内正式推出了vivo G2智能手机。众所周知,vivo多次以不同的名称推出相同的设备,现在vivo G2也预计将发生同样的情况。 在vivo G2智能手机发布之前,该设备的型号PD2318就已在Google Play Console数据库中被发现。今天,有外媒再次在网站上发现了同一型号但不同名称的设备。vivo Y36s以型号PD2318在Google Play Console的清单中被发现。 这表明vivo Y36s将作为vivo G2的更名版本到来。而且,不过该型号表明这款即将推出的设备将仅在中国市场发售。只看vivo Y36s的规格的话,数据库显示芯片编号为MT6833,对应联发科天玑700 SoC,但该设备可能会搭载天玑6020 SoC,因为vivo G2智能手机也发生过类似的情况。与vivo G2类似,vivo Y36s也将搭载Android 13操作系统,拥有720P的屏幕分辨率和6GB RAM。 由于上述规格与vivo G2智能手机相匹配,且两款设备都使用相同的型号,预计vivo Y36s和vivo G2可能会拥有相同的功能。此外,从型号V2318A来看,它可能很快就会在中国市场推出。 vivo G2 5G智能手机搭载联发科天玑6020芯片组,并集成了Mali G57 GPU。它运行基于Android 13操作系统的OriginOS 3.0系统,并提供三种LPDDR4X RAM选项(4GB/6GB/8GB)和两种UFS2.2存储选项(128GB/256GB)。 在屏幕方面,该智能手机配备了一个LCD屏幕,屏幕尺寸为6.56英寸,分辨率为1612 x 720像素,支持60Hz/90Hz的刷新率。在影像方面,新机配备有后置双摄,主摄像头为1300万像素。智能手机上还有一个500万像素的自拍摄像头。它搭载一块5000mAh的电池,支持15W有线充电。
那些创意爆棚的手机,为什么配置通常总是很坑?
如果你是一位重度手机爱好者、或者是喜欢折腾小众数码产品的发烧友,那么大概率就会知道,在如今的这个智能手机市场里,除了耳熟能详的几家“头部厂商”之外,其实还有很多规模相对较小的厂牌存在。 请注意,我们说的并不是某些靠贴牌,卖品牌授权维生的“变相山寨机”,而是那些真正有在用心做产品,但本身规模较小、或是本就主打小众用户群体的手机厂商。 这些小众品牌有的专注于户外三防手机,推出的产品集防冻、防摔、防水,夜视、红外测温、激光测距为一体,再加上七八千、甚至几万毫安时的电池,轻轻松松可以做到续航一个月。再加上诸如强光手电、超大音量喇叭、海事卫星电话,甚至是漂浮装置(扔进水里不会沉底、会浮起来)等种种“很厉害的”配置,完全堪称是出门在外的探险利器,就算说它们能直接拿来当砸人,估计也不会有人感到怀疑。 当然,也有一些小众品牌专注于隐私保护。其所推出的智能手机产品会使用非安卓的Linux系统,并自带存储芯片全盘加密、网络流量加密,和端对端加密通话以及邮件服务,再加上物理摄像头断电设计,甚至有些机型还会在自带的数据线里都加入“防火墙”,号称是可以屏蔽掉潜在的黑客攻击。 除此之外,还有一些小众厂商将手机的“环保、可修复性”作为重点,他们会在硬件设计阶段就少用胶水和焊接,多使用螺丝和卡扣进行固定,并用尽量模块化的组件设计。这样一来,用户在手机坏掉之后可以轻松地自行购买相应模块、进行维修更换,从而直接延长手机的使用寿命,同时降低“换机”的花费。 当然,考虑到上述“模块”往往并非标准接口,所以厂商实际上也不会吃亏,算是一种“我给你环保,你给我掏钱”的双赢。 不过说了这么多,如果大家真的有按照我们的这些描述去寻觅相应的小众产品,并打算“尝个鲜”的话,那么你大概率会发现,它们的硬件配置普遍会比想象中要低得多。而且更进一步来说,它们往往会在相应的价位段显得“毫无性价比”可言。那么这是为什么呢? 很显然,各种充满想象力、“花里胡哨”的小众功能设计对于硬件成本的“挤占”,首先就是不可忽视的一个因素。就拿部分三防手机上使用的耐超低温电池、红外测温装置来说,它们的成本可是一点都不低。更不要说海事卫星电话这种一个功能可能成本就直接大几千的模块了。加上了它之后如果还想控制最后的售价,那么在SoC、影像、屏幕等方面的配置略微缩减,自然也就是很正常的结果。 除此之外,可能有些朋友会有所耳闻(或者有所察觉)的一件事,是如今的手机行业普遍存在“抢产能”的情况。特别是对于一些最新款SoC、最先进的CMOS来说,头部厂商往往要么是直接砸钱“定制研发”,要么就是用销量保证来换取“首发权”。 在这样的前提下,既不那么富裕,又本就只能混迹小众市场、注定不可能有多大销量的这些品牌,别说拿到与头部厂商同期、同价格的旗舰SoC份额,很多时候他们其实都只能选择过时、且产(ku)量(cun)充足的中端方案。于是乎,在“性价比”上看似缺乏竞争力也就并不奇怪了。 说了这么多,对于这些小众手机厂商来说,客观上的“低性价比”其实很多时候也未必真就是个问题。 一方面,正如我们前面讲到的那样,绝大多数“正常”的小众厂商,它们产品的卖点本就不是传统的性能、跑分、拍照这些方面。说白了,它们的消费群体多半已经有了另外的“主力机”,在购买时本就不会在意这些产品的“性价比”。比起更好的SoC、更强的摄像头,这部分消费者或许反而宁愿为更大容量的电池、亮度更高的手电筒,或者仅仅是更奇葩的外观设计去付费。 另一方面,站在这些小众厂商的角度而言,使用“不那么新”的硬件方案,实际上也就意味着他们不需要承担很多技术研发、试错的潜在成本。比如相关移动平台的系统稳定性、应用兼容性,实际上都已经得到了验证,驱动也会是历经迭代的成熟版本。 如此一来,对于相关企业来说,就相当于减少了许多研发成本,可以变相提高产品的利润率。而对于最终的消费者来说,比起小众厂商的旗舰机型,这种采用成熟方案的产品往往也会被认为更加可靠、实用。所以从某种程度上来说,这也算得上是各方都能接受的一种产品思路了。
华为Pura 70零件已实现90%本土制造 100%存在挑战
【CNMO科技消息】华为Pura 70系列备受追捧的原因之一就是它拥有很高的国产化率。此前,据博主爆料,华为Pura 70系列国产化率接近100%。但具体数据是多少?最近,日商调查公司Fomalhaut Techno Solutions发布了对华为Pura70系列的拆解报告,发现该系列手机已实现90%以上的本土制造。 华为Pura 70系列 Fomalhaut Techno Solutions报告显示,华为Pura 70系列在本土化生产方面取得了显著进展,除了超大杯Pura 70 Ultra机型的主摄像头采用了日本索尼传感器外,其它型号如Pura70、Pura70 Pro及Pura70 Pro+的关键零部件,均已实现高达90%以上的国产化,包括核心处理器、显示屏、外壳、电池、镜头、散热系统以及声学部件等。这标志着华为距离完全的国产化手机制造仅一步之遥。 Pura 70系列的成功本土化生产得益于多家国内企业的鼎力支持,主要供应商名单涵盖了欧菲光、蓝思科技、歌尔声学、长盈精密、舜宇光学、京东方和水晶光电等行业领军者。 不过,华为在追求100%国产化的道路上仍面临一些挑战,尤其是在高端处理器(如麒麟9010)的晶圆制程技术和顶级摄像头组件上还需突破。但业界普遍认为,华为智能手机实现全面国产化是大势所趋。 虽然官方没有公布关于Pura70系列处理器的相关信息,但根据博主晒出的开箱视频来看,华为Pura70 Ultra手机参数显示为搭载麒麟9010芯片。此前分析机构TechInsights预测称,Pura 70系列2024年出货量预计将超过1000万部,将成为苹果iPhone 15和iPhone 16系列的主要竞争对手之一。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。