EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
不能上网的笨手机,怎么突然火了?
这是索尼的高解析度音乐播放器——NW-WM1AM2,俗称「黑砖」。能听高品质音乐,像手机但不能打电话,和更大众的 MP3 相比,它确实大了点。 这是另一块黑砖,看着像一台播放器,但它真的是一台手机,能听音乐也能打电话。和当下流行的智能机放在一起,它小了点,比例也有点「失调」。 在小屏手机快要消失,但依然有一大批小屏爱好者呼喊 mini 快回来的 2024 年,手机公司 Light 像是听到了小众的心声,推出了旗下第三代机型 Light Phone III。 更加激进的是,他们不仅把屏幕砍了,还试图把智能从手机中分割开来。 失去彩色的「笨手机」 你很难想象,这是一台诞生在 AI 手机元年的设备。 和主流智能机相比,Light Phone III 最明显的不同是,去掉了硕大且彩色的手机屏幕,取而代之的,是一块 3.92 英寸黑白 OLED 面板。 虽然看上去这就是一块墨水屏,和 Kindle 阅读器的那块屏幕几乎一样。 的确,上一代 Light Phone 用的是电子墨水屏,这和 Light 的成立主旨高度一致:用最简单的零件做最简单的机器。 尽管电子墨水屏有一定的先天优势:护眼,低电耗,更适合长时间使用。可有超过 50% 的老 Light Phone 用户反映,没办法习惯如此低的刷新率,本就没什么功能的机子在墨水屏的「加持」下,更加难用。 许多用户的弃坑也使得 Light 在三代机上启用了更加符合这个时代的 OLED 屏。 Light Phone III 的屏幕分辨率不高,仅为 1080 x 1240,不过屏幕刷新响应的速度很快。 一方面,更好的屏幕能让许多曾经的粉丝考虑重新入坑,另一方面,也降低了想要尝试 Light Phone 的智能机用户的使用门槛,起码在屏幕观感上,Light Phone 不会和智能机拉开太大的差距,产生极强的割裂感。 Light Phone 在官网的介绍中写到: 它不具备互联网、社交媒体、新闻、电子邮件或任何诱饵式的无限功能。 它没有内置也不能下载任何一个常用的应用,虽然设备能连 Wi-Fi,但不能上网。 连儿童手表都在 All in AI 的时候,Light Phone III 却回头向功能机看齐:打电话、发短信、放音乐、定闹钟、计时器、地图导航和语音备忘录,这几乎就是 Light Phone 能做到的所有。 从某种程度说,Light Phone 甚至还不如一台能砸核桃的诺基亚,因为这套系统里连贪吃蛇之类的小游戏,都被拒之门外。 但 Light 在前两代机型上还是积累了些经验——用户想要的极简,是简单,不是简陋。 因此,在 Light Phone III 在上一代设备的基础上,加入了非常多这个时代「本该有」的手机配置。 从外观来看,Light Phone III 增加了当下流行的金属中框,和前两代机型的全局塑料比起来,金属总能给手机带来一点高级感,也更抗造。 另外,三代机型上还配备了: USB-C 2.0 降噪麦×2 立体声扬声器×2 1800 mAh 电池 指纹识别 手电筒 NFC 和 5G 芯片 如果把上面的这些配置都放在第二代 Light Phone 上,你出门还是会有些慌张,因为没有摄像头的手机真的很不方便,即使你我都能舍去拍照录像、记录生活点滴的习惯,但点餐下单、扫码付款总还是需要一颗镜头,这也是二代机被诟病最多的缺点之一。 因此,知错就改的 Light Phone III 就加上了镜头,前置 50mp,后置 8mp。它既可以扫码,也可以视频,用它拍照虽然比不上主流手机,但有一种用 CCD 拍出老照片的质感。 更惊喜的是,虽然屏幕是黑白的,但照片导出后,是彩色的。 这些小功能单拎出来都不算什么重大更新,但把它们放在一起,而且是放在一台极简风的手机上时,这家公司的意图就十分明显了: 他们希望 Light Phone 能成为一台独立设备,而不是备用机,即使你出门只带着它,也不会担心和这个世界脱节。 Light Phone 的归园田居 Light 创始人 Joe Hollier 和 Kaiwei Tang 称,他们和团队一起: 打造了一款功能极少,且几乎可以永久使用的手机。 能永久使用的 Light Phone III,并不是说所有零件都耐用,而是便于拆卸的设计,让它易于更换电池和其他零部件,所以才说这款手机可以使用多年。 无论从哪个角度看,Light 的三代机,都有一种过去与现在交错的「拧巴感」。 和 1GB+8GB 的 Light Phone II 比较,Light Phone III 的内存组合升级为了 6GB+128GB,本就不多的功能加上更大的内存存储,三代机的确耐用了不少。 当然,Light Phone III 799 美元(约合人民币 5800 元)的价格也比上一代(299 美元)贵了将近三倍。 不过官网目前的预售价为 399 美元(约合人民币 2895 元),打了五折。从对半砍价格不难看出,Light 急需一批尝鲜的用户,并且成为极简手机模式的粉丝。 可是,Light Phone,或者说极简手机,真的行得通么? 2014 年,Joe Hollier 和 Kaiwei Tang 在一个 Google 实验项目中相识,他们最初被安排的工资是制作智能手机应用程序,在更深层次上学习了不同产品的构建、资助方式和背后的因果关系。 本应潜心钻研手机 Killer App 的二人组,最后却合作成立了 kill the App 的公司——Light。这种叛逆感,也完美在每一代 Light Phone 中体现。 他们希望借助自己对产品的理解,让现代人脱离手机通知的骚扰,重新回归到自己的现实生活中。 在 Hollier 和 Tang 看来,LightOS 在设计之初,有两个核心的概念: 世界最不需要的就是另一个争夺我们注意力的智能手机应用程序,因为这些广告驱动平台的兴趣和性质永远不会与我们的实际生活质量相符。 我们的使命就是让人们重新拥有他们最宝贵的财富——注意力。 Light Phone 也就是在这样的概念下初见雏形。 手机脱敏计划的第一步,就是要减少设备对人的吸引和诱惑,所以从第一代 Light Phone 开始,一切可能会分散用户注意力的「非必要」功能,都没能出现在这款极简手机上。 Light Phone I 应该是三代机型中,最激进的一个。不仅没有 App,就连最基础的音乐、蓝牙、短信功能都没有,这块 mini 像素屏,只能显示时间,手机唯一的对外功能,只剩接打电话。 说它是一款产品,我更愿意把它看成一个概念,是 Light 为日后走向更广泛市场打下的基调,虽然销量平平,但也引起的讨论不小,当时市面上还出现了仿制 Light Phone I 的山寨机。 Light Phone II,在一代建好的毛坯房里,搞了点装修,但不多: 2.8 英寸的 E-Ink 电子墨水屏幕,78g 的小巧机身,能收发短信,计算器、闹钟、音乐、导航和叫车服务等功能也陆续在二代机上出现。 但是,第二代 Light Phone 仍然很激进: 原本我们觉得摄像头是一个很好的工具,但它存在「诱导性」,即人们会习惯将自己拍下的东西传到社交网络上,再去看自己获得的点赞数,所以我们决定去掉。 至此的两代机型,哪怕放在它们发布的那一年,对「极简」的追求都略显夸张,和时下流行的手机放在一起,Light Phone 给人一种与世隔绝的感受,可惜去的不是桃花源,而是监狱。 这种被迫被剥夺一切的实际体验,使许多想要尝试的用户望而生畏,它们不属于这个时代,也不属于大多数人。 但即使是这样疯狂的产品,Light Phone 的前两代产品,仍然卖出了 10 多万台。 极简手机有市场,但如此极简的 Light Phone 想要更进一步,还得继续深挖:这群小众的用户到底需要什么? 使人离不开手机、让人对手机成瘾的,是手机里的各种 App 而并非手机本身,所以这种把软硬件一刀切的做法,不仅误伤了自己,也失去了许多对 Light 感兴趣的人。 原因很简单,拿着一二代的 Light Phone 出门,很多事你根本做不了,本来是要和脱敏手机,现在搞不好要和社会断绝关系了。 所以,Light Phone III,才是当初设想的完全体。 它既给你提供了远离 App、极简生活的可能,又能在到处都需要手机的环境里,不至于让你和这个世界断开连接。 这两年,声称能够戒掉手机瘾的「自律神器」很受考公考研党,以及轻生活爱好者的欢迎。 把手机放在盒子里设置好时间关起来,就没办法在倒计时结束前,拿出手机刷视频、刷微博分神了。 虽然神器宣称「整个使用生命周期只能暂停两次取出手机,用完了就只能等计时结束,不然打不开」,但这里面有两个很明显的 bug: 只要想打开,谁都阻止不了; 自律神器只是中介和辅助,最后靠的还是自己。 手机的健康屏幕使用时长、学生群体中很火的番茄时钟,包括 Light Phone,也都是如此。 想着靠一台手机、一个软件,甚至一个盒子让自己走向自律人生,还是有点痴人说梦,所以这类设备最大的意义在于:当你想要改变一些生活习惯或是生活现状的时候,它们会是一些不错的工具。 就像 Light Phone III 的广告语一样: 无论您是梦想着摆脱数码产品,还是想更多地关注您的孩子,或者正在购买您的第一部手机,Light Phone III 都是一款让生活更美好的工具。
苹果的 Apple Intelligence,为什么要这样设计新 Siri?
苹果的审美,也有被吐槽的一天。 上周的 WWDC,AI 生成的卡通图片,就算是演示也丑得肉眼可见。 ▲ 左:Apple Intelligence,右:新版 Siri 同时,Apple Intelligence 和新版 Siri 的炫彩 logo,也引起了一些质疑:怎么和微软 Copilot 神似?乔布斯当年的话还言犹在耳:微软唯一的问题是他们没有品味。 ▲ 微软 Copilot 换种高情商的说法,这次微软和苹果是英雄所见略同,都挺好。 AI 产品越来越多,也离我们越来越近,科技公司们都在绞尽脑汁地想,怎么用设计传达,这个产品被 AI 赋能,用户正在和 AI 功能交互。 目前,答案大致可以分为两派,一种像苹果、微软这样,更加丰富、多彩和圆润,一种像 OpenAI、Perplexity,更简单的颜色,更抽象的形状,更有高级感。 友好,友好,还是特么的友好 每天和你相处的 AI,你有注意它们长着怎样的「脸」吗? 之前我们写过一篇 AI 产品为什么喜欢拿「四角星」当 logo 的文章。 背后原因主要有两个,一是,「四角星」有 bling bling 的效果,让人觉得亲切和喜悦,二是,「四角星」可以引申到「魔法」,体现技术的神奇,同时略过技术的黑箱,一键使用某个功能,事情就能解决。 新版 Siri 似乎有着类似的觉悟,未来,我们拿着 iPhone 15 Pro 及以上手机和它交互的时候,屏幕边缘会亮起一圈彩色的光芒,同样有些「魔法」特效的味道。 过去的人类不理解电,将暴风雨时的电弧称为魔法。当 AI 同样不可名状时,用魔法的比喻反而更容易为人接受。 从这个角度上说,logo 不负责解释 AI 是什么,而是塑造 AI 带给用户的感觉。越陌生的概念,就越应该以平易近人的姿态接近。 所以,我们可以看到,虽然各家 AI 产品 logo 的设计风格不大一样,但基本的思路还是共通的——友好、日常、包容、人性化…… 有的凸显色彩,微软 Copilot,柔和的糖果色,天然有亲和力,对应自身的 slogan——「你的日常 AI 伴侣」。 有的勾勒形状,Meta AI,用渐变的圆圈,体现 AI 助手比以往更快、更智能、更有趣,流转在扎克伯格的社交产品宇宙里。腾讯的元宝,也是「圆滚滚」的模样。 甚至还可以拟人,抖音旗下的豆包,名字取得接地气,logo 用的也是可爱的 3D 卡通女性头像,定位就像抖音一样,老少咸宜,适合对 AI 感兴趣但不了解的大众。 除了推出新的 logo,苹果还在 WWDC 玩了文字游戏,对「AI」旧词新解,把 Artificial 改成 Apple。 但道理还是那个道理,苹果智能听起来比人工智能温暖,不关联冷色调的电路、芯片、机器。 总之,AI 不能是科幻电影里的反派,比如《2001 太空漫游》的「红眼」HAL 9000。 每个 logo,都在讲一个故事 也有唱反调的声音说,这些设计都太幼稚了,像儿童动画,不够严肃和专业。 各花入各眼,OpenAI 和 Perplexity 是另外一种风格,更侧重展现产品的专业性和 AI 的可能性。 Perplexity 的 logo,像一本打开的、翻不完的书,切合 AI 搜索作为互联网门户的定位,又突出 Perplexity 自身的特点——搜索、总结、通过引用来源的方式尊重事实…… 同时,Perplexity 把界面包装得像淡黄色的纸张,有意和传统的科技产品区分。情商超高的聊天机器人 Pi 也是这个风格,将聊天塑造得像笔友相互写信。 OpenAI 的 logo 则是个风格化的六角形,也像一个漩涡,和通义、DeepMind 有共同语言。 我请 GPT-4 解释一下含义,它的答案是,这个 logo 用交织的图案、相扣的线条,象征着 AI 与人类的协作和联系,以及 AI 的复杂本质,传达出和谐、平衡和创新的感觉。 尽管还是很抽象,但已经比几年前像用 Word 随手打出来的 logo 好多了。 OpenAI 的网站也包装得有模有样,之前是抽象的 AI 生成图片,配合浅景深的暖色调人像摄影。 最近又进行了微调,用类似油画的风格装点门面,显得更加文艺范儿。 其实,OpenAI 的整体视觉风格是 2021 年底请了创意机构重新设计的。 这个时间点很微妙,2021 年初,OpenAI 发布了文生图模型 Dall-E,并且计划在 2022 年发布 ChatGPT。他们必须拾掇一下自己的企业形象,站上舞台面向大众了。 所以,OpenAI 的总体改造思路就是「既要又要」——既要展现人性化的色彩,也要清楚传达人工智能的概念。 很有意思的一点是,从书本到艺术,OpenAI 和 Perplexity 的人文色彩都带点「复古」。 如何带给用户舒适和安全的感觉,直观的色彩、形状、拟人化是一种方式,而怀旧也行之有效。 这种「怀旧」也体现在产品的使用方式上。 Perplexity 长得就像传统搜索,你知道怎么输入查询,OpenAI 为 ChatGPT 设计的对话界面,简单性高于一切,每个交互都不言自明,无需说明书,降低了用户的上手门槛。 logo 并不孤立存在,而是和其他设计一起,服务于用户使用一个产品的美好感觉。 从小众到主流,AI 正在成为产品本身 我们已经习惯用图标指认功能,比如放大镜表示「搜索」,齿轮表示「设置」,三个点表示「更多」,向下的箭头表示「下载」。 然而,目前为止,AI 还没有约定俗成的表现形式。 一方面,AI 是一个太过广泛的概念,当我们说到 AI,有可能在说抖音的猜你喜欢、美图秀秀的 P 图,也可能在说和 ChatGPT 聊天、用 Midjourney 从文字生成图片。 另一方面,从前的 AI 往往是作为一个功能,低调地嵌入产品之中,比如推荐算法、比如 P 图选项。 但现在,AI 自己就是一个独立的产品,以及产品的宣传点,比如 ChatGPT、比如 PS、PR 被生成式 AI 加成的一系列功能。 AI 一直都存在,但我们从未像现在这样明确地感知到。如果是你,会用什么 logo 表示 AI? 北亚利桑那大学社会学家 James I. Bowie,提出过一个非常有趣的发现。 和 AI 有关的美国 logo,上世纪 80 年代就有出现,当时的企业喜欢用抽象的人头,以及埃舍尔式三角形和条纹,凸显智能的概念。特别是其中的条纹,可能是在效仿当时的巨头 IBM。 不过,近十几年来,和人有关的因素减少了,取而代之的是简约的机器人造型,像是从 Android 标志、《机器人总动员》取材的。 如此看来,没有标志凭空产生,或多或少受到了巨头、行业趋势甚至科幻作品的影响。同时,我们解读某个标志,其实也是基于我们对某些元素的既有认知。 不得不说,目前的 AI logo 们,仍然需要刻意地「阅读理解」,如果不加以解释,我们只会觉得「就这」或者「不解其意」。 标志的目的,应该是尽可能清晰和普遍地传达含义,让我们无需依赖文本或语言即可理解。根据这个评判标准,AI logo 里还没有成功的榜样。 反过来看,AI logo 更适合作为一面镜子,让用户了解企业的使命和价值观。那些五颜六色的图标带着一点点讨好的意味,主动地提供情绪价值,不太容易联想到「一夜变天」「抢饭碗」之类的负面词汇。 这是基准测试之外的一种软实力比拼,类似于各家 AI 厂商往哪里投广告,是女性用户多的小红书,学生、打工人多的 B 站,还是中老年也覆盖的抖音。 人靠衣装佛靠金装,为了让更多人愿意用起来,AI 们当然也要考虑,画上一张怎样的皮。
Apple Watch X 即将到来:纤薄机身、更大屏幕,更有全新磁吸表带
2014 年 9 月 9 日,苹果在加州库比蒂诺的 Flint Center 发布了 Apple Watch。这是在乔布斯离世后,苹果的第一个「One More Thing」产品,也是库克时代发布的第一个没有以「i」开头的新品。 转瞬间,十年已经过去。为纪念 Apple Watch 发布十周年,苹果可能会为 Apple Watch 带来重大更新,并将使用「Apple Watch X」来命名。 按照惯例,自 Apple Watch Series 1 开始,苹果几乎总是每隔三代就进行一次大的外观更新。 伴随着 Apple Watch Series 7 的发布,苹果为手表升级了更大的屏幕,还带来了更圆润的机身。直到现在,这一 ID 设计正好迭代了三款手表,同样在暗指着下一代 Apple Watch 将获得外观上的全新变化。 作为 Apple Watch 发布十周年的纪念表款,「Apple Watch X」有望带来「里程碑式更新」。 郭明錤在最新的 Medium 博客中,提到即将推出的 Apple Watch 将迎来全新外观升级。 新的 Apple Watch 会拥有更大的屏幕尺寸,将从之前的从 45mm / 41mm 升级到约 49mm / 45mm。另外,Series 10 还会变得更薄。 另外,郭明錤还补充到,虽然去年最后没有无量产,但经过过去一年多的密集测试,目前 3D 打印的生产效率已有明显改善。因此 Apple Watch 将从今年下半年开始,采用由 3D 打印技术生产的零部件。 至于 Apple Watch Ultra 的下一代产品,郭明錤表示该款机型的规格无明显变化,若生产良率能符合预期,则可能会新增机壳颜色选项,例如黑色或深色等。 「Apple Watch X」将采用更薄设计这一观点,与彭博社的马克·古尔曼(Mark Gurman)上周末报道的内容完全吻合。 在最新的 Power On 时事通讯中,古尔曼表示苹果正在努力对 MacBook Pro 和 Apple Watch 进行「瘦身处理」,并计划让最新款 iPad 成为同类产品中最薄、最轻的设备。 此外,他还在此前的报道中,声称下一代 Apple Watch 将是「迄今为止最大的一次革新」。 目前 Apple Watch 的表带,是通过机身侧面划入来固定连接的。从发布至今,所有的 Apple Watch 都采用了这一设计。这样做的好处是可以兼容不同型号的产品,从初代到 Apple Watch Ultra 的表带均可互相替换。 但这样做也带来了一些负面影响。庞大的表带固定槽无法变动,会占用较多原本可以留给电池和其他部件的位置,这对于手表上寸土寸金的空间会造成一定的「浪费」。 因此,「Apple Watch X」可能会采用一种表带连接系统。据参与开发 Apple Watch 的内部人士透露,Apple Watch X 可能会采用一种新的磁吸表带固定方式,但目前并没有披露太多细节。 新表带的磁吸固定方式,可能会带来更便捷的体验。不过这也意味着现有的 Apple Watch 表带,可能不再与新的「Apple Watch X」兼容。 在健康管理方面,苹果一直尝试在 Apple Watch 上提供血压监测功能。 据彭博社此前报道,下一代 Apple Watch 将首次配备血压传感器。苹果首次实现该功能的关键之处在于,它不会向用户显示确切的收缩压和舒张压读数。 相反,该功能将显示血压随时间变化的趋势,类似于 Apple Watch 目前的体温功能。如果用户的血压呈上升趋势,他们就会收到通知,提醒他们注意这一变化。该功能还会提示用户记录血压飙升时的情况。 美国商标和专利局则在早前也公示了一项苹果的专利,其中就涉及到非侵入式血压测量方法。 苹果在专利信息中称,相较于侵入性测量技术,传统的非侵入性测量血压的方法准确性普遍不高而且在实际测试中存在诸多变量。 但苹果在这一专利中,对非侵入性血压测量方法进行了改进,可以明显提高准确度。另外还有消息称,苹果仍在开发一个能提供准确血压数字的系统,但「这些改进仍遥遥无期」。 Apple Watch 即将推出的另一项功能,是睡眠呼吸暂停检测。这项功能最快将于今年推出,其工作原理与 Apple Watch 的其他大多数健康功能类似,将提醒用户可能出现的健康问题,并建议他们接受医生的进一步诊断。 据彭博社报道,Apple Watch 的睡眠呼吸暂停检测功能将监测用户的睡眠和呼吸情况,「以预测用户是否患有这种疾病。 放眼当下,Apple Watch 已经走进了许多人的日常生活。无论是作为饰品还是运动检测设备,Apple Watch 都是十分合适的存在。它不是必须,但是 Apple Watch 带来的「锦上添花」,已经让众多用户感受到了那份喜悦。 十周年之际,Apple Watch 也即将迎来「X」时刻,让我们一同期待苹果会呈现一份怎样的礼物。
谷歌真·AI配音神器来了!自动看懂画面、对齐音频,能为任何视频生成无数音频
编译 | 陈骏达 编辑 | 程茜 智东西6月18日消息,今日凌晨,谷歌DeepMind发布了一个名为V2A(Video-to-Audio)的系统,能根据画面内容或者手动输入的提示词直接为视频配音。它还可以为任何视频输入生成无限数量的音轨。 谷歌DeepMindV2A系统最大的特点就是无需人工输入提示词也可以为视频配音。DeepMind在博客中称V2A能依靠自己的视觉能力理解视频中的像素。也就是说,V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。 自动播放 ▲谷歌DeepMind发布的V2A Demo视频 当然,V2A也能够根据提示词生成所需的音频。使用者可以通过输入“正面提示词”来引导模型输出所需的声音,或输入“负面提示词”来引导其避免出现不需要的声音,这给了使用者更大的控制权。 与其它AI音频生成工具不同,V2A在生成音频后无需人工对齐音频视频,而是可以直接自动将音频与画面对齐。 但谷歌DeepMind也承认,这一系统目前仍然存在很大的局限性。如果输入的视频质量不高,那么输出的音频质量也会出现明显的下降。他们认为需要进一步提升系统安全性并补齐当前V2A在口型同步等方面的短板,才能正式向公众发布这一系统。 谷歌发布V2A没过几小时,语音克隆创企ElevenLabs就发布了文字到音频模型的API,并基于这一API做了一个Demo应用让公众免费使用。 自动播放 ▲ElevenLabs最新应用给Luma生成的视频配音 与V2A不同的是,该应用并不能直接实现画面到音频的转换,而是利用了GPT-4o将视频截图转换为文字提示词,之后再输入文字转在几秒内生成多条与画面内容匹配的音频。这是基于该公司5月底发布的文字到音频模型打造的。 一、与自家Veo模型配合生成有声视频,但对复杂画面理解存在缺陷 虽然目前Sora、Pika、可灵以及近期的Dream Machine和Runway Gen-3 Alpha等一系列视频生成模型已经能输出逼真的视频画面,但它们生成的视频都是没有声音的。 AI工具也可以直接生成质量尚可的音频。AI创企Stability AI发布的Stable Audio Open模型可以输出长达47秒的乐器演奏片段,语音克隆初创公司ElevenLabs发布的音频生成工具可以根据用户输入的提示词生成音频。然而,目前没有工具可以全自动将视频与音频相结合,为AI生成的视频配音将是让AI视频变得更为真实的重要一步。 谷歌DeepMind推出V2A系统就是为了解决这一问题。谷歌DeepMind的博客中写道,V2A可与谷歌自家的Veo等视频生成模型配合使用,直接生成有声音的AI视频,V2A也可用于历史档案画面配音、无声影片配音等领域。 在下方的视频中,V2A展现出了对画面和提示词的超强理解能力。配乐营造出了提示词中紧张的恐怖片般的氛围,且音频与视频几乎完全同步。脚步声基本符合人物走动的节奏,随着画面的切换,脚步声也瞬间消失了。 自动播放 ▲音频提示词:电影风、惊悚片、恐怖片、音乐、紧张、氛围、混凝土上的脚步声 在下方的这则视频中,V2A生成的音乐婉转悠扬,配乐后的视频颇有西部大片般的感觉。 自动播放 ▲音频提示词:草原上夕阳西下时,悠扬柔和的口琴声响起 谷歌DeepMind发布的Demo视频中也出现了不少破绽。下方的视频是一位鼓手在演奏架子鼓。而V2A生成的第一秒音频还相对符合画面中的演奏节奏和所击打的鼓,然而后面的音频却出现了不属于这一画面的声音。画面中鼓手一直演奏的是架子鼓中的军鼓,然而音频中却出现了击打架子鼓其它部分(嗵鼓)的声音。这显示出V2A对复杂画面的理解尚存在缺陷。 自动播放 ▲音频提示词:音乐会舞台上的鼓手,周围环绕着闪烁的灯光和欢呼的人群 V2A还有一个特点就是给了创作者很大的自由。它可以为任何视频输入生成无限数量的音轨,还可以给模型定义“正面提示”以引导模型输出所需的声音,或定义“负面提示”以引导其避免出现不需要的声音。 这种灵活性使用户可以更好地控制V2A的音频输出,让用户可以可以快速尝试不同的音频输出并选择最佳匹配。 自动播放 ▲视频1(音频提示词:空灵的大提琴氛围) 自动播放 ▲视频2(音频提示词:宇宙飞船在浩瀚的太空中疾驰,星星划过,高速,科幻) 上方2个视频是V2A根据同一段视频生成的不同音频效果。只需简单调整提示词,V2A就能迅速给创作者提供风格迥异的音频。 二、采用基于扩散的高质量音频输出,AI给视频加注释辅助训练 谷歌DeepMind的研究人员称,他们一开始尝试了自回归和扩散这两种技术路径,发现基于扩散的音频生成方法为同步视频和音频信息提供了最真实的输出结果。 V2A系统首先会将视频输入编码为压缩表征,然后扩散模型迭代地从随机噪声中提炼音频。该过程由视觉输入和自然语言提示引导,以生成高度符合提示词的音频。最后,音频输出被解码,转换为音频波形并与视频数据组合。 为了生成更高质量的音频并增加引导模型生成特定声音的能力,谷歌DeepMind的研究人员在训练过程中添加了更多信息。这些信息是AI根据视频生成的注释,包括对画面内声音的详细描述和画面中的口语对话的记录。 通过使用视频、音频和附加注释进行训练,V2A系统学会了将特定的音频事件与各种视觉场景相关联,同时还能理解提示词中提供的信息。 博客中写道,V2A系统可以理解原始像素,将文本提示变为可选项。这意味着V2A可以直接看懂视频画面并据此生成音频。这一系统也不需要人工将生成的声音与视频对齐,创作者不需要经历繁琐的调整过程。 尽管目前这一系统已经初具成效,但DeepMind的研究人员认为目前这一系统仍然存在缺陷。它的音频输出质量严重依赖于视频输入的质量,视频中的伪影或失真会导致音频质量的严重下滑。 此外,研究人员还在不断改进系统的口型同步能力,目前V2A在这方面表现不佳。在下方的视频中,虽然V2A只生成了一位小女孩的说话声,但是画面中所有人物的口型都在变化,并且与说话内容并不一致。 自动播放 ▲音频提示词:音乐、对话内容:“这只火鸡看起来棒极了,我太饿了。”(Music, Transcript: “This turkey looks amazing, I’m so hungry.”) 虽然V2A可以按照输入文本生成人物对话的音频,并基本与画面中角色的口型同步。但口型同步的效果与视频生成模型相关,如果视频生成模型没有对口型的能力,口型同步的效果便会大打折扣。 三、ElevenLabs开源视频配音应用,部分效果不如V2A 5月31日,同样在AI声音生成赛道上的ElevenLabs发布了他们最新的AI音频模型,可以通过文本提示生成音效、乐器演奏片段和各种角色声音。 在ElevenLabs发布的宣传片中,他们的AI音频模型展现出了不俗的能力。它能一次生成多段音效供创作人员选择,在口型同步上表现也不错。ElevenLabs认为这一模型在游戏行业和影视行业中有较大的应用前景。 自动播放 就在谷歌DeepMind发布V2A系统后不久,ElevenLabs就上线了他们的文本到声音效果API,并基于API做了一个开源的视频到声音效果的应用。智东西第一时间测试了这一应用的生成效果,我们将谷歌Demo中的视频消音后输入了ElevenLabs的开源应用,让其生成音频。 自动播放 ▲ElevenLabs产品给谷歌Veo生成的视频配音 就这一视频而言,ElevenLabs的应用要逊色于谷歌V2A系统。视频前半部分的脚步声频率基本与画面相符,但在切换镜头后音频就与画面不匹配了。此外,由于不支持人工提示词输入,视频没有配上适合的背景音乐。 ElevenLabs的研究人员称,他们的视频到声音应用在不到一天的时间内开发出来了。该应用自动将视频按照每秒截取四帧的频率截图,并发送给GPT-4o模型,将画面内容转为文字提示词。提示词将输入到他们的文字到音频模型中,模型会生成符合画面内容的音频。 结语:V2A系统尚不对外开放,开发者需要对模型潜在风险负责 谷歌DeepMind目前并不打算向公众开放V2A系统。他们目前在与创作者进行沟通,收集创作者的看法与建议然后进一步优化V2A系统。 谷歌DeepMind强调,他们特别将SynthID工具包(谷歌标记AIGC的特殊水印)纳入到V2A研究中,为所有AI生成内容添加水印,防止滥用该技术的可能性。 ElevenLabs的音频模型和谷歌DeepMind的V2A系统的相继发布,或将给内容创作的生态带来巨大的改变。而正如之前所有AI模型那样,音频生成模型也面临着滥用的风险。这将是摆在开发者面前的重要挑战。
2024Q1国内平板战报:华为增88%、苹果降3%
原标题:2024Q1 国内平板战报:华为增 88%、苹果降 3%、小米增 35%、荣耀降 7%、联想持平 IT之家 6 月 18 日消息,市场调查机构 Canalys 公布最新报告,预估 2024 年中国大陆个人电脑(含台式机、笔记本和工作站)市场预计会缩减 1%,不过会在 2025 年迎来 12% 的反弹。 报告指出 2024 年第 1 季度全球市场已恢复增长趋势,而中国大陆第一季度的 PC 出货量仍然下跌 12%。 台式机和笔记本 联想出货量 272.8 万台,市场占有率为 34%,同比下降 16% 华为出货量 95.6 万台,市场占有率为 12%,同比不变 惠普出货量 69 万台,市场占有率为 9%,同比下降 24% 华硕出货量 62.3 万台,市场占有率为 8%,同比下降 11% 苹果出货量 47.5 万台,市场占有率为 6%,同比下降 21% 平板 AI 不仅推动 PC 市场的发展,也成为平板电脑市场的重要催化剂。尽管第一季度的笔记本和台式机出货量分别下降 13% 和 11%,但平板电脑市场却实现 22% 的增长。 华为继续更新其平板产品组合,推出 MatePad SE 系列的低端产品和 MatePad Pro 系列高端产品。其他厂商则陆续推出新设备和提高效率的 AI 应用(如录音、翻译和笔记 app),来为平板电脑赋能。 IT之家附上主要平板情况如下: 华为出货量 214.1 万台,市场占有率为 29%,同比增加 88% 苹果出货量 195.6 万台,市场占有率为 27%,同比下降 3% 小米出货量 91.3 万台,市场占有率为 12%,同比增加 35% 荣耀出货量 65 万台,市场占有率为 9%,同比下降 7% 联想出货量 64 万台,市场占有率为 9%,同比不变 该机构认为受益于商用领域,尤其是大型国企和地方政府部门的采购需求,2024 年台式机出货量预期将表现良好,同比涨幅达到 10%。 短期内,消费者和私营企业在 PC 等方面的支出仍然保持谨慎,预计全年笔记本电脑出货量将下降 5%。
京东App苹果Vision Pro版曝光:商品可“拖拽”到家中,支持下单购买
IT之家 6 月 18 日消息,在今日的京东 618 媒体开放日活动上,京东宣布,随着苹果 Vision Pro 在国内正式上市,京东.Vision 将作为国内首批发布的 Vision Pro 应用与用户见面。 京东.Vision 首期以家场景为核心,覆盖了多个家电家居与潮流数码产品,后续将逐步拓展至全品类,IT之家小伙伴可以在 VisionOS 的 App Store 搜索“京东.Vision”进行下载和体验。 据介绍,京东.Vision 利用 Vision Pro 的空间计算技术,为用户提供了一种新的购物方式。用户可以通过京东.Vision 直接将心仪的家电家居或数码产品以 1:1 等比例“拖拽”到自己的家中,实现真实预览每件物品在空间中的布局和外观。 负责京东.Vision 开发的京东零售技术人员表示,目前电商购物无论是 PC 还是移动端,都是基于 2D 平面的购物体验,希望通过京东.Vision 为用户带来对商品的三维立体直观感受。用户不用再局限于平面看商品,也不用再等着到货之后才能试搭,而是下单前就可以对商品进行各种角度的放置或搭配,并立体地查看相应的摆放效果,获得一种全新的沉浸式购物体验。 为了进一步提升用户体验,京东还通过把 Vision Pro 技术与京东云言犀大模型技术结合,在京东.Vision 内研发推出了智能导购服务。用户在选购时如果暂时对自己的具体需求不太明确,可通过与智能导购“小萌宠 Joy”的互动,逐步明确需求,并获得越来越精准的内容或商品推荐。 截至目前,京东.Vision 联合三星电视、卡萨帝冰箱、老板电器、哈曼卡顿、MORRORART 等合作伙伴,实现了对场景的内容覆盖。用户通过京东.Vision 选购这些产品时,即可以看到它们在现实空间中的摆放效果。 据京东官方介绍,和淘宝的 Vision Pro 版比,京东 Vision Pro 版更多的是围绕场景进行深度细化。“淘宝的版本只能看,不能购买和交易,但是京东的产品是可以下单的,可以进行交易,价格和手机端也是相同的,未来我们还在研发不同的场景,京东的强势是各个品类的专业度,在日后的细化中,我们希望未来可以让用户体验坐在车里的感觉。”
三星首款骁龙X Elite笔记本电脑开售,起售价近万元
【CNMO科技消息】CNMO注意到,三星近日宣布,其首款搭载高通骁龙X Elite处理器的笔记本电脑Galaxy Book 4 Edge现已在全球范围内正式开售。 Galaxy Book 4 Edge在美国的起价为1349.99美元,配置包括16GB RAM和512GB存储空间。在欧洲,这款产品的起价为1699欧元;而在英国,同样的配置起价为1399英镑。此外,三星还提供了更高级别的16英寸版本,配备16GB RAM和1TB存储空间,以满足不同用户的需求。 与此同时,三星还推出了一系列区域促销活动。在美国,购买Galaxy Book 4 Edge的用户将免费获得价值379.99美元的50英寸Crystal UHD 4K电视;而在部分欧洲国家,用户在购买后的150天内将享受24欧元的折扣优惠。 在亚洲市场,特别是韩国,Galaxy Book 4 Edge的定价略有不同。14英寸版本的起价为215万韩元(约合1557美元),而16英寸版本则根据存储容量的不同,起价分别为235万韩元(约合1702美元)和265万韩元(约合1920美元)。 Galaxy Book 4 Edge的一大亮点在于其搭载的骁龙X Elite处理器。这款处理器不仅性能强劲,还支持5G连接,为用户带来更加流畅的网络体验。同时,该笔记本还配备了一块14英寸动态AMOLED 2x触摸屏,拥有QHD+分辨率和120Hz刷新率。电池寿命方面,Galaxy Book 4 Edge同样表现出色。其搭载的55.9Wh电池能够提供长达18小时的运行时间。
AI爆火京东618!数字人带动百亿GMV,AI硬件销售额增200%,Vision Pro原生应用首发
作者 | 云鹏 编辑 | 李水青 智东西6月18日报道,刚刚京东集团在北京总部举办了一场媒体开放日,展示了京东在618这样的大促节点中使用到的一系列“黑科技”,包括各类AI技术、虚拟数字人技术,同时京东还首发了Vision Pro原生应用“京东.Vision”。 在京东看来,如今是AI电商时代。从“线下实体”到“AI电商”,AI技术是营销20多年迭代的底层动力。AI大模型的发展带来了生成式AI的爆发,进而打开了AI更广阔的应用场景。 一、言犀AI数字人落地5000多品牌,数字人主播带动百亿GMV 在AI电商领域,京东已经进行了AI文案、AI做图、AI客服、AI导购、AI直播的实际落地应用。据了解,目前京东在内容创意、广告投放、自动化营销、客户管理等多个领域应用AI技术,帮商家实现生意增长。 京东言犀AI的语音技术目前突破了“黄金60秒”,也就是说,在60秒内,我们已经无法判断沟通对象是AI还是真人。 目前言犀AI外呼有语音、视频多种形式,其中言犀AI视频外呼的接通率为45%-55%,完播率达到了40%,值得一提的是,AI视频外呼可以直观地展示领券、下单的路径。 在AI虚拟数字人方面,未来无需真人去录影棚拍摄,京东就可以借助技术实现全AI数字人的生成。多模态大模型的应用,可以让数字人更真实,语言更生动,动作幅度可以更大,京东将其称之为“大姿态数字人”。 据了解,京东早年在实验室中进行了大量数字人的研究实验,如今京东的数字人技术已经具备了面向产业赋能的能力。 618期间,有18位大公司总裁进行了“数字人直播”。此外,京东帮助不少中小企业和商家进行了虚拟数字人直播。 目前,京东言犀数字人可以实现5-10分钟小样本素材形象建模,目前服务的品牌数量有5000多家,数字人主播带动的GMV近百亿元。据了解,言犀数字人直播等成本是真人的十分之一,闲时直播转化率超过30%。 除了直播,言犀AI也在探索更多的生成式AI应用。 二、京东押宝空间计算,首发visionOS原生应用,沉浸式购物体验新奇 此次京东Vison Pro负责人也登台分享了京东在虚拟沉浸购物方面的一些关键进展,重点介绍了“京东.Vision”这一应用可以提供的一些“3D虚拟沉浸式购物”体验。 在京东看来,Vison Pro是下一代空间计算设备,京东也看到了空间计算的潜力。比如对于尺寸不合适、风格不合适这样的两大典型购物痛点,空间计算设备可以带来购物体验的升级。 借助Vision Pro,用户可以把商品从虚拟空间中直接拖拽到现实中,从而完成摆放测量,了解是否适用。通过这种方式,我们还可以直接看到商品摆放在家中的样子,确定风格是否搭配。 一个非常典型的场景就是买电视不知道买多大,此时我们就可以直接把虚拟电视摆放到现实中的客厅中,检查是否合适。对于冰箱、咖啡机、扫地机器人等商品,也可以以同样方式操作。 当然,用户还可以带着Vision Pro与朋友一起“云逛街”。 京东已经完成了鸿蒙原生应用的开发,京东鸿蒙版App即将在华为应用市场上架。京东.Vision这一visionOS原生应用会在6月28日国内首批发布。 三、AI PC成高增长品类,直播带货依然火爆,国货挑大梁 紧接着,京东研究院相关负责人分享了今年618数据背后的一些消费热点趋势。比如AI电脑、超薄洗衣机、便携充电枪都成为了高速增长的品类。 AI产品成为消费新热点之一,具有强大切适用AI新功能成为消费者换新的主要因素之一,以AI手机、AI电脑位代表的AI硬件品类在618开门红销售中成交额同比增长超过200%。 在补贴方面,京东百亿补贴继续发力,补贴商品数量同比增长100%。 今年618,直播销售依然表现较为亮眼,数字人直播间观看总时长已经超过了38万小时,数字人直播间用户互动频次超过400万次。 此外,国货引领消费新风尚也是一大消费趋势,热度TOP100品牌中国货品牌占比超过70%,其中90后和00后消费金额占比超过55%。 结语:生成式AI革新电商行业,京东已经跑在了前面 如今京东在电商业务中已经大量应用了生成式AI技术,AI数字人等典型应用已经广泛落地,带来了不错的创收表现。今天,AI已经深入了电商产业的全链条,而京东的AI技术也已经广泛走入产业,进行赋能。 与此同时,对于空间计算这样的前沿趋势概念,京东也紧密跟随,并发布了相关原生应用,可以看出,京东对行业新技术的跟进是十分紧密的。 毫无疑问,面向未来的生成式AI时代,技术创新仍然是各行各业企业竞争的核心,对于电商产业来说亦是如此,而在生成式AI与电商的融合方面,京东显然已经跑在了前面。
小米MIX 5终于有消息了,或2025年发布,依旧真全面屏
【CNMO科技消息】如今,小米品牌只有数字系列、Civi系列和折叠屏三大系列产品保持更新。其中,数字系列是小米手机的灵魂所在,Civi系列则主打女性市场,而折叠屏形态特殊,被赋予了“MIX”的名字。然而,在很多米粉的心中,直板的MIX全面屏手机才是小米真正的旗舰机型。而近日,CNMO注意到,小米MIX 5似乎有动静了。 6月18日,爆料人士“数码皮卡丘”发文称:“超混和mix直板屏幕终极形态,明年期待了。”以此来看,小米MIX 5或许会在明年问世,但小米官方目前没有公布任何消息。 如果不考虑折叠屏手机的话,小米最后一款MIX系列机型为小米MIX 4。小米MIX 4发布于2021年8月,搭载高通骁龙888移动平台,配备6.67英寸的OLED屏幕,采用了屏下摄像头技术,提供白色陶瓷版本,发布时起售价格为4999元人民币,价格低于当年的小米11 Ultra。看到高通骁龙888移动平台,相信大家也明白当年的小米MIX 4大致是怎样的口碑了。 小米MIX系列一直坚持采用真全面屏的设计,为此数代MIX系列机型先后采用了前置摄像头下置、滑盖和屏下摄像头等技术。然而,这些技术虽然带来了真全面屏,但也影响了MIX的使用体验。例如,滑盖设计的MIX 3电池容量较小,屏下的小米MIX 4自拍效果不佳。小米MIX 5如果在2025年问世,或许有望带来更为完善的真全面屏技术。
消息称华为考虑对鸿蒙应用商店收取佣金 低于苹果
华为鸿蒙系统 凤凰网科技讯 北京时间6月18日,据彭博社报道,华为公司正考虑对其鸿蒙移动系统的应用内购买交易收取佣金,凸显出该公司在中国与苹果公司竞争时越来越自信。 知情人士称,华为正在考虑收取的佣金比例低于苹果、谷歌。通常情况下,苹果、谷歌会对通过其移动应用商店购买的应用、游戏、电影或音乐订阅收取30%的佣金。目前为止,华为一直没有对鸿蒙应用商店内的应用内购买收取佣金,目的是吸引开发者和发行商入驻。 游戏占据了移动应用商店的大部分收入。知情人士称,以游戏为例,华为一直在与开发商讨论收取20%左右的佣金。相比之下,在中国,小米等Android应用商店运营商对游戏内购买收取高达50%的佣金。知情人士说,华为尚未做出最终决定,其计划仍有可能改变。 华为这一即将采取的行动表明,该公司认为它的用户和开发者基础已经壮大到了可以开始收取佣金的程度。在美国的制裁切断了华为与Android所有者谷歌的合作后,该公司改用了自研鸿蒙操作系统。虽然华为正考虑收购佣金,但比例依旧低于市场竞争对手。尽管华为过去一年在中国高端手机市场卷入重来,取得了很大进展,但是它必须说服用户和应用开发者接受除苹果iOS和谷歌Android之外的第三选择:鸿蒙。 自从去年发布Mate 60 Pro后,华为5G智能手机的需求增加。今年第一季度,随着华为从苹果和其他公司手中夺走市场份额,该公司净利润增长了564%。市场研究公司Counterpoint Research的数据显示,今年第一季度,华为鸿蒙操作系统在中国的市场份额也超过了iOS。 截至发稿,华为发言人尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
东风日产为岚图代工?谣言!
近日有消息称,岚图旗下的全新纯电家用SUV将在东风日产云峰工厂生产,生产地址为湖北武汉经济技术开发区军山街云峰大道8号,该工厂是东风日产纯电动车型Ariya的生产基地,拥有成熟的纯电动车型制造经验。 不过公开信息却显示,云峰工厂项目建设名称为东风汽车集团股份有限公司乘用车扩建项目,是东风汽车公司采用数字化、智能化等先进技术打造的一座工厂,具备燃油车、混合动力、纯电动等多车型生产能力,并不是前期媒体报道的"东风日产工厂",投产车型也不限于合资车型。 东风公司知情人士向记者表示,东风日产其实是租用该工厂生产旗下车型,岚图亦是采用类似模式。 (图片为云峰工厂奠基仪式) 值得注意的是,今年前5个月合资品牌普遍销量与市场份额大跌,东风日产是主流合资车企里年累计产销唯一同比正增长的企业。 乘联会数据显示,今年1~5月,主流合资品牌零售销量为245.7万辆,同比下滑10.1%,市场渗透率下滑至43.9%。丰田、大众等一线合资品牌在国内承受了较大的增长压力,出现销量同比的大幅下滑;在合资车企集体承压的大环境下,今年1-5月,东风日产累计销量27.1万辆,较去年同期持平。 6月16日,东风日产正式发布"新奋斗·100行动计划,根据该计划,东风日产将在产品、品牌和研发等多个方面进行全面升级。在产品方面,东风日产计划在2026年底前投放7款全新的新能源产品,其中包括5款日产品牌新能源车型;在品牌方面,东风日产将成立"品牌管理委员会",以进一步提升品牌形象和影响力;在研发方面,东风日产将加大投入力度,以实现新能源转型和汽车智能化发展目标。 此外,外方股东日产汽车也正在给予东风日产更多决策权,以响应目前快速变化的中国市场。日产汽车方面表示,日产汽车将坚守"在中国、为中国"的承诺,以定制化的市场战略深耕中国市场,提升企业价值、提高综合竞争力。 日产汽车公司总裁兼首席执行官内田诚(Makoto Uchida)表示:“中国市场正在发生巨大变化。日产汽车需要迅速应对并保持竞争力。”因此,日产汽车在全新战略规划‘The Arc日产电弧计划’指导下,专为中国市场量身定制了注重均衡并关注重点的战略。 据悉,东风日产的新能源产品将反哺日产汽车其它海外市场,2025年开始整车出口,第一阶段要实现出口10万辆。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。