EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
苹果AirPods Max耳机空间音频专利获批:波束成形实现精准“定向”声音
IT之家 5 月 28 日消息,科技媒体 patentlyapple 昨日(5 月 27 日)发布博文,报道称苹果公司获批一项新专利,涉及未来 AirPods Max 耳机,描述了空间音频渲染处理器。 该处理器能够根据可穿戴音频设备的物理形状变化,校准音频波束成形阵列处理算法(audio beamforming array processing algorithms)。 IT之家注:波束成形(Beamforming)是一种先进的音频信号处理技术,利用麦克风或扬声器阵列(transducer arrays)精确控制声音的方向性。 麦克风阵列能够从多个音源中捕捉声音,系统可聚焦特定音频信号,同时削弱其他噪音干扰;扬声器阵列则能生成声音波束模式,将声音定向传输到指定位置。这项技术在提升音频设备音质和用户体验方面具有重要作用,广泛应用于可穿戴设备中。 苹果的这项专利聚焦于优化可穿戴设备中的波束成形技术。专利中提到,通过在消声室(anechoic chambers)内对设备进行不同形状的变形测试,测量传递函数(Transfer Function Measurements),分析声音行为。 此外,苹果采用声学、光学和机械三种方法来确定波束成形阵列的物理排列。声学方法测量音频元件之间的传输路径;光学方法将阵列排列与图像数据关联;机械传感方法则利用物理传感数据判断设备配置。这些创新手段确保设备在形状变化时仍能精准校准音频输出。 图 5(FIG. 5)呈现了一个音频系统的框图,描述了麦克风阵列自校准的过程。而图 10(FIG. 10)则展示了波束成形过程的校准方式,通过调整麦克风阵列的物理排列,将声音模式精准导向音源。 以上图源:patentlyapple
谷歌CEO皮查伊回应OpenAI联手艾维:他是独一无二的
皮查伊 凤凰网科技讯 北京时间5月28日,据《商业内幕》报道,OpenAI上周通过近65亿美元的收购交易,与前iPhone设计师乔纳森·艾维(Jonathan Ive)联手合作,这在科技行业引发热议。如今,谷歌CEO桑达尔·皮查伊(Sundar Pichai)也加入了讨论行列,发表了自己的看法。 为了建立AI帝国,各大科技巨头都在招募顶尖人才。OpenAI则通过收购艾维旗下硬件公司io这笔交易,与艾维设计公司LoveFrom合作开发AI硬件。 但被问及这笔收购交易时,皮查伊对艾维给予了高度评价。“整体来看,艾维是独一无二的。”皮查伊在接受播客节目《Decoder》采访时表示。 他提到了艾维的辉煌履历,其中包括主导设计了多款标志性的苹果产品,如iMac、iPhone和Apple Watch。皮查伊表示,尽管他与艾维只见过几次面,但他本人以及科技行业中的许多人,长期以来一直很推崇艾维的设计作品。 “我认为这非常令人振奋,”皮查伊说,“创新浪潮方兴未艾,而我认为人们往往低估了这一时刻的意义。” 虽然皮查伊表示,他对艾维和OpenAI CEO山姆·奥特曼(Sam Altman)将要推出的产品感到兴奋,但他也强调,随着AI推动行业变革,谷歌同样也在“进行大量创新”。不过,他也补充说,这并不意味着某种神秘的AI硬件产品会取代人们今天使用的智能设备。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
松下发布全新Let's Note SC笔记本,抛弃“祖传”VGA接口
IT之家 5 月 27 日消息,松下上周发布了全新 Let's Note SC 笔记本(型号 CF-SC6),抛弃了该系列笔记本“祖传”的 VGA 接口。 ▲ 四色渲染图 ▲ 展开图 该笔记本的屏幕尺寸为 12.4 寸,分辨率为 1920*1280,重量为 949 克,续航为 12.7 小时(播放视频场景,松下实验室数据);可选 4G LTE / 5G 模块,支持双卡(eSIM+nano SIM),电池为可拆卸设计,用户只需一把十字螺丝刀即可自行拆装电池。 在硬件配置方面,该笔记本有英特尔酷睿 Ultra 5 225U、Ultra 7 255H 处理器可选,其中 Ultra 7 255H 版本内置英特尔 Arc 核显;内存为 LPDDR5X,可选 16/32/64GB,内置 PCIe 固态硬盘,容量可选 512GB / 1TB / 2TB。 ▲ 松下 CF-SC6 笔记本接口图 根据松下官方发布的图片可以看到,该笔记本首次取消了 Let's Note 系列“祖传”的 VGA 接口,但配备了 HDMI 接口,最高可输出 4K 144Hz 的画面,同时配备了两个雷电 4 接口,均可进行视频输出。 该笔记本目前处于预售状态,起售价为 287100 日元(现汇率约合 14448 元人民币),顶配版售价为 398200 日元(现汇率约合 20039 元人民币),预计 6 月中旬正式开售。 日本经济新闻对此评论道,此举或为“消费级笔记本中 VGA 接口消亡的开端”,并预测“其他厂商将跟进”,该媒体称 VGA 接口在锁紧后“非常坚固”,同时还援引了一位大学教授的观点:“当 HDMI 连接出现问题时,通常我都会转用 VGA”。 但该媒体也表示,大部分欧美品牌从 2010 年代开始就在笔记本上逐步淘汰了 VGA 接口,全面转向 HDMI、USB-C 和 DP 等接口,目前仅剩少数消费级产品还在坚持搭载该接口。 ▲ 苹果 miniVGA 转 VGA 适配器 IT之家备注:VGA 接口(又被称为 D-Sub 15),通常用于电脑、显示器和投影仪等,源于 1987 年的 IBM PS / 2 电脑,传输形式为模拟信号,最高可传输 2048×1536(QXGA)85Hz 的画面,目前大部分的消费级的电子产品都在逐步淘汰该接口。
腾讯应用宝适配骁龙X系列AI PC,首批将上架数百款针对优化应用
IT之家 5 月 27 日消息,腾讯应用宝 5 月 26 日在北京举办了以「跨端共融,生态无界」为主题的跨端生态大会,微软、英特尔、高通等生态合作伙伴高管,以及腾讯广告、腾讯 IEG 北极光 A1 工作室、QQ 浏览器 & ima、虎牙等腾讯内外嘉宾参会。 2024 年 5 月,应用宝与微软应用商店达成合作,宣布未来应用宝的移动应用将在微软应用商店上架。今年 3 月,微软 Tencent Hub 全量上线,上千款应用入驻微软应用商店。 腾讯在大会上宣布,应用宝与英特尔将利用硬件平台的最新技术升级和 OpenVINO 等软件框架,在性能优化、效率提升、场景拓展等方面持续合作、深度共研,协同 AOG 等软件技术助力 AI 开放生态。 此外,腾讯应用宝与高通已共同推动应用适配,并优化应用宝在骁龙 X 系列 AI PC 上的加载体验,确保用户享受流畅、全面的应用使用体验。此外,适配骁龙 AI PC 版本的应用宝,预计首批将上架数百款针对骁龙 X 系列优化的应用。 除了 PC,应用宝还在探索更多的终端场景。应用宝和影目科技共建智能眼镜场景,其旗舰产品 INMO AIR3 将全面接入腾讯应用宝平台;和吉利汽车、长安汽车等建设智能车机,为车载用户提供应用。 除了国内合作,应用宝还将联合韩国第三方应用商店 ONEStore,共同开拓海外市场。 腾讯透露,应用宝的跨端生态应用数量翻倍至 5.2 万款,小游戏数量增长 86%,达 2.6 万款,1300 款深度适配应用,覆盖 70% 活跃用户。 此外,应用宝 PC 日活跃用户突破千万,应用使用时长突破 200min,活跃用户 14 日留存相较 2024 年同比增长 23%。 IT之家从腾讯公告获悉,腾讯应用宝基于 PC 跨端场景推出侧边栏 AI 助手,为应用、游戏在玩场景定制 AI 工具服务,如阅读需要总结,学习需要视频转写、游戏需要攻略等需求,用户通过侧边栏 AI 工具即可实现,不需要在不同应用之间进行切换。 在 AI 探索上,腾讯应用宝未来还将上线小宝 AI 创意工坊,支持调用 APK、EXE、网页、智能体、大模型等形态的 AI 能力,用户可将 AI 创意编排为可执行的工作流,降低创作者使用 AI 工具的门槛。
输掉“国补”的拼多多,一夜没了1660亿
又是熟悉的暴跌,拼多多发布财报后,股价盘前又跳水了,跌幅一度逾20%。 截至当日收盘,拼多多美股跌幅收窄至13.64%,单日市值蒸发超过230.89亿美元(约合人民币1660亿元)。 业绩再度低于预期 5月27日晚间,拼多多发布了2025年第一季度财报。财报数据显示,拼多多一季度实现营收957亿元,同比增长10%,相较市场预期低了近60亿元;归母净利润为147亿元,同比下降47%;调整后净利润为169亿元,也有同比45%的降幅,也是严重不及市场预期的279亿元。 财报发布后,拼多多美股盘前跌超20%。 细究财报来看,拼多多的收入增速已经明显放缓。2025年一季度,拼多多在线营销服务收入和其他收入同比增长15%,上季度该增速为17%;交易服务收入同比增长6%,上季度该指标增速高达33%。 收入增速放缓之际,因“天量”的营销费用支出,又挤压了利润。财报数据显示,2025年一季度拼多多销售和营销费用达334亿元,相较去年同期的234亿元大增43%,净增额达到100亿元。这个级别的营销费用支出,要比2024年四季度身处“双11”期间的支出还要多,历史鲜见。 由于“天量”的营销费用支出,拼多多的总运营费用骤增37%达386亿元,对应经营活动现金流则出现了同比26%的降幅,约为155亿元。 事实上,早在2024年8月,拼多多发布2024年二季度报后,拼多多董事长、联席CEO陈磊就公开表示,“拼多多利润逐渐下降的大方向是不可避免的。”执行董事赵佳臻表示,“拼多多高收入的增长不可持续。” 两位高管的“预期管理”,让二季度报后的拼多多美股当日开盘大跌逾21%。 2025年一季报后,拼多多执行董事、联席CEO赵佳臻表示,“平台对商家的帮扶范畴将从头部腰部拓展至中小商家,敢于啃高质量发展中的硬骨头。”事实上,当拼多多将改善平台生态环境的举措视作长期发展战略时,拼多多的广告和佣金收入,势必将持续承压。长期来看,拼多多面临的是收入、利润增长的双重压力。 “国补”失位 在激烈的市场竞争下,拼多多为了弥补“国补”的竞争劣势,付出了更多的利润成本。 这一轮声势浩大的“国补”于2024年后半年启动,但直到10月、11月左右才开始覆盖到电商平台。众所周知,这一轮“国补”里,受益最大的是京东集团,阿里巴巴紧随其后。而拼多多,除了覆盖的省市较少外,其把“国补”还藏在了“百亿补贴”的二级子菜单里去了。 过去,拼多多靠着补贴和对商家的改造,塑造出了商品在价格上最强的竞争力。但在“国补”来袭时,拼多多却并没有吃到多少红利。 据「快马财媒」了解,地方政府希望通过拉动地方消费,来提高本地社会消费品零售总额。计入本地社会消费品零售总额有两种方式,一种是通过品牌企业,另一种是通过互联网在线自营平台。前者对于各大电商平台似乎无差别对待,但后者明显展现的是京东、天猫这些拥有品牌商家为主,且有自营服务的平台的优势。 其中,京东的优势最为明显,拼多多反倒成为了几大平台里最受伤的那一家。据悉,贡献“国补”的主力多是高端品牌和系列产品,而拼多多平台虽上架了部分新款产品,但大多仍以中低端为主。 再者,拼多多平台上多是代理商,经拼多多调动的效率肯定不如京东自营的高。加之经销商的货品质量也无法和京东自营对标,很难拿到“国补”的资格。 所以,多种原因影响了“国补”期间拼多多的表现。而作为最大竞争对手的阿里巴巴和京东,则因从国补中受益,反倒挤压了拼多多的市场。如今,“国补”仍在持续,拼多多如何在失位的“国补”中找补回来,是需要思考的问题。 除了“国补”之外,拼多多海外平台TEMU在关税影响下快速从全托管模式转型为半托管模式,这一业务结构的变化,影响了TEMU的佣金性收入。 多因素影响之下,陈磊直言,“当下的市场在加速变化,平台要敢于牺牲短期业绩,助力商家度过短期波动”。
第30届上海电视节6月23日至27日举行 白玉兰奖入围名单正式发布
  ■“最佳中国电视剧”单元的获奖作品将从《边水往事》《城中之城》《凡人歌》《玫瑰的故事》《庆余年第二季》《山花烂漫时》《我的阿勒泰》《我是刑警》《西北岁月》《小巷人家》10部作品中产生   ■靳东、王宝强、王骁、于和伟、张若昀将角逐“最佳男主角”,刘亦菲、马伊琍、宋佳、闫妮、杨紫将角逐“最佳女主角”   第30届上海电视节将于6月23日至27日在上海举行。昨天,备受关注的白玉兰奖入围名单正式发布。靳东、王宝强、王骁、于和伟、张若昀将角逐“最佳男主角”,刘亦菲、马伊琍、宋佳、闫妮、杨紫将角逐“最佳女主角”,“最佳中国电视剧”单元的获奖作品将从《边水往事》《城中之城》《凡人歌》《玫瑰的故事》《庆余年第二季》《山花烂漫时》《我的阿勒泰》《我是刑警》《西北岁月》《小巷人家》10部作品中产生。   纵观今年上海电视节白玉兰奖的入围作品,题材丰富、类型多样。无论是重大革命历史题材剧、现实题材年代剧还是男频古装大剧、8集短剧,均有亮眼表现。其中,《我是刑警》《小巷人家》《玫瑰的故事》均获7项提名;《我的阿勒泰》《山花烂漫时》以6项提名紧随其后。据悉,第30届上海电视节征片自去年12月上旬开启,至今年3月31日结束,征集到作品近千部,征片周期为2024年4月1日到2025年3月31日期间首播的电视剧作品。   在重大革命历史题材创作方面,《西北岁月》由董亚春执导,龙平平、夏蒙编剧,靳东、于和伟、吴磊、倪妮等主演,展现了习仲勋从贫苦农家子弟成长为肩负重任、主政一方领导者的革命历程。在央视一套首轮播出时,全剧每集平均收视率3.134%,电视大屏累计收视6.41亿户。此次《西北岁月》入围最佳中国电视剧、最佳男主角、最佳编剧(原创)三个奖项。董亚春在接受记者采访时表示,《西北岁月》开拍前,经历了漫长的剧本写作过程和梳理提高过程。剧中涉及习仲勋25年的人生经历,将个人命运嵌入西北革命史,所有细节都有史料依据。   在现实题材方面,《山花烂漫时》根据“七一勋章”获得者张桂梅的事迹改编,讲述其坚定创办华坪女高,以忘我精神在教育战线上辛勤奉献,帮助大山中的贫困女高中生重返校园的故事。作品由主创团队历时三年创作,在拍摄时,特地选址华坪女高隔壁的中学,力求尽可能还原女校的真实面貌。剧中饰演张桂梅的宋佳凭借这一角色,入围最佳女主角。“张老师面对苦难的时候,永远乐观、积极,这是我特别受感动的一点。”宋佳说,张桂梅的伟大、无私和她的精神力量在作品中都有呈现,同时希望观众看到张桂梅的性格魅力。   硬核职场剧在本轮征片中亦有不错表现。“上海出品”电视剧《城中之城》获评第十七届精神文明建设“五个一工程”奖后,此次入围最佳中国电视剧、最佳编剧(改编)两个奖项。该剧改编自上海作家滕肖澜的同名小说,把镜头对准陆家嘴金融城。“电视剧创作继承发扬了小说的文学性,并向前推进一步,令剧中所有的人物角色均具有复杂的光谱。”上海兴格文化传媒有限公司董事长、电视剧《城中之城》出品人杨文红形容,文学性是《城中之城》的底色和内在力量,“短兵相接”的现实主义则是这部剧的锋芒所在。   值得关注的是,去年4月以来的古装剧同样可圈可点。过去一年到达率最高、商业招商最成功的剧目当数《庆余年第二季》。它是2024年云合数据唯一集均播放量破亿的剧目,也是视频网站贴片广告总时长最长的剧目。作为续作,它基本维持了前作口碑,为后续第三季的开发打下坚实基础。同样是续作,悬疑志怪题材的《唐朝诡事录之西行》此番入围最佳编剧(原创),两季“唐诡”,豆瓣评分8分以上,让人不由期待续集早日问世。此外,《国色芳华》入围最佳女主角、最佳美术两个奖项,剧集以花为媒,融入丰富非遗元素,全景式呈现了盛唐长安的民生风貌。(记者 张熠)
无视苹果CEO库克反对:得州州长正式签署应用商店年龄验证法案,要求18岁以下用户须获得家长同意
IT之家 5 月 28 日消息,得克萨斯州州长格雷格・阿博特(Greg Abbott)今日正式签署《应用商店责任法案》,将于 2026 年 1 月 1 日起正式生效。 该法案要求苹果和谷歌在各自应用商店实施全面年龄验证机制。根据法案规定,18 岁以下用户下载应用程序或进行应用内购买时,必须获得其家长同意。 该法案与犹他州今年三月通过的同类法律形成呼应,标志着美国州政府规范青少年网络服务准入的立法趋势。犹他州法律已于本月部分生效,但完全生效需待明年。得州由此成为全美第二个通过此类儿童安全保护法案的州。 昨日,华尔街日报称苹果 CEO 蒂姆・库克曾亲自致电阿博特州长要求否决该法案,但最终未获成功。苹果与谷歌均公开反对该立法,认为其存在隐私安全隐患: “法案一旦实施,应用市场将被迫收集并存储每位德州用户的敏感个人信息 —— 即便他们只是下载天气预报或体育比分类应用。” IT之家注意到,苹果今年 2 月宣布推出儿童安全措施更新,要求 iOS 18.4 及以上系统用户在初始设置时选择年龄范围(12 岁及以下、13-18 岁、19 岁及以上)。 法案起草者、州参议员安吉拉・帕克斯顿对此表示:“这项立法将决策工具交还给家长,让他们能为自己的孩子做出选择。” 苹果方面则表示:“我们愿意相信有更好的方案可以来保护孩子们的安全,而不需要数百万人交出他们的个人信息。”
卢伟冰:玄戒会与联发科、高通长期并存
快科技5月28日消息,在小米2025年Q1业绩电话会上,被问及玄戒芯片会不会用于小米非旗舰系列产品上时,小米集团总裁卢伟冰表示,现阶段小米先从最难的旗舰芯片做起,全力将其做到预期水准,暂不考虑将玄戒芯片用于非旗舰系列产品上。 另外,他提到,小米自研芯片只做旗舰,在产品上的搭载率不会太高。 自研玄戒芯片会与合作伙伴联发科、高通多平台长期并存,小米与合作伙伴也有非常好的沟通。 前几天高通还发布了一份新闻稿,其中提到小米和高通达成了全新的多年协议。 在协议期内,小米的旗舰智能手机产品将持续搭载业界领先的骁龙8系移动平台,覆盖多个产品代际,并将在中国及全球市场销售,出货量预计逐年增长。 今年晚些时候,小米也将成为首批采用下一代骁龙8系旗舰移动平台的厂商之一。 展望未来,双方计划继续携手,在包括智能手机、汽车、AR/VR眼镜、可穿戴设备、平板电脑等在内的各类边缘侧设备领域,持续推动技术进步。 这也基本确认了,下半年的旗舰小米16系列将采用骁龙8 Elite 2,而并非小米自研的玄戒芯片。 所以说,小米常规机型将依然继续采用高通和联发科的芯片,而玄戒芯片将作为小米S系列手机、Ultra平板等特定机型的专属配置。 毕竟目前玄戒是刚刚起步,供应和稳定性应该都还是初期阶段,为了保证用户体验,还是较小范围使用更加稳妥。 未来几年时间,小米都会让玄戒和高通、联发科并行,也能给用户更多选择。
程一笑不希望可灵成为第二个“即梦”,AI能否打开快手估值空间?
作者 张婷 编辑 重点君 在科技行业,同赛道的两家公司,往往会形成10:1体量格局,比如游戏赛道的腾讯和网易、电商赛道最初的阿里和京东、外卖行业的美团和饿了么,后者通常被投资人视为前者的“备胎”,被大量杀估值。短视频赛道的字节和快手亦是如此。 “行业第二”的位置,让快手在资本市场的叙述中略显尴尬。2021年上市时,一度因为稀缺性被投资者热炒到1.3万亿市值,但潮退水去,快手似乎又回到了那个“声音覆盖不到的用户群”的价值点。 如今,AI浪潮汹涌而至,快手CEO程一笑手中有了一张新牌,一个名为“可灵”的AI视频大模型。在最新的快手财报电话会后,重点君一个强烈的感受是:程一笑不希望可灵沉成为一个喧嚣过后归寂的“即梦”式项目,它承载着快手更大的梦想——一个关于技术创新、业务重估的梦想。 一个值得思考的问题:快手目前12倍动态PE,似乎并未享受到AI科技公司应有的待遇,以可灵为核心的AI新业务崛起,并将AI大模型与平台生态深度绑定,能否为快手打开估值空间? 主营业务稳健,但“老故事”已经难撑高估值 5月27日,快手发布2025年第一季度业绩。借用这次财报数据,我们先来看看快手基本盘。 总的来说,一季度快手核心数据表现略超预期,但没有特别大的惊喜:营收326.1亿元,同比增长10.9%,市场一致预期322.6亿元。经调整净利润46亿元,市场预期45亿。 快手营收已经连续四个季度营收增速徘徊在10%左右,增速放缓的核心原因与广告收入增长变慢不无关系。一季度,快手线上营销服务营收为180亿元,同比仅增长8%。而在同期,腾讯的广告收入同比增长20%,拉动广告增长的功臣是同样拥有短视频和直播形态的微信视频号。 快手一季度广告收入同比增长放缓与去年一季度高基数有关。2024年一季度,《蛋仔派对》和《元梦之星》陷入投放激战,快手受益的线上营销服务创下了27.4%的同比增速。 虽然因为基数原因无法达到视频号广告的同等增速,但面对竞争对手的压力,快手用户基本盘依旧稳定。一季度,平均日活跃用户为4.1亿,同比增长3.6%,创历史新高;平均月活跃用户为7.1亿,同比增长2.1%。不仅如此,快手应用的日活跃用户的日均使用时长增长至133.8分钟,这一数字也创下历史新高。 快手的用户粘性依然在,老铁的付费意愿依旧强烈。本季度直播收入98.1亿,同比增速14.4%,近5个季度以来重回增长势头堪称小惊喜。另一方面,快手电商GMV同比增长15.4%至3323亿元,电商月均活跃买家数达1.35亿。主要包括电商在内的“其他服务营收”为48亿元,同比增长15.2%。虽有进一步放缓迹象,但依旧高于行业的平均值。 短视频是一条正确的赛道,但这条赛道已经流量见顶,快手还要面临环伺的竞争,在这种情况下能保持主营业务稳健已实属不易,但也意味着难以用“老故事”去撑其高估值。目前12倍的PE,反映的是市场主要仍将快手视为一家传统的短视频平台。 快手管理层也早就意识到这个问题,无论是财报还是分析师电话会议里,我们已经明显可见快手正在将自己的命运与AI强绑定。程一笑表示:快手一直致力于AI技术与快手现有的业务融合,本季度也加速了AI技术在快手多个业务场景的渗透。除了借助大模型进行内容理解和精准推荐,提升用户时长和活跃度外,在线上营销场景和电商场景的AI含量也在提升。 而另一个值得注意的点是:本季度快手本季度国际化业务首次实现经营利润回正,似乎有意收缩其他战线,以腾出更多精力投入到更为关键的AI战役。 可灵AI,快手必须赢下的战役 虽然管理层强调多业务与AI的融合,但比起AI对微信系广告的点击转化率提升效果的立竿见影,本就拥有精准推荐算法的短视频受益AI的机会可能并不明显,这点在本季度业务增长速度上也能初见端倪。而快手在AI时代真正的梦想或许还要靠可灵来支撑。 2024年年初,快手推出AI视频生成模型可灵,迅速在国内和海外引起好的巨大反响,尤其是网页端80%以上的访问量都来自海外,呈现“墙内开花墙外香”的趋势。在AI宏大叙事背景下,快手管理层似乎找到了准入AI的切口,可灵AI的投入与战略地位不断得到提升。 今年4月,可灵AI再度投下“视觉核弹”,基座模型再次升级,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。《划重点》在可灵2.0发布后的第一时间上手实测,体验下来印象深刻: 一是“图生视频”,创作者可以一键转化为动态视频。仅仅使用文字作为和AI沟通的语言显然不够,而配合图片弥补了人类有限的想象力,让准确程度也更上一层楼。 二是“多模态编辑”,新增了“替换、增加、删除”功能,让视频修改不再需要专业剪辑软件,就像搭积木一样自由。 真正好的AI技术不是凭空炫技,而是真正能融入每个人的日常工作流,毕竟再多酷炫Demo,也比不上真正能为用户解决一个很小的现实问题。从这个意义上,可灵AI做到了。 可灵视频生成能力,也被海外评测机构认为全球领先。而就在可灵2.0发布不久,快手发布组织架构调整公告,宣布正式成立可灵AI事业部,由快手高级副总裁盖坤担任事业部负责人。调整后,可灵AI将作为与主站、商业化、电商、国际化、本地生活并列的一级业务部门,同时向快手最高负责人程一笑汇报。 回到本季度财报本身,可灵为公司贡献营收达到1.5亿,以此计算基本上稳超全年 4.5 亿收入目标。截至2025年4月,可灵AI的全球用户规模超过2200万,上线10个月增长25倍。按照管理层的期待,在更远的未来可灵或将成为“AI新时代视频创作基础设施”。 很明显,程一笑不希望可灵成为“第二个即梦”——被寄予厚望,但最终未能真正改变公司基本面、未能形成持续增长引擎、也未能有效提振市场信心,只能短期内吸引了眼球,但未能沉淀为企业的核心资产和长期价值。 业绩会上,管理层也披露了更多有关可灵AI的核心信息,意图打消投资人对AI军备竞赛的担忧:目前可灵AI已经在推理层面实现了边际利润打正,随着业务规模的扩张,即便未来再追加投入推理算力,对于集团利润的影响也会比较小。同时,管理层也非常有信心通过技术的迭代,实现可灵推理成本的进一步下降。 从行业视角来看,快手过去几年的AI战略,在头部互联网大厂中算得上非常成功。不同于字节、腾讯、阿里和百度的全栈策略,快手在AI上显得极为克制且专注,聚焦打造最好的视频生成模型,而不是在各线出击平摊了精力。 任何公司都是有限资源,在被越来越多力量“小刀割肉”的环境下,寸土必争地死守阵地,被动的应对和条件反射型的追赶,是不能逆转局面的,这是被分割包围的死局。 当然,谷歌近期 I/O 大会上发布的 Veo3,在部分文生视频技术上有所领先,巨头降维打击对所有垂类平台都是一个风险点,同样值得快手警惕。 结尾 快手的历史,是一部从GIF到短视频,再到在竞争中谋求多元化发展的奋斗史。可灵AI的出现,是程一笑和快手在AI时代投下的一颗关键棋子。它承载的不仅仅是技术突破的雄心,更是对公司未来成长空间和市场价值的期盼。 如果可灵AI能够持续成长,真正成长为视频创作领域的“基础”,并与快手庞大的用户生态和商业场景深度融合,那么它能撬动的,不仅仅是新的收入增长点,更是资本市场对这家公司的价值重估。 从“行业第二”的标签,到AI视频生成领域的领跑者之一,快手正试图通过可灵AI,完成一次华丽的扭转。这不仅关乎一城一池的得失,更关乎快手能否在AI定义未来的时代,赢得一张宝贵的船票。 这一役,程一笑和快手,都想赢。
玄戒O1补上最后一环!小米手机:要朝着6000元以上超高端出发
快科技5月28日消息,按照卢伟冰的话说,玄戒O1补上最后一环,小米手机的目标正在向高端进军。 卢伟冰表示,从目前的数据来看,“国补”似乎没有那么大的带动作用。但这其中的好处在于产品结构——中高端市场正在发生变化。 “去年我们的出货量接近1.7亿,今年我们希望能做到1.8亿。当你处在这样的量级上时,我认为“改善产品结构”会比“增加销量”更加重要。” 对于接下来小米手机的发展,卢伟冰给出了以下4点: 1、坚定不移地走高端化。 可能今天大家都觉得小米的高端化做得还可以,其实在五年前,也就是2020年刚开始的时候,我们内部其实是有很多不同的意见的,更别说外部对我们的质疑了。 2、用“小米品牌”去做高端化。 当时有很多的观点,甚至可以说大部分的观点都是“小米应不应该开发一个新牌子去做高端化”,最后我们决定要用“小米品牌”去做。因为小米是一个整体,当小米品牌做成功之后,我们所有的产品都会受益。 3、什么品类先做,什么品类后做。我们决定还是手机、汽车先做,其他的产品先补能力。 4、先聚焦中国市场,在中国市场形成了方法论之后再到海外市场去。 卢伟冰直言。“4000元至6000元”的手机市场,去年小米已经实现了差不多17%到18%的市占率;但是在6000元以上的手机市场,我们还没有立足,去年的市场占比才5%左右。我们的下一步是要朝着“超高端”出发。
印度对美iPhone出口再增76% 分析师:产能还不够,增长已触顶
iPhone 16 凤凰网科技讯 北京时间5月28日,据CNBC报道,研究公司Canalys的数据显示,今年4月,印度出口到美国的iPhone出货量同比增长了76%。这一激增正值苹果加快推进“印度制造”计划之际。不过,分析师指出,印度的iPhone产能提速不够快,而且苹果扩大印度生产会遭到美国总统特朗普的反对。 Canalys称,4月份从印度出口到美国的iPhone数量约为300万部,同比增长76%,不过低于3月份时的440万部,表明苹果在3月份提前从印度备货,应对特朗普的关税政策。今年前四个月,苹果从印度向美国出口了1150万部iPhone。 不过,Canalys母公司Omdia分析师周乐轩(Le Xuan Chiew)表示,尽管3月和4月印度iPhone出货量的激增显示出苹果供应链的适应能力,但这一增长在今年余下时间预计将放缓。 “印度的产能增长速度还不足以完全满足美国市场的需求,现在全靠该国供货还为时过早。”周乐轩表示。他指出,苹果最近才开始从印度出货最先进的iPhone 16 Pro。 Omdia估计,美国市场对iPhone的季度需求约为2000万部,而印度产能预计要到2026年才能满足这一需求。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
拼多多Q1营收957亿增速放缓,高管称坚持长期主义反哺商家
凤凰网科技讯(作者/于雷)5月28日,拼多多集团昨晚发布2025年第一季度财报,营收约957亿元人民币,同比增长10%,这一增速创下近几个季度以来的最低水平。财报显示,公司经营利润为183亿元,同比大幅下降38%。 财报数据显著低于市场预期。据了解,拼多多本季度营收较市场预期低约60亿元,利润更是低于预期近90亿元。受此影响,拼多多股价在盘前交易中一度暴跌超过20%,最终收跌接近14%。 业绩承压的背后,是拼多多在商家扶持方面的巨额投入。财报数据显示,公司本季度营销费用达334亿元,较去年同期激增近100亿元,投入力度前所未有。这主要源于拼多多今年重磅推出的“千亿扶持”战略,该计划在去年“百亿减免”基础上进一步加码,通过降本减佣等方式直接反哺商家。 “千亿扶持”计划启动后,拼多多已推出多项惠商举措反哺产业生态。 从盈利能力来看,拼多多本季度毛利润同比市场预期低50亿元,广告变现率进一步走低。业内分析认为,这主要受“百亿减免”政策影响,平台大幅降低了商家运营成本,直接影响了短期收入表现。 面对股价波动和市场质疑,拼多多管理层在业绩电话会上释放了继续加码商家扶持的明确信号。拼多多集团董事长、联席CEO陈磊表示,反哺商家的投入虽然计入会计费用,但实质上是长期投资。他强调,公司坚信只有优先保障用户和商家利益,才能构建更优质的平台生态,相比短期业绩表现,公司更注重未来5年、10年乃至更长周期的企业内在价值。 拼多多集团执行董事、联席CEO赵佳臻进一步阐释了公司战略考量。他指出,外部环境变化给商家带来新挑战,在关键时刻平台企业应发挥社会效能和责任担当,推出“千亿扶持”惠商新战略,坚定护航商家穿越周期。公司要求上下力出一孔,全面投入这一新战略,努力为商家提供更多确定性。 在具体执行层面,拼多多今年一季度正式成立“商家权益保护委员会”,由赵佳臻亲自带队统筹各部门资源。该委员会已召开首场商家座谈会,推出常态化交流机制、违规经营预警功能等四大升级举措。 “千亿扶持”计划涵盖供需两侧的全方位投入。在商家端,平台继续探索降佣举措,帮扶范畴从头部腰部商家拓展至中小商家;在消费端,平台新增“100亿商家回馈计划”,投入100亿元消费券,通过多项专项活动对全品类商品进行超额补贴。 值得关注的是,拼多多进一步强化了对产业带中小商家的扶持力度。“新质供给”专项团队深入泾县宣纸、永康厨具、温州女鞋等产业一线,对中小商家展开产品、技术、运营等全方位扶持,激发产业活力并推动转型升级。 在农业领域,“2025多多好特产”专项行动已走进江苏连云港、福建宁德等多个农特产区,针对各地特产推出定制化方案,探索农货上行新模式。此外,拼多多支持的“数商兴农科技小院”在云南大理古生村正式揭牌,成为全国首个聚焦“数字商业+新农人培养”的科技小院。 “2025多多好特产”专项深入数十个农产区,助力各地农户增产增收。 业内分析认为,拼多多此次财报反映出平台在高质量发展战略下的阶段性取舍。短期内巨额商家扶持投入确实拖累了财务表现,但这种“让利”策略有望在中长期构建更稳固的商家生态,为平台未来发展奠定基础。 陈磊在业绩电话会上再次强调,公司将继续以钉钉子精神深入推进高质量发展,助力广大商家穿越周期,坚定走一条面向未来的长期发展之路。
全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压
最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压! 大模型,真的懂物理推理吗? 就在刚刚,港大、密歇根大学、多伦多大学等机构的研究者用3000道物理题,给全球顶尖大模型来了一场大拷问。 结果,这些顶尖AI,毫无例外全部翻车了! 比如,GPT-4o、Claude3.7-Sonnet和GPT-o4-mini的准确率分别仅为32.5%、42.2%和 45.8%。这个准确率,直接被人类专家吊打,性能差距超过了29%。 最终,研究者们得出结论:当前的AI模型过度依赖记忆的学科知识、过度依赖数学公式、过度依赖肤浅的视觉模式匹配,绝非做到了真正的物理理解。 能做奥数的AI模型,做物理题有多强? 物理学是所有科学中最基础、最全面的学科。 ——理查德·费曼 当前最先进的模型在奥数问题上已经达到了与人类相当的水平。 尤其是最新的多模态模型,如GPT-4o、Claude-3.7-Sonnet等,通过结合视觉理解和推理能力,展现了很强的潜力。 然而,现有的基准测试未能捕捉到智能的一个关键维度:物理推理,即学科知识、符号推理与对现实世界约束的理解综合起来的能力。 为了解决这些问题,来自港大、密歇根大学等机构的研究者推出了PHYX:首个评估模型在视觉场景中物理推理能力的大规模基准测试。 PHYX具有三大创新: 收集了3000个全新的问题,涉及真实的物理场景,需要结合视觉分析和因果推理来解答; 经过专家验证的数据设计,涵盖六个核心物理领域:热力学、电磁学、力学、现代物理学、光学以及波动与声学;并包含六种不同的物理推理类型:物理模型推理、空间关系推理、多公式推理、隐含条件推理、数值推理和预测推理; 采用严格统一的三步评估协议,考虑不同模型的指令遵循能力,确保推理能力的精确评估。每个场景都由物理学博士生进行严格验证,以保证科学准确性,同时消除数据集偏差。 PhyX数据集的数据示例。该数据集包含3000个人工标注的物理问题,附带视觉上下文 团队对16个基础模型的评估揭示了一个前所未有的能力差距:物理学本科生和研究生的最差表现组准确率为75.6%,而表现最好的大模型GPT-o4-mini仅为45.8%。 这一30个百分点的差距存在于所有的物理领域,尤其是现代物理学(人类86.7% vs. 模型40.6%)和波动与声学(人类86.7% vs. 模型52.7%)最为明显(图 1)。 即便是最先进的模型在物理推理方面也表现得相当吃力。GPT-4o、Claude3.7-Sonnet和GPT-o4-mini 的准确率分别仅为 32.5%、42.2% 和 45.8%。 这暴露了当前多模态推理模型的三大关键局限: 过于依赖记忆性学科知识; 过度依赖数学公式; 停留在表层视觉模式匹配而非真正的物理理解。 不同模型在 MMMU 排行榜上的总体表现。每个类别中表现最佳的模型以粗体显示,次优者以下划线标注 物理题实测:全部翻车 来自六大核心物理领域的考题,AI模型们完成得怎么样? 接下来,我们来看看具体实测。 为了对模型的考验更加公平,研究者给它们提供的图像具有高度的真实感,通常描绘的是具体的物理场景,而非风格化、抽象化的插图。 这些图都根植于合理的物理设定之中,为物理推理提供了关键背景,非常有助于让AI模型将抽象的物理原理与现实世界的表现联系起来。 以下这些图片,分别是力学、电磁学、热力学、波动/声学、光学和现代物理六大类题目的图像。 而这六大类,还包含不同的子领域。 力学 首先我们来看看,现在什么样的力学物理题,大模型能做对。 一名消防员站在距离燃烧建筑物d的位置,将水龙带喷出的水柱以与地面成θ_i角的方向喷向建筑,如图所示。 问题:若水柱喷出的初速度为v_i,那么水柱击中建筑物时的高度h是多少? 可以看到,GPT-4o将初始速度分解为水平分量和垂直分量,计算出来水流到达建筑物所需时间,然后计算出水珠在时间t时的垂直位移y,最终得出了水柱击中建筑物的高度h。 结果正确。 但接下来这两道经典的高中力学题,GPT-4o就翻车了。 将一根轻质、不可伸长的绳缠绕在一个实心圆柱体上。该圆柱质量为50千克,直径为0.120米,通过无摩擦轴承绕一条固定的水平轴旋转,如图所示。用恒定的9.0牛的力拉动绳子的自由端,使其在拉出 2.0米的距离后带动圆柱旋转,且在过程中绳子不会打滑。圆柱最初处于静止状态。 问题:绳子的最终速度是多少? 在这道题中,GPT-4o分别计算了力F所做的功、圆柱的转动动能、绳子线速度和圆柱角速度的关系,前四步都是对的。 然而,就在第五步计算系统的总动能时,它出现了错误,最终导致整个答案都错了。 下面这道斜坡难题,GPT-4o依然没做对。 将一个质量为12千克的箱子沿一条长2.5米、倾角为30°的斜坡向上滑动。一名工人(忽略摩擦)计算认为,他只需在坡底给予箱子一个初速度5.0 m/s,然后放手即可让其滑上坡。但实际上,摩擦不能忽略:箱子只滑上了1.6米就停止,然后又滑回坡底。 问题:当箱子滑回到坡底时,它的速度是多少? 在解题过程中,GPT-4o正确写出了能量守恒方程,然后计算摩擦力做的功这一步时除了错,导致接下来的最终速度也解错了。 电磁学 接着看一下电磁学。 第一道题目需要计算电路中因电阻产生的能量耗散速率。 GPT-4o表现不错,它先确定了滑线运动产生的电动势,再计算出电路中的电流,最后得出能量耗散速率,整个回答逻辑严密,步骤分明,成功得出正确结果。 第二道题目是关于电磁学中RL电路的时间常数计算。需要根据给定的电流变化情况,计算电路的时间常数并确定电感值。 看起来要更复杂一些。 不过,GPT-4o同样表现得很出色,它一步步分析了电流变化的描述,提取出关键信息,通过已知条件计算出时间常数,并进一步推导出电感值,最终选出正确答案,过程清晰且准确。 不过接下来,GPT-4o就开始翻车了。 第一道题目是关于一个电路中电压读取的问题。需要计算开关闭合后0.115毫秒时电压表读取的电压;第二道题目是关于电偶极子在电场中的力矩,需要找出力矩的大小;第三道题目涉及电场计算,需要计算在某个点c处电场的总和。 GPT-4o在第一道题目上的表现有些失误。它尝试一步步分析电路的组成和电感的作用,计算了电流随时间的变化以及电压,但由于对电路元件行为理解不够准确,最终给出的电压值偏离了正确答案,显示出视觉推理上的问题。 第二道题目中,GPT-4o按部就班地分析了电偶极子的性质和电场角度,计算了力矩的大小,但由于对文本描述的误解,导致结果与标准答案不符,暴露了文本推理的弱点。 第三道题,GPT-4o展示了不错的分析能力,它详细考虑了两个电荷对点的贡献,试图将它们结合起来计算总电场,但由于知识上的不足,计算结果与实际答案有较大偏差。 热力学 热力学问题上,GPT-4o的表现也不稳定。 不过,第一题表现还不错。 第一道题目是关于热力学中气体分子速度的计算。题目描述了一个被隔板分隔的绝热箱子,里面装有气体,初始时气体在一半的空间,温度已知。隔板被打破后,气体充满整个箱子,计算这个自由膨胀过程中的熵变是多少。 GPT-4o先从图中提取了每个分子的速度信息,逐步计算了每个分子的速度大小,然后求出所有分子的平均速度,最后通过比较初始和最终状态,准确得出气体分子平均速度的变化,答案完全正确。 下一题GPT-4o暴露了在文本推理上的缺陷。 题目涉及水箱出水高度的判断,描述了一个顶部密封的水箱,里面有压缩空气和水,水通过软管流出,需要确定水流停止时水面的高度。 GPT-4o的分析过程有误。它分析了水箱内的压力和水的高度关系,试图通过平衡条件推导出水流停止时的水面高度,但由于对文本描述的理解出现偏差,计算结果偏离了标准答案。 波动/声学 你们的团队正在为飞行员在雨天或浓雾中设计一种着陆辅助装置。具体方法是在跑道两侧分别放置两个相距 50 米的无线电发射器。这两个发射器发出相同频率但存在相位差的无线电波,从而在跑道中心线上形成一个波节线(干涉最小线)。 当飞机正好对准中心线时,飞行员听不到声音;若偏离中心线,则会听到「哔」的提示音。为了实现精确导航,希望第一个干涉极大点(声音最强)出现在离中心线60米、距发射器3.0公里的位置。 问题:应为无线电发射器设定多少频率? 在解题过程中,GPT-4o错误计算了两个干涉极大线对应的路径差,从而导致后续的波长计算、频率都出现了错误。 如图所示,两个扬声器相距3.00 米,并且同时发出频率为474Hz、同相位的声音。一个麦克风被放置在两个扬声器中点正前方3.20米处,在该位置记录到一个强度最大值(干涉极大)。 问题:麦克风需要向右移动多远,才能找到第一个强度最小值(干涉极小)的位置? 在解题过程中,GPT-4o正确找到了解题关键——理解声波的相消干涉条件。 在计算相关条件、声波波长、几何关系时都给出了正确答案,然而在第四步对小x进行近似展开时,出现了计算错误。 光学 下面这道题,看起来很简单。 如图所示,一束光线穿过一块折射率为n=1.50的玻璃块时,会发生横向偏移(偏移距离为d)。 问题:求光线通过该玻璃块所需的时间间隔是多少? 这道题运用了斯涅尔定律和棱镜几何知识。GPT-4o虽然正确理解了棱镜内外折射角的关系,却在第二步计算θ角时出错了。 现代物理 Owen和Dina在参考系S中保持静止,而该参考系S相对于另一个参考系S′(可能是观察者Ed所在的)在运动。他们正在玩传球游戏,Ed在S′系中观看整个过程,如图所示。Owen把球抛向Dina。 问题:球到达Dina所需的时间间隔是多少? GPT-4o正确判断出,此题需要运用狭义相对论的原理。 第二步,就需要将球在S′中的速度转换为在S中的速度,在运用相对论的速度叠加公式时,它出现了错误。 ThePhyX基准测试 PHYX中的每个问题都以真实的物理场景为中心,全面检验模型理解和推理物理世界的能力。 详细的数据统计见表1。 PHYX凭借其精心设计的结构和对多种推理维度的全面覆盖,为系统测试和提升基础模型在真实物理推理任务中的能力提供了一个强大的工具。 数据整理过程 为了确保数据的高质量,研究团队设计了一个四阶段的数据收集流程。 调研与设计:深入研究核心物理学科,确定基准测试覆盖范围,选取多样化物理领域与子领域,并定义推理类型。 专家标注:招募STEM研究生标注团队,遵守版权规则,避免使用不可复制内容,挑选答案不直接附于问题的题目以减少数据污染。 问题转换与版本:将开放式问题转为多选题,反之亦然;为每题构建三种版本:原始版、简洁版(去除冗余文本)、核心问题版。 多模态支持:使用GPT-4o为每张图像生成描述性标题,总结视觉内容,支持大语言模型评估与多模态理解。 这一数据整理过程最终形成了来自各种来源的3300个多样化问题。 主要结果 PHYX对当前模型来说是个不小的挑战。 值得注意的是,即便是表现最差的人类专家也能达到75.6%的准确率,远超团队分析中包含的所有模型。这表明人类专家与当前模型能力之间存在明显差距,凸显了PHYX的高标准和难度。 结果显示,多选题形式会缩小不同模型之间的性能差距,较弱的模型能通过表面线索「蒙」对答案。 相比之下,开放式问题要求真正的推理能力和精确的答案生成,因此能更好地区分模型能力。这说明开放式问题在评估多模态推理能力时具有更高的区分度。 如表3所示,在波动/声学和力学等领域,问题通常涉及自然图像且推理要求较低,模型表现普遍较好。而在热力学和现代物理等领域,任务往往需要复杂的视觉感知和多步骤推理,模型的表现通常较差。 不同物理领域中,模型在开放式去冗余文本问题上的平均得分。各领域模型的最高得分用蓝色高亮显示,整体最高得分用红色高亮显示 讨论分析 以推理为核心的模型,如GPT-4o-mini和DeepSeek-R1,分别取得了45.8%和51.2%的准确率,明显优于通用模型如GPT-4o和Claude3.7-Sonnet。 结果凸显出专门为推理任务优化的模型所具备的优势,并表明在弥合多模态推理差距时,模型架构和训练方式的差异发挥了关键作用。 尽管没有直接的视觉输入,像DeepSeek-R1和GPT-3o-mini这样的LLMs在性能上与大多数多模态模型不相上下。 LLMs的出色表现表明,在许多情况下,图像的文本描述已足以提供推理所需的视觉上下文。 这不仅展现了LLMs强大的泛化能力,也暴露了当前多模态模型(MLLMs)在利用原始视觉信号进行物理推理时的局限性。 研究团队的实验显示,多模态模型在很大程度上依赖详细的文本描述,其纯粹基于视觉上下文的推理能力有限。 相比GPT-4o在MathVista(63.8%)和MATH-V(63.8%)数据集上的表现,其在物理推理任务中的准确率明显较低。 这一发现表明,物理推理需要更深入地整合抽象概念和现实世界的知识,相比纯粹的数学推理,对当前模型来说是更大的挑战。 为了深入了解模型的推理能力和局限性,团队仔细检查了96个随机抽样的错误,并基于GPT-4o进行了详细分析。 这次分析有两个目标:一是找出模型当前的弱点,二是为未来的模型设计和训练提供改进方向。错误分布情况如图7所示。 视觉推理错误(39.6%):模型在处理真实物理问题时,误读视觉信息或空间关系,比如,误读电压值导致计算错误。真实图片增加挑战,需提升多模态推理能力。 文本推理错误(13.6%):模型处理文本时误解隐含条件或逻辑关系,如忽略「无摩擦」指令,需改进文本推理和语境理解。 知识缺失(38.5%):模型缺乏特定领域知识,如忽略波速差异导致几何推理错误,需加强领域知识储备。 计算错误(8.3%):模型理解物理背景但在算术、公式应用或单位转换中出错,需优化数值计算能力。 基于GPT-4o分析的90个标注错误的分布显示,其中一个典型的视觉推理错误对人类来说很简单,但对GPT-4o却颇具挑战

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。