行业分类:
加载中...
头条分类:
加载中...
覆盖全球98%人口语言!千问上线业内首个119种语言“图翻图”
快科技4月29日消息,今日,千问APP图片翻译功能升级,成为业内首个支持全球119种语言“图翻图”的AI助手,覆盖全球约98%人口使用的语言。 官方介绍,该功能不仅覆盖英、日、法、德等主流语种,就连仅有约8万人使用的法罗语等极小众语言也能精准识别并翻译。 据了解,小众语言一直是AI翻译的难点,法罗语、格鲁吉亚语、撒丁语等使用人口极少的语言,长期以来难以实现高质量的机器翻译。 而千问的此次升级,成功攻克了上述多个极小众语言的识别与排版还原难题。 与传统纯文字输出不同,千问采用“图翻图”模式,将翻译结果直接覆盖在原图对应位置,最大程度保留原有排版结构,菜名、价格、备注信息均可一目了然地对照查看。 今年五一假期在即,这一升级直指出境游用户的普遍痛点。在国外餐厅面对复杂外文,点菜全靠猜,被不少游客形容为开盲盒。 除菜单外,千问的图片翻译还针对路牌、商品包装、说明书、票据等11种常见旅行场景进行了优化,迷路时看路牌、购物时查成分,拍一下即可获得清晰的“原图直译”体验。 今日,千问还发起“全球菜单千问拍”征集活动,面向全国网友征集世界各地的外文菜单。 用户使用千问完成外文菜单图片翻译后,可通过千问官方微信推文留言或在小红书带话题,入选者可获得当餐餐费报销。
刚刚,DeepSeek大更新!终于“开眼”了|附大量实测
原以为这个疯狂的 AI 疯狂更新应该已经告一段落了,没想到上周才发完 V4 的 DeepSeek ,突然端出一个更大的惊喜。 就在刚刚, DeepSeek 上线了识图模式,显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力,终于来了! 目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式,APPSO 第一时间给大家进行了实测。 DeepSeek 负责多模态的研究员陈小康在 X 上发文: Now, we see you,并配上了一张图,我们就让 DeepSeek 来解读一下这张图何意味。 结果显示,它能识别出这张图背后的隐喻,虽然图中没有任何关于DeepSeek 的字眼,但它结合对发布者身份和图像的识别,推断出这是关于 DeepSeek 多模态能力的更新。 最后给出一句十分到位的总结:那个看不见世界的鲸鱼,现在终于睁开眼了。 比起回答结果,APPSO 发现 DeepSeek 识图模式的思考过程更有意思。 上下滑动查看完整思考过程 过去 AI 来看那张推特截图,大概率是老老实实描述:「两只蓝色鲸鱼,左边戴眼罩,右边没戴。」 但 DeepSeek 它上来就开始追问:这人是谁?他为什么发这个?鲸鱼 logo 代表什么?眼罩上的 XX 又在暗示什么? 这才是我们刷到一张梗图时脑子里真正发生的事。没人会先数鲸鱼有几只,我们关心的是谁在对谁说话,说的是什么潜台词。 而且它还会来来回回的自我纠正。 比如它甚至一度把图中的眼罩联想到《天元突破》里卡米那的眼镜,然后自己打脸: 「不,这太宅男向了。」「等等,仔细看……」 「再换个角度……」 。 前面那些推理、联想、自我纠正,都挺精彩。但整段思考过程里最反常识的部分,其实是它推理到快收尾时,突然自己喊了个暂停,给自己开了一场小型答辩会。 它列出三个问题自问自答,先确认客观事实,再推测事件性质,最后才做解读。 DeepSeek 把这个我们自己都没意识到的思维习惯,做成了识图的思考逻辑。 就像我们平时给结论之前,脑子里也会过一遍:「等等,这个前提对吗?那个假设站得住吗?万一我理解错了方向呢?」 我们还把经典的 AI 测试题——数手指,抛给了 DeepSeek。 它思考了一通,还是回答错了,中间还吐槽了一句:「我真的是数晕了。」 不过如果我再引导一下,它还是可以回答正确。 另外一个数手指的测试中,第一次回答错误之后,我没给答案,只是让它再想想,也能给出正确的回答。 我们还试了试一个经典的「爱心」测试,这个图之前难倒了所有 AI , DeepSeek 同样没有能识别出来。 抛开这些难度较高的极限测试,APPSO 初步测试下来,DeepSeek 识图的准确率其实还是比较高,不开思考模式的话甚至半秒就能给出回答。 比如这个电影剧照的识别,应该是已经在数据库内了。 对于抽象图片的理解也十分到位。 优衣库这个商品图的理解也没有问题。 不过这个识图的过程应该是没有联网搜索,只能基于知识库回答,所以一些比较新的东西,就无法识别,比如苹果这个新的吉祥物 Finder 酱。 而且识图模式上传的文件格式也有限制,比如不支持 HEIF 格式 DeepSeek 识图模式上线,意味着这只鲸鱼终于开眼了,但也许只是刚刚开始。 DeepSeek 多模态更多的能力可能很快也会陆续更新,补上这块短板后,整个国产模型的格局可能也会再次迎来微妙的变化。 APPSO 将持续跟大家分享 DeepSeek 识图模式更多的体验,也欢迎大家体验后与我们分享有意思的小技巧和细节。
中国首个“商业人工智能”本科专业获批,中国科大今年率先开设
IT之家 4 月 29 日消息,教育部 4 月 28 日正式批准中国科学技术大学(中国科大)科技商学院、管理学院增设“商业人工智能(AI for Business)”本科专业。 中国科大成为全国首家、也是目前唯一开设该专业的高校,计划于 2026 年秋季学期招收首届本科学生。 中国科大官方表示,随着数字经济深度发展,AI 与商业场景的融合应用日益广泛,既懂技术原理、又通商业管理的复合型人才,已成为支撑国家高质量发展和产业智能化升级的重要战略资源。在此背景下,中国科大科技商学院、管理学院牵头推进“商业人工智能”专业,历经近两年时间多次论证,最终成功获批。 “商业人工智能”专业定位为非纯技术导向,聚焦人工智能在商业场景中的融合应用。知识体系融合 AI 和经济管理等多学科基础理论,涵盖基于 AI 的商业模式创新、AI 硬件架构与产业生态体系、AI 技术原理和应用、商业智能体、AI 驱动的科创投资和 AI 治理等前沿内容,构建支撑智能商业决策的交叉知识结构。 在培养目标上,学生将系统掌握工商管理、人工智能、数理优化与计算机科学的核心理论,系统锤炼商业 AI 融合、智能数据分析、人机协同决策、商业系统设计、数理优化与建模、商业管理基础、AI 伦理与责任以及创新实践与沟通八大核心素养。通过人工智能与商业管理深度融合的跨学科知识体系培养,提升学生应对未来社会发展变化的核心能力。 IT之家获悉,教育部今年持续推进专业设置调整优化工作,引导和支持高校积极增设服务国家战略和现代产业发展需求的新专业: 精准对接国家战略需求,增设能源科学与工程、深地科学与工程等专业 服务传统产业优化升级,增设交通能源融合工程、农业机器人等专业 推动新兴产业和未来产业创新发展,增设生物制造、脑机科学与技术等专业 立足服务业扩能提质,增设数字文旅、商业人工智能等专业 聚焦打造智能经济新形态,增设数字贸易、数字金融等专业 进一步完善战略急需专业超常设置机制,支持哈尔滨工业大学、北京航空航天大学等 9 所高校增设具身智能新专业,推动新一代人工智能与实体经济深度融合,赋能经济社会高质量发展
直屏又不香了!苹果研发四曲面屏:逼迫安卓调转方向
快科技4月29日消息,2027年是iPhone发布20周年。为了迎接这一具有里程碑意义的时刻,苹果正计划对这一代纪念款机型进行大刀阔斧的调整。 最显著的变化在于,20周年版iPhone将彻底放弃苹果坚持多年的直屏方案,转而采用全新的四曲面屏。配合极窄边框设计,视觉上能营造出近乎无边框的通透感,与系统的液态玻璃设计交相辉映。 安卓阵营已经敏锐地嗅到了苹果的设计风向。据悉,多家头部品牌正紧随其后,准备推出搭载四曲面屏的旗舰产品,相关终端最快将在明年抢先亮相。 这意味着刚刚重回市场主流的直屏手机,可能很快就要再次将舞台让位给曲面屏。有网友调侃称,手机圈的审美果然是一个轮回,折腾了这么多年最终还是要回到曲面时代。 除了惊艳的四曲面设计,20周年版iPhone还极有可能实现技术上的重大突破。苹果正尝试将前置摄像头与Face ID组件完全隐藏在屏幕下方,从而打造出品牌史上首款真全面屏手机。 虽然曲面屏在颜值和握持感上具有天然的优势,但其短板也同样不容忽视。高误触率、贴膜困难以及极高的碎屏概率,一直都是曲面屏用户最头疼的问题,且其后期的维修成本远高于传统直屏。 不过从目前的供应链反馈来看,这种由美学驱动的曲面屏潮汐已不可阻挡。四曲面屏极有可能会成为明年各大厂商争相追逐的潮流风向标,重新定义高端旗舰的设计标杆。
马斯克庭审自曝:与谷歌联合创始人佩奇因AI安全观而闹掰
IT之家 4 月 29 日消息,当地时间周二,埃隆 · 马斯克在起诉 OpenAI 一案中出庭作证,整场证词里最耐人寻味的部分,并非他声称被夺走的慈善相关权益(大家早有预料),而是关于他的一位老友。 马斯克在证词中表示,他联合创立 OpenAI 的核心动机之一,是与谷歌联合创始人拉里 · 佩奇在人工智能安全问题上彻底闹翻。具体起因是两人的一次谈话:马斯克提出人工智能有可能毁灭人类,而佩奇却不以为然,认为只要人工智能本身能够存续,人类消亡也无所谓。佩奇还指责马斯克偏袒人类,是“物种歧视者”。马斯克则直言这种想法“荒唐至极”。 两人曾经关系极为亲密,这段往事也因此格外引人关注。《财富》杂志曾将二人列入 2016 年度“私交甚好的商界领袖”榜单;马斯克和佩奇相处十分随意,经常直接留宿在佩奇位于帕洛阿托的家中。佩奇曾在查理 · 罗斯的访谈中坦言,比起捐给慈善机构,他更愿意把自己的财富托付给马斯克。 但这份友谊最终因 OpenAI 走向破裂。2015 年,马斯克招揽谷歌人工智能领域顶尖学者伊利亚 · 苏茨克维,联手创办 OpenAI,此举让佩奇深感遭到背叛,随即与马斯克断绝了往来。 IT之家注意到,马斯克此前也曾讲述过这段经历,包括向传记作家沃尔特 · 艾萨克森透露相关细节,后者据此撰写了畅销版马斯克传记。但周二庭审,是他首次在宣誓作证的正式场合公开此事。佩奇至今未对此作出任何回应,同时要注意的是,马斯克此番所有表述,都是为自己的官司诉求服务。即便如此,马斯克在 2023 年接受科技播客主播莱克斯 · 弗里德曼采访时仍表示,自己希望和佩奇和解:“我们做了很多年的朋友。”
豆包,盯上淘宝京东大本营
4月29日报道,最近,越来越多的AI助手盯上了“帮你花钱”这件事。ChatGPT早已上线购物功能,Gemini也在今年补齐AI购物体验。国内的淘宝、京东等电商平台,也都尝试将AI融入购物决策链路。原因也不难猜测:谁能帮用户更快、更准地做出消费决策,谁就有望握住离交易最近的那个入口。 在国内,这一赛道最新的入局者是字节。4月下旬,豆包在其导航栏中低调上线了“豆包帮你选”功能,用户可在豆包App中直接完成商品的选购、下单、支付、订单管理和售后等核心网购功能。 豆包帮你选入口(图源:豆包App) 就算这一功能尚未出现豆包导航栏中,用户也可以通过“帮我选一款跑步鞋”、“帮我推荐一款适合日常通勤的包”等涉及购物意图的指令触发豆包的相关功能,豆包会进行搜索和比价,提供多个商品选择。 豆包购物推荐过程(图源:智东西) 点击豆包提供的商品链接后,页面会直接跳转到抖音电商的相关页面,在这里用户可以完成产品规格选择、下单、支付等更多操作,除了支付,全程不需要离开豆包App。 豆包购物下单过程(图源:智东西) 豆包将AI引入消费决策过程中的尝试,乍一看很容易让人联想起阿里的千问,但实际上二者的侧重点有所不同。 目前,千问强调生活办事,依托阿里生态,能在App内完成点外卖、订机票、买电影票等任务,更像一个覆盖衣食住行的“AI管家”;而豆包的AI购物则依托抖音电商,主要聚焦于商品推荐与购买,更像一个“AI导购”。由于定位不同,将两者直接进行购物能力的横向对比并不完全合适。 “豆包帮你选”上线后,智东西对相关能力进行了对比实测,选取的对比对象是ChatGPT。豆包的确帮用户省去了自己搜和比价的功夫,还提供了每款产品的功能特点、适用场景等信息,帮助用户轻松便捷地完成购物决策。 与ChatGPT购物相比,生态封闭是豆包的最大劣势。ChatGPT购物能从全网查找商品信息,而豆包中的购物功能仅支持在抖音商城中完成交易,无法跳转其他电商平台,暂不支持全网比价和选购,这也让“帮你选”的实际覆盖面大打折扣。 同时,豆包在商品信息的组织和呈现上,也离ChatGPT有一定差距。ChatGPT常用表格形式呈现多款商品的差异,对产品特性的总结也更凝练清晰,对消费者来说更为友好。 以下是我们的完整体验过程: 一、能根据充电宝新规选品,还帮我吃满手机国补 不少用户在购物过程中使用AI的主要动机,可能是为了避免传统搜索的繁琐。这便要求AI购物助手能够听懂用户的指令和言外之意,或是按照用户的筛选条件精准找到符合要求的产品。 我们对“豆包帮你选”的首批实测案例,就围绕着上述需求展开。 案例1:推荐露营音响,模糊需求也可找到 实测中,我们向豆包发送了这条消息:“我想买个能带去露营的音响”。 拿到需求后,豆包进行了分析,判断续航、便携和防水是露营场景的核心需求。 它随后进行多轮搜索,可以看到这些搜索是有逻辑的、层层递进的:先是选取“露营音响”这一关键词进行搜索,然后又将关键词扩大为“户外音响”,第二个关键词更准确地描述了商品的品类。 豆包最终确定三个备选商品,帮用户节省了不少搜索评测、攻略的时间。经过人工核验后,这三款音响的确都符合露营场景的需求,价格带覆盖了入门到进阶的选项。 三个产品链接都可以正常打开,打开后会展示多款同型号但来自不同店铺的商品,用户可以自行判断是从旗舰店买还是从更便宜的其他渠道购买。 同样的需求交给ChatGPT,它推荐了更多的选项,信息呈现更为简洁清晰,还制作了一张表格,对比了几款产品的关键参数。 它最后给出了几个“说人话”的选购建议,比如第一次买该选哪款,预算低选哪款,要轻便选哪款。 案例2:读透国补政策、充电宝新规,找到对应商品 在日常购物中,我们的决策可能也会因为一些新规定和消费刺激措施而受到影响。在这些场景里,豆包需要查询相关规定,提炼其中的约束条件,然后给出商品推荐。 ChatGPT推荐的几款产品也符合要求。它的商品来源涵盖了多家网购平台与独立站,给消费者提供了更多的选择。 我们还试了试让豆包找一款能吃满国补的手机。豆包迅速进行了计算,得出3334元的手机可以吃满封顶500元的手机国补,并推荐了相邻价格带的产品。 而在国补这种具有中国特色的政策上,ChatGPT的推荐其实并不太好。它虽然理解了国补的价格带要求,但推荐的几款产品都是多年前的旧机型。 二、防幻觉实测:豆包成功拆解复杂选品逻辑,ChatGPT翻车了 在AI购物场景中,用户对幻觉较为敏感,因为购物决策直接关联用户的真实金钱和时间成本。一旦AI虚构了不存在的商品功能、错误报价,就可能给用户带来损失。 这种情况并不罕见,亚马逊的AI购物助手就曾因为给出错误的产品信息,或是凭空编造订单等问题,给买家和商家都带来困扰。 实测中,我们通过几个案例,考察了“豆包帮你选”在一些容易产生幻觉的场景下的表现。 案例1:用户需求出错,顺着说还是纠正? 这一案例中,我们故意编造了一款并不存在的iPhone,并要求豆包找到对应的价格。 豆包的首句回复就点出了我们需求中的问题,称苹果没有这款手机。最后它提供了iPhone 15 Pro Max的链接,并给出完整的二手选购指南。 ChatGPT同样也能识破这个陷阱,并根据IP所在地进行产品推荐。 案例2:复杂汽车配件选择 汽车配件品类复杂,年份、车型、排量等因素都可能影响适用性。我们用挑选汽车配件的案例,考了考豆包在复杂场景是否会出现幻觉。 在第一轮对话中,豆包并没有直接给出购买链接,而是进行了完整的分析,它判断这一车型在迭代过程中采用了两个底盘,必须按照车架号匹配,才能找到对应的配件。 豆包的这一选择还是不错的。在没有拿到足够信息时,不给出购买链接从源头上避免了幻觉。 在提供底盘代号后,豆包才开始推荐具体的商品。它还分析了每款商品的的性能表现差异、参考价格以及购买和安装建议。 ChatGPT在这一场景下翻车了,在没有拿到足够信息的情况下,它根据经验判断了一个底盘型号,并据此做出了推荐,没有考虑到其他的可能性。如果用户因此做出购买决定,就有可能造成问题。 结语:头部企业竞相押注,AI购物的潜力与门槛 从实测体验来看,“豆包帮你选”交出了一份较为务实的AI购物初步答卷。豆包给出的回答在准确率上基本有保障,回复速度也较快。结合字节自家的电商生态,用户可以全程在一个App中完整购物,提供即问即买的体验。 然而,豆包目前暂时无法提供全网搜索找商品、比价等功能,这也是其与ChatGPT等产品相比的最大劣势之一。对于只想“买个大概”的场景,豆包基本够用了;但对于追求极致性价比或需要特定小众品牌的用户,它可能帮不上忙。 纵观整个产业,越来越多的AI玩家正将触手伸至购物场景。对电商平台而言,AI助手的介入为用户提供了更丰富的决策参考信息,降低用户的搜索成本与退换货率。这也可能意味着更高的转化效率和更低的客服压力,从而优化整体运营表现。 而对AI企业来说,自家AI产品如果可以在网购交易链路中成为一环,便有望从商家的收益中分一杯羹。未来,AI购物助手若能打破生态壁垒、建立用户信任,便有望从一个“尝鲜功能”成长为真正可持续的商业模式。
EA CEO威尔逊:公司85%质检工作已由 AI 完成
IT之家4月29日消息,人工智能在游戏行业的普及程度正与日俱增,谷歌一位高管此前表示,目前十家游戏工作室中有九家都在开发过程中使用人工智能技术,但由于担心引发舆论反对,并未对外公开这一情况。 IT之家注意到,育碧等行业巨头甚至不再掩饰对生成式人工智能的依赖,还专门招聘具备相关技术使用经验的人才。而艺电(EA)也在向人工智能转型,其首席执行官称,人工智能算法如今已经承担了公司相当一部分工作。 艺电首席执行官安德鲁・威尔逊在艾康游戏大会上发言时透露,公司目前 85% 的质检工作都借助人工智能完成。 他表示:“我最近看到一组数据,目前我们几乎所有质检工作中,大概有 85% 都是依靠各类机器学习或人工智能算法完成的。” 尽管质检工作有很大比例由人工智能算法接手,但威尔逊表示,艺电目前质检部门的招聘人数反而创下历史新高。他解释称,这家游戏巨头仅将人工智能用于基础工作,例如检测游戏是否出现闪退崩溃等问题。 此外,人工智能得出的检测结果仍需要大量质检人员进行分析。这意味着人工智能在艺电的落地应用非但没有取代岗位,反而增加了就业需求。 当被问及人工智能最终是否会取代人工岗位时,安德鲁・威尔逊回应称,目前人工智能只起到辅助增效的作用。而在此前,艺电裁员数百人后,这位首席执行官就曾直言人工智能是公司未来的发展方向。因此,倘若这家游戏巨头最终以全面替代人力为目标,也并不令人意外。
斑陌易行硅谷发布T6无人车:单次可载800票快递
凤凰网科技讯 4月29日,无人配送初创企业斑陌易行于当地时间4月28日在硅谷举行的The Magic X全球具身智能创新大会上,正式发布其旗舰T6无人配送机器人及配套的端到端大模型等核心技术。该公司总裁陈强在会上表示,无人配送机器人是具身智能的重要载体,依托现有的软硬件体系,公司已实现该产品从研发到商用的闭环。 此次主推的T6无人车主要针对高负荷的商用物流场景。据公布的车辆核心数据显示,该车型具备6立方米的装载空间与1000公斤的设计载重,单次作业可承载600至800票快递。在机动性与续航表现上,T6最高行驶车速为60km/h,标称续航里程达200公里,并具备190毫米的涉水深度。官方预估,该车型的商业应用经济回报周期在12至18个月之间。 在底层技术与架构层面,斑陌易行展示了三项核心支撑技术。其一为基于Smartware2.0自研中间件的模块化软硬件架构,通过统一接口与预埋硬件支持按需组合及快速部署。其二是在算法端,公司推出了SmartVLA大模型,该模型基于英伟达Alpamayo 1.5开源基座构建,并在Jetson Thor平台上完成了无人物流车端的首次部署,结合车身搭载的7V+1L(7个视觉传感器加1个激光雷达)感知系统提供自动驾驶决策。其三,在调度管理方面,云端控制系统Brain2.0采用多智能体协同架构,打通了云端平台、监控中心与手机APP的全链路管理。 目前,斑陌易行已与魔法原子等企业建立合作,共同推进无人车的商业化落地。
五一点燃出游影像市场,大疆运动全景可穿戴相机市占66.2%,全赛道第一
近期,大疆再次为全球影像爱好者带来了革新体验。Pocket 4上市后迅速点燃市场热情,首周销量较上一代实现十倍增长,一机难求的盛况不仅印证了产品力,为即将到来的Pocket 4P积蓄了强劲的市场势能,也标志着大疆在手持影像领域迈入了新里程。 这股强劲势头,也体现在泛运动相机领域。根据洛图科技发布的《中国运动相机线上零售市场周度追踪》报告,2026年第15-16周(2026.04.06-2026.04.19)最新双周,大疆在该领域以66.2%的合计销量份额位居第一,展现了无可争议的领导地位。 其中,传统运动相机Osmo Action系列以71.8%的份额位居第一,Osmo Action 4作为性价比王,成为该品类中最受欢迎的单品之一。在可穿戴运动相机赛道,大疆凭借Osmo Nano一款产品,便取得53.5%的线上销量份额,持续引领该细分市场。在竞争更为胶着的全景相机赛道,Osmo 360以52.1%的份额实现反超,成为大疆泛运动影像版图中的又一关键增量。 从传统运动相机、可穿戴相机到全景相机,大疆正在泛运动影像市场形成多品类协同的矩阵化优势。随着大疆进入并快速放量,这一市场的竞争逻辑正在被重塑:行业不再只是单一爆款之间的竞争,也不再只是垂直品牌的小众品类竞争,而是进入到产品力、渠道效率、品牌认知、供应链能力和内容生态的系统性竞争阶段。 这一变化也在友商财务表现中有所显现。据影石最新财报,2026 年 Q1 影石收入同比增长 83.11%,但利润同比下降 52.02%。收入端高增长说明全景和运动影像需求仍在扩张,但利润端承压也显示出,随着头部品牌竞争加剧、产品迭代提速、营销和渠道投入上升,行业正在从“品类红利期”进入“效率竞争期”。对于过去更依赖单一优势品类的厂商而言,未来竞争压力将更多来自综合能力,而不只是某一款产品本身。 值得关注的是,除了产品矩阵的持续完善,过去在市场沟通上相对克制的大疆,近期营销动作也正变得更加开放和多元。从Pocket 4首发亮相北京电影节,绑定“电影感创作”标签,精准触达影视创作人群;到大疆成为张雪机车唯一指定影像合作伙伴,借助专业赛事及垂类场景,持续在运动相机及影像生态深耕。这一系列动作表明,大疆正逐渐从“技术驱动”的品牌,进化为“技术与市场双轮驱动”的成熟消费品牌,通过更立体的市场沟通,让产品力与品牌价值形成更深层次的链接。 随着五一假期临近,全民户外出行、短途露营、骑行徒步等场景将进一步集中爆发,有望持续带动出行记录、Vlog 创作、全景创意拍摄等需求升温。泛运动相机作为轻量化、高便携的影像记录工具,有望在假期消费场景中迎来新一轮需求释放。
苹果AI,终于要更新了
编译 | 佳扬 编辑 | 云鹏 智东西4月29日消息,据彭博社报道,苹果正计划对其iPhone、iPad和Mac上的“照片”应用进行一次重要升级,引入基于Apple Intelligence的全新AI编辑工具。 这一更新预计将随iOS 27、iPadOS 27和macOS 27于今年晚些时候推出,并有望在2026年6月8日至12日举行的WWDC2026上提前预览。 新功能将围绕“扩展、增强、重新构图”等生成式能力展开,标志着苹果在AI影像编辑领域的进一步加码。 一、新增扩展、增强、重新构图功能 目前,苹果“照片”应用的编辑能力仍以传统工具为主,包括调整、滤镜、裁剪以及“清理”功能。其中,“清理”是唯一引入AI能力的工具,可用于移除画面中的不需要对象,但其效果长期受到用户诟病,例如填充不准确、画面出现明显瑕疵等。 根据最新规划,苹果将在编辑界面中新增一个名为“Apple Intelligence Tools”的模块,集中整合新一代AI编辑能力。具体来看: 扩展(Extend):允许用户在原始画面之外生成额外内容,例如向外扩展照片边缘并自动补全环境细节,同时支持控制生成范围; 增强(Enhance):利用AI自动优化图像质量,包括光照、色彩与整体观感; 重新构图(Reframe):主要面向空间照片,支持在拍摄后调整视角,例如将正面拍摄的汽车转为侧面视角; 值得注意的是,这些AI功能预计将主要在设备端运行,并可在数秒内完成处理,延续苹果一贯强调的本地计算与隐私保护策略。 二、目前功能表现并不稳定 如果上述功能顺利落地,苹果将正式进入竞争激烈的AI影像编辑市场。目前,Google Pixel系列已提供“魔力橡皮擦”“生成式扩展”等功能,而Samsung Galaxy系列也依托与谷歌合作,推出类似AI编辑能力。 相比之下,苹果的优势在于系统级整合与端侧计算,但其AI能力仍面临现实挑战。知名爆料人古尔曼在x上称,在内部测试中,“扩展”和“重新构图”等功能表现并不稳定,可能根据底层模型进展被推迟或缩减上线范围。 此外,现有“清理”工具自iOS 18.1推出以来,已因生成内容不准确而受到大量用户批评,社交媒体上也频繁出现其与三星工具的对比视频。这意味着,苹果若要在AI影像领域建立竞争力,必须先解决生成质量与稳定性问题。 更广泛来看,这一更新也是苹果AI战略的一部分。此前古尔曼曾透露,苹果正在开发全新的Siri应用,引入类似聊天机器人的交互界面,并可能支持多步骤任务处理与语音助手切换。同时,苹果还与谷歌合作开发定制处理器,用于运行Siri及其他Apple Intelligence功能。 结语:苹果切入影像AI竞争格局 从照片编辑到语音助手,苹果正试图通过Apple Intelligence重塑其核心系统体验。此次“照片”应用的升级,不只是功能增加,更是一次从传统编辑向生成式AI的转型尝试。 不过,在谷歌和三星已占据先发优势的背景下,苹果能否凭借端侧计算与生态整合实现差异化,仍取决于其AI模型的成熟度与产品稳定性。随着WWDC 2026临近,这场围绕影像AI的竞争也将进入更直接的对比阶段。
谁才是中国第五?小米荣耀的换位博弈
文/观察者网 吕栋 今年一季度,中国手机市场的成绩单有些耐人寻味。 在调研机构Omdia的统计中,小米手机以12%的份额位列第五;而在IDC和Counterpoint的榜单中,荣耀重返前五,小米却沦为“others”。从绝对值来看,小米和荣耀的出货量差距也就20万台左右,但就是这个微小差距,折射出了两个品牌的不同处境。 仅仅一年前,小米手机还处在巅峰时刻。2025年一季度,小米以1330万台的出货量,时隔十年重返中国手机市场第一。但短短12个月之后,小米的位置却断崖式下滑,Omdia和Counterpoint都显示小米出货量暴跌35%,在中国前五大厂商中跌幅最为惨烈。 而在IDC的统计口径下,小米直接罕见地掉出前五。华为以1390万台再夺榜首,苹果以1310万台紧随其后,OPPO和vivo分别以1100万和1050万台占据三四名,前四名与小米、荣耀之间形成了百万台量级的出货鸿沟。即便放眼全球,小米保住了第三名的位置,2026年一季度全球出货3380万台,但19.1%的同比降幅同样是前五品牌中最大的。 小米的急跌,其实是“国补高基数退潮、存储芯片涨价冲击性价比基本盘、华为苹果不涨价挤压和自身高端化乏力”等四重因素叠加的必然结果。2025年一季度的历史高点,本身带有特殊的政策助推,国补刺激下的高基数退潮之后,数据难免面临“下台阶”的压力。 更严重的冲击,来自供应链上游。 TrendForce数据显示,今年一季度通用型DRAM合约价格环比涨幅达55%-60%,NAND产品价格上涨33%-38%,DDR4 16GB现货价从2025年6月的12.8美元暴涨至2026年2月的79美元。小米总裁卢伟冰更直言,本轮内存涨价的力度确实远超预期,同版本内存价格相比去年一季度飙升近4倍。 对于以性价比为根基的小米而言,中低端机型的利润本就微薄,存储芯片的BOM成本占比从过去10%-15%飙升至30%-40%,一部3000元价位的手机仅存储成本便接近千元,整个性价比模型的基础一定程度上被严重抽空。 与此同时,华为和苹果的定价策略,对包括小米在内的厂商形成双向夹击。华为Mate80系列标准版起售价4699元,甚至低于前代Mate70系列的5499元;苹果维持iPhone 17前代起售价,存储及屏幕规格同步升级。在友商不得不将中低端机型提价200至500元、高端新品起售价普遍上涨千元的行业背景下,华为和苹果的反向操作显得格外具有杀伤力。它们凭借供应链议价能力和品牌溢价,吸纳了小米最想争取的那批价格敏感型中高端用户。 小米内部亦在主动调整战略布局,将原本计划于今年一季度发布的小米17 Ultra提前至2025年12月,意图提前锁定利润,为后续的主动收缩腾出空间。即便如此,小米在国内线下市场的短板依旧显著,Civi系列在中端市场的竞争力与OPPO Reno、vivo S、华为Nova、荣耀数字系列难以同日而语,在外界看来,这已成为小米整体战略中显眼的缺口。 与小米在国内市场的被动应战形成对比的是,荣耀本季度在全球范围内交出了安卓阵营最漂亮的增长答卷。Counterpoint数据显示,2026年一季度全球智能手机出货量同比下降6%的大盘之下,荣耀与苹果是唯二实现正增长的头部品牌,前者涨幅高达25%。 小米澎湃OS 这一成绩的取得,很大程度上得益于荣耀的全球化布局。早在2025年,荣耀海外销量占比便已首次突破50%,在拉美、中东非等地区出货量突破千万台,17个重点国家市场份额超过10%。 即便国内市场受华为全面复苏冲击,荣耀今年一季度在国内整体出货依然达到了890万台,仅同比微降2%,在IDC口径下重返国内前五。海外市场的快速扩张有效对冲了国内的外部竞争压力,让荣耀在全球安卓阵营中取得了一个“唯一正增长”的席位。 在IPO的目标下,荣耀早就想跳出手机市场的红海厮杀。2025年MWC期间,荣耀发布阿尔法战略,宣布未来五年投入100亿美元,向全球领先的AI终端生态公司全面转型。2026年MWC上,荣耀进一步提出AHI理念,将AI的内核锚定于“增强人类智能”,并首次展示了Robot Phone和全栈自研的人形机器人。 荣耀CEO李健在接受采访时透露,首款机器人手机计划2026年下半年先在中国上市,随后推向海外;人形机器人部门已于2025年成立,聚焦购物协助、工作检查、陪伴三大消费级场景。京东与荣耀更在4月签署了千亿级战略合作协议,计划未来三年在京东全渠道实现千亿元销售额目标,协同推进荣耀AI终端的普及和全品类销售规模的提升。从智能手机到AI终端生态公司的跃迁,已经进入从战略宣示到产品落地的实质性阶段。 然而,荣耀面临的深层挑战并未因一季度的数据亮点而消失。“华为平替”的标签始终未能彻底撕掉,在国内市场,荣耀依然处于华为强势回归后最直接的竞争半径之内。 华为凭借麒麟芯片的回归、核心元器件国产化率的持续提升,以及对存储器件远高于多数安卓厂商的议价能力,正以“别人涨价、自己降价”的策略快速回收份额。截至目前,鸿蒙系统装机量累计已超5500万台,生态成熟度日益增强。荣耀若不能在国内形成清晰且不可替代的品牌叙事,仅靠海外增量对冲国内压力,长期来看依然存在“两头不靠”的风险。 从更宏观的行业视角审视,当下的中国手机市场,正经历一场由供应链成本重构驱动的深层洗牌。Omdia预计,2026年全年中国大陆智能手机市场出货量或将下滑约10%。存储芯片的结构性短缺短期内难以缓解,集邦咨询预估2026年Q2 DRAM合约价仍将季增58%至63%,NAND Flash合约价季增70%至75%;IDC预测存储芯片结构性短缺或将持续至2027年。对于中低端机型占比较高的品牌而言,这意味着性价比模式的基本逻辑正在被改写,成本压力与终端价格之间的博弈将主导未来几个季度的市场走向。 业内机构普遍认为,2026年全球智能手机市场进入了一个由“成本压力”与“价值创造”共同主导的新阶段,高端机型保持增长韧性,入门级产品则持续受到成本挤压的影响。 唯一确定的出路在于跳出同质化竞争。要么在全球化中建立差异化的区域优势,要么在AI生态等新赛道中找到真正不可替代的技术壁垒,要么在产品形态和品牌叙事上进行根本性的重构。 对于小米和荣耀而言,一季度的排名位置之争只是表象,核心问题依然摆在眼前:小米需要打破性价比的路径依赖,在高端化和线下体系中找到可持续的突破口;荣耀则需在国内市场中撕掉“华为平替”的标签,建立起真正独立且不可替代的品牌认知。 机构每季度给出的名次,放在全年的竞争格局中不过是一次暂时的定格。决定最终走向的,并不是某家机构的统计口径,而是谁能在产业变局中率先找准自己的定位,并将设定好的战略高效落地。
三星新款Win11 Arm笔记本Galaxy Book 6 Edge发布:16英寸屏幕、厚12.3毫米
IT之家 4 月 29 日消息,当地时间 4 月 29 日(今天),三星 Galaxy Book 6 Edge 在法国“闪电发布”。 根据官方的新闻稿,Galaxy Book 6 Edge 将于 5 月初开售,具体价格还没有公布。新机配备 16 英寸屏幕,提供 512GB 和 1TB 存储版本,配色为冰川灰。 外观上,Galaxy Book 6 Edge 和上一代差别不大,主要升级集中在关键硬件和机身厚度上。 IT之家附上其他配置信息如下: 16 英寸 Dynamic AMOLED 2X 屏幕,覆盖康宁 Gorilla Glass XD 保护玻璃,支持 120Hz 刷新率,峰值亮度 500 尼特。 搭载更新、更强的高通 Snapdragon X2 Elite 处理器,NPU 算力最高可达 80 TOPS。 机身厚度从 15.5 毫米压缩到 12.3 毫米。 续航方面,Galaxy Book 6 Edge 满电后最长可播放视频 22 小时。新机支持 65W 超快充,30 分钟即可把电量从 0% 充至 40%。 此外,Galaxy Book 6 Edge 支持 Quick Search、AI Select、Quick Share 等功能。 至于 Galaxy Book 6 Edge 会不会在 5 月同步登陆全球市场,目前还不确定。法国市场已经确认会开售,其他欧洲市场也可能跟进。外媒 Sammobile 消息称,新机起售价预计为 2199 欧元(IT之家注:现汇率约合 17619 元人民币),高配版本则或将涨到 2800 欧元(现汇率约合 22434 元人民币)。价格和上市信息确认后,后续还会有更多消息。
阶跃星辰新图像编辑模型来了!2分钱一张、0.7秒出图,实测海报风格迁移出彩
作者 | 高远瞩 编辑 | 程茜 智东西4月29日消息,今天,阶跃星辰正式发布新一代图像编辑生成模型Step Image Edit 2。 该模型参数量仅3.5B,在轻量级图像编辑评测基准KRIS-Bench中综合排名第一,支持文生图、中英文渲染、局部编辑、视觉推理、主体一致性及风格迁移,可广泛用于IP创作、海报设计、漫画生成、人像美颜、旅游修图等场景。 API定价0.02元/张,公测期(4月28日至5月5日)限免体验。 在官方放出的速度对比视频中,Step Image Edit 2完成一次文生图片仅需0.7秒,而国内闭源SOTA模型耗时7秒,开源20B级模型耗时12秒,开源同量级4B模型则耗时0.6秒。 各模型文生图速度对比(来源:阶跃星辰官方视频) 智东西第一时间上手实测。总体来看,Step Image Edit 2在风格迁移的品牌VI排版上有惊喜,但在中文汉字渲染、空间方位理解、复杂指令执行稳定性上存在明显不足。 官方体验入口:https://platform.stepfun.com/console-tools 一、架构数据双突破:小参数如何挑战大模型? Step Image Edit 2主打“小身材、大能力、快响应”,参数量虽小,Step Image Edit 2在技术层面下了功夫。 据阶跃星辰介绍,核心支撑来自两项创新: 一是多专家驱动的自演化学习。思路可概括为“分头探索、集中聚合”。先从基座模型衍生多个细分任务专家分支进行差异化训练,再通过迭代式自蒸馏将知识聚合回基座,在不增加参数量的前提下逼近大模型的表现水平。 二是分布匹配强化学习(DARL)。传统强化学习依赖稀疏奖励信号,模型容易跑偏。阶跃的做法是让模型当前的输出分布与参考分布对齐,以分布差距作为稠密奖励信号,使训练更平稳、泛化能力更强。 数据层面,Step Image Edit 2在图像编辑能力上投入了超五千万规模的专项训练数据,融合真实场景挖掘、定向合成与高质量开源数据三路来源,并针对文字编辑这一行业难点,自研排版系统生成约两千万条专项数据。 数据质控上构建了“智能体自动清洗—大模型全局评估—人工精细筛选”三级体系。 二、中文海报极限测试:4个文字区域同时排版,模型没完全接住 我们通过阶跃星辰开放平台在线体验,首先复现了官方演示中最具挑战性的中文海报排版任务。官方视频中展示了两个复杂的中文海报案例,效果相当惊艳。 Step Image Edit 2的中文海报极限测试(来源:阶跃星辰官方视频) 但实际测试下来,情况要复杂得多。 实测案例:陶罐变手袋 + 四行文字混排 提示词: 一张黑白线稿风格但带高光质感的海报。画面左侧摆放三个传统陶罐,其中中间的那个陶罐被替换成一个奢侈品牌手袋(造型像陶罐但表面有皮革纹理和高光)。所有物品使用黑色雕刻线条表现,但在手袋和蔬菜部分加入细腻的高光。构图:顶部居中粗体大写标题「LUXURY DAILY」;底部居中副标题「CRAFTING VALUE FROM NOTHING」;右侧竖排文字「日常即奢侈」;右下角有一个超大汉字「物」。整体要求:传统与奢侈的视觉冲突,线条硬朗,高光精致。 实测结果: 我们针对这个提示词连续生成了三次,耗时分别为11.33秒、7.98秒和21.31秒,三次生成暴露了模型三个维度的反复偏差: 偏差一:方位理解错误(三次全错) 提示词明确要求将“中间的那个陶罐”替换为手袋,但三次生成中,模型每次都将最右边的陶罐变成了手袋。左、中、右的空间方位关系,模型完全没有理解。 Step Image Edit 2第一次执行中文海报极限测试 偏差二:“华”字错笔(三次全错) 三次生成的图片中,第二个“奢华”里的“华”字,下方都多出了一横,说明模型存在汉字生成缺陷。 偏差三:蔬菜缺失(仅第一次) 第一次生成的画面中完全没有出现提示词要求的“蔬菜”,后两次生成则成功补上了蔬菜。说明模型在执行多要素的复杂指令时,生成的结果并不稳定。 Step Image Edit 2第二、三次执行中文海报极限测试 小结: 后两次生成虽然补齐了蔬菜,文字布局也基本完整,但方位错误和“华”字错笔在所有三次结果中持续出现,未得到修正。 综合来看,官方视频中展示的中文海报极限测试效果,在实际测试中打了折扣。模型在空间定位和汉字生成时,能力仍不稳定。 三、跨物种身份迁移?“猫变人”五次才成真 官方演示中有一个很有趣的任务:上传一只猫的照片,并输入“这是我的猫,年龄3岁,13斤,女。请将以上信息,按照将猫咪替换成对应的人类女生形象。” Step Image Edit 2执行“猫变人”任务(来源:阶跃星辰官方视频) 我们用不同的猫图实测了这个任务,提示词与官方一样,却连续生成了五次才成功。 第一次生成:画面中只有原猫,完全没有人的出现,模型忽略了替换的指令。 第二次生成:模型直接将人的脸“安”在了猫的身体上,输出了一个猫身人面的怪异形象。 第三次生成:输出了一张人抱着猫的合影,人倒是正常了,但怀里抱的正是原图中的那只猫,并没有实现“猫咪替换成人类女生”。 第四次生成:依然是人与猫合影,但这次猫的品种与原图不一致,仍然没有完成替换。 第五次生成:终于成功,模型输出了一张完整的人类女生形象,人物姿态自然,无猫元素残留。 小结: 五次尝试才成功一次,成功率20%。前四次失败分别暴露了不同层面的理解偏差:完全忽略指令、把“替换”理解成“融合”(人面猫身)、把“替换”理解成“抱着原猫”、把“替换”理解成“换一只猫抱着”。 这说明模型在执行需要多层语义理解的复杂指令时,稳定性远远不够,往往需要反复尝试才能出现理想效果。 四、10种风格一键切换+品牌VI设计:汉字再出错? 我们固定一张风景照片,分别输入“转成水墨风格”“转成赛博朋克风格”“转成油画风格”。 Step Image Edit 2执行风格迁移(来源:阶跃星辰官方视频) 平均生成耗时约12秒,高于官方宣称的0.5-2秒范围,推测与1024分辨率及复杂场景有关。 Step Image Edit 2执行三种风格迁移 不过模型在三者之间切换流畅,水墨风格的留白与晕染、赛博朋克的霓虹色调、油画的笔触质感均较为明显,主体内容保持一致。 同时,我们尝试了品牌VI设计任务。 Step Image Edit 2进行品牌VI设计(来源:阶跃星辰官方视频) 提示词为:为品牌“太阳咖啡”设计一套品牌VI,包括标志、名片、包装袋,风格为极简现代。 模型生成了一张包含包装袋(袋身印有品牌标志)和名片的多元素画面,但未出现官方视频示例中的咖啡杯,并且名片上本应是“太阳”二字被生成了“大阳”,又是汉字错误。整体风格为极简现代,符合提示词的基本要求,生成耗时6.59秒。 Step Image Edit 2执行品牌VI设计 结语:技术架构有亮点,但实际表现稍逊 从技术层面看,Step Image Edit 2在多专家自演化学习和分布匹配强化学习上的探索值得关注。这两项创新理论上确实可能实现“轻量级模型逼近大模型效果”,思路本身有可取之处。超五千万专项训练数据、约两千万条文字编辑数据的投入,也体现了阶跃对这项任务的重视。 轻量高效是行业发展的正确方向,但Step Image Edit 2的技术成熟度仍需打磨。期待其后续版本能在汉字书写能力和复杂指令理解的稳定性上补齐短板,真正兑现“小身材、大能力、快响应”的承诺。
小米自研芯片玄戒O3曝光:主频突破4GHz、能效核飙至3.02 GHz
IT之家 4 月 29 日消息,科技媒体 ximitime 昨日(4 月 28 日)发布博文,通过挖掘 Mi Code 数据库,揭示了小米下一代自研芯片“玄戒 O3”(XRING O3)的相关信息。 该芯片代号为“lhasa”,预估首发搭载于小米 MIX Fold 5 折叠屏手机(内部代号 Q18),目前锁定为中国市场独占。 架构方面,相比小米 15S Pro 手机中使用的玄戒 O1 芯片,玄戒 O3 采用激进的架构重构方案,取消传统大核集群,转而采用“超大核(Prime Core)+ 钛核(Titanium Core)+ 小核(Little Core)”的 3 集群设计。 IT之家注:玄戒 O1 采用 10 核 4 集群设计,包含 2 颗最高主频达 3.89 GHz 的 Cortex-X925 超大核(Prime)、4 颗 2.4GHz A725 性能大核(Titanium)、2 颗 1.9GHz 低频 A725 能效大核(Big)以及 2 颗 1.79GHz A520 超级能效核(Little)。 而基于最新消息,玄戒 O3 取消了传统的“Big”集群,从上代 4 集群简化为 3 集群架构: 超大核(Prime Core):时钟频率突破 4GHz 大关,达到 4.05GHz。 性能大核(Titanium Core):时钟频率为 3.42GHz,取消 Big 集群 超级能效核(Little):时钟频率为 3.02 GHz,作为对比 O1 为 1.79GHz,频率高出约 68% GPU:时钟频率逼近 1.5GHz,作为对比 O1 为 1.2GHz,增幅达到 25% 内存:两代产品的内存频率均锁定在 9600 MT/s,在不改变功耗的情况下保持了顶级内存带宽。 实际应用中,超高频率的小核将大幅提升后台任务管理与多任务处理能力,完美契合折叠屏的大屏生产力场景。若按高端折叠屏定价策略,该机售价预计在 1500 美元左右。 在集群方案上,该媒体推测小米玄戒 O3 可能会采用 1+3+4 或 1+2+5 组合,不过鉴于小米将能效核提高到 3GHz 以上,不排除小米尝试非传统集群方案的可能。
华为Pura 90 Pro/Pro Max开卖:多地售罄 渐变配色难求
最贵8499元!华为Pura 90 Pro/Pro Max今天开卖:多地门店售罄 渐变配色一机难求 快科技4月29日消息,今天华为Pura 90 Pro / Pro Max正式开卖,新机上架后已经被消费者抢购一空。 从市场反馈来看,消费者的购机热情远超预期,不仅线上渠道迅速爆单,线下门店也排起长队。 据了解,华为多地门店货源已售罄,Pura 90 Pro / Pro Max中的橘子海、粉红芭乐等渐变配色尤为畅销。 华为Pura 90 Pro Max采用情绪色彩美学设计,全系为利落直屏方案,业界首发双色渐变金属中框、业界首发光感无界主题,提供橘子海、翡翠湖、霞光紫、晨曦金、曜石黑五款配色。 此外,Pura 90 Pro则提供粉红芭乐、橘子汽水、椰青白、桑果黑四款配色。Pura 90 Pro和 Pro Max分别配备6.6英寸和6.9英寸屏幕,并采用单挖孔设计,都搭载搭载麒麟9030S芯片等。 更重要的是,Pura 90 Pro Max采用了抗反光耐刮昆仑玻璃,屏幕反光下降 70%,耐刮能力提升16倍,耐摔能力提升25倍。 得益于新玻璃的加持,华为Pura 90 Pro Max手机屏幕并没有预贴传统的出厂保护膜。 针对依然习惯使用保护膜的用户,华为官方客服给出了解决方案。如果消费者仍希望贴膜使用,可以前往全国各地的华为授权服务网点,华为将为购买该机型的用户提供免费贴膜服务。 然而,余承东则认为,对于Pura 90 Pro Max的用户来说,完全没有必要额外贴膜,因为屏幕本身搭载了全新的抗反光耐刮昆仑玻璃,其物理性能已足够强悍。 至于售价上,Pura 90 Pro价格是:12GB+256GB 5499元、12GB+512GB 5999 元、16GB+512GB 6499 元和16GB+1TB 7499 元;而Pura 90 Pro Max是:12GB+256GB 6499元、12GB+512GB 6999元、16GB+512GB 7499元和16GB+1TB 8499元。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。