行业分类:
加载中...
头条分类:
加载中...
国内最强生图模型阿里Wan2.7-Image来了!千人千面 告别AI标准脸
快科技4月1日消息,阿里巴巴今日正式发布图像生成与编辑统一模型Wan2.7-Image,直击当前 AI 生图领域“标准脸”审美疲劳和“色彩盲盒”等痛点。 该模型可实现“千人千面”,捏出“活人感”,全新的“调色盘”功能可精准控制色彩。 即日起,用户可在https://tongyi.aliyun.com/wan/、wan.video网站和阿里云百炼体验Wan2.7-Image,千问App也即将接入。 据介绍,Wan2.7-Image具备文生图、图生组图、图像指令编辑和交互式编辑等全链路能力。 在人类偏好盲测中,“文生图”能力超过GPT-Image1.5和国内主流模型,在文本渲染、照片级成像和世界知识指标上,接近Nano Banana Pro。 针对目前千篇一律的“AI脸”情况,Wan2.7-Image强化了虚拟形象捏脸功能,支持从骨相、眼眸到五官细微处的全方位定制。 例如更换提示词中的脸型(鹅蛋脸、圆脸、方脸、长方脸等)、眼部特征(杏仁眼、深邃眼窝、圆眼、丹凤眼等),实现“千人千面”。 此外,Wan2.7-Image全新支持“调色盘”功能,用户可通过Hex Code,一键提取或输入参考图的各种颜色和占比,并可自由调控颜色的数量和占比,自定义配色方案。 当前,超长文字渲染是AI生图的痛点,容易文字模糊、内容错乱甚至直接漏写。 而Wan2.7-Image对超长文字、表格和复杂公式的渲染可达印刷级,支持12种语言,最高3K tokens的超长文字输入,可输出一页A4纸的论文。 Wan2.7-Image还具备强大的组图生成能力,可生成多达12张,用于批量制作同风格系列图、PPT配图、分镜脚本、电商模特套图及多视角建筑图。 而Wan2.7-Image的多主体一致性最高支持输入9张图片作为参考源,对于合影、电影海报及家具组合图等,可保持风格与特征的统一,告别“抽卡”式创作。 值的注意的是,Wan2.7-Image不只会生图,还更懂图。 在训练数据上,超大规模的异构数据底座涵盖全域品类的视觉素材,还整合了理解类数据。 在模型架构上,模型采用了领先的生成与理解统一模型架构,模型不需费力去猜文字对应的画面。 此外,在数据工程维度,根据图像的布局、文字、光影、拍摄角度和用途等,模型团队构建了多维精细标注体系。 基于更大规模数据及尺寸训练而成的Wan2.7-Image-Pro也同步上线,生成图像的构图更加稳定,语义理解更强更精准。 目前,Wan2.7-Image的强大功能可应用于多个行业。 对于短剧与影视团队,可低成本完成角色设定、动作模仿与特效预览;对于自媒体与内容创作者,可轻松生成多风格封面、OOTD穿搭。 而在电商领域,可裂变生成特写图、不同场景的卖点图,大幅降低拍摄成本;教育和科研从业者也可直接调用模型生成论文配图、信息图表与儿童绘本。 针对时下大火的龙虾热,Wan2.7-Image 现已支持skill调用,让龙虾画画,全面解锁生成模型的应用场景。
逆天,ClaudeCode源代码泄露,几小时就被扒的底朝天
大瓜!ClaudeCode源代码泄露了! 然后,被开源了! 1906个源文件完整暴露,51万行代码,全部公开可读! 刚看了下,被开源项目已获得6W+星,目前还在猛涨中。 要说起来,事情其实不复杂,但细节越看越离谱。 先说怎么泄露的? Claude Code在发布新版本v2.1.88的时候,不小心把一个60MB的source map文件一起打包进了npm发布包。 source map是个啥? 你可以把它理解成一份“翻译字典”。 开发者写的代码,发布时通常会被压缩、混淆,变成一坨人类看不懂但机器能跑的东西。而source map的作用,就是把这坨“乱码”重新映射回原始源码,方便调试。 重点来了! 这玩意,本来就不该出现在生产环境。 结果这次,不但出现了,还直接把整套源码“明文送出”。 规模有多大? 1906个源文件,51万行代码,完整可读。 不是片段,是“全套菜单”。 换句话说: 如果你懂代码,现在真的可以自己复刻一个了。 代码一泄露,全球开发者就像开盲盒一样开始“考古”。 短短数小时内,基本被扒了个底朝天。 结果发现,这不仅是源码泄露,还是一份“未来功能路线图”。 比如: Claude Code里,藏了个电子宠物系统。 代号Buddy。 Tamagotchi风格的终端宠物,纯ASCII画风,会在你的命令行里陪你。 还不是随便生成的。 18种物种,6种稀有度,还有“闪光款”。 每个人的宠物根据账号ID唯一生成。 听起来像什么? ——程序员版抽卡游戏。 不过从时间戳来看,大概率是愚人节彩蛋。 但你不得不承认,这帮人是真会玩。 再比如: 一个叫Kairos的功能,被很多人盯上了。 简单说,它是一个“长期记忆助手”。 你不用Claude Code的时候,它在后台帮你干活: 整理你之前的对话、提取重点、压缩信息、生成结构化笔记。 除此之外,还有一堆没发布的功能: 最长30分钟的深度任务规划(Ultraplan) 多Agent协同工作 多会话之间互相通信 后台守护进程模式 还有26个隐藏指令。 当然,不只是“新功能八卦”。 真正让人五味杂陈的,是它的代码质量。 一方面,架构设计是真的强。 安全机制堪称“变态级别”: 每一次工具调用,要经过六级权限验证+四层决策管道; 所有外部命令都跑在沙箱里; 还能一边输出、一边后台处理; 对话太长还会自动压缩上下文。 说实话,这套设计,很多公司都做不到。 但另一方面—— 代码里也有“屎山”。 比如一个文件里的函数,3000多行,12层嵌套,复杂度直接爆表。 还有更搞笑的: 情绪识别不是用AI,而是用正则表达式匹配“ffs”“shitty”这种词。 你看,这就是现实世界的工程: 顶级架构+人类本能的偷懒。 那这件事到底意味着什么?影响有多大?各有各的说法,咱也不关心。 但对普通用户来说,这事有意思。 因为对开发者来说,这绝对是一份“超豪华学习资料”啊。 你要真想提升自己—— 这比很多付费课程都值钱。 至于能不能复刻一个Claude Code? 那就看你本事了。 反正代码已经在那儿了。 代码备份仓库:https://github.com/instructkr/claude-code
深扒科技大厂裁员潮:一边裁一边招,全职换成了合同工,AI背锅?
编译 | 佳扬 编辑 | 云鹏 智东西4月1日消息,据Business Insider报道,近期,科技圈裁员潮再度蔓延。Meta砍掉数百岗位,Oracle计划裁员30000人筹措数据中心建设资金,Atlassian直接砍掉 10% 员工,全力押注AI业务重组;而早在今年2月,Block更是一次性裁掉近4000人,占总员工数的近四成。 科技公司高管们总在高调宣称,AI会帮人类 “减负”、缩短工作时长。可他们口中的 “减负”,根本不是让在岗员工少干活,而是直接把一部分全职打工人从岗位上 “精简” 掉了。 越来越多的公司开始转向合同工用工模式。美国劳工统计局曾估算,1999年临时工占整体劳动力的比例仅为4.3%;而按照更广义的统计口径,如今这一比例已接近40%。 一、AI裁员的真相:资源重分配与用工替代 从数据上看,AI裁员已成为一种显性趋势。职业转型咨询机构Challenger, Gray & Christmas统计显示,自2023年以来,美国企业以AI为由裁员约9.2万人,其中近三分之二发生在2025年。 但这并不意味着AI已经具备大规模替代白领工作的能力。更真实的情况是,企业正在将资源从传统业务转向生成式AI,裁员成为这一过程中最直接的手段。 值得注意的是,不少公司在裁员后并未彻底冻结人力需求,反而转向成本更低的用工方式。咨询机构Robert Hal的调查显示,29%的招聘经理表示会重新启用被裁岗位,55%计划增加合同工或临时工。Gartner也给出预测,到明年,一半因AI裁减客服岗位的企业将考虑重新招聘。 Gartner高级分析总监凯西・罗斯一语道破本质:多数裁员并非AI直接替代人力,而是企业主动进行的资源再分配,“本质上是为AI投入腾挪空间,而非技术成熟的结果”。 这种转向正在深刻重塑劳动力结构。随着企业加大AI投资力度,成本压力被直接转嫁至用工端,传统意义上稳定的全职雇佣关系开始松动,灵活用工正在成为科技行业越来越普遍的选择。 学界普遍认为,这一变化并非短期行业波动,而是企业长期试图降低固定用工成本的必然结果,只是在AI浪潮的催化下,被进一步放大与显性化。 二、从“硅谷福利”到“零工模式”:先裁员再外包 在互联网行业的黄金时代,成为科技公司全职员工,曾意味着进入一套高福利体系。高薪、股权激励、超长带薪假期与完善的福利保障,共同构成了 “硅谷叙事” 的核心吸引力。 但这一模式正在发生变化。在就业市场整体趋紧的背景下,降薪已逐渐成为科技圈的常态。研究机构Revelio Labs数据显示,到2025年底,约40%的白领跳槽者接受了10%及以上的降薪,这一比例创下十年来新高。 裁员与外包也同步推进,企业与员工之间的关系趋于松动。杜兰大学教授罗伯·拉尔卡认为,这种变化让企业文化更强调效率与控制,“用马克·扎克伯格的话来说,是更具主导性的风格正在占据主流”。布兰迪斯大学经济学教授大卫·韦尔则指出,这其实是科技行业长期趋势的延续,AI只是加速了企业减少长期用工的进程。 个体层面的冲击已经真实显现。 一名曾被Microsoft裁员的员工透露,公司虽然没有直接将裁员归因于AI,但战略转向的信号早已十分明确。他离职时不仅失去了未兑现的股票期权,随后还被外包公司邀请以合同工身份回归原团队。 经历一年的求职拉锯战后,他最终重返微软,却只能接受更低的职位,以及约三分之一的薪资降幅。“我几乎没有选择的余地。” 这位员工无奈表示。 类似的案例正在科技圈不断上演。一些公司在裁员的同时仍保留招聘需求,甚至重新吸纳部分被裁员工。Klarna为甚至在大幅削减员工规模后,引入AI客服系统降低基础人力成本,同时增加合同工团队以处理复杂客户投诉问题,其CEO甚至直接提出要打造 “类似零工平台” 的客服用工模式。 数据更能直观反映这一变化:美国劳工统计局曾估算,1999年临时工占整体劳动力的比例仅为4.3%;而按照更广义的统计口径,如今这一比例已接近40%。人才平台MBO Partners的测算也显示,美国约有7300万人以独立工作者的身份参与劳动力市场。 这种模式的代价同样显而易见。合同工往往缺乏医疗保险、退休金等基础保障,更没有全职岗位的稳定性,在面对行业波动与个人风险时更为脆弱。尽管企业反复强调灵活用工的优势,但其背后的核心逻辑,始终是成本控制与利润最大化。 与普通岗位的收缩形成鲜明对比的是,AI相关人才的价值正在水涨船高。Meta曾抛出数亿美元级别的薪酬包争夺顶级AI人才,行业呈现出明显的 “赢家通吃” 趋势,而技术门槛较低的普通岗位,则面临持续压缩甚至边缘化的困境。 事实上,科技公司依赖合同工并非新鲜事。早在上世纪90年代,Microsoft就曾大量使用 “长期临时工”,并因此在2000年支付9700万美元与相关诉讼达成和解。此后,Google、Amazon、Uber等公司在扩张过程中,也广泛采用合同工模式降低用工成本。Upwork的研究进一步证实,77%的企业管理者认为,AI时代对具备专业技能的合同工需求正在持续上升。 需要警惕的是,过快的裁员节奏可能给企业带来反噬。Gartner指出,大规模裁员不仅会损害企业的市场声誉,还可能导致核心技术知识流失,最终拖累组织长期运营效率。 更值得关注的是,AI带来的生产力提升尚未完全兑现,MIT的研究显示,95%的AI试点项目未能实现预期的效率提升或成本节约,甚至有部分企业反映,AI的应用反而在一定程度上加剧了在岗员工的工作强度。 结语:AI时代,劳动力规则正在被改写 在这场转型中,真正被改写的,不只是工作方式,还有“谁来工作、以什么身份工作”的基本规则。 如果企业持续削弱雇佣关系,无论是频繁裁员,还是加速外包,都可能进一步侵蚀本已脆弱的劳资信任。这或许才是AI浪潮之下,更深层的结构性变化。
足足51万行!明星AI编程工具Claude Code源码意外泄露
快科技4月1日消息,当地时间3月31日,AI巨头Anthropic遭遇重大安全事故,其核心AI编程工具Claude Code的完整源代码意外泄露,规模达51.2万行TypeScript代码、超1900个文件,此事引发全球AI行业震动,被业内称为AI界的“核泄漏”事件。 更让人大跌眼镜的是,此次泄露并非黑客攻击所致,而是一场低级的发布打包失误,据悉,Web3安全公司实习研究员未正确排除调试文件(.npm文件),导致一个57MB的源映射文件被公开发布。 该文件包含完整的源码映射信息,开发者只需简单脚本即可还原1900多个TypeScript原始文件,涵盖Claude Code的内部架构、核心算法和工具调用机制,包括代码执行沙箱安全机制、多模态上下文理解模块等多项未发布功能。 讽刺的是,泄露代码中甚至包含名为“卧底模式”的反泄密模块——专门防止员工在公开仓库暴露内部信息,却未能阻止自身源码泄露。 消息曝光后,代码迅速在开发者社区传播留存,即便Anthropic紧急删除原文件,也无法挽回技术资产流失的损失。 万幸的是,核心模型权重、客户敏感数据及相关凭证未被泄露,Anthropic官方也第一时间声明,确认此次事件为发布失误,而非安全漏洞,并表示将推出防控措施避免类似问题重演。 此次事件已是Anthropic短期内第二次安全失误,此前该公司曾意外泄露未发布的顶级模型信息,暴露其在软件发布流程和供应链安全管理上的薄弱环节。
App时代终结?Rokid新视频爆火背后:AIUI正重塑下一代人机交互
作者 | 云鹏 编辑 | 漠影 AI模型大战火爆,月更周更成为常态,虽然底层算力和模型都在“狂奔”,但用户触达的“最后一公里”却始终推进的很慢,应用层的爆发相对滞后,直到OpenClaw(龙虾)爆火全球,AI才第一次真正意义上推开了“大众化”的门。 优秀大模型就像AI的聪明“大脑”,但我们还在用原始的“手脚(GUI图形用户界面)”与之沟通,通过触摸、点击与屏幕上的图标、菜单交互。 AI交互方式的变革,或许会成为AI技术发展的一个关键节点。 龙虾爆火主要因素之一,就是无需复杂操作,一句话帮你做事,这实则已经是对既有人机交互方式的一种打破:用户其实并不想学习如何写出完美Prompt(提示词),用户真正需要的是“意图直达”,一键搞定、一句话搞定。 就在最近,国内AI眼镜赛道头部玩家之一乐奇Rokid的创始人兼CEO祝铭明在网上发布了一条视频,这一功能演示视频迅速窜热,被各路业内人士频频转发。 Demo视频 Demo视频中,佩戴乐奇Rokid眼镜的他,基于纯自然语言与AI交互,AI直接实现复杂任务处理和多模态信息呈现,从查股价到查天气,AI都给出了定制的、可视化图像结果。 这一Demo视频,像我们展示了AI人机交互未来的一个重要趋势——AIUI(以AI为核心的交互)的到来: App边界被打破,AI成为核心中枢调用一切;更简洁高效的纯自然语言交互替代繁琐触控操作;内容形态限制打破,AI多模态内容的生成与呈现成为现实。 AIUI已经不再是未来,属于AI时代的交互,我们已经看到了雏形。或许AI时代的“终极应用”就是没有应用,最适合的交互,就是最自然无感的交互。 一、深度拆解Demo视频:从“触控搜索”到“意图直达” 所以乐奇Rokid这个短短一分多钟的Demo视频为何引起如此多的关注?实则重点并不是视频中所展示的功能有多么“超乎想象”,而是功能背后所预示的AI交互变革,以及这份变革所蕴含的巨大潜力,令所有人不敢忽视。 我们看到,在视频中,用户让AI查股价,AI直接生成了一副动态股价曲线图,我们让AI查询天气,AI直接生成天气相关的图像显示,更直观、也不需要任何其他操作,用户只需要用自然语言与AI沟通。 在传统AI交互操作模式下,我们往往需要先解锁手机,然后找App、输入查询内容、查看页面获取信息,进行一系列操作,而基于AIUI交互模式,一句话AI就直接呈现出“完美结果”。更重要的是,这些内容是AI实时生成的、符合当前语境和用户需求的。 传统模式下,我们只能通过文本与AI“交流”,形式为纯文字,这种“说明书式”的沟通,没有交互感,无法呈现图表、菜单、卡片、功能面板。我们必须进入特定App或者特定的功能中才能使用,无法随时随地无感交互。 传统GUI(图形用户界面)之下,用户直接充当了“路由器”的角色,在不同的信息孤岛(App)之间手动寻找、组合信息。 而在AIUI中,交互路径大幅缩短,几乎完全省去手的操作,只需要语言交互;AI多模态内容生成输出可以实现从理解文本到呈现可视化图文信息的完整链路,AI可以精准识别意图、提供多模态信息的按需呈现。 AI接管了中间所有繁琐的步骤,就如同“龙虾”一句话搞定复杂工作流程。 可以说,眼镜上的AIUI,就像把“龙虾”搬上了眼镜,但更加系统级、更加原生,并且更加安全可控。跟AI眼镜交互,一句话帮你搞定各类复杂操作,并直接呈现可视化直观结果。 设想一下,在双手提着行李的高铁站、在需要双手操作仪器的维修现场,或者在专心驾驶的座舱内,衣食住行,办公、学习、娱乐、出行,基于AIUI交互的智能眼镜几乎在所有场景均有高应用潜力价值。 从信息获取模式上来看,从传统交互到AIUI,就是从“人找App”变为“AI找人”——AI精准识别意图、呈现定制化内容。 二、到底什么是AIUI,它凭什么颠覆传统OS? AI时代,人机交互的改变几乎是必然的,纵观技术和人类社会发展,每一次“生产力革命”,几乎都伴随着交互的大变革。 从PC时代的命令行交互CLI(通过输入代码指令执行操作),到移动互联网智能手机时代的图形交互(GUI),再到如今AI智能硬件时代,从AI眼镜到各类AI可穿戴设备,人与机器的交互模式、人与AI的交互模式必然会发生改变。 在GUI时代,人需要适应机器的逻辑,学习各类功能、如何操作设备,比如用户要记住微信App在第二屏的左上角,要知道手机设置里的哪个选项控制蓝牙开关,但在AIUI时代,这些“物理路径”被彻底抹除,机器理解人类的需求,直接呈现最终结果。 这种差异进一步延伸至生态层面,传统OS是“App的集合”,数据彼此独立于各类App中,而AIUI以大模型Agent为中枢,调用各类API和数据,直接将最终结果打包呈现。 这意味着iOS和安卓庞大的“应用商店”模式可能面临挑战,既有移动应用生态或面临重构,流量入口或许会从具体的App转移到系统底层的Agent手中。 原生AIUI架构真正解决了什么问题?首先,其打破了信息、内容、服务呈现的形态限制,AI可以直接渲染“图形界面”,呈现多模态信息、呈现形式更丰富,比如菜单、卡片、面板、按钮、列表、弹窗、功能页等。 更直观地来看:系统不再预设所有固定的UI框架,而是通过大模型实时“生成”UI,甚至AIUI交互是否真的要有“UI界面”都不一定。 在开发层面,AIUI可能会彻底改变开发逻辑,在开发者生态中掀起波浪,由于乐奇Rokid的AIUI支持JS渲染,底层开发可以直接以AI为核心,而非以App为核心。直接提供AI可以调用的服务接口,让开发更加轻量化。 这种转变也带来了内容的升维:从“发短信”到“发送打包小程序”,用户一键获取结果,还可交互,用户可以进行二次指令调整与追问。 人与AI智能体交互模式从“进进出出”转变为“即用即走”。最终AI真正成为交互中枢、思考中枢,主动判断用户意图、自动调用、汇总、呈现,AI真正可以做到无感、随时随地、陪伴、主动式、个性化服务。 这是传统操作交互模式无法企及的体验上限。在当前的AI Agent时代,AIUI的这些优势更加凸显。 从AI智能体(Agentic AI)的爆发到多模态交互的成熟,AI智能体需要主动拆解用户需求、理解意图、执行复杂任务、调用各类工具,AI主动服务、伴随式的特点日益突出,解放双手成为重要需求。 手机的屏幕和手持形态限制了AI体验上限。实际上,如果你需要时刻将手机举在面前才能让AI“看到”你所处的环境,这种“伴随”显然是伪命题。 AI可穿戴设备成为先天具有无感伴随式特点的品类,其中AI眼镜更是相对来说形态、技术、生态更为成熟,也得到巨头和创企共同认可的一类产品,尤其是带显示功能的AI眼镜,这两年持续火热。 对于AIUI,我们可以用一个非常具象的比喻来概括,如果将找信息或服务比作复杂的“迷宫寻宝”,那么AIUI就相当于直接坐着“飞机”飞越迷宫直抵重点,高效精准获取结果。 对于用户来说,体验升级十分明显——可视化呈现、更自然的交互、AI更易用、好用,信息、服务获取更高效、操作更便捷;对开发者来说,AIUI生态更加开放,前端/JS开发者都可以快速加入AI Agent生态,快速让这套交互模式应用在自己的产品上,大幅降低门槛。 从行业层面来看,从“文字对话AI”升级为“原生融合AI”,这种AI交互范式的革新,为AR眼镜、空间计算、智能助手等场景奠定了下一代交互基础。 乐奇Rokid宣布近期推送基于AIUI架构的OTA 三、Rokid的阳谋:为什么是“AI眼镜”?空间计算的轻量化破局 实际上,近年来类似AIUI的概念我们已经见过,比如AI手机领域如雨后春笋般涌现的AI OS,但至今手机AI OS仍然是“雷声大雨点小”,局限于手机的形态,交互模式很难有实质性突破。 而在AI眼镜上,以AI为核心的交互模式可以说是先天极为契合的,也是行业都能看得到的未来,那么为何在竞争如此激烈的AI眼镜赛道,是乐奇Rokid第一个让我们看到了AIUI的未来长什么样? 实际上,将AIUI拆解来看,核心需要系统、交互以及大模型等方面的深厚技术积累,如何在眼镜这一“寸土寸金”、“螺蛳壳里做道场”级别的地狱难度下实现好的AIUI体验,是极具挑战的。 在系统层面,乐奇Rokid很早就自研了全栈开源的XR操作系统YodaOS——一个低功耗、快响应、易扩展的操作系统,可以灵活接入配置各种主流大模型,这是让AI眼镜快速响应流畅交互的关键。 交互层面,在光学显示、交互技术等方面,乐奇Rokid同样实现了自研技术的储备,包括衍射光波导成像技术的优化、3D手势识别算法、空间音频技术等。 大模型层面,今年2月初,乐奇Rokid已经与国内头部大模型公司合作,研发专属端侧多模态模型,当时就已经有报道指出,其下一代AI眼镜产品会聚焦生成式AI以及AI Agent为驱动的全新操作系统和UI。 今天,靴子初步落地,让我们略窥一斑。 面向未来,AI眼镜会成为AIUI时代的核心入口之一吗?从当前的产业发展逻辑来看,答案似乎已是必然。 AI发展至今,Agent主动、无感、多模态的服务特点,会被手机的操作方式和屏幕信息的呈现方式所限制,而AI眼镜几个关键特点:轻量化、全天候佩戴、无感式、多模态感知、解放双手,都精准命中AI交互需求。 很多业内人士普遍认为AI穿戴设备将成为下一代AI人机交互的关键入口,像阿里巴巴、小米等巨头也都重点押宝AI眼镜这一赛道。头部大厂强强联合,也让各类行业方案更快速走向成熟。 AI方面,从大厂到创企,AI眼镜赛道玩家都在联合大模型公司,研发专属端侧多模态模型,AI眼镜的AI体验不断优化。软硬件厂商的双向奔赴,夯实了整个赛道的地基。 今天,AI眼镜已经成为新一轮AI硬件革命中相对跑得最快、最成熟的产品形态。 从销量上来看,根据全球知名科技市场研究机构Omdia最新数据,2025年全球AI眼镜出货量达870万台,同比增长322%,市场初步进入爆发期。 而乐奇Rokid作为赛道头部玩家,在今年2月初就已经实现了日销1200台的战绩,更是在“带显示的AI+AR眼镜”这一更重要的品类中跻身前列,AI眼镜真正不再是极客的玩具,而是普通大众消费者所能接受、认可的消费品。 戴在脸上的AI眼镜,让大模型“上脸”,实现真正轻量无感的AI交互,AIUI无疑成为未来变革人机交互的重要方式和技术路线。 结语:AI交互变革“奇点”已至 第一代苹果iPhone发布时,行业惊叹于多点触控的“魔法”,而今天,当我们直接用自然语言唤起AI呈现动态图形UI时,我们已经站在了另一个时代交替的十字路口。 短短一分多钟的乐奇Rokid视频Demo绝不是一次炫技,而是让我们窥见了AI时代人机交互未发展未来的“一角”,它证明抛弃冗杂的传统应用形态,直接由大模型接管整个链路是完全可行的。 AIUI带来的是从用户体验、开发生态到商业模式的多方位变革。可以预见,未来会有越来越多的AI智能硬件向这一方向靠拢。 当然,向着这一方向,还有诸多技术层面的挑战,从硬件、软件、系统到生态、商业模式探索,再到如何解决用户隐私安全保护,诸多问题需要解决,这不是一家公司可以解决的,需要行业的共同努力。 但不可否认的是,技术的车轮已经滚滚向前,展望未来,一款小小的AI眼镜,或许真的会成为AI交互革命变革的奇点,AI与物理现实世界的交互、我们与AI的交互,都有了更优解。属于AI眼镜的“iPhone时刻”,已经在不远处招手了。
刚刚,阿里发了款能“捏脸”的新模型
作者 | 陈佳 编辑 | 心缘 智东西4月1日报道,刚刚,阿里正式发布新一代图像生成与编辑统一模型Wan2.7-Image,一举将文生图、图生组图、图像指令编辑和交互式编辑整合进同一套模型架构。 新模型主打四大能力:可自由定制五官骨相的“千人千面”捏脸功能、能精准提取和控制色彩配比的“调色盘”功能、最高支持3K token超长文字渲染的印刷级排版能力,以及支持框选区域精准操作的像素级交互式编辑能力。 我们重点测试了该模型“千人千面”、交互式编辑和多主体一致性三个方面的能力。 在人物生成测试中,无需精细控制提示词,该模型已能在同一组输出中呈现脸型轮廓、颧骨位置、下颌线各异的差异化人像,告别批量同脸问题。加入脸型关键词后,不同轮廓的响应可感知,但方脸、长脸等强特征的精准度仍有提升空间。 在交互式编辑测试中,我们以《唐顿庄园》电影剧照为素材执行人物位置互换,模型在保留服饰特征和背景环境的前提下完成了对调。 在多主体一致性测试中,我们基于参考人物要求模型生成咖啡馆、户外街拍、正式会议室三大场景共12张图像,模型精准保留了参考人物的面部特征、发型轮廓与整体气质,跨场景辨识度稳定,同时对不同场景的光影逻辑和环境氛围适配良好,是三项测试中表现最为亮眼的一项。 同步上线的Wan2.7-Image-pro在构图稳定性和语义理解上进一步提升。 从官方盲测结果来看,Wan2.7-Image多项能力已位列国内第一,整体水平接近Nano Banana Pro。 目前,两款模型均已在阿里云百炼平台开放API调用,万相官网也支持直接体验。 万相官网:https://tongyi.aliyun.com/wan 百炼国内站:https://bailian.console.aliyun.com/cn-beijing?tab=api#/api/?type=model&url=3026980 百炼国际站:https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=api#/api/?type=model&url=3026980 一、告别“AI标准脸”,还能写满一页A4纸 AI生成人像“千篇一律”是业界长期的痛点,Wan2.7-Image强化了虚拟形象“捏脸”功能,支持从骨相到五官细节的全方位定制——脸型可在鹅蛋脸、圆脸、方脸、长方脸之间切换。 在人物生成能力上,我们使用了一条基础的提示词进行测试:“一个年轻女性肖像,半身照,电影感光影,高清细节,真实皮肤质感”。 在未加入任何脸型、五官或身份限定的情况下,Wan2.7-Image一次生成了4张人像。从结果来看,这组图已经明显不同于以往常见的“AI标准脸”,人物之间呈现出较为自然的差异。 四张图中的人物在脸型轮廓、颧骨位置和下颌线条上各不相同,并非简单的“同一张脸微调”。 同时,皮肤纹理、毛孔及轻微瑕疵(如泛红、肌理不均)均被真实保留,未出现过度磨皮的失真感。 在光影控制与整体氛围营造方面,Wan2.7-Image表现出色。四张图像均采用自然窗光作为主光源,形成强烈的明暗对比与电影化质感,背景环境元素虚实得当,未对主体造成干扰,且不同图像间的人物特征保持了较高的一致性。 整体来看,在无精细控制提示词的情况下,Wan2.7-Image已经可以生成风格统一但人物不同的人像结果,相比以往容易出现的“批量同脸”问题,有明显改善。 在基础人像生成测试后,我们进一步加入明确的脸型约束,对Wan2.7-Image的“捏脸能力”进行验证。测试提示词在原有基础上增加:鹅蛋脸/圆脸/方脸/长脸。 从实测结果来看,Wan2.7-Image模型能够对脸型特征做出差异化响应,不同生成样本中,人物面部轮廓呈现出从鹅蛋脸到圆脸、方脸的明显区分,下颌线、颧骨宽度、面部长宽比等核心脸型指标存在可感知的差异。 在皮肤质感、电影感光影等方面,限定脸型后生成的图片画面细节保留度基本稳定。但该模型的脸型控制仍存在精度与一致性的不足。部分图片存在特征模糊、脸型特征不典型的问题,难以完全匹配“方脸”“长脸”等强特征的严格定义。 对比未添加脸型关键词的基础生成版本,限定脸型后生成的图片人物面部占比整体偏大,脸部视觉尺寸有所扩增,头身比例、半身构图的原有平衡被打破。 在官方演示案例当中,Wan2.7-Image模型生成的图片人物眼部特征支持杏仁眼、深邃眼窝、圆眼、丹凤眼等多种选项,并能跨越国籍与年龄生成差异化人像。 另一大亮点是“调色盘”功能。用户可一键提取参考图的颜色及其占比,并以此为基础生成同色系图片,同时自由调控各颜色的数量和比例,构建个性化配色方案。无论是马蒂斯浓郁的红色系、梵高明媚的黄色系,还是毕加索清冷的蓝色系,都可作为输入参考,输出色调高度一致的全新画面。 在文字渲染方面,Wan2.7-Image支持12种语言,最高可处理3K token的超长文字输入,输出效果达到印刷级质量。这一能力让其在信息图、教育插画、旅游攻略长图海报等场景中颇具实用价值——理论上可以一口气生成排满一页A4纸的论文。 二、一次生成12张图,还能“哪里不爽改哪里” Wan2.7-Image的编辑能力也迎来了显著升级,其“交互式编辑”功能支持用户在指定区域内精准框选,对框内元素进行添加、对齐、移动操作,也可进行Logo插入和人物位置互换,实现像素级意图对齐。 实测中,我们用《唐顿庄园》电影剧照图片执行“两人位置调换”的编辑指令,Wan2.7-Image成功将原图中左侧蓝裙人物与右侧黄裙人物的站位进行了对调。 人物主体、服饰特征(蓝/黄缎面礼服、头饰、项链、长手套)均完整保留,未出现主体丢失、严重变形等致命问题,整体场景的背景环境(宴会厅装饰、背景人物、花艺陈设)也基本维持了原图的一致性,实现了编辑指令的核心诉求。 官方演示中,用户框选图中两个人物后输入“互换位置”指令,模型准确完成了人物交换,且背景及其他元素保持不变。 在另一官方案例中,用户通过框选区域、指定对话气泡风格和文字内容,直接生成了毛毡风格的对话场景,文字与画面风格统一。 多主体一致性是图像生成中难度较高的任务。Wan2.7-Image在这一方向支持最多9图的风格与特征统一,可用于合影生成、电影海报及家具组合图等场景。官方展示了AI女团海报和家具组合图的生成效果,多人物之间的风格一致性较高。 我们基于参考人物进行多场景生成测试,发现Wan2.7-Image在核心人物特征的一致性还原上展现出较高水准。模型根据提示词“基于参考人物,生成3张图:(1)咖啡馆内看书;(2)户外街拍;(3)正式会议室”,输出了一组共12张图像。 从输出结果来看,模型精准保留了参考人物的核心面部特征、发型轮廓与整体气质,在咖啡馆、户外街拍、正式会议室三大场景中,人物主体的辨识度始终稳定,未出现五官变形缺陷。 同时,模型对场景环境的适配性表现优异,不同场景的光影逻辑、环境氛围与人物状态高度匹配,咖啡馆的暖光、户外的自然光、会议室的室内冷光均符合场景逻辑,人物服饰、姿态也与场景属性高度契合。 三、不只会画图,还开始“理解图” 从技术层面看,Wan2.7-Image有三个维度的升级。 在训练数据上,模型底座整合了超大规模异构视觉素材,并额外加入了理解类数据,使模型不止于像素级拟合,还具备底层语义认知能力。 在模型架构上,Wan2.7-Image采用生成与理解统一的模型架构,在共享隐空间(Latent Space)内实现语义映射——文字紧挨着画面,模型不需要费力推断文字对应的画面区域。同时,训练流程中引入了多模态指令(文字+图片),进一步强化了从“像素拟合”到“语义认知”的跨越。 此外,模型还支持调用WanImage Skill工具,据官方介绍可实现“让龙虾画画”等创意指令编排。 在人类偏好盲测中,Wan2.7-Image多项能力位列全国第一,综合成绩接近Nano Banana Pro。同步上线的Wan2.7-Image-pro版本在训练数据规模和模型尺寸上进一步扩大,构图稳定性和语义理解精准度更高。 四、从电商到短剧,图像模型开始全面落地 Wan2.7-Image在多个垂直场景展示了行业落地潜力。 在短剧制作方向,模型支持角色生成中的“一人分饰多角”,通过多主体一致性能力保持同一角色在不同场景中的特征稳定;分镜生成可将人物自然融入场景,并通过交互式编辑精准调整人物位置和大小。 在电商广告场景,模型支持从单张模特图一键裂变出多张不同角度、不同场景的展示图,并可按电商上架格式自动输出场景图、特写图、尺寸图和卖点图等套图组合。 颜色变装(通过调色盘功能切换服装色彩)、四季拼图生成以及“拯救废片”(消除闭眼)等功能,可满足小红书、B站等社交平台的内容创作需求。OOTD穿搭生成和不露脸服装替换也在演示中效果稳定。 该模型可生成图文并茂的知识卡片和教育插画,内容创作方向支持B站封面、小红书封面、种草图文等常见内容格式。 结语:图像模型正在走向“可控化”和“生产力工具” 从Wan2.7-Image的技术突破中可见,图像模型的技术竞赛已转向更深层的维度。其核心价值不再局限于“画得像不像”的表象还原,而是能否精准控制人物形象、颜色搭配和画面布局,能否深入理解文本与语义内涵,能否无缝融入设计、电商、内容创作等工作流程。 随着长文本渲染能力的突破、交互式编辑的灵活操作以及多主体风格一致性的显著提升,图像模型正从辅助性的“创意工具”蜕变成为驱动产业效率的“高效生产力工具”。“千人千面”和“调色盘”这类能力,也意味着AI生成内容开始走向个性化与可控化。
Claude Code开源发酵:负责人反省,平替版狂飙10万星,Anthropic紧急封杀
作者 | 杨京丽 编辑 | 心缘 智东西4月1日报道,今天下午,Claude Code负责人鲍里斯·切尔尼(Boris Cherny)在X上回应了Claude Code开源事件。他坦言,此次事故是团队问题,一个本应自动化的部署步骤却以手动方式完成,团队已着手改进自动化流程,更多改进措施仍在进行中。 Claude Code负责人在X上回应泄露事件 昨天下午,Claude Code在打包发布时误将source map文件(.map)捆绑进了npm包,导致约1900个TypeScript文件以及超过51.2万行代码遭泄露。 泄露发生后,全球开发者连夜搬运代码,事态走向了Anthropic完全无法控制的方向。 有人在两小时内重写了整套系统并创下GitHub历史纪录,有人将源码搬上去中心化平台并宣称“永远不会被删除”,Anthropic的DMCA封杀令也未能阻止代码的扩散。(注:DMCA,即美国《数字千年版权法》,通常被版权方用来要求平台下架涉嫌侵权内容。) 一、两小时5万星:泄露引爆GitHub史上最快“克隆”狂欢 泄露发生后,全球开发者几乎是以“抢”的速度扑向了这批代码。 一位韩国开发者Sigrid Jin迅速对其进行了重写,他去年累计消耗250亿个Claude Code token,是全球最活跃的Claude用户之一,此前曾被《华尔街日报》报道。 据他本人在claw-code的readme中写到,他凌晨被消息惊醒,女朋友担心持有Claude源码会惹上官司,于是他用Python重写了一套功能类似的系统,命名为“claw-code”推上GitHub。 claw-code仓库中的背景介绍(中文转译版) 不管动机是规避法律风险,还是蹭一波泼天的流量,结果是实打实的: 发布仅2小时突破5万星标,创下GitHub历史上最快纪录 目前,claw-code星标数近10万,fork数超过9万 fork数一度反超星标数,超9万名开发者“复刻”了这套代码 这波热度的本质在于Anthropic泄露的源码实在太有价值了,51.2万行顶级AI编程工具的完整实现,正常情况下花多少钱都看不到。 值得一提的是,开发者采用的是所谓“clean-room”重写方式,即不直接复制原始代码,独立实现相同功能。这种做法在法律上构成“全新”创作,Anthropic想靠DMCA一网打尽所有衍生项目,恐怕没那么容易。 claw-code项目开源地址:https://github.com/instructkr/claw-code 二、8100个仓库被封杀,但代码已在去中心化平台“永生” 发现泄露后,Anthropic迅速祭出法律武器,GitHub的DMCA存档显示,Anthropic在3月31日当天便提交了版权投诉,主张“大部分甚至所有fork均构成侵权”。 GitHub随即配合执行,超过8100个仓库被禁用,覆盖原始泄露仓库及其整个fork网络。有开发者在社交媒体上无奈发帖:“Anthropic的律师刚睡醒就把我的仓库干掉了。” 然而,DMCA的长臂管辖在去中心化面前失灵了。去中心化Git平台Gitlawb将完整源码做了镜像,并在X上公开喊话:“永远不会被下架。” Gitlawb在X上宣布镜像Claude Code泄露源码 镜像Claude Code项目开源地址:https://gitlawb.com/node/repos/z6MkgKkb/instructkr-claude-code 这恰恰是互联网的经典悖论:DMCA之所以对GitHub有效,是因为中心化平台有合规义务、有单点可以施压;而去中心化基础设施天然不存在这样的单点故障。 值得一提的是,这并非Anthropic第一次围堵Claude Code的逆向工程。早在2025年4月,Anthropic就曾对一名尝试逆向Claude Code的开发者发起过DMCA下架。 另外,Anthropic还专门打造了名为“Undercover Mode”系统,防止AI泄露内部机密。如今,他们亲手泄露了曾经不惜动用法律手段保护的全部代码。 三、“安全至上”的AI公司,5天内两次泄露 Claude Code负责人的推文试图将外界的关注从“追责个人”引向“团队反思”,但开发者社区的质疑已经超出了这起事故本身。 同样的泄露事件已经不是第一次发生了,2025年2月,Claude Code就曾发生过几乎一模一样的source map泄露,同样的失误在13个月内重演,让“我们已改进流程”的承诺显得格外苍白。 另外,就在3月27日,Anthropic的模型规范文件也被意外公开。五天内,接连两次泄露,对于一家天天把“AI安全”挂在嘴边的公司而言,动摇的不只是技术信誉,更是其品牌叙事的根基。 Anthropic此前泄露的内部文件 从商业层面看,Anthropic当前年化收入已达190亿美元(约合人民币1311亿元),Claude Code单一产品的年度经常性收入(ARR)便高达25亿美元(约合人民币172.5亿元)。 而此次泄露的源码中,包含KAIROS(自主守护进程模式)、ULTRAPLAN(云端深度规划)、COORDINATOR MODE(多Agent协调)等44个功能开关,这几乎等于将一份完整的未发布产品路线图,拱手递到了竞争对手面前。 结语:Anthropic的愚人节“大礼” 一家致力于AI安全的公司,专门打造了名为“Undercover Mode”系统,防止AI泄露内部机密,最终却因一个配置的疏忽,将51.2万行源码完整曝光于世。同样的错误屡次上演,Anthropic恐怕需要先把自己的安全问题搞明白。 但换个角度看,全球开发者倒是实实在在地“爽”了一把,51.2万行顶级AI编程工具的完整源码、三层记忆架构的设计思路、44个未发布功能的技术细节,这些在任何正常情况下都不可能公开的东西,如今被摊在了所有人面前。 两小时5万星的GitHub狂欢、去中心化平台上“永不下架”的镜像……Anthropic的失手,意外成了开源社区的一场狂欢,恐怕这是今年愚人节的最大乐子了。
OPPO发布K15 Pro系列手机:搭载新一代疾风散热引擎 国补后2464.15元起
凤凰网科技讯 4月1日,OPPO发布K15 Pro系列智能手机,包含K15 Pro和K15 Pro+两款机型。K15 Pro搭载天玑8500 SUPER处理器,配备6.59英寸144Hz屏幕;K15 Pro+搭载天玑9500S处理器,配备6.78英寸165Hz屏幕。两款机型均搭载新一代疾风散热引擎,采用疏密错位散热鳍片、VC均热板及石墨凝胶,风扇进风口微凸不足1毫米,50%转速下噪音低至19dB,整机通过IP69防尘防水认证。 续航方面,K15 Pro内置7500mAh冰川电池,支持80W超级闪充;K15 Pro+内置8000mAh冰川电池,支持100W超级闪充。全系首发自研冰川电池聚能芯片,在20%低电量下仍可维持性能释放。 影像方面,后置5000万像素光学防抖主摄与800万像素超广角镜头,支持实况拼图、AI人像补光、AI消除等功能。K15 Pro系列配备三颗岚影呼吸灯,支持色彩自定义及游戏、音乐联动。Pro版专属“金色传说”配色采用锻造碳后盖,随机分布金色纹理。两款机型均支持DIY磁吸镜头盖玩法,可更换镜头装饰。 K15 Pro系列搭载ColorOS 16系统,支持与苹果生态的部分互联功能,包括iPhone来电提醒、Apple Watch信息同步、AirPods原生连接及苹果备忘录迁移。 售价方面,OPPO K15 Pro 12GB+256GB简装版首销7天内叠加国补后2464.15元;12GB+256GB标准版国补价2719.15元;12GB+512GB标准版国补价2999元。 OPPO K15 Pro+ 12GB+256GB简装版首销7天内叠加国补后2634.15元;12GB+256GB标准版国补价2999元;12GB+512GB标准版国补价3499元。
新阿维塔12开启预售:全系搭载太行智控2.0技术+896线激光雷达
凤凰网科技讯 4月1日,新阿维塔12近日开启预售。该车型定位50万元以内豪华轿车,有纯电和增程两大动力形式,主打驾控、智能、安全与品味四大核心卖点,22.99万元起售。 驾控方面,新阿维塔12全系搭载太行智控2.0技术,配备TVC智能扭矩矢量控制系统,可独立调节每个车轮动力,响应时间在千分之一秒内。在湿滑路面可将横摆角速度控制在±2°/s以内;时速200公里发生爆胎时,系统在0.1秒内介入,将横摆角速度控制在10°/s以内,通过对其他车轮的精准制动和扭矩分配保持车身稳定。 纯电双电机版零百加速4.1秒,三电机版搭配高性能轮胎后达2.71秒,并配备一键加速按钮,按下后额外获得30%推力。 首次在该级别引入电磁悬架,阻尼调节频率达每秒1000次,从最软至最硬切换时间10毫秒,峰值阻尼力超过10000N(1m/s活塞速度)。 电池方面,纯电版搭载宁德时代麒麟6C超充电池,30%-80%充电时间少于10分钟,电池底部增加高强度钢防护,抗撞击能力为国标10倍;增程版搭载宁德时代骁遥超级增混电池,52度容量,30%-80%充电时间10分钟,综合续航超1200公里。 智能方面,新阿维塔12是首款搭载华为乾崑ADS 4.1与鸿蒙座舱5的联合共创车型。硬件上配备全球量产最高896线激光雷达,采用双光路架构,长焦与广角双焦段一体成像,分辨率较行业主流提升4倍,可稳定感知120米外14厘米高小物体,低反射率目标感知识别距离提升190%,异型障碍物感知识别距离提升77%。同时搭载分布式4D毫米波雷达,前向1组3颗、后向2颗,在雨雾天气下可对静止故障车实现AEB刹停;配备D-tof高精度固态激光雷达,测距精度3厘米,用于边缘检测、台阶与负向障碍物识别、后向开门检测等场景。 智驾系统支持车位到车位领航辅助,窄路掉头时可自动完成三点式掉头,前向AEB最高刹停速度150km/h,侧向防碰撞新增对排水渠、田坎等负向障碍物的识别,后向防碰撞识别儿童扭扭车、消防栓等低矮障碍物,路面自适应AEB可感知路面附着力变化提前制动。 鸿蒙座舱5搭载MoLA架构,支持多模态感知与大模型融合,配备35.4英寸4K一体星环屏,新增音乐律动主题,后排16英寸悬浮屏支持60°至100°角度调节,情景模式包括休憩、嗨唱、宠物等模式。 安全方面,全系标配9安全气囊,包含前排中间远端气囊,采用双腔49L容积设计。车身骨架采用“高强钢+铝合金+热成型钢”复合结构,顶盖前横梁连接左右A柱,前舱缓冲区采用三段式吸能设计,纵梁采用“目字”截面结构。车内应急拉手位于门板位置,解锁力经调校防止儿童误触;半隐藏门把手保留机械开启方式,新增照明灯。 内饰与配置上,前排双零重力座椅采用10层舒适结构,腿托长156mm、靠背宽530mm、坐垫长614mm,躯干与膝部角度达120°,支持加热、通风、8点位按摩。后排可选VIP四座布局,带冰箱、双手机无线充电。 皇家剧院版搭载石墨烯加热座椅,发热面积达90%,发射6-14μm远红外光波,通过5万次跪压测试。英国之宝音响系统配备25个扬声器,输出功率2016W,支持7.1.4全景声。四温区纳米水离子空调每秒产生4.8万亿个羟基自由基,除菌率99.9%。沉浸式香氛提供提神、舒缓、防晕车三种香型,单盒续航180小时。豪华天鹅绒顶棚通过OEKO-TEX婴幼儿产品级认证。中控台与手机浮岛采用欧洲进口天然真木,提供珍珠母木、白蜡木、桦木三种选择。人机交互优化包括方向盘新增实体按键、车窗按键移至门板、门板储物空间扩大一倍、后排中控新增磁吸连接点等细节改进。 售价方面,Max 双电机增程版29.99万元;Max双电机纯电版30.99 万元。Ultra双电机增程版31.99万元;Ultra双电机纯电版32.99万元。Performance三电机纯电版35.99万元;Master三电机纯电版38.99万元;皇家剧院版43.99万元。
比亚迪首个海外云轨项目在巴西落地,圣保罗17号黄金线开通运营
IT之家 4 月 1 日消息,比亚迪今日宣布,其首个海外轨道交通项目 —— 巴西圣保罗 17 号黄金线云轨于当地时间 3 月 31 日正式通车运营。 这条线路连接圣保罗市重要交通枢纽孔戈尼亚斯机场,开通仪式在机场站举行,圣保罗州州长塔尔西西奥 · 德弗雷塔斯、比亚迪巴西分公司总经理李铁、比亚迪第二十一事业部副总经理卓开阔等嘉宾出席活动并共同乘坐体验列车。 IT之家查询官方资料获悉,比亚迪于 2020 年正式接手该项目,围绕既有梁体结构完成列车适配和系统优化,推动项目顺利落地。 圣保罗 17 号线云轨列车采用比亚迪云轨专用电池,兼具自动化运行、绿色低噪、安全高效等优势。针对项目建设条件复杂、前期遗留的梁面超高、坡度大等严苛工况,比亚迪开展了针对性技术攻关,实现了系统全天候安全稳定运行,提供了任意位置折返、区域入侵防护以及区间救援疏散等安全功能。 李铁表示,为能够助力圣保罗 17 号线正式通车深感自豪,这不仅是比亚迪首个海外轨道交通项目,也是比亚迪以创新技术服务当地城市交通发展的重要实践。 塔尔西西奥 · 德弗雷塔斯表示,项目推进过程中需要一家能够提供成熟解决方案的企业,比亚迪凭借技术实力承担了这一任务,其交付的云轨列车在通信、信号、舒适度和安全性等方面展现出先进水平。
曝京东云PaaS一号位被刘强东开除
作者 | 程茜 编辑 | 云鹏 智东西4月1日消息,根据雷峰网、新行情消息,京东集团副总裁、京东云PaaS业务部负责人刘辰,已于近期正式离职,疑似刘强东亲自拍板开除。 京东集团副总裁、京东云PaaS业务部负责人刘辰(图源:人民网) 刘辰负责的PaaS团队,已整体划归至京东云IaaS业务部,由IaaS业务部负责人龚义成统一管理。 根据公开信息,刘辰曾毕业于北京工业大学,为2008届硕士研究生,是京东云的核心老将,历任京东云客户成功部负责人,到集团副总裁,再到PaaS产品研发部负责人。刘辰曾在京东云带队支撑了多年618、春晚等大流量场景,建设全球规模最大的云原生集群之一。 据传,其离职原因是业绩未达标且存在合规问题。刘辰负责的PaaS业务表现未达预期,并且有消息称,他负责的部门在合同层面出现合规问题且已被核实。 京东云于2016年组队,相比腾讯、阿里等头部大厂晚了7年。根据脉脉网友爆料的信息,京东集团为京东云定的目标是2026年增长60%,但内部判断“这个任务基本完成不了”。 此外,在业务层面,3月18日,京东云宣布全系核心产品不涨价,并将对多款产品实施更大力度优惠。京东云将明确拒绝跟风涨价,现有云主机、AI算力、存储、网络等全系核心产品价格保持稳定,不新增涨价项、不提高收费标准,此外还将对数据库、中间件等多款产品实施更大力度的优惠措施,平均降幅超16%,最高降幅达40%。 此次,刘辰离职、PaaS团队被整体划归至IaaS业务部,或意味着京东在精简瘦身,进入全力冲业绩时期。
又一家手机公司要做AI眼镜了,前一加联合创始人出手
编译 | 佳扬 编辑 | 云鹏 智东西4月1日消息,据彭博社报道,由瑞典籍华裔裴宇(Carl Pei)创立的科技品牌Nothing,计划于2027年上半年推出首款AI增强型(Artificial Intelligence-enhanced)智能眼镜,同时一款主打AI功能的全新耳机也预计在今年正式面市。 裴宇是一加联合创始人,24岁他联合创立一加并创下首年百万销量纪录,2020年他离职后于2021年创立Nothing,仅用6周Nothing就完成了700万美元(折合人民币约为0.5亿元)的融资。 Nothing正在研发的智能眼镜,将配备摄像头、麦克风与扬声器,其AI运算将依托智能手机与云端完成,主打任务自动化与个性化体验两大核心功能。 一、裴宇:“朝三年内IPO努力” Nothing于2020年创立,是一家专注于消费电子硬件和生态系统的科技公司,其产品线包括智能手机、TWS耳机等。 2025年,该公司完成2亿美元C轮融资,估值攀升至13亿美元(折合人民币约90亿元)。目前,Nothing的投资方包括老虎全球管理(Tiger Global)、谷歌风投(GV)、Highland Europe、殷拓集团(EQT)及高通风投(Qualcomm Ventures)。 此前,裴宇表示:“我们正朝着在三年内具备IPO条件的方向努力。至于具体时间,将取决于当时的市场环境,以及对公司业务最合理的选择。” 尽管体量远不及传统硬件大厂,Nothing已凭借差异化产品,在科技爱好者与开发者群体中积累了一批忠实拥趸。其产品以“透明设计+灯效交互”为核心卖点,形成较强辨识度,也为后续产品线扩展奠定基础。 2021年推出的首款产品Ear(1)无线耳机累计截止到2022年6月销量突破53万台;2022年推出的首款智能手机Phone(1),以透明后盖、可编程LED灯效为核心标识,上市数月后销量突破50万台,跻身当时科技圈的现象级产品。 近期,Nothing发布了两款全新手机,分别是入门级定位的4a和中端定位的4a Pro,两款产品凭借高性价比与亮眼设计收获市场好评。不过,品牌并未对标苹果、三星旗舰的高端机型3代。 市场布局上,Nothing正深耕印度及部分欧洲新兴市场,但尚未敲开美国市场的大门。 二、以AI为核心,向可穿戴赛道延伸 AI一直是Nothing的战略核心。此前,裴宇曾表示:“人工智能要充分发挥其潜力,消费硬件也必须随之革新。与如今一刀切的解决方案不同,未来将有十亿个不同的操作系统,分别服务于十亿个不同的用户。” Nothing近期上线手机端AI辅助编程工具Vibe编码,用户可借助这一工具自定义主屏幕小部件,并与其他Nothing用户共享。此外,其自研操作系统也深度集成AI功能,支持语音备忘录分析、截图内容识别等便捷操作。 Nothing如今正将产品线拓展至智能手机与音频设备之外,加码布局AI可穿戴赛道。其正在研发的智能眼镜,将配备摄像头、麦克风与扬声器,其AI运算将依托智能手机与云端完成,主打任务自动化与个性化体验两大核心功能。 有趣的是,有消息人士透露,裴宇起初对入局智能眼镜领域态度谨慎,最近却明确向员工表示,公司将聚焦多设备协同战略。 结语:智能眼镜赛道迎群雄逐鹿 放眼整个智能眼镜赛道,玩家们正加速跑马圈地。苹果计划于2027年初推出智能眼镜,该产品将搭载计算机视觉摄像头分析环境,并联动Siri语音助手;据智东西此前报道,Meta本周发布新款Ray-Ban智能眼镜,主打近视人群适配需求;谷歌与三星的同类产品也预计于年内亮相。 Nothing作为从手机圈跨界而来的玩家,拥有在消费硬件领域的经验和差异化设计理念,能否在巨头扎堆的格局中开辟出新赛道,值得期待。
2000万人围观,React大佬开源神作“干翻”前端!速度飙500倍,狂揽2.8万颗星
编译 | 程茜 编辑 | 心缘 智东西3月31日消息,刚刚过去的周末,开源纯TypeScript库Pretext迅速引爆GitHub,至今Star数已飙升至2.47万,开发者的官宣推文浏览量已超2100万次,成为全球开发者社区焦点。 Pretext由前端大神、Midjourney前端工程师Cheng Lou重磅开源,仅几KB大小,渲染速度比传统工具快约500倍。 Pretext由前端大神、Midjourney前端工程师、开源JavaScript库React核心团队成员Cheng Lou重磅开源,是仅几KB大小的纯TypeScript库,前端UI渲染速度比传统工具快约500倍。Cheng Lou透露,Pretext的实现是通过向Claude Code和Codex展示浏览器的真实基准,并让它们在每一个重要的容器宽度下进行测量和迭代,持续运行数周完成的。 Cheng Lou在社交平台X上对Pretext给出了极高评价:“未来几年UI工程领域最重要的基础组件之一。” Pretext还支持开发者所能想到的所有语言,兼容各种浏览器特性差异。不过他也提到Pretext比传统方式快约500倍的对比可能不公平。 其强大的灵活性更是激发了开发者的创作热情,目前社交平台X上已掀起Pretext应用热潮,如用Pretext做游戏、MV,手搓文字环绕、流动效果。 还有知名歌曲Bad Apple!!那段经典、经常被拿来各种魔改的黑白影绘视频,开发者让歌词文本通过位移变形特效,拼出了人物、城堡的轮廓,且随音乐旋律丝滑变化。 【视频】 Pretext受热捧的背后,核心在于其跳出了传统前端排版的方案,避开前端UI渲染中最费时费力的操作之一DOM,这一难题长期困扰着全球前端开发者,更是大型前端项目、高并发场景下的短板。 新方案采用自研文本测量逻辑,以浏览器自身的字体引擎作为真实基准,既保证了排版的精准度,又将渲染效率提升至新高度,更重要的是,这种创新架构天然适配AI迭代优化,或为未来前端排版的智能化、自动化发展预留巨大空间。 有趣的是,Cheng Lou还自曝,Vibe Coding不够,边等结果边转呼啦圈就是正确的做法,他透露做Pretext这个月下来,他人都瘦了快2磅。 一、一个页面放几十万个文本框,丝滑滚动不卡顿 UI设计的传统方案中,因为文字复杂多变,所以需要依赖DOM读尺寸,这需要强制浏览器重新计算整个页面布局,会导致页面卡顿、不可预测、性能差。因此做高性能动态排版的难度很大。 但在AI实时生成UI、空间计算、3D界面发展迅速的时代,这种慢且不可控的文本布局方式完全跟不上需求。 Pretext的出现就是为了解决这一难题。其可以基于浏览器自有的字体引擎作为实地验证,相比传统方案更快、性能更可控。 Cheng Lou在社交平台X上举了几个典型实用案例: 基于Pretext,一个页面可以同时放下几十万个文本框,还能做到丝滑滚动、不卡顿。 其对数十万个高度各不相同的文本框进行遮挡虚拟化(Occlusion Virtualization)处理,无需进行DOM尺寸测量,仅通过一次无缓存、线性遍历高度的计算即可完成可见性判断,实现120fps流畅滚动与窗口缩放。 其页面的聊天气泡能自动贴合内容,可以看到在滑动时聊天框的宽度会紧紧贴合文字内容,不会撑满页面整行。 浏览多个页面时,其能实现响应式动态多栏杂志排版,像杂志那样实现多栏布局,同时做到自适应屏幕、内容动态变化。 Pretext还能快速制作可变字体宽度的ASCII字符画,也就是只包含英文字母、数字、标点符号、少量符号等基础符号拼出图案、人脸、风景、logo等字符画。 那些常见的自动增高输入框、折叠面板、多行文本居中、纯Canvas多行文本,以及其他过去在CSS里给网页排版、布置样式等非常棘手的难题,如今都变得简单到不值一提。 有开发者对比了使用Pretext和DOM对整本小说即时分页,要求每页都有预览,Pretext每次运行只需2-3毫秒,而DOM需要超过100毫秒。 二、X上开启前端性能秀,开发者用文本做游戏、MV、3D特效 开发者直接在X上来了一场前端炫技。 有开发直接用Pretext做出了歌词文本随旋律进行变形做出MV。 下面是英国当红制作人Fred again与Daft Punk核心成员Thomas Bangalter的DJ合作现场,用文字把节奏呈现了出来。 【视频】 还有开发者用Pretext做游戏。 例如下面是3D迷宫射击游戏《毁灭战士》的ASCII字符版。 还有文字版的打砖块小游戏,砖块跳动时,页面上的大小文字都会随之流畅变形。 文本还能模拟类似水面波纹或声波传播的视觉效果。 还有网友称,Pretext的最实用场景是做简历,不管你填多少内容,它会自动调整排版、字号、间距,永远只占一页不会溢出到第二页。 三、“架构变革才能实现最大性能提升”,Pretext有两种使用场景 传统网页测文字大小、位置,要频繁读DOM,非常慢还会卡,同时这类尺寸测量还必须进行批量处理,这会破坏UI组件边界独立的编程模型。 Pretext方案不靠DOM测量,会先对文本进行布局,再通过getBoundingClientRect粗略读取尺寸信息。Cheng Lou认为,最大的性能提升,永远来自架构层面的变革。 在开源项目主页,Pretext有两种使用场景: 首先是在完全不接触DOM的前提下,测量一段文本的高度。 prepare负责执行一次性工作:规范化空白字符、文本分段、应用连字规则,并通过Canvas测量各文本片段尺寸,最后返回一个不透明句柄;layout是后续开销极低的热点路径:仅基于缓存的宽度做纯数值计算;避免对相同文本和配置重复调用prepare,否则会失去预计算的意义,例如窗口大小改变时,只需重新执行layout即可。 其次是自行手动对段落进行分行排版。 将prepare替换为prepareWithSegments,然后执行以下操作: 结语:Pretext或成下一代UI关键基础设施 Pretext开源将前端文本测量与布局,从浏览器DOM的传统方案升级为一套可预测、可缓存、高性能的方案,或为高性能、动态、AI原生的下一代UI设计扫清障碍。 基于这一方案,其将UI前端渲染的文本尺寸变成纯计算结果,AI可以提前精确知道每段文字的大小、换行、位置,未来AI或许只需调用简单接口就能实现专业级排版,大幅降低AI生成高质量UI的难度。
9家新势力月销超2万!零跑5万理想4万,14大车企月销交卷
国内车市开始回温,比亚迪重夺销冠。 作者 | 郭月 编辑 | 志豪 仅3家销量下滑!国内14家车企3月销量战报出炉。 车东西4月1日消息,就在刚刚,14家车企公布了2026年3月销量成绩单,整体涨势明显。 从当前已有数据来看,3月交付量超2万台的新势力车企有9家,而今年2月份仅有4家,其中3月交付量环比增长达到7成以上的有零跑、蔚来集团、深蓝、奕派、赛力斯、小鹏、岚图、智己。 这其中,3月新势力交付量冠军零跑实现了今年以来的最好成绩,月交付超5万台,比上个月多卖了2万台。 理想也直接冲上了4万台,拿下新势力3月交付量第二名,从销量阴霾中恢复过来,同环比均实现增长。 小米汽车3月交付量超过2万台,同2月份交付量相比整体变化不大,新一代SU7首周交付超7000台。 截至发文时间,鸿蒙智行及问界汽车并未公布销量数据,不过赛力斯公布了旗下新能源销量数据,赛力斯新能源汽车3月销量为2.27万台,同比增长21%,旗下销量主力问界仍处于车型切换淡季。 民营车企三强方面,比亚迪3月销量为30.02万辆,同比下滑20%,环比增长58%,这里面出口接近12万辆,同比增长65%。 吉利3月销量达到23.3万辆,同比变化不大,环比增长13%。长城汽车2026年3月共销售新车10.62万辆,同比增长8%,环比增长46%。 整体来看,这14家车企环比大多实现增长,仅比亚迪、小鹏、小米同比略有下滑,后续市场表现值得期待。 ▲国内部分车企2026年3月销量 01. 零跑5万、理想4万 蔚来小鹏加码新车战 11家新势力车企月销战报出炉。 按照新势力车企月销排行从高到低来看,零跑汽车3月交付量为5.00万台,同比增长35%,相较2月的2.81万台交付量,环比增长78%,多卖了超2万台。 ▲零跑汽车2026年3月交付量 零跑3月销量暴涨,主要得益于现有车型的持续增量。 ▲零跑A10 不过,值得注意的是,零跑今年的销量目标是100万台,而今年一季度,零跑汽车累计销量刚刚突破11万台,今年剩下时间零跑面临的销售压力可能会很大。 在公布3月销售捷报的同时,零跑官方再次预热,D19将在4月16日上市。再加上A系列新车逐步铺开及B、C系列车型改款,多款车型有望助推零跑销量创新高。 理想3月交付4.11万台,同比增长12%,环比增长56%,从销量阵痛中恢复过来,在3月新势力车企交付量中排在第二位。 ▲理想汽车2026年3月交付量 理想销量回升一方面得益于理想i6的产能瓶颈在春节后彻底解决,交付量持续攀升,3月超过2.4万辆;另一方面也得益于理想i8订单量的稳步增长,3月环比提升超过100%。 这也让理想汽车在3月份没有新车发布且处于产品换代过渡期的情况下,仍实现超4万辆的交付成绩,显示出较强的产品力与终端运营能力。 蔚来集团也传出捷报,2026年3月交付新车3.55万台,同比增长136%,环比增长71%。 ▲蔚来汽车2026年3月交付量 其中,蔚来品牌交付新车2.25万台,同比增长120%,环比增长48%。 蔚来集团3月销量同比增长明显,主要原因是蔚来ES8的热销。当前,蔚来全新ES8完成第8万台累计交付,历时181天,连续三个月拿下大型SUV销量冠军。 ▲蔚来全新ES8 乐道和firefly萤火虫表现也可圈可点。乐道品牌3月交付新车6877台,同比增长43%,环比增长131%;firefly萤火虫品牌3月交付新车6119台,环比增长130%。 在此基础上,蔚来集团今日官宣,将进入密集的新品发布阶段。 ▲蔚来官宣新车发布时间 新款ES6、EC6、ET5、ET5T将于4月2日上市,对比蔚来ES8的定位及降价走量策略来看,蔚来即将改款的这4款车型售价无疑会更加亲民,承担更多走量重任。 此外,乐道L90 2026款将在4月下旬发布,蔚来ES9、乐道L80、萤火虫改款车型也在路上了。 小米汽车依旧延续了保守风格,未公布具体交付量数字,仅官宣3月交付量也超过了2万台,相较今年2月份同样超2万台的交付量,保持了相对稳定。 ▲小米汽车2026年3月交付量 值得注意的是,新一代SU7于3月19日正式发布、3月23日开启交付,交付首周即实现交付超7000台。 ▲新一代SU7首周交付超7000台 虽然看起来小米汽车3月销量未大幅攀升,但根据业内多个口径消息,截至今年3月小米新一代SU7或备产1.6万辆,雷军也确认,新车上市前已提前两个月开始备产,产能策略上或有倾斜。 而根据此前公开报道,今年下半年小米或发布3款增程车型,并且还有两款车型(或包括小米SU7加长版)或将年内上市,多款新车有望助力小米冲刺55万台年销量目标。 小鹏汽车2026年3月共交付2.74万辆,同比下滑17%,环比增长80%,3月销量环比增长,或与一车双能车型销量与市场需求提升有关。 ▲小鹏汽车2026年3月交付量 小鹏在3月19日正式推送了第二代VLA系统,据小鹏汽车董事长及 CEO何小鹏透露,第二代VLA带动门店试驾量环比翻倍,搭载该系统的Ultra及Ultra SE高端车型销量占比提升超一倍。 就在4月2日,也就是明天,小鹏旗下销量担当MONA M03即将改款上市,有望进一步带动销量增长。 岚图3月交付1.50万辆,同比增长50%,环比增长80%,销量增长与3月岚图连续推出多款战略车型有关。 今年3月,岚图旗下高端MPV梦想家达成20万辆下线里程碑并推出冠军版;旗舰SUV岚图泰山Ultra量产交付,还同步推出了黑武士版本,而岚图泰山X8也在当月首发,或将在4月上市。 ▲岚图汽车2026年3月交付量 根据规划,岚图今年还会带来代号为“FE”的全新FUV、代号为“珠峰”的50万级MPV,可以预见今年车市竞争依然激烈。 除了以上新势力车企外,昊铂埃安、深蓝、奕派表现同样亮眼,3月分别交付3.83万台、3.17万台、2.75万台,环比增长62%、88%、90%,智己3月交付7187辆,逐渐重回正轨。 ▲深蓝汽车2026年3月交付量 02. 结语:4月车市竞争将更激烈 总的来说,刚刚过去的3月份虽然仍处于国内车市销售淡季,但国内大多车企都从今年前两个月的销量颓势中恢复,环比呈现不同程度的增长。 随着4月份2026年北京车展的到来,大批新车即将上市,国内汽车销售局面有望扭转。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。