EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列
阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列:改进混合注意力机制、高稀疏度MoE结构 IT之家 9 月 12 日消息,阿里云通义团队今日宣布推出其下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型(Instruct 与 Thinking)。 通义团队表示,Context Length Scaling 和 Total Parameter Scaling 是未来大模型发展的两大趋势,为了进一步提升模型在长上下文和大规模总参数下的训练和推理效率,他们设计了全新的 Qwen3-Next 的模型结构。 该结构相比 Qwen3 的 MoE 模型结构,进行了以下核心改进:混合注意力机制、高稀疏度 MoE 结构、一系列训练稳定友好的优化,以及提升推理效率的多 token 预测机制。 基于 Qwen3-Next 的模型结构,通义团队训练了 Qwen3-Next-80B-A3B-Base 模型,该模型拥有 800 亿参数(仅激活 30 亿参数)、3B 激活的超稀疏 MoE 架构(512 专家,路由 10 个 + 1 共享),结合 Hybrid Attention(Gated DeltaNet + Gated Attention)与多 Token 预测(MTP)。 IT之家从官方获悉,该 Base 模型实现了与 Qwen3-32B dense 模型相近甚至略好的性能,而它的训练成本仅为 Qwen3-32B 的十分之一不到,在 32k 以上的上下文下的推理吞吐则是 Qwen3-32B 的十倍以上,实现了极致的训练和推理性价比。 该模型原生支持 262K 上下文,官方称可外推至约 101 万 tokens。据介绍,Instruct 版在若干评测中接近 Qwen3-235B,Thinking 版在部分推理任务上超过 Gemini-2.5-Flash-Thinking。 据介绍,其突破点在于同时实现了大规模参数容量、低激活开销、长上下文处理与并行推理加速,在同类架构中具有一定代表性。 模型权重已在 Hugging Face 以 Apache-2.0 许可发布,并可通过 Transformers、SGLang、vLLM 等框架部署;第三方平台 OpenRouter 亦已上线。
“严重损害特斯拉使命”,特斯拉工程师离职怒喷马斯克
马斯克 凤凰网科技讯 北京时间9月12日,据彭博社报道,一名负责特斯拉欧洲能源交易算法的工程师表示,他将离职,原因是他认为CEO埃隆·马斯克(Elon Musk)的领导力“严重受损”。 这位工程师名叫乔治奥·巴莱斯特里耶(Giorgio Balestrieri),在特斯拉能源交易平台Autobidder工作。周四,他在领英上发帖称,在特斯拉工作八年后,他决定离职,原因是“我认为马斯克对特斯拉的使命(和多个国家的民主制度健康)造成了巨大损害”。 “这不仅仅是政治立场问题,还涉及对公众撒谎、操控舆论、针对少数群体,以及支持气候变化怀疑论者,与石油天然气行业结盟的政治力量。”巴莱斯特里耶在帖子中表示。 巴莱斯特里耶怒喷马斯克 去年,马斯克投入3亿美元帮助美国总统特朗普竞选,这位亿万富翁一度是特朗普最亲近的盟友之一。但两人在公众场合反目,给马斯克的商业利益造成了影响。今年7月,特斯拉指出,特朗普取消电动汽车补贴和提高进口关税的政策,成为其汽车制造和能源业务的两大阻力。 巴莱斯特里耶在领英帖子中称,特朗普政府为扶持化石燃料行业而对风能、太阳能进行打压。 “当前美国政府正在放缓能源转型进程,这是无可争辩的事实。遗憾的是,如果我们想避免气候变化带来的最严重后果,转型速度至关重要。”他表示。 截至发稿,特斯拉尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
史上最薄iPhone Air会被掰弯吗?苹果用实测回应耐用性质疑
IT之家 9 月 12 日消息,在苹果“前方超燃”秋季主题活动结束后,苹果营销主管 Greg Joswiak 和硬件工程主管 John Ternus 接受科技媒体 Tom's Hardware 的 Mark Spoonauer 采访,期间讨论了苹果 iPhone Air,并邀请 Spoonauer 现场尝试掰弯,以此来展示 iPhone Air 的耐用性。 苹果于北京时间 2025 年 9 月 10 日推出 iPhone Air,这款手机厚度仅 5.6 毫米,刷新了苹果最薄机型纪录,售价 7999 元起。 256GB:7999 元起 512GB:9999 元起 1TB:11999 元起 外观极致纤薄,让人联想到 2014 年因易弯曲引发“弯曲门”的 iPhone 6 Plus。不过,苹果强调此次在材料与结构上大幅加强,以避免重蹈覆辙。IT之家附上媒体采访视频如下: iPhone Air 采用五级钛合金一体成型机身,去除了传统接缝与连接点,减少结构弱点。屏幕使用更坚固的 Ceramic Shield 2,并具备 IP68 级防水防尘性能。 苹果营销主管 Greg Joswiak 在节目中直接将手机抛向对面,并邀请记者尝试弯折,结果手机轻微弯曲后迅速恢复,毫发无损。 图源:来自视频截图 两位高管解释,这款手机在受力时会允许有限度的弹性形变,并立即回弹,这种设计理念源自 2008 年 MacBook Air 的一体成型工艺,高管表示将该技术应用到仅 5.6 毫米厚的智能手机上,制造难度更高,但能显著提升手感和强度。 针对电池安全性,Ternus 表示苹果为 iPhone Air 的锂电池加装了金属外壳,让电池也成为机身结构的一部分,能抵御弯折时的潜在风险,这一额外保护旨在消除消费者对“更薄等于更脆弱”的担忧。 苹果高管承认社交媒体上已有调侃与质疑,但相信 iPhone Air 可承受日常口袋压力、跌落及偶尔的过度弯曲测试。
威马要复活了?其实不太可能
威马可能要复活了,但威马复活其实不太可能 兄弟们,还记得当年那个名叫威马的新势力车企吗? 在大伙都以为它的坟头草已经两米高的时候,威马竟然套上了复活甲,开始准备原地复活了! 就在上周六,威马在自家的公众号上更新了一条推文,叫 《 致供应商白皮书 》。虽说标题多少有点语病,但哥们上次更新还是倒闭前的车型调价,时隔两年重新开麦,那大概率就是要宣布复活了。 事实上也确实如此,推文的内容虽然齁长的,但总结起来无非就是三点:威马不仅要复活,而且动作很快,底气很足,志向也很远大! 动作快,说的是威马计划从今年 9 月份开始就恢复生产,准备靠着 EX5 和 E.5 这两台车在年底实现产销 2 万台的目标。 有底气,说的是威马这回可不是简单的复活,一方面是换了换了大股东翔飞汽车,另一方面上海和温州的政府也从很多方面给予了支持,不仅有补贴,还会优先考虑公共采购,背景嘎嘎硬。 至于目标那真的就是非常远大了,以前欠的钱该还还,以后的团队该招招,威马现在的目标,是到 2026 年产 10 万台、2028 年之前冲到 40 万台并上市、2030 年冲到 100 万台,营收 1200 亿! 最后文章以一则供应商招募结尾:大伙都来加入我们吧,前途无量啊! 要知道,现在新势力的扛把子理想,去年的销量和营收也就是 50 万台和 1400 亿左右。意思就是复活以后的威马准备用五年的时间,用两倍的销量追上理想的营收。 小文一发,也算是实锤了大半年以来各种关于威马复活的小道消息。 很多郁闷已久的威马车主也瞬间坐不住了,说卧槽这哪是复活啊,这不纯纯涅槃么!以后再也不用背负倒闭车主的名号,可以正常用车机和手机 App ,售后是不是也能恢复再也不用自己找配件和修理厂了! 然而在研究了一番以后脖子哥发现,威马的这波复活可能并不是大伙想象中华丽的咸鱼翻身,里头不仅有很多蹊跷的地方,更需要面对极其困难的挑战。 就比如说最最明显的 bug ,就是推文里头所说的销量目标。 都不说 2030 年能不能完成百万产销了,单说想靠威马 EX5 和 E.5 这两款车在今年达到两万的产销( 单车月均 2500 销量 ),难度就看比登天。 至于为啥,只要看看这俩车的配置就能知道了。 E.5 是和特斯拉毛豆 3 尺寸差不多的中型轿车,EX5 则是比毛豆 Y 还小一号的紧凑型 SUV 。俩车都是 2022 年初发布的最新款,都是主打网约车的市场,并且主力车型的定价也都在 15-20 万区间。 虽说定位和定价乍一看没啥问题,但把这两台 3 年前的车放到今天的环境里,那哥俩基本就和原始人穿越到未来没啥区别。 电池只有五十度上下,纸面续航只有四五百公里。电机都是前置的,最大马力也都只有两百匹左右( 轿车 E.5 更是只有可怜的 160 匹 )。 至于什么智驾和舒适性配置就更是沾不上边,轿车 E.5 甚至还有一个阉割了中控屏幕的车型,得要价 16 万以上。 说白了,除了砍到脚踝级别的降价,我几乎想不到它俩有任何希望达到 2500 台的月销目标。但这也给威马的成本控制提出了很高的要求,对于还在供应商招募阶段、对未来营收有很高期望的威马来说,难度真的太高。 当然,配置都是可以改的,价格也都是可以商量的。相比产品层面的落伍,我觉得这回威马背后的这个新股东,才是槽点最多的部分。 6 月份的时候南方都市报发了一篇报道,说的是深圳宝能汽车的展厅里头突然摆出了两台威马的车型( 还正好是前面提到的 EX5 和 E.5 )。 从那时开始,宝能集团要拯救威马的传闻就已经传得到处都是了。 而在上周六的推文里,威马虽然没有明面上提及宝能的名字,但里头说到的新股东翔飞汽车无论是实控人黄晶还是复杂的持股关系背后,其实指向的都是那个喜欢捣鼓破产汽车品牌的宝能集团。 算是基本坐实了之前的收购猜测。 可问题就在于,这个宝能集团虽说体量大业务多,但对汽车一直都是一副热衷但不认真的态度。 就比如大伙都知道的观致汽车,就是宝能从 2017 年开始入股在 2019 年完成收购的。在入主观致的时候,宝能也是跟今天收购威马一样意气风发,列了许多要在未来解决的问题。 比如答应了会帮供应商们解决收入少没返利的问题,会用五年时间推出将近 30 台新车解决观致竞争力低的问题,以及会用总共 8 个工厂,让观致的生产规模超过特斯拉等等。 可事实是,直到 2022 年观致拢共也就出过观致 7 这一台全新车型,说好的 8 个工厂也就只有观致原本就有的两个在运行,新工厂几乎都是刚建好文件夹。 与此同时,宝能为了在纸面上提高观致品牌销量,选择了把车大量低价的卖给了共享租车平台联动云。 这个办法虽然让观致 2018 年的销量同比翻了三番,但经销商们的利润却变得更加微薄,变得更难赚钱了。 也是因此,宝能收购观致还没两年,观致就出现了经销商车展维权、被爆大规模欠薪、工厂停产、员工大面积离职等各种 “ 倒闭症状 ”。 2022 年更是直接被山东省的汽车流通协会拉进了消费黑名单,提示人们谨慎购买观致汽车。 时至今日,观致的销量已经归零,曾经到处都有的联动云现在也几乎销声匿迹。跟当年宝能画下的大饼比起来,观致真就可以说是一地鸡毛了。 并且不止是观致,大伙可能不知道的是,在 2020 年的时候宝能还全资收购了长安标致雪铁龙也就是长安 PSA,并且把名字改成了宝能汽车。 现在咱们还能买到的雪铁龙 DS 车型,比如 DS9 和 DS7 ,车屁股上写的就是宝能汽车。 然而和之前的观致一样,按理来说收购了长安 PSA 以后,宝能理应利用上后者深圳工厂的产能或者技术,来给自己的汽车品牌 BAO 提升提升。 可结果是不仅 DS 这边的本土化车型没有任何进展,宝能的 BAO 品牌也跟当年的恒大汽车似的,新车都还只是 PPT。 好不容易把 3 年前的剁椒鱼头车型悠宝利 A3 搓出来了,也只有个工程车,甚至连招商都招不到。 也是因此,从过往的经历上看,宝能虽然对抄底快要不行的汽车品牌情有独钟,却似乎并没有经营好一个品牌需要基础和能力。 只能做到先抄底、再画饼,然后止步于此,真不能太指望它能拯救某个品牌于水火。 被宝能收购的威马,在我看来大概率也会走向观致、DS 的同款结局。 而且话说回来,即使抛开宝能集团这个车圈 “ 明灯 ” 不看,大伙觉得如今的车圈真的会有已经不行的车企咸鱼翻身,打赢复活赛重新上桌吗? 说实话,我真觉得够呛。 因为只要盘一盘它们的倒闭史就能发现,这些品牌并不是因为某一个方面做不好导致崩盘的,而是几乎就没有做对什么事情。他们中的绝大多数,都集成了产品定位不清晰、定价不合理、供应链不稳定、产能跟不上、卖车渠道不合理等种种问题。 与其说他们造不好车,不如说是他们压根就没弄清车子应该咋造咋卖,也压根扛不住更有想法、更有能力的车企们的进攻。 并且现在大伙都在说的新能源决赛圈,比拼的也早就不是倒闭车企们缺乏的基础能力了,而是谁能用更低的成本给人们带来动力、智驾、和可靠性都更强的产品。 对应的,则是更大的研发资金投入、更强的成本控制和供应链整合、以及面对实力同样可怕的对手。 只是找了新股东、有了一些资金的输入就想重新加入竞争,在我看来还远远不够。 当然,我也由衷希望宝能和威马这回能静下心来,好好把这个曾经很火的新势力车企重新盘起来。 毕竟为了解决车机不能用的问题,威马的老车主们现在都已经研究出破解车机、破解远程车控、改装 Carplay 等各种逆天方案了。 再不下场维护更新,可能真要追不上车主们的版本咯。
53岁遗孀成居然智家新主人,杨芳能否守住88亿身家?
雷达财经出品 文|丁禹 编|孟帅 一场突如其来的继承,将53岁的杨芳推上了家居龙头企业居然智家的权力之巅。 9月9日晚,居然智家发布公告称,公司实际控制人已由汪林朋变更为其配偶杨芳。通过夫妻共同财产分割和遗产继承的方式,杨芳直接及间接控制居然智家合计43.93%的股权,对应市值约88亿元(截至9月11日收盘)。 居然智家此次实际控制人变更,源于两个月前(7月27日)汪林朋的突然离世。根据公告,汪林朋的其他法定继承人均表示自愿放弃继承相关遗产,最终前述遗产均由汪林朋的遗孀杨芳一人继承。 伴随着此次公告的发布,这位刚刚从银行退休两年多的女性,如今成为了居然智家这个家居零售巨头的新任实控人。而在今年8月,王宁成功当选公司的董事长兼CEO。 尽管公司目前已平稳完成控制权与管理层的双重交接工作,但居然智家的经营困境仍未缓解,依旧处于“水深火热”之中。一方面,公司的归母净利润连年下滑,盈利能力持续承压;另一方面,公司还面临着一定的流动性风险,资金层面的压力犹存。 而受行业下行、公司业绩波动等多重因素影响,身为居然智家原掌舵者的汪林朋,其去年在《新财富杂志500创富榜》的财富较巅峰时期缩水约245亿元,今年更是直接跌出该榜单,财富缩水态势进一步恶化。 53岁遗孀成新实控人,持股最新市值约88亿 从此次发布的公告来看,居然智家的控制权交接过程十分平稳。 公告显示,在此之前,汪林朋直接持有居然智家3.72亿股股份(占总股本5.97%),同时他还直接或间接持有居然控股94.02%的股权。 北京市国信公证处出具的《公证书》((2025)京国信内民证字第4102号)显示,这些财产的一半为汪林朋的遗产。鉴于其他法定继承人均自愿放弃,全部遗产由其配偶杨芳继承。 本次权益变动完成后,杨芳合计控制居然智家27.36亿股股份,占公司总股本的43.93%。 截至9月11日收盘,居然智家的最新市值为200.51亿元。按照43.93%的持股比例计算,杨芳合计持股对应市值约88亿元。 雷达财经了解到,在居然智家8月20日举行的第十一届董事会第二十次会议上,经公司控股股东北京居然之家投资控股集团有限公司推荐,公司董事会提名和薪酬考核委员会审核,董事会同意提名杨芳为公司第十一届董事会非独立董事候选人。 随着前述公告的发布,外界也可一窥杨芳的过往履历:出生于1972年的她,现年53岁,拥有管理学学士学历。 此前,杨芳的职业生涯主要集中在金融行业,曾任职于全国华联商厦联合有限公司、中商股份有限公司和兴业银行股份有限公司,并于2022年4月从兴业银行北京丰台支行退休。 另据天眼查信息,杨芳目前在4家公司担任高管,分别是北京居然传世文化艺术发展有限公司、北京居然之家投资控股集团有限公司、北京中天基业商业管理有限公司和北京华联综艺广告有限公司,而这四家公司均与居然智家或汪林朋深度绑定。 值得一提的是,在杨芳成为公司的新实控人之前,居然智家已完成了管理层的过渡调整。在8月20日的第十一届董事会第二十次会议上,公司选举王宁担任董事长兼CEO。 据了解,王宁生于1972年,现年53岁,拥有博士研究生学历。1999年,王宁加入北京居然之家投资控股集团有限公司,后续他从公司基层门店副总经理一路成长为公司董事、执行总裁,再到如今成为公司的新任掌舵人董事长兼CEO。 据媒体报道,王宁上任后不久便对外公开表示,“居然智家”的名称将重新改回“居然之家”。去年12月,公司刚从居然之家更名而来,但王宁认为,“对消费者来说,居然之家代表了更多的市场信任,当前重塑信任至关重要。” 据了解,王宁本人一向保持务实风格,他曾在朋友圈表示“要里子不要面子”。上任后,王宁正积极推进公司国际化布局,目前居然智家正在筹备马来西亚吉隆坡店,相关业务也在孟加拉达卡中国城、越南河内、哈萨克斯坦等地快速落地。 上半年增收不增利,面临一定流动性风险 居然智家经历前述一系列调整的背后,公司近年来的业绩正面临着严峻的挑战。 同花顺iFinD数据显示,2022年至2024年,居然智家的营收规模基本维持在130亿元上下。 但自2022年起,公司的归母净利润已经连续三年下滑,从2022年的16.48亿元直接腰斩至2024年的7.69亿元,盈利规模下降超五成。 据居然智家最新披露的半年报,今年上半年,公司实现营收64.45亿元,同比增加1.54%;但归母净利润同比再度骤降45.52%,仅有3.28亿元。 面对增收不增利的窘境,居然智家在财报中解释称,净利润下降主要受国内经济形势波动和房地产市场周期性影响,家居建材市场存量竞争加剧。为支持商户持续经营,公司给予优质商户部分租金及管理费减免,导致租赁及管理业务收入出现阶段性下降。 雷达财经了解到,居然智家绝大部分的营收主要依赖传统的租赁及加盟管理业务(上半年营收占比为40.34%)和新兴的商品销售(上半年营收占比为56.34%)两大板块。 从公司营收结构的变化趋势不难看出,居然智家近年来似乎正有意识地向商品销售方向调整业务重心。 居然智家两大主要业务营收占比示意图(数据来源:公司财报) 去年,居然智家的商品销售业务首次以48.77%的占比,超越租赁及加盟管理业务46.06%的占比,成为公司的第一大营收来源。今年上半年,公司商品销售业务的营收占比延续了这一态势。 然而,居然智家愈发倚重的商品销售业务,却在毛利率方面面临不小的挑战。同花顺iFind数据显示,近年来,公司商品销售业务的毛利率飞速下跌,从2020年的31.25%一路下滑至去年的7.59%,并在今年上半年进一步降至6.16%。 与之形成鲜明对比的是,居然智家的租赁及加盟管理业务,上半年的毛利率高达47.24%,这意味着从利润贡献维度来看,居然智家目前仍较为依赖传统租赁及加盟管理业务的高毛利支撑,公司近年来向商品销售方向推进的营收结构转型,反而短期内在一定程度上限制了公司的盈利能力。 更为严峻的是,居然智家当前的资金状况并不是十分乐观。截至上半年末,公司的流动资产为48.74亿元,同比减少25.69%;期末的现金及现金等价物余额为11.03亿元,同比减少55.94%。 与此同时,公司的流动负债合计88亿元,短期借款为14.05亿元,一年内到期的非流动负债达27.26亿元,短期资金缺口较大,现有资金无法覆盖短期负债,公司面临着一定的流动性风险。 灵魂人物跳楼身故,百亿家居帝国何去何从? 身为居然智家创始人、前掌舵者的汪林朋,1968年出生于湖北黄冈。1990年,汪林朋从北京工商大学会计系毕业后,进入原国家商业部财会司开启职业生涯。 1999年,汪林朋临危受命接管了当时风雨飘摇的北京居然装饰城。当时的居然之家,是一家经营困难的国有控股企业。2001年,国企改制盛行,汪林朋主导完成了对北京居然之家投资控股集团有限公司的改制工作。 此后,凭借在家居建材界率先提出的“先行赔付”理念,汪林朋成功帮助居然之家奠定了在北京市场的行业标杆地位。 在北京市场站稳脚跟后,汪林朋的视野随即投向更广阔的全国市场。2002年冬天,在一次内部高管会议上,汪林朋与核心团队秘密制定了全国连锁发展战略。 2005年,在完成京城从1店到4店的布局后,居然之家果断跨出北京,首站挺进太原,开启了波澜壮阔的全国化之路。此后的岁月,汪林朋以其非凡的战略眼光和执行力,推动居然之家一路高歌猛进。 雷达财经从居然智家披露的中报获悉,截至上半年末,公司在国内30个省、区、市及海外经营399家家居卖场,包含76家直营卖场及323家加盟卖场。 2019年,伴随着上市钟声的响起,居然智家通过借壳武汉中商的方式,成功叩开资本市场的大门,完成A股上市布局。 公司登陆资本市场后,汪林朋逐渐迎来个人财富的巅峰时刻。据《新财富杂志500创富榜》,2020年,汪林朋的身家创下350.5亿元的最高纪录,位居当年总榜第62位。 然而,巅峰之后的居然智家,很快迎来发展低谷。受家居行业整体下行周期等多重因素影响,公司净利润连续多年呈现下滑态势,叠加流动性风险持续加剧,其股价也随之进入下行通道,经营压力逐步显现。 企业经营承压的连锁反应,也直接体现在创始人汪林朋的身家变化上。据《新财富杂志500创富榜》,汪林朋的身家于2024年跌至105.4亿元,较巅峰时期缩水约245亿元。今年,汪林朋的名字甚至直接从该榜单中消失。 值得一提的是,今年4月,公司披露的一纸留置公告,更是揭开了汪林朋最后的“体面”。尽管7月23日武汉市江汉区监察委员会解除对汪林朋的留置措施,变更为责令候查措施,但仅仅四天后,汪林朋却选择跳楼结束了自己的生命。 当汪林朋纵身跃下时,他留下的居然智家正深陷泥潭。如今,汪林朋的遗孀杨芳成为居然智家的新实控人,新任董事长、CEO王宁也走马上任,未来居然智家将驶向何处?雷达财经将持续关注。
英伟达最强AI芯片Blackwell Ultra GB300:性能较GB200快50%
IT之家 8 月 25 日消息,英伟达于 8 月 22 日发布博文,深入分析了其最快 AI 芯片 Blackwell Ultra GB300,比上一代 GB200 性能提升 50%。 该芯片采用双光罩(Reticle)设计、2080 亿晶体管、2 万个 CUDA 核心,并配备 288GB HBM3e 显存,带宽达 8TB/s。 GB300 采用双光罩(IT之家注:芯片光刻时单次曝光的最大尺寸单位,双光罩设计指通过互连技术将两颗大芯片作为一体运行)大芯片设计,通过 NV-HBI 高速互连将两颗芯片以 10TB/s 带宽连接为单颗 GPU。 该芯片基于台积电 4NP 工艺制造,集成 2080 亿晶体管,拥有 160 个 SM 单元,每个 SM 共有 128 个 CUDA 内核,总计 20480 个 CUDA 核心与 640 个第五代 Tensor 核心,并具备 40MB TMEM。 在存储方面,GB300 配备 288GB HBM3e 显存,带宽达 8TB/s,较 GB200 的 192GB 大幅提升,8 组堆叠显存通过 8192-bit 位宽连接,可容纳 3000 亿以上参数模型,支持更长的上下文长度及更高计算效率。 互连方面,Blackwell Ultra 支持第五代 NVLink,实现每 GPU 1.8TB/s 双向带宽,最多支持 576 GPU 互连;PCIe Gen6 接口提供 256GB/s 带宽,并支持与 Grace CPU 的 NVLink-C2C 协同。企业特性还包括多实例 GPU(MIG)分区、安全计算和 AI 预测运维功能。 在系统层面,Grace Blackwell Ultra 超级芯片将一颗 Grace CPU 直连两颗 GPU,构成 GB300 NVL72 机架系统,峰值算力可达 1.1 EFLOPS FP4。 安全与管理方面,GB300 搭载升级版 GigaThread 调度引擎,支持多实例 GPU(MIG)灵活分配显存资源,并引入机密计算与 TEE-I/O 特性保障 AI 模型与数据安全。
AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底
编译 | 程茜 编辑 | 李水青 智东西8月25日消息,今日,前特斯拉AI总监、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)放出了AI辅助编程的私藏独家秘籍。 ▲安德烈·卡帕西部分推文截图 他的AI辅助编程不再集中于一个工具,而是“雇佣”了多个工具按需分配岗位。 总结来看,卡帕西使用AI辅助编程可分为4个阶段,75%使用Cursor编辑器自动补全代码功能,其次使用大模型修改某段具体代码,第三层使用Claude Code、Codex等独立AI编程工具,实现较大功能模块;最后使用GPT-5 Pro解决最难的问题,他将GPT-5 Pro称为“最后一道防线”。 ▲安德烈·卡帕西AI辅助编程流程图 这是因为,当下,开发者无法基于单一编程工具满足所有开发需求,且这些工具擅长的点各有不同,包括Cursor编辑器善于自动补全代码,但需频繁重启;独立AI编程工具可以针对开发者不了解内容编程,但需要定期清理代码、调整风格、处理代码审美等;GPT-5 Pro则能处理最难的问题,10分钟分析出人类、Cursor、Claude Code都找不到的隐蔽bug。 从卡帕西分享的AI编程工作流可以看出,目前的AI编程工具各有优劣,开发者会通过拼接使用实现高效辅助编程。 一、Cursor是主力、独立AI编程工具辅助、GPT-5 Pro解决最难问题 卡帕西在推文中提到的具体工作流程如下: 他使用大模型辅助编程的流程中,有75%都用于在Cursor编辑器中通过Tab键触发的自动补全代码功能。 这是因为,卡帕西发现自己在代码的正确位置写下具体的代码片段或注释,是向大模型传递“任务需求”的高效方式,也就是说,关键在于精准传递任务细节。如果用文字描述其想要实现的效果,不仅需要大量表述,还会产生明显延迟;而直接在代码里、在正确位置演示需求,速度则快得多。 但偶尔,这一自动补全功能需要他进行频繁开启、关闭才会变得好用。 ▲卡帕西使用Cursor编辑器的推文描述 第二层用法是:卡帕西会选中一段具体的代码,要求大语言模型对其进行某种修改。 ▲卡帕西使用大模型修改代码的推文描述 第三层用法是,他会在Cursor编辑器之外,运行Claude Code、Codex等独立的AI编程工具。这种情况一般是,他遇到需要实现较大功能模块,且用提示词比较容易说清需求的场景。 对于这些工具的评价,卡帕西说,这些工具确实帮了大忙,但整体用下来体验有好有坏,偶尔还会让人有点烦。他不会使用“无需每一步确认模式”(YOLO mode),因为这些工具很容易跑偏,写出他根本不想要、也不需要的冗余内容,所以经常需要按ESC键中断生成。 卡帕西吐槽说,他还没学会同时用多个工具来提升效率,因为单是用好一个,就已经够费劲了。 其中的问题包括,他无法高效实现CLAUDE.md文档的维护、更新,必须经常花时间做“代码清理”、调整代码风格或者处理“代码审美”相关问题。 比如,这些AI工具写代码时防御性过强,会滥用try/catch语句;把抽象逻辑搞复杂;把代码写得臃肿冗余,很多时候用列表推导式或者一行if-else就能解决的问题,偏要写嵌套的if-else结构;重复写好几段相似代码,没有将其封装成一个简洁的辅助函数。 这些就证明AI工具没有“代码审美”的概念。 但卡帕西提到,在某些场景下,这些工具又必不可少:比如当他需要Vibe Coding(氛围编程),且对相关领域不太熟悉的时候。他提到像他最近写Rust代码、写SQL命令,或是其他平时很少接触的内容时,这些AI编程工具就能派上大用场。 他还试过让Claude Code在写代码的同时教他一些知识,但这个工具满脑子就只想写代码,不愿意花时间在过程中解释任何内容。他之前还让Claude Code帮忙做超参数调优,结果过程特别有意思,但效果并不好。 卡帕西还提到一些场景,这些工具的作用也十分突出,比如需要各种低风险一次性的自定义可视化图表、小工具或调试代码。因为这些工具过于浪费时间。他举了一个例子,为了定位某个特定bug,Claude Code能快速写出1000行专门的可视化代码或调试代码,找到bug后就可以全部删掉这些代码。 他认为,现在已经是代码过剩时代,开发者完全可以先写出成千上万行高度定制化、用完即弃的代码,代码早已不是那种“写出来就很珍贵、成本很高”的东西了。 ▲卡帕西使用独立AI编程工具的推文描述 最后一道防线是GPT-5 Pro。卡帕西称,他会在遇到最难解决的问题时用到它。 他提到,有很多次,他本人、Cursor编辑器、Claude Code都卡在一个bug上且10分钟都没进展,而当他把完整代码复制粘贴给GPT-5 Pro后,它花了10分钟分析,然后就找出了非常隐蔽的bug。卡帕西认为,GPT-5 Pro的能力确实很强,还能检索到各种生僻的文档、学术论文之类的资料。 对于GPT-5 Pro的其他用途,卡帕西称也会用它处理其他更复杂的任务,比如让它给代码抽象逻辑的优化提建议,但效果有好有坏,有时候能给出不错的想法,但不是所有建议都有用;或者让它围绕“某个技术的实现方法”做一次完整的文献调研,它最后会返回相关度很高的参考资料和信息来源。 总之,卡帕西认为,在众多各有优劣的工具加持下,编程领域的可能性被完全打开了。不过,这也让人很容易产生一种焦虑感,担心自己没能跟上行业集体能达到的前沿水平。也正因为如此,才有了这周日洗澡时突然冒出来的一堆想法,同时我也特别好奇,其他人在实践中都有哪些发现。 ▲卡帕西使用GPT-5 Pro的推文描述 二、开发者拼接编程工具,评论区为卡帕西提建议 评论区很多网友对卡帕西的工作流程表示认同,他们提到,部分工具可能有所不同,但基本都选择了拼接不同AI工作辅助编程的策略。 在评论区还有不少网友为卡帕西遇到的问题提建议:比如打造Context Engineer的Agent,帮助开发者更新Claude.md,或者为了避免Claude Code反复跑偏,要求它提供详细但简洁的问题总结,交给Grok解决;或者尝试语音转录说出指令等。 结语:开发者靠工具拼接实现高效辅助编程 越来越多的开发者使用AI工具更高效便捷编写代码,具体用例包括自动补全代码行、修复代码错误和测试代码等。 但在实际体验中,AI编程工具会面临编写错误、代码冗余等情况。从卡帕西分享的AI辅助编程流程以及评论区网友的互动可以看出,在AI编程工具发展尚处于初期,无法基于单一工具满足用户需求的情况下,开发者正通过拼接不同工具,发挥其在不同编程环节的优势,以实现高效、准确的辅助编程。
最便宜的华为车来了!尚界 H5 预售价 16.98 万元,还有问界 M8 纯电版
今年上海车展前夕,华为乾崑召集了 11 位合作车企的高管,举办了一场信息量巨大的发布会。在长达两小时的发布会里,外界期待已久的 ADS 4 正式揭开面纱。 一直以来,华为 ADS 的每一次迭代,都会被放在放大镜下审视,这次自然也不例外。更何况,当下的时间点十分微妙,行业对 L2 级辅助驾驶的宣传正在收紧,L3 又还差临门一脚。 在这样的十字路口,所有人都在看着华为怎么做、怎么说。 而他们的做法是,将技术进一步下放,用规模换取数据和迭代速度——把一套领先的辅助驾驶系统,覆盖到更主流的 15 万元级车型上,最终用庞大的用户基数和真实的道路里程来证明自己。 所以今天,不只是问界和智界,连 15 万元级的尚界也来了。 问界 M8,冲向高端纯电 问界亮出的第一张关键牌,便是首次亮相的 M8 纯电版。它承载着整个鸿蒙智行向上突破的野心。 作为一款全尺寸 SUV,M8 的车长接近 5.2 米,车宽 2 米,轴距超过 3.1 米。在设计上,它没有为了追求低风阻而采用溜背造型,而是保留了余承东所说的「高头大马」式的端正车身,以此保证了内部乘员舱的可用空间。 即便如此,通过在设计之初就定下的严苛目标,M8 依然做出了 0.255Cd 的低风阻系数,远低于尺寸相近的传统豪华 SUV。 余承东在发布会上强调:「在保持车高大威猛的情况下,还能实现这样的低风阻,是非常不容易的。」 庞大的身躯不仅带来了更强大的气场,也赋予了它出色的通过性。余承东表示,M8 纯电版 700mm 的涉水深度和最高 220mm 的离地间隙,超过了奔驰 GLS 等 SUV 车型。 进入车内,M8 的核心卖点是「舒适」。 余承东称,无论是五座还是六座版本,车内的每一位乘客都能得到很好的照顾。全系标配的「舒云座椅」,采用 Nappa 真皮和 10 层回弹海绵,提供了不错的支撑和包裹感。 尤其值得一提的是第三排,问界 M8 在这里做出了 960mm 的头部空间——相当于普通紧凑型 SUV 的后排,成年人也能舒适乘坐。 「1.8 米的高个子坐进去,头部仍然有很大的空间」。余承东说。 同时,出色的整车 NVH,让车辆在 120km/h 高速行驶时,车内噪音依然能维持在 60.8dBA,比一些百万级的竞品更安静。 储物方面,M8 同样毫不吝啬。 一个 149L 的智能电动前备箱,支持手势、语音、双击等多种开启方式,取物时车身还能自动降低。五座版的后备箱空间超过 1000L,地板下方还有 110L 的暗格;而更难得的是六座版,在坐满三排的情况下,后备箱容积也接近 400L,可以轻松装下六个人的随行行李。 一个 149L 的智能电动前备箱,加上五座版下高达 1086L 的后备箱空间,足以应对全家出行的装载需求。 而更难得的是六座版,在坐满三排的情况下,后备箱容积也接近 400L,可以轻松装下六个人的随行行李。 当然,作为华为深度赋能的产品,M8 的核心技术才是其真正的护城河。它基于全新的高压纯电平台打造,采用了前双叉臂、后五连杆的独立悬挂,并配备了双腔空气悬架和 CDC 连续可变阻尼减震器。 与此同时,在华为途灵平台的加持下,「猫头鹰极致转向」功能让这台大车的转弯半径仅为 5.75m。 动力上,M8 首发了华为 DriveONE 高压七合一电驱,CLTC 效率高达 92.2%,并标配了基于 800V 平台的宁德时代 100 度电池包。 这套高效的三电系统,为 M8 带来了最高 705km 的 CLTC 续航里程。 余承东还称,这是一个比较「谦虚」的数字,因为 M8 的续航达成率非常高,实测普遍在 82% 以上。在补能方面,充电 15 分钟即可从 30% 补充至 80%。 为了给纯电出行提供保障,问界在制造和补能网络两方面都做了充足的准备。赛力斯汽车总裁何利扬在发布会上介绍,问界联合宁德时代开创了「厂中厂」的合作模式,从源头保证高端电池的研发、生产与供应。 而在用户端,问界计划在未来三年,通过自建、合建等方式,在全国高速服务区、高频生活区以及经典自驾路线上,建设超过 4000 座充电站,以解决用户的补能焦虑。 最后是价格: 问界 M8 纯电 Max+ 长续航版:大五座 35.98 万元,享六座 37.98 万元; 问界 M8 纯电 Max+ 四驱版:大五座 37.98 万元,享六座 39.98 万元; 问界 M8 纯电 Ultra 四驱版:大五座 42.98 万元,享六座 44.98 万元。 增配降价,智界 R7/S7 同步进化 智界新款这次的价格相当有诚意,概括起来就是增配降价。 智界 R7,纯电版和增程同价,Max 版 24.98 万元、Max+版 26.98 万元、Ultra 版 30.98 万元。 智界 S7,全系纯电,Max 版 22.98 万元,Max+ 版 24.98 万元,Ultra 版 28.98 万元。 新款智界 R7 整体延续现款车型设计,其长宽高分别为 4982/1981/1634mm,轴距为 2950mm,采用 5 座布局。 细节部分,新车在前机盖中央和轮毂中央换装了全新样式的品牌徽标,对前大灯组进行微调,增加了类似矩阵式灯芯的装饰件。配色上新增了一款「极光绿」外观色,同时还提供深空灰、鎏金黑、陶瓷白三款免费颜色,以及幻影紫、晴光蓝、碧波青、暖星云和大都会红五款选装颜色,整体均以年轻运动为主。 车身侧面和尾部变化不大,提供了包括 21 英寸多辐式熏黑轮毂、黑色后视镜、黑色车窗装饰条、黑色尾翼、黑色尾部标识等的黑曜套件选装包。 智界 R7 内饰在设计方面做了简单调整,增加了双拼内饰色可选,中控台下方区域的中央杯架盖板和车门饰板处将采用官方称之为「凝光贝母」的工艺打造,在阳光下可以反射出独特光泽。 智界 R7 升级到了 16.1 英寸的全新空中屏、带按摩、加热以及通风的主副驾双零重力座椅,后排的乘坐空间有所增加,腿部空间来到了 956mm,头部空间也超过 1000mm。新车也将全系标配电动遮阳帘、 21 扬声器音响、智能冷暖箱和车外控车功能。 在辅助驾驶方面,新款智界 R7/S7 将全系搭载华为 ADS 4 辅助驾驶系统,标配 192 线激光雷达、后向高精度固态激光雷达、4D 毫米波雷达和 ADS 小蓝灯,可实现高速/城区领航辅助驾驶、智能泊车、全向防碰撞预警系统等功能,具备更强的主动安全性能。 并且智界老车主将可以从今年 9 月份开始陆续升级到华为 ADS 4。 在华为途灵底盘的加持下,智界 R7 将拥有更好的动态转向辅助,驾驶时更顺,转向时更稳,并可以做到在 120km/h 高速行驶爆胎时的车身稳定控制。 R7 的升级功能都将在智界 S7 上同步更新,并免费赠送外观运动套件。 新款智界 R7 将继续提供增程版和纯电版可选,增程版搭载奇瑞第五代 1.5T 增程动力系统,最大功率为 115 千瓦,后驱版搭载最大功率 200 千瓦驱动电机,百公里加速 7.4 秒,新车有容量为 37 千瓦时和 53.4 千瓦时的两种电池组可选,CLTC 纯电续航分别为 251km 和 360km,馈电油耗为 5.68L/100km,综合续航超 1600km。 增程四驱版车型系统综合功率为 365 千瓦,综合扭矩为 679 牛·米,百公里加速 4.9 秒,匹配,电池组容量为 53.4 千瓦时,CLTC 纯电续航 331km,CLTC 综合续航里程可达 1673 公里。 R7 纯电版车型,同样有后驱版和四驱版可选,后驱版电机最大功率 215 千瓦,百公里加速 5.9 秒,有 82 千瓦时和 100 千瓦时两种电池组可选,CLTC 纯电续航分别为 667km 和 802km;纯电四驱版车型系统综合功率 365 千瓦,百公里加速 3.9 秒,电池容量为 100 千瓦时,CLTC 纯电续航 736km。 新款智界 S7 则全系采用纯电驱动,后驱版最大功率 215 千瓦,四驱版系统综合功率 365 千瓦,有 82 千瓦时和 100 千瓦时两种电池组可选,CLTC 纯电续航分别为 705km、855km 和 785km。 鸿蒙智行也在寻求突破 发布会的最后,余承东也正式预告了尚界 H5 将搭载华为 ADS 4、192 线激光雷达、鸿蒙座舱,将有 655km 续航的 80 度电版本和纯电续航 235km、综合续航 1360km 综合续航的增程版本。 其预售价格为 16.98 万元起。 无论是问界前所未有的展现出了对纯电车型的重视,还是智界车型贯彻「加配降价」的策略,乃至更亲民的尚界的出现,都印证了一件事—— 在问界的增程豪华智能 SUV系列销量几乎到达顶点后,鸿蒙智行正在积极探索其他新的增长点。 目前看来,问界承担着在高端纯电市场塑造用户心智,开拓新市场的任务,而智界和尚界则会进一步下沉,在 15-30 万左右的市场当中,和其他品牌贴身肉搏。这个目标能否达成,不仅决定着鸿蒙智行的销量能够突破现状再攀高峰,也会在很大程度上影响合作伙伴们对华为智选车模式的资源投入和合作信心。 ▲ 尚界 H5 今年 6 月份,鸿蒙智行全系交付 5.27 万辆,创下了单月的历史新高,其中问界占比 8 成,达到了 4.6 万辆,享界 4200 辆。智界「双 7」3500 辆。7 月份,鸿蒙智行累计交付新车 4.77 万辆,稳居新势力销量第一阵营,其中问界交付 4.07 万辆,享界 2000 辆,智界 4500 辆。 综合近半年的成绩来看,智界的销量大约占整个鸿蒙智行的 16.2% 左右,享界则约为 5%。 无论从销量上看还是从各界之间的内部竞争上看,智界和享界对于目前的现状显然都不那么满意。 智界这边,8 月 7 日奇瑞与华为签订了 2.0 版本的战略合作协议,双方宣布将围绕智界投入超百亿元、组建 5000 人研发团队,并启动产销服一体化独立运作。 这似乎在某种程度上是华为和奇瑞两家对业内一直传言的「奇瑞对智界合作三心二意」的回应。 智界的首款车型 S7 在上市时因为交付问题错过了爆发期,后面进行了多次改款都没能提振销量;R7 在去年刚刚上市时月销量一度冲到 1.6 万辆,但今年来销量也在一路下滑,在小米 YU7 上市当天,更是宣布官降 2 万元;奇瑞新车发布用智界直播间之类的问题也让很多车主相当不满。 在这次的 2.0 合作模式下,智界将从奇瑞独立出来,成为五界中唯一的的产销服一体化独立运作的品牌,拥有专属智界的设计中心,专属研发团队以及智界超级工厂和武汉用户中心。奇瑞也明确了「只控股,不指挥」的原则,让华为来主导管理与决策。 与此同时,北汽也在不断加码享界。 一方面,北汽新能源已组建了 「享界事业部」,主体包括营销中心和享界工厂。另一方面,北汽将把享界品牌研发资金定为第一优先级,并调动北汽集团渠道资源,重点覆盖一至三线城市,年内计划建成数十家享界专网用户中心。 ▲ 智界超级工厂 升级后的智界双 7 开启预定 8 小时,订单量就火速突破 20000 台,正式上市 1 小时,大定突破 5000 台,似乎在某种程度上印证了华为主导车型研发的正确性。 但后续能否在制造、交付、销售、服务上做到全流程的把控和升级,才是「五界」能否在市场的激烈竞争中站稳脚跟的关键。
“杭州六小龙”又开源了!一句话爆改空间设计,AI视频生成Agent今年发
作者 | ZeR0 编辑 | 漠影 智东西8月25日报道,AI不仅能生成文章、图像和视频,还能生成可以动的室内空间设计了! 只需用文字描述3D空间,或者上传一张户型图,你就能让AI创建出一个可交互的3D室内空间。 问客厅一共几个门,AI迅速给出答案“6扇门”。你也可以上难度,一句话让它生成适合老人居住的客厅: AI能意识到“老人居住”需要的防滑扶手以及家具摆放方式,化身虚拟室内空间设计师,直接替你把防滑扶手、桌椅、窗帘、冰箱、落地灯等都布置好了。 你还可以要求更改细节,比如加一些装饰画: 或者提出更具体的要求,例如让AI生成一个适合老人居住的卧室,并需要一个带扶手的单人床,AI会立即生成满足诉求的新布局: 让AI规划从卧室床尾到餐桌边的路径,它能直接生成动态的3D空间漫游演示: 批量生成也不在话下,比如让AI生成三口之家的客厅,然后从AI输出的多样化设计稿中尽情挑选。 对比之下,以GPT-5为代表的大语言模型,输出可视化空间布局的能力就显现局限性了。 这么好用的空间生成与编辑能力,来自“杭州六小龙”之一群核科技刚刚发布的空间语言模型SpatialLM 1.5。 以前,群核科技的代表作是全球最大空间设计软件酷家乐。如今,这家冲刺科创板“空间智能第一股”的杭州AI公司正在讲出新故事。 在今日下午的群核科技首届技术开放日上,群核科技宣布开源3D场景生成模型SpatialGen,即将开源空间语言模型SpatialLM 1.5,并首次分享基于SpatialGen探索的AI视频生成解决方案,旨在解决时空一致性难题。 群核科技联合创始人兼董事长黄晓煌发布了群核科技空间智能全景图。 传统大语言模型对物理世界几何与空间关系的理解存在局限性。而SpatialLM 1.5不仅能理解文本指令,还能输出包含空间结构、物体关系、物理参数的“空间语言”,可被用具身智能机器人的虚拟训练上,解决数据难题。 今年3月,SpatialLM1.5的前代版本、开源空间理解模型SpatialLM 1.0曾与DeepSeek-V3-0324、Qwen2.5-Omni一起登上了全球最大AI开源平台Hugging Face的模型趋势榜前三。 SpatialLM 1.5将很快以空间语言对话Agent “SpatialLM-Chat” 形式开源。 SpatialGen已在Hugging Face、GitHub、魔搭开源。 Hugging Face地址:https://huggingface.co/manycore-research/SpatialGen-1.0 Github地址:https://github.com/manycore-research/SpatialGen 魔搭地址:https://modelscope.cn/models/manycore-research/SpatialGen-1.0 群核科技AI产品总监龙天泽透露,群核科技正在做一个“SpatialGen + AI视频创作”的内部保密项目,代号X。 其基于3D技术的AI视频生成产品计划在今年发布,可能成为“全球首款深度融合3D能力的AI视频生成Agent”。 他还现场播放了用该工具生成让群核科技三位联合创始人在不同场景中跳舞的搞笑视频。 这个视频呈现出几个特点:在有超过十个分镜的情况下保持精准的一致性,动作没有崩坏,能够精准卡点,在复杂运镜下画面内容依然合理,并实现内容可控性。 龙天泽说,群核科技的愿景是,让任何有创意想法并渴望将其视觉化的人,都可以利用AI 3D+视频产品来释放创造力。 会后,群核科技首席科学家周子寒进一步详细解释了群核空间大模型的技术细节与特点。 一、启动空间智能飞轮战略,迈向空间大模型的“DeepSeek时刻” 当前AI仍主要局限于文本、图像等二维交互领域,能够完成写作、绘图等任务,但要实现诸如家务协助等三维空间操作,仍有相当距离。 群核科技联合创始人兼董事长分享了群核科技在空间智能布局上的最新思考。 黄晓煌谈道,空间智能是AI从数字世界走向物理世界的关键桥梁。当前空间大模型仍面临三大技术挑战:室内空间数据获取比室外空间数据更困难、空间结构复杂度高、具身智能等场景中的交互需求更高。 基于全球最大的空间设计平台酷家乐,群核科技构建了“空间编辑工具-空间合成数据-空间大模型”的空间智能飞轮,让工具沉淀数据,用数据加速模型训练,用模型提升工具体验,再在工具的广泛应用中沉淀更为丰富的场景数据。 截至2025年6月30日,群核科技拥有包含超过4.41亿个3D模型及超过5亿个结构化3D空间场景。 群核科技从2018年开始开源,逐步开放其在数据和算法上的能力。 “开源是我们战略的重要关键词之一。”黄晓煌说,“相比大语言模型,当前空间大模型还处于初级阶段。我们希望通过开源推动全球空间智能技术快速前进,成为全球空间智能服务提供商,推动属于空间大模型的‘DeepSeek时刻’尽快来临。” 二、和视频模型、世界模型相比,空间大模型有什么不同? 据介绍,群核空间大模型是业界首个专注于3D室内场景认知和生成的空间大模型,基于大规模、高质量的3D场景数据训练而成。 近年来世界模型研究成果层出不穷,那么空间大模型与世界模型、视频模型有什么区别?群核科技首席科学家周子寒对此做了解释。 视频生成模型、世界模型面临空间一致性、视角灵活度两大挑战。 Sora、Genie3等视频生成模型,能还原看似丰富的视觉效果,但视觉一致性、可控性方面仍有不足。 World Labs、混元3D世界模型等3D场景类模型,可以保证视角一致性,但在视角灵活性受限,而且模型通常基于游戏数据场景训练,难以很好地实现真实感。 与世界模型相比,群核科技空间大模型有三大核心优势:真实感全息漫游、结构化可交互、复杂室内空间场景生成能力。 (1)真实感全息漫游场景:由于开源3D场景数据稀缺,已有的工作在算法选择上受限,一般通过蒸馏2D生成模型,导致结果视觉真实性不足;基于群核数据集,我们设计并训练面向场景的多视角扩散模型以生成高质量图像。 (2)结构化可交互:可生成包含空间结构、空间关系等丰富物理参数信息的场景语言,相较于传统大语言模型可精准解析空间布局与物体关系,支持参数化场景生成和编辑,为机器人的路径规划等任务提供必要场景可交互信息。 (3)复杂室内空间处理能力:作为全球最大的空间设计平台,沉淀了数以亿计的3D模型和空间场景资产,其InteriorNet也成为了当时全球最大的室内空间深度学习数据集,群核在室内空间数据的优势使空间大模型可处理更复杂的场内场景生成和交互。 得益于上述优势,群核空间大模型可处理更复杂的场内场景生成和交互,并能精准解析空间布局与物体关系,支持参数化场景生成和编辑,为机器人的路径规划等任务提供必要场景可交互信息。 目前,该模型已开源两大核心子模型:空间语言模型SpatialLM(结构化可交互)和空间生成模型SpatialGen(真实感全息漫游)。 三、空间语言模型SpatialLM 1.5:一句话生成结构化3D场景,解决机器人训练数据难题 今日发布的SpatialLM 1.5,是一款基于大语言模型训练的空间语言模型,支持用户通过对话交互系统SpatialLM-Chat进行可交互场景的端到端生成。 SpatialLM 1.5不仅能理解文本指令,还能输出包含空间结构、物体关系、物理参数的“空间语言”。 例如,用户输入简单文本描述,SpatialLM 1.5就能生成结构化场景脚本,智能匹配家具模型并完成布局,还支持通过自然语言对现有场景进行问答或编辑。 其核心技术路径是在GPT等大语言模型(LLM)基础上,通过融合3D空间描述语言能力构建增强型模型,使其既能理解自然语言,又能以类编程语言(如Python)的结构化方式对室内场景进行理解、推理和编辑。 据周子寒分享,SpatialLM 1.5的底模是通义千问,然后增加空间数据做训练。没选DeepSeek是因为不需要那么大的底模,需要的是一款“小而美”的模型。 由于SpatialLM 1.5生成的场景富含物理正确的结构化信息,且能快速批量输出大量符合要求的多样化场景,可用于机器人路径规划、避障训练、任务执行等场景,有效解决当前机器人训练“缺数据”的难题。 借助SpatialLM的空间参数化生成能力,可以高效创建具备物理准确性的具身智能机器人训练场景:首先基于自然语言描述生成结构化空间方案,继而自动匹配素材库构建三维环境,最终输出可供机器人进行路径仿真的可交互场景。 现场,周子寒演示了机器人养老场景的应用,当输入“去客厅餐桌拿药”这一指令后,该模型不仅理解了相关的物体对象,还调用工具自动规划出最优行动路径,展示了机器人在复杂家庭环境中执行任务的潜力。 四、多视角图像生成模型SpatialGen:搞定时空一致性,打造可自由漫游的3D世界 SpatialLM解决的是“理解与交互”问题,SpatialGen则专注于“生成与呈现”。 SpatialGen是一款基于扩散模型架构的多视角图像生成模型,可根据文字描述、参考图像和3D空间布局,生成具有时空一致性的多视角图像,并支持进一步得到3D高斯(3DGS)场景并渲染漫游视频。 该模型依托群核科技海量室内3D场景数据与多视角扩散模型技术,其生成的多视角图像能确保同一物体在不同镜头下始终保持准确的空间属性和物理关系。 基于SpatialGen生成的3D高斯场景和真实感全息漫游视频,用户可以如同在真实空间中一样,自由穿梭于生成的场景内,获得沉浸式的体验。 对比之下,其他开源视频模型会在移动过程中生成一些幻觉。 SpatialGen有三大技术优势: (1)大规模、高质量训练数据集:由于开源3D场景数据稀缺,已有的工作在算法选择上受限,一般通过蒸馏2D生成模型,导致结果视觉真实性不足;基于群核数据集,群核科技设计并训练面向场景的多视角扩散模型,以生成高质量图像。 (2)灵活视角选择:已有方法基于全景图生成还原,3D场景完整性较差;或基于视频底模,无法支持相机运动控制等。SpatialGen在这一方面具有优势。 (3)参数化布局可控生成:基于参数化布局生成,未来可支持更丰富的结构化场景信息控制。 其工作流是:给定一个3D空间布局,首先在空间中采样多个相机视角,然后基于每个视角将3D布局转为对应2D语义图和深度图。 将它与文字、参考图一起,通过一个多视角扩散模型生成每个视角对应的RGB图,以及语义图和深度图(户型、家具物体等在相机视角的投影)。最后,通过重建算法得到场景的3DGS。 群核科技发现,基于SpatialGen的能力,能够快速补足现有视频生成能力无法解决空间一致性的问题。 例如一些视频生成类模型,物体在形状和空间关系,在多帧画面中无法保持稳定和连贯。而能用于商业化短剧创作的AIGC,不仅要求每一帧画面“看起来合理”,更要求整个视频序列在空间中像真实世界一样“合理存在”。 四、深度融合3D能力,首款AI视频生成Agent今年发布 群核科技正在研发一款基于3D技术的AI视频生成产品,计划在今年内发布。 “这可能是全球首款深度融合3D能力的AI视频生成Agent。”群核科技AI产品总监龙天泽透露说。 该产品通过构建3D渲染与视频增强一体化的生成管线,有望显著弥补当前AIGC视频生成中时空一致性不足的问题。 空间一致性是指在生成视频的过程中,物体的形状和空间关系在多帧画面中保持稳定和连贯。 据龙天泽分享,空间一致性对人类很基本,但对AI很难。 现有的AI视频创作中,常因视角切换导致物体位置偏移、空间逻辑混乱、遮挡错误等问题。这背后的原因是,多数视频生成模型基于2D图像或视频数据训练,缺乏对3D空间结构和物理法则的理解和推演能力。图像缺少人类感知空间时所依赖的深度线索,因此仅凭自然语言难以让AI建立精确的空间关系认知。 群核科技基于SpatialGen的空间生成能力,搭建了一个高效易用的空间视频创作工具,可以让AI视频生成跨过“时空一致性”陷阱,天然具备空间逻辑,真正理解3D空间运行的规律及内在逻辑。 群核通过“三位一体”来构建可控的视频生成: (1)SpatialGen:提供强大的理解与生成能力,可低门槛获得高真实还原度的3D场景。用户只需提供 简单的输入,工具就能智能地生成符合真实物理规律和用户具体需求的三维物体、空间关系和运动轨迹。它为后续的视频生成模型提供了 高品质、结构化、可依赖的三维信息基础。 (2)自研渲染引擎:群核科技自研的KooEngine采用光线追踪渲染技术,精确模拟每一条光线的物理运行轨迹 ,渲染出的3D空间和物体。其质感、光影、氛围都无限接近人类在现实生活中的视觉观察效果,这种物理级的真实感 ,为AI模型理解空间提供了与人类视觉认知高度一致的参考依据。 (3)DiT架构AI视频生成模型:融合了扩散模型在高质量图像生成方面的优势,以及Transformer模型在捕捉长序列依赖关系和复杂时空动态方面的强大能力,提升视频效果的丰富性和多样性。结合用户指令,模型能在保证空间一致性的前提下,灵活地生成符合要求的、富有创意的视频片段,进一步刻画3D场景没有呈现的丰富变化(如群星闪烁、水面涟漪)。 未来AI视频创作工具可应用电商、广告、产品演示乃至短视频、短剧创作。 龙天泽现场展示了酷家乐的一个渲染工具页面,左侧提供场景、光影、视频三类模板,用户可以直接点击模板选项,也可以选择下方“AI设计助手”,在聊天框输入需求,它就会进行快速推理,然后自动调出符合需求的对应模板。 结语:推动AI走向物理世界 群核科技团队认为,当前空间大模型处于GPT-2到GPT-3阶段,“空间大模型的ChatGPT时代”还远未到来。 GPT-2的核心是自然语言建模,首次提出用不同prompt来描述不同任务。而SpatialLM的核心是空间语言建模,训练模型基于输入prompt,使用空间语言来完成不同任务。 群核科技希望其所提供的特性,能够弥补一些全球范围内的能力缺失,为迈向AGI添一份力。
金标充电宝,带手机功能 | vivo Y500 上手体验
8 月 25 日,vivo 推出了新一代 Y 系列手机 vivo Y500。 按照 Y 系列的特性,vivo 这次也把「续航」和「防护性能」作为升级重点。而在整个升级中最大的亮点,就是加入了 IP68/69/69+ 满级防水机身,以及 vivo 目前最大容量的 8200mAh 电池。 这块电池用了新一代蓝海电池技术,能量密度从760Wh/L提升至847Wh/L,可在增大容量的同时更好地压缩电池体积。搭载了这块电池的 Y500 厚度为 8.23mm,重 213g,还是适合手持的尺寸。 电池容量增加之后,Y500 的续航性能再提升了不少。 日常使用 2-2.5 天已经非常基本了,要是不打游戏、只用来首发信息通知和应付通勤支付功能,Y500 可以实现 2.5 天以上的续航。 当然,Y 系列另一个应用场景是快递、外卖、网约车用的业务机,更长和更稳定的电池表现会让工作更方便。 官方给出了 21 小时持续导航、53 小时连续通话,以及综合户外跑单时间能到 28 小时,手机在 -20℃ 环境下支持 11 小时导航,40℃ 的户外也能用 17 小时导航,低电量模式下可以导航 2.4 小时或 10.5 小时通话,户外工作人员对充电宝的依赖就更少了。 新电池改用了新物料,vivo 开发时增加了充电保护,Y500 的电池可以持续使用 6 年。机身支持全局直驱供电,降低直充直用时对电池健康的影响。 充电方面,Y500 支持 90W 安心远航闪充,使用官方的快充组合 15 分钟可以从 20% 充到 47%,61 分钟可以完全充满。 通用快充支持的部分,手机在 AI 小电拼搭配细雳线的组合下实测最高瓦数为 47W,不到 70 分钟充满,0-100% 充电过程: 10 分钟:18% 20 分钟:33% 30 分钟:48% 40 分钟:63% 50 分钟:79% 60 分钟:89% 讲完了充电,来看看 Y500 的防护性能。 Y500 机身同时支持了 IP68/69/69+ 防水认证,最多能在 1.5 米水深下浸泡 24 小时,或在 80℃ 的热水喷洒下坚持 6 分钟。 主板内置缓震结构,手机的防撞杆做了加厚,Y500 获得了瑞士 SGS 金标五星整机抗跌耐摔认证,加上附带的保护壳在四角中增加了气囊防护设计,日常的手滑基本不需要担心,面对经常在户外工作的骑手也给足了防护保障。 来到机身配置的部分,主打耐用和续航的 Y500 内置天玑 7300 移动平台,最高搭配 12GB RAM 和 512GB 的储存空间,要基本玩玩游戏,王者荣耀 90fps、和平精英 60fps 模式都可以应付。 机身对发热的控制不错,高性能模式下游戏并不算特别热。 机内提供 vivo 的职业模式,开启物流、网约车服务的 app 时可以自动开启,加入三向定位增强、免提增强、自动增长锁屏时间和提升亮度以及网络加速功能,还有增强信号的 360° 穿墙天线设计,让职业用户使用起来更稳定。 屏幕部分,Y500 搭载了一块 6.77 英寸 2392 x 1080 的 vivo 悦目护眼屏,支持 120Hz 刷新率和 3840Hz PWM 调光,最高亮度 800nits,全局 HBM 最高亮度能够达到 1300nits。 比较意外的是,vivo 这次还升级了扬声器配置。 Y500 加入了自研超保真扬声器,机身上方加入对称出音孔,扬声器的体积比常规的歌尔 1611B 要大一倍,以增强了扬声器的低频表现,让声音听起来更加厚实。 它同时获得了 Hi-Res Audio 和 Hi-Res Audio Wireless 双小金标认证,在扬声器和无线音频中都有 Hi-Res 音频支持,在这个价位的入门机中比较罕见。 相机部分,Y500 的后置采用一颗 5000 万像素主摄和一颗辅助镜头的双摄组合。后置支持机内 2x 裁切、电子防抖和夜景模式,满足日常拍摄需求。 总的来说,vivo Y500 还是一款非常安稳本分的业务机。 稳定的长续航表现和耐摔防水特性,充电和耐用度都不需要担心。不管你是需要一台长时间待机的备用机,还是需要一台跑网约车和快递外卖的业务机,它都是稳定的选择。 最后看看机器的详细参数: 外观: 冰川蓝丨龙晶紫丨玄武黑 163.10×75.90×8.23mm丨213g 性能: 天玑7300:台积电4nm制程,8核心,64位 CPU主频:2.5GHz*4+2.0GHz*4 最高 12GB RAM,512GB ROM 可选 四个储存选项 屏幕: 6.77 英寸 10.7 亿色 2392×1080、387PPI 最高刷新率:120Hz 屏幕对比度:8,000,000:1 屏幕亮度(典型值):800nit 全局HBM最高亮度:1300nit 3840Hz PWM调光 续航: 8200mAh 蓝海电池 90W 安心远航闪充 特点: IP68/69/69+满级防水 360°穿墙天线 长辈安心三件套、全功能 NFC 全景环绕立体声、双 Hi-Res Audio 认证 影像: 800万像素丨f/2.05丨传感器尺寸:0.45cm(1/4″) 5000万像素丨f/1.8丨传感器尺寸:0.62cm(1/2.88″) 传感器单位像素尺寸:0.61µm
微信悄悄上线AI播客,“真人”唠嗑给你讲新闻
作者 | 江宇 编辑 | 漠影 智东西8月25日报道,近日,微信在“快讯”页面内悄然上线一项AI实验功能:“AI播客”。不同于传统音频播报形式,它引入了双人AI主播对话的形式,将地方新闻、政策动态等内容转化为更具交流感的“语音快讯”,目前功能仍处于灰度测试阶段。 该功能入口隐藏在微信“快讯”合集页内。若用户平时很少点开公众号,“快讯”可能会自动出现在公众号列表页顶部;若经常浏览公众号内容,则需手动在搜索栏中输入“快讯”,进入合集页后点击右上角“听快讯”按钮,即可开启AI播客。 音频播放过程中,两位AI主播通过对话形式复述新闻内容,语气自然,语序节奏接近真实对话,整体听感更像一段轻松交流。 快讯的内容来源主要为各地官方媒体发布的政策通稿等结构化新闻,在播报过程中AI会对原文信息进行拆解重组,保留要点的同时降低理解门槛,适配用户通勤、家务等“耳朵空闲”的场景使用需求。 此前,微信就已在公众号后台提供AI语音克隆功能,支持创作者上传语音样本训练专属AI音色,实现“本人朗读”效果。 而此次AI播客则更进一步:相比此前以朗读原文为主的“听全文”功能,AI播客引入“对话解读”的方式,让听感更接近日常交流,为信息消费场景打开了新的想象空间。 微信为何选择“快讯”作为首发场景?一方面,该页面汇聚的内容多为官方稿件,具备高稳定性和低误解风险;另一方面,快讯原本定位即为“高频率、短文本”的信息快线,与AI生成的短播内容形式天然契合。在AI能力尚处测试期的阶段,这类内容既能作为微信稳妥的练兵场,又切中了用户对“快速过目新闻”的潜在需求。 结语:AI正在改写我们获取信息的方式 “听快讯”或许只是个开始。微信在语音交互路径上的探索,正在悄然将公众号的“碎片信息”重新打包,未来可能会出现更个性化的“私人播客”——由AI主播为用户串讲好友动态、长文观点、热点话题,利用每段耳朵空闲时间完成一次“信息捕捉”。 对于信息过载的用户而言,下一个争夺注意力的入口,或许正藏在耳机里。
谷歌AI硬件全家桶爆更!买手机送AI,发3nm芯片、折叠屏,硬刚三星苹果
作者 | 云鹏 编辑 | 心缘 谷歌爆肝更新,软硬件大招直接拉满了。 智东西8月21日消息,今天凌晨,谷歌在自家的“Made by Google 2025”大会上正式发布了最新旗舰Pixel 10系列三款手机和Pixel 10 Pro Fold折叠屏,手表和耳机同步更新。 Gemini Nano全球首发落地手机带来的各种端侧AI新功能和台积电3nm工艺的Tensor G5自研芯大招都成为核心看点。 谷歌在官网上一口气爆更了18篇博文,可以说是量大管饱。 这次Gemini变得更主动,Magic Cue功能可以在各类应用中都可以给你提供合适的建议,颇有种知心小秘书端茶送水的感觉。 ▲收到航空公司来电,AI会自动生成今天航班信息的小卡片 你跟AI视频聊天寻求建议时,AI直接可以圈出你视频画面中的物体,给你明确指示,AI与我们世界的交互变得更灵动更直观了。 ▲询问AI车辆关键零部件在哪里,AI会给你直接圈出来 AI还会手把手教你如何成为“摄影大师”,还可以根据你随口哼唱的调调为你生成歌曲。 并且基于性能、能效大幅提升的自研芯Tensor G5,Pixel新机在实现诸多功能升级的基础上,官宣的续航时间竟然突破了30小时,着实令人有些惊喜。 这种从芯片、操作系统到AI大模型的全链路自研,是谷歌的核心优势之一。 当然,从绝对性能来看,根据Geekbench官网数据,Tensor G5在Geekbench 6测试中CPU单核跑分约为2240分,多核跑分约为6000分,相比高通旗舰骁龙8 Elite的单核2850分、多核9400分,差距仍然比较明显。 ▲Tensor G5泄露跑分,来源:Geekbench官网 在AI和芯片之外,Pixel 10系列新机的拍照能力有重点升级,标准版也塞入了潜望式长焦,折叠屏的无齿轮铰链黑科技使其支持了IP68防尘防水,这在折叠屏领域暂时是“独一份”。 新Pixel 10系列的外观着实是“果味十足”,在这一点上倒是和国内安卓阵营保持了一致。 手表Pixel Watch 4的外观改变非常大,机身变得十分“圆润”,搭载了高通第二代骁龙W5芯片和新一代基于机器学习的协处理器,支持独立卫星通信;耳机则首次在A系列中加入了主动降噪功能。 ▲Pixel Watch 4 价格方面,Pixel 10、Pixel 10 Pro和Pixel 10 Pro XL的起售价分别为799美元、999美元和1199美元(约合人民币5730元、7170元和8600元),Pro和Pro XL用户会获得一年的Google AI Pro服务(一年订阅费大约1600元)。 ▲Pixel 10标准版 ▲ Pixel 10 Pro版 折叠屏Pixel 10 Pro Fold的起售价格为1799美元(约合人民币12900元)。 不得不说,Pixel 10系列定价是像素级对标苹果iPhone 16系列,这也是谷歌的老传统了,折叠屏的定价则比三星Galaxy Z Fold6还贵了200美元,突出一个自信。 接下来,我们将深入这次1小时15分钟的发布会,带你一文看尽谷歌的软硬件黑科技亮点。 01 . 9大关键AI功能升级,AI主动干活更勤快 各类应用处处都能AI了 谷歌作为当下AI大模型领域的头部玩家之一,其旗舰机的AI功能自然是重中之重。 在AI视觉方面,谷歌的Gemini Live功能进行了升级,视觉感知能力更强、表达能力更丰富,同时跟更多的谷歌应用做了深度集成,更加“系统级”。 现在当你跟Gemini共享摄像头时,AI不仅可以看到你所见的内容,还可以直接在屏幕上突出显示它所聚焦的内容。 比如当你询问AI烹饪时的调料建议时,AI可以直接在画面中高亮圈选它推荐的调料,更直观、一目了然。 比如当你受困于一堆工具扳手,不知道该用哪个时,AI可以直接根据你的需求为你推荐正确型号的工具并高亮圈选出来。 谷歌目前正在把Gemini Live对话功能植入到更多应用程序中,比如在日历程序中直接让Gemini帮你设置日程、让Gemini直接在Google Keep中添加新的购物清单。 谷歌称他们很快会在信息、电话和时钟应用里加入这些Gemini Live的功能。 值得一提的是,谷歌即将推出新的模型更新,来提升Gemini Live在语音对话方面的能力,包括语调、节奏和音高的控制,从而让对话更自然流畅,同时更富有表现力。 比如如果你在谈论一个比较紧张的话题,Gemini的语气可能会更平静、克制;你也可以让Gemini说话慢一点,方便你做笔记;你还可以让Gemini用有趣的口音来活跃气氛,或者让Gemini讲故事的时候模拟其中一个角色的来讲述。 此次在Pixel 10系列中,谷歌发布了“Magic Cue”AI新功能,相当于一个AI智能提示,在消息或者电话应用中,AI会主动给你提供一些合适的信息。 比如当我们跟朋友聊天时,朋友询问晚餐地址,AI就会在邮件中找到与对应朋友聊天时提到的地址信息,并生成好回复,我们只需要点击就可以给朋友发过去。 比如在我们收到航空公司的电话时,AI会自动从邮件中找到航班信息,给我们生成对应的信息小卡片,便于我们回复。 比如当妈妈在消息中问及家里的猫时,AI可以直接主动给我推送相册中关于猫的照片。 这带来的一个最大改变就是所有操作都在同一个应用的界面内完成,不需要在反复切换应用查找信息,并且AI的主动性显著增强。 在拍照方面,AI同样有很多加持。 谷歌此次推出了Camera Coach功能,相当于AI拍照指导,Gemini模型可以给你提供拍照建议,比如尝试不同的构图和取景方式。 AI甚至会把拍照步骤一步一步的给你列出来,比如第一步让被摄者看镜头、第二步距离被摄对象近一点、第三步把镜头降低一些、第四步调整人物在镜头中的位置、第五步拍照。 这次谷歌在长焦拍照中也融入了AI模型能力,Pro和Pro XL的100倍变焦,用到了Tensor G5和一种新的图像生成模型,这个模型负责恢复并优化复杂的图像细节。 这次谷歌算是大大方方地承认百倍变焦是“算出来的”。谷歌还特别提到,这是Pixel相机有史以来用过的最大的AI模型。 在多人合影时,AI只要检测到你正在拍摄多人合影,Auto Best Take功能就会自动启动,AI会在几秒内分析150帧画面,找到每个人都有好表情的瞬间并拍照,避开“闭眼”或糟糕表情。 值得一提的是,如果实在找不到完美的单帧画面,AI会自动合成出一张最佳照片。 在相册的照片编辑环节,你可以直接跟Gemini说“去掉窗户上的反光”、“消除眩光”、“提亮照片并给天空添加云朵”,动动嘴就能让AI帮你“P图”。 甚至对于一张褪色严重的老照片,你只需要简单的说“修复照片”或者“让它变得更好”,AI会自动进行处理,最终还原一张清晰的照片。 基于Video Boost功能,AI还可以帮你一键提升视频防抖。 翻译一直是AI的强项之一,此次谷歌进一步扩展了实时通话翻译的语言支持范围。 在通话方面,AI的“留言”功能可以提供未接或拒接来电的实时文字转录,AI还会根据收到的信息自动识别下一步行动。 这次谷歌的AI研究助手NotebookLM已经集成在了Pixel截图和录制功能里,如果AI检测到你拍摄的照片可能适合你的笔记,它就会自动建议你将其添加到笔记中,你还可以直接将录制功能生成的字幕文本添加到笔记中。 此外,在AI音乐生成方面,你可以通过录制歌声,并选择偏好的音乐风格,来让AI创作出契合你心情的曲子。 这次谷歌在AI方面的升级可以说是诚意十足,AI的主动性、系统级特性拉满,AI视觉能力的提升也让AI多模态交互的体验进一步优化。 02 . 台积电3nm自研芯挑大梁 Tensor G5性能暴涨,整机续航破30小时 Tensor G5这颗芯片或许是AI之外另一个值得关注的升级重点。 谷歌这次着重地介绍了新Tensor G5芯片,谷歌特别提到,在他们与DeepMind的联合设计之下,最新的Gemini Nano模型将率先在Tensor G5上运行,这样手机就可以支持更多的端侧AI功能。 可以说上述诸多本地AI功能的实现,都离不开Tensor G5的支持。 谷歌称Tensor G5是迄今为止他们自研定制芯片最大的一次升级。 ▲谷歌将Tensor G5称为“a game-changer for Pixel” 具体来看,首先是性能方面的提升。此次Tensor G5的TPU性能相比上代提高了60%,CPU平均性能提升了34%。 制程工艺方面,Tensor G5终于也用上了台积电3nm工艺,不过谷歌没有具体提到是否是第二代3nm工艺。 Tensor G5内部还集成了新的安全硬件模块,提升安全防护能力。 正如前文提到的,谷歌和DeepMind团队进行了深入合作,Tensor G5针对新模型进行了优化,据称Gemini Nano在Pixel截图和录音等用例中的运行速度提升了2.6倍,效率提高了2倍。 谷歌提到,像Magic Cue、语音翻译、个人日记、电话诈骗检测等一些主动AI功能都需要Tensor G5的支持,此外,Pixel 10系列拍照性能的提升也部分得益于Tensor G5中ISP模块的升级。各类AI图像处理功能同样离不开Tensor G5。 最后,谷歌特别提到了Pixel 10的续航时间超过了30小时,而这是在搭载了上述各类新功能的基础上实现的。 03 . 手机外观太“苹果”!潜望式长焦首次塞入标准版,“XL”真的只是更大了一些 “拆解”完了手机的AI和芯片两大“灵魂”,我们接下来聚焦手机本体的一些设计、配置和硬件升级。 首先我们来看直屏旗舰Pixel 10系列,其包括Pixel 10、Pixel 10 Pro和Pixel 10 Pro XL三款机型。 Pro和Pro XL的关系类似苹果的标准版和Plus版,只是单纯的屏幕尺寸增加,在其他配置方面基本相同,并非Pro和Pro Max的关系。 Pixel 10系列搭载了谷歌Tensor G5芯片和最新的Gemini Nano模型,其最主要的三个升级点是设计、AI和拍照。 在设计方面,当下手机外观着实有些“趋同”,如果把Pixel 10系列的背部镜头模组和谷歌LOGO挡住,你可能很难分辨这是iPhone还是Pixel。 从软件系统界面来看,新的Pixel 10系列首次搭载了谷歌最新的“Material 3 Expressive”用户界面,简单来说就是动画的动感更强、风格个性化更突出、系统整体流畅度和交互性有所升级。 Pixel 10系列的中框为亮面金属材质,类似iPhone 16系列,背部还是标志性的“横条”摄像头模组。标准版搭载了一块6.3英寸的屏幕,峰值亮度3000nit。 在拍照方面,Pixel 10系列首次在标准版中就加入了5倍潜望式长焦镜头,据称拍照品质堪比10倍光学变焦镜头,数码变焦最高支持20倍。 Pro版有6.3英寸和6.8英寸版本,大尺寸版本就是Pro XL,在Pro Res算法加持下,Pro和Pro XL都可以实现100倍变焦。 在一些外围配置方面,Pixel 10系列升级了Pixel系列有史以来最大的电池,内存容量也达到了有史以来最大的16GB,显然这是为未来AI的更多应用铺路。 04 . 折叠屏最强防尘防水,铰链暗藏黑科技 8英寸大屏“站着”也能充电 除了直屏机,这次谷歌的Pixel 10 Pro Fold折叠屏也是大家关注的重点之一。 安卓折叠屏做了六年后,基本的硬件迭代已经趋于成熟,谷歌能否在软件交互和AI层面给折叠屏带来一些新气象,为明年与苹果折叠屏的正面较量做好准备? 此次Pixel 10 Pro Fold的主要升级是采用了新的无齿轮铰链、更大的外屏、相机性能提升、支持IP68级防尘防水、电池更大续航更长、AI功能更丰富。谷歌称其为“迄今为止最耐用的折叠屏手机”。 这款折叠屏同样搭载了谷歌Tensor G5芯片。 具体来看,新的无齿轮铰链耐用性是上代铰链的2倍,整机支持IP68防尘防水,据称这是全球首款支持这一防水防尘等级的折叠屏手机。 根据公开信息,目前大部分国产旗舰折叠屏通常支持的都是IPX8防尘防水,在防尘能力上会弱于IP68。 在屏幕方面,Pixel 10 Pro Fold的屏幕采用了超薄玻璃(UTG)作为保护盖板,并基于其上设置了两层抗冲击薄膜,可以说耐久度拉满了。 整机寿命上,谷歌称Pixel 10 Pro Fold可以承受超过10年的折叠使用。 Pixel 10 Pro Fold的内屏为8英寸,这也是目前折叠屏上内屏的最大尺寸,其外屏为6.4英寸,两块屏幕的峰值亮度都可以达到3000nit。 续航是现在折叠屏“卷”的重点领域之一,Pixel 10 Pro Fold的续航据称可以达到30小时。无线充电方面,其成为目前首款内置Qi2无线充电的折叠屏手机,通过Pixelsnap磁吸技术集成于手机内部。 值得一提的是,Pixel 10 Pro Fold无线充电的姿势很“优雅”,可以通过Pixelsnap环形支架进行直立充电,可以边充边看视频。 令人稍有遗憾的是,在AI方面,谷歌Pixel 10 Pro Fold的介绍一带而过,只说跟直屏机一样,该有的都有。我们所期待的折叠屏特有的AI功能或体验,并没有出现。 此次Pixel 10 Pro Fold的拍照也进行了重点升级,主摄升级为4800万像素,长焦支持20倍变焦拍照。 在拍照界面,大屏展开后,可以支持一边拍照一边预览,这的确是大屏的一项优势。 此外,Pixel 10 Pro Fold在分屏功能上支持了根据需要调整应用大小,用户可以通过拖放来在不同应用之间传送媒体文件或其他内容。 05 . 手表太太太“圆”了!首次支持卫星通信,千元机耳机首次加入主动降噪 最后,在智能穿戴品类方面,谷歌此次发布了Pixel Watch 4智能手表和Pixel Buds 2a耳机。 谷歌称Pixel Watch 4为迄今为止更新幅度最大的Pixel手表,其搭载了全球首款曲面Actua 360显示屏,谷歌称其为全球首款支持独立卫星通信的智能手表,可以在紧急情况下让你在远离网络覆盖的区域也能发送救援信息。 ▲独立卫星通信 但实际上华为早在2023年就已经发布了支持北斗卫星消息的智能手表。 从外观来看,Pixel Watch 4的确是相当“圆润”,正面和背面都是圆润过渡,据称显示区域扩大了10%,边框缩窄了16%,峰值亮度3000nit。 Pixel Watch 4的续航时间延长了25%,45mm版本续航时间为40小时,省电模式下最长续航可以达到三天左右。 芯片方面,Pixel Watch 4搭载了第二代高通骁龙W5和一颗基于机器学习的协处理器,这颗协助处理器比上代快了25%,功耗为上代的一半。 健康和健身功能依然是手表的重头戏,包括更智能的睡眠追踪、增强的皮肤温度感应功能、更精准的运动路线追踪、更多运动模式的支持、个性化自动运动数据检测分析等等。 谷歌还推出了一个基于Gemini的AI健康教练,它可以提供主动的健身和睡眠指导。 售价方面,41mm Wi-Fi版售价349美元(约合人民币2500元),LTE版449美元,45mm两个版本售价为399美元(约合人民币2860元)和499美元。 Pixel Buds 2a耳机是谷歌第一款支持主动降噪的A系列产品,其搭载了谷歌自研的Tensor A1芯片,该芯片首次发布是在2024年8月14日,用在Pixel Buds Pro 2中。 Pixel Buds 2a主打舒适稳固佩戴,支持IP54级防汗防水,可以明显看出其针对的是运动场景。 Pixel Buds 2a即使在开启降噪后,单次充电续航也可以达到7小时,这个表现在TWS耳机中属于TOP水平。 AI方面,Pixel Buds 2a最大的作用就是可以解放用户双手,你不需要掏出手机就可以直接跟Gemini聊天。 售价方面,Pixel Buds 2a售价为129美元(约合人民币925元)。 06 . 结语:谷歌AI无处不在 软硬件底层技术打通优势明显 谷歌今天的发布会,可以说从硬件、软件到生态都拉满了,AI毫无疑问是今天的核心主角,AI功能不断丰富,AI的主动性增强、与各类应用的集成进一步加深。 与此同时,谷歌诸多AI功能升级都没有牺牲续航和其他产品体验,这与谷歌自研芯片的能力密不可分,自研芯片+自研系统+自研大模型的深度协同联通,已经成为谷歌智能硬件的核心优势。 相比之下,苹果除了基础自研模型,在部分场景还需要引入外部模型,而谷歌直接可以用自家的Gemini。 虽然谷歌在智能硬件领域并不是市场份额方面的“巨头”,但谷歌在智能硬件领域,尤其是安卓生态方面,是“风向标”的存在,其各类AI功能的升级,是否会得到国内安卓厂商们的跟进,我们将继续观察。 从AI手机到智能穿戴,AI新硬件战事愈发激烈,核心的芯片、大模型能力仍然是巨头们角逐的关键
英特尔警告美政府入股风险:国际销售等业务或受影响
英特尔 凤凰网科技讯 北京时间8月25日,据路透社报道,英特尔公司周一表示,美国政府持有其10%股权可能会对其业务构成风险,从可能损害其国际销售,到限制其未来获得政府补助。 在美国政府决定将对英特尔的补助转换为股权后,英特尔在一份证券文件中列出了新的“风险因素”。 英特尔表示,目前尚不确定这一交易是否会导致其他政府机构尝试将现有补助转换为股权投资,或使它们不愿意支持未来的补助。 美国政府将使用拜登时期所出台《芯片法案》中尚未支付的57亿美元补助,以及为“安全飞地”芯片计划授权英特尔的32亿美元资金来购买英特尔股权。该交易预计将于8月26日完成。 英特尔在文件中表示,“在适用法律允许的最大范围内”,英特尔在《芯片法案》中的义务将被视为已解除,但“安全飞地”计划除外。 文件称,美国政府成为英特尔大股东,可能会对公司的非美国业务产生影响,因为这可能使英特尔受制于额外的法规或限制,例如其他国家的外国补贴法。 截至2024年12月28日的财年,英特尔在美国以外市场的销售额占其总营收的 76%,其中来自中国的营收占比达到29%。 英特尔还表示,公司以低于当前市场价格向美国政府发行股份,将对现有股东的权益造成稀释。美国政府购买英特尔股票的价格比上周五24.80美元的收盘价低了4美元。 文件还显示,美国政府的持股还削弱了其他股东的投票权。与此同时,政府在涉及英特尔法律和监管事务上拥有实质性额外权力,可能会限制英特尔推进有利于股东的交易。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
字节大模型关键人物被曝离职
作者 | 程茜 编辑 | 李水青 字节跳动被曝又损失一员大将! 智东西8月25日消息,今日下午,据微信公众号大厂日爆消息,字节跳动豆包大模型视觉基础研究团队负责人冯佳时已经于近期离职,并且推算他为字节跳动职级4-1、4-2大佬。 今年6月,就有媒体爆料冯佳时将离职,但当时被字节辟谣为不实信息。 ▲字节跳动豆包大模型视觉基础研究团队负责人冯佳时 2024年,字节跳动启动Top Seed人才计划,为豆包大模型团队招人,在招聘海报中公布的顶尖导师团队共有8人,冯佳时就是其中之一。 ▲Top Seed人才计划的顶尖导师团队 冯佳时2007年本科毕业于中国科学技术大学,硕士毕业于中国科学院自动化研究所,2014年获得新加坡国立大学博士学位,2014-2015年在加州大学伯克利分校从事博士后研究,2016年-2021年在新加坡国立大学担任助理教授,他曾在新加坡国立大学师从AI领域全球顶尖学者颜水成,2009年颜水成回国后,冯佳时接任其在机器学习与视觉实验室的主持工作。 2021年冯佳时回国加入字节跳动,专注于计算机视觉、机器学习领域的相关研究及其在多媒体中的应用。 字节跳动的公开信息显示,冯佳时已发表400多篇关于深度学习、物体识别、生成模型、机器学习理论方面的论文,曾获得ACM MM 2012最佳技术演示奖、TASK-CVICCV 2015最佳论文奖、ACM MM 2018最佳学生论文奖。他也是2018年麻省理工学院技术评论亚洲35岁以下创新者奖获得者,曾担任CVPR、NeurIPS、ICML、ICLR的领域主席以及ICMR 2017的程序主席。 值得一提的是,他的论文在谷歌学术引用量已经超过6.9万次。 冯佳时的Hugging Face主页显示,字节跳动的视频多模态大模型Sa2VA、自回归视频生成模型VideoWorld等研究论文,他均在作者之列。 ▲冯佳时Hugging Face主页 2023年底,新加坡国立大学Show Lab与字节联合开源视频生成模型MagicAnimate,允许用户从单个图像和动态视频生成动画视频,这项研究就是冯佳时作为核心研究员推动的。 ▲MagicAnimate研究论文 去年12月以来,字节跳动的大模型团队已经损失多员大将,包含冯佳时在内已有7人离职。 去年12月,字节跳动剪映产品负责人张逍然被曝离职,新动向未知;去年12月,TikTok算法负责人陈志杰被曝从字节跳动离开,今年3月成立了AI编程方向公司言创万物;今年3月,火山引擎AI应用产品线一号位骆怡航被曝离职,同月入职生数科技担任CEO。 今年6月,字节跳动豆包大模型大语言模型团队负责人乔木被辞退;今年7月,字节跳动豆包大模型视觉多模态生成负责人杨建朝因家庭因素与长期高强度工作,宣布暂时休息;今年6月,字节跳动AI Lab负责人李航被曝正式卸任,转为劳务/顾问身份。 另一边,字节跳动也在大力从全球招兵买马。 去年9月,字节跳动被曝数千万年薪挖走原阿里通义大模型技术团队的关键成员,包括技术负责人周畅及其手下的十多名团队成员;今年1月,经纬创投合伙人、前班牛科技高管熊飞被曝加入字节跳动飞书团队负责南区销售团队管理;今年2月,Google Fellow、谷歌DeepMind研究副总裁吴永辉被曝离开谷歌加入字节跳动,担任大模型团队Seed基础研究负责人。 大模型的人才争夺战愈演愈烈。
为什么豌豆荚、应用宝、91助手等应用商店现在都没什么人用了?
2025年8月28日,91手机助手关停的公告,瞬间将众人的思绪拉回到2013年8月。当年百度以19亿美元收购91无线,其中最有价值的便是91手机助手,“19亿美元”刷新了互联网行业的天价记录,同时也开启了移动互联网行业收购狂潮,2018年,阿里巴巴收购饿了么的价格达到了95亿美元。后来,腾讯、阿里巴巴、字节跳动等互联网巨头都在买买买。 从“事后诸葛亮”的角度看,不少人认为百度当时花费19亿美元的天价去购买91无线是个大亏本生意,91助手的关停公告,更是让人重新印证了这一评价。从“移动互联网船票”的定义来看,91无线确实没能完成它的使命和价值,但若从“亏本”和“冤大头”的角度来看,百度并不亏。 第一,收购后,91手机助手+百度手机助手一度成为当时第三方应用商店的No.1,当时各家都在争这个入口地位,91手机助手显然起到了巨大的作用。 第二,百度旗下的App收获了优势,特别是“手机百度”App,现在百度旗下的主力产品,比如百度文库、百度网盘、百度地图等,都享受了91手机助手+百度手机助手的便利,这个便利,让如今百度旗下的产品有了立足之地。 百度2025年Q2季度财报显示,6月,百度App的月活跃用户达到735百万,同比增长5%。同样对比搜索引擎最红火的时代,360搜索、搜狗、神马搜索等,它们的月活跃用户数远远赶不上现在的百度。 换个角度来看,把买91无线的成本,当成是对百度、百度文库、百度网盘、百度地图等App的广告投放,就更能体现出91手机助手的价值。 91无线被收购后,91手机助手的流量、影响力、用户等全被“百度手机助手”给吸走,所以,也并不是“啥都不剩”。 2016年7月,阿里巴巴收购另一家较大的第三方应用商店——豌豆荚,大约只花了2亿美元,与19亿美元的91无线形成鲜明对比。 百度拥有91手机助手+百度手机助手,阿里巴巴拥有豌豆荚+PP助手,腾讯该怎么办?与前面两大巨头相比,腾讯来了一招釜底抽薪,利用微信的影响力,直接将新版微信的大更新放在应用宝上,直接带火了应用宝,其他两家大厂根本没有还手之力。 BAT各自手握拥有“入口”能力的应用商店,是不是其他人就彻底没机会了?并不是,华为、小米、vivo、OPPO等手机厂商也看中了应用商店这块“肥肉”。相比较豌豆荚、91助手、应用宝等产品,手机厂商自带的应用商店是滞后性的。过去,手机厂商的重点是硬件,而不是软件,这就给了各种各样的应用商店机会,91助手、豌豆荚的身价也是水涨船高。 但随着手机厂商回过神之后,华为、小米、vivo、OPPO等手机厂商也开始发力搞应用商店,一方面,它们的产品能力出现提升;另一方面,它们利用终端的影响力,以安全之名,逐渐限制第三方应用商店的出现。你想想,用户从应用宝、豌豆荚等App上安装新的App,系统要么提示不安全,要么让用户去系统的应用商店下载,要么让用户多次确认安全输入密码,如此复杂繁琐的用户体验,让用户只能选择手机厂商自带的应用商店,豌豆荚、应用宝、PP助手等第三方应用商店只能被用户抛弃和以往。 所以,为什么豌豆荚、应用宝、91助手等应用商店现在都没啥人用了?第一点就是,手机厂商逐渐不让用户用了。既然大家都“不讲武德”,既然大家都在利用平台的超能力,作为终端厂商自然也可以从底层限制住第三方应用商店,而且,华为、小米、vivo、OPPO等手机厂商早有前车之鉴,苹果也只允许用户使用它们自己的应用商店App Store下载App,苹果能这么干,其他手机厂商自然也能这么干。 一款App,哪怕你本身产品非常好、功能非常多,但是却与用户隔离,最终也只能吸引一些极品铁粉,他们愿意在各种不方便之下,还去使用这些产品,但放大到11.23亿网民规模下,这个用户群体就显得非常小。 豌豆荚、应用宝、91助手等应用商店没人用的第二个关键点是产品力被稀释。应用商店的价值是为用户提供App下载,过去手机厂商应用商店没起来的时候,豌豆荚、应用宝、91助手等产品对于用户来说非常有用。仅以2020年的数据为例,据统计,截止到2020年6月末,我国国内市场上监测到的APP数量为359万款,本土第三方应用商店APP数量为212万款。面对如此之多的App,如果没有第三方应用商店,用户要想找App非常难。 然而,随着后续手机厂商自带应用商店的崛起,第三方应用商店就由装机必备的应用,变成了可替代品,这是其一。 其二是,小程序以及抖音、微信等产品的广告效应。小程序在某种程度上就替代了App。而更其余的App开发者,就算要拉下载量,更多的是将广告直接投放到微信、抖音等头部App的Feed流广告或开屏广告上,开发者们不再依赖于第三方应用商店这一渠道,它们的价值进一步降低。 对于开发者来说,它们也可能会和豌豆荚、应用宝、百度手机助手等应用商店合作,但它们也有可能直接和手机厂商自带得以应用商店合作,或者直接花钱买预装,第三方应用商店逐渐被边缘化。 对于用户来说,手机厂商自带的就有应用商店,为什么要用豌豆荚、应用宝、百度手机助手等第三方? 对于开发者来说,跟豌豆荚、应用宝、百度手机助手等第三方合作能赚到钱吗? 显然,第三方应用商店目前很难解决上述两个问题,这就导致产品用的人越来越少。 实际上早在2020年,百度就发布了不再支持91和安卓市场渠道的渠道包上传和管理等功能的通知,直到这次彻底关停。它之所以被再次关注,很大程度上是由于当初“19亿美元”的天价。 只能说互联网行业变得太快,谁都不敢预言互联网行业三年、五年后会发生什么,毕竟,谁能想到,当初势头那么盛的公司,现在市值都赶不上腾讯音乐,连听歌的都不如,真的让人唏嘘。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。