行业分类:
加载中...
头条分类:
加载中...
古老剧种打破沉寂—— ​东路梆子“吼”出新天地
  “青史人物百家评,悲歌一曲留人间……”近日,东路梆子新编历史剧《荐官记》在山东省滨州市阳信县首演,剧中寒儒王密求官、为官、失官、悔官的人生历程令许多观众唏嘘感叹。   这场演出是东路梆子近半个世纪以来首次推出的原创大戏。从历史上的繁荣、沉寂,到近几年的挖掘、保护,东路梆子继承传统、守正创新,重新走入大众视野,受到广泛关注。   传唱300年   “吼”出鲜明特色   《荐官记》开场前,山东省戏曲理论家、作曲家高鼎铸对两件事尤为关注:一是演员有没有外借,二是唱腔的完成度如何。对此,他解释说:“东路梆子虽然是个稀有剧种,但它也是地方大剧种,传统戏以袍带戏居多,‘四梁八柱’是否齐整将直接关系到未来的剧目体系。唱腔音乐更为关键,它是一个剧种最显著的艺术特色,也是戏曲有别于其他艺术形式的主要标志。”   东路梆子,也叫“山东吼”“东路讴”,属于梆子声腔系统,至今已流传300多年。据《山东地方戏曲剧种史料汇编》记载,明末清初,山西、陕西梆子艺人沿黄河来山东谋生,演唱梆子腔,这种声腔先是在商贾往来重镇章丘盛行,后又以惠民为主蓬勃发展,并受到地域艺术元素影响,形成了特色鲜明的剧种形态。   “清代中叶以后,东路梆子在鲁东北多地取得长足发展,常与横笛梆子(今河北梆子)班社同台演出。”高鼎铸告诉记者,为了加以区分,当时,人们把活跃在济南以西及西北的横笛梆子叫作西路梆子;把流布于济南以东的这一支称为东路梆子,该剧种便由此得名。   谈及剧种特色,《荐官记》导演陈胜介绍,东路梆子虽与山东省内流传的山东梆子、莱芜梆子等同属于梆子声腔剧种,但在伴奏乐器、唱腔风格上有明显不同。“它的唱腔高亢明亮,句尾会根据不同的唱词内容、唱腔板式、演唱情绪呈现出不同程度的拖腔,就是这个‘吼’,彰显了剧种的独特性,往往也是烘托戏剧情境的点睛之笔。”陈胜说。   “周康演关公,我三天不上工”“豁上今天不赶市,也要先看梆子戏”……这些民间流传的说法,形象描述了东路梆子在不同历史时期的繁盛局面。据阳信县洋湖乡西肖家村老艺人讲,及至20世纪50年代末,该村尚有东路梆子演出人员30多人,服装、把子箱五六顶,常演《双锁山》《破洪州》等20多出剧目,这也印证了东路梆子为地方大剧种的观点。   十余载挖掘保护   从沉寂走向新生   20世纪中叶,以惠民、阳信一带为中心,东路梆子演出辐射至周边20多个县市区的上百个村庄。1956年,东路梆子第一个专业演出团体——惠民县东路梆子剧团成立。但由于历史原因,这支剧团在1967年被解散。   “此后,东路梆子再无专业演出团体,民间零散组织一些演出活动,随机性较强。20世纪末,受到娱乐方式多元化等现实因素影响,剧种发展进入低迷期。”滨州市艺术创作研究所所长臧宝荣介绍。至今,她仍清晰记得该所牵头开展东路梆子调研时的情况:“2015年前后,调研组走访了70多个村庄,发现仅有少数村还保留服装、道具,艺人最年轻的也已60多岁。东路梆子整体走向沉寂,一无财力支持,二无研究人员,三无专业学校。”   作为历史上东路梆子演出较活跃的区域之一,阳信县较早开始了对这一剧种的挖掘与保护工作。“从2007年起,阳信县就着手整理东路梆子老艺人口述资料。2016年,阳信县非物质文化遗产保护和文化研究中心(简称‘阳信县非遗中心’)成立,在开展专项研究的同时,以原阳信县艺术团为班底从事东路梆子演出活动。”阳信县非遗中心负责人封波说。   体制机制创新给东路梆子发展带来转机,但如何让剧种回到群众中去?亮出家底和特色,是阳信县走出的第一步。   《荐官记》剧照     阳信县文化和旅游局供图   说到近些年演出的剧目,东路梆子省级代表性传承人李双印开口就唱,传统戏《白虎帐》选段被他演绎得酣畅淋漓。“过去几年,我们把滨州区域内上演的几百种东路梆子戏分类存目,整理出传统戏10余部,并复排了《白虎帐》《双锁山》。”李双印介绍,东路梆子每个行当都有不同的唱腔特点、发声方法,文本、表演、伴奏均有较高的研究价值,需要在传承中被发现。   封波介绍,东路梆子还贴合时代审美,从现实中取材,排演了反映乡村生活的《二蛋闹牛》、讲述军民鱼水情的《军号嘹亮》等多部小戏作品,给人质朴、灵动和耳目一新之感,受到许多年轻人喜爱。   与时代同行   返本不忘开新   “与排小戏有所不同,排演大戏更锻炼年轻人。就拿《荐官记》来说,我们从2024年就投入创排之中,以演带训,演职人员获得了快速成长。”陈胜表示,演出原创作品时,演员需要突破固定范式,把自身感受与体验融入人物塑造,这正是获取舞台经验的良好契机。   “从长远来看,一部新戏的问世、打磨,对于稀有剧种传承发展、人才培养的意义或将超越作品本身。”高鼎铸谈到,阳信县非遗中心若能在现有队伍基础上,扩充一部分演职人员,舞台演出将会更加游刃有余,也能更好地契合东路梆子作为地方大剧种对行当、角色的要求。   这同样是阳信县非遗中心迫切想要解决的问题。“近几年,尽管有新生力量注入,但2026年前,中心将有8名演职员退休,45岁以下的演员尤为匮乏,人才梯队建设亟须完善。”封波说。   阳信县已经开始“破题”。据阳信县文化和旅游局党组副书记孙洪芳介绍,除“以戏促培”外,该县推动“以师带徒”,聘请戏曲名家、当地老艺人定期对青年演员进行教学、培训,拓宽了东路梆子专业人才培养途径。与此同时,阳信县探索人才引进“特事特办”机制、与相关艺术院校开展联合培养,为剧种体系化传承和地方文化生态整体性保护注入内生动力。   也有专家建议,东路梆子的发展,在尊重规律、注重差异、保护特色的同时,还应抓住在“中国戏曲稀有剧种优秀剧目展演”等大型演出活动中的“出圈”机会,加强新人、新作与新青年、新平台的连接,打破传承的时空界限与代际隔阂,这将有助于更好地彰显剧种的艺术魅力和时代价值。(记者  孙丛丛)
集装箱行业加速绿色低碳升级
  2025集装箱多式联运亚洲展上发布的最新数据显示,2024年我国集装箱总产量超810万标准箱,较2023年增长268.2%,再创历史新高。   2024年,我国集装箱供应链水平持续提升,产业链协同更加稳定,集装箱生产及上游企业积极配合,通过优化生产流程、稳定资源供应等方式保障订单交付。中国集装箱行业协会副会长李军表示,我国拥有集装箱全产业链集群,具备全供应链体系、全产品系列、全技术能力和全面的配套服务体系。   国际市场显著增长   近日,中国集装箱行业协会发布《中国集装箱供应链发展报告(2024)》显示,2024年我国集装箱产量占全球96%,产能主要分布在长三角和珠三角地区。   其中,国际标准干货集装箱是集装箱生产的主力箱型,2024年,约占我国集装箱总产量的91.3%。此外,冷藏集装箱产量约占我国集装箱总产量的3.8%;铁路35吨敞顶箱产量占比约为0.7%;罐式集装箱产量占比约为0.6%;其他类型集装箱产量占比约为3.6%。   “2024年,我国集装箱生产量继2021年后再创历史新高,是过去5年集装箱平均产量的2.2倍。这主要是多重因素叠加推升了集装箱市场需求。”中国集装箱行业协会弘景智库副主任罗先立分析,一是红海危机等冲击了集装箱供应链,推动了需求增长;二是航运公司和租箱公司为应对地缘政治影响及国际贸易形势变化,备箱意愿增强。   数据显示,2024年,集装箱国际市场显著增长。从出口数量来看,我国集装箱出口数量较上年增长135.7%,扭转2022年、2023年连续两年下降的态势;从出口金额来看,2024年,我国集装箱出口额为170.4亿美元,较上年增长105.8%;出口箱型结构上,40尺国际标准干货集装箱占比超过50%。   虽然出口数量增长,但集装箱价格仍处于较低水平。罗先立介绍,2024年集装箱出口额增幅低于出口量增幅,集装箱箱价较上年下滑,国际标准干货集装箱箱价同比下降约15%,冷藏集装箱箱价同比下降6.2%。   推进绿色低碳发展   在出口数量和金额均大幅增长的同时,国内集装箱市场发展势头也不错。2024年,集装箱国内市场销量达到47.7万标准箱,较上年增长35.8%。   不过,由于国际市场销量激增、国内市场基数较低,使得国内市场销售占比下降。   李军认为,从国内市场来看,关于促进集装箱发展的政策频出,利好国内集装箱市场,集装箱产业仍具有较大潜力。   2024年,交通运输部等多个部门相继推出《有效降低全社会物流成本行动方案》《交通物流降本提质增效行动计划》等,持续推动集装箱多式联运发展。   按照部署,到2027年,港口集装箱铁水联运量年均增长15%左右。近年来,集装箱国内市场需求保持在50万标准箱左右的规模。随着我国交通物流降本提质增效进程加快,以及多式联运“一箱制”推进实施,将持续带动国内集装箱市场需求。   今年3月10日,《冷藏集装箱智能终端技术规范》等4项交通运输行业标准发布,国内特种集装箱推广应用步伐加快。   罗先立介绍,与国际市场不同,国内集装箱市场呈现3个特点:一是以高频次、小批量的用箱需求为主;二是注重不同货物运输场景的定制化需求;三是需求主体主要为国际陆港及物流园区的运营商、内河航运企业、多式联运经营人、港口物流企业等。   根据国内用箱的需求特点,集装箱行业积极拓展冷藏集装箱、罐式集装箱国内市场。铁路50英尺等大容积集装箱投入量和覆盖区域将持续扩大,卷钢、水泥、沥青、豆粕等货类集装箱加快推广应用,铁路35吨敞顶箱海铁联运“一箱制”班列有序推进……这些都将促进国内集装箱需求增长。   “绿色低碳正成为集装箱行业发展的主基调。”罗先立介绍,绿色材料创新驱动产业升级,绿色能源应用加快拓展,集装箱生产和配套企业推进“零碳工厂”建设……一系列节能减排技术和节能设备加快改造步伐,助推集装箱全产业链节能减排。   集装箱供应链碳核算与绿色认证体系将加快完善。2024年下半年,中国集装箱行业协会先后发布《推进集装箱绿色发展倡议及标准体系建设工作建议》和《中国集装箱行业绿色低碳发展工作方案及第一阶段工作计划》。在此基础上,集装箱行业将继续推进绿色低碳进程,组织上下游企业共同参与,为集装箱相关企业绿色低碳发展提供有力支撑。   积极应对市场变化   总体上看,集装箱行业受经济形势、外贸水平、船队规模、流转效率、安全局势等多方面影响,市场波动大。比如,2021年我国集装箱产量创下历史新高后,2022年、2023年产量均出现下降。2024年,集装箱行业在再创历史新高的同时也积极应对可能出现的波动。   “结合行业调查及对集装箱市场面临的形势研判,我们认为集装箱供应链进入了调整期。近期看,集装箱市场将回归常态。”罗先立说,集装箱新箱处于高库存,全球集装箱保有量规模已达5800万标准箱,航运公司和租箱公司订购新箱的紧迫性减弱,对集装箱市场造成较大下行压力。   与此同时,全球贸易和安全形势还面临许多不确定因素。   业内专家分析,综合研判当前形势和未来趋势,建议集装箱行业、企业要持续稳固自身优势,练好内功,同时紧跟国际需求变化,不断调整适应,积极应对变化。(记者 齐慧)
2025“五月演出季”官宣: 28部剧目96场演出“京”彩纷呈
  北京演艺集团2025“五月演出季”重磅官宣,精彩来袭!作为北京演艺集团十年倾力打造的演出季品牌,今年第十一届从5月1日至6月1日,共带来4大单元板块、28部作品、96场演出,为首都市民打造一场跨越春末夏初的文化盛宴。   “伯爵号”五一假期剧场扬帆起航 “主角”用舞蹈肢体吟唱命运悲歌   五月好戏云集,多部精品佳作将在北京天桥艺术中心集中上演。音乐剧《基督山伯爵》中文版北京站8场连演开启“五一”小长假,北京演艺集团旗下北京歌剧舞剧院音乐剧团团长、剧目制作人和主演阿云嘎,联袂赵超凡、娄艺潇、徐瑶、徐丽东等众多实力派原班人马回归,让观众感受文学经典的深度舞台呈现,更有限定活动“假面舞会”邀请大家与“伯爵“共舞”;改编自茅奖小说,集结文学、舞蹈、戏剧界豪华主创阵容倾力打造的舞剧《主角》5月9日至11日重磅首演,剧目将横跨40年78万字的长篇巨著浓缩于舞台之上,巧妙融合舞蹈肢体与秦腔元素,以全新视角和艺术表现手法,让观众感受文学与舞台艺术融合的独特魅力。   让艺术跨越时空与地域 新疆的大漠、青海的高原、拉萨的河水即将走上舞台   以国宝文物为灵感创作,荣获“五个一、文华”双项大奖、惊艳央视春晚舞台的舞剧《五星出东方》5月23日至24日将携西域传奇故事登上舞台,全国巡演超百场好评,被观众评价为“含舞量”超高的口碑佳作;全国儿童剧高分榜第1名、大麦评分9.9的原创藏风儿童剧《高原上的黑眼睛》5月10日至11日即将温情上演,不出北京也能欣赏到三江源的美,这部“遛娃神剧”千万别错过;5月16日至18日,话剧《远方的拉萨河》将动人援藏故事搬上舞台,剧目用艺术形式巧妙融合京藏两地极具鲜明地域特色的元素与符号,以平凡故事展现不平凡的感动与美好。   传统戏曲、京味经典、热门IP改编创作 十三大艺术门类带来丰富视听文艺盛宴   北京演艺集团旗下文艺院团“国家队”多部好戏登台,带来高品质精彩演出。中国杂技团建团75周年特别演出“登峰造‘技’——中国杂技团建团75周年精品展演”,5月9日至11日将在二七剧场上演;中国评剧院新创作品《咫尺千里》5月10日至11日唱响梅兰芳大剧院,传统经典剧目《花为媒》《秦香莲》《杨三姐告状》5月19日至21日登台人民剧场;中国木偶艺术剧院改编创作自经典神话IP与热门动画IP的木偶剧《孙悟空三打白骨精》《哪吒闹海之龙灵石传说》《海底小纵队在中国》之东海救援5月1日至5月10日在中国木偶艺术剧院为小朋友们带来快乐与惊喜。   梆韵声腔交织时尚国乐,中华优秀传统文化魅力绽放舞台。北京演艺集团旗下北京市河北梆子剧团带来的经典剧目《王宝钏》和集团重点剧目、讲述密云水库建设保护动人故事的《密云十姐妹》,将于5月7日至8日、11日在长安大戏院登台亮相,更有深受戏迷喜爱的河北梆子《金玉奴》5月17日在民族文化宫大剧院上演。北京民族乐团推出的“青春乐拍《胡同》”、成立十周年系列音乐会《五行》、《彩云追月》将分别于 5月3日、10日、30日在国家大剧院、中山公园音乐堂、北京艺术中心奏响国乐之声。   地道京味曲韵悠扬,南锣剧场即将好戏开场。北京演艺集团旗下北京儿童艺术剧院四部好评儿童剧《甲骨文学校1》《米小圈之银河侦探社》《你看起来好像很好吃》《封神之哪吒大战海龙王》将串联整个五月在南锣剧场和中国木偶艺术剧院,为小朋友们打造欢乐戏剧海洋,是亲子同行的绝佳去处。北京曲艺团四大名著主题专场演出《红楼缘梦》《国学中的曲艺》将于5月16日至17日,5月29日至30日在东图剧场、北京天桥艺术中心带来最地道的京味演出。北京市曲剧团将于5月3日至6日在北京天桥艺术中心带来北京唯一地方戏北京曲剧《少年天子》《离婚》,以及5月31日在中国儿童艺术剧院还将上演北京曲剧《运河遥啊谣》(暂定名),看北京曲剧,品京腔京韵之美。   北京演艺集团2025五月演出季,共将为观众呈现5部集团重点精品大戏,9部彰显传统文化技艺佳作,7部适合全家共赏儿童剧,7场京腔京韵的曲艺、民乐及戏曲演出。让我们欢聚剧场,五月不见不散。(记者 杜娟)   2025“五月演出季”演出排期:   
OpenAI发布生图神器狙击谷歌!一句话P图奥特曼现场玩梗
就在刚刚,OpenAI 宣布在 GPT-4o 模型中集成了迄今为止最先进的图像生成器。 OpenAI CEO Sam Altman 在 X 平台继续夸夸群主上线,表示初次见到模型生成的图片时,难以相信是 AI 所为,并期待用户能发挥创意。 新功能亮点如下: 能够精确渲染文本内容 支持多模态输入输出(文本、图像、音频) 能理解复杂指令并结合上下文 能创建具有真实感的第一人称视角图像 遵循指令,可以处理上传的图片并进行编辑或风格转换 先来感受一下新模型生成的图片: 向左滑动查看更多内容 最新版本的系统卡写到,与作为扩散模型的 DALL·E 不同,4o 图像生成是一个自回归模型,原生嵌入在 ChatGPT 中。 具体来说,比起其他图像生成模型,GPT-4o 能处理多达 10-20 个不同物体的复杂指令,远超竞争对手 5-8 个的限制,差距不是一般大。 一句话 P 图也行,该模型同样支持多轮图像生成,聊着天就能优化图像,确保角色等元素在多次迭代中保持一致性。 比如设计个游戏角色,改来改去外观都能稳住,还能分析用户上传的图像、细节抓得准,并指导后续图像生成。 目前,新功能已向 Plus、Pro、Team 和免费用户开放,Enterprise 和 Edu 用户即将获得访问权限。别急,开发者们几周后也能通过 API 用上这功能。 附体验链接:https://chatgpt.com/ 使用 GPT-4o 创建和自定义图像非常简单,只需描述需求,包括纵横比、精确颜色或透明背景等规格。不过要是细节多,渲染可能得等上一分钟,毕竟慢工出细活嘛。 今天凌晨召开的发布会也向我们展示了几个具体的案例。比如说,演示者拍了张仨人的合影,让 ChatGPT 改成动漫风。 结果模型不仅保留了三人的特征(如胡须、表情等),还能理解并融合「动漫」这一视觉风格。 接着他又让它改成互联网梗图,加上了「I FEEL THE AGI」的文字,果然,OpenAI 的发布会少了 AGI 总感觉差点意思,属实是传统艺能了。 又或者,演示者要求模型创建一个「描述相对论的彩色漫画页面,并添加幽默元素」。 模型生成一个结构完整的漫画页面,包含了相对论相关概念的解释,融合了不同语言的文字,并通过视觉表现形式呈现出幽默效果。 换句话说,能够将抽象科学概念可视化,有望利好教育领域。 还有演示者先上传了一张 Sora 发布会的交易卡片照片作为参考,然后上传了自己宠物狗的照片,并提供了卡片上应包含的具体信息(名称、年份、能力、体重身高等)。 模型很快整出一张风格统一的卡片。卡片里,狗狗站在滑雪板上帅气出场,文字排版清晰准确。 继续上强度,演示人员拿前两个演示的图加上背景两张图,让模型设计一枚纪念币,并指定了特定的颜色代码(春季色彩)和文字要求。 模型成功将四张不同图像以和谐方式融合到一个币面设计中。他随后还要求将背景改为透明,以便实际打印,模型稳稳改好,设计也没走样。 AI 生成图像造成的危害已经不是什么新鲜的话题了。为了安全,所有生成图像都带有 C2PA 元数据标识,OpenAI 还构建了内部搜索工具,验证内容来源,以及阻止违反内容政策的图像请求。 当要求生成真人图像时,OpenAI 则管得更严。包括 Altman 也表示,OpenAI 希望工具默认不生成冒犯性内容,除非用户明确要求,并在合理范围内实现。 那新功能也存在比较明显的短板。比如偶尔裁剪不恰当、低上下文提示下可能产生幻觉、渲染非拉丁语言文本困难、局部调整不够细等。OpenAI 说了,这些小问题会在发布后慢慢优化。 此外,Google 于今天凌晨也发布了旗下迄今为止最强大的 AI 模型。 Google CEO Sundar Pichai 在线打 Call,称 Gemini 2.5 Pro Experimental 是一款最先进的「思维」模型,在多个基准测试中领先,特别是在推理和编程能力上有了显著的提升。 在大模型竞技场 Chatbot Arena 中,新模型力的排名压 Gork 3,再次遥遥领先。 按照 OpenAI 过往的「狙击」作风,新模型的发布一方面是对上周 Google 发布的图像模型进行回击,另一方面同样是狙击 Gemini 2.5 Pro Experimental。 你方唱罢我登场,AI 巨头们针锋相对的戏码只会越演越烈,消停?看来是想都别想了。
电视剧《北上》—— “情”是年代剧的生命线
  电视剧《北上》海报。   资料图片   在网络内容层出不穷、不断争夺注意力的今天,年代剧何以在视听市场顽强占据一席之地?正在热播的电视剧《北上》或许提供了一种答案。它以独特的审美和叙事,满足观众日益升维的视听需求,又以对个体情感的用心观照,给人以情感抚慰和价值共鸣。   《北上》的叙事是生活化的,开篇以一个4分多钟的“认门”长镜头,勾勒出3代人、6个家庭之间包容互助的真情,构筑起独属于运河人家的烟火气和人情味。观众感慨:“《北上》让中国传统式的邻里关系回来了。”作品以温存但不美化的目光回望过去,不仅复现了当时的社会环境,而且让人物命运连通时代情绪,让故事有了情感锚点。为了还清邻居们买船入股的钱,梁海泓没有躺平,她要让因跑船生意一落千丈而日渐颓废的丈夫谢天成明白,一个卖早点的家庭妇女也能学开大货车赚钱,带领这个家走出困境。面对婆婆提出过继的无理要求,多年带着女儿忍气吞声的李燕终于爆发,如同从背后猛击一掌,促使家人振作起来。这些情节抵抗住了“话题叙事”的诱惑,让人物“是其所是”,于细微处勾连起荧屏内外。   年代剧往往给人画面泛黄的印象,但《北上》始终洋溢着青春与活力,它以青春化表达塑造成长型角色,传递出一种温暖且振奋的力量,让观众在年代叙事中看到指向未来的“箭头”。作品将90后成长史融进运河百年变迁,在如何让乡愁与梦想共生、让传统与现代共舞的解题中,实现人与运河的双向奔赴。   谢天成身为“船老大”的时代,因陆运取代水运的大势而落幕,谢望和、夏凤华等一众童年玩伴,也懵懂又勇敢地感受着时代变革。经济变迁与个人成长的交织,让“北上”成为他们的共同选择,“花街六子”们从乡土嬉闹到都市闯荡的生命轨迹,镌刻着许多80后、90后的集体记忆,也暗含着现代化进程中挣脱舒适区、对未知与可能性的热烈拥抱。   《北上》将运河的兴衰放置于代际关系中书写,凸显了传承与创新的主题。剧中,新生代的拔节成长、创业突围与父辈“搁浅”于运河经济的生存处境,形成极具张力的代际叙事。一条沉船勾连出百年秘辛,三代人接力破解运河密码,新旧碰撞的火花里,年轻一代懂得了什么叫“根”。剧作巧妙地将2000年的少年身影与1950年父辈拉纤的剪影交织重叠,又让2014年北京写字楼里跳动的数据流与运河古道上亲人们的足迹遥相呼应。运河这个地理坐标,已经被升华为承载文化记忆、凝聚情感认同的精神原乡,增添了作品的历史厚重感。   作为一部年代剧,《北上》通过情绪的表达、情感的体认,最终完成了情怀的彰显。歌谣文理,与世推移。虽然人生甘苦的内容和表现形式已然不同,但丝毫不影响我们穿越时空,在年代叙事中看见自己的真实悲欢,更看见面对人生起伏时的那种坚定信念何以生生不息。(张  硕)
特朗普要在美推广马斯克的星链 官员质疑:长期使用成本太高
星链终端 凤凰网科技讯 北京时间3月26日,据彭博社报道,特朗普政府正在对一项价值420亿美元的宽带补贴计划做出调整,此举将让埃隆·马斯克(Elon Musk)旗下星链等卫星互联网提供商受益。然而,一些州和联邦官员担忧,卫星互联网技术无法大规模、低成本地为美国民众提供可靠的网络连接。 此前,拜登政府制定了宽带公平与接入部署计划(BEAD),希望为每个美国家庭提供快速、可靠的家庭互联网服务。该计划主要依赖光纤线路,虽然安装成本高,但使用时间可达数十年。不过,在特朗普上任后,马斯克大力游说美国政府转用卫星网络,并获得了共和党的支持,其中包括参议院商务委员会主席特德·克鲁兹(Ted Cruz)。 然而,一些州政府官员和前联邦官员在接受彭博社采访时以匿名方式透露,美国商务部长卢特尼克推广卫星网络的新政策存在问题。虽然卫星网络最初价格低廉,但长期费用较高。一位州政府官员分享的内部数据显示,卫星服务在30年内将使消费者的成本增加53%,维护成本也将增加一倍以上。 “这些技术之间的区别目前似乎还没有一个清晰的认识,选择一种技术弃用另一种技术所产生的长期影响也不清楚。”拜登政府时期负责宽带项目的前负责人埃文·费因曼(Evan Feinman)。他在本月离开了商务部。 根据一位匿名州宽带官员分享的分析,光纤铺设到家的安装成本至少为每户1500美元。然而,这项成本可能会因住户所在位置、周围现有基础设施完善情况等因素存在很大差异。得州估计,安装光纤到每个家庭的成本大约为1万美元。 相比之下,星链提供的标准家庭套件大约为600美元,该费用也可能存在波动。然而,根据该州的分析,星链的卫星每五年就需要更换,这使得卫星服务的长期成本大幅增加。分析还显示,光纤在30年内为25万户家庭提供服务的总体成本,比卫星服务节省了大约40亿美元,每个家庭将节省1.56万美元。 美政府的宽带计划转用卫星服务将为星链带来更多利润。《华尔街日报》报道称,根据当前的BEAD计划,星链有望获得41亿美元宽带补贴资金。如果特朗普政府转用卫星服务,星链可能会获得100亿美元至200亿美元补贴资金。 除星链外,亚马逊、OneWeb也在提供或计划提供卫星互联网服务。截至发稿,SpaceX、亚马逊以及OneWeb尚未就此置评。 (作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
OpenAI发布新文生图模型,免费、逼真到难以分辨
今天凌晨2点,OpenAI进行了技术直播,对GPT-4o和Sora进行了重大更新,提供了全新文生图模型。 除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。 尤其是生成图像的逼真度,肉眼几乎看不出任何破绽,在精细度、细节和文本遵循方面非常出色,可以媲美甚至在某些功能超过该领域的头部平台Midjourney。 新图像模型功能展示 话不多说,「AIGC开放社区」就用免费版为大家展示一下实际的生成案例。 我们先测试一下模型的文本还原和细节表现,来个复杂点的提示词 提示词:一个由甜品组成的奇幻世界,地面是柔软的奶油草坪,树木是用巧克力棒和糖果制作的,树叶是五彩缤纷的果冻。天空中漂浮着巨大的棉花糖云,远处有一个冰淇淋火山正在喷涌彩色的糖浆。 场景中还有一座用蛋糕堆砌的小屋,屋顶是草莓酱,窗户是糖玻璃,细节包括散落的糖粒、路上的巧克力碎片,以及跳跃的小糖果精灵。 构图、文本还原能力非常棒!一次就完成,生成时间大约在15秒左右。 再试一下它的新功能,其实OpenAI官方说这是一个“世界知识”功能,但是使用之后感觉更像是一个图像PPT功能,对于教育、金融、医疗等领域帮助非常大。 例如,帮我用图像介绍牛顿第一定律。就能直接生成详细介绍牛顿定律的图像,感觉和PPT差不多吧。 提示词:用一张图片介绍人体各个结构。 这个人体介绍图片就丰满很多,放在医疗介绍或PPT里应该不错吧。以后做各种宣传资料不愁找不到量身定制的图片了。 如果不满意,可以基于该图片继续发问,例如,我们想看上面人体介绍的骨骼。提示词:可以详细展示骨骼介绍吗? 我们放大手部骨骼,继续提问:来一张手部骨骼的特写。 需要注意的是,图像的文字介绍可能比较模糊或混乱,这是因为中文提示的原因,如果使用英文会好很多。 那我们就用英文提示词来试一下,In a study filled with a retro atmosphere, on the corkboard beside the wooden desk, magnetic word - spelling cards fixed with colorful pushpins form a unique poem: Line 1: "A melody" Line 2: "Can wake up" Line 3: "The slumbering memories," Line 4: "However, occasionally" (There is a large gap here) Line 5: "On a silent night" Line 6: "Will deepen" Line 7: "That longing." 文字的嵌入和排列顺序还是相当不错的。 这个提示词的大意是,在一间充满复古氛围的书房里,木质书桌旁的软木板上,挂着用彩色图钉固定的磁性拼词卡片,组成一首独特的诗:第一行:“一段旋律” 第二行:“能唤醒” 第三行:“沉睡的记忆,” 第四行:“然而偶尔” (此处有较大间隔)第五行:“在寂静的夜晚” 第六行:“会加深” 第七行:“那份思念。” 上面只是一些非常简单、基础的玩法,有兴趣小伙伴可以体验一下非常棒。 对于新的文生图模型,OpenAI联合创始人兼首席执行官Sam Altman也给出了非常高的评价。 这是一项令人难以置信的产品。我还记得看到这个模型最初生成的一些图像时,很难相信它们真的是由人工智能创作的。我们认为大家会喜欢它,并且很期待看到由此激发的创造力。 这代表着我们在给予创作自由方面达到了一个新的高度。人们将会创作出一些非常了不起的作品,也会有一些可能冒犯他人的内容;我们的目标是,除非用户有此需求,否则该工具不会生成冒犯性内容,即便有此需求,生成的内容也需在合理范围内。 正如我们在模型规格说明中提到的,我们认为将这种知识创作自由和控制权交到用户手中是正确的做法,但我们也会观察其发展情况并倾听社会的声音。 我们认为,尊重社会最终为人工智能设定的广泛界限是正确的做法,而且随着我们离通用人工智能越来越近,这一点也变得越来越重要。在此过程中,感谢大家的理解。 新图像模型简单介绍 根据直播介绍,非自回归生成是OpenAI新图像模型的核心之一,是提升图片质量、生成效率的关键技术。 传统的图像生成方法,尤其是基于自回归模型的技术,通常是通过逐步生成图像的每个像素或部分来构建最终的图像。这种方法虽然在某些情况下能够生成高质量的图像,但其生成过程往往较为缓慢,并且容易在生成过程中出现累积错误,导致最终图像的质量下降。 此外,自回归生成方法在处理复杂的图像结构时也存在一定局限性,因为它们需要在每一步生成过程中都依赖于之前生成的内容,这使得模型难以全局性地理解和优化图像的整体结构。 相比之下,非自回归生成模块采用了一种全新的思路。不再依赖于逐像素的生成过程,而是直接生成整个图像。这一过程的关键在于模型能够一次性地理解和处理图像的整体结构和细节。非自回归生成模块通过一种特殊的编码器-解码器架构来实现这一目标。 编码器负责将输入的文本描述或其他模态信息转化为一种中间表示,包含了生成图像所需的所有关键信息。然后,解码器利用这种中间表示直接生成完整的图像,而无需逐像素地构建图像。 这种直接生成完整图像的方式带来了很多优势。首先,非自回归生成模块的生成速度远远超过了传统的自回归方法。由于无需逐像素生成,模型能够在短时间内生成高质量的图像,这对于实时应用和大规模图像生成任务具有重要意义。例如,在需要快速生成大量图像的设计场景或教育场景中,非自回归生成模块能够显著提高工作效率。 此外,非自回归生成模块在生成图像的质量上也表现出色。由于模型能够一次性地理解和处理图像的整体结构,生成的图像在细节和一致性方面都得到了显著提升。 例如,在生成复杂场景的图像时,非自回归生成模块能够更好地处理图像中的多个对象及其相互关系,生成的图像更加自然和逼真。此外,非自回归生成模块还能够更好地处理文本指令中的复杂语义信息,生成与文本描述高度一致的图像。 非自回归生成模块的另一个重要特点是其在多模态融合中的应用。在ChatGPT 4.0模型中,非自回归生成模块不仅能够根据文本描述生成图像,还能够结合其他模态的信息,如音频或已有的图像,生成更加丰富和多样化的图像内容。 这种多模态融合的能力使得模型能够更好地理解和满足用户的需求。例如,用户可以提供一段音频描述和一张参考图像,非自回归生成模块能够结合这些信息生成一张符合音频描述且风格与参考图像一致的新图像。 从今天开始,新的文生图模型在ChatGPT和Sora中开始向所有Plus、Pro、Team和免费用户推出。面向企业版、教育版和API即将到来。 本文素材来源OpenAI,如有侵权请联系删除 END
谷歌地表最强模型深夜来袭!Gemini 2.5 Pro发布即屠榜,代码推理杀疯了
新智元报道 编辑:Aeneas 好困 【新智元导读】Gemini 2.5 Pro,刚刚深夜上线了!这个「思考」模型专为复杂任务打造,推理能力强大,一经诞生就横扫各大榜单、拿下各类TOP 1,还创下了历史上最大分数飞跃纪录。 就在刚刚,谷歌的全新模型Gemini 2.5 Pro,果然深夜上线了! Gemini 2.5 Pro是一个「思考」模型,能够在回应前先进行思考推理,从而提升性能,并改善准确性。 谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的Gemini的所有功能(长上下文、工具等)。 它在多个基准测试中达到了SOTA水平,并且以显著的优势在LMArena上排名第一。 现在,Gemini 2.5 Pro已经登顶了Arena排行榜的第一位,而且创下了历史最大分数飞跃,比Grok-3/GPT-4.5整整高出了40分! 在代号「nebula」的测试中,它也横扫所有类别夺得第一,并且独揽数学、创意写作、指令遵循、长查询和多轮对话五大领域的冠军! 在困难提示词和编程两大领域,它与Grok-3/GPT-4.5拿到了并列冠军,而且在所有其他比拼中都以微弱优势胜出,成功问鼎榜首! 此外,Gemini 2.5 Pro还成功登顶了视觉竞技场(Vision Arena)排行榜榜首! 在网页开发领域,它也同样大放异彩,成功斩获网页开发竞技场(WebDev Arena)亚军宝座! 它是首个实力媲美 Claude 3.5 Sonnet 的模型,相比之前版本的Gemini更是实现了质的飞跃。 这一次,谷歌的模型又展现出巨大的飞跃,OpenAI、Anthropic、DeepSeek等竞争对手,在多久时间内会赶上? 目前,Gemini 2.5 Pro已在Google AI Studio和Gemini应用中,向Gemini Advanced用户开放,并将很快在Vertex AI上推出。 而它的定价方案,会在未来几周内公布,用户可以在更高使用配额下,将模型应用于大规模生产环境。 网友实测后发现,它果然实力惊人,在所有模型中效果拔群,第一次尝试就只用几秒解决了一道难题。 Gemini 2.5 Pro上线! 谷歌表示,在AI领域,系统的「推理」能力不仅仅指分类和预测,而是指系统分析信息、得出逻辑结论、融入上下文和细微差别,以及做出明智决策的能力。 长期以来,谷歌一直在探索通过强化学习和思维链提示词等技术,让AI更智能、更具推理能力的方法。 正是在此基础上,他们在2月推出了第一个思考模型,Gemini 2.0 Flash Thinking。 而今天,通过Gemini 2.5,他们结合了显著增强的基础模型和改进的后期训练,让模型达到了新的性能水平。 推理和代码能力大幅提升 Gemini 2.5 Pro展现出了强大的推理和代码能力,在常见的编程、数学和科学基准测试中均处于领先地位。 另外,在各类需要高级推理能力的基准测试中,它都达到了SOTA水平。 无需使用测试阶段会增加计算成本的技术(如多数投票法),2.5 Pro就能在GPQA和 AIME 2025等数学和科学基准评测中表现卓越。 而且,在不使用任何外部工具的条件下,它就在挑战人类知识和推理能力的极限前沿「人类最后的考试」中取得了18.8%的准确率,达到业界领先。 在编程能力上,Gemini 2.5相比2.0版本也实现了质的飞跃,而这,仅仅是个开始。 2.5 Pro在创建视觉精美的网页应用和AI智能体代码应用方面都表现卓越,在代码转换和编辑领域中,也同样实力出色。 在智能体代码评估的行业标准测试SWE-Bench Verified上,Gemini 2.5 Pro靠使用自定义智能体配置,就获得了63.8%的优异成绩。 以下这波demo,就展示了Gemini 2.5 Pro如何运用强大推理,仅通过一行提示词,就能生成可执行代码,来创建完整的动画和游戏。 在下面这个demo中,仅仅根据下面这行prompt,它就生成了一段p5js的交互式动画,展示了「宇宙鱼」的场景,并且还显示了鱼们都在想什么。 它还根据以下prompt,生成了一个无限的恐龙跑酷游戏。 按照要求,它生成了像素化的恐龙图像和有趣的游戏背景。 随后,Gemini 2.5 Pro还通过编程实现了分形可视化。 它创建出了精细分形图案的模拟程序,展现出了神奇的曼德布洛特集合。 此外,它还能构建一个交互式气泡图,直观展示出了每个大陆的经济与健康指标随时间的变化。 或者用一段交互式的Javascript动画,展示了旋转六边形内多彩的人工生命群体,并且按要求做成了「超新星星云」的感觉。 另外,它还能开发粒子系统模拟,给出了一个HTML文件,创造出了反射星云的沉浸式交互模拟场景。 原生多模态和超长上下文 Gemini 2.5继承并发扬了Gemini 模型的优势——原生多模态能力和超长上下文长度。 自己发布之初,2.5 Pro就支持100万token的上下文窗口(而200万token也即将推出!),性能显著超越了前代模型。 这能让它理解海量数据集,并处理来自多种信息源的复杂问题,包括文本、音频、图像、视频,甚至完整的代码仓库。 最后,既然谷歌已经掏出了地表最强模型,接下来,就让我们坐等OpenAI的反应了。 参考资料: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking https://deepmind.google/technologies/gemini/pro/ https://x.com/lmarena_ai/status/1904581128746656099
3000亿逆袭3万亿!印度码农用云计算暴打苹果谷歌
2014年的微软总部弥漫着焦虑的气息,落地窗外西雅图的阴雨仿佛浸透了每个员工的衬衫。史蒂夫·鲍尔默最后一次以CEO身份走进董事会的脚步格外沉重,会议桌上的数据报表像一本黑色幽默小说:Windows系统市场份额持续流失,智能手机战场被苹果碾压,云计算领域落后亚马逊五年,股价在33美元徘徊了整整十年。曾有分析师刻薄地说:"微软就像博物馆里的恐龙骨架——壮观但毫无生气。" 在茶水间端着咖啡的萨蒂亚·纳德拉凝视着纸杯上的水渍,这个来自印度海得拉巴的工程师突然想起家乡的季风。儿时在板球场上的记忆涌上心头——当暴雨突袭时,真正的队长不会让队员躲雨,而是带领大家调整击球策略。47岁的他摸了摸西装口袋里的《薄伽梵歌》,推开董事会大门的瞬间,命运的齿轮开始转动。 上任第一周,纳德拉做了件震惊华尔街的事:在全员大会上公开放映iPhone广告。当库克的声音回荡在微软礼堂,前排高管们的脸色比窗外的乌云更阴沉。"我们要停止把世界看作Windows与苹果的对立战场,"他指着屏幕上流畅的iOS系统,"真正的战争在云端。"这句话如同板球棍击碎玻璃窗,飞溅的碎片划破了微软延续二十年的操作系统崇拜。 在比尔·盖茨私人办公室的深夜长谈中,两位技术先知用白板推演着云计算的未来。纳德拉用工程师的缜密计算出每个数据中心的边际成本,盖茨则用创业者的直觉勾勒出企业服务的生态闭环。"Azure不能只是追赶亚马逊的云存储,"盖茨用马克笔圈住白板上的流程图,"要成为数字时代的电力公司。"这个比喻让纳德拉想起海得拉巴老家的变压器——看不见却支撑着整个街区的生机。 转型的阵痛比预期更剧烈。当纳德拉宣布开放Office套件登陆iPad时,视窗部门主管当场摔门而去;提议收购领英时,财务总监拿着报表的手在发抖:"260亿买求职网站?这足够开发三代Windows系统!"但纳德拉在董事会上展示了令人震撼的数据可视化:领英每个用户的职业图谱都是潜在云服务客户,每份简历更新都在标记企业软件需求。这就像他年轻时痴迷的板球运动——真正的战略家能从击球手的挥棒轨迹预判球的落点。 2018年某个雨夜,微软研究院的地下实验室里,纳德拉抚摸着初代Surface电脑的金属外壳。突然响起的视频通话打断了他的沉思——OpenAI的阿尔特曼在屏幕那端兴奋地展示着GPT-3的雏形。两个技术狂人隔着12小时时区讨论到黎明,纳德拉的衬衫袖口沾满了白板笔的墨迹。当晨光穿透云层时,他签下了改变科技史的百亿美元投资协议,就像二十年前盖茨押注图形界面般决绝。 2020年的疫情黑天鹅成了微软的涅槃之火。当全球企业挣扎着搭建远程办公系统时,Teams视频会议的用户量以每分钟3000人的速度暴涨。纳德拉命令工程师们拆解了Xbox云游戏的代码架构,将其底层技术注入Azure服务器。"这就像用板球投球手法打棒球,"他在内部邮件中写道,"重要的是解决问题的核心逻辑,而不是形式。"十二个月内,微软云服务的市占率从17%飙升至31%,亚马逊AWS的城墙第一次出现裂痕。 收购动视暴雪的决定再次让华尔街哗然。680亿美元的天价背后,纳德拉在备忘录里写下一段诗意的话:"游戏世界里的每个虚拟化身,都是元宇宙的原始细胞。"当分析师质疑时,他展示了Xbox云平台与Azure的神经连接图谱——暴雪1.2亿月活用户的数据流,正在训练着下一代AI模型的认知能力。这让人想起他童年拆解收音机的执着:所有看似无关的零件,终将在某个电路板上共振。 2023年春天,纳德拉站在新落成的智能云园区顶楼,俯瞰着数据中心的蓝色光点如星河闪烁。他的西装口袋里依旧装着那本翻旧的《薄伽梵歌》,扉页上有句用梵文写的批注:"变革不是破坏,而是让旧元素在新维度重生。"此时的微软市值突破3万亿美元,Azure年收入超过500亿,但最让这位CEO自豪的,是开发者论坛里00后工程师的留言:"在微软生态里,我的代码能变成治愈罕见病的AI诊断模型。" 回望这场惊心动魄的转型,纳德拉在自传中揭示的不仅是商业智慧,更暗合熊彼特"创造性破坏"的经济学真谛。当传统路径依赖形成沉没成本陷阱时,真正的企业家会像量子跃迁般突破势垒。微软的故事证明:组织的生命力不在于现有资产的规模,而在于将技术资本、人力资本和愿景资本重新组合的勇气。就像纳德拉家乡的板球场——胜负从不取决于场地大小,而在于击球手能否在风向突变时,将劣势转化为独特的旋转弧线。
DeepSeek的一次小更新,堪比发布新模型
一个好消息,时隔俩月, DeepSeek 终于更新了。 就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。 模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。 根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。 现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。 不过有一说一,虽然 V3-0324 仅仅只是 V3 的小版本升级,并不是大伙儿期待已久的 V4 或者 R2 ,且官方账号也没有发布任何跟模型有关的信息。 但也丝毫不妨碍, V3-0324 一上线,就有人说他的代码能力,直追克劳德。 新版本的模型刚一上传,就登上了 Hugging Face 的趋势榜单。 在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。 图源 @karminski 牙医 重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。 所以在 V3-0324 上线不到一天的时间里,就已经有很多老哥迫不及待上手测评了一波。 这么说吧, V3-0324 在这些人手里,已经成了拳打 o3-mini ,脚踢 Claude 3.7 Sonnet 的存在。 经典的小球弹跳测试中,这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。 o3-mini 刚开始看着还不赖,但估计物理没学好,外面的六边形都转到垂直的位置了,球还不知道往下掉。 R1 的表现,也是有些让人摸不着头脑。。 相对来说, V3-0324 生成的结果是表现最好的,这位老哥丝毫不吝啬对它的夸奖,说它 “ 表现得像唯一排名第一的非推理模型 ” 。 让 V3-0324 生成一个网页,模型一口气写了 800 多行代码,运行的时候还没有出错,这什么实力不用多说了吧。 在评论区底下,有人仅仅下达了编写登录页面的简单指令,并没有任何其他的附加提示,同样也生成了一个完整的登录页面。 还说 V3-0324 在编码上,能跟 Claude 3.7 Sonnet 掰一掰手腕。 更别提其他的模型,性价比各方面相比下来,现在 OpenAI 的 o1-pro 和 GPT-4.5 ,都已经不香了。 反正看了几个网友的测试案例之后,世超对 V3-0324 的前端代码生成能力,已经有了初步的判断。 但不管咋说,没亲自上过手的东西,咱硬夸也有点心虚。所以这次世超也打算简单试一试,看看 V3-0324 到底有多能打。 一上来,世超就让模型做了一个画板,提示词是 “ 帮我用 HTML 代码构建一个画板,支持鼠标绘制、橡皮擦功能和颜色选择 ” ,这次出战的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。 只能说,这把 Claude 3.7 Sonnet 赢得很彻底。光是有取色器这一点,就甩了 V3-0324 不知道几个车尾灯。 更别提 UI 设计了, V3-0324 做出来的画板让世超不是很有创作的欲望。。。 世超着实是没想到,这盆凉水来得这么快,都让我有点怀疑到底是我的提示词没写好,还是模型有问题了。。。 不过,我后面又继续把小球弹跳的提示词,分别喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。 这下味儿终于对了。V3-0324 生成的结果确实牛叉,能很清楚地看到小球在下落触底的时候,产生了小幅度的弹跳。 就是吧,老版本的 V3 压根没运行起来。。。只能说两个版本之间的差距高下立判了。 再来看普通版 Claude 3.7 Sonnet 的结果,优点是底下的转速、重力和摩擦力都是可调节的,弹跳看起来也没什么大问题,但小球有点出画面了。。。 最后,世超又分别让 V3 和 V3-0324 生成一个 Saas 登录页面,提示词就一句话,没有任何的附加信息。 可以看到, V3 的页面倒是做出来了,但没什么设计可言。 反观 V3-0324 ,果然就跟官方的版本更新说明一样,生成的网页更美观了。 综合看下来, V3-0324 的代码能力相比 V3 确实有了比较大的提升,而且在一部分测试案例中,也能够比肩普通版 Claude 3.7 Sonnet 。 但如果要说完全超越 Claude 3.7 Sonnet ,那世超觉着暂时还不太行。 不过大伙儿也别忘了, V3-0324 在开源这个赛道里, V3-0324 已经算得上能打的了。 而且 DeepSeek 的 API 价格业主打的一个便宜。世超对比了 Claude 3.7 Sonnet 和 V3-0324 的 API 价格, V3-0324 百万 tokens 输入的价格是 2 元,百万 tokens 输出的价格是 8 元,而同样的 tokens 数, Claude 3.7 Sonnet 的输入和输出价格分别是 36.6 元和 108.9 元,价差最多有 18 倍。 所以在某种程度上, V3-0324 这个小更新,的确可以跟 Claude 3.7 Sonnet 媲美。 特别是今天晚上,DeepSeek官方还发文,正式介绍了这波小更新,在数学、代码类的相关评测上,V3-0324比OpenAI目前最厉害的非推理模型GPT-4.5都要更胜一筹。 去年 12 月底 V3 上线,紧接着 R1 就在过年的时候上桌吃饭了。如果按照 DeepSeek 之前发布模型的节奏,盲猜一波 R2 也快了。 总之,小版本更新的 V3-0324 就已经如此强悍了,就是不知道,在 DeepSeek 猛烈的开源炮弹下, “OpenAI 们 ” 还遭不遭得住了。 撰文:西西 编辑:江江&面线 美编:萱萱
增强版Sora生图模型发布:不仅能直接在ChatGPT用,还抢了梗图作者的饭碗
在 DeepSeek 24 小时前刚刚发布了 V3 模型 0324 版本更新之后,OpenAI 似乎真的有点「不甘示弱」的较劲感,在北京时间 3 月 26 日凌晨宣布了新产品的发布预告。 虽然在正式开始之前,有一些传言猜测本次有可能发布 GPT-5,但根据以往 OpenAI 的各种产品发布节奏来看,这次并不会是一次重磅更新,但本次直播中,发布的整合进 ChatGPT 中的新版 Sora,还是给大家带来的意料之外的「节目效果」。 目前,整合进 ChatGPT 中的 Sora,相比于独立应用版本,能力暂时被局限在了图像生成,但据 OpenAI 在直播中介绍,该模型比之前的模型有了质的飞跃。 据介绍,开发团队使用了GPT-4o「全模态」(或可以生成文本、图像、音频和视频等任何类型数据的模型)能力为基础,来开发这个版本的 Sora。因此用户可以直接说出自己的需求,甚至上传或者拍一张照片,作为提示词来使用。 比如直播现场的演示环节,就直接用手机给 Sam Altman 在内的三人来了张自拍,并要求 Sora 生成一张「动漫风格的版本」。 这还没完,他们三人甚至还现场演示了让 Sora 在图片上添加一段文本「Feel The AGI」(感受通用人工智能)。现场画了第一张新版 Sora 的表情包。 这个现场生成的表情包不仅文本准确清晰,并且准确理解了当代流行梗图中的包括粗体字等必备元素,已经能直接拿来当梗图发到各种群里了。 由于是 OpenAI 官方带头整活,评论区也有不少用户也被激发热情,尝试着把相同的提示词喂给 Grok,用相同的提示词和照片,生成同样风格的内容 ———— 但显然效果还是比新版 Sora 差了不少,反而带来了更喜感的效果。 除了带头画梗图,OpenAI 还演示了新版本 Sora 在文本渲染方面的改进,可以让在图像上生成没有拼写错误的连贯文本的成功率明显提升。 在另一个演示场景中,OpenAI 团队让 Sora 去生成一幅用于理解相对论的漫画卡片。 不同于以往生图模型中,在文本生成部分经常容易变得混乱不堪,甚至是「AI 造字」的情况发生,新版 Sora 其原生图像生成,生成的文本,已经没有任何明显错乱,甚至还在漫画生成了非常自然流畅的日文,意外的让日文社区的不少日本用户「炸锅」。 对于图片生成模型来讲,过去正确渲染文本是一个巨大的挑战。如果小标题或文本元素有拼写错误或错误,整个图像都可能变得无法使用。 此外在这个案例中,OpenAI 还演示了类似对相对论这样「世界上现有知识」的正确引用。 「如果我画一张图像,我会受到自身技能的限制……以及我积累的所有世界知识的限制,」 ChatGPT多模态产品负责人 Jackie Shannon 在接受媒体采访时解释这个功能的必要性。 「该模型将世界知识代入其中,因此当你要求生成牛顿棱镜实验的图像时,你无需解释「牛顿棱镜实验」这件事它本身是什么,就能得到准确的图像。」 除了上述这些直播中提到的模型能力改进,OpenAI 还表示新版 Sora 大幅提升了在属性和对象之间保持正确关系的能力。例如,绑定能力较差的模型可能会将要求生成蓝色星星和红色三角形的提示词,生成为红色星星而没有三角形。 据 OpenAI 介绍,现有的大多数图像模型在这方面都很容易「犯错」,尤其是当被要求渲染多个项目(通常在5到8个左右)时,经常会混淆颜色和形状。而新版 Sora 的图像生成功能,可以正确绑定15到20个对象的属性,在理解各自的复杂需求的同时,保证不会被误导,从而大幅提高成功率。 除了这些使用体验上的改进,还有一个细节是,OpenAI 已经确认,新版 Sora 生成图像的时间比以前更长,但 OpenAI 认为这是一个值得的权衡。 「虽然我们在延迟方面肯定还有改进的空间……但(我们觉得)这些生成图片的质量、功能和世界知识,确实弥补了用户需要等待的额外几秒钟,」Shannon说。 至于生图领域的安全问题 —— 从去年到今年已经出现多次伪造名人不雅图像、热点事件虚假图像,以及 Google Gemini 去除照片原水印这样的问题,OpenAI 团队强调新版 Sora 已经可以去除照片水印,同时阻止生成性深度伪造图像,并拒绝生成相关的内容请求。同时所有生成的图像都将包含标准的C2PA元数据,以标记该图像是由OpenAI创建的。 目前,新版集成在 ChatGPT 内的 Sora 图像生成模型功能,已经开放给 Pro 和 Plus 订阅套餐的用户,并且 OpenAI 承诺,新版 Sora 也会在不久的将来,提供给免费版本和 API。 现在我最想做的,就是立即让它帮我画自己的梗图了。
别让大模型想太多了,过度思考会影响性能
加州大学伯克利分校、苏黎世联邦理工学院等多所高校的研究人员,深入剖析了大模型在执行Agent任务时面临的困境 ——过度思考。 为了量化这种行为,研究人员开发了一套系统评估框架,并通过4018条轨迹分析发现,高推理努力配置的模型虽然解决了29.1%的问题,但成本高达1400美元;而低推理努力配置则以3.5倍更低的成本达到了21.0%的成功率。 此外,生成两个低推理解决方案并选择其中一个具有较低过度思考得分的方法,实现了27.3%的解决率,同时减少了43%的计算成本。这表明减轻过度思考不仅提高了推理效率,还显著降低了成本。 开源地址:https://github.com/AlexCuadron/ThinkingAgent 过度思考是指,大模型过度依赖内部推理,而忽视了从环境中获取或整合关键反馈的倾向。即使在资源不受限制的情况下,这种过度依赖内部推理的模型仍然会受到其不完整或不准确的世界模型的限制,从而导致错误的累积和决策能力的下降。 为了深入研究这种现象,研究人员通过分析智能体与环境之间的交互过程,识别出三种过度思考的典型表现模式。 首先是“分析瘫痪”(Analysis Paralysis),在这种情况下,模型过度专注于未来的规划,而忽视了当前环境中的实际进展。它们会生成越来越复杂的行动序列,但却难以系统地执行这些计划,从而陷入无休止的规划循环中。 其次是“鲁莽行动”(Rogue Actions),在这种模式下,模型在面对错误时会尝试同时执行多个相互依赖的行动,而没有等待环境对前一个行动的反馈,模型试图用内部模拟来替代真实的环境反馈。 最后是“过早脱离”(PrematureDisengagement),在这种情况下,模型基于内部对问题空间的模拟而终止任务,而不是根据环境反馈来验证解决方案的有效性。这种过度依赖内部推理的行为可能导致模型在没有验证的情况下就放弃任务,或者错误地认为问题无法解决。 为了量化过度思考行为,研究团队开发了一种系统化的评分方法,使用大模型作为评判标准。该方法通过分析模型轨迹,识别出上述三种过度思考模式,并给出0到10分的评分,分数越高表示过度思考越严重。每个评分都附有详细的理由,解释所识别的模式及其严重程度。完整的评估提示和评分标准可以在附录A中找到。 为了验证自动化评估方法的可靠性,研究人员邀请了四位专家手动评定了20个随机选择的模型轨迹。通过标准化评分,研究团队进行了全面的统计分析,探究过度思考行为与模型性能的关系,以及过度思考对推理模型和非推理模型的不同影响。 结果显示,推理模型的过度思考得分显著高于非推理模型,且两者之间的相关性非常强,证实了自动评估方法的可靠性。 此外,研究团队设计了一个系统化评估轨迹的提示,避免使用“过度思考”一词以防止模型偏向自身定义。该提示围绕过度思考的三种表现形式展开,即分析瘫痪、鲁莽行为和过早脱离,并强调偏好内部推理链而非环境互动。 评分系统分为三档:0-3分表示适当的环境互动,4-7分表示偶尔过度依赖内部推理,8-10分则表示完全脱离环境反馈。 通过提供具体的例子,如模型得0分时会持续重试类似配置并在每次尝试间等待反馈,而得10分时会生成多个互依动作而不等待环境响应,或基于内部推理提前结束任务,确保评分标准的透明和一致。 实验结果表明,过度思考评分与任务解决率呈现出显著的负相关性。推理模型的过度思考评分越高,其在软件工程任务中的表现越差。这一趋势在非推理模型中也得到了体现,但其下降速度更快。例如,推理模型的趋势线斜率为-7.894,而非推理模型的趋势线斜率达到了-15.938。 在模型类型与过度思考的关系方面,作者们发现推理模型的过度思考倾向明显高于非推理模型。实验数据显示,推理模型的平均过度思考评分为3.505,而非推理模型的平均评分为2.228。这种倾向可能是由于推理模型在训练过程中被优化为生成更长的推理链,从而在面对需要频繁与环境互动的任务时,表现出更高的过度思考倾向。 此外,还研究了模型规模对过度思考的影响。实验结果表明,模型规模与过度思考评分之间存在负相关性。较小的模型,如7B和14B参数的模型在交互式任务中表现出更高的过度思考倾向,而较大的模型如671B参数的模型则相对较低。这一现象可能与模型的复杂性和对环境反馈的处理能力有关。
59元起!小米偷偷上架这新品,一个比一个离谱
下一波新机,基本都定在下个月了... 闲暇之余,我们就去 “ 小米百货 ” 逛逛吧,看看有什么好玩的新品~ 首先,就是小米最近偷偷众筹的 MIJIA 智能音频眼镜 2 ! 想不到吧?小米还卖这种东西,而且还出到了第二代。 其实之前果子路过小米之家就挺想去试试一代的,但每次店里的摆放的样机都没电,以至于果子还没真正体验过 MIJIA 的智能音频眼镜... 不过据买过的小伙伴说,体验还不错,这次二代可以的话果子也整一个。 外观上最明显的,就是二代的镜腿相比上代大幅优化... 在最细处的前端跟最宽处的后端尺寸分别减少了 26% 跟 30% ! 更轻巧的重量跟更合理的重心分配,使得二代在佩戴舒适感上进一步增强。 然后弹性更好更持久的「琴钢超弹铰链」、疏水性更好的 105° 高水滴角设计跟质感更好的 NCVM 纳米真空镀膜工艺... 细节上,MIJIA 智能音频眼镜 2 跟普通眼镜越来越接近了~ 再提供 5 款不同风格的镜框,辅以 “ 单手就能秒换镜框 ” 的「第二代快拆技术」! 基本能满足绝大部分小伙伴的场合跟款式需求了吧? 功能上... MIJIA 智能音频眼镜 2 不仅新增了上代没有的现场、线上会议、通话、音视频录音(无需手机)! 音质跟降噪这块也进一步得到了增强,上代漏音的情况也有所了改善。 而且录音的时候眼镜是会有亮灯提醒,隐私保护好评~ 最后比上代续航更长的 12 小时音乐播放时间(1小时充满)、IP54 防尘防水、语音就能唤醒设备端小爱同学的 MIJIA 智能音频眼镜 2 价格是: 1199 元(众筹 999 元) 这个价格你们觉得怎么样? 果子是觉得这代升级挺大的,更好的音质、更强的续航、更多的功能... 关键是更接近普通眼镜的设计跟佩戴体验,在可用度上要好上不少~ 然后就是可能每家都有的小米插座... 他们新出了一个轨道插座,看着蛮有意思的~ 它采用长条的轨道式设计,可以按自己的需求自由增减插座: 用的时候呢,插上去即可;不用的时候呢,可以取下来! 如果像电饭煲、微波炉等位置常驻电器,插头不取下来也行,因为插头有内外圈分离的断电设计... 只要旋转外圈就能控制通电/断电,进而减少线缆插拔,方便不少~ 关键是它还能自由换位这你们受得了吗? 针对安全性,轨道基座还有 “ 自回弹关闭式保护门 ” 设计! 取下插座后保护门会自动回弹关闭,避免猫猫狗狗小孩伸手进去误触。 T 型结构设计,就算是金属物品误入轨道开口也没有触电风险。 最后 8000W 总功率,单个插头 2500W ... 有 50cm 3 插座、75cm 4 插座、100cm 5 插座,黑白两色可选: 大家可以根据场景布局、用电需求选择自己合适的尺寸。 299 元起(众筹 289 元起) 这个价格你们觉得怎么样? 然后插座的话也有单个卖... 59 元 但单独不能使用,必须得配合那个轨道基座。 不得不说这设计是真的好看~ 说到好看,小米还推出了个米家隐藏式智能窗帘! 之所以叫 “ 隐藏式 ” ,是因为整个设计的特别小。 5.5cm 的高度,半掌大小... 因此它能被藏进大部分顶装设计的窗帘盒。 功能这块的话,支持窗帘三档开合调速!你也可以选择手拉或让窗帘自适应控速。 就连开合行程、开合比例都能精准自定义! 在接入米家 App 控制后,手机控制、定时开合,配合 WiFi 模块,实现进/离家门自动开合等等...... 什么小爱同学语音控制、电视无线遥控器也算是米家生态基操了~ 最后 1.5N・m 扭矩,低于 30dB(A)的运行噪音,最大 50Kg 的帘布驱动重量,满足多种直轨安装... 599 元(国补 509 元) 这个价格你们觉得怎么样? 果子初略看了下,包含一次上门安装服务,拼接式的轨道设计,是不用上门测量、定制的,只要一次上门就能完成安装跟拆旧... 这点还是不错的~ 总体看下来果子好像也就那个 MIJIA 智能音频眼镜 2 能买的,另外两个的话问就是果子现在所处的出租房基本用不到也不好搞。 等哪天有属于自己的房子再捣鼓吧,不说了都是泪,果子接着搬砖了。 参考资料: 小米众筹 小米商城 编辑:Unicorn
中国AI没有泡沫,比起资本开支,更需要风险投资
美国对算力的投资过于激进,中国企业对算力的投资仍在务实增长,并为AI应用留足了空间。现在,只缺风险资金推中国AI应用一把了。 美国巨头砸在算力上的资本开支,一年或超4000亿美元;中国互联网巨头加上三大运营商,一年或在650亿美元左右,相差6倍。美国初创企业获得的风险投资约为760亿美元,是中国的140亿美元的4倍。似乎相比资本开支,中国与美国在风险资本上的差距还小点;但是,中国正在提供更高性价比的算力,亟待AI应用爆发,更需要初创企业的大爆发。 今天,在香港举行的汇丰全球投资峰会上,阿里巴巴董事长蔡崇信对全球数据中心建设中可能形成的泡沫发出了警告。结果,被标题党渲染为“数据中心泡沫”,吓了市场一跳。明明阿里巴巴刚刚承诺未来三年内投入过去十年的资本开支,超过520亿美元。 很快媒体逐步还原现场。原来,他讲的是全球范围内很多企业或基金,在没有取得全球云巨头等潜在用户的使用协议前,就筹集数十亿美元投机建设数据中心;美国许多数据中心投资公告存在“重复”或“相互重叠”的现象。 “我仍然对美国在人工智能投资方面所提到的那些数字感到震惊。”蔡崇信说,人们居然真的在谈论数千亿美元这样的数字。他指的是美国巨头将在今年投入至少3200亿美元的资本开支。其中,亚马逊1000亿美元,微软800亿美元,谷歌750亿美元,Meta约650亿美元。这还没算上OpenAI联合软银、甲骨文,准备未来几年向星际之门投入5000亿美元,初期1000亿美元。 事实上,微软早已转向谨慎。美国投行TD Cowen就发现微软正在退租数据中心;纳德拉有点反感市场上那些动辄AGI的过度炒作,倒是非常关注微软的推理收入。 中国正在开启第二波算力资本开支的增长,务实稳健。互联网巨头仍在追逐前沿模型训练,并为旗下应用推理需求爆发做准备;三大电信运营商承担了“东数西算”战略基建重任,算力开支继续两位数增长,并承诺对推理需求的投资不设上限。 阿里巴巴未来3年至少3800亿元人民币,约合520亿美元,平均每年170亿美元;字节跳动的资本开支,缺乏官方披露信息,市场推测约为200亿美元;腾讯去年四季度资本支持大幅跃升,超过2023年全年,明年将进一步增长,预计占收入低十几百分点,或在150亿美元左右。即,三家科技巨头明年资本开支合计约520亿美元。 由于5G基建大潮基本过去,八大算力枢纽基建前几年保持“适度超前”,三大运营商明年资本开支整体微降。但是,在支出结构上,算力占比相反明显提升。 中国移动预计2025年资本开支下降2.5%,但算力支出为373亿元人民币,增长0.5%;中国联通预计2025年资本开支约下降10%,但算力投资同比增长28%;中国电信预计2025年资本开支下滑10%,但算力相关开支增长22%。目前,算力相关业务在中国联通归入算网数智类,规模约为141亿人民币;在中国电信归入产业数字化业务,规模约317亿元。粗略估算,三家运营商明年算力相关资本开支合计约130亿美元。 但是,无论是腾讯,还是三大运营商,无一例外都强调了对推理需求预留了充分的调节空间。腾讯高管在财报电话会议上补充说,现在他们提供的只是当前的预期,而市场是非常动态的,腾讯也将“保持高度灵活性和动态响应能力”,如果需求激增,肯定会追加订单。三大运营商的表述相当统一,对推理资源需求的投资“不设上限”。 中国与美国的大模型及其应用,仍然处于不同的商业化路径上。中国企业基于开源策略,大模型商品化趋势明显,关键在于用低成本的算力培育出高体验的AI应用。阿里巴巴Qwen和DeepSeek正在持续开源,为全球提供训练与推理算力性价比更高的选择。腾讯认为“”中国公司普遍优先考虑效率和GPU服务器的高效利用”,并认为这并不一定会影响技术的最终效果。而以OpenAI为代表的美国企业,为避免被卷入价格战,将继续加大投入,维持闭源模型在一段时间内的溢价能力。 美国的风险在于,闭源模型能够维持的优势期越来越短;中国的风险在于,AI应用层面的初创企业不够活跃。根据CBInsights的统计,最近两年,美国初创企业获得的风险投资资金分别为400亿美元与760亿美元;而据清科研究中心的统计,中国企业获得的融资规模分别是105亿美元与140亿美元。无论是在金额上,还是增速上,中国创业激情仍然没有美国强烈。 未来,越来越多的初创企业会围绕AI开展业务。在这个意义上,中国的风险投资更需要大步赶上。据PitchBook统计,在2024年第四季度,全球风险投资资金超过1半的金额投向了AI相关初创企业,几乎是2023年同期的两倍。 启明创投创始主管合伙人邝子平相信,全球投资人希望到中国投资AI的呼声,在未来几年会越来越高。近日,他在中国发展高层论坛表示,中国的AI市场潜力巨大,中国的AI人才库具有全球竞争力,中国的AI产业存在巨大投资缺口;而中国在投资准入方面,包括AI,近年来越来越开放。 几乎所有人都已经相信,2025年是AI应用爆发的一年。中国与美国在AI领域的竞争,将从大模型领域蔓延至AI应用领域。相比资本开支,风险投资也需要扮演越来越重要的角色。
80万的蔚来ET9,甚至还有点性价比
80 万的 ET9 ( 电池租赁后 70 万 ),能救蔚来吗? 这段时间,连小鹏销量都起来了,蔚小理里唯一拖后腿的的可能只有 “ 蔚 ” 了,本以为斌哥也会学小鹏一样搞点打骨折的车型,结果一等等来了这个行政旗舰轿车——蔚来 ET9 ,确实有点意外。 不过斌哥都说了,大伙儿别教他做 CEO ,毕竟他上大学就赚钱了,这操作肯定有他的说法。 仔细研究市场的话,你会发现过去七八十万这个价位一直被豪华品牌垄断,还算是个蓝海,如果蔚来 ET9 颠覆了这个级别,或许真能咸鱼翻身。 这波,脖子哥有幸收到官方邀请,就先代大伙儿肉身试试车。 先看它的外观尺寸, ET9 的尺寸明显对标奔驰 S 和宝马 7 系,车身达到 5325 × 2016 × 1620 ,轴距 3250 。ET9 的车长在两者之间,车身更宽、更高,而且轴距也更长,空间必然是吊打这俩了。 但这里的车高嘛,可以说是蔚来传统,大胆猜测下,是不是因为能换电所以地台就更高呢? 从造型上看,如果说 S 级是正统的商务车, 7 系是年轻点的运动豪华,那 ET9 就有点行政溜背轿跑的风格,再加上 23 寸的轮毂,这个车就有点像是外星飞船。。。 之前大家看工信部的 ET9 证件照,说这个轮胎有点窄,看上去像是裹小脚,但其实这个 265 的胎宽 40 的扁平比,比奔驰还要宽一些,大伙觉得裹小脚可能是这个车太宽。 总的来说, ET9 还是蔚来原汁原味的风格,只有几处细节的变化,这些变化没准会在之后改款的 ET5T 和 ES6 上面继承下来。 比如这个日行灯的线条,远看差不多,但细看会发现它比以前更加凌厉,而大灯则拥有了类似问界 M9 的光毯投影功能,还增加了转向补盲。 另外, ET9 还有一个电动前备箱,它可以脚踢开启,也可以喊 NOMI 帮你开,有个细节是,你车外喊它, NOMI 会把头转过来,睁大眼睛特别可爱。 打开后的前备箱看起来有点像是跑车的前备箱,虽然不大,但可以放一点随身的小物件,里面是有关闭的实体按键,但也可以车底踢一脚再让它自动关上。 为了满足 ET9 这种科技、豪华的调性,这车的四个轮子还带了悬浮轮毂标,屁股上还装了电动尾翼,可以车外语音直接打开,大伙儿觉得好看吗? 除此之外,蔚来在 ET9 的门把手里偷偷放了个电机,按下去,可以感受到震动的反馈,略爽。 然后走进车内,这次方向盘也有个大的改变,除了尺寸更小,形状更方以外,右边还多了一个换挡拨杆,之前蔚来都是把换挡设计在中控位置。 同时这次车机也从竖屏换成了横屏,可能是考虑到了看电影、打游戏方面的需要,但说实话,脖子哥基本不会在车上干这些事儿,竖屏更习惯一点。 中控后边还有一个长条的屏幕,类似阿维塔的远端屏,对车内质感也有很大提升。 然后咱们到后排, ET9 中岛这里其实也有一个屏幕,扶手打开还有一个小桌板,但我觉得最喜欢的还是屏幕打开后,下面这种镂空的质感,特别奢华。 另外还有一点不得不提,它的天窗其实分了两部分,中间有一道固定的衡量,左右可以单独调整,比如后排俩领导,一个想睡觉一个想晒太阳,是不是不用纠结了? 说完这些面上的,你肯定觉得就这些东西卖 80 万还是贵,没错,我也觉得贵。上面这些东西都没什么门槛,质感不错,用料不错,但是也能很快被别人抄了。什么阿维塔 011 ,尊界 S800 ,甚至 FF91 都把这些面上的功夫做的很好。 所以接下来,我们把这台车开起来,加上线控转向和全主动悬架,说说这台车到底跟我们现在的半主动悬架,开起来和坐起来到底有啥区别? 先说这个线控转向。相比传统转向的硬链接模式, ET9 取消了物理转向柱,没有机械结构,只通过一个方向盘给转向机构提供一个电信号,相当于手柄打游戏了。 所以它的转向比是可以自由调节的,比如在低速倒车的时候,方向盘可以不用打满,就很轻松地停进车位里面;而在高速的时候,就算打方向幅度大一点,这个车也不会有很明显的晃动。 说实话,这个技术难度到不大,难的地方是调校。 脖子哥开完以后,感觉它的线控转向非常符合驾驶直觉,很容易上手,你第一次开,虽然知道手感不一样,但不会感觉特别奇怪。 而且 ET9 的后轮还有 8.5 度的一个转向角度,我们拿这个车跑了一段山路,感觉特别的灵活,甚至有点小爽,因为线控转向和后轮的适配性特别好。可以看出来 ET9 不是想做一个纯舒适的行政车,也可以开着很有操控感。 然后我们再来说这个主动悬架。 要知道,我们现在用的阻尼可调的减振器,像是 CDC 或者乐道在用的 FSD ,都是半主动悬架。再高级点的 MRC ,也只是比纯粹的液压油调节的速度更快。 而全主动悬架是用电流流过线圈,来控制悬架的上下,理论上,它可以完全隔绝车辆和路面的反馈。所谓的路感,所谓的侧倾,所谓的甩尾、推头等等等等,主动悬架都可以通通隔绝掉,这台车就真正的悬浮起来了。 之前仰望 U7 的那个云辇 Z ,用的是四个直线电机,而这次 ET9 依然是一个空簧搭配减振器,但它给减振器单独配了个油泵和电机,来快速调节阻尼和刚度。 总之用上主动悬架之后, ET9 在 Z 轴的平顺性上,可以说是现有的半主动悬架永远比不上的。做的最好的是在小的坑洼上,它不会来回摆,完全过滤掉振感,而且这点提升了轮胎的接地效率,对乘坐体验是个很大的改善。 过大的减速带呢,相对会保留了一些路感,但它弹一下也会迅速拉回,不至于剧烈晃动。 要说印象最深的就是它过弯的支撑性, 2.7 吨毫无压力,给了你足够的过弯信心,脖子哥也试了把主动悬架关掉,这个支撑性的差距非常明显。 不过,脖子哥开完以后也有几点抱怨,比如开启后排尊享模式,路感还是过多了,而且这些驾驶模式的区别主要是电门响应等等,悬挂上的感受真不是特别大,希望后续还能继续 OTA 一下。 总的来说,这不是一台完全的行政轿车,而是带一点操控,坚持人开胜于机开的豪华旗舰车型。 至于这车 80 多万算不算贵,咱们看看帕美、仰望这些配了全主动悬架的,其实早就超过这个价了。甚至前段时间雷军也说它们在预研的新技术,就是主动选悬架,搭载这项技术的小米新车肯定也比 SU7 Ultra 的 52.99 万更贵。 所以现在这个市场,开这个车,卖这个价,就真心不贵。 那么最后,这台车能救蔚来吗? 我觉得这台车的销量如果能像理想 MEGA 那样,一个月卖 800 台左右,其实就算成功。毕竟这台车的毛利肯定是高的,卖就是赚。但是啊,治标不治本,这台车再好再棒,只能帮蔚来挽回一下口碑。 真正能让蔚来从 ICU 跳到 KTV 的车,还得靠即将改款的 ET5 、 ET5T 和 ES6 ,这些车的销量如果能拔起来,再配合蔚来内部的降本增效,蔚来重新上牌桌是完全没有问题的。 至于那个世界模型什么的,嗯。。。我觉得还是出来了看具体表现吧。 撰文:TC 编辑:面线 & 脖子右拧 美编:萱萱
GPT-4o 生图实测:很强(附:20+场景示例&缺陷整理)
ChatGPT 凌晨发了新东西,通过 4o 模型,创建靠谱的图像:光影、文字、细节栩栩如生 通过对话,可以进一步修改:遮挡、倒影等等都处理的非常到位 图片质量相当高,可直接用于科普插画,比如:分光三棱镜 继续对话,一致性相当好,比如让他画成书册: 只能说:斗宗强者,竟恐怖如斯,OpenAI 的箱子里,还是有东西的。 让我们细致看一看:本次更新,突破了以往的哪些边界。 文本渲染绝佳 一图胜千言,来感受一下。比如让他根据对话内容,来画一个菜单(文字是单独给的) 或者让他去画一个婚礼邀请(同样,文字单独给到) 多轮生成很棒 这套图像生成,是 GPT-4o 的原生功能,可通过对话,逐步进行图像完善,并保持内容一致。比如这个: 也比如我把橘猫放在了魔兽世界里 甚至来说,我还可以要求他生成 png 透明版 指令遵循很强 在生成图像的时候,4o 的指令遵循能力很强,可以处理包含 10-20 个不同物体的场景,并对物体与特征及关系的紧密绑定允许更好的控制。 比如:只有一滴红酒的空玻璃杯 prompt: show me a wine glass with only the tiniest drop of red wine in it. 比如:看不见的大象 Prompt: We need evidence there is a currently present invisible elephant. Consider what an elephant is and does in the environment, then show us that, perhaps mid-process - but the elephant itself is not shown at all 我还让他给画了个撸猫指南 Prompt: 4-step photo guide on how to pet a cat 上下文关联 如果很清楚知道自己要什么,可以直接上传图片给 ChatGPT,让参考风格、精准输出。比如给一些风格插画,然后要求 GPT 来生成一个三角形轮子的自行车 吐槽:为啥是英国专利 而我,作为炉石玩家,我让 ChatGPT 来生成一份奥特曼的专属卡片 Hhhhh 太真实了,GPT 觉得奥特曼上不了传说,种族属于「战吼」(特别能逼逼) 然后,还可以让他做个实体版... 稀有度变成了普通,技能变成了嘲讽,hhhhh认真的吗? 贯通现实知识 4o 的绘图,能够从大模型中直接获取到知识,生成与现实世界知识相符的图像,如:可以直接使用的鸡尾酒配方 Prompt: Make me a professionally shot photorealistic diagram of the top selling cocktails in my bar with recipes labeled on each drink. put the recipes on handwritten cards in front of each drink. The cards are brown, and the text is black. Background is white.Title is "4 most popular cocktails" 制作一款披萨 Prompt: A graphic of an Italian chef giving instructions on how to make authentic pepperoni pizza 动量定理和冲量定理 Prompt: 画一个有关冲量定理和动量定理的 infographic Prompt:画一个肯德基的简体中文菜单,其中有一个套餐叫做“V 我 50” 风格多样 4o 的这个模型,能轻松绘制各种风格的图像。比如我让他用莫奈的风格,来画一只猫 Prompt:一只猫,莫奈风格 幻想风格的海豚地铁 Prompt: A realistic underwater scene with dolphins swimming through the windows of an abandoned subway car, with bubbles and detailed water flow accurately simulated. 奥特曼在采棉花,颇有纪录片的范儿 Prompt: 山姆奥特曼正在采棉花 一些限制 当然,这个模型也存在一些问题: 对于长图像,会出现剪裁问题 可能产生幻觉,然后开始胡编乱造 难以准确渲染超过 20 个不同概念 多语言文本渲染:处理非拉丁语言(比如中文),不够准确 对特定部分要求编辑,可能会出 bug 密集文本下,效果会不好 以及...出于安全考虑,很多内容不允许被生成,比如:米老鼠大战皮卡丘的钞票 最后 OpenAI 这次的更新的确非常棒,真没得黑。 这项功能已经通过 ChatGPT & Sora 向 Plus、Pro、Team 和免费用户推出,替换 DaLLE 作为默认图像生成器。,Enterprise 和 Edu 用户也将很快更新,API 也将在数周内进行更新。 所以,不要小瞧 OpenAI,箱子里有货的
谷歌Waymo无人车拟2026年“开进”华盛顿
智通财经APP获悉,谷歌(GOOGL.US)旗下自动驾驶先锋Waymo将于2026年正式在华盛顿特区推出无人驾驶叫车服务。继今年初重返特区后,该公司正紧锣密鼓"铺平全自动运营道路",预计未来数月将向更广泛用户及应急部门开放测试。值得注意的是,Waymo正携手立法机构推动特区无人车运营法规落地,打破当前自动驾驶车辆需配备安全员的限制。 在本土市场,Waymo已制定清晰的扩张蓝图:今年及明年将重点攻克旧金山、亚特兰大、迈阿密三大城市,持续扩大商业运营版图。 从行业趋势看,随着自动驾驶技术日益成熟,主要企业正将试验性项目加速转化为规模化服务。其中,特斯拉(TSLA.US)CEO马斯克宣布,计划年内分别在得州奥斯汀和加州推出自动驾驶出租车服务,其"完全无人驾驶"版本正在特定用户中展开测试。 此外,亚马逊(AMZN.US)支持的Zoox则采取逐步推进的策略,继福斯特城和拉斯维加斯后,近日在旧金山SoMa社区启动试点,并将运营范围扩展至拉斯维加斯大道周边。 这场自动驾驶出行大战已呈现三足鼎立之势:传统科技巨头Waymo稳扎稳打推进合规落地,新能源车龙头特斯拉依托庞大用户基数谋求技术变现,电商巨头亚马逊则通过Zoox另辟蹊径布局未来交通。随着法规逐步完善、技术加速迭代,无人驾驶出租车从科幻场景走向日常消费的临界点正在临近。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。