行业分类:
加载中...
头条分类:
加载中...
希音、Temu告知美国消费者4月25日起涨价:关税变化导致运营成本上升
受美国关税政策影响,两家知名电商平台即将调整美国地区价格。 近日,服饰类电商平台希音(SHEIN)和拼多多旗下的跨境电商平台Temu在官方网站发布通知称,由于最近全球贸易规则和关税的变化,运营费用有所增加,为了不降低质量,将从2025年4月25日起进行价格调整。在4月25日之前,价格将保持不变。“自从我们开始为美国购物者提供服务以来,我们的目标一直很简单:以实惠的价格提供优质的时尚产品,同时为我们服务的社区带来积极的影响。” Temu发布了一份几乎相同的通知,称其运营成本已上升,因此将从下周开始上调价格。该公司还补充道,在此之前,价格将保持不变。 不过两家平台均未透露涨幅细节。 希音和Temu在美销售从服装到智能手机等各种商品,因其低廉的价格而受到美国消费者的青睐。 据央视新闻,美国当地时间4月2日,特朗普政府签署行政令,将取消从中国内地和中国香港进口的小额包裹免税待遇。 4月17日,商务部召开例行新闻发布会。会上,新闻发言人何咏前谈到美国对小额包裹关税政策进行破坏性调整时表示,这将严重影响美国消费者的利益。何咏前表示,跨境电商具有效率高、到货快、费用低的独特优势,能更好满足消费者个性化、多样化消费需求。是国际贸易创新发展的重要趋势,已经成为人们不可或缺的生活方式。 何咏前说,近期,美国对小额包裹关税政策进行破坏性调整,将严重影响美国消费者的利益,我想强调的是,跨境电商是契合全球消费发展趋势,惠及亿万消费者的新型贸易方式,相关领域政策调整应以便利化为方向。我们愿同各国一道,加强交流合作,共同促进跨境电商健康可持续发展。 此举将使希音和Temu的商业模式面临挑战,而美国科技公司亦将承压。 路透社报道,调研机构数据显示,希音和Temu正在大幅削减其在美国的数字广告支出,这对Meta旗下Facebook等科技公司造成了不小打击。目前,希音和Temu都位于美国社交媒体最大广告商之列。 调研机构Sensor Tower评估,3月31日至4月13日的两周内,Temu在Facebook、Instagram、TikTok、Snap、X和YouTube上的美国每日平均广告支出与前30天相比总体下降了31%;希音在Facebook、Instagram、TikTok、YouTube和Pinterest上的美国每日平均广告支出则同比平均下跌了19%。 美国数字营销公司Tinuiti数字营销研究总监Mark Ba​​llard对外媒表示,Temu在第一季度显著增加了广告投放量,然而自4月12日起,其在谷歌购物(Google Shopping)上的广告投放量大幅缩减。
谷歌要送AI进校园:美国大学生可限免使用Google One AI Premium
IT之家 4 月 18 日消息,据外媒 The Verge 今日报道,谷歌成为最新一位加入高校市场竞争的 AI 服务商。从即日起,美国大学生可以免费订阅 One AI Premium,直到 2026 年 6 月 30 日,无需支付原本每月 20 美元(IT之家注:现汇率约合 146 元人民币)的费用。 谷歌发言人 Alex Joseph 表示,想要申请的学生需在 2025 年 6 月 30 日之前注册,并通过有效的.edu 邮箱地址完成验证。他表示,计划到期前,谷歌会提前通过邮件提醒,学生将有足够时间取消订阅。 这一订阅方案不仅提供 2TB 云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗 ChatGPT Plus 推出的旗舰级产品,另外还包括 Gemini Deep Research,能帮助用户总结复杂主题,甚至能将报告转换成播客风格的音频。 订阅用户还可使用 NotebookLM Plus,享受更多学习辅助与音频总结功能,并能将 Gemini 助理直接集成至 Docs、Sheets 和 Slides。此外,谷歌还提供了全新工具,例如文本生成视频模型 Veo 2 以及名为 Whisk 的创意工具,用户可以通过混合文本和图像提示,生成全新的内容。 OpenAI 和 Anthropic 本月也陆续公布了面向高校用户的免费体验计划,试图吸引学生使用自家 AI 工具。学术市场价值巨大,而 AI 已成为谷歌搜索业务的最大威胁,谷歌自然是不可能“错失良机”的。
谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini
编辑:桃子 好困 【新智元导读】谷歌发布首款混合推理模型Gemini 2.5 Flash,引入了革命性「思考预算」,可灵活控制推理深度,性能一举击败Claude 3.7,比肩o4-mini。而且,关闭思考模式成本直降600%。 刚刚,谷歌重磅发布首个混合推理模型——Gemini 2.5 Flash。 与Claude类似,新模型的「思考预算」可以自定义,即可开启/关闭Gemini 2.5的思考模式。 值得一提的是,关闭思考的成本直接暴降600%,而且性能还不输Gemini 2.0 Flash。 具体来说,Gemini 2.5 Flash关闭思考输出价格0.6美元/百万token,开启思考输出价格3.5美元/百万token。 当然了,思考越久,模型性能也会随之提升。 在GPQA知识问答中,新模型24k思考预算,性能提升了6%;对于代码任务(LiveCodeBench),16k思考预算性能最佳。 在多项基准测试中,Gemini 2.5 Flash再次刷新SOTA。在大模型排行榜中,Flash预览版以1392 ELO高分位居第二,与GPT-4.5-preview、Grok 3并驾齐驱。 在数学(AIME 2025/2024)、多模态推理(MMMU)、知识问答(GPQA)等基准上,Gemini 2.5 Flash完全碾压Claude 3.7 Sonnet,足以与最新o4-mini相媲美。 就模型每百万token输入/输出价格来看,Gemini 2.5 Flash更具性价比。 在人类最后一次考试中,Gemini 2.5 Flash拿下12.1%高分,仅次于o4-mini 目前,Flash预览版可以在Gemini中使用,API同时向开发者开放。 首款混合推理Gemini登场 击败Claude 3.7 混合推理模型,就是专为需要在性能、成本、延迟之间找到完美平衡的开发者而设计。 Gemini 2.5 Flash不仅继承了2.0 Flash的高速响应特点,还引入了革命性的「思考模式」——可根据任务需求灵活调整推理深度。 Gemini 2.5系是「思考模型」,能够在回答前先行推理。 模型不会立即输出结果,而是先执行「思考」流程,更好地理解提示词,拆解复杂任务并规划回答。 如下图所示,相较于2.0 Flash,Gemini 2.5 Flash在复杂任务,如数学推理、科研分析中表现更优异。 在LMArena其他评估中,比如Hard Prompts、编码、长查询,Gemini 2.5 Flash全部拿下第一。 另外从下图中可看出,在同类模型中,2.5 Flash以超高性价比领跑,兼具最优性能和极低成本的优势。 网友实测 在网友的实测中,2.5 Flash物理模拟能力足够惊艳,小球会随着多边形变化精准运动。 而且,2.5 Flash还轻轻松松通过了4o-mini/o3无法通过的Galton Board(高尔顿板)测试。 它还能根据精灵图,创建出自定义游戏城房间。 另一位网友用了最大24k预算,让2.5 Flash设计出了一个《创:战纪》风格的游戏。 提示:Create Design a visually striking Tron-style game in a single HTML file, where AI-controlled light cycles compete in fast-paced, strategic battles against each other 如今Claude 3.7已经完全没有优势了,在设计登录界面时,Gemini 2.5 Flash用时最短速度最快。 自动播放 思考预算 智能控制 不同使用场景在质量、成本与延迟之间各有取舍。 为给开发者更大灵活性,2.5 Flash新增了「思考预算」功能。开发者可以通过设置预算(0 – 24576 Token),来控制模型在思考阶段的推理深度。 低预算(甚至为0):适合简单查询,保持2.0 Flash超低延迟和成本,性能更强 高预算:模型会进行更深入的推理,生成更准确、全面的答案。 需要强调的是,预算只是设定了2.5 Flash的思考上限;若prompt并不复杂,模型不会用满全部预算。 开发者也可通过API参数,或在Google AI Studio与Vertex AI控制台的滑块控件,为思考阶段指定具体的Token预算 更智能的是,模型会根据prompt复杂度,自动判断所需推理量和思考时间,避免了预算的浪费。 以下示例中,展示了2.5 Flash在默认模式下,可能使用的推理量。 · 需要低推理量的提示词: 示例1: 「Thank you」的西班牙语表达 示例2: 加拿大有多少个省? · 需要中等推理量的提示词: 示例1: 掷两枚骰子,点数之和为7的概率是多少? 示例2: 我的健身房在周一、三、五9‑15点以及周二、周六14‑20点开放篮球自由场地。如果我每周工作5天、时间为9‑18点,但想在工作日打5小时篮球,请为我制定一份可行的日程表。 · 需要高推理量的提示词: 示例1: 一根悬臂梁,长度L=3 m,矩形截面宽b=0.1 m、高h=0.2 m,材质钢 (E=200 GPa)。梁全长受均布载荷w=5 kN/m,且自由端承受集中载荷P=10 kN。请计算最大弯曲应力σ_max。 示例 2: 编写函数evaluate_cells(cells: Dict[str, str]) -> Dict[str, float],用于计算电子表格单元格的数值。 每个单元格的内容可能为: · 一个数字(如 「3」),或 · 一个公式,例如「=A1 + B1 * 2」,可使用「+、-、*、/」运算符并引用其他单元格。 要求: 1. 解析并解决单元格间的依赖关系。 2. 处理运算符优先级(*/高于+-)。 3. 检测循环依赖并抛出 ValueError("Cycle detected at ")。 4. 不得使用eval(),只可使用Python内置库。 Gemini 2.5 Flash正式上线 当前,Gemini 2.5 Flash预览版API在Google AI Studio和Vertex AI中上线,可通过Gemini应用专用下拉菜单找到它。 谷歌强烈建议尝试thinking_budget(思考预算)参数,看看可控推理如何去解决更复杂的问题。
新氧创始人金星回应李佳琦不建议普通女生做医美
凤凰网科技讯(作者/于雷)4月18日,近日李佳琦在直播里“不建议没有足够经济基础的人去做医美”的观点引发热议。新氧创始人兼CEO金星对此回应称,“正常的商业操作,没什么可避讳的,世界上所有商品都有资本推。iPhone、电动汽车、化妆品,哪个没有?关键是消费者需要知道真相,才能做出最适合自己的选择。” 金星在其视频号中进一步解释,李佳琦所言不无道理。他指出,社交平台上大量医美相关内容实际来自KOS(关键意见传播者)账号,这些账号需要向平台付费才能发布医美内容,否则将面临内容屏蔽。这些付费账号主要由医美机构、MCN机构、医美运营公司及第三方平台运营。 “你能看到的医美笔记和内容基本都是这些付费公司制作的,”金星表示,“比如很多人分享自己的前后对比、医美效果,真实用户哪有那么多人愿意去分享自己的前后对比?他们的动机是什么?” 据金星介绍,这些内容的商业模式取决于合作方向。若与医美机构合作,笔记评论区会指明在特定机构完成项目;若与上游产品厂商合作,则会强调使用了某款产品并取得良好效果。 自动播放 此前,李佳琦在直播中表示对经济基础不足的人不建议做医美,并指出许多医美项目效果被夸大且存在风险。他还提到当一个广告或项目“飞起来”时,背后往往有资本推动,这一言论迅速登上热搜榜。
世界物联网大会与阿塞拜疆达成战略合作
凤凰网科技讯 4月18日,在昨日举行的中国—阿塞拜疆产业与投资合作推介会上,世界物联网大会与阿塞拜疆经济部第四次工业革命分析与协调中心正式签署合作备忘录,标志着双方将在万物智联数字经济领域展开深度合作。此次推介会以“开放合作 共赢未来”为主题,由阿塞拜疆出口与投资促进署联合中国国家发展改革委国际合作中心、阿塞拜疆驻华使馆商务代表处在北京共同主办。 推介会现场,世界物联网大会执委会副主席兼秘书长何强与阿塞拜疆经济部第四次工业革命分析与协调中心执行董事法里兹·贾法罗夫进行了签约仪式。值得注意的是,中国国家发展改革委国际合作中心、中国信通院等机构也与阿方相关单位达成了合作,成为本次推介会的重要亮点。 在随后举行的闭门会议中,何强秘书长表示,此次合作不仅是双方建立伙伴关系,更意味着阿塞拜疆正式迈入全球万物智联数字经济社会创新发展的新阶段。世界物联网大会将致力于协助阿塞拜疆政府与企业从传统经济向数字经济转型升级,并欢迎阿方相关机构与企业开展深入交流合作。 会后,双方还就阿塞拜疆万物智联数字经济战略发展、阿塞拜疆成为世界物联网大会主席团成员国、参与2025世界物联网大会以及推动阿塞拜疆物联网和产业数字化转型等具体合作事宜进行了深入讨论,并制定了初步推进计划。 此次推介会上,阿塞拜疆多个政府部门和机构,包括阿拉特自由经济区管理局、中小企业发展署管理委员会、第四次工业革命分析与协调中心、国家石油公司、铁路股份公司、可再生能源署以及出口与投资促进署等,向与会投资者详细介绍了阿塞拜疆的投资政策、激励机制和制度建设情况。 中阿两国企业代表还分享了在重工业、轻工业、绿色能源、采矿业、农业等领域的多个投资项目。中国能源海外投资有限公司、东方电气集团国际合作有限公司、北京航天驭星科技股份有限公司等中国企业代表也分享了在阿塞拜疆的投资经验,为促进两国间的产业合作提供了宝贵参考。 此次世界物联网大会与阿塞拜疆的战略合作,将为两国在万物智联数字经济领域的创新发展注入新动力,也为“一带一路”倡议下的国际数字经济合作提供了新样本。
黄仁勋钩住梁文锋
被特朗普狠狠“坑”了的黄仁勋,光速现身中国。 被称为“对华特供版”的H20芯片突然禁售,让英伟达在中国市场的前景再度蒙上阴影。 值此背景之下,近期黄仁勋访华,可以看出两个关键目的,第一是表态,英伟达不会放弃中国市场,H20禁售之后,该公司依然会想办法推出适应新政策的产品。 第二是“取经”。不放弃中国市场,H20又不能卖了,黄仁勋需要新的产品。而新的产品怎么设计,需要和需求方对话。 《金融时报》报道,黄仁勋会见了英伟达的客户,其中包括DeepSeek创始人梁文锋,“讨论针对中国客户的新芯片设计”。 目前,黄仁勋和梁文锋方面均未对该消息做出回应。 DeepSeek崛起、英伟达“维稳”、关税战和H20禁售,很难相信这是短短三个月里发生的事情。在这三个月里,英伟达出现在DeepSeek的技术报告中,出现在外界对DeepSeek进行分析的几乎每一则内容里。 英伟达也绕不开DeepSeek,黄仁勋在财报会议、GTC大会上,都或主动或被动地谈及这家公司。DeepSeek既给英伟达出了难题、引发了外界对这家公司的灵魂拷问,也给英伟达在中国市场带来了新的活力。 如今,背后的两位创始人黄仁勋和梁文锋终于相会,在如此纷乱的背景下,多少有些遗憾。但试图突破地缘政治的影响,继续“共赢”的态度,也足以成为商业世界的一段佳话。 只是,黄仁勋即便锁定了当下最能帮上自己的人梁文锋,但未来英伟达在中国市场究竟会经历什么,谁都说不好。英伟达在华销售的芯片若一再阉割,国产芯片厂商又纷纷追赶,包括DeepSeek在内的AI企业是否还会继续青睐英伟达芯片? 01.黄仁勋特殊的北京之旅 三个月前,中国春节。美国新任总统特朗普正值就职时刻,英伟达的CEO黄仁勋忙着在中国四处拜访,待了一周之久。外界称之为黄仁勋在中国的“最长路演”,并称黄仁勋是“最努力的销售”。 彼时黄仁勋想不到,他将在不到百天之后再度到访中国,还脱掉皮夹克、穿上西装。形势之严峻,可见一斑。 图源:央视财经视频截图 特朗普就职之后,开始对中国施加更大的压力。关税战打响,压力很快传导到了芯片行业,英伟达股价震荡,一度一夜蒸发上万亿美元市值。 大概在一周前,英伟达传出利好消息,据美国全国公共广播电台NRP报道,黄仁勋亲自参与特朗普在海湖庄园的晚宴,随后白宫暂时放弃了对H20禁售的计划。 H20,是英伟达在拜登政府“芯片禁令”下的特殊产物,专门为中国市场设计,相比于旗舰芯片做了一定程度的“阉割”,以合规出口中国。关税的提高,叠加特朗普可能连H20都会禁售的传闻,成为外界对英伟达的最大担忧。 海湖庄园“游说成功”的消息,让英伟达在哀鸿遍野的股市中,股价应声上涨18%。 然而,惊天大反转很快上演。仅仅不到五天后,本周一,特朗普政府就通知英伟达,H20芯片被纳入出口管制,如向中国等五个国家出口,需获得许可,该要求将在未来无限期生效。 这一出其不意的噩耗,将黄仁勋打了个措手不及。周二英伟达递交给美国证监会的一份文件中,称此举将造成英伟达第一财季损失55亿美元。“(这一损失)与H20产品线库存、采购承诺和相关储备有关。” 需要注意的是,英伟达的第一财季对应自然日期,截至4月27日。 也就是说,和客户的订单签了还没交付,那边产品已经出来了不少,这一下全砸手里了。毫不意外地,该消息一出,英伟达股价又应声下跌6%。 不出48小时,黄仁勋抵达北京。他明确表态,过去30年,英伟达在中国成长,中国对英伟达来说非常重要。英伟达和中国市场实现了共赢,将继续服务于中国市场。 不管是从这次来北京的时机,还是从黄仁勋毫不避讳地明确表态,都能看出黄仁勋并不准备向特朗普政府的“担忧”低头。生意会继续做,还要比以前更努力地做。 02.为什么找上梁文锋 不放弃中国市场,就意味着英伟达需要继续做“中国特供版”AI芯片。既要符合新的禁令要求,又要满足中国客户的需求,二者缺一不可。 而如何满足中国客户的需求,要讨论这个问题,没有人比梁文锋更合适。 不管消息是否属实,黄仁勋的确有必要和梁文锋好好“对齐”一下。 在春节时期黄仁勋到访中国的时候,AI领域正在发生一件大事,那就是DeepSeek的迅速崛起。 这是一个极富戏剧色彩的事件:在被美国限制高端芯片获得的中国,出现了一个初创企业,他们用英伟达“阉割”版芯片,以数百万美元的成本,训练出了性能卓越的推理模型R1。 虽然硅谷有不同的声音,甚至有来自OpenAI和Anthropic两家公司CEO的指责(奥特曼暗示DeepSeek“抄袭”,阿莫迪质疑DeepSeek在所用芯片和成本上“撒谎”),但DeepSeek用“开源周”证明了自己的技术实力。几乎每一个开源项目,都是对英伟达芯片的“压榨魔法”。 在这次中美关税战、美国禁售H20之前,英伟达最大的危机、最大的挑战是由DeepSeek制造的。而且这种危机直击英伟达的灵魂,这家芯片巨头高速迭代,打破摩尔定律,不断推出最先进的AI芯片。DeepSeek则让一个问题自然浮现:英伟达真的需要这样做吗?或者说,行业真的需要英伟达这样做吗? 在3月的英伟达GTC演讲中,黄仁勋花了很久向世界解释,为什么推理时代缩放定律没有死、为什么英伟达仍然非常重要。并且,黄仁勋还超前公布了下下代、下下下代的芯片架构计划。 同时,Meta和OpenAI等大客户对英伟达新一代Blackwell架构高端芯片的订单,也让黄仁勋的论证有了事实基础。OpenAI甚至推出了一个史上最贵的模型GPT-4.5,讲的是同一个道理。 如果照此发展,英伟达的最大挑战就是交付Blackwell,用销售数字说话。至于中国市场,刨去DeepSeek对英伟达的“灵魂拷问”之外,不容忽略的是,其对英伟达在中国市场的表现有很大的帮助。DeepSeek已经证明了H20的“香”,多家中国巨头花费160亿美元采购“阉割版”H20。 也就是说,在全球市场来看,DeepSeek让英伟达不得不解释高端芯片依然重要,但在本来就只能卖特供版H20的中国市场,DeepSeek的作用反而是正向的。 直到H20的禁令。 如今英伟达不得不设计新的中国特供芯片,拜访这个国家的“英伟达芯片压榨魔法师”是势在必行。 03.梁文锋的选择 不管是从哪个角度看,想象二者相会的场景都足以令人感慨万千。 生于60年代的黄仁勋作为华人,走的是上一辈的精英路径:赴美求学、工作、创业。而80后的梁文锋则走的是新一代的路:在中国高等学府求学、留在中国工作、创业。最终,两个人在2025年的地缘政治的纷乱之中,顶峰相见,共谋发展。 只是时移势易,梁文锋是否还会像过去一样需要英伟达,或者说在未来是否还会持续如此,还要打一个问号。 对于中国市场,黄仁勋有决心不放弃,但是下游算力需求方是否会被迫加速向国产替代方案迁移?这是摆在他面前的一个绕不开的问题。 就在4月10日,华为公布AI基础设施架构突破性新进展,推出基于新型高速总线架构的CloudMatrix 384超节点集群,并宣布已在芜湖数据中心规模上线。 在芯片和AI计算领域,“超节点”即通过高密度集成计算资源和高速互联技术,构建的具备超大算力和高带宽的数据处理单元,是为了满足大规模AI模型训练和推理的需求应运而生的。如此前英伟达的NVL72就是超节点技术的代表产品,由72个GPU组成,采用NVLink和NVSwich技术,实现GPU之间的高速通信。 华为公司常务董事、华为云计算CEO张平安在华为云生态大会2025上说:“华为并不发布面向C端的大模型应用,我们更关注的是怎么能让行业客户真正落地AI。” 其与英伟达在中国本土的竞争关系,不言自明。 中国正在攻坚AI芯片技术的公司不只有华为,但华为和英伟达之间的张力是一个典型例证:就像DeepSeek在被限制的情况下反而“憋”出了“压榨魔法”,中国企业不可能坐以待毙,等待美国“解锁”英伟达芯片。从某种意义上讲,美国进一步禁售英伟达H20,是给中国芯片产业注入了动力。 黄仁勋早已意识到英伟达在中国的竞争压力,英伟达连续两年把华为列入竞争对手名单,黄仁勋在接受《金融时报》采访时曾盛赞其是“中国最强大的科技公司,征服了他们步入的每一个市场”。 层层阉割之下,英伟达在华合规销售的芯片几乎不可避免地被进一步压缩性价比和吸引力,与此同时中国本土企业纷纷蓄招。 在华禁售H20也许不足以给英伟达在中国市场的未来以致命打击,但若DeepSeek和梁文锋抛弃或者减少对英伟达的依赖,那也许才是英伟达在华的真正噩梦。
地平线发布征程 6P 智驾芯片,20 万元车型可获得超 1000Tops 算力
地平线今天开了两个半小时的发布会。 总结一下主要讲了四部分内容—— – 地平线的技术哲学。 – 地平线和蔚来合作量产落地了萤火虫车型。 – 推出全新一代的大算力征程 6P 芯片和「弹夹系统」,实现了硬件可插拔、软件可升级。 – 地平线 HSD 作为奇瑞「猎鹰」的一款先进方案,将在 9 月的星途品牌上全球首发。 征程 6P 和「弹夹系统」 我们调换一下顺序先讲最重要、可能也是大家最感兴趣的征程 6P 平台和「弹夹系统」。 地平线去年推出了征程 6 系列智驾平台,覆盖 10+ TOPS ~ 560 TOPS 算力,而在今天的发布会上,地平线宣布征程 6H 与征程 6P,作为征程系列中的大算力代表,已经成功回片并点亮,并即将投入到实际应用中。 征程 6P 芯片搭载了 18 核 ARM Cortex A78AE 核心以及 4 核 BPU Nash 核心,其算力高达 560 TOPS,可以支持 18MP 的前视感知,图像处理带宽则是达到了 5.3G pixel/s ,可以为智能驾驶系统提供更精准更快速的数据处理能力。 发布会上,地平线还展示了搭载征程 6P 芯片的域控制器。这个「弹夹系统」可以像升级个人电脑一样,让车企选择不同的芯片配置方案来升级车载计算平台。 再具体一点, 搭载双征程 6M 芯片的方案,可以为 10 万级别的车型提供大约 300 TOPS的算力,使其标配智能驾驶功能; 搭载单征程 6P 芯片的方案,则可以为 15 万级别的车型提供大约 500 TOPS的算力; 如果选择搭载双征程 6P 芯片的方案,那么 20 万级别的车型将能够享受到大约 1000 TOPS的算力,实现更加高级、智能的驾驶体验。 HSD 智驾系统 同时新架构下的地平线的 HSD 智驾系统计划与奇瑞合作在 9 月份上车。 HSD 全称为 Horizon Super Drive,地平线称其旨在打造既有类人体验,又让用户信任,在安全方面远超人类的城区辅助驾驶产品。 地平线的 CEO 余凯介绍了他们在 HSD 系统中用来构建用户信任的四个指标。 – 安心度: 预防性驾驶策略,例如减速但不顿挫的刹车,对风险的预判和应对,例如识别障碍物和提前预判施工路段。 – 专业度: 高效舒适的通行体验,例如在上海五角场复杂环岛中灵活换道,以及在狭窄道路中实现三点式掉头。 – 亲密度: 优秀的人机交互界面,例如获得 IF 设计大奖的 HMI,以及强大的语音和语言交互技术。 – 可信度: 避免夸大宣传,实事求是,避免恐慌接管,让用户真正信任自动驾驶系统。 HSD的目标是将城区辅助驾驶系统打造为老百姓每日出行必备的工具,而不仅仅是买车的一个配置。 奇瑞的董事长尹同跃也来为地平线占了台,并宣布奇瑞「猎鹰方案」将和地平线征程6P芯片在星途品牌上全球首发,并于2025年9月正式量产,后续奇瑞还将有更多采用HSD的奇瑞“猎鹰方案”车型陆续上市亮相。 地平线的技术哲学 整场发布会余凯用一大半的时间讲了地平线的技术哲学,董车会在这里给大家总结了几个金句。 智能驾驶的本质是功能价值,而非情绪价值。智能驾驶提供功能价值,智能座舱提供情绪价值,有了功能价值做基础,情绪价值才有机会进一步释放。 互联网时代的产品逻辑是「洞见人间烟火」,本质上是链接,得流量者得天下,得用户者得天下;而 AI 时代的产品逻辑是「逼近世界真相”」。AI 时代,人类行为数据没有价值,99% 的用户数据不值得学习。智能驾驶只有通过自我学习,才能真正超越人类驾驶水平,逼近「驾驶之神」。 技术进步同样会带来技术「平权陷阱」。昨日的独门绝技,放到今天就是标准解法。看似炫酷的技术,并不会带来真正的领先性与差异化。干好苦活累活、做好经验积累、提高体系化的组织文化与能力,才能打造真正的技术护城河,避免陷入技术平权陷阱。 L3/L4/L5 的前提是足够好的全场景辅助驾驶。L3 是受限但清晰 ODD 边界的 L4,加上全场景 L2 辅助驾驶。地平线余凯说,「行百里者半九十,在用户价值的兑现上,整个行业才刚刚开始。地平线要做狂飙中的冷静者,悲观中的笃定者。」 至于蔚来萤火虫,在明天的发布会结束后,董车会会在第一时间带来全面详细的报道,大家可以关注一下。
DeepSeek引爆“万物皆可AI”时代,20余位大咖分析行业痛点,万字梳理干货在此
“DeepSeek,评价一下第三届中国AIGC产业峰会”: 今年的峰会现场,20余位大咖以「万物皆可AI」为主题,激辩“技术前沿与产业痛点”: 2025年中国AI应用爆发的关键是提速降费。 大模型来了,万物皆可Chat,但不能是单纯Excel+Chat。 大模型落地正在从简单、高容错的场景向复杂、低容错的场景延伸。 物理世界实现AGI,一定要通过端侧智能。 大模型正在打破教育领域长期存在的“不可能三角”。 …… 台上精彩纷呈,台下座站无虚席,云端持续火爆,到场参会观众超千人,线上围观人数超320万人,累计曝光量超2000万次,延续了往届峰会的火热。 与以往不同的是,这一次协助编辑部共同整理内容的大模型不再是ChatGPT和Claude,而是DeepSeek。 DeepSeek也成为峰会的高频热词,前所未有的破圈效应把AI推向前所未有的普及程度。 底层的基建,顶层的应用,垂直的场景,正在迎来海量的用户,一个「万物皆可AI」的时代已经到来。如何把握机遇,用好AI,带你一文看尽。 AI如何落地千行百业? 百度阮瑜:大模型场景从简单高容错向复杂低容错延伸 百度副总裁阮瑜首先谈到了大模型应用展现的三大趋势:开发者可以轻松快速、低成本地开发出企业应用;大模型场景从简单高容错向复杂低容错延伸;应用市场在从工具市场向专业服务市场拓展,市场潜力不断地爆发。 随之而来的,可以看到大模型的应用形态也在不断演进:从单模态到多模态,从单智能体到多智能体,从辅助决策向自主执行演进。在这个趋势下,越来越多的大模型应用也将逐步解决用户场景中的更多实际问题。 按照场景划分,百度智能云将千行百业的应用分为两类:通用应用和行业应用。 通用应用中,多模态是个重要演进方向。大模型时代,百度智能云发现大小模型相结合的方式,随着多模态技术不断发展,调优成本是显著降低的,而且碎片化的需求将有非常大的可能性会被标准化的产品来满足。 百度智能云一见就是在视觉领域应用深耕多年诞生出来的产品,其主要覆盖三个场景,分别是安全生产(比如能源制造领域,沉淀了800多个安全生产模型)、连锁合规(比如餐饮安全,有大量视觉场景需求)以及品质管控等。 此外,大模型在行业里的应用也发生了很多变化。以医疗为例,AI技术变革正全面渗透进各种场景中,已经能看到医疗大模型从辅助决策到自主执行方向演进。 阮瑜表示,整个AIGC应用在各个产业里面的创新,离不开产业各界的共同努力。期待未来随着大模型技术的不断发展,可以携手各方共同去加速大模型应用在产业里面的落地、繁荣以及发展。 生数科技廖谦:随着多模态生成能力实时可控可交互,会诞生全新的内容平台 生数科技产品副总裁、Vidu产品负责人廖谦带来了多模态大模型生成方向的展望。 从整体技术发展来看,文本生成工作相对早,技术范式也更明确,解锁的应用场景非常多;多模态起步稍晚一点,图像生成发展很快,已经突破了技术奇点;而视频生成这块,现在的研发进入到黄金发展期。 最近多模态还有个重要方向是具身智能,当多模态的模型可以利用更多维度的数据,也会带来更高维度的智能涌现。 而从产品来看,当前整个中国视频生成/多模态生成的产品,不管是模型效果、用户、商业化的进展,放眼全球都是相对领先的。 那么视频生成能干什么?在生数Vidu的实践中,AI短片、动漫、大众娱乐、广告营销、电商等都是可落地的场景。 接下来多模态生成领域如何发展,他分享了三个行业洞察。 趋势一,2025年将是多模态生成的爆发之年; 趋势二,多模态内容直出,而非仅仅是默剧和片段。 趋势三:专业和半专业用户会大规模涌入,产生破圈高价值的内容。 不过当前还是有很多问题需要解决,下周生数将发布Vidu Q1模型,它将在“极致高质量“上带来新的突破。 最后作为产品经理,廖谦对多模态大模型的终局进行了展望。 随着多模态技术发展到可以做到实时可控可交互时,它完全做到个性化,到那时一定会诞生出全新内容平台。这将在社交、游戏、VR、AR等多个行业领域带来非常深远的影响。 粉笔陈建华:有多少Context,就有多少个性化 大模型的出现,打破了教育不可能三角。可以同时兼顾高质量、大规模化和个性化。 大会现场,粉笔CTO陈建华分享了他 们在AI教育领域的探索和实践。 粉笔成⽴于2015年,是⼀家专注于职业考试培训的互联⽹教育公司。 在陈建华看来,大模型落地教育有四个特点:聚焦学会,⽽⾮仅答案正确; 学习主动⾯临巨⼤挑战; 遵循科学、系统的教研体系;场景严肃、准确率要求极⾼。 陈建华分享,粉笔在大模型教育应用探索主要有三个阶段。 阶段一,聚焦在内部、有限制、⼩场景中进⾏探索。2023年粉笔尝试直接解题,辅助题⽬解析,结果正确率太低,解析不符合教研体系。不过在点评场景⾥,给出点评框架让⼤模型发挥,却发现效果⾮常不错。 由此,他们意识到:⼤模型在教育场景落地中,推理能⼒仍需提升,结构化引导⾄关重要。 阶段⼆,2024年粉笔正式推出AI⽼师,标志着从单点场景⾛向系统化、多场景融合,得到不少收获。 而在第三阶段,AI时代的全新产品——AI系统班发布,基于⼤模型、数字⼈、TTS等技术,AI系统班全程由AI⽼师驱动学习流程,且提供了更加个性化的学习体验。 陈建华强调:有多少Context,就有多少个性化。 展望未来,他表示,粉笔在⼤模型赋能教育的探索将主要聚焦在两个关键⽅向:多维度的个性化升级和三位一体的AI老师形态。 面壁智能李大海:物理世界实现AGI,一定是通过端侧智能 面壁智能联合创始人、CEO李大海带来了端侧智能的分享,他从DeepSeek的成功切入主题,李大海认为其成功背后是天时地利人和的叠加,最底层是三个“密度”: 高人才密度、高组织密度、高资源密度。他总结认为DeepSeek是在云端践行高效大模型的组织,而面壁在端侧秉承同样的信念。 基于端侧智能的长期实践,李大海提出了知识密度的概念,即大模型同样参数量能够压缩越多的知识,知识密度越高,模型的智力就越强。 面壁认为,高知识密度的模型在端上最有价值,端侧智能也是物理世界实现AGI的必由之路。因为物理世界的交互对实时性与用户隐私保护有基本要求,端侧更有优势,李大海以具身智能为例展开介绍了两个场景。 首先是汽车,李大海认为,汽车是第一个真正落地的具身智能。因为汽车的网络不可能100%稳定,因此需要不受网路影响的端侧模型可随时随地感知。 目前面壁已在车端落地了首个纯端侧Agent智能助手超级小钢炮cpmGO,不仅包括去年12月即端侧部署的首个纯端侧、Always On 的 GUI Agent 屏幕助手, 还创造了覆盖感知、决策、执行全场景,与云端全面对齐的智能座舱「原生端侧体验」。突破弱网断网环境限制,实现低功耗高性能快响应的「端侧」专属优势。 然后是机器人,李大海认为只有把大模型直接部署在机器人的脑子里,机器人才能稳定地灵敏感知与及时决策,相比云端具备先天的数据优势与用户信任感。 中关村科金喻友平:“平台+应用+服务”是企业大模型落地的最佳路径 中关村科金总裁喻友平的演讲主题是“垂类大模型迈入商业化应用时代”,他介绍了中关村科金如何将大模型技术应用于企业服务领域。 喻友平强调,2025年大模型正式进入应用时代,企业面对大模型关注的核心问题其实是:大模型能否帮助增加收入、带来更多客户、节约成本或提高效率。 尽管企业应用面临算力成本高、模型与业务融合难、数据处理低效等挑战,但市场前景广阔,而垂类大模型则是企业突围的关键。 喻友平介绍,中关村科金是一家大模型技术与应用公司,具有10年+企业服务经验,积累了深厚的领域和行业产品基础。AI大模型浪潮来临后,不断用大模型对自有产品进行重构。 近两年他们发现,企业对于垂类大模型、基于大模型平台的应用需求越来越大,在实际企业服务过程中,还发现一个规律: 要真正帮助这些企业实现大模型落地,本质上还是需要做好平台、应用和服务。 由此,中关村科金提出了“平台+应用+服务”的三级引擎战略,是企业大模型落地的最佳路径,其核心是基于得助大模型平台训练垂类大模型,打造有价值的智能化应用。 得助大模型平台覆盖算力、数据、模型和智能体四大能力工厂,兼容各类算力和国内外开源基础模型,提供从数据标注到训练推理的全流程支持,具备全链路的大模型开发和应用能力。并且平台还沉淀了数百个大小模型组合的“样板间”,帮助客户更容易实现应用落地。 喻友平指出,大模型在企业的应用难以完全标准化,每个企业业务流程和目标、数据都有差异,在“样板间”里企业则可以根据各自的需求场景做调优,中关村科金与众多合作伙伴一起训练出面向不同场景和行业的垂类大模型,并打造出得助智能陪练、智能质检、语音机器人、文本机器人、知识助手等有实用价值的智能应用。 最后他还介绍了在垂类大模型、垂类场景中,中关村科金在工程建设领域、船舶工业领域,以及金融、汽车、家装等行业的一系列大模型落地案例。 网易有道张艺:「AI+教育」的想象力与落地 网易有道智能应用事业部负责人张艺围绕AI教育,分享了有道一系列的大模型落地成果。 张艺认为大模型在教育场景天然的具有普适性,学校、家庭和自学三个场景非常关键,AI在不同场景扮演着不同的角色。 比如在家庭场景,AI像家庭老师帮你辅导孩子,自学场景则更像是个学习搭子。 张艺介绍,业内一般将AI在教育领域的进展分为四个阶段,目前AI已从“辅助教学”进化至“个性化学习”,正朝着成为“虚拟老师”努力。 以有道最新落地进展为例,张艺还谈到,AI不仅重塑了原有业务,也带来了全新的AI应用及硬件机会。 据介绍,有道自研的子曰翻译大模型2.0最近以14B参数规模,在翻译质量上保持行业领先,已在有道词典、翻译等产品中上线。 在AI原生应用方面,虚拟人口语私教产品Hi Echo,可以提供随时随地的口语练习,以及儿童模式、雅思模式等垂直内容,并履获苹果应用商店推荐,成为教育垂直落地的代表。同时有道今年正在探索AI播客等全新领域,新产品有道文档FM能实现超拟人音色生成,并已开启全网公测。 而有道也在AI原生硬件发力,新品SpaceOne全面屏答疑笔,通过内置的AI家教“小P老师”实现全科答疑的同时,基于多模态识图能力,还带来更丰富的交互学习可能性。 如何为AI产业保驾护航? PPIO派欧云姚欣:AI时代需要“提速降费”,让免费成为可能 PPIO派欧云联合创始人、CEO姚欣的演讲从“AI大规模应用,成本非常关键”这一问题展开。 他认为2025年整个AI行业的关注点已从大模型本身转向了应用落地,特别是以Agent为核心的应用发展。 AI应用普及面临两大挑战:Agent单次任务消耗近百万Token、中国互联网用户的免费习惯很难改变。 他通过移动互联网发展的历史类比,提出“AI时代需要提速降费”的观点。从2014年到2021年,移动流量资费下降了90%,这极大促进了移动互联网的普及。同样,AI应用要走向大众,也需要大幅降低使用成本。 接下来姚欣表示,目前如果要实现AI大规模应用和降本,AI Infra公司必须要成为最懂上层模型和应用的底层硬件基础设施公司。 而这也是PPIO派欧云的定位。他详细介绍了PPIO派欧云的技术策略。 一是持续跟进最新模型,整合更多开源模型,实现模型的推理加速;二是建立全局分布式算力调度系统,应对海量用户请求;三是通过整合全国约4000个数据中心的闲置算力资源,覆盖1200多个城市,提供10毫秒响应的算力服务。 成效方面,姚欣透露PPIO派欧云提供的整个AI推理服务,每年都能实现10倍左右的成本下降。以去年推出的Llama-8B模型为例,上线时定价还是0.1美金,去年年底已降到4分钱,在未来两三个月内还会降到1分钱。 到今天,PPIO平台上每日Token消耗量已突破千亿次,且每月保持超过50%的增速。他相信这一增长曲线将如早期移动互联网一样呈现陡峭上升态势。 亚马逊云Troy Cui:提高数据质量和效率是AI赋能的重要前提 亚马逊云科技大中华区数据及存储产品总监Troy Cui在分享中提出,AI最核心的竞争力仍然是企业自己的数据,如何将数据更快地变成洞察,尽可能提高数据质量,是AI赋能的重要前置条件。 企业已经认识到数据对自身竞争力的重要性,但目前数据治理存在着诸多问题,比如多部门协作时的数据碎片化问题,传统技术栈与云技术不兼容,传统ETL(Extract-Transform-Load)开发维护成本高等。 针对行业痛点,亚马逊云提出了一系列解决方案。 首先是统一数据与AI平台Amazon SageMaker Unified Studio,提供一站式数据开发、模型训练和部署环境,企业可以基于自身数据,用其在几分钟内构建一个低代码的智能问答平台。 然后是数据检索工具,一个是集成在Amazon SageMake中的AI助手Amazon Q,支持自然语言快速生成复杂的SQL,可以帮助开发者判断代码是否存在知识产权的问题。 还有一个应用于视频的方案Media To Cloud,支持用自然语言搜到想要的视频片段。 接着还有Zero-ETL解决方案,自动化将数据汇聚到数据仓库或数据湖,减少ETL开发工作。 Troy Cui最后总结表示,云服务的基线已经从存储、计算、网络和数据库转变为存储、计算、数据和AI-Infra,这也反映出AI在云计算越来越重要。 无问芯穹夏立雪:端云并举改善算力供需矛盾 无问芯穹联合创始人、CEO夏立雪指出,大模型发展逐渐步入推理规模扩展时代,算力需求将激增百倍,但粗放供给与精细需求矛盾日益凸显。 他将传统裸金属算力服务比喻为“高端毛坯房”——用户需自主完成系统搭建与运维,使用门槛高且资源利用率低。应构建高质量平台化算力服务,帮助企业将分散算力升级为“商业广场”、“AI赋能综合体”式标准化服务,使中小开发者无需关注底层架构即可获得完整AI服务生态。 无问芯穹正在相应技术堆栈上持续取得突破,在端侧首创SpecEE推理框架,利用小参数模型缩减大模型搜索空间,实现AI PC等智能终端上2.43倍推理加速;云端创新推出semi-PD,结合融合式实例存储优势和分离式实例计算优势,实现延时降低最高达5.6倍;另提出通用计算通信方案FlashOverlap,首次以基于信号的方式实现计算通信重叠以降低通信开销,可在生产级和消费级显卡上实现约1.5倍加速。 夏立雪最后强调,通过全链路算力服务平台研发,无问芯穹正推动AI算力向“水电煤式”基础设施进化,让每份算力高效转化为新质生产力。 瑞莱智慧田天:大模型落地关键在于智能体组织,安全是核心前置门槛 大模型应用广泛落地中,AI安全隐患、AI被滥用等问题开始涌现。在瑞莱智慧视角下,怎么去看待这一问题。 第一,首先关注去提升AI自身的可靠性和安全性,如越狱攻击、偏见歧视、模型幻觉等,这是因为AI能力还不够强,需要对AI自身进行加固。 第二,随着AI生成能力越来越强,技术本身也是一个双刃剑,需要去防范AI滥用以及被人恶意应用所带来的一些危害。 第三,如果AI能力进一步增强,达到所谓AGI,能力全方位超越人类水平的时候,需要考虑怎么保证AGI的安全发展。 围绕AI的内生和衍生安全,瑞莱智慧经过长期实践,已经有一系列平台产品落地。对于怎么确保AGI安全发展,瑞莱也在进行一些前沿的布局研究,包括怎么样搭建超级对齐平台,用AI监管AI,最终实现更加安全的超级智能。 可能大家会有疑问,是不是随着AI大模型能力越来越强,甚至到了AGI时代,自然而然变得更加安全可控,就不需要进行独立的安全研究和布局了。 类比人类社会智能的发展,古代人类个体智慧水平相比于现在,并没有那么大的差异。但古代人类没有办法形成很强的生产力,而现代人类系统,通过强有力的组织形式和分工取得了前人所无法想象的成就,其关键就在于如何将智能体组织起来。 对于大模型也一样,今天大模型已具备非常强的能力水平,我们不需要单一的智能体具备无所不能的能力,但如果把现有的智能体通过比较好的方式组织并融入到各行各业的工作流之中,重构工作流程,就有可能大幅度解放AI的生产力。 在这个过程中,安全可控一定是非常核心的前置的门槛。 华为王辉:网络安全进入新阶段 ,AI成为网络守护者 华为NCE数据通信领域总裁王辉在演讲中表示,当前全球AI产业正处于全面加速状态,带来网络升级、智能终端泛在和大模型普及等显著变化,持续加剧了企业网络安全风险。 他从网络安全的视角讲述了如何为AI产业保驾护航,以及AI如何为网络和安全产业做好深度赋能。 他表示,AI催生出了新的网络安全攻击场景,包括大模型越狱攻击(利用大模型自身漏洞进行控制)、勒索软件攻击(大模型自动生成勒索变种)、社会工程学攻击(大模型钓鱼新型攻击)等。 由此,网络安全也进入了新的阶段,他分享了华为的安全应对之道,即构建以AI为核心的新一代L4级网络自动驾驶系统,实现网络和安全的深度融合,整体包括三层: 智能网元:内生安全,保障网络自主可控;内置AI,为整网智能化提供必要的数据要素; 网安融合:云网边端的的深度融合,形成网安一体的立体式防御作战; 智能决策:在攻击AI加持下,网络智能体尤其关键,在传统检测与响应的工作流外,能够更加自主的威胁分析、阻断与处置闭环。 最后,王辉强调了四个观点: 第一,未来网络安全将进入AI与AI对抗的螺旋式竞争阶段,取决于进化的速度。 第二,智能体的智能程度不是取决于对已知的决策,而是对未知的判断。智能体当前还是采用了大量的外挂,是面向过去经验的总结,提升模型自身的逻辑推理和规划能力,才能从已知走向未知。 第三,AI落地垂直行业是一个系统工程,不仅仅是引入大模型或智能体,更涉及到硬件、软件、模型甚至流程的重塑,紧密结合,相互协同,才能重构一个垂直行业。 第四,在AI这场国运级别的竞争中,要用最领先的AI技术赋能网络,用最安全的网络技术护航AI产业,推动新质生产力,做科技文明复兴的守护者。 各行各业从业者怎么用AI? MSRA刘炜清:RD-Agent让每个研究员都有个Agent当科研助理 微软亚洲研究研究院首席研究员刘炜清博士谈到的,是大语言模型时代下的数据科学新引擎RD-Agent,其起源、现状和未来。 回望过去十年产业相关落地应用和工作,常用的开发范式是在海量数据中找到有价值的特征来训练模型,根据业务场景不断迭代渐进的过程,最终得到一个智能化解决方案。 但大模型时代到来,是等待被冲击还是选择被赋能?团队研发RD-Agent的初衷旨在让研究员和数据科学家人人都能拥有科研助理,来承担起重复但高门槛的工作。只需要人类专家提供一个想法以及数据,RD-Agent就能完成代码实现。 当前的阶段,他们更进一步的目标是构建通用的数据科学或机器学习智能体,以增强人类专家的能力和产出,甚至自动解决新场景和新问题并持续改进方案。 通过引入领域知识和经验优化算法,使其可以模仿人类专家,RD-Agent解决广泛数据科学任务的能力得到了显著增强,但也渐渐显现出「只是模仿专家,很难达到更高境界」这种瓶颈,团队正在快速迭代演进中尝试以数据驱动的路线来突破这一瓶颈。目前RD-Agent在Kaggle比赛测试上已经能够达到初阶从业者的水平。 未来他们期待RD-Agent可以自主发现新方法,能重塑数据科学和机器学习领域。 最后可以这样总结,团队从最开始自动化为初衷,到现在是增强的阶段,到未来它能在不同场景数据中自主观察、分析和理解来改进现有的方法或者发明新的方法,为各行各业赋能。 数势科技谭李:让每个打工人都能有数据分析和决策助手 今天我给大家分享一个每个打工人都能拥有的数据分析和决策助手。 数势科技联合创始人谭李刚上台就点明了这次演讲的主题。 谭李首先从行业视角分析了数据分析领域的现状和挑战。他指出,即便是领先的互联网公司或优秀的传统企业,目前也只有10%的业务人员能随时获取所需数据,对于绝大多数业务人员来讲经常遇到的问题是数据分析面临大量的需求“排队”。 他分析了三个关键趋势正在加速新数据消费范式的到来: 数据右移:数据权重从采集、入仓向消费端迁移,“以消费促治理,以消费驱动数据生产”成为主旋律。 决策下移:从集中式决策转向分散式决策,各部门需要做出敏捷决策。 管理后移:科技企业不再设置详细的前期业务规则,而是“招到优秀的人给他好的命题让他自主发挥”。 这三大趋势在需求侧,创造了大量数据即时消费的需求。而供给侧,随着DeepSeek的面世以及AI产业链各环节的发力,AI Agent落地的成本指数级降低。因此,AI Agent用于数据分析场景不仅成为刚需也成为可能。于是谭李介绍了数势科技的新一代决策分析智能体SwiftAgent。 SwiftAgent是一款面向企业的数据分析与决策AI智能体,核心解决四层面问题: 及时提供数据和事实,即需即给;给出深度洞察和智能归因;生成智能报告,指引业务决策;关联行动,自主进行长距离任务规划和执行。 谭李还特别强调了企业级应用面临的挑战,为解决这些挑战,数势科技打造了完整的技术栈,解决企业级产品的数据安全、模型幻觉、计算性能问题。 最后,谭李宣布了数势科技即将发布的智能分析Agent白皮书,作为行业方法论引领的重要一步。 蚂蚁集团徐达峰:AI重构前端开发的难点与解决 蚂蚁集团平台智能体验技术负责人徐达峰基于团队在前端从业开发的实践,分享了AI编码落地的难点与解决方案。 徐达峰表示,AI前端研发已成为行业共识,但在整个软件研发的生命周期仍然有很大的提效空间,AI研发在企业落地主要面临AI辅助编码后续修改比率高,安全与可靠运行,兼容现有研发体系和思维模式等三大难点。 聚焦前端开发场景,蚂蚁前端技术团队打造了WeaveFox智能研发体系进行AI编码,主要有图生代码、意图生码和AI质检系统三大突破方向,让AI能根据用户输入的设计图,或者工程上下文补充逻辑代码,交付通过多模态技术检查产物质量。 当然对前端开发者来说,最棘手的不光是开发和改bug,还有不同终端的页面适配。蚂蚁前端技术团队为此制定了图生代码的UI IR标准,让AI前端开发一键跨端适配成为可能,能够生成各种框架库,比如说VUE和React,也包括后续的鸿蒙OS和安卓的一些界面实现类代码。 目前WeaveFox已在阿里和蚂蚁的实际投产,据介绍在超500名前端工程师的参与下,目前在设计图交付动线场景下 AI 已累计生成合并接近100万行代码;研发效率最高可提升5倍。 趣丸贾朔:AI取代了重复性的音乐工作流 那么AI又如何在音乐产业落地呢?趣丸科技副总裁贾朔分享了他们自身的观察与探索。 他首先指出2024年是AI音乐发展的重要节点,技术门槛、创作门槛大大降低。这既带来机遇也带来挑战,音乐行业部分工作可能被AI替代或冲击,也可能提高创作效率和质量。 站在2025年AI音乐应用元年的时间点,AI将以怎样的方式给产业带来正向影响?贾朔认为: 一方面,很多AI产业化应用,有可能是以相对来说润物细无声的方式在背后默默进行。 另一方面,他认为AI更有可能作为辅助的方式帮助现有的从业者、创作家,以更低的成本、更快的速度去完成更高质量的艺术创作。以之前的实践来看,AI创作提效提速初步估算在10倍以上。 这也看到了一种新的可能性—— AI的应用与传统产业不是一个替代跟竞争的关系,更有可能是协助产业升级的方式。 他们自研的音乐大模型在多模态音乐生成、中文人声歌曲生成、编曲能力等方面都有特色,甚至还通过了专业学生盲测,多数评测者难区分人声是机器还是真人,歌曲自然度已经突破音乐“图灵测试”,效果超越美国头部模型。 接下来2025年,应用层是他们探索的重要方向。当前他们以MIDI电子编曲为切入点,让音乐人掌握艺术创作的方向盘,由AI辅助帮助音乐人去快速地产生完整的作品。 圆桌对话:AI 产品如何在垂直赛道落地为王 按照惯例,大会最后迎来了一场备受瞩目的圆桌论坛,今年主题聚焦“AI产品如何在垂直赛道落地为王”。 圆桌对话嘉宾是四位垂直领域行业翘楚,分别是: 轻松健康集团技术副总裁高玉石 像素绽放PixelBloom (AiPPT.com)CEO赵充 心影随形科技(逗逗游戏伙伴)创始人、CEO刘斌新 狸谱APP负责人一休 讨论话题包括产品定位的关键决策、确定产品核心功能的思考历程、AI垂直应用的未来发展趋势等。 Q:为什么要把AI落地到现在的场景?如何确定产品的主打功能? 刘斌新表示,两年前看到ChatGPT后产生了“用AI创造快乐”的想法,想要做“伴随”用户的应用,给用户更多情绪价值。目前产品功能的底层逻辑,就是满足用户在游戏场景里对陪伴、成就和共鸣的需求。 一休则是在看到AI生图能力后,意识到AI可以让原来有创作欲但没有创作技能的普通用户,也能利用AI工具去创作内容。然后打造了狸谱APP,一款能用AI生成漫画和动漫的创作工具,把内容消费者转变为内容创作者,扩大了创作者群体。 Q:如何在容易同质化的场景用AI打造差异化优势?还有哪些进一步的差异化规划? 高玉石介绍目前平台有1.68亿注册用户,和数万多名医疗专业人员以及近百家医药和保险公司建立了伙伴关系,具有非常完整的用户生态和数据的优势,这些优势会进一步放大并转化成差异化优势。他以科普内容为例,表示平台沉淀了超过67万条科普内容,在疾病和健康相关数据有很深厚的积累,相对来说专业性和深入度更高。 赵充分享了对AI应用在产品和渠道侧的打法,首先AiPPT.cn在产品侧是不需要按钮的AI原生工作流程,就和传统PPT创作形成了最基础的差异化,而且覆盖品类范围广,四大PPT品类全都做。然后是渠道侧,目前AiPPT.cn携手200个生态伙伴共同开发市场,为很多知名AI平台如豆包、钉钉的PPT制作赋能,已经在全球积累了约2000万名用户。 Q:从产品面世至今,做AI产品有哪些的环境因素发生了重大变化?这对大家的产品有什么影响? 一休认为环境变化主要有两个,一是视频模型的快速迭代;二不得不提的是DeepSeek。在视频创作方面,一休透露他们原本设想搞类似于平行世界创作,但发现创作核心idea仍然要靠人完成,之后没有在这个方向继续探索下去。DeepSeek出来以后,他们也尝试了用它来写剧情。 刘斌新感受到的变化,首先是大模型底层变化让一些事情变得可能,例如AI搜索在以前有各种幻觉问题,得用各种RAG来做辅助,现在有了推理模型,模型自己能回答得很好。其次,用户对AI的接受度变高。第三个变化是中国的AI应用正在走向全球。 在赵充看来,最大的变化是今年应该是AI应用创业最好的时间,原因有三点:DeepSeek带动了整个AI应用的大盘;所有应用的范式在做切换,有大量的重新定义产品的机会;成本侧,又降了约10倍。 高玉石认为变化有两个,一个是AI技术发展很快,成熟度明显提升,能有效弥补目前自研模型在非核心能力上的各种空白,带来的好处是产品迭代周期和效率明显提升。另外,用户对AI接受度明显提高,但也变得更加理性。现在有层出不穷的AI产品,产品在场景里面有没有有效满足用户需求、有没有解决用户的核心痛点,很关键。 Q:从单次爆款到常青树,维持用户粘性和长期优势的关键因素是什么? 高玉石与刘斌新都谈到了首先在解决用户的需求、解决用户痛点上面,真正提供端到端的完整体验。 随后高玉石谈到了以下两点:将用户使用数据与AI产品、场景等结合形成飞轮效应;以及像轻松健康集团这样已经形成完整生态的业务,将AI技术深度融入到业务流程,特别是关键流程,也很关键。他谈到了辅助医生创作科普视频的一系列AI产品和工具,一方面降低了医生进行健康科普的门槛,另一方面C端海量用户也能获取有价值的专业健康知识,增加生态内用户的粘性。 刘斌新则补充表示「做时间的朋友」,随着时代浪潮发展,更多技术迭代去交付更多能超出预期的功能。具体实操上有三个核心策略:通过构建丰富的人物设定与用户建立情感纽带;数据驱动深度洞察用户需求;开放生态协同,提供全方位立体化价值服务。 对于爆款持续打造,一休更有心得。她首先谈到精准匹配平台与人群属性的重要性,根据目标平台特性选择策略,深度洞察群体共性;此外还有内容设计激发传播冲动,强化社交基因与情感共鸣。不过创业公司容易陷入单次爆款热度消退后持续产出爆款的挑战中,现在正在增加小爆款频次,一步步往上走。 Q:根据观察,影响AiPPT.cn一系列成功及用户增长的关键是什么? 赵充谈到两个关键:需求是不是刚性?需求能不能得到满足? 对于需求刚性这件事,有个数据,全球每个月写PPT次数是10亿次,AI技术之后这个数在涨,很多之前不会写PPT的人开始写PPT了。 需求满足这件事,核心思考的是垂直场景适配、产品体验层面等问题,比如像PPT中文本生成,大模型生成的东西不能直接用,尤其在政务、医疗等场景,他们通常会外挂领域知识库实现专业化,从而更适配需求。 Q:下一轮增长的关键驱动因素会是什么?现在还能看到哪些新的场景/应用机会? 刘斌新认为方向可以看多模态的理解,理解指的是理解整个video时序里发生了什么,而不是单一图片的这一帧里面有什么物体。他觉得以前移动互联网常用的MVP模型在AI时代不适用了,需要预判用户的需求怎样随着技术的发展更好地解决,提前做好准备。 一休看好多模态生成,看好的技术方向有两点:一是实时生成,是精准可控性,模式不完全是文字的方式,可以直接是一种手势或者行为加上语音的方式。精准可控性加上实时生成的话玩法会非常多样,自由度非常高。 赵充分享了他们未来的三个核心策略。第一个是针对既有产品做深度场景化;第二个是出海;第三个事情是做新产品投资和孵化。他表示单品很难建立壁垒,靠产品矩阵、综合的经济模型才会更好。 高玉石整体比较看好大健康领域。他认为从传统的诊疗、健康科普、健康管理,甚至临床研究,药物研发,都存在着大量的机会。他还详细介绍了个性化和动态化的健康管理服务,以及基于此,针对特定用户群体提供定制化的保险产品和个性化的保险定价。 — 完 —
最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了
“史上最强视觉生成模型”,现在属于快手。 一基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵,都重磅升级到2.0版本。 可图2.0,对比MidJourney 7.0,胜负比「(good+same) / (same+bad)」超300%,对比FLUX超过150%; 可灵2.0,文生视频对比Sora胜负比超360%,图生视频对比谷歌Veo2胜负比超180%。 新版本当中,两款模型的语义遵循能力和美学能力均大幅提升,还新增了图像编辑、风格转绘等一系列新功能。 并且一如既往坚持不搞期货,发布会一结束,两款模型及新功能就立即上线可用。 模型发布后,也引发国内外广泛讨论,就连马斯克也在X上连夜关注了可灵AI官方账号。 实测可图全新升级 在过去,MidJourney生图+可灵图生视频是一种常用的创作工作流。 但随着可图的全新升级,创作者们可以告别MidJourney,在可灵AI的平台内完成这一系列操作了。 相比前一代模型,可图2.0基础模型的第一个亮点,就是语义遵循能力大幅提升,具体又可以分为三个方面—— 复杂元素响应更精准、镜头语言设计更合理、画面细节表现更丰富。 话不多说,直接看案例: 黑白照片,少女照镜子,镜子里映出她老年的样子,写实摄影,左右对比,侧面构图,电影光照,一位白裙少女正在一个复古圆镜前照镜子,伦勃朗光照,景深摄影。 这组提示词设置了“现实”中的少女样貌和镜子中老年形象的反差,这样的场景是一种艺术设计,在真实世界中并不存在。 即便如此,可图2.0还是按照提示词中的要求完成了创作,构图、颜色等设置也都满足提示词要求。 相比之下,前一代生成的图片,除了确实有一位少女和一个镜子之外,和提示词几乎没有什么关联。 再看第二组。 春节,爷爷奶奶,爸爸妈妈,1个男孩,5个人其乐融融的互相聊天,桌上的菜肴丰富。 这个设定看似简单,但实际上想要让准确呈现人或物体的数量,一直以来都不是一件容易的事。 但可图2.0的作品当中,人物的数量,以及人和人之间的关系,都完美契合了提示词的要求。 而前一代产品,四张图无一例外地出现了6个甚至更多的人物,性别和年龄设定就更随意了。 内容和细节之外,可图2.0对提示词中的构图、光线和景别设定的响应,也变得更加精准。 一位盘着浅色毛衣发髻的绝美的东方女性背对镜头,倚坐在木质窗边的扶手椅上,手中的书本在自然光下泛着柔和的纸页光泽。她的姿态松弛而专注,浅色长裙垂落椅边,与窗外险峻的雪山形成奇妙呼应——远处峰峦正被夕阳染成熔金般的色彩,雪线与蓝天交界处泛起淡紫的暮霭,粗犷的自然景观透过玻璃窗框,化作室内暖色空间里一幅流动的油画。窗台上冒着水珠的玻璃瓶和摇曳的烛火,在木纹窗台投下细长的光影,昏暗的室内环境,极简,大面积留白,影视化构图,光影美学,梦核,迷惑,丰富的细节,逼真,忧郁,悲伤,朦胧,模糊,虚焦,逆光,摄影,宝丽来风格。 在翻译行业里,能否做到“信、达、雅”是衡量结果质量的常用标准,放到AI绘图当中,这套标准也同样适用。 因为AI绘图,也可以看做是从文本到视觉信息的一种“翻译”。 如果说对指令的遵循体现了“信”和“达”,那么可图2.0的“电影美学表现”,就是在向着“雅”的层次迈进。 来看实测效果。 电影质感,下午一位穿浅色衣服的亚洲男人站在路边打电话,前景有绿色汽车飞速驶过。光影柔和。参考《重庆森林》电影质感。 电影感,参考《赎罪》风格,树林里光线明暗交替,一个女生拿着花束,穿着法式绿色纱裙在树林中奔跑,她飘逸的卷发随风飞舞,中景,动态模糊。 可以看出,可图2.0在勾勒电影质感时,运用了更高级的色彩及光影,使得情绪表达更具感染力。 另外可图2.0也进行了多风格化相应,支持近百种风格,无论是古典还是现代、写实还是夸张、实拍还是动漫都能搞定,包括GPT-4o带火的吉卜力风也能生成。 白衣剑客动态姿势,丝质长袍飘动,剑锋直指前方。背景悬浮万剑阵列呈几何矩阵排列,冷钢质感伴随青蓝刃光。金色光粒子在气流中旋绕,柔和的体积光照。强烈明暗对比搭配轮廓光强化肌肉线条。纯黑虚空背景增强景深对比。超精细8K渲染,ZBrush级布料雕刻纹理,Octane金属反射材质。剑身雾气效果含次表面散射。构图融合天野喜孝幻想美学、Greg Rutkowski电影级打光与《剑灵》概念设计元素。 新海城风格,穿着运动装的少女在霓虹闪烁的都市街道上疾速奔跑,飘动的长发掠过街边玻璃橱窗倒影,交通信号灯在暮色中切换成流动的光带,背包上的挂饰随着步伐晃动,柏油路面蒸腾着雨后水汽,广告牌与电子屏的光斑交织成迷离的背景光晕。 不仅模型,可图这次更新也增加了两大全新功能——风格转绘和图片编辑。 下面的这12张图,就是由同一张图片,搭配不同风格提示词,使用可图转绘而成的。 而图片编辑具体包括了局部重绘和扩图两个方面。 有了局部重绘,不仅可以对现实中的图像进行修改,当得到一张风格特别好但细节有瑕疵的图片时,也不用再从头开始“抽卡”了。 比如想要把前面展示的年夜饭照片中小男孩手里的魔方换成螃蟹,就可以框选或涂抹目标区域,然后提出修改要求,就可以等待成果了。 生成的结果是这样,完成了选中部分的重绘要求,同时未选择的部分没有任何变动。 在扩图功能中,既可以把自己的想法交给可图实现,也可以什么也不说,给定一个比例,让可图自行发挥想象。 △ 扩图结果,无提示词 当然,可图2.0的局部重绘和扩图并不局限于上面的传统用法,创作者可以充分发挥想象力,创造出别具一格的作品。 这里就用一个例子抛砖引玉,更多的玩法就交给创作者们自行探索了~ 在可图模型和功能全面上新的背后,是可灵大模型团队做出的一系列技术创新。 首先是利用全新升级的文本表征处理链路,精准建模预训练文本到视觉表征的映射,这正是可图2.0语义遵循能力提升的关键。 可图2.0还采用了自适配图像Caption构建策略,显著提升了各阶段的学习效率。 此外,可灵大模型团队还在探索后训练阶段的Scaling Law,对数据体系和多样性进行了全面升级,并应用全新提示词工程和去噪策略,从而提升模型的表现力。 超越文本,AI创作的新方式 可图的升级,既是为了更好满足图像创作者的需求,也是为了给视频创作者提供更好的素材获取途径。 发布会上,快手副总裁、可灵AI负责人张迪介绍,在使用可灵生成视频的用户当中,有85%使用的是图生视频。 但其中涉及到的图片素材,不一定是拍摄或手绘而成,也可能包括生成结果。 相比于完全由文字生成视频,图片能够体现出文本无法精准描述的细节,从而让视频生成模型对目标的把控更加清晰。 因此,这种“曲线救国”的方式,可以降低视频生成结果的不确定性,减少试错成本,因此受到了用户的青睐。 这样看来,可灵AI团队不断打磨图像生成模型的目的,就显而易见了。 当然除了可图,视频生成模型可灵也进行了升级,针对之前指令遵循不好、动态效果不佳、美感缺乏的问题做出了全面升级。 可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。 模型与产品升级之外,快手也在探索一种人与AI之间的新型交互方式。 快手高级副总裁盖坤表示,文字在表达影像信息时是不完备的,我们需要探索新的方式,才能让人真正精准地表达出心中所想。 所以在本次发布会上,可灵AI正式发布AI视频生成的全新交互理念——多模态视觉语言(Multi-modal Visual Language,MVL)。 MVL让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。 基于MVL这一全新交互方式,可灵2.0大师版全面升级了视频及图像创作可控生成与编辑能力,上线了全新的多模态视频编辑功能。 加上之前已有的提示词优化、音效生成、对口型等一系列功能,快手已经初步构建出了从创意到视觉呈现的完整创作链路。 这不仅让专业创作者能够精准还原脑海中的艺术构思,更让普通用户通过“所见即所得”的交互逻辑释放创作潜能。 让每个人都能用AI讲出好故事 发布会上,盖坤再一次讲到了可灵的愿景——让每个人都能用AI讲出好故事。 自去年6月发布以来,可灵AI已累计完成超20次迭代,累计生成1.68亿段视频和3.44亿张图片素材。 在这一过程当中,可灵AI一直坚守初心,不断提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。 包括可图和可灵2.0版本升级,以及MVL的提出,同样是在扫清“用AI讲好故事”的道路上的障碍。 可灵越来越完备的产品体系和工作链路,正在让AI创作变得愈加触手可得。 甚至为了帮助不懂提示词的纯小白用户完成创作,可灵还在Web和APP当中接入了经过专门为设计提示词而调整的DeepSeek模型,进一步降低了AI视频创作的门槛。 可灵的表现也获得了大佬的认可,比如马斯克早在去年八月就曾评论一则由可灵AI制作的内容,称“AI娱乐产业正飞速发展”。 到现在马斯克连夜关注官方账号,进一步说明可灵已经彻底打造出了国际口碑。 总之,快手正在用技术让影像创作回归本真——专业者能精准雕琢每个光影细节,普通人也可凭直觉编织动人故事。 当技术逐渐溶解专业壁垒,那些曾遥不可及的艺术表达,终将成为每个人记录世界的本能,让每个平凡瞬间都自带美学重量。 — 完 —
把智能体装入浏览器,3分钟搞出可视化研报,解放打工人神器来了
作者 | 陈骏达 编辑 | 云鹏 智东西4月18日报道,今天,国内AI浏览器创企Fellou向智东西等媒体分享了其浏览器产品的最新进展。Fellou将Fellou浏览器其定义为一款AI原生,具有自主规划、计划执行、根据用户需求自主决定行为方式的AI浏览器。 这款浏览器具备自动浏览网页、整合信息,帮助用户完成复杂任务的行动能力,还能据用户行为和状态主动提供服务。其任务平均耗时为3.7分钟,成本为0.3元-3元,远少于Manus、OpenAI Deep Research等相同功能的产品。 浏览网页、使用电脑时,Fellou浏览器基于虚拟化技术为浏览器打造了“影子空间”,AI不会与用户“争夺”电脑的使用权。为了让人与Agent更顺畅的协作,Fellou还打造了用于更高级别自动化的智能体框架Eko。 Fellou浏览器于2024年底面向海外市场小规模推出,目标用户主要为先锋用户与知识密集型用户,如产品经理、投资人、媒体从业者等。这款产品的商业模式处于探索阶段,未来可能通过云存储空间等方式进行收费。 一、打造行动型浏览器,可主动预测用户需求 Fellou创始人谢扬也是身份云产品Authing的创始人,曾在字节跳动任职,后连续创业。 谢扬认为,当今浏览器市场拥有三种类型的浏览器:传统浏览器、对话式浏览器与搜索优化型浏览器。其中,对话式浏览器更多提供对网页的总结与自然语言交互,而搜索优化型浏览器具备深度检索能力。 Fellou浏览器的名字是“Fellow”的变体,谢扬称Fellou希望将这一浏览器打造为用户的伙伴,了解、熟悉用户,并且能为用户提供服务,是一款行动型浏览器(Agentic Browser)。 现场,谢扬用多个案例展示了Fellou浏览器的能力。 首先是深度行动能力,其中包括了Fellou浏览器的Deep Search功能。与Deep Research不同,Deep Search产出的结果较为精简,重点明确,并且倾向于可视化、图形化的方式呈现。 ▲Fellou浏览器的Deep Search结果 其次是主动智能。Fellou浏览器具备环境感知架构,能了解用户行为、环境状态与环境事件,并通过这些信息预测用户的需求。例如,当在Fellou浏览器搜索“故宫博物院”时,这款浏览器会主动询问用户是否需要为其指定旅行计划。 影子空间是Fellou浏览器的一项独特技术,通过虚拟化技术,能让浏览器与人更好地同时使用浏览器。不过,Fellou并未实现操作系统级别的虚拟化,而是应用程序级别的,谢扬称目前这项技术的成熟度在60%到70%。 谢扬认为,未来很难出现一个单一通用智能体胜任所有任务的情况。Fellou打造了智能体网络(Agent Store),允许用户打造个性化的对话智能体;同时,也可以将操作序列封装为一个完整的工作流,供其他用户直接调用。 这一智能体网络使有垂直领域知识的智能体创作者面向全网用户开发、共享自己的经验、知识和工作流。 二、融合浏览器、智能体与工作流,单次任务执行成本小于3元 在设计这款行动型浏览器时,Fellou主要融合了3大元素:浏览器、智能体能力与工作流自动化。 浏览器负责最广泛的Web内容访问与渲染,以及对操作系统、文件系统、命令行与本地应用的直接控制。 智能体负责思考和决策,基于大模型或其他算法来理解上下文、规划行动。 工作流自动化负责执行和工具化,能调用不同的API、插件、脚本,实现跨网站、跨应用的自动化操作,并能与A2A、MCP等协议集成。 用户在浏览器上的行为可大致分为搜索和序列化操作工作流。 在搜索场景,用户通过浏览海量网页来收集信息、分析数据,获取所需知识,Fellou浏览器可以批量并行化,一次性辅助用户阅读大量网页信息。 在工作流中,用户需要依靠一系列序列化操作完成具体任务,如在线购物、预订会议、填写报告、交互提交等,Fellou浏览器可根据用户需求自行规划任务并自主行动。 为验证生成的报告效果,Fellou团队找了60位用户进行测评,分为五大维度(准确性、描述清晰性、思考深度和广度、可读性),和OpenAI Deep Research、Manus、Perplexity做了打分比较,Fellou浏览器的综合得分展现出优势。 从执行速度层面来看,Fellou在49个任务中的平均耗时为3.7分钟,而Manus的平均耗时为18.6分钟,OpenAI Deep Research为11.5分钟。 Fellou浏览器的自动化工作流依托于Fellou团队自研的浏览器使用框架Eko,允许用户干预,执行速度较快,单次任务执行成本在0.3元-3元之间。 三、现阶段主打海外市场,仍存幻觉问题 现场,谢扬与智东西等多家媒体进行了交流。智东西注意到,其官网内提供的Demo中存在图表数据错误,在这些数据以可视化形式呈现后,用户对其进行溯源的难度也更高,这对其生成结果的可靠性产生了负面影响。 对此,谢扬回应,在深度行动场景,Fellou浏览器在检索数据丰富的信息(如某家公司的财报)时准确度较高,但在数据量较小的情况下,确实会出现幻觉。 现阶段,谢扬建议在使用Fellou浏览器进行行业分析或决策时,优先参考其提供的结构化的文字信息与引用,Fellou也在努力解决生成结果中的幻觉问题。 当谈及浏览器领域面临的激烈竞争时,谢扬称Fellou团队目前拥有产品、运营、工程与算法部门,团队有打造优秀to C产品经验,学历背景包括清华、复旦、斯坦福等知名学府。 谢扬透露,Fellou浏览器的平均内存占用约为1.5GB-2GB左右,Fellou团队认为有希望将其优化至400MB-500MB,这将降低其对用户设备的要求。 现阶段,Fellou浏览器将主打规模更大的海外市场,这一市场对新产品的接受度更高,竞争环境更好,但未来中国也会是重要的市场。 结语:AI引发浏览器形态升级 浏览器作为互联网的主要入口,在AI技术兴起之前,功能较为传统和固定。生成式AI为传统浏览器带来了新的发展机遇,浏览器厂商纷纷加入AI功能,浏览器AI插件或是如Dia这样的新形态AI浏览器产品层出不穷。 Fellou本次发布的行动型浏览器是AI浏览器领域的最新尝试,现阶段在成本、速度方面具有优势,并通过可视化界面提供了独特的阅读体验。未来,我们或许能看到更多AI对浏览器形态带来的变革。
“AI孙悟空”首秀大阪世博会,中国力量已然改写全球AI竞争格局
作者 | 程茜 编辑 | 漠影 智东西4月18日报道,这一周,2025年大阪·关西世博会(大阪世博会)上,本届世博会面积最大的外国自建馆之一中国馆无疑成为焦点。 从“嫦娥五号”“嫦娥六号”带回的月壤样本,到”蛟龙”号深潜器的体验舱,一件件代表中国科技实力的”大国重器”精彩亮相。而在AI领域,中国馆也带来了令人眼前一亮的互动展项——由科大讯飞联合打造的”AI孙悟空”。 中国第一部彩色动画长片《大闹天宫》中的”孙悟空”形象,是国人心中当之无愧的动画英雄。这一次,在讯飞星火大模型的科技赋能下,“AI孙悟空”用中日英三国语言实时与观众进行对话交流、传播中国文化,化身世博会中国馆的“导览小能手”,图文并茂地介绍中国地道美食以及意境深远的古诗词。 这些齐齐亮相的硬核科技和创新成果,正成为中国科技实力的生动注脚。 一、“AI孙悟空”化身中国馆宣传大使,三国语言自由切换 上个世纪60年代,上海美术电影制片厂出品的《大闹天宫》中,齐天大圣的形象深入人心。为了体现传统文化与AI大模型的结合,科大讯飞将身穿虎皮裙、手拿金箍棒的“AI孙悟空”搬到了世博会的中国馆里,此AI大模型展项由上影元联合共创。屏幕上的“AI孙悟空”出场效果惊艳,依托讯飞星火的技术,语言交互、AI作画功能让孙悟空“七十二变”的本领变得切实可感,引得不少观众交流互动。 话不多说,先来一览“AI孙悟空”在大阪世博会中国馆上的精彩表现。 走向国际舞台,“AI孙悟空”的外语能力自然不在话下,面对现场观众中、日、英三国语言的提问,“AI孙悟空”自如切换,流畅回答现场观众的问题。不仅多语言对话功底深厚,中日英三国语言的回答都完全忠于角色特点,即使说日语、英语时也能和动画片中角色风格保持一致。 自世博会开园以来,前来参观的观众络绎不绝,熙熙攘攘的会场里人声鼎沸,然而,即便在这样的嘈杂环境中,”AI孙悟空”依然可以精准捕捉到观众的声音,并快速给出准确的回答,可见孙悟空的“听力”功底也是非同一般。 光会说外语还不足以体现“AI孙悟空”的多才多艺,它还可以“写诗作画”。配合着屏幕进行图文并茂的展示,“AI孙悟空”直接将“大漠孤烟直”这句古诗词的景象“画”了出来。 郜静文称,科大讯飞团队对“AI孙悟空”重点打造的能力集中在数字人和星火大模型的问答能力之上。基于上影元为孙悟空构建的3D模型,科大讯飞进行了大量的AI化工作,既要让孙悟空动起来,还要结合大模型能力让其回复、动作表现、与人交互的方式方面更还原孙悟空形象。 科大讯飞为世博会定制的“AI孙悟空”,上知天文、下知地理、通晓三国语言,成为世博会上一个非常引人注目的“中国名片”。 二、拆解“AI孙悟空”背后的技术密码 “AI孙悟空”强大的能力背后,科大讯飞想要传递的正是中国在AI方面的深远积淀。当下全球科技圈内,大模型能力迅速崛起成为新一轮科技竞争与国际发展格局重塑中的关键变量。 惊艳众人的“AI孙悟空”背后,一系列前沿技术的支撑不可或缺。 首先是在人声鼎沸的场馆内,让“AI孙悟空”听得足够清楚的高噪场景语音识别技术。 语音已经成为人们在诸多场景的高频交互方式,但实际应用中往往会面临嘈杂环境识别不清、多人说话识别混乱等诸多问题,也就是语音识别领域的“鸡尾酒会”难题。解决这一难题的关键在于“抗噪”技术的处理,即如何在多人对话的场景中,精准识别出多位主讲人的声音。 而科大讯飞的技术团队早已突破这一难题。去年9月,在国际权威赛事、语音领域公认“最难语音识别任务”——CHiME-8中,科大讯飞在“会议室场景远场多人语音识别”(NOTSOFAR)任务中获得全部两个赛道的第一名,自2020年已连续五届拿下冠军,标志着“鸡尾酒会”难题已经取得了重大突破。据科大讯飞东北亚研究院院长孙庆华介绍,科大讯飞团队实现了在多重干扰噪声场景中,对多通道语音识别和说话人分离,多通道赛道上语音识别错误率(tcpWER)降低至10.8%,远远领先第二名的18.7%,且在细分的7个声学场景下的表现都优于其他团队。 孙庆华还介绍到,语音识别准确性提升的门槛集中于数据、模型算法、复杂环境处理三大方面。 具体来看,科大讯飞围绕着输入法、翻译机、智能座舱、虚拟人交互等相关场景积累了大量真实多语种语音数据;基于上述语音识别领域的数据积累,结合无监督预训练、多模态融合技术,科大讯飞在去年1月就率先发布了星火语音大模型;此外,基于“多通道语音信号时空分离建模方法”实现了说话内容和环境噪声的高度解耦,提升了复杂环境中的语音识别性能。 正是在这三个维度的深耕,使得科大讯飞在语音识别领域一骑绝尘,去年讯飞星火4.0的发布会上,一段三个人混叠说话的语音识别场景惊艳亮相。 孙庆华透露,目前,科大讯飞的语音识别在三人混叠说话场景也能实现86%的准确率。并且在噪声比人声大很多的-5dB信噪比高噪场景下,其识别准确率也能达到85%以上,远超OpenAI语音识别模型Whisper-V3。 大阪世博会期间,科大讯飞发布了双屏翻译机2.0新品,解决了高分贝噪音干扰、多语种混谈等痛点,其1米音障强降噪能力,让用户在嘈杂环境下也能进行实时翻译。 其次是多情感超拟人语音合成技术,高度还原孙悟空声线。 事实上,这一技术并不神秘,已经被用于地图导航、数字人声音等场景,讯飞星火也曾在去年4月推出“一句话声音复刻”功能,用户只需要用一句话就可以定制专属的AI助手声音,大幅降低了语音合成的采集成本。 孙庆华介绍说,“AI孙悟空”通过语音大模型音色解耦技术,控制合成语音的音色,完美复刻了86年版《西游记》前5集中孙悟空的配音演员李世宏老师的声音,并让孙悟空“学会了”把日语和英语也用同样的音色说出来。如此一来,实现了孙悟空的声音穿越时空,在今天的世博会上与观众对话。 同时,为了让“AI孙悟空”的对话内容更符合西游记中孙悟空的形象,研发人员在星火多语种大模型基础上,增强了多轮对话、角色扮演能力,从性格、人格、说话特点、口头禅、说话场景等维度实施解耦,用日语再现了中国人家喻户晓的那个孙悟空的形象。 第三是“AI孙悟空”的多模态交互能力。 大模型的能力已经从单一模态向多模态融合演进,具备图片、视频、音频等生成能力的大模型层出不穷。去年4月,讯飞首发长文本、长图文、长语音“三合一”的星火多模态交互大模型,直接跨模态实现文字、图像、语音交互。 通过深度融合多模态交互能力与超拟人数字人技术,“AI孙悟空”能依据和游客语音对话的内容,生成丰富的动作和表情,让每一个动作、每一个神态都与语言表达完美契合;同时,依托讯飞星火大模型的视觉处理图像理解与创作能力,能够基于语义需求生成高质量视觉内容,从而打造出这个能“写诗作画”的AI孙悟空。 最后,对各种问题都能应对自如的“AI孙悟空”,离不开科大讯飞“奇思妙问”这款产品多年的技术积累。 在世博会上,“AI孙悟空”饱读诗书,能够轻松应对观众关于中国传统文化、人文风情的各类问题,这一丰富的知识储备,以及让AI大模型达到类科学家的自由对话、问题准确理解、海量科普知识、逻辑推理能力,也是科大讯飞在教育场景不断积累的成果。 科大讯飞科学教育产品线总经理刘君谈道,奇思妙问产品的研发初衷是,在入校调研中发现的一个矛盾:学生的奇思妙想是无限的,但老师的知识储备存在边界。当孩子提出跨学科甚至“天马行空”的问题时,有时被老师敷衍、忽视甚至斥责。因此,科大讯飞决心用技术“接住”每一个问题,做一个“随时满足孩子‘十万个为什么’”的产品。她补充说,依托讯飞星火大模型及数字人技术,科大讯飞为学生构建爱因斯坦(科学)、李白(人文)等10位中外科学巨匠与文化名人的AI虚拟形象。通过深度语义理解与多模态对话能力,实时解答孩子的问题并通过启发式问答引导逻辑推理。截至2025年4月,“奇思妙问”已累计为18万中小学生解答超362万个问题,98.7%的孩子获得了满意答案。 这4项关键的技术密码,以及多年的数据积累、实践经验沉淀,构成了大阪世博会上生动的“AI孙悟空”,凭借过硬的实力在这一届世博会上火出了圈。 三、基于全国产化算力底座训练,科大讯飞展现中国科技实力 此次,“AI孙悟空”作为世博会中国馆唯一大模型展项,不仅折射出科大讯飞在AI领域的长足积累,更是体现了中国科技发展的底气。 2022年底大模型风起,科大讯飞迅速布局,并率先瞄准了“全国产”布局。去年10月,讯飞星火4.0 Turbo发布,彼时实现了七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o;今年1月,发布业界首个基于全国产算力平台训练的深度推理大模型讯飞星火X1。 可以看到,讯飞星火大模型正一步步从追赶国际先进模型到对标甚至赶超。 此外,AI行业的发展瞬息万变,但其中的一大隐忧是算力生态的布局。因此率先洞察到这一产业趋势的同时,科大讯飞将训练基座模型和构建国产算力生态同步推进。 2023年7月,讯飞星火大模型与华为昇腾自主创新算力平台结合拉开了构建全国产算力平台的序幕,3个月后,其联手打造的首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”启用。24年10月,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。 这也使得讯飞星火大模型成为国内唯一全栈国产算力训练、推理双实现的大模型。 在AI发展日益激烈的当下,科大讯飞此前的技术布局与积累,正在实现交叉融合,其语音技术和大模型的结合进一步扩宽了业务场景,并逐步转化到真实场景的软硬件业务落地之上,在教育、办公、医疗等诸多场景落地。以数字人为例,科大讯飞不断探索AI与数字人形象相结合,将场景从传统的电话客服、企业营销等领域,逐渐扩展到面向大众的文化传播赛道,能够让AI大模型技术在丰富的工作、生活场景中落地,也是这次科大讯飞能够赋能“AI孙悟空”,成为本届世博会上唯一大模型展项的关键。 同时,这也是厚积薄发的科大讯飞在当下交出的一张满分答卷。 结语:科大讯飞亮剑全球AI竞技场 在大阪世博会上,”AI孙悟空”的身影,也是中国人工智能发展的一个生动缩影。它向世界证明,基于全国产化算力底座训练的国产大模型,同样能突破技术边界,展现出令人惊叹的交互能力和文化创造力。 这不仅标志着中国AI产业已构建起从芯片、框架到应用的完整生态链,更象征着在全球人工智能竞赛中,中国正以自主创新的姿态,成长为与全球顶尖水平并驾齐驱的”第二极”。AI的发展,不仅赋予了一个传统动画角色的新生,更是代表了一个科技大国在智能浪潮中的崛起宣言。 4月21日,讯飞星火深度推理模型X1将再次升级,讯飞星火将在全国产算力平台上持续训练,以对标世界领先的技术水平。
ABB集团宣布分拆机器人业务,拟2026年独立上市
编译 | 江宇 编辑 | 漠影 瑞士工业巨头ABB集团于2025年第一季度财报会议中正式公布,计划在2026年第二季度将旗下机器人及离散自动化业务(Robotics & Discrete Automation)分拆为独立上市公司。 ABB首席执行官马丁·韦德(Martin Wierod)表示,独立上市旨在“优化资源配置并提升业务透明度”。分拆后,ABB将保留瑞典、中国和美国三大区域制造中心,其机器自动化事业部(生产PLC、伺服系统等产品)将于2026年第一季度并入集团过程自动化事业部,以强化工业流程控制能力。 一、订单回暖,机器人业务透露企稳迹象 ABB机器人部门2025年第一季度订单量环比回升,除欧洲市场外,全球订单较2023-2024年间的急剧下滑有所回升,但欧洲市场仍面临压力。 ▲ABB机器人及离散自动化业务订单与收入在2023年暴跌后,于2025年第一季度出现回升。(数据来源:ABB) 尽管汽车行业需求依旧疲软,ABB机器人业务在喷涂技术、消费电子、食品饮料及工业机械等多元应用场景带动下,非汽车领域的订单实现显著增长。其中,喷涂解决方案持续保持领先地位,广泛应用于跨国制造企业在全球范围内的新建和扩产项目。ABB表示,其机器人产品正随客户的全球布局同步推进。 根据财报,ABB机器人事业部在2024年实现了12.1%的运营EBITDA利润率。EBITDA即息税折旧摊销前利润,是衡量企业主营业务盈利能力的重要指标,能剔除融资、税收及固定资产投入等对利润的干扰,反映其核心运营质量。 与此同时,原隶属于该事业部的机器自动化业务也在2025年第一季度实现盈亏平衡,释放出业务回稳的信号。 不过,ABB指出,由于关税上升和供应链相关的地缘经济不确定性,ABB2025年第一季度的营收较预测减少2.6亿美元。尽管面临外部成本压力,ABB仍维持了稳定的客户留存率。 在全球制造业格局调整、本地化趋势加快的背景下,这份稳定尤为可贵,也为后续业务独立运营奠定基础。 二、过80%的机器人集成了AI能力 ABB的机器人产品线涵盖工业机器人、协作机械臂以及自主移动机器人(AMR),在全球工业自动化供应商中位居前列。尤其在近几年,ABB加速推进智能化与软件能力,强化其在高端制造解决方案中的技术地位。 2021年ABB收购西班牙移动机器人厂商ASTI,正式切入AMR赛道;2023年进一步并购瑞士初创公司Sevensense,将其视觉导航技术整合进AMR产品,打造出Flexly智能导航系统,提升了其移动机器人在动态环境中的适应与路径规划能力。Flexly已成为ABB AMR产品线的关键模块之一。 ▲ABB的产品线涵盖自主移动机器人(AMRs)、工业机械臂、协作机器人(cobots)及配套软件平台。 截至2024年,ABB超过80%的机器人产品已实现软件或AI能力集成,推动机器人从硬件设备向“智能系统”转变。2024年推出的RoboMasters培训平台内置模块化API和虚拟仿真环境,面向开发者、教育与中小企业用户,成为其构建技术生态的重要一环。 根据财报披露,ABB机器人部门2024年营收为23亿美元,市占率全球第二,仅次于日本发那科,主要竞争对手还包括美的旗下库卡、瑞士史陶比尔等老牌玩家。 在ABB集团内部,该部门自2019年以来大多数季度维持两位数利润率,具备相对独立的市场节奏与发展潜力。 三、拆分之后,ABB如何再造增长路径? ABB管理层在公告中强调,机器人业务自2019年以来多数季度保持两位数利润率,其市场需求与集团其他业务差异显著。ABB董事长傅赛(Peter Voser)指出,独立架构可提升资本配置效率,而ABB集团将维持对电气化与自动化核心领域的投入。 财报同时提及,分拆后的ABB Robotics将更直接对标同业竞争,并通过区域化战略应对地缘经济挑战——例如2023年宣布的2000万美元美国工厂扩建计划,旨在强化北美市场供应链稳定性。 但ABB的分拆方案还需通过欧盟、美国及中国的反垄断审查,合规流程预计耗时8-12个月。若股东批准,ABB Robotics计划于2026年第二季度在瑞士证券交易所上市。 ABB表示,分拆细节将于2024年5月波士顿机器人峰会上进一步披露。据第三方数据显示,中国目前占据全球工业机器人52%的装机量,而ABB上海工厂承担其35%的全球产能,这一布局或为独立后的ABB提供关键市场支撑。
全球首个人形机器人马拉松!宇树和众擎组队,参赛阵容太炸了
编译 | 江宇 编辑 | 漠影 机器人前瞻4月18日消息,2025年4月19日清晨,北京亦庄泡桐大道的紫桐花海下,一场跨越生物与机械界限的赛事即将启幕——全球首届“人机共跑半程马拉松”​。 这场赛事不仅是人类与机器人首次同赛道竞技的历史性时刻,更是全球顶尖机器人技术的“全景秀场”。来自中国、美国、日本等国的20余支人形机器人战队,将携最新科技成果与1.2万名人类跑者并肩挑战21.0975公里赛道,用钢铁之躯诠释科技与生命的共振。 战队1:天工队 参赛选手:天工Ultra 这是一款由北京人形机器人创新中心打造的高性能人形机器人,身高180厘米,体重52公斤,属于全球首个全尺寸纯电驱动人形机器人。它搭载了“慧思开物”智能平台,具备出色的环境感知与规划能力(“大脑”)以及精准的运动执行控制(“小脑”),实现大脑与小脑的协同控制。 机器人具备优异的运动性能,峰值速度可达每小时12公里,采用刚柔耦合的腿部结构,有效降低运动中的冲击力,同时通过优化风冷散热技术,保障其在长时间高强度运动中的稳定表现。 为适应各种真实复杂地形,研发团队还在仿真环境中对其进行了强化训练,包括跨越楼梯、雪地等障碍,甚至成功实现连续攀爬134级台阶。 战队2:钛虎队 参赛选手:T170A “墨翟” 这款由钛虎机器人科技有限公司研制的人形机器人,身高170厘米,体重48公斤,以其卓越的关节模组技术脱颖而出。 其核心技术亮点是完全自主研发的关节模组,集成了电机、减速器、传感器与驱动器,扭矩密度高达220Nm/kg,远超行业平均水平,使其具备如单腿跳跃等复杂高难度动作的能力。 在性能方面,机器人单臂可负重5公斤,兼具高负载与高度灵活性,能够胜任工厂中的物料搬运、精密装配等工作场景,为替代高强度、重复性人工劳动提供了可靠的解决方案。 战队3:神农机器人队 参赛选手:神农 这款由华中科技大学丁汉院士团队研发的人形机器人,身高173厘米,体重50公斤,融合了传统控制方法与强化学习算法,具备在复杂地形(如斜坡、碎石路面)上的自适应行走能力。 面对外力的推拉扰动,它依然能够保持身体稳定,展现出出色的动态平衡性能。机器人搭载先进的电动推进航空动力系统,并结合优化的空气动力学设计,在实现高效能运动的同时,达到了长续航与高载重之间的理想平衡,进一步拓宽了其在复杂环境下的应用潜力。 战队4:轩辕机器人队 参赛选手:轩辕 由合肥哈工轩辕智能科技有限公司打造的这款人形机器人,身高172厘米,体重88公斤,专为服务型场景设计,融合了AI智能问诊功能与情感识别模块。 通过语音、表情等多模态交互方式,它能够理解并响应用户需求,广泛适用于医疗陪护、家庭服务等人机交互密集的环境。 在性能层面,该机器人特别针对半程马拉松赛事优化了步态算法,历经300万次仿真训练与25万次电机结构测试,不仅显著提升了运动控制能力,还具备出色的抗干扰性与复杂地形适应性,兼顾智能服务与高性能运动能力。 战队5:亦马当先队 参赛选手:BoosterT 这款由北京加速进化科技有限公司推出的人形机器人,身高120厘米,体重30公斤,由公司创始人程昊(前字节跳动飞书产品副总裁)带领团队打造,主打小型化与高智能并存的设计理念。 其核心技术包括采用力控准直驱关节设计,每个关节配备双编码器,实现无需复位即可启动,大幅提升了操作便捷性与实战效率。机器人具备跌倒后自主爬起功能,在复杂环境中展现出强大的适应能力。 在性能方面,它能够精准模拟人类跑步姿态,稳定保持速度与平衡,并借助先进的运动控制算法,实现一秒内从摔倒到站立的快速恢复,同时还能实时分析赛道状况,智能调整步伐与节奏,体现出高度智能化的动态响应能力。 战队6:清华通班队 参赛选手:Kuavo(夸父) 这款由深圳乐聚机器人技术有限公司推出的人形机器人,身高166厘米,体重约为55公斤,是国内首款搭载开源鸿蒙操作系统的人形机器人,具备出色的多场景智能互联能力。 技术方面,其创新点在于融合了以降低运动耗能为目标的强化学习框架,显著提升了机器人的运动效率、步态稳定性以及对多变地形的适应能力。 在实际性能上,该机器人可实现超过7公里/小时的奔跑速度,具备强劲的拟人化动态表现。通过强化学习与真机迁移技术的结合,它能够在户外低温、大风、地形起伏等复杂环境下,连续稳定地奔跑30余分钟。 战队7:逐日行者队 参赛选手:逐日行者 这款由优必选科技联合北京人形机器人创新中心联合打造的人形机器人,身高180厘米,体重45公斤,融合了前沿的深度强化学习技术与高水平的具身智能平台。 其技术亮点在于通过深度强化学习框架对动态稳定性进行优化,使机器人在斜坡、沙地等复杂地形中也能保持平稳移动,具备极强的抗冲击干扰能力。 性能方面,机器人搭载了由北京人形机器人创新中心研发的“慧思开物”通用具身智能平台,支持手眼协调、多模态感知及复杂任务决策能力,为其在应对多变环境与高阶任务中提供强大支撑。 战队8:小巨人队 参赛选手:北职大“0306”小巨人 这款由北京科技职业大学11名师生团队自主研发的小型人形机器人,身高75厘米,虽体型娇小,却蕴含强大技术实力。其核心亮点在于融合强化学习与多模态融合算法,开发出一套全身协调控制系统,有效提升了机器人在动态环境中的适应能力。 在结构设计上,机器人采用刚柔耦合关节技术,使得关节活动范围可达180°,具备灵活的头部转动、自然的双臂垂摆以及稳定的双足仿生行走能力。 性能方面,结合基于模型预测控制(MPC)的抗干扰技术,机器人能够在预判未来状态的基础上优化控制策略,即便在外界冲击下也能保持稳定行走,展现出优异的平衡性与仿生表现。 战队9:灵宝机器人队 参赛选手:CASBOT SE 这款由北京中科慧灵机器人技术有限公司研发的人形机器人,身高170厘米,体重48公斤,具备高度自主化与工程集成能力。其最大技术亮点是全身采用自主研发的一体化关节系统,不仅显著提升了机器人的灵活性和抗冲击能力,还实现了长续航与瞬时大电流输出之间的高效平衡。 在控制系统方面,机器人基于分层全身运动控制算法和仿人运动先验,具备高度稳定的全身协调能力。 在复杂地形适应上,研发团队通过算法仿真模拟草地、柏油路、斜坡等场景,并加载数百条障碍物反馈数据,进一步增强了其在复杂环境中的抗干扰性与运行稳定性,使其具备应对多样应用场景的能力。 战队10:城市之间科技队 参赛选手:众擎PMO1 这款由众擎机器人团队打造的人形机器人,身高130厘米,体重40公斤,专注于实现高度拟人化的动态表现。其技术核心在于融合光学动捕技术,精准采集人体运动数据,并通过强化学习与模仿学习优化步态控制,从而实现接近人类的自然动作表现。 性能方面,该机器人移动速度可达2米/秒(约7.2公里/小时),并支持机械步态与类人自然步态两种模式切换,不仅能够完成平稳奔跑(瞬时速度最高达12公里/小时),还具备完成前空翻等高难度动作的能力。 参赛选手:宇树G1 这款由宇树科技研发的人形机器人,身高132厘米,体重35公斤,采用了23-43个高扭矩密度关节电机,扭矩密度超越特斯拉Optimus 30%,使得机器人具备出色的动力和灵活性。 其技术亮点在于能够支持单腿跳跃、360度转身等复杂动作,展现出高度的运动能力和协调性。性能方面,机器人搭载了自主研发的智能算法,具备实时环境感知与动态路径规划功能,能够在极端条件下保持零失误运行,确保在多变的环境中也能稳定、高效地执行任务。 战队11与12:旋风小子队与小顽童队 参赛选手:松延动力N2 这款由松延动力研发的人形机器人,身高120厘米,体重30公斤,采用了优化的脚踝球轴承结构,强化了核心部件的抗冲击性,能够在训练过程中承受数十次摔落而不影响性能。 其技术亮点在于结合了模型预测控制(MPC)与强化学习(RL),通过分阶段训练让机器人掌握高难度动作。在性能上,机器人配备了自研的高扭矩密度关节(≥150N·m),并采用新型复合材料来减轻重量,同时提升爆发力与稳定性,使其具备在复杂环境下执行精确动作的能力。 战队13:湛沪冲锋龙卷风队 参赛选手:Zbot-1600 该款机器人以轻量化设计为核心,配备高精度触摸传感器与AI视觉识别系统,灵巧穿梭于狭窄空间,轻松应对复杂环境。 战队14:巴音布鲁克永远的王 参赛选手:ZBOT-MiniWalker-800 战队15:钢包队 参赛选手:幻幻机器人 这款由智瞰深鉴团队研发的人形机器人,身高170厘米,体重55公斤,具备创新的技术设计。 其技术亮点在于采用石墨烯双通道散热设计,有效保障了机器人在高强度使用下实现4.5小时的持久续航。 在性能方面,机器人深度融合了双足控制技术与自研的VLA大模型技术,使其仿生运动系统能够支持1米/秒的行走速度,并在多种应用场景中展现出卓越的环境适应性,确保在复杂环境中也能稳定、高效地执行任务。 战队16:行者二号队 参赛选手:行者二号 这款由上海卓益得机器人有限公司研发的人形机器人,身高168厘米,体重28公斤,采用先进的肌腱驱动技术,模拟人类骨架与步态设计,使其腿部结构具备高度拟人化特征。 在行走和奔跑时,机器人通过弹性驱动降低冲击力,同时提升能量效率。其最大亮点是成为历史上首个行走距离突破百公里的足式机器人,续航时间超过6小时。 性能方面,机器人搭载了动态步态能量回收机制,能够有效减少无效能耗,即便在复杂地形中,也能保持轻盈而稳定的跑步姿态,展现出优异的能量管理和环境适应能力。 战队17:EAI队 参赛选手:卓益得X02 这款由上海卓益得机器人有限公司研发的人形机器人,身高170厘米,体重30公斤,采用全球首创的肌腱仿生驱动技术。 通过将腿部关节驱动集中至髋关节质心附近,并通过钢丝绳传动模拟人体肌腱运动,机器人实现了更自然的运动方式。其单腿重量不到2公斤,且腿部没有电机,这大大降低了转动惯量和传动损耗,提升了运动效率与安全性,使机器人在高效运动的同时保持稳定和灵活。 战队18:半醒机器人队 参赛选手:精灵 这款由半醒科技研发的人形机器人,身高140厘米,体重32公斤,采用了低转动惯量设计的腿部结构,使其在运动控制中表现出极高的灵活性。 该设计特别适合高动态算法的应用,有助于实现从模拟环境到真机硬件的顺利迁移,提升了机器人在实际环境中的运动控制精度与效率。 战队19:青心Orca队 参赛选手:Orca 该机器人身高145cm,体重40kg,所属团队为上海青心意创科技有限公司。其技术亮点在于能够在直膝状态下实现行走、爬坡、原地转圈等多种运动能力,并稳定完成自然变速行走技术。 此外,它还具备横向劈叉、侧面劈叉等高难度动作的执行能力,在运动控制方面表现尤为出色。 战队20:海派兄弟队 参赛选手:Mini Hi(中文名:小海) 这款由高擎机电研发的人形机器人,身高82厘米,体重17公斤,体型小巧,具备模块快拆功能,方便进行快速组装与维护。其全身搭载自研模组,动力强劲,且具有环境友好的开放设计,能够适配多种拓展模块,最大程度满足开发需求。 在性能方面,机器人配备了近似人类的腿部关节,能够实现跑步、跨障碍、上台阶等功能。未来,该机器人将重点研发上肢功能,拓展其在陪伴与服务领域的应用,进一步提升其多功能性。 战队21:飞天队 参赛选手:XAI-Lite 该款机器人采取简单化机构,结构轻量,跨界实验材料,不设技术路线的限制,构件标准化,与A1+影视工业化相结合。
智己 L6 开启预售,21.99 万元起就有 AI Agent 和四轮转向
智己汽车站在悬崖边上已经有一段时间了。 从 24 年 1 月开始,在乘联会公布新能源乘用车批发销量排名里面,智己汽车就一直在后半部分,到了去年 6 月份,更是被难兄难弟极狐汽车彻底抛在了身后,成为了新势力的「守门员」。 甚至今年前三个月的所有车型的销量加起来,也只有 7035 辆,隐隐有种要步合创后尘的味道。 在这种局势下,新的智己 L6 像是一根稻草,只是不知道是「救命」的那根还是「压死骆驼」的那根。 不过真要给智己的现状找一个「背锅侠」,产品本身倒怎么都排不到前面,营销、销售、售后的各种「骚操作」才是真正脱不了干系的那个部分。 今天智己全新发布的 L6 也一如既往的没有在产品力上让人失望,但不知道是忘写 PPT 了还是为了留一手伏笔,智己只公布了三个版本里其中两个的预售价格—— 74 度电 + 690km 续航的 MAX 版本预售价为 21.99 万元。 100 度电 + 780km 续航的四驱 ULTRA 版本预售价为 28.99 万元,除了电池和四驱的差异外,ULTRA 版本还多了空气悬架和电控减振器。 100 度电 + 850km 续航后驱 PRO MAX版本的售价则未公布。 年轻的流线美 作为智己品牌定位最年轻化的车型,新的智己 L6 并未进行大的调整,依旧采用了流线型车身设计和溜背式造型,长、宽、高分别为4931mm、1960mm、1474mm,轴距达2950mm,车身低矮且宽大,呈现出一种运动感和优雅感。 新智己 L6 前脸部分采用了封闭式格栅,头灯狭长,造型犀利,与进气口区域相连接,形成贯穿式设计,增加了车头的视觉宽度。全新改进的车标位于车头正中央,依旧显得很大。 车身侧面的线条自然流畅,采用了隐藏式门把手的设计,腰线从前翼子板一直延伸至车尾,营造出了一种向前俯冲的视觉效果。 轮毂造型也比较独特,采用多辐式设计,与车身颜色相呼应,刹车卡钳的橙红色也很亮眼,进一步增强了车辆的运动感,L6 标配是 19 寸的轮圈,前轮是 245/45 R19 的规格,后轮则加宽到了 275/40 R19,扁平率更低,刚性更高,在运动场景下确实很好用。 车尾的设计则显得简洁而富有层次感,尾灯采用贯穿式设计且加入了灯语功能,后备箱盖上方微微上翘,形成了一个小鸭尾,符合车身整体的动感美学。 走进车内,最吸睛的部分莫过于中控上方的带鱼屏加下方触控屏的组合,科技感确实很强,但过于方正的连屏究竟适不适配整车的流线型设计还有待商榷,此外触摸式的车内控制屏,在现在实体按键纷纷回归的状况下,有可能成为一个槽点。 新款智己 L6 优化了中控岛台后方的杯架区域,换成了两个手机无线充电面板,整体的氛围设计也比现款更显精致了一些,全景天幕也全系换装了瞬感智控防晒天幕,采用最新⼀代 NMAT 纳⽶矩阵调光技术,UVB 防护达 SPF130+,隔绝紫外线和隔热的能力也都不错。 智己 L6 的座椅这次也得到了升级,主驾座椅的坐骨位置处新增了两个独立控制的气袋,可以依据驾驶者的臀型来进行充气,很好的缓解了臀部压力。后排座椅的靠背这次也提供了 11° 的超大角度调节,同时配备了座椅加热和按摩功能。在乘坐舒适性方面提供了行政级的空间表现,官方数据后排腿部纵向空间将近 1 米,后排横向肩部空间为 1.4 米, 舒适性配置上,新款智己 L6 配备了主动降噪功能,在双层夹胶玻璃和WANOS 7.1.4 20扬声器音响系统的配合下,车内音乐的氛围感和立体感都很棒。 部分噱头部分实用的智能化 当然作为一家由阿里巴巴作为大股东的车企,智己在座舱上的智能化也相当激进。 在阿里大模型的加持下,新款智己 L6 的 IMOS 4.0系统 ,引入了 「AI Agent」,可以实现全场景智能化服务,可以实现「AI 点外卖」等功能,比如可以在回家的路上让 「AI Agent」 给你点一份粤菜送到家里,甚至在付款时帮你自动使用优惠券。 这里要解释一下,这个「AI Agent」只是智己自己的命名,实际上目前 AI 业界所处的阶段,还没有哪款产品可以称的上是成熟的「AI Agent」。 新款智己 L6 全系配备了激光雷达,来自 Momenta 的最新技术让智己 L6 补全了智驾功能的最后一款版图——实现了全国的无图城市 NOA 功能。一键泊车则新增加了 AI 自定义泊车功能,在没有车位线、停车杂乱的环境下,用户可以拖动屏幕上的停车框来指定车辆的泊入位置,同时也增加了路边窄车位侧向泊车、一键循迹、一键贴边、一键脱困等实用功能。 智己这次全系搭载的 「灵蜥数字底盘」 和「智慧四轮转向系统」值得详细说一下,智己说它俩结合能够更好的保障车辆的行驶安全,智己主要举了高速爆胎时的例子——这套系统可以使用智慧四轮转向和线控制动协同技术来控制爆胎 ,能够在爆胎发生的 300 ms内做出反应,帮助稳定车身姿态。 智慧四轮转向系统则支持了双向 18 度的后轮转角,可以实现 「蟹行模式」即前后轮同向同角度转动,能够让车辆实现对角线方向的平行移动,还能使车辆在转向时拥有更好的姿态,在这套系统的加持下,智己 L6 实现了 4.69 米的转弯半径。 在 20 万到 30 万这个区间内,智己 L6 的产品设计确实有其独到之处,体验良好的智驾功能和同级少见的四轮转向更是赋予了其独特的竞争力,但消费者购车时在考虑产品价值的同时,车企能在品牌调性、售前售后服务乃至营销策略方面提供多少情绪价值,也是一个重要的考量因素。 智己的起点本来是不错的,一开始甚至是上汽集团的一号项目。但是后续一系列的不当操作让自己从「顺风局」陷入了「大逆风」,尤其是在上汽和华为联手打造的「尚界」即将到来的当下,智己能否靠新款 L6 一跃成为标杆还是就此成为「弃子」,值得期待一下。 那么各位,你们在购车的时候情绪价值占多大的比重呢?
杭州又发重磅AI新政:基础模型补贴5000万,每年2.5亿元算力券
作者 | 陈骏达 编辑 | 云鹏 智东西4月18日报道,近日,浙江省杭州市发改委发布了关于公开征求《杭州市建设人工智能产业发展高地实施方案(2025年版)(征求意见稿)》意见建议的公告。 杭州市将在算力、模型、核心技术、应用生态、企业成长、人才、数据等方面给予定向支持,部分政策包括: 1、每年2.5亿元市级算力券,补贴采购算力、模型服务的30%(国产算力叠加至45%,非国产至25%)。 2、数据采购、加工补贴30%,单企年补贴上限800万元(大模型企业放宽)。 2、模型研发补助:国际领先的基础大模型给予最高5000万元训练成本补助;行业应用大模型最高给予500万元补助;获国家备案的模型一次性50万元奖励。 4、智能终端按照单品销售额5%给予奖励,单企最高300万元。 5、对高层次留学回国人员在杭的创新创业项目,通过综合评审后给予最高500万元资助。 2025年,杭州市希望培育2个具有国际一流水平的基础大模型,25个具有行业重大影响力的行业应用大模型。 杭州市希望借此方案,打造全球一流的AI研发环境、创业环境、投资环境,建设全国算力成本洼地、模型输出源地、数据共享高地、应用首发地,培育国际一流的人工智能大模型、智能体和示范应用。 以下为《杭州市建设人工智能产业发展高地实施方案(2025年版)(征求意见稿)》原文: 为抢占人工智能发展制高点,抢抓省市一体推进人工智能高质量发展机遇,塑造杭州人工智能创新生态发展优势,加快建设具有全球竞争力的人工智能产业发展高地,特制定本方案。 一、总体目标 坚持市场主导、政府引导、创新驱动、场景牵引、生态赋能,全力构建从算法模型创新突破到行业转化应用的创新支撑体系,打造全球一流的人工智能研发环境、创业环境、投资环境,建设全国算力成本洼地、模型输出源地、数据共享高地、应用首发地,培育国际一流的人工智能大模型、智能体和示范应用,加速凝练以通用人工智能为核心引擎的新质生产力,深度赋能实体经济跨越式发展,建成具有全球竞争力和影响力的人工智能产业发展高地。 到2025年,全市投入市场的智算规模超过**EFLOPS。培育形成具有国际一流水平的基础大模型2个,具有行业重大影响力的行业应用大模型25个以上。全市规上人工智能核心产业营业收入达****亿元,规上核心产业企业达700家。全市投向人工智能的产业基金组建规模突破***亿元。人工智能在制造、医疗、金融、教育、消费、文创、科学、城市治理等领域的应用渗透度显著提升,形成一批具有引领性、标志性的“人工智能+”高价值示范场景。 二、主要任务 (一)打造模型输出源地,加速前沿技术的原创性策源 1.支持头部企业多路线攻关大模型前沿技术。重点支持模型研发企业开展模型前沿技术的基础性、试错性、颠覆性研究,建立面向前沿探索的要素供给机制和试错成本分担机制。 2.深入实施核心技术研发计划。深入实施国、省、市重点研发计划,鼓励和支持企业、科研院所开展人工智能核心技术攻关,加大AI芯片、模型算法、数据工程、具身智能、群体智能、类脑智能、AI4S等领域技术攻关支持力度。2025年,实施人工智能方向市重点科研计划项目10项。 3.建设对标国际顶尖水平的开源社区。依托“魔搭”模型开源社区建设国际领先的人工智能开源社区,汇聚国内外优质人才、机构、场景、资金,研发开发框架、数据集、工具集、智能体、软件应用等原创性技术产品,打造AI开源技术生态。 (二)打造算力成本洼地,加速城市算力的基础性建设 4.超前布局智算集群飞地。在国家“东数西算”枢纽节点超前布局“算力飞地”,形成支撑大模型研发训练的服务能力。优化本地与飞地园区的高速光网传输网络,降低数据传输成本。 5.全面构建城市多元智算供给服务体系。面向智能算力市政化趋势,构建城市智能算力资源统筹供给服务体系,建设算力统筹调度、交易在线结算、算力券快捷兑付的市级算力资源调度服务平台,高质量实施智算云服务试点任务,实现多元算力资源有效汇聚、供需高效匹配,提升算力供给能力、降低算力综合成本。 (三)打造数据共享高地,加速数据要素的创造性配置 6.推进数据要素资源开放共享。深化公共数据授权运营,新增5个公共数据授权运营领域和10个典型应用场景。争取国家数据产权登记试点,启动数据产权登记业务。制定数据产业高质量发展政策,发布杭州数据产业图谱,办好第四届全球数贸会数据要素治理与市场化交流活动。 7.打造数据流通应用“避风港”。构建可信可控可证可溯的训练数据安全供给体系,优化公共数据授权运营模式,探索开源数据集、行业数据集、公共数据、科学数据等多源数据资源分类分级支持人工智能模型训练的开放模式。 (四)打造智能应用首发地,加速场景牵引的变革性突破 8.加速推进“杭州AI+”场景开放示范工程。面向城市治理、市政建设、智能制造、商贸旅游、文化创意、健康医疗、金融投资、低空经济、科学研究等领域,常态化开展“人工智能+”场景的挖掘、策划、发布、路演、对接、落地、推广全流程工作,发布重点场景“机会清单”和重点企业“能力清单”,为人工智能企业和创业团队创造更多产品落地机遇,培育一批数实融合的“人工智能+”高价值示范场景。探索开展国有企业场景开放创新试点和合作创新采购方式试点。 9.加快推进具身智能行业应用。打造人工智能企业、机器人企业、行业应用企业等多元优势主体共创发展的创新联合体,强化大脑、小脑、本体等关键技术的研发、测试与验证,推进人形机器人和具身智能标准建设,加速“具身智能+人形机器人”的软硬件综合集成方案在真实应用场景的规模化落地。 10.加快发展医学人工智能应用。打造以数字健康人安诊儿为核心的医疗智能体,在病历生成、病历质控、药事管理、患者管理、专病研究等方面开展中试应用。建设睡眠、体重管理、医学美容等名医专家智能体和“杭小育”“中医小安”等服务智能体。建设卫生健康数字智能创新实验室,开展医学人工智能关键技术的科研攻关、场景落地、应用验证等工作,推动医学人工智能关键技术发展。 11.深入探索人工智能驱动科学研究。支持浙江大学、西湖大学、之江实验室、白马湖实验室等高校和科研机构聚焦生命科学、基础物理、地球科学、材料科学、环境科学等领域,攻关AI4S领域前沿课题。围绕“深时数字地球”“中国巡天空间望远镜”“三体计算星座”等重大科学课题和工程,开展科研范式变革的系统性实践。 (五)打造产业发展高地,加速智能经济的集群式发展 12.优化人工智能产业布局。立足地区要素禀赋和产业基础优势,因地制宜推动资源要素集聚、产业政策制定、功能平台建设,推动人工智能关键赛道和各类融合业态在优势地区集聚发展。支持余杭区发挥之江实验室创新生态圈、人工智能小镇、未来科技城脑机智能产业园的创新企业集聚优势,重点发展智能计算、类脑智能、智能终端、低空经济等未来产业赛道。支持西湖区发挥环紫金港创新生态圈、中国云谷、云栖小镇的创新资源集聚优势,打造以云计算、基础模型、开源社区、智能空天为核心的生态型产业赛道。支持滨江区发挥中国数谷、模力社区的创新要素集聚优势,重点发展智能计算、数据服务、具身智能、智能体应用、智能终端等创新型产业赛道。支持萧山区、钱塘区,重点发展智能制造、生物智造、智慧医疗等融合型产业赛道。支持上城区,重点发展空间智能、AI元宇宙等未来产业赛道。支持拱墅区、临平区,重点发展智能计算、算力服务等产业赛道。支持临安区、富阳区、桐庐县、建德市、淳安县,加快引进和推广人工智能前沿技术,加速传统产业关键技术智能化变革和产业链焕新升级。 13.创建生态创新空间和标杆产业园。根据人工智能产业布局,支持有条件的区、县(市)打造人工智能生态创新空间,集聚低价算力、共享语料、模型服务、开源指导、政策服务、场景对接、金融投资、孵化空间等一站式综合服务,加快培育服务“人工智能+”垂直应用和赋能产业转型升级的新生力量。打造人工智能标杆产业园,建设园区内外细分领域协作和产业链上下游配套体系,加快人工智能企业集聚发展。2025年认定市级人工智能生态创新空间5个,人工智能产业标杆园区2个。 14.全力打造人工智能制造业集群。培育壮大科技领军企业和专精特新“小巨人”企业,2025年新认定人工智能领域专精特新“小巨人”企业15家,招引人工智能亿元以上项目30个。强化人工智能技术底座赋能,建设一批行业赋能中心,为各领域制造业提供案例展示、培训交流、数字化转型改造等系列服务,打造人工智能赋能新型工业化的标杆案例,树立行业特色“样板间”。依托服务型制造研究院国家卓越工程师实践基地,完善卓越工程师梯度培育体系,壮大人工智能高层次人才梯队,2025年新增卓越工程师200名。推进杭甬人工智能产业集群建设,发挥杭甬“全国数字经济创新中心”和“全国制造业单项冠军之城”融合聚变优势,实施以“1024计划”为核心的集群建设方案,夯实国家先进制造业集群创建培育基石。 15.探索培育“人工智能+”产业新赛道。培育智能计算新赛道,构建覆盖“芯片、板卡、服务器、集群、智算云、端侧设施、运营服务”的产业链闭环,打造智能计算产业集群。培育智能终端新赛道,支持企业加强智能眼镜、无人机、自动驾驶、智能家居、健康监测仪器、外骨骼装置等智能终端产品研发,加速智能终端在真实场景的首试首用和全面推广,2025年新增智能终端类首台(套)装备20项。培育智能空天新赛道。依托“三体”计算星座工程,推动星间激光高速互联、星座稳定组网、算力分布式调度等关键技术突破,打造具身智能卫星系统和天基智能计算基础设施。鼓励科研院所、高校、企业联合攻关,推动人工智能变革卫星设计、制造和应用,赋能智能空天产业发展。赋能未来产业新赛道,面向人形机器人、脑机接口、合成生物、低空经济等未来产业方向,搭建人工智能与未来产业前沿技术深度融合的开放创新合作网络,支持企业建设一批专用算力池、数据集、工具链、模型库,打造一批未来产业运营中心和未来场景创新中心,加速未来产业创新产品从实验室走向规模化商用。 三、政策措施 (一)分担创新成本 1.实施算力券和智能券政策。每年设立2.5亿元市级算力券,对采购智能算力服务和模型服务的用户企业,按不超过合同实际发生金额的30%给予补贴,其中,依托经备案的大模型进行模型服务、智能体开发等应用的企业补贴比例不超过30%,使用国产算力设施开展模型训练、推理和应用的补贴比例不超过30%,使用其他算力设施的补贴比例不超过20%。对采购算力、模型、数据三类服务的企业、高校、科研机构,实施智能券政策。其中,对使用国产算力和非国产算力服务的用户补贴合同实际发生金额的30%和10%,符合市级算力券条件的,可叠加补贴比例至45%和25%。模型服务补贴合同实际发生金额的30%,符合市级算力券条件的,可叠加补贴比例至45%。对数据采购和数据加工服务的用户补贴合同实际发生金额的30%。单家企业每年市级算力券申领(叠加)金额不超过800万元,生成式多模态基础大模型企业可以放宽。 2.支持核心技术攻关。对企业承担国家、省重点科研任务,按国家、省实际到账补助资金的25%,给予最高500万元补助。对企业承担的竞争类市重点科研项目,市本级按不超过实际投入额的20%给予补助,最高补助300万元。对采用主动设计、揭榜挂帅方式组织实施的重大项目可按投资额的一定比例给予补助,最高不超过1000万元补助。 3.支持模型研发。对拥有自主核心技术、按国家有关规定进行备案、经权威第三方机构评测性能达到国际领先水平、综合绩效良好的基础大模型,对牵头研发单位按训练成本进行财政资金补助,补助金额最高不超过5000万元。每年择优评选不超过10个具有行业影响力的行业应用大模型,按研发成本给予一定比例财政补助,补助金额最高不超过500万元。鼓励企业自研模型申请模型备案,对获得中央网信办生成式人工智能模型备案的企业,依据其模型评测等相关费用,给予不超过50万元的一次性奖励。 4.支持开源技术研发。每年安排一定额度智能券份额,重点支持人工智能开源社区面向开发者提供免费的算力、数据、模型服务。推动优秀人工智能开源项目纳入杭州创新产品推广应用目录、首版次软件产品应用推广指导目录等。支持政府、国企、事业单位优先使用基于开源大模型的人工智能解决方案,推动开源大模型在城市大脑重点场景的应用孵化。对开源社区中模型或软件下载量靠前、同类技术指标持续领先、社区贡献度高的个人或企业,按照贡献模型、工具、智能体等不同类别,择优选择不超过10个标杆性项目给予每家最高100万元分档奖励。 (二)培育应用生态 5.支持“人工智能+”场景示范。支持各行业企事业单位主动发布场景需求,与人工智能企业、科研机构形成创新联合体,开展“人工智能+”场景合作创新,每年根据场景开放力度规模、联合体研发投入等因素遴选最多5个联合创新项目,按照不超过项目投资额30%的标准给予联合创新项目牵头单位补助,最高不超过500万元。遴选一批“人工智能+”高价值示范场景及解决方案,每年根据实际成效,评选最多10个具有标志性成果的应用场景,按照不超过项目投资额 30%的标准给予补助,最高不超过500万元。 6.支持智能终端和智能装备应用。支持消费级智能终端和工业级智能装备的研发、应用、推广,推动纳入大规模设备更新和消费品以旧换新补贴范围。对智能终端品牌企业推出的创新度高、性能领先、市占率高的智能终端和智能装备单品予以奖励,每年评选最多5款产品,按照经核定申报产品年度实际销售金额的5%予以单家最高不超过300万元奖励。 7.实施“AI+民生”普惠工程。结合医疗、养老、助残、教育等公共普惠政策,重点支持AI辅助诊断、AI生成病历、AI健康管理、适老化智能终端、助残科技产品、智能假肢、智能康复仪器、AI教学软件等智能产品的推广。在医疗卫生机构、养老院、康复中心、残疾人服务机构等服务机构开展智能产品试用和场景验证。 (三)支持企业成长 8.建立企业成长支持政策。建立“初创、成长、领军”企业成长梯度支持政策。耐心扶持初创企业成长,在大学生创业项目资助政策中,优先支持人工智能初创项目;加大产业生态创新空间为初创企业提供创业经营场地和各类服务扶持,鼓励所在区、县(市)给予各方面要素支持。支持处于成长加速期企业发展壮大,按规定给予“新势力”企业相关支持奖励;支持企业申报认定科技领军企业和专精特新“小巨人”企业;支持企业申报认定国家重点软件企业、国家高新技术企业,按规定享受研发费用加计扣除和所得税优惠政策。支持创新能力领先的领军企业积极参与全球竞争,重点为企业提供“一对一”服务和国际竞争风险应对服务,为企业提供安心发展、静心发展、专心发展的环境,按规定给予总部企业相关支持奖励。 9.支持企业上市融资。将人工智能重点企业纳入上市重点培育名单,组织开展上市专题培训。支持符合条件的人工智能优质企业纳入证券交易所知名成熟发行人名单,接入交易所债券发行绿色通道。支持人工智能优质企业发行科技创新公司债券。运用债券融资支持工具,通过信用风险缓释凭证、担保增信等方式,支持企业在银行间债券市场发行科创票据。 10.支持产业创新空间和基地园区建设。评定一批市级人工智能标杆产业园,每年对绩效较好的给予运营经费补助,补助金额最高不超过200万元。对经认定的产业生态创新空间,给予一定人工智能券额度;对年度绩效较好的,按每年不超过3个,给予每个最高200万元的奖励。 11.支持公共服务平台建设。支持企业、科研院所和第三方机构为人工智能企业提供产品评测、知识产权交易等公共服务,择优评选一批市级人工智能产业公共服务示范平台,对年服务交易额超过2000万元的示范平台,每年给予运营经费补助,补助金额最高不超过200万元,视平台运行成效,对于成长性较好的示范平台奖励在政策期内不超过三年。推进人工智能技术赋能关键共性技术攻关、科学设备研发、中试平台搭建,对经认定的未来产业市级制造业创新中心,形成有核心带头人的研发团队以及不少于1000万元投入的,每年对其平台建设、前沿或共性技术研发以及示范应用类项目,按不超过审核确定投入的50%给予资助,资助金额不超过500万元,政策有效期内资助不超过3年,每年评定不超过3个。 (四)激活创新要素 12.加大人工智能人才招引力度。大力引进人工智能顶尖人才,给予连续三年顶格支持。通过“人才+项目”引进领军人才和团队,在“西湖明珠工程”中单列人工智能赛道,给予倾斜名额支持。对外籍高端专家给予每年最高60万元的年薪资助;对高层次留学回国人员在杭的创新创业项目通过综合评审给予最高500万元资助。开展“FIND HZ”行动,吸引人工智能海外人才来杭留学访学、实习实践、考察交流。 13.加强人工智能复合型人才自主培养。鼓励企业与在杭高校院所共建人工智能领域的研究院、产教融合平台、人才实训基地。将人工智能企业的各级人才计划入选者纳入产业导师库。支持我市高校科研院所与国际高水平机构联合培养人工智能领域研究生,对符合条件的给予培养经费支持。支持在人工智能重点企业、科研院所设置人工智能领域博士后工作站,符合条件的可享受相应政策待遇。 14.推广“企业认定、政府认账”机制。聚焦人工智能前沿技术、细分赛道和关键核心环节,开展人工智能成长型企业专项人才授权。将薪酬待遇、代码被引用量、在重要开源社区的影响力贡献度、“千卡/万卡级”训练优化经验等作为人工智能人才的重要评价依据。支持人工智能企业申报“新八级工”制度单位,对符合条件的技能人才开展“特级技师”自主评定。 15.优化人工智能人才服务体系。持续提升“我负责阳光雨露,你负责茁壮成长”的创新创业服务专业化水平。深化“一码六服务人才杭帮彩”服务机制,为不同层次人工智能人才提供服务。 16.加强产业基金支持。引导“3+N”杭州产业基金群撬动社会资本、金融资本,投向人工智能相关方向的产业基金规模超1000亿元。组建润苗直投基金,重点支持具备硬科技属性的本地人工智能初创企业,完善“投早、投小、投长期、投硬科技”机制。探索投补联动、投贷联动等支持方式。探索建立产业基金容错免责机制,支持政府产业基金和市属国资国有企业加大对人工智能企业的投资。对符合条件的人工智能企业购买的研发类科技保险,按照实际保费给予最高50万元补助。设立人才基金人工智能专项,实施风险包容性支持,允许符合条件的人才申报“高风险、非共识”项目。加强人工智能企业信贷支持,鼓励金融机构创新产品,加大专精特新贷等科创企业贷款推广力度,为人工智能企业提供更适配的金融服务。 17.支持数据集及数据基础设施建设。支持企业和机构通过杭州数据开放平台向社会提供训练、验证、测试、语料等数据集,每年评选不超过5个高质量开放数据集,按照不超过实际投入的30%给予奖励,同一单位年度最高奖励100万元,高质量多模态开放数据集最高奖励可提升至200万元。支持企业和机构参与国家数据流通利用基础设施试点工程,按照不高于已履行的相关服务合同年度累计金额的30%给予补贴,每年最高补贴100万元。 18.支持算力设施投资建设。对合规的算力设施项目(总投资不低于5000万元),鼓励合作银行按照优惠利率提供算力建设项目贷款,支持硬件设备抵押融资。财政资金给予贴息支持,根据合作银行优惠利率择优分档给予项目建设单位不超过1.5个百分点的利息财政补贴,贴息金额不超过项目建设单位支付利息的50%,且单个企业贴息金额每年不超过1000万元。支持符合条件的算力设施项目申请政策性开发性金融工具和地方专项债,发行基础设施领域不动产投资信托基金(REITs)产品。 四、保障机制 (一)加强组织领导。健全全市人工智能发展工作决策运行机制,统筹推进人工智能产业发展高地建设,优化全市数据、算力、科研、政策、产业等资源调度与配置。建立国家、省、市、区工作联动机制,强化政策协同和资源协同 (二)营造创新氛围。坚持“无事不扰、有求必应”的服务理念,营造宽松活跃、服务高效的发展环境。深化政务服务增值化改革,为企业在商事、税务、人才、政策、金融等方面提供全生命周期服务。建设人工智能产业联盟和具身智能产业联盟。依托全球数字贸易博览会、云栖大会、全球人工智能技术创新大赛等赛会活动,打响高地品牌。 (三)强化资金保障。争取各类专项资金,集中力量支持AI基础设施、开源社区、行业数据空间等项目。争取国家级、浙江省产业基金落地杭州,建立多层次市场化专业化的人工智能产业投资机制。 (四)把握安全底线。探索建立发展优先的人工智能安全治理体系,推行包容审慎监管模式,对人工智能新技术、新业态设置观察期和包容期,根据技术发展动向和风险变化趋势,及时更新监管策略,为创新留足空间。探索人工智能安全标准,规范数据安全、算法安全、网络安全和内容安全。做好人工智能人才安全保护,规范人工智能人才流动秩序。 以上政策实施期限2025年*年*月-2027年12月31日。实施期限将根据经济形势和产业发展情况动态调整。本政策措施由市发改委负责牵头组织实施,相关政策条款由市有关部门按职责分工具体实施。杭政办函〔2023〕55号和杭政办函〔2024〕40号同步废止。除明确上级资金支持的条款外,其他政策资助资金由市和各区、县(市)按财政体制共同承担。本政策措施与各级同类政策有重叠的,按照“从优、就高、不重复”的原则执行。上级政策有调整的,本政策按上级政策调整执行。
增程越野深蓝G318无忧穿越版上市:馈电最低油耗7L,18.59万元起
凤凰网科技讯(作者/于雷)4月18日,深蓝汽车旗下越野性能车型——G318无忧穿越版今晚正式发布,共推出3款车型,售价区间为18.59万元至22.99万元。值得注意的是,购车用户可同时享受国家及品牌双重置换补贴,使实际起购价降至15.29万元。此外,老车主更新换代还可享受限时八折优惠政策。 作为G318系列的越野增强版,无忧穿越版在外观设计上更显硬朗气质,配备了一系列专业越野套件,包含前机舱保护盖、车顶高亮探照灯、前后专业包围、碳纤维纹路点缀的外后视镜壳体、黑色外挂式备胎罩以及实用车顶行李架等元素,整车造型更具越野探险特性。 从车身尺寸来看,该车型长宽高数据分别为5125×2025×1895(1950)毫米,轴距达到2880毫米。消费者还可选装原厂AT全地形轮胎,搭配独特设计的轮毂,进一步强化越野性能。 内饰部分基本延续了现款G318的设计理念,采用内嵌式仪表盘与中控屏幕布局,并大面积使用软质材料包裹,提升整体质感。中控区域配备14.6英寸大屏,搭载最新一代Deepal OS 3.0车机系统,除全新UI视觉设计外,还深度整合了DeepSeek智能助手功能。 舒适配置方面表现丰富,全系标配方向盘加热和全景天窗,并提供多色氛围灯、16扬声器高级音响系统(支持车内K歌),前后排座椅均配备加热、通风和按摩功能,副驾更提供舒适腿托,满足长途驾乘需求。 底盘结构上,该车型采用前双叉臂加后五连杆独立悬架系统,高配版本更配备魔毯空气悬架和CDC连续可变阻尼系统,有效兼顾舒适性与越野通过性。 动力系统采用“新蓝鲸”增程动力平台,分为后驱单电机和四驱双电机两种布局。其中,后驱版本最大功率185千瓦,CLTC纯电续航达190公里,百公里加速时间为8.6秒;四驱版本最大功率提升至316千瓦,纯电续航为174公里,百公里加速时间缩短至5.9秒。值得一提的是,该车型最低馈电油耗仅为7升/百公里,展现出良好的燃油经济性。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。