行业分类:
加载中...
头条分类:
加载中...
访五家企业 谈创新发展
图为管理人员在宁德时代电芯制造生产线上调试设备。记者 刘晓宇/摄 图为斐雪派克工厂智能制造生产线。斐雪派克电器(青岛)有限公司供图 图为中试实验室工程师进行产品测试。武汉中关村硬创空间科技有限公司供图 图为育种工人清理水稻田里的杂草,为育秧做准备。中国种子集团有限公司供图 图为广州酒家参加美食周活动。广州市商务局供图   企业是市场经济的细胞,是创新创业的主体,是整个经济充满生机活力的基础,也是读懂中国经济发展趋势的重要窗口。我们约请记者对5家企业进行了采访,这些企业有大有小,来自新能源、家电、中试平台、种业、餐饮等不同领域。新的一年,面对困难和挑战,企业怎么看?把握机遇、坚定信心,如何加油干?让我们听听企业的声音。   ——编者     一家新能源产业链主企业——   不卷价格卷创新   记者:作为链主企业,如何带动产业链创造更多价值,避免陷入“卷价格”的怪圈?   宁德时代新能源科技股份有限公司董事长曾毓群:近些年,部分供应链企业通过“卷价格”的方式寻求市场占有率。我们认为,锂电和新能源产业链的健康发展,不能靠层层压低价格来实现,而应该创造“高价值”产品,带动企业进一步研发,让整条产业链受益。   作为链主企业,我们通过开放式创新的方式,推动上下游企业技术创新、全产业链发展和价值的提升。为增强供应链韧性和协同性,我们在正负极材料、隔膜、电解液等上游重要环节,与供应商推进新技术研发;也与下游车企展开合作,让整车上的电池更好用,提高产品的迭代速度。   跳出“卷价格”的怪圈,还需要产业链企业共同向外看,开拓市场,做大蛋糕。我们观察到,一些高能耗、高排放行业的绿色低碳转型就用到了与新能源相关的产品。我想,传统产业的再造对产业链提出了新的需求,也提供了全新机遇。   中央经济工作会议提出,“综合整治‘内卷式’竞争”。我们坚信,参与国际竞争,引领全球绿色转型,需要整条供应链协同发力,也需要链主企业通过开放式创新,为产业链创造更多价值。我们将与上下游企业展开合作,让新能源产业链更成熟,涌现出更多面向市场的技术应用。我们还将发力锂电的回收利用,携手产业链上下游企业打造集电池生产、使用、梯次利用、回收资源再生为一体的生态闭环。(记者 刘晓宇)     一家家电产业链上游企业——   用好政策练内功   记者:作为家电产业链上游企业,如何将“两新”政策的机遇化为企业内在的竞争力,实现可持续发展?   斐雪派克电器(青岛)有限公司总经理孙利:“两新”政策提振了家电产品销量,作为家电企业的电机供应商,我们的产品销量随之增加。以广泛应用于高能效洗衣机的一款直驱电机为例,2024年其产销量同比增长14%。“两新”政策在2025年加力扩围,我们有信心继续实现公司的发展,推动技术与产品创新。   我们清楚地认识到,企业发展不能有依赖政策的“等靠要”想法,而是要主动将政策助力内化为企业自身市场竞争力,实现可持续发展。   为此,我们正努力将销量增长带来的收益,转化为企业实实在在的研发实力。在“两新”政策推动下,消费者对高品质家电的需求提升了,我们通过技术研发,着力解决消费者使用家电时的一些痛点问题,比如通过算法对运转中的电机做出精准控制和适时调整,有效降低滚筒洗衣机的振动噪声。   我们也期望国家进一步加强知识产权保护,出台相应细则,辅导我们用好政策,为企业创新保驾护航。   市场与环境是多变的,企业要敢于创新与变化,才能不被淘汰。2025年,我们会继续深挖企业内部潜力,专注于下一代领先技术产品的开发、测试及市场开拓工作,满足和响应市场变化,实现企业的创新发展。(记者 李蕊)     一家中试平台企业——   打通堵点促转化   记者:新兴科技产业研发投入大、验证周期长、投资回收难度大。作为中试平台,如何打通科技与产业之间的创新堵点,提升科技成果转化水平?   武汉中关村硬创空间科技有限公司总经理朱志猛:小微企业自己搭建平台做测试验证,成本太高了。而现在只需支付一定的费用,就能享受到产品的贴片、性能测试、认证检测等集成服务,加快了产品研发进度。湖北武汉创现科技有限公司负责人蔡毅告诉我,得益于我们的帮助,2024年他们在海外推出了软表面清洁机器人,市场反响不错。   一直以来,科技成果转化存在一些难点,比如科技成果供给端和市场需求端不匹配,多学科资源不匹配。   如何发挥平台在创新链、产业链中承上启下的优势?我们是由北京中关村硬创空间集团和武汉高科国有控股集团共同组建的科技服务企业,北京提供科技成果,武汉高科提供当地的供应链支持并进行推广。双方优势互补,为科技企业提供服务和解决方案。我们还开展了高校院所和科技企业的撮合对接,政府也在科技人员培育、平台发展方面给予我们激励。   公司为500余家企业提供了2500多次技术服务,创造服务收入的同时,也带动服务对象创收。今年,我们会继续加强政产学研用的协同,着手设立成果转化中试天使基金,搭建“技术—资本—产业”融合发展平台;还计划进行3期2000多万元的设备投入,围绕低空经济、人形机器人、新能源储能等前沿领域,充分发挥平台专业能力和优势,帮助更多中小企业打通科技成果转化“最后一公里”。(记者 范昊天)     一家种业企业——   揭榜挂帅解难题   记者:产学研结合不够紧密是商业化育种面临的难题,如何克服问题,利用各方支持,推动种业创新?   中国种子集团有限公司水稻测评总监周华:在商业化育种起步阶段,资源、人才、技术集中在科研院所和高校,与企业、市场存在一定距离,阻碍创新。   我们采取揭榜挂帅方式,对种业创新难题进行协同攻关。我们出题目,院校出专家人才,成果和收益两者共享。不久前,第二批“揭榜挂帅”项目立项,我们对结果充满期待。   种业创新不是企业一家唱“独角戏”。集团成立之初,在海南三亚设立了分支机构,政府协调科研用地,给予支持。后来,我们把总部从北京迁入三亚崖州湾科技城。去年初,为鼓励种业创新,海南出台多项措施。好政策助力好种子加速涌现,同年4月,我们举办了早造水稻展示观摩会,一个由我们和研究机构共同研发,具有抗白叶枯病、抗倒伏、产量高等优良性状的水稻品种,受到广泛欢迎。2024年,我们共有138个品种通过国家审定,168个新品种获得授权。   今年是我在三亚南繁的第二十六个年头,看到种业越来越受重视,我越干越有劲!新的一年,在各方支持下,我们将在生物育种、成果转化等方面持续发力,为种业创新作出新贡献。(记者 曹文轩)     一家餐饮企业——   紧贴需求谋转型   记者:餐饮消费新需求不断涌现,老字号如何紧扣市场变化,在竞争中赢得主动?   广州酒家集团股份有限公司副总经理黎钢:面对消费新趋势、新变化,餐饮行业难免面临一些困难和冲击,更好地吸引客流是重中之重。随着生活水平提高,情绪、社交和文化价值成为消费者选择餐厅时的考虑因素。同时,生活节奏加快,消费者对于上菜速度等服务品质有了更高的要求。   我们通过数字化转型,努力提供更好的用餐环境。广州是美食之都,餐饮门店客流如云,我们引入送餐机器人,加快上菜速度。机器人无接触配送,餐食更卫生,消费者更满意。我们还推行数字化电子券,消费者通过手机领取和使用,餐厅的客流量和销售额也实现增长。   我们正与电商平台等外部合作方联动,拓展其他客源群体,引流到线下餐饮门店。   餐饮企业转型也少不了政府的支持。2024年11月,广州市政府财政投入10亿元支持企业数字化转型。我们还积极参与广州精品美食周活动,创新多元化消费场景,提升品牌形象。   将老字号这块“金字招牌”越擦越亮,我们一直在努力。2025年,我们会继续深化数字化转型,根据消费者消费习惯和偏好,提供服务和优惠。我们也计划与各行业品牌跨界联动,为消费者带来更多惊喜和便利。相信随着餐饮企业数字化转型不断深入,会有更多消费者来广州欣赏珠江、海心沙的美丽景致,享受新鲜出炉的广东味道,获得更加高品质的美食体验。(记者 王云娜)   ■留言板   建议加大对科技创新的支持力度,特别是人工智能、大数据等领域的研究和开发。进一步提高智能制造、数字技术在工业生产和管理方面的应用水平,推动传统产业转型升级,积极培育和发展新兴产业。   ——吉林网友     建议完善创新资源向企业集聚机制,构建广泛参与的科技奖励机制。应完善企业主导的产学研融合机制,将高校院所与企业开展产学研合作情况作为考核评价重要内容,强化评价结果运用;研究制定顶尖孵化器建设实施方案,省市协同打造一批顶尖孵化器,有效提升企业育成能力和生态支撑能力。   ——湖南网友     建议加大对科技型中小企业的支持力度,在项目申报等方面向科技型企业倾斜。   ——宁夏网友     (以上留言摘编自人民网《人民建议》,施云娟整理)   本期统筹:张安宇   版式设计:蔡华伟   融媒合作:人民网“领导留言板”
2024年微短剧:要流量更要质量 要情绪更要情怀
  资料图片   资料图片   资料图片   自2020年诞生伊始,微短剧的发展就仿佛被按下了倍速键。尤其在刚刚过去的2024年,微短剧的用户规模已达5.76亿人,占整体网民的52.4%,已超越网络外卖、网络文学、网约车和网络音频等多类基础数字服务。2024年我国微短剧市场规模达504.4亿元,同比增长34.90%。在高速发展的同时,微短剧也面临内容同质化、盗版泛滥、投流成本持续走高等问题。特别是免费平台迅速发展,打破了微短剧付费充值的营利模式。如何进一步提升精品意识,探索以更多好内容获得大流量、正能量,成为这一年行业发展的主基调。   产业规模不断扩容   监管与治理引导行业健康发展   2024年,看微短剧的人比点外卖的人还多,微短剧让人越看越上头。凭借着强情节、高反转、快节奏等特点,微短剧作品轻巧“拿捏”住了大批受众。从付费购剧到小程序充值,微短剧业收割了流量,也扩大了产业规模。   这一年,传统视频网站进行战略调整,从专注于横屏微短剧向创作播出更多竖屏微短剧转向。比如,爱奇艺与红果短剧达成合作,启动IP联合开发、联合出品、成品内容授权等;芒果超媒也通过“大芒计划”布局竖屏短剧赛道,并迅速推进多部竖屏短剧开机。互联网企业全面布局微短剧市场。美团、京东、拼多多等电商平台开始采购竖屏短剧,助力制作方二轮发行。华为推出独立的短剧App,试水短剧付费模式。   随着产业规模的不断扩容,“日进斗金”的微短剧行业暴露出一系列问题。比如,投流成本成了决定微短剧能否获得高回报率的重要指标。这就导致行业利益分配严重不均,大多数资金流入投流公司及其背后的网络平台,留给创作的成本相对较少,导致作品质量参差不齐。在逐利投机的心态影响下,部分微短剧仍将制造爽感当成制胜法宝,甜宠、霸总、穿越等题材扎堆,导致题材同质化、内容低俗化、创作低智化。   面对这种乱象,国家广电总局多措并举,加强微短剧的监管治理,引导并推动微短剧行业健康发展。2024年6月,《国家广播电视总局办公厅关于进一步统筹发展和安全促进网络微短剧行业健康繁荣发展的通知》正式实施,明确微短剧施行分类分层审核,未经审核且备案的微短剧不得上网传播,进一步规范了微短剧的传播秩序。10月,《关于中老年题材微短剧的管理提示》发布;11月,《关于“霸道总裁”微短剧的管理提示》发布;12月,《关于加强微短剧片名审核的管理提示》发布;年底,某免费微短剧平台因内容违规被管理部门约谈并要求整改。在一系列政策措施的调控引导下,行业加快了从次品到产品再到作品乃至精品、从“表达情绪”到“表达情感”再到“表达情怀”的迭代升级。很多创作者在耕耘现实题材的同时,还将创作视野拓展到科幻、历史、文化,甚至红色革命主题等多个领域,并在重点领域推出一批现象级作品。很多优秀作品不仅丰富了微短剧市场,还登上电视大屏,满足了用户多样化、差异化的观看需求。据中国视听大数据(CVB)统计,截至2024年11月,已有30余部微短剧在全国省级卫视播出,收视规模超5亿户次,千万级别观众规模剧片占比48.3%。   微短剧赋能千行百业   打开探索精品内容的思路   在从无序发展向理性回归的转变过程中,精品化已成微短剧的行业共识。而推进“微短剧+”赋能千行百业,为探索精品化指出了一条道路。   2024年初,国家广播电视总局发布开展“跟着微短剧去旅行”创作计划通知,以“文旅+微短剧”的形式,助推一批取景地跟随微短剧的热播“出圈”,微短剧由此走上文旅赛道。这一年,不少城市和乡村探索以微短剧撬动文旅宣传,一批作品在引领微短剧精品创作和赋能拍摄地文旅产业发展方面的实践初见成效。《爱在炊烟袅袅时》围绕一道道传统美食展开故事,呈现海盐古法制作等传统手工艺的同时,展现了取景地多个特色场景。该剧的热播不仅提升了浙江海盐的知名度和美誉度,更吸引了各地游客。《那个重逢的夜晚》场景覆盖福建平潭多个特色景点,展示了海岛风土人情和美丽自然风光。该剧相关短视频在抖音平台播放量超6亿,很多网友表示“看完剧专门去了平潭”。还有《飞扬的青春》《恋恋茶园》《有种味道叫清溪》《一梦枕星河》等,这些微短剧作品结合各地的特色文旅资源,用创意故事展现地方独特文化底蕴。随着创作计划不断推进,不少地方“借剧出圈”,各地风土人情也为微短剧创作提供灵感素材,增加微短剧的烟火气和文化厚重感,文旅携手微短剧共赢的局面初现。   由文旅创作的思路延展开来,2024年10月,在国家广电总局网络视听节目管理司指导下,包括抖音、快手等18家单位联合发起“微短剧里看品牌”创作计划;11月2日,新华网与某公司联合发布品牌短剧计划,核心也是为国内企业量身打造品牌短剧,赋能品牌营销与文化出海。2025年国家广电总局将深入组织实施“跟着微短剧去旅行”创作计划,继续推进“跟着微短剧来学法”“微短剧里看品牌”创作计划,启动“跟着微短剧学经典”“跟着微短剧来科普”“微短剧里看非遗”等创作计划,拟在细分领域共推出300部左右具有引领作用和创新价值的重点微短剧。   海外市场传播能力增强 需要探索主流内容的国际表达   一边是与日俱增的中国微短剧市场空间,另一边则是微短剧公司纷纷出海,谋求更大的舞台,让中国微短剧走向世界。2024年,中国微短剧应用在海外的下载量和内购收入延续了2023年的高速增长趋势。微短剧海外市场规模不断扩大,变现能力也进一步增强。据不完全统计,截至2024年12月,有200余款海外微短剧App上线海外微短剧市场,2024全年预估收入4亿美元左右。出海为微短剧赛道找到新的发力点。   这些微短剧应用平台并不局限于某一国别或文化背景,而是从一开始就将自己定义为全球性的身份。从美国、日本、韩国,到欧洲、东南亚、中东、拉美,中国微短剧在海外市场积极适应不同用户的需求。狼人、吸血鬼等超自然题材在欧美国家有较高的接受度,家庭伦理题材在东南亚地区更受欢迎,战争类内容吸引着巴西等南美地区受众的关注。中国微短剧让很多外国人欲罢不能。   一些创作团队在了解到海外观众的观赏喜好后,回到国内进行微短剧创作,或将国内热门微短剧直接译制成多种语言,或请外国演员出演,再把产品输送到海外市场,降低成本。为了进一步保证海外市场的可持续发展,不少微短剧出海机构开始探索拓展产业链条。例如九州文化与海外微短剧团队合作,实施“乘风计划”,通过多种合作模式加码优质内容生产。枫叶互动构建微短剧、互动故事游戏、网络阅读的产品矩阵和创作者生态,能够依托不同类型作品在市场的多轮验证,持续生产出符合当地用户喜好的本土原创微短剧。还有很多公司通过AI技术提升生产力,进行翻译、配音、后期剪辑,以个性化定制、多语言适配满足海外消费群体多样的观赏需求。   这一年,微短剧出海在商业探索上的成功固然可喜,但套路化、模式化的内容生产难以保证平台的长期稳定发展,要想在文化领域产生持续良性的传播效应还“道阻且长”。很多出海的平台和创作团队意识到,注入国际视角,尊重文化差异的同时唤醒受众对题材的共情,才能达到文化交流的目的。我们不能只顾眼前的经济利益,也要探索主流内容的国际表达,助推创作向更符合国际用户审美需求和承载更高文化价值内容的方向发展。   相信在各界努力之下,微短剧将进一步实现艺术价值与社会价值的统一,为观众带来更加丰富的视听体验,不断推动网络视听艺术向更高质量、更广阔领域发展。   (作者:牛梦笛)
亚冬会冰壶赛况:混双开赛 中国队首战告捷
  新华社哈尔滨2月4日电(记者杨思琪、戴锦镕)第九届亚冬会冰壶比赛4日在哈尔滨平房区冰壶馆开赛,率先进行的是本届赛事的新设项目混合双人赛,中国队的韩雨/王智宇在循环赛B组首轮发挥稳健,拿下首胜。 2月4日,中国队选手韩雨(左)与队友王智宇在比赛中交流。新华社记者 江汉 摄   本场比赛是中国代表团在本届亚冬会上的第一次亮相。面对哈萨克斯坦组合,韩雨/王智宇在前两局先手的情况下冷静应战,以3:0领先。第四局,他们又抓住对手的失误将比分扩大到6:1。   五局过后,中国队取得10:1的压倒性优势。第六局韩雨投壶失误,对手趁机把分差缩小到5分。随后中国队稳扎稳打,没有再给对手可乘之机,七局过后以11:5赢得“开门红”。   “作为中国代表团(在本届亚冬会)的首秀,我们是有一些压力,尤其是第一次搭档参加这样的大赛。今天能在家门口拿下这场比赛,我们很激动也很兴奋,这为后面的比赛奠定了信心。”韩雨赛后说。 2月4日,中国队选手韩雨在比赛中掷壶。新华社记者 江汉 摄   泰国队当天首次亮相亚冬会冰壶赛场,上午的首轮比赛他们以2:12负于日本队,但在下午的第二轮较量中以12:3战胜科威特队。泰国队选手查娜提普·松克汉姆表示,能来参加比赛就非常开心,希望能走得更远。   日本队在战胜泰国队后,又以19:0的大比分战胜蒙古国队,取得两连胜。中国香港队以9:8战胜中国台北队。   5日,韩雨/王智宇将迎来一天双赛,先后迎战来自吉尔吉斯斯坦和菲律宾的组合。中国香港队则将遇到劲敌日本队。
彭博:下个颠覆人工智能的“DeepSeek”还会来自中国,会是谁?
凤凰网科技讯 2月6日,彭博社发文称,下一个颠覆全球人工智能行业的“DeepSeek”可能仍将来自中国。 彭博社表示,中国已经孕育出几家颇具潜力的人工智能初创企业和项目,而其领先的互联网企业多年来一直在投资并开发支持这些新兴企业的基础设施。中国新兴人工智能公司的发展前景十分乐观。 以下是彭博社盘点的中国“最值得关注”的几家人工智能公司和它们的产品: 杨植麟 1.月之暗面 人工智能模型:Kimi k1.5 总部:北京 成立时间:2023 年 关键领导人:杨植麟 投资方:阿里巴巴、腾讯、高榕资本、红杉资本 最新估值:33亿美元 月之暗面由清华大学助理教授杨植麟创立,杨植麟此前曾在Meta和谷歌参与人工智能项目。月之暗面的最新产品利用强化学习来加速和扩大训练过程。它与DeepSeek的R1推理模型在同一天发布,工作原理类似。推理模型采用思维链方法来寻找并完善对查询的答案。Kimi k1.5旨在给出更简洁的回复,并支持多达200万个汉字的上下文,这些上下文可以包含从先前对话到用户意图和情境等所有内容。 2.智谱华章 人工智能模型:GLM - 4、Codegeex 总部:北京 成立时间:2019 年 关键领导人:张鹏、唐杰 投资方:阿里巴巴、腾讯、美团、红杉资本 最新估值:28亿美元 智谱华章发布了一系列应用程序和工具,包括一种可以在手机或浏览器上模拟用户行为的自主智能体。其语音人工智能模型能够模拟人类的语气、情感以及诸如填充词、停顿和偶尔的喘息等不完美之处。在拜登政府任期的最后几天,该公司被美国商务部列入黑名单,进一步限制了其获取美国人工智能芯片的渠道。精英学府清华大学将智谱华章的成功归功于其校友唐杰,唐杰的团队引领了该公司的模型开发。唐杰在杨植麟于清华大学求学时还曾指导过他。 通义千问大模型 3.阿里巴巴 人工智能模型:通义千问2.5 Max 总部:杭州 成立时间:1999年 关键领导人:蔡崇信、吴泳铭 市值:2400亿美元 在DeepSeek在全球引起轰动几天后,中国电子商务和云计算领域的领军企业阿里巴巴推出了其模型的最新版本,并宣称在基准测试中取得了更好的成绩。阿里巴巴与腾讯一样,在这份榜单上的大多数其他竞争对手中都持有股份,尽管它们之间也存在竞争关系。在首席执行官吴泳铭的领导下,该公司正重新聚焦于自身核心优势,云计算和兴起的人工智能浪潮是其中的关键组成部分。 豆包大模型 4.字节跳动 人工智能模型:豆包1.5 Pro 总部:北京 成立时间:2012年 关键领导人:梁汝波 投资方:贝莱德、泛大西洋投资集团、尚宾资本 最新估值:3000亿美元 中国最受欢迎的消费级聊天机器人来自抖音的母公司字节跳动。据字节跳动自己估计,其在人工智能领域还有些追赶的空间,并已将人工智能列为首要任务。豆包采用专家混合(MoE)机器学习方法构建,这种方法在中国的几种人工智能模型中很常见。豆包因其诙谐、拟人化的对话以及用户友好的界面而在中国受到欢迎。其会议总结和图像生成功能也吸引了年轻用户。 5.百川智能 人工智能模型:Baichuan4 - Turbo 总部:北京 成立时间:2023年 关键领导人:王小川 投资方:阿里巴巴、腾讯、小米、中金公司 最新估值:27亿美元 百川智能的最新模型采用了一种称为深度思考的技术,这是一种复杂的推理和解决问题的方法,模仿人类解决问题的方式。它适用于文本、语言和视觉领域。该公司还提供一种更具针对性的循证医学模式,旨在为医疗专业人员和学者检索医疗研究和数据。创始人王小川在创立百川智能之前,将其搜索引擎搜狗出售给了腾讯。 6.Minimax 人工智能模型:Minimax - 01 总部:上海 成立时间:2021年 关键领导人:严俊杰 投资方:阿里巴巴、腾讯、红杉资本 最新估值:31亿美元 Minimax使用其所谓的闪电注意力机制,有效地将极长的数据序列分解为更小的、易于管理的数据块。该模型旨在优先处理长篇文本中最重要的部分,而不会陷入困境。创始人严俊杰在中国科学院自动化研究所获得博士学位,之后在清华大学继续深造。在创立Minimax之前,他曾是商汤科技的副总裁。 李开复 7.零一万物 人工智能模型:Yi 总部:北京 成立时间:2023年 关键领导人:李开复 投资方:阿里巴巴、创新工场 最新估值:12亿美元 与DeepSeek一样,零一万物也是开源的。去年 10 月,零一万物发布了Yi-Lightning专家混合模型,在一个备受关注的基准测试中,其排名仅次于OpenAI和谷歌的闭源模型。这家初创公司声称,其训练人工智能模型的成本比行业领先者低得多,并且在将其服务商业化方面进展最快,正在为各种行业应用构建解决方案。上月初,它宣布与阿里巴巴开展联合开发项目。 8.阶跃星辰 人工智能模型:Step—2 总部:上海 成立时间:2023年 关键领导人:姜大昕 投资方:复星锐正资本、腾讯、启明创投 阶跃星辰的最新产品是一个拥有万亿参数的大语言模型,同样依赖于专家混合(MoE)技术。专家混合是一种将模型划分为多个子集的方法,每个子集在处理特定类型的数据或任务方面具有专长,通过仅为每个任务激活所需的专家子网来提高效率。首席执行官姜大昕此前曾领导微软公司在亚洲的研究工作。一家由上海政府支持的基金是该公司的首批投资方之一。(作者/陈俊熹) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
“非常棒”,又有两家科技巨头点赞DeepSeek
【环球时报驻澳大利亚特约记者 达乔 环球时报特约记者 吴鸣】据日本《日经亚洲新闻》2月5日报道,谷歌首席执行官桑达尔·皮查伊和美国超威半导体公司(AMD)首席执行官苏姿丰(Lisa Su)日前纷纷称赞中国人工智能(AI)企业深度求索(DeepSeek)。 报道称,DeepSeek已成为本季度各大科技公司财报电话会议上的常见话题。皮查伊在周二的财报电话会议上谈及DeepSeek时表示,该团队做了“非常、非常棒的工作”。他表示,随着推理成本持续下降,AI将能够应用于更多用途,这对于美国科技巨头来说是“机会空间”。报道称,AMD首席执行官也在周二的财报电话会议上称赞DeepSeek。“我们认为其在模型上的创新及其算法有利于AI的应用。”苏姿丰表示,有新方法用更少的基础设施实现(AI的)训练和推理能力,其实是一件“好事”,因为这让人们能够继续部署AI资源,并拓展AI的应用空间,让其为更多人所用。 两人是继苹果、微软和Meta等公司高管之后,最新对DeepSeek所取得成就表示赞赏的科技企业高管。然而,一些国家对该应用程序保持谨慎。据韩联社5日报道,因处理的信息涉及机密较多,韩国外交部和产业通商资源部自行决定限制通过支持外网连接的电脑登录DeepSeek平台。另据澳大利亚广播公司等媒体报道,澳政府4日宣布禁止在政府机构的电子设备上使用DeepSeek,声称其“对澳政府技术(构成)不可接受的风险”。在宣布这一禁令时,澳内政部长伯克强调,这一做法“与(特定)国家无关”,“重点是关注澳政府及其资产面临的风险”。 中国外交部发言人此前在回应外界质疑中国应用软件数据安全问题时曾表示,中国政府高度重视并依法保护数据隐私与安全,从来没有也不会要求企业或个人以违反当地法律的方式为中国政府采集或提供位于外国境内的数据、信息和情报。有关方面应当尊重市场经济和公平竞争原则,为中国企业提供公平、透明、非歧视的营商环境。
OpenAI认输,中国用“穷人的原子弹”终结美国科技霸权
OpenAI认输,中国用"穷人的原子弹"终结美国科技霸权! DeepSeek对美国冲击为什么这么大?在把美国AI产业链公司市值干掉一万多亿美元后,如今美国硅谷彻底服了,美国各大品牌纷纷承认Dee­p­S­e­ek的不凡优越性。 第一,对美国AI市场地位的颠覆性挑战。 不仅仅美国AI大公司市值蒸发过万亿美元,上周英伟达一家过500亿,全球500名富豪财富蒸发1080亿美元。其高性价比模型、训练成本仅为美国同类产品的5%-10%,打破了美国大模型的垄断格局,使得依赖高投入的硅谷企业面临盈利模式崩塌的风险。之前投入几千亿美元的成本有点变为沉没成本,难以回收了。 而比训练成本更可怕的是DeepSeek推理成本优势,也就是我们日常应用的运营成本优势。DeepSeek的推理调用成本仅为OpenAI的三十分之一,约2.2美元/百万语料 vs. 60美元,大幅降低了大模型的应用门槛,推动AI技术进入“全球普及”。这不仅威胁美国企业的市场份额,还可能导致其长期依赖的“算力堆砌”模式被淘汰。DeepSeek下载过亿的时间仅为7天,没有任何广告推广情况下,这是一个不可思议的奇迹。 第二,全球AI控制权正在快速易手,OpenAI老板奥特曼承认没有开源是错误的。 DeepSeek选择开源模式,允许全球开发者参与优化和迭代,形成开放生态。相比之下,OpenAI的闭源策略被视为“历史错误”,逐渐被边缘化。一旦DeepSeek成为AI领域的通用标准,全球技术路径将由中国主导,美国将失去对产业链的控制权。 所以美国人在经过抹黑、安全调查,然后已经开启各种禁止使用,比如美国政府,美国军队,美国国会和德克萨斯州都禁止使用。 而极端的美国政客、美国参议员Josh Hawley提交了一个名为《将美国AI能力与中国脱钩法案》,这个法案的核心目标就是促使中美两国AI完全脱钩,禁止美国公民和公司从中国进口或使用任何与中国有关的AI技术和知识产权。要求,对于下载和使用中国deepseek的美国公民和企业,最高将面临20年的监禁,另外个人最高面临100万美元的罚款,企业最高面临1亿美元的罚款。 因为美国大公司都在切换到DeepSeek,这是他们害怕丢失AI主导权,而DeepSeek开源免费,低成本,用户都喜欢。 乃至OpenAI也实际上认输,急忙套壳DeepSeek上线,结果被用户发现大量思考用中文,代码相同90%以上。 第三,中国AI崛起,带动其他国家使用,美国的AI可能被旁路。 美国将DeepSeek的崛起类比1957年苏联发射首颗人造卫星的冲击,认为这是对其科技霸权的根本威胁。美国参议院和智库频繁提及“斯普特尼克时刻”,呼吁加大AI投资并强化对华技术封锁,但现有制裁措施,如芯片出口限制被指“过时且无效”。 有趣的是,由于美国的限制,才是导致DeepSeek千方百计搞低算力要求的路子,还走通了。而且还千方百计搞去英伟达的路子,AMD和华为昇腾也走通了,这是美国人搬起石头砸自己的脚。 在印度和英国看到DeepSeek兴高采烈后,韩国也跟上。韩国代理总统崔相穆周三表示,DeepSeek的最新人工智能模型有可能重塑产业格局,并评价说,“这是一个新的冲击”。韩国政府将尽快成立一个“国家人工智能委员会”,以使韩国成为全球三大人工智能领先国家之一。 网友开玩笑说“Deepseek开源后,欧盟:AI我又行了,印度:AI我又行了,韩国:AI我很快成为世界第三”,虽然玩笑归玩笑,但是全世界聚焦到DeepSeek,韩国民众上月第四周使用最多的生成型AI应用程序为ChatGPT,用户数量为493万人。中国的DeepSeek短短一周就排名第二,在韩用户多达121万人。所以美国人狗急跳墙,搞各种网络攻击,就是不允许其他国家用。,差不多是淮海战役胜利的里程表,从量变到质变的标志。 美国“痛感”源于其技术霸权逻辑的动摇,高成本垄断模式被低成本开源生态取代,各种绞杀和抑制中国AI技术的伎俩被技术创新突破,全球标准制定权从单极转向多元。这种结构性冲击迫使美国重新审视其战略,但短期内难以找到有效应对方案
终结谷歌搜索!OpenAI放大招:免费开放ChatGPT搜索,无需注册
今天凌晨3点,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。 与谷歌那种传统收录模式的搜索引擎相比,ChatGPT搜索可以更快抓取网络信息,能实现分钟级别的解析,这对于股票、体育、财经等,需要第一时间快速获取新闻内容的行业帮助非常大。 同时借助大模型的能力,可以更好地解读用户的搜索想法,并且可以提供搜索结果的源地址。 对此,有网友表示,谷歌时代结束了;谷歌搜索要大幅度下降了。 ChatGPT搜索功能展示 使用界面很简单,打开下面的搜索按钮就行。旁边那个推理是否显示推理链,就是大模型是否展示整个推理过程。 最右面的是支持语音模式,可以直接用语音输入。 第一个搜索问题,找神奇四侠的预告片。 ChatGPT搜索已经把信息显示出来了,值得一提的是还把预告片的播放视频给端上来了,都不用出搜索框直接观看。 如果你想查看整个新闻的源地址,只需要点击搜索结果的最下方“源”,就会在搜索框的右面显示所有关于这个信息的最新源地址。 第二个问题,北美时间2月5日,美国纽约发生了哪些大事情? 已经汇总了中文网站的主要信息。 这里需要注意的是,你用中文提问,ChatGPT回复的内容主要是从中文网站搜索的,当把同样的问题改成英文, 搜索结果就会变成英文版,并且来源也全部是国外网站。 整体上,ChatGPT搜索功能很强。 据报道,OpenAI发文称,现已向包括英国、欧盟、挪威、冰岛、列支敦士登和瑞士在内的所有专业用户全面推出Deep Research功能。 与此同时,OpenAI加大研发布局人形机器人。 上周五(1月31日),OpenAI向美国专利商标局(USPTO)提交了一份涉及人形机器人的商标申请,文中提到了“用户可编程的人形机器人”和“具有通信和学习功能的人形机器人,用于协助和娱乐人类”。 虽然申请知识产权并不能保证未来能有相应的产品,但TechCrunch报道称,不到一周的时间里先后曝出OpenAI的专利申请以及OpenAI与Figure AI终止合作的新闻,这让外界很难忽视。 而且,去年11月,OpenAI便开始重建曾在2020年解散的机器人团队,聘请Meta前硬件负责人Caitlin Kalinowski负责机器人和消费级硬件项目。Kalinowski曾主导了Meta原型AR眼镜Orion的开发,他此前表示,自己研究重点将是“通过机器人和硬件合作,将AI引入物理世界”。 根据招聘清单和The Information的报道,OpenAI当时就已在测试人形机器人,其由定制传感器和AI驱动,可以在现实环境中以类似人类的智能操作。 过去几年,OpenAI在人形机器人领域的押注明显增大。除了此前与Figure AI的合作外,OpenAI还是挪威机器人初创公司1X Technologies的主要投资者。1X Technologies专注于研发适用于家庭场景的机器人。 对人形机器人的兴趣会让OpenAI与其曾经投资过的初创公司形成直接的竞争关系,比如Figure AI和1X Technologies。而这也正是OpenAI独特的商业模式:与重要客户和合作伙伴既竞争又合作。 每日经济新闻综合公开消息 免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。 每日经济新闻
谷歌Gemini 2.0 Flash系列AI模型登场,编程和推理性能迈上新台阶
2 月 6 日消息,谷歌公司昨日(2 月 5 日)发布博文,邀请所有 Gemini 应用用户,访问最新 Gemini 2.0 Flash 应用模型,并放开 2.0 Flash Thinking 推理实验模型。 2.0 Flash:全新更新,全面开放 2.0 Flash 模型最初于 2024 年 I/O 大会上亮相,凭借其低延迟和高性能,迅速成为开发者社区中的热门选择。该模型适用于大规模、高频率的任务,能够处理多达 100 万 tokens 的上下文窗口,展现出强大的多模态推理能力。 Gemini 2.0 Flash 模型可以和 YouTube,Google Search 和 Google Maps 在内的应用程序进行交互,在多个应用场景下帮助用户发掘和拓展知识。 Gemini 2.0 Flash Thinking 模型 Gemini 2.0 Flash Thinking 模型基于 2.0 Flash 的速度和性能,这一模型经过训练,能够将提示分解为一系列步骤,从而增强其推理能力并提供更优质的响应。 2.0 Flash Thinking Experimental 模型展示了其思考过程,用户可以看到其为何以某种方式回应、其假设是什么,并追踪模型的推理逻辑。这种透明性使用户能更深入理解模型的决策过程。 Gemini 还推出了与 YouTube、Search 和 Google Maps 等应用互动的 2.0 Flash Thinking 版本。这些连接的应用已使 Gemini 成为独特的 AI 助手,未来将探索如何将新的推理能力与用户应用结合,帮助用户完成更多任务。 2.0 Pro 实验版:最佳编程性能与复杂提示词处理 谷歌还推出了 Gemini 2.0 Pro 实验版本,官方声称该模型擅长编程,且能回答复杂提示。该模型拥有 200 万 tokens 的上下文窗口,能够全面分析和理解海量信息,并支持调用 Google 搜索和代码执行等工具。 开发者现可在 Google AI Studio 和 Vertex AI 中体验这一实验版模型,Gemini 高级用户也可在桌面和移动端访问。IT之家附上相关性能对比如下: 2.0 Flash-Lite:最具成本效益的模型 Google AI Studio 还推出了 Gemini 2.0 Flash-Lite 模型,官方声称其是迄今为止最具成本效益的模型。旨在保持低成本和快速响应的同时,提供比 1.5 Flash 更高的质量。 该模型同样支持 100 万 tokens 的上下文窗口和多模态输入,例如,它可以在 Google AI Studio 的付费订阅中为 4 万张独特照片生成一行相关描述,成本低于 1 美元。
能给600万人供电的核电站,是怎么保证安全的?
这是我国研发设计的具有完全自主知识产权的第三代核电技术的华龙一号核电站。 它采用了我国拥有自主知识产权的第三代压水堆核电站技术,每个机组占地都超过了 3 万平方米,有 4.2 个标准足球场大,二十层楼高。 通常一个核电站有六到八个机组,一天大概可以发出 2700 万到 2800 万度电, 对于核电,相信差友们多多少少都有了解。但谈到 “ 核 ”,总不免有人想到安全问题。 这么多核燃料堆在这个大家伙里真的安全吗?我们又是如何保障核电站安全的呢? 为了弄清楚这些问题,我们来到了位于福建云霄的漳州核电,来实地解答一下我们心中的疑问。 核电站是怎么运行的 核反应堆的原理 要弄清核电站如何保证安全,我们首先要知道,核电站是如何发电的。 众所周知,虽然带 “ 核 ” 看起来比较高大上,但实际上,核电站本质上还是换了种燃料烧开水。 在华龙一号中,一共有三条回路相互配合,烧两次 “ 开水 ”。 首先是进行核反应的一回路,也是核电站第一次 “ 烧水 ” 的地方。 在这里,随着燃料棒插入反应堆,铀235 在吸收中子后发生裂变一分为二,同时放出大量的热量,加热与反应堆直接接触的硼酸水。 不过,这次水并不会 “ 烧开 ”。 我们知道,压力越大,水的沸点也会越高。 而核反应堆所在的压力容器,是一个压力能够达到 150 个大气压的 “ 超级高压锅 ”。在这个压力下,即使加热到 320 摄氏度,水也不会沸腾。 在这条回路上,连接着一个叫做 “ 蒸汽发生器 ” 的密封容器。 在这里,被密封在 U 形管中的一回路水,起到了类似烧水壶中热管的作用,将热量传递给二回路,进行第二次 “ 烧水 ”。 这次,在常压环境下,二回路的水会被正常 “ 烧开 ”,形成饱和水蒸气,驱动汽轮机发电。 最后,三回路会抽出海水,在冷凝器中将二回路中经过汽轮机的蒸汽重新冷凝成水继续循环。 这种结构将 “ 有核 ” 与 “ 无核 ” 的回路完全隔离开来,将核电厂分成了进行核反应 “ 核岛 ” 与不接触核材料的 “ 常规岛 ”。 大家现在看到的,就是核岛中的核心组件,反应堆,在它的内部,装载着给核电站的能源心脏,由 177 组 “ 燃料组件 ” 按照核燃料浓度编组排布而成的燃料堆芯。 在每组燃料组件中,都有一捆这样的锆合金管燃料棒, 他们当中包裹的,是一节节被加工成短圆柱体,长得像黑色粉笔的二氧化铀燃料芯快。 除了燃料棒,还有一组叫做控制棒的组件。 在反应堆运行时,可以根据操作人员的指令插入或者抽出核反应堆。 其中比较特殊的,是含有铍9 和锎252 的 “ 启动 ” 控制棒。当它们被插入核燃料后,会向四面八方释放中子。 这些中子与核燃料结合后,铀原子会变得不稳定,并分裂成两个较小的原子核,放出大量能量。 这时候,反应堆会发出幽幽的蓝光( 切伦科夫辐射 ),并生成更多的中子,引发下一级的核裂变,然后将这种反应一级一级的传递下去。 也就是我们经常听到的 “ 链式反应 ”。 但核电站的 “ 链式反应 ”,其实是一条安全的 “ 单链 ”。 在大多数情况下,铀235 发生裂变时会释放 2 ~ 3 个中子。如果这些中子全部引发次级核裂变,那么核裂变的次数将会以几何级数的方式不断增加,形成一传十,十传百,核反应会越来越剧烈的 “ 超临界状态 ”。 如果在某一级,中子全部逸散,没有中子进入下一级,则会进入核反应逐渐停止的 “ 负临界状态 ”,让核电站供电不稳定。 所以,为了稳定地转化电力,核电反应堆中的铀燃料浓度就不能太高,才能方便控制。 通过插入或者抽出控制棒,就能调控反应堆的中子浓度,让核反应始终处于一个铀235 核的裂变恰好引发另一个铀235 核的裂变的 “ 临界状态 ”。 所以,在正常的运转状态下,核电站中进行的核反应始终的安全的。 核电站结构上如何防护 但是,作为 “ 国之重器 ”,在核电站的修建过程中,不能只考虑正常的运行状态,还要考虑突发情况下的应对措施。 而包裹着核反应堆和一回路水的核岛,则是极限状况下绝对的布防重点。 第一、二道屏障( 燃料棒 ) 为了保护极限情况下核岛的完整性,华龙一号在从燃料到厂房的各个环节设置了的四道安全屏障。 前两道屏障就是我们前面提到过长得像黑色粉笔的核燃料芯块和包裹它的金属包壳管。 核裂变产生的放射性物质中,98% 以上都会滞留在陶瓷芯块中,不会被释放出来。 而陶瓷芯块则被被压紧 “ 封印 ” 在两端密封焊接的锆合金管内。 这种材料能够承受 1200℃ 的高温,并且能够吸收中子,防止放射性物质进入一回路的水中。 压力容器 在反应堆的外围,则是第三道屏障 —— 压力容器。 这是一个壁厚高达 20cm,能够耐高温、高压和强辐射的 “ 铁罐子 ”,牢牢包裹住了整个核反应堆。 即使燃料棒发生破损,它也能够阻止反应堆的辐射泄漏到核岛的厂房中,把异常辐射控制在反应堆内。 安全壳 在压力容器外,华龙一号还有双层混凝土安全壳作为最后,也是最重要的一道屏障。 也就是大家现在看到的这个巨大的半球形水泥盖子。 华龙一号的安全壳分成两层,外壁厚 1.5 米,内壁 1.3 米,内壳的表面还加有六毫米厚的钢材。 现场的工作人员告诉我们,就连两层安全壳之间在模型上看上去很窄的缝,里面都能站个人。 安全壳的建设过程中,所有材料都遵循最高的强度要求,采用了标号最高的 C60 混凝土四级钢筋。可能有差友对这些标号没什么概念。正好,在差评君去华龙一号参观的那天,还去探访了一下工地。 核岛附近的施工现场,差评君也是真真切切的感受了一把跟手腕差不多粗的钢筋。 由于我们所处的是核岛相对比较外围的设施,这里的钢筋用的还只是三级,真正架在安全壳上的钢筋,比我们看到的还要粗上不少。 根据统计,单单在在华龙一号机组的建设过程中,就使用了 27.28 万方混凝土和 9.21 万吨钢筋,差不多够盖两个鸟巢。 不过,对于核电站来说,在极端情况下 “ 坚固 ” 还远远不够。 核岛的安全结构如何保证这种危机时刻的安全: 为了保证在对反应堆的控制失效,乃至遭遇地震、海啸等极端情况,核电站本身的供水供电受到影响的情况下的安全。 华龙一号还配备了一四套冷却反应堆的安全系统作为核电站的 “ 应急预案 ”。 能动 + 非能动的应急堆芯冷却 能动 + 非能动的二次侧余热排出 能动 + 非能动的安全壳热量导出 能动 + 非能动的堆腔注水冷却 不断电的时候 首先,在反应堆压力容器和蒸汽发生器上,都有一条紧急情况下备用的注水管道。在安全壳的顶部,还设有喷淋装置。 一旦发现反应堆冷却不足或者蒸汽发生器出现管道破裂失水,工作人员就能激活这套应急系统,从放置在核岛底部的换料水箱中抽水并注入到堆芯和蒸汽发生器所在的回路中,并启动喷淋装置给核岛降温。 但是,不管是紧急注水还是喷淋,也还是需要控制系统的驱动。 断电的时候 所以,针对可能停水停电的极端情况,华龙一号还给这个需要电力的 “ 能动 ” 备份方案,设计了一套可以完全脱离电力运行的 “ 非能动 ” 方案,作为 “ 备份的备份 ”。 在一回路、蒸汽发生器上,各有一个悬在高处的水箱,当检测到反应堆过热时熔断阀门自动启动。在重力的作用下,将冷却水灌入反应堆和蒸汽发生器中。 保证在工厂全厂完全断电的情况下,也能核岛也能完成被动散热。 并且,混凝土外壳的 “ 穹顶 ” 外面这一圈凸出来的 “ 帽子 ” 里,也有一个存满了冷却水的巨大环形水箱。 通过热管,水箱链接着安全壳内的换热器。当反应堆过热时,内部的温度会加热换热器,把安全壳 “ 帽子 ” 里的水烧开,通过水蒸气把热量带出去。 冷却失效,堆芯融毁 即使这些措施全部失效,堆芯真的发生了熔毁,也同样有能动与非能动两套方案进行堆腔注水,封死压力容器的底部,将融化的放射性物质控制在核岛内。 全部失效,安全壳破损 最后的最后,即使真的发生了最坏的情况,堆芯发生爆炸,安全壳两层之间还采取的负压设计也能保证环形区域的压力低于大气压。即使发生破损,也是吸入外部空气,不会将核岛内的空气往外排,最大程度的降低辐射物质的外溢。 华龙一号的人控安全保障 人控工程 ( 为了防止事故发生 ) 当然,以上我们聊到的,都是装置本身的防护,但再完美的装置,终究也是要靠人来运行的。 操作核电站,其实是一项既庞杂,又需要时刻准确与专注的工作。 三组人控备份 我们来到一个模拟的主控室,这里跟真实的主控室会一模一样,所有的学员要在这里接受培训。一般来说,这里正式运行的时候会有三位工作人员在这里工作。 分别是在这个位置的值长,他负责监督整个核电站的运行。 第二位是 ROA,他负责整个有核的部分的控制。第三位是 ROB,他负责无核的部分,也就是汽轮机那个部分的运行。 这两套系统有很大的安全冗余,比如说,ROA 或者 ROB 宕掉的时候、机器坏掉了,还有一片电脑 —— ROC。它可以来做 ROA 和 ROB 一模一样的操作。即便 ROC 也宕掉了,还有一片纯机械的控制台,可以做到跟上边说的一模一样的事情。 “ 黄金人 ” 的培养 华龙一号的工作人员向我们介绍,从一个毕业生到成为一个能上岗的核电站操纵员,至少要经过上百次大大小小的考试。 在这个过程中,参与培训的 “ 预备役 ” 操作员要学习 14 门理论课程培训,还得取得辐射防护、工业安全、消防、急救和应急各类授权。 还要来我们这个模拟机组进行实战考试,模拟机组突发应急事件。 而且就算全部通过了这些考试,也并不代表就万事大吉了。每五年,考取了执照的操纵员还得进行一次换照考试,重新回炉一趟。 三向交流法 除了专业知识之外,在核电站的高压环境下,即使是一个最简单的按钮操作,万一操纵员理解错了指令,或者按错了纽,也都可能会引发严重的后果。 为了避免这种把前门楼子听成胯骨轴子的误操作,核电站里的工作人员会使用一种叫做 “ 三向交流法 ” 的特殊方式沟通。 当一个小组的成员收到指令现在要在电脑上点击一个 “ A ” 按钮,他必须先跟当时值班的组长汇报:“ 我现在请求点击这个按钮 A。” 组长在收到请求后,要重复这个请求的完整内容并且反问:“ 你是否确认你要点击的是按钮 ‘ A ’。” 然后,提出操作请求的成员需要再重复确认一次完整内容:“ 我确认我要按下的是按钮‘ A ’。” 最后,组长才能下达命令:“ 我同意你按下按钮 ‘ A ’。” 这时候,组员才能在组长的注视下进行操作。 在这个过程中,命令的发起者和确认者,要反复确认三次完整的命令,最大程度确保了没有指令上的误解,保证人控的安全。 就在我们这趟探访后不久,漳州核电的一号机组已经完成了并网发电,另外全国还有 43 台机组也在建设中。 在完全建成之后,6 台华龙一号机组它能够满足 600 万人口的用电需求。年发电考量超 600 亿度。 差评君觉得,一个浅显的事实是,我们需要核电,也需要安全。化石能源只是人类的新手大礼包。但人类无法永远躺在摇篮里。总有一天,人类需要离开摇篮。 而核能,则是目前看起来最有可能帮助我们离开摇篮的方案。 如何打造完全安全的核电,也许是一个永恒的命题。但因噎废食绝对不是答案。 点击图片跳转视频! 撰文:吉吉 编审:蛋布利多 & 结界 & 小鑫鑫 视频制作:胡尼 & Je77ery & 上进 & 十一 美编:焕妍 图片、资料来源: 特辑 华龙一号 更安全的核电技术 全球最大“华龙一号”核电基地首台机组并网发电 央视网 探秘“华龙一号” 人民日报
安卓手机快充不如苹果?主流手机充电协议盘点
在当今智能手机市场,快充技术已成为各大厂商竞相角逐的关键领域。苹果和安卓手机在这一方面各有千秋,而关于谁更胜一筹的讨论也从未停歇。下面我们一起深入盘点主流手机的充电协议,并探讨快充技术上的异同。 苹果早期推出的2.4A快充协议,主要应用于iPhone 6至iPhone 7系列机型,支持最高12W的充电功率。这种协议需要搭配支持2.4A快充的充电头和USB-A转Lightning的数据线。然而,从iPhone 8开始,苹果逐渐引入了USB PD(Power Delivery)快充协议,这一协议具备更高的充电效率和更广泛的兼容性。例如,iPhone 14 Pro Max等高端机型支持高达29W的充电功率。 安卓手机则拥有更为多样化的快充协议。以下是几种主流协议:USB PD协议:这是一种基于USB Type-C接口的快充协议,由USB Implementers Forum推出,最大充电功率可达240W。USB-PD通过设备和充电器之间的双向通讯,智能调整充电电压和电流,确保充电过程的高效和安全性。许多安卓手机,如小米、一加等,都支持这一协议。 高通QC协议:这是高通为配备骁龙处理器的手机研发的快充技术,全名为Quick Charge。从QC2.0到最新的QC5,充电功率逐步提升至100W以上。支持高通QC协议的安卓手机品牌众多,如小米、三星等。 VOOC闪充:这是OPPO独立自主研发的快速充电技术,采用低压大电流的充电方式。VOOC闪充需要定制的适配器和电池搭配使用,电量转化率达到95%。此外,VOOC闪充可以兼容一加的WARP闪充和realme的DART闪充。 SCP/FCP协议:这两种协议都是华为自家的私有协议。SCP(Super Charge Protocol)采用低压大电流方案,支持高达88W的充电功率。FCP(Fast Charger Protocol)则采用高压低电流方案。这两种协议主要应用于华为和荣耀手机。 FlashCharge闪充:这是vivo采用的快充技术,主要应用于iQOO手机和vivo手机。FlashCharge通过更高的充电功率实现较短的充电时间,目前已有120W的闪充技术。 此外,不同品牌的安卓手机可能采用不同的快充协议,而同一品牌的手机也可能因为型号不同而支持不同的快充协议。这导致用户在选择快充充电器和数据线时需要格外注意兼容性。相比之下,苹果手机的快充协议相对统一,用户只需选择支持PD快充的充电器和数据线即可。 总的来说,安卓手机和苹果在快充技术上各有千秋。安卓手机在充电功率上更具优势,而苹果手机则在快充协议的统一性和兼容性上更胜一筹。用户在选择快充产品时,应根据自己的设备需求、充电习惯以及预算做出明智的选择。无论选择哪种快充方案,都应确保充电器的质量和安全性,避免因使用劣质充电器而对手机造成损害。 (9417569)
DeepSeek会是激活个人AI体验的神奇按钮吗
DeepSeek的余波仍在大模型生态深处震荡。它将重新激活去年春季一度兴起的AI PC热潮。当时,这场产品革命的核心,就是面向规模市场,交付个人AI用户体验。如今,这两个目标已经不再遥远。 上线不足1个月,全球数千万用户都在抢着下载DeepSeek的移动应用。但它的官方服务,在国内面临算力短缺的瓶颈,在美国则面临着“下一个TikTok”的监管压力。中国与美国的云巨头正在将这个开源模型整合到自己的云平台上,动手能力较强的工程师与研究者开始尝试本地部署它的蒸馏模型。 设备厂商刚刚在CES上发布新品,与DeepSeek擦身而过,但高度开源的高性价比的推理模型,势必成为个人AI设备的新支点。 模型性能是本地推理的用户体验的关键。本地推理模型对于维护隐私、优化推理速度,以及在没有网络连接的情况下继续提供服务至关重要。无论是完全依赖本地算力,还是与云形成混合推理引擎,都依赖于部署的推理模型的性能的不断提升。应该说,AI PC在构建个人AI体验方面,最初并不理想。 艾伦人工智能研究所(Allen Institute for AI)科学家Nathan Lambert将DeepSeek的R1推理模型,称为ChatGPT时刻以来,第一个开源模型权重且采用商业友好许可协议、对下游应用无限制的前沿模型。前沿模型,意味着它的性能已经无限逼近已经发布的最强大的闭源模型;再加上开源、友好,意味着更容易围绕其建立应用生态。 一般而言,同等条件下,基础模型性能越强大,蒸馏模型表现越好。完整版R1拥有6710亿参数规模,与其一同发布的蒸馏模型共6个,最小15亿参数,最大700亿参数,适合不同配置的终端设备本地部署。在R1发布后不久,LangChainAI就基于其中的140亿参数规模的蒸馏模型,搭建了一个完全本地的 “深度研究员”。年度最佳Mac应用Craft也迅速将14亿参数规模的蒸馏模型,更新到自己的本地笔记软件之中。 它们仍然不完美,但比此前的本地模型好用得多。而且,尽管扩展定律在预训练阶段的边际效应放缓,但大模型性能仍在提升,蒸馏模型的性能也因此能够得以继续提升;端侧设备的算力性能,也仍在追逐摩尔定律的轨迹,可以逐步在本地驱动更大参数规模的推理模型。 备注为DeepSeek研究员的推特用户DayaGuo(郭达雅),在被问及“如今推理模型处于GPT-2时代,还是已经到了GPT-3.5时代”时,乐观地回答当前仍处于“非常早期的阶段”,“强化学习领域还有很长的路要探索”,但“今年会看到显著进展”。 同样,V3与R1不会是DeepSeek开源的终点。此前,在谈及OpenAI从开源走向闭源的过程时,DeepSeek创始人梁文锋称,“我们不会闭源,我们认为先有一个强大的技术生态更重要。” 模型持续稳定地开源,可以建立与应用生态的反馈循环。这对推进整个开源生态至关重要。在最近一次长达5个小时的访谈中,Semianalysis的Dylan Patel称,模型正在商品化,基于这些模型的应用,会成为巨人肩膀上的赢家,DeepSeek的出现印证了这一趋势。基于云端的Perplexity,以及完全本地的Craft都迅速集成了DeepSeek。 推理模型的应用不仅仅是聊天问答。代理、编码、任务自动化、计算机使用自动化,以及机器人,都将是AI的杀手级应用。这些杀手级应用,非常适合部署于本地。目前,15亿参数的R1蒸馏模型,在数学基准测试中优于GPT-4o和Claude-3.5 Sonnet,它甚至可以装到一个手机里。这能释放软件工程师的生产力,或数学与编码技能相对缺乏的其他行业工程师的创造力。 它们也非常有必要部署于本地。真正负责数据安全的,是开源模型的托管者,是云服务商和本地用户。 芯片厂商也在积极拥抱DeepSeek。AI服务器的垄断巨头英伟达看上去最受打击,但实际上,在今年的CES上,英伟达就公开了自己的Project Digits。它相当于个人AI的桌面数据中心,在 FP4 精度下,可提供高达1 PFLOPS的算力,官方文档称它可以本地驱动2000亿参数规模的大模型。黄仁勋预言未来每个数据科学家、研究者和学生的桌子上都会有一台。 英伟达相当重视DeepSeek的出现。它不仅基于NIM微服务提供了DeepSeek模型服务,还贴心地为消费者测试了在新发布的RTX 50系列上跑R1蒸馏模型的效果。这是首款支持FP4精度的消费级GPU,与上一代相比,推理性能提高了2倍,本地运行内存占用更小。其中,80亿参数的R1蒸馏模型,每秒钟处理200多个token。去年,未尽研究的报告将AI PC的下限设定基于70亿参数的模型,以每秒20个token的速度对外输出。 英伟达的老对手AMD,最快为DeepSeek“站台”,将其模型集成至Instinct系列数据中心芯片上。在CES上,该公司CEO苏姿丰(Lisa Su)也公布了面向消费者的全新的Ryzen AI Max系列处理器,号称最高支持700亿参数本地模型,预计今年二季度上市。 操作系统同样行动迅速。纳德拉在财报电话会议上称,对于像微软这样的超大规模云服务提供商和PC平台提供商来说,DeepSeek的出现是好消息。几日后,该公司就宣布为DeepSeek-R1进行了NPU(神经处理单元)优化,以适配搭载高通骁龙X芯片的Copilot+PC。 也许困扰于如何让Apple Intelligence在华落地的苹果公司,也可以在挑选合作伙伴的时候,考虑一下DeepSeek。 设备厂商戴尔与联想也动作不断。月初,戴尔公司CEO迈克尔·戴尔(Michael Dell)宣布已将R1模型整合到戴尔服务器中。今日,联想同时宣布在旗下AI服务器与AI PC业务领域,适配DeepSeek的模型。前者主要与沐曦合作,后者主要是将DeepSeek集成到个人智能体“小天”之中。 现阶段,DeepSeek凭借最优性价比与最开放的姿态,成为面向规模市场,交付最佳个人AI用户体验的关键节点。这一趋势正在改变大模型生态。未来,它不必是DeepSeek,但很可能仍是DeepSeek。 今年,随着DeepSeek及更多机构组织推出下一代开源模型,英伟达、AMD与高通等新的消费级算力芯片的陆续上市,AI PC或许再次激起一波换机周期。据Canalys统计,去年,全球PC出货量增长3.8%,达到2.55亿台,今年将会继续加速。 坐拥DeepSeek、联想与庞大知识工作者群体的中国,个人AI渗透率及其增速,将有望领跑全球。
团圆年|行程万里 文韵悠长
  编者按:春节,是中华民族传统节日,是万家团圆、辞旧迎新的日子。新时代以来,每到年味渐浓之时,习近平总书记都会深入到群众当中,问冷暖送祝福、听民声解民忧。值此辞旧迎新之际,央视网推出系列特稿,与您一起循着总书记新春足迹,感悟深厚的人民情怀。   乙巳蛇年,中华儿女迎来春节申遗成功后的首个新春佳节。   2025年1月23日,农历腊月二十四,年味渐浓。这一天,正在辽宁考察的习近平总书记来到沈阳长安小区。在社区党群服务中心,见到大家喜气洋洋地写春联、做绒线花、编中国结,总书记欣慰地说,“几千年形成的过节的文化传统,是凝聚中华民族、中国人、全体中华儿女的精神纽带。”他为大家的作品点赞,并勉励大家更好传承弘扬中华优秀传统文化。   春节,这一承载着深厚文化底蕴的中华民族传统节日,于烟火人间讲述着“何以中国”的生动故事。   春节前夕,总书记走基层、看非遗、赏民俗……行程中饱含关于以文润城、以文兴业、以文惠民的深邃思考。   以文润城·让人们记住乡愁   历史文化是城市的灵魂。   农历羊年春节前,古城西安迎来了习近平总书记一行人。   2015年2月15日夜里,总书记登上西安古城墙。脚下是岁月浸润的石板路,远眺是熙熙攘攘的烟火人间,总书记殷殷叮嘱:“这是世界级的宝贝,要保护传承好。”“同时加强研究和利用,让历史说话,让文物说话。”   千里之外的北京,朱门楹联,苍老石纹、花木扶疏……五朝古都沉淀的人文底蕴,藏在红墙青瓦里、老街胡同中。   2019年2月1日,临近春节时,总书记走进北京前门东区草厂四条胡同。在44号院的“小院议事厅”,总书记饶有兴致地参与到胡同院落提升改造恳谈会的讨论中,并关切地询问大家:“从什么时候开始改造?”“有历史文化价值的房子多不多?”“遇到的主要困难是什么?”   2019年2月1日,习近平总书记来到北京前门东区草厂四条胡同看望慰问群众时,同市民合影。   “北京的传统文化特色在哪里?就是胡同。如果北京的胡同都消失了,都变成高楼大厦了,还怎么记得住乡愁?”总书记叮嘱,“我们搞现代化建设,既要把这个文化底蕴保留下来,又要让胡同居民过上现代生活,要把二者结合好。”   天津古文化街,同样浓缩着当地的民俗与历史。   2024年2月1日,总书记在天津古文化街考察时,一条写着“津味中国年”的横幅吸引了他的目光。总书记直言:“天津是一座很有特色和韵味的城市,要保护和利用好历史文化街区,使其在现代化大都市建设中绽放异彩。”   一面城墙、一个胡同、一条古街……在流淌的光阴中,庚续着文化的传承。这些“不仅属于我们这一代人,也属于子孙万代”。   以文兴业·赋能高质量发展   文化,是凝聚人心的精神纽带,也是带动产业发展的引擎。   在四川成都战旗村,有个“网红”打卡点——“乡村十八坊”。很多游客慕名而来,坊内的唐昌布鞋坊,更是门庭若市。2018年2月春节前,总书记在战旗村考察时走进“精彩战旗”特色产业在线服务大厅,在这里买下了一双唐昌布鞋。   7年前的场景,手工艺人赖淑芳至今历历在目:“总书记说,在陕北插队时,老乡就做这种布鞋,穿着很舒服。我想送总书记一双布鞋,没想到他自己掏钱买了一双。”   那天,在“精彩战旗”特色产业在线服务大厅,总书记一路看,一路问,一路支招,停留时间最长。   在蓉绣坊展位,一位绣娘聚精会神飞针走线,现场演示蜀绣技法,不一会儿,颜色光亮明快的彩线就在针下汇聚成精美图案。总书记驻足端详,频频点头。   这个展位上,展陈着罗中立的名作《父亲》、仇英的《莲溪渔隐图》、以国宝熊猫为素材的多种精品绣作。总书记肯定道:“传统文化作为产业发展大有可为”,并鼓励大家在款式花样上多研发、设计,把蜀绣作为国礼送出去,让中国的传统非遗文化走向世界。   2022年1月27日,习近平总书记沿街巷察看山西平遥古城风貌,走进东湖老醋坊,了解当地开展特色经营情况。   2022年1月,农历虎年春节前夕,在山西平遥古城考察的习近平总书记走进多家地方特色小店。在推光漆器店,小到首饰盒,大到五斗柜、屏风,总书记一件件看得仔细,还详细了解了推光漆器的制作工艺;在东湖老醋坊,他观看并亲自体验陈醋发酵打耙,称赞这“既是技术,也是学问,又是艺术”。   “做优秀传统文化传承者”“统筹好旅游发展、特色经营、古城保护”“把富有民族特色的传统文化产业发扬光大、推向世界”……以文赋能企业转型、赋能乡村振兴、赋能产业发展。今日中国,唐昌布鞋成网红、蜀绣装点冠军服,各种“非遗”变身“新国潮”……在文化与经济的良性互动中,各地蹚出了一条条以文兴业的新路子。   以文惠民·点亮高品质生活   每逢新春佳节,大江南北处处张灯结彩,丰富多彩的年俗活动汇成了一道道独特的风景线。   习近平总书记走入百姓中间,给大家拜年,与大家一起贴春联、包饺子、观看舞龙舞狮等民俗表演。   2014年1月27日,习近平总书记在内蒙古锡林浩特市宝力根苏木(乡)参加冬季那达慕“五畜祈福”仪式。   在内蒙古宝力根苏木(乡),总书记按照当地习俗端起银碗,用无名指蘸上鲜牛奶弹了三下,祝福来年风调雨顺,五畜兴旺,人民幸福安康。   在云南腾冲司莫拉佤族村,总书记拿起鼓棒,敲响三声佤族木鼓,祝福来年风调雨顺、国泰民安。   在山西临汾段村,乡亲们打起威风锣鼓、扭起秧歌,一曲《风搅雪》把年味烘托得喜庆热烈。总书记热情点赞:“威风锣鼓,好威风!”   …………   源于民间,流传至今,年俗文化既有深厚的历史渊源,又具有鲜明的时代特征。各地年俗虽有不同,但文化根脉相同。总书记主张“春节期间,各地可以多举办一些群众喜闻乐见的文化活动,让节日更喜庆、更欢快”,“更好弘扬中华优秀传统文化,更好服务经济社会发展和人民高品质生活”。   福建华安,舞动的“巨龙”穿梭在土楼之间,气势磅礴;云南文山多民族群众跳起民族舞蹈,分享传统美食花米饭;新疆乌鲁木齐,人们打起手鼓,跳起麦西热甫,喜迎新春……   人间烟火气,红火中国年。浓浓的年味里,铭刻着几千年的文化基因,也焕发着蓬勃的时代气息。    总监制丨骆红秉 魏驱虎   监 制丨王敬东   主 编丨李璇   策 划丨蔡纯琳   编 辑丨李珊珊   视 觉丨颜妮   校 对丨李丹 鲁杨 刘禛 宋春燕 李英卓 任佳    出 品丨中央广播电视总台央视网
英伟达憾失DeepSeek关键人才?美国放走AI“钱学森”,哈佛教授痛心疾首
新智元报道 编辑:编辑部 【新智元导读】最近,一位哈佛教授痛心疾首地曝出,DeepSeek本来有机会诞生在美国?原本DeepSeek的工程师可以拿到英伟达的全职offer,美国却没有将他留住,导致「钱学森回国」的故事再一次上演,美国跟「国运级AI」擦肩而过! DeepSeek给美国造成的威胁,还在加剧。 就在昨天,DeepSeek的日活数已经达到ChatGPT的23%,每日应用下载量接近500万! a16z联创Marc Andreessen发文 谁能想到,做出DeepSeek关键贡献的人才,本来是可能留在美国的。 最近哈佛大学教授曝出这一惊人事实:DeepSeek多模态团队的第4位工程师,本来可以拿到英伟达的全职offer。 然而最终,他选择归国加入DeepSeek,由此的后果就是,美国在AI领域的主导地位被动摇,相关公司市值蒸发一万亿,全球AI格局也被彻底掀翻。 这种结果是阴错阳差,还是一种必然? 美国错失DeepSeek,让「钱学森」再次回国 近日,政治学家、哈佛大学教授、前国防计划助理部长Graham Allison,在X上提问:「谁曾错失了DeepSeek」? 他在X痛心发帖称,DeepSeek已刷新对美国AI地位的认知,而美国原本有机会留住DeepSeek的关键员工之一潘梓正(Zizheng Pan): (DeepSeek超越OpenAI相关模型)颠覆了我们对美国AI主导地位的大部分了解。 这也生动地提醒我们,美国必须多么认真地吸引和留住人才,包括来自中国的人才。 潘梓正,是DeepSeek多模态团队的第4位多工程师,在开发DeepSeek的R1模型方面发挥了重要作用。 回国之前,他在英伟达实习过4个月,而且拿到了英伟达的全职邀约。 Graham Allison认为潘梓正之所以如此,是因为硅谷公司未能在美国为他提供这样做的机会。 这种「人才流失」,让Graham Allison痛心疾首,甚至将潘梓正回国提升到钱学森归国的高度! 像钱学森、黄仁勋以及马斯克这样的的超级人才可以用脚投票,可以在任何地方施展才华、大张宏图。 他认为,美国应该尽力避免这样的「人才流失」: 美国的大学教练,在寻找并招募世界上最有才华的运动员。 在中美科技竞争中,美国应该尽一切努力避免失去更多的钱学森和潘梓正这样的人才。 英伟达憾失人才 英伟达的高级研究科学家禹之鼎,在得知DeepSeek超越ChatGPT登顶App Store后,分享了当时的实习生潘梓正回国的选择,对他现在取得的成就感到高兴,并分享了对AI竞争的观点: 在2023年夏季,梓正是英伟达的实习生。后来,当我们考虑是否给他提供全职工作时,他毫不犹豫地选择了加入 DeepSeek。 当时,DeepSeek的多模态团队只有3个人。 梓正当时的决定,至今我仍印象深刻。 在DeepSeek,他做出了重要贡献,参与了包括DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1等多个关键项目。我个人对他的决定和所取得的成就感到非常高兴。 梓正的案例是我近年来看到的一个典型例子。很多最优秀的人才都来自中国,而这些人才并不一定只能在美国公司取得成功。相反,我们从他们身上学到了很多东西。 早在2022年的自动驾驶(AV)领域,类似的「斯普特尼克时刻」就已经发生过,并且将在机器人技术和大语言模型(LLM)行业继续发生。 我热爱英伟达,并希望看到它继续成为AGI和通用自主系统发展的重要推动力。但如果我们继续编织地缘政治议程,制造对中国研究人员的敌对情绪,我们只会自毁前程,失去更多的竞争力。 我们需要更多的优秀人才、更高的专业水平、更强的学习能力、创造力以及更强的执行力。 潘梓正是DeepSeek-VL2的共同一作 在DeepSeek超越ChatGPT登顶App Store下载榜第一时,潘梓正在X上分享了自己的感受: 潘梓正2024年全职加入DeepSeek,担任研究员。他曾在英伟达AI算法组担任研究实习生。 2021年,潘梓正加入蒙纳士大学(Monash University)ZIP Lab攻读计算机科学博士,导师是Bohan Zhuang教授和Jianfei Cai教授。在此之前,他分别获得阿德莱德大学(University of Adelaide)计算机科学硕士和哈尔滨工业大学(威海)软件工程学士学位。 在博士期间,潘梓正的研究兴趣主要集中在深度神经网络的效率方面,包括模型部署、Transformer架构优化、注意力机制、 推理加速和内存高效的训练。 Lex Fridman硬核播客,揭秘中国AI新星如何撼动全球格局 就在最近,Lex Fridman放出了一期长达5小时的播客,邀请了AI2的模型训练专家Nathan Lambert和Semianalysis硬件专家Dylan Patel。 在这期信息量爆棚的谈话中,他们全程聚焦DeepSeek,讨论了这颗中国AI新星如何撼动全球格局、MoE架构+MLA的技术双刃、DeepSeek开源倒逼行业开放进程、中国式极限优化之道的硬件魔术等。 DeepSeek到底用没用OpenAI数据 这次,几位大佬的谈话内容可谓相当犀利,直指问题核心。 比如这个关键问题:DeepSeek究竟用没用OpenAI的数据? 此前,OpenAI公开表示,DeepSeek使用了自家的模型蒸馏。 《金融时报》干脆说,「OpenAI有证据表明DeepSeek用了他们的模型来进行训练」 这在道德和法律上站得住脚吗? 虽然OpenAI的服务条款规定,不许用户使用自家模型的输出来构建竞争对手。但这个所谓的规则,其实正是OpenAI虚伪的体现。 Lex Fridman表示:他们和大多数公司一样,本来就是在未经许可的情况下,使用互联网上的数据进行训练,并从中受益的。 大佬们一致认为,OpenAI声称DeepSeek用其模型训练,就是在试图转移话题、让自己独赢。 而且,过去几天还有很多人把DeepSeek的模型蒸馏到Llama中,因前者在推理上运行很复杂,而Llama很容易提供服务,这违法吗? DeepSeek的训练成本,为何如此之低 Dylan Patel表示,DeepSeek的成本涉及两项关键的技术:一个是MoE,一个就是MLA(多头潜注意力)。 MOE架构的优势在于,一方面,模型可以将数据嵌入到更大的参数空间中,另一方面,在训练或推理时,模型只需要激活其中一部分参数,从而大大提升效率。 DeepSeek模型拥有超过6000亿个参数,相比之下,Llama 405B有4050亿参数。从参数规模上看,DeepSeek模型拥有更大的信息压缩空间,可以容纳更多的世界知识。 但与此同时,DeepSeek模型每次只激活约370亿个参数。也就是说,在训练或推理过程中,只需要计算370亿个参数。相比之下,Llama 405B模型每次推理却需要激活4050亿个参数。 MLA主要用于减少推理过程中的内存占用,在训练过程也是如此,它利用了一些巧妙的低秩近似数学技巧。 Nathan Lambert表示,深入研究潜注意力的细节,会发现DeepSeek在模型实现方面下了很大功夫。 因为,除了注意力机制,语言模型还有其他组件,例如用于扩展上下文长度的嵌入。DeepSeek采用的是旋转位置编码(RoPE)。 将RoPE与传统的MoE结合使用,需要进行一系列操作,例如,将两个注意力矩阵进行复数旋转,这涉及到矩阵乘法。 DeepSeek的MLA架构由于需要一些巧妙的设计,因此实现的复杂性大大增加。而他们成功地将这些技术整合在一起,这表明DeepSeek在高效语言模型训练方面走在了前沿。 Dylan Patel表示,DeepSeek想方设法提高模型训练效率。其中一个方法就是不直接调用NVIDIA的NCCL库,而是自行调度GPU之间的通信。 DeepSeek的独特之处在于,他们通过调度特定的SM(流式多处理器)来管理GPU通信。 DeepSeek会精细地控制哪些SM核心负责模型计算,哪些核心负责allreduce或allgather通信,并在它们之间进行动态切换。这需要极其高深的编程技巧。 DeepSeek为何如此便宜 在所有声称提供R1服务的公司中,定价都远高于DeepSeek API,而且大多服务无法正常工作,吞吐量极低。 让大佬们震惊的是,一方面中国取得了这种能力,另一方面价格如此之低。(R1的价格,比o1便宜27倍) 训练为什么便宜,上文已经提到。为什么推理成本也这么低呢? 首先,就是DeepSeek在模型架构上的创新。MLA这种全新的注意力机制,跟Transformer注意力机制不同。 这种多头潜注意力,可以将注意力机制的内存占用减少大约80%到90%,尤其有助于处理长上下文。 而且,DeepSeek和OpenAI的服务成本有巨大差异,部分原因是OpenAI的利润率非常高,推理的毛利率超过了75%。 因为OpenAI目前是亏损的,在训练上花费了太多,因此推理的利润率很高。 接下来亮点来了,几位大佬放飞想象,猜测这会不会是一种阴谋论:DeepSeek精心策划了这次发布和定价,做空英伟达和美国公司的股票,配合星际之门的发布…… 但这种猜测立马遭到了反驳,Dylan Patel表示,他们只是赶在农历新年前把产品尽快发布而已,并没有没有打算搞个大的,否则为什么选在圣诞节后一天发布V3呢? 中国的工业能力,已经远超美国 美国无疑在GPU等芯片领域领先于中国。 不过,对GPU出口管制,就能完全阻止中国吗?不太可能。 Dylan Patel认为,美国政府也清楚地认识到这一点, 而Nathan Lambert认为中国会制造自己的芯片。 中国可能拥有更多的人才、更多的STEM毕业生、更多的程序员。美国当然也可以利用世界各地的人才,但这未必能让美国有额外的优势。 真正重要的是计算能力。 中国拥有的电力总和,数量已经惊人。中国的钢铁厂,其规模相当于整个美国工业的总和,此外还有需要庞大电力的铝厂。 即使美国的星际之门真的建成,达到2吉瓦电力,仍小于中国最大的工业设施。 就这么说吧,如果中国建造世界上最大的数据中心,只要有芯片,马上就能做到。 所以这只是一个时间问题,而不是能力问题。 现在,发电、输电、变电站以及变压器等构建数据中心所需的东西,都将制约美国构建越来越大的训练系统,以及部署越来越多的推理计算能力。 相比之下,如果中国继续坚信Scaling Law,就像纳德拉、扎克伯格和劈柴等美国高管那样,甚至可以比美国更快地实现。 因此,为了减缓中国AI技术的发展,确保AGI无法被大规模训练,美国出台了一系列禁令——通过限制GPU、光刻机等关键要素的出口,意图「封杀」整个半导体产业。 OpenAI o3-Mini能追上DeepSeek R1吗? 接下来,几位大佬对几个明星推理模型进行了实测。 有趣的是,谷歌的Gemini Flash Thinking,无论从价格还是性能上来看都优于R1,而且在去年12月初就发布了,然而却无人关心…… 对此,几位大佬的体感是,它的行为模式不如o1那样富有表现力,应用场景较窄。o1在特定任务上可能不是最完美,但灵活性和通用性更强。 Lex Frieman则表示,自己个人非常喜欢R1的一点,是它会展示完整的思维链token。 在开放式的哲学问题中,我们作为能欣赏智能、推理和反思能力的人类,阅读R1的原始思维链token,会感受到一种独特的美感。 这种非线性的思维过程,类似于詹姆斯·乔伊斯的意识流小说《尤利西斯》和《芬尼根的守灵夜》,令人着迷。 相比之下,o3-mini给人的感觉是聪明、快速,但缺乏亮点,往往比较平庸,缺乏深度和新意。 从下图中可以看到,从GPT-3到GPT-3.5,再到Llama,推理成本呈指数级下降趋势。 DeepSeek R1是第一个达到如此低成本的推理模型,这个成就很了不起,不过,它的成本水平并没有超出专家们预期的范围。 而在未来,随着模型架构的创新、更高质量的训练数据、更先进的训练技术,以及更高效的推理系统和硬件(比如新一代GPU和ASIC芯片),AI模型的推理成本还会持续下降。 最终,这将解锁AGI的潜力。 谁将赢得AGI竞赛 最后,几位大佬预测了一番,谁将是AGI竞赛的最终赢家。 谷歌似乎是领跑者,因为拥有基础设施优势。 但在舆论场上,OpenAI似乎是领先者。它在商业化方面已经走在了最前面,拥有目前AI领域最高的收入。 目前,谁究竟在AI领域赚到钱了,有人盈利了吗? 大佬们盘了盘后发现,从财务报表上看,微软在AI领域已经实现了盈利,但在基础设施方面已经投入了巨额资本支出。谷歌、亚马逊也是如此。 Meta获取的巨额利润来自于推荐系统,并非来自Llama等大模型。 Anthropic和OpenAI显然还没盈利,否则就不需要继续融资了。不过单从营收和成本来看,GPT-4已经开始盈利了,因为它的训练成本只有几亿美元。 最终,谁都无法预料,OpenAI是否会突然陨落。不过目前,各家公司还会继续融资,因为一旦AGI到来,AI带来的回报难以估量。 人们可能并不需要OpenAI花费数十亿美元,去研发「下一个最先进的模型」,只需要ChatGPT级别的AI服务就足够了。 推理、代码生成、AI智能体、计算机使用,这些都是AI未来真正有价值的应用领域。谁不发力,谁就可能被市场淘汰。 参考资料: https://youtu.be/_1f-o0nqpEI https://x.com/GrahamTAllison/status/1885442402833621426 https://x.com/ZhidingYu/status/1883958911839133894

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。