EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
马斯克将与这位争议人物见面 会擦出怎样的火花?
财联社4月10日讯(编辑 赵昊)当地时间周二(4月9日),阿根廷政府宣布了总统哈维尔·米莱(Javier Milei)的行程,他将进行为期一周的出国访问。 根据阿根廷总统发言人的说法,米莱首先将前往美国佛罗里达州的迈阿密,接着到得克萨斯州奥斯汀,然后飞往欧洲,在哥本哈根会见丹麦首相梅特·弗雷泽里克森。 发言人还向媒体确认,米莱将于本周六参观特斯拉位于奥斯汀的超级工厂,期间将会见这家电动汽车制造龙头的首席执行官埃隆·马斯克。这也成为了米莱行程里的重头戏。 上周,米莱在接受媒体采访时表示,“马斯克将在阿根廷的发展中发挥重要作用,我毫不怀疑他会是一个积极的参与者。”米莱补充道,新阿根廷将摆脱100年来的颓废。 米莱 & 马斯克 2023年11月,经济学家出身,极右翼选举联盟“自由前进党”候选人米莱当选阿根廷新一任总统。有分析认为,这代表阿根廷民众抛弃了长期统治阿根廷的“庇隆主义”。 胜选之后,米莱誓言要彻底改革阿根廷臃肿的政府,大幅削减公共支出,向全球市场开放阿根廷经济,并出售国营企业。当时有观点认为,米莱当选将对当地的锂产业发展产生积极作用,或将创造更多锂投资机遇。 据了解,阿根廷是全球第四大锂生产国,仅落后于澳大利亚、智利和中国,共有38个锂相关项目,未来碳酸锂年产能或达7.7万吨,2026年将进一步增长至30万吨。摩根大通预测,阿根廷锂产量将在2029年超过智利,达35万吨。 去年年底,米莱在一期节目中透露,“我接到了埃隆·马斯克的电话。他对锂非常感兴趣,美国政府和许多美国公司也是如此。但他们需要一个法律框架来保证产权得到尊重。” 今年2月,阿根廷国家通讯局批准SpaceX等科技公司在该国提供卫星互联网服务的申请。除此以外,米莱还在《综合法案》中纳入了允许自动驾驶汽车在阿根廷上路的许可证。 对于这个合作伙伴,一向尖酸刻薄的马斯克不吝惜赞美之词。在米莱当选总统时,马斯克就在社交媒体上发出祝贺,并称“繁荣即将降临阿根廷”。 1月的时候,米莱在达沃斯首度国际亮相时发表了一篇极具争议性的演讲,马斯克转发并配文“这很好地解释了为什么有的国家繁荣,有的却不能”。
马老师,现在当务之急不是写公开信,而是您必须回到一线!
昨天刚刚看了蔡崇信的视频访谈,今天就见马老师的内网公开信,作为一个和阿里有着千丝万缕联系的人,我想说:所有矛盾甩锅给逍遥子这事吧,不体面,可以先停一停了。当务之急是:淘宝的“生态位”正在史无前例被挤压,仅仅反思是没用的,破局才是正道!要说反思,上一个最能反思的是凡客的陈年同学,每半年一年,就长文反思一下,不可谓不深刻……而且满满都是“君非亡国之君,臣皆亡国之臣”调调儿,可现在凡客在哪里? 先说一个令人毛骨悚然的事实:美妆类目,那是所有综合平台最核心类目了吧?也是淘宝起家的类目之一,今年一到三月份,天猫美妆是195亿(来自生意参谋),而抖音美妆是487亿(来自飞瓜数据),这可是足足2.5倍啊!抖音美妆说一句拿着望远镜看不见对手,恐怕天猫不敢接下茬儿吧?更重要是:这个差距,还在快速拉大中,去年Q4,抖音美妆仅仅是天猫美妆的1.15倍…… 我作为淘天上一个大卖家,现在感觉淘天内部一切都乱糟糟的,按理说,每年年初,各个品牌商都要和天猫签“年框”,这既是天猫绑定各个品牌的一个手段,也是收入的一个大来源,可问题是,现在可都四月份啦,对接我们的小二一直换来换去,就没人搭理我们签年框这事,我们拎着猪头找不到庙门…… 这就使我想起来崇祯一上任就干掉魏忠贤,虽然今天从道德判断,杀魏忠贤一片叫好,但从当时现实出发,没了魏忠贤,帝国税收就出了大问题,而财政一旦出问题,那真是按下葫芦浮起瓢,李自成和皇太极都各种闹事,帝国百病丛生。 我当然不是说逍遥子是魏忠贤,公平说,逍遥子更像是苹果的库克,曾经接手一个辉煌无比的好摊子,平平庸庸守业许多年。唯一不同的是,乔布斯留下那个摊子,生态位太TM好了,库克手中的创新,汽车也黄了,VR眼镜也没热度了,就剩每年给iPhone换换颜色,给MacBook加个难看刘海儿,仍然是两三万亿美金市值;回过头看,逍遥子干了哪些致命伤?其实都没有,虽无妙手,亦无致命,比库克不差滴!……但马云留下的生态位,说到底,护城河没有那么深、那么广。经不起时间考验,几年一过,八百里洞庭湖变成了苏州园林里的流觞曲水。 可现在的感觉,就仿佛是只要全盘否定逍遥子,把逍遥子的“遗产”统统抹除,比如卖掉逍遥子买来的一切,把逍遥子任用的将领纷纷淘汰,淘宝就会重新焕发新生……这可能吗? 今天看来,小平的智慧之伟大一点便是“不争论”,他何尝不知道以前搞的很多东西,是改革的障碍?学赫L晓夫批判斯D林、直接否定前任的一切,多过瘾?但是前Su联带来的动荡,又有谁受得了? 阿里现在已经动荡到什么地步呢,再说一个例子,从疫情开始,我就全职回归到阿芙,河狸家那边我已经三年没有参与,前些日子,河狸家有点事需要董事会开一下讨论通过,结果,发现阿里作为河狸家第一大股东,派给我们的董事,都不知道是谁,董事会开不成啊……去问也始终没下文,阿里投资部也完全放羊状态,一片混乱。 好了,说了这么多,我想说,无论从商业上还是感情上,甚至从价值观上我都百分百希望阿里能重新辉煌(是的,我真的认为抖音的价值观多多少少有问题,他家一家独大后,绝非商家之幸事。)而现在当务之急,别再甩锅给逍遥子啦……尤其在动作上,要避免赫L晓夫那种“一切反着来”的古怪精神。 最重要的是: 阿里生态位目前摇摇欲坠,而这不是小修小补、不是抱残守缺、不是外科手术、能够达成目标的。 重新复兴,那得是乔布斯重回苹果的魄力与手段,尤其是:重新找到iPod的灵感与智慧,乃至等到iPhone来临的泼天生态位。 我有幸听过蔡崇信的课,甚至写过一篇《CFO的三重境界》来赞美蔡崇信的能力……但是很抱歉,阿里不是小船,而是航母,能把航母重新驶回太平洋的,恐怕还得是马云。我理解马老师肯定有一层心理阴影,就是他的恩人之一,杨志远重回雅虎的失败案例,但我想说,马云可比杨志远身经百战多了。 总之,今天阿里面临的困境,绝不可能通过拨乱反正来完成,真正挑战是: 找到下一个,能够比肩当年电商崛起那种泼天生态位 ,而这种手段与魄力,尤其是福至心灵,电光火石,别人都认为不可能,而只有创始人“因为相信而看见”的灵感,只有马老师这种“初代创始人”才有……或者只有二十岁毛头小伙子,目前窝在车库里,胸怀天下,兜里一干二净,才有。 虽然我很尊敬蔡崇信和吴泳铭,但他们太老了,早已缺乏一线厮杀的手感与体感……那有人问了,马云不也一样离开一线很多年,且年龄一样大? 我的回答是:创始人永远是少年! 马老师,回来吧!
“马斯克2.0”最新预判:人形机器人2025年就能“上班挣钱”了!
今年3月,一段人形机器人视频刷屏。 视频中,机器人根据人类的口头指令执行了一系列简单的抓取和放置动作,例如将苹果递给人类、将塑料袋放入篮子中,以及将杯子和盘子放置在沥水架上。 在整个交互过程中,机器人与人类之间的对话十分流畅,尽管在反应速度方面与真人仍存在一定差距,但显然已经取得了显著的提高。 此视频由一家名为Figure AI的人工智能机器人公司上传,视频中的人形机器人便是其自主开发的Figure 01。 4月5日,Figure AI创始人兼首席执行官、被称作“马斯克2.0”的Brett Adcock接受了一档节目的采访。 Brett Adcock表示,希望在未来的12到18个月内,机器人能在客户的真实工作场景中做些真正的工作。 划重点: 1、对大家来说,人形机器人就是那些外形像人、有腿、手臂和手的机器人,它们能够像人一样完成各种工作。 2、这将是世界上最大的业务,GDP的一半是人类劳动,比所有交通市场的规模都要大一个数量级,是一个巨大的行业。 3、我们之所以没有感受到上限,是因为我们已经清晰地看到了未来12到24个月的发展蓝图,并且我们正在不断进行优化。 4、我们觉得,和机器人交流最自然的方式就是通过说话,就像和真人聊天一样。 5、我们期望在接下来的一年到一年半的时间里,我们的机器人能够在客户的实际工作环境中承担起具体的任务,并通过完成这些任务来赚取收益。 6、我们期待这些仿人机器人能够帮忙做一些体力上的家务活,比如洗衣服和做晚餐这样的事情。 核心内容: 首先,Adcock提出了人形机器人的巨大市场潜力。他指出,人类劳动占据了全球GDP的一半,这意味着如果能够开发出能够完成类似人类工作的机器人,那么它们将能够承担世界上一半的劳动力任务,从而创造出巨大的经济价值。他预见到,在未来,随着人形机器人技术的成熟和普及,人们将能够从日常的体力劳动中解放出来,例如洗衣服、做饭等家务活,使得劳动成为一种选择而非必须。Adcock还称,期望在未来12至18个月内,他们的机器人可以去宝马的南卡罗莱纳州工厂实际工作。 Adcock强调了技术创新在推动人形机器人发展中的关键作用。他提到,随着电池和电动机技术的进步,以及运动控制器和人工智能系统的发展,人形机器人的性能和可靠性将得到显著提升。他特别提到了与OpenAI的合作,这一合作将有助于提高机器人的语言推理和任务执行能力,使得机器人能够更好地理解和响应人类的指令。 在谈及社会接受度时,Adcock强调了安全的重要性,并表示Figure AI将致力于建立人形机器人的安全记录,以赢得公众的信任。他还提到,随着成本的降低,人形机器人将变得更加普及和可负担,最终成为家庭和社会中的常见成员。 Adcock对于人形机器人的发展前景持乐观态度。他认为,随着技术的不断发展和完善,人形机器人将在不久的将来成为现实,并在各个领域发挥重要作用。他预见到,人形机器人不仅能够在工业领域替代人类执行危险或重复性工作,还能够在家庭环境中提供帮助,比如照顾老人、协助残疾人士,甚至在教育和娱乐领域发挥作用。 他还提到了人形机器人在提高生产效率方面的潜力。通过自动化生产线上的重复性任务,人形机器人能够帮助企业降低成本、提高效率,从而推动经济增长。此外,人形机器人还能够在灾难救援、空间探索等高风险领域发挥作用,保护人类免受危险环境的威胁。 Adcock也讨论了人形机器人对于就业市场的影响。他相信,虽然人形机器人可能会取代一些工作,但同时也会创造新的就业机会,比如机器人维护、编程和系统集成等领域。他强调,教育和培训将至关重要,以确保劳动力能够适应这一变革。 在采访中,Adcock还分享了他对于人形机器人技术发展的一些个人经历和感悟。他提到了自己从软件行业跨越到硬件领域的经历,以及他如何通过不断的学习和实践,逐步建立起对人形机器人技术的理解。他还谈到了自己对于创新和创业的热情,以及他如何将这种热情转化为推动人形机器人技术发展的动力。 总的来说,Brett Adcock在采访中展示了他对人形机器人未来的明确愿景,即通过技术创新来推动社会进步和提高人类生活质量。他相信,随着技术的不断发展和完善,人形机器人将在不久的将来成为现实,并在各个领域发挥重要作用。他对于人形机器人的发展前景充满信心,认为这些人形机器人将能够帮助人类解决许多长期存在的问题,从而创造一个更加美好的未来。
在音乐APP上,花10元就能成为“周杰伦”
撰文/ 孟会缘 编辑/ 李觐麟 自从“90后”周同在半个月前开始体验酷狗AIK,仅制作了一首歌的他就对这个功能升起了浓厚的兴趣,“有谁能拒绝在开车的时候,可以播放一首由自己的声音录制但效果堪比原唱的歌呢?” 对于这个自诩为行业首个AI创作工具与玩法,按照其功能介绍,用户只需录制一段60秒的声音,就能让AI模仿用户的音色,从而打造用户的专属音色音效,并借此制作成各种高难度的歌曲。 换句话说,或许过去的我们只能在音乐APP上听AI歌手“洛天依们”献唱,而现在的我们却能通过AI翻唱功能变身为下一个“洛天依”。 谁也没有想到,AI在音乐领域的渗透会如此迅猛:目前,国内至少已有3家可以为用户提供AI翻唱服务的平台,如酷狗音乐、QQ音乐以及全民K歌的“AI帮唱”功能,单首歌曲的制作费用为10元,片段收费为5元。 甚至随着AI相关功能在音乐领域的不断落地,以后不只能圆人们的专业歌手梦,还能助力普通人成为像周杰伦这样的原创音乐制作人——已进入Beta测试阶段的网易天音,只需选择“AI一键写歌”,就能将词曲编唱一键搞定。 显然,音乐圈的“ChatGPT时刻”已经到来。 AI技术有欠缺,问题全在细节上 “one two three和后面都不是一个声音,里面每一个超都破音” “伴奏声音把人声音盖住了,能不能伴奏和人声音量分离开,可以自行调整的那种?” “余香的2分57秒左右位置的卡顿有改好吗?一般要等多久啊?” …… 待在酷狗AIK用户交流群里的这半个月里,周同围观了数个同好向客服反馈的奇葩问题,“本来只是进群催催我想要的歌曲版权,但没想到AI翻唱的技术BUG会出得这么有特色。” 酷狗AIK用户反馈的部分问题 根据自己的使用体验,周同告诉锌刻度,AI翻唱目前只能做到音色和本人相似,唱法基本要靠模仿原唱,咬字习惯和偏好也是随着原唱走,因此听成品的时候偶尔会觉得某些地方不像自己唱的,“整体只能说是像个八九分吧。” 这一点从另一位用户“Re”的反馈也能看出来。按照“Re”的说法,她在录制《大鱼》时,感觉自己的AI翻唱版本中有一个字的发音和整首歌曲不一样,听起来就像是变成了大舌头。 对此,客服在询问过技术人员后的答复是,“绳索那两个字是发出来了的,只是AI的话,它目前人性化演唱技巧没那么好,发声吐词会比较硬一点,原唱周深用了混声技巧唱出来比较顺一些,这个目前技术无法调整到完全一致。” 在用户“顺其自然”看来,这些问题全都要归因于AI算法仍有欠缺,“大体上听起来可以,但有些细节处理还是差不少。” 更重要的是,平台方在进行技术调整时,有明显的下行趋势,“有些歌压根都跟不上节奏和调上,没制作之前用试听就能听出极大瑕疵,以前是用自己的声音来模仿贴近原唱,但至少前提是用自己的声音做出的效果,比较符合真实唱的效果,但现在有些直接弄出电音来弥补,或者颤音像过电一样,还有个别歌曲某个词的一个字或尾音是直接掐断那种,如同这个音没唱完就瞬间断了,极不协调和生硬。” 用户“鱼”为AI翻唱歌曲已花费过万 已经制作了一千多首AI翻唱歌曲的“鱼”也深表认同,“真不如以前好听,优化一下吧。伴奏又大、声音又粗、吐词也不清晰,还不如以前的,虽然没有呼吸声,但至少听起来是好听的。” 从翻唱到写歌,音乐APP开始“圈钱” 不过,尽管AI翻唱技术还不够“丝滑”,却已经足够让音乐APP借此变现了。 锌刻度从QQ音乐、酷狗音乐和全民K歌的相关业务板块看到,这三个头部音乐APP的“AI帮唱”功能,单首歌曲的制作费用为10元,片段收费为5元。此外,酷狗音乐还有一笔29.9元的下载费用。 三大头部音乐APP的AI翻唱价格 “就是有点贵,制作10元,下载30元,一套下来要40元一首歌。”一位酷狗音乐用户表示,“官方说是因为版权问题,AI翻唱歌曲不支持录屏,只能选择付费下载。以前都可以,现在却不行,这样一改太不方便了,我都不想做歌了。” 而除了收取AI翻唱歌曲的制作费,音乐APP们还盯上了AI技术在音乐创作方面的市场潜力。 自Suno在3月22日正式发布V3模型那天起,外界的关注焦点迅速投向了这个令人震惊的音乐生成工具上——可以不懂乐理,也不需要很专业的提示词,只要给出风格和主题的单词,几秒钟之后就可以生成一首有歌词、前奏、间奏、副歌的完整歌曲。 Suno在海外掀起巨浪的同时,国内市场的“类Suno”产品也已蓄势待发。 作为网易推出的一站式AI音乐创作工具,网易天音集成了如AI智能快速编曲、AI作词与创作、一键DEMO和虚拟歌姬歌声合成等多种功能,同样无需乐理知识,只需选择“AI一键写歌”,输入脑海中那些原本只能一闪而逝的灵感,就可以由AI辅助完成词、曲、编、唱,在生成AI初稿后,还支持词曲协同调整。据网易天音官网介绍,该产品已进入Beta测试阶段。 已进入Beta测试阶段的网易天音 另外,锌刻度注意到,QQ音乐APP也上线了SunoAI的业务板块,虽然还没有歌曲上传入口,但其功能介绍表明“SunoAI包含两个主要的音乐生成模型,即擅长歌唱和抒情表演的Bark,以及专注于创作乐器伴奏曲目的Chirp”。在该板块区域,不仅设置好了“趋势流行”“新鲜改编”“来点电子舞曲”“感受电音流行”“摇滚不止”“更多音乐探索”这六个AI音乐分区,官方还留下了一个问题:“你是如何理解Suno AI的音乐?”种种迹象不难看出,QQ音乐下一步想开展SunoAI业务的野心。 从用户评论来看,对AI写歌业务感兴趣的人,表现得也很踊跃:“音乐的本质是什么?是技巧吗,是各种乱七八糟的专业名词吗,难道不是打动人心?就此而言,AI已经实现了超越”“真的可以有这个板块”“一直在用,现在已经有好几首很好听的了,就是不知道咋上传”…… 对此,一位QQ音乐用户表示,“这玩意流行起来,真会让不少相关产业的人失业,至少商业上议价能力会极大受损。原来觉得被 AI替代还早着呢,现在一看,恐怕这个趋势很快就会蔓延到音乐制作工作中去。” 文生音乐持续迭代,作曲家“下岗潮”来了? 毫无疑问,AI技术已在成为音乐行业的下一个转折点。 第一波察觉到“风暴”来临的是音乐圈相关人士。四月初,包括凯蒂·佩里、比莉·艾利什和妮琪·米娜等知名歌星在内,共有200多名音乐人联合发表了公开信,呼吁数字音乐开发商“停止使用人工智能侵犯和贬低人类艺术家的权利”,要求他们承诺不开发与之相关的AI音乐生成技术,不能拒绝向艺术家提供合理报酬等。音乐界的知名人士甚至还在信中警告称,“如果不加以控制,AI将引发一场逐底竞争。” 此前,这样的戏码已经在影视圈上演过。开年文生视频工具Sora的问世,令整个娱乐行业开始担心这项新兴技术会危及自己的生计。在去年的好莱坞编剧大罢工中,限制AI的使用是行动的核心诉求之一。 国内的暗潮涌动同样不少。除了QQ音乐和网易云音乐这样的垂直音乐平台,在对文生音乐的相关功能进行积极探索和体验测试外,还有更多互联网公司付诸行动。 去年,腾讯就发布了一款音乐理解生成框架M2UGen。据悉,该模型融合了音乐理解和多模态音乐生成任务,能够进行音乐问答,还可以从文本、图像、视频和音频生成音乐,并进行音乐编辑。 4月2日,昆仑万维推出了国内首款且唯一对外开放的AI音乐生成大模型“天工SkyMusic”,并宣布即日起面向社会开启免费邀测。资料显示,该大模型能够支持生成80秒44100Hz采样率双声道立体声歌曲。后续还将逐步迭代和添加多模态的情感理解与表达能力。 图源自公众号天工AI助手 “AI作曲和人作曲是有差别的,尽管AI在全球各个领域迅猛发展,包括音乐制作等,但AI仅仅是一个载体,不可能像人一样到位,始终替代不了人工。音乐是诞生于人的感情,而AI只能描绘感情,它本身没有感情。”湖南省文联副主席、省音乐家协会主席邓东源在接受长沙晚报的采访时如此表示。 部分业内人士认为,虽然业界频频传出AI会抢了作曲工作者饭碗的隐忧,但实际情况却是,目前的人工智能只是服务于人类支配的工具,在其基础上衍生而来的文生音乐工具充其量不过是更聪明的工具,如今能替代的大都只是一些重复性、程序性的工作。 换句话说,AI制造的歌曲暂时还无法替代人工产物。而当下真正可以预见的是,随着AI技术与音乐领域进行更深度绑定,从10元的AI翻唱,到正在进行深度测试的SunoAI,AI应用落地的商业前景正被急速拓宽。
谷歌、英特尔纷纷推AI芯片,科技巨头欲挑战英伟达市场统治
谷歌表示,新处理器将于2024年晚些时候上市。 人工智能热潮加剧,科技巨头正在寻找人工智能所需的稀缺芯片,摆脱依赖,加速竞争。 谷歌正在制造基于ARM架构的定制CPU“Axion”,支持其数据中心的人工智能工作,让云计算变得更便宜。当地时间4月9日,在拉斯维加斯举行的Cloud Next大会上,谷歌表示,新处理器将于2024年晚些时候上市。 据路透社报道,基于ARM架构的Axion CPU,性能比通用ARM芯片高30%,比英特尔和AMD生产的当前一代x86芯片高出50%。谷歌计划“很快”使用Axion来支持谷歌云上的YouTube广告等服务。 谷歌试图减少对英特尔和英伟达等的依赖,追赶亚马逊和微软等竞争对手。亚马逊网络服务公司2018年推出了ARM芯片Graviton。就在谷歌宣布推出ARM处理器的几个月前,微软公布了为其云基础设施设计的定制芯片。据The Verge报道,微软已经开发了人工智能定制芯片来训练大模型,并为云和人工智能工作负载定制了基于ARM的CPU。 谷歌也在更新其TPU人工智能芯片,周二,谷歌TPU v5p芯片通过谷歌云服务上线。谷歌TPU芯片作为英伟达GPU的替代品用于人工智能加速任务,尽管开发者只能通过谷歌云平台访问它们而不能直接购买。 谷歌云副总裁兼计算和机器学习基础设施总经理马克·洛迈耶(Mark Lohmeyer)表示,TPU v5p是下一代加速器,专门用于训练一些规模最大、要求最高的生成式人工智能模型。单个TPU v5p pod包含8960个芯片,是TPU v4 pod上芯片数量的两倍多。 英特尔也公布了新的人工智能芯片细节,以对抗英伟达的统治地位。当地时间4月9日,在Intel Vision 2024大会上,英特尔推出用于AI训练和推理的Gaudi 3加速器,采用5纳米工艺。Gaudi 3将带来4倍的BF16 AI计算能力提升和1.5倍的内存带宽提升,预计可大幅缩短70亿和130亿参数Llama2模型以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3芯片比英伟达上一代H100 GPU训练特定大语言模型的速度快50%。在英特尔测试的一些模型上,它的推理速度比H100芯片更快。 英特尔在Meta开源的Llama模型和阿布扎比支持的Falcon模型上测试了该芯片。英特尔表示,Gaudi 3可以训练或部署大模型,包括文生图模型Stable Diffusion和Open AI旗下用于语音识别的Whisper模型等。该芯片比英伟达芯片的功耗更低。 据路透社报道,Gaudi 3芯片预计今年第二季度向超微电脑(Supermicro)和惠普企业(Hewlett Packard Enterprise)等服务器制造商提供。 过去一年,GPU是人工智能企业的首选高端芯片。英伟达凭借其GPU在人工智能芯片市场上占据约80%的份额。今年3月,英伟达在其GTC大会上推出了H100的继任者,即用于运行人工智能模型的新一代人工智能芯片B200和GB200。 英特尔至强(Xeon)软件副总裁达斯•卡姆豪特(Das Kamhout)表示,确实希望Gaudi 3芯片与英伟达最新芯片相比具有极致的竞争力。“从我们具有竞争力的价格、独特的开放式集成网络、使用行业标准以太网等方面来看,我们相信这是一个强大的产品。”
谷歌推出AI创作应用Google Vids:会PPT就能做视频、支持多人协作
IT之家 4 月 10 日消息,过去传统办公一直围绕着文档、电子表格和幻灯片(如微软的 Word、Excel、PowerPoint,苹果的 Pages、Numbers、Keynote,谷歌的 Docs、Sheets、Slides)。现在,谷歌想要增加一个名为 Vids 的应用程序,使用户比以往任何时候都更容易地制作协作可共享的视频。 Vids 是一款全新的 AI 应用程序,可以帮助用户生成视频内容的分镜脚本、选择风格、编辑草稿,同时还提供预录制的旁白功能,并支持项目的安全协作和共享,预计将在 6 月份之前登陆 Workspace Labs 测试版。 谷歌 Workspace 协作应用程序产品管理副总裁 Kristina Behr 说:“我们的精神是,如果你能制作幻灯片,你就可以在 Vids 中制作视频,不需要视频制作(的经验)。” IT之家从公告中获悉,用户可以自己完成所有这些工作,也可以使用 Google 的 Gemini AI 制作视频的初稿。Gemini 可以构建故事板,它可以写一个脚本,它可以通过文本转语音将用户的脚本变成声音,它可以创建图像供用户在视频中使用。Google Vids 有一个视频库和音频库,用户也可以将自己的视频加入其中。 在 Vids 中制作内容后,用户可以与他人分享。就像谷歌的其他生产力工具一样,当用户分享一个视频时,不仅仅是在分享一个带有播放按钮的文件。“与您分享的人可以发表评论、留言,甚至自己编辑视频。如果你愿意,你可以把它导出到 MP4 上,”Behr 说,“但我们希望它看起来很像我们的其他协作应用程序。在她和谷歌的心目中,视频与电子表格没有什么不同。这些不是好莱坞的作品 —— 它们只是为了在工作中分享简单、快速的视频。”
我们需要更多不做大模型的AI应用主义者
All in AI ,到 2024 年这个节点几乎已经成了科技互联网公司的主旋律。 仿佛全世界都陷入了 AI Fomo(AI 错失恐惧症),科技公司展开了追赶 OpenAI 的大模型军备竞赛,普通个体担心被 AI 取代,于是 199 元的 AI 课收获了大批拥趸。 而在国内掀起的「百模大战」中,金山办公算是一个异类。这家国内办公软件市场份额最高、现金流也十分充足的公司,并没有投入到大模型的竞争中,却在国内最先推出了基于大语言模型的智能办公助手 WPS AI。 在昨天的金山办公生产力大会,CEO 章庆元再次强调金山办公是一个大模型的应用者,目前也接入了国内几乎所有主流大模型。 以这种方式 All in AI 的金山办公,在过去 36 年间从 PC 时代走到移动互联网时代后,正在经历的第三个重要的节点,而前两个节点都影响了中国办公软件的市场的走向。 八十年代,求伯君把自己关在在深圳蔡屋围酒店 501 号房 14 个月,用一台 386 电脑敲出了 12 万行汇编代码,1988 年 WPS 1.0 诞生。 2002 年,金山 6 号员工雷军带领 100 多位工程师花三年重写了 WPS 500 多万行代码,推出了完全兼容微软 Office 的 WPS 2005。 ▲ 雷军(左)和求伯君 现在大模型的到来开始改变软件应用的使用方式和开发方式,章庆元认为未来甚至 UI(User Interface,用户交互)这个词都会消失。金山也从去年开始暂停了所有跟 AI 无关的业务,全面转型。 爱范儿曾在年初的 ifanRank 中预测,我们正迈向工具性、普适化和工业化的「大应用时代」,2024 年将看到更多满足消费者或商业需求的 AI 原生应用。 大模型赛道逐渐趋于饱和,接下我们显然需要更多专注 AI 产品落地的公司,将大模型能力转化为行业生产力和创造力。 AI 生产力的迷思 回顾过去一年的爆款 AI 工具,无论是微软的 Copilot ,还是春节开始刷屏的 Sora ,伴随出现的高频词汇往往有两个——颠覆和取代。 尽管这些 AI 工具奔着提升生产力而来,但比起它们可能带来的效率提升,能取代多少工作颠覆哪些行业却总是被讨论最多的话题,甚至还有不少机构乐此不疲计算出精确的百分比。 工具本质是什么?帮助我们更轻松地完成想要做的事。那提升生产力无非就是两种方式,要么提升单个步骤的效率,要么缩减任务过程中所需的步骤,或者两者同时实现。 大模型驱动的一众 AI 工具,则是大大缩短了从提出需求到实现想法所需的流程。 你只要一句话,让 AI 几秒列出大纲,然后生成 20 多页 PPT。 一些需要过去拍摄和后期制作的视频,如今化作一段 prompt 指令。 哪怕是用手机随手一拍的照片,用手指圈一圈就能去掉将路人或杂物。 章庆元在去年接受采访时曾预测,大概再过一年,人们就可以用「100 块钱一个月请一个全能 Office 助手」的方式,实现对办公软件全新的掌控,任何复杂的表单、表格和计算等工具栏都会从办公软件上消失,这种用「订阅」的方式从根本上改变办公软件的商业模式。 这背后其实是 AI 加速了算力平民化的进程。 WPS AI 的产品经理付子豪不久前在一次分享中提出一个观察:大模型的出现不能类比移动互联网出现的状态,它更像是 PC 诞生的时代,云诞生的时代。 随着人类社会出现的需求和场景越来越复杂,大脑的算力已经不够用,我们开始通过计算机扩展算力。但要充分释放计算机算力的门槛并不低,你可能需要懂得编程语言,就算是常用 Excel 表格、PS,要用好也不容易。 AIGC 解决的就是算力门槛的问题,只要用自然语言就能让计算机理解你的思考逻辑 ,并生成结果,极大地缩短从想法到结果的链条。 如果理解了这个逻辑,对 Sam Altman 最近专访关于 AI 将取代多少工作的回答或许更有共鸣。Altman 思考的方式不是 AI 将完成多少百分比的工作,而是 AI 在一段时间内将完成多少百分比的任务。 我认为这是一个比 AI 可以做多少工作更有趣、更有影响力、更重要的问题,因为它是一种工具,可以在越来越复杂的水平上工作,在越来越长的时间范围内完成越来越多的任务,并让人们以一种更灵活的方式进行操作。所以也许人们的工作效率会更高。 这个思考不仅对于用户,对于 AI 工具的开发者同样有价值。因为用户需要的其实不是参数越来越大的模型,而是能让他们更容易将想法落实的工具,就像当年乔布斯一个经典的回答: 必须从用户体验入手,然后再回过头去开发技术,而不是从技术入手,然后再试着想办法,看这个技术能用到哪? Copilot 的交互 在《大模型元年,人类文明的操作系统正在大更新》一文中,我们提到下一代革命性的人机交互模式可能会是自然用户界面(Natural user interface, NUI)。 NUI 最核心的原则是简单性高于一切。复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。 而 Copilot ,则是 NUI 交互逻辑下 AI 工具理想的形态。Copilot 这个词源自飞行术语,指的是协助主驾驶员操作飞机的副驾驶,当主驾驶员需要休息或处理其他任务时,副驾驶员就会接管控制权,二者共同负责飞机的安全飞行。 我认为这也是人和 AI 交互最恰当的形容。微软对于 Copilot 的定义是:一种使用自然语言处理技术或大语言模型,帮助人们完成复杂或认知任务的应用程序或组件。 WPS AI 同样将人机交互作为三大战略方向之一,也把基于自然语言多轮问答式的自然交互称为 Copilot,能够深入植入到文档和协作的各种场景。 比如昨天推出的 WPS AI 企业版可以提供「文理兼修」的数字员工服务,例如阅读助手、画图助手、考勤助手、销售分析、合同分析等等,触达各类细微的办公场景。 其中的 Copilot Pro 则可帮助运营人员使用自然语言驱动 BI 产品分析数据,同时可调用 WPS 365 API 和企业自有 API,解决办公自动化需求。 GitHub 一项数据显示,在使用 GitHub Copilot 的开发人员中,88% 的人表示他们的生产力更高,74% 的人表示他们可以专注于更令人满意的工作中,77% 的人表示它有助于他们减少搜寻资讯或范例的时间。 章庆元有个形容也十分贴切,自然语言交互大幅降低用户交互成本,意味着 Photoshop 可以直接进入「美图秀秀」这类工具的市场。 用户能以操作美图秀秀的交互难度,实现 Photoshop 中复杂的功能。这样情况正在越来越多类型的 AI 产品中出现。如果留意去年 WPS AI 的更新,也会发现用户界面在不断简化,自然语言的输入开始替代原来一些按钮的功能。 可以看到,目前办公文档处理套件,已经向「office+协作+AI」组成的一站式 AI 办公转变。一个产品能高效完成越来越多的任务,但集成的功能模块却越来越少,也将是 AI 工具的趋势。 科技的革新本质上是人机交互的进化,当 Copilot 发展到一定程度,甚至可能整个交互界面本身就是一个超级应用,不仅连功能按钮被取消,甚至很多应用本身都不一定再需要单独存在。 我们需要更多不做大模型的 AI 公司 很多人把大模型或 AIGC 视为第四次工业革命,实际上如果一个技术要被冠以革命性的帽子,实际指的不是技术的突破本身,而是能影响整个商业社会、改变大多数人的生活方式。 无论是蒸汽、电力还是互联网,毫无疑问都符合这些特点,那大模型呢?至少现阶段肯定是达不到这个程度。我们需要的是通过 AI 应用产品将大模型能力发挥出来,从而来影响人们的工作和生活。 ▲ 吴恩达 计算机科学家吴恩达也认为, AI 作为新一代通用技术,更多的机会,在于大规模应用落地。 这也是为什么我一开始就说,我们需要更多不做模型的 AI 公司。大模型作为底层技术固然不可或缺,但专注于满足消费者的各种需求以及各类商业交易的 AI 公司绝对需要更多,才能让 AI 在社会层面真正爆发。 就像多点触控技术,早在初代 iPhone 发布 20 多年前就有了成熟应用,但只有苹果让这项技术成为后来几乎所有智能手机的交互方案。 而在这波 AI 浪潮中,也有着不生产大模型,但坚定要做大模型应用者的探索者,金山办公就是其中的佼佼者。 金山办公的策略十分务实,关注落地的场景,几乎与国内主流的 AI 大模型公司都达成了深度合作,包括 MiniMax、智谱 AI、商汤、文心一言、通义大模型等,自己则聚焦落地的场景。 金山扮演的角色就像分诊台,负责判断用户所有的问题和要解决的场景然后调用对应最适合的模型来执行任务。而一些小众场景则由金山办公的自研小模型补充满足需求。 比如商汤在数据分析上比较出色,WPS AI 就调用它处需要理科思维的场景。而像文字、PPT 等场景则通过智谱 AI 等模型来完成。 这样化整为零的大模型应用方式,好处是能充分发挥各模型的长处,实现优势互补,不会受到某个模型能力的限制。即便是 GPT-4,也有一些场景存在短板。 昨天的 WPS 发布会上,开场章庆元提到的一个点让我印象比较深刻。他说今天看到的所有功能,都是马上能体验,一定是落到客户真实的应用场景里的。 AI 除了在聊天框,在长文本处理不断内卷之外,还有什么更有想象力的应用方式?这是值得更多人去探索的,尽管目前大模型应用处于起步阶段,但像金山这样的 AI 应用主义者应该要多一些。
超越GPT-4V,苹果多模态大模型上新
【新智元导读】苹果开发的多模态模型Ferret-UI增强了对屏幕的理解和交互,在引用、基础和推理方面表现出了卓越的性能,这些增强功能的出现预示着巨大的进步。 一句话Siri就能帮忙打开美团外卖下订单的日子看来不远啦! 4月8日,苹果发布了其最新的多模态大语言模型(MLLM )——Ferret-UI,能够更有效地理解和与屏幕信息进行交互,在所有基本UI任务上都超过了GPT-4V! 论文地址:https://arxiv.org/pdf/2404.05719.pdf 虽然苹果前段时间经历了泰坦项目的沉没,但看目前的形式,这是又要开卷的节奏呀~ 不少人十分期待,这项技术如果在苹果的Siri上,Siri岂不是要变得聪明绝顶了! 众所周知,通用域多模态大型语言模型(MLLM )在理解和有效交互的能力方面往往不足。 而Ferret-UI被称之为是一种新的MLLM,专为理解移动UI屏幕而量身定制,具备指向、定位和推理等多种能力。 Ferret-UI能够通过灵活的输入格式(点、框、涂鸦)和基础任务(例如:查找小部件、查找图标、查找文本、小部件列表)在移动用户界面屏幕上执行引用任务(例如:小部件分类、图标识别、OCR) )。 Ferret-UI的一个关键特点是「任何分辨率」(anyres),该技术通过放大细节来解决UI屏幕中小型对象的识别问题,从而提高模型对UI元素的理解精度。 这些基本任务为模型提供了丰富的视觉和空间知识,使其能够在粗略和精细级别上区分 UI 类型, 例如区分各种图标或文本元素。 具体来说,Ferret-UI 不仅能够在详细描述和感知对话中讨论视觉元素, 还能在交互对话中提出目标导向的动作并通过函数推理来推断屏幕的整体功能。 网友直呼:泰裤辣! 虽然Ferret-UI-base紧密遵循Ferret的架构,但Ferret-UI-anyres融入了额外的细粒度图像功能。 特别是,预先训练的图像编码器和投影层可以为整个屏幕生成图像特征,对于基于原始图像长宽比获得的每个子图像,生成附加图像特征。 为了增强模型的推理能力, 研究人员编译了用于高级任务的数据集,包括详细描述、 感知/交互对话和函数推理。 在基础任务性能的比较上, Ferret-UI展现出了对UI屏幕的出色理解能力以及执行开放式指令的能力,表现可谓亮眼! 掌握应用程序屏幕并使AI像人类一样进行交互,苹果未来或许将改变MLLM的游戏规则! 论文细节 方法 Ferret-UI建立在Ferret的基础上。 Ferret是一种MLLM,擅长在形状和细节各异的自然图像中进行空间参照和定位。 它可以解释区域或对象并与之交互,无论这些区域或对象被指定为任何自由形状(点、方框等)。 它包含一个预先训练好的视觉编码器和一个纯解码器语言模型,并采用一种独特的混合表示技术,将指定区域转换为适合LLM处理的格式。 为了向Ferret灌输UI专业知识,他们对Ferret-UI进行了两个扩展: 1. UI参照和定位的定义与构建 2. 模型架构调整以更好地处理屏幕数据 与之前需要外部检测模块或屏幕视图文件的MLLM不同, Ferret-UI 是自给自足的。 它将原始屏幕像素作为模型输入,这种方法不仅促进了高级单屏交互,还为新应用程序铺平道路,例如:提高可访问性。 数据集 他们对iPhone和安卓设备的屏幕进行了研究。 对于安卓屏幕,研究人员使用RICO数据集的一个子集,具体来说,他们考虑了Spotlight中的任务,其数据是公开的,包括 screen2words、widgetcaptions 和 taperception。 对于iPhone屏幕,研究人员使用AMP数据集,它涵盖了广泛的应用程序。 在收集 Android 和 iPhone 屏幕后,他们使用预先训练好的基于像素的UI检测模型进一步从屏幕收集细粒度元素注 释。 对于每个检测到的用户界面元素,输出结果都包括用户界面类型(按钮、文本、图标、图片等)、相应的边界框,以及由Apple Vision Framework识别的显示在其上的文本(如果有的话)。 任务制定 首先从现有的Spotlight任务中获取screen2words、widgetcaptions和taperception,并将它们格式化为会话QA 对。 对于每个训练示例,他们都会对相应任务的提示进行采样,并将其与原始源图像和真实答案配对。 基础任务数据生成 除了Spotlight任务之外,他们将referring任务定义为输入中带有边界框的任务,而基础任务则是输出中带有边界框的任务。 对于每个任务,他们还使用GPT-3.5 Turbo来扩展基本提示以引入任务问题的变体。 数据生成的详细信息如下图所示。 高级任务数据生成 为了将推理能力融入到该模型中,他们使用LLaVA方法,并用GPT-4收集另外4种格式的数据。 首先对检测输出中的边界框坐标进行标准化,然后将检测、提示和可选的一次性示例发送到GPT-4。 为了详细描述和功能推理,他们将生成的响应与预选的提示配对来训练Ferret-UI。 下图说明了高级任务的训练数据生成过程。 以上数据的生成主要为4个任务,分别是:详细描述、对话感知、对话交互和功能推理。 其中,他们扩展了详细描述和函数推理的基本提示,将它们与GPT-4响应配对,作为模型训练中的输入数据。 对于对话任务,他们为GPT-4提供了一个上下文示例,以更好地遵循其输出中的边界框格式。 实验结果 初级任务的性能细分如下表所示。 可以看到,与Spotlight相比,Ferret-UI在S2W和 WiC方面表现出了优越的性能,尽管Spotlight使用了80M网页截图和269M手机截图进行预训练。Ferret-UI性能虽然低于TaP,但仍然具有竞争力。 高级任务性能的结果如下表所示。 尽管Ferret-UI的训练数据 集中缺少Android特定数据,但它在两个平台的高级任务上都表现出了值得称赞的性能。 这表明用户界面知识在不同操作系统之间具有显著的可转移性。 消融研究 研究发现,当仅使用高级任务数据,两个平台的性能均为64%。添加iPhone或Android基本任务 后,iPhone上高级任务的性能持续提高5%。 同样,从iPhone添加基本任务可将Android在高级任务上的性能提高约4%,而合并Android基本任务可将这一性能提高9%。 包含iPhone和Android基本任务后,iPhone 和 Android 高级任务的性能分别进一步提高了3%和5%,超出了单组基本任务所带来的改进。 这些观察结果支持他们的假设,即:基本任务为模型提供了增强的视觉和空间理解,从而促进了高级任务。 为了探索不同数据配置对Spotlight Tasks性能的影响,他们特别研究了添加初级任务数据是否能提高模型性能,因为这些任务的目的是为了提高对屏幕的视觉和空间理解能力。 如下表所示,添加基本任务数据(无论是仅来自Android、iPhone还是两者的组合)都不会显著改变三个Spotlight任务的性能。 在分析Ferret-UI 的参照功能时,他们特别关注OCR和小部件分类预测,如下图所示。 OCR分析揭示了三个值得注意的观察结果: 1. 模型预测相邻文本而不是目标区域中的文本 2. 该模型表现出预测实际单词的倾向,而不仅仅是破译屏幕上显示的字符。 3. Ferret-UI展示了准确预测部分被截断的文本的能力,即使在OCR模型返回不正确文本的情况下也是如此。 参考资料: https://arxiv.org/abs/2404.05719
英特尔Gaudi 3发布性能不输H200 AI PC进入“百TOPS”算力时代
集微网报道 “当前,围绕AI的创新正以前所未有的速度发展,每家公司都在加速成为AI公司,这一切都需要半导体技术提供支持。从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。我们将再次改变世界!” 4月9日,在美国亚利桑那举办的“Intel Vision 2024”上,面对AI所带来的机遇,英特尔CEO基辛格说出上述豪言壮语。 在此次大会上,英特尔宣布推出全新一代AI加速芯片Gaudi 3,数据中心处理器Xeon6以及下一代酷睿Ultra客户端处理器家族(代号Lunar Lake),集中展示了其在AI方面的强大创新能力。 AI PC进入100TOPS时代 今年出货4000万台 英特尔首次提出AI PC概念,在去年底举行的主题为“AI Everywhere”发布会上,英特尔正式推出面向AI PC的处理器产品——代号Meteor Lake的酷睿Ultra。 酷睿Ultra被英特尔视为40年来最大的架构转变,采用分离式模块架构,首次采用Intel 4制程工艺,也是首个集成NPU的英特尔CPU,整体AI算力34TOPS,可支持200亿大模型在终端运行。 基辛格表示,英特尔酷睿Ultra处理器为生产力、安全性和内容创作提供了全新能力,并为企业焕新其PC设备提供了巨大动力。截至目前,AI PC出货超过500万台,预计2024年将出货4000万台,以及超过230种的设计,覆盖轻薄PC和游戏掌机设备。 基辛格介绍,英特尔将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族(代号Lunar Lake),将具备超过100 TOPS平台算力,以及在神经网络处理单元(NPU)上带来超过46 TOPS的算力。相比于上一代产品,AI性能提升3倍。 目前,行业对于AI PC所具备的算力要求一般在40TOPS左右,如高通去年年底推出的45TOPS算力的 Snapdragon X Elite平台,以及AMD的锐龙8040移动处理器的39TOPS等,而此次英特尔推出的新一代的酷睿Ultra,将首次实现AIPC的平台整体算力突破100TOPS,显著提升AI PC的能力表现,也为AI PC注入更多创新的可能。 此外,英特尔发布了涵盖英特尔酷睿Ultra、英特尔®酷睿™、英特尔凌动®处理器和英特尔锐炫™显卡系列产品在内的全新边缘芯片,主要面向零售、工业制造和医疗等关键领域。英特尔边缘AI产品组合内的所有新品将于本季度上市,并将在今年年内获得英特尔Tiber边缘平台的支持。 Gaudi 3性能不输H200 Q3上市 去年英特尔Gaudi 2加速器发布时便引发广泛关注,被视为AI领域英特尔向英伟达发起冲击的信号。 此次发布的Gaudi 3采用5nm工艺,具有64个第五代张量处理核心和8个矩阵计算引擎,采用128GB 速率达 3.7TB / s 的 HBM2e 内存和 96MB 速率达 12.8TB / s的SRAM,还具有24个200 Gbps以太网 RDMA NIC以及最高 16 条 PCIe 5.0 总线。 Gaudi 3 可以支持基于还支持多模态、大语言模型、文本/图片生成、翻译、问答等常见 AI 功能。 在软件生态方面,英特尔 Gaudi 3 针对生成式 AI 提供端到端全栈 AI 软件解决方案,包括嵌入式软件、软件套件、AI 软件、AI 应用。 英特尔称,与英伟达H100芯片相比,训练性能提高170%,推理能力提高50%,能效平均提高40%,运行人工智能模型的速度是H100的1.5倍。此外,英特尔表示,Gaudi 3将与英伟达最新的H200大致相当,在某些领域甚至表现更好。 据了解,和上一代产品相比,Gaudi 3的FP8性能提升两倍,BF16 性能提升四倍,网络带宽提升两倍,内存带宽提升1.5倍。Gaudi 3的产品线包括加速卡HL-325L,PCIe CEM以及服务器主板HLB-325。 英特尔Gaudi 3提供开放的、基于社区的软件和行业标准以太网网络,允许企业灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。按照计划,英特尔将于2024年一季度将率先推出Gaudi 3 风冷版样品,二季度推出液冷版样品,并今年第三季度通过 OEM 系统大批量上市。 Xeon6焕新 性能能效双路出击 英特尔至强处理器为运行当前的生成式AI解决方案提供了性能高效的解决方案,包括使用专有数据生成特定业务结果的RAG。同时,英特尔还为面向数据中心、云和边缘的下一代处理器进行了品牌焕新,即英特尔至强6。 此次大会上,英特尔宣布为其数据中心 CPU 产品组合推出了全新品牌命名:原代号为 Granite Rapids 和 Sierra Forest 的芯片现在将被称为 "Xeon 6" 系列。这些芯片计划于今年上市,并将支持全新性能提升的标准化 MXFP4 数据格式。 英特尔在去年公布了其2023-2025年至强(Xeon)处理器路线图中,显示未来至强系列处理器将分为P-Core和E-Core两个系列产品线,前者就是之前传统的至强系列,后者是新增加的能效架构,将提供更好的电源效率。Xeon6是首次采用Inte3制程工艺的产品。 据了解,配备性能核的英特尔至强6处理器(此前代号为Granite Rapids):包含了对MXFP4数据格式的软件支持,与使用FP16的第四代至强处理器相比,可将下一个令牌(token)的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。 而配备能效核的英特尔至强6处理器(此前代号为Sierra Forest),相比于第二代至强,机架密度提高2.7倍,机架数量从200个减少到72个;客户能以近3:1的比例替换旧系统,大幅降低功耗,每年能够节省100万瓦能耗。 英特尔方面表示,配备能效核(E-cores)的英特尔至强6处理器将于2024年第二季度推出,提供卓越的效率,配备性能核(P-cores)的英特尔至强6处理器将紧随其后推出,带来更高的AI性能。 此次会以上,通过超以太网联盟(UEC),英特尔正在驱动面向AI高速互联技术(AI Fabrics)的开放式以太网网络创新,并推出一系列针对AI优化的以太网解决方案。这些创新旨在革新可大规模纵向(scale-up)和横向(scale-out)扩展的AI高速互联技术,以支持AI模型的训练和推理,这些模型的规模日益庞大,每一代都会增长一个数量级。英特尔的产品组合包括英特尔AI网络连接卡(AI NIC)、集成到XPU的AI连接芯粒、基于Gaudi加速器的系统,以及一系列面向英特尔代工的AI互联软硬件参考设计。 此外,英特尔联合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz共同宣布,将创建一个开放平台助力企业推动AI创新。这一凝结全行业力量的计划旨在开发开放的、多供应商的生成式AI系统,通过RAG(检索增强生成)技术,提供一流的部署便利性、性能和价值。RAG可使企业在标准云基础设施上运行的大量现存专有数据源得到开放大语言模型(LLM)功能的增强。
Redmi Turbo 3哈利·波特版发布:售价2699元
凤凰网科技讯(作者/李军) 4月10日晚,小米集团旗下品牌Redmi召开新品发布会,正式发布Turbo系列的首款产品Redmi Turbo 3以及Redmi首款Pro级平板Redmi Pad Pro,同时发布的还有两款深度定制产品Redmi Turbo 3哈利·波特版和Redmi Pad Pro哈利·波特版,Redmi Turbo 3哈利·波特版售价2699元。 Redmi Turbo 3作为Turbo系列的首款产品,其搭载的第三代骁龙8s旗舰平台由台积电4nm工艺打造,采用最新一代CPU架构,搭配LPDDR5x+UFS4.0最新一代存储架构,安兔兔跑分高达175万。基于第三代骁龙8s领先的AI能力,Redmi与高通深度联调,率先打造“主动视觉感知系统”,实现AI隔空手势交互,并带来AI通话降噪、AI网络以及多项基于AIGC的智能玩法。 据悉,Redmi Turbo 3整机厚度仅7.8mm、重179g,同时整机采用了金刚骨骼架构,通过了SGS五星抗跌耐摔认证。正面四窄边设计,搭载最新一代1.5K中国屏,峰值亮度达到2400nit,支持1920Hz高频PWM调光。5000万像素索尼相机支持OIS光学防抖。5000mAh大电池支持90W快充,首次搭载 3.0V 低电压关机技术,实测在-20℃低温环境下,Turbo 3视频播放时长相比上代提升幅度达68%。 据介绍,Turbo系列的首款产品Turbo 3源自Note 11T Pro、Note 12 Turbo两代性能产品的探索,搭载第三代骁龙8s旗舰平台。 Redmi Pad Pro是Redmi首款Pro级平板,搭载12.1英寸2.5K高刷护眼LCD大屏,搭载小米澎湃OS,支持跨端智联,以及PC无线副屏、键鼠共享、5G网络共享及跨设备相机等旗舰功能。 Redmi Turbo 3将于4月15日上午10点正式发售,12GB+256GB版1999元、12GB+512GB版2299元、16GB+512GB版2499元、16GB+1TB版 2799元。Redmi Pad Pro 6GB+128GB版1499元 、8GB+128GB版1599元、8GB+256GB版1799元。 本次发布会上,Redmi再度与哈利·波特合作,推出了全新的Redmi Turbo 3哈利·波特版。手机采用了金色与暗色的撞色设计,并以独特的铂金浮雕工艺呈现了霍格沃茨院徽、荧光闪烁咒以及黑魔法魂器等元素,呼应了魔法世界黑暗与光明斗争的故事。 一同亮相的还有全球首款哈利·波特定制平板——Redmi Pad Pro哈利·波特版。 两款定制产品将于4月15日10:00发售,Redmi Turbo 3哈利·波特版售价2699元,Redmi Pad Pro哈利·波特版售价2299元。 此外,多款智能生态产品也一同发布。小米开放式耳机售价699元,首发649元,小米电视S 85 Mini LED首发5999元,米家空调 巨省电Pro首发2399元,米家空调 自然风Pro首发2799元、米家空调 新风Pro首发3399元。
耐用,怎么就成了手机的新卖点?
这是一台三防手机:防尘、防水、防摔。 从外形就能看出,它很能打,也很抗造。 AMG 的旗舰机 G2 GT,标配 7000mAh 大电池、500m 视野热成像仪、IP69K 防水认证、 1.5 米 1000 次跌落轻松通过…… 溢出的防护性和体积重量,注定了以其为代表的三防手机,只适合在户外、探险、工业等场景下使用,而并不会面向大众市场。 而 OPPO 却想突破传统细分市场的隔阂:用组装「特种设备」的思路,做出了一台大众手机——A3 Pro。 OPPO A3 Pro,千元机中的肌肉男 OPPO 当前一共有四个系列在售: Find X Reno K A 即将于 4 月 12 日发售的 A3 Pro 属于入门系列,价格区间在 1000-2000 元。 OPPO 在本次发布会前的预热一反常态,友商都在大谈特谈影像、大屏、AI 等产品特点时,它们则是把「耐用」放在了最显要的位置,试图将不寻常的「三防」天赋,带到寻常百姓家。 并且,还在 A3 Pro 上拆分出了 3 个细分卖点:「超防水」「超抗摔」「超耐用」。 先说防水,因为 A3 Pro 的防水等级,真的比较罕见。 官方宣传,这台新机支持最高 IP69 级别的防水,这和开头那台 G2 GT 的防水效果所差无几。 IP 指的是国际通用防护标准「GB/T 4208-2017 外壳防护等级」。 从左到右的第一个数字代表「防尘等级系数」,6 级能完全防尘(另一种说法是防细密粉尘)。 最后一位数字代表「防水等级系数」, 9 级能防高温高压水柱。手机行业里目前顶配的 IP68 一般指「可在 1.5m 水深下存留不超过 30min」。 OPPO 这次对防水效果非常有信心,连发三条微博介绍了 A3 Pro 同时具备 IP69 · IP68 · IP66 三个防水标准,并作了官方解释: IP69=支持防高压喷热水 IP68=支持防泡水 IP66=支持防强烈喷水 从官方的口吻里,我们看到了一台「与水绝缘」的 A3 Pro,并且这还只是个开始。 A3 Pro 的第二大亮点叫「超抗摔」,整台手机从里到外,几乎都和抗摔扯不上关系。 从官方认证看,OPPO A3 Pro 获得了 SGS(民间私营机构,非官方强制标准)的金标五星整机抗跌耐摔认证,并取得满分;而且还同时通过了国家军用标准抗冲击测试。 从硬件配置看,A3 Pro 的正面玻璃用上了 OPPO 旗舰系列的同款,相较于上代抗摔能力提升 180%,抗划伤能力提升 300%;背板玻璃则是配备了 OPPO 首发的「晶盾玻璃」,抗摔能力较同档位产品提升 160%。 从内部结构看,A3 Pro 首次采用 OPPO 的超抗摔金刚石架构,手机里的主板、零部件都为抗摔重新设计布局。 总之,OPPO 打造了一台和主流千元机格格不入的产品,它们没有面面俱到地介绍 A3 Pro,就只抓住了「耐用」这一个特性,并把它讲得很透彻。 都说好钢用在刀刃上,在 OPPO 看来,A3 Pro 的刀刃就是经得起造,回顾一下上面的宣传语,你很难相信这是一台发布在 2024 年的手机,这种「All in 耐用」的策略,甚至都很难相信这是一台手机应该具备的特性。 可是,「耐用」真的有用么? 耐用的手机,耐得住考验? 每个手机品牌都会为旗下的各类机型贴上不同的标签,这也往往代表着一个系列产品的「性格」。 华为的 Mate 系列主打商务,P 系列是影像旗舰;OPPO 和 vivo 两兄弟以人像摄影独占一个山头;小米数字系列从性价比起家,又在冲击高端撕掉标签的路上摸爬滚打了好些年。 而苹果呢,已经把「苹果」二字做成了一种个性:雷打不动,我行我素。 这次,OPPO 在 A3 Pro 上选择了「耐用」的标签,甚至试图「耐用王者」的官方名称,把这种印象牢牢焊死在自己的 DNA 里,上一个这么做的,还是诺基亚。 从 1996 年到 2011 年,诺基亚引领了全球手机市场将近 15 年,市场份额甚至在 2007 年达到前所未有的 50.9%。 当年诺基亚能打造出一个全球范围内的手机「王朝」,核心原因有三: 能拿来开核桃的结实 不可能存在焦虑的续航 百花齐放、绝不重样的产品更新 可是,当把 20 年前的成功结论放在今天的手机市场,反而会成为杀死品牌的罪魁祸首。 产品延续性设计,是目前判断一个系列机型成功与否的重要标准。苹果、三星、华为和小米等出货量名列前茅的厂家,在旗舰机型上都有一致性的设计语言,而且不会轻易改变。 全面屏在开启了移动互联网和智能手机时代后,集众多功能于一身,成为了我们生活中不可或缺的一部分,当然也不可能指望还有当年智能接打电话、接发信息的单一功能机的续航。 而结实耐用,则和目前的消费电子品不太沾边,并且智能手机行业向来都比较抵触这个特点。 消费电子产品有两大特性:首先要找到用户诉求,消费者买单才能卖的出去;其次产品也是消耗品,有复购才有未来。 智能手机作为消费电子领域的核心产品,厂家其实并不太在意耐用度,反而希望用户在用坏之前就换机。 手机系统半年一大更,两月一小更;手机电池变大了,但电池健康也随着屏幕使用时长的飙升而衰减;芯片公司也在夜以继日地追赶着马上到达边际的「摩尔定律」;设备存储空间变大了,但并不「小而美」的 App 和十几兆一张的高质量照片,让 256GB 手机空间都略显局促。 许多人几个月前才买的最新旗舰机型还没玩儿明白,过两个月又要出下一代了。 没有厂家会承认「计划报废」的说法,但这一切被打上「技术爆发增长」标签的手机迭代,好像都在催着我们:你 out 了,快跟上节奏! 根据 IDC 的数据报告,2023 年全球智能手机出货量同比下降 3.2%,降至 11.7 亿部,这是十年来最低的全年出货量。 这还是在各大厂商都铆足劲更新产品、优化细分市场、高端下沉市场两手抓的情况下,所取得的战绩。 处在手机市场「冰河时期」,谁不奔跑、谁不进步,谁就会成为消费电子历史课本里的吉祥物。 在这样的大环境下,还要继续强调「耐用」的 A3 Pro,好像选错了时间,也选错了路线。 但,以上这些都只是厂家的视角,当我们坐在消费者的位子上,就会发现最没用的「耐用」,可能才是智能手机的新卖点。 有人在装睡,有人很清醒 随着消费者的购买选择越来越务实,我们注意到,大众用户对于更持久、更可靠的手机使用体验的需求日益增长。 OPPO 中国区总裁刘波,在 OPPO A3 Pro 的宣传信里强调,耐用性是用户导向的结果,也成为了许多大众用户在选择手机时的首要考量。 当 2016 年智能手机销量见顶,换机周期逐渐拉长之后,耐用与否的意义就变得愈发重要。 第一重要的就是电池耐久度和健康度,甚至电池健康度成为了 iPhone 二手价格的决定性因素之一。 再者,手机厂商开发的新材料和新结构,也让手机变得更加耐用,比如 iPhone 的超磁晶玻璃,康宁的 Victus 2 玻璃,华为的昆仑玻璃和玄武架构,还有每次发布会非重点但必提及的防水防尘功能。 哪怕是存量用户不多的小众折叠屏,也会把柔性屏幕的折叠次数,还有铰链的强度和耐用性,拎出来重点介绍。 所以耐用在手机卖点里的优先级,开始变得越来越高。 市场调研机构 TechInsights 的报告显示,2023 年全球智能手机换机周期继续拉长到历史最长的 51 个月,中国消费者换得更勤一些,但也超过 40 个月。 也就是说,许多消费者 4 年多才会换一次手机。 怒喵 CEO 李楠曾发文表示,这就是旗舰芯片性能过剩的最好证明。早些年大家的换机周期一般都是 1~2 年,因为当时手机的性能还跟不上用户的实际需求,最多用个 3 年老款机型就会变得非常卡顿,加上系统版本的升级,手机也就不得不换了。 如今手机性能的全面溢出,又成了用户逐渐成为「老款钉子户」的根本原因。 所以,比起厂家期望的「每年换新机」的目标,增加用户黏性,让大家长久使用一个品牌的手机,才是更重要的事。 除了 AGM 这类户外手机,大众消费品手机甚少把耐用作为第一卖点,A3 Pro 选择打这个点,意味着面对换机周期越来越长,长到三四年之久,终于有厂商开始转变思路: 既然无力驱动换机,特别是入门手机的换机,那不如换个思路,给你一个耐用的手机,安心让用户不换机。 并且,A 系列的用户,是价格敏感型用户,同时也意味着对换机成本更为谨慎的用户。随着曲面屏大规模下放到中低端机型,碎屏更换的成本也更高,因此耐用或许真是客群的第一需求。 那么现在,把 A30 Pro 的耐用变成卖点,只剩最后一道坎儿: 如何化解耐用和复购之间的矛盾? 2002 年,洞洞鞋鼻祖 Crocs 在美国的一场游艇展上正式亮相,200 双库存在现场销售一空。 2007 年,Crocs 盈利高达 1.682 亿美元,从蹒跚学步的宝宝到上了年纪的奶奶,都穿上了 Crocs 的洞洞鞋。这股风,也刮到了大洋彼岸的中国,各种颜色的「新式凉鞋」一时间走进大街小巷。 仅一年后,Crocs 被曝全年亏损 1.85 亿美元,其股价也下跌了 76%。由于 Crocs 在上市前的 4 年里,已经赚了 8 亿美元,上市后股价几乎翻了 3 倍,被眼前盛世冲昏头的管理层开启了产品线扩张和收购计划,也开启了 Crocs 创办以来的第一次低谷,并且持续了 10 年之久。 业内人士指出,Crocs 的销量下滑的确与其无序扩张有关,但产品本身的卖点却是其跌入谷底的重要原因: 洞洞鞋只适合在夏天穿,冬天不会有人买,销售有周期性 Crocs 的质量非常好,甚至宣称一双能穿一辈子,使得消费者复购受阻,导致产品滞销 对于消费者来说,以上两个还有可能成为复购的诉求点,但 Crocs 洞洞鞋自打诞生以来的一个缺陷,是许多人都无法忍受的点:丑。 《TIME》将 Crocs 评为 50 项最糟糕的发明之一,《洛杉矶时报》形容它是「地球上最难看的物体之一」的鞋; 《Maxim》则将其列入 2007 年发生在男人身上最坏的 10 件事之一; Facebook 成立了「让我们烧掉 Crocs!」的小组。 出圈因其丑的特别,衰落因其特别的丑。 所以,Crocs 意识到「如何让更多人接受这个丑鞋」才是当务之急。 16 年,时尚设计师 Christopher Kane 在洞洞鞋上点缀上宝石,带上了秀场;18 年巴黎世家给 Crocs 配上了 10 厘米的厚底,并穿上了时装周;21 年, Crocs 与前 YEEZY 设计师、前 Versace 球鞋设计师 Salehe Bembury 合作推出了 Pollex Clog,让洞洞鞋也当了一段时间二级市场的硬通货…… 虽然众人对 Crocs 的评价依然褒贬不一,即使它还是不那么好看,但「廉价感」已经在这些年的联名合作中,逐渐从洞洞鞋上消失。 回到中国市场,Crocs 与当红明星的合作,主打青年人时尚路线,在小红书的大量 DIY,那双当年「透气耐穿」的拖鞋摇身一变,成了年轻时尚的一种选择。 价格便宜和耐用并不是影响复购的原罪,廉价感才是。 所以,回头看看这台 OPPO A3 Pro,官方强调的是它很耐用,这是里子;官方没说的是它的设计,这是面子。 A3 Pro 不丑,甚至有着超越价格的大气:曲面屏,玻璃背板,顶配甚至有素皮。 手机厂商在冲击高端万元机的同时,还能把千元价位的产品做出体面感,对于消费者最大的意义在于:平时用着不担心,拿着出去不掉价。 这可能就是,耐用也能成为手机卖点的原因。
超越英伟达H100!英特尔Gaudi3发布:训练快40%,推理快50%!
北京时间4月9日晚间,英特尔在美国召开了“Intel Vision 2024”大会,介绍了英特尔在AI领域取得的成功,并发布了新一代的云端AI芯片Gaudi 3及第六代至强(Xeon)可扩展处理器,进一步拓展了英特尔的AI产品路线图。 AI芯片市场的巨大机遇 在生成式AI持续爆发背景之下,市场对于AI芯片的需求正高速增长。根据市场研究机构Gartner最新预测,到2024年AI芯片市场规模将较上一年增长 25.6%,达到671亿美元,预计到2027年,AI芯片市场规模预计将是2023年规模的两倍以上,达到1194亿美元。 英特尔也表示,到2030年,半导体市场规模将达1万亿美元,人工智能是主要推动力。创新技术正在以前所未有的速度发展,每家公司都在加速成为AI公司,这一切都需要半导体技术提供支持。从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。 在边缘AI市场,英特尔已经发布了涵盖英特尔酷睿Ultra、英特尔酷睿、英特尔凌动处理器和英特尔锐炫显卡系列产品在内的全新边缘芯片,主要面向零售、工业制造和医疗等关键领域。英特尔边缘AI产品组合内的所有新品将于本季度上市,并将在今年年内获得英特尔刚刚发布的Intel Tiber边缘解决方案平台的支持,以简化企业软件和服务的部署,包括生成式AI。 对于去年推出的面向AI PC产品的英特尔酷睿Ultra处理器,凭借强大的AI内核,为生产力、安全性和内容创作提供了全新能力,并为企业焕新其PC设备提供了巨大动力。英特尔预计将于2024年出货4000万台AI PC,以及超过230种的设计,覆盖轻薄PC和游戏掌机设备。 同时,英特尔透露将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族(代号Lunar Lake),将具备超过100 TOPS平台算力,以及在神经网络处理单元(NPU)上带来超过46 TOPS的算力,从而为下一代AI PC提供强大支持。 在面向云端的数据中心市场,英特尔在2022年就推出了AI加速芯片Gaudi 2,在去年年底还推出了集成了AI内核的代号为“Emerald Rapids”的面向数据中心的第五代 Xeon处理器。 英特尔公司首席执行官帕特·基辛格表示:“创新技术正在以前所未有的速度发展,每家公司都在加速成为AI公司,这一切都需要半导体技术提供支持。从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。英特尔最新的Gaudi、至强和酷睿平台将提供灵活的、可定制化的解决方案,满足客户和合作伙伴不断变化的需求,把握住未来的巨大机遇。” Gaudi 3:BF16性能提升4倍,支持1800亿参数大模型 而在云端AI加速芯片市场,英特尔早在2019年12月就斥资20亿美元收购Habana Labs(其于2019 年 7 月推出了 Gaudi 1 加速器),虽然当时英伟达在AI芯片市场的体量还很小,但是在AI芯片的技术积累上,英伟达更为深厚。因此,我们可以看到,当2022年Gaudi 2 推出之时,其也只能与英伟达A100进行对标。 为了进一步加强在云端AI加速芯片市场的竞争力,在此次“Intel Vision 2024”大会上,英特尔正式推出了全新的Gaudi 3。虽然整体得到了大幅提升,但是依然只能是与英伟达上一代的H100/H200竞争。 据介绍,Gaudi 3采用的是台积电5nm工艺,在芯片设计上,Gaudi 3转向了具有两个计算集群的Chiplet的设计,而不是Gaudi 2所采用的单个集群的方案。 Gaudi 3 拥有 8 个矩阵数学引擎、64 个张量内核、96MB SRAM(每个Tile 48MB,可提供12.8 TB/s的总带宽) 和 128 GB HBM2e 内存,16 个 PCIe 5.0 通道和 24 个 200GbE 链路 。在计算核心的周围,则是八个HBM2e内存堆栈,总容量为128 GB,带宽为3.7 TBps。 与上一代的Gaudi 2 相比,Gaudi 3在BF16工作负载方面的性能将是Gaudi 2的四倍,FP8性能也将是Gaudi 2 的两倍,网络性能也是Gaudi 2的两倍(Gaudi 2是24个内置的100 GbE RoCE Nic),HBM容量是Gaudi 2的1.5倍。 另外,Gaudi 3 设备中的张量内核支持与 Gaudi 32 相同的 FP32、TF32、BF16、FP16 和 FP8 数据格式,并且不支持 FP4 精度。相比之下英伟达新的Blackwell GPU 将支持 FP2 精度,而英伟达现有的 Hopper GPU 则不支持。 英特尔表示,Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。此外,在Llama 7B、70B和Falcon 180B大型语言模型(LLM)的推理吞吐量和能效方面也展现了出色性能。 尽管Gaudi 3 与英伟达的Blackwell GPU有着很多相似之处,但英特尔旗下Habana首席运营官Eitan Medina强调,这不是GPU。“GPU传统上是被设计为进行图形渲染,是关于渲染像素的,所以自然而然地,选择实现许多小的执行单元,因为像素就是像素”,他解释道。“图形渲染不需要巨大的矩阵乘法。而Gaudi3 是使用数量较少的非常大的矩阵数学引擎构建的,这些引擎能够更有效地处理 AI 工作负载。” 虽然Gaudi 3是英特尔最新一代的AI加速芯片,相比上一代的Gaudi 2带来了很大的提升,但是其仍然难以与英伟达最新的B200或者AMD最新的MI300X系列竞争。显然,英特尔Gaudi 3 的主要对标的也是英伟达H100/H200。 训练性能比英伟达H100快了40%,推理快了50% 根据英特尔官方公布的数据显示,Gaudi 3 在流行的大语言模型(LLM)训练速度方面,比英伟达H100平均快了40%;在流行大模型的推理能效表现上,比如英伟达H100领先50%。 具体来看,英特尔 Gaudi 3 与英伟达 H100 在相同节点数量下,相关大模型训练时间对比上最高快了1.7倍,其中,LLAMA2 70 亿参数对比有 1.5 倍于 H100 的优势,LLAMA2 130 亿参数最高有 1.7 倍的优势,GPT 3 1750 亿参数有 1.4 倍优势。 在大模型推理速度表现上,Gaudi 3 相比 H100 平均快了1.5倍,最高快了4倍。 在大模型推理能效表现上,Gaudi 3 相比 H100 最高提升2.3倍。 在更高性能的能效表现上,Gaudi 3 相比 H100 最高也提升了2.3倍。 从具体的芯片性能方面来看,Theregister的报道显示,Gaudi 3 的密集的浮点性能为1,835 teraFLOPS ,而英伟达则依靠稀疏性来实现其公布的4 petaFLOPS性能。考虑到这一点,Gaudi3 仅比 H100 慢了约 144 teraFLOPS,同时提供了更多的HBM内存容量。 而在半精度(FP16/BF16)下,Gaudi 3 可以实现相同的1,835 teraFLOPS性能,使其比英伟达H100领先了1.85 倍,比AMD MI300X 领先了 1.4 倍。但是,Gaudi 3不支持稀疏性。 “稀疏性是经过大量研究的东西,但我们并不依赖它,”Medina补充说,英特尔“没有立即计划”在 Gaudi 3 上启用稀疏性以进行训练或推理。 由于浮点性能只是 AI 性能对标的一个指标,HBM内存带宽在决定AI性能方面也起着巨大的作用,尤其是对于较大模型来说。 目前英伟达B200和AMD MI300X都配备了192GB HBM3e/HBM3,英伟达上代的H200也配备了141GB HBM3。显然,Gaudi 3在这方面是相对落后不少的,仅比H100多一些,但还是较旧的HBM2e,这也使得其在HBM内存带宽上仅有3.7 TBps,远低于英伟达H200的4.8 GBps 和 AMD MI300X的 5.3 TBps。 对此,Medina解释称,继续使用HBM2e的决定,是因为风险管理。“我们的只使用在流片之前已经在芯片中得到验证的IP。在我们流片Gaudi 3 时,还没有经过验证符合我们标准的可用物理层。” 大规模互联 无论是 FP8 还是 FP16/BF16,一个大语言模型在多个AI加速器上运行并不罕见。例如,要在 FP16 上推理一个 1750 亿参数的大模型,至少需要五个 80GB HBM内存的 H100 才能将模型放入其中。 为此,英伟达 和 AMD 分别使用称为 NVLink 和 Infinity Fabric 的专用互连器,它们提供大约 900 GBps 的带宽,将八个或更多AI加速器拼接在一起。相比之下,英特尔Gaudi3 使用的是常规的旧RDMA融合以太网(ROCe)。 但是,Gaudi 3具有 24 个 200GbE 接口,总带宽为 1.2 TBps。24 条链路中有 3 条专用于节点外通信,剩余 1 TBps 用于服务器内的芯片到芯片通信。 这样做有几个好处。首先,从理论上讲,Gaudi 3系统应该简单得多,因为它们需要更少的组件。在典型的 英伟达 或 AMD 系统中,每个 GPU 至少有一个用于计算网络的 NIC。 英特尔认为,通过将以太网网卡集成到其Gaudi 3 加速器中,使用传统的骨干叶架构扩展以支持 512 甚至 1,024 个节点集群也更容易。 △要获得 512 个服务器节点上的 4,096 个 Gaudi 3 加速器,需要构建 32 个子集群,并将 96 个叶交换机与三组 16 个主干交换机交叉链接,这将为您提供三种不同的路径,通过两层网络将任何 Gaudi 3 链接到任何其他 Gaudi 3。 软件生态 软件生态方面,英特尔 Gaudi 3 针对生成式 AI 提供端到端全栈 AI 软件解决方案,包括嵌入式软件、软件套件、AI 软件、AI 应用。 Gaudi 3 可以支持基于还支持多模态、大语言模型、增强检索生成核心能力的 3D 生成、文本生成、视频图片生成、内容总结、翻译、问答、分级等常见 AI 功能。 依靠丰富的 AI 软件生态,Gaudi 3 也支持常见的 AI 框架库、使用场景和工具,并对有代表性的模型进行支持。英特尔还提供 Gaudi 软件套件,提供对底层硬件的支持。 Gaudi 3提供开放的、基于社区的软件,以及行业标准以太网网络,可以灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。 三种形态产品 对于Gaudi 3 硬件,英特尔提供了OAM兼容夹层卡(Mezzanine Card)、通用基板(Universal Baseboard)、PCle加速卡三种形态产品。 Gaudi 3 Universal Baseboard有些类似英伟达DGX H100,集成了八个Gaudi 3芯片。 三季度交付 英特尔在 Vision 2024 上也公布了 Gaudi 3 生产节点,2024 年一季度将率先推出风冷版样品,二季度推出液冷版样品,并在今年第三、第四季度分别批量交付风冷版和液冷版。 在此基础上,英特尔也宣布 Gaudi 3 今年下半年可在英特尔 Developer Cloud 获得。除了英特尔 Gaudi 3 加速器之外,英特尔还提供了关于其在企业 AI 各个领域的下一代产品和服务的更新。 OEM供应商及行业客户 Gaudi 3 硬件将由戴尔、惠与、联想和超微四家 OEM 厂商提供。 目前,英特尔Gaudi加速器的行业客户及合作伙伴有NAVER、博世(Bosch)、IBM、Ola/Krutrim、NielsenIQ、Seekr、IFF、CtrlS Group、Bharti Airtel、Landing AI、Roboflow、Infosys,等等。 第六代至强可扩展处理器“Xeon 6” 继去年12月英特尔正式推出了集成NPU内核的代号为“Emerald Rapids”的第五代至强(Xeon)可扩展处理器之后,英特尔此次正式公布了第六代Xeon处理器,英特尔将其重新命名为了“Intel Xeon 6”系列。 和之前曝光的信息一样,Intel Xeon 6系列拥有基于性能核(P-core)的 Xeon 6(此前代号为Granite Rapids)和基于能效核(E-core)的 Xeon 6(此前代号为Sierra Forest)两个系列。 其中,配备能效核的英特尔至强6处理器具有144 核和 288 核的两种配置,相比第二代英特尔 Xeon 处理器,每瓦性能提高了 2.4 倍,并且机架密度提高了 2.7 倍。 对于英特尔的客户而言,可以以接近 3 比 1 的比例替换老旧系统,大幅降低能耗,推动实现可持续发展目标。 配备性能核的英特尔至强6处理器则包含了对MXFP4数据格式的软件支持,与使用FP16的第四代至强处理器相比,可将下一个令牌(token)的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。 △英特尔CEO基辛格展示Sierra Forest与Granite Rapids晶圆 英特尔表示,配备能效核的英特尔至强6处理器将于2024年第二季度推出,提供卓越的效率,配备性能核的英特尔至强6处理器将紧随其后推出,带来更高的AI性能。 生态系统联合共建开放平台 此外,英特尔还宣布联合Anyscale、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、SAS、VMware、Yellowbrick、Zilliz等伙伴,共同创建一个开放平台,助力企业推动AI创新。 该计划旨在开发开放的、多供应商的AIGC系统,通过RAG(检索增强生成)技术,提供一流的部署便利性、性能和价值。RAG可使企业在标准云基础设施上运行的大量现存专有数据源得到开放大语言模型(LLM)功能的增强。 初始阶段,英特尔将利用至强处理器、Gaudi加速器,推出AIGC流水线的参考实现,发布技术概念框架,并继续加强Intel Tiber开发者云平台基础设施的功能。 另外值得一提的是,通过超以太网联盟(UEC),英特尔正在驱动面向AI高速互联技术(AI Fabrics)的开放式以太网网络创新,并推出一系列针对AI优化的以太网解决方案。这些创新旨在革新可大规模纵向(scale-up)和横向(scale-out)扩展的AI高速互联技术,以支持AI模型的训练和推理,这些模型的规模日益庞大,每一代都会增长一个数量级。英特尔的产品组合包括英特尔AI网络连接卡(AI NIC)、集成到XPU的AI连接芯粒、基于Gaudi加速器的系统,以及一系列面向英特尔代工的AI互联软硬件参考设计。
欧美急眼!中国传统芯片逆袭全球市场
在全球半导体产业的大棋盘上,中国传统芯片近年来异军突起,犹如一颗璀璨的新星,引领着全球芯片市场的新潮流。而这场“芯片大战”的硝烟,也随着欧美国家的紧张反应,逐渐弥漫开来。 在全球化的今天,中国传统芯片的成功并非偶然。多年来,中国在半导体领域持续投入,积极培养本土人才,引进国际先进技术,逐步构建起完整的产业链条。正是这份坚持与努力,让中国传统芯片在全球市场上占据了一席之地。 然而,中国传统芯片的崛起,无疑触动了欧美国家的神经。他们意识到,这个东方的巨人正在悄然改变全球半导体市场的格局。于是,一场针对中国传统芯片的围攻悄然展开。 最近,美国和欧盟在高级别会议上达成了重要协议,旨在联合应对中国在传统半导体领域的强势崛起。美国商务部长雷蒙多和美国贸易代表戴琪等高官的参与,彰显了此事的重要性。他们公开表示,中国传统芯片产业获得了巨额补贴,占据了全球高达60%的市场份额,这种市场集中度对全球供应链可能构成风险。 面对欧美的指责,我们不禁要问:中国传统芯片产业究竟是如何在全球市场中脱颖而出的?答案显而易见,中国在传统芯片领域拥有完整的产业链、庞大的市场需求以及政府的大力支持。这些因素共同推动了中国传统芯片产业的快速发展,也让全球消费者享受到了性价比极高的产品。 欧美国家的担忧并非空穴来风。他们计划通过一系列反制措施来削弱中国的竞争优势,包括加强技术研发、提高产能和扩大市场份额等。然而,这种做法真的能阻挡中国传统芯片产业的崛起吗? 在这场全球芯片大战中,美国贸易代表戴琪对中国的“非市场政策”提出了批评。她认为这些政策对欧美经济产生了深远影响。然而,在指责中国的同时,美国自身也在大力扶持国内芯片产业,这种做法与其对中国的指责形成了鲜明的对比。事实上,竞争是市场经济的核心,而每个国家都在努力提升自己的竞争力。中国的政策只是其中之一,而欧美的反应也暴露了他们对于自身竞争力的担忧。 值得注意的是,自从2019年以来,美国就试图遏制中国在中高端芯片领域的发展,通过限制对中国出口高端芯片制造设备等方式进行打压。如今,美国和欧盟又联手对中国传统芯片产业展开围攻,这无疑加剧了全球芯片市场的竞争态势。然而,这种竞争是否真的符合市场经济的规律?是否真的有利于全球芯片产业的发展? 面对欧美的联合打压,中国并没有退缩。相反,中国正积极加强自主创新能力,提高芯片产品的技术含量和附加值。同时,中国也在积极拓展国际市场,降低对单一市场的依赖。这种多元化的市场策略,不仅有助于中国芯片产业的发展,也有助于全球芯片市场的稳定与繁荣。 中国传统芯片产业的崛起并非偶然,这是中国多年来在科技创新和产业升级方面持续努力的结果。面对欧美的挑战,我们有信心也有能力保持领先地位,并继续为全球半导体市场的发展做出贡献。因为我们深知,只有不断创新、不断进步,才能在激烈的国际竞争中立于不败之地。 在这场全球芯片大战中,我们看到了中国传统芯片产业的实力和潜力。面对欧美的围攻和挑战,我们并没有感到恐惧和退缩。相反,我们更加坚定了自主创新和产业升级的决心和信心。因为我们相信,在未来的日子里,中国传统芯片产业将继续保持领先地位,为全球半导体市场的发展贡献更多的力量! 中国传统芯片产业的崛起引发了欧美的紧张和反应,但这也从侧面证明了中国在半导体领域的实力和潜力。面对挑战和机遇并存的未来,我们有信心继续前行,为全球半导体产业的发展贡献中国智慧和力量!
我们需要更多不做大模型的 AI 应用主义者
All in AI ,到 2024 年这个节点几乎已经成了科技互联网公司的主旋律。 仿佛全世界都陷入了 AI Fomo(AI 错失恐惧症),科技公司展开了追赶 OpenAI 的大模型军备竞赛,普通个体担心被 AI 取代,于是 199 元的 AI 课收获了大批拥趸。 而在国内掀起的「百模大战」中,金山办公算是一个异类。这家国内办公软件市场份额最高、现金流也十分充足的公司,并没有投入到大模型的竞争中,却在国内最先推出了基于大语言模型的智能办公助手 WPS AI。 在昨天的金山办公生产力大会,CEO 章庆元再次强调金山办公是一个大模型的应用者,目前也接入了国内几乎所有主流大模型。 以这种方式 All in AI 的金山办公,在过去 36 年间从 PC 时代走到移动互联网时代后,正在经历的第三个重要的节点,而前两个节点都影响了中国办公软件的市场的走向。 八十年代,求伯君把自己关在在深圳蔡屋围酒店 501 号房 14 个月,用一台 386 电脑敲出了 12 万行汇编代码,1988 年 WPS 1.0 诞生。 2002 年,金山 6 号员工雷军带领 100 多位工程师花三年重写了 WPS 500 多万行代码,推出了完全兼容微软 Office 的 WPS 2005。 ▲ 雷军(左)和伯君 现在大模型的到来开始改变软件应用的使用方式和开发方式,章庆元认为未来甚至 UI(User Interface,用户交互)这个词都会消失。金山也从去年开始暂停了所有跟 AI 无关的业务,全面转型。 爱范儿曾在年初的 ifanRank 中预测,我们正迈向工具性、普适化和工业化的「大应用时代」,2024 年将看到更多满足消费者或商业需求的 AI 原生应用。 大模型赛道逐渐趋于饱和,接下我们显然需要更多专注 AI 产品落地的公司,将大模型能力转化为行业生产力和创造力。 AI 生产力的迷思 回顾过去一年的爆款 AI 工具,无论是微软的 Copilot ,还是春节开始刷屏的 Sora ,伴随出现的高频词汇往往有两个——颠覆和取代。 尽管这些 AI 工具奔着提升生产力而来,但比起它们可能带来的效率提升,能取代多少工作颠覆哪些行业却总是被讨论最多的话题,甚至还有不少机构乐此不疲计算出精确的百分比。 工具本质是什么?帮助我们更轻松地完成想要做的事。那提升生产力无非就是两种方式,要么提升单个步骤的效率,要么缩减任务过程中所需的步骤,或者两者同时实现。 大模型驱动的一众 AI 工具,则是大大缩短了从提出需求到实现想法所需的流程。 你只要一句话,让 AI 几秒列出大纲,然后生成 20 多页 PPT。 一些需要过去拍摄和后期制作的视频,如今化作一段 prompt 指令。 哪怕是用手机随手一拍的照片,用手指圈一圈就能去掉将路人或杂物。 章庆元在去年接受采访时曾预测,大概再过一年,人们就可以用「100 块钱一个月请一个全能 Office 助手」的方式,实现对办公软件全新的掌控,任何复杂的表单、表格和计算等工具栏都会从办公软件上消失,用「订阅」的方式根本改变办公软件的商业模式。 这背后其实是 AI 加速了算力平民化的进程。 WPS AI 的产品经理付子豪不久前在一次分享中提出一个观察:大模型的出现不能类比移动互联网出现的状态,它更像是 PC 诞生的时代,云诞生的时代。 随着人类社会出现的需求和场景越来越复杂,大脑的算力已经不够用,我们开始通过计算机扩展算力。但要充分释放计算机算力的门槛并不低,你可能需要懂得编程语言,就算是常用 Excel 表格、PS,要用好也不容易。 AIGC 解决的就是算力门槛的问题,只要用自然语言就能让计算机理解你的思考逻辑 ,并生成结果,极大地缩短从想法到结果的链条。 如果理解了这个逻辑,对 Sam Altman 最近专访关于 AI 将取代多少工作的回答或许更有共鸣。Altman 思考的方式不是 AI 将完成多少百分比的工作,而是 AI 在一段时间内将完成多少百分比的任务。 我认为这是一个比 AI 可以做多少工作更有趣、更有影响力、更重要的问题,因为它是一种工具,可以在越来越复杂的水平上工作,在越来越长的时间范围内完成越来越多的任务,并让人们以一种更灵活的方式进行操作。所以也许人们的工作效率会更高。 这个思考不仅对于用户,对于 AI 工具的开发者同样有价值。因为用户需要的其实不是参数越来越大的模型,而是能让他们更容易将想法落实的工具,就像当年乔布斯一个经典的回答: 必须从用户体验入手,然后再回过头去开发技术,而不是从技术入手,然后再试着想办法,看这个技术能用到哪? Copilot 的交互 在《大模型元年,人类文明的操作系统正在大更新》一文中,我们提到下一代革命性的人机交互模式可能会是自然用户界面(Natural user interface, NUI)。 NUI 最核心的原则是简单性高于一切。复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。 而 Copilot ,则是 NUI 交互逻辑下 AI 工具理想的形态。Copilot 这个词源自飞行术语,指的是协助主驾驶员操作飞机的副驾驶,当主驾驶员需要休息或处理其他任务时,副驾驶员就会接管控制权,二者共同负责飞机的安全飞行。 我认为这也是人和 AI 交互最恰当的形容。微软对于 Copilot 的定义是:一种使用自然语言处理技术或大语言模型,帮助人们完成复杂或认知任务的应用程序或组件。 WPS AI 同样将人机交互作为三大战略方向之一,也把基于自然语言多轮问答式的自然交互称为 Copilot,能够深入植入到文档和协作的各种场景。 比如昨天推出的 WPS AI 企业版可以提供「文理兼修」的数字员工服务,例如阅读助手、画图助手、考勤助手、销售分析、合同分析等等,触达各类细微的办公场景。 其中的 Copilot Pro 则可帮助运营人员使用自然语言驱动 BI 产品分析数据,同时可调用 WPS 365 API 和企业自有 API,解决办公自动化需求。 GitHub 一项数据显示,在使用 GitHub Copilot 的开发人员中,88% 的人表示他们的生产力更高,74% 的人表示他们可以专注于更令人满意的工作中,77% 的人表示它有助于他们减少搜寻资讯或范例的时间。 章庆元有个形容也十分贴切,自然语言交互大幅降低用户交互成本,意味着 Photoshop 可以直接进入「美图秀秀」这类工具的市场。 用户能以操作美图秀秀的交互难度,实现 Photoshop 中复杂的功能。这样情况正在越来越多类型的 AI 产品中出现。如果留意去年 WPS AI 的更新,也会发现用户界面在不断简化,自然语言的输入开始替代原来一些按钮的功能。 可以看到,目前办公文档处理套件,已经向「office+协作+AI」组成的一站式 AI 办公转变。一个产品能高效完成越来越多的任务,但集成的功能模块却越来越少,也将是 AI 工具的趋势。 科技的革新本质上是人机交互的进化,当 Copilot 发展到一定程度,甚至可能整个交互界面本身就是一个超级应用,不仅连功能按钮被取消,甚至很多应用本身都不一定再需要单独存在。 我们需要更多不做大模型的 AI 公司 很多人把大模型或 AIGC 视为第四次工业革命,实际上如果一个技术要被冠以革命性的帽子,实际指的不是技术的突破本身,而是能影响整个商业社会、改变大多数人的生活方式。 无论是蒸汽、电力还是互联网,毫无疑问都符合这些特点,那大模型呢?至少现阶段肯定是达不到这个程度。我们需要的是通过 AI 应用产品将大模型能力发挥出来,从而来影响人们的工作和生活。 ▲ 吴恩达 计算机科学家吴恩达也认为, AI 作为新一代通用技术,更多的机会,在于大规模应用落地。 这也是为什么我一开始就说,我们需要更多不做模型的 AI 公司。大模型作为底层技术固然不可或缺,但专注于满足消费者的各种需求以及各类商业交易的 AI 公司绝对需要更多,才能让 AI 在社会层面真正爆发。 就像多点触控技术,早在初代 iPhone 发布 20 多年前就有了成熟应用,但只有苹果让这项技术成为后来几乎所有智能手机的交互方案。 而在这波 AI 浪潮中,也有着不生产大模型,但坚定要做大模型应用者的探索者,金山办公就是其中的佼佼者。 金山办公的策略十分务实,关注落地的场景,几乎与国内主流的 AI 大模型公司都达成了深度合作,包括 MiniMax、智谱 AI、商汤、文心一言、通义大模型等,自己则聚焦落地的场景。 金山扮演的角色就像分诊台,负责判断用户所有的问题和要解决的场景然后调用对应最适合的模型来执行任务。而一些小众场景则由金山办公的自研小模型补充满足需求。 比如商汤在数据分析上比较出色,WPS AI 就调用它处需要理科思维的场景。而像文字、PPT 等场景则通过智谱 AI 等模型来完成。 这样化整为零的大模型应用方式,好处是能充分发挥各模型的长处,实现优势互补,不会受到某个模型能力的限制。实际上就算是 GPT-4,也有一些场景存在短板。 昨天的 WPS 发布会上,开场章庆元提到一个点我印象比较深。他说今天看到的所有功能,都是马上能体验,一定是落到客户真实的应用场景里的。 AI 除了在聊天框之外,在长文本处理不断内卷之外,还有什么更有想象力的应用方式?这是值得更多人去探索的,尽管目前大模型应用处于起步阶段,但像金山这样的 AI 应用主义者应该要多一些。
微软前全球副总裁入局AGI:左手效率神器、右手AI开放世界,实测好用
作者 | 三北 编辑 | 漠影 大模型进入创业爆发期,来自全球大厂的离职AI大牛成为一大主力军,近期圈内热门的阶跃星辰是一个典型代表。 成立于2023年4月的阶跃星辰,是由原微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕创办的通用大模型创业公司。 这是一个“卧虎藏龙”的团队:创始人、CEO姜大昕是自然语言处理领域的全球知名专家,也是阶跃星辰的算法负责人;系统负责人朱亦博曾在谷歌、字节和微软等公司就职,拥有多次单集群万卡以上的系统建设与管理实践经验;数据负责人焦斌星此前担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量……基于这样的团队背景,阶跃星辰仅花了一年时间就憋出“大招”。 今年3月23日,阶跃星辰推出Step系列通用大模型,打响国产玩家进击万亿参数规模通用大模型的响亮一枪。 同时,阶跃星辰的两款C端产品——效率工具“跃问”和AI开放世界平台“冒泡鸭”已经全面开放,在巨头云集的“百模大战”中撕开一道新口子。 创业一年来,阶跃星辰对大模型产业有什么独到见解?其推出的大模型的实际体验效果如何?智东西来与读者一起一探究竟。 一、微软大牛下场创业,“铁人四项”进击AGI 按照阶跃星辰的理念,大模型的演化路径会经历“从各模态独立发展、到融合统一、再到主动探索物理世界”的三个阶段。 姜大昕在此前的媒体沟通会上表示,阶跃星辰正处在多种模态走向融合的第二阶段。 姜大昕认为,多模理解和生成的统一是通向AGI的必经之路。原因有两个:第一,多模理解是多模生成的坚实基础。Sora在视频生成领域的惊艳表现,正是因为OpenAI有非常出色的多模理解模型GPT-4V。第二,多模理解做得好,也证明了模型在LLM方面的能力优秀。正如GPT-4V的基础是GPT-4。 Scaling law是阶跃星辰在追逐AGI路上与多模态齐头并进的方向,为此其提出“铁人四项”,算力、系统、数据和算法四大要素缺一不可。 在姜大昕看来,能够自己从头训练千亿参数模型已经是个不低的门槛,而在千亿之后,每增长一个数量级,面临的挑战却是几十倍的增长。 因此,能否对这四大要素进行综合布局,非常考验一家创业公司的能力,也决定了这家公司能走多远。 ▲阶跃星辰创始人姜大昕在讲解攀登Scaling law所需的要素 二、左手效率神器、右手开放世界平台,实测两款AI产品 基于多模态和Scaling law两大路线,阶跃星辰推出了Step系列大模型。 Step-1千亿参数语言大模型于2023年8月底训练完成。经过充分准备,Step-1大模型的进展非常快,用时2个月一次性训练成功,综合性能超过GPT-3.5。 Step-1V千亿参数多模态大模型于2023年11月训练完成。Step-1V在多个主流评测集上性能指标比肩GPT-4V。特别是在多模理解能力上达到全球领先水平。Step-1V大模型可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。 Step-2万亿参数语言大模型采用MoE架构,每Token激活两千亿以上参数,聚焦模型深度智能水平的探索,综合体感对标GPT-4,目前已发布预览版。 围绕Step-1和Step-1V千亿参数大模型,阶跃星辰的产品和生态已经初步打磨成熟。 以跃问为例,其在图像理解、内容创作、逻辑推理、指令跟随等方面的能力,使其成为一个出色的“个人效率助手”。 比如,当智东西发给跃问一篇报道链接,跃问立马为我提炼了报道中的关键数据和信息点。 当智东西给它一张关于“A公司营业收入与毛利、净利”的统计图,并要求其“将图中的内容转成表格形式,并计算每年净利增长率”。跃问迅速生成了表格,并算出了9.54%、2.72%两个图中没有直接给出的答案,体现了强大读图、数学、组建联动能力。 通过点击展开“代码执行完成”,智东西追溯了计算过程,确认两个数值计算正确。 当智东西给跃问一张菜肴的图片,跃问则准确地识别了这是一道经典的湖南菜“辣椒炒肉”,并给出了烹饪所需的材料和烹饪步骤。可见跃问的常识知识还是很丰富的,可以做不错的日常助手。 再看看冒泡鸭,这是一个由剧情和角色组成的AI开放世界平台,能满足多种娱乐和社交需求。 以逃离精神病院Agent为例,这是一个有趣的心理学游戏,我需要通过与“兔子医生”的对话,找到逃离精神病院办法。而逃出这里的唯一方法,是成为一个真正的病人。这一游戏获得了超5.6万的热度。 跃问和冒泡鸭只是Step系列大模型的小试牛刀。为了促进Step系列大模型应用生态的繁荣,在生态布局方面,阶跃星辰与合作伙伴共同探索面向C端用户的创新应用,API开放平台目前已开放体验。 结语:大厂牛人纷纷“下海”,掀起AI创业潮 纵观产业,当下大厂牛人纷纷“下海”投身大模型创业,掀起一波新的AI创业潮。 创业方向也展现出百花齐放的态势,通用大模型创业成为一个值得关注的前沿方向。尤其是今年Sora的出现,让我们看到基座模型在迭代细分模型应用上的效率和效果,坚定了通用大模型创业的发展路径。
对话创维集团创始人黄宏生:解决全球智慧家庭的电能刚需,是我们的核心竞争力
提起创维,你会想到什么? 很多人脑海中第一个蹦出来的词可能是「电视」,但如今,有不少人接触到创维这个品牌,可能是因为创维的迷你剃须刀——去年,创维卖了数百万个迷你剃须刀,是抖音电商销量最好的剃须刀品牌。 如果你再仔细看创维集团的财报,会发现全年近 700 亿的营收里,有超过 230 亿营收来自光伏新能源业务,时至今日,创维已经是中国前三的户用光伏品牌。 这就是创维,一家在家电领域和光伏领域同时领先的中国企业。 2023 年,创维集团营业额逼近 700 亿,较上年同期增长 29%,卖出了超过 1 亿件产品,如今的创维,已经从单一的彩电品牌,发展为集智能家电、智能系统技术、新能源、现代服务四大业务板块为一体的全品类科技集团。 在 4 月 8 日的创维全品类客户大会上,创维集团创始人、创维汽车创始人黄宏生喊出了「剑指 1000 亿」的目标,这位 68 岁的企业家,不仅是创维集团的掌舵人,也是新能源行业最年长的创业者。 会后,爱范儿等多家媒体采访了黄宏生,一起聊了聊智慧家电、光伏新能源以及 AI 等新技术,为创维带来的新机遇。 在黄宏生看来,为创维带来强劲增长势能的,是新能源时代对中国出口「新三件」的旺盛需求——即电动汽车、锂电池和光伏产品。 在短短四年时间里,创维的户用光伏业务营收从 1 亿迅速涨到 230 多亿,成为创维的第二增长曲线。 尽管据创维集团财报,目前创维光伏的毛利仍比较薄,而创维汽车也尚未达到盈利线,但黄宏生认为,未来光伏将会进入低毛利时代,而创维走薄利多销的路线,通过户用光伏布局创维的智慧家庭操作系统,去赢取更多的用户数据,创造智慧家庭的生态价值,进而通过生态带动家电、新能源汽车的产品销售转化。 解决全球智慧家庭的电能刚需,是我们的核心竞争力。 作为国产家电产品的头部企业之一,创维近几年的差异化竞争策略取得了明显的成效。 电视领域,创维拿下了「壁纸电视」和「百吋电视」两个品类第一,并保持全球出货前五、中国出货前三的位置。 此外,创维也在家电、消电、个护等领域广泛布局,在活动现场,爱范儿发现除了洗衣机、电冰箱、油烟机、热水器等常用家电产品,创维还开发了助听器、老人手机等适老型产品,以及透明电视、VR 头显、AR 眼镜等探索型业务。 黄宏生认为,以 AI 为代表的新技术浪潮,将会在全球范围内推动智慧家庭的升级,AI 带来的技术赋能,有机会让用户从移动小屏回归到家用大屏,极大拓展家庭的应用场景,而这也是创维通过智慧电能产品去赋能家庭用户的机会。 有意思的是,不久前彭博社记者 Mark Gurman 爆料,苹果正在考虑开发一种「先进的桌面家用设备」,通过机器人技术为家庭提供一个可以移动的显示屏。 智能手机十多年的发展,让具备智能交互系统的屏幕,成为现代人难以割舍的一种「器官」。 未来,新的屏幕形态,可能会进一步改造我们的家庭,而这,又将会是一个万亿美元的市场。 已经有中国企业往里冲了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。