EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
OpenAI与美国AI安全研究所合作 20%算力将分配给安全研究
①OpenAI首席执行官山姆·奥尔特曼周四(8月1日)重申,致力于将20%的计算资源分配给AI安全工作;②奥尔特曼指出,OpenAI团队正在与美国人工智能安全研究所(US AI Safety Institute)合作;③他承诺为该研究所提供下一个AI模型早期访问权限。 财联社8月2日讯(编辑 周子意)OpenAI首席执行官山姆·奥尔特曼周四(8月1日)重申了该公司在保证人工智能(AI)安全方面所作出的承诺。 奥尔特曼在社交媒体X平台上发文称,“我们致力于将20%的计算资源分配给整个公司的安全工作。”这一点该公司曾在7月初的一则声明中提到过。 他还指出,“我们的团队一直在与美国人工智能安全研究所(US AI Safety Institute)合作并达成协议,希望该研究所能尽早访问我们的下一个基础模型,以便我们能够共同努力,推动人工智能安全评估的科学发展。” 这家研究所是一个旨在评估和解决人工智能平台风险的联邦政府机构,隶属于美国商务部国家标准与技术研究院(National Institute of Standards and Technology)。该机构为包括Anthropic、谷歌、Microsoft、Meta、苹果、亚马逊和英伟达等大型科技公司在内的公司财团提供咨询。 奥尔特曼的这一声明并没有透露太多细节,但这一举措,连同OpenAI在6月与英国人工智能安全机构达成的类似协议,意在反驳这样一种说法,即OpenAI在追求更有能力、更强大的生成式人工智能技术时,已经把人工智能安全工作放在了次要地位。 今年5月,OpenAI被爆出解散了一个专注于研究人工智能安全的部门,该部门致力于开发人工智能控制措施,以防止“超智能(Superintelligence)”人工智能系统失控。同月,该部门的两位联合负责人Jan Leike和Ilya Sutskever也宣布辞职。 目前,Jan Leike在人工智能初创公司Anthropic的安全研究部门就职,而Ilya Sutskever创办了自己的专注于安全的人工智能公司Safe Superintelligence。 这一事态发展让OpenAI和奥尔特曼遭受到了很多批评声。OpenAI后来回应道,成立安全委员会,将20%的计算资源用于安全研究,并且将取消限制员工揭发的条款。 然而,这些举措并没有安抚一些市场观察人士的质疑声。OpenAI 首席战略官杰森·权(Jason Kwon)最新回应称,OpenAI“致力于在我们流程的每个阶段实施严格的安全协议”。
研究表明产品越强调AI越招人们反感:降低情感信任 减少购买意愿
快科技8月2日消息,据媒体报道,华盛顿州立大学的一项突破性研究成果引发了广泛关注:在产品描述中融入“人工智能”这一前沿词汇,竟意外地可能成为消费者心中的一道门槛,微妙地左右着他们的购买决策。 该研究团队精心策划了一场面向超过1000名美国成年人的深入调查,旨在精准把脉消费者对产品中AI元素披露的真实反应。 实验将受试者一分为二,一组直面含有“人工智能”字眼的产品描述,另一组则与之绝缘。结果揭晓,令人咋舌——提及AI的产品,其吸引力显著滑坡,消费者偏好出现明显偏移。 华盛顿州立大学市场营销领域的临床助理教授Mesut Cicek对此做出了深刻剖析,他指出,AI一词的浮现,往往不经意间触发了消费者内心的情感防御机制,导致信任感骤降,进而转化为购买意愿的减弱。 这一现象在涉及高风险、高价值的领域尤为凸显,如精密电子产品、关键医疗设备以及复杂金融服务等。在这些领域,消费者本就持谨慎态度,对技术故障可能引发的经济负担或安全隐患心存顾虑。因此,AI的提及,无异于在消费者心中投下了关于未知风险的阴影,信任之墙悄然竖起。 鉴于此,企业策略应适时调整,转而聚焦于产品本身的实用价值与独特优势,强调AI技术如何切实提升用户体验、增强产品安全性与便捷性。通过这样的正面引导,不仅能够有效缓解消费者的疑虑与不安,还能逐步构建起更为坚实的信任基石。 这一发现提醒企业,在推广AI技术时,需要更加注重实际效果的展示和用户信任的建立,避免过度炒作,以真正满足消费者的需求和期望。
AI进内娱,群众不答应?
相较于AI翻唱、AI换脸、AI智能体等在二创领域的风生水起,随着近期AI明确宣告进入专业创作领域,却引起了一连串意料之中和意料之外的群众反弹。如果AI内部也开组织扩大会议,应该也要说一句:改革进入深水区。 在奥运到来之前,AI创作是整个7月的舆论大热点、群众大雷点。一连串关联名单里既包括大明星成龙、大导演乌尔善,也有从番茄小说到AI助手“豆包”、国产办公软件WPS等一系列互联网大厂产品。同一时间段,抖音、快手也分别推出了自己的AI短剧。 AI创作在7月集中爆发,各方却明显仍在调试期。首当其冲的“受害者”是乌尔善。新片《异人之下》与《封神》的命运截然相反,其大众槽点是擦边软色情,比较小众的争议则在于:片中有近20分钟的画面是在AI技术辅助下、由真人实拍素材转化而成的动画。拍时废了老大劲,片方也将其作为卖点之一,观众却并不买账。 原因不难理解。男色变女色尚算一脉相承,但主动引入AI、宣扬AI,任由成片画面流露出AI味儿,与《封神》时期主打的真材实料、匠人精神可谓背道而驰。 从短视频上涌现的花式AI整活儿,到电影中的AI成龙、AI特效,以及面向网文作者的AI协议,AI攻入专业内容生产的速度超出人们的想象。而这些还仅仅是冰山一角,另外还有一些小事件没能分得那么多声量,但绝不代表它们不重要。 文字+AI,萝卜带出泥? 浅做一下事件回顾。今年6月,就有番茄小说作者发帖表示,收到了平台的一份“AI训练补充协议”,其中提到,平台有权将签约作品的“作品全部/部分内容及相关信息”用于包括AI人工智能模型训练在内的新开发技术研发/应用领域,并且乙方不得因此主张侵权。 在作者们多平台奔走宣传、乃至停更抗议的努力下,事件在7月份持续发酵,赢得了更多网友的关注声援。这个过程还印证了众人最可怕的那条猜想:有人扒出番茄小说站内已经出现一些疑似AI写书的账号,更新的频率与数量有明显异常,或是开篇方式高度雷同。 待到7月中旬,番茄小说官方终于作出回应,表示平台没有发布过任何纯AI写作的作品,不会违背作者个人意愿使用AI写作能力,同时上线了解除相关条款的功能入口。 但仍有作者表示,在解除条款之后,自己的作品疑似遭遇限流。要知道,番茄小说当初正是以免费模式与大数据推送手段吸引了无数读者作者,乱拳打翻付费老师傅。若真存在平台限流,这之于作者是非常实际的制裁。之于平台,这样的指控也意味着彼此的信任一去不返。 同为AI进入创作领域,AI电影引发的是观众的小规模吐槽,番茄小说事件则引发了更激烈的抗议与更广泛的共情,其区别就在于网文的多重属性。 网文的文首先是文学的文,对于单个作者来说,创意与版权都有意义,值得保护。然而,商业模式的纯熟又令它不可能只是个体的创意挥洒、为爱发电。 拉到宏观层面,它又是一种强调工业化、规模化的产品,有明确的套路可循,红利期也足够漫长。因此新人可以随时跟着教程入行,就算搞不出大IP,也能靠勤劳赚稿费过活儿。 每个读者都是潜在的作者,这是番茄小说事件的大众共情基础。 AI来袭,最先受冲击的就是这类“副业”作者。而作为免费阅读巨头,番茄小说上聚集着大量这类作者。因此,尽管搞AI的网文平台绝不止番茄一家,矛盾却率先在这里爆发。有媒体将这一事件比作网文圈的“萝卜快跑来袭”,不无道理。 事实上,到现在为止,作者们的疑虑也没能得到真正解决。只不过属于这一热点的“七天”之期已到,后续的一切又回到了小圈子里。 有趣的是,由于官方迟迟不作回应,也由于AIGC技术来得太快太猛、大众普遍对其一知半解,这半个多月中涌现出不少有谱的、没谱的猜测,字节系的AI助手“豆包”、国产办公软件WPS都被卷入其中。 涉及到授权与隐私,影响范围便不限于网文作者。很多不搞创作的普通人突然意识到,就算不去主动学习新技术,却免不了被新技术围猎。契机可能就是常用软件的每一次更新,或每一份“太长不看”的用户协议。 影视+AI,距离产生美? 事实上,国内专业影视领域对AI技术的应用远比AI成龙、《异人之下》要早。但之前主要是用在幕后,从作品看不出来,也并未对公众大肆宣传。 例如,用AI提升长篇网文的评估与改编效率,优化拍摄中的制片管理流程,辅助生成宣传物料等等。为了降本增效、又或者为了讲故事,三大长视频平台在这方面都十分积极。阿里甚至在不久前推出了一个影视妆造大模型。 电影领域,郭帆导演也曾经在行业论坛上分享过自己的经验。不难想象,《流浪地球》这样的科幻大片,后期特效何等烧钱,前期工序又何等繁琐,AI能够在剧本会、概念图这样的环节为他们节省相当的时间精力。 但此类应用方式通常不会在正片环节留下痕迹,观众也没必要知晓。《传说》的AI成龙与《异人之下》的AI转制动画引发争议的原因很简单:它们首次将AI带到了台前,作为正片的一部分看点来售卖。但拿出来的东西又不比短视频上网友自制的AI换脸、AI绘画好多少,让观众作为消费者深感不值。 毕竟,不管未来如何,电影到目前为止还是对双方都要求最高的一种专业内容——要掏钱买票、要在大银幕观看,还顶着第七艺术的名头,品质与独创性是重要的评价标准。硬糖君建议,下次如果不是真有把握惊艳众人,电影咱还是偷偷用AI降本增效就好。 而在微短剧界,对AI技术的想象与反馈又是另外一番光景。今年初,就有许多媒体报道过某些公司试图用“AI配音+换脸老外”让短剧一键出海。到了年中,随着AI视频技术日新月异,市面上已经开始涌现主打AIGC的短片与短剧: 6月,中央广播电视影视剧纪录片中心在央视频上线了3部AI短剧《英雄》《爱永无终止》《奇幻专卖店》。7月,抖快狭路相逢,“即梦”对战“可灵”,前者拿出了与电影公司博纳合作的《三星堆:未来启示录》,后者拿出了扶持新人导演的《山海奇镜之劈波斩浪》。 不难发现,这些AI短剧主要分布在幻想类题材。这主要是为了扬长避短,AI长在以低廉成本去呈现超现实画面,短处则是微表情与讲故事。 以硬糖君的实际感受,《三星堆》还带有浓重的动态漫画感。《山海奇镜》更自然一些,但显然团队承担不了更大的素材量,全季5集、其中最长的不过3分钟,剧情推进像电影解说一样匆忙。 可想而知,这两部短剧对于平台来说其实“广而告之”的意味更浓一些,播放表现也不算突出。不过短视频用户一如既往展现出了相当的宽容度,有些会犀利指出人物表情僵硬、长相变来变去,也有些冲着新鲜与免费不吝美言夸奖,顺便拉踩几句内娱鲜肉。 微短剧之所以是公认的影视鄙视链底端,是因为它并不把品质放在第一位。只要能提供充足的情绪价值,用户会对千篇一律的剧情与拙劣浮夸的表演照单全收,因此制作方也没那么多动力去砸钱搞精品化。 未来如若AI短剧真能解决面瘫问题,用户未必不会欢迎。问题反而在于制作方是否愿意付出前期的学习成本,因为就目前来说,还是压榨人类牛马更划算一些。想来短时间内,也就平台有这个动力和财力了。 营业+AI,革新长尾效应? 在这些引发热议的大事件之外,这个暑期档的剧集大战还推出了另一种玩法,也就是AI角色号——可以视为剧宣角色号的AI化、永久化;也可视为长视频拒绝让星野、ChatGPT等中间商赚差价,不必再由粉丝去创建和调教野生智能体,官方直接把一切准备好。 AI角色号目前的主要玩家是爱奇艺和腾讯视频。爱奇艺在主站推出了“桃豆”板块,并与微博合作,双端上线了一批角色号,包括《苍兰诀》的东方青苍、小兰花,《云之羽》的宫尚角、宫远徵等。 在微博,这些已播剧角色号主要是加入@评论罗伯特、@花果山_孙悟空这类“赛博街溜子”的行列中,主动闪现到评论区或者等待用户召唤互动。 在爱奇艺主站则有更多互动方式。网络资料显示,围绕热播剧《唐朝诡事录之西行》,爱奇艺推出了单个角色对话、探案小剧场、推理游戏、加入主角团群聊等四种互动玩法。 腾讯视频的角色AI则是与自家的AI应用“腾讯元宝”合作,用热剧为其引流。这一联动在《庆余年2》时期上线,到《长相思2》全面引爆。 《长相思》身为热剧的同时还主打雄竞,播到第二季,粉丝间的大战已进入白热化,角色AI互动值也就成为新的战场。“相柳”扮演者檀健次在直播中与AI互动,也提供了一个很好的事件营销。 目前来看,或许因为玩法太新、或者过于粉丝向,AI角色号的影响力还仅限于粉圈的一亩三分地,与成为真正的追剧日常还有一段距离。 但平台在这一业务的投入力度、宣传力度不小。因为它不仅是一种粉丝福利、一种新的剧宣方式,更代表了将剧集IP的长尾红利维持得更久、以及更多沉淀在主站的可能。 通常来说,剧粉的诉求是“只愿长醉不复醒”。但演员不可能为一个角色停留,活人运营的官微与角色号到期也可能会注销,甚至会被新剧顶替。日前,相柳在剧中战死之后角色号又注销,用粉丝的话说,以后连“赛博哭坟”的地方都没了。AI角色号则可以避免这种情况,或者,至少能够避免这种情况发生后,角色粉全被演员本人提走。 AI技术对资本的最大诱惑就在于将人工的、一次性的东西转化为可留存的数字资产,以后用来降本增效、反复收割。AI角色号如此,虚拟拍摄如此(搭一次实景,之后都可改用LED),“AI成龙”、AKA数字人也是如此。 如此,尽管真人主演一时半会不太会被取代,毕竟AI成龙匍匐在前。但其他工作机会可能会被压缩,例如真人到场可改为肖像授权。 “积极”的一面是,明星之于影视行业的重要性将会下降——来到了许多人喜闻乐见的痛击208w环节。但还有一个更朴素的逻辑,就是我们消费文娱产品,还是希望其中能够蕴含人类的巧思与情感,收获对人类自身的思考、对人类力量的肯定。成龙的高成就来自以血肉之躯玩命拍片、比肩特效,就算有朝一日AI成龙能够完美还原年轻的他,也很难带给观众同等的战栗与震撼。 至于剧集市场,我们口中的“内娱”,在没AI时也已经流水线、抄袭拼贴与空心偶像泛滥成灾,实在不需要更多的科技与狠活儿。其实就像任何领域一样,技术浪潮势不可挡,法律与行业共识也得抓进跟上,将对AI的应用控制在一个度,对所有人都好。
豆包vs可灵,抖快AI之争背后的产品路径
智能涌现的浪涛,还在翻涌。以今年5月为节点,全球科技巨头在AI领域的成功与部署以更为密集的状态呈现。 其中一条步履鲜明的主线,是普遍在追求AI落地。硬件端,苹果在全球开发者大会上发布苹果智能,宣布将ChatGPT融入Siri,三星宣布Galaxy AI融入手机、平板、穿戴式设备;软件端,谷歌在Chrome浏览器集成Gemini AI助手…… 一个公认的现况,AI应用即是国内AI产业当下的弱点环节,又是国内能够追赶甚至超越的机会所在。 有趣的是,抛开尚处于初级阶段的“百模大战”,仅从AI应用场景出发,抖音与快手这两大先天占据优势的短视频内容平台,各自大热的AI应用,又提供了两种截然不同的落地路径。 01 豆包,文生图文基底的AI Agent AIGC相关的App中,豆包绕不过。据Questmobile数据显示,截至2024年6月,在国内AIGC App中,豆包、天工、Kimi智能助手、猫箱增长亮眼——其中豆包流量排名第一。 豆包并不严格“归属”于抖音,更确切来说归属于字节跳动。坊间流传的消息是,这个名字很接地气的AI产品,最开始的定位是抖音内的AI工具包,或者是抖音内的所有AI应用都包了,所以叫豆包。 在2023年8月上线以来,豆包本身的产品定位和能力也在不断迭代,直至跳脱出抖音本身的框架,单独成为一个App。与ChatGPT和文心一言等ChatBot产品形态类似但不同的是,尽管交互形态相似,但豆包的定位更倾向于一个综合性的AI Agent(AI智能体)平台。 通用场景下,用户可以和“豆包”默认智能体聊天对话,也可以寻找其他垂直应用的智能体对话解决垂直场景的问题,其中包含官方与第三方创建的智能体应用。 在不断迭代之下,其功能也愈发繁复。现在的豆包,不仅有App更有PC端,应用内的场景也扩展到了虚拟社交聊天、AI搜索、文档对话、文生图、内容创作等多种使用场景。而且AI能力的应用也开始扩展到了字节旗下的不同产品。 以抖音为例,一边是抖音应用内上线AI搜索功能,一边是用户在和豆包进行吃喝玩乐等特定类目内容交互时,豆包除了生成文字回复,还会推流一个抖音短视频来填补AI回复的准确性和及时性。 在今年上半年相对热门的AI应用中,字节基本都有入局,虚拟社交领域的猫箱,智能台开发平台领域的扣子,为主文生视频的即梦等等。然而,豆包之于字节的定位重要性毋庸置疑,先是持续在增长方面的投入并公布商业化路径,后是干脆将原来的大模型名称从云雀大模型改成豆包大模型等一系列动作,都足够验证。 集成、聚合、综合……豆包代表的产品路径,依旧保持着“超级App”或者说“超级入口”的思路,在市场相对空白阶段阶段,先通过应用端占领用户市场,并且在小步快跑中不断迭代,最终聚合成一个超级应用,来获取AI应用时代的优先船票。 与此同时,不同场景和不同产品的贯穿,又让字节生态内的用户数据进一步被累积,成为自身AI能力增长的数据养料。 02 可灵,视频世界的AI入口 对AI领域有关注的人们,或许还会记得2月Sora推出时引起的震动。这是堪比ChatGPT式的信标。丝滑的文生视频体验,代表着人机交互、内容创意之间的某个隔阂被消磨殆尽,转向通途。 很多人会以为,中国版“Sora”,会诞生在BAT和所谓“大模型五虎”上。作出这种判断并不令人意外,技术基底延伸产品应用的链路总是更短。但出乎意料的是,真正在用户层引起爆发式普及的文生视频产品,却是快手推出的可灵。 与还处于内测阶段的Sora相比,在6月公布的可灵直接对外开放。比较吸引人的点在于,可灵支持生成长达 2 分钟的 30 帧视频,分辨率最高1080p,并且可以自由定制宽高比。这样的产出能力,甚至远超还Sora和其余竞品(包括在可灵公布前一个月字节上线测试的文生视频应用“即梦”)。 在发布后不久,其又上线了图片生成视频功能。视频生成的效果,也符合其宣称的大幅度合理运动、物理世界特性模拟、具备概念组合能力和想象力等优势。这一度成为许多“内容创作者”们吸睛的利器,让老照片、手绘图片变成视频的“独家秘笈”甚至被许多人做成课程销售。 快手的AI产品路径,也值得思考。在可灵之前,快手先后发布了通用大语言模型“快意”、文生图大模型产品“可图”,均未有太大火花,反而是更符合自身内容生态的可灵迅速火爆。 而在可灵爆火后,在移动端唯一能使用的渠道依旧只有快手创作工具快影 App。但快手专门打造了Web端,并发布公告称此前的可图平台将在8月关闭,产品功能融入“可灵AI”中。从Web端入口可以看到,快手对可灵的官方定位是新一代AI创意生产力平台,突破了文生视频局限,集中在AI内容/创意生成方面,并且还有AI视频剪辑等功能方面的想象力留白。 这似乎又是一个方向:围绕自身核心业务场景,提供AI助力来实现扬长避短。而快手本身的内容生态,AI能力的喂养、AI产品的落地、用户的反馈,形成了一个完整闭环,用第三方平台、工具的形式,从创作到体验到生态提升了整体主站App的体验。 03 Agent和工具集,被动与主动 不难发现,尽管目前交互的形态还属于一问一答、一入一出的阶段,但豆包和可灵之间的差异,已经有了被动与主动的差别。 豆包尝试的AI Agent作为通往AGI(通用人工)的必经之路,发展方向无疑是能够独立思考、调用工具去逐步完成给定目标的独立助手。终极的发展目标,是用户只需要给出一个需求,就能根据需求拆解步骤并提供解法。用户被动享受着AI的主动响应。 可灵AI作为垂类平台,集成了对应的分类能力。用户依旧要为进行文字、图片和素材的输入,并且进行调试。产品用被动式的交互保持了用户的部分主动性。 无关优劣,这本就是非常有意思的阶段性发展。人机交互关系究竟应该是什么形态,人们需要一个万能的智能体助手,还是更垂直有效的工具,又是一个事关伦理的新命题。 而可以确认的是,至少在未来的一段时间内,我们不用担心AI产品的无趣了。
Nature:谷歌AI研究引用量登全球榜首,中国企业腾讯、阿里、华为前十
Nature 最近报道了一个新发布的 AI 行业数据库 PARAT,分析显示,在论文引用、专利申请等方面,美国和中国企业占据了主导地位。 在 AI 领域,硅谷巨头 Alphabet(谷歌母公司)和微软的论文引用量最高,远超其他公司。 不过,中国企业百度和腾讯在专利方面领先。 这些结果来自新兴技术观察站(ETO)发布的 PARAT 数据库,该工具跟踪私营部门的 AI 相关活动,包括研究和专利的发表,以及人才指标,帮助我们洞见 AI 发展趋势。 ETO 是隶属于安全与新兴技术中心(CSET),后者的总部设在乔治城大学外交学院,是致力于 AI 领域政策分析的智库。 CSET 高级分析师 Ngor Luong 表示,由于 AI 领域的尖端研究在工业界和大学中同样频繁,因此监控商业活动是很重要的。 AI 巨头 观察站的首席分析师 Zachary Arnold 表示,PARAT 数据可以证明,中国的大型企业在 AI 领域非常具有竞争力。 按高被引 AI 论文和预印本数量排序时,三家中国科技巨头 —— 腾讯、阿里巴巴和华为都位列前十。 Arnold 说,「很多人仍然存在一种偏见,认为中国规模大,可以产出很多结果,但不是真正的一流。」 然而,ETO 计算了多种质量调整指标,中国公司在这些指标上「表现出色」。 根据 PARAT 数据,所有 AI 研究中被引用次数最多的论文是 2017 年发表的《Attention Is All You Need》。 ▲ 根据谷歌学术,这篇论文的引用量已经超过 12.7w 这篇论文的作者团队主要来自谷歌,提出了实现「大一统」的 Transformer 架构。 中国机构同样产出了很多高质量研究,比如这篇由港中文、腾讯、商汤等机构共同撰写的论文,提出了一种实时的语义分割方法 ICNet,引用量超过 1.7k。 论文地址:https://arxiv.org/ pdf/1704.08545 过去十年中,提交 AI 专利最多 top10 公司中仅有三家位于美国,其余则分布在中国、德国和韩国。 顶级雇主 数据还突显了 AI 行业的多样性。 除了五大巨头 —— Alphabet、亚马逊、苹果、Meta、微软之外,还有许多公司位于「长尾」部分,引用量同样很高。 其中比较知名的公司包括 OpenAI 和苹果,以及不太以 AI 创新闻名的迪士尼和日本三菱。 Luong 指出,数据库收集的论文和专利数据仅截至 2023 年底,因此错过了最近的发展。 Arnold 表示,PARAT 中的其他指标揭示了有时被忽视的 AI 活动。比如,PARAT 涵盖了各公司 AI 岗位的数量,从社交媒体平台 LinkedIn 进行收集。 这些数据对美国公司最为准确,从中我们可以看到哪些公司吸引到了最多的 AI 人才。 按这一指标,亚马逊以 1.4w 个 AI 岗位成为榜首,但紧随其后的是跨国咨询公司埃森哲。按照 Arnold 的形容,大型咨询公司现在是其他公司和政府 AI 项目的「雇佣兵」。 这些数据能让我们通过多种视角审视公司的在 AI 领域的动态。 「我们看到很多关于『谁在 AI 领域领先』的讨论。我们是数据迷,我们知道有许多不同类型的数据可以用来回答这个问题,而且它们并不总是指向完全相同的方向。」
超三千种色彩搭配,戴森新耳机太潮了
收到戴森大礼盒,打开以为是月饼,没想到是耳机。 这三个词放一块,不能说毫无关系,只能说九唔搭八。 没错,就是那个做吸尘器、做吹风机的戴森。去年它的空气净化耳机像个面具,这次它做了一个纯音频的耳机。 但,还在继续整活。 关于这款耳机我想说两个方面,第一个,作为耳机它的表现怎样。 它的重量看起来夸张,但是戴头上其实并没有很重的感觉。 戴森的头梁用的是气垫设计,电池像马鞍一样横跨两侧,耳罩很大而且很软,人体工学方面做得很不错,其实佩戴还挺舒服的。 而牺牲重量换来的是长达 55 个小时的降噪续航,哪怕每天上下班都要坐两个小时地铁,充一次电就能听一个月。 机身有三种控制方式,按键控制电源和蓝牙,摇杆切歌调音量,拍两下切换降噪。有个很酷的音效,一定点开视频听听看! 它的频响范围由 6Hz 到 21KHz,远超人耳可以听到的范围(20Hz-20KHz),就像汽车的极限速度,代表整机的设计规格更高。 降噪和音质的对比效果请戳视频~ 要讲的第二个方面是设计。 外壳可以拆,耳罩可以换,各有 7 种颜色,甚至不装外壳也能算一种,算下来能有三千多种组合。 除了颜色出挑,工艺也有不同,表面的光泽纹理各不相同、随心搭配。 有人笑这是「科技以换壳为本」,但颜色和质感的呈现,代表着品牌在许多方面的综合实力。 色彩、材料和工艺之间的碰撞,也正是工业设计的魅力所在。 以苹果 AirPods Max 为例,耳机正在成为时尚潮流的一部分。 戴森作为跨界者,一定不能只是做一个降噪耳机,而时尚,恰好就是戴森的关键词——不管是吸尘器还是电风扇,吹风机还是卷发棒,它们的造型、配色都独具一格。 市面上的耳机产品千千万,工程师将控制马达噪音的理解和戴森独特的美学理念,延续到了这款音频产品上,赋予它强烈的品牌符号。 让人只需远远看一眼就知道—— 噢 是戴森的!
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
IT之家 8 月 2 日消息,据摩尔线程公众号今天的推文,在第十二届互联网安全大会期间,摩尔线程与 360 集团宣布达成战略合作伙伴关系,并现场签署了战略合作协议。 双方此次合作旨在聚焦数字安全、信息与数字化服务及大模型等领域的创新应用,共同构建一个更加强大、可靠的人工智能生态系统,为各行各业提供先进的技术支持和服务。双方还将携手打造“360 智脑大模型一体机”,加速推动人工智能技术的发展与应用,为大模型行业的发展注入强劲动力。 据介绍,“360 智脑大模型一体机”集成了 360 智脑大模型,具备大模型管理、推理部署等功能,摩尔线程全功能 GPU 将为其提供底层算力,“以高性价比硬件方案确保大模型推理效率和成本的平衡”。双方还将共同研发和优化推理框架,在软件层面深入定制,致力于为大模型推理带来更具竞争力的方案。 360 大模型产品也已经与摩尔线程完成适配,基于摩尔线程夸娥(KUAE)千卡智算集群,360 集团已成功完成了 70 亿和 700 亿参数的大模型分布式训练任务。摩尔线程方面称,测试结果显示全程软硬件即插即用,集群训练稳定性达到 100%,训练效率和兼容性均达到预期。 据IT之家此前报道,今年 7 月,摩尔线程宣布其 AI 旗舰产品夸娥(KUAE)智算集群解决方案从当前的千卡级别扩展至万卡规模。摩尔线程夸娥万卡智算集群以全功能 GPU 为底座,打造能够承载万卡规模、具备万 P 级浮点运算能力的国产通用加速计算平台,号称专为万亿参数级别的复杂大模型训练而设计。
AMD 用 AI 给游戏插帧,集成显卡也支持
将 AI 使用在游戏上,不算什么新鲜话题。 更多的时候,大家将注意力放在游戏内容上,期望 AI 的存在能给游戏内容带来更多的可玩性和丰富度。在 CES 2024 上,英伟达展示了基于 Avatar Cloud Engine(ACE)技术打造的最新成果,游戏中的 NPC 借助 AI 仿佛拥有了自己的生命,与其他角色甚至玩家展开对话。 除了为游戏提供更丰富的内容,AI 也一直在为游戏更好地运行提供帮助。 早前,AMD 推出了自家的 AMD Fluid Motion Frames(AFMF)技术,让玩家在不需要特定的硬件支持下就能拥有帧数提升所带来的流畅显示画面,并在 Adrenalin Edition 的升级中持续更新,使用者只需要打开 HYPR-RX 配置,不管游戏支持与否都能提供生成补帧的效果。 而随着 AI 技术的进步,与玩家对游戏要求的提高,AMD 公布了 AMD Fluid Motion Frames(AFMF)技术的迭代升级,相较于第一代,AFMF 2 预览版配备了 AI 增强技术以及更多使用者自定义模式,来提升画面的品质、降低延迟以及提高帧数。 在自定义功能中,AFMF 2 提供了两个不同的模式:分别是最大力度提高画质与帧率的「Search」模式与降低功耗并保证游戏流畅运行的「Performance」模式。 ▲「Search」模式设置界面 在 Search 模式下有三个档位,Standard 档位为 1080p 画面提供技术支持,而 High 档主要为 1440p 及以上画面进行优化。搜索模式时,AMF 2 会在高动态场景中禁用帧生成来避免画质产生抖动,保证图像质量和平滑度,而 Auto 档则会根据画面分辨率进行自主调整。 AMD 表示: 不管使用「Search」模式下的哪个档位,AFMF 2 的画质都比 AFMF 1 提升了相当多。 AFMF 2 提供另外一个模式是 Performance,在这里除了 Auto 档外,提供了 Quality 与 Performance 两种不同的设定选择,在 Auto 设定时,会自动调整成品质取向设定,这部分跟 AFMF 1 是相同的。不过这次 AFMF 2 在这边多出了一个 Performance 模式,选择此档位使用 AFMF 2 的话,可以降低性能消耗,在更多设备上实现高帧率游戏体验——尤其是集成显卡上。 ▲「Performance」模式的设置界面 帧数提高只是 AFMF 2 的手段之一,在帧生成带来延时的问题上,AFMF 2 也带来改善,AMD 宣称不管使用任何设定模式、分辨率或硬件,只要开启 AFMF 2 的 AMD HTPR-RX 功能,就有相当显著的延迟降低效果,比如在 Cyberpunk 2077 游戏中,以 4K 解析度,同时开启最高档光线追踪的设置下,AFMF 2 比起 AFMF 1 降低了 28% 的延迟。 另外 AFMF 2 也可以与新的 AMD Anti-Lag 2 技术结合,在追求反应速度、高帧率的 FPS 游戏中,提供高帧率低延迟效的游戏体验,哪怕在集成显卡上也是如此。AMD 展示了在配备 AMD Ryzen 7 8700G 处理器以及 Radeon 780M 集成显卡的电脑里运行 CS 2,将 AFMF 2 与 Anti-Lag 2 技术同时开启,可以在 1080p 解析度、画质非常高的设置下,达成 120 fps 以上的显示帧率,并且降低 12% 的延迟。 目前 AFMF 2 支持自家 RDNA 2 以及更新的 RDNA 显卡架构,AMD 官方列出了在不同 RDNA 显卡架构中,AFMF 2 在预设的自动设定下会采用的设定模式: 另外 AFMF2这次也对无边界全屏的显示设定以及使用 Vulkan 与 OpenGL API 的游戏,以及 AMD 自家的 Radeon Chill 自动更新率调整功能提供更好的支持。 今年以来,AMD 进入了一个发布高峰期,宣布了多项硬件的问世:适合游戏与创作的基于 Zen 5 架构的 Ryzen 9000 系列处理器、集成强大 AI 计算能力和图形性能的 Ryzen 8000 系列处理器、适用于服务器与数据中心的 EPYC 9005 系列处理器…… 在密集发布硬件的同时,AMD 也推出了一系列加持 AI 的软件技术,赋予硬件更强大的性能——AFMF 2 也是其中之一。 而到现在,2024 年才刚刚过半,在下半年的时间里,AMD 在游戏与性能上还能给我们带来什么样的惊喜,值得令人期待。
高端鼠标歇菜了!要用AI闯出一片天?
大家上一次买新鼠标是什么时候的事情呢? 对于小雷这样的「网瘾少年」来说,一款鼠标往往就是「一辈子」的事情——游戏玩家对鼠标的外形、重量、重心分布和按键手感有极为严格的要求,这也导致在绝大多数情况下,大家都不会轻易尝试更换鼠标。即使旧鼠标有问题,往往也会买「同款」而不是新款。 再说了,罗技和雷蛇在国内都有非常不错的售后服务,即使鼠标「时日已尽」,也可以通过官方售后免费「续杯」换新,颇有「薅羊毛」的意思。可惜的是,这种动不动就「续杯」的日子,可能马上就要到头了。 图片来源:Logitech 在 The Verge 对罗技新 CEO 汉内克·法贝尔(Hanneke Faber)的采访中,法贝尔提到了一个非常有趣的观点: 未来有可能你一直用同一款鼠标,但我们(罗技)会为你的设备新的软件功能,只要你「订阅」的话。 没错,就连鼠标这种「一手交钱一手交货」的生意,罗技也想引入互联网思维了。 传统鼠标的困局 在过去的几十年里,鼠标作为计算机的标准外设,经历了从滚轮鼠标到光电鼠标,再到无线鼠标的多次技术革新。然而,近年来传统鼠标市场面临着越来越大的挑战和困局。市场销售数据也显示出,鼠标行业的增长速度已经明显放缓,甚至出现了下滑的趋势。 根据市场研究公司 GfK 的数据,全球鼠标销量在过去几年里保持平稳,但增长率却在逐年下降:2019 年全球鼠标销量同比增长仅为 1.2%,而到了 2022 年,这一数字降至 0.5%。不可否认的是,在疫情期间,由于远程办公和在线学习的需求,笔记本电脑、显示器等产品的销量因居家办公而上涨,耳机、鼠标键盘等外设的销量也一同出现小幅上升,但随着居家办公概念的淡出,这类科技消费品的销量也随之回落。 而这种销量下滑的困局,在我看来主要有三个原因。 首先是市场饱和的原因。鼠标作为一种耐用工具,本身就是一个高度饱和的存量市场。绝大多数用户对鼠标的需求就是「连接稳定」「按键不坏」「续航够长」,这种极为根本的用户需求让鼠标成为了一个门槛极低的外设产品。 没错,好的鼠标讲究人体工程学设计,能让用户「久用不累」,来能延缓「鼠标手」(腕管综合征)的出现,但这一切都需要加钱,而鼠标的低技术门槛让鼠标的终端售价屡屡触底。毕竟对用户来说,鼠标差一点就差一点,「又不是不能用」。 图片来源:京东 其次是鼠标技术进化缓慢的问题。而对于高端鼠标的用户,比如职业玩家来说,除非赞助商有变,否则他们几乎不会更新自己的鼠标。虽然新款鼠标在外形设计、传感器精度和无线技术上有所改进,但这些改进相对有限,难以吸引高消费力用户的购买欲望。 再说了,和日新月异的智能手机相比,鼠标的技术革新速度较慢,功能创新也较少。当前市面上的高端游戏鼠标「迭代」,无非就是改用了更利于「偷轻」的蜂窝设计,或用上了更高刷新率的传感器。在核心功能上,鼠标始终还是那个样子。甚至在鼠标这么多年的发展进程中,除了有线变无线之外,最显著的功能进化甚至是多年就已经弃用的「鼠标平滑」功能。 最后,智能手机、平板电脑的出现也给鼠标带来了全新的危机。不同与精准指向交互的电脑,以模糊操作为主的智能手机、平板电脑成为了大多数用户的首要娱乐设备。而鼠标作为电脑的周边外设,自然也会「结构性失业」。 综上所述,传统鼠标市场的困局主要源于市场饱和、技术创新乏力和替代品的出现。虽然面临诸多挑战,但通过技术创新和商业模式的转变,鼠标制造商依然有机会在这个竞争激烈的市场中找到新的发展空间。 鼠标也要「碰瓷」AI ? 那么鼠标该如何提升自己的竞争力,从而避免「结构性失业」?或者说法贝儿想用什么功能打动罗技用户,让他们心甘情愿为鼠标持续付费呢? 没错,居然还是 AI。 采访中,法贝儿提到了罗技的 Logi AI Prompt Builder。简单来说,这是一个可以用鼠标快速呼出的 AI 界面,可以为用户提供快速回复邮件、修改文本、总结文本等操作。尽管这个功能是一个软件功能,但遗憾的是,这个功能集成在了罗技的办公鼠标软件 Option+ 中,而只有特定的几款新鼠标可以使用这个全新的 Option+。 图片来源:Logitech 换句话说,用户还得买新鼠标。但在「订阅制」的设想下,用户可以继续用自己的旧鼠标,只要每个月定时给钱,就能用上最新的 AI 功能。根据介绍,这个 Logi AI Prompt Builder 目前已经有数百万的用户。这种用 AI 给鼠标「赋能」的做法,确实也能为罗技带来新的收入点。 但问题在于,现阶段所有的 AI 都只能算一种服务(有些甚至只能算是一个 App),而不是一种硬件。这意味着用户有多种不同的方式可以获取 AI 的服务。既然有网页、App 这种更通用的选项,为什么用户还要在鼠标这一种产品上「锁死」呢? 或者这么说,小雷不打游戏时只用 Apple 的触控板,但这并不妨碍我用 ChatGPT 搜食谱、用 Stable Diffusion 画壁纸、用 AI 插件给视频插动作模糊。 罗技作为硬件品牌,想让自己的产品成为 AI 的入口,但 AI 最不缺的就是「入口」。 国产鼠标有希望赶超吗? 话又说回来,国际品牌增长放缓,那这是否意味着国产鼠标品牌将迎来赶超的机会呢? 在我看来,很难。虽然硬件性能上确实对标了大厂的次旗舰产品,但是在外形设计、无线连接稳定性、固件等方面都依然有着明显的差距,很难满足高要求用户的标准。 对于国产品牌来说,设计与固件开发等方面的能力缺失,确实使其无法在中高端市场上与大厂竞争,只能以高性价来抢夺低端市场。在我看来,以上问题在短时间内并不好解决,每一项都需要投入不少的人力与物力,而代工厂的技术有着一定上限,显然是无法满足厂商进军高端市场的需求。 当然了,国产 AI 的出现确实为国产新势力鼠标的带来了同场竞技的机会。毕竟国内 AI特殊的付费模式极大降低了用户接触 AI、使用 AI 的成本。但是在价格差距不大的情况下,多年的口碑积累和更稳定的体验会让游戏玩家更倾向于大厂的产品。 图片来源:Logitech 而且,罗技与雷蛇在传感器上的优势是国产厂商暂时无法追上的,罗技自研的 Hero 传感器性能出色且成本低廉,已经被罗技普及到入门级产品线。而雷蛇则与传感器巨头原相有着密切关系,原相的最新一代旗舰传感器基本上独供雷蛇,使其他厂商与雷蛇有明显的代差。 可以说,经营市场多年的大厂们有着不少的优势,想要挑战大厂的地位,国产新势力要面对的困难还有很多。但在硬件与成本难以拉近距离的时候,AI 的出现很可能是国产鼠标赶超国际大牌的最好机会。 毕竟更懂中国用户的,还得是中国 AI。
戴森进军降噪耳机,我们去英国探访了它背后的故事
风生水起的头戴式降噪耳机市场,即将迎来一位新晋却强劲的选手——戴森。这个以数码马达为核心科技、以吸尘器、吹风机闻名的科技品牌,正努力把产品从家庭推向街头。 新耳机名为 Dyson OnTrac,与其说这是一款音频设备,倒不如说这是一个具备清洁能力的可穿戴设备。只不过 OnTrac 净化的不是空气,而是城市交通里无处不在的引擎轰鸣、手机扬声器突如其来的鬼畜笑声,以及办公室里急促的机械键盘声。 一个月前,戴森首席工程师 Jake Dyson 在伦敦向爱范儿在内的全球媒体展示了这款设备。为了这款耳机,他们打磨了数年。 OnTrac,成熟得不像第一代产品 起源于 20 世纪 70 年代的降噪耳机,最初为了帮助飞行员减少机内噪音。历经数十年的迭代,主动降噪耳机的技术和市场都已经非常成熟。 设计、降噪、音质——这些维度构成了用户体验的「不可能三角」。个体生理结构的差异,更是使得音质和佩戴舒适性更是成为因人而异的玄学。比如在舒适性和降噪独树一帜的 Bose 就在设计与音质上稍逊一筹,而在设计和体验拉满的苹果 AirPods Max,就在佩戴舒适性上饱受诟病。 Dyson OnTrac 的设计风格延续了戴森家族式的特征,棱角分明,属于人群中一眼难忘的类型。耳罩体积很大,头梁和机身结构也都很宽。规整、严谨中透露的轻快,很容易让人想到当年诺基亚多彩的 Lumia 手机。 OnTrac 采用混合式主动降噪技术,8 个主动降噪麦克风,每秒监测周围的噪音 384000 次,耳罩内外的麦克风产生反相频率,与被动降噪相结合,从而消除背景噪音。 ▲ 实体的操控杆,可以操控音乐播放及语音助手 尽管没有机会做现场对比,但凭借对 Bose 和 AirPods Max 多年的使用经验判断,OnTrac 的降噪水平属于第一梯队,耳压的处理非常舒适。 ▲ 双击耳机外壳,可在沉浸模式、通透模式及交谈模式之间切换 戴森定制了两个 40 毫米、16 欧姆扬声器单元,以 13° 倾角的方式向耳朵传递声音,6Hz-21000Hz 覆盖了人类听力之外更多的频响范围。 这就像你买了一辆跑车,它可以达到每小时 250 英里的速度,但你不一定需要开到这么快。但事实是,它能够达到这么快的速度,意味着在你通常的行驶速度下,它的性能会更加稳定和受控。 戴森声学工程师 Alex Woodfield 在接受爱范儿采访时这样解释。 OnTrac 在音质上实现了质的飞跃,尤其在低音表现上,相比前作 Dyson Zone 有显著改善,强劲有力,富有弹性。 ▲OnTrac 支持佩戴检测,取下耳机音乐暂停,重新戴上恢复播放 在开启主动降噪的前提下,OnTrac 的续航达到了惊人的 55 小时,是同类产品两倍以上。耳机配备了两块锂电池组,均匀地分布在头梁的两端,工程师说灵感来自于马鞍。 配图:MyDyson app,预设三种 EQ 均衡器设置,支持自定义。 降噪和续航上的拔尖,使其重量也超出预期,451g 的重量超过了 AirPods Max。好在通过设计,戴森保证了 OnTrac 佩戴的舒适性。只要不是特别剧烈的晃动,耳机不会有压头和晃动感,也并不夹耳朵。 OnTrac 可能是第一款「科技以换壳为本」的耳机——外盖和耳垫均可更换。耳机本体有银、黑、金、橙四种配色,但戴森却开发了 7 种颜色的外盖和耳垫,算下来用户可以有 196 种个性化混搭方案。 ▲ 外盖由铝合金 CNC 加工而成,包括陶瓷镀膜、金属拉丝和阳极氧化 和 AirPods Max 一样,OnTrac 不支持折叠收纳,整体体积较大,但戴森为此设计了轻薄的收纳包,取出耳机后收纳包可压平,节省空间。 尽管也有明显的不足,但 OnTrac 在核心的音质与降噪表现上达到了业界领先的水平,而设计和颜色混搭的差异性上,戴森显示出足够的技术实力。 降噪:一个因马达而诞生的产品 伦敦以西 130 公里威尔士郡的 Malmesbury,远离城市的纷扰,这里便是戴森全球研究、设计和开发中心 Dyson Village 的所在地。在这片这片广袤而宁静的土地上,汇聚了 14000 名员工,其中一半都是工程师。 Hullavington 一座退役的皇家空军机场被赋予新生,硕大的机堡被改造为办公区和实验室,草坪一角陈列着一台 1943 年的劳斯莱斯 RB23 Welland 喷气发动机。 这是世界上运行状态最古老的喷气发动机,也是唯一一台不在博物馆中的同类型的发动机,目前由一小批戴森工程师进行日常维护。 一位嬉皮士装扮的戴森工程师启动了这台年过半百的发动机。引擎的轰鸣夹杂着炽热的火光,让在场所有人不禁捂住了耳朵。 我本以为这是 OnTrac 秀肌肉的环节,但除了长达三分钟的轰鸣,什么都没发生。站在这里只是为了感受戴森的动力之源。 某种意义上,这台发动机代表着戴森的精神图腾。吸尘器、干手器、吹风机…… 戴森的产品品类看似五花八门,但剥丝抽茧,大多都离不开一颗马达的驱动。 为了牢牢掌握这项核心科技,戴森在新加坡总部建立了先进制造中心,专门用于生产数码马达这一个零部件。在全球供应链分工明确的今天,很少有消费电子科技公司会自建工厂。 故事的起源可以追溯到 30 年前,当时我的父亲詹姆斯和五位工程师开发了双旋风真空吸尘器,机器由一个强大的电机的驱动,然而电机和耳机噪音很大。 首席工程师 Jake Dyson 说,「当一个造型师在你耳边运行一个 120,000 RPM 的电机,降噪就特别重要。」 Supersonic(超声波)是戴森吹风机的名字,将声学名词用于吹风机的命名,足见降噪技术在工程师心中的份量。 吹风机搭载的 V9 马达,尽管可以驱动很大的风量,但产生的尖锐噪声令人不适。 「马达的设计并不是转得越快就越好。」工程师向爱范儿解释。转子是马达的核心部件,充当旋转磁场。在开发马达中的转子时,每一个转子都必须保证质量的平衡,才能让转子减少振动,降低噪音。 马达和空气动力学工程师需要对马达进行改进,他们会把产品放在声学实验室中央进行试验,墙壁布满的楔形吸音海绵能够完全消除低至 100 赫兹的音波反射,周边数个高灵敏度定向采音麦克风会对噪音进行采样分析。 ▲ 过去十年里,戴森在全球建立了 5 间声学实验室 经过一系列的尝试,工程师将 11 个马达叶片增加了 2 个,这使得马达产生的其中一个声音频率调协到人类听觉范围之外,即超声波。Supersonic 这个名字也由此而生。 Jake Dyson 告诉爱范儿,城市噪声污染很大一部分就来自于引擎和马达。而戴森工程师大约 20% 的时间都花在声音控制上。 我们对真空吸尘器电机噪音、吹风机电机噪音的隔离和控制的理解,都延续到了对音频的处理上。 发现问题,用技术驱动下一个产品 「我们要发现那些别人忽略的问题。」戴森英国一间办公室里,赫然挂着这样一副巨大的标语。 类似的格言有很多,比如戴森新加坡技术中心前台的那句:“As engineers,we have to see beyond existing technology and ask if there a better way。(作为工程师,我们必须超越现有技术,追问是否有更优解。) 戴森诸多爆款都出自这种产品观的指导,比如 Supersonic 吹风机造型独特颇具未来感,但镂空的设计只是搭载高速吹风机的结果,戴森观察到的问题是:吹风机吹干头发很慢,又容易灼伤头皮,本质问题是风量太小。 Jake Dyson 告诉爱范儿,在头戴式耳机领域,降噪效果和舒适性是容易被忽视的关键,为此他们研究了全球 95% 的头型,力求耳机贴合各种用户需求。 与马达降噪主要利用空气动力与精密调试不同,耳机的降噪效果受到多种因素的影响,不仅涉及电子工程,还关乎材料科学和 CMF(颜色、材料和表面处理),比如耳垫的结构设计和材质选择,都能显著影响隔音效果和音质。 因为这样复杂性,工程师与设计师的角色界限往往是模糊的,每一位投身于工程研究、设计或开发的人,都被视为工程师或科学家。「设计」一词也超越了传统美学的范畴,而是关乎产品体验的一切,包括技术、工程、如何制作它、性能如何、它将如何被使用、它能续航多长时间——这些问题都称之为设计。 这就好比文艺复兴时期的雕塑家,他们既是审美超群、手艺精湛的艺术家,又是懂得如何选择石料如何开采乃至如何运输的工匠。 戴森的工程师团队遍及英国、新加坡和马来西亚,虽然地理位置相距遥远,但这并未成为沟通的障碍,他们反而借助时差和制造业差异加速了研发进程。 今天我们在伦敦提出想法,设计 3D 模型,夜间发送给新加坡团队,新加坡的团队紧接着就用 3D 打印机制作原型并测试,第二天一早就可以告诉我们问题所在、如何改进。这使我们能够比单一地点开发更敏捷地进行研发。 工作了 13 年 James Terry-Collins 是戴森副总裁,负责机器人前端开发和可穿戴品类。他这段话一定程度上解释了为何戴森可以在短短几年时间,从零追赶那些拥有数十年经验的公司。 在戴森的前三十年里,万物皆马达,但事情正在发生一些变化。 好奇心引领着公司接二连三地进入到不同的领域,包括机器学习、电子硬件、传感器开发、音频领域。 James Terry-Collins 说。 戴森不去试图押注 the next big thing,而是聚焦从改进产品的角度去 reshape 世界。从搭载马达的家电产品,到如今因马达间接衍生的降噪耳机。看似无序的领域扩张背后,实则是技术演进的自然结果。 当一项已有的技术落地在一个全新的场景上,一个新产品就应运而生了。 8 年前的戴森 Supersonic 如此,今天的戴森 Ontrac 亦是如此。
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
作者 | 香草 编辑 | 李水青 最强开源文生图模型一夜易主! 智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。 FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流模型,较小规模的FLUX.1[schnell]也超越了Midjourney v6.0、DALL·E 3等更大的模型。 ▲FLUX.1 ELO分数与主流模型对比 FLUX.1在文字生成、复杂指令遵循和人手生成上具备优势。以下是其最强的专业版模型FLUX.1[pro]生成图像示例,可以看到即使是生成大段的文字、多个人物,也没有出现字符、人手等细节上的错误。 ▲FLUX.1[pro]生成图像示例 FLUX.1现已在开源平台Replicate上可用,以下是我用提示词“世界上最小的黑森林蛋糕,手指大小,被黑森林的树木包围”,在三款模型上生成的图像,用时分别为17.5s、12.2s、1.5s。 ▲三款模型生成对比 FLUX.1同时开放了API(应用程序接口),按图像张数定价,三款模型的价格依次为每张图片0.055美元、0.03美元、0.003美元(约合人民币0.4元、0.22元、0.022元)。 FLUX.1背后的公司名为Black Forest Labs(黑森林实验室),由Stable Diffusion原班人马、多位Stability AI前研究员成立。与Stability AI类似,黑森林致力于研发优质多模态模型并开源,目前已完成3100万美元(约合人民币2.25亿元)的种子轮融资。 黑森林还预告不久之后将发布SOTA(当前技术指标第一)视频模型。从其放出的Demo来看,无论是流畅度、稳定性还是物理模拟都达到第一梯队水平,该公司或许会成为视频生成领域的一匹黑马。 ▲视频生成模型预告 三款模型试用地址: https://replicate.com/black-forest-labs/flux-pro https://replicate.com/black-forest-labs/flux-dev https://replicate.com/black-forest-labs/flux-schnell 一、擅长生成文字、人手,三种模型规模秒级生成 FLUX.1在视觉质量、图像细节和输出多样性等方面性能优越,其具有三大特点:文字生成、复杂构图、人手描绘。 文字的生成在图像、视频生成中非常重要,许多模型容易混淆看起来相似的字母。FLUX.1可以处理重复字母的棘手单词,例如生成一个黑森林Flux Schnell蛋糕: ▲黑森林Flux Schnell蛋糕 在构图方面,FLUX.1擅长按照图像中事物应该位于哪里等复杂指示进行操作。例如,FLUX.1完美地演绎了这段提示词:三个魔法巫师站在一张黄色桌子上,每个巫师都拿着一个标志。左边,一个穿着黑色长袍的巫师拿着一个写着“AI”的标志;中间,一个穿着红色长袍的女巫拿着一个写着“is”的标志;在右边,一个穿着蓝色长袍的巫师拿着一个写着“cool”的标志。 ▲复杂构图 人手一直是多模态生成模型的重灾区。FLUX.1生成的人手图像虽然还不够完美,但实现了很大的进步。 ▲人手 FLUX.1共有专业版、开发者版、快速版三种版本。 其中,FLUX.1[pro]是最先进的一个版本,具有顶级的即时跟踪、视觉质量、图像细节和输出多样性,面向专业用户提供定制的企业解决方案。 ▲FLUX.1[pro]生成图像示例 FLUX.1[dev]面向非商业应用,它从FLUX.1[pro]提炼而来,具有相似的质量和能力,同时比相同尺寸的标准模型更高效。 ▲FLUX.1[dev]生成图像示例 FLUX.1[schnell]是三款模型中最快的,专为本地开发和个人使用而定制,并根据Apache 2.0标准许可公开提供。 ▲FLUX.1[schnell]生成图像示例 FLUX.1现已在开源平台Replicate上可用,只需一行代码即可在云端运行,用户也可以下载模型权重并以编程方式运行。FLUX.1的API也同步开放,三款模型的价格依次为每张图片0.055美元、0.03美元、0.003美元(约合人民币0.4元、0.22元、0.022元)。 二、击败MJ V6、DALL·E 3,技术报告即将发布 性能方面,FLUX.1经过特别微调,在预训练中保留了整个输出多样性,在指令遵守、视觉质量、尺寸/长宽变化等多个方面树立了新标准。 其中FLUX.1[pro]和[dev]两款模型,在5项测评标准中都超过了Midjourney v6.0、DALL·E 3和SD3-Ultra等热门模型。 FLUX.1[schnell]作为轻量级模型,不仅优于同类竞争对手,还优于Midjourney v6.0、DALL·E 3等强大的非蒸馏模型。 ▲FLUX.1性能与主流模型对比 此外,所有FLUX.1模型均支持0.1和2.0百万像素的多种宽高比和分辨率。 ▲宽高比/分辨率变化 如此强大的性能是怎么做到的? 在模型架构上,FLUX.1采用基于多模态和并行扩散Transformer模块的混合架构,并将其扩展到12B参数。 团队通过建立流匹配(Flow Matching)来改进最先进的扩散模型,并通过结合旋转位置嵌入(Rotary Position Embedding)和并行注意力层,来提高模型性能和硬件效率。更详细的技术报告将在不久后发布。 三、SD原班人马,2.25亿种子轮,要发SOTA视频模型 黑森林实验室由Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。 Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Rombach、Andreas Blattmann、Dominik Lorenz以及Patrick Esser,都在黑森林实验室的创始团队中。 ▲Stable Diffusion作者、黑森林实验室创始团队 该团队称,其核心信念是开发广泛可访问的模型,促进研究界和学术界的创新和协作,并提高模型透明度。 黑森林实验室宣布已完成3100万美元(约合人民币2.25亿元)的种子轮融资,由知名风投机构a16z(Andreessen Horowitz)领投,VR制造商Oculus的CEO Brendan Iribe、创企孵化器YC的CEO陈嘉兴(Garry Tan)、英伟达研究员Timo Aila等专家及AI公司跟投,还收到了来自General Catalyst等一线基金的后续投资。 该团队的顾问委员会,包括在内容创作行业拥有丰富经验的前迪士尼总裁Michael Ovitz,以及神经风格转换的先驱Matthias Bethge教授。 刚刚创业的AI大神安德烈·卡帕西(Andrej Karpathy)为黑森林团队送上祝福,并称“开源的FLUX.1图像生成模型看起来非常强大”。 ▲卡帕西评论 创始团队的前领导——Stability AI前CEO埃马德·莫斯塔克(Emad Mostaque)也发来贺电,还说“之前能与他们合作是我的荣幸,我相信他们会继续在生成每一个像素的旅程中突破界限”。 ▲莫斯塔克评论 在下一步的工作上,黑森林预告将发布一款SOTA文生视频模型,“让所有人都能将文本转为视频”。该模型将建立在FLUX.1的基础上,“以高清和前所未有的速度实现精确创作和编辑”。 ▲视频生成模型预告 结语:多模态大模型领域黑马涌现 在众多大厂、创企狂卷文生视频之际,文生图领域突然迎来黑马。“横空出世”的FLUX.1的不仅展现出卓越的性能,在文字生成、复杂构图、人手描绘等方面突破难关,还以多样化的版本满足不同用户的需求。 黑森林实验室凭借着Stable Diffusion原班人马的强大实力,获得了丰厚的种子轮融资,也吸引了众多行业大咖的关注与支持。其后续将发布的视频模型,又将为文生视频领域注入新的活力。
有望不到5000元!高通:骁龙X笔记本2024年会便宜的
快科技8月2日消息,高通的骁龙PC笔记本其实已经做是第四代了,但是对于最新的骁龙X Elite/Plus笔记本,大家关心或者说担心的问题,除了生态兼容性,最大的还是价格……太贵了! 在国内,骁龙X笔记本最便宜的是宏碁非凡Go Pro,也要高达6599元,只有首发阶段短暂地有过5999元。 然后就是华硕无畏Pro15 2024,目前要8199元,比首发还贵了200元。 其他还有:微软Surface Laptop 7 8388元起、微软Surface Pro 11 8688元起、联想Yoga Air 14s 9969元起、联想ThinkPad T14s 10999元起、戴尔Latitude 7455 12999元起。 在海外,骁龙X笔记本更是普遍在1000美元之上,比如新蛋上华硕无畏Pro15 2024 1260美元,联想ThinkPad T14s 1220美元。 当然也有狠心的,比如惠普OmniBook X,首发1200美元,如今竟然杀到了899.99美元。 高通显然也意识到了这个问题,高通CEO安蒙在季度财务会议上表态:“展望2025年,除了新的产品设计,骁龙X系列笔记本的零售价格将会低至700美元,同时不会牺牲NPU AI性能。” 由于中外价格差异不能简单地按照汇率计算,但是看目前的样子,如果能说到做到,骁龙X笔记本在国内有望最低来到5000元之下。 当然,最低价不能说明一切,还是要把主流价位拉下来,集中在六七千元才是比较合理的。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。