行业分类:
加载中...
头条分类:
加载中...
世界在建单机容量最大塔式光热发电项目开工,位于青海
IT之家 3 月 15 日消息,据中国电力建设集团(中国电建)消息,近日,由中国电建牵头 EPC 总承包的全球在建单机容量最大的塔式光热发电项目正式开工。 青海德令哈光储热一体化 200 万千瓦项目位于青海省海西州德令哈市光伏产业园区,规划面积约 5.3 万亩,项目总装机容量 200 万千瓦,配置光伏 160 万千瓦、光热储能 40 万千瓦,投产后年上网电量可达 36.5 亿度。 其中,一期塔式光热 20 万千瓦项目由中国电建所属西北院牵头 EPC 总承包,是全球在建单机容量最大塔式光热发电项目。 据介绍,整个项目采用了光伏发电、光热储能相结合的可再生能源发电技术,通过光热储能发电机组和电加热装置有效吸收光伏弃电,结合光伏、光热的出力特性,形成一体化多能互补发电项目。建成投产后年上网电量可达 36.5 亿度,将实现光伏、光热、储能协同发电技术的科技创新与示范应用。 与光伏发电项目相比,光热发电项目可以通过吸收太阳光转化为热能,再通过发电机组将热能转化为电能,兼具调峰电源和储能双重功能,可以连续、稳定输出,实现 24 小时不间断供电。 ▲ 图源中国电建 IT之家查询获悉,2023 年 11 月,中国电建集团西北勘测设计研究院有限公司、中电建湖北电力建设有限公司与西北水利水电工程有限责任公司的联合体中标该项目 EPC。 按照规划,一期新建 800MW 光伏 + 200MW 熔盐塔式光热发电项目,二期新建 800MW 光伏 + 200MW 熔盐槽式光热发电项目。
记录孩子成长瞬间,商汤科技元萝卜家族首次集体亮相AWE 2024
“这样的坐姿会伤害你的眼睛和脊椎哦”,“白棋棋形已被破坏,通过打吃收气”。在熙熙攘攘、热闹非凡的会场上,一台台简约酷萌又科技感十足的机器人吸引了不少人的围观,有的和它下棋,有的在探究它如何知道自己的坐姿……每一次与机器人的互动,都让观众们感受到了AI带来的新奇与乐趣。 3月14日,备受瞩目的“全球三大家电展”之一的2024年中国家电及消费电子博览会(AWE 2024)在上海盛大开幕,以“智能科技、创享生活”为主题,全景化呈现智慧生活新场景、新产品、新技术。商汤科技“元萝卜SenseRobot”家族首次集体登上世界级的科技盛会舞台,不仅带来了能够在真实棋盘上下象棋、围棋的AI下棋机器人,更有首次在线下展会与大众见面的元萝卜光翼灯,为孩子的健康学习与成长保驾护航。 作为商汤科技首个进入家庭的电子消费系列产品,元萝卜承载了商汤科技“以人为本、为爱而生”的理念,致力于让AI技术看得见、摸得着、用得上,走进千家万户。从多元化的家庭场景需求出发,元萝卜如同不断进化的“AI智能体”,以硬核的技术驱动人机交互的革命性体验,化身孩子学习成长的守护者、益智培养的好导师,开启AI时代智慧家庭的全新生活方式。 学习成长的守护者 在学习成长过程中,很多孩子很难长时间保持正确的坐姿,家长的唠叨式监督也会无形中增加双方的压力。元萝卜光翼灯将科技“光源”注入家庭学习场景中,不仅有着优于国家AA级认证指标的全光谱光源,更实现了“AI坐姿提醒、AI专注力检测、AI聚光灯”三大AI创新功能,既是孩子双眼、脊柱健康和学习专注力的守护者,也是让家长放心、更懂孩子的贴心伴侣。 其中,“AI坐姿提醒”可以在孩子出现不良坐姿时发出语音提醒,帮助孩子坐直坐正;“AI专注力检测”可形成可视化日报和周报,展现孩子专注力占比等数据,让家长全面了解孩子的学习状态。此外,元萝卜光翼灯还首创了“AI光随书动”功能,使光源自动聚焦于绘本,创造沉浸式照明环境,引导孩子快速进入专注状态。 在展会现场,很多孩子们怀着好奇的心态,纷纷模拟自己平日的学习读书情境,亲自“测评”元萝卜光翼灯的守护能力。他们发现,无论是眼睛离桌面过近,还是身体倾斜托腮,只要时间一长,元萝卜都能精准无误地发出温馨提示。对于元萝卜的提醒,孩子们十分配合,纷纷调整坐姿保持端正,身旁的家长们也能通过手机APP实时查看分析报告。“比家长提醒更管用”是现场很多家长的直观反应。 益智培养的好导师 棋局对弈对孩子的智力发育具有显著的促进作用,能够有效培养他们的空间想象力和逻辑思维能力。凭借高精度的视觉感知算法和工业级机械臂技术,元萝卜AI下棋机器人能够以毫米级的操作精度进行取子、落子,还能通过“画面引导+语音激励+机械臂演示”激发孩子学棋兴趣,成为贴身的专职陪练。 其中,象棋版获得了中国象棋协会权威认证,孩子可以通过元萝卜报名参与16-13级的官方象棋考级评测,并获取中国象棋协会认证证书;围棋版具备从业余20级到职业九段的超高棋力,让不同水平的人都可以与之展开人机对弈,同时还内置AI习题精练功能,帮助孩子巩固所学知识。从电子屏幕回归实体棋盘,在博弈之间培养益智能力,元萝卜AI下棋机器人自发售以来,已成为无数孩子的好陪练、好棋友。 智慧生活的科技纽带 长期以来,消费者对机器人的遐想从未停止,人工智能技术如何走进家庭,连接不同的生活场景,一直是热议不断的话题。尽管市面上涌现出众多新技术产品,但真正能够满足用户切实所需的却寥寥无几。既拥有机器人的外在,又兼具先进AI技术的内在,能在日常学习、娱乐等生活情景中提供贴心陪伴,正是广大消费者的向往。 秉持“创新、益智、陪伴、护眼”的设计初衷,元萝卜真正让人工智能技术无缝融合到机器人的设计当中。无论是AI下棋机器人上配备的可以自由取子的机械臂,还是光翼灯上能够跟随书本而动的聚光灯,都充分展现了元萝卜对家庭场景的深刻理解与细致关怀。正如 “真正的科技是让你感受不到它的存在”,元萝卜以自然流畅的人机交互方式,为家庭生活带来了前所未有的趣味互动与成就感体验。 “智能科技、创享生活”,如同本届AWE大会的主题,元萝卜也坚持用极致的AI黑科技,让孩子在AI的陪伴下健康成长,让更多家庭都能感受到AI带来的改变,共同享受智能且极具人文关怀的智能生活体验。
OpenAI兵临城下 投资人对这家老牌软件巨头焦虑加剧
财联社3月15日讯(编辑 赵昊)北京时间周五(3月15日)凌晨,美国软件巨头、PhotoShop的开发商Adobe公布了2024财年第一财度(截至2024历年3月1日的三个月)的业绩报告。 具体财报显示,Adobe在这一季度的营收录得创纪录的51.8亿美元,同比上升11%;但利润从前年同期的12.47亿美元骤降至6.2亿美元,GAAP每股收益同比腰斩至1.36美元,非GAAP每股收益上涨18%至4.48美元。 来源:Adobe Adobe首席执行官山塔努·纳拉延(Shantanu Narayen)在报告中写道,创纪录的第一财季营收显示出Creative Cloud(创意工具全家桶,包含编辑图片的PS、创建视频的Premiere等)、Document Cloud和Experience Cloud的强劲发展势头。 纳拉延称,“我们在利用生成式人工智能的力量为整个产品组合提供突破性创新方面取得了令人惊叹的成绩。”首席财务官也表示,业绩和创记录的RPO反映了客户对公司创新产品和服务的强烈采用欲望。 在营收和非GAAP每股收益双双超过华尔街预期的同时,董事会还授权公司在2028年3月14日前回购不超过250亿美元的普通股。即便有这么多的利好,Adobe在盘后仍跌超11%,股价势创去年10月以来的最低水平。 但问题就发生在Adobe对第二财季的展望中,公司预计当季营收将在52.5至53亿美元之间,非GAAP每股收益则在4.35至4.40美元之间。与之相比,分析师先前的预测为53.1亿美元和4.38美元。 媒体分析认为,略显疲软的营收前景反映Adobe对其他人工智能初创公司进入其核心业务领域的担忧。这也反映在公司的展望之中,Adobe预计包含创意工具全家桶在内数字媒体业务ARR(年度经常性收入)的增量为4.4 亿美元,低于预期的4.59亿美元。 来源:Adobe 年初至今,Adobe的股价已累跌4.38%,在美股人工智能概念持续爆火的背景下更显低迷。接近一个月前,Adobe的股价在2月16日暴跌了7.41%,创年内最差单日表现,就是在那一天,OpenAI的文生视频模型Sora炸裂出道。 虽不是第一家涉足文本转视频领域的公司,但Sora的推出使OpenAI在这一赛道取得领先,巩固了其在生成式人工智能领域的领军地位。 Gartner分析师Arun Chandrasekaran表示,“在这个领域,没有一家公司比OpenAI更雄心勃勃,且这种雄心似乎有增无减。”
首次亮相即巅峰?阿联酋AI投资公司MGX商讨投资OpenAI的芯片厂
财联社3月15日讯(编辑 史正丞)北京时间周五午后,市场传出消息称,本周刚刚成立的阿联酋人工智能投资公司MGX,正在与OpenAI就投资芯片业务展开初步讨论。 这件事情也从侧面印证,奥尔特曼是真的想自己搞芯片厂。过去几个月里,在各大媒体口耳相传的加持下,OpenAI芯片厂的投资规模从“数百亿美元”到“7万亿美元”都有。 要知道现在英伟达+AMD+英特尔的市值加起来还不到2.7万亿美元,台积电和三星电子加起来接近1万亿美元,所以“7万亿美元”的消息一出,就令不少投资人直呼“不靠谱”。但最新的消息显示,奥尔特曼仍旧在为摆脱对英伟达芯片的依赖奔走努力。 中东资本要站“AI舞台C位” 非常有趣的是,这次与奥尔特曼的芯片厂搭上关系的阿联酋人工智能投资公司MGX,本周才刚刚成立。 阿联酋人工智能和先进技术委员会(AIATC)在3月11日宣布,设立技术投资公司MGX,主要布局半导体、人工智能基础设施,以及人工智能核心技术和应用三个领域,主权财富基金穆巴达拉与阿布扎比AI企业G42在该基金创建中担任基础合作伙伴。 MGX的董事会主席,由阿联酋总统穆罕默德的弟弟、国家安全顾问塔努恩·本·扎耶德·阿勒纳杨担任,他也是阿布扎比投资局、阿布扎比控股公司(ADQ)、国际控股公司(IHC),以及G42的掌门人。 知情人士称,MGX的资管规模,有可能在短短几年内超过1000亿美元。 由于奥尔特曼的“芯片梦”过于烧钱,所以与该项目传出绯闻的基本都是主权财富基金级别的玩家。除了MGX外,此前也有消息称OpenAI正在与新加坡的淡马锡讨论芯片厂的投资。 当然,要拿阿联酋主权财富基金的钱,还得看奥尔特曼的计划能否符合中东国家谋求经济转型的愿景。此前阿联酋已经明确表示,希望使用庞大的石油资本,将这个国家转变为全球AI枢纽。知情人士表示,MGX正在考虑建立一个结构,与全球合作伙伴一起将阿布扎比置于这个AI战略的中心。 马斯克也有意参与阿联酋的AI愿景 除了奥尔特曼外,xAI公司的创始人马斯克也有意与阿联酋主权资本进行合作。 阿联酋的人工智能部长奥马尔·阿尔·奥拉马透露,马斯克对与海湾国家建立合作伙伴关系感兴趣。他是在2017年首次与马斯克见面(注:奥拉马在2017年被任命为阿联酋首任人工智能部长),此后双方又多次见面。奥拉马认为,经济因素将会决定马斯克和其他人会在阿联酋做哪些事情。 除了奥尔特曼和马斯克外,黄仁勋也今年2月到访迪拜,与奥拉马一同出席论坛活动。 (来源:英伟达Blog) 穿着标志性的皮衣,黄仁勋对中东的听众表示,主权人工智能(Sovereign AI)强调的是一个国家对其数据和智能产生的所有权,对于全球领导者来说都是巨大的机遇。黄仁勋也强调,阿联酋正在快速进行转变,从一个能源强国成为全球信息技术的中心。 奥拉马也透露,该国还有一大批英伟达GPU订单尚未交付,未来还将在这个领域不断投资,增加储备。 他也强调,阿联酋希望人工智能的应用方式能够在长期内对这个国家起到帮助,如果有可能的话希望这件事能由阿联酋主导,如果不行的话,也希望能与全球最好的伙伴进行合作。
来感受一下“人工智能+”,三甲医院是这样用大模型的
当去年GPT4公布的时候,我们大吃一惊,哪有这样的事;过若干时间后淡忘了,因为你也没有用过。 今年突然出现Sora,惊呆了,文字就能出来一幕剧;难道仅仅是如此吗?不是,都说明我们没有用上。 我的意思是,需要让一部分人先用起来。 今年,围绕AI的最前沿科技依旧是大热门的话题,而上述这段话正是来自全国政协委员周汉民。此建议一出,可谓是立即在网上掀起了不小的热潮。 而之所以会有如此建议,是因为在周汉民看来,对于这些最前沿的技术是要尽快体验和使用的: 如果你不够了解,就会处于劣势。 因为它所带来的是以点带面、连线成片的巨大影响效应。 不难看出,其核心观点,就是技术需要被用起来,要尽快地做到落地。 而这也应了自ChatGPT引爆AIGC大热潮以来的一个大趋势,即从大模型的训练逐渐向推理过渡,从底层的模型层逐渐向顶层的应用,甚至是更进一步的行业或消费者应用发展。 但毕竟像Sora这样的技术也是刚问世不久,诸多技术和体验方式还并没有对外开放;而大语言模型(LLM),则是已然火了整整一年有余。 由此能联想到的一个问题便是——LLM,现在用得怎么样了? 让我们先拿医疗行业的实践举个例子 。 无论是以往传统AI,还是当下顶流大模型,医疗领域一直都是一个非常典型且亟需AI支持的大行业场景,AI的融入,能肉眼可见地提高医疗服务的效率和质量、应对医疗资源短缺的挑战、以及推动个性化医疗的发展等。 让我们从电子病历上来个“以小见大”。 一方面,与之相关的工作可以说是非常的繁杂,大量的文本信息需要人为手动地去输入,在有些医生详细追踪患者的情况下,病历甚至可长达万字之多,极容易出现错误录入的情况。 另一方面,电子病历又会影响到医生和医疗工作者的判断,因为他们需要对电子病历有着深入的洞察,以便发现潜在的健康风险和疾病模式。 其在医疗工作环节中的重要性可见一斑。而诸如LLM这样的AI技术,恰巧能够很好地满足对大量文本内容的信息化、数字化以及深入理解,正好可以用来做病历的归纳、纠错和重要信息的提炼,而且这类活儿恰好苦到,或者累到……所有“正常人类”都不太愿意干。 那么这些工作让AI来代劳,又能带来什么样的效果呢?我们不妨以深耕医疗行业多年,并且已经帮助众多头部三甲医院完成信息化和数字化的卫宁健康为标杆来一探究竟。 卫宁给出的一套解决方案叫做WiNEX Copilot,如其名,它在医疗领域所发挥的作用,正是充当医生和相关工作者的AI助手。 在WiNEX Copilot病历文书助手的加持之下,医生们可以一键生成符合医疗规范和匹配患者个人病情的病历文书段落,大幅减少病历记录书写工作量,可以让他们更专注于诊断和治疗。 从披露的数据来看,只需要给它8个小时(例如在医生下班后的时间),病历文书助手就可以处理近6000份病历,相当于三甲医院12名医生一天工作量的总和! 而这也还仅是LLM上岗医疗的一隅,WiNEX Copilot还具备怎样的实力,我们继续往下看。 AI医生助手为什么值得拥有 实际上,WiNEX Copilot已深度集成到卫宁新一代产品WiNEX中,除了前面提到的病历文书助手,我们还可以举几个有代表性的场景来进一步展示它的实力。 在放射科,WiNEX Copilot影像报告助手就能帮助医生提升诊断质量,降低误诊率。 根据影像医生写下的影像检查所见情况文字描述,这个小助手就可以自动生成影像诊断结论,包括具体的病变名称或诊断、随访建议等。 医生可基于对自动生成内容准确度的判断,灵活选择一键引用或重新生成。 对于影像报告的完整书写工作来说,这就相当于人类医生和AI合作完成了一轮交叉核对,减轻影像科医生的工作负担,降低误诊漏诊风险,提高影像报告质量。 特别是遇到有多次检查记录的随访患者,系统可自动调出相关的报告辅助对比分析,让诊断结论更严谨、完整、准确。 再如WiNEX Copilot药品知识助手,不仅能从海量的医药文献和数据库中快速检索出与用户查询相关的精确知识,还能基于这些信息生成通俗易懂、内容准确的回答。 这样一来,就相当于给医护人员提供了一个外挂的药品知识库,面对不断更新的药品信息,也能跟得上变化。 就像这样,WiNEX Copilot对接上具体细分的医疗业务场景,就会立即摇身变成医护人员的全方位、多维度智能助手。 目前WiNEX Copilot已经集成在卫宁健康WiNEX全系列产品中,覆盖医院管理、医生增效和患者服务等100多个临床应用场景。 所有这一切,看着炫目又实用,一定需要氪不少金才能拥有吧? 划重点了,它的硬件成本非常合理,性价比也许出乎你的预料。而且更重要的是其实际部署和应用也非常高效,能在任何一家已经使用WiNEX系统的医院迅速“上岗”。 这,又是怎么做到的? 用CPU加速AI落地 可以把AI产品做到既贴近用户需求,又能把它落地和部署的效率拉满,这对于卫宁健康来说其实是相辅相成的。 作为国内医疗信息化领域龙头企业,卫宁健康服务的各类医疗卫生机构用户达 6,000 余家,其中包括 400 余家三级医院,覆盖智慧医院、区域卫生、基层卫生、公共卫生、医疗保险、健康服务等多个领域。 在技术方面,卫宁健康还拥有成体系的系统研发、AI和大数据技术转化能力。 到了大模型时代,卫宁健康多年积累的医疗行业经验、高质量训练数据和研发能力就起到了关键作用—— 在三项优势的综合下,推出面向医疗垂直领域的大模型WiNGPT。 WiNGPT正是WiNEX Copilot的底层AI引擎,它一个突出特点就是结合高质量医疗数据,可针对医疗场景优化和定制。 从2023年初开始研发,到10月正式发布时预训练数据20G,微调数据更是达到50万条。 WiNGPT另一个突出特点就是能高效交付、部署和应用了。 卫宁健康为此选择与英特尔合作,通过软硬适配、优化模型算法等手段,把在CPU上部署的生成效率搞到接近GPU的水平。 为什么要选择这一条技术路线,与CPU本身的能力和医疗行业的特点都脱不开关系。 首先,高端CPU近年来瞄准AI市场持续发力,内置的AI加速技术的性能已经能够满足需求。 这一步在应用部署方面更看重的推理算力方面表现得更为突出。 例如卫宁选用的第五代英特尔® 至强® 可扩展处理器,内置了AMX(高级矩阵扩展)加速技术。相比同样内置AMX的第四代至强® 可扩展处理器,得益于自身在微架构和整体性能上的提升,第五代的推理性能提升高达42%;而与内置了矢量加速指令集,即深度学习加速(DL Boost)技术的第三代至强® 可扩展处理器相比,其AI训练和推理性能提升更是高达14倍。 其次,在医疗行业数字化过程中,CPU已有非常广泛的使用基础。 这一点行内人都知道,广泛应用的电子病历系统、医院资源规划系统以及患者管理系统等等,都需要处理大量的数据,并且要求高可靠性和实时性。 因此CPU早就已经是医疗行业经常采购的设备,不像专用AI加速器或者GPU还需要特批采购流程,选择在CPU上落地AI应用自然更平滑顺畅。 再进一步来说,CPU得益于这种基础,积累了充足的技术人才储备,更易于优化和使用。 CPU群众基础广泛,易于使用、有较出色的可靠性,在医疗行业历经考验的同时,也积攒了大批相关专业人才。 这些人才,和卫宁健康自己的专业人才,再加上合作伙伴英特尔方面的工程师协作,推进AI应用落地时,无论业务方案还是硬件优化方面都能做到就绪程度更高,上手更快。 综合来看,如果这样一个AI 应用能在拥有广泛部署、易于获取,便于应用和优化,能兼顾通用计算又能做推理加速的平台上落地,且不用为此导入异构带来的各种复杂性,自然就会收获高效的应用表现、落地速度和更会有的成本竞争力。 具体到实际表现上——在卫宁健康和英特尔共同对WiNGPT的推理进行优化后,提升了内存使用效率,并通过对 PyTorch在CPU平台上主要算子的算法进行改良,进一步加快了深度学习框架的推理速度。 而在测试中,将基于第五代英特尔® 至强® 可扩展处理器的方案与基于第三代英特尔® 至强® 可扩展处理器的方案进行了对比,结果显示,新一代处理器可将性能提升多达 3 倍。 同时,CPU方案还具有可以更轻松扩展推理实例数量的优势,并且可以在各种平台上适配进行推理。 所有这些优势叠加的结果,就是能让每家已经用上卫宁新一代产品WiNEX系统的医院,都有机会拥有WiNGPT支持的全套WiNEX Copilot医护智能助手。 CPU成了大模型时代下的另一种解法 那么我们现在再来回答最初的那个问题:如何把LLM用好? 首先非常确定的是,目前的大模型已然是步入到了拼谁可以“快好省”地用起来的阶段。 这种趋势从去年便已开始崭露头角,例如从ChatGPT问世之后,国内外先是呈现出了百模大战这种以训练为基础的态势。 而后从下半年至今,则是在训练完大模型的基础之上,更多企业都在思考的则是如何将LLM真正地扎根到行业里。 卫宁这个例子,可以说是较为成功的范例,这不仅是得益于它长期在以大模型为代表的前沿技术上的跟进与创新,更是基于它对于医疗行业的深耕;因此才可以抓住医疗领域的痛点,并让LLM在其中发挥更大的价值。 由此来看,如何能把LLM用好,需得先有深厚的行业积累、有洞悉,方可精准切入。 诚然,全球步入大模型时代之后,GPU或专用的加速器无疑成为了香饽饽,并且越发呈现出千金难求的局面。 然而这就是所有场景中的最优解吗?不见得。 正如我们刚才所言,不论是传统的AI技术亦或是LLM,要想很好的落地需得是做到“快好省”。 若是在部署时盲目堆GPU,一是可能会出现算力上的过剩甚至浪费,二是在落地效率上可能达不到那么高,同时成本也可能会水涨船高。 因此卫宁pick老牌芯片巨头英特尔的最新一代至强,也是从性能、行业、人才、到成本等一系列因素深入考量之后所做出的较优解;而从结果上来看,CPU也正在实实在在地助力着LLM在医疗领域大展拳脚。 所以,到了今天,我们会突然发现,一个有意思的新趋势是:CPU成了大模型落地的另一种解法。
日本NEC:成功利用AI技术降低劳动力成本 提高工作效率
集微网消息,日本NEC公司近日透露,已成功利用人工智能(AI)技术提高效率,并削减劳动力成本。NEC CEO Motoo Nishihara表示,自2023年5月起的实验已经取得了一些显著的早期成果,使得准备文件的时间缩短一半,会议记录的转录用时也从30分钟缩减到5分钟。 NEC还表示,利用AI技术将某些软件工程开发的劳动力成本削减了70%之多。 根据普华永道2023年的一项调查,生成式人工智能所创造的价值约有75%来自四个领域:客户运营、市场营销和销售、软件工程以及研发。日本政府此前已将人工智能与半导体作为国家首要战略重点之一,目的是重振该国的科技竞争力。 NEC联席首席运营官兼企业高级执行副总裁表示,知道如何将大语言模型这类生成式AI应用于业务中至关重要,生成式AI本身并不创造价值,它只是一种工具。企业需要知道如何利用良好的专业知识和安全性,来利用生成式AI。 NEC公司于2023年7月设立了人工智能业务在三年内实现3.46亿美元收入的目标,该公司在生物识别、视频识别、分析等领域拥有国际专利,并正在开发大语言模型算法,参数达1000亿个。但NEC一名高管也表示,建立轻量的中小型大语言模型也至关重要,因为部署更快、能耗更低。
开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出“灵巧手”,泡茶剪纸炫技
【新智元导读】「OpenAI机器人」一出世惊艳众人!最近,李飞飞团队打造了一个开源便携式手部动捕系统——DexCap,成本仅3600美元,就能让机械灵巧手完成花样任务。 OpenAI大模型加持的机器人Figure 01,昨天火爆了全网。 而今天,真正「开源版」的擎天柱/Figure 01诞生了,而且背后团队还将成本打了下来。 成本只要3605.59美元! 它拥有一双灵巧手,就比如泡茶,先是拧开瓶盖,再拿茶镊将茶叶挑进杯中,并放回原位。 快看,它能一手拿着剪刀,一手拿着便利签纸,执行人类剪纸这一动作。(不过剪断的这个过程好难) 它还可以将胶带纸,放到收纳的纸盒中,一手拿胶带摆放,一手将盒子推近。 而且不管这个物体是什么,它都能照样完成。 与前段时间爆火的炒虾机器人不同的是,「灵巧手」并非通过远程操控完成任务。 是因为,凭借一副特制的手套,它可以通过各种传感器捕捉到手部精确的运动数据。 这正是由Chen Wang、李飞飞和Karen Liu等人提出的「便携式手部动作捕捉系统」——DexCap。 论文地址:https://arxiv.org/abs/2403.07788 DexCap是一套基于SLAM、电磁场,以及对环境的3D观察,便能实时追踪手腕和手指运动的系统。 与传统基于视觉动捕技术不同,它不会因为视线遮挡,而无法收集数据。 与此同时,他们还设计了全新的模仿算法DEXIL,才用了逆运动学和基于点云的模仿学习。 当手部动作数据收集完成,DexCap就会利用背包中的迷你PC,通过RGB-D相机重建3D场景。 然后将运动数据与之对齐,这样,就可以得到非常精确的手部动作模型,可用于进一步的机器人训练。 值得一提的是,在对具体6项操作任务评估中,DexCap展现出卓越的完成能力。 而且,它还可以从野外动捕数据中有效学习,为未来灵巧操作的数据收集方法提供了方法。 Jim Fan认为DexCap是「低配版的Optimus」,关键只要3600美元,一般人也能买得起。 另外,他还特意强调,数据收集和机器人的执行是分离的。 还有网友称,「DexCap绝对震撼,我们正在进入个人机器人与个人AI的下一阶段」。 全新手部动捕系统DexCap,不怕遮挡 DexCap系统核心设计,就在于前向后向设备的组合。 具体来说,正面设计的胸部相机架上,配备了一个RGB-D激光雷达摄像头和三个SLAM追踪摄像头。 背面的背包中,有一个迷你PC,以及电源为系统供电。大约可进行40分钟的数据收集。 此外,还需要一个动捕手套,以便进行手部动作的捕捉。 追踪摄像头最初放置在胸前机架上,进行校准。 然后在具体数据收集过程中,将摄像头从校准架上取下,安装到特制的手部支架上。 这样,系统就可以持续追踪手部的位置。 可以看到,网球被放进框里,再倒出来,整个动作都清晰可见。 机器人更多的训练数据,这不就来了么。 数据可视化:点云观测中的3D手部运捕数据 再来看数据采集吞吐量,DexCap可以实现与人类自然运动同水平的效果,而且是远程操作的3倍。 再看如下用固定的手势握住杯子手柄的动作。 VR头显使用了基于视觉的手部追踪方法,却因严重遮挡而无法准确追踪手部动作。 显然,DexCap无障碍收集了手与物体交互的数据。 从人类行为模仿学习 研究人员的目标是利用DC记录的人手动作捕捉数据,来训练灵巧机器人策略,这个过程中会面临3个问题: (1)如何将人手的运动重新定位到机器人手? (2)什么算法可以学习灵巧的策略,而且要适应双手动作的高维空间? (3)研究直接从人类动捕数据中学习的失败案例以及潜在的解决方案。 为了应对这些挑战,研究人员引入了DexIL,一个使用人手动作捕捉数据训练灵巧机器人的三步框架。 第一步,将DEXCAP数据重新定位到机器人实施例的动作和观察空间。 第二步,使用重新定位的数据训练基于点云的扩散策略。 最后一步,可以采用人机交互来进行校正,旨在解决策略执行期间出现的意外行为。 动作重定向: LEAP手比人手大了约50%,这种尺寸差异使得很难将手指运动直接转移到机器人硬件上。 为了解决这个问题,研究人员使用指尖逆向运动学(IK)来计算16维关节位置,并使用动捕手套跟踪人体手指的运动,手套根据电磁场(EMF)测量手指相对于手掌的3D位置。 视觉差距: 观察和状态表示选择对于训练机器人策略至关重要。为了进一步弥合人手和机器人手之间的视觉差距,研究人员使用正向运动学生成机器人手的点云网格,并将其添加到点云观察中。 使用相机参数将DCdata中LiDAR相机捕获的RGB-D图像转换为点云。这种额外的转换提供了两个显著的好处。 首先,由于DEXCAP允许人体躯干在数据采集过程中自然移动,因此直接使用RGB-D输入需要考虑移动的相机帧。 而通过将点云观测转换为一致的世界坐标系,可以隔离并消除躯干运动,从而实现稳定的机器人观察。 其次,点云提供了与机器人操作空间对齐的灵活性。由于在野外捕获的一些运动可能超出了机器人的运动范围,所以需要调整点云观测和运动轨迹的位置来确保操作范围的可行性。 观察重定向: 为了简化在人和机器人之间切换相机系统的过程,相机机架的背面集成了一个快速释放带扣,可以在不到20秒的时间内快速更换相机。 通过这种方式,保证机器人可以使用人类收集数据时的同一台相机。 通过上述设计,DexIL可以直接从DCdata学习复杂的灵巧操作技能(比如拾取、放置、双手协调等),而无需机器人数据。 30分钟人类数据,机器人「学废了」 根据上面的分析,首先通过RGB-D观测构建3D点云,并转换到机器人的操作空间,将DexCap数据重定位到机器人实例中。 同时,手部动作捕捉数据也要重定位到带有指尖IK的机械臂。 基于这些数据,学习扩散策略,将点云作为输入,并输出一系列未来目标位置作为机器人动作。 上图展示了DC以3D形式捕捉详细手部运动的能力,将人类动作与所有视图中的对象点云对齐。 黄色列表示重定位后的机器人手部动作,我们可以看到它们与蓝色列在同一3D空间中精确对齐。 上图中,将DC与最先进的基于视觉的手部姿态估计方法HaMeR进行了比较,从相似的角度观察它们的性能。 HaMeR在严重遮挡的情况下表现不佳,要么无法检测到手,要么无法准确估计指尖位置。相比之下,DC在这些条件下表现出良好的鲁棒性。 结果演示: 下图的捡球任务,只使用30分钟的人类动作捕捉数据来学习策略,无需任何远程操作。 双手操作任务: 先收集双手的人体动捕数据,然后进行完全自主的策略部署。 用DexCap进行RLHF DexCap系统在执行任务时提供了两种便捷的人在回路纠正,让用户能够根据需要灵活调整机器人的动作: 1. 残差纠正模式: 系统会实时捕捉用户手腕的微小位移变化,并将这些变化作为额外的动作指令加入到机器人的动作中,从而实现精细控制。这种模式可以实现最小的运动,但需要用户进行更精确地控制。 2. 遥控操作模式: 通过逆向运动学算法,用户的手部动作会被转化为机器人末端执行器的相应动作,适用于需要全面控制机器人的场景,但相对而言需要用户付出更多的努力。用户可以通过简单地踩下脚踏板来在这两种模式之间自由切换。 最后,这些纠正动作会被记录并保存在一个新的数据集中,并与原始训练数据一起进行均匀采样,从而更好地调整机器人的行为策略。 微调后:泡茶 通过分析1小时人类动捕数据并进行30次人在回路纠正后学到的策略: 微调后:使用剪刀 通过分析1小时人类动捕数据并进行30次人在回路纠正后学到的策略: 硬件教程 地址:https://docs.google.com/document/d/1ANxSA_PctkqFf3xqAkyktgBgDWEbrFK7b1OnJe54ltw/edit#heading=h.t3oe3oo3ujny CAD 模型清单 打印项目包括: - 中心相机架和连接板 - 两个手套相机支架(分别为左手和右手设计的镜像版本) - 两个T265相机的后装板(同样需要左右镜像) 相关的STL文件如下: 地址:https://drive.google.com/drive/folders/1pfUISMJTJU68g6HkjKkiJAOBtRBKKByx?usp=sharing 为了确保打印出的零件能够顺畅运作,建议将滑槽部分的打印角度保持在与Z轴的倾斜角度在45度以内。 作者介绍 Chen Wang 论文一作Chen Wang是斯坦福大学CS的一名博士生,导师是李飞飞教授和C. Karen Liu。 在加入斯坦福大学之前,他曾在Machine Vision and Intelligence Group工作,导师是Cewu Lu教授。
苹果首次披露多模态大模型!AI大招什么时候上iPhone
一直在大模型浪潮有点克制的苹果,终于不再低调了。 在今年的 苹果股东大会上,库克罕见地谈及了生成式 AI。 苹果 2024 年将在生成式 AI 领域「开辟新天地」。 今天,苹果首次揭晓了在多模态大型语言模型(LLM)研究领域的最新突破。 这是一篇题为《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的学术论文,里面详细介绍了具有高达 30B 参数规模的系列多模态 LLM。 不只是数苹果!超大杯自带火眼金睛 直入主题,先来看看「超大杯」 MM1-30B-Chat 的能力。 MM1-30B-Chat 不仅准确无误地数出图片中苹果、橙子的数量,而且面对一连串数字的识别,也能轻松应对。 难度也进一步升级,研究人员设置了个陷阱问题,询问 MM1-30B-Chat 能看到图片中的红球吗? 并未中招的它能够明确地回应道:「图片中并无红球,我所见到的是一只猫正坐在沙发的枕头上,除此之外,别无他物。」 我们时常在朋友圈上看到飞机上随手一拍的风景图,那 MM1-30B-Chat 会怎么解读这些风景图呢? 目睹这幅图像,人们会体验到敬畏、好奇和宁静等多种情感。飞机窗户外展现的景色令人叹为观止:飞机的机翼下,是一片广阔而雪白的山脉,给人一种宁静和自然之美的深刻感受。 山脉宏伟、层次分明的排列,以及其雪峰与明亮的蓝天形成的对比,让人不禁对自然世界充满惊奇和赞赏。 这种视角还提供了一个日常生活中难以体验的独特世界,激发出人们的好奇心和兴奋感。此外,图中未被触及、原始的风景,还能带来平静与安宁之感。 它提取信息的能力也是一流,光靠一张图,就能滔滔不绝地给你讲清楚地解释清楚蒸发和蒸散发的区别。 推理能力是大模型的必备的核心竞争力之一,这种能力使得模型能够从有限的信息中提炼出深层次的见解和关联。MM1-30B-Chat 仅凭照片,就能推理出下面这些信息: 海滩上的伞图片显示温度在 25-30 摄氏度。伞已撑开,人们在海滩上,看来是个温暖而阳光灿烂的日子。 飞机飞越雪地的图片显示温度在 -20 至 -30 摄氏度。飞机正飞越一片雪地,地面上有车辆,显然是一个寒冷的冬日。 动物在田野上吃草的图片显示温度在 15-20 摄氏度。动物正在吃草,这通常发生在温和的天气中。草地的绿色进一步显示出温和的气候特征。 MM1 是怎么做到的? 苹果发布的论文里详细披露了背后的研究过程。 得益于大规模图像-文本数据的丰富性和大规模计算能力的普及,多模态大模型已经成为众多顶尖模型的标配。 现有的多语言大型语言模型(MLLMs)主要分为封闭和开放两类。封闭模型的信息有限,而开放模型提供详细的参数、数据和训练配置,便于进一步研究。不过,大多数研究缺乏关于算法设计选择的透明度,特别是在多模态预训练方面。 因此,苹果撰写的这篇论文详细记录了多语言大型语言模型(MLLM)的开发过程,并尝试归纳出宝贵的设计经验。 具体来说,研究团队在模型架构决策和预训练数据选择进行了小规模的消融实验,探讨了模型架构决策和预训练数据选择,并观察到了几个有趣的趋势: 在模型设计方面,研究人员发现图像分辨率、视觉编码器的损失和容量、以及视觉编码器的预训练数据是至关重要的考量点。但出乎意料的是,几乎没有发现有力证据支持视觉数据输入到大型语言模型(LLM)的架构设计对性能有显著影响。 此外,研究人员探索了三种不同的预训练数据类型:图像字幕、交错的图像文本数据以及纯文本数据。 他们发现,对于少样本学习和纯文本任务的性能来说,交错的图像-文本数据和纯文本数据极为关键,而对于零样本学习的性能而言,图像-标题对数据最为重要。 经过监督微调(SFT)阶段后,研究人员证实了这些趋势的持续性,无论是在预训练阶段的评估中,还是在后续的基准测试中。这一发现表明,模型在预训练阶段所展现的能力以及所做出的建模决策,在经过微调之后依然保持其有效性。 在研究的最终阶段,研究团队通过扩展至更大规模的大型语言模型(LLMs),包括3B、7B 至 30B 参数级别的模型,以及探索混合专家(MoE)模型的不同配置——从拥有 64 个专家的 3B MoE 到拥有 32 个专家的 7B MoE——来进一步增强模型的性能。 预训练模型 MM1 在少样本学习设置中,无论是在小型还是大型规模上,都在标题生成和视觉问答(VQA)任务上超越了 Emu2、Flamingo 和 IDEFICS 等众多先进模型。经过监督微调(SFT)后的最终模型,在 12 个公认的多模态基准测试中展现了竞争力十足的性能。 得益于广泛的大规模多模态预训练,MM1 展现出了一系列引人注目的能力,包括上下文预测、多图像处理和连贯性推理等。 此外,经过指令调优的 MM1 还表现出了卓越的少样本学习能力。这些显著的成果证明了研究团队提出的构建多语言大型语言模型(MLLM)的方法能够有效地将设计原则转化为实际中具有竞争力的规模化模型。 构建 MM1 的秘诀 构建高性能多模态大型语言模型(MLLMs)是一项极其依赖经验的工作。虽然高层次的架构设计和训练流程是明确的,但实际形式和执行方式却不明确。 研究人员详细记录了为了构建高性能模型所进行的一系列消融实验。主要是三个设计决策维度: 架构:研究人员研究了不同的预训练图像编码器,并探索了将这些编码器与大型语言模型(LLMs)如何连接。 数据:研究人员考虑了不同类型的数据及其混合比例。 训练流程:研究人员探索了如何训练多模态大型语言模型,包括超参数以及在不同阶段训练模型的哪些部分。 鉴于训练大型多模态语言模型(MLLMs)可能涉及庞大的资源消耗,研究人员采取了一种精简的实验设置来进行消融实验。 模型架构消融 实验过程中,研究者分析了使大型语言模型(LLM)有效处理视觉数据的关键组件。他们专注于两个主要问题:最佳预训练视觉编码器的方法,以及如何将视觉特征与 LLM 内部空间有效结合。 图像编码器的预训练:多数多模态大型语言模型(MLLMs)使用 CLIP 预训练的图像编码器,也有研究探索使用 DINOv2 等仅视觉的自监督模型。研究显示,预训练图像编码器的选择对下游任务性能有显著影响,重点关注图像分辨率和预训练目标的重要性。在此过程中,研究人员使用了 2.9B 的 LLM 以充分挖掘大型图像编码器的潜力。 对比损失与重建损失:大规模图像-文本数据集训练的模型展现出强大的语义理解能力,这得益于数据的丰富性和视觉编码器的语义知识。然而,CLIP 风格的模型在密集预测任务上表现不佳,因此研究者考虑使用重建损失来提升图像理解的详细程度。 编码器课程的影响:研究发现,图像分辨率的提升对性能影响最大,其次是模型大小和训练数据组成。提高图像分辨率、增加模型参数和引入合成字幕数据集均能带来性能的小幅提升。 模型类型的选择:对比方法通常优于重建方法,特别是 ViT-L 编码器在性能上小幅超越同等尺寸的 AIM。 预训练数据消融 在追求高性能模型的训练过程中,获取大量且与任务相关的数据是至关重要的。通常,模型的训练被分为两个关键阶段:预训练和指令调优。 预训练阶段涉及使用广泛的网络数据,旨在为模型提供一个全面的学习基础。随后的指令调优阶段则利用针对特定任务精心挑选和策划的数据,以进一步提升模型在该任务上的表现。 而研究人员则集中讨论预训练阶段,并详细阐释他们在数据选择上的策略和考量。 最终模型与训练方法 研究人员选用了 378x378 像素分辨率的 ViT-H 模型,并在 DFN-5B 数据集上以 CLIP 目标进行预训练。 研究显示视觉标记的数量至关重要,因此他们采用了包含 144 个标记的连接器,选择了 C-Abstractor 作为连接器架构。 为了保持模型在零样本和少样本场景下的性能,研究人员使用了 45% 交错图像-文本、45% 图像-文本对和 10% 纯文本的数据组合。 他们也将大型语言模型(LLM)的参数规模扩展至 3B、7B 和 30B,并在相同文本数据集上进行训练。利用预训练的LLM和视觉编码器初始化 MM1,并在混合数据上进行了 200 万步的多模态预训练。 所有模型都在 AXLearn 框架下,以不冻结状态、4096 的序列长度、每序列最多 16张图像、378×378 分辨率和 512 序列的批次大小进行训练。 鉴于在这样规模下进行精确的超参数搜索是不现实的。研究人员依据 LLM 的扩展规律,在小规模上进行了学习率的网格搜索,并确定了最佳学习率,随后将其应用于更大规模的模型中。 监督微调 研究人员还阐述了基于预训练模型所进行的监督微调(SFT)实验细节。 它们遵循了 LLaVA-1.5 和 LLaVA-NeXT 的方法,并从一系列多样化的数据集中收集了大约 100 万个 SFT 示例,包括: 由 GPT-4 和 GPT-4V 生成的指令-响应对,LLaVA-Conv 和 LLaVA-Complex 用于对话和复杂推理,以及 ShareGPT-4V 用于详细图像描述。 针对学术任务的视频-语言(VL)数据集,涵盖了自然图像的 VQAv2、GQA、OKVQA、A-OKVQA 和 COCO Captions;文本丰富的图像数据集 OCRVQA 和 TextCaps;以及文档和图表理解的 DVQA、ChartQA、AI2D、DocVQA、InfoVQA 和 Synthdog-En。 此外,研究人员使用了类似于ShareGPT 的内部数据集,以保持模型对仅文本指令的遵循能力。 论文结论 研究团队致力于探索构建高效能的多模态大型语言模型(MLLMs)的策略。通过精心设计的消融实验,研究人员对建模和数据选择进行深入分析,从而归纳出一系列关键的经验教训。 这些经验成功培养出一个预训练模型,在各种少样本评估中取得了业界领先的成绩。经过监督微调(SFT)的过程,这一模型系列在多个基准测试中展现出卓越的性能,不仅能够处理多图像推理任务,还能适应少样本提示的挑战。 更多研究细节,请查阅论文地址:https://arxiv.org/pdf/2403.09611.pdf 另外,据彭博社报道,苹果在今年早些时候还悄然收购了加拿大 AI 初创公司 DarwinAI。而该公司掌握的核心技术之一是利用 AI 来理解深度神经网络算法,并据此定制生成一系列经过高度优化、满足特定需求的神经网络。 报道还指出,这项技术对苹果公司来说可能极具战略价值,因为它完美契合苹果致力于在设备上直接运行 AI 功能的长远规划,而非单纯依赖云端计算。 无论是发表学术论文,还是战略性收购,这一连串举措都清晰表明了苹果即将在 AI 领域大展拳脚。 如今距离 WWDC24 仅剩不到三个月的时间,现在,让我们备好爆米花,屏息以待,准备迎接库克所描述的「开辟新天地」。
宝马回应315被点名,315晚会曝光主板机黑灰产业链、AI换脸诈骗、同程金融App礼品卡套路,这就是今天的其他大新闻
今天是3月15日 农历二月初六 今天的 315 晚会 不仅讲到了 不防火的防火玻璃 偷工减料的灭火器 梅菜扣肉里的糟心肉 神乎其神的听花酒 套路深的婚恋平台 还讲到了 。。。 下面是今天的其他大新闻 # 宝马回应 315 被点名 据 @央视财经 报道:众多新车车主反馈,宝马 530Li 车型存在传动轴异响问题。对于此问题,宝马 4S 店的维修人员告诉记者,更换传动轴可以,但没法做到退车或者换车。 记者了解到,更换新的传动轴并不能彻底解决车辆传动轴异响的问题。 针对#315晚会# 被点名,@宝马集团 发布声明称:针对部分宝马530Li用户提出的“ 传动轴异响 ”问题,我们此前已经进行过技术核查,确认该现象不会影响行驶安全,并可以通过维修解决,宝马承担所有相关维修费用。 :换都解决不了,这得咋修? # 315 曝光主板机黑灰产业链 ( 差评 )315 晚会中曝光了主板机的黑灰产业链,其提及: “ 20 块手机主板就能集成一个主板机了,一台电脑可以投屏上百台手机,可以一 IP 多机或者一机一 IP 。 这些广告甚至宣称:他们制造的主板机叠加起来,就可以组建成千上万台手机的网络矩阵,有这样的设备,可以操纵游戏、操纵发帖数量,操控网络投票 ”。 据悉,晚会上点名的云机侠( 深圳 )科技有限公司,下午还在发抖音,现在账号已被封禁。 :好,这么操控舆论是吧? # 315 曝光 AI 换脸诈骗 在 315 晚会上,穿插了一段对“ AI 换脸 ”的科普。其提及,视频通话 AI 换脸诈骗已经不是什么稀罕事了. 为了更好地防诈骗,大家在怀疑对方换脸时可以让对方摸脸、按鼻子等,这样可以更容易地识别 AI 换脸视频。 此外,AI 换脸、变声功能虽然看起来很强,但诈骗分子由于训练数据不足、技术能力欠缺等硬伤,基本都会在几秒钟后挂断视频 / 电话。 :懂了,接到视频电话先聊个十分钟的。 # 315 曝光同程金融 App 礼品卡套路 315 晚会中提及,有投诉者表示,“ 通过网友,知道同程金融App可以借钱。网上说购买它的礼品卡,然后把礼品卡通过商城回收卖了,填写自己的收款账户,就把钱打给我了。购买礼包的价格一共是 40000 多元,但是我实际到手只有 28000 多元。 ”(注:购物时用了分期付款) 据悉,仅在一家投诉平台上,关于同程金融 App 的投诉就高达 36755 条,内容包括:同程金融高利贷、同程金融捆绑销售等。 节目播出后,同程金融同名微信小程序、微信公众号均已被封禁,“ 同程金融 ”App已被多个应用商城下架。 :这不就是砍头息?
别再用一拖三数据线了,搞不好手机都给你都烧了
最近发布的产品太多了太忙了以至于托尼都没意识到已经 3.15 了。 既然是消费者权益日,那我也给广大消费者排个雷吧,曝光一种看上去很方便实则很危险的产品。 不知道大家有没有用过图片里这种,可以用一个充电器给三台不同接口的设备充电的数据线。 这种三合一的线,哪儿都有,商店里、车上、甚至家里都有,但是很少有人生出警惕之心。 我们办公室的同事胖虎最近就在某多多上用十块钱买了一个。 后来他回忆的时候,也承认当时是被这个价格迷了心窍,又想着一根线就能解决好几种设备充电问题,再加上还是个有头有脸的品牌,不是什么三无产品,没想更多就直接下单了。 结果这一贪便宜还真就出问题了——在不连接任何设备的情况下,其中一根线居然异常发热。 我当时正坐在他旁边,有幸目睹了他被烫到尖叫,手忙脚乱的样子,仔细一看手都被烫去了一层皮。 出于职业敏感,在断完电之后,我们赶紧拿出测温工具看了一下,发现这时候这根数据线的温度居然来到了 66.1 ℃。 好家伙,还好我们胖虎反应快,想想要是被家里的小朋友不小心碰到这种情况,后果简直不堪设想。 我尝试着把这根线拆了一下,结果发现果然短路了,连接口都烧黑了。 我们又去网上搜了一下,发现这样的低质量三合一线造的孽还不少。 一位网友也买了这样的三合一的数据线,充完电之后,没有把充电头拔下来,结果数据线接触到桌面开始冒烟了。 画面可以说是相当惊悚了。 我把这些消息都发到了平常的吹水群里,一个之前倒卖过数据线的同事突然冒泡了: “ 三合一的线,别买! ” 他说这种廉价的一拖三数据线,质量差,做工简陋,十分不靠谱。 它不仅有质量不合格短路的风险,还有可能会因为快充能力,把你的设备给 “ 击穿 ” 。 因为这种几块钱的快充三合一线,很有可能只是简单的把三根线接在了一起,并不具备单独识别每一个充电设备快充协议的能力。 比如我们影棚之前有一根号称 120W 的三合一数据线。 我们把它拆开之后,发现里面只是简单地把三根线的绝缘层剥离,再用一个小金属扣子束在一起。 这样同时给三台设备同时充电的时候,相当于把三台设备并联,它们接口收到的电压是一样的。 假如其中一台是支持快充的手机,另外两根线接的是不支持快充的蓝牙耳机或者充电宝。 这时候手机为了满足快充需求,会跟充电头协商,把充电电压抬高。 充电头这边并不能分辨这是三台设备连接的情况,认为就是一台快充设备在充电,于是很愉快地把电压给抬高了。 耳机和充电宝这边因为被廉价数据线绑在了同一条贼船上,自然也得跟着升压。 快充手机这边拿到了自己想要的高电压,但是其他两个不支持快充的设备,他们能承受的电压并没有那么高,搞不好当场就烧掉了。 即使是三台都支持快充的设备,也会有协议电压不一致的风险,迁就了一个另外两个没准就烧坏了。 所以大家如果不小心买到了这样的线的话,最好只用其中一个口,千万别三个同时充!!! 稍微贵一点一拖三快充线倒是可以解决烧设备的问题,但是通常就只能支持一个口用上快充。 这种线通常会在接线的地方安排一个降压芯片和基本的保护电路,只让一路接口支持快充,把其他两路强制变成普通的数据线。 这两路线的电压会被锁在一个比较低的值,这样接在上面的耳机、充电宝之类的设备也就不会被快充的高压烧坏了。 安全是安全了,但是三线快充也没了,同时充电的话只有一台设备能够快充,另外两个设备都只能是 5V-1A 的 “ 极致 ” 体验。 要我说啊,与其这样提心吊胆,还不如老老实实多买几根线吧,别再贪便宜图方便冒险买这种一拖三的线了。 其实说到这种三合一的线,让我想到了很久以前的另外一种 “ N 拖 1 数据线 ” 。 当年这个头,有的是 2.1 毫米 DC ,有的是 3.5 毫米 DC ,有苹果的 30 pin 的线,也有诺基亚、摩托罗拉、三星的专有接口。。。。 N 拖 1 数据线就很好地搞定了这种情况,直接一根包揽全场。 正好那个时候的充电电压最高就是 5V ,不像现在 9V 、 12V 、 24V 电压快充都有。 出门在外只要带一个充电头和一根这样的数据线就能解决所有电子设备的充电问题。 可再怎么方便,它最多算是给当时那个混乱的世界打了一个补丁,还是一个不怎么安全的补丁。 现在它的历史使命已经完成了,去年就连最固执的苹果都给 iPhone 和 Air Pods Pro 安排上了 C 口,完成了全系产品的接口统一。 也到了淘汰这种多合一数据线的时候,毕竟现在日常用的设备里,要找一台不是 C 口的还挺难的。 撰文: 施昂 编辑: 米罗 & 面线 美编:阳光 & 焕颜 摄影:若轩
一年几千万台,国产电视到底是怎么在国外卖爆的?
在今年年初的时候,托尼和几位同事先后参加了两场重磅电子和通信类展会—— CES 和 MWC 。 本来吧,托尼以为折腾完这两场展会,可以好好休息一下,给大家写点测评啥的。 结果没想到,前两天我们编辑部又被通知去参加一场叫做 AWE 的展会。。。 AWE 的全称是中国家电及消费电子博览会,无论是参展方还是展出的产品技术含量,这次都可以说是刷新了我对于 “ 家电展 ” 的认知。 给大家举个例子,像是我们熟悉的老牌家电大厂——海信的现场布展,科技含量就直接拉满了。 开幕当天,海信各个展台前人气爆满,连搜狐 CEO 张朝阳都没忍住过来溜达了一圈。。。 毕竟人家是物理学博士出身,对现场的一些技术感兴趣也挺合理的,据说他还计划在自己的物理课上专门讲讲展区的所见所闻。。。 展区不仅分成了好几个不同的区域,各种花样的产品也让人一饱眼福,比如用于车载的激光全息投影、高颜值的智能化白色家电和欧洲杯定制款 Mini LED 电视等等。 至于为啥会有欧洲杯定制版电视,当年绿茵场上这个刷屏全网的广告语,相信大家都没忘吧。。。 但是前面提到的这些,对于展会里的产品甚至是海信本身来讲,都只是开胃小菜,接下来我要给差友们展示的,才是真正的重量级产品。 请欣赏,海信可折叠激光电视。。。 海信之所以研发出了全球首款可折叠激光电视,因为在他们内部的数据中,表示 100 英寸往上的电视由于太大放不进电梯,导致入户安装率还不到 80% 。。。 要么只能买个尺寸小点的电视,要么就得破窗用吊车把大电视吊上去,成为全村最靓的仔。。。 但海信偏偏就不信这个邪,于是这台超大尺寸的可折叠激光电视和大家见面了。 乍一听似乎只要把屏幕卷起来就可以了,但想要做到这一步可一点都不简单。 为了能让电视 “ 卷 ” 起来,海信采用了比普通膜片更厚的光学膜片,再把它固定在合成布上,让合成膜既能卷曲也能固定在框架上,可以说是能屈能伸了。 而且它在折叠的基础上,还要保证电视的基本功能不受影响,画质、色彩和声音效果都不能缩水。 反正要让我从折叠电视和破窗运上楼之间选,我绝对选这个能折叠的。 我去,合着这哪是家电展啊,技术含量一点都不比国外的展会低。。。 但这只是 AWE 的冰山一角,再给差友们看一个能升降的电视。。。 这台电视同样由海信研发,可以一键升降隐藏,同样能够轻松放进客厅。 如果你觉得还是不够,海信还有一台 8K 分辨率的屏幕发声激光电视,声画体验全部拉满。 所以看到这里,差友们不难发现,电视这个再常见不过的家电,已经被国产品牌卷到了一个我从来都没有想过的高度。 光是海信这一个牌子,就从平板电视卷到激光电视,再进化到了可折叠电视,可以说是完全不怂那些外国货。 在人们的固有认知里,海信通常都会被大家认为是一个销量很好的电视品牌。 但经过这次 AWE 展会,你就会发现中国的电视品牌不仅市场占有率高,更是有实打实的技术在做支撑。 对了,说到销量,海信这两年也并没有因为埋头研发新技术,而把自己已有的市场份额丢掉,反而是技术犒赏了这个埋头苦干的理工男。 比如根据市场调研机构 Omdia 的数据显示,2023 年海信电视全球出货量足足 2611 万台,位居全球第二,同比增长 6.4% 。。。 我技术比你强,销量还比你好,也许这就是 “ 中国第一,世界第二 ” 的含金量吧。。。 所以回过头来看,海信这个牌子知名度不断提升,除了本身产品获得很多人认可,电视销量遥遥领先之外,还有就是自身也在通过技术研发进行产业升级。 其实通过技术来提升自己品牌形象的路子不算新鲜,但海信还是在这个基础上玩出了相当多的花样。 除了前面说的折叠激光电视,海信也研发出了用在汽车上的激光全息 HUD 显示技术,以及车载激光全景投影。 跟 LED 显示相比,全色激光显示色彩表现力不仅更好,集成化也更高,它比传统的二次光学方案体积低了足足 80% ,发光效率也是传统 LED 的 2 倍。。。 大家在看科幻电影或者玩一些赛博朋克题材游戏的时候,应该都注意过各种眼花缭乱的显示界面。 而有了海信这种高集成度、效率更高的激光显示技术之后,这种科幻场景也许很快就能融入我们的生活中了。 电影《 头号玩家 》 除了产品研发,海信自己也做出了自家的 IoT 平台 —— 爱家。 简单来讲,只要使用海信自家的爱家 App ,就可以轻松管理海信自家的电视、空调和洗衣机等全系列智能设备。 爱家还不只是一个单纯的平台,它还能提供从选购前资讯到售后维护保养的全套服务,产品的整个生命周期都能给用户提供高效的服务。 当一个家电企业包办起了软件服务,这种软硬件打通的方式对于用户来讲,最大的好处自然就是省时省力,而且自家软件对于硬件的适配肯定是最好的。 甚至,海信连最近大火的AI 也不放过,把它给塞进了洗衣机里。。。 海信璀璨洗衣机就可以针对用户的各种需求提供细化洗衣程序,比如脏衣服、敏感肌、抗菌需求等等。 这放在以前的洗衣机,压根不会给你这么多选择,但现在海信不仅做到了,而且老少皆宜没有门槛。 到了这里,差友们会发现海信确实喜欢玩转各种科技。但是在玩明白了之后,海信没有单纯止步于做出酷炫的设备,而是要让每个普通人感受到科技带来的便利。 激光电视很帅但是太大了,那我就想办法把它折叠送上楼;IoT 平台不仅方便,还提供从选购到售后的一条龙服务;AI 跟洗衣机融合,让每个人都有专属的洗涤程序。 这样的做法,正巧跟海信在 AWE 展会上公布的全新品牌价值不谋而合。 因为海信在以前给人更像是一个埋头苦干的理工男,但近两年公开发布和展出的产品却改变了这种印象,产品本身除了技术够强,也更加注重用户体验和所需,也就是海信所说的 “ 人本科技 ” 。 而那些通过技术积累展示的高端产品,也就是前面展示过的折叠激光电视,则通过科技诠释了 “ 至臻品质 ” 的含义,用科技来提升人们的生活质量和幸福感。 比如前面提到的洗衣机,在融合了 AI 和爱家平台之后,就把再常见不过的洗衣场景给变得轻松了许多,你只管把衣服丢进去,剩下的交给海信。 这种提升品牌形象的方式并非炫技,而是通过提升人们的生活品质为出发点,用户的生活品质上去了,品牌形象自然就会升级换新,往高端的方向靠拢。 要是你还嫌不够,海信甚至还官宣成为 2024 年 KPL 《 王者荣耀 》职业联赛以及重庆狼队的官方合作伙伴。 承包客厅和厨房也就算了,海信这回连游戏室都没放过,还是很多人天天都在刷的游戏,狠狠拿捏住了年轻人的喜好。。。 海信在欧洲杯等传统体育赛事经营了那么久,这次决定来电竞领域闯荡一番,托尼还是挺期待会产生什么样的化学反应的。 从这次 AWE 展会可以看出来,像海信这样的老牌家电企业,已经不愿再成为一个单纯的家电品牌,而是希望通过产业布局和品牌形象的升级,转型成为一家高科技企业。 但要做到这样的转型,前提是需要大量的技术积累才能做到,海信也是在成为 “ 全球第二 ” ,以及研发出各种科技感、高品质的产品之后,才有底气向外界正式宣布这次的品牌升级。 技术永远是一家科技企业的根本所在,而海信不仅玩明白了,还在 AWE 上面大大方方地展示这些产品,让普通民众能够零距离接触它们。 也正是海信的这种底气,让这次看似普通的家电消费展之旅,反而变得震撼了起来。 撰文:百威 编辑:小鑫鑫 摄影:萝卜 美编:阳光
音视频掀起变革新浪潮!海思用一套鸿鹄媒体解决方案交卷
作者 | 程茜 编辑 | 漠影 智东西3月15日消息,昨天,2024年中国家电及消费电子博览会(AWE 2024)开幕。同期,海思首次展示面向音视频行业的鸿鹄媒体解决方案,这正是其面向智能终端的全新“5+2”解决方案之一。 在音视频领域,鸿鹄媒体解决方案从性能、影音、交互、互联四大维度出发,面向TV、投影、机顶盒、云电脑等智能硬件设备。这是海思以芯片、相应标准为核心,拿出端到端的技术能力,实现了跨场景构建解决方案。 再加上其对媒体业务的深度理解与市场洞察,鸿鹄媒体解决方案打造了面向旗舰与入门档产品的不同方案,将媒体SoC与星闪、Wi-Fi、ISP、TCON等技术相结合,重构音视频行业的性能、画质和交互体验。 那么,打造这一整套涵盖范围如此之广、性能提升范围大的解决方案,海思的杀手锏是什么?为什么要从单芯片向全套解决方案转型?智东西在参观了海思AWE展台后,找到了这些问题的答案。 一、谁能抢占客厅C位?智能化、交互体验、画质是关键 用户对于智能化生活方式的追求已经延伸到客厅的媒体中心,科技感日益增强的电视、投影仪等设备正在抢占家庭客厅的C位。 但现有的以电视为中心的智能设备,并不能满足当下用户对于其更加智能化、多样化、自动化的强烈需求。正如市场调研机构洛图科技公布的2023年全球电视调研报告显示,2023年中国电视市场品牌整机出货量达3656万台,同比下降8.4%,创下近十年来的新低点;投影仪的出货量也在经历多年迅猛增长后,2023年国内市场销量同比下降5.1%。 这背后一方面受电子消费行业的宏观环境影响,另一方面就是家庭智能音视频设备自身存在的诸多不足,这也成为消费者对于消费预算和支出更为慎重的当下,产品“见真章”的关键。 首先,当下一些音视频设备虽然搭上了智能化快车,但其功能等并不成熟,没有以用户的核心需求切入,反而给用户增加了学习成本。相比于此前打开电视调台选择的简单操作,智能电视的操作更为繁琐,前期设置时需要登录账户、购买会员等操作。 其次,设备与人之间的交互体验较差。有时智能电视、投影仪等设备需要用户使用多个遥控器,才能打开自己想看的节目,并且一些电视的“套娃式”收费模式直接将部分用户劝退,有时甚至需要手机、电视联动操作。 第三,对于音视频设备最核心的显示、音质能力,投影仪等设备的实际效果易受外界环境干扰,如房间遮光效果差等,并且画质更好的电视等设备售价极高,往往会超出一般用户的预算范围。并且超大尺寸的电视又存在入户困难等问题,无法满足消费者对大尺寸显示的要求。 最后,这些专业音视频设备的创新动力不足,导致用户选择其他替代品的意愿或许会更为强烈。如平板、手机等智能交互设备在一定程度上就会挤占电视、投影仪等不方便携带等音视频设备的市场需求。 可以看出,这些设备现存的诸多发展困境,使得音视频行业增长、创新乏力,而突破这些困境也将为电视、投影仪、机顶盒等设备带来新的生命力。 二、鸿鹄媒体解决方案,打造高阶家庭智慧中心 海思首次推出的鸿鹄媒体解决方案正是这一困局的一大突破点。 这一以媒体场景为核心的套片解决方案,就是将其内部的技术与产品相组合,释放出除芯片本身外更大的能量,使得TV、投影、机顶盒、泛智能终端等设备的用户体验全面升级。 围绕着性能、音画、交互体验、互联体验这四大场景,以GPU、CPU、NPU等芯片为核心,打造了基于智慧计算的更高性能音质画质,使得音视频设备拥有指向等更为丰富的交互方式,并与Wi-Fi、星闪等技术相结合带来了更为流畅的互联体验,让用户“手随心动,自由交互”。 1、鸿鹄TV:横跨中高端+入门档需求,全面集成星闪、Wi-Fi等技术 其中针对用户家庭中使用频率较高的电视,鸿鹄TV解决方案面向不同的受众群体打造了四套方案,可大致分为中高端档位和入门档,包括面向8K、4K的旗舰解决方案、面向4K的中高端解决方案、面向4K的主流解决方案以及面向2K的入门解决方案。 面向8K、4K推出的鸿鹄T900旗舰解决方案以一颗媒体SoC V900X为核心,与ISP、摄像头、Wi-Fi以及星闪生态相结合,为终端客户的具体需求提供了性能强劲且可灵活选择的组合方案。 作为旗舰解决方案,鸿鹄T900的各项能力都更为突出。据了解,鸿鹄T900解决方案是行业首款可商用的4K2K 240Hz高刷新率的解决方案,还能达到8K DLG 120Hz。 同时,鸿鹄T900还进行了计算优化,让AI在“脑补”画面的同时增强动态画质提升效果。SoC V900X可以在成本可控的基础上,直接实现5000个分区的背光直驱,将MiniLED的优势充分发挥出来。 鸿鹄T900可实现Wi-Fi 6+联接,带宽为160MHz,最大下载率可以达到2400Mbps,缩小设备间连接延迟。基于星闪生态体系,还能进一步丰富电视的应用生态,如将其作为办公大屏等。 面向4K的中高端解决方案鸿鹄T800相比于T900解决方案,进行了一定的性能舍取,但同样可以满足相应受众群体的需求。鸿鹄T600面向的是4K主流解决方案,其关键就是为用户提供超越入门档位的观看体验。 面向2K的海思鸿鹄媒体入门解决方案、T300 FHD入门TV解决方案也对Wi-Fi 6、星闪等技术进行了集成。 同时,考虑到入门档企业对于成本的敏感度更高,海思从芯片端就拿出了低成本方案,并且还能根据其具体的需求将功能进行取舍。 2、鸿鹄投影:激发行业活力,把影院级体验带回家 电视之外,近几年来智能投影仪市场呈爆发式增长,针对于其当下产品的诸多不足,海思也拿出了对应解法。 目前,中高端投影仪采用的传统显示技术被国外单一厂商垄断,且技术迭代缓慢,使得显示分辨率长期停留在FHD与4K。同时,投影仪的显示效果会受高亮环境影响,用户只能在较暗的环境下获得较好的视觉体验。 基于此,鸿鹄投影解决方案同样以一颗旗舰SoC为核心,将影院级的观看体验搬到了用户家中。 ▲(左)鸿鹄投影解决方案、(右)行业投影解决方案 相比于其他投影,鸿鹄投影的抗光性达到96%,接近显示器量级,视觉体验更好。海思采用的技术路线使得画面的对比度更高,能呈现更多的画面细节如漫天繁星等,并且传统投影侧投画面产生的灰边,也可以消除。 基于8K解码、AI算力和计算画质等能力、鸿鹄光核技术,再加上定制的鸿鹄光幕,鸿鹄投影方案还为用户提供了端到端的8K显示体验。 对于投影仪常出现的散斑、功耗等问题,鸿鹄激光能实现低散斑、低功耗、广色域,同等光源亮度下,这一方案的功耗、激光器数量都有所下降。 此外,鸿鹄光核还采用了与影院同源的3片式LCoS架构,使得色彩更加稳定,并有效解决当前投影对比度短板,将对比度提升到10000:1,暗部细节更突出,让消费者在家也能体验到影院级观影 在智能感知交互方面,AI强算力能灵活调用AI大模型,提升设备的语音交互体验。 3、星闪机顶盒:一个遥控器搞定所有 电视和投影仪之外,即便当下机顶盒的用户群体很小,但为了满足更为广泛的用户需求,鸿鹄解决方案推出了星闪机顶盒解决方案,通过全套解决方案革新用户的体验。基于媒体SoC MV320,通过星闪技术实现了一个遥控器同时控制电视、机顶盒。 对于其他创新智能终端,海思将自身的技术与产品进行了延伸,使这些设备与更多前沿技术的结合更加紧密。 综上,这些解决方案覆盖用户家庭显示的各个设备,使其在突破原有产品瓶颈的同时,依托于更强大的硬件条件实现创新。 三、从单芯片到全套解决方案,音视频终端迎新机遇 可以看出,基于鸿鹄媒体解决方案,音视频设备作为家庭智慧中心的属性将更加凸显。 鸿鹄媒体解决方案以单芯片为核心,打造了完整的套片解决方案,既涵盖TV、投影仪、机顶盒和云电脑等不同设备种类,还横跨了性能、画质、交互、联接的核心体验。 海思端到端的技术体系,正全面支撑这一解决方案不断创新。海思面向家庭家电、消费电子、汽车电子三大场景,布局了联接、智慧视觉、智慧媒体等9大业务领域。再加上海思在媒体等方面对于市场需求的深刻洞察,更紧密地将技术与市场相结合。 从单芯片的方案出发,拿出聚焦于不同设备、不同场景的核心痛点,将现有的技术相组合,打造出兼顾性能强劲且灵活丰富的解决方案。 依托于已有产品和技术的性能,从性能、影音、交互、互联四大维度进行升级,这些跨场景解决方案能力的迸发,为客户和开发者提供了更强大的创新平台。 这背后是海思对于创新的坚持, 20年来,海思一直围绕基础原创创新,芯片不仅是现代智能终端的核心部件,更是创新的源泉与产业发展的根基。 在音视频领域,海思已经深度参与HDR Vivid和Audio Vivid技术创新。目前,HDR Vivid已有华为、创维、康佳、三星、夏普等多家电视新品支持,并得到央视总台、腾讯视频、爱奇艺、华为视频、咪咕视频、芒果TV等内容平台支持,采用HDR Vivid的内容已有30000小时以上,是国内领先的HDR生态。Audio Vivid作为首个基于AI的三维音频编解码标准,能适配智能座舱与智慧家庭。 如今,以芯片这一创新源泉与产业发展根基出发,海思打造了更完善的技术、解决方案生态,服务千行百业。 从创新技术到颠覆性的性能提升,鸿鹄媒体解决方案将为媒体行业的创新提供更强劲的动能。 结语:以SoC核心,鸿鹄媒体解决方案重新定义音视频体验 媒体音视频娱乐体验一直是用户家庭的核心,但由于智能化程度不足、用户对于音画质的要求不断提升,使得其升级迭代的速度或者水平无法满足用户现在的需求。在消费电子行业不景气的大背景下,也为这一领域的产业发展蒙上了一层迷雾。 海思以自身的技术积累,从单芯片扩展到更完善全面的解决方案,覆盖更为广泛的设备种类,正在重塑这些设备的画质、交互等体验的同时激发行业的创新活力。
打开闲鱼,你才知道年轻人现在玩得有多花
闲鱼真的越来越难评了。 同样都是买东西,在小红书种草,在淘宝天猫下单,在闲鱼。。。玩。 闲鱼是一个 “ 二手交易平台 ” ,一说这话,曾经谁都认可。 但如果 2024 年了还这么想,你可能已经成为前浪,半只脚进土里,忽略了闲鱼的基本盘。。。 要知道最大的 00 后已经 24 岁,开始工作好几年了。。。 让我们把目光放回 2023 年 9 月,当时有条微博在互联网上特火 ↓ ↓ 其实事情本身很简单,一位《 神兵小将 》阿娇的死忠粉,中意一款阿娇手办,寻找多年,终于在去年找到。 交易完成后,这位粉丝激动地向卖家分享了自己找寻的经历,原来她线上线下找了三年,一度背井离乡成为了玩具设计师,就希望有更大可能遇到这款玩具,收到玩具的这一刻,圆梦了。 卖家也被她的经历打动,将来龙去脉一分享,火了。 随后网友们拼凑出了更多信息,原来这位粉丝多年来在多个平台上画画单推这个角色,阿娇的百科也是她撰写完善的,再加上她多年找寻这款手办的经历,让大家心生感慨。 有网友留言, “ 终于理解了那句,被爱着的人拥有了灵魂 ” 。 跟这件事情相关的微博跟 B 站评论区,都演变成了互联网难得的温馨现场,互相分享,互相鼓励,此情此景,即便是隔着千万条网线,你也能感受到一丝温情。 时间再往前推,也许你还记得,我们曾经报道过的牛牛的故事。 2022 年,一位 25 岁的模型玩家牛牛去世了,他的母亲决定替他完成遗愿,就这样,一位年过半百的妇女,研究起了二次元,学习起了 C4D 建模以及胶佬的手艺活。 阿姨当时跟我们说, “ 我是个唯物主义者,可我总觉得以后在那个世界会遇见儿子,如果学习他喜欢的事,以后娘俩相见,一起聊的东西会更多 ” 。 编辑部集体眼睛进砖头 直到现在,阿姨还在维系着这家小店,不为赚钱,就为了延续儿子的爱好和精神。 这两件事情,算是网友们关注特别多的,其他类似好玩、动人的事儿还有很多,在互联网上随手一刷,你都能看到很多。 有人挂了一瓶闲置香水,结果有个明天领证的小哥哥拍了给老婆做礼物了。 这位母亲,给自家小孩哥奥特曼贴纸书补缺,聊着聊着,对面还跟她分享起了奥特曼贴纸收藏。 很多年轻人更是把闲鱼当成了一个自己的会客厅,在这里摆放上自己的心头好,在好玩、新潮、猎奇等维度疯狂探索,分享自己的精神世界。 @替计划昆虫工作室 是一位昆虫专家,在他的闲鱼主页你可以看到各种蒸汽朋克昆虫。 昆虫的身体是基于工业设计和仿生学 3D 打印制作而成,外表设计精巧,栩栩如生,通电之后,翅膀会拟真挥动,跟真实的昆虫非常相似。 有大佬也有萌新,如果搜索 “ 仅展示 ” 、 “ 供交流 ” 的帖,可以看到更多 “ 萌新 ” 在上面的钻研记录,如何从小白开始起步,最后一点点拼凑出自己喜欢的模玩。 如今的闲鱼已经在闲置交易平台的本命里,衍生出一个完全不同的形象:有故事,有温度,有交情。 而且,还有一件非常微妙的事。 不同于网购这类效率工具,随用随开,用完就关,你会在闲鱼上玩,经常一言不合就聊上了。 试着回想一下,你在其他平台上买东西,付款后这笔交易就约等于结束了,后续再有聊天的话,多半是出问题,需要对线了。 但在闲鱼上,出汽车,会聊聊这个车型的问题,通病,发动机哪款好。出钢笔,聊聊笔头软硬,用的什么墨水?就像是两个同好在市井街头相遇,直接搬了两块板凳坐下来开唠,人们有血有肉,故事有起有伏,唠完顺便把东西卖了。 在过去的这几年里,社区平台想做电商,但大多数都难以上岸,而闲鱼正以「 市井电商 」的形态,一步一个脚印地成为阿里探索电商社区的集大成者。 归根结底,人们 “ 买东西 ” 的需求没变,但 “ 怎么买 ” 的需求变了。 如今,会玩的用户们除了买卖东西本身以外,也希望寻找一种 —— 被懂的感觉。 原本我还担心,在飞速航行的互联网时代,这种市井的节奏会影响闲鱼商业进度,但查了查数据才知道,这种独特的内容生态和交易氛围恰恰开启了闲鱼强劲增长的新纪元。 相较于其他平台,闲鱼节后就迎来了大爆发。 过去一年里,超过 1 亿人在闲鱼发布闲置,日均有 10 亿的交易额,你可以想象一下,如果一个商品是 1000 块,那每天有一百万件商品在这里交易,把它们稍加具象化,在这个 “ 集市 ” 里,会是何等人声鼎沸,摩肩接踵。 95 后是闲鱼上最活跃的人,去年他们在闲鱼上人均赚了 2723.5 元,这其中 45% 的交易都与兴趣相关。 00 后的占比也达到了 22%。 虽然我不是 95 后 也算做了一点微小的贡献? 为什么闲鱼能获得这么强劲的增长? 这个社区不止有所谓的交情、感动和人情味,还有对新鲜事物、对年轻人喜好的助攻。 春节我陪家人压马路逛商场的时候看到这个广告,顺手拍了下来 ↓ ↓ 这是闲鱼整的「 富苏季 」,想法非常简单粗暴,既然现在的年轻人最关心的就是如何暴富,那就来带大家发家致富,随着万物复苏,希望大家的钱包跟生活也统统富苏。 在春节这个特殊时间的周期内,像外出消费、宠物喂养这些项目的价格会上涨,需求也特别旺盛。 但这些赚钱门路你之前可能没有留意,所以闲鱼这次从节前就开始鼓励大家,去了解同城上门代喂猫遛狗,代购电影票、景点门票以及餐厅代买这些服务。 简单搜索了一下咱编辑部的聊天记录,不得不说,闲鱼对咱的洞察,还挺精准。。。 除了外出消费以外,春节避不开的还有宅家的乐趣,很多人过年会在闲鱼上以租代买,淘置游戏卡带,花点小钱过年通关了再卖出。 这么多项目摆在面前,但凡有点赚钱的心思,几杯奶茶钱也进账了吧 ~ 春节是过了,那节后呢? 对于年轻人来说,开工后最重要的事,那就是立点 2024 年的 flag ,比如今年实现 2023 年的 flag 什么的,然后就是收拾家里,把吃灰已久的设备琢磨琢磨是不是挂出去回回血。 毕竟,现在是循环经济时代,年轻人的消费理念也变成了要能赚会花,一边响应国家以旧换新的号召,一边让自己钱包再厚上一点,何乐不为呢? 顺应年轻人的想法,闲鱼在节后除了鼓励年轻人挂闲置,还用现在最流行的彩票兑换券、刮刮卡做发布激励,小手动动,挂上一些平日用不着的东西,说不定真就一夜暴富了。 近几年,在年轻人群体中最火热的还有——短剧。 就算你没看过短剧,也应该听过,短剧爽点集中,剧情狗血,逻辑无脑,简单明快,让很多年轻人一边觉得尬,一边又看得停不下来。 闲鱼连年轻人的电子榨菜也没放过, 3 月初推出了首部自制短剧《 傅太太全程开挂 》,讲得是一个普通女孩通过玩转闲鱼,靠闲鱼翻身系统怒赚 20 亿,一路高能商战的故事。 短剧就算了,闲鱼还把这个翻身系统变成了现实,整了个「 每日翻奖励 」作为富苏季的延续,给大家带一波新年好彩头。 从小孩哥到年轻人当下最时兴的生活潮流,被闲鱼全方位拿捏,这样看来,闲鱼确实越来越会玩了。 仔细想想,闲鱼从闲置交易起家,现在已经形成了业内独一档的交易生态和内容生态。 在交易中,衍生了 “ 我是学生 ” 、 “ 一卖相承 ” 、 “ 一面之缘 ” 这样的趣味梗,也出现了 “ 仅展示 ” 、 “ 已出留念 ” 这样的无关交易,只做纪念和同好分享的页面。 而最为直观的,就是从 “ 小孩哥 ” 、 “ 我给不了的生活 ” 到让无数人感慨的 “ 阿娇 ” 死忠粉,现在的闲鱼上,完成的不仅是交易,具有人情味的故事也越来越多。 在循环经济被大力倡导的背景下,闲鱼对于年轻人的意义是实用的,也许正在你阅读文章的此刻,就有一个年轻人在上架自家的闲置,流通自己手上吃灰的闲置,变成对他人有用的物件。 但生活并不像数学题,总有既定的标准答案,对于每个人来说,有用的定义都是不一样的,对于年轻人来说,刷到一件让自己大开眼界的模玩,跟同好分享信息,同样也意义非凡。 对于如今的闲鱼来说,消费只是外壳,更重要的是那些爱玩、会玩的年轻人以兴趣为纽带,以物品为介质,与陌生人交易互动,乃至建立友谊,呈现出了中年人看不懂的多元生活方式。 人类的生活与流动促进了各种各样物品的流通,而物品的流转也见证了人们的悲欢离合,西方人称作“命运”,中国人叫他“缘分”。 而闲鱼的美妙意义,大概在于让这世上的你与我,走向相遇。 撰文:黑猫警长 编辑:莽山烙铁头 封面:萱萱
看完苹果大模型的论文,我只能说:如来
大伙儿有没有发现,放弃造车后的苹果,最近在 AI 上的动向是越来越频繁了。 这不,今天一大早就有媒体报道,苹果收了一家搞视觉检测的加拿大 AI 初创公司。但还没一会儿,就又传出个大消息,说是苹果大模型要来了。 正当世超满怀期待想要看看怎么个事儿,却发现所谓的苹果大模型,只是一篇论文。。。 在 arXiv 上,苹果上新了一篇名为《 MM1 : Methods , Analysis & Insights from Multimodal LLM Pre-training 》(多模态大型语言模型预训练的方法,分析和洞察)的文章。 论文里,他们公布了个名叫 MM1 的基础大模型系列,其中 MM1 支持图文多模态,参数规模也分了小杯的 30 亿、中杯的 70 亿,还有大杯的 300 亿三种。 世超总体看起下来, MM1 的原理和市面上其他的一些大模型比,并没啥大差别。 但,世超还是翻到了些比较有意思的干货。因为他们通过一大堆实验,研究出了些能让多模态大语言模型变得更聪明的小技巧。 就比如,他们在训练模型的一开始,就给 AI 来了一波 “ 消融实验 ” ,大伙可别被这个生僻的名词给吓到了,消融实验,咱可以粗略地把它理解成 “ 可控制变量法 ” 。 就像差评君说他打游戏菜,是因为空调温度太低影响了他的发挥,那咱就空调温度往上调调;当然也可能是屏幕太亮,晃着眼差评君的眼睛了,所以咱也把屏幕亮度调低试试。。。 总之经过一系列调整之后,肯定能找出差评君游戏菜的锅,到底该谁背。。。 同样,在训练苹果大模型时,技术人员也挨个调配置,比如修改预训练数据源,或者调整图像分辨率,来看看调整之后,对模型性能到底有啥影响、有多大影响。 这样做的目的,就是要确认哪种组合设计可以让模型变得更聪明,世超也就不卖关子,直接公布最后的 “ 结果 ” 了。 首先,他们发现图像编码器的设计,尤其是图像分辨率和图像标记的数量,对模型性能的影响贼大。 说人话就是,图像越清晰、标记的细节越多,模型效果也就越好。 模型在不同图像编码器配置下,对不同图像分辨率和数据预训练的消融实验结果 还有咱们都知道,一般多模态多模型都能分成视觉模型、大语言模型和视觉语言连接器( 帮助模型理解图片内容,并用文字解释的部分 )三部分。 苹果则发现,其中视觉语言连接器相对是个小透明,无论它具体咋设计,对模型性能的影响都比较小。 另外再举个例子,模型从来没见过猫的图片,但在测试的时候却能认出猫是猫,这叫零样本性能。他们则发现,要想提高模型的零样本( zero-shot )性能,训练模型时,带标题的图像数据很重要。。。 说实话,上面的这些发现,多少还是有些人类能理解的逻辑在里面。 但这论文我越看,就越觉得 AI 妖。 因为实验发现 “ 45% 的图像 - 标题数据 + 45% 的交错图像 - 文本数据 + 10% 的纯文本数据 ” ,这种比例的数据,对他们的多模态大模型训练最有效。 这配方居然还有零有整的,而苹果就是研究出这个配方的厨子。。。 还有一点就是, MM1 也用上了最近流行的混合专家 MoE 架构,这种架构能给模型大脑扩容( 提高参数量 )的同时,又不会影响到模型推理速度。 这个 MoE 架构可以理解成,把一个模型拆成好几个 “ 专家 ” ,每个专家负责处理不同的任务。 假设你去医院看病,传统模型就像一个全科医生,他可以处理各种疾病,但没法子做到科科都精通。 MoE 架构则更像一个医院,它有不同的科室,医院系统会根据你的病情调一个最适合的科室大夫,既不会浪费医疗资源,又能给你提供更专业的医疗建议。 这次,苹果就搞了一个有 64 个专家的 30 亿参数模型,和一个有 32 个专家的 70 亿参数模型。 反正经苹果这么一调教,按照他们的说法, MM1 已经在某些领域超过了群内同行,达到了 SOTA ,也就是目前最先进的水平。 SOTA 的定语有点长,大家细品 最后世超想说的是,之前在 2024 苹果股东大会上,库克就提过苹果今年要在 GenAI 领域大展拳脚。 而这篇论文,或许可以看作是苹果进入生成式 AI 领域的一块敲门砖,也变相跟外界解释了一波其实他们一直都在紧跟潮流,没有外界说得那么落伍。 还有论文里的发现,虽说有些零散,但好歹也让以后的大模型炼丹,有了些方向。 不过咱也说实话,且不和微软、谷歌这些大模型第一梯队的比了。。。 单是国内主流手机厂商,都已经吹响了 AI 大模型手机的冲锋号角,魅族要 All in AI , OPPO 成立了 AI 中心,华为的鸿蒙 4.0 也接入了盘古大模型。 苹果再不整,可就真来不及了。 最后,如果这大模型能成,我对他的要求就一个,求求给 siri 换个好使的脑子吧。。。 撰文:西西 编辑:江江 & 面线 封面:焕妍
调查显示美国智能手机损坏率下降,但使用时间和维修支出上升
美国智能手机用户在过去一年损坏手机的比例有所下降。该调查于2023年5月至12月期间进行,共收集了1004份有效回复。结果显示,过去一年有7800万美国人损坏过智能手机(包括安卓和iOS系统),尽管这个数字仍然很高,但低于2020年的8700万。 造成损坏率下降的原因可能是智能手机价格的上升、人们对环保意识的提高以及更多用户开始使用手机保护壳等保护措施。在受访者中,53%的人表示环保问题对他们很重要,这一比例在2020年仅为37%。 然而,另一个有趣的现象是美国人使用智能手机的时长正在增加。49%的受访者表示他们比一年前花更多的时间在手机上。此外,屏幕维修支出也水涨船高,从2018年的34亿美元飙升至2023年的83亿美元。 调查还显示,45%的受访者每天使用手机时间超过5个小时;82%的人表示手机已经取代了他们的数码相机;39%的人每天拍摄6张或更多的照片,31%的人每天录制6个或更多的视频。 超过一半(54%)的受访者表示,他们现在更倾向于用手机观看视频、电视剧和电影,而不是传统的电视机。 调查显示,在过去一年中,31%的用户损坏过手机,8%的人丢失过手机,5%的人遭遇过手机被盗的情况。 最常见的手机损坏和故障类型包括屏幕损坏(67%)、Wi-Fi或网络连接问题(28%)、触摸屏失灵(24%)、充电口松动或损坏(22%)、进水(21%)、电池故障(21%)等。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。