EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
纽约时报:美国电动汽车100多年前就曾失败,如今会重蹈覆辙?
1897年,纽约市的电动出租车 凤凰网科技讯 北京时间5月27日,《纽约时报》周一发文称,100多年前,电动汽车就曾在美国风靡一时,但受到充电不方便、政治等因素的干扰,最终败给了油车。如今,美国的电动汽车发展情况与100多年前类似,美国还会重蹈覆辙吗? 在特斯拉推出首批电动汽车的一个多世纪前,美国街头就已经出现了贝克(Baker)电动轿车和瑞克(Riker)电动跑车的身影。当时,电动汽车颇受欢迎,以至于纽约大约三分之一的出租车都是电动的。 然而,这些早期电动汽车很快就被后来居上的新型燃油车所取代,例如福特T型车。它们不仅价格更便宜,而且更容易加油,那时石油燃料正在全美迅速普及。再加上1920年代联邦税收优惠政策的推动,石油产业实现了蓬勃发展,汽油车也随之大量涌现。 这段历史基本上已被人遗忘,几乎所有早期电动汽车都已彻底消失,以至于如今大多数人从未亲眼见过,有些人甚至根本不知道它们曾经存在过。仅有极少数保留下来的电动汽车被收藏于博物馆或私人藏品中,其中包括一辆由美国主持人杰·雷诺(Jay Leno)收藏并完全修复的贝克电动汽车,停放在他位于加州的大车库里。 1919年,一辆电动汽车正在充电 这辆车现在看起来或许很新奇,但它之所以具有新的重要意义,是因为美国可能即将重蹈历史覆辙。 历史惊人相似 眼下,特朗普政府和国会中的共和党人正试图阻碍电动汽车的发展势头,对电动汽车征收新税,并大幅调整联邦政策以支持石油和汽油产业。 研究过早期电动汽车发展历程的学者们发现,电动汽车在20世纪初的衰落历程与如今所面临的困境存在诸多相似之处。在这两个时代,电动汽车都难以获得市场的广泛接受,也都受到了政治力量的打压。人们对电动汽车最大的质疑之一是“需要充电”,最终被认为不如内燃机汽车方便。 “如果你有拖车公司的话,电动汽车还是挺不错的。”特朗普在2023年10月爱荷华州的一场竞选集会上这样讽刺道。一个月后的另一场活动上,他又说:“你开着电动汽车根本出不了新罕布什尔州。” 实际上,充电和电力的普及问题早在一个世纪前就困扰着电动汽车。 20世纪20年代,美国人渴望探索自己的国家,但当时许多乡村和郊区地区尚未通电。罗斯福总统在1936年大力推动电力在美国的普及,直到1970年代初最后一批农场才接入电网。这也使得在许多地方使用电动汽车变得极为不便。 共和党领袖现在认为,电动汽车不应在税法中享受补贴,他们的税收法案旨在纠正此前民主党偏袒电动汽车的失衡局面。 杰·雷诺收藏了一辆修复版的贝克电动汽车 100年前,立法者们也曾插手干预电动汽车的发展,并且站在了石油产业这一边。 石油产业长期享有大量税收优惠。其中一项立法可追溯至1926年,当时美国国会允许石油企业按销售额的27.5%抵扣应税收入。该立法提案人后来承认,这一激励措施过度。 “我们定了27.5%的抵扣比例,不仅因为贪心,更因这个古怪数字能让它看起来像是科学测算的结果。”该税收优惠提案人、得州民主党参议员汤姆·康纳利(Tom Connally)表示,这段话在美国前总统林登·约翰逊传记《山姆·约翰逊的儿子:得州总统近距离观察》中被引述。 这项税收优惠持续了数十年。美国直到1975年才取消了对大型石油生产商的优惠,并减少了对小型公司的优惠。 美国电动汽车发展放缓 如今,内燃机汽车与电动汽车之间长达数十年的激烈竞争再度加剧。电动汽车或许正面临困境,至少在美国是这样。 据研究公司Rho Motion的数据,全球大部分地区电动汽车的销量正在迅速增长。今年前四个月,中国电动汽车销量增长了35%,欧洲增长了25%。但据汽车研究公司凯利蓝皮书的数据,今年前三个月,美国的电动汽车销量仅增长了11%。 特朗普打压电动汽车 共和党领袖正在推动一项立法,取消拜登政府时期旨在促进电动汽车销售的多个项目,包括7500美元的联邦税收抵免。他们还计划对电动汽车车主征收每年250美元的新费用,用于资助高速公路的建设和维护。 虽然共和党的这些措施或许不会彻底扼杀电动汽车产业,但它们可能会让该行业的发展进程倒退数年。伯恩斯坦公司分析师本月在一份报告中指出:“美国电动汽车的发展势头已经放缓,政策的不确定性也在不断增加。” 开电动汽车不够“阳刚”? 不过,电动汽车面临的阻碍远不止是政治因素,它们还得克服性别偏见。其诸如安静、平稳的运行等优点在一些男性眼中被认为过于女性化。在19世纪末和20世纪初,许多像贝克电动汽车这样的车型还明确只向女性进行销售宣传。 在杰·雷诺位于加州伯班克的车库中,墙上还挂着当年的电动汽车广告。其中一张写着:“让这个圣诞节最幸福,送你妻子一辆电动汽车。”另一张广告中,一位年轻女性请求道:“爸爸,给我买辆贝克吧。” 相比之下,男性长期以来一直被灌输汽油车所代表的“阳刚”美德——那种轰鸣与震撼的感觉。 2022年秋天,与特朗普关系密切,来自佐治亚州的共和党众议员玛乔丽·泰勒·格林(Marjorie Taylor Greene)在一场集会上宣扬了汽油车更具“男子气概”的说法。她说:“没有什么比福特野马或雪佛兰科迈罗引擎盖下V8发动机的轰鸣声更美国的了,那种强大马力带来的感觉令人难以置信。”但她表示,民主党人“想要阉割我们开车的方式”。 特斯拉CEO埃隆·马斯克(Elon Musk)一直在努力与特朗普政府合作,同时试图扩大电动汽车的吸引力。特斯拉最新推出的车型是Cybertruck,一款外形拥有大量棱角的大型皮卡。 “马斯克竭尽全力让特斯拉看起来是一款有男子气概的车型。”新墨西哥大学历史系杰出的荣休教授、著有《掌握方向盘:女性与汽车时代的来临》等多本著作的弗吉尼亚·沙夫(Virginia Scharff)表示。 马斯克疏远了特斯拉车主 不过,沙夫教授补充说,马斯克可能做得太过了。他与特朗普的政治保守派结盟,正在疏远电动汽车最忠实的一批购买者:那些希望摆脱化石燃料的自由派人士和环保主义者。 “这其实像是一次性别观念的反转:如今的特斯拉越来越被视为某种‘有毒的男子气概’的象征,而不是像20世纪初那样,电动汽车被认为是女性化的东西。”沙夫说。 前景乐观? 安德鲁·瑞克(Andrew Riker)在19世纪90年代中期设计的一辆敞篷双座电动汽车,如今依然能以每小时约15英里的速度缓慢行驶。它目前正与其他老式电动汽车及正在研发的电动汽车一起,在彼得森博物馆展出。 尽管面临政策和其他方面的挑战,瑞克仍然对电动汽车的前景感到乐观。他预计,未来几十年内,技术进步将使电动汽车在与汽油车的竞争中占据明显优势。 “如果你能在5分钟内充满电,并行驶500英里,”他说,“那汽油发动机将彻底成为历史。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
一场比赛催生5000万订单:机器人产业进入“赛事经济”时代
摘要: 这场机器人格斗大赛的意义,远不止于一场表演。它像一面镜子,映照出人形机器人技术当前的极限与潜力——既有令人惊叹的灵活性与策略性,也暴露出动力、算法、结构等方面的挑战。 凤凰网科技 出品 作者|姜凡 编辑|董雨晴 今年,机器人的表现着实吸引了无数目光。 4月,在北京亦庄的赛道上,20台人形机器人开启了人类马拉松史上极为特殊的一场起跑。尽管这些机器人步伐踉跄、行动不稳、状况百出——但这些插曲并未削弱比赛带来的震撼——人们第一次亲眼目睹,机器人正以如此生动的姿态闯入人类的竞技领域。 5月,一场同具震撼力的机器人赛事——《CMG世界机器人大赛·系列赛》机甲格斗擂台赛在杭州开赛。该赛事则是全球首个以人形机器人为参赛主体的格斗竞技赛。 此次比赛分为表演赛与竞技赛两部分。参赛队伍仅有四组,比赛所使用的机器人本体均出自宇树科技的人形机器人G1。 不少网友在观看完比赛后表示,整个比赛表现远超预期,甚至有人惊叹道:“全世界仿佛都沉浸在电影情节里,而我们这场比赛竟是真实的机器人对打!”还有人感慨:“2025年的科技水平已如此惊人,虽说比赛中的机器人仍需人遥控操作,但真不敢想象到2035年又会是怎样一番景象。” 大约在7年前,各大视频平台都推出过机器人格斗赛的综艺项目,最终爆冷终结。而今天,形势已完全逆转,这背后是技术与生态的共同跃迁。 格斗赛,比马拉松还难 本次比赛是由四位来自不同领域的非专业选手,操控四台宇树G1机器人登上擂台,展开了三轮共计十二回合的“激烈”格斗对抗。经过多轮角逐,由一位人工智能博主操控的“AI策算师”机器人脱颖而出,成功击败所有对手,摘得本次比赛桂冠。 据官方提供的数据显示,宇树G1机器人身高约130厘米,体重达35千克,电池续航能力约为2小时。该机器人配备29个自由度,膝关节最大扭矩为120N.m。 此外,宇树G1机器人具备卓越的运动性能,能够完成左右勾拳、上勾拳、组合拳等复杂攻击动作,还可实现闪避、跌倒后起身等高难度动作。 这一次比赛的意义还在于,并不是所有人形机器人都是所向披靡的。也有很多较为滑稽的表现。即使有人为操控,仍有部分机器人失去稳定摔倒、被对手打败;也有一些机器人颇具策略意识,能够根据赛场形势见机行事。更有甚者,在战胜对手后,还会转身做出类似拍屁股的挑衅动作。 机器人格斗看似简单,实则面临诸多技术难题。 据央广网报道,处于格斗模式的人形机器人存在三大训练方面的棘手难题。 其一,格斗模式对瞬间爆发力要求极高。这就要求机器人必须配备强大的动力系统,只有这样,才能提供足够的扭矩,让机器人可以快速做出动作响应。 其二,控制算法的精准度与稳定性至关重要。控制算法需要实时处理海量的传感器数据,精准计算身体各部位的运动轨迹以及发力时机,从而对机器人的多关节、重心和姿态进行毫秒级的精确控制,确保动作既充满力量又协调有序。 其三,机械结构的强度要求不能低。当机器人进行格斗动作时,它的机械结构会承受较大的冲击力,这就对关节、骨骼等结构的强度和稳定性提出了非常严格的要求。 另有行业投资人士对凤凰网科技表示,“机器人互动本身是一件非常具有挑战性的事情,这也是为什么前一段时间机器人跑的是马拉松,而不是接力赛,这次好在机器人格斗大赛用的都是宇树的机器人,也让互动这件事更有可能实现”。 这么多技术难题,需要一一克服,那为什么非要办一个这样的比赛? 宇树科技在赛前接受采访时表示:“通过格斗比赛,可以验证机器人结构的极限,从而不断进行调整,进一步完善机器人结构稳定性。” 其实,这场机器人格斗大赛的意义,远不止于一场充满科技感的表演。它像一面镜子,映照出人形机器人技术当前的极限与潜力——既有令人惊叹的灵活性与策略性,也暴露出动力、算法、结构等方面的挑战。 格斗正是检验机器人极限的“试金石”,每一次出拳、每一次跌倒后的爬起,都在推动技术的边界向前延伸。或许在不远的将来,这些在擂台上锤炼出的技术,将融入工业、医疗、服务等领域,而今天这场“又萌又凶”的格斗赛,正是迈向那个未来的一小步,却也是充满想象力的一大步。 比赛后,暴涨的订单 各项赛事不仅充分展现了各大机器人的实力,也为其各自带来了实打实的收益。 在今年四月的北京亦庄机器人马拉松赛事中,松延动力堪称最大黑马。其提供的参赛机器人不仅顺利完成全程比赛,更以稳定的表现斩获亚军殊荣。这场赛事让松延动力在业内声名鹊起,不少投资人都“纷至沓来”。 松延动力董事长此前在接受《财经天下》周刊采访时透露,因为一场比赛,公司估值也从赛前的5亿元涨到了20亿元左右。 自参赛结束后,时间来到五月份,松延动力召开了一场生态战略会议。据相关报道披露,在会议现场,该公司成功签约总金额达 5000 多万元的订单,同时还售出 1000 余台人形机器人以及 20 多台仿生机器人。 这样的“赛事效应”或许正在让机器人行业形成良性循环。预计后续会有更多的机器人赛事如雨后春笋般涌现,而这些赛事带来的商业价值正呈现几何级增长。 赛事成为技术验证的最佳舞台。格斗赛检验抗冲击能力,马拉松考验续航性能,这些实战数据比实验室测试更具说服力。 赛事同样是绝佳的品牌曝光机会。CMG格斗大赛现场观众超5万人,线上直播观看量突破2亿次,这种量级的曝光让参赛企业更是直接省去了巨额广告费。 2017年时,优酷曾经打造过一款S+级别的超级网综节目《这就是铁甲》,粉丝们曾戏称其为“机器人格斗竞技世界杯”,最终该节目以总播放量超17亿,微博主话题阅读量超20亿收官。彼时,节目的主办方一直抱着忐忑的心情,他们说“这个内容太新了,我们内心也有犹豫和不自信的地方。” 七年过去,机器人的进步已超想象。从马拉松到拳击赛,越来越多机器人史上的第一次正在发生。 当我们在赛场见证机器人跌倒后自主起身的瞬间,看到的不仅是技术的进步,更是整个产业生态的跃迁。从北京亦庄到深圳湾,从央视直播到创投圈热议,机器人大赛正在推动整个行业向上,向前发展。
淘宝正在发生一场“文艺复兴”
今年618,一些商家发现,淘宝的流量政策正在变化。 一份给商家的淘宝新政策解析显示,淘天内部今年调整了策略,流量扶持的重点转向了真实成交增量。 所谓真实成交,是扣除退款、退货等资损后核算的真实成交额,直接体现商家实际到账收入及经营效益。 过去几年,仅退款等薅羊毛漏洞的存在等原因,使得电商整体退货率整体走高,很多平台的GMV已经不能真实反应商家的实际增长水平;另一面,若按GMV口径,一些擅长流量玩法,但商品质量差、退货率高的商家,就钻了平台的空子。 指标变化的意义是,平台更重视“真实有效的增长”。纯搞流量玩法的商家在淘宝获取流量将会变得困难,平台更倾向于保护和扶持商品质量和服务优质的商家。 一些变化已经悄然出现。字母榜发现,今年618前,淘宝推出了新版店铺评价体系“真实体验分”,其评判标准为商品质量、物流速度、服务保障三个方面的客观指标,分数会和店铺流量直接挂钩。虽然正式上线要等到6月底,但4月底开始,商家已经能在后台看到分数,可以预见,这将成为未来评判商家的最重要标准。 最新动态是,淘宝天猫刚刚上线了搜索店铺评分筛选功能,消费者搜索商品时,在搜索结果筛选栏启用“店铺评分”筛选,即可根据当前搜索结果,一键选择高分店铺商品。这意味着,无论是平台根据评分在搜推场域分发,还是向消费者提供主动筛选,淘宝天猫正通过各种路径为高分店铺获得更多流量。 这种调整方向也与近期取消仅退款一致。过去几年,电商行业一度进入了完全的“买方市场”,一切都以用户喜好为导向,甚至牺牲商家利润;与此同时,商家们则在无限卷低价。仅退款叫停算是给这个方向画上了休止符。 从淘宝的传统看,他们其实一直营造的是和商家共同发展的长期良性关系,而不是让他们单纯成为自己供应链上的无名厂商,淘宝和天猫因此涌现了众多淘品牌。 现在,整个行业又正在重新回到良性竞争的轨道上,这可以说是淘宝的一次文艺复兴。 字母榜获悉,“扶优去劣”是今年淘宝618期间在流量分配、商家激励和补贴等多种政策背后的真实战略考量,同样是贯穿全年的战略方向:提供优质商品、服务的商家将获得平台更大幅度扶持。 显然,淘天正进行一次整体的体质调理,在淘宝“扶优去劣”大背景下,电商行业吃大锅饭的时代过去了。 “‘扶优去劣’是淘宝高层定下来的长期战略,淘宝内部是希望电商市场重新回归理性,商家需要的是良性竞争”,一位淘宝内部人士表示。 字母榜获悉,真实体验分是赶在仅退款全面取消前官宣的。一位电商运营表示,“真实体验分”未来会和店铺流量紧紧绑在一起,高分店铺能在搜索、推荐等池子里获得更多流量,“这督促商家们提升商品质量,找靠谱物流合作,好好培训客服,不然很难获得消费者的青睐。” 一位资深电商从业者说,店铺真实体验分达到4.8甚至5分的店铺会在搜索排名里优先展示,也能自动入首页推荐的池子,“能吃到不少免费流量”。 上述淘宝内部人士告诉字母榜,淘宝高层希望对平台生态进行一场系统性的体质调理,“以前商家只讲流量,现在淘宝希望让商家更注重提升商品质量、做好服务。” 字母榜获悉,具体的调整方向是,重点扶持优质品牌、原创商家,将优质的资源大量倾斜给产品力强、服务指标好、愿意与平台共赢共发展的商家。 最新动向是,今年618淘宝天猫上线搜索店铺评分筛选功能,消费者可一键选择高分店铺商品。淘天相关负责人介绍,该功能下,高分店铺商品更容易被消费者看到,“提供好产品、好服务的商家有望获得更多生意增长机会。” 另外618期间,阿里妈妈也投入了30亿红包补贴商家,其中的亿级资金用于优选商品扶持,显然,扶持又倾斜给了优质商品和商家。 这一大背景下,单纯的流量玩法就失灵了,那些只擅长流量玩法的商家,在淘宝的空间将会愈发逼仄。 事实上,过去几个月,平台已有了明显的变化和方向转型。一是不再过度卷低价,弱化“绝对低价”策略,转为比拼商品质量、原创性,强调长期价值的竞争。 官方去年已经对外释放过这一消息,去年双11前夕,淘宝相关负责人曾对外表示,淘天的价格力,是指在品类的每一个价格带都有竞争力,不是一味卷低价。“恶性价格战不仅挤压商家的利润空间,也不能满足消费者的品质需求。” 二是优化营商环境、削弱恶性竞争,治理仅退款就是其中重点之一。 去年淘宝已经率先给优质商家开了一道松绑仅退款的口子。7月底,淘宝上线店铺体验分体系,对4.8分以上优质服务商家平台不主动介入仅退款。 到今年,淘宝更是加码营商环境优化。今年上半年,除了全面取消“仅退款”外,淘宝天猫已经针对恶意店群、AI假图治理、“羊毛党”进行了一系列治理。618期间,淘宝天猫围绕异常退款、异常物流等问题上线多项商家政策,帮助商家提效经营。 618期间淘宝面向商家的相关利好 从淘天今年的动作来看,淘宝今年的调整的重点之一,就是围绕店铺进行系统性重构,真实体验分是第一幕,也是这场变化中重要的“尺”。 618前夕,淘宝还上线了新店铺框架和新店铺标签,核心变化是,根据用户使用习惯进行全面简化。 “今年策略是让各个店铺回归自己的优势地带”,上述淘宝内部人士说。比如知名品牌的店铺框架,新增黑金标认证体系,特色商家重点强化店铺特色信息,升级新品页功能。 另外,平台还会给优质高体验分商家店铺标签在公域更多露出机会。重新优化的店铺标签,将在店铺首页、搜索、推荐等多个核心场域展示。 淘天为何要围绕店铺调整? “扶优去劣”的目标除了系统性调整平台体质,另一目标则是让优质商家获得增长,解决商家缺流量、缺复购、缺利润的问题。 店铺的本质就是货架电商。过去几年,行业内曾有过一轮货架电商与内容电商之争,结论就是内容电商虽然短期内能带来丰沛的流量,但货架电商是才是做留存和复购的关键阵地,更适合商家长期经营。 正因如此,意识到这个问题的内容电商,在过去几年一直在努力补上自己货架电商的一环。早在三年前,抖音就宣布要加码货架电商,要将货架场景的GMV提高到50%。 电商竞争打到货架电商这侧,便来到了淘宝的优势地带,显然淘宝正在试图强化其货架电商和店铺体系的优势,让商家做好会员体系的留存和复购不可或缺。 一位淘宝相关人士告诉字母榜,以前很多商家没有意识到会员私域的重要性,入会的券额都很低,但今年平台会跟商家做共同投入。 3月中旬,淘宝内测新版店铺会员产品。主要是在搜索页、商品详情页等位置展示店铺会员信息,比如在搜索推荐页展示会员价、会员券、会员立减、会员加赠等会员权益信息,吸引用户入会。 “淘宝内部讨论的结论是,让商家以店铺为根据地,做好货架、稳定经营。”上述阿里人士表示。 从今年618上半场的结果来看,这些动作已经有了阶段性结果。据淘天公布的数据,今年618期间,会员成交破千万品牌超320家;截至5月18日24点,淘宝天猫平台商家会员客单价相比整体大盘高达2倍以上,商家会员价值也在持续增长。 商家会员销量与客单价增长与618平台的一系列动作有关,同样与平台618期间推出的两个重要活动有关:一是平台推出了购物金打榜赛等玩法,帮商家提升会员群体复购成交规模;另一方面,针对提供优质会员权益的商家,平台在搜索、推荐等场域,为商家提供额外公域流量。 事实上,这些方向皆是淘宝年初以来增长战役的延续,也是接下来淘天的发展重点。 从淘宝的传统看,他们其实一直想营造的是与商家共同发展的长期良性关系,淘宝和天猫涌现了很多淘品牌就是力证。 淘宝这一轮的“扶优去劣”,可以说是淘宝的一次文艺复兴运动,电商行业正回归理性发展的正轨,淘宝是这些平台中最先转向也是最坚定转向的一个。 行业内也开始对淘宝有所预期——虽然“扶优去劣”短期内可能会伴随一些阵痛,但调理后的平台生态,将有望催生出更多优质品牌和商家。一切将会是全新的。 上述电商运营说,4月中下旬,淘宝天猫商家后台就会更新店铺真实体验分了,“平台这次砸钱做用户教育,肯定会捧出新一代口碑神店。” 过往经验已经证明,平台每一次大的方向调整,都会有一批新的商家跑出来,淘宝这轮调整,显然是优质品牌和商家们的机会。 淘宝“扶优去劣”的大背景下,单纯的流量玩法已经失灵。现阶段,商家要重新理顺好“流量+新品+复购”等一整套玩法。 尽管获取新流量变得艰难,但站内外的投流策略依旧重要。为了扶持优质商家,淘天今年加大了从站外引流的力度。甚至商家投放站外广告的同时,淘天会追加投放。 字母榜了解到,目前淘宝站外引流的平台已经包含小红书、微博、B站、微信等各大主要平台。 一位淘宝人士告诉字母榜,在服饰类目,平台会和商家已经开始共同去站外投流了,“比如商家在小红书投放了50万,平台最高会再补贴50万。” 4月,天猫方面还表示,会在站外流量方面做“更激进的策略运营”。5月,这一计划浮出水面,淘宝天猫与小红书达成合作,在小红书投放种草笔记的优质商家,支持商品一键跳转至淘天,商家投放站外流量的确定性增强。 另外,今年商家想从淘宝池子里获取流量,除了要保证商品质量和服务,另一个关键点是做新品。 “今年做淘宝,一定要赶紧上新,上新就有流量。另外有原创设计能力的服饰商家上新之后,要报名超级新品橱窗,流量会明显不同。”一位电商从业者建议道。 今年2月,淘宝商家后台上线了“新品超级橱窗”板块。服饰商家,每发布成功一个新品,最高可拿3万曝光PV的流量。 经济大环境的改变,正在不断改变人们的消费习惯,这意味着能抓住新消费趋势的商品和品牌,将获得新的增长机会。 一个已经被许多人看到的机会是,“性价比品牌”正在崛起,需要指出,性价比品牌指的并不是过去几年行业内无限卷低价的极致低价品牌。 历史经验已经证明了这条赛道可能产生的机会。1996年后,日本消费产业迎来大衰退时期,平价商品由此兴起,无印良品、优衣库、大创百元店等一批强调高性价比的企业在竞争中胜出,这些品牌的共同特征是,兼具了价格、商品质量和服务的多重要素。 显然,新赛道的增长大战,才刚刚开始。这是商家们的机会,同时,也是平台的机会。
全彩显示的AI眼镜来了!8999元带走阿里大模型和最强光波导
国补后7649(原价8999),雷鸟正式发布了带有定制大模型和全彩显示的AI眼镜——X3 Pro。 雷鸟X3 Pro搭载了4nm高通骁龙AR1平台,支持光波导全彩显示,重量仅为76g。 在AI上,雷鸟延续了之前V3的部署方式,继续与阿里通义深度合作,内置了定制化的多模态大模型,可以面对眼前看到的一切,向AI发出提问。 此外后续还将上线AI Agent商店,可以搜索并安装更丰富的AI应用,还能搭配手机实现眼镜中的实景导航。 并且依然是不搞长期预售,今日(5月27日)即刻开始预售,6月15日就能发货。 随时随地,用AI探索世界 在之前的V3当中,雷鸟就与通义团队合作打造了专门定制的大模型。 量子位不久前曾与雷鸟创始人李宏伟先生进行过一次对话,其间李宏伟就表示,定制化大模型是做好AI眼镜的必经之路。 X3 Pro当中,雷鸟再次和通义联手,开发了专为AR眼镜优化的可视化大模型。 有了X3 Pro,可以边走边问、边吃边问、边聊边问,AI能随时回答你的问题,并且有了摄像头,还能对眼前看到的一切进行提问。 戴上X3 Pro,相当于你有了一名真正的全能导游。 比如你来到北京的故宫,AI能很快捕捉场景,告诉你建筑的幕后故事。 再比如来到新疆赛里木湖,想知道这片湖水中有着什么鱼,AI也能给你解答。 除了即时问答,X3 Pro也搭载了全新的AI翻译能力—— 和外国人交流时,你能实时听到眼镜传来的同步翻译声音,还有“同看传译”,让你就像看实时字幕一样,看翻译的内容。 对于文本,也配备了拍照翻译功能,随时拍下照片就能翻译,无论是餐馆的菜单,还是机场的登机牌,又或者是英文的广告牌,都能所见即所得。 AI翻译同时支持了8种外语,让你在全球主流国家都能想翻就翻。 此外,雷鸟还通过AI Agent商店,为X3 Pro准备了更多的AI应用,从饮食顾问、模拟面试到演讲技巧分享统统涵盖。 不仅能独立使用,还能当手机伴侣 除了独立使用,X3 Pro也可以成为手机的伴侣,为手机最高频的三个自带功能——通话、音乐和通知——设计了专门的组件。 X3 Pro可以实时将你的通话内容转成文本,为设计了“空间歌词”功能,以及可以调用手机所有通知提醒的全新的通知组件。 在这几项基础功能之外,雷鸟带来了两款全新为手机服务的应用——超级录音和实景导航。 X3 Pro内置了快捷录音按钮,可以随时记录灵感,并且支持一边录音,一边实时在手机上同步显示进度,还能区分每一个说话人,做对应的人物标记。 实景导航方面,雷鸟和高德地图一起,实现了跨平台的定位功能,并把手机的全景地图完全同步到了眼镜上,实现了豪车HUD级别的地图显示。 除了这些,雷鸟还为X3 Pro开发了一套全新的测试版安卓虚拟机系统,它能自动将应用进行双画面渲染输出,同时匹配相应的分辨率,并进行色彩显示的优化。 现在,已经可以在AR眼镜上,体验刷抖音、逛B站,甚至是玩王者荣耀……未来,雷鸟正在逐步计划开发大量的官方应用,并接入小程序等新的功能生态。 光引擎+光波导,全彩显示的AI眼镜 在之前的交流当中,李宏伟表示,具备全彩显示能力的AI眼镜,才是AI最好的落地载体。 实际上,整个行业中,光学显示对于AR来说都是珠穆朗玛峰一样的存在,全行业都在不断的尝试用新技术,去攻克光学显示的难题。 之所以AR显示十分困难,是因为它不同于传统的带屏幕的设备,后者采用了直射的方式来成像,人们肉眼看到的就是屏幕本身。 但AR眼镜受制于体积限制,无法通过直射式的光路实现成像,从光引擎发出的图像,需要在镜片中经过非常复杂的光学通路,经过数百次折射、投射和衍射,才能最终在镜片上成像,这需要光引擎和光波导非常默契的配合。 这当中,一共涉及了雷鸟提出的两项关键技术——萤火光引擎和RayNeo光波导。 萤火光引擎是首个把体积做到0.36cc的光引擎,也就是和一颗小小的绿豆相当。 看似一颗颗小小的萤火光引擎下,分别集成了红色,绿色,和蓝色三块屏幕,左右双眼共6块屏幕,他们需要精准的把每颗像素进行一对一的匹配,并最终通过雷鸟自研的超微棱镜进行聚光,使之能够输出高达100万尼特的亮度。 但绿豆大小的输出显然不能直接被肉眼观察,在光引擎输出完整的画面后,还需要对画面进行放大。 在这一步当中,雷鸟X3 Pro抛弃了过去低光效的纳米压印技术,改用RayNeo光波导来实现。 RayNeo光波导通过光刻机在基底上进行雕刻实现,波导片在多项性能指标上,都有着巨大提升—— 体积方面,仅需一层玻璃片,就可以实现全彩的显示效果,厚度直接减少0.6毫米,重量下降了 25%; 视觉效果上,相比于过去传统的波导技术,减少了95%的彩虹纹; 亮度上,X3 Pro实现了3500尼特的平均亮度和6000尼特的峰值亮度,在阳光下屏幕也清晰可见。 同时,雷鸟动态色彩矫正算法也迎来升级,实现了30度的FOV和1600万的色彩,并提供了最高60Hz的刷新率,带来了极佳的使用体验。 总之,通过萤火光引擎和RayNeo光波导的配合,X3 Pro实现了真正独一档的光学显示效果。 此外,对于近视的用户,雷鸟X3 Pro也提供了两种解决方案。 第一种是卡扣式镜片,可以使用相应度数的近视镜片进行光学矫正。 另一种则是“雷鸟超贴合光学”——通过对镜片光学层的优化,在X3 Pro中实现全贴合的近视矫正效果。 雷鸟将光学层和近视层通过特殊材料进行贴合,实现了一片完整镜片的设计,最终全贴版本的镜片实现了10%的视野提升、20%的厚度下降,以及25%的重量下降。 近视的用户可以在其中任选,不过“超贴合光学”方案需要购买特定版本,价格是10999元,比基础版多2000元。 重量76g,38分钟充电100% 包括显示在内,在这款小体积的眼镜中,集成了超过200个零部件,可以说是一台非常复杂的精密设备。 并且X3 Pro没有采用独立盒子计算的分离式架构(Meta Orin也是分离式),而是直接采取了一体化方案。 X3 Pro上使用了全新的高通AR1架构,这是一款高通专为AR眼镜设计的4nm芯片,画面输出功耗降低了40%。 这款芯片也具备了出色的连接和处理能力,包括高速的WiFi6和蓝牙5.3、双核ISP图像处理能力,以及高通专属的GPU。 并且,雷鸟还和高通共同联调了AR1的图像输出信号。 交互方面,雷鸟在X3 Pro后续将通过OTA支持Apple Watch交互,通过苹果官方API接口操作眼镜可以利用Apple watch 内部的6轴陀螺仪,直接用手部动作实现操控,并且从Apple Watch之后的四代手表全部兼容。 非苹果用户也不必担心,雷鸟在X3 Pro的镜腿上设计了五维导航触控面板和四个方向滑动控制系统,操纵方式同样简单。 当然,如果实在玩不转手势动作,还可以通过手机APP操纵,或者使用语音进行交互。 另外,对于AR眼镜来说理解空间是非常重要的,为此X3 Pro配备了升级版的猎鹰影像Plus,采用了索尼IMX681和雷鸟定制的豪威空间摄像头的双摄组合方案。 索尼IMX681采用了1200万像素的背照式传感器,提供F2.2的大光圈提高进光量,并且有着16mm的广角镜头提供更多视野。 定制版豪威黑白摄像头,拥有F2.0的大光圈,可以感光能力,同时配合索尼IMX681,能方便的实现距离定位。 正因为两颗摄像头的加入,X3 Pro第一次实现了内外视频同录的功能,可以一边记录周围的环境,一边记录屏幕里看到的内容,方便进行分享。 同时高精度的双摄系统,做到了空间定位的误差小于千分之5,提供了真正精准的空间识别能力。 除了功能、性能、交互方式和空间计算之外,重量也是AR眼镜避不开的话题。 雷鸟X3 Pro选用了航天工业中大量使用的铝镁合金,它的质量非常轻,同时又能提供非常好的支撑性;还使用了钛金属转轴,在进一步减轻重量的同时加固整体产品的可靠度。 除了材料,雷鸟还在产品的11处细节上进行了大幅度优化,包括更小的光机、更轻的PCB、密度更高的电池等等,最终重量仅有76克。 此外,X3 Pro使用了高弹性转轴来适配不同头围的人。使用胶囊空气鼻托来缓解前部的压力,同时还采用了超细腻的肤感漆进一步提升触感。 Two More Things 除了X3 Pro之外,此次雷鸟还发布了两款新品。 AR眼镜(无AI功能)Air 3s和Air 3s Pro,由Air 3升级,国补前售价分别为1499元和1599元; AI拍摄眼镜(无显示功能)V3 Slim,在V3的基础上基于窄脸型用户开发的小尺寸型号,国补前售价1799元,搭配充电盒套装国补前售价1999元。 包括X3 Pro在内,符合要求的用户购买以上产品时均可享受15%的国补,补贴后价格已在图中标明。 另外,还联合名侦探柯南推出了三款联名定制产品——Air3s Pro毛利小五郎限定版(1699元)、V3怪盗基德限定版(1899元)和X3 Pro柯南限定版(9199元)。 三款定制产品中都放入了具备纪念意义的礼盒限定卡,总共有10个款式,此外雷鸟还藏了30张神秘卡片,抽到的用户可以享受免单。 喜欢柯南的朋友,可千万不要错过哦。(doge)
阿里治“大公司病”的这一年
马云也要面临公司“老白兔”的问题了 吉姆·柯林斯在《巨人如何倒下》中描述到——“成功滋生傲慢”,过去多年持续的营收增长等亮眼成绩,或许在某种程度上掩盖了企业内部逐渐滋生的问题。 这种傲慢削弱了企业对内在隐患的敏感度,直至外部竞争压力和市场变局将其逼至不得不变革的边缘。 阿里巴巴,正站在这个临界点上。 自公开承认“大公司病”已有一年,阿里仍在深度治理这一顽疾。 5月上旬,在一年一度的“阿里日”活动中,阿里内部宣布了四项“破壁”举措,包括打通内网论坛“阿里味儿”等。据报道,一些老员工对这些改革表现出兴奋,认为这仿佛重现了创业时期的“阿里味”。 这些举措的核心,显然是为了解决大公司病。 早在一年前,蔡崇信就率先公开点名“大公司病”,他在采访中直言“阿里犯错了”,释放出鲜明信号。随后,他与吴泳铭在阿里年报中联合发布致股东信,首次以正式文件的形式承认问题。 这种高管在全球投资者面前主动认错的姿态,在中国企业中实属罕见。相比之下,尽管腾讯董事会主席马化腾曾多次提及“危机感”,却从未如此坦率地承认失误。 紧接着,阿里的精神领袖马云也在内部信中再度提到“大公司病”。 事实上,大公司病并非阿里独有。在过去几十年互联网企业的高速发展中,几乎所有体量庞大的公司都不可避免地遭遇组织能力下降、沟通效率低下、创新乏力、管理层官僚化等问题。 一个典型的问题就是“老白兔”的出现,曾在业内掀起激烈讨论。彼时马云就曾直言,大公司“老白兔”繁殖速度快,裁撤需“心善刀快”。 未曾料到,八年后,阿里也不得不直面“老白兔”问题的挑战。 值得注意的是,即便是曾被视为互联网典范的阿里,在治理大公司病的道路上,也可以向他者学习。腾讯在这方面经验更加丰富,过去20年的时间里腾讯3次进行变革以适应行业和自身发展的问题;微软也曾因官僚化导致竞争力下滑,最终通过深度自我变革实现涅槃重生,重回巅峰。 阿里能否成功“破壁”,走出困局,仍需时间给出答案。 1、“巨人如何倒下”? 马化腾喜欢说的一句话是“巨人倒下时,体温还是暖的”。这句话曾在腾讯多次变革中被拿出来,用作警示高管、员工。 如今这句话送给阿里予以警示,也正合适。 阿里在面对大公司病的治理中,并不比腾讯经验足。 一年前,蔡崇信、吴泳铭、马云接连发声,直指阿里存在大公司病。其中,蔡崇信在2024年接受挪威主权基金采访时罕见承认:阿里落后了,阿里犯了错。 这一表态,被视为阿里正式启动改革的转折点。 几天后,马云在内网发表《致改革,致创新》,呼应蔡崇信的态度:“我们要向大公司病开刀,从一个决策缓慢的组织,重回效率至上、市场至上的道路,让公司重新变得简单和敏捷。” 蔡崇信与吴泳铭更是在阿里2024财年年报中,坦率承认公司面临大公司病,强调要以“初创企业”的心态推动变革。 距离阿里巴巴三个关键人物表态一年后,阿里的组织改革还在进行。 此次发布的四项措施,正是对马云“效率至上、市场至上”理念的具体回应——打通内网、推动人才流动,意在打破效率与沟通的障碍。 在“阿里日”上公布的四项新举措, 1. 打通公司内部网络论坛“阿里味儿”,重建员工发声的平台; 2.优化员工跨业务流动机制,提升组织灵活性; 3.持续推进“510阿里日”、阿里家书和年陈文化等文化建设项目,重塑企业文化; 4.启动工牌更新计划,象征身份重塑与归属感的再定义。 恢复中断多年的公司内网,是阿里重新审视并回归早期成功经验的一个重要信号。四项措施直指公司的内部流通壁垒,意在打通信息与人才流动的脉络,加速组织内部的沟通与协作。 2、阿里的问题,到底出在哪里? 实际上,大公司病是所有走到规模化阶段的互联网公司都可能遭遇的共性难题。 阿里巴巴的大公司病,其最深层的病灶,也许不在业务,不在结构,而在人,在价值观。 马云在给淘天集团的三大战略中提到了一个关键词:“回归”。事实上,阿里过去一年的种种改革举措,其核心也正是“回归”——回归用户,回归淘宝,回归互联网。 而“回归”的前提,是曾经失去了什么,现在不得不找回来。 在阿里巴巴25年的发展历程中,有20年几乎都在攻城略地,高歌猛进。但自2020年前后起,面对拼多多的快速崛起,面对抖音、快手在直播电商领域的猛烈攻势,阿里开始真正感受到压力。 一组中金公司研究部的数据直观地反映了形势变化:2017年到2021年,阿里在中国电商市场的份额从72.1%下滑至49.2%。新电商平台不断蚕食阿里的领地,挑战其曾经不可撼动的统治力。 问题出在哪里?从表象看,是创新能力不足,是执行效率下滑,是典型的大公司病。但更深层次的问题,藏在人与文化之中。 马云和蔡崇信在公开信中反复强调效率、创新和改革。将这些词语对应到实际业务,每一项都曾让阿里在竞争中陷入被动。 比如在创新上,拼多多自2018年上市后,依靠拼单、砍一刀、百亿补贴、仅退款等模式迅速撼动淘宝的根基。反观淘宝,大多只能被动应战、被动跟随,反应迟缓。 抖音、快手的直播电商GMV一路飙升,突破5万亿规模,而淘宝直播却始终未能掌握节奏,难以形成有效反制。 在外部冲击面前,阿里内部却频繁爆出价值观层面的问题,这更加剧了危机感。 2020年,年轻合伙人蒋凡因桃色事件引发巨大争议。其后续处理结果被外界质疑模糊了阿里的“红线”。同年6月,一场内网直播成为价值观崩塌的缩影:3万多员工围观时,有弹幕写下: “低P碰红线,低P没了;高P碰红线,红线没了;高P碰考试,考试也没了。” 这句讽刺迅速传播,成为当年最具代表性的企业伦理反思。 据晚点报道,蒋凡事件处理过轻,是许多员工的共识。按理说,这应触碰红线,但他只是被“发配”至国际业务线,甚至借此“曲线救国”,重回合伙人行列。 这还不是终点。 2021年,阿里再次爆发807事件,在社会引发巨大关注,进一步撼动了公司声誉。甚至内部员工自发成立“勇敢牛牛员工帮助小组”,群成员突破6000人。这一事件最终导致阿里本地生活CEO李永和引咎辞职。 如此种种,让人不得不问:阿里的问题到底出在哪里? 也许,正是在一批核心管理者身上,组织文化失守,价值观逐步被淡化。 曾几何时,阿里的价值观曾是互联网企业的标杆。那句“让天下没有难做的生意”深入人心,“客户第一”的承诺、“诚信红线”的坚守、马云倡导的“六脉神剑”,都曾构筑出一个鲜明而值得尊敬的阿里形象。 而如今,我们却很难用一个清晰的词汇再去定义阿里。 失去的,不只是市场份额,更是文化的重心与精神的力量。回归的路,不只是业务上的重整,更是价值观上的自我校正。 3、如何“让阿里再次伟大”? 在治理大公司病方面,国内的腾讯也是一个值得参考的案例。腾讯曾经历低谷,但通过内部改革,特别是对中层干部的年轻化和结构优化,完成了组织的“瘦身”与“焕新”。 另一个成功“再造”的经典样本是微软。曾经,微软也被大公司病困扰——内斗严重、信息壁垒林立,一幅著名的讽刺漫画形象描绘了微软各部门“互相瞄准”的局面。 纳德拉上任后,以“云为核心”的战略转型和组织文化的重塑,打破部门藩篱,提升协同效率,最终让微软重回巅峰,登顶全球市值第一的宝座。 腾讯和微软的例子,有一个共同点是,大公司在摆脱自身组织效率低下的解决方案,一定是伴随着新业务的跑通共同实现的。腾讯如果不是视频号跑出来,恐怕930变革最终也是一场空,微软如果不是云业务崛起,纳德拉又如何能将微软从泥潭中拉出来? 阿里AI业务近期取得的成绩,一度带动中概股整体市值上扬,让市场对以阿里为代表的中国互联网巨头再次燃起期待。曾经振奋人心的口号“让阿里再次伟大”(MAGA,Make Alibaba Great Again)再次被高喊。 然而,这股热情并未持续太久。 阿里发布的最新财报不及市场预期,股价随即大跌。财报显示,阿里当季实现营收2364.54亿元,同比增长7%,略低于市场预期的2379.14亿元;在非公认会计准则下,净利润为298.47亿元,同比增长22%,略高于市场预期。 尽管利润超出预期,但市场反应依然冷淡。摩根士丹利指出,阿里云收入增速未达预期是股价承压的主因:“阿里云同比增长18%,虽符合我们的预测,但低于市场20%的普遍预期,这导致财报发布后股价表现疲软。” 面对大公司病的桎梏,阿里选择的路径是“回归”。 马云,作为阿里的精神领袖,早在2023年5月,他就在一次内部沟通会上为淘天集团定下三个“回归”:回归淘宝、回归用户、回归互联网。 两年来,阿里陆续出售重资产,重申“消费者第一”的核心理念,并推出如真实评价分等一系列具体举措,试图重塑用户信任与平台活力。 “阿里日”当天,还有一个耐人寻味的动作:阿里将象征创业起点的“湖畔小屋”复刻搬进了总部园区。这不仅是一次形式上的怀旧,更是一种文化上的提醒——提醒高管、老员工、新员工,要回到阿里的原点,回到那个使命感驱动、充满创业激情的时代。 但当我们重新审视这场“回归”,不禁要问: 阿里曾经失去的是什么?又是谁打破了那条价值观的底线? 阿里今天所面临的,正是类似的抉择时刻。
普通人如何月入过万?这五大AI副业方向值得关注
‍‍人工智能(AI)领域正蓬勃发展。 麦肯锡的一项最新研究发现,企业使用生成式人工智能的比例已从2024年初的65%跃升至今年3月的71%。随着企业用户开始接受它,普通副业者也开始积极参与。 借助AI开展副业可以做到更高效,既能增加收入,又能节省时间。下面是一些具体的创意和方向: 01.创建定制化GPT 如果熟悉ChatGPT或类似工具的使用逻辑,就可以利用这些知识为特定领域创建定制化GPT(即生成式预训练Transformer模型)。当聊天机器人生成所需代码后,将其部署在私有网站上,并向企业提供免费试用,随后采用按月收费的模式。 具体应用场景十分广泛,例如生成法律文件的自动回复、将笔记翻译成正式报告等。最好的方法是针对客户提及的痛点,或通过社交媒体或专业论坛调研,针对特定的任务,开发自动化解决方案,并且一款工具可以服务数百名面临相同问题的客户。 02.开发AI微型工具 如果没有想法创建定制化GPT,也可以在Gumloop等平台上开发自己的AI工具。这类平台支持通过可视化界面构建可大规模运行的工作流程。 利用拖放模板,可以开发各种功能的工具,从对网站进行搜索引擎优化(SEO)审计,到设计求职者排名系统等。完成开发后,便可向企业推广此服务。 03.AI视频剪辑 以往手动剪辑视频可能需要数小时,这会带来很多限制。目前,借助Veed.IO或Runway等AI工具,可以在极短时间内完成视频剪辑与调色、场景重组、去除背景噪音,甚至生成字幕等操作。 04.AI网页设计 网页设计曾是一项高度专业化的技能,如今在AI的助力下,这一领域的门槛大幅降低。AI工具能够加速设计流程,帮助创建吸引访客的网站,同时由AI承担编写代码的核心工作。在熟悉流程时,可以尝试Wix或Jimdo等平台。 05.AI搜索引擎优化(SEO) 企业总是希望在搜索结果页面中获得高排名,但很少有精力对网站进行深度审核。掌握一定AI技能可以借助工具提高SEO过程,例如针对内容优化、标签调整、为提升可读性提供建议。 部分工具甚至能提供数据分析方法,让长期合作的客户直观了解用户如何发现和使用网站。目前Alli AI、Frase和MarketMuse等工具是不错的选择。 原文来源于: 1.https://www.inc.com/chris-morris/5-side-hustles-you-can-do-with-ai/91190296
AI数字人助力PPT展示,SlidesOrator在BEYOND Expo崭露头角
在近日举行的 BEYOND Expo 展会上,SlidesOrator 项目引起了与会者的广泛关注。这一新颖的工具不需要高端的机械设备或虚拟现实眼镜,展台简约却不失亮点,直接聚焦于每一位职场人士都能感同身受的一个核心问题:如何更好地展示 PPT。 SlidesOrator 的理念与其功能紧密相连,它的目标不仅是帮助用户快速制作 PPT,更在于通过 AI 技术将演讲变得 “自动而可信”。与传统的 PPT 制作工具不同,SlidesOrator 更注重演讲的质量,而不仅仅是内容的堆砌。 图源备注:图片由AI生成,图片授权服务商Midjourney 用户在使用 SlidesOrator 时,只需将自己准备好的 PDF 格式幻灯片上传,系统便会自动生成语音解说,并由3D 虚拟数字人完成整个演示。这一过程不仅省去了真人录音的繁琐,也不依赖于事先的专业训练,大大降低了用户的门槛。 更为惊艳的是,SlidesOrator 并不是简单地播放幻灯片。它的数字人能够根据 PPT 内容即时回答观众提问,模拟出一个完整且互动的 “AI 演讲者” 形象。这一特性使得用户在展示时,可以与观众进行更深入的交流,提升了演讲的互动性和趣味性。 SlidesOrator 团队表示,他们在多语言语音合成、语义摘要、图文匹配和3D 数字人驱动等技术方面进行了深入优化,力求让任何人都能轻松 “托管” 一场高质量的演讲。现阶段,这一系统已经在教育培训、企业宣讲、产品发布等多个领域找到了应用场景,尤其适合那些内容结构化程度高、需要多语种传播的行业。 例如,在跨国展会、在线公开课和初创路演等场合,SlidesOrator 的表现都令人眼前一亮。团队提到,他们的服务受到了许多发展中地区用户的青睐,展会期间,我也看到了一些来自越南和泰国等地的用户上传本地语言的 PPT,展现了这一技术的广泛适用性。 SlidesOrator 不仅提升了 PPT 展示的效率,也为演讲者带来了全新的体验,正在成为现代职场人士的新助力。
欧洲顶尖AI 3D模型研究员创业,拿下超9000万种子轮融资
编译 | 金碧辉 编辑 | 程茜 智东西5月27日消息,据外媒TechCrunch今天下午报道,欧洲顶尖AI 3D模型研究员马蒂亚斯·尼斯纳(Matthias Niessner)将从慕尼黑工业大学视觉计算与AI实验室休了创业假,成立SpAItial并完成1300万美元(折合人民币约为9425万元)种子轮融资。 本轮融资由欧洲早期投资机构早鸟风险投资公司(Earlybird Venture Capital)领投,Speedinvest(一家位于奥地利维也纳的风险投资公司)及多位知名天使投资人跟投。 据外媒TechCrunch报道,SpAItial目前仅发布一支文本生成3D房间的teaser视频,该视频虽简短,却直观展现了通过输入文本指令,快速生成具有一定细节和空间结构3D房间的过程,让外界得以一窥其技术理念与潜力。 而其团队背景堪称豪华。创始人尼斯纳是欧洲AI 3D模型领域的顶尖研究员,在AI及3D模型领域积累了深厚的学术与实践经验。其组建的技术团队成员里卡多·马丁-布鲁亚(Ricardo Martin-Brualla)曾参与谷歌3D电话会议平台(现Beam)的开发工作,在3D通信及相关技术应用方面经验丰富;戴维·诺沃特尼(David Novotny)则在Meta任职六年,主导了该公司的文本转3D资产生成项目,对文本与3D模型转换技术有深入研究与实践成果。 如此强大的团队背景,使投资者对SpAItial在技术研发与行业突破上充满信心,为SpAItial在竞争中提供核心竞争力。 一、Synthesia联合创始人带队,谷歌/Meta技术骨干加盟SpAItial 尼斯纳曾联合创立估值21亿美元(约合人民币151.97亿元)的AI虚拟形象公司Synthesia,此次又为SpAItial组建了明星技术团队:谷歌3D会议平台Beam开发者布鲁亚与Meta文本转3D资产专家诺沃特尼强势加盟。这支聚焦照片级真实感(photorealism)3D生成技术的“铁三角”,为SpAItial在竞争中提供核心竞争力。 同时,外媒TechCrunch透露了SpAItial已将“与早期合作伙伴验证API应用”列为首要任务,并引入前Cazoo(一家成立于2018年底的英国在线二手车交易平台,致力于为消费者提供便捷的线上购车服务,业务模式为从市场采购二手车,定损定价后在网站上出售,目前业务已拓展至多个国家,拥有数千名员工)高管卢克·罗杰斯(Luke Rogers)负责商业策略。 ▲四位合作伙伴,从左到右分别为马丁-布鲁亚、诺沃特尼、罗杰斯、尼斯纳(图源:SpAItial) SpAItial的技术目标不止于“生成3D世界”,更要实现“真实世界的交互性”,这一信息由外媒TechCrunch透露。 实现“真实世界的交互性”的这一愿景通过具体场景案例具象化,例如让3D空间中的玻璃杯实现“逼真碎裂效果”,即不仅呈现视觉层面的3D物体,还需赋予其物理规则下的动态交互能力。 二、3D模型赛道初现竞争:Odyssey融资2700万美元,World Labs估值超10亿 当前,SpAItial面临的竞争对手包括聚焦娱乐场景、融资2700万美元(约合人民币1.96亿元)的Odyssey,以及由AI先驱李飞飞创立、估值超10亿美元(约合人民币72.5亿)的World Labs。 尼斯纳在去年7月接受外媒TechCrunch专访时透露:“相比图像生成等成熟领域,目前,对于高拟真3D环境(photorealistic 3D environments)的市场需求究竟有多大,业界也尚未形成明确答案。” 随着工业数字孪生、AR应用及机器人仿真训练的爆发式增长,高精度3D建模技术被视为撬动万亿美元市场的核心引擎。在此趋势下,SpAItial正押注其核心AI模型。 SpAItial通过开放API接口,开发者可直接调用其3D生成能力开发具体应用:游戏工作室能快速构建虚拟场景,建筑公司可实时渲染设计方案,机器人企业则能生成高拟真训练环境。若这一模式成功,它或将成为3D内容工业化流水线的“动力系统”。 三、绕开游戏平台限制,SpAItial或从替代CAD工具切入3D生成赛道 与其他资金充裕的AI初创公司不同,TechCrunch披露了SpAItial将营收放在优先位置,但短期内需投入算力与人才。 尼斯纳在去年7月接受TechCrunch专访时透露,团队不打算快速扩张至数百人,而是以“质量优先”原则吸纳核心成员,当前SpAItial的研发重点是生成更大规模、更具交互性的3D空间。 尼斯纳透露,由于游戏平台对第三方内容的严格控制,SpAItial的“圣杯”目标可能先从替代CAD(计算机辅助设计)工具切入,当Roblox等平台自建3D生成体系时,SpAItial可能已在建筑设计等领域建立技术壁垒,而3D生成的下一阶段变革才刚刚开始。 3D生成公司SpAItial面临游戏平台(如Roblox)对第三方内容的严格限制,因此该公司调整了其战略方向,他们不再急于直接攻入游戏生态,而是将短期目标转向替代传统CAD设计软件(如建筑、工业领域常用的AutoCAD),通过服务专业场景积累技术优势。 据TechCrunch报道,若未来Roblox等平台开始自研3D生成工具,SpAItial或许已在建筑设计等垂直领域形成技术护城河,而彼时3D生成技术本身也可能迎来新一轮变革,比如从静态模型向动态交互升级,这或将成为行业竞争的下一个焦点。 结语:3D模型技术突围战,SpAItial的工业精度、开发者争夺与合规成本三重挑战 尼斯纳与SpAItial的入局,为尚处萌芽期的文本生成3D赛道注入新变量。1300万美元(折合人民币约为9425万元)的融资规模与顶尖技术团队,使其成为欧洲AI创业领域的焦点。 SpAItial能否在技术攻坚(如交互性实现)与商业落地(如API授权模式)上突破,或将决定其能否在3D生成的“下一章节”中占据先机。而这一过程中,技术突破的节奏、合作伙伴的选择,以及对市场需求的精准捕捉,可能都将成为这家欧洲初创公司的关键挑战。
经典“台灯iMac”复活?苹果带屏音箱最新爆料,带机械臂还能动
编译 | 金碧辉 编辑 | 程茜 智东西5月27日消息,据外媒Mashable昨日报道,彭博社科技记者马克·古尔曼(Mark Gurman)于本月25日最新爆料,苹果首款配备触控显示屏的HomePod智能音箱已进入最终研发阶段,预计将于2025年面世,但具体时间仍不确定。 这款集成7英寸LCD屏幕的创新设备将搭载可拆卸电池组,内置升级版Siri智能助手,支持苹果智能家居控制中枢功能。 ▲苹果新款HomePod爆料图 如果带屏版苹果智能音响真如爆料图中的外形,则酷似2002年苹果推出的一款经典电脑—iMac G4,该造型是苹果产品中非常经典的一款设计,灵感来自乔布斯参与创办的另一家公司—皮克斯动画的经典“跳跳灯”Logo形象。 ▲苹果2002年推出的iMac G4电脑 如果苹果公司能在AI时代,以智能音响的产品形态将这一设计复活,且让它的连接臂能够动起来,一定是既新鲜好玩,又不失经典和情怀。 一、7英寸触屏+可拆卸电池,HomePod新机摄像模组首曝光 据外媒Mashable透露,新款HomePod可能采用类似iPad mini的7英寸LCD显示屏,支持多点触控操作,HomePod内置5000mAh可充电电池组,配合低功耗模式可实现8小时移动使用。 据外媒Mashable援引彭博社科技记者古尔曼称:“带屏HomePod可能是苹果未来将要发布的一系列以AI为核心的产品中的第一款。” 二、曝苹果HomePod升级,人脸识别与手势实现多交互,高阶版将搭载机械臂 外媒Mashable透露,虽然新款HomePod设备将内置扬声器,但苹果可能会将其定位为智能家居中枢,而不仅仅是一款家庭扬声器,后续该设备可能将延伸出搭载机械臂的高阶版本。 据苹果智能家居产品线触控模组主力供应商宸鸿科技(TPK Holding)高层向台湾《电子时报》(DigiTimes)独家透露(2024年7月15日报道),新款HomePod设备顶部配备1080P广角摄像头,可实现人脸识别与手势交互功能。 古尔曼在昨日发布的《Power On》专栏中披露称:“HomePod机械臂机型可自主完成物理交互操作,目前研发进度符合预期,我们可以在第一款产品上市一两年后期待它。” 三、Siri技术短板拖累产品进度,HomePod延期暴露苹果软肋 据外媒Mashable透露,HomePod产品原定2024年上市计划,现因AI技术瓶颈已推迟18个月。 古尔曼在昨日发布的《Power On》专栏中透露,苹果带屏HomePod智能音箱的延期发布,核心问题在于其智能助手Siri的技术瓶颈。 作为语音交互领域的早期开拓者,Siri目前在多轮对话理解、上下文关联等AI核心能力上显著落后于OpenAI的ChatGPT-4及谷歌Gemini等竞品。 结语:苹果带屏HomePod即将来袭,能否打破智能音箱市场僵局? 苹果首款带屏HomePod已进入最终研发阶段,这款集成7英寸LCD屏幕、可拆卸电池组,且具备智能家居控制中枢功能的产品,预计将于2025年面世。它的出现,有望为苹果智能家居生态补上关键一环,也将为用户带来全新的智能交互体验。 HomePod的推出面临着诸多挑战,不仅要突破Siri的技术瓶颈,还要在竞争激烈的市场中找准定位,与谷歌、亚马逊等竞品争夺份额。 但苹果若能解决技术短板,为用户带来出色的智能家居控制体验,HomePod或有机会在市场中脱颖而出。
对标GPT-4o!蚂蚁开源统一多模态大模型Ming-lite-omni,理解生成一体化
作者 | 李水青 编辑 | 心缘 智东西5月27日杭州报道,今日,在蚂蚁技术开放日上,蚂蚁集团宣布开源理解与生成统一多模态大模型Ming-lite-omni。该模型支持将理解和生成模型合在一起调用,也可以单独完成理解和生成任务,带来原生全模态交互体验。 智东西与蚂蚁集团基础智能负责人西亭等相关负责人进行了面对面对话。西亭告诉智东西,新开源的Ming-lite-omni模型有几个值得关注的创新点:一是真正把生成和理解模型放到一个模型;二是真正意义上的全模态输入和输出,都支持音视频、图文多种形态;三是真正是以MoE为架构的模型,中间没有串其他东西,交互性较强。 据悉,团队希望这个模型能够接近GPT-4o像人一样去交互,但GPT-4o是闭源模型。所以团队给自己设定一个目标:希望推出一款非常接近GPT-4o的原生全模态模型,而且将彻底开源。 全球顶尖AI科学家、阿里集团副总裁许主洪在会上发表演讲,他认为,当下多模态大模型的一大演进趋势,正是用统一的框架做理解和生成。这一领域发展尚处于的初级阶段,需要实践验证。今日蚂蚁开源的Ming-lite-omni,正是这一领域的代表性实践。 ▲许主洪在讲解统一多模态模型产业发展脉络 统一理解与生成的多模态大模型面临众多技术挑战。在全模态交互挑战方面,当下支持音、视、图、文全模态交互的公开单模型非常少见;在理解与生成统一方面,图像和语意的理解生成统一模型鲜有出现,且理解和生成效果难以平衡。 蚂蚁为什么选择在当下节点开源这样一款“大一统”模型? 西亭告诉智东西,团队从去年9-10月份开始就一直在尝试和探索这件事情,之所以今年把它开放出来,也是受业界开源举措启发想要回馈社区。越简洁的东西越美,很多做技术的人都希望有一个“大一统”的模型,Ming-lite-omni就是把多模态繁琐的过程用一个较简单的形式表达出来。就蚂蚁的AGI事业部的技术路线而言,最好的AGI就是最好的产品。用户选择一款模型的理由就是它的智能上限高。所以团队把追逐更好的智能能力作为目标,这也是推出Ming-lite-omni并开源的一个很大初衷。 截至目前,蚂蚁集团今年已开源了多款模型,包括Ling-lite-1.5语言大模型,推理模型Ring-lite-1.5、Ring-lite-linear,以及今天推出的多模态模型Ming-lite-omni。 其中,Ling-lite-1.5整体能力已达到同等规模(16.8B-A2.75B)模型的SOTA水平,整体能力超过Qwen3-4B;Ring-lite-1.5推理能力达到Qwen3-8B水平,AlME24/GPQA/LCB平均分接近Qwen3-30B-A3B;Ring-lite-linear采用混合线性注意力机制架构,有效降低计算复杂度和显存占用,突破长上下文推理效率瓶颈。 回顾蚂蚁通用语言模型Ling的探索过程,Ling-plus及Ling-lite(0220版本)采用轻量级分布式分析、异构硬件自适应训练策略、MoE架构优化,从而实现了同尺寸模型的SOTA(行业最佳)性能。发展到Ling-lite-1.5,其仅用2.75B激活计算,可对标10B内SOTA dense模型;再到近期开源的Ling-lite(0415版本),采用分层语料预训练策略跟需求驱动的执行优化体系,以更少的语料和更高的质量,性能超过同尺寸下SOTA模型(如Llama-3.1-8B、Qwen2.5-7B等),大幅提升了数学、代码等推理能力。 除了模型更新,蚂蚁集团在行业大模型方面也有新进展。旗下AI健康管家不久后将上线新版本。当下,虽然基模能力越来越强,但在医疗领域仍面临严肃性、专业性、复杂性和个性化多方面挑战。AI健康管家是其与卫健委合作开发的应用,通过高质量数据资源、专业标注团队等多方面优化模型,主打“AI就医助理”、“AI健康咨询”和“AI家庭医生顾问”三方面,和个人健康档案打通,充当健康助理角色。 结语:统一多模态,探索AGI能力上限 当下,AGI正飞速发展,一方面带来更多商业机会,另一方面也带来更多技术不确定性。2015年的5月27日,由于杭州市萧山区某地光纤被挖断导致支付宝大规模宕机,部分用户无法使用支付宝。527这一天,因此也被设定为蚂蚁的技术开放日,用以勉励蚂蚁技术人要永远保持对技术的敬畏和创新之心。 在527技术开放日公布一系列大模型新进展,体现了蚂蚁在AGI时代化挑战为机遇的决心。一方面,蚂蚁AGI团队在探索追求智能能力的上线,打造统一多模态的AGI产品;另一方面,其开源步伐紧锣密鼓,有望联合社区力量共同推进大模型产业发展,也将影响AI产业格局。
终于破产,这家“AI 独角兽”竟然用真人程序员骗倒半个创投圈?
近年来,人工智能浪潮席卷全球,打着 AI 旗号的创业公司如雨后春笋般涌现。 其中,Builder.ai 曾凭借 “AI 驱动的无代码 App 开发平台” 概念风光无限,吸引众多知名投资机构注资,估值一度高达 17 亿美元。 然而,光鲜表象下,却是一场精心编织的骗局 —— 这家公司用真人程序员冒充 AI 工作,直至 2025 年 5 月 20 日正式宣布破产,其造假的来龙去脉令人瞠目结舌。 所谓AI背后竟然是真人程序员牛马 2016 年,印度裔创始人 Sachin Dev Duggal 在伦敦创立 Builder.ai,起初名为 Engineer.ai,2017 年推出首款 AI 平台产品 Builder V1。 公司宣称,用户只要提供想法,平台就能通过 AI 自动组合出定制化的 App 架构、功能模块和界面,并快速交付上线。 不仅如此,Builder.ai 还声称其开发成本不到传统软件开发成本的三分之一,速度却是传统开发的两倍。在 AI 概念正当红的时期,这样的宣传无疑极具吸引力。 凭借亮眼的 “AI 技术” 概念,Builder.ai 迅速在资本市场崭露头角。自成立以来,公司累计融资近 5 亿美元,投资者阵容堪称豪华,微软、卡塔尔投资局、Insight Partners、软银 DeepCore 等知名机构纷纷入局。 2023 年 5 月,Builder.ai 完成 2.5 亿美元的 D 轮融资,彼时公司估值高达 17 亿美元,成为炙手可热的独角兽企业。 此外,公司还与 BBC、NBC、富士通等企业展开合作,2021 年更是被纳入 Gartner 的 “多体验开发平台(MXDP)” 魔力象限中的 “愿景者(Visionaries)” 象限,一时风头无两。 然而,华丽的包装之下,真相却令人震惊。 2019 年,《华尔街日报》的一篇报道撕开了 Builder.ai 的虚假面纱。多位前员工爆料,公司所谓的 AI 平台,大量功能实际上是靠印度工程师手动编码完成。 用户在平台上看到的看似由 AI 生成的界面,背后却是无数程序员在加班加点地敲代码。更令人惊讶的是,公司甚至没有一个真正专业的 AI 研发团队,而是靠大规模雇佣数以万计的低成本开发者,以人力方式完成原本声称由 AI 实现的开发流程。 这种 “挂羊头卖狗肉” 的行为,本质上是用真人程序员冒充 AI,以此欺骗投资者和客户。 随着时间推移,Builder.ai 的虚假商业模式逐渐难以为继。 公司实际资金消耗远超营收能力,财务状况日益恶化。 2024 年 8 月提交的上一财年报告显示,截至 2023 年 3 月,公司营收仅为 2300 万英镑,却连 9% 的日常运营开销都无法覆盖。面对资金压力,公司不断寻求融资续命,2024 年 10 月从债权市场获得 5000 万美元融资,2025 年 3 月又从老股东处紧急注资 7500 万美元。但这些资金仍未能扭转局面,2025 年 2 月,创始人 Duggal 辞去 CEO 职务,由亚马逊和 Flipkart 的前高管 Manpreet Ratia 接替。 然而,新的管理层也无力回天,5 月 20 日,Builder.ai 正式宣布进入破产程序,试图支付员工薪资的资金也被债权人冻结。据估算,公司拖欠微软云服务费用 3000 万美元,拖欠亚马逊 8500 万美元,债务窟窿巨大。 Builder.ai 的轰然倒塌,给整个创投圈和科技行业敲响了警钟。对于投资者而言,在追逐热门概念时,更应保持理性和谨慎,加强对企业技术真实性和商业模式可持续性的深入调查。不能仅仅被华丽的宣传和亮眼的数据所迷惑,而应透过表象看本质,避免成为类似骗局的受害者。 AI公司造假,并不是个例 在人工智能热度持续高涨的当下,类似 Builder.ai 的 “伪 AI” 公司或许并非个例。 美国 AI 教育创企 AllHere 的故事同样令人唏嘘。该公司成立于 2016 年,其明星产品是一个名为 Ed 的 AI 聊天机器人,据称可提供定制化支持,促进家校沟通,提高学生的出勤率和课业表现,AllHere 对外宣称其用户涵盖美国的 9100 所学校。 在 “爆雷” 之前,AllHere 在 2020 年完成了 A 轮融资,获得哈佛校友基金 The Yard Ventures 和 Alumni Ventures(美国最大的个人投资者风投)等投资公司的注资。2023 年,他们公布公司年度经常性收入(ARR)达到 760 余万美元,并在当年开启了 B 轮融资,但未能完成。 然而,今年 6 月,外部会计师在对 AllHere 的财务状况进行审计时,发现其营收情况要远远少于其对外公布的数据,仅年度经常性收入一项就被夸大了近 700 倍。为掩盖这一问题,创始人兼首席执行官 Joanna Smith - Griffin 还假扮财务顾问向投资者发送虚假财务信息。这一行径最终败露,Smith - Griffin 遭到美国纽约联邦调查局的调查。AllHere 目前已宣告破产,全部员工均被遣散,其聊天机器人 Ed 停止服务。 这些闹剧不仅让我们看到了商业世界的复杂与残酷,也促使整个行业反思和审视自身的发展。 AI公司造假的手段大揭秘 (一)技术造假 夸大 AI 能力:许多创业公司在宣传时,过度夸大自家 AI 技术的性能和应用范围。比如一些声称能够实现精准医疗诊断的 AI 创业公司,实际技术可能仅处于实验室研究阶段,离临床应用还有很大差距,但却在宣传中暗示已经能够广泛应用于医疗实践,误导投资者和消费者。 伪 AI 技术包装:除了像 Builder.ai 那样用真人冒充 AI 工作外,还有一些公司将传统算法重新包装,贴上 AI 的标签。例如,把普通的数据统计分析算法包装成具有智能预测功能的 AI 算法,利用大众对 AI 技术的不了解,骗取信任和投资。 虚假演示:部分创业公司在产品演示环节做手脚。通过精心设计的演示场景,展示出 AI 产品强大的功能,但实际产品在真实环境中根本无法达到演示效果。比如一些智能家居 AI 控制系统,在演示时能够完美地控制各种家电设备,但消费者购买回家后却发现问题百出,根本无法实现宣传中的智能联动。 (二)数据造假 虚构用户数据:为了显示产品受欢迎程度,一些 AI 创业公司会虚构用户数量、使用频率等数据。例如,AllHere 对外宣称其用户涵盖美国的 9100 所学校,但实际从成立到破产期间仅有 31 名客户。这种虚假的用户数据会让投资者误以为产品市场需求大,前景广阔,从而吸引投资。 伪造营收数据:通过篡改财务报表,夸大公司的营收情况,制造公司盈利能力强的假象。如 AllHere 在融资过程中,创始人 Smith - Griffin 向投资者报告的年度经常性收入与实际数据相差巨大,2023 年宣称年度经常性收入为 700 余万美元,而真实数据仅为 117 万美元。这种伪造营收数据的行为不仅欺骗了投资者,也影响了市场对公司价值的正确判断。 操纵数据指标:在一些需要数据指标来衡量产品性能的领域,如 AI 图像识别技术的准确率、AI 翻译的准确率等,部分公司会通过操纵测试数据来提高指标数值。比如在测试 AI 图像识别产品的准确率时,故意选择一些简单、容易识别的图像进行测试,而不是采用真实场景下复杂多样的图像,从而得出虚假的高准确率数据。 (三)团队造假 虚假专家背书:邀请一些与 AI 领域关联不大,甚至没有相关专业知识的名人或专家为公司站台,声称他们是公司的技术顾问或合伙人,以此提升公司的可信度。例如,某些公司会聘请一些知名演员或体育明星担任所谓的 “AI 战略顾问”,但这些人实际上对 AI 技术一窍不通,只是为了利用他们的名气吸引关注和投资。 夸大团队成员背景:对团队成员的学历、工作经历进行夸大或造假。比如宣称团队中有多位来自顶尖科技公司的资深 AI 专家,但实际这些人可能只是在相关公司担任过普通职位,甚至根本没有在这些公司工作过。通过这种方式打造出一个看似实力强大的团队,让投资者相信公司具备强大的技术研发能力。 AI 创业公司造假严重破坏行业信任,投资者和消费者信心受挫,连累诚信企业发展。同时,造假导致资源错配,真正创新企业难获资金,阻碍 AI 技术进步。虚假数据还误导市场决策,投资者易因不实信息受损,企业合作选错伙伴,政府政策制定也会出现偏差,无法有效推动产业发展。 应对造假,投资者需组建专业团队深入尽调,保持理性,避免跟风。监管部门应完善法规政策,明确技术、数据等标准,加大处罚力度。行业协会要加强自律,制定准则,建立信用评价体系,奖惩分明。此外,还需通过科普宣传提升公众对 AI 的认知,增强辨别能力,鼓励公众监督举报,共同营造健康的行业环境。
声音克隆+视频通话,豆包猜出了我住哪个小区
豆包的新功能,大家都试了吗? 在最新版的豆包APP里,已经有“视频通话”的功能。 也就是说,你现在可以打开摄像头,让豆包直接“看”了。 我测试的时候,豆包不仅一眼看出我家龟背竹是仿真的假货,还通过窗景猜出了我家小区的名字,真是刺激。 目前,“视频通话”已经是各家AI厂商争相上线的功能:OpenAI的ChatGPT、谷歌的Gemini,以及国内的智谱等,都已经让AI“开眼”。腾讯紧紧跟上,预计下周就会在元宝中看到类似功能。 别忘了,下一代硬件的寻找和创造,正在世界范围里上演。当我们不再需要举起摄像头,视频通话还会带来更多想象力。 01 “视频通话”,相当于豆包有了眼睛 豆包的视频通话入口在“打电话”里,只不过从前点击通话,仅有语音通话的功能,现在出现了一个摄像机按钮。实际体验下来,这样的安排符合使用逻辑。 点击按钮,画面上出现你手机镜头拍摄的实时画面。 所以要注意的是,和豆包视频通话,与和人视频通话有很大区别,不是说豆包作为一个虚拟形象和你面对面,而只会有你单方面的视频画面。更像是在给豆包做一对一的视频直播,或者说邀请豆包通过你的摄像头看你的世界。 我们进行了以下测试: 第一,这是什么? 作为热身项目,先测试一下豆包对各种事物的判断是否准确。 摄像头打开后,豆包主动发言,描述我正坐在电脑前,后方的电视正在播放美剧。 对家具、电器等的判断没有难度,轻松回答。令人惊讶的是以下三件: 在刻意摇晃镜头的情况下,一个看起来是大马克杯的保温杯,一盆(很多来我家的朋友都以为是真植物的)仿真龟背竹,在猫窝里只露出两只脚和尾巴(且堆叠在一起)的橘猫,豆包都回答正确。 第二,我在哪儿? 判断物品没问题,我试图将豆包带到更有挑战的场景里。 镜头对准窗外,让豆包帮我看看我在哪里。豆包先是根据街景和绿化度,给出了三个城市的名称,其中包括正确答案,另外两个城市也距离很近。接着看到了路牌上的街名,这条街道非常长,有几公里,但是豆包准确说出了我所在的小区的名字。 第三,这怎么用? 接下来是一个日常的“有用”场景,让豆包教我使用电器。 镜头对准一个小电器,豆包准确判断这是一款“胶囊咖啡机”。我随后便问“胶囊是什么”边用镜头快速扫过桌面,它用很自然的语言告诉我:“就在那儿啊,一个米色袋子里”。 随后,豆包又指导我将胶囊放入咖啡机并按下按钮,在我表示按了按钮没反应后,又指导我检查水箱。全程豆包并非机械式地“背诵使用说明”,而是根据看到的画面进行指导,比如“机器后方的两个黑色按钮”“把机器侧一下,我看看水箱在哪里”“就是后面带刻度、塑料的那个”。 整个过程非常丝滑、自然。 第四,我该买点啥? 很多人已经在用AI辅助减肥,比如制定饮食、健身计划,但是人嘛,自述情况很有可能有偏差,要是直接让AI看呢? 打开冰箱,让豆包猜猜我的饮食习惯,并给出采购建议。豆包准确总结我的食物种类很多,肉食和速冻食品比较多,建议我购买绿叶蔬菜。可以说是一针见血了。 几个简单的测试走下来,可以看出豆包可以透过镜头,颇为准确地判断看到的事物,并且和用户产生实时的互动。这提供了很多想象力,如在旅游时提供帮助、在采购时提供建议、教用户使用物品等。 02 视频通话仍摆脱不了“AI味儿” 特别要指出的一点是,豆包在视频通话时,语言平实,表达方式生活化、口语化,不会有很机械、死板的感受,这非常重要。 顺便推荐一个“进阶”玩法:豆包语音克隆+视频通话。语音克隆的功能已经在豆包里很久了,用户不仅可以选择豆包提供的预设音色,还可以通过简单的步骤获得克隆的音色。 我的豆包里一直用的是姐姐的克隆音,豆包在视频通话中的语言又非常日常,也因此,视频通话时真的有一种在和我姐打视频的错觉。 不敢想象如果我给我妈的豆包安排一个我的克隆音,再教会她怎么视频通话,她会有多爱用。 我们也同步测试了ChatGPT,在视频通话模式下,二者的准确度都很高。但是ChatGPT没有看出彩色马克杯实际上是一个保温杯,进一步追问才给出判断,且在“看窗景猜地点”的小测中,ChatGPT的回答离正确答案差得很远。 另外很明显的感受是,ChatGPT在视频通话模式下的表达方式“更AI”,措辞比较书面化,不确定使用英文的话,ChatGPT会不会更自然一些。 但也不是没有遗憾,目前豆包视频通话还是要“等一下”AI的回复。而且有时候可能是问题比较难回答,“思考”时间会更长一些,经常出现以为AI卡住了,结果和AI一起开口的情况。 另一个遗憾是,在视频通话中,依然遵循用户说话、AI回答的模式。在实际体验中,豆包会在自己的句尾主动和用户互动,比如“你在看《无耻之徒》吗”,但是它做不到“主动出击”。 如当我告诉豆包,我现在要打字,当看到“2”的时候立刻告诉我。虽然豆包欣然答应,但是它并不会在看到“2”的时候立刻指出,而是必须等我询问,它再回答。同样地,对“看到扫地机器人就立刻告诉我”的请求,它也同样无法做到。它的确看到了机器人,但是需要等我再说一句话,才轮到它发言。 当然,这些不仅是豆包视频通话的遗憾,ChatGPT也是同理。和已经普及的“语音通话”一样,AI依然需要遵循既定的对话模式,而非像人与人沟通时那般灵活。 03 AI交互方式再次迭代 “视频通话”可以带来很多想象力,尤其是在如今“AI代理”成为风口、“超级AI助理”成为桂冠上的明珠之时。 豆包此次的升级基于“豆包·视觉理解模型”。该模型去年年底发布,此后又经历了升级,同时具备内容识别能力、理解和推理能力以及更细腻的视觉描述能力。 从2022年底ChatGPT横空出世之后,我们与AI的交互方式已经不断进化:纯文本交互(你打字给AI,AI也回复文字)、实时语音交互(直接和AI说话,AI也用声音回复)、图像交互(你发给AI一张图片或视频,AI可以解读)、实时图像交互(视频通话)。 能直接打开摄像头,让AI自己“看”,直接邀请AI“进入”所处的世界,相当于揭开了我们和AI之间始终隔着的一层名为“描述”的薄纱。从实际体验来说,在视频通话时,AI的“Agent”属性更加凸显,而非一个手机里的小小工具。 去年12月,OpenAI就给ChatGPT加入了视频通话的功能,谷歌的项目Project Astra也已经启动。在国内,包括智谱在内的头部AI玩家也已经配上了视频通话。此外,就在上周,腾讯旗下语音通话模型Hunyuan-Voice宣布将于6月登陆元宝APP,直接对标字节跳动旗下豆包AI的视频通话功能。 让AI“开眼”,已经越来越普遍。 对此,前不久在谷歌I/O开发者大会上,谷歌DeepMind创始人兼CEO戴密斯·哈萨比斯(Demis Hassabis)称,他们将Gemini打造成一个世界模型,是开发一种新型、更通用、更有用AI助手的关键一步。 这家巨头目标直接指向构建通用AI助手。大会上宣布,Gemini Live正式向 iOS 和安卓用户开放。这项功能可以实时识别并回应用户手机摄像头和屏幕上的内容。 更值得注意的是,Gemini Live是Project Astra的延伸,而后者也在大会上展示了新的进展:更主动。比如AI“看”着用户做题,在发现错误的时候会直接指出。 这也对应了在使用现有AI视频通话功能时的那个困扰,即虽然AI已经看到了某个物品,但仍然要“用户一句,它一句”,等着轮到自己发言。 而以上讨论还仅限于手机这个核心硬件。但未来的“AI硬件”未必还会是手机,如果下一代硬件比手机更小巧、更灵活,那视频通话的能力还会发挥更大潜力。 比如如今已经被AI厂商积极尝试的XR眼镜,通过这个设备“观察”世界,不需要用户举起手机。可以想象,如果你戴着一副AR眼镜,打开摄像头,AI将可以更“无形”地提供帮助(甚至只是陪伴)。 随处可见“自言自语”的人类,这样的未来也许已经不远了。
雷鸟创新亮出万元AR眼镜王炸,对标Meta,融合安卓,X3 Pro 8999元起
作者 | 云鹏 智东西5月27日报道,刚刚,国内AR大厂雷鸟创新发布了最新旗舰全彩AI+AR眼镜雷鸟X3 Pro、更轻便小巧的AR眼镜雷鸟Air 3s系列,以及AI拍摄眼镜雷鸟V3 Slim等多款新品。 根据洛图科技数据,2025年第一季度,雷鸟创新在中国AR/AI拍摄眼镜线上市场以50%的市场份额排名第一。其中雷鸟V3在AI拍摄眼镜细分市场占有率达95%。 雷鸟X3 Pro在芯片、交互、空间计算、重量与光学显示五个核心技术领域实现了技术难点的突破,并引入了可视化Live AI和安卓虚拟机,应用生态更完善。 价格方面,雷鸟X3 Pro首发定价为8999元起,雷鸟Air 3s售价1499元,Air 3s Pro售价1599元起,雷鸟V3 Slim售价1799元起,四款产品均支持国补。 一、屏幕虽小大有乾坤,定制大模型,联合行业大厂提升应用体验 首先来看旗舰产品雷鸟X3 Pro,其为雷鸟创新发布的第三代彩色真AR眼镜,搭载了全球最小可量产全彩Micro-LED光引擎,并与应用材料公司(Applied Materials)联合研发了纳米光刻刻蚀RayNeo光波导,实现了43英寸全彩3D空中透明屏显示效果。 在空间感知方面,雷鸟X3 Pro搭载了猎鹰影像Plus系统,可将空间定位误差控制在千分之五以内,让眼镜具备广泛适用的空间识别能力。 在交互方面,雷鸟X3 Pro首次实现了Apple Watch手表控制,并支持镜腿五维导航、语音、手机联动等多种交互方式的融合,提升交互效率。 性能方面,雷鸟X3 Pro搭载第一代骁龙AR1平台,其高性能摄像头ISP可以实现高质量的图像和视频功能。 轻薄减重方面,眼镜使用了航空级镁铝合金支架和钛合金转轴,兼顾强度与强支撑特性,雷鸟X3 Pro将重量控制在了76g,据称是全球最轻的彩色AR眼镜之一。 在应用生态方面,RayNeoOS 2.0系统集成了AI翻译、空间导航、AI录音、通话转文字、第一视角摄影摄像等功能,体验更智能、更便捷。 雷鸟X3 Pro内置通义独家定制的第一视角多模态大模型,成为全球首批支持可视化Live AI交互的AR眼镜。无论步行、用餐还是交谈,用户都能随时提问,获得即时智能反馈。 后续,雷鸟创新将推出AI Agent应用商店,上线DeepSeek、白酒识别、奢侈品识别、英语陪练、模拟面试等海量AI智能体。 为进一步拓展应用边界,雷鸟X3 Pro首发了“RayNeo AR应用虚拟机”,实现了安卓与AR眼镜生态的融合,首批支持抖音、B站、王者荣耀等30余款主流APP,让用户在AR眼镜与智能手机间可以无缝切换。 此外,雷鸟创新还宣布与阿里云、高德地图、蚂蚁集团等多家公司在AI与AR眼镜的AR眼镜大模型、地图导航、眼镜安全等多个领域展开深度合作。 二、加速全民AI+AR普及,窄脸型用户也有能舒适佩戴的眼镜了 发布会上,雷鸟创新还发布了新一代口袋电视雷鸟Air 3s系列,以及新一代多功能内容终端雷鸟魔盒2代。 雷鸟Air 3s系列全系采用孔雀光学引擎2.0+第5.5代Micro-OLED屏幕,在画质精度、清晰度和亮度上有比较明显的提升,雷鸟Air 3s Pro还搭载了3D环绕音效系统。 为了带来更好的巨幕观影体验,雷鸟创新为雷鸟Air 3s系列配合推出了影音终端雷鸟魔盒2代。其搭载FlyTouch触控系统,配备3.5英寸触控板,支持毫米级响应和多点操作,可通过内置陀螺仪实现如鼠标般的操控,提升交互效率。 作为本次发布会的另一款新品,雷鸟V3 Slim是雷鸟创新为窄脸型用户开发的小尺寸型号,相比V3,它将前框长度缩至150mm,并通过框型优化,使它更加贴合小脸型用户佩戴。 结语:硬件、软件、生态创新三路并行,雷鸟创新趟出AI+AR新路子 可以看到,雷鸟旗舰AI+AR眼镜的背后,是从硬件、软件到生态的一系列硬核技术创新:定制化模块、联合行业大厂研发突破技术难题、系统级创新提升用户体验。 如今AI眼镜快速发展,行业人士预计今年将会有诸多AI眼镜新品发布,行业竞争也将愈发激烈。已经杀入行业前列的雷鸟创新如何面对挑战者发起的攻势,AI眼镜产业格局将怎样演变,我们将持续深入关注。
谷歌发布开源LMEval框架:打破AI模型比较壁垒,降低评测成本和时间
IT之家 5 月 27 日消息,科技媒体 The Decoder 昨日(5 月 26 日)发布博文,报道称谷歌推出开源框架 LMEval,为大语言模型和多模态模型提供标准化的评测工具。 评测新型 AI 模型一直是个难题。不同供应商使用各自的 API、数据格式和基准设置,导致跨模型比较耗时且复杂。 而谷歌最新推出的 LMEval 开源框架直击这一痛点,研究人员和开发者只需设置一次基准,就能展开标准化的评测流程,大幅简化了评测工作,节省了时间和资源。 LMEval 还通过 LiteLLM 框架抹平了 Google、OpenAI、Anthropic、Ollama 和 Hugging Face 等平台之间的接口差异,确保测试跨平台无缝运行。 LMEval 不仅支持文本评测,还涵盖图像和代码等领域的基准测试,且新输入格式可轻松扩展,框架支持是非题、多选题和自由文本生成等多种评估类型。同时,该框架能识别模型采用的“规避策略”,即故意给出模糊回答以避免生成有风险内容。 Google 还引入了 Giskard 安全评分,展示模型规避有害内容的表现,百分比越高代表安全性越强。测试结果存储在自加密的 SQLite 数据库中,确保数据本地化且不会被搜索引擎索引,兼顾了隐私与便捷。 LMEval 具备增量评估功能,无需在新增模型或问题时重新运行整个测试,仅执行必要的新增测试即可,并采用多线程引擎并行处理多项计算,有效降低了计算成本和时间消耗。 谷歌还开发了 LMEvalboard 可视化工具,通过雷达图展示模型在不同类别中的表现。用户可深入查看具体任务,精准定位模型错误,并直接比较多个模型在特定问题上的差异,图形化展示一目了然。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。