EN
中文
注册 / 登录
产品分类:
加载中...
头条分类:
加载中...
三星计划在越南追加72亿元年度投资 加速产业发展
原标题:三星计划在越南追加10亿美元年度投资 加速产业发展 【CNMO科技消息】近日,三星电子宣布将大幅增加在越南的年度投资规模,计划将投资额提升高达10亿美元。上周,三星电子首席财务官朴韩洙与越南总理范明政会晤,就最新的财务协议达成握手合作。在会晤中,范明政强调了越南政府对外资企业的支持,并期待三星能够继续深化与越南的合作,带动更多本土企业加入其供应链。 目前,全球约一半的Galaxy手机在越南生产,越南已经成为三星智能手机制造业务的核心区域。据了解,自2008年在越南建厂以来,三星已将其在越南的投资总额提升至224亿美元。此次再追加10亿美元年度投资,无疑将加速三星在越南的业务拓展。目前,三星在越南运营着6家工厂、1家销售法人实体和1家研发中心,为越南创造了大量就业机会。 三星在越南的投资涵盖了电子产品制造、半导体和芯片制造、显示屏制造、电池制造以及硬件组装与加工等多个领域。其中,位于越南北部的泰安工厂和北宁工厂以及位于胡志明市的斋桐工厂,都是三星在越南的重要生产基地,专注于生产智能手机、平板电脑和其他电子产品。 特别值得一提的是,位于太原省的三星电子越南太原工厂(SEVT),是三星全球最大的智能手机工厂。该工厂于2013年投资建立,初始资本为20亿美元,经过多年发展,注册资本已增加至超过75亿美元。
OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互直接进入科幻时代
机器之心报道 机器之心编辑部 ChatGPT 问世才 17 个月,OpenAI 就拿出了科幻电影里的超级 AI,而且完全免费,人人可用。 太震撼了! 当各家科技公司还在追赶大模型多模态能力,把总结文本、P 图等功能放进手机里的时候,遥遥领先的 OpenAI 直接开了大招,发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。 5 月 14 日凌晨,OpenAI 在首次「春季新品发布会」上搬出了新一代旗舰生成模型 GPT-4o、桌面 App,并展示了一系列新能力。这一次,技术颠覆了产品形态,OpenAI 用行动给全世界的科技公司上了一课。 今天的主持人是 OpenAI 的首席技术官 Mira Murati,她表示,今天主要讲三件事: 第一,以后 OpenAI 做产品就是要免费优先,为的就是让更多的人能使用。 第二,因此 OpenAI 此次发布了桌面版本的程序和更新后的 UI,其使用起来更简单,也更自然。 第三,GPT-4 之后,新版本的大模型来了,名字叫 GPT-4o。GPT-4o 的特别之处在于它以极为自然的交互方式为每个人带来了 GPT-4 级别的智能,包括免费用户。 ChatGPT 的这次更新以后,大模型可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出 —— 这才是属于未来的交互方式。 最近,ChatGPT 不用注册也可以使用了,今天又增加了桌面程序,OpenAI 的目标就是让人们可以随时随地的无感使用它,让 ChatGPT 集成在你的工作流中。这 AI 现在就是生产力了。 GPT-4o 是面向未来人机交互范式的全新大模型,具有文本、语音、图像三种模态的理解力,反应极快还带有感情,也很通人性。 在现场,OpenAI 的工程师拿出一个 iPhone 演示了新模型的几种主要能力。最重要的是实时语音对话,Mark Chen 说:「我第一次来直播的发布会,有点紧张。」ChatGPT 说,要不你深呼吸一下。 好的,我深呼吸。 ChatGPT 立即回答说,你这不行,喘得也太大了。 如果你之前用过 Siri 之类的语音助手,这里就可以看出明显的不同了。首先,你可以随时打断 AI 的话,不用等它说完就可以继续下一轮对话。其次,你不用等待,模型反应极快,比人类的回应还快。第三,模型能够充分理解人类的情感,自己也能表现出各种感情。 随后是视觉能力。另一个工程师在纸上现写的方程,让 ChatGPT 不是直接给答案,而是让它解释要一步步怎么做。看起来,它在教人做题方面很有潜力。 ChatGPT 说,每当你为数学焦头烂额的时候,我就在你身边。 接下来尝试 GPT-4o 的代码能力。这有一些代码,打开电脑里桌面版的 ChatGPT 用语音和它交互,让它解释一下代码是用来做什么的,某个函数是在做什么,ChatGPT 都对答如流。 输出代码的结果,是一个温度曲线图,让 ChatGPT 以一句话的方式回应所有有关此图的问题。 最热的月份在几月,Y 轴是摄氏度还是华氏度,它都能回答得上来。 OpenAI 还回应了一些 X/Twitter 上网友们实时提出的问题。比如实时语音翻译,手机可以拿来当翻译机来回翻译西班牙语和英语。 又有人问道,ChatGPT 能识别你的表情吗?
免费!免费!免费!GPT-4o是什么?是你想要的一切
距离GPT-4的发布已经过去了一年,当地时间5月13日上午10点,OpenAI春季发布会千呼万唤始出来。 这次发布的既不是传了很久的搜索引擎,也不是GPT5,而是GPT-4的迭代版本,GPT-4o。在未来几周内,用户将会陆续自动更新到GPT-4o。 GPT-4o作为新一代旗舰模型,把AI工具的使用门槛降到了更低的程度,不仅比上一代速度快两倍,能实现无延迟实时对话,而且用户不用注册,功能全部免费。 此外,ChatGPT现在有桌面版本了,轻量化的使用体验可以无缝融入你的任何工作流程,再也不用苦哈哈地往网页上搬砖了。据OpenAI的CTO米拉·穆拉蒂(Mira Murati)表示,这也是他们第一次在易用性上做出改进。 “O”是包罗万象的O 发布会刚开始,米拉·穆拉蒂为这次新发布定了调,说OpenAI的目标是进一步减小人们使用AI的障碍,让所有人都能在工作、学习、创造中用上AI工具。 为了这个目的,OpenAI做了三件事:发布更强大的模型GPT-4o,更新用户界面提高使用体验,然后一口气免费开放给用户。穆拉蒂补充道,付费用户享有五倍的使用容量限制。 米拉·穆拉蒂主持了整场发布会,萨姆·奥尔特曼没有露面|@OpenAI 据OpenAI表示,GPT-4o是一个“原生多模态”模型,它的命名来源于“omni”,即包罗万象之意。 比起此前要么是图文模式要么是语音模式的GPT-4,它更擅长打组合拳,可以接受文字、音频、图像的任意组合输入,然后无缝衔接图文音频的多种形式输出。 升级后的GPT-4o回答速度更快了。 据OpenAI表示,GPT-4想要实现和人的对话需要通过三步来实现:先把语音转换为文字,再生成回复文本,最后再转成语音。根据用户选择模型的不同,这个过程的平均延迟高达2.8秒 (GPT-3.5)和5.4 秒(GPT-4),对着手机屏幕等回复,跟GPT聊过天的朋友应该都有类似的体验。而且在语音转文字再转语音的过程中,很多信息损失了,GPT无法获得说话人的音调,也无法收取背景音,如果有多个人一起说话更是灾难性的场景。 “我们跨文本、视觉和音频端到端地训练了一个新模型,”OpenAI写道,“这意味着所有输入和输出都由同一神经网络处理。”现在的GPT-4o可以在最短232毫秒内响应对话,平均响应时间320毫秒,和人类的反应速度几乎一样,爱跟ChatGPT聊天的朋友终于可以从微信语音模式切换到日常交流模式了。 GPT-4o还带来了更好用的界面。 再也不用在网页间互相切换了,新的桌面版GPT可以融入任何工作流,随时和用户用图像文字语音进行交流,虽然还没用上,但可以想像这种工作体验有多快乐。 @OpenAI 上图右上角是桌面版GPT的小窗口,可以贴代码让它debug,可以截图让它读表格,也可以随时跟它对话 此外,萨姆·奥尔特曼在X上补充道,模型升级不止在GPT上,开发者也可以在API里同步使用GPT-4o,价格是GPT-4 Turbo的一半,速度是GPT-4 Turbo的两倍。GPT-4o还在50多种除英文外的语言能力上得到了加强。 连呼吸都能辨别 发布会的最后一个环节是实机演示。OpenAI麾下的大牛研究员Marc Chen和Barret Zoph一起展示了新模型的强大之处。 在第一段对话里,Chen对GPT说,自己有点紧张,然后开始急促地呼吸。GPT识别到了他呼吸的声音,说,别紧张,你喘得像个吸尘器,深呼吸,再吐气。接着GPT开始指导Chen怎么深吸慢呼平复心情。 这个demo设置得很妙,它展示出了两个重要的新能力:听环境音和即时反馈。 GPT不再需要一轮一轮地进行对话,它可以同时听人喘气和进行呼吸指导,输入和输出在同时发生。 第二个demo里,Chen让GPT给Zoph讲个睡前故事哄他入睡,Chen反复打断GPT的讲述,问它能不能讲得更刺激点,最后,GPT跟迪士尼公主似的把故事用歌唱了出来。 有时候GPT给人感觉话太多了,在新版本里,你要是不想听可以立刻打断或者提出意见,就像在真实生活里的交流一样。 后面的几个demo里,GPT教Zoph做了数学题(“你能不直接告诉我答案,而是启发我一步一步解完嘛?”),给大家解释了代码,读了图表,给Zoph看了面相(“你很开心,又有点激动。”),最后还当了Chen和穆拉蒂之间的同声传译。 GPT给Zoph看面相|OpenAI 我个人的体会是,这个版本的GPT比以前更像人了,对话中会开更多的玩笑,语气词也多了不少,这和OpenAI所说的提高GPT的工具性似乎有点相悖。我可能会在用的过程中让它少废话,否则真的会有点情感压力。 但还是有很多人对这次发布会不满意。有网友觉得OpenAI在挤牙膏,一年多过去了仍然在GPT-4上裹足不前,也有人对免费提出了质疑。 “当服务免费时,用户就是产品。”“(ChatGPT免费之后)OpenAI获得的数据量会超出想象。” 对一般用户来说,不用注册即可使用已经是个天大的惊喜了,再也不用找国外手机号了,懂的都懂。
跟OpenAI争夺iPhone合作权的Google,要发布什么才能“弯道超车”
作为 Google 每年的重头戏,I/O 大会是 Google 展示其最新技术和产品的舞台。在近 8 年中,AI 相关内容一直是 Google I/O 大会的重点话题,但到头来一鸣惊人的确是后来者 OpenAI。 此后 Google 就被贴上「起了个大早,赶了个晚集」、「恨铁不成钢」、「万年老二」等众多标签。 其中最值得细品的就是「AI 黄埔军校」这一称谓,看似褒奖,实则确是 Google 的「一把辛酸泪」。 如今 OpenAI 故意将发布会放在 Google I/O 前一天,不仅「抢热度」的意思很明显,还把目光投向了本来已经格局稳定的搜索业务,颇有点想要一举「直捣黄龙」的意味。 眼看一场好戏就要开场,消费者和业界普遍期待谷歌能够拿出一些真正令人惊艳的「真东西」,Google 也希望借此机会打一场漂亮的「翻身仗」。因此,今年的 Google I/O 大会可谓备受瞩目。 Gemini 加速融入服务,还有新功能亮相 Gemini 项目自曝光以来,一直备受关注。起初也曾存在一定争议,但后来也凭借自身实力挽回了口碑,而今也越来越成熟,但仍然逃不开被拿来与 ChatGPT 相比,双方也在暗中较劲。 Gemini 1.5 发布后仅几个小时,OpenAI 就祭出了轰动一时的文生视频模型 Sora;不久前,曾有消息称苹果将在 iPhone 中集成 Gemini AI,但近期事件又发生反转,最终苹果大概率会选择 ChatGPT,竞争势头可谓愈演愈烈。 如今 Google 与 OpenAI 再次「撞」到一起,显然 Google 希望发挥自己服务众多的优势,将 Gemini 加速融入更多服务中。尤其将与搜索、翻译、Google 地图及 Android 等多项服务进行深度整合,提升服务的准确性和效率,还可能会加入包括图像、语音在内的更多交互方式。 在手机等移动设备上,我们也将越来越多地见到 Gemini 的身影。备受期待的多模态助手新版本「Pixie」也将亮相 Google I/O 2024,据称它将能够通过拍摄物体照片来学习使用或获取购买方向,让数字助手变得更加直观和个性化。 不过,想要真正成为一家「AI first」的公司,谷歌需要发布既具有变革性又具有广泛可用性的功能,尤其对于免费用户而言。 从目前的信息来看,Google 很有可能会在 I/O 大会上重点展示更多此前未被公开的新功能,例如针对英语学习者的人工智能对话练习、用于购物和虚拟试穿的图像生成、在地图上寻找充电桩、AI 持续通话等。 此外,Google 可能会公布 Gemini 的 API,这意味着开发者们将能够利用 Gemini 的强大 AI 能力,为各类应用和服务注入智能元素,提供更多可能性。 Android 15 细节曝光,系统体验再升级 每年的 Google I/O 大会中,Android 的更新都会成为一个重点,毕竟 Android 作为全球最大的移动操作系统,其每一次的升级都会影响到亿万用户的使用体验。在今年的 I/O 大会上,Android 15 的更多细节将会被揭晓。 据悉,新系统将在操作界面、安全隐私保护、功耗优化等方面做出诸多改进。此外,自动隐藏未使用的通知渠道、优化音量、亮度、振动控制等功能的加入,将进一步提升用户的使用体验。 事实上,设备端 AI 对于帮助减低云成本非常重要,对于使 Android 成为构建新一代 AI 移动应用程序平台也很重要,因而我们很可能会在 Google I/O 大会上看到一个深度集成 AI 的 Android 15。 但目前很多时候,除了壁纸以外,我们还没有太多见到 AI 真正应用于用户体验,Google I/O 会为我们展示更多内容。为我们展示更多的可能性,例如更智能的主屏幕、锁屏或通知栏等。 卫星通讯和离线定位 自从华为、苹果等手机陆续支持卫星通讯,安卓用户就翘首以盼。好消息是在 Android 15,这一功能可能会成为标配,并且不仅限于基本短信服务,还扩展到了短信应用和预装的 RCS 服务,此前在开发者预览版中已经出现,很有可能会在 Android 15 中正式与用户见面。 还有消息显示,Google 正在研发「离线定位」的相关功能,即关机也能定位手机。不过由于这一功能需要依靠硬件支持,所以后续升级后可能才会陆续出现。 电池健康管理 电池用久了总会有损耗,而电池健康检测这一功能就可以让我们直观地看到电池还有多少「余力」,了解什么时候应该考虑换个电池。其实早在 Android 14 的测试版本中,这一功能就曾经出现过,但由于并不完善而并没有投入使用,而 Android 15 有望让这一功能走进用户手机。 应用归档 在 iPhone 中,为节省存储空间,系统常常会帮你卸载不常用的应用腾出空间,同时保留个人资料。此前 Google Play 虽然也提供过这一功能,但却无法卸载商店以外的软件,而 Android 15 可能会为我们带来系统级的应用归档,让用户直接从应用信息栏归档任何已经安装的软件。 隐私安全 作为所有科技巨头的重中之重,每逢发布会必然会谈到「隐私和安全」。Android 15 也不例外,不仅将为我们带来一个专属的「私人空间」,用以存储应用和数据;还可能会实现「部分屏幕共享」,即只分享或录制单个应用,避免透露更多内容;以及旨在避免一次性密码被偷窥的「敏感通知」功能。 AR/VR 回归,还有更多 Android XR 细节 虽然今年相关话题热度难与 AI 相比,但 XR 同样很有可能会在今年为包括教育、娱乐、零售、医疗等各个领域带来巨大改变。Google 可能将在 I/O 大会上为我们带来更加清晰的 XR 发展战略,进一步整合服务和平台,提供更丰富的用户体验。 去年初三星正式宣布正在开发 XR 头显,Google 则通过 Android 的变体提供处理系统软件 Android XR,显然 Google 想要采取类似安卓的方式,通过专注 XR 平台开发,为相关厂商提供 OEM 合作,以此在 XR 空间计算领域占据一席之地。 不过,在去年的 I/O 大会,Google 就曾表示将会在晚些时候分享更多有关 Android XR 的信息,但最终却不了了之。外界猜测可能与三星推迟并重新设计头显设备有关,而这也影响到了 Google。 还有消息显示,之前 Google 曾试图跟 Meta 合作让他使用自己的系统,但遭到了 Meta 的拒绝,显然 Google 想要在 XR 领域复刻安卓的成功,恐怕并不容易。 Pixel 新品会前提前亮相,未来趋势才是重点 在 Google I/O 2024 中,硬件可能不会成为重点,最可能在大会上发布的 Pixel 8a 甚至提前直接开启了线上预售,出乎很多人预料。 目前来看,这款手机最大的优势在于 500 美元的售价却能享受到诸多旗舰机的特性,堪称性价比之选。皮查伊一直认为手机将会是 AI 出现创新突破的重要载体,所以 Pixel 8a 可能会成为 Google 将 AI 向低价位机型渗透的新标杆。 虽然 Pixel Fold 在去年 I/O 上备受瞩目,但第二代 Pixel Fold 是否会出现在今年 Google I/O 大会,目前还没有太多信息。 还有消息称,Google 折叠屏手机品牌将会面临重塑,名称改为 Pixel 9 Pro Fold,以便与 Pixel 系列完成更好统一,而这也意味着它很有可能会与 Pixel 9 一同或在之后发布,无缘 Google I/O 2024。 虽然 Pixel 系列不会成为 Google I/O 的主角,但从目前的信息来看,我们可能会在 Google I/O 2024 大会上看到一些概念型产品的更新,例如翻译眼镜、裸眼 3D 全息视频聊天等技术。 除了这些最新发布的产品、服务以外,今年的 Google I/O 大会还将迎来一系列演讲。此前皮查伊在接受采访时曾表示,Google I/O 大会并不注重具体的产品,而是展示未来规划与目前进展。 或许相比具体产品而言,这些演讲会为我们带来更多前沿的技术趋势,描绘出 Google 以及 AI 的未来发展蓝图。
苹果更新Mac和iPad版Logic Pro应用,引入AI增强工具
IT之家 5 月 14 日消息,苹果公司今天更新了适用于 Mac 和 iPad 的 Logic Pro 应用程序,引入了上周 iPad 发布会上预告过的内容,主要是带来了 AI 功能,部分功能需要搭载苹果 M1 或后续芯片的 Mac 和 iPad。 IT之家附上官方介绍如下: 人工智能增强型工具 智能速度和音高修正插件中加入新的人工智能增强型工具,可进一步提升你的艺术技巧 鼓手迎来贝司手和键盘手的加入,组成了完整的伴奏乐手阵容。所有乐手均通过人工智能构建,可在你的指挥下轻松创建演奏 伴奏乐手可使用全局和弦轨道跟随同一和弦进行 通过 ChromaGlow 为任意轨道增添温暖感,这款高级插件包含五个饱和度模型,用于重现老式模拟硬件的声音 * 通过大分轨拆分器将立体声音频文件分离成人声、鼓、贝司及其他声部的大分轨。 iPad 版 Logic Pro 2 也加入了伴奏乐手、ChromaGlow 和大分轨拆分器,可轻松兼容在 Mac 版 Logic Pro 中创建的项目 声音资源库 录音室贝司包含六款深度采样的原声贝司和电贝司可供弹奏 录音室钢琴包含三款精细采样的钢琴可供演奏 包含和弦标记的乐段在添加到项目时会自动填充和弦轨道 三个全新制作人包可供使用:Hardwell、The Kount 和 Cory Wong Ellie Dixon 的原创多轨道项目“Swing!”以 App 内演示乐曲的形式提供 空间音频 降低混音和修剪选项允许对非全景声通道配置进行自定义混音 导出的 ADM BWF 文件可包含立体声及其他多通道格式的设置,兼容性优于杜比全景声 改进 原位并轨为外部乐器片段或通过 Logic 的 I / O 插件使用外部硬件的轨道增加了自动实时录音功能 支持的软件乐器和效果所生成的 MIDI 可发送至其他轨道的输入,以便在播放或录音期间进行创意性叠加 使用键盘命令更高效地进行编辑,包括移动、扩展选取框所选内容或调整其大小
消息称苹果有望2025年10月发布搭载M4芯片的MacBook Pro
IT之家 5 月 14 日消息,彭博社的马克・古尔曼在最新一期的 Power On 时事通讯中表示,苹果将于今年晚些时候推出搭载 M4 系列的芯片的 MacBook Pro 和 Mac mini。 具体而言,古尔曼预估 14 英寸 MacBook Pro 将采用 M4 芯片、14 英寸和 16 英寸 MacBook Pro 机型将采用 M4 Pro 和 M4 Max 芯片,Mac mini 机型将采用 M4 和 M4 Pro 芯片。 古尔曼预估苹果会在 2025 年为 MacBook Air、Mac Studio 和 Mac Pro 更新 M4 芯片,古尔曼并未提及 iMac。 古尔曼近日发布的 Power On 时事通讯中,再次分享了搭载 M4 系列芯片的新款 Mac 设备更新路线图,IT之家附时间表如下: 苹果将于 2024 年年底前推出配备 M4 的低端 14 英寸 MacBook Pro; 苹果将于 2024 年年底前推出配备 M4 的 24 英寸 iMac; 苹果将于 2024 年年底 / 2025 年年初推出配备 M4 Pro / Max 芯片的全新 14 英寸和 16 英寸高端 MacBook Pro; 苹果将于 2024 年年底 / 2025 年年初推出配备 M4 和 M4 Pro 配置的 Mac mini; 苹果预计 2025 年春季左右上市新款 13 英寸和 15 英寸 MacBook Air; 苹果将于 2025 年年中推出配备高端 M4 芯片的 Mac Studio; 苹果将于 2025 年下半年推出配备 M4 Ultra 芯片的 Mac Pro。 国外媒体 MacRumors 在博文中认为,基于苹果此前的发布习惯,每年的 10 月是发布新款 Mac 产品的常见月份,因此苹果可能会在今年 10 月发布搭载 M4 系列芯片的全新 Mac 产品。
特斯拉Cybertruck生产负责人朱人杰离职 曾在上海工厂工作
Cybertruck制造工程总监朱人杰 凤凰网科技讯 北京时间5月14日,特斯拉奥斯汀超级工厂的制造工程总监朱人杰在上周日宣布,他已离开了公司。朱人杰此前在特斯拉上海工厂工作,来美国协助特斯拉最新车型Cybertruck的推出。 朱人杰在领英上宣布,在Cybertruck项目的推出取得史诗级成功之后,他在这家伟大公司的“冒险旅程”已经结束。目前还不清楚朱人杰的离职是特斯拉最近一系列裁员的一部分,还是他主动辞职的。过去一个月里,特斯拉至少有七名高管离职。上周,特斯拉前产品推出负责人表示,他选择离开是因为最近的裁员打击了员工士气,使公司“失衡”。 朱人杰的离职声明 不过,朱人杰在他的离职声明中采用了更为积极的语气。“当有时间停下来回头看在特斯拉度过的过去五年,很庆幸没有浪费哪怕一天的时间,跟许多有能力有态度有理想的同事以及敢于打破藩篱挑战极限的供应商伙伴一起,做到了很多以前想都不敢想的事情。我坚信那些我们给整车制造行业带来的变化会持续酝酿和发酵,引发更加深远的变革。猎鹰着陆,修葺整装;他日集结,再启征程!”他表示。 领英资料显示,朱人杰在特斯拉工作了五年多时间,在2023年1月从上海工厂来到得州工厂来协助推出Cybertruck项目。在推迟了几年之后,特斯拉从去年11月开始交付Cybertruck。 特斯拉CEO埃隆·马斯克(Elon Musk)在今年4月15日启动了一系列裁员。当时,马斯克告诉员工,他计划削减公司10%以上的员工。特斯拉员工目前正面临连续第五周的裁员通知。同时,特斯拉的“二号人物”朱晓彤已回归中国业务,重新担任副总裁职位。 截至发稿,特斯拉发言人和朱人杰均未回应置评请求。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
马斯克反悔了?特斯拉超级充电桩团队部分员工被重新聘用
IT之家 5 月 14 日消息,据彭博社报道,特斯拉公司正开始重新聘用部分超级充电桩团队的员工,该团队此前被 CEO 埃隆・马斯克于上个月底解散,当时被解雇的员工接近 500 人。 图源 Pixabay 据知情人士透露,被重新聘用的人员中级别最高的是北美充电业务总监 Max de Zegher。他是上个月被马斯克解雇的资深总监 Rebecca Tinucci 的下属之一,当时几乎整个充电团队都被裁撤了。 目前尚不清楚有多少名被解雇员工被重新聘用,马斯克和 de Zegher 都没有回应置评请求。 马斯克解散该团队的决定震惊了整个电动汽车行业,因为超级充电桩可以说是特斯拉最具前瞻性的产品之一。过去一年,特斯拉说服了竞争对手采用其充电接口作为行业标准,并与全球许多大型汽车制造商签订协议,向这些制造商的用户开放其超级充电网络。 在一片反对声中,马斯克上周承诺今年将投入“远超”5 亿美元(IT之家备注:当前约 36.2 亿元人民币)用于扩大特斯拉的充电网络。而几天前这位 CEO 还表示,公司计划以较慢的步伐增加充电桩,并将更多精力放在现有充电站的正常运行上。 5 月 10 日,马斯克拥有的社交媒体平台 X 上的 @TeslaCharging 账号发布了一条帖子,感谢充电站的场地所有者和供应商在公司内部重组期间的耐心,de Zegher 转发了这条帖子。 现年 52 岁的马斯克此前也曾收回过冲动的裁员举措。2019 年,他宣布特斯拉将关闭大部分门店,将销售转移到线上,此举让许多销售团队成员措手不及。但 10 天后,由于房东拒绝解除租约,马斯克又收回了该决定并提高了汽车售价。 类似的情况也发生在 2022 年底的推特上:马斯克解雇了大约一半的员工后不久,就有数十名前员工被要求回公司上班。 特斯拉在 2012 年 9 月推出了首批超级充电桩,当时正值这家汽车制造商开始生产 Model S 轿车。目前,特斯拉在全球范围内拥有超过 6,200 个超级充电站和 57,000 个充电枪。
OpenAI用26分钟改变世界!免费版GPT-4来了,视频语音交互快进到科幻片
今天凌晨,一场 26 分钟的发布会,将又一次大大改变 AI 行业和我们未来的生活,也会让无数 AI 初创公司焦头烂额。 这真不是标题党,因为这是 OpenAI 的发布会。 刚刚,OpenAI 正式发布了 GPT-4o,其中的「o」代表「omni」(即全面、全能的意思),这个模型同时具备文本、图片、视频和语音方面的能力,这甚至就是 GPT-5 的一个未完成版。 更重要的是,这个 GPT-4 级别的模型,将向所有用户免费提供,并将在未来几周内向 ChatGPT Plus 推出。 我们先给大家一次性总结这场发布会的亮点,更多功能解析请接着往下看。 发布会要点 新的 GPT-4o 模型:打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换 GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。 GPT-4 向所有用户免费开放 GPT-4o API,比 GPT4-turbo 快 2 倍,价格便宜 50% 惊艳的实时语音助手演示:对话更像人、能实时翻译,识别表情,可以通过摄像头识别画面写代码分析图表 ChatGPT 新 UI,更简洁 一个新的 ChatGPT 桌面应用程序,适用于 macOS,Windows 版本今年晚些时候推出 这些功能早在预热阶段就被 Altman 形容为「感觉像魔法」。既然全世界 AI 模型都在「赶超 GPT-4」,那 OpenAI 也要从武器库掏出点真家伙。 免费可用的 GPT-4o 来了,但这不是它最大的亮点 其实在发布会前一天,我们发现 OpenAI 已经悄悄将 GPT-4 的描述从「最先进的模型」,修改为「先进的」。 这就是为了迎接 GPT-4o 的到来。GPT-4o 的强大在于,可以接受任何文本、音频和图像的组合作为输入,并直接生成上述这几种媒介输出。 这意味着人机交互将更接近人与人的自然交流。 GPT-4o 可以在 232 毫秒内回应音频输入,平均为 320 毫秒,这接近于人类对话的反应时间。此前使用语音模式与 ChatGPT 进行交流,平均延迟为 2.8 秒(GPT-3.5)和 5.4 秒(GPT-4)。 它在英文和代码文本上与 GPT-4 Turbo 的性能相匹敌,在非英语语言文本上有显著改进,同时在 API 上更快速且价格便宜 50%。 而与现有模型相比,GPT-4o 在视觉和音频理解方面表现尤为出色。 你在对话时可以随时打断 可以根据场景生成多种音调,带有人类般的情绪和情感 直接通过和 AI 视频通话让它在线解答各种问题 从测试参数来看,GPT-4o 主要能力上基本和目前最强 OpenAI 的 GPT-4 Turbo 处于一个水平。 过去我们和 Siri 或其他语音助手的使用体验都不够理想,本质上是因为语音助手对话要经历三个阶段: 语音识别或「ASR」:音频 -> 文本,类似 Whisper; LLM 计划下一步要说什么:文本 1 -> 文本 2; 语音合成或「TTS」:文本 2 -> 音频,想象 ElevenLabs 或 VALL-E。 然而我们日常的自然对话基本上却是这样的 在听和说的同时考虑下一步要说什么; 在适当的时刻插入「是的,嗯,嗯」; 预测对方讲话结束的时间,并立即接管; 自然地决定打断对方的谈话,而不会引起反感; 在听和说的同时考虑下一步要说什么; 在适当的时刻插入「是的,嗯,嗯」; 优雅地处理并打断。 此前的 AI 语言助手无法很好处理这些问题,在对话的三个阶段每一步都有较大延迟,因此体验不佳。同时会在过程中丢失很多信息,比如无法直接观察语调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。 当音频能直接生成音频、图像、文字、视频,整个体验将是跨越式的。 GPT-4o 就是 OpenAI 为此而训练的一个全新的模型,而要时间跨越文本、视频和音频的直接转换,这要求所有的输入和输出都由同一个神经网络处理。 而更令人惊喜的是,ChatGPT 免费用户就能使用 GPT-4o 可以体验以下功能: 体验 GPT-4 级别的智能 从模型和网络获取响应 分析数据并创建图表 聊一聊你拍的照片 上传文件以获取摘要、写作或分析帮助 使用 GPTs 和 GPT Store 通过 Memory 构建更加有帮助的体验 而当你看完 GPT-4o 下面这些演示,你的感受或许将更加复杂。 ChatGPT 版「贾维斯」,人人都有 ChatGPT 不光能说,能听,还能看,这已经不是什么新鲜事了,但「船新版本」的 ChatGPT 还是惊艳到我了。 睡觉搭子 以一个具体的生活场景为例,让 ChatGPT 讲一个关于机器人和爱的睡前故事,它几乎不用太多思考,张口就能说出一个带有情感和戏剧性的睡前故事。 甚至它还能以唱歌的形式来讲述故事,简直可以充当用户的睡眠搭子。 做题高手 又或者,在发布会现场,让其演示如何给线性方程 3X+1=4 的求解提供帮助,它能够一步步贴心地引导并给出正确答案。 当然,上述还是一些「小儿戏」,现场的编码难题才是真正的考验。不过,三下五除二的功夫,它都能轻松解决。 借助 ChatGPT 的「视觉」,它能够查看电脑屏幕上的一切,譬如与代码库交互并查看代码生成的图表,咦,不对劲?那我们以后的隐私岂不是也要被看得一清二楚了? 实时翻译 现场的观众也给 ChatGPT 提出了一些刁钻的问题。 从英语翻译到意大利语,从意大利语翻译到英语,无论怎么折腾该 AI 语音助手,它都游刃有余,看来没必要花大价钱去买翻译机了,在未来,指不定 ChatGPT 可能比你的实时翻译机还靠谱。 暂时无法在飞书文档外展示此内容 ▲ 实时翻译(官网案例) 感知语言的情绪还只是第一步,ChatGPT 还能解读人类的的面部情绪。 在发布会现场,面对摄像头拍摄的人脸,ChatGPT 直接将其「误认为」桌子,正当大家伙以为要翻车时,原来是因为最先打开的前置摄像头瞄准了桌子。 不过,最后它还是准确描述出自拍面部的情绪,并且准确识别出脸上的「灿烂」的笑脸。 有趣的是,在发布会的尾声,发言人也不忘 Cue 了英伟达和其创始人老黄的「鼎力支持」,属实是懂人情世故的。 对话语言界面的想法具有令人难以置信的预见性。 Altman 在此前的采访中表示希望最终开发出一种类似于 AI 电影《Her》中的 AI 助理,而今天 OpenAI 发布的语音助手切实是有走进现实那味了。 OpenAI 的首席运营官 Brad Lightcap 前不久曾预测,未来我们会像人类交谈一样与 AI 聊天机器人对话,将其视为团队中的一员。 现在看来,这不仅为今天的发布会埋下了伏笔,同时也是我们未来十年生活的生动注脚。 苹果在 AI 语音助手「兜兜转转」了十三年的时间都没能走出迷宫,而 OpenAI 一夜之间就找到出口。可预见的是,在不久的将来,钢铁侠的「贾维斯」将不再是幻想。 《她》来了 虽然 Sam Altman 没在发布会上出现,但他在发布会后就发布了一篇博客,并且在 X 上发了一个词: her。 这显然在暗指那部同名的经典科幻电影《她》,这样是我观看这场发布会的演示时,脑子里最先联想的画面。 电影《她》里的萨曼莎,不只是产品,甚至比人类更懂人类,也更像人类自己 ,你真的能在和她的交流中逐渐忘记,她原来是一个 AI 。 这意味着人机交互模式可能迎来图像界面后真正的革命性更新,如同 Sam Altman 在博客中表示: 新的语音(和视频)模式是我使用过的最好的计算机界面。它感觉像电影中的人工智能;而且我仍然有点惊讶它是真实的。达到人类级别的响应时间和表现力原来是一个很大的改变。 之前的 ChatGPT 让我们看到自然用户界面初露端倪:简单性高于一切:复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。 但今天发布的 GPT-4o 则完全不同,它的几乎无延迟的相应、聪明、有趣、且实用,我们和计算机的交互从未真正体验过这样的自然顺畅。 这里面还藏着巨大可能性,当支持更多的个性化功能和与不同终端设备的协同后,意味着我们能够利用手机、电脑、智能眼镜等计算终端做到很多以往无法实现的事情。 AI 硬件不会再试积累,当下更令人期待的,就是如果下个月苹果 WWDC 真的官宣与 OpenAI 达成合作,那么 iPhone 的体验提升或许将比近几年任何一次发布会都大。 英伟达高级可科学家 Jim Fan 认为,号称史上最大更新 iOS 18 ,和 OpenAI 的合作可能会有三个层面: 放弃 Siri,OpenAI 为 iOS 提炼出一个纯粹在设备上运行的小型 GPT-4o,可选择付费升级使用云服务。 原生功能将摄像头或屏幕流输入到模型中。芯片级支持神经音视频编解码器。 与 iOS 系统级操作 API 和智能家居 API 集成。没有人使用 Siri 快捷方式,但是是时候复兴了。这可能会成为一开始就拥有十亿用户的 AI 代理产品。这对智能手机来说,就像特斯拉那样的全尺寸数据飞轮。 说到这里,也不得不心疼明天要举办发布会的 Google 一秒。 作者:李超凡 莫崇宇
智驾系统被过度神话?《萝卜报告》创始人陈震:我被救过很多次 | 凤凰V现场
凤凰网科技讯 (作者/杨睿琪)5月9日,近期,新能源车事故频发引起社会的广泛关注,对此,凤凰V现场邀请《萝卜报告》创始人陈震、车评人三刀、底盘电子工程师罗新雨、整车电子架构专家一起连麦讨论。对于各种新势力车企,也包括特斯拉都在宣传他们的AEB、ADAS、以及他们的辅助驾驶、智能驾驶功能,这些功能是不是被过度神话了?《萝卜报告》创始人陈震表示辅助驾驶是对的,我被救过很多次。 陈震表示,前段时间的事故我觉得已经超过了AEB工作的车速范围,我比较依赖辅助驾驶,被救过很多回。有时候跑长途,会出现犯困的情况,大多都是车的辅助驾驶帮我停住,或者是提示我,避免了事故。所以我觉得辅助驾驶是对的,会减少很多事故的发生。车身上有很多感知设备是不会偷懒的。在极端情况下,它能看见(险情),但人看不见(险情)。 对于新能源车是否事故率更高?陈震表示,新能源车因为是电驱,可以用很便宜的价格就能买到,实际驾驶起来也很猛,事故率增加也正常。以前要想买一个百公里加速3秒、4秒的车得花很多钱,因为贵,销量相对就少。而现在二十几万的车已经达到2秒、3秒了。随着销售量增大,会导致事故变多。另一方面,对于新手来说,给他这么大扭矩的车,不一定能把控得住,这或许也会加大事故概率。 此外,现在大家提到新能源车,会有很多标签,比如动能回收、隐藏式门把手等等。对于隐藏式门把手是否方便这个问题,陈震表示,一方面是风阻,新能源车对于风阻系数比较敏感,因为直接涉及到它的续航。风阻系数低,续航数据就会好看。从之前发生的事故来看,碰撞速度已经达到115km/h,这个不是测试范围内的速度,车里的乘员还存在没有系安全带的行为,这也是一个问题。陈震认为,随着技术的发展,隐藏式门把手会变得越来越安全,如果人在车里系上安全带,在一些事故发生之后操作机械门把手,大概率就能从车里逃生。这种电子门把手,在车里都会有一个机械开关,只不过是藏在哪个位置的问题。所以,我们一定要了解自己的车,要知道自己的车有隐藏的机械门把手,这是打开车门的前提。
TikTok美国命运未卜,谷歌督促广告团队“抓住机会”
YouTube的短视频服务短片 凤凰网科技讯 北京时间5月9日,对于数以百万计的TikTok用户和网红来说,TikTok在美国面临被禁的前景可能是一场噩梦,但对谷歌公司来说却是一个美梦。 美国《商业内幕》看到的谷歌内部文件显示,该公司正试图通过强调TikTok可能在美国被禁的可能性,来说服广告商在YouTube上投入更多资金。谷歌管理层鼓励广告销售员工抓住TikTok这个不确定时刻,就TikTok被禁的后果与客户“进行深思熟虑的对话”。2020年,YouTube推出了短视频服务“短片”(Shorts),抗衡TikTok。 这份文件为谷歌广告销售部门的员工提供了指导,称员工在与广告商交谈时应强调在YouTube上投入的好处,包括该平台所具备的“行业领先的品牌安全”。“最近的立法加大了TikTok在美国被禁的可能性,因此积极主动的客户互动至关重要。”该文件写道。 文件还提供了YouTube正在击败TikTok的例子,要求员工在与广告商交谈时强调这些例子。例如,它引用皮尤研究中心最近一份报告中的数据指出,美国青少年每天使用YouTube的次数多于TikTok。 谷歌发言人在一份声明中回应称:“我们的战略保持不变:我们将全力投入对我们的创作者、观众和广告商最重要的事情。话虽如此,我们无法审核这份文件,也无法证实《商业内幕》的报道。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
苹果员工争取福利遭公司消极对待 或将进行罢工
马里兰州陶森市陶森镇中心购物中心的一家 Apple 专卖店 凤凰网科技讯 北京时间5月9日,继苹果在与工会谈判中被指责态度消极后,马里兰州陶森的苹果零售店员工将于周六投票决定是否罢工,以争取更高的薪水和福利。 本周早些时候,代表商店员工的本地机械师工会(local Machinists union)向员工们发送了详细说明该计划的相关资料。如果大多数工会成员在5月11日投票批准罢工,那么罢工随时可能发生。一位工会代表表示,具体日期尚未确定。 至于罢工的原因,早在去年5月份,工会要求苹果公司实施高达10%的加薪。它还呼吁改变假期政策、丧假和加班费。该商店的代表要求苹果公司针对店内信用卡交易实施小费系统,让购物者以3%、5%或自定义金额的增量支付小费。 然而,代表马里兰州陶森市苹果专卖店的国际机械师和航空航天工人协会表示,苹果尚未对员工提出的建议做出回应。该组织曾在去年7月份向国家劳工关系委员会提出申诉,称存在“明显的倒退性谈判模式”。 员工社交媒体发文指责苹果谈判态度消极 机械师工会附属组织零售员工组织联盟表示:“经过十几次谈判,苹果公司继续采取拖延战术,其行为方式不符合达成集体谈判协议的精神”。还有员工在推特上发文表示,苹果公司采取了“令人震惊的措施,只能被解释为故意采取行动,破坏我们迄今取得的进展。” 因此,工会希望以罢工的形式来达成员工提高薪酬和改善福利的诉求:“我们的暂定协议将为我们的团队带来显着的保护,并实现我们在谈判中的许多目标。”工会对陶森商店的工人这样说道。 除此之外,工会告诉员工,在罢工至少持续14天后,他们将每周向罢工者提供200美元,并且抗议者不会因为对劳工实践进行纠察而被解雇。 对此,苹果官方发表声明回应称:“我们很自豪能为他们提供行业领先的薪酬和特殊福利。一如既往,我们将尊重并真诚地与代表我们陶森团队的工会进行接触。” 另一个值得注意的信息是,苹果位于新泽西州肖特山的商店将于本周末投票决定是否成立工会。本月早些时候,美国国家劳工关系委员会裁定,苹果公司在纽约世贸中心商店非法审问员工。(作者/周文浩) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
被美撤销向中企出口芯片许可,英特尔发声
作者 | 樊雪寒 5月8日,英特尔在提交给美国证券交易委员会(SEC)的一份文件中指出,美商务部“撤销了向中国客户出口消费者相关产品的某些许可证,立即生效,因此, 公司预计2024年第二季度的收入将保持在原指导区间125亿美元至135亿美元之间,但实际收入将低于此前预期的中间值。” 虽然英特尔在上述文件中并未指明“中国客户”是谁,不过消息面上,拜登政府日前进一步收紧了对中国通信公司华为的出口限制,撤销了美国芯片公司高通和英特尔向华为出售半导体的许可证。 第一财经记者分别致电了两家公司,高通没有立即回应置评请求,英特尔则表示拒绝置评。 美国《巴伦周刊》指出,证券文件显示,2023年,中国市场占英特尔总营收的27%,拜登政府此次对华为出口限制可能影响其营收的6个百分点。中国市场则占高通2023年整体营收的62%,可见中国客户在上述两家公司业务版图中的重要性。 出口限制消息释出后,高通股价在7日交易期间下跌 0.9%,英特尔股价在7日当天相对平稳,不过在上述提交给SEC的文件公开后,英特尔股价在8日午盘交易中下跌2.5%至29.91美元每股,在8日美股收盘时,英特尔股价继续下跌,跌幅达到2.22%,收盘价为30美元每股,创下了自2023年6月5日以来的收盘新低。 分析认为,相比手机,此次出口管制对华为电脑业务的影响可能更为严重。 从手机业务线来看,高通方面不久前曾表示,华为相关业务当前已经很有限,公司此前被美国政府批准向华为供应较为旧款的4G通信芯片,但被禁止销售5G通信芯片给华为。因此,即便高通对华为的出售许可证被撤销,影响的也是华为当前在低端手机市场的布局。 相比手机,在中国市场,华为笔记本电脑的销售额份额已从2018年的2.2%增长到2023年的9.7%。分析认为,尽管华为当前已经具备一定技术能力,包括基于ARM架构的设计,如果英特尔的核心处理器芯片供应被限制,华为笔记本的排名将会有所滑落。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。