行业分类:
加载中...
头条分类:
加载中...
《绝区零》,米哈游的 B 面
昏暗的灯光下,一台老式复古 CRT 电视,正循环播放着各种电视广告。 这是米哈游旗下最新游戏——《绝区零》的登录界面,换作是《原神》里的天空岛,或是《崩坏星穹铁道》中驶向银河的列车,大部分人估计会不假思索,直接点击进入游戏。 不过,如果你愿意在《绝区零》的登录界面多待几分钟,的确会看到意外的惊喜。 登录界面隐藏的杂货店广告 我细数了下,不到5分钟的时间内,这台电视足足播放了 14 条不重样的广告内容:有致敬特摄片的《星辉骑士》,有怪诞惊悚风的《波特山》,还有风格鲜明的能量饮料、运动球鞋和街头潮玩店广告...... 光是一个登录界面,就能埋下这么多梗,也能看出制作这款游戏的团队,是一群什么样的人了。 拿到版号的《绝区零》,近期火速开启了第二次测试 如果说米哈游之前的《原神》、《崩坏:星穹铁道》,亦或是更早的《崩坏3》,在题材上都偏向奇幻冒险风格,那么《绝区零》,则更多呈现出一种二次元与潮流文化的碰撞融合,反倒带有些叛逆和不羁。 两个月前,在接受日本 IGN 采访时,《绝区零》游戏制作人李振宇就曾表示:「都市元素,是本作有别于原神等其它米哈游游戏的重要特征之一。」设计师出身的他,更希望在风格上,做出明显的改变。 这似乎也奠定了某种基调:绝区零,不太米哈游。或者说,是米哈游的 B 面。 米哈游最「潮」游戏来了 「潮酷」与「街头感」,是我对绝区零的第一印象。 六分街的整体风格,能让你联想起许多潮流街头文化空间 一来,是来自场景的感知:《绝区零》的主城区「六分街」融入了大量的街头、潮流风格元素,而且各家店面都进行了精心设计。 每家门店都具备功能性,比如咖啡店和拉面店均可以提供增益buff 这里有开咖啡店的机器人,装有机械义肢的拉面店老板,以及看管报摊亭的小狗。 街机厅的游戏可以当作是附属小玩法 还有一间电玩街机厅,内置了两款致敬《贪食蛇》和《钻头小子》的街机游戏,而且,你真的可以上手去玩。 加上随处可见的街头涂鸦、宣传海报、手写体招牌,以及来回行走的学生和路人,整个《绝区零》都营造出一种上世纪八九十年代的街头风,这对于玩家感知游戏格调,也起到了很好的效果。 主角的房间有着浓郁的怀旧气息 游戏内的主角所经营的录像店,更是充斥着各种复古怀旧要素:雅达利游戏主机、老式收音机、拍立得,以及布满货架的录像带影片...... 你发现了吗,前文提到的登录界面中那台电视机,其实就摆在主角房间的沙发正前方。 用电视墙来展现关卡 再者,《绝区零》的整体UI风格,也在有意识地与「潮酷」主题相融合。 制作成录像带的回忆录 比如通过电视墙的表现手法来展现关卡,将剧情事件制作成一盘盘录像带,以及各种带有渐变色彩、闪烁特效的动态按钮等…… 种种这些,其实所有的设计都是在契合潮流的基调,强突显游戏的时尚感。 全动态角色展示界面 还有角色的展示界面,每切换一个菜单栏,就会变换一次运镜,对角色不同角度进行展示,搭配上节奏感极强的电子背景音乐,都让游戏迸发出一种莫名的「张力」。 通过各种界面细节、场景内容等设计表达,来展现游戏内文化、世界观的「自洽性」,这在《女神异闻录》、《Splatoon》等很多强风格化的游戏中,已经有了很好的诠释。 在《绝区零》中,项目团队也在有意展现出自己对于都市风、街头感和潮酷文化的理解和认知。这也让本作在艺术风格的表达上,成为了目前米哈游游戏中,独树一帜的存在。 除了潮,还要爽 如果单纯描述游戏玩法的话,《绝区零》乍看之下算是个挺朴素的「3D 即时动作 RPG」,标准的多角色小队副本探索,并融入了Rogue自由选择元素,最终达到通关目的。 但在体验了近 20 个小时后,我发现《绝区零》的战斗可以划分到「高速动作游戏」那一类:它比预想中要更爽快,更刺激,也更炫。 这种感受来源于多个方面,首先最直观的一点,是战斗的「等待时间」明显变少了。 游戏中的切人操作不存在CD时间,而且衔接十分自然 具体来说,我们在《原神》中看到的「换人 CD」、「技能 CD」,均在《绝区零》里被移除——尤其是切人这一操作,完全是 0 延迟触发,甚至达到了上一个角色还在放技能,下一位角色就已经出场的情况,衔接极其丝滑流畅。 加上《绝区零》的战斗方式,是需要攻击敌人来叠满失衡值,从而实现破防;而战斗场地,又多为平面线性关卡,各个接敌区之间的间隙很短,也变相加快了战斗节奏。 每一位角色释放终结技均会有动画演出 种种因素导致下,《绝区零》的战斗,其实是「鼓励进攻」的,玩家几乎不需要等待各种 CD 时间,或是无意义追怪闪避,或是寻求防御,「干架」几乎成了战斗中的唯一选择,主动进攻的欲望也变得更为强烈。 其次,绝区零在战斗运用了大量定格帧与特写镜头,来提升战斗演出的表现力,进一步拉满了游戏的爽感。 「打铁」 一个是「极限支援」,这是游戏中将「防反」与「切人」融合的机制,如果是近战角色实现判定,你就能看到类似《只狼》中的「弹刀」效果,配上熟悉的打铁声,确实非常带感。 此外,当玩家触发连携技 QTE 时,镜头还会直接拉近,给当前角色一个慢动作特写镜头,并会无缝切换到下一个释放技能的角色。 故障视觉特效在许多动画电影中也有所运用 最后,在收尾战斗时,时不时还会看到一组多视角的慢动作镜头,这里巧妙地结合了「GlitchArt」故障特效来提升视觉冲击力,其实也与游戏中通过电视墙来推进关卡的设定相符合。 还有一点出乎意料,我在测试中试玩过的角色,几乎没有看到动作复用的情况——不管是角色待机、疾跑,还是战斗中的出招姿态,每个角色基本都使用了独立的动作模组。 单看这点,《绝区零》角色所拥有的动作数,或许要比米哈游在原神、崩铁中要多得多,我想每一位经历过「动作模组复用」洗礼的玩家,更会对老米这波升级感触良深。 把控共性,寻求个性 米哈游游戏在一些内核上,是有「共性」的。 往大了说,产品管线的成熟化,让原神和星铁都实现了 42 天一周期的版更节奏,这是开发流程的共性;而落到玩法上,虽然原神和星铁品类不同,但两者在角色养成、系统机制上,都有相似之处,这是核心玩法的共性。 用原铁地材料去类比,的确能极大降低理解成本 比较有意思的是,不管是今年星铁刚上线,还是这次绝区零二测,我都能看到热心玩家制作的「一图读懂XXX」,他们将新游戏中的各项设定,分门别类对应到老游戏中,老玩家一看,自然都心领神会。 甚至,当我在《绝区零》中听到角色猫宫又奈的声线,都能听出一些熟悉感。翻看声优列表,还真的是同一个人。 问题来了,作为一款主打潮酷主题的游戏,《绝区零》的「个性」在哪?一贯擅长以内容和角色打动玩家的米哈游,又如何在本作中体现它的差异化? 玩家在《绝区零》中不再扮演自己,更多是从一对兄妹的视角出发 一个是叙事视角的改变:在原神、崩铁中,我们一般是以第一人称的的身份,参与到游戏冒险之中,所以不管是旅行者还是开拓者,基本不会有太多带配音的剧情,也是为了增强玩家自己的代入感。 但在《绝区零》中,虽然仍然保留了选择男女的环节,但在剧情上,更多是以铃和哲这对绳匠兄妹的视角,去经历剧情中的大小事件。 这也使得游戏剧情的个人主观色彩不再那么强烈,但相对的,视角的多元化也进一步拓宽了剧情的视野,尤其是这对性格迥异的兄妹,在剧情中交互颇多,很少会有自说自话的表达方式。 漫画风的剧情演出新鲜感极强 剧情演绎的方式也得到了拓宽。这里不得不提一下《绝区零》的漫画分镜过场了,丰富的动态分格,以及气泡框、效果线等常见漫画元素的运用,大大提升了剧情演出的体验层次,重要的是,这与游戏本身潮的基调并不冲突。 再者,《绝区零》目前所放出的角色群,不仅设定新颖,而且都极具辨识度。 猫耳兽娘、furry 狼哥、傲娇女仆、时尚辣妹、假面骑士机器人…… 几乎所有你能想到的亚文化元素,你都能从《绝区零》中找到对应的体现,而且除了普通人类,还有大量的亚人族、机甲等设定。 游戏中不同阵营的穿搭风格,有着明显差异 此外,每一位角色均有「阵营」的设定,所以在衣着搭配上也有各自的特色——比如其中的「白祇重工~」四人组,便参考了粗犷厚重的工装风,而福瑞狼哥所属的「维多利亚家政」,更像是一群身着西装、女仆装的管家执事,风格化十分明显。 角色的武器也很有意思。不仅拥有符合自身流派设定,而且基本是将生活中随处可见的道具进行改装——「白祇重工」用的是冲击钻、钉枪、柱子等「工地设备」,而「狡兔屋」用的则是短刀、双枪、手提箱等更具街头气息的武器。 哦对了,我似乎并没有看到法杖、魔导书这样的东西… 我所能想到的原因,是制作团队希望做出符合游戏基调的产物,如开头所说,「都市感」、「潮酷」是绝区零的内核,比起剑与魔法的世界,或许上演一场「街头乱斗」,会更符合绝区零的调调。 但,谁能保证以后不会出现一位赛博流派的法师呢? 米哈游的新征程 毫不夸张地说,目前的《绝区零》,完全不像是一款仍处于非计费测试期,未正式上线游戏的品质。 它的成熟度高得惊人——不仅延续了米哈游一贯的美术优势,而丰富多元化的角色,也准确切中了当代亚文化玩家的喜好,还有酷炫的动作玩法,最展现出一个品质极高的酷潮世界。 在这样的前提下,一些欠缺打磨的部分,在测试期似乎也显得不那么重要了——比如敌人种类偏少、关卡内场景较为单一、单次空洞探索时间偏长、空洞高难关对手残玩家不会很友好等等,都有再改进调优的空间。 对米哈游来说,《绝区零》已经交出了一份异常新颖且大胆的答卷,或许他们要考虑的,是明年《绝区零》上线后能够达到的高度——许多公司可以碰运气开发出一个还不错的作品,但连续赢两次的可并不多。当原神和星铁,已经证明这家公司的工业化打造能力后,绝区零,是否能凭借不一样的潮酷题材,再次赢得商业与口碑上的成功? 结果尚无定论,让我们拭目以待。
新能源车出海,最成功的竟然是滑板车?
如果要选一个代步工具去解决两三公里的通勤,你会选哪个? 估计大家应该绕不开单车或者电瓶车,毕竟现在这玩意儿共享的满大街都是。 但要是在国外,尤其是欧美那块儿,他们可能还有另外一个选择:电动滑板车。 电动滑板车在国外有多受欢迎呢? 这么说吧,你要是走在大马路上,经常就能看到有人踩个电动滑板车 “ 嗖 ” 得滑过去,还有人图省事儿直接用它送送外卖。 时不时他们还会自己搞个电动滑板竞速赛啥的。。。 甚至说起来你们可能不信,共享电动滑板行业,也因此在国外爆火了起来。 他们的共享电动滑板,也是扫个码就能骑走。而且停车贼方便,它不像国内共享单车还给你划了白框框,必须停在里面。 他们讲究的是一个 “ 无码头 ” 停放,随停随放,充电的话不用担心,自然有工人回收统一更换电池。 有点离谱的是,国外有些地方的共享电动滑板还衍生出了新的 “ 副业 ” ,骑没电的车可以开回家自己充电,充满电第二天放回去,平台会给补贴,有狠人小哥之前靠干这个一个月挣了 2000 美金。。。 不过方便归方便,收费相比于咱们的共享单车,还是贵了不少的。 就拿英国举例,在他们那儿骑个最便宜的共享电动滑板,起步价先得来个九块钱( 一英镑 ),之后每分钟还得以一块多每分的价格收费,着要骑个 10 分钟,不得快 20 块钱。 而国内骑个 30 分钟的小蓝或小黄顶多也就三五块钱。 好在欧美那块儿的消费整体都高,打个车更贵,动不动就 30 块钱起步费,相较之下,共享电动滑板还是蛮划算的。。。 所以从 2017 年共享电动滑板车刚刚问世后, 18 、 19 年,国外马路就已经发展到两步一小红、三步一小蓝的地步,到现在完全可以讲在欧美遍地开花了。 光是美国,去年中旬的时候,能骑共享电动滑板车的城市,已经有 158 个了,而在 2019 年的时候,这个数字还只是 87 。。。 国外共享电动车发展的那叫一个热闹,可能会有不少人觉得各大运营商都赢麻了。 但世超却觉得,里面的最大赢家,还不是那些运营商,而是一群给他们造车子的制造商。 毕竟运营商还要承担能不能回本的风险,但卖车子可就不一样了,那是一手交钱、一手交货的买卖。。。 前年的时候,全球电动滑板车的产量有 620 多万台,里面中国造的就有 546 万台,排在第二的美国年产量连中国的一个零头都不到,才 45 万台。。。 而国内厂商造的电动滑板,有很一大批都是卖给了共享电动滑板的运营商。 比如国外共享界的老大哥 Lime 和 Lyft ,他们俩的车子几乎清一色中国造的。 甚至 Lime 的前两代车子,连设计都懒得做,全权交给中国厂商干了, Lyft 则和国内的九号公司达成了合作,由它专门给生产定制的专属车型。 其中光是九号这一家公司的电动滑板车,就占了全球市场的一半以上。 他的主要客户,从 2018 年开始就几乎全是共享电动滑板运营商,除了 Lyft 之外,还有 Spin 、 Grin 、 Voi 、 Uber Scooter 、 Bird 等等等等。 而咱国内厂商几乎能包圆了国外的电动滑板车需求,背后最大的功臣,还得是国内成熟的供应链体系。 在前几年新冠期间,其他企业或者其他领域的供应链都一断再断。 国内的电动滑板车制造商却稳如老狗,尤其在 2021 年,它们在电芯和电子器件的供应上就没断过。 但问题也来了,就供应链这块儿,国内像电动自行车这些也相当成熟,为啥它出海就不怎么香呢? 这就得牵扯到欧美那些国家的政策了,从 2019 年开始,从咱这儿向他们出口电动自行车,会被戴上个 “ 反倾销 ” 的帽子,繁重的反倾销税,让不少企业苦不堪言。 但把自行车换成滑板车,再去出口就不算反倾销了,要交的税就少得多得多。 电动滑板车算是钻了这个小 “ 漏洞 ” ,占领了国外的市场。 而除了给共享平台供货之外,国产电动滑板车企业们,也开始想法子在国外打响自己名气,自己卖货。 这块搞得最得心应手的还是九号公司,不少伙伴应该都知道,像这种制造业出海做生意,第一个拦路虎就是专利问题,属于是企业出海老戏码了。 为了搞定这个,在 2015 年,九号直接收购了欧美那边的一个平衡车鼻祖品牌赛格威。 赛格威那边呢,口袋里的专利贼全,并且名头在国外也贼响亮,买下它相当于坐稳了半个国外平衡车霸主的地位。 这一通操作下来,品牌影响力 + 技术问题,统统全都解决了,顶着赛格威的名头,造的车子自然也就更好卖了。 不过,虽说在国外大部分国家,共享电动滑板市场发展得火热,但这两年它引起的争议也不小,每隔一段时间就要拿出来吵一次。 前不久,巴黎还直接整个城市禁了电动滑板。 大家争论的原因,就是电动滑板车这玩意儿,相较于单车、电动车啥的,事故率是真的高。 因为毕竟这是要站着开的,速度还贼快,一不小心没刹住车人直接给飞出去。 英国交通部就做过一个数据统计,现在因电动滑板车严重受伤的人数在逐年递增, 2021 年有 228 人,到去年这个数字就几乎翻了一番,有 429 人。 当然大家的争论,也代表着电动滑板车整个行业在不断规范中,到现在,共享电动滑板车野蛮生长的阶段已经过去了,修剪整个行业内的 “ 杂草 ” 也会是未来很长一段时间内他们的主题。 国内在电动滑板上,走的则是先规范、再发展的路子。今年 8 月份,官方也马不停蹄通过了一个电动滑板车的国家标准。 随着相关标准的完善,或许在未来解决最后一公里的方案中,咱也会有电动滑板车这个选项。 不过至少短期内,共享电动滑板车的主场还是会在欧美那块儿,而国内这些电动滑板车厂商口袋里的一些钱,也还是得从国外赚。 撰文:松鼠 编辑:江江&面线 封面:萱萱
Mark Gurman:苹果Vision Pro即将发售,将于1月中旬开始培训零售员工
IT之家 12 月 11 日消息,据彭博社记者马克-古尔曼(Mark Gurman)报道,苹果零售店已经开始为 Vision Pro 做准备,这意味着这款产品即将发售,定价 3499 美元(IT之家备注:当前约 25088 元人民币)。 据称,苹果邀请了部分零售店员工前往加利福尼亚州的库比蒂诺,培训他们如何使用和销售 Vision Pro,计划是从每个店铺中挑选几个人飞往总部接受培训,然后让他们回去后再传授给其他人。 苹果之前只告诉员工们这一培训将会在 2024 年初进行,大约与 Vision Pro 发售的时机接近。 根据古尔曼的说法,现在这些研讨会已经开始安排下去,具体的培训活动将于明年 1 月中旬开始,每位员工需要接受为期两天的培训。 他指出,Vision Pro 的设置过程将非常复杂,苹果不希望搞砸。该设备需要根据每个人的需求进行定制,如果安装不当可能会最终影响用户的体验。所以,苹果需要精心策划每一步,包括让零售员工学会如何接近客户并将设备戴到用户头上。 值得一提的是,虽然客户可以在线预订 Vision Pro,但用户更倾向于在实体店购买,而且 Vision Pro 早起仅在美国上市,并且就算在零售店购买也需要预约。 苹果 Vision Pro 采用 micro-OLED 屏幕,拥有 2300 万像素,单眼分辨率超过 4K。耳机面罩和表带采用布衬和模块化设计,苹果表示它们可以弯曲以适应各种脸型和头型。 苹果 Vision Pro 有一个可提供 2 小时续航的外部电池,可以通过“柔软的编织电缆”连接,因此使用时可以放入口袋;搭载 M2 芯片以及全新的 R1 芯片,R1 芯片主要负责传输,还采用全新的操作系统 visionOS。 广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
屏宇宙卷进大模型!TCL华星5个全球首发重磅新品炸场,印刷OLED明年落地
作者 | 云鹏 编辑 | 云鹏 智东西12月7日报道,刚刚TCL华星在全球生态大会上发布了全球首款65英寸8K印刷OLED曲面显示器、全球首款14英寸2.8K印刷Hybrid OLED笔电屏、全球首个1727PPI的Real RGB LTPO-VR LCD显示模组等一系列重磅显示新品。 会上,TCL华星还发布了全球首款半导体显示垂域大模型,据称其在半导体显示领域的能力要超越GPT-4,并且这一大模型支持私有化部署。 此外,TCL科技、TCL华星相关高管陆续登台进行了演讲,对一些业务规划和产品技术进行了进一步的深入解读。 一、五个“全球首款”重磅新品,印刷OLED优势凸显,AI大模型走入显示产业 首先我们来看看今天发布的新品。目前TCL华星在OLED领域的重点技术方向是印刷OLED,此次的新品也多与该技术相关。 TCL华星发布的全球首款65英寸8K印刷OLED显示器是一款大尺寸曲面电竞显示器,从某种程度上来说也可以作为电视使用。印刷OLED的技术在PPI上有比较明显的优势,据称PPI同比提升达到了3倍,同时开口率提升了50%,寿命更长,发光材料利用率也超过了90%。 我们在现场也看到了这款产品的实际样机,这款产品为8K 120Hz,峰值亮度可以达到800nit,色彩表现较为出色,画面的通透感和对比度都较好。 TCL华星发布的第二款新品为全球首款14英寸2.8K印刷Hybrid OLED笔电显示屏,这块屏幕的亮度可以达到400nit,支持120Hz高刷,在14英寸内做到2.8K分辨率在以往是难度较高的,这也侧面体现出印刷OLED在PPI方面的优势。 此外,TCL华星还发布了一款全球首创的150英寸MLCD零拼缝商用显示产品以及一个2.1英寸的LTPO-VR LCD显示模组,其PPI达到了全球最高的1727,并且像素排列还是Real RGB。 ▲150英寸MLCD零拼缝商用显示屏 根据我实际线下佩戴,其显示效果是较为出色的,屏幕几乎察觉不到任何颗粒感和纱窗感,屏幕精细度不错,色彩显示也比较抓人眼球。 值得一提的是,在AI大模型火爆的当下,TCL华星也亮出了自己的垂类大模型,星智X-Intelligence,据称这也是全球首款半导体显示垂域大模型。 根据官方测试数据,其在半导体显示领域的模型能力超越GPT-4,并实现了私有化部署。 这款大模型由TCL华星和清华KEG&智普AI、国家新型显示技术创新中心联合发布。 根据官方展示的信息,这款大模型大同了知识管理、多领域应用仿真和多场景实践,进行了垂域数据增量预训练,学习了超过53万个半导体显示领域文献。 在发布新品的同时,TCL华星相关高管也提到了他们在显示技术领域的布局,TCL华星主要会聚焦于LCD、OLED/QLED、MLED以及微显示技术的开发和商业化应用。而TCL华星的显示产品主要会聚焦显示体验、视觉健康和绿色低碳这三个方面。 TCL华星的印刷OLED技术会应用在各个尺寸的显示产品中,比如重大尺寸的电视和显示器产品、中小尺寸的平板和笔记本电脑显示产品。 在电视和显示器领域,印刷OLED是目前唯一可以满足视网膜级显示器的OLED技术,Real RGB的OLED像素设计在清晰度上也优于其他方案。在平板和笔记本电脑显示领域,印刷OLED高开口率带来的长寿命、成本的进一步降低、可快速切换生产的灵活性以及功耗方面的节省,都成为其突出优势。 当然,技术研发创新离不开生态的建设,TCL华星高管也提到,他们会跟上下游供应链一起突破材料关键技术,这是他们始终要坚持的一个重点方向。 二、换机周期和新品迭代速度的“鸿沟”如何弥合?从性能至上到体验为王 除了众多重磅新品炸场,此次TCL华星高管也在演讲中带来了不少有价值的行业思考。 TCL科技高级副总裁、TCL华星首席执行官赵军在开场率先抛出了一个值得思考的问题,如今消费者手机换机周期提升至43个月,但手机迭代速度仍然很快,小于12个月,这种差距如何解决,产品如何匹配消费者的需要? 这也是目前消费电子产业中一个突出的问题。根据TCL华星和相关研究机构的调查数据,关注产品是否具有高精尖技术的消费者占比其实只有9%,性能技术响应实际上是过剩的。 相反,为了核心需求被满足而购买产品的消费者有73%,但细分需求响应是不足的,这就带来了需求响应的“结构性不均”。 在这样的大背景下,厂商能否真正洞察消费者需求,让消费者产生价值认同,是解决前面提到的行业问题的关键。 赵军提到,如今产品性能的提升逐渐遇到瓶颈,边际效益递减,甚至逐渐逼近人眼视觉感知的极限,因此产品和技术的迭代需要“从性能至上转向体验为王”。厂商必须要更加重视基础功能和体验升级。 赵军在演讲中特别说道,不能为消费者带来价值的卷,是没有出路的。 在体验方面,赵军特别提到了屏幕用眼健康的问题,这也是当下消费者越来越关注的。根据市研机构数据,2023年人均日用屏时长已经达到了7小时,中国16-18岁青少年近视率达到了80%,每五个人中有四个近视,问题已经很突出了。 在这样的大背景下,护眼消费市场在快速增长,今年上半年,护眼产品线上成交额同比增长了50%,这也是显示厂商们一直关注的重点市场。 随后,赵军继续介绍了TCL华星在LCD、OLED等领域进行的技术、产品和服务布局,包括在LCD领域推出的画质平台和能效平台、在OLED领域重点投入的FMM OLED和印刷OLED技术。 这些技术和产品我们已经比较熟悉了,在此不再赘述。 赵军也在演讲中透露,TCL华星的印刷OLED产品将在明年正式量产,走入用户家中。 在演讲最后,赵军对TCL华星的整体战略进行了解构,从场景应用、产品领域、技术平台三个层面进行了宏观解读。 三、从手机、穿戴、平板、车载、VR到电视,众多显示黑科技袭来 除了前文提到的各类首发新品,在这次DTC大会的产品展区,我们还看到了诸多亮眼的“黑科技”屏幕显示产品,涉及品类从智能手机、智能穿戴、平板电脑、车载、PC、VR/AR到电视。 值得一提的是,TCL华星还展示了全球首款半导体显示AI大模型,星智X-Intelligence,该AI大模型针对显示半导体领域的知识进行了大量学习训练,可以说已经是显示半导体领域的“专家”了。 比如对OLED的良率如何提升、半导体显示设计的关键要点这些专业问题,星智X-Intelligence都可以给出准确的答案。 在展区,我们看到TCL华星研发的高亮AMOLED屏幕,其全局亮度可以达到1700nit,从现场观感来看,其亮度确实很足,相比传统的600nit,提升感知非常明显,屏幕色彩显示更通透、鲜亮。 在目前业内高度关注的中尺寸OLED领域,TCL华星展示了多款相关产品,其中14英寸的Ultra Tandem OLED中尺寸柔性屏的最高亮度已经超过了2500nit,同时功耗相较普通OLED提升了30%,寿命提升了3.5倍。 这样的显示性能参数对于一款OLED屏幕来说,已经是相当出色了,甚至在OLED传统短板亮度方面超过了不少LCD屏幕。 在折叠屏领域,TCL展示了业内首款近似无折痕折叠屏,该屏幕据称可以在20万次弯折后,保持0.206左右的光栅曲率。 现场我们还能看到一款手机屏幕,支持分频显示,这款LTPO OLED屏幕可以进行2分频和3分频,也就是在一块屏幕上同时以不同的刷新率呈现不同的画面,比如上半屏以120Hz显示,下半屏以30Hz显示,这在不少使用场景中可以带来功耗的节省,据称IC功耗节省幅度在15%-20%。 TCL华星展示了一款集成了可见光及紫外线传感器的屏幕产品,这与当下消费者重视健康的消费趋势有很好的契合。 当然,在目前火热的VR/AR领域,TCL华星也亮出了不少产品,比如广视角色准增强COA-VR显示屏,据称这也是CF on Array技术首次应用在VR 1512PPI领域,可以比较好地改善大视角下的偏色问题,提高显示均匀性。 此外,TCL华星还展示了一款LCD-VR显示屏,其2124的PPI据称也是目前全球最高的,支持单眼4K和双眼8K显示,其PPD大于35,可以比较好地消除纱窗效应,提升沉浸感。 另外,TCL华星展示的0.26英寸硅基MicroLED显示屏也值得关注,其分辨率达到了5644PPI,屏幕亮度最高可以突破1000000nit。 结语:抓紧新兴显示技术和AI大模型,TCL华星要带飞中国显示产业 从此次TCL华星发布的一系列显示新品中我们不难看到,其在OLED技术、MLED技术等前沿显示技术领域有着较为深厚的布局,产品落地进度也走在行业靠前的位置上,同时在健康护眼等领域的重视也显示出他们对于用户体验的重视。 AI大模型在显示产业中的应用,也一定程度上对生产效率的提升产生着积极作用。 目前在全球显示技术领域,面对海外巨头,TCL华星、京东方等头部厂商正在快速追赶,在部分领域已经实现了超越,印刷OLED技术的逐渐成熟和落地,或许将成为中国屏幕产业“换道超车”的一个好机会。
谷歌深夜放复仇杀器Gemini,最强原生多模态史诗级碾压GPT-4!语言理解首超人类
【新智元导读】传说中的Gemini,终于在今天深夜上线了!「原生多模态」架构,是谷歌的史诗级创举,Gemini也如愿在多个领域超越了GPT-4。这场仗,谷歌必不能输。 谷歌的复仇大杀器Gemini,深夜忽然上线! 被ChatGPT压着打了整整一年,谷歌选择在12月的这一天,展开最强反击战。 多模态Gemini,迄今规模最大、能力最强的谷歌大模型,在文本、视频、语音等多个领域超越了GPT-4,是真正的一雪前耻。 人类有五种感官,我们所建造的世界、所消费的媒体,都是以这样的方式所呈现。 而Gemini的出现,就是迈向真正通用的AI模型的第一步! Gemini的诞生,代表着AI模型的巨大飞跃,谷歌所有的产品,都将随之改头换面。 塞进多模态模型的搜索引擎、广告产品、Chrome浏览器……这,就是谷歌给我们的未来。 多模态的史诗级创新 以前,多模态大模型就是将纯文本、纯视觉和纯音频模型拼接在一起,就像OpenAI的GPT-4、DALL·E和Whisper那样。然而,这并不是最优解。 相比之下,在设计之初,多模态就是Gemini计划的一部分。 从一开始,Gemini就在不同模态上进行了训练。随后,研究人员又用额外的多模态数据进行了微调,进一步提升了模型的有效性。最终,实现了「无缝」地理解和推理各种模态的输入内容。 从结果上来看,Gemini的性能要远远优于现有的多模态模型,而且它的功能几乎在每个领域都是SOTA级别的。 而这个最大、最有能力的模型,也意味着Gemini可以用和人类一样的方式理解我们周围的世界,并且吸收任何类型的输入和输出——无论是文字,还是代码、音频、图像、视频。 Gemini猜对了纸团在最左边的杯子里 Google DeepMind首席执行官兼联合创始人Demis Hassabis表示,谷歌一直对非常通用的系统感兴趣。 而这里最关键的,就是如何混合所有这些模式,如何从任意数量的输入和感官中收集尽可能多的数据,然后给出同样多样化的响应。 DeepMind和谷歌大脑合并后,果然拿出了真东西。 之所以命名为Gemini,就是因为谷歌两大AI实验室的合体,另外也一个解释是参考了美国宇航局的Gemini项目,后者为阿波罗登月计划铺平了道路。 首次超越人类,大幅碾压GPT-4 虽然没有正式公布,但根据内部消息,Gemini有万亿参数,训练所用的算力甚至达到GPT-4的五倍。 既然是被拿来硬刚GPT-4的模型,Gemini当然少不了经历最严格的测试。 谷歌在多种任务上评估了两种模型的性能,惊喜地发现:从自然图像、音频、视频理解到数学推理,Gemini Ultra在32个常用的学术基准的30个上,已经超越GPT-4! 而在MMLU(大规模多任务语言理解)测试中,Gemini Ultra以90.0%的高分,首次超过了人类专家。 Gemini是第一个在MMLU(大规模多任务语言理解)上超越人类专家的模型 MMLU测试包括57个学科,如数学、物理、历史、法律、医学和伦理,旨在考察世界知识和解决问题的能力。 在这50多个不同学科领域中的每一个中,Gemini都和这些领域最好的专家一样好。 谷歌为MMLU设定的新基准,让Gemini在回答复杂问题前,能够更仔细地发挥推理能力,相比于仅依赖于直觉反应,这种方法带来了显著提升。 在新的MMMU基准测试中,Gemini Ultra也取得了59.4%的高分,这一测试包括了跨越不同领域的多模态任务,这些任务需要深入的推理过程。 图像基准测试中,Gemini Ultra的表现也超过了之前的领先模型,而且,这一成就是在没有OCR系统帮助的情况下实现的! 种种测试表明,Gemini在多模态处理上表现出了强大的能力,并且在更复杂的推理上也有着极大潜力。 详情可参阅Gemini技术报告: 报告地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf 中杯、大杯、超大杯! Gemini Ultra是谷歌迄今为止创建的最强大LLM最大,能够完成高度复杂的任务,主要面向数据中心和企业级应用。 Gemini Pro是性能最好的模型,用于广泛的任务。它会为许多谷歌的AI服务提供动力,并且从今天起,成为Bard的支柱。 Gemini Nano是最高效的模型,用于设备端任务,可以在安卓设备上本地和离线运行,Pixel 8 Pro的用户就能马上体验到。其中,Nano-1的参数为1.8B,Nano-2为3.25B。 Gemini最基本的模型能做到文本输入和文本输出,但像Gemini Ultra这样更强大的模型,则可以同时处理图像、视频和音频。 不仅如此,Gemini甚至还能学会做动作和触摸这种更像机器人的功能! 以后,Gemini会获得更多的感官,变得更加有意识,更加准确。 虽然幻觉问题仍然不可避免,但模型知道的越多,性能就会越好。 文本、图像、音频精准理解 Gemini 1.0经过训练,可以同时识别和理解文本、图像、音频等各种形式的输入内容,因此它也能更好地理解细微的信息,回答与复杂主题相关的各类问题。 比如,用户先是上传了一段非英语的音频,然后又录了一段英语的音频来提问。 要知道,一般设计音频的归纳,都是用文字输入prompt。而Gemini却可以同时处理两段不同语言的音频,精准输出所需要的摘要内容。
真我 GT5 Pro 体验:起售价 3298 元,主摄级高质量长焦,一台性能也是旗舰级的拍照手机
12 月 7 日,真我正式发布了新一代旗舰产品真我 GT5 Pro,首销定价 3298 元起,有 4 个储存版本。 集齐旗舰元素的样子 真我 GT5 Pro 的后盖少了真我 11 Pro 上的花巧,感觉又像是回归到真我 GT 系列原有的素雅风格。后盖只保留了超大型的后置多摄模组,模组下有亮面处理的 realme Logo。 配色有赤岩、皓月和星夜三种,星夜的后盖用了附带星闪工艺的 AG 磨砂玻璃,透过融合磨砂后盖上的闪点来呈现出黑夜星空的效果。 皓白和我们手上的赤岩一样,都采用了类似荔枝皮纹路的科技纳米皮后盖。手机拿在手上摩擦感比较明显,科技纳米皮也比较耐脏,日常简单擦一下就可以。 随机附带的手机保护壳也从光滑的灰色光滑款变成了有类素皮纹路的哑光保护壳,质感提升了不少。 赤岩配色的机身整体颜色会暗一些,金属边框是接近暗红铜配色的效果。边框顶部做了金属拉丝纹理,并在纹理上添加了透明护盖,並為红外传感器和听筒做了开孔。 按键都集中在右侧,底部有卡槽、扬声器和更新到 USB 3.2 的 USB-C 接口。 真我 GT5 Pro 正面搭载了一块 6.78 英寸的 1.5K 京东方新一代 S1 定制柔性屏,屏幕的手动亮度最高能提到 1000nits,全局最高亮度能达到 1600nits,局部的峰值亮度最高能达到 4500nits。 屏幕支持了 Pro-XDR 高动态显示和爱优腾的杜比视界视频播放,在高亮度状态下支持 DC 调光。 低光状态下也有 2160Hz 高频 PWM 调光,屏幕自身也会确保在低亮度状态下的色彩表现。 刷新率方面,真我 GT5 Pro 用了 0.5Hz-144Hz 的 8T LPTO 智能刷新率技术。真我表示,手机刷短视频的时候是 60Hz,启动游戏才会开启 144Hz,而 0.5Hz 的模式使用在手机 AOD 显示上,进一步降低 AOD 显示的功耗。 屏幕顶部放置了一颗 3200 万像素的前置摄像头,这摄像头除了用来自拍和面部识别之外,还肩负起了掌纹识别和手势操作的工作。 性能是基本,操控有惊喜? 既然提到掌纹识别和手势操作,先来讲讲这部分。 真我 GT5 Pro 在指纹和面部的基础上新增了掌纹识别功能,掌纹录入的操作也面部识别类似,只要把手掌放到前摄像头前面,对准取景框固定几秒钟就能够完成录制。 录制完成后,熄屏状态下把手掌放在摄像头前 2-3cm 左右的位置悬空,手机识别到之后就会亮屏,并且会在摄像头下会呈现一个手掌形状的开锁 Logo,等它转完之后就完成解锁了。 当手机能够正常识别到手掌的话,那掌纹解锁的效率就跟面部识别的效率差不多。快速的话,手机识别完成后会跳过锁屏页,直接进入到主页面。 录入掌纹后,手机会自动跳转到手势设置的页面。真我提供了 12 种手势,里面有左右手势是滑动桌面、单指能隔空开启应用,加上比心和 OK 几个专用于抖音等常用 app 的手势。 当手机固定在无线充电板或充电底座上,用手势简单解锁看个信息或刷刷抖音,也不需要拿起手机。 说到充电,真我 GT5 Pro 在有线和无线充电上都给足了配置。 机身自带 5400mAh 电池和 SuperVOOC 电源管理芯片,支持有线的 100W 光速秒充还有 50W 无线闪充,出门前用十来分钟充个电就能够满电出门。 日常以拍照和游戏为主,偶尔刷刷微博抖音小红书的话,真我 GT5 Pro 一天下来也有 30-40% 剩余电量,不管是续航还是充电效率都不需要担心。 现在大部分性能旗舰都把重点放到有线充电上,越来越少机型会自带无线充电。真我这次给了 50W 无线充电的支持,那还是相当有诚意的。就算用户不打算另外购置专用的无线充电器,晚上睡觉前放在充电座也可以,免去了多插一次线的麻烦。 手机本身也支持 UFCS 融合快充,日常对有线充电器的要求也不高。 自带的 100W 充电器除了能给手机快充,也能充笔记本,要是充电器接头可以换成 USB-C 接口那就更完美了。 最后来看看性能,真我 GT5 Pro 搭载高通骁龙 8 Gen 3 移动平台,最高有 16GB 内存和 1TB 闪存的储存组合,支持最新的 GT 模式 5.0,用安兔兔能够跑到 215 万分以上,是标准的高通骁龙 8 Gen 3 旗舰水平。 打开 GT 模式跑最高画质设置的原神,我们用真我 GT5 Pro 在枫丹廷里面来回跑动,发现手机只要在完整加载完场地之后就基本不会卡顿,视角切换和操作都流畅。 偶尔会在播放必杀动画和场景完整加载完的时候会有些卡顿,但出现得并不频繁,整体操作以及静止时的动画播放依旧流畅。 底部的 USB-C 接口升级到 USB 3.2,用 Android 官方的文件传输工具来拷贝照片素材,读取和拷贝的速度都不错,1GB 左右的实测素材大概也就 30 秒左右完成。 旗舰级主摄,主摄级长焦 相机方面,真我 GT5 Pro 用了「超广+广角主摄+ 3x 长焦」的标准三摄组合,广角主摄和都堆足了料。 主摄搭载 5000 万像素 1/1.4 英寸的索尼 LYT-808 传感器,镜头光圈为 F1.69,搭载了超光影算法引擎,视频部分支持 8K 和 4K HDR 杜比视界视频拍摄。 得益于超光影引擎算法,主摄在保留高光暗部细节的同时不会大幅度扭曲现场光比。HDR 效果不明显,画面干净通透。暗部不至于完全变黑,墙身上还能看到纹路,整个照片也不至于变灰,画面中要保留的光影还在。 所以想要拍摄光影的话也不需要太刻意处理或后期,拍摄时简单压压曝光就能够出来效果。 真我 GT5 Pro 主摄呈现的线条细节刻画锐利,颜色会稍稍浓郁些。 等效 65mm 的 3x 长焦用上 5000 万像素、1/1.56 英寸的索尼 IMX890 这块主摄级传感器,镜头光圈是 F2.6,镜头边缘增加了大锯齿形状的结构,效果类似相机镜头的遮光罩,能够降低拍摄时炫光的影响。 镜头支持最近 25cm 的微距,拍摄弹性大不少。 最简单的就是用这 25cm 的微距加上 F2.6 的大光圈,真我 GT5 Pro 就很容易拍摄出这种浅景深大虚化效果。放大照片的话,对焦的位置也有不错的清晰度。 只要适应一下 2x 和 3x 的距离差异,用这个长焦就能够拍出不错的效果。 在长焦拍摄的人像模式效果中,空间距离的识别做得还可以,就算画面出现很多的空隙,手机基本都能够算对距离关系,观感上不那么容易穿帮。但光圈还是不能开得太大,不然会有明显的「抠图感」。 用人像模式拍摄静物的效果也很好,颜色鲜艳细节锐利,加上长焦的视角和虚化模拟,很容易就能够出片。 高像素传感器有利于裁切,真我 GT5 Pro 在这也提供了用 3x 长焦数码变焦出来的 6x 视角,变焦过后基本不影响画面细节显示。 真我 GT5 Pro 的超广角摄像头里搭载了一块 800 万像素、1/4 英寸的索尼 IMX355 传感器,光圈为 F2.2。成像风格和另外长焦、主摄一致,应对整体比较光亮的场景时画面会稍稍有点淡,但还不至于偏灰。 但拍摄时有明显的强光源还是要躲一下,不然炫光还是有些明显。 夜景方面,真我 GT5 Pro 搭载超光影引擎期间算法和 ProLight 超级夜景模式,能够从 RAW 域开始进行处理,对画面进行整体提亮的同时可以保留现场光比和画面光暗的自然过渡。 手机在弱光环境下的拍摄风格会和日间类似,照片有足够的对比度,不管是长焦还是主摄,处于暗部的建筑放大后依旧能看清楚窗户的细节,没有明显噪点和涂抹感。 长焦拍摄的夜景,细节锐利,像是高架桥下的树依然能看到纹理。手机在拍摄时也不需要把快门降得很低,1/52s 的快门速度配合大底大光圈,依旧能出来干净光亮的画面。 拍照变好的性能机,和性能很好的拍照手机 当性能旗舰的性能部分都已经进化到贴近天花板的时候,厂商们不约而同地将目标转移到性能旗舰的拍照上。 换上更好的传感器和旗舰机型的算法技术,然后在 Pro 款定位的机型上一个能打的长焦,这样就成了现阶段性能旗舰的影像强化流程了。 确实,真我 GT5 Pro 也在跟着这个方向走。 手机有最高 1TB 的闪存芯片和一块高质量的高刷高亮 1.5K 屏幕,用上了高通骁龙 8 Gen 3 旗舰移动平台,性能跑分能达到 215 万分以上。机身配备 100W 有线快充和 5400mAh 的大电池,真我甚至还补充上了 50W 的无线快充,不管是性能表现还是续航都是打好打满的状态。 虽然没有配上 24GB RAM 的话可能有点不够「旗舰」,但如果你对于应用超长时间留存有非常极限的要求,或者是没有同时打四五个游戏的需要,那 16GB RAM 放到现在的环境还是非常够用的。 相机的部分,我觉得真我 GT5 Pro 不仅仅实现「性能旗舰拍照提升」的目标,更是把拍照做成了自己的优势项。 有了旗舰级的传感器,获得了旗舰图像算法和技术,照片能在信息量、影调和风格中取得了平衡。就算是经常被性能旗舰机忽略的长焦,这次也升级到了主摄级别。 要说真我 GT5 Pro 是一款「拍照变强了的性能旗舰」,可能不那么合适。用了它来拍照之后,我觉得真我 GT5 Pro 应该是一款「性能配置都升级到旗舰水平的拍照手机」。 最后来看看定价: 12GB+256GB 售价 3399 元,首销价 3298 元; 16GB+256GB 售价 3699 元,首销价 3598 元; 16GB+512GB 售价 3999 元,首销价 3898 元; 16GB+1TB 售价 4299 元,首销价 4198 元。
Google 史上最强大模型 Gemini,真的全面碾压GPT-4 吗?
昨天深夜,Google 突然发布重磅 AI 杀手锏——Gemini。 多模态 Gemini 可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。 在去年 ChatGPT 发布不到两周后,Google 就已经拉响「红色警报」来应对挑战。可紧急上线的 Bard ,却在首次亮相就出现错误,一夜让 Google 蒸发了 1000 亿美元市值。 在过去的一年里,基于大模型的聊天机器人单月访问量已经超过 20 亿, 其中 ChatGPT 遥遥领先,Google Bard 虽然排在第二,但和几个竞品一起归为「其他」更为合适。 ▲ 图片来自:The Information 因此,Gemini 早已被寄予了赶超 ChatGPT 的厚望,无论成败,它就是 Google 过去对 AI 大模型孤注一掷的成果。 能看、能说、能推理 Gemini 1.0 共官宣中杯、大杯、超大杯三种不同规格。 中杯:Gemini Nano —— 最高效的设备任务模型 大杯:Gemini Pro —— 适用于广泛的任务扩展的最佳模型 超大杯:Gemini Ultra ——最大且最能胜任高度复杂任务的模型 暂且抛开繁杂的参数信息,先来用几个案例让你全面了解 Gemini 的能力。 当你随手画个鸭子,从曲线到鸭子成型,Gemini 都可以精准识别。给鸭子画条波浪线,它能理解你的言外之意,精准地指出鸭子在水中游泳的场景答案。 同时它还能人性化地模仿鸭子的叫声,即使是用流利的普通话说出鸭子的叫法也不在话下。 闲着无聊,也可以和 Gemini 玩个游戏,你的手指指向哪个区域,Gemini 就能说出那个国家及其代表性的事物。 三仙归洞,猜猜纸球在哪个杯子下面,手速再快,也躲不过 Gemini 的「眼睛」。 拿到纱线却毫无头绪,别急,Gemini 聪明的大脑在看到纱线的那一刻,就已经把成品给你安排上,你只需要「照猫画虎」就好了。 识别图像还只是 Gemini 的基础水准,看到乐器,Gemini 还能生成符合环境氛围的音乐, 逻辑和谜题解决、图像序列分析、魔术技巧解释、记忆和逻辑,这些能力 Gemini 样样都有,样样精通。 Google 也发布了文字演示版本,若你不想看视频,可以访问 https://developers.googleblog.com/2023/12/how-its-made-gemini-multimodal-prompting.html 查看。 或许是这个视频过于震撼,部分网友质疑 Google 这个视频存在「造假」的可能性,不过 Gemini 将很快在 Google AI Studio 中向公众开放,届时便能一辩真假。 多模态 Gemini VS GPT-4 据 Google 官方显示,从自然图像、音频和视频理解到数学推理,Gemini Ultra 的性能在 32 个广泛使用的大型语言模型(LLM)研究和开发的学术基准测试中,超过了 30 个当前最先进的结果。 从 Google 放出的测试结果来看,在文本、常规推理、数学、代码等领域,Gemini 的表现几乎是全方位碾压了 OpenAI 的 GPT-4。 MMLU(大规模多任务语言理解)是测试 AI 模型知识和解决问题能力的最流行方式之一。Gemini Ultra 在该测试中以 90.0% 的准确率成为首个超越人类专家的模型,作为对比,GPT-4 只有 86.4% 的准确率。 新的 MMMU 基准测试包含了跨不同领域的多模态任务,对多模态大模型的检验程度更高,但超大杯 Gemini Ultra 同样取得了 59.4% 的高分。 Google CEO Sundar Picha 在接受《麻省理工学院技术评论》的采访时表示,Gemini 之所以令人瞩目,其中一个重要原因是它从根本上就是一个多模态模型,就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习。 多模态特性是 Gemini 花时间打磨的原生特性,Gemini 1.0 能同时识别和理解文本、图像、音频等多种信息,理解信息能力更强,在回答与复杂主题相关的问题也能游刃有余。在多模态 SOTA 的测试中,Gemini 图像、视频、音频的多模态测试水准再次遥遥领先。 代码是检验大模型水平的重要指标之一,Gemini 1.0 跨语言工作和推理复杂信息的能力是它的强项,能够理解诸如 Python、Java、C++ 等高质量代码。两年前,Google 推出了 AlphaCode,这是首个在编程比赛中达到竞争水平的 AI 代码生成系统。 现在, AlphaCode 推出了第二代,这是一个由 Gemini 微调的竞争性编码模型,在与原始 AlphaCode 在相同的平台上较量时,AlphaCode-2 在人类竞争对手中的得分为 87%,而此前 AlphaCode 的得分只有 46%。 AlphaCode-2 技术报告地址 :https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf 在技术报告中,Google DeepMind(AlphaCode 2 出品人)分享了大量关于推理时搜索、过滤和重新排名系统的细节。英伟达高级科学家 Jim Fan 直夸这些最新成果堪称 Google 的 Q*(可以简单理解为 AI 的大突破)。 thehiredai CEO Arman 大胆地作出预测:「Gemini AI 刚刚杀死了 ChatGPT!」 值得一提的是,Google 还宣布推出迄今为止最强大、最高效、最可扩展的 TPU 系统:Cloud TPU v5p。 ▲ Cloud TPU v5p Gemini 1.0 的训练正是在 Google 内部设计的 Tensor 处理单元(TPUs)v4 和 v5e 的 AI 优化基础设施上进行的。 Google Cloud CEO Thomas Kurian 对于自家产品,毫不吝啬地夸赞道:「Cloud TPU v5p 是我们迄今为止功能最强大、可扩展性最强的 TPU 加速器,其训练模型的速度比其前代产品快 2.8 倍。」 手机大模型的新玩家 手机是新技术破圈的重要媒介,Gemini 想要大规模走进大众社会,Pixel 8 一定是其不二之选。 Pixel 8 Pro 作为第一款内置人工智能的手机,已经在高新技术民用化的道路上建立了良好的口碑,从已经上手 Pixel 8 Pro 的用户反馈看,Google 把 AI 和手机终端应用结合得相当不错。 在此基础上,Google 官宣中杯大模型 Gemini Nano 从今天开始,将在 Pixel 8 Pro 上正式运行。 消息一出,PassionateGenius CTO Morimoto 已经迫不及待想要体验在 Pixel 8 上跑大模型了。 作为首款专为 Gemini Nano 设计的智能手机, Pixel 8 Pro 有两项专属的拓展功能将在后续的更新中加入:「记录器摘要」和「Gboard 智能回复」。 即使没有网络连接,记录器也可以获得手机对话录音、采访、演示等内容的摘要,强大的终端硬件是支撑这个功能的依托,而优化的侧端算法让「断网不断线」成为了可能。 智能回复功能很像我们挂断电话后的自动回复,但和传统的固定内容相比, Gemini Nano 可以识别来信的内容,根据不同的语句生成对应的回信,语言也会更加自然亲切,有种明星的运营团队在社交平台回复粉丝的即视感。 这两项功能目前只支持英文文本的识别,但转头一想对本身就买不到 Google 手机的我们好像也没有任何影响,不过能买到 Pixel 8 Pro 的非英语国家的用户,还需要再静候一段时间。 而在生产力方面的优化,在大洋彼岸 Pixel 终于赶上了国内的基本水平。 类似的照片和视频的 AI 编辑功能在新机首发时,就成了 Google 新机的代名词,现在继续优化的 AI 编辑优化,可以让手机再加一件「专业编辑器」的新装。 全新清洁功能可以帮助去除扫描文档中的污迹、污渍和折痕。现在只用在相册里滑动几下,即可消除图片中的污渍。 借助 Google Tensor G3 的强大功能,Pixel 8 Pro 上的视频增强模型,可在云端调整颜色、照明、稳定性和颗粒度。 从官方展示的对比看,视频被加了一层「鲜明」滤镜,颜色更饱满,明暗对比度更高,特别是在夜晚暗光环境中,这种 AI 优化的效果会更明显。 相较视频的编辑,图像美化应该是更多人的期待,特别是在拍动态物体的时候,模糊的画面总会让你在事后翻阅时留下一些遗憾,升级的 AI 编辑可以将 Google 照片中的模糊全部消除。 以后记录自家宠物的高光时刻,不用担心相机没聚焦带来的焦虑了。 此外,Google 将多设备之间的联动也进行了升级。Pixel Watch 能够成为手机解锁的另一种方式,也能帮你忽略不需要的来电,或接听电话之前确认对象以及通话原因。 如果你能买到 Pixel 8 Pro,或者已经是 Google 手机的用户,可以尝试检验一下这些新功能,会不会成为你购买或继续使用 Google 的推动力。 从今天开始,通过全新升级的 Gemini Pro 版本,Bard 将实现更高级的推理、规划、理解等功能。它将在超过 170 个国家和地区提供英文版本。 在接受《麻省理工学院技术评论》的采访时,Sundar Pichai 还说到:「Gemini Pro 在基准测试中的表现非常出色,当将其集成到 Bard 中时,我可以亲身感受到它的优势,我们一直在对它进行测试,所有类别任务的好评率都有显著的提升,因此,我们将其称为迄今为止最大的升级之一。」 ▲目前 Bard 已使用 Gemini Pro 版本,图片来自 X 用户 @gijigae 在接下来的几个月里,Gemini 还会陆续上线 Google 旗下更多的产品和服务,比如搜索、广告、Chrome 和 Duet AI 等。 从 12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。 目前,Gemini Ultra 已经在内测中,并打算明年初推给开发者和企业用户,明年初,Google 还将推出 Bard Advanced,让更多的普通用户用上最强的 Gemini Ultra。 Google CEO Sundar Pichai 在发布 Gemini 时说到: 每一次技术转变都是推进科学发现、加速人类进步和改善生活的机会。 我相信我们现在看到的与 AI 有关的转变将是我们一生中最深远的,远大于之前的移动或网络的转变。 想要实现 AGI(通用人工智能),就需要 AI 做到像人类一样从容地解决不同领域、不同模式的复杂任务,在这个过程中,除了基本的计算、推理等基础能力,相对应的文字、图像、视频等多模态能力也要跟上。 DeepMind 曾提出 AGI 的评估和分类的框架,前两个阶段分别是: AGI-0:基本的人工智能,能够在特定的领域和任务上表现出智能,如图像识别、自然语言处理等,但是不能跨领域和跨模态地进行学习和推理,也不能与人类和其他 AI 进行有效和自然的沟通和协作,也不能感知和表达情感和价值。 AGI-1:初级的通用人工智能,能够在多个领域和任务上表现出智能,如问答、摘要、翻译、对话等,能够跨领域和跨模态地进行学习和推理,能够与人类和其他 AI 进行基本的沟通和协作,能够感知和表达简单的情感和价值。 Gemini 的演示视频,充分展现了它对各个模态交互的深刻理解,能看、能说、能推理、能够感知和表达简单的情感和价值,也让我们看到了 AGI-1 的潜在可能性。 本文由李超凡、肖凡博、莫崇宇合写
对话TCL华星CEO赵军:从面板制造商到解决方案商,印刷OLED成中国显示产业突围关键
作者 | 云鹏 编辑 | 云鹏 智东西12月7日报道,今天上午,TCL华星在全球生态大会上发布了全球首款65英寸8K印刷OLED曲面显示器、全球首款14英寸2.8K印刷Hybrid OLED笔电屏、全球首个1727PPI的Real RGB LTPO-VR LCD显示模组等一系列重磅显示新品以及全球首款半导体显示垂域大模型,据称其在半导体显示领域的能力要超越GPT-4,并这一大模型支持私有化部署。 在大会结束后,智东西同少数业内媒体一起与TCL科技高级副总裁、TCL华星首席执行官赵军进行了深入交流,对显示产业的新趋势、技术发展方向、市场变化以及TCL华星的产品、技术布局进行了进一步探讨。 一、从面板制造商到显示解决方案提供商,研发人员要做“工程商人” 赵军提到,目前TCL华星正从面板制造商到显示解决方案提供商转变,最核心的是顺应市场趋势,挖掘消费者的需求和痛点,用户到底需要的是什么?并依据这些展开产品和技术的研发。 TCL创始人李东生曾提到,研发人员要做“工程商人”,而不仅仅是工程师,产品和技术要能够真正进行商业化落地。 过去几年TCL华星最主要的变化是业务日趋多元化,此前主要是以TV为主,但目前TCL华星在全品类和各个尺寸都有产品和解决方案布局,拓展了平板、商显、车载、VR/AR等应用领域。 在这些应用领域,传统的思维方式需要转变,对于客户需求的挖掘是非常重要的, 在OLED等新技术领域,TCL华星与终端厂商一起进行前沿技术的联合研发,这个过程中,TCL华星自己的产品性能也得到了比较明显的提升。 比如在与小米的合作中,TCL华星在手机AMOLED领域有不少亮眼的产品推出,在高分辨率、低功耗、护眼方面都推出了一些新产品和新技术。 今年TCL华星在OLED领域,市场份额、市场影响力、产品技术等方面都有比较明显的提升。 二、武汉成TCL华星新一代技术孵化中心 赵军在交流中提到,武汉在TCL华星的业务布局里有非常重要的角色,尤其是在中小尺寸屏幕领域,从手机、车载到专用显示,t3和t5已经成为全球最大的LTPS产业集群,t4也成为中国在OLED领域一个重要的增长点。 未来TCL华星会继续在武汉进行投资,例如对t4产线仍然会进行10亿规模的投资,提高高端产品的产能,未来t4也会重点布局高端OLED产品。 据了解,TCL华星已经把印刷OLED的中台放到了武汉,武汉会是TCL华星新一代显示技术的孵化中心。 TCL华星目前比较重视产业链生态的建设。此外,TCL华星比较重视与武汉当地的科研机构、高校进行联合技术开发,武汉当地的优秀人才资源、科研人才力量也是TCL华星技术进步的关键动力。 三、TCL华星车载研发团队工程师超200人,2023年车载业务增长翻倍 车载是当下较为火热的显示赛道之一。据了解,TCL华星的车载显示业务在过去三年一直保持比较高的增长,并且这一市场的增长潜力很大,产品附加值也在提升。 TCL华星在车载显示领域投入了不少资源,例如t5工厂的主要产品之一就是车载产品,针对车载产品进行了特别的优化。 车载显示屏相较手机大很多,工厂也对相应的工艺进行了优化,对于大尺寸车载显示屏生产效率的提升有一定帮助。 据赵军透露,TCL华星负责车载产品的研发工程师团队已经超过了200人。 在车载产品领域,性能、性价比都会是未来TCL华星据聚焦的重点,印刷OLED技术在车载产品中的应用也在探索之中,多技术、多产线的产业集群是后续TCL华星要打造的。 赵军提到,今年TCL华星车载业务在海外业务的发展也进入了快车道,拿到了不少欧洲主流车厂的车载项目订单。在车载显示领域做到全球领先,是TCL华星未来的主要目标之一。 赵军透露,TCL华星2023年车载业务成长的幅度在1倍以上。 四、电竞市场保持高增长潜力,HVA+IPS两条腿走路,印刷OLED产品在路上 目前电竞显示器是增长比较迅速的一个品类,对此赵军谈到,目前电竞显示器市场增长潜力是比较大的,TCL华星对这块业务也是比较有信心的。 在电竞显示器领域,TCL华星的主要规划大致分为两方面,一方面是强化HVA这种传统优势技术品牌方面的竞争力,包括跟客户进行新品和新技术的联合研发,跟客户一起定义HVA产品的技术和方向。 据了解,随着t9工厂的量产,TCL华星也会加大在IPS电竞方面的投入和拓展,今年TCL华星开发了多款基于IPS技术的电竞产品。整体来看,TCL华星的策略是“两条腿走路”,把自身在电竞显示器领域的综合能力进行一个巩固和强化。 同时,赵军也提到,在更新的印刷OLED技术方向上,TCL华星也在电竞方面做了更多开发,基于印刷OLED技术的电竞显示产品也在研发之中。可以预见,TCL华星未来大概率会成为行业内首批量产印刷OLED电竞显示产品的厂商。 五、印刷OLED明年下半年落地,首批聚焦IT OLED、医疗专显产品,OLED市场长线看好 对于华星目前重点押宝的印刷OLED技术,赵军进行了进一步解读。 目前TCL华星印刷OLED相关技术和产线的建设都进入到提速阶段。目标是明年下半年实现量产,中间会有很多节点,例如设备调试、产线贯通、技术导入验证,未来任务会很重,时间紧迫。 印刷OLED方面量产的第一批产品会以IT OLED产品、医疗专显产品为主,赵军透露,目前已经有多家客户针对TCL华星的印刷OLED产品表明了积极合作意愿。 在目前的OLED领域,TCL华星也是主要的蒸镀OLED厂商之一,过去一年在OLED产能、良率等方面提升还是较为明显的,终端厂商对于TCL华星的高端OLED产品表示认可。 赵军提到,TCL华星跟国内和全球主流智能手机厂商都保持合作。 对于2024年OLED市场的发展趋势,TCL华星持乐观态度,中高端的OLED产品应用会越来越多,手机领域的刚性OLED渗透率已经超过50%,目前OLED已经成为智能手机屏幕领域的主流技术方向。 除了智能手机,平板、笔电、车载领域的OLED应用也在快速增加,这也给OLED技术的迭代带来了积极推动。
iPhone 15价格跳水后中国销量霸榜前三:年轻人首选苹果,换机越来越理性
快科技12月7日消息,苹果中国官方多次降价后,iPhone 15的销量也是有了效果。 据统计,iPhone15自发布以来,在各渠道连续多次降价,经历多轮价格跳水的iPhone15,全系销量提升,霸榜手机金榜前三。 数据显示,本次iPhone15销量的提升,00后作用显著。艾瑞咨询报告称,相比普通用户,Z世代年轻人群换机频率显著更高,近七成会选择在1年内换手机。 作为消费主力军,00后在更换iPhone等电子产品时越来越理性。 值得一提的是,国内越来越多年轻人在购买iPhone时,会首选官方渠道,而这个现象在00后上更为明显。 此外,今年9月国内手机出货量同比大涨近六成。多个市场咨询报告也显示,国内手机市场在回暖,确实越来越多国人在换机了。 对于这个现象,有专业人士表示,因为今年秋季多个市场品牌发布旗舰机型,包括华为发布Mate 60系列,市场大卖;再加上日益成熟的折叠屏受到不少消费者的青睐,刺激了消费者购买欲望。 产业链也表示,这波换机潮,主要是高端手机刺激的,特别是以苹果iPhone 15和华为Mate 60等拉升,这其实也就解释了,为什么相比之前,国人换机均价提升800元,来到了近3500元左右。 此外,在换机人群中,淘汰换新是最广泛、最日常的购机场景,占比达34%;新品尝鲜占比21%,他们总会希望第一时间到手尝鲜。这样算下来,这两者占换机用户一半以上。
早报|超越 GPT-4,Google 发布大模型 Gemini/苹果明年初或将推出多款新品/五月天阿信回应假唱风波
Google 发布最强 AI 大模型 Gemini 英伟达 CEO 黄仁勋:华为是英伟达在 AI 芯片领域的强大竞争对手 英伟达智能驾驶快速扩张人手 苹果据悉寻求在印度生产 iPhone 16 电池 Sam Altman :OpenAI 正在重新思考公司结构 马斯克的人工智能公司 xAI 寻求 10 亿美元融资 字节跳动以每股 160 美元开启新一轮回购 王健林拟转让万达投资 51% 股权 蔚来汽车正计划分拆电池制造业务 苹果准备推出新款 iPad 和 MacBook Air 苹果发布开源模型的运行软件框架 MLX 引入代码解释器、DALL·E 3,微软 Copilot 重磅升级 8.88 万元起,五菱星光正式上市 阿信发长文回应假唱风波 周杰伦加盟环球音乐 G-SHOCK 与 Rich Brian 联手推出特别合作表款 《弗洛伊德的最后一会》发布预告 美国演员工会正式批准新合约 三部皮克斯电影将首次北美上映 Google 发布最强 AI 大模型 Gemini 当地时间 12 月 6 日,Google CEO 桑达尔・皮查伊(Sundar Pichai)官宣 Gemini 1.0 版正式上线。据介绍,这是 AI 模型的巨大飞跃,最终将影响几乎所有的 Google 产品。 Gemini 大模型包括三种量级:能力最强的 Gemini Ultra,可扩展多任务的 Gemini Pro 以及适用于特定任务和移动设备的 Gemini Nano。 Google DeepMind 首席执行官兼联合创始人 Demis Hassabis 表示,Gemini 是一个多模态大模型,这意味着它可以概括并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。 据介绍,从自然图像、音频和视频理解到数学推理, Gemini Ultra 在大型语言模型研发中被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过了目前最强的大语言模型 GPT-4。 Gemini Ultra 在 MMLU(大规模多任务语言理解数据集)中的得分率高达 90.0%,首次超越了人类专家。MMLU 结合了数学、物理、历史、法律、医学和伦理学等 57 个科目来测试大模型的知识储备和解决问题的能力。 Google 将在其产品中添加 Gemini。从今天开始,Bard 将使用 Gemini Pro 的微调版本来执行更高级的推理、规划、理解等。这是 Bard 自推出以来最大的升级。 Google 还将 Gemini 引入了 Pixel。Pixel 8 Pro 将是第一款运行 Gemini Nano 的智能手机。 在接下来的几个月中,Gemini 将出现在 Google 更多的产品和服务中,例如搜索、广告、Chrome 和 Duet AI。 英伟达 CEO 黄仁勋:华为是英伟达在 AI 芯片领域的强大竞争对手 据彭博社报道,英伟达首席执行官黄仁勋表示,在生产最好的人工智能芯片的竞争中,华为是英伟达「非常强大」的竞争对手之一。 周三,黄仁勋在新加坡接受采访时表示,华为、英特尔和不断壮大的半导体初创公司对英伟达在人工智能加速器市场的主导地位构成了严峻挑战。 「我们在中国内外都有很多竞争对手」,黄仁勋说,「我们大多数竞争对手并不关心我们在哪里,无论我们走到哪里,他们都想与我们竞争」。 黄仁勋透露,英伟达正在与美国政府密切合作,确保面向中国市场的新芯片符合出口限制。 英伟达智能驾驶快速扩张人手,要求两个月内入职 100 个新人 据 36 氪,12 月 4 日,上任近 4 个月的吴新宙在英伟达上海办公室召开了中国区全员大会。 会上,他指出了英伟达智能驾驶「落后」的原因,同时开始快速扩张人手,要求两个月内入职 100 个新人,「考虑到春节假期影响,半年内必须实现该目标」。 日前,吴新宙在朋友圈转发了英伟达官方发出的招聘信息,显示英伟达中国团队正在寻求自动驾驶软件组、自动驾驶平台组、系统集成&测试组、地图&仿真组、产品组五个部门的 25 个岗位,共上百个职位。 据透露,此次参会的英伟达中国区智驾人员近 300 人,加上即将新招募的 100 人,有望组成英伟达智能驾驶的核心团队。 吴新宙曾在小鹏汽车担任自动驾驶副总裁,全面主导小鹏智驾的核心团队、技术架构、业务走向,也帮助小鹏在国内最早交付量产高速 NOA、城市 NOA 高阶智能驾驶产品。 今年 8 月 25 日,吴新宙离开小鹏汽车,加入芯片巨头英伟达。据了解,吴新宙已经全权接管了英伟达的智驾软件业务,向英伟达创始人兼 CEO 黄仁勋直接汇报。 苹果据悉寻求在印度生产 iPhone 16 电池 据《金融时报》,知情人士透露,苹果公司已通知零部件供应商,其倾向于从印度工厂采购 iPhone 16 的电池。 三名知情人士表示,中国德赛等电池制造商被鼓励在印度建立新工厂,而新普科技则被要求扩大在印度的生产规模,以应对未来的订单。 「如果 iPhone 16 电池供应一切顺利,苹果计划将更多的 iPhone 电池生产转移到印度」。 此外,印度信息技术部副部长 Rajeev Chandrasekhar 本周在 X 平台上表示,苹果的日本供应商 TDK 正在印度北部哈里亚纳邦建立建立一家制造工厂,生产用于印度制造的 iPhone 的电池。 据了解,德赛和新普等公司将 TDK 及其同行生产的电池封装成模块,然后发送给富士康等组装商。 Sam Altman :OpenAI 正在重新思考公司结构 据日经新闻,OpenAI 创始人 Sam Altman 昨日在一场人工智能活动上表示,正在重新考虑公司的「盈利和非盈利」混合结构。 几周前,Altman 突然被 OpenAI 董事会赶下台,但上周又重返公司担任 CEO。这场会议也是他重返公司后的首次公开露面。 Sam Altman 说:「这个结构显然有一些缺陷,我们的新董事会正在认真思考什么是最适合我们使命的公司结构」。 Altman 向与会者表示,他被罢免「令人震惊」,不过他拒绝回答有关秘密人工智能项目的问题。此前有报道称,该项目与董事会罢免他的决定有关。 马斯克的人工智能公司 xAI 寻求 10 亿美元融资 马斯克的人工智能初创公司 xAI 向美国证监会(SEC)提交的文件显示,该公司拟通过发行股票融资至多 10 亿美元。文件称,该公司已从四位投资者那里筹集了近 1.35 亿美元。 马斯克于今年 7 月成立 xAI 公司,他宣称该公司的使命旨在「了解宇宙的真正本质」。 上个月,xAI 发布了一款名为 Grok 的聊天机器人,相较于 ChatGPT 、 Bard 和 Bing Chat,马斯克认为 Grok 最大的不同是存在幽默感。xAI 表示,Grok 可以通过 X 平台实时访问信息,这与其他模型相比具有巨大的优势。 马斯克 12 月 3 日在 X 平台上发文称,将在未来一周左右向 X 的 Premium+ 用户开放 Grok 的访问权限,优先顺序取决于订阅的时间。 字节跳动以每股 160 美元开启新一轮回购 据《南华早报》报道,知情人士透露,由于 IPO 计划仍悬而未决,字节跳动拟从投资者手中回购价值 50 亿美元的期权。 消息人士称,本次回购价格为每股 160 美元,该价格与今年 10 月字节跳动员工期权回购价格相当。 这使得该公司估值为 2680 亿美元,相比一年前股东回购时的 3000 亿美元估值,跌幅约 10%。 据 The Information 此前报道,字节跳动第二季度收入同比增长超过 40%,达到 290 亿美元,正在追赶 Facebook 母公司 Meta。 王健林拟转让万达投资 51% 股权 昨日,万达电影公告,公司间接控股股东北京万达文化产业集团有限公司及其全资子公司北京珩润企业管理发展有限公司、公司实际控制人王健林先生拟将其合计持有的公司控股股东北京万达投资有限公司 51% 股权转让予上海儒意投资管理有限公司。 若上述事项最终实施完成,将会导致公司控制权变更。 公告称,公司股票 12 月 6 日(星期三)开市起停牌,预计停牌时间不超过 2 个交易日。 值得注意的是,此前,港股中国儒意曾于 7 月 23 日公告,上海儒意(中国儒意的受控制结构实体)22.62 亿元受让北京万达投资 49% 股权。 蔚来汽车正计划分拆电池制造业务 据路透社报道,两名消息人士透露,蔚来汽车正计划分拆电池制造业务为单独新公司并对外进行融资,作为该公司争取尽快扭亏为盈、减少成本的努力举措之一。 根据该计划,蔚来电池部门的顶级工程师将加入新公司,而一些员工将合并到蔚来的其他部门。 知情人士称,拟分拆到新公司的资产可能包括规划中的电池工厂、测试设备及一些专利。 据悉,分拆最早可能在今年年底进行,并将寻求外部投资者,估值将在稍后决定。 苹果计划在明年 3 月推出 iPad Air、iPad Pro 和 M3 款 MacBook Air 据彭博社记者 Mark Gurman 报道,为扭转 Mac 和 iPad 销量下滑的局面,苹果正在为明年年初的几款新机型和升级做准备。 据知情人士透露,此次更新包括 iPad Air、iPad Pro 和 MacBook Air。 新款 iPad Air 将首次推出 10.9 英寸和 12.9 英寸两个版本,Pro 机型将配备 OLED 屏幕,与此同时,MacBook Air 将配备速度更快的 M3 处理器。 此外,苹果正在准备新版 Apple Pencil 和 Magic Keyboard 配件,这些配件将与新款 iPad Pro 一起销售。 iPad 及相关配件预计将于明年 3 月底左右推出,同时还将推出 iPadOS 17.4;Mac 与 macOS 14.3 一起开发,该软件更新可能会在明年一月底到二月之间发布,但 MacBook Air 可能要到三月份才会发货。 苹果发布开源模型的运行软件框架 MLX 昨日,苹果机器学习研究团队推出了开源模型的运行软件框架 MLX。 这是一个专为苹果 M 系列芯片设计的高效机器学习框架,也就是说配备 M 系列芯片的设备,能够更有效地进行深度学习训练。 据 GitHub 主页显示,MLX 包括 Python API、C++ API,具有用于自动微分、自动矢量化和计算图优化的可组合函数转换。 采用惰性计算,动态构建计算图,支持多设备,并且统一内存。 英伟达高级科学家 Jim Fan 指出,这可能是苹果迄今为止在开源人工智能方面的最大举措。 引入代码解释器、DALL·E 3,微软 Copilot 重磅升级 近日,微软宣布 Copilot 迎来一系列重磅更新。包括集成 OpenAI 最新模型 GPT-4 Turbo、DALL-E 3、新的代码解释器功能以及 Bing 内部的深度搜索功能。 Copilot 很快就能使用 GPT-4 Turbo 模型进行响应,这意味着将支持 128k 长度的上下文窗口。 微软执行副总裁 Yusuf Medhi 表示,该模型目前正在待定用户中进行测试,并将在未来几周内广泛集成到 Copilot 中。 此外,更新后 DALL-E 3 模型也将集成到 Copilot 中,从而提供更高质量、更准确的图像。 新的代码解释器功能将使 Copilot 用户能够获得更准确的计算、数据分析甚至代码。 用户还可以在 Copilot 上传和下载文件,这样就可以使用自己的数据和代码,以及必应的搜索结果。 在 Bing 方面,Medhi 表示,「深度搜索利用 GPT-4 的强大功能,为复杂主题提供优化的搜索结果。使用深度搜索可将搜索查询扩展为更全面的描述,从而提供更相关的结果」。 8.88 万元起,五菱星光正式上市 昨日,五菱星光正式上市,定位超 A 级家轿,新车提供 70 和 150 km 两种续航(CTLC)版本可选,价格分别为 8.88 万元和 10.58 万元。 五菱星光采用「星翼美学」设计理念,配有展翼式前格栅、星彩灯组、全 LED 自动大灯、星环尾灯。新车轴距为 2800mm,长宽高分别为 4835mm、1860mm、1515mm。 内饰方面,新车提供玄黑深色、流沙拼色两种内饰,前排座椅向后放倒 180° 可以与后排坐垫齐平; 70 标准版车型配备 10.1 英寸悬浮智能中控屏 + 7 英寸全液晶仪表屏,150 进阶版提供 15.6 英寸智能中控屏 + 8.8 英寸全液晶仪表屏。 动力方面,五菱星光搭载「五菱灵犀混动系统」,风阻系数 0.228cd,WLTC 标准综合油耗号称低至 3.98L / 100km,百公里用车成本仅 33.5 元。 阿信发长文回应假唱风波 昨晚,五月天主唱 @阿信 发长文回应假唱风波:「每次的嘶吼,每一场,每一声,都来自于我依赖了 24 年的嗓子。除了真唱,否则没有其他感动你的方式」。 「明年就是五月天出道 25 周年,这当然不是我们航行过的第一场风雨。谢谢每位为我们挺身而出的旧识,更感谢所有给我们指教的路人老师,派对会结束,曲终之时,你我的心与眼神将更加清澈」。 周杰伦加盟环球音乐 昨日,环球音乐集团宣布,与杰威尔音乐达成重磅战略合作伙伴关系。 环球音乐集团将获得周杰伦经典曲库及未来新发行作品的全球发行权利,同时还包括两位杰威尔音乐旗下的潜力新人派伟俊和曹杨的加盟。 此外,杰威尔音乐日前曾表示,周杰伦新歌将于 12 月 22 日上线。 G-SHOCK 与 Rich Brian 联手推出特别合作表款 正值 40 周年重要时刻的经典腕表品牌 G-SHOCK,此次联手人气说唱歌手 Rich Brian,打造了合作款腕表。 此番合作,双方以品牌标志性的 GA-2100 系列作为模版,打造出以蒂芙尼蓝配色覆盖的全新个性表款。 同时通过表盘上亮红色的品牌字样刻字、指针等细节点缀,营造出极具对比感的色彩对撞视觉。 《弗洛伊德的最后一会》发布预告 《弗洛伊德的最后一会》发布正式预告。安东尼·霍普金斯饰演西格蒙德·弗洛伊德,马修·古迪饰演 C·S·刘易斯。 1939 年 9 月 3 日的伦敦,刚刚带着女儿逃离纳粹政权的弗洛伊德在弥留之际,迎来了刘易斯的到访。20 世纪最伟大的两位思想家就人类未来的信仰和上帝的存在展开了一场不朽的对话。 影片由马特·布朗执导,改编自马克·圣·杰曼创作的舞台剧,将于 12 月 22 日在北美限定上映,2024 年 1 月全面上映。 美国演员工会正式批准新合约 美国演员工会和广播电视艺人联合工会 (SAG-AFTRA) 最新通过成员投票表决,正式批准一个月前与电影电视制片人联盟 (AMPTP) 谈成的三年新合约。 工会 16 万名成员有 38% 提交了投票,其中 78.33% 为赞成票,因为合约在 AI 等方面产生了一些争议,这个赞成的比例比很多人的预计要高一些,也高于前几次的三年新合约的成员投票赞同率:2017 年为 76%,2020 年为 74%。 这也宣告为期 118 日的好莱坞演员罢工的正式结束,不过在 11 月上旬临时协议达成的时候,SAG-AFTRA 就已经宣布可以复工,目前已有多个项目恢复拍摄。 三部皮克斯电影将首次北美上映 皮克斯宣布此前采用流媒发行、未在北美上映的三部电影《心灵奇旅》《青春变形记》《夏日友晴天》将于明年登陆北美院线。 《心灵奇旅》定档 1 月 12 日北美上映; 《青春变形记》定档 2 月 9 日北美上映; 《夏日友晴天》定档 3 月 22 日北美上映。 ​
Google 最强大模型发布,GPT-4 要被反超?
与 GPT-4 正面对决 昨天深夜,Google 突然发布重磅 AI 杀手锏——Gemini。 多模态 Gemini 可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。 在去年 ChatGPT 发布不到两周后,Google 就已经拉响「红色警报」来应对挑战。可紧急上线的 Bard ,却在首次亮相就出现错误,一夜让 Google 蒸发了 1000 亿美元市值。 在过去的一年里,基于大模型的聊天机器人单月访问量已经超过 20 亿, 其中 ChatGPT 遥遥领先,Google Bard 虽然排在第二,但和几个竞品一起归为「其他」更为合适。 图片来自:The Information 因此,Gemini 早已被寄予了赶超 ChatGPT 的厚望,无论成败,它就是 Google 过去对 AI 大模型孤注一掷的成果。 能看、能说、能推理 Gemini 1.0 共官宣中杯、大杯、超大杯三种不同规格。 中杯:Gemini Nano —— 最高效的设备任务模型 大杯:Gemini Pro —— 适用于广泛的任务扩展的最佳模型 超大杯:Gemini Ultra ——最大且最能胜任高度复杂任务的模型 暂且抛开繁杂的参数信息,先来用几个案例让你全面了解 Gemini 的能力。 当你随手画个鸭子,从曲线到鸭子成型,Gemini 都可以精准识别。给鸭子画条波浪线,它能理解你的言外之意,精准地指出鸭子在水中游泳的场景答案。 同时它还能人性化地模仿鸭子的叫声,即使是用流利的普通话说出鸭子的叫法也不在话下。 闲着无聊,也可以和 Gemini 玩个游戏,你的手指指向哪个区域,Gemini 就能说出那个国家及其代表性的事物。 三仙归洞,猜猜纸球在哪个杯子下面,手速再快,也躲不过 Gemini 的「眼睛」。 拿到纱线却毫无头绪,别急,Gemini 聪明的大脑在看到纱线的那一刻,就已经把成品给你安排上,你只需要「照猫画虎」就好了。 识别图像还只是 Gemini 的基础水准,看到乐器,Gemini 还能生成符合环境氛围的音乐。 逻辑和谜题解决、图像序列分析、魔术技巧解释、记忆和逻辑,这些能力 Gemini 样样都有,样样精通。 或许是这个视频过于震撼,部分网友质疑 Google 这个视频存在「造假」的可能性,不过 Gemini 将很快在 Google AI Studio 中向公众开放,届时便能一辩真假。 多模态 Gemini VS GPT-4 据 Google 官方显示,从自然图像、音频和视频理解到数学推理,Gemini Ultra 的性能在 32 个广泛使用的大型语言模型(LLM)研究和开发的学术基准测试中,超过了30个当前最先进的结果。 从 Google 放出的测试结果来看,在文本、常规推理、数学、代码等领域,Gemini 的表现几乎是全方位碾压了 OpenAI 的 GPT-4。 MMLU(大规模多任务语言理解)是测试 AI 模型知识和解决问题能力的最流行方式之一。Gemini Ultra 在该测试中以 90.0% 的准确率成为首个超越人类专家的模型,作为对比,GPT-4 只有 86.4% 的准确率。 新的 MMMU 基准测试包含了跨不同领域的多模态任务,对多模态大模型的检验程度更高,但超大杯 Gemini Ultra 同样取得了 59.4% 的高分。 Google CEO Sundar Picha 在接受《麻省理工学院技术评论》的采访时表示,Gemini 之所以令人瞩目,其中一个重要原因是它从根本上就是一个多模态模型,就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习。 多模态是 Gemini 花时间打磨的原生特性,Gemini 1.0 能同时识别和理解文本、图像、音频等多种信息,理解信息能力更强,在回答与复杂主题相关的问题也能游刃有余。在多模态 SOTA 的测试中,Gemini 图像、视频、音频的多模态测试水准再次遥遥领先。 代码是检验大模型水平的重要指标之一,Gemini 1.0 跨语言工作和推理复杂信息的能力是它的强项,能够理解诸如 Python、Java、C++ 等高质量代码。两年前,Google 推出了 AlphaCode,这是首个在编程比赛中达到竞争水平的 AI 代码生成系统。 现在, AlphaCode 推出了第二代,这是一个由 Gemini 微调的竞争性编码模型,在与原始 AlphaCode 在相同的平台上较量时,AlphaCode-2 在人类竞争对手中的得分为 87%,而此前 AlphaCode 的得分只有 46%。 AlphaCode-2 技术报告地址 🔗:https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2\_Tech\_Report.pdf 在技术报告中,Google DeepMind (AlphaCode 2 出品人)分享了大量关于推理时搜索、过滤和重新排名系统的细节。英伟达高级科学家 Jim Fan 直夸这些最新成果堪称 Google 的 Q*(可以简单理解为 AI 的大突破)。 thehiredai CEO Arman 大胆地作出预测:「Gemini AI 刚刚杀死了 ChatGPT!」 值得一提的是,Google 还宣布推出迄今为止最强大、最高效、最可扩展的 TPU 系统:Cloud TPU v5p。 Cloud TPU v5p Gemini 1.0 的训练正是在 Google 内部设计的 Tensor 处理单元(TPUs)v4 和 v5e 的 AI 优化基础设施上进行的。 Google Cloud CEO Thomas Kurian 对于自家产品,毫不吝啬地夸赞道:「Cloud TPU v5p 是我们迄今为止功能最强大、可扩展性最强的 TPU 加速器,其训练模型的速度比其前代产品快 2.8 倍。」 手机大模型的新玩家 手机是新技术破圈的重要媒介,Gemini 想要大规模走进大众社会,Pixel 8 一定是其不二之选。 Pixel 8 Pro 作为第一款内置人工智能的手机,已经在高新技术民用化的道路上建立了良好的口碑,从已经上手 Pixel 8 Pro 的用户反馈看,Google 把 AI 和手机终端应用结合得相当不错。 在此基础上,Google 官宣中杯大模型 Gemini Nano 从今天开始,将在 Pixel 8 Pro 上正式运行。 消息一出,PassionateGenius CTO Morimoto 已经迫不及待想要体验在 Pixel 8 上跑大模型了。 作为首款专为 Gemini Nano 设计的智能手机, Pixel 8 Pro 有两项专属的拓展功能将在后续的更新中加入:「记录器摘要」和「Gboard 智能回复」。 即使没有网络连接,记录器也可以获得手机对话录音、采访、演示等内容的摘要,强大的终端硬件是支撑这个功能的依托,而优化的侧端算法让「断网不断线」成为了可能。 智能回复功能很像我们挂断电话后的自动回复,但和传统的固定内容相比, Gemini Nano 可以识别来信的内容,根据不同的语句生成对应的回信,语言也会更加自然亲切,有种明星的运营团队在社交平台回复粉丝的即视感。 这两项功能目前只支持英文文本的识别,但转头一想对本身就买不到 Google 手机的我们好像也没有任何影响,不过能买到 Pixel 8 Pro 的非英语国家的用户,还需要再静候一段时间。 而在生产力方面的优化,在大洋彼岸 Pixel 终于赶上了国内的基本水平。 类似的照片和视频的 AI 编辑功能在新机首发时,就成了 Google 新机的代名词,现在继续优化的 AI 编辑优化,可以让手机再加一件「专业编辑器」的新装。 全新清洁功能可以帮助去除扫描文档中的污迹、污渍和折痕。现在只用在相册里滑动几下,即可消除图片中的污渍。 借助 Google Tensor G3 的强大功能,Pixel 8 Pro上的视频增强模型,可在云端调整颜色、照明、稳定性和颗粒度。 从官方展示的对比看,视频被加了一层「鲜明」滤镜,颜色更饱满,明暗对比度更高,特别是在夜晚暗光环境中,这种 AI 优化的效果会更明显。 相较视频的编辑,图像美化应该是更多人的期待,特别是在拍动态物体的时候,模糊的画面总会让你在事后翻阅时留下一些遗憾,升级的 AI 编辑可以将 Google 照片中的模糊全部消除。 以后记录自家宠物的高光时刻,不用担心相机没聚焦带来的焦虑了。 此外,Google 将多设备之间的联动也进行了升级。Pixel Watch 能够成为手机解锁的另一种方式,也能帮你忽略不需要的来电,或接听电话之前确认对象以及通话原因。 如果你能买到 Pixel 8 Pro,或者已经是 Google 手机的用户,可以尝试检验一下这些新功能,会不会成为你购买或继续使用 Google 的推动力。 从今天开始,通过全新升级的 Gemini Pro 版本,Bard 将实现更高级的推理、规划、理解等功能。它将在超过 170 个国家和地区提供英文版本。 在接受《麻省理工学院技术评论》的采访时,Sundar Pichai 还说到:「Gemini Pro 在基准测试中的表现非常出色,当将其集成到 Bard 中时,我可以亲身感受到它的优势,我们一直在对它进行测试,所有类别任务的好评率都有显著的提升,因此,我们将其称为迄今为止最大的升级之一。」 目前 Bard 已使用 Gemini Pro 版本,图片来自 X 用户 @gijigae 在接下来的几个月里,Gemini 还会陆续上线 Google 旗下更多的产品和服务,比如搜索、广告、Chrome 和 Duet AI 等。 从 12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问Gemini Pro。 目前,Gemini Ultra 已经在内测中,并打算明年初推给开发者和企业用户,明年初,Google 还将推出 Bard Advanced,让更多的普通用户用上最强的 Gemini Ultra。 Sundar Pichai 在发布 Gemini 时谈到: 每一次技术转变都是推进科学发现、加速人类进步和改善生活的机会。我相信我们现在看到的与 AI 有关的转变将是我们一生中最深远的,远大于之前的移动或网络的转变。 想要实现 AGI(通用人工智能),就需要 AI 做到像人类一样从容地解决不同领域、不同模式的复杂任务,在这个过程中,除了基本的计算、推理等基础能力,相对应的文字、图像、视频等多模态能力也要跟上。 DeepMind 曾提出 AGI 的评估和分类的框架,前两个阶段分别是: AGI-0:基本的人工智能,能够在特定的领域和任务上表现出智能,如图像识别、自然语言处理等,但是不能跨领域和跨模态地进行学习和推理,也不能与人类和其他 AI 进行有效和自然的沟通和协作,也不能感知和表达情感和价值。 AGI-1:初级的通用人工智能,能够在多个领域和任务上表现出智能,如问答、摘要、翻译、对话等,能够跨领域和跨模态地进行学习和推理,能够与人类和其他AI进行基本的沟通和协作,能够感知和表达简单的情感和价值。 Gemini 的演示视频,充分展现了它对各个模态交互的深刻理解,能看、能说、能推理、能够感知和表达简单的情感和价值,也让我们看到了 AGI-1 的潜在可能性。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。