首页>科技动态 > 科技前沿 > 正文

实时全息3D视频聊天 谷歌首个量子AI园区来了

谷歌 I/O(开发者大会)2021 大会在今日凌晨 1 点线上召开。在本次大会中,谷歌涵盖了芯片 TPU、会话式语音 AI(人工智能)、搜索模型 MUM、Android 12 系统、实时 AR 地图、智能办公、全息 3D 视频聊天等方面的技术探讨。

此外,谷歌还重点关注了,用户的隐私安全和环境保护这两大块问题的解决方案。虽然今年大会受到了疫情的影响,只能在线上召开,自然是让人们少了些参与感。但“感觉”不够,“内容”来凑!这次谷歌带给大众的惊喜丝毫不少于大会的线下体验。

01. 力推前沿计算:第四代 TPU 算力飚十倍,首个量子 AI 园区来了

在谷歌 I/O 2021 开发者大会的主题演讲期间,谷歌研究与健康部门副总裁 Jeff Dean 披露了张量处理单元(TPU)芯片的相关细节,它可用于开展 AI 训练,然后生成 AI 模型,并有望用于智能扬声器、手机等设备中。Dean 解释:“谷歌将 4096 个四代 TPU 整合到一个 Pod 中,使一个 Pod 就可以提供超过一个 Exoflops(浮点算力为 10^18)的 AI 计算能力。”

得益于系统内部的互联速度及架构优化,TPU v4 算力可达 v3 的两倍,实际能更是比 v3 提升了十倍之多。

之前的 AI Pod 主要是采用了 TPU 的集成设计,而在第四代版本中,谷歌运用了光纤线路,不仅使不同板块组合到一起,还使维护工作更加轻松。此外,谷歌对单独的 AI 系统进行训练,用以识别语音、文字、照片和视频等信息,还试图通过研发 MUM(多任务统一模型)技术来改进相应的 AI 软件。

大会上,谷歌表示将在美国加利福尼亚建立一个全新量子 AI 园区,包括第一个量子数据中心和量子处理芯片制造设施,预计在十年内打造一台商业级量子计算机,这将在帮助他们建造机器、研发新材料方面发挥巨大的作用。目前谷歌的首个量子计算实验室已经雇佣了数十名研究人员和工程师,未来将会有更多技术人员加入。

“由于数据处理最基本元素的量子比特易受到外加干扰,所以增强量子比特的稳定是目前构建量子园的首要任务。加上量子计算依赖于控制超小粒子的怪异物理定律,这也使研发过程受阻。”Jeff Dean 说道。

谷歌计划将现实世界中的多个量子比特,组合成为一个有效的虚拟量子比特(又称“逻辑量子比特”),两者的比例约为 1000:1。此前技术人员预计需要 1000 个逻辑量子比特,才能完成实际的计算工作量。但对于目前只有数十个量子比特的谷歌来说,这个项目目标确实比较遥远。

02. 突破会话式 AI:从冥王星聊到纸飞机无需重训练

在今年的谷歌 I/O 会议上,谷歌强调了其对 AI 语言理解的工作,推出一个名为 LaMDA 的实验模型。研发人员在大会上展示了用户与 LaMDA 充当的冥王星和纸飞机的对话,可以看出对话自然合理,并不像普通聊天机器人那般毫无逻辑。谷歌称该模型有一天可以增强其对话式 AI 助手的功能,并允许进行更自然的对话,这对于软件和网页翻译功能起着巨大作用。

LaMDA 模型最初是一种被称为 Transformer 的机器学技术,它在处理计算机语言方面非常出色,并支持 AI 公司 OpenAI 的 GPT-3(一种回归语言模型)的兼容。一直以来,AI 和 LaMDA 模型就像是面包和黄油的关系。AI 技术为 LaMDA 模型助力的同时,它也推动着语言理解和运用的融合。

AI 语音助手的构建,有助于更好的理解用户所需的信息诉求,因为谷歌部分产品都是基于对计算语言的解读,而 AI 语音则是它的核心技术。谷歌首席执行官 Sundar Pichai 在演讲中提到:“语言的丰富和灵活使其成为人类最伟大的工具之一,它也是计算机科学的最大挑战之一。虽然现在与 LaMDA 的智能对话,可以根据上下文内容提供建议和答案,让对话不违和地进行下去,但它仍是处在研发初期,想要达到 AI 助手的对话功能,还需要时间的磨合”。

03. 比 BERT 强 1000 倍的搜索模型 MUM,提供更灵活可靠的搜索结果

谈论到搜索功能,谷歌在此次 I/O 大会上公布了一个全新的多任务统一模型 MUM。它是建立在一个 Transformer 架构之上,但却比 BERT 要强大 1000 倍。MUM 可以理解语言、接受 75 多种语言的培训,还能同时处理文字、图片、视频等信息,并最终得到统一且具有极强参考价值的信息。

在发布会上谷歌演示了一个 MUM 的使用案例,当用户想去攀登富士山时,自己需要做哪些准备?MUM 通过用户提供的照片,视频,路线图等信息,并针对富士山和亚当斯山的季节、地质等差异,提出最合理的攀登路线、时间和装备需求。

在这个例子中,MUM 结合用户所提供的信息,综合分析后的提出最适合的解决方案。但目前 MUM 和 LaMDA 一样还处于开发阶段,何时能正式推出,时间尚不明确。

04.AI + 图像处理强强联手,做动图、诊疗皮肤、升级 AR 地图

当下用户电子相册里的照片可谓是越来越多了,但要如何在需要的时候准确找到目标照片呢?谷歌推出了一个名为称为小图案(Little Patterns)的全新 AI 功能。这个模式可以将用户相册里,三个类似对象的照片归类为一类,方便用户查看。Little Patterns 还将利用电影中画面转场技术,把两张相似的照片制作成动画图像。

此外,谷歌还透露正在研发一种新工具,可以轻松地从照片库中删除某一人的全部照片,例如,想忘记却频繁出现在相册中的前任。

在医疗健康方面,谷歌之前研发的 AI 深度学系统,它能像皮肤科医生一样准确识别 26 种常见的皮肤病,该项技术还曾在春季刊的科学杂志《Nature》上发表。

基于此项技术,谷歌正在尝试利用 AI,通过检测皮肤、头发和指甲,帮助人们了解自身身体状况。具体点说就是,人们使用手机拍摄下身体出现异常的部位,然后该技术将从具有 288 例的数据库中进行症状识别,并给出相应的治疗方案。

据悉,该项技术通过了对数百万张患病皮肤图片和健康皮肤图像的学,还对 6.5 万张临床环境图像模型进行了培训。在测试阶段,谷歌技术人考虑了患者年龄、皮肤类型、别和种族等不同因素的存在,并对不同患者约 1000 张患病皮肤图像进行了模拟。

谷歌健康首席健康官 Karen DeSalvo 说:“我们每年大概会收到 100 亿次关于皮肤症状的查询,大多数人们都喜欢自行在互联网上了解治疗方案,由此我们想到用 AI 来解决这个问题。”DeSalvo 希望这项技术可以帮助轻度患者们高效、快速、准确地获取相关信息,同时也为皮肤科医生减小就诊压力。

今年大会宣布了将加强 Live View(实时视图)功能,可以让用户增强现场感,实现“环游世界”的体验。

自 2019 年推出 Live View 测试版以来,人们就可以通过谷歌地图看到一些公共场所的实时视图,像机场、购物中心、公园等区域。现在,谷歌将推出大范围的 Live View,并将为用户整合出更多有用的信息,比如通过餐厅的实时视图,人们可以了解其繁忙程度,然后估算出大概的用餐时间等。同时,谷歌地图还提供用户评论及上传照片的功能,便于人们对该地区的了解和判断。

谷歌地图预计到今年年底,将在包括柏林、圣保罗、西雅图和新加坡等 50 个新城市,提供更加详细的 Live View。当用户打开地图时,不仅能知道路线规划,还能了解当前地理位置下,周边环境、建筑的具体信息。同时,地图还将为人们推荐周边的酒店、餐厅或是娱乐等服务。

不仅如此,Live View 还在一些复杂的十字路口街道设置了“标签”,它将自动根据用户常用的位置信息(如家或工作的地址)来提供更准确的定位服务。“谷歌地图今年有望增加,多达 100 多项人工智能的程序设计。”谷歌地图技术部门的 Liz Reid 说。

谷歌地图另外一个重点升级是,它将利用人工智能识别来预测用户的“紧急刹车事件”。简单来说就是地图根据对于道面信息路况的监测,有意识地提前对用户发出危险警告,帮助用户规避因紧急刹车而出现的交通事故。据谷歌表示,在这项技术的指导下,每年可以预防 1 亿次紧急刹车事件的发生。

对于谷歌 Pixel 手机来说,它最大的亮点是,升级了图片处理器的相关技术,使其更具有包容。“这项技术旨在让相机里的有色人种,能够毫无保留地呈现他们的自然之美,使照片上的颜色更加精准。”谷歌技术研发人员解释道。

更准确地说,这项技术主要是改变了相机的白衡和曝光算法,让它更广泛的搜集深色人种的数据信息,避免照片中过亮和不饱和的有色人种,从而提高图片颜色的准确。同时,谷歌还表示之后将会把这项技术应用到更多的产品设计中。

此外,在手机相机的应用上,谷歌还推出了新的人像自拍模式,为卷发和波浪发型创建深度准确的图像信息抓取。虽然目前该技术还是存在一些问题,但还是个值得研发的项目。

05. 智能画布改变协作办公:让你一边编辑文档,一边视频沟通

在企业办公方面,谷歌在 Google Workspace 中推出了一项新协作工具 ——Smart Canvas(智能画布),它可以更高效地将文档、表格和幻灯片进行组合,提供无缝的工作体验。

同时,谷歌将 Google Meet 功能也整合进了 Smart Canvas 中,方便用户在编辑文档时能实时交流。Google Meet 还支持 AI 自动缩放以实现最佳人脸显示并提供自定义视图。最后,Google Meet 在消除噪音方面做了改进,整合 AI 来提升视频质量、优化取景和对焦,以及提供翻译能力。

06. 实时全息 3D 视频聊天:相隔千里也犹如面对面

在 I/O 大会上,谷歌介绍了一项名为 Project Starline 的视频会议新技术。它能够借助 3D 成像技术来获取用户信息,然后通过实时数据压缩技术,以借助现有网络来传输大量数据。其特点是让用户产生“面对面”交谈的真实感。

Project Starline 技术通过大量设置摄像头、深度传感器、专用照明和其他定制的硬件,可以达到毫无距离感的现场交流效果。这个技术目前仅在谷歌旧金山湾区、纽约和西雅图的部分办公室中启用。谷歌希望,这项技术在未来能够进一步降低成本和获取,最终实现人们能在察觉不到硬件设备的前提下,全身心地投入视频交流中去。

在技术应用方面,谷歌计划将 Project Starline 介绍给包括医院和媒体机构在内的商业部门,并与之合作。

07. 谷歌 Wear OS 与三星 Tizen 可穿戴操作系统深度整合

当提及可穿戴设备,尤其是智能手表时,大家的第一印象可能是 Apple Watch,但谷歌才是这个领域的早期玩家。

从最开始的 Moto 360 ,谷歌智能手表就赚足大众眼球,后来因为种种原因,技术和软件没有得到推进,其产品也就无疾而终了。以至于后来推出的 Android Wear 也未能让谷歌逆袭。

如今,之前的 Android Wear 早已更名为 Wear OS。谷歌在今年一月收购了元老级的穿戴设备玩家 Fitbit,原以为将会在这次的大会上宣布穿戴设备新品,但出乎意料的是,谷歌只是宣布与三星 Tizen 系统联合打造全新的可穿戴台。

依目前信息来看,谷歌意识到可穿戴产品的大趋势,是运动监测和健康追踪的功能。因此,他们将研发重点放在了 Fitbit 的健康监测系统上。通过迄今为止已售出 1.3 亿台的 Fitbit 获得大量数据,技术人员对研究人群进行数据分析,从而得到更准确的运动、健康数据,用于开发新一代的 Wear OS。

本次 I/O 大会还透露,Wear OS 可支持用户的个化体验,并添加多样的手势操控。例如,双击手表的一个按钮将转换到其他页面,像此类的快捷方式用户可以自定义设定。此外,谷歌与 26 个国家合作,推出 Wear OS 版的谷歌地图。YouTube 也将推出 Wear OS 版本,将在晚些时候发布,其功能包括在线听音乐或是下载音乐。

08.Android 12 风格全翻新,手机充当车钥匙

谷歌 I/O 2021 大会的主题演讲公布了 Android 12 公测版,除了谷歌 Pixel 手机外(Pixel 3 及更高级版本),它还适用于 OnePlus、联想、华硕、OPPO、Realme、夏普、Tecno、TCL、vivo、小米和中兴的设备。

本次 Android 12 可以说是历上最大的变化,给用户带来了全新的页面视觉设计语言 Material You,用户将能够通过自定义调色板和重新设计的小工具来完全个化自己的手机。Material You 提供了各种丰富的界面主题,操作系统的颜色也会随着壁纸的改变而改变。

但值得注意的是,并不是所有新功能都同时推出,它会随着系统版本的更新而相继出现。在未来 Material You 设计将适用于包括智能手机、板电脑、可穿戴设备、智能显示器、物联网项目、智能家居在内的所有设备。

此次 Android 12 简化了互动和重新设计了整个底层系统,不仅提升了系统的流畅和效率。还使 CPU 使用时间减少了 22%,并将系统服务器对大核心的使用减少 15%。

在用户体验上,Android 12 通知栏会变得更加直观、有趣,用户可以一目了然地看到应用通知、或是目前正在收听和观看的内容。同时还支持快捷设置,让用户通过滑动和点击来控制大部分的操作系统。

全新的 Android 12 支持管理 Android TV 设备上的内容,当找不到电视遥控器或是车钥匙的时候,这项技术可以算是那些丢三落四用户的福音了。

数字汽车钥匙也正在投放市场。谷歌 Pixel 和三星手机将支持 Android 12 使用数字钥匙。目前,宝马是唯一一家确认使用此新功能的汽车制造商。

09. 安全至上

在 Android 12 中,谷歌引入了 Android 私有计算核心(Private Compute Core),可以安全地存储用于机器学的数据,用以增强保护用户个人信息的安全、私密。私有计算核心能让用户在音频和智能回复等方面与网络隔离,是所有操作都在设备上执行,与网络隔离,以此来以保护用户的隐私。同时,私有计算核心的保护措施是开源的,完全可以由安全社区检查和验证。

在 I/O 大会上,谷歌推出了浏览器内置密码管理功能。当它发现密码有可能被泄露时,它会建议用户及时修改密码。目前这个功能会先在 Android 的 Chrome 中推出。

关于个人账户的隐私安全问题,谷歌系统推出了一个密码保护文件夹的功能。这项技术可以通过设置密码,帮助用户保护那些最私密的照片。与此同时,谷歌还为用户提供了自动删除功能。系统将会自动删除,在账户保留时间超过 18 个月的活动记录。目前,有 20 亿账户开启了自动删除功能。

Android 12 具有了一个名叫 Privacy Dashboard 的隐私面板,类似于之前系统的 My Activity 面板。面板上面记录了用户在过去一段时间内都做过什么操作、浏览过什么页面、生成了哪些数据,它允许用户快速对这些信息进行管理,包括删除操作记录和相关的数据,驳回特定 App 的权限等操作。

10. 到 2030 年实现运营中使用无碳能源

保护环境,人人有责。今年的大会,谷歌除了带来技术层面的惊喜,Sundar Pichai 还立下环保战书:到 2030 年,成为第一家全天候零碳的公司。注意,这里的零碳指的是包括全球所有的谷歌办公室。这个想法的提出,就如同立下“在 10 年内建设量子计算机”的目标一样大胆。

不管怎么说,这都是一项艰巨的任务。去年,谷歌发布了首个业界所谓的“碳智能计算台”,它按照清洁能源的供给情况,智能地进行计算负载分配。简单点说就是,谷歌把高能、高消耗的计算负载给分配到风能更充足的夜晚,以及太阳能更充足的正午,让风能和太阳能去转化这些计算负载。

目前这个碳智能计算台通过升级后,可采用机器学对计算负载的日间变化进行预测,然后提前完成冗杂的分配和备案等操作。谷歌还提到,这将不影响业务的实际运行效率和用户的正常使用。“到明年的这个时候,我们应该有能力把超过三分之一的非生产用途计算负载,给分配到清洁能源更充沛的地区去。”Sundar Pichai 说。

11. 结语:Android 12 为大会造势,AI 应用才是大会重点

由于疫情原因今年谷歌 I/O 大会只能以线上形式举办,但谷歌作为科技领域的顶端技术创造者,每次发布会都为大众带来不一样的惊喜。

这次大会正式发布了 Android 12 系统,但还是以 AI 领域的应用为主,谷歌推出了自然语义模型 LaMDA 和用于医疗领域的 AI 治疗。另外还有谷歌地图 Live View 技术的全面应用、虽然万众期待的 Wear OS 手表没有推出,但还是透露了些相关信息,值得期待。

标签: 全息3D 实时 谷歌 量子AI园区

推荐DIY文章
性能旗舰一加 10 Pro首销战报出炉 1秒破亿
一加 10 Pro重磅发布,最强性能旗舰10至名归
千万销量千家售后 一加多触点布局国内市场
科技加持,未来已来,“头号玩家”不再是科幻
一加 10 Pro发布在即,性能屏幕影像全方位提升
一加中国区新任总裁李杰 :做好品牌与用户之间的连接器
精彩新闻

超前放送