文/沈知涵、biu
照例5月,山景城,少了来自全世界各地程序员的“朝拜”,GoogleI/O好像没了“灵魂”。面向寥寥无几的戴着口罩的员工,CEO桑达尔·皮查伊好像自说自话。外界猜测的手机、耳机等硬件纷纷缺位,Android12反而成为“最大亮点”。
“太没意思了。”这是看到半个小时的心里话,但将持续了两个小时的开场看完,会发现Google把每一处技术和产品的更新迭代都加上了“人性的温度”。
Google在台上说得最多的,是“AI”
“HeyGoogle”,Google的语音助手被召唤出来了,“我想看视频里『雄狮在夕阳下咆哮』的画面”,手机背后的AI经过短暂的处理,像是听懂了人话一样,直接跳转到了用户想看的片段。
20年前,人们使用Google搜索,只能看到带有蓝色下划线的超链接,而现在却能看到文本、图片、音频、视频等多模态结合的结果。又比如,你问“我打算来一场公路旅行,哪条路会有好看的山景?”Google会直接在地图上规划好一条路线,至于你想沿途欣赏的美景,机器也已经在地图界面上给出了具体节点的图片、视频。
而这种高效的搜索,受益于了Google最新的自然语言模型LaMDA。要执行用户提出的复杂指令,AI理解人类语言是第一步,AI越“听话”,人类就越能有求必应。
和AI明星GPT-3一样,LaMDA也是基于Transformer架构,在语言对话方面非常出色。为了展示LaMDA的能力,Google和LaMDA进行了两个简短对话。在其中一个对话中,LaMDA“扮演”了冥王星,Google团队开聊后,AI显得非常自如,回答说“如果要来旅游记得穿得暖和点,因为我这里特别冷”,至于被问到“有没有人访问过冥王星”,AI也能答出准确的事实。
如果Google能让AI更好地理解语言,它就能改善其核心产品——搜索。它可以把搜索,变成一种交互摩擦更小的“对话”。
但皮查伊仍非常谨慎地表示LaMDA仍在开发的初期阶段,虽然AI能够开放地回答人类问题,但它有时还是会出现逻辑错误。值得一提的是,Google前几年公布了能帮用户打电话订餐厅的AIDuplex,被媒体发现背后有真人代劳。
Google还公布了一个全新模型MUM(MultitaskUnifiedModel)。MUM能同时处理文字、图片、视频等信息,最终得到有极强参考价值的信息。在发布会上Google演示了一番,用户问MUM“我已经成功登上了亚当斯山,明年想去攀登富士山,自己应该做些什么准备?”MUM通过用户提供的照片、视频、路线图等信息,并针对富士山和亚当斯山的季节、地质等差异,提出最合理的攀登路线、时间和装备建议。
和LaMDA一样,MUM目前也还在开发阶段。
Google还强调会确保AI尽量避免偏见,对社会有益,还宣布引入Androidprivatecomputecore,作用是将系统中需要基于用户数据进行AI处理的部分和其他部分隔离开来,保证AI任务收集的个人数据的安全性。
除了帮你搜素之外,Google还想做你的购物助手。“人们每天在Google上购物次数超过10亿次,今天我们要推出『购物图谱』(2012年Google提出了『知识图谱』概念)。”在搜索沉淀下来的知识图谱基础上,Google生成了很多种产品品类和销售这些产品的商家的数据集。据说,Google可以对接全网数百万商家,提供了超过240亿的商品的报价,帮用户找到最划算的商品。由于“购物图谱”覆盖整个Google生态,用户可以在Lens、Photos、YouTube等场景随时随地“剁手”。
Google还借助AI给旗下产品加入了一些人性的温度。比如,用AI分析用户上传到GooglePhotos里的相片,“LittlePatterns”功能可以把相片里频繁出现的小物件(比如某一个橙色背包)提取出来,做成你背着这个背包行走的“旅途回忆”。“Cinematic”通过智能补帧的方式,可以将可能相关的照片合成一张有更多细节的动图。又比如,优化算法,为有色人种设计一个更“公平”的相机:过去图像处理针对浅色肤色优化,黑人的皮肤往往会被过度提亮。
AI需要有强大的基础设施来驱动,Google在I/O上也展示了专门为机器学习设计的最新一代芯片TPUv4,速度是TPUv3的两倍多。另外,Google也首次展示了他们设立在特殊园区内的量子AI中心,可在其中一些设施中实现接近绝对零度,以保护其量子比特。这个中心未来将很快拥有几十个第四代TPU,以驱动量子中心的运行。
Android12,有史以来“最个性化”的更新
安卓设备总量已经超过30亿台,从软件开发的角度,安卓是谷歌生态系统的关键。Google曾经在I/O2014上推出设计语言MaterialDesign,目的是为Google打造一个独有的设计风格,无论是手机、平板还是其他平台形成统一的设计理念。
然而,在Android12引入全新的设计语言——MaterialYou中,Google强调“你”才应该是你的操作系统的创作者。Android12不仅重新设计了UI,交互上也有简化,对系统空间也进行了重构。
Google举了“颜色提取”例子,如果用户设置一张新的壁纸,系统会根据算法为桌面主题创建一个“调色板”,选出主色和互补色。Android12强调UI与现实世界的关系,从桌面拿起手机时亮屏动画会遵循设备拿起的方向,按下电源键锁屏时屏幕会朝电源键位置逐渐熄灭,时钟的大小取决于是否有未读通知。Android12中一些动画和其他指标做了优化,将CPU系统服务器时间减少22%,因此Android12体验会更快、更流畅。
当然,作为所有科技巨头的重中之重,每逢发布会必谈“隐私和安全”。在Android12层面,Google称它通过创建一个新的隐私仪表盘来提高数据透明度,该仪表盘可以显示用户的应用程序正在访问什么,何时访问数据,它会报告包括第一方和第三方所有软件,一旦用户看到哪个软件“行为怪异”,可以直接在仪表盘中管理和撤销对于该应用程序的权限。
基于新一代操作系统,Google还提出要让手机成为中心,与其他智能设备更好地协作。对于Chromebook,Android12添加了一项新功能,允许用户从手机解锁并登陆到附近的电脑;对于那些永远找不到电视遥控器的人来说,手机将逐渐替代电视遥控器,控制AndroidTV和GoogleTV将是一个福音;甚至未来,手机还能当作汽车钥匙使用。
Google,还是那个Google
除此之外,WearOS也做了常规节奏的更新,虽然Google称这是WearOs史上最大更新——Google将与三星联手,将WearOS和三星可穿戴操作系统Tizen相结合,可将应用启动速度提高30%,加强设备续航持续运行心率传感器,以及繁荣开发者生态。
对照往年,今年的发布会略显平淡。过去人们说,Google总是有办法,把最前沿的技术用最简单实用的方式尽量普及给最广泛的用户,因此带给人们超出预期的欢呼和惊喜。然而,曾经代表前沿技术的互联网科技公司,现在早已渗透到生活的方方面面,后疫情时代的远程办公,图像识别乳腺癌,碳中和……这些在GoogleI/O开场中出现的词语,也正是过去一年离不开人们嘴边的话题。
针对远程会议的体验优化,Google内部正在研发名为ProjectStarline的项目,利用高清摄像头和景深传感器,捕捉身型相貌之后,创建一个实时的3D模型,加上光场和显示器,一个栩栩如生的3D形象就能赫然坐在你的对面,用来模拟面对面会议的真实感。
每逢开场的结尾处,总少不了温馨和感动的环节。虽然Pixel系列手机没有登场,但是Google预告了对于摄像头的改进期待,Google正在对摄像头的自动白平衡和曝光算法进行改进,避免黑色皮肤人种在拍摄时过度增亮和饱和度不足,“改变的不应该是人们的外貌,而是我们的工作方式,有色人种需要更加美丽和准确的展现自我。”
或许有人说,这届GoogleI/O没有那么炫酷了,但是你发现,它在距离“BuildingamorehelpfulGoogleforeveryone”的使命感却越来越靠近了,切实地对每个人的真实生活有所助益,这是Google在变大变强之后,回过头来对社会责任感的反思和实践。
当技术不止停留在“酷炫”,它才变成与人们生活密不可分的底层技术,才能真正变得“helpful”。