立場新聞 Stand News

無處不在的人工智能: Google IO 2016 Keynote 綜述

2016/5/19 — 18:31

對我們而言:技術,絕不僅僅是我們創造的設備或產品,因為那並不是終極目標。技術,是一種民主的力量,它所提供的信息,便是力量之源。而Google正是這樣一家信息公司,成立至今,始終堅守初衷,從未改變。同時,人們對信息的運用,也不斷給我帶來驚喜與啟迪。

Google CEO Sundar Pichai, 2016 年 4 月

又是一年一度的谷歌開發者大會 Google IO 開幕演講時間。今天下班以後,我早早地打開 Youtube 上的 live stream。離開始還有一個多小時, 那個 live stream 的視頻旁邊的公共聊天室裡就滿是各種不同語言的問候。全球幾百萬觀眾像我一樣激動地期待這個全球技術圈中旗幟性年會的開幕。離正式開始還有十多分鐘, 現場直播視頻就出現了。與往年 techno 的音樂不同, 今年正式開幕以前的音樂十分柔和悠揚, 如沙灘上輕柔的浪花撫過腳背, 似乎還可以看見蔚藍色的天際海鷗徜徉。因期待開幕而緊張興奮的心也頓時寧靜下來。 (本篇全部圖片來自網絡直播的視頻截圖)

廣告

會場設計, 開幕序曲以及 Google Assistant

廣告

作為技術界的翹楚舉辦的具有全球影響力的開發者大會, Google IO 歷來每年的主會場設計也是別具匠心, 讓我們提前遊歷未來。今年是 Google IO 舉辦的第十個年頭, 這次的會場​​佈置反而返璞歸真。就是在一個露天球場, 舞台上 3 塊大型熒幕, 沒有更多噱頭。現場大約可以容納 7000 多名觀眾。

這次的開幕序曲是由兩位藝術家露天表演的大地豎琴 (earth harp)音樂。他們帶來的音樂如流水琮琤沁人心脾, 給整個會場帶來一種與天地萬物同生共進退的開闊與和諧。

這時三塊大屏幕上溫柔飄搖的千絲萬縷, 既為這飄忽而又細膩深情的音樂帶出視覺意象, 又似乎象徵著後來整個演講中始終貫穿, 無所不在的一個中心主題: 高級人工智能全面滲透人們生活的時代已經到來。

開場致辭還是跟前幾年一樣, 由 Sundar Pichai 擔當 —— 他在去年剛剛升任 Google 的 CEO。他提到, 今年有 100 多個國家的觀眾在此時此刻通過互聯網收看這次盛會。最大的開發者觀眾群來自中國, 他向一百多萬在網上觀看直播的開發者致以熱情問候。

問候過後,他立刻切入正題, 講到當今世界, 越來越多的人依賴移動設備提供的信息服務。人們在移動設備上搜索, 越來越多人漸漸習慣語音搜索或者語音命令, 完成他們的日常任務。而這一切, 在十年前還是不太可能。是人工智能技術在近十年裡的突飛猛進使計算機語音識別, 語義識別, 圖像識別等等成為可能, 將有用信息送到人們身邊。

在說到移動設備的高度普及時, 大屏幕上有展示從移動設備上傳來的搜索概念。我看到 Eurovision 2016 了, 截圖作個紀念:

Pichai 說, Google 已經開始訓練她們的 AI 識別嘈雜環境中的語音語義。然後又有計算機視覺加語義搜索成果的演示。用關鍵字 “擁抱” 搜索你自己放在 Google Photo 上的私人相冊, Google 自動幫你找出所有含有擁抱動作的照片。這種搜索也可以應用於動畫視頻。當然還有基於圖像識別的實時翻譯功能,可以省去手動輸入文字, 把手機鏡頭對牢文字就可以:

將這些人工智能因應用高度整合以後, Google 在今年向大家正式推出了谷歌助理 (Google Assistant)的概念。跟幾年前推出的Google Now 不同, 谷歌助理並不綁定於某一種硬件設備, 而是Google 向大家提供的一種服務, 她存在於多種不同的智能設備上, 包括手機, 家電,穿戴設備等等。她了解這個世界, 也知道你的私人喜好和行程, 總是能夠在合適的時間,地點,發出貼心的提醒或者作出適當的安排。人工智能將會以穀歌助理的形式在當今的日常生活中與我們同呼吸共存在。

Pichai 介紹, 谷歌助理有這樣三個主要特性: 健談 (Conversational), 務實 (Get things done) 和貼心 (In your world)。健談是指谷歌助理具有世界最強的自然語言處理系統,基於谷歌的類神經網絡和深度學習系統。這個系統可以和人類作比較通順的自然語言溝通。務實是指谷歌助理的精通任務管理和時間管理。貼心當然是指她知道你的喜好和脾氣。

接下來的幾段演講, 都是用具體的硬件或者應用軟件來展示 Google 的人工智能對世界的深廣改變。一般媒體喜歡聚焦Google 在IO 大會上發布的新硬件或者新版本軟件, 但是我覺得, 這次的IO 大會, Google 向世人再次凸顯自己“始終是一間人工智能研究公司” 的身份, 並且清楚表明她在人工智能領域當仁不讓的領先地位。

Google Home

這屆 IO 淡化硬件設備的角色。唯一被介紹的新產品 Google Home 卻有非凡的意義。這個小小的圓錐形設備是谷歌助手在家居生活中的一個載體。主要有三大用處: 娛樂, 日常任務管理和請教 Google (Ask Google)。人們可以用語音指令或者觸碰來控制她。她內置的喇叭可以用來播放音樂 —— 當然可以用語音控制, 和跟人流暢對話。她可以控製家居的智能設備, 提醒主人各種重要事項和出行時的周邊環境。 “請教 Google” 功能則把大千世界的許多知識帶到家裡。大會上有播放了一段短片, 說的是在一個忙碌的早晨, Google Home 怎樣與一個家庭互動, 是家庭裡忠實可靠的一員。這令我想起一部英國電視劇裡的忠實僕人 Jeeves。只不過 Google Home 上知天文下知地理, 恐怕比 Jeeves 要博學得多。

這個小小的設備要流暢控製家居電器, 當然少不了日後各大物聯網設備廠商的支持。在目前來看, 主要還是根據家庭成員的 Google Calendar 行程表作些提醒以及相關資料自動呈現工作。但是無論如何這是 Google 進入家居領域的可喜第一步。

這個 Google Home 設備有各種顏色可供選擇。

Google Allo 和 Duo

Google 的即時通訊軟件 (就是通常所說的聊天軟件) Hangout 跟競爭對手相比似乎不太流行。 Google 決心在今年改變現狀。他們製作的全新的即時通訊軟件 Allo, 在裡面深度整合了大量 Google 無與倫比的人工智能。

比如, Allo 懂得對方講的話的語義, 可以向你提供幾個回答選項, 這樣, 你不必打字, 選擇怎樣回答就可以。她也懂得對方發來的圖片或者影片裡有些什麼, 會向你建議幾個回答選項。這是我個人覺得很酷的功能, 中國的微信或者臉書的 messenger 還沒有的。

當你和對方討論某個話題時, Allo 還會適時提供建議。比如, 附近有些什麼意大利餐廳, 或者某種礫石應該是什麼樣子, 聰明的谷歌助理當然有附身在 Allo 上, 她的建議在 Allo 中無縫整合。大家要查看任何事實, 不必切換到別的應用程序。

Allo 還有一個值得一提的特性是安全。你的談話有端對端的加密機制, 確保隱私。在 Snapchat 上很流行的談話內容過期刪除功能 Allo 也有。

除此之外, Google 還為用戶提供了多種生動有趣的貼紙。提供所謂 Whisper Shout 功能, 字號的大小可以隨時改變, 以表達語氣感情 (見以上截圖中的 Cool 一詞)。

Google IO 令我感到貼心的是, 他們的高層永遠在會上表示對廣大開發人員的最大尊重與器重。每次 IO 都要反復強調, 沒有開發人員的創意和努力就根本沒有 Google 的今天。這樣受到重視,所以, 我們這些技術人員喜歡 Google。就算是在中國, 都有 100 多萬開發人員半夜翻牆看 Google IO。

Google Duo 則是一款視頻聊天軟件, 是 Allo 的好搭檔。個人認為 Duo 最大的亮點在​​於她的高效視頻壓縮解碼以及傳輸技術。這項技術是流暢視頻通訊的保證。 Duo 能做到視頻流暢, 歸根到底還是底層技術過硬。所以我一直有說, 在科網產品界, 深度決定高度, 與其炒作各種商業概念, 還不如潛心修煉技術內功。基礎研究一定會有用武之地。個人覺得中國國內流行的許多軟件產品, 在技術上來說, 跟國外同類產品相比差距還是不小的。

這次 Keynote 上介紹的 Allo 和 Duo 都將在今年夏天上架。歡迎使用!

Android N

Android N 在今年進化到第 N 版。到底叫什麼名字, Google 表示還沒有想好, 大家可以到網上向 Google 建議。注意他們會比較想要甜食的名字哦~

Android N 著重在運行速度, 用戶工作效率, 和安全性這三個方面作出改進。

這次推出全新的圖像編程接口 Vulkan, 令複雜的多邊形處理更為高效, 移動設備上的影像更為逼真流暢。首先是廣大 gamer 的福音。照相機運行時也用到更少的內存。 Android 操作系統也有作過大幅速度優化。新的 Just In Time (JIT) 編譯器, 令 app 的安裝和運行流暢許多。下面是大會上展示的 Android N 的 JIT 編譯器的效率在幾個不同的基準包上相對於去年的 Android M 的測試結果:

為了提高用戶的工作效率, Android N 提供了屏幕分割, 雙擊切換常用 app 等功能。屏幕分割在平板電腦上會很有用。通知的設置系統也有很大改進, 用戶可以更為簡便地對某種系統通知進行設置, 減少無用信息的噪音, 讓真正關心的事不至於被埋沒。軟件的更新更為平滑, 安全系統也有改進。下面這張 slide 對 Android N 的主要改進作了歸納:

下面這張圖上, 提供更多改進的細節項目:

上面這張圖上有提到 Emoji。是的 Android N 向大家提供更多基於 Unicode 的系統表情符號!

Daydream VR

我在 2014 年的 Google IO keynote 綜述中就向大家隆重介紹過 Google 家輕便,簡單又價格親民的虛擬現實設備 Google Cardboard。但是畢竟這個簡易設備在舒適性, 交互方式的多樣性和沈浸是體驗等各方面是有所不足的。今年 Google 就推出他們全新的虛擬現實係統 (VR 系統), 代號白日夢 Daydream。

一些廠商做 VR, 只是做硬件設備, 即頭戴式的 VR 眼鏡。但是 Google 不同。他們對 VR 有三大方面的系統性認識。

首先,他們要使 VR 系統在移動設備(主要是手機)上也能運行, 而不是只在高端個人電腦或者遊戲主機上運行。這當然對手機的內置感應器, 圖形處理器, 顯示屏, 系統芯片等硬件有一定的要求。 Google 就發布了一個所謂 Daydream-Ready 的硬件配置標準。目前, 已經有包括三星, 華為, LG, 小米, 華碩等在內的手機廠商生產 Daydream-Ready 的手機。剛才說到的 Android N 也有內置的 VR 模式。這個 VR 模式提供更強的運算性能, 極短的系統反應延遲時間 (這兩項聽上去比較耗電……)和 VR 系統操作界面。

其次, 他們推出了一套 VR 眼鏡和控制器的技術​​設計, 歡迎廣大硬件廠商生產 Daydream-Ready 的頭戴式 VR 眼鏡。大會上演示了控制器的使用, 非常簡便且精準, 令我印象深刻。

一個成熟的 VR 系統還必須有足夠的 content 支持。 Google 又一次表示, 親愛的 app 開發者們, 未來是你們的, 做白日夢還要靠你們!本桑再一次被哄得飄飄然, 已經半夜了還在這里為 Google 義務宣傳。

除了以上提到的三點,Google 還把他們的在線電影商店和 Youtube 進行大幅改造,目標是令它們也能隨時放映白日夢。

Android Wear 2.0 以及 Android Auto

我手上戴的是 2014 年買的, Android Wear 的第一款手錶, 三星產的。當年只有三款還是七款 Android 手錶可供選擇。短短一年裡,市面上形形色色的 Android 手錶超過一百款了~ 一些著名的時尚品牌比如 Michael Kors 都有 Android 手錶推出。

在過去的兩年裡, 我有感受到 Android Wear 系統軟件的巨大進步。而今年推出的 Android Wear 2.0 系統軟件則更是一次質的飛躍。個人認為最為有用的特性之一, 是用戶可以選擇把一些常看的信息直接嵌在表面上, 這樣就不必用手指去滑出有關的 app, 真正便利。

很多功能, 可以不必依靠手機做 host, 手錶直接就可以運行。

從手錶上回​​覆交談, 可以用三種不同的方式: 選一個系統給你的選項 (又見谷歌助理的語義分析能力!), 或者用手指在表面上寫, 或者用表面上的鍵盤輸入。

大家還要記得蘋果的智能手錶上也可以安裝 Android Wear 的軟件哦~

至於 Android Auto, 這次在 keynote 上倒是一兩句話就帶過, 主要是說越來越多的汽車製造商支持 Android Auto 系統, 已經超過一百間了好像。 Keynote 散會後, 當然還有專門關於 Android Auto 新特性的 session, 我還沒來得及看。

Android Studio 2.2 以及其他開發者工具

基於 IntelliJ IDEA 的 Android Studio 自問世以來就是廣大專業 Android 開發者的首選工具。這次的新版本大幅提高了運行速度, 尤其是測試時的運行速度。還提供測試動作自動記憶, Java 8 的特性支持, 更強的 C++ 支持等等新特性。 Firebase 也對開發者常用的功能進行了一系列整合,令開發者的使用體驗更為順暢。

煽情時刻以及結語

Keynote 到最後快要結束的時候, Google CEO Pichai 又上台講話。他介紹了 Google 雲平台的三個最強大優勢, 即云端機器學習, 計算機視覺 API 和自然語言處理 API。其實這三個領域是當今世界上幾大 IT 服務公司的兵家必爭之地, 幾乎每個公司都在這方面有所佈局。過幾天我會寫寫 IBM 的 Bluemix 以及 Watson API。但是目前為止不得不承認, Google 在這些方面還是有優勢的。

然後 Pichai 又深情回憶了不久前 AlphaGo 的輝煌戰績以及第二局中富有創意的一手棋, 他說, 以前人們認為不可能的機器 creativity, 在機器學習的不斷進步下, 也在變得可能。不太熟悉 AlphaGo 的同學, 可以參看我前不久寫的文章: 淺說 AlphaGo

Google IO 的 Keynote 每年都有煽情時刻。今年說的是一位土耳其的軟件工程師, 為敘利亞的難民們編寫 app,以幫助他們在土耳其開拓新的生活。他說, 他希望敘利亞的難民在土耳其感到溫暖。啊 Google 真的很關心歐洲, 但就在幾天前, 歐盟判罰 Google 幾百億歐元, 說 Google 妨害競爭。欸話不可以倒過來講的……

最後的最後, Pichai 說: “真正的考驗在於, 人們是否能在人工智能的協助下完成更多的壯舉。 一些以前人們認為不可能的事, 也許其實是可能的。 ”

自己寫的這句話每年都要重複至少一次: 想像力從來不是憑空而來,而是許多科學上的知識,工程上的經驗, 對社會對他人的熱情和誠意的積累。去年這句話是序, 今年作跋, 與各位同道共勉。

謝謝閱讀,下次再見。

 

PS: 今年的開幕演講只持續了大約 2 個小時, 比往年緊湊一些。而這 2 小時里傳達的內容卻是豐富, 集中而意義重大。今天作演講的 Google 各位高層, 從衣著,敘述結構到細部措辭都平易近人, 沒有誇張的抒情或者華麗的自誇。令人真正相信 Google 是一個有使命感, 同時也腳踏實地的技術公司。

作者博客

發表意見