谷歌I/O大會終于來了。今天的大會上,谷歌有三個值得業界關注的新產品發布:TPU3.0、能讓機器人打電話的Google Duplex和Android P。今年谷歌I/O大會,全場都在談AI,谷歌的AI First戰略已經深入到每個產品中。
跟去年一樣,7000人來到了谷歌I/O開發者大會現場。
Pichai上場。
Pichai先是講了谷歌“核心”產品中最大的問題:emoji中的偷工減料問題,比如,漢堡和啤酒表情。
最后它們解決了這兩個讓人不爽的問題。Pichai只是開玩笑,其實在技術大爆炸的時代,谷歌有更多責任去減少數字鴻溝、承擔更多社會責任,而AI提供了一種解決社會問題的途徑。
Pichai舉了三個AI應用到現實社會中的例子。
第一個例子:AI應用于醫療。
使用深度學習分析視網膜圖像,以此預測心血管疾病突發的風險。
谷歌通過在來自284335名患者數據上訓練的深度學習算法,能夠從12026名和999名患者的兩個獨立數據集中患者的視網膜圖像,以驚人的高準確度預測病人的心血管疾病風險因子。例如,算法通過視網膜圖像區分吸煙者與不吸煙者的準確率有71%。
左圖:眼球背部圖像顯示斑疹(中間的黑點),視盤(右側亮點)和血管(右側亮點旁的深紅線)。右圖:視網膜圖像呈灰色,使用了深度學習算法的像素可以預測血壓(綠色陰影高亮顯示)。我們發現每個心血管風險因子預測使用不同模式,例如血管用于血壓,視盤用于其他預測。
在Pichai演講的同時,Google AI也公布了谷歌與斯坦福大學醫學院等合作的研究成果“用于電子健康記錄的可擴展、準確的深度學習”。
圖:病人記錄中的數據以時間線的形式表示。
研究人員設計了一個計算機系統來進行預測,而無需為每項任務手動制作新的數據集,并且可以采用可擴展的方式。但構建數據只是工作的一部分; 預測還需要準確。
評估準確性的最常見方法是接收者操作特征曲線(ROC曲線),該曲線衡量模型如何區分具有特定未來結果的患者與不具有特定未來結果的患者之間的區別。在這個度量標準中,1.00表示完美,0.50表示不比隨機結果好,因此數字越高意味著模型越準確。谷歌報告的模型預測患者是否會住院的得分為0.86(傳統邏輯回歸方法得分為0.76); 在預測住院死亡率方面得分為0.95(傳統方法為0.86),在預測出院后意外再住院率方面得分為0.77(傳統方法為0.70)。
這些模型也被用來評估患者接受治療的條件。例如,如果醫生為患有高溫,發熱和咳嗽的患者開具頭孢曲松和強力霉素,則該模型可以將這些標識為患者正在接受肺炎治療的信號。
該研究的一個重點是深度學習模型的可解釋性。
圖:在患者入院后24小時使用深度學習模型進行預測。
這對患者和臨床醫生意味著什么呢?機器學習可用于改善醫療,這項工作是一個開始。
Pichai說,AI可以影響的最大的領域是醫療。
第二個例子:聲畫分離。
當人們在電視上互相交談時,字幕就會很糟糕。谷歌試圖用AI解決問題。
谷歌用一種深度學習音頻-視覺模型,用于將單個語音信號與背景噪聲、其他人聲等混合聲音分離開。例如,AI可以通過YouTube幫助谷歌識別誰在說話,即使是在一場爭吵比賽中,自動生成字幕。
Pichai說,辯論很好,大喊大叫不好。我希望谷歌能解決人們在電視上互相吼叫的問題。
第三個例子:Gboard。
Pichai介紹了谷歌的輸入法Gboard的功能:添加了摩爾斯電碼。
谷歌展示了開發者Tania Finlayson的視頻。由于疾病,Tania Finlayson無法通過自然聲音與其他人交流。視頻中,Tania Finlayson通過摩爾斯電碼發出了聲音。
通過頭戴的定制設備,可以分析她的頭部的動作并將其轉碼為摩爾斯電碼。當她觸發左鍵時,該設備會添加一個短信號,而右鍵則會觸發一個長信號。接著,設備將文本轉換為語音。
谷歌的Gboard用兩個區域代表短信號和長信號。鍵盤上方有多個單詞建議,就像普通鍵盤上的一樣。目前,Gboard已經在iOS和Android上提供測試版。Tania也來到了I/O大會現場,受到了大家的熱烈歡迎。
谷歌一直在用AI帶來改變。
比如Gmail的新功能,這個功能被稱為智能組合。
簡而言之就是在你輸入文字后,谷歌使用機器學習推薦你可能輸入的短語。你所要做的就是按Tab鍵。
Pichai說,它負責處理日常事務,比如地址。“(使用了新功能后)我給公司發了更多的郵件?!?/p>
本月晚些時候,所有Gmail用戶都將使用智能組合。
接下來是Google Photo。Pichai說,在谷歌的照片中,每天都有超過50億張照片被觀看。它也融入AI技術,比如自動修正亮度。
同時,在谷歌照片中,名為Smart Actions的新智能功能將會識別照片中的人物,比如照片中如果有Lisa,可以把其中關于Lisa的照片發給她。
另外,如果照片曝光不足,在谷歌照片中的人工智能將提供一個建議來修復亮度。谷歌照片可以使用人工智能將照片中的主體分離出來,并在顏色上重新創建一個灰度照片。
并且能夠對舊照片著色,這是一個非常有趣的圖像識別應用(國內騰訊AI Lab也做過類似的技術)。
最后是文檔轉換功能,Google Photo能識別文檔并將其轉換為PDF。這對工作人士非常有幫助。
第一個重磅產品:TPU 3.0,性能是TPU2.0的八倍
接下來,Pichai講到了重磅部分——TPU 3.0。
Pichai說,3.0的能力是去年芯片的8倍,性能達到100 petaflops?!斑@些芯片如此強大,以至于我們第一次不得不在我們的數據中心用上了冷卻液?!?/p>
作個比較,一個包含16個英偉達最新版GPU的芯片組能夠提供的計算能力是2 petaflops。
TPU(張量處理器)是谷歌為機器學習定制的專用芯片,專為谷歌的深度學習框架TensorFlow而設計。
谷歌在2016年的I/O大會上首次公布TPU。不過在此之前 TPU已在 Google 內部的一些項目中使用了一年多,如 Google 街景服務、 DeepMind的AlphaGo 等都用到了 TPU。
在去年的I/O大會上,谷歌發布了第二代TPU。第二代 TPU 設備單個的性能就能提供高達 180 teraflops 的浮點運算能力。不僅如此,谷歌還將這些升級版的 TPU 集成在一起成為 Cloud TPU。每個 TPU 都包含了一個定制的高速網絡,構成了一個谷歌稱之為 “TPU pod” 的機器學習超級計算機。一個 TPU pod 包含 64 個第二代 TPU,最高可提供多達 11.5 petaflops。
Pichai說,谷歌公司第一次不得不在其數據中心采用液體冷卻——液體冷卻通常用于高性能計算芯片或PC中的一些性能導向的芯片。
值得一提的是,在隨后Waymo CEO上臺介紹谷歌自動駕駛取得的新進展時,特別強調Waymo自動駕駛系統使用TPU,將性能提高了15倍!
幾乎所有大公司都在開發自己的AI定制芯片,這一領域競爭激烈。Facebook的硬件針對其Caffe2框架進行了優化,該框架旨在處理其對用戶的大量信息圖。亞馬遜試圖通過AWS構建云基礎架構的生態系統。微軟則押注比定制芯片更靈活的FPGA,在昨天BUILD大會上公布Project Brainwave,其性能可與定制芯片相媲美,并且實時 AI 能力延遲相比TPU低 5 倍。
Google Duplex:完美與人類溝通,讓機器人為你打Call
接下來應該是本次大會的明星產品——Google Assistant。
Google Assistant用到了DeepMind的WaveNet技術,并且能夠模擬6個人的聲音,而且這六個人的聲音聽起來相當自然。每個人的聲音都有完全不同的效果。
其中還包括歌手John legend的聲音。
Google Assistant的更詳細的功能交給負責人Scott Huffman介紹??偨Y有四大亮點:
連續對話
以前喚醒Google Assistant每次都要說“Hey Google”或“OK Google”等熱門詞匯,現在可以進行更自然的談話,而無需在每次帶助手的句子后觸發命令,并且還可以區分何時與其通話或與其他人交談。Scott Huffman介紹,這個功能將在“未來幾周”推出。
多個操作
Google的虛擬助理可以在同一個語音命令中執行同時操作,使用協調減少功能即使使用更長的命令也能準確找出用戶的含義。例如,用戶可以要求它設置提醒并在一條語音消息中播放。
Pretty Please有點像亞馬遜對最近推出的Echo Dot兒童版一樣,谷歌助理添加了一些技巧,為用戶(特別是孩子)提供了積極的支持。
當孩子們與助理通過禮貌的詞語(如Please和Thank You)交談時,助理會表揚孩子有禮貌,并且還提供免費的適合家庭的內容,包括Google合作伙伴(如迪士尼)的游戲、活動和故事。
Google Duplex
今晚最大的亮點之一就是Google Duplex。
它不僅能夠像一般的助理一樣安排日程,更重要的是能夠以極為類似人聲的角色為你操作接下來的行動!
左邊是機器人,右邊是真人
Pichai演示了為發型設計師助理安排預約餐廳的案例,在視頻中,谷歌助理記錄下了需求,并真!的!給餐廳打!電!話!了!
Pichai說,機器人打電話的過程是實時的,不是表演的。而餐廳服務員與這個機器人交流完全沒有障礙。
這個功能將來會上線。
智能化的Android P
第三個是重要部分是Android P。
Android P有三大特性智能、簡潔、Digital wellbeing,其中第一個也是最重要的一個是智能。
智能體現在以下幾個方面:
智能適應電池功能。谷歌與DeepMind合作開發了一項名為“自適應電池”的新功能,利用AI來檢查用戶如何使用手機,并尋找方法來減緩耗電。
具體來說,該功能使用AI來預測用戶接下來會使用那些App,以及那些App只會偶爾被打開一下。Android P將不經常使用APP會進入睡眠狀態。谷歌表示,這能讓App的喚醒次數平均減少30%,得以延長手機的電池續航時間。
智能亮度調節。Android P還通過“自適應亮度”的功能來節省電池壽命。該功能可以根據用戶的使用習慣來控制手機屏幕的亮度。例如,如果是白天,手機會自動降低屏幕亮度以節省電量。
自適應電池和自適應亮度兩項功能都由DeepMind與谷歌Android團隊合作開發。
智能識別用戶活動。將最常用或即將使用的應用提前,為用戶智能推薦應用。
Slices。在Google搜索中輸入相關詞匯,如果涉及到手機上的應用,就會出現該應用的相關功能。比如輸入Lyft,就會在搜索結果中看到一個應用程序slice,用戶可以直接從該頁面使用應用功能(類似搜索里的直達號?)
MLKit API接口。第三方App也能即時使用AI模板。
其他產品:地圖、媒體、自動駕駛等全部AI化
I/O大會,其實是全面展示Google產品的大會,包括地圖、媒體、自動駕駛(Waymo)等。
比如說Google News。
在News首頁,谷歌為提供的五個Top新聞,這是全球頭條新聞、本地新聞和你一直關注的新聞的最新動態。
然后,你可以切換到標題,看世界各地的頭條新聞。這里的附加部分讓你深入到不同的主題,如體育、商業或技術。
谷歌推出了一種新的視覺形式叫newscast,它使用自然語言理解提供一個單一主題的文章、視頻和引用。這可以讓你在短時間內通過瀏覽不同的源來獲得一個事件的基本信息,這樣你就可以決定是否要進繼續看一個新聞。
如果你想深入到一個特定的話題,谷歌新聞的“Full Coverage”功能可以讓你看到一個新聞是如何從不同的地方和多種形式出現的,如社會評論、地方新聞來源、和頂級出版商的報道。谷歌新聞將收集如何實時地討論和發布新聞,并將它們聚集在一個地方。
自動駕駛方面,Waymo的CEO也上臺演講,現在,Waymo是世界唯一一個有在公共道路上路的Fully Selfdriving Car的公司,已經有超過600萬英里的行駛記錄。
前文提到,Waymo自動駕駛系統使用TPU,將性能提高了15倍,而使用深度學習也讓Waymo自動駕駛有了對比:(上圖是使用前,下圖是使用后)
至此,谷歌2018I/O大會到此結束,你覺得哪項產品能改變未來?
-
谷歌
+關注
關注
27文章
6161瀏覽量
105304 -
AI
+關注
關注
87文章
30734瀏覽量
268893
原文標題:谷歌TPU 3.0重磅發布;I/O大會上機器人真的能打Call!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論