11月28日上午,2017年Google APAC Press在東京舉行,本次會議的主題是Made With AI,Google Brain團隊負責人、Google Research Group資深院士Jeff Dean以及Google AI軟硬件產品研發的負責人發表了演講,闡述了Google如何將AI運用到自己的軟硬件產品上,以及如何與社會機構合作解決人類面臨的重大問題。
Jeff Dean首先登場,他闡述了Google在人工智能領域的愿景,即通過三種途徑讓每個人都從中受益。這三個方面包括:利用AI使得Google產品更加實用,幫助企業和開發者創新,以及為研究人員提供工具,從而解決人類面對的各項重大挑戰。
一、AI已經完全深入Google的軟硬件產品
Jeff Dean表示,機器學習是Google在人工智能領域的工作重心。通過機器學習,可以極大的改善Google的產品。這些產品有:將機器學習用于分類的軟件Goolge Photos 中的照片搜索(Photo Search)、Google Translate中的即時相機翻譯(Word Lens)和 Google Lens。將機器學習用于預測的系統程序,如Gmail 和 Inbox 中的智能回復(Smart Reply),Google Maps 中停車難易度的圖標(Parking difficulty icons)。將機器學習用于理解的系統程序,如Google Assistant,YouTube 中的自動字幕(Auto captions)和神經網絡機器翻譯(Neural Machine Translation)。
1、Goolge Photos
Goolge Photos是圍繞機器視覺建立的一個產品,可以讓用戶輕松在照片庫中搜索到特定照片,比如搜索 “狗”或者“擁抱”的照片。另外,Google Photos還可以自動向用戶推薦與哪些好友分享照片。
2、Google Translate
自去年以來,Google開始將神經網絡用于翻譯中,大大提高了翻譯的準確性和質量。據Jeff Dean透露,Google Translate中已經有97個語言對使用了神經網絡翻譯,整體上使得翻譯效果更流暢、更好。而即時相機翻譯功能也已經成為Google Translate的一大特色。
值得一提的是,Google Translate是目前在中國大陸唯一能夠使用的谷歌產品。
3、Google Lens
Google Lens在今年5月份的Google I/O開發者大會上發布,是一款基于圖像識別和OCR技術的人工智能應用,能夠讓機器學會“看圖說話”。Google Lens能實時識別用智能手機相機所拍攝的物品并提供與之相關的內容,目前Google Lens已經集成到Google Assistant和Google Photos中。
4、Gmail 和 Inbox
Google將機器學習用于郵件回復中,推出智能回復的功能,當用戶要回復郵件的時候,智能回復可以自動給一些建議的回復內容,可以加速我們的辦公效率,尤其是在使用手機回復郵件的時候。Jeff Dean稱,目前有12%的郵件回復是在手機上進行的。
5、Google Maps
通過機器學習,Google Maps可以變成一個實用的地圖,比如目前的停車難問題,Google Maps可以預測這個地方有沒有停車位,標出停車難易度的圖標,然后幫你導航過去。
另外,通過機器學習,基于你愿意看什么節目,愿意聽什么音樂,它還可以幫助用戶推薦一些歌曲或一系列相關的音樂產品,這就能運用到Google Play Music上。
6、Google Allo
Google Allo是一款主打定制表情的即時通信類App,使用者在發送這些表情或文字的時候,可以改變進行涂鴉表情回復,以此來表示預期和心情。另外,人工智能甚至在Allo上可以幫助你聊天,人工智能能自動推送你一些常用的回答方式。
7、Google Assistant
Google Assistant核心技術是語音識別。比如詢問Google新德里的天氣是什么樣的,它會通過語音識別、理解,然后以合理的形式展示給用戶。Jeff Dean說,這個系統是非常復雜的,其中包含了很多機器學習的相關技術。這個產品沒有機器學習是不存在的。
8、YouTube
在YouTube上,通過機器學習給超過10億的視頻自動加上字幕,可以讓世界上近3億的聾啞人或者有聽覺障礙的人可以看到視頻上的東西。Jeff Dean成,我們還在不斷的改進這個語音識別系統,使“自動字幕”的文字準確性提升了50%。“通過神經網絡等技術,可以讓聽力有障礙或者不精通視頻播放語言的人通過自動字幕享受到視頻。”
9、Pixel Buds
Google將AI與新型硬件、軟件相結合的另一個實例是 Pixel Buds。這是一種能實時將你周圍別人說的話翻譯成你的母語的耳機,運用了語音識別和翻譯技術。Jeff Dean表示,有了它你就能在陌生的語言環境中漫游,幾秒鐘后便能翻譯成你的母語。
Jeff Dean同時提到,在2017年5月,我們發布了TensorFlow1.0,同時我們也在不斷的進一步發開增加新的功能,讓這個平臺變得更好用,更強大。
二、人工智能對于硬件產品使用體驗的提升
Google Pixel Camera產品經理Isaac Reynolds詳細闡述了人工智能對于硬件產品的體驗提升。
首先,他介紹了Pixel 2 XL上的人像模式(Portrait Mode)。Isaac Reynolds到達東京的以后,他用Pixel 2 XL拍攝了很多人像照片,通過機器學習技術,可以自動判別哪個是人,哪些物體距離更近,哪些更遠,從而自動進行背景虛化,達成更好的人像效果。Isaac Reynolds說,雖然手機硬件的創新看上去是結束了,但還有很多AI與軟件方面的創新。
機器學習還被用于為Google Home智能音箱提供語音配對功能(Voice Match)。機器學習有助于識別不同的語音,使最多六個用戶連接到同一臺 Google Home。Isaac Reynolds稱,Google Home是首個具備此功能的智能音箱。另外,機器學習技術也幫助Google Home僅適用兩個麥克風就能判斷聲源位置。
另外,基于地理位置,機器學習可以幫助Google Home Max判別音箱所在的位置,自動調節適合錄音室還是家中的音響效果。
三、用機器學習
Google研究項目總監Linne Ha詳細闡述了機器學習如何幫助解決語言問題。她說,世界上有6000種語言,另外還有很多方言,這其中超過100萬人以上使用的語言有400種,但是,目前網絡上的內容大約50%以上都是英文,這就是用機器學習來解決語言互通的重要性。
Linne Ha稱,語言是身份不可或缺的一部分,谷歌想要創造一個技術,能夠讓更多的人聯網,讓不同語言的人上網更容易。
另外,機器學習技術在輸入法也是非常重要的。首先是鍵盤,英文有26個字母,這個鍵盤排列很普遍,但是有一些語言有30個字幕,我們通過機器學習來做預測排列方式。
其次是谷歌手寫輸入,Google Handwriting Input,利用機器學習可以更準確的判斷手寫內容。
第三還有語音輸入Voice Input,在機器學習的幫助下,自然語言處理系統能夠更好地理解你想說的話。語音搜索支持 119 種語言,其中包括 11 種印度語言和 3 種印度尼西亞語言。
對于小數據的語言模型的訓練,Linne Ha說到,他們還發起了Unison Date Collection活動,到小語種地區,讓當地的人每人說45分鐘,收集數據進行訓練。另外,Google 還發起了文本轉語音 (Text-to-Speech)項目Project Unison,這是一個利用機器學習實現文本向語音轉換的實驗項目。通過轉換引擎,手機可以用語料并不豐富的語種,如孟加拉語,高棉語和爪哇語與您對話。而機器學習模型有助于減少構建文本到語音模型所需的數據量。
Linne Ha稱,方言是我們的下一步需要解決的問題。
四、打造新的人機交互方式:Google Assistant
Google Assistant 工程總監Pravir Gupta介紹了這款智能助手的情況。他說,目前的 Google Assistant支持不同種類的任務,比如尋找某一問題的答案、導航服務、獲取新聞或得到日程安排方面的幫助,在現場,Pravir Gupta為了一個“在東京是不是要給小費”、“給我XXX的照片”、”中巴犬是怎么叫的“等問題,Google Assistant簡潔完整的回答了這個問題。最值得一提的是, Google Assistant 可以在不同設備間通用,并且可以無縫切換。
目前,Google Assistant可以在澳大利亞、巴西、加拿大(英文和法文)、德國、法國、意大利、印度(英文和印度文)、印度尼西亞、日本、韓國、墨西哥、新加坡、西班牙、英國、美國等國家和地區使用。
五、機器學習在企業中的應用
Google AI在企業領域的布局逐步清晰,Google為企業及開發者提供三種創新工具:TensorFlow,云機器學習 API (Cloud Machine Learning APIs) 以及張量處理器 (Tensor Processing Unit, TPU) 電腦芯片。主要目的是為了幫助企業進行創新,同時優化流程。
會上,Google邀請了日本當地食品企業丘比(Kewpie)公司上臺演講,闡述了丘比公司使用AI改善日本管理思想中的現場管理,包括顧客管理、供應鏈等方面。丘比使用 TensorFlow 開發出一個工具,可以從嬰兒食品中所使用的切塊土豆中檢測出食品生產中有缺陷的成分。
六、利用AI解決人類面臨的巨大挑戰
會議最后,Google產品經理、醫療成像團隊負責人Lily Peng登臺演講,闡述了Google的AI技術如何幫助人類解決目前面臨的一些重大挑戰:如醫療保艦能源和環境保護問題。
在醫療方面,Lily Peng 的團隊與印度、泰國和美國的一些醫院合作開發一種工具,可以通過機器學習幫助診斷糖尿病所引起的視網膜病變(數據顯示,全世界有4.15億人收到此病的困擾,50%的患者因為得不到提前檢查致盲。)的篩查工作。他們所開發的算法的準確性可以媲美專業的眼科醫生,能夠在缺少眼科醫生的地方發揮重要作用。
Lily Peng回顧了他們對深度神經網絡進行了培訓的過程,她的團隊獲得了眾多的糖尿病指視網膜病變的圖像,一共收集了13萬張這種圖片,然后找了54個專業醫生進行閱讀,進行了88萬個診斷,對圖像進行分級和模型訓練。最終的這個系統的結果,機器學習系統的表現比專業眼科醫生的識別準確率還要高一點。
另外,機器學習還用乳腺癌的診斷,通過將機器學習應用于乳腺X光檢查,來探索新的方法以提高乳腺癌的檢測幾率。Google、DeepMind聯合英國癌癥研究中心研發,希望建立一種機器學習模型,能夠快速、準確地檢測出癌癥的跡象,幫助醫生盡早發現癌癥,以便盡早開始治療。
機器學習運用到醫療領域之外,還可以推進很多的進展,還可以找到新的治療方法,用到基因測序,計算機環保、能源、交通領域的問題,Lily Peng說,我們還是處在一個開端,我們希望這些方法能為研究機構提供更多的方法。
在環保問題上,Google邀請維多利亞大學博士生Victor Anton闡述了如何利用機器學習來保護鳥類。Victor Anton 致力于追蹤新西蘭瀕臨滅絕的鳥類,以改善對它們的保護工作。他收集了 5 萬個小時的音頻并將其轉換成譜圖,通過 TensorFlow 更加快速高效地分析這些音頻,對鳥類的聲音進行分類,識別譜圖中的鳥鳴聲,以便更好的了解鳥類。他希望此研究能夠為新西蘭未來的動物保護工作提供有價值的信息。
七、總結,Google是一家AI First的公司
Jeff Dean在會議最后總結到,作為一家 AI First 的公司,Google 致力于讓每個人都能夠從人工智能中獲益。Jeff Dean稱,雖然取得了一些成績,但是還有很多困難需要克服。
例如需要想方設法讓機器學習模型的創作過程更加觸手可及?為了解決這個問題,Google已經開展了人工智能的內部培訓,已經有1.8萬名Google員工參加過此項培訓,而且Google將于2018年在互聯網上提供免費的機器學習課程。Jeff Dean同時透露,Google也同時在中國招募機器學習相關的人才。
另外一個挑戰是,如何確保我們構建的機器學習模型具有包容性,并且能夠真正為每個人所用?Jeff Dean說,Google已經啟動了People + AI Research (PAIR) 計劃,這個計劃旨在將 Google 的研究人員聚集在一起,研究并重新設計人與人工智能系統交互的方式。Facets 正是此計劃所孕育出的一種工具,能夠 將用于機器學習的訓練數據可視化。
除此之外,Google還與Geena Davis 研究所合作建立了GD-IQ,可以利用機器學習檢測電影中性別偏見的工具。
評論
查看更多