高考結束填報志愿是每個考生人生中最重要的事情之一,今年的人工智能專業(yè)顯然是最時髦的,各大高校將迎來第一批AI本科生。但是報考AI專業(yè)該怎么選、有什么注意事項、去哪兒學呢?下面由清華大學計算機系自然語言處理實驗室副教授劉知遠為廣大考生答疑解惑。
國內(nèi)CS/AI方向又有很多新的變化,最明顯的是各大高校紛紛設立人工智能學院,開始招收人工智能專業(yè)本科生。最近又要開始新的一輪填報志愿,我又來蹭個熱點,花了些時間整理出這篇短文,聊聊人工智能是什么、學什么、怎么學、以及去哪兒學的問題。
Q:人工智能是什么?
A:人工智能(Artificial Intelligence,AI)是一門年輕的學科,從1956年達特茅斯會議正式提出AI名稱至今不過65年;從阿蘭圖靈1950年提出判斷機器是否能夠思考的圖靈測試至今也不過70年時間。AI的70年發(fā)展史匯集了來自數(shù)學、計算機科學、邏輯學、哲學、神經(jīng)科學、語言學等不同領域學者的努力,是典型的交叉學科。同時,從整體來看AI仍然是計算機科學技術的主要分支。
人工智能是什么?簡言之,人工智能學科是利用計算機實現(xiàn)人類智能。人類智能并沒有公認的定義與界限,實際上也隨著AI的發(fā)展而有所變化。某項人類技能被計算機所掌握后,人們往往不再認為它代表人類"真正"的智能。例如,1997年IBM深藍戰(zhàn)勝人類國際象棋冠軍卡斯帕羅夫后,就有評論說IBM計算機只是在暴力搜索,不是真正的智能,that's not thinking!這種現(xiàn)象又被稱為"AI Effect"。
所以,人工智能總是聚焦在那些尚未被計算機破解的人類智能能力上。比較簡單的人類智能已經(jīng)被解決了,例如計數(shù)能力有了計算器,數(shù)據(jù)記憶和查詢有了數(shù)據(jù)庫,下棋能力有了下棋軟件,剩下的是那些困難的高級智能。簡單而言,如果我們把大腦看做一個黑盒,它能夠接受外部世界的刺激信號,大腦處理這些信號產(chǎn)生輸出反饋,人類智能正體現(xiàn)在這些"刺激-反饋"的對應中。針對不同刺激信號和反饋處理的復雜性,AI下面有很多專門的領域開展相關研究和探索。目前,公認的AI核心課題包括:機器學習、計算機視覺、自然語言處理、語音識別、知識表示與計算、推理與規(guī)劃,等等,并在此基礎上支持著許多重要應用場景如無人駕駛(無人車)、機器人等。
機器學習:旨在讓計算機具備自動學習的能力,能夠解決分類、聚類、回歸、關聯(lián)分析等任務。目前主流是從大規(guī)模數(shù)據(jù)中自動學習和總結規(guī)律,從而能夠對新的數(shù)據(jù)進行預測,也被稱為統(tǒng)計機器學習。簡單地講,機器學習是從大量"刺激-反饋"數(shù)據(jù)中自動總結規(guī)律的技術。
計算機視覺:旨在讓計算機理解和處理圖像數(shù)據(jù)(包括圖片、視頻等),使計算機掌握"看"的能力。圖像是典型的無結構數(shù)據(jù),由像素組成,如何從一幅圖像中自動識別不同層次的對象(如輪廓、人臉、場景等)及其復雜關聯(lián),是計算機視覺面臨的挑戰(zhàn)問題。
語音識別:旨在讓計算機理解和處理語音數(shù)據(jù),使計算機掌握"聽"的能力。語音也是一種典型的無結構序列數(shù)據(jù),目前在深度學習技術的支持下,普通場景的語音轉文本的效果已經(jīng)得到廣泛應用。而在多人、方言、噪音、遠場等極端挑戰(zhàn)場景下,語音識別效果還需要進一步提升。
自然語言處理:旨在讓計算機理解和處理人類語言。與C++、Java等人工設計的編程語言不同,人類語言是大自然的產(chǎn)物,因此被稱為"自然語言"。人類語言也是典型的無結構數(shù)據(jù),由字詞組合而成,如何理解一句話、一篇文章甚至一本書的意思,也是人工智能面臨的挑戰(zhàn)問題。由于語言是人類特有的傳遞豐富信息和知識、表達復雜思想和情緒的載體,甚至被認為是人類思考的重要工具,因此自然語言處理問題更接近人類高級認知智能,有很多重要的開放問題。
知識表示與計算:人類對世界的認識積累形成了知識,知識是人類理解外部信息、實現(xiàn)各種智能能力的基礎。近年來隨著知識圖譜的廣泛應用,成為研究界和工業(yè)界關注的重點問題。
由于上述這些課題都關涉人類智能,所以互相密切關聯(lián)、不分彼此,例如計算機視覺、語音識別和自然語言處理都是機器學習算法的重要應用場景,知識表示與計算也成為計算機視覺和自然語言處理方向的重要話題,等等。正因為年輕,這些方向都充滿著活力,一方面最新技術日益深遠地影響著人類社會生活的方方面面,同時學科體系和技術框架也在飛速地日新月異、推陳出新,現(xiàn)在去翻十年前的教材很多內(nèi)容都顯得過時了。
從學科設置來看,國內(nèi)大學遵照教育部《學位授予和人才培養(yǎng)學科目錄》來頒發(fā)學位。最初的計算機一級學科是"計算機科學與技術",下設"計算機系統(tǒng)結構"、"計算機軟件與理論"、"計算機應用技術"三個二級學科,其中"計算機系統(tǒng)結構"對應高性能計算(超算)和計算機網(wǎng)絡體系架構(互聯(lián)網(wǎng)),后來單獨成立出"網(wǎng)絡空間安全"一級學科;"計算機軟件與理論"對應軟件工程和計算機理論科學等,后來單獨成立出"軟件工程"一級學科;而"計算機應用技術"則對應計算機的各類應用技術,很大程度上正沿著從信息化到自動化再到智能化的路線前進,可以想見,如果現(xiàn)在這波AI浪潮還能持續(xù)幾年,單獨成立"人工智能"一級學科也指日可待。
從研究配置來看,AI研究隊伍主要分布在計算機、自動化、電子工程等信息科學相關院系中,這與AI起源有密切關系,計算機的奠基人圖靈、馮諾依曼,自動化的主要理論基礎"控制論"的奠基人維納,以及電子工程和信號處理的主要組成"信息論"的奠基人香農(nóng),均為AI的創(chuàng)立貢獻了思想。所以,計算機系主要從計算理論和計算機應用的角度研究AI,自動化系從自動控制的角度理解AI,電子工程系則從信號處理(將AI關心的視覺、文本、聽覺等模態(tài)理解問題看做信號處理)的角度解讀AI。
當然,在哲學、腦神經(jīng)等其他領域也有從事人工智能探索的學者。不過總體而言,由于人工智能核心目標是探索如何將人類智能轉化為可計算問題,因此它主要還是落在計算機領域。
如果希望對AI發(fā)展有比較通俗全面的了解,可以參考以下兩本書:《人工智能狂潮》雖然標題名略顯中2,內(nèi)容比較扎實,淺顯全面并及時涵蓋到最近的深度學習浪潮;《人工智能簡史》是華人尼克的大作,作者搜集的史料全面扎實,夾敘夾議有很多干貨,讀起來很過癮,不過很多地方點到即止,如果沒有相關背景知識很難看懂作者所指。
Q:人工智能學什么?
A:如前所述,人工智能大致還是一個計算機應用的課題。雖然這兩年國內(nèi)外已有很多高校開設了人工智能班和專業(yè),課程設置還沒有形成共識。我們可以從國內(nèi)AI本科教育體系的先聲——南京大學人工智能學院發(fā)布的《南京大學人工智能本科專業(yè)教育培養(yǎng)體系》做一些分析。
作為對比,這里列出清華大學計算機科學與技術系的選課指導清單,其中用紅框標出了與人工智能有關的限選課程。
可以看到,人工智能需要學習的主要內(nèi)容包括:
數(shù)學基礎課:清華CS和南大AI都需要學習的有 微積分(或數(shù)學分析)、代數(shù)與幾何、離散數(shù)學(或數(shù)理邏輯、圖論等)、概率論。南大AI新增 最優(yōu)化方法,這在清華CS為研究生課程。
學科基礎課:清華CS和南大AI都需要學習的有 程序設計基礎、數(shù)據(jù)結構、人工智能導論、計算機原理、數(shù)字電路、系統(tǒng)控制。南大AI新增 機器學習、知識表示、計算機視覺、自然語言處理 作為學科基礎課,這在清華CS均為高年級選修課或研究生課程;清華CS需要額外學習 電路原理、信號處理、操作系統(tǒng)、編譯原理、形式語言與自動機,這些被南大AI列為專業(yè)選修課。
專業(yè)選修課:南大AI設立了很多AI相關的專業(yè)選修課,如 自動規(guī)劃、概率圖模型、強化學習、神經(jīng)網(wǎng)絡、深度學習等,在清華CS均為人工智能方向研究生課程;而南大AI設立的很多認知科學、神經(jīng)科學、計算金融、計算生物學、計算語言學等交叉課程,在清華則分散在各院系開設的課程。
由此可以總結,目前看AI本科專業(yè)核心課程的設置與計算機專業(yè)相比,重疊部分要遠大于差異部分??梢钥闯瞿洗笤贏I課程體系構建方面花費了大量心力,非常符合AI的當前發(fā)展特點。
所以,回到這個問題,人工智能學什么?建議就是以計算機核心課程(數(shù)學基礎課、學科基礎課)為學科主線,以 機器學習、知識表示、計算機視覺、自然語言處理 為學科特色,以學科交叉為輔助。因此,我們也可以說,無論是在以南京大學人工智能學院為代表的新成立的人工智能專業(yè),還是以清華大學計算機系為代表的計算機專業(yè),都可以完成對人工智能基礎知識的學習。不同之處在于,前者預置為學科基礎課,后者則成為高年級時的可選方向(計算機系統(tǒng)結構、計算機軟件與理論、計算機應用技術)之一的計算機應用技術,如下是該方向的專業(yè)限選課程列表,其中超過一半課程是AI相關。
如果對這些課程要學什么感興趣,可以購買查閱《南京大學人工智能本科專業(yè)教育培養(yǎng)體系》或者使用搜索引擎檢索相關介紹。
Q:人工智能怎么學?
A:清華大學章程明確提出"價值塑造、能力培養(yǎng)、知識傳授"三位一體的育人模式,我認為這是高水平AI人才養(yǎng)成方式的最佳描述。
知識傳授這層不必多說,師者傳道受業(yè)解惑,在大學里通過課程講授和課下實踐,研習精通計算機和人工智能理論與技術,每位同學通過一門門課程成績反映出的,正是專業(yè)知識掌握的水平。我想,絕大部分同學都能明白課程學習的重要性。然而,大學之道不僅于此,不然大學就不過是個專業(yè)技校。
在知識傳授之上就要構筑能力培養(yǎng),這對CS/AI專業(yè)而言尤其重要。計算機和人工智能是非常年輕的學科,正處在飛速發(fā)展的朝陽時期,學科知識更新?lián)Q代很快,大部分最新知識根本無法在短時間內(nèi)及時沉淀到教科書中。而進入教科書的那些知識,與實際應用場景往往已有較大距離。很多CS/AI高科技公司自身就站在學科最前沿,亟需有快速學習和獨立解決開放問題能力的人才。
這樣,一方面要求同學有意識建立終身學習的理念,有較強的獨立學習的能力;另一方面則要求同學注意通過實驗室研究等方式鍛煉科研創(chuàng)新能力。CS/AI同學們需要主動參與科研工作的全過程,樹立專業(yè)志趣,培養(yǎng)獨立學習的能力、自我學習的習慣、提出問題的意識、以及獨立解決開放問題的能力,這是大學培養(yǎng)CS/AI高水平人才的必由之路。因此,大學教師在CS/AI開展高水平原創(chuàng)研究的能力,也一定程度上決定了他們對學生進行能力培養(yǎng)的水平。
最后一層價值塑造也許是最玄乎的,但更加重要。一個人在知識和能力確定的情況下,Ta的努力方向和堅持程度最終決定其成長的高度。找到在術業(yè)上的堅持方向,就是價值塑造的過程。這個過程絕不是簡單粗暴的灌輸和宣講就能實現(xiàn)的,要有高水平的教師一起教學相長,有志存高遠的同學共同努力拼搏,有各界奮斗的學長作為示范榜樣,有校外海外的實踐平臺廣開視野。實踐出真知,只有自己多聽多看多想,才能找到自己喜歡的、努力的方向,也才更有后勁堅持不懈。
所以,不管是人工智能、計算機專業(yè)還是其他什么專業(yè),只要想把自己培養(yǎng)成為該領域的可堪大用之才,就需要從知識、能力和價值這三個層面來努力提升自己。
Q:人工智能去哪學?
A:上面說了這么多,接下來圖窮匕見,再聊聊國內(nèi)人工智能應該去哪里學。根據(jù)前面幾個問題的回答,可以從師資水平、課程設置等方面來做判斷,其中師資水平應該是最重要的因素,而課程設置、培養(yǎng)水平等與師資水平直接正相關。
我推薦UMass教授Emery Berger維護的高校計算機科學領域排名CSRankings,采用DBLP數(shù)據(jù)庫中大學CS/AI教授在不同方向頂級會議上發(fā)表的論文數(shù)量進行排名,有客觀確切數(shù)據(jù)支持,例如美國號稱CS四大名校的Stanford、MIT、UCB和CMU就排在美國前四位。同時CSRankings工程和數(shù)據(jù)全部開源在github上,可以非常方便地進行檢查、復現(xiàn)和擴展。
CSRankings將CS劃分為AI、Systems、Theory、Interdisciplinary Areas四個一級方向,每個方向有有若干子領域,例如AI就又下分General AI (AI總方向)、Computer Vision (計算機視覺)、Machine Learning & Data Mining(機器學習與數(shù)據(jù)挖掘)、Natural Language Processing(自然語言處理)、The Web & Information Retrieval(互聯(lián)網(wǎng)與信息檢索)。每個字領域只收錄2-3個頂級會議,這主要是因為計算機科學技術由于發(fā)展比較快,所以學者們更重視通過國際會議論文發(fā)表最新成果進行學術交流,而不像其他領域那樣主要是通過期刊發(fā)表最新研究成果。
由于CSRankings原網(wǎng)站沒有提供中國單列的高校排名,國內(nèi)學術網(wǎng)站AMiner做了一個改進版,除了提供中國高校單列名單外,還額外提供根據(jù)論文引用數(shù)量的排名。如果按照2009-2019十年間論文發(fā)表統(tǒng)計,我簡單統(tǒng)計了國內(nèi)AI/CS排名較高的高校(不含香港***高校、不考慮中科院)如下:
這個排序大致能夠反映各大高校CS/AI專業(yè)的國際學術前沿整體水平,而且通過AI領域和CS整體的排名反差,可以觀察到該高校AI方向的強勢程度,例如復旦的AI排名高于其CS排名2位,哈工大AI排名高于CS排名3位等等,說明這兩所大學的AI方向相對比較強勢。而且,還可以看出,國內(nèi)高校AI領域的世界排名整體明顯超過CS整體的世界排名,說明國內(nèi)高校在AI方面更接近世界前沿水平。
需要注意:(1)這個統(tǒng)計結果只能反映師資力量的一個側面,而很多國內(nèi)高校如北航、國防科大等在國家信息科學重大需求方面做出的巨大貢獻如天河等,并無法客觀反映到這個統(tǒng)計中。(2)由于CSRankings作者Emery Berger堅持只收錄能招收博士的CS教授,因此那些在電子工程或自動華系等其他非CS系的教授沒有被收錄進來,從而導致該清單并不能完全反映各大高校的AI等領域的師資水平,但也正因為其只收錄CS教授,也許對于我們評判這些高校的CS專業(yè)師資力量更有幫助。此外,部分高校可能存在教授列表不全等問題,而CSRankings接受修改申請,建議國內(nèi)高校相關院系如果有遺漏CS教師的可以去申請更新。
CSRankings主要以高校為單位進行排序,前幾天我組同學用CSRankings開源數(shù)據(jù),對AI領域的國內(nèi)C9高校學者進行了排序,可以看到前20的學者有7位清華、5位北大、2位南大、2位浙大、2位哈工大、2位復旦,可以從另一個側面反映各高校的AI師資力量。
總之,我認為CSRankings是很好地定量了解各高校CS各領域研究實力和師資力量的平臺,例如下面就是CSRankings提供的清北兩校不同領域發(fā)表論文分布的餅狀圖。
最后特別說明,這些僅為一家之言,不代表任何機構。我很樂意解答大家提出的更多通用問題,但不提供具體填報志愿的咨詢。希望能幫上今年那些對CS/AI感興趣的考生。衷心祝愿大家不畏浮云,理性判斷,做好人生的重要選擇。
本文經(jīng)授權轉載自清華大學計算機系自然語言處理實驗室劉知遠副教授
-
語音識別
+關注
關注
38文章
1742瀏覽量
112697 -
人工智能
+關注
關注
1792文章
47354瀏覽量
238834 -
計算機視覺
+關注
關注
8文章
1698瀏覽量
46023
原文標題:清華劉知遠:寫給想要填報CS/AI志愿的考生們
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論