人工智能時代已來，AI芯片路在何方？

　　一、芯片行業的演進路線

　　芯片行業的整體發展始自上世紀60年代，一開始是指數型發展，所以有了每18個月集成度翻一番的摩爾定律，可以說當時的發展是非?？斓摹Ｄ柖杀澈蟮倪壿嬍钦f，隨著工藝制程的進化，同一款芯片的制造成本會更低，單位面積晶體管數量提升導致相同的芯片所需要的面積縮小；而如果工藝制程發展速度過慢，則意味著芯片制作成本居高不下，導致利潤無法擴大。但是，如果孤注一擲把所有的資本都用來發展新制程，則風險太大，一旦研發失敗公司就完蛋了。

　　摩爾發現當時市場上成功的半導體廠商的制程進化速度大約是每年半導體芯片上集成的晶體管數量翻倍，于是寫了著名的論文告訴大家這個發展速度是成本與風險之間一個良好的折中，半導體業以后發展可以按照這個速度來。

　　可以說，摩爾定律背后的終極推動力其實是經濟因素，它給市場帶來的積極影響是，隨著半導體工藝制程的進化，芯片的性能以指數級增長，從而帶動了電子產品性能大躍進式發展，電子市場一片生機勃勃。在摩爾定律提出的前三十年，新工藝制程的研發并不困難，但隨著晶體管越來越小，越來越接近宏觀物理和量子物理的邊界，高級工藝制程的研發越來越困難，研發成本也越來越高。如果工藝制程繼續按照摩爾定律所說的以指數級的速度縮小特征尺寸，會遇到兩個阻礙，一個是經濟學阻礙，另一個是物理學阻礙。

　　經濟學阻礙是，隨著特征尺寸的縮小，芯片的成本上升很快。這個成本包括NRE成本（Non-Recurring Engineering，指芯片設計和掩膜制作成本，對于一塊芯片而言這些成本是一次性的）和制造成本（即每塊芯片制造的成本）。有人計算過，以現在的最新工藝，一塊芯片的NRE要到1000萬美元以上。如此高昂的NRE意味著需要非常非常高的芯片生產量才能去攤薄這個成本。換句話說，如果芯片的產量不到，那么你就沒有能力去使用最新的工藝，只能沿用較舊的工藝。這就部分打破了摩爾定律 “投資發展制程－芯片生產成本降低－用部分利潤繼續投資發展制程”的邏輯。

　　而物理學的障礙主要來源于量子效應和光刻精度。晶體管太小就會碰到各種各樣的問題，比如當特征尺寸縮小到10nm的時候，柵氧化層的厚度僅僅只有十個原子那么厚，這時便會產生諸多量子效應，導致晶體管的特性難以控制。

　　我認為，現在芯片行業的發展已經到了瓶頸期，接下來的發展策略有三種，分別是More Moore， More than Moore和Beyond Moore。第一種More Moore，意思是繼續按照摩爾定律的老路走下去，繼續縮小晶體管尺寸；第二種More than Moore，意思是首先芯片系統性能的提升不再單純地靠晶體管的縮小，而是更多地靠電路設計以及系統算法優化。其次集成度的提高不一定要靠把更多模塊放到同一塊芯片上，而是可以靠封裝技術來實現，例如Intel的EMIB，TSMC的InFO等等（蘋果的處理器就用了InFO技術）；第三種Beyond Moore，意思是干脆不用CMOS器件而是去研發一些新的器件，不過這個目前看起來還比較遙遠。未來估計是會More Moore結合More than Moore，隨著時間推移More than Moore比重越來越大。

　　其實我對未來還是蠻悲觀的，這個瓶頸期如果沒有新器件誕生的話，應該會持續5年10年甚至更長一段時間。就像鋼鐵行業，它早已進入平緩期，也沒什么特別新的技術，如果這個行業想要有比較大的發展，那除非是發現新的材料可以替代鋼。半導體行業也一樣，什么時候出來新器件結束這個瓶頸期我也不知道，有的時候科學上的事情就是很偶然，可能突然就發現某種材料可以用了，但如果你找不到新材料，就是沒辦法有很大突破。

　　二、NV/Google/Intel/AMD在AI芯片的不同戰略

　　其實人工智能計算還是分很多領域，芯片應用大概有兩個極端：一個是用于云端服務器的高功耗高計算能力的芯片，走的是高性能超級計算機（HPC）的路子；另一個是用于終端（比如手機）的人工智能芯片，這個就特別注重低功耗，對計算能力的要求不是特別高。

　　在云端服務器這個領域，因為要處理海量的數據，Nvidia的GPU已經成為服務器不可或缺的一部分，但Nvidia自己目前還沒有打算大規模自己做服務器，因此在人工智能的云端市場，Nvidia提供的是硬件而非平臺。而在終端這個領域，Nvidia基于GPU的人工智能平臺一方面功耗太大，另一方面過高的計算能力反而導致成本過高，因此無法與定制芯片抗衡。其實，Nvidia的人工智能平臺最具優勢的應用場景是上面兩種情況的中間，即數據量中等、對計算能力要求還比較高、對功耗有一定要求但是并不苛刻的地方，比如ADAS市場。Nvidia人工智能平臺無論計算能力（10-100TOPS）還是功耗（10-100W）都能完美地符合要求，因此它主打自動駕駛市場并不奇怪，它在2017年1月份舉辦的CES上也主要發布了自動駕駛相關的產品。

　　Intel的話，從三個方面來說吧。第一，在云端市場，它是最大的玩家，并且正在積極準備與Nvidia抗衡，因為Intel在HPC方面的業務本來就是駕輕就熟，而Nvidia進入HPC還沒有幾年，只能算這個市場的new player。大概是在2013年的時候，人們才發現原來GPU可以用于深度學習，之前根本不知道這個事情。說回Intel，它在收購Altera之后推出了基于FPGA的專用深度學習加速卡，可以在云端使用。另外Intel收購Nervana后正在積極推廣結合其技術為AI優化的Knight Mill至強處理器，目標也是在云端。第二，在車載端，Intel與Mobileye和BMW結成了自動駕駛聯盟，Mobileye提供傳感器芯片和算法，Intel提供云端計算平臺，BMW提供汽車。第三，在移動端，Intel收購了Movidius，但是尚未看到大的動作。所以我預期，移動端的人工智能芯片，如果有的話還是高通之類的廠商會比較有優勢。

　　再說Google，它推出來的芯片TPU主要是自用的。這個有點像IBM，IBM最早出的Power PC系列芯片也是為了給自己的server用。所以Google也是類似的思路，它的芯片就沒有打算給別人用，換句話說它沒有真的打算進入芯片這個市場，和別人競爭。

　　最后說AMD，它在GPU和CPU的技術都處于追趕者的位置，在AI方面比較低調，在CES上公布新產品的時候也都沒有主動去提人工智能的事情。最近的新聞大概是和阿里巴巴合作云端服務作為試水。AMD的總體思路還是求穩，不刻意去跟Nvidia爭誰先誰后，它就等你們把這些東西先做出來再說，自己就很踏實地把顯卡技術做好。其實GPU天生就符合深度學習的要求，只要AMD把自己芯片的運算能力做上去，它很快就可以殺入人工智能這個領域中來。

　　三、Nvidia面臨的機遇和挑戰

　　2016年是人工智能爆發的一年，借著這股東風，Nvidia的股價在去年飛升三倍有余，令人驚嘆。目前看來，Nvidia的技術成長空間還有很多，因為Nvidia正在轉型成為平臺公司而不是硬件公司，GPU會是它的核心但是不是全部，它要做的是圍繞GPU的一個平臺、一個生態。與GPU配套的各種設施，例如開發平臺、開發者社區和包絡編程語言在內的開發工具也非常重要。舉例來說，在筆記本PC市場，其實ARM的處理器性能完全可以和Intel相抗衡，但是為什么基本沒有筆記本電腦用ARM的處理器？就是因為ARM在筆記本PC上沒有任何生態。一旦平臺和生態做起來，即使它的技術發展不像原來那么生猛，我相信Nvidia的商業價值仍然可以得到保證。假如明天AMD做出來一個和Nvidia性能一模一樣的GPU，它一時半會兒也還是無法取代Nvidia，因為Nvidia有自己的CUDA、CUDNN等配套的開發工具。

　　而Nvidia可能會面臨的最大風險在于，它現在的股價完全由人工智能來支撐，但人工智能的應用會不會像投資者想象中發展的那么快是存疑的。其實非常明顯現在人工智能的應用有很大的泡沫，大家預期它在一兩年之內會起來。但是如果它在一兩年之內沒有起來或者說某些應用沒有能真的落地，那時候投資者可能會有些反沖?，F在是一個overshoot，發現沒有達到預期之后就會有一個undershoot，幾次震蕩之后慢慢回到理性估值。

　　四、FPGA的玩家和留給創業公司的機會

　　FPGA全稱“可編輯門陣列”（Field Programmable Gate Array），其基本原理是在FPGA芯片內集成大量的數字電路基本門電路以及存儲器，而用戶可以通過燒入FPGA配置文件來來定義這些門電路以及存儲器之間的連線。這種燒入不是一次性的，即用戶今天可以把FPGA配置成一個微控制器 MCU，明天可以編輯配置文件把同一個FPGA配置成一個音頻編解碼器?，F在FPGA和人工智能相關的主要機會是云端服務器的可配置運算，目前這個領域的玩家主要是兩個，Xilinx和Altera，后者已經被Intel收購。

　　當下FPGA遇到的一個最關鍵的問題就是開發者生態。傳統CPU也好GPU也好，編程是比較容易的，使用的是語言是C++、Java，大家都很熟悉，而且已經形成了成熟的體系，開發環境、生態系統還有開發者的社區這些都很好。但是FPGA開發通常需要使用硬件描述語言，如Verilog、VHDL等等，這些對于程序員來說需要大量的時間才能掌握。這樣的話FPGA的生態就無法發展，因為門檻高意味著做的人少，做的人少意味著知名度低，相關項目數量少，這又導致了無法吸引到開發者參與項目，如此便形成了惡性循環。

　　針對這種情況，Xilinx就發布了一個比較能改善生態的東西，叫做可重配置加速棧，這些用于云端的FPGA將會使用部分重配置方案。什么意思呢？通常FPGA配置過程包括硬件描述語言的綜合、布局布線、最后產生比特流文件并寫入以完成配置。在這個過程中，綜合以及布局布線花費的時間非常長，可達數小時，而最后比特流文件寫入以及配置可以在一秒內完成。用于云端的FPGA方案為了實現快速應用切換，預計將會使用硬IP（即針對某應用硬件加速的比特流），并在需要使用該應用時快速寫入該比特流。在未來，云端FPGA的生態預計將不止包括Xilinx，還會包括許多第三方IP提供商，最后形成類似App Store的形式讓使用者方便地選購對應的硬件加速方案并實時加載／切換。

　　目前國內FPGA水平較弱，而且FPGA需要一整套從軟件到硬件的流程，需要深刻的積累，對于創業公司并不是一個最好的方向，更適合國家科研項目。但是創業公司使用FPGA，做FPGA的解決方案，基于FPGA開發或者做FPGA上的IP，是個不錯的機會。換句話說就是你不去手機，而是做APP。其實這個方向國內也已經有不少公司在做了，我知道的比較出名的有深鑒科技。

　　五、玩人工智能軟件的正確姿勢

　　目前人工智能軟件最大問題是如何把技術真正落實到解決消費者的需求，一些算法非常有技術含量，但是落地并不容易，例如圖像分類等等。我覺得現在做的比較好的軟件是語音識別／交互類，比較典型的是訊飛輸入法，前陣子在錘子手機的發布會上被秀了一把。

　　圖像類的人工智能算法目前是最火的方向，比語音類要火很多，但是目前看來圖像算法大多數只能作為一個大系統的一部分。比如一個安防系統，圖像算法可以用來檢測一個人是否帶刀，但是把這個軟件單獨拉出來賣就不一定能成立了。當然也有單獨做軟件的，例如Prisma，這個之前在Instagram很火的軟件就是利用深度學習來做圖像風格變換。總結一句話就是，人工智能相關的軟件當然是一個非常好的創業方向，只是要找準這個創新的賣點，光有好的技術其實是沒什么大用的。

　　在人工智能領域，國內也出現了一批還不錯的公司，我有在關注。在圖像檢測／人臉識別領域，有依圖科技、Face++、商湯科技三只領頭羊，它們主要為銀行和一些安防系統提供人臉識別的解決方案。在醫療領域，就是用人工智能幫忙人類判定疾病也有很多公司在做，一圖正在進軍這個領域。在自動駕駛領域，軟件方面做的比較有名的是圖森、地平線。其實地平線攤子鋪得比較大，硬件軟件都做，除了輔助駕駛外，還跟美的合作在做智能家居。還有一些比較小眾的領域，比如鑒黃，就是圖譜在做。硬件的話，比較有名的是寒武紀。

　　六、芯片行業的未來除了人工智能，還有……

　　最后再說回到整個芯片行業的發展上來。有人問，芯片行業是不是有一個強者恒強的規律，出現黑馬的幾率有多大。我認為是這樣的：在芯片這個地方，它是每隔一段就會換一個應用方向，90年代時候最火的是多媒體電腦，也就是PC端，后來就變到了移動端，最近則是人工智能。眾所周知，Intel是PC時代永遠的老大，在那25年的時間里基本碾壓所有競爭對手，但移動設備這個方向它就完全錯過了。所以說，在同一個領域里基本上是強者恒強，很難有超越，但是在這個領域強，不代表在下一個領域也會強，在“時代”交替的時候是最容易出黑馬的。我們在評判企業價值的時候，要對芯片的技術應用有一個判斷，要非常清楚下一個所謂的風口在哪里。

閱讀全文