隨著基于人工智能與機(jī)器學(xué)習(xí)的應(yīng)用如雨后春筍般不斷涌現(xiàn),我們也看到有很多提供類似功能的 API 悄悄登上了舞臺(tái)。 API 是用于構(gòu)建軟件應(yīng)用的程序、協(xié)議以及工具的組合;本文是對(duì)2015 中這個(gè)列表的修正與完善,移除了部分被廢棄的 API ;我們也添加了最近由 IBM、Google、Microsoft 這些大廠發(fā)布的 API 。所有的 API 可以根據(jù)應(yīng)用場(chǎng)景進(jìn)行分組:
人臉與圖片識(shí)別。
文本分析,自然語(yǔ)言處理以及情感分析。
語(yǔ)言翻譯。
預(yù)測(cè)以及其他的機(jī)器學(xué)習(xí)算法。
在具體的每個(gè)分組內(nèi),我們根據(jù)首字母順序排序; API 的描述信息源自截止到 2017 年 2 月 3 日對(duì)應(yīng)主頁(yè)上的描述。如果你發(fā)現(xiàn)存在未被收錄的流行的 API 可以在評(píng)論中留言,我們會(huì)將其增補(bǔ)到列表中。
人臉與圖片識(shí)別
Animetrics Face Recognition:?該 API 能夠用于圖片中的人臉檢測(cè),并且將其與已知的部分人臉進(jìn)行匹配分析;該 API 還支持從某個(gè)待搜索的集合中添加或者移除某個(gè)分類,或者從某個(gè)分類中添加或者刪除某張人臉圖片。
Betaface: 同樣是提供人臉識(shí)別與檢測(cè)的在線服務(wù)。它支持多人臉檢測(cè)、人臉裁剪、123 個(gè)人臉特征點(diǎn)提取、人臉驗(yàn)證、識(shí)別以及大型數(shù)據(jù)庫(kù)中的相似性搜索提取。
Eyedea Recognition:?致力于提供高階的計(jì)算機(jī)視覺(jué)解決方案,主要包括對(duì)象檢測(cè)與識(shí)別。其識(shí)別服務(wù)提供了常見(jiàn)的眼部、人臉、車輛、版權(quán)以及果盤(pán)識(shí)別,該 API 主要的價(jià)值在于對(duì)于對(duì)象、用戶以及行為的快速識(shí)別。
Face++: 為應(yīng)用提供面部的檢測(cè)、識(shí)別以及分析服務(wù),用戶可以通過(guò) API 調(diào)用訓(xùn)練模型,進(jìn)行人臉檢測(cè)、人臉識(shí)別、人臉?lè)诸悺D像修正、創(chuàng)建人臉?lè)纸M等等服務(wù)。
FaceMark: 提供了能夠在正面照片中檢測(cè) 68 個(gè)特征點(diǎn)以及側(cè)面照片中檢測(cè) 35 個(gè)特征點(diǎn)的服務(wù)。
FaceRect: 提供了非常強(qiáng)力與完整的面部檢測(cè)的 API ,包括在正面照片與側(cè)面照片中檢測(cè)面部以及在單張照片中提取多個(gè)面部的功能;它還能將結(jié)果以 JSON 格式輸出,包括檢測(cè)到的眼睛、鼻子、嘴等等面部特征。
Google Cloud Vision API: 架構(gòu)于著名的?TensorFlow?之上,能夠高效地學(xué)習(xí)與預(yù)測(cè)圖片中的內(nèi)容。它能夠有助于用戶搜索最愛(ài)的圖片,并且獲取圖片中豐富的注釋。它還能將圖片按照船、獅子、埃菲爾鐵塔等等不同的類別進(jìn)行分類,并且對(duì)照片中不同表情的面部進(jìn)行識(shí)別,除此之外它還能將圖片中不同國(guó)家的語(yǔ)言打印出來(lái)。
IBM Watson Visual Recognition: 該 API 能夠輔助理解圖片內(nèi)容,包括圖片標(biāo)記、人臉識(shí)別、年齡估計(jì)以及性別判斷,還能根據(jù)人臉相似度進(jìn)行搜索。開(kāi)發(fā)者能夠在該服務(wù)的基礎(chǔ)上結(jié)合自身業(yè)務(wù)特點(diǎn)定制出各式各樣奇妙的產(chǎn)品。
Kairos: 該平臺(tái)方便開(kāi)發(fā)者快速添加?情感分析?與?人臉識(shí)別?的功能到應(yīng)用與服務(wù)中。
Microsoft Cognitive Service - Computer Vision: 該 API 能夠根據(jù)用戶輸入與用戶選擇分析可視化內(nèi)容。譬如根據(jù)內(nèi)容來(lái)標(biāo)記圖片、進(jìn)行圖片分類、人類識(shí)別并且返回他們的相似性、進(jìn)行領(lǐng)域相關(guān)的內(nèi)容識(shí)別、創(chuàng)建圖片的內(nèi)容描述、定位圖片中的文本、對(duì)圖片內(nèi)容進(jìn)行成人分級(jí)等。
Rekognition: 該 API 能夠根據(jù)社交圖片應(yīng)用的特點(diǎn)提供快速面部識(shí)別與場(chǎng)景識(shí)別。譬如基于人眼、嘴、面部以及鼻子等等特征進(jìn)行性別、年齡以及情緒預(yù)測(cè)。
Skybiometry Face Detection and Recognition: 該 API 提供人臉檢測(cè)與識(shí)別服務(wù),新版本的 API 還提供了深色微分功能。
文本分析,自然語(yǔ)言處理,情感分析
提供了目前市場(chǎng)上來(lái)說(shuō)幾乎最準(zhǔn)確的基于情感的多主題識(shí)別,目前包括四個(gè)語(yǔ)義服務(wù):實(shí)體與概念抽取、情感分析與文本分類;該 API 總共支持 8 種不同的語(yǔ)言。
Diffbot Analyze: 為開(kāi)發(fā)者提供了從任何網(wǎng)頁(yè)中識(shí)別、分析以及提取主要內(nèi)容與區(qū)塊的功能。
Free Natural Language Processing Service: 提供了包括情感分析、內(nèi)容提取以及語(yǔ)言檢測(cè)等功能。它同樣是 mashape.com 這個(gè)大型云 API 市場(chǎng)中的暢銷產(chǎn)品之一。
Google Cloud Natural Language API: 該 API 提供了對(duì)于文檔的架構(gòu)與含義進(jìn)行分析的功能,包括情感分析、實(shí)體識(shí)別以及文本標(biāo)注等。
IBM Watson Alchemy Language: 該 API 能夠輔助電腦學(xué)習(xí)如何閱讀以及進(jìn)行一些文本分析任務(wù)。譬如將非結(jié)構(gòu)化數(shù)據(jù)按照領(lǐng)域模型轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),使其能夠服務(wù)于社交媒體監(jiān)測(cè)、商業(yè)智能、內(nèi)容推薦、商業(yè)交易以及定向廣告等等服務(wù)。
MeaningCloud Text Classification: 該 API 提供了部分預(yù)分類的功能:文本提取、分詞、停用詞設(shè)置以及同義詞提取等等。
Microsoft Azure Text Analytics API?基于 Azure Machine Learning 實(shí)現(xiàn)的一系列文本分析服務(wù)。該 API 能夠用于情感分析、關(guān)鍵語(yǔ)句提取、語(yǔ)言檢測(cè)以及主題識(shí)別這些非結(jié)構(gòu)化文本的處理任務(wù)。該 API 并不需要使用者提供相關(guān)的訓(xùn)練數(shù)據(jù),能夠大大降低使用門(mén)檻。
Microsoft Cognitive Service - Text Analytics: 提供了情感檢測(cè)、關(guān)鍵語(yǔ)句提取、主題以及語(yǔ)言分析等功能。該分組中其他的 API 還包括?Bing 拼寫(xiě)檢測(cè)、語(yǔ)言理解、文本分析、Web 語(yǔ)言模型等等。
nlpTools: 簡(jiǎn)單的采用 JSON 傳輸格式的提供了自然語(yǔ)言處理功能的 HTTP RESTful 服務(wù)。它能夠提供對(duì)于在線媒體的情感分析與文本分類等服務(wù)。
Semantic Biomedical Tagger: 能夠利用文本分析技術(shù)提取出文檔中的 133 個(gè)生物醫(yī)藥學(xué)相關(guān)的實(shí)體詞匯并且將它們鏈接到知識(shí)庫(kù)中。
Thomson Reuters Open Calais?: Calais 基于自然語(yǔ)言處理與機(jī)器學(xué)習(xí)技術(shù),能夠分類與關(guān)聯(lián)文檔中的實(shí)體信息(人名、地名、組織名等)、事實(shí)信息(員工 x 為公司 y 工作)、事件信息(員工 z 在 x 日被任命為 y 公司的主席) 。
Yactraq Speech2Topics?提供了基于語(yǔ)音識(shí)別與自然語(yǔ)言處理技術(shù)的將語(yǔ)音內(nèi)容轉(zhuǎn)化為主題數(shù)據(jù)的云服務(wù)。
語(yǔ)言翻譯
Google Cloud Translation: 能夠在數(shù)以千計(jì)的語(yǔ)言之間完成文本翻譯工作。該 API 允許網(wǎng)頁(yè)或者程序方便地接入這些翻譯服務(wù)。
IBM Watson Language Translator: 能夠在不同語(yǔ)言之間進(jìn)行文本翻譯,該服務(wù)允許開(kāi)發(fā)者基于獨(dú)特的領(lǐng)域術(shù)語(yǔ)與語(yǔ)言特性進(jìn)行自定義模型開(kāi)發(fā)。
LangId: 能夠快速地從多語(yǔ)言中檢索結(jié)果的服務(wù),并不需要使用者指定哪種語(yǔ)言,并且能夠返回結(jié)果對(duì)應(yīng)的語(yǔ)言類型。
Microsoft Cognitive Service - Translator: 能夠自動(dòng)地在翻譯之前進(jìn)行語(yǔ)言類型檢測(cè),支持 9 種語(yǔ)言的語(yǔ)音翻譯以及 60 種語(yǔ)言的文本翻譯。
MotaWord: 快速地人工翻譯平臺(tái),提供了超過(guò) 70 種語(yǔ)言支持。該 API 同樣允許開(kāi)發(fā)者查詢翻譯報(bào)價(jià)、上傳帶有文檔說(shuō)明與樣式指南的翻譯項(xiàng)目請(qǐng)求、自動(dòng)追蹤翻譯進(jìn)度以及進(jìn)行實(shí)時(shí)反饋等。
WritePath Translation: API 允許開(kāi)發(fā)者將 WritePath 功能集成到自定義應(yīng)用中,包括字?jǐn)?shù)檢索、提交文本翻譯任務(wù)、以及獲取翻譯信息等等。
預(yù)測(cè)與其他機(jī)器學(xué)習(xí) API
Amazon Machine Learning: 尋找數(shù)據(jù)中的隱藏模式信息,典型的用法包括詐騙檢測(cè)、天氣預(yù)報(bào)、市場(chǎng)營(yíng)銷以及點(diǎn)擊預(yù)測(cè)等。
BigML: 提供基于云的機(jī)器學(xué)習(xí)與數(shù)據(jù)分析服務(wù),允許用戶以 HTTP 請(qǐng)求的方式自己創(chuàng)建數(shù)據(jù)源以及選擇合適的模型來(lái)處理有監(jiān)督或者無(wú)監(jiān)督的機(jī)器學(xué)習(xí)任務(wù)。
Ersatz: 基于 GPU 支持的深度神經(jīng)網(wǎng)絡(luò)提供的預(yù)測(cè)服務(wù),允許用戶以 API 方式進(jìn)行交互。Ersatz 中還利用增強(qiáng)學(xué)習(xí)來(lái)合并不同的神經(jīng)網(wǎng)絡(luò)模型來(lái)提升整體的效果。
Google Cloud Prediction: 提供了用于構(gòu)建機(jī)器學(xué)習(xí)模型的 RESTful API 。這些工具能夠通過(guò)分析數(shù)據(jù)來(lái)提取出應(yīng)用中數(shù)據(jù)的不同特征,譬如用戶情感、垃圾信息檢測(cè)、推薦系統(tǒng)等等。
Google Cloud Speech API: 能夠提供超過(guò) 80 種語(yǔ)言的快速與準(zhǔn)確的語(yǔ)音識(shí)別以及轉(zhuǎn)化服務(wù)。
Guesswork.co: 能夠?yàn)殡娚叹W(wǎng)站提供產(chǎn)品推薦引擎,Guesswork 可以通過(guò)基于 Google 預(yù)測(cè) API 構(gòu)建的語(yǔ)義化引擎來(lái)對(duì)用戶行為進(jìn)行預(yù)測(cè)。
Hu:toma:?幫助世界各地的開(kāi)發(fā)者構(gòu)建商用級(jí)別的深度學(xué)習(xí)聊天機(jī)器人。
IBM Watson Conversation?: 幫助構(gòu)建可以部署在多個(gè)消息平臺(tái)或者網(wǎng)頁(yè)上的,能夠理解自然語(yǔ)言的聊天機(jī)器人。其他類似的 API 還包括?Dialog、Natural Language Classifier、Personality Insights、Document Conversion以及?Tone Analyzer.
IBM Watson Speech?: 包含了?語(yǔ)音到文本?以及?文本到語(yǔ)音?之間的轉(zhuǎn)化功能(譬如創(chuàng)建語(yǔ)音控制的應(yīng)用)。
IBM Watson Data Insights: 該系列的服務(wù)包含了三個(gè) API :AlchemyData News、Discovery 以及 Tradeoff Analytics。AlchemyData 提供了對(duì)于大量的新聞、博客內(nèi)容的高級(jí)別定向搜索與趨勢(shì)分析的服務(wù)。Tradeoff Analytics 則是幫助用戶在多目標(biāo)優(yōu)化時(shí)進(jìn)行有效抉擇。
IBM Watson Retrieve and Rank: 開(kāi)發(fā)者可以將自定義數(shù)據(jù)導(dǎo)入到服務(wù)中,并且使用相關(guān)的關(guān)聯(lián)發(fā)算法來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型。服務(wù)的輸出包括了一系列相關(guān)的文檔與元數(shù)據(jù),譬如某個(gè)聯(lián)絡(luò)中心的代理能夠基于該服務(wù)提高呼叫的平均處理時(shí)間。
Imagga: 能夠?yàn)槟愕膱D片自動(dòng)打標(biāo)簽,從而允許你的圖片可以被關(guān)聯(lián)搜索到。
indico: 提供了文本分析(情感分析、Twitter 參與度、表情分析等)以及 圖片分析(面部表情識(shí)別、面部定位)。indico 的 API 可以免費(fèi)試用并且不需要任何的訓(xùn)練數(shù)據(jù)。
Microsoft Azure Cognitive Service?API : 基于預(yù)測(cè)分析提供機(jī)器學(xué)習(xí)推薦服務(wù),譬如個(gè)性化產(chǎn)品推薦等,可以用來(lái)代替?zhèn)鹘y(tǒng)的 Azure Machine Learning Recommendations 服務(wù)。新版本提供了批處理支持,更好地 API 檢索服務(wù)、更清晰的 API 使用界面以及更好的注冊(cè)與賬單界面等。
Microsoft Azure Anomaly Detection API?: 能夠在序列數(shù)據(jù)中檢測(cè)出異常數(shù)據(jù),譬如檢測(cè)內(nèi)存使用過(guò)程中是否存在內(nèi)存泄露的情況。
Microsoft Cognitive Service - QnA Maker: 將信息提取為會(huì)話式的、易于瀏覽的數(shù)據(jù)形式。其他類似的 API 還包括?Academic Knowledge、Entity Linking、Knowledge Exploration以及Recommendations。
Microsoft Cognitive Service - Speaker Recognition: 幫助應(yīng)用來(lái)分析檢測(cè)出當(dāng)前的發(fā)言者。其他的類似于的 API 還包括Bing Speech?(將語(yǔ)音轉(zhuǎn)化為文本并且理解其大致含義)、?Custom Recognition?等等。
NuPIC: 由 NuPIC 社區(qū)運(yùn)行與維護(hù)的開(kāi)源項(xiàng)目,其基于 Python/C++ 實(shí)現(xiàn)了 Numenta's Cortical Learning 算法并對(duì)外提供 API 服務(wù)。該 API 允許開(kāi)發(fā)者能夠使用基本算法或者分層算法,也可以選擇使用其他的平臺(tái)功能。
PredicSis: 能夠通過(guò)預(yù)測(cè)分析與大數(shù)據(jù)技術(shù)提供市場(chǎng)營(yíng)銷的效用與收益。
PredictionIO: 基于 Apache Spark、HBase 以及 Spray 這些著名的開(kāi)源項(xiàng)目搭建的開(kāi)源機(jī)器學(xué)習(xí)服務(wù)。典型的 API 包括了創(chuàng)建與管理用戶信息及其行為記錄、檢索項(xiàng)目與內(nèi)容、基于用戶進(jìn)行個(gè)性推薦等等。
RxNLP - Cluster Sentences and Short Texts: 提供了文本挖掘與自然語(yǔ)言處理的服務(wù)。其中語(yǔ)句聚類 API 能夠?qū)⒉煌恼Z(yǔ)句進(jìn)行分類,譬如將不同新聞文章中的語(yǔ)句或者 Twitter、Facebook 上提取出來(lái)的短文本劃分到不同的分組中。
Sightcorp F.A.C.E.: 該 API 能夠幫助第三方應(yīng)用來(lái)更好地理解用戶行為,并且根據(jù)年齡、性別、面部表情、頭部姿勢(shì)以及種族劃分來(lái)進(jìn)行相似面部的分析與搜索。
評(píng)論
查看更多