色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探討NLP技術落地的難點及如何降低開發者門檻的問題

電子工程師 ? 來源:cc ? 2019-01-10 09:06 ? 次閱讀

AI 很火,但是 AI 的門檻也很高,普通的開發者想要搭上這波 AI 紅利依然困難。

近期,人工智能公司推出了新一代智能 Bot 開放平臺,它整合了小i機器人 Chatting Bot、FAQ Bot、Discovery Bot 三大核心能力,為企業和開發者提供智能機器人服務+人工在線服務+智能人機協作學習的完整使用閉環,除智能客服場景應用外,智能營銷、智能外呼、智能硬件等多種不同類型的應用場景也將陸續開放。

平臺開放的目的就是降低企業使用和擁有AI技術的成本與門檻,讓企業和開發者快速開發出滿足自身業務需求的智能服務系統或者具有智能交互能力的對話機器人。

近日,CSDN主編下午茶邀請到了小i機器人技術委員會輪值主席兼首席架構師李波,與我們一起探討了NLP技術落地的難點,以及如何降低開發者門檻的問題,希望能對廣大讀者有所啟發。

NLP的發展方向

AI科技大本營:能簡單介紹下 NLP 技術嗎?

李波:NLP 技術目前有兩種,一種是基于規則,還有一種是基于統計。近年來,基于統計的 NLP 技術占據了上風,特別是深度學習出現之后,基于統計的 NLP 技術進展快很多。并不是說誰更優,或者誰更差,它們各有所長,比如基于統計的模型的泛化性比較好,但是它是一個黑盒。一些應用還需要兩者結合使用,比如在問答系統中,有些機器回答并不是很友好,就可以利用基于規則的方法做補充,兩者結合來達到產品化的程度。

拋開運算智能,人工智能主要包含兩個層面,一個是認知智能,一個是感知智能。比如常見的語音識別、圖像識別就屬于感知智能的層面,目前比較成熟的 落地應用也比較多,而 NLP 則屬于認知智能層面。NLP 往往需要結合上下文信息,甚至考慮背景知識、常識性知識等。另外,感知智能(如圖片識別)的輸入輸出一般是單輪的(single-turn),但是 NLP 往往需要多輪的(multi-turn)交互后才能得到結果。目前 NLP 技術還處于發展的早起階段,還有很多難點需要突破。

AI科技大本營:你覺得它未來還會有很快的進展嗎?還有哪些需要探索的方向?

李波:常識和背景知識:用 NLP 做專業性很強的事情,可能效果會很好,反到是小概率簡單的事情做不到,因為缺乏常識。想要解決這個問題就需要構建常識庫,然后與模型結合,這是一個難點,也是大家比較愿意探索的一個方向。

多模態:人類是通過視覺、聽覺等各種感觀結合在一起來理解一件事情的,也就是多模態。假設 NLP 系統可以同時結合音頻視頻來理解用戶的意圖,那么可能會有更大的突破。

預訓練:這是近期大家可以嘗試的一個熱點。預訓練在音頻和圖片領域已經得到了廣泛應用,最近 Google 的 BERT 則是把預訓練運用到了 NLP 領域,取得了不錯的效果。這也是近期的一個熱點,大家可以去嘗試。

強化學習:在認知智能方面,強化學習也有些不錯的方向。

NLP如何走出實驗室

AI科技大本營:學術界的成果能夠及時地應用到工業界嗎?

李波:有些技術可以及時轉化,有些技術還需要轉化周期。這個轉化周期意思就是說,我們要考慮商用模型的性能和準確率,此外還有其他的工程條件,滿足這些標準之后,才可以把研究成果輸出到產品。學術界訓練一個模型只看最后的評價指標,也就是一個百分比的結果,但落地的時候考慮更多因素,比如一個準確率 99% 的模型,但剩下 1% 的工程化的工作量,不一定比99%工作量小。

AI科技大本營:從實驗室到模型商用化落地,你們最關心什么?

李波:我們最關心的首先是要模型的可用性要達到工業化落地的標準,除此之外包括產品的 UI 設計、體驗設計等也非常重要。NLP 不像圖片和語音,在 UI 方面需要考慮的更多。比如機器翻譯系統的準確率達到一定程度后,如果 UI 做得不好,用戶體驗不好,可能會對落地造成的很大的影響。這是一個系統化的工程,包括成本、用戶體驗,為客戶帶來多少價值等,都需要考慮。

AI科技大本營:關于 AI 創業公司落地難的問題,小i機器人有什么好的經驗可以分享嗎?

李波:跟圖片和語音對比,NLP 特別難,NLP涉及到的多模態是它的一個難點。第二個難點是需要結合背景知識及常識。這兩個問題在目前并沒有很好的處理方式。小i 主要是結合基于規則+統計的方式,引入知識,比如我之前提到的領域語義庫,目的就是融入常識和背景知識。最后就是個性化的問題,NLP 的輸出往往和個體相關,不同的個體需要依據人物畫像等信息給出不同的個性化的結果,這樣才更接近人類的處理方式。

此外,NLP 的落地場景不是那么直接,需要結合客戶或者是產品設計。比如做推薦,我們訓練模型的關注點可能就是模型對應的幾個指標,比如查準率等,但是客戶看的是最后推薦的效果,也就是用戶實際的評價和購買情況。因此,不管實驗室的效果如何,在實際效果中,需要根據客戶的反饋不斷調整系統參數,調整訓練數據,或者結合其他算法等等,以此來提高最終落地的效果。

上線運行之后,我們還需要根據運營的日志和客戶的行為,再迭代模型,這是一個閉環。而不是說不結合實際場景,把模型訓練好后直接投入使用,然后就不管了,不是這回事,需要根據運營的數據,不斷調優迭代。

AI科技大本營:模型可控性的問題怎么解決?

李波:比如我們幫客戶做的智能客服機器人,主要依靠混合模型引擎來達到可控的目的。另外也可以通過一些工程化手段來做到可控,如在問答中涉及到一些敏感的內容,我們可以通過前處理、后處理等方式及時干預,而無需更新模型、重啟系統。在用戶真實的使用過程中發現問題時,我們需要有渠道、有方法控制系統的輸出,甚至邏輯,保證系統是可控的。

AI科技大本營:哪些方法可以使它可控?

李波:我們的混合模型引擎包含兩種模型,一個是黑盒子,就是深度學習模型,另一個是語義理解模型,基于傳統的語義表達式,可以用來做干預。語義理解模型可以直接通過語義表達式來進行更改,而深度學習模型想要干預則必須重新訓練。因此我們可以讓深度學習模型和語義理解模型同時作用,然后調整深度學習模型和語義理解模型的輸出策略(如優先級策略等)來調優。

小i機器人如何收集數據?

AI科技大本營:小i機器人是如何積累數據的?

李波:主要是三個方面:第一,我們會通過爬蟲去爬取相關的行業數據。第二,我們的云端產品產生的日志數據,會直接收集到我們的數據平臺里。第三,客戶提供的素材,我們會把它轉化成數據和知識。

AI科技大本營:數據收集之后怎么處理?

李波:非結構化數據:首先我們會對收集到數據進行數據清洗,然后再按照知識的分類通過機器+人工方式將其歸類,再通過一些手段(如規則等)做一些粗顆粒度的標注,之后由人工確認,確認完后入庫。

半結構化數據:客戶提供的原始帶格式文檔,通過格式規則分析或者機器學習模型等手段來進行分類或者聚類等輔助處理,然后再進行人工梳理,最后入庫。

AI科技大本營:數據的處理靠機器和人工的結合?

李波:機器做前期輔助,人工做最終的確認,而不是機器處理之后直接入庫。小i有一個大的數據平臺和一個標注系統,還有一個實驗室系統,共同運作來產生這些行業訓練數據以及行業背景知識,然后以領域語義庫的形式部署到實際系統中。

小i機器人如何賦能開發者?

AI科技大本營:現在有很多平臺和工具可以幫助開發者去降低門檻,據我所知,小i最近也推出了新一代智能 Bot 開放平臺,這個平臺能給開發者帶來什么?

李波:幫助中小企業或者開發者快速打造一個適應各種實際場景的AI系統。第一個落地的場景是智能客服,以問答能力為主,降低人工客服的成本。第二個應用場景是智能營銷,以營銷推薦為主,包括用戶畫像等,我們會在后期推出。第三個應用場景是智能外呼。后續我們還會推出更多的場景。開發者不僅可以直接使用這些場景,還可以基于每個場景的API來擴充應用的能力。

AI科技大本營:因為現在有各種各樣的平臺和工具,假設我是個新手,我就做一個小項目練練手,應該怎么做?

李波:這個平臺的目的是降低開發者的門檻。開發者如果是自己收集數據,然后訓練模型,開發周期很長,而且有很多的坑要趟。我們的這個平臺有兩個目標,第一,讓用戶可以直接使用;第二個,開發者可以基于這個平臺擴充自己的能力。

使用我們的平臺,開發者需要提供的數據只是問答的基本意圖點,我們在底層有領域語義庫做支撐,我們會自動在詞的層面,在句法層面幫你擴充數據集,然后自動幫你去訓練。

AI科技大本營:關于NLP技術的工程實踐,您對開發者有什么建議嗎?

李波:針對NLP的開發者有幾點建議:首先,你要對相關技術有全面的了解,不一定要特別細化,這樣對開發會有幫助;第二,一定要明確你的輸入和輸出;最后,開發者要更多地關注產品體驗。

AI科技大本營:最后,您平時都是怎樣自我學習的,有哪些經驗可以分享下嗎?

李波:互聯網是一個非常好的渠道,我比較喜歡“碰到問題后在解決問題的過程中學習“的方式。如果你只是通過書本去學習,而忽略實踐,就會比較虛。因此要結合實踐,哪怕是做一些Demo嘗試也可以。在嘗試過程中遇到問題,然后通過各種方式去獲取答案,而不是像學校里的傳統方式去學習。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30763

    瀏覽量

    268907
  • nlp
    nlp
    +關注

    關注

    1

    文章

    488

    瀏覽量

    22033

原文標題:NLP技術落地為何這么難?里面有哪些坑?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2024開放原子開發者大會暨首屆開源技術學術大會成功舉辦

    近日,以“一切為了開發者”為主題的2024開放原子開發者大會暨首屆開源技術學術大會在武漢成功舉辦。大會為眾多開源項目和開發者提供了廣闊的展示空間,為繁榮開源生態注入了強勁動力。與會
    的頭像 發表于 12-23 14:23 ?57次閱讀

    云端AI開發者工具怎么用

    云端AI開發者工具通常包括代碼編輯器、模型訓練平臺、自動化測試工具、代碼管理工具等。這些工具不僅降低了AI開發門檻,還極大地提高了開發效率
    的頭像 發表于 12-05 13:31 ?113次閱讀

    涂鴉推出面向個人開發者的TuyaOpen Framework!極客爭鋒大賽限時報名拿大獎啦

    為了幫助開發者們高效降低開發智能產品的門檻,涂鴉本次重磅推出面向個人開發者的TuyaOpenFramework!它是涂鴉專門為科技愛好
    的頭像 發表于 11-08 01:04 ?192次閱讀
    涂鴉推出面向個人<b class='flag-5'>開發者</b>的TuyaOpen Framework!極客爭鋒大賽限時報名拿大獎啦

    KaihongOS 4.1.2開發者預覽版正式上線,誠邀開發者免費試用!

    深開鴻在2024開放原子開源生態大會上正式宣布KaihongOS4.1.2開發者預覽版全面上線,并向全球開發者開放免費下載。作為KaihongOS不斷創新與發展的重要里程碑,此次預覽版為開發者提供了
    的頭像 發表于 09-28 08:07 ?330次閱讀
    KaihongOS 4.1.2<b class='flag-5'>開發者</b>預覽版正式上線,誠邀<b class='flag-5'>開發者</b>免費試用!

    KaihongOS 4.1.2開發者預覽版正式上線,誠邀開發者免費試用!

    今日,深開鴻在2024開放原子開源生態大會上正式宣布KaihongOS 4.1.2開發者預覽版全面上線,并向全球開發者開放免費下載。作為KaihongOS不斷創新與發展的重要里程碑,此次預覽版為
    的頭像 發表于 09-26 15:59 ?451次閱讀

    降低物聯網開發門檻的TuyaOS重磅更新:AI賦能設備升級,配網速度10倍提升

    作為降低智能解決方案開發門檻的 TuyaOS 操作系統,此次又迎來了重大更新(點擊查看 TuyaOS 完整介紹)! 本次 TuyaOS 3.10.0 版本發布了超豐富的開發框架,覆蓋多
    的頭像 發表于 07-22 11:47 ?289次閱讀
    <b class='flag-5'>降低</b>物聯網<b class='flag-5'>開發</b><b class='flag-5'>門檻</b>的TuyaOS重磅更新:AI賦能設備升級,配網速度10倍提升

    涂鴉智能借助亞馬遜云科技全面擁抱生成式AI打造智慧解決方案 提升開發者效率

    ,極大提升了開發者效率和終端消費體驗。其中,通過“T-Smart開發者平臺AI助手”的引入,涂鴉智能進一步簡化了產品開發流程,將開發者原本
    發表于 07-08 14:06 ?121次閱讀

    報名開啟!第二屆OpenHarmony開發者大會2024重磅來襲!

    了44款發行版,落地商用設備303款,覆蓋金融、超高清教育、商顯、工業、警務、城市、交通、醫療等領域。 誠邀您參加OpenHarmony開發者大會2024,共赴一場技術盛宴,探討未來生
    發表于 05-14 15:23

    MediaTek 天璣開發者大會MDDC 2024啟幕

    Conference, 簡稱MDDC)是一場面向全球開發者的行業盛會,旨在與生態合作伙伴和開發者共同探討行業發展趨勢,分享知識、經驗和先進技術成果。本屆大會的主題為“AI予萬物”,屆
    的頭像 發表于 05-07 10:25 ?669次閱讀

    涂鴉推出完全開源的open sdk開發框架!大大降低IoT開發門檻

    開發者來說,IoT開發難點是什么?首先,IoT涉及到多個領域和多種開發技術,每一層的技術接口
    的頭像 發表于 04-12 08:14 ?1147次閱讀
    涂鴉推出完全開源的open sdk<b class='flag-5'>開發</b>框架!大大<b class='flag-5'>降低</b>IoT<b class='flag-5'>開發</b><b class='flag-5'>門檻</b>

    鴻蒙系統優缺點,能否作為開發者選擇

    起跑線,都是0基礎開始。學習來輕松,未來趨勢大。 那么鴻蒙的發展,開發者如何抓住機遇?鴻蒙的開發技術要學習那些呢?下面分享鴻蒙的開發者技術
    發表于 02-16 21:00

    華為宣布HarmonyOS NEXT鴻蒙星河版開發者預覽面向開發者開放申請

    華為宣布HarmonyOS NEXT鴻蒙星河版開發者預覽面向開發者開放申請,這意味著鴻蒙生態進入第二階段,將加速千行百業的應用鴻蒙化。
    的頭像 發表于 01-29 16:42 ?1410次閱讀
    華為宣布HarmonyOS NEXT鴻蒙星河版<b class='flag-5'>開發者</b>預覽面向<b class='flag-5'>開發者</b>開放申請

    您有一份OpenHarmony開發者論壇2023年度總結,請查收~

    體驗用戶,并迅速在論壇開啟了 OpenHarmony 技術交流。 通過開發者們在論壇進行提問、答疑、分享技術文章、技術資料等方式為論壇沉淀了豐富的 OpenHarmony
    發表于 01-26 17:27

    HarmonyOS SDK,助力開發者打造煥然一新的鴻蒙原生應用

    ,即可降低開發者接入門檻,實現用戶在地圖上選擇所需地點此類場景的使用體驗。 煥然一新的鴻蒙原生應用:更純凈、更智能、更精致、更易用 應用上架后的用戶體驗,也是開發者最關注的。Harm
    發表于 01-19 10:31

    降低物聯網開發門檻的TuyaOS大更新

    作為降低物聯網開發門檻的TuyaOS操作系統,此次又迎來了重大更新(點擊查看TuyaOS完整介紹)!本次TuyaOS3.9.0版本發布了超豐富的開發框架,覆蓋多種協議連接和平臺??晒?/div>
    的頭像 發表于 01-05 08:14 ?922次閱讀
    <b class='flag-5'>降低</b>物聯網<b class='flag-5'>開發</b><b class='flag-5'>門檻</b>的TuyaOS大更新
    主站蜘蛛池模板: chinese情侣自拍啪hd| 美女挑战50厘米长的黑人| 国产午夜小视频| 国产一区内射最近更新| 好男人好资源在线观看| 久久re视频这里精品09首页| 久久中文字幕亚洲精品最新| 男同志vdieos免费| 日韩精品 电影一区 亚洲高清| 同时被两个男人轮流舔| 亚洲欧美中文字幕高清在线| 制服丝袜 快播| no视频在线观看| 国产高清在线a视频大全| 精品国产成人系列| 免费三级网址| 天天色天天综合网| 伊人成色综合人网| 把腿张开再深点好爽宝贝| 国产精品三级在线观看| 久久精品视频在线看99| 欧美性狂猛AAAAAA| 亚洲成人一区| 97视频在线观看免费视频| 国产GV无码A片在线观看| 果冻传媒2021在线观看| 暖暖日本手机免费完整版在线观看| 日本六九视频| 亚洲天堂久久久| jiz中国zz| 黄色三级图片| 日本国产黄色片| 一个人免费完整在线观看影院| 阿力gv资源| 国色天香社区视频免费高清3| 捏揉舔水插按摩师| 亚洲AV无码久久流水呻蜜桃久色| 97在线播放视频| 国产亚洲视频在线播放香蕉| 欧美6O老妪与小伙交| 亚洲成片在线看|