色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自然語言處理一些相關技術以及相關任務淺析

電子工程師 ? 來源:工程師青青 ? 作者: 電子發燒友 ? 2019-03-29 15:22 ? 次閱讀

本文根據自己的學習以及查閱相關資料的理解總結,簡要的介紹一下自然語言處理(nlp)一些相關技術以及相關任務,nlp技術包括基礎技術和應用技術。后續會抽空繼續分專題完善這一個系列。限于作者水平有限,其中難免有錯漏之處,歡迎讀者斧正。

發展

一般認為1950 年圖靈提出著名的“圖靈測試”是自然語言處理思想的開端。20 世紀 50 年代到 70 年代自然語言處理主要采用基于規則的方法。基于規則的方法不可能覆蓋所有語句,且對開發者的要求極高。這時的自然語言處理停留在理性主義思潮階段。

70 年代以后隨著互聯網的高速發展,語料庫越來越豐富以及硬件更新完善,自然語言處理思潮由理性主義向經驗主義過渡,基于統計的方法逐漸代替了基于規則的方法。

從 2008 年到現在,由于深度學習在圖像識別、語音識別等領域不斷取得突破,人們也逐漸開始引入深度學習來做自然語言處理研究,由最初的詞向量到 2013 年 word2vec,將深度學習與自然語言處理的結合推向了高潮,并且在機器翻譯、問答系統、閱讀理解等領域取得了一定成功。再到最近的emlo、bert等,也許正在揭開下一個篇章。

定義

自然語言是指漢語、英語等人們日常使用的語言,是隨著人類社會發展自然而然的演變而來的語言,不是人造的語言,自然語言是人類學習生活的重要工具。或者說,自然語言是指人類社會約定俗成的,區別于人工語言,如程序設計的語言。

處理包含理解、轉化、生成等過程。自然語言處理,是指用計算機對自然語言的形、音、義等信息進行處理,即對字(如果是英文即為字符)、詞、句、段落、篇章的輸入、輸出、識別、分析、理解、生成等的操作和加工。實現人機間的信息交流,是人工智能界、計算機科學和語言學界所共同關注的重要問題。所以自然語言處理也被譽為人工智能的掌上明珠。

可以說,自然語言處理就是要計算機理解自然語言,自然語言處理機制涉及兩個流程,包括自然語言理解和自然語言生成。自然語言理解是指計算機能夠理解自然語言文本的意義,自然語言生成則是指能以自然語言文本來表達給定的意圖。自然語言的理解和分析是一個層次化的過程,許多語言學家把這一過程分為五個層次,可以更好地體現語言本身的構成,五個層次分別是語音分析、詞法分析、句法分析、語義分析和語用分析。

語音分析是要根據音位規則,從語音流中區分出一個個獨立的音素,再根據音位形態規則找出音節及其對應的詞素或詞。

詞法分析是找出詞匯的各個詞素,從中獲得語言學的信息。

句法分析是對句子和短語的結構進行分析,目的是要找出詞、短語等的相互關系以及各自在句中的作用。

語義分析是指運用各種機器學習方法,學習與理解一段文本所表示的語義內容。 語義分析是一個非常廣的概念。

語用分析是研究語言所存在的外界環境對語言使用者所產生的影響。

基礎技術

基礎技術包括詞法分析、句法分析、語義分析等。

詞法分析(lexical analysis)

詞法分析包括漢語分詞(word segmentation 或 tokenization)和詞性標注(part-of-speech tag)等。

漢語分詞:處理漢語(英文自帶分詞)首要工作就是要將輸入的字串切分為單獨的詞語,這一步驟稱為分詞。

詞性標注:詞性標注的目的是為每一個詞賦予一個類別,這個類別稱為詞性標記。比如,名詞(noun)、動詞(verb)等。

句法分析(syntactic parsing)

句法分析是對輸入的文本句子進行分析得到句子的句法結構的處理過程。最常見的句法分析任務有下列幾種:

短語結構句法分析(phrase-structure syntactic parsing):該任務也被稱作成分句法分析(constituent syntactic parsing),作用是識別出句子中的短語結構以及短語之間的層次句法關系。

依存句法分析(dependency syntactic parsing):作用是識別句子中詞匯與詞匯之間的相互依存關系。

深層文法句法分析:即利用深層文法,例如詞匯化樹鄰接文法(Lexicalized Tree Adjoining Grammar,LTAG、詞匯功能文法(Lexical Functional Grammar,LFG)、組合范疇文法(Combinatory Categorial Grammar,CCG)等,對句子進行深層的句法以及語義分析。

語義分析(Semantic Analysis)

語義分析的最終目的是理解句子表達的真實語義。但是,語義應該采用什么表示形式一直困擾著研究者們,至今這個問題也沒有一個統一的答案。語義角色標注(semantic role labeling)是目前比較成熟的淺層語義分析技術。

總而言之,自然語言處理系統通常采用級聯的方式,即分詞、詞性標注、句法分析、語義分析分別訓練模型。在使用過程中,給定輸入句子,逐一使用各個模塊進行分析,最終得到所有結果。

近年來,研究者們提出了很多有效的聯合模型,將多個任務聯合學習和解碼,如分詞詞性聯合、詞性句法聯合、分詞詞性句法聯合、句法語義聯合等,取得了不錯的效果。

應用技術

另一方面是自然語言處理的應用技術,這些任務往往會依賴基礎技術,包括文本聚類(Text Clustering)、文本分類(Text Classification)、文本摘要(Text abstract)、情感分析(sentiment analysis)、自動問答(Question Answering,QA)、機器翻譯(machine translation, MT)、信息抽取(Information Extraction)、信息推薦(Information Recommendation)、信息檢索(Information Retrieval,IR)等。

因為每一個任務都涉及的東西很多,因此在這里我簡單總結介紹一下這些任務,等以后有時間(隨著我的學習深入),再分專題詳細總結各種技術。

文本分類:文本分類任務是根據給定文檔的內容或主題,自動分配預先定義的類別標簽。包括單標簽分類和多標簽文本分類,。

文本聚類:任務則是根據文檔之間的內容或主題相似度,將文檔集合劃分成若干個子集,每個子集內部的文檔相似度較高,而子集之間的相似度較低。

文本摘要:文本摘要任務是指通過對原文本進行壓縮、提煉,為用戶提供簡明扼要的文字描述。

情感分析:情感分析任務是指利用計算機實現對文本數據的觀點、情感、態度、情緒等的分析挖掘。

自動問答:自動問答是指利用計算機自動回答用戶所提出的問題以滿足用戶知識需求的任務。

機器翻譯:機器翻譯是指利用計算機實現從一種自然語言到另外一種自然語言的自動翻譯。被翻譯的語言稱為源語言(source language), 翻譯到的語言稱作目標語言(target language)。

信息抽取:信息抽取是指從非結構化/半結構化文本(如網頁、新聞、論文文獻、微博等)中提取指定類型的信息(如實體、屬性、關系、事件、商品記錄等),并通過信息歸并、冗余消除和沖突消解等手段將非結構化文本轉換為結構化信息的一項綜合技術。

信息推薦:信息推薦據用戶的習慣、 偏好或興趣, 從不斷到來的大規模信息中識別滿足用戶興趣的信息的過程。

信息檢索:信息檢索是指將信息按一定的方式加以組織,并通過信息查找滿足用戶的信息需求的過程和技術。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自然語言處理

    關注

    1

    文章

    618

    瀏覽量

    13552
  • nlp
    nlp
    +關注

    關注

    1

    文章

    488

    瀏覽量

    22033

原文標題:干貨 | 一文輕松了解NLP所有相關任務簡介!

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    python自然語言

    最近,python自然語言是越來越火了,那么什么是自然語言自然語言(Natural Language )廣納了眾多技術,對自然或人類
    發表于 05-02 13:50

    自然語言處理技術介紹

    專業知識。本文主要介紹自然語言處理領域的一些常用技術。受限于本人在數據處理領域的實踐經驗,在示例的選擇上,主要以個人的研發項目為主,包括自動
    發表于 09-27 09:57

    NLPIR語義分析是對自然語言處理的完美理解

    和邏輯表示。語義分析就是對信息所包含的語義的識別,并建立種計算模型,使其能夠像人那樣理解自然語言。語義分析是自然語言理解的根本問題,它在自然語言
    發表于 10-19 11:34

    自然語言處理怎么最快入門?

    `本文整理自知乎上的個問答,分享給正在學習自然語言處理的朋友們!自然語言
    發表于 11-28 10:02

    語義理解和研究資源是自然語言處理的兩大難題

    都是為了解決低資源問題。自然語言處理一些特定領域的應用時,會受到資源不足的影響。般現在采用的主要方法是對引入領域知識,通過增加人工標注數據,使用半監督利用標注數據;或者采用多
    發表于 09-19 14:10

    【推薦體驗】騰訊云自然語言處理

    `相信大家對NLP自然語言處理技術都不陌生,它是計算機科學領域和AI領域中的個分支,它與計算機和人類之間使用自然語言進行交互密切
    發表于 10-09 15:28

    自然語言處理語言模型

    自然語言處理——53 語言模型(數據平滑)
    發表于 04-16 11:11

    什么是自然語言處理

    什么是自然語言處理自然語言處理任務有哪些?自然語言處理
    發表于 09-08 06:51

    自然語言處理的概念和應用 自然語言處理屬于人工智能嗎

      自然語言處理(Natural Language Processing)是種人工智能技術,它是研究自然語言與計算機之間的交互和通信的
    發表于 08-23 17:31 ?1557次閱讀

    自然語言處理技術的原理的應用

    自然語言處理(Natural Language Processing, NLP)作為人工智能(AI)領域的個重要分支,旨在使計算機能夠理解和處理人類
    的頭像 發表于 07-02 12:50 ?516次閱讀

    自然語言處理是什么技術種應用

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學領域的個分支,它涉及到使用計算機技術
    的頭像 發表于 07-03 14:18 ?811次閱讀

    自然語言處理模式的優點

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的個重要分支,它致力于使計算機能夠理解、生成和處理人類
    的頭像 發表于 07-03 14:24 ?756次閱讀

    自然語言處理技術有哪些

    ,以下是一些主要的自然語言處理技術: 詞法分析(Lexical Analysis):詞法分析是自然語言
    的頭像 發表于 07-03 14:30 ?1098次閱讀

    使用Python進行自然語言處理

    在探討使用Python進行自然語言處理(NLP)的廣闊領域時,我們首先需要理解NLP的基本概念、其重要性、Python在NLP中的優勢,以及如何通過Python實現一些基礎的NLP
    的頭像 發表于 07-04 14:40 ?441次閱讀

    圖像識別技術包括自然語言處理

    圖像識別技術自然語言處理是人工智能領域的兩個重要分支,它們在很多方面有著密切的聯系,但也存在一些區別。 、圖像識別
    的頭像 發表于 07-16 10:54 ?734次閱讀
    主站蜘蛛池模板: 日本高清加勒比| 青青草国产偷拍在线av| 看美女大腿中间的部分| 蜜桃最新网址| 欧美日韩免费看| 色屁屁影院| 学生无码AV一区二区三区 | 久久久97丨国产人妻熟女| 久久兔费黄A级毛片高清| 女教师の诱惑| 色-情-伦-理一区二区三区| 校园男男高h小黄文| 亚洲伊人久久综合影院2021| 中文字幕亚洲乱码熟女在线| av狼新人开放注册区| 国产成人小视频| 久久久精品免费免费直播| 欧美人与善交大片| 掀开奶罩边躁狠狠躁软学生| 中文字幕s级优女区| 成人做视频免费| 好男人午夜www视频在线观看| 久久无码人妻中文国产| 日本护士喷水| 亚洲欧洲无码AV在线观看你懂的| 60老妇性xxxxhd| 国产精品1区在线播放| 久久精品无码一区二区日韩av| 免费看成人毛片| 无码99久热只有精品视频在线| 伊人网久久网| 东日韩二三区| 久久久性色精品国产免费观看 | 久久这里只有精品1| 色www精品视频在线观看| 尹人综合网| 光溜溜的美女直播软件| 久久性生大片免费观看性| 少妇第一次交换| 中文字幕久精品视频在线观看| 高清bblxx手机在线观看|