色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

成功的文本分析工作流程的四個步驟

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Seth DeLand ? 2022-06-20 14:53 ? 次閱讀

文本分析(從原始人類語言中發現隱藏模式以實現更好的決策和預測的過程)為工業和預測性維護系統提供了多種好處。這些分析使工程師能夠利用原始文本數據輕松生成有關維護記錄的見解,并構建故障預測算法以預防潛在問題。

以非公路商業空間為例,在建筑工地使用重型設備:如果一臺重型設備發生故障,它可能會在修復系統所需的時間和成本以及停機時間之間成為代價高昂的故障。施工停滯時的現場。傳統上,來自該設備的遙測數據已被用于構建可預測未來故障的預測性維護模型。但是,機械師和操作員的文字說明中也包含有關過去故障及其原因的寶貴信息。工程師可以利用這些文本數據來增強預測性維護模型,并識別應該解決的模式和故障模式。

文本分析的挑戰在于非結構化的原始文本數據集的龐大數量,這可能會使分析工具不堪重負。這使得工程師更難快速、直觀地提取用戶可能獲得的所有有價值的信息。然而,工程師可以通過正確的工具和堅持端到端的工作流程來克服這些障礙。

當談到端到端的文本分析工作流程時,工程師需要知道什么?工作流程有四個主要階段:

poYBAGKwGbWAZSGZAAB0svF0DfA535.png

圖 1. 端到端文本分析工作流程。

第 1 階段:數據訪問和探索

文本數據將來自多種來源,包括數據庫、內部文件存儲庫和 Internet,并采用多種格式。正確準備數據是成功工作流程的關鍵因素。適當的數據準備將原始文本數據清理并預處理為“清理數據”以進行分析。

以詞云為例。該模型將數據轉換為一種格式,使工程師能夠快速輕松地可視化正在使用的單詞以及數據池中最常用的短語。當與應用他們的領域專業知識的工程師結合使用時,詞云等可視化有利于更大的文本分析工作流程,因為工程師可以很容易地發現數據可能遺漏的地方或需要更多清理的地方,因為他們了解給定的典型問題或問題環境或用例。

第 2 階段:數據預處理

這些可視化還有助于指導需要采取的下一步行動。如圖 2 所示,停用詞(不增加價值的低信息詞)很常見,它們的存在會影響可視化結果。在工程師開始模型開發過程之前,他們必須清理原始文本數據,以便過濾掉這些“停用詞”并輸入真實、重要的數據以傳遞給建模過程。預處理階段允許用戶從原始文本中提取有意義的單詞。

數據清洗通常是數據分析中最耗時的部分,根據數據量,清洗步驟可能需要多次迭代。但是,由于投入額外的時間和所需資源而產生的投資回報率允許稍后在文本分析工作流程中建立更準確和成功的模型。在許多情況下,干凈的詞云會傳遞更多關于文本頁面上實際內容的信息。

pYYBAGKwGb6ANMsjAADTUnqbRM0882.png

圖 2. 預處理數據。

Text Analytics Toolbox等工具通過為文本數據的預處理、分析和建模提供算法和可視化,幫助用戶為模型構建過程做好準備,從而為解決數據清理痛點的工程師提供支持。

這些工具從流行的文件格式中提取文本,對來自設備日志、新聞提要、調查、操作員報告和社交媒體等來源的原始文本進行預處理,提取利用文本、數字和其他類型的數據,將文本轉換為數字表示,然后構建統計模型。

第 3 階段:預測模型構建

清理和預處理數據后,就可以開始使用機器或深度學習算法構建預測模型了。

這就是文本分析的優勢所在:它發現數據中的隱藏模式并以直觀的格式顯示它們,使用戶能夠消化數據,然后采取糾正措施來解決問題,然后再進一步進入工作流程。

以將純文本數據轉化為數字形式為例。工程師可以應用諸如“詞袋”之類的建模方法,它根據提供的文本數據創建一個數字矩陣,顯示每個詞的使用頻率。然后,工程師可以從那里使用預測模型,例如潛在狄利克雷分配 (LDA) 模型,該模型可以擬合到詞/頻矩陣,以發現文本數據集中隱藏的主題和見解。

如圖 3 所示,LDA 模型可以生成與數據中的“隱藏主題”相關的詞云,顯示模式如何從將文本數據擬合到該預測模型中開始出現,有助于為相應問題的創建解決方案提供信息。

poYBAGKwGcWAb6TOAANzQjKFti4838.png

圖 3. 使用 LDA 方法自動識別工廠報告數據中的主題。主題 2 與電子問題有關。主題 3 與流體系統的問題有關。

一旦模型(例如上面示例中的模型)使用新的敘述進行測試以驗證模型的預測是否正確,就可以建立自動警報,以便系統在任何需要注意的問題上向響應團隊發送標志。如果位置數據也可用,結果會發現某些主題(例如,標記的問題)與其位置數據之間存在相關性,因此該模型還可以通過使用多個數據流來補充文本數據,提醒響應團隊注意基礎設施方面潛在的更大問題。

第 4 階段:洞察力和預測模型部署

使用文本分析設置模型并驗證可接受的性能后,有多種方法可以與工程團隊和/或管理層共享結果和模型,包括生成報告或交互式筆記本(例如,MATLAB 實時編輯器)、溝通將數據傳輸到桌面或 Web 應用程序(例如,MATLAB App Designer),或將應用程序托管在生產服務器或 Web 應用程序服務器上。

對于工業自動化、機械、汽車制造、航空航天設計或能源分配等行業的工程師來說,文本分析可以幫助他們執行復雜的數值分析,以識別可以帶來更好結果并改進預測性維護等功能的想法和概念組。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • matlab
    +關注

    關注

    185

    文章

    2977

    瀏覽量

    230601
  • 編輯器
    +關注

    關注

    1

    文章

    806

    瀏覽量

    31198
  • 航空航天
    +關注

    關注

    1

    文章

    390

    瀏覽量

    24322
收藏 人收藏

    評論

    相關推薦

    LJ40B4-20J/EZ常開型接近開關工作流程及接線圖

    常開型接近開關的工作流程包括無信號觸發狀態、信號觸發狀態和信號輸出與應用三步驟。其接線方式可能因型號和制造商而異,但通常遵循兩線制或三線制的接線原則。在實際應用中,應根據具體需求和場景選擇合適的接近開關型號和接線方式。
    的頭像 發表于 12-09 10:42 ?141次閱讀

    如何使用自然語言處理分析文本數據

    使用自然語言處理(NLP)分析文本數據是一復雜但系統的過程,涉及多個步驟和技術。以下是一基本的流程
    的頭像 發表于 12-05 15:27 ?289次閱讀

    用CPLD控制ADS7229,工作流程是怎么樣的?

    用CPLD控制ADS7229,因為需要用到狀態機,需要了解7229的工作流程是怎么樣的,手冊上沒有看懂,望大俠指點! 比如:流程一:通過SPI接口進行寄存器(CFR)配置——》啟動轉換-——》等待轉換完成——》輸出數據(sdo)——》啟動下一次轉換?
    發表于 12-03 07:50

    淺談無刷電機的工作流程

    上一期的芝識課堂,我們跟大家一起分析了無刷電機的四個功能單元,并詳細分析了PWM和逆變器單元的工作情況,今天我們繼續來熟悉無刷電機工作流程
    的頭像 發表于 11-12 13:46 ?483次閱讀
    淺談無刷電機的<b class='flag-5'>工作流程</b>

    邏輯組件中的流程塊節點通常出于什么用途

    邏輯組件中的流程塊節點是流程圖、狀態圖、序列圖等圖表中的基本元素,它們用于表示業務流程工作流程、算法步驟、系統狀態等。這些節點在軟件開發、
    的頭像 發表于 10-15 14:38 ?171次閱讀

    利用TensorFlow實現基于深度神經網絡的文本分類模型

    要利用TensorFlow實現一基于深度神經網絡(DNN)的文本分類模型,我們首先需要明確幾個關鍵步驟:數據預處理、模型構建、模型訓練、模型評估與調優,以及最終的模型部署(盡管在本文中,我們將重點放在前
    的頭像 發表于 07-12 16:39 ?885次閱讀

    卷積神經網絡在文本分類領域的應用

    在自然語言處理(NLP)領域,文本分類一直是一重要的研究方向。隨著深度學習技術的飛速發展,卷積神經網絡(Convolutional Neural Network,簡稱CNN)在圖像識別領域取得了
    的頭像 發表于 07-01 16:25 ?743次閱讀

    自動化IC封裝模擬分析工作流程

    在IC封裝制程的制程模擬中,為了同時提升工作效率與質量,CAE團隊常會面臨到許多挑戰。在一般的CAE分析流程中,仿真分析產生結構性網格,是非常繁瑣且相當花時間的。必須要先匯入2D(或3
    的頭像 發表于 06-26 08:35 ?338次閱讀
    自動化IC封裝模擬<b class='flag-5'>分析</b><b class='flag-5'>工作流程</b>

    Linux啟動流程本分析

    Linux啟動流程總的來說可以分成三階段 Linux啟動流程圖 ? 第一步:上電 ?在 x86 系統中,將 1M 空間最上面的 0xF0000 到 0xFFFFF 這 64K 映射給 ROM
    的頭像 發表于 05-11 08:49 ?698次閱讀
    Linux啟動<b class='flag-5'>流程</b>基<b class='flag-5'>本分析</b>

    鴻蒙原生應用元服務-訪問控制(權限)開發工作流程相關

    是否屬于用戶授權類。如果是,應用需要使用動態授權彈框來提供用戶授權界面,請求用戶授權目標權限。 當用戶授予應用所需權限后,應用可成功訪問目標數據或執行目標操作。 應用使用權限的工作流程如圖所示。 1
    發表于 04-19 15:27

    Ansys與SynMatrix合作,簡化無線通信射頻濾波器設計工作流程

    Ansys擴展其電子系列產品組合,以簡化無線通信射頻濾波器設計工作流程
    的頭像 發表于 04-08 09:45 ?827次閱讀
    Ansys與SynMatrix合作,簡化無線通信射頻濾波器設計<b class='flag-5'>工作流程</b>

    推挽放大電路工作流程

    ”),另一在負半周期拉動負載(“挽”),因此稱為“推挽”。這種結構允許放大電路在信號的兩半周期內都能提供能量,從而有效地將輸入信號的功率放大到更高的水平。 推挽放大電路的工作流程如下: 信號分離:輸入信號首先被送到一
    的頭像 發表于 02-03 17:23 ?1354次閱讀
    推挽放大電路<b class='flag-5'>工作流程</b>

    BUCK電路工作原理四個階段

    BUCK電路工作原理四個階段? BUCK電路是一種常用的降壓轉換器,廣泛應用于電源管理領域。其工作原理可以分為四個階段:導通、關斷、自阻抗、反饋調節。 1. 導通階段: 在導通階段,輸
    的頭像 發表于 01-31 16:08 ?1033次閱讀

    四個單片機能共用一晶振時鐘頻率來工作嗎?

    四個單片機能共用一晶振時鐘頻率來工作嗎? 四個單片機共用一晶振時鐘頻率來工作是可能的。在實際
    的頭像 發表于 01-31 11:31 ?1803次閱讀

    SOLIDWORKS 2024通過自動化和縮短工作流程來實現智能工作

    隨著科技的快速發展,工程設計和制造業正在經歷變革。在這個過程中,SOLIDWORKS 2024的發布為我們提供了一全新的視角,以實現更智能的工作流程。本文將探討SOLIDWORKS 2024如何通過自動化和縮短工作流程來實現智
    的頭像 發表于 01-10 11:37 ?561次閱讀
    SOLIDWORKS 2024通過自動化和縮短<b class='flag-5'>工作流程</b>來實現智能<b class='flag-5'>工作</b>
    主站蜘蛛池模板: 蛇缚dvd| 秘密教学26我们在做一次吧免费| 果冻传媒mv国产陈若瑶主演| 青春禁区动漫免费观看| 又长又大又粗又硬3p免费视频 | 妻子+免费观看完整| 2017天天拍天天拍香蕉视频| 久久www成人看片| 伊人久久大香线蕉无码麻豆| 好男人在线观看视频观看高清视频免费 | 大陆极品少妇内射AAAAAA| 久久免费视频| 亚洲欧美日韩国产另类电影| 俄罗斯雏妓的BBB孩交| 欧美日韩精品一区二区三区高清视频 | 在线播放毛片| 激情床戏揉胸吃胸视频| 天天爽夜夜爽8888视频精品| 波多结衣一区二区三区| 暖暖免费 高清 日本社区中文| 伊人色综合久久天天网| 娇喘高潮教室h| 亚洲欧美自拍明星换脸| 国产在线一区二区AV视频| 亚洲 欧美 国产 综合 播放| 久久99免费视频| 亚洲第一天堂无码专区| 国产欧美另类久久久品| 偷拍自怕亚洲在线第7页| 国产成人高清精品免费5388密| 日韩精品欧美在线视频在线| 成人毛片在线播放| 日本夜夜夜| 国产成人精品s8p视频| 忘忧草下载| 国产一区二区在线观看免费| 亚洲人成网站在线播放| 久久伊人中文字幕有码| 99re8热视频这在线视频| 欧美日韩无套内射另类| 大学生第一次破苞疼哭了|