色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國際紙業:為機器學習魔獸饋送數據

倩倩 ? 來源:lq ? 作者:國際紙業流程信息 ? 2019-09-20 11:06 ? 次閱讀

國際紙業公司擁有 55,000 名員工,年銷售額超過 210 億美元,是世界上最大的紙漿和造紙公司。大規模的生產也會帶來大規模的數據:該公司目前跟蹤著全球 37 家工廠,近 200 萬個活躍的數據點。國際紙業公司的 PI System會產生大量的數據,可以從這些生產數據中挖掘業務洞察力。通過使用 PI System工具深入研究如何收集和組織數據,工程師們能夠將數據處理時間縮短 80% 以上,從而使公司新推出的機器學習計劃能夠更快執行。

國際紙業訓練機器算法,作為其“未來之戰”現代化計劃的一部分

國際紙業公司的工程師致力于高效地處理他們正在使用和生成的海量數據。“我們的工程師們需要花費他們 80% 到 90%的時間來檢索和清理數據,”國際紙業公司的化學工程師和流程信息經理Rick Smith 在 OSIsoft 的 PI World 2018 舊金山大會上這樣說。“我們支付工資讓他們進行決策并改進我們的流程。我們需要以適當的頻率向工程師提供正確的數據,以便于他們工作。”

幾年前,公司在減少數據檢索時間方面做了一些努力。使用 PI OLEDB 工具后,工程師可以將 PI System 數據存檔視為關系數據庫。通過運行 SQL 查詢可以將提取出來的數據自動填充到 Microsoft Excel 電子表格中,而無需在 Excel 內運行耗時的計算。采用這種方法后,國際紙業能夠將審計中經常使用的數據檢索過程從 3-12小時縮短到 15-45 分鐘。

這是一個良好的開端,但后面還有更大的挑戰。2017 年,國際紙業發起了一個以數據和機器學習為核心的試點項目,作為其“未來之戰”現代化計劃的一部分。為了訓練機器算法,工程師需要同時在數千個標簽上提取幾年的歷史數據并將這些數據輸入機器學習引擎。

為了獲取數據檢索過程所需的時間值,Smith提出了一個他稱之為“年標簽”的時間單位:即從單個 PI 數據標簽中檢索一年的信息所需的時間。因為不同的標簽收集數據的間隔不同,所以各個標簽的“年標簽”值不盡相同,有些甚至差異極大。

Smith 有關檢索數據所需時間的初步估計發人深省。使用 10,000 個數據標簽一到三年的數據,數據采集間隔為一分鐘,會產生大約 160 億行數據,整個過程需要耗時數月。

“對于我們的數據標簽,如果所有標簽都是上面這種情形,那么讀取三年的數據,將需要100 到 200 天的時間來檢索數據。我不了解其他公司的情況,但我們的副總裁可不想等待200 天才開始這個項目,” Smith 說。

國際紙業創建了另外的數據標簽,每隔一分鐘而不是每隔 1-2 秒寫一次數據,從而簡化了大數據機器學習的數據提取過程。

優秀的數據管理員的價值

使用 PI System 工具,Smith 開始研究數據,探索如何能減少不必要的存儲與數據處理。他發現,在一家造紙廠,不到百分之一的數據標簽占據了存檔空間的近 37%。對于不同類型的分析,可能需要以不同的頻率采集數據。Smith 采用 Asset framework(PI Server 的一部分)為采集頻率密集的標簽同時設置了較低的采集頻率,以較長的間隔來收集相同的數據,在確保數據存檔豐富性的同時,實現更快的檢索速度。

對于某些數據標簽,密集的數據收集頻率對于存檔很重要,但并非所有分析都需要細粒度的數據。在對一組數據標簽進行分析時,Smith發現,與一秒鐘間隔的數據相比,一分鐘間隔的數據其數據讀取時間可以減少 85%。

對數據進行適當的管理和組織,也會使數據檢索時間在原來長度的基礎上大幅減少。在一項分析中,Smith 使用了 50 個數據標簽并在Asset framework 為它們構建了一個結構,這一舉措將讀取一年數據的時間從 15 分鐘以上縮短到 5 分鐘以內。通過使用數據平均值而不是工廠儀表上傳感器的原始值,將另一項分析的時間從 14 小時縮短到 40 秒。

仔細研究公司的數據如何生成、存儲和處理,這一工作平淡無奇,但它所產生的結果卻令人矚目。

“所有系統都需要管理者,”Smith 說。“每個人都想成為架構師。但我們更需要腳踏實地的數據管理員。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4615

    瀏覽量

    93000
  • 數據采集
    +關注

    關注

    39

    文章

    6131

    瀏覽量

    113727
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132743
收藏 人收藏

    評論

    相關推薦

    傳統機器學習方法和應用指導

    用于開發生物學數據機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比
    的頭像 發表于 12-30 09:16 ?220次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    海康威視攜手太陽紙業共推造紙行業數字化轉型

    近日,海康威視高級副總裁徐習明帶隊赴山東濟寧太陽紙業,與太陽紙業管理團隊探討交流未來合作方向。后續,雙方將基于造紙行業生產、運營環節中的實際需求,探索場景落地數字化應用,共同推動造紙行業數字化轉型。
    的頭像 發表于 11-19 11:12 ?342次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智
    的頭像 發表于 11-16 01:07 ?437次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門深度學習
    的頭像 發表于 11-15 09:19 ?496次閱讀

    人工智能、機器學習和深度學習存在什么區別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數據學習
    發表于 10-24 17:22 ?2503次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區別

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務,可以
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器
    發表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關于時間序列進行大
    發表于 08-11 17:55

    機器學習中的數據分割方法

    機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習
    的頭像 發表于 07-10 16:10 ?1877次閱讀

    機器學習中的數據預處理與特征工程

    機器學習的整個流程中,數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發,詳細探討這
    的頭像 發表于 07-09 15:57 ?459次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器
    的頭像 發表于 07-02 11:25 ?1113次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從
    的頭像 發表于 07-02 11:22 ?648次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,眾多領域帶來了革命性的變化。然而,盡管它們都屬于
    的頭像 發表于 07-01 11:40 ?1420次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據
    的頭像 發表于 06-27 08:27 ?1675次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典算法與應用

    魔獸世界》未采用生成式AI,利用機器學習實現護甲套裝配置

    同時,海特還談及了團隊利用機器學習進行實驗的情況。得益于此,《魔獸世界》的 24 個種族已配備新護甲套裝。“此前,我們的美術師需每個角色設計單獨護甲,再依身高、體態、犄角乃至尾巴等特
    的頭像 發表于 04-03 11:38 ?319次閱讀
    主站蜘蛛池模板: 亚洲黄色录像片| 香蕉59tv视频| 色丁香婷婷综合缴情综| 宅男午夜大片又黄又爽大片| 国产精品无码AV天天爽人妻蜜桃 | 国产精品美女久久久久浪潮AV| 男人J进入女人P免费狂躁| 在线观看永久免费网站| 精品亚洲视频在线观看| 亚洲欧美一区二区三区导航| 好紧的小嫩嫩17p| 亚洲一品AV片观看五月色婷婷 | 亚洲VA欧美VA天堂V国产综合| 成人在线视频在线观看| 如懿传免费观看在线全集| 把手戳进美女尿口里动态图| 女人被躁到高潮嗷嗷叫69| BL全肉多攻NP高H| 日本G奶乳液汁| 风情韵味人妻HD| 少妇精油按摩| 国产午夜精品一区二区| 亚洲欧洲免费三级网站| 久久久久久久网| 99热精品一区| 色综合五月激情综合色一区| 国产色精品久久人妻无码看片软件 | 久久精品一区| 4455永久在线毛片观看| 免费毛片网站在线观看| av在线不卡中文网| 日韩亚洲人成在线| 国产偷抇久久精品A片蜜臀A| 亚洲综合免费视频| 嗯啊好爽视频| 国产精品无需播放器| 一级无毛片| 欧洲精品一区二区不卡观看| 国产精品成人免费视频99| 亚洲色婷婷久久精品AV蜜桃| 免费麻豆国产黄网站在线观看|