色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

八大機器學習數據集

DPVg_AI_era ? 來源:lq ? 2019-01-18 09:52 ? 次閱讀

近日,Medium上的一位用戶整理了一份機器學習大型數據集清單,包括八大數據集資源庫。總有一款適合你,快來收藏吧!

下面的ML大型數據集,總有一款適合你。

就目前來看,找到一個特定的數據集來解決各種機器學習問題,甚至進行實驗還是比較困難的。

本文作者Will Badr便列舉了八大機器學習數據集。

不僅包含用于實驗的大型數據集,還附帶對數據集的描述以及使用示例。有的還包含用于解決與該數據集相關機器學習問題的算法代碼。

話不多說,上數據集!

1、Kaggle數據集

數據集地址:

https://www.kaggle.com/datasets

這是作者最喜歡的數據集之一。

每個數據集都是一個小型社區,用戶可以在其中討論數據、查找公共代碼或在內核中創建自己的項目。包含各式各樣的真實數據集。

用戶還可以看到與每個數據集相關的“內核”,許多數據科學家還提供了相關手冊來分析數據集。

2、Amazon數據集

數據集地址:

https://registry.opendata.aws/

該數據源包含多個不同領域的數據集,如:公共交通、生態資源、衛星圖像等。

網頁中也有一個搜索框來幫助用戶尋找想要的數據集,還有所有數據集的描述和使用示例,這些數據集信息豐富且易于使用!

數據集存儲在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個高度可伸縮的對象存儲服務。

如果用戶正在使用AWS進行機器學習實驗和開發,這將非常方便,由于它是AWS網絡的本地數據,因此數據集的傳輸將非常快。

3、UCI機器學習資源庫

數據集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一個來自加州大學信息與計算機科學學院的大型資源庫,包含100多個數據集。

用戶可以找到單變量和多變量時間序列數據集,分類、回歸或推薦系統的數據集。

有些UCI的數據集已經是被清洗過的。

4、谷歌數據集搜索引

數據集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他們最擅長的事情,推出了另一項偉大的服務——它是一個可以按名稱搜索數據集的工具箱。

他們的目標是統一成千上萬個不同的數據集存儲庫,使這些數據能夠且易被發現。

5、微軟數據集

數據集地址:

https://msropendata.com/

2018年7月,微軟與外部研究社區共同宣布推出“Microsoft Research Open Data”。

它在云中包含一個數據存儲庫,用于促進全球研究社區之間的協作。它提供了一系列用于已發表研究的、經過處理的數據集。

6、Awesome Public Datasets Collection

數據集地址:

https://github.com/awesomedata/awesome-public-datasets

這是一個按“主題”組織的數據集,比如生物學、經濟學、教育學等。

這里列出的大多數數據集都是免費的,但是在使用任何數據集之前,用戶需要檢查一下許可要求。

7、政府數據集

政府相關數據集也很容易找到的。

許多國家為了提高透明度,向公眾分享了各種數據集。以下是一些例子:

歐盟開放數據門戶:歐洲政府數據集。

數據集地址:

https://data.europa.eu/euodp/data/dataset

美國政府數據:目前由于一些非政治性原因,暫時無法訪問。

數據集地址:

https://www.data.gov/

新西蘭政府數據集:

數據集地址:

https://catalogue.data.govt.nz/dataset

印度政府數據集:

數據集地址:

https://data.gov.in/

8、計算機視覺數據集

數據集地址:

https://www.visualdata.io/

Visual Data包含一些可以用來構建計算機視覺(CV)模型的大型數據集。

用戶可以通過特定的CV主題查找特定的數據集,如語義分割、圖像標題、圖像生成,甚至可以通過解決方案(自動駕駛汽車數據集)查找特定的數據集。

總結

從上述作者所觀察到數據集情況來看,似乎是涵蓋各個方向和領域。

這些新數據集的社區將繼續發展,使數據更容易被獲取,使眾包和計算機科學社區能夠繼續快速創新,為生活帶來更多創造性的解決方案。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4615

    瀏覽量

    92982
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132714
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24723

原文標題:【收藏】8款大型機器學習數據集頂級資源

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2025年全球半導體八大趨勢,萬年芯蓄勢待發

    近日,國際數據公司(IDC)發布了2025年全球半導體市場的八大趨勢預測,顯示出對半導體市場回暖的信心,為業界提供了寶貴的市場洞察。在全球范圍內,特別是在人工智能(AI)和高性能運算(HPC)需求
    的頭像 發表于 12-17 16:53 ?610次閱讀
    2025年全球半導體<b class='flag-5'>八大</b>趨勢,萬年芯蓄勢待發

    cmp在機器學習中的作用 如何使用cmp進行數據對比

    機器學習領域,"cmp"這個術語可能并不是一個常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習中的作用 模型評估 :比較不同模型的性能是
    的頭像 發表于 12-17 09:35 ?214次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智
    的頭像 發表于 11-16 01:07 ?429次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    緊密。 NPU的起源與特點 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設計目標是提高機器學習算法的運行效率,特別是在處理大規模
    的頭像 發表于 11-15 09:19 ?494次閱讀

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    提高機器學習模型效果與性能的過程。 而我對特征工程的理解就是從一堆數據里找出能表示這堆數據的最小數據
    發表于 08-14 18:00

    米思米直線電機模組的八大核心優勢,你知道嗎?

    米思米直線電機模組憑借其價格親民、高精度、高速運行、低噪音、長壽命、多動子配置、選型便捷以及品類豐富等八大核心優勢,在自動化與精密制造領域展現出了強大的競爭力和廣闊的應用前景。
    的頭像 發表于 07-25 10:57 ?508次閱讀
    米思米直線電機模組的<b class='flag-5'>八大</b>核心優勢,你知道嗎?

    pycharm怎么訓練數據

    在本文中,我們將介紹如何在PyCharm中訓練數據。PyCharm是一款流行的Python集成開發環境,提供了許多用于數據科學和機器學習
    的頭像 發表于 07-11 10:10 ?649次閱讀

    機器學習中的數據分割方法

    機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習
    的頭像 發表于 07-10 16:10 ?1865次閱讀

    如何理解機器學習中的訓練、驗證和測試

    理解機器學習中的訓練、驗證和測試,是掌握機器學習
    的頭像 發表于 07-10 15:45 ?4207次閱讀

    PyTorch如何訓練自己的數據

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態圖特性而聞名。在訓練深度學習模型時,數據是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的
    的頭像 發表于 07-02 14:09 ?1760次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從
    的頭像 發表于 07-02 11:22 ?641次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據是一個
    的頭像 發表于 06-27 08:27 ?1672次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典算法與應用

    華為發布5G-A八大創新實踐,助力全球運營商因地制宜

    MWC24 巴塞羅那期間,華為發布了5G-A八大創新實踐,助力全球運營商因地制宜,基于自身網絡情況多路徑構建5G-A網絡。
    的頭像 發表于 02-29 10:00 ?644次閱讀

    盤點飛創高精度直線電機模組八大主流應用行業

    飛創高精度直線電機模組八大主流應用行業
    的頭像 發表于 02-05 16:19 ?716次閱讀

    什么是機器學習?它的重要性體現在哪

    任務的解決方法。機器學習的重要性體現在幾個方面數據處理能力:在當今數字化時代,我們產生了大量的數據機器
    的頭像 發表于 01-05 08:27 ?1621次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?它的重要性體現在哪
    主站蜘蛛池模板: 国外成人电台| 国产国拍亚洲精品永久软件| 九九99国产香蕉视频| 少男同志freedeos| 国产主播AV福利精品一区| 在线亚洲97se| 热久久国产欧美一区二区精品| 国产高清在线观看视频| 一本道dvd久久综合高清免费| 内射无码AV-区二区在线观看| 国产高清-国产av| 在公交车上被JB草坏了被轮J了 | 国产树林野战在线播放| 一个人在线观看视频| 欧洲-级毛片内射八十老太婆| 国产精品午夜小视频观看| 中文字幕AV亚洲精品影视| 色婷婷欧美在线播放内射| 久久精品国产亚洲AV蜜臀| 床伴在线观看免费高清完整泰剧第四集 | 国产高清超清在线播放| 在线观看免费小视频| 涩涩999| 麻豆第一区MV免费观看网站| 国产盗摄TP摄像头偷窥| 做暖免费观看日本| 无限资源在线完整高清观看1| 久青草影院| 国产剧情福利AV一区二区 | 在线观看国产高清免费不卡| 双性大乳浪受噗呲噗呲h总| 久久久久久久久人体| 高H内射NP古文| 6080YYY午夜理论片在线观看| 性夜影院午夜看片| 人人妻免费线| 男女牲交大战免费播放| 护士们的母狗| 大陆女人内谢69XXXORG| 最近中文字幕mv手机免费高清| 羞羞答答影院在线|