色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

統計學基礎理論之一——中心極限定理的核心概念

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-10-18 09:08 ? 次閱讀

編者按:中心極限定理是概率論中的一組重要定理,它的中心思想是無論是什么分布的數據,當我們從中抽取相互獨立的隨機樣本,且采集的樣本足夠多時,樣本均值的分布將收斂于正態分布。為了幫助更多學生理解這個概念,今天,UW iSchool的教師Mike Freeman制作了一些直觀的可視化圖像,讓不少統計學教授大呼要把它們用在課堂上。

本文旨在盡可能直觀地解釋統計學基礎理論之一——中心極限定理的核心概念。通過下文中的一系列動圖,讀者應該能真正理解這個定理,并從中汲取應用靈感,把它用于決策樹等其他項目。

需要注意的是,這里我們不會介紹具體推理過程,所以它不涉及定理解釋。

教科書上的中心極限定理

在看可視化前,我們先來回顧一下統計學課程對中心極限定理的描述。

來源:LthID

n>30一般為大樣本的分界線 來源:LthID

來源:LthID

一個簡單的例子

為了降低這個定理的理解門檻,首先我們來舉個簡單的例子。假設有一個包含100人的團體,他們在某些問題上的意見分布在0-100之間。如果以可視化的方式把他們的意見分數表示在水平軸上,我們可以得到下面這幅圖:深色豎線表示所有人意見分數的平均值。

假如你是一名社會科學家,你想知道這個團體的立場特點,并用一些信息,比如上面的“平均意見得分”來描述他們。但可惜的是,由于時間、資金有限,你沒法一一詢問。這時候,你就可能需要對這100人進行抽樣。比方說,在有限的時間、資金條件內,你可以從中隨機抽取10個人作為自己的采訪對象(n=10),向他們詢問有關特定問題的具體想法:

隨機抽取10個樣本

如你所見,這些樣本的均值可能會和整個團體的總體均值有很大差異。那么,怎么采樣才能更可靠呢?

考慮多個樣本

假設我們可以從團體中采集多個樣本。雖然這種做法在現實中是客觀存在的(尤其是在政治民意調查中),但在這里,我們會更多地將其作為一種解釋工具(當你進行重復采樣時,實際上會有一些意料之外的因素出現)。對于每個樣本,我們在每次采樣時都跟蹤樣本均值與整體平均值的差。

多次重復該過程,我們就能獲得樣本均值的分布,它通常被稱為樣本均值分布,或者(更簡單的)抽樣分布。下面是對100人的團體進行多次抽樣后(每次10人),樣本均值的變化情況:

第一次采樣,樣本均值和總體均值有明顯偏差

多次采樣后,樣本均值和總體均值的偏差變小了

可以發現,隨著抽樣次數逐漸增多,總體均值和樣本均值之間的差距正在不斷縮小。這是可以理解的,因為整個過程就相當于從100人中抽取更多樣本。但之前我們也說了,資金、時間是有限的,這沒有解決資源受限的問題,也無法反映人整個團體在特定問題上的立場。

為了了解每次計算樣本均值的效果,我們得先看看抽樣分布的分布情況。

理解分布

鑒于上述可視化圖像在分布上不夠直觀,所以在這里,我們把原先表示每個意見的圓圈變成方塊,以直方圖的形式展現總體分布的情況:

顯然,我們的數據分布并不正常。雖然上圖中有些部分的曲線是符合正態分布的,但大多數是不符合的,這段曲線沒法幫助我們理解這100個人的習性。相反地,我們可以從樣本均值的分布情況著手,看看抽樣分布的變化情況:

隨著采樣次數上升,抽樣分布正在發生變化

進一步增加采樣次數,抽樣分布的形狀逐漸趨于穩定

隨著采樣數量的增加,采樣分布在可視化中形成了一條鐘形曲線,符合正態分布。如上所述,隨著重復采樣次數的增加,樣本均值(抽樣分布的平均值)會變得越來越準確。

為什么重要

當采樣的數量接近無窮大時,我們的抽樣分布就會近似于正態分布。這個統計學基礎理論意味著我們能根據個體樣本推斷所有樣本。結合正態分布的其他知識,我們可以輕松計算出給定平均值的值的概率。同樣的,我們也可以根據觀察到的樣本均值估計總體均值的概率。

維基百科對于“中心極限定理”的定義:中心極限定理是概率論中的一組定理。中心極限定理說明,在適當的條件下,大量相互獨立隨機變量的均值經適當標準化后依分布收斂于正態分布。

在留言中,美國田納西州范德堡大學的醫學院生物統計學教授Frank Harrell留下了自己的風趣評論:“但是在所有定理中,中心極限定理是最后一個我想教給學生的東西。我想他們得先學好第一堂課,它包括一些設計、數據的意義、數據的穩健性、bootstrap、一些貝葉斯、高精度數據圖等等。”

讀完他的話,是不是覺得即便了解了這個定理,自己要學的東西還是很多呢?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1083

    瀏覽量

    40449
  • 可視化
    +關注

    關注

    1

    文章

    1194

    瀏覽量

    20934

原文標題:什么是中心極限定理?這里有一份可視化解釋

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    MPEG基礎理論和協議分析

    MPEG基礎理論和協議分析MPEG 基礎理論和協議分析(包括DVB和ATSC)的指南MPEG 是當今最流行的音頻/ 視頻壓縮技術之一。這是因為它不僅僅是個單獨的標準,而是
    發表于 10-20 17:36

    種基于統計學和模糊控制理論的權控智能節水系統設計

    、集成化、智能化方向發展。基于此,設計了種基于統計學和模糊控制理論的權控智能節水系統。它利用改進的紅外檢測單元準確地采集數據;以AT89C2051單片機為硬件平臺構建信號處理、控制的主控制器,對檢測數據
    發表于 07-15 06:30

    統計學和編程題目

    統計學和編程練習
    發表于 09-10 14:21

    統計學的概率分布

    統計學術語總結
    發表于 09-27 16:24

    量子力學基礎理論之一 維量子系統的應用

    量子力學基礎理論之一 維量子系統的應用 量子力學開啟了當今世界現代的量子計算與與通訊的大門(俗稱,我國5G---->>>6G),這里見識下其
    發表于 07-09 09:06

    混頻器的基礎理論和應用

    混頻器的基礎理論和應用
    發表于 09-18 16:53 ?32次下載
    混頻器的<b class='flag-5'>基礎理論</b>和應用

    如何使用統計學知識進行和統計分析誤差分析?

    3.1 誤差分析背后的統計學知識
    的頭像 發表于 08-22 01:32 ?4960次閱讀

    人工智能其實就是華麗的統計學

    人工智能其實就是統計學,只不過用了個很華麗的辭藻,其實就是統計學。好多的公式都非常老,但是所有的人工智能利用的都是統計學來解決問題。
    的頭像 發表于 08-13 15:33 ?2968次閱讀

    機器學習教程之機器學習的核心算法和理論電子教材免費下載

    從書本新聞。介紹性文本,介紹機器學習的主要方法和通過經驗自動改進的計算機算法的研究。根據需要,引入統計學、人工智能、信息論和其他學科的基本概念,并均衡地覆蓋理論和實踐,并且提出它們的使用的主要算法
    發表于 10-23 14:18 ?10次下載

    人工智能只有統計學

    人工智能并未朝著我們期望的方向發展,而是更多地走向了統計學的范疇。
    發表于 10-14 17:39 ?1178次閱讀

    概率論與數理統計PDF電子書免費下載

    主要內容包括:概率論的基本概念、隨機變量及其概率分布、數字特征、大數定律與中心極限定理統計量及其概率分布、參數估計和假設檢驗、回歸分析、方差分析、馬爾科夫鏈等內容。
    發表于 11-25 08:00 ?0次下載
    概率論與數理<b class='flag-5'>統計</b>PDF電子書免費下載

    統計學對于機器學習有什么作用

    統計學和機器學習是兩個密切相關的領域。實際上,兩者之間的界限有時可能非常模糊。
    發表于 04-05 21:51 ?1609次閱讀

    數據分析師應當了解的五個統計基本概念

    本文講述了數據分析師應當了解的五個統計基本概念統計特征、概率分布、降維、過采樣/欠采樣、貝葉斯統計方法。 從高的角度來看,統計學
    的頭像 發表于 11-02 15:57 ?1800次閱讀
    數據分析師應當了解的五個<b class='flag-5'>統計</b>基本<b class='flag-5'>概念</b>

    深度學習與經典統計學的差異

    深度學習和簡單的統計學回事嗎?很多人可能都有這個疑問,畢竟二者連術語都有很多相似的地方。在這篇文章中,理論計算機科學家、哈佛大學知名教授 Boaz Barak 詳細比較了深度學習與經典統計
    的頭像 發表于 09-20 15:18 ?1118次閱讀

    統計學習方法代碼集

    統計學習所含部分代碼合集
    發表于 09-07 09:24 ?0次下載
    主站蜘蛛池模板: 总裁呻吟双腿大开男男H| 原神美女被超污app| 99热婷婷国产精品综合| 湖南电台在线收听| 香蕉99久久久久成人麻豆| WWW国产亚洲精品久久| 久久精视频| 亚洲日韩国产成网站在线| 国产成人综合视频| 欧美亚洲韩日午夜| 亚洲国产欧美在线人成aaaa20| 99热这里只有 精品| 久久精品国产在热亚洲完整版| 日韩综合网| ccc36色小姐电影| 久久精品电影网| 午夜在线观看免费完整直播网| FREE性丰满白嫩白嫩的HD| 久9视频这里只有精品123| 性做久久久久久久久浪潮| a在线观看免费视频| 久久免费电影| 亚洲午夜久久久精品电影院 | 肉多的小说腐小说| 26uuu老色哥| 麻豆精品国产剧情观看| 用快播看av的网站| 久久AV国产麻豆HD真实乱| 亚洲国产在线精品国 | 国产精品亚洲一区二区三区久久| 日本aa大片| 成人免费小视频| 日本一卡二卡三卡四卡无卡免费播放 | 成人午夜精品久久久久久久秋霞| 欧美片第1页 综合| CHINA末成年VIDEO学生| 欧美精品XXXXBBBB| 成年人视频在线免费观看| 日操夜操天天操| 国产精亚洲视频综合区| 亚洲精品视频在线观看免费|