(二)樣本
從總體中抽取部分個體所組成的集合稱為樣本。樣本中所包含的個體的個數(shù)稱為樣本量,常用n表示。
人們從總體中抽取樣本是為了認識總體,即從樣本推斷總體,如推斷總體是什么類型的分布·總體均值為多少· 總體的標準差是多少· 為了使此種統(tǒng)計推斷有所依據,推斷結果有效,對樣本的抽取應有所要求。
滿足下面兩個條件的樣本稱為簡單隨機樣本,簡稱隨機樣本。
。1)隨機性。總體中每個個體都有相同的機會。比如,按隨機性要求抽出5個樣品,記為X1,X2,…X5,則其中每一個個體的分布都應與總體分布相同。只要隨機抽樣就可保證此點實施。
。2)獨立性。從總體中抽取的每個個體對其他個體的抽取無任何影響。假如總體是無限的,獨立性容易實現(xiàn);若總體很大,特別地,與樣本量n相比是很大時,即使總體是有限的,此種抽樣獨立性也可得到基本保證。
綜上兩點,隨機樣本X1,X2,…,Xn可以看做n個相互獨立的、同分布的隨機變量,每一個個體的分布與總體分布相同。今后討論的樣本都是指滿足這些要求的簡單隨機樣本。在實際中抽樣時,也應按此要求從總體中進行抽樣。這樣獲得的樣本能夠很好地反映實際總體。圖1.3-3顯示兩個不同的總體,圖上用虛線畫出的曲線是兩個未知總體。若是按隨機性和獨立性要求進行抽樣,則機會大的地方 (概率密度值大)被抽出的樣品就多;而機會少的地方 (概率密度值。,被抽出的樣品就少。分布愈分散,樣本也很分散;分布愈集中,樣本也相對集中。
抽樣切忌受到干擾,特別是人為干擾。某些人為的傾向性會使所得樣本不是簡單隨機樣本,從而使最后的統(tǒng)計推斷失效。
若 是從總體X中獲得的樣本,那么 是獨立同分布的隨機變量。樣本的觀測值用 表示,這也是我們常說的數(shù)據。有時,為了方便起見,不分大寫與小寫,樣本及其觀測值都用 表示,今后將采用這一方法表示。
[例1.3-2] 樣本的例子及表示方法。
(1)某食品廠用自動裝罐機生產凈重為345g的午餐罐頭。由于生產中眾多因素的干擾,每只罐頭凈重都有差別,現(xiàn)從生產線上隨機抽10個罐頭,稱其凈重,得:344336345342340338344348344346
這就是樣本量為10的一個樣本,它是來自該生產線上罐頭凈重這個總體的一個樣本。
。2)某型號的20輛汽車記錄了各自每加侖汽油行駛的里程數(shù)(單位:km)如下:
這是來自該型號汽車每加侖汽油行駛里程這個總體的一個樣本,樣本量是20.
。3)(分組樣本)對363個零售商店調查其周零售額(單位:千元)的結果如下表1.3-1所示:
周零售額的調查結果(單位:千元)
這是一個樣本量為363的樣本,對應的總體是該地區(qū)全部零售商店的周零售額。這個樣本與前兩個樣本不同,它僅給出樣本所在區(qū)間,沒有給出具體的零售額。這樣做雖會失去一些信息,但要準確獲得每個零售店的周零售額并非易事,能做到的是把區(qū)間再縮小一些。這種樣本稱為分組樣本。在樣本量n很大時,比如幾百甚至上千個,羅列所有數(shù)據非常不便,且使人眼花繚亂,不得要領,這時可把樣本作初步整理轉化為分組樣本并加以表達,這樣可立即給人一個大致的印象。以后在作頻率直方圖時,也要用到這個方法。
。4)(有序樣本)設 是從某總體隨機抽取的一個樣本。將它們按從小到大的順序排列為 ,這便是有序樣本。比如,在本例中(1)的樣本量為10的樣本,經排序可得如下的有序樣本:
從有序樣本可獲得一些有用信息。比如,樣本中的最小值為 ,最大值為 ,兩者之差,即樣本極差 .這些量對我們認識生產線都是有幫助的。
1、凡本網注明“來源:建設工程教育網”的所有作品,版權均屬建設工程教育網所有,未經本網授權不得轉載、鏈接、轉貼或以其他方式使用;已經本網授權的,應在授權范圍內使用,且必須注明“來源:建設工程教育網”。違反上述聲明者,本網將追究其法律責任。
2、本網部分資料為網上搜集轉載,均盡力標明作者和出處。對于本網刊載作品涉及版權等問題的,請作者與本網站聯(lián)系,本網站核實確認后會盡快予以處理。
本網轉載之作品,并不意味著認同該作品的觀點或真實性。如其他媒體、網站或個人轉載使用,請與著作權人聯(lián)系,并自負法律責任。
3、聯(lián)系方式:010-82326699 / 400 810 5999。