首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » (成對)雙樣本平均數差異t檢定

(成對)雙樣本平均數差異t檢定
Two-sample t-test for paired data
此處使用的統計分析方法---t檢定,又稱學生t(student t)檢定,是由英國統計學家戈斯特(William Sealy Gosset, 1876-1937)所提出,student則是他的筆名。t檢定是一種檢定母體平均數的統計方法,當資料成對時(如資料包含減肥前和減肥後體重),資料可視為包含兩組樣本,此時若要檢定兩組樣本的母體平均數是否相同,可先計算資料中兩兩成對樣本的差異值(如減肥前體重與減肥後體重相減),此筆差異值資料即為單一組樣本,再利用單一樣本平均數t檢定方法檢定此差異值資料的母體平均數是否大於、小於或等於某一特定數值。當資料中樣本數較小時(通常樣本個數<30的樣本可視為樣本數較小),建議改用(成對)雙樣本中位數差異檢定(Wilcoxon signed-rank test)檢定中位數差。
註:母體中位數經常和平均數一樣, 因此檢定中位數差即檢定平均數差。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-1:蜥蜴生長的研究

生物多樣性對於人類來說是一個重要的議題,地球上的物種豐富,各種的動植物都有,1992年聯合國在巴西的地球高峰會議通過『生物多樣性公約』,因此生物多樣性的議題受到了全球的關注,而保育的觀念也慢慢的深植於人心。台灣是一個美麗的寶島,地處於亞熱帶與熱帶之間,四季溫暖氣候宜人且雨量充沛,在峻嶺高山中蘊含著豐富的物種。但由於高度的經濟開發與都市建設,許多物種的棲息地被破壞殆盡,造成野生動植物數量大量減少,甚至於消失殆盡,有鑒於此,許多動物保育學家需至山林裡從事動物保育的工作,以避免一些台灣的特有品種絕種。 蜥蜴是日常生活中在野外常常可見的小型爬蟲類,非常的不起眼,但是蜥蜴可說是自遠古時代即存在的物種,因此引起許多的動物學家的研究興趣。有一位保育學家對於研究台灣特有種的短肢攀蜥相當熱衷,想了解該物種的生長速度,花了兩年的時間在中海拔的山區量測該品種蜥蜴的身長並記錄之,第一年補獲的蜥蜴共50隻,每隻皆記錄身長並於身上加以編號後放生,並於第二年再記錄這群蜥蜴的身長,兩年前的記錄顯示該地區該品種蜥蜴的平均身長為18公分,而一年前與今年所測量的資料共有50筆列於表中。

編號 1 2 3 4 5 ... 48 49 50
第一年身長 18.5 23 20.6 19 16 ... 22 20.3 18.4
第二年身長 19.4 23.5 20.9 21.2 17.5 ... 22.8 23.3 21.1

Q2:因為第一年與第二年所記錄的蜥蜴皆為同一群體,可確知第二年的蜥蜴平均身長不會小於第一年。根據保育學家的經驗,該品種蜥蜴每年可成長2公分,保育學家想了解此組蜥蜴的資料是否也如此,該如何分析呢?
問題解析:直接比較第一年的平均身長與第二年的平均身長是否差異達2公分,因為第二年的平均身長必定大於第一年,故可討論"第二年的平均身長減去第一年平均身長是否大於2公分?"。
統計方法:此問題中變數為蜥蜴身長,為單一變數(一個變數,建議選擇單變數分析)。資料須比較第一年與第二年身長故樣本數二組,且需成對比較;另此份資料樣本數大於30筆,可採用分析方法:(成對)雙樣本平均數差異t檢定(two-sample t-test for paired data),檢定"第二年的平均身長減去第一年平均身長是否大於2公分?"。此處需注意,因為每一隻蜥蜴皆有第一年與第二年的身長資料,此種資料的記錄方式稱為成對,故此時分析需注意資料須被"成對"使用,無法將資料分開討論。

解析:
1. 此題可建立虛無假設為"第二年的平均身長減去第一年平均身長小於等於2公分",即H0: μ第二年身長- μ第一年身長≦2。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: two sample paired t test
(成對)雙樣本平均數差異t檢定 - 分析結果
  • 分析方法:(成對)雙樣本平均數差異t檢定
  • 資料名稱:範例A-1
  • 變數名稱:第二年身長 - 第一年身長
  • 顯著水準:0.05
  • 檢定平均數差異:2
  • 檢定方向:右尾檢定
  • 計算時間:0.174秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    第二年身長5020.47820.914.9242.1524
    第一年身長5018.69618.913.923.42.6228
    I:樣本敘述統計量皆不包含遺失值

  • 雙樣本平均數差異t檢定(成對樣本):
    虛無假設:母體平均數差異 ≤ 2
    H0μ1 - μ2 ≤ 2
    變數名稱
    Variable
    t檢定統計量
    t-statistics
    自由度
    d.f.
    臨界值
    t(d.f.,1-α)
    p-值I
    p-value
    樣本平均數與母體
    平均數的差異
    Difference between
    sample mean and null
    母體平均數差異
    的 95% 信賴區間
    95% C.I. for difference
    下界
    Lower
    上界
    Upper
    第二年身長 - 第一年身長 -1.5681 49 1.6766 0.93835 -0.218 1.5489 Inf
    I:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(0.93835) > 顯著水準0.05,因此無法拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: