首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 單一樣本平均數t檢定

單一樣本平均數t檢定
One-sample t-test
此處使用的統計分析方法---t檢定,又稱學生t(student t)檢定,是由英國統計學家戈斯特(William Sealy Gosset, 1876-1937)所提出,student則是他的筆名。t檢定是一種檢定母體平均數的統計方法,當資料中僅含單一樣本且樣本數較大時(通常樣本個數≧30的樣本可視為樣本數較大),可用此方法來檢定母體平均數是否大於、小於或等於某一特定數值。當資料中僅含單一樣本但樣本數較小時(通常樣本個數<30的樣本可視為樣本數較小),建議改以單一樣本中位數檢定(Wilcoxon signed-rank test)檢定母體中位數。
註:母體中位數經常和平均數一樣, 因此檢定中位數即檢定平均數。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-1:蜥蜴生長的研究

生物多樣性對於人類來說是一個重要的議題,地球上的物種豐富,各種的動植物都有,1992年聯合國在巴西的地球高峰會議通過『生物多樣性公約』,因此生物多樣性的議題受到了全球的關注,而保育的觀念也慢慢的深植於人心。台灣是一個美麗的寶島,地處於亞熱帶與熱帶之間,四季溫暖氣候宜人且雨量充沛,在峻嶺高山中蘊含著豐富的物種。但由於高度的經濟開發與都市建設,許多物種的棲息地被破壞殆盡,造成野生動植物數量大量減少,甚至於消失殆盡,有鑒於此,許多動物保育學家需至山林裡從事動物保育的工作,以避免一些台灣的特有品種絕種。 蜥蜴是日常生活中在野外常常可見的小型爬蟲類,非常的不起眼,但是蜥蜴可說是自遠古時代即存在的物種,因此引起許多的動物學家的研究興趣。有一位保育學家對於研究台灣特有種的短肢攀蜥相當熱衷,想了解該物種的生長速度,花了兩年的時間在中海拔的山區量測該品種蜥蜴的身長並記錄之,第一年補獲的蜥蜴共50隻,每隻皆記錄身長並於身上加以編號後放生,並於第二年再記錄這群蜥蜴的身長,兩年前的記錄顯示該地區該品種蜥蜴的平均身長為18公分,而一年前與今年所測量的資料共有50筆列於表中。

編號 1 2 3 4 5 ... 48 49 50
第一年身長 18.5 23 20.6 19 16 ... 22 20.3 18.4
第二年身長 19.4 23.5 20.9 21.2 17.5 ... 22.8 23.3 21.1

Q1:保育學家想了解在第一年所捕獲的蜥蜴的平均身長是否有比前一年為長,該如何分析呢?
問題解析:因為在兩年前的資料中顯示當時所量測的蜥蜴平均身長為18公分,若保育學家想了解第一年量測的平均身長是否大於前一年的資料,僅需討論"一年前的蜥蜴身長平均是否大於18公分?"。
統計方法:此問題中變數為蜥蜴身長,為單一變數(一個變數,建議選擇單變數分析)。因僅一組樣本且此組樣本數大於30筆,可採用分析方法:單一樣本平均數t檢定(one-sample t-test),檢定"一年前的蜥蜴身長平均是否大於18公分?"。

解析:
1. 此題可建立虛無假設為"一年前的蜥蜴平均身長小於等於18",即H0: μ第一年身長≦18。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
one-sample t-test
單一樣本平均數t檢定 - 分析結果
  • 分析方法:單一樣本平均數t檢定
  • 資料名稱:範例A-1
  • 變數名稱:第一年身長
  • 顯著水準:0.05
  • 檢定平均數:18
  • 檢定方向:右尾檢定
  • 計算時間:0.077秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    第一年身長5018.69618.913.923.42.6228
    I:樣本敘述統計量皆不包含遺失值

  • 單一樣本平均數t檢定:
    虛無假設:母體平均數 ≤ 18
    H0μ ≤ 18
    變數名稱
    Variable
    t檢定統計量
    t-statistics
    自由度
    d.f.
    臨界值
    t(d.f.,1-α)
    p-值I
    p-value
    樣本平均數與母體
    平均數的差異
    Difference between
    sample mean and null
    母體平均數的 95% 信賴區間
    95% C.I. for μ
    下界
    Lower
    上界
    Upper
    第一年身長 1.8764 49 1.6766 0.033281 * 0.696 18.0741 Inf
    I:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(0.033281) < 顯著水準0.05,因此可拒絕虛無假設。
[重新分析]
範例A-11:新藥效益的分析

藥物對於國人來說使用率可說是非常的高,從日常容易罹患的感冒、發燒、輕微皮膚疾病及足癬等,還有各種慢性病到嚴重的各種急症及致命的癌症等。藥物種類有內服與外用,顆粒、膠囊與藥膏、藥布等,還有較特殊者需以針筒注射等各種不同型式的藥品。雖然有這麼多的藥品種類,但對於藥品的使用與上市,事實上是非常的嚴格的,必須經過多次的動物與人體試驗及相關單位的審核及檢驗,才能得到上市的許可。在台灣,由於工作與經濟上的壓力,失眠已成為大多數人的夢靨,根據台灣睡眠學會統計,全台有超過200萬人睡不好,而健保局統計,台灣人一年吞掉13億顆具有安眠或鎮靜效果的藥丸,安眠藥已經是台灣藥物濫用榜排行第三的藥品【服用藥物請遵循醫師指示】。而此問題正代表著安眠藥具有廣大市場,因此引起某藥商的注意,想引進一款最新的安眠藥,實行一系列的人體試驗,在這試驗中廠商準備了三組受試者,每組各有40人,第一組使用廠商引進的新藥物,第二組則是使用坊間最受歡迎的藥物(稱為舊藥物),最後一組則是給予安慰劑。在使用藥物後記錄每個受試者自服藥後到入眠的時間長短(單位:分鐘),所有受試者的資料列於表中。

受試者編號 1 2 3 4 ... 38 39 40
第一組(新藥物) 22 18 12 8 ... 32 19 14
第二組(舊藥物) 29 34 31 20 ... 19 13 45
第三組(安慰劑) 35 39 25 26 ... 31 26 31

Q1:由於市面上有一款號稱服藥後20分鐘即可入眠的安眠藥,故該藥商想了解新藥物的藥效是否比該款藥物為佳,以便於廣告宣傳中能有宣稱更好的效果,該如何證實此療效呢?
問題解析:此問題須了解服用新藥物是否有低於20分鐘即可入眠的效果,討論問題"服用新藥物後的入眠時間是否少於20分鐘?"。
統計方法:此問題中,變數為受試者的入眠時間,為單一變數(一個變數,建議選擇單變數分析);僅使用新藥物資料可視為有一組的資料,樣本數40大於30;可採用分析方法:單一樣本平均數t檢定(one-sample t-test),檢定"服用新藥物後的入眠時間是否少於20分鐘?"。

解析:
1. 此題可建立虛無假設為"服用新藥後入眠的時間大於等於20分鐘",即H0: μ新藥物≧20。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
one-sample t-test
單一樣本平均數t檢定 - 分析結果
  • 分析方法:單一樣本平均數t檢定
  • 資料名稱:範例A-11
  • 變數名稱:新藥物
  • 顯著水準:0.05
  • 檢定平均數:20
  • 檢定方向:左尾檢定
  • 計算時間:0.078秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    新藥物4018.925188468.7512
    I:樣本敘述統計量皆不包含遺失值

  • 單一樣本平均數t檢定:
    虛無假設:母體平均數 ≥ 20
    H0μ ≥ 20
    變數名稱
    Variable
    t檢定統計量
    t-statistics
    自由度
    d.f.
    臨界值
    t(d.f.,α)
    p-值I
    p-value
    樣本平均數與母體
    平均數的差異
    Difference between
    sample mean and null
    母體平均數的 95% 信賴區間
    95% C.I. for μ
    下界
    Lower
    上界
    Upper
    新藥物 -0.7769 39 -1.6849 0.22095 -1.075 -Inf 21.2563
    I:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(0.22095) > 顯著水準0.05,因此無法拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: