首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » (獨立)雙樣本平均數差異t檢定

(獨立)雙樣本平均數差異t檢定
Two-sample t-test
此處使用的統計分析方法---t檢定,又稱學生t(student t)檢定,是由英國統計學家戈斯特(William Sealy Gosset, 1876-1937)所提出,student則是他的筆名。t檢定是一種檢定母體平均數的統計方法,當資料中兩組樣本的樣本數都較大時(通常樣本個數≧30的樣本可視為樣本數較大),可用此方法檢定兩組樣本間母體平均數的差異值是否大於、小於或等於某一特定數值。當資料中樣本數較小時(通常樣本個數<30的樣本可視為樣本數較小),建議改用(獨立)雙樣本中位數差異檢定(Wilcoxon rank-sum test)檢定中位數差。
註:母體中位數經常和平均數一樣, 因此檢定中位數差即檢定平均數差。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-11:新藥效益的分析

藥物對於國人來說使用率可說是非常的高,從日常容易罹患的感冒、發燒、輕微皮膚疾病及足癬等,還有各種慢性病到嚴重的各種急症及致命的癌症等。藥物種類有內服與外用,顆粒、膠囊與藥膏、藥布等,還有較特殊者需以針筒注射等各種不同型式的藥品。雖然有這麼多的藥品種類,但對於藥品的使用與上市,事實上是非常的嚴格的,必須經過多次的動物與人體試驗及相關單位的審核及檢驗,才能得到上市的許可。在台灣,由於工作與經濟上的壓力,失眠已成為大多數人的夢靨,根據台灣睡眠學會統計,全台有超過200萬人睡不好,而健保局統計,台灣人一年吞掉13億顆具有安眠或鎮靜效果的藥丸,安眠藥已經是台灣藥物濫用榜排行第三的藥品【服用藥物請遵循醫師指示】。而此問題正代表著安眠藥具有廣大市場,因此引起某藥商的注意,想引進一款最新的安眠藥,實行一系列的人體試驗,在這試驗中廠商準備了三組受試者,每組各有40人,第一組使用廠商引進的新藥物,第二組則是使用坊間最受歡迎的藥物(稱為舊藥物),最後一組則是給予安慰劑。在使用藥物後記錄每個受試者自服藥後到入眠的時間長短(單位:分鐘),所有受試者的資料列於表中。

受試者編號 1 2 3 4 ... 38 39 40
第一組(新藥物) 22 18 12 8 ... 32 19 14
第二組(舊藥物) 29 34 31 20 ... 19 13 45
第三組(安慰劑) 35 39 25 26 ... 31 26 31

Q2:廠商在推出新藥物之前,須先了解效果是否較原販賣的舊藥物為佳,才能決定是否販賣,請問廠商是否應販賣新的藥物呢?與舊藥物相比較,新藥是有效的嗎?
問題解析:此處要了解新藥的藥效與舊藥的藥效相比是否有差異,即比較服用新藥後的平均入眠時間是否少於服用舊藥後的平均入眠時間,討論問題"服用新藥後的平均入眠時間減去服用舊藥後的平均入眠時間是否小於0?"。
統計方法:此問題中,變數為受試者的入眠時間,為單一變數(一個變數,建議選擇單變數分析);使用新藥物與舊藥物比較可視為有二組的資料,樣本數40大於30;二組受試者之間並無關聯,為獨立樣本;可採用分析方法:(獨立)雙樣本平均數差異t檢定(two-sample t-test),檢定"服用新藥後的平均入眠時間減去服用舊藥後的平均入眠時間是否小於0?"。

解析:
1. 此題可建立虛無假設為"服用新藥後的平均入眠時間減去服用舊藥後的平均入眠時間大於等於0",即H0: μ新藥物- μ舊藥物≧0。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: two sample independent t test
(獨立)雙樣本平均數差異t檢定 - 分析結果
  • 分析方法:(獨立)雙樣本平均數差異t檢定
  • 資料名稱:範例A-11
  • 檢定變數:_NEW_
  • 分組變數:_GROUP_(新藥物, 舊藥物)
  • 顯著水準:0.05
  • 檢定平均數差異:0
  • 檢定方向:左尾檢定
  • 計算時間:0.094秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    分組變數(_GROUP_)
    Class Variable(_GROUP_)
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    _NEW_ 新藥物4018.925188468.7512
    舊藥物4032.22533.5116511.0998
    不分組(Total)8025.5752486511.9755
    I:樣本敘述統計量皆不包含遺失值

  • 雙樣本變異數(標準差)差異檢定I
    虛無假設:兩組資料的變異數相等
    H0σ1222 = 1
    變數名稱
    variable
    F檢定統計量
    F-statistics
    分子自由度
    d.f. of
    numerator
    分母自由度
    d.f. of
    denominator
    p-值II
    p-value
    母體變異數比值的 95% 信賴區間
    95% C.I. for ratio
    下界
    lower
    上界
    upper
    _NEW_ 0.6216 39 39 0.14202 0.3288 1.1753
    I:分組變數為_GROUP_
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 雙樣本平均數差異t檢定(獨立樣本)I,II
    虛無假設:母體平均數差異 ≥ 0
    H0μ1 - μ2 ≥ 0
    變數名稱
    Variable
    t檢定統計量
    t-statistics
    自由度
    d.f.
    臨界值
    t(d.f.,α)
    p-值III
    p-value
    樣本平均數與母體
    平均數的差異
    Difference between
    sample mean and null
    母體平均數差異
    的 95% 信賴區間
    95% C.I. for difference
    下界
    Lower
    上界
    Upper
    _NEW_ -5.9511 78 -1.6646 3.5846e-08 *** -13.3 -Inf -9.5798
    I:分組變數為_GROUP_
    II:根據雙樣本變異數檢定結果,假設兩母體具有相同變異數進行雙樣本平均數差異t檢定
    III:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(3.5846e-08) < 顯著水準0.05,因此可拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: