首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 皮爾生相關係數

皮爾生相關係數
Pearson’s correlation coefficient
此處的統計分析方法可計算並分析皮爾生相關係數(Pearson’s correlation coefficient),主要用來衡量兩個變數間線性關聯性的高低程度,此方法限制兩個變數皆需為連續型,且為比例尺度。皮爾生相關係數值介於-1與1之間,當值大於0時稱兩變數為正相關,等於1時稱為完全正相關;小於0時稱兩變數為負相關,等於-1時稱為完全負相關;等於0時則稱兩變數為無相關。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例B-4:軌道哩數和載客量的相關研究

在美國由於幅員相當廣大,交通工具對於民眾是相當重要的,早期發展出許多的火車與電車做為都市間與都市內的運輸工具。隨著經濟的發展,汽車的大量生產與私人化特性,電車的使用量大幅的下降;另外在高密度發展的大都市大都建有高運量的捷運系統,可說是相當的便利。但是汽車的高密度普及使得都市的交通狀況非常壅擠,且地下化捷運興建的成本與時間花費皆高,並不是每個城市皆能興建此種大眾運輸系統,而電車的技術則有了新的發展,因此許多城市轉而發展輕軌電車為其主要的大眾交通運輸系統,輕軌電車被認為是安全性極高的運輸系統。某交通研究機構想了解輕軌電車在美國發展的狀況,記錄了七個城市中輕軌電車系統的軌道鋪設哩數及每週載客人數;資料記錄於表中。

表:各城市輕軌電車鋪設哩數與載客數。
城市 軌道哩數 載客數(千人)
克里弗蘭 15 15
丹佛 17 35
波特蘭 38 81
沙加緬度 21 31
聖地牙哥 47 75
聖荷西 31 30
聖路易斯 34 42

Q1:若城市有較密集的軌道鋪設,使得交通變得更為便利,則民眾搭乘的意願就會提高,但是較密集的鋪設代表著成本的提高,為了對成本與收入之間的關係有較確切的了解,故研究機構想研究鐵軌鋪設的哩數與載客量的關係?
問題解析:此處想了解比較長的鐵軌鋪設哩數會有較高的載客量嗎?或是根本沒有影響,想了解此情況可討論"鐵軌鋪設哩數與載客量的相關性"。
統計方法:此問題中有兩個變數,分別是軌道鋪設哩數與每周載客人數(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為連續變數,可採用分析方法:皮爾生相關係數(Pearson's correlation coefficient)分析,檢定"鐵軌鋪設哩數與載客量的相關性"。

解析:
1. 此題可建立虛無假設為"鐵軌鋪設的哩數與載客量無相關",即H0:ρ=0。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: Pearson's correlstion coefficient
皮爾生相關係數 - 分析結果
  • 分析方法:皮爾生相關係數
  • 資料名稱:範例B-4
  • 變數名稱:軌道鋪設哩數, 周末載客人數
  • 虛無假設:相關係數ρ 無 0 (雙尾檢定)
  • 計算時間:

  • 樣本敘述統計量I
    變數名稱
    Variable
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    軌道鋪設哩數72931154711.8181
    周末載客人數744.142935158124.5658
    I:樣本敘述統計量皆不包含遺失值

  • 皮爾生相關係數矩陣I
    軌道鋪設哩數周末載客人數
    軌道鋪設哩數1.000
    0.000
    7
    0.844
    0.017
    7
    周末載客人數0.844
    0.017
    7
    1.000
    0.000
    7
    I:表格內容為皮爾生相關係數 / P-值 / 樣本數

[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: