以收集數據的手段來說,有所謂的實驗。實驗經常在各種領域中進行,有關實驗的知識依其領域而有不同,但不管是哪一種領域的實驗,實驗的計畫方法與實驗數據的解析方法存在著共同的準則。不關心此準則的實驗,會實施不需要的實驗,或未實施需要的實驗,造成非常沒有效率的結果。未實施需要的實驗,當然也會影響實驗數據的解析,連帶著也造成無法透過實驗取得所需要的資訊。因此,參與實驗的研究人員對進行實驗的準則需要學習知識,有系統地整理此準則的學問即為「實驗計畫法」。內容包括一元配置、二元配置、多元配置、直交配列表、多重比較、無母數統計等。
閱讀統計的書籍最重要的事情是要抓住數據分析的重點,正確地使用統計方法,避免數據分析中的統計陷阱,如樣本有偏誤、樣本無代表性、樣本不充分等,錯誤的統計解讀均會對知識的追求帶來負面的影響。
本書的企劃是以圖解式、步驟式進行解說,讓讀者可以配合步驟實際應用。此外,本書的另一個特徵是公式與例子,只要使用EXCEL就能簡單計算。
作者
陳耀茂
日本(國立)電氣通信大學經營工學博士
東海大學企管系教授
目錄
序言
第1章 數據與變異數分析
1.1 在蒐集數據之前
1.2 實驗計畫法與變異數分析
1.3 統計用語迷你辭典
1.4 重要的機率分配:有關統計量的分配
第2章 母平均的檢定與估計
2.1 母平均之檢定與估計
2.2 母平均之差的檢定與估計
第3章 百分比的檢定與估計
3.1 母百分比的檢定與估計
3.2 母百分比之差的檢定與估計
第4章 實驗計畫法
4.1 實驗計畫法簡介
4.2 實驗的實施
第5章 一元配置實驗分析
5.1 一元配置實驗的計量與解析
5.2 數據解析的實務
第6 章 二元配置實驗分析
6.1 無重複的二元配置實驗
6.2 有重複的二元配置實驗
6.3 重複測量變異數分析
第7 章 多元配置實驗分析
7.1 三元配置實驗
7.2 亂塊法
第8 章 直交配列實驗分析
8.1 利用直交配列的計畫實驗
8.2 直交配列實驗的數據解析
第9 章 多重比較分析
9.1 最小顯著差法
9.2 Bonferroni 法
9.3 Tukey 法
9.4 Dunnett 檢定
9.5 Scheffe 法
第10 章 無母數變異數分析
10.1 二獨立樣本之檢定
10.2 成對樣本之檢定
10.3 k 組獨立樣本之檢定
10.4 k 組成對樣本之檢定
附錄 數表
參考文獻
序/導讀
序
變異數分析(ANalysis Of VAriance; ANOVA)是一種統計方式用於比較不同組的平均值之間的變異。即使各個組的平均值看似不同,這也可能是由於抽樣錯誤所引起的,而不是由於自變量對因變量的影響。如果是由於抽樣錯誤,則組的平均值之間的差異是沒有意義的。變異數分析有助於確定平均值的差異是否在統計上有顯著性。
在數據科學中使用變異數分析的一個例子,就是電子郵件垃圾郵件檢測。由於電子郵件和電子郵件功能數量龐大,識別和拒絕所有垃圾郵件變得非常困難且占用大量的資源。變異數分析和F檢定(F-test)被用於識別至關重要的特性,用於正確識別哪些是垃圾郵件、哪些不是垃圾郵件。
本書是為「已收集數據但不知道分析方法是什麼?」的人而寫的。
當然,對於「想詳細了解變異數分析」方法的人,也是可以充分因應他們的要求。
本書的特徵是「容易了解」、「方便閱讀」。
本書不需要正襟危坐的在書桌上閱讀,即使搭乘捷運、公車也可閱讀。
我們想要知道的事情是:
「幾個處理之間有差異嗎?」
「差異有多少呢?」
以及,如處理之間有明顯差異時,
「哪一個處理是最好的呢?」
這些手法稱為變異數分析與多重比較。
變異數分析與多重比較是統計分析的中心話題,其中,Bonferroni 校正是一種多重比較校正,當多個相關或獨立的統計檢定同時執行時使用(因為雖然給定的alpha值可能適用於每個單獨的比較,但它不適用於所有比較的集合)。為避免大量假陽性,需要降低 alpha 值以考慮執行的比較次數,此校正因而受到矚目。
為了學習此手法,書中搭配「有趣的數據」。所謂有趣的數據是指對學習而言感到有興趣的數據。
閱讀統計的書籍最重要的事情是要抓住數據分析的重點、正確地使用統計方法,避免數據分析中的統計陷阱,如樣本有偏、樣本無代表性、樣本不充分等,錯誤的統計解讀會對知識的追求帶來負面的影響。
數據分析的重點是:
1. 你想在這些數據中獲得什麼?
2. 哪些數據是可以利用的?
3. 它的實際意義是什麼?
本書的另一個特徵是公式與例子,只要使用EXCEL 就能簡單計算。
此外,本書的企劃是以圖解式、步驟式進行解說,讓讀者可以配合步驟以利實際應用。最後,倉促成書,書中若有誤植之處,還盼賢達賜正,日後再行補正。