如何運用資料說故事?資料科學最重要的功能在於解讀與呈現其意義。
將資料產生的意義加以串接與形成更多理解世界的線索,並且讓他們的讀者更快、更精準地理解現象背後的真相。
自周敦頤說「文,所以載道也」,後有「文以載道」一說。對資料科學家,「文以載道」就是資料寫作學:讓資料分析成為書寫。如果文件需要對資料作圖表處理和統計分析,用R Markdown 製作文件就是最佳選擇。編輯R Markdown可以直接在R Studio當中進行,在寫R Code分析數據的同時,同時撰寫分析報告,不需要在不同的軟體中進行切換,上手相當容易。
在本書中,將使用RStudio的免費平台,建立好讀者製表、製圖與繪製地圖的基本功,以及運用Markdown語法,將R語法及結果直接與你的解讀編織(knit) 在一起,進而轉為簡報檔或一本線上圖書。分享、讓大眾理解數據資料蘊含的脈絡與現象,是資料寫作最大的價值。
作者
何宗武
美國猶他大學(University of Utah)經濟學博士,現為國立臺灣師範大學全球經營與策略研究所教授,教學資歷豐富,曾任世新大學經濟學系及財務金融學系教授。
專長
計量建模,財務經濟學,商業資料科學
著作
多本相關書籍如:《大數據決策分析盲點大突破10講:我分類故我在》、《資料分析輕鬆學:R Commander高手捷徑》、《大數據時代的決策思維:資料敘事的起承轉合》、《數位創新:商業模式經濟學》、《管理數學、Python與R:邊玩程式邊學數學,不小心變成數據分析高手》、《財經時間序列預測─使用R的計量與機器學習方法》。
目錄
推薦序
前言
I. 傳遞資訊的視覺化技巧
第1 章 RStudio 與R
1.1 RStudio 裝置
1.2 變更四方面板
1.3 RStudio
第2 章 製作傳遞資訊的表格
2.1 套件 gt 的表格製作
2.2 色彩與符號的資源
2.3 套件 kableExtra 的表格製作
第3 章 製作傳遞統計資訊的圖
3.1 資料的統計性質
3.2 Base R 的繪圖函數 plot()
3.3 三維立體繪圖
3.4 Imaging Correlation 相關性影像圖
3.5 Multiway 多向式繪圖—套件lattice
3.6 ggplot2 簡介
3.7 統計分析視覺化
第4 章 地圖
4.1 具有空間意義的資料集
4.2 套件maps 的進一步內容
4.3 套件geodata::gadm
4.4 擷取衛星地圖
II. R Markdown 的動態文件製作
第5 章 用R Markdown 寫報告或論文
5.1 開啟R Markdown
5.2 程式嵌入文本
5.3 插入數學符號與方程式
5.4 其餘編輯功能
5.5 一個R Markdown 到Word 的樣式建立
第6 章 其他
6.1 R Markdown 簡報
6.2 用R Markdown 寫一本書
序/導讀
前言
Data Journalism 經常譯成資料新聞學,其實,就技術層次,這個詞更好的名稱是資料敘事學,畢竟,Journal 一詞更通用的意義是嚴謹且專業的出版物,或稱期刊,不一定指學術期刊。例如,英國《經濟學人》(The Economist) 的內容,對問題的描述必須輔佐專業且清晰的圖表;IMF 的World Economic Outlook 內容,除了專業學理,也有大量專業的統計圖與表來輔佐內容敘事。
本書目的是為資料敘事,也就是將資料圖表分析和寫作整合起來。因為一個好的圖表,會讓寫作變得簡單。背後的精神是可重製文件(reproducible documents) 或動態文件(dynamic documents) 的製作與流通,製作這些優美東西的就是Markdown 文本,透過Markdown,我們可以輸出多種格式,如:MS-Word、PDF 和HTML。如果要直接發布一篇和數據分析有關的網誌,Markdown 的blogdown 可以直接完成並發布在指定網站;如果要製作簡報,Markdown 可以製作精彩的PPT;如果要寫一本書或碩博士論文,bookdown 可以完美整合,並可以指定期刊格式、編輯文獻目錄和內文。