資料科學的統計實務:探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步
 
作者: 江崎貴裕 
書城編號: 23398820

原價: HK$200.00
現售: HK$190 節省: HK$10

購買此書 10本或以上 9折, 60本或以上 8折

購買後立即進貨, 約需 7-12 天

 
 
出版社: 旗標
出版日期: 2021/11
頁數: 272
ISBN: 9789863126829

商品簡介


新書上市即攻佔日本亞馬遜統計類書籍第一名

 

很多資料科學、機器學習的書,內容充滿各種建模的技術展示、完美的案例分析,卻忘記了更重要的「資料」。唯有掌握好手中的資料,才是機器學習成功建模的第一步。

 

無法了解資料,深度學習也救不了你;相反的,正確蒐集資料,輕鬆建模沒煩惱。

 

如何了解資料?當然要從統計觀念開始。學習統計一定都要看抽象複雜的數學嗎?並不是!本書所使用的範例,會告訴大家「為什麼統計學要如此定義」、「為什麼技巧要那樣使用」。當讀者了解統計背後的觀念時,才不會迷失在複雜的數學。此外,有別於一般市售書籍總是用漂亮案例展示程式運行結果,此書用相當多的範例都是「專家也會犯的錯誤」,相信讀者同時學習成功以及失敗的案例後,可以更全面地了解資料科學的分析流程觀念。

 

本書會介紹資料分析中的許多技術的基本觀念,如變異數分析、偏相關係數、自相關函數、Bonferroni校正、Holm校正、隨機對照試驗、斷點迴歸分析、傾向評分匹配、T檢定、F檢定、分層多階段抽樣法等,介紹的過程中會直擊分析技術的思維,而非僅展示漂亮的數學。

 

本書亦會說明身為資料科學家該有的素養,來避免確認偏誤、倖存者偏誤、選擇偏誤、發表偏誤、自願者偏誤、可得性偏誤、樂觀偏誤、常態偏誤、後此謬論、賭徒謬誤、辛普森謬論、p-hacking、HARKing、單方論證、霍桑效應、畢馬龍效應等資料分析中可能踩到的陷阱。

 

如果讀者曾經有以下問題,那這本書將是你的最佳解方。

● 我想知道怎麼蒐集高品質資料來加速機器學習建模

● 我想知道什麼樣的資料適合什麼分析技術

● 我想知道分析過程中是否參雜不自覺的偏見

● 我想知道分析完的結果代表什麼意思

● 我想知道為什麼資料分析可以解決問題

 

此外,中文版還提供免費Python程式下載,讓讀者可以實際演練書中的範例,加深對知識的理解。

 

本書貫通從資料蒐集、資料分析、資料解讀每一個環節的觀念,讓你走上資料科學家的康莊大道! 

 

本書特色

 

● 概念性介紹資料分析的流程,探討過程中所需要的技術,解說分析結果的意義

● 拒絕只展示漂亮數學,改變傳統一直寫程式的教學,帶你直擊資料分析流程的根本觀念

● 分享專家的成敗案例,助你建立好的資料科學家素養,避免落入陷阱

● 底線標示重要觀念,粗體標示重要名詞,註解提供讀者延伸資訊

● 滿滿全彩圖說,每章結束附有重點整理,中文版附贈範例程式

● 中文版收錄免費 Bonus,由國內專家分享業界經驗談,讓你快速銜接上實務技能

 

好評推薦(依姓名筆劃順序排列)

 

國立政治大學統計學系副教授、台灣人工智慧學校講師 吳漢銘 推薦 

國立政治大學統計學系助理教授 周珮婷 推薦

「資料科學家的工作日常」版主 張維元 推薦

國立臺灣大學名譽教授 謝南瑞 推薦

作者

江崎貴裕

 

東京大學先端科學技術研究中心特任講師。

 

2011 年畢業於東京大學工學部航空太空工程學系。2015 年取得同系所課程博士學位(因表現優異而縮短修業年限 1 年)與論文博士學位(工程學)。曾任日本學術振興會特別研究員、日本國立情報學研究所專案計畫研究員、日本國立研究開發法人科學技術振興機構 PRESTO 研究員與史丹佛大學訪問學者,自 2020 年起擔任現職。曾獲東京大學校長獎及井上研究獎勵獎等。致力於憑藉數學分析技術,解決統計力學、腦科學、行為經濟學、生物化學、運輸工程與物流科學等多重領域之問題。

目錄

序言
第一篇 資料特性的相關知識
第1章 測量其實並非易事
1.1 測量資料
1.2 測量的難處
1.3 測量誤差之外的誤差

第2章 資料誤差
2.1 測量標準的選擇
2.2 問卷帶來的問題
2.3 抽樣母體誤差
2.4 沒觀測誤差
2.5 回答者帶來的問題
2.6 發表偏誤(Publication Bias)

第3章 測量誤差中的隨機誤差 (Random Error) 與偏誤 (Bias)
3.1 測量誤差(Measurement Error)的分析
3.2 誤差與機率分佈(Probability Distribution)
3.3 機率分佈的相關知識
3.4 處理隨機誤差 (Random Error) 

第4章 資料抽樣方法論
4.1 抽樣的概念
4.2 抽樣的方法

第二篇 資料分析的相關知識
第5章 資料分析的基本流程
5.1 檢查手中資料
5.2 正確分析資料
5.3 妥善管理資料

第6章 干擾因子(Confounding Factor)與因果關係
6.1 兩個變數之間的關聯
6.2 面對並處理干擾因子(Confounding Factor)
6.3 無法使用隨機對照試驗(Randomized Controlled Trial)的處理方式

第7章 單一變數的分析手法
7.1 探討敘述統計量 (Descriptive Statistics) 
7.2 探討資料分佈
7.3 探討理論分佈
7.4 探討時序資料

第8章 探究變數之間的關係 – 假設檢定(Hypothesis Testing)、檢定三步驟、手法選擇、相關係數、效應大小(Effect Size)
8.1 比較兩個變數的數值
8.2 關於假設檢定的思維
8.3 研究兩個變數的相關性

第9章 解讀多變數資料
9.1 探索分析與多重檢定
9.2 變異數分析(Analysis of Variance)與多重比較
9.3 探究相關結構
9.4 分析方法整理

第10章 數學模型的要點
10.1 簡介數學模型
10.2 配合目標來建立模型
10.3 使用模型進行預測(Prediction)

第三篇 資料活用的相關知識
第11章 分析資料的陷阱
11.1 資料操作時容易遇到的陷阱
11.2 資料有限時容易遇到的陷阱
11.3 資料推論時容易遇到的陷阱

第12章 解讀資料的陷阱
12.1 分析結果的可信度
12.2 解讀資料的認知偏誤

第13章 運用資料的陷阱
13.1 依不同目標做出評估跟決策
13.2 獲取資料的實際考量
13.3 現實世界與資料分析的差異

江崎貴裕 作者作品表

資料科學的統計實務:探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步

資料科學的建模基礎:別急著coding!你知道模型的陷阱嗎?

2021年11月中文新書 同類商品


時日悠悠

野鳥完全圖鑑:詳盡比對辨識,盡覽鳥類之美

香港中小學中華經典詩文多媒體課程:視頻篇

香港中小學中華經典詩文多媒體課程:音頻篇

為甚麼又是中國

邯城之傾

中國的智慧:樓宇烈的北大哲學課

哲學問題論集

粵語三國演義

西方文明的未來

玫瑰與革命:民國奇女子鄭毓秀自傳

每個人的心0距離

Bonjour! 初學者開口說法語(附法中對照音檔 QR Code)

哥哥和妹妹吵架了

以茶代酒:愛在原鄉,健康促進

植栽一座文化森林:洪建全基金會50年

顯微鏡下的古人生活

愛沙尼亞・解密全數位王國:一張數位身份證就能超越GAFAM!從全球首創雲端治理成功模式,解讀數位化矛盾與未來

漢聲精選世界兒童數學叢書第四輯(11本書+1本媽媽手冊)

漢聲精選世界兒童數學叢書第三輯(10本書+1本媽媽手冊)

還有... [顯示所有書籍]

* 以上資料僅供參考之用, 香港書城並不保證以上資料的準確性及完整性。
* 如送貨地址在香港以外, 當書籍/產品入口時, 顧客須自行繳付入口關稅和其他入口銷售稅項。

 

 

 

  我的賬戶 |  購物車 |  出版社 |  團購優惠
加入供應商 |  廣告刊登 |  公司簡介 |  條款及細則

香港書城 版權所有 私隱政策聲明

顯示模式: 電腦版 (改為: 手機版)