◆採用黑箱模式和MBA 案例模式,結合大量經典案例,
◆介紹 sklearn 機器學習模組函數庫和常用的機器學習演算法,在金融領域的應用
◆懂 Excel 就能看懂本書
本書採用生動活潑的語言,從入門者的角度,講解Python 語言和sklearn 模組庫內置的各種經典機器學習演算法;介紹股市外匯、比特幣等實盤交易資料在金融量化方面的具體分析與應用,包括對未來股票價格的預測、大盤指數趨勢分析等。
簡單風趣的實際案例讓讀者能夠快速掌握機器學習在量化分析方面的程式設計,為進一步學習金融科技奠定扎實的基礎。
懂 Excel 就能看懂本書,逆向式教材模式,結合大量案例、圖表,層層剖析,系統說明逐步深入。
本書特色
簡單實用,配合大量的圖表說明。
◎IT零起點:無須任何電腦程式設計基礎,只要會打字、會使用Excel,就能看懂本書。
◎投資零起點:無須購買任何專業軟體,配套zwPython 套裝軟體。
◎配置零起點:所有軟體、資料全部採用「開箱即用」模式,解壓縮即後可直接執行。
◎理財零起點:採用通俗易懂的語言,配合大量專業的圖表和實盤操作案例。
◎數學零起點:全書沒有複雜的數學公式,輕輕鬆松就能看懂全書。
作者
何海群
網名:字王,CHRD前海智庫CTO,《中華大字庫》發明人。
20年人工智慧從業經驗;zwPython開發平台、TopQuant.vip極寬量化系統設計師,中國「Python創客」專案發起人, Python量化專案的啟蒙者和開拓者: TOP極寬量化開源團隊的創始人。
研究成果有:BigQuant理論架構:Python量化+數位貨幣+人工智慧;「小數據」理論, MTRD多節點超算集群演算法、「1+N」網路傳播模型、人工智慧「足彩圖靈法則」等;論文《人工智慧與中文字型設計》是中文字形檔三大基礎建模理論之一。
目錄
01 Python 與機器學習
1.1 scikit-learn 模組函庫
1.2 開發環境架設
1.3 機器學習:從忘卻開始
1.4 學習線圖
02 機器學習程式設計入門
2.1 經典機器學習演算法
2.2 經典鳶尾花
2.3 機器學習演算法程
2.4 機器學習資集
2.5 資割函
2.6 線性回歸演算法
03 金融資料的前置處理
3.1 至簡歸一法
3.2 股票池與Rebase
3.3 融資割
3.4 preprocessing 模組
04 機器學習快速入門
4.1 回歸演算法
4.2 LR 線性回歸模型
4.3 常用評測指標
4.4 多項式回歸
4.5 輯回歸演算法模型
05 模型驗證最佳化
5.1 交換驗證評估器
5.2 交換驗證評分
06 決策樹
6.1 決策樹演算法
6.2 決策樹回歸函
6.3 決策樹分函
6.4 GBDT 演算法
6.5 反覆運算決策樹函
07 隨機森林演算法和極端隨機樹演算法
7.1 隨機森函
7.2 決策樹測試架構
7.3 決策樹測試函
7.4 極端隨機樹演算法
7.5 極端隨機樹函
08 機器學習演算法模式
8.1 學習模式
8.2 機器學習五大派
8.3 經典機器學習演算法
8.4 小結
09 機率程式設計
9.1 單純貝氏的上證之
9.2 隱藏馬可夫模型
10 實例演算法
11 正規化演算法
11.1 回歸演算法
11.2 最小絕對值收斂和選擇算子回歸演算法
11.3 彈性網演算法
11.4 最小角回歸演算法
12 分群分析
12.1 K 平均值演算法
12.2 BIRCH 演算法
12.3 小結
13 降維演算法
13.1 主成分分析
13.2 奇值分解演算法
14 整合演算法
14.1 sklearn 內建整合演算法
14.2 裝袋演算法
14.3 AdaBoost 反覆運算演算法
15 支援向量機
15.1 支援向機演算法
15.2 SVM 函介面
16 類神經網路演算法
A sklearn 常用模組和函數
B 量化分析常用指標
序/導讀
前言
◇ 本書特色
本書全程採用黑箱模式和MBA 案例模式,結合大量經典案例,介紹
sklearn 機器學習模組函數庫和常用的機器學習演算法,懂Excel 就能看懂本書;逆向式教材模式,結合大量案例、圖表,層層剖析;三位一體的教材模式:圖書+ 開發平台+ 成套的教學案例,系統說明、逐步深入。
本書簡單實用,書中配備大量的圖表說明,本書特點如下。
■ IT 零起點:無須任何電腦程式設計基礎,只要會打字、會使用 Excel,就能看懂本書,利用本書搭配的Python 軟體套件,輕鬆學會如何利用Python 對股票資料進行專業分析和量化投資分析。
■ 投資零起點:無須購買任何專業軟體,本書搭配的 zwPython 軟體套件,採用開放原始碼模式,提供100% 全功能、全免費的工業級數據分析平台。
■ 設定零起點:所有軟體、資料全部採用“開箱即用”模式,綠色版本,無須安裝,解壓縮後即可直接執行系統。
■ 理財零起點:採用通俗容易的語言,配合大量專業的圖表和實盤操作案例,無須任何專業金融背景,輕鬆掌握各種量化投資策略。
■ 數學零起點:全書沒有任何複雜的數學公式,只有最基本的加、減、乘、除,輕輕鬆鬆就能看懂全書。
◇ 網路資源
本書的案例程式,已經做過最佳化處理,無須GPU 顯示卡,全部支援單CPU 平台,不過為避免版本衝突,請儘量使用zwPython2017m6 版本執行本書的案例程式。
使用其他執行環境的讀者,如Linux、Mac 平台的使用者,請儘量使用Python 3 版本,自行安裝其他所需的模組函數庫,如Numpy、Pandas、Tushare 等協力廠商模組函數庫。
此外需要注意的是,大家執行本書案例獲得的結果可能與書中略有差別;甚至多次執行同一案例,結果都有所差異。這屬於正常情況,因為很多機器學習函數,內部使用了亂數作為種子數,用於系統變數初始化等操作,每次分析的起點或中間參數會有所不同。
版本衝突是開放原始碼專案常見的問題,為了解決這個問題,本書的原始程式是獨立儲存的。此外,我們還特意設計了zwPython 教學版。
建議初學者先使用zwPython 教學版,有關的教材程式,已經經過版本相容測試,並且整合了zwDat 金融資料集。
◇ 目錄設定
為執行本書教材程式,使用者需要下載以下三個軟體,並設定好目錄:
■ zwPython,必須放在根目錄,是 Python 開發平台,為避免版本衝突,請儘量使用zwPython2017m6 版本。
■ kb_demo,本書 sklearn 機器學習搭配教材原始程式。
■ pg_demo,本書 Python 入門學習搭配教材原始程式。
以上軟體、程式最好儲存在固態硬碟,這樣速度會快很多;目錄名稱不要使用中文名稱,壓縮檔當中的中文名稱只是為了便於使用者下載。
zwPython 開發平台必須放在根目錄,教材程式可以放在其他自訂目錄,建議放在zwPython 目錄下面,作為二級目錄。
◇ 致謝
特別感謝電子工業出版社的黃愛萍和陳林編輯在選題策劃和稿件整理方面所做的大量工作。
同時,在本書創作過程中,極寬開放原始碼量化團隊和教育訓練班的全體成員提出很多寶貴的意見,並對部分教材程式做了中文註釋。
特別是吳娜、余勤、邢夢來、孫勵、王碩幾位成員,為TOP 極寬開放原始碼量化文函數庫和開放原始碼軟體撰寫文件,以及在團隊成員管理方面做了大量工作,對他們的付出表示感謝。
何海群(字王)
TOP 極寬量化開放原始碼組發起人