想了解如何兼顧資料共享與隱私安全?
讓你腳踏實地,將理論知識深化為實踐能力!
★金融業工程師 實戰必備
★專案實作、延伸領域 一應俱全
▍本書介紹
隨著社會發展,資料隱私安全的關注度正不斷提高,資料擁有者極力反對無限制計算和使用敏感性資料。在未經許可下,隱私資訊若被商業機構利用即被視為違規,而不同領域間的資料分析也將變得越來越困難。
聯邦學習正是解決這些挑戰的關鍵技術。過去幾年不論在研究領域或產業領域,都見證了聯邦學習從無到有、由面對質疑到逐步嶄露頭角的過程。聯邦學習以同態加密等方法來保證本地訓練資料的隱私,同步實現多個資料擁有者協同訓練一個共用的機器學習模型。根據不同的應用場景,逐步發展出了橫向聯邦學習、縱向聯邦學習、聯邦遷移學習等類型。
本書不僅限於背景歷程、演算法模型、平台框架、應用實戰,更延伸至電腦視覺、自然語言處理等領域的思考與展望,是新一代AI工程師必備的技術參考。
本書特色
.FinTech和深度學習結合
.新一代機器學習,更安全穩定快速
.聯邦學習演算法,模型實作及多種演算法
.使用聯邦學習的推薦系統
.Docker/K8s的聯邦學習平台架設運行
.信用卡/保險評鑑機制的建立
.聯邦學習在電腦視覺、NLP、醫療、物聯網的實作專案
作者
向小佳
光大科技有限公司副總經理。曾任中國科學院副研究員、哥倫比亞大學訪問學者、華為架構師。在雲端運算、大數據、機器學習領域具有豐富的學術與產業應用經驗。於2010年獲得北京清華大學博士學位。
李琨
光大科技有限公司追光實驗室負責人。致力於金控集團資料合作和資料探勘方向的解決方案實作與演算法創新。於2011年獲得北京大學計算數學博士學位。
王鵬
光大科技有限公司大數據研究團隊負責人。擁有10餘年的大數據、人工智慧系統設計經驗,並在金控集團應用領域中實現了技術創新,其成果獲得了多項獎項。
鄭方蘭
光大科技有限公司追光實驗室技術專家。致力於開發演算法模組解決實際業務問題和演算法創新。於2012年獲得博士學位。
田江
光大科技有限公司大數據部負責人。工學博士,在大數據、人工智慧領域擁有豐富的理論研究及實踐經驗。
目錄
第1章 聯邦學習與金融科技應用介紹
1.1 聯邦學習的發展背景和歷程
1.2 金融資料價值採擷的聯邦學習實踐
第2章 聯邦學習演算法之建模準備
2.1 聯邦學習的分類
2.2 樣本對齊的實現方式
2.3 特徵工程的聯邦學習實現方式
第3章 聯邦學習演算法之模型實現
3.1 線性模型的聯邦學習實現方式
3.2 極端梯度提升樹的聯邦學習實現方式
3.3 深度學習類演算法的聯邦學習實現方式
第4章 以聯邦學習為基礎的推薦系統
4.1 資訊推薦與推薦系統
4.2 矩陣分解和因數分解機的實現方式
4.3 聯邦推薦系統演算法
第5章 聯邦學習應用之資料要素價值
5.1 聯邦學習貢獻度
5.2 以聯邦學習為基礎的資料要素交易
第6章 聯邦學習平台架設實踐
6.1 聯邦學習開放原始碼框架介紹
6.2 FATE架構與核心功能
6.3 金融控股集團聯邦學習平台簡介
6.4 FATE叢集部署實踐
6.5 與異質平台對接
第7章 聯邦學習平台實踐之建模實戰
7.1 水平聯邦學習場景
7.2 垂直聯邦學習場景
第8章 跨機構聯邦學習營運應用案例
8.1 跨機構資料統計
8.2 在交換行銷場景中的聯邦學習實踐
8.3 聯邦規則取出演算法及其在反詐騙與行銷場景中的應用
第9章 跨機構聯邦學習風控應用案例
9.1 聯邦學習下的評分卡建模實踐
9.2 對企業客戶評估的聯邦學習和區塊鏈聯合解決方案
9.3 在保險核保場景中銀行保險資料聯邦學習實踐
第10章 聯邦學習應用擴充
10.1 以聯邦學習為基礎的電腦視覺應用
10.2 聯邦學習在自然語言處理領域的應用
10.3 聯邦學習在大健康領域中的應用
10.4 聯邦學習在物聯網中的應用
A RSA公開金鑰加密演算法
B Paillier半同態加密演算法
C 安全多方計算的SPDZ協定
D 參考文獻
序/導讀
前言
「資料是新時代的石油」。石油需要經過勘探、開採、提煉才能成為石化產品,服務人類,表現價值。資料同樣需要經過治理和採擷才能產生價值。在資料治理和採擷的過程中,資料的應用面臨很多困難和挑戰。解決「資料孤島」問題是其中最突出的困難。隱私保護是近年來從個人使用者到政府都高度注意的內容。如何在保護個人隱私和資料安全的情況下,實現跨機構的資料聯合使用,是當前巨量資料產業和人工智慧技術應用的重要課題與探索方向。
2020年被認為是聯邦學習和隱私保護計算的應用重大突破點。無論是掌握最豐富資料資源的網際網路「大廠」,掌握大量金融資料的銀行和豐富通訊資料的電信企業,還是傳統的提供資料服務的第三方科技公司,都開始佈署聯邦學習,或提出應用架構框架,或結合業務建立產業解決方案。這既是資料共用和價值採擷具有巨大的應用需求與價值的表現,也是面對嚴格的法律和監管要求,資料相關工作的一種必然的選擇。
聯邦學習身為隱私保護計算技術,為資料的聯合建模和價值採擷提供了可行的解決路徑,正在實踐中高速發展。在金融科技發展的過程中,對於資料的跨機構聯合使用有強烈的應用需求。在打造世界一流金融控股集團的戰略目標過程中,作為金融科技產業的參與者,把在聯邦學習上的探索和實踐經驗分享給業界,希望為巨量資料和人工智慧在金融產業的實踐應用、數位經濟發展和企業數位化轉型貢獻一份力量。這也是我們撰寫本書的初心和動機。我們嘗試從聯邦學習發展的背景、技術方法和工具的原理、實踐的詳細過程、與金融業務相關的應用案例、應用展望等方面,多角度、多層次地展示聯邦學習及其在金融科技產業應用的全貌。
在撰寫本書的過程中,特別是在資料收集方面,我們獲得了光大科技有限公司巨量資料部門同事的大力幫助,在此特別向張明銳、凌立、周權、魏樂、額日和、盧格潤、彭成霞、原田、畢光耀、樊昕曄、李鈺、王義文、解巧巧等表示衷心的感謝。本書的撰寫和出版獲得了電子工業出版社博文視點公司石悅老師,從選題策劃到佈署謀篇等方面的幫助。我們也對石悅老師表達感謝。此外,我們還要特別感謝香港科技大學的楊強教授和聯邦學習FATE 開放原始碼社區創始人陳天健,他們閱讀了本書初稿並提出了很多寶貴的意見和建議,使我們對FATE 框架的介紹更加準確與深入。