◤ 25堂「AI世代」標配的統計素養課 ◢
不知不覺就懂了!
從數據識讀、邏輯推理,到決策輔佐,
前BCG集團王牌顧問
教你用統計學看懂世界運轉的祕密
>>> 人生是靠「骰子點數」決定的?
>>> 贏家為什麼都把YES或NO交給期望值?
>>> 鬼遮眼的時候就用數字釐清真相?
\WTF!! 原來統計學這麼好用∕
日文版熱銷20萬冊,文組圈口碑爆紅!
只要會按計算機,你就能解開這個世界的祕密
「統計學」是AI時代的必備素養,
但對文組人來說,卻總是不得其門而入……
這是一本即便不擅長數字的人,
也能一步步學會運用「統計式見解/思維」的訓練書,
只要懂得操作計算機上的加、減、乘、除,
你就能一邊享受解題樂趣,
一邊鍛鍊出看穿數字背後真相的能力!
\你可以:看見別人看不見的因果,回答網路上找不到的答案∕
本書並不是要教你怎麼驗算統計學,
而是要教你怎麼「用統計學思考」,這個才是ChatGPT搶不走的能力!
Class1 即使只靠「四則運算」也能懂得這麼多!──@變換是強大的工具
Class2 工作與人生是靠「機率」在決定輸贏的嗎?──關於情境規劃與漏斗
Class3 萬事萬物是「常態分布」構成的結果!──關於解讀大局的「偏差值」
Class4 掌握統計學上「正確的」數據處理法!──分辨有意義與無意義的調查
Class5 「多變量分析」是在AI時代生存的必備知識──機會、風險與財富,皆在其中
\懂「機率」與「期望值」,那些卡住你人生的難題就能迎刃而解∕
任何人都能節省龐大的試錯成本、快速釐清問題本質!
本書作者齋藤,曾是波士頓顧問集團(BCG)首屈一指的王牌顧問,生涯協助無數公司導入AI及數據分析、管理機制,大幅升級第一線經理人的「數字腦」。
同為文組人出身的他,將透過這本專為跨領域讀者而寫的書,用25個與我們生活切身相關的精彩提問,引導你進入用統計學思考、解決問題的世界。
他強調:「數據與AI的各種應用,今後會更加如火如荼地發展。抗拒或欣然接受這種時代的變化,差別只在於你『懂不懂它運作的機制』。交友軟體也好,AI給你的作文建議也罷,說來說去都不脫「多變量分析」(本書第五章)的範疇……」
而本書提供的方法論,就是你弄懂這個新時代遊戲規則的敲門磚。有趣,而且超級好懂!
※更多精彩內容,請下滑至【內容連載】──前言:你可以從這本書中獲得什麼?
本書特色
★ 第一本針對AI及演算法時代而設計的「統計思維訓練」入門書。
★ 文科生與跨界職人皆適用,只要你會小學程度的「加減乘除」,就能運用本書的方法解決難題、創造自我價值。
作者
▋齋藤廣達
芝加哥大學商學院畢業。先後任職於波士頓顧問集團(BCG)、羅蘭貝格(Roland Berger)、花旗銀行等公司,後來以管理顧問的身分獨立創業。
齋藤曾多次參與企業併購與事業重整案,他以社長的身分在第一線指揮、重建那些營運效率不彰的企業。隨後他會在這些上市公司擔任執行董事,負責推動電商及AI導入等數位化轉型的工作。目前他主要擔任AI開發、數位行銷、行動裝置應用等顧問。
齋藤同時也是一位極受商業讀者歡迎的暢銷書作者,主要著作包括:《用數字說話》、《鍛鍊「計算力」》(PHP研究所出版),以及《創新思維革命》、《讓業績往上衝的統計式思考術》、《商務專業教科書》(日経BP社出版)等。
譯者
▋劉格安
政治大學畢業,現為專職譯者,譯作類型包含商管、醫學、旅遊、生活、歷史和小說等。
目錄
前言:
在一邊享受閱讀樂趣的同時,不知不覺就突破盲點
──什麼?原來這些東西也是統計學!
● 「世界的祕密」究竟藏在哪裡?
● 你可以從這本書中獲得什麼?
序章:
學會運用統計學的力量,解開「世界的祕密」
──理解支配我們生活的遊戲規則
● 世界是靠「骰子的點數」來決定的?
● 公司內部充斥著「更加」、「總之」等模稜兩可的指示
● 不是要學習統計學,而是要「運用統計學」
● 統計學可以做到的事:①了解數字的意義
● 統計學可以做到的事:②預測未來
● 預測未來的意義在於「防患未然」
● 統計學可以做到的事:③因應AI時代
● 莫非我們已經被AI玩弄於股掌之間?
● 還記得國中學的「一次函數」嗎?
● 關鍵是先了解這個世界的「遊戲規則」
第1章:
即使只靠「四則運算」也能懂得這麼多!
──@變換是強大的工具
1-1 如何看待那些過於龐大的數字?
● 平均的「正確使用方式」是什麼?
● 運用「@變換」將龐大的數字化為自己的事
● 如何把龐大的豐田汽車變得「平易近人」?
● 用數字看出「安倍口罩」的問題出在哪裡
1-2 把公司的相關數字套用@變換
──如何找出「好公司」?
● 看到公司營收數字就自動套用「@變換」
● 觀察零售業店面每一坪的營收是多少
● 「數大就是美」的時代結束了嗎?
1-3 把「時間」的相關數字套用@變換
──如何洞悉真正的使用成本?
● 用數字分析當紅的「共享汽車」
● 把用車成本轉換成「月」支出
● 如今已邁入「不持有」汽車的時代?
● 比用車成本更令人在意的是「車輛對環境造成的負荷」
1-4 運用@變換來做「推測」
──如何回答網路上找不到的答案?
● 如何看見那些別人「看不見的數字」?
● 「費米推定」是怎麼估算的?
1-5 小心「平均值」的陷阱
──數字會說話,但別讓它騙了你
● 「@變換」與「平均」絕非萬靈丹
● 根據平均值所做的判斷有誤差時……
1-6 認識「平均值」與「中位數」
──世界上的財富分配不均是真的嗎?
● 破解年收入的迷思
● 從「有薪假消化率」來思考
● 用中位數來取代平均值
● 你是勝利組還是失敗組?
第2章:
工作與人生是靠「機率」在決定輸贏的嗎?
──關於情境規劃與漏斗
2-1 不懂機率,就無法在競賽中取勝?
● 隨著次數增加,一切會愈來愈趨近機率
● 那次成功,是否只是「歪打正著」?
● 從機率可以導出「期望值」
● 用賭骰子來思考期望值的話……
● 如何在商場上活用期望值?
● 重點是要建立「可供討論的基礎」
2-2 學會先用「機率」描繪出情境
● 什麼是「情境規劃」?
● 相較於成功,重要的是「悲觀情境」
● 假設的也可以,先提出「機率是多少」再說
● 檢視整個計畫的「期望值」,你就會發現……
2-3 職場上好用的「555漏斗」
● 頂尖業務員都會思考銷售漏斗
● 突破業績高牆的機率是?
● 把各項數字乘以倍數的話……
● 「勤跑業務」其實才是正解?
2-4 「335」是解讀新事物的關鍵密碼
● 切入新領域時要思考「335漏斗」
● 開發新業務的最大困難點
● 陸戰受阻,還可以打空戰
第3章:
萬事萬物是「常態分布」構成的結果!
──關於解讀大局的「偏差值」
3-1 如果把「離差」數值化的話
● 同班同學的成績差距很大嗎?
● 怎麼把「離差」數值化?
● 檢視各種數據的「變異數」
● 釐清大局的好用工具──標準差
3-2 數據與組織都可用「常態分布」去解讀
● 如何尋找身高超過190公分的長人?
● 變換標準差可以讓你的目標變得更清晰
● 常態分布中的「2:6:2的法則」
● 為什麼「反對你的人」一定會出現?
● 如何應付那些極端反對者?
● 人際關係也會呈現「常態分布」嗎?
3-3 需要「偏差值」的不只是學生而已?
● 只要有人群的地方,就有偏差值
● 偏差值60,代表排名在「前16%」?
● 為什麼考試完全是「與別人的競爭」?
● 思考自己的職涯時也可以應用偏差值
● 「偏差值決定一輩子」的時代遲早會到來?
3-4 解讀生活中隨處可見的「S型曲線」
● 新商品的銷售初速度很差⋯⋯怎麼辦?
● 常態分布與S型曲線的關係
● 學習新事物的成果也會呈現「S型曲線」?
● 新冠疫情下的「S型曲線」
3-5 該如何與「網路評論文化」共處?
● 無所不在的2%負面評價
● 用「常態分布」解讀暗樁是否存在
● 你該在意評論到什麼程度?
第4章:
掌握統計學上「正確的」數據處理法!
──分辨有意義與無意義的調查
4-1 到底該聽取多少人的意見才夠?
● 「開票率1%」就能確定當選的奇妙現象
● 概略推估即可的話,「30個樣本」就OK!
● 即使在統計學上不正確,「徵詢意見」為什麼依然很重要?
4-2 從「樣本」就能推測出全體嗎?
──關於稍微有點複雜的「信賴區間」
● 5個樣本、10 個樣本可以代表「全體」嗎?
● 樣本量太少,就愈可能得出極端的結果
● 身邊有許多朋友離婚,是整個社會的縮影嗎?
● 話說回來,「離婚率」是有意義的數字嗎?
4-3 養成數據識讀的能力
● 正確率有九成的數據,為什麼是無效的呢?
● 「偽陽性」為什麼會愈來愈多?
● 從不同面向拆穿數據的謊言
第5章:
「多變量分析」是在AI時代生存的必備知識
──機會、風險與財富,皆在其中
5-1 賣場的面積愈大,營收也會愈高嗎?
──關於「迴歸分析」
● 店面的大型化真的是正解嗎?
● 先提出「預測值」,再驗證是否正確
● 用Excel 就能輕鬆搞定迴歸分析!
● 數據科學家都怎麼判斷迴歸分析?
● 找出潛藏大好機會的「離群值」
5-2 那個「相關性」真的正確嗎?
──學會運用PAC思考
● 試著將自己的主張帶入「計算式」裡
● 運用「PAC思考」突破邏輯的盲點
5-3 用「多變量分析」開啟AI時代的大門
● 葡萄酒的價格取決於「僅僅4個」要素?
● 根據多種因素進行考量就是「多變量分析」
● 你可以用「多變量分析」做什麼?
● 數據科學家的工作意外的樸實無華?
● 用AI計算「錄取婉拒率」的問題在哪裡?
終章:
本書所謂的統計式見解與思維是什麼?
──看清事實、提高勝率的行動方針
● 養成「統計式思維」習慣的重要性
● 運用「MECE分析法」解決問題
● 只要理解統計學,就能預見未來?
● 人類與世界溝通的型態已經改變
● 適應混沌新世界的完美工具,就是統計學
序/導讀
▋前言:
在一邊享受閱讀樂趣的同時,不知不覺就突破盲點
──什麼?原來這些東西也是統計學!
世界的祕密」究竟藏在哪裡?
「為什麼這個商品如此熱銷?」
「為什麼這個App這麼熱門?」
「為什麼這個YouTuber這麼受歡迎?」
……總覺得這些所謂的「成功案例」背後,似乎藏著什麼特定的法則。
如今市面上充斥著各種媒體內容,試圖解析成功案例背後的法則或主因。從累積各種經驗或思考訓練的顧問所分析的內容,到一些三教九流之輩如洗腦講座般的分享……老實說,內容良莠不齊,有些是根據真憑實據的分析而來,但單純的意見或感想也所在多有。
即使對此心知肚明,但一旦在職場上或私生活中遭遇任何不順遂,人們就會想要依賴那些媒體內容,以為這個世界上一定有什麼成功的祕訣,只要知道那個祕訣,肯定能夠把世界看得透徹,做任何事情都一定會成功。
但是實際上,這個世界並沒有那麼單純。像國中學的數學那樣「只要知道x即可知道y」的簡單法則,並不是那麼地通用。學生時期書讀得愈認真,成績就會愈好,但轉換到工作上可就沒那麼簡單了……
以前的我也是如此。回想起來,我總是不曉得怎樣做才是對的,每天都被上司提點著我的一舉一動──為了擺脫這樣的生活,同時找到成功的祕訣,必須更努力學習才行。我就是帶著這樣的想法,度過了年輕歲月。
你可以從這本書中獲得什麼?
我就是在那樣的情況下,接觸到「統計學」。原本堪稱「超級」文科人的我,下定決心前往美國的研究所深造,在那裡學習統計學,並一腳踏入顧問圈。後來我學習使用Python進行數據分析與機械學習,目前也經手許多跟數據分析或AI相關的工作。
那段期間,我一直都在接觸「統計學」。然後我發現,過去心中的疙瘩也慢慢地消失了。
當然,這種工具並沒有那麼神奇,並不是「只要學會統計學,就能知道世界上所有的祕密」,只不過,藉由學習統計學,你會發現:
● 每天的生活會看起來稍有不同。
● 對於工作上該做些什麼,可以運用數字思考得比以往更清楚。
● 可以用統計學的觀點來分析世界的動向或趨勢。
● 然後最重要的是──可以對這個充滿不確定性又不可思議的世界,再多一些些理解。
這就是統計學的魅力,也是統計學所擁有的力量。
因為想讓讀者體驗上述這些統計學的厲害之處,所以我執筆寫下本書。
過去我曾出了好幾本關於數字或統計的書,但本書的切入點則與以往不同,會著重在「對日常生活或工作有幫助」的內容上,並以謎題為主軸,讓讀者得以在享受解題樂趣的同時,也能充分理解統計學。
自從PHP研究所的吉村先生,也是我作為商業書作者出道以來的舊識,向我提及此事後,我們一同絞盡腦汁思考,什麼樣的主題可以更貼近讀者?什麼樣的謎題可以讓讀者當成自己的事情一般產生興趣?此外,我也盡量避免使用艱難的詞彙或數字,好讓同為文科出身的人,也能夠享受閱讀的樂趣。
讓讀者在回答謎題並閱讀解說的過程中,不知不覺學會「統計式見解與思維」,就是我完成此書的用意。
當你在閱讀本書時應該會發現,有很多地方讓人心想「什麼?原來這也是統計學」。沒錯,儘管統計學給人難度很高的印象,但基本上都是極其單純且眾所皆知的觀念。只要再多補充一點點知識,就能大幅加深理解的程度。
前言的部分還是就此擱筆,趕緊進入正題好了。請務必在享受樂趣的同時,嘗試接觸統計學的世界。
但願各位都能夠發現各自的「世界的祕密」,學會如何簡單又有效率地在工作上創造成果,並且在私生活中也能夠擁有充實的時光。
試閱
序章:
學會運用統計學的力量,解開「世界的祕密」
──理解支配我們生活的遊戲規則
(部分節錄)
世界是靠「骰子的點數」來決定的?
想像一下:你的眼前有一顆骰子,你骰子擲到1點的話,可以得到1萬圓,但擲到6點的話,則會反過來損失1萬圓,若擲到2至5點的話,就再擲一遍。
我認為經營事業就像這個擲骰子的遊戲一樣。
成功與失敗都有一定的機率會發生,非要到等實際執行之後才會知道結果。有時堅持下去會成功,有時堅持下去則會失敗。只是如果一再重複這個過程的話,最終將會按照機率去發展。
如果想要贏得這場遊戲,該怎麼做才好?
訓練出能夠經常擲出1點的能力嗎?那也是一個辦法。聽說賭場的荷官能夠透過訓練,慢慢學會如何擲出特定的數字。
不過還有一個方法比那簡單多了,那就是「改變遊戲規則」。
例如,把規則變成擲出數字2與3,而不是只有擲出數字1時,也能夠得到1萬圓。如此一來,贏得遊戲的機率就會一口氣提高許多。
當然,失敗的機率並不會變成零,但知道規則的話,不僅可以為失敗做準備,也可以經由「試錯」,更進一步提高機率。
經營事業也一樣,成功與失敗都是基於一定的機率來決定,結果要等到實際去做才知道,但你可以藉由各種行動來提高成功的機率。
經營事業就是一門可以像這樣用數字來掌握、用數字來計算的科學。
不,應該不只是經營事業而已,即使說世界上所有事物都是由「數字」構成的,也絕非言過其實。
能不能進入自己想要的學校或公司、能不能負責有成長空間的工作、能不能遇到理想的伴侶、能不能在偶然踏進的餐廳裡吃到合自己口味的餐點……真要說來,這些也全都是機率的世界。
不是要學習統計學,而是要「運用統計學」
以統計學為主題的書籍,大部分都著重在如何處理數據,還有為此要進行什麼樣的計算。畢竟統計學就是「處理數據的技術」,所以這也無可厚非。
其中還常出現文科人沒聽過的用語,例如變異數、標準差、信賴水準、卡方檢定、t檢定等等,許多人可能光是看到這些就頭痛了吧。
藉由使用這些專門技術,舉例來說,就有可能根據店面的營收數據,提出這樣的詳細分析:「這個數據的變異數只有這樣,標準差是○○,信賴水準是△△……」
不過,能夠進一步論及「那該如何運用那個數字比較好」的書籍,絕對不多。
反觀本書所設定的目標,則是「有用的」統計學知識。
書中盡量避免採用複雜的數字或算式,而是專注於「用統計學的思維來想,會是這樣,所以可以如何派上用場」。
在基本知識方面,只要懂得四則運算,亦即「加、減、乘、除」就夠了。
統計學可以做到的事:(1)了解數字的意義
那麼,閱讀本書究竟可以做到哪些事呢?
首先,第一件事就是「能夠了解數字的意義」並融會貫通。
2020年席捲全球的新型冠狀病毒肺炎,是否讓更多人了解到數字的意義了呢?
每天持續公布的確診人數、不斷攀升的統計圖表、疫苗接種率的變化……看到那些資料,即使知道「喔,昨天的確診人數是○○人啊」,也不曉得那究竟代表著什麼意思。
與此同時,(據稱)使用各種數據的可疑資訊甚囂塵上。「打疫苗會讓身體產生磁力……」、「吃○○的話就不會感染新冠肺炎……」等奇談妙論也漫天飛舞。
究竟該相信什麼才好?未來又會如何發展?恐怕有許多人都為此感到焦慮。
若能具備統計學的基本知識,就能夠理解那些「數字的意義」並融會貫通。如此一來,至少能夠緩和焦慮,而且在碰到明顯可疑的數字時,也能夠意識到「不太對勁」。
所謂「數字能力強的人」都有一個特徵,就是「擅長將數字融會貫通」。每當碰到不理解的數字,習慣自動自發地去思考,如何將那轉換成可以具體想像的數字。
例如在看到「確診人數突破100 萬人」的數字時,能夠舉一反三地聯想到:「確診人數超過100 萬人的話,大約是日本人口的1/100。我們公司的員工是500人,目前為止確診者只有1人,所以我們的對策應該是相對較成功的。」
如果你在人資部或總務部任職的話,應該一方面會對那個數字感到安心,一方面也會思考「萬一疫情擴散的速度變快的話,必須強化我們的對策才行」等等。
沒錯,正因為了解數字的意義,才能夠採取「下一步行動」。
統計學可以做到的事:(2)預測未來
正如文章一開始提及的,經營事業就像擲骰子的遊戲一樣。
如果是擲出1點能得到1萬圓、擲出6點會損失1萬圓的遊戲,贏的機率約為17%,輸的機率也約為17%。
像這樣解讀遊戲規則並預測未來,也是統計學的強項。
例如使用統計分析來預測便當的銷售量。根據過去的資料來預測可以賣多少便當,像是一月的星期六、陰天的日子、最高氣溫10度時……類似這樣的計算,只要資料收集得夠齊全,應該能夠導出準確度相當高的數字。
而目前統計分析走在最尖端的,就是EC(電子商務)的世界。不只是哪個商品在什麼時候賣出多少量而已,就連哪種屬性的人看了哪裡的網站點進來、瀏覽哪個頁面多長的時間才下單購買,這些行動紀錄全部都會留下痕跡,這就是EC的特徵。正因如此,才能夠預測「哪個部分如何改變會得到什麼結果」。
近來大受討論的流行語,就是「SDGs」(永續發展目標)。所有領域都開始講求對環境的考量,那些大量出貨、大量廢棄的商業模式已不再見容於這個社會。正因如此,也才形成了對於需求預測講求高準確度的背景。
統計學可以做到的事:(3)因應AI時代
我自己的感覺是,日本人至今對數字的敏感度依然很低。
但即使是這樣的日本社會,似乎也在一點一滴地改變當中。而在所有的理由當中,最大的莫過於IT與AI的發展。
拜現今便利的網路環境之賜,人們可以獲取龐大的數據。數據愈多,數字愈能發揮力量。
近年來,各大統計學會的發展方興未艾,想必與更多唾手可得的數據不無關連。隨著數據愈來愈多,社會將愈接近統計學的結果。
各位知道中國有一種名為「芝麻信用」的信用評分機制嗎?
AI會分析每個人在營運該系統的阿里巴巴集團網站上的消費紀錄,或使用「支付寶」這種電子支付服務的數據,並將每個人的信用度化為分數。而且不僅是支付紀錄而已,連那個人的社會地位、購物傾向、交友關係等都會經過數據分析,再給每一個人打分數。評分高代表信用度高,因此會被判斷為可以高額借貸的對象;反之,若評分低的話,就比較難借到錢。此外,評分高還有其他好處,像是可以獲得各式各樣的優惠等等。
不過,如今這個數值也開始被使用在信用以外的世界。舉例而言,評分低的話,對於求職會造成阻礙,尋找結婚對象也會比較辛苦⋯⋯因此,中國人為了提高這個分數,紛紛卯足全力。哎呀,這還真是個前所未有的時代。
如今這種信用評分也登陸日本了,但似乎尚未普及開來。不過就像電子支付在中國遍地開花,如今在日本也變得很普遍一樣,或許日本總有一天也會邁入被這套信用評分機制所掌控的時代。
莫非我們已經被AI玩弄於股掌之間?
即使不是這樣,我們也已經被AI玩弄於股掌之間。例如在亞馬遜上購物時會出現的「推薦商品」,應該有很多人曾經一不小心就買下原本沒打算買的東西吧?這就是AI分析了你的購物紀錄,再顯示出擁有相同嗜好者經常購買的商品給你看。
或者像是YouTube影片,看完一個影片後,再繼續觀看下一個推薦的影片,然後不知不覺幾個小時就過去了……相信也有很多這樣的人。這也是因為AI分析了你的嗜好,並且陸續推薦你所偏好的影片的緣故。
更厲害的是TikTok。雖說推薦的機制基本上大同小異,但TikTok的AI會不時地放入與使用者的嗜好完全無關的推薦項目。比方說,當你在看跳舞的影片時,突然出現呼嚕嚕吃拉麵的影片。
持續觀看同樣的東西總是會膩,但像這樣隨機被推薦毫無關聯的影片,使用者就會愈來愈沉迷其中。
關於推薦引擎常見的批評之一,就是「如果總是觀看相同類型的東西, 無法擴展一個人的視野」。對此,TikTok採用這樣的機制,來創造「不期而遇」的意外驚喜,老早就推翻了這樣的批評。
還記得國中學的「一次函數」嗎?
「這樣的AI想必會進行十分複雜的計算吧」,或許是許多人共同的心聲。
確實,計算很複雜沒錯,不過背後的原理絕不複雜。
在AI的世界裡,使用的是「多變量分析」(請見本書第5章)。而其基礎則是各位在國中就學過的「一次函數」。
各位可否還記得呢?舉例來說,就是:
y=5x
或是:
y=2x+5
……等等。
換句話說,就是「若給定一個變數的話,就會恰好對應到另一個變數」。所謂的「y=5x」,即「當x等於1時,y等於5」的意思。
舉例而言,假如有個法則是「氣溫每上升1度,自動販賣機的飲料就會多賣出5罐」的話,這就可以用「y=5x」的一次函數來表示。
話雖如此,這個世界並沒有這麼單純。星期、時間或廣告的曝光量等等,種種因素都會影響到營收。
因此這個變數會一直增加。如此一來,由人工來計算會變成一個大工程,因此才要交由AI來替我們計算。
AI在做的就是這些事情。
怎麼樣?這樣一想的話,是不是就感覺親切許多了呢?
關鍵是先了解這個世界的「遊戲規則」
IT、大數據、信用評分、AI、元宇宙……
當今的世界日新月異,新事物如雨後春筍般湧現。面對這一切,「因為我都不了解,所以就算了吧」,雙手一攤放棄理解是個人自由,但除非你是躲在深山裡過著隱居生活,否則我們每個人都一定會受到影響。
既然如此,至少先了解一下支配我們的「遊戲規則」,不是比較好嗎?
而其中的關鍵,就是統計學。
沒錯,換句話說,統計學就是解開「世界祕密」的關鍵。