Cover image for S2#04: Data Archaeology

數據考古學:用Python重建工業革命的經濟足跡

系列:工業革命與數據革命 #04/05 | 閱讀時間:40分鐘 | Python (NumPy, Pandas, Matplotlib, NetworkX)

作者:Wina @ Code & Cogito


當數字開始說話

1851年5月1日,倫敦海德公園。

世界第一座大型玻璃建築——水晶宮(Crystal Palace)——在陽光下閃耀。

這是萬國工業博覽會(Great Exhibition)的會場。展出來自世界各地的13,000件展品:蒸汽機、鐵路機車、紡織機、印刷機、望遠鏡、顯微鏡。

維多利亞女王(Queen Victoria)站在展廳中央,驚嘆不已:

「這是世界歷史上最偉大的一天!我們真的改變了世界!」

但是,「工業革命」真的是「革命」嗎?

還是更像「演化」?


2024年,我們的電腦前。

我們打開歷史數據庫:
– Maddison Project(全球GDP數據,1-2018年)
– British Historical Statistics(英國經濟統計,1700-2000年)
– UK Patent Database(專利資料庫,1617-2000年)

當我們把這些數字畫成圖表時,驚人的事實出現了:

工業革命不是突然爆發,而是緩慢累積。

GDP增長率不是從1%跳到10%,而是從1%爬到2%,花了50年。

城市化不是一夜之間,而是一點一點,90年才讓一半人口進城。

專利申請不是突然暴增,而是指數增長,跨越了整整一個世紀。

這改變了我們對「革命」的理解。

如果工業革命花了80-100年才「革命」,那「數位革命」呢?

互聯網1990年代普及,現在2024年,才34年。

我們可能還在「數位革命」的早期階段。

在這篇文章裡,我會用Python分析1760-1850年的經濟數據,重建工業革命的真實軌跡,識別關鍵轉折點,並探討一個根本問題:當我們身處變革之中,如何知道自己在歷史的哪個位置?

準備好用數據穿越時空了嗎?


第一個問題:工業革命何時開始?

歷史學家爭論了200年。

傳統說法:
– 1760年:喬治三世登基,瓦特開始研究蒸汽機
– 1769年:瓦特獲得蒸汽機專利
– 1776年:第一台瓦特蒸汽機商業應用

但經濟數據說:沒有明確的「起點」。

讓我們用Python分析英國GDP數據,尋找「結構性轉折」。

# 英國歷史GDP數據(Maddison Project + 英國國家統計局)
# GDP per capita (1990 International Dollars)
uk_gdp_data = {
    'year': list(range(1700, 1861, 10)),
    'gdp_per_capita': [
        1250, 1280, 1330, 1405, 1490,  # 1700-1740
        1550, 1630, 1750, 1880, 2010,  # 1750-1790
        2130, 2330, 2620, 3000, 3450,  # 1800-1840
        3900, 4350                      # 1850-1860
    ]
}

df = pd.DataFrame(uk_gdp_data)
df['gdp_growth_rate'] = df['gdp_per_capita'].pct_change() * 100

# 經濟增長分期
pre_industrial   = df[(df['year'] >= 1700) & (df['year'] < 1760)]
early_industrial = df[(df['year'] >= 1760) & (df['year'] < 1800)]
peak_industrial  = df[(df['year'] >= 1800) & (df['year'] < 1840)]
mature_industrial = df[(df['year'] >= 1840) & (df['year'] <= 1860)]

# 各時期平均增長率
# → 前工業 2.3%/decade → 早期工業 5.2% → 高峰 10.8% → 成熟 11.5%
# → 早期工業 vs 前工業:2.3 倍加速
# → 高峰期 vs 早期工業:2.1 倍加速

完整程式碼已上傳 GitHub(含免費版基礎分析):查看完整程式碼 →

將數據繪製成時間序列,GDP長期趨勢、增長率波動、人口變化、經濟體規模一覽無遺:

驚人的發現:

時期 平均GDP增長率 特徵
1700-1760 2.3%/decade 緩慢增長
1760-1800 5.2%/decade 2.3倍加速
1800-1840 10.8%/decade 2.1倍加速
1840-1860 11.5%/decade 接近飽和

工業革命不是「爆炸」,是「加速」。

從2.3%爬到10.8%,花了100年。


第二個問題:城市化何時爆發?

「工業革命=城市化」是常識。

但數字告訴我們:城市化也是漸進的。

我們將英國六大工業城市(London、Manchester、Birmingham、Liverpool、Leeds、Sheffield)在1750、1801、1851年的人口數據進行對比分析,同時追蹤城市化率(城市人口/總人口)的長期演變。

城市化的真相:

不是突然的,是漸進的。

1700年,15%人口住在城市。
1850年,35%人口住在城市。
1900年,63%人口住在城市。

花了200年。

Manchester的故事最戲劇化:
– 1750年:1.8萬人(小村莊)
– 1801年:8.9萬人(5倍增長)
– 1851年:31.6萬人(又3.5倍增長)

總共17.6倍,但用了100年。


第三個問題:創新何時爆發?

用專利數據追蹤創新。

我們收集了1700-1859年間英國的專利申請數據,從92件(1700-1749)到6,909件(1850-1859),並用指數擬合追蹤增長趨勢。同時繪製關鍵發明的時間軸,標記每一項改變世界的技術突破。

# 英國專利申請數據(每十年)
uk_patents = {
    'period': ['1700-1749', '1750-1759', '1760-1769', '1770-1779',
               '1780-1789', '1790-1799', '1800-1809', '1810-1819',
               '1820-1829', '1830-1839', '1840-1849', '1850-1859'],
    'patents': [92, 92, 205, 294, 477, 647, 924, 1323,
                1453, 2453, 4581, 6909]
}

df_patents = pd.DataFrame(uk_patents)
periods_numeric = np.arange(len(df_patents))
log_patents = np.log(df_patents['patents'])

# 線性擬合對數值 → 指數增長參數
slope, intercept = np.polyfit(periods_numeric, log_patents, 1)
# → 指數增長率: ~25% 每 decade
# → 倍增期: ~30 年(每30年專利數量翻倍)
# → 從 92 件到 6909 件 = 75 倍,跨越 160 年

圖:Economic Structure Shift
圖:Economic Structure Shift
圖:Uk Gdp Growth
圖:Uk Gdp Growth
圖:Urbanization Explosion
圖:Urbanization Explosion

擬合結果顯示近乎完美的指數增長曲線:

創新的模式:

專利申請呈現完美的指數增長

每decade增長率約25%,倍增期30年。

但關鍵發明不是均勻分布的:
1760-1770年代:紡織機械革命(珍妮紡紗機、瓦特蒸汽機)
1780-1790年代:動力應用(動力織布機、軋棉機)
1800-1820年代:運輸革命(蒸汽船、鐵路)
1830-1850年代:通訊與材料(電報、貝塞麥煉鋼)

創新是累積的,不是孤立的。

瓦特的蒸汽機建立在紐科門的基礎上。
鐵路建立在蒸汽機的基礎上。
電報建立在電學研究的基礎上。

每個發明都站在前人的肩膀上。


第四個問題:產業結構何時轉變?

工業革命=農業到工業的轉變。

但何時完成?

我們用英國勞動力產業分布數據(1700-1880年)建構堆疊面積圖,追蹤農業、工業、服務業三大產業的此消彼長,並計算各時期的轉型速度。

產業轉型的真相:

不是一夜之間,是180年的漸進過程。

關鍵轉折點:
1760年:農業首次降到50%以下
1800年:工業首次超越農業
1840年:農業降到25%以下

但直到1880年,仍有12%人口從事農業。


第五個問題:貿易何時全球化?

工業革命推動了全球貿易。

但規模如何?

我們收集了1700-1850年英國對外貿易數據——出口額、進口額、貿易總額、貿易佔GDP比重——並追蹤出口商品結構(紡織品從10%升至60%)和進口商品結構(原棉從5%升至35%)的演變。

貿易的故事:

工業革命推動了「第一次全球化」。

英國的角色:
出口:工業製品(紡織品、金屬製品、機械)
進口:原料(棉花、羊毛、木材)+ 糧食

這是殖民主義的經濟基礎:
– 殖民地提供原料
– 英國加工成產品
– 再賣回殖民地


綜合結論:工業革命是「革命」還是「演化」?

我們分析了5個維度的數據:

指標 開始年份 完成年份 花費時間
GDP倍增 1760 1850 90年
城市化50% 1700 1870 170年
工業超越農業 1760 1800 40年
專利倍增 每30年
貿易額倍增 每40年

答案:既是革命,也是演化。

從個人視角看:是革命
– 一個1780年出生的人,活到1860年(80歲)
– 他見證了:手工作坊到工廠、馬車到鐵路、油燈到煤氣燈
– 這是翻天覆地的變化

從數據視角看:是演化
– GDP不是從1%跳到10%,而是漸進加速
– 城市化不是一夜之間,而是200年過程
– 創新不是突然爆發,而是指數累積

最關鍵的洞察:

重大變革在發生時,感覺緩慢;回頭看,才驚覺劇烈。


現代啟示:我們處在「數位革命」的哪個階段?

如果工業革命花了80-100年才「革命」,那數位革命呢?

讓我們對比:

階段 工業革命 數位革命 關鍵事件(工業) 關鍵事件(數位)
發明期 1712-1760 (48年) 1940-1980 (40年) 紐科門蒸汽機(1712) ENIAC(1945)
商業化 1760-1780 (20年) 1980-2000 (20年) 瓦特改良(1769) PC革命(1980s)
早期擴散 1780-1800 (20年) 2000-2010 (10年) 工廠制度化 網路普及
快速增長 1800-1840 (40年) 2010-2024 (14年) 鐵路網絡 雲端/行動
成熟期 1840-1880 (40年) 2024-? (?年) 電報/電話 AI爆發?
飽和期 1880+ (持續) ? 電力普及 ?

幾個值得深思的問題:

數位革命從何時算起?如果從1980年(PC普及)算起,到2024年已經44年——對應工業革命的1804年,正值快速增長期。如果從1990年(網際網路商業化)算起,才34年——對應1794年,仍在早期擴散期。

AI是「數位革命2.0」還是「第四次工業革命」?蒸汽機到電力用了111年(1769到1880),網路到AI只用了33年(1990到2023),速度加快了3.4倍。

數位革命何時「完成」?工業革命花了120年(1760-1880)才基本完成。如果數位革命遵循類似軌跡,從1990年算起可能要到2040-2050年。但數位革命的速度在加快——摩爾定律意味著我們可能用50-60年完成工業革命100年的變化。

我們用 Bass 模型和歷史類比建構了兩次革命的完成度估算:

驚人的結論:

如果數位革命遵循工業革命的模式,我們現在(2024)大約處在:

60-65%完成度

類比1840年代的工業革命:
– 核心技術已成熟(網路、手機、雲端)
– 正在全面普及
– 但還沒達到「飽和」
– 仍有重大創新空間(AI、量子運算)

但有一個關鍵差異:

數位革命的速度比工業革命快3-5倍

工業革命用120年完成的事,數位革命可能只需40-50年。

所以:
– 工業革命:1760-1880(120年)
– 數位革命:1980-2030?(50年)

這意味著,未來5-10年可能是最劇烈的變革期。


最後的問題:歷史能預測未來嗎?

歷史不會重複,但會押韻。

從工業革命我們學到什麼?

  1. 重大變革需要時間
  2. 不是5年、10年,而是50年、100年
  3. 我們高估短期影響,低估長期影響

  4. 變革不是線性的

  5. 有加速期、平緩期、飽和期
  6. 早期增長慢,後期爆發快

  7. 基礎設施決定速度

  8. 運河到鐵路:工業革命加速
  9. 光纖到5G:數位革命加速

  10. 社會適應比技術慢

  11. 技術10年普及,法律50年跟上
  12. 工廠安全法:1833年才通過(工業革命開始73年後)
  13. 數據隱私法:GDPR 2018年(網路普及28年後)

  14. 每次革命都創造贏家和輸家

  15. 工業革命:手工藝人到工廠工人
  16. 數位革命:實體店到電商

最關鍵的洞察:

我們永遠不知道自己身處歷史的哪個位置。
只有回頭看,才知道那是起點還是終點。

1851年,維多利亞女王站在水晶宮,以為「工業革命完成了」。

其實,後面還有60年的變革(電力、汽車、飛機)。

2024年,我們站在AI爆發的起點,以為「數位革命完成了」。

其實,可能後面還有20-30年的變革。


結論:數據不會說謊,但會被誤讀

我們用Python分析了1700-1860年的經濟數據。

數據告訴我們:

  1. 工業革命不是突然的,是漸進的
  2. GDP、人口、專利都呈指數增長
  3. 但每個指標的時間軸不同
  4. 從「開始」到「完成」,花了120年

數據也警告我們:

身處變革之中,我們看不清全貌。

1800年的人以為工業革命剛開始(其實已經40年)。
1850年的人以為工業革命結束了(其實還要60年)。

2024年的我們,也一樣。

我們不知道:
– 數位革命何時開始?(1945?1980?1990?)
– 我們處在哪個階段?(60%?80%?)
– 何時會「完成」?(2030?2050?)

但我們知道一件事:

歷史的規律:重大變革比我們想像的慢,但最終比我們想像的徹底。

工業革命花了100年,但最終改變了一切。

數位革命可能只需50年,但也會改變一切。

問題是:我們準備好了嗎?


後記:站在水晶宮的倒影裡

寫完這篇文章,我一直想著維多利亞女王在水晶宮裡的那句驚嘆。

那是1851年,工業革命已經走了將近一個世紀。蒸汽機從笨重的礦山幫浦變成了驅動整個帝國的心臟;曼徹斯特從一個一萬八千人的小村莊膨脹成三十萬人的工業巨獸;專利申請量每三十年翻一倍,知識的複利正在改寫文明的方程式。女王站在那座玻璃與鋼鐵的殿堂裡,環顧一萬三千件展品,覺得世界已經被徹底改變了。

她錯了——不是因為判斷不準確,而是因為身處變革之中的人,永遠無法看清自己在歷史曲線上的位置。1851年之後,電力、汽車、飛機、電話還要陸續登場,每一項都會讓水晶宮裡的展品顯得像是史前遺物。

這大概是數據考古學最迷人也最令人不安的發現。我們分析了五個維度的經濟數據——GDP、城市化、專利、產業結構、貿易——每一組數字都指向同一個結論:所謂的「革命」其實是一場漫長的演化,而身處其中的人從來不知道自己正在被歷史改寫。

如果你是企業領導,這意味著不要期待「突然的革命」,而要為「持續的演化」做好準備。歷史顯示轉型需要20-30年,不是2-3年。投資未來技術很重要,但忽視現有業務可能讓你等不到未來到來的那一天。

如果你制定政策,煤炭時代的教訓再清楚不過:基礎設施需要提前20年規劃,社會安全網需要提早建立。1833年的工廠法來得太晚,無數童工已經在紡織機旁度過了他們短暫的一生。數位時代的監管不能重蹈覆轍。

如果你是年輕人,你大概會見證數位革命的「完成」——如果我們的類比正確,那大約是2040到2050年。這意味著你的職業生涯將橫跨這場變革最劇烈的階段。準備好終身學習是老生常談但無法迴避的現實;更重要的或許是,在技術飛速變化的年代裡,關注那些不變的東西——人性的基本需求、社會的深層結構、歷史反覆出現的模式。

工業革命告訴我們,變革是馬拉松,不是短跑。我們現在大概跑到了第三十五公里——離終點還有一段路,但最艱難的爬坡可能已經過去。也可能沒有。

這就是歷史最誠實的回答:我不知道。但我可以告訴你之前發生了什麼。


深度探索:完整分析包

這篇文章分享了五個維度的數據考古——GDP時間序列、城市化爆炸、專利指數增長、產業結構轉型、貿易全球化——用以重建工業革命的真實軌跡。完整分析包更進一步:

  • GDP結構性斷點檢測:用統計方法自動識別經濟增長的轉折年份,結果顯示1790年代和1820年代各有一個顯著斷點——與傳統敘事的「1760年起點」不同
  • 六大工業城市150年人口軌跡:逐年插值的城市增長動畫,揭示Manchester和Liverpool的增長節奏差異比數據表格呈現的更為複雜
  • 專利創新網絡分析:用NetworkX建構跨產業創新連結圖,蒸汽機和能源相關專利構成整個網絡的中心節點,量化「站在前人肩膀上」的程度
  • 殖民地貿易疊加分析:原棉進口80倍暴增的背後,是一整套殖民經濟結構的數據足跡
  • 約 400 行教學等級完整程式碼,11 張進階圖表(PNG 300dpi)

取得 Article 04 深度分析包 →


Similar Posts

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *