任何一個上過中學的人都知道熱力學第二定律,正因為這條定律,第二類永動機才永遠無法實現。
雖然我們現在普遍認為熱力學第二定律是這個宇宙裡最堅實的規律之一,但是它從很早之前就存在一個隱患,這個隱患持續了 100 多年,直到 1982 年才被一位在 IBM 工作的物理學家本奈特從理論上解決掉,而最終的實驗驗證還要等到 2012 年才由歐洲科學家做出來。
這個隱患就是被人戲稱為物理學 4 大神獸之一的“麥克斯韋妖”,是麥克斯韋在 1871 年提出的一個可能違反熱力學第二定律的思想實驗。
在克勞修斯之前,人們已經隱隱約約發現熱機的效率無法無限提高,但是如何用數學描述這個問題還不清楚。
克勞修斯之前的科學家就注意到了這樣一種情況,假如一個物理系統的變化是一個可逆過程,比如理想彈簧的壓縮和伸展,相變過程,熱平衡狀態下 0 攝氏度的水變冰冰變水,能量不應該有變化。
但是絕大多數的非理想情況都不是這樣的,比如現實中的彈簧,不論是從伸展到壓縮,還是從壓縮到伸展都是會有能量損耗。而且,在這個過程中,能量以熱量的形式被消耗,因此也稱為熱損耗。
在物理課本往往都是用一個卡諾機的狀態變化圖來展示一個類似過程,其中 p 代表氣體的壓強,V 代表氣體體積。

● 過程 A 到 B,是一個等溫膨脹過程,溫度維持 T1 不變,體積增加,壓強減少。這個過程需要吸收熱量,吸收的熱量為 ,大於0。
● 過程 B 到 C,代表著絕熱條件下膨脹,對外界做功,溫度下降到 T2 。這個過程雖然溫度改變了,也對外做功了,但是因為絕熱,所以熱量的改變 。
● 過程 C 到 D,是一個等溫壓縮的過程,溫度維持 T2不變,體積減少,壓強增大。這個過程需要釋放熱量 Q2,釋放的熱量為 ,小於0。
雖然卡諾機一般都是在理想狀態下考慮到一個可逆過程,但是對於任何一個狀態的迴圈改變都有下面的關係。
可逆過程:
不可逆過程:
對於不可逆過程,熱損耗很容易被注意到,所以上面這樣的規律不能說沒用,但是會顯得比較平庸。而克勞修斯的獨創性在於,他發現了系統狀態改變時,熱量的改變還和溫度有關。他發現,在這個過程中的熱量變化程度是會和溫度成正比的,溫度越高需要的熱量變化幅度就越大,相反溫度越低需要的熱量變化幅度就越小。
於是克勞修斯就開創性的把上面的公式給增加上了溫度:
可逆過程:
不可逆過程:
如果狀態的改變是連續的,那麼這個從一個起點轉一圈再回到起點的連續加法,就可以用一個封閉曲線積分表示(也就是沿著圖上 ABCDA 一圈連續計算),那麼上面還可以統一寫成:
這也就是大名鼎鼎的克勞修斯定理了。值得注意的是,在這個定理中出現了一個全新的物理關係 ,克勞修斯也注意到了這一點,於是就把這樣的一個比值定義為了一個全新的物理量——熵(用 S 表示)。也就是: ,其中 L 表示任意兩個狀態之間的路徑。
於是前圖中的迴圈過程就可以寫作:
從 A 轉一圈回到 A,起點和終點的狀態相同,系統的熵必然一樣的。對於不可逆的過程,根據克勞修斯定理 計算出來是一個負熵。這個負熵就代表著沿著 ABCDA 的路徑變化,如果還想讓系統恢復到原先的狀態、原先的熵,那麼需要對這個系統額外提供 這麼多的負熵才行。這個數值越大,代表著 ABCDA 這個路徑的熱效率越低,會損耗更多能量,也可以說會給環境中帶來更多的熵增。
為了把熵這個概念表示的更清楚一些,其實還可以在這個基礎上把克勞修斯定理的公式擴充套件一下,把積分表示換成微分表示,也就是:
或
從這裡就可以更直觀地看到這樣一個簡單的關係,熵 (S)的改變乘以溫度 (T)等於所需要的能量 (Q)。
克拉修斯提出熵這個概念後自己也沒有意識到這件事的價值,因為在當時的人看來,熵這個概念只是一個幫助理解熱力學第二定律的輔助概念而已。
雖然克勞修斯對熱力學第二定律的表述是,"熱量不可能自發地從低溫物體傳向高溫物體",但是完全可以等價地換成,熵只可能自發地增加,不可能自發地減少。
熵的作用幾乎就是一個輔助作用,它甚至都不能被直接測量到,就像是做幾何題時畫的輔助線一樣,有可以更方便,沒有也不是不行。
如果一直是這樣的話,熵這個概念只會是隱藏在物理學非常角落裡的生僻概念。(比如焓就是一個和熵類似性質的熱力學概念,但現在絕大多數就都沒有聽過)
改變這一切的是玻爾茲曼,如果不是他非常天才般地把一個系統的微觀狀態和熵聯絡到了一起,讓熵成為了一個關聯宏觀和微觀狀態的一個橋樑,現在熵也不會成為物理學裡最出圈的概念之一。

玻爾茲曼算是克勞修斯的下一代物理學家,克勞修斯 1855 年提出熵的時候,玻爾茲曼只有 11 歲。
在那個年代別說將宏觀和微觀聯絡起來了,在當時連物質是不是由分子構成的還被廣泛的爭論。就比如說當時的著名科學家恩斯特·馬赫,他就明確反對分子論。還有,物理化學學科的奠基人,1909 年諾貝爾化學獎獲得者奧斯特瓦爾德,也反對分子論。
玻爾茲曼在當時就開創性地思考這樣一個問題,如果氣體裡面全都是一個一個粒子的話,那麼當氣體的壓強、溫度、體積等引數處於一個確定狀態的時候,其中的粒子都會是如何的?
知道每個粒子的具體狀態肯定是不現實的,不過當氣體處於平衡狀態的時候,還是可以推斷出一個粒子在各種不同狀態時可能的機率是多少,這個機率值遵循的就是玻爾茲曼分佈:
其中:
● 是粒子處於能量狀態 的機率
● Z是配分函式,是所有可能狀態的 之和。即, ,M 是所有可能的狀態總數。有了配分函式才可以讓最後的機率值歸一。
● 是粒子在狀態 i 時的能量。
● 是玻爾茲曼常數,後面也會直接用k表示。
● T 是絕對溫度
具體分佈圖如下:

需要注意的是,關於氣體粒子的分佈圖經常見到的還有下面這種。這個其實是麥克斯韋-玻爾茲曼分佈的。玻爾茲曼分佈和麥克斯韋-玻爾茲曼分佈並不一樣,玻爾茲曼分佈考慮的是粒子的能量狀態,麥克斯韋-玻爾茲曼分佈考慮的是速度狀態。速度和能量之間還相差了粒子的質量,知道粒子質量之後,才可以透過玻爾茲曼分佈推匯出麥克斯韋-玻爾茲曼分佈。這也是為什麼下面這個分佈圖要把氣體分子的元素型別標出來,因為元素型別知道了粒子質量也就知道了。

玻爾茲曼推匯出分佈圖之後就發現,一個系統從一種分佈曲線切換到另一種分佈曲線,一定對應著克勞修斯熵的改變,而分佈曲線上每一種可能性的機率值有都和一個粒子的在微觀狀態上的可能性數量有關。
於是玻爾茲曼就更進一步,用自己紮實的機率論的基礎從數學上推匯出了克勞修斯熵的微觀定義,也就是我們之前介紹過的玻爾茲曼熵:
至此熵就成為了一個可以關聯微觀和宏觀狀態的關鍵概念。
現在有了兩個公式:
和
透過這兩個公式,很容易就可以得到微觀狀態和能量之間的關係。一個系統從 A 狀態變到了 B 狀態,其中熵的變化 是:
這個過程中系統的熱量變化則是如下:(其中正數代表著向環境中吸收能量,負數代表向環境中釋放能量)
我們最開始考慮的問題其實就是一個系統如果用來記錄資訊,是不是可以不需要能量也能做到。一個系統想要記錄一個資訊,其實就代表著這個系統的熵一定發生了改變,也就是上面的 不為0。所以現在我們可以確定了,即便是一個單純的資訊系統也無法完全脫離能量。
接下來,就可以更進一步考慮這樣一個問題了,如果一個系統想要擦除 1 bit 的資訊,最少需要消耗多少能量,也就是需要向環境至少釋放多少熱量。
這個問題可並不簡單,不是簡單的讓 就行了,這裡有兩個原因。
第一,資訊量定義裡進行 log 運算用到的底是2,而玻爾茲曼熵用到的底是自然常數 e ,這個需要轉換。
第二,上一集介紹過資訊熵計算的是系統中資訊量的平均值,玻爾茲曼熵計算的是一個總值。這其實也很好理解,比如用一份水的溫度來表示資訊,溫暖是 10 攝氏度的時候代表 0,溫度是 20 攝氏度的時候代表 1,不論這份水是 1 毫升還是 1 升,溫度狀態的改變就是 1 bit 的資訊改變。但是如果考慮的是玻爾茲曼熵,10 攝氏度的溫度變化,1 毫升還是 1 升所要用到的熱量可就差別大了。1 毫升只需要很少的熱量,1 升卻需要很多。所以 1 毫升情況下的玻爾茲曼熵改變的也就更少,畢竟 1 升的粒子數量比 1 毫升多多了,公式裡的 W 也要大得多。
所以對於 1bit 資訊熵的改變到底需要多少能量,我們只能考慮一個最小值。什麼情況下能量最小,當然是系統裡面只有 1 個粒子的時候。這樣 1bit 資訊就代表著,原來粒子可以有 2 種狀態,最後變成了只有 1 種狀態的情況。也就是:
所以有:
這裡的負號代表著是系統需要向外釋放能量,所以擦除 1bit 最少需要的能量也就是 ,在 20 攝氏度下這個數值大概是 0.0175 eV。
這個最小值現在被稱作蘭道爾界限,是蘭道爾在 1960 年前後提出的。蘭道爾在當時不只是提出了這個界限的具體數字,他還在研究中強調了並不是所有的資訊處理過程都會有能量消耗,比如“讀”、“寫”和“複製”資料,它們本質上只是把一種確定的狀態變成了另一種確定的狀態,系統的可能性本身並沒有改變,所以原則上這些操作可以不消耗任何能量。
只有像是資訊擦除過程,才有一個能量耗散的下限。這是因為,資訊擦除可以認為是這樣一個過程:不論之前的狀態是 0 還是 1,都統一變成了 0。這就不是將一種確定狀態傳遞變成另一種確定狀態了。
所以只有這種情況,也就是隻有擦除資訊才會消耗能量,而且消耗的能量還有一個下限。現在這個理論也被稱為蘭道爾原理。
其實在更早的 1951 年,著名物理學布里淵還聲稱,他發現了一個重要的物理定律:每次測量過程都伴隨著一個熵增,而且存在一個熵增下限,如果低於這個下限,測量無法完成。因為布里淵的這個說法當時很多科學家都認為麥克斯韋妖的問題已經解決了。
現在我們知道了,當時布里淵的說法是錯的,測量本身並不會改變物體的熵,只有當資訊被擦除的時候才會涉及到熵的改變。
在 2011 年,還有科學家進一步研究,他們提出蘭道爾認為的擦除資訊會導致熵增這一點本身並沒有問題,但是熵增並不一定必須體現在能量上。導致熵增的代價可以是別的守恆量,比如角動量的損耗。
關於蘭道爾原理,最關鍵的實驗是 2012 年,由美國馬里蘭大學雅津斯基教授等科學家做出的。他們創造出另一種非常獨特的裝置,這個裝置可以自發地吸收熱漲落,把熱能轉化成機械能。如果只是考慮熱力學熵的話,這個裝置是違反了熱力學第二定律的。因為這個裝置不需要額外做功,就可以讓熱量變成機械能。
不過,這個裝置雖然不需要額外做功,但是它卻需要持續地消耗空白的儲存單元,如果把這部分儲存單元所消耗的資訊熵也考慮進去,那麼這個系統仍然是符合熱力學第二定律的。
透過前面介紹可以知道,能將能量和資訊聯絡起來的關鍵,就是玻爾茲曼對熵給出的微觀定義,至此宏觀的狀態和微觀的狀態被關聯了起來。
這樣的關聯,雖然可以為我們認識各種物理規律開闢了新的角度(比如蘭道爾原理),但同時也為我們理解熱二定律帶來了新的困難。
比如,就有這樣一個讓人困擾的問題,從宏觀視角下(也就是克勞修斯定理的角度),可以知道一個物理系統是沒有辦法自發熵減的,要麼維持不變要麼自發增加。這也是為什麼很多人把熱力學第二定律稱為熵增定律的原因。
但是如果從微觀的角度去看,熵增就不一定是必然的了。比如,有兩份溫度不同的氣體放在一起充分混合,這是一個從低熵到高熵到熵增過程,但即便是充分混合後的氣體分子,仍然存在著一種可能,在分子隨機運動的過程中,恰好高速率的分子全部跑到右邊,低速率分子全跑到左邊,變成右邊的溫度高,左邊的溫度低。也就是說,熵會自發減少的可能性不能絕對排除掉。
這樣的話,是不是就否掉了熱力學第二定律了呢?還真不是這樣。很多人認為的熱力學第二定律就是指一個物理系統沒有辦法自發的熵減,只能不變或熵增,這樣理解雖然簡單,但是並不嚴謹。
熱力學第二定律嚴謹的表述有很多,其中比較有名的有三個,分別是克勞修斯、開爾文和康斯坦丁·卡拉泰奧多里,其中卡拉泰奧多里對於大眾來說比較陌生,不過在科學界他很有名,他是最先對熱力學做出公理化的科學家。
● 克勞修斯表述:
“不可能把熱量從低溫物體傳遞到高溫物體而不產生其他影響。”
● 開爾文表述:
“不可能製造一種永動機,使其在一個熱源上吸收熱量並將其全部轉化為功而不產生其他影響。”
● 康斯坦丁·卡拉泰奧多里表述:
“在一個系統的任意給定平衡態附近,總有這樣的態存在:從給定的態出發,不可能經過絕熱過程得到。”
這 3 個表述不用全部理解,只需要知道它們都等價,重點是這裡面沒有一個提到熵。
當然,你可能說我這是咬文嚼字,透過表述字眼得出結論,是不是太隨意了?其實還真不是。如果熱力學第二定律真的可以用熵就可以又簡潔又嚴謹的表述出來,科學家們為什麼不用呢?畢竟奧卡姆剃刀原則是科學領域裡的最基礎原則之一。
我們應該明白,熱力學第二定律不論用什麼樣的表述都是外在的形式,它的本質其實在說第二類永動機不能做出來。而我們前面提到的,因為無法排除熱振盪而導致出現的自發熵減的情況,並不會否定這一點。
也就是說,即便有偶然的自發性熵減的情況存在,也沒有辦法實現永動機。
首先,那種自發的熵減情況,即便是真的出現了,因為發生的機率非常小,只可能是零星地會出現,所以不可能持續的發生,也就是它即便是可以對外做功也沒有辦法持續,沒有辦法持續當然就不是永動機了。
那是不是可以加一個單向閥門,只保留會帶來熵減的熱震盪,將那些會引起熵增的情況排除掉?如果可以的話,的確可以持續做功了,但這樣,就又變成了一個麥克斯韋妖。我們前面已經介紹過了,麥克斯韋妖是無法實現的。
其實,如果單純從數學上去看,前面提到的各種表述都默認了一個前提,那就是對應的系統一定是由大規模粒子構成。就拿克勞修斯定理的那個公式來說,裡面是用到了微積分的。而微積分這個數學工具如果想有效,那還是有門檻的,它分析的問題需要遵守一個前提,那就是分析的物件(也就是對應的函式影像)需要連續且光滑地變化,只有這樣的情況才是可微的。
而如果一個系統裡的粒子數量不多,那它的熵的改變就會像是隨機過程一樣抖動,而隨機過程往往都是屬於連續不可微的情況(比如布朗運動),無法直接使用微積分進行分析。所以,當我們承認克勞修斯定理是正確的時候,就已經默認了一個系統的熵一定是在連續且光滑地變化,而這隻有在粒子規模非常巨大的時候才成立。其他幾個表述也類似。
在物理學裡有一個概念——狀態函式,專門用來指那些僅僅依賴系統初態和終態的的宏觀物理量,這些物理量的特點就是隻和系統的當前狀態有關,與系統如何達到這些狀態的過程無關。
我們最熟悉的一個狀態函式就是系統的能量狀態。比如,許多小球從高處滾落到谷底,不論它從那個方向、以什麼樣的形式滾落,只要都是在同一個谷底那麼它們的勢能都是相同的。
熵在這一點和能量非常像,熵也是狀態函式,一個系統的熵只和這個系統所具有的狀態有關。而且熵和能量還有一個非常重要的相似之處,那就是能量和功是一對,熵和資訊量是一對,功是能量狀態改變的原因,資訊量也是熵改變的原因,功的量綱和能量的量綱相同,資訊量雖然沒有量綱,但是資訊量的單位也可以和熵一樣,比如都可以是 bit 。
雖然能量和熵很多地方都很相似,但是在“能量-功”這對組合上很多有用的經驗,並不能直接照搬到“熵-資訊”這對組合上。
其中第一點,資訊量和功的作用是相反的。對一個系統做功,系統的能量是增加的,而對一個系統傳遞資訊,資訊是一種負熵,所以系統的熵會減少。當然,這一點區別並不算大,一個是給總量“添油加料”的,一個是給總量“釜底抽薪”的,數學計算上只是一個正負號的差別。
不過在另一個能量和熵的差別上才是最關鍵的。
能量和功是一個非常簡單的因果關係,只要有做功,那麼能量一定改變。反過來,只要有能量改變也都有做功。即便是熱傳遞,宏觀上雖然不一定會導致做功,但是從微觀角度去看,也都是由各種做功活動導致的。
比如,我們通常理解的熱傳遞有 3 種情況,熱傳導、熱輻射和熱對流。熱傳導是微觀粒子自己互相碰撞導致的,熱傳導是微觀粒子和輻射光子之間碰撞吸收導致的,熱對流就是微觀粒子的流動,這些行為本質上都可以看作是做功。
也正是“能量-功”這對組合有這樣一個明確的因果關係,所以才會有能量守恆。因為在龐大的物理世界中,不論關係如何複雜,系統之間的能量變化的因果鏈條都是唯一且等量的。
可如果是熵和資訊這一對組合呢?資訊的確是熵改變的原因,但卻不是熵唯一改變的原因,因為即便是一個封閉系統,即便沒有和外界有任何的資訊交換,它的熵也是會逐漸增加直到系統達到平衡。
能量之所以能守恆,就是因為它簡單明確的因果鏈條,現在我們知道,熵不具備這個條件,所以熵是不守恆的,宇宙的熵一直在增加。
這裡值得多講一下霍金提到的資訊守恆。霍金因為資訊守恆才發現了黑洞輻射。前面我們提到過,熵和資訊某種程度是一種東西,甚至可以認為資訊熵就是一個系統裡包含了多少資訊量的平均值。如果宇宙的熵不守恆,那是不是資訊也不守恆呢?這不和霍金的說法矛盾了嗎?
其實並沒有矛盾。我們前面提到的熵增的規律,一定是大規模微觀粒子裡才有的,如果系統裡的粒子數量很少,那麼熵就會出現在一會兒增一會兒減的震盪,根本沒有規律。如果更進一步只考了一個粒子的孤立系統,那它狀態將是永恆不變的,當然也就不會涉及到熵的變化了,這個時候熵當然就是守恆的了。
其實,霍金所說的資訊守恆裡的資訊是量子資訊,這是把經典資訊、經典熵的概念擴充套件到了量子系統裡。不論是經典還是量子,資訊和熵的定義都依賴於機率的,經典系統裡之所以會有機率存在,是對大規模粒子數量的統計的結果,在這種情況下是由統計規律所支配的(比如大數定律和中心極限定理等)。而單個量子也是有機率存在的,只不過這個機率是由薛定諤方程決定的,而薛定諤方程所決定的機率並不會自發的發生改變。
也就是說,經典的熵之所以會自發地發生改變、無法遵循守恆定律,追根究底還是因為被統計規律所支配,而一個系統可以達到平衡、不再繼續熵增,也是因為它在統計規律下系統維持了穩定。
所以,當統計規律不在起效時,比如單個粒子或量子,因果關係有變成單一且確定的了,當然守恆定律就會再次起效。
瞭解了這些,我們再回頭去看克勞修斯定理就會發現其中的巧妙之處,為什麼這個定理一定要用閉曲線積分,也就是隻考慮那種起點和終點相同的情況去描述。
這是因為只有這樣才能排除因為“獲取資訊”而導致的熵的改變,剩下的一定是在這個過程中因為“統計規律”而導致的改變了。克勞修斯定理的偉大之處就在於,它明確了,要想完全抵消這種改變只能是負值,它的方向是確定的。
驅動熵發生改變有兩個因素,一個是資訊-熵這樣的因果關係,另一個則是統計規律。而就是這個統計規律為我們認知這個世界帶來了巨大的挑戰,這也是為什麼關於熱力學第二定律的爭論和錯誤理解有很多。其實“統計規律”對認知帶來的挑戰並不只是體現在物理學上,在其他各個領域都帶來了巨大的挑戰。
這是因為我們人都非常習慣利用因果關係進行思考,但是我們又非常不善於發現因果關係。
如果沒有專門思考過什麼是因果關係這樣的問題,那麼就會很容易把“ A 發生了之後 B 也發生了”認定為 AB 是一個因果關係,A 是因、B 是果。
對一個系統做功,系統的能量狀態發生改變,做功是因,能量狀態改變是果。這一點就沒有問題。
但如果僅僅這樣思考的話,對於熵就會帶來巨大的認知挑戰,因為統計規律可以自發發生。所以完全可能會有這樣的情況出現:
三個人甲、乙、丙,他們的視角不同,甲看到的是 A 發生了之後系統狀態發生了改變;乙是看到的 B 發生了後系統狀態發生了改變;丙看到的則是 C 發生了後系統狀態發生了改變。因為統計規律導致的改變完全是自發的,所以上面 3 種情況完全可以同時存在。這樣的話,那麼甲乙丙就會得出 3 個不一樣的因果關係。
那麼如何才能認定一個因果關係呢?其實這個問題現在在科學界中也沒有一個定論。不過,值得關注的是圖靈獎獲得者朱迪亞·珀爾(Judea Pearl)的觀點。他之所以獲獎,就是因為他在因果關係方面的研究促進了人工智慧的發展。

珀爾認為,確定一個因果關係需要有 3 層,也就是他所稱的“因果關係之梯”:
● 第一層是“關聯”,簡單的說就是我們前面提到的 A 發生之後 B 也發生,A B 就是一種關聯關係,也可以成為相關。
● 第二層是“干預”,確定一個因果關係不止於被動的觀察,還對變數進行主動干預,然後去看干預之後產生的影響。
● 第三層是“反事實推理”,反事實推理是最高層次的因果推理,需要考慮對假設情境的思考。不只要看 A 發生了之後 B 是否發生,還需要考慮如果 A 沒有發生,B 是否還會發生。
簡單的說,就是如果 AB 是這樣一種關係:A 發生了 B 也發生了,A 沒發生 B 也一定不發生。那麼我們才能將 AB 稱作是因果關係。
那麼統計規律如果也看作是系統變化的一個原因的話,那麼它的反事實推理應該是,如果沒有統計規律,是否系統一定不會發生改變。而沒有統計規律這件事,別說做干預實驗了,就是單純假設一個不存在統計規律的環境都很困難。
為什麼熵會這麼晦澀難懂,就是因為“熵變=資訊+統計規律”,而和這個公式非常像的還有一個公式“成功=天賦+運氣”,統計規律至少還是有規律的,運氣那可就是純純的隨機了。這或許也是為什麼關於成功學的書很多,但是書的作者也沒有辦法把書中的成功復現一遍的原因吧。



科聲使用者專屬福利 
滿200-20元,全網僅限科聲使用者專享!
滿200-20元,全網僅限科聲使用者專享!
悄悄告訴大家,滿減後到手價比在“得到APP”內購買還要低哦~
還有還有,優惠券可無限次領取,
超過200元的專欄,分別領券下單都可立減 20!
*請注意:下單購買時的手機號一定要
和登入“得到”APP 的手機號保持一致,
否則會導致購買後找不到已購課程!
掃描下方二維碼即可領取全網獨家優惠券

歡迎大家選購自己想要學習的「得到」課程,如果以前沒有下定決心,現在就別再猶豫了。
推薦閱讀

歡迎關注“科學聲音”影片號
更多有趣的科普影片等你來發現