複雜科學是一個跨學科的領域,它融合了物理學、生物學、計算機科學、經濟學和社會學等多個學科的理論和方法,旨在理解複雜系統的行為和動態。而“規模法則(Scaling Laws)”是複雜科學中一個重要的概念,旨在描述不同系統和現象如何隨著規模變化而變化的規律。這些法則在自然界、工程學、生物學、城市發展、經濟等多個領域都有廣泛的應用。
2024年11月15日,北京師範大學系統科學學院教授張江老師在西塘為我們帶來了一堂關於規模法則的課程,以下是本次課程節選。

規模縮放法則
今天我們會看到有大量的數學定量公式可以去描述這個複雜世界背後所蘊含的統一規律,這些規律就是所謂的規模法則。正是有這些規律的存在,複雜科學才得以成立。
規模理論的提出者Geoffrey West,早年是一個純粹的理論物理學家,由於家族的前輩們在50歲時出現了普遍的衰老乃至死亡,在其50多歲的時候,他也開始擔心自己的身體健康問題,並將其當作一個科學問題來探索。
一個生命體的壽命長短是由什麼因素決定的呢?他開始查閱大量的生物學文獻,但是這些文獻都沒有辦法直面回答他的問題。一次偶然的機會,他遇到了生態學家James Brown,James告訴他,從生態學的角度來說,這一問題的答案可能與“規模”相關。此後,二人開展了長達十年的合作,最終確立了規模法則,並將這套理論應用於公司企業、城市規劃之中。
什麼是規模法則呢?其英文為Scaling,又譯為規模縮放法則。人類的大腦最習慣於進行線性思考,自然而然地認為一個十人規模的企業擴大到百人規模時,就能從賺一個億到賺十個億,而規模法則最為重要的特點就在於強調變化的非線性。一個生命體從小變大,雖然各個部位都會相應放大,但是放大的比例卻不盡相同。兩個四點五寸的披薩和一個九寸的披薩面積並不等同,是因為當披薩的尺寸增加時,其面積的增長速度是平方級別的。
科幻片中身高兩三層樓高的巨型怪獸哥斯拉在真實的物理世界中是不可能存在的,因為它的雙腿無法支撐起它的整個體重。如果把一個生命體抽象成一個立方體,體積的增長呈三次方規律,而截面積的增長則呈二次方規律。截面積越大,承受力就越強。隨著生物體的增長,其體重的增長速率將遠超承受力的增長速率。

規模法則也同樣適用於大語言模型的發展。2020年,研究就發現,隨著模型引數的擴大,一系列的效能指標都會出現不同比例的變化,代入公式就可以進行外推,人工智慧系統在未來能夠達到什麼樣的水平。這也是Open AI篤定大模型的方向,並應用於科技創新的原因。

生命體中的規模法則
上百年來,科學家們對於複雜系統的研究形成了一定的科學正規化。第谷進行了長達20年的天文觀測,親手在筆記本上把觀測的資料記錄下來,形成了非常珍貴的手稿。在臨終前,第谷把記錄了20年的資料手稿交給了開普勒,將行星執行背後的原理性問題留給了他解決。開普勒在進行了幾年的研究之後,跳脫出行星沿圓形軌道運動的看法,結合資料總結出了行星沿橢圓軌道執行的規律,提出了著名的開普勒三大定律。牛頓應用他的第二運動定律和萬有引力定律,在數學上嚴格地證明了開普勒定律。
事實上,這三個人就代表了自然科學發現的三個階段。第谷代表的是第一階段,即資料收集階段。開普勒代表的是第二階段,即唯象階段,用一套數學原理去解釋觀測到的資料。比如開普勒三大定律就完美解釋了第谷觀測了20年得到的資料,揭示了太陽系中行星的執行規律,但侷限在於其無法推廣到別的星系。牛頓代表的是第三階段,即原理階段,代表著事物發展的底層規律,可以應用在更廣的範圍中。
規模法則處於第二階段,反映生物系統中的規律的“克萊伯法則”F=cM^3/4被我稱為“生物界的開普勒定律”。從單細胞內部的線粒體到鯨魚大象,克萊伯定律適用範圍橫跨了20個數量級。這條規律表明,生物體的代謝水平與體積大小之間具有正相關性。當一個生物體的體重增長了十倍,其代謝水平則以一個相對較慢的速度增長,大概在八至九倍。體重越大的物種,每個細胞的代謝水平就越低,能力利用率就越高。

由於代謝是生物體不斷進行物質和能量交換的過程,因此和生物體的表面積關聯較密。從幾何的角度看,表面積和體積的2/3次冪成正比,然而,代謝率與體重之間並非2/3次冪的關係,而是3/4次冪的關係。到底是哪裡出錯了呢?研究發現,我們的世界不僅僅停留在三維的層面,生物體的褶皺分形構成了一個四維的空間。我們的大腸表面大量的毛細血管網路,植物、動物和單細胞裡面的細胞骨架,都構成了所謂的分形幾何體,正是這些分形幾何體導致了四分之三冪律。

克萊伯定律就告訴我們一個道理,不要盲目進行線性外推,而這是一個連頂尖科學家都會犯的錯誤。在上個世紀六十年代,科學家對一種名為LSD的毒品展開了大量的實驗研究,並測算出貓的安全劑量為0.1毫克每公斤,他們依次推測一個體重為3000公斤的大象的安全劑量為300毫克,並少注射了3毫克進入大象體內。結果,實施注射5分鐘之後,大象開始大叫起來,轟然倒地,並進入持續癲癇狀態,在1小時40分鐘之後便死亡了。
同樣地,我們平時吃藥也要謹遵醫囑,不能線性地外推。2歲的小孩大概12.5公斤,服藥的劑量為一包。7-8歲的小孩體重是2歲小孩的兩倍,但是服藥的劑量卻小於兩包。而醫生給病患開藥的時候,已經考慮到了年齡、體重等因素。
人類懷胎十月生出寶寶,而小貓懷孕可能兩三個月就能生下一胎。生命體的特徵時間T與體重之間也有規律,為1/4次冪的關係。另外,生物體的特徵頻率f,即心跳頻率與體重也有關係,為-1/4次冪的關係。把這兩條規律結合在一起,還有一個令人震驚的發現:當生命體的特徵時間與特徵頻率相乘時,會得到1.5*10^9這個結果。這就意味著,生命體一生的心跳次數是一個恆定的常數結果。體重大的生命體壽命較長,但是頻率就相應地變低了;體重小的生命體壽命較短,但卻有較高的頻次,冥冥之中自有定數。

從克萊伯定律和能量守恆等基本原理出發,可以推匯出生物體從出生到死亡體重變化的過程,即生長曲線。這一過程可以抽象為一個水缸模型:生物體的體重就相當於水缸中的水量,體重的變化則可以視為水的注入和流出帶來的結果。代謝水平對應的是水的流入量,維持生命活動所需要的能量代表的是水的流出量。
生物的代謝與體重的3/4次冪成正比,因此呈彎曲形態。隨著體重的增加,代謝流量增長逐漸減緩。生物的維護成本與體重成正比,因此呈直線狀態。隨著體重的增加,維護流量始終以固定速率增長。生物的生長就發生在流入量高於流出量的時候。

這一生長曲線的普適性進一步被驗證:不同物種的生長資料,都能在同一曲線上找到對應位置。規模法則在生物界的作用就類似於開普勒定律在天文學中的作用,能夠有效描述生物體生老病死的實證資料。

企業中的規模法則
企業是經濟系統的基本單元,規模法則是如何在企業中體現的呢?
規模法則可以用來分析企業銷售額與員工數之間的關係。根據2008年美國300多家上市企業的資料形成了一張散點圖,一個小點就代表一家企業,其中橫座標為企業員工數、縱座標為企業銷售額。透過線性擬合可以得到一個方程,這個方程中最關鍵的是x前的斜率1.02,反映了企業規模與銷售額之間的增長關係。這意味著美國上市企業的員工數量增加兩倍時,其銷售額大約會增加兩倍多一點,大公司與小公司的銷售能力差異不太大。我們根據3000多家中國企業的資料得出來了的斜率數值僅為0.83,明顯小於1。這意味著在中國,企業規模翻倍時,銷售額增長不到兩倍,大公司比小公司的人均銷售額低。方程的係數代表的是單人的銷售額,是一個企業只有單一員工時的銷售額。中國企業的規模法則係數大於美國,則意味著中國企業的單人銷售貢獻高於美國企業。

規模法則還可以揭示企業老化的現象。我們依然採用的是企業銷售額和員工數這兩個指標,但是選取的樣本有所不同。我們在1950年到2023年這長達70年的跨度內,選取了所有創業時間只有一年的企業,對於這些初創企業而言,企業銷售額和員工數之間的斜率提高到1.07了,具有更強的規模效應,規模擴張時銷售額增長的速度更快。這也意味著,創業初期的企業增長潛力巨大,能夠實現快速突破。

我們還可以進一步研究不同年齡段的企業的表現,分析企業在10歲、20歲、30歲等不同年齡階段的斜率變化。同時,我們還可以考察銷售成本、管理成本等各類指標,繪製出不同的增長曲線,這些線條的斜率變化就揭示了企業隨著時間推移時的不同表現。隨著企業年齡的增長,企業的研發成本和管理成本越來越高,帶來巨大的消耗,導致企業的效率降低,呈現出典型的老化現象。
規模法則還可以用來直接對企業進行評估。我們提取了規模法則中一個叫作離差的指標,根據收集到的資料對企業進行統一的評估。在一個橫座標為總資產、縱座標為總負債的座標系裡,我們可以看到A、B、C三家企業的整體資產規模和負債規模。直觀來看,C企業的負債最高,似乎是最不理想的。然而,單純根據總負債評估企業是不準確的,因為負債高的企業往往資產規模也更大,尤其在中國,大企業往往更容易獲取資本。為了更加合理地評估企業,我們引入了負債率這一指標,斜率越高,負債率越大,企業經營狀況就越不理想。
我們還提出了一個全新的指標,對於中國企業實際遵循的規模法則而言,總負債和總資產之間呈1.09次冪的關係,是一個冪指數大於1的非線性方程。負債水平和資產規模的偏離程度直接影響對企業好壞的評估結果。若企業處於曲線之上,則意味著負債過高,表現較差;反之,若處於曲線之下,表現較好。

我們可以利用規模法則分別結合負債率、成本、利潤等擬合出一條直線,並用離差,即企業偏離直線的距離來評估每家企業的經營狀況。對於如銷售額和利潤這樣的正向指標,偏離曲線越大越好;對於如負債這樣的負向指標,則偏離曲線越小越好。利用這一創新指標,我們對美國300多家上市公司和中國3000多家上市公司進行了資料分析,對離差指標與傳統的比例指標進行對比,從而為企業評估提供了一種新的視角。
我們進行了一項大規模的實驗,對時間跨度長達70年的美國企業資料進行分析,透過利用離差指標評估企業的破產機率,來檢驗離差指標的預測能力。實驗證明,我們的離差指標比原有的比例指標用來預測企業的未來表現要更加可靠和合理。
那麼,企業的發展到底有沒有規律呢?如果以時間為橫座標、總資產規模為縱座標來觀察北美企業的資料,這些小點呈現出的似乎是無規律的上下起伏和波動,但是如果你仔細地觀察就會發現,這些小點形成的曲線表現出了緩慢的增長趨勢,恰好與美國2~3%的GDP增長率相吻合。

然而,這只是表面現象,真正的規律蘊藏在不同視角下對資料的特殊處理。當我們改變視角,將橫座標選取為總資產,所有的資料點呈現出強烈的規矩性,形成了一條几乎完美的直線。之前我們提到生物體代謝率和體重之間存在著穩定的關係,企業的淨收入和總資產的斜率為0.85,展現了類似於生物體中的克萊伯定律。

基於這個定律,我們可以推匯出企業週期、運動頻率等一系列要素與企業規模之間的關係。隨著企業規模擴大,資金的週轉頻率和人員週轉頻率會降低。企業的壽命越長,平均而言,員工在企業中停留的時間就會越長。
在企業中的水缸模型裡,流入水缸的部分有兩個專案,一是淨收入,二是貸款,流出水缸的部分是企業發展所需的各類成本,構成了企業的財務平衡方程。財務平衡方程和規模法則這兩個第一性原理結合在一起,就推匯出來企業生長方程。我們可以看到對於美國大多數的傳統企業,如可口可樂,其增長曲線與這個生產方程能夠很好地吻合,但是企業畢竟不是生物體,其成長受市場約束和個性化因素的影響,像蘋果這樣的高科技公司,往往就因被投資者看好、獲得大量資金支援,而偏離正常的增長軌跡,增長速度明顯高於市場平均水平。

在中國,也有百分之六七十的企業的增長曲線是與這個方程相吻合的。中國和美國的企業增長曲線之間存在著一個巨大差異:美國企業的增長曲線趨於平穩,而中國企業的增長曲線在上漲之後會有微微跳起的趨勢。這一差異的原因在於中國企業的借貸模式,中國企業總債務與總資產的斜率是1.09,且公司越大,負債率越高。在美國則不會有這種現象,大小公司的負債率都差不多。

城市中的規模法則
為什麼我們要關注城市?全球超過50%的人口都已經居住在城市之中了,城市化程序日益加快,特別是中國,許多小縣城已經轉變為初具規模的小型城市。隨著城市化水平的提高,城市的發展也逐漸展現出兩面性,一方面是城市的輝煌和繁榮,另一方面則是環境汙染等負面要素。規模法則就可以幫助我們去研判在城市的發展過程中,其財富水平、科技創新等方面會發生何種變化。
當我們去看張家口、石家莊、北京這三座城市,是否可以說北京就是一個放大的張家口或者擴大的石家莊呢?這是我們思考規模法則的起點。以500多個美國城市的實證資料為基礎,我們將城市總人口作為規模指標,分析城市GDP的變化。資料顯示,城市規模與GDP成正相關關係。城市每擴大1倍,GDP會擴大1.13倍。這就是現在很多年輕人願意留在大城市的原因,因為隨著城市規模的擴大,人均GDP在上升,儘管大城市同時也伴隨著犯罪率、疾病風險較高的問題。

規模法則涵蓋了眾多指標,且在不同國家的城市中都呈現出類似的規律。城市不僅是人口的聚集地,也是基礎設施的載體。以美國城市為例,其道路總面積與城市規模的0.85次冪成正比,這得益於大規模城市的高聯動性,共享道路面積大,因此對於道路面積的增速沒有較高的需求。

規模法則中的方程指數可以分為三類:大於1、等於1和小於1。指數大於1的通常是與人類互動密切的指標,如GDP、科技創新、專利數量、犯罪率等等。這意味著城市越大,人均的積極性越高、專利數越多、犯罪率越高。指數小於1的則是與各類基礎設施相關的指標,如加油站數量、城市管道長度等等。這意味著隨著城市規模擴大,人均基礎設施的數量逐漸減少。指數等於1的是與人口數相關的指標,如平均用電量等。
我們提出了一個模型去解釋為什麼城市中廣泛存在規模法則,出發點是人是城市的主體。城市中的人口不是固定的,除了睡覺的時候,絕大部分時間都在流動。因此,我們提出了“活躍人口”的概念,代表著城市中流動的人群,白天可能體現為工作人口,夜晚則轉化為居住人口,將二者平均混合即可得到相應的活躍人口。
我們將活躍人口作為建模的基本單元,遵循匹配生長的原則。一個城市可能起源於一個小漁村、小社群,後來會不斷有代表活躍人口的節點,即活躍社群加入,新加入的節點只有在與現有節點足夠靠近的時候,才會被認為是有效的加入。有效加入的節點才能夠生長,形成中間密集、兩邊稀疏的人口分佈模式,這與真實的城市資料非常吻合。

城市不僅要聚集人口,還需要形成創新的力量。那麼,創新從何而來?創新並非是刻意需要偉大的發明抑或理論,從大尺度看,它和隨機的化學反應類似,是人和人之間思維的隨機碰撞。所有創新和財富創造的根源都在於人和人之間的互動。很多城市中的咖啡屋、車庫空間,就是為人們提供了互動的空間,從而催生科技創新,形成財富。
人口不是孤立存在的,而是彼此之間形成互動,從而構成一個簡單的網路。隨機形成的互動網路,與節點數成二次冪的關係,但這一互動網路並沒有考慮到人與人之間互動的成本。在實際生活中,人們的互動會受到物理距離的限制,特別是在沒有現代化高速公路的過去,人們的活動範圍非常侷限。
在現代化的城市裡,我們的互動模式顯然不是隨機的,但也不像網格般規整,高速公路的蓬勃建設使我們的社交網路得以跨越空間。我們假設所有的人類互動形成的創新和財富創造都沿著路網進行,這說明道路路網與經濟活動之間有著非常密切的聯絡,路網構成了我們人類經濟活動的介面。

人類活動的節奏與城市規模也有關係。研究發現,城市規模越大,人們的步伐會越快。在北京、上海這樣的大城市,上班高峰期地鐵裡擁擠不堪,人們都行色匆匆,慌里慌張。在倫敦,還會有專門的快速通道,讓人們得以快速透過。同樣地,城市規模越大,手機的使用頻率越高,人們的溝通強度越高。大城市迫使人類生活節奏加快,變得越來越繁忙,這也是規模法則的推演和體現。
刺蝟是我特別喜歡的一個搖滾樂隊,他有一句歌詞叫“社會是傷害的比賽”,我深有體會。當人和人之間形成互動時,除了會帶來創新想法和財富來源,還會帶來矛盾和摩擦。因為人際關係的發展背後是熵的產生,城市發展到一定程度,一定會將這些產生的廢棄物排出去,在資料上即體現為二氧化碳的排放會隨著城市規模的擴大而增加。
與生物體和企業一樣,我們也可以為城市建構出一個水缸模型,方程指數為1.15。但與其它二者不同的是,基於初始條件和引數設定的不同,城市增長存在著兩種可能性:一是實現超速度增長,在有限時間內形成人口的超大規模爆發;二是伴隨著人口增長產生的大量垃圾無法消化,基礎設施建設跟不上需求,整個城市遭遇發展瓶頸,乃至完全崩塌。

為了調節這兩種可能性,研究者又推匯出來一個波浪式的城市增長規律。人類歷史上眾多城市曾面臨消亡,但科技革命的出現遏制了這一趨勢。換句話說,創新不是原因,而是結果。城市發展的一角在崩塌,於是人們不得不尋求新的突破。科技創新就會改變城市發展的方程係數,提升人們的幸福感,使得城市發展邁入了新的軌跡。
週期性的崩潰和重建並非無序,而是遵循著一定的定量規律。科技迭代的週期越來越短,從最初的上百年縮短至幾十年,再到現在只需要幾年。用跑步機來做比喻,人們不僅是在跑步機上奔跑,而且還會不停地跳到更快速的跑步機上奔跑。當我們玩命地加速,不停地切換到更快速的跑步機上,就會面臨一個不可迴避的問題:最終哪裡是終點?
科技進步的不斷加速是在接近人類歷史中的技術奇點,一旦到達奇點,超級人工智慧和環境崩潰可能同時發生。問題的根源就在於我們剛才所說的,互動是一個傷害,一切互動都伴隨著熵增加。老子在《道德經》中所形容的理想國,“鄰國相望,雞犬之聲相聞,民至老死不相往來”,似乎是暗示我們停止或減少人類間的互動,但這並不意味著我們要退回原始的生活模式,人類無法一直停滯不前。

////// END //////
混沌文理院七期——以思想抵抗虛無,回答人生大問題
以下為混沌文理院七期學習課表。點選“閱讀原文”,立即報名。
