化學空間浩瀚無比,據估計分子量小於500的穩定小分子數量可達10的60次方,而目前為止FDA批准的所有藥物加起來也不超過4000個、小分子可能也就2000多個。因此在巨大的化學空間尋找藥物類似在曠野中找金礦,必須有一套尋找金礦的完整體系、隨機挖的成功率太低了。絕大部分化學空間幾乎不可能成藥,比如水溶性太低、選擇性太差、含有毒性基團等,是要躲開的雷區。藥物設計的目標一個是找到礦區、一個是避開雷區,二者同樣重要。盯著球門的同時也要能看明白防守陣型。
根據經驗小分子藥物每日劑量最好不超過400毫克,否則毒性風險、使用障礙(pill burden)、生產成本都會上升。這個劑量除以人體體液容量,加上非特異蛋白結合、肝腎代謝消除等因素遊離血藥濃度應該在nM到uM之間。考慮到藥物需要與內源配體競爭靶點蛋白,藥物分子與靶點蛋白結合能力(Ki)最好達到nM級別。這是藥物最佳化的第一個目標,就是金礦的中心位置。
所有藥物設計手段比如組合化學圍攻、構效關係分析、計算化學預測、AI等都是為了預測這個金礦在化學空間的位置,這是傳統藥物化學的核心內容。這裡每個分支說起來都是專門的學問,比如組合化學就有多個變種,從早期的split-and-pool到規模大幾個數量級的DEL和環肽庫構建;從多樣性導向合成(DOS)、Diverted total synthesis到類天然產物(NP-like)、假天然產物(pseudo-NP)。構效關係分析有電子等排體、Topliss決策樹、定量構效、骨架遷躍等方法,計算化學也是大領域、有多個分支。AI近些年突飛猛進,未來對藥物設計的影響不容忽視。
化學空間佈滿雷區、需要足夠重視,如果只盯著金礦會不斷踩雷。有些基團通常風險大於收益,除非十分必須要儘量避免。化學活性基團如環氧乙烷、滷代烷、醛、酮、Michael受體等除非你知道你的分子可以讓這些基團選擇性與你的靶標蛋白反應,否則毒性風險很大。硫脲、磺醯脲、肼/醯基肼沒什麼反應活性但也通常被認為是毒性基團,儘管這些基團曾經出現在藥物中。有一大類所謂PAIN化合物經常產生假陽性測試結果、誤導最佳化方向,如鄰雙吡啶可以絡合過渡金屬離子影響酶活性、本身就有熒光的化合物干擾測試熒光訊號等,最好避免。現代藥物化學為了避免被假陽性現象誤導會在分子工作機制上投入大量資源,因此開發了很多化學生物學技術。
藥物在體內面臨代謝酶的騷擾和排洩系統的驅逐,有些基團以變節速度聞名。比如酯基很少能逃脫無處不在的酯酶水解、酚羥基很容易參與次級代謝、多肽特徵會被蛋白酶快速識別等,這些清除反應產物與底物結構差別很大、多數情況會導致活性喪失。另外有一些代謝反應會產生毒性代謝物質、危害更大,一個常見的毒性基團是硝基,因為在體內很容易被還原成有基因毒性的亞硝基,苯胺也被認為有潛在基因毒性。還有一些隱藏比較深的毒性基團,比如烷基四氫吡啶體內可以被氧化成吡啶季銨鹽、能夠引起帕金森氏症。代謝酶底物也會帶來藥物相互作用風險,如果有更安全路徑應該儘量繞開這些已知雷區。當然也有利用代謝啟用的前藥技術,比如ADC。
除了區域性毒性和代謝不穩定基團外還有一些整體分子特徵與成藥性背道而馳,比如脂溶性太高、極性太大、分子柔韌性太大等與溶解度、過膜性等藥代性質相關,這些化合物即使活性很好也難以成藥。過去30年小分子藥物設計一個主要進展是對這一大片所謂非成藥空間的理解加深很多,自1997年Lipinski提出五規則很多人根據藥物和不同開發階段的候選藥物與早期苗頭化合物結構特徵的比較終結了大量經驗規則,定義了藥物設計的不同風險雷區、警告大家儘量少去。
當然所有這些規則都有例外,但這是理性平衡利弊的結果、並不意味著雷區不存在。藥物設計除了要利用所有工具儘量準確定位金礦核心位置,也要系統評估這個區域附近的已知雷區。因為藥物在廣袤的化學空間只是滄海一粟,任何微小的誤判都可能錯過藥物分子或在雷區浪費過多資源。因為化學合成是個主要的資源投入,在啟動這個過程前要確認這是地雷最少、離金礦中心最近的區域。這個聽起來無可爭議的策略在實踐中並不容易執行,有時候是因為無法抵禦活性的誘惑、有時是受合成難度的限制。更多時候就是根本沒仔細算賬,遺漏了成藥空間的未開發區域或只盯著金礦陷在非成藥空間,這都會延誤戰機。
藥物設計是個經驗、偏見、科學、玄學的複合體,不僅沒有標準答案、而且幾個研究顯示即使同一公司不同藥物化學家對同一個設計問題經常看法大相徑庭。把先導物最佳化過程科學化、標準化必然會影響設計思路的多樣化,這會推動還是阻礙藥物發現還不好說。歷史上藥物化學家以自由主義戰士為主,除非太離譜基本可以隨心所欲想做哪個化合物就可以做、甚至有人認為乾脆合成所有可以合成的類似物。但隨著我們對成藥空間理解的深入、AI等預測方法的大規模介入、合成技術的成熟等外部環境變化,藥物化學家可能也需要嚴格一下設計的紀律性,每次進入一個新地界要仔細問問土地爺本地都有哪些妖怪、來自何方。