多家國際金融機構發生系統穩定問題

2025年年初,第一資本銀行、巴克萊銀行、富途平臺以及英國多家金融機構發生系統穩定問題事件,其中部分宕機事件引起的業務中斷時間長達3天,影響範圍十分廣泛,經濟損失嚴重。
第一資本銀行——第三方服務問題
2025年1月15日至18日期間,第一資本銀行(Capital One)遭遇嚴重的宕機事件,數千名客戶無法訪問其賬戶資金。1月22日,受到宕機事件影響的金融消費者對第一資本銀行發起集體訴訟。根據訴訟內容可以看出,雖然第一資本宕機事件是由第三方供應商故障引起的,但引起使用者更強烈不滿的是滯後的事件處理速度和模糊的訊息內容,愈發凸顯金融機構在服務中斷期間採取清晰、及時和主動溝通的必要性。
使用者社交媒體的發聲擴大了事件影響範圍,並對機構聲譽造成負面影響。在宕機事件發生後,第一資本銀行沒有對宕機事件進行解釋,使用者在官方渠道無法找到宕機的原因和時間表,只能在社交媒體上抱怨,搜尋有助於解決問題或宕機事件相關更新。使用者還會分享空白賬戶餘額、交易失敗和客戶服務聊天視窗無響應的螢幕截圖,這些內容在社交平臺上形成了相關“熱詞”,並逐步發展成了具有一定影響力的社會事件。
延遲和模糊的陳述加劇了使用者焦慮。在宕機事件的數個小時後,第一銀行資本才向所有客戶傳送了第一封電子郵件,稱預計服務將在第二天逐漸恢復正常。宕機事件的第三天,第一資本銀行才在社交媒體上釋出公告,稱第三方供應商遭遇技術問題,已經連續兩天影響多個賬戶的服務、存款和付款處理需求。但此次回覆既缺乏關於問題範圍或何時解決的具體資訊,也沒有說明使用者發起的交易是否已經正確執行。客戶無法確定交易情況、何時處理以及中斷將持續多長時間,加劇了宕機事件引起的使用者焦慮。
巴克萊銀行——關鍵模組故障
2025年1月31日至2月2日,巴克萊銀行在英國的大型技術系統的一個關鍵模組出現軟體問題,影響了5%的客戶登入嘗試,以及成功登入使用者中56%的交易請求失敗。2月26日,巴克萊銀行向英國財政委員會提交了該事件報告,詳細描述了事件的背景、原因及影響。事件發生後,巴克萊啟動了應急管理程式,優先恢復服務,並與客戶和監管機構保持溝通。2月2日採取臨時緩解措施,2月21日收到修復的軟體更新。
在巴克萊銀行事件發生後,英國財政委員會指出,“在2023年1月到2025年2月期間,英國銀行和房屋貸款機構協會中有9家機構在過去兩年中發生至少158次故障,累計故障時間至少803小時,相當於超過33天的技術問題和系統中斷。”
富途平臺——網路異常導致訂單失敗
根據富途方面公告,2025年2月12日晚22點30分美股開盤後富途平臺發現網路異常問題,導致部分客戶出現無法操作訂單指令等情況。富途相關人員立即進行排查和修復,截至當天23點15分,新增交易訂單已恢復正常。這次故障對部分客戶造成較大的影響,尤其是期權交易者。有客戶反饋稱,由於無法平倉,末日期權歸零,損失高達數千美元。在處理方案上,富途設立了專線客服團隊來處理受影響客戶的問題,同時承諾提升系統穩定性。
儘管所有的金融服務機構都難免遇到系統宕機、第三方服務中斷等技術問題,但作為依靠技術能力彎道超越傳統經紀商的網際網路經紀商,富途平臺的每一次宕機事件都備受關注。2019年11月,阿里巴巴返港二次上市,創下港股自2011年以來的最大規模IPO紀錄,機構和散戶投資情緒高漲,但在打新期間,富途牛牛App遭遇宕機問題;2020年3月9日,歐美各國新冠疫情集中爆發,加上俄羅斯和沙特進行石油價格戰,當天美股開盤暴跌7%,觸發1997年金融危機以來的首次熔斷,行情壓力下,富途在內的多家金融機構的交易遭遇通道擁擠問題;2021年10月9日,富途平臺出現技術故障,多位使用者在各類社交媒體稱自己賬號無法正常登入、交易,出現資產資訊無法顯示等情況,此次事故原因為運營商機房電力閃斷導致的多機房網路故障;2024年8月,富途證券的夜盤交易系統出現異常,導致美東時間凌晨1:45至3:06之間的夜盤訂單被上游系統取消,富途隨後對這些時段的夜盤交易進行了撤單處理。
英國多家金融機構集體宕機問題
2025年2月28日,英國勞埃德銀行(Lloyds Bank)、哈利法克斯銀行(Halifax)、TSB、國民西敏寺銀行(Nationwide)、蘇格蘭銀行(Bank of Scotland)等7家主要銀行因資料中心繫統故障集體宕機,該事件發生在月度發薪高峰時段,導致數百萬使用者無法使用移動銀行、轉賬或檢視餘額,部分使用者因支付失敗陷入財務困境。值得關注的是,其中哈利法克斯和蘇格蘭銀行都屬於勞埃德集團的子品牌,而TSB原為勞埃德TSB集團(1996年勞埃德銀行與TSB合併成立)的一部分,2013年因歐盟反壟斷要求被拆分獨立運營,但部分業務仍與勞埃德集團保持關聯,而且此次多家銀行登入介面顯示的故障提示介面相似,可能來自同一第三方服務模組。
據監控平臺Downdetector資料顯示,事故源於核心系統每秒交易請求量突破歷史峰值,資料庫響應延遲超800毫秒,引發分散式事務鎖死,且涉事銀行過度依賴統一第三方服務模組,形成單點故障風險。儘管多家金融機構啟動備用系統,但災備切換耗時遠超預設的SLA標準,僅有國民西敏寺銀行透過賬戶間閉環交易維持部分服務能力,驗證了分散式架構的應急價值。英國金融行為監管局(FCA)在事後質詢中特別指出,涉事銀行近三年的IT投入中,僅有15%用於基礎設施升級,低於行業平均水平。雲原生架構故障隔離機制不成熟,以及監管對高併發場景應對措施的滯後性。FCA計劃將此類場景納入PS21/3新規,要求銀行構建在“極端但合理(severe but plausible)”情景下的持續服務能力,即保證機構在可能發生的極端情況下依然保持服務能力。
簡析
綜合案例來看金融機構發生宕機事件的主要原因有三個:
一是遺留系統問題。該類問題主要是系統架構陳舊、功能適配性差以及資料孤島嚴重等情況導致的,本質上是技術投入重硬體輕軟體,缺乏對系統可擴充套件性和資料治理的長期規劃;未建立“迭代式再開發工程”(如分階段重構而非一次性替換),導致技術債務持續積累。
二是第三方服務問題。該類問題主要是雲服務中斷、API介面故障以及服務商被攻擊等情況導致的,體現出金融機構未建立嚴格的第三方准入與退出機制,缺乏對第三方服務商的持續監控,如資質稽核、災備能力定期評估等;冗餘方案設計不足,未採用物理隔離等。
三是突發性事件問題。該類問題主要是自然災害、人為操作失誤以及市場“黑天鵝”事件導致的,本質上是金融機構缺乏定期演練,基層人員接受的網路安全培訓不足,導致事件處理效率低下,擴大損失範圍。
宕機事件的連續發生讓金融行業必須重視發展存在的嚴重技術債務(Technical Debt)問題。技術債務是指在開發過程中為追求短期目標(如快速交付、應對緊急需求)而採取技術妥協或捷徑,導致未來需付出額外成本來修復問題的現象。技術債務的形成原因有很多,可以初步分為明知選擇非最優方案但計劃未來修復的“有意債務”;因經驗不足或資訊缺失導致的程式碼缺陷導致的“無意債務”;以及由技術環境更新、第三方API變更等外部因素引發的“環境債務”。嚴重的技術債務不僅會提高金融機構的維護成本、降低運營效率,導致效能下降或限制架構靈活性;還會導致資料洩露、宕機等安全事件,給機構帶來不可預知的合規風險;冗雜的系統架構和程式碼還可能導致開發維護團隊士氣低落,導致技術團隊人才流動率升高,造成更嚴重的技術債務,形成惡性迴圈。
檢視完整分析請訂閱華銳研究所《金融科技洞察》,具體請諮詢華銳市場經理或聯絡華銳研究所@[email protected]
聲 明
本報告由華銳研究所提供,所載內容反映的是截至報告發表日的判斷,如所載內容出現變動,我們將及時補充、修訂或更新內容及觀點。本報告版權屬於華銳研究所,如需引用本文,請明確註明引自華銳研究所。

相關文章