基于數字孿生的生物制造系統是以數字孿生為核心,軟硬件多層次、多尺度深度結合的動態系統,從數據流的角度來看(圖1),該系統以集成在制造系統上的在線傳感器為數據來源,通過統一的數據接口傳輸至數字孿生,經過數據同步、處理和預測后,用于系統自我修正的高階數據從數字孿生和物理實體間的雙向數據通道返回,關鍵數據經可視化后展示在HMI上,而操作人員的指令則通過HMI傳輸回數字孿生和物理實體。
圖1 基于數字孿生的細胞培養系統架構設計
基于上述思路,該研究基于Python與C++混合編程技術,開發了基于數字孿生的開源細胞培養框架,包含數字孿生、微型反應器(支持在線細胞密度檢測)和web端HMI應用。其中數字孿生與微型反應器分別連接至HMI,進行交互與數據管理。該框架已開源,歡迎下載體驗。(https://github.com/BeichenZhao/BioDT)
圖2 數字孿生系統中的微型反應器
數字孿生在過程分析技術(PAT)和高級過程控制(APC)方面的潛力引人注目。然而,在生物制造領域,尚未出現成熟的基于數字孿生的制造執行系統(MES)。數字孿生究竟可以給人們帶來什么樣的幫助呢?該研究通過兩個案例研究,對這一問題進行初步闡述:
基于上述基于數字孿生的細胞培養系統,針對中國倉鼠卵巢細胞進行實驗。首先開發了基于數字孿生的預測結果進行手動換液提醒功能。換液是在細胞培養中的常規操作,其目的是棄掉舊的培養基,換成新鮮的培養基來為細胞提供營養支持。那么,在什么時間點換液,既能維持細胞的生長代謝,又不造成培養基的浪費,成了研究人員關注的問題。
本研究基于代謝物濃度,在HMI上集成了一個提示功能,如圖3所示,以葡萄糖為例,通過點擊“predict”按鈕,就可以得到未來一段時間內,葡萄糖和細胞密度變化的預測結果。
圖3 HMI中的預測功能界面
為了驗證預測結果的準確性,分別以葡萄糖和乳酸濃度為檢測指標開展了實驗,在不同的初始細胞接種密度下,預測值分別達到4 g/L和1 g/L時,進行換液并離線取樣測試。離線取樣的數據一方面是為了驗證預測結果的準確性,另一方面是為了通過HMI將該數據同步至數字孿生,校準其預測結果,更新其動力學參數。結果表明,該數字孿生系統可以準確地預測代謝物濃度,為研究人員的理性決策提供參考。同時也能看出,預測結果的偏差總體呈現出隨時間縮小的趨勢,這受益于數字孿生對動力學參數的更新,從而使數字孿生可以更精準地追蹤系統的狀態。
圖4 (a-c)在2, 5和10 (×106) cell·mL-1的初始接種密度下以葡萄糖濃度為指標進行手動換液提醒;(d-f)在2, 5和10 (×106) cell·mL-1的初始接種密度下以乳酸濃度為指標進行手動換液提醒
然而,換液仍然需要研究人員手動操作,為了探究數字孿生系統的自動化能力研究人員在控制系統中集成了一個蠕動泵,以實現對葡萄糖濃度的調節。如圖5所示。數字孿生模型根據機理模型和歷史數據實時預測培養基中的葡萄糖濃度。當預測的葡萄糖濃度低于5 g/L時,蠕動泵自動開啟,執行一次補料動作。用控制論的術語來說,這實現了對葡萄糖的模型預測控制(Model Predicting Control, MPC)。
圖5 葡萄糖補料系統連接示意圖
如圖6所示,為了驗證模型預測的準確度和控制效果的穩定性,每隔12h進行一次葡萄糖離線取樣測量,結果表明,基于數字孿生的模型預測控制可以將葡萄糖濃度穩定地維持在5g/L。此外,與批次培養相比,在48 h的培養后,該策略使細胞得率提高了14.8%。
圖6(a)進行葡萄糖補料的葡萄糖濃度變化;(b)是否使用葡萄糖自動補料的細胞密度比較
那么,數字孿生是如何被構建出來的呢。以本研究為例,細胞培養中的各項參數主要通過各種動力學方程計算,下面列舉主要計算公式。
細胞密度使用Logistic方程計算:
其中,μ代表特定生長速率 (cell/cell);μmax代表最大生長速率 (cell/cell);X代表細胞密度 (cell/mL);Xmax代表最大細胞密度 (cell/mL)。
底物代謝用以下公式計算:
此外,每當傳感器數據或離線檢測數據同步至數字孿生,其內置的Levenberg-Marquardt算法就會對動力學參數進行重新測算,使其更好的捕捉細胞當前的生理狀態。
數字孿生具備全時空尺度過程重建的能力,由于微型反應器中的流場可以被認為是全混流,在空間上分布基本均勻,該研究把目光放在了全時間尺度,即歷史過程重建、當前動力學參數計算和未來狀態預測,并在批次培養實驗中進行了驗證。
圖7 (a)根據傳感器數據更新的數字模型、數字映射和數字孿生預測的細胞密度變化值;(b)數字模型、數字映射和數字孿生對葡萄糖消耗的預測;(c)數字模型、數字映射和數字孿生對乳酸產生的預測;(d)數字孿生計算的比生長速率;(e)數字孿生計算的葡萄糖消耗速率;(f)數字孿生計算的乳酸產生速率;(g)根據離線測量數據更新的數字模型、數字映射和數字孿生預測的細胞密度變化值;(h)數字孿生重建的葡萄糖濃度變化過程;(i)數字孿生重建的乳酸濃度變化過程
在這里,數字模型(Digital Model)、數字映射(Digital Shadow)和數字孿生(Digital Twin)分別被用于對培養過程中細胞密度的變化進行預測。如圖7(a)所示,數字模型的靜態預測在開始時與實驗數據偏差較小,但隨著時間的推移增大。這是因為靜態動力學參數無法捕捉細胞生理代謝的變化,導致累積誤差無法消除。數字映射和數字孿生每15分鐘與傳感器數據同步一次,獲得了更準確的追蹤結果。此外,數字孿生還提供了比生長速率的變化情況(圖7(d)),由于一旦傳感器數據傳回,該值就會更新。僅用于跟蹤過程參數而言,在高采樣頻率下,數字孿生相對于數字映射的優勢并不明顯。
如果只有離線測量數據可用,由于更新周期較長,即使數字映射周期性地進行了校正,誤差也會隨著時間的推移擴大(圖7(g))。數字孿生基于傳感器數據更新了μmax,從而跟蹤了細胞生理活性和比生長速率的變化(圖7(d)),獲得了更加準確的預測結果。
葡萄糖消耗和乳酸生成也分別通過數字模型、數字映射和數字孿生進行了預測,如圖7(b)(c)所示。基于獲取的數據,經動力學參數校正的數字孿生成功捕捉到了葡萄糖和乳酸濃度的變化,相較于數字模型和數字映射,預測結果更加準確。利用數字孿生,還計算出了葡萄糖消耗速率和乳酸生成速率,顯示出隨時間的總體下降趨勢(圖7(e)(f))。這種現象可能是由于葡萄糖濃度降低和細胞密度增加而導致的代謝活性減少。這些實驗結果表明了數字孿生在追蹤細胞代謝方面的能力,這對于理解處在動態變化環境下的細胞活性變化至關重要。
圖7(h)(i)展示了通過利用數字孿生獲得的更新參數重新計算歷史的細胞密度、葡萄糖濃度和乳酸濃度的過程趨勢。由于離線數據僅反映了時間上離散的培養過程。通過重建整個培養過程,數字孿生使研究人員能夠更全面地研究歷史過程的條件,從而獲得對所研究的生物系統更詳細和準確的理解。
結語
隨著數字孿生在各行各業的發展,人們逐步意識到這是一個極具發展潛力的概念,很有可能會變革未來的生物制造模式。在物聯網的概念流行的時代,我們常說“萬物互聯”,現在我們已經能無感地享受到傳感器的普及給我們帶來的便利。TJX團隊認為,我們有機會迎來一個“萬物皆可計算”的時代,從基因表達、酶促反應,到細胞生長代謝,再到反應器流場仿真,從而建立代謝模型與計算流體力學耦合的多尺度、多層次模型,并且在工藝開發的各個階段為工藝開發人員提供建議。或許在不久的將來,上位機軟件的數據展示界面中出現各個參數的預測曲線,會成為一件稀松平常的事情。