在人工智能技術與生命科學深度融合的浪潮下,亦康(北京)醫藥科技有限公司(以下簡稱“亦康醫藥”)與超擎數智達成深度合作,通過超擎數智提供的基于AI算力集群+AI Engine人工智能開發平臺的AI整體解決方案,成功將癌癥藥物研發效率提升至新高度,為醫療健康和生命科學領域突破性研究注入強勁動能。
一、癌癥治療與新藥研發的困境和需求
癌癥治療經歷了三個關鍵階段,每一次進步都顯著提升了患者的生存率和治療精準度。
- 傳統化療利用細胞毒性藥物殺死快速分裂的癌細胞,但副作用較大,容易傷害健康細胞;
- 靶向藥物通過靶向特定的致癌基因或蛋白,如 EGFR 或 HER2,精準干預癌細胞生長信號。然而,癌細胞基因突變可能導致耐藥性問題;
- 免疫治療通過激活人體免疫系統,由 T 細胞(免疫細胞的一種)識別并消滅癌細胞。其中 T 細胞受體(TCR)需要精準識別癌細胞抗原,但由于抗原多樣性及個體基因差異,TCR 識別的有效性仍有提升空間。
T細胞通過TCR(T細胞受體)識別癌細胞抗原,但TCR-抗原匹配是一個復雜的生物信息學問題。傳統實驗方法或人為分析匹配TCR和癌細胞抗原難度極大:人類免疫系統的TCR種類極其龐大,以適應各種不同病毒的抗原,這種極大的多樣性使得人工匹配近乎不可能;癌細胞可能表達數千種突變蛋白,每種蛋白可包含多個潛在的抗原位點,識別最具免疫原性的抗原是個挑戰;TCR與抗原肽的結合依賴于氨基酸序列、空間結構、分子間相互作用,人工難以直接預測哪種組合最優。
隨著科學技術的不斷進步,通過整合化療、靶向藥物治療、免疫治療等多種治療手段,以及借助基因檢測、生物信息學等前沿技術,有望進一步提高癌癥治療的效果。基于Transformer的大模型成為解決TCR-抗原匹配問題,實現癌癥藥物研發的最佳方案。TCR和抗原均由氨基酸組成,其相互作用類似于自然語言處理(NLP)任務中的文本匹配,同時氨基酸序列的上下文信息極其重要,TCR識別不僅依賴于單個氨基酸,而是基于整個序列的結構和相互作用模式,Transformer架構正好滿足上述需求。
二、超擎數智×亦康醫藥:新藥研發的AI新范式
亦康醫藥位于北京經濟技術開發區,致力于藥物的體外生物活性篩選和功能驗證、臨床前體外、體內藥理藥效學評價及藥物臨床轉化研究,以藥理學、免疫學、病理學和創新藥物開發的知識和技術體系為核心,針對進入臨床實驗的創新藥物開展伴隨臨床實驗的生物標本檢測及預測療效的生物標志物開發,踐行精準治療。
過去,藥物研發過程中,蛋白質三維結構分析 是一個極其昂貴且耗時的環節。為了精準解析蛋白質的空間構象,研究機構通常依賴冷凍電鏡、X 射線晶體衍射等高精度成像技術。然而,這些傳統方法不僅設備昂貴,而且實驗周期長,嚴重制約了新藥的研發進度。
亦康醫藥作為專業從事生物醫藥研發外包服務和疾病精準治療的國家高新技術企業,在業務發展過程中,面臨AI技術創新資源不足、海量數據計算與復雜模型迭代效率低等挑戰。
超擎數智基于對生物醫藥行業痛點的深刻洞察,為亦康醫藥量身打造了“軟硬一體”的AI解決方案,助力亦康醫藥大幅提升TCR識別癌細胞抗原的精準度,為抗癌藥物和抗癌疫苗研發提速。亦康醫藥通過部署、使用超擎數智AI Engine人工智能開發平臺,采用Transformer架構,成功研發了亦康醫藥生物大模型,通過精準的TCR識別和強大的數據處理能力,能夠加速抗癌藥物和疫苗的研發進程,顯著提高研發效率,不僅提升了亦康醫藥在生物醫學領域的競爭力,也為整個行業的發展提供了新的思路和技術支持。
同時,亦康醫藥通過超擎AI Engine人工智能開發平臺,輕松實現AI集群的高效管理:
- 智能集群管理:實時監控 GPU 使用率、顯存占用、網絡流量,提升計算資源利用率。
- 算力動態調度:基于 AI 任務需求,智能分配計算資源,避免資源浪費。
- 全生命周期管理:支持 AI 計算集群的部署、運行、維護,保障高效穩定運行。
超擎數智為亦康醫藥設計部署高性能AI集群與無損AI網絡,通過強大的AI基礎設施,賦能亦康醫藥業務發展。亦康醫療的 AI 計算集群采用12臺8卡GPU 服務器,構建高性能計算平臺,支撐大規模 AI 模型訓練,AI網絡層面架構構成如下:
- 計算網絡:基于 Infiniband MQM9700 交換機,提供高帶寬、低延遲的 AI 訓練通信。
- 存儲網絡:基于 Infiniband MQM8700 交換機,加速大規模數據加載,支撐 AI 訓練。
- 管理網絡:采用以太網進行機器帶內帶外管理。
三、系統性創新,高效完成亦康醫藥項目交付
在為期四天的項目交付周期中,超擎技術團隊面對傳統機房改造、計算效能瓶頸及醫療健康數據合規三重挑戰,實施全棧式優化方案,通過系統性技術創新,成功為亦康醫藥構建支撐新藥研發的AI算力基座,實現項目的快速部署與高效運行。
針對原有機房純風冷設計難以滿足高密度GPU服務器對散熱的需求,為確保設備穩定運行,超擎技術團隊結合機房現有條件,對機房散熱進行了改造優化,通過調整氣流組織,優化風道布局,增加了高效散熱方案,使得PUE(電源使用效率)值維持在合理范圍內,提升了整體能效比。同時,采用精密空調等高效風冷技術,優化服務器機柜的布局,確保冷風均勻覆蓋計算節點,同時增強機房通風能力,以滿足長期穩定運行的要求。
在計算架構層面,為了進一步提高訓練效率,超擎技術團隊采用了FP8混合精度訓練引擎,大幅減少計算過程中的顯存占用,同時提升訓練吞吐量。這一優化方案不僅提升了訓練速度,還降低了能耗,使AI集群在計算能力和能源效率之間達到了最佳平衡。
尤為關鍵的是,生物醫藥領域對數據安全要求極為嚴格,尤其是病患基因數據、臨床試驗數據,須滿足法律法規合規性要求。在項目交付過程中,超擎技術團隊采用端到端加密、訪問控制策略,并在 AI 計算集群內部署了專用隔離網絡,確保數據不出域。此外,特別設計的本地化存儲方案,結合Infiniband 網絡加速數據傳輸,既滿足安全要求,又確保高效計算,實現從數據接入、計算到存儲的全生命周期防護。
在 AI 訓練過程中,數據傳輸延遲會極大影響模型訓練效率。超擎技術團隊通過優化Infiniband網絡拓撲結構,并啟用SHARP 技術(Scalable Hierarchical Aggregation and Reduction Protocol),減少GPU間梯度傳輸的帶寬消耗,實現跨節點的低延遲 All-Reduce,最終讓大模型訓練效率提升35%。
四、賦能新藥研發實現跨越式效能躍升
通過超擎技術團隊的創新和努力,本次交付成果顯著。亦康醫藥經過超擎數智 AI 整體解決方案賦能后,結合 Transformer 大模型,采用深度學習+生物計算的方法,癌癥新藥研發周期從36個月壓縮至6個月,成本降低67%,AI訓練后的模型可以在數小時甚至數分鐘內解析蛋白質三維結構,相較于傳統實驗方法,效率提升了千倍,在關鍵研發環節實現突破性進展。超擎數智“AI+醫療”技術路徑已形成可復制的行業解決方案,助推AI for Science研究進入新階段。
“超擎數智的AI解決方案不僅為亦康醫藥提供了核心技術升級,更助力亦康醫藥實現了一場醫藥研發范式的變革。”亦康醫藥創始人許春萍博士說,“過去需要跨部門長時間協作的分析任務,如今通過AI平臺即可快速高效完成,亦康醫藥團隊得以聚焦更具創新性的療法設計。”
對于亦康醫藥與超擎數智的成功攜手合作,超擎數智總經理唐春峰表示:“與亦康醫藥的深度合作,是超擎數智以AI賦能產業革新的重要里程碑。通過打造靈活、高效的算力底座與智能化工具鏈,我們助力亦康醫藥將前沿算法與生物學洞見快速轉化為臨床價值,這不僅驗證了技術方案的行業適配性,更讓我們看到AI驅動生命科學創新的無限可能。
此次合作,標志著超擎數智“AI+醫療健康”垂直場景應用的又一標桿項目落地。超擎數智致力于將AI基礎設施與行業Know-How深度融合,讓醫藥企業用好AI,為中國生物醫藥產業智能化轉型提供可復制的路徑。未來,超擎數智將持續深耕AI垂直場景建設,以創新的技術方案和敏捷的交付能力,與亦康醫藥等創新伙伴并肩前行。