在過去三年裡,這個可以說是世界上最具競爭力的行業之一的 10 家公司一直在以一種不尋常且一度不可想像的方式共享數據。
一個由歐盟資助的利用人工智慧 (AI) 促進藥物發現的計畫剛剛結束,該計畫背後的法裔美國獨角獸公司 Owkin 表示,該計畫已顯示出改變製藥業的潛力。
其目的是加快新療法的發現和開發,這些新療法通常需要數億歐元的研究資金,並且需要 10 多年才能進入市場。
葛蘭素史克(GSK)、阿斯特捷利康(AstraZeneca) 和諾華(Novartis) 等大型製藥公司合作開發了名為MELLODDY 的項目,該項目允許Owkin 的機器學習模型對其機密研究進行訓練,而製藥商不必擔心這些寶貴的資料會離開自己的伺服器。
「我們沒有收集數據,而是讓模型從一家製藥公司轉移到另一家製藥公司,」Owkin 首席數據長 Mathieu Galtier 在接受 Euronews Next 採訪時表示。
「這是一種交響樂。這就是為什麼我們喜歡世界旋律;我們精心安排每個模型如何在這家製藥公司上學習一點,然後在另一家製藥公司上學習一些」。
還有很多東西要學習。
MELLODDY 平台在數十億個工業實驗數據點上訓練人工智慧模型,記錄了 40,000 多項生物測定中超過 2000 萬個化學小分子的行為。
藥物發現的“探照燈”
Owkin 的目標是利用所有這些數據,使其機器學習工具更加智能,並能夠更好地預測某種化合物如何與某些蛋白質發生反應或結合,從而預測哪種化合物適合某種藥物或治療標靶。
加爾蒂埃說,這就是人工智慧有可能從根本上改變製藥業及其發現新療法的方式的地方。
「過去,我們確定了一個目標,說這是我們想要活化或抑制的蛋白質。然後我們會嘗試世界上所有不同的化合物,我們會隨機做事,」他說。
「現在人工智慧的目標是找到建議新分子的演算法,這些演算法將為你提供這種方法的探照燈」。
Owkin 成立於2016 年,去年在法國製藥商賽諾菲(Sanofi) 投資1.6 億歐元後,該公司達到了「獨角獸」地位,即一家新創公司的估值超過10 億美元(9.76 億歐元) 。
Owkin 開發了人工智慧工具,將其分發到醫療和研究中心,與本地伺服器合作存取用於訓練演算法的資料。
由於 Owkin 不在中央伺服器上收集數據,因此 MELLODDY 平台使用區塊鏈技術,並在所有貢獻的製藥合作夥伴中分佈分類賬,以記錄其活動。
MELLODDY 項目該計畫由創新藥物倡議 (IMI) 資助,該倡議是歐盟與歐洲製藥工業協會聯合會 (EFPIA) 之間的合作夥伴關係。
該計畫的負責人表示,該舉措不僅表明大型製藥公司可以合作,而且以這種方式共享數據也更加有效。
該試驗證明,MELLODDY 計畫使用的「協作」模型在將分子分類為具有藥理學或毒理學活性或無活性時,平均比製藥商的獨立 AI 模型好 4%。
資料共享也使模型在觀察新型分子(稱為「適用範圍」)時做出自信預測的能力提高了 10%。
「合作比單獨行動更好,這是我們從整個計畫中得到的主要訊息,」加爾蒂埃說。
製藥遊說團體 EFPIA 對此表示同意,並表示該試點計畫可以說服製藥商合作並開放數據,以促進藥物發現。
EFPIA 發言人告訴Euronews Next:“MELLODDY 展示了在不損害知識產權的情況下安全協作建模的可行性”,並補充說該項目“使每個合作夥伴能夠為其大多數發現分析獲得更好的預測模型」。
Galtier 表示,雖然預測能力提高4% 對於外行人來說可能聽起來不那麼令人印象深刻,但這是基於數以萬計的藥物發現實驗數據的平均值,而且它可能掩蓋了其中一些實驗的更顯著的提升。
「真正有影響力的將是少數改善超過 20% 的藥物,」他說。
可疑藥品
在專案的早期階段讓製藥公司加入仍然非常棘手。
歐金不僅必須說服科學家分享他們的數據,還必須向公司的法律團隊和安全專家保證數據是安全的。
這可能會對他們最初同意共享的資料類型產生影響,其中一些資料可能不是最相關或最有洞察力的。
「如果你把自己放在製藥公司的立場上......你會從一些安全的東西開始,比如他們 10 年前所做的實驗,」Galtier 說。
然而,隨著專案的進展,共享了更多數據,包括製藥商目前正在進行研究的所謂「主動實驗」的數據。
但加爾蒂埃實際上對他們提供的底層數據一無所知。該平台的任何其他運營商也沒有——這就是該平台構建的全部前提。
「我確信,如果奧金或我有權查看數據,製藥公司就不會加入,他們會說不可能,」加爾蒂埃說。
人工智慧模型只是從一個製藥數據集轉移到另一個製藥數據集並當場學習;它保留有關數據的統計信息,例如平均值,但不保留有關其訓練的基礎數據的信息,例如所研究的實際化合物。
「我們確定了這一點。我們有一些學術合作夥伴試圖攻擊模型、提取資訊……我們確保這是不可能的。這是製藥公司的先決條件之一,」加爾蒂埃說。
Owkin 表示,MELLODDY 的成功推出讓大型製藥公司確信以安全方式共享資料的可能性,現在正計劃為願意使用相同聯邦學習共享資料的製藥商創建更專業的「通路」或「聯盟」技術。
共享的數據將超越藥物和小分子,包括蛋白質設計、抗體和患者數據——所有這些潛在的洞察力都有助於確定癌症、糖尿病或阿茲海默症等神經退化性疾病的新療法。
加爾蒂爾表示,解決製藥商對保密的擔憂開闢了一個新的合作空間,他稱之為「合作請願」:不是競爭,不是合作,而是介於兩者之間的東西。
「我們證明它確實有效。這是第一步,但這是非常好的第一步」。