在COVID-19大流行爆發(fā)后不到1年,專業(yè)人員從診斷第一例病例到接種疫苗。除其他突破外,基因組學進步被廣泛認為是對疾病的快速理解和疫苗的快速部署。
自2003年對第一個全人類基因組進行測序以來,基因組學在醫(yī)療保健和生命科學行業(yè)已經變得司空見慣,導致基因組數據呈指數級增長。每個人類基因組包含的數據足以填滿200本電話簿。這些數據中蘊含著改變生活的發(fā)現,包括對疾病原因的了解,這些發(fā)現可以導致治療。但是疾病原因 - 通常是“錯別字”或基因序列突變 - 可能很難找到;基因組數據受到高度監(jiān)管并存儲在孤立的數據湖中,進一步阻礙了研究。
面臨這一挑戰(zhàn)的是Lifebit Biotech Ltd.(Lifebit瑞威生物科技有限公司),這是亞馬遜網絡服務(AWS)的精選咨詢合作伙伴。Lifebit與生物樣本庫、研究機構和制藥公司合作,提供分析臨床基因組數據集的解決方案,以加速藥物發(fā)現、診斷、疾病監(jiān)測、藥物反應預測和健康模型。
解鎖對孤立基因組數據的訪問
Lifebit CloudOS 是一個完全聯合的云操作系統(tǒng),它使用 AWS 解鎖臨床基因組數據,用于藥物和生物標志物的發(fā)現。這促進了更大的研究合作,使藥物開發(fā)和疾病預防迅速增加。在COVID-19大流行開始時,Genomics England(GEL)轉向Lifebit CloudOS。作為群體基因組學的先驅,GEL負責監(jiān)督100,000個基因組計劃,這是一個癌癥和罕見病全基因組的隊列。
早期的基因組學研究依賴于更少,更小的數據集,該行業(yè)可以依靠集中式技術來分析這些數據。因此,數據保護法規(guī)更加寬松,協(xié)作更易于管理。但由于基因組數據已成為歷史上最大的數據來源,該系統(tǒng)無法支持今天的研究。“數據集中化不再可行或負擔得起,”Lifebit商業(yè)副總裁Thorben Seeger說。“數據太大,無法有效移動,許多法規(guī)禁止數據離開組織、州或國家。因此,這些數據集中有80-90%無法用于研究。“GEL被廣泛稱為基因組學的'諾克斯堡',”Seeger說。“但是當你鎖定數據時,幾乎不可能訪問或與其他數據組合。
Lifebit 重新設計了用于保護數據的傳統(tǒng)模型,將其計算引擎和分析功能引入數據本身。這種新模型由 Amazon Elastic Compute Cloud (Amazon EC2) 提供支持,Amazon Elastic Compute Cloud (Amazon EC2) 是一種 Web 服務,可在云中提供安全、可調整大小的計算容量。“我們正在 AWS 上的客戶自己的環(huán)境中部署我們的尖端研究,”Seeger 說。“每個用戶都會收到一個潔凈室環(huán)境,以分別訪問和分析數據。完全托管的服務在不犧牲安全性或控制力的情況下提供了最大的研究效用。”
Lifebit 使用 AWS 高度可擴展的云功能來獲得所需的計算能力,以適應數據集大小與結果之間的指數關系。該公司處理存儲數據超過 100 PB 的項目,需要數十億個虛擬 CPU 小時。“我們使用整個 AWS 計算流程來更快、更高效地運行生產管道,”Seeger 說。“這一點至關重要,因為GEL需要快速的數據處理才能更快地獲得見解。
建立安全、強大的協(xié)作服務
在COVID-19大流行期間,GEL與英國政府啟動了一項計劃,向八家領先的制藥公司以及研究機構提供隊列,以推動疫苗,治療和早期檢測研究。該隊列包括來自20,000名COVID-19重癥病例患者和15,000名輕度病例患者的測序基因組,以及來自100,000個基因組計劃的數據。然而,GEL需要一個聯合數據分析系統(tǒng)來使該隊列可供多方使用。“我們正在建立一個新的研究環(huán)境,我們需要一家能夠在7-8周內上線的公司,”GEL首席商務官Parker Moss說。
Lifebit 基于 GEL 現有的 AWS 架構構建,可在 3 個月內交付完全實時的系統(tǒng)。如今,制藥公司和研究人員可以訪問隊列并連接自己的私有數據集。“用戶的外部數據不會進入GEL環(huán)境,”Moss說。“但是,通過聯合鏈接,您可以像研究數據在一個地方一樣進行研究。這是一個非常強大的價值主張。該系統(tǒng)可節(jié)省時間并提供額外的保護。“數據保留在客戶的環(huán)境中,所有 AWS 安全功能都能確保數據安全,”Seeger 說。
在系統(tǒng)上,研究人員使用自動化工具在幾秒鐘內安全地查詢、分析和協(xié)作處理大型數據集。“我們正在彌合安全性和可用性之間的二分法,”Seeger說。“這促進了GEL等公共機構,其他領先群體,研究機構和私人機構之間的全球合作。
在 AWS 上以基因組學的速度進行擴展
Lifebit CloudOS使基因組研究更容易獲得。“云與我們的數據環(huán)境相結合,是偉大的民主化者,”Seeger解釋說。“數以百萬計的研究人員可以按需訪問和執(zhí)行大數據分析 - 只有少數訓練有素的高性能計算專家以前可以做到這一點。
至關重要的是,Lifebit 客戶及其用戶使用 Amazon Simple Storage Service (Amazon S3) 獲得幾乎無限的存儲,該服務可提供行業(yè)領先的可擴展性、數據可用性、安全性和性能。一個完整的人類基因組相當于120-300 GB的數據,Lifebit正在對超過1000萬名患者運行數據庫進行模擬,這些患者具有數千個臨床和表型變量。“連接全球數據集正在推動種族基因組多樣性,”Seeger說。“這有助于我們了解一般的疾病,但也使我們能夠迎合以前服務不足的人群。
在 AWS 上,Lifebit 提供了一個系統(tǒng),該系統(tǒng)促成了生命科學史上最重要的云計算交易之一。“AWS 在醫(yī)療保健和生命科學市場的普及非常有幫助,”Seeger 說。“我們已經從 AWS 看到了難以置信的靈活性,它在倫敦地區(qū)幫助我們設置了 GEL 聞名遐邇的安全。AWS 的規(guī)模和全球影響力對于我們追求大型政府計劃具有巨大的戰(zhàn)略意義。
加速藥物研究和疾病預防方面的全球合作
通過使用 AWS,Lifebit 使 GEL 能夠快速為 COVID-19 數據和分析提供研究環(huán)境?,F在,Lifebit正在與各國討論如何結合數據集以促進研究成果并加快癌癥和罕見疾病的藥物開發(fā)。“我們的聯合分析系統(tǒng)不僅只是為了服務一個國家或一個疾病隊列的單一目的而存在,”Seeger說。“它與世界各地的其他隊列合作,使這個科學領域成為有史以來最具協(xié)作性的領域。
Lifebit Biotech是人口基因組學軟件和人工智能藥物發(fā)現的全球領導者。它在北美,歐洲,中東,非洲和亞太地區(qū)開展業(yè)務,為人口基因組學計劃,生物銀行,研究和制藥公司提供支持。
◊ 在不到3個月的時間內推出聯合數據分析系統(tǒng)
◊ 處理超過 100 PB 的項目數據
◊ 支持對全球不同數據集的協(xié)作研究
◊ 遵守數據隱私法規(guī)
◊ 在客戶自己的環(huán)境中執(zhí)行分析
◊ 高效編排數十億個 CPU 小時
◊ 使生物信息學分析的可及性民主化
◊ 實現可持續(xù)的自籌資金商業(yè)模式
(內容來源網絡,如有侵權請聯系刪除)