一、國家大數據戰略
數據是國家基礎性戰略資源,是21世紀的“鉆石礦”。黨的十八屆五中全會提出“實施國家大數據戰略”,國務院印發《促進大數據發展行動綱要》、工信部印發《大數據產業發展規劃(2016-2020年)》,全面推進大數據發展,加快建設數據強國。
2016年6月,國務院辦公廳印發《國務院辦公廳關于促進和規范健康醫療大數據應用發展的指導意見》,文件指出健康醫療大數據應用發展將帶來健康醫療模式的深刻變化,有利于提升健康醫療服務效率和質量。

二、生物醫藥主要大數據類別
生物醫藥產業鏈主要包括原料藥供應、生產研發、外包服務、醫藥商業、醫療服務、產業服務、金融服務、會展服務、數據服務、產業媒體等。
圖 生物醫藥產業鏈圖譜;
現階段,生物醫藥大數據主要來源于生產研發、醫療服務、產業服務三個版塊:
研發數據:主要指藥企或科研機構進行研發獲得的數據,包括從先導化合物篩選、臨床前、I-III期臨床、IV期臨床、上市后療效副作用跟蹤等數據;
醫療服務數據:主要指患者就醫產生的數據,如病例數據、檢查數據、用藥選擇等;還包括患者行為和感官數據,如家族病史及可穿戴設備、即時監控設備采集的健康數據;健康醫療行業數據,如監管數據、醫院評價數據、公共衛生數據等;
產業數據:主要是指生物醫藥產業企業、人才、藥品器械、投融資等數據。
三、生物醫藥行業典型大數據應用
1.生物醫藥研發大數據應用
(1)蛋白質組數據分析研究:基于大數據技術的發展與應用,已有許多具有創新性的數據分析方法得以廣泛運用,為保證蛋白質組學研究的健康、持續、高效發展,需加強不同層面組學數據的綜合分析能力;
(2)單細胞數據分析研究:在當前階段,能夠實現單細胞基因組數據分析的高效、簡潔的方法較少,在單細胞異化分析領域甚至存在大量的分析技術空白;
(3)基因組數據分析研究:通過系統化的數據分析模型建設,實現了對基因組、轉錄組數據的綜合性分析,最終實現生物系統研究向著標準化、深入化方向有效發展;
(4)宏基因組數據分析研究:生物醫學方面的宏基因組項目呈現出井噴態勢,如何通過科學、高效、準確的數據分析進行結果測算是廣大科研人員需面對的首要問題;
(5)生物醫學圖像數據分析:隨著光學成像儀器和高精度細胞操作技術的進步,生物醫學圖像相關數據急劇積累,但還缺乏公認的、標準化的生物醫學圖像存儲和處理平臺;
(6)基因生物學大數據應用:致病基因通路分析,利用大數據分析技術可發現不同階段、不同位置的遺傳控制因素,從而進行有針對性的治療;序列相似性分析,使用非線性相關統計法、神經網絡、分類及聚類算法進行相似性分析可以發現核酸序列之間的異同點。
2.臨床醫學大數據應用
(1)致病因素關聯分析:通過檢索病案數據庫中大量的病人病情信息以及病人的個人信息,使用聚類分析算法進行分析,以發現某疾病與外在環境因素的潛在關系,指導患者關注這些致病因素,有效預測疾病,降低疾病發生率;
(2)提高診斷準確率:疾病的致病因素錯綜復雜,而且不同階段癥狀各不相同,不同疾病之間有時會具有高度相似的病癥特征,大數據分析技術可應用于疾病快速高效的病情診斷。Kusiak等使用大數據處理的相關算法對實體性肺結節進行診斷,準確率高達100%;
(3)疾病預測應用:診療大數據可為某種疾病的發病史以地區分布性提供線索;可對疾病的遺傳性和非遺傳性進行分析,為治療人員提供相應防治措施;可對某些疾病發展趨勢進行預測;還是對傳染性疾病進行預測、預警的利器;
(4)醫學影像應用:在醫學領域的影像(如CT、MRI)分析中,采用大數據分析技術能夠對所得出的影像結果進行分析,進而對病人的疾病做出正確的診斷;
(5)藥物副作用分析應用:采用大數據分析技術,通過互聯網對各家醫院所出現的藥物不良反應進行挖掘,使醫護人員在用藥時提高警惕,保證病人合理用藥。
3.健康醫療行業/生物醫藥產業大數據應用
(1)健康醫療行業治理大數據:居民健康狀況等重要數據的精準統計和預測評價,有力支撐健康中國建設規劃和決策;醫院評價體系,完善現代醫院管理制度,優化醫療衛生資源布局;對醫療、藥品、耗材等收入構成及變化趨勢的監測機制;
(2)公共衛生大數據應用:公共衛生業務信息系統建設;疾病敏感信息預警機制,提高突發公共衛生事件預警與應急響應能力;集成多方監測數據有效評價影響健康的社會因素;開展重點傳染病、職業病和醫學媒介生物監測,有效預防控制重大疾??;
(3)生物醫藥產業大數據:準確把脈生物醫藥產業發展狀況,為產業規劃制定、引導產業集聚式發展提供支撐;為園區或區域提供精準招商服務,降低招商成本、提升招商效率;為產業企業提供專家人才評估、流動監測與預警服務;基于供需精準匹配的創新資源一站式服務,促進生物醫藥產業創新服務發展。
四、生物醫藥產業大數據應用展望
在產業互聯網快速發展基礎之上,大數據中臺建設將加速產業鏈各環節數據積累與集聚,大數據應用也將有更多的需求場景,為企業提升效率、降低成本、縮短周期等提供更有效的措施。同時,基于大數據,結合云計算、人工智能、區塊鏈等新一代信息技術,可進一步促進生物醫藥產業發展與突破。