網頁

星期六, 4月 20, 2019

Bio-IT World 探討數據隱私及安全問題

Sage 生物網絡公司首席通識長John Willbank。(周菊子攝)
            (Boston Orange 周菊子波士頓報導)18屆生物信息世界(Bio-IT World)在海港世貿大樓一連舉行三天後,圓滿落幕。3000多名研究人員,生物資訊專家,在分別為17項主題的280多場座談,演講中交流,分享行業新知,其中開幕主題演講的數據安全及個人隱私,最是引人深思。
John Willbank提醒人們注意,應用人工智能的一體
兩面。(周菊子攝)
            今年的會議,重點領域圍繞著人工智慧,公平數據,資訊,前沿計算等等,還首次推出創新實踐獎(first Innovative Practices Awards)”,選出AbbvieDiscngineNovo NordiskLinguamatics,以及Sentieon等這幾家公司,予以表揚。伴隨會議的攤位展示,還有最佳展秀獎(Best of Show)”
            開幕主題演講是Sage生物網路公司議事長(Chief Commons Officer)John Wilbanks開放科學:從理想到方法。他認為有開放的標準和數據來源,才能推動互通性,並加強保障研究結果中未察覺的偏差更少,正確性更高,能夠得到發表的研究成果,也的確達到一定程度。再者,如果研究者都洽當注釋了各自在研究中所使用的數據,他們的研究發現對其他研究者會更有用,甚至他們的數據都會有再使用價值。
NIH在2016年推出以100萬人為資訊蒐集對象的研究計畫。(周菊子攝)
John Wilbanks表示,如果不知道一項研究的數據來源及樣本數量,沒有可供對照檢驗的公開標準,其實很難做全面檢驗及判斷。NIH主任去年報告要蒐集一百萬人的生物樣本,基因數據及生活型態的我們所有人(All of US)”這研究計畫時,特地指出,已招募來參加計畫者,50%以上來自以往研究中涵括不足的少數族裔,就是為了要強調該研究照顧到所收集數據的平衡,以加強研究結果的不偏頗。
Add caption
John Wilbanks還指出,在目前的社會中,很多人為了使用某些社交媒體,或取得某些方便,都在不知不覺中授權的把個人隱私資訊交了出去,整個人類社會恐怕及早考慮,擁有這些資訊的機構或企業,將來如何應用這些數據,尤其是他們一旦變成壟斷性機構或企業時,會有什麼樣後果。
            會議中有各種議題的討論,新產品的發佈等,包括Genomenon 宣佈和谷歌(Google )合作,要在谷哥雲平台上提共該公司的基因組突變數據。
John Wilbanks強調科學必須具有正義。(周菊子攝)
Wayne州立大學的Weisong Shi認為,前沿計算目前處於穩定發展期,要發揮潛力,還需納進人工智能系統來應用。由於諸如Apache HadoopApache SparkTensor Flow,以及Alluxio等許多框架及系統已經成形,人工智能變得更容易實現。到2020年時,產生出來的數據,估計有55%會是不可能放到雲端去的邊緣數據,將來的走向會是從人工智能轉向拓展智能(extended intelligence)”
Add caption
神州數碼醫療副總裁莫維克談的是中國在醫療大數據上的成就(Medical Big Data Efforts in China)”。他從先有數據,取得資訊,形成知識,採取行動的多組學時代說起。他指出,中國的醫療大數據,優點是病人數量夠大,而且所有醫院的醫療記錄都依規定電子化了。該公司在兩年內就收集了300億筆數據資料。但缺點是使用的術語不一致,描述非結構性,內容有缺失。蒐集來的數據資料,大概只有10%品質和美國相當。
莫維克表示,該公司在中國醫療大數據中佔有極重要地位,分別和國家癌症大數據平台,國家罕見病登記系統,中國心臟病註冊處,精神分裂症的基因分析平台等關鍵數據平台合作。
神州數碼醫療副總裁莫克勤在Bio-IT World中談中國大數據。(周菊子攝)
以癌症為例,根據中國境內大數據,每年約有429萬餘人染患癌症,281萬人死於癌症,其中大多數人在查知染患癌症時,病情已達三期或四期,僅30.9%有五年存活率,和美國的發現患癌時多半處於一期,二期,治療後存活率5年以上有66%。莫維克指出,這顯示及早篩測可大幅改善現有狀況。中國國家衛生和計畫生育委員會,發改委分別於20162017批准通過了設立國家癌症中心,腫瘤數據中心,腫瘤大數據平台,大數據發展工程等。
神州數位醫療和博德研究院(Broad Institute)Congenica等機構在生物資訊分析等領域都有合作。

一連三天的會議,還有不少在展場的產品介紹,包括來自密蘇里州的IBM資深解決方案建築師李寧就在會場介紹該公司和博德研究院合作的數據目錄化項目。

沒有留言: