1 精準醫學與大數據 楊永正 國立陽明大學生物醫學資訊研究所 1

2 這是一個顛覆傳統的時代 2

3 產生破壞式革新的技術 : 改變生活 商務 與全球經濟的進展 Mobile internet ( 移動互聯網 ) Automation of knowledge work The internet of things Cloud technology Advanced robotics Autonomous and nearautonomous vehicles Next generation genomics Energy store 3D printing Advanced materials Advanced oil and gas exploration and recovery Renewable energy - by McKinsey Global Institute, May,

4 APP 大幅增加 生活的方便性 ils?id=com.mywoo.busplus& hl=zh_tw uk/news/amazon-androidappstore-briefly-opens-outsideus

5 移動互聯網的成功需要 開放數據 (open data) 5

6 政府機構有明確的開放政策, 並提供 使用說明, 可擴大民間參與的機會 想像若能串接公車時間與電影開演時間, 是否讓你更容易規劃時程? 6

7 開放數據的品質影響佈署之方便性 make your stuff available on the Web (whatever format) under an open license1 make it available as structured data (e.g., Excel instead of image scan of a table)2 use non-proprietary formats (e.g., CSV instead of Excel)3 use URIs to denote things, so that people can point at your stuff4 link your data to other data to provide context5 7

8 4G (LTE) 網路是否能取代 wifi 尚不清楚, 但 無線上網 已是生活的一部份 Sri Lanka will be the first country in the world to have universal Internet coverage. 8

9 當無線上網成為生活的一部份, 萬物 皆可上網, 物聯網儼然成型 Mobile internet Automation of knowledge work The internet of things ( 物聯網 ) Cloud technology Advanced robotics Autonomous and nearautonomous vehicles Next generation genomics Energy store 3D printing Advanced materials Advanced oil and gas exploration and recovery Renewable energy - by McKinsey Global Institute, May,

10 物聯網 : 越來越多的設備可以透過 網路收集各種有用的數據 大數據 BIG DATA 10

11 當數據大到與母群體差不多, 桌機的計算力比以前的伺服器更大, 還需要取樣嗎? 11

12 大數據的探採 (mining) 可以找到意想不到的關聯性 Story of Walmart in 90 Put beer and diaper together on the shelf Will increase sales, especially on Friday Story of Target in 2012 (NY Times) Angry father: why do you mail coupon for baby-related merchandize to my daughter, who is not 18 yet. Grateful father: thank you for telling me my daughter is probably pregnant 12

13 大數據讓奧巴馬總統贏得選戰, 在各行各業都將如此 王可言 (2013) 全球物聯網技術與智慧產業發展趨勢 13

14 行動裝置的輸入不方便, 很難做複雜的 事, 所以需要與電腦相通才會方便 Mobile internet Automation of knowledge work The internet of things Cloud technology ( 雲端技術 ) Advanced robotics Autonomous and nearautonomous vehicles Next generation genomics Energy store 3D printing Advanced materials Advanced oil and gas exploration and recovery Renewable energy - by McKinsey Global Institute, May,

15 雲端技術提供電腦與行動裝置間 跨平台的數據儲存與交換空間 只要將檔案儲存在 Dropbox 上, 便可從電腦 手機 或平板電腦任意存取 在任何地方都能編輯文件 自動匯入相片 和分享影片 box.com/ 15

16 哪一種比較省錢? mercedes-benz-s-class-production Google s data center 16

17 當使用計算力像是用電, 需要時打開, 不用時關掉, 有必要自己擁有發電廠嗎? A smart power grid 17

18 有字天書記載生命的故事, 但是一種米 養百樣人, 人人都有自己的故事 Mobile internet Automation of knowledge work The internet of things Cloud technology Advanced robotics Autonomous and nearautonomous vehicles Next generation genomics ( 新世代定序 ) Energy store 3D printing Advanced materials Advanced oil and gas exploration and recovery Renewable energy - by McKinsey Global Institute, May,

19 Angelina Jolie and genetic testing Fox, J.L., Nat Biotechnol, (10): p opinion/my-medical-choice.html?_r=0 19

20 定序價格急速滑落, 讓我們有機會看 到人的差異, 也造成鉅量數據的累積 Need only 1,000 USD to sequence a human genome by the end of

21 定序儀越來越小, 最終將 進入醫院的檢驗中心 3700 Ion torrent 21

22 為什麼有些人吃藥會有嚴重的副作用? 甚至造成藥害 Carbamazepine 是抗癲癇與治療三叉神經痛用藥, 有些人吃後, 會引發史帝文生氏強生症候羣 (SJS) 帶 HLA-B*1502 變異的病人, 得到 SJS 的風險甚至是帶正常基因者的 1 千 5 百倍, 嚴重者會造成死亡 人的體質不同 Picture was taken from 22

23 人與人的序列不盡相同, 造成體質差異 許多變異是 中性 的, 不會造成嚴重後果, 只會使酵素活性變化, 有時甚至完全沒有造成影響 23 23

24 雖然 預防勝於治療, 只是千金難買早知道 基因型 分子機制 表現型 Wild type MDM2 T T mdm2 p53 Tumor formation 動情激素接受體必須存在, SNP309 才會有影響 Sp1 SNP309 on MDM2 G G 309 若由序列能預卜未來, 就可事先預防 mdm2 p53 Tumor formation Bond Sp1 GL, 和 ERα Levine 共同影響 AJ. (2007) A single nucleotide polymorphism in the p53 pathway MDM2 interacts 基因表現 with : G-allele gender, environmental stresses and tumor genetics to influence 時 MDM2 cancer 會增加 in humans., T-allele Oncogene. 26, Review 時減少 Crystall ball picture was taken from 24

25 同樣是乳癌, 每個人的腫瘤 卻有不同的突變 Genes (1,137) Breast cancer (55 patients) Plotted based on the data described in Science, 314, (2006) Science 318, (2007) 25

26 個人化的醫療將不再是夢 ( 未來基因研究將成為醫學的一部份, 而不再是另一學門 ) 1. Order Patient Physician Sequencing center 自然人憑證 & 健保卡 醫事人員卡 4. three-factor authenication 5. Most updated genotype and related medical information 定序不是一切, 更重要的是建立基因與疾病, 或基因與藥物間的關係 2. Deposit personal genomic seq. Info. center for translational medicine ( 轉譯醫學資訊中心 ) Biomedical knowledgebase 3. Analysis and data collection 26 26

27 四種破壞式革新技術的衝擊 Mobile internet ( 移動互聯網 ) 開放資料與連結性 => 帶動 利用數據 的習慣 The internet of things ( 物聯網 ) 提供收集多樣資料的潛力 => 帶動 循證決策 (evidence-based decision making) Cloud technology ( 雲端技術 ) 什麼都要能自動化 => 帶動 流程改造 Next generation genomics ( 新世代定序 ) 高解析度的測量, 帶我們進入微觀的世界 27

28 越來越多的疾病被發現與遺傳有關 人類基因組計畫讓遺傳學研究的解析度大幅增加 簡單的疾病 : 致病基因複雜的疾病 : 危險因子 Left and middle figures: com/human_genome_project.html Right figure: cgi/content/full/291/5507/1221/f1 28

29 有系統地收集同一個體的各種相關資訊, 才能避免個體間差異造成的影響 29

30 沒有一個團隊有那麼多錢, The genomes 可以收集所有的資訊 Encyclopedia of DNA elements (ENCODE) The cancer genome atlas (TCGA) Library of Integrated Network-based cellular signatures (LINCS) Stem Cell database (StemDB), etc. National health insurance research database Taiwan biobank 30

31 31

32 臺灣研究生物醫學的優勢 : 全世界唯一的全民健保資料庫 32

33 電子病歷救經濟? the-hitech-act-helpful-or-harmful Health Information Technology for Economic and Clinical Health (HITECH) Act,

34 個人的健康數據, 將隨著物聯網技術 的進步, 而越來越有應用價值 Sources: Terry B.J. Kuo, Kuan-Liang Kuo, Norden E. Huang 34

35 移動健康 (mobile health, mhealth) 將成為生活的一部份 35

36 台灣的健康雲計畫包括 保健 醫療 與照護三朵小雲 病前的健康服務 病中的健康服務 病後的健康服務

37 你放心將健康數據放在雲端嗎? 道高一尺, 魔高一丈 Hundreds of intimate pictures of female celebrities, including Oscar-winning actor Jennifer Lawrence, were leaked overnight after being stolen from their private collections and posted on infamous web forum 4chan... Final Destination actress Mary Elizabeth Winstead - another of the hacking victims - claimed that she had deleted her intimate shots years earlier, suggesting that fully removing icloud images may be more complicated than previously understood, or that the hacker had been compiling the images for some time. 37

38 天下沒有不可破解的技術 病人需要有隱私 圖片取自 html/managallery/ysl/ysl0005.htm 立委林進興等 12 位醫師公佈胡志強病歷, 台中市政府醫師懲戒委員會, 做出廢照一年, 或是接受醫學倫理教育的處分, 但有八成網友認為這樣的處分太輕了! ( list.asp?no=alisa ) 圖片取自 FILE_DB/newsphoto/alisa/200512/ alisa jpg 必須培養從業人員的職業道德與全民的道德觀 38

39 生醫領域的開放數據多數可以串接 若能串接數據 (Linking open data, LOD), 將增加開放數據的可用性 39

40 串接資料可以回答許多問題 例如研究冠狀動脈繞道手術的醫療品質研究時, 發現醫師手術死亡率與其手術量呈負相關 方法 ( 一 ): 取得 可整合的 健保資料與死因檔後, 根據需要自行整合 方法 ( 二 ): 由健保資料庫中, 取得醫師與病人間的關係, 只要求部份 ( 指定 ) 病人的死因 是否有第三種方法, 例如虛擬整合等, 則有待研究 ELSI = ethical, legal, and social issues 40 40

41 親人有同樣的基因, 卻不見得人人得同樣的病 健康資料加值應用實例介紹, 衛生署統計室,

42 衛生福利部統計處衛生福利資料統計應用管理審議會健康署疾管署健保署...去個人化 / 統計分析 / 資料處理加值應用協作中心加值應用平台健康指標資料庫查詢介面申請審核慈濟台中北醫台大成大高醫長庚陽明基礎資料庫需求者研究分中心法規研析組資訊安全組統計發展組社家署健康資料加值應用協作中心組織架構 f_list_no=812&fod_list_no=4789&doc_no=

43 台灣人體生物資料庫透過 Taiwan view 網 站, 已開始釋出基因型相關資訊 43

44 以證據為基礎的醫學 (evidence-based medicine) 任何的處置都要依據證據, 而臨床試驗的結果比研究的推論更直接 44

45 由美國國家衛生院導入臨床資訊管理系統 (Clinical Informatics & Management System) 試驗紀錄需 CSIS (Clinical Study Information System) 資料整合需 GUID (Global Unique Identifier) 檢體管理需 STAMS (Specimen Tracking & Management System) Patient 計畫審核需 PTMS (Protocol Tracking and Management System) Clinical information Informed consent Survival % Analysis year Specimen High throughput data 45

46 使用別人收集的數據, 最怕有 垃圾進, 垃圾出 的情形 若要共享數據, 必須有標準作業程序, 與品質管控機制 46

47 台灣已有超過 80% 的疾病臨床試驗聯盟使用 CSIS ( ) 47

48 臺灣版 CSIS 有多種確保數據品質的機制 Hospital information system(his) Image (PACS server) Sequenom/ genotype or mutation data Randomized treatment assignment Blood pressure or other data on cloud Pedigree data from an interview Logic checking & data freezing 48

49 在可以無線上網處, 即可使用行動裝置填寫問卷 49

50 檢體是連接臨床研究與基礎研究的橋樑 Box1 中第一個檢體的資訊 Box1 的存放情況 50 50

51 如何做嚴謹的匿名化? Local Site (holds Subject-GUID Keys) Enrollment & Consent Collect Data with GUID Private Key PII Informatio n Systems Hash Codes GUID De-identified Data GUID Server (Hash Codes DB) PII GUID Anonymized Study Database or Repository 51

52 可利用讀卡機收集健保卡中的 人口學資料編 GUID 碼 姓名 身份證字號 出生年 月 日 性別 2 1 插入健保卡 減少人工輸入產生的錯誤 52

53 個人資料由醫師自行保管,CSIS 中只存 放編碼後的資料, 以符合 GCP 的規定 1 2 Querier 程式有編輯與查詢功能, 並有各種安全防護機制, 避免洩露個資 3 登錄到 CSIS 使用之例子均為人工合成的資料, 沒有洩露個資的問題 53

54 虛擬人體生物資料庫採資料集中, 檢體分散的方式運作 Log in for users, research nurses, managers, PI, Co-PIs, and user committee 背景, 組織與架構, 合作醫院, 使用者委員會 審查原則, 申請流程, 註冊, 查詢申請進度, 收費標準, 收費方式 檢體申請表, 送審文件清單, 檢體領取單下載, 檢體領取委託書 現有檢體量及類別, 臨床 病理及流行病學資料 54

55 相同的人在不同醫院會編出不同的 GUID-T, 在資料匯整時會檢查是否是同一人 55

56 婦癌人體生物資料庫的成功案例 56

57 整合基因表現與臨床數據尋找生物標記 Survival curve of biomarker A and biomarker B combinations Survival curve of biomarker A or B Survival % survival 長期追蹤可以顯示趨勢 year P= n=249 High expression Low expression B + B - A A

58 讓存活率降低的 基因對 可能參與 Epithelial-mesenchymal transition (EMT) EMT picture was taken from 58

59 歷史可以幫助我們瞭解未來的趨勢 Genome proj began 1990 Reorganization of genome proj 2000 Celera 1998 End of genome proj.2003 NIH translational medicine 2004 Next generation sequencing 2007 Concept of precision medicine National Research Council, 2011 Obama s precision medicine initiative 2015 American Recovery and Reinvestment (ARRA) Act & Health Information Technology for Economic and Clinical Health (HITECH) Act, 2009 NIH Big Data to Knowledge (BD2K) initiative,

60 由大數據到知識 (Big Data to Knowledge, BD2K) UCSD is inviting Taiwan to establish a data discovery index jointly Dear Prof. Yang, NIH is calling for the establishment of a consortium to create a "Data Discovery Index" to facilitate sharing and reuse of biomedical data. Please let me know if you are interested. We sincerely hope that you can join this consortium and we think your support is crucial to the approval from NIH. Also, it would be great if you can help us reach out to other Asian countries, like Japan, China, Hong Kong, and South Korea. 60

61 將基因體分析的結果 轉化為醫學上的應用 Provide case and control, clear phenotype definition Collect clinical information 臨床研究 (bedside) 基礎研究 (bench top) Interpret clinical information Provide mechanism and idea for therapeutic intervention Picture was from 61

62 利用外顯子 (exome) 定序, 確認造成疾病的突變位點 第 22 型脊髓小腦萎縮症 Hsu et al (2011) Prioritizing disease candidate genes by a gene interconnectedness-based approach. BMC Genomics, 12: S25 Lee et al (2012) Mutations in KCND3 cause spinocerebellar ataxia type 22. Ann. Neurol. doi: /ana

63 此突變在多各族裔的病人身上都有觀察到, 因此 Nature Reviews Neurology 特別撰文介紹 2015/9/9 63

64 網路生物學的啟發 : 致病基因的預測 Thirty-one legged race archives/life/action/06-02/ act0602.html Lim et al. (2006) Cell 125, Pathways / regulatory circuit 64

65 利用病人 cohort, 預測疾病的形成機制 精神分裂症 Recent evidence indicates that enhancing N-methyl-d-aspartate (NMDA) neurotransmission with the treatment of NMDA/glycine site agonists, such as d-serine, or a glycine transporter-1 (GlyT-1) antagonist, N-methylglycine (sarcosine), can improve symptoms of schizophrenia. GlyT-1 inhibitor is more efficacious than the NMDA/glycine site agonist in treatment for schizophrenia, including life quality and global function, at the dosages tested. Hsu et al (2008) A protein interaction-based model for schizophrenia. BMC Bioinformatics Lane HY, Lin CH, Huang YJ, Liao CH, Chang YC, Tsai GE. (2009 ) Int J Neuropsychopharmacol. 4,

66 欲達到精準醫學的目標, 需要建立 知識網路 (knowledge network) Toward Precision Medicine: Building a Knowledge Network for Biomedical Research and a New Taxonomy of Disease. An expert consensus report prepared by the Committee on a Framework for Developing a New Taxonomy of Disease 共享數據, 一起成長 一起進步 2011 The National Academy of Sciences 66

67 臨床試驗聯盟 藥物基因體學實驗室 (PGL) Biospecimen Biospecimen bank Sequenom / OncoCarta analysis Report Decision making 整合基因突變與臨床信息, 供醫師決策使用 CSIS Genotype database 生物資訊與生物統計中心 (BBC) 67

68 美國總統 2015 宣示推動 精準醫學 Collins, F.S. and Varmus, H. (2015) A New Initiative on Precision Medicine. The New England journal of medicine. 68

69 精準醫學 強調個人化醫療 與轉譯醫學的整合 Precision medicine is an emerging approach for disease prevention and treatment that takes into account people s individual variations in genes, environment, and lifestype. The precision medicine initive will generate the scientific evidence needed to move the concept of precision medicine into clinical practice. Revised from 69

70 以分子層次的證據做癌症治療決策參考 Roychowdhury et al (2011) Personalized Oncology Through Integrative High- Throughput Sequencing: A Pilot Study. Sci Transl Med. 3(111): 111ra121 70

71 短期與長期目標 短期目標 強化癌症研究 Innovative clinical trials of targeted drugs for adult and pediatric cancers Use of combination therapies Knowledge to overcome drug resistance 長期目標 收集研究對象群 (cohort) Create a research cohort of over 1 million American volunteers who will share genetic data, biological samples, and diet/lifestyle information. All linked to their electronic health records if they choose. Pioneer a new model for doing science that emphasizes engaged participants, responsible data sharing, and privacy protection. 71

72 整合生醫資訊, 開創利用大數據的新世代 生物資訊研究 基因型 - 基因體 - 蛋白質體 共通的資訊平台 轉譯醫學 倫理 法律 社會問題的共識 醫學 / 衛生資訊研究 表現型 - 健康紀錄 - 檢驗結果 發現 臨床前試驗 臨床試驗 臺灣基因資料庫 基因體醫學計畫 生醫資訊研究 修改自科技顧問組林美雪博士投影片 國民健康資訊計畫 臨床試驗與研究體系 72

73 結合醫療 生活與基因資訊, 迎向 智慧醫療的新世代 利用 CDR 尋找可能的關聯性 所需經費較少 提出工作假說 利用 CDR 測試假說 需巨額經費 發展檢驗試劑 藥物或治療方法 yes 成功? no 設計臨床研究或試驗 CDR = clinical data repository 73

74 跨領域是成功的關鍵 原理 觀察 Information integration & information-driven biomedical research 測試假說 Computational / systems biology 由資訊驅動的生物醫學研究 提出假說 Knowledge management & inference engine 74

75 Backup slides 75

76 研究對象群 (cohort) 的可能應用 Advance pharmacogenomics, the right durg for the right patient at the right dose Identify new targets for treatment and prevention Test whether mobile devices can encourage healthy behaviors Lay scientific foundation for precision medicine for many diseases Revised from 76

More information