生 物 資 訊 與 藥 物 設 計 Bioinformatics and Drug Design Chao-Sheng Cheng Institute of Bioinformatics and Structural Biology, Department of Life Science, National Tsing Hua University
Watson and Crick, May 1953 (From Robert Olby, The Path to the Double Helix, 1974)
1953 發 現 DNA 結 構 1962 諾 貝 爾 獎 1990 率 領 全 世 界 的 科 學 家 開 始 進 行 人 類 基 因 體 定 序 計 畫 James Watson 2003 年 4 月 14 日 六 國 共 同 宣 布 完 成 人 類 所 有 基 因 序 列 的 解 碼
GeneBank 基 因 庫 http://www.ncbi.nlm.nih.gov/ Ex. Cancer related genes!! http://www.ensembl.org/
基 因 體 與 後 基 因 體 之 資 訊 複 雜 度 Information Complexity 後 基 因 體 分 析 世 代 所 有 基 因 體 序 列 資 訊 瞭 解 DNA 中 蘊 涵 的 資 訊 生 物 科 技 的 應 用
生 物 資 訊 學 Bioinformatics 結 合 生 物 科 技 與 資 訊 科 技 ( 資 料 的 蒐 集 儲 存 管 理 傳 輸 分 析 ) 的 一 門 新 興 科 技 蒐 集 與 儲 存 生 物 資 料 架 構 搜 尋 引 擎 解 釋 生 物 資 料 的 意 義 不 同 資 料 庫 間 的 聯 繫
甚 麼 是 生 物 資 訊? 最 狹 隘 的 定 義 創 造 及 管 理 生 物 資 料 庫 以 支 援 基 因 組 序 列 研 究 最 廣 義 的 定 義 任 何 利 用 電 腦 及 資 訊 科 學 來 解 決 生 物 問 題 都 包 括
為 什 麼 需 要 應 用 電 腦 及 資 訊 科 學 在 生 命 科 學? 太 複 雜 太 古 老 太 快 太 慢 太 大 太 小 太 遠 太 危 險
The Size of Cell
What is Cell? virtual cell http://www.virtualcell.com/
Cells Life Virtual Frog Dissection http://www-itg.lbl.gov/frog/
虛 擬 青 蛙 解 剖
果 蠅 腦 部 神 經 網 路
外 科 模 擬 - Computer training of surgical skills
生 物 資 訊 電 腦 教 育 資 源 虛 擬 細 胞 http://www.cellsalive.com/ 細 胞 解 剖 http://www.virtualcell.com/ 青 蛙 解 剖 http://www.froguts.com/ http://www-itg.lbl.gov/frog/ 果 蠅 腦 部 神 經 網 路 清 華 腦 科 學 中 心 http://brc.life.nthu.edu.tw/ 外 科 模 擬 http://www.mi.auc.dk/virtualbrain/
資 料 管 理 基 因 預 測 基 因 註 解 尋 找 基 因 藥 物 發 展 人 果 蠅 線 蟲 酵 母 菌 大 腸 桿 菌 序 列 比 對 分 子 模 擬
http://www.ncbi.nlm.nih.gov/ 尋 找 與 大 腸 癌 (colon cancer) 有 關 的 基 因 Search results for query "colon cancer": 17 hits
第 三 號 染 色 體 MFS2 PHENO Marfan-like connective tissue disorder TGFBR2 KNOWN Colon cancer; Colorectal cancer, hereditary nonpolyposis, type 6 MLH1 KNOWN Colorectal cancer, hereditary nonpolyposis, type 2, 114500 PSORS5 PHENO Psoriasis, susceptibility to, 177900 DLEC1 KNOWN Lung cancer, 211980; Esophageal cancer ACAA1 KNOWN Pseudo-Zellweger syndrome, 261510
DNA 轉 錄 RNA 轉 譯 蛋 白 質 控 制 生 理 生 化 現 象
蛋 白 質 序 列 比 對
多 序 列 排 比 - 找 出 保 守 性 區 域 Demonstrate similarity among sequences Identify functionally important sites Structure prediction Molecular phylogeny Search for weak but significant similarity/primer design Consensus seq. Seq. A Seq. B Seq. C Conserved region One Seq. with homology to A, B, C Conserved motif
HIV-1 Protease Complexed With A Tripeptide Inhibitor 蛋 白 質 結 構
蛋 白 質 結 構 簡 介 一 級 結 構 二 級 結 構 三 級 結 構 四 級 結 構
Docking 預 測 蛋 白 質 和 蛋 白 質 或 小 分 子 之 間 正 確 的 結 合 方 式 (binding state)
藥 物 研 發 的 平 均 週 期 先 導 化 合 物 的 發 現 及 修 飾 2~3 年 隨 機 篩 選 10000~20000 個 化 合 物 2~3 年 2~3 年 有 潛 力 的 藥 物 2~3 年 臨 床 前 研 究 理 論 計 算 分 子 模 擬 電 腦 輔 助 藥 物 設 計 3~4 年 臨 床 研 究 上 市 平 均 10~12 年, 耗 資 2.0 億 ~3.5 億 美 元
Drug Characteristic Must be safe to use Must be effective for the intended use Must be stable (chemically and metabolically) Must have a good solubility profile Must be synthetically feasible Must be novel (patentable)
蛋 白 質 體 學 在 新 藥 開 發 上 的 應 用 發 現 藥 物 作 用 的 新 目 標
Computer Aided Drug Design Target Structure unknown Ligand-based approaches (Pharmacophore + QSAR) known Structure-based approaches (Docking; De novo design) 29
Computer Aided Drug Design Two different strategies: Ligand-based (analog-based) design Relies on a set of known ligands and is particularly valuable if no structural information about the receptor is available. Structure-based (target-based) design Usually starts with the structure of a receptor site, such as the active site in a protein. This structure can be generated from direct experimentation or can be deduced from experimental structures through homology modeling 30
Definition of a Pharmacophore A pharmacophore can be defined as a specific 3D arrangement of chemical groups common to active molecules and essential to their biological activities. 31
SAR: Structure-activity relationship Bioisosteric Replacements Molecules that are designed by bioisosteric replacements are expected to have similar biological properties. 32
Programs Catalyst Sybyl Discovery Studio
Computational ligand design Two different strategies: Ligand-based (analog-based) design Relies on a set of known ligands and is particularly valuable if no structural information about the receptor is available. Structure-based (target-based) design Usually starts with the structure of a receptor site, such as the active site in a protein. This structure can be generated from direct experimentation or can be deduced from experimental structures through homology modeling 34
Structure-based (target-based) design * Homology modeling 35 (Krumrine et al., 2003)
Homology modeling: software Modeller: http://salilab.org/modeller/tutorial/ DeepViewer: http://ca.expasy.org/spdbv/text/disclaim.htm What If: http://swift.cmbi.ru.nl/servers/html/index.html Discovery Studio/InsightII
Homology modeling: Web-Service SWISS-MODEL: http://swissmodel.expasy.org/ What If: http://swift.cmbi.ru.nl/servers/html/index.html CPHmodels 2.0: http://www.cbs.dtu.dk/services/cphmodels/ PredictProtein: http://www.predictprotein.org/
Quality Check of the protein structure ProsaII... check protein energy Procheck... check protein geometric Whatcheck.. check protein geometric
Structure-based (target-based) design * Homology modeling Dock known chemicals from an in silico database into the receptor target site (database searching or screening). Design of novel compounds to fit into receptor target site (de novo design). 39 (Krumrine et al., 2003)
Design Methods 1. Docking 2. Database searching 40
Definition of Docking Docking is an energy-based operation for exploring the binding modes of two interaction molecules. Give the 3D structure of a protein target, compuonds can be designed to fit in a cavity, which is called "docking". The treatment ends when a minimum of energy is obtained for the complex. 41
Docking Goal 1. To build the binding model between ligand and protein 2. To clarify the critical residues which involve in ligand binding 3. To engineer the protein by mutagenesis 4. To develop a drug from a compound database 42
Docking Require Ligand structure Protein structure Docking software Ligand: XK-263 Protein: HIV-1 Protease (1hvr) Software: AutoDock version 2.4 43
Docking Flowchart Input Docking Output Limitation For Input Ligand Data: structure Protein structure Protein must be high resolution! 大 部 分 的 溶 劑 分 子 必 須 移 除, 除 非 該 溶 劑 Autodock 和 蛋 白 質 作 用 機 制 有 很 大 關 係 Dock 若 原 Ludi 子 的 B factors 值 很 高, 也 必 須 將 其 移 Gramm 除 對 於 NMR 的 結 構, 若 在 較 少 限 制 的 區 域 (Poorly Complex constrained structure information regions) 也 必 須 Analysis ProSall, SWISS PDB Viewer 移 除 Evaluation 44
Ligand Structure Chemical drawing ChemOffice Discovery Studio/InsightII Sybyl ISIS Draw Alchemy2000 The Dundee PRODRG2 Server
Ligand Structure from database Protein Data Bank Zinc database Cambridge Structural Database CrossFire Database/Beilstein, Gmelin, EcoPharm MDL ISIS Database, (Chinese) CCDC/Relibase Protein-Ligand Structure Database National Cancer Institute SoP Computer-Aided Drug Design Center
Protein Structure Download: Protein Data Bank: http://www.rcsb.org/pdb/home/home.do Build the model by yourself!!
Docking Flowchart Input Limitation Ligand structure Protein structure Docking Autodock Dock Ludi Gramm Need to consider. Forces Receptor and ligand flexibility Solvent Binding mode Output Complex structure information Analysis ProSall, SWISS PDB Viewer Evaluation 48
Docking Program Protein-Protein Docking ZDOCK/RDOCK PatchDOCK DOCK GRAMM Molfit HADDOCK Protein-Ligand Docking GOLD AutoDOCK DOCK GRAMM Molegro FlexX Discovery Studio
Docking Flowchart Input Docking Output Limitation For Output Ligand Data: structure Protein structure 嵌 合 計 算 完 成 後, 首 先 要 知 道 藥 物 或 化 學 小 分 子 所 結 合 的 活 化 區 位 置 (active Autodock sites) Dock 結 合 Ludi 的 幾 何 圖 形 (Geometry), 幾 何 上 兩 個 Gramm 配 對 的 結 構 結 合 的 能 量 勢 能 (potential energy) Complex structure information Analysis ProSall, SWISS PDB Viewer Evaluation 50
Docking Analyses Molecular visualization Calculation of Binding Energies Score Function
Molecular Visualization
Molecular Visualization Rasmol Chime SWISS PDB Viewer Discovery Studio/insightII Sybyl Molegro Pymol MolMol Molscript GRASP Coot O Chimera
Protein Surface Map GRASP MS MSMS Naccess Surfnet Connolly Delphi Dms MolMol PyMol Swiss PDB Viewer Discovery Studio
Structural Alignment 1. CE 2. Discovery Studio/InsightII 3. Swiss PDB Viewer 4. MolMol 5. Vector Alignment Search Tool (VAST)
Protein volume & cavity size Voidoo GRASP SWISS PDB Viewer Volume+Access
Interaction - Ligplot
Binding Energy & Kd MMTSB + charmm or amber SCORE DynFit Discovery Studio
Virtual screening 59
2. Database searching 3D Database Searching In practice the database approach provides an easy way to arrive at leads. It consists of a 3D computerized search of a database of synthesized or naturally occurring compounds and testing them in silico. The result of this treatment is a list of compounds ranked by a score based on the overall match with the receptor. 60
2. Database searching Databases of Molecules in 3D Throughout the world there are thousands of chemical suppliers offering more than 3 million of organic molecules. The advantage of using commercially available molecules in database searching is that they offer a great diversity and can be purchased and tested rapidly. 61
Figure 2. (a) Binding conformations of docked compounds at the active sites of CatK. 62
Figure 3b represents the interaction model of the docked inhibitor 38 with CatK, as generated with the program Ligplot. Compound 38 Figure 3. (a) Plots of pic50 versus ChemScore energy for compounds from the training and the test sets. (b) Proposed interaction model of inhibitor 38 in the active sites of CatK 63
Database Cambridge Structural Database CrossFire Database/Beilstein, Gmelin, EcoPharm MDL ISIS Database, (Chinese) CCDC/Relibase Protein-Ligand Structure Database National Cancer Institute SoP Computer-Aided Drug Design Center Zinc database 64
Virtual Screening Program DOCK AutoDOCK GOLD Discovery Studio Molegro FlexX
Structure-based (target-based) design * Homology modeling Dock known chemicals from an in silico database into the receptor target site (database searching or screening). Design of novel compounds to fit into receptor target site (de novo design). 66 (Krumrine et al., 2003)
De-Novo design 67
3. De-Novo design Automated Construction Approaches The purpose of construction programs is to discover a new chemical framework that fits to the active site of the target receptor or enzyme. Some methods are based on an existing moiety and additional fragments are appended by a step-by-step build up procedure. Other methods consist of assembling novel molecules from pieces that are positioned optimally in favorable regions of the active site. 68
Program LigBuilder Ludi 69
謝 謝! 清 華 大 學 生 物 資 訊 中 心 Bioinformatics Center, NTHU 70