1Introduction to bioinformatics



Dovnload 97.68 Kb.
Pagina1/5
Datum16.08.2016
Grootte97.68 Kb.
  1   2   3   4   5

Introduction ICES 2006-2007



1Introduction to bioinformatics




Table of contents: Introduction to bioinformatics



1 Introduction to bioinformatics 1

1.1. Voorwoord Bio-informatica 2

1.2. Bioinformatics formal definition 5

1.3. Driving force for bioinformatics: 5

1.3.1 Advance in molecular biology 5

1.4. Different subfields in bioinformatics research 6

1.5. Structural genomics 8

1.5.1 Overview 8

1.5.2 Biological application: genome sequencing projects 12

1.6. Comparative genomics 14

1.6.1 Overview 14

1.6.2 Biological application 1: comparative genomics, genome evolution (Y. Van de Peer) 15

1.6.3 Biological application 2: metagenomics (G. Venter) 15

1.7. Functional genomics 17

1.7.1 Overview 17

1.7.2 Biological application 1: dataintegration (K. Marchal) 18





Updated 01/10/2006

1.1.Voorwoord Bio-informatica


Bio-informatica, hoewel een relatief recente term, bestaat reeds meer dan 400 jaar. Galileo schreef immers “the book of nature is written in the language of mathematics!”.

Het gebruik van wiskundige modellen om biologische fenomenen te verklaren en gegevens te analyseren is zeker niet nieuw. Tot nog toe was het enkel gemeengoed in bepaalde deeldomeinen van de biologie (e.g. populatiegenetica, fylogenie, “molecular modeling” etc.).

Belangrijke technologische vernieuwingen in de moleculaire biologie in het begin van de jaren ‘90 brachten hierin grondige verandering. Ze hebben geleid tot een drastische verruiming in het “biologisch” denken. De toepassing van de hoge-doorvoer technologieën (genomica, transcriptomica, proteomica, metabolomica) laat immers toe om in zeer korte tijd de DNA-sequentie van hele genomen in kaart te brengen, de expressie van duizenden genen of proteïnen in een organisme te analyseren, de aard en concentratie van alle metabolieten te evalueren en de interacties tussen deze verschillende genetische entiteiten te identificeren. De finale doelstelling van de moleculaire biologie “het verwerven van inzicht in de werking en evolutie van organismen” bleef dezelfde. De manier om dit doel te bereiken is gewijzigd. Tot voor enkele jaren werden in het functioneel moleculair biologisch onderzoek, genen, proteïnen en andere moleculen één voor één als geïsoleerde entiteiten bestudeerd. Het gebruik van de nieuwe technologieën situeert de functie van een gen nu in een globale context, namelijk als deel van een complex regulatorisch netwerk. Vanuit dit nieuw perspectief wordt het organisme beschouwd als een systeem dat interageert met zijn omgeving. Het gedrag ervan wordt bepaald door de complexe dynamische interacties tussen genen/proteïnen/metabolieten op het niveau van het regulatorische netwerk. Door de beschikbaarheid van data van verschillende modelorganismen kunnen bovendien de cellulaire mechanismen tussen de organismen vergeleken worden.


Organisme voorgesteld als een systeem dat interageert met zijn omgeving. Via de werking van regulatorische netwerken past een organisme zich voortdurend aan aan wisselende omgevingssignalen. Deze aanpassingen resulteren in een gewijzigd gedrag of fenotype. De regulatorische netwerken kunnen beschouwd worden als de biologische signaalverwerkingssystemen.
Traditionele studies van biologische systemen waren veeleer beschrijvend. De systeembenadering van de biologie impliceert echter een doorgedreven kwantitatieve en geïntegreerde analyse van complexe gegevens. Onder invloed van deze nieuwe tendens ontstond de term "bio-informatica" (voor het eerst gebruikt in de rond 1993) en werd de hoge-doorvoer functionele moleculaire biologie een deel van de “systeembiologie”.
Zoals de moleculaire biologie zijn systeembiologie en bio-informatica onderzoeksdomeinen met vele deeldisciplines (structurele, functionele, comparatieve bio-informatica).

De bio-informatica vraagstelling ontstaat vanuit de biologie. De computationele wetenschappen stellen een arsenaal standaardalgoritmes en principes ter beschikking. Beide moeten op een zinvolle manier verenigd worden, rekening houdend zowel met de specifieke eigenschappen van het gebruikte algoritme als met deze van het biologisch probleem. Het verzoenen van algoritmen uit exacte wetenschappen met experimentele data afkomstig van stochastische biologische systemen vormt hierbij de belangrijkste uitdaging. Om die reden kan het oplossen van een biologisch probleem via computationele weg al snel een paar jaar onderzoek in beslag nemen maar leidt het tot waardevolle resultaten die in sommige gevallen het tradioneel biologisch onderzoek overstijgen.


Het infereren van regulatorische netwerken is een voorbeeld van dergelijk overstijgend onderzoek. Internationaal werken talrijke labo’s, elk vanuit hun eigen invalshoek (studie van een bepaalde regulatieweg, focus op proteïn-, expressie-, sequentiedata), op een bepaald modelorganisme (e.g. gist). Wanneer al de informatie, gegenereerd in deze verschillende kenniscentra, (expressiedata in verschillende condities, eiwitinteracties, ...) gecombineerd wordt, kunnen de regulatorische netwerken, die aan de basis liggen van het geobserveerde gedrag van het modelorganisme, gereconstrueerd worden.
Systeem biologie onderzoek vereist (daarom) complexe wiskundige methodes, een goed inzicht in de kwaliteit en de biologische relevantie van de inputdata en tenslotte een nauwgezette validatie van gevonden interacties a.h.v. literatuur, databanken en nieuw uitgetekende experimenten. Naast het fundamenteel inzicht in de mechanistische werking van een organisme biedt netwerkinferentie eveneens de mogelijkheid tot verregaande industriële of medische toepassingen. Het ontrafelen van eenvoudige netwerkmodules, betrokken bij het ontstaan van sommige kankertypes, kan vb. een verbeterde diagnose, prognose of behandeling opleveren (e.g. identificeren van een merker in het bloed om vroegtijdig kanker op te sporen, het produceren van een kankervaccin). Goed gekarakteriseerde netwerkmodules kunnen ook nuttig zijn voor het uittekenen van reguleerbare heterologe expressiesystemen (“metabolic engineering”) of biologische “logische switchen” (Benenson et al. 2004).
Doel van de cursus bio-informatica

De moleculaire bioloog van de 21e eeuw zal niet enkel beschikken over een goed uitgebouwde biologische kennis, maar hij dient ook vertrouwd te zijn met belangrijke principes uit de wiskunde, de statistiek en de informatietechnologie. Dergelijke integratie van biologisch inzicht, analytisch en probleemoplossend denken is eigen aan de opleiding bio-ingenieur. Een groot deel van het vakkenpakket bestaat immers nu reeds uit basiswetenschappen (wiskunde of scheikunde) toegepast op biologische fenomenen (bv systeemidentificatie, biochemie als toepassing van de organische chemie).

De bedoeling van dit vak is dan ook om een overzicht te geven van de meest courant gebruikte bioinformatica tools. Het bio-informatica domein is echter zeer ruim en in volle expansie. Het is dan ook onmogelijk om alle tools en onderdelen te belichten. We zullen een aantal belangrijke en veel gebruikte voorbeelden bespreken. Aan de hand van voorbeelden zal ook aangetoond worden dat zinvolle bio-informatica meer is dan enkel het toepassen van tools maar dat het essentieel is om ook de onderliggende mathematische principes van deze tools te begrijpen en tegelijk inzicht te verwerven in de datageneratieprotocols en de biologische complexiteit. Dit impliceert dat bio-informatica meer is dan een hulpmiddel bij het moleculair biologisch onderzoek maar dat het een volwaardig onderzoeksdomein op zichtzelf vormt.
Bio-informatica onderzoek aan de KULeuven

Enkele jaren geleden beseften verschillende laboratoria binnen de Faculteit Bio-ingenieurswetenschappen (b.v. het laboratorium voor Gentechnologie, het Centrum voor Microbiële en Plantengenetica (CMPG), laboratorium voor Tropische Plantenteelt,...) de dringende noodzaak om bio-informatica te introduceren in het onderzoek. Het CMPG koos bijvoorbeeld resoluut voor een systeembiologie aanpak met Salmonella als modelorganisme. Eigen transcriptomica en proteomica faciliteiten werden uitgebouwd. Overtuigd van het interdisciplinaire karakter van het bio-informatica onderzoeksdomein werd er van bij het begin succesvol samengewerkt met de bio-informatica onderzoeksgroep op de faculteit Toegepaste Wetenschappen (ESAT/SCD).

Met deze investeringen in bio-informatica volgt de Faculteit Bio-ingenieurswetenschappen een prominente internationale tendens. De strategische keuze om hierbij de grenzen van de faculteiten te overschrijden is conform het voorbeeld van grote interdisciplinaire onderzoekscentra (e.g. Institute for Systems Biology (ISB), Seattle; Ideker et al. 2004; Bialek and Botstein. 2004; Pevzner 2004 ).
Bioinformatica en industrie

Hoewel hoge-doorvoer technologieën reeds eerder werden geïntroduceerd in de biotech en farmaceutische industrie dan in de moleculair biologische labo’s, toch bleef de houding van de industrie t.a.v. bio-informatica tot nu toe tamelijk terughoudend. Ze gaf in een eerste investeringsgolf wellicht voorkeur aan de invoering van datageneratietechnologieën. Wel bevestigen deze investeringen het geloof van de farmaceutische industrie in de kracht van bio-informatica en systeembiologie bij o.a. drug lead development (targetidentificatie, toxiciteitstesten). Momenteel kijken ze afwachtend toe hoe een veelbelovend, maar relatief recent opgericht onderzoeksdomein evolueert. Naarmate het academisch onderzoek in de bio-informatica groeit, de expertise zich opbouwt, de graad van specialisatie stijgt en de eerste “proofs of principles”, die in farmaceutische bedrijven werden uitgebouwd, vruchten afwerpen, zal ongetwijfeld de vraag van de industrie naar experten verhogen.


Toekomst van bio-informatica

Bio-informatica is dus geen “hype”. Naarmate de moleculair biologische technologie evolueert zal ze verder aan belang toenemen. De meest succesvolle moleculair biologische laboratoria zullen daarbij ongetwijfeld deze zijn, die het “wet lab” onderzoek sturen a.h.v. de predicties van geavanceerd computioneel onderzoek. De toekomst van zowel de moleculaire biologie als de bio-informatica ligt in de uitbouw van het onderzoek waarbij de grens tussen het “wet lab” en het computationeel aspect vervaagt.

K. Marchal

Deze overtuiging reflecteert zich in de thema's van hedendaagse toonaangevende congressen en symposia (b.v. “Crossroads of Microbiology and Informatics” georganiseerd door de Belgian Society of Microbiology, “The 5th International conference on Systems Biology 2004”).

De opleiding van een generatie bio-informatica experten, zich bewust van het belang van de computationele aanpak, en evengoed thuis in de wiskundige als de biologisch geörienteerde disciplines, is dus essentieel.

Literatuur


Benenson Y, Gil B, Ben-Dor U, Adar R, Shapiro E. 2004. An autonomous molecular computer for logical control of gene expression. Nature, 429:423-9.
Bialek W, Botstein D. 2004. Introductory science and mathematics education for 21st-Century biologists. Science 303:788-90.
Ideker T. 2004. Systems biology 101--what you need to know. Nat. Biotechnol. 22:473-5.
Monsieurs P, De Keersmaecker S, Navarre W W, Bader M W, De Smet F, McClelland M, Fang FC, De Moor B, Vanderleyden J, Marchal K. Comparison of the PhoPQ regulon in Escherichia coli and Salmonella typhimurium. J Mol Evol, in press.
Pevzner P. 2004. Educating biologists in the 21st century: bioinformatics scientists vs. bioinformatics technicians. Bioinformatics, in press.


  1   2   3   4   5


De database wordt beschermd door het auteursrecht ©opleid.info 2017
stuur bericht

    Hoofdpagina