Samenvatting Class notes - OMICS in Biomedical Sciences

Vak
- OMICS in Biomedical Sciences
- .
- 2018 - 2019
- Universiteit van Amsterdam
- Bèta-gamma
328 Flashcards en notities
1 Studenten
  • Deze samenvatting

  • +380.000 andere samenvattingen

  • Een unieke studietool

  • Een oefentool voor deze samenvatting

  • Studiecoaching met filmpjes

Onthoud sneller, leer beter. Wetenschappelijk bewezen.

PREMIUM samenvattingen zijn gecontroleerd op kwaliteit en speciaal geselecteerd om je leerdoelen nog sneller te kunnen bereiken!

Samenvatting - Class notes - OMICS in Biomedical Sciences

  • 1554069600 Introduction OMICS

  • Met OMICS kun je meten op elk niveau uit het centrale dogma. Welke niveaus nog meer?
    • metabolieten
    • epigenetica (histon modificaties, DNA methylatie)
  • Geef voorbeelden van small data voor diagnostiek.
    • pH als diagnostic marker (n = 100 metingen bijv)
    • Barth Syndroom (BHTS). veroorzaakt in mutaties in bepaald gen. van bepaald eiwit MLCL- en CL analyse. omzetting van bepaalde stof kan niet meer --> dat kun je dus meten, de hoeveelheid. paar data punten --> simpele analyse. 

    Beperkt aantal datapunten, makkelijk te managen, analyseren en interpreteren (in veel gevallen). 
  • Er is sprake van een verschuiving naar high throughput technieken (OMICS). Daar is data analyse voor nodig (bioinformatics) en we kunnen kijken naar de onderliggende biological systems. Daarnaast is e-science nodig: om al die data op te kunnen slaan en verwerken: infrastructuur.
  • Wat is OMICS?
    high-throughput wet-lab experimenten en technologieën die gebruikt worden om moleculen te meten in een cel. Uitsplitsen in verschillende gebieden: genomics, transcriptomics, proteomics, metabolomics.
  • Noem twee technieken die voor zowel genomics als transcriptomics worden ingezet.
    • sequencing (DNA of RNA (en dan meten transcriptieniveaus))
    • microarrays
  • Noem twee technieken die voor zowel proteomics als metabolomics van belang zijn.
    • chromatography/ mass spectrometry (proteomics: gels + digestion, metabolomics: chromatography before MS)
    • MNR
  • Hoe verder je in de data komt als je de route van het centrale dogma volgt, hoe meer complex de data wordt. De mate van maturity loopt andersom.
  • Met OMICS kan stratificatie bereikt worden: subgroepen van bijvoorbeeld een vorm van kanker definiëren op basis van transcriptie of expressieniveaus. Toepassing: diagnostiek en gepersonaliseerde behandelingen (gaat een drug effect hebben?).
  • Wat is een disease signature/biomarker?
    Een groep van genen, eiwitten, metabolieten of combinatie daarvan, meetbaar in bloed, cellen of weefsel, die gebruikt kan worden voor diagnostiek en het bepalen van een geschikte behandeling. gaat dan vaak om niveaus van transcriptie etc. 

    Uitbreiding definitie: daarbinnen valt ook de gebruikte computationele methode gebruikt om die groep te definiëren en te herkennen.
  • Wat wordt bedoeld met imprecision medicine?
    Voor een relatief groot deel van de patiënten werkt medicatie niet. 
    Daarom: toewerken naar de juiste behandeling voor de juiste patiënt. Traditioneel gezien wordt een patiënt behandeld naar aanleiding van een soort gemiddelde, gevonden over patiëntpopulaties. Daar komt een behandeling uit die beter is dan anderen, maar dit is gemiddeld gesproken. 

    Mutaties of genexpressie kunnen echter leiden tot en andere uitkomst leiden voor individuele patiënten. Daarom: streven naar stratificatie, moleculair onderscheiden van patiënten.
  • Geef een definitie van personalized medicine.
    Verbeteren van stratificatie en timing van preventieve en therapeutische ingrepen, gebruikmakend van biologische informatie en biomarkers op moleculair niveau.
  • Leg uit hoe MammaPrint de voordelen van personalized medicine laat zien.
    Kan artsen helpen om het individuele risico van een patiënt op uitzaaiingen te krijgen te bepalen, om zo een specifieke behandeling te kiezen (geen onnodige chemo). preciezer onderscheid tussen high en low risk patiënten met OMICS data. 

    Met behulp van microarrays zijn tumoren gemeten --> 70 genen significant voor prognosis --> treshold leggen voor uitkomst patiënt. dus gaat op basis van genexpressie niveaus.
  • Wat is bioinformatica?
    De extractie van biologische kennis uit complexe data.
  • Wat is systeembiologie?
    Integratie van wet-lab experimenten, bioinformatics en mathematisch modeleren om een biologisch netwerk te begrijpen. 

    systems medicine = aanvulling: toegepast op kliniek, toegevoegde waarde voor patiënt.
  • Geef een definitie van personalized mecine.
    Het doel van PM is om stratificatie en timing van preventieve/therapeutische behandelingen te verbeteren. Dit wordt gedaan door gebruik te maken van biologische informatie en biomarkers op moleculair niveau.
  • 1554156000 NGS/exome sequencing

  • humane genoom: 3 miljard nucleotiden per streng
    aantal humane genen: > 20.000
    percentage exonen: 1 - 1.5%
    gemiddelde gen lengte (mens): 10 - 15 kb
    (10 pg DNA per mammalian cell
    ---> mens van 70 kg --> 225 g DNA)
  • Wat zijn capillaire sequencers?
    Maken nog steeds gebruik van sanger sequencing, maar automatiseren het proces deels. Geeft een electropherogram (denk aan uitkomst sequencing van moleculaire technieken). 

    = Automated sequencing
  • Next generation sequencing maakt het mogelijk om complete genomen van individuen te sequencen, evenals populaties.

    1000 genomes project: sequencen van genoom groot aantal individuen (2500) van verschillende etniciteiten. Later: 10.000 genome project UK. 100.000 genome project loopt nog steeds. China heeft nu 1 million genome project. En de farmaceutische industrie: 2 million genome project.
  • Geef 7 toepassingen/onderzoeksmogelijkheden van NGS.
    • volledige genomen
    • variant detection (SNPs, indels, etc.) (o.a. met exome sequencing)
    • structurele variatie
    • splice variant detection (RNA seq)
    • Chip-seq (eiwitinteracties met DNA)
    • DNA methylatie in kaart brengen (bisulfite sequencing)
    • metagenomics (vinden van alle genomen in bijv microbioom)
  • welk verschil in output is er tussen sequencing technieken?
    NGS geeft kortere output (minder bp) dan classical approach.
  • Wat is de rol van ddNTPs in Sanger sequencing?
    Worden gebruikt voor chain termination, waarmee verschillende fragmenten van verschillende lengten worden gebruikt met zo'n ddNTP aan het einde. 

    Een ddNTP mist de OH groep aan de 3 '. Er worden ook gewone nucleotiden gebruikt in sanger sequencing!
  • Geef de 4 stappen van klassieke Sanger sequencing.
    • fragmenteren van DNA (shotgun)
    • amplificeren DNA (dit vooral kostte heel veel tijd, klonering)
    • extension en chain termination 
    • electrophoresis
  • Voor sanger sequencing voer je eigenlijk een PCR uit, DNA polymerase en primers zijn dus nodig. Daarnaast heb je per reageerbuis alle 4 de gewone nucleotiden nodig, en één ddNTP. 

    In nieuwere techniek: alles in één reageerbuis (dus 4 soorten ddNTP), met elk een eigen fluorescente kleur. Daarna aflezen middels kleuren. Dit wordt gebruikt in capillaire sequencers.
  • Wat is de doorbraak die leidde tot ontwikkeling van NGS ( = high troughput sequencing)?
    Methoden waarmee het meteen gedetecteerd kan worden als een gelabelde nucleotide wordt ingebouwd. Dus tijdens synthese vindt detectie plaats --> snelheid omhoog. 
    Eerste machine = 454 Life sciences sequencer, dus op basis van pyrosequencing.
  • Geef de 4 stappen van Illumina sequencing (= vorm van NGS).
    • library preparation
    • cluster amplification
    • sequencing
    • alignment en data analysis
  • Hoe wordt een DNA library gemaakt?
    Fragmentatie van gDNAs, daaraan bepaalde adaptors ligeren. Daaraan ga je je primers zetten. 

    Illumina: gevolgd door cluster amplificatie.
  • Illumina maakt gebruik van clusteramplificatie. Leg uit.
    DNA bindt aan flow cell met complementaire sequenties (dit zijn de adapters!). Strand klapt om en bindt aan tweede oligo forming bridge. Polymerase synthetiseert reverse strand. Twee strands laten los --> recht. --> proces herhaalt zich.
  • Illumina: meten van fluorescentie op te bepalen welke nucleotide wordt ingebouwd: CCD camera. Op moment van inbouwen wordt een foto gemaakt. Je doet meerdere clusters tegelijk, dus je ziet in je foto verschillende kleuren. Je krijgt een stack, waaruit je sequentie kunt gaan afleiden.
    Je meet alle DNA templates die op je flow cell zitten in parallel, in tegenstelling tot Sanger (1, of 96 met capillaire sequencing). Je weet niet welke read tot welk molecuul behoort, bij Sanger weet je dit wel.
  • Wat is het doel van sequence alignment?
    Na sequencen: miljoenen short sequence reads, maar waar horen ze bij, wat representeren ze?
    Daartoe: alignen van sequences met een reference genome om identiteit te bepalen. 
    BLAST/BWA gebruiken: deze leggen de reads op de juiste positie op de referentie sequentie.
  • Wat houdt de term coverage in? Waarom is deze term relevant?
    Ook wel sequence depth genoemd. Twee interpretaties:
    1. Per nucleotide-positie tellen hoeveel reads overlappend zijn. Dan krijg je dus bijv een coverage van 4, als 4 reads dit nucleotide beslaan. 
    2. kijken hoeveel procent van de referentie sequentie is afgedekt met reads --> percentage. 

      De coverage zegt iets over de kwaliteit van de analyse.
  • Mate Pairs/Paired-end sequencing zijn veelgebruikte technieken. Leg uit wat ze inhouden.
    • Paired end: fragmentation of genomic DNA into short segments, followed by sequencing of both ends of the segment. 
    • Mate Pairs: gDNA: circulair, ook aan twee uiteinden. 

    Je weet welke reads bij elkaar horen (komen uit zelfde fragment uit DNA library): daartussen mis je dus een stuk (stuk in midden wordt niet gesynthetiseerd). 
    Protocollen compleet anders. voor analyse: belangrijk is dat er bij mate pairs meer afstand tussen de reads zit.
  • Waarmee kan gekeken worden naar inserties en deleties in het DNA?
    Mate-pairs sequencing (wordt uitgelegd in werkcollege) (komt in tentamen): detection of structural variation.
  • Samenvattend: geef de 4 vlakken waarop NGS en capillary-based sequencing van elkaar verschillen.
    • library construction: NGS seq reads are produced from fragment libraries that have not been subject to conventional DNA cloning. Addition of adaptor oligos to both ends
    • parallelism: NGScan proces millons of sequence reads in parallel rather than 96 (cappilary based) or one at a time (SS)
    • read lengths & sequence error rates: NGS soms minder precies
    • sequencing costs: NGS vele malen goedkoper
  • Sequencing methoden zijn niet perfect. Een manier om de fouten te beperken is door het aantal sequencing reads te verhogen, en daarmee de sequencing depth. 
    Sequencing errors can affect the detection of rare somatic mutations and of SNPs if the coverage is low.
  • Veel complexe elementen van het humane genoom kunnen niet in kaar gebracht worden met short-read paired end sequencing: de onderdelen zijn te lang. Met welke techniek kan dit worden opgelost?
    Long-read sequencing
    • single-molecule real-time sequencing approaches (bar code library preparation: multiplexing)
    • synthetic approaches (rely on existing short-read approaches --> in silico construction)
  • Waarom is exome sequencing relevant/wat is het doel?
    Middels exome sequencing kunnen gen varianten geïdentificeerd worden die (zeldzame) Mendeliaanse ziekten veroorzaken. 
    Dus: op zoek naar genvarianten in speficieke protein coderende regio's.
  • Wat voor varianten kun je identificeren met exome sequencing?
    • Single nucleotide polymorphism: punt mutatie dat heeft volstaan in de populatie. 
    • Indels (insertie/deletie)
  • Wat is een exon capture? Waarom voeren we dit uit?
    • cruciale stap in exome sequencing
    • procedure om introns en intergenic regions van het DNA te verwijderen
    • daarna kan vervolgd worden met sequencing: waar we dan dus minder van hoeven te doen! (slechts paar procent DNA is eiwit-coderend)
  • Stel: je hebt een exon capture uitgevoerd? Bevat het DNA dan nog introns? Welke extra info krijgen we zo mee?
    JA
    bijv wasstap niet helemaal succesvol. of probe neemt nog deel mee.
    exome sequencing geeft dus ook inzicht in exome splice sites. 
  • Wat is het resultaat van NGS in exome sequencing? Wat is de vervolgstap?
    • Millions of sequence reads! (nog steeds)
    • Bioinformatica begint: referentie DNA sequentie nodig, bijv vanuit public data base
    • Die hebben we nodig, om een lijst van nucleotide differences tussen patiënt en referentie te verkrijgen. 
    • Filtering op die lijst toepassen. 
    • In die lijst willen we alle verschillen die geen experimentele sequencing errors zijn. 
  • Hoe krijg je uit een exome sequencing lijst de juiste SNPs?
    Eerst heb je een lijst met verschillen met referentie. Maar gaat dit om seq errors, of echte mutaties? En zijn het dan ook de disease causing mutaties?
    1. Wegfilteren errors
    2. SNPs shared  between patients. Patienten onderling vergelijken: dan zie je bijv één gen wat in alle patiënten is gemuteerd. --> verder valideren: bioinformatica en terug naar het lab. maar anderen kun je weggooien. 
    3. list of synonymous SNPs: SNPs die het eiwit niet gaan veranderen kun je ook weggooien
  • Leg uit hoe identificatie van zeldzame en veel voorkomende ziektes werkt via verschillende technieken.
    • zeldzaam = high impact --> identificeren via exome seq
    • common = low impact --> GWAS. most are in regulatory regions --> geen exome seq
    • GWAS: meer kandidaten nodig. 
  • Geef het argument voor exome sequencing in 4 stappen aangaande het succes van de techniek.
    • linkage analysis/positional cloning studies focussing on protein coding sequences were highly succesful at identification of variants underlying disease
    • known allelelic variants known to underlie Mendelian disorders disrupt M. dis. 
    • large fraction of rare non-synonymous variants in human genome are predicted to be deleterious
    • splice acceptor and donor sites are also enriched for highly functional variation --> target

    Dus: gebied waar hele hoge kans bestaat op vinden van oorzaak. 
  • Waarom zijn zeer zeldzame ziekten erg moeilijk te onderzoeken met linkage analysis?
    • Zo zeldzaam en zo ernstig dat de mutatie eigenlijk niet wordt doorgegeven aan volgende generatie. 
    • het zijn dus waarschijnlijk de novo mutaties die ontstaan in de germ line
    • dus geen linkage analyse door generaties
    • statistisch niet te doen

    Dus: argument voor exome sequencing. (+ kosten)
  • Welke informatie kan meegenomen worden in de analyse bij exome sequencing?
    • manier van overerving ziekte (dom/rec)
    • of het een de novo mutatie is
    • extend of locus heterogeneity: of het door meerdere mutaties wordt veroorzaakt. 
    • populatiestructuur
  • Waarom is het makkelijker om recessieve mutatieziekten te identificeren met exome sequencing?
    Dan hoef je alleen nog naar kandidaten te kijken waarbij 2 mutaties aanwezig zijn: gaat veel minder voortkomen.
  • Hoe onderzoek je de novo mutaties?
    Door DNA van ouders zonder de ziekte en van het kind met de ziekte te bekijken: zoek de verschillen. Maar je kunt ook common variants zoeken binnen een patiënten groep.
  • Voor exome sequencing moet dus een exome capture worden uitgevoerd. Leg de procedure van exome capture uit.
    • ontwerpen van capture probes (die zijn complementair aan exonen) (bioinformatica speelt hier een rol in design!)
    • ontwikkelingen: steeds meer probes beschikbaar. maar je neemt dus niet per se alles mee. dit is dus ook een probleem. Daarom argument om toch compleet te sequencen, nu dit steeds goedkoper wordt. 
    • je kunt dit doen via microarray capture (probes zitten vast) en solution capture  (probes in oplossing). 
  • Geef 4 mogelijke uitkomsten van alignment procedures.
    • alignment op unieke positie --> houden
    • alignment op meerdere posities --> weg
    • alignment met lage betrouwbaarheid (veel mismatches) --> weg
    • geen alignment gevonden (experimentele artefacten) --> weg 
  • Na exome sequencing en alignment worden de verschillen tussen reads en reference bepaald. vervolgens kun je de echte SNPs bepalen: als een verschil maar in één read voorkomt dan gaat het om een sequencing fout. Als je echter een puntmutatie vindt in alle reads gaat het om een SNP.

    Stel je hebt maar één read, en die verschilt: je weet dan niet of het om een sequentie fout gaat of om een echte mutatie, je coverage is te laag om dat dan echt te kunnen aantonen.Echter: bij hoge coverage hoeft niet alles gemuteerd te zijn: heterozygoten!
Lees volledige samenvatting
Deze samenvatting. +380.000 andere samenvattingen. Een unieke studietool. Een oefentool voor deze samenvatting. Studiecoaching met filmpjes.