Samenvatting Class notes - OMICS

Vak
- OMICS
- Antoine van Kampen
- 2019 - 2020
- Universiteit van Amsterdam
- Biomedische Wetenschappen
273 Flashcards en notities
1 Studenten
  • Deze samenvatting

  • +380.000 andere samenvattingen

  • Een unieke studietool

  • Een oefentool voor deze samenvatting

  • Studiecoaching met filmpjes

Onthoud sneller, leer beter. Wetenschappelijk bewezen.

PREMIUM samenvattingen zijn gecontroleerd op kwaliteit en speciaal geselecteerd om je leerdoelen nog sneller te kunnen bereiken!

Samenvatting - Class notes - OMICS

  • 1554069600 Introduction to OMICS

  • Wat is Biomedical research?
    basis, toegepaste en getransleerde onderzoek uitgevoerd om onze kennis of (moleculaire) processen in gezondheid en ziekten te begrijpen.
  • Waarom zijn OMICS technologien 'high-troughput' technologien?
    OMICS experimenten produceren een grote hoeveelheid aan data. OMICS technologien maken het mogelijk om veel (alle) genen, eiwitten en metabolieten tegelijk te bestuderen.
  • Noem voorbeelden van OMICS metingen
    1. gehele genoom sequentie (NGS)
    2. gen expressie meten (DNA microarrays)
    3. identificeren en kwantificeren van eiwitten en metabolieten
    4. meten van epigenetische veranderingen als methylatie
  • Wat zijn genome-wide measurments?
    Metingen van complete DNA/RNA sequenties of alle genen, eiwitten of metabolieten
  • Voor wat kunnen OMICS technieken gebruikt worden?
    1. Identificatie genetische mutaties bij ziekte
    2. Mappen van biologische netwerken
    3. Identificatie biomarkers (predictive for disease outcome)
    4. Besturderen van immuun responsen
    5. Evolutie van soorten en genen
    6. Identificatie genen/ regulatoire elementen
  • Wat zijn de 4 typen van high-throughput metingen?
    1. Genomic measurements (large-scale genotyping SNPs)
    2. Transcriptomic measurements (expression all genes in cell/tissue)
    3. Proteomic measurements (identification/quantification all proteins in cell/tissue)
    4. Metabolomic measurements (identification/quantification all metabolites)
  • Waarom is het moeilijk om belangrijke SNPs te identificeren?
    SNPs op zichzelf zijn vrij normaal en veroorzaken niet altijd een ziekte. SNPs werken juist vaak samen met andere SNPs en externe variabelen waarbij ze de risico voor een ziekte bij een persoon verhogen of verlagen.
  • Wat is GWAS?
    Genome Wide Association Studies (GWAS) associeert SNPs aan ziektes.
  • Voor wat is transcriptomics belangrijk?
    Gen expressie beinvloedt fenotypes directer dan SNPs. Hoewel Transcriptomics measurements niks kunnen zeggen over pre-disease prediction (een persoon zijn gen expressie kan heel anders zijn voordat de ziekte zich manifisteert), kan het wel:
    1. ziektes vroeg identificeren (vergoogde gen expressie maar nog geen symptomen)
    2. classifiseren van patienten in subgroepen (gen expressie niveau ~ prognose)

    * Vaak DNA microarrays, maar ook NGS (RNAseq, aantal RNA moleculen tellen)
  • Voor wat is proteomics belangrijk?
    1. vroege identificatie ziektes
    2. classificeren van patienten in subgroepen 

    (Ook het zelfde voor metabolomics)
  • Proeomics & metabolomics:
    scheiden door chromatografie --> massa spectorscopie om te identificeren & kwantificeren
  • - Genomics
    Next Generation Sequencing (NGS) (DNA microarrays in GWAS)
    Nucleotide order, mutations, regulatory elements
    - Transcriptomics
    DNA microarrays,  NGS
    Gene expression
    - Proteomics
    MS, NMR
    Amino acid order, PTM, abudance
    - Metabolomics
    MS, NMR
    metabolites, abudance
  • Wat is personalized medicine?
    Personalized medicine focust zich op het verbeteren van stratificatie en timing van preventieve en therapeutische ingrepen door gebruik te maken van biologische informatie en biomarkers op het niveau van moleculaire ziekte pathways, genetics, proteomics en metabolomics. 

    * PM gaat om het detecteren van sub-groepen (stratificatie), NIET om individuele patienten
  • Wat is e-Science?
    Enhanced Science: multidisciplinair en data- en computer-intensieve onderzoek door gebruik te maken van creatieve en innovatieve ICT
  • 1554156000 Next Generation Sequencing (NGS)

  • What zijn de toepassingen van RNA en DNA sequencing?
    1. Full genomes: complete DNA sequentie (genoom) van een organisme. Vaak gebruikt ter referentie.

    2. Variant detection: vergelijken van DNA/RNA sequentie met een referentie sequentie. Single Nucleotide Polymorphisms (SNPs) en small insertions en deletions (indels). Varianten kunnen ziektes veroorzaken.   

    3. Structural variation: variantie in structuur van een organisme zijn chromosoom. Deleties, duplicaties, copy-number varianten, inserties, inversies en translocaties. Structuur variantie is groter dan SNPs (1 Kb - 3Mb) en kleiner dan chromosoom abnormaliteiten.   

    4. Splice variant detection: vergelijking RNA sequenties met andere RNA sequenties van zelfde gen of referentie genoom.

    5. RNA-seq: gen expressie meten door het sequencen en tellen van mRNA moleculen. (Alternatief voor DNA microarrays). 

    6. Chip-seq: eiwit interactie met DNA. Combineert chromatin immunoprecipitation (ChIP) met massively parallel DNA sequencing om binding sites van DNA-geassocieerde eiwitten te vinden. 

    7. Exome sequencing: detectie van gen varianten in coderend gedeelte genoom

    8. DNA methylatie: behandelen van DNA met bisulfide en vervolgens sequencen --> patroon van methylatie. Epigenetische marker. 

    9. Metagenomics: metagenomes (multiple genomes in parallel), oftewel hap uit weefsel. Hierdoor krijg je een unbiased view van alle genen (bacterien, virussen etc.)
  • Voor Sanger sequencing wordt DNA/RNA geamplificeerd door recombinantie DNA technieken of door PCR.
  • Wat zijn de verschillen tussen NGS en Sanger sequencing?
    1. Library constructie: de NGS sequence reads zijn niet geproduceerd uit fragment 'libraries' dat geamplificeerd zijn. De DNA fragementen worden voorbereid voor sequemcem door ligatie van specifieke adaptor oligos aan beide uiteindes van elk DNA fragment. (relatief weinig input DNA nodig voor het maken van library).

    2. Parallelism  
    3. Read lengte en sequence errors: Sanger sequencing heeft langere fragmenten en een kleinere error rate (99,9999%) terwijl NGS een error rate heeft tussen 85-99,9%.   

    4. Sequencing cost: NGS is veel goedkoper
  • Wat is een miscalled base?
    Een incorrectie nucleotide dat door sequencing verkregen is.
  • Wat zijn somatische mutaties?
    Een somatische mutatie is een verandering in het DNA dat na conceptie plaatsvindt. Ze kunnen in elk cel plaatsvinden behalve in germ cells (sperma en eicellen) en kunnen hierdoor niet aan volgende generaties doorgegeven worden. Deze mutaties kunnen kanker of andere ziektes veroorzaken.
  • Waarom zijn sequencing errors gevaarlijk?
    Alleenstaand zijn ze niet te onderscheiden van sequence varianten. 
    Door het vergroten van de coverage depth (meer reads per positie) kan deze onduidelijkheid weggewerkt worde.

    *Echter, zonder te labelen van de DNA fragmenten, kunnen somatische mutaties onterecht weggedaan worden (gezien zij maar in 1 cel plaatsvinden).
  • Wat houdt single-end (SE) sequencing in?
    Tijdens het sequencen wordt het DNA in kleine fragmenten geknipt en daar worden vervolgens adaptors aan geligeerd. Bij SE wordt alleen 1 uiteinde van het DNA fragment gesequenced.
  • Wat houdt paired-end (PE) sequencing in?
    Hierbij worden beide uiteindes van het DNA fragment gesequenced en de forward en reverse reads worden dan gealigned als read pairs. 

    * Vergoogt de nauwkeurigheid van reads mapping op het referentie genoom. 
    * fragment grootte: 200-500 bp
    * produceerd 2x zo veel reads voor zelfde tijd en moeite, nauwkeurigere read alignment, kan indels detecteren
  • Wat houdt ,mate-pair sequencing in?
    Het is in prencipe hetzelfde als PE sequencing met als enig verschil hoe de sequence library geproduceerd is. De fragmenten zijn 2-5 kb groot waardoor de reads informatie geven over nucleotides die zich ver van elkaar bevinden bij elkaar horen. Wordt vaak gebruikt voor structural variant (SV) detectie.
  • Welke long-read technieken zijn er?
    1. single-molecule real-time sequencing: hebben geen clonal populatie van geamplificeerde DNA fragmenten nodig voor signaal en ook geen chemische cycling voor elke toegevoegde dNTP. 

    2. synthetic approaches: gebruiken bestaande short-read technieken om lange reads te maken. Gebruiken barcodes in de library preparation om later kleine fragmenten te assembleren tot een groot fragment.
  • Hoe werkt multiplexing?
    Multiplexing houdt het sequencen met barcodes in. Een barcode is een unieke 5-10 basen sequentie die aan het '3 uiteinde van de template wordt toegevoegd. Tijdens het sequencen worden de barcode en het target DNA als 2 onafhankelijke sequence reads verkregen. Tijdens data pre-processing worden de sequenties van verschillende samples gescheiden.
  • Wat zijn DNA caputure methoden en welke zijn er?
    DNA capture methoden maken gebruik van probes om naar specifieke gedeeltes van het genoom te bekijken (e.g. kankergenen etc.).

    1. Microarray capture: de gesynthetiseerde probes zitten vast aan een vast oppervlak. De fragment library wordt dan 'geladen' op de microarray, wat tot hybridizatie van de exon fragmenten aan de complementaire probes leidt (rest wordt weggewassen).

    2. Solution campture: zelfde principe, maar probes zitten in oplossing. In dit geval worden de juist fragmenten met beads geselecteerd.     

    * Probes worden gemaakt aan de hand van referentie sequenties
  • Voor wat worden Unique Molecular Identifiers (UMIs) gebruikt?
    Ze worden gebruikt als absolute tel methode. Hierbij wordt elk molecuul in een populatie eerst uniek gemaakt door het toe te voegen van een UMI. De UMIS in de library zijn dan een moleculaire geheugen van het aantal moleculen in de begin sample. Het aantal begin DNA moleculen kan de bepaald worden door elke UMI 1x te tellen. 

    * Voorkomt overpresentatie van specifieke sequenties door PCR
    * Herkent incorporatie van foute nucleotiden door PCR

    - UMIs zorgen voor betere kwantificatie van gen expressie met RNA-seq of verbeterde detectie van low-frequent mutaties
  • Wat houdt data pre-processing in?
    Het klaar maken van de sequence data voor verdere, meer gespecialiseerde, data analyse zoals de identificatie van SNPs, pathway analyse en gen expressie analyse. 

    Hierbij hoort bijvoorbeeld data conversion, het checken van de kwaliteit en die van de alignment.
  • Wat houdt data conversion in?
    Hierbij wordt raw data geconverteert in een fastq format.
  • Wat is een fastq format?
    Fastq is een text-based format waarin beide biologische sequenties (meestal nucleotide sequenties) en de bijbehorende kwaliteit scores worden bewaard.
  • Hoe worden de kwaliteit waardes geinterpeteerd?
    De sequencing machine produceert naast de sequenties ook nog kwaliteit waardes voor elke nucleotide. Deze worden vaak gegeven in Phred Scores Q ( Q= -logP)

    Dus bijvoorbeeld:
    Score                  kans incorrecte base                       base call nauwkeurigheid
    10                             1 in 10                                                            90%
    20                             1 in 100                                                          99%
    30                             1 in 1000                                                        99,9%
    40                             1 in 10000                                                      99,99%
    50                             1 in 100000                                                    99,999%

    * De kwaliteit van de calls zal bij de meeste platforms lager worden naarmate de run progress vordert (Hoe verder in de read, des te lager)
  • Wat kunnen de verschillende uitkomsten zijn van een sequence alignment?
    Je kan Blast of BWA gebruiken (BWA is beter en sneller voor de alignment van korte sequentie reads)

    1. Unique alignment: ideale situatie. Sequentie is aligned op exact 1 positie van het referentie sequentie. 
    2. Non-unique alignment: mapped op meerdere posities van referentie sequentie. Kan doordat de sequentie te kort is. (worden vaak weggehaald)
    3. Low confidence alignment: een unique alignment maar dan met lage kwaliteit (te veel mismatches met referentie genoom). 
    4. No alignment   
  • Wat is coverage?
    1. breadth of coverage: percentage van het DNA dat is beslagen met reads verkregen tijdens het sequencen.
    2. read depth: gemiddeld aantal reads voor een gegeven nucleotide in de sequence.
  • Hoe werken microfluidic devices?
    Ze zijn perfect voor single-cell isolatie. Ze maken compartimentalisatie en gecontroleerde beheer van nanolitre reactie mogelijk door gebruik te maken van microfluid chips en gecontroleerde vloeistof stroming.
Lees volledige samenvatting
Deze samenvatting. +380.000 andere samenvattingen. Een unieke studietool. Een oefentool voor deze samenvatting. Studiecoaching met filmpjes.