VL Bioinformatik für Nebenfächler - SS2019 Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin

VL Bioinformatik für Nebenfächler
Woche 1

Tim Conrad
AG Medical Bioinformatics
Institut für Mathematik & Informatik, Freie Universität Berlin
Die Themen heute

1.         Team
2.         Tutorien
3.         Prüfungsleistungen
4.         „Was ist Bioinformatik?“

Das Team

• Tim Conrad
       –    BSc/MSc Bioinformatik 2000-2005
       –    Leiter AG „Medical Bioinformatics“
       –    Email: conrad@math.fu-berlin.de
       –    Sprechstunde nach Vereinbarung, Arnimallee 6, Raum 137

• Sina Sommer

• Matthias Fischer

• Leon Kerger

• Inhalte?

• Termine
        – Beginnt 22.04.2019
        – Räume werden auf Homepage bekannt gegeben

        – T2: Dienstag 10-12 (Leon)
        – T3: Dienstag 12-14 (Matthias)
        – T4: Mittwochs 8-10 (Sina)
        – T5: Donnerstag 10-12 (Leon)

    – VL kann auch anderes Material enthalten (z.B. heute).
    – Folien werden zeitnah online verfügbar gemacht. Eine
      Mitschrift des Folieninhaltes ist nicht nötig.
    – Die Folien sind KEIN Skript. Hinzu kommen
      Erklärungen, Tafelanschrieb, Beispiele, Hinweise,
      Anekdoten, Overheadfolien, …

     Gehen Sie in die Vorlesung
     und machen Sie sich Notizen.

VL Homepage(s):
       • http://www.medicalbioinformatics.de/teaching
       • Seite/Gruppe im KVV

Kriterien zum Bestehen des Kurses:

1. Aktive und regelmäßige Teilnahme an den
   Übungen: Nachweis durch Erreichen von mind.
   50% der Punkte aller Übungszettel (insgesamt,
   nicht pro Zettel.)
2. Aktive und regelmäßige Teilnahme an der
   Vorlesung: Nachweis durch Erreichen von mind.
   50% der Punkte in der Klausur.

• 09.07.2019 (letzter VL Termin)
• 09.10.2019 (Nachklausur)

Soweit zum Administrativen

                          Fragen zur „Verwaltung“?

Was ist Bioinformatik?

•     Bioinformatics, n. The science of information and information flow in biological
      systems, esp. of the use of computational methods in genetics and genomics.
      (Oxford English Dictionary)

•     “Research, development, or application of computational tools and approaches for
      expanding the use of biological, medical, behavioral or health data, including those
      to acquire, store, organize, archive, analyze, or visualize such data.”

•     "The mathematical, statistical and computing methods that aim to solve biological
      problems using DNA and amino acid sequences and related information.“
      (Fredj Tekaia, Institut Pasteur)

•     "I do not think all biological computing is bioinformatics, e.g. mathematical
      modeling is not bioinformatics, even when connected with biology-related
      problems. In my opinion, bioinformatics has to do with management and the
      subsequent use of biological information, particular genetic information.“
      (Richard Durbin, Sanger Center)

Was ist Bioinformatik nicht?

• Biologisch-inspirierte (Be)-Rechnungen
  oder Algorithmen, wie z.B. Genetische
  Algorithmen (GA) oder Neuronale
  Netzwerke (NN)

• Allerdings: Anwendung von GAs oder
  NNs, um biologische Probleme zu
  lösen, kann wieder Bioinformatik sein.

Verwandte Gebiete

•     Computational Biology
•     Systems Biology
•     Mathematical Biology
•     Computational Chemistry
•     Biophysics
•     (Computational) Genomics
•     Comparative genomics
•     Functional genomics
•     (Computational) Proteomics
•     Pharmacogenomics, Pharmacogenetics, Pharmacokinetics
•     Pharmacoinformatics
•     Chemoinformatics
•     Biomedical Informatics / Medical Informatics
•     Agroinformatics / Agricultural informatics


Mathematical Biology

Mathematical     biology     “tackles
biological  problems,      but    the
methods it uses to tackle them need
not be numerical and need not be
implemented     in    software     or

 Alan Turing

Turing über biologische Komplexität

•     “It must be admitted that the biological examples which it has been
      possible to give in the present paper are very limited.

•     This can be ascribed quite simply to the fact that biological
      phenomena are usually very complicated. Taking this in combination
      with the relatively elementary mathematics used in this paper one
      could hardly expect to find that many observed biological
      phenomena would be covered.

•     It is thought, however, that the imaginary biological systems which
      have been treated, and the principles which have been discussed,
      should be of some help in interpreting real biological forms.”

Alan Turing, The Chemical Basis of Morphogenesis, 1952

• “Biologie von Netzwerken”

• Integration verschiedener
  Ebenen von Informationen
  um zu verstehen, wie
  biologische Systeme

     Overview of metabolic pathways,
     KEGG database,

Warum ist Bioinformatik wichtig?

• Neue Messmethoden produzieren
  riesige Mengen an biologischen Daten
        − Es werden neue Techniken zur Datenanalyse gebraucht, um daraus
          sinnvolle Informationen zu gewinnen.
        − Die typischen Messmethoden produzieren verrauschte Daten, wobei auch
          noch viele Werte fehlen.

• Paradigmenwechsel in der Biologie
        − Anwendung von Bioinformatik in der Forschung

Typische Fähigkeiten eines Bioinformatikers

• Statistische Methoden der Datenanalyse
        •    Große Datenmengen
        •    Viel Rauschen
        •    Fehlende Werte
        •    # Attribute >> # Daten Punkte

• Programmiersprachen
        •    Imperative Sprachen: Java, C/C++
        •    Skriptsprachen: Python, Perl, Ruby
        •    Viele Daten-/Textformate: Notwendigkeit für Parser
        •    Integration von Daten und Tools
        •    Kenntnis von wissenschaftlichen Programmier-Paketen, -Bibliotheken

• Datenstrukturen, Datenbanken
• Modellierung
• Kommunikationsfähigkeit
        •    Notwendiges Hintergrundwissen in den notwendigen Disziplinen (Bio, Chemie, Informatik, …)

                                                   Wir wollen herausfinden, was für
                                                   Effekte das regulierende Gen x
                                                   während Bedingung y hat und wie
                                                   sich das auf den Phänotyp des
                                                   Organismus auswirkt.

                                                          Definieren Sie Eingabe und
                                                           Ausgabe des Problems.

Typische Fähigkeiten eines Bioinformatikers

                                                           • Biologische Sequenzanalyse
                                                           • Biologische Datenbanken
   Biologie / Medizin                                      • Analyse von
   • Grundlagen in Molekular-                              Expressionsdaten
   und Zellbiologie                                        • Modellierung von
   • Meßtechniken                                          Proteinstrukturen
                                                           • Verständnis von Genen,
                                                           Proteinen und metabolischen

Mathematik / Statistik                                               Informatik
• Analysis                                                           • Programmierung
• Lineare Algebra                                                    • Datenbanken
• Wahrscheinlichkeits-                                               • Algorithmen

                                  Wo wären Sie in diesem Dreieck?
Warum ist Bioinformatik wichtig? Ein Beispiel.

Bioinformatik und die

Schweinegrippe - Grundfakten

• Die Virenpartikel werden
  schnell instabil (Halbwertszeit
  ein paar Stunden bei

• Kaltes und trocknes Wetter
  lässt den Virus ausserhalb
  des Körpers länger
  überleben als bei warmen

• Einmal infiziert, bricht die
  Krankheit innerhalb von drei
  Tagen aus.

• Im Menschen infiziert der                              Es verbreitet sich durch Husten und Niesen.
  Virus Zellen des
  Atmungstraktes (Nase, Hals
  und Lungen).

 Influenza A                                           Influenza B              Influenza C
                                                       Eher milde Infektionen
 Schwere Erkrankung und schnelle Verbreitung


Grippestämme werden durch Antigene unterschieden

                                                              • Grippeviren sind
                                                                benannt nach den
                                                                Antigenen (Proteinen),
                                                                die aus der Virenhülle
                                                              • Es gibt zwei Antigen
                                                                Typen = N und H.
                                                              • In verschiedenen Virus-
                                                                Stämmensind die
                                                                Formen von N und H
                                                              • Es gibt 9 bekannte N
                                                        (N)     und 16 bekannte H
Die Rolle der Grippe-Antigene

  Das N Anti-Gen wird benötigt um                         Das H Anti-Gen erlaubt dem Virus in
  den Virus aus der Wirtszelle                            die Zelle einzudringen und sich so zu
  “herauszu-schneiden”, damit es                          verbreiten.
  sich ausbreiten kann.
                                                          Vogel-Grippe H ermöglicht dem Virus
  Beim oben gezeigten N ist die                           “intestinal cells” von Vögeln zu
  “cutting site” durch ein                                infizieren. Menschen-Grippe H
  Medikament geblockt.                                    ermöglicht dem Virus menschliche
                                                          Lungenzellen zu infizieren.

Influenza A infecting a human.
Can spread from human to
human due to H and N proteins
on surface.                                                                           Influenza A infecting a
                                                                                      chicken. Can occasionally
                                                                                      infect humans but cannot
                                                                                      spread from human to
                                           Pig can become infected easily with bird   human due to H and N
                                           flu and/or human flu. Serves as a mixing   proteins on surface.
        N cuts the links between theH attaches to cell
Virus   viruses and the cell surfacesurface
                                       so   proteins so
        virus particles are free to virus
                                    go    can enter cell
                                          Proteins on cell
        and infect more cells.

        Virus genes are released
        into the cell.
        The lung cell is ‘tricked’
        into using these genes to
        make new virus particles.Human Lung Cell
Die Spanische Grippe von 1918 tötete mehr Menschen als WWI

Die Spanische Grippe Pandemie tötete
weltweit mehr als 40 Millionen Menschen.
Die Virus Antigene unterschieden sich
deutlich von denen, die vorher auftraten.
Daher waren die Menschen nicht
immunisiert und dem Virus schutzlos                      Das Virus hatte seinen Ursprung in
ausgeliefert.                                            Amerika, und wurde von den in den
                                                         Krieg ziehenden Soldaten in der
                                                         Welt verteilt.
Das Influenza Genom

Das gesamte genetische Material im Virus wird als sein Genom
bezeichnet.    Das Genom ist in 8 Ribonukleoprotein (RNP)
Abschnitte unterteilt. Das genetische Material ist (-)-sense RNA
(das ist das Gegenteil von mRNA)


Influenza hat 8 Gen-Abschnitte

 Segment           Size                  Polypeptide                                  Function
 1             2341                 PB2                Subunit of polymerase: Host cap binding and endonuclease

 2             2341                 PB1                Catalytic subunit of polymerase
 3             2233                 PA                 Subunit of polymerase, active in vRNA synthesis

 4             1778                 HA                 Haemagglutinin
 5             1565                 NP                 Nucleoprotein: Part of transcriptase complex

 6             1413                 NA                 Neuraminidase: release of virus
 7             1027                 M1                 Matrix protein: Major component of virion

                                    M2                 Integral membrane protein: Ion channel

 8             890                  NS1                Anti-interferon protein. Effects on cellular RNA transport

                                    NS2                RNP nuclear export

Durch Sequenzierung wurde das Genom entschlüsselt. Mittlerweile
sind auch fast alle Proteine bekannt, die dadurch kodiert werden.


Origins and evolutionary genomics of the
2009 swine-origin H1N1 influenza A

      Schattierte Boxen repräsentieren
      Wirtsspezies; Vogel (grün), Schwein              GJD Smith et al. Nature 459, 1122-1125 (2009)
      (rot) and Mensch (blau).                         doi:10.1038/nature08182

PLoS One. 2009; 4(7): e6402.
                                                       Published online 2009 July 28.
                                                       doi: 10.1371/journal.pone.0006402.

Wo steckt nun die Bioinformatik?

• An vielen Stellen!
• Zum Beispiel:
   – Sequenzvergleiche bzw. „Blasten“ von Sequenzen
   – Erforschen der Entwicklung des Virus (Phylogenetische Bäume)
   – Finden der Gene im Virus Genom
   – Modellierung und Simulation von Proteinen; Drug Design
   – Auswirkungen auf die verschiedenen Systeme im Menschen
Mehr Informationen im Internet unter
Vielen Dank!
Tim Conrad                             Weitere
AG Medical Bioinformatics              Fragen
Sie können auch lesen