20410568 - IN470 - METODI COMPUTAZIONALI PER LA BIOLOGIA

Acquisire la conoscenza di base dei sistemi biologici e dei problemi legati alla loro comprensione anche in relazione a deviazioni dal normale funzionamento e quindi all’insorgenza di patologie. Curare l’aspetto modellistico come pure quello della simulazione numerica, soprattutto di problemi formulati mediante equazioni e sistemi discreti. Acquisire la conoscenza dei principali algoritmi bio-informatici utili ad analizzare dati biologici.

Curriculum

scheda docente | materiale didattico

Programma

Introduzione alla Systems Biology: cosa è la biologia computazionale; i ruoli della modellistica matematica e della bioinformatica; a cosa mira – quali sono i problemi; quali sono gli strumenti teorici utilizzati.

Introduzione alla biologia molecolare e cellulare: conoscenza di base di genetica, proteomica e processi cellulari; ecologia ed evoluzione; cenni alla disponibilità di dati biologici in rete.

Richiamo di teoria della probabilità: variabili casuali discrete e continue; distribuzioni, entropia, inferenza, campionamento, stima di probabilità, l'algoritmo EM (Expectation Maximisation).

Richiamo di teoria dell’informazione: Shannon entropy e altre misure di entropia; misure di diversità (indice di Shannon-Wiener, indice di Simpson).

Introduzione ai processi stocastici: random walks, catene di Markov.

Introduzione al Machine Learning e al Pattern Recognition: supervised and unsupervised learning; metodi Bayesiani; tecniche non-parametriche; Neural Networks; metodi stocastici; clustering; k-means.

Analisi delle sequenze: Algoritmi di allineamento (e.g., BLAST); Hidden Markov Models (HMM); strumenti software disponibili in rete.

Richiamo di teoria dei grafi: notazione; tipi di grafi; rappresentazione; algoritmi sui grafi; proprietà statistiche delle reti; centralità; Motifs; Network clustering.
Biological Networks: reti di trasduzione del segnale; reti di regolazione genica; protein-protein interaction networks; reti metaboliche; strumenti software disponibili in rete.

Modelli bio-matematici; predizione mediante modelli teorici; modelli continui; richiami dei metodi numerici per la risoluzione di sistemi di equazioni differenziali ordinarie; modelli discreti; modelli di spin (Ising models); Automi cellulari; Boolean networks; Agent-based models; data fitting e stima dei parametri; strumenti software disponibili.


Testi Adottati

Testi di Riferimento

• E.S. Allman, J.A. Rhodes. Mathematical Models in Biology: An Introduction (2004) Cambridge University Press.

• W.J. Ewens, G.R. Grant. Statistical Methods in Bioinformatics, An Introduction (2005) Springer Verlag.

• R. Durbin, S. Eddy, A. Krogh, G. Mitchison. Biological sequence analysis - Probabilistic models of proteins and nucleic acids (1998) Cambridge University Press.

• B.H. Junker, F. Schreiber (eds). Analysis of biological networks (2008) John Wiley & Sons.

• R.O. Duda, P.E. Hart, D.G. Stork. Pattern Classification (2001) John Wiley & Sons.



Modalità Erogazione

Svolgimento tradizionale ma in caso di impedimenti si procede con lo svolgimento a distanza.

Modalità Frequenza

Preferibile la frequenza alle lezioni che prevedono il laboratorio.

Modalità Valutazione

Previsto un esonero a meta' corso circa valevole per meta' dell'esame scritto.

scheda docente | materiale didattico

Programma

Introduzione alla Systems Biology: cosa è la biologia computazionale; i ruoli della modellistica matematica e della bioinformatica; a cosa mira – quali sono i problemi; quali sono gli strumenti teorici utilizzati.

Introduzione alla biologia molecolare e cellulare: conoscenza di base di genetica, proteomica e processi cellulari; ecologia ed evoluzione; cenni alla disponibilità di dati biologici in rete.

Richiamo di teoria della probabilità: variabili casuali discrete e continue; distribuzioni, entropia, inferenza, campionamento, stima di probabilità, l'algoritmo EM (Expectation Maximisation).

Richiamo di teoria dell’informazione: Shannon entropy e altre misure di entropia; misure di diversità (indice di Shannon-Wiener, indice di Simpson).

Introduzione ai processi stocastici: random walks, catene di Markov.

Introduzione al Machine Learning e al Pattern Recognition: supervised and unsupervised learning; metodi Bayesiani; tecniche non-parametriche; Neural Networks; metodi stocastici; clustering; k-means.

Analisi delle sequenze: Algoritmi di allineamento (e.g., BLAST); Hidden Markov Models (HMM); strumenti software disponibili in rete.

Richiamo di teoria dei grafi: notazione; tipi di grafi; rappresentazione; algoritmi sui grafi; proprietà statistiche delle reti; centralità; Motifs; Network clustering.
Biological Networks: reti di trasduzione del segnale; reti di regolazione genica; protein-protein interaction networks; reti metaboliche; strumenti software disponibili in rete.

Modelli bio-matematici; predizione mediante modelli teorici; modelli continui; richiami dei metodi numerici per la risoluzione di sistemi di equazioni differenziali ordinarie; modelli discreti; modelli di spin (Ising models); Automi cellulari; Boolean networks; Agent-based models; data fitting e stima dei parametri; strumenti software disponibili.


Testi Adottati

Testi di Riferimento

• E.S. Allman, J.A. Rhodes. Mathematical Models in Biology: An Introduction (2004) Cambridge University Press.

• W.J. Ewens, G.R. Grant. Statistical Methods in Bioinformatics, An Introduction (2005) Springer Verlag.

• R. Durbin, S. Eddy, A. Krogh, G. Mitchison. Biological sequence analysis - Probabilistic models of proteins and nucleic acids (1998) Cambridge University Press.

• B.H. Junker, F. Schreiber (eds). Analysis of biological networks (2008) John Wiley & Sons.

• R.O. Duda, P.E. Hart, D.G. Stork. Pattern Classification (2001) John Wiley & Sons.



Modalità Erogazione

Svolgimento tradizionale ma in caso di impedimenti si procede con lo svolgimento a distanza.

Modalità Frequenza

Preferibile la frequenza alle lezioni che prevedono il laboratorio.

Modalità Valutazione

Previsto un esonero a meta' corso circa valevole per meta' dell'esame scritto.