Options
Development of a new diagnostic algorithm for the study of diseases caractherized by high genetic heterogeneity
Development of a new diagnostic algorithm for the study of diseases characterized by high genetic heterogeneity
Nicchia, Elena
2015-03-02
Abstract
Next Generation Sequencing (NGS) technologies, such the Ion Torrent platform, could allow to simplify the diagnostic process of diseases characterized by an high genetic and phenotypic heterogeneity, because of the possibility to sequence simultaneously more genes and more patients in a single sequencing run. In order to develop a new diagnostic algorithm for rapid molecular diagnosis of these disorders, we have applied the Ion Torrent technology on two different genetically heterogeneous diseases, Fanconi anemia (FA) and inherited thrombocytopenias (IT). Since FA is a disorder better characterized than ITs, we first validated the Ion torrent technology on 30 samples (2 wild type and 28 FA), 25 of which were already analyzed with Sanger sequencing. Because of their low sequencing quality, we have excluded from this type of analysis 2 of the 28 FA samples. Then, comparing Ion Torrent and Sanger sequencing data, we have evaluated the sensitivity (95%) and the specificity (100%) of Ion Torrent technology. Moreover, in order to detect copy number variations (CNVs) in FA genes, we have improved a statistical analysis based on coverage sequencing data, confirming the presence of large intragenic deletions on FANCA in 5 patients. In summary we have characterized 25 of the 26 FA patients analyzed, identifying also 4 mutant alleles in the rare complementation group FANCL and FANCF and 10 mutations in loci different from genes causing the disease. Since we cannot exclude that new genes are involved in FA, the only patient without any mutation identified is suitable for whole exome analysis. Taking advantage from these good sequencing data, we have developed a diagnostic algorithm that combines the identification of both point mutations and CNVs. In order to verify if this new diagnostic process could be applied also to other genetically heterogeneous diseases, we have analyzed 21 IT patients, already characterized by Sanger sequencing. Among the 2225 variants identified by Ion torrent technology, using this new approach, we have select those (N=75, 56 different) potentially pathogenetic because of their frequency (MAF<0.01), or of their presence in IT mutation database o because of bioinformatics analysis. Thirty of these variants were confirmed by Sanger sequencing, 14 (12 different) of which localized in loci different from the gene causing the disease. It would be interesting to carry out functional studies on these additional variants to unravel the molecular basis of ITs. In summary we were able to characterized 17 of the 21 IT patients, including 2 patients with deletions in RBM8A (Thrombocytopenia and Absent Radii syndrome, TAR). The remaining 4 mutant alleles were not detected because of a low sequencing coverage.
In conclusion, according to our data, we can consider the Ion Torrent technology and in particular the diagnostic algorithm proposed in our study, as a feasible approaches for the study of diseases characterized by high genetic and phenotypic heterogeneity.
RIASSUNTO
Le tecnologie di Next Generation Sequencing (NGS) consentono di analizzare più geni e più campioni contemporaneamente. In questo modo potrebbe essere possibile ridurre i tempi e i costi di analisi di tutte quelle patologie caratterizzate da elevata eterogeneità genetica e fenotipica, la cui caratterizzazione risulta essere spesso complessa e dispendiosa.
Al fine di elaborare un nuovo algoritmo diagnostico che consenta la rapida elaborazione di una diagnosi molecolare di tali patologie, abbiamo deciso di validare una tra le più innovative tecnologie NGS attualmente in commercio, la metodica Ion Torrent, su due differenti malattie, entrambe caratterizzate da eterogeneità genetica. l’anemia di Fanconi (FA) e le piastrinopenie ereditarie (IT).
Siccome la FA è una patologia meglio caratterizzata rispetto alle IT, durante la prima fase di questo lavoro di tesi abbiamo analizzato 30 campioni (25 dei quali già precedentemente analizzati con sequenziamento Sanger), di cui 2 wild type e 28 affetti. In seguito all’esclusione dalla nostra analisi di 2 campioni FA a causa di una bassa qualità di sequenziamento, abbiamo determinato la sensibilità (95%) e la specificità (100%) della nuova metodica confronto i dati di sequenziamento Ion Torrent e quelli Sanger a nostra disposizione. Inoltre, utilizzando i dati di copertura della sequenza, abbiamo messo a punto un’analisi statistica volta all’identificazione delle Copy Number Variation (CNV), confermando le delezioni a carico del gene FANCA presenti in 5 pazienti. Abbiamo quindi caratterizzato 25 dei 26 pazienti analizzati, identificando inoltre 2 casi con mutazioni nei rari gruppi di complementazione FANCF e FANCL e 10 mutazioni in loci differenti dai geni causativi. Poiché non escludiamo la possibilità che un nuovo gene possa essere coinvolto nella patologia, riteniamo che l’unico paziente ancora privo di diagnosi molecolare possa essere un buon candidato per lo studio dell’esoma. Infine, avvalendoci dei buoni risultati ottenuti, abbiamo elaborato un nuovo processo diagnostico con il quale identificare in modo semplice e rapido sia le mutazioni sia le CNV a carico dei 16 geni coinvolti nella FA.
Nella seconda parte del nostro studio, abbiamo verificato se l’applicazione di tale algoritmo possa essere estesa anche ad altre patologie ad elevata eterogeneità genetica. Per questo motivo abbiamo analizzato 21 campioni affetti da piastrinopenie ereditarie, già precedentemente analizzati mediante sequenziamento Sanger. Grazie all’algoritmo proposto abbiamo potuto selezionare tra le 2225 varianti identificate le 75 (56 differenti) che sono risultate essere potenzialmente patogenetiche in base alla loro frequenza nella popolazione (MAF<0.01), alla loro presenza nei database di mutazione e all’analisi bioinformatica di patogenicità. Trenta (27 differenti) di queste varianti sono state confermate mediante sequenziamento Sanger, di cui in particolare 14 (12 differenti) presenti in geni diversi da quelli causativi. Alla luce di questo dato si rendono necessari studi funzionali su tali varianti al fine di comprendere i meccanismi molecolari alla base delle piastrinopenie ereditarie. Infine, utilizzando l’algoritmo proposto, è stato possibile confermare la diagnosi molecolare in 17 dei 21 pazienti IT, compresi i 2 affetti da trombocitopenia con assenza del radio (TAR) e portatori di una delezione sul cromosoma 1q21.1. I restanti 4 alleli mutati non sono stati identificati a causa di una bassa copertura di sequenziamento.
In conclusione, in base ai dati raccolti sui campioni affetti da FA e IT, possiamo affermare che la tecnologia di sequenziamento Ion Torrent e l’algoritmo diagnostico da noi proposto sono degli strumenti utili per ottenere una diagnosi molecolare completa, veloce ed economica.
Insegnamento
Publisher
Università degli studi di Trieste
Languages
en
File(s)