Questa tesi riassume l’attività di ricerca da me svolta durante i tre anni di dottorato, sovvenzionato dal progetto ERC LanGeLin, il cui scopo principale è di migliorare le conoscenze sulla co-evoluzione di lingue e geni. I progetti descritti condividono l’uso di marcatori uniparentali usati per gli studi di evoluzione umana, ma differiscono per la combinazione di metodi molecolari e statistici. La Parte I descrive lo stato dell’arte dei marcatori uniparentali e i pro e contro del loro utilizzo in ambito linguistico e archeologico. La Parte II riassume i risultati delle ricerche condotte nell’ambito del progetto LanGeLin che descrive la diversità dei pattern genetici e linguistici in 36 popolazioni Euroasiatiche. Il progetto LanGeLin (Language and Gene Lineages), finanziato dal “European Research Council” ha lo scopo di testare l’ipotesi di Darwin presentata in “Origine delle specie”. Darwin intuì che l’albero filogenetico delle diverse sottospecie umane, potesse sovrapporsi a quello ottenuto a partire dalle diverse lingue, offrendo di fatto la possibilità di studiare la genealogia delle lingue e allo stesso tempo capire come le differenze tra queste avrebbero permesso di far luce sugli aspetti elusivi della storia demografica umana. R. Sokal e L.L. Cavalli-Sforza nel 1988 hanno elucidato come la comparazione dei vocaboli rifletta la correlazione fra variabilità genetica e linguistica nelle maggiori famiglie linguistiche ma, a causa di metodi linguistici, risulta difficile comparare popolazioni derivanti da gruppi linguistici distanti. Il nuovo metodo linguistico PCM si basa sulle caratteristiche linguistiche più stabili della sintassi. È stato dunque possibile, anche in questa tesi, testare su larga scala geo-linguistica la correlazione tra dati genetici e linguistici. Lo studio delle discendenze materne e paterne è stato condotto separatamente per indagarne le relative storie di migrazione: due differenti storie sono emerse dall’analisi del Ychr (discendenza patrilineare) e del mtDNA (discendenza matrilineare). Non ovvie considerazioni sono scaturite dalla comparazione delle caratteristiche genetiche e linguistiche, che ha portato a definire come la correlazione tra lingue e sequenza genetica sia dipendente dall’area geografica e dai marcatori genetici considerati. La Parte III descrive l’analisi di sequenze di mtDNA del Mesolitico (Ms) che ci ha permesso di indagare sul popolamento della Sardegna in periodo Neolitico (Ne) e pre-Neolitico (pN). Lo studio è stato incentrato su due sequenze mitocondriali sarde Ms in relazione al contesto europeo. C’è ancora molta incertezza sulla variabilità genetica della Sardegna preistorica, a causa della scarsità di resti umani Ne. Dal punto di vista genetico, i sardi moderni possono considerarsi un gruppo a se stante rispetto al resto dell’Europa continentale, mostrando alti livelli di diversità interna e una forte vicinanza con i primi coltivatori europei del Ne. Questa tesi riporta le due prime sequenze mtDNA complete sarde, datate circa 10000 anni fa. I due individui confermano un’occupazione mesolitica dell’isola e rappresentano un aplotipo mai trovato prima in Sardegna mesolitica e con basse frequenze nell’intera Europa. Le due sequenze risultano ben differenziate se comparate con altri dati europei pN, e più simili a popolazioni dell’era pre-glaciale che a popolazioni coeve. Analisi di inferenza Bayesiana hanno mostrato come i primi abitanti dell’isola abbiano contribuito poco al popolamento attuale dell’isola, la cui diversità genetica deriva da migrazioni dal continente in tempi neolitici. Un progetto portato avanti parallelamente, ha riguardato lo studio di frequenze alleliche in gemelli dizigotici provenienti da popolazioni umane africane, europee ed asiatiche. Le tecniche bioinformatiche e biostatistiche usate per le analisi genomiche su larga scala, fanno da collante con i precedenti progetti descritti.

This dissertation is divided in three sections and focuses on two of the projects I worked on during my three-years PhD, funded by a European Research Council (ERC) grant LanGeLin. Both the projects share the uniparental markers as tool used for the investigation of the human evolutionary history, but each of them addresses different scientific questions by means of a different combination of molecular and statistical methods. Part I is a technical summary on current knowledge about uniparental markers features and on the pros and cons of their usage for addressing questions stemming from the fields of linguistics and archaeology. Part II summarizes the results of one of the ERC-founded LanGeLin works; here I describe the comparison of patterns of genetic and liguistic diversity in 36 Eurasian populations. The ERC-founded LanGeLin project aims to improve our understanding about the coevolution of language and genes. R. Sokal and L.L. Cavalli-Sforza in 1988 showed that a correlation between genetic and linguistic variation within major language families is actually present, but due to imperfect methods to quantify linguistic variation, it has been difficult to compare populations belonging to distant linguistic groups. Thanks to the newly PCM linguistic method, a new way to compare languages is now available, based on stable linguistic syntax features. It is now possible to test the correlation between genetic and linguistic data in a broad geo-linguistic scale, as this thesis will do, and to interpret in evolutionary terms both the rule and the exceptions. It is also possible to study maternal and paternal lineages separately, to inquire their migrational histories. Two different migrational histories emerged, with women dispersing at a higher rate than men. When comparing genetic and linguistic features a neither obvious nor simple pattern is detectable: correlations between languages and DNA variants depend on the geographical area and the genetic markers considered. Part III addresses questions related with the analysis of complete mitochondrial sequences from Mesolithic (Ms) times, which allowed us to address questions regarding Neolithic (Ne) and pre-Neolithic (pN) peopling of Sardinia. We investigated the role of two Ms Sardinian mtDNA sequences in the European context. Little is known about the genetic prehistory of Sardinia because of the scarcity of pN human remains. Modern Sardinians are known as genetic outliers in Europe, showing unusually high levels of internal diversity and a close relationship to early European Ne farmers. However, how far this peculiar genetic structure extends and how it originated was to date impossible to test. Here I present the first and oldest complete mtDNA sequences from Sardinia, dated back to 10,000 yBP. These two individuals belong to rare mtDNA lineages never been found before in Ms samples and that are currently present at low frequencies also in the whole Europe. When compared with other European pN data, the Ms Sardinian sequences appeared already well differentiated, and in general more similar to pre-Last Glacial Maximum populations, than to coeval sequences. As a side project, I was also involved in the study of the differences in twinning rate (tr) among human populations of Africa (where the tr is maximum), Europe and Asia (where the tr is minimum). The contact point between these projects was represented by the common bioinformatics and biostatistical tools needed for analysis of large genomic. Although I considered that, for the sake of consistency, this thesis will mostly focus on the ERC-funded project, I am enclosing, in the final Manuscripts section, both papers produced during my doctoral years.

Patterns of genetic and linguistic variation. A study of uniparental markers.

SUSCA, Roberta Rosa
2017

Abstract

Questa tesi riassume l’attività di ricerca da me svolta durante i tre anni di dottorato, sovvenzionato dal progetto ERC LanGeLin, il cui scopo principale è di migliorare le conoscenze sulla co-evoluzione di lingue e geni. I progetti descritti condividono l’uso di marcatori uniparentali usati per gli studi di evoluzione umana, ma differiscono per la combinazione di metodi molecolari e statistici. La Parte I descrive lo stato dell’arte dei marcatori uniparentali e i pro e contro del loro utilizzo in ambito linguistico e archeologico. La Parte II riassume i risultati delle ricerche condotte nell’ambito del progetto LanGeLin che descrive la diversità dei pattern genetici e linguistici in 36 popolazioni Euroasiatiche. Il progetto LanGeLin (Language and Gene Lineages), finanziato dal “European Research Council” ha lo scopo di testare l’ipotesi di Darwin presentata in “Origine delle specie”. Darwin intuì che l’albero filogenetico delle diverse sottospecie umane, potesse sovrapporsi a quello ottenuto a partire dalle diverse lingue, offrendo di fatto la possibilità di studiare la genealogia delle lingue e allo stesso tempo capire come le differenze tra queste avrebbero permesso di far luce sugli aspetti elusivi della storia demografica umana. R. Sokal e L.L. Cavalli-Sforza nel 1988 hanno elucidato come la comparazione dei vocaboli rifletta la correlazione fra variabilità genetica e linguistica nelle maggiori famiglie linguistiche ma, a causa di metodi linguistici, risulta difficile comparare popolazioni derivanti da gruppi linguistici distanti. Il nuovo metodo linguistico PCM si basa sulle caratteristiche linguistiche più stabili della sintassi. È stato dunque possibile, anche in questa tesi, testare su larga scala geo-linguistica la correlazione tra dati genetici e linguistici. Lo studio delle discendenze materne e paterne è stato condotto separatamente per indagarne le relative storie di migrazione: due differenti storie sono emerse dall’analisi del Ychr (discendenza patrilineare) e del mtDNA (discendenza matrilineare). Non ovvie considerazioni sono scaturite dalla comparazione delle caratteristiche genetiche e linguistiche, che ha portato a definire come la correlazione tra lingue e sequenza genetica sia dipendente dall’area geografica e dai marcatori genetici considerati. La Parte III descrive l’analisi di sequenze di mtDNA del Mesolitico (Ms) che ci ha permesso di indagare sul popolamento della Sardegna in periodo Neolitico (Ne) e pre-Neolitico (pN). Lo studio è stato incentrato su due sequenze mitocondriali sarde Ms in relazione al contesto europeo. C’è ancora molta incertezza sulla variabilità genetica della Sardegna preistorica, a causa della scarsità di resti umani Ne. Dal punto di vista genetico, i sardi moderni possono considerarsi un gruppo a se stante rispetto al resto dell’Europa continentale, mostrando alti livelli di diversità interna e una forte vicinanza con i primi coltivatori europei del Ne. Questa tesi riporta le due prime sequenze mtDNA complete sarde, datate circa 10000 anni fa. I due individui confermano un’occupazione mesolitica dell’isola e rappresentano un aplotipo mai trovato prima in Sardegna mesolitica e con basse frequenze nell’intera Europa. Le due sequenze risultano ben differenziate se comparate con altri dati europei pN, e più simili a popolazioni dell’era pre-glaciale che a popolazioni coeve. Analisi di inferenza Bayesiana hanno mostrato come i primi abitanti dell’isola abbiano contribuito poco al popolamento attuale dell’isola, la cui diversità genetica deriva da migrazioni dal continente in tempi neolitici. Un progetto portato avanti parallelamente, ha riguardato lo studio di frequenze alleliche in gemelli dizigotici provenienti da popolazioni umane africane, europee ed asiatiche. Le tecniche bioinformatiche e biostatistiche usate per le analisi genomiche su larga scala, fanno da collante con i precedenti progetti descritti.
BARBUJANI, Guido
File in questo prodotto:
File Dimensione Formato  
DDR_Tesi_Susca.pdf

Open Access dal 08/04/2018

Descrizione: DDR_Tesi_Susca.pdf
Tipologia: Tesi di dottorato
Dimensione 17.52 MB
Formato Adobe PDF
17.52 MB Adobe PDF Visualizza/Apri

I documenti in SFERA sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11392/2488149
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact