Questa clamorosa scoperta ha innescato la creazione di un metodo scientifico (basato sull’individuazione di corrispondenze fra i suoni delle parole, che permettono di ricostruirne l’etimologia, cioè l’origine storica) per confrontare lingue, antiche e moderne, anche molto diverse, e individuare relazioni genealogiche. Ne è emersa una classificazione in famiglie linguistiche, la cui evoluzione è stata ricostruita e datata con accuratezza, risalendo fino a circa quattro-cinquemila anni dalle prime attestazioni. Entro questi limiti temporali, il metodo della linguistica storica, che recentemente è stato integrato con sofisticate tecniche quantitative e computazionali, ha prodotto risultati solidissimi.

Superare i limiti dei metodi tradizionali per ricostruire il passato a una profondità temporale più ampia è stata a lungo una sfida aperta per i linguisti: la forma delle parole, che è la base del metodo comparativo, si rinnova infatti molto rapidamente; quindi, dopo un certo lasso di tempo, nessuna corrispondenza è più identificabile. Intorno a questo problema si concentra la ricerca di un gruppo di studiosi che lavorano fra l’università di York e l’università di Modena e Reggio Emilia (Unimore), con collaborazioni con l’Italia (Trieste), il Regno Unito (Cambridge) e gli Stati Uniti (Ucla). L’intuizione che guida le nostre ricerche è che, per fare un salto di qualità, è necessario utilizzare proprietà profonde, che cambino molto lentamente nel tempo e conservino traccia di una comune origine anche dopo moltissimi anni dalla separazione.

Una delle nostre fonti d’ispirazione è la genetica delle popolazioni. La chiave che ha permesso a questa disciplina di fare scoperte rivoluzionarie sulla storia dell’umanità fu infatti un cambiamento radicale nel tipo di caratteri utilizzati per confrontare le popolazioni e ricostruirne le parentele: i tratti genetici (oggi genomici), come si sa, solo in parte hanno manifestazioni fenotipiche visibili, ma per il resto sono invisibili in superficie e come tali sono meno soggetti a cambiamenti indotti da fattori esterni. Grazie a ciò è stato possibile ricostruire la storia delle migrazioni umane con un’accuratezza che prima sarebbe stata impossibile.

Anche nelle lingue esistono entità simili ai marcatori genetici, codificate negli ultimi settant’anni sotto l’impulso delle scoperte del linguista statunitense Noam Chomsky. Le strutture sintattiche sono il dna delle lingue, lo scheletro sul quale si basano le frasi che pronunciamo, l’impalcatura sulla quale si innestano le parole.

I vantaggi di questi caratteri per la ricostruzione storica sono almeno due: (1) sono universali, cioè presenti in tutte le lingue, perché codificate biologicamente; quindi, qualunque lingua può essere confrontata con qualunque altra anche in assenza di somiglianze superficiali; (2) hanno una codifica binaria: ciò significa che per qualunque coppia di lingue è possibile misurare oggettivamente somiglianze e differenze, e calcolare distanze. I risultati sono poi processabili mediante algoritmi automatici che ricostruiscono alberi genealogici (gli stessi usati dai biologi per classificare le popolazioni) e sottoposti a test di robustezza statistica. Su questi presupposti si fonda il metodo di comparazione parametrica.

Le nostre ricerche hanno provato che le strutture sintattiche contengono un segnale storico. Esplorandolo possiamo ricostruire relazioni genealogiche a una profondità maggiore rispetto a quella raggiunta dai metodi comparativi tradizionali. In un lavoro pubblicato su Philosophical Transactions of the Royal Society B, abbiamo esplorato le parentele tra certe lingue parlate in Europa e in Asia. Attraverso simulazioni statistiche, abbiamo identificato una soglia che definisce la probabilità che due lingue condividano un certo numero di somiglianze per ragioni casuali.

La scoperta più interessante è che sotto questa soglia ricadono non solo tutte le famiglie note (per esempio l’indoeuropeo, l’uralico o il semitico), ma anche gruppi per i quali, fino a oggi, non esisteva prova di parentela: è il caso, per esempio, delle cosiddette lingue altaiche. E c’è di più: gli esperimenti suggeriscono una relazione tra le lingue altaiche e quelle uraliche, e una possibile parentela tra il coreano e il giapponese, la cui relazione storica non era mai stata provata per mancanza di corrispondenze fonetiche.

Infine, una scoperta ancora più sorprendente è una probabile relazione tra le lingue caucasiche nordorientali e le lingue dravidiche, parlate soprattutto nel sud del continente indiano. Questa affinità si può spiegare con l’ipotesi che molto probabilmente gli antenati di queste lingue erano parlati nella stessa area geografica, tra la parte orientale della Mezzaluna Fertile e l’attuale Iran occidentale. Molte di queste ipotesi sono anche sostenute da studi sul dna antico e moderno, descritti nel libro di David Reich Chi siamo e come siamo arrivati fin qui, tradotto in italiano nel 2019.

Queste scoperte confermano che le somiglianze sintattiche codificano relazioni storiche, e che esplorare il segnale storico contenuto nelle strutture profonde significa scoprire eventi e contatti antichissimi che arricchiscono la nostra conoscenza della storia umana.