n this work we apply techniques from computational Authorship Veri- fication (AV) to the problem of detecting whether the “Epistle to Can- grande” is an authentic work by Dante Alighieri or is instead the work of a forger. The AV algorithm we use is based on “machine learning”: the algorithm “trains” an automatic system (a “classifier”) to detect whether a certain Latin text is Dante’s or not Dante’s, by exposing it to a corpus of example Latin texts by Dante and example Latin texts by authors coeval to Dante. The detection is based on the analysis of a set of stylometric features, i.e., style-related linguistic traits whose us- age frequencies tend to represent an author’s unconscious “signature”. The analysis carried out in this work suggests that, of the two parts into which the Epistle is traditionally subdivided, neither is Dante’s. Experi- ments in which we have applied our AV system to each text in the corpus suggest that the system has a fairly high degree of accuracy, thus lending credibility to its hypothesis about the authorship of the Epistle. In the last section of this paper we apply our system to what has been hypothesized to be “Dante’s 14th Epistle”; the system rejects, with very high confi- dence, the hypothesis that this epistle might be Dante’s.
Questo lavoro applica tecniche automatiche di “Authorship Verification” (AV) al problema di riconoscere se l’“Epistola a Cangrande” sia un’o- pera autentica di Dante Alighieri o sia invece opera di un falsario. L’al- goritmo di AV che viene utilizzato usa tecniche di “machine learning”: esso “addestra” un sistema automatico (un “classificatore”) a rilevare se un certo testo latino è di Dante o meno, esponendolo a un corpus di testi latini di Dante e di testi latini di autori coevi a Dante. L’algoritmo basa le sue ipotesi sull’analisi di un insieme di caratteristiche stilome- triche, cioè di tratti linguistici legati allo stile, le cui frequenze d’uso tendono a rappresentare la “firma” inconscia di un autore. L’analisi condotta in questo lavoro suggerisce che, delle due parti in cui l’Epistola è tradizionalmente suddivisa, nessuna è di Dante. Esperimenti in cui lo stesso sistema di AV è stato applicato a ciascun testo del corpus sugge- riscono che esso ha un grado di accuratezza abbastanza elevato, dando così credibilità alla sua ipotesi sulla paternità dell’Epistola. Nell’ultima sezione di questo lavoro applichiamo il nostro classificatore a quella che è stata ipotizzata essere la “14a Epistola di Dante”; il sistema rigetta, con grande sicurezza, l’ipotesi che questa epistola possa essere di Dante.
L’Epistola a Cangrande al vaglio della Computational Authorship Verification: risultati preliminari (con una postilla sulla cosiddetta “XIV Epistola di Dante Alighieri”)
Corbara, Silvia;Tavoni, Mirko
2020
Abstract
n this work we apply techniques from computational Authorship Veri- fication (AV) to the problem of detecting whether the “Epistle to Can- grande” is an authentic work by Dante Alighieri or is instead the work of a forger. The AV algorithm we use is based on “machine learning”: the algorithm “trains” an automatic system (a “classifier”) to detect whether a certain Latin text is Dante’s or not Dante’s, by exposing it to a corpus of example Latin texts by Dante and example Latin texts by authors coeval to Dante. The detection is based on the analysis of a set of stylometric features, i.e., style-related linguistic traits whose us- age frequencies tend to represent an author’s unconscious “signature”. The analysis carried out in this work suggests that, of the two parts into which the Epistle is traditionally subdivided, neither is Dante’s. Experi- ments in which we have applied our AV system to each text in the corpus suggest that the system has a fairly high degree of accuracy, thus lending credibility to its hypothesis about the authorship of the Epistle. In the last section of this paper we apply our system to what has been hypothesized to be “Dante’s 14th Epistle”; the system rejects, with very high confi- dence, the hypothesis that this epistle might be Dante’s.File | Dimensione | Formato | |
---|---|---|---|
Epistola_a_Cangrande.pdf
Accesso chiuso
Tipologia:
Published version
Licenza:
Non pubblico
Dimensione
1.11 MB
Formato
Adobe PDF
|
1.11 MB | Adobe PDF | Richiedi una copia |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.