Tipologie I sistemi di traduzione automatica possono essere classificati nei seguenti gruppi:
Traduzione basata su regole La traduzione automatica basata su regole, che comprende la traduzione basata sul principio del trasferimento (transfer) e quella basata sull'uso di una interlingua (o "lingua pivot"), è al giorno d’oggi il paradigma prevalente per la traduzione automatica. Le parole vengono tradotte secondo un punto di vista prettamente linguistico scegliendo gli equivalenti linguistici più appropriati. La traduzione automatica basata su regole utilizza in genere un processo traduttivo suddiviso in tre fasi. Nella prima fase, nota come fase di analisi, il sistema esegue il parsing delle frasi del testo di partenza e le trasforma in diagrammi ad albero (morfologici, sintattici e/o semantici). Nella seconda fase, detta fase di trasferimento, gli alberi sintattici creati per il testo di partenza vengono trasformati in altrettanti alberi con la struttura sintattica della lingua d’arrivo. Nella terza fase, chiamata fase di generazione o sintesi, le parole della lingua di partenza vengono tradotte nella lingua d’arrivo e inserite nell’albero d’arrivo seguendo le regole sintattiche proprie della lingua medesima al fine di creare frasi di senso compiuto. Una tecnica particolare della traduzione automatica basata su regole è quella che parte da un linguaggio intermedio ("interlingua"). Rispetto al sistema di traduzione diretta, parola per parola, in questo caso la lingua d’origine del testo da tradurre viene trasferita a una lingua intermedia, la cui struttura è indipendente da quella della lingua originale e da quella della lingua finale. Il testo nella lingua di destinazione viene ottenuto a partire dalla rappresentazione del testo nella lingua intermedia. Traduzione tramite corpora La tipologia di traduzione automatica che utilizza corpora linguistici paralleli, si basa sull’analisi di campioni reali e delle loro traduzioni corrispondenti. Fra questi sistemi, quello principale è la traduzione automatica statistica, abbreviata in SMT (Statistical Machine Translation). L’obiettivo di questa tecnologia è generare traduzioni a partire da metodi statistici basati su corpora di testi bilingui e monolingui. Affinché la SMT funzioni correttamente è necessario mettere a disposizione del sistema due banche dati piuttosto corpose: una di testi nella lingua di partenza con le relative traduzioni nella lingua d'arrivo e un’altra di testi solo nella lingua d’arrivo. Di fronte a un nuovo testo da tradurre, il sistema genera possibili traduzioni delle sequenze di parole che trova nel testo stesso sulla base delle corrispondenze che riscontra nella prima banca dati. Tra le varie proposte di traduzione seleziona poi la migliore sulla base della seconda banca dati, quella relativa alla sola lingua d’arrivo. Il vantaggio della traduzione automatica statistica è che, una volta impostato il sistema secondo le specifiche richieste dal cliente, questi ha a disposizione uno strumento in grado di fornire una discreta qualità traduttiva di testi simili tra loro. Il lato negativo è che, affinché il sistema fornisca risultati di un certo livello, occorre mettere a sua disposizione un corpus molto sostanzioso di traduzioni esistenti e approvate. Come si può facilmente immaginare, con questa tecnologia la qualità della traduzione aumenta all’aumentare della dimensione dei corpora linguistici nelle banche dati. Con un insieme sterminato di traduzioni esistenti e di testi nella lingua d’arrivo, si potrebbero ottenere risultati eccellenti con testi di argomento similare. Il primo programma di traduzione automatica statistica fu Candide, sviluppato da IBM. Language Weaver, il principale fornitore di sistemi di traduzione automatica statistica a livello mondiale, per ogni combinazione linguistica consiglia un corpus bilingue minimo di due milioni di parole, ma si tratta di un valore molto inferiore rispetto a quello necessario per ottenere traduzioni accettabili. Per questo motivo e anche per il costo tendenzialmente superiore rispetto ad alcuni sistemi basati su regole, i sistemi di traduzione automatica statistica vengono usati quasi unicamente da agenzie governative e da multinazionali. Traduzione basata sul contesto La traduzione automatica basata sul contesto si basa sulla ricerca della migliore traduzione di una parola prendendo in considerazione il resto delle parole che la circondano. Il sistema suddivide un testo in unità di quattro/otto parole e propone traduzioni di ogni sequenza nella lingua di destinazione eliminando le traduzioni che contengono frasi senza senso. Tale filtraggio utilizza uncorpus nella lingua di destinazione, nel quale viene conteggiato il numero di volte in cui compare la frase cercata. In seguito la sequenza creata viene spostata di una posizione (una parola), ritraducendo la maggior parte dei vocaboli e filtrando nuovamente il testo in modo da lasciare solo le frasi coerenti. Tale procedimento viene ripetuto per tutto il testo. Nella fase finale vengono concatenati i risultati di ciascuna sequenza in modo da ottenere un’unica traduzione del testo. La traduzione automatica basata sul contesto presenta un grande vantaggio rispetto alle altre tecnologie di traduzione automatica basate su corpora linguistici: aggiungere nuove lingue è molto facile. Per inserire una nuova lingua, infatti, non è necessario tradurre milioni di parole come nei metodi statistici: sono sufficienti due corpora linguistici di dimensioni ridotte: un buon dizionario elettronico, contenente regole che permettano al sistema di coniugare correttamente i verbi e di accordare aggettivi e sostantivi in base al genere e al numero, e un corpus nella lingua di destinazione, che può essere facilmente reperito su Internet. Oggi i software più sofisticati offrono la possibilità di fissare parametri specifici a seconda del settore in cui si esegue la traduzione per ottenere risultati più accurati. Ad esempio si può limitare la quantità di sostituzioni permesse oppure selezionare i nomi propri e aiutare il software a riconoscere la terminologia e la fraseologia più ricorrenti. Queste tecniche sono particolarmente utili in campi dove si impiega un linguaggio formale basato su moduli, come gli annunci nelle stazioni dei treni e negli aeroporti, i documenti legali e amministrativi o le previsioni del tempo. Traduzione automatica mediante lingua intermedia La traduzione automatica mediante lingua intermedia è una delle strategie classiche di traduzione automatica. L'idea fondamentale di questo metodo indiretto di traduzione è di tradurre il testo iniziale in una lingua intermedia, indipendente dalle altre due (iniziale e finale), per tradurre successivamente nel linguaggio di destinazione. Bibliografia
0 Commenti
Lascia una risposta. |
Segreteria studenti
08527754 WhatsApp
327 4915165 e.mail
info@scuolainterpreti.it Archivio
Marzo 2020
|