Terminologia etc.

Terminologia, localizzazione, traduzione e altre considerazioni linguistiche

Post con tag “traduzione automatica”

Traduzione automatica?

Che effetto vi fa la traduzione in italiano sul cartello delle ferrovie austriache visto da @jeperego?

Per favore, azzionare loscarico solamente quando il coperchio est chiusato.  

Si può dare la colpa alla traduzione automatica? 

(altro…)

Traduzione non automatica del baccalà

Google Traduttore compie 10 anni è un post del team di traduzione automatica di Google con alcuni video accattivanti e parecchi dettagli anche insoliti. Dopo la morte di Prince, ad esempio, c’è stato un aumento del 25000% della traduzione della locuzione “purple rain”.

Avrebbe fatto bene a usare Google Traduttore chi si è fidato un po’ troppo delle proprie competenze linguistiche e ha scritto “pioggia porpora” (esempi sotto) o chi ha coniato norvegiano da Norwegian:

Baccalà norvegiano sfuso Foto: Italians

Quasi sicuramente è frutto di traduzione umana anche questo cartello:

(altro…)

Link corrotti: di chi è la colpa?

Purtroppo questa pagina non è disponibile. È possibile che il link che hai seguito sia corrotto o che la pagina sia stata rimossa.

Questo messaggio di errore di Facebook è apparso su Italians sotto il titolo Facebook e il link “corrotto” con un commento divertente di Fabio Zilberstein:

  «La corruzione dilaga anche nei social network. Persino Facebook con i suoi mezzi non puo’ fare a meno dei traduttori automatici. Con il risultato che vedete: “Corrupted link” diventa “link corrotto” (invece che: danneggiato, non corretto…). O forse oggi dovremmo dire link corrott-oso? Sarà colpa del bisestile: anno bisesto, link funesto»

(altro…)

Memoria: quelli che camminano di prova giusto

Titolo sibillino come due voci nel test di diagnostica dei computer Lenovo:

schermata di Lenovo Solution Center

(altro…)

“evacuer without precipitatation”

Viaggio raramente con Trenord, però ieri è capitato e mentre uscivo ho visto le frasi in inglese di questo avviso, che ho fotografato (malamente) al volo:This compartiment is equipe of a detector of fire. […] In the event of declenchement of audible alarm evacuer the compartiment without precipitatation and come into contact with the crew.

Non riesco a trovare una spiegazione logica per questa traduzione assurda.

(altro…)

Google Translate e l’accesso ai cani

Inglese maccheronico su un cartello del Comune di Milano:

Denied access to dogs

Non credo si tratti di traduzione letterale, fatta parola per parola da una persona, perché chi sa che né accessdogs richiedono l’articolo, a differenza dell’italiano, non può non sapere che in inglese quasi sempre il soggetto (access) deve precedere il verbo (denied). 

È più probabile che si tratti di traduzione automatica, eppure basterebbe qualche piccola accortezza per ottenere un risultato accettabile. Va considerato, ad esempio, che le frasi senza verbo o con verbi di modo indefinito di solito risultano più problematiche e che punteggiatura e maiuscole possono influire sulla traduzione.

(altro…)

Se la menta parte…

In 50 disastri di Google Translate (Wired) potete trovare una raccolta divertente di traduzioni assurde condivise sui social network, come questa:

Mint leaves: la menta parte (e le foglie di menta sono finite nel barattolo)
via Isolaria Pacifico

Ma non è sempre colpa della traduzione automatica: gli errori più eclatanti sono molto spesso traduzioni umane fatte letteralmente parola per parola, oppure traduzioni non recenti ottenute con vecchi sistemi di traduzione automatica basati su regole, come era ad esempio Babel Fish su altavista.com.

(altro…)

Altoparlanti intelligenti e “ricognizione vocale”

Da Il mito di Babele rivive in Lexifone, l’app israeliana che traduce in 8 lingue:

’’La nostra macchina interagisce con l’utente ascoltando ciò che dice e traducendo per chi ascolta grazie ad altoparlanti posizionati davanti e dietro per rendere comprensibile ciò che viene detto’’ insiste Itay Sagie. Il sistema – pensato per rendere più economiche le relazioni commerciali – si basa su una “ricognizione vocale” accresciuta con un meccanismo di traduzione chiamato in inglese “computational linguistics” (prende le frasi usate da chi parla e le traduce simultaneamente in un’altra lingua).

Gli errori dei media italiani non sono certo una novità, però mi pare che qui i problemi non siano solo di traduzione ma anche di conoscenze inadeguate e di incapacità di riconoscere affermazioni che non hanno molto senso.

(altro…)

Microsoft Manual of Style

Microsoft Manual of StyleÈ uscita da qualche settimana la quarta edizione di Microsoft Manual of Style (“your everyday guide to usage, terminology, and style for professional technical communications”).

È una pubblicazione molto nota in ambito informatico, utile anche per chi lavora in una lingua diversa dall’inglese perché evidenzia vari aspetti della comunicazione a cui va prestata attenzione, indipendentemente dalla lingua.

Nel blog di Microsoft Press si possono leggere sommario e introduzione e buona parte del terzo capitolo, Content for a worldwide audience (tra i vari argomenti, Machine translation syntax, indicazioni su come scrivere testi adatti alla traduzione automatica).

Questa edizione, a differenza della precedente, non include alcun CD (ed è stampata su carta piuttosto scadente).

Seminario TermITes & CATs

termites_cats_en_smlIl 20 giugno ho partecipato al seminario TermITes and CATs organizzato dalla Terminology Coordination Unit del Parlamento europeo in Lussemburgo, una giornata che ho trovato estremamente interessante, non solo per i contenuti ma anche per il formato: presentazioni al mattino e workshop al pomeriggio. 

Andreas Eisele (Commissione europea) e Alexandros Poulis (Parlamento europeo) hanno illustrato le soluzioni di traduzione automatica che i loro team stanno sviluppando e hanno descritto l’integrazione con gli strumenti di traduzione assistita e altre applicazioni delle tecnologie di traduzione automatica. 

Jap van der Meer (TAUS) con What could we do if we had 100 billion translated words at our disposal? ha fatto una panoramica stimolante di possibili tendenze, cambiamenti e innovazioni nella traduzione e nella gestione dei dati linguistici per i prossimi cinque anni.

La mia presentazione, Multilingual terminology management – a brief overview and best practices, si inseriva nel tema della giornata evidenziando l’aspetto “umano”, essenziale per produrre dati di qualità che possano poi essere utilizzati in modo ottimale negli strumenti di automazione presenti e futuri: una gestione della terminologia efficace aiuta a produrre traduzioni più accurate, quindi a disporre di memorie di traduzione più coerenti e precise che a loro volta, usate per il training dei sistemi di traduzione automatica, possono contribuire a migliorarne l’output.

Nel mio intervento ho introdotto i benefici e alcuni principi teorici della gestione della terminologia di tipo onomasiologico, sottolineando i vantaggi dei sistemi concettuali ma anche i punti deboli. Ho quindi sintetizzato alcuni aspetti del lavoro terminologico, soffermandomi su alcuni problemi ed errori tipici con possibili suggerimenti per prevenirli, infine ho segnalato le indicazioni dello standard ISO 23185 per la valutazione delle risorse terminologiche.

Un caloroso GRAZIE al team TermCoord per l’invito, l’organizzazione perfetta e la grande cordialità.

Si traduce meglio con Google, Yahoo! o Bing?

sito Gabble On Segnalo anch’io un’iniziativa di cui stanno parlando in molti: uno studio di Gabble On per valutare i motori di traduzione automatica di Google, Yahoo! (Babel Fish) e Microsoft (Bing).

Finora sono stati raccolti circa 900 voti per 22 lingue ma per avere dati statisticamente significativi la ricerca si prefigge di arrivare ad almeno a 10000 voti entro la fine di marzo.

Per partecipare: Which Engine Translates Best?  (c’è un Apple iPad in premio).

Vedi anche: post con tag traduzione automatica e in particolare Traduzione automatica: Windows Live Translator per le principali differenze tra motori di traduzione di tipo statistico (Google e Microsoft) e basati su regole (Systran, il sistema usato da Babel Fish).

E visto che è venerdì, per sorridere sulla traduzione automatica e umana: Translation Humor & Mocking Machine Translation (da eMpTy Pages, un bel blog su tecnologie per la traduzione, globalizzazione e collaborazione).

Immagini, traduzione automatica e tazze

Con i sistemi di traduzione automatica di tipo statistico come Google Translate e Microsoft Translator è sempre più difficile vedere traduzioni esilaranti come “addolorisi con i ventilatori dell’ape Gee” (mourn with Bee Gee fans, titolo apparso dopo la dipartita di uno dei cantanti) o “le lampadine della molla” (spring bulbs come tulipani e narcisi).

Qualche sorrisetto può ancora capitare in alcuni siti di immagini stock dove le parole chiave (keyword) associate a ciascuna foto e illustrazione sono presumibilmente vecchie traduzioni fatte con sistemi basati su regole. Ecco qualche risultato in Shutterstock, con l’italiano come lingua di ricerca, per la parola tazza:

alcuni risultati per la parola chiave 'tazza' in Shutterstock.com

Chi parla inglese fa presto i collegamenti: cup non è solamente la tazza tradizionale con il piattino ma anche il bicchiere di carta o di plastica (paper cup e plastic cup) e la coppa data in premio, ad esempio nei tornei di calcio; suction cup è la ventosa e rubber cup una ventosa di gomma, quindi cup plunger spiega lo sturalavandini (da non usare però cup per la tazza del water, che è toilet bowl!).

Mug, invece, è sia il tazzone alto che il boccale da birra. Più divertente, e sicuramente disorientante per chi non conosce l’inglese, il risultato con la foto segnaletica (mug shot, infatti mug è anche un sinonimo informale per faccia) e soprattutto la descrizione associata alla relativa immagine: “colpo della tazza dell’uomo Medio Evo” (mug shot of middle aged man)!

Sono tutti esempi di anisomorfismo, l’impossibilità di far corrispondere tutti i significati di una parola in una data lingua a tutti i significati di una parola in un’altra.

Vedi anche: Espressioni idiomatiche inglesi, per un altro esempio di cupbicchiere, e Traduzione automatica, per le principali differenze tra sistemi basati su regole, come quello probabilmente usato per le traduzioni di mug, e di tipo statistico, come Google Translate.

Aggiornamento dicembre 2010:

vignetta da SO MUCH PUN

Traduzione automatica in Office

Il team MSR-MT (Microsoft Research-Machine Translation) ha rilasciato un plug-in che in pochi secondi installa Microsoft Translator come servizio predefinito di traduzione automatica in Office (per scaricarlo, qui). Maggiori informazioni nel blog del team.

Per tradurre del testo in Office 2007,  scegliere la scheda Revisione, quindi Traduci dal gruppo Strumenti di correzione. In alternativa, selezionare il testo, fare clic con il pulsante destro e scegliere Traduci.

traduzione automatica in Office

Si possono avere opinioni diverse sulla traduzione automatica ma va sottolineato che i servizi come Microsoft Translator e Google Translate sono in continuo miglioramento.

Vedi anche:
Traduzione automatica: Windows Live Translator
Altre informazioni sulla traduzione automatica

Aggiornamento 17 aprile 2009: anche il team di TechNet Italia oggi parla di traduzione automatica in TechNet Magazine e la Machine Translation.

Altre informazioni sulla traduzione automatica

Post pubblicato l’11 settembre 2008 [non aggiornato!] in blogs.technet.com/terminologia

Riprendo l’ultimo post sulla traduzione automatica per aggiungere alcuni riferimenti sull’argomento, tutti però in inglese:

la pagina Machine Translation nel sito Microsoft Research, con una rappresentazione schematica del sistema MT-MSR, una panoramica delle tecnologie linguistiche che integrano l’approccio statistico, le applicazioni pratiche nei prodotti e servizi Microsoft e un elenco di pubblicazioni accademiche;
il blog Microsoft Research Machine Translation (MSR-MT) Team Blog per informazioni e aggiornamenti dal team che ha sviluppato il sistema di traduzione automatica di Microsoft;
la voce Statistical Machine Translation in Wikipedia;
il sito Machine Translation Archive, con elenchi di articoli, bibliografie e risorse sul mondo della traduzione automatica;
il sito Statistical Machine Translation, con una sezione di introduzione alla ricerca nel campo della traduzione automatica di tipo statistico e riferimenti a vari corpora paralleli;
il post The (probable) truth about Austria and Ireland in Language Log, che accenna a un problema che può succedere quando si "addestrano" i sistemi statistici con materiale localizzato.

Vedi anche: altri post con il tag traduzione automatica.

Traduzione automatica: Windows Live Translator

Post pubblicato il 10 settembre 2008 in blogs.technet.com/terminologia. Nel frattempo la traduzione automatica ha avuto sviluppi e miglioramenti molto importanti e il nome del servizio di traduzione automatica di Microsoft è diventato Bing Translator.


Fino a qualche giorno fa il servizio di traduzione automatica di Windows Live Translator offriva due opzioni: la tecnologia Microsoft Research per testo con contenuto informatico e un sistema di terze parti, sviluppato da Systran, per testo generico, come si può vedere in questa vecchia schermata:

Live Translator - vecchia versione

Lunedì il team MSR-MT ha annunciato che ora tutte le coppie di lingue disponibili in Windows Live Translator, tra cui italiano-inglese e inglese-italiano, utilizzano solamente tecnologia Microsoft:

Live Translator -  nuova versione

Ho fatto un po’ di prove e i risultati sono decisamente migliorati.

L’annuncio è interessante anche perché il sistema di traduzione automatica sviluppato da Microsoft (MSR-MT) è un sistema ibrido con un motore di tipo statistico mentre il modello Systran, che continua ad essere usato ad es. da Babel Fish, era principalmente basato su regole. Anche Google l’anno scorso è passata definitivamente da Systran a un proprio sistema di tipo statistico per tutte le coppie di lingue.

Semplificando al massimo, i sistemi basati su regole analizzano il testo di partenza per poi generare il testo di arrivo applicando regole di trasformazione. Per ogni lingua nel sistema è necessario definire regole precise di tipo morfologico, sintattico e semantico e un lessico di riferimento.

I sistemi di tipo statistico come quello Microsoft, invece, vengono "addestrati" (il training) con milioni di frasi da testi paralleli, ovvero testo originale e relativa traduzione umana. Non è necessario definire regole individuali per ciascuna lingua perché il sistema "impara" a riconoscere le corrispondenze tra parole e segmenti di frase in ogni coppia di lingue e assegna una probabilità più alta alle associazioni più ricorrenti, in modo da poterle poi riprodurre in fase di traduzione applicando altri algoritmi e parametri statistici.

Inizialmente il motore di traduzione MSR-MT era focalizzato su contenuto di tipo informatico perché era destinato alla traduzione automatica di articoli del sito Aiuto & Supporto (Knowledge Base). Il training era effettuato in particolare con le memorie di traduzione dei prodotti Microsoft.

Per il training di un sistema di tipo statistico sono necessari notevole potenza di elaborazione e corpora bilingui enormi. Ovviamente qualità, varietà e quantità dei corpora usati per il training sono tra i tanti fattori che incidono sul risultato finale: se il sistema non è stato esposto a particolari tipi di testo, potrebbe avere più difficoltà a tradurli in maniera soddisfacente.

Negli ultimi anni sono aumentate le iniziative per la condivisione di memorie di traduzione, ad es. da parte della Commissione europea. L’accesso a corpora paralleli vastissimi e diversificati e a computer sempre più potenti non può che dare un ulteriore impulso al perfezionamento dei sistemi di traduzione automatica ibridi con un motore di tipo statistico.

I margini di miglioramento sono comunque veramente ampi, come sanno tutti quelli che hanno avuto a che fare con testo tradotto automaticamente. Chi lavora in questo campo non è certo a rischio di disoccupazione!

Vedi anche: Altre informazioni sulla traduzione automatica.


Aggiornamento: un video di Google, con sottotitoli in italiano, che spiega come funziona il proprio sistema di traduzione automatica e sintetizza le differenze tra sistemi basati su regole e di tipo statistico: