Non solo per gioco: frequenza delle parole

link a Up-Goer Five

Ultimamente molti stanno giocherellando con due editor di testo ispirati da una vignetta di xkcd, intitolata Up Goer Five, in cui il razzo Saturn V viene descritto usando solo le mille parole più comuni dell’inglese (ad es. la capsula, capsule, diventa people box).

Up-Goer Five verifica che le parole inserite siano tra quelle più frequenti in inglese mentre Up-Goer Six colora le parole digitate in base alla loro frequenza, visualizzabile con un clic. Dettagli sul corpus di riferimento in A bit more about the Up-Goer Five Text Editor ed esempi di testo semplificato qui.

L’intento è soprattutto ludico ma si riconosce un aspetto tipico dei linguaggi controllati, come ad es. Basic English e Simplified Technical English, che per facilitare la comunicazione e ridurre le ambiguità consentono di adoperare solo un vocabolario ristretto di parole e termini, il cui uso è verificabile con appositi strumenti (in inglese term checker o language checker).

I dati sulla frequenza delle parole, ricavati da corpora diversi in base alle esigenze, sono usati anche nelle valutazioni di globalizzazione per evidenziare parole inglesi poco comuni e quindi potenzialmente ostiche dal punto di vista E2 (inglese come seconda lingua).
.

Vedi anche: Le 100 parole di inglese di Capello (e di Trapattoni).
.

5 commenti su “Non solo per gioco: frequenza delle parole”

  1. .mau.:

    in realtà non è affatto detto che una parola inglese poco comune sia ostica per gli E2, soprattutto se neolatini 🙂

  2. Nico:

    Vero, è pieno di E2 che non hanno idea di cosa voglia dire “put down” ma capiscono benissimo “humiliate” che per un native speaker è una parola di “un certo livello culturale” 🙂

  3. Licia:

    @.mau. @Nico, infatti, tanto che nei test per “misurare” il proprio vocabolario di inglese le parole di origine latina ci fanno ottenere risultati migliori di altri. Chi parla lingue completamente diverse invece potrebbero non riconoscere parole per noi ovvie come maxi.

    Dai dati di frequenza si possono ricavare indicazioni utili per una prima scrematura ma si tratta spesso di indicazioni che vanno comunque interpretate perché non tutti gli strumenti tengono in considerazione la polisemia e i significati secondari (esempi: il sostantivo common, descritto a proposito delle valutazioni di globalizzazione, e l’accezione poco nota di charm per il termine di Windows 8).

    Un altro fattore cruciale sono i corpora usati, che possono dare risultati parecchio diversi: basti pensare al T9 dei telefonini che suggeriva come prima parola tv come se fosse più probabile di tu, paura di scusa ecc. perché usava come riferimento corpora ricavati da giornali, quindi argomenti e forme verbali diversi da quelli più frequenti invece nelle conversazioni quotidiane (e addirittura suggeriva forme errate come *pò).

  4. Licia:

    @Paolo, grazie del riferimento. Davvero interessante dare un’occhiata alle liste di parole, in particolare la Basic English international wordlist (“These words are similar in many Western languages, are used in diplomacy or schools, or are international standards”) perché ci sono alcune scelte curiose, come beef, hyena e torpedo e poi Imperial ed Empire, ma anche palesi mancanze, come ad es. computer e Internet (vedi Intercomprensione: la parola Internet), che rivelano l’origine britannica e l’età del progetto Basic English.

I commenti sono chiusi.