Abstract Paolo Monella, Scritture dimenticate, scritture colonizzate: sistemi grafici e codifiche digitali

Versione italiana più breve

Introduzione

Le società che elaborano una tecnologia, la modellano sulla loro cultura. Le altre, subiscono la pressione a rimodellare la propria cultura sulla tecnologia. Esporrò alcune riflessioni su come le attuali tecnologie di codifica digitale del testo rappresentino e manipolino due sistemi grafici non-occidentali, quello indiano (devánāgarī) e quello arabo.

Tre principi gutenberghiani

L'avvento della tecnologia della stampa in Europa nell'Età moderna ha lentamente rimodellato il sistema grafico latino, come quello greco e quello cirillico, su un modello rigidamente "alfabetico", ovvero sulla base di tre principi che valevano alle origini degli alfabeti greco e latino, ma già non più per i complessi sistemi chirografici, ovvero di scrittura manoscritta, sviluppatisi in età medievale:

Principi non universali

Questi tre principi non valevano per i sistemi grafici dei manoscritti del medioevo europeo), e ancor oggi non valgono per sistemi grafici non occidentali, neanche nella loro versione a stampa. In molte scritture infatti i segni concepiti come diacritici orbitano intorno (sopra, sotto, davanti o dietro) grafemi-base. I moltissimi e diversi esempi includono i diacritici greci (iota sottoscritto, spirito aspro), le vocali nella scrittura devánāgarī e in quella ebraica, gli ḥarakāt arabi (indicanti vocali brevi), per non accennare neanche alle scritture dell'Asia orientale (giapponese, coreana, cinese), che non hanno struttura alfabetica.

Rischi digitali

Se l'applicazione della stampa ai sistemi grafici dell'India (devánāgarī) e del Medio Oriente (arabo) non ha avuto un enorme impatto "normalizzatore", e quindi di fatto "occidentalizzante", rischiano di fare di peggio le tecnologie digitali di codifica del testo che, sviluppate soprattutto negli Stati Uniti e in Occidente, sono basate sui principi della stampa occidentale.

Devánāgarī

Nella scrittura indiana devánāgarī, che scorre da sinistra a destra come quella latina, le vocali si legano alle consonanti formando di fatto con esso un simbolo sillabico unico. In alcuni casi una vocale si lega, e quindi si scrive, non a destra ("dopo"), ma a sinistra ("prima") della consonante che modifica, contraddicendo il principio gutenberghiano della sequenzialità unidirezionale dei grafemi (1, 2, 3…).

Non si tratta di una inversione arbitraria della direzione della scrittura, ma di una conseguenza del fatto che le vocali in questo sistema scrittorio hanno lo status di "modificatori" delle consonanti (contraddicendo il principio gutenberghiano 1 = 1). Tra l'altro, la concezione indiana della fonetica che sta dietro a questo uso grafico appare pienamente razionale, non meno di quella retrostante agli alfabeti occidentali, se si consideri come nell'articolazione fonica consonanti e vocali abbiano effettivamente status molto diversi, e si articolino in strettissima correlazione gli uni alle altre nell'unità fonica della sillaba.

Il modello di codifica del testo di ASCII o di Unicode, invece, ignora la distinzione di status e il rapporto reciproco tra vocali e consonanti devánāgarī, ma attribuisce a tutte indifferentemente un numero identificativo ("code point") e le giustappone semplicemente le une alle altre. Una parola hindi codificata tramite le attuali tecnologie digitali viene dunque convertita in una sequenza ordinata di numeri/codici, tutti sullo stesso livello.

La contraddizione tra il modello eurocentrico retrostante e la specificità culturale indiana esplode quando si rappresenta una sillaba come "pi". La sua codifica Unicode è la sequenza U+092A ("p") U+093F ("i"), in cui la "i" viene dopo; ma in scrittura devánāgarī la vocale ि "i" va scritta a sinistra ("prima") della consonante प "p": "पि". La "inversione" viene effettuata dal software solo a livello di visualizzazione, nascondendo il fatto che la codifica impone un modello occidentale al sistema grafico indiano.

Arabo

All'interno del sistema grafico arabo, ricco di segni diacritici, farò solo l'esempio degli ḥarakāt, i segni che, aggiunti sopra o sotto un grafema consonantico, indicano la vocale breve con cui esso va pronunciato.

Assumendo un punto di vista interno alla cultura araba, gli ḥarakāt contraddicono tutti e tre i principi enunciati sopra:

Ancora una volta, invece, ASCII e Unicode attribuiscono agli ḥarakāt un numero identificativo ("code point") alla pari dei grafemi consonantici e delle vocali lunghe. Anche le parole arabe, rappresentate tramite le attuali (occidentali) tecnologie digitali, vengono dunque ridotte ad una sequenza ordinata di numeri equivalenti.

Attriti

Anche nel caso dell’arabo, come del devánāgarī, la forzatura non è apparente nella fase dell'input e in quella della visualizzazione, grazie a software che gestiscono la digitazione da tastiera (reale o virtuale) e la ri-composizione su schermo dei grafemi, legature e diacritici inclusi.

Esiste però un attrito tra il modello occidentale alla base della tecnologia e la cultura non-americana cui il modello viene imposto, e questo emerge quando si passa dalla codifica all'elaborazione digitale del testo. Basterà l'esempio della più semplice delle elaborazioni: la ricerca testuale semplice. Un utente arabo che eseguisse una ricerca in una pagina web di una parola, digitandola con gli ḥarakāt, avrebbe molte probabilità (a seconda delle funzionalità del software che sta usando) di non trovare le istanze di quella parola scritte senza gli ḥarakāt - e viceversa. Il problema, originandosi dalla codifica, si riverbera su ogni tipo di ricerca testuale, dall'interrogazione di un database alle ricerche sul web, a meno che software specifici non siano stati istruiti a superarlo.

Arabīzī

Per quanto riguarda l'arabo, ho scritto che, in fase di input, tastiere e tastierini virtuali permettono di mascherare il problema della codifica "occidentalizzante". Questo è vero quando lo scrivente ha davanti la tastiera fisica di un computer e scrive in fuṣḥā, cioè nella variante "alta" e unitaria della lingua che, integrata in età contemporanea con numerosi neologismi, discende direttamente dalla lingua del Corano.

Ma quando i giovani messaggiano tra di loro in lingua vernacolare (cioè nelle varianti locali dell'arabo) scrivendo sul tastierino di un cellulare o di un tablet, tendono sempre più a scrivere l'arabo in caratteri latini, più semplici da inserire in quei contesti, in quanto i sistemi operativi di quei dispositivi sono stati disegnati in occidente, e successivamente adattati all'input in caratteri arabi.

Il codice risultante è comunemente chiamato "Arabīzī" (Arabi + Anglizi) o "Franco-Arabic", e mescola lettere latine e numeri (come il "3", usato per la lettera "ʿayn" ع che non ha corrispettivi né fonetici né grafici nell'alfabeto latino). In esso, le vocali brevi possono venire indicate (con "a", "i", "u"), e non viene usato alcun diacritico, ad esempio per distinguere le vocali brevi dalle lunghe. In pratica, la codifica usata è la più semplice, la più "standard" e quindi la più restrittiva possibile, quella ASCII.

Questo è un aspetto che spesso si sottovaluta: le tecnologie possono aiutare nella codifica e la trascodifica da/in linguaggi non-americani - ad esempio, le ricerche su Google usano algoritmi straordinariamente evoluti, che superano molti problemi di "spelling" e codifica -, ma non tutte le tecnologie sono disponibili in tutti i contesti. Su un cellulare è molto più comodo digitare in ASCII che in arabo.

L'impatto politico

Sarebbe difficile argomentare che questa "colonizzazione tecnologica" della scrittura sia frutto di una pianificazione ostile contro le culture non-occidentali. Ma ugualmente essa ha implicazioni politiche, in quanto la scrittura, e la concezione della lingua ad essa retrostante, costituiscono aspetti centrali di molte culture, spesso sentiti come identitari. Il caso dell'arabo è più che evidente.

Agli inizi de Novecento, la Turchia e i popoli arabi si allontanarono l'una dagli altri, lacerando l'Impero Ottomano. Da un lato, i turchi in cerca di un'identità nazionale di stampo europeo abbandonarono la scrittura araba per quella latina. Questa, a detta dello stesso Atatürk, si adattava meglio alle specificità fonetiche della lingua turca, in cui, peraltro, le vocali sono più numerose e hanno un ruolo morfologico più pesante rispetto alla lingua araba. Di converso, i popoli arabi e maghrebini, ribelli ad un impero sempre meno ottomano e sempre più turco, trovarono proprio nel sistema scrittorio arabo uno dei simboli identitari in quella lotta.

Oggi, per quanto possa sembrare sorprendente ad un occidentale, proprio la struttura sostanzialmente sillabica della scrittura araba, con la sua distinzione di status tra consonanti, vocali lunghe e vocali brevi, ha una funzione identitaria. Essa gioca un ruolo importante nel costruire l'idea dell'unità della cultura dei popoli di lingua araba e tradizione islamica nel tempo - dal Corano ad oggi - e nello spazio - dal Marocco all'Iraq.

Come già accennato, nella percezione di chi parla l'arabo e nella sua tradizione grammaticale, consonanti e vocali lunghe bastano a identificare per iscritto la radice della parola, mentre la parte della morfologia demandata alle consonanti è demandata alla competenza del lettore.

Ma c'è di più in gioco: i grafemi di consonanti e vocali lunghe di una parola - cioè la parte che viene normalmente scritta - rimangono sostanzialmente uguali nel tempo, cioè non variano significativamente dall'arabo classico del Corano al "Modern Standard Arabic" (MSA), e nello spazio, cioè nelle aree geografiche. Al contrario l'effettiva pronuncia di alcune vocali, e soprattutto delle vocalizzazioni, non a caso tenute fuori dalla scrittura e demandate a segni diacritici, sono più variabili nel tempo e ancor più nelle varianti locali della lingua.

Una parola in fuṣḥā è la stessa parola nel passato del Corano e nel presente, a Est come ad Ovest, cioè in tutta la storia della cultura araba (per lo più identificata con la storia dell'Islam), e in tutto lo spazio geografico della Umma (la comunità dele società di tradizione islamica), finché se ne scrivono solo le consonanti e le vocali lunghe, cioè solo all'interno del sistema grafico arabo. Scrivere la vocalizzazione, o meglio pertinentizzarla, cioè renderla significativa nel sistema grafico, significa rompere l'unità culturale (e quindi sociale, e potenzialmente politica) del mondo arabo-islamico.

Questo contribuisce, credo, a spiegare il fastidio nel mondo arabo per l'"Arabīzī", in cui non a caso si mescolano più liberamente anglismi alla lingua araba.

Probabilmente, se i computer fossero stati inventati in Arabia Saudita o in Israele, c'è da credere che anche la modellizzazione dell'alfabeto sarebbe stata plasmata intorno alla struttura specifica delle lingue semitiche, cioè codificando, almeno per alcuni sistemi grafici, alcuni grafemi (consonanti e vocali lunghe nella scrittura araba, le consonanti nella scrittura ebraica o devánāgarī) come strutturali e altri come diacritici modificatori di quelli.

Un modello di codifica di questo genere è senz'altro possibile, dal punto di vista tecnologico. Io stesso ho usato il markup testuale TEI XML nella mia edizione del "De nomine" di Orso Beneventano (IX secolo, http://www.unipa.it/paolo.monella/ursus) per codificare la differenza di status tra grafemi-base e diacritici abbreviativi nel sistema grafico latino medievale manoscritto. La tecnologia c'è - se c'è l'interesse strategico. La questione non è tecnologica, ma politica.

Postilla: speranze

Una postilla: in queste considerazioni finali mi sono concentrato sulla cultura araba. In essa le reazioni al profondo disagio sociale e politico prendono a volte, più spesso di quanto vorremmo, le forme del fondamentalismo religioso e della violenza. Non intendo ignorare la questione, per quanto non ci sia ovviamente spazio in questa sede per esaminarla a fondo. Personalmente, se da un lato condanno nettamente gli esiti fondamentalisti e quelli violenti, dall'altro penso che la difesa di un'identità e di unità culturale araba sia una reazione comprensibile di fronte al percepito sfruttamento occidentale.

Lo scenario ideale, dal mio punto di vista, sarebbe quello di un Medio Oriente socio-economicamente florido e politicamente libero, non sfruttato nello scenario della globalizzazione e non oppresso da regimi locali complici. Un Medio Oriente che conservi la propria identità culturale, inclusa la specificità della propria lingua e quindi della propria scrittura, nel tempo e nello spazio, senza bisogno di fare di quell'identità un'arma di difesa o di offesa.

Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione - Condividi allo stesso modo 4.0 Internazionale.