El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics

Autor:Josep Àngel Mas Castells
Càrrec:Doctor en filologia per la Universitat de València
Pàgines:208-222
RESUMEN

Els correctors i els traductors automàtics proporcionen una ajuda de primer ordre per a l’ús de la llengua en l’àmbit digital, en un moment en què el canal escrit hi és el més utilitzat. En llengües minoritzades i pluricèntriques com la nostra, la manera en la qual les aplicacions d’assistència ortogràfica i gramatical gestionen la variació lingüística admesa per la normativa, és a dir, les variants que configuren les especificitats dels tres grans paraestàndards del català, pot influir decisivament en la percepció de la unitat de la llengua i en la seguretat lingüística dels parlants, sobretot dels més llecs en qüestions lingüístiques. El present estudi analitza aquesta gestió, tant la manera que trien aquests programes per a presentar la nostra llengua entre la resta d’opcions lingüístiques com la gestió efectiva de les variants, que pot anar des de l’opció única -opció, per tant, més restrictiva que la mateixa normativa- fins a la de reflectir el mateix polimorfisme que l’IEC o l’AVL organitza o no per paraestàndards, en una panoràmica de resultats considerablement heterogènia.

 
CONTENIDO
EL PLURICENTRISME DE LA LLENGUA CATALANA EN ELS PRINCIPALS
CORRECTORS I TRADUCTORS AUTOMÀTICS
Josep Àngel Mas Castells*
Resum
Els correctors i els traductors automàtics proporcionen una ajuda de primer ordre per a l’ús de la llengua en l’àmbit
digital, en un moment en què el canal escrit hi és el més utilitzat. En llengües minoritzades i pluricèntriques com la
nostra, la manera en la qual les aplicacions d’assistència ortogràca i gramatical gestionen la variació lingüística admesa
per la normativa, és a dir, les variants que conguren les especicitats dels tres grans paraestàndards del català, pot
inuir decisivament en la percepció de la unitat de la llengua i en la seguretat lingüística dels parlants, sobretot dels més
llecs en qüestions lingüístiques. El present estudi analitza aquesta gestió, tant la manera que trien aquests programes
per a presentar la nostra llengua entre la resta d’opcions lingüístiques com la gestió efectiva de les variants, que pot
anar des de l’opció única —opció, per tant, més restrictiva que la mateixa normativa— ns a la de reectir el mateix
polimorsme que l’IEC o l’AVL organitza o no per paraestàndards, en una panoràmica de resultats considerablement
heterogènia.
Paraules clau: pluricentrisme; traducció automàtica; correcció automàtica; variació lingüística; nom de la llengua.
THE PLURICENTRISM OF CATALAN IN THE MAIN AUTOMATIC SPELL-CHECKERS AND TRANSLATION
TOOLS
Abstract
Automatic spell-checkers and translation tools provide an excellent support for language use in the digital world
at a time when written communication channels prevail. For pluricentric and minority languages such as Catalan,
the way in which spelling and grammar tools handle the linguistic variation permitted by linguistic standards (the
distinct variants represented by the three main parastandards of Catalan) can have a decisive impact on the perceived
unity of the language and how secure its speakers feel in its usage, particularly those with little understanding of
language issues. The present study analyses the aforementioned handling of linguistic variation, taking into account
(1) the way programmes choose to present Catalan (from amongst the language options available) and (2) the effective
management of linguistic variants, which can range from just one (an option more restrictive than the legislation) to a
reection of the same polymorphism that the Institute of Catalan Studies (IEC) or the Valencian Academy of Language
(AVL) may organise in terms of parastandards, with highly varied results.
Keywords: pluricentricity; automatic translation; automatic correction; linguistic variation; name of the language.
* Josep Àngel Mas Castells, doctor en lologia per la Universitat de València i professor titular del Departament de Lingüística
Aplicada de la Universitat Politècnica de València. El seu camp de recerca és l’estandardització del valencià, tant pel que fa al corpus
com a l’estatus. jamas@upv.es
Article rebut el: 17.10.2018. Avaluacions cegues: 12.03.2019 i 25.03.2019. Acceptació de la versió nal: 06.05.2019.
Citació recomanada: Mas Castells, Josep Àngel. (2019). El pluricentrisme de la llengua catalana en els principals correctors i
traductors automàtics. Revista de Llengua i Dret, Journal of Language and Law, 71, 208-222. https://doi.org/10.2436/rld.
i71.2019.3229
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 209
Sumari
Introducció
1 La variació diatòpica en els usos formals: el pluricentrisme de la llengua catalana
2 Objectius i hipòtesis
3 Metodologia
4 Resultats
4.1 El(s) nom(s): la presentació de la llengua
a) Català
b) Català general / català valencià
c) Català-valencià-balear
d) Català/valencià
4.2 Les variants: la representació de la llengua
5 Conclusions
Referències bibliogràques
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 210
Introducció
Les aplicacions de correcció i de traducció suposen una ajuda com no s’havia vist mai a la producció
escrita en les llengües que hi tenen accés. El fet que corregisquen automàticament errades ortogràques i
gramaticals o que subratllen en diferents colors mots i expressions de correcció o adequació dubtosa i que
ns i tot en proposen alternatives, sens dubte facilita l’expressió escrita dels parlants. I això s’esdevé en un
temps en què, també gràcies a la digitalització, en aquest cas de les eines de comunicació dites xarxes socials,
probablement hi ha més població que posa en pràctica les habilitats escrites a diari que mai. Ni que siga en
les noves formes d’expressió escrita informal, sorgides d’aplicacions com ara Twitter, WhatsApp, Telegram,
etc., que tot sovint incorporen aplicacions de correcció lingüística automàtica.
Per tant, es pot dir que les anomenades xarxes socials han multiplicat les ocasions d’expressar-se per
escrit d’un percentatge no menyspreable de la població mundial, fenomen per al qual s’ha comptat amb
l’assistència de programari de suport a l’escriptura. A més, en el cas de les llengües minoritzades com el
català, és indubtable que aquestes eines han facilitat l’opció per la llengua pròpia de milers de parlants que,
abans, s’expressaven per escrit només en la llengua dominant per falta de competència lingüística escrita en
la llengua pròpia i també d’ocasions per a practicar-la.
No obstant això, hi ha un aspecte que aquests programes i aplicacions no resolen de la mateixa manera en les
diferents llengües a les quals són aplicables i que pot tindre efectes no desitjats, ns i tot contraproduents, per
a l’objectiu general que se’ls suposa de facilitar la pràctica de l’escriptura: la variació lingüística diatòpica
o geogràca. Amb el benentés que els programes es basen en la normativa i no en la llengua col·loquial, les
opcions poden anar des de recollir una única varietat estàndard (amb més o menys polimorsme) ns a donar
compte de totes, en cas que n’hi haja efectivament més d’una en circulació. En aquest darrer cas, o encara
que siga amb un cert grau de polimorsme no necessàriament exhaustiu, encara es podrà distingir entre les
que consideren mútuament incorrectes les variants d’altres estàndards i les que les admeten totes en peu
d’igualtat o bé n’assenyalen la inadequació de l’ús en un paraestàndard que no siga el propi.
El present estudi es proposa analitzar la manera en què resol la qüestió del polimorsme i del pluricentrisme
el programari de suport ortogràc i gramatical per a l’ús escrit de la llengua catalana. Per tal de dur a
terme aquest objectiu, caldrà començar fent una breu revisió de l’estat del marc teòric que va del mateix
concepte d’estàndard al de pluricentrisme, sense oblidar els pocs estudis empírics que es relacionen amb
aquest objecte d’estudi; tot seguit, hi ha l’exposició dels objectius i de la hipòtesi basada en el marc teòric
descrit. Després de la presentació dels resultats, tan gràca i clara com siga possible, l’estudi es tanca amb
l’apartat de conclusions.
1 La variació diatòpica en els usos formals: el pluricentrisme de la llengua catalana
Aquest estudi s’enquadra en una perspectiva sincrònica, atés que posem el focus en la fotograa actual
de la manera en la qual el programari lingüístic més utilitzat gestiona la variació lingüística de la llengua
catalana. Però, com és obvi, el moment actual s’ha d’emmarcar en un procés, en una cadena d’esdeveniments
al voltant de l’estandardització lingüística que ens ha portat ns ací, analitzada en diversos estudis (per
exemple, Segarra, 1985; Pradilla, 2011; Ferrando, 2018), i que continuarà evolucionant d’una manera que
només podem intuir, pel caràcter intrínsecament canviant dels processos històrics i socials.
En qualsevol cas, a hores d’ara es pot adduir consens quant al caràcter composicional i polimòrc de la
normativa de la llengua catalana (vegeu, per exemple, Pradilla, 2011). Això vol dir que ja des dels treballs
i les propostes de Fabra es va obrir la porta a l’entrada de variants pròpies de les varietats demogràcament
més importants (composicionalitat), que poden ns i tot conviure com a geosinònims al si de la normativa
(polimorsme). El polimorsme ha augmentat ininterrompudament, de manera que és especialment
contrastable en les darreres obres publicades, les gramàtiques i els diccionaris de l’Institut d’Estudis Catalans
(IEC) i de l’Acadèmia Valenciana de la Llengua (AVL). A més, l’IEC ha publicat els seus criteris per al
tractament de la variació dialectal al diccionari normatiu, l’aplicació pràctica dels quals es descriu als punts
següents (Martí, 2018: 20):
“3. Seran considerades de prestigi global les unitats lèxiques molt esteses que almenys s’empren en dos dels
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 211
grans dialectes territorials, en els quals frueixen de prestigi reconegut.
4. Seran considerades de prestigi regional les unitats lèxiques que són pròpies d’un sol dels cinc grans
dialectes [balear, central, nord-occidental, septentrional i valencià] i que frueixen de prestigi reconegut en tot
l’àmbit d’aquest dialecte.”
En qualsevol cas, després de la creació d’aquesta darrera institució, l’AVL, als albors del segle xxi, i després
que haja publicat un diccionari i una gramàtica explícitament normatius, no és possible aplicar de cap
manera el qualicatiu de monocèntrica a la normativització de la llengua catalana. La simple existència
física de més d’una institució ocial creada amb la missió de treballar sobre la normativa de la llengua
porta a haver de qualicar-la com a policèntrica. S’ha de remarcar que recentment s’ha fet un altre pas en
l’expansió del policentrisme: el 20 d’abril de 2018, el Boletín Ocial de Aragón ha publicat els estatus de
l’Academia Aragonesa de la Lengua, que integra al seu si l’Institut Aragonès del Català, a més del de la
Llengua Aragonesa.1
A més, només es pot dir en un sentit restringit o literal que la codicació del català ha estat monocèntrica
abans de la creació de l’AVL: l’etiqueta del monocentrisme tan sols és adequada si ens referim a l’existència
física d’institucions ocialment creades amb l’encàrrec d’establir la normativa lingüística. En aquest sentit,
es pot adduir el segle de l’IEC, si fa no fa de la primera dècada del segle xx als primers anys del segle
xxi (vegeu, per exemple, Pradilla, 2011, 2015). Però des d’un punt de vista més obert, més social, que
en compte altres agents secundaris a més de les institucions ocials en la codicació lingüística, caldrà
convenir que el monocentrisme no ha gaudit mai d’una acceptació granítica i homogènia per tot el domini
lingüístic. D’aquesta manera, les Normes de Castelló, canònicament presentades com una mostra i un símbol
d’assumpció de la unitat de la llengua, són en realitat i en primer lloc una evidència que el seguiment dels
dictàmens d’una entitat externa requeria la mediació i el beneplàcit del món cultural valencià, a més d’un
grapat d’adaptacions a la varietat pròpia.2 És aquesta necessitat social de sentir com a pròpies les normes,
aquesta adhesió identitària a les variants d’una llengua que es representa com a pròpia primigèniament, el
que precisament dona lloc al pluricentrisme.
Per tant, el terme pluricentrisme implica la presa en consideració dels importants condicionants socials
en tots els passos o fases de la codicació lingüística (Clyne, 1992; Muhr, 2008, 2012) i supera el terme
policentrisme, que pot remetre a la més simple qüestió quantitativa. En aquest marc, cal dir que la classicació
del català com a llengua pluricèntrica ha fet forat ja en la bibliograa especialitzada (Casesnoves i Mas, 2015;
Edelmann, 2015; Mas, 2012a, 2019; Riutort, 2011). Cal subratllar que no es tracta d’un canvi terminològic
frívol, sinó que comporta tota una sèrie d’actualitzacions conceptuals que es duen a terme, a més, amb una
clara vocació contrastiva. De fet, una de les primeres constatacions a què s’arriba quan s’indaga en el marc
del pluricentrisme és la de la gran similitud entre els processos, les posicions ideològiques o les actituds
interdialectals de llengües pluricèntriques distants i aparentment diverses.
Així, hi ha tot un cos actitudinal i una ideologia lingüística que la teoria pluricèntrica atribueix a les llengües
que s’hi adscriuen, tant si són de grans dimensions demogràques i territorials —com ara el francés o
l’alemany— com si són mitjanes —com ara les llengües eslaves o el mateix català. Per exemple, és comú que
només les varietats perifèriques, dites no dominants (NDV en la sigla en anglés), es consideren dialectals,
1 Els estatus de l’Academia Aragonesa de la Lengua van ser aprovats el 10 d’abril de 2018 (Boletín Ocial de Aragón, núm. 77, 20
d’abril). S’hi estableix que la normativa, que es diu explícitament que serà de compliment obligatori per a les institucions radicades
al territori aragonés, la xarà l’Academia a proposta dels seus instituts (art. 4). Quant a l’Institut Aragonès del Català, diu: “Podrá
proponer al Pleno la implementación, adaptada a la realidad aragonesa, de la normativa vigente para el catalán y velar por su
aplicación” (art. 41, cap. III). Repeteix la idea de l’adaptació i el respecte a la diversitat dialectal a l’article 42, on també es parla
d’estimular l’ús, l’ensenyament i la difusió del català d’Aragó i les seues distintes modalitats i de determinar la forma correcta dels
topònims. En una mostra de pluricentrisme de manual, apareixen explicitades la unitat de la llengua i la voluntat de preservar les
variants pròpies de la varietat. Com, d’altra banda, també ha fet i fa l’AVL, per exemple en la Gramàtica normativa valenciana: “La
GNV vol ser una contribució de l’AVL al procés de construcció d’un model de llengua convergent amb la resta de modalitats de
l’idioma comú” (AVL, 2006: 14).
2 D’altra banda, les Normes de Castelló han tingut i tenen un paper fonamental en la conguració de l’estàndard valencià, de manera
que la seua funció ha sobrepassat des de bon començament el fet de ser un simple acatament simbòlic de les normes de l’IEC. Són
les de Castelló, més o menys corregides i augmentades, i no les de l’IEC, pures, les que s’han difós des del primer moment al País
Valencià, com ara la inuent campanya del setmanari El Camí o els cursos de llengua de Lo Rat Penat abans de l’assumpció de les
tesis secessionistes (Climent, 2007; Mas, 2010a; Ferrando, 2018).
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 212
mentre que les varietats centrals o dominants (DV) encarnen la veritable Llengua amb majúscula; que els
canvis i les innovacions en les DV es vegen com a evolucions, mentre els que es donen en la resta, com a
deformacions; que les elits culturals tant de les DV com de les NDV prioritzen les formes de les primeres i que
aquestes mateixes elits argumenten que allò normal és que hi haja una única institució i un únic i monolític
codi normatiu per a cada llengua (Muhr, 2012). Com és obvi, aquesta mena de sentiment d’estranyesa,
quasi de fer el ridícul si es té més d’una institució normativa, només és possible quan s’ignora la magnitud
internacional del fenomen del pluricentrisme.
D’altra banda, és precisament en relació amb el català que s’ha dut a terme un estudi empíric pioner que
corrobora la teoria de les actituds interdialectals de les llengües pluricèntriques mitjançant la tècnica matched-
guise o de veus disfressades (Casesnoves i Mas, 2015). Sobre una població d’estudiants universitaris, s’hi
demostra que només els parlants de català central esgrimeixen actituds de rebuig cap a variants perifèriques
com el valencià, actitud pròpia de parlants de varietats dominants de llengües pluricèntriques. En canvi, els
parlants de valencià i mallorquí combinen una bona percepció de la varietat dominant amb bones actituds
cap a la varietat pròpia, especialment en la dimensió de la solidaritat grupal, com és propi dels parlants de
varietats no dominants, que reclamen el seu espai sense menystenir les altres varietats.
De la mateixa manera que en l’article sobre actituds interdialectals que acabem d’esmentar, en aquest estudi
assumim que hi ha tres grans paraestàndards del català —i potser algun altre subestàndard, com el nord-
occidental, que lluita per fer-se un lloc dins l’ecosistema comunicatiu de Catalunya, si més no. És una
armació que sovint és contestada amb l’argument que la proposta no és coherent amb les característiques
diatòpiques del català, atés que, per exemple, català central i balear formen part del mateix bloc dialectal,
l’oriental, mentre que el valencià s’ha de situar al costat del català nord-occidental, que no és representat en
la proposta, com tampoc no ho és el català septentrional, que cita l’IEC entre les varietats de l’estàndard.
I que, en realitat, els tres suposats paraestàndards coincideixen amb la divisió administrativa actual de les
autonomies espanyoles —i històrica de regnes i principats, caldria afegir. Però en realitat aquest argument
no impugna la proposta, sinó que, sent verídic, subratlla el fet que la conguració dels paraestàndards de
qualsevol llengua pluricèntrica és un afer d’origen i condicionants més de caire ideologicoidentitari que
no asèpticament lològic. Però, atenció, fem aquesta armació amb ànim únicament descriptiu, lluny dels
judicis de valor amb què se sol emetre des de posicions negacionistes del pluricentrisme.
De més a més, en el cas valencià és possible triar entre un model de llengua més carregat de formes pròpies
o més farcit de variants exògenes, generalment pròpies de la DV, el català central. Tenint en compte la
importància que es dona a les endovariants, des de la presència exclusiva (incloent-hi una normativització
paral·lela) ns a l’absència absoluta d’aquestes, s’ha arribat a parlar de quatre models de llengua formal
vigents per a la comunitat de parla valenciana. Aquests models correspondrien a codicació exonormativa
heterònoma (que parteix d’una suposada independència lingüística del valencià), codicació exonormativa
autònoma, codicació endonormativa autònoma i codicació endonormativa integracionista, d’acord amb
la proposta de Pradilla (2004, 2008). Més breument i partint d’una proposta anterior de Lacreu (2002), hem
anomenat els models secessionista, particularista, convergent i uniformista (Mas, 2008, 2010a). Aquesta
proposta substitueix el terme integracionista de la proposta de Lacreu per uniformista, en entendre que
aquest darrer terme respon millor a l’òptica posada en les formes lingüístiques per a la descripció primera
dels models. A més, la proposta inclou la descripció de les connotacions ideològiques de l’ús d’aquests
models, que van des d’un ús preferent per grups espanyolistes/regionalistes de dreta ns als catalanistes
d’esquerra i deixen la major part dels usuaris entre els particularistes i els convergents.
Cal dir que també hi ha la visió que no es pot parlar d’aquests quatre models com a simultanis i interpretar-
ne la tria institucional a partir de condicionants ideològics, sinó que serien models successius històricament,
segons la font difusora dominant en cada moment (Montoya, 2011: 257-258), i ara ens trobaríem en la fase
de domini del particularisme / codicació exonormativa autònoma. Però succeeix que és possible observar a
hores d’ara exemples d’ús social de tots quatre models, per bé que els extrems, el secessionista i l’uniformista,
siguen molt minoritaris, socialment irrellevants.
L’existència dels diferents paraestàndards i models de llengua formal ha d’afectar necessàriament la gestió
del polimorsme per part dels programes de suport a la llengua escrita: caldrà prendre la decisió de si
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 213
s’adapta la comunicació territorialment als diversos paraestàndards vigents —i, encara, a quin model, en el
cas del valencià. No obstant això, el programari lingüístic té la capacitat de resoldre la qüestió d’una manera
contemporitzadora, si se’m permet l’expressió. A diferència d’un text escrit, que haurà d’utilitzar una variant
o una altra indefectiblement, el corrector o traductor automàtic pot contindre els diversos geosinònims
(lèxics, morfosintàctics, ortogràcs...) admesos per la normativa i deixar-ne la tria al criteri de l’usuari, siga
en peu d’igualtat, siga recomanant-ne l’ús d’unes en detriment d’altres. També hi ha l’opció, òbviament, de
triar exclusivament un paraestàndard i tractar la resta com una incorrecció qualsevol. En aquest darrer cas,
podríem trobar-nos amb una única versió del programa o amb diferents localitzacions que donen per bones
les variants del paraestàndard en qüestió i per incorrectes o no recomanables les pròpies de les altres varietats
territorials.
Aquest conjunt d’opcions respecte de la gestió més o menys localitzada del polimorsme s’ha de combinar
amb un altre que afecta el nom de la llengua i de les diverses varietats d’aquesta —si més no, les considerades
estàndard. Sobre el paper, hi ha dos grans possibilitats: usar exclusivament el terme català o obrir-se a les
denominacions de la llengua corresponents, si fa no fa, a les tres grans varietats d’estàndard. En el segon cas,
la denominació pot ser tan aclaridora com ambigua respecte de la unitat de la llengua, per exemple amb l’ús
de fórmules sincrètiques (català_valencià, per exemple) o posant les denominacions a l’altura dels noms de
llengües diferents entre les opcions del programa, respectivament. L’espai d’ambigüitat en què l’ús de les
denominacions populars i legals de la llengua permet moure’s (Bodoque, 2009: 86-91; Mas, 2010b, 2012b)
pot resultar còmode per a uns programes que pretenen la difusió màxima entre el conjunt dels parlants.
Aquest estudi pretén esbrinar l’estat de la qüestió de la gestió de la variació lingüística en el programari
lingüístic més usat en el moment actual. Distingirem, doncs, dos subtemes, que podem anomenar presentació
i representació de la variació i que es refereixen respectivament al(s) nom(s) de la llengua i a la gestió del
polimorsme que fa cadascun d’aquests programes i, per descomptat, a la relació entre tots dos. Vegem-ho.
2 Objectius i hipòtesis
L’objectiu general d’aquest estudi és avaluar la representació de la variació diatòpica en el programari
lingüístic de suport a l’ús de la llengua catalana. Es tracta d’esbrinar si els diversos programes reecteixen la
realitat pluricèntrica d’aquesta llengua, entesa com l’exercici de la diversitat existent no sols en els dialectes
reals sinó també en els usos cultes dels paraestàndards, i de quina manera ho fan: si aquesta és compatible
i promou la percepció de la unitat de la llengua o bé l’entrebanca. Per tant, l’estudi tindrà una dimensió
quantitativa i una altra de qualitativa, com exposarem tot seguit.
Tenint en compte la manca de consens acadèmic i social sobre els efectes que el mateix pluricentrisme té
sobre la vitalitat de la llengua, la hipòtesi més probable és que aquesta diversitat es veja reectida també
en el disseny del programari lingüístic. Així, trobarem aplicacions que no reectiran la diversitat, pel que
fa a la inclusió de variants alienes a un suposat estàndard general, al costat d’altres que sí que ho fan.
Aquestes darreres poden donar compte de la variació de diverses maneres: incloent les variants dins d’un
mateix paquet, amb el nom de català i permetent que l’usuari trie; orientant l’usuari en una tria homogènia
de variants (per paraestàndards) i això, encara, dins una mateixa opció o més d’una, amb diferents noms.
Aquest darrer cas també pot presentar diferents solucions: des de subratllar que les diverses versions —o més
previsiblement algunes: les corresponents a NDV— ho són de la mateixa llengua o senzillament anomenar-
les de manera diferenciada (català, valencià i mallorquí, posem per cas).
És lògic pensar que els programes desenvolupats amb participació d’institucions públiques (AVL, IEC,
conselleries, universitats...) reectiran millor la diversitat i alhora la unitat de la llengua, atés que aquesta és
la veritat acadèmica que s’explica a les aules de tot el domini lingüístic. D’altra banda, el programari privat
pot tindre altres prioritats, entre les quals destaca la d’arribar al màxim possible de població. En aquest cas,
la hipòtesi ha de ser que seguiran el camí de la isolació de cada territori, si més no pel que fa al valencià,
encara que això puga semblar paradoxal a primer colp d’ull: deuen considerar que els parlants d’aquesta
varietat prefereixen usar les variants pròpies que no sistemàticament les de la varietat dominant, atés el
caràcter pluricèntric de la nostra normativa. D’altra banda, és també plausible suposar que el referent per al
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 214
programari privat deu ser la veritat legal per davant de l’acadèmica, la qual cosa comença pel mateix nom
de la llengua, de manera que és probable que distingisquen entre una versió en català i una altra en valencià.
En aquest sentit, no s’espera gaire presència dels parlars balears ni en els noms de la llengua (ocialitzada
a l’Estatut balear com a català) ni en el corresponent maneig de les variants, més enllà d’alguna aplicació
de caire institucional. Tampoc del català aragonés, ni que siga pel simple fet que encara no està prescrit
normativament el conjunt de la seua especicitat, tot i que l’existència d’una institució pròpia n’augura una
presència futura especialment en els usos institucionals i, per tant, probablement al programari lingüístic. El
català septentrional, citat com una de les varietats de l’estàndard per l’IEC (Martí, 2018: 21), no és esperable
tampoc en cap dels seus trets especícs per la manca de regulació i per unes dades d’ús que s’intueixen poc
rendibles per als programadors. D’aquesta manera, els parlants d’aquestes varietats necessiten a hores d’ara
una competència lingüística que els permeta valorar la correcció de les variants pròpies per davant de les
propostes del programari lingüístic. De la seua banda, la presència de variants del català nord-occidental es
veurà afavorida per la pressió del valencià, la varietat dominant entre les no dominants de la llengua catalana.
En el cas del valencià, la hipòtesi és trobar exemples de variants pròpies del model particularista i del
convergent. Els altres models són massa minoritaris i marcats ideològicament perquè el programari els tinga
en compte. A més, el secessionista és extraocial, i l’uniformista no s’espera que puga congurar-se com a
tal dins d’una opció anomenada valencià.
3 Metodologia
La recerca, partint de la base exposada ns ací, s’ha dut a terme prenent com a objecte d’estudi dos ítems, que
anomenarem presentació de la llengua i representació de la variació lingüística, que al seu torn presenten
dos fases analítiques, la recollida de dades i l’anàlisi qualitativa d’aquestes. El tòpic de la presentació es
refereix al nom de la llengua o als noms de les varietats que els diversos programes de correcció i traducció
presenten com a opcions per a l’usuari. L’anàlisi de la representació de la variació suposa xar-se en les
opcions de correcció i d’estil de les variants més representatives i usuals dels tres grans paraestàndards:
català, valencià i balear.
Pel que fa a la recollida de dades, en el cas de la presentació de la llengua consisteix bàsicament a anotar si el
programa utilitza una única denominació o diverses, però també les diverses solucions dins de la multiplicitat,
com ara si es presenten aquestes diverses opcions com a versions o varietats d’una mateixa llengua o bé
si l’usuari llec en podria deduir que es tracta de llengües diferents, atés que els noms no presenten cap
relació entre ells. Les dades de la representació de la variació es referiran a les variants diatòpiques que cada
programa utilitza, reconeix o prioritza estilísticament, si és el cas. Amb el benentés que no cal fer-ne un
buidatge exhaustiu: n’hi ha prou amb una anàlisi de les variants estereotípiques, denides per Labov (1994)
com aquelles amb fortes connotacions socials, que ancoren l’opció de correcció o de traducció en un o en
un altre parestàndard —i encara, en el cas valencià, en un o en un altre model lingüístic (Mas, 2008: 40-41).
Per tant, s’ha fet una tria de variants no exhaustiva però sucient per a analitzar el capteniment de cada
aplicació respecte de la unitat i la diversitat de la llengua catalana. Les variants triades tenen una alta
freqüència d’aparició en tot tipus de textos escrits i serveixen per a identicar la tendència més o menys
accentuada d’usar variants endodialectals o exodialectals. S’han tingut en compte variants ortogràques i
morfològiques, mentre que el nivell lèxic s’ha deixat fora de l’estudi, per tal com l’acceptació de variants
lèxiques és més vasta i menys signicativa des del punt de vista del nostre pluricentrisme. Concretament,
hem analitzat la manera com les diverses aplicacions tracten les variants següents:
1. Ortograa: accentuació de la é en paraules com cafè/café, anglès/anglés, conèixer/conèixer.
2. Morfologia verbal: primera persona del singular del present d’indicatiu de la primera conjugació (acabo/
acabe/acab); primera persona del plural del present d’indicatiu de la primera conjugació (acabem/acabam);
subjuntius acabats en –i/–a o –e; incoatius acabats en –eix o –ix.
3. Demostratius: reforçats o simples: aquest/este, aqueix/eixe.
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 215
4. Possessius: la forma femenina amb v o amb u: meva/meua.
Cadascuna d’aquestes variants pot: a) ser la variant no marcada o preferent; b) marcar-se com a variant
secundària, i c) marcar-se com a error o incorrecció. Cal dir que no totes les aplicacions presenten l’opció
b), que és poc freqüent especialment en els traductors automàtics. Al punt 4.2 hi ha la representació gràca
dels resultats (taula 2).
La tria d’aplicacions per a congurar el corpus d’anàlisi s’ha fet d’una manera intuïtiva: hem triat les que
deuen ser d’ús més habitual, atenent a la presència en les pàgines web d’institucions públiques (universitats,
conselleries...) i a l’experiència relatada per part de col·legues i d’estudiants universitaris, a més de la facilitat
d’accés. En aquest darrer punt cal aclarir que ens centrem sobretot en aplicacions lliures i institucionals, però
també tenim en compte algunes de comercials amb forta presència social (com ara el corrector de Microsoft
Word). Quant als programes lliures, cal assenyalar que n’hi ha dos de codi obert a la base dels correctors i els
traductors institucionals: LanguageTool i Apertium, respectivament.
En concret, les aplicacions analitzades són les següents:
a) Aplicacions de correcció: eina de correcció lingüística de Microsoft Word 2013, eina de correcció de
Microsoft Word 2016 per a Apple, eina de correcció de WhatsApp i LanguageTool. Aquest darrer és un
programa de codi lliure que recentment s’ha incorporat a Twitter i es troba a la base de les aplicacions de
correcció Softcatalà i Softvalencià.3
b) Aplicacions de traducció: eina de traducció de Google, Opentrad, Politraductor i Apertium.4 La primera és
un servei més del buscador gegantí d’internet; Opentrad és una empresa de traducció que ofereix un traductor
automàtic gratuït per a textos breus de demostració; Politraductor ha estat desenvolupat per l’empresa
Prompsit, originada en la Universitat d’Alacant, per a la Universitat Politècnica de València, a partir de
la tecnologia Apertium; aquesta darrera és una plataforma lliure o de codi font obert per a la traducció
automàtica.
c) Aplicacions de correcció i traducció: Salt, Softcatalà i Softvalencià.5 Salt, com Politraductor, és també una
eina institucional basada en Apertium, però desenvolupada i difosa per la Generalitat Valenciana; Softcatalà
i Softvalencià, de la seua banda, es basen en LanguageTool per a l’eina de correcció i en Apertium per a la
de traducció.6
4 Resultats
4.1 El(s) nom(s): la presentació de la llengua
En aquest primer bloc de resultats mostrarem la manera de referir-se a la llengua catalana de les aplicacions
estudiades. La taula següent n’ofereix una panoràmica visual, que s’explica més detingudament tot seguit.
català cat.-cat. val. cat.-val.-bal. cat./val. valencià
Word PC X
Word Apple X
WhatsApp X
LanguageTool X
Softcatalà corr. X
Google X
3 https://languagetool.org/
4 https://translate.google.es/?hl=ca, http://www.opentrad.com, https://politraductor.upv.es/, https://www.apertium.org/index.cat.
html?dir=cym-eng#translation
5 http://www.salt.gva.es/va/inici, https://www.softcatala.org/, http://www.softvalencia.org/
6 No s’ha tingut en compte l’eina de traducció de Microsoft Word perquè utilitza altres traductors en línia i ofereix uns resultats d’una
qualitat sensiblement inferior a la dels traductors automàtics amb què hem treballat en aquest estudi.
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 216
Opentrad X
Politraductor X
Apertium *X
Softcatalà trad. X
Softvalencià c./t. X
Salt c./t. X
Taula 1. Els noms de la llengua en el programari lingüístic català. L’asterisc (*) signica que la marca indicada requereix
alguna matisació, que es fa en l’anàlisi.
Des del punt de vista quantitatiu i en ordre decreixent, cal dir que 5 programes utilitzen una denominació
única per a la llengua, 3 dels quals l’anomenen català i 2, valencià. En comptem 4 que presenten dos
entrades que deixen clar que la varietat valenciana forma part del català (català general / català valencià).
D’altra banda, n’hi ha un que usa aquests mateixos dos noms com dos entrades diferents al mateix nivell
que la resta de llengües. També només un incorpora el balear i ofereix, així, tres opcions de conguració a la
correcció automàtica —tot i que el traductor automàtic de la mateixa “casa”, Softcatalà, no actua exactament
de la mateixa manera. Vegem-ne tot seguit una anàlisi, que té en compte les solucions adoptades per a altres
llengües pluricèntriques.
a) Català
Microsoft Word 2016 per a Apple: aquesta aplicació només recull una versió per a la nostra llengua, que
anomena català, la qual cosa divergeix notablement de la versió per a PC, que presenta les opcions català
i valencià (vegeu més avant). Es tracta, però, d’una versió amb una presència del polimorsme superior a
la de la resta programes amb una única opció, si més no els que l’anomenen català, com veurem a l’apartat
següent.
WhatsApp: l’autocorrector d’aquesta aplicació es pot congurar per a una única versió en cada llengua
(enfront de la vintena que ofereix Microsoft Word PC per a l’anglés, per exemple), amb l’única excepció del
portugués (Brasil i Portugal). Com una mena de compensació, ofereix la possibilitat d’afegir al diccionari
intern qualsevol paraula nova que s’escriga, la qual serà oferida posteriorment en l’opció d’autocompletar.
Traductor de Google: ofereix també una única versió per a totes les llengües (distingeix gallec i portugués).
No obstant això, cal tindre en compte que la gestió de les variants és més oberta del que podria semblar, atés
que l’aplicació reconeix algunes de les variants estereotípiques del valencià i del mallorquí, tant si es tria el
català com a llengua d’origen com en les propostes alternatives del català com a llengua d’arribada (vegeu
més avant).
b) Català general / català valencià
LanguageTool: presenta una llista de 27 llengües, alguna de les quals, en ser seleccionada, ofereix la
possibilitat de triar un o un altre paraestàndard. Com que les llengües amb possibilitat de tria de varietats
són poques, les enumerarem: l’alemany, que permet triar entre Deustchland, Österreich i Schweiz; l’anglés
(American, British, South Africa, Canada, Australia, New Zealand); el portugués (Portugal, Brazil, Angola,
Mozambique), i el català, que distingeix entre General i Valencian. Per tant, llengües tan marcadament
pluricèntriques com l’espanyol o el francés, que en altres aplicacions superen la dotzena de versions, es
queden ací amb una única possibilitat. Això fa pensar que el desenvolupament de l’aplicació es troba encara
en curs, en una fase relativament inicial.
Politraductor: català i català (val.). Aquest traductor s’ofereix per a tres llengües: anglés, català i castellà,
entre les quals presenta aquestes dos opcions per al català com a llengua d’arribada. Anglés i castellà
tenen una única versió, tant com a llengües d’origen com d’arribada. El fet que es tracte d’una aplicació
desenvolupada pels serveis lingüístics d’una universitat pública valenciana, la Universitat Politècnica de
València, pot explicar aquesta sensibilitat especial cap al valencià, alhora que s’hi subratlla la unitat de la
llengua.
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 217
Apertium: aquest traductor permet traduir al català textos redactats en anglés, aragonés, espanyol, francés,
italià, occità i portugués. En el cas de textos en espanyol —i només en aquest cas—, permet triar entre català
i català-valencià com a varietats d’arribada, mentre que per a les altres llengües només hi ha l’opció català.
L’opció cat_valencia es troba dins l’opció de català, de la mateixa manera que por_BR es troba dins de
portuguès, per exemple, de manera que la presentació del valencià com a varietat del català és nítida. L’opció
català, de la seua banda, tradueix a l’estàndard més difós a Catalunya.
Traductor de Softcatalà: tot i que l’eina de traducció de la popular plataforma de programari en llengua
catalana només ofereix l’opció català en el menú de llengües, en les opcions de conguració i edició apareix
“Utilitza les formes valencianes” (vegeu més avant). A més, en l’apartat “Recursos per a traductors” hi ha
un “Adaptador de la variant general a la variant valenciana” que es diu explícitament que s’ha creat “amb
el suport dels serveis lingüístics de les universitats valencianes i de l’AVL” que inclou un document amb el
detall de les adaptacions.
c) Català-valencià-balear
Corrector de Softcatalà: l’eina de correcció distingeix entre formes generals, valencianes i balears i s’ofereix
exclusivament per a la llengua catalana. Com hem vist, l’eina de traducció només usa el terme català. Tot i
aquesta diferència nominal, la gestió efectiva del polimorsme no és tan diferent entre les dos aplicacions
germanes, com veurem més avant.
d) Català/valencià
Microsoft Word 2013 per a PC: presenta dos versions per a la nostra llengua, anomenades català i valencià,
dins d’una llista de 150 opcions lingüístiques, de les quals el paquet bàsic que s’adquireix a l’Estat espanyol
en té activades 58. S’ha de remarcar que açò es pot considerar una anomalia, atés que en aquesta aplicació
la solució més habitual és mantindre el nom de la llengua i diferenciar-la per estats: alemany (Alemanya),
alemany (Àustria), etc. També hi ha llengües amb opcions diferenciades per paraestàndards, ns i tot amb
alfabets diferents, dins d’un mateix estat o de diversos: noruec (Nynorsk) i noruec (Bokmal), o les nou
possibilitats del serbi, que combinen l’alfabet ciríl·lic i el llatí a Bòsnia, Montenegro i Sèrbia. Per tant, el
nostre cas es presenta com si valencià i català foren llengües diferents.
Opentrad: l’eina de traducció automàtica de l’empresa Opentrad ofereix el ventall màxim d’opcions si
s’agafa l’espanyol com a llengua d’origen: hi apareixen 16 opcions d’arribada, entre les quals es distingeix
català i valencià, tot i que també hi ha anglès i anglès EUA. D’altra banda, aquesta és l’única opció per a
l’etiqueta valencià: ser llengua d’arribada de les traduccions de l’espanyol. En canvi, el català pot traduir-
se a l’anglés, l’aranés, l’espanyol, l’esperanto, el francés, l’occità i el portugués, i ser llengua d’arribada
d’aquestes mateixes llengües llevat de l’esperanto, que no pot ser llengua d’origen per a cap d’arribada.
e) Valencià
Salt: valencià. Només tradueix entre valencià i castellà, en els dos sentits, però permet triar entre algunes
variants del valencià estàndard, corresponents si fa no fa als models particularista i convergent descrits al
punt 2 d’aquest article, com veurem a l’epígraf següent.
Softvalencià: valencià. També és un traductor entre valencià i castellà, tot i que ofereix versions en proves
de traductors, en els dos sentits, també amb anglés, francés i portugués. Presenta també opcions de tria de
variants que comentarem de seguida.
4.2 Les variants: la representació de la llengua
En aquest apartat veurem la manera en la qual aquestes opcions categoritzen algunes variants lingüístiques
admeses per mor del polimorsme i el pluricentrisme de la nostra normativa lingüística. Com s’ha explicat
al punt 4, la tria de variants s’ha fet atenent al seu caràcter estereotípic i a la freqüència d’ús en tot tipus de
text. L’ús de les diferents variants s’ha marcat amb els símbols següents:
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 218
x: indica que és la variant no marcada del parell o terna. És literalment la que l’aplicació no marca
de cap manera, així que se n’ha de considerar la variant preferent o exclusiva, segons si es combina amb el
següent símbol o amb cap.
○: és la variant que cal considerar secundària. En el cas dels correctors, aquestes variants són
subratllades amb una marca verd-blavosa que en pitjar el botó dret del ratolí suggereix que es canvie per la
forma preferent o no marcada. En el cas dels traductors, és la variant que donen com a opció secundària de
traducció quan es demana una solució alternativa a la que dona per defecte el programa —la que ací es marca
amb x.
L’absència de marca indica que el programa tracta la variant en qüestió de la mateixa manera que
qualsevol errada ortogràca, gramatical o lèxica, en el cas dels correctors, o que no la considera com a opció,
en el cas dels traductors.
L’ordre d’exposició dels programes en la primera columna està relacionat amb les hipòtesis plantejades
adés, de manera que hi apareix en primer lloc el programari comercial seguit del lliure i l’institucional.
Aquest ordre es repeteix en un primer bloc que agrupa els correctors automàtics, seguit del bloc d’eines de
traducció. En cada bloc i tipus de programa es presenten primer les variants corresponents a la DV i, tot
seguit, a les NDV.
è é -o -e -Ø-em -am -i -a aquest este -v- -u- -eix -ix
Word cat. PC
i Apple
x x x x x x x x x
WhatsApp x x x x x *esta x x x
LanguageTool
Catalan/Gen.
x ○ x ○ ○ x x ○ x x x
Softcatalà
corr. gral.
x ○ x ○ ○ x x ○ x x x
Word val. PC x x x x x x x x x x x x
LanguageTool
Catalan/Val.
○ x ○ x ○ x ○ x x x x
Softcatalà
corr. val.
○ x ○ x ○ x ○ x x x x
Softvalencià
corr. defecte
○ x ○ x ○ x ○ x x x x
Salt corr. def. ○ x ○ x ○ x ○ x x x x
Softcatalà
corr. bal.
x ○ ○ ○ x x x x ○ x x x
Google x x x x x (est) x x *(pl.)
Opentrad cat. x x x x x x x
Apertium cat. x x x x x x x
Softcatalà cat. x x x x x x x
Politraductor
cat.
x x x x x x x
Opentrad val. x x x x x x x
Apertium val. x x x x x x x
Softcatalà val. x x x x x x x
Softvalencià
trad.
x x x x x x x
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 219
Politraductor
cat. (val.)
x x x x x x x
Salt trad. x x x x x x x
Taula 2. Ús de variants estereotípiques per part del programari lingüístic de suport a l’ús de la llengua catalana. L’asterisc
(*) signica que la marca indicada requereix alguna matisació, que es fa en l’anàlisi.
Els correctors ofereixen dos grans grups amb una notable homogeneïtat de resultats tant en la versió de
català general com en la valenciana: d’una banda, les eines comercials i, de l’altra, el programa lliure i les
aplicacions institucionals que s’hi basen.
Així, l’opció català dels correctors de Word per a PC i per a Apple marca com a incorreccions les variants
pròpies del valencià i el balear, amb l’excepció del demostratiu simple i el possessiu femení amb –u–. De
la mateixa manera actua el corrector de WhatsApp. De la seua banda, el programari lliure i l’institucional
se’n distingeixen perquè accepten totes les variants: tant LanguageTool com la versió català general de
Softcatalà no marquen com a incorrectes les variants valencianes i balears, sinó que suggereixen canviar-les
per les respectives generals, amb fórmules com “Useu demostratius reforçats” o “Esteu usant terminacions
verbals en ix” —encara que no n’hàgem escrit cap altra—, amb una distribució idèntica de variants no
marcades i secundàries.
L’opció valencià només la recull el corrector de Word per a PC entre les aplicacions comercials, com s’ha
comentat. Cal subratllar que no actua d’una manera simètrica a la versió català del mateix programa pel
que fa al reconeixement i la sanció de variants: en aquest cas, les posa quasi totes al mateix nivell, tant les
orientals com les valencianes. Només marca com a incorreccions els subjuntius acabats en –i i els verbs en
–am. Ofereix, doncs, més oportunitats de tria a l’usuari a l’hora d’adherir-se a un o un altre model valencià
de llengua formal que al qui haja triat l’opció català. El programari lliure i l’institucional, de la seua banda,
presenten ací més disparitat de criteris que en l’opció anterior: tan sols LanguageTool i el corrector de la
Generalitat Valenciana, Salt, ofereixen exactament la mateixa distribució de variants preferents i secundàries,
en què les primeres generalment són les valencianes amb l’excepció dels demostratius reforçats i els incoatius
acabats en –eix. En canvi, la versió amb formes valencianes de Softcatalà i el corrector de Softvalencià
prefereixen els incoatius en –ix i, encara, el segon marca com a secundari el demostratiu reforçat. Cal
subratllar que aquests correctors, llevat de Language Tool, permeten congurar la tria de formes preferents.
L’anàlisi s’ha fet, doncs, a partir de la conguració per defecte.
Una característica pròpia i distintiva de Softcatalà és que el corrector presenta també la versió formes balears.
Ací les variants preferents són, òbviament, les balears, signicades en la morfologia verbal. Per tant, tant les
generals com les valencianes hi reben la indicació “Useu formes verbals balears” en el quadre de diàleg de
les formes secundàries.
Pel que fa als traductors automàtics, és remarcable que tan sols el traductor d’una empresa privada, Google,
presenta la possibilitat de canviar les formes preferents per d’altres d’equivalents, que caldrà considerar
secundàries. L’única variant de les analitzades que no ofereix és el morfema verbal zero del balear. La resta
d’aplicacions, la de l’empresa Opentrad i les versions català general d’Apertium, Softcatalà i Politraductor,
usen exclusivament les variants del català central, sense cap altra opció. Ocorre el mateix amb la versió
valenciana, que és idèntica en tots els traductors llevat del Salt. Així, tots donen les variants valencianes amb
l’excepció del demostratiu reforçat i l’incoatiu en –eix, com s’esdevé en la major part dels correctors, però hi
agen també a la preferència per exovariants l’accentuació oriental de la è, amb l’excepció, com s’ha dit, de
Salt. Cal subratllar també que cap d’aquestes eines presenta opcions de conguració de variants, com feien
els correctors automàtics respectius.
5 Conclusions
La primera constatació general que cal traure dels resultats obtinguts en aquest estudi és la disparitat de
solucions amb què el programari lingüístic afronta la variació lingüística de la llengua catalana. Totes les
possibilitats hi estan representades: des de la versió única i exclusiva concretada en el nom català i les variants
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 220
del català central que considera incorreccions la resta de variants (Word Apple, corrector del WhatsApp), ns
a les eines que presenten una versió per a cadascun dels tres grans paraestàndards (el corrector de Softcatalà)
o reconeixen les variants no dominants ni que siga com a secundàries (la major part de correctors i el
traductor de Google). Aquesta heterogeneïtat era previsible, tal com s’ha comentat en plantejar les hipòtesis
d’aquest estudi, si partim de la falta de consens social i acadèmic quant al mateix caràcter pluricèntric de la
llengua catalana.
La hipòtesi que el programari lliure i institucional reecteix la variació lingüística i nominal d’una manera
més pròxima a l’acadèmia que el programari comercial, que tendiria més a l’isolament territorial, també es
compleix, tot i que requereix alguna matisació. És cert que són comercials els correctors de Word Apple i
de WhatsApp, els únics programes que usen el nom català de manera exclusiva alhora que marquen com a
incorreccions totes les variants exodialectals del català central, i també ho és que són lliures i institucionals
els que reconeixen totes les variants de l’estudi i en prioritzen les pròpies en les versions català general /
català valencià o similar: Language Tool, Politraductor, Apertium i els traductors de Softcatalà, als quals
caldria sumar l’única ocurrència del balear en el corrector de Softcatalà. Però també ho és que és en un
programari lliure, el de Softvalencià, i en un d’institucional, el Salt, que trobem els únics programes que
anomenen la llengua exclusivament com a valencià.
Cal dir, però, que aquests programes no actuen d’una manera simètrica als de la denominació exclusiva
català, atés que no es pot dir que promoguen l’isolament, o de cap manera en el mateix grau, des del moment
que els correctors reconeixen com a secundàries totes les variants exodialectals del valencià, de manera que
representen el corpus de variants com a part d’una mateixa llengua. També hi ha el cas simètric del traductor
comercial de Google, que, amb la denominació exclusiva català, actua com aquests dos programes respecte
de la representació de la variació.
Per tant, els correctors de Word Apple i de WhatsApp poden provocar un alt grau d’estranyament i de
confusió per part dels parlants de varietats no dominants. És clar que la denominació única i l’exclusivitat
de variants del paraestàndard de Catalunya es poden deure a un procés de localització inacabat d’aquests
programes, però el fet és que la representació de la variació que ofereixen diculta la identicació amb la
llengua que presenten i fa més difusa encara la línia del que és i no és normatiu. Uns efectes semblants pot
tindre la presentació diferenciada de la llengua com a català i com a valencià del corrector de Word PC, al
mateix nivell que altres llengües, i que marquen com a incorreccions algunes de les exovariants respectives.
En aquest cas, tot i que el diccionari del corrector té les variants, aquesta manera de gestionar la presentació
i la representació de la llengua promou un isolament que pot fer pensar que es tracta de sistemes diferents.
Al cantó oposat hi ha el corrector de Softcatalà, que presenta les opcions català general, valencià i balear.
Es tracta, doncs, de l’única eina que permet als parlants illencs de triar la seua varietat com a preferent,
alhora que representa les exodialectals com a secundàries. La representació de variants insulars com a
secundàries es redueix als correctors de base lliure (LanguageTool, Salt i les diferents versions de Softcatalà)
i, parcialment, al traductor de Google, mentre que són totalment absents, com també ho és el nom, de la resta
de traductors (de base lliure, per cert) i dels correctors comercials. El contrast amb el valencià, present en
tots els traductors i quasi tots els correctors, més encara quant a variants que pel que fa al nom, indica una
adhesió més forta a l’endovarietat en la comunitat de parla valenciana.
D’altra banda, no hi ha cap ocurrència de les propostes sincrètiques de nom de la llengua, tipus català-
valencià (que usa, en canvi, el traductor Apertium per referir-se a la varietat valenciana), que recollirien
la dualitat onomàstica ocial i, alhora, subratllarien la unitat de la llengua en impedir interpretacions com
les que permet tindre les etiquetes català i valencià separadament. El traductor de Google actua d’una
manera en la representació de la variació que s’hauria pogut encabir perfectament en una denominació de la
llengua d’aquest tipus, que s’ha de reconéixer que no ha tingut èxit —potser, precisament, perquè impedeix
l’ambigüitat.
En qualsevol cas, ja s’ha comentat que el doble rètol i la respectiva gestió excloent de les exovarietats són
la pitjor opció. Ara com ara, no és una utopia irrealitzable que les autoritats competents actuals, catalanes i
valencianes, s’adreçaren conjuntament a Microsoft i demanaren una recticació. Si ho arribaren a fer, amb
aquesta companyia o altres institucions que s’hi dediquen, semblaria lògic partir del que tenim a hores d’ara:
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 221
els criteris per al tractament de la variació dialectal de l’IEC (Martí, 2018: 17-21) podrien portar a considerar
no marcades les variants usades almenys en dos dels grans dialectes, i secundàries les que gaudeixen de
prestigi en un.
Quant a la qüestió onomàstica, si s’opta per més d’una versió, els suggeriria modestament que no apostaren per
l’opció català general / català valencià: el terme general aplicat a l’estàndard basat en una de les varietats és
tan inexacte com propi de les actituds centralistes pròpies dels parlants de les DV de llengües pluricèntriques.
Per no parlar de l’oposició català estàndard / valencià, de connotacions encara més pejoratives per als
usos formals habituals no basats en el català oriental. Les paraules de Norman Fairclough referides a la
relació de l’anglés estàndard amb els altres dialectes, socials en el cas britànic, serien aplicables ací pel
que fa a la variació diatòpica i subratllen la necessitat d’aprofundir en l’anàlisi contrastiva de les llengües
pluricèntriques:
“There is an element of schizophrenia about standard English, in the sense that it aspires to be (and is
certainly portrayed as) a national language belonging to all classes and sections of the society, and yet
remains in many respects a class dialect. The power of its claims as a national language even over those
whose use of it is limited is apparent in the widespread self-depreciation of working-class people who say
they do not speak English, or do not speak ‘proper’ English.” (Fairclough 2015: 85)
Referències bibliogràques
Bodoque, Anselm. (2009). La política lingüística dels governs valencians (1983-2008). Un estudi de
polítiques públiques. València: Universitat de València.
Casesnoves, Raquel, i Mas, Josep Àngel. (2015). Un tema oblidat: les relacions interdialectals del català.
Zeitschrift für Katalanistik, 28, 55-94.
Climent, Josep Daniel. (2007). Les Normes de Castelló: l’interés per la llengua dels valencians al segle xx.
València: Acadèmia Valenciana de la Llengua.
Clyne, Michael. (1992). Pluricentric languages: differing norms in different nations. Berlín/Nova York:
Mouton de Gruyter.
Edelmann, Gerhard. (2015). Catalan as a pluricentric language. Dins Rudolf Muhr i Dawn Marley (ed.),
Pluricentric languages: new perspectives in theory and description (p. 143-156). Viena et al.: Peter
Lang.
Fairclough, Norman. (2015). Language and power. Londres/Nova York: Routledge.
Ferrando, Antoni. (2018). Fabra, Moll i Sanchis Guarner. La construcció d’una llengua moderna de cultura
des de la diversitat. València: Publicacions de la Universitat de València.
Labov, William. (1994). Principles of linguistic change: internal factors. Oxford: Blackwell.
Lacreu, Josep. (2002). Els models de llengua del valencià. Dins Emili Casanova i altres (ed.), Estudis del
valencià d’ara (p. 241-251). València: Denes.
Martí, Joan (ed.). (2018). Documents de la Secció Filològica, V. Barcelona: Institut d’Estudis Catalans.
Mas, Josep Àngel. (2008). El morfema ideològic. Una anàlisi crítica dels models de llengua valencians.
Benicarló: Onada Edicions.
Mas, Josep Àngel. (2010a). Les connotacions ideològiques dels models lingüístics valencians: situació actual
i condicionants històrics. Caplletra. Revista Internacional de Filologia, 48, 47-70.
Mas, Josep Àngel. (2010b). Els noms de la llengua i els models lingüístics del català a Europa. De la traducció
de la Constitució europea (2004) a les eleccions de 2009. Revista de Llengua i Dret, 54, 79-100.
Josep Àngel Mas Castells
El pluricentrisme de la llengua catalana en els principals correctors i traductors automàtics
Revista de Llengua i Dret, Journal of Language and Law, núm. 71, 2019 222
Mas, Josep Àngel. (2012a). Catalan as a pluricentric language: the Valencian case. Dins Rudolf Muhr (ed.),
Non-dominant varieties of pluricentric languages. Getting the picture (p. 283-300). Viena et al.: Peter
Lang.
Mas, Josep Àngel. (2012b). El nom de la llengua i altres termes sociolingüístics en la campanya electoral per
a les Corts Valencianes de 2011. Terminàlia, 6, 7-14.
Mas, Josep Àngel. (2019). Identity and use of a pluricentric language in conict: Catalan in Spain. Dins
Rudolf Muhr, Josep Àngel Mas i Jack Rueter (ed.), European pluricentric languages in contact and
conict (p. 91-106). Viena et al.: Peter Lang [en premsa].
Montoya, Brauli. (2011). Normativa lingüística i estatus del valencià. Dins Actes del I Simposi Internacional
sobre Situació i Perspectives del Plurilingüisme a Europa. València 2008 (p. 245-264). València:
Acadèmia Valenciana de la Llengua.
Muhr, Rudolf. (2008). The pragmatics of a pluricentric language: A comparison between Austrian German
and German German. Dins Klaus Schneider i Ann Baron (ed.), Variational pragmatics: A focus on
regional varieties in pluricentric languages (p. 211-244). Amsterdam/Filadèla: John Benjamins.
Muhr, Rudolf. (2012). Linguistic dominance and non-dominance in pluricentric languages: A typology. Dins
Rudolf Muhr (ed.), Non-dominant varieties of pluricentric languages. Getting the picture (p. 23-48).
Viena et al.: Peter Lang.
Pradilla, Miquel Àngel. (2004). El laberint valencià: Apunts per a una sociolingüística del conicte.
Benicarló: Onada Edicions.
Pradilla, Miquel Àngel. (2008). La tribu valenciana: Reexions sobre la desestructuració de la comunitat
lingüística. Benicarló: Onada Edicions.
Pradilla, Miquel Àngel. (2011). La gestió normativa de la llengua catalana: unitat en la diversitat o diversitat
d’unitats? Revista de Llengua i Dret, 56, 115-141.
Pradilla, Miquel Àngel. (2015). La catalanofonia. Una comunitat del segle xxi a la recerca de la normalitat
lingüística. Barcelona: Institut d’Estudis Catalans.
Riutort, Macià. (2011). Les varietats estàndards catalanes com a condicionants d’un futur diccionari alemany-
català. Zeitschrift für Katalanistik, 24, 53-72.
Segarra, Mila. (1985). Història de la normativa catalana. Barcelona: Enciclopèdia Catalana.