Galiza e Galicia e outras palavras con terminações análogas no período medieval

Após o excelente trabalho do catedrático Martinho Montero Santalha sobre o uso das formas Galiza/Galicia no período medieval, não é fácil acrescentar novas informações sobre este assunto sem evitar redundâncias. No entanto, como se trata duma velha polémica ainda viva nos meios de comunicação (como o recente artigo em Praza por L.C. Carballal) e nas redes sociais, insistirei em defender a forma Galiza como a maioritária no galego medieval frente à forma castelhanizada, Galicia, achegando um ponto de vista mais abrangente. Nomeadamente, apresentarei a distribuição e evolução das formas Galiza e Galicia no contexto doutras palavras que possuem terminações análogas sem iode para as formas patrimoniais e com iode para as formas semi-cultas castelhanizadas. A metodologia utilizada, de carácter empírico, será a mesma que usei no meu anterior artigo no PGL sobre os pares de sufixos çom/cion e vel/ble

Deste jeito, compararei, em termos puramente quantitativos, a frequência de distribuição das formas Galiza e Galicia num corpus representativo do galego-português medieval da Galiza ao longo de três séculos: XIII, XIV e XV. A seguir, os dados obtidos para o par Galiza/Galicia serão comparados com a distribuição dum pequeno feixe de palavras com duas terminações, sem iode e com iode, em conflito.

O corpus do galego medieval da Galiza utilizado no presente estudo, cedido polo professor Xavier Varela do ILG e que forma parte do TMILG (Tesouro Medieval Informatizado da Língua Galega), consta de 9 documentos do século XIII contendo 254 mil palavras, 12 documentos do XIV com 817 mil palavras, e 6 documentos do XV com 350 mil palavras. Em total, o corpus conta com cerca de 1 milhão e meio de palavras, sendo todos os documentos de autoria galega (e não portuguesa). 

Os documentos pertencem a diversos géneros, incluindo textos líricos, ensaios e escrituras notariais. Entre as obras compiladas, incluem-se as Cantigas de Santa Maria, Crónica Geral de Castela, Cancioneiro de Ajuda, cantigas de Airas Nunes e numerosas actas notariais. Um dos principais problemas deste corpus é que muitos dos documentos, nomeadamente os notariais, contêm parágrafos e excertos em castelhano medieval. A identificação e separação destes excertos foi feita com um detector automático de variedades medievais. É preciso salientar que o número total de parágrafos do corpus é de 165 mil, sendo detectados apenas 1400 em castelhano medieval (ou num galego medieval muito influenciado polo castelhano). Como era esperável, a imensa maioria do texto dos documentos está escrito em galego-português.

Começamos este estudo analisando a distribuição do par Galiza/Galicia ao longo dos três séculos. Para levar a cabo a análise, foram identificadas e listadas todas as variantes gráficas dos dous termos:

Galiza: Galiza, Galisa, Galiça, Galliza, Gallisa, Galliça

Galicia: Galizia, Galisia, Galicia, Gallizia, Gallisia, Gallicia, Galleçia

A seguir, foram extraídas todas as ocorrências das palavras com alguma das variantes listadas nas três partições do corpus (séculos XIII, XIV e XV), assim como os valores agregados, tal e como se mostra nas Tabelas 1 e 2.

GalizaSéc XIIISéc XIVSéc XVTotal
Galiza8117594
Galliza418527
Galliça2428
Galisa-2810
Gallisa-7-7
Galiça--22
Total144292148

Tabela 1. Ocorrências das variantes de Galiza no corpus medieval da Galiza ao longo de três séculos e em parágrafos identificados automaticamente como sendo escritos em galego-português.

GaliciaSéc XIIISéc XIVSéc XVTotal
Gallizia113335
Galicia-325
Galizia--1111
Gallisia--44
Total145055

Tabela 2. Ocorrências das variantes de Galicia no corpus medieval da Galiza ao longo de três séculos e em parágrafos identificados automaticamente como sendo escritos em galego-português.

A Tabela 1 mostra a distribuição ao longo dos três séculos estudados das variantes de Galiza, que têm uma frequência total de 148 ocorrências em parágrafos seleccionados polo detector de língua como sendo escritos em galego-português. A Tabela 2 reflecte a distribuição das ocorrências das variantes de Galicia, cujo agregado total é quase três vezes inferior: 55 ocorrências totais, a maioria delas (50) encontradas em documentos do século XV.

Cumpre salientar que na Tabela 2 aparecem 4 das 7 variantes de Galicia, pois 3 delas (Galisia, Gallicia, Galleçia) só aparecem em excertos em castelhano. Uma vez feito o mesmo estudo quantitativo em relação aos excertos em castelhano, identificamos 47 ocorrências em total de variantes de Galicia, enquanto que só aparecem em total 10 variantes de Galiza neste tipo de parágrafos. Em consequência, em contraste com os parágrafos em galego-português, o termo Galicia é o maioritário nos excertos em castelhano medieval.

Para visualizarmos melhor as frequências das formas Galiza/Galicia em termos relativos, pois os corpus de cada século são de tamanhos diferentes, observemos o rácio ou proporção entre os valores das duas formas nos excertos em galego-português e castelhano que nos fornece a Figura 1. Esta figura mostra duas curvas: por um lado, a curva vermelha representa a evolução da proporção entre a frequência agregada das variantes de Galiza frente à frequência das variantes de Galicia ao longo dos séculos em texto escrito em galego-português e, por outro, a curva roxa representa a proporção entre as variantes de Galicia frente às de Galiza nos excertos em castelhano medieval. As curvas mostram uma tendência muito significativa: a maior proporção de Galiza frente a Galicia atinge o máximo no século XIII (14 vezes maior) e vai caindo até ser menos do dobro (92 frente a 50) no século XV. Em contraste, nos parágrafos em castelhano medieval, a proporção entre Galicia frente a Galiza vai crescendo até chegar a ser 14 vezes maior no século XV. Esta figura mostra com claridade uma correlação forte entre a progressiva aparição das variantes de Galicia nos textos escritos tanto em galego-português como em castelhano medieval e a progressiva influência de Castela na Galiza ao longo dos séculos da baixa Idade Média. É preciso ter muita imaginação para não ver aqui um indício claro de castelhanização no uso cada vez mais frequente de Galicia ao longo dos séculos.

Maior proporção de Galiza frente a Galicia nos excertos em galego-português, comparada com a maior proporção de Galicia frente a Galiza nos excertos em castelhano, e evolução das proporções (descida de Galiza e aumento de Galicia) ao longo dos três períodos estudados (séculos XIII, XIV e XV). ©

A seguir, analisamos a evolução da distribuição de frequências doutras palavras que, como o par Galiza/Galicia, sofreram similares vacilações entre as formas patrimoniais sem iode e as formas castelhanizadas com iode. Nomeadamente, analisamos os seguintes seis pares de formas e as suas variantes gráficas:

espaço: espaço, espaso, espazo, espaco espaçio: espaçio, espasio, espazio, espacio

preço: preço, prezo, preco preçio: preçio, presio, prezio, precio

serviço: serviço, serviso, servizo, servico serviçio: serviçio, servisio, servizio, servicio

graça: graça, grasa, graza, graca graçia: graçia, grasia, grazia, gracia

justiça: justiça, justisa, justiza, justica justiçia: justiçia, justisia, justizia, justicia

sentença: sentença, sentensa, sentenza, sentenca sentençia: sentençia, sentensia, sentenzia, sentencia


Mesmo se as formas com iode (-çio) triunfaram na fala popular, junto com uma mancheia de castelhanismos, as últimas normas da RAG de 2003 só admitem as formas patrimoniais sem iode para este conjunto de palavras. No caso de Galiza/Galicia, as duas formas são consideradas legítimas sendo a forma com iode maioritariamente usada na atualidade e reconhecida como "a denominación oficial do país".

-ço/-çaSéc XIIISéc XIVSéc XVTotal
espaço1416
serviço3392668
preço13125132414
graça75949115
justiça11402778
sentença725338163
Total225446173844

Tabela 3. Ocorrências das formas sem iode terminadas em -ço/-ça no corpus medieval da Galiza ao longo de três séculos e em parágrafos em galego-português (para simplificar, o valor de cada forma por século é a soma das frequências de todas as suas variantes).

-çio/-çiaSéc XIIISéc XIVSéc XVTotal
espaçio1348
serviçio-729
preçio1913436
graçia18531788
justiçia492336
sentençia12313881
Total5411688258

Tabela 4. Ocorrências das formas com iode terminadas em -çio/-çia no corpus medieval da Galiza ao longo de três séculos e em parágrafos em galego-português (para simplificar, o valor de cada forma por século é a soma das frequências de todas as suas variantes).

As tabelas 3 e 4 mostram as distribuições dos seis pares de formas agregando a frequência das suas variantes em cada linha para simplificar a visualização. Observa-se que as ocorrências das variantes terminadas na forma patronímica -ça/-ço é maioritaria: 844 ocorrências, frente a 258 casos de variantes terminadas em -çia/-çio.

Como os corpus de cada século são de tamanho diferente, vai ser preciso relativizar de novo estes valores. Desta volta, usamos a percentagem ou probabilidade de ocorrência das formas em -ça/-ço frente a -çia/-çio ao longo dos séculos, incluindo as probabilidades de Galiza frente Galicia. A Tabela 5 mostra estes valores relativos onde se observa como as formas patrimoniais (em azul) têm uma percentagem de uso muito maior do que as formas com iode, mas essa percentagem desce ao longo dos séculos. A Figura 2 visualiza melhor essa descida, sendo mais marcada no caso de Galiza frente a Galicia que no caso das palavras terminadas em -ço/-ça frente às terminadas em -çio/-çia. De cada 100 ocorrências Galiza/Galicia, 93 são escritas com variantes de Galiza no século XIII, mas só 64 de cada 100 no XV. As palavras patrimoniais terminadas em -ço/-ça seguem a mesma tendência mas mais suave: a curva desce de 80 para 66 por cento de uso ao longo dos três séculos. 

 Séc XIIISéc XIVSéc XVTotal
Galiza0,930,910,640,73
Galicia0,070,090,360,27
-ço/-ça0,800,790,660,76
-çio/-çia0,200,190,340,24

Tabela 5. Percentagens de uso das diferentes formas estudadas ao longo dos três séculos em excertos em galego-português. As percentagens totais (última coluna) são calculadas sobre o total de ocorrências.

Visualização das percentagens/probabilidades de uso das formas patrimoniais nos excertos em galego-português ao longo dos três séculos medievais (as percentagens da gráfica são os valores em azul da Tabela 5). ©

As percentagens mostradas correlacionam com as proporções ou rácios de uso entre as formas sem e com iode. A proporção de uso de Galiza frente a Galicia e das palavras em çom frente a -çion também vai decrescendo com o passar dos séculos e a progressiva castelhanização da escrita. Os mesmos dados que explicam a evidente castelhanização de gracia ou espacio demostram igualmente que Galicia é um claro e inequívoco castelhanismo.

À luz destes dados, é difícil suster linguisticamente que a forma Galicia seja legítima em quanto que outras palavras com iode, como gracia ou espacio, tamém muito populares na fala espontânea, sejam castelhanismos não permitidos polas normas da RAG. É bem provável que, além dos critérios linguísticos e quantitativos, as normas da nossa língua estejam reguladas por valorações subjectivas ligadas à psique do colonizado: se o nosso dono e senhor chama o nosso país Galicia, esta deve ser a forma legítima. Trata-se dum preconceito forte e sólido como uma rocha, inserido no ADN da gente, e contra um tal preconceito nada ou pouco podem fazer estudos quantitativos como este. 

Grazas ás socias e socios editamos un xornal plural

As socias e socios de Praza.gal son esenciais para editarmos cada día un xornal plural. Dende moi pouco a túa achega económica pode axudarnos a soster e ampliar a nosa redacción e, así, a contarmos máis, mellor e sen cancelas.