Corpora comparáveis e variação lexical nas variedades africanas do português

Maria Fernanda Bacelar do Nascimento

Resumo


Neste artigo são apresentados resultados de um projecto de constituição de corpora orais e escritos das cinco variedades africanas do português (Angola, Cabo Verde, Guiné-Bissau, Moçambique e São Tomé e Príncipe) e de extracção dos respectivos léxicos. Os cinco corpora, que no total perfazem 3.200.124 palavras, são comparáveis em dimensão, constituição interna e cronologia. Com a realização deste trabalho, pretendeu-se dar uma contribuição para colmatar uma grave lacuna no que respeita aos Recursos Lingüísticos (corpora e léxicos) existentes para o português. Existiam já, em elevado número e grandes dimensões, corpora e léxicos das variedades europeia e brasileira do português, mas eram quase inexistentes (se excluirmos Moçambique) Recursos Linguísticos semelhantes para as variedades africanas que permitissem análises objectivas de cada uma delas e que, pela sua comparabilidade permitissem estudos contrastivos entre essas variedades ou entre elas e o português europeu ou do Brasil. O projecto, intitulado Recursos Linguísticos para o Estudo das Variedades Africanas do Português, foi executado pelo grupo Linguística de Corpus do Centro de Linguística da Universidade de Lisboa – CLUL e por uma equipa do Centro de Física Teórica e Computacional da mesma universidade, tendo sido acompanhado pela consultora do projecto, Perpétua Gonçalves, da Universidade moçambicana Eduardo Mondlane.


Palavras-chave


Corpus África; Léxico; Variação; Português;

Texto completo:

PDF


E-ISSN: 1981-5794