Contagem da frequência dos bigramas em palavras de quatro a seis letras do português brasileiro

  • Claudia Nascimento Guaraldo Justi
  • Francis Ricardo dos Reis Justi
Palavras-chave: bigramas, redundância ortográfica, análise de corpus linguístico.

Resumo

Vários estudos sobre leitura e escrita têm demonstrado a influência de unidades sublexicais no processamento da linguagem. Uma das medidas de unidades sublexicais mais conhecida é a frequência de ocorrência dos bigramas (pares ordenados de letras que co-ocorrem nas palavras de uma língua). Visando preencher uma lacuna nos dados psicolinguísticos relativos ao português brasileiro, o presente estudo disponibiliza aos pesquisadores dados relativos à frequência de ocorrência dos bigramas (type e token) em palavras de quatro a seis letras do português brasileiro. Os resultados desse estudo demonstraram que a correlação média entre as medidas type e token foi forte e que, de uma forma geral, há mais redundância ortográfica no final das palavras de quatro a seis letras, uma vez que os bigramas em posições finais foram sempre em menor número e significativamente mais frequentes do que os bigramas nas outras posições.
Publicado
2017-11-17
Seção
Artigos