Contagem da frequência dos bigramas em palavras de quatro a seis letras do português brasileiro

Autores

  • Claudia Nascimento Guaraldo Justi
  • Francis Ricardo dos Reis Justi

DOI:

https://doi.org/10.24879/200900300200385

Palavras-chave:

bigramas, redundância ortográfica, análise de corpus linguístico.

Resumo

Vários estudos sobre leitura e escrita têm demonstrado a influência de unidades sublexicais no processamento da linguagem. Uma das medidas de unidades sublexicais mais conhecida é a frequência de ocorrência dos bigramas (pares ordenados de letras que co-ocorrem nas palavras de uma língua). Visando preencher uma lacuna nos dados psicolinguísticos relativos ao português brasileiro, o presente estudo disponibiliza aos pesquisadores dados relativos à frequência de ocorrência dos bigramas (type e token) em palavras de quatro a seis letras do português brasileiro. Os resultados desse estudo demonstraram que a correlação média entre as medidas type e token foi forte e que, de uma forma geral, há mais redundância ortográfica no final das palavras de quatro a seis letras, uma vez que os bigramas em posições finais foram sempre em menor número e significativamente mais frequentes do que os bigramas nas outras posições.

Downloads

Não há dados estatísticos.

Downloads

Publicado

2017-11-17

Edição

Seção

Artigos