4) A interlíngua da base lexical bilíngue REBECA
Resumo
Inglês: In Natural Language Processing (NLP) domain, a lexical database, i.e. a systematic stock of words of a natural language, is a crucial component of a wide variety of NLP applications. In this paper, we present the interlingua used in the construction of the bilingual lexical database called REBECA, one of the few lexical resources that encompasses Brazilian Portuguese (BP) language. The interlingua is the core feature of REBECA and it is composed of a set of concepts which allows the alignment of the English and BP monolingual databases. Precisely, we present: (i) the composition; (ii) the structure, (iv) the formalism, and (v) the editing tool used to develop REBECA. . As a result, we obtained a formal and hierarchical interlingua, which allowed a proper link between the monolingual databases.KEYWORDS: Natural language processing; Lexical data base; Interlingua; Lexical-conceptual alignment; Concept.
Tradução: No Processamento Automático das Línguas Naturais (PLN), as bases de dados lexicaisdesempenham papel central em diversos sistemas que processam língua natural. Neste trabalho, apresentamos a interlíngua que foi utilizada na construção da base de dados lexicais bilíngue REBECA, uma das poucas que englobam o português do Brasil. A interlíngua dessa base é composta por um conjunto de conceitos que funciona como elo entre as bases monolíngues do inglês norte-americano e do português brasileiro. Especificamente, apresentamos: a (i) composição, a (ii) estrutura, o (iii) formalismo de representação dos conceitos e a (iv) ferramenta computacional de auxílio à construção da referida base. Como resultado, obtivemos uma interlíngua formal e hirarquicamente organizada, que garantiu o alinhamento eficaz das bases monolíngues da REBECA.
Palavras-chave: Processamento automático das línguas naturais; Base de dados lexicais; Interlíngua; Alinhamento léxico-conceitual; Conceito.
Downloads
Não há dados estatísticos.