Projeto Concluído

Projeto Lexis

Objetivos

O objetivo principal do Projeto LEXIS (início: 1991; término: 1997) foi criar um ambiente de tratamento automatizado permitindo o desenvolvimento de aplicações pelos mais diversos segmentos da pesquisa e do mercado de usuários potenciais do português, entre os quais a pesquisa documentária, a correção e a geração de textos, tradução automática e interrogação de bases de dados em linguagem natural.

Como objetivos específicos do Projeto LEXIS, foram estabelecidos:

a construção de um dicionário eletrônico para um subconjunto significativo da língua portuguesa;

a modelagem de nossa língua tendo como objetivo um tratamento informatizado;

o desenvolvimento de uma "caixa de ferramentas" de tratamento da língua portuguesa.

Fases do Projeto

O conjunto de esforços desenvolvidos para a realização do ambiente proposto envolveu uma duração de 05 anos, assim distribuídos:

uma fase de implantação do conjunto básico de componentes do ambiente proposto de tratamento da língua portuguesa, denominada "fase sedimentar" (duração: 24 meses, apoio PUCRS, CNPq e FAPERGS);

uma fase de utilização das ferramentas desenvolvidas, passando-se a trabalhar com dados de grandeza real, denominada "fase de aquisição", com duração de 18 meses (concluída em dezembro / 94, apoio:PUCRS, CNPq, FAPERGS, RHAE, PROTEM);

uma "fase de inserção", em outros ambientes de pesquisa e de desenvolvimento, dos resultados obtidos, com duração de 24 meses (apoio: PUCRS, CNPq).

Resultados do Projeto

Com relação ao desenvolvimento de software, foram desenvolvidos os protótipos:

de um dicionário de formas do português bem como de seu gerenciador (o software "Dicionário de Animais", desenvolvido para testar a estrutura das formas, já foi distribuído a várias instituições de ensino para uso como software instrucional);

de um dicionário seqüencial de bases do português bem como de seu gerenciador;

de um transdutor simplificado que efetua a análise morfológica de uma frase em português;

de um dicionário armazenado em árvore TRIE e do correspondente programa de análise morfológica, o qual relaciona informações morfológicas a cada cadeia armazenada no dicionário;

de um corretor ortográfico usando o método da chave-esqueleto;

de um gerador morfológico que efetua a geração de palavras segundo diferentes modalidades de uso;

de um analisador sintático do português, implementado a partir das Gramáticas de Adjunção de Árvores (TAG);

de um componente léxico semântico baseado na Teoria do Léxico Gerativo de James Iustejovski.

Durante a fase de inserção, foi trabalhado o tema da tradução automática usando TAGs síncronas.

Publicações resultantes

STRUBE DE LIMA, V. Processamento da linguagem natural: premissas e desafios. III Escola Regional de Informática, Canoas - RS, Abr. 1996.

AGUSTINI, A., STRUBE DE LIMA, V. Syntatic Divergences and Machine Translation. Cahiers de I'Institut de Linguistique de Louvain (CILL), Louvain - Bélgica, Set. 1997.

KIPPER, K.C., STRUBE DE LIMA, V. Portuguese analysis with tree-adjoining grammars. In: Proceedings of the 15th International Conference on Computational Linguistics, Kyoto - Japão, Ago. 1994. pp. 1255-1261.

KIPPER, K.C., STRUBE DE LIMA, V. Parsing Portuguese: a syntatical analyser using TAG formalism. In: Proceedings of the 3rd International Workshop on Tree-Adjoining Grammars, Paris - França, Set. 1994. pp. 64-69.

AGUSTINI, A., STRUBE DE LIMA, V. An experiment on Synchronous TAGs for the construction of a Transfer Module. In: Proceedings of the 4th Workshop on tree-Adjoining Grammars, Philadelphia - Pennsylvania, Ago. 1998. pp.1-4.

STRUBE DE LIMA, V., KIPPER, K.C. Analisador morfológico para tratamento de textos em português. Actas do Encontro de Processamento da Lingua Portuguesa EPLP'93, Lisbôa - Portugal, Fev. 1993. pp.39-44

KIPPER, K.C., STRUBE DE LIMA, V. Um analisador sintático para sentenças em linguagem natural. In: Anais das 24avas Jornadas Argentinas de Informática e Investigación Operativa, Buenos Aires - Argentina, Ago. 1995. pp.330-335.

ABRAHÃO, P.R.C., STRUBE DE LIMA, V. Um estudo preliminar de metodologias de análise semântica da linguagem natural. In: Anais do II Encontro para o Processamento Computacional de Português Escrito e Falado, Curitiba - PR, Out. 1996. pp.139-148.

STRUBE DE LIMA, V. Ambiente para tratamento lingüístico de documentos. In: Anais do II Simpósio Brasileiro de Informática na Educação, Porto Alegre - RS, Out.-Nov. 1991.

LUZ, A.L.L., MORAES, S.M.W., STRUBE DE LIMA, V. Léxico e análise morfológica de textos em português. In: Anais do IV Simpósio Brasileiro de Informática na Educação, Recife - PE, Dez. 1993.

AGUSTINI, A. STRUBE DE LIMA, V. Tratamento de Divergências Estruturais na Tradução Automática. In: Anais do Encontro Nacional de Inteligência Artificial, Brasília - DF, Ago. 1997. pp.105-111.

ABRAHÃO, P.R.C, STRUBE DE LIMA, V. Modelagem e Implementação de um Léxico Semântico para Linguagem Natural. In: Anais do Encontro Nacional de Inteligência Artificial, Brasília - DF, Ago. 1997. pp.98-104.

Trabalhos Premiados

MIRANDA, C.A.O. TRIE - estrutura de dados apropriada para dicionários: menção honrosa no III Salão da Iniciação Científica da PROPESP/UFRGS, ano 1991.

MARQUES, L.G.S. LEXIS - geração morfológica: menção honrosa no IV Salão da Iniciação Científica da PROPES/UFRGS, ano 1992.

SANTA MARIA FILHO, I. Tratamento automatizado da língua portuguesa - um analisador sintático: menção honrosa no VI Salão da Iniciação Científica da PROPES/UFRGS, ano 1994.

Colaboração com outras instituições

Em termos de colaboração Universidade - Empresa, trabalhamos, em 1994 / 95, no aperfeiçoamento de uma ferramenta para criação, a partir de um texto escrito em português, do Diagrama Entidade-Relacionamento (DER), em projeto de cooperação com a empresa DEVELOP e a UFRGS;