RECURSOS ONLINE
- Portal de Ontologias: http://ontolp.inf.pucrs.br/
- Matching de Ontologias: http://voar.inf.pucrs.br
- Resolução de Correferências: http://grupopln.inf.pucrs.br/corref/
- Extração de Termos Médicos: http://grupopln.inf.pucrs.br/meshx/
Reconhecimento de Entidades Nomeadas
- Corpora: Entidades Geológicas
Reconhecimento de Entidades Nomeadas para a área de Geologia em textos em Português, denominadas Entidades Geológicas.
- Ferramenta: NERP-CRF
Sistema de Reconhecimento de Entidades Nomeadas.
Extração de Relações Abertas entre Entidades Nomeadas
- Recurso: Textos e listas de Relações
Extração de Relações abertas que ocorrem entre pares de Entidades Nomeadas do domínio de Organizações para o Português.
Resolução de Correferências
Corpora contendo a anotação de correferência para o Português.
- Ferramentas: CORP versão Desktop , WebDemo e CorrefVisual
CORP para resolução automática de correferências para o Português, CorrefVisual para visualização e dição de cadeias geradas pelo CORP.
Extração de Termos
- Corpora: Corpora de Domínio e Listas de Conceitos e Termos
Corpora envolvendo os seguintes domínios: Pediatria, Geologia, Modelagem Estocástica, Mineração de Dados e Processamento Paralelo. Lista de conceitos e termos relevantes para cada destes domínios.
Dicionário bilíngue Inglês-Português para domínios específicos e corpora paralelo.
Identificação de Relações Semânticas entre Pares de Palavras
- Recurso: Lista de pares de palavras
Lista de 65 pares de palavras traduzidos para o francês e para o português, contendo cada par sua respectiva pontuação.
Extração de Relações Taxonomicas
- Ferramenta: HREx
Ferramenta para a extração de relações taxonomicas (i.e., relações “é um tipo de”) entre termos.
Análise de Sentimentos
Recursos:
Léxico de sentimento para a língua portuguesa (OpLexicon).
Reviews em Português de 10 hotéis do TripAdvisor anotados manualmente com a polaridade de cada feature.
Base lexical de palavras de emoções para a língua portuguesa.
Ontologias
Ferramentas:
Portal de Ontologias.
Corpus não anotado
Coleção de 5 milhões de postagens retiradas de blogs na plataforma Blogspot escritas por usuários brasileiros.
Dicionários de Palavras Médicas
Coleção de 64 mil palavras com relação semântica e sintática extraídas de 21 milhões de sentenças médicas.