Descrição
O CORP é um ferramenta de resolução de coreferências para o Português. Tendo como entrada textos puros, livres de anotação, o modelo é capaz de produzir cadeias de correferência em dois formatos de anotação (XML e HTML) . A ferramenta foi concebida por meio de regras linguísticas e conhecimento semântico. A ferramenta está disponível também em versão web.
Download
CORP versão desktop
Instruções de Uso
Para executar, basta colocar os arquivos a serem processados no diretório “Entrada” e executar o arquivo CORPv2.jar.
– Para sistemas Linux, usar linha de comando java -Dfile.encoding=ISO8859-1 -jar [caminho do corp.jar] – Os arquivos de saída estarão disponíveis em dois formatos diferentes, nos diretórios “/Saida/HTML” e “/Saida/XML”.
Citação
Citação em texto, bibtex e PDF do artigo
Licença de Uso
O CORP, está licenciado sob uma licença creative commons CC BY-NC-ND 3.0