Descrição
O NERP-CRF é um sistema de Reconhecimento de Entidades Nomeadas, o qual realizada a identificação e classificação das Entidades Nomeadas, por meio da técnica de Aprendizado de Máquina Conditional Random Fields. As classes envolvidas nessa tarefa são: Abstração, Acontecimento, Coisa, Local, Obra, Organização, Pessoa, Tempo, Valor e Outro. O corpus pré-processado juntamente com um conjunto de features são as entradas para o classificador.
Download
O recurso é composto pelo corpus de referência do HAREM, o arquivo de PosTagger Open NLP e pela biblioteca Mallet. Todas as palavras que constituem o corpus de referência foram etiquetadas morfologicamente e suas Entidades Nomeadas receberam uma das dez classes.
Citação
Amaral, D. O. F. and Vieira, Renata. NERP-CRF: uma ferramenta para o reconhecimento de entidades nomeadas por meio de Conditional Random Fields. Linguamática (Braga), 2014. [pdf] [bib]