La extracción de entidades
de nombre también conocida como reconocimiento de entidades
de nombre, o en inglés Named Entity Recognition
(NER) es una parte del procesamiento del lenguaje natural que
tiene como objetivo localizar automáticamente en un
texto una serie de categorías de nombres expresan nombres
de personas, de organizaciones, de lugares , expresiones de
tiempo, cantidades, valores monetarios, etc.
Un sistema automático de extracción de entidades
de nombres sería capaz de tratar el siguiente texto
y recuperar sus entidades:
La NASA lanzará el viernes
6 de marzo desde Cabo Kennedy un telescopio que buscará
'tierras' fuera del Sistema Solar observando la luminosidad.”
El resultado de la extracción
de entidades de nombre sería la siguiente clasificación:
NASA es una entidad de nombre de organización.
6 de marzo es una entidad de expresión de tiempo.
Cabo Kennedy es una entidad de nombre de lugar y no de
nombre de persona.
El ámbito de aplicación básico de la extracción
de entidades de nombre es la Recuperación de la Información
mediante sistemas automáticos. La extracción
de las entidades de nombre es una técnica que mejora
la comprensión automática del texto, ya que a través
del reconocimiento de dichas entidades se obtiene gran cantidad
de información acerca del contenido |