Clasificación y jerarquización entre decenas de miles de categorías basadas en grandes corpus de conocimiento.

  • Etiquetado automático de textos
  • Algoritmo propio de aprendizaje
  • Extracción de conceptos
Acerca del proyecto

ClassOn es un proyecto satélite de SIFIA que centra sus esfuerzos en el etiquetado automático de textos, descubrimiento de categorías de patentes aplicables y extración de conceptos para su posterior uso a la hora de descubrir relaciones, asociaciones y conexiones semánticas en grandes cantidades de texto.
Usando los últimos algoritmos en Aprendizaje Máquina (Machine Learning) y un novedoso algoritmo propio, es capaz de usar corpus de conocimiento ya establecidos como la base de datos de patentes estadounidense o la Wikipedia para generar un resultados precisos y coherentes. También se incluye entre sus objetivos conseguir un etiquetado y minería de conceptos multilenguaje que nos permita rebasar la barrera del idioma a la hora de indexar, relacionar, categorizar y poner en contexto los textos que se analicen y un algoritmo de jerarquización de categorías propio, semánticamente similar a las categorizaciones humanas, que facilitará la navegación en grandes cantidades de textos no clasificados a priori.