Clasificación y jerarquización entre decenas de miles de categorías basadas en grandes corpus de conocimiento.
ClassOn es un proyecto satélite de SIFIA que centra sus esfuerzos en el etiquetado automático de textos, descubrimiento de categorías de patentes aplicables
y extración de conceptos para su posterior uso a la hora de descubrir relaciones, asociaciones y conexiones semánticas en grandes cantidades de texto.
Usando los últimos algoritmos en Aprendizaje Máquina (Machine Learning) y un novedoso algoritmo propio, es capaz de usar corpus de conocimiento
ya establecidos como la base de datos de patentes estadounidense o la Wikipedia para generar un resultados precisos y coherentes.
También se incluye entre sus objetivos conseguir un etiquetado y minería de conceptos multilenguaje que nos permita rebasar la barrera del idioma
a la hora de indexar, relacionar, categorizar y poner en contexto los textos que se analicen y un algoritmo de jerarquización de categorías propio,
semánticamente similar a las categorizaciones humanas, que facilitará la navegación en grandes cantidades de textos no clasificados a priori.