Datos informativos, patrones y aprendizaje

El aprendizaje se asocia con la adquisición y modificación de habilidades, destrezas, conocimientos, conductas y valores. En ciertas ocasiones, el análisis del aprendizaje puede circunscribirse a un ámbito natural, por ejemplo, el aprendizaje humano o de los animales, o bien a un ámbito artificial, por ejemplo, el área de la inteligencia artificial y el aprendizaje automático. Especialmente, en ese último ámbito, el aprendizaje como proceso de adquisición de conocimiento guarda relación con tres aspectos: la extracción de conocimiento, la minería de datos y el aprendizaje automático.

Procesamiento de datos informativos

El conocimiento remite a información adquirida por la experiencia o la formación de cualquier aspecto referente a la realidad. La extracción de conocimiento es el proceso de identificación de patrones válidos, novedosos y potencialmente útiles y comprensibles que se encuentran en los datos informativos. El valor de los datos informativos sólo es relevante a posteriori, a la luz del conocimiento que proporcionan.

El procesamiento de los datos informativos se sustenta en una metodología procedimental cuyo cumplimiento hace posible logar un conocimiento a partir de las características informativas que contienen los datos.

En una presentación simple, el procedimiento aludido podría estar constituido por tres etapas:

  • el preprocesamiento de la información
  • la extracción de modelos; y,
  • el postprocesamiento, la evaluación del conocimiento (Ilustración 1).

El esquema representado en la Ilustración 1 quiere ir más de la simplificación recién expuesta de tres etapas sucesivas. La linealidad puede eliminarse si rechaza el carácter iterativo del procedimiento y se considera la posibilidad de retroalimentaciones.la salida de una etapa no tiene por qué conducir a la siguiente, puesto que cabe la retroalimentación con alguna etapa anterior, con la posibilidad de modificar una u otra, o ambas. Este rasgo puede conducir a mejoras en los resultados y de la calidad de los modelos o patrones identificados; aunque no carece de costes en términos de consumo de tiempo o de indeterminación en los resultados. La representación propuesta no agota la iteratividad posible. El máximo riesgo es un bloqueo con la consiguiente paralización del procedimiento.

La interactividad del proceso de extracción de conocimiento deriva de la posibilidad por parte del usuario de determinar los modos de actuación en cada una de las etapas. La validez de los modelos obtenidos, el estudio de su utilidad y las orientaciones futuras depende de la interactividad del proceso con el usuario.

El establecimiento de diferentes interacciones y rutas de ida y vuelta pueden conformarse como fuentes importantes de conocimiento novedoso. El nuevo conocimiento puede surgir de nuevas fuentes de datos informativos, pero también de enfocar o modelizar de una forma diferentes los datos informativos previamente disponibles. Por ello, el preprocesamiento es una etapa sumamente importante. El tratamiento de los datos antes de efectuar un intento de extraer de modelos de los datos no es una etapa carente de consecuencias para la generación de conocimiento. Por el contrario, la forma de disposición de los datos informativo puede ser crucial para la obtención de conocimiento.

Minería de datos

La minería de datos se relaciona con el establecimiento de patrones. Y, es importante tener presente que el establecimiento de patrones es un elemento necesario para el análisis de los datos, sino que es, de hecho, puesto que es imposible analizarlos sin un patrón organizador de los datos recolectados. El coste de tener un patrón es que, en determinadas ocasiones, el patrón mismo puede aparecer como un impedimento hacia nuevo conocimiento y, con ello, una imposibilidad para una correcta compresión de la información. El patrón pueden inducir sesgos en la organización de los datos, esto contribuye a obtener conocimiento pero también puede ser un gran impedimento para descubrir otro conocimiento.

No obstante, siempre, necesitamos modelizar los datos, especialmente cuando estos son numerosos. La modelización puede ser apriorística o podemos intentar que surjan a partir de los propios datos (aunque resulta complicado). Es más, la automatización en el establecimiento de patrones es deseable cuando el volumen de datos informativos es muy elevado. El aumento del número de datos otorga una gran importancia a la minería de datos, cuyo propósito es extraer información del conjunto de datos para transformarla en una estructura comprensible que favorezca su uso posterior. Aunque, como venimos diciendo, la estructuración no aparece únicamente a posteriori, sino que también es previa (consciente o inconscientemente)

El aprendizaje automático permite expresar en forma de patrones los datos obteniendo de este modo un conocimiento y también una mejor compresión del conocimiento bajo la forma de conceptos (ya establecidos).

El aspecto crucial parece ser la contribución a la detección de la novedad. El objetivo de la minería de datos es inferir conocimiento bajo la forma de patrones o modelos que sea útil en la mejora de algún aspecto. La novedad debe ser incorporada a nuestro conocimiento, ampliándolo e incrementándolo.

Aprendizaje incremental y revisión de patrones

El aprendizaje incremental se caracteriza por su capacidad para incorporar información aportada por las nuevas experiencias a un modelo o patrón previamente existente. También contribuye a la evolución de este modelo inductivo. La nueva información puede articularse con facilidad al modelo preexistente manifestando una secuencialidad. Aunque también puede comportar cambios significativos en el modelo y alterarlo radicalmente. Se manifestarían dos situaciones: un aprendizaje secuencial y un aprendizaje temporal por lotes. Este último se caracteriza por la destrucción del modelo inducido cada vez que llegan experiencias nuevas, cuya incorporación requiere cambios significativos en el modelo. En este sentido, no hay evolución incremental del modelo en el que se acomoda la información de las nuevas experiencias. Los requisitos de memoria no dependen del número de experiencias en el conjunto de datos, sino de la estructura que se induce.