EL APRENDIZAJE AUTOMÁTICO DE LAS MÁQUINAS
Con el paso del tiempo se han desarrollado diferentes métodos para el análisis de datos que están basados en técnicas estadísticas. Sin embargo, a medida que la información almacenada crece considerablemente, los métodos estadísticos tradicionales han empezado a enfrentar problemas de eficiencia y escalabilidad. De ahí nace la necesidad de crear una nueva forma de procesar y convertir estos datos en información útil que sirva de apoyo para la toma de decisiones en una organización, dando paso al surgimiento del aprendizaje automático o machine learning.
Los arboles de decisión, son una herramienta clave para la toma de decisiones; estos son actualmente utilizados por la minería de datos para el análisis de datos y la toma de decisiones convenientes. El árbol de decisión es una forma gráfica y analítica de representar una serie de condiciones que ocurren de forma sucesiva. El análisis por medio de esta herramienta, consiste en desintegrar todos los caminos y alternativas posibles hasta llegar a los distintos estados finales. Este esquema se representa en forma de árbol, dándole a cada rama una probabilidad de ocurrencia.
Dicho modelo se construye a partir de la descripción narrativa de un problema, ya que provee una visión gráfica de la toma de decisión, especificando las variables evaluadas, las acciones que deben ser tomadas y el orden en el que la toma de decisión debe ser efectuada.
Los arboles de decisión son apropiados para expresar procedimientos médicos, legales, comerciales, estratégicos, matemáticos, lógicos entre otros. Estos algoritmos son llamados o conocidos como algoritmos de “divide y vencerás”.
Dentro de la terminología utilizada para esta herramienta encontramos:
Nodo de decisión representado por la figura cuadrado que indica que se debe tomar una decisión en ese punto del proceso.
Nodo de probabilidad simbolizado por la figura circulo indica que en ese punto del proceso ocurre un evento aleatorio.
Rama representado por la figura de una flecha indica los diferentes caminos que se pueden tomar luego de una decisión o un evento aleatorio.
Ahora bien, ya con la parte conceptual clara, ¿En qué momento la evolución de la tecnología llegó a tal punto que las máquinas pueden aprender por si mismas? Antes de mencionar de qué forma funciona, es importante definir que es aprendizaje automático. Para contextualizar, es necesario observar como aprende el ser humano, y si estas formas aplican para los sistemas de información.
Existen tres mecanismos de aprendizaje destacables: inducción, deducción y abducción, los cuales en el transcurso del tiempo se van desarrollando complementando las competencias básicas del ser, del cómo actuar en determinadas situaciones, que decisiones tomar, y poder diferenciar un objeto de otro por sus atributos. En los sistemas sucede algo parecido, un almacenamiento de datos generalmente se hace con un atributo característico que lo distingue de todos, un identificador, una cualidad o un tipo, entonces, el aprendizaje automático, junto al algoritmo TDIDT (Árboles inductivos de arriba hacia abajo – Top-Down Induction Trees), el cual hace un exhaustivo uso de los árboles de decisión para lograr su cometido, transforma un conjunto de datos en un modelo clasificado por características o atributos.
Hoy en día, es evidente ver los resultados de esta implementación en sistemas de datos robustos, como Google.
Permitiendo mediante el motor de búsqueda que todos los usuarios usan, Google va filtrando información según un tema, atributo en especial que consulten en sus bases de datos, esto con el fin de reducir el tiempo de búsqueda y mostrarle al usuario información mas acorde al perfil que tiene, la cual consiste en palabras, imágenes, videos, gustos, sitios a visitar, rutas frecuentes, entre otros.
Otro ejemplo de la implementación de algoritmos que usan arboles de decisiones conformados por premisas y un valor lógico de 0 y 1 (Si, NO, F, V), son las entidades bancarias, ¿Quién no ha recibido una llamada “molesta” donde ofrecen productos según el perfil crediticio del usuario, sin que se tenga la menor idea de como es que saben toda esta información, necesidades, gustos y probables problemas con otras entidades? Bueno, he aquí el uso de un dispendioso análisis de datos, un sistema de información convertido en un modelo que ayuda a los bancos a elaborar propuestas mas atractivas para sus clientes según su consumo, capacidad de pago, entre otros factores que influyen a la hora de escoger lo más adecuado. Mediante premisas y atributos, se genera un resultado, arrojado por un sistema que le ingresa numerosa información, y mediante el estudio y el procesamiento del algoritmo, entrega reportes, y en caso de que no sea el adecuado, el sistema ya toma decisiones independientes para ajustarse a los objetivos del banco. Todo este procedimiento es el método de aprendizaje automatico a partir de la experiencia, citando la siguiente nota:
“Se puede afirmar que un programa computacional es capaz de desarrollar aprendizaje automático a partir de la experiencia E con respecto a un grupo de tareas T y según la medida de performance P, si su performance en las tareas T, medida según P, mejora con la experiencia E.”
Para entrar en más detalles, el sistema de aprendizaje se clasifica en los siguientes pilares: métodos de caja negra y métodos orientados al conocimiento. El primero es el más común, se trata de realización de cálculos matemáticos muy eficientes, los cuales son difíciles de ser entendidos por la persona que usa el sistema. Un ejemplo son los métodos estadístico-matematicos y las redes neuronales. En cambio, el otro método se encarga de representar todo este análisis que realiza el sistema de forma simbolica de tal forma que sea legible para el usuario.
El esquema general de un sistema de aprendizaje automatico se compone de dos tipos de entradas, y uno de salida. En las entradas están los ejemplos que difieren mediante un conjunto y valores de atributos un cierto concepto, explicar algo, en tanto a los conocimientos previos contienen la información acerca del lenguaje utilizado para describir los ejemplos y los conceptos, es decir, son una suerte de metalenguaje, es decir, el sistema usa estos conocimientos previos para interpretar y describir los ejemplos para generar una descripción de los mismos. Consiguiente a este grupo de entradas, aparece el aprendizaje de conceptos.
Se entiende por concepto en el contexto de aprendizaje automático, como un conjunto de objetos que comparten ciertas propiedades y atributos que los hacen diferentes a otros conceptos.
Volviendo al ejemplo del motor de búsqueda de Google, un ejemplo de concepto seria el tipo de búsqueda que se guarda en el sistema, si es texto, imagen o video, cada uno con un conjunto de propiedades únicas que entran al sistema, y posterior, con un respectivo análisis de sus atributos, lanzan un resultado acorde y adecuado en la siguiente vez que se quiera realizar una consulta de nuevo.
En el ámbito de ingeniería de sistemas, apuntar a construir sistemas de información con capacidad de memorizar, procesar, analizar y aprender por si mismos, es un tema que hay que perfeccionar, ya que en temas de privacidad de la información es importante manejar ciertos límites, aunque es un apartado muy interesante pensando en un futuro cercano donde la matemática y la ingeniería de sistemas pueden crear tecnología surrealista, de películas de ciencia ficción, pero que en la cotidianidad, ya se ve poco a poco como se va acercando más a esa “ficticia” realidad. En conclusión, el mercado exige una toma de decisiones más eficaces y relevantes, la información pasa ser un factor indispensable para predecir patrones, comportamientos y dinámica del mercado en general, permitiendo, con un sistema de información con tecnología de minería de datos, Big data y aprendizaje automático, anticiparse a los movimientos de un sistema económico que día a día va cambiando conforme a las necesidades de la sociedad.
Si te gustó mi artículo visita nuestras redes sociales, ¡compártelo y síguenos!
Si te apasiona la tecnología y quieres hacer parte de nuestro equipo visita nuestra sección Trabaje con nosotros y postula tu CV.
BIBLIOGRAFIA
[Michalski, 1991] Michalski, R. S. 1991. Towards an Unified Theory of Learning: An Outline of Basic Ideas, Proceedings of the 3rd World Conference on the Fundamentals of Artificial Intelligence, Paris, Julio 1-5, 1991
[Michalski, Tecuci, 1994] Michalski, R. S., Tecuci, G. (eds) 1994. Machine Learning: A Multistrategy Approach, Vol.IV, Morgan Kauffinan, EE.UU
Autor:
Jhonatan Arango.
Miembro del equipo IT Experts.
Ingeniero de desarrollo.