Apuntes sobre Aprendizaje Relacional y Programación Lógica Inductiva

El aprendizaje relacional permite a las computadoras reconocer y formar relaciones entre elementos, como palabras en texto, elementos en imágenes o bases de datos SQL.
Tiene aplicaciones en minería de datos, clasificación de imágenes y procesamiento del lenguaje natural.
El objetivo principal es comprender las características del aprendizaje relacional y la programación lógica inductiva (PLI).
La PLI es un subcampo de la IA simbólica que utiliza la programación lógica como representación uniforme.
Dado un conocimiento previo codificado y ejemplos como una base de datos lógica, un sistema PLI genera un programa lógico hipotético.

La PLI se centra en desarrollar algoritmos para aprender patrones lógicos a partir de datos.
Estos algoritmos pueden aprender árboles de decisión y modelos de grafos probabilísticos.
Una aplicación importante es el procesamiento del lenguaje natural, donde la PLI aprende la sintaxis y semántica del lenguaje.
La PLI se usa en sistemas de traducción de idiomas, clasificación de textos y respuesta a preguntas.
La lógica relacional es fundamental para representaciones estructuradas como ERM y SQL.
La PLI se preocupa por aprender modelos interpretables a partir de datos con estructuras relacionales complejas.
La lógica relacional se utiliza para representar modelos en forma de teorías lógicas, es decir, conjuntos de reglas lógicas.
La PLI es útil en bioinformática y procesamiento del lenguaje natural.
Gordon Plotkin y Ehud Shapiro sentaron las bases teóricas del aprendizaje automático inductivo.
Shapiro implementó el primer sistema de inferencia de modelos en Prolog en 1981.
Este sistema infería inductivamente programas lógicos a partir de ejemplos positivos y negativos.
El término "programación lógica inductiva" fue introducido por Stephen Muggleton en 1991.
El término inductivo se refiere a la inducción filosófica: la sugerencia de una teoría para explicar hechos observados.

La PLI utiliza la lógica de primer orden para representar hipótesis y datos.
Es adecuada para problemas que involucran datos estructurados y conocimientos previos debido a su expresividad y naturaleza declarativa.
A diferencia del aprendizaje profundo, que requiere muchos ejemplos, la PLI puede derivar hipótesis de pocos ejemplos, incluso uno solo.
La PLI puede analizar teorías relacionales complejas como teorías de cálculo de ocasiones, redes de Petri, programas de conjuntos de soluciones y algoritmos estándar.
También permite razonar sobre hipótesis y examinar programas óptimos, incluyendo programas con complejidad temporal mínima y políticas de control de acceso estables.

La PLI ayuda a encontrar patrones y regularidades en los datos para comprender fenómenos y procesos.
Es útil cuando se tienen grandes cantidades de datos y no se conocen las reglas del sistema.
Se utiliza para determinar reglas y principios en campos como medicina, física y biología.
En biología, ayuda a explicar el funcionamiento de células y sistemas biológicos.
En medicina, identifica patrones en datos para tratamientos eficaces y prevención de enfermedades.
En física, se usa para el descubrimiento de leyes y principios de la naturaleza.

Los programas de robótica requieren conocimientos del dominio y necesidades seguras.
The Robot Engineer utiliza PLI para diseñar equipos y robots comprobados en simulaciones y entornos reales (Sammut et al., 2015).
Un estudio en Autonomous Robots utilizó PLI para aprender políticas de control que permiten a un robot navegar y evitar obstáculos (Hamadi et al., 2007).
En la Conferencia Internacional sobre Robots y Sistemas Inteligentes, se presentó un caso donde la PLI permitió a un robot aprender habilidades de manipulación basadas en demostración y retroalimentación (Demircan et al., 2015).
ROSPlan permite a los robots razonar y ejecutar planes de alto nivel en tiempo real (Chang et al., 2014).

La inducción de pautas deportivas tiene un largo historial en PLI, especialmente en el ajedrez.
Se ha utilizado para la evaluación de posiciones, desarrollando sistemas que evalúan la fuerza de una posición y predicen el resultado (López de Mantaras, 2019).
Holland investigó la clasificación de finales de ajedrez.
El artículo de Reiser describe el uso de PLI para clasificar aperturas basándose en la estructura de los peones y el desarrollo de las piezas (Reiser & Riddle, 1998).

Depende de patrones en grandes conjuntos de datos. Si el conjunto de datos es pequeño, puede no encontrar suficientes patrones.
La interpretación puede ser difícil a medida que aumentan las reglas lógicas, lo que dificulta la comprensión de predicciones y decisiones.
No es adecuada en casos con alta incertidumbre o falta de información.
Los modelos son difíciles de actualizar y adaptar a nuevos datos o cambios en el sistema.

La PLI se utiliza para extender y modificar registros, explorando paquetes ejecutables.
Esto es útil en la síntesis de paquetes para resolver problemas de usuario final, como modificaciones de cadenas en Microsoft Excel.
La programación lógica y las bases de datos relacionales tienen el mismo fundamento teórico.
La programación lógica es un formalismo ideal para desarrollar aplicaciones de bases de datos, lo que ha llevado a bases de datos deductivas.
Las bases de datos deductivas admiten definiciones de datos y lenguajes de consulta más expresivos que los sistemas relacionales.
Prolog es un lenguaje de programación lógica utilizado para implementar sistemas expertos, donde el conocimiento se representa en forma de reglas y hechos.
Las consultas se realizan mediante un sistema de inferencia que deduce nuevos hechos a partir del conocimiento existente.
Prolog es menos eficaz para problemas complejos y no es tan fácil de aprender como otros lenguajes.