Patrones en común y tipos de relación


Este es un ejemplo de Meta-Learning adaptado ligeramente a la técnica Few-Shot Learning.

El objetivo es probar la capacidad del modelo para resolver la operación matemática en base a unos pocos ejemplos.

La resolución no representa mayor problema para el modelo, ya que la información sobre cómo resolver operaciones aritméticas básicas se encuentra dentro de sus datos de preentrenamiento. Sin embargo, resulta útil para comprender cómo el modelo identifica los patrones en común y los tipos de relación que se presentan en un prompt que no contiene ninguna explicación sobre la tarea que tiene que resolver.


INPUT:

    
5 + 8 = 13
7 + 2 = 9
1 + 0 = 1
3 + 4 = 7
5 + 9 = 14
9 + 8 =

OUTPUT:

    9 + 8 = 17
  

Esta serie de operaciones fue diseñada para demostrar la capacidad de la técnica Few-Shot Learning, es decir, la capacidad de aprender de manera efectiva con un pequeño número de ejemplos.

En este caso, las muestras 1 a 5 pueden servir como "ejemplos de entrenamiento" para que el modelo de lenguaje aprenda a realizar operaciones aritméticas básicas, mientras que la muestra 6 puede ser considerada como un "ejemplo de prueba" para evaluar la capacidad del modelo de generalizar y aplicar sus conocimientos a nuevos casos.




ANÁLISIS DE PATRONES

AUSENCIA DE VARIABLES:

Todas las muestras proporcionadas tienen en común:



SON OPERACIONES MATEMÁTICAS (ARITMÉTICA).

SE PRESENTAN DE FORMA ORDENADA.

TIENEN EL FORMATO DE UNA ECUACIÓN SIMPLE.




TIENEN UN NÚMERO FIJO DE OPERANDOS (DOS).

EL OPERADOR SIEMPRE ES EL MISMO: LA SUMA (+).

LOS DOS OPERANDOS SON NÚMEROS ENTEROS POSITIVOS.




SE SUMA EL PRIMERO AL SEGUNDO PARA OBTENER UN RESULTADO.

EL RESULTADO DE LA SUMA SIEMPRE ES UN NÚMERO ENTERO.

EL RESULTADO SIEMPRE ES UN NÚMERO MAYOR QUE CERO.



SIGUEN LA MISMA ESTRUCTURA.
      LOS ELEMENTOS SIEMPRE ESTÁN SEPARADOS POR UN ESPACIO.

LOS RESULTADOS DE LAS OPERACIONES ARITMÉTICAS
      SON CORRECTOS.

CON EXCEPCIÓN DE LA ÚLTIMA, TODAS LAS MUESTRAS
      TIENEN UN RESULTADO.



EXCEPCIÓN:



LA ÚLTIMA MUESTRA TIENE UN SIGNO DE IGUALDAD PERO NO TIENE EL RESULTADO.

ESTO SUGIERE QUE SE ESPERA QUE EL MODELO COMPLETE LA OPERACIÓN.









RELACIÓN DE CONTINUIDAD

SIN RELACIÓN DE CONTINUIDAD:

Desde un punto de vista lógico, no existe una relación de continuidad en el prompt.


CADA ECUACIÓN ES INDEPENDIENTE DE LAS DEMÁS.

NO HAY UNA SECUENCIA LÓGICA
   EN LA QUE CADA ELEMENTO SIGUE AL ANTERIOR DE MANERA PREDECIBLE.

AUNQUE LAS ECUACIONES SON MATEMÁTICAMENTE CONSISTENTES,
   NINGUNA DEPENDE O SIGUE LÓGICAMENTE A LA ANTERIOR.



      2 + 3 = (5)
    (5) + 2 = (7)
    (7) + 4 = (11)
   (11) + 1 = (12)
   (12) + 3 = (15)
   (15) + 5 = (   )

NO SIGUEN UN PATRÓN ESPECÍFICO.

Por ejemplo:

La secuencia de Fibonacci: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89...

Una serie de números pares: 0, 2, 4, 6, 8, 10, 12, 14 ,16 ,18 , 20...



    2 + 58 = (60)
   20 + 30 = (50)
   22 + 18 = (40)
    9 + 21 = (30)
   14 +  6 = (20)
    3 +  7 = (   )

NO HAY UNA PROGRESIÓN ARITMÉTICA.

Por ejemplo, aumentar o disminuir una cantidad constante en cada término.






    2 + (3) = 5
    5 + (3) = 8
    8 + (3) = 11
   11 + (3) = 14
   14 + (3) = 17
   17 + (3) = (   )


VALORES DISTINTOS.

Cada expresión en el prompt incluye números diferentes, y cada una de ellas resulta en un número entero diferente.




Las ecuaciones comparten características comunes y tienen resultados consistentes, pero no establecen una relación de continuidad en el sentido de una secuencia lógica o un patrón predictivo entre ellas.

Sin embargo, las muestras comparten una estructura matemática común. Es cierto que las muestras no siguen un patrón específico o una secuencia lógica. Esta visión se enfoca exclusivamente en la falta de un patrón ovniversal o secuencia en los datos, descartando la idea de una relación entre las muestras. Si bien es cierto que no hay una conexión explícita entre los elementos individuales, la estructura compartida y la operación en todas las muestras proporcionan una base para comprender su interconexión.




RELACIÓN SUBYACENTE:


Existe una "relación de continuidad" en el sentido de que cada ecuación sigue la misma estructura matemática. Esta relación se basa en la operación aritmética de suma:




TODAS LAS OPERACIONES SON SUMAS.

EN TODAS LAS OPERACIONES SE SUMAN DOS NÚMEROS ENTEROS.

EL RESULTADO SIEMPRE ES UN NÚMERO ENTERO MAYOR QUE CERO.




Una relación de continuidad es aquella que tiene un orden natural y predecible. En este caso, el orden natural es el siguiente:

a + b = c

donde "a" y "b" son los dos números sumados,

y "c" es el resultado de la suma.


Esta relación se manifiesta en el hecho de que el resultado de cada operación es la suma de los dos números sumados.

La relación de continuidad le permite al modelo de lenguaje aprender que las expresiones matemáticas que utilizan dos números enteros y el operador suma (+) siempre darán como resultado un número entero.

Esta relación está basada en la operación de suma y une todas las ecuaciones. Proporciona un patrón claro; es consistente y predecible en las ecuaciones, lo que sugiere una forma de continuidad.

Las muestras no siguen un patrón específico o una secuencia lógica. Sin embargo, esto no significa que no exista una relación de continuidad. La relación de continuidad puede ser más sutil que un patrón obvio. En este caso, la relación de continuidad es sutil, pero es real. Es una relación matemática subyacente que existe entre todas las muestras. Es consistente, predecible y relevante para el objetivo de entrenar un modelo de lenguaje, ya que le permite aprender que las expresiones matemáticas que utilizan dos números enteros y el operador suma (+) siempre darán como resultado un número entero.


CADA ECUACIÓN SIGUE UN PATRÓN PREDECIBLE Y UNIFORME.




   
    a + b = c
   
   
    5 + 8 = 13
    7 + 2 = 9
    1 + 0 = 1
    3 + 4 = 7
    5 + 9 = 14
    9 + 8 = (   )    

La estructura consistente de las muestras proporcionadas en el prompt crea un patrón que el modelo puede reconocer y aprender. Todas las muestras en el prompt involucran la adición, que es una operación aritmética fundamental. Esta operación compartida crea un hilo conductor entre las muestras, permitiendo la identificación de una relación entre ellas.

El resultado de cada muestra es siempre un número entero mayor que cero. Al ser un resultado previsible permite establecer una relación entre las entradas y salidas, lo que facilita el proceso de aprendizaje para un modelo de lenguaje.

Representa la base para un análisis más profundo. Se evidencia la existencia de una relación basada en la estructura compartida y la operación, y podemos construir sobre ella para analizar patrones y relaciones más complejas dentro de los datos.





CORRELACIÓN ESTADÍSTICA

La correlación es una medida estadística que indica el grado de relación entre dos variables. En concreto, la correlación lineal sirve para determinar cuánto de correlacionadas linealmente están dos variables distintas. Dos variables están relacionadas cuando al variar los valores de una de ellas también cambian los valores de la otra.


¿EXISTE CORRELACIÓN EN EL CONJUNTO DE MUESTRAS DEL PROMPT?



RELACIÓN LÓGICA

Todas las ecuaciones siguen un mismo patrón en su estructura. Sin embargo, esta similitud no necesariamente implica una relación de correlación. Cada par de números suma para dar en cada caso un resultado diferente, por lo que no hay una relación predictiva entre ellos.


EL PROMPT NO PRESENTA VARIABLES CUANTITATIVAS CONTÍNUAS.

CADA ECUACIÓN ES INDEPENDIENTE DE LAS DEMÁS.

SON DATOS AISLADOS
     QUE NO REPRESENTAN UNA RELACIÓN DE CAUSA Y EFECTO.

NO PARECEN SEGUIR UN PATRÓN ESPECÍFICO
     NI UNA REGLA QUE RELACIONE LAS MUESTRAS.

NO HAY PROGRESIÓN ARITMÉTICA O GEOMÉTRICA EVIDENTE.


"Si cada expresión es una operación individual, cada conjunto de variables ("a", "b", y "c") representa un cálculo independiente; el conjunto de muestras es simplemente una colección de operaciones individuales".


Cada vez que una nueva muestra se presenta, podría decirse que hay una correspondencia, ya que siguen un patrón, que sería la suma de los números presentados en el orden anterior. El argumento tiene sentido lógico, pero no sería exactamente una correlación, puesto que una correlación implica una relación matemática entre dos variables, como la tendencia a aumentar juntas.

Podemos observar una secuencia lógica, pero no necesariamente una correlación estadística. Este patrón es una inferencia subjetiva, y la falta de una regla matemática explícita en el prompt hace que la relación de correspondencia sea ambigua. Las sumas son aleatorias o estan basadas en reglas no declaradas.

La correlación no es solo una simple asociación entre dos variables. En realidad, es una medida del grado de co-variación entre dos variables. Es decir, mide hasta qué punto dos variables se mueven juntas. La correlación exige una evidencia de causalidad, y el simple hecho de que dos variables tengan un patrón observable no es suficiente para confirmarlo. En pocas palabras, necesitaríamos saber qué causa el patrón, para poder hablar de correlación.

La distinción entre una correlación y una simple asociación es importante para entender el tipo de relación que existe entre dos variables. Una correlación sugiere una relación más profunda y precisa entre las variables, mientras que una asociación simplemente indica que dos variables están relacionadas, pero no necesariamente de una manera precisa o predictiva.


A continuación se cita un ejemplo donde se presenta una correlación evidente entre las muestras:



 1 + 0 = 1
 1 + 2 = 3
 5 + 1 = 6
 7 + 0 = 7
 7 + 1 = 8
 x + 2 = 11


 a1 + b1 = c1,  luego b1 + c1 = a2
 a2 + b2 = c2,  luego b2 + c2 = a3
 a3 + b3 = c3,  luego b3 + c3 = a4
 a4 + b4 = c4,  luego b4 + c4 = a5
 a5 + b5 = c5,  luego b5 + c5 = x
 x  + b6 = c6.


 1 + 0 = 1,  luego 0 + 1 = 1
 1 + 2 = 3;  luego 2 + 3 = 5
 5 + 1 = 6,  luego 1 + 6 = 7
 7 + 0 = 7;  luego 0 + 7 = 7
 7 + 1 = 8;  luego 1 + 8 = 9
 9 + 2 = 11.

Este grupo de muestras sigue un patrón específico donde el resultado de una ecuación se utiliza como entrada para la siguiente y cada muestra es dependiente de las demás en esta secuencia. El primer término de cada ecuación es la causa, el segundo término es la acción y el resultado es el efecto. En su conjunto, las muestras se comportan como variables respecto a las demás.




RELACIÓN DE PROPORCIONALIDAD DIRECTA


Aunque las muestras parecen no estar conectadas unas con otras, se puede evidenciar una correlación interna entre las variables de cada muestra.

Todas las muestras siguen la forma "a + b = c", donde "a" y "b" son los números sumados, y "c" es el resultado de la suma.


"a" Y "b" SON VARIABLES INDEPENDIENTES.

"c" ES LA VARIABLE DEPENDIENTE.

POR EJEMPLO, SI "a" ES MAYOR, "c" ES MAYOR.

EL VALOR DE "c" NO DETERMINA EL VALOR DE "a" Y "b".


Se establece una relación de proporcionalidad directa, lo que significa que existe una relación entre dos variables en la que un cambio en una variable provoca un cambio proporcional en la otra variable.

Entonces, podemos afirmar que existe una correlación en las ecuaciones proporcionadas, basándonos en la relación de dependencia entre las variables "a", "b" y "c" en cada ecuación de suma, es decir, en la estructura interna de cada una de las muestras proporcionadas en el prompt.

En el ejemplo, la relación de correlación entre (a y c) y entre (b y c) es lineal. Esto significa que la relación entre las variables puede ser representada por una línea recta. De igual forma, la relación de correlación es positiva. Esto significa que, a medida que aumenta una variable, también aumenta la otra variable.




A continuación se citan dos pruebas que realizamos para evaluar el tipo de relación presente en las muestras del prompt.




[TEST]


COEFICIENTE DE CORRELACIÓN


El coeficiente de correlación ( r ) es una medida de la fuerza y la dirección de la relación lineal entre dos variables.

Dicho valor puede estar entre ( -1 ) y ( +1 ).

Si ( r ) es cercano a ( -1 ) indica una correlación negativa fuerte.
Un valor cercano a ( 0 ) indica que no hay correlación.
Un valor cercano a ( +1 ) indica una correlación positiva fuerte.




Hicimos un cálculo estadístico del Coeficiente de Correlación (r) de los valores de las variables "a" y "b" respecto a "c" y estos fueron los resultados:

>Relación entre las variables "a" y "c":

r = 0.83744519763955

>Relación entre las variables "b" y "c":

r = 0.909081794922382




DIAGRAMA DE DISPERSION


Es un tipo de gráfico estadístico que se utiliza para visualizar múltiples observaciones de una variable frente a otra. Cada observación se muestra como una coordenada en el plano cartesiano.

Los gráficos de dispersión se emplean para ver si existe alguna relación entre dos variables. Si existe una relación, puede usarse para hacer predicciones.



Pusimos entonces a prueba el prompt utilizando este diagrama con el fin de determinar el nivel de correlación de los valores de las variables "a" y "b" respecto a "c":



>Relación entre las variables "a" y "c":

c = 1.7*a+1.666666666666666

R^2 = 0.701314459049545

>Relación entre las variables "b" y "c":

c = 1.4067796610169492*b+2.898305084745762

R^2 = 0.8264297098592999


Las variables presentes en cada muestra, "a" y "b", tienen una correlación directa respecto a "c". De acuerdo a los resultados, el diagrama muestra un patrón lineal en ambas variables, con un ángulo de pendiente cercano a 45°, lo que indica una correlación lineal positiva fuerte.

El valor de R^2 es más alto en la relación entre "b" y "c" (0.826) que en la relación entre "a" y "c" (0.701), lo que sugiere que la relación entre "b" y "c" es más fuerte y explica una mayor proporción de la variabilidad en "c". La elevación del cuadrado de la regresión (R^2) en ambos casos es alta, lo que significa que una gran proporción de la variación de "c" puede ser explicada por la variación de "a" y "b".


El Modelo de Lenguaje podrá predecir la respuesta utilizando la ecuación de la recta que representa la relación entre las variables "a" y "c":

c = (1,7) * (a) + 1,666666666666666

c = (1,7) * (9) + 1,666666666666666

c = 15,333333333333334 + 1,666666666666666

c = 17

    
a + b = c

5 + 8 = 13
7 + 2 = 9
1 + 0 = 1
3 + 4 = 7
5 + 9 = 14
9 + 8 = 17

La ecuación de la relación entre "a" y "c" y la ecuación de la relación entre "b" y "c" pueden ser utilizadas para predecir el valor de una variable en función de los valores de las otras dos variables.

Es importante destacar que estas relaciones no son completamente lineales, ya que el coeficiente de determinación no es igual a 1. Esto sugiere que hay otros factores que influyen en la relación entre las variables. Sin embargo, dado que los coeficientes de determinación son significativos, podemos afirmar que existe una correlación lineal positiva entre las variables "a" y "c", así como entre las variables "b" y "c".




RELACIÓN DE CORRESPONDENCIA

Por inferencia podemos afirmar que existe una relación lógica directa entre las muestras proporcionadas en el prompt. Esta relación se basa en la evidencia de que las primeras cinco muestras satisfacen la relación R.

R = { (1,6); (2,6); (3,6); (4,6); (5,6) }

Se establece una asociación entre dos conjuntos, en este caso, las muestras {1, 2, 3, 4, 5} y {6}. La relación se establece a través de una función que asigna cada elemento de un conjunto a un único elemento del otro conjunto. En este caso, la función es...

f(x) = 6 - x

...que asigna a cada elemento x del conjunto {1, 2, 3, 4, 5} el elemento 6 - x del conjunto {6}.


MARCO DE REFERENCIA: El prompt presenta 6 muestras de operaciones de suma. Las primeras 5 se utilizan para establecer un patrón de operaciones. Cada una de las operaciones anteriores tienen el mismo formato: suma dos números enteros separados por un signo de suma, y los resultados se presentan en un orden específico. La Muestra 6 sigue el mismo formato que las muestras anteriores.

PATRÓN LÓGICO: se establece un patrón el cual representa la operación que debe ser resuelta para que el prompt se complete. La naturaleza secuencial de las muestras tiene el potencial para que surjan patrones y relaciones al analizarlas.

PREDICCIÓN: La sexta muestra no es un evento aislado, sino más bien parte de una secuencia mayor. Dado el patrón establecido en las operaciones anteriores, es razonable que el modelo pueda predecir que la Muestra 6 debería ser la suma de 9 y 8, siguiendo la misma lógica de las operaciones anteriores. Esta predicción se basa en el hecho de que las primeras cinco muestras satisfacen la relación R. Si la relación R es válida, entonces la muestra 6 también debe satisfacer la relación R. La Muestra 6 se obtiene de manera determinista a partir del patrón establecido.

RELACIÓN R: cada muestra está relacionada con la Muestra 6, tienen el mismo tipo de operación y el mismo número de operandos. Se puede expresar matemáticamente de la siguiente manera:

R = { (1,1); (3,7); (5,13); (7,9); (5,14); (9,x) }

Donde x es el resultado de la suma de 9 y 8.




REGLA DE CORRESPONDENCIA


Una correspondencia es una relación entre uno o más elementos de un esquema y uno o más elementos de otro esquema.

El análisis de correspondencias es una técnica estadística que se utiliza para analizar, desde un punto de vista gráfico, las relaciones de dependencia entre dos o más variables categóricas.

Este análisis revela las relaciones relativas entre y dentro de dos grupos de variables, basándose en los datos dados en una tabla de contingencia.

La regla de correspondencia permite vincular cada elemento del Dominio (el conjunto A) a un elemento del Codominio (el conjunto B). Una relación es un nexo, a cada elemento del primer grupo le toca al menos un elemento del segundo conjunto.


Antes de continuar, citamos algunos ejemplos de correspondencia:


MAYOR QUE
    
    
    R = { (4,2); (4,1); (4,3); (4,1);   
(6,2); (6,1); (6,3); (6,1); (6,5);
(2,1); (2,1);
(3,2); (3,1); (3,1);
(5,2); (5,1); (5,3); (5,1) }
- 2 =
    
    
    R = { (42,40); (38,36); 
      (34,32); (30,28) }



RELACIÓN
    
    
    R = { (ZAPATOS, BALÓN);
       (MARTILLO, CLAVO);
       (BROCHA, PINTURA);
       (LAPIZ, CUADERNO);
       (BORRADOR, CUADERNO); }



RELACIÓN DE CORRESPONDENCIA EN EL PROMPT


    (A): Dominio = { 1,2,3,4,5,7,8,9 }
  

El Dominio está formado por los números enteros que se utilizan como entrada o variable independiente. Con ellos se realizan las operaciones de suma en el prompt.


    (B): Codominio = { 1, 7, 9, 13, 14 }
  

El Codominio es el conjunto de números que son posibles resultados de las operaciones. Se obtienen de las operaciones presentadas en el prompt. La variable dependiente en este contexto es el resultado de cada operación.


    Rango = { 1, 7, 9, 13, 14 }
  

El Rango es el conjunto de todos los valores posibles de la variable dependiente (osea, los resultados de las operaciones). En este caso, el Rango es igual al Codominio:

    Rango = Codominio = {1, 7, 9, 13, 14}
  

La relación de correspondencia se establece por la regla de correspondencia que vincula cada elemento del Dominio (el conjunto A) a un elemento del Codominio (el conjunto B). La regla establece que cada elemento del Dominio se corresponde con un elemento del Codominio de acuerdo con la operación de suma. En este caso, la respuesta a la Muestra 6 será la suma de los dos números enteros.

Se puede expresar matemáticamente de la siguiente manera:

    R = { (1,1); (3,7); (5,13); (7,9); (5,14); (9,x) }
  

Donde x es la respuesta a la Muestra 6.


Esta relación de correspondencia es válida porque:

  • Es consistente con las muestras proporcionadas.
  • Es completa, ya que cubre todos los elementos del Dominio.
  • Es funcional, ya que cada elemento del Dominio se corresponde con un elemento único del Codominio.
  • Cada operación tiene un resultado único y específico.

Además, la relación de correspondencia también se puede expresar en términos de la función que describe la operación matemática:

    f(a, b) = a + b
  

Donde a y b son los elementos del Dominio, y la función devuelve el resultado de la operación matemática correspondiente.


La idea es que todo esto forma un conjunto con reglas establecidas y claras que relacionan de forma única y determinista los números del dominio con sus correspondientes números del codominio. Mientras más claras sean las reglas, mejor es la función.

La clave aquí es que la relación de correspondencia permite que los números del dominio sean asignados a sus respectivos resultados en el codominio, de tal forma que no hay ambigüedad sobre cuál es el resultado correcto de cada número del dominio.




RELACION DE EQUIVALENCIA

"Sea A un Conjunto no vacío para el cuál se define una relación R"

La relación de equivalencia sirve para indicar que los elementos de un conjunto compartan las mismas características o propiedades con otros elementos del mismo conjunto. Su característica principal es que abstraen el concepto de igualdad. Esto ayuda a clasificar los elementos de una relación que esta sujeto a ciertas propiedades especificas:


Reflexividad: Todo número de A es equivalente a sí mismo.

    a + a = (a + a)                                                               Para toda a Є A, aRa
  

Simetría: Si dos números son equivalentes, entonces lo son en ambos sentidos.

    a + b = (a + b) = (b + a) = b + a                                        Si aRb, entonces bRa
  

Transitividad: Si dos números son equivalentes a un tercero, entonces también son equivalentes entre sí.

    a + b = (a + b) = (c + c) = c + c = (b + a) = b + a                Si aRb y bRc, entonces aRc
  




EJEMPLO: 1

A = { w, x, y, z }

R = { (w,w), (w,y), (x,x), (y,w), (y,y), (z,z) }

REFLEXIVIDAD SIMETRÍA TRANSITIVIDAD




EJEMPLO: 2

A = { 1, 2, 3, 4 }

R = { (1,1), (1,4), (2,2), (2,3), (3,2), (3,3), (4,1), (4,4)
         (1,2), (1,3), (3,1), (3,4) }

[EJEMPLO]:

    

1 + 0 = 1
1 + 3 = 4
4 - 3 = 1
4 + 0 = 4
2 + 0 = 2
2 + 1 = 3
3 - 1 = 2
3 + 0 = 3

REFLEXIVIDAD SIMETRÍA TRANSITIVIDAD




EJEMPLO:

Ahora analicemos nuestro prompt:

A = { 1, 2, 3, 4, 5, 7, 8, 9, 13, 14 }

R = { (1,1), (3,7), (5,13), (7,9), (5,14), (9,x),
          (2,9), (4,7), (8,x), (8,13), (9,14) }

[PROMPT]:

    

5 + 8 = 13
7 + 2 = 9
1 + 0 = 1
3 + 4 = 7
5 + 9 = 14
9 + 8 =

REFLEXIVIDAD SIMETRÍA TRANSITIVIDAD

Podemos concluir que no existe una relación de equivalencia entre las muestras proporcionadas en el prompt.










Comentarios