Scatter Diagram examples

Ejemplos de diagramas de dispersión
Garantía de calidad

Ejemplos de diagramas de dispersión

¿Qué es el diagrama de dispersión y por qué se utiliza?

A Diagrama de dispersión es un presentación pictórica de la relación entre dos variables.
Se puede utilizar un diagrama de dispersión para averiguar la correlación entre las variables.
Por ejemplo, a partir del diagrama de dispersión podemos averiguar que la altura y el peso de una persona guardan cierta relación entre sí.

La relación de dispersión se define como

donde, \( X\) representa la variable independiente (altura o peso), y \( Y\) representa la variable dependiente (altura o peso). La dirección coeficiente de correlación entre dos variables también se denomina a veces Valor r. Puede definirse como la proporción de pares en los que ambas variables están en la misma dirección (números positivos) o ambas están en direcciones opuestas (números negativos).

Aunque Los diagramas de dispersión no se dibujan con todos los conjuntos de datos, hay algunos conjuntos de datos en los que deben utilizarse diagramas de dispersión.

Ejemplo:

? Relación entre variables en la misma dirección.
por ejemplo, cuando la altura y el peso aumentan juntos, o cuando la deuda y los ingresos aumentan juntos. [Véase el diagrama siguiente.]

Diagrama de dispersión
Diagrama de dispersión

? Relación entre variables en direcciones opuestas, por ejemplo, cuando aumenta la estatura y disminuye el peso.
[Véase el diagrama siguiente]

Diagrama de dispersión
Diagrama de dispersión

¿Por qué funciona con estos datos?

La altura es independiente del peso, por lo que obtenemos un coeficiente de correlación positivo (r = +0,177). Del mismo modo, obtenemos un coeficiente de correlación negativo (r = -0. 069) para la variable ingresos que es significativamente diferente de cero.

Ejemplo: Si hay intereses en una determinada acción y el precio de esa acción sube, el número de personas que compran esa acción también aumentará. Esto significa que podemos utilizar esta influencia para predecir el precio futuro de la acción. La correlación entre las dos variables es de +0,596, por lo que indica una correlación positiva o alta entre las variables en cuestión.

Para conocer el precio actual de una acción, hay que saber cuánto ha subido en el pasado. Para medir esta subida, utilizamos un dato llamado valor actual. Pero para predecir la subida futura (utilizaremos este conjunto de datos para probar nuestro modelo), tenemos que resolver los valores pasados de esta variable.

Ejemplo: La empresa XYZ vende muchos productos diferentes. Vende más productos por aumentos de precio que por aumentos de calidad (las ventas aumentan en más de $5 millones después de cada aumento de calidad). Además, las ventas disminuyen cuando el precio del producto se reduce en más de $5 millones.

Esta situación sirve para ilustrar una tendencia. Al predecir el precio de las acciones en el futuro, debe tener en cuenta estas tendencias, como cuántas acciones se venderán por un aumento o una disminución del precio. Estas tendencias no son fáciles de analizar y cambian con el tiempo (por ejemplo, cuando los precios de las acciones caen durante largos periodos de tiempo, algunos inversores pueden perder el interés por las acciones).

Qué herramienta para hacer un diagrama de dispersión?

No se necesita nada especial para la creación del diagrama de dispersión, todo lo que se necesita es una lista de pares de valores para cada variable.
Para averiguar la relación entre dos variables, debes crear un diagrama de dispersión, en el que ambas variables estén representadas por sus valores naturales. La relación entre dos variables puede expresarse del siguiente modo:

Donde \( X\) y \( Y\) son las variables (o valores ??de esas variables) y \(a\) y \(b\) son constantes o coeficientes. El coeficiente puede ser 0 si ambas variables son independientes entre sí.

Para obtener la relación de dispersión entre las dos variables, tienes que reunir todos los pares de valores de \(X\) y \(Y\) que formen un diagrama de dispersión completo (en el que coloques dos puntos en cada variable). A continuación, para cada par de valores, calcula el coeficiente de correlación:

Donde \(r\) se define como un cociente de \(a/b\). El valor \(r = 0,0 \ll r\ll 1,0\), o cuando ninguna de las variables está conectada con otra y su relación es "neutra" (lo que no significa que no estén relacionadas en absoluto).

Conclusión:

El método del diagrama de dispersión es una herramienta útil para el análisis de las relaciones entre dos variables. Se utiliza para visualizar la correlación entre dos variables y saber cómo están relacionadas. Para crear un diagrama de dispersión, es necesario obtener pares de valores de las dos variables y calcular el coeficiente de correlación entre ellos. El valor de \(r\) da el grado de correlación entre dos variables y nos indica qué tipo de relación existe.

* CONSIDERACIONES SOBRE EL DIAGRAMA DE DISPERSIÓN

  • Un coeficiente de correlación cero no significa que no exista conexión entre las dos variables, sino sólo que la fuerza de la relación entre ellas es muy débil. en general, la dirección en la que existe una mayor correlación entre dos variables es superior a 0,5 (hay algunos casos en los que habrá una correlación cero con una tendencia direccional).
  • Cuanto más correlacionadas estén estas dos variables, más confianza podremos obtener al utilizarlas para predecir valores futuros... de ambas variables. En conclusión, hay que ver si ambas tendencias suben y bajan juntas en cantidades significativas.
  • El término significativo en el contexto del análisis estadístico significa que la correlación es superior a 0,5 e inferior a 1,0.
  • En situaciones en las que la correlación entre dos variables es altaEl el coeficiente de correlación (r) puede ser cercano a 1pero no significa que esta situación se mantenga indefinidamente en el futuro.
  • Cuando se predicen las variables X e Y (= precio), tanto los cambios positivos como los negativos (en otras palabras, suponemos que habrá cambios en \(X\) y \(Y\)), pero estos valores ?? variarán con el tiempo.
  • En el caso de los cálculos de correlaciones múltiples, puede observar el diagrama de dispersión (el gráfico de los datos) para ver todas las variables.
  • Si el diagrama de dispersión no muestra ninguna relación entre las variables, considere si los datos podrían estar estratificados.
  • Cuando la correlación es alta (más cercana a 1), se puede decir que ambas variables están fuertemente relacionadas y que su relación es casi lineal en el diagrama de dispersión.
  • No todos los conjuntos de datos se prestan a la visualización de diagramas de dos variables.
    Las tendencias que no están relacionadas o los datos que no muestran tendencias fuertes (como ocurre con la distribución normal) no se prestan a la visualización mediante un diagrama de dispersión.
Compartir en las redes sociales

Deje aquí su opinión

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

5 × tres =