Exemplos de diagramas de dispersão

Exemplos de diagramas de dispersão
Garantia de qualidade

Exemplos de diagramas de dispersão

O que é o diagrama de dispersão e porque é que é utilizado?

A Diagrama de dispersão é um apresentação pictórica da relação entre duas variáveis.
Um diagrama de dispersão pode ser utilizado para descobrir a correlação entre as variáveis.
Por exemplo, pelo diagrama de dispersão podemos descobrir que a altura e o peso de uma pessoa têm alguma relação uma com a outra.

A relação de dispersão é definida como:

onde, X representa a variável independente (altura ou peso), e Y representa a variável dependente (altura ou peso). O coeficiente de correlação entre duas variáveis é por vezes também chamada de r-valor. Pode ser definida como a proporção de pares em que ambas as variáveis estão na mesma direcção (números positivos) ou ambas estão em direcções opostas (números negativos).

Embora Os diagramas de dispersão não são desenhados com todos os conjuntos de dados, existem alguns conjuntos de dados onde devem ser utilizados diagramas de dispersão.

Exemplo:

- Relação entre variáveis na mesma direcção.
por exemplo, quando a altura e o peso aumentam em conjunto, ou quando a dívida e o rendimento aumentam em conjunto. [Ver diagrama abaixo].

Diagrama de dispersão
Diagrama de dispersão

- Relação entre variáveis em direcções opostas, por exemplo, quando a altura aumenta e o peso diminui.
[Ver diagrama abaixo].

Diagrama de dispersão
Diagrama de dispersão

Porque é que funciona para estes dados?

A altura é independente do peso, pelo que obtemos uma correlação positiva Coeficiente (r = +0,177). Da mesma forma, obtemos um coeficiente de correlação negativa (r = -0. 069) para o rendimento variável que é significativamente diferente de zero.

Exemplo: Se houver interesses num determinado stock e o preço desse stock aumentar, o número de pessoas que compram esse stock também aumentará. Isto significa que podemos usar esta influência para prever o preço futuro das acções. A correlação entre as duas variáveis é de +0,596, pelo que indica uma correlação positiva ou elevada entre as variáveis em questão.

Para saber o preço de uma acção no presente, é necessário saber quanto subiu no passado. Para medir este aumento, utilizamos um ponto de dados chamado valor actual. Mas para prever o aumento futuro (utilizaremos este conjunto de dados para testar o nosso modelo), precisamos de resolver para valores passados para esta variável.

Exemplo: A XYZ Company vende muitos produtos diferentes. Vende mais produtos por aumentos de preços do que por aumentos de qualidade (as vendas aumentaram em mais de $5 milhões após cada aumento de qualidade). Além disso, as vendas diminuem quando o preço do produto é reduzido em mais de $5 milhões.

Esta situação é utilizada para ilustrar uma tendência. Ao prever o preço das acções no futuro, deve ter em conta estas tendências, tais como quantas acções serão vendidas por um aumento ou diminuição do preço. Estas tendências não são fáceis de analisar e mudam com o tempo (por exemplo, quando os preços das acções caem durante longos períodos de tempo, alguns investidores podem perder o interesse em acções).

O que ferramenta a utilizar para fazer um diagrama de dispersão?

Nada de especial necessário para a criação do diagrama de dispersão, tudo o que precisa é de uma lista de pares de valores para cada variável.
Para descobrir a relação entre duas variáveis, é necessário criar um diagrama de dispersão, onde ambas as variáveis são representadas pelos seus valores naturais. A relação entre as duas variáveis pode ser expressa da seguinte forma:

Onde X e Y são as variáveis (ou valores ??dessas variáveis) e a e b são constantes ou coeficientes. O coeficiente pode ser 0 se ambas as variáveis forem independentes uma da outra.

Para obter a relação de dispersão entre as duas variáveis, é necessário recolher todos os pares de valores de X e Y, que formam um diagrama de dispersão completo (onde se colocam dois pontos em cada variável). Em seguida, para cada par de valores, calcular o coeficiente de correlação:

Onde é definido como um rácio de a/b. O valor \i(r = 0,0 r = 0,0 r = 1,0), ou quando nenhuma das variáveis está ligada a outra e a sua relação é "neutra" (o que não significa que não estejam completamente relacionadas).

Conclusão:

O método do diagrama de dispersão é uma ferramenta útil para a análise das relações entre duas variáveis. É utilizado para visualizar a correlação entre duas variáveis e para aprender como estão relacionadas. Para criar um diagrama de dispersão, é necessário obter pares de valores das duas variáveis e calcular o coeficiente de correlação entre elas. O valor de \\i1 dá o grau de correlação entre duas variáveis e diz-nos que tipo de relação existe.

* CONSIDERAÇÕES DO DIAGRAMA DE DISPERSÃO

  • O coeficiente de correlação de zero não significa que não haja ligação entre as duas variáveis, mas apenas que a força da relação entre elas é muito fraca. em geral, a direcção em que há uma correlação mais elevada entre duas variáveis é superior a 0,5 (há alguns casos em que haverá correlação zero com uma tendência direccional).
  • Quanto mais correlacionadas forem estas duas variáveis, mais confiança podemos ganhar com a sua utilização para prever valores futuros ?? de ambas as variáveis. Em conclusão, é preciso ver se ambas as tendências sobem e descem juntas em quantidades significativas.
  • O termo significativo no contexto da análise estatística significa que a correlação é superior a 0,5 e inferior a 1,0.
  • Em situações em que a correlação entre duas variáveis é elevada, o o coeficiente de correlação (r) pode ser próximo de 1mas isso não significa que esta situação existirá indefinidamente no futuro.
  • Quando se prevê as variáveis X e Y (= preço), tanto as mudanças positivas como as negativas (por outras palavras, assumimos que haverá mudanças em X e Y), mas estes valores ??? irão variar ao longo do tempo.
  • No caso de cálculos de correlação múltipla, pode olhar para o diagrama de dispersão (o gráfico de dados) para ver através de todas as variáveis.
  • Se o diagrama de dispersão não mostrar qualquer relação entre as variáveis, considerar se os dados podem ser estratificados.
  • Quando a correlação é elevada (mais próxima de 1), pode-se dizer que ambas as variáveis estão fortemente relacionadas e que a sua relação é quase linear no diagrama de dispersão.
  • Nem todos os conjuntos de dados se prestam à visualização de diagramas de duas variáveis.
    As tendências que não estão relacionadas ou dados que não mostram tendências fortes (tais como com distribuição normal) não se prestam à visualização através de um diagrama de dispersão.
Partilhar nas redes sociais

Deixe aqui o seu pensamento

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

18 − dois =