+ - 0:00:00
Notes for current slide
Notes for next slide

Estadística IV

Kevin Carrasco & Daniela Olivares

María Fernanda Nuñez

Sociología - UAH

2do Sem 2024

estadisticaiv.netlify.com


Sesión 5: Correlación y regresión

1 / 30

Sesión 5


Correlación

Regresión



2 / 30

Sesión 5


Correlación

Regresión



3 / 30


¿Cómo puedo saber si una variable se encuentra asociada a otra variable?

4 / 30


¿Cómo puedo saber si una variable se encuentra asociada a otra variable?

Si ambas varían de manera similar (covarían)

4 / 30

Asociación: covarianza / correlación

¿Se relaciona la variación de una variable, con la variación de otra variable?

5 / 30

Correlación

  • Medida de co-variación lineal estandarizada
6 / 30

Correlación

  • Medida de co-variación lineal estandarizada



¿En qué rango varía una correlación?

6 / 30

Correlación

  • Medida de co-variación lineal estandarizada



¿En qué rango varía una correlación?

  • Varía entre -1 y +1
6 / 30

Correlación

  • Da cuenta de:

    • Intesidad: mientras más cercana a |1|, más intensa
    • Sentido: positiva o negativa
7 / 30

Correlación

  • Da cuenta de:

    • Intesidad: mientras más cercana a |1|, más intensa
    • Sentido: positiva o negativa
  • Gráficamente se expresa en nubes de puntos

7 / 30

8 / 30





Adivina la correlación - http://guessthecorrelation.com/

9 / 30
  • Pero ojo, correlación no implica causalidad

10 / 30

Sesión 5


Correlación

Regresión



11 / 30

¿Qué es la regresión lineal?

12 / 30

¿Qué es la regresión lineal?

  • Es un modelo estadístico
12 / 30

¿Qué es la regresión lineal?

  • Es un modelo estadístico
  • Se usa para:

    • Conocer: La relación de una variable dependiente de acuerdo a una/otras independiente(s)
    • Predecir: Estimar el valor de una variable dependiente de acuerdo al valor de otras
    • Inferir: si estas relaciones son estadísticamente significativas
12 / 30

¿Qué es la regresión lineal?

  • Dos tipos de regresión:
    • Regresión lineal simple (una variable independiente)
    • Regresión lineal múltimple (más de una variable independiente)
13 / 30

¿Qué es la regresión lineal

Terminología:

14 / 30

Ejemplo

## Educacion Ingreso
## 1 1 250
## 2 2 200
## 3 3 250
## 4 4 300
## 5 5 400
## 6 6 350
## 7 7 400
## 8 8 350
15 / 30

Ejemplo

16 / 30

Ejemplo

17 / 30

La recta de regresión

$$\widehat{Y}=b_{0} +b_{1}X$$

Donde

  • \(\widehat{Y}\) es el valor estimado de \(Y\)

  • \(b_{0}\) es el intercepto de la recta (el valor de Y cuando X es 0)

  • \(b_{1}\) es el coeficiente de regresión, que nos dice cuánto aumenta Y por cada punto que aumenta X

18 / 30

Estimación de los coeficientes de la ecuación:

$$b_{1}=\frac{Cov(XY)}{VarX}$$

$$b_{1}=\frac{\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {n-1}}{\frac{\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})} {n-1}}$$

Y simplificando

$$b_{1}=\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})}$$

19 / 30

En R es más simple:

reg1<-lm(Ingreso~Educacion, data=data)

reg1

##
## Call:
## lm(formula = Ingreso ~ Educacion, data = data)
##
## Coefficients:
## (Intercept) Educacion
## 200 25
20 / 30

Estimación de los coeficientes de la ecuación:

$$\bar{Y}=b_{0}+b_{1}\bar{X}$$ Reemplazando:

$$\bar{Y}=b_{0}+25\bar{X}$$

Despejando el valor de \(b_{0}\)

$$b_{0}=200-0\bar{X}$$

21 / 30

Ejemplo

Por cada unidad que aumenta educación, ingreso aumenta en 25 unidades

22 / 30

Varianza explicada

  • ¿Qué porcentaje de la varianza de Y logramos explicar con X?
23 / 30

Varianza explicada

  • ¿Qué porcentaje de la varianza de Y logramos explicar con X?
  • R2 = Porcentaje de la variación de Y puede ser asociado a la variación de X
23 / 30

Ejemplo

El ajuste del modelo a los datos se relaciona con la proporción de residuos generados por el modelo respecto de la varianza total de Y (R2)

24 / 30

Inferencia estadística

  • ¿Cómo sabemos si \(b_{1}\) es estadísticamente significativo?
25 / 30

Inferencia estadística

  • ¿Cómo sabemos si \(b_{1}\) es estadísticamente significativo?

  • ¿Nuestros datos se pueden extrapolar a la población?

25 / 30

Inferencia estadística

  • Según criterios muestrales:

    • Distribución normal
    • Desviación estándar
  • Error estándar

26 / 30
  Model 1
(Intercept) 200.00**
  (35.57)
Educacion 25.00*
  (7.04)
R2 0.68
Adj. R2 0.62
Num. obs. 8
***p < 0.001; **p < 0.01; *p < 0.05
27 / 30
  Model 1
(Intercept) 106.12*
  (33.92)
Educacion 7.07
  (6.57)
edad 5.48*
  (1.56)
R2 0.91
Adj. R2 0.87
Num. obs. 8
***p < 0.001; **p < 0.01; *p < 0.05
28 / 30

Parcialización

29 / 30

Estadística IV

Kevin Carrasco & Daniela Olivares

María Fernanda Nuñez

Sociología - UAH

2do Sem 2024

estadisticaiv.netlify.com


Sesión 5: Correlación y regresión

30 / 30

Sesión 5


Correlación

Regresión



2 / 30
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow