Esta sección hace la transición de la estimación puntual e intervalar a la prueba de hipótesis.
Prueba de hipótesis se introduce como un aspecto crucial de la inferencia estadística, con detalles adicionales disponibles en el Apéndice A.
El texto señala que este es un libro introductorio, por lo que no es posible un análisis profundo de por qué se eligen niveles de significancia del 1, 5 o 10 %, ya que esto involucra la teoría de la decisión estadística, que es una disciplina en sí misma.
Sin embargo, se proporciona un breve resumen, señalando que para un tamaño de muestra dado, reducir un error Tipo I aumenta un error Tipo II y viceversa. En otras palabras, reducir la probabilidad de rechazar una hipótesis verdadera aumenta la probabilidad de aceptar una hipótesis falsa cuando el tamaño de la muestra se mantiene constante.
Por lo tanto, la elección de un nivel de significancia representa un compromiso.
La sección retoma el ejemplo del Capítulo 3 sobre los salarios por hora promedio (Y) y el nivel educativo (X), donde β̂2 = 0.7240 y se(β̂2) = 0.0700. Hay 13 observaciones en este caso con 11 grados de libertad (df).
La discusión involucra la prueba de hipótesis del coeficiente de pendiente β2, con una hipótesis nula (H0) de que β2 = 0 frente a una hipótesis alternativa (H1) de que β2 ≠ 0.
Estadístico de prueba: El estadístico de prueba apropiado es un estadístico t, dado por la fórmula (5.3.2), que el texto cita como:
t = (β̂2 - β2)/se(β̂2)
Bajo H0, este estadístico sigue una distribución t con (n-2) df.
El estadístico de prueba se calcula para el ejemplo de salario/educación, resultando en un valor t de 10.3428. Dada la distribución t, la probabilidad de obtener un valor t de 10.3428 o mayor es extremadamente pequeña.
La prueba de hipótesis plantea entonces si el valor t de la muestra cae en la región de rechazo, que es el área poco probable bajo la hipótesis nula.
Prueba de dos colas: Se rechaza la hipótesis nula si el valor t calculado excede el valor crítico de t tomado de una tabla t para el nivel de significancia elegido.
Valor p: Se introduce el valor p como la probabilidad exacta de obtener un valor t tan alto como el calculado, asumiendo que H0 es verdadera. También se conoce como el valor de probabilidad.
El texto explica que si el valor p es suficientemente pequeño (por ejemplo, menor al 1 %, 5 % o 10 %), entonces se rechaza la hipótesis nula.
Se menciona que generalmente se reportará el valor p de un estadístico de prueba dado.
El lector puede establecer su nivel α y rechazar la hipótesis nula si el valor p es menor que α.
Esta sección introduce la distinción entre significación estadística y significación práctica.
El texto utiliza un ejemplo de la relación entre el Gasto en Consumo Personal (PCE) y el Producto Interno Bruto (PIB) para ilustrar esta diferencia.
La regresión de PCE sobre PIB del ejemplo del Capítulo 3 da como resultado una relación altamente significativa desde el punto de vista estadístico, porque el valor p para el coeficiente de pendiente es cercano a cero.
Es posible obtener resultados estadísticamente significativos sin que tengan un valor práctico relevante.
Los autores señalan que depende del usuario determinar el valor práctico o sustantivo de los resultados.
Se menciona que algunos investigadores prefieren los intervalos de confianza en lugar de las pruebas de significancia porque brindan más información.
Se alienta el uso de intervalos de confianza sobre pruebas de significancia como un enfoque útil.