C.6 Prueba de Hipótesis: Esta sección explica cómo utilizar la información de una muestra para tomar decisiones sobre una afirmación (hipótesis) respecto a un parámetro poblacional.
Hipótesis Nula (H0): La afirmación inicial que se va a probar. Por ejemplo, un programa de capacitación no tiene efecto en la productividad de los trabajadores.
Hipótesis Alternativa (H1): La afirmación que se acepta si se rechaza la hipótesis nula. Por ejemplo, el programa de capacitación sí aumenta la productividad.
Error tipo I: Rechazar la hipótesis nula cuando es verdadera.
Error tipo II: No rechazar la hipótesis nula cuando es falsa.
Estadístico de Prueba: Un estadístico utilizado para determinar si hay suficiente evidencia para rechazar la hipótesis nula. La forma del estadístico de prueba depende de la hipótesis y de las distribuciones de los estimadores.
Valor p: La probabilidad de obtener un resultado tan extremo como el observado (o más extremo) si la hipótesis nula fuera cierta. Un valor p pequeño (por debajo de un nivel de significancia predefinido, como 0.05) lleva a rechazar la hipótesis nula.
Si el valor p es menor que el nivel de significancia, se rechaza H0.
Si el valor p es mayor que el nivel de significancia, no se rechaza H0.
Prueba de una cola: Se usa cuando la hipótesis alternativa especifica una dirección del efecto (mayor que o menor que).
Prueba de dos colas: Se usa cuando la hipótesis alternativa no especifica una dirección del efecto.
Ejemplo C.2 [Efecto de los subsidios para la capacitación laboral en la productividad de los trabajadores]: Este ejemplo ilustra la prueba de hipótesis, enfocándose en los efectos de los subsidios de capacitación laboral en la productividad de los trabajadores. Se compara la tasa de desperdicio industrial antes y después del programa para determinar si hay una diferencia estadísticamente significativa.
Nivel de significancia: Un umbral para el valor p (típicamente 0.05 o 0.01) utilizado para decidir si se rechaza la hipótesis nula.
Región de rechazo: El conjunto de valores del estadístico de prueba que lleva al rechazo de H0.
C.7 Comentarios sobre notación: Esta sección introduce una convención de notación.
Si 𝛽 es un parámetro poblacional, la notación ̂𝛽 ("beta con sombrero") se usará para denotar tanto un estimador como una estimación de 𝛽.
Conceptos Claves y Términos Adicionales
Muestras aleatorias: Una muestra aleatoria de una población es una muestra en la que cada miembro de la población tiene la misma probabilidad de ser incluido.
Estimadores: Una regla para combinar datos muestrales y estimar un parámetro poblacional.
Estimaciones: Un valor particular del estimador para una muestra dada.
Parámetros: Características numéricas de una población.
Propiedades de muestras finitas: Propiedades de los estimadores que se mantienen para cualquier tamaño de muestra, ya sea pequeño o grande.
Propiedades asintóticas: Propiedades de los estimadores que se refieren al comportamiento del estimador cuando el tamaño de la muestra crece sin límite.
Insesgado: Un estimador es insesgado si su valor esperado es igual al verdadero parámetro poblacional.
Consistente: Un estimador es consistente si converge en probabilidad al verdadero parámetro poblacional a medida que aumenta el tamaño de la muestra.
Normalidad asintótica: La distribución muestral de un estimador debidamente normalizado converge a la distribución normal estándar.
Máxima verosimilitud: Un método de estimación que elige los parámetros que maximizan la verosimilitud de observar los datos muestrales.
Mínimos cuadrados: Un método de estimación que elige los parámetros para minimizar la suma de los residuos al cuadrado.
C.8 Un Ejemplo Sencillo
Se incluye un ejercicio para considerar si el promedio de bateo de .400 de un jugador de béisbol es justificable con base en su desempeño. El ejercicio sugiere que, aunque una muestra pueda desviarse del promedio esperado de un parámetro, esto no necesariamente implica que se deba rechazar la suposición de que el jugador es capaz de dicho desempeño. Esto sirve para ilustrar el proceso de cómo pensar sobre las variaciones muestrales y las pruebas de hipótesis.