Estadistica Fecha Sin saber
Media Poblacional y Media Muestral
Definición de la media poblacional:
La media poblacional se representa como (mu).
Cuestionamiento sobre si se debe usar (media muestral) o . La incógnita se resuelve al establecer que la elección correcta se basa en la representación más cercana a los parámetros poblacionales.
Relación entre tamaño de muestra y precisión:
Cuanto más grande sea la muestra, más cerca estará el estadístico (media) del parámetro real poblacional.
Cálculo de la mediana:
Primer paso es ordenar los datos de forma ascendente.
Ejemplo de cálculo: si la cantidad total de datos es , la posición se calcula como .
En un caso específico, si , la posición es , indicando que se seleccionan los datos en las posiciones 3 y 4 cuando hay un número impar de datos.
Tipos de distribuciones:
Unimodal: Una única “montañita” (modo).
Bimodal: Dos “montañitas” (dos modas).
Multimodal: Tres o más montañitas.
Importancia del Histograma
La barra más alta en un histograma representa la mayor frecuencia, identificando así la moda.
Si hay una única barra alta, es unimodal; si hay dos, es bimodal; y si hay más, es multimodal.
Relación entre la media, mediana y moda
Dependiendo de cómo se relacionen estas tres medidas, se puede inferir sobre la distribución de los datos:
Sesgo a la izquierda: Caso donde la media es menor que la mediana.
Se discieren los grados de diferencia necesarios para definir un sesgo.
Cálculo del Rango
Definición del rango:
El rango es la diferencia entre el valor más grande y el valor más pequeño.
Indica la dispersión: un rango mayor implica mayor dispersión. Sin embargo, se considera un estadístico subjetivo.
Desviación y Medidas de Dispersión
Desviación estándar y varianza:
Buenas para medir la variabilidad entre los datos.
Definición: La desviación estándar mide qué tan alejados están los datos de la media, y se considera que los datos agrupados presentan poca variabilidad.
Medidas de dispersión:
Ejemplos incluyen:
Rango: Simple y directo, pero limitado en la información que brinda.
Varianza y desviación estándar: Se utilizan para ofrecer una representación más precisa de la dispersión y comparar diferentes distribuciones.
Cálculo de la Varianza
Varianza poblacional () vs Varianza muestral ():
Ambos tipos de varianza se calculan de forma similar:
Varianza poblacional se utiliza todos los datos de toda la población.
Varianza muestral se utiliza para una muestra específica de la población.
Fórmula:
para la población,
para la muestra.
La utilización de cuadrados se debe a que las desviaciones pueden ser negativas, y al elevarlas al cuadrado se garantiza que la sumatoria produzca valores positivos, evitando que se cancelen entre sí.
Ejemplo de Cálculo
Para calcular la media:
.
Desviación estándar y varianza:
Se examinan los pasos para encontrar la variabilidad utilizando la media y las desviaciones calculadas de cada dato respecto a esta media.
La varianza se presenta como una medida de los datos distanciados y es crucial para comprender la dispersión general del conjunto de datos.
Conclusiones y Reflexiones Finales
La media es importante para situar el "centro" de los datos.
Las desviaciones permiten observar la posición de cada dato con respecto a la media.
La interpretación adecuada de la varianza y la desviación estándar es clave para el análisis de la dispersión en estadística.