Estadística Descriptiva: Organización de Datos y Medidas de Tendencia

Tabla de Frecuencias

La tabla de frecuencias es una herramienta fundamental en la estadística descriptiva que permite organizar y resumir un conjunto de datos. Su propósito principal es facilitar la visualización de la distribución de los datos, ya sea que se trate de variables cualitativas o cuantitativas.

En una tabla de frecuencias típica, se incluyen las siguientes columnas:

  • Frecuencia Absoluta (fif_i): El número de veces que se repite un valor específico en el conjunto de datos.
  • Frecuencia Acumulada (FiF_i): La suma de las frecuencias absolutas desde el primer dato hasta el dato actual.
  • Frecuencia Relativa (hih_i): Representa la proporción de los datos que pertenecen a una categoría, calculada como: hi=finh_i = \frac{f_i}{n} donde nn es el tamaño total de la muestra.
  • Frecuencia Relativa Acumulada (HiH_i): La acumulación de las frecuencias relativas.

Medidas de Tendencia Central

El documento detalla las métricas clave para identificar el centro de una distribución de datos. Estas medidas proporcionan un valor típico o central.

  • Media (referida en el texto como mada ritmet, probablemente en alusión a la media aritmética): Es el promedio de todos los valores recogidos. Se obtiene mediante la sumatoria de todos los elementos dividida por el total de observaciones. Su formulación matemática es: xˉ=i=1nxin\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}

  • Mediana: Es el valor que ocupa la posición central de un conjunto de datos cuando estos están ordenados de forma ascendente o descendente. Si el número de datos (nn) es impar, la mediana es el valor central. Si nn es par, la mediana es el promedio de los dos valores centrales.

  • Moda: Aunque se menciona indirectamente a través de la variación fonética del término, la moda es el valor que aparece con mayor frecuencia en una distribución. Una distribución puede ser unimodal, bimodal o multimodal.

Gráfica Poligonal

La grafica poligonal, también conocida como polígono de frecuencias, es una representación visual que permite observar la tendencia de los datos a lo largo de diferentes categorías o intervalos.

  • Construcción: Se construye a partir de un histograma. Para ello, se marcan los puntos medios de la parte superior de cada barra (conocidos como marcas de clase) y se unen mediante segmentos de línea recta.
  • Utilidad: Es particularmente útil cuando se desea comparar dos o más conjuntos de datos en un mismo gráfico, ya que facilita la visualización de las formas de las distribuciones.

Datós Específicos y Rangos de la Muestra

El texto menciona valores y términos específicos que definen la estructura del conjunto de datos analizado:

  • 78: Este número representa un dato específico extraído de la muestra o posiblemente el tamaño de la muestra (n=78n = 78).
  • nimaxe et natal: Este término se mantiene según la transcripción original. En el análisis estadístico formal, esto suele corresponder a los valores extremos de la distribución, es decir, el valor mínimo y el valor máximo. El rango total de los datos se determinaría como: Rango=XmaxXmin\text{Rango} = X_{\max} - X_{\min}