Estadística Descriptiva - Unidad 3: Medidas estadísticas

3.7(3)
studied byStudied by 23 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/86

flashcard set

Earn XP

Description and Tags

Conoce las medidas estadísticas que nos enseñan las diferentes características de las distribuciones de datos.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

87 Terms

1
New cards
Medidas estadísticas
Valores que definen las *características* de las variables cuantitativas.
2
New cards
Medidas estadísticas
Resumen la información de los datos, nos permiten analizar la dispersión y tendencia central del conjunto, nos otorgan valores representativos que permiten compararlos con otros conjuntos respecto a diferentes características y son de fácil interpretación.
3
New cards
Medidas de frecuencia
Son herramientas utilizadas para describir la distribución de los datos en un conjunto de observaciones, como lo es su incidencia o repetición.
4
New cards
Moda
Valor que ocurre con mayor frecuencia en un conjunto de datos. Es una medida de tendencia central que se utiliza para describir la forma de la distribución de los datos.
5
New cards
Unimodal
El conjunto de datos sólo tiene una moda.
6
New cards
Bidomal
El conjunto de datos tiene dos modas.
7
New cards
Multimodal
El conjunto de datos tiene más de dos modas.
8
New cards
Se toma el conjunto con mayor frecuencia absoluta y se procede a coger su límite inferior + (la frecuencia absoluta - la frecuencia absoluta anterior)/(frecuencia absoluta - frecuencia absoluta anterior)+ (frecuencia absoluta - frecuencia absoluta siguiente)
Se toma el conjunto con mayor frecuencia absoluta y se procede a coger su límite inferior + (la frecuencia absoluta - la frecuencia absoluta anterior)/(frecuencia absoluta - frecuencia absoluta anterior)+ (frecuencia absoluta - frecuencia absoluta siguiente)
Fórmula para la moda para datos agrupados en intervalos
9
New cards
Medidas de posición
Son indicadores estadísticos que permiten resumir los datos en uno solo, o dividir su distribución en intervalos del mismo tamaño. No nos proporcionan información confiable sobre la distribución y son sensibles a los valores extremos, sin embargo no dependen de la escala y son fáciles de interpretar.
10
New cards
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. Es una medida de tendencia central.
11
New cards
n/2
Cómo calcular la posición de la mediana
12
New cards
Cuartil
Divide la distribución en cuatro partes iguales.
13
New cards
3
Cuántos cuartiles hay?
14
New cards
Cuartil 1 (Q1)
Es mayor al 25% de los datos.
15
New cards
Cuartil 2(Q2)
Es mayor al 50% de los datos. También es conocido como la mediana y coincide con el quinto decil.
16
New cards
Cuartil 3 (Q3)
Es mayor al 75% de los datos.
17
New cards
Quintil
Es un cuantil que divide una distribución de datos ordenados en cinco partes iguales. Es menos frecuente que el cuartil
18
New cards
Decil
Son los nueve valores que dividen a un conjunto de datos ordenados en diez partes iguales.
19
New cards
Percentil
Son los valores que dividen a un conjunto de datos ordenados en cien partes iguales.
20
New cards
nK/t
Cómo calcular la posición de las medidas de posición?
21
New cards
Ubicación de un percentil
(n + 1) (P/100)
22
New cards
Cuantil que estemos calculando. Ej: decil = 10, cuartil = 4, etc.
Qué es T?
23
New cards
Cogemos el *límite superior* de esta frecuencia acumulada, y esa será nuestra mediana.
Qué pasa si al calcular la posición de la mediana encontramos el número en una de las frecuencias absolutas *acumuladas*?
24
New cards
Tomamos la frecuencia acumulada directamente psoterior a la posición de la mediana y luego: *Límite inferior + (n/2 - frecuencia acumulada anterior)/(frecuencia absoluta)*i*
Tomamos la frecuencia acumulada directamente psoterior a la posición de la mediana y luego: *Límite inferior + (n/2 - frecuencia acumulada anterior)/(frecuencia absoluta)*i*
Fórmula de la mediana para datos agrupados.
25
New cards
Límite superior - Límite inferior + 1
Cómo calcular i?
26
New cards
Cogemos el la frecuencia acumulada posterior a la posición del cuantil que estemos calculando, y luego: *Límite inferior + i(nk/t -frecuencia acumulada anterior)/frecuencia acumulada - frecuencia acumulada anterior)*
Fórmula para calcular los demás cuantiles
27
New cards
Medidas de representación
Son herramientas que se utilizan para resumir y describir un conjunto de datos.
28
New cards
Media aritmética
Es un valor central característico de un conjunto de datos estadísticos. Es uno de los principales indicadores que se utilizan para hacer un estudio estadístico de una muestra. Es una medida de tendencia central que se utiliza para describir un conjunto de datos.
29
New cards
term image
Símbolo de la media aritmética poblacional
30
New cards
term image
Símbolo de la media aritmética muestral
31
New cards
Media geométrica
Se le calcula la raíz, con coeficiente de n/N, al producto de un conjunto de números *estrictamente positivos*. Se utiliza comúnmente para calcular el promedio de datos que siguen una distribución logarítmica, como las tasas de crecimiento o los precios de las acciones.
32
New cards
term image
Fórmula de la media geométrica
33
New cards
Media armónica
Es igual al número de elementos de un grupo de cifras entre la suma de los inversos de cada una de estas cifras. Se utiliza comúnmente para calcular el promedio de datos relacionados con velocidades, tasas y ratios, como la velocidad promedio de un viaje en automóvil o la tasa de retorno promedio de una inversión. Es siempre menor que la media aritmética, a menos que todos los valores del conjunto de datos sean iguales.
34
New cards
term image
Fórmula de la media armónica
35
New cards
Medidas de variabilidad
Es una medida de la dispersión de los datos en una distribución, sea esta teórica o de una muestra. Miden la dispersión, desviación y oscilación.
36
New cards
Desviación media
Es la media aritmética de los valores absolutos de las desviaciones respecto a la media. Es una manera de describir la variación en un conjunto de datos. Nos ayuda a tener una idea de qué tan "extendidos" están los valores en un conjunto de datos.
37
New cards
term image
Fórmula desviación media
38
New cards
Desvío
Es una medida de la diferencia entre el valor observado de una variable y algún otro valor, a menudo la media de esa variable. Signo (+) o (-) informan la dirección de la desviación.
39
New cards
Los valores de desvío o desvaición son muy altos.
La media aritmética no es representativa cuando…
40
New cards
Varianza
Media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Es una medida de dispersión. Eso significa que pretende capturar en qué medida los datos están en torno a la media. Mayor valor de esto, mayor dispersión y variabilidad.
41
New cards
Σ(Xi-𝝻)^2\*fi/N
Fórmula de la varianza para distribución de frecuencias
42
New cards
Σ(Xi-media)^2/n
Fórmula de la varianza para datos simples
43
New cards
\
\
Símbolo de la varianza poblacional
44
New cards
term image
Símbolo de varianza muestral
45
New cards
Desviación estándar
Raíz cuadrada de la varianza, representa su *valor lineal*. Medida cuadrática de lo que se apartan los valores de su media. Sirve para comparar variables que están a distintas escalas pero que están correlacionadas estadísticamente y sustantivamente con un factor en común.
46
New cards
σ
Símbolo de desviación estándar poblacional
47
New cards
s
Símbolo de desviación estándar muestral
48
New cards
Coeficiente de variación
Este sirve como *medida relativa* de dispersión. Determina el grado de dispersión de un conjunto de datos relativo a su media. Comparación. Si nos da un valor muy grande con la media, se utiliza la mediana.
49
New cards
CV
Símbolo del coeficiente de variación poblacional
50
New cards
cv
Símbolo del coeficiente de variación muestral
51
New cards
Coeficiente de variación mayor al 30%
Coeficiente de variación es grande
52
New cards
Medidas de formas
Son unos indicadores que permiten describir una distribución de probabilidad según la forma que tiene. Sirven para determinar cómo es una distribución sin necesidad de representarla gráficamente. Nos muestran si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
53
New cards
Momento
Son formulaciones matemáticas, que se definen como parámetros estadísticos, algunos de ellos cuales tienen amplia connotación dentro del estudio de curvas de distribución de frecuencias y más específicamente respecto del sesgo y de la curtosis.
54
New cards
term image
Fórmula para momentos
55
New cards
Momento 0
Siempre será igual a 1.
56
New cards
Momento 1
Este momento siempre será 0.
57
New cards
Momento 2
Este momento es igual a la varianza de distribición de frecuencias.
58
New cards
Momento 3
Con este momento se calcula el coeficiente de asimetría
59
New cards
Momento 4
Con este momento se calcula el coeficiente de Curtosis
60
New cards
Asimetría
Asimetría
Se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética).
61
New cards
Distribución de datos sesgada
La distribución de datos no es simétrica y se extiende más hacia un lado que hacia otro.
62
New cards
M3/(σ)^3
Fórmula para coeficiente de asimetría
63
New cards
Coeficiente de Asimetría es menor a 0
La distribución de datos es asimétrica a la izquierda (negativa) cuando…
64
New cards
Coeficiente de Asimetría es mayor a 0
La distribución de datos es asimétrica a la derecha (positiva) cuando…
65
New cards
Coeficiente de asimetría es igual a 0
La distribución de datos es simétrica cuando…
66
New cards
Kurtosis
Kurtosis
Grado de concentración que presentan los valores alrededor de la zona central de la distribución. Cómo se agrupan los valores en torno a su media.
67
New cards
M4/(M2)^2
Fórmula coeficiente de curtosis
68
New cards
Forma platicúrtica
Coeficiente de curtosis es < 3
69
New cards
Forma Mesocúrtica
Coeficiente de Curtosis es = 3
70
New cards
Forma Leptocúrtica
Coeficiente de Curtosis es > 3
71
New cards
Que los datos son poco cambiantes, se concentran en la gráfica.
La forma leptocúrtica significa…
72
New cards
Que los datos están muy dispersos, son muy cambiantes.
La forma platicúrtica significa…
73
New cards
Estandarización
Es el proceso de ajustar o adaptar ciertas características para que los datos se asemejen a un tipo, modelo o normal común con el objetivo de que su tratamiento, acceso y uso sea más sencillo para los usuarios o personas que dispongan de ellos.
74
New cards
Puntuación estándar (P.E., zi)
Es un método de comparación de las posiciones relativas de dos o más elementos respecto al conjunto de observaciones. Devuelve el número de desviaciones estándar que la puntuación xi se desvía de la media.
75
New cards
Xi-Media/σ
Fórmula para la puntuación estándar
76
New cards
Puntuación directa
Puntuación definida por Xi/Valor puntual
77
New cards
Puntuación diferenciada
Es la distancia entre la puntuación directa y la media.
78
New cards
Medidas de concentración
Son medidas de reparto del total de la variable. Trata de definir si el reparto de los valores en la distribución es más o menos equitativo o si es desigual.
79
New cards
Coeficiente de Gini
Es una medida de la concentración de una distribución o equidad en el reparto de una distribución. es el método más utilizado para medir la desigualdad salarial. Es una herramienta analítica que suele emplearse para medir la concentración de ingresos entre los habitantes de una región, en un periodo de tiempo determinado.
80
New cards
term image
Fórmula del Coeficiente/Indice de Gini
81
New cards
Coeficiente de Gini = 0
En la distribución de los valores hay mínima concentración o equidistribución
82
New cards
Coeficiente de Gini = 1
En la distribución de los datos hay máxima concentración.
83
New cards
Medidas de asociación
Tienen el objetivo de definir si dos variables aleatorias tienen alguna relación y que tan intensa es. 
84
New cards
Coeficiente chi cuadrado (**χ²**)
Coeficiente chi cuadrado (**χ²**)
Es un procedimiento estadístico utilizado para determinar si existe una diferencia significativa entre los resultados esperados y observados en una o más categorías.
85
New cards
Coeficiente de contingencia (CC)
Coeficiente de contingencia (CC)
Indica si dos variables o conjuntos son independientes o dependientes entre sí.
86
New cards
Medidas de confiabilidad
Procedimientos que miden la fiabilidad o ausencia de errores de medida.
87
New cards
Alfa de Cronbach
Un coeficiente que toma valores entre 0 y 1, utilizado para saber cuál es la fiabilidad de alguna escala o test. La fiabilidad se define como la ausencia de errores de medida en un test o la precisión de su medición. Cuanto más se aproxime el valor al número 1, mayor será la confiabilidad del instrumento que se está tratando. Si se da un resultado negativo, esto denota un grado alto de inconsistencias dentro del instrumento