1- Repaso medidas de posición
Medidas de posición
Son aquellas que dan información acerca del orden en la estructura de una muestra.
Cuartiles: Son valores de la variable que dividen a la distribución en 4 partes, cada una de las cuales engloba el 25 % de las mismas. Son 3, denotados como en donde: es el primer cuartil que deja a su izquierda el 25 % de los datos; es el segundo cuartil que deja a su izquierda el 50% de los datos, y es el tercer cuartil que deja a su izquierda el 75% de los datos. Además, .
Cada cuartil comprende un 25% de la información de una serie de datos, se tienen tres valores:
El primer Cuartil : comprende el primer 25% de la información.
El Segundo Cuartil : comprende el otro 25%, es decir que en el segundo cuartil ya se ha considerado el 50% de la información correspondiente a la serie de datos, es decir la mitad de los datos de la información. Por esta razón coincide con la mediana.
El tercer Cuartil : ha abordado un 75%, es decir este contiene el 25% que se ubica en el tercer intervalo.
Cálculo de la posición del cuartil:
Percentiles: Llamamos percentiles a cada uno de los números que dividen la muestra en 100 partes iguales, en consecuencia, son 99, y se denotan por , donde k es el orden del percentil indicado. Se emplean cuando se tiene tamaños de muestras muy grandes.
Se aprecia que los percentiles guardan relación con los cuartiles, se puede notar que estos percentiles comprenden el 25% de cada 100 datos.
; comprende los primeros 25 datos de 100, esto equivale a la cuarta parte de la serie de datos que se está analizando, entonces el percentil 25 es equivalente al cuartil 1. Simplificando 25/100 obtenemos que el percentil 25 (P_25) contiene uno de cada cuatro datos
; tiene la mitad de la información, entonces es igual al cuartil 2. Simplificando 50/100 el P_50 contiene dos de cada cuatro datos.
; comprende las tres cuartas partes de la serie de datos, es decir es equivalente al cuartil 3. Simplificando el contiene tres de cada cuatro datos.
– Para calcular el percentil, se procede como sigue: se multiplica el tamaño de la muestra por , y se ubica la observación cuyo ranking iguale o supere por primera vez el número calculado.
Ejemplo 1: Dadas las series estadísticas: 3, 5, 2, 7, 6, 4, 9, 1. Calcule los percentiles 20 y 70.
Solución: Ordenamos los datos: 1, 2, 3, 4. 5, 6, 7, 9. Note que el tamaño de la muestra es igual a 8. Luego, utilizando la fórmula, se tiene que:
El dato que supera al valor calculado es 2. Por lo tanto .
Para calcular el percentil 70 seguiremos un procedimiento análogo al anterior:
Por lo tanto
Ejemplo 2: Una distribución estadística viene dada por la siguiente tabla:
|
|
[10, 15) |
3 |
[15, 20) |
5 |
[20, 25) |
7 |
[25, 30) |
4 |
[30, 35) |
2 |
Hallar el percentil 70.
Solución: Completamos la tabla con la frecuencia acumulada:
|
|
|
[10, 15) |
3 |
3 |
[15, 20) |
5 |
8 |
[20, 25) |
7 |
15 |
[25, 30) |
4 |
19 |
30, 35) |
2 |
21 |
Buscamos el intervalo donde se encuentra el percentil 70.
Buscamos en la columna de las frecuencias acumuladas, el intervalo que contenga al valor 14,7. Recordemos que es el primero que le supere al 14,7
Por lo tanto, la clase de .
Si queremos conocer exactamente el valor de P_k, en este caso para datos agrupados, aplicamos la fórmula:
Donde:
: Límite inferior del intervalo que contiene el percentil k.
: Percentil buscado.
N: Cantidad de datos.
: Frecuencia Acumulada en el intervalo anterior al intervalo donde se encuentra el percentil k.
: Amplitud del intervalo donde se encuentra el percentil k.
: Frecuencia absoluta donde se encuentra el percentil k.
Reemplazando entonces los datos:
– Deciles: Son 9, denotados como . Dividen la muestra en diez partes iguales. Cada una de las cuales engloba el 10 % de los datos y corresponden respectivamente a los percentiles . Además, que corresponde a la mitad de los datos, lo que coincide con cuartil 2 y percentil 50 y por ende a la mediana.
Cálculo de la posición del decil:
En resumen:
coincide con la mediana.
coincide y con
Es decir,
Si tenemos que la posición de los siguientes cuantiles son:
y , igualando entonces estos tres cuantiles, se tiene:
, dividiendo por N
Simplificando:
Vemos que se cumple la igualdad.
2- Ejercicios
Ejercicio Resuelto:
Se ha realizado una prueba de 79 preguntas a 600 personas. El número de respuestas correctas se refleja en la siguiente tabla:
Respuestas |
[0,10) |
[10, 20) |
[20, 30) |
[30, 40) |
[40, 50) |
[50, 60) |
[60, 70) |
[70, 80) |
N° de personas |
40 |
60 |
75 |
90 |
105 |
85 |
80 |
65 |
Calcular los cuartiles, la mediana, el rango intercuartílico, el decil 2 y el percentil 48
Solución: Construyendo una tabla de frecuencia
Intervalos |
|
|
|
|
|
[ 0, 10) |
5 |
40 |
40 |
200 |
|
[ 10, 20) |
15 |
60 |
100 |
900 |
|
[ 20, 30) |
25 |
75 |
175 |
1875 |
|
[ 30, 40) |
35 |
90 |
265 |
3150 |
|
[ 40, 50) |
45 |
105 |
370 |
4725 |
|
[ 50, 60) |
55 |
85 |
455 |
4675 |
|
[ 60, 70) |
65 |
80 |
535 |
5200 |
|
[ 70, 80) |
75 |
65 |
600 |
4875 |
|
Total |
600 |
|
Entonces, calculando la posición de los cuartiles:
Entonces, el primer valor que sobrepasa a 150 en la frecuencia acumulada es 175, que corresponde al intervalo [ 20, 30).
Calculando el primer cuartil:
Recordemos que , pues como se observó anteriormente, corresponde la cuarta parte o el 25% de los datos. Utilizando la fórmula:
Posición del segundo Cuartil:
Entonces el primer valor que sobrepasa a 300 en la frecuencia acumulada es 370, que corresponde al intervalo [ 40, 50).
Recordemos que , pues corresponde al 50% de los datos:
Posición del tercer Cuartil:
Entonces el primer valor que sobrepasa a 450 en la frecuencia acumulada es 455 que corresponde al intervalo [ 50, 60).
Recordemos que , pues corresponde al 75% de los datos:
Rango Intercuartílico: Q_3-Q_1= 59,4-26,7=32,7
Deciles: Nos piden calcular el decil 2. Para esto, vemos primero en qué intervalo se encuentra:
Entonces el primer valor que sobrepasa a 120 en la frecuencia acumulada es 175, que corresponde al intervalo [ 20, 30).
Recordemos que: , pues calculando sus posiciones:
Por lo tanto, la equivalencia es válida.