Mostrando las entradas con la etiqueta Estadistica. Mostrar todas las entradas
Mostrando las entradas con la etiqueta Estadistica. Mostrar todas las entradas

sábado

Matemática Serie 23

Los Cuantiles para datos no agrupados.

¿Qué es un cuantil?


Este término es usado en la estadística descriptiva, y se refieren a las medidas de posición no central que me permiten reconocer otros puntos característicos de la distribución los cuales no son centrales.


Los cuantiles, Q, son valores que dividen en partes iguales a cualquier muestra de datos. Un cuantil deja por debajo una determinada cantidad de datos, generalizando de esta manera a la mediana, que deja por debajo la mitad de los datos o su 50%. Los cuantiles más usados son:

1-) Cuartiles Qk
2-) Deciles Dk.
3-) Centiles o percentiles Pk.


Cuartiles Qk

Los Cuartiles dividen a un conjunto de datos de tal manera que, Q1: es el valor antes del cual quedan un 25% de los datos; Q2: Es idéntico a la mediana, los datos quedan en un 50%, y Q3: los datos quedan en un 75%, que es el tercer cuartil.

El proceso para localizar cuartiles es semejante al que se utiliza para encontrar la mediana.
1) Ordene los “n” datos desde el menor al mayor.
2) Esta es la fórmula para determinar cualquier cuartil: k(n+1) /4
Siendo “k” igual al cuartil buscado y “n” al número de datos.


Nota: Si la posición cae entre dos enteros, deberá emplear la formula…
Qk= E1 + (E2-E1)e

E1=número donde está el cuartil.
E2= numero que le sigue donde está el cuartil.
e=parte decimal de la posición.

Ejemplo:

1-) Determinar el 3er cuartil de los siguientes datos: 1, 2, 8, 8, 9, 7, 4, 8, 9.

Ordenamos los datos de menor a mayor: 1, 2, 4, 7, 8, 8, 8, 9, 9.

Luego buscamos la formula.


Donde.

K= 3 (cuartil buscado)

N= 9 (total de datos)


Entonces:



Como el resultado es un número decimal “7.5”, la posición 7 y 8.

El cuartil # 3, será:

Q3=8 + (9-8)(0.5)
Q3= 8 + 1(0.5)
Q3= 8 + 0.5 = 8.5

Deciles Dk:


Los deciles se localizan en la muestra de modo que un 20 % de los datos son menores o iguales que el segundo decil, D2; un 80 % de los datos son menores o iguales al octavo decil, D8, y un 90 % de los datos menores o iguales que el noveno decil, D5:



Para calcular los deciles y percentiles utilizamos el mismo procedimiento de los cuartiles, pero con la siguientes formulas:




Siendo “k” igual al decil buscado y “n” al número de datos.

Nota: En ambos casos, si la posición cae a la mitad entre dos enteros, deberá tomarse como cuartil la media de ambos enteros.

Ejemplo: 

Determinar el 7mo decil y el 25 percentil de los siguientes datos: 1, 2, 8, 8, 9, 7, 4, 8, 9.

Ordenamos los datos de menor a mayor: 1, 2, 4, 7, 8, 8, 8, 9, 9.

Luego buscamos la formula.


Donde.

K= 7 (decil buscado)

N= 9 (total de datos)



Entonces:




El decil # 7, será: 8.


AQUÍ NO SE APLICA LA FORMULA PASADO, YA QUE, NO EL CUARTIL RECAE EN UN NÚMERO.


El percentiles:


Donde.

K= 25 (percentil buscado)

N= 9 (total de datos)


Ordenamos los datos de menor a mayor: 1, 2, 4, 7, 8, 8, 8, 9, 9.



P25 = 2 + (4-2) (0.5)

P25 = 2 + (2) (0.5)

P25= 2 + 1 = 3

VER VÍDEO EJEMPLO.



Actividad de Aprendizaje.

I-) Analiza y haz lo que te piden en cada ejercicio.

1-) Una maquinaria registra las siguientes temperaturas en un período de producción de 20 días.
42°, 53°, 39°, 33°, 40°, 41°, 50°, 35°, 28°, 29°, 37°,
43°, 34°, 31°, 44°, 57°, 32°, 45°, 46°, 48°.

Determinar la posición de los valores que corresponda al Q4, Q2, D6, P7:

2-) Los datos siguientes corresponden a los tiempos de reacción de una muestra de 33 sujetos, medidos en centésimas de segundo: 55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74,
65, 58, 61, 62, 59, 64, 57, 63, 52, 67.

Calcule la media, el primer y el tercer cuartil, directamente a partir de los datos.

3-) Hemos medido la variable neuroticismo en un grupo de sujetos obteniendo los siguientes resultados: 3, 5, 3, 6, 4, 2, 8, 3, 7, 5, 8, 9, 4, 5, 5, 3

Calcule moda, mediana y el percentil 35.

4-) Un experimento, medido en grados ¿emigrados, arroja los siguientes resultados: 28, 31, 28, 30. 28. 27, 30. 32, 35, 26, 25, 29, 26, 28, 25. 31, 31, 32, 27, 30, 31, 31, 25, 28

Hallar los percentiles P18, P70 y dar su respectiva Interpretación:


Leer Mas
Matemática Serie 23

Desviación media, Varianza y Desviación típica de Datos No Agrupados.

Medidas de Dispersión para datos no agrupados.
Medidas de dispersión. Parámetros estadísticos que indican como se alejan los datos respecto a los valores centrales. Sirven como indicador de la variabilidad de los datos.

Las medidas de dispersión más utilizadas son el rango, desviación media, la varianza y la desviación típica.


El rango R.

Indica la dispersión entre los valores extremos de una variable y se representa con la letra R. El rango R de una muestra de datos, es la diferencia del mayor y el menor valor presentes en la muestra.

se calcula como la diferencia entre el dato mayor y el menor.


Si “X” es el mayor valor de la muestra y “x” el menor valor, el rango se obtiene, con la expresión:

R = X - x ; 

Desviación media Dm.

La desviación media, Dm, de una muestra de datos, es la suma de los valores absolutos de las diferencias de cada uno de los datos y la media aritmética, dividida por el número total de datos de la muestra.


Otra manera:


Ejemplo:

Las siguientes calificaciones se obtuvieron de un grupo de estudiantes de una prueba de Matemáticas: 71, 85, 65, 53, 90, 84, 81, 40,64.

Obtener el rango y la desviación media de los datos de la muestra:

DESARROLLO.

Para el Rango:

Buscamos el valor mayor y lo restamos con el valor menor.

R= 90 – 40 = 50.

Para el rango medio:

Rm = (90+40) / 2 = 130 / 2= 65

Para la desviación media.

Primer paso: obtener la media aritmética de los datos.

AHORA BUSCAMOS ESTA PEQUEÑA FORMULA.


Eso indica que debemos restarle a cada dato la media aritmética, recordando que, aunque haya resultado negativos siempre se colocan positivos, ya que las barras de la formula indica valor absoluto:

71– 70.3 = 0.7

85 – 70.3 = 14.7

65 – 70.3 = 5.3

53 – 70.3 = 17.3

90 – 70.3 = 19.7

84 – 70.3 = 13.7

81 – 70.3 = 10.7

40 – 70.3 = 30.3

64 – 70.3 = 6.3

Ahora sumamos todos los resultados para luego dividirlos entre el total de datos.

0.7+14.7+5.3+17.3+19.7+13.7+10.7+30.7+6.3 = 119.1

Ahora, la desviación media será…


La Varianza σ².

La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media.
Para calcular la varianza utilizamos esta formula parecida a la de Desviación Media.

Aquí, hacemos el mismo procedimiento que en la Desviación Media.


Ejemplo:

Las siguientes calificaciones se obtuvieron de un grupo de estudiantes de una prueba de Matemáticas:
71, 85, 65, 53, 90, 84, 81, 40,64.

Ahora le restamos a cada dato la media aritmética.

71– 70.3 = 0.7

85 – 70.3 = 14.7

65 – 70.3 = 5.3

53 – 70.3 = 17.3

90 – 70.3 = 19.7

84 – 70.3 = 13.7

81 – 70.3 = 10.7

40 – 70.3 = 30.3

64 – 70.3 = 6.3

Cada resultado lo elevamos al cuadrado.

0.7² = 0.49‬

14.7² = 216.09

5.3² = 28.09

17.3² = 299.29‬

19.7² = 388.09

13.7² = 187.69‬

10.7² = 114.49

30.3² = 918.09

6.3² = 39.69

Ahora obtenemos la sumatoria de todos los resultados.

0.49‬+216.09+28.09+299.29‬+388.09+187.69‬+114.49+918.09+39.69 = 2,192.01


La varianza será…

La desviación típica o estándar:

es una medida que se usa para cuantificar la variación o dispersión de un conjunto de datos numéricos. Una desviación estándar baja que indica que la mayor parte de los datos de una muestra tienden a estar agrupados cerca de su media.


La desviación típica se obtiene secándole la raíz cuadrada a la varianza.

Ejemplo:

La desviación típica del ejemplo anterior seria…


Quiere decir que.

Varianza = σ² =243.56

Desviación típica = σ =√(243.56)=15.6


VER VÍDEO EJEMPLO.



Actividad de Aprendizaje.


I-) Analiza y haz lo que te piden en cada ejercicio.


1-) Una maquinaria registra las siguientes temperaturas en un período de producción de 20 días.
42°, 53°, 39°, 33°, 40°, 41°, 50°, 35°, 28°, 29°, 37°,
43°, 34°, 31°, 44°, 57°, 32°, 45°, 46°, 48°.

Determinar el rango, la desviación media y típica.:


2-) Los datos siguientes corresponden a los tiempos de reacción de una muestra de 33 sujetos, medidos en centésimas de segundo: 55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74,
65, 58, 61, 62, 59, 64, 57, 63, 52, 67.

Determinar el rango, la desviación media y típica.:

3-) Hemos medido la variable neuroticismo en un grupo de sujetos obteniendo los siguientes resultados: 3, 5, 3, 6, 4, 2, 8, 3, 7, 5, 8, 9, 4, 5, 5, 3

Determinar el rango, la desviación media y típica.:

4-) Un experimento, medido en grados ¿emigrados, arroja los siguientes resultados: 28, 31, 28, 30. 28. 27, 30. 32, 35, 26, 25, 29, 26, 28, 25. 31, 31, 32, 27, 30, 31, 31, 25, 28

Determinar el rango, la desviación media y típica.:


Leer Mas

lunes

Matemática Serie 23

Media aritmética, moda y mediana para datos No agrupados.


Medidas de tendencia central:

Las medidas de tendencia central o valores medios son valores en torno a los que se ubican los datos de una muestra, es decir, que nos sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.
Las más comunes son:

La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior.

La mediana: la cual es el puntaje que se ubica en el centro de una distribución o una muestra. Se representa como Md o Me.

La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.


Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.

Nota: La media aritmética solo se puede hallar para variables cuantitativas.

Ejemplo # 1:

En matemáticas, un alumno tiene las siguientes calificaciones durante la mitad de un año escolar:
70, 68, 50, 81, 74, 81, 55, 67, ¿cual es el promedio de las calificaciones?

Aquí: n = 8 (número total de datos).

Entonces el promedio sería.

Respuesta: El promedio es 68.25.

Ejemplo 2:

Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 45 varas de pino lo ilustra. ¿Cuál es el promedio de árboles en metros?


En este caso de la tabla, lo primero que hacemos es multiplicar cada frecuencia por los árboles dados en metros, y obtener el total de dichos resultados.



La moda (Mo):

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Ejemplo:

Hallar la moda de la distribución siguiente:  2, 3, 3, 4, 4, 4, 5, 5

Aquí, el que más se repite es el “4”, por eso, Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

Por ejemplo:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9, Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 

La mediana (Md):
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se representa por Md.

Nota: La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana

Primero: Ordenamos los datos de menor a mayor, y si el conjunto de datos es un numero impar, entonces la mediana es el dato que está en el centro.

Ejemplo:
Determines la mediana de los siguientes datos: 2, 8, 6, 7, 2, 5, 9, 4 ,7

Ordenamos los datos: 2, 2, 4, 5, 6, 7, 7, 8, 9


Como se puede observar, al ser un numero de datos impar , entonces el dato que queda en el centro es la mediana, en este caso Md = 6.


Segundo: Ordenamos los datos de menor a mayor, y si el conjunto de datos es un numero par, entonces la mediana se consigue sumando los dos datos del centro y dividir el resultado en dos.

Ejemplo: 

De las siguientes calificaciones obtener la mediana.

70, 68, 50, 81, 74, 81, 55, 67

Ordenamos los datos:

50, 55, 67, 68, 70, 74, 81, 81


Se observa que el 68 y 70 quedaron el centro, por eso la mediana se obtiene...



VER VÍDEO EJEMPLO.


Actividad de aprendizaje:

1-) Los siguientes son los puntajes de un grupo de adolescentes en un test de Agudeza Visual: 25, 12, 15, 23, 24, 39, 13, 31, 19, 16.


a-) La media, la moda y la mediana serán. 


2-) Suponga que se tiene una muestra de los ingresos mensuales en miles de dólares para 5 mes: 56, 57, 52, 45, 67,56.

a-) La media y la moda serán.


3-) El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 61, 75, 88, 57, 91, 60, 87, 80, 74, 70.

a-) La media, la moda y la mediana serán.

4-) La siguiente tabla de frecuencia muestra el número de preguntas de 81 encuestados sobre un Test que consta de solo seis preguntas.


a-) La media, la moda y la mediana serán. 




Leer Mas
Matemática Serie 23

Tablas de Datos Agrupados (Introducción a la Estadísticas 3ra Parte).


Organización de los datos 
La Tabla de frecuencia de datos agrupados son aquella distribución en la que los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

Para agrupar datos, primero, se obtiene la diferencia entre los valores mayor (Xmax) y menor (Xmin) de la muestra; luego, esta diferencia, Xmax - Xmin, se divide por el número de grupos, N, que se quiera formar, para obtener la amplitud, L, del grupo y, finalmente, con la amplitud, L, se forman los distintos grupos.

Algo importante:

Es bueno recordar que una clase está formada por todos los datos que están ubicados entre dos números dados. Estos números determinan la amplitud o recorrido y definen lo que se conoce como límite inferior de la clase y el mayor como límite superior.

Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase: La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase: La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Hay distintas formas de construir los intervalos dependiendo del tipo de variable que estemos trabajando.

a) Variables cuantitativas discretas: solo pueden tomar un número finito de valores. Siendo por lo general estos valores los números naturales 1, 2, 3...Un ejemplo son el número de hijos, el número de habitaciones de una vivienda, el número de matrimonios de una persona. Cuando categorizamos variables discretas los límites de clase son idénticos a los límites reales. Por ejemplo, el número de personas que viven en una familia podemos agruparlo, De 1 hasta 2 (0 es imposible no hay ninguna familia sin ningún miembro) De 3 hasta 4, De 5 hasta 7.

b) Variables cuantitativas continuas: Las variables continuas, por el contrario, pueden, tomar un número infinito de valores en cualquier intervalo dado. En este caso los valores se agrupan en intervalos cuyos límites inferior y superior serían los siguientes:

Habitualmente, los intervalos se consideran cerrados a la izquierda y abiertos a la derecha, es decir que el extremo inferior está incluido en el intervalo, pero el extremo superior no.

Construcción de una tabla de datos agrupados.

No existen normas fijas para determinar la cantidad de intervalos de clases, pero existen algunas fórmulas que nos proporcionan un numero aproximado del numero de clases que podrían usarse, algunas son:


a-) A través de la raíz cuadrada del total de datos .

b-) Por la formula,
 
donde “x” es un número entero tal que
 
sea la potencia más cercana al número “n” de datos (x+1 cantidad de clases).

Ejemplo:
Los siguientes datos muestran el número de choque en una autopista durante 30 días en el mes de mayo: 2, 6, 8, 60, 50, 20, 3, 9, 5, 10, 3, 2, 1, 7, 9, 30, 50, 10, 13, 15, 23, 52, 23, 45, 40, 16, 54, 4, 34, 28.

a-) Construir una tabla de frecuencia para datos agrupados con amplitud = 10.
b-) ¿Cuántos choques constituyen la muestra estudiada?
c-) ¿Cuál es el límite inferior de la clase 2?
d-) ¿Entre qué límites se observan más choques?

Aquí en este ejemplo nos dan la amplitud = 10, nos faltaría el número de intervalos clases que formaremos.

-Como el total de los datos es 30, entonces N=30.
√30 = 5.47, haciendo un redondeo, tenemos 6, hay que saber que 0.47 está muy cerca 0.5, por eso la cantidad de intervalos que formaremos es 6.
-También, como sabemos que 30 es la cantidad de datos "n", entonces
2^5 = 32, que esta cerca de 30, entonces el número de intervalo es 5+1= 6.

a-) Ahora comenzamos a construir la tabla, a principio colocamos dos columnas, una para los intervalos y la otra para la frecuencia absoluta (fi).


fi












Total


Ahora buscamos el valor menor de los datos y comenzamos a sumarle la amplitud, para así formar los intervalos. Valor menor = 1, amplitud =10.

Intervalos
fi
1-11

11-21

21-31

31-41

41-51

51-61

Total


Recodar que, a la hora de contar las frecuencias de los datos, no se incluye el límite superior.

Ejemplos:

Primer intervalo: 1-11, contamos todos los números que sean igual o mayor a uno y menor a 11.

(1, 2, 5, 8, 3, 9,5, 10, 3, 2, 1, 7, 9, 10, 4, estos son los números igual o mayor que uno y menor que 11), total = 15.

Segundo intervalo: 11-21, contamos todos los números que sean igual o mayor a 11 y menor a 21.

(20, 13, 15, 16, estos son los números igual o mayor que 11 y menor que 21), total = 4.

Y…así sucesivamente.

Intervalos
fi
1-11
15
11-21
4
21-31
4
31-41
2
41-51
3
51-61
2
Total
30

b-) 30 choques constituyen las muestras en ese mes.
c-) El limite interior de la clase “2” es 11.
d-) en limite 1-11 se observaron 15 choques.

VER VÍDEO EJEMPLO.



Actividad de aprendizajes:
1-) Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas:

60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 
63; 69; 80; 59; 66; 70; 67; 78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56;
65; 74; 67; 54; 65; 65; 69; 61; 67; 73; 57; 62; 67; 68; 63; 67; 71; 68; 76; 
61; 62; 63; 76; 61; 67; 67; 64; 72; 64; 73; 79; 58; 67; 71; 68; 59; 69; 70; 
66; 62; 63; 66;



a-) Obtenga una distribución de datos en intervalos de amplitud 5, siendo el primer
intervalo [50; 55].
b-) ¿Cuántas personas tienen peso mayor o igual que 70 Kg pero menor que 85?


2-) Unos grandes almacenes disponen de un aparcamiento para sus clientes. Los siguientes datos que se refieren al número de horas que permanecen en el aparcamiento una serie de coches:


a-) Obtener la tabla de frecuencias para ese conjunto de datos intervalos de amplitud = 1. Interpretar la tabla.

3-) Las notas finales de 65 estudiantes de una Escuela Superior son las siguientes:
46, 58, 25, 48, 18, 41, 35, 59, 28, 35, 37, 68, 70, 31, 44, 84, 64, 82, 26, 42, 51, 29, 59, 92, 56, 5, 52, 8 ,12, 21, 32, 15, 67, 47, 61, 47 ,43, 33, 48, 47, 43, 69 ,49 ,21, 9 ,15 ,22, 29 ,14 ,31 ,46 ,19 ,49 ,51 ,71 52, 32 ,51 ,44 ,57 ,60 ,43 ,65 ,73 ,62.



a-) Obtenga una distribución de datos en intervalos de amplitud 12.
b-) ¿Cuál es el número de estudiantes con nota superior a 80?

4-) Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la misma categoría de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron:



a-) a-) Obtener la tabla de frecuencias para ese conjunto de datos intervalos de amplitud = 0.5.

b-) ¿Cuántos hoteles tienen un precio entre 3.3 y 3.8?

c-) ¿Cuántos hoteles tienen un precio superior a 4.8?

d-) ¿Qué porcentaje de hoteles cuestan como mucho 4.3?

5-) Los siguientes datos representan los ingresos diarios (en miles) de 20 obreros de cierta compañía:16, 16, 17, 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 24.

a-) Construya una tabla de frecuencias agrupadas utilizando la formula de Sturges.

b-) Construya un histograma de frecuencias. Comente.

c-) ¿Cuántos obreros tienen un ingreso diario menor de 22?

d-) ¿Qué porcentaje de obreros tienen un ingreso diario entre 16 y 19?



Leer Mas