Mostrando entradas con la etiqueta gráficos. Mostrar todas las entradas
Mostrando entradas con la etiqueta gráficos. Mostrar todas las entradas

miércoles, 24 de mayo de 2017

Inicio de una breve introducción a la estadística

Solamente doy asesorías a particulares en casos excepcionales, y éste es uno de ellos. Alguien que requiere de conocer los elementos de la estadística con apenas un par de semanas para aprenderlo. Lo bueno: la disposición. Trabajaremos un total de 10 horas, aproximadamente, partiendo de cero (absoluto). 
El día de ayer tuvimos la primera sesión de dos horas y lo que sigue es el resumen que hice yo esta mañana.

Primera sesión

1.       Hacemos observaciones todos los días, en diferentes lugares y por diferentes razones. Una observación realizada a propósito es un experimento. Por ejemplo, podemos decidir observar a las personas que salen de un elevador en un edificio público, ese sería un experimento.
2.       Lo que registramos al hacer la observación se llaman Variables. Por ejemplo, al observar a las personas que salen de un elevador en un edificio público podemos fijarnos en si son hombres o son mujeres (la variable es Sexo), o podemos observar si usan zapatos formales, tenis, chanclas, botas (la variable sería tipo de calzado), pero también podemos observar el número de personas que salen en cada vuelta (la variable sería número de personas), incluso podríamos preguntarles su religión (esa sería la variable) o su edad (y esa sería la variable).
3.       Algunas variables dan como resultado “cualidades” es decir, características no medibles con regla, pesas, etc. como en el caso de las variables Sexo, tipo de calzado, religión. Esas variables se dicen cualitativas.
4.       Otras variables dan como resultado números y se dicen cuantitativas. Es el caso de las variables número de personas, edad, tiempo, …
5.       Según la variable que nos interese, lo que vamos registrando tiene un cierto número de opciones. En el caso de Sexo (en documento oficiales, por ejemplo), las opciones son Hombre y Mujer (o Masculino y Femenino). Esos son los valores que puede tomar la variable Sexo. Si la variable es número de personas que salen del elevador que observamos, los valores que puede tomar son 0, 1, 2, 3, 4, 5, 6, 7 (de acuerdo con las normas).
6.       En el caso de las variables cuantitativas tenemos dos situaciones:
a.       Lo que registramos se puede contar como si fueran naranjas: años cumplidos, número de hijos en una familia, personas que salen de un elevador, veces que sale águila cuando tiramos cinco volados, frutos que da un árbol en una temporada. En estos casos las opciones van, generalmente, de 0 a algún número entero por muy grande que sea. Se llaman variables cuantitativas discretas.
b.       Lo que registramos puede tomar cualquier valor (entero, decimal, etc.) en un rango. Por ejemplo: tiempo que tarda en salir la gente de un elevador, medido en segundos (de 0 a 90, por ejemplo), y puede ser cualquier número, con decimales incluidos, en ese rango. O el tiempo que dura un foco sin fundirse medido en horas (de 0 a 250, por ejemplo). O el peso de un ser humano vivo, ya nacido, (de 0.200  a 220 kg, más o menos). En estos casos decimos que se trata de variables cuantitativas continuas.
7.       
       Las variables se representan con letras mayúsculas; los valores de las variables (para efectos de las fórmulas que seguirán) se representan con letras minúsculas.  Por ejemplo:
Variable
Símbolo
Valores
Sexo
X
Femenino, masculino
Número de personas que salen de un elevador
Q
0, 1, 2, 3, 4,5, 6,7
Si el número posibilidades es muy grande (por ejemplo, el número de personas que viajan en un vehículo público, como un camión urbano) puede no ser conveniente escribir todas las posibilidades y entonces se agrupan en rangos pequeños.
Peso de un ser humano vivo ya nacido, en kg
P
Aquí no es posible dar todos los valores que pueden observarse, porque el continuo es infinito. Se acostumbra trabajar por intervalos cortos, subdividiendo el rango para que “tenga sentido”

8.
       Una vez que tenemos el experimento formulado (incluyendo sus condiciones) y la variable que nos interesa bien definida, de manera que NADIE pueda malinterpretar lo que se pide observar, registramos de manera precisa cada una de las observaciones que hacemos. Cada uno de esos registros se llama un dato. 
9.       Por ejemplo: Estamos observando a las personas que salen del elevador del edificio público de la SEG, en Guanajuato, frente a la salida del elevador en la planta baja del edificio, entre las 8 y las 9 de la mañana (todo eso es la descripción del experimento y sus condiciones), y vamos a registrar el número de personas que descienden en ese piso (esta es la variable). Sabemos que los valores que puede tomar la variable, sus opciones, van de 0 a 7 por las limitantes de seguridad. Supongamos que en el tiempo que duró la observación hubo un total de 20 llegadas (número total de observaciones = N) y que registramos lo siguientes números: 0, 2, 2, 1, 0, 3, 4, 1, 3, 4, 5, 2, 1, 3, 5, 3, 6, 3, 4, 5 (estos son los datos recabados)
10.   Lo que sigue es presentar la información y sacarle provecho. Porque para eso se estudia estadística.
11.   El asunto entonces es a quién se le va a presentar la información, qué habilidades tiene para comprenderla, y qué queremos hacerle ver (sin trampas). Hay opciones:
a.       Darle la lista de valores registrados, los datos, tal cual los obtuvimos: 0, 2, 2, 1, 0, 3, 4, 1, 3, 4, 5, 2, 1, 3, 5, 3, 6, 3, 4, 5
b.       Darle la misma lista, pero ordenada: 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6
c.       Construirle una tabla de frecuencias absolutas (cada valor con el número de veces que apareció). f(q) se lee como “frecuencia con la que aparece el valor q”.
                        La frecuencia (número de veces) del valor q =1 es 3, por ejemplo.

q
f(q)
0
2
1
3
2
3
3
5
4
3
5
3
6
1
                        
La suma de todas las frecuencias debe ser igual al total de observaciones registradas.
                        En este caso N = 20 y verificamos:   2 + 3 + 3 + 5 + 3 + 3 + 1 = 20

La misma tabla se puede construir con frecuencias relativas, dividiendo la frecuencia de cada dato entre el total de observaciones registradas (N = 20). En el caso de las frecuencias relativas, en decimal, la suma debe ser 1. Si se da en porcentajes debe ser 100%. Y es muy importante verificarlo.

q
f(q) absoluta
f(q) relativa
0
2
2/20 = 0.10 = 10%
1
3
2/20 = 0.15 = 15%
2
3
3/20 = 0.15 = 15%
3
5
5/20 = 0.25 = 25%
4
3
3/20 = 0.15 = 15%
5
3
3/20 = 0.15 = 15%
6
1
1/20 = 0.05 = 5%

d.       Construirle un diagrama de barras a partir de esa tabla:


e.       Construirle un diagrama de pay o pastel: