Solamente doy asesorías a particulares en casos excepcionales, y éste es uno de ellos. Alguien que requiere de conocer los elementos de la estadística con apenas un par de semanas para aprenderlo. Lo bueno: la disposición. Trabajaremos un total de 10 horas, aproximadamente, partiendo de cero (absoluto).
El día de ayer tuvimos la primera sesión de dos horas y lo que sigue es el resumen que hice yo esta mañana.
Primera sesión
1.
Hacemos observaciones todos los días, en
diferentes lugares y por diferentes razones. Una observación realizada a
propósito es un experimento. Por
ejemplo, podemos decidir observar a las personas que salen de un elevador en
un edificio público, ese sería un experimento.
2.
Lo que registramos al hacer la observación se
llaman Variables. Por ejemplo, al
observar a las personas que salen de un elevador en un edificio público podemos
fijarnos en si son hombres o son mujeres (la variable es Sexo), o
podemos observar si usan zapatos formales, tenis, chanclas, botas (la variable
sería tipo de calzado), pero también podemos observar el número de
personas que salen en cada vuelta (la variable sería número de personas),
incluso podríamos preguntarles su religión (esa sería la variable) o su edad (y
esa sería la variable).
3.
Algunas variables dan como resultado
“cualidades” es decir, características no medibles con regla, pesas, etc. como
en el caso de las variables Sexo, tipo de calzado, religión. Esas variables se
dicen cualitativas.
4.
Otras variables dan como resultado números y se
dicen cuantitativas. Es el caso de
las variables número de personas, edad, tiempo, …
5.
Según la variable que nos interese, lo que vamos
registrando tiene un cierto número de opciones. En el caso de Sexo (en
documento oficiales, por ejemplo), las opciones son Hombre y Mujer (o Masculino
y Femenino). Esos son los valores que
puede tomar la variable Sexo. Si la variable es número de personas
que salen del elevador que observamos, los valores que puede tomar son 0, 1, 2,
3, 4, 5, 6, 7 (de acuerdo con las normas).
6.
En el caso de las variables cuantitativas
tenemos dos situaciones:
a.
Lo que registramos se puede contar como si
fueran naranjas: años cumplidos, número de hijos en una familia, personas que
salen de un elevador, veces que sale águila cuando tiramos cinco volados,
frutos que da un árbol en una temporada. En estos casos las opciones van,
generalmente, de 0 a algún número entero por muy grande que sea. Se llaman variables cuantitativas discretas.
b.
Lo que registramos puede tomar cualquier valor
(entero, decimal, etc.) en un rango. Por ejemplo: tiempo que tarda en salir la
gente de un elevador, medido en segundos (de 0 a 90, por ejemplo), y puede ser
cualquier número, con decimales incluidos, en ese rango. O el tiempo que dura
un foco sin fundirse medido en horas (de 0 a 250, por ejemplo). O el peso de un
ser humano vivo, ya nacido, (de 0.200 a
220 kg, más o menos). En estos casos decimos que se trata de variables cuantitativas continuas.
7.
Las variables se representan con letras
mayúsculas; los valores de las variables (para efectos de las fórmulas que seguirán) se representan con letras minúsculas. Por ejemplo:
Variable
|
Símbolo
|
Valores
|
Sexo
|
X
|
Femenino, masculino
|
Número de personas que salen de un elevador
|
Q
|
0, 1, 2, 3, 4,5, 6,7
Si el número
posibilidades es muy grande (por ejemplo, el número de personas que viajan en
un vehículo público, como un camión urbano) puede no ser conveniente escribir
todas las posibilidades y entonces se agrupan en rangos pequeños.
|
Peso de un ser humano vivo ya nacido, en kg
|
P
|
Aquí no es posible dar todos los
valores que pueden observarse, porque el continuo es infinito. Se acostumbra
trabajar por intervalos cortos, subdividiendo el rango para que “tenga
sentido”
|
8. Una vez que tenemos el experimento formulado (incluyendo sus condiciones) y la variable que nos interesa bien definida, de manera que NADIE pueda malinterpretar lo que se pide observar, registramos de manera precisa cada una de las observaciones que hacemos. Cada uno de esos registros se llama un dato.
9.
Por ejemplo: Estamos observando a las
personas que salen del elevador del edificio público de la SEG, en Guanajuato,
frente a la salida del elevador en la planta baja del edificio, entre las 8 y
las 9 de la mañana (todo eso es la descripción del experimento y sus
condiciones), y vamos a registrar el número de personas que descienden en
ese piso (esta es la variable). Sabemos que los valores que puede tomar la
variable, sus opciones, van de 0 a 7 por las limitantes de seguridad.
Supongamos que en el tiempo que duró la observación hubo un total de 20
llegadas (número total de observaciones
= N) y que registramos lo siguientes números: 0, 2, 2, 1, 0, 3, 4, 1, 3, 4, 5,
2, 1, 3, 5, 3, 6, 3, 4, 5 (estos son los datos
recabados)
10.
Lo que sigue es presentar la información y
sacarle provecho. Porque para eso se estudia estadística.
11.
El asunto entonces es a quién se le va a
presentar la información, qué habilidades tiene para comprenderla, y qué
queremos hacerle ver (sin trampas). Hay opciones:
a.
Darle la lista de valores registrados, los
datos, tal cual los obtuvimos: 0, 2, 2, 1, 0, 3, 4, 1, 3, 4, 5, 2, 1, 3, 5, 3,
6, 3, 4, 5
b.
Darle la misma lista, pero ordenada: 0, 0, 1, 1,
1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6
c.
Construirle una tabla de frecuencias absolutas (cada valor con
el número de veces que apareció). f(q) se lee como “frecuencia con la que aparece el valor q”.
La frecuencia (número de veces) del valor q =1 es 3, por
ejemplo.
q
|
f(q)
|
0
|
2
|
1
|
3
|
2
|
3
|
3
|
5
|
4
|
3
|
5
|
3
|
6
|
1
|
La suma de todas las frecuencias debe ser igual al total de observaciones registradas.
En este caso N = 20 y verificamos: 2 + 3 + 3 + 5 + 3 + 3 + 1 = 20
La misma tabla se puede construir con frecuencias relativas, dividiendo la frecuencia de cada dato entre
el total de observaciones registradas (N = 20). En
el caso de las frecuencias relativas, en decimal, la suma debe ser 1. Si se da en porcentajes debe ser 100%. Y es muy importante verificarlo.
q
|
f(q) absoluta
|
f(q) relativa
|
0
|
2
|
2/20 = 0.10 = 10%
|
1
|
3
|
2/20 = 0.15 = 15%
|
2
|
3
|
3/20 = 0.15 = 15%
|
3
|
5
|
5/20 = 0.25 = 25%
|
4
|
3
|
3/20 = 0.15 = 15%
|
5
|
3
|
3/20 = 0.15 = 15%
|
6
|
1
|
1/20 = 0.05 = 5%
|
d.
Construirle un diagrama de barras a partir de
esa tabla:
e.
Construirle un diagrama de pay o pastel: