Mostrando entradas con la etiqueta discreto. Mostrar todas las entradas
Mostrando entradas con la etiqueta discreto. Mostrar todas las entradas

miércoles, 31 de mayo de 2017

Segunda sesión e intermedios: asesoría de estadística

Durante la primera sesión de trabajo surgieron detalles interesantes:
  • El estudiante no recordaba haber aprendido a trazar gráficos de ningún estilo
  • Desconoce o no recuerda el uso de variables; se sorprende de que en la calculadora que utiliza (de la que desconoce las funciones) aparezca la x en diversas teclas
  • Comenta que todo se puede convertir a número
Para los primeros dos casos simplemente hay que ir con cuidado, haciendo notar el sentido, el uso y sus reglas; en el último caso, proporcionar una serie de ejemplos en los que eso no es verdadero. 
En la segunda sesión supe el origen de esa afirmación: la maestra proporciona ejemplos de codificación y los datos cualitativos se convierten en números en el mismo momento. Pero también, y de manera explícita, dice que algunas variables cuantitativas, como la edad, se pueden tratar tanto como variable cuantitativa y como variable cualitativa; agrega que si se trata de la edad de un individuo entonces es cuantitativa pero cuando se agrupan las edades en clases, la variable pierde su naturaleza cuantitativa:


Entre la primera y la segunda sesión hice el resumen que compartí en la entrada anterior de este blog y el siguiente mapa mental simple (y de carrera)


El estudiante en realidad no ha tenido tiempo de resolver ni un solo ejercicio, de modo que llegamos a la segunda sesión en la que me muestra una serie de "materiales" que le entregaron sus compañeros para que se prepare: una guía de estudio y unas cuantas fotos de las diapositivas en Power Point que constituyeron la clase.

La guía incluye una especie de resumen de los temas tratados:

Y los ejercicios propuestos a partir de una tabla de datos codificados, que es lo que lleva a pensar al estudiante que todo se convierte a número y entonces puede calcularse cualquier cosa:

 

Algunas de las fotos compartidas. 
Las que siguen se refieren al concepto de variable estadística:

 


Y luego, al muestreo:

 







Ahí es a donde el estudiante quiere llegar, y le urge. Pretende brincar a las técnicas de muestreo, intervalos de confianza y pruebas de hipótesis, sin conocer siquiera lo básico.

Sin embargo, uno de los ejercicios propuestos en la especie de guía de estudio le pide hacer un histograma a partir de datos brutos. De hecho pareciera que debe hacerlo con cada una de las variables de la tabla que le fue proporcionada donde aparecen números (códigos) para la variable Sexo y Orientación en el plano, por ejemplo, y otros valores numéricos que no tenemos idea de qué representan exactamente pero que podrían ser puntuaciones en un examen de aptitudes. Ese ejercicio da pie para que continuemos con lo básico, apuntado ya en el diagrama anterior.

El resumen de la sesión se presenta en dos partes en los enlaces siguientes.

Al recibir los materiales, el joven me reenvió las fotografías anteriores porque, evidentemente, tiene prisa en terminar de "aprender" lo que requiere para su examen. Le reitero:

Digamos que esos temas están en el diagrama que te envié ayer por la mañana. pero el diseño de encuestas o cuestionarios es otra cosa y debería ser realizado por expertos en el área de interés (maestros, sociólogos, políticos, etc.) porque cada uno busca información específica respecto a un grupo de la sociedad o de la sociedad competa.
En el caso de la criminalística, lo que interesa observar son variables de ese tipo: delitos cometidos, por tipo, y su relación con otras variables como pueden ser: sexo, grado de escolaridad, consumo de drogas, religión, filiación partidista, tipo de música preferida, y un gran etcétera.
Y entonces lo que se busca es la correlación entre la variable que nos interesa con cada una de las otras.
Y entonces estamos ya en otro contexto.
Cuando relacionamos variables (varias, de dos en adelante), podemos hacerlo de manera muy simple (comparación de medias, o comparación de varianzas, por ejemplo) o podemos meternos a lo que es el Diseño y Análisis de Experimentos (ANOVA, cuadrados latinos, cuadrados grecolatinos, etc.).
Para eso necesitamos la probabilidad, y que las variables sean verdaderamente cuantitativas. Y asegurar que tienen una distribución normal. A partir de esas certitudes es que pueden llevarse a cabo esos análisis.
La correlación simple sí puede detectarse aún cuando las variables no sean cuantitativas.
Y está toda la estadística no paramétrica que, lamentablemente, no se estudia en las universidades.

Aquí no voy a emitir juicios sobre la exposición de la maestra ni los comentarios que intercambiamos al respecto. Cada uno puede juzgar a partir de lo expuesto.

Algo que alcanzamos a hacer en la segunda sesión, cuando el estudiante ya pedía que lo dejara en paz (la sesión es de dos horas), fue calcular la media para los datos agrupados. Que no resultara lo mismo que en el caso de datos brutos le provocó un gran conflicto. Para él significaba que nos habíamos equivocado al hacer los cálculos ("las matemáticas son exactas" dicen algunos, y luego se topan con esto que los desconcierta y desanima). Y por ahí recomenzaremos en la sesión de mañana.










miércoles, 24 de mayo de 2017

Inicio de una breve introducción a la estadística

Solamente doy asesorías a particulares en casos excepcionales, y éste es uno de ellos. Alguien que requiere de conocer los elementos de la estadística con apenas un par de semanas para aprenderlo. Lo bueno: la disposición. Trabajaremos un total de 10 horas, aproximadamente, partiendo de cero (absoluto). 
El día de ayer tuvimos la primera sesión de dos horas y lo que sigue es el resumen que hice yo esta mañana.

Primera sesión

1.       Hacemos observaciones todos los días, en diferentes lugares y por diferentes razones. Una observación realizada a propósito es un experimento. Por ejemplo, podemos decidir observar a las personas que salen de un elevador en un edificio público, ese sería un experimento.
2.       Lo que registramos al hacer la observación se llaman Variables. Por ejemplo, al observar a las personas que salen de un elevador en un edificio público podemos fijarnos en si son hombres o son mujeres (la variable es Sexo), o podemos observar si usan zapatos formales, tenis, chanclas, botas (la variable sería tipo de calzado), pero también podemos observar el número de personas que salen en cada vuelta (la variable sería número de personas), incluso podríamos preguntarles su religión (esa sería la variable) o su edad (y esa sería la variable).
3.       Algunas variables dan como resultado “cualidades” es decir, características no medibles con regla, pesas, etc. como en el caso de las variables Sexo, tipo de calzado, religión. Esas variables se dicen cualitativas.
4.       Otras variables dan como resultado números y se dicen cuantitativas. Es el caso de las variables número de personas, edad, tiempo, …
5.       Según la variable que nos interese, lo que vamos registrando tiene un cierto número de opciones. En el caso de Sexo (en documento oficiales, por ejemplo), las opciones son Hombre y Mujer (o Masculino y Femenino). Esos son los valores que puede tomar la variable Sexo. Si la variable es número de personas que salen del elevador que observamos, los valores que puede tomar son 0, 1, 2, 3, 4, 5, 6, 7 (de acuerdo con las normas).
6.       En el caso de las variables cuantitativas tenemos dos situaciones:
a.       Lo que registramos se puede contar como si fueran naranjas: años cumplidos, número de hijos en una familia, personas que salen de un elevador, veces que sale águila cuando tiramos cinco volados, frutos que da un árbol en una temporada. En estos casos las opciones van, generalmente, de 0 a algún número entero por muy grande que sea. Se llaman variables cuantitativas discretas.
b.       Lo que registramos puede tomar cualquier valor (entero, decimal, etc.) en un rango. Por ejemplo: tiempo que tarda en salir la gente de un elevador, medido en segundos (de 0 a 90, por ejemplo), y puede ser cualquier número, con decimales incluidos, en ese rango. O el tiempo que dura un foco sin fundirse medido en horas (de 0 a 250, por ejemplo). O el peso de un ser humano vivo, ya nacido, (de 0.200  a 220 kg, más o menos). En estos casos decimos que se trata de variables cuantitativas continuas.
7.       
       Las variables se representan con letras mayúsculas; los valores de las variables (para efectos de las fórmulas que seguirán) se representan con letras minúsculas.  Por ejemplo:
Variable
Símbolo
Valores
Sexo
X
Femenino, masculino
Número de personas que salen de un elevador
Q
0, 1, 2, 3, 4,5, 6,7
Si el número posibilidades es muy grande (por ejemplo, el número de personas que viajan en un vehículo público, como un camión urbano) puede no ser conveniente escribir todas las posibilidades y entonces se agrupan en rangos pequeños.
Peso de un ser humano vivo ya nacido, en kg
P
Aquí no es posible dar todos los valores que pueden observarse, porque el continuo es infinito. Se acostumbra trabajar por intervalos cortos, subdividiendo el rango para que “tenga sentido”

8.
       Una vez que tenemos el experimento formulado (incluyendo sus condiciones) y la variable que nos interesa bien definida, de manera que NADIE pueda malinterpretar lo que se pide observar, registramos de manera precisa cada una de las observaciones que hacemos. Cada uno de esos registros se llama un dato. 
9.       Por ejemplo: Estamos observando a las personas que salen del elevador del edificio público de la SEG, en Guanajuato, frente a la salida del elevador en la planta baja del edificio, entre las 8 y las 9 de la mañana (todo eso es la descripción del experimento y sus condiciones), y vamos a registrar el número de personas que descienden en ese piso (esta es la variable). Sabemos que los valores que puede tomar la variable, sus opciones, van de 0 a 7 por las limitantes de seguridad. Supongamos que en el tiempo que duró la observación hubo un total de 20 llegadas (número total de observaciones = N) y que registramos lo siguientes números: 0, 2, 2, 1, 0, 3, 4, 1, 3, 4, 5, 2, 1, 3, 5, 3, 6, 3, 4, 5 (estos son los datos recabados)
10.   Lo que sigue es presentar la información y sacarle provecho. Porque para eso se estudia estadística.
11.   El asunto entonces es a quién se le va a presentar la información, qué habilidades tiene para comprenderla, y qué queremos hacerle ver (sin trampas). Hay opciones:
a.       Darle la lista de valores registrados, los datos, tal cual los obtuvimos: 0, 2, 2, 1, 0, 3, 4, 1, 3, 4, 5, 2, 1, 3, 5, 3, 6, 3, 4, 5
b.       Darle la misma lista, pero ordenada: 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6
c.       Construirle una tabla de frecuencias absolutas (cada valor con el número de veces que apareció). f(q) se lee como “frecuencia con la que aparece el valor q”.
                        La frecuencia (número de veces) del valor q =1 es 3, por ejemplo.

q
f(q)
0
2
1
3
2
3
3
5
4
3
5
3
6
1
                        
La suma de todas las frecuencias debe ser igual al total de observaciones registradas.
                        En este caso N = 20 y verificamos:   2 + 3 + 3 + 5 + 3 + 3 + 1 = 20

La misma tabla se puede construir con frecuencias relativas, dividiendo la frecuencia de cada dato entre el total de observaciones registradas (N = 20). En el caso de las frecuencias relativas, en decimal, la suma debe ser 1. Si se da en porcentajes debe ser 100%. Y es muy importante verificarlo.

q
f(q) absoluta
f(q) relativa
0
2
2/20 = 0.10 = 10%
1
3
2/20 = 0.15 = 15%
2
3
3/20 = 0.15 = 15%
3
5
5/20 = 0.25 = 25%
4
3
3/20 = 0.15 = 15%
5
3
3/20 = 0.15 = 15%
6
1
1/20 = 0.05 = 5%

d.       Construirle un diagrama de barras a partir de esa tabla:


e.       Construirle un diagrama de pay o pastel: