miércoles, 31 de mayo de 2017

Segunda sesión e intermedios: asesoría de estadística

Durante la primera sesión de trabajo surgieron detalles interesantes:
  • El estudiante no recordaba haber aprendido a trazar gráficos de ningún estilo
  • Desconoce o no recuerda el uso de variables; se sorprende de que en la calculadora que utiliza (de la que desconoce las funciones) aparezca la x en diversas teclas
  • Comenta que todo se puede convertir a número
Para los primeros dos casos simplemente hay que ir con cuidado, haciendo notar el sentido, el uso y sus reglas; en el último caso, proporcionar una serie de ejemplos en los que eso no es verdadero. 
En la segunda sesión supe el origen de esa afirmación: la maestra proporciona ejemplos de codificación y los datos cualitativos se convierten en números en el mismo momento. Pero también, y de manera explícita, dice que algunas variables cuantitativas, como la edad, se pueden tratar tanto como variable cuantitativa y como variable cualitativa; agrega que si se trata de la edad de un individuo entonces es cuantitativa pero cuando se agrupan las edades en clases, la variable pierde su naturaleza cuantitativa:


Entre la primera y la segunda sesión hice el resumen que compartí en la entrada anterior de este blog y el siguiente mapa mental simple (y de carrera)


El estudiante en realidad no ha tenido tiempo de resolver ni un solo ejercicio, de modo que llegamos a la segunda sesión en la que me muestra una serie de "materiales" que le entregaron sus compañeros para que se prepare: una guía de estudio y unas cuantas fotos de las diapositivas en Power Point que constituyeron la clase.

La guía incluye una especie de resumen de los temas tratados:

Y los ejercicios propuestos a partir de una tabla de datos codificados, que es lo que lleva a pensar al estudiante que todo se convierte a número y entonces puede calcularse cualquier cosa:

 

Algunas de las fotos compartidas. 
Las que siguen se refieren al concepto de variable estadística:

 


Y luego, al muestreo:

 







Ahí es a donde el estudiante quiere llegar, y le urge. Pretende brincar a las técnicas de muestreo, intervalos de confianza y pruebas de hipótesis, sin conocer siquiera lo básico.

Sin embargo, uno de los ejercicios propuestos en la especie de guía de estudio le pide hacer un histograma a partir de datos brutos. De hecho pareciera que debe hacerlo con cada una de las variables de la tabla que le fue proporcionada donde aparecen números (códigos) para la variable Sexo y Orientación en el plano, por ejemplo, y otros valores numéricos que no tenemos idea de qué representan exactamente pero que podrían ser puntuaciones en un examen de aptitudes. Ese ejercicio da pie para que continuemos con lo básico, apuntado ya en el diagrama anterior.

El resumen de la sesión se presenta en dos partes en los enlaces siguientes.

Al recibir los materiales, el joven me reenvió las fotografías anteriores porque, evidentemente, tiene prisa en terminar de "aprender" lo que requiere para su examen. Le reitero:

Digamos que esos temas están en el diagrama que te envié ayer por la mañana. pero el diseño de encuestas o cuestionarios es otra cosa y debería ser realizado por expertos en el área de interés (maestros, sociólogos, políticos, etc.) porque cada uno busca información específica respecto a un grupo de la sociedad o de la sociedad competa.
En el caso de la criminalística, lo que interesa observar son variables de ese tipo: delitos cometidos, por tipo, y su relación con otras variables como pueden ser: sexo, grado de escolaridad, consumo de drogas, religión, filiación partidista, tipo de música preferida, y un gran etcétera.
Y entonces lo que se busca es la correlación entre la variable que nos interesa con cada una de las otras.
Y entonces estamos ya en otro contexto.
Cuando relacionamos variables (varias, de dos en adelante), podemos hacerlo de manera muy simple (comparación de medias, o comparación de varianzas, por ejemplo) o podemos meternos a lo que es el Diseño y Análisis de Experimentos (ANOVA, cuadrados latinos, cuadrados grecolatinos, etc.).
Para eso necesitamos la probabilidad, y que las variables sean verdaderamente cuantitativas. Y asegurar que tienen una distribución normal. A partir de esas certitudes es que pueden llevarse a cabo esos análisis.
La correlación simple sí puede detectarse aún cuando las variables no sean cuantitativas.
Y está toda la estadística no paramétrica que, lamentablemente, no se estudia en las universidades.

Aquí no voy a emitir juicios sobre la exposición de la maestra ni los comentarios que intercambiamos al respecto. Cada uno puede juzgar a partir de lo expuesto.

Algo que alcanzamos a hacer en la segunda sesión, cuando el estudiante ya pedía que lo dejara en paz (la sesión es de dos horas), fue calcular la media para los datos agrupados. Que no resultara lo mismo que en el caso de datos brutos le provocó un gran conflicto. Para él significaba que nos habíamos equivocado al hacer los cálculos ("las matemáticas son exactas" dicen algunos, y luego se topan con esto que los desconcierta y desanima). Y por ahí recomenzaremos en la sesión de mañana.










No hay comentarios:

Publicar un comentario