Future City Lab: estadísticas del vecindario

Estadísticas Chi-Cuadradas

Interdisciplinario

Palabras clave: hipótesis nula, sesgo, significación estadística, chi cuadrado, valor p, ciencias sociales
Miniatura
Fuente: www.flickr.com/franciscodaum

Objetivos

Serán estudiantes

  • Derivar y utilizar pruebas de chi-cuadrado  

  • Explicar el uso de esta prueba en el contexto de la demografía de la ciudad de Nueva York. 

  • Compare y contraste las ciencias sociales con la llamada "ciencia dura" 

  • Considere hasta qué punto las estadísticas son útiles en el estudio de los seres humanos. 

Materiales

  • Una bolsa de 30 cuentas (o bolos) por pareja de estudiantes. Debe haber cinco colores diferentes. 

  • Folletos (dos folletos de actividades estudiantiles, una hoja de datos y una clave del maestro)

  • Calculadoras 

Normas: 

  • CCSS.ELA-ALFABETIZACIÓN.RST.9-10.7: Traducir información cuantitativa o técnica expresada en palabras en un texto en forma visual (por ejemplo, una tabla o gráfico) y traducir información expresada visual o matemáticamente (por ejemplo, en una ecuación) en palabras. 

  • CCSS.MATEMÁTICAS.CONTENIDO.HSS.MD.A.4: Desarrollar una distribución de probabilidad para una variable aleatoria definida para un espacio muestral en el que las probabilidades se asignan empíricamente; encuentre el valor esperado.  

Preguntas orientadoras

  1. ¿Cómo puede probar si un grupo se distribuye al azar? 

  2. ¿Cuáles son las principales diferencias entre las “ciencias duras” y las “ciencias sociales” y cuáles son las limitaciones de datos en cada una? 

  3. ¿Cómo podemos utilizar las estadísticas de hoy para ayudarnos a comprender el pasado? 

    Procedimientos

    Las tablas de chi cuadrado son herramientas para ayudar a los científicos a comprender si los datos son significativamente diferentes de un resultado aleatorio; en otras palabras, si hay algún factor externo en juego que deba explicarse. A menudo se ilustran en el aula utilizando objetos inanimados o actores no humanos (cuentas, resultados genéticos). Esta lección considera si los métodos estadísticos como los chi-cuadrados pueden ser útiles para evaluar el comportamiento humano y si podría ser una herramienta a considerar en el aula de historia. Aquí puede encontrar un tutorial útil para el maestro de aula que no es de ciencias: http://www.ling.upenn.edu/~clight/chisquared.htm . 

    En la primera parte de la lección, los estudiantes obtienen valores de chi-cuadrado probando la distribución de cuentas. Luego, a los estudiantes se les presenta un problema más difícil: ¿Están los diferentes grupos étnicos en Nueva York distribuidos al azar? Los estudiantes pueden determinar esto usando calculadoras. (Todos los vecindarios de la ciudad de Nueva York que se les darán tienen valores de chi-cuadrado significativamente altos). Luego, el maestro guiará a los estudiantes a través de una discusión sobre si estos tipos de herramientas pueden ser significativas para analizar el comportamiento humano, y una discusión sobre el diferencias entre las ciencias sociales y la "ciencia dura" en general. Finalmente, la lección termina con una discusión sobre si estas herramientas son útiles para analizar la historia y apunta hacia recursos que exploran los factores históricos que influyen en por qué las personas en la ciudad de Nueva York se agrupan de manera no aleatoria. 

    Descargue la hoja de trabajo de actividad de cuentas de Neighborhood Stats

    Descargue el folleto demográfico de Neighborhood Stats

    Descargar la tabla de datos de estadísticas de vecindario

    Descargue la clave de profesor de Neighborhood Stats

  1. Gancho
  2. Haga una afirmación extravagante para los estudiantes, algo como "Las personas que usan camisas con botones pueden saltar más alto que las que usan camisetas". Encuentre un estudiante que no esté de acuerdo con usted. Pregunte a la clase: ¿Quién tiene la carga de la prueba? ¿Cuál deberíamos asumir sin evidencia? ¿Por qué? Haga que los estudiantes compartan sus respuestas. 

    Explique que el objetivo de todos los experimentos es probar el hipótesis nula. Las hipótesis son explicaciones comprobables de los fenómenos. La hipótesis nula es la hipótesis que explica cualquier diferencia como resultado de la aleatoriedad / azar. Hasta que no se descubra evidencia suficiente, no podemos adoptar hipótesis nuevas (alternativas).  

    La hipótesis alternativa específica que propuso el profesor (Halt) fue: Las diferencias entre las alturas de salto de las personas se pueden predecir por el tipo de camisa que usan. 

    La hipótesis nula (H0) para el ejemplo de la camiseta sería: Las diferencias entre las alturas de salto de las personas no están relacionadas con la camiseta que visten. 

    ¿Cómo podemos averiguar cuál es la correcta? Aquí es donde entra el análisis de chi-cuadrado. 

  3. Práctica
  4. Explique a los alumnos que ha llenado cada bolsa con 30 cuentas de cinco colores diferentes. Su trabajo es determinar si lo hizo al azar o con un sesgo. Verifique a los estudiantes: ¿Qué explicación es la hipótesis nula? (Respuesta: la hipótesis nula es que se distribuyeron al azar, sin sesgos). 

    Pregunte: si la hipótesis nula (sin sesgo) es cierta, ¿cuál esperaría que fuera la distribución de las cuentas? (Respuesta: esperaría que con 30 cuentas y 5 colores hubiera 6 de cada uno).  

    ¿Cómo podría un científico / estadístico determinar qué tan lejos están los números reales (observados) de lo esperado? Permita que los estudiantes tengan una lluvia de ideas para posibles soluciones matemáticas. Deben ser capaces de llegar a la resta como la forma de medir la diferencia. 

    La ecuación para chi-cuadrado es: 

    x2 = [SUMA] (o - e)/ e

    o = observado (esto sería cuántos de cada categoría hay realmente) 

    e = esperado (esta es la cantidad predicha por azar) 

    La diferencia representa qué tan lejos está cada valor de la predicción de H0

    Las diferencias son al cuadrado para eliminar números negativos. Luego se dividen por el valor esperado. Esto es como tomar un promedio. 

    Los valores resultantes se suman todos (denotados por la suma, o sigma en el folleto). Cuanto mayores sean las diferencias, mayor será el valor de chi-cuadrado. Tenga en cuenta que aquí no se tiene en cuenta el tamaño de la muestra, por lo que una muestra más grande en general significará un valor mayor de chi cuadrado. 

    Explicar: Chi-cuadrado es un valor que mide qué tan lejos está lo observado de lo esperado. Si está lo suficientemente lejos, podemos rechazar la hipótesis nula. En otras palabras, podemos decir en este caso que usted, el maestro, no actuó al azar. En cambio, por alguna razón, seleccionó qué cuentas regalar a cada grupo y, por lo tanto, actuó con parcialidad. Naturalmente, esta prueba no puede determinar de dónde proviene este sesgo. Pida a los estudiantes que propongan sus propias hipótesis alternativas. Los ejemplos pueden incluir: 

    1.) El maestro prefiere usar una cuenta de cierto color sobre otras cuentas de color. 

    2.) La elección del maestro fue aleatoria, pero la fuente original de cuentas no tenía el mismo número de cada color.  

    Haga que los estudiantes sigan las instrucciones del folleto para probar su propio bolso. Tendrá que calcular los grados de libertad (número de colores - 1) y aprender a utilizar la tabla de valores p. Todas las tablas y gráficos se proporcionan en la hoja de trabajo.  

  5. Resumen
  6. Los estudiantes comparten los resultados como grupo, toman decisiones grupales sobre si hubo un sesgo en la distribución de cuentas. 

  7. Aplicá
  8. A los estudiantes se les presentan datos demográficos reales de los vecindarios de la ciudad de Nueva York del Departamento de Educación. La primera tarea es determinar cuál es la hipótesis nula: si el censo de EE. UU. Nos dice que el 29% de los neoyorquinos se identifican como hispanos, ¿qué indicaría la hipótesis nula sobre la población de personas en un vecindario determinado de la ciudad? (Respuesta: esperaríamos que el 29% de las personas en cada vecindario sean de origen hispano). 

    Los estudiantes eligen un vecindario del folleto de datos provisto para probar. Dado que chi-cuadrado solo funciona bien con tamaños de muestra más pequeños, no deberían usar los datos sin procesar. Pueden usar los porcentajes como muestra, como si cada barrio tuviera sólo 100 personas. Este trabajo se puede hacer en el folleto con calculadoras. 

  9. Analiza los datos
  10. Pida a los alumnos que compartan sus resultados. ¿Por qué todos los vecindarios tenían un valor de chi cuadrado significativo? ¿Qué significa eso, estadísticamente? (Cada vecindario tiene un valor de chi-cuadrado significativo. Eso significa que podemos rechazar la hipótesis nula de que las personas se distribuyen al azar). 

    Reforzarse: los datos muestran que las poblaciones no están distribuidas al azar en estos vecindarios de la ciudad de Nueva York, pero los datos tampoco pueden decirnos por qué. El análisis de Chi-cuadrado simplemente nos permite saber que hay algún sesgo en juego y que la diferencia entre los resultados reales y los resultados esperados es estadísticamente significativa. En este escenario, determinar porque este podría ser el caso en el ámbito tradicional de las ciencias sociales, no de la estadística. 

  11. Discusión: la naturaleza de las ciencias sociales
  12. Use estas preguntas para guiar una discusión en profundidad y / o actividad de escritura sobre las posibles aplicaciones de las habilidades que los estudiantes acaban de aprender. 

    Explique a los estudiantes que los chi-cuadrados se usan tradicionalmente con poblaciones que no ejercen la elección (como en el caso de las cuentas o bolos en la primera actividad). El análisis del comportamiento humano ha sido generalmente el ámbito de las llamadas "ciencias sociales" (por ejemplo, psicología, economía, sociología, ciencias políticas e historia).  

    Solicite la ayuda confidencial de: ¿Qué tienen en común las “ciencias duras” y las “ciencias sociales”?  

    Solicite la ayuda confidencial de: ¿Qué desafíos son exclusivos de las ciencias sociales? ¿Por qué es más difícil sacar conclusiones de un estudio de humanos que una de plantas o incluso animales modelo como ratones? ¿Es útil cuantificar el comportamiento humano? ¿Qué uso potencial tienen los datos demográficos? ¿Cuáles son las limitaciones de los estudios estadísticos como este? 

    Solicite la ayuda confidencial de: ¿Por qué tiene sentido que podamos rechazar la hipótesis nula en todos los barrios que analizamos? (Espere respuestas en la línea de: las personas eligen dónde viven o las personas están limitadas por lo que pueden pagar.)  

    Sobre el tema de las elecciones de los inmigrantes: ¿Por qué los grupos de personas podrían elegir vivir cerca unos de otros? 

    Sobre el tema de otros factores externos: ¿Qué otros factores podrían limitar la elección de los inmigrantes en términos de dónde pueden vivir? 

  13. Discusión: Introducción a los factores históricos.
  14. A lo largo de la historia de la ciudad de Nueva York, ciertos grupos de personas han sido forzados u obligados a vivir en ciertas áreas, o, al menos, se les ha impedido vivir en las partes más "deseables" de la ciudad. A mediados del siglo XX, redlining - en el que a los afroamericanos se les negaron las hipotecas dentro de los barrios tradicionalmente negros - impidió que muchos afroamericanos fueran dueños de viviendas (y por lo tanto se unieran a la clase media), y ayudó a concentrar a los afroamericanos en ciertas secciones de la ciudad. Por otro lado, muchos afroamericanos se mudaron a barrios tradicionalmente negros como Harlem, que sirvió como un espacio seguro en medio de la violencia de Jim Crow America y permitió la libertad de creación, pensamiento y expresión que fomentó el Renacimiento de Harlem.  

    Con el empuje y tracción de la historia en juego y los múltiples factores y contextos históricos que informan las elecciones (o la falta de elección) de los actores humanos, ¿podemos utilizar el análisis estadístico como una herramienta significativa en la historia? Si estuviera escribiendo un artículo de historia, ¿consideraría incluir un análisis de chi cuadrado para respaldar su argumento? 

Recursos adicionales 

Use este sitio web para enseñar sobre la historia de la línea roja: cómo las políticas de la década de 1940 resultaron en una segregación de facto en las ciudades: https://dsl.richmond.edu/panorama/redlining/ 

Para una historia completa de la línea roja, vea Richard Rothstein's El color de la ley: una historia olvidada de cómo nuestro gobierno segregó a América (Liveright, 2017). 

Excursiones: este contenido está inspirado en Ciudad mundial, 1898-2012 y Laboratorio de la ciudad del futuro galerías en la exhibición emblemática del museo, Nueva York en su núcleo. Si es posible, considere llevar a sus estudiantes a una excursión. Visitar http://mcny.org/education/field-trips para obtener más información. 

Agradecimientos

Esta serie de planes de lecciones para Nueva York en su núcleo fue desarrollado en conjunto con un grupo de enfoque de maestros de escuelas públicas de la ciudad de Nueva York: Joy Canning, Max Chomet, Vassili Frantzis, JoAnn Gensert Ph.D., Jessica Lam, Patty Ng y Patricia Schultz.

Este proyecto fue posible en parte por el Instituto de Servicios de Museos y Bibliotecas.

Los puntos de vista, hallazgos, conclusiones o recomendaciones expresados ​​en estas lecciones no representan necesariamente los del Instituto de Servicios de Museos y Bibliotecas.