Update: Inicialmente mis cálculos no consideraban el factor de ponderación que usa el INEGI. Los números han sido actualizados para reflejarlo.

Yo crecí en México en lo que consideré la clase media, pero después viví en E.U.A y en Europa, por lo que tal vez mi concepción de las diferentes clases dejó de estar apegada a la realidad. Yo pensaba que un salario mensual de $20,000 (una cantidad módica en países del primer mundo) se consideraría clase media, y cuando una persona me dijo que el salario promedio era $8,000 no lo creí, y así comenzó la tarea de buscar los salarios de las diferentes clases en México que resultó no ser tan fácil como parecía.

ENIGH

El INEGI realizó una encuesta (Encuesta Nacional de Ingresos y Gastos de los Hogares) que supuestamente contiene estos datos, sin embargo, estos son los resultados:

I $1,674 II $3,033 III $3,977 IV $4,900 V $5,959 VI $7,183 VII $8,800 VIII $11,313 IX $16,012 X $42,120 * Trimestral.

En teoría ahí está toda la información y la tarea está hecha, sin embargo hay un problema al tratar de entender estos números. La tabla se titula “ingreso corriente total promedio trimestral per cápita en deciles de personas”. Ahí vemos los diez grupos, pero un decil se define como: “cualquiera de los nueve valores que dividen los datos ordenados en diez partes iguales”; nueve valores, y en la tabla hay diez, esos números no son deciles.

Básicamente, la tabla es completamente inútil. Si una persona gana $10,000 trimestrales, ¿Está en el grupo VII o VIII? El número que necesitamos para saber eso no está en esta tabla.

A mano

Afortunadamente el INEGI provee los datos originales, y gracias a mis habilidades de programación pude hacer las manipulaciones necesarias para sacar los datos de interés. Desafortunadamente en el proceso noté discrepancias en las tablas del INEGI, así que tuve que hacer los cálculos por mi cuenta.

10% $835 20% $1,180 30% $1,478 40% $1,798 50% $2,182 60% $2,632 70% $3,306 80% $4,315 90% $6,753

Estos números sí son deciles, y es fácil saber a qué grupo perteneces. Si tu ingreso mensual es de $3,000 pesos (y no tienes familia), eso significa que ganas más que el 70% de la población (grupo VII). Curiosamente es fácil ver la media (50%), que es $2,182, es decir: 50% de la población gana menos de $2,182, 50% gana más.

De forma similar podemos dividir la población en tres grupos:

baja menos de $1,579 media de $1,579 a $3,033 alta más de $3,033

Parece difícil de creer, pero estos números se pueden comprobar fácilmente. El tamaño de la muestra del INEGI son 19479 personas, con un filtro para ver cuántas personas ganan más de $3,033, el resultado es 8040 (41.28%), sin embargo al usar el factor de expansión el resultado es 33.32% (una tercera parte).

Cabe mencionar que los números son per cápita. Es decir, si ganas $8,000 pesos y mantienes a una familia de 4, cada persona se considera que percibe un ingreso de $2,000 pesos. Más detalles abajo.

Los números para la clase súper rica son:

91% $7,156 92% $7,663 93% $8,325 94% $9,130 95% $10,065 96% $11,516 97% $13,159 98% $16,475 99% $22,763

Promedios

Los promedios pintan un panorama muy diferente. Por ejemplo; la clase alta es más de $3,033, sin embargo hay mucha diferencia entre un ingreso de $4,000 y $400,000 pesos, y ambos están en el mismo grupo. Al promediar a toda la gente de éste grupo, el resultado cambia mucho. El promedio de la clase alta (top %33) es de $7,262, el promedio del top 90% es de $14,040, y el promedio del top %1 es de $42,910.

Por eso son peligrosos los promedios. A pesar de que el promedio de todo el país es de $3,499, el promedio del bottom 99% es de $3,101, pero al juntarlo con el top %1 de $42,911 se eleva a $3,499 (3101 * 0.99 + 42910 * 0.01).

Ingresos por trabajo

Hay muchos detalles de estos números, pero en general es el ingreso de todo el hogar: salarios, utilidades, rentas, transferencias, y estimado de alquiler, dividido por el número de integrantes.

Si tomamos en cuenta sólo el ingreso por trabajo de las personas ocupadas, el resultado es más prometedor.

10% $782 20% $1,545 30% $2,201 40% $2,872 50% $3,563 60% $4,303 70% $5,324 80% $7,008 90% $10,492

En tres grupos:

33% $2,413 66% $4,937

Y el top 10%:

91% $11,041 92% $11,848 93% $12,739 94% $13,960 95% $15,473 96% $16,988 97% $19,565 98% $24,508 99% $32,983

Desigualdad

Existe un número que se usa para medir la desigualdad de forma rápida, el coeficiente Gini. Aunque no es perfecto, es el más utilizado, y no deja de ser útil. Una sociedad perfectamente igual tendría un valor de 0%, mientras que una totalmente desigual 100%. Alemania, un país con mucha igualdad social tiene un valor de 27%, Estados Unidos, conocido por su desigualdad, 45%. Según el INEGI México tiene un valor de 48%, pero según mis cálculos el valor es 49.70%. La diferencia se debe a que el INEGI usa sus promedios por decil (10 datos), mientras que yo uso todos los registros (19479 datos), por lo que mi cálculo es más preciso.

Probablemente la forma más fácil de visualizar la increíble desigualdad que hay es graficando todos los ingresos de la muestra:

Errores del INEGI

Ya mencioné el hecho de que para empezar su tabla de deciles no contiene deciles, contiene promedios de los diversos grupos, que como ya vimos los promedios son peligrosos por que pueden pintar las cosas más positivas de lo que son.

Además hay discrepancias muy curiosas. La misma tabla de ‘ingresos’ está en un formato “tradicional” y de “nueva construcción”.

folioviv foliohg numren clave ing_5 0860298316 1 01 P043 8000 0860298316 1 01 P071 8237

folioviv foliohg numren clave ing_5 0860298316 1 01 P043 8000 0860298316 1 01 P071 58237

Aquí vemos dos ingresos de una persona; P043 es un beneficio de PROCAMPO, P071 es la clave de negocios agrícolas. En una tabla dice que sacó $8,237 de negocios agrícolas, y en la otra $58,237. Parece ser un error de dedo (que cambia las cantidades drásticamente), pero por qué no comparan sus propias tablas?

Como éste tipo de errores parece haber muchos. Por ejemplo en la documentación de la variable ‘ing_cor’:

inc_cor: ingreso corriente

La suma de ing_cor y percep_tot

Eh? Para sacar ‘ing_cor’ necesito ‘ing_cor’?

Otro ejemplo son registros marcados como “indemnizaciones” (P034), que no parecen usarlos en ningún lado.

Todo indica que al INEGI le hace falta revisar su propia información.

Mapa de la muestra

Update: Mucha gente preguntó que de dónde sacaron las encuestas, aquí hay un mapa para visualizarlo. Por alguna extraña razón en el centro de Tabasco es donde tomaron más información. Se ve muy evidente que a el norte no le prestaron mucha atención.

Conclusión

No queda más que aceptar que estamos mucho peor de lo que pensaba, no solo en cuestión de salarios, pero desigualdad, e incluso disponibilidad de la información. Si el organismo dedicado a proveer datos estadísticos no sabe ni lo que es un decil, realmente no se puede esperar mucho del futuro.

Nota: Estos números son confiables sólo si la muestra del INEGI es realmente aleatoria. Dado que ya detecté muchos errores en sus tablas, es posible que la muestra del INEGI también deje que desear. Desafortunadamente no hay mejores datos, así que hasta donde yo sé, estos son los números más confiables.

Método

Cualquier persona puede verificar los datos si le interesa. Todo el código se encuentra en GitHub, yo utilicé Linux, pero es posible correr Ruby en Windows también.