An empirical analysis of homicides in Mexico through Machine Learning and statistical design of experiments

Abstract
Homicide is one of the most important mortality causes that has reduced the Mexican life expectancy. That is why the aim of this work is to identify some sociodemographic and economic factors that can help explain homicides in Mexico and measure their impact, assuming the current conditions prevail. To do that, several Machine Learning (ML) methods were evaluated. The C5.0 model is best suited for the data at hand. After fine-tuning the algorithm, we used the estimated model to identify the main factors that explain homicides. Among these factors, eleven were selected that can be influenced by direct changes in domestic public policy, laws and/or regulations. These were used as input in a two-level fractional factorial Statistical Design of Experiments (DOE) to estimate their main effects and possible interactions. Although several of these factors had statistically significant effects on homicide rate, the one that had the biggest and direct impact from a practical perspective, was the Rule of Law Index (RLI). In fact, if we assumed that all states had the median RLI of 0.37, implementing domestic policies and procedures to move them all to the best RLI level could significantly reduce homicide rates. El homicidio es una de las principales causas de muerte que ha reducido la esperanza de vida de los mexicanos. El objetivo de este trabajo es identificar algunos factores sociodemográficos y económicos que puedan ayudar a explicar homicidios en México y medir su impacto, suponiendo que las condiciones actuales permanecen. Para lograrlo, comparamos diferentes métodos de Aprendizaje de Máquina (AM). Para tal fin, se encuentra que el modelo C5.0 es el más adecuado. Después de hacer una calibración final del modelo, lo utilizamos para determinar los veinticinco principales factores que explican el fenómeno de homicidios. Se seleccionan 11 factores que se consideran pueden ser influenciados directamente por cambios en políticas públicas, leyes y/o regulaciones. Estos predictores fueron utilizados como entrada en un diseño de experimentos factorial fraccionado con dos niveles para estimar los principales efectos principales e interacciones posibles. A pesar de que varios de estos factores tuvieron impactos estadísticamente significativos, el que mostró tener el mayor impacto directo desde una perspectiva práctica fue el Índice de Estado de Derecho (IED). De hecho, asumiendo que todos los estados tuvieran el valor de IED de 0.37, correspondiente a la mediana en todo el país, si se implementaran políticas y procedimientos para ubicar a todos los estados al nivel del mejor estado en términos de IED, se lograría una reducción altamente significativa en la incidencia de homicidios en México.