Índices de varianza
La variación es la diferencia en los valores individuales de la característica en las unidades de la población estudiada. El estudio de la variación es de gran importancia práctica y es un vínculo necesario en el análisis económico. La necesidad de estudiar la variación está relacionada con el hecho de que el promedio cumple su tarea principal con diversos grados de precisión: cuanto menores son las diferencias en los valores individuales del atributo sujeto a promediar, más uniforme es la población y, en consecuencia, más exacto y confiable es el promedio, y viceversa. En consecuencia, por el grado de variación, es posible juzgar los límites de la variación del rasgo, la homogeneidad del agregado para una característica dada, la tipicidad del promedio, la interrelación de los factores que determinan la variación.
La variación en la variación del rasgo en el agregado se logra con la ayuda de absoluto y relativo indicadores.
Los indicadores de variación absoluta incluyen:
- rango de variación
- desviación lineal media
- varianza
- media desviación cuadrada
El rango de variación (R)
El rango de variación es la diferencia entre los valores máximo y mínimo de la característica
Muestra los límites en los que varía la magnitud del atributo en la población estudiada.
Ejemplo: La experiencia laboral de cinco solicitantes en el trabajo anterior es: 2,3,4,7 y 9 años.
La solución: el rango de variación = 9 - 2 = 7 años.
Para la característica generalizada de las diferencias en los valores de la característica, los índices de variación promedio se calculan teniendo en cuenta las desviaciones de la media aritmética. Para la desviación del promedio, la diferencia
En este caso, para evitar la conversión a cero de la suma de desviaciones de las variantes de la característica de la media (propiedad cero de la media), se deben ignorar los signos de desviación, es decir, tomar esta suma módulo
Desviación media lineal y cuadrática
Desviación lineal media
Es la media aritmética de las desviaciones absolutas de los valores individuales de la característica de la media.
La desviación lineal promedio es simple:
La experiencia laboral de cinco solicitantes en el trabajo anterior es: 2,3,4,7 y 9 años.
En nuestro ejemplo:
Respuesta: 2,4 años.
La desviación lineal promedio ponderada se aplica a los datos agrupados:
La desviación lineal promedio debido a su convencionalidad se utiliza en la práctica con relativa poca frecuencia (en particular, para caracterizar el desempeño de las obligaciones contractuales para la uniformidad del suministro, en el análisis de la calidad del producto, teniendo en cuenta las características tecnológicas de la producción).
Desviación media del cuadrado
La característica más perfecta de la variación es la respuesta cuadrada media, que se llama estándar (o desviación estándar). Desviación cuadrática media (
La desviación media del cuadrado es simple:
La desviación estándar del peso se aplica a los datos agrupados:
Entre las desviaciones lineales medias y medias en condiciones normales de distribución, se cumple la siguiente relación:
La desviación cuadrática media, que es la principal medida absoluta de variación, se usa para determinar las ordenadas de la curva de distribución normal, en cálculos relacionados con la organización de observación selectiva y el establecimiento de la precisión de las características de muestreo, y también cuando se estiman los límites de variación del rasgo en una población homogénea.
Dispersión
Dispersión
En nuestro ejemplo:
Es más conveniente calcular la varianza por la fórmula:
que se obtiene de la principal por transformaciones simples. En este caso, la desviación cuadrática media es igual al promedio de los cuadrados de los valores de la característica menos el cuadrado de la media.
Para datos descargados:
Para datos agrupados:
La variación de la característica alternativa consiste en la presencia o ausencia de la propiedad estudiada en las unidades del agregado. Cuantitativamente, la variación de la característica alternativa se expresa mediante dos valores: la unidad de la propiedad que se estudia se denota por unidad (1) y su ausencia por cero (0). La fracción de unidades que posee la característica que se estudia se denota mediante la letra
media desviación cuadrada
Por lo tanto, la varianza de una característica alternativa es igual al producto de la fracción de unidades que posee esta propiedad (
El valor máximo de la desviación media cuadrática (varianza) se toma en caso de igualdad de acciones, es decir cuando
Entonces, si en un lote manufacturado de 3% de productos resultó ser no estándar, entonces la varianza de la proporción de productos no estándar
Desviación media del cuadrado
Indicadores relativos de variación
Los indicadores relativos de variación incluyen:
- Coeficiente de oscilación
- Desviación lineal relativa (coeficiente de variación lineal)
- Coeficiente de variación (desviación relativa)
La comparación de la variación de varias poblaciones en el mismo rasgo, y aún más en diferentes motivos usando indicadores absolutos, no es posible. En estos casos, las diferencias relativas en la variación se construyen para comparar el grado de diferencia . Se calculan como la relación entre los índices absolutos de variación y la media:
Coeficiente de oscilación | |
Desviación lineal relativa | |
Coeficiente de variación |
Se calculan otras características relativas. Por ejemplo, para estimar la variación en el caso de una distribución asimétrica, la relación entre la desviación lineal media y la mediana
porque gracias a la propiedad de la mediana, la suma de las desviaciones absolutas del signo de su valor es siempre menor que la de cualquier otra.
Como una medida relativa de dispersión, estimando la variación de la parte central de la población, la desviación cuartil relativa
En la práctica, el coeficiente de variación se calcula con mayor frecuencia. El límite inferior de este indicador es cero, no tiene un límite superior, pero se sabe que al aumentar la variación del signo, su valor también aumenta. El coeficiente de variación es en cierto sentido un criterio para la homogeneidad de la población (en el caso de una distribución normal).
Calcule el coeficiente de variación basado en la desviación estándar para el siguiente ejemplo. El consumo de materias primas por unidad de producción fue (kg): una tecnología
En la etapa de selección de candidatos para participar en la implementación de un proyecto complejo, la empresa anunció una competencia de profesionales. La distribución de los solicitantes de acuerdo con la experiencia laboral mostró los siguientes resultados:
Calcule la experiencia de producción promedio, años
Calcule la varianza por duración de la experiencia laboral
El mismo resultado se obtiene si utilizamos otra fórmula para calcular la varianza
Calcule la desviación estándar, años:
Definir el coeficiente de variación,%:
Regla de adición de varianzas
Para evaluar la influencia de los factores que determinan la variación, se utiliza el método de agrupamiento: el agregado se divide en grupos, seleccionando uno de los factores determinantes como el atributo de agrupamiento. Luego, junto con la varianza total calculada en toda la población, se calcula la varianza intragrupo (o la media de la varianza grupal) y la varianza intergrupal (o la varianza de los promedios grupales).
La varianza total
Dispersión intergrupal
- promedio grupal - número de unidades del i- ésimo grupo
La varianza intragrupal estima la variación del rasgo, que se forma por la influencia de otros factores no registrados en este estudio e independientes del factor de agrupamiento. Se define como la media de las variaciones del grupo.
Dispersión del grupo i-th.
Las tres varianzas (
esta relación se usa para construir indicadores que evalúan el efecto del atributo de agrupamiento en la formación de una variación general. Estos incluyen el coeficiente de determinación empírica (
Coeficiente empírico de determinación (
y muestra cuánto se debe la variación del rasgo en el agregado al factor factoring.
La relación de correlación empírica (!! \ eta = \ sqrt {\ frac {\ delta ^ 2} {\ sigma ^ 2}}
estima la rigidez de la conexión entre los rasgos estudiados y los de agrupamiento. Valores límite
Un ejemplo El costo de 1 metro cuadrado de área total (cond). En el mercado de la vivienda para las diez decimoséptimas casas de planificación mejorada fue:
Se sabe que las primeras cinco casas se construyeron cerca del centro de negocios, y el resto, a una distancia considerable.
Para calcular la varianza total, calcule el costo promedio de 1 sq.m. área total:
Calcule el costo promedio de 1 sq.m. y la varianza para este indicador para cada grupo de casas que difieren en la ubicación relativa al centro de la ciudad:
a) para casas construidas cerca del centro:
b) para casas construidas lejos del centro:
Variación del costo de 1 sq.m. del área total causada por el cambio en la ubicación de las casas está determinada por la magnitud de la dispersión intergrupal :
Variación del costo de 1 sq.m. del área total, debido a un cambio en las otras cifras que no medimos, se mide por el valor de la dispersión intragrupo
Las varianzas encontradas en la suma dan el valor de la varianza total
Coeficiente empírico de determinación :
muestra que la varianza del costo de 1.kv.m. el área total en el mercado de la vivienda en un 81.8% debido a las diferencias en la ubicación de los nuevos edificios en relación con el centro de negocios y el 18.2% - otros factores.
La relación de correlación empírica
La regla para agregar variaciones para la parte de una característica se escribe de la siguiente manera:
y tres tipos de variaciones de acciones para datos agrupados se determinan mediante las siguientes fórmulas:
dispersión total
Fórmulas de varianzas intergrupales e intragrupales:
Características de la forma de distribución
Para obtener una idea de la forma de distribución, se utilizan los indicadores del nivel promedio ( aritmética promedio , modo , mediana ), índices de variación, asimetría y curtosis.
En distribuciones simétricas, la media aritmética, el modo y la mediana coinciden (
El indicador más simple de asimetría es la diferencia
Para comparar la asimetría de varias series, el índice relativo
Como características centralizadoras de la variación, los momentos centrales de la distribución
Para datos no agrupados:
Para datos agrupados:
Momento de primer orden
El momento de segundo orden
Momentos de la tercera
Con la ayuda del momento de tercer orden, se mide el grado de asimetría o asimetría de la distribución.
En distribuciones simétricas
Para caracterizar la finura o llanura de la distribución, la relación del momento de cuarto orden
Para una distribución normal
Además de los índices considerados anteriormente, una característica generalizada de variación en un conjunto homogéneo es un cierto orden en la variación de las frecuencias de distribución de acuerdo con los cambios en el valor de la característica que se estudia, llamada regularidad de distribución .
La naturaleza (tipo) del patrón de distribución puede revelarse construyendo una serie variacional sobre la base de un gran volumen de observaciones, así como una elección del número de grupos y la magnitud de las integrales, en las que la ley podría manifestarse más claramente.
El análisis de la serie variacional asume el carácter de la distribución (como resultado de la acción del mecanismo de variación), el establecimiento de la función de distribución, la verificación de la correspondencia de la distribución empírica con la distribución teórica.
La distribución empírica , obtenida a partir de datos observacionales, se representa gráficamente mediante una curva de distribución empírica usando un polígono.
En la práctica, existen varios tipos de distribuciones, entre las cuales se pueden distinguir simétricas y asimétricas, un solo vértice y múltiples vértices.
Establecer el tipo de distribución significa expresar el mecanismo de la formación de la regularidad en forma analítica. Muchos fenómenos y sus características se caracterizan por formas características de distribución, que se aproximan por las curvas correspondientes. Con toda la variedad de formas de distribución, la distribución normal, la distribución de Pausson, la distribución binomial, etc., se convirtió en la teoría más ampliamente aceptada.
Un lugar especial en el estudio de la variación pertenece a la ley normal, gracias a sus propiedades matemáticas. Para una ley normal, se cumple una regla de tres sigmas, según la cual la variación de los valores individuales del rasgo está dentro de
La correspondencia entre las distribuciones empíricas y teóricas se evalúa utilizando criterios de consentimiento, entre los que se conocen ampliamente los criterios de Pearson, Romanovskii, Yastremskii y Kolmogorov.