Serie de distribución
Después de definir la característica de agrupamiento , el número de grupos y los intervalos de agrupamiento, los datos de resumen y agrupamiento se representan en forma de series de distribución y se formatean en forma de tablas estadísticas .
Una cantidad de distribuciones es un tipo de agrupación.
La serie de distribución es una distribución ordenada de las unidades de la población estudiada en grupos según una determinada característica variable.
Dependiendo de la característica que subyace a la formación de un número de distribuciones, se distinguen las series de distribución atributiva y de variación :
- Atributivo - llamado la serie de distribución, construida por características cualitativas.
- Las series de distribución construidas en orden de valores crecientes o decrecientes de la característica cuantitativa se llaman variacionales .
La primera columna contiene los valores cuantitativos de la característica variable, que se llaman variantes y se denotan por
La segunda columna contiene el número de variante concreta , expresada a través de frecuencias o frecuencias:
Las frecuencias son números absolutos que muestran tantas veces como sea posible un valor dado de una característica, lo que denota
. La suma de todas las frecuencias debe ser igual al número de unidades de toda la población. Las frecuencias (
) Son las frecuencias expresadas como un porcentaje del total. La suma de todas las frecuencias expresadas en porcentaje debe ser igual al 100% en fracciones de uno.
Representación gráfica de la serie de distribución
Visualmente, las series de distribución están representadas por imágenes gráficas.
Las series de distribución se representan como:- Polígono
- Histogramas
- Acumulativo
- Ogives
Polígono
Al construir un polígono en el eje horizontal (el eje de abscisas), los valores de la variable se trazan, y en el eje vertical (eje de ordenadas) - frecuencias o frecuencias.
El polígono en la Fig. 6.1 fue construido según el microcenso de la población rusa en 1994.
Hogares que consisten en: | una persona | dos personas | tres personas | 5 o más | total |
Número de hogares en% | 19.2 | 26.2 | 22.6 | 20.5 | 100.0 |
Condición : se dan los datos sobre la distribución de 25 empleados de una de las empresas de acuerdo a categorías arancelarias:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Problema : construya una serie variacional discreta y grábela gráficamente en forma de un polígono de distribución.
Solución :
En este ejemplo, la opción es el rango de tarifas del empleado. Para determinar las frecuencias, es necesario calcular el número de empleados que tienen un rango de tarifa correspondiente.
Tarifa bit X i | Número de trabajadores f i |
1 | 3 |
2 | 5 |
3 | 4 |
4 | Sexto |
5 | 3 |
Sexto | 4 |
Total: | 25 |
El polígono se usa para series discrecionales discretas.
Para construir el polígono de distribución (Fig. 1), en el eje de abscisas (X), graficamos los valores cuantitativos de la característica variable, las variantes, y en la ordenada las frecuencias o frecuencias.
Si los valores de la característica se expresan en forma de intervalos, entonces dicha serie se llama intervalo.
Las filas de distribución de intervalos se representan gráficamente en forma de un histograma, se acumula u oye.
Tabla estadística
Condición : datos sobre el tamaño de los depósitos de 20 personas en un banco (miles de rublos) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Problema : construir una serie de variación de intervalo con intervalos iguales.
Solución :
- El conjunto inicial consta de 20 unidades (N = 20).
- De acuerdo con la fórmula de Sturgess, definimos la cantidad necesaria de grupos usados: n = 1 + 3,322 * lg20 = 5
- Calculamos el valor de un intervalo igual: i = (152 - 2) / 5 = 30 mil rublos
- Dividimos la población inicial en 5 grupos con un valor de intervalo de 30 mil rublos.
- Los resultados de la agrupación se presentan en la tabla:
Cantidad de depósitos mil rublos X i | Cantidad de depósitos f i | Número de depósitos en% en total W i |
2 - 32 | 11mo | 55 |
32 - 62 | 4 | 20 |
62 - 92 | 2 | 10 |
92 - 122 | 1 | 5 |
122 - 152 | 2 | 10 |
Total: | 20 | 100 |
Con dicho registro continuo de características, cuando el mismo valor ocurre dos veces (como el límite superior de un intervalo y el límite inferior de otro intervalo), este valor se refiere al grupo donde este valor actúa como el límite superior.
Histograma
Para construir un histograma a lo largo de la abscisa, se indican los valores de los límites de los intervalos y en su base se construyen rectángulos cuya altura es proporcional a las frecuencias (o frecuencias).
En la Fig. 6.2. El histograma de distribución de la población de Rusia en 1997 en grupos de edad está representado.
Toda la población | Incluyendo a la edad de | ||||||||
hasta 10 | 10-20 | 20-30 | 30-40 | 40-50 | 50-60 | 60-70 | 70 y más | Total | |
Tamaño de la población | 12.1 | 15.7 | 13.6 | 16.1 | 15.3 | 10.1 | 9.8 | 7.3 | 100.0 |
Condición : la distribución de 30 empleados por el tamaño del salario mensual
La cantidad de salarios rublos. por mes | Cantidad de empleados personas |
hasta 5000 | 4 |
5000 - 7000 | 12º |
7000 - 10000 | Octavo |
10,000 - 15,000 | Sexto |
Total: | 30 |
Tarea : Para representar una serie de variación de intervalo gráficamente en forma de un histograma y se acumula.
Solución :
- El límite desconocido del intervalo abierto (primer) está determinado por el valor del segundo intervalo: 7000 - 5000 = 2000 rublos. Con el mismo valor, encontramos el límite inferior del primer intervalo: 5000 - 2000 = 3000 rublos.
- Para trazar el histograma en un sistema de coordenadas rectangulares a lo largo del eje de abscisas, trazamos los segmentos cuyos valores corresponden a los intervalos de la serie de varicela.
Estos segmentos sirven como la base inferior, y la frecuencia (frecuencia) correspondiente es la altura de los rectángulos formados. - Construyamos el histograma:
Para construir acumulados, debe calcular las frecuencias acumuladas (frecuencias). Se determinan sumando secuencialmente las frecuencias (frecuencias) de los intervalos precedentes y se denotan por S. Las frecuencias acumuladas muestran cuántas unidades del agregado tienen un valor característico no mayor que el considerado.
Acumulativo
La distribución del rasgo en la serie variacional por las frecuencias acumuladas (frecuencias) se representa usando acumulados.
Una curva acumulativa o acumulativa, a diferencia de un polígono, se construye a partir de frecuencias o frecuencias acumuladas. En este caso, los valores característicos se colocan en el eje de abscisas y las frecuencias o frecuencias acumuladas en el eje de ordenadas (Figura 6.3).
4. Calcule las frecuencias acumuladas:
La frecuencia acumulada del primer intervalo se calcula de la siguiente manera: 0 + 4 = 4, para el segundo: 4 + 12 = 16; para el tercero: 4 + 12 + 8 = 24, etc.
La cantidad de salarios rublos por mes X i | Cantidad de empleados personas f i | Frecuencias acumuladas S |
hasta 5000 | 4 | 4 |
5000 - 7000 | 12º | 16 |
7000 - 10000 | Octavo | 24 |
10,000 - 15,000 | Sexto | 30 |
Total: | 30 | - |
Al construir acumulaciones, la frecuencia (frecuencia) acumulada del intervalo correspondiente se asigna a su límite superior:
Ogiva
Ogiva se construye de manera análoga al cúmulo, con la única diferencia de que las frecuencias acumuladas se colocan en el eje de abscisas y los valores de los signos en el eje de ordenadas.
Una variación del cúmulo es la curva de concentración o la curva de Lorentz. Para construir una curva de concentración en ambos ejes de un sistema de coordenadas rectangular, se aplica una escala en porcentaje de 0 a 100. Al mismo tiempo, las frecuencias acumuladas se indican en el eje de abscisas y los valores acumulados del porcentaje (porcentaje) por el volumen del atributo en el eje de ordenadas.
La distribución uniforme de la característica corresponde a la diagonal del cuadrado en el gráfico (Figura 6.4). Con una distribución desigual, el gráfico es una curva cóncava, según el nivel de concentración de la característica.