jueves, 3 de abril de 2014

Estadística descriptiva medidas de tendencia central




Metodología  


Como metodología de la investigación se denomina el conjunto de procedimientos y técnicas que se aplican de manera ordenada y sistemática en la realización de un estudio.


En un proceso de investigación, la metodología es una de las etapas en que se divide la realización de un trabajo. En ella, el investigador o los investigadores deciden el conjunto de técnicas y métodos que emplearán para llevar a cabo las tareas vinculadas a la investigación.


Estadística descriptiva


Se encarga de la recolección, ordenamiento y descripción  de un conjunto de datos numéricos. Los datos pueden ser presentados en tablas gráficas, donde se resaltan medidas de tendencia central y de dispersion.   


Medidas de localización  central


Existen dos medidas de interés para cualquier conjunto de datos: la localización de su centro y su variabilidad. Latendencia central de un conjunto de datos es la disposición de éstos para agruparse ya sea alrededor del centro o de ciertos valores numéricos. La variabilidad de un conjunto de datos es la dispersión de las observaciones en el conjunto.


Existen principalmente tres medidas de tendencia central: la media, la mediana y la moda. La media de las observaciones x1x2xn, es el promedio aritmético de éstas y se denota por


La media es una medida apropiada de tendencia central para muchos conjuntos de atos. Sin embargo, dado que cualquier observación en el conjunto se emplea para su cálculo, el valor de la media puede afectarse de manera desproporcionada por la existencia de algunos valores extremos (aislados).

La mediana de un conjunto de observaciones es el valor para el cual, cuando todas las observaciones se ordenan de manera creciente (ascendente), la mitad de éstas es menor que este valor y la otra mitad mayor.

Si el número de observaciones en el conjunto es impar, la mediana es el valor de la observación que se encuentra a la mitad del conjunto ordenado. Si el número es par se considera la mediana como el promedio aritmético de los valores de las dos observaciones que se encuentren a la mitad del conjunto ordenado. Alternativamente, la mediana puede determinarse a partir de la distribución acumulativa, es decir, la mediana es el percentil cincuenta.




Puesto que la mediana es un valor que se basa en la secuencia ordenada de las observaciones en un conjunto de datos, es necesario saber que la existencia de algunos valores extremos no afectará su valor. Por lo tanto, si un conjunto contiene unos cuantos valores extremos y un agregado muy alto de observaciones, la mediana puede ser una medida de tendencia central mucho más deseable que la media. Generalmente los conjuntos de datos que describen información acerca de ingresos caen en esta categoría.



La moda de un conjunto de observaciones es el valor de la observación que ocurre con mayor frecuencia en el conjunto. La moda muestra hacia qué valor tienden los datos a agruparse. En conjuntos relativamente pequeños, puede que no exista un par de observaciones cuyo valor sea el mismo. En esta situación no es clara la definición de moda. También puede suceder que la frecuencia más alta se encuentre compartida por dos o más observaciones. En estos casos, la moda tiene la utilidad limitada como medida de tendencia central. Si se ha determinado una distribución de frecuencia relativa, la clase con la frecuencia más alta recibirá el nombre de clase modal, con lo que se define a la moda como el punto medio de esa clase. En este caso la clase modal sirve como punto de concentración en el conjunto de datos.

La inferencia estadística resulta en general más simple cuando se usa la media. Puesto que es la inferencia el tema principal y debido a que la media es más usada para este propósito, de aquí en adelante concentraremos la atención en la media como medida de tendencia central.

Medidas de dispersión


Proporcionan la variabilidad de las observaciones en un conjunto de datos. Una de las medidas más útiles de dispersión o variación es la varianza.

La varianza de las observaciones x1, x2, xn es, en esencia, el promedio del cuadrado de las distancias entre cada observación y la media del conjunto de observaciones. La varianza se denota por



La varianza es una medida razonablemente buena de la variabilidad debido a que si muchas de las diferencias son grandes (o pequeñas) entonces el valor de la varianza s2 será grande (o pequeño). El valor de la varianza puede sufrir un cambio muy desproporcionado, aún más que la media, por la existencia de algunos valores extremos en el conjunto.


La raíz cuadrada positiva de la varianza recibe el nombre de desviación estándar y se denota por


La varianza y la desviación estándar no son medidas de variabilidad distintas, debido a que la última no puede determinarse a menos que se conozca la primera. A menudo se prefiere la desviación estándar en relación con la varianza, porque se expresa en las mismas unidades físicas de las observaciones.

No hay comentarios:

Publicar un comentario