Descripción de algunos parámetros estadísticos básicos
Objetivo: El objetivo de esta sección es presentar y explicar el fundamento teórico de algunos parámetros estadísticos básicos, destacando su importancia y utilidad en el análisis de datos. Al entender estos conceptos, estudiantes de la carrera de Q.F.B en el módulo de Estadística de tercer semestre, podrán aplicar de manera más efectiva las técnicas estadísticas en sus estudios, mejorando la precisión y la validez de sus conclusiones.
Vigencia de febrero 2025 a febrero 2026
Revisión y actualización febrero de 2025 a febrero de 2026
Elaboró: Dra. Ma. Elena Tejeda Rosales
Conocimientos Previos
Estadística paramétrica
Fundamento Teórico
La estadística es una disciplina fundamental en la investigación científica, ya que proporciona las herramientas necesarias para recolectar, analizar e interpretar datos. Dentro de esta disciplina, los parámetros estadísticos juegan un papel crucial, ya que permiten resumir y describir las características esenciales de un conjunto de datos. Estos parámetros ofrecen una visión clara y concisa de la tendencia central, la dispersión y la relación entre variables en un conjunto de datos, facilitando así la comprensión y la toma de decisiones basadas en datos.
En este contexto, es vital comprender el fundamento teórico que subyace a estos parámetros estadísticos. La media, la mediana y la moda, por ejemplo, son medidas de tendencia central que proporcionan información sobre el valor típico de un conjunto de datos. Por otro lado, la varianza y la desviación estándar son medidas de dispersión que indican cómo se distribuyen los datos en torno a la media, mientras que el rango y los percentiles ofrecen una perspectiva sobre la amplitud y la distribución relativa de los datos. Además, el coeficiente de correlación de Pearson es esencial para entender la relación lineal entre dos variables cuantitativas.
Media (Promedio):
- Definición: La media es el promedio aritmético de un conjunto de datos. Se calcula sumando todos los valores y dividiéndolos por el número de observaciones.
- Fórmula: x̄ = ∑xi / n, donde ∑xi es la suma de todos los valores y n es el número de observaciones.
- Uso: La media proporciona una medida central del conjunto de datos y es útil para comparar diferentes conjuntos de datos.
Ejemplo de Media:
Supongamos que queremos calcular la media de las calificaciones de un grupo de estudiantes en un examen. Las calificaciones de los estudiantes son las siguientes:
75,82,91,87,69,95,78,84,77,8875, 82, 91, 87, 69, 95, 78, 84, 77, 8875,82,91,87,69,95,78,84,77,88
Paso 1: Sumar todas las calificaciones.
75 + 82 + 91 + 87 + 69 + 95 + 78 + 84 + 77 + 88 = 826
Paso 2: Dividir la suma de las calificaciones por el número total de estudiantes (n).
Número de estudiantes = 10
Media = ∑Calificaciones / n = 826 / 10 = 82.6
Interpretación:
La media de las calificaciones en este examen es 82.6. Esto significa que, en promedio, los estudiantes obtuvieron una calificación de 82.6 en el examen. La media proporciona una medida central de las calificaciones, lo que ayuda a entender el desempeño general del grupo.
Mediana:
- Definición: La mediana es el valor que divide un conjunto de datos ordenados en dos partes iguales, de manera que el 50% de los valores están por debajo y el 50% están por encima.
- Cálculo: Para un conjunto de datos ordenado, si hay un número impar de observaciones, la mediana es el valor central. Si hay un número par de observaciones, la mediana es el promedio de los dos valores centrales.
- Uso: La mediana es útil para describir la tendencia central de un conjunto de datos, especialmente cuando hay valores atípicos que podrían distorsionar la media.
Moda:
- Definición: La moda es el valor que aparece con mayor frecuencia en un conjunto de datos.
- Uso: La moda es útil para identificar los valores más comunes en un conjunto de datos y puede ser aplicada a datos cualitativos y cuantitativos.
Ejemplo de Mediana:
Supongamos que queremos calcular la mediana de las calificaciones de un grupo de estudiantes en un examen. Las calificaciones de los estudiantes son las siguientes:
75, 82, 91, 87, 69, 95, 78, 84, 77 y 88
Paso 1: Ordenar las calificaciones en orden ascendente.
69, 75, 77, 78, 82, 84, 87, 88, 91, 95
Paso 2: Determinar el número total de observaciones (n).
En este caso, hay 10 calificaciones, por lo que n = 10.
Paso 3: Encontrar la mediana.
- Si el número total de observaciones es impar, la mediana es el valor del medio.
- Si el número total de observaciones es par, la mediana es el promedio de los dos valores centrales.
En este caso, n es par (10), por lo que necesitamos encontrar el promedio de los dos valores centrales
Los dos valores centrales son el quinto y el sexto valores en el conjunto ordenado:
- 82 y 84
Paso 4: Calcular la mediana.
Mediana = (82 + 84) / 2 = 166 / 2 = 83
Interpretación:
La mediana de las calificaciones en este examen es 83. Esto significa que la mitad de los estudiantes obtuvo una calificación por debajo de 83 y la otra mitad obtuvo una calificación por encima de 83. La mediana proporciona una medida central que no se ve afectada por valores atípicos o extremos, ofreciendo una visión más robusta de la distribución central de las calificaciones en comparación con la media.
Varianza:
Definición: La varianza mide la dispersión de los datos con respecto a la media. Se calcula como el promedio de los cuadrados de las diferencias entre cada valor y la media.
Fórmula:
σ² = ∑(xi – x̄)² / n para una población, o
σ² = ∑(xi – x̄)² / (n – 1) para una muestra.
Uso: La varianza es utilizada para entender la variabilidad dentro de un conjunto de datos. Cuanto mayor es la varianza, mayor es la dispersión de los datos.
Ejemplo de Varianza:
Supongamos que queremos calcular la varianza de las calificaciones de un pequeño grupo de estudiantes en un examen. Las calificaciones de los estudiantes son las siguientes:
70, 75, 80, 85, 90
Paso 1: Calcular la media (x̄) de las calificaciones.
x̄ = (70 + 75 + 80 + 85 + 90) / 5 = 400 / 5 = 80
Paso 2: Restar la media de cada calificación y luego cuadrar el resultado.
(70 – 80)² = (-10)² = 100
(75 – 80)² = (-5)² = 25
(80 – 80)² = (0)² = 0
(85 – 80)² = (5)² = 25
(90 – 80)² = (10)² = 100
Paso 3: Sumar todos los valores obtenidos en el paso 2.
100 + 25 + 0 + 25 + 100 = 250
Paso 4: Dividir esta suma por el número total de observaciones menos uno (n – 1) para obtener la varianza muestral.
n = 5
Varianza (s²) = 250 / (5 – 1) = 250 / 4 = 62.5
Interpretación:
La varianza de las calificaciones es 62.5. Esto significa que, en promedio, las calificaciones se desvían del valor medio en una cantidad cuadrada de 62.5 unidades.
Nota:
En el cálculo de la varianza para una muestra (como en este ejemplo), dividimos por n – 1 (donde n es el número de observaciones) para obtener una estimación imparcial de la varianza poblacional. Esto es conocido como el ajuste de Bessel.
Desviación Estándar:
Definición: La desviación estándar es la raíz cuadrada de la varianza. Indica, en promedio, cuánto se desvían los valores de la media.
Fórmula:
σ=√(∑(xi – x̄)² / n) para una población,
o
σ=√(∑(xi – x̄)² / (n – 1)) para una muestra.
Uso: La desviación estándar es ampliamente utilizada para comprender la dispersión y la variabilidad de los datos de una manera que es intuitivamente más comprensible que la varianza.
Ejemplo de Desviación Estándar:
Supongamos que queremos calcular la desviación estándar de las calificaciones de un pequeño grupo de estudiantes en un examen. Las calificaciones de los estudiantes son las siguientes:
70, 75, 80, 85, 90
Paso 1: Calcular la media (x̄) de las calificaciones.
x̄ = (70 + 75 + 80 + 85 + 90) / 5 = 400 / 5 = 80
Paso 2: Restar la media de cada calificación y luego cuadrar el resultado.
(70 – 80)² = (-10)² = 100 (75 – 80)² = (-5)² = 25 (80 – 80)² = (0)² = 0 (85 – 80)² = (5)² = 25 (90 – 80)² = (10)² = 100
Paso 3: Sumar todos los valores obtenidos en el paso 2.
100 + 25 + 0 + 25 + 100 = 250
Paso 4: Dividir esta suma por el número total de observaciones menos uno (n – 1) para obtener la varianza muestral.
- n = 5
- Varianza (s²) = 250 / (5 – 1) = 250 / 4 = 62.5
Paso 5: Calcular la desviación estándar, que es la raíz cuadrada de la varianza.
- s = √62.5 ≈ 7.91
Interpretación:
La desviación estándar de las calificaciones es aproximadamente 7.91. Esto significa que, en promedio, las calificaciones se desvían de la media en 7.91 unidades. La desviación estándar proporciona una medida de dispersión que está en las mismas unidades que los datos originales y es una forma intuitiva de entender la variabilidad dentro del conjunto de datos.
Rango:
- Definición: El rango es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos.
- Fórmula: R = Máximo – Mínimo
- Uso: El rango proporciona una medida rápida y sencilla de la dispersión de los datos, aunque es sensible a los valores atípicos.
Ejemplo de Rango:
Supongamos que queremos calcular el rango de las calificaciones de un grupo de estudiantes en un examen. Las calificaciones de los estudiantes son las siguientes:
70, 75, 80, 85, 90
Paso 1: Identificar el valor mínimo y el valor máximo en el conjunto de datos.
- Valor mínimo: 70
- Valor máximo: 90
Paso 2: Calcular el rango restando el valor mínimo del valor máximo.
- Rango = Máximo – Mínimo = 90 – 70 = 20
Interpretación:
El rango de las calificaciones es 20. Esto significa que la diferencia entre la calificación más baja y la calificación más alta es de 20 puntos. El rango proporciona una medida rápida y sencilla de la dispersión de los datos, indicando la amplitud total de los valores en el conjunto de datos.
Cuestionario
Cuestionario de Estadística Básica
1. ¿Qué es la moda en estadística?
a) El valor más frecuente en un conjunto de datos.
b) La suma de todos los valores dividida por el número total de valores.
c) El valor central de un conjunto de datos ordenados.
d) La diferencia entre el valor máximo y el valor mínimo.
Respuesta correcta: a) El valor más frecuente en un conjunto de datos.
2. ¿Qué describe la mediana en un conjunto de datos?
a) El valor más frecuente en un conjunto de datos.
b) La suma de todos los valores dividida por el número total de valores.
c) El valor central de un conjunto de datos ordenados.
d) La diferencia entre el valor máximo y el valor mínimo.
Respuesta correcta: c) El valor central de un conjunto de datos ordenados.
3. ¿Qué mide la varianza en un conjunto de datos?
a) La tendencia central.
b) La dispersión de los datos alrededor de la media.
c) La frecuencia de los datos.
d) La relación entre dos variables.
Respuesta correcta: b) La dispersión de los datos alrededor de la media.
4. ¿Qué es el promedio (media) en estadística?
a) El valor más frecuente en un conjunto de datos.
b) La suma de todos los valores dividida por el número total de valores.
c) El valor central de un conjunto de datos ordenados.
d) La diferencia entre el valor máximo y el valor mínimo.
Respuesta correcta: b) La suma de todos los valores dividida por el número total de valores.
5. ¿Qué representa el rango en un conjunto de datos?
a) El valor más frecuente en un conjunto de datos.
b) La suma de todos los valores dividida por el número total de valores.
c) El valor central de un conjunto de datos ordenados.
d) La diferencia entre el valor máximo y el valor mínimo.
Respuesta correcta: d) La diferencia entre el valor máximo y el valor mínimo.
6. Si un conjunto de datos tiene valores 3, 7, 7, 7, 10, ¿cuál es la moda?
a) 3
b) 7
c) 10
d) No hay moda
Respuesta correcta: b) 7
7. Si los datos son 15, 18, 22, 30, 35, ¿cuál es la mediana?
a) 15
b) 18
c) 22
d) 30
Respuesta correcta: c) 22
8. ¿Qué indica una varianza alta en un conjunto de datos?
a) Que los datos están muy dispersos alrededor de la media.
b) Que los datos están muy cerca de la media.
c) Que hay muchos valores atípicos.
d) Que la media es alta.
Respuesta correcta: a) Que los datos están muy dispersos alrededor de la media.
9. Si los valores son 4, 8, 12, 16, 20, ¿cuál es el promedio?
a) 4
b) 12
c) 16
d) 20
Respuesta correcta: b) 12
10. Si los valores son 10, 20, 30, 40, 50, ¿cuál es el rango?
a) 10
b) 20
c) 40
d) 50
Respuesta correcta: c) 40
Referencias Bibliográficas
Anderson D., Sweeney D., Williams T. Estadística para la administración y economía. Décima edición. Cengage Learning. 2008
Berenson M., Levine D., Krehbiel T. Estadística para administración. Segunda edición. Prentice Hall. 2000
Blair C., Taylor R. Bioestadística. Peason. Prentice Hall. 2008
Daniel W. Bioestadística. Cuarta edición. Limusa Wiley. 2006
Devore J. Probabilidad y Estadística para ingeniería y ciencias. Séptima edición. Cengage Learning. 2008
Johnson R. Probabilidad y Estadística para ingenieros. Octava edición. Pearson. 2012
Kuehl R., Diseño de experimentos. Segunda edición. Thomson Learning. 2001
Meyer P. Probabilidad y Aplicaciones estadísticas. Edición revisada. Addison Wesley Logman. 1998
Montgomery D., Diseño y análisis de experimentos. Segunda edición. Limusa Wiley. 2006
Newbold P., Carlson W., Thorne B. Estadística para la administración y economía. Sexta edición. Pearson. Prentice Hall. 2008
Ritchey F., Estadística para las ciencias sociales. Mc Graw Hill. 2002
Steel R., Torrie J. Bioestadística. Segunda edición. Mc Graw Hill. 1988
Walpole R., Myers R., Myers S., Ye K. Probabilidad y Estadística para ingeniería y ciencias. Octava Edición. Pearson, Prentice Hall. 2007
Wisniewski P., Velasco G. Problemario de probabilidad. Thomson Learning. 2001
Zimmermann F., Estadística para investigadores. Editorial Escuela Colombiana de Ingeniería. 2004