Definiciones Básicas

Estadística

El término “estadística” se derivó originalmente del vocablo estado, porque ha sido función tradicional de los gobiernos centrales llevar registros de la población, nacimiento, defunciones, profesiones, cosechas y demás información del estado. Contar y medir estos hechos, del estado, genera muchas clases de datos numéricos.

Su definición tradicional es: la colección, organización, resumen y presentación de datos numéricos. Actualmente se considera como una disciplina que proporciona herramientas para coleccionar, clasificar y evaluar o analizar datos, esto para darle sustento a la toma de decisiones, para realizar inferencias o generar conclusiones validadas a la luz de los datos.

Si se considera que el objeto de trabajo de la estadística es la INCERTIDUMBRE y que una forma de medirla es mediante la probabilidad, que en términos coloquiales se puede definir como una medida de la posibilidad. Entonces, se requiere conocer y manejar una serie de conceptos que usaremos durante todo el curso.

Probabilidad

Más que una definición se revisa qué es, desde tres enfoques: clásico, frecuencial y axiomático.

  • Enfoque clásico: Conocido como la definición de Laplace o “a priori“. Su uso y aplicación se encuentra limitado por un par de condiciones: 1) Cada uno de los resultados posibles debe estar bien definido y el número de todos los resultados posibles debe ser finito; 2) Todos los resultados deben ser igualmente probables.

Donde la probabilidad de que se presente un evento A, P(A), está dado por el número de resultados que implican el evento A, n(A), dividido entre el número total de resultados posibles en el espacio S, n(S).

Por ejemplo: La probabilidad de que al lanzar un dado se obtenga una cara cuyo número de puntos sea par: P(A) = (2,4,6)/(1,2,3,4,5,6) = 3/6 = 1/2 

  • Enfoque frecuencial: También denominada definición empírica o “a posteriori”. Es una definición más general de la probabilidad, donde ningún resultado es contundente, sino que proporciona una aproximación o estimación del valor real. Se atiene a un número muy grande de repeticiones, siempre bajo las mismas condiciones. Lo que le otorga mayor veracidad a los resultados y brinda una mejor estimación de la probabilidad mientras mayor sea el número de repeticiones.

Por ejemplo, la probabilidad de obtener “águila” al lanzar al aire una moneda (honesta): P(águila) = 1/2.

Esto no quiere decir que si lanzo al aire una moneda dos veces obtengo un águila y un sol, sino que si se lanza una moneda muchas veces, digamos 10,000, la mitad de los resultados serán águila y si no nos convence se podrían hacer 100,000 lanzamientos hasta obtener la regularidad de frecuencia que indica que la mitad de los resultados son águila.

  • Enfoque axiomático: Conocido como la definición de Kolmogorov. No es propiamente un enfoque experimental, sino que pueden desarrollarse leyes o propiedades de la probabilidad a partir de análisis lógicos o computacionales. Los tres axiomas que lo sustentan son:

Axioma 1: La probabilidad P(A) de cualquier evento no debe ser menor que cero ni mayor que uno, siendo cero la probabilidad nula de que ocurra; mientras que uno es la probabilidad cierta de que ocurra ese evento (sólo hay un evento).

Axioma 2: La suma de las probabilidades de todos los posibles eventos en un universo S es igual a uno.

Axioma 3: Si A y B son dos eventos mutuamente excluyentes (concepto que se verá más adelante):

Que sean mutuamente excluyentes implica que no presentan intersección y la probabilidad de esta intersección es cero.

Relación entre Probabilidad y Estadística

Si bien, la estadística permite trabajar con los datos, es un hecho que al momento de obtenerlos (observar, medir, colectar) siempre existe un margen de error o factor de azar, por lo que hay que buscar la forma de considerar este factor.

La probabilidad es la herramienta básica que permite considerar la incertidumbre, siempre implícita en cualquier análisis estadístico (nivel de significancia o nivel de confianza).

Población

Una población o universo está conformado por la totalidad de unidades elementales. En otras palabras, si queremos hablar de una población, debemos garantizar que en los datos se encuentren incluidos todos los elementos. Lo cual es muy difícil de cumplir.

Muestra

Es una porción o subconjuntos de unidades elementales extraídas de una población. A partir de la cual se van a realizar generalizaciones de toda la población, por lo que esta muestra debe ser representativa de toda la población.

Población y muestra, donde la primera es un todo, del cual se extrae un fragmento representativo de ese todo, definido como muestra.

Unidades elementales y observación

Si un individuo u objeto de una población cuentan con una característica medible o ellos mismos pueden ser considerados una unidad medible, se les considera unidades elementales. Por lo tanto, tener una población definida, no es más que delimitar la cantidad de unidades elementales. La característica medible reciben el nombre de rasgos o propiedades, los cuales a su vez pueden ser medidas de manera cualitativa (color, ausencia o presencia de tricomas, etc.) o cuantitativos (talla, peso seco, velocidad de reacción).

Observación. Se define como observación al resultado de las mediciones (observaciones) realizadas a las unidades elementales. En otras palabras, es el valor numérico de estas unidades.