El ajuste de datos es el proceso mediante el que se ajustan modelos a datos y se analiza la precisión del ajuste. Los ingenieros y los científicos utilizan técnicas de ajuste de datos, incluidas ecuaciones matemáticas y métodos no paramétricos, para modelar datos adquiridos.
Una vez hallado el modelo de ajuste se está en posibilidades de interpolar o extrapolar nuevos valores desconocidos. En la interpolación se buscan valores intermedios entre el rango de datos conocidos, en la extrapolación se estiman valores más allá de los datos conocidos. En estos hay mayor incertidumbre, por lo que, sólo se debe usar con ciertas limitaciones.
A través de un análisis de regresión se establecen niveles de confianza para cada ajuste. La regresión nos permite además de establecer la tendencia, determinar el grado de dependencia de las series de valores X e Y en la distribución.
Coeficiente de correlación
El coeficiente de correlación es otro parámetro para el estudio de una distribución bidimensional, que nos indica el grado de dependencia entre las variables X e Y.
Se designa con la letra r y se obtiene mediante una fórmula r=n/d
El numerador es el producto de las desviaciones de los valores X e Y respecto de sus valores medios. En el denominador tenemos las desviaciones cuadráticas medias de X y de Y.
El coeficiente de correlación puede valer un número comprendido entre -1 y +1.
- Cuando r = 1, la correlación lineal es perfecta, directa.
- Cuando r = -1, la correlación lineal es perfecta, inversa
- Cuando r = 0, no existe correlación alguna, independencia total de los valores X e Y
Normalmente un ajuste adecuado acepta valores de r mayores y cercanos a 0.98