REGRESION LINEAL SIMPLE (PARTE 2)

Verificación de la ecuación de estimación

Ahora que sabemos como calcular la línea de regresión, podemos verificar que tanto se ajusta.
Tomando los errores individuales positivos y negativos deben dar cero.
5) Error estándar de la estimación

El error estándar nos permite deducir la confiabilidad de la ecuación de regresión que hemos desarrollado.
Este error se simboliza Se y es similar a la desviación estándar en cuanto a que ambas son medidas de dispersión.
El error estándar de la estimación mide la variabilidad, o dispersión de los valores observados alrededor de la línea de regresión y su formula es la siguiente
· = media de los valores de la variable dependiente
· Y = valores de la variable dependiente
· n = numero de puntos de datos
Método de atajo para calcular el error estándar de la estimación
Dado que utilizar la ecuación anterior requiere una serie de cálculos tediosos, se ha diseñado una ecuación que puede eliminar unos de estos pasos, la ecuación es la siguiente:

· X = valores de la variable independiente
· Y = valores de la variable dependiente
· a = intersección en Y
· b = pendiente de la ecuación de la estimación
· n = numero de puntos de datos
Interpretación del error estándar de la estimación
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar de estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión. De manera que inversa, si Se = 0, esperemos que la ecuación de estimación sea un estimador perfecto de la variable dependiente. En este caso todos lo puntos deben caer en la línea de regresión y no habría puntos dispersos.
Usaremos el error estándar como una herramienta de igual forma que la desviación estándar. Esto suponiendo que los puntos observados están distribuidos normalmente alrededor de la línea de regresión, podemos encontrar un 68% de los puntos en + 1 Se, 95.5% en + 2 Se y 99.7% de los puntos en + 3 Se. Otra cosa que debemos observar es que el error estándar de la estimación se mide a lo largo del eje Y, y no perpendicularmente de la línea de regresión.
Intervalos de confianza utilizando desviación estándar
En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce como el nivel de confianza Esta probabilidad nos indica que tanta confianza tenemos en que la estimación del intervalo incluya al parámetro de la población. Una probabilidad mas alta significa mas confianza.
El intervalo de confianza es el alcance de la estimación que estamos haciendo pero a menudo hacemos el intervalo de confianza en términos de errores estándar, para esto debemos calcular el error estándar de la media así:
Donde es el error estándar de la media para una población infinita, es la desviación estándar de la
población. Con frecuencia expresaremos los intervalos de confianza de esta forma: en la que:
= limite superior del intervalo de confianza
= limite inferior del intervalo de confianza
Relación entre nivel de confianza e intervalo de confianza.
Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99% en todos los problemas sobre estimaciones, pero en algunos casos altos niveles de confianza producen intervalos de confianza alto por lo tanto imprecisos.
Debe tenerse un intervalo de confianza que vaya de acuerdo al tema que se este estimando.
6) intervalos de predicción aproximados

Una forma de ver el error estándar de la estimación es concebirla como la herramienta estadística que podemos usar para hacer un enunciado de probabilidad sobre el intervalo alrededor del valor estimado de , dentro del cual cae el valor real de Y.

Cuando la muestra es mayor de 30 datos, se calcula los intervalos de predicción aproximados de la siguiente manera. Si queremos estar seguros en aproximadamente 65% de que el valor real de Y caerá dentro de + 1 error estándar de . Podemos calcular los limites superior e inferior de este intervalo de predicción de la siguiente manera:
= Limite superior del intervalo de predicción
= Limite inferior del intervalo de predicción
Si, en lugar decimos que estamos seguros en aproximadamente 95.5% de que el dato real estará dentro de + 2 errores estándar de la estimación de . Podríamos calcular los limites de este intervalo de la siguiente manera:
= Limite superior del intervalo de predicción
= Limite inferior del intervalo de predicción

y por ultimo decimos que estamos seguros en aproximadamente el 99.7% cuando usamos + 3 errores estándar de la estimación de Podríamos calcular los limites de este intervalo de la siguiente manera:
= Limite superior del intervalo de predicción
= Limite inferior del intervalo de predicción

Como ya habíamos mencionado solo se usa para grandes muestras (mayores de 30 datos) para muestras más pequeñas se usan la distribución T. Debemos poner énfasis en que los intervalos de predicción son solo aproximaciones, de hecho los estadísticos pueden calcular el error estándar exacto para la predicción Sp, usando la formula en la que:

X0 = valor especifico de x en el que deseamos predecir el valor de Y

0 comentarios:

jueves, 21 de mayo de 2009

REGRESION LINEAL SIMPLE (PARTE 2)

Verificación de la ecuación de estimación

Ahora que sabemos como calcular la línea de regresión, podemos verificar que tanto se ajusta.
Tomando los errores individuales positivos y negativos deben dar cero.
5) Error estándar de la estimación

El error estándar nos permite deducir la confiabilidad de la ecuación de regresión que hemos desarrollado.
Este error se simboliza Se y es similar a la desviación estándar en cuanto a que ambas son medidas de dispersión.
El error estándar de la estimación mide la variabilidad, o dispersión de los valores observados alrededor de la línea de regresión y su formula es la siguiente
· = media de los valores de la variable dependiente
· Y = valores de la variable dependiente
· n = numero de puntos de datos
Método de atajo para calcular el error estándar de la estimación
Dado que utilizar la ecuación anterior requiere una serie de cálculos tediosos, se ha diseñado una ecuación que puede eliminar unos de estos pasos, la ecuación es la siguiente:

· X = valores de la variable independiente
· Y = valores de la variable dependiente
· a = intersección en Y
· b = pendiente de la ecuación de la estimación
· n = numero de puntos de datos
Interpretación del error estándar de la estimación
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar de estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión. De manera que inversa, si Se = 0, esperemos que la ecuación de estimación sea un estimador perfecto de la variable dependiente. En este caso todos lo puntos deben caer en la línea de regresión y no habría puntos dispersos.
Usaremos el error estándar como una herramienta de igual forma que la desviación estándar. Esto suponiendo que los puntos observados están distribuidos normalmente alrededor de la línea de regresión, podemos encontrar un 68% de los puntos en + 1 Se, 95.5% en + 2 Se y 99.7% de los puntos en + 3 Se. Otra cosa que debemos observar es que el error estándar de la estimación se mide a lo largo del eje Y, y no perpendicularmente de la línea de regresión.
Intervalos de confianza utilizando desviación estándar
En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce como el nivel de confianza Esta probabilidad nos indica que tanta confianza tenemos en que la estimación del intervalo incluya al parámetro de la población. Una probabilidad mas alta significa mas confianza.
El intervalo de confianza es el alcance de la estimación que estamos haciendo pero a menudo hacemos el intervalo de confianza en términos de errores estándar, para esto debemos calcular el error estándar de la media así:
Donde es el error estándar de la media para una población infinita, es la desviación estándar de la
población. Con frecuencia expresaremos los intervalos de confianza de esta forma: en la que:
= limite superior del intervalo de confianza
= limite inferior del intervalo de confianza
Relación entre nivel de confianza e intervalo de confianza.
Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99% en todos los problemas sobre estimaciones, pero en algunos casos altos niveles de confianza producen intervalos de confianza alto por lo tanto imprecisos.
Debe tenerse un intervalo de confianza que vaya de acuerdo al tema que se este estimando.
6) intervalos de predicción aproximados

Una forma de ver el error estándar de la estimación es concebirla como la herramienta estadística que podemos usar para hacer un enunciado de probabilidad sobre el intervalo alrededor del valor estimado de , dentro del cual cae el valor real de Y.

Cuando la muestra es mayor de 30 datos, se calcula los intervalos de predicción aproximados de la siguiente manera. Si queremos estar seguros en aproximadamente 65% de que el valor real de Y caerá dentro de + 1 error estándar de . Podemos calcular los limites superior e inferior de este intervalo de predicción de la siguiente manera:
= Limite superior del intervalo de predicción
= Limite inferior del intervalo de predicción
Si, en lugar decimos que estamos seguros en aproximadamente 95.5% de que el dato real estará dentro de + 2 errores estándar de la estimación de . Podríamos calcular los limites de este intervalo de la siguiente manera:
= Limite superior del intervalo de predicción
= Limite inferior del intervalo de predicción

y por ultimo decimos que estamos seguros en aproximadamente el 99.7% cuando usamos + 3 errores estándar de la estimación de Podríamos calcular los limites de este intervalo de la siguiente manera:
= Limite superior del intervalo de predicción
= Limite inferior del intervalo de predicción

Como ya habíamos mencionado solo se usa para grandes muestras (mayores de 30 datos) para muestras más pequeñas se usan la distribución T. Debemos poner énfasis en que los intervalos de predicción son solo aproximaciones, de hecho los estadísticos pueden calcular el error estándar exacto para la predicción Sp, usando la formula en la que:

X0 = valor especifico de x en el que deseamos predecir el valor de Y

0 comentarios:

Con la tecnología de Blogger.

Copyright © / ECONOMIA

Template by : Urang-kurai / powered by :blogger