Regresyon Analizi

Emrah Er bio photo By Emrah Er

R’da basit regresyon analizini gerçekleştirmek için öncelikle aşağıdaki kod girilerek gerekli kitaplık yüklenmelidir.

library(RCurl)

Analizde kullanılan veri seti 20 gözlem ve 2 değişken (Boy (X) ve Kilo (Y)) içermektedir. Veriyi R’a aktarmak için aşağıda yer alan komutlar kullanılmalıdır.

url <- "https://raw.githubusercontent.com/emraher/data/master/HTWT1.csv"
data <- getURL(url)
data <- read.csv(textConnection(data))

Verinin serpilim grafiğini çizmek için plot, grafiğe trend doğrusu eklemek için ise abline komutu kullanılabilir.

plot(data$X, data$Y, main = "Serpilim Grafigi", xlab = "Boy", ylab = "Kilo", pch = 19)
abline(lm(data$Y ~ data$X), col = "red")

plot of chunk unnamed-chunk-3

Grafikten görüldüğü üzere boy ve kilo arasında pozitif bir ilişki vardır. Bu ilişki değişkenler arasındaki korelasyon katsayısı hesaplanarak da gözlemlenebilir.

cor(data$X, data$Y)
## [1] 0.862

En küçük kareler yöntemi kullanılarak regresyon tahmini gerçekleştirmek için ise aşağıdaki komutlar kullanılmalıdır.

model <- lm(data$Y ~ data$X)
summary(model)
## 
## Call:
## lm(formula = data$Y ~ data$X)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -18.545  -3.947  -0.611   3.176  18.701 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)  103.397      9.342   11.07  1.8e-09
## data$X         6.377      0.884    7.22  1.0e-06
## 
## Residual standard error: 8.5 on 18 degrees of freedom
## Multiple R-squared:  0.743,	Adjusted R-squared:  0.729 
## F-statistic: 52.1 on 1 and 18 DF,  p-value: 0.00000103

Kullanılan veri setine buradan da ulaşabilirsiniz.