R
ỨNG DỤNG NGÔN NGỮ
TRONG PHÂN TÍCH DỮ LIỆU
Nhóm thực hiện: Phan Đình Khôi
Nguyễn Hồ Anh Khoa
Nội dung chính
Hướng dẫn cài đặt và vận hành R
Xử lý số liệu bằng R
Phân tích thống kê mô tả bằng R
Phân tích hồi quy bằng R
Phân tích dãy số thời gian bằng R
Nội dung 1. GIỚI THIỆU R
Tại sao sử dụng R
Tổng quan R
Workspace
Đọc và lưu dữ liệu trong R
Tại sao R
Mã nguồn mở
Hoàn toàn miễn phí
Chạy trên nền Windows, MacOS
Nhiều phương pháp phân tích không
có trong các phần mền khác
Vẽ biểu đồ tuyệt vời
Lưu ý!
Thuật ngữ/ngôn ngữ khó hiểu
Dùng câu lệnh tương tác
Nhiêu ký hiệu
Cần quen với ngôn ngữ lập trình
R làm được gì?
R là công cụ phân tích thống kê
Cho phép thực hiện tất cả các mô
hình phân tích
Mô phỏng
Vẽ đồ thị và biểu đồ rất đẹp
Lập trình cho phương pháp mới
Tải phần mềm R
• Truy cập http://cran.r-project/
• R for Windows screen, chọn “base”
• Download R
• Run, chọn OK sau đó chọn FINISH
• Biểu tượng R sẽ xuất hiện trên desktop
• Bắt đầu sử dụng R
Làm việc với R
Object: Đối tượng
- tên cho mỗi đối tượng (case sensitive)
- gán giá trị cho đối tượng sử dụng
assignment operator (<- hoặc =)
Ví dụ:
>tuoi=25
>Tuoi<-25
Note: tuoi và Tuoi là 2 đối tượng khác
nhau
Làm việc với R
Object: Đối tượng
# tạo object sử dụng hàm concatenation
(nối số liệu)
>x = c(1:10)
# gọi các giá trị của object
>x
>x[(x>8)|(x<5)]
kết quả?
Làm việc với R
Object: Cách đặt tên Đối tượng
# tạo object y bao gồm 10 giá trị normal
>y = rnorm(10)
# tạo myobject bao gồm 20 giá trị nornal
>myobject<- rnorm(20)
>my.object<-rnorm(20)
>my object<-rnorm(20)
Không được
Làm việc với R
Làm việc với R
Object: Đối tượng
# tạo object y bao gồm 10 giá trị normal
>y = rnorm(10, mean=0, sd=1)
Hoặc
>y=rnorm(10,0,1)
Làm việc với R
Làm việc với R
Workspace: Môi trường làm việc
# tạo thư mục chứa dữ liệu
> setwd(“D:/thongke”)
Note: + thongke phải được tạo trước ở D:
+ R làm việc với / (không phải \)
# xem thư mục làm việc
> getwd()
Làm việc với R
Workspace: Môi trường làm việc
# chuyển thư mục làm việc
>setwd(“C:/mydocument”)
# lưu trữ lệnh
>savehistory(file=“myfile”)
# mở lệnh đã lưu trữ
>loadhistory(file=“myfile”)
Làm việc với R
Packages: Gói công cụ
- R cấu trúc theo packages
- Mỗi phương pháp phân tích được thiết
kế trong một package
- Tải package về để sử dụng trong R
- Để xem các packages sẳn có
> library()
Làm việc với R
Làm việc với R
Packages: Gói công cụ
# cài đặt package mới
>install.packages(c(“moments”)
> library()
# cài đặt nhiều packages
>install.packages(c(“car”,“ggplot2”))
Làm việc với R
Đọc và lưu dữ liệu trong R
Ghi xuất các dữ liệu dưới dạng file.rda
# tạo hai vector cột x, y
>x=c(1,3,1,3,5)
>y=c(2,5,6,7,8)
# sử dụng data.frame để nhập hai vector x,
y vào object tên là mydat
>mydat=data.frame(x,y)
Đọc và lưu dữ liệu trong R
Đọc và lưu dữ liệu trong R
Ghi xuất các dữ liệu dưới dạng file.rda
# lưu mydat dưới dạng R file với tên
mydatfile.rda
>save(mydat,file=“mydatfile.rda")
Đọc và lưu dữ liệu trong R
Nhập số liệu trực tiếp trong R
# mở cửa sổ nhập liệu bằng lệnh
edit(data.frame())
>nhaplieu=edit(data.frame())
# lưu nhaplieu dưới dạng R file với tên
mynhaplieu.rda
>save(nhaplieu,file=“mynhaplieu.rda")
Đọc và lưu dữ liệu trong R
Đọc dữ liệu vào R
Trực tiếp từ R
Từ text, excel, SPSS, Stata
Từ mạng
Lưu ý: kiểm tra thư mục đang làm việc
Đọc và lưu dữ liệu trong R
Đọc dữ liệu từ R (file.rda)
# gọi tên file (tìm file mynhaplieu.rda)
>filename=file.choose()
# đọc dữ liệu dưới dạng R bằng lệnh load
>dat= load(“mynhaplieu.rda”)
# xem dữ liệu
>head(dat)