Tải bản đầy đủ (.ppt) (60 trang)

ỨNG DỤNG NGÔN NGỮ R TRONG PHÂN TÍCH DỮ LIỆU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 60 trang )

R

ỨNG DỤNG NGÔN NGỮ
TRONG PHÂN TÍCH DỮ LIỆU
Nhóm thực hiện: Phan Đình Khôi

Nguyễn Hồ Anh Khoa


Nội dung chính
Hướng dẫn cài đặt và vận hành R
Xử lý số liệu bằng R
Phân tích thống kê mô tả bằng R
Phân tích hồi quy bằng R
Phân tích dãy số thời gian bằng R


Nội dung 1. GIỚI THIỆU R
 Tại sao sử dụng R
 Tổng quan R
 Workspace
 Đọc và lưu dữ liệu trong R


Tại sao R
 Mã nguồn mở
 Hoàn toàn miễn phí
 Chạy trên nền Windows, MacOS
 Nhiều phương pháp phân tích không
có trong các phần mền khác
 Vẽ biểu đồ tuyệt vời




Lưu ý!
 Thuật ngữ/ngôn ngữ khó hiểu
 Dùng câu lệnh tương tác
 Nhiêu ký hiệu
 Cần quen với ngôn ngữ lập trình


R làm được gì?
 R là công cụ phân tích thống kê
 Cho phép thực hiện tất cả các mô
hình phân tích
 Mô phỏng
 Vẽ đồ thị và biểu đồ rất đẹp
 Lập trình cho phương pháp mới


Tải phần mềm R
• Truy cập http://cran.r-project/
• R for Windows screen, chọn “base”
• Download R
• Run, chọn OK sau đó chọn FINISH
• Biểu tượng R sẽ xuất hiện trên desktop
• Bắt đầu sử dụng R


Làm việc với R
 Object: Đối tượng
- tên cho mỗi đối tượng (case sensitive)

- gán giá trị cho đối tượng sử dụng
assignment operator (<- hoặc =)
Ví dụ:

>tuoi=25
>Tuoi<-25

Note: tuoi và Tuoi là 2 đối tượng khác
nhau


Làm việc với R
 Object: Đối tượng
# tạo object sử dụng hàm concatenation
(nối số liệu)
>x = c(1:10)
# gọi các giá trị của object
>x
>x[(x>8)|(x<5)]

kết quả?


Làm việc với R
 Object: Cách đặt tên Đối tượng
# tạo object y bao gồm 10 giá trị normal
>y = rnorm(10)
# tạo myobject bao gồm 20 giá trị nornal
>myobject<- rnorm(20)
>my.object<-rnorm(20)

>my object<-rnorm(20)

Không được


Làm việc với R


Làm việc với R
 Object: Đối tượng
# tạo object y bao gồm 10 giá trị normal
>y = rnorm(10, mean=0, sd=1)
Hoặc
>y=rnorm(10,0,1)


Làm việc với R


Làm việc với R
 Workspace: Môi trường làm việc
# tạo thư mục chứa dữ liệu
> setwd(“D:/thongke”)
Note: + thongke phải được tạo trước ở D:
+ R làm việc với / (không phải \)
# xem thư mục làm việc
> getwd()


Làm việc với R

 Workspace: Môi trường làm việc
# chuyển thư mục làm việc
>setwd(“C:/mydocument”)
# lưu trữ lệnh
>savehistory(file=“myfile”)
# mở lệnh đã lưu trữ
>loadhistory(file=“myfile”)


Làm việc với R
 Packages: Gói công cụ
- R cấu trúc theo packages
- Mỗi phương pháp phân tích được thiết
kế trong một package
- Tải package về để sử dụng trong R
- Để xem các packages sẳn có
> library()


Làm việc với R


Làm việc với R
 Packages: Gói công cụ
# cài đặt package mới
>install.packages(c(“moments”)
> library()
# cài đặt nhiều packages
>install.packages(c(“car”,“ggplot2”))



Làm việc với R


Đọc và lưu dữ liệu trong R
 Ghi xuất các dữ liệu dưới dạng file.rda
# tạo hai vector cột x, y
>x=c(1,3,1,3,5)
>y=c(2,5,6,7,8)
# sử dụng data.frame để nhập hai vector x,
y vào object tên là mydat
>mydat=data.frame(x,y)


Đọc và lưu dữ liệu trong R


Đọc và lưu dữ liệu trong R
 Ghi xuất các dữ liệu dưới dạng file.rda
# lưu mydat dưới dạng R file với tên
mydatfile.rda
>save(mydat,file=“mydatfile.rda")


Đọc và lưu dữ liệu trong R
 Nhập số liệu trực tiếp trong R
# mở cửa sổ nhập liệu bằng lệnh
edit(data.frame())
>nhaplieu=edit(data.frame())
# lưu nhaplieu dưới dạng R file với tên

mynhaplieu.rda
>save(nhaplieu,file=“mynhaplieu.rda")


Đọc và lưu dữ liệu trong R
 Đọc dữ liệu vào R
 Trực tiếp từ R
 Từ text, excel, SPSS, Stata
 Từ mạng
 Lưu ý: kiểm tra thư mục đang làm việc


Đọc và lưu dữ liệu trong R
 Đọc dữ liệu từ R (file.rda)
# gọi tên file (tìm file mynhaplieu.rda)
>filename=file.choose()
# đọc dữ liệu dưới dạng R bằng lệnh load
>dat= load(“mynhaplieu.rda”)
# xem dữ liệu
>head(dat)


×