Xu thế là sự vận động tăng hoặc giảm của dữ liệu trong một thời gian dài. Sự vận động này có thể được mô tả bằng một đường thằng hay đường cong toán học.
Có thể mô hình hóa hàm xu thế bằng cách thực hiện một hàm hồi quy thích hơpk với biến cần dự báo Y và thời gian T.
Để biết được xu thế trong dữ liệu sẽ tuân theo dạng hàm nào cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc Y sau đó nhận dạng đồ thị của hàm số tương ứng với dạng hàm toán học nào. Có khi bằng đồ thị ta chưa phân biệt được dữ liệu có xu thế với dạng hàm nào, khi đó ra phải ước lượng một số mô hình mà mình cho răng có thể phù hợp. Sau đó kiểm định so sánh các chỉ tiêu thống kê để chọn ra mô hình phù hợp nhất.
23 trang |
Chia sẻ: lvbuiluyen | Lượt xem: 6834 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CÁC PHƯƠNG PHÁP VÀ MÔ HÌNH DỰ BÁO KINH TẾ-XÃ HỘI
Đề tài: Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế.
Cơ sở lý thuyết.
Định nghĩa:
Xu thế là sự vận động tăng hoặc giảm của dữ liệu trong một thời gian dài. Sự vận động này có thể được mô tả bằng một đường thằng hay đường cong toán học.
Có thể mô hình hóa hàm xu thế bằng cách thực hiện một hàm hồi quy thích hơpk với biến cần dự báo Y và thời gian T.
Các dạng hàm xu thế điển hình:
Yt = β1 + β2.T + Ut
Yt = β1 + β2.T + β3.T2 + Ut
Yt = β1 + β2.T + β3.T2 + β4.T3 + Ut
Yt = β1 + β2.ln(T) + Ut Yt = e β1 + β2.T + Ut
Yt = β1 + β2.() + Ut ln(Yt ) = β1 + β2.T + Ut
Dự báo điểm với hàn xu thế
Để biết được xu thế trong dữ liệu sẽ tuân theo dạng hàm nào cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc Y sau đó nhận dạng đồ thị của hàm số tương ứng với dạng hàm toán học nào. Có khi bằng đồ thị ta chưa phân biệt được dữ liệu có xu thế với dạng hàm nào, khi đó ra phải ước lượng một số mô hình mà mình cho răng có thể phù hợp. Sau đó kiểm định so sánh các chỉ tiêu thống kê để chọn ra mô hình phù hợp nhất.
Các ví dụ cho mô hình dự báo xu thế và các bước thực hiện với phần mềm Eview.
Ví dụ 1: Dự báo tổng sản phẩm quốc nội (GDP) từ những số liệu thu thập được từ năm 1990 đến năm 2010.
Năm
Tổng sản phẩm quốc nội
Tỷ Đồng
1990
131968
1991
139634
1992
151782
1993
164043
1994
178534
1995
195567
1996
213833
1997
231264
1998
244596
1999
256272
2000
273666
2001
292535
2002
313247
2003
336242
2004
362435
2005
393031
2006
425373
2007
461344
2008
490458
2009
516568
Số liệu lấy từ Tổng Cực Thống Kê Việt Nam 2010
Ví Dụ 2: Xây dựng mô hình dự báo số lượng người lao động Mỹ năm 2010 theo phương pháp xu thế.
Năm
Đội ngũ lao động là công dân Mỹ
(nghìn người)
1990
125840
1991
126343
1992
128105
1993
129200
1994
131056
1995
132304
1996
133943
1997
136297
1998
137673
1999
139368
2000
142583
2001
143734
2002
144863
2003
146510
2004
147401
2005
149320
2006
151428
2007
153124
2008
154287
2009
154142
Số liệu lấy từ Cục Tống Kê Nhân Lực Mỹ.
Ví dụ 3: Xây dựng mô hình dự báo Tổng vốn đầu tư nước ngoài vào Việt Nam theo phương pháp xu thế.
Năm
Tổng Vốn Đầu Tư Nước Ngoài Được Thực Hiện
(Triệu USD)
1990
187
1991
328
1992
574
1993
1017
1994
2040
1995
2556
1996
2714
1997
3115
1998
2367
1999
2334
2000
2413
2001
2450
2002
2591
2003
2650
2004
2852
2005
3308
2006
4100
2007
8030
2008
11500
2009
10000
Lời nói đầu:
- Trong bài chuận bị của nhóm 5 sẽ giới thiệu 1 phương pháp khác nhập dữ liệu cho eview thay vì cách nhập dữ liệu sử dụng Empty Group (Edit Series). Phương pháp đó là Mở Dữ Liệu Ngoại Lai (Files\Open\Open a Foreign as Workfile) - ở đây là Microsoft Exel 2003.
Quá trình chuẩn bị phần mềm cùng thiết bị.
- Phiên bản Eview được sử dụng là 5.1 đã được mua bản quyền.
- File dữ liệu exel chứa nội dung của 3 bảng.
Bước 1: Nhập và tinh chỉnh số liệu.
- Vì sử dụng phương pháp Open a Foreign as Workfile nên việc nhập dữ liệu trở lên rất nhanh chóng và đơn giản, nhóm chúng tôi quyết định cùng 1 lúc nhập toàn bộ số liệu cho 3 bảng.
- Trong giao diện ban đầu của Eview 5.1 Chọn Files\Open\Open a Foreign as Workfile…
Hộp thoại Open hiện ra, tìm đến file số liệu dạng exel đã chuẩn bị sẵn chọn
Open.
Lúc này Eview sẽ tự động tìm kiếm tên biến, dạng số liệu của biến, tần suất.
Cửa sổ SpreadSheet Read Step 1 hiện ra
- Lựa chọn đầu tiên được mặc định là tự động duyệt toàn bộ trang Exel.
- Custom Range: Tùy biến khoảng duyệt - đưa ra các tùy chọn điểm bắt đầu và kết thúc duyệt, số lượng ô dữ liệu được đưa vào.
Vì bảng dữ liệu trong exel đã được nhập đúng cách nên không cần phải chọn chế độ custom range nữa mà chúng ta chọn Next luôn.
Trong bước 2:
- Mục Column headers dùng để tinh chỉnh độ dài của tên cột. Trong ví dụ này trước các số liệu có 2 đầu đề là Tên biến và Đơn vị. Chính vì vậy số trog Header Lines là 2.
- Chính vì khả năng rất cao tên biến quá dài không phù hợp cho sử dụng trong eview lên chúng ta nhấp chuột để chọn các biến như Nam, GDP … Tương ứng với đó ta có thể thay đổi tên biến, cũng như thêm các đoạn miêu tả trong Column Info và Description.
Sau khi tinh chỉnh tên biến xong nhấn Finish.
+ Ta được Workfile mới như sau.
Chú Ý: Eview tự động lấy 1 biến có tần số giống với tần số trong bộ nhớ để làm biến quan sát – OBS. Trong trường hợp này là biến Nam, tần số là Annual – Năm.
+ Tinh Chỉnh số liệu: Thêm xóa thay đổi cấu trục dữ liệu sao cho phù hợp với yêu cầu.
Như trong hình trên chúng ta thấy thiếu 1 quan sát năm 2010 để dự báo. Vậy để thêm 1 quan sát là năm 2010 thì phải làm thế nào?
Có 2 cách nhưng nhanh nhất vẫn là nháy đúp chuột vào chữ Range trong cửa sổ Workfile.
Cửa sổ Workfile structure hiện ra chúng ta giờ có thể điều chỉnh Loại, dạng tần số của dữ liệu. Khởi Đầu và kết thúc các quan sát. Như ở trên chúng ta thay đổi End Date từ 2009 thành 2010.
Bước 2: Vẽ biểu đồ cho từng biến.
Cách làm tương tự như nhau nên nhóm chúng tôi làm 1 lần.
Trên thanh công cụ chọn Quick\Graph\ Sau đó nhận vào dạng biểu đồ mà bạn muốn, để dễ cho việc nhận diện dạng đồ thị nhóm chúng tôi chọn biểu đồ đường – Line Graph.
Cửa sổ Series List hiện ra chúng ta muốn vẽ biến nào và số lượng ra sao tùy theo yêu cầu. Trong các ví dụ này FDI, GDP, LF không liên quan đến nhau và đơn vị khác nhau nên chúng ta lập đồ thị riêng.
Sau khi nhập tên biến xong nhấn OK và chúng ta được đồ thị.
Bước3: Xác định dạng đồ thị và tiến hành dự báo thông qua phương pháp xu thế.
- Để biết xu thế của dữ liệu sẽ tuân theo dạng hàm nào,cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc sau đó nhận dạng đồ thị. Nhưng có một số trường hợp như với biến FDI, đồ thị như trên ta khó có thể phân biệt được dữ liệu có xu thế tương ứng với dạng hàm nào. Do đó, ta cần phải ước lượng một số mô hình mà mình cho rằng có thể phù hợp. Sau đó, cần kiểm định, so sánh các chỉ tiêu thống kê để tìm ra mô hình phù hợp nhất.
1. Tạo biến xu thế.
Cách 1:
Chọn Quick/Generate Series để tạo biến mới.
Ta gõ t=@trend(1989) với
T là tên biến.
= là thao tác gán.
@trend() là hàm xu thế
1989 là thời điểm bắt đầu chuỗi xu thế.
Nhấn Ok ta được bảng giá trị của t như sau.
Cách 2:
Gõ vào cửa sổ chính là Eview.
Genr t = @trend(1989)
Trên cửa sổ Workfile hiện hành sẽ xuất hiện thêm biến xu thế t.
2. Dự báo biến phụ thuộc FDI.
2 hàm tương ứng là:
Hàm bậc 3
Hàm Ln
Ta vào Quick\Equation Estimation…
a. Hàm bậc 3.
Phương pháp dự báo là LS – Bình Phương Nhỏ Nhất.
Xét các quan sát: 1990 – 2010.
Ta được kết quả.
Dependent Variable: FDI
Method: Least Squares
Date: 11/14/10 Time: 17:24
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
-2176.476
1067.477
-2.038898
0.0583
T
1699.831
429.5131
3.957577
0.0011
T^2
-201.5634
46.92326
-4.295596
0.0006
T^3
7.532379
1.471111
5.120198
0.0001
R-squared
0.911779
Mean dependent var
3356.300
Adjusted R-squared
0.895238
S.D. dependent var
3019.270
S.E. of regression
977.2457
Akaike info criterion
16.78421
Sum squared resid
15280148
Schwarz criterion
16.98336
Log likelihood
-163.8421
F-statistic
55.12118
Durbin-Watson stat
1.735690
Prob(F-statistic)
0.000000
b. Hàm bậc 2.
Làm tương tự trong ô Equation Spectification: fdi c t t^2
Dependent Variable: FDI
Method: Least Squares
Date: 11/14/10 Time: 17:14
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
1825.477
1145.730
1.593287
0.1295
T
-342.1967
251.2764
-1.361834
0.1910
T^2
35.70654
11.62271
3.072136
0.0069
R-squared
0.767228
Mean dependent var
3356.300
Adjusted R-squared
0.739843
S.D. dependent var
3019.270
S.E. of regression
1539.998
Akaike info criterion
17.65443
Sum squared resid
40317078
Schwarz criterion
17.80379
Log likelihood
-173.5443
F-statistic
28.01635
Durbin-Watson stat
0.646872
Prob(F-statistic)
0.000004
c. Hàm Ln
Làm tương tự trong ô Equation Spectification: log(fdi) c t
Dependent Variable: LOG(FDI)
Method: Least Squares
Date: 11/14/10 Time: 17:19
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
6.153335
0.239510
25.69137
0.0000
T
0.149719
0.019994
7.488246
0.0000
R-squared
0.756999
Mean dependent var
7.725387
Adjusted R-squared
0.743499
S.D. dependent var
1.018037
S.E. of regression
0.515594
Akaike info criterion
1.607647
Sum squared resid
4.785075
Schwarz criterion
1.707220
Log likelihood
-14.07647
F-statistic
56.07382
Durbin-Watson stat
0.314070
Prob(F-statistic)
0.000001
d. So sánh các hàm số xác định hàm phù hợp nhất.
Xét giá trị R-squared: chọn mô hình nào có R-squared lớn nhất
Hàm bậc ba có R-squared là 0.911779
Hàm bậc hai có R-squared là 0.767228
Hàm loganêpe có R-squared là 0.756999
Vậy hàm bậc 3 phù hợp nhất, từ bảng kết quả của hàm bậc 3 ta chọn Forecast
Cửa sổ Forecast hiện ra, tat hay đổi tên chuỗi giá trị dự báo là fdif.
Trong đó
Root Mean Squared Error: Sai số bình phương trung bình
Mean Absolute Error: Sai số tuyệt đối trung bình
Mean Abs.Percent Error: Phần trăm sai số tuyệt đối trung bình
Các sai số này khá nhỏ.
Tương tự với hàm bậc hai và Loganêpe
Theo so sánh các sai số ta thấy Hàm bậc 3 là phù hợp nhất. Ta tìm đến chuỗi số dự báo FDIF để tham chiếu giá trị năm 2010.
FDI năm 2010 được dự báo sẽ là: 14387.56 (Triệu USD)
3. Dự báo biến phụ thuộc GDP.
Làm tương tự như với FDI.
Xét 2 hàm
Hàm bậc nhất.
Hàm bậc 2.
Tương ứng với.
Dependent Variable: GDP
Method: Least Squares
Date: 11/14/10 Time: 17:58
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
78608.58
9972.327
7.882672
0.0000
T
20001.05
832.4738
24.02604
0.0000
R-squared
0.969761
Mean dependent var
288619.6
Adjusted R-squared
0.968081
S.D. dependent var
120158.5
S.E. of regression
21467.50
Akaike info criterion
22.88111
Sum squared resid
8.30E+09
Schwarz criterion
22.98068
Log likelihood
-226.8111
F-statistic
577.2507
Durbin-Watson stat
0.136479
Prob(F-statistic)
0.000000
Hàm bậc 2
Dependent Variable: GDP
Method: Least Squares
Date: 11/14/10 Time: 18:00
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
129422.9
4599.200
28.14032
0.0000
T
6142.588
1008.676
6.089755
0.0000
T^2
659.9267
46.65597
14.14453
0.0000
R-squared
0.997632
Mean dependent var
288619.6
Adjusted R-squared
0.997353
S.D. dependent var
120158.5
S.E. of regression
6181.872
Akaike info criterion
20.43411
Sum squared resid
6.50E+08
Schwarz criterion
20.58347
Log likelihood
-201.3411
F-statistic
3580.659
Durbin-Watson stat
0.374140
Prob(F-statistic)
0.000000
Qua so sánh các sai số ta thấy hàm bậc 2 phù hợp hơn.
Kết quả dự báo GDP cho năm 2010 là: 549444.98 (Tỷ Đồng)
4. Dự Báo Biến Phụ Thuộc LF
Làm tương tự FDI với các hàm
Hàm Bậc Nhất.
Hàm bậc hai.
Hàm loganêpe
Hàm Bậc nhất.
Dependent Variable: LF
Method: Least Squares
Date: 11/14/10 Time: 18:04
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
123276.0
332.7460
370.4808
0.0000
T
1628.578
27.77710
58.63025
0.0000
R-squared
0.994791
Mean dependent var
140376.1
Adjusted R-squared
0.994502
S.D. dependent var
9659.991
S.E. of regression
716.3045
Akaike info criterion
16.08073
Sum squared resid
9235659.
Schwarz criterion
16.18030
Log likelihood
-158.8073
F-statistic
3437.506
Durbin-Watson stat
1.037325
Prob(F-statistic)
0.000000
Hàm bậc 2
Dependent Variable: LF
Method: Least Squares
Date: 11/14/10 Time: 18:05
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
122887.1
534.9091
229.7346
0.0000
T
1734.634
117.3138
14.78627
0.0000
T^2
-5.050296
5.426314
-0.930705
0.3650
R-squared
0.995043
Mean dependent var
140376.1
Adjusted R-squared
0.994460
S.D. dependent var
9659.991
S.E. of regression
718.9815
Akaike info criterion
16.13103
Sum squared resid
8787884.
Schwarz criterion
16.28039
Log likelihood
-158.3103
F-statistic
1706.411
Durbin-Watson stat
1.079095
Prob(F-statistic)
0.000000
Hàm Loganepe
Dependent Variable: LOG(LF)
Method: Least Squares
Date: 11/14/10 Time: 18:06
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable
Coefficiet
Std. Error
t-Statistic
Prob.
C
11.72758
0.002670
4391.652
0.0000
T
0.011641
0.000223
52.22189
0.0000
R-squared
0.993443
Mean dependent var
11.84982
Adjusted R-squared
0.993079
S.D. dependent var
0.069099
S.E. of regression
0.005749
Akaike info criterion
-7.385066
Sum squared resid
0.000595
Schwarz criterion
-7.285492
Log likelihood
75.85066
F-statistic
2727.126
Durbin-Watson stat
0.819484
Prob(F-statistic)
0.000000
Như vậy hàm bậc 2 là phù hợp nhất.
Lực lượng lao động mỹ năm 2010 được dự báo sẽ là: 158269.39 (Nghìn người)