Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế

Xu thế là sự vận động tăng hoặc giảm của dữ liệu trong một thời gian dài. Sự vận động này có thể được mô tả bằng một đường thằng hay đường cong toán học. Có thể mô hình hóa hàm xu thế bằng cách thực hiện một hàm hồi quy thích hơpk với biến cần dự báo Y và thời gian T. Để biết được xu thế trong dữ liệu sẽ tuân theo dạng hàm nào cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc Y sau đó nhận dạng đồ thị của hàm số tương ứng với dạng hàm toán học nào. Có khi bằng đồ thị ta chưa phân biệt được dữ liệu có xu thế với dạng hàm nào, khi đó ra phải ước lượng một số mô hình mà mình cho răng có thể phù hợp. Sau đó kiểm định so sánh các chỉ tiêu thống kê để chọn ra mô hình phù hợp nhất.

doc23 trang | Chia sẻ: lvbuiluyen | Lượt xem: 6834 | Lượt tải: 4download
Bạn đang xem trước 20 trang tài liệu Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CÁC PHƯƠNG PHÁP VÀ MÔ HÌNH DỰ BÁO KINH TẾ-XÃ HỘI Đề tài: Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế. Cơ sở lý thuyết. Định nghĩa: Xu thế là sự vận động tăng hoặc giảm của dữ liệu trong một thời gian dài. Sự vận động này có thể được mô tả bằng một đường thằng hay đường cong toán học. Có thể mô hình hóa hàm xu thế bằng cách thực hiện một hàm hồi quy thích hơpk với biến cần dự báo Y và thời gian T. Các dạng hàm xu thế điển hình: Yt = β1 + β2.T + Ut Yt = β1 + β2.T + β3.T2 + Ut Yt = β1 + β2.T + β3.T2 + β4.T3 + Ut Yt = β1 + β2.ln(T) + Ut Yt = e β1 + β2.T + Ut Yt = β1 + β2.() + Ut ln(Yt ) = β1 + β2.T + Ut Dự báo điểm với hàn xu thế        Để biết được xu thế trong dữ liệu sẽ tuân theo dạng hàm nào cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc Y sau đó nhận dạng đồ thị của hàm số tương ứng với dạng hàm toán học nào. Có khi bằng đồ thị ta chưa phân biệt được dữ liệu có xu thế với dạng hàm nào, khi đó ra phải ước lượng một số mô hình mà mình cho răng có thể phù hợp. Sau đó kiểm định so sánh các chỉ tiêu thống kê để chọn ra mô hình phù hợp nhất. Các ví dụ cho mô hình dự báo xu thế và các bước thực hiện với phần mềm Eview. Ví dụ 1: Dự báo tổng sản phẩm quốc nội (GDP) từ những số liệu thu thập được từ năm 1990 đến năm 2010. Năm  Tổng sản phẩm quốc nội Tỷ Đồng   1990  131968   1991  139634   1992  151782   1993  164043   1994  178534   1995  195567   1996  213833   1997  231264   1998  244596   1999  256272   2000  273666   2001  292535   2002  313247   2003  336242   2004  362435   2005  393031   2006  425373   2007  461344   2008  490458   2009  516568   Số liệu lấy từ Tổng Cực Thống Kê Việt Nam 2010 Ví Dụ 2: Xây dựng mô hình dự báo số lượng người lao động Mỹ năm 2010 theo phương pháp xu thế. Năm  Đội ngũ lao động là công dân Mỹ (nghìn người)   1990  125840   1991  126343   1992  128105   1993  129200   1994  131056   1995  132304   1996  133943   1997  136297   1998  137673   1999  139368   2000  142583   2001  143734   2002  144863   2003  146510   2004  147401   2005  149320   2006  151428   2007  153124   2008  154287   2009  154142   Số liệu lấy từ Cục Tống Kê Nhân Lực Mỹ. Ví dụ 3: Xây dựng mô hình dự báo Tổng vốn đầu tư nước ngoài vào Việt Nam theo phương pháp xu thế. Năm  Tổng Vốn Đầu Tư Nước Ngoài Được Thực Hiện (Triệu USD)   1990  187   1991  328   1992  574   1993  1017   1994  2040   1995  2556   1996  2714   1997  3115   1998  2367   1999  2334   2000  2413   2001  2450   2002  2591   2003  2650   2004  2852   2005  3308   2006  4100   2007  8030   2008  11500   2009  10000   Lời nói đầu: - Trong bài chuận bị của nhóm 5 sẽ giới thiệu 1 phương pháp khác nhập dữ liệu cho eview thay vì cách nhập dữ liệu sử dụng Empty Group (Edit Series). Phương pháp đó là Mở Dữ Liệu Ngoại Lai (Files\Open\Open a Foreign as Workfile) - ở đây là Microsoft Exel 2003. Quá trình chuẩn bị phần mềm cùng thiết bị. - Phiên bản Eview được sử dụng là 5.1 đã được mua bản quyền. - File dữ liệu exel chứa nội dung của 3 bảng. Bước 1: Nhập và tinh chỉnh số liệu. - Vì sử dụng phương pháp Open a Foreign as Workfile nên việc nhập dữ liệu trở lên rất nhanh chóng và đơn giản, nhóm chúng tôi quyết định cùng 1 lúc nhập toàn bộ số liệu cho 3 bảng. - Trong giao diện ban đầu của Eview 5.1 Chọn Files\Open\Open a Foreign as Workfile… Hộp thoại Open hiện ra, tìm đến file số liệu dạng exel đã chuẩn bị sẵn chọn Open.  Lúc này Eview sẽ tự động tìm kiếm tên biến, dạng số liệu của biến, tần suất.  Cửa sổ SpreadSheet Read Step 1 hiện ra - Lựa chọn đầu tiên được mặc định là tự động duyệt toàn bộ trang Exel. - Custom Range: Tùy biến khoảng duyệt - đưa ra các tùy chọn điểm bắt đầu và kết thúc duyệt, số lượng ô dữ liệu được đưa vào. Vì bảng dữ liệu trong exel đã được nhập đúng cách nên không cần phải chọn chế độ custom range nữa mà chúng ta chọn Next luôn.  Trong bước 2: - Mục Column headers dùng để tinh chỉnh độ dài của tên cột. Trong ví dụ này trước các số liệu có 2 đầu đề là Tên biến và Đơn vị. Chính vì vậy số trog Header Lines là 2. - Chính vì khả năng rất cao tên biến quá dài không phù hợp cho sử dụng trong eview lên chúng ta nhấp chuột để chọn các biến như Nam, GDP … Tương ứng với đó ta có thể thay đổi tên biến, cũng như thêm các đoạn miêu tả trong Column Info và Description. Sau khi tinh chỉnh tên biến xong nhấn Finish. + Ta được Workfile mới như sau.  Chú Ý: Eview tự động lấy 1 biến có tần số giống với tần số trong bộ nhớ để làm biến quan sát – OBS. Trong trường hợp này là biến Nam, tần số là Annual – Năm. + Tinh Chỉnh số liệu: Thêm xóa thay đổi cấu trục dữ liệu sao cho phù hợp với yêu cầu. Như trong hình trên chúng ta thấy thiếu 1 quan sát năm 2010 để dự báo. Vậy để thêm 1 quan sát là năm 2010 thì phải làm thế nào? Có 2 cách nhưng nhanh nhất vẫn là nháy đúp chuột vào chữ Range trong cửa sổ Workfile.  Cửa sổ Workfile structure hiện ra chúng ta giờ có thể điều chỉnh Loại, dạng tần số của dữ liệu. Khởi Đầu và kết thúc các quan sát. Như ở trên chúng ta thay đổi End Date từ 2009 thành 2010. Bước 2: Vẽ biểu đồ cho từng biến. Cách làm tương tự như nhau nên nhóm chúng tôi làm 1 lần. Trên thanh công cụ chọn Quick\Graph\ Sau đó nhận vào dạng biểu đồ mà bạn muốn, để dễ cho việc nhận diện dạng đồ thị nhóm chúng tôi chọn biểu đồ đường – Line Graph.   Cửa sổ Series List hiện ra chúng ta muốn vẽ biến nào và số lượng ra sao tùy theo yêu cầu. Trong các ví dụ này FDI, GDP, LF không liên quan đến nhau và đơn vị khác nhau nên chúng ta lập đồ thị riêng. Sau khi nhập tên biến xong nhấn OK và chúng ta được đồ thị.   Bước3: Xác định dạng đồ thị và tiến hành dự báo thông qua phương pháp xu thế. - Để biết xu thế của dữ liệu sẽ tuân theo dạng hàm nào,cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc sau đó nhận dạng đồ thị. Nhưng có một số trường hợp như với biến FDI, đồ thị như trên ta khó có thể phân biệt được dữ liệu có xu thế tương ứng với dạng hàm nào. Do đó, ta cần phải ước lượng một số mô hình mà mình cho rằng có thể phù hợp. Sau đó, cần kiểm định, so sánh các chỉ tiêu thống kê để tìm ra mô hình phù hợp nhất. 1. Tạo biến xu thế. Cách 1: Chọn Quick/Generate Series để tạo biến mới.   Ta gõ t=@trend(1989) với T là tên biến. = là thao tác gán. @trend() là hàm xu thế 1989 là thời điểm bắt đầu chuỗi xu thế. Nhấn Ok ta được bảng giá trị của t như sau.  Cách 2: Gõ vào cửa sổ chính là Eview. Genr t = @trend(1989) Trên cửa sổ Workfile hiện hành sẽ xuất hiện thêm biến xu thế t. 2. Dự báo biến phụ thuộc FDI. 2 hàm tương ứng là: Hàm bậc 3 Hàm Ln Ta vào Quick\Equation Estimation… a. Hàm bậc 3.  Phương pháp dự báo là LS – Bình Phương Nhỏ Nhất. Xét các quan sát: 1990 – 2010. Ta được kết quả. Dependent Variable: FDI     Method: Least Squares     Date: 11/14/10 Time: 17:24     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  -2176.476  1067.477  -2.038898  0.0583   T  1699.831  429.5131  3.957577  0.0011   T^2  -201.5634  46.92326  -4.295596  0.0006   T^3  7.532379  1.471111  5.120198  0.0001               R-squared  0.911779      Mean dependent var  3356.300   Adjusted R-squared  0.895238      S.D. dependent var  3019.270   S.E. of regression  977.2457      Akaike info criterion  16.78421   Sum squared resid  15280148      Schwarz criterion  16.98336   Log likelihood  -163.8421      F-statistic  55.12118   Durbin-Watson stat  1.735690      Prob(F-statistic)  0.000000               b. Hàm bậc 2. Làm tương tự trong ô Equation Spectification: fdi c t t^2 Dependent Variable: FDI     Method: Least Squares     Date: 11/14/10 Time: 17:14     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  1825.477  1145.730  1.593287  0.1295   T  -342.1967  251.2764  -1.361834  0.1910   T^2  35.70654  11.62271  3.072136  0.0069               R-squared  0.767228      Mean dependent var  3356.300   Adjusted R-squared  0.739843      S.D. dependent var  3019.270   S.E. of regression  1539.998      Akaike info criterion  17.65443   Sum squared resid  40317078      Schwarz criterion  17.80379   Log likelihood  -173.5443      F-statistic  28.01635   Durbin-Watson stat  0.646872      Prob(F-statistic)  0.000004               c. Hàm Ln Làm tương tự trong ô Equation Spectification: log(fdi) c t Dependent Variable: LOG(FDI)     Method: Least Squares     Date: 11/14/10 Time: 17:19     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  6.153335  0.239510  25.69137  0.0000   T  0.149719  0.019994  7.488246  0.0000               R-squared  0.756999      Mean dependent var  7.725387   Adjusted R-squared  0.743499      S.D. dependent var  1.018037   S.E. of regression  0.515594      Akaike info criterion  1.607647   Sum squared resid  4.785075      Schwarz criterion  1.707220   Log likelihood  -14.07647      F-statistic  56.07382   Durbin-Watson stat  0.314070      Prob(F-statistic)  0.000001                     d. So sánh các hàm số xác định hàm phù hợp nhất. Xét giá trị R-squared: chọn mô hình nào có R-squared lớn nhất Hàm bậc ba có R-squared là 0.911779 Hàm bậc hai có R-squared là 0.767228 Hàm loganêpe có R-squared là 0.756999 Vậy hàm bậc 3 phù hợp nhất, từ bảng kết quả của hàm bậc 3 ta chọn Forecast  Cửa sổ Forecast hiện ra, tat hay đổi tên chuỗi giá trị dự báo là fdif.  Trong đó Root Mean Squared Error: Sai số bình phương trung bình Mean Absolute Error: Sai số tuyệt đối trung bình Mean Abs.Percent Error: Phần trăm sai số tuyệt đối trung bình Các sai số này khá nhỏ. Tương tự với hàm bậc hai và Loganêpe   Theo so sánh các sai số ta thấy Hàm bậc 3 là phù hợp nhất. Ta tìm đến chuỗi số dự báo FDIF để tham chiếu giá trị năm 2010. FDI năm 2010 được dự báo sẽ là: 14387.56 (Triệu USD) 3. Dự báo biến phụ thuộc GDP. Làm tương tự như với FDI. Xét 2 hàm Hàm bậc nhất. Hàm bậc 2. Tương ứng với. Dependent Variable: GDP     Method: Least Squares     Date: 11/14/10 Time: 17:58     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  78608.58  9972.327  7.882672  0.0000   T  20001.05  832.4738  24.02604  0.0000               R-squared  0.969761      Mean dependent var  288619.6   Adjusted R-squared  0.968081      S.D. dependent var  120158.5   S.E. of regression  21467.50      Akaike info criterion  22.88111   Sum squared resid  8.30E+09      Schwarz criterion  22.98068   Log likelihood  -226.8111      F-statistic  577.2507   Durbin-Watson stat  0.136479      Prob(F-statistic)  0.000000                Hàm bậc 2 Dependent Variable: GDP     Method: Least Squares     Date: 11/14/10 Time: 18:00     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  129422.9  4599.200  28.14032  0.0000   T  6142.588  1008.676  6.089755  0.0000   T^2  659.9267  46.65597  14.14453  0.0000               R-squared  0.997632      Mean dependent var  288619.6   Adjusted R-squared  0.997353      S.D. dependent var  120158.5   S.E. of regression  6181.872      Akaike info criterion  20.43411   Sum squared resid  6.50E+08      Schwarz criterion  20.58347   Log likelihood  -201.3411      F-statistic  3580.659   Durbin-Watson stat  0.374140      Prob(F-statistic)  0.000000                Qua so sánh các sai số ta thấy hàm bậc 2 phù hợp hơn. Kết quả dự báo GDP cho năm 2010 là: 549444.98 (Tỷ Đồng) 4. Dự Báo Biến Phụ Thuộc LF Làm tương tự FDI với các hàm Hàm Bậc Nhất. Hàm bậc hai. Hàm loganêpe Hàm Bậc nhất. Dependent Variable: LF     Method: Least Squares     Date: 11/14/10 Time: 18:04     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  123276.0  332.7460  370.4808  0.0000   T  1628.578  27.77710  58.63025  0.0000               R-squared  0.994791      Mean dependent var  140376.1   Adjusted R-squared  0.994502      S.D. dependent var  9659.991   S.E. of regression  716.3045      Akaike info criterion  16.08073   Sum squared resid  9235659.      Schwarz criterion  16.18030   Log likelihood  -158.8073      F-statistic  3437.506   Durbin-Watson stat  1.037325      Prob(F-statistic)  0.000000                Hàm bậc 2 Dependent Variable: LF     Method: Least Squares     Date: 11/14/10 Time: 18:05     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  122887.1  534.9091  229.7346  0.0000   T  1734.634  117.3138  14.78627  0.0000   T^2  -5.050296  5.426314  -0.930705  0.3650               R-squared  0.995043      Mean dependent var  140376.1   Adjusted R-squared  0.994460      S.D. dependent var  9659.991   S.E. of regression  718.9815      Akaike info criterion  16.13103   Sum squared resid  8787884.      Schwarz criterion  16.28039   Log likelihood  -158.3103      F-statistic  1706.411   Durbin-Watson stat  1.079095      Prob(F-statistic)  0.000000                Hàm Loganepe Dependent Variable: LOG(LF)     Method: Least Squares     Date: 11/14/10 Time: 18:06     Sample (adjusted): 1990 2009     Included observations: 20 after adjustments                Variable  Coefficiet  Std. Error  t-Statistic  Prob.                 C  11.72758  0.002670  4391.652  0.0000   T  0.011641  0.000223  52.22189  0.0000               R-squared  0.993443      Mean dependent var  11.84982   Adjusted R-squared  0.993079      S.D. dependent var  0.069099   S.E. of regression  0.005749      Akaike info criterion  -7.385066   Sum squared resid  0.000595      Schwarz criterion  -7.285492   Log likelihood  75.85066      F-statistic  2727.126   Durbin-Watson stat  0.819484      Prob(F-statistic)  0.000000                Như vậy hàm bậc 2 là phù hợp nhất. Lực lượng lao động mỹ năm 2010 được dự báo sẽ là: 158269.39 (Nghìn người)