Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế - Luận văn, đồ án, đề tài tốt nghiệp

Xu thế là sự vận động tăng hoặc giảm của dữ liệu trong một thời gian dài. Sự vận động này có thể được mô tả bằng một đường thằng hay đường cong toán học. Có thể mô hình hóa hàm xu thế bằng cách thực hiện một hàm hồi quy thích hơpk với biến cần dự báo Y và thời gian T. Để biết được xu thế trong dữ liệu sẽ tuân theo dạng hàm nào cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc Y sau đó nhận dạng đồ thị của hàm số tương ứng với dạng hàm toán học nào. Có khi bằng đồ thị ta chưa phân biệt được dữ liệu có xu thế với dạng hàm nào, khi đó ra phải ước lượng một số mô hình mà mình cho răng có thể phù hợp. Sau đó kiểm định so sánh các chỉ tiêu thống kê để chọn ra mô hình phù hợp nhất.

23 trang | Chia sẻ: lvbuiluyen | Lượt xem: 8093 | Lượt tải: 4

Bạn đang xem trước 20 trang tài liệu Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

CÁC PHƯƠNG PHÁP VÀ MÔ HÌNH DỰ BÁO KINH TẾ-XÃ HỘI Đề tài: Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế. Cơ sở lý thuyết. Định nghĩa: Xu thế là sự vận động tăng hoặc giảm của dữ liệu trong một thời gian dài. Sự vận động này có thể được mô tả bằng một đường thằng hay đường cong toán học. Có thể mô hình hóa hàm xu thế bằng cách thực hiện một hàm hồi quy thích hơpk với biến cần dự báo Y và thời gian T. Các dạng hàm xu thế điển hình: Yt = β1 + β2.T + Ut Yt = β1 + β2.T + β3.T2 + Ut Yt = β1 + β2.T + β3.T2 + β4.T3 + Ut Yt = β1 + β2.ln(T) + Ut Yt = e β1 + β2.T + Ut Yt = β1 + β2.() + Ut ln(Yt ) = β1 + β2.T + Ut Dự báo điểm với hàn xu thế Để biết được xu thế trong dữ liệu sẽ tuân theo dạng hàm nào cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc Y sau đó nhận dạng đồ thị của hàm số tương ứng với dạng hàm toán học nào. Có khi bằng đồ thị ta chưa phân biệt được dữ liệu có xu thế với dạng hàm nào, khi đó ra phải ước lượng một số mô hình mà mình cho răng có thể phù hợp. Sau đó kiểm định so sánh các chỉ tiêu thống kê để chọn ra mô hình phù hợp nhất. Các ví dụ cho mô hình dự báo xu thế và các bước thực hiện với phần mềm Eview. Ví dụ 1: Dự báo tổng sản phẩm quốc nội (GDP) từ những số liệu thu thập được từ năm 1990 đến năm 2010. Năm Tổng sản phẩm quốc nội Tỷ Đồng 1990 131968 1991 139634 1992 151782 1993 164043 1994 178534 1995 195567 1996 213833 1997 231264 1998 244596 1999 256272 2000 273666 2001 292535 2002 313247 2003 336242 2004 362435 2005 393031 2006 425373 2007 461344 2008 490458 2009 516568 Số liệu lấy từ Tổng Cực Thống Kê Việt Nam 2010 Ví Dụ 2: Xây dựng mô hình dự báo số lượng người lao động Mỹ năm 2010 theo phương pháp xu thế. Năm Đội ngũ lao động là công dân Mỹ (nghìn người) 1990 125840 1991 126343 1992 128105 1993 129200 1994 131056 1995 132304 1996 133943 1997 136297 1998 137673 1999 139368 2000 142583 2001 143734 2002 144863 2003 146510 2004 147401 2005 149320 2006 151428 2007 153124 2008 154287 2009 154142 Số liệu lấy từ Cục Tống Kê Nhân Lực Mỹ. Ví dụ 3: Xây dựng mô hình dự báo Tổng vốn đầu tư nước ngoài vào Việt Nam theo phương pháp xu thế. Năm Tổng Vốn Đầu Tư Nước Ngoài Được Thực Hiện (Triệu USD) 1990 187 1991 328 1992 574 1993 1017 1994 2040 1995 2556 1996 2714 1997 3115 1998 2367 1999 2334 2000 2413 2001 2450 2002 2591 2003 2650 2004 2852 2005 3308 2006 4100 2007 8030 2008 11500 2009 10000 Lời nói đầu: - Trong bài chuận bị của nhóm 5 sẽ giới thiệu 1 phương pháp khác nhập dữ liệu cho eview thay vì cách nhập dữ liệu sử dụng Empty Group (Edit Series). Phương pháp đó là Mở Dữ Liệu Ngoại Lai (Files\Open\Open a Foreign as Workfile) - ở đây là Microsoft Exel 2003. Quá trình chuẩn bị phần mềm cùng thiết bị. - Phiên bản Eview được sử dụng là 5.1 đã được mua bản quyền. - File dữ liệu exel chứa nội dung của 3 bảng. Bước 1: Nhập và tinh chỉnh số liệu. - Vì sử dụng phương pháp Open a Foreign as Workfile nên việc nhập dữ liệu trở lên rất nhanh chóng và đơn giản, nhóm chúng tôi quyết định cùng 1 lúc nhập toàn bộ số liệu cho 3 bảng. - Trong giao diện ban đầu của Eview 5.1 Chọn Files\Open\Open a Foreign as Workfile… Hộp thoại Open hiện ra, tìm đến file số liệu dạng exel đã chuẩn bị sẵn chọn Open. Lúc này Eview sẽ tự động tìm kiếm tên biến, dạng số liệu của biến, tần suất. Cửa sổ SpreadSheet Read Step 1 hiện ra - Lựa chọn đầu tiên được mặc định là tự động duyệt toàn bộ trang Exel. - Custom Range: Tùy biến khoảng duyệt - đưa ra các tùy chọn điểm bắt đầu và kết thúc duyệt, số lượng ô dữ liệu được đưa vào. Vì bảng dữ liệu trong exel đã được nhập đúng cách nên không cần phải chọn chế độ custom range nữa mà chúng ta chọn Next luôn. Trong bước 2: - Mục Column headers dùng để tinh chỉnh độ dài của tên cột. Trong ví dụ này trước các số liệu có 2 đầu đề là Tên biến và Đơn vị. Chính vì vậy số trog Header Lines là 2. - Chính vì khả năng rất cao tên biến quá dài không phù hợp cho sử dụng trong eview lên chúng ta nhấp chuột để chọn các biến như Nam, GDP … Tương ứng với đó ta có thể thay đổi tên biến, cũng như thêm các đoạn miêu tả trong Column Info và Description. Sau khi tinh chỉnh tên biến xong nhấn Finish. + Ta được Workfile mới như sau. Chú Ý: Eview tự động lấy 1 biến có tần số giống với tần số trong bộ nhớ để làm biến quan sát – OBS. Trong trường hợp này là biến Nam, tần số là Annual – Năm. + Tinh Chỉnh số liệu: Thêm xóa thay đổi cấu trục dữ liệu sao cho phù hợp với yêu cầu. Như trong hình trên chúng ta thấy thiếu 1 quan sát năm 2010 để dự báo. Vậy để thêm 1 quan sát là năm 2010 thì phải làm thế nào? Có 2 cách nhưng nhanh nhất vẫn là nháy đúp chuột vào chữ Range trong cửa sổ Workfile. Cửa sổ Workfile structure hiện ra chúng ta giờ có thể điều chỉnh Loại, dạng tần số của dữ liệu. Khởi Đầu và kết thúc các quan sát. Như ở trên chúng ta thay đổi End Date từ 2009 thành 2010. Bước 2: Vẽ biểu đồ cho từng biến. Cách làm tương tự như nhau nên nhóm chúng tôi làm 1 lần. Trên thanh công cụ chọn Quick\Graph\ Sau đó nhận vào dạng biểu đồ mà bạn muốn, để dễ cho việc nhận diện dạng đồ thị nhóm chúng tôi chọn biểu đồ đường – Line Graph. Cửa sổ Series List hiện ra chúng ta muốn vẽ biến nào và số lượng ra sao tùy theo yêu cầu. Trong các ví dụ này FDI, GDP, LF không liên quan đến nhau và đơn vị khác nhau nên chúng ta lập đồ thị riêng. Sau khi nhập tên biến xong nhấn OK và chúng ta được đồ thị. Bước3: Xác định dạng đồ thị và tiến hành dự báo thông qua phương pháp xu thế. - Để biết xu thế của dữ liệu sẽ tuân theo dạng hàm nào,cách đơn giản nhất là vẽ đồ thị của biến phụ thuộc sau đó nhận dạng đồ thị. Nhưng có một số trường hợp như với biến FDI, đồ thị như trên ta khó có thể phân biệt được dữ liệu có xu thế tương ứng với dạng hàm nào. Do đó, ta cần phải ước lượng một số mô hình mà mình cho rằng có thể phù hợp. Sau đó, cần kiểm định, so sánh các chỉ tiêu thống kê để tìm ra mô hình phù hợp nhất. 1. Tạo biến xu thế. Cách 1: Chọn Quick/Generate Series để tạo biến mới. Ta gõ t=@trend(1989) với T là tên biến. = là thao tác gán. @trend() là hàm xu thế 1989 là thời điểm bắt đầu chuỗi xu thế. Nhấn Ok ta được bảng giá trị của t như sau. Cách 2: Gõ vào cửa sổ chính là Eview. Genr t = @trend(1989) Trên cửa sổ Workfile hiện hành sẽ xuất hiện thêm biến xu thế t. 2. Dự báo biến phụ thuộc FDI. 2 hàm tương ứng là: Hàm bậc 3 Hàm Ln Ta vào Quick\Equation Estimation… a. Hàm bậc 3. Phương pháp dự báo là LS – Bình Phương Nhỏ Nhất. Xét các quan sát: 1990 – 2010. Ta được kết quả. Dependent Variable: FDI Method: Least Squares Date: 11/14/10 Time: 17:24 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C -2176.476 1067.477 -2.038898 0.0583 T 1699.831 429.5131 3.957577 0.0011 T^2 -201.5634 46.92326 -4.295596 0.0006 T^3 7.532379 1.471111 5.120198 0.0001 R-squared 0.911779 Mean dependent var 3356.300 Adjusted R-squared 0.895238 S.D. dependent var 3019.270 S.E. of regression 977.2457 Akaike info criterion 16.78421 Sum squared resid 15280148 Schwarz criterion 16.98336 Log likelihood -163.8421 F-statistic 55.12118 Durbin-Watson stat 1.735690 Prob(F-statistic) 0.000000 b. Hàm bậc 2. Làm tương tự trong ô Equation Spectification: fdi c t t^2 Dependent Variable: FDI Method: Least Squares Date: 11/14/10 Time: 17:14 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C 1825.477 1145.730 1.593287 0.1295 T -342.1967 251.2764 -1.361834 0.1910 T^2 35.70654 11.62271 3.072136 0.0069 R-squared 0.767228 Mean dependent var 3356.300 Adjusted R-squared 0.739843 S.D. dependent var 3019.270 S.E. of regression 1539.998 Akaike info criterion 17.65443 Sum squared resid 40317078 Schwarz criterion 17.80379 Log likelihood -173.5443 F-statistic 28.01635 Durbin-Watson stat 0.646872 Prob(F-statistic) 0.000004 c. Hàm Ln Làm tương tự trong ô Equation Spectification: log(fdi) c t Dependent Variable: LOG(FDI) Method: Least Squares Date: 11/14/10 Time: 17:19 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C 6.153335 0.239510 25.69137 0.0000 T 0.149719 0.019994 7.488246 0.0000 R-squared 0.756999 Mean dependent var 7.725387 Adjusted R-squared 0.743499 S.D. dependent var 1.018037 S.E. of regression 0.515594 Akaike info criterion 1.607647 Sum squared resid 4.785075 Schwarz criterion 1.707220 Log likelihood -14.07647 F-statistic 56.07382 Durbin-Watson stat 0.314070 Prob(F-statistic) 0.000001 d. So sánh các hàm số xác định hàm phù hợp nhất. Xét giá trị R-squared: chọn mô hình nào có R-squared lớn nhất Hàm bậc ba có R-squared là 0.911779 Hàm bậc hai có R-squared là 0.767228 Hàm loganêpe có R-squared là 0.756999 Vậy hàm bậc 3 phù hợp nhất, từ bảng kết quả của hàm bậc 3 ta chọn Forecast Cửa sổ Forecast hiện ra, tat hay đổi tên chuỗi giá trị dự báo là fdif. Trong đó Root Mean Squared Error: Sai số bình phương trung bình Mean Absolute Error: Sai số tuyệt đối trung bình Mean Abs.Percent Error: Phần trăm sai số tuyệt đối trung bình Các sai số này khá nhỏ. Tương tự với hàm bậc hai và Loganêpe Theo so sánh các sai số ta thấy Hàm bậc 3 là phù hợp nhất. Ta tìm đến chuỗi số dự báo FDIF để tham chiếu giá trị năm 2010. FDI năm 2010 được dự báo sẽ là: 14387.56 (Triệu USD) 3. Dự báo biến phụ thuộc GDP. Làm tương tự như với FDI. Xét 2 hàm Hàm bậc nhất. Hàm bậc 2. Tương ứng với. Dependent Variable: GDP Method: Least Squares Date: 11/14/10 Time: 17:58 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C 78608.58 9972.327 7.882672 0.0000 T 20001.05 832.4738 24.02604 0.0000 R-squared 0.969761 Mean dependent var 288619.6 Adjusted R-squared 0.968081 S.D. dependent var 120158.5 S.E. of regression 21467.50 Akaike info criterion 22.88111 Sum squared resid 8.30E+09 Schwarz criterion 22.98068 Log likelihood -226.8111 F-statistic 577.2507 Durbin-Watson stat 0.136479 Prob(F-statistic) 0.000000 Hàm bậc 2 Dependent Variable: GDP Method: Least Squares Date: 11/14/10 Time: 18:00 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C 129422.9 4599.200 28.14032 0.0000 T 6142.588 1008.676 6.089755 0.0000 T^2 659.9267 46.65597 14.14453 0.0000 R-squared 0.997632 Mean dependent var 288619.6 Adjusted R-squared 0.997353 S.D. dependent var 120158.5 S.E. of regression 6181.872 Akaike info criterion 20.43411 Sum squared resid 6.50E+08 Schwarz criterion 20.58347 Log likelihood -201.3411 F-statistic 3580.659 Durbin-Watson stat 0.374140 Prob(F-statistic) 0.000000 Qua so sánh các sai số ta thấy hàm bậc 2 phù hợp hơn. Kết quả dự báo GDP cho năm 2010 là: 549444.98 (Tỷ Đồng) 4. Dự Báo Biến Phụ Thuộc LF Làm tương tự FDI với các hàm Hàm Bậc Nhất. Hàm bậc hai. Hàm loganêpe Hàm Bậc nhất. Dependent Variable: LF Method: Least Squares Date: 11/14/10 Time: 18:04 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C 123276.0 332.7460 370.4808 0.0000 T 1628.578 27.77710 58.63025 0.0000 R-squared 0.994791 Mean dependent var 140376.1 Adjusted R-squared 0.994502 S.D. dependent var 9659.991 S.E. of regression 716.3045 Akaike info criterion 16.08073 Sum squared resid 9235659. Schwarz criterion 16.18030 Log likelihood -158.8073 F-statistic 3437.506 Durbin-Watson stat 1.037325 Prob(F-statistic) 0.000000 Hàm bậc 2 Dependent Variable: LF Method: Least Squares Date: 11/14/10 Time: 18:05 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C 122887.1 534.9091 229.7346 0.0000 T 1734.634 117.3138 14.78627 0.0000 T^2 -5.050296 5.426314 -0.930705 0.3650 R-squared 0.995043 Mean dependent var 140376.1 Adjusted R-squared 0.994460 S.D. dependent var 9659.991 S.E. of regression 718.9815 Akaike info criterion 16.13103 Sum squared resid 8787884. Schwarz criterion 16.28039 Log likelihood -158.3103 F-statistic 1706.411 Durbin-Watson stat 1.079095 Prob(F-statistic) 0.000000 Hàm Loganepe Dependent Variable: LOG(LF) Method: Least Squares Date: 11/14/10 Time: 18:06 Sample (adjusted): 1990 2009 Included observations: 20 after adjustments Variable Coefficiet Std. Error t-Statistic Prob. C 11.72758 0.002670 4391.652 0.0000 T 0.011641 0.000223 52.22189 0.0000 R-squared 0.993443 Mean dependent var 11.84982 Adjusted R-squared 0.993079 S.D. dependent var 0.069099 S.E. of regression 0.005749 Akaike info criterion -7.385066 Sum squared resid 0.000595 Schwarz criterion -7.285492 Log likelihood 75.85066 F-statistic 2727.126 Durbin-Watson stat 0.819484 Prob(F-statistic) 0.000000 Như vậy hàm bậc 2 là phù hợp nhất. Lực lượng lao động mỹ năm 2010 được dự báo sẽ là: 158269.39 (Nghìn người)