Đề tài Khắc phục hiện tượng tự tương quan - Luận văn, đồ án, đề tài tốt nghiệp

Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo). Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu Ui nghĩa là: Cov(Ui , Uj ) = 0 (i j)

16 trang | Chia sẻ: tuandn | Lượt xem: 5565 | Lượt tải: 5Free

Bạn đang xem nội dung tài liệu Đề tài Khắc phục hiện tượng tự tương quan, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Đề cương Phần 1: Bản chất hiện tượng tự tương quan ……………………………. 2 1.1. Định nghĩa………………………………………………………………. 2 1.2. Nguyên nhân của tự tương quan………………………………………… 2 1.2.1. Nguyên nhân khách quan…………………………………………….. 2 1.2.2. Nguyên nhân chủ quan……………………………………………...... 3 1.3. Ước lượng bình phương nhỏ nhất khi có tự tương quan………………... 4 1.4. Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan……… 5 1.5. Hậu quả………………………………………………………………….. 5 Phần 2: Phát hiện có tự tương quan………………………………………. 7 2.1. Phương pháp đồ thị………………………………………………………7 2.2. Phương pháp kiểm định số lượng………..………………………………8 2.2.1. Kiểm định các đoạn mạch………..……………….……………………8 2.2.2. Kiểm định về tính độc lập của các phần dư….…………………….8 2.2.3. Kiểm định d (Durbin - Watson)….…………………………………….8 2.2.4. Kiểm định Breusch – Godfrey (BG)………………………………….. 9 2.2.5. Kiểm định Durbin h…………………………………..……………..... 9 2.2.6. Phương pháp khác: Kiểm định Correlogram……………………..….. 10 Phần 3: Biện pháp khắc phục tự tương quan…………………………... 12 3.1. Khi cấu trúc tự tương quan là đã biết…………………..……………… 12 3.2. Khi chưa biết…………………………………..……………………. 13 3.2.1. Phương pháp sai phân cấp 1…………………..…………………..…. 13 3.2.2. Ước lượng dựa trên thống kê d.Durbin – Watson……………..….. 14 3.2.3. Thủ tục lặp Cochrane – Orcutt để ước lượng ……………..…….....14 3.2.4. Thủ tục Cochrane – Orcutt hai bước…………..…………………..….16 3.2.5. Phương pháp Durbin – Watson hai bước để ước lượng ………..…. 16 3.2.6. Các phương pháp khác để ước lượng …………………………..…. 16 PHẦN 1 - BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN 1.1. Định nghĩa Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo). Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu Ui nghĩa là: Cov(Ui , Uj ) = 0 (ij) (7.1) Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác. Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là: Cov(Ui , Uj ) 0 (ij) (7.2) 1.2. Nguyên nhân của tự tương quan 1.2.1. Nguyên nhân khách quan - Quán tính: Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính. Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất nghiệp mang tính chu kỳ. Chẳng hạn nếu chúng ta ở đầu của thời kỳ khôi phục kinh tế tổng sản phẩm có xu hướng đi lên. Vì vậy trong hồi quy của chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau. - Hiện tượng mạng nhện: Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá mua lạc năm ngoái của các công ty xuất khẩu. Cho nên cung về lạc có biểu hiện dưới dạng hàm: Yt = + Pt – 1 + Ut (7.3) Giả sử ở cuối thời kỳ t giá lạc Pt < Pt – 1 , do đó trong thời kỳ t + 1 những người nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t. Điều này sẽ dẫn đến mô hình mạng nhện. - Trễ: Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào thu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩa là: Yt = + Xt + Yt – 1 + Ut (7.4) Trong đó: Yt: Tiêu dùng ở thời kỳ t. Xt: Thu nhập ở thời kỳ t. Yt – 1: Tiêu dùng ở thời kỳ t – 1. Ut: Nhiễu. , , : Các hệ số. Chúng ta có thể lý giải mô hình (7.4) như sau: Người tiêu dùng thường không thay đổi thói quen tiêu dùng…, như vậy nếu ta bỏ qua số hạng trễ trong (7.4), số hạng sai số sẽ mang tính hệ thống do ảnh hưởng của tiêu dùng thời kỳ trước lên tiêu dùng thời kỳ hiện tại. 1.2.2. Nguyên nhân chủ quan - Xử lý số liệu: Trong phân tích thực nghiệm, số liệu thô thường được xử lý. Chẳng hạn trong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo tháng rồi chia cho 3. Việc lấy trung bình này làm trơn các số liệu và làm giảm sự dao động trong số liệu tháng. Chính sự làm trơn này gây ra tự tương quan. - Sai lệch do lập mô hình: Đây là nguyên nhân thuộc về lập mô hình. Có hai loại sai lầm có thể gây ra hiện tượng tự tương quan: Một là: không đưa đủ các biến vào trong mô hình. Hai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan. 1.3. Ước lượng bình phương nhỏ nhất khi có tự tương quan Ta xét mô hình: Yt = + Xt + Ut (7.5) Trong đó: t ký hiệu quan sát ở thời điểm t (giả thiết ta đang nghiên cứu số liệu dạng chuỗi thời gian). Với giả thiết tổng quát cov(Ut, Ut + s) 0 (s 0). Ta có thể giả thiết nhiễu sản sinh ra theo cách sau: Ut = Ut – 1 + (-1 < < 1) (7.6) Trong đó: gọi là hệ số tự tương quan, là nhiễu ngẫu nhiên thoả mãn các giả thiết thông thường của phương pháp bình phương nhỏ nhất: (7.7) Lược đồ (7.7) gọi là lược đồ tự hồi quy bậc nhất Markov. Chúng ta ký hiệu lược đồ đó là AR(1). Nếu Ut có dạng: Ut = Ut – 1 + Ut – 2 + Là lược đồ tự hồi quy bậc 2 và ký hiệu AR(2). Bằng phương pháp bình phương nhỏ nhất ta tính được: Nhưng phương sai của nó trong lược đồ AR(1), bây giờ là: Nếu không có tự tương quan thì: Ta thấy: cộng với một số hạng phụ thuộc vào ρ . Nếu ρ = 0 thì: Nếu tiếp tục dùng phương pháp OLS và điều chỉnh công thức phương sai thông thường bằng việc sử dụng lược đồ AR(1) thì không còn là ước lượng không chệch tốt nhất nữa. 1.4. Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan Giả sử chúng ta tiếp tục xét mô hình 2 biến và có quá trình AR(1) bằng phương pháp bình phương nhỏ nhất tổng quát đã xét từ ở chương trước ta thu được: (7.8) Trong đó C là hiệu số điều chỉnh có thể bỏ qua trong thực tế. Và phương sai của nó được cho bởi công thức: Var() = (7.9) Trong đó D cũng là hệ số điều chỉnh mà ta có thể bỏ qua trong thực hành. 1.5. Hậu quả - Ước lượng bình phương nhỏ nhất thông thường không phải là ước lượng tuyến tính không chệch tốt nhất nữa. - Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông thường là chệch và thông thường là thấp hơn giá trị thực của phương sai, do đó giá trị của thống kê T được phóng đại lên nhiều lần. - Các kiểm định t và F nói chung không đáng tin cậy. - cho ước lượng chệch của thực, và trong một số trường hợp, nó dường như ước lượng thấp . - R2 có thể là độ đo không đáng tin cậy cho R2 thực. - Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không hiệu quả. PHẦN 2 – PHÁT HIỆN CÓ TỰ TƯƠNG QUAN 2.1. Phương pháp đồ thị Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổ điển gắn với các nhiễu Ut , nhưng không quan sát được, ta chỉ có thể quan sát các phần dư et. Mặc dù et không hoàn toàn giống như Ut nhưng quan sát các phần dư et có thể gợi ý cho ta những nhận xét về Ut Có nhiều cách khác nhau để xem xét các phần dư. Chẳng hạn chúng ta có thể đơn thuần vẽ đồ thị của et theo thời gian như hình dưới: Nhìn vào đồ thị, ta thấy phần dư không biểu thị một kiểu mẫu nào khi thời gian tăng lên, nó phân bố một cách ngẫu nhiên xung quanh trung bình của chúng → Nó ủng hộ cho giả thiết không có sự tương quan trong mô hình hồi quy tuyến tính cổ điển. Nếu đồ thị của phần dư như hình dưới: ta thấy có xu thế tuyến tính, tăng hoặc giảm trong các nhiễu → Nó ủng hộ cho giả thiết có sự tương quan trong mô hình hồi quy tuyến tính cổ điển. Một cách khác là vẽ đồ thị của phần dư chuẩn hoá theo thời gian. 2.2. Phương pháp kiểm định số lượng 2.2.1. Kiểm định các đoạn mạch Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xác định xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu có phải là kết quả của một quá trình mang tính ngẫu nhiên hay không. 2.2.2. Kiểm định về tính độc lập của các phần dư Để kiểm định về tính độc lập của các phần dư ta sử dụng bảng liên tiếp. Bảng liên tiếp mà chúng ta sử dụng ở đây gồm một số dòng và một số cột, cụ thể là bảng liên tiếp 2 dòng và 2 cột. 2.2.3. Kiểm định d.Durbin – Watson Là kiểm định dựa vào giá trị tính toán, thống kê d được định nghĩa như sau: d = (7.10) d 2(1 - ) (7.11) Trong đó: (7.12) Vì -1 1 nên 0 4. Nếu = -1 thì d =4: tự tương quan ngược chiều Nếu = 0 thì d = 2: không có tự tương quan Nếu = 1 thì d = 0: tồn tại tự tương quan thuận chiều (1) (2) (3) (4) (5) 0 dl du 2 4-du 4-dl 4 d (1): tồn tại tự tương quan thuận chiều d (2): không xác định d (3): không có tự tương quan d (4): không xác định d (5): tồn tại tự tương quan ngược chiều Kiểm định Durbin – Watson chỉ nhận dạng được hiện tượng tương quan chuỗi bậc 1. Đôi khi Kiểm định Durbin – Watson không cho kết luận. 2.2.4. Kiểm định Breusch – Godfrey (BG) Để đơn giản ta xét mô hình giản đơn: Yt = Trong đó: Ut = , thoả mãn các giả thiết của OLS. Giả thiết: H0 : Kiểm định như sau: Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS. Từ đó thu được các phần dư et. Bước 2: Ước lượng mô hình sau đây bằng phương pháp OLS: et = Từ kết quả ước lượng mô hình này thu được R2 Bước 3: Với n đủ lớn, (n - p)R2 có phân bố xấp xỉ (p). Nếu (n - p)R2 > (p) thì H0 bị bác bỏ, nghĩa là ít nhất tồn tại tự tương quan một bậc nào đó. Trong trường hợp ngược lại không tồn tại tự tương quan. 2.2.5. Kiểm định Durbin h Ta xét mô hình: Yt = Thống kê kiểm định này được gọi là thống kê h và được tính theo công thức sau: h = (7.13) Trong đó n là cỡ mẫu, Var() là phương sai của hệ số của biến trễ Yt-1. là ước lượng của tương quan chuỗi bậc nhất từ phương trình: Khi n lớn, Durbin đã chỉ ra rằng nếu = 0 thì thống kê h tuân theo phân phối chuẩn hoá – N(0,1). Trong thực hành không cần tính vì có thể tính được xấp xỉ bằng công thức: Trong đó d là thống kê d – thông thường. Thay biểu thức của vào ta được công thức cho thống kê h như sau: h (7.14) Vậy để áp dụng thống kê h phải: - Ước lượng mô hình Yt = bằng phương pháp bình phương bé nhất. - Tính Var(). - Tính . - Tính h theo công thức h . - Quy tắc quyết đinh: Vì h N(0,1) nên P(-1,96 1,96) = 0,95. 2.2.6. Phương pháp khác: Kiểm định Correlogram( trong tập bài giảng kinh tế lượng – biên soạn: ThS Hoàng Thị Hồng Vân). Một phương pháp khác giúp nhận dạng AR là kiểm định Q. Để thực hiện kiểm định này chúng ta cần xem xét một khái niệm “tự tương quan” (AutoCorrellation – AC) Giả thuyết kiểm định: Trị số thống kê kiểm định (Box-Lung): PHẦN 3 - BIỆN PHÁP KHẮC PHỤC TỰ TƯƠNG QUAN 3.1. Khi cấu trúc của tự tương quan là đã biết Vì các nhiễu không quan sát được nên tính chất của tương quan chuỗi thường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thực tiễn. Trong thực hành, người ta thường giả sử rằng theo mô hình tự hồi quy bậc nhất nghĩa là: (7.15) Trong đó và thoả mãn các giả thiết của phương pháp bình phương nhỏ nhất thông thường nghĩa là: Trung bình bằng 0, phương sai không đổi và không tự tương quan. Giả sử (7.15) là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng nếu hệ số tự tương quan là đã biết. Để làm sáng tỏ vấn đề đó ta quay lại mô hình hai biến: (7.16) Nếu (7.16) đúng với t thì cũng đúng với t – 1 nên: (7.17) Nhân hai vế (7.17) với ta được: (7.18) Trừ (7.16) cho (7.18) ta được: (7.19) Đặt Đặt Thì phương trình (7.19) có thể viết lại dưới dạng: (7.20) Vì thoả mãn các giả thiết của phương pháp bình phương nhỏ nhất thông thường đối với các biến và và các ước lượng tìm được có tất cả các tính chất tối ưu nghĩa là ước lượng tuyến tính không chệch tốt nhất. Phương trình hồi quy (7.19) được gọi là phương trình sai phân tổng quát. 3.2. Khi chưa biết 3.2.1. Phương pháp sai phân cấp 1 Như ta đã biết nghĩa là nằm giữa (-1,0) hoặc (0,1) cho nên người ta có thể bắt đầu từ các giá trị ở các đầu mút của các khoảng đó. Nghĩa là ta có thể giả thiết rằng: tức là không có tương quan chuỗi nghĩa là có tương quan dương hoặc âm hoàn toàn. Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng không có tự tương quan rồi sau đó tiến hành kiểm định Durbin – Watson hay các kiểm định khác để xem giả thiết này có đúng hay không. Tuy nhiên nếu thì phương trình sai phân tổng quát (7.17) quy về phương trình sai phân cấp 1: Hay (7.21) Trong đó là toán tử sai cấp 1. Để ước lượng hồi quy (7.21) thì cần phải lập các sai phân cấp 1 của biến phụ thuộc và biến giải thích và sử dụng chúng làm những đầu vào trong phân tích hồi quy. Giả sử mô hình ban đầu là: (7.22) Trong đó t là biến xu thế còn Ut theo sơ đồ tự hồi quy bậc nhất. Thực hiện phép biến đổi sai phân cấp 1 đối với (7.22) ta đi đến (7.23) Trong đó và Xt = Xt - X Nếu nghĩa là có tương quan chuỗi âm hoàn toàn, phương trình sai phân bây giờ có dạng: Hay (7.24) Mô hình này được gọi là mô hình hồi quy trung bình trượt (2 thời kỳ) vì chúng ta hồi quy giá trị của một trung bình trượt đối với một trung bình trượt khác. Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trong kinh tế lượng ứng dụng vì nó dễ thực hiện. 3.2.2. Ước lượng dựa trên thống kê d – Durbin – Watson Trong phần kiểm định d chúng ta đã thiết lập được các công thức: (7.25) Hoặc (7.26) Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của từ thống kê d. Từ (7.24) chỉ ra rằng giả thiết sai phân cấp 1 với chỉ đúng khi d =0 hoặc xấp xỉ bằng không. Cũng vậy khi d = 2 thì và khi d = 4 thì . Do đó thống kê d cung cấp cho ta một phương pháp sẵn có để thu được ước lượng của . Nhưng lưu ý rằng quan hệ (7.26) chỉ là quan hệ xấp xỉ và có thể không đúng với các mẫu nhỏ. Khi đã được ước lượng thì có thể biến đổi tập số liệu như đã chỉ ra ở (7.20) và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thông thường. Khi ta sử dụng một ước lượng thay cho giá trị đúng, thì các hệ số ước lượng thu được từ phương pháp bình phương nhỏ nhất có thuộc tính tối ưu thông thường chỉ tiệm cận có nghĩa là có thuộc tính đó trong các mẫu lớn. Vì vậy trong các mẫu nhỏ ta phải cẩn thận trong khi giải thích các kết quả ước lượng. 3.2.3. Thủ tục lặp Cochrane – Orcutt để ước lượng Phương pháp này sử dụng các phần dư et đã được ước lượng để thu được thông tin về chưa biết. Ta xét phương pháp này thông qua mô hình hai biến sau: (7.27) Giả sử Ut được sinh ra từ lược đồ AR(1) cụ thể là (7.28) Các bước tiến hành như sau: Bước 1: Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhất thông thường và thu được các phần dư et. Bước 2: Sử dụng các phần dư đã ước lượng để ước lượng hồi quy: (7.29) Bước 3: Sử dụng thu được từ (7.29) để ước lượng phương trình sai phân tổng quát (7.29) cụ thể là phương trình: Hoặc đặt Ta ước lượng hồi quy (7.30) (7.30) Bước 4: Vì chúng ta chưa biết trước rằng thu được từ (7.29) có phải là ước lượng tốt nhât của hay không, ta thế giá trị và thu được từ (7.30) vào hồi quy gốc ban đầu (7.27) và thu được các phần dư mới chẳng hạn e** (7.31) Các phần dư có thể tính dễ dàng. Ước lượng phương trình hồi quy tương tự với (7.29) Wt (7.32) là ước lượng vòng 2 của . Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của khác nhau một lượng rất nhỏ chẳng hạn bé hơn 0,01 hoặc 0,005. 3.2.4. Thủ tục Cochrane – Orcutt hai bước Đây là một kiểu rút gọn quá trình lặp. Trong bước 1 ta ước lượng từ bước lặp đầu tiên nghĩa là từ phép hồi quy (7.27) và trong bước 2 ta sử dụng ước lượng của để ước lượng phương trình sai phân tổng quát. 3.2.5. Phương pháp Durbin – Watson 2 bước để ước lượng Để minh hoạ phương pháp này chúng ta viết lại phương trình sai phân tổng quát dưới dạng sau: (7.33) Durbin đã đề xuất thủ tục 2 bước để ước lượng : Bước 1: Coi (7.33) như là một mô hình hồi quy bội, hồi quy Yt theo Xt, Xt-1 và Yt-1 và coi giá trị ước lượng được của hệ số hồi quy của Yt-1 (=) là ước lượng của . Mặc dù là ước lượng chệch nhưng ta có ước lượng vững của . Bước 2: Sau khi thu được , hãy đổi biến và và ước lượng hồi quy bằng phương pháp bình phương nhỏ nhất thông thường trên các biến đã biến đổi đó như là ở (7.20). Như vậy theo phương pháp này thì bước 1 là ước lượng còn bước 2 là để thu được các ước lượng tham số. 3.2.6. Các phương pháp khác ước lượng Ngoài các phương pháp để ước lượng đã trình bày ở trên còn có một số phương pháp khác nữa. Chẳng hạn ta có thể dùng phương pháp hợp lý cực đại để ước lượng trực tiếp các tham số của (7.33) mà không cần dùng đến một số thủ tục lặp đã thảo luận. Nhưng phương pháp ước lượng hợp lý cực đại liên quan đến thủ tục ước lượng phi tuyến (đối với các tham số) và thủ tục tiềm kiếm của Hildreth – Lu nhưng thủ tục này tốn nhiều thời gian và không hiệu quả so với phương pháp ước lượng hợp lý cực đại nên ngày nay không được dùng nhiều.

Các file đính kèm theo tài liệu này:

TH7842O LU7852N KTL.doc
BI T7852P eviews.doc
SLIDE.ppt