Luận án Khai phá quan điểm với kỹ thuật học sâu - Luận văn, đồ án, đề tài tốt nghiệp

Mô hình AOA thiết lập một mạng neural với mô hình chú ý quá mức Attention-Over-Attention [14] dựa trên LSTM. Mô hình đã liên kết được các từ khía cạnh và quan điểm trên cơ sở mô hình hoá được từ khía cạnh và ngữ cảnh cùng lúc nhằm khai thác được các thông tin bổ trợ quan trọng trong các từ khía cạnh và ngữ cảnh. Cũng sử dụng cơ chế Attention, các tác giả trong [105] đã kết hợp với một mạng RNN để phân loại quan điểm tương ứng khía cạnh trong tài liệu bình luận. Nghiên cứu trong [35] đề xuất một mạng chú ý tương tác Interactive Attention Network (IAN) để học các chú ý trong ngữ cảnh và từ mục tiêu một cách tương tác, đồng thời phát sinh các đại diện cho các ngữ cảnh và từ mục tiêu tương đồng, hỗ trợ tốt cho khả năng phân loại quan điểm. Nhóm các tác giả trong [164] áp dụng một mô hình mạng mã hoá chú ý Attentional Encoder Network (AEN) với các bộ mã hoá dựa trên sự chú ý để mô hình hoá ngữ cảnh và khía cạnh giúp khai thác thông tin ngữ nghĩa cần thiết tương ứng khía cạnh từ cơ chế nhúng từ mà không cần quan tâm đến khoảng cách giữa các từ trong văn bản. Chen và cộng sự [126] trình bày một mô hình đồng trích xuất với việc nhúng từ được tinh chỉnh bằng cách cung cấp các đại diện vector riêng biệt cho các quan điểm đối lập nhau. Các tác giả đã xây dựng một mô hình Attention kép nhiều lớp dựa trên học sâu để khai thác các cấu trúc phụ thuộc thể hiện mối liên quan giữa khía cạnh và quan điểm trong tài liệu giúp tăng hiệu suất cho mô hình phân loại. Nhóm nghiên cứu [158] đề xuất mô hình phân loại với sự kết hợp của GRU và cơ chế chú ý đến các từ quan trọng trong câu để trích rút các đặc trưng của khía cạnh và ngữ cảnh giúp cho việc phân tích quan điểm được chính xác hơn. Nhóm tác giả [64] đã sử dụng một mạng LSTM và cơ chế chú ý vị trí, kết hợp việc chú ý đến tầm quan trọng của từ ngữ cảnh với vector nhận biết vị trí đại diện cho ngữ cảnh để phân loại quan điểm. Các tác giả trong [128] sử dụng mạng Attention hai chiều nhận biết vị trí để xác định quan điểm mức khía cạnh.

164 trang | Chia sẻ: Tuệ An 21 | Ngày: 08/11/2024 | Lượt xem: 908 | Lượt tải: 4

Bạn đang xem trước 20 trang tài liệu Luận án Khai phá quan điểm với kỹ thuật học sâu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN UYÊN TRANG KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU (Opinion mining with deep learning) LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐÀ NẴNG – 2023 ii ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN UYÊN TRANG KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU (Opinion mining with deep learning) Ngành: Khoa học máy tính Mã số: 9.48.01.01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Cán bộ hướng dẫn: 1. TS. Hoàng Thị Thanh Hà 2. TS. Đặng Hoài Phương ĐÀ NẴNG – 2023 iii LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu do tôi thực hiện, dưới sự hướng dẫn của TS. Hoàng Thị Thanh Hà và TS. Đặng Hoài Phương. Tôi cam đoan các kết quả nghiên cứu được trình bày trong luận án là trung thực và không sao chép từ bất kỳ công trình nghiên cứu nào khác. Mọi trích dẫn trong luận án đều đề cập đến nguồn gốc xuất xứ rõ ràng và đầy đủ. Tác giả Trần Uyên Trang iv MỤC LỤC LỜI CAM ĐOAN ........................................................................................................III MỤC LỤC .................................................................................................................... IV DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT .................................................... VII DANH MỤC BẢNG .................................................................................................... IX DANH MỤC HÌNH ...................................................................................................... X PHẦN MỞ ĐẦU ............................................................................................................ 1 1. TÍNH CẤP THIẾT CỦA LUẬN ÁN ........................................................................... 1 2. MỤC TIÊU, ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU CỦA LUẬN ÁN ...................... 4 3. CÁC ĐÓNG GÓP CỦA LUẬN ÁN ............................................................................. 5 4. BỐ CỤC CỦA LUẬN ÁN .......................................................................................... 6 CHƯƠNG 1- TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM VÀ KỸ THUẬT HỌC SÂU ....................................................................................................................... 9 1.1. KHAI PHÁ QUAN ĐIỂM ......................................................................................... 9 1.2. CÁC CẤP ĐỘ KHAI PHÁ QUAN ĐIỂM .................................................................. 11 1.2.1. Khai phá quan điểm mức tài liệu .............................................................. 12 1.2.2. Khai phá quan điểm mức câu .................................................................... 12 1.2.3. Khai phá quan điểm mức khía cạnh hay mức đặc trưng ......................... 12 1.3. CÁC HƯỚNG NGHIÊN CỨU KHAI PHÁ QUAN ĐIỂM ............................................ 13 1.3.1. Hướng tiếp cận dựa trên ngữ liệu ............................................................. 14 1.3.2. Hướng tiếp cận máy học ............................................................................ 14 1.3.3. Các nghiên cứu liên quan ......................................................................... 16 1.4. MỘT SỐ HẠN CHẾ CỦA CÁC TIẾP CẬN KHAI PHÁ QUAN ĐIỂM HIỆN NAY ......... 24 1.5. HỌC SÂU VÀ NHÓM KỸ THUẬT HỌC SÂU ĐƯỢC SỬ DỤNG TRONG CÁC MÔ HÌNH KHAI PHÁ QUAN ĐIỂM ĐỀ XUẤT ..................................................................... 30 1.5.1. Học sâu ....................................................................................................... 30 v 1.5.2. Các kỹ thuật học sâu phổ biến dùng trong xử lý ngôn ngữ tự nhiên và khai phá quan điểm ............................................................................................... 34 1.6. ĐỀ XUẤT NGHIÊN CỨU: KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU ........ 46 1.7. KẾT LUẬN CHƯƠNG 1 ........................................................................................ 47 CHƯƠNG 2-TRÍCH RÚT KHÍA CẠNH TRONG KHAI PHÁ QUAN ĐIỂM VỚI HƯỚNG TIẾP CẬN HỌC SÂU ................................................................................ 49 2.1. TRÍCH RÚT KHÍA CẠNH VỚI HƯỚNG TIẾP CẬN HỌC SÂU .................................. 49 2.2. MÔ HÌNH TRÍCH RÚT KHÍA CẠNH VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT ................ 54 2.2.1. Mô hình tích hợp BiGRU-CRF cho trích rút khía cạnh .......................... 55 2.2.2. Mô hình tích hợp Bi-IndyLSTM-CRF cho trích rút khía cạnh ............... 59 2.3. KẾT QUẢ THỰC NGHIỆM.................................................................................... 64 2.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm ................................ 64 2.3.2. Kết quả thực nghiệm và đánh giá hiệu quả trích rút khía cạnh .............. 65 2.4. KẾT LUẬN CHƯƠNG 2 ........................................................................................ 67 CHƯƠNG 3-KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI HƯỚNG TIẾP CẬN HỌC SÂU ................................................................................ 68 3.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ ........................................ 68 3.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT .......................................................................................... 69 3.2.1. Mô hình CNN-BiGRU cho trích rút khía cạnh và quan điểm ................. 71 3.2.2. Mô hình CNN-IOB2 cho trích rút từ mục tiêu ......................................... 76 3.2.3. Mô hình MABSA cho trích rút và phân loại ba tác vụ tiếp theo: khía cạnh, thực thể và quan điểm................................................................................. 82 3.3. KẾT QUẢ THỰC NGHIỆM CÁC MÔ HÌNH ............................................................ 89 3.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm ................................ 90 3.3.2. Kết quả thực nghiệm, đánh giá hiệu quả khai phá quan điểm đa tác vụ 91 3.4. KẾT LUẬN CHƯƠNG 3 ........................................................................................ 97 CHƯƠNG 4-KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ, ĐA MIỀN VỚI HƯỚNG TIẾP CẬN HỌC SÂU ............................................................ 99 vi 4.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA MIỀN .......................................... 101 4.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ ĐA MIỀN ĐỀ XUẤT ............................................................................................................. 102 4.2.1. Mô hình khai phá quan điểm mức khía cạnh đa miền CNN-BiLSTM . 103 4.2.2. Mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền CNN- BiIndyLSTM-Attention ....................................................................................... 110 4.3. KẾT QUẢ THỰC NGHIỆM.................................................................................. 115 4.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm .............................. 116 4.3.2. Kết quả thực nghiệm và đánh giá hiệu quả khai phá quan điểm đa tác vụ trên đơn miền và đa miền ................................................................................... 117 4.4. KẾT LUẬN CHƯƠNG 4 ...................................................................................... 124 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ............................................................... 126 KẾT LUẬN ................................................................................................................ 126 HƯỚNG PHÁT TRIỂN ............................................................................................... 132 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ ........................ 133 TÀI LIỆU THAM KHẢO ........................................................................................ 135 vii DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT STT Thuật ngữ Tiếng Anh Viết tắt 1 Đơn vị tuyến tính được chỉnh lưu Rectified Linear Unit ReLU 2 Học máy Machine learning ML 3 Học sâu Deep learning DL 4 Khai phá quan điểm/Phân tích cảm xúc Opinion mining/Sentiment analysis OM/SA 5 Khai phá quan điểm mức tài liệu Document_based sentiment analysis DBSA 6 Khai phá quan điểm mức câu Sentence_based sentiment analysis SBSA 7 Khai phá quan điểm mức khía cạnh/đặc trưng Aspect/Feature_based sentiment analysis ABSA 8 Khai phá quan điểm mức khía cạnh/đặc trưng đa tác vụ Multitask aspect/feature_based sentiment analysis MABSA 9 Khai phá quan điểm mức khía cạnh/đặc trưng đa miền Multidomain aspect/feature_based sentiment analysis 10 Ma trận đồng xuất hiện Co-occurrence matrix 11 Mạng neural hồi quy Recurrent Neural Network RNN 12 Mạng neural hồi quy hai chiều Bidirectional Recurrent Neural Network BiRNN 13 Mạng bộ nhớ ngắn dài Long_Short Term Memory LSTM 14 Mạng bộ nhớ ngắn dài hai chiều Bidirectional Long_Short Term Memory BiLSTM 15 Mạng bộ nhớ ngắn dài độc lập Independently Long_Short Term Memory IndyLSTM 16 Mạng bộ nhớ ngắn dài độc lập hai chiều Bidirectional Independently Long_Short Term Memory BiIndyLSTM 17 Mạng đơn vị hồi quy có cổng Gated Recurrent Unit GRU 18 Mạng đơn vị hồi quy có cổng hai chiều Bidirectional Gated Recurrent Unit BiGRU 19 Mạng neural đệ quy Recursive Neural Network 20 Mạng neural tích chập Convolutional Neural Network CNN 21 Máy vector hỗ trợ Support Vector Machine SVM 22 Mô hình Markov ẩn Hidden Markov Models HMM 23 Phân bổ Dirichlet tiềm ẩn Latent Dirichlet Allocation LDA 24 Phân loại miền Domain classification 25 Phân loại quan điểm Sentiment classification 26 Phân rã đạo hàm Gradient decay 27 Phân tích ngữ nghĩa tiềm ẩn Latent Semantic Analysis LSA 28 Phân tích ngữ nghĩa tiềm ẩn xác suất Probabilistic Latent Semantic Analysis pLSA 29 Quan điểm Opinion 30 Quan điểm tích cực Positive opinion 31 Quan điểm tiêu cực Negative opinion 32 Quan điểm trung lập Neutral opinion viii 33 Quá khớp Overfitting 34 Trích rút khía cạnh Aspect extraction 35 Trích rút từ mục tiêu quan điểm Opinion target extraction 36 Trích rút thực thể Entity extraction 37 Trường ngẫu nhiên có điều kiện Conditional Random Field CRF 38 Triệt tiêu/bùng nổ đạo hàm Vanishing/exploding gradient 39 Vector toàn cục Global Vector GloVe ix DANH MỤC BẢNG Bảng 1.1. Các mô hình khai phá quan điểm dựa trên hướng tiếp cận ngữ liệu nổi bật và hiệu suất của các mô hình ................................................................................................................. 26 Bảng 1.2. Các mô hình khai phá quan điểm dựa trên hướng tiếp cận máy học nổi bật và hiệu suất của các mô hình ................................................................................................................. 27 Bảng 2.1. Tập dữ liệu SemEval 2014 ....................................................................................... 65 Bảng 2.2. So sánh độ đo F1 trên mô hình BiGRU-CRF và Bi-IndyLSTM-CRF với các mô hình hiện có ....................................................................................................................................... 65 Bảng 3.1. Sử dụng miền Restaurant trong tập dữ liệu SemEval 2016 cho thực nghiệm ......... 90 Bảng 3.2. Kết quả thực nghiệm mô hình hiện có so với các mô hình đề xuất của luận án trong Chương 2 và Chương 3 trên miền Laptop của tập dữ liệu SemEval 2014 ............................... 92 Bảng 3.3. Kết quả thực nghiệm mô hình hiện có so với các mô hình đề xuất của luận án trong Chương 2 và Chương 3 trên miền Restaurant của tập dữ liệu SemEval 2014 ......................... 92 Bảng 3.4. Kết quả thực nghiệm xét trên độ đo F1 và Accuracy của các mô hình hiện có và mô hình CNN-IOB2 trên miền Restaurant của SemEval 2016 ...................................................... 95 Bảng 3.5. Kết quả thực nghiệm mô hình MABSA đề xuất xét trên các độ đo Precision, Recall, F1 và Accuracy trên miền Restaurant của tập SemEval 2016 .................................................. 96 Bảng 4.1. Tập dữ liệu huấn luyện gồm các đơn miền Restaurant, Laptop của tập SemEval 2016, đa miền Laptop_Restaurant, và đa miền Laptop_Restaurant_Hotel ...................................... 117 Bảng 4.2. Trích rút khía cạnh xét trên độ đo Precision, Recall và F1 của hai mô hình đề xuất so với các mô hình hiện có trên miền Laptop và Restaurant....................................................... 118 Bảng 4.3. Kết quả thực nghiệm mô hình CNN-BiLSTM trên đa miền Laptop_Restaurant .. 120 Bảng 4.4. Kết quả thực nghiệm mô hình CNN-BiIndyLSTM-Attention trên đa miền Laptop_Restaurant_Hotel ....................................................................................................... 121 Bảng 4.5. Trích rút khía cạnh xét trên độ đo Precision, Recall và F1 của hai mô hình đề xuất so với các mô hình hiện có trên đơn miền Restaurant, đa miền Laptop_Restaurant và đa miền Laptop_Restaurant_Hotel ....................................................................................................... 122 Bảng 5.1. Bảng tổng hợp đặc điểm của các mô hình khai phá quan điểm đề xuất ................ 128 x DANH MỤC HÌNH Hình 1.1. Các cấp độ cụ thể trong khai phá quan điểm............................................................ 12 Hình 1.2. Mô hình mạng neural đơn giản gồm 1 lớp ẩn .......................................................... 32 Hình 1.3. Mô hình mạng học sâu gồm 3 lớp ẩn ....................................................................... 33 Hình 1.4. Mạng neural tích chập .............................................................................................. 35 Hình 1.5. Tính toán với MaxPooling ....................................................................................... 36 Hình 1.6. Mô hình CNN trong xử lý văn bản .......................................................................... 37 Hình 1.7. Mô hình mạng RNN và các tính toán bên trong RNN ............................................. 38 Hình 1.8. Cấu trúc của mô-đun trong RNN ............................................................................. 40 Hình 1.9. Cấu trúc của mô-đun trong LSTM ........................................................................... 40 Hình 1.10. Cấu trúc chi tiết của một mô-đun LSTM ............................................................... 41 Hình 1.11. Cấu trúc mạng BiLSTM ......................................................................................... 42 Hình 1.12. Cấu trúc cơ bản của GRU ...................................................................................... 43 Hình 1.13. Cấu trúc mạng BiGRU ........................................................................................... 44 Hình 1.14. Cấu trúc mạng Bidirectional IndyLSTM ............................................................... 45 Hình 2.1. Quy trình trích rút khía cạnh của mô hình BiGRU-CRF ......................................... 56 Hình 2.2. Cấu trúc mô hình BiGRU-CRF cho trích rút khía cạnh trong câu quan điểm ......... 58 Hình 2.3. Quy trình trích rút khía cạnh của mô hình Bi-IndyLSTM-CRF .............................. 61 Hình 2.4. Cấu trúc mô hình Bi-IndyLSTM-CRF cho trích rút khía cạnh trong câu quan điểm .................................................................................................................................................. 63 Hình 2.5. Biểu đồ so sánh độ chính xác F1 của hai mô hình đề xuất với các mô hình đã được đánh giá cao trước đây .............................................................................................................. 66 Hình 3.1. Quy trình trích rút, phân loại khía cạnh và quan điểm của mô hình CNN-BiGRU . 74 Hình 3.2. Cấu trúc mô hình CNN-BiGRU cho khai phá quan điểm mức khía cạnh trích rút đồng thời khía cạnh và quan điểm ..................................................................................................... 75 Hình 3.3. Quy trình trích rút từ mục tiêu của mô hình CNN-IOB2 ......................................... 79 Hình 3.4. Cấu trúc mô hình CNN-IOB2 cho trích rút từ mục tiêu........................................... 82 Hình 3.5. Quy trình trích rút, phân loại khía cạnh, thực thể và quan điểm của mô hình MABSA .................................................................................................................................................. 86 Hình 3.6. Cấu trúc mô hình khai phá quan điểm mức khía cạnh đa tác vụ MABSA cho phân loại khía cạnh, thực thể và quan điểm....................................................................................... 88 xi Hình 3.7. So sánh độ chính xác của tác vụ trích rút khía cạnh xét trên độ đo F1 của các mô hình hiện có so với mô hình CNN-BiGRU đề xuất .......................................................................... 93 Hình 3.8. So sánh độ chính xác của tác vụ phân loại quan điểm xét trên độ đo Accuracy của mô hình hiện có so với mô hình CNN-BiGRU đề xuất .................................................................. 94 Hình 3.9. Biểu đồ so sánh độ chính xác của mô hình đề xuất với các mô hình hiện có xét trên độ đo F1 và Accuracy ............................................................................................................... 96 Hình 3.10. Biểu đồ biểu diễn độ đo Precision, Recall, F1 và Accuracy của mô hình MABSA đề xuất............................................................................................................................................ 97 Hình 4.1. Quy trình thực hiện của mô hình khai phá quan điểm mức khía cạnh đa miền CNN- BiLSTM .................................................................................................................................. 106 Hình 4.2. Cấu trúc mô hình khai phá quan điểm mức khía cạnh đa miền CNN-BiLSTM .... 107 Hình 4.3. Quy trình thực hiện của mô hình CNN-BiIndyLSTM-Attention ........................... 113 Hình 4.4. Cấu trúc mô hình khai phá quan điểm mức khía cạnh đa tác vụ đa miền .............. 114 Hình 4.5. Biểu đồ so sánh độ chính xác thực thi tác vụ trích rút khía cạnh của mô hình CNN- BiLSTM đề xuất với các mô hình hiện có trên miền Restaurant ............................................ 115 Hình 4.6. Biểu đồ so sánh độ chính xác thực thi tác vụ trích rút khía cạnh của mô hình CNN- BiIndyLSTM-Attention đề xuất với các mô hình hiện có trên miền Restaurant .................... 120 Hình 4.7. Kết quả thực thi mô hình đa tác vụ CNN-BiIndyLSTM-Attention đề xuất với các độ đo Precision, Recall, F1 và Accuracy trên đa miền Laptop_Restaurant_Hotel ...................... 122 PHẦN MỞ ĐẦU 1. Tính cấp thiết của luận án Trong kỷ nguyên bùng nổ thông tin hiện nay, với sự phát triển mạnh mẽ và nhanh chóng của các nền tảng truyền thông xã hội, thương mại điện tử, người dùng không chỉ chia sẻ thông tin mà còn có thể bày tỏ thái độ, quan điểm cá nhân trực tiếp trên những nền tảng này. Cụ thể là những bình luận, đánh giá, chia sẻ kinh nghiệm của cộng đồng đối với các sản phẩm, dịch vụ mà họ đã từng trải nghiệm; các quan điểm của cộng đồng đối với một chính sách mới hay đối với một nhân vật có tầm ảnh hưởng lớn; và một số vấn đề khác thông qua mạng xã hội, các diễn đàn, blog cá nhânThông tin từ các bình luận, chia sẻ, quan điểm dạng này đã ảnh hưởng trực tiếp đến suy nghĩ, tâm tư, nguyện vọng, hành vi của người dùng toàn cầu. Lượng thông tin này đã và đang là một khối dữ liệu khổng lồ không ngừng tăng lên từng ngày từng giờ một cách khó kiểm soát. Đặc biệt từ năm 2020 đến nay, do ảnh hưởng của dịch bệnh Covid 19 cùng với những diễn biến phức tạp của đại dịch, thương mại điện tử đã tăng trưởng ngoạn mục dựa trên lựa chọn ngày càng nhiều của người tiêu dùng. Đối với

Các file đính kèm theo tài liệu này:

luan_an_khai_pha_quan_diem_voi_ky_thuat_hoc_sau.pdf
0_Phu luc bia.pdf
2_Tom tat luan an_Tieng Viet.pdf
3_Tom tat luan an_Tieng Anh.pdf
4_Thong tin dong gop moi_Tieng Viet.pdf
5_Thong tin dong gop moi_Tieng Anh.pdf
6_Trich yeu luan an_Tieng Viet.pdf
7_Trich yeu luan an_Tieng Anh.pdf
8_QD bao ve cap co so.pdf