Tóm tắt Luận án Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực

Trong một số lĩnh vực, chúng ta mong muốn máy móc có thể mô phỏng được hành vi, khả năng lập luận như con người và đưa ra cho con người những gợi ý tin cậy trong quá trình ra quyết định. Một đặc trưng nổi bật của con người là khả năng suy luận trên cơ sở tri thức được hình thành từ cuộc sống và biểu thị bằng ngôn ngữ tự nhiên. Do đặc trưng của ngôn ngữ là tính mờ, vì vậy bài toán đầu tiên cần phải giải quyết đó là làm thế nào để hình thức hóa toán học các vấn đề ngữ nghĩa ngôn ngữ và xử lý ngữ nghĩa ngôn ngữ mà con người thường thao tác trong cuộc sống. Trước những yêu cầu đặt ra đó, năm 1965 Lotfi A. Zadeh là người đầu tiên đặt đã nền móng cho lý thuyết tập mờ. Dựa trên lý thuyết tập mờ, hệ mờ dựa trên luật (Fuzzy Rule Based System - FRBS) đã được phát triển và trở thành một trong những công cụ mô phỏng gần gũi nhất phương pháp suy luận và lấy quyết định của con người. FRBS đã được ứng dụng thành công trong giải quyết các bài toán thực tiễn như bài toán điều khiển, bài toán phân lớp, bài toán hồi quy, bài toán trích rút ngôn ngữ. Khi xây dựng các FRBS, chúng ta cần đạt được hai mục tiêu là độ chính xác (accuracy) và tính giải nghĩa được (interpretability). Luận án sẽ tập trung nghiên cứu về tính giải nghĩa được. Trong [1]1 Gacto cho rằng hiện tại có hai hướng tiếp cận chính về tính giải nghĩa được. Hướng thứ nhất dựa trên độ phức tạp và hướng thứ hai dựa trên ngữ nghĩa. Một hướng tiếp cận khác được Mencar và các cộng sự đề xuất trong [2]2, được gọi là phương pháp tiếp cận dựa trên độ đo tương tự để đánh giá tính giải nghĩa được của các luật mờ dựa trên ngữ nghĩa. Tính giải nghĩa được của các luật mờ được đo bằng độ tương tự giữa tri thức được biểu diễn bằng biểu thức tập mờ và biểu thức ngôn ngữ trong ngôn ngữ tự nhiên.

pdf27 trang | Chia sẻ: thientruc20 | Lượt xem: 531 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ NGUYỄN THU ANH Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực Chuyên ngành: CƠ SỞ TOÁN HỌC CHO TIN HỌC Mã số: 62.46.01.10 TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Trần Thái Sơn Hà Nội 2018 2 Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ – Viện Hàn lâm KH&CN Việt Nam Người hướng dẫn khoa học : TS. Trần Thái Sơn Phản biện 1: Phản biện 2: Phản biện 3: Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam vào hồi giờ ..’, ngày tháng năm 201. Có thể tìm hiểu luận án tại : 1. Thư viện Học viện Khoa học và Công nghệ 2. Thư viện Quốc gia Việt Nam 3 MỞ ĐẦU Trong một số lĩnh vực, chúng ta mong muốn máy móc có thể mô phỏng được hành vi, khả năng lập luận như con người và đưa ra cho con người những gợi ý tin cậy trong quá trình ra quyết định. Một đặc trưng nổi bật của con người là khả năng suy luận trên cơ sở tri thức được hình thành từ cuộc sống và biểu thị bằng ngôn ngữ tự nhiên. Do đặc trưng của ngôn ngữ là tính mờ, vì vậy bài toán đầu tiên cần phải giải quyết đó là làm thế nào để hình thức hóa toán học các vấn đề ngữ nghĩa ngôn ngữ và xử lý ngữ nghĩa ngôn ngữ mà con người thường thao tác trong cuộc sống. Trước những yêu cầu đặt ra đó, năm 1965 Lotfi A. Zadeh là người đầu tiên đặt đã nền móng cho lý thuyết tập mờ. Dựa trên lý thuyết tập mờ, hệ mờ dựa trên luật (Fuzzy Rule Based System - FRBS) đã được phát triển và trở thành một trong những công cụ mô phỏng gần gũi nhất phương pháp suy luận và lấy quyết định của con người. FRBS đã được ứng dụng thành công trong giải quyết các bài toán thực tiễn như bài toán điều khiển, bài toán phân lớp, bài toán hồi quy, bài toán trích rút ngôn ngữ... Khi xây dựng các FRBS, chúng ta cần đạt được hai mục tiêu là độ chính xác (accuracy) và tính giải nghĩa được (interpretability). Luận án sẽ tập trung nghiên cứu về tính giải nghĩa được. Trong [1]1 Gacto cho rằng hiện tại có hai hướng tiếp cận chính về tính giải nghĩa được. Hướng thứ nhất dựa trên độ phức tạp và hướng thứ hai dựa trên ngữ nghĩa. Một hướng tiếp cận khác được Mencar và các cộng sự đề xuất trong [2]2, được gọi là phương pháp tiếp cận dựa trên độ đo tương tự để đánh giá tính giải nghĩa được của các luật mờ dựa trên ngữ nghĩa. Tính giải nghĩa được của các luật mờ được đo bằng độ tương tự giữa tri thức được biểu diễn bằng biểu thức tập mờ và biểu thức ngôn ngữ trong ngôn ngữ tự nhiên. Năm 2017, một cách tiếp cận mới đối với tính giải nghĩa được của hệ mờ, đó là cách tiếp cận dựa trên khả năng giải nghĩa theo thế giới thực (Real- world-semantics-based approach – RWS-approach) lần đầu tiên đã được đề xuất và bước đầu được khảo sát trong [3]3. Cách tiếp cận này dựa trên các ngữ nghĩa mang tính chất thế giới thực của các từ và các mối quan hệ giữa ngữ nghĩa của các thành phần hệ mờ với các cấu trúc phần tương ứng trong thế giới thực. Xuất phát từ việc nhận thấy rằng, các biểu thức tập mờ, đặc biệt là các luật mờ của các hệ mờ không có mối liên hệ trên cơ sở phương pháp luận với 1 M.J. Gacto, R. Alcalá, F. Herrera (2011), Interpretability of Linguistic Fuzzy Rule-Based Systems: An Overview of Interpretability Measures. Inform. Sci., 181:20 pp. 4340–4360. 2 C. Mencar, C. Castiello, R. Cannone, A.M. Fanelli (2011), Interpretability assessment of fuzzy knowledge bases: a cointension based approach, Int. J. Approx. Reason. 52 pp. 501–518. 3 Cat Ho Nguyen, Jose M. Alonso (2017), “Looking for a real-world-semantics-based approach to the interpretability of fuzzy systems”. FUZZ-IEEE 2017 Technical Program Committee and Technical Chairs, Italy, July 9-12. 4 ngữ nghĩa thế giới thực và, do đó, không có cơ sở hình thức để nghiên cứu bản chất của tính giải nghĩa được, LA lựa chọn cách tiếp cận dựa trên ngữ nghĩa thế giới thực đã được đề xuất trong [3] để nghiên cứu tính giải nghĩa được của các hệ mờ. Đồng thời, hiện nay, các phương pháp xây dựng FRBS từ dữ liệu theo hướng tiếp cận dựa trên lý thuyết tập mờ thiếu một liên kết hình thức đầy đủ giữa các tập mờ biểu diễn ngữ nghĩa tính toán của từ với ngữ nghĩa vốn có của nó. Các từ sử dụng trong FRBS chỉ được xem như là các nhãn hay là các ký hiệu gán cho các tập mờ tương ứng, rất khó có thể chuyển tải được đầy đủ ngữ nghĩa tiềm ẩn (underlying semantics) như các từ ngôn ngữ tự nhiên. Do đó LA mong muốn đi sâu nghiên cứu về tính giải nghĩa được của các hệ mờ ngôn ngữ theo hướng tiếp cận về ngữ nghĩa dựa trên Đại số gia tử được đề xuất bởi Nguyen và Wechler [4]4 [5]5. Theo hướng tiếp cận này, ngữ nghĩa tính toán của từ phải được định nghĩa dựa trên ngữ nghĩa thứ tự vốn có của các từ và miền từ của các biến thiết lập một cấu trúc dựa trên thứ tự là đủ giầu để giải các bài toán thực tế LA đã đạt được một số kết quả như sau:  Nghiên cứu, phân tích phép giải nghĩa như là việc nghiên cứu mối quan hệ giữa RWS của các biểu thức ngôn ngữ và ngữ nghĩa tính toán của biểu thức tính toán gán cho biểu thức ngôn ngữ. Đề xuất lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán của các khung nhận thức ngôn ngữ (khung NTNN).  Nghiên cứu đề xuất các ràng buộc đối với các phép giải nghĩa được xây dựng để chuyển tải, bảo toàn các khía cạnh ngữ nghĩa mong muốn của khung NTNN cho các hệ mờ.  Ứng dụng phương pháp tiếp cận ĐSGT giải bài toán tính giải nghĩa được của biểu diễn tính toán của các khung NTNN bằng việc xây dựng cấu trúc đa thể hạt các tập mờ tam giác hay các tập mờ hình thang.  Làm rõ thêm sự giải nghĩa RWS của các ngôn ngữ tự nhiên của con người và các miền từ của các biến và vai trò cơ bản của nó trong việc kiểm tra khả năng giải nghĩa RWS của các thành phần của hệ thống mờ. Đồng thời chứng minh các đại số tập mờ tiêu chuẩn không phải là giải nghĩa được RWS.  Đề xuất phương pháp hình thức hoá để giải quyết sự giải nghĩa RWS của các hệ thống mờ trong trường hợp hai và n biến đầu vào. 4 C.H. Nguyen and W. Wechler (1990), “Hedge algebras: an algebraic approach to structures of sets of linguistic domains of linguistic truth variables”, Fuzzy Sets and Systems, vol 35, no.3, pp. 281- 293. 5 Cat-Ho Nguyen and W. Wechler (1992),” Extended hedge algebras and their application to Fuzzy logic”, Fuzzy Sets and Systems, 52, 259-281. 5 CHƯƠNG I : NHỮNG KIẾN THỨC CƠ SỞ 1.1 Tập mờ Định nghĩa 1.1. [6]6 Cho U là vũ trụ các đối tượng. Tập mờ A trên U là tập các cặp có thứ tự (x, A(x)), với A(x) là hàm từ U vào [0,1] gán cho mỗi phần tử x thuộc U giá trị A(x) phản ánh mức độ của x thuộc vào tập mờ A. Nếu A(x) = 0 thì ta nói x hoàn toàn không thuộc vào tập A, ngoài ra nếu A(x) = 1 thì ta nói x thuộc hoàn toàn vào A. Trong Định nghĩa 1.1, hàm  còn được gọi là hàm thuộc (membership function). 1.2 Biến ngôn ngữ Nói một cách đơn giản như Zadeh đã từng nói, một biến ngôn ngữ là biến mà “các giá trị của nó là các từ hoặc câu trong ngôn ngữ tự nhiên hoặc ngôn ngữ nhân tạo”. 1.3 Hệ mờ dựa trên luật 1.3.1. Các thành phần của hệ mờ Một hệ mờ dựa trên luật gồm các thành phần chính sau: cơ sở dữ liệu (Database), cơ sở luật mờ (Fuzzy Rule-based - FRB) và hệ suy diễn (Inference System). - Cơ sở dữ liệu là các tập 𝔏j gồm Tj nhãn ngôn ngữ tương ứng với các tập mờ dùng để xây dựng phân hoạch mờ miền tham chiếu UjR (tập số thực) của biến 𝔛j, (j=1,..,n+1) của bài toán n đầu vào 1 đầu ra. - Cơ sở luật mờ là một tập các luật mờ dạng if-then. - Hệ suy diễn thực hiện lập luận xấp xỉ dựa trên các luật và các giá trị đầu vào để đưa ra giá trị dự đoán đầu ra. Một số hướng lập luận xấp xỉ: + Lập luận xấp xỉ dựa trên quan hệ mờ + Lập luận xấp xỉ bằng nội suy tuyến tính trên tập mờ + Lập luận dựa trên độ đốt cháy luật 1.3.2. Các mục tiêu khi xây dựng FRBS  Đánh giá hiệu quả thực hiện (tính chính xác) của FRBS Mục tiêu hiệu quả thực hiện của FRBS, chúng ta đã có những công thức toán học để đánh giá một FRBS như thế nào là hiệu quả.  Vấn đề tính giải nghĩa được của FRBS Tính giải nghĩa được là một vấn đề phức tạp và trừu tượng, nó liên quan đến nhiều yếu tố. Trong [1] Gacto cho rằng hiện tại có hai hướng tiếp cận chính về tính giải nghĩa được: - Tính giải nghĩa được dựa trên độ phức tạp:  Mức cơ sở luật: số luật của hệ luật càng ít càng tốt, độ dài của luật càng ngắn càng tốt. 6 L. A. Zadeh, Fuzzy set, Information and control, 8, (1965), pp. 338-353 6  Mức phân hoạch mờ: số thuộc tính hay số biến, số biến sử dụng ít sẽ làm tăng tính giải nghĩa được của hệ luật; số hàm thuộc sử dụng trong phân hoạch mờ, số hàm thuộc không nên vượt quá 7±2 [6]. - Tính giải nghĩa được dựa trên ngữ nghĩa:  Ngữ nghĩa ở mức cơ sở luật: Cơ sở luật phải nhất quán, tức là nó không chứa các luật mâu thuẫn, các luật có cùng phần tiền đề thì phải có cùng kết luận; số luật bị đốt cháy bởi một dữ liệu đầu vào càng ít càng tốt.  Ngữ nghĩa ở mức phân hoạch mờ (mức từ): Miền xác định của các biến phải được phủ hoàn toàn bởi hàm thuộc của các tập mờ. 1.4 Đại số gia tử. 1.4.1. Khái niệm Đại số gia tử Định nghĩa 1.2 [7]7: Một ĐSGT được ký hiệu là bộ 4 thành phần được ký hiệu là AX = (X, G, H, ) trong đó G là tập các phần tử sinh, H là tập các gia tử (hedge) còn “” là quan hệ cảm sinh ngữ nghĩa trên X. Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần tử lớn nhất và phần tử trung hòa (neutral) trong X. Ta gọi mỗi giá trị ngôn ngữ xX là một hạng từ (term) trong ĐSGT. Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H, ) gọi là ĐSGT tuyến tính. Và nếu được trang bị thêm hai gia tử tới hạn là  và  với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x) khi tác động lên x, thì ta được ĐSGT tuyến tính đầy đủ, ký hiệu AX* = (X, G, H, , , ). Lưu ý rằng hn...h1u được gọi là một biểu diễn chính tắc của một hạng từ x đối với u nếu x = hn...h1u và hi...h1uhi-1...h1u với i nguyên và in. Ta gọi độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc của nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x). 1.4.2. Một số tính chất của Đại số gia tử tuyến tính Định lý 1.1: [7] Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của ĐSGT AX = (X, G, H, ). Khi đó ta có các khẳng định sau: i) Với mỗi uX thì H(u) là tập sắp thứ tự tuyến tính. ii) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính thì X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u<v, và u, v là độc lập với nhau, tức là uH(v) và vH(u), thì H(u) H(v). Định lý dưới đây xem xét sự so sánh của hai hạng từ trong miền ngôn ngữ của biến X. Định lý 1.2: [7] Cho x = hnh1u và y = kmk1u là hai biểu diễn chính tắc của x và y đối với u. Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho hj' = kj' với 7 C. H. Nguyen and V. L. Nguyen (2007), Fuzziness measure on complete hedges algebras and quantifying semantics of terms in linear hedge algebras, Fuzzy Sets and Syst., vol.158 pp.452-471. 7 mọi j'<j (ở đây nếu j = min {n, m} + 1 thì hoặc hj = I, hj là toán tử đơn vị I, với j = n + 1 ≤ m hoặc kj = I với j = m + 1 ≤ n) và i) x<y khi và chỉ khi hjxj<kjxj, trong đó xj = hj-1...h1u. ii) x = y khi và chỉ khi m = n và hjxj = kjxj. iii) x và y là không so sánh được với nhau khi và chỉ khi hjxj và kjxj là không so sánh được với nhau. 1.4.3. Độ đo tính mờ của các giá trị ngôn ngữ Định nghĩa 1.3: [7] Cho AX *= (X, G, H, , , ) là một ĐSGT tuyến tính đầy đủ. Ánh xạ fm: X [0,1] được gọi là một độ đo tính mờ của các hạng từ trong X nếu: (i) fm là đầy đủ, tức là fm(c-) + fm(c+) =1 và hHfm(hu) = fm(u), uX; (ii) fm(x) = 0, với các x thỏa H(x) = {x} và fm(0) = fm(W) = fm(1) = 0; (iii) x,y X, h H, ký hiệu (h) = )( )( )( )( yfm hyfm xfm hxfm  , tỷ số này không phụ thuộc vào x và y, và nó được gọi là độ đo tính mờ của các gia tử. Các tính chất của độ đo tính mờ của các hạng từ và gia tử được thể hiện qua mệnh đề sau: Mệnh đề 1.1: [7] Với độ đo tính mờ fm và  đã được định nghĩa trong Định nghĩa 1.3, ta có: (i) fm(c-) + fm(c+) = 1 và ( ) ( ) h H fm hx fm x   ; (ii)     1 )( qj j h  ,    p j j h 1 )(  , với ,> 0 và  + = 1; (iii)   kXx xfm 1)( , trong đó Xk là tập các hạng từ có độ dài đúng k; (iv) fm(hx) = (h).fm(x), và xX, fm(x) = fm(x) = 0; (v) Cho fm(c-), fm(c+) và (h) với hH, khi đó với x = hn...h1c, c {c-, c+}, dễ dàng tính được độ đo tính mờ của x như sau: fm(x) = (hn)...(h1)fm(c). 1.4.4. Khoảng tính mờ Định nghĩa 1.4 [7]: Khoảng tính mờ của các hạng từ xX, ký hiệu fm(x), là một đoạn con của đoạn [0, 1], fm(x)  Itv([0, 1]), có độ dài bằng độ đo tính mờ, |fm(x)| = fm(x). 1.4.5. Định lượng ngữ nghĩa của giá trị ngôn ngữ Định nghĩa 1.5 [7]: Cho ĐSGT tuyến tínhAX*= (X, G, H, ), ta định nghĩa: 1) Hàm sign(k, h) ∈ {-1, 1} được gọi là hàm dấu tương đối (relative) của k đối với h nếu sign(k, h) = 1((x≤ hx) hx ≤ khx)(x≥hx) hx≥khx)), và sign(k, h) = -1  ((x ≤ hx) hx≥ khx ≥ x)  (x ≥ hx) hx≤ khx≤ x)) 2) Hàm Sign: X {-1, 0, 1} được gọi là hàm dấu của các từ x nếu hn h1c, c∈G, là biểu diễn chính tắc, tức là hjhj-1 h1c ≠ hj-1 h1c, với mọi j = 1, , n và h0 = Id, phép đồng nhất, tức là h0c = c, thì ta có: 8 Sign(x)=Sign(hnhn-1h1c) = sign(hn,hn-1) × × sign(h2,h1) × sign(h1) ×sign(c). Dựa trên định nghĩa hàm dấu, chúng ta có tiêu chuẩn để so sánh hx và x. Mệnh đề 1.2 [7]. Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx>x; nếu Sign(hx) = -1 thì hx<x và nếu Sign(hx) = 0 thì hx = x. Từ mệnh đề trên ta có: 0≤ H(x) ≤ 1 và H(x) ≤ H(y), x, y, tức là xH(x) và yH(y) (1.2) Sgn(hpx) = +1 H(h-qx) ≤≤ H(h-1x) ≤ x ≤ H(h1x) ≤≤ H(hpx) (1.3) Sgn(hpx) = 1 H(h-qx) ≥ ≥ H(h-1x) ≥ x ≥ H(h1x) ≥≥ H(hpx) (1.4) Định nghĩa 1.6 [7]: Cho AX là một ĐSGT tuyến tính và fm là một độ đo tính mờ trên X. Ta nói ánh xạ : X [0, 1] được cảm sinh bởi độ đo tính mờ fm nếu được định nghĩa bằng đệ qui như sau: (i) (W)= =fm(c-), (c-)=– fm(c-) = .fm(c-), (c+) =  +fm(c+); (ii) (hjx)= (x)+          )( )( )()()()()()( jsigni jsigni xfmx j hx j hxfm i hx j hSign  , (1.5) với mọi j, –qjp và j 0, trong đó:     ,))(()(1 2 1 )(  xhhSignxhSignxh jpjj ; Với định nghĩa này, đã được chứng minh nó thỏa mãn các yêu cầu của một hàm định lượng ngữ nghĩa và đảm bảo tính trù mật của nó đối với các hạng từ của AX trong đoạn [0, 1]. 1.5 Kết luận chương 1 Trong chương này, LA đã tóm tắt những kiến thức cơ sở làm nền tảng phục vụ trong quá trình nghiên cứu. Nó bao gồm lý thuyết tập mờ, hệ mờ dựa trên luật và các ứng dụng, lý thuyết của ĐSGT. CHƯƠNG 2. TÍNH GIẢI NGHĨA ĐƯỢC CỦA KHUNG NHẬN THỨC NGÔN NGỮ TRONG CÁC HỆ MỜ NGÔN NGỮ Trong chương này, chúng ta sẽ đưa ra lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán của khung nhận thức ngôn ngữ, đề xuất các ràng buộc ngữ nghĩa bổ sung trên các ánh xạ giải nghĩa. Phần tiếp theo sẽ khảo sát biểu diễn cấu trúc đa thể hạt được sinh ra từ các ngữ nghĩa của miền từ và cho thấy những biểu diễn này thỏa mãn các ràng buộc liên quan. Các kết quả của chương này được trình bày dựa vào công trình [2] trong Danh mục các công trình khoa học của tác giả liên quan đến luận án. 9 2.1. Tính giải nghĩa được của LRBSs ở mức từ ngôn ngữ Nguyễn và các cộng sự, [8]8, đã đưa ra cách tiếp cận mới về tính giải nghĩa được của FRBSs dẫn đến tính giải nghĩa được của các thành phần của chúng. Cơ sở của cách tiếp cận mới là miền từ ngôn ngữ của biến 𝒳, Dom(𝒳), được mô hình hóa toán học bằng một cấu trúc thứ tự cảm sinh bởi ngữ nghĩa vốn có của các từ ngôn ngữ là ĐSGT. Bản chất của giải nghĩa tính toán là việc diễn giải ngữ nghĩa của từ, vốn không tính toán được, cần phải được chuyển đổi sang các đối tượng tính toán được, nhưng việc chuyển đổi phải “bảo toàn ngữ nghĩa” của các từ. Điều này yêu cầu chúng ta phải khảo sát để đề xuất các ràng buộc cần thiết trên diễn giải ngữ nghĩa. Chúng ta sử dụng khái niệm khung nhận thức ngôn ngữ LFoCs của các biến, được xem như tập các từ vựng được dùng để nhận biết, mô tả các thực thể thế giới thực. Vì vậy, nghiên cứu khả năng giải nghĩa của một biểu diễn tính toán của một khung NTNN LFoC chính là việc nghiên cứu khả năng biểu diễn ngữ nghĩa của chúng, hay khả năng chuyển tải thông tin ngữ nghĩa các từ của LFoC sang biểu diễn tính toán cấu trúc ngữ nghĩa của phương pháp biểu diễn tính toán. 2.1.1. Lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán của khung nhận thức ngôn ngữ Quá trình giải bài toán tính giải nghĩa được của biểu diễn tính toán các LFoC, như lược đồ Hình 2.1, trong đó I1 là một giải nghĩa (interpretation) gán 8 C.H. Nguyen, V.Th. Hoang, V.L. Nguyen (2015), “A discussion on interpretability of linguistic rule base systems and its application to solve regression problems”, Knowledge-Based Syst., vol. 88, pp. 107-133. Hình 2.1. Lược đồ giải nghĩa tính toán I của LFoC Các biểu thức cú pháp của LFoC và các tính chất hình thức của nó Mức thấp (mức từ): - Các từ (chuỗi cú pháp) - LFoC được hình thức hóa (tập các từ được hình thức hóa) và cấu trúc mối quan hệ của chúng (quan hệ dựa trên thứ tự ngữ nghĩa của từ, quan hệ chung-riêng ) ĐSGT AX mô hình hóa miền từ D chứa LFoC ĐSGT của miền từ: - Các biểu thức HA: biểu diễn chuỗi các từ trong D - LFoCs và cấu trúc các mối quan hệ của chúng Các đối tượng tính toán của cấu trúc toán học tính toán Cấu trúc tính toán: (số, tập mờ, khoảng,) - Các đối tượng của cấu trúc tính toán CS và các quan hệ giữa chúng - Tập các đối tượng tính toán biểu diễn FLoC I2 I1 I = I2 o I 1 10 một phần tử của ĐSGT AX thích hợp cho mỗi từ và I2 gán một phần tử của ĐSGT AX thành một đối tượng của cấu trúc tính toán. 2.1.2. Ràng buộc về tính giải nghĩa được của việc biểu diễn ngữ nghĩa của các từ của biến Các tác giả trong [8] đã đề xuất những ràng buộc ban đầu áp dụng cho các diễn giải được mô tả trong Hình 2.1 đối với các khung NTNN LFoC để duy trì ngữ nghĩa các từ của các LFoCs trong ngữ cảnh của toàn bộ miền từ, thay vì những ràng buộc được áp đặt chỉ trên các tập mờ. Ràng buộc 2.1 [8] (Vai trò thiết yếu của ngữ nghĩa vốn có của từ): Về nguyên tắc ngữ nghĩa vốn có của các từ ngôn ngữ của một biến có mặt trong một cơ sở luật mờ (FRB) phải được tận dụng hoặc, tốt hơn cần thiết lập một cơ sở hình thức để sinh ra ngữ nghĩa định lượng, kể cả ngữ nghĩa dựa trên tập mờ của các từ, để biểu diễn ngữ nghĩa của FRB. Ràng buộc 2.2 [8] (Một hình thức hóa đầy đủ để xác định việc định lượng ngữ nghĩa của từ): Các ngữ nghĩa tính toán được của từ, kể cả các ngữ nghĩa định lượng dựa trên tập mờ, cần được sinh ra dựa trên một phương pháp hình thức đúng đắn dựa trên toàn bộ miền từ của các biến ngôn ngữ. Ngoài ra, chúng cần được tạo ra bởi một thủ tục được phát triển dựa trên hệ hình thức hoá này để trên cơ sở đó có thể thực hiện việc sinh ngữ nghĩa tính toán của các từ một cách tự động. Ràng buộc 2.3 [8] (Về ngữ nghĩa khoảng của từ và quan hệ chung-riêng): cho tập từ 𝒮 của một biến 𝒳, ánh xạ 𝒜: 𝒮 → Intv, với Intv là tập hợp các khoảng con của miền xác định số của biến 𝒳, chỉ ra khoảng ngữ nghĩa của các từ của tập 𝒮, cần bảo toàn các mối quan hệ chung-riêng giữa các từ, ví dụ đối với bất kỳ hai từ x, hx𝒮, trong đó h là một gia tử, chúng ta luôn có quan hệ 𝒜(hx) 𝒜(x). Ràng buộc 2.4 [8] (Phép gán diễn giải ngữ nghĩa là một đẳng cấu thứ tự): Cho cấu trúc tính toán có thứ tự (C(𝒳), ≼). Một phép giải nghĩa ℑ các từ được xem như là các xâu kí hiệu của biến 𝒳 sang các đối tượng tính toán trong C(𝒳),ℑ: Dom(𝒳) → C(𝒳), nhằm biểu diễn ngữ nghĩa tính toán đượ
Luận văn liên quan