Trong một số lĩnh vực, chúng ta mong muốn máy móc có thể mô phỏng
được hành vi, khả năng lập luận như con người và đưa ra cho con người những
gợi ý tin cậy trong quá trình ra quyết định. Một đặc trưng nổi bật của con người
là khả năng suy luận trên cơ sở tri thức được hình thành từ cuộc sống và biểu thị
bằng ngôn ngữ tự nhiên. Do đặc trưng của ngôn ngữ là tính mờ, vì vậy bài toán
đầu tiên cần phải giải quyết đó là làm thế nào để hình thức hóa toán học các vấn
đề ngữ nghĩa ngôn ngữ và xử lý ngữ nghĩa ngôn ngữ mà con người thường thao
tác trong cuộc sống.
Trước những yêu cầu đặt ra đó, năm 1965 Lotfi A. Zadeh là người đầu
tiên đặt đã nền móng cho lý thuyết tập mờ. Dựa trên lý thuyết tập mờ, hệ mờ
dựa trên luật (Fuzzy Rule Based System - FRBS) đã được phát triển và trở thành
một trong những công cụ mô phỏng gần gũi nhất phương pháp suy luận và lấy
quyết định của con người. FRBS đã được ứng dụng thành công trong giải quyết
các bài toán thực tiễn như bài toán điều khiển, bài toán phân lớp, bài toán hồi
quy, bài toán trích rút ngôn ngữ.
Khi xây dựng các FRBS, chúng ta cần đạt được hai mục tiêu là độ chính
xác (accuracy) và tính giải nghĩa được (interpretability). Luận án sẽ tập trung
nghiên cứu về tính giải nghĩa được.
Trong [1]1 Gacto cho rằng hiện tại có hai hướng tiếp cận chính về tính
giải nghĩa được. Hướng thứ nhất dựa trên độ phức tạp và hướng thứ hai dựa trên
ngữ nghĩa. Một hướng tiếp cận khác được Mencar và các cộng sự đề xuất trong
[2]2, được gọi là phương pháp tiếp cận dựa trên độ đo tương tự để đánh giá tính
giải nghĩa được của các luật mờ dựa trên ngữ nghĩa. Tính giải nghĩa được của
các luật mờ được đo bằng độ tương tự giữa tri thức được biểu diễn bằng biểu
thức tập mờ và biểu thức ngôn ngữ trong ngôn ngữ tự nhiên.
27 trang |
Chia sẻ: thientruc20 | Lượt xem: 512 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
NGUYỄN THU ANH
Nghiên cứu tính giải nghĩa được của hệ mờ
theo ngữ nghĩa thế giới thực
Chuyên ngành: CƠ SỞ TOÁN HỌC CHO TIN HỌC
Mã số: 62.46.01.10
TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. Trần Thái Sơn
Hà Nội 2018
2
Công trình được hoàn thành tại:
Học viện Khoa học và Công nghệ – Viện Hàn lâm KH&CN Việt Nam
Người hướng dẫn khoa học : TS. Trần Thái Sơn
Phản biện 1:
Phản biện 2:
Phản biện 3:
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Học
viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam
vào hồi giờ ..’, ngày tháng năm 201.
Có thể tìm hiểu luận án tại :
1. Thư viện Học viện Khoa học và Công nghệ
2. Thư viện Quốc gia Việt Nam
3
MỞ ĐẦU
Trong một số lĩnh vực, chúng ta mong muốn máy móc có thể mô phỏng
được hành vi, khả năng lập luận như con người và đưa ra cho con người những
gợi ý tin cậy trong quá trình ra quyết định. Một đặc trưng nổi bật của con người
là khả năng suy luận trên cơ sở tri thức được hình thành từ cuộc sống và biểu thị
bằng ngôn ngữ tự nhiên. Do đặc trưng của ngôn ngữ là tính mờ, vì vậy bài toán
đầu tiên cần phải giải quyết đó là làm thế nào để hình thức hóa toán học các vấn
đề ngữ nghĩa ngôn ngữ và xử lý ngữ nghĩa ngôn ngữ mà con người thường thao
tác trong cuộc sống.
Trước những yêu cầu đặt ra đó, năm 1965 Lotfi A. Zadeh là người đầu
tiên đặt đã nền móng cho lý thuyết tập mờ. Dựa trên lý thuyết tập mờ, hệ mờ
dựa trên luật (Fuzzy Rule Based System - FRBS) đã được phát triển và trở thành
một trong những công cụ mô phỏng gần gũi nhất phương pháp suy luận và lấy
quyết định của con người. FRBS đã được ứng dụng thành công trong giải quyết
các bài toán thực tiễn như bài toán điều khiển, bài toán phân lớp, bài toán hồi
quy, bài toán trích rút ngôn ngữ...
Khi xây dựng các FRBS, chúng ta cần đạt được hai mục tiêu là độ chính
xác (accuracy) và tính giải nghĩa được (interpretability). Luận án sẽ tập trung
nghiên cứu về tính giải nghĩa được.
Trong [1]1 Gacto cho rằng hiện tại có hai hướng tiếp cận chính về tính
giải nghĩa được. Hướng thứ nhất dựa trên độ phức tạp và hướng thứ hai dựa trên
ngữ nghĩa. Một hướng tiếp cận khác được Mencar và các cộng sự đề xuất trong
[2]2, được gọi là phương pháp tiếp cận dựa trên độ đo tương tự để đánh giá tính
giải nghĩa được của các luật mờ dựa trên ngữ nghĩa. Tính giải nghĩa được của
các luật mờ được đo bằng độ tương tự giữa tri thức được biểu diễn bằng biểu
thức tập mờ và biểu thức ngôn ngữ trong ngôn ngữ tự nhiên.
Năm 2017, một cách tiếp cận mới đối với tính giải nghĩa được của hệ
mờ, đó là cách tiếp cận dựa trên khả năng giải nghĩa theo thế giới thực (Real-
world-semantics-based approach – RWS-approach) lần đầu tiên đã được đề xuất
và bước đầu được khảo sát trong [3]3. Cách tiếp cận này dựa trên các ngữ nghĩa
mang tính chất thế giới thực của các từ và các mối quan hệ giữa ngữ nghĩa của
các thành phần hệ mờ với các cấu trúc phần tương ứng trong thế giới thực.
Xuất phát từ việc nhận thấy rằng, các biểu thức tập mờ, đặc biệt là các
luật mờ của các hệ mờ không có mối liên hệ trên cơ sở phương pháp luận với
1 M.J. Gacto, R. Alcalá, F. Herrera (2011), Interpretability of Linguistic Fuzzy Rule-Based
Systems: An Overview of Interpretability Measures. Inform. Sci., 181:20 pp. 4340–4360.
2 C. Mencar, C. Castiello, R. Cannone, A.M. Fanelli (2011), Interpretability assessment of fuzzy
knowledge bases: a cointension based approach, Int. J. Approx. Reason. 52 pp. 501–518.
3 Cat Ho Nguyen, Jose M. Alonso (2017), “Looking for a real-world-semantics-based approach to
the interpretability of fuzzy systems”. FUZZ-IEEE 2017 Technical Program Committee and
Technical Chairs, Italy, July 9-12.
4
ngữ nghĩa thế giới thực và, do đó, không có cơ sở hình thức để nghiên cứu bản
chất của tính giải nghĩa được, LA lựa chọn cách tiếp cận dựa trên ngữ nghĩa thế
giới thực đã được đề xuất trong [3] để nghiên cứu tính giải nghĩa được của các
hệ mờ.
Đồng thời, hiện nay, các phương pháp xây dựng FRBS từ dữ liệu theo
hướng tiếp cận dựa trên lý thuyết tập mờ thiếu một liên kết hình thức đầy đủ
giữa các tập mờ biểu diễn ngữ nghĩa tính toán của từ với ngữ nghĩa vốn có của
nó. Các từ sử dụng trong FRBS chỉ được xem như là các nhãn hay là các ký hiệu
gán cho các tập mờ tương ứng, rất khó có thể chuyển tải được đầy đủ ngữ nghĩa
tiềm ẩn (underlying semantics) như các từ ngôn ngữ tự nhiên. Do đó LA mong
muốn đi sâu nghiên cứu về tính giải nghĩa được của các hệ mờ ngôn ngữ theo
hướng tiếp cận về ngữ nghĩa dựa trên Đại số gia tử được đề xuất bởi Nguyen và
Wechler [4]4 [5]5. Theo hướng tiếp cận này, ngữ nghĩa tính toán của từ phải
được định nghĩa dựa trên ngữ nghĩa thứ tự vốn có của các từ và miền từ của các
biến thiết lập một cấu trúc dựa trên thứ tự là đủ giầu để giải các bài toán thực tế
LA đã đạt được một số kết quả như sau:
Nghiên cứu, phân tích phép giải nghĩa như là việc nghiên cứu mối quan
hệ giữa RWS của các biểu thức ngôn ngữ và ngữ nghĩa tính toán của biểu thức
tính toán gán cho biểu thức ngôn ngữ. Đề xuất lược đồ giải bài toán tính giải
nghĩa được của biểu diễn tính toán của các khung nhận thức ngôn ngữ (khung
NTNN).
Nghiên cứu đề xuất các ràng buộc đối với các phép giải nghĩa được xây
dựng để chuyển tải, bảo toàn các khía cạnh ngữ nghĩa mong muốn của khung
NTNN cho các hệ mờ.
Ứng dụng phương pháp tiếp cận ĐSGT giải bài toán tính giải nghĩa được
của biểu diễn tính toán của các khung NTNN bằng việc xây dựng cấu trúc đa thể
hạt các tập mờ tam giác hay các tập mờ hình thang.
Làm rõ thêm sự giải nghĩa RWS của các ngôn ngữ tự nhiên của con
người và các miền từ của các biến và vai trò cơ bản của nó trong việc kiểm tra
khả năng giải nghĩa RWS của các thành phần của hệ thống mờ. Đồng thời chứng
minh các đại số tập mờ tiêu chuẩn không phải là giải nghĩa được RWS.
Đề xuất phương pháp hình thức hoá để giải quyết sự giải nghĩa RWS của
các hệ thống mờ trong trường hợp hai và n biến đầu vào.
4 C.H. Nguyen and W. Wechler (1990), “Hedge algebras: an algebraic approach to structures of sets
of linguistic domains of linguistic truth variables”, Fuzzy Sets and Systems, vol 35, no.3, pp. 281-
293.
5 Cat-Ho Nguyen and W. Wechler (1992),” Extended hedge algebras and their application to Fuzzy
logic”, Fuzzy Sets and Systems, 52, 259-281.
5
CHƯƠNG I : NHỮNG KIẾN THỨC CƠ SỞ
1.1 Tập mờ
Định nghĩa 1.1. [6]6 Cho U là vũ trụ các đối tượng. Tập mờ A trên U là tập
các cặp có thứ tự (x, A(x)), với A(x) là hàm từ U vào [0,1] gán cho mỗi phần
tử x thuộc U giá trị A(x) phản ánh mức độ của x thuộc vào tập mờ A.
Nếu A(x) = 0 thì ta nói x hoàn toàn không thuộc vào tập A, ngoài ra nếu
A(x) = 1 thì ta nói x thuộc hoàn toàn vào A. Trong Định nghĩa 1.1, hàm còn
được gọi là hàm thuộc (membership function).
1.2 Biến ngôn ngữ
Nói một cách đơn giản như Zadeh đã từng nói, một biến ngôn ngữ là biến
mà “các giá trị của nó là các từ hoặc câu trong ngôn ngữ tự nhiên hoặc ngôn
ngữ nhân tạo”.
1.3 Hệ mờ dựa trên luật
1.3.1. Các thành phần của hệ mờ
Một hệ mờ dựa trên luật gồm các thành phần chính sau: cơ sở dữ liệu
(Database), cơ sở luật mờ (Fuzzy Rule-based - FRB) và hệ suy diễn (Inference
System).
- Cơ sở dữ liệu là các tập 𝔏j gồm Tj nhãn ngôn ngữ tương ứng với các tập
mờ dùng để xây dựng phân hoạch mờ miền tham chiếu UjR (tập số thực) của
biến 𝔛j, (j=1,..,n+1) của bài toán n đầu vào 1 đầu ra.
- Cơ sở luật mờ là một tập các luật mờ dạng if-then.
- Hệ suy diễn thực hiện lập luận xấp xỉ dựa trên các luật và các giá trị đầu
vào để đưa ra giá trị dự đoán đầu ra. Một số hướng lập luận xấp xỉ:
+ Lập luận xấp xỉ dựa trên quan hệ mờ
+ Lập luận xấp xỉ bằng nội suy tuyến tính trên tập mờ
+ Lập luận dựa trên độ đốt cháy luật
1.3.2. Các mục tiêu khi xây dựng FRBS
Đánh giá hiệu quả thực hiện (tính chính xác) của FRBS
Mục tiêu hiệu quả thực hiện của FRBS, chúng ta đã có những công thức
toán học để đánh giá một FRBS như thế nào là hiệu quả.
Vấn đề tính giải nghĩa được của FRBS
Tính giải nghĩa được là một vấn đề phức tạp và trừu tượng, nó liên quan đến
nhiều yếu tố. Trong [1] Gacto cho rằng hiện tại có hai hướng tiếp cận chính về
tính giải nghĩa được:
- Tính giải nghĩa được dựa trên độ phức tạp:
Mức cơ sở luật: số luật của hệ luật càng ít càng tốt, độ dài của luật càng
ngắn càng tốt.
6 L. A. Zadeh, Fuzzy set, Information and control, 8, (1965), pp. 338-353
6
Mức phân hoạch mờ: số thuộc tính hay số biến, số biến sử dụng ít sẽ làm
tăng tính giải nghĩa được của hệ luật; số hàm thuộc sử dụng trong phân hoạch
mờ, số hàm thuộc không nên vượt quá 7±2 [6].
- Tính giải nghĩa được dựa trên ngữ nghĩa:
Ngữ nghĩa ở mức cơ sở luật: Cơ sở luật phải nhất quán, tức là nó không
chứa các luật mâu thuẫn, các luật có cùng phần tiền đề thì phải có cùng kết luận;
số luật bị đốt cháy bởi một dữ liệu đầu vào càng ít càng tốt.
Ngữ nghĩa ở mức phân hoạch mờ (mức từ): Miền xác định của các biến
phải được phủ hoàn toàn bởi hàm thuộc của các tập mờ.
1.4 Đại số gia tử.
1.4.1. Khái niệm Đại số gia tử
Định nghĩa 1.2 [7]7: Một ĐSGT được ký hiệu là bộ 4 thành phần được ký
hiệu là AX = (X, G, H, ) trong đó G là tập các phần tử sinh, H là tập các gia tử
(hedge) còn “” là quan hệ cảm sinh ngữ nghĩa trên X. Giả thiết trong G có chứa
các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần tử lớn nhất và
phần tử trung hòa (neutral) trong X. Ta gọi mỗi giá trị ngôn ngữ xX là một
hạng từ (term) trong ĐSGT.
Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H, )
gọi là ĐSGT tuyến tính. Và nếu được trang bị thêm hai gia tử tới hạn là và
với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x) khi tác động lên x,
thì ta được ĐSGT tuyến tính đầy đủ, ký hiệu AX* = (X, G, H, , , ). Lưu ý
rằng hn...h1u được gọi là một biểu diễn chính tắc của một hạng từ x đối với u nếu
x = hn...h1u và hi...h1uhi-1...h1u với i nguyên và in. Ta gọi độ dài của một hạng
từ x là số gia tử trong biểu diễn chính tắc của nó đối với phần tử sinh cộng thêm
1, ký hiệu l(x).
1.4.2. Một số tính chất của Đại số gia tử tuyến tính
Định lý 1.1: [7] Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của
ĐSGT AX = (X, G, H, ). Khi đó ta có các khẳng định sau:
i) Với mỗi uX thì H(u) là tập sắp thứ tự tuyến tính.
ii) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính thì
X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u<v, và u, v là độc lập với
nhau, tức là uH(v) và vH(u), thì H(u) H(v).
Định lý dưới đây xem xét sự so sánh của hai hạng từ trong miền ngôn ngữ
của biến X.
Định lý 1.2: [7] Cho x = hnh1u và y = kmk1u là hai biểu diễn chính tắc
của x và y đối với u. Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho hj' = kj' với
7 C. H. Nguyen and V. L. Nguyen (2007), Fuzziness measure on complete hedges algebras and
quantifying semantics of terms in linear hedge algebras, Fuzzy Sets and Syst., vol.158 pp.452-471.
7
mọi j'<j (ở đây nếu j = min {n, m} + 1 thì hoặc hj = I, hj là toán tử đơn vị I, với j
= n + 1 ≤ m hoặc kj = I với j = m + 1 ≤ n) và
i) x<y khi và chỉ khi hjxj<kjxj, trong đó xj = hj-1...h1u.
ii) x = y khi và chỉ khi m = n và hjxj = kjxj.
iii) x và y là không so sánh được với nhau khi và chỉ khi hjxj và kjxj là không
so sánh được với nhau.
1.4.3. Độ đo tính mờ của các giá trị ngôn ngữ
Định nghĩa 1.3: [7] Cho AX *= (X, G, H, , , ) là một ĐSGT tuyến tính
đầy đủ. Ánh xạ fm: X [0,1] được gọi là một độ đo tính mờ của các hạng từ
trong X nếu:
(i) fm là đầy đủ, tức là fm(c-) + fm(c+) =1 và hHfm(hu) = fm(u), uX;
(ii) fm(x) = 0, với các x thỏa H(x) = {x} và fm(0) = fm(W) = fm(1) = 0;
(iii) x,y X, h H, ký hiệu (h) =
)(
)(
)(
)(
yfm
hyfm
xfm
hxfm
, tỷ số này không phụ
thuộc vào x và y, và nó được gọi là độ đo tính mờ của các gia tử.
Các tính chất của độ đo tính mờ của các hạng từ và gia tử được thể hiện qua
mệnh đề sau:
Mệnh đề 1.1: [7] Với độ đo tính mờ fm và đã được định nghĩa trong Định
nghĩa 1.3, ta có:
(i) fm(c-) + fm(c+) = 1 và ( ) ( )
h H
fm hx fm x
;
(ii)
1
)(
qj j
h ,
p
j j
h
1
)( , với ,> 0 và + = 1;
(iii) kXx xfm 1)(
, trong đó Xk là tập các hạng từ có độ dài đúng k;
(iv) fm(hx) = (h).fm(x), và xX, fm(x) = fm(x) = 0;
(v) Cho fm(c-), fm(c+) và (h) với hH, khi đó với x = hn...h1c, c {c-,
c+}, dễ dàng tính được độ đo tính mờ của x như sau: fm(x) = (hn)...(h1)fm(c).
1.4.4. Khoảng tính mờ
Định nghĩa 1.4 [7]: Khoảng tính mờ của các hạng từ xX, ký hiệu fm(x),
là một đoạn con của đoạn [0, 1], fm(x) Itv([0, 1]), có độ dài bằng độ đo tính
mờ, |fm(x)| = fm(x).
1.4.5. Định lượng ngữ nghĩa của giá trị ngôn ngữ
Định nghĩa 1.5 [7]: Cho ĐSGT tuyến tínhAX*= (X, G, H, ), ta định
nghĩa:
1) Hàm sign(k, h) ∈ {-1, 1} được gọi là hàm dấu tương đối (relative) của k
đối với h nếu sign(k, h) = 1((x≤ hx) hx ≤ khx)(x≥hx) hx≥khx)), và
sign(k, h) = -1 ((x ≤ hx) hx≥ khx ≥ x) (x ≥ hx) hx≤ khx≤ x))
2) Hàm Sign: X {-1, 0, 1} được gọi là hàm dấu của các từ x nếu hn h1c,
c∈G, là biểu diễn chính tắc, tức là hjhj-1 h1c ≠ hj-1 h1c, với mọi j = 1, , n
và h0 = Id, phép đồng nhất, tức là h0c = c, thì ta có:
8
Sign(x)=Sign(hnhn-1h1c) = sign(hn,hn-1) × × sign(h2,h1) × sign(h1)
×sign(c).
Dựa trên định nghĩa hàm dấu, chúng ta có tiêu chuẩn để so sánh hx và x.
Mệnh đề 1.2 [7]. Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx>x; nếu Sign(hx)
= -1 thì hx<x và nếu Sign(hx) = 0 thì hx = x.
Từ mệnh đề trên ta có:
0≤ H(x) ≤ 1 và H(x) ≤ H(y), x, y, tức là xH(x) và yH(y) (1.2)
Sgn(hpx) = +1 H(h-qx) ≤≤ H(h-1x) ≤ x ≤ H(h1x) ≤≤ H(hpx) (1.3)
Sgn(hpx) = 1 H(h-qx) ≥ ≥ H(h-1x) ≥ x ≥ H(h1x) ≥≥ H(hpx) (1.4)
Định nghĩa 1.6 [7]: Cho AX là một ĐSGT tuyến tính và fm là một độ đo
tính mờ trên X. Ta nói ánh xạ : X [0, 1] được cảm sinh bởi độ đo tính mờ
fm nếu được định nghĩa bằng đệ qui như sau:
(i) (W)= =fm(c-), (c-)=– fm(c-) = .fm(c-), (c+) = +fm(c+);
(ii) (hjx)= (x)+
)(
)(
)()()()()()(
jsigni
jsigni
xfmx
j
hx
j
hxfm
i
hx
j
hSign , (1.5)
với mọi j, –qjp và j 0, trong đó:
,))(()(1
2
1
)( xhhSignxhSignxh
jpjj
;
Với định nghĩa này, đã được chứng minh nó thỏa mãn các yêu cầu của một
hàm định lượng ngữ nghĩa và đảm bảo tính trù mật của nó đối với các hạng từ
của AX trong đoạn [0, 1].
1.5 Kết luận chương 1
Trong chương này, LA đã tóm tắt những kiến thức cơ sở làm nền tảng phục
vụ trong quá trình nghiên cứu. Nó bao gồm lý thuyết tập mờ, hệ mờ dựa trên
luật và các ứng dụng, lý thuyết của ĐSGT.
CHƯƠNG 2. TÍNH GIẢI NGHĨA ĐƯỢC CỦA KHUNG NHẬN
THỨC NGÔN NGỮ TRONG CÁC HỆ MỜ NGÔN NGỮ
Trong chương này, chúng ta sẽ đưa ra lược đồ giải bài toán tính giải nghĩa
được của biểu diễn tính toán của khung nhận thức ngôn ngữ, đề xuất các ràng
buộc ngữ nghĩa bổ sung trên các ánh xạ giải nghĩa. Phần tiếp theo sẽ khảo sát
biểu diễn cấu trúc đa thể hạt được sinh ra từ các ngữ nghĩa của miền từ và cho
thấy những biểu diễn này thỏa mãn các ràng buộc liên quan. Các kết quả của
chương này được trình bày dựa vào công trình [2] trong Danh mục các công
trình khoa học của tác giả liên quan đến luận án.
9
2.1. Tính giải nghĩa được của LRBSs ở mức từ ngôn ngữ
Nguyễn và các cộng sự, [8]8, đã đưa ra cách tiếp cận mới về tính giải nghĩa
được của FRBSs dẫn đến tính giải nghĩa được của các thành phần của chúng. Cơ
sở của cách tiếp cận mới là miền từ ngôn ngữ của biến 𝒳, Dom(𝒳), được mô
hình hóa toán học bằng một cấu trúc thứ tự cảm sinh bởi ngữ nghĩa vốn có của
các từ ngôn ngữ là ĐSGT.
Bản chất của giải nghĩa tính toán là việc diễn giải ngữ nghĩa của từ, vốn
không tính toán được, cần phải được chuyển đổi sang các đối tượng tính toán
được, nhưng việc chuyển đổi phải “bảo toàn ngữ nghĩa” của các từ. Điều này
yêu cầu chúng ta phải khảo sát để đề xuất các ràng buộc cần thiết trên diễn giải
ngữ nghĩa.
Chúng ta sử dụng khái niệm khung nhận thức ngôn ngữ LFoCs của các
biến, được xem như tập các từ vựng được dùng để nhận biết, mô tả các thực thể
thế giới thực. Vì vậy, nghiên cứu khả năng giải nghĩa của một biểu diễn tính
toán của một khung NTNN LFoC chính là việc nghiên cứu khả năng biểu diễn
ngữ nghĩa của chúng, hay khả năng chuyển tải thông tin ngữ nghĩa các từ của
LFoC sang biểu diễn tính toán cấu trúc ngữ nghĩa của phương pháp biểu diễn
tính toán.
2.1.1. Lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán
của khung nhận thức ngôn ngữ
Quá trình giải bài toán tính giải nghĩa được của biểu diễn tính toán các
LFoC, như lược đồ Hình 2.1, trong đó I1 là một giải nghĩa (interpretation) gán
8 C.H. Nguyen, V.Th. Hoang, V.L. Nguyen (2015), “A discussion on interpretability of linguistic
rule base systems and its application to solve regression problems”, Knowledge-Based Syst., vol. 88,
pp. 107-133.
Hình 2.1. Lược đồ giải nghĩa tính toán I của LFoC
Các biểu thức cú pháp
của LFoC và các tính
chất hình thức của nó
Mức thấp (mức từ):
- Các từ (chuỗi cú pháp)
- LFoC được hình thức
hóa (tập các từ được hình
thức hóa) và cấu trúc mối
quan hệ của chúng (quan
hệ dựa trên thứ tự ngữ
nghĩa của từ, quan hệ
chung-riêng )
ĐSGT AX mô hình hóa
miền từ D chứa LFoC
ĐSGT của miền từ:
- Các biểu thức HA: biểu
diễn chuỗi các từ trong D
- LFoCs và cấu trúc các
mối quan hệ của chúng
Các đối tượng tính
toán của cấu trúc
toán học tính toán
Cấu trúc tính toán: (số,
tập mờ, khoảng,)
- Các đối tượng của
cấu trúc tính toán CS
và các quan hệ giữa
chúng
- Tập các đối tượng
tính toán biểu diễn
FLoC
I2 I1
I = I2 o
I
1
10
một phần tử của ĐSGT AX thích hợp cho mỗi từ và I2 gán một phần tử của
ĐSGT AX thành một đối tượng của cấu trúc tính toán.
2.1.2. Ràng buộc về tính giải nghĩa được của việc biểu diễn ngữ nghĩa
của các từ của biến
Các tác giả trong [8] đã đề xuất những ràng buộc ban đầu áp dụng cho các
diễn giải được mô tả trong Hình 2.1 đối với các khung NTNN LFoC để duy trì
ngữ nghĩa các từ của các LFoCs trong ngữ cảnh của toàn bộ miền từ, thay vì
những ràng buộc được áp đặt chỉ trên các tập mờ.
Ràng buộc 2.1 [8] (Vai trò thiết yếu của ngữ nghĩa vốn có của từ): Về
nguyên tắc ngữ nghĩa vốn có của các từ ngôn ngữ của một biến có mặt trong
một cơ sở luật mờ (FRB) phải được tận dụng hoặc, tốt hơn cần thiết lập một cơ
sở hình thức để sinh ra ngữ nghĩa định lượng, kể cả ngữ nghĩa dựa trên tập mờ
của các từ, để biểu diễn ngữ nghĩa của FRB.
Ràng buộc 2.2 [8] (Một hình thức hóa đầy đủ để xác định việc định lượng
ngữ nghĩa của từ): Các ngữ nghĩa tính toán được của từ, kể cả các ngữ nghĩa
định lượng dựa trên tập mờ, cần được sinh ra dựa trên một phương pháp hình
thức đúng đắn dựa trên toàn bộ miền từ của các biến ngôn ngữ. Ngoài ra, chúng
cần được tạo ra bởi một thủ tục được phát triển dựa trên hệ hình thức hoá này để
trên cơ sở đó có thể thực hiện việc sinh ngữ nghĩa tính toán của các từ một cách
tự động.
Ràng buộc 2.3 [8] (Về ngữ nghĩa khoảng của từ và quan hệ chung-riêng):
cho tập từ 𝒮 của một biến 𝒳, ánh xạ 𝒜: 𝒮 → Intv, với Intv là tập hợp các khoảng
con của miền xác định số của biến 𝒳, chỉ ra khoảng ngữ nghĩa của các từ của
tập 𝒮, cần bảo toàn các mối quan hệ chung-riêng giữa các từ, ví dụ đối với bất
kỳ hai từ x, hx𝒮, trong đó h là một gia tử, chúng ta luôn có quan hệ 𝒜(hx)
𝒜(x).
Ràng buộc 2.4 [8] (Phép gán diễn giải ngữ nghĩa là một đẳng cấu thứ tự):
Cho cấu trúc tính toán có thứ tự (C(𝒳), ≼). Một phép giải nghĩa ℑ các từ được
xem như là các xâu kí hiệu của biến 𝒳 sang các đối tượng tính toán trong
C(𝒳),ℑ: Dom(𝒳) → C(𝒳), nhằm biểu diễn ngữ nghĩa tính toán đượ