1.1. Thiết kếvà tối ưu hóa công thức
Đối với các nhà sản xuất dược phẩm, xây dựng công thức là việc thường xuyên phải
thực hiện, do mỗi sản phẩm đều có một vòng đời nhất định, và nhu cầu cạnh tranh
trên thịtrường đòi hỏi sản phẩm phải liên tục được cải tiến hay được thay thếbằng
các sản phẩm mới.
Trong mỗi công thức dược phẩm, ngoài các hoạt chất còn có nhiều thành phần tá
dược khác nhau. Tính chất của sản phẩm không chỉphụthuộc vào tính chất và tỷlệ
của các nguyên liệu mà còn bị ảnh hưởng bởi các điều kiện sản xuất (nhiệt độ, độ
ẩm, thời gian, tốc độ ) Vì vậy, việc xây dựng công thức không phải là một vấn đề
đơn giản, mà thực sựlà một sựthửthách.
Các phương pháp tối ưu hóa truyền thống (toán thống kê, đơn hình ) có thểáp
dụng với các dữliệu đơn giản và tuyến tính, nhưng không phù hợp với những dữ
liệu phức tạp và phi tuyến. Ngoài ra, các phương pháp này không tối ưu đồng thời
được nhiều biến phụthuộc trong khi mỗi dược phẩm có rất nhiều tính chất cần được
tối ưu [2].
Việc xây dựng và tối ưu công thức bằng máy tính ngày càng được áp dụng phổbiến
vì các lợi ích của nó nhưkhông giới hạn sốbiến độc lập (x), có thểtối ưu đồng thời
nhiều biến phụthuộc (y), phù hợp với các loại dữliệu phức tạp và phi tuyến.
Có rất nhiều phương pháp xây dựng và tối ưu công thức bằng máy tính đã được áp
dụng như: mạng nơ ron (Neural Networks), logic mờ(Fuzzy Logic), thuật giải di
truyền (Genetic Algorithms) và các hệthống lai giữa chúng. Những kỹthuật này
phần nào giải quyết được yêu cầu tối ưu nhưgiảm thời gian và chi phí nghiên cứu
và phát triển công thức. Tuy nhiên, các kỹthuật này tồn tại nhiều hạn chếnhư:
Mạng neuron thì được biết đến nhưmột phương pháp “hộp đen” (black-box), không
thểtheo dõi tiến trình thực hiện và các kỹthuật trên không thểtạo ra các công thức
ởdạng phương trình toán học. Mặc dù có những hệthống lai của những kỹthuật
này, nhưng những hệthống này chỉcó thểhỗtrợngười dùng trong việc truy vấn tri
thức trong những luật dạng “If then ”, và nhiều khi thông tin tìm được không
thỏa mãn yêu cầu [1], [7].
Với ưu điểm chính là có thểtạo ra các phương trình toán học khác nhau từmột bộ
dữliệu thực nghiệm, lập trình di truyền (Genetic Programming - GP) được hy vọng
sẽgiúp đạt kết quảtốt trong việc mô hình hóa dữliệu. Những ưu điểm của lập trình
di truyền liên quan đến vấn đềtối ưu công thức dược phẩm là:
- Cho ra kết quảlà phương trình toán học.
- Có thểthực hiện với những dữliệu phi tuyến.
- Việc thực thi của lập trình di truyền thì khá linh hoạt, tùy thuộc vào việc lựa
chọn các hàm tính giá trịthích nghi hay thay đổi các tham sốliên quan.
Dựa trên những mô hình dữliệu có được từGP, áp dụng thuật giải di truyền
(Genetic Algorithms - GA) đểcó được công thức dược phẩm tối ưu.
1.2. Mục tiêu và nội dung của đềtài
Mục tiêu của đềtài là đưa ra một phương pháp hiệu quả đểtối ưu hóa công thức
dược phẩm, giúp các nhà bào chếtiết kiệm thời gian và công sức.
Nội dung thực hiện của đềtài là sửdụng 2 kỹthuật chính là lập trình di truyền
(Genetic Programming) đểmô hình hóa dữliệu và thuật giải di truyền (Genetic
Algorithms) đểtìm ra công thức dược phẩm tối ưu. Đềtài sẽsửdụng các dữliệu
thực tế đã được đánh giá bằng Neural Networks kết hợp với Genetic Algorithms. So
sánh các kết quả đạt được với các kết quảtrước đó bằng phương pháp thống kê, đưa
ra đánh giá về ưu điểm của hướng kết hợp mới.
1.3. Nội dung trình bày của luận văn
Luận văn gồm các phần sau đây:
• Chương 1: Đặt vấn đề là chương giới thiệu vềcông việc thiết kếvà tối ưu
công thức dược phẩm, chương này cũng giới thiệu sơlược vềmục tiêu và nội
dung của đềtài.
• Chương 2: Tổng quan và Cơsởlý thuyết là chương giới thiệu vềthuật giải
di truyền và lập trình di truyền, hai thuật toán tính toán tiến hóa được sửdụng
trong đềtài. Chương này cũng mô tảviệc ứng dụng hai kỹthuật tính toán tiến
hóa này cho bài toán tối ưu công thức dược phẩm
• Chương 3: Chương trình ứng dụng là chương trình bày kết quảviệc cài đặt
thuật giải di truyền và lập trình di truyền đểtìm công thức dược phẩm tối ưu,
đồng thời đánh giá kết quảthửnghiệm, so sánh kết quả đạt được từchương
trình với kết quảtừphương pháp thống kê và chương trình INForm 3.6.
• Chương 4: Đánh giá và hướng phát triển là chương đưa ra các kết quảmà
đềtài đã đạt được, cũng nhưnhững tồn tại cần phải khắc phục, đồng thời đưa
ra hướng phát triển đềtài.
33 trang |
Chia sẻ: tuandn | Lượt xem: 1894 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng các phương pháp tính toán tiến hóa để giải quyết bài toán tối ưu công thức dược phẩm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
35
CHƯƠNG 3. CHƯƠNG TRÌNH ỨNG DỤNG
3.1. Yêu cầu
Chương trình ứng dụng phải giải quyết được các vấn đề sau:
- Thiết lập được phương trình toán học thể hiện mối quan hệ giữa các biến độc lập
x và các biến phụ thuộc y từ bộ dữ liệu thực nghiệm đưa vào (dựa trên mô hình
thực nghiệm).
- Dự đoán được giá trị của các biến phụ thuộc y từ giá trị các biến độc lập x.
- Cho người dùng đưa ra yêu cầu về tính chất, giá trị của các biến phụ thuộc y, từ
đó, chương trình phải tối ưu các biến độc lập x.
Ngoài ra, chương trình còn có các tính toán, thống kê để đánh giá các kết quả xuất
ra.
3.2. Cài đặt
Chương trình ứng dụng 2 kỹ thuật tính toán tiến hóa là thuật giải di truyền và lập
trình di truyền kết hợp logic mờ giải quyết bài toán tối ưu hóa công thức.
Giao diện chính của chương trình
Formatted: Indent: Left: 0 pt
36
Hình 3.1. Giao diện chính của chương trình
Chương trình gồm 5 bước thực hiện chính như sau:
- Bước 1: Nhập bộ dữ liệu thực nghiệm.
- Bước 2: Xác định các biến độc lập và phụ thuộc.
- Bước 3: Dùng GP tìm các công thức quan hệ giữa x và y.
- Bước 4: Nhập dữ liệu đầu vào cho GA.
- Bước 5: Dùng GA tìm các giá trị x sao cho các y đạt giá trị tối ưu.
37
Bước 1: Nhập bộ dữ liệu thực nghiệm.
Hình 3.2. Bước 1: Nhập bộ dữ liệu thực nghiệm.
Chương trình hỗ trợ việc nhập bộ dữ liệu thực nghiệm bằng 3 cách:
- Nhập trực tiếp từ bàn phím.
- Mở từ tập tin MS Excel.
- Sao chép từ chương trình MS Excel.
38
Bước 2: Xác định các biến độc lập và phụ thuộc.
Hình 3.3. Bước 2: Xác định các biến độc lập và phụ thuộc.
Chương trình đã đặt mặc định, cho phép hỗ trợ người dùng xác định biến 1 cách tự
động:
- Các tên biến bắt đầu bằng chữ x là các biến độc lập.
- Các tên biến bắt đầu bằng chữ y là các biến phụ thuộc.
Deleted: ắ
Deleted: ắ
39
Bước 3: Dùng GP tìm các công thức quan hệ giữa x và y.
Hình 3.4. Bước 3: Dùng GP tìm các công thức quan hệ giữa x và y.
Sau khi đã cài đặt các tham số cần thiết cho thuật toán, người dùng có thể chọn từng
biến phụ thuộc và chọn thao tác Khởi tạo quần thể để khởi tạo quần thể ban đầu,
sau đó chọn thao tác Huấn luyện để chạy thuật toán hoặc chọn thao tác Khởi tạo tất
cả để thực hiện trên tất cả các biến phụ thuộc.
Trong đó, giá trị R2 (luyện và thử) được tính theo công thức sau:
100
)(
)ˆ(
1
1
2
1
2
2 ×
⎟⎟
⎟⎟
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜⎜
⎜⎜
⎜
⎝
⎛
−
−
−=
∑
∑
=
=
n
i
i
n
i
ii
yy
yy
R
Với:
n: số lượng dữ liệu thực nghiệm.
iy : giá trị thực nghiệm thứ i của biến phụ thuộc.
Formatted: Superscript
Formatted: Centered, Tabs: 439.5
pt, Right
Formatted: Lowered by 45 pt
Formatted: Indent: First line: 36 pt
Formatted: Lowered by 6 pt
40
iyˆ : giá trị dự đoán thứ i của biến phụ thuộc.
:y giá trị trung bình của biến phụ thuộc.
Trong quá trình thực hiện thuật toán:
- Biểu đồ tổng lỗi thể hiện giá trị thích nghi của cá thể tốt nhất trong quần thể hiện
tại.
- Biểu đồ dự đoán thể hiện sự tương quan giữa giá trị thực nghiệm và giá trị tìm
được của biến phụ thuộc.
Hình 3.5. Biểu đồ dự đoán
Formatted: Lowered by 6 pt
Formatted: Lowered by 5 pt
41
Các phép tính được sử dụng:
- Toán tử một ngôi:
Hình 3.6. Các phép tính một ngôi được sử dụng trong chương trình.
- Toán tử hai ngôi:
Hình 3.7. Các phép tính hai ngôi được sử dụng trong chương trình.
42
Biểu đồ 3D thể hiện mối tương quan bằng đồ thị giữa các biến phụ thuộc và các
biến độc lập.
Hình 3.8. Biểu đồ 3D
Ngoài ra, ở bước này, chương trình còn cho phép người sử dụng xem chi tiết các cá
thể trong quần thể hiện tại, đồng thời thể hiện kết quả mà cá thể tốt nhất đạt được.
Hơn nữa, phần này còn cho phép người dùng chọn lại cá thể khác mà người dùng
cho là thích hợp hơn trong quần thể hiện tại.
Hình 3.9. Xem chi tiết quần thể
Formatted: Font: Bold, Italic
Deleted: ¶
43
Bước 4: Nhập dữ liệu đầu vào cho GA.
Hình 3.10. Bước 4: Nhập dữ liệu đầu vào cho GA.
Nếu giá trị của các biến độc lập được xác định, thì dựa vào công thức tìm được ở
bước 3, chương trình sẽ đưa ra giá trị tương ứng của các biến phụ thuộc.
Người dùng nhập vào các điều kiện ràng buộc trên các biến độc lập như: miền giá
trị (mặc định được tổng hợp từ dữ liệu thực nghiệm ban đầu), yêu cầu về giá trị (là
một giá trị cố định hay là một số nguyên…)… và đồng thời nhập giá trị tối ưu mà
người dùng yêu cầu trên các biến phụ thuộc.
Deleted: ¶
44
Hình 3.11. Nhập các điều kiện ràng buộc cho các biến độc lập
Bước 5: Dùng GA tìm các giá trị x sao cho các y đạt giá trị tối ưu.
Hình 3.12. Bước 5: Dùng GA tìm các giá trị x sao cho các y đạt giá trị tối ưu.
45
Sau khi đã cài đặt các tham số cần thiết, người dùng chọn thao tác Khởi tạo quần
thể để tạo quần thể ban đầu cho GA, chọn thao tác Huấn luyện để thực hiện thuật
toán. Sau khi dừng việc huấn luyện, có thể chọn một số cá thể để xuất ra trong phần
báo cáo.
Phần báo cáo xuất ra cả quá trình thực hiện, từ bước nhập dữ liệu thực nghiệm, xác
định biến phụ thuộc, kết quả của GP, các điều kiện ràng buộc trên các biến độc lập
và phụ thuộc, và kết quả của GA: các giá trị của các biến độc lập để các biến phụ
thuộc nhận các giá trị tối ưu theo yêu cầu của người dùng.
BÁO CÁO KẾT QUẢ
Công thức thực nghiệm
• Số biến độc lập:4
• Số biến phụ thuộc:4
• Dữ liệu thực nghiệm:
STT x1 x2 x3 x4 y1 y2 y3 y4
1 3 1 3 1 42.58 74.97 90.52 102.81
2 3 3 4 1 25.12 46.83 67.09 81.69
3 3 2.3 2 1 28.68 60.01 78.24 88.97
4 3 1.7 5 1 19.37 46.38 68.34 89.23
5 7 1 4 1 3.39 12.6 23.23 37.03
6 7 3 3 1 13.59 29.27 40.82 60.64
7 7 1.7 2 1 6.24 20.89 33.97 56.44
8 7 2.3 5 1 3.86 13.35 23.56 40.19
9 5.7 1 2 1 11.59 31.83 49.55 75.81
10 4.3 1 5 1 22.51 59.68 73.29 83.71
11 4.3 3 2 1 11.62 32 43.34 64.41
12 5.7 3 5 1 16.02 34.45 53.55 68.14
13 3 1 2 2 21.28 63.86 83.43 100.95
14 7 1 2 2 8.42 21.53 37.37 54.99
Formatted: Font: Bold, Italic
Formatted: Font: Bold, Italic
Formatted: Bullets and Numbering
Deleted: ề
46
15 3 3 2 2 34.64 62.01 76.57 96.34
16 7 3 2 2 15.91 35.42 59.32 78.57
17 3 1 5 2 28.8 65.87 89.29 103.21
18 7 1 5 2 6.79 18.97 29.53 41.46
19 3 3 5 2 43.51 71.05 89.75 104.66
20 7 3 5 2 9.29 24.98 35.93 55.61
21 5 2 3.5 2 10.34 30.3 45.47 63.32
• Số lượng dữ liệu luyện: 17
• Số lượng dữ liệu thử:
o y1: 4 ( 1; 5; 8; 16; )
o y2: 4 ( 5; 8; 17; 19; )
o y3: 4 ( 3; 6; 8; 19; )
o y4: 4 ( 6; 8; 14; 17; )
Kết quả mô hình dự đoán
• y1=((((79.93 / x1) + x2) + ((x3 * x2) / (x1 / x4))) - ((9.34 - (4.31 / x2)) - ((x2 * x2) /
(x1 / x4))))
R2 Luyện= 85.2 %
R2 Thử= 58.66 %
R2 = 75.89 %
• y2=((((86.76 - x3) / x1) + ((83.46 - x3) / x1)) - (((99 / x2) / x4) / ((96.47 / x1) -
(37.04 * x2))))
R2 Luyện= 84.17 %
R2 Thử= 79.56 %
R2 = 82.39 %
• y3=(((x2 / (x3 / 17.46)) / ((x1 - 10.52) + x1)) - ((x4 + 10.86) * (x1 - 9.61)))
R2 Luyện= 85.36 %
R2 Thử= 93.59 %
R2 = 87.69 %
• y4=(((43.17 + (11.39 / x2)) / ((15.29 * x1) / (x4 + 83.2))) + ((x2 * (15.08 * x1)) /
((x3 + 74.19) / x1)))
R2 Luyện= 80.28 %
Formatted: Bullets and Numbering
Formatted: Bullets and Numbering
47
R2 Thử= 82.02 %
R2 = 81.51 %
Yêu cầu tối ưu công thức
• Ràng buộc cho các biến độc lập:
o 3 ≤ x1 ≤ 7
o 1 ≤ x2 ≤ 3
o 2 ≤ x3 ≤ 5
o 1 ≤ x4 ≤ 2
• Ràng buộc cho các biến phụ thuộc:
o 10 ≤ y1 ≤ 20
o 40 ≤ y2 ≤ 55
o 55 ≤ y3 ≤ 79
o y4 ≥ 78
Kết quả công thức tối ưu
STT x1 x2 x3 x4 y1 y2 y3 y4
1 3.65 1.18 2.23 1.24 18.758 49.33 69.247 83.024
2 3.75 1.34 3.61 1.9 19.892 45.093 72.628 80.341
3 3.65 1.29 4.8 1.21 19.794 46.976 70.48 81.93
4 3.67 2.08 2.51 1.28 19.921 45.746 67.562 78.745
5 3.51 1.18 2.28 1.07 19.509 52.03 70.191 85.809
6 3.8 1.18 2.04 1.97 18.497 46.046 71.084 80.802
7 3.75 1.11 2.23 1.92 18.866 47.221 72.013 82.401
8 3.65 1.77 2.41 1.54 19.885 46.243 69.922 79.963
9 3.51 1.88 2.49 1.02 19.992 48.302 68.702 81.808
10 3.79 1.06 4.96 1.51 19.418 46.775 70.724 81.714
Hình 3.13. Xuất báo cáo kết quả của quá trình tối ưu công thức
Formatted: Bullets and Numbering
Deleted: ¶
BÁO CÁO KẾT QUẢ¶
Công thức thực nghiệm¶
Số biến độc lập:3 ¶
Số biến phụ thuộc:3 ¶
Dữ liệu thực nghiệm: ¶
STT ... [5]
48
Bước này với sự kết hợp với logic mờ, khi xác định giá trị tối ưu của các biến phụ
thuộc thông qua mô hình nhân quả tìm được từ GP, các giá trị này sẽ được ánh xạ
sang các giá trị mờ nhờ các hàm thành viên được xác định bởi người dùng. Với cách
định nghĩa tối ưu biến phụ thuộc, biến phụ thuộc được xem là tối ưu khi giá trị được
ánh xạ qua hàm thành viên bằng 1, như vậy:
Σƒi (yi) ≤ số biến phụ thuộc
với ƒi là hàm thành viên tương ứng với biến phụ thuộc yi.
Các hàm mờ được sử dụng trong quá trình tối ưu:
Hàm mái bằng (Flat Tent): giá trị tối ưu
được xác định trong khoảng từ Mid1 đến
Mid2. Mức tối ưu giảm từ Mid1 đến Min
và Mid2 đến Max.
Hàm lên dốc (Up): Giá trị tối ưu được
xác định trong khoảng từ Mid (Mid =
Mid1 = Mid2) đến Max. Mức tối ưu
giảm từ Mid đến Min
Hàm xuống dốc (Down): Giá trị tối ưu
được xác định trong khoảng từ Min đến
Mid (Mid = Mid1 = Mid2). Mức tối ưu
giảm từ Mid đến Max.
49
Hàm phẳng (Flat): Giá trị tối ưu là bất kỳ
giá trị nào nằm trong khoảng từ Min đến
Max.
3.3. So sánh kết quả dự đoán từ phần mềm GP với thực nghiệm
Tối ưu công thức Cefuroxim
Với :
y1 : độ đắng
y2 : độ hòa tan (%)
Điều kiện tối ưu hóa :
x1>= 312
y1 : càng nhỏ càng tốt
y2 : càng lớn càng tốt
Kết quả đạt được từ chương trình ứng dụng:
BÁO CÁO KẾT QUẢ
Công thức thực nghiệm
• Số biến độc lập:3
• Số biến phụ thuộc:2
• Dữ liệu thực nghiệm:
STT x1 x2 x3 y1 y2
1 312 300 20 1 77.23
2 234 300 40 1 83.56
3 234 150 40 1 82.89
50
4 312 450 40 0 76.98
5 468 150 20 0 63.12
6 312 450 20 1 77.98
7 468 450 40 0 63.68
8 468 300 20 0 62.91
9 234 450 40 1 83.22
10 234 300 20 1 83.41
11 468 150 40 0 61.48
12 312 300 40 0 78.15
13 312 150 20 1 77.63
14 234 150 20 1 81.87
• Số lượng dữ liệu luyện: 12
• Số lượng dữ liệu thử:
o y1: 2 ( 10; 11; )
o y2: 2 ( 10; 11; )
Kết quả mô hình dự đoán
• y1=((((26.32 * (78.26 / (((x2 + (9.07 / x2)) * (x1 / 31.1)) / x2))) - (((((4.49 - (90.23
+ 51.4)) + x1) * x3) / ((x3 - ((73.2 - x1) * (x1 / 97.44))) - ((93.37 * x1) / (x3 - (x3 /
36.86))))) + squareRootAbs(((x1 / (53.96 - x3)) * x1) + x1))) / x1) - ((91.62 * x1) /
(59.7 * ((91.62 + (91.62 * x1)) - ((x1 / ((x1 / 18.78) / x3)) * squareRootAbs(x3 - (x1
* x3)))))))
R2 Luyện= 99.52 %
R2 Thử= 98.55 %
R2 = 99.38 %
• y2=((((76.48 + x2) / (x1 + 51.26)) + 88.04) - (x1 / (97.11 / (x1 / 88.04))))
R2 Luyện= 99.57 %
R2 Thử= 99.12 %
R2 = 99.47 %
Yêu cầu tối ưu công thức
• Ràng buộc cho các biến độc lập:
51
o 234 ≤ x1 ≤ 468
o 150 ≤ x2 ≤ 450
o 20 ≤ x3 ≤ 40
o x1 >= 312
• Ràng buộc cho các biến phụ thuộc:
o y1 ≤ 0
o y2 ≥ 83.56
Kết quả công thức tối ưu
STT x1 x2 x3 y1 y2
1 312.747 449.999 39.947 0 78.046
Từ kết quả dự đoán của GP cho Y2 mô hình dự đoán cho thấy X3 thật sự không có ý
nghĩa lên độ hoà tan của thuốc. Điều này rất quan trọng có thể giúp nhà bào chế
hiểu rõ hơn về mối liên hệ giữa các thành phần trong công thức nghiên cứu. Giá trị
của các biến độc lập có được từ chương trình được dùng để sản xuất thực nghiệm và
đạt được kết quả như sau:
X1= 312.75
X2= 450.00
X3= 39.95
Bảng 3.1. Kết quả thực nghiệm
Y1 Y2
Dự đoán từ chương trình 0.00 78.05
Thực nghiệm 0.00 77.71
Bằng phương pháp phân tích ANOVA 1 yếu tố, chứng minh được kết quả dự đoán
và kết quả thực nghiệm rõ ràng không có sự khác biệt về mặt thống kê (P=0.9978).
Formatted Table
Formatted: No underline
Formatted: Normal
Deleted: ¶
Deleted: X3
Deleted: x
Deleted: y
Deleted: x1
Deleted: x
Deleted: x
52
3.4. So sánh kết quả dự đoán từ phần mềm GP với các phương
pháp khác
Phương pháp thống kê từ nghiên cứu đã công bố và phần mềm tối ưu hoá INForm
V3.6 với kỹ thuật mạng nơ ron và thuật toán di truyền sẽ được so sánh với kỹ thuật
tiến hóa trong nghiên cứu này.
3.4.1. Dữ liệu công thức
Dữ liệu công thức dược phẩm được tham khảo từ công trình của Bodea và Leucuta
[5], công thức viên nén matrix bao gồm 13 công thức thực nghiệm với 3 biến độc
lập (hydroxypropylmethylcellulose, HPMC – X1, sodium carboxymethylcellulose,
CMCNa – X2 và propranolol HCL – X3). Phần trăm (%) hoạt chất được giải phóng
sau 1 giờ, 6 giờ, và 12 giờ được xem là các biến phụ thuộc Y1, Y2, và Y3 tương ứng.
Dữ liệu công thức này đã được tối ưu trong nghiên cứu của Bodea và Leucuta bằng
phương pháp thống kê D-optimal quadratic.
Phần này sẽ trình bày kết quả tối ưu dữ liệu này (Phụ lục A) với kỹ thuật tiến hoá và
ngoài ra kết quả từ kỹ thuật máy tính sẽ được so sánh với kết quả thống kê của
Bodea và Leucuta [5], và kết quả từ chương trình INForm 3.6 (Phụ lục B).
3.4.2. Mô hình hoá dữ liệu
Công thức dự đoán từ kỹ thuật GP:
Y1=((((((976.35 / 242.53) - (215.21 / x1)) + (x3 - 688.37)) / ((x1 * (x2 * 997.26)) +
(210.31 + 127.19))) / (((x1 * 584.85) + (913.62 - (x1 * 876.06))) * ((429.69 / x3) /
(x1 * 876.06)))) * ((((566.8 - 604.07) * (945.87 / 242.53)) / (((88.66 + x3) + x3) /
(473.73 - 431.87))) + (((x2 * 719.74) - (688.37 - (431.87 / x3))) / ((389.02 * x1) -
((88.66 + x3) + x3))))) (3.1)
(R2 = 0.98)
Y2=((900.52 + (((x1 * x1) * (861.45 + (x2 / 773.25))) - (((x1 * 315.4) * x2) +
343.42))) / ((((x1 / x3) + (699.75 / 622.59)) * (773.25 + (x1 / (x1 - x3)))) - ((((x2 +
Formatted: Normal
Formatted: Subscript
Formatted: Subscript
Deleted: GP
Deleted: phụ lục
Deleted: phụ lục
53
146.69) + (253.13 - 115.75)) - ((x3 - x2) * (x2 * 974.33))) - (((x1 / x3) - x2) * (x2 *
974.33))))) (3.2)
(R2 = 0.98)
Y3=((((((x2 + x2) / x1) / (x3 - x1)) + ((859.1 - 76.57) * x3)) + (783.85 + ((687.92 *
x2) * (x2 - x3)))) / ((698.57 + (((x3 / 698.57) + (x3 - x1)) + 413.18)) + (x1 * (659.6
- (x1 / (x3 / 50.92)))))) (3.3)
(R2 = 0.97)
Công thức dự đoán từ nghiên cứu của Bodea và Leucuta [5]:
Y1 = -0.015 + 0.145X1 - 0.062X2 + 0.168X3 + 0.594X22 - 0.691X1X2 (3.4)
(R2 = 0.96)
Y2 = 0.279 - 0.1X1 - 0.08X2 + 0.626X3 + 1.27X22 - 0.841X1X2 (3.5)
(R2 = 0.91)
Y3 = 0.629 - 0.246X1 - 0.08X2 + 0.653X3 + 1.122X22 - 0.841X1X2 (3.6)
(R2 = 0.92)
Thông số luyện mạng cho INForm 3.6
Momentum 0.8
Tốc độ học 0.7
Số lượng dữ liệu đầu vào 3
Số lượng dữ liệu đầu ra 1
Số lượng lớp ẩn 1
Số lượng nút trong lớp ẩn 2
Hàm truyền Asymmetric Sigmoid
Hàm truyền tại nút xuất Linear
Hàm lan truyền ngược QuickProp
Y1: R2 = 0.98 (không có mô hình dự đoán rõ ràng với mạng nơron)
Y2: R2 = 0.93 (không có mô hình dự đoán rõ ràng với mạng nơron)
Y3: R2 = 0.96 (không có mô hình dự đoán rõ ràng với mạng nơron)
Formatted: Subscript
Formatted: Font color: Black
Formatted Table
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: No underline, Font
color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Right
Formatted: Subscript
Formatted: Left
Formatted: Font color: Black
Formatted: Right
Formatted: Font color: Black
Formatted: Font color: Black
Formatted: Subscript
Formatted: Right
Formatted: Subscript
Formatted: Widow/Orphan control
Deleted: Learning Rate
Deleted: Target Epoch
Deleted: Number of Inputs
Deleted: Number of Outputs
Deleted: Number of Hidden Layers
Deleted: Hidden Layer
Deleted: Number of Nodes
Deleted: 1
Deleted: 2
Deleted: Output Transfer Type
Deleted: BackPropagation Type
Deleted: ¶
Deleted: ¶
... [7]
... [6]
54
Bảng 3.2. So sánh kết quả dự đoán Y1 dùng kỹ thuật tiến hoá với phương pháp
thống kê và chương trình INForm 3.6
STT Y1 Y1-GP Y1-TK Y1-IN
1 0.152 0.150 0.145 0.153
2 0.104 0.098 0.105 0.100
3 0.112 0.111 0.108 0.113
4 0.122 0.123 0.138 0.128
5 0.148 0.148 0.143 0.151
6 0.074 0.076 0.066 0.076
7 0.098 0.104 0.092 0.102
8 0.084 0.090 0.088 0.087
9 0.087 0.090 0.088 0.087
10 0.084 0.090 0.088 0.087
11 0.089 0.090 0.088 0.087
12 0.052 0.045 0.055 0.055
13 0.143 0.140 0.140 0.137
Y1-TK = 0.959x + 0.0039
R2 = 0.96
Y1-GP = 0.978x + 0.0027
R2 = 0.98
Y1-IN = 0.976x + 0.0036
R2 = 0.98
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.04 0.06 0.08 0.1 0.12 0.14 0.16
Y1-GP
Y1-TK
Y1-IN
Hình 3.14. Biểu đồ hồi quy so sánh kết quả dự đoán của GP, thống kê và
INForm 3.6 cho Y1
Formatted: Subscript
Formatted: Hinh
Deleted:
Deleted:
Deleted: ¶
Deleted: ¶
55
Bảng 3.3. So sánh kết quả dự đoán Y2 dùng kỹ thuật tiến hoá với phương pháp
thống kê và chương trình INForm 3.6
STT Y2 Y2-GP Y2-TK Y2-IN
1 0.683 0.669 0.658 0.691
2 0.545 0.541 0.626 0.533
3 0.612 0.639 0.662 0.593
4 0.448 0.446 0.426 0.479
5 0.585 0.607 0.581 0.572
6 0.388 0.382 0.394 0.390
7 0.576 0.572 0.609 0.570
8 0.512 0.515 0.529 0.523
9 0.518 0.515 0.529 0.523
10 0.507 0.515 0.529 0.523
11 0.525 0.515 0.529 0.523
12 0.352 0.376 0.460 0.360
13 0.518 0.527 0.503 0.479
Y2-GP = 0.9786x + 0.015
R2 = 0.98
Y2-TK = 0.8534x + 0.0968
R2 = 0.80
Y2-IN = 0.9363x + 0.0324
R2 = 0.96
0.3
0.35
0.4
0.45
0.5
0.55
0.6
0.65
0.7
0.75
0.3 0.4 0.5 0.6 0.7 0.8
Y2-GP
Y2-TK
Y2-IN
Hình 3.15. Biểu đồ hồi quy so sánh kết quả dự đoán của GP, thống kê và
INForm 3.6 cho Y2
Formatted: Not Superscript/
Subscript
Formatted: Subscript
Deleted: ¶
Deleted:
Deleted: ¶
Deleted: ¶
56
Bảng 3.4. So sánh kết quả dự đoán Y3 dùng kỹ thuật tiến hoá với phương pháp
thống kê và chương trình INForm 3.6
STT Y3 Y3-GP Y3-TK Y3-IN
1 0.992 0.980 0.976 1.015
2 0.902 0.905 0.925 0.881
3 0.986 1.010 0.998 1.001
4 0.712 0.709 0.689 0.724
5 0.866 0.877 0.880 0.860
6 0.68 0.730 0.675 0.671
7 0.925 0.907 0.923 0.916
8 0.856 0.861 0.838 0.868
9 0.862 0.861 0.838 0.868
10 0.851 0.861 0.838 0.868
11 0.87 0.861 0.838 0.868
12 0.672 0.686 0.754 0.711
13 0.792 0.786 0.784 0.752
Y3-GP = 0.9278x + 0.066
R2 = 0.97
Y3-TK = 0.9187x + 0.068
R2 = 0.92
Y3-IN = 0.9927x + 0.009
R2 = 0.96
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
1.05
0.6 0.7 0.8 0.9 1 1.1
Y3-GP
Y3-TK
Y3-IN
Hình 3.16. Biểu đồ hồi quy so sánh kết quả dự đoán của GP, thống kê và
INForm 3.6 cho Y3
Formatted: Not Superscript/
Subscript
Formatted: Subscript
Deleted: ¶
Deleted: ¶
Deleted:
Deleted:
57
Trong giai đoạn mô hình hóa dữ liệu, chương trình INForm 3.6 không đưa ra được
phương trình toán học để thể hiện mối quan hệ giữa các biến phụ thuộc và các biến
độc lập.
Dựa vào phần mềm ứng dụng kỹ thuật tiến hóa, mặc dù công thức dự đoán cho các
biến Y1(công thức 3.1), Y2 (công thức 3.2), Y3 (công thức 3.3) được đưa ra bằng kỹ
thuật GP phức tạp hơn công thức được tính toán bằng phương pháp thống kê, tuy
nhiên giá trị dự đoán R2 cho các biến Y1, Y2, Y3 của GP cao hơn so với phương
pháp thống kê (tương ứng với các công thức 3.4, 3.5 và 3.6), và cũng cao hơn so với
kết quả dự đoán từ chương trình INForm 3.6.
Ngoài ra khi so sánh các kết quả dự đoán của Bodea và Leucuta bằng phương pháp
thống kê, kết quả dự đoán từ chương trình INForm 3.6 và kết quả từ kỹ thuật tiến
hoá với dữ liệu thực nghiệm bằng phương pháp hồi quy nhằm đánh giá khả năng dự
đoán và mô hình hoá dữ liệu thực nghiệm, kết quả trình bày trong Hình 3.14, 3.15
và 3.16 cho thấy:
- Phương trình hồi quy: dựa vào đồ thị và phương trình hồi quy (hệ số góc), kỹ
thuật tiến hoá cho kết quả khả quan hơn so với thống kê với các dữ liệu biến Y2.
- Giá trị R2 tương quan giữa giá trị thực nghiệm và dự đoán: giá trị R2 cho 3 biến
Y1, Y2 và Y3 của kỹ thuật tiến hoá đều cao hơn so với phương pháp thống kê.
Với so sánh bằng hồi quy tương quan, rõ ràng kết quả mô hình hoá từ kỹ thuật tiến
hoá gần như tốt hơn phương pháp thống kê đã được nghiên cứu bởi Bodea và
Leucuta [5], cũng như phần mềm tối ưu hóa INForm V3.6 cho