Luận văn Ứng dụng các phương pháp tính toán tiến hóa để giải quyết bài toán tối ưu công thức dược phẩm

1.1. Thiết kếvà tối ưu hóa công thức Đối với các nhà sản xuất dược phẩm, xây dựng công thức là việc thường xuyên phải thực hiện, do mỗi sản phẩm đều có một vòng đời nhất định, và nhu cầu cạnh tranh trên thịtrường đòi hỏi sản phẩm phải liên tục được cải tiến hay được thay thếbằng các sản phẩm mới. Trong mỗi công thức dược phẩm, ngoài các hoạt chất còn có nhiều thành phần tá dược khác nhau. Tính chất của sản phẩm không chỉphụthuộc vào tính chất và tỷlệ của các nguyên liệu mà còn bị ảnh hưởng bởi các điều kiện sản xuất (nhiệt độ, độ ẩm, thời gian, tốc độ ) Vì vậy, việc xây dựng công thức không phải là một vấn đề đơn giản, mà thực sựlà một sựthửthách. Các phương pháp tối ưu hóa truyền thống (toán thống kê, đơn hình ) có thểáp dụng với các dữliệu đơn giản và tuyến tính, nhưng không phù hợp với những dữ liệu phức tạp và phi tuyến. Ngoài ra, các phương pháp này không tối ưu đồng thời được nhiều biến phụthuộc trong khi mỗi dược phẩm có rất nhiều tính chất cần được tối ưu [2]. Việc xây dựng và tối ưu công thức bằng máy tính ngày càng được áp dụng phổbiến vì các lợi ích của nó nhưkhông giới hạn sốbiến độc lập (x), có thểtối ưu đồng thời nhiều biến phụthuộc (y), phù hợp với các loại dữliệu phức tạp và phi tuyến. Có rất nhiều phương pháp xây dựng và tối ưu công thức bằng máy tính đã được áp dụng như: mạng nơ ron (Neural Networks), logic mờ(Fuzzy Logic), thuật giải di truyền (Genetic Algorithms) và các hệthống lai giữa chúng. Những kỹthuật này phần nào giải quyết được yêu cầu tối ưu nhưgiảm thời gian và chi phí nghiên cứu và phát triển công thức. Tuy nhiên, các kỹthuật này tồn tại nhiều hạn chếnhư: Mạng neuron thì được biết đến nhưmột phương pháp “hộp đen” (black-box), không thểtheo dõi tiến trình thực hiện và các kỹthuật trên không thểtạo ra các công thức ởdạng phương trình toán học. Mặc dù có những hệthống lai của những kỹthuật này, nhưng những hệthống này chỉcó thểhỗtrợngười dùng trong việc truy vấn tri thức trong những luật dạng “If then ”, và nhiều khi thông tin tìm được không thỏa mãn yêu cầu [1], [7]. Với ưu điểm chính là có thểtạo ra các phương trình toán học khác nhau từmột bộ dữliệu thực nghiệm, lập trình di truyền (Genetic Programming - GP) được hy vọng sẽgiúp đạt kết quảtốt trong việc mô hình hóa dữliệu. Những ưu điểm của lập trình di truyền liên quan đến vấn đềtối ưu công thức dược phẩm là: - Cho ra kết quảlà phương trình toán học. - Có thểthực hiện với những dữliệu phi tuyến. - Việc thực thi của lập trình di truyền thì khá linh hoạt, tùy thuộc vào việc lựa chọn các hàm tính giá trịthích nghi hay thay đổi các tham sốliên quan. Dựa trên những mô hình dữliệu có được từGP, áp dụng thuật giải di truyền (Genetic Algorithms - GA) đểcó được công thức dược phẩm tối ưu. 1.2. Mục tiêu và nội dung của đềtài Mục tiêu của đềtài là đưa ra một phương pháp hiệu quả đểtối ưu hóa công thức dược phẩm, giúp các nhà bào chếtiết kiệm thời gian và công sức. Nội dung thực hiện của đềtài là sửdụng 2 kỹthuật chính là lập trình di truyền (Genetic Programming) đểmô hình hóa dữliệu và thuật giải di truyền (Genetic Algorithms) đểtìm ra công thức dược phẩm tối ưu. Đềtài sẽsửdụng các dữliệu thực tế đã được đánh giá bằng Neural Networks kết hợp với Genetic Algorithms. So sánh các kết quả đạt được với các kết quảtrước đó bằng phương pháp thống kê, đưa ra đánh giá về ưu điểm của hướng kết hợp mới. 1.3. Nội dung trình bày của luận văn Luận văn gồm các phần sau đây: • Chương 1: Đặt vấn đề là chương giới thiệu vềcông việc thiết kếvà tối ưu công thức dược phẩm, chương này cũng giới thiệu sơlược vềmục tiêu và nội dung của đềtài. • Chương 2: Tổng quan và Cơsởlý thuyết là chương giới thiệu vềthuật giải di truyền và lập trình di truyền, hai thuật toán tính toán tiến hóa được sửdụng trong đềtài. Chương này cũng mô tảviệc ứng dụng hai kỹthuật tính toán tiến hóa này cho bài toán tối ưu công thức dược phẩm • Chương 3: Chương trình ứng dụng là chương trình bày kết quảviệc cài đặt thuật giải di truyền và lập trình di truyền đểtìm công thức dược phẩm tối ưu, đồng thời đánh giá kết quảthửnghiệm, so sánh kết quả đạt được từchương trình với kết quảtừphương pháp thống kê và chương trình INForm 3.6. • Chương 4: Đánh giá và hướng phát triển là chương đưa ra các kết quảmà đềtài đã đạt được, cũng nhưnhững tồn tại cần phải khắc phục, đồng thời đưa ra hướng phát triển đềtài.

33 trang | Chia sẻ: tuandn | Lượt xem: 2317 | Lượt tải: 2

Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng các phương pháp tính toán tiến hóa để giải quyết bài toán tối ưu công thức dược phẩm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

35 CHƯƠNG 3. CHƯƠNG TRÌNH ỨNG DỤNG 3.1. Yêu cầu Chương trình ứng dụng phải giải quyết được các vấn đề sau: - Thiết lập được phương trình toán học thể hiện mối quan hệ giữa các biến độc lập x và các biến phụ thuộc y từ bộ dữ liệu thực nghiệm đưa vào (dựa trên mô hình thực nghiệm). - Dự đoán được giá trị của các biến phụ thuộc y từ giá trị các biến độc lập x. - Cho người dùng đưa ra yêu cầu về tính chất, giá trị của các biến phụ thuộc y, từ đó, chương trình phải tối ưu các biến độc lập x. Ngoài ra, chương trình còn có các tính toán, thống kê để đánh giá các kết quả xuất ra. 3.2. Cài đặt Chương trình ứng dụng 2 kỹ thuật tính toán tiến hóa là thuật giải di truyền và lập trình di truyền kết hợp logic mờ giải quyết bài toán tối ưu hóa công thức. Giao diện chính của chương trình Formatted: Indent: Left: 0 pt 36 Hình 3.1. Giao diện chính của chương trình Chương trình gồm 5 bước thực hiện chính như sau: - Bước 1: Nhập bộ dữ liệu thực nghiệm. - Bước 2: Xác định các biến độc lập và phụ thuộc. - Bước 3: Dùng GP tìm các công thức quan hệ giữa x và y. - Bước 4: Nhập dữ liệu đầu vào cho GA. - Bước 5: Dùng GA tìm các giá trị x sao cho các y đạt giá trị tối ưu. 37 Bước 1: Nhập bộ dữ liệu thực nghiệm. Hình 3.2. Bước 1: Nhập bộ dữ liệu thực nghiệm. Chương trình hỗ trợ việc nhập bộ dữ liệu thực nghiệm bằng 3 cách: - Nhập trực tiếp từ bàn phím. - Mở từ tập tin MS Excel. - Sao chép từ chương trình MS Excel. 38 Bước 2: Xác định các biến độc lập và phụ thuộc. Hình 3.3. Bước 2: Xác định các biến độc lập và phụ thuộc. Chương trình đã đặt mặc định, cho phép hỗ trợ người dùng xác định biến 1 cách tự động: - Các tên biến bắt đầu bằng chữ x là các biến độc lập. - Các tên biến bắt đầu bằng chữ y là các biến phụ thuộc. Deleted: ắ Deleted: ắ 39 Bước 3: Dùng GP tìm các công thức quan hệ giữa x và y. Hình 3.4. Bước 3: Dùng GP tìm các công thức quan hệ giữa x và y. Sau khi đã cài đặt các tham số cần thiết cho thuật toán, người dùng có thể chọn từng biến phụ thuộc và chọn thao tác Khởi tạo quần thể để khởi tạo quần thể ban đầu, sau đó chọn thao tác Huấn luyện để chạy thuật toán hoặc chọn thao tác Khởi tạo tất cả để thực hiện trên tất cả các biến phụ thuộc. Trong đó, giá trị R2 (luyện và thử) được tính theo công thức sau: 100 )( )ˆ( 1 1 2 1 2 2 × ⎟⎟ ⎟⎟ ⎟⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎜⎜ ⎜ ⎝ ⎛ − − −= ∑ ∑ = = n i i n i ii yy yy R Với: n: số lượng dữ liệu thực nghiệm. iy : giá trị thực nghiệm thứ i của biến phụ thuộc. Formatted: Superscript Formatted: Centered, Tabs: 439.5 pt, Right Formatted: Lowered by 45 pt Formatted: Indent: First line: 36 pt Formatted: Lowered by 6 pt 40 iyˆ : giá trị dự đoán thứ i của biến phụ thuộc. :y giá trị trung bình của biến phụ thuộc. Trong quá trình thực hiện thuật toán: - Biểu đồ tổng lỗi thể hiện giá trị thích nghi của cá thể tốt nhất trong quần thể hiện tại. - Biểu đồ dự đoán thể hiện sự tương quan giữa giá trị thực nghiệm và giá trị tìm được của biến phụ thuộc. Hình 3.5. Biểu đồ dự đoán Formatted: Lowered by 6 pt Formatted: Lowered by 5 pt 41 Các phép tính được sử dụng: - Toán tử một ngôi: Hình 3.6. Các phép tính một ngôi được sử dụng trong chương trình. - Toán tử hai ngôi: Hình 3.7. Các phép tính hai ngôi được sử dụng trong chương trình. 42 Biểu đồ 3D thể hiện mối tương quan bằng đồ thị giữa các biến phụ thuộc và các biến độc lập. Hình 3.8. Biểu đồ 3D Ngoài ra, ở bước này, chương trình còn cho phép người sử dụng xem chi tiết các cá thể trong quần thể hiện tại, đồng thời thể hiện kết quả mà cá thể tốt nhất đạt được. Hơn nữa, phần này còn cho phép người dùng chọn lại cá thể khác mà người dùng cho là thích hợp hơn trong quần thể hiện tại. Hình 3.9. Xem chi tiết quần thể Formatted: Font: Bold, Italic Deleted: ¶ 43 Bước 4: Nhập dữ liệu đầu vào cho GA. Hình 3.10. Bước 4: Nhập dữ liệu đầu vào cho GA. Nếu giá trị của các biến độc lập được xác định, thì dựa vào công thức tìm được ở bước 3, chương trình sẽ đưa ra giá trị tương ứng của các biến phụ thuộc. Người dùng nhập vào các điều kiện ràng buộc trên các biến độc lập như: miền giá trị (mặc định được tổng hợp từ dữ liệu thực nghiệm ban đầu), yêu cầu về giá trị (là một giá trị cố định hay là một số nguyên…)… và đồng thời nhập giá trị tối ưu mà người dùng yêu cầu trên các biến phụ thuộc. Deleted: ¶ 44 Hình 3.11. Nhập các điều kiện ràng buộc cho các biến độc lập Bước 5: Dùng GA tìm các giá trị x sao cho các y đạt giá trị tối ưu. Hình 3.12. Bước 5: Dùng GA tìm các giá trị x sao cho các y đạt giá trị tối ưu. 45 Sau khi đã cài đặt các tham số cần thiết, người dùng chọn thao tác Khởi tạo quần thể để tạo quần thể ban đầu cho GA, chọn thao tác Huấn luyện để thực hiện thuật toán. Sau khi dừng việc huấn luyện, có thể chọn một số cá thể để xuất ra trong phần báo cáo. Phần báo cáo xuất ra cả quá trình thực hiện, từ bước nhập dữ liệu thực nghiệm, xác định biến phụ thuộc, kết quả của GP, các điều kiện ràng buộc trên các biến độc lập và phụ thuộc, và kết quả của GA: các giá trị của các biến độc lập để các biến phụ thuộc nhận các giá trị tối ưu theo yêu cầu của người dùng. BÁO CÁO KẾT QUẢ Công thức thực nghiệm • Số biến độc lập:4 • Số biến phụ thuộc:4 • Dữ liệu thực nghiệm: STT x1 x2 x3 x4 y1 y2 y3 y4 1 3 1 3 1 42.58 74.97 90.52 102.81 2 3 3 4 1 25.12 46.83 67.09 81.69 3 3 2.3 2 1 28.68 60.01 78.24 88.97 4 3 1.7 5 1 19.37 46.38 68.34 89.23 5 7 1 4 1 3.39 12.6 23.23 37.03 6 7 3 3 1 13.59 29.27 40.82 60.64 7 7 1.7 2 1 6.24 20.89 33.97 56.44 8 7 2.3 5 1 3.86 13.35 23.56 40.19 9 5.7 1 2 1 11.59 31.83 49.55 75.81 10 4.3 1 5 1 22.51 59.68 73.29 83.71 11 4.3 3 2 1 11.62 32 43.34 64.41 12 5.7 3 5 1 16.02 34.45 53.55 68.14 13 3 1 2 2 21.28 63.86 83.43 100.95 14 7 1 2 2 8.42 21.53 37.37 54.99 Formatted: Font: Bold, Italic Formatted: Font: Bold, Italic Formatted: Bullets and Numbering Deleted: ề 46 15 3 3 2 2 34.64 62.01 76.57 96.34 16 7 3 2 2 15.91 35.42 59.32 78.57 17 3 1 5 2 28.8 65.87 89.29 103.21 18 7 1 5 2 6.79 18.97 29.53 41.46 19 3 3 5 2 43.51 71.05 89.75 104.66 20 7 3 5 2 9.29 24.98 35.93 55.61 21 5 2 3.5 2 10.34 30.3 45.47 63.32 • Số lượng dữ liệu luyện: 17 • Số lượng dữ liệu thử: o y1: 4 ( 1; 5; 8; 16; ) o y2: 4 ( 5; 8; 17; 19; ) o y3: 4 ( 3; 6; 8; 19; ) o y4: 4 ( 6; 8; 14; 17; ) Kết quả mô hình dự đoán • y1=((((79.93 / x1) + x2) + ((x3 * x2) / (x1 / x4))) - ((9.34 - (4.31 / x2)) - ((x2 * x2) / (x1 / x4)))) R2 Luyện= 85.2 % R2 Thử= 58.66 % R2 = 75.89 % • y2=((((86.76 - x3) / x1) + ((83.46 - x3) / x1)) - (((99 / x2) / x4) / ((96.47 / x1) - (37.04 * x2)))) R2 Luyện= 84.17 % R2 Thử= 79.56 % R2 = 82.39 % • y3=(((x2 / (x3 / 17.46)) / ((x1 - 10.52) + x1)) - ((x4 + 10.86) * (x1 - 9.61))) R2 Luyện= 85.36 % R2 Thử= 93.59 % R2 = 87.69 % • y4=(((43.17 + (11.39 / x2)) / ((15.29 * x1) / (x4 + 83.2))) + ((x2 * (15.08 * x1)) / ((x3 + 74.19) / x1))) R2 Luyện= 80.28 % Formatted: Bullets and Numbering Formatted: Bullets and Numbering 47 R2 Thử= 82.02 % R2 = 81.51 % Yêu cầu tối ưu công thức • Ràng buộc cho các biến độc lập: o 3 ≤ x1 ≤ 7 o 1 ≤ x2 ≤ 3 o 2 ≤ x3 ≤ 5 o 1 ≤ x4 ≤ 2 • Ràng buộc cho các biến phụ thuộc: o 10 ≤ y1 ≤ 20 o 40 ≤ y2 ≤ 55 o 55 ≤ y3 ≤ 79 o y4 ≥ 78 Kết quả công thức tối ưu STT x1 x2 x3 x4 y1 y2 y3 y4 1 3.65 1.18 2.23 1.24 18.758 49.33 69.247 83.024 2 3.75 1.34 3.61 1.9 19.892 45.093 72.628 80.341 3 3.65 1.29 4.8 1.21 19.794 46.976 70.48 81.93 4 3.67 2.08 2.51 1.28 19.921 45.746 67.562 78.745 5 3.51 1.18 2.28 1.07 19.509 52.03 70.191 85.809 6 3.8 1.18 2.04 1.97 18.497 46.046 71.084 80.802 7 3.75 1.11 2.23 1.92 18.866 47.221 72.013 82.401 8 3.65 1.77 2.41 1.54 19.885 46.243 69.922 79.963 9 3.51 1.88 2.49 1.02 19.992 48.302 68.702 81.808 10 3.79 1.06 4.96 1.51 19.418 46.775 70.724 81.714 Hình 3.13. Xuất báo cáo kết quả của quá trình tối ưu công thức Formatted: Bullets and Numbering Deleted: ¶ BÁO CÁO KẾT QUẢ¶ Công thức thực nghiệm¶ Số biến độc lập:3 ¶ Số biến phụ thuộc:3 ¶ Dữ liệu thực nghiệm: ¶ STT ... [5] 48 Bước này với sự kết hợp với logic mờ, khi xác định giá trị tối ưu của các biến phụ thuộc thông qua mô hình nhân quả tìm được từ GP, các giá trị này sẽ được ánh xạ sang các giá trị mờ nhờ các hàm thành viên được xác định bởi người dùng. Với cách định nghĩa tối ưu biến phụ thuộc, biến phụ thuộc được xem là tối ưu khi giá trị được ánh xạ qua hàm thành viên bằng 1, như vậy: Σƒi (yi) ≤ số biến phụ thuộc với ƒi là hàm thành viên tương ứng với biến phụ thuộc yi. Các hàm mờ được sử dụng trong quá trình tối ưu: Hàm mái bằng (Flat Tent): giá trị tối ưu được xác định trong khoảng từ Mid1 đến Mid2. Mức tối ưu giảm từ Mid1 đến Min và Mid2 đến Max. Hàm lên dốc (Up): Giá trị tối ưu được xác định trong khoảng từ Mid (Mid = Mid1 = Mid2) đến Max. Mức tối ưu giảm từ Mid đến Min Hàm xuống dốc (Down): Giá trị tối ưu được xác định trong khoảng từ Min đến Mid (Mid = Mid1 = Mid2). Mức tối ưu giảm từ Mid đến Max. 49 Hàm phẳng (Flat): Giá trị tối ưu là bất kỳ giá trị nào nằm trong khoảng từ Min đến Max. 3.3. So sánh kết quả dự đoán từ phần mềm GP với thực nghiệm Tối ưu công thức Cefuroxim Với : y1 : độ đắng y2 : độ hòa tan (%) Điều kiện tối ưu hóa : x1>= 312 y1 : càng nhỏ càng tốt y2 : càng lớn càng tốt Kết quả đạt được từ chương trình ứng dụng: BÁO CÁO KẾT QUẢ Công thức thực nghiệm • Số biến độc lập:3 • Số biến phụ thuộc:2 • Dữ liệu thực nghiệm: STT x1 x2 x3 y1 y2 1 312 300 20 1 77.23 2 234 300 40 1 83.56 3 234 150 40 1 82.89 50 4 312 450 40 0 76.98 5 468 150 20 0 63.12 6 312 450 20 1 77.98 7 468 450 40 0 63.68 8 468 300 20 0 62.91 9 234 450 40 1 83.22 10 234 300 20 1 83.41 11 468 150 40 0 61.48 12 312 300 40 0 78.15 13 312 150 20 1 77.63 14 234 150 20 1 81.87 • Số lượng dữ liệu luyện: 12 • Số lượng dữ liệu thử: o y1: 2 ( 10; 11; ) o y2: 2 ( 10; 11; ) Kết quả mô hình dự đoán • y1=((((26.32 * (78.26 / (((x2 + (9.07 / x2)) * (x1 / 31.1)) / x2))) - (((((4.49 - (90.23 + 51.4)) + x1) * x3) / ((x3 - ((73.2 - x1) * (x1 / 97.44))) - ((93.37 * x1) / (x3 - (x3 / 36.86))))) + squareRootAbs(((x1 / (53.96 - x3)) * x1) + x1))) / x1) - ((91.62 * x1) / (59.7 * ((91.62 + (91.62 * x1)) - ((x1 / ((x1 / 18.78) / x3)) * squareRootAbs(x3 - (x1 * x3))))))) R2 Luyện= 99.52 % R2 Thử= 98.55 % R2 = 99.38 % • y2=((((76.48 + x2) / (x1 + 51.26)) + 88.04) - (x1 / (97.11 / (x1 / 88.04)))) R2 Luyện= 99.57 % R2 Thử= 99.12 % R2 = 99.47 % Yêu cầu tối ưu công thức • Ràng buộc cho các biến độc lập: 51 o 234 ≤ x1 ≤ 468 o 150 ≤ x2 ≤ 450 o 20 ≤ x3 ≤ 40 o x1 >= 312 • Ràng buộc cho các biến phụ thuộc: o y1 ≤ 0 o y2 ≥ 83.56 Kết quả công thức tối ưu STT x1 x2 x3 y1 y2 1 312.747 449.999 39.947 0 78.046 Từ kết quả dự đoán của GP cho Y2 mô hình dự đoán cho thấy X3 thật sự không có ý nghĩa lên độ hoà tan của thuốc. Điều này rất quan trọng có thể giúp nhà bào chế hiểu rõ hơn về mối liên hệ giữa các thành phần trong công thức nghiên cứu. Giá trị của các biến độc lập có được từ chương trình được dùng để sản xuất thực nghiệm và đạt được kết quả như sau: X1= 312.75 X2= 450.00 X3= 39.95 Bảng 3.1. Kết quả thực nghiệm Y1 Y2 Dự đoán từ chương trình 0.00 78.05 Thực nghiệm 0.00 77.71 Bằng phương pháp phân tích ANOVA 1 yếu tố, chứng minh được kết quả dự đoán và kết quả thực nghiệm rõ ràng không có sự khác biệt về mặt thống kê (P=0.9978). Formatted Table Formatted: No underline Formatted: Normal Deleted: ¶ Deleted: X3 Deleted: x Deleted: y Deleted: x1 Deleted: x Deleted: x 52 3.4. So sánh kết quả dự đoán từ phần mềm GP với các phương pháp khác Phương pháp thống kê từ nghiên cứu đã công bố và phần mềm tối ưu hoá INForm V3.6 với kỹ thuật mạng nơ ron và thuật toán di truyền sẽ được so sánh với kỹ thuật tiến hóa trong nghiên cứu này. 3.4.1. Dữ liệu công thức Dữ liệu công thức dược phẩm được tham khảo từ công trình của Bodea và Leucuta [5], công thức viên nén matrix bao gồm 13 công thức thực nghiệm với 3 biến độc lập (hydroxypropylmethylcellulose, HPMC – X1, sodium carboxymethylcellulose, CMCNa – X2 và propranolol HCL – X3). Phần trăm (%) hoạt chất được giải phóng sau 1 giờ, 6 giờ, và 12 giờ được xem là các biến phụ thuộc Y1, Y2, và Y3 tương ứng. Dữ liệu công thức này đã được tối ưu trong nghiên cứu của Bodea và Leucuta bằng phương pháp thống kê D-optimal quadratic. Phần này sẽ trình bày kết quả tối ưu dữ liệu này (Phụ lục A) với kỹ thuật tiến hoá và ngoài ra kết quả từ kỹ thuật máy tính sẽ được so sánh với kết quả thống kê của Bodea và Leucuta [5], và kết quả từ chương trình INForm 3.6 (Phụ lục B). 3.4.2. Mô hình hoá dữ liệu Công thức dự đoán từ kỹ thuật GP: Y1=((((((976.35 / 242.53) - (215.21 / x1)) + (x3 - 688.37)) / ((x1 * (x2 * 997.26)) + (210.31 + 127.19))) / (((x1 * 584.85) + (913.62 - (x1 * 876.06))) * ((429.69 / x3) / (x1 * 876.06)))) * ((((566.8 - 604.07) * (945.87 / 242.53)) / (((88.66 + x3) + x3) / (473.73 - 431.87))) + (((x2 * 719.74) - (688.37 - (431.87 / x3))) / ((389.02 * x1) - ((88.66 + x3) + x3))))) (3.1) (R2 = 0.98) Y2=((900.52 + (((x1 * x1) * (861.45 + (x2 / 773.25))) - (((x1 * 315.4) * x2) + 343.42))) / ((((x1 / x3) + (699.75 / 622.59)) * (773.25 + (x1 / (x1 - x3)))) - ((((x2 + Formatted: Normal Formatted: Subscript Formatted: Subscript Deleted: GP Deleted: phụ lục Deleted: phụ lục 53 146.69) + (253.13 - 115.75)) - ((x3 - x2) * (x2 * 974.33))) - (((x1 / x3) - x2) * (x2 * 974.33))))) (3.2) (R2 = 0.98) Y3=((((((x2 + x2) / x1) / (x3 - x1)) + ((859.1 - 76.57) * x3)) + (783.85 + ((687.92 * x2) * (x2 - x3)))) / ((698.57 + (((x3 / 698.57) + (x3 - x1)) + 413.18)) + (x1 * (659.6 - (x1 / (x3 / 50.92)))))) (3.3) (R2 = 0.97) Công thức dự đoán từ nghiên cứu của Bodea và Leucuta [5]: Y1 = -0.015 + 0.145X1 - 0.062X2 + 0.168X3 + 0.594X22 - 0.691X1X2 (3.4) (R2 = 0.96) Y2 = 0.279 - 0.1X1 - 0.08X2 + 0.626X3 + 1.27X22 - 0.841X1X2 (3.5) (R2 = 0.91) Y3 = 0.629 - 0.246X1 - 0.08X2 + 0.653X3 + 1.122X22 - 0.841X1X2 (3.6) (R2 = 0.92) Thông số luyện mạng cho INForm 3.6 Momentum 0.8 Tốc độ học 0.7 Số lượng dữ liệu đầu vào 3 Số lượng dữ liệu đầu ra 1 Số lượng lớp ẩn 1 Số lượng nút trong lớp ẩn 2 Hàm truyền Asymmetric Sigmoid Hàm truyền tại nút xuất Linear Hàm lan truyền ngược QuickProp Y1: R2 = 0.98 (không có mô hình dự đoán rõ ràng với mạng nơron) Y2: R2 = 0.93 (không có mô hình dự đoán rõ ràng với mạng nơron) Y3: R2 = 0.96 (không có mô hình dự đoán rõ ràng với mạng nơron) Formatted: Subscript Formatted: Font color: Black Formatted Table Formatted: Font color: Black Formatted: Font color: Black Formatted: No underline, Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Font color: Black Formatted: Right Formatted: Subscript Formatted: Left Formatted: Font color: Black Formatted: Right Formatted: Font color: Black Formatted: Font color: Black Formatted: Subscript Formatted: Right Formatted: Subscript Formatted: Widow/Orphan control Deleted: Learning Rate Deleted: Target Epoch Deleted: Number of Inputs Deleted: Number of Outputs Deleted: Number of Hidden Layers Deleted: Hidden Layer Deleted: Number of Nodes Deleted: 1 Deleted: 2 Deleted: Output Transfer Type Deleted: BackPropagation Type Deleted: ¶ Deleted: ¶ ... [7] ... [6] 54 Bảng 3.2. So sánh kết quả dự đoán Y1 dùng kỹ thuật tiến hoá với phương pháp thống kê và chương trình INForm 3.6 STT Y1 Y1-GP Y1-TK Y1-IN 1 0.152 0.150 0.145 0.153 2 0.104 0.098 0.105 0.100 3 0.112 0.111 0.108 0.113 4 0.122 0.123 0.138 0.128 5 0.148 0.148 0.143 0.151 6 0.074 0.076 0.066 0.076 7 0.098 0.104 0.092 0.102 8 0.084 0.090 0.088 0.087 9 0.087 0.090 0.088 0.087 10 0.084 0.090 0.088 0.087 11 0.089 0.090 0.088 0.087 12 0.052 0.045 0.055 0.055 13 0.143 0.140 0.140 0.137 Y1-TK = 0.959x + 0.0039 R2 = 0.96 Y1-GP = 0.978x + 0.0027 R2 = 0.98 Y1-IN = 0.976x + 0.0036 R2 = 0.98 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.04 0.06 0.08 0.1 0.12 0.14 0.16 Y1-GP Y1-TK Y1-IN Hình 3.14. Biểu đồ hồi quy so sánh kết quả dự đoán của GP, thống kê và INForm 3.6 cho Y1 Formatted: Subscript Formatted: Hinh Deleted: Deleted: Deleted: ¶ Deleted: ¶ 55 Bảng 3.3. So sánh kết quả dự đoán Y2 dùng kỹ thuật tiến hoá với phương pháp thống kê và chương trình INForm 3.6 STT Y2 Y2-GP Y2-TK Y2-IN 1 0.683 0.669 0.658 0.691 2 0.545 0.541 0.626 0.533 3 0.612 0.639 0.662 0.593 4 0.448 0.446 0.426 0.479 5 0.585 0.607 0.581 0.572 6 0.388 0.382 0.394 0.390 7 0.576 0.572 0.609 0.570 8 0.512 0.515 0.529 0.523 9 0.518 0.515 0.529 0.523 10 0.507 0.515 0.529 0.523 11 0.525 0.515 0.529 0.523 12 0.352 0.376 0.460 0.360 13 0.518 0.527 0.503 0.479 Y2-GP = 0.9786x + 0.015 R2 = 0.98 Y2-TK = 0.8534x + 0.0968 R2 = 0.80 Y2-IN = 0.9363x + 0.0324 R2 = 0.96 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.3 0.4 0.5 0.6 0.7 0.8 Y2-GP Y2-TK Y2-IN Hình 3.15. Biểu đồ hồi quy so sánh kết quả dự đoán của GP, thống kê và INForm 3.6 cho Y2 Formatted: Not Superscript/ Subscript Formatted: Subscript Deleted: ¶ Deleted: Deleted: ¶ Deleted: ¶ 56 Bảng 3.4. So sánh kết quả dự đoán Y3 dùng kỹ thuật tiến hoá với phương pháp thống kê và chương trình INForm 3.6 STT Y3 Y3-GP Y3-TK Y3-IN 1 0.992 0.980 0.976 1.015 2 0.902 0.905 0.925 0.881 3 0.986 1.010 0.998 1.001 4 0.712 0.709 0.689 0.724 5 0.866 0.877 0.880 0.860 6 0.68 0.730 0.675 0.671 7 0.925 0.907 0.923 0.916 8 0.856 0.861 0.838 0.868 9 0.862 0.861 0.838 0.868 10 0.851 0.861 0.838 0.868 11 0.87 0.861 0.838 0.868 12 0.672 0.686 0.754 0.711 13 0.792 0.786 0.784 0.752 Y3-GP = 0.9278x + 0.066 R2 = 0.97 Y3-TK = 0.9187x + 0.068 R2 = 0.92 Y3-IN = 0.9927x + 0.009 R2 = 0.96 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1 1.05 0.6 0.7 0.8 0.9 1 1.1 Y3-GP Y3-TK Y3-IN Hình 3.16. Biểu đồ hồi quy so sánh kết quả dự đoán của GP, thống kê và INForm 3.6 cho Y3 Formatted: Not Superscript/ Subscript Formatted: Subscript Deleted: ¶ Deleted: ¶ Deleted: Deleted: 57 Trong giai đoạn mô hình hóa dữ liệu, chương trình INForm 3.6 không đưa ra được phương trình toán học để thể hiện mối quan hệ giữa các biến phụ thuộc và các biến độc lập. Dựa vào phần mềm ứng dụng kỹ thuật tiến hóa, mặc dù công thức dự đoán cho các biến Y1(công thức 3.1), Y2 (công thức 3.2), Y3 (công thức 3.3) được đưa ra bằng kỹ thuật GP phức tạp hơn công thức được tính toán bằng phương pháp thống kê, tuy nhiên giá trị dự đoán R2 cho các biến Y1, Y2, Y3 của GP cao hơn so với phương pháp thống kê (tương ứng với các công thức 3.4, 3.5 và 3.6), và cũng cao hơn so với kết quả dự đoán từ chương trình INForm 3.6. Ngoài ra khi so sánh các kết quả dự đoán của Bodea và Leucuta bằng phương pháp thống kê, kết quả dự đoán từ chương trình INForm 3.6 và kết quả từ kỹ thuật tiến hoá với dữ liệu thực nghiệm bằng phương pháp hồi quy nhằm đánh giá khả năng dự đoán và mô hình hoá dữ liệu thực nghiệm, kết quả trình bày trong Hình 3.14, 3.15 và 3.16 cho thấy: - Phương trình hồi quy: dựa vào đồ thị và phương trình hồi quy (hệ số góc), kỹ thuật tiến hoá cho kết quả khả quan hơn so với thống kê với các dữ liệu biến Y2. - Giá trị R2 tương quan giữa giá trị thực nghiệm và dự đoán: giá trị R2 cho 3 biến Y1, Y2 và Y3 của kỹ thuật tiến hoá đều cao hơn so với phương pháp thống kê. Với so sánh bằng hồi quy tương quan, rõ ràng kết quả mô hình hoá từ kỹ thuật tiến hoá gần như tốt hơn phương pháp thống kê đã được nghiên cứu bởi Bodea và Leucuta [5], cũng như phần mềm tối ưu hóa INForm V3.6 cho

Các file đính kèm theo tài liệu này:

6.pdf
0.pdf
1.pdf
2.pdf
3.pdf
4.pdf
5.pdf
7.pdf
8.pdf