Quy hoạch lồi là một lớp bài toán cơ bản của tối ưu hóa. Một đặc
điểm cơ bản nhất của lớp bài toán này là mọi điểm cực tiểu địa phương đều
là cực tiểu tuyệt đối. Tính chất quan trọng này cho phép các lý thuyết có
tính địa phương, như giới hạn, vi phân,. có thể áp dụng trực tiếp vào quy
hoạch lồi. Lý thuyết về bài toán quy hoạch lồi đã được quan tâm nghiên
cứu nhiều và đã thu được nhiều kết quả quan trọng dựa trên lý thuyết
của giải tích lồi và tối ưu hóa; về phương diện tính toán, đã có khá nhiều
phương pháp hữu hiệu cho lớp bài toán này. Các phương pháp đó đã được
giới thiệu trong cuốn sách Tối ưu lồi (Convex Optimization) của các tác
giả Stephen Boyd and Lieven Vandenberghe do nhà xuất bản Cambridge
University Press in năm 2004.
Mục đích của bản luận văn này là để trình bày một số phương pháp
cơ bản nhất cho bài toán quy hoạch lồi. Cụ thể luận văn trình bày các
phương pháp sau: các phương pháp sử dụng đạo hàm bậc nhất, phương
pháp Newton và các phương pháp hàm phạt.
Luận văn gồm có 3 chương:
• Chương 1: Giới thiệu các kiến thức cơ bản nhất về giải tích lồi, đặc
biệt chú trọng vào phép chiếu vuông góc lên một tập lồi đóng và tính dưới
vi phân của hàm lồi; chúng được sử dụng trong các chương tiếp theo.
• Chương 2: Trình bày đối ngẫu Lagrange và áp dụng Định lý Krush -Kuhn - Tucker, Định lý Kuhn - Tucker để giải bài toán quy hoạch lồi và
các định lý về sự tồn tại nghiệm tối ưu của bài toán quy hoạch lồi.
• Chương 3: Trình bày các phương pháp giải bài toán quy hoạch lồi như:
phương pháp dùng đạo hàm bậc nhất gradient, chiếu gradient và trường
hợp tổng quát của nó là chiếu dưới gradient xấp xỉ, thuật toán Frank -Wolf, phương pháp Newton dùng đạo hàm bậc hai và các phương pháp
hàm phạt
60 trang |
Chia sẻ: oanh_nt | Lượt xem: 3017 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Một số phương pháp cơ bản nhất cho bài toán quy hoạch lồi, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
iMục lục
Mục lục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
Lời cảm ơn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
Mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Chương 1. Các kiến thức cơ bản về tập lồi và hàm lồi . . . . . . . . . 2
1.1.Tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Chương 2. Điều kiện cực tiểu hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.Bài toán quy hoạch lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.1. Các khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.2. Sự tồn tại nghiệm tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.3. Điều kiện tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.Tối ưu có ràng buộc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1. Đối ngẫu Lagrange. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.2. Điều kiện tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Chương 3.Một số phương pháp giải bài toán quy hoạch lồi . . 27
3.1.Các thuật toán sử dụng đạo hàm bậc nhất . . . . . . . . . . 27
3.1.1. Thuật toán gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.2. Phương pháp chiếu Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.3. Thuật toán chiếu dưới gradient xấp xỉ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.1.4. Thuật toán Frank-Wolfe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.Phương pháp Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.Phương pháp hàm phạt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.1. Phương pháp hàm phạt điểm ngoài. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.2. Phương pháp hàm phạt điểm trong . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Kết luận. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
ii
LỜI CẢM ƠN
Trước khi trình bày nội dung chính của khóa luận, em xin bày tỏ lòng
biết ơn sâu sắc tới GS.TSKH. Lê Dũng Mưu người đã tận tình hướng dẫn
và giúp đỡ em trong suốt quá trình học tập và nghiên cứu để em có thể
hoàn thành khóa luận này.
Em cũng xin bày tỏ lòng biết ơn chân thành tới quý thầy, cô giáo Viện
Toán học - Viện Khoa học và Công nghệ Việt Nam đã giảng dạy và giúp
đỡ em hoàn thành khóa học.
Nhân dịp này em cũng xin chân thành cảm ơn Ban Giám hiệu, các bạn
đồng nghiệp Trường Đại học Công nghệ Thông tin và Truyền thông - Đại
học Thái Nguyên, gia đình và bạn bè đã luôn động viên, giúp đỡ và tạo
điều kiện cho em về mọi mặt trong suốt quá trình học tập và thực hiện
khóa luận tốt nghiệp.
Mặc dù đã có nhiều cố gắng nhưng Luận văn khó tránh khỏi những
thiếu sót. Tác giả rất mong nhận được ý kiến đóng góp của quý thầy, cô
và bạn đọc để luận văn được hoàn thiện hơn.
Xin trân trọng cảm ơn!
Hà Nội, ngày 30 tháng 08 năm 2011
Tác giả
Quách Thị Mai Liên
1MỞ ĐẦU
Quy hoạch lồi là một lớp bài toán cơ bản của tối ưu hóa. Một đặc
điểm cơ bản nhất của lớp bài toán này là mọi điểm cực tiểu địa phương đều
là cực tiểu tuyệt đối. Tính chất quan trọng này cho phép các lý thuyết có
tính địa phương, như giới hạn, vi phân,... có thể áp dụng trực tiếp vào quy
hoạch lồi. Lý thuyết về bài toán quy hoạch lồi đã được quan tâm nghiên
cứu nhiều và đã thu được nhiều kết quả quan trọng dựa trên lý thuyết
của giải tích lồi và tối ưu hóa; về phương diện tính toán, đã có khá nhiều
phương pháp hữu hiệu cho lớp bài toán này. Các phương pháp đó đã được
giới thiệu trong cuốn sách Tối ưu lồi (Convex Optimization) của các tác
giả Stephen Boyd and Lieven Vandenberghe do nhà xuất bản Cambridge
University Press in năm 2004.
Mục đích của bản luận văn này là để trình bày một số phương pháp
cơ bản nhất cho bài toán quy hoạch lồi. Cụ thể luận văn trình bày các
phương pháp sau: các phương pháp sử dụng đạo hàm bậc nhất, phương
pháp Newton và các phương pháp hàm phạt.
Luận văn gồm có 3 chương:
• Chương 1: Giới thiệu các kiến thức cơ bản nhất về giải tích lồi, đặc
biệt chú trọng vào phép chiếu vuông góc lên một tập lồi đóng và tính dưới
vi phân của hàm lồi; chúng được sử dụng trong các chương tiếp theo.
• Chương 2: Trình bày đối ngẫu Lagrange và áp dụng Định lý Krush -
Kuhn - Tucker, Định lý Kuhn - Tucker để giải bài toán quy hoạch lồi và
các định lý về sự tồn tại nghiệm tối ưu của bài toán quy hoạch lồi.
• Chương 3: Trình bày các phương pháp giải bài toán quy hoạch lồi như:
phương pháp dùng đạo hàm bậc nhất gradient, chiếu gradient và trường
hợp tổng quát của nó là chiếu dưới gradient xấp xỉ, thuật toán Frank -
Wolf, phương pháp Newton dùng đạo hàm bậc hai và các phương pháp
hàm phạt.
2Chương 1
Các kiến thức cơ bản về tập lồi và
hàm lồi
Trong luận văn này, ta chỉ xét không gian hữu hạn chiều IRn với tích
vô hướng được ký hiệu là 〈., .〉 và chuẩn tương ứng được ký hiệu là ‖.‖.
Chương này trình bày một số kiến thức cơ bản nhất của giải tích lồi
sẽ được sử dụng ở chương sau. Nội dung của chương được trích dẫn chủ
yếu từ tài liệu tham khảo [1] và [3].
1.1. Tập lồi
Định nghĩa 1.1. Cho hai điểm a, b ∈ IRn.
(i) Một đường thẳng đi qua hai điểm a, b là tập hợp có dạng
{x ∈ IRn : x = αa+ βb, α, β ∈ IR, α + β = 1}.
(ii) Đoạn thẳng nối hai điểm a, b trong IRn có dạng
{x ∈ IRn : x = αa+ βb, α ≥ 0, β ≥ 0, α + β = 1}.
Định nghĩa 1.2. Một tập D được gọi là tập affine nếu D chứa mọi đường
thẳng đi qua hai điểm bất kỳ x, y ∈ D, tức là
∀x, y ∈ D, ∀λ ∈ IR⇒ λx+ (1− λ)y ∈ D.
Mệnh đề 1.1. Tập D 6= ∅ là tập affine khi và chỉ khi nó có dạng D =
M + a với M là một không gian con của IRn và a ∈ IRn. Không gian M
được xác định duy nhất và được gọi là không gian con song song của D.
3Định nghĩa 1.3. Thứ nguyên (hay chiều) của một tập affine D là thứ
nguyên của không gian con song song với D và được ký hiệu là dimD.
Định nghĩa 1.4. Siêu phẳng trong không gian IRn là một tập hợp các
điểm có dạng
{x ∈ IRn : aTx = α},
trong đó a ∈ IRn là một vectơ khác 0 và α ∈ IR.
Định nghĩa 1.5. Cho a ∈ IRn là một vectơ khác 0 và α ∈ IR. Tập
{x : aTx ≥ α},
được gọi là nửa không gian đóng và tập
{x : aTx > α}
gọi là nửa không gian mở.
Định nghĩa 1.6. Một tập D được gọi là một tập lồi nếu
∀a, b ∈ D và 0 ≤ λ ≤ 1⇒ λa+ (1− λ)b ∈ D.
Định lí 1.1. Tập lồi là đóng với phép giao, phép cộng, phép nhân với một
số thực. Tức là, nếu C và D là hai tập lồi trong IRn thì C ∩D, λC + βD
cũng là các tập lồi.
Định nghĩa 1.7. Ta nói x là tổ hợp lồi của các điểm (vectơ) x1, ..., xk nếu
x =
k∑
j=1
λjxj, λj ≥ 0 (j = 1, ..., k),
k∑
j=1
λj = 1.
Mệnh đề 1.2. Tập hợp D là lồi khi và chỉ khi nó chứa mọi tổ hợp lồi của
các điểm của nó. Tức là, D lồi khi và chỉ khi
∀k ∈ IN, ∀λ1, ..., λk ≥ 0 :
k∑
j=1
λj = 1,∀x1, ..., xk ∈ D ⇒
k∑
j=1
λjxj ∈ D.
Định nghĩa 1.8. Một tập được gọi là tập lồi đa diện nếu nó là giao của
một số hữu hạn các nửa không gian đóng.
4Định nghĩa 1.9. Bao lồi của một tập D là giao của tất cả các tập lồi
chứa D. Bao lồi của tập D được ký hiệu là coD.
Bao lồi của một tập D là tập lồi nhỏ nhất chứa D.
Định nghĩa 1.10. Thứ nguyên của một tập lồi D được cho bởi thứ nguyên
của đa tạp affine nhỏ nhất chứa D. Đa tạp affine này được gọi là bao affine
của D và được ký hiệu là aff D. Thứ nguyên của tập lồi D sẽ được ký hiệu
là dimD.
Định nghĩa 1.11. Một điểm a của một tập lồi D gọi là điểm trong tương
đối nếu với mọi x ∈ D đều có một số λ > 0 để cho a+λ(x−a) ∈ D. Tập
các điểm trong tương đối của D được ký hiệu riD.
Định nghĩa 1.12. Một tập D được gọi là nón nếu
∀λ > 0,∀x ∈ D ⇒ λx ∈ D.
Một nón được gọi là nón nhọn nếu nó không chứa đường thẳng. Một nón
được gọi là nón lồi nếu nó đồng thời là tập lồi. Nếu nón lồi này lại là một
tập lồi đa diện thì ta nói nó là nón lồi đa diện.
Định nghĩa 1.13. Cho D ⊆ IRn là một tập lồi và x0 ∈ D.
(i) Tập
ND(x
0) := {ω ∈ IRn : 〈ω, x− x0〉 ≤ 0, ∀x ∈ D}.
gọi là nón pháp tuyến ngoài của D tại x0 và tập −ND(x0) được gọi
là nón pháp tuyến trong của D tại x0.
(ii) Tập
N D(x
0) := {ω ∈ IRn : 〈ω, x− x0〉 ≤ , ∀x ∈ D}
được gọi là nón pháp tuyến của D tại x0.
Hiển nhiên 0 ∈ ND(x0) và dùng định nghĩa ta có ND(x0) là một nón lồi
đóng.
Trong chương 2 và chương 3, ta sẽ sử dụng các định lý tách tập lồi, đây
cũng là những định lý cơ bản nhất của giải tích lồi.
5Định nghĩa 1.14. Cho hai tập C và D, ta nói rằng siêu phẳng
H := {x : 〈v, x〉 = λ}
(i) tách hai tập C và D nếu
〈v, a〉 ≤ λ ≤ 〈v, b〉, ∀a ∈ C, b ∈ D.
(ii) tách chặt C và D nếu:
〈v, a〉 < λ < 〈v, b〉, ∀a ∈ C, b ∈ D.
(iii) tách mạnh C và D nếu:
sup
x∈A
〈v, x〉 < λ < inf
y∈B
〈v, y〉.
Định lí 1.2 (Định lý tách 1). Cho C và D là hai tập lồi khác rỗng trong
IRn sao cho C ∩D = ∅. Khi đó có một siêu phẳng tách C và D.
Định lí 1.3 (Định lý tách 2). Cho C và D là hai tập lồi khác rỗng trong
IRn sao cho C ∩D = ∅. Giả sử có ít nhất một tập là compăc. Khi đó hai
tập C và D có thể tách mạnh được bởi một siêu phẳng.
Hệ quả 1.1 (Bổ đề Farkas). Cho a ∈ IRn và A là ma trận cấp m× n.
Khi đó 〈a, x〉 ≥ 0 với mọi x thỏa mãn Ax ≥ 0, khi và chỉ khi tồn tại y ≥ 0
thuộc IRm sao cho a = ATy.
Ý nghĩa hình học của bổ đề Farkas: siêu phẳng đi qua gốc tọa độ
〈a, x〉 = 0 để nón Ax ≥ 0 về một phía của nó khi và chỉ khi vectơ pháp
tuyến a của siêu phẳng nằm trong nón sinh bởi các hàng của ma trận A.
Định nghĩa 1.15. Cho D 6= ∅ (không nhất thiết lồi) và y là một vectơ bất
kỳ, đặt:
dD(y) := inf
x∈D
‖x− y‖.
Ta nói dD(y) là khoảng cách từ y đến D. Nếu tồn tại pi ∈ D sao cho
dD(y) = ‖y − pi‖, thì ta nói pi là hình chiếu (vuông góc) của y trên D và
ký hiệu là pi = PD(y).
6Theo định nghĩa, ta thấy rằng hình chiếu PD(y) của y trên D là
nghiệm của bài toán tối ưu
min
x∈D
{
1
2
‖x− y‖2 : x ∈ D
}
.
Nói cách khác việc tìm hình chiếu của y trên D có thể đưa về việc tìm cực
tiểu của hàm toàn phương ||x − y||2 trên D. Nếu D 6= ∅ thì dD(y) hữu
hạn, vì
0 ≤ dD(y) ≤ ‖x− y‖, ∀x ∈ D.
Mệnh đề 1.3. Cho D là một tập lồi đóng khác rỗng. Khi đó
(i) Với mọi y ∈ IRn, pi ∈ D hai tính chất sau là tương đương:
a) pi = PD(y),
b) y − pi ∈ ND(pi).
(ii) Với mọi y ∈ IRn, hình chiếu PD(y) của y trên D luôn tồn tại và duy
nhất.
(iii) ‖PD(x)− PD(y)‖ ≤ ‖x− y‖, ∀x, y ∈ IRn (tính không giãn),
(iv) ‖PD(x)−PD(y)‖2 ≤ 〈PD(x)−PD(y), x−y〉, ∀x, y ∈ IRn (tính đồng bức).
1.2. Hàm lồi
Trong phần này ta chỉ xét những hàm f không nhận giá trị −∞.
Định nghĩa 1.16. Một hàm số f xác định trên tập lồi D được gọi là
(i) lồi trên D nếu
f(λx+ (1− λ)y) ≤ λf(x) + (1− λ)f(y),∀x, y ∈ D, 0 < λ < 1.
(ii) lồi chặt nếu
f(λx+ (1− λ)y) < λf(x) + (1− λ)f(y),∀x, y ∈ D, 0 < λ < 1.
(iii) lõm (lõm chặt) nếu −f là lồi (lồi chặt).
7Định lí 1.4. Cho f và g là các hàm lồi trên tập lồi C và D tương ứng.
Khi đó các hàm số αf+βg, (∀α, β ≥ 0) và max{f, g} cũng lồi trên C∩D.
Một hàm lồi có thể không liên tục tại một điểm trên biên miền xác
định của nó. Tuy nhiên, nó liên tục tại mọi điểm trong của tập đó theo
định lý sau:
Định lí 1.5. Một hàm lồi xác định trên tập lồi D thì liên tục tại mọi điểm
trong của D.
Tính chất sau đây đặc trưng cho một hàm lồi khả vi, và thuận lợi để
kiểm tra tính lồi của một hàm số. Ký hiệu f ′(a) hoặc ∇f(a) là đạo hàm
của f tại a.
Định lí 1.6. Cho f : D → IR là một hàm khả vi trên tập lồi mở D. Điều
kiện cần và đủ để f lồi trên D là
f(x) + 〈∇f(x), y − x〉 ≤ f(y), ∀x, y ∈ D.
Nếu f khả vi hai lần thì điều kiện cần và đủ để f lồi trên D là với mọi
x ∈ A ma trận Hessian H(x) của f tại x xác định không âm, tức là
yTH(x)y ≥ 0,∀x ∈ D, y ∈ IRn.
Như vậy, một dạng toàn phương xTQx là một hàm lồi khi và chỉ khi Q
xác định không âm. Một dạng toàn phương là một hàm lồi chặt khi và chỉ
khi ma trận của nó xác định dương.
Tính khả vi của một hàm lồi giữ vai trò quan trọng trong các phương
pháp tối ưu hóa. Lớp các hàm lồi có những tính chất khả vi rất đẹp mà
các lớp hàm khác không có. Giả sử f : IRn → IR ∪ {+∞} là hàm lồi. Ta
có các khái niệm sau
Định nghĩa 1.17. Cho > 0. Một véc tơ w ∈ IRn được gọi là một −
dưới gradient của f tại x0 ∈ IRn nếu:
〈w, x− x0〉 ≤ f(x)− f(x0) + , ∀x ∈ IRn.
8Tập hợp tất cả các −dưới gradient gọi là − dưới vi phân của hàm f tại
x0, kí hiệu là
∂f(x
0) := {w ∈ IRn : 〈w, x− x0〉 ≤ f(x)− f(x0) + , ∀x ∈ IRn}.
Định nghĩa 1.18. Véctơ w ∈ IRn được gọi là dưới gradient của f tại
x0 ∈ IRn nếu:
〈w, x− x0〉 ≤ f(x)− f(x0), ∀x ∈ IRn.
Tập hợp tất cả các dưới gradient của hàm f tại x0 được gọi là dưới vi phân
của f tại x0, kí hiệu là:
∂f(x0) := {w ∈ IRn : 〈w, x− x0〉 ≤ f(x)− f(x0), ∀x ∈ IRn}.
Hàm f được gọi là khả dưới vi phân tại x0 nếu ∂f(x0) 6= ∅.
Ví dụ 1.1. Cho D là một tập lồi, khác rỗng của không gian IRn. Xét hàm
chỉ trên tập D
δD(x) :=
{
0 nếu x ∈ D,
+∞ nếu x /∈ D.
Với mọi x0 ∈ D ta có:
w ∈ ∂δD(x0)⇔ δD(x)− δD(x0) ≥ 〈w, x− x0〉,∀x ∈ D
⇔ 0 ≥ 〈w, x− x0〉,∀x ∈ D ⇔ w ∈ ND(x0).
Chứng tỏ
∂δD(x
0) = ND(x
0),∀x0 ∈ D.
Cũng có trường hợp tồn tại những điểm x∗ tại đó f không có dưới vi
phân, nghĩa là tập ∂f(x∗) có thể là một tập rỗng. Tuy nhiên, đối với hàm
lồi, ta có định lý sau:
Định lí 1.7. Cho f là một hàm lồi (hữu hạn) trên tập lồi D. Lúc đó f có
dưới vi phân tại mọi điểm thuộc riD.
Từ định lý này suy ra rằng nếu f là một hàm lồi trên toàn không gian
IRn thì nó có dưới vi phân tại mọi điểm, vì riIRn = IRn.
9Định nghĩa 1.19. Ta gọi đạo hàm theo hướng d của một hàm số f (không
nhất thiết là lồi) tại điểm x là đại lượng
f ′(x, d) := lim
λ→0+
f(x+ λd)− f(x)
λ
nếu giới hạn này tồn tại.
Định lí 1.8. Nếu f là một hàm lồi trên tập lồi D thì với mọi x ∈ D và
mọi d sao cho x+ d ∈ D, đạo hàm theo hướng d của f tại x luôn tồn tại
và nghiệm đúng
f ′(x, d) ≤ f(x+ d)− f(x).
Ngoài ra với mỗi điểm x cố định, f ′(x, .) là một hàm lồi trên tập lồi
{d : x+ d ∈ D}.
Từ định lý này dễ dàng suy ra rằng nếu f khả vi thì
f ′(x, d) = 〈∇f(x), d〉,∀d. (1.1)
Nói chung một hàm lồi không nhất thiết khả vi tại mọi điểm. Dưới vi
phân là một khái niệm mở rộng của đạo hàm trong trường hợp hàm không
khả vi. Trong trường hợp ∂f(x∗) chỉ gồm duy nhất một điểm thì f khả vi
tại x∗. Trong phần tiếp theo, ta sẽ định nghĩa về - nghiệm và - chiếu
của một hàm lồi.
Định nghĩa 1.20. Cho D ⊆ IRn là tập lồi, f : D → IR là hàm lồi và
≥ 0. Xét bài toán:
min
x∈D
f(x). (P )
Một điểm x¯ ∈ D được gọi là - nghiệm của bài toán (P ) nếu:
f(x¯) ≤ min
x∈D
f(x) + .
Mệnh đề 1.4. Vectơ x¯ ∈ D là - nghiệm của bài toán (P ) khi và chỉ khi
0 ∈ ∂f(x¯).
10
Chứng minh. Giả sử x¯ ∈ D là - nghiệm của bài toán (P ). Khi đó
f(x¯) ≤ f(x) + , ∀x ∈ D.
Suy ra
〈0, x− x¯〉 ≤ f(x)− f(x¯) + , ∀x ∈ D ⇔ 0 ∈ ∂ (f(x¯)) .
Ngược lại, nếu 0 ∈ ∂ (f(x¯)) thì ta có:
〈0, x− x¯〉 ≤ f(x)− f(x¯) + , ∀x ∈ D.
Chứng tỏ x¯ là − nghiệm của bài toán (P ).
Định nghĩa 1.21. Cho D là một tập lồi đóng khác rỗng trong IRn, x ∈ IRn
và ≥ 0 . Một điểm px ∈ D được gọi là - chiếu của x trên D nếu px là
một - nghiệm của bài toán
min
y∈D
{
1
2
‖x− y‖2
}
(Q)
nghĩa là:
1
2
‖x− px‖2 ≤ 1
2
‖x− PD(x)‖2 + ,
trong đó PD(x) là hình chiếu của x trên D.
Mệnh đề 1.5. Cho D là tập lồi đóng khác rỗng. Khi đó px là - chiếu
của x trên D khi và chỉ khi
〈x− px, px − y〉 ≥ −, ∀y ∈ D. (1.2)
Chứng minh. Giả sử px là − chiếu của x trên D. Ta có
min
y∈D
1
2
‖x− y‖2 ⇔ min
{
1
2
‖x− y‖2 + δD(y)
}
(1.3)
trong đó δD(y) là hàm chỉ của y trên tập D. Đặt
f(y) :=
1
2
‖x− y‖2, x ∈ IRn.
11
Theo Định nghĩa 1.21, px là − nghiệm của bài toán (1.3). Từ Mệnh đề
1.4 ta được
0 ∈ ∂[f(px) + δD(px)] = ∂f(px) + ∂δD(px). (1.4)
Theo Ví dụ 1.1, ∂δD(px) = N
D(px) nên từ (1.4) ta có:
0 ∈ {−x+ px}+N D(px).
Suy ra
(x− px) ∈ N D(px)⇔ 〈x− px, ω − px〉 ≤ , ∀ω ∈ D.
Ngược lại, giả sử có (1.2). Ta có
‖x− PD(x)‖2 = ‖x− px‖2 + 2〈x− px, px − PD(x)〉+ ‖px − PD(x)‖2
≥ ‖x− px‖2 + 2〈x− px, px − PD(x)〉.
Suy ra
‖x− PD(x)‖2 ≥ ‖x− px‖2 − 2.
Chứng tỏ px là − chiếu của x trên D.
12
Chương 2
Điều kiện cực tiểu hàm lồi
Chương này trình bày một số kiến thức quan trọng phục vụ cho
chương 3. Đó là đối ngẫu Lagrange và áp dụng vào giải bài toán tối ưu lồi;
các định lý cơ bản như Định lý Karush - Kuhn - Tucker, Định lý Kuhn -
Tucker. Nội dung của chương chủ yếu được trích dẫn từ tài liệu tham khảo
[1].
2.1. Bài toán quy hoạch lồi
2.1.1. Các khái niệm
Cho D ⊆ IRn và f : IRn → IR. Xét bài toán quy hoạch toán học
min{f(x) : x ∈ D}. (P )
Bài toán này được hiểu là hãy tìm một điểm x∗ ∈ D sao cho f(x∗) ≤ f(x)
với mọi x ∈ D. Mỗi điểm x∗ ∈ D được gọi là một phương án chấp nhận
được của bài toán (P ). Tập D được gọi là miền (tập) chấp nhận được, f
được gọi là hàm mục tiêu của bài toán (P ). Thông thường, tập D được
cho như là tập nghiệm của một hệ bất đẳng thức hoặc đẳng thức có dạng
D := {x ∈ X : gj(x) ≤ 0, hi(x) = 0, j = 1, ...,m, i = 1, ..., p}, (2.1)
trong đó ∅ 6= X ⊆ IRn và gj, hi : IRn → IR (j = 1, ...m, i = 1, ...p). Bài
toán (P ) với D cho bởi (2.1) gọi là trơn nếu cả hàm mục tiêu và các ràng
buộc đều trơn (khả vi).
13
Bài toán (P ) có rất nhiều ứng dụng trong các lĩnh vực khác nhau. Ví
dụ, trong kinh tế nó là bài toán xác định phương án sản xuất sao cho chi
phí thấp nhất. Trong ví dụ này, x là phương án sản xuất mà mỗi tọa độ
xj của nó là số lượng sản phẩm loại j cần sản xuất, còn f(x) là chi phí
ứng với phương án x. Bài toán (P ) trong mô hình này có nghĩa là tìm một
phương án sản xuất trong tập hợp các phương án chấp nhận được D sao
cho chi phí sản xuất ứng với phương án này là thấp nhất.
Định nghĩa 2.1. Điểm x∗ ∈ D được gọi là lời giải tối ưu địa phương của
bài toán (P) nếu tồn tại một lân cận U của x∗ sao cho
f(x∗) ≤ f(x), ∀x ∈ U ∩D.
và x∗ gọi là lời giải tối ưu toàn cục của (P) nếu
f(x∗) ≤ f(x), ∀x ∈ D.
2.1.2. Sự tồn tại nghiệm tối ưu
Xét bài toán tối ưu toàn cục (P ). Có 4 trường hợp tồn tại nghiệm tối
ưu của bài toán này
• D = ∅ (Không có nghiệm).
• f không bị chặn dưới trên D( inf
x∈D
f(x) = −∞).
• inf
x∈D
f(x) <∞ nhưng giá trị cực tiểu không đạt được trên D.
• tồn tại x∗ ∈ D sao cho f(x∗) = min
x∈D
f(x).
Câu hỏi đặt ra: Làm thế nào để kiểm tra được bài toán (P ) có nghiệm
hay không? Câu trả lời là, nói chung điều này là không dễ dàng.
Định lí 2.1. Điều kiện cần và đủ để tồn tại nghiệm tối ưu toàn cục của
bài toán (P ) là
F+(D) := {t ∈ IR : f(x) ≤ t, x ∈ D},
đóng và bị chặn dưới.
14
Chứng minh. Nếu x∗ là nghiệm tối ưu thì F+(D) = [f(x∗),+∞] đóng (là
phần bù của một tập mở) và bị chặn dưới.
Ngược lại, giả sử F+(D) bị chặn dưới. Đặt t∗ = inf F+(D) thì t > −∞.
Do F+(D) đóng, t∗ ∈ F+D nên tồn tại x∗ ∈ D sao cho f(x∗) = t∗. Chứng
tỏ x∗ là một điểm cực tiểu của f trên D.
Định lí 2.2 (Weierstrass). Nếu D là tập compact và f nửa liên tục dưới
trên D, thì bài toán (P ) có nghiệm tối ưu.
Chứng minh. Đặt α := infx∈D f(x). Theo định nghĩa có một dãy {xk} ⊂
D sao cho limk→+∞ f(xk) = α. Do D compact nên có một dãy con hội tụ
về x0 ∈ D, không giảm tính tổng quát có thể coi xk → x0. Vì f nửa liên
tục dưới nên α > −∞. Nhưng x0 ∈ D nên theo định nghĩa của α, ta phải
có f(x0) ≥ α. Vậy f(x0) = α.
Định lí 2.3. Nếu f nửa liên tục dưới trên D và thỏa mãn điều kiện bức
sau
f(x)→ +∞ khi x ∈ D, ‖x‖ → +∞
thì f có điểm cực tiểu trên D.
Chứng minh. Đặt D(a) := {x ∈ D : f(x) ≤ f(a)} với a ∈ D. Rõ ràng,
D(a) đóng và bị