Trong các lĩnh vực mang tính xác suất ngẫu nhiên thì thời điểm dừng tối
ưu mang ý nghĩa rất quan trọng. Những người chơi trò chơi Poker thường nói
"thắng thua là việc hoàn toàn bình thường, không có gì lạ lẫm cả. Nếu bạn
không kiểm soát những rủi ro, bạn sẽ bị những rủi ro kiểm soát". Biết rằng rủi
ro là không thể kiểm soát, cũng không thể dự liệu trước, chi bằng ta hãy cố
gắng tránh nó, chứ không phải là kiểm soát nó. Việc xác lập được thời điểm
dừng tối ưu là việc làm cần thiết để chúng ta tránh được những thất bại nặng
nề bởi tình trạng mất kiểm soát khi ưu thế không nằm ở phía mình. Đặc biệt,
trong các "trò chơi kinh tế" như chứng khoán, cũng như trong điều hành kinh
tế thời điểm dừng tối ưu phải được tính toán cân nhắc thận trọng và ngay cả
khi đó cũng nên tiếp tục thực hiện các biện pháp dài hạn để thu về lợi nhuận
cao nhất, bền vững và lâu dài.
Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình
hóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suy
nghĩ đã trở thành hiện thực. Nathanial Rochester sau nhiều năm làm việc tại
các phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để mô
phỏng một mạng nơ-ron. Trong thời kì này tính toán truyền thống đã đạt được
những thành công rực rỡ trong khi đó những nghiên cứu về nơ-ron còn ở giai
đoạn sơ khai. Mặc dù vậy những người ủng hộ triết lý “thinking machines” (các
máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của mình. Năm 1956 dự
án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence) đã mở ra
thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng nơ-ron. Tác
động tích cực của nó là thúc đẩy hơn nữa sự quan tâm của các nhà khoa học về
trí tuệ nhân tạo và quá trình xử lý ở mức đơn giản của mạng nơ-ron trong bộ
não con người.
33 trang |
Chia sẻ: Trịnh Thiết | Ngày: 06/04/2024 | Lượt xem: 348 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Một số dạng phương trình vi phân ngẫu nhiên trong bài toán thời điểm dừng tối ưu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Thành Trung
MỘT SỐ DẠNG PHƯƠNG TRÌNH VI PHÂN NGẪU NHIÊN
TRONG BÀI TOÁN THỜI ĐIỂM DỪNG TỐI ƯU
Chuyên ngành: Lý thuyết xác suất và thống kê Toán học
Mã số: 62 46 01 06
(DỰ THẢO) TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC
Hà Nội – 2019
Công trình được hoàn thành tại: Trường Đại học Khoa học Tự nhiên - ĐHQGHN
Người hướng dẫn khoa học: PGS. TS Phan Viết Thư
Phản biện: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Phản biện: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Phản biện: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến
sĩ họp tại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vào hồi giờ ngày tháng năm 2019
Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia Việt Nam
- Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội
iMỤC LỤC
MỤC LỤC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
MỞ ĐẦU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ 4
1.1 Tích phân ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Phương trình vi phân ngẫu nhiên . . . . . . . . . . . . . . . . 5
1.3 Bài toán thời điểm dừng tối ưu . . . . . . . . . . . . . . . . . 6
1.3.1 Khái niệm thời điểm dừng . . . . . . . . . . . . . . . . . . . 6
1.3.2 Bài toán thời điểm dừng tối ưu . . . . . . . . . . . . . . . . 8
1.4 Mạng nơ-ron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.1 Tổng quan về mạng nơ-ron . . . . . . . . . . . . . . . . 11
1.4.2 Huấn luyện mạng nơ-ron . . . . . . . . . . . . . . . . . 12
1.4.3 Phương pháp xây dựng mạng nơ-ron MLP . . . . . 12
1.5 Kết luận chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 12
CHƯƠNG 2. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN
QUẢNG CÁO 14
2.1 Mô hình bài toán quảng cáo . . . . . . . . . . . . . . . . . . . 14
2.2 Giải phương trình vi phân ngẫu nhiên . . . . . . . . . . . . . 15
2.3 Xấp xỉ thời điểm dừng tối ưu bằng mạng nơ-ron . . . . . . 17
2.4 Giải thuật giải bài toán thời điểm dừng tối ưu . . . . . . . 17
2.5 Kết quả mô phỏng . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.6 Kết luận chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 19
ii
CHƯƠNG 3. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN
BÁN TÀI SẢN 21
3.1 Bài toán bán tài sản tối ưu và lời giải . . . . . . . . . . . . . 21
3.2 Xấp xỉ thời điểm dừng tối ưu bằng mạng nơ-ron . . . . . . 23
3.3 Kết quả mô phỏng . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4 Kết luận chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . 25
KẾT LUẬN 27
CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ 28
1MỞ ĐẦU
Trong các lĩnh vực mang tính xác suất ngẫu nhiên thì thời điểm dừng tối
ưu mang ý nghĩa rất quan trọng. Những người chơi trò chơi Poker thường nói
"thắng thua là việc hoàn toàn bình thường, không có gì lạ lẫm cả. Nếu bạn
không kiểm soát những rủi ro, bạn sẽ bị những rủi ro kiểm soát". Biết rằng rủi
ro là không thể kiểm soát, cũng không thể dự liệu trước, chi bằng ta hãy cố
gắng tránh nó, chứ không phải là kiểm soát nó. Việc xác lập được thời điểm
dừng tối ưu là việc làm cần thiết để chúng ta tránh được những thất bại nặng
nề bởi tình trạng mất kiểm soát khi ưu thế không nằm ở phía mình. Đặc biệt,
trong các "trò chơi kinh tế" như chứng khoán, cũng như trong điều hành kinh
tế thời điểm dừng tối ưu phải được tính toán cân nhắc thận trọng và ngay cả
khi đó cũng nên tiếp tục thực hiện các biện pháp dài hạn để thu về lợi nhuận
cao nhất, bền vững và lâu dài.
Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình
hóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suy
nghĩ đã trở thành hiện thực. Nathanial Rochester sau nhiều năm làm việc tại
các phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để mô
phỏng một mạng nơ-ron. Trong thời kì này tính toán truyền thống đã đạt được
những thành công rực rỡ trong khi đó những nghiên cứu về nơ-ron còn ở giai
đoạn sơ khai. Mặc dù vậy những người ủng hộ triết lý “thinking machines” (các
máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của mình. Năm 1956 dự
án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence) đã mở ra
thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng nơ-ron. Tác
động tích cực của nó là thúc đẩy hơn nữa sự quan tâm của các nhà khoa học về
trí tuệ nhân tạo và quá trình xử lý ở mức đơn giản của mạng nơ-ron trong bộ
não con người.
2Bài toán thời điểm dừng tối ưu đã được nhiều tác giả xem xét chủ yếu trong
lĩnh vực tài chính và được giải thông qua việc giải các phương trình vi phân đạo
hàm riêng. Trong luận án này chúng tôi xem xét một cách tiếp cận khác cho bài
toán thời điểm dừng tối ưu đó là tiếp cận học máy. Mỗi một quyết định dừng
hay tiếp tục tại thời điểm t được biểu diễn bởi một hàm (gọi là hàm quyết định)
nhận giá trị trong tập {0, 1}, trong đó giá trị 0 là tiếp tục chiến dịch, giá trị 1 là
dừng lại. Chúng tôi tiếp tục xấp xỉ hàm quyết định bởi một mạng nơ-ron nhiều
lớp. Sau khi đã huấn luyện mạng nơ-ron, cho dữ liệu qua mạng ta sẽ nhận được
quyết định dừng hay tiếp tục.
Bố cục của luận án:
Ngoài phần mở đầu và phần kết luận, kiến nghị, Luận án được chia thành 3
chương với bố cục như sau:
Chương 1. KIẾN THỨC CHUẨN BỊ.
Chương này chúng tôi trình bày một cách tóm lược nhất một số kiến thức cơ
bản nhất của giải tích ngẫu nhiên bao gồm tích phân ngẫu nhiên, phương trình
vi phân ngẫu nhiên, bài toán thời điểm dừng tối ưu. Nội dung ở chương này chủ
yếu được trích dẫn từ các tài liệu [0], [0], [0], [0], [0].
Trong chương này cũng giới thiệu các vấn đề cơ bản về mạng nơ-ron, gồm các
khái niệm của mạng nơ-ron nhân tạo, lịch sử phát triển, các mô hình mạng và
phương pháp xây dựng cũng như huấn luyện mạng. Trong đó đi sâu vào việc
xây dựng một mạng nơ-ron truyền thẳng MLP và thuật toán huấn luyện lan
truyền ngược.
Chương 2. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN QUẢNG CÁO.
Trong chương này chúng tôi xem xét một bài toán thực tế đó là xác định thời
điểm dừng tối ưu cho một chiến dịch quảng cáo. Thị phần (tiềm năng) của công
ty đang xét về một sản phẩm A nào đó được mô tả bằng một phương trình
vi phân ngẫu nhiên dưới tác động của chiến dịch quảng cáo thông qua truyền
thông cũng như sự truyền miệng của các khách hàng đã có của công ty. Hàm
mục tiêu là một hàm liên tục xác định trên thời gian t và thị phần đạt được của
3chiến dịch quảng cáo. Trong chương này ngoài việc giải mô hình chúng tôi xem
xét một cách tiếp cận khác cho bài toán thời điểm dừng tối ưu đó là tiếp cận
học máy.
Chương 3. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN BÁN TÀI SẢN.
Trong chương này chúng tôi xem xét bài toán bài toán tìm thời điểm dừng tối
ưu cho quá trình bán tài sản với tốc độ tăng giá là quá trình Markov rời rạc
hai trạng thái (tăng giá và giảm giá). Kết quả tìm được các ngưỡng cố định cho
quá trình xác suất hậu nghiệm. Nếu quá trình xác suất hậu nghiệm vượt qua
ngưỡng này thì ta quyết định bán tài sản. Các kết quả thu được là khả quan và
được kiểm tra trên dữ liệu mô phỏng cho thấy tính đúng đắn của các kết quả
tìm được. Cũng như trong chương 2, chương này chúng tôi cũng xem xét một
cách tiếp cận khác cho bài toán thời điểm dừng tối ưu đó là tiếp cận học máy.
Xấp xỉ hàm quyết định bởi một mạng nơ-ron nhiều lớp, sau khi đã huấn luyện
mạng nơ-ron, cho dữ liệu qua mạng ta sẽ nhận được quyết định bán tài sản.
4CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
Chương này chúng tôi sẽ trình bày một cách tóm lược nhất một số kiến thức
cơ bản nhất của giải tích ngẫu nhiên bao gồm tích phân ngẫu nhiên, phương
trình vi phân ngẫu nhiên, bài toán thời điểm dừng tối ưu. Nội dung ở chương
này chủ yếu được trích dẫn từ các tài liệu [0], [0], [0], [0], [0].
1.1. Tích phân ngẫu nhiên
1.1.1. Tích phân ngẫu nhiên Itô
1.1.2. Công thức Itô
Định lý 1.1 (Công thức Itô) Cho u(t, x) là một hàm xác định trên [0, T ]×R
có các đạo hàm riêng ut, ux, uxx liên tục. Cho Xt là một quá trình Itô với vi phân
ngẫu nhiên
dXt = f(t, ω)dt+ g(t, ω)dWt
Khi đó quá trình Yt = u (t,Xt) cũng là một quá trình Itô với vi phân ngẫu nhiên
là
dYt = du (t,Xt) =
(
ut (t,Xt) + ux (t,Xt) f(t) +
1
2
uxx (t,Xt) g
2(t)
)
dt
+ux (t,Xt) g(t)dWt
Ta cũng có thể viết công thức Itô dưới dạng dễ nhớ hơn như sau
dYt = ut (t,Xt) dt+ ux (t,Xt) dXt +
1
2
uxx (t,Xt) (dXt)
2
trong đó khi tính (dXt)
2 ta quy ước
(dt)2 = dtdWt = 0, (dWt)
2 = dt
5Ta có công thức Itô suy rộng sau đây
Định lý 1.2 (Công thức Itô mở rộng) Quá trình Yt = u (t,X1(t), X2(t), . . . , Xn(t))
là một quá trình Itô với vi phân ngẫu nhiên cho bởi
dYt = utdt+
n∑
i=1
uxidXi +
1
2
n∑
i=1
n∑
i=1
uxixjdXidXj
trong đó tích dXidXj được tính theo quy ước sau
(dt)2 = dWdt = dtdW = 0, (dWt)
2 = dt
Như vậy dXidXj = gigjdt và
dYt =
(
ut +
n∑
i=1
uxifi +
1
2
n∑
i=1
n∑
i=1
uxixjgigj
)
dt+
(
n∑
i=1
uxigi
)
dWt.
1.2. Phương trình vi phân ngẫu nhiên
Phương trình vi phân ngẫu nhiên đóng vai trò rất quan trọng trong kĩ thuật,
vật lý, kinh tế và một số ngành khoa học khác. Sự ra đời của nó xuất phát từ
nhu cầu xác định mối quan hệ giữa một bên là một đại lượng biến thiên liên tục
với một bên là độ biến thiên của đại lượng đó. Các mối quan hệ như thế xuất
hiện thường xuyên trong các ứng dụng thực tế.
Định lý 1.3 Giả sử các hàm b (t, x) và σ (t, x) thỏa mãn các điều kiện sau
|b(t, x)|+ |σ(t, x)| ≤ C(1 + |x|), x ∈ R, t ∈ [0, T ]
với C là hằng số và
|b(t, x)− b(t, y)|+ |σ(t, x)− σ(t, y)| ≤ D|x− y|
với D là hằng số. Gọi Z là đại lượng ngẫu nhiên độc lập vớiWt, t > 0 và EZ2 <∞.
6Khi đó phương trình vi phân ngẫu nhiên
dXt = b (t,Xt) dt+ σ (t,Xt) dWt; X0 = c (1.1)
có nghiệm duy nhất.
1.3. Bài toán thời điểm dừng tối ưu
1.3.1. Khái niệm thời điểm dừng
Lý thuyết Martingale bắt nguồn từ trò chơi cờ bạc nay trở thành một loại
quá trình ngẫu nhiên có rất nhiều ứng dụng về lý thuyết cũng như thực tiễn,
đặc biệt là một công cụ không thể thiếu trong tính toán ngẫu nhiên và toán
học trong tài chính. Một công cụ quan trọng trong lý thuyết Martingale và các
ứng dụng của chúng là các thời điểm dừng. Thí dụ, chúng ta muốn dừng một
Martingale trước khi nó nhận các giá trị quá lớn. Tuy nhiên, dừng nên được
thực hiện sao cho đối tượng dừng lại là một Martingale mới thực sự có ý nghĩa
quan trọng.
Cho không gian xác suất đầy đủ (Ω,F , P ), tức là F chứa tất cả các tập có
xác suất 0. (Tập N được gọi là tập có xác suất 0 nếu tồn tại A ∈ F sao cho
N ⊂ A). Một họ (Ft, t ∈ R+) các σ - trường con của F được gọi là một lọc nếu
Fs ⊂ Ft nếu s < t. Lọc
(Ft, t ∈ R+) được gọi là liên tục phải nếu với mọi t ∈ R+
Ft = Ft+ =
⋂
s>t
Fs
Để cho gọn khi nói về lọc (Ft) ta hiểu là xét lọc
(Ft, t ∈ R+).
Định nghĩa 1.1 Một hàm T : Ω→ [0,∞) được gọi là một thời điểm Markov đối
với lọc (Ft) nếu nó là F - đo được và với mỗi t ta có
{T ≤ t} ∈ Ft (1.2)
Nếu P (T <∞) = 1 (T hữu hạn hầu chắc chắn) thì thời điểm Markov T được gọi
7là thời điểm dừng.
Nếu lọc (Ft) liên tục phải thì điều kiện (1.2) tương đương với
{T < t} ∈ Ft, ∀t ∈ R+
Ví dụ 1.1 Cho X = (Xt) là quá trình liên tục và F là một tập đóng trên đường
thẳng. Giả sử T là thời điểm lần đầu tiên (Xt) chạm vào tập F nghĩa là
T (ω) =
inf {t : Xt(ω) ∈ F} nếu tồn tại t như thế∞ nếu Xt /∈ F, ∀t ∈ R+
Khi đó T là thời điểm Markov đối với lọc (Ft).
Thật vậy, đặt G = R\F . Khi đó G là tập mở do đó tồn tại dãy tập đóng (Kn)
sao cho G = ∪nKn và do X = (Xt) là quá trình liên tục nên
{T ≤ t} =
⋂
n
⋃
s<t
{Xs /∈ Kn} =
⋃
r<t,r∈Q
{Xr /∈ Kn} ∈ Ft.
Ví dụ 1.2 Cho X = (Xt) là quá trình liên tục phải và G là một tập mở trên
đường thẳng. Giả sử T là thời điểm lần đầu tiên (Xt) chạm vào tập G nghĩa là
T (ω) =
inf {t : Xt(ω) ∈ G} nếu tồn tại t như thế∞ nếu Xt /∈ G,∀t ∈ R+
Khi đó nếu lọc (Ft) liên tục phải thì T là thời điểm Markov đối với lọc (Ft).
Thật vậy, đặt F = R\G. Khi đó F là tập đóng và do X = (Xt) là quá trình liên
tục phải nên
{T ≥ t} =
⋂
s<t
{Xs ∈ F} =
⋂
r<t,r∈Q
{Xr ∈ F} ∈ Ft
Suy ra {T < t} ∈ Ft và vì lọc (Ft) liên tục phải nên ta kết luận T là thời điểm
8Markov.
1.3.2. Bài toán thời điểm dừng tối ưu
Giả sử Xt là nghiệm duy nhất của phương trình vi phân ngẫu nhiên (??) và cho
g (hàm giá) là hàm số trên Rn, thỏa mãn
a) g(ξ) ≥ 0 với mọi ξ ∈ Rn
b) g liên tục.
Hãy tìm thời điểm dừng τ∗ = τ∗(x, ω) (được gọi là thời điểm dừng tối ưu) của
{Xt} sao cho
Ex[g(Xτ∗)] = sup
τ
Ex[g(Xτ )] với mọi x ∈ Rn (1.3)
sup được lấy trên tập tất cả các thời điểm dừng τ của {Xt}. Chúng ta cũng
muốn tìm
g∗(x) = Ex[g(Xτ∗)] (1.4)
Ở đây g(Xτ ) được hiểu là bằng 0 tại ω ∈ Ω mà τ(ω) = ∞ và Ex là kỳ vọng với
quy luật phân phối xác suất Qx của quá trình Xt; t ≥ 0 với X0 = x ∈ Rn.
Định nghĩa 1.2 Một hàm đo được, nửa liên tục dưới f : Rn → [0, ∞) được gọi
là hàm siêu điều hòa nếu
f(x) ≥ Ex[f(Xτ )] (1.5)
với mọi thời điểm dừng τ và với mọi x ∈ Rn.
Định nghĩa 1.3 Cho h là hàm thực đo được trên Rn. Nếu f là hàm siêu điều
hòa và f ≥ h ta nói f là hàm trội siêu điều hòa của h. Hàm
ĥ(x) = inf
f
f(x);x ∈ Rn (1.6)
9inf được lấy trên tập tất cả các hàm trội siêu điều hòa f của h, được gọi là hàm
trội siêu điều hòa tối thiểu của h.
Định lý 1.4 (Xây dựng hàm siêu điều hòa tối thiểu) Cho g = g0 là hàm
không âm, nửa liên tục dưới trên Rn ta định nghĩa một cách quy nạp như sau
gn(x) = sup
t∈Sn
Ex[gn−1(Xt)] (1.7)
trong đó Sn = {k · 2−n; 0 ≤ k ≤ 4n}, n = 1, 2, . . .. Khi đó gn ↑ ĝ và ĝ là hàm siêu
điều hòa tối thiểu của g.
Định lý 1.5 (Định lý về sự tồn tại thời điểm dừng tối ưu) Cho g∗ là hàm
giá tối ưu và ĝ là hàm siêu điều hòa tối thiểu của hàm giá liên tục g ≥ 0.
a) Khi đó
g∗(x) = ĝ(x) (1.8)
b) Với > 0 đặt
D = {x; g(x) < ĝ(x)− } (1.9)
Giả sử g bị chặn. Khi đó thời điểm τ lần đầu tiên x rời khỏi tập D gần
như là tối ưu, theo nghĩa
|g∗(x)− Ex [g (Xτe)]| ≤ 2 (1.10)
với mọi x.
c) Đặt
D = {x; g(x) < g∗(x)} (1.11)
Cho N = 1, 2, . . . định nghĩa gN = g ∧ N, DN = {x; gN (x) < ĝN (x)} và σN =
τDN . Khi đó DN ⊂ DN+1, DN ⊂ D ∩ g−1([0, N)), D =
⋃
N DN . Nếu σN <∞
10
h.c.c với mọi N khi đó
g∗(x) = lim
N→∞
Ex [g (XσN )] (1.12)
d) Đặc biệt, nếu τD <∞ h.c.c và dãy {g (XσN )}N khả tích, khi đó
g∗(x) = Ex [g (XτD)]
và τ∗ = τD là thời điểm dừng tối ưu.
Định lý 1.6 (Định lý về tính duy nhất thời điểm dừng tối ưu) Như trước
đã định nghĩa
D = {x; g(x) < g∗(x)} ⊂ Rn
Giả sử tồn tại thời điểm dừng tối ưu τ∗ = τ∗(x, ω). Khi đó
τ∗ ≥ τD với mọi x ∈ D (1.13)
và
g∗(x) = Ex [g (XτD)] với mọi x ∈ Rn (1.14)
Do đó τD là thời điểm dừng tối ưu.
1.4. Mạng nơ-ron
Các nghiên cứu về bộ não con người đã được tiến hành từ hàng nghìn năm
nay. Cùng với sự phát triển của khoa học kĩ thuật đặc biệt là những tiến bộ
trong ngành điện tử hiện đại, việc con người bắt đầu nghiên cứu các nơ-ron nhân
tạo là hoàn toàn tự nhiên. Sự kiện đầu tiên đánh dấu sự ra đời của mạng nơ-ron
nhân tạo diễn ra vào năm 1943 khi nhà thần kinh học Warren McCulloch và
nhà toán học Walter Pitts viết bài báo mô tả cách thức các nơ-ron hoạt động.
Họ cũng đã tiến hành xây dựng một mạng nơ-ron đơn giản bằng các mạch điện.
Các nơ-ron của họ được xem như là các thiết bị nhị phân với ngưỡng cố định.
11
Kết quả của các mô hình này là các hàm logic đơn giản chẳng hạn như “ a OR
b” hay “a AND b”.
Nội dung của chương này được tham khảo trong [0].
1.4.1. Tổng quan về mạng nơ-ron
Nơ-ron sinh học và nơ-ron nhân tạo
a) Nơ-ron sinh học
Hình 1.1: Cấu trúc của một nơ-ron sinh học điển hình
b) Nơ-ron nhân tạo
Một nơ-ron là một đơn vị xử lý thông tin và là thành phần cơ bản của một
mạng nơ-ron. Cấu trúc của một nơ-ron được mô tả ở hình dưới.
Mô hình mạng nơ-ron
12
Hình 1.2: Nơ-ron nhân tạo
Hình 1.3: Mạng MLP tổng quát
1.4.2. Huấn luyện mạng nơ-ron
1.4.3. Phương pháp xây dựng mạng nơ-ron MLP
1.5. Kết luận chương 1
Chương này chúng tôi đã trình bày một số kiến thức cơ bản nhất của giải
tích ngẫu nhiên, trong đó thời điểm dừng tối ưu là khái niệm liên quan trực tiếp
tới các chương tiếp theo.
13
Trong chương này chúng tôi cũng trình bày các vấn đề cơ bản về mạng
nơ-ron, gồm các khái niệm của mạng nơ-ron nhân tạo, lịch sử phát triển, các mô
hình mạng và phương pháp xây dựng cũng như huấn luyện mạng. Trong đó đi
sâu vào việc xây dựng một mạng nơ-ron truyền thẳng MLP và thuật toán huấn
luyện lan truyền ngược.
Các vấn đề cần nghiên cứu triển khai là:
• Tìm hiểu về các thuật toán huấn luyện mạng nơ-ron khác, để có thể đưa ra
các so sánh, cũng như chọn mô hình thích hợp cho các bài toán cụ thể.
• Phát triển chương trình thực nghiệm có ý nghĩa thực tế như nhận dạng chữ
viết tay, nhận dạng ảnh, ...
14
CHƯƠNG 2. THỜI ĐIỂM DỪNG TỐI ƯU
CHO BÀI TOÁN QUẢNG CÁO
Trong chương này chúng tôi xem xét một bài toán thực tế đó là xác định
thời điểm dừng tối ưu cho một chiến dịch quảng cáo. Thị phần (tiềm năng) của
công ty đang xét về một sản phẩm A nào đó được mô tả bằng một phương trình
vi phân ngẫu nhiên dưới tác động của chiến dịch quảng cáo thông qua truyền
thông cũng như sự truyền miệng của các khách hàng đã có của công ty. Hàm
mục tiêu là một hàm liên tục xác định trên thời gian t và thị phần đạt được
của chiến dịch quảng cáo. Bài toán thời điểm dừng tối ưu đã được nhiều tác giả
xem xét chủ yếu trong lĩnh vực tài chính và được giải thông qua việc giải các
phương trình vi phân đạo hàm riêng. Trong chương này chúng tôi xem xét một
cách tiếp cận khác cho bài toán thời điểm dừng tối ưu đó là tiếp cận học máy.
Mỗi một quyết định dừng hay tiếp tục chiến dịch quảng cáo tại thời điểm t được
biểu diễn bởi một hàm (gọi là hàm quyết định) nhận giá trị trong tập {0, 1},
trong đó giá trị 0 là tiếp tục chiến dịch, giá trị 1 là dừng lại. Chúng tôi tiếp tục
xấp xỉ hàm quyết định bởi một mạng nơ-ron nhiều lớp. Sau khi đã huấn luyện
mạng nơ-ron, cho dữ liệu qua mạng ta sẽ nhận được quyết định dừng hay tiếp
tục.
Một số kiến thức liên quan được tham khảo trong các tài liệu [0], [0], [0],
[0].
2.1. Mô hình bài toán quảng cáo
Chiến dịch quảng cáo thông qua truyền thông sẽ thay tác động vào những
người chưa phải là khách hàng của công ty, còn sự lan tỏa sẽ do những khách
hàng đã có của công ty quyết định - bằng truyền miệng những khách hàng của
15
công ty sẽ giới thiệu hoặc khuyến cáo những người tiêu dùng chưa phải là khách
hàng nên hoặc không nên mua mặt hàng A, vì vậy sự biến động về khách hàng
của công ty được xác định bởi:
dn(t)
dt
= E(N − n(t)) +Mn(t)(N − n(t)) (2.1)
ở đây E đại diện cho hiệu quả của chiến dịch truyền thông và M đại diện cho
chất lượng của sản phẩm A.
Đặt X(t) = n(t)N ∈ [0, 1], khi đó phương trình (2.1) trở thành
dX(t)
dt
= E(1−X(t))+MNX(t)(1−X(t)) = E(1−x(t))+MNX(t)(1−X(t)) (2.2)
Đặt b = MN và phân rã E thành hai thành phần, một thành phần tất định a
và một thành phần ngẫu nhiên tỉ lệ với a là σa. Khi đó phương trình (2.1) trở
thành
dX(t) = [a(1−X(t)) + bX(t)(1−X(t))]dt+ σa(1−X(t))dW (t) (2.3)
Giả sử X(t) là nghiệm của phương trình vi phân (2.3). Gọi F = (Ft)t∈[0,T ] là bộ
lọc sinh bởi X(t).
Xét hàm liên tục g : [0, T ]× R → R, g (t,Xt) là hàm của thời gian t và thị phần
Xt.
Bài toán đặt ra là cần xác định thời điểm τ∗, là nghiệm của bài toán sau
f (τ∗, Xτ∗) = sup
τ
E [g (τ,Xτ )]
trong đó τ : Ω→ [0, T ] là một F - thời điểm dừng.
2.2. Giải phương trình vi phân ngẫu nhiên
Xét phương trình vi phân ngẫu nhiên (2.3)
dX(t) = [a(1−X(t)) + bX(t)(1−X(t))]dt+ σa(1−X(t))dW (t)
16
Đặt 1−X(t) = Z(t) ta có −dX(t) = dZ(t) và do đó
dZ(t) = −Z(t)[a+ b(1− Z(t))]dt+ σaZ(t)dW (t)
hay
dZ(t) =
[
bZ2(t)− (a+ b)Z(t)] dt− σaZ(t)dW (t) (2.4)
Để giải phương trình (2.4) ta sẽ đi giải phương trình sau
dZ(t) =
[
αZ2(t) + βZ(t)
]
dt+ λZ(t)dW (t) (2.5)
trong đó α, β và λ là các tham số của quá