Hệ thống điều khiển robotcó thị giác được
sửdụng đểtheodõi các mục tiêu di động trong các
ứngdụngcủa robot công nghiệpvà quốc phòng. Hệ
thốngthịgiác có thể đượcphân thành hailớp, theo
nhưcấu trúc của hệ, đó là hệ có camera gắn cố định
và hệcócamera gắn trêntay máy (eye-in-hand).
Tronghệcamera cố định, các camera được gắn cố
địnhso với hệtọa độthực, thu thập ảnhcủa cảmục
tiêu và của cảmôi trường. Mục đíchcủa hệnàylà
cung cấptín hiệu điều khiển tay máy saocho tay
máy đạt tới vị trímong muốn. Mục đíchcủa cấu
trúceye-in-handlà điều khiểntay máy sao cho ảnh
của mục tiêucố địnhhoặc di độngluônluôn được
duytrì ởvịtrí mong muốn trên mặt phẳng ảnh thu
được.Trêncơsở ảnh thu được từcamera, được số
hóa và tích hợp trong vòng điều khiển phản hồi, hệ
thống điều khiển các khớp của tay máy (DOF). Để
cải thiện chất lượng của hệbám,các thuật điều
khiểnkhác nhưthích nghi, tối ưu, lọc Kalman
thường được sửdụng. Sốbậc tựdo của robottùy
thuộc từng bài toán cụthể, ví dụkhi
thểthay đổi không biết trước (do gió,ánhsángthay
đổi). Các nghiên cứu vềhệmôi trường động bịbỏ
khá xa sovới hệmôi trườngtĩnh do bị ảnhhưởng
khá lớn của tốc độtính toán, cũngnhư độchính xác
của việc phân tích ảnh. Dovậy, cónhiều thuật toán
đểcải thiện tốc độxửlý ảnhvà xemxét đến các
yếu tốnhiễu tác độnglên quá trình thuthập ảnh.
Một tháchthức khác của bài toán visualservoing là
việc phân loại đối tượng. Mộtrobotcóthểphải đối
mặt với rấtnhiều đối tượng khác nhau, trong đó chỉ
có một đối tượng quan tâm,còn các đối tượng khác
thì không. Dovậy chúngta phải mởrộng khảnăng
của hệthốngbao gồm chức năngthông minh tự
nhận dạngchính xác đối tượng cầntìm. Đểnhận
được thôngtinvềvịtrí của mục tiêu trong môi
trường động, các đặc trưngcủa mục tiêurấtquan
trọng. Các điểm lỗ, các góccạnh, các đặc trưng
hìnhhọc của mục tiêu được phân tíchthông qua
quá trình nhận dạng. Đặc tính vềtrọngtâmcủa mục
tiêucóthểdễ dàngtính thông qua momen bậc nhất
của ảnh, trong trườnghợpmôi trường tĩnh, nhưng
trong trườnghợpmôi trường động, việc này rấtkhó
thực hiện vìchiphíthờigian tính toán lớn.Một giải
pháp hay được sửdụng đểlọc nhiễu, dựbáo vịtrí
tiếp theo của mục tiêu, do đó giảm đáng kểthời
gian xửlí ảnh, được trình bày trong trong bàibáo là
phươngpháplọc Kalman.
HệthốngVICON được thiết kếdựa trênsơ đồhình
1 được thửnghiệm trongphòngthí nghiệmcho kết
quảtốt, mặc dù cómột sốhạn chếsẽ được trình bày
ởphần sau. Bàibáo này được tổchức nhưsau.
Phần thứnhất mô tảhệbám mục tiêu di động. Phần
thứhai trình bày vềmôhình độnghọc của hệ
thống. Phần tiếp theo giới thiệu vềmôhình bộlọc
Kalmantrongdựbáo vịtrí mục tiêu. Phần thứ4 là
thuật toánnhận dạng, xửlí ảnh. Kết quảthửnghiệm
hệthốngVICON sẽ được trình bày ởphần 5.Cuối
cùng là kết luận và hướngnghiên cứu tiếp theo.
6 trang |
Chia sẻ: ngtr9097 | Lượt xem: 2590 | Lượt tải: 4
Bạn đang xem nội dung tài liệu Đề tài Nghiên cứu phát triển hệ Robot – camera tự động tìm kiếm và bám đối tượng di động VICON, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nghiên cứu phát triển hệ Robot – camera
tự động tìm kiếm và bám đối tượng di động VICON.
PGS. TSKH Phạm Thượng Cát, Ths. Trần Việt Phong
Phòng công nghệ Tự Động Hóa - Viện Công Nghệ Thông Tin
Tel. 8363484, e-mail: ptcat@ioit.ncst.ac.vn
Tóm tắt:
Hệ điều khiển visual servoing bám đối tượng di động liên quan đến vấn đề điều khiển và thị giác máy được
rất nhiều tác giả quan tâm. Hệ thống được trình bày trong báo cáo này bao gồm một robot hai bậc tự do pan/tilt
có gắn một camera. Hệ thống có nhiệm vụ bám đối tượng đang di chuyển với quỹ đạo không biết trước, thông
qua điều khiển các khớp quay của robot sao cho ảnh của đối tượng thu được ở chính giữa tâm camera. Báo cáo
đưa ra mô hình động học của hệ, liên quan đến vị trí của đối tượng trong ảnh và góc quay pan, tilt. Sau đó, để
mục tiêu luôn luôn ở chính giữa ảnh, một mô hình dự báo vị trí và tốc độ của mục tiêu được áp dụng. Báo cáo
cũng giới thiệu về phương pháp xử lí ảnh, tự động tìm kiếm và nhận dạng đối tượng di động. Các kết quả nghiên
cứu được áp dụng trong hệ thực nghiệm VICON cho kết quả rất khả quan.
Development of a Robot-camera system VICON
for automatic recognition and tracking of moving objects.
Abstract:
The robotic visual servoing system relates to robot control and machine vision issue has received many
attention from reseachers. The system introduced in this paper consists of a pan/tilt robot with 2 degree of
freedom (pitch and yaw) that controls a videocamera. The aim of system is to move robot in such a way that the
image of an unknown moving object attains the center of camera. We propose a kinematic model that relates the
position of object’s centroid in the image plane with the pan and tilt rotation angles. In order to permanently
maintain the object in the field of vision of videocamera, a prediction algorithm is used. This paper also briefly
describes image processing, auto detection and recognition of moving objects. The experiments with VICON
system present good results.
1.GIỚI THIỆU.
Hệ thống điều khiển robot có thị giác được
sử dụng để theo dõi các mục tiêu di động trong các
ứng dụng của robot công nghiệp và quốc phòng. Hệ
thống thị giác có thể được phân thành hai lớp, theo
như cấu trúc của hệ, đó là hệ có camera gắn cố định
và hệ có camera gắn trên tay máy (eye-in-hand).
Trong hệ camera cố định, các camera được gắn cố
định so với hệ tọa độ thực, thu thập ảnh của cả mục
tiêu và của cả môi trường. Mục đích của hệ này là
cung cấp tín hiệu điều khiển tay máy sao cho tay
máy đạt tới vị trí mong muốn. Mục đích của cấu
trúc eye-in-hand là điều khiển tay máy sao cho ảnh
của mục tiêu cố định hoặc di động luôn luôn được
duy trì ở vị trí mong muốn trên mặt phẳng ảnh thu
được. Trên cơ sở ảnh thu được từ camera, được số
hóa và tích hợp trong vòng điều khiển phản hồi, hệ
thống điều khiển các khớp của tay máy (DOF). Để
cải thiện chất lượng của hệ bám, các thuật điều
khiển khác như thích nghi, tối ưu, lọc Kalman
thường được sử dụng. Số bậc tự do của robot tùy
thuộc từng bài toán cụ thể, ví dụ khi i éng59838962TT3.46027 Tf
0AB Tc 10.02 0 0 10.0203174.717 t76.00032 Tm
Tj
/T/TT038194 2TT3.46027 Tmn r40i ttTm
(ng)Tj
10.02 0 0 100 2165194 112590 186 Tmm
(i )Tj
10.02 0 0 10.02 244.472 92.88251 966. 1Tj
10112590 186 T0 Tc 0 Tw 10.02 0 010.02 174.71 14502 244.472 92.88251 966.8.7754 112590 186 Tmc
(bot)Tj
10.02 0 0 10.149.432944 112590 186 Tmib,2b i
thể thay đổi không biết trước (do gió, ánh sáng thay
đổi). Các nghiên cứu về hệ môi trường động bị bỏ
khá xa so với hệ môi trường tĩnh do bị ảnh hưởng
khá lớn của tốc độ tính toán, cũng như độ chính xác
của việc phân tích ảnh. Do vậy, có nhiều thuật toán
để cải thiện tốc độ xử lý ảnh và xem xét đến các
yếu tố nhiễu tác động lên quá trình thu thập ảnh.
Một thách thức khác của bài toán visual servoing là
việc phân loại đối tượng. Một robot có thể phải đối
mặt với rất nhiều đối tượng khác nhau, trong đó chỉ
có một đối tượng quan tâm, còn các đối tượng khác
thì không. Do vậy chúng ta phải mở rộng khả năng
của hệ thống bao gồm chức năng thông minh tự
nhận dạng chính xác đối tượng cần tìm. Để nhận
được thông tin về vị trí của mục tiêu trong môi
trường động, các đặc trưng của mục tiêu rất quan
trọng. Các điểm lỗ, các góc cạnh, các đặc trưng
hình ọc của mục tiêu được phân tích thông qua
quá t
tiêu c
của ả
trong
thực
pháp
tiếp
gian
phươ
Hệ th
1 đượ
quả t
ở ph
Phần
thứ h
thống
Kalm
thuật
hệ th
cùng
2. MÔ
trong
quay
chuy
H
Cấu
thành
dựa vào chuỗi ảnh liên tiếp thu được từ camera để
nhận dạng và tính toán vị trí của đối tượng quan
tâm. Phần thứ hai là phần điều khiển, dựa vào thông
tin vị trí của đối tượng trong mặt phẳng ảnh, tính
toán tín hiệu điều khiển robot sao cho ảnh của đối
tượng di chuyển duy trì ở chính giữa mặt phẳng
ảnh.
Precision
deg/step
Range
deg
Max velocity
deg/s
Pan 0.01290 -1590 – +1580 60
Tilt 0.01290 -300 – +410 60
Bảng 1. Các đặc trưng chủ yếu của Robot.
Các thông số cơ bản của robot được giới thiệu như
trên bảng 1.
Do các tín hiệu điều khiển dựa trên thông tin xử lí
ảnh, nên một mô hình ánh xạ từ mặt phẳng ảnh vào
h
rình nhận dạng. Đặc tính về trọng tâm của mục
ó thể dễ dàng tính thông qua momen bậc nhất
nh, trong trường hợp môi trường tĩnh, nhưng
trường hợp môi trường động, việc này rất khó
hiện vì chi phí thời gian tính toán lớn. Một giải
hay được sử dụng để lọc nhiễu, dự báo vị trí
theo của mục tiêu, do đó giảm đáng kể thời
xử lí ảnh, được trình bày trong trong bài báo là
ng pháp lọc Kalman.
ống VICON được thiết kế dựa trên sơ đồ hình
c thử nghiệm trong phòng thí nghiệm cho kết
ốt, mặc dù có một số hạn chế sẽ được trình bày
ần sau. Bài báo này được tổ chức như sau.
thứ nhất mô tả hệ bám mục tiêu di động. Phần
ai trình bày về mô hình động học của hệ
. Phần tiếp theo giới thiệu về mô hình bộ lọc
an trong dự báo vị trí mục tiêu. Phần thứ 4 là
toán nhận dạng, xử lí ảnh. Kết quả thử nghiệm
ống VICON sẽ được trình bày ở phần 5. Cuối
là kết luận và hướng nghiên cứu tiếp theo.
TẢ HỆ BÁM MỤC TIÊU DI ĐỘNG.
Hệ bám mục tiêu di động được trình bày
bài này như hình 2. Hệ thống bao gồm một bệ
hai bậc tự do (2DOF), camera CCD có thể di
ển đồng thời theo hai hướng pan và tilt.
ình 2. Thiết bị điều khiển pan/tilt-camera.
trúc hệ điều khiển visual servoing gồm hai
phần chính. Phần thứ nhất là phần xử lí ảnh,
không gian robot cần được thực hiện. Hơn nữa, để
giảm ảnh hưởng của nhiễu và giảm khối lượng tính
toán trong xử lí ảnh nên các bước tiền xử lí, nhận
dạng, thích nghi cũng được sử dụng. Các bước này
sẽ lần lượt được trình bày dưới đây.
3. MÔ HÌNH HÓA ĐỘNG HỌC ROBOT.
Nhằm mục đích duy trì ảnh của mục tiêu
càng gần tâm của mặt phẳng ảnh, chúng ta thiết lập
mối quan hệ tương đối giữa biến quan sát được x0
và y0 là tọa độ của đối tượng trên hệ tọa độ gắn với
mặt phẳng ảnh (IP), đối với biến điều khiển của
robot φ và θ.
Yc
Xc
Oc
P(X, Y, Z)Zc Z
Y'
d2
θ φ
d1X
O X' Z'
Y
Hình 3. Mô hình động học hệ.
Trong hình 3, ta có thể nhìn thấy rằng φ và θ là các
góc quay xung quanh trục tương ứng là OZ và OZ’,
sao cho, sau khi di chuyển tâm của mục tiêu di
động có tọa độ P(X, Y, Z) sẽ được ánh xạ lên tâm
của mặt phẳng ảnh.
Mô hình động học của hệ sẽ được thể hiện trong hai
phần. Đầu tiên là xây dựng một mô hình hình học
xấp xỉ quan hệ giữa biến điều khiển và biến quan
sát. Tiếp theo, sử dụng xấp xỉ đó để xây dựng mô
hình động học của hệ.
2
1. Mô hình xấp xỉ hình học.
Gọi OXYZ là hệ toạ độ thực của hệ robot-camera
và OXcYcZc là hệ toạ độ gắn với camera. P(X, Y, Z)
là toạ độ của đối tượng trên hệ toạ độ thực, toạ độ
của P chiếu lên mặt phẳng ảnh là (xp, yp). Hình 4
thể hiện quan hệ hình học của góc quay φ là góc
quay của hệ robot-camera sao cho tâm của đối
tượng P(X, Y, Z) nằm trên trục OcZc. Từ hình vẽ 4,
có thể nhận thấy:
X
Y)tan( =φ (1)
và
λ
−=−==α
p
c
c x
dX
Y
Z
X
)tan(
1
(2)
trong đó X và Y thể hiện vị trí của tâm mục tiêu
trong hệ tọa độ thực, d1 là khoảng cách từ trục OY
đến trục OcXc , λ là tiêu cự camera.
Từ (1) ta nhận thấy, để tính được φ chúng ta phải
biết X và Y, là các đại lượng không đo được, cũng
không quan sát được, khi chỉ dùng một camera tĩnh.
Cũng từ (2) ta nhận thấy rằng, từ xP, là biến có thể
quan sát được, và λ là đại lượng có thể đo được, ta
có thể tính được α.
Nếu sai số để có thể xấp xỉ φ ≈ α là đủ nhỏ, thì φ có
thể tính qua α, do đó có thể tính φ từ các đại lượng
đo được và quan sát được.
Nếu φe là sai lệch khi thực hiện xấp xỉ này thì ta có
φ = α + φe. Do đó ta có thể viết:
)tan()tan(1
)tan()tan(
)tan()tan(
e
e
e φα
φαφαφ −
+=+=
(3)
từ (1), (2), (3) ta có:
⎟⎟⎠⎝ 1 YXdX
từ (4) có thể nhận thấy rằng sai số khi thực hiện xấp
⎞
⎜⎜
⎛
+−=φ 22
1Ydarctane (4)
- 0. Khi hệ điều khiển bám chính xác
-
d và Y, tức là X >> d Y .
n giải của robot và sai số do nhiễu
ác biến quan sát được x , y và đo lường được λ.
2. Mô hình động học của hệ robot-camera.
xỉ có thể chấp nhận được, trong các trường hợp sau:
limY→0 φe =
đối tượng.
- limd1→0 φe = 0. Khi gốc O và Oc là trùng nhau.
limX→∞ φe = 0. Khi khoảng cách X rất lớn so với
1 1
Các giả thiết này được áp dụng cho mô hình động
học của hệ thống đang xét với sai số nhỏ φc ≈ 0.005
rad. Sai số này có thể chấp nhận được nếu so với
sai số do độ phâ
trong xử lí ảnh.
Đối với xấp xỉ góc θ cũng tính tương tự. Ta có thể
kết luận rằng, khi tính φ và θ có thể giả thiết rằng O
và OC trùng nhau. Mục đích của xấp xỉ này là
chúng ta có thể tính góc quay pan φ và góc tilt θ từ
c P P
Nhằm mục đích tìm mô tả quan hệ giữa xp và yp đối
với φ và θ, đầu tiên ta tìm ma trận chuyển đổi đồng
nhất của hai phép quay c era xung quanh O
một góc φ và θ.
O
Oc
R
Hệ toạ độ quy chiếu của robot được xác định theo
quy tắc David - Hetenberg như trên hình 3.
Hình 4. Phép chiếu quay quanh trục OZ.
Ma trận chuyển từ hệ toạ độ O’X’Y’Z’ về hệ toạ độ
OXYZ:
ch hệ toạ độ
cos(φ) 0 sin(φ) 0
sin(φ) 0 -cos(φ) 0
0 1 0 0
1
O
O'R =
Y
P(X, Y, Z)
Xc
Yφ Zcλ α
xp O Oc X
IP
d1
X
Ma trận
O’X’Y’Z’
Ma trận đồ
Oc về hệ to
đồng nhất
độ camera
R
Do vậy:
=cOOR
Hình 3 và
được chiếu
thực hiện p
trận đồng n
co
-co
'O
OCR = uyển từ hệ toạ độ OcXYZ về
khi quay quanh O’Z’ góc θ:
0 0 0 ng nhất khi chuyển
ạ độ thực O là
khi chuyển từ hệ tọa
O
O
OCR
c, theo định nghĩa
( ) ( OOOOOO CCc RR == −1
hình 4 chỉ ra rằng cá
lên tâm của mặt p
hép quay φ và θ .
hất , ta có thể vcOOR
s(φ)cos(θ) sin(φ)c
s(φ)sin(θ) -sin(φ)s
sin(φ) -cos
0 0
cos(θ) -sin(θ)
sin(θ) cos(θ)
0 0
0 0
c
0
0
1am từ hệ toạ độ camera
. Ma trận
độ thực O về hệ tọa
'O
O
O
'O CRR=
ta có:
)T
c điểm P(X, Y, Z) sẽ
hẳng ảnh IP sau khi
Do vậy, khi biết ma
iết được như sau:
(5)
os(θ) sin(θ) 0
in(θ) cos(θ) 0
(φ) 0 0
0 1
0 0
0 0
1 0
0 1
=
3
Trong đó, (c, 0, 0, 1) và (X, Y, Z, 1) là tọa độ đồng
nhất của điểm P khi nhìn trong hệ toạ độ Oc và hệ
toạ độ O tương ứng.
Giải (5) ta có:
Xsin(φ) - Ycos(φ) = 0 (6)
-Xcos(φ)sin(θ) - Ysin(φ)sin(θ) + Zcos(θ) = 0
ta có:
⎟⎠
⎞⎜⎝
⎛=φ
X
Yarctan
(7)
( )⎟⎠
⎞⎜⎝
⎛ φ−=θ cos
Y
Zarctan
từ giả thiết xấp xỉ (1) và (2) ta có:
⎟⎟⎠
⎞
⎜⎜⎝
⎛
λ−=φ
pxarctan
(8)
( )⎟⎟⎠
⎞
⎜⎜⎝
⎛ φλ=θ cos
y
arctan p
Công thức (8) biểu diễn quan hệ giữa vị trí của mục
tiêu trên hệ tọa độ ảnh và các biến điều khiển của
robot, qua đó ta có thể điều khiển robot sao cho ảnh
của mục tiêu tiến tới chính giữa của mặt phẳng ảnh.
Trước khi trình bày về phần xử lý ảnh, ta giới thiệu
về phương pháp dự báo vị trí, tốc độ của mục tiêu
trên ảnh để điều khiển sao cho ảnh của mục tiêu
luôn duy trì ở chính giữa mặt phẳng ảnh khi mục
tiêu di chuyển, đồng thời phép dự báo này cũng làm
giảm khối lượng tính toán xử lí ảnh.
3. DỰ BÁO VỊ TRÍ CỦA MỤC TIÊU TRONG
MÔI TRƯỜNG CÓ NHIỄU BẰNG BỘ LỌC
KALMAN.
Bài toán bám mục tiêu di động với quỹ
đạo không biết trước yêu cầu phải dự báo được vị
trí và tốc độ của đặc trưng ảnh ở bước tiếp theo. Bộ
lọc Kalman được sử dụng để ước lượng dự đoán
căn cứ vào thông tin ảnh thu được từ camera số tại
thời điểm hiện tại. Bộ lọc Kalman được coi như bộ
ước lượng trạng thái hệ thống, có cấu trúc lọc đơn
giản và độ hội tụ tốt cùng với khả năng lọc nhiễu
cao [8], [9], [10].
Mô hình cần được ước lượng dự báo được mô tả
bởi hệ phương trình trạng thái:
kkk
kkk
ζCxy
GωAxx
+=
+=
+
+
1
1
ở đây, x và y tương ứng là vector trạng thái và
vector đầu ra của hệ thống, các chỉ số ‘k’ và ‘k+1’
chỉ các vector tại thời điểm thứ k và k+1. Đối với
bài toán ước lượng đặc trưng ảnh, ta có:
T
kkkkk vvuu ][ &&=x ; Tkkk vu ][=y
trong đó (uk, vk) và tương ứng là toạ
độ và tốc độ của ảnh đối tượng trên mặt phẳng ảnh
ở thời điểm thứ k.
),( kk vu &&
- Nhiễu quá trình ωk là nhiễu thể hiện độ không
chính xác của mô hình và được giả thiết là nhiễu ồn
trắng có giá trị kỳ vọng bằng 0 và ma trận tương
uan Q; ζk là nhiễu đo lư ng do độ không chính
ác của sensor và cũng đư c giả thiết là nhiễu ồn
X
Y
Z
1
cos(φ)cos(θ) sin(φ)cos(θ) sin(θ) 0
-cos(φ)sin(θ) -sin(φ)sin(θ) cos(θ) 0
sin(φ) -cos(φ) 0 0
0 0 0 1
q
x
trắng có giá trị kỳ vọng b
quan R. Trong mô phỏng Q
dương và là các ma trận đơ
Trong bài toán dự bá
điểm đặc trưng, ta xấp xỉ c
giữa hai lần cắt mẫu T có v
Các ma trận được tính như
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
=
1000
100
0010
001
A
T
T
Gọi P là ma trận tương qu
chọn là ma trận đơn vị, c
trước thời điểm hiện tại.
Ta có thuật toán lọc Kalma
Đầu ra của bộ dự báo cho
điểm đặc trưng.
Mô phỏng của bộ lọc dự
bày trên hình 5, khi ảnh củ
quỹ đạo thẳng.
Hình 5. Kết quả
ờ
ợ(15)
ằng 0 và ma trận tương
, R được chọn xác định
n vị.
o vị trí và vận tốc của
huyển động của mục tiêu
ận tốc không đổi.
sau:
⎥⎦
⎤⎢⎣
⎡=
0100
0001
C
G = I
an sai lệch, ban đầu P0
hỉ số “-“ xác định giá trị
n [9]:
ta vị trí và tốc độ của
báo Kalman được trình
a mục tiêu di chuyển với
bộ lọc Kalman.
4
Trong thực tế, áp dụng bộ lọc Kalman phụ thuộc
nhiều vào việc lựa chọn ma trận tương quan Q, R.
Ngoài ra nếu mục tiêu di chuyển với sự thay đổi
quỹ đạo nhanh chóng, tức là giả thiết tốc độ mục
tiêu là hằng số giữa hai lần lấy mẫu không còn
chính xác thì việc dự báo bằng bộ lọc Kalman sẽ
tiến tới kết quả không ổn định. Khi đó có thể sử
dụng phương pháp dự báo khác như phương pháp
Luenberger [10].
4. NHẬN DẠNG VÀ BÁM MỤC TIÊU DI
ĐỘNG.
Nhận dạng mục tiêu di động là bước quan
trọng trong hệ tự động tìm kiếm và bám mục tiêu di
động. Mục đích của quá trình này là thực hiện các
phép xử lí ảnh để tìm kiếm đối tượng cần quan tâm,
xác định vị trí của nó trong mặt phẳng ảnh hiện
thời. Trong quá trình tìm kiếm, ta chia một ảnh là
tập hợp các pixel bao gồm hai thành phần, hoặc là
thuộc đối tượng, hoặc là thuộc nền. Ta xem xét việc
tìm kiếm để nhận dạng các điểm thuộc đối tượng
trong mỗi ảnh thuộc chuỗi ảnh thu được.
Có rất nhiều cách để nhận dạng một đối tượng, ví
dụ ta có thể áp đặt mô hình của đối tượng đã biết
trước (màu sắc, hình dáng) lên toàn bộ ảnh, từ đó
tìm ra vị trí phù hợp nhất của đối tượng trong ảnh.
Tuy nhiên cách này phải tốn nhiều thời gian, và
không hiệu quả trong thực tế. Một phương pháp
nhanh hơn để xử lí ảnh và nhận dạng đối tượng
được trình bày như lưu đồ trên hình 6.
Hình 6. Lưu đồ xử lí ảnh.
Để đánh giá trạng thái của một pixel là đối tượng
hay là nền, chúng ta giả thiết là đối với các pixel
thuộc nền, cường độ sáng thay đổi chậm, trong khi
đó đối với pixel thuộc đối tượng, cường độ sáng
thay đổi lớn. Như vậy, một phép so sánh được thực
hiện giữa các pixel trong ảnh hiện thời, nếu giá trị
của pixel lớn hơn ngưỡng đặt trước, pixel đó có giá
trị 1, nếu không pixel có giá trị 0. Nếu ngưỡng quá
lớn, pixel thuộc đối tượng có thể lẫn với nền, nếu
ngưỡng quá nhỏ, thì sự thay đổi ánh sáng trong môi
trường sẽ tạo ra nhiều pixel có giá trị 1, mà các
diểm này lại không phải là điểm quan trọng.
Ngưỡng hợp lí được tạo ra sau khi thực hiện một số
phép lọc nhiễu và các bước tiền xử lí ảnh khác.
Khi ảnh đã được xử lí ngưỡng, ảnh nhị phân thu
được sẽ gồm các pixel có hai trạng thái 0 và 1. Các
pixel 0 thuộc nền và các pixel 1 thuộc các đối
tượng, ta phải phân tích các đối tượng được thể
hiện. Tuy nhiên ảnh thu được sẽ bao gồm rất nhiều
đối tượng khác nhau, bao gồm cả nhiễu, nhưng
trong đó chỉ có duy nhất một đối tượng cần quan
tâm. Các bước xử lí ảnh nhị phân tiếp theo được
thực hiện nhằm loại bỏ nhiễu, hoặc điền đầy các lỗ
của đối tượng, cũng làm giảm khối lượng tính toán
của các bước xử lí ảnh tiếp theo. Quá trình phân
đoạn ảnh thành từng đối tượng riêng rẽ được thực
hiện thông qua algorithm đánh nhãn liên tiếp
(Sequential Labeling Algorithm). Quá trình này có
thể tạo ra hàng trăm đối tượng khác nhau, trong đó
chỉ có một số đối tượng gần với đối tượng quan
tâm. Một quá trình quét tiếp theo sẽ loại bỏ các đối
tượng không hợp lý so với đối tượng mẫu.
Bước tiếp theo là phân tích các đặc trưng của các
đối tượng vừa thu thập được trên ảnh, và quyết định
xem đối tượng nào thuộc lớp đối tượng quan tâm.
Sử dụng phương pháp momen bất biến hoặc
phương pháp quyết định Bayes là các biện pháp
ương đối hiệu quả [4]. Việc còn lại là xác định vị
Bắt đầu
Tiền xử lý
ảnh nhị phân
ảnh phân vùng
Nhận dạng
mục tiêu
Xác định tọa độ
mục tiêu
Kết thúc
t
trí trọng tâm của mục tiêu trên ảnh tương đối đơn
giản, thông qua xác định momen bậc nhất.
Quá trình xử lí ảnh được thực hiện không phải trên
toàn bộ ảnh thu được, mà sử dụng kết quả dự báo ở
trên để làm giảm thời gian tính toán. Hình 7 thể
hiện ảnh kết quả sau khi đã thực hiện nhận dạng.
a) ảnh gốc. b) ảnh sau khi xử lí
Hình 7. ảnh sau khi qua các bước xử lí.
5. THỬ NGHIỆM HỆ THỐNG.
Hệ thống VICON được xây dựng bao gồm
một robot tay máy với hai bậc tự do pan và tilt của
hãng DPerception Inc, như hình 1, với các đặc
trưng chủ yếu của robot giới thiệu trong bảng 1.
Camera CV-M50, monochrome CCD Camera của
hãng JAI Corporation, có tiêu cự λ = 8mm, tín hiệu
ra video 25 hình/s. Quá trình thu thập ảnh và số hóa
ảnh được thực hiện nhờ card xử lí ảnh FrameLocker
của hãng Ajeco, tốc độ xử lí 33ms. Thiết bị tính
toán và điều khiển là một máy tính Touchscreen
màn hình 6.4 inchs, theo chuẩn PC104, tốc độ xử lí
800MHz/s, do hãng Nagasaki IPC Technology chế
tạo. Phần mềm của hệ điều khiển và xử lí ảnh được
viết bằng ngôn ngữ C trên môi trường MS-DOS.
5
Thực nghiệm hệ thống với mục tiêu đặt cách
camera khoảng 6.5 m. Mục tiêu được gắn động cơ
di chuyển với tốc độ khoảng 0.5m/s. Hình 8 chỉ ra
một số frame ảnh trích từ chuỗi ảnh thu được từ
camera, minh họa khả năng bám đối tượng cũng
như tìm kiếm tự động đối tượng.
a) Frame ảnh ban đầu b) Frame ảnh thứ 4
c) Frame ảnh thứ 5 d) Frame ảnh thứ 6
e) Frame ảnh thứ 7 f) Frame ảnh thứ 8
ình 8. Chuỗi ảnh thu được sau khi thực hiện xử lí
ảnh và điều khiển hệ robot-camera.
Từ kết quả thực nghiệm thấy rằng, hệ bám mục tiêu
di động với tốc độ xử lí ảnh khoảng 15 frame/s. Với
tốc độ này, thí nghiệm cũng chỉ ra rằng, khi mục
tiêu di chuyển với tốc độ nhanh thì ảnh mục tiêu sẽ
i chuyển ra ngoài vùng quan sát của camera, do
ậy hệ sẽ không bám được mục tiêu. Các thuật xử lí
ảnh và nhận dạng sẽ được cải thiện nhằm tăng chất
lượng của hệ thống.
6. KẾT LUẬN.
Báo cáo này đã mô tả ngắn gọn hệ thống
tự động bám đối tượng di động sử dụng thông tin
phản hồi hình ảnh. Động học của hệ được xây
dựng, vị trí của đối tượng trong ảnh được nhận
dạng theo kỹ thuật đã được trình bày ở trên. Nhằm
mục đích duy trì mục tiêu ở tâm của ảnh, phương
pháp dự báo Kalman cho vị trí tiếp theo của mục