1. Khái niệm cơ bản về cơ sở dữ liệu
a. Cơ sở dữ liệu (CSDL) là gì?
b. Ưu điểm của CSDL
2. Các loại thông tin trong hệ thống thông tin địa lí
3. Kiến trúc một hệ cơ sở dữ liệu
4. Các loại mô hình dữ liệu cơ bản
a. Mô hình quan hệ (Relational Data Model)
b. Mô hình phân cấp (Hierarchical Data Model)
c. Mô hình mạng (Network Data Model)
5. Tính độc lập dữ liệu
6.Hệ quản trịcơ sở dữ liệu của GIS
7. Kết luận
34 trang |
Chia sẻ: tuandn | Lượt xem: 3108 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Đề tài Tổ chức cơ sở dữ liệu trong GIS, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
KỸ THUẬT THÔNG TIN ĐỊA LÝ
(Geograpgic Information System (GIS)
Đề tài: TỔ CHỨC CƠ SỞ DỮ LIỆU
TRONG GIS
TRƯỜNG ĐẠI HỌC ĐỒNG THÁP
Khoa Địa lý
Nội dung
1. Khái niệm cơ bản về cơ sở dữ liệu
a. Cơ sở dữ liệu (CSDL) là gì?
b. Ưu điểm của CSDL
2. Các loại thông tin trong hệ thống thông tin địa lí
3. Kiến trúc một hệ cơ sở dữ liệu
4. Các loại mô hình dữ liệu cơ bản
a. Mô hình quan hệ (Relational Data Model)
b. Mô hình phân cấp (Hierarchical Data Model)
c. Mô hình mạng (Network Data Model)
5. Tính độc lập dữ liệu
6..Hệ quản trị cơ sở dữ liệu của GIS
7. Kết luận
1. Khái niệm cơ bản về cơ sở dữ liệu
a. Cơ sở dữ liệu (CSDL) là gì?
Định nghĩa CSDL (DataBase)
CSDL là một tập hợp các dữ liệu được lưu trữ để phục vụ
các hệ thống ứng dụng.
Hệ quản trị CSDL (DBMS-DataBase Management System)
Phần chương trình để có thể xử lý, thay đổi tập hợp các
dữ liệu này
Như một bộ diễn dịch (Interpreter) với ngôn ngữ bậc cao
1. Khái niệm cơ bản về cơ sở dữ liệu
b. Ưu điểm của CSDL
Tại sao ngươi ta cần lưu trữ dữ liệu trong một tổ
hợp như CSDL?
CSDL cung cấp một sự điều khiển tập trung đối với các
dữ liệu trong CSDL.
Các phần tử trong hệ thống CSDL
1. Khái niệm cơ bản về cơ sở dữ liệu
b. Ưu điểm của CSDL ...(tiếp)
Những ưu điểm của sự điều khiển tập trung
Giảm sự dư thừa dữ liệu cần lưu trữ.
Có thể tránh được những xung đột về dữ liệu được lưu trữ.
Có thể dùng chung dữ liệu đã được lưu trữ .
Có thể chuẩn hoá dữ liệu giúp đơn giản hoá các vấn đề về bảo hành
và trao đổi dữ liệu giữa các lần cài đặt.
Có thể áp dụng các phương pháp bảo mật với dữ liệu.
Duy trì được sự thống nhất dữ liệu để đảm bảo CSDL chỉ chứa dữ
liệu chính xác.
Có thể cân đối được các đòi hỏi xung đột nhau.
Dữ liệu là độc lập, độc lập với cấu trúc bộ nhớ, với phương pháp lưu
trữ và tiếp cận thông tin.
Đảm bảo quy tắc toàn vẹn dữ liệu.
2. Các loại thông tin trong hệ thống thông
tin địa lí
Có 2 loại:
Dữ liệu địa lí
• Ảnh hàng không vũ trụ
• Bản đồ trực ảnh (orthophotomap)
• Bản đồ nền địa hình lập từ ảnh hàng không-vũ trụ
• Bản đồ địa hình lập từ số liệu đo đạc mặt đất
• Bản đồ địa chính
• Bản đồ dịa lí tổng hợp từ các loại bản đồ địa hình.
2. Các loại thông tin trong hệ thống thông
tin địa lí(tt)
Các loại ảnh và bản đồ đều ở dạng số và lưu lại
dưới dạng vector hoặc raster hỗn hợp raster-
vector.
Dạng vector được phân theo lớp.
Dạng raster là các thông tin nguồn và các
thông tin hỗ trợ, không gian quản lí. Các đối
tượng raster thể hiện ở 3 dạng: điểm, đường,
vùng hoặc miền.
2. Các loại thông tin trong hệ thống thông
tin địa lí ( tt)
Dữ liệu thuộc tính
Dùng để giải thích cho các hiện tượng địa lí gằn
với hiện tượng địa lí.
3. Kiến trúc một hệ cơ sở dữ liệu
Người sữ dụng 1
Người sữ dụng 2
Khung nhìn 1
Khung nhìn 2
Người sữ dụng n Khung nhìn n
CSDL mức
khái niệm
(logic)
CSDL
mức vật lí
Hệ quản trị
CSDL
Hình 1: Cấu trúc hệ cơ sở dữ liệu
3. Kiến trúc một hệ cơ sở dữ liệu
Hệ quản trị cơ
Sở dữ liệu
Cơ sở
Dữ liệu
Yêu cầu của
Người sữ dụng
Môi trường hệ điều hành
Thông tin
ra
Hình 2: Sơ đồ tổng quát hệ cơ sở dữ liệu
a) Các mức của kiến trúc
Mức vật lý ( mức trong)
Là các tệp dữ liệu theo một cấu trúc nào đó được lưu
trên các thiết bị nhớ ngoài (đĩa từ,..).
Liên hệ với cấu trúc lưu trữ ngoài
Mức khái niệm
Là một sự biểu diễn trừu tượng của mức vật lý
Thực chất đây là mức logic của toàn bộ CSDL
3. Kiến trúc một hệ cơ sở dữ liệu
Khung nhìn (mức ngoài )
Là cách nhìn, quan niệm của từng người sử dụng
CSDL vì vậy còn gọi là "khung nhìn".
Có nhiều "cách nhìn ở khung nhìn" khác nhau. Mỗi
cách bao gồm sự biểu diễn trừu tượng của một phần
nào đó của CSDL.
3. Kiến trúc một hệ cơ sở dữ liệu
b) Các khái niệm
Khái niệm "thể hiện" (instance)
Dữ liệu hiện có trong CSDL gọi là "thể hiện" của
CSDL.
Mặc dù dữ liệu có thể thay đổi trong một chu kỳ
thời gian nào đó nhưng "bộ khung" của CSDL vẫn
không thay đổi.
3. Kiến trúc một hệ cơ sở dữ liệu (tt)
3. Kiến trúc một hệ cơ sở dữ liệu(tt)
Khái niệm "lược đồ" (schema)
Giữa các thực thể có thể có những mối quan hệ nào đó với
nhau vì vậy người ta thường dùng thuật ngữ "lược đồ"
thay cho "bộ khung".
Thiết kế tổng quan CSDL goi là lược đồ. Gồm:
- Lược đồ khái niệm.
- Lược đồ vật lí.
- Lược đồ con.
Mô hình dữ liệu
- Sự hình thức hóa toán học với tập hợp các ký hiệu để mô
tả và tập các phép toán được dùng để thao tác đối với
các dữ liệu
Một số mô hình dữ liệu cơ bản
- Mô hình quan hệ (Relational Model).
- Mô hình lưới ( Network Model).
- Mô hình phân cấp (Hierarchical Model).
4. Các loại mô hình dữ liệu cơ bản
4. Các loại mô hình dữ liệu cơ bản(tt)
2 3 5
fa
b
cI II
1 4 6d g
2 b 3
a I c
1 d 4
3 e 5
c II f
g4 6
Bản đồ A Đa giác I
Đa giác II
a. Mô hình quan hệ (Relational Data Model)
Mô hình dựa trên cơ sở khái niệm lý thuyết tập hợp của
các quan hệ, tức là tập các k-bộ với k cố định.
Là một bản 2 chiều tiệp độc lập. Trong đó mỗi cột
(trường) là một tập thuộc tính, mỗi hàng (bộ) là một đối
tượng
Hình 3 : biểu diễn bản đồ A bằng mô hình quan hệ
a. Mô hình quan hệ (Relational Data Model)
A I II
I a b c d
II c e f g
I a 1 2
I b 2 3
I c 3 4
I d 4 1
II e 3 5
II f 5 6
II g 6 4
II c 4 3
Bản đồ A
Đa giác
Đường
Ưu điểm
Đặc điểm nổi bật của cấu trúc dữ liệu
quan hệ là các mối kết nối giữa các bộ (các
hàng) được biểu thị chặt chẽ bởi các giá trị
dữ liệu trong các cột được rút ra từ một
miền chung
Qua quan sát, nhận thấy cấu trúc quan hệ
rất đơn giản, dễ hiểu
Mô hình quan hệ có sự thống nhất trong
tập các phép toán
a. Mô hình quan hệ (Relational Data Model)
Ưu điểm….(tiếp)
Có tính độc lập dữ liệu rất cao, dễ dàng sử
dụng
Không có dị thường xảy ra đối với thao tác
lưu trữ cơ bản
- Phép chèn (INSERT)
- Phép xoá (DELETE)
- Phép thay đổi (UPDATE)
a.Mô hình quan hệ (Relational Data Model)
b. Mô hình phân cấp (Hierarchical Data Model)
Cạnh a
Đỉnh
A
I II
a b c d c e gf
1 2 3 44 1 4 3 3 5 5 6 6 42 3
Hình 4 : Biểu diễn bản đồ A bằng mô hình phân cấp
Nhận xét qua ví dụ:
1. Trong mô hình phân cấp, các thực thể quan hệ với
nhau thông qua cấu trúc cây, tất cả tạo nên một
rừng cây
Người sử dụng thấy bốn cây tách biệt nhau, hay còn gọi là
bốn thể hiện phân cấp, mỗi cây thể hiện cho một
Mỗi cây thể hiện một bản ghi về bản đồ A gồm dữ liệu 2
đa giác, kèm theo dữ liệu đường chung và cặp tọa độ
Kiểu dữ liệu của thực thể đóng vai trò như một gốc (root)
b. Mô hình phân cấp (Hierarchical Data Model)
2. Đặc điểm
Trong thủ tục truy xuất đến một đối tượng trong
mô hình phân cấp là đường dẫn đi từ gốc đến
phần từ cần xét trong cây phân cấp
Phù hợp những hình thức phân cấp tổ chức trong
xã hội
Thường gặp trong hệ thống máy tính: Mô hình
quản lí thư mục
Ngôn ngữ con dữ liệu phức tạp hơn so với ngôn
ngữ con dữ liệu của mô hình quan hệ
b. Mô hình phân cấp (Hierarchical Data Model)
2. Đặc điểm………(tiếp)
Tồn tại các dị thường đối với các thao tác lưu
trữ cơ bản
-Phép chèn
-Phép xoá
-Phép thay đổi
Bất tiện cho việc lưu trữ và khai thác xử lý
Lưu trữ số lớn con trỏ mốc nối gây phức tạp quá
trình cập nhật ,biến đổi dữ liệu
b. Mô hình phân cấp (Hierarchical Data Model)
c. Mô hình mạng (Network Data Model)
A
I II
a b c d
1 2 3 4
e f g
5 6
Là phép dùng một mô hình đồ thị trực tiếp và đơn giản
cho dữ liệu
Hình 5 : Biểu diển bản đồ A bằng mô hình lưới
1. Nhược điểm chính của mô hình mạng là sự phức
tạp, phức tạp từ cấu trúc của chính mô hình đến
ngôn ngữ con dữ liệu có liên quan đến nó
Nguồn gốc của sự phức tạp này nằm ở khối lượng thông
tin về cấu trúc của mô hình dữ liệu này
Thông tin phải bao gồm hai phần:
bản ghi
mối liên kết
Các cấu trúc dữ liệu này rất gần với cấu trúc bộ nhớ
c. Mô hình mạng (Network Data Model)
Tầm quan trọng
Tính độc lập dữ liệu là mục tiêu chủ yếu của các
CSDL
J. Date định nghĩa:
Tính độc lập dữ liệu là "tính bất biến của các hệ
ứng dụng đối với các thay đổi trong cấu trúc lưu
trữ và chiến lược truy cập"
Phân loại mức độ độc lập
Theo sơ đồ kiến trúc của hệ thống CSDL
(Hình1) cho thấy có hai mức "độc lập dữ liệu":
Độc lập dữ liệu ở mức logic
Độc lập dữ liệu ở mức vật lý
5. Tính độc lập dữ liệu
Độc lập dữ liệu ở mức logic
Vấn đề đặt ra:
Có thể cần thiết phải thay đổi lược đồ khái niệm
như thêm thông tin các loại khác nhau của các thực
thể hoặc bớt, xoá các thông tin về các thực thể đang
tồn tại trong CSDL.
Độc lập dữ liệu ở mức logic
Việc thay đổi lược đồ khái niệm không làm ảnh
hưởng tới các lược đồ con đang tồn tại, do đó không
cần thiết phải thay đổi các chương trình ứng dụng
=> độc lập dữ liệu mức logic
5. Tính độc lập dữ liệu(tt)
Độc lập dữ liệu ở mức vật lý
Vấn đề đặt ra:
Lược đồ vật lý có thể thay đổi do người quản trị
CSDL mà không cần thay đổi lược đồ con
Độc lập dữ liệu ở mức vật lý
Việc tổ chức lại CSDL vật lý (thay đổi các tổ chức, cấu
trúc dữ liệu trên các thiết bị nhớ thứ cấp) có thể làm
thay đổi hiệu quả tính toán của các chương trình ứng
dụng nhưng không đòi hỏi phải viết lại các chương
trình đó => độc lập dữ liệu mức vật lý
5. Tính độc lập dữ liệu(tt)
6. Hệ quản trị cơ sở dữ iệu
Hệ thống quản lí, lưu trử, bảo trì toàn bộ cơ sở dữ liệu.
Cung cấp công cu tra cứu, hỏi đáp và tác động vào
CSDL
Gồm 3 dữ liệu con:
Cho cơ sở dữ liệu địa lý
Quan hệ ở mức tra cứu hỏi đáp
Thuộc tính
6. Hệ quản trị cơ sở dữ liệu(tt)
Hệ quản trị CSDL không gian gồm hệ thống con
sau:
Hệ thống nhập bản đồ
Hệ thống hiển thị bản đồ
Hệ thống hỏi đáp tra cứu CSDL
Hệ thống phân tích địa lý
Hệ thống phân tích thống kê
Hệ thống đầu ra
Một hệ CSDL phải có khả năng biểu diễn hai
dạng đối tượng:
Các "thực thể" ("entities")
Các kết nối ("associations")
Sự khác nhau giữa ba loại mô hình đã xét (mô
hình quan hệ, mô hình phân cấp, mô hình
mạng):
Thể hiện ở cách thức cho phép người sử dụng quan
sát và thao tác các kết nối
7. Kết luận
Mô hình quan hệ có nhiều ưu điểm và được
nhiều người quan tâm hơn cả vì:
Mô hình dữ liệu quan hệ có tính độc lập dữ liệu cao
Mô hình dữ liệu quan hệ dễ sử dụng
Điều quan trọng hơn cả, mô hình quan hệ được
hình thức hoá toán học tốt, do đó được nghiên cứu
phát triển và cho được nhiều kết quả lý thuyết
cũng như ứng dụng trong thực tiễn
7. Kết luận (tiếp theo)
Good luck to you!