Đề tài Tổ chức cơ sở dữ liệu trong GIS

1. Khái niệm cơ bản về cơ sở dữ liệu a. Cơ sở dữ liệu (CSDL) là gì? b. Ưu điểm của CSDL 2. Các loại thông tin trong hệ thống thông tin địa lí 3. Kiến trúc một hệ cơ sở dữ liệu 4. Các loại mô hình dữ liệu cơ bản a. Mô hình quan hệ (Relational Data Model) b. Mô hình phân cấp (Hierarchical Data Model) c. Mô hình mạng (Network Data Model) 5. Tính độc lập dữ liệu 6.Hệ quản trịcơ sở dữ liệu của GIS 7. Kết luận

pdf34 trang | Chia sẻ: tuandn | Lượt xem: 2968 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Đề tài Tổ chức cơ sở dữ liệu trong GIS, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
KỸ THUẬT THÔNG TIN ĐỊA LÝ (Geograpgic Information System (GIS) Đề tài: TỔ CHỨC CƠ SỞ DỮ LIỆU TRONG GIS TRƯỜNG ĐẠI HỌC ĐỒNG THÁP Khoa Địa lý Nội dung 1. Khái niệm cơ bản về cơ sở dữ liệu a. Cơ sở dữ liệu (CSDL) là gì? b. Ưu điểm của CSDL 2. Các loại thông tin trong hệ thống thông tin địa lí 3. Kiến trúc một hệ cơ sở dữ liệu 4. Các loại mô hình dữ liệu cơ bản a. Mô hình quan hệ (Relational Data Model) b. Mô hình phân cấp (Hierarchical Data Model) c. Mô hình mạng (Network Data Model) 5. Tính độc lập dữ liệu 6..Hệ quản trị cơ sở dữ liệu của GIS 7. Kết luận 1. Khái niệm cơ bản về cơ sở dữ liệu a. Cơ sở dữ liệu (CSDL) là gì?  Định nghĩa CSDL (DataBase)  CSDL là một tập hợp các dữ liệu được lưu trữ để phục vụ các hệ thống ứng dụng.  Hệ quản trị CSDL (DBMS-DataBase Management System)  Phần chương trình để có thể xử lý, thay đổi tập hợp các dữ liệu này  Như một bộ diễn dịch (Interpreter) với ngôn ngữ bậc cao 1. Khái niệm cơ bản về cơ sở dữ liệu b. Ưu điểm của CSDL  Tại sao ngươi ta cần lưu trữ dữ liệu trong một tổ hợp như CSDL?  CSDL cung cấp một sự điều khiển tập trung đối với các dữ liệu trong CSDL.  Các phần tử trong hệ thống CSDL 1. Khái niệm cơ bản về cơ sở dữ liệu b. Ưu điểm của CSDL ...(tiếp)  Những ưu điểm của sự điều khiển tập trung  Giảm sự dư thừa dữ liệu cần lưu trữ.  Có thể tránh được những xung đột về dữ liệu được lưu trữ.  Có thể dùng chung dữ liệu đã được lưu trữ .  Có thể chuẩn hoá dữ liệu giúp đơn giản hoá các vấn đề về bảo hành và trao đổi dữ liệu giữa các lần cài đặt.  Có thể áp dụng các phương pháp bảo mật với dữ liệu.  Duy trì được sự thống nhất dữ liệu để đảm bảo CSDL chỉ chứa dữ liệu chính xác.  Có thể cân đối được các đòi hỏi xung đột nhau.  Dữ liệu là độc lập, độc lập với cấu trúc bộ nhớ, với phương pháp lưu trữ và tiếp cận thông tin.  Đảm bảo quy tắc toàn vẹn dữ liệu. 2. Các loại thông tin trong hệ thống thông tin địa lí Có 2 loại: Dữ liệu địa lí • Ảnh hàng không vũ trụ • Bản đồ trực ảnh (orthophotomap) • Bản đồ nền địa hình lập từ ảnh hàng không-vũ trụ • Bản đồ địa hình lập từ số liệu đo đạc mặt đất • Bản đồ địa chính • Bản đồ dịa lí tổng hợp từ các loại bản đồ địa hình. 2. Các loại thông tin trong hệ thống thông tin địa lí(tt) Các loại ảnh và bản đồ đều ở dạng số và lưu lại dưới dạng vector hoặc raster hỗn hợp raster- vector. Dạng vector được phân theo lớp. Dạng raster là các thông tin nguồn và các thông tin hỗ trợ, không gian quản lí. Các đối tượng raster thể hiện ở 3 dạng: điểm, đường, vùng hoặc miền. 2. Các loại thông tin trong hệ thống thông tin địa lí ( tt) Dữ liệu thuộc tính Dùng để giải thích cho các hiện tượng địa lí gằn với hiện tượng địa lí. 3. Kiến trúc một hệ cơ sở dữ liệu Người sữ dụng 1 Người sữ dụng 2 Khung nhìn 1 Khung nhìn 2 Người sữ dụng n Khung nhìn n CSDL mức khái niệm (logic) CSDL mức vật lí Hệ quản trị CSDL Hình 1: Cấu trúc hệ cơ sở dữ liệu 3. Kiến trúc một hệ cơ sở dữ liệu Hệ quản trị cơ Sở dữ liệu Cơ sở Dữ liệu Yêu cầu của Người sữ dụng Môi trường hệ điều hành Thông tin ra Hình 2: Sơ đồ tổng quát hệ cơ sở dữ liệu a) Các mức của kiến trúc  Mức vật lý ( mức trong)  Là các tệp dữ liệu theo một cấu trúc nào đó được lưu trên các thiết bị nhớ ngoài (đĩa từ,..).  Liên hệ với cấu trúc lưu trữ ngoài  Mức khái niệm  Là một sự biểu diễn trừu tượng của mức vật lý  Thực chất đây là mức logic của toàn bộ CSDL 3. Kiến trúc một hệ cơ sở dữ liệu Khung nhìn (mức ngoài )  Là cách nhìn, quan niệm của từng người sử dụng CSDL vì vậy còn gọi là "khung nhìn".  Có nhiều "cách nhìn ở khung nhìn" khác nhau. Mỗi cách bao gồm sự biểu diễn trừu tượng của một phần nào đó của CSDL. 3. Kiến trúc một hệ cơ sở dữ liệu b) Các khái niệm  Khái niệm "thể hiện" (instance)  Dữ liệu hiện có trong CSDL gọi là "thể hiện" của CSDL.  Mặc dù dữ liệu có thể thay đổi trong một chu kỳ thời gian nào đó nhưng "bộ khung" của CSDL vẫn không thay đổi. 3. Kiến trúc một hệ cơ sở dữ liệu (tt) 3. Kiến trúc một hệ cơ sở dữ liệu(tt)  Khái niệm "lược đồ" (schema)  Giữa các thực thể có thể có những mối quan hệ nào đó với nhau vì vậy người ta thường dùng thuật ngữ "lược đồ" thay cho "bộ khung".  Thiết kế tổng quan CSDL goi là lược đồ. Gồm: - Lược đồ khái niệm. - Lược đồ vật lí. - Lược đồ con.  Mô hình dữ liệu - Sự hình thức hóa toán học với tập hợp các ký hiệu để mô tả và tập các phép toán được dùng để thao tác đối với các dữ liệu  Một số mô hình dữ liệu cơ bản - Mô hình quan hệ (Relational Model). - Mô hình lưới ( Network Model). - Mô hình phân cấp (Hierarchical Model). 4. Các loại mô hình dữ liệu cơ bản 4. Các loại mô hình dữ liệu cơ bản(tt) 2 3 5 fa b cI II 1 4 6d g 2 b 3 a I c 1 d 4 3 e 5 c II f g4 6 Bản đồ A Đa giác I Đa giác II a. Mô hình quan hệ (Relational Data Model)  Mô hình dựa trên cơ sở khái niệm lý thuyết tập hợp của các quan hệ, tức là tập các k-bộ với k cố định.  Là một bản 2 chiều tiệp độc lập. Trong đó mỗi cột (trường) là một tập thuộc tính, mỗi hàng (bộ) là một đối tượng Hình 3 : biểu diễn bản đồ A bằng mô hình quan hệ a. Mô hình quan hệ (Relational Data Model) A I II I a b c d II c e f g I a 1 2 I b 2 3 I c 3 4 I d 4 1 II e 3 5 II f 5 6 II g 6 4 II c 4 3 Bản đồ A Đa giác Đường Ưu điểm  Đặc điểm nổi bật của cấu trúc dữ liệu quan hệ là các mối kết nối giữa các bộ (các hàng) được biểu thị chặt chẽ bởi các giá trị dữ liệu trong các cột được rút ra từ một miền chung  Qua quan sát, nhận thấy cấu trúc quan hệ rất đơn giản, dễ hiểu  Mô hình quan hệ có sự thống nhất trong tập các phép toán a. Mô hình quan hệ (Relational Data Model) Ưu điểm….(tiếp)  Có tính độc lập dữ liệu rất cao, dễ dàng sử dụng  Không có dị thường xảy ra đối với thao tác lưu trữ cơ bản - Phép chèn (INSERT) - Phép xoá (DELETE) - Phép thay đổi (UPDATE) a.Mô hình quan hệ (Relational Data Model) b. Mô hình phân cấp (Hierarchical Data Model) Cạnh a Đỉnh A I II a b c d c e gf 1 2 3 44 1 4 3 3 5 5 6 6 42 3 Hình 4 : Biểu diễn bản đồ A bằng mô hình phân cấp Nhận xét qua ví dụ: 1. Trong mô hình phân cấp, các thực thể quan hệ với nhau thông qua cấu trúc cây, tất cả tạo nên một rừng cây  Người sử dụng thấy bốn cây tách biệt nhau, hay còn gọi là bốn thể hiện phân cấp, mỗi cây thể hiện cho một  Mỗi cây thể hiện một bản ghi về bản đồ A gồm dữ liệu 2 đa giác, kèm theo dữ liệu đường chung và cặp tọa độ  Kiểu dữ liệu của thực thể đóng vai trò như một gốc (root) b. Mô hình phân cấp (Hierarchical Data Model) 2. Đặc điểm  Trong thủ tục truy xuất đến một đối tượng trong mô hình phân cấp là đường dẫn đi từ gốc đến phần từ cần xét trong cây phân cấp  Phù hợp những hình thức phân cấp tổ chức trong xã hội  Thường gặp trong hệ thống máy tính: Mô hình quản lí thư mục  Ngôn ngữ con dữ liệu phức tạp hơn so với ngôn ngữ con dữ liệu của mô hình quan hệ b. Mô hình phân cấp (Hierarchical Data Model) 2. Đặc điểm………(tiếp)  Tồn tại các dị thường đối với các thao tác lưu trữ cơ bản -Phép chèn -Phép xoá -Phép thay đổi  Bất tiện cho việc lưu trữ và khai thác xử lý  Lưu trữ số lớn con trỏ mốc nối gây phức tạp quá trình cập nhật ,biến đổi dữ liệu b. Mô hình phân cấp (Hierarchical Data Model) c. Mô hình mạng (Network Data Model) A I II a b c d 1 2 3 4 e f g 5 6 Là phép dùng một mô hình đồ thị trực tiếp và đơn giản cho dữ liệu Hình 5 : Biểu diển bản đồ A bằng mô hình lưới 1. Nhược điểm chính của mô hình mạng là sự phức tạp, phức tạp từ cấu trúc của chính mô hình đến ngôn ngữ con dữ liệu có liên quan đến nó  Nguồn gốc của sự phức tạp này nằm ở khối lượng thông tin về cấu trúc của mô hình dữ liệu này  Thông tin phải bao gồm hai phần:  bản ghi  mối liên kết  Các cấu trúc dữ liệu này rất gần với cấu trúc bộ nhớ c. Mô hình mạng (Network Data Model)  Tầm quan trọng  Tính độc lập dữ liệu là mục tiêu chủ yếu của các CSDL  J. Date định nghĩa:  Tính độc lập dữ liệu là "tính bất biến của các hệ ứng dụng đối với các thay đổi trong cấu trúc lưu trữ và chiến lược truy cập"  Phân loại mức độ độc lập  Theo sơ đồ kiến trúc của hệ thống CSDL (Hình1) cho thấy có hai mức "độc lập dữ liệu":  Độc lập dữ liệu ở mức logic  Độc lập dữ liệu ở mức vật lý 5. Tính độc lập dữ liệu  Độc lập dữ liệu ở mức logic  Vấn đề đặt ra:  Có thể cần thiết phải thay đổi lược đồ khái niệm như thêm thông tin các loại khác nhau của các thực thể hoặc bớt, xoá các thông tin về các thực thể đang tồn tại trong CSDL.  Độc lập dữ liệu ở mức logic  Việc thay đổi lược đồ khái niệm không làm ảnh hưởng tới các lược đồ con đang tồn tại, do đó không cần thiết phải thay đổi các chương trình ứng dụng => độc lập dữ liệu mức logic 5. Tính độc lập dữ liệu(tt)  Độc lập dữ liệu ở mức vật lý  Vấn đề đặt ra:  Lược đồ vật lý có thể thay đổi do người quản trị CSDL mà không cần thay đổi lược đồ con  Độc lập dữ liệu ở mức vật lý  Việc tổ chức lại CSDL vật lý (thay đổi các tổ chức, cấu trúc dữ liệu trên các thiết bị nhớ thứ cấp) có thể làm thay đổi hiệu quả tính toán của các chương trình ứng dụng nhưng không đòi hỏi phải viết lại các chương trình đó => độc lập dữ liệu mức vật lý 5. Tính độc lập dữ liệu(tt) 6. Hệ quản trị cơ sở dữ iệu Hệ thống quản lí, lưu trử, bảo trì toàn bộ cơ sở dữ liệu. Cung cấp công cu tra cứu, hỏi đáp và tác động vào CSDL Gồm 3 dữ liệu con:  Cho cơ sở dữ liệu địa lý Quan hệ ở mức tra cứu hỏi đáp Thuộc tính 6. Hệ quản trị cơ sở dữ liệu(tt) Hệ quản trị CSDL không gian gồm hệ thống con sau:  Hệ thống nhập bản đồ  Hệ thống hiển thị bản đồ  Hệ thống hỏi đáp tra cứu CSDL  Hệ thống phân tích địa lý  Hệ thống phân tích thống kê  Hệ thống đầu ra  Một hệ CSDL phải có khả năng biểu diễn hai dạng đối tượng:  Các "thực thể" ("entities")  Các kết nối ("associations")  Sự khác nhau giữa ba loại mô hình đã xét (mô hình quan hệ, mô hình phân cấp, mô hình mạng):  Thể hiện ở cách thức cho phép người sử dụng quan sát và thao tác các kết nối 7. Kết luận  Mô hình quan hệ có nhiều ưu điểm và được nhiều người quan tâm hơn cả vì:  Mô hình dữ liệu quan hệ có tính độc lập dữ liệu cao  Mô hình dữ liệu quan hệ dễ sử dụng  Điều quan trọng hơn cả, mô hình quan hệ được hình thức hoá toán học tốt, do đó được nghiên cứu phát triển và cho được nhiều kết quả lý thuyết cũng như ứng dụng trong thực tiễn 7. Kết luận (tiếp theo) Good luck to you!