Nghiên cứu, xây dựng nội dung, cấu trúc cơ sở dữ liệu thống kê kinh tế - Xã hội tổng hợp quốc gia

Một số khái niệm 1. Dữ liệu Trong máy tính, thuật ngữ dữ liệu đƣợc xem nhƣ là các sự kiện đƣợc biết đến mà có thể ghi lại và lƣu trữ trên các thiết bị ghi nhớ của máy tính. Dữ liệu tạo nên nội dung của cơ sở dữ liệu, tuy nhiên nó không quyết định tính hiệu quả của cơ sở dữ liệu vì tính hiệu quả đƣợc thể hiện qua việc thiết kế và khai thác cơ sở dữ liệu. 2. Cơ sở dữ liệu Có thể định nghĩa cơ sở dữ liệu nhƣ là một bộ sƣu tập có tổ chức của các dữ liệu liên quan logic với nhau và đƣợc các hệ ứng dụng của một tổ chức cụ thể nào đó sử dụng. 3. Cơ sở dữ liệu thống kê kinh tế - xã hội Cơ sở dữ liệu thống kê kinh tế - xã hội là tập hợp có tổ chức các dữ liệu về kinh tế và xã hội có liên quan với nhau, đƣợc cập nhật và lƣu trữ một cáchhợp lý trong các ph-ơng tiện mang tin điện tử và mạng tin học sao cho các ch-ơng trình máy tính có thể trợ giúp ngƣời sử dụng khai thác các thông tin từ cơ sở dữ liệu này một cách dễ dàng. Cơ sở dữ liệu thống kờ kinh tế - xó hội gồm cơ sở dữ liệu thống kờ kinh tế - xó hội vi mụ và cơ sở dữ liệu thống kờ kinh tế - xó hội vĩ mụ.

pdf25 trang | Chia sẻ: thientruc20 | Lượt xem: 536 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Nghiên cứu, xây dựng nội dung, cấu trúc cơ sở dữ liệu thống kê kinh tế - Xã hội tổng hợp quốc gia, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
45 ĐỀ TÀI KHOA HỌC SỐ: 2.1.3-TC05-06 NGHIấN CỨU, XÂY DỰNG NỘI DUNG, CẤU TRÚC CƠ SỞ DỮ LIỆU THỐNG Kấ KINH TẾ - XÃ HỘI TỔNG HỢP QUỐC GIA 1. Cấp đề tài : Tổng cục 2. Thời gian nghiờn cứu : 2005-2006 3. Đơn vị chủ trỡ : Vụ thống kờ Tổng hợp 4. Đơn vị quản lý : Viện Khoa học Thống kờ 5. Chủ nhiệm đề tài : CN. Nguyễn Thị Ngọc Võn 6. Những ngƣời phối hợp nghiờn cứu: KS. Phạm Thị Thanh TS. Trần Kim Đồng CN. Phạm Huy Tỳ TS. Thiều Văn Tiến CN. Nguyễn Thị Chiến 7. Điểm đỏnh giỏ nghiệm thu đề tài: 8,75 / Xếp loại: Khỏ 46 PHẦN I MỘT SỐ VẤN ĐỀ CHUNG VỀ CSDL TỔNG HỢP I. Một số khỏi niệm 1. Dữ liệu Trong mỏy tớnh, thuật ngữ dữ liệu đƣợc xem nhƣ là cỏc sự kiện đƣợc biết đến mà cú thể ghi lại và lƣu trữ trờn cỏc thiết bị ghi nhớ của mỏy tớnh. Dữ liệu tạo nờn nội dung của cơ sở dữ liệu, tuy nhiờn nú khụng quyết định tớnh hiệu quả của cơ sở dữ liệu vỡ tớnh hiệu quả đƣợc thể hiện qua việc thiết kế và khai thỏc cơ sở dữ liệu. 2. Cơ sở dữ liệu Cú thể định nghĩa cơ sở dữ liệu nhƣ là một bộ sƣu tập cú tổ chức của cỏc dữ liệu liờn quan logic với nhau và đƣợc cỏc hệ ứng dụng của một tổ chức cụ thể nào đú sử dụng. 3. Cơ sở dữ liệu thống kờ kinh tế - xó hội Cơ sở dữ liệu thống kờ kinh tế - xó hội là tập hợp cú tổ chức cỏc dữ liệu về kinh tế và xó hội cú liờn quan với nhau, đƣợc cập nhật và lƣu trữ một cỏch hợp lý trong các ph-ơng tiện mang tin điện tử và mạng tin học sao cho các ch-ơng trình máy tính có thể trợ giúp ngƣời sử dụng khai thác các thông tin từ cơ sở dữ liệu này một cách dễ dàng. Cơ sở dữ liệu thống kờ kinh tế - xó hội gồm cơ sở dữ liệu thống kờ kinh tế - xó hội vi mụ và cơ sở dữ liệu thống kờ kinh tế - xó hội vĩ mụ. 4. Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp là tập hợp những thụng tin kinh tế - xó hội theo thời gian, đơn vị hành chớnh đó đƣợc tổng hợp từ kết quả cỏc cuộc điều tra thống kờ mẫu, điều tra thống kờ toàn bộ, tổng điều tra thống kờ; cỏc bỏo cỏo thống kờ và các nguồn thu thập khỏc. Những thụng tin này đƣợc nhập, lƣu trữ và đƣợc tổ chức một cỏch hợp lý trong cỏc phƣơng tiện mang tin điện tử, mạng tin học. 5. Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp quốc gia Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp quốc gia là tập hợp những dữ liệu thống kờ kinh tế - xó hội tổng hợp trờn phạm vi cả nƣớc do ngành Thống kờ xõy dựng. Những dữ liệu này đƣợc chuẩn hoỏ, cập nhật và lƣu trữ một cỏch hợp lý trong cỏc phƣơng tiện mang tin điện tử, mạng tin học 47 sao cho cỏc chƣơng trỡnh mỏy tớnh cú thể trợ giỳp ngƣời sử dụng đó đƣợc phõn quyền truy nhập khai thỏc một cỏch dễ dàng, thuận tiện cỏc thụng tin theo yờu cầu, mục đớch riờng. 6. Cỏc bảng danh mục + Bảng danh mục đơn vị hành chớnh + Bảng phõn ngành kinh tế quốc dõn + Bảng danh mục sản phẩm + Bảng danh mục nghề nghiệp + Bảng danh mục giỏo dục, đào tạo + Bảng danh mục dõn tộc Việt Nam. PHẦN II ĐỀ XUẤT NỘI DUNG VÀ CẤU TRÚC CSDL TỔNG HỢP I. Một số nguyờn tắc xõy dựng CSDL tổng hợp Vỡ CSDL tổng hợp là sản phẩm cuối cựng của ngành Thống kờ đƣợc ứng dụng cụng nghệ tin học tuyệt đối ở tất cả cỏc bƣớc: Nhập dữ liệu, kiểm tra dữ liệu, quản lý dữ liệu, khai thỏc dữ liệu, ngƣời dựng tin sẽ sử dụng những dữ liệu khai thỏc đƣợc từ CSDL tổng hợp để phục vụ mục đớch nghiờn cứu riờng của mỗi đối tƣợng nờn quỏ trỡnh xõy dựng CSDL tổng hợp phải đảm bảo một số nguyờn tắc sau đõy: 1. CSDL tổng hợp phải đỏp ứng tốt nhất nhu cầu của người sử dụng thụng tin thống kờ Nhu cầu thụng tin của cỏc đối tƣợng cũng đa dạng và phong phỳ hơn, điều này đũi hỏi ngƣời phổ biến thụng tin phải nhanh chúng tiếp cận và ứng dụng tiến bộ của cụng nghệ thụng tin vào cụng tỏc phổ biến thụng tin để ngƣời sử dụng cú thể tiếp cận đƣợc với thụng tin một cỏch nhanh nhất và tiện lợi nhất. Một số loại thụng tin thống kờ chủ yếu sau đõy đƣợc ngƣời dựng tin quan tõm: + Thụng tin tổng hợp vĩ mụ + Thụng tin thỏng, quý, năm + Thụng tin chuyờn ngành + Thụng tin khỏc. 48 2. CSDL phải mang tớnh đồng bộ và toàn diện Tớnh toàn diện thể hiện ở chỗ CSDL tổng hợp phải bao gồm những chỉ tiờu liờn quan đến cỏc hoạt động kinh tế - xó hội chủ yếu đang diễn ra trong nền kinh tế. Tớnh đồng bộ của CSDL tổng hợp chớnh là mối liờn hệ, sự kết nối giữa số liệu cỏc chỉ tiờu với những dữ liệu cú liờn quan đến chỉ tiờu để làm rừ hơn về chỉ tiờu và số liệu của chỉ tiờu nhƣ: khỏi niệm/định nghĩa, nguồn số liệu, này đƣợc để trong cỏc metadata của CSDL tổng hợp. 3. CSDL phải mang tớnh kịp thời Dữ liệu trong CSDL tổng hợp phải đƣợc cập nhật thƣờng xuyờn, liờn tục, trỏnh sự trậm trễ làm cho dữ liệu bị lạc hậu. Tớnh kịp thời cũn đũi hỏi mọi sự thay đổi, điều chỉnh cú liờn quan đến dữ liệu phải đƣợc thể hiện ngay trong CSDL tổng hợp. 4. CSDL phải đỏp ứng khả năng truy cập Nguyờn tắc này đũi hỏi hệ quản trị CSDL phải đảm bảo hệ thống hoạt động thƣờng xuyờn, trỏnh tỡnh trạng ngƣời sử dụng khụng truy cập đƣợc vào bất kỳ một bảng nào của CSDL 5. CSDL phải khả thi CSDL tổng hợp mang tớnh khả thi thể hiện ở những yếu tố sau đõy cú khả thi hay khụng: - Yếu tố cơ sở vật chất kỹ thuật; - Yếu tố con ngƣời; - Kinh phớ cũng là một nhõn tố quan trọng quyết định CSDL tổng hợp đƣợc triển khai nhanh hay chậm và cú đảm bảo chất lƣợng tối ƣu hay khụng. II. Nội dung và đối tƣợng sử dụng CSDL tổng hợp 1. Nội dung 1.1 Hệ thống cỏc chỉ tiờu Nội dung chớnh của CSDL tổng hợp là những thụng tin liờn quan đến hệ thống cỏc chỉ tiờu thống kờ, vỡ vậy cỏc chỉ tiờu này phải đƣợc lựa chọn sao cho đảm bảo cỏc nguyờn tắc đó đƣợc đề cập trờn đõy. Hiện nay, Hệ thống chỉ tiờu thống kờ quốc gia đƣợc Thủ tƣớng Chớnh phủ phờ duyệt và ban hành 49 theo Quyết định số 305/2005/QĐ-TTg ngày 24 thỏng 11 năm 2005 là hệ thống chỉ tiờu thống kờ đầy đủ nhất mang tớnh phỏp lý cú thể đỏp ứng tốt nhất nhu cầu của ngƣời sử dụng thụng tin thống kờ. Hệ thống chỉ tiờu thống kờ quốc gia gồm 24 nhúm với 381 chỉ tiờu: (1) Nhúm chỉ tiờu về đất đai, khớ hậu, hành chớnh 8 chỉ tiờu; (2) Nhúm chỉ tiờu về dõn số 15 chỉ tiờu; (3) Nhúm chỉ tiờu về lao động, việc làm 15 chỉ tiờu; (4) Nhúm chỉ tiờu về cơ sở kinh tế, hành chớnh, sự nghiệp 15 chỉ tiờu; (5) Nhúm chỉ tiờu về đầu tƣ 12 chỉ tiờu; (6) Nhúm chỉ tiờu về tài khoản quốc gia 14 chỉ tiờu; (7) Nhúm chỉ tiờu về tài chớnh cụng 7 chỉ tiờu; (8) Nhúm chỉ tiờu về tiền tệ, chứng khoỏn 13 chỉ tiờu; (9) Nhúm chỉ tiờu về bảo hiểm 8 chỉ tiờu; (10) Nhúm chỉ tiờu về nụng, lõm nghiệp và thủy sản 22 chỉ tiờu; (11) Nhúm chỉ tiờu về cụng nghiệp và xõy dựng 10 chỉ tiờu; (12) Nhúm chỉ tiờu về thƣơng mại 16 chỉ tiờu; (13) Nhúm chỉ tiờu về giỏ cả 8 chỉ tiờu; (14) Nhúm chỉ tiờu về du lịch 7 chỉ tiờu; (15) Nhúm chỉ tiờu về giao thụng, vận tải 20 chỉ tiờu; (16) Nhúm chỉ tiờu về bƣu chớnh viễn thụng 8 chỉ tiờu; (17) Nhúm chỉ tiờu về khoa học cụng nghệ 10 chỉ tiờu; (18) Nhúm chỉ tiờu về giỏo dục và đào tạo 57 chỉ tiờu; (19) Nhúm chỉ tiờu về y tế và chăm súc sức khoẻ 26 chỉ tiờu; (20) Nhúm chỉ tiờu về văn hoỏ, thụng tin, thể thao 36 chỉ tiờu; (21) Nhúm chỉ tiờu về mức sống dõn cƣ 14 chỉ tiờu; (22) Nhúm chỉ tiờu về trật tự, an toàn xó hội và tƣ phỏp 13 chỉ tiờu; (23) Nhúm chỉ tiờu về bảo vệ mụi trƣờng 20 chỉ tiờu; (24) Nhúm chỉ tiờu về tiến bộ phụ nữ 7 chỉ tiờu. Trong CSDL tổng hợp, mỗi chỉ tiờu đều cú những phõn tổ, kỳ cụng bố cũng nhƣ nguồn thu thập phự hợp với nội dung của từng chỉ tiờu (chi tiết xem trong bỏo cỏo kết quả đề tài). 1.2. Hệ thống cỏc bảng danh mục, bảng phõn loại Bất kỳ một hệ thống tin học húa nào cũng bao gồm một loạt cỏc danh mục cú liờn quan để mọi dữ liệu trong CSDL của hệ thống trở nờn cú ý nghĩa. CSDL cỏc bảng danh mục, bảng phõn loại gồm toàn bộ cỏc bảng danh mục cú liờn quan đến phõn tổ của cỏc chỉ tiờu nhƣ: Bảng danh mục cỏc đơn vị hành chớnh; bảng danh mục dõn tộc; bảng danh mục hàng hoỏ xuất, nhập khẩu; bảng danh mục sản phẩm; bảng phõn ngành kinh tế quốc dõn... Hệ thống cỏc bảng danh mục, bảng phõn loại đƣợc mó húa cú vai trũ rất quan trọng trong việc thu thập thụng tin, xử lý thụng tin, liờn kết và chia sẻ thụng tin. 50 1.3. Hệ thống cỏc metadata (Thụng tin siờu dữ liệu) CSDL metadata lƣu trữ những thụng tin rất cần thiết cho ngƣời khai thỏc CSDL tổng hợp, nội dung CSDL này gồm những khỏi niệm; định nghĩa; phƣơng phỏp tớnh từng chỉ tiờu thống kờ; nguồn thu thập dữ liệu; thực trạng dữ liệu (Chớnh thức hay sơ bộ/ƣớc tớnh); thời điểm thay đổi đơn vị hành chớnh, trong đú cú sự xỏc định những thay đổi địa giới cỏc tỉnh theo thời gian. Từ CSDL này, ngƣời sử dụng cú thể xỏc định đƣợc thời gian tồn tại, thời điểm tỏch/nhập của cỏc tỉnh; thời điểm thay đổi cỏc bảng danh mục, bảng phõn loại; nguyờn nhõn điều chỉnh số liệu Những thụng tin này giỳp ngƣời dựng tin hiểu đầy đủ và chớnh xỏc hơn về nội dung, phạm vi cũng nhƣ phƣơng phỏp tớnh của mỗi chỉ tiờu. 2. Đối tượng sử dụng CSDL tổng hợp 2.1. Nhúm người khai thỏc dữ liệu trong CSDL 2.2. Nhúm người quản trị và cập nhật dữ liệu cho CSDL tổng hợp. III. Cấu trỳc, chức năng của CSDL tổng hợp 1. Cấu trỳc 1.1. Yờu cầu của cấu trỳc a. Xõy dựng hệ thống mở Xõy dựng hệ thống mở cho CSDL tổng hợp là một yờu cầu cần thiết và gồm những nội dung sau: - Mở về số lƣợng cỏc chỉ tiờu - Mở về cỏc bảng danh mục, bảng phõn ngành kinh tế. b. Kết nối với cỏc bảng danh mục, bảng phõn loại và CSDL siờu dữ liệu - metadata c. Đảm bảo cỏc nhu cầu của ngƣời sử dụng - Ngƣời sử dụng CSDL tổng hợp trớch xuất đƣợc dữ liệu một cỏch linh hoạt, mềm dẻo trờn những dữ liệu đó cú trong CSDL tổng hợp. - Thực hiện một số tớnh toỏn thụng dụng trờn dữ liệu cú trong CSDL tổng hợp nhƣ tớnh tổng, tớnh hiệu, tớnh cơ cấu, tớnh tốc độ phỏt triển, tớnh số trung bỡnh, v.v... - Đƣa những dữ liệu đó trớch xuất và tớnh toỏn từ CSDL tổng hợp vào mụi trƣờng làm việc mà họ đang sử dụng, vớ dụ nhƣ bảng tớnh MS Excel trờn cơ sở định dạng của dữ liệu đƣa ra đảm bảo đƣợc yờu cầu cho việc nhập vào trong cỏc mụi trƣờng khỏc. 51 - Ngƣời sử dụng cú đƣợc thụng tin về nguyờn nhõn của sự thay đổi dữ liệu của chỉ tiờu. - Minh họa số liệu thống kờ bằng cỏc loại đồ thị thụng dụng. - Truy nhập đƣợc thụng tin về khỏi niệm, định nghĩa, phƣơng phỏp tớnh cỏc chỉ tiờu, phạm vi số liệu, chu kỳ số liệu. - Ngƣời sử dụng cú thể khai thỏc CSDL tổng hợp thụng qua ngụn ngữ tiếng Việt và tiếng Anh. 1.2. Cấu trỳc của CSDL tổng hợp Để thoả món những yờu cầu trờn đõy, cấu trỳc của CSDL tổng hợp phải đƣợc thiết kế sao cho phự hợp nhất, đảm bảo tớnh ổn định và linh hoạt, khụng bị thay đổi khi cú sự điều chỉnh bất cứ một dữ liệu nào trong hệ thống chỉ tiờu cũng nhƣ trong cỏc bảng danh mục, cỏc bảng phõn loại của CSDL, tạo điều kiện thuận lợi cho ngƣời sử dụng. Trong thực tế, ngƣời ta thƣờng chia cỏc CSDL thành 03 loại: CSDL vĩ mụ, CSDL vi mụ và CSDL cỏc chỉ tiờu. Trong đú, cấu trỳc của CSDL vi mụ và CSDL vĩ mụ đều khụng thoả món những yờu cầu đƣợc đề cập trờn đõy. Sau đõy chỳng ta sẽ nghiờn cứu 02 cấu trỳc chủ yếu nhất để trờn cơ sở đú chọn lựa 01 cấu trỳc tối ƣu nhất: Cấu trỳc 1: Số liệu cỏc chỉ tiờu được tổ chức thành cỏc bảng ba chiều: + Một chiều là cỏc chỉ tiờu; + Một chiều là cỏc đơn vị hành chớnh; + Một chiều là thời gian. Với cỏc hệ thống ứng dụng khỏc nhau, cấu trỳc trờn cú thể xoay quanh trục ba chiều trờn. Tuy nhiờn, cỏch tổ chức này cú một số bất cập sau: Một là, hệ thống cỏc chỉ tiờu thống kờ tổng hợp cú định kỳ cung cấp khỏc nhau cho mỗi chỉ tiờu (thỏng, quý, năm, 2 năm.); nhiều chỉ tiờu trƣớc mắt chƣa thu thập đƣợc số liệu và do vậy trong bảng số liệu trờn sẽ cú nhiều ụ trống. Hai là, trong CSDL tổng hợp, số liệu đƣợc thu thập từ rất nhiều nguồn, vớ dụ chỉ tiờu dõn số cú năm đƣợc thu thập từ tổng điều tra dõn số, cú năm đƣợc thu thập từ điều tra mẫu hay số dự bỏo, ƣớc tớnh. Thụng tin về nguồn thu thập từ đõu là rất quan trọng đối với ngƣời sử dụng dữ liệu. Vỡ vậy, với cấu trỳc trờn, nếu mỗi nguồn dữ liệu ứng với mỗi bảng, mỗi dũng hay mỗi chỉ tiờu thỡ cú thể giải quyết đƣợc, nhƣng trong thực tế thỡ cú trƣờng hợp một số ụ trong cỏc bảng trờn cú thể ứng với cỏc nguồn thu thập khỏc nhau và nhƣ 52 vậy khú cú thể đƣa ra cỏch tổ chức hợp lý nào cho việc lƣu thụng tin về nguồn dữ liệu cho mỗi ụ của bảng. Ba là, vỡ mỗi phõn tổ của chỉ tiờu chỉ cú thể đƣa về thành cỏc chỉ tiờu nờn cỏch tổ chức dữ liệu theo bảng này khụng đỏp ứng đƣợc yờu cầu hệ thống mở. Cấu trỳc 2: Với cấu trỳc này thỡ bảng dữ liệu là bảng chớnh trong CSDL tổng hợp sẽ gồm cỏc cột sau: + Mó chỉ tiờu + Mó đơn vị hành chớnh + Mó thời gian + Mó bảng danh mục phõn tổ + mó số trong danh mục + Mó nguồn + Dữ liệu CSDL tổng hợp này chỉ gồm một bảng dữ liệu, hoặc cũng cú thể chia thành nhiều bảng cho từng năm, từng loại thời kỳ Bảng dữ liệu này đƣợc liờn kết với cỏc bảng thuộc nhúm siờu dữ liệu nhƣ: Cỏc bảng danh mục; bảng phõn ngành; định nghĩa, giải thớch, cỏch tớnh toỏn chỉ tiờu, thay đổi địa giới cỏc tỉnh Nhƣ vậy, số liệu trong CSDL tổng hợp quốc gia là cỏc chỉ số kinh tế - xó hội từ nhiều nguồn số liệu khỏc nhau, là số liệu của cỏc chỉ tiờu mà khụng phải là số liệu của bảng biểu. Ở đõy, cỏc chỉ tiờu đƣợc phõn chia thành cỏc phõn tổ nhỏ theo từng cấp để dễ dàng cho việc lựa chọn chỉ tiờu mong muốn, cú thể sử dụng chớnh cỏch phõn loại cỏc chỉ tiờu trong hệ thống chỉ tiờu thống kờ quốc gia để tổ chức phõn loại chỉ tiờu trong hệ thống này. Trong hệ thống này, những giải thớch về từng chỉ tiờu (Khỏi niệm, định nghĩa và phƣơng phỏp tớnh) là rất cần thiết cho ngƣời sử dụng số liệu. Cỏc thụng tin giải thớch này đƣợc để riờng trong một bảng của CSDL và chức năng khai thỏc dữ liệu cho phộp ngƣời sử dụng lấy thụng tin siờu dữ liệu này đồng thời với việc chiết xuất dữ liệu của cỏc chỉ tiờu. Cấu trỳc cỏc bảng trong CSDL tổng hợp cụ thể nhƣ sau:  Bảng số liệu Đõy là bảng chớnh, bảng trung tõm của CSDL tổng hợp gồm những số liệu của cỏc chỉ tiờu, toàn bộ dữ liệu của cỏc chỉ tiờu kinh tế - xó hội đƣợc lƣu trữ trong một bảng vật lý của cơ sở dữ liệu cú tờn là Solieu. Bảng dữ liệu này đƣợc liờn kết với cỏc bảng thuộc nhúm siờu dữ liệu: Cỏc bảng phõn loại, bảng danh mục, bảng phõn tổ 53  Bảng danh mục chỉ tiờu Bảng này chứa danh sỏch (Mó và tờn) của cỏc chỉ tiờu, bao gồm cả cỏc phõn nhúm của chỉ tiờu. Cỏc mó nhúm, lớp dựng để phõn loại cỏc chỉ tiờu trong hệ thống theo cỏc nhúm. Cỏc chỉ tiờu con thực chất cũng là một chỉ tiờu, đƣợc lƣu trữ hoàn toàn giống với một chỉ tiờu nhƣng là một phõn tổ nhỏ của chỉ tiờu.  Bảng danh mục loại chỉ tiờu Bảng này liờn quan trực tiếp đến bảng danh mục chỉ tiờu, đƣợc dựng để xỏc định mỗi dũng trong bảng danh mục chỉ tiờu là một chỉ tiờu cụ thể, một chỉ tiờu con hay chỉ là tờn cho một nhúm chỉ tiờu.  Bảng giải thớch Những thụng tin giải thớch cho cỏc chỉ tiờu đƣợc thể hiện trong bảng này, gồm toàn bộ cỏc giải thớch: Khỏi niệm, định nghĩa, phƣơng phỏp tớnh cho từng chỉ tiờu.  Bảng danh mục loại số liệu Trong bảng này, số liệu của chỉ tiờu đƣợc giải thớch rừ là số ƣớc tớnh, sơ bộ hay chớnh thức.  Bảng danh mục đơn vị hành chớnh Bảng này mụ tả tờn đơn vị hành chớnh, năm bắt đầu sử dụng danh mục đơn vị hành chớnh, năm kết thỳc sử dụng danh mục đơn vị hành chớnh, trạng thỏi của danh mục đơn vị hành chớnh  Bảng thay đổi danh mục đơn vị hành chớnh Xõy dựng bảng này nhằm xỏc định những thay đổi địa giới cỏc đơn vị hành chớnh theo thời gian. Từ bảng này cú thể xỏc định đƣợc một tỉnh đó tồn tại từ năm nào đến năm nào, trƣớc đú đƣợc thành lập bằng cỏch tỏch ra từ tỉnh nào, nếu hiện khụng cũn tồn tại nữa thỡ nú đó đƣợc sỏt nhập vào tỉnh nào và khi nào. 2. Chức năng CSDL tổng hợp theo kết cấu trờn cú cỏc chức năng cơ bản sau đõy: 2.1. Quản lý danh mục hệ thống chỉ tiờu 2.2. Quản lý thụng tin mụ tả chỉ tiờu thống kờ quốc gia 2.3. Quản lý thụng tin về cỏc bảng phõn loại 2.4. Quản lý số liệu cỏc chỉ tiờu 2.5. Khai thỏc dữ liệu 2.6. Quản trị hệ thống 54 IV. Lựa chọn giải phỏp phần mềm 1. Yờu cầu Giải phỏp phần mềm xõy dựng CSDL tổng hợp phải đảm bảo cỏc yờu cầu sau:  Đảm bảo tớnh mở của cấu trỳc CSDL tổng hợp  Đảm bảo độ tin cậy, tớnh xỏc thực của dữ liệu trong CSDL tổng hợp.  Đảm bảo tớnh an toàn thụng qua việc quản lý quyền truy nhập và cỏc biện phỏp đảm bảo an ninh mạng và an ninh CSDL tổng hợp.  Chƣơng trỡnh ứng dụng phải phỏt triển trờn mụi trƣờng đơn giản, tiện lợi cho nhiều ngƣời cú thể sử dụng đƣợc.  Cỏc ứng dụng khai thỏc dữ liệu phải đảm bảo tớnh mềm dẻo, cho phộp ngƣời sử dụng lựa chọn dữ liệu theo mục đớch của họ. 2. Lựa chọn phần mềm nhập dữ liệu Dữ liệu đầu vào của CSDL tổng hợp là dữ liệu của rất nhiều chuyờn ngành/lĩnh vực khỏc nhau, vỡ vậy chỳng là đầu ra của rất nhiều phần mềm khỏc nhau, hoặc cũng cú thể đú là cỏc thụng tin đƣợc trỡnh bầy trờn cỏc bỏo cỏo bằng giấy nhƣ bỏo cỏo vốn đầu tƣ thực hiện của cỏc doanh nghiệp Nhà nƣớc; bỏo cỏo văn hoỏ, y tế, giỏo dục; bỏo cỏo của cỏc địa phƣơngvới những cỏch tổ chức và khuụn mẫu hoàn toàn khụng giống nhau. Do đú phải tỡm một giải phỏp chung phự hợp để cập nhật cỏc loại thụng tin khỏc nhau cho hệ CSDL này. Sau đõy chỳng ta sẽ phõn tớch những ƣu điểm của 03 giải phỏp chủ yếu và những khú khăn khi ỏp dụng để từ đú lựa chọn giải phỏp tối ƣu nhất: Giải phỏp thứ nhất: Khi cỏc thụng tin tổng hợp đƣợc tớnh toỏn trong cỏc hệ thống xử lý/cỏc phần mềm khỏc thỡ cỏc chỉ tiờu cần thiết sẽ tự động đƣợc chọn lọc và chuyển thẳng vào CSDL tổng hợp. Cỏch thức cập nhật dữ liệu này là giải phỏp tốt nhất nhƣng bị phụ thuộc vào cỏc hệ thống xử lý khỏc đó đƣợc tin học húa đến mức độ nào, cú chức năng chuyển đổi, cập nhật dữ liệu vào CSDL tổng hợp hay chƣa. Chớnh vỡ vậy, giải phỏp này khụng phự hợp để cập nhật dữ liệu cho CSDL tổng hợp trong điều kiện dữ liệu hiện nay của ngành Thống kờ. Giải phỏp thứ hai: Hệ thống CSDL tổng hợp cú chức năng đọc dữ liệu từ một tệp dữ liệu cú cấu trỳc chuẩn và cập nhật dữ liệu cần thiết vào CSDL tổng hợp. Ở cỏch cập nhật này, mức độ tự động thấp hơn so với cỏch thứ nhất, nhƣng nú cú thể đỏp ứng cho cả những chỉ tiờu chƣa đƣợc tin học húa việc xử lý mà đƣợc tớnh toỏn bằng phần mềm nhƣ EXCEL hay một số phần mềm tớnh 55 toỏn khỏc. Việc thiết kế và lập chƣơng trỡnh để đọc dữ liệu từ một tệp chuẩn và chuyển vào CSDL tổng hợp khụng khú nhƣng tệp dữ liệu lại phải rất chuẩn xỏc. Khú khăn ở đõy chớnh là dữ liệu cần thu thập cho CSDL tổng hợp rất đa dạng nờn việc tạo ra cỏc tệp EXCEL chuẩn xỏc khụng hề đơn giản, tốn kộm cụng sức. Đõy chớnh là nguyờn nhõn làm cho giải phỏp cập nhật này khụng hiệu quả và khụng đƣợc chọn để ứng dụng cho CSDL tổng hợp. Giải phỏp thứ ba: là giải phỏp đƣợc coi là khả thi nhất hiện nay, theo giải phỏp này thỡ dữ liệu đƣợc cập nhật từ bàn phớm, đõy là cỏch nhập truyền thống, một thuận lợi cơ bản khi thực hiện giải phỏp này là hiện nay phần lớn cỏc thụng tin thống kờ tổng hợp đều đó nằm ở dạng cỏc tệp dữ liệu văn bản/bảng tớnh điện tử, vỡ vậy modun nhập dữ liệu từ bàn phớm chỉ cần đƣợc thiết kế sao cho đảm bảo tớnh linh hoạt, giỳp ngƣời nhập dữ liệu cú thể tạo ra cỏc form bảng/biểu xoay đƣợc nhiều chiều và thứ tự cỏc dũng/cột khụng cứng nhắc đỳng nhƣ trong danh mục cỏc phõn loại mà nguợc lại, ngƣời nhập dữ liệu cú thể thay đổi thứ tự này hoặc chỉ lựa chọn một phần cỏc dũng/cột cần thiết, nhờ vậy họ cú thể “copy” dữ liệu từ mụi trƣờng bờn ngoài và dỏn vào “form” nhập liệu thay vỡ phải gừ lại vừa tốn kộm cụng sức vừa dễ sai sút. 3. Lựa chọn phần mềm khai thỏc dữ liệu Việc khai thỏc CSDL tổng hợp của ngƣời sử dụng thụng tin thống kờ trong và ngoài nƣớc sẽ đƣợc thực hiện qua mạng Internet thụng qua chƣơng trỡnh ứng dụng trờn Web, đõy là giải phỏp đơn giản và hiệu quả nhất hiện nay. Trong chƣơng trỡnh ứng dụng này, dựa trờn những giao diện đơn giản, ngƣời sử dụng cú thể trớch xuất dữ liệu mà họ cần từ CSDL tổng hợp
Luận văn liên quan