Một số khái niệm
1. Dữ liệu
Trong máy tính, thuật ngữ dữ liệu đƣợc xem nhƣ là các sự kiện đƣợc
biết đến mà có thể ghi lại và lƣu trữ trên các thiết bị ghi nhớ của máy tính. Dữ
liệu tạo nên nội dung của cơ sở dữ liệu, tuy nhiên nó không quyết định tính
hiệu quả của cơ sở dữ liệu vì tính hiệu quả đƣợc thể hiện qua việc thiết kế và
khai thác cơ sở dữ liệu.
2. Cơ sở dữ liệu
Có thể định nghĩa cơ sở dữ liệu nhƣ là một bộ sƣu tập có tổ chức của các
dữ liệu liên quan logic với nhau và đƣợc các hệ ứng dụng của một tổ chức cụ
thể nào đó sử dụng.
3. Cơ sở dữ liệu thống kê kinh tế - xã hội
Cơ sở dữ liệu thống kê kinh tế - xã hội là tập hợp có tổ chức các dữ liệu
về kinh tế và xã hội có liên quan với nhau, đƣợc cập nhật và lƣu trữ một cáchhợp lý trong các ph-ơng tiện mang tin điện tử và mạng tin học sao cho các
ch-ơng trình máy tính có thể trợ giúp ngƣời sử dụng khai thác các thông tin
từ cơ sở dữ liệu này một cách dễ dàng.
Cơ sở dữ liệu thống kờ kinh tế - xó hội gồm cơ sở dữ liệu thống kờ kinh
tế - xó hội vi mụ và cơ sở dữ liệu thống kờ kinh tế - xó hội vĩ mụ.
25 trang |
Chia sẻ: thientruc20 | Lượt xem: 536 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Nghiên cứu, xây dựng nội dung, cấu trúc cơ sở dữ liệu thống kê kinh tế - Xã hội tổng hợp quốc gia, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
45
ĐỀ TÀI KHOA HỌC
SỐ: 2.1.3-TC05-06
NGHIấN CỨU, XÂY DỰNG NỘI DUNG, CẤU TRÚC CƠ SỞ DỮ LIỆU
THỐNG Kấ KINH TẾ - XÃ HỘI TỔNG HỢP QUỐC GIA
1. Cấp đề tài : Tổng cục
2. Thời gian nghiờn cứu : 2005-2006
3. Đơn vị chủ trỡ : Vụ thống kờ Tổng hợp
4. Đơn vị quản lý : Viện Khoa học Thống kờ
5. Chủ nhiệm đề tài : CN. Nguyễn Thị Ngọc Võn
6. Những ngƣời phối hợp nghiờn cứu:
KS. Phạm Thị Thanh
TS. Trần Kim Đồng
CN. Phạm Huy Tỳ
TS. Thiều Văn Tiến
CN. Nguyễn Thị Chiến
7. Điểm đỏnh giỏ nghiệm thu đề tài: 8,75 / Xếp loại: Khỏ
46
PHẦN I
MỘT SỐ VẤN ĐỀ CHUNG VỀ CSDL TỔNG HỢP
I. Một số khỏi niệm
1. Dữ liệu
Trong mỏy tớnh, thuật ngữ dữ liệu đƣợc xem nhƣ là cỏc sự kiện đƣợc
biết đến mà cú thể ghi lại và lƣu trữ trờn cỏc thiết bị ghi nhớ của mỏy tớnh. Dữ
liệu tạo nờn nội dung của cơ sở dữ liệu, tuy nhiờn nú khụng quyết định tớnh
hiệu quả của cơ sở dữ liệu vỡ tớnh hiệu quả đƣợc thể hiện qua việc thiết kế và
khai thỏc cơ sở dữ liệu.
2. Cơ sở dữ liệu
Cú thể định nghĩa cơ sở dữ liệu nhƣ là một bộ sƣu tập cú tổ chức của cỏc
dữ liệu liờn quan logic với nhau và đƣợc cỏc hệ ứng dụng của một tổ chức cụ
thể nào đú sử dụng.
3. Cơ sở dữ liệu thống kờ kinh tế - xó hội
Cơ sở dữ liệu thống kờ kinh tế - xó hội là tập hợp cú tổ chức cỏc dữ liệu
về kinh tế và xó hội cú liờn quan với nhau, đƣợc cập nhật và lƣu trữ một cỏch
hợp lý trong các ph-ơng tiện mang tin điện tử và mạng tin học sao cho các
ch-ơng trình máy tính có thể trợ giúp ngƣời sử dụng khai thác các thông tin
từ cơ sở dữ liệu này một cách dễ dàng.
Cơ sở dữ liệu thống kờ kinh tế - xó hội gồm cơ sở dữ liệu thống kờ kinh
tế - xó hội vi mụ và cơ sở dữ liệu thống kờ kinh tế - xó hội vĩ mụ.
4. Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp
Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp là tập hợp những thụng
tin kinh tế - xó hội theo thời gian, đơn vị hành chớnh đó đƣợc tổng hợp từ kết
quả cỏc cuộc điều tra thống kờ mẫu, điều tra thống kờ toàn bộ, tổng điều tra
thống kờ; cỏc bỏo cỏo thống kờ và các nguồn thu thập khỏc. Những thụng tin
này đƣợc nhập, lƣu trữ và đƣợc tổ chức một cỏch hợp lý trong cỏc phƣơng
tiện mang tin điện tử, mạng tin học.
5. Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp quốc gia
Cơ sở dữ liệu thống kờ kinh tế - xó hội tổng hợp quốc gia là tập hợp
những dữ liệu thống kờ kinh tế - xó hội tổng hợp trờn phạm vi cả nƣớc do
ngành Thống kờ xõy dựng. Những dữ liệu này đƣợc chuẩn hoỏ, cập nhật và
lƣu trữ một cỏch hợp lý trong cỏc phƣơng tiện mang tin điện tử, mạng tin học
47
sao cho cỏc chƣơng trỡnh mỏy tớnh cú thể trợ giỳp ngƣời sử dụng đó đƣợc
phõn quyền truy nhập khai thỏc một cỏch dễ dàng, thuận tiện cỏc thụng tin
theo yờu cầu, mục đớch riờng.
6. Cỏc bảng danh mục
+ Bảng danh mục đơn vị hành chớnh
+ Bảng phõn ngành kinh tế quốc dõn
+ Bảng danh mục sản phẩm
+ Bảng danh mục nghề nghiệp
+ Bảng danh mục giỏo dục, đào tạo
+ Bảng danh mục dõn tộc Việt Nam.
PHẦN II
ĐỀ XUẤT NỘI DUNG VÀ CẤU TRÚC CSDL TỔNG HỢP
I. Một số nguyờn tắc xõy dựng CSDL tổng hợp
Vỡ CSDL tổng hợp là sản phẩm cuối cựng của ngành Thống kờ đƣợc
ứng dụng cụng nghệ tin học tuyệt đối ở tất cả cỏc bƣớc: Nhập dữ liệu, kiểm
tra dữ liệu, quản lý dữ liệu, khai thỏc dữ liệu, ngƣời dựng tin sẽ sử dụng
những dữ liệu khai thỏc đƣợc từ CSDL tổng hợp để phục vụ mục đớch nghiờn
cứu riờng của mỗi đối tƣợng nờn quỏ trỡnh xõy dựng CSDL tổng hợp phải
đảm bảo một số nguyờn tắc sau đõy:
1. CSDL tổng hợp phải đỏp ứng tốt nhất nhu cầu của người sử dụng thụng
tin thống kờ
Nhu cầu thụng tin của cỏc đối tƣợng cũng đa dạng và phong phỳ hơn,
điều này đũi hỏi ngƣời phổ biến thụng tin phải nhanh chúng tiếp cận và ứng
dụng tiến bộ của cụng nghệ thụng tin vào cụng tỏc phổ biến thụng tin để
ngƣời sử dụng cú thể tiếp cận đƣợc với thụng tin một cỏch nhanh nhất và tiện
lợi nhất.
Một số loại thụng tin thống kờ chủ yếu sau đõy đƣợc ngƣời dựng tin
quan tõm:
+ Thụng tin tổng hợp vĩ mụ
+ Thụng tin thỏng, quý, năm
+ Thụng tin chuyờn ngành
+ Thụng tin khỏc.
48
2. CSDL phải mang tớnh đồng bộ và toàn diện
Tớnh toàn diện thể hiện ở chỗ CSDL tổng hợp phải bao gồm những chỉ
tiờu liờn quan đến cỏc hoạt động kinh tế - xó hội chủ yếu đang diễn ra trong
nền kinh tế.
Tớnh đồng bộ của CSDL tổng hợp chớnh là mối liờn hệ, sự kết nối giữa
số liệu cỏc chỉ tiờu với những dữ liệu cú liờn quan đến chỉ tiờu để làm rừ hơn
về chỉ tiờu và số liệu của chỉ tiờu nhƣ: khỏi niệm/định nghĩa, nguồn số liệu,
này đƣợc để trong cỏc metadata của CSDL tổng hợp.
3. CSDL phải mang tớnh kịp thời
Dữ liệu trong CSDL tổng hợp phải đƣợc cập nhật thƣờng xuyờn, liờn
tục, trỏnh sự trậm trễ làm cho dữ liệu bị lạc hậu. Tớnh kịp thời cũn đũi hỏi
mọi sự thay đổi, điều chỉnh cú liờn quan đến dữ liệu phải đƣợc thể hiện ngay
trong CSDL tổng hợp.
4. CSDL phải đỏp ứng khả năng truy cập
Nguyờn tắc này đũi hỏi hệ quản trị CSDL phải đảm bảo hệ thống hoạt
động thƣờng xuyờn, trỏnh tỡnh trạng ngƣời sử dụng khụng truy cập đƣợc vào
bất kỳ một bảng nào của CSDL
5. CSDL phải khả thi
CSDL tổng hợp mang tớnh khả thi thể hiện ở những yếu tố sau đõy cú
khả thi hay khụng:
- Yếu tố cơ sở vật chất kỹ thuật;
- Yếu tố con ngƣời;
- Kinh phớ cũng là một nhõn tố quan trọng quyết định CSDL tổng hợp
đƣợc triển khai nhanh hay chậm và cú đảm bảo chất lƣợng tối ƣu hay khụng.
II. Nội dung và đối tƣợng sử dụng CSDL tổng hợp
1. Nội dung
1.1 Hệ thống cỏc chỉ tiờu
Nội dung chớnh của CSDL tổng hợp là những thụng tin liờn quan đến
hệ thống cỏc chỉ tiờu thống kờ, vỡ vậy cỏc chỉ tiờu này phải đƣợc lựa chọn sao
cho đảm bảo cỏc nguyờn tắc đó đƣợc đề cập trờn đõy. Hiện nay, Hệ thống chỉ
tiờu thống kờ quốc gia đƣợc Thủ tƣớng Chớnh phủ phờ duyệt và ban hành
49
theo Quyết định số 305/2005/QĐ-TTg ngày 24 thỏng 11 năm 2005 là hệ
thống chỉ tiờu thống kờ đầy đủ nhất mang tớnh phỏp lý cú thể đỏp ứng tốt nhất
nhu cầu của ngƣời sử dụng thụng tin thống kờ. Hệ thống chỉ tiờu thống kờ
quốc gia gồm 24 nhúm với 381 chỉ tiờu: (1) Nhúm chỉ tiờu về đất đai, khớ
hậu, hành chớnh 8 chỉ tiờu; (2) Nhúm chỉ tiờu về dõn số 15 chỉ tiờu; (3) Nhúm
chỉ tiờu về lao động, việc làm 15 chỉ tiờu; (4) Nhúm chỉ tiờu về cơ sở kinh tế,
hành chớnh, sự nghiệp 15 chỉ tiờu; (5) Nhúm chỉ tiờu về đầu tƣ 12 chỉ tiờu; (6)
Nhúm chỉ tiờu về tài khoản quốc gia 14 chỉ tiờu; (7) Nhúm chỉ tiờu về tài
chớnh cụng 7 chỉ tiờu; (8) Nhúm chỉ tiờu về tiền tệ, chứng khoỏn 13 chỉ tiờu;
(9) Nhúm chỉ tiờu về bảo hiểm 8 chỉ tiờu; (10) Nhúm chỉ tiờu về nụng, lõm
nghiệp và thủy sản 22 chỉ tiờu; (11) Nhúm chỉ tiờu về cụng nghiệp và xõy
dựng 10 chỉ tiờu; (12) Nhúm chỉ tiờu về thƣơng mại 16 chỉ tiờu; (13) Nhúm
chỉ tiờu về giỏ cả 8 chỉ tiờu; (14) Nhúm chỉ tiờu về du lịch 7 chỉ tiờu; (15)
Nhúm chỉ tiờu về giao thụng, vận tải 20 chỉ tiờu; (16) Nhúm chỉ tiờu về bƣu
chớnh viễn thụng 8 chỉ tiờu; (17) Nhúm chỉ tiờu về khoa học cụng nghệ 10 chỉ
tiờu; (18) Nhúm chỉ tiờu về giỏo dục và đào tạo 57 chỉ tiờu; (19) Nhúm chỉ
tiờu về y tế và chăm súc sức khoẻ 26 chỉ tiờu; (20) Nhúm chỉ tiờu về văn hoỏ,
thụng tin, thể thao 36 chỉ tiờu; (21) Nhúm chỉ tiờu về mức sống dõn cƣ 14 chỉ
tiờu; (22) Nhúm chỉ tiờu về trật tự, an toàn xó hội và tƣ phỏp 13 chỉ tiờu; (23)
Nhúm chỉ tiờu về bảo vệ mụi trƣờng 20 chỉ tiờu; (24) Nhúm chỉ tiờu về tiến
bộ phụ nữ 7 chỉ tiờu.
Trong CSDL tổng hợp, mỗi chỉ tiờu đều cú những phõn tổ, kỳ cụng bố
cũng nhƣ nguồn thu thập phự hợp với nội dung của từng chỉ tiờu (chi tiết xem
trong bỏo cỏo kết quả đề tài).
1.2. Hệ thống cỏc bảng danh mục, bảng phõn loại
Bất kỳ một hệ thống tin học húa nào cũng bao gồm một loạt cỏc danh
mục cú liờn quan để mọi dữ liệu trong CSDL của hệ thống trở nờn cú ý nghĩa.
CSDL cỏc bảng danh mục, bảng phõn loại gồm toàn bộ cỏc bảng danh mục
cú liờn quan đến phõn tổ của cỏc chỉ tiờu nhƣ: Bảng danh mục cỏc đơn vị
hành chớnh; bảng danh mục dõn tộc; bảng danh mục hàng hoỏ xuất, nhập
khẩu; bảng danh mục sản phẩm; bảng phõn ngành kinh tế quốc dõn...
Hệ thống cỏc bảng danh mục, bảng phõn loại đƣợc mó húa cú vai trũ rất
quan trọng trong việc thu thập thụng tin, xử lý thụng tin, liờn kết và chia sẻ
thụng tin.
50
1.3. Hệ thống cỏc metadata (Thụng tin siờu dữ liệu)
CSDL metadata lƣu trữ những thụng tin rất cần thiết cho ngƣời khai thỏc
CSDL tổng hợp, nội dung CSDL này gồm những khỏi niệm; định nghĩa;
phƣơng phỏp tớnh từng chỉ tiờu thống kờ; nguồn thu thập dữ liệu; thực trạng
dữ liệu (Chớnh thức hay sơ bộ/ƣớc tớnh); thời điểm thay đổi đơn vị hành
chớnh, trong đú cú sự xỏc định những thay đổi địa giới cỏc tỉnh theo thời gian.
Từ CSDL này, ngƣời sử dụng cú thể xỏc định đƣợc thời gian tồn tại, thời
điểm tỏch/nhập của cỏc tỉnh; thời điểm thay đổi cỏc bảng danh mục, bảng
phõn loại; nguyờn nhõn điều chỉnh số liệu Những thụng tin này giỳp ngƣời
dựng tin hiểu đầy đủ và chớnh xỏc hơn về nội dung, phạm vi cũng nhƣ
phƣơng phỏp tớnh của mỗi chỉ tiờu.
2. Đối tượng sử dụng CSDL tổng hợp
2.1. Nhúm người khai thỏc dữ liệu trong CSDL
2.2. Nhúm người quản trị và cập nhật dữ liệu cho CSDL tổng hợp.
III. Cấu trỳc, chức năng của CSDL tổng hợp
1. Cấu trỳc
1.1. Yờu cầu của cấu trỳc
a. Xõy dựng hệ thống mở
Xõy dựng hệ thống mở cho CSDL tổng hợp là một yờu cầu cần thiết và
gồm những nội dung sau:
- Mở về số lƣợng cỏc chỉ tiờu
- Mở về cỏc bảng danh mục, bảng phõn ngành kinh tế.
b. Kết nối với cỏc bảng danh mục, bảng phõn loại và CSDL siờu dữ liệu - metadata
c. Đảm bảo cỏc nhu cầu của ngƣời sử dụng
- Ngƣời sử dụng CSDL tổng hợp trớch xuất đƣợc dữ liệu một cỏch linh
hoạt, mềm dẻo trờn những dữ liệu đó cú trong CSDL tổng hợp.
- Thực hiện một số tớnh toỏn thụng dụng trờn dữ liệu cú trong CSDL
tổng hợp nhƣ tớnh tổng, tớnh hiệu, tớnh cơ cấu, tớnh tốc độ phỏt triển, tớnh số
trung bỡnh, v.v...
- Đƣa những dữ liệu đó trớch xuất và tớnh toỏn từ CSDL tổng hợp vào
mụi trƣờng làm việc mà họ đang sử dụng, vớ dụ nhƣ bảng tớnh MS Excel trờn
cơ sở định dạng của dữ liệu đƣa ra đảm bảo đƣợc yờu cầu cho việc nhập vào
trong cỏc mụi trƣờng khỏc.
51
- Ngƣời sử dụng cú đƣợc thụng tin về nguyờn nhõn của sự thay đổi dữ
liệu của chỉ tiờu.
- Minh họa số liệu thống kờ bằng cỏc loại đồ thị thụng dụng.
- Truy nhập đƣợc thụng tin về khỏi niệm, định nghĩa, phƣơng phỏp tớnh
cỏc chỉ tiờu, phạm vi số liệu, chu kỳ số liệu.
- Ngƣời sử dụng cú thể khai thỏc CSDL tổng hợp thụng qua ngụn ngữ
tiếng Việt và tiếng Anh.
1.2. Cấu trỳc của CSDL tổng hợp
Để thoả món những yờu cầu trờn đõy, cấu trỳc của CSDL tổng hợp phải
đƣợc thiết kế sao cho phự hợp nhất, đảm bảo tớnh ổn định và linh hoạt, khụng
bị thay đổi khi cú sự điều chỉnh bất cứ một dữ liệu nào trong hệ thống chỉ tiờu
cũng nhƣ trong cỏc bảng danh mục, cỏc bảng phõn loại của CSDL, tạo điều
kiện thuận lợi cho ngƣời sử dụng.
Trong thực tế, ngƣời ta thƣờng chia cỏc CSDL thành 03 loại: CSDL vĩ
mụ, CSDL vi mụ và CSDL cỏc chỉ tiờu. Trong đú, cấu trỳc của CSDL vi mụ
và CSDL vĩ mụ đều khụng thoả món những yờu cầu đƣợc đề cập trờn đõy.
Sau đõy chỳng ta sẽ nghiờn cứu 02 cấu trỳc chủ yếu nhất để trờn cơ sở đú
chọn lựa 01 cấu trỳc tối ƣu nhất:
Cấu trỳc 1: Số liệu cỏc chỉ tiờu được tổ chức thành cỏc bảng ba chiều:
+ Một chiều là cỏc chỉ tiờu;
+ Một chiều là cỏc đơn vị hành chớnh;
+ Một chiều là thời gian.
Với cỏc hệ thống ứng dụng khỏc nhau, cấu trỳc trờn cú thể xoay quanh
trục ba chiều trờn. Tuy nhiờn, cỏch tổ chức này cú một số bất cập sau:
Một là, hệ thống cỏc chỉ tiờu thống kờ tổng hợp cú định kỳ cung cấp khỏc
nhau cho mỗi chỉ tiờu (thỏng, quý, năm, 2 năm.); nhiều chỉ tiờu trƣớc mắt
chƣa thu thập đƣợc số liệu và do vậy trong bảng số liệu trờn sẽ cú nhiều ụ trống.
Hai là, trong CSDL tổng hợp, số liệu đƣợc thu thập từ rất nhiều nguồn,
vớ dụ chỉ tiờu dõn số cú năm đƣợc thu thập từ tổng điều tra dõn số, cú năm
đƣợc thu thập từ điều tra mẫu hay số dự bỏo, ƣớc tớnh. Thụng tin về nguồn
thu thập từ đõu là rất quan trọng đối với ngƣời sử dụng dữ liệu. Vỡ vậy, với
cấu trỳc trờn, nếu mỗi nguồn dữ liệu ứng với mỗi bảng, mỗi dũng hay mỗi chỉ
tiờu thỡ cú thể giải quyết đƣợc, nhƣng trong thực tế thỡ cú trƣờng hợp một số
ụ trong cỏc bảng trờn cú thể ứng với cỏc nguồn thu thập khỏc nhau và nhƣ
52
vậy khú cú thể đƣa ra cỏch tổ chức hợp lý nào cho việc lƣu thụng tin về
nguồn dữ liệu cho mỗi ụ của bảng.
Ba là, vỡ mỗi phõn tổ của chỉ tiờu chỉ cú thể đƣa về thành cỏc chỉ tiờu nờn
cỏch tổ chức dữ liệu theo bảng này khụng đỏp ứng đƣợc yờu cầu hệ thống mở.
Cấu trỳc 2: Với cấu trỳc này thỡ bảng dữ liệu là bảng chớnh trong CSDL
tổng hợp sẽ gồm cỏc cột sau:
+ Mó chỉ tiờu
+ Mó đơn vị hành chớnh
+ Mó thời gian
+ Mó bảng danh mục phõn tổ + mó số trong danh mục
+ Mó nguồn
+ Dữ liệu
CSDL tổng hợp này chỉ gồm một bảng dữ liệu, hoặc cũng cú thể chia
thành nhiều bảng cho từng năm, từng loại thời kỳ Bảng dữ liệu này đƣợc liờn
kết với cỏc bảng thuộc nhúm siờu dữ liệu nhƣ: Cỏc bảng danh mục; bảng phõn
ngành; định nghĩa, giải thớch, cỏch tớnh toỏn chỉ tiờu, thay đổi địa giới cỏc tỉnh
Nhƣ vậy, số liệu trong CSDL tổng hợp quốc gia là cỏc chỉ số kinh tế - xó
hội từ nhiều nguồn số liệu khỏc nhau, là số liệu của cỏc chỉ tiờu mà khụng
phải là số liệu của bảng biểu. Ở đõy, cỏc chỉ tiờu đƣợc phõn chia thành cỏc
phõn tổ nhỏ theo từng cấp để dễ dàng cho việc lựa chọn chỉ tiờu mong muốn,
cú thể sử dụng chớnh cỏch phõn loại cỏc chỉ tiờu trong hệ thống chỉ tiờu thống
kờ quốc gia để tổ chức phõn loại chỉ tiờu trong hệ thống này.
Trong hệ thống này, những giải thớch về từng chỉ tiờu (Khỏi niệm, định
nghĩa và phƣơng phỏp tớnh) là rất cần thiết cho ngƣời sử dụng số liệu. Cỏc
thụng tin giải thớch này đƣợc để riờng trong một bảng của CSDL và chức
năng khai thỏc dữ liệu cho phộp ngƣời sử dụng lấy thụng tin siờu dữ liệu này
đồng thời với việc chiết xuất dữ liệu của cỏc chỉ tiờu.
Cấu trỳc cỏc bảng trong CSDL tổng hợp cụ thể nhƣ sau:
Bảng số liệu
Đõy là bảng chớnh, bảng trung tõm của CSDL tổng hợp gồm những số
liệu của cỏc chỉ tiờu, toàn bộ dữ liệu của cỏc chỉ tiờu kinh tế - xó hội đƣợc lƣu
trữ trong một bảng vật lý của cơ sở dữ liệu cú tờn là Solieu. Bảng dữ liệu này
đƣợc liờn kết với cỏc bảng thuộc nhúm siờu dữ liệu: Cỏc bảng phõn loại, bảng
danh mục, bảng phõn tổ
53
Bảng danh mục chỉ tiờu
Bảng này chứa danh sỏch (Mó và tờn) của cỏc chỉ tiờu, bao gồm cả cỏc
phõn nhúm của chỉ tiờu. Cỏc mó nhúm, lớp dựng để phõn loại cỏc chỉ tiờu trong
hệ thống theo cỏc nhúm. Cỏc chỉ tiờu con thực chất cũng là một chỉ tiờu, đƣợc
lƣu trữ hoàn toàn giống với một chỉ tiờu nhƣng là một phõn tổ nhỏ của chỉ tiờu.
Bảng danh mục loại chỉ tiờu
Bảng này liờn quan trực tiếp đến bảng danh mục chỉ tiờu, đƣợc dựng để
xỏc định mỗi dũng trong bảng danh mục chỉ tiờu là một chỉ tiờu cụ thể, một
chỉ tiờu con hay chỉ là tờn cho một nhúm chỉ tiờu.
Bảng giải thớch
Những thụng tin giải thớch cho cỏc chỉ tiờu đƣợc thể hiện trong bảng
này, gồm toàn bộ cỏc giải thớch: Khỏi niệm, định nghĩa, phƣơng phỏp tớnh cho
từng chỉ tiờu.
Bảng danh mục loại số liệu
Trong bảng này, số liệu của chỉ tiờu đƣợc giải thớch rừ là số ƣớc tớnh, sơ
bộ hay chớnh thức.
Bảng danh mục đơn vị hành chớnh
Bảng này mụ tả tờn đơn vị hành chớnh, năm bắt đầu sử dụng danh mục
đơn vị hành chớnh, năm kết thỳc sử dụng danh mục đơn vị hành chớnh, trạng
thỏi của danh mục đơn vị hành chớnh
Bảng thay đổi danh mục đơn vị hành chớnh
Xõy dựng bảng này nhằm xỏc định những thay đổi địa giới cỏc đơn vị hành
chớnh theo thời gian. Từ bảng này cú thể xỏc định đƣợc một tỉnh đó tồn tại từ
năm nào đến năm nào, trƣớc đú đƣợc thành lập bằng cỏch tỏch ra từ tỉnh nào,
nếu hiện khụng cũn tồn tại nữa thỡ nú đó đƣợc sỏt nhập vào tỉnh nào và khi nào.
2. Chức năng
CSDL tổng hợp theo kết cấu trờn cú cỏc chức năng cơ bản sau đõy:
2.1. Quản lý danh mục hệ thống chỉ tiờu
2.2. Quản lý thụng tin mụ tả chỉ tiờu thống kờ quốc gia
2.3. Quản lý thụng tin về cỏc bảng phõn loại
2.4. Quản lý số liệu cỏc chỉ tiờu
2.5. Khai thỏc dữ liệu
2.6. Quản trị hệ thống
54
IV. Lựa chọn giải phỏp phần mềm
1. Yờu cầu
Giải phỏp phần mềm xõy dựng CSDL tổng hợp phải đảm bảo cỏc yờu cầu sau:
Đảm bảo tớnh mở của cấu trỳc CSDL tổng hợp
Đảm bảo độ tin cậy, tớnh xỏc thực của dữ liệu trong CSDL tổng hợp.
Đảm bảo tớnh an toàn thụng qua việc quản lý quyền truy nhập và cỏc
biện phỏp đảm bảo an ninh mạng và an ninh CSDL tổng hợp.
Chƣơng trỡnh ứng dụng phải phỏt triển trờn mụi trƣờng đơn giản, tiện
lợi cho nhiều ngƣời cú thể sử dụng đƣợc.
Cỏc ứng dụng khai thỏc dữ liệu phải đảm bảo tớnh mềm dẻo, cho phộp
ngƣời sử dụng lựa chọn dữ liệu theo mục đớch của họ.
2. Lựa chọn phần mềm nhập dữ liệu
Dữ liệu đầu vào của CSDL tổng hợp là dữ liệu của rất nhiều chuyờn
ngành/lĩnh vực khỏc nhau, vỡ vậy chỳng là đầu ra của rất nhiều phần mềm khỏc
nhau, hoặc cũng cú thể đú là cỏc thụng tin đƣợc trỡnh bầy trờn cỏc bỏo cỏo
bằng giấy nhƣ bỏo cỏo vốn đầu tƣ thực hiện của cỏc doanh nghiệp Nhà nƣớc;
bỏo cỏo văn hoỏ, y tế, giỏo dục; bỏo cỏo của cỏc địa phƣơngvới những cỏch
tổ chức và khuụn mẫu hoàn toàn khụng giống nhau. Do đú phải tỡm một giải
phỏp chung phự hợp để cập nhật cỏc loại thụng tin khỏc nhau cho hệ CSDL
này. Sau đõy chỳng ta sẽ phõn tớch những ƣu điểm của 03 giải phỏp chủ yếu và
những khú khăn khi ỏp dụng để từ đú lựa chọn giải phỏp tối ƣu nhất:
Giải phỏp thứ nhất: Khi cỏc thụng tin tổng hợp đƣợc tớnh toỏn trong cỏc
hệ thống xử lý/cỏc phần mềm khỏc thỡ cỏc chỉ tiờu cần thiết sẽ tự động đƣợc
chọn lọc và chuyển thẳng vào CSDL tổng hợp. Cỏch thức cập nhật dữ liệu
này là giải phỏp tốt nhất nhƣng bị phụ thuộc vào cỏc hệ thống xử lý khỏc đó
đƣợc tin học húa đến mức độ nào, cú chức năng chuyển đổi, cập nhật dữ liệu
vào CSDL tổng hợp hay chƣa. Chớnh vỡ vậy, giải phỏp này khụng phự hợp để
cập nhật dữ liệu cho CSDL tổng hợp trong điều kiện dữ liệu hiện nay của
ngành Thống kờ.
Giải phỏp thứ hai: Hệ thống CSDL tổng hợp cú chức năng đọc dữ liệu từ
một tệp dữ liệu cú cấu trỳc chuẩn và cập nhật dữ liệu cần thiết vào CSDL tổng
hợp. Ở cỏch cập nhật này, mức độ tự động thấp hơn so với cỏch thứ nhất,
nhƣng nú cú thể đỏp ứng cho cả những chỉ tiờu chƣa đƣợc tin học húa việc xử
lý mà đƣợc tớnh toỏn bằng phần mềm nhƣ EXCEL hay một số phần mềm tớnh
55
toỏn khỏc. Việc thiết kế và lập chƣơng trỡnh để đọc dữ liệu từ một tệp chuẩn và
chuyển vào CSDL tổng hợp khụng khú nhƣng tệp dữ liệu lại phải rất chuẩn
xỏc. Khú khăn ở đõy chớnh là dữ liệu cần thu thập cho CSDL tổng hợp rất đa
dạng nờn việc tạo ra cỏc tệp EXCEL chuẩn xỏc khụng hề đơn giản, tốn kộm
cụng sức. Đõy chớnh là nguyờn nhõn làm cho giải phỏp cập nhật này khụng
hiệu quả và khụng đƣợc chọn để ứng dụng cho CSDL tổng hợp.
Giải phỏp thứ ba: là giải phỏp đƣợc coi là khả thi nhất hiện nay, theo
giải phỏp này thỡ dữ liệu đƣợc cập nhật từ bàn phớm, đõy là cỏch nhập truyền
thống, một thuận lợi cơ bản khi thực hiện giải phỏp này là hiện nay phần lớn
cỏc thụng tin thống kờ tổng hợp đều đó nằm ở dạng cỏc tệp dữ liệu văn
bản/bảng tớnh điện tử, vỡ vậy modun nhập dữ liệu từ bàn phớm chỉ cần đƣợc
thiết kế sao cho đảm bảo tớnh linh hoạt, giỳp ngƣời nhập dữ liệu cú thể tạo ra
cỏc form bảng/biểu xoay đƣợc nhiều chiều và thứ tự cỏc dũng/cột khụng
cứng nhắc đỳng nhƣ trong danh mục cỏc phõn loại mà nguợc lại, ngƣời nhập
dữ liệu cú thể thay đổi thứ tự này hoặc chỉ lựa chọn một phần cỏc dũng/cột
cần thiết, nhờ vậy họ cú thể “copy” dữ liệu từ mụi trƣờng bờn ngoài và dỏn
vào “form” nhập liệu thay vỡ phải gừ lại vừa tốn kộm cụng sức vừa dễ sai sút.
3. Lựa chọn phần mềm khai thỏc dữ liệu
Việc khai thỏc CSDL tổng hợp của ngƣời sử dụng thụng tin thống kờ
trong và ngoài nƣớc sẽ đƣợc thực hiện qua mạng Internet thụng qua chƣơng
trỡnh ứng dụng trờn Web, đõy là giải phỏp đơn giản và hiệu quả nhất hiện
nay. Trong chƣơng trỡnh ứng dụng này, dựa trờn những giao diện đơn giản,
ngƣời sử dụng cú thể trớch xuất dữ liệu mà họ cần từ CSDL tổng hợp