Luận văn Khai phá dữ liệu và phát hiện luật kết hợp trong cơ sở dữ liệu lớn

Một tổ chức thương mại có thể sản sinh ra dữ liệu trong hoạt động kinh doanh mà để ghi chép lại có thể phải mất cả đời người. Tình trạng này càng tăng lên kể từ khi xuất hiện mạng toàn cầu Internet. Mỗi ngày có hàng trăm megabyte, thậm chí nhiều hơn thế dữ liệu được đưa lên Internet. Trong tình trạng bội thực về dữ liệu như vậy, chúng ta phải đối mặt với nghịch lý mới về khai thác dữ liệu: càng nhiều dữ liệu, càng ít thông tin. Hiện nay, cũng như trong tương lai, các nhà kinh doanh, nhà khoa học hoặc tổ chức thương mại không thể đủ thời gian và khả năng đọc và diễn giải theo cách cổ điển tất cả các dữ liệu sang những thông tin cần thiết. Tuy nhiên, yêu cầu về thông tin không vì thế giảm đi, mà ngày càng trở nên cần thiết hơn bao giờ hết đã buộc chúng ta phải đề ra và thực hiện các chiến lược và phương pháp chọn, lọc và diễn giải dữ liệu thành các thông tin hữu ích. Như thế, các tổ chức bị ngập chìm trong đống dữ liệu khổng lồ, đặc biệt trong một số lĩnh vực tài chính, ngân hàng, thị trường chứng khoán và kinh doanh thương mại, sẽ có cơ hội khai thác dữ liệu hiệu quả để phát triển. Mục đích của luận văn là nghiên cứu, tổng hợp kiến thức về khai phá dữ liệu trong khung nhìn của quá trình phát hiện tri thức đồng thời, chú ý đến dự báo phân lớp nhờ kỹ thuật cây quyết định và đặc biệt đi sâu tìm hiểu nhiệm vụ phát hiện luật kết hợp trong cơ sở dữ liệu lớn.

docx88 trang | Chia sẻ: tuandn | Lượt xem: 2004 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Luận văn Khai phá dữ liệu và phát hiện luật kết hợp trong cơ sở dữ liệu lớn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên