Đồ án Nghiên cứu chuẩn quốc tế về dữ liệu từ điển, xây dựng Website tra từ điển theo chuẩn

Ngôn ngữ như ta nói hằng ngày có vô vàn nghĩa và cách diễn đạt, mỗi quốc gia có một ngôn ngữ riêng. Với xu hướng toàn cầu hóa hiện nay việc học các ngôn ngữ của nhau là một tất yếu, vì thế rất nhiều phần mềm tra từ với nhiều ngôn ngữ ra đời. Hiện nay có rất nhiều chương trình tra từ điển được phát triển rất thành công bao gồm cả phần mềm online và offline. Việc xây dựng từ điển khó nhất là xây dựng bộ dữ liệu. Với mỗi loại từ điển ta quy định việc dây dựng dữ liệu làm sao cho phải đúng quy chuẩn, định dạng, và chuẩn đó làm sao phải thật tiện lợi cho việc tìm kiếm, tra cứu của người dùng. Hiện nay với sự phát triển rộng rãi của Internet, mọi nhu cầu của con người đều được Internet phục vụ, cũng vì thế mà nó luôn gắn liền với mọi người ở mọi lứa tuổi với mọi nhu cầu công việc. Vì thế mà rất nhiều từ điển online ra đời nhằm đáp ứng nhu cầu đó. Với ưu điểm nhanh, tiện lợi, không phải cài đặt,miễn phí ở đâu có Net là ở đó có từ điển. Ngoài ra từ điển online cũng là nơi kết nối cộng đồng giúp mọi người trao đổi học tập kiến thức ngoại ngữ với nhau. Dù vậy từ điển online cũng có nhiều nhược điểm mà ở từ điển offline mới có.

doc66 trang | Chia sẻ: tuandn | Ngày: 24/05/2013 | Lượt xem: 2014 | Lượt tải: 9download
Bạn đang xem nội dung tài liệu Đồ án Nghiên cứu chuẩn quốc tế về dữ liệu từ điển, xây dựng Website tra từ điển theo chuẩn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
LỜI CẢM ƠN Trong suốt quá trình thực hiện đồ án tốt nghiệp “Nghiên cứu chuẩn quốc tế về dữ liệu từ điển, xây dựng website tra từ điển theo chuẩn”, ngoài sự cố gắng hết mình của bản thân, em đã nhận được sự giúp đỡ nhiệt tình từ phía nhà trường, thầy cô , gia đình và bạn bè. Em xin gửi lời cảm ơn sâu sắc đến thầy – Th.S Tô Hữu Nguyên đã tận tình giúp đỡ em trong suốt quá trình làm đồ án. Em xin chân thành cảm ơn các thầy cô trường ĐH công nghệ thông tin và truyền thông đã truyền đạt những kiến thức quý báu cho em trong suốt quá trình học tập. Mặc dù đã cố gắng hoàn thiện đề tài nhưng do hạn chế về thời gian cũng như kinh nghiệm nên vẫn có nhiều điều thiếu sót, mong được sự thông cảm và góp ý của các thầy cô, bạn bè để chương trình hoàn thiện hơn. Em xin chân thành cảm ơn ! LỜI CAM ĐOAN Em xin cam đoan về nội dung đồ án tốt nghiệp với tên đề tài “Nghiên cứu chuẩn quốc tế về dữ liệu từ điển, xây dựng website tra từ điển theo chuẩn” là không sao chép nội dung cơ bản từ các đồ án khác, hay các sản phẩm tương tự không phải do em làm ra. Sản phẩm của đồ án là chính bản thân em nghiên cứu và xây dựng dưới sự hướng dẫn của thầy Tô Hữu Nguyên. Nếu có gì sai em xin chịu mọi hình thức kỉ luật của Khoa Công nghệ thông tin - Đại học công nghệ và truyền thông Thái nguyên. Thái Nguyên , tháng 6 năm 2011 Sinh Viên: Bùi Hương Giang MỤC LỤC CHƯƠNG 1: CƠ SỞ LÝ THUYẾT Giới thiệu chung về từ điển Ngôn ngữ như ta nói hằng ngày có vô vàn nghĩa và cách diễn đạt, mỗi quốc gia có một ngôn ngữ riêng. Với xu hướng toàn cầu hóa hiện nay việc học các ngôn ngữ của nhau là một tất yếu, vì thế rất nhiều phần mềm tra từ với nhiều ngôn ngữ ra đời. Hiện nay có rất nhiều chương trình tra từ điển được phát triển rất thành công bao gồm cả phần mềm online và offline. Việc xây dựng từ điển khó nhất là xây dựng bộ dữ liệu. Với mỗi loại từ điển ta quy định việc dây dựng dữ liệu làm sao cho phải đúng quy chuẩn, định dạng, và chuẩn đó làm sao phải thật tiện lợi cho việc tìm kiếm, tra cứu của người dùng. Hiện nay với sự phát triển rộng rãi của Internet, mọi nhu cầu của con người đều được Internet phục vụ, cũng vì thế mà nó luôn gắn liền với mọi người ở mọi lứa tuổi với mọi nhu cầu công việc. Vì thế mà rất nhiều từ điển online ra đời nhằm đáp ứng nhu cầu đó. Với ưu điểm nhanh, tiện lợi, không phải cài đặt,miễn phí ở đâu có Net là ở đó có từ điển. Ngoài ra từ điển online cũng là nơi kết nối cộng đồng giúp mọi người trao đổi học tập kiến thức ngoại ngữ với nhau. Dù vậy từ điển online cũng có nhiều nhược điểm mà ở từ điển offline mới có. Các từ điển Online Có rất nhiều từ điển online hiện nay với rất nhiều tính năng rất hữu dụng, ta có thể tham khảo một số chức năng để tích hợp cho phần mềm offline. + trang web xuất bản dữ liệu mở để dùng cho stardict và babylon , có nhiều ngôn ngữ nhất + trang này mua bản quyền phần mềm dịch evtran 3.0, có thể dùng nó để dịch online miễn phí. + mua dữ liệu từ điển prodic với lượng từ rất lớn, nhiều chuyên ngành. + bách khoa toàn thư mở. + bách khoa toàn thư của Việt Nam , giải thích khá rõ ràng . +nếu không tra được thì dùng cái này hay Từ điển Offline Từ điển offline là các từ điển chạy trên máy mà không cần kết nối net. Hiện tại nổi tiếng nhất trong giới mã nguồn mở là Stardict, một phần mềm có khả năng tra từ khá nhanh, gọn nhẹ, bắt từ trong ứng dụng khác (click and see ) khá tốt ,định dạng của nó là một biến thể đã nâng cấp của chuẩn Dict, một chuẩn mà trong thời điểm hiện tại đa số các phần mềm miễn phí, nguồn mở đều dùng để làm từ điển, nhưng nó cũng có những nhược điểm nhất định chưa khắc phục được của chuẩn Dict đó là dữ liệu từ điển phải ghi vào trong nhiều file dữ liệu khác nhau, như trong stardict là 4 file. Ngoài ra khả năng thêm xoá không có cũng là một hạn chế rất lớn của chuẩn từ điển này và các biến thể của nó . Ngoài các soft mã nguồn mở, phải kể đến một bộ phận không nhỏ là soft từ điển miễn phí với đại diện mà mình cho là tốt nhất là lingoes, với các tính năng cũng khá giống stardict nhưng có ưu điểm là phần danh sách từ của nó xuyên suốt từ đầu đến cuối, có phát âm công nghệ text to speech của microsoft, còn stardict chỉ có 30 từ trong danh sách. Nhưng nó cũng có nhược điểm là tác giả của nó không cung cấp bộ công cụ convert dữ liệu từ điển, phải gửi dữ liệu đã biên soạn bằng text cho tác giả để tác giả convert thành ra hiện tại bộ dữ liệu từ điển của nó không nhiều ngôn ngữ và hiện tại stardict vẫn phổ biến hơn. Đối với các phần mềm miễn phí trong nước thì có các phần mềm :Multidictionary (phổ biến nhất), powerclick và jtranslator mới xuất hiện. Tất cả các từ điển trên đều không có khả năng thêm xoá từ và tạo từ điển. Hi vọng từ điển này ra đời sẽ khoả lấp được chỗ trống đó. Đồng thời với cơ chế dữ liệu mở và mã nguồn mở sẽ thúc đẩy được sự xuất hiện của những từ điển miễn phí, nguồn mở tăng thêm về chất lượng, tính năng phục vụ cho cộng đồng. Giới thiệu luôn cho mọi người một số từ điển thương mại phổ biến hiện nay: Lạc Việt mtd: có thêm xóa từ, tra từ click and see, chạy ổn định, dữ liệu từ điển tương đối đầy đủ. Just click and see: chỉ có tra từ click and see (tốt hơn lạc việt), rất ít tính năng Evatran 2.0: có thêm xóa, chức năng click and see lên vista thì liệt. English Study 4.0: đây là phần mềm ngữ pháp tiếng anh, từ điển và luyện nge tốt. Babylon: không có khả năng thêm xóa nhưng khả năng click and see thuộc loại tốt nhất hiện nay cùng với khả năng tìm kiếm từ gần đúng hoàn hảo, nó rất mạnh Prodict và javidict thuộc cùng một hãng, đặc điểm của loại này là dữ liệu lớn nhất hiện nay gồm nhiều chuyên ngành, nhưng không thêm xóa, tra từ click and see ngang Lạc Việt, giá rất đắt. Hiện nay trang đã mua bản quyền, chúng ta có thể tra trực tuyến trên đó miễn phí. Giới thiệu tổng quan về ASP.NET, C# và ngôn ngữ UML Tổng quan về ASP.NET ASP (active server pages ) là một môi trường lập trình script trên server, nó cho phép người lập trình tạo các trang web động có tính bảo mật cao và làm tăng khả năng giao tiếp của chương trình ứng dụng. Các ứng dụng xây dựng bằng ASP có phần mở rộng .ASP. Trong một file ASP có thể trộn lẫn các đoạn mã script, các thẻ của html và các đoạn văn bản (text). Trên mỗi trang ASP có một ngôn ngữ script gọi là ngôn ngữ script cơ sở. Ngôn ngữ cơ sở có thể là một trong các ngôn ngữ script thông dụng sau: jscript, vbscript, perl... ngôn ngữ cơ sở mặc định là vbscript. Để thiết lập lại ngôn ngữ script mặc định, ASP cung cấp lệnh sau: Các script này được chạy ngay trên web server mà không cần biên dịch riêng. Chính điều này đã làm cải thiện đáng kể tới tốc độ thực hiện ứng dụng được xây dựng bằng ASP. Mô hình hoạt động của ASP.NET Cách hoạt động của mô hình ASP được mô tả tóm tắt qua 3 bước sau: - Bước 1: Khi web browser người dùng gửi một yêu cầu về một tệp ASP cho web server. - Bước 2: Tệp ASP đó được nạp vào bộ nhớ và thực hiện (tại máy chủ). Các đoạn chương trình script trong tệp ASP đó có thể là mở dữ liệu, thao tác với dữ liệu để lấy được những thông tin mà người dùng cần đến. Trong giai đoạn này tệp ASP đó cũng xác định xem là đoạn script nào là chạy trên máy chủ, đoạn script nào là chạy trên máy người dùng. - Bước 3: Sau khi thực hiện, kết quả đó sẽ được trả về cho web browser của người dùng dưới dạng một trang web tĩnh. Các đối tượng được xây dựng sẵn của ASP.NET Gồm có 6 đối tượng như sau: a) Application: được dùng để chia sẻ thông tin giữa các người dùng của cùng một hệ thống ứng dụng. Một ứng dụng cơ bản ASP được định nghĩa là gồm tất cả các tệp ASP ở trong một thư mục ảo và tất cả các thư mục con của thư mục ảo đó. Đối tượng application hỗ trợ các phương thức lock và unlock để khoá và bỏ khoá khi chạy ứng dụng đó với nhiều người dùng. b) Session: dùng lưu trữ những thông tin cần thiết trong phiên làm việc của người dùng, những thông tin lưu trữ trong sesion khách hàng không bị mất đi khi người dùng di chuyển qua các trang trong ứng dụng. c) Request: dùng để truy cập những thông tin được chuyển cùng với các yêu cầu http. Thường thông tin này gồm có các tham số của form khi được submit dùng phương thức post và get hay các tham số được ghi cùng với trang ASP trong lời gọi đến trang đó. Dùng đối tượng request để chia sẻ thông tin qua lại giữa các trang ASP trong một ứng dụng. Ngoài ra request còn được dùng để lấy giá trị các cookie lưu trữ trên máy client. d) Response: đối tượng này được dùng để gửi kết quả cho web browser, chuyển browser đến một url khác và hoặc thiết lập các cookie trên máy client. e) Server: đối tượng này cung cấp các phương thức cũng như thuộc tính của server. thường sử dụng phương thức server.createobject để khởi tạo instance của một active object trên trang ASP. f) Objectcontext: dùng đối tượng này để chấp nhận hoặc huỷ bỏ các transaction được điều khiển bởi microsoft transaction server. khi mà tệp ASP có chứa từ khoá @transaction ở trên đầu thì tệp ASP đó sẽ chạy cho đến khi mà transaction thực hiện thành công hoặc thất bại. Sử dụng Ado để truy nhập dữ liệu Ado (access data object) là đối tượng activex truy nhập dữ liệu mới nhất mà microsoft hỗ trợ tích cực cho việc tương tác với dữ liệu qua bất kỳmột nhà cung cấp cơ sở dữ liệu nào (db provider). Ado cho phép viết các ứng dụng truy nhập dữ liệu từ các nguồn dữ liệu ole db, gồm cả các nguồn dữ liệu odbc. Nó dựa trên kỹ thuật tự động. Việc kết nối với odbc thông qua các driver cơ sở dữ liệu. Các driver cơ sở dữ liệu là các chương trình đưa thông tin từ ứng dụng web tới cơ sở dữ liệu. Việc kết nối này sử dụng tên nguồn dữ liệu DSN (data source name). dsn chứa những thông tin về việc bảo mật, việc tham chiếu tới cơ sở dữ liệu vật lý. Khi sử dụng Ado với active server pages, mọi truy xuất dữ liệu và thao tác được thực hiện trên server. Các đối tượng của Ado - Đối tượng connection: Đối tượng này được dùng để tạo một kết nối tới một cơ sở dữ liệu, trước tiên phải tạo ra một biến connection sau đó sử dụng phương thức open của đối tượng này. <% set biến_đối_tượngserver.createobject(“Adodb.connection”) biến_đối_tượng.open “dsn=mydatabase” %> Mydatabase là tên một cơ sở dữ liệu nguồn(dsn) mà đã dược tạo ra trước đó. Đối tượng connection cung cấp phương thức ‘execute’ để thực hiện một truy vấn trên dữ liệu đã được tạo kết nối. - Đối tượng recordset: Ado cung cấp đối tượng recordset cho phép lấy dữ liệu, nghiên cứu kết quả, và cập nhật cơ sở dữ liệu. Đối tượng recordset duy trì vị trí của mỗi bản ghi được trả về bởi một truy vấn, vì vậy ta có thể duyệt từng bản ghi một từ bản ghi đầu tiên tới bản ghi cuối cùng. Tạo ra một đối tượng recordset có dạng như sau: <% set biến_đối_tượng= server.createobject(“Adodb.recordset”) biến_đối_tượng. open source, activeconnection, cursortype, locktype %> + Source: thường là một xâu lệnh sql, cũng có thể là tên của một bảng. + Activeconnection: tham số thứ hai của phương thức open là một trong hai dạng sau: - Sử dụng một xâu ký tự chỉ ra rằng tạo một kết nối mới. - Chỉ ra một kết nối đã tạo ra bằng đối tượng connection. Cách này thường được dùng nhiều hơn bởi vì chỉ cần tạo một kết nối bằng đối tượng connection là có thể taọ ra nhiều đối tượng recordset sử dụng kết nối này. + cursortype: Tham số này có thể là một trong 4 giá trị : 0: Là kiểu forword_only. kiểu này chỉ cho phép di chuyển con trỏ về phía trước. đây là dạng mặc định của phương thức open. 1: Là kiểu keyset. đặc điểm của kiểu này là số bản ghi không bao giờ thay đổi, không thấy đựơc sự tác động của người dùng khác với dữ liệu. 2: Là kiểu dynamic. kiểu này cho phép ta thấy được sự cập nhật các bản ghi bởi người dùng khác. kiểu này hỗ trợ nhiều chức năng của recordset nhất nhưng giá phải trả là tốn bộ nhớ nhất và xử lý lâu nhất. 3: Là kiểu static. kiểu này cũng không cho phép biết được sự thay đổi các bản ghi bởi người dùng khác. Nói chung các kiểu trên đây chỉ khác nhau ở việc phản ánh những thay đổi trên các bản ghi bởi người dùng khác. + locktype : tham số khoá này cũng có 4 giá trị sau: Ngôn ngữ C# Ngôn ngữ C# khá đơn giản, chỉ khoảng 80 từ khóa và hơn mười mấy kiểu dữ liệu được xây dựng sẵn. Tuy nhiên, ngôn ngữ C# có ý nghĩa cao khi nó thực thi những khái niệm lập trình hiện đại. C# bao gồm tất cả những hỗ trợ cho cấu trúc, thành phần, lập trình hướng đối tượng. Những tính chất đó hiện diện trong một ngôn ngữ lập trình hiện đại. Và ngôn ngữ C# hội đủ những điều kiện như vậy, hơn nữa nó được xây dựng trên nền tảng của hai ngôn ngữ mạnh nhất là C++ và Java. Một số kiến thức cần nắm rõ trong quá trình xây dựng chương trình: Các kiểu dữ liệu trong C#: Bảng 1.1: Các kiểu dữ liệu trong C# Thao tác với tập tin Để xử lý file dữ liệu từ điển, chúng ta cần nghiên cứu namespace System.IO; bao gồm các công cụ ghi file, mở file, đổi tên file.... Đối với các thao tác ghi file có 3 loại : - Đối với file text: dùng StreamReader, StreamWriter (để làm việc với file dict.tab). - Đối với file nhị phân BinayStream: chạy trên stream cơ bản (Base Stream). - Stream là cái tổng quát nhất, có thể dùng thay thế cả hai cái trên, hai cái trên đều lấy cái này là BaseStream. Đối với file dữ liệu từ điển này thì cần quan tâm đến Stream cơ bản và StreamReader / StreamWriter. Trong Stream cần chú ý: - Position: cho biết vị trí con trỏ trong văn bản hiện hành. - Seek: nhảy đến các vị trí trong văn bản, cú pháp: seek(pos, seekOrigin), trong đó: pos là kiểu long xác định vị trí nhảy, seekOrigin là mốc nhảy. VD: seek(-1, seekOrigin.End): nhảy từ cuối file về 1 byte. - SetLength: định lại kích thước của file. 1.2.3. Ngôn ngữ thống nhất mô hình hóa UML Với sự phát triển của công nghệ phần mềm, nhiều công cụ lập trình đã được phát triển và có khả năng hỗ trợ mạnh cho người sử dụng, giảm thiểu được công sức của lập trình viên khi xây dựng chương trình. Khi triển khai tin học hoá các bài toán trong thực tế, vấn đề gặp nhiều khó khăn nhất chính là đi phân tích, thiết kế hệ thống (PTTKHT) cho bài toán đó. Đã có nhiều phương pháp PTTKHT đang được sử dụng hiện nay và phổ biến hơn cả là những phương pháp có cấu trúc như: SADT (Structured Analysis and Design Technique - Kỹ thuật Thiết kế và Phân tích cấu trúc), phương pháp MERISE (Méthode pour Rassembler des Idées Sans Effort - Phương pháp để tập hợp các ý tưởng không cần nỗ lực), phương pháp MCX (Méthode de Xavier Castellani - Phương pháp của Xavier Castellani), … Mỗi phương pháp có những điểm mạnh và điểm yếu riêng, vấn đề ưu tiên khi chọn lựa một phương pháp PTTKHT là: dễ sử dụng, có thể mô hình hóa một cách tổng quát nhất các vấn đề đặt ra trong thực tế, có khả năng áp dụng cho lớp các bài toán tương tự và có khả năng chuyển thành chương trình sử dụng trong thực tế nhanh nhất. Trên cơ sở yêu cầu trên, em đã chọn UML để tiến hành PTTKHT cho bài toán xây dựng chương trình tra từ điển. Phương pháp phân tích, thiết kế hệ thống hướng đối tượng (UML) này giúp chúng ta hiểu rõ những công việc phải làm, những yêu cầu thực tế về số liệu cần phải đáp ứng, và trên cơ sở đó xây dựng các mô hình cần thiết để mô tả mối tương quan giữa các thành phần trong hệ thống, từ đó dễ dàng hơn rất nhiều trong việc triển khai lập trình cũng như bảo trì, nâng cấp cho hệ thống hoạt động tốt, đáp ứng các yêu cầu hay thay đổi của người sử dụng. Khái niệm UML (Unifield Modeling Language) là một ngôn ngữ mô hình hoá thống nhất có phần chính bao gồm những ký hiệu hình học, được các phương pháp hướng đối tượng sử dụng để thể hiện và miêu tả các thiết kế của một hệ thống. Nó là một ngôn ngữ để đặc tả, trực quan hoá, xây dựng và làm sưu liệu cho nhiều khía cạnh khác nhau của một hệ thống. UML có thể được sử dụng làm công cụ giao tiếp giữa người dùng, nhà phân tích, nhà thiết kế và nhà phát triển phần mềm. Mục đích của UML là: - Mô hình hoá các hệ thống sử dụng các khái niệm hướng đối tượng. - Thiết lập một kết nối từ nhận thức của con người đến các sự kiện cần mô hình hoá. - Giải quyết vấn đề về mức độ thừa kế trong các hệ thống phức tạp, có nhiều ràng buộc khác nhau. - Tạo một ngôn ngữ mô hình hoá có thể sử dụng được bởi người và máy. 1.2.3.1. Các thành phần của ngôn ngữ UML Ngôn ngữ UML bao gồm một loạt các phần tử đồ họa (graphic element) có thể được kếp hợp với nhau để tạo ra các biểu đồ. Bởi đây là một ngôn ngữ, nên UML cũng có các nguyên tắc để kết hợp các phần tử đó. Một số những thành phần chủ yếu của ngôn ngữ UML: - Hướng nhìn (view): Hướng nhìn chỉ ra những khía cạnh khác nhau của hệ thống cần phải được mô hình hóa. Một hướng nhìn không phải là một bản vẽ, mà là một sự trừu tượng hóa bao gồm một loạt các biểu đồ khác nhau. Chỉ qua việc định nghĩa của một loạt các hướng nhìn khác nhau, mỗi hướng nhìn chỉ ra một khía cạnh riêng biệt của hệ thống, người ta mới có thể tạo dựng nên một bức tranh hoàn thiện về hệ thống. Cũng chính các hướng nhìn này nối kết ngôn ngữ mô hình hóa với quy trình được chọn cho giai đoạn phát triển. - Biểu đồ (diagram): Biểu đồ là các hình vẽ miêu tả nội dung trong một hướng nhìn. UML có tất cả 9 loại biểu đồ khác nhau được sử dụng trong những sự kết hợp khác nhau để cung cấp tất cả các hướng nhìn của một hệ thống. - Phần tử mô hình hóa (model element): Các khái niệm được sử dụng trong các biểu đồ được gọi là các phần tử mô hình, thể hiện các khái niệm hướng đối tượng quen thuộc. Ví dụ như lớp, đối tượng, thông điệp cũng như các quan hệ giữa các khái niệm này, bao gồm cả liên kết, phụ thuộc, khái quát hóa. Một phần tử mô hình thường được sử dụng trong nhiều biểu đồ khác nhau, nhưng nó luôn luôn chỉ có một ý nghĩa và một kí hiệu. - Cơ chế chung: Cơ chế chung cung cấp thêm những lời nhận xét bổ sung, các thông tin cũng như các quy tắc ngữ pháp chung về một phần tử mô hình; chúng còn cung cấp thêm các cơ chế để có thể mở rộng ngôn ngữ UML cho phù hợp với một phương pháp xác định (một quy trình, một tổ chức hoặc một người dùng). 1.2.3.2. Một số biểu đồ chính của UML Biểu đồ Use-Case (Use Case Diagram) Biểu đồ Use case chỉ ra một số lượng các tác nhân ngoại cảnh và mối liên kết của chúng đối với Use case mà hệ thống cung cấp (hình 1.2). Một Use case là một lời miêu tả của một chức năng mà hệ thống cung cấp. Lời miêu tả Use case thường là một văn bản tài liệu, nhưng kèm theo đó cũng có thể là một biểu đồ hoạt động. Các Use case được miêu tả duy nhất theo hướng nhìn từ ngoài vào của các tác nhân (hành vi của hệ thống theo như sự mong đợi của người sử dụng), không miêu tả chức năng được cung cấp sẽ hoạt động nội bộ bên trong hệ thống ra sao. Các Use case định nghĩa các yêu cầu về mặt chức năng đối với hệ thống. Hình 1.2: Ví dụ về biểu đồ UseCase Biểu đồ lớp Biểu đồ lớp mô tả cấu trúc tĩnh của hệ thống, thể hiện các phần hệ thống xử lý được. UML thể hiện lớp bằng hình chữ nhật có 3 phần: Phần thứ nhất chứa tên lớp. Trong phần thứ hai là thuộc tính và các dữ liệu thành phần của lớp. Trong phần thứ ba là các phương thức hay hàm thành phần của lớp. Biểu đồ trình tự Biểu đồ trình tự minh họa các đối tượng tương tác với nhau ra sao. Chúng tập trung vào các chuỗi thông điệp, có nghĩa là các thông điệp được gửi và nhận giữa một loạt các đối tượng như thế nào. Biểu đồ trình tự có hai trục: trục nằm dọc chỉ thời gian, trục nằm ngang chỉ ra một tập hợp các đối tượng tại một thời điểm nào đó trong quá trình thực thi của hệ thống. Biểu đồ cộng tác Một biểu đồ cộng tác miêu tả tương tác giữa các đối tượng cũng giống như biểu đồ trình tự, nhưng nó tập trung trước hết vào các sự kiện, tức là tập trung chủ yếu vào sự tương tác giữa các đối tượng, còn biểu đồ trình tự tập trung thể hiện sự tương tác giữa các đối tượng theo trình tự thời gian. Biểu đồ trạng thái Biểu đồ trạng thái thể hiện những khía cạnh mà ta quan tâm tới khi xem xét trạng thái của một đối tượng: - Trạng thái ban đầu. - Một số trạng thái ở giữa. - Một hoặc nhiều trạng thái kết thúc. - Sự biến đổi giữa các trạng thái. - Những sự kiện gây nên sự biến đổi từ một trạng thái này sang trạng thái khác Các giải pháp và kỹ thuật xử lý khi xây dựng chương trình Xử lý dữ liệu Để xử lý file dữ liệu từ điển, chúng ta cần nghiên cứu namepace System.IO, bao gồm các cô