Khóa luận Xây dựng dịch vụ web học từ vựng

Học từ vựng là một vấn đề lớn đối với nhiều người. Học theo cách truyền thống là sử dụng từ điển đơn thuần thường không hiệu quả. Hệ thống học từ vựng là một tiện ích giúp mọi người tăng khả năng ngoại ngữ. Những tính năng rất đơn giản mà hiệu quả, tra từ nhanh chóng, học từ theo một từ điển tự chọn, phát âm chuẩn, hình ảnh gần với từ cần học giúp khả năng ghi nhớ lâu hơn. Chức năng đọc báo đáp với dữ liệu được tự động cập nhật hàng ngày từ các báo nổi tiếng trên internet, thuộc nhiều lĩnh vực khác nhau như Asia, Americas, Sport, Entertainment. Chức năng này với tính năng thông minh, tự động làm nổi bật những từ người dùng chưa biết, đồng thời hiển thị nghĩa khi di chuột lên những từ đó trong tầm nhìn của trình duyệt giúp người dùng học từ ngay khi đọc tin tức. Những tính năng đó hy vọng sẽ giúp người dùng có được những trải nghiệm mới trong học từ vựng, không theo lối khô khan như trước nữa. Chức năng đọc báo dựa trên kiến thức từ vựng của từng người, tạo được sự hứng thú. Hệ thống và người dùng có tương tác cao, tạo hiệu quả lớn trong quá trình học tập.

pdf62 trang | Chia sẻ: lvbuiluyen | Lượt xem: 1832 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Khóa luận Xây dựng dịch vụ web học từ vựng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
` ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Bùi Quang Trung XÂY DỰNG DỊCH VỤ WEB HỌC TỪ VỰNG KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công Nghệ Thông Tin HÀ NỘI - 2010 II ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Bùi Quang Trung XÂY DỰNG DỊCH VỤ WEB HỌC TỪ VỰNG KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công Nghệ Thông Tin Cán bộ hướng dẫn: TS. Trương Anh Hoàng HÀ NỘI - 2010 I LỜI NÓI ĐẦU Tôi xin cảm ơn Khoa Công Nghệ Thông Tin – Đại Học Công Nghệ đã tạo điều kiện cho tôi học tập, trau dồi kiến thức để vững bước trên con đường sau này. Tôi xin chân thành cảm ơn các thầy cô trong trường đã tận tình giảng dạy, truyền cho tôi những kiến thức quý báu trong suốt bốn năm học. Tôi xin chân thành cảm ơn thầy TS. Trương Anh Hoàng đã tận tình giúp đỡ tôi trong quá trình làm đồ án này. Những chỉ bảo của thầy giúp tôi mở mang thêm rất nhiều. Và cuối cùng con xin gửi lời biết ơn sâu sắc tới cha mẹ, người luôn sát cánh bên con, nuôi dưỡng con lên người, trở thành người có ích cho xã hội. II MỤC LỤC LỜI NÓI ĐẦU............................................................................................................. I BẢNG CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ...........................................................IV BẢNG CÁC HÌNH VẼ...............................................................................................V BẢNG CÁC BẢNG BIỂU ...................................................................................... VII TÓM TẮT NỘI DUNG .......................................................................................... VIII CHƯƠNG 1: GIỚI THIỆU ..........................................................................................1 1.1. Đặt vấn đề .........................................................................................................1 1.2. Tổng quan về giải pháp......................................................................................2 1.2.1 Tại sao là dịch vụ Web? ...............................................................................2 1.2.2. Giải pháp Webdict.......................................................................................2 CHƯƠNG 2: TỔNG QUAN VỀ DỊCH VỤ WEB .......................................................5 2.1. Giới thiệu dịch vụ Web......................................................................................5 2.1.1. Dịch vụ web là gì?.......................................................................................5 2.1.2 Đặc điểm của dịch vụ web ............................................................................5 2.1.2.1. Sự tương kết có một ưu tiên cao nhất ....................................................5 2.1.2.2. XML .....................................................................................................6 2.1.2.3. WSDL...................................................................................................6 2.1.3. Giao thức dịch vụ web – SOAP .................................................................8 2.2. Python .............................................................................................................11 2.3. Sphinx .............................................................................................................12 2.3.1. Giới thiệu ..................................................................................................12 2.3.2. Tính chất ...................................................................................................13 2.3.3. Cài đặt .......................................................................................................13 2.3.4. Tạo mục lục...............................................................................................14 2.4. CakePHP .........................................................................................................15 2.4.1. Giới thiệu ..................................................................................................15 2.4.2. Mô hình MVC...........................................................................................16 2.4.3. Sử dụng .....................................................................................................17 2.5. OpenID............................................................................................................18 CHƯƠNG 3: PHÂN TÍCH HỆ THỐNG ...................................................................21 3.1. Phân tích yêu cầu.............................................................................................21 3.1.1. Yêu cầu người sử dụng ..............................................................................21 3.1.2. Yêu cầu hệ thống.......................................................................................21 III 3.2. Biểu đồ Ca sử dụng..........................................................................................22 3.3. Luồng sự kiện ..................................................................................................22 3.3.1. Đăng nhập .................................................................................................22 3.3.2. Tra từ.........................................................................................................23 3.3.3. Học từ .......................................................................................................23 3.3.4. Đọc báo .....................................................................................................24 3.3.5. Quản lý từ vựng.........................................................................................25 CHƯƠNG 4: THIẾT KẾ ...........................................................................................26 4.1. Thiết kế hệ thống .............................................................................................26 4.1.1. Biểu đồ tuần tự ..........................................................................................26 4.1.1.1. Đăng nhập ...........................................................................................26 4.1.1.2. Tra từ ..................................................................................................27 4.1.1.3. Học từ .................................................................................................31 4.1.1.4. Đọc báo...............................................................................................32 4.1.1.5. Quản lý từ vựng ..................................................................................33 4.1.2. Biểu đồ hoạt động......................................................................................33 4.1.2.1. Đăng nhập ...........................................................................................34 4.1.2.2. Tra từ ..................................................................................................34 4.1.2.3. Học từ .................................................................................................36 4.1.2.4. Đọc báo...............................................................................................37 4.1.2.5. Quản lý từ vựng ..................................................................................38 4.1.3. Biểu đồ lớp................................................................................................39 4.2. Thiết kế cơ sở dữ liệu ......................................................................................39 4.3. Thiết kế giao diện ............................................................................................43 4.3.1. Đăng nhập .................................................................................................43 4.3.2. Tra/Học từ .................................................................................................44 4.3.3. Đọc báo .....................................................................................................44 CHƯƠNG 5: CÀI ĐẶT VÀ THỬ NGHIỆM .............................................................46 5.1. Đăng nhập .......................................................................................................46 5.2. Tra từ/Học từ vựng ..........................................................................................47 5.3. Đọc báo ...........................................................................................................49 KẾT LUẬN ...............................................................................................................51 TÀI LIỆU THAM KHẢO..........................................................................................52 IV BẢNG CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu Diễn giải MVC Model-View-Controller RSS Really Simple Syndication HTML HyperText Markup Language HTTP Hypertext Transfer Protocol XML Extensible Markup Language WSDL Web Services Description Language SOAP Simple Object Access Protocol RPC Remote procedure call V BẢNG CÁC HÌNH VẼ Hình 1. Tính năng tra từ của Stardict ..........................................................................2 Hình 2. So sánh giữa Vdict và Webdict ......................................................................3 Hình 3. Thành phần của SOAP ...................................................................................9 Hình 4. MVC............................................................................................................16 Hình 5. Biểu đồ Ca sử dụng ......................................................................................22 Hình 6. Thiết kế tổng quan hệ thống .........................................................................26 Hình 7. Biểu đồ tuần tự chức năng Đăng nhập ..........................................................26 Hình 8. Biểu đồ tuần tự chức năng Tra từ - Searchdict..............................................28 Hình 9. Biểu đồ tuần tự chức năng Tra từ - autoComplete ........................................29 Hình 10. Biểu đồ tuần tự chức năng Tra từ ...............................................................30 Hình 11. Biểu đồ tuần tự chức năng Học từ ..............................................................31 Hình 12. Biểu đồ tuần tự chức năng Đọc báo ............................................................32 Hình 13. Biểu đồ tuần tự chức năng Quản lý từ vựng................................................33 Hình 14. Biểu đồ hoạt động chức năng Đăng nhập....................................................34 Hình 15. Biểu đồ hoạt động chức năng Tra từ ...........................................................35 Hình 16. Biểu đồ hoạt động chức năng Học từ..........................................................36 Hình 17. Biểu đồ hoạt động chức năng Đọc báo .......................................................37 Hình 18. Biểu đồ hoạt động chức năng Quản lý từ vựng ...........................................38 Hình 19. Biểu đồ lớp hệ thống ..................................................................................39 Hình 20. Bảng Users .................................................................................................39 Hình 21. Bảng Dictionaries.......................................................................................40 Hình 22. Bảng New Categories .................................................................................40 Hình 23. Bảng New Domain .....................................................................................40 Hình 24. Bảng New Content .....................................................................................41 Hình 25. Bảng Words ...............................................................................................41 Hình 26. Bảng User Words .......................................................................................42 VI Hình 27. Bảng Known Words ...................................................................................42 Hình 28. Biểu đồ quan hệ của các bảng.....................................................................42 Hình 29. Cửa sổ Đăng nhập ......................................................................................43 Hình 30. Cửa sổ Tra từ .............................................................................................44 Hình 31. Cửa sổ Đọc báo 1 .......................................................................................45 Hình 32. Cửa sổ Đọc báo 2 .......................................................................................45 Hình 33. Cửa sổ Đăng nhập thất bại..........................................................................46 Hình 34. Cửa sổ sau khi Đăng nhập ..........................................................................47 Hình 35. Cửa sổ Tra từ gợi ý.....................................................................................48 Hình 36. Cửa sổ Đọc báo chi tiết ..............................................................................50 VII BẢNG CÁC BẢNG BIỂU Bảng 1. Các nhà cung cấp OpenID ...........................................................................18 Bảng 2. Luồng sự kiện Đăng nhập ............................................................................22 Bảng 3. Luồng sự kiện Tra từ ...................................................................................23 Bảng 4. Luồng sự kiện Học từ ..................................................................................23 Bảng 5. Luồng sự kiện Đọc báo ................................................................................24 Bảng 6. Luồng sự kiện Quản lý từ vựng....................................................................25 Bảng 7. Users ...........................................................................................................39 Bảng 8. Dictionaries .................................................................................................39 Bảng 9. News Categories ..........................................................................................40 Bảng 10. News Domain ............................................................................................40 Bảng 11. News Content ............................................................................................40 Bảng 12. Words ........................................................................................................41 Bảng 13. User Words................................................................................................41 Bảng 14. Known Words............................................................................................42 VIII TÓM TẮT NỘI DUNG Học từ vựng là một vấn đề lớn đối với nhiều người. Học theo cách truyền thống là sử dụng từ điển đơn thuần thường không hiệu quả. Hệ thống học từ vựng là một tiện ích giúp mọi người tăng khả năng ngoại ngữ. Những tính năng rất đơn giản mà hiệu quả, tra từ nhanh chóng, học từ theo một từ điển tự chọn, phát âm chuẩn, hình ảnh gần với từ cần học giúp khả năng ghi nhớ lâu hơn. Chức năng đọc báo đáp với dữ liệu được tự động cập nhật hàng ngày từ các báo nổi tiếng trên internet, thuộc nhiều lĩnh vực khác nhau như Asia, Americas, Sport, Entertainment. Chức năng này với tính năng thông minh, tự động làm nổi bật những từ người dùng chưa biết, đồng thời hiển thị nghĩa khi di chuột lên những từ đó trong tầm nhìn của trình duyệt giúp người dùng học từ ngay khi đọc tin tức. Những tính năng đó hy vọng sẽ giúp người dùng có được những trải nghiệm mới trong học từ vựng, không theo lối khô khan như trước nữa. Chức năng đọc báo dựa trên kiến thức từ vựng của từng người, tạo được sự hứng thú. Hệ thống và người dùng có tương tác cao, tạo hiệu quả lớn trong quá trình học tập. 1 CHƯƠNG 1: GIỚI THIỆU 1.1. Đặt vấn đề Hiện nay nhu cầu học ngoại ngữ đang trở nên rất cần thiết. Mỗi một người đều hiểu rõ tầm quan trọng của việc học ngoại ngữ, giúp họ tăng khả năng giao tiếp, lương cao, khả năng thăng tiến. Việc học ngoại ngữ bao gồm học nhiều kỹ năng khác nhau, như phát âm, ngữ pháp, viết, nói. Trong đó, việc học từ vựng là một công việc khá mất thời gian, nhiều khi còn khiến người học nản chí. Trên mạng cũng có rất nhiều phần mềm và trang web hỗ trợ việc học từ vựng. Nhưng hầu hết những chương trình và phần mềm đó đều khiến cho người dùng nhanh chóng cảm thấy chán, khả năng ghi nhớ không được lâu, ví dụ như đều là các trang cho phép người dùng tra từ vựng. Nguyên nhân là những trang web thường quá đơn điệu, chỉ nêu ra nghĩa của từ mà không có phương pháp giúp người dùng tăng khả năng ghi nhớ từ đó. Chẳng hạn, khi người dùng muốn tra từ mother, thì hầu hết đều chỉ đưa ra nghĩa là mẹ, chăm sóc … Tuy rằng nghĩa thì đúng và đầy đủ, nhưng như thế không thể giúp người dùng ghi nhớ lâu được, phải đọc đi đọc lại nhiều lần, rất mất thời gian. Đối với nhiều người thích đọc báo online thì vấn đề về từ vựng cản trở họ rất nhiều. Nhiều từ khi đọc không biết, lại phải tra từ điển, như thế mất thời gian, cũng không ghi nhớ được từ hiệu quả. Google translate là một tiện ích mà nhiều người biết đến. Nó tự động dịch một đoạn văn bản từ ngôn ngữ này sang ngôn ngữ khác. Tuy nhiên, khi dịch toàn bộ đoạn văn bản thì nội dung thường không chính xác, vì thế gây bất tiện cho người dùng. Ví dụ, đoạn văn bản sau: “Law enforcement officials are looking into whether Shahzad had any foreign connections who may have participated in Saturday's failed bombing attempt in New York City”, khi được dịch ra thì có nghĩa là “Luật cán bộ thực thi pháp luật đang xem xét liệu có bất kỳ kết nối Shahzad nước ngoài có thể đã tham gia vụ đánh bom không thành công trong nỗ lực thứ bảy tại New York City”. Nghĩa được dịch ra đó không chính xác, gây phiền toái cho người sử dụng. Hay như tính năng tự động tra từ khi một từ được bôi đen của Stardict. 2 Hình 1. Tính năng tra từ của Stardict Cửa sổ nghĩa hiện ra che mất không gian đọc, gây khó chịu cho người dùng. Trên cơ sở những khó khăn đó, ý tưởng xây dựng một trang web trợ giúp mọi người học từ vựng cần phải được hiện thực hóa. Hệ thống có các chức năng cần thiết giúp người dùng học từ vựng một cách hiệu quả nhất. 1.2. Tổng quan về giải pháp 1.2.1 Tại sao là dịch vụ Web? Dịch vụ web đã ra đời từ lâu. Nó có ứng dụng rộng rãi trong nhiều lĩnh vực. Dịch vụ web chính là tạo ra một nơi lưu trữ liệu và tính toán trên dữ liệu đó, nhiều người có thể truy cập vào, sử dụng để tạo ra ứng dụng riêng cho mình. Nhận thấy nếu sử dụng dịch vụ web thì sẽ tiết kiệm được thời gian và công sức, đồng thời ứng dụng cũng sẽ chạy tốt và ổn định hơn. Dữ liệu chính xác là điều rất cần thiết để ứng dụng có thể tồn tại lâu dài, đồng thời có nhiều người sử dụng. 1.2.2. Giải pháp Webdict Webdict là hệ thống chạy trên Internet, cho phép nhiều người truy cập học từ vựng. Hệ thống được xây dựng sử dụng dịch vụ web, đáp ứng yêu cầu thuận tiện và hiệu quả cho người dùng. Trong bộ não con người thì ý thức giác quan chiếm tới 60% (thông tin từ trang web Nếu 3 gắn thông tin với các hình ảnh cụ thể thì sẽ dễ nhớ hơn. Ví dụ như khi bạn đến thăm nhà một người bạn mới, lỡ quên mất số nhà, lần sau đến bạn vẫn có thể tìm được cái nhà ấy vì ở đầu đường có cái cây cầu hoặc có một cây bàng to lớn. Việc học từ vựng cũng vậy, nhiều từ rất đơn giản, chỉ cần nhìn một lần là nhớ, nhưng nhiều từ thì rất khó nhớ. Chẳng hạn từ academy có nghĩa là học viện, nếu ngay lần đầu học từ này thì sẽ khó nhớ, nhưng nếu có thêm hình ảnh các học viện đi kèm thì từ này sẽ được ghi nhớ lâu hơn, khi nhìn một học viện thì liên tưởng ngay đến từ này. Hoặc từ acrobatically có nghĩa là tài tình, khéo léo, từ ngày thì rất khó nhớ, nhưng nếu