Tổng quan về internet

Internet là một mạng máy tính nối hàng triệu máy tính với nhau trên phạm vi toàn thế giới. Internet có lịch sử rất ngắn, nó có nguồn gốc từ một dự án của Bộ Quốc Phòng Mỹ có tên là ARPANET vào năm 1969, dự án nhằm thực nghiệm xây dựng một mạng nối các trung tâm nghiên cứu khoa học và quân sự với nhau. Đến năm 1970 đã có thêm hai mạng: Store-and-forwarrd và ALOHAnet, đến năm 1972 hai mạng này đã được kết nối với ARPANET. Cũng trong năm 1972 Ray Tomlinson phát minh ra chương trình thư tín điện tử E-mail. Chương trình này đã nhanh chóng được ứng dụng rộng rãi để gửi các thông điệp trên mạng phân tán. Kết nối quốc tế đầu tiên vào ARPANET từ University College of London (Anh) và Royal Radar Establishment (Na Uy) được thực hiện vào năm 1973. Thành công vang dội của ARPANET đã làm nó nhanh chóng được phát triển, thu hút hầu hết các trường đại học tại Mỹ. Do đó tới năm 1983 nó đã được tách thành hai mạng riêng: MILNET tích hợp với mạng dữ liệu quốc phòng (Defense Data Network) dành cho các địa điểm quân sự và ARPANET dành cho các địa điểm phi quân sự. Sau một thời gian hoạt động, do một số lý do kỹ thuật và chính trị, kế hoạch sử dụng mạng ARPANET không thu được kết quả như mong muốn. Vì vậy Hội đồng khoa học quốc gia Mỹ (National Science Foundation) đã quyết định xây dựng một mạng riêng NSFNET liên kết các trung tâm tính toán lớn và các trường đại học vào năm 1986. Mạng này phát triển hết sức nhanh chóng, không ngừng được nâng cấp và mở rộng liên kết tới hàng loạt các doanh nghiệp, các cơ sở nghiên cứu và đào tạo của nhiều nước khác nhau. Cũng từ đó thuật ngữ Internet ra đời. Dần dần kỹ thuật xây dựng mạng ARPANET đã được thừa nhận bởi tổ chức NSF, kỹ thuật này được sử dụng để dựng mạng lớn hơn với mục đích liên kết các trung tâm nghiên cứu lớn của nước Mỹ. Người ta đã nối các siêu máy tính (Supercomputer)thuộc các vùng khác nhau bằng đường điện thoại có tốc độ cao. Tiếp theo là sự mở rộng mạng này đến các trường đại học

doc24 trang | Chia sẻ: lvbuiluyen | Lượt xem: 3759 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Tổng quan về internet, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
phần 1: Cơ sở lý thuyết Chương 1: tổng quan về internet I. Công nghệ internet 1. Internet và xuất xứ của nó Internet là một mạng máy tính nối hàng triệu máy tính với nhau trên phạm vi toàn thế giới. Internet có lịch sử rất ngắn, nó có nguồn gốc từ một dự án của Bộ Quốc Phòng Mỹ có tên là ARPANET vào năm 1969, dự án nhằm thực nghiệm xây dựng một mạng nối các trung tâm nghiên cứu khoa học và quân sự với nhau. Đến năm 1970 đã có thêm hai mạng: Store-and-forwarrd và ALOHAnet, đến năm 1972 hai mạng này đã được kết nối với ARPANET. Cũng trong năm 1972 Ray Tomlinson phát minh ra chương trình thư tín điện tử E-mail. Chương trình này đã nhanh chóng được ứng dụng rộng rãi để gửi các thông điệp trên mạng phân tán. Kết nối quốc tế đầu tiên vào ARPANET từ University College of London (Anh) và Royal Radar Establishment (Na Uy) được thực hiện vào năm 1973. Thành công vang dội của ARPANET đã làm nó nhanh chóng được phát triển, thu hút hầu hết các trường đại học tại Mỹ. Do đó tới năm 1983 nó đã được tách thành hai mạng riêng: MILNET tích hợp với mạng dữ liệu quốc phòng (Defense Data Network) dành cho các địa điểm quân sự và ARPANET dành cho các địa điểm phi quân sự. Sau một thời gian hoạt động, do một số lý do kỹ thuật và chính trị, kế hoạch sử dụng mạng ARPANET không thu được kết quả như mong muốn. Vì vậy Hội đồng khoa học quốc gia Mỹ (National Science Foundation) đã quyết định xây dựng một mạng riêng NSFNET liên kết các trung tâm tính toán lớn và các trường đại học vào năm 1986. Mạng này phát triển hết sức nhanh chóng, không ngừng được nâng cấp và mở rộng liên kết tới hàng loạt các doanh nghiệp, các cơ sở nghiên cứu và đào tạo của nhiều nước khác nhau. Cũng từ đó thuật ngữ Internet ra đời. Dần dần kỹ thuật xây dựng mạng ARPANET đã được thừa nhận bởi tổ chức NSF, kỹ thuật này được sử dụng để dựng mạng lớn hơn với mục đích liên kết các trung tâm nghiên cứu lớn của nước Mỹ. Người ta đã nối các siêu máy tính (Supercomputer)thuộc các vùng khác nhau bằng đường điện thoại có tốc độ cao. Tiếp theo là sự mở rộng mạng này đến các trường đại học. Ngày càng có nhiều người nhận ra lợi ích của hệ thống trên mạng, người ta dùng để trao đổi thông tin giữa các vùng với khoảng cách ngày càng xa. Vào những năm 1990 người ta bắt đầu mở rộng hệ thống mạng sang lĩnh vực thương mại tạo thành nhóm CIX (Commercial Internet Exchange Association). Có thể nói Internet thật sự hình thành từ đây. Cho đến thời điểm hiện tại, Internet đã trở thành một phần không thể tách rời của cuộc sống hiện đạiĐối với một người lao động bình thường tại một nước phát triển bình thường, Internet đã trở thành một khái niệm giống như Điện thoại, Tivi. Trong thời gian biểu của một ngày làm việc đã xuất hiện một khoảng thời gian nhất định để sử dụng Internet, cũng giống như khoảng thời gian xem Tivi mà thôi. Theo số liệu thống kê, năm 2000 số lượng người sử dụng Internet là khoảng 150 triệu và dự đoán đến năm 2003 sẽ là 545 triệu người sử dụng hiệnSố lượng 150 triệu người sử dụng hiện tại được phân bố rất không đồng đều trên toàn cầuQuá nửa số người sử dụng là ở khu vực Bắc Mỹ còn lại ở Châu Âu, Châu á, Nam Mỹ, Châu Phi và khu vực cận ĐôngCụ thể là: Bắc Mỹ 57%, Châu Âu 21.75%, Nam Mỹ 3%, Châu Phi 0.75% và khu vực cận Đông 0.5% Các loại hình dịch vụ được sử dụng nhiều nhất trên Internet là: Giáo dục, mua bán, giải trí, công việc thường ngày tại công sở, truyền đạt thông tin, các loại dịch vụ có liên quan đến thông tin cá nhân. Trong đó, các dịch vụ liên quan đến thông tin cá nhân chiếm nhiều nhất, sau đó là công việc, giáo dục, giải trí và mua bán. 2. Cách thức truyền thông trên Internet Trong những năm 60 và 70, nhiều công nghệ mạng máy tính đã ra đời nhưng mỗi kiểu lại dựa trên các phần cứng riêng biệt. Một trong những kiểu này được gọi là mạng cục bộ (Local Area Networks - LAN), nối các máy tính với nhau trong phạm vi hẹp bằng dây dẫn và một thiết bị được cài đặt trong mỗi máy. Các mạng lớn hơn được gọi là mạng diện rộng (Wide Area Networks - WAN), nối nhiều máy tính với nhau trong phạm vi rộng thông qua một hệ thống dây truyền dẫn kiểu như trong các hệ thống điện thoại. Mặc dù LAN và WAN đã cho phép chia sẻ thông tin trong các tổ chức một cách dễ dàng hơn nhưng chúng vẫn bị hạn chế chỉ trong từng mạng riêng rẽ Mỗi một công nghệ mạng có một cách thức truyền tin riêng dựa trên thiết kế phần cứng của nó. Hầu hết các LAN và WAN là không tương thích với nhau. Internet được thiết kế để liên kết các kiểu mạng khác nhau và cho phép thông tin được lưu thông một cách tự do giữa những người sử dụng mà không cần biết họ sử dụng loại máy nào và kiểu mạng gì. Để làm được điều đó cần phải có thêm các máy tính đặc biệt được gọi là các bộ định tuyến (Router) nối các LAN và các WAN với các kiểu khác nhau lại với nhau. Các máy tính được nối với nhau như vậy cần phải có chung một giao thức (Protocol) tức là một tập hợp các luật dùng chung qui định về cách thức truyền tin. Với sự phát triển mạng như hiện nay thì có rất nhiều giao thức chuẩn ra đời nhằm đáp ứng nhu cầu phát triển. Các chuẩn giao thức được sử dụng rộng rãi nhất hiện nay như giao thức TCP/IP, giao thức SNA của IBM, OSIISDN, X.25 hoặc giao thức LAN to LAN netBIOS. Giao thức được sử dụng rộng rãi nhất hiện nay trên mạng là TCP/IP. Giao thức này cho phép dữ liệu được gửi dưới dạng các “gói “ (packet) thông tin nhỏ. Nó chứa hai thành phần, Internet Protocol (IP) và Transmission Control Protocol (TCP). Giao thức TCP/IP đảm bảo sự thông suốt việc trao đổi thông tin giữa các máy tính. Internet hiện nay đang liên kết hàng ngàn máy tính thuộc các công ty, cơ quan nhà nước, các trung tâm nghiên cứu khoa học, trường đại học, không phân biệt khoảng cách địa lý trên toàn thế giới. Đó là ngân hàng dữ liệu khổng lồ của nhân loại. Một số mạng máy tính bao gồm một máy tính trung tâm (còn gọi là máy chủ) và nhiều máy trạm khác nối với nó. Các mạng khác kể cả Internet có quy mô lớn bao gồm nhiều máy chủ cho phép bất kỳ một mạng máy tính nào trong mạng đều có thể kết nối với các máy khác để trao đổi thông tin. Một máy tính khi được kết nối với Internet sẽ là một trong số hàng chục triệu thành viên của mạng khổng lồ này. Vì vậy Internet là mạng máy tính lớn nhất thế giới hay nó là mạng của các mạng. 3. Các dịch vụ trên Internet Internet là công nghệ thông tin liên lạc mới, nó tác động sâu sắc vào xã hội, vào cuộc sống ở mức độ khá bao quát. Nó đưa chúng ta vào một thế giới có tầm nhìn rộng lớn và chúng ta có thể làm mọi thứ như: viết thư, đọc báo, xem bản tin, giải trí, tra cứu và hiện nay các công ty có thể kinh doanh thông qua Internet, dịch vụ thương mại điện tử hiện nay đang phát triển khá mạnh mẽ. Dưới đây chỉ là một số dịch vụ trên Internet: Thư điện tử (E-mail): Dịch vụ E-mail có thể dùng để trao đổi thông tin giữa các cá nhân với nhau, các cá nhân với tổ chức và giữa các tổ chức với nhau. Dịch vụ này còn cho phép tự động gửi nội dung thông tin đến từng địa chỉ hoặc tự động gửi đến tất cả các địa chỉ cần gửi theo danh sách địa chỉ cho trước (gọi là mailing list). Nội dung thông tin gửi đi dùng trong thư điện tử không chỉ có văn bản (text) mà còn có thể ghép thêm (attack) các văn bản đã được định dạng, graphic, sound, video. Các dạng thông tin này có thể hoà trộn, kết hợp với nhau thành một tài liệu phức tạp. Lợi ích chính dịch vụ thư điện tử là thông tin gửi đi nhanh và rẻ. WWW (World Wide Web): Đây là khái niệm mà người dùng Internet quan tâm nhiều nhất hiện nay. Web là một công cụ, hay đúng hơn là một dịch vụ của Internet, Web chứa thông tin bao gồm văn bản, hình ảnh, âm thanh và thậm chí cả video được kết hợp với nhau... Web cho phép chúng ta chui vào mọi ngõ ngách trên Internet, là những điểm chứa CSDL gọi là Website. Nhờ có Web nên dù không phải là chuyên gia, mọi người có thể sử dụng Internet một cách dễ dàng. Phần mềm sử dụng để xem Web gọi là trình duyệt (Browser). Một trong những trình duyệt thông thường hiện nay là Navigator của Netcape, tiếp đó là Internet Explorer của Microsoft. Dịch vụ truyền file (FTP - File Transfer Protocol): là dịch vụ dùng để trao đổi các tệp tin từ máy chủ xuông các máy cá nhân và ngược lại. Gropher: Dịch vụ này hoạt động như viện Menu đủ loại. Thông tin hệ thống Menu phân cấp giúp người sử dụng từng bước xác định được những thông tin cần thiết để đi tới vị trí cần đến. Dịch vụ này có thể sử dụng để tìm kiếm thông tin trên các FTPSite. Telnet: Dịch vụ này cho phép truy cập tới Server được xác định rõ như một TelnetSite tìm kiếm Server. Người tìm có thể thấy một dịch vụ vô giá khi tìm kiếm các thông tin trong thư viện và các thông tin lưu trữ. Telnet đặc biệt quan trọng trong việc kết nối các thông tin từ các máy tính xuống trung tâm. Chương 2 mô hình Client/Server 1. Các khái niệm Thuật ngữ Server được dùng cho những chương trình thi hành như một dịch vụ trên toàn mạng. Các chương trình Server này chấp nhận tất cả các yêu cầu hợp lệ đến từ mọi nơi trên mạng, sau đó thi hành dịch vụ trên Server và trả kết quả về máy yêu cầu. Một chương trình được coi là Client khi nó gửi các yêu cầu tới máy có chương trình Server và chờ đợi câu trả lời từ Server. Chương trình Server và Client nói chuyện với nhau bằng các thông điệp (message) thông qua một cổng truyền thông liên tác IPC (Interprocess Communication). Để một chương trình Server và một chương trình Client có thể giao tiếp được với nhau thì giữa chúng phải có một chuẩn để giao tiếp, chuẩn này được gọi là giao thức (Protocol). Nếu một chương trình Client nào muốn yêu cầu lấy thông tin từ Server thì nó phải tuân theo giao thức Server đưa ra. Một máy tính chứa chương trình Server được coi là một máy chủ hay máy phục vụ (Server) và máy chứa chương trình Client được coi là máy khách. Mô hình trên mạng mà các máy chủ và máy khách giao tiếp với nhau theo một hoặc nhiều dịch vụ được coi là mô hình Client /Server. 2. Mô hình Client/Server Thực tế mô hình Client/Server là sự mở rộng tự nhiên và tiện lợi cho việc truyền thông lên tiến trình lên các máy tính cá nhân mô hình này cho phép xây dựng các chương trình Client/Server một cách rễ ràng và sử dụng chúng để liên tác với nhau đạt hiệu quả hơn Mô hình Client/Server như sau: : Client : Server Gửi yêu cầu Trả về trang Web Đây là mô hình tổng quát nhất, trên thực tế thì một Server có thể được nối tới nhiều Server khác nhằm làm việc hiệu quả hơn và nhanh chóng hơnKhi nhận được một yêu cầu từ Client/Server này thì có thể gửi tiếp yêu cầu vừa nhận được cho một Server khácVí dụ như Database Server vì bản thân nó không thể xử lý yêu cầu này được. Máy Server có thể thi hành các nhiệm vụ đơn giản hoặc phức tạpVí dụ như một máy chủ trả lời thời gian hiện tại trong ngày khi một máy Client yêu cầu lấy thông tin về thời gian, nó sẽ phải gửi yêu cầu theo một một tiêu chuẩn do một số yêu cầu lấy thông tin về thời gian, nó sẽ phải gửi yêu cầu theo một một tiêu chuẩn do một Server đặt ra, mức yêu cầu được chấp nhận thì máy Server sẽ trả về một thông tin mà Client yêu cầuCó rất nhiều dịch vụ trên mạng nhưng nó hoạt động theo nguyên lý là nhận các yêu cầu từ Client sau đó xử lý và trả lại các yêu cầu cho Client yêu cầu. Thông thường chương trình Client/ Server được thi hành trên hai máy khác nhau cho dù lúc nào Server cũng ở trạng thái sãn sàngchờ nhận yêu cầu từ Client nhưng trên thực tế một tiến trình liên tục qua lại (interaction) giữa Client với Server lại bắt đầu ở phía Client khi mà Client giữ tín hiệu với Server. Các chương trình Server thường đều thi hành ở mức ứng dụng (tầng ứng dụng của mạng)Sự thuận lợi của phương pháp này là nó có thể làm việc trên bất cứ một mạng máy tính nào hỗ trợ giao thước truyền thông chuẩn mà cụ thể ở đây là giao thức TCP/IPVới các giao thức chuẩn này cũng giúp cho các nhà sản xuất có thể tích hợp nhiều sản phẩm khác nhau của họ lên mạng mà không gặp khó khăn gìVới các chuẩn này thì các chương trình Server cho một ứng dụng nào đó có thể thi hành trên một hệ thống chia sẻ thời gian với nhiều chương trình và dịch vụ khác hoặc nó có thể chạy trên chính một máy tính cá nhân bình thườngCó thể có nhiều Server cùnh làm một dịch vụ, chúng có thể nằm trên nhiều máy tính hoặc một máy tính. Với mô hình trên thì mô hình Client/Server chỉ mang đặc điểm của phần mềm không liên quan đến phần cứng mặc dù trên thực tế yêu cầu cho một máy Server là cao hơn rất nhiều so với máy Client Lý do là bởi vì máy Server phải quản lý rất nhiều các yêu cầu từ các Client khác nhau trên mạng máy tính. 4. ứng dụng mô hình Client/Server WWW (World Wide Web): Có nhiều người đã nghe đến thuật ngữ này nhưng lại không hiểu nó là cái gì, thậm chí có người đã sử dụng nó nhưng cũng không định nghia chính xác được WWW là cái gì ? WWW là tập hợp các văn bản tài liệu (document) có mối liên kết (Link) với nhau trên mạng Internet. Bởi vì WWW đang phát triển rất mạnh mẽ và được quảng bá khắp nơi nên người sử dụng thường nhầm lẫn WWW là Internet nhưng thực tế nó chỉ là một dịch vụ của Internet. Ngày nay Web là một dich vụ lớn nhất của Internet sử dụng giao thức truyền văn bản siêu liên kết HTTP (Hypertext Transfer Protocol) để hiện thị các siêu văn bản (còn gọi là trang Web) và hình ảnh trên một màn hình đồ hoạ thuật ngữ siêu văn bản được hiểu như việc trình bầy các văn bản bình thườngcó mối liên kết với nhau. Người sử dụng chỉ việc bấn chuột vào một phần của văn bản thì một văn bản khác có mối liên kết đó sẽ hiện lên, có thể thay Web mới này ở một nơi hoàn toàn khác với trang Web liên kết đến nó. Mỗi một mối liên kết đến một trang siêu văn bản được gọi là địa chỉ của trang văn bản đó, địa chỉ này có tên là URL(Uniform Resource Locators) gọi là bộ định danh tài nguyên. Để tạo ra một trang Web người ta sử dụng một ngôn ngữ gọi là ngôn ngữ đánh dấu siêu văn bản HTML (HypertText Makeup Language) vì vậy người ta còn gọi các trang Web là trang HTML. Như vậy với dịch vụ này trên mạng, người sử dụng máy tính có thể truy cập vào mạng để lấy các thông tin khác nhau dựa trên văn bản, hình ảnh thậm chí cả âm thanh (thông tin đa phương tiện-Multimedia). Giao diện giữa người và máy ngày càng trở nên thân thiện, nhờ các biểu tượng và dùng các thiết bị ngoại vi như chuột, bút quang... Người dùng mạng không cần có trình độ cao về tin học, với một chút vốn tiếng Anh đủ để hiểu những gì máy tính thông báo cũng có thể dùng nó như một công cụ đắc lực. Công nghệ Web cho phép xử lý các trang dữ liệu đa phương tiện và truy nhập trên mạng diện rộng đặc biệt là Internet. Thực chất Web là hội tụ của Internet. Các phần mềm lớn thi nhau thể hiện bộ duyệt Web như Mosaic, NetCape, Internet Explorer, WinWeb, Midas. WWW rất tiện lợi cho người dùng bình thường, không phải vất vả mới hiểu được các thủ tục của Internet và dễ dàng truy cập vào thông tin trên hàng ngàn máy chủ đặt ở khắp nơi trên thế giới một cách nhanh chóng và hiệu quả. Có công nghệ Web thực chất chúng ta đã bước vào một thập kỷ mà mọi thông tin có thể có ngay trên bàn làm việc của mình. Như vậy dịch vụ WWW trên mạng có một ứng dụng rất to lớn trong thời đại thông tin như hiện nay. Web đã thay đổi cách biểu diễn thông thường bằng văn bản toàn kiểu chữ nhàm chán sang kiểu thông tin sinh động có hình ảnh âm thanh. Với một bộ duyệt có trang bị tiện ích đồ hoạ ta dễ dàng xử lý thông tin đa phương tiện khác. Cho phép tìm kiếm thông tin một cách nhanh chóng, phổ biến các tài liệu khoa học và trao đổi thông tin trên mạng. Dịch vụ kinh doanh đầu tư trên mạng qua Web. Với sự phát triển vượt bậc của khả năng truyền thông qua mạng và các công nghệ Web tiên tiến, việc ta có thể ung dung ngồi nhà mà du ngoạn từ cửa hàng này sang hàng khác trong không gian ảo không còn là cảnh phim viễn tưởng mà đã trở thành hiện thực. Ngày nay hầu như bất kỳ thứ hàng hoá nào cũng có thể đặt mua qua Internet. 5. Mô hình Web Client/Server Mô hình Client/Server ứng dụng vào trang Web được gọi là mô hình Web Client/ServerGiao thức chuẩn được sử dụng để giao tiếp giữa Web Server và Web Client là HTTP (HyperText Transfer Protocol). Web Client (Web Browser): Các trình duyệt có vai trò như là Client trong mô hình Client/Server, khi cần xem một trang Web cụ thể nào thì trình duyệt Web sẽ gửi yêu cầu lên cho Web Server để lấy nội dung trang Web đó. Web Server: Khi nhận được yêu cầu từ một Client/Server, Web Server sẽ trả về nội dung file cho trình duyệt Web Server cho phép chuyển giao dữ liệu bao gồm văn bản, đồ hoạ và thậm chí cả âm thanh, video tới người sử dụng. Người sử dụng chỉ cần trình duyệt xét Web để liên kết các máy chủ qua mạng IP nội bộ yêu cầu của người sử dụng được đáp ứng bằng cách nhấn chuột vào các chủ đề hoặc minh hoạ mẫu theo khuôn dạng HTML. Những trang dữ liệu theo yêu cầu sẽ được gọi xuống từ máy chủ nào đó theo giao thức HTTP rồi hiển thị trên máy cá nhân. 6. Hoạt động Tất cả các gói tin nhận và trả lời giữa Web Server và Client đều tuân theo giao thức chuẩn HTTP. Mô hình hoạt động như sau: Ban đầu trình duyệt trên máy Client có một văn bản HTML và hiển thị lên màn hình với đầy đủ các mối liên kết. Khi người sử dụng chọn một mối liên kết nào đó trong văn bản trên thì trình duyệt sẽ sử dụng giao thức HTTP gửi một yêu cầu lên mạng cho Web Server để truy cập tới một trang Web mới hay muốn được phục vụ một dịch vụ nào đó được chỉ ra bởi mối liên kết đó. Sau khi nhận được thông tin từ trình duyệt nó có thể tự xử lý thông tin hoặc gửi cho các bộ phận khác có khả năng xử lý (Database Server, CGI. . . ) rồi chờ kết quả để gửi về cho trình duyệt Client. Trình duyệt nhận và định dạng dữ liệu theo chuẩn của trang Web để hiển thị lên màn hình. Quá trình cứ tiếp diễn như vậy được gọi là duyệt Web trên mạng. Chương 3 Lập trình trên WWW - Ngôn ngữ HTML (HyperText Makeup Language) 1. Giới thiệu ngôn ngữ HTML HTML là ngôn ngữ chuẩn để tạo lập các tài liệu cho WWW. HTML được sử dụng trong các chương trình duyệt Web, Ví dụ như MS Internet Explorer, Nescape Navigator. Một tài liệu HTML là một tệp văn bản chứa các phần tử mà các chương trình duyệt sẽ sử dụng để hiện các văn bản, các đối tượng Multimedia, và các siêu liên kết. Người sử dụng có thể dùng chuột để chọn các văn bản được format như một siêu liên kết trong các tài liệu này. Sau khi liên kết này được chọn, tài liệu mà nó trỏ tới sẽ được nạp vào máy và hiện lên màn hình. Một phần tử là một đơn vị cơ sở của HTML. Nó bao gồm một thẻ khởi đầu (start-tag), một thẻ kết thúc (end-tag), và các ký tự dữ liệu được đặt trong các thẻ này. Một thẻ bắt đầu bằng một dấu nhỏ hơn (). Thẻ kết thúc phải có thêm một dấu sổ chéo (/) ngay trước tên thẻ. Có một số thẻ phẩi luôn luôn kết thúc bằng một thẻ phù hợp, còn một số khác lại cho phép bỏ qua thẻ kết thúc nếu kết quả là rõ ràng và không có sự mập mờ nào cả. HTML không mô tả trang tài liệu theo như một số ngôn ngữ máy tính khác. Có những ngôn ngữ mô tả từng phần tử đồ hoạ và vị trí của nó trên trang tài liệu, bao gồm font chữ, kích cỡ... Ngược lại HTML lại không đưa ra bất cứ mô tả nào về font, hình ảnh đồ hoạ và chỗ để đặt chúng. HTML chỉ “gán thẻ” cho nội dung tập tin với những thuộc tính nào đó mà sau đó chúng được xác định bởi chương trình duyệt để xem tập tin này. Điều này giống như người đánh dấu bằng tay một số đoạn trên văn bản tài liệu để chỉ cho người thư kí biết những việc cần thiết như: "chỗ này in đậm", "chỗ này in nghiêng"... Ví dụ: các thẻ về kích thước chữ các thẻ về kiểu chữ . HTML gán thẻ cho kiểu chữ, chèn file ảnh đồ hoạ, âm thanh, video vào văn bản tạo ra mối liên kết và hình thức gọi là siêu văn bản (Hypertext). Siêu văn bản là đặc tính quan trọng nhất của HTML. Điều này có nghiã là một văn bản hay đồ hoạ bất kỳ chỗ nào cũng có thể liên kết với một tài liệu khác. 2. Đặc điểm ngôn ngữ HTML HTML được thiết kế ra để dùng cho Web : trong phần lớn các chương trình xử lý văn bản khá rắc rối trong một số tiểu tiết -ví dụ như chọn font - HTML, được thiết kế để dùng trên mọi kiểu máy tính. Nó được thiết kế vừa để dễ vận chuyển trên internet, vừa thích hợp với các loại máy tính. HTML là một chuẩn mở:ngoài các thẻ trong bộ chuẩn, HTML có thể được mở rộng bằng nhiều cách như : Mở rộng thêm các thẻ HTML, sử dụng Javascript, VBScri