Sự phát triển của ngành công nghệ thông tin trong những thập kỷ qua đã góp
phần cải thiện chất lƣợng cuộc sống con ngƣời. Máy tính đã có mặt trong hầu hết các
ngành khoa học, hỗ trợ con ngƣời giải quyết những công việc khó khăn và nhiều thời
gian.
Công nghệ sinh học đƣợc xem là ngành khoa học mũi nhọn của thế kỷ XXI. Với
sự ra đời của kỹ thuật giải trình tự, nhiều bộ gene của sinh vật đã đƣợc giải mã, tạo ra
một lƣợng dữ liệu sinh học khổng lồ. Điều này đòi hỏi có sự lƣu trữ, quản lí và khai
thác các dữ liệu một cách hiệu quả. Với khả năng xử lí và truy xuất lƣợng thông tin lớn
và nhanh chóng, máy tính đã trở thành công cụ hữu ích trong nghiên cứu sinh học. Sự
kết hợp giữa ngành sinh học và tin học đã cho ra đời một công cụ mới đó là Tin – Sinh
học (Bioinformatics). Tin – Sinh học giúp giải quyết hàng loạt những nghiên cứu trong
sinh học mà đòi hỏi thời gian dài hay khó có thể thực hiện bằng tay đƣợc.
Cho đến nay, Tin – Sinh học đạt đƣợc nhiều thành tựu to lớn. Nhiều CSDL sinh
học đã đƣợc thiết lập nhƣ NCBI, EMBL, DDBJ Các CSDL này chứa lƣợng lớn
thông tin phục vụ đắc lực cho các nhà nghiên cứu sinh học.
Gene 16S và 23S rRNA là 2 gene có chức năng cần thiết cho sự sống của vi
khuẩn, vừa có vùng bảo tồn và vừa có vùng biến động ở các cấp độ khác nhau, giúp
cho việc định danh hay xác định mối quan hệ họ hàng giữa hai hay nhiều loài vi
khuẩn. Các gene này đã đƣợc giải trình tự và lƣu trữ trong các CSDL sinh học trực
tuyến. Tuy nhiên, việc tìm kiếm các thông tin trình tự của hai gene trong các CSDL
lớn thƣờng tốn nhiều thời gian do thông tin không tập trung cho một đối tƣợng cụ thể.
Hiện nay, rất nhiều bệnh nguy hiểm do vi khuẩn gây ra trong đó có bệnh viêm
màng não mủ. Bệnh xảy ra thƣờng xuyên và để lại di chứng nặng nề nếu không điều
trị kịp thời. Việc chẩn đoán bệnh bằng các phƣơng pháp truyền thống thƣờng hạn chế
về mặt thời gian. Phƣơng pháp PCR hiện nay đƣợc sử dụng rộng rãi do tính đơn giản,
nhanh và chính xác. Gene 16S và 23S rRNA là hai gene thích hợp cho việc thiết kế mồi
đặc hiệu để phát hiện các vi khuẩn gây bệnh viêm màng não.
83 trang |
Chia sẻ: lvbuiluyen | Lượt xem: 2250 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn – Ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não mủ (bacterial meningitis), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
***000***
LÊ VĂN TÁM
XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S
RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU
HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ
PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM
MÀNG NÃO MỦ (Bacterial Meningitis)
Luận văn kỹ sƣ
Chuyên ngành: Công nghệ sinh học
Thành phố Hồ Chí Minh
-2006-
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
***000***
XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S
RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU
HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ
PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM
MÀNG NÃO MỦ (Bacterial Meningitis)
Luận văn Kỹ sƣ
Chuyên ngành: Công nghệ sinh học
Giáo viên hƣớng dẫn Sinh viên thực hiện
TS. TRẦN THỊ DUNG LÊ VĂN TÁM
LƢU PHÚC LỢI
Thành phố Hồ Chí Minh
-2006-
MINISTRY OF EDUCATION AND TRAINING
NONG LAM UNIVERSITY, HCMC
DEPARTMENT OF BIOTECHNOLOGY
************
CONSTRUCT DATABASE OF 16S AND 23S RIBOSAMAL RNA
GENE IN BACTERIA – APPLICATION THE DATABASE
FOR DETECTION BACTERIAL MENINGITIS
Graduation thesis
Major: Biotechnology
Professor Student
Ph.D. TRAN THI DUNG LE VAN TAM
LUU PHUC LOI
Ho Chi Minh City
-2006-
iii
LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến:
Ban Giám hiệu trƣờng Đại học Nông Lâm thành phố Hồ Chí Minh, Ban chủ
nhiệm Bộ môn Công nghệ Sinh học, cùng tất cả quý thầy cô đã truyền đạt kiến
thức cho tôi trong suốt quá trình học tại trƣờng.
TS. Trần Thị Dung và Cử Nhân Lƣu Phúc Lợi đã tận tình hƣớng dẫn, giúp đỡ
tôi trong thời gian làm khóa luận tốt nghiệp.
Xin gởi lời cảm ơn đến tập thể lớp Công Nghệ Sinh Học K28 đã động viên,
giúp đỡ và luôn ở bên cạnh tôi trong những lúc vui buồn.
Cha mẹ kính yêu đã nuôi nấng, dạy dỗ và động viên để con có thể đạt đƣợc
thành quả nhƣ ngày hôm nay.
Thành phố Hồ Chí Minh, ngày…tháng…năm 2006
Sinh viên
LÊ VĂN TÁM
iv
TÓM TẮT KHÓA LUẬN
LÊ VĂN TÁM, Đại học Nông Lâm TP. Hồ Chí Minh. Tháng 8/2006. “XÂY
DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN
– ỨNG DỤNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI
KHUẨN ĐỂ PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO
MỦ (Bacterial Meningitidis)”
Hội đồng hƣớng dẫn:
– TS. Trần Thị Dung
– Cử nhân Lƣu Phúc Lợi
Khóa luận đƣợc thực hiện tại bộ môn Công Nghệ Sinh Học - Trƣờng Đại Học
Nông Lâm TP. Hồ Chí Minh, từ tháng 1/2006 đến 8/2006.
Với sự phát triển của kỹ thuật sinh học phân tử, một số lƣợng lớn các gene 16S
và 23S rRNA đã đƣợc giải trình tự. Những trình tự gene này đƣợc lƣu trữ trong CSDL
sinh học lớn nhƣ NCBI, EMBL, DDBj…Vì các CSDL này quá lớn và chứa rất nhiều
thông tin khác nhau, không tập trung cho một đối tƣợng cụ thể nên khó có thể thực
hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do
vậy, mục tiêu của đề tài là tiến hành xây dựng cơ sở dữ liệu hai gene 16S và 23S rRNA
ở vi khuẩn và ứng dụng CSDL này để phát hiện các loài vi khuẩn gây bệnh viêm màng
não mủ.
Để đạt đƣợc mục tiêu trên, khóa luận cần đảm bảo thực hiện những nội dung nhƣ
sau:
Dùng Perl script để thu nhận các mẫu tin của hai gene từ trang CSDL GenBank
(CSDL nucleotide của NCBI). Tiếp tục sử dụng Perl script tách các mẫu tin thu
nhận đƣợc thành từng phần riêng biệt nhƣ accession number (mã số truy cập),
gi, definition, sequence (trình tự của gene)…
Thiết kế CSDL dựa vào mô hình dữ liệu quan hệ. Dùng Perl script để chuyển tự
động các thông tin tách đƣợc ở bƣớc trên vào CSDL.
Sử dụng giao thức CGI kết hợp với ngôn ngữ lập trình Perl để thiết kế trang
web CSDL về hai gene 16S và 23S rRNA ở các loài vi khuẩn.
v
Sử dụng trình tự của hai gene 16S và 23S rRNA trong CSDL để thiết kế mồi cho
phản ứng PCR phát hiện và phân biệt các tác nhân gây bệnh viêm màng não
mủ.
Đề tài đã đạt đƣợc những kết quả nhƣ sau:
Đã thu thập đƣợc 2825 mẫu tin về gene 16S rRNA và 305 mẫu tin về gene 23S
rRNA từ cơ sở dữ liệu GenBank (NCBI).
Tạo đƣợc CSDL của hai gene 16S và 23S rRNA tích hợp với web.
Trang web CSDL của hai gene và gồm có 5 trang chính: HOME, SEARCH,
TOOL, LINK, ABOUT. Từ các trang web này, ngƣời sử dụng có thể truy xuất
thông tin, tìm kiếm trình tự, so sánh một trình tự quan tâm với các trình tự trong
CSDL (alignment, BLAST)… Ngoài ra, những trang web chính này còn kết nối
đến những trang phụ khác để cung cấp các tiện ích cho ngƣời dùng.
Thiết kế mồi cho phản ứng PCR phát hiện các tác nhân gây bệnh viêm màng
não mủ bằng chƣơng trình thiết kế mồi Primrose.
vi
MỤC LỤC
Nội dung Trang
LỜI CẢM ƠN ............................................................................................................. iii
TÓM TẮT KHÓA LUẬN .......................................................................................... iv
MỤC LỤC ................................................................................................................... vi
DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ ......................................................................x
DANH SÁCH CÁC HÌNH ......................................................................................... xi
DANH SÁCH CÁC CHỮ VIẾT TẮT .................................................................... xiii
PHẦN 1: MỞ ĐẦU .......................................................................................................1
1.1. ĐẶT VẤN ĐỀ ......................................................................................................... 1
1.2. MỤC ĐÍCH ............................................................................................................. 2
1.3. YÊU CẦU ................................................................................................................ 2
PHẦN 2: TỔNG QUAN TÀI LIỆU ............................................................................3
2.1. SƠ LƢỢC VỀ CƠ SỞ DỮ LIỆU .......................................................................... 3
2.1.1. Định nghĩa .................................................................................................................. 3
2.1.2. Hệ quản trị CSDL (Database Management System – DBMS) ....................... 3
2.1.3. Các mô hình dữ liệu ................................................................................................. 3
2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB ................... 3
2.2.1. Perl ............................................................................................................................... 3
2.2.1.1. Tóm tắt lịch sử phát triển ................................................................................. 3
2.2.1.2. Ứng dụng .............................................................................................................. 4
2.2.1.3. Một số module của Perl thƣờng đƣợc sử dụng............................................ 4
2.2.2. Giới thiệu về mạng Internet ................................................................................... 5
2.2.3. Tích hợp CSDL với web dùng CGI ...................................................................... 5
2.3. CƠ SỞ DỮ LIỆU SINH HỌC ............................................................................... 6
2.3.1. NCBI (National Center for Bioinformatic Information) ................................. 6
2.3.1.1. Vài nét về NCBI .................................................................................................. 6
2.3.1.2. Một số cơ sở dữ liệu trong NCBI .................................................................... 7
2.3.1.3. Một số công cụ trong NCBI ............................................................................. 7
2.3.2. EBI (European Bioinformatics Institute) ........................................................... 8
vii
2.3.2.1. Vài nét về EBI ..................................................................................................... 8
2.3.2.2. Một số cơ sở dữ liệu trong EBI ....................................................................... 8
2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học ..................................... 9
2.3.3. SIB (Swiss Institute of Bioinformatics) ............................................................... 9
2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan) ......... 10
2.4. BỆNH VIÊM MÀNG NÃO MỦ .......................................................................... 12
2.4.1. Sơ lƣợc về bệnh viêm màng não mủ................................................................... 12
2.4.1.1. Định nghĩa ......................................................................................................... 12
2.4.1.2. Bệnh theo lứa tuổi ............................................................................................ 12
2.4.1.3. Các con đƣờng xâm nhiễm của vi khuẩn gây bệnh .................................. 13
2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh ................................................. 13
2.4.2.1. Những triệu chứng giai đoạn khởi phát ...................................................... 13
2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ ............................................... 13
2.4.3. Hậu quả của bệnh trên những đối tƣợng bị lây nhiễm .................................. 15
2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam ................... 15
2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ .......................................... 16
2.6. CÁC PHƢƠNG PHÁP XÉT NGHIỆM BỆNH VIÊM MÀNG NÃO MỦ ...... 18
2.6.1. Phƣơng pháp chẩn đoán lâm sàng ..................................................................... 18
2.6.2. Phƣơng pháp xét nghiệm vi khuẩn học ............................................................. 18
2.6.3. Phƣơng pháp miễn dịch học ................................................................................ 19
2.6.4. Phƣơng pháp tế bào học ....................................................................................... 19
2.6.5. Phƣơng pháp sinh hoá ........................................................................................... 19
2.6.5.1. Đƣờng trong dịch não tủy .............................................................................. 19
2.6.5.2. Đạm trong dịch não tủy .................................................................................. 19
2.6.5.3. Phƣơng pháp khảo sát nồng độ lactate ....................................................... 20
2.6.6. Phƣơng pháp chụp cắt lớp – CT (computer tomography) ........................... 20
2.6.7. Phƣơng pháp xét nghiệm dựa vào kỹ thuật PCR ........................................... 20
2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC NHÂN
GÂY BỆNH VIÊM MÀNG NÃO MỦ ....................................................................... 20
2.7.1. Nguyên tắc của kỹ thuật PCR ............................................................................. 20
2.7.2. Quy trình của phản ứng PCR .............................................................................. 21
2.7.3. Seminested PCR/ Multiplex PCR ....................................................................... 22
viii
2.7.3.1. Seminested PCR ............................................................................................... 22
2.7.3.2. Multiplex PCR .................................................................................................. 22
2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm
màng não mủ. ..................................................................................................................... 22
2.8. GENE 16S rRNA VÀ 23S rRNA .......................................................................... 24
2.8.1. RNA ribosome (rRNA) – Cấu trúc ribosome .................................................. 24
2.8.2. Gene 16S rRNA thƣớc đo tiến hóa ...................................................................... 25
2.8.3. Gene 23S rRNA ....................................................................................................... 28
2.9. ĐIỀU TRỊ BỆNH VIÊM MÀNG NÃO MỦ BẰNG KHÁNG SINH ............... 28
PHẦN 3: PHƢƠNG PHÁP VÀ CÁC CHƢƠNG TRÌNH SỬ DỤNG ..................29
3.1. CÁC CHƢƠNG TRÌNH VÀ NGÔN NGỮ LẬP TRÌNH ĐƢỢC SỬ DỤNG 29
3.1.1. Hệ điều hành............................................................................................................ 29
3.1.2. Các chƣơng trình phân tích trình tự ................................................................. 29
3.1.2.1. Chƣơng trình so sánh trình tự ClustalW.................................................... 29
3.1.2.2. Chƣơng trình tìm kiếm các trình tự tƣơng đồng – BLAST ................... 30
3.1.3. Hệ quản trị CSDL quan hệ MySQL .................................................................. 30
3.1.4. Apache web server ................................................................................................. 31
3.1.5. Ngôn ngữ lập trình Perl và các gói sử dụng ..................................................... 31
3.1.6. Chƣơng trình thiết kế mồi Primrose 2.17 ......................................................... 32
3.2. PHƢƠNG PHÁP .................................................................................................. 33
3.2.1. Thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene
16S và 23S rRNA ............................................................................................................... 33
3.2.3. Thiết kế CSDL gene 16S và 23S rRNA .............................................................. 38
3.2.3.1. Phân tích dữ liệu .............................................................................................. 38
3.2.3.2. Thiết kế CSDL dạng bảng .............................................................................. 39
3.2.3.3. Lƣu trữ các thông tin vào CSDL .................................................................. 41
3.2.4. Tích hợp CSDL gene 16S rRNA và 23S rRNA với trang web ...................... 42
3.3. Thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn viêm màng não ............. 42
3.3.1 Thiết kế mồi dựa trên trình tự gene 16S rRNA ................................................ 43
3.3.2. Thiết kế mồi dựa trên trình gene 23S rRNA .................................................... 47
3.3.3. Nhiệt độ nóng chảy của mồi ................................................................................. 51
PHẦN 4: KẾT QUẢ VÀ THẢO LUẬN ...................................................................52
ix
4.1. Kết quả thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai
gene 16S và 23S rRNA ................................................................................................. 52
4.2. CSDL gene 16S và 23S rRNA .............................................................................. 52
4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA ............................ 52
4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page) ..... 54
4.3.2. Trang tìm kiếm (Search Page) ............................................................................ 55
4.3.3. Trang công cụ (Tool Page) ................................................................................... 58
4.3.4. Trang Meningitidis ................................................................................................ 60
4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng màng não mủ ......... 60
PHẦN 5: KẾT LUẬN VÀ ĐỀ NGHỊ ........................................................................63
PHẦN 6: TÀI LIỆU THAM KHẢO .........................................................................64
PHỤ LỤC
x
DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ
Trang
Bảng 2.1. Tóm tắt tác nhân gây bệnh theo lứa tuổi ...................................................... 12
Bảng 2.2. Dấu hiệu và triệu chứng của bệnh viêm màng não mủ ................................ 14
Bảng 2.3. Các nhóm kháng sinh đặc trị vi khuẩn viêm màng não mủ ......................... 28
Bảng 3.1. Các đối tƣợng phụ dựa trên đối tƣợng chính sinh vật .................................. 38
Bảng 3.2. Các đối tƣợng phụ dựa trên đối tƣợng chính trình tự .................................. 39
Sơ đồ tóm tắt quá trình thu nhận mẫu tin của hai gene 16S và 23S rRNA ................... 33
Sơ đồ các đối tƣợng chính trong CSDL hai gene 16S và 23S rRNA ............................ 38
Sơ đồ chi tiết các bảng quan hệ .................................................................................... 40
Sơ đồ cấu trúc các trang web thể hiện thông tin CSDL gene 16S và 23S rRNA .......... 53
xi
DANH SÁCH CÁC HÌNH
Trang
Hình 2.1. Tƣơng tác giữa Perl script-DBI-DBD và RBDMS ........................................ 5
Hình 2.2. Tƣơng quan giữa NCBI, NLM (National Library of Medicine) và NIH ....... 6
Hình 2.3. Một số cơ sở dữ liệu trong EBI ..................................................................... 9
Hình 2.4. Ba cơ sở dữ liệu nucleotide (GenBank – EMBL – DDB) và công cụ tìm
kiếm tƣơng ứng ............................................................................................................. 11
Hình 2.5. Sự hợp nhất của ba cơ sở dữ liệu MSD, PDBj, PDB ................................... 11
Hình 2.6. Quy trình phản ứng PCR .............................................................................. 21
Hình 2.7. Thành phần cấu tạo của ribosome ở prokaryote ........................................... 25
Hinh 2.8. Vị trí và kích thƣớc của 16S và 23S rRNA trong bộ gene vi khuẩn ............. 27
Hình 3.1. Tìm kiếm bằng từ khóa trong trang Home Page của NCBI ......................... 34
Hình 3.2. Trang kết quả tìm kiếm bằng từ khóa cho gene 16S rRNA .......................... 34
Hình 3.3. Kết quả tìm kiếm thể hiện ở dạng text ......................................................... 35
Hình 3.4. File text chứa mã số truy cập ........................................................................ 35
Hình 3.5. Tất cả mẫu tin của gene 16S rRNA ............................................................... 36
Hình 3.6. Một mẫu tin của gene 16S rRNA có mã số truy cập AB016268 .................. 37
Hình 3.7. Thiết kế CSDL ở mức vật lý ........................................................................ 41
Hình 3.8. Tiến trình lấy thông tin từ CSDL hai gene ở vi khuẩn ................................. 42
Hình 3.9. Tạo CSDL trình tự gene 16S rRNA ở các vi khuẩn viêm màng não mủ ...... 43
Hình 3.10. Chọn trình tự đích trong thiết kế mồi phát hiện Streptococcus pneumoniae
dựa trên gene 16S rRNA. .............................................................................................. 43
Hình 3.11. Xác định các thông số cho mồi và số lƣợng mồi đƣợc tạo ra trên trình tự
đích 16S rRNA .............................................................................................................. 44
Hinh 3.12. Danh sách các mồi thiết kế đƣợc trên 16S rRNA ....................................... 44
Hình 3.13. Vị trí bắt cặp của mồi xuôi trên trình tự đích 16S rRNA ............................ 45
Hình 3.14. Vị trí bắt cặp của mồi ngƣợc trên trình tự đích 16S rRNA ......................... 46
Hinh 3.15. Kiểm tra lại sự bắt cặp của mồi ngƣợc và mồi xuôi trên trình tự đích 16S
rRNA ............................................................................................................................. 46
Hình 3.16. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngƣợc trên trình tự đích gene
16S rRNA ...................................................................................................................... 47
xii
Hình 3.17. D