Java Servlet có thể thiết kế trang web dựa trên những dữ liệu submit từ phía
ngƣời dùng.
* Java Servlet có thể sử dụng thông tin từ những cơ sở dữ liệu chung hoặc từ
server khác. (Nhƣ là một trang web thƣơng mại có thể sử dụng Servlet để xây dựng
ứng dụng báo cáo danh sách các giá hiện thời đƣợc cập nhật từ nhiều nguồn khác nhau
và có thể đƣợc sử dụng cho mỗi mặt hàng bán ra thị trƣờng)
Nhƣ vậy, Servlet không bị hạn chế đến ứng dụng web và ứng dụng server mà nó
còn có thể vận dụng cho HTTP request. Java Servlet có thể ứng dụng cho nhiều loại
server khác nhau.
22 trang |
Chia sẻ: lvbuiluyen | Lượt xem: 2401 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Cơ sở tin học – Ngôn ngữ Java, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHẦN B: TỔNG QUAN – Cơ sở tin học – Ngôn ngữ Java
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
53
* Java Servlet có thể thiết kế trang web dựa trên những dữ liệu submit từ phía
ngƣời dùng.
* Java Servlet có thể sử dụng thông tin từ những cơ sở dữ liệu chung hoặc từ
server khác. (Nhƣ là một trang web thƣơng mại có thể sử dụng Servlet để xây dựng
ứng dụng báo cáo danh sách các giá hiện thời đƣợc cập nhật từ nhiều nguồn khác nhau
và có thể đƣợc sử dụng cho mỗi mặt hàng bán ra thị trƣờng)
Nhƣ vậy, Servlet không bị hạn chế đến ứng dụng web và ứng dụng server mà nó
còn có thể vận dụng cho HTTP request. Java Servlet có thể ứng dụng cho nhiều loại
server khác nhau.
III.3.5. Thuận lợi của Servlet so với các công nghệ thiết kế web khác
Java Servlet hiệu quả hơn, dễ dàng sử dụng hơn, mạnh, dễ thay đổi hơn (vì ứng
dụng kỹ thuật Model-Controller-View (MVC)).
Nhờ ứng dụng mô hình MVC trong thiết kế mà tạo nên tính dễ dàng thay đổi và
cập nhật trong kỹ thuật thiết kế web bằng Servlet. Những thay đổi cụ thể nhƣ view có
thể dễ dàng thay đổi mà không ảnh hƣởng đến toàn bộ hoạt động hiện thời của hệ
thống.
Chúng ta có thể so sánh cụ thể giữa Servlet và CGI
CGI (giao thức truyền giữa client và server)
Với kỹ thuật CGI truyền thống thì một tiến trình đƣợc thi hành cho mỗi HTTP
request, phí tổn bắt đầu tiến trình có thể lớn hơn thời gian thi hành thực tế..
Với Java Servlet ta có thể hiểu một cách nôm na là nó sử dụng máy ảo Java (Java
virtual machine) để biên dịch chƣơng trình.
Hình 3.1: Một chu kỳ sống của CGI
PHẦN B: TỔNG QUAN – Cơ sở tin học – Ngôn ngữ Java
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
54
Với CGI: nếu có những yêu cầu đồng thời trong cùng một chƣơng trình, thì mã
cho CGI đƣợc load n lần vào bộ nhớ.
Với Java Servlet ta hình dung nó đƣợc load một lần và sử dụng cho các lần khác
Với CGI thì rất khó khăn trong việc chia sẻ tài nguyên hoặc là vị trí trong server
(server-side) giữa các request khác nhau.
Với Servlet cho phép chia sẽ tiến trình chính, chia sẽ tài nguyên giữa nhiều
Servlet và nhiều yêu cầu. Hiện nay Servlet và JSP (Java server page) đƣợc kết hợp để
làm nên Web tier (tầng web) cho Java 2 Enterprise Edition (J2EE).
Hình 3.2: Chu kỳ sống của CGI hiện nay
Sơ đồ 3.1: Sơ đồ một ứng dụng phần mềm
Java Servlet hỗ trợ vài khả năng mà khó hoặc không thể hoàn thành với CGI nhƣ:
Servlet có thể liên lạc trực tiếp server, mà các chƣơng trình CGI không làm đƣợc, ít
nhất là không thể sử dụng specific API (application program interface).
PHẦN B: TỔNG QUAN – Cơ sở tin học – Ngôn ngữ Java
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
55
Nhiều Servlet giao tiếp với web server thông qua việc chuyển đổi địa chỉ URL
thành tên đƣờng dẫn cụ thể. Nhiều Servlet có thể dễ dàng chia sẻ cơ sở dữ liệu, dễ
dàng hiện thực kết nối cơ sở dữ liệu và chia sẽ nguồn tài nguyên.
Servlet có khả năng lƣu trữ thông tin từ yêu cầu ngƣời sử dụng nhƣ session
(phiên làm việc).
Dễ dàng thay đổi di chuyển:
- Servlet đƣợc viết trong ngôn ngữ lập trình Java và theo tiêu chuẩn API.
- Servlet có thể viết ra ứng dụng web mà chạy hầu nhƣ không thay đổi trên
Apache, Microsoft Internet Information Server(IIS), IBM Web Sphere. Java Servlet
đều đƣợc thi hành trên Sun Java web server, Apache Tomcat và Sun‟s Java server we
development (JSWDK).
Nhƣ vậy, chính nhờ dựa trên nền tảng công nghệ Java mà Java Servlet có hiệu
quả khi lập trình web đòi hỏi các ứng dụng động và phức tạp. Sử dụng chức năng lập
trình hƣớng đối tƣợng trong Java.
Tuy nhiên, với những tiến bộ của công nghệ Java hiện nay, Servlet đƣợc xem là
công nghệ cơ bản để nhiều công nghệ khác đƣợc xây dựng trên đó, chẳng hạn Struts,
WebWork, JavaServer Faces, và Spring MVC. Ƣu điểm của các công nghệ này là giúp
ngƣời lập trình phát triển các ứng dụng web nhanh hơn và dễ dàng hơn.
III.3.6. Cấu trúc ứng dụng Servlet
Một Servlet là một lớp Java mà có thể đƣợc nạp một cách động vào trong và
đƣợc chạy bởi một web server riêng biệt. Web server đƣợc gọi là Servlet container,
còn đƣợc gọi là một Servlet Engine trong những ngày đầu của công nghệ Java.
Giao diện Servlet (Servlet interface) với máy ngƣời sử dụng qua mô hình yêu
cầu-đáp ứng (request-response) trên cơ sở HTTP. Bởi vì công nghệ Java hoạt động
trên đỉnh cao của HTTP, một Servlet Container phải hỗ trợ HTTP khi truyền giao thức
ngƣời dùng yêu cầu (request) và server trả lời (response). Tuy nhiên, một Servlet
Container cũng có thể hỗ trợ giao thức tƣơng tự nhƣ HTTPS (HTTP over SSL) cho sự
giải quyết an toàn.
PHẦN B: TỔNG QUAN – Cơ sở tin học – Ngôn ngữ Java
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
56
Sơ đồ 3.2: Cấu trúc của một ứng dụng Servlet (Servlet Application)
Trong hình 3.2, một Servlet Application cũng có thể bao gồm nội dung tĩnh
(static content), nhƣ trang HTML và file ảnh. Servlet container thì không thích hợp để
đáp ứng nội dung tĩnh mà đƣợc phục vụ bởi một HTTP Servlet mạnh, vì nếu vậy nội
dung sẽ rất nhanh, nhƣ Apache web server hay Microsoft Interface Information Server.
Nó là thực tiễn phổ biến nhất để đặt một web server phía trƣớc để quản lý các request
của client.
Sơ đồ 3.3: Một cấu trúc phổ biến hơn của một server application.
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Phương tiện
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
57
C. PHƢƠNG TIỆN VÀ PHƢƠNG PHÁP TIẾN HÀNH
I. Phƣơng tiện
I.1. Thiết bị
Máy tính cấu hình P.4, có cài đặt hệ điều hành Microsoft Windows.
Internet truy cập CSDL thế giới.
Một số phần mềm soạn thảo lập trình Perl nhƣ: EditPlus, UltraEdit, Notepad,
Perl Builder …
Trình biên dịch Active Perl 5.6, Active Perl 5.8
Trình soạn thảo lập trình Java: JBuilder hỗ trợ bởi JDK 1.5
Các công cụ thiết kế web hỗ trợ :FrontPage 2003, Dreamweaver MX
Phần mềm lập trình web Java Studio Creator
I.2. Thời gian và địa điểm xây dựng CSDL
a) Thời gian:
- Tiến hành từ tháng 3 đến tháng 8 năm 2005.
b) Địa điểm:
- Tiến hành tại:
Phòng máy tính Trung Tâm Phân Tích và Thí Nghiệm Hóa Sinh, trƣờng
Đại Học Nông Lâm TpHCM.
Phòng thực tập tin học Khoa Công nghệ thông tin.
Phòng mạng Khoa Công nghệ thông tin, trƣờng Đại Học Nông Lâm
TpHCM.
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
58
II. Tìm kiếm các ấn phẩm, bài báo khoa học về cây trồng biến đổi di truyền
II.1. Tổng hợp dữ liệu tính trạng liên quan đến cây trồng biến đổi di truyền
Để tìm kiếm thông tin dạng này trên mạng Internet, chúng ta có thể sử dụng
nhiều công cụ tìm kiếm khác nhau. Việc tiếp cận đƣợc các thông tin có thể thực hiện
theo nguyên tắc:
Sơ đồ 2.1: Quy trình tìm kiếm thông tin
Quy trình tìm kiếm một thông tin cần thiết có thể đƣợc thực hiện theo chi tiết sau:
a. Xác định một từ hay một nhóm từ khóa (keyword) mang nội dung chủ yếu và
quan trọng nhất của vấn đề quan tâm.
b. Sử dụng các công cụ tìm kiếm trên mạng để tìm đến các địa chỉ lƣu trữ thông
tin cần thiết.
c. Sử dụng chức năng lọc thông tin của các công cụ để hạn chế tiếp nhận những
thông tin không liên quan nếu cần thiết. Nhƣng thông thƣờng kết quả tìm kiếm đƣợc
có sự sắp xếp theo ƣu tiên nên chức năng này ít đƣợc sử dụng đối với ngƣời sử dụng.
* Xác định nội dung cần tìm kiếm
- Liên quan đến đề tài tập hợp và tổ chức dữ liệu gene phục vụ nghiên cứu cây
trồng biến đổi di truyền, chúng tôi sẽ tìm kiếm những nội dung liên quan đến những
tính trạng, những cây trồng đƣợc biến đổi di truyền trên Internet.
* Lựa chọn công cụ tìm kiếm
- Hiện nay có rất nhiều công cụ khác nhau cho tìm kiếm trang web và các ấn
phẩm bài báo. Sau đây là một vài công cụ tìm kiếm phổ biến:
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
59
Công cụ search Địa chỉ Kích thƣớc danh mục đƣợc
báo cáo
Google 560M
AltaVista 350M
FAST 340M
Northern Light 265M
Excite 250M
HotBot 110M
Lycos 110M
MetaCrawler ND
Scirus 69M
(chỉ cho khoa học)
Bảng 2.1: Địa chỉ những phƣơng tiện tìm kiếm trên Internet cùng với dung lƣợng danh
mục (tƣơng đƣơng với số lƣợng tài liệu danh mục)
- Trong đề tài này chúng tôi chọn tìm kiếm tài liệu điện tử, các ấn phẩm, bài báo
khoa học về các tính trạng, cây trồng biến đổi di truyền ở trên bằng hai công cụ tìm
kiếm sau:
Google (
Scirus (
- Quá trình tìm kiếm để có đƣợc thông tin thật sự cần thiết đúng nhƣ yêu cầu, cần
phải sử dụng rất nhiều từ khóa khác nhau để có đƣợc thông tin thật sự hữu ích. Một số
tài liệu, báo cáo khoa học xuất hiện sau khi gõ những từ khóa ngắn gọn nhƣng có
những loại tài liệu phải đăng ký là thành viên mới có đƣợc những loại tài liệu này.
- Sau đây là kết quả điển hình tìm đƣợc qua quá trình tìm kiếm tài liệu điện tử,
bài báo, báo cáo khoa học thông qua hai công cụ tìm kiếm ở trên (Google, Scirus).
Kết quả 1: Tìm kiếm bằng Google.com với từ khóa là “global AND status AND
GM AND crops”, chọn loại tài liệu tìm kiếm là PDF.
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
60
Hình 2.1: Trang kết quả tìm kiếm bằng Google sau khi nhập từ khóa:
“global AND status AND GM AND crops”
Kết quả 2: Tìm kiếm tài liệu bằng Scirus.com cũng với từ khóa “global AND
status AND GM AND crops”, loại tài liệu PDF và chỉ thuộc lĩnh vực khoa học sinh
học và nông nghiệp.
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
61
Hình 2.2: Trang tìm kiếm Scirus.com nâng cao
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
62
Hình 2.3: Trang kết quả của Scirus sau khi tìm kiếm
* Ngoài cách tìm kiếm bằng hai công cụ ở trên, chúng tôi còn tìm kiếm thông tin
về các tính trạng, cây trồng biến đổi di truyền trên những trang web, tạp chí khoa học
chuyên ngành trên mạng Internet nhƣ:
- Tìm ở trang PubMed của cở sở dữ liệu NCBI:
/entrez/query.fcgi?db=PubMed, quá trình tìm kiếm thực hiện nhƣ sau:
Vào trang chủ NCBI Homepage.
Hình 2.4: Trang chủ NCBI
Nhấp chọn dòng Entrez trên menu trang chủ NCBI để vào trang Entrez, chọn
dòng PubMed để vào trang Entrez PubMed.
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
63
Hình 2.5: Trang Entrez PubMed của NCBI
Trong khung tìm kiếm chúng ta có thể nhập vào những yêu cầu cần tìm kiếm
nhƣ: tên các bài báo, tên ấn phẩm khoa học, tài liệu sinh học, …
Hình 2.6: Trang kết quả Entrez PubMed sau khi tìm kiếm
Kết quả sẽ xuất hiện dƣới dạng một danh sách các mục bài (entries, hits) với tên
tác giả, tựa đề bài báo, tên tạp chí, năm xuất bản …. Chúng ta có thể thay đổi
kiểu thể hiện kết quả bằng cách chọn kiểu thể hiện ở menu Display (Summary,
Brief, Abstract, Citation, ASN.1, MEDLINE, …).
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
64
- Tìm thông tin trong trang web Đây là trang web
chuyên cung cấp thông tin về tình hình cây trồng biến đổi di truyền đƣợc thu thập trên
khắp thế giới.
Hình 2.7: Trang chủ Agbios.com
* Giai đoạn chọn lọc thông tin
- Sau khi các công cụ tìm kiếm xuất ra kết quả trên màn hình, có rất nhiều thông
tin liên quan đến từ khóa đã nhập, ở giai đoạn này ta phải vào từng kết quả để tìm hiểu
và chọn lọc kết quả đúng yêu cầu của mình. Các tính trạng đƣợc chọn lọc, tổng hợp
thành các “Bảng thống kê danh sách các tính trạng và cây trồng biến đổi di
truyền” (Xem phụ lục A)
II.2. Tổng hợp dữ liệu Primer dùng trong phát hiện GMO
Để tìm thông tin về primer đƣợc dùng trong phát hiện GMO, chúng tôi xác định
keyword và tìm thông tin trên trang web tìm kiếm Google.
Đầu tiên vào địa chỉ trang chủ Google (
Đánh keyword: “methods detect GMO” vào trong khung tìm kiếm.
Bấm nút tìm kiếm.
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu bài báo
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
65
Hình 2.8: Kết quả tìm kiếm bằng Google với keyword “methods detect GMO”
Ta đƣợc tổng cộng 26.100 nội dung có chứa Keyword đó.
Ta phải xét từng nội dung, xem nội dung nó thế nào. Thông thƣờng ta nên tìm
kiếm khoảng 20 kết quả đầu tiên. Nếu không thấy kết quả cần tìm ta thay đổi
keyword khác.
Sau khi tìm kiếm nhiều lần với nhiều keyword khác nhau. Kết quả có rất nhiều
bài báo nói về primer dùng trong chẩn đoán GMO, chúng đƣợc chọn lọc và
tổng hợp thành “Bảng thống kê tổng hợp Primer dùng trong chẩn đoán
GMO” (Xem phụ lục C)
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
66
III. Thu thập trình tự các gene dùng trong cây trồng biến đổi di truyền
III.1. Tìm kiếm trình tự Sinh học với Keyword
- Đây là dạng trình tự sinh học đƣợc lƣu trữ phổ biến trong các cơ sở dữ liệu sinh
học. Hiện nay, các thông tin này đƣợc lƣu trữ chủ yếu trong các cơ sở dữ liệu lớn trên
thế giới nhƣ hệ thống GenBank (NCBI), EMBL (European Molecular Biology
Laboratory), DDBJ (DNA Database of Japan) và một số hệ thống cơ sở dữ liệu khác
trên thế giới.
- Thông tin trong các cơ sở dữ liệu này là rất lớn và luôn đƣợc cập nhật thƣờng
xuyên (sau mỗi 24 giờ).
- Trong phạm vi đề tài tập hợp và tổ chức dữ liệu gene phục vụ nghiên cứu cây
trồng biến đổi di truyền, chúng tôi chỉ sử dụng cơ sở dữ liệu NCBI để tiến hành tìm
kiếm.
- Để tìm những trình tự DNA chúng tôi sử dụng trang Entrez Nucleotide để tìm
kiếm trong hệ thống cơ sở dữ liệu về trình tự DNA thế giới.
* Nguyên tắc tìm kiếm trình tự bằng Keyword
- Để tìm đƣợc trình tự mong muốn, trƣớc hết chúng ta phải nắm rõ quy luật tìm
kiếm dạng này để có đƣợc thông tin theo yêu cầu.
- Mục đích của ta là lấy trình tự trong cơ sở dữ liệu. Trƣớc khi tìm kiếm ta phải
tìm hiểu cấu trúc của loại dữ liệu này, và cách thức tìm chúng. (Xem phụ lục B)
* Các bƣớc thực hiện:
Vào trang chủ NCBI ( Chọn dòng Nucleotide để
đƣa chúng ta đến trang Entrez Nucleotide. Nhập vào từ khóa cần tìm kiếm.
Hình 2.9: Trang Entrez Nucleotide với từ khóa cần tìm
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
67
Kết quả sẽ xuất hiện một danh sách chỉ mục các trình tự DNA.
Hình 2.10: Trang kết quả của Entrez Nucleotide sau tìm kiếm
Có nhiều cách để lấy kết quả về, để thuận lợi cho việc xử lý dữ liệu về sau ta
chọn cách lấy dạng text. Cách lấy nhƣ sau:
o Chọn mục send to, chọn text.
o Kết quả nhƣ sau:
Hình 2.11: Trang kết quả Entrez Nucleoide dạng text
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
68
o Ta chọn File/Save As, lƣu về chọn đuôi *.txt.
Entrez là công cụ tìm kiếm dựa trên các ký tự query ta nhập vào. Khi query đƣợc
nhập, Entrez sẽ tự động dịch query theo qui định của Entrez với khả năng tìm kiếm
cao nhất. Để xem query đƣợc dịch nhƣ thế nào, ta chọn lớp Details. Chức năng này thì
hữu ích trong trƣờng hợp ta không tìm thấy kết quả, hoặc ra kết quả không đúng mong
muốn. Trong trƣờng hợp này, ta xem cách dịch query của Entrez để có thể điều chỉnh
query chính xác hơn.
Xét ví dụ sau: ta tiến hành tìm kiếm trình tự quy định tính kháng thuốc diệt cỏ
trên loài cỏ Creeping Bentgrass.
o Nhập query: “Creeping Bentgrass [ORGN] Herbicide tolerance” vào khung tìm
kiếm trên trang Entrez Nucleotide. Sẽ không có kết quả nào đƣợc tìm thấy. Chọn mục
Details để xem chi tiết hơn.
Hình 2.12: Kết quả sau khi nhấp vào mục Details
o Mục details cung cấp thông tin chi tiết về query của ta, và kết quả tìm kiếm với
query này. Ở đây query của ta không đƣợc Entrez dịch, và cụm từ “Creeping
Bentgrass” [ORGN] không đƣợc tìm thấy trong trƣờng sinh vật. Vì thế không có kết
quả đƣợc trả về.
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
69
o Thông tin này chứng tỏ ta đánh sai từ “Creeping Bentgrass” hoặc tên này không
có trong trƣờng sinh vật, muốn lấy đƣợc thông tin từ loài này phải có thêm thông tin
về nó.
o Creeping Bentgrass là một loại cỏ mọc quanh năm trên các cánh đồng cỏ có tên
khoa học là Agrostis stolonifera. Loại cỏ này thƣờng trồng trong các sân golt vì các
đặc tính độc đáo của nó.
o Thông thƣờng ta không cần phải dùng tên khoa học để tìm kiếm (vì NCBI có cơ
sở dữ liệu Taxanomy bao gồm cả tên thông thƣờng và tên khoa học của các sinh vật, vì
thế nếu một sinh vật có tên thông thƣờng trong Taxanomy ta không cần dùng tên khoa
học của chúng). Trong trƣờng hợp này, ta phải dùng tên khoa học để tìm kiếm.
o Ta nhập lại vào khung tìm kiếm với tên khoa học query nhƣ sau: “Agrostis
stolonifera” [ORGN] Herbicide tolerance.
Hình 2.13: Nhập từ khóa cần tìm vào khung tìm kiếm
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
70
o Vẫn không có kết quả nào đƣợc tìm thấy. Ta xem chi tiết trong mục Details.
Hình 2.14: Xem chi tiết (Details) khi kết quả không tìm thấy
o Query của ta đƣợc hệ thống Entrez dịch ra và tìm kiếm trên thông tin đƣợc dịch
này. Kết quả trả lại là 0 nghĩa là không có record nào mang đồng thời các từ trong
query.
Tìm kiếm bằng keyword đòi hỏi phải kiên nhẫn, thay đổi các keyword thƣờng
xuyên một cách hợp lý thì mới có thể đem về các thông tin mong muốn đƣợc.
III.2. Tìm kiếm trình tự Sinh học với Primer
- Tìm trình tự bằng primer dựa vào công cụ BLAST trên NCBI.
Đầu tiên ta truy cập vào trang Homepage của NCBI tại địa chỉ
Ta chọn vào mục BLAST trên trang chủ. Sẽ xuất hiện trang sau:
Hình 2.15: Trang BLAST của cơ sở dữ liệu NCBI
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
71
Tất cả các chƣơng trình BLAST đƣợc liệt kê tại đây. Ta chọn chƣơng trình
“Search for short, nearly exact matches” trong BLAST nucleotide. Xuất hiện trang
sau:
Hình 2.16: Trang BLAST Nucleotide của NCBI
Ta nhập trình tự mồi vào khung search nhƣ sau:
Hình 2.17: Khung nhập trình tự
Đây là cách nhập trình tự theo định dạng FASTA, phần chú thích về trình tự đƣợc
viết sau dấu “>”. Trình tự mồi xuôi và mồi ngƣợc đƣợc nối ở giữa với 20 ký tự N hay
nhiều hơn (Blast-Helpgroup, 2004). Các trình tự mồi xuôi và ngƣợc không cần phải
chuyển đổi sang mạch bổ sung vì chƣơng trình sẽ tự động tìm kiếm trên cả hai mạch.
Mục Set subsequence: mục này cho ta chỉ tìm kiếm nội dung một đoạn nào đó
trong trình tự nhập vào (trình tự query).
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
72
Choose database: giới hạn phạm vi cơ sở dữ liệu tìm kiếm trong các cơ sở dữ
liệu của chƣơng trình BLAST. Chƣơng trình BLAST đƣợc phân ra rất nhiều cơ sở dữ
liệu (chi tiết xem tại địa chỉ
Ở đây ta chọn cơ sở dữ liệu nr (non-redundant) nội dung của nó bao gồm All GenBank
+ EMBL + DDBJ + PDB sequences ( không bao gồm các trình tự EST, STS, GSS hay
phase 0, 1 hay 2 của trình tự HTGS).
Trình tự query là cặp primer:
i. Forward 5‟-GGTGAGCTGTATAATCGAGCGA-3‟
ii. Reverse 5‟-GGCGCAGCATCGGCT-3‟
Marta Hernandez và ctv -2001 dùng trong kỹ thuật real-time PCR để định lƣợng
và định tính gene BnACCg8 (Accession number X77576) trong Rapeseed (Brassica
napus). Vị trí bắt cặp của primer forward 9652-9673, reverse 9741-9755 trong trình tự
gene BnACCg8.
Tiếp theo ta chọn một vài thông số khác trong phần sau:
Hình 2.18: Phần tùy chọn của trang BLAST Nucleotide
Các tùy chọn này hỗ trợ cho bạn đạt đƣợc kết quả mong muốn hơn:
Limit by entrez query: mục này cho bạn giới hạn cơ sở dữ liệu bạn muốn
tìm kiếm với keyword. Muốn thực hiện đƣợc sự giới hạn này phải biết các keyword
nào có giá trị để dùng. Chi tiết phần này có thể tham khảo tại địa chỉ
Hay bạn có thể
chọn lựa trong khung bên cạnh để giới hạn cơ sở dữ liệu tìm kiếm.
Choose filter: phần này giúp ta loại bỏ những trình tự có mức độ phức
tạp thấp (Low complexity), ví dụ nhƣ: AAATAAAAAAAATAAAAAAT. Trong việc
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
73
tìm kiếm nếu ta tắt