Luận văn Mã hóa băng con ứng dụng trong xử lý tiếng nói

Trong lịch sửphát triển, một trong những tiến bộquan trọng nhất trong mã hóa âm thanh là việc phát minh ra bộmã hóa băng con (Subband Coding – SBC). Ứng dụng đầu tiên của mã hóa băng con trong xử lý âm thanh số theo chuẩn MPEG/audio. Chuẩn MPEG/audio ra đời vào năm 1990 bởi ISO/IEC, được ứng dụng rộng rãi, trong đó có phát thanh sốvô tuyến. Ngoài ra, ATRAC cũng là thuật toán mã hóa băng con, được phát minh bởi Sony và được ứng dụng trong ghi đọc âm thanh trên MiniDisc, phát thanh sốtrên Internet. Hiện nay, phát thanh Việt nam đang nghiên cứu để chuyển đổi từ phát thanh tương tựsang phát thanh số. Một sốnước đã và đang phát triển hệthống phát thanh sốriêng. Các hệthống phát thanh sốhiện nay trên thếgiới đều dùng kỹthuật mã hóa băng con đểnén dữliệu âm thanh, với tỷlệnén rất cao. Mã hóa băng con là một trong những thuật toán mã hóa nén dữliệu có tổn hao, đã được ứng dụng trong mã hóa âm thanh. Việc nghiên cứu SBC (Subband Coding) trong việc nén dữliệu âm thanh và ứng dụng nó trong phát thanh sốcó ý nghĩa quan trọng trong việc định hướng cho phát thanh số ởViệt nam. Đó cũng là lý do đểem lựa chọn nghiên cứu và thực hiện đềtài này.

pdf104 trang | Chia sẻ: tuandn | Lượt xem: 3201 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Mã hóa băng con ứng dụng trong xử lý tiếng nói, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
LỜI CAM ĐOAN Tôi xin cam đoan: Những kết quả nghiên cứu, các số liệu, hình vẽ, biểu bảng, kết quả tính toán được trình bày trong luận văn là hoàn toàn trung thực, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và pháp luật Việt Nam. TÁC GIẢ LUẬN VĂN Đào Văn Đã DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT 1. SBC(442) Mã hóa băng con 3 kênh dùng tổ hợp phân chia [4, 4, 2] 2. SBC(8842) Mã hóa băng con 4 kênh dùng tổ hợp phân chia [8,8,4,2] 3. Tone Một thành phần đơn âm 4. ∆f Độ rộng dải tần của tín hiệu (đơn vị là Hz) 5. BB Độ rộng dải thông của bộ lọc thông dải(đơn vị là rad) 6. Bbkn Hệ số của bộ lọc thông dải đã nhân với kn phụ thuộc vào n 7. Bbn Hệ số của bộ lọc thông dải phụ thuộc vào n 8. BH Độ rộng dải thông của bộ lọc thông cao (đơn vị là rad) 9. bi Số bit cấp cho dải con thứ i 10. BL Độ rộng dải thông của bộ lọc thông thấp (đơn vị là rad) 11. bTB Số bit trung bình/mẫu trong mã hóa băng con 12. bTBi Số bit trung bình/mẫu cấp cho tín hiệu băng con thứ i 13. Btr Độ rộng dải chuyển tiếp của bộ lọc (đơn vị là rad) 14. D Hệ số phân chia của bộ phân chia 15. F Tần số (đơn vị Hz) 16. fmax Tấn số cực đại của tín hiệu âm thanh (đơn vị Hz) 17. fSr Tần số lấy mẫu của tín hiệu đầu ra 18. fSv Tần số lấy mẫu của tín hiệu đầu vào. 19. G Đáp ứng biên độ của bộ lọc 20. GB Đáp ứng biên độ của bộ lọc thông dải 21. GBdB Đáp ứng biên độ của bộ lọc thông dải tính dB 22. GdB Đáp ứng biên độ của bộ lọc tính theo dB 23. GH Đáp ứng biên độ của bộ lọc thông cao 24. GHdB Đáp ứng biên độ của bộ lọc thông cao tính dB 25. GL Đáp ứng biên độ của bộ lọc thông thấp 26. GLdB Đáp ứng biên độ của bộ lọc thông thấp tính dB 27. HB(ejF) Đáp ứng tần số của bộ lọc thông dải theo thang tần số F 28. Hbkn Hệ số của bộ lọc thông cao đã nhân với kn phụ thuộc vào n 29. Hbn Hệ số của bộ lọc thông cao phụ thuộc vào n 30. HH(ejF) Đáp ứng tần số của bộ lọc thông cao theo thang tần số F 31. HL(ejF) Đáp ứng tần số của bộ lọc thông thấp theo thang tần số F 32. kn Hàm cửa sổ 33. L Hệ số nội suy của bộ nội suy 34. Lbkn Hệ số của bộ lọc thông thấp đã nhân với kn phụ thuộc vào n 35. Lbn Hệ số của bộ lọc thông thấp phụ thuộc vào n 36. M Số kênh trong bộ mã hóa băng con 37. N Bậc của bộ lọc 38. ni Hệ số phân chia của dải con thứ i 39. p Cấp phân chia trong phân tích Wavelet 40. R Tốc độ bit trong SBC 41. Ts Chu kỳ lấy mẫu (đơn vị là giây) 42. TSr Chu kỳ lấy mẫu của tín hiệu đầu ra 43. TSv Chu kỳ lấy mẫu của tín hiệu đầu vào. 44. X(ejω) Tín hiệu trong miền tần số liên tục 45. x(n) Tín hiệu trong miền thời gian rời rạc chuẩn hóa theo Ts 46. X(z) Tín hiệu trong miền z 47. δp Độ gợn sóng trong dải thông của bộ lọc 48. δs Độ gợn sóng trong dải chắn của bộ lọc 49. ε Lỗi khôi phục trong mã hóa băng con 50. ωcB1 Tần số cắt dưới của bộ lọc thông dải (đơn vị là rad) 51. ωcB2 Tần số cắt trên của bộ lọc thông dải (đơn vị là rad) 52. ωcH Tần số cắt của bộ lọc thông cao (đơn vị là rad) 53. ωsB1 Tần số giới hạn dưới của bộ lọc thông dải ở mức -20dB ( rad) 54. ωsB2 Tần số giới hạn trên của bộ lọc thông dải ở mức -20dB ( rad) 55. ωsH Tần số giới hạn của bộ lọc thông cao ở mức -20dB ( rad) 56. ωsL Tần số giới hạn của bộ lọc thông thấp ở mức -20dB (rad) 57. ADC Analog to Digital Converter Bộ chuyển đổi tương tự sang số 58. ATRAC Adaptive Transform Acoustic Coding Mã hóa âm thanh biến đổi thích nghi. 59. BPF Bandpass Filter Bộ lọc thông dải 60. CD Compact Disc Đĩa Compact 61. DAC Digital to Analog Converter Bộ chuyển đổi số sang tương tự 62. DF Digital Filter Bộ lọc số Bộ lọc số 63. DFT Discrete Fourier Transform Biến đổi Fourier rời rạc 64. FFT Fast Fourier Transform Biến đổi Fourier nhanh. 65. FIR Finite Impulse Response Đáp ứng xung hữu hạn 66. HPF Highpass Filter Bộ lọc thông cao 67. IDFT Inverse Discrete Fourier Transform Biến đổi Fourier rời rạc ngược. 68. IEC International Electrotechnical Commission Ủy ban Điện quốc tế 69. IIR Infinite Impulse Response Đáp ứng xung vô hạn 70. ISO International Organization for Standardization Tổ chức tiêu chuẩn quốc tế. 71. LPF Lowpass Filter Bộ lọc thông thấp 72. MDCT Modified Discrete Cosine Transform Biến đổi cosin rời rạc 73. MPEG/audio Motion Picture Experts Group/audio Nhóm chuyên gia hình ảnh chuyển động/âm thanh 74. PASC Precision Adaptive Subband Coding Mã hóa băng con thích nghi chính xác 75. QMF Quadrature Mirror Filter Bộ lọc gương cầu phương 76. SBC SubBand Coding Mã hóa băng con DANH MỤC CÁC BẢNG trang Bảng 1.1.1 : Các phép toán cơ bản của xử lý tín hiệu 17 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Chương 1: Cơ bản về bộ lọc và bank lọc số trang Hình 1.5.1: Đáp ứng biên độ của bộ lọc số thông thấp 10 Hình 1.7.1: Bộ phân chia 12 Hình 1.7.2: Bộ phân chia 12 Hình 1.7.3: Phổ của một tín hiệu x(n) 13 Hình 1.7.4: Phổ của tín hiệu ra bộ phân chia với hệ số D = 2 14 Hình 1.7.5: Sơ đồ tương đương của bộ lấy mẫu Fs = Fnsy 15 Hình 1.7.6: Ký hiệu bộ nội suy trong miền n 15 Hình 1.7.7: Bộ nội suy 16 Hình 1.7.8: Phổ của một tín hiệu x(n) 17 Hình 1.7.9: Phổ của tín hiệu tại đầu ra bộ nội suy với L = 2 17 Hình 1.7.10: Bộ biến đổi nhịp với hệ số L D 18 Hình 1.7.11: Ký hiệu bộ biến đổi nhịp hệ số L D 19 Hình 1.7.12: Y↓↑2/3(ejω) và Y↑↓2/3(ejω) 20 Hình 1.7.13: Sơ đồ tổng quát của bộ lọc nội suy 21 Hình 1.7.14: Y↑2H(ejω) 22 Hình 1.7.15: Bộ lọc biến đổi nhịp hệ số D/L 23 Hình 1.7.16: Sơ đồ khối của bộ lọc biến đổi nhịp hệ số D/L 24 Hình 1.8.1: Cấu trúc của bank lọc số phân tích 25 Hình 1.8.2: Cấu trúc của bank lọc số tổng hợp 25 Hình 1.9.1: Bank lọc số nhiều nhịp 2 kênh 26 Hình 1.9.2: Một vài trường hợp của đáp ứng biên độ 27 Hình 1.9.3: Phổ tín hiệu vào, ra bộ lọc số lý tưởng 29 Hình 1.9.4: Sơ đồ tổng quát của bank lọc số M kênh 30 Chương 2: Mã hóa băng con Hình 2.1.1: Sơ đồ mã hoá băng con 2 kênh Hình 2.1.2: Sơ đồ mã hoá băng con tổng quát M kênh 31 32 Hình 2.1.3: Bank lọc phân tích 4 kênh đơn phân giải 34 Hình 2.1.4: Bank lọc tổng hợp 4 kênh đơn phân giải 34 Hình 2.1.5: Bank lọc số 4 kênh 35 Hình 2.1.6: Bank lọc phân tích 2 tầng đa phân giải 36 Hình 2.1.7: Bank lọc tổng hợp 2 tầng đa phân giải 36 Hình 2.1.8: Quá trình mã hóa băng con 37 Hình 2.1.9: Phân bố các băng con theo các hệ số phân chia 39 Hình 2.1.10: Quan hệ giữa đầu ra và đầu vào của bộ phân chia 42 Hình 2.1.11: Tín hiệu vào (a) và tín hiệu ra (b) của bộ phân chia trong miền thời gian rời rạc, đã chuẩn hoá theo chu kỳ lấy mẫu. 43 Hình 2.1.12: Phổ của tín hiệu vào (a) và tín hiệu ra (b) bộ phân chia D = 2. 43 Hình 2.1.13: Quan hệ giữa đầu ra và đầu vào của bộ nội suy 43 Hình 2.1.14: Tín hiệu vào (a) và tín hiệu ra (b) của bộ nội suy trong miền thời gian rời rạc, đã chuẩn hoá theo chu kỳ lấy mẫu. 44 Hình 2.1.15: Phổ của tín hiệu vào (a) và tín hiệu ra (b) bộ nội suy với L = 2. 44 Hình 2.2.1: Minh họa các bộ lọc có dải chuyển tiếp bằng nhau 47 Hình 2.2.2: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp trực tiếp theo đáp ứng tần số với N = 20. 50 Hình 2.2.3: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp trực tiếp theo đáp ứng tần số với N = 40. 50 Hình 2.2.4 : Đáp ứng biên độ của LPF với các dải chuyển tiếp 50 Hình 2.2.5 : Đáp ứng biên độ của BPF với các dải chuyển tiếp 52 Hình 2.2.6 : Đáp ứng biên độ của HPF với các dải chuyển tiếp 54 Hình 2.2.7: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp ấn định dải chuyển tiếp với N = 20, tgα=40/π. 56 Hình 2.2.8: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp ấn định dải chuyển tiếp với N = 40, tgα=40/π. 56 Hình 2.2.9: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp dải chuyển tiếp - cửa sổ với N = 20, tgα=40/π, cửa sổ Hamming. 59 Hình 2.2.10: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp dải chuyển tiếp - cửa sổ với N = 40, tgα=40/π, cửa sổ Hamming. 60 Hình 3.2.1: Các băng con tại đầu ra bank lọc phân tích nhiều nhịp đơn phân giải 61 Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói Hình 3.2.2: Bank lọc phân tích nhiều nhịp đơn phân giải 62 Hình 3.2.3: Bank lọc tổng hợp nhiều nhịp đơn phân giải 63 Hình 3.2.4:Các băng con tại đầu ra bank lọc phân tích nhiều nhịp đa phân giải 64 Hình 3.2.5: Bank lọc phân tích nhiều nhịp đa phân giải 64 Hình 3.2.6: Bank lọc tổng hợp nhiều nhịp đa phân giải 66 Hình 3.3.1: Phân chia băng con và tạo khung dữ liệu của các lớp MPEG-1/audio 67 Hình 3.3.2: Bộ mã hóa MPEG-1/audio 68 Hình 3.3.3: Sơ đồ khối bộ SBC(442) 72 Hình 3.3.4: Sơ đồ khối mã hóa âm thanh theo thuật toán ATRAC1 72 Hình 3.3.5: Phổ tần của tín hiệu vào x(n) 72 Hình 3.3.6: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ lọc 73 Hình 3.3.7: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ phân chia 74 Hình 3.3.8: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ nội suy 75 Hình 3.3.5: Sơ đồ khối bộ SBC(8842) 76 Hình 3.4.1: Các dải con ứng với tổ hợp phân chia [6,3,2] 78 Hình 3.4.2: Sơ đồ khối bộ mã hóa băng con SBC(632) 79 Hình 3.4.4: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn N= 10, α= 750 83 Hình 3.4.5: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn N= 12, α= 780 83 Hình 3.4.6: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn N= 20, α= 82,50 83 Hình 3.4.7: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn N= 35, α= 85,50 83 Hình 3.4.8: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn N= 100, α= 88,50 84 Hình 3.4.4: Phổ tần của tín hiệu vào x(n) khi fs = fNy 85 Hình 3.4.4: Phổ tần của tín hiệu băng con tại đầu ra bank lọc phân tích 86 Hình 3.4.6: Phổ tần của tín hiệu băng con tại đầu ra bank lọc tổng hợp 87 Hình 3.4.7: Phổ tần của 3 tín hiệu dải con sau khi qua các bộ lọc nôi suy 88 Hình 3.4.8: Phổ tần của 3 tín hiệu dải con sau khi qua các bộ lọc tổng hợp 89 Hình 3.4.9: Phổ tần của 3 tín hiệu ra y(n) 89 MỤC LỤC Trang Danh mục các ký hiệu, các chữ viết tắt Danh mục các bảng Danh mục các hình vẽ, đồ thị MỞ ĐẦU 1 Chương 1: Cơ bản về bộ lọc và bank lọc số 1.1. Giới thiệu chung về bộ lọc số 5 1.2. Các loại bộ lọc số 1.3. Bộ lọc số đa nhịp và các băng lọc 6 7 1.4. Tính ưu việt của bộ lọc số 8 1.5. Các chỉ tiêu thiết kế của bộ lọc số 1.6. Vai trò của cửa sổ 1.7. Thay đổi nhịp lấy mẫu 9 11 1.7.1. Khái niệm phân chia và nội suy 12 1.7.2. Thay đổi nhịp lấy mẫu với hệ số D/L 18 1.7.3. Bộ lọc nội suy 21 1.7.4. Bộ lọc biến đổi nhịp lấy mẫu với hệ số D/L không nguyên 23 1.8. Bank lọc số 24 1.8.1. Định nghĩa bank lọc số 24 1.8.2. Định nghĩa bank lọc số phân tích 24 1.8.3. Định nghĩa bank lọc số tổng hợp 25 1.9. Bank lọc số nhiều nhịp hai kênh 1.9.1. Bank lọc số nhiều nhịp 2 kênh và bank lọc gương cầu phương 26 26 1.9.2. Bank lọc số nhiều nhịp M kênh 30 Chương 2: Mã hóa băng con 2.1. Tổng quan về mã hóa băng con 31 2.1.1. Giới thiệu 31 2.1.2. Cấu trúc dạng cây của bank lọc số 33 2.1.3. Nguyên lý mã hóa băng con 36 2.1.4. Các thông số kỹ thuật của SBC 38 2.1.5. Các điều kiện của mã hóa băng con 41 2.1.6. Điều kiện để tăng hệ số nén tín hiệu trong mã hóa băng con 44 2.2. Thiết kế bộ lọc FIR bằng phương pháp kết hợp dải chuyển tiếp-cửa sổ 46 2.2.1. Giới thiệu 46 2.2.2. Thiết kế bộ lọc FIR bằng phương pháp trực tiếp 48 2.2.3. Thiết kế bộ lọc FIR bằng phương pháp dải chuyển tiếp 50 2.2.4. Thiết kế bộ lọc FIR bằng phương pháp dải chuyển tiếp-cửa sổ 56 Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói 3.1. Giới thiệu 3.2. Bank lọc theo phân tích Wavelet 61 61 3.2.1. Bank lọc nhiều nhịp đơn phân giải 61 3.2.2. Bank lọc nhiều nhịp đa phân giải 64 3.3. Mã hóa băng con đã ứng dụng trong xử lý âm thanh số 66 3.3.1. Chuẩn âm thanh số MPEG/audio 66 3.3.2. Thuật toán PASC 70 3.3.3. Thuật toán ATRAC 3.4 Đề xuất phương pháp xác định tổ hợp phân chia 3.4.1 Phương pháp phân chia liên tiếp cộng cuối 3.4.2 Xác định tổ hợp phân chia tối ưu 3.4.3 Ứng dụng vào mã hóa băng con SBC(632) 71 77 77 78 78 3.4.4 Biến đổi hệ số và so sánh kết quả SBC(632) với SBC(442) 85 KẾT LUẬN & KIẾN NGHỊ TÀI LIỆU THAM KHẢO 92 PHỤ LỤC 1 MỞ ĐẦU Các loại tín hiệu trong tự nhiên, tiếng nói là một trong những tín hiệu được nghiên cứu nhiều nhất và sớm nhất do mục đích cơ bản nhất của các hệ thống thông tin là truyền đi tiếng nói. Ứng dụng âm thanh trong lĩnh vực thông tin rất đa dạng như phát thanh vô tuyến, phát thanh qua vệ tinh, qua cáp quang, truyền âm thanh qua Internet, ghi và phát lại âm thanh, điện thoại, nhận diện qua tiếng nói, chuyển đổi văn bản âm thanh, các phần mềm ghi đọc âm thanh, âm thanh trong truyền hình, âm thanh đa kênh trong DVD và phim ảnh, âm thanh trong các ứng dụng truyền thông đa phương tiện khác. Trong lịch sử phát triển, một trong những tiến bộ quan trọng nhất trong mã hóa âm thanh là việc phát minh ra bộ mã hóa băng con. Tất cả các mã hóa băng con đã ứng dụng theo phân tích Wavelet có hai dạng: +Mã hóa băng con đơn phân giải. +Mã hóa băng con đa phân giải tương đối. Đối với mã hóa băng con đơn phân giải: Hiện nay, trong mã hóa – nén tín hiệu âm thanh có chuẩn MPEG/audio ra đời năm 1990. Chuẩn này thực hiện mã hóa băng con đơn phân giải với 32 băng con bằng nhau. Ưu điểm nhất của chuẩn MPEG/audio là hệ số nén dữ liệu cao nhưng chất lượng âm thanh vẫn đảm bảo. Hiện nay, chuẩn MPEG/audio ra đời nhiều phiên bản khác, ứng dụng trong nhiều lĩnh vực. Nhược điểm cơ bản của MPEG/audio là số lượng băng con lớn, bank lọc phức tạp. Đối với mã hóa băng con đa phân giải tương đối: Hiện nay, đã ứng dụng chuẩn ATRAC do Sony phát minh, dùng mã hóa băng con đa phân giải tương đối 3 kênh và 4 kênh tương ứng các tổ hợp phân chia là [4 4 2] và [8 8 4 2]. Chuẩn ATRAC cho hệ số nén dữ liệu cao, chất lượng âm thanh tốt. Trong phạm vi đề tài này, em xin giới thiệu về mã hóa băng con đơn phân giải, đa phân giải tương đối 3 kênh và nghiên cứu mã hóa băng con đã được ứng dụng thực tế trong xử lý tín hiệu âm thanh số. Đồng thời đưa ra phương pháp thiết kế bộ lọc bằng phương pháp kết hợp dải chuyển tiếp-cửa sổ và giải pháp mới để xác định lại hệ số phân chia tối ưu hơn SBC đã ứng dụng trong thực tế. 2 Em xin chân thành cảm ơn viện đào tạo sau đại học, các thầy giáo, cô giáo trong viện điện tử viễn thông trường Đại học Bách khoa Hà nội, đặc biệt là thầy PGS.TS Nguyễn Quốc Trung đã hướng dẫn, giúp đỡ để em hoàn thành được luận văn này. 1. Lý do chọn đề tài: Trong lịch sử phát triển, một trong những tiến bộ quan trọng nhất trong mã hóa âm thanh là việc phát minh ra bộ mã hóa băng con (Subband Coding – SBC). Ứng dụng đầu tiên của mã hóa băng con trong xử lý âm thanh số theo chuẩn MPEG/audio. Chuẩn MPEG/audio ra đời vào năm 1990 bởi ISO/IEC, được ứng dụng rộng rãi, trong đó có phát thanh số vô tuyến. Ngoài ra, ATRAC cũng là thuật toán mã hóa băng con, được phát minh bởi Sony và được ứng dụng trong ghi đọc âm thanh trên MiniDisc, phát thanh số trên Internet. Hiện nay, phát thanh Việt nam đang nghiên cứu để chuyển đổi từ phát thanh tương tự sang phát thanh số. Một số nước đã và đang phát triển hệ thống phát thanh số riêng. Các hệ thống phát thanh số hiện nay trên thế giới đều dùng kỹ thuật mã hóa băng con để nén dữ liệu âm thanh, với tỷ lệ nén rất cao. Mã hóa băng con là một trong những thuật toán mã hóa nén dữ liệu có tổn hao, đã được ứng dụng trong mã hóa âm thanh. Việc nghiên cứu SBC (Subband Coding) trong việc nén dữ liệu âm thanh và ứng dụng nó trong phát thanh số có ý nghĩa quan trọng trong việc định hướng cho phát thanh số ở Việt nam. Đó cũng là lý do để em lựa chọn nghiên cứu và thực hiện đề tài này. 2. Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu. + Mục đích nghiên cứu: Mục đích của luận văn là nghiên cứu các vấn đề cơ bản của bộ lọc và bank lọc số nhiều nhịp, từ đó mô tả và xây dựng mô hình mã hóa băng con ứng dụng trong xử lý âm thanh số + Đối tượng và phạm vi nghiên cứu: Luận văn nghiên cứu mã hóa băng con đơn phân giải và đa phân giải tương đối theo phân tích wavelet. Cụ thể là chuẩn ATRAC (Adaptive Transform Acoustic Coding) mã hóa âm thanh biến đổi thích nghi do SONY phát minh dùng mã hóa dải con đa phân giải tương đối 3 kênh và 4 3 kênh với các tổ hợp phân chia [442] và [8842]. Luận văn nghiên cứu và đề xuất xây dựng bank lọc đa phân giải tương đối dùng phương pháp kết hợp dải chuyển tiếp- cửa sổ. Khảo sát chúng trên các file âm thanh khác nhau, kết quả kiểm chứng qua phần mềm Matlab. 3. Tóm tắt cô đọng các luận điểm cơ bản và đóng góp mới của tác giả Đối với mã hóa băng con đơn phân giải hiện nay trong mã hóa nén tín hiệu âm thanh có chuẩn MPEG/audio ra đời năm 1990. Chuẩn này thực hiện mã hóa với 32 dải con bằng nhau, tỷ lệ nén cao, cho chất lượng âm thanh tốt nhưng số lượng dải con lớn bank lọc phức tạp. Đối với đa phân giải tương đối, cụ thể là chuẩn ATRAC do SONY phát minh dùng mã hóa dải con đa phân giải tương đối 3 kênh và 4 kênh với các tổ hợp phân chia [442] và [8842] khắc phục được hạn chế về số kênh. Tuy nhiên có hạn chế là hệ số phân chia phải là lũy thừa của 2 và có ít nhất có 2 dải con có độ rộng bằng nhau, để khắc phục hạn chế đó luận văn đưa ra giải pháp thiết kế mới bằng cách thiết kế lại bộ lọc bên trong bằng phương pháp kết hợp dải chuyển tiếp –cửa sổ và thay đổi lại hệ số phân chia trong bank lọc phân tích và tổng hợp để đạt được ưu điểm hơn so với SBC đã ứng dụng bằng mô hình mới SBC 3 kênh tổ hợp phân chia [632] . 4. Phương pháp nghiên cứu. Luận văn nghiên cứu trên phương diện lý thuyết kết hợp với mô phỏng qua Matlab và phương pháp thống kê với nhiều file âm thanh khác nhau. 5. Nội dung của luận văn: Cấu trúc của luận văn gồm: Mở đầu Chương 1: Cơ bản về bộ lọc và bank lọc số Chương 2: Mã hóa băng con Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói Kết luận và kiến nghị; tài liệu tham khảo và phần phụ lục. Chương 1: Nghiên cứu các vấn đề cơ bản về bộ lọc & bank lọc số, bao gồm các phép toán, các loại bộ lọc số và các ưu, nhược điểm, các chỉ tiêu kỹ thuật yêu cầu khi thiết kế bộ lọc và các loại cửa sổ. Đồng thời nghiên cứu quá trình thay đổi 4 nhịp lấy mẫu gồm có phép phân chia và phép nội suy, bộ lọc biến đổi nhịp lấy mẫu gồm có bộ lọc phân chia và bộ lọc nội suy từ đó ứng dụng để tạo ra các bank lọc số. Chương 2: Nghiên cứu về cấu trúc, nguyên lý, thông số kỹ thuật và các điều kiện của mã hóa băng con. Đề xuất thiết kế phương pháp mới kết hợp dải chuyển tiếp-cửa sổ trong bộ lọc FIR. Chương 3: Nghiên cứu về mã hóa băng con đơn phân giải và đa phân giải tương đối, đưa ra mô hình mã hóa băng con đã ứng dụng trong xử lý âm thanh số theo chuẩn MPEG/audio của Sony. Giới thiệu thuật toán PASC, ATRAC. Phân tích thuật toán ATRAC1 và ATRAC3 áp dụng trong mã hóa âm thanh 3 và 4 kênh, với tổ hợp phân chia [442] và [8842]. Đề xuất mới phương pháp xác định tổ hợp phân chia tối ưu, từ đó so sánh kết quả đề xuất SBC(632) với bộ mã hóa đa phân giải tương đối 3 kênh SBC[442] (ATRAC1) đã ứng dụng trong thực tế. 5 Chương 1: Cơ bản về bộ lọc và bank lọc số 1.1. Giới thiệu chung về bộ lọc số Tín hiệu là biểu diễn vật lý của thông tin. Về mặt toán học tín hiệu được biểu diễn bởi hàm của một hoặc nhiều biến độc lập. Tín hiệu được chia làm hai nhóm lớn, đó là tín hiệu liên tục và tín hiệu rời rạc. Tín hiệu liên tục là tín hiệu luôn được xác định tại mọi thời điểm trong thời gian tồn tại của nó, gồm có tín hiệu tương tự và tín hiệu lượng tử hoá. Tín hiệu rời rạc là tín hiệu chỉ được xác định tại các thời điểm rời rạc cách biệt nhau, gồm có tín hiệu lấy mẫu và tín hiệu số. Tín hiệu số cũng như tín hiệu tương tự có thể biểu diễn bằng hàm của tần số và được gọi là phổ tần số của tín hiệu, phổ tần số chính là sự mô tả ý nghĩa tần số của tín hiệu. Lọc tín hiệu là quá trình mà tr