Trong lịch sửphát triển, một trong những tiến bộquan trọng nhất trong mã hóa
âm thanh là việc phát minh ra bộmã hóa băng con (Subband Coding – SBC). Ứng
dụng đầu tiên của mã hóa băng con trong xử lý âm thanh số theo chuẩn
MPEG/audio. Chuẩn MPEG/audio ra đời vào năm 1990 bởi ISO/IEC, được ứng
dụng rộng rãi, trong đó có phát thanh sốvô tuyến. Ngoài ra, ATRAC cũng là thuật
toán mã hóa băng con, được phát minh bởi Sony và được ứng dụng trong ghi đọc
âm thanh trên MiniDisc, phát thanh sốtrên Internet.
Hiện nay, phát thanh Việt nam đang nghiên cứu để chuyển đổi từ phát thanh
tương tựsang phát thanh số. Một sốnước đã và đang phát triển hệthống phát thanh
sốriêng. Các hệthống phát thanh sốhiện nay trên thếgiới đều dùng kỹthuật mã
hóa băng con đểnén dữliệu âm thanh, với tỷlệnén rất cao. Mã hóa băng con là
một trong những thuật toán mã hóa nén dữliệu có tổn hao, đã được ứng dụng trong
mã hóa âm thanh. Việc nghiên cứu SBC (Subband Coding) trong việc nén dữliệu
âm thanh và ứng dụng nó trong phát thanh sốcó ý nghĩa quan trọng trong việc định
hướng cho phát thanh số ởViệt nam. Đó cũng là lý do đểem lựa chọn nghiên cứu
và thực hiện đềtài này.
104 trang |
Chia sẻ: tuandn | Lượt xem: 3362 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Luận văn Mã hóa băng con ứng dụng trong xử lý tiếng nói, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
LỜI CAM ĐOAN
Tôi xin cam đoan:
Những kết quả nghiên cứu, các số liệu, hình vẽ, biểu bảng, kết quả tính toán
được trình bày trong luận văn là hoàn toàn trung thực, không vi phạm bất cứ điều gì
trong luật sở hữu trí tuệ và pháp luật Việt Nam.
TÁC GIẢ LUẬN VĂN
Đào Văn Đã
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
1. SBC(442) Mã hóa băng con 3 kênh dùng tổ hợp phân chia [4, 4, 2]
2. SBC(8842) Mã hóa băng con 4 kênh dùng tổ hợp phân chia [8,8,4,2]
3. Tone Một thành phần đơn âm
4. ∆f Độ rộng dải tần của tín hiệu (đơn vị là Hz)
5. BB Độ rộng dải thông của bộ lọc thông dải(đơn vị là rad)
6. Bbkn Hệ số của bộ lọc thông dải đã nhân với kn phụ thuộc vào n
7. Bbn Hệ số của bộ lọc thông dải phụ thuộc vào n
8. BH Độ rộng dải thông của bộ lọc thông cao (đơn vị là rad)
9. bi Số bit cấp cho dải con thứ i
10. BL Độ rộng dải thông của bộ lọc thông thấp (đơn vị là rad)
11. bTB Số bit trung bình/mẫu trong mã hóa băng con
12. bTBi Số bit trung bình/mẫu cấp cho tín hiệu băng con thứ i
13. Btr Độ rộng dải chuyển tiếp của bộ lọc (đơn vị là rad)
14. D Hệ số phân chia của bộ phân chia
15. F Tần số (đơn vị Hz)
16. fmax Tấn số cực đại của tín hiệu âm thanh (đơn vị Hz)
17. fSr Tần số lấy mẫu của tín hiệu đầu ra
18. fSv Tần số lấy mẫu của tín hiệu đầu vào.
19. G Đáp ứng biên độ của bộ lọc
20. GB Đáp ứng biên độ của bộ lọc thông dải
21. GBdB Đáp ứng biên độ của bộ lọc thông dải tính dB
22. GdB Đáp ứng biên độ của bộ lọc tính theo dB
23. GH Đáp ứng biên độ của bộ lọc thông cao
24. GHdB Đáp ứng biên độ của bộ lọc thông cao tính dB
25. GL Đáp ứng biên độ của bộ lọc thông thấp
26. GLdB Đáp ứng biên độ của bộ lọc thông thấp tính dB
27. HB(ejF) Đáp ứng tần số của bộ lọc thông dải theo thang tần số F
28. Hbkn Hệ số của bộ lọc thông cao đã nhân với kn phụ thuộc vào n
29. Hbn Hệ số của bộ lọc thông cao phụ thuộc vào n
30. HH(ejF) Đáp ứng tần số của bộ lọc thông cao theo thang tần số F
31. HL(ejF) Đáp ứng tần số của bộ lọc thông thấp theo thang tần số F
32. kn Hàm cửa sổ
33. L Hệ số nội suy của bộ nội suy
34. Lbkn Hệ số của bộ lọc thông thấp đã nhân với kn phụ thuộc vào n
35. Lbn Hệ số của bộ lọc thông thấp phụ thuộc vào n
36. M Số kênh trong bộ mã hóa băng con
37. N Bậc của bộ lọc
38. ni Hệ số phân chia của dải con thứ i
39. p Cấp phân chia trong phân tích Wavelet
40. R Tốc độ bit trong SBC
41. Ts Chu kỳ lấy mẫu (đơn vị là giây)
42. TSr Chu kỳ lấy mẫu của tín hiệu đầu ra
43. TSv Chu kỳ lấy mẫu của tín hiệu đầu vào.
44. X(ejω) Tín hiệu trong miền tần số liên tục
45. x(n) Tín hiệu trong miền thời gian rời rạc chuẩn hóa theo Ts
46. X(z) Tín hiệu trong miền z
47. δp Độ gợn sóng trong dải thông của bộ lọc
48. δs Độ gợn sóng trong dải chắn của bộ lọc
49. ε Lỗi khôi phục trong mã hóa băng con
50. ωcB1 Tần số cắt dưới của bộ lọc thông dải (đơn vị là rad)
51. ωcB2 Tần số cắt trên của bộ lọc thông dải (đơn vị là rad)
52. ωcH Tần số cắt của bộ lọc thông cao (đơn vị là rad)
53. ωsB1 Tần số giới hạn dưới của bộ lọc thông dải ở mức -20dB ( rad)
54. ωsB2 Tần số giới hạn trên của bộ lọc thông dải ở mức -20dB ( rad)
55. ωsH Tần số giới hạn của bộ lọc thông cao ở mức -20dB ( rad)
56. ωsL Tần số giới hạn của bộ lọc thông thấp ở mức -20dB (rad)
57. ADC Analog to Digital Converter Bộ chuyển đổi tương tự
sang số
58. ATRAC Adaptive Transform
Acoustic Coding
Mã hóa âm thanh biến đổi
thích nghi.
59. BPF Bandpass Filter Bộ lọc thông dải
60. CD Compact Disc Đĩa Compact
61. DAC Digital to Analog Converter Bộ chuyển đổi số sang
tương tự
62. DF Digital Filter Bộ lọc số Bộ lọc số
63. DFT Discrete Fourier Transform Biến đổi Fourier rời rạc
64. FFT Fast Fourier Transform Biến đổi Fourier nhanh.
65. FIR Finite Impulse Response Đáp ứng xung hữu hạn
66. HPF Highpass Filter Bộ lọc thông cao
67. IDFT Inverse Discrete Fourier
Transform
Biến đổi Fourier rời rạc
ngược.
68. IEC International
Electrotechnical
Commission
Ủy ban Điện quốc tế
69. IIR Infinite Impulse Response Đáp ứng xung vô hạn
70. ISO International Organization
for Standardization
Tổ chức tiêu chuẩn quốc tế.
71. LPF Lowpass Filter Bộ lọc thông thấp
72. MDCT Modified Discrete Cosine
Transform
Biến đổi cosin rời rạc
73.
MPEG/audio
Motion Picture Experts
Group/audio
Nhóm chuyên gia hình ảnh
chuyển động/âm thanh
74. PASC Precision Adaptive Subband
Coding
Mã hóa băng con thích nghi
chính xác
75. QMF Quadrature Mirror Filter Bộ lọc gương cầu phương
76. SBC SubBand Coding Mã hóa băng con
DANH MỤC CÁC BẢNG
trang
Bảng 1.1.1 : Các phép toán cơ bản của xử lý tín hiệu 17
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Chương 1: Cơ bản về bộ lọc và bank lọc số trang
Hình 1.5.1: Đáp ứng biên độ của bộ lọc số thông thấp 10
Hình 1.7.1: Bộ phân chia 12
Hình 1.7.2: Bộ phân chia 12
Hình 1.7.3: Phổ của một tín hiệu x(n) 13
Hình 1.7.4: Phổ của tín hiệu ra bộ phân chia với hệ số D = 2 14
Hình 1.7.5: Sơ đồ tương đương của bộ lấy mẫu Fs = Fnsy 15
Hình 1.7.6: Ký hiệu bộ nội suy trong miền n 15
Hình 1.7.7: Bộ nội suy 16
Hình 1.7.8: Phổ của một tín hiệu x(n) 17
Hình 1.7.9: Phổ của tín hiệu tại đầu ra bộ nội suy với L = 2 17
Hình 1.7.10: Bộ biến đổi nhịp với hệ số
L
D
18
Hình 1.7.11: Ký hiệu bộ biến đổi nhịp hệ số
L
D
19
Hình 1.7.12: Y↓↑2/3(ejω) và Y↑↓2/3(ejω) 20
Hình 1.7.13: Sơ đồ tổng quát của bộ lọc nội suy
21
Hình 1.7.14: Y↑2H(ejω) 22
Hình 1.7.15: Bộ lọc biến đổi nhịp hệ số D/L 23
Hình 1.7.16: Sơ đồ khối của bộ lọc biến đổi nhịp hệ số D/L 24
Hình 1.8.1: Cấu trúc của bank lọc số phân tích 25
Hình 1.8.2: Cấu trúc của bank lọc số tổng hợp 25
Hình 1.9.1: Bank lọc số nhiều nhịp 2 kênh 26
Hình 1.9.2: Một vài trường hợp của đáp ứng biên độ 27
Hình 1.9.3: Phổ tín hiệu vào, ra bộ lọc số lý tưởng 29
Hình 1.9.4: Sơ đồ tổng quát của bank lọc số M kênh 30
Chương 2: Mã hóa băng con
Hình 2.1.1: Sơ đồ mã hoá băng con 2 kênh
Hình 2.1.2: Sơ đồ mã hoá băng con tổng quát M kênh
31
32
Hình 2.1.3: Bank lọc phân tích 4 kênh đơn phân giải 34
Hình 2.1.4: Bank lọc tổng hợp 4 kênh đơn phân giải 34
Hình 2.1.5: Bank lọc số 4 kênh 35
Hình 2.1.6: Bank lọc phân tích 2 tầng đa phân giải 36
Hình 2.1.7: Bank lọc tổng hợp 2 tầng đa phân giải 36
Hình 2.1.8: Quá trình mã hóa băng con 37
Hình 2.1.9: Phân bố các băng con theo các hệ số phân chia 39
Hình 2.1.10: Quan hệ giữa đầu ra và đầu vào của bộ phân chia 42
Hình 2.1.11: Tín hiệu vào (a) và tín hiệu ra (b) của bộ phân chia trong
miền thời gian rời rạc, đã chuẩn hoá theo chu kỳ lấy mẫu.
43
Hình 2.1.12: Phổ của tín hiệu vào (a) và tín hiệu ra (b) bộ phân chia
D = 2.
43
Hình 2.1.13: Quan hệ giữa đầu ra và đầu vào của bộ nội suy 43
Hình 2.1.14: Tín hiệu vào (a) và tín hiệu ra (b) của bộ nội suy trong
miền thời gian rời rạc, đã chuẩn hoá theo chu kỳ lấy mẫu.
44
Hình 2.1.15: Phổ của tín hiệu vào (a) và tín hiệu ra (b) bộ nội suy với
L = 2.
44
Hình 2.2.1: Minh họa các bộ lọc có dải chuyển tiếp bằng nhau 47
Hình 2.2.2: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
trực tiếp theo đáp ứng tần số với N = 20.
50
Hình 2.2.3: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
trực tiếp theo đáp ứng tần số với N = 40.
50
Hình 2.2.4 : Đáp ứng biên độ của LPF với các dải chuyển tiếp 50
Hình 2.2.5 : Đáp ứng biên độ của BPF với các dải chuyển tiếp 52
Hình 2.2.6 : Đáp ứng biên độ của HPF với các dải chuyển tiếp 54
Hình 2.2.7: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
ấn định dải chuyển tiếp với N = 20, tgα=40/π.
56
Hình 2.2.8: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
ấn định dải chuyển tiếp với N = 40, tgα=40/π.
56
Hình 2.2.9: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
dải chuyển tiếp - cửa sổ với N = 20, tgα=40/π, cửa sổ Hamming.
59
Hình 2.2.10: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
dải chuyển tiếp - cửa sổ với N = 40, tgα=40/π, cửa sổ Hamming.
60
Hình 3.2.1: Các băng con tại đầu ra bank lọc phân tích nhiều nhịp đơn
phân giải
61
Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói
Hình 3.2.2: Bank lọc phân tích nhiều nhịp đơn phân giải 62
Hình 3.2.3: Bank lọc tổng hợp nhiều nhịp đơn phân giải 63
Hình 3.2.4:Các băng con tại đầu ra bank lọc phân tích nhiều nhịp đa
phân giải
64
Hình 3.2.5: Bank lọc phân tích nhiều nhịp đa phân giải 64
Hình 3.2.6: Bank lọc tổng hợp nhiều nhịp đa phân giải 66
Hình 3.3.1: Phân chia băng con và tạo khung dữ liệu của các lớp
MPEG-1/audio
67
Hình 3.3.2: Bộ mã hóa MPEG-1/audio 68
Hình 3.3.3: Sơ đồ khối bộ SBC(442) 72
Hình 3.3.4: Sơ đồ khối mã hóa âm thanh theo thuật toán ATRAC1 72
Hình 3.3.5: Phổ tần của tín hiệu vào x(n) 72
Hình 3.3.6: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ lọc 73
Hình 3.3.7: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ phân chia 74
Hình 3.3.8: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ nội suy 75
Hình 3.3.5: Sơ đồ khối bộ SBC(8842) 76
Hình 3.4.1: Các dải con ứng với tổ hợp phân chia [6,3,2] 78
Hình 3.4.2: Sơ đồ khối bộ mã hóa băng con SBC(632) 79
Hình 3.4.4: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
N= 10, α= 750
83
Hình 3.4.5: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
N= 12, α= 780
83
Hình 3.4.6: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
N= 20, α= 82,50
83
Hình 3.4.7: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
N= 35, α= 85,50
83
Hình 3.4.8: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
N= 100, α= 88,50
84
Hình 3.4.4: Phổ tần của tín hiệu vào x(n) khi fs = fNy 85
Hình 3.4.4: Phổ tần của tín hiệu băng con tại đầu ra bank lọc phân tích 86
Hình 3.4.6: Phổ tần của tín hiệu băng con tại đầu ra bank lọc tổng hợp 87
Hình 3.4.7: Phổ tần của 3 tín hiệu dải con sau khi qua các bộ lọc nôi suy 88
Hình 3.4.8: Phổ tần của 3 tín hiệu dải con sau khi qua các bộ lọc
tổng hợp
89
Hình 3.4.9: Phổ tần của 3 tín hiệu ra y(n) 89
MỤC LỤC
Trang
Danh mục các ký hiệu, các chữ viết tắt
Danh mục các bảng
Danh mục các hình vẽ, đồ thị
MỞ ĐẦU 1
Chương 1: Cơ bản về bộ lọc và bank lọc số
1.1. Giới thiệu chung về bộ lọc số 5
1.2. Các loại bộ lọc số
1.3. Bộ lọc số đa nhịp và các băng lọc
6
7
1.4. Tính ưu việt của bộ lọc số 8
1.5. Các chỉ tiêu thiết kế của bộ lọc số
1.6. Vai trò của cửa sổ
1.7. Thay đổi nhịp lấy mẫu
9
11
1.7.1. Khái niệm phân chia và nội suy 12
1.7.2. Thay đổi nhịp lấy mẫu với hệ số D/L 18
1.7.3. Bộ lọc nội suy 21
1.7.4. Bộ lọc biến đổi nhịp lấy mẫu với hệ số D/L không nguyên 23
1.8. Bank lọc số 24
1.8.1. Định nghĩa bank lọc số 24
1.8.2. Định nghĩa bank lọc số phân tích 24
1.8.3. Định nghĩa bank lọc số tổng hợp 25
1.9. Bank lọc số nhiều nhịp hai kênh
1.9.1. Bank lọc số nhiều nhịp 2 kênh và bank lọc gương cầu phương
26
26
1.9.2. Bank lọc số nhiều nhịp M kênh 30
Chương 2: Mã hóa băng con
2.1. Tổng quan về mã hóa băng con 31
2.1.1. Giới thiệu 31
2.1.2. Cấu trúc dạng cây của bank lọc số 33
2.1.3. Nguyên lý mã hóa băng con 36
2.1.4. Các thông số kỹ thuật của SBC 38
2.1.5. Các điều kiện của mã hóa băng con 41
2.1.6. Điều kiện để tăng hệ số nén tín hiệu trong mã hóa băng con 44
2.2. Thiết kế bộ lọc FIR bằng phương pháp kết hợp dải chuyển tiếp-cửa sổ 46
2.2.1. Giới thiệu 46
2.2.2. Thiết kế bộ lọc FIR bằng phương pháp trực tiếp 48
2.2.3. Thiết kế bộ lọc FIR bằng phương pháp dải chuyển tiếp 50
2.2.4. Thiết kế bộ lọc FIR bằng phương pháp dải chuyển tiếp-cửa sổ 56
Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói
3.1. Giới thiệu
3.2. Bank lọc theo phân tích Wavelet
61
61
3.2.1. Bank lọc nhiều nhịp đơn phân giải 61
3.2.2. Bank lọc nhiều nhịp đa phân giải 64
3.3. Mã hóa băng con đã ứng dụng trong xử lý âm thanh số 66
3.3.1. Chuẩn âm thanh số MPEG/audio 66
3.3.2. Thuật toán PASC 70
3.3.3. Thuật toán ATRAC
3.4 Đề xuất phương pháp xác định tổ hợp phân chia
3.4.1 Phương pháp phân chia liên tiếp cộng cuối
3.4.2 Xác định tổ hợp phân chia tối ưu
3.4.3 Ứng dụng vào mã hóa băng con SBC(632)
71
77
77
78
78
3.4.4 Biến đổi hệ số và so sánh kết quả SBC(632) với SBC(442) 85
KẾT LUẬN & KIẾN NGHỊ
TÀI LIỆU THAM KHẢO
92
PHỤ LỤC
1
MỞ ĐẦU
Các loại tín hiệu trong tự nhiên, tiếng nói là một trong những tín hiệu được
nghiên cứu nhiều nhất và sớm nhất do mục đích cơ bản nhất của các hệ thống thông
tin là truyền đi tiếng nói. Ứng dụng âm thanh trong lĩnh vực thông tin rất đa dạng
như phát thanh vô tuyến, phát thanh qua vệ tinh, qua cáp quang, truyền âm thanh
qua Internet, ghi và phát lại âm thanh, điện thoại, nhận diện qua tiếng nói, chuyển
đổi văn bản âm thanh, các phần mềm ghi đọc âm thanh, âm thanh trong truyền hình,
âm thanh đa kênh trong DVD và phim ảnh, âm thanh trong các ứng dụng truyền
thông đa phương tiện khác. Trong lịch sử phát triển, một trong những tiến bộ quan
trọng nhất trong mã hóa âm thanh là việc phát minh ra bộ mã hóa băng con.
Tất cả các mã hóa băng con đã ứng dụng theo phân tích Wavelet có hai dạng:
+Mã hóa băng con đơn phân giải.
+Mã hóa băng con đa phân giải tương đối.
Đối với mã hóa băng con đơn phân giải: Hiện nay, trong mã hóa – nén tín
hiệu âm thanh có chuẩn MPEG/audio ra đời năm 1990. Chuẩn này thực hiện mã hóa
băng con đơn phân giải với 32 băng con bằng nhau. Ưu điểm nhất của chuẩn
MPEG/audio là hệ số nén dữ liệu cao nhưng chất lượng âm thanh vẫn đảm bảo.
Hiện nay, chuẩn MPEG/audio ra đời nhiều phiên bản khác, ứng dụng trong nhiều
lĩnh vực. Nhược điểm cơ bản của MPEG/audio là số lượng băng con lớn, bank lọc
phức tạp.
Đối với mã hóa băng con đa phân giải tương đối: Hiện nay, đã ứng dụng
chuẩn ATRAC do Sony phát minh, dùng mã hóa băng con đa phân giải tương đối 3
kênh và 4 kênh tương ứng các tổ hợp phân chia là [4 4 2] và [8 8 4 2]. Chuẩn
ATRAC cho hệ số nén dữ liệu cao, chất lượng âm thanh tốt.
Trong phạm vi đề tài này, em xin giới thiệu về mã hóa băng con đơn phân
giải, đa phân giải tương đối 3 kênh và nghiên cứu mã hóa băng con đã được ứng
dụng thực tế trong xử lý tín hiệu âm thanh số. Đồng thời đưa ra phương pháp thiết
kế bộ lọc bằng phương pháp kết hợp dải chuyển tiếp-cửa sổ và giải pháp mới để xác
định lại hệ số phân chia tối ưu hơn SBC đã ứng dụng trong thực tế.
2
Em xin chân thành cảm ơn viện đào tạo sau đại học, các thầy giáo, cô giáo
trong viện điện tử viễn thông trường Đại học Bách khoa Hà nội, đặc biệt là thầy
PGS.TS Nguyễn Quốc Trung đã hướng dẫn, giúp đỡ để em hoàn thành được luận
văn này.
1. Lý do chọn đề tài:
Trong lịch sử phát triển, một trong những tiến bộ quan trọng nhất trong mã hóa
âm thanh là việc phát minh ra bộ mã hóa băng con (Subband Coding – SBC). Ứng
dụng đầu tiên của mã hóa băng con trong xử lý âm thanh số theo chuẩn
MPEG/audio. Chuẩn MPEG/audio ra đời vào năm 1990 bởi ISO/IEC, được ứng
dụng rộng rãi, trong đó có phát thanh số vô tuyến. Ngoài ra, ATRAC cũng là thuật
toán mã hóa băng con, được phát minh bởi Sony và được ứng dụng trong ghi đọc
âm thanh trên MiniDisc, phát thanh số trên Internet.
Hiện nay, phát thanh Việt nam đang nghiên cứu để chuyển đổi từ phát thanh
tương tự sang phát thanh số. Một số nước đã và đang phát triển hệ thống phát thanh
số riêng. Các hệ thống phát thanh số hiện nay trên thế giới đều dùng kỹ thuật mã
hóa băng con để nén dữ liệu âm thanh, với tỷ lệ nén rất cao. Mã hóa băng con là
một trong những thuật toán mã hóa nén dữ liệu có tổn hao, đã được ứng dụng trong
mã hóa âm thanh. Việc nghiên cứu SBC (Subband Coding) trong việc nén dữ liệu
âm thanh và ứng dụng nó trong phát thanh số có ý nghĩa quan trọng trong việc định
hướng cho phát thanh số ở Việt nam. Đó cũng là lý do để em lựa chọn nghiên cứu
và thực hiện đề tài này.
2. Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu.
+ Mục đích nghiên cứu: Mục đích của luận văn là nghiên cứu các vấn đề cơ bản
của bộ lọc và bank lọc số nhiều nhịp, từ đó mô tả và xây dựng mô hình mã hóa băng
con ứng dụng trong xử lý âm thanh số
+ Đối tượng và phạm vi nghiên cứu: Luận văn nghiên cứu mã hóa băng con đơn
phân giải và đa phân giải tương đối theo phân tích wavelet. Cụ thể là chuẩn
ATRAC (Adaptive Transform Acoustic Coding) mã hóa âm thanh biến đổi thích
nghi do SONY phát minh dùng mã hóa dải con đa phân giải tương đối 3 kênh và 4
3
kênh với các tổ hợp phân chia [442] và [8842]. Luận văn nghiên cứu và đề xuất xây
dựng bank lọc đa phân giải tương đối dùng phương pháp kết hợp dải chuyển tiếp-
cửa sổ. Khảo sát chúng trên các file âm thanh khác nhau, kết quả kiểm chứng qua
phần mềm Matlab.
3. Tóm tắt cô đọng các luận điểm cơ bản và đóng góp mới của tác giả
Đối với mã hóa băng con đơn phân giải hiện nay trong mã hóa nén tín hiệu
âm thanh có chuẩn MPEG/audio ra đời năm 1990. Chuẩn này thực hiện mã hóa với
32 dải con bằng nhau, tỷ lệ nén cao, cho chất lượng âm thanh tốt nhưng số lượng
dải con lớn bank lọc phức tạp. Đối với đa phân giải tương đối, cụ thể là chuẩn
ATRAC do SONY phát minh dùng mã hóa dải con đa phân giải tương đối 3 kênh
và 4 kênh với các tổ hợp phân chia [442] và [8842] khắc phục được hạn chế về số
kênh. Tuy nhiên có hạn chế là hệ số phân chia phải là lũy thừa của 2 và có ít nhất có
2 dải con có độ rộng bằng nhau, để khắc phục hạn chế đó luận văn đưa ra giải pháp
thiết kế mới bằng cách thiết kế lại bộ lọc bên trong bằng phương pháp kết hợp dải
chuyển tiếp –cửa sổ và thay đổi lại hệ số phân chia trong bank lọc phân tích và tổng
hợp để đạt được ưu điểm hơn so với SBC đã ứng dụng bằng mô hình mới SBC 3
kênh tổ hợp phân chia [632] .
4. Phương pháp nghiên cứu.
Luận văn nghiên cứu trên phương diện lý thuyết kết hợp với mô phỏng qua
Matlab và phương pháp thống kê với nhiều file âm thanh khác nhau.
5. Nội dung của luận văn:
Cấu trúc của luận văn gồm: Mở đầu
Chương 1: Cơ bản về bộ lọc và bank lọc số
Chương 2: Mã hóa băng con
Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói
Kết luận và kiến nghị; tài liệu tham khảo và phần phụ lục.
Chương 1: Nghiên cứu các vấn đề cơ bản về bộ lọc & bank lọc số, bao gồm
các phép toán, các loại bộ lọc số và các ưu, nhược điểm, các chỉ tiêu kỹ thuật yêu
cầu khi thiết kế bộ lọc và các loại cửa sổ. Đồng thời nghiên cứu quá trình thay đổi
4
nhịp lấy mẫu gồm có phép phân chia và phép nội suy, bộ lọc biến đổi nhịp lấy mẫu
gồm có bộ lọc phân chia và bộ lọc nội suy từ đó ứng dụng để tạo ra các bank lọc số.
Chương 2: Nghiên cứu về cấu trúc, nguyên lý, thông số kỹ thuật và các điều
kiện của mã hóa băng con. Đề xuất thiết kế phương pháp mới kết hợp dải chuyển
tiếp-cửa sổ trong bộ lọc FIR.
Chương 3: Nghiên cứu về mã hóa băng con đơn phân giải và đa phân giải
tương đối, đưa ra mô hình mã hóa băng con đã ứng dụng trong xử lý âm thanh số
theo chuẩn MPEG/audio của Sony. Giới thiệu thuật toán PASC, ATRAC. Phân tích
thuật toán ATRAC1 và ATRAC3 áp dụng trong mã hóa âm thanh 3 và 4 kênh, với
tổ hợp phân chia [442] và [8842]. Đề xuất mới phương pháp xác định tổ hợp phân
chia tối ưu, từ đó so sánh kết quả đề xuất SBC(632) với bộ mã hóa đa phân giải
tương đối 3 kênh SBC[442] (ATRAC1) đã ứng dụng trong thực tế.
5
Chương 1: Cơ bản về bộ lọc và bank lọc số
1.1. Giới thiệu chung về bộ lọc số
Tín hiệu là biểu diễn vật lý của thông tin. Về mặt toán học tín hiệu được biểu
diễn bởi hàm của một hoặc nhiều biến độc lập. Tín hiệu được chia làm hai nhóm
lớn, đó là tín hiệu liên tục và tín hiệu rời rạc. Tín hiệu liên tục là tín hiệu luôn được
xác định tại mọi thời điểm trong thời gian tồn tại của nó, gồm có tín hiệu tương tự
và tín hiệu lượng tử hoá. Tín hiệu rời rạc là tín hiệu chỉ được xác định tại các thời
điểm rời rạc cách biệt nhau, gồm có tín hiệu lấy mẫu và tín hiệu số.
Tín hiệu số cũng như tín hiệu tương tự có thể biểu diễn bằng hàm của tần số
và được gọi là phổ tần số của tín hiệu, phổ tần số chính là sự mô tả ý nghĩa tần số
của tín hiệu.
Lọc tín hiệu là quá trình mà tr