Trong thời đại ngày nay, cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật thỡ vấn đề trao đổi thông tin đa phương tiện ngày càng trở nên cần thiết, từ lúc đầu chỉ giao tiếp, tương tác thông qua các văn bản giấy tờ, ngày nay nhu cầu sử dụng tiếng nói trong truyền thông, tương tác người máy càng trở nên cấp thiết hơn. Vỡ vậy mà một lĩnh vực kỹ thuật mới đó ra đời, đó là xử lý tiếng núi.
Mặc dù mới nhưng xử lý tiếng nói đó đạt được những thành tựu đáng kể. Các ứng dụng của xử lý tiếng nói đó và đang được áp dụng trong rất nhiều lĩnh vực khác nhau trong xó hội như nhận dạng, tổng hợp tiếng nói, tương tác người máy, truyền thông, dạy học, .Nhờ có xử lý tiếng núi mà con người có thể tạo ra những máy móc thông minh hơn, có khả năng hiểu được tiếng nói con người và có thể giao tiếp với con người thông qua lời nói.
Một trong những phương pháp được ứng dụng rất nhiều trong lĩnh vực xử lý tiếng nói đó là phương pháp mó húa dự đoán tính (LPC). Phương pháp LPC được sử dụng trong các phân tích tiếng nói, mó húa tiếng núi, tổng hợp tiếng núi Do vậy tụi đó chọn đề tài là “Tỡm hiểu về phương pháp LPC trong xử lý tiếng núi”.
Nội dung của đồ án này gồm có ba chương
Chương 1: Tổng quan về tiếng núi và xử lý tiếng núi
Chương này sẽ nêu một cách tổng quan về những vấn đề liên quan đến tiếng nói và xử lý tiếng núi:
ỉ Giới thiệu về tiếng nói, các đặc trưng và cơ chế tạo tiếng nói của con người.
ỉ Giới thiệu tổng quan về đặc điểm, hoạt động và một số phép biến đổi của một hệ xử lý tín hiệu chung.
ỉ Các phương pháp trong xử lý tiếng núi như: tổng hợp tiếng nói, mó húa tiếng núi, phõn tớch tiếng núi.
88 trang |
Chia sẻ: lvbuiluyen | Lượt xem: 3947 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Tìm hiểu về phương pháp LPC trong xử lý tiếng nói, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Lời núi đầu
Trong thời đại ngày nay, cựng với sự phỏt triển mạnh mẽ của khoa học kỹ thuật thỡ vấn đề trao đổi thụng tin đa phương tiện ngày càng trở nờn cần thiết, từ lỳc đầu chỉ giao tiếp, tương tỏc thụng qua cỏc văn bản giấy tờ, ngày nay nhu cầu sử dụng tiếng núi trong truyền thụng, tương tỏc người mỏy càng trở nờn cấp thiết hơn. Vỡ vậy mà một lĩnh vực kỹ thuật mới đó ra đời, đú là xử lý tiếng núi.
Mặc dự mới nhưng xử lý tiếng núi đó đạt được những thành tựu đỏng kể. Cỏc ứng dụng của xử lý tiếng núi đó và đang được ỏp dụng trong rất nhiều lĩnh vực khỏc nhau trong xó hội như nhận dạng, tổng hợp tiếng núi, tương tỏc người mỏy, truyền thụng, dạy học, ….Nhờ cú xử lý tiếng núi mà con người cú thể tạo ra những mỏy múc thụng minh hơn, cú khả năng hiểu được tiếng núi con người và cú thể giao tiếp với con người thụng qua lời núi.
Một trong những phương phỏp được ứng dụng rất nhiều trong lĩnh vực xử lý tiếng núi đú là phương phỏp mó húa dự đoỏn tớnh (LPC). Phương phỏp LPC được sử dụng trong cỏc phõn tớch tiếng núi, mó húa tiếng núi, tổng hợp tiếng núi… Do vậy tụi đó chọn đề tài là “Tỡm hiểu về phương phỏp LPC trong xử lý tiếng núi”.
Nội dung của đồ ỏn này gồm cú ba chương
Chương 1: Tổng quan về tiếng núi và xử lý tiếng núi
Chương này sẽ nờu một cỏch tổng quan về những vấn đề liờn quan đến tiếng núi và xử lý tiếng núi:
Giới thiệu về tiếng núi, cỏc đặc trưng và cơ chế tạo tiếng núi của con người.
Giới thiệu tổng quan về đặc điểm, hoạt động và một số phộp biến đổi của một hệ xử lý tớn hiệu chung.
Cỏc phương phỏp trong xử lý tiếng núi như: tổng hợp tiếng núi, mó húa tiếng núi, phõn tớch tiếng núi.
Chương 2: Ứng dụng của LPC trong xử lý tiếng núi
Chương này sẽ đề cập tới phương phỏp LPC trong xử lý tiếng núi.
Trỡnh bày cơ sở của phương phỏp LPC
Ứng dụng của LPC trong phõn tớch tiếng núi
Mụ hỡnh tổng hợp tiếng núi LPC
Chương 3: Xõy dựng chương trỡnh
Chương này giới thiệu về chương trỡnh đó được xõy dựng, cỏc kết quả đạt được và nờu ra nhận xột.
Kết luận: Khỏi quỏt những kết quả đạt được. Định hướng phỏt triển tiếp.
Chương 1 Tổng quan về tiếng núi và xử lý tiếng núi
Tiếng núi và đặc điểm của tiếng núi
Tiếng núi là một trong những phương tiện trao đổi thụng tin của con người. Tiếng núi được tạo ra từ tư duy của con người dưới sự chỉ đạo của trung khu thần kinh, mệnh lệnh phỏt sinh tiếng núi được phỏt ra và hệ thống phỏt õm thực hiện nhiệm vụ tạo õm thanh.
Tiếng núi mà con người vẫn giao tiếp hàng ngày cú bản chất là súng õm thanh lan truyền trong khụng khớ. Súng õm thanh trong khụng khớ là súng dọc sinh ra do sự dón nở của khụng khớ. Tớn hiệu õm thanh là tớn hiệu biến thiờn liờn tục về thời gian và biờn độ, cú dải tần số rất rộng. Tuy nhiờn tai người chỉ cú thể nhận biết được cỏc súng õm cú tần số trong khoảng 20 - 20000 (Hz). Những súng õm cú tần số lớn hơn 20000 Hz gọi là súng siờu õm. Những súng cú tần số nhỏ hơn 20 Hz gọi là súng hạ õm. Thực tế người ta cú thể hạn chế dải tần số của tớn hiệu tiếng núi trong khoảng từ 300 đến 3500 Hz. Do đú, quỏ trỡnh phõn tớch cũng như tổng hợp tiếng núi chỉ cần dựng một số nhất định cỏc tham số cũng đủ để biểu diễn tớn hiệu tiếng núi mà nóo người xử lý.
Hỡnh 1.1 Mụ phỏng quỏ trỡnh truyền tiếng núi trong khụng khớ
Về bản chất vật lớ, súng õm, súng siờu õm, súng hạ õm khụng khỏc gỡ nhau và cũng như cỏc súng cơ học khỏc. Sự phõn biệt như trờn là dựa vào khả năng cảm thụ cỏc súng cơ học của tai con người, do cỏc đặc tớnh sinh lớ của tai người quyết định. Vỡ vậy súng õm thanh được phõn biệt hai loại đặc tớnh là đặc tớnh vật lý và đặc tớnh õm học.
Đặc tớnh vật lý của õm thanh
Bản chất õm thanh tiếng núi là súng cơ học nờn cú cỏc tớnh chất cơ bản của súng cơ học. Cỏc tớnh chất của súng cơ học mang một ý nghĩa khỏc khi xột trờn gúc độ là õm thanh tiếng núi.
Tớn hiệu õm thanh tiếng núi là một tớn hiệu ngẫu nhiờn khụng dừng, tuy nhiờn những đặc tớnh của nú tương đối ổn định trong những khoảng thời gian ngắn (vài chục mili giõy). Trong khoảng thời gian nhỏ đú tớn hiệu gần tuần hoàn, cú thể coi như tuần hoàn.
Độ cao (Pitch)
Độ cao hay cũn gọi là độ trầm bổng của õm thanh chớnh là tần số của súng cơ học. Âm thanh nào phỏt ra cũng ở một độ cao nhất định. Độ trầm bổng của õm thanh phụ thuộc vào sự chấn động nhanh hay chậm của cỏc phần tử trong khụng khớ trong một đơn vị thời gian nhất định. Núi cỏch khỏc, độ cao của õm phụ thuộc vào tần số dao động. Đối với tiếng núi, tần số dao động của dõy thanh quy định độ cao giọng núi của con người và mỗi người cú một độ cao giọng núi khỏc nhau.
Độ cao của nữ giới thường cao hơn so với nam giới và độ cao tiếng núi của trẻ em cao hơn so với nữ giới, điều này cũng tương tự đối với tần số của dõy thanh.
Cường độ
Cường độ chớnh là độ to nhỏ của õm thanh, cường độ càng lớn thỡ õm thanh cú thể truyền đi càng xa trong mụi trường cú nhiễu. Nếu xột trờn gúc độ súng cơ học thỡ cường độ chớnh là biờn độ của dao động súng õm, nú quyết định cho năng lượng của súng õm.
Trong tiếng núi, cường độ của nguyờn õm phỏt ra thường lớn hơn phụ õm. Do vậy chỳng ta thường dễ phỏt hiện ra nguyờn õm hơn so với phụ õm. Tuy nhiờn đối với tai người giỏ trị tuyệt đối của cường độ õm I khụng quan trọng bằng giỏ trị tỉ đối của I so với một giỏ trị I0 nào đú chọn làm chuẩn. Người ta định nghĩa mức cường độ õm L là logarit thập phõn của tỉ số I/I0: (đơn vị mức cường độ là Ben - kớ hiệu B)
Trường độ
Trường độ hay độ dài của õm phụ thuộc vào sự chấn động lõu hay nhanh của cỏc phần tử khụng khớ. Cựng một õm nhưng trong cỏc từ khỏc nhau thỡ độ dài khỏc nhau.
Âm sắc
Âm sắc là bản sắc, sắc thỏi riờng của một õm, cựng một nội dung, cựng một độ cao nhưng khi núi mỗi người đều cú õm sắc khỏc nhau.
Đặc tớnh õm học của õm thanh
Tớn hiệu tiếng núi là tớn hiệu tương tự biểu diễn cho thụng tin về mặt ngụn ngữ và được mụ tả bởi cỏc õm vị khỏc nhau. Tuỳ theo từng ngụn ngữ cụ thể mà số lượng cỏc õm vị nhiều hay ớt. Thụng thường số lượng cỏc õm vị vào khoảng 20 – 30 và nhỏ hơn 50 đối với mọi ngụn ngữ. Đối với từng loại õm vị mà cú cỏc đặc tớnh õm thanh khỏc nhau. Cỏc õm vị được chia thành hai loại nguyờn õm và phụ õm. Tổ hợp cỏc õm vị tạo nờn õm tiết. Âm tiết đúng vai trũ một từ trọn vẹn mang ngữ nghĩa.
Nguyờn õm
Nguyờn õm được tạo ra bằng sự cộng hưởng của dõy thanh khi dũng khớ được thanh mụn đẩy lờn. Khoang miệng được tạo lập thành nhiều hỡnh dạng nhất định tạo thành cỏc nguyờn õm khỏc nhau. Số lượng cỏc nguyờn õm phụ thuộc vào từng ngụn ngữ nhất định. Mỗt nguyờn õm được đặc trưng bởi 3 formant đầu tiờn, cỏc formant tiếp theo thường thỡ ớt mang thụng tin hơn.
Phụ õm
Phụ õm được tạo ra bởi cỏc dũng khớ hỗn loạn được phỏt ra gần những điểm co thắt của đường dẫn õm thanh do cỏch phỏt õm tạo thành. Dũng khụng khớ tại chỗ đúng của vũm miệng tạo ra phụ õm tắc. Những phụ õm xỏt được phỏt ra từ chỗ co thắt lớn nhất và cỏc õm tắc xỏt tạo ra từ khoảng giữa. Phụ õm cú đặc tớnh hữu thanh và vụ thanh tuỳ thuộc việc dõy thanh cú dao động để tạo thành cộng hưởng khụng. Đặc tớnh của phụ õm tuỳ thuộc vào tớnh chu kỳ của dạng súng, phổ tần số, thời gian tồn tại và sự truyền dẫn õm.
Tỷ suất thời gian
Trong khi núi chuyện, khoảng núi chuyện và khoảng nghỉ xen kẽ nhau. Phần trăm thời gian núi trờn tổng số thời gian núi và nghỉ được gọi là tỷ xuất thời gian. Giỏ trị này biến đổi tuỳ thuộc vào tốc độ núi và từ đú ta cú thể phõn loại thành núi nhanh, núi chậm hay núi bỡnh thường.
Hàm năng lượng thời gian ngắn
Hàm năng lượng thời gian ngắn của tiếng núi được tớnh bằng cỏch chia tớn hiệu tiếng núi thành nhiều khung chứa N mẫu và tớnh diện tớch trung bỡnh tổng cỏc mẫu tớn hiệu trong mỗi khung. Cỏc khung này được đưa qua một cửa sổ cú dạng hàm như sau:
Với 0 Ê n Ê N
Với n ³ N
Thụng thường cú ba dạng cửa sổ được sử dụng đú là cửa sổ chữ nhật, cửa sổ Hamming và cửa sổ Hanning.
Với 0 Ê n Ê N
Với n ³ N
Cửa sổ chữ nhật:
Cửa sổ Hamming :
ợ
ớ
ỡ
³
Ê
Ê
-
=
N
n
Với
N
n
Với
n
n
W
0
1
)
cos(
46
.
0
54
.
0
)
(
Cửa sổ Hanning:
ợ
ớ
ỡ
³
Ê
Ê
-
=
N
n
Với
N
n
Với
n
n
W
0
1
)
cos(
5
.
0
5
.
0
)
(
Hàm năng lượng ngắn tại mẫu thứ m được tớnh theo cụng thức sau :
Hàm năng lượng thời gian ngắn của õm hữu thanh thường lớn hơn so với õm vụ thanh.
Tần số vượt qua điểm khụng.
Tần suất vượt qua điểm khụng là số lần biờn độ tớn hiệu tiếng núi vượt qua giỏ trị khụng trong một khoảng thời gian cho trước. Thụng thường giỏ trị này đối với õm vụ thanh lớn hơn õm hữu thanh do đặc tớnh ngẫu nhiờn của õm vụ thanh. Do đo tần suất vượt qua điểm khụng là tham số quan trọng để phõn loại õm hữu thanh và õm vụ thanh.
Phỏt hiện điểm cuối.
Trong xử lý tiếng núi việc xỏc định khi nào bắt đầu xuất hiện tớn hiệu tiếng núi và khi nào kết thỳc quỏ trỡnh núi rất cần thiết và quan trọng. Trong một mụi trường nhiều tiếng ồn (nhiễu ) hoặc mụi trường nhiều người núi thỡ việc phỏt hiện điểm kết thỳc rất khú khăn. Cú rất nhiều phương phỏp để phỏt hiện điểm cuối của tiếng núi. Vớ dụ như một phương phỏp đơn giản sau :
Lấy một mẫu nhỏ của nền nhiễu trong khoảng thời gian yờn lặng trước khi bắt đầu núi. Sử dụng hàm năng lượng thời gian ngắn để tớnh năng lượng cho mẫu. Ngưỡng của tiếng núi được chọn là giỏ trị giữa năng lượng yờn tĩnh và năng lượng đỉnh. Ban đầu giả thiết điểm cuối xuất hiện tại điểm năng lượng tớn hiệu vượt quỏ mức ngưỡng. Để tớnh đỳng ước lượng này, người ta giả thiết và so sỏnh chỳng với giỏ trị đú trong vựng yờn tĩnh. Khi những thay đổi phỏt hiện được trong khi tớnh toỏn tần suất trờn suất hiện ở ngoài ngưỡng giả thiết thỡ điểm cuối được giả thiết lại tại điểm mà sự thay đổi xảy ra.
Tần số cơ bản
Dạng súng của tiếng núi gồm hai phần: Phần gần giống nhiễu trong đú biờn độ biến đổi ngẫu nhiờn và phần tuần hoàn. Phần tớn hiệu cú tớnh chu kỳ chứa cỏc thành phần tần số cú dạng điều hũa. Tần số thấp nhất chớnh là tần số cơ bản và cũng chớnh là tần số dao động của dõy dõy thanh.
Đối với những người núi khỏc nhau, tần số cơ bản cũng khỏc nhau. Tần số cơ bản của trẻ em thường cao hơn so với người lớn và của nữ giới cao hơn so với nam giới, Sau đõy là một số giỏ trị tần số cơ bản tương ứng với giới tớnh và tuổi:
Người núi
Giỏ trị tần số cơ bản
Nam giới
80 – 200 Hz
Nữ giới
150 – 450 Hz
Trẻ em
200 – 600 Hz
Đối với hai õm cú cựng cường độ, cựng độ cao sẽ được phõn biệt bởi tớnh tuần hoàn. Một õm hữu thanh cú tớn hiệu gần như tuần hoàn khi được phõn tớch phổ sẽ xuất hiện một vạch tại vựng tần số rất thấp. Vạch này đặc trưng cho tớnh tuần hoàn cơ bản của õm hay đú chớnh là tần số cơ bản của õm. Trong giao tiếp bỡnh thường tần số cơ bản thay đổi liờn tục tạo nờn ngữ điệu cho tiếng núi.
Hỡnh dưới mụ tả tớn hiệu trờn miền thời gian và phổ của chỳng (trờn miền tần số) của cỏc nguyờn õm a, i, u. đỉnh đầu tiờn của cỏc phổ tương ứng với tần số cơ bản F0.
Hỡnh 1.2 Tớn hiệu và phổ của tớn hiệu
Formant
Trong phổ tần số của tớn hiệu tiếng núi, mỗi đỉnh cú biờn độ cao nhất xột trong một khoảng nào đú (cũn gọi là cực trị địa phương) xỏc định một formant. Ngoài tần số, formant cũn được xỏc định bởi biờn độ và dải thụng của chỳng. Về mặt vật lý cỏc tần số formant tương ứng với cỏc tần số cộng hưởng của tuyến õm. Trong xử lý tiếng núi và nhất là trong tổng hợp tiếng núi để mụ phỏng lại tuyến õm người ta phải xỏc định được cỏc tham số formant đối với từng loại õm vị, do đú việc đỏnh giỏ, ước lượng cỏc formant cú ý nghĩa rất quan trọng.
Tần số formant biến đổi trong một khoảng rộng phụ thuộc vào giới tớnh của người núi và phụ thuộc vào cỏc dạng õm vị tương ứng với formant đú. Đồng thời, formant cũn phụ thuộc cỏc õm vị trước và sau đú. Về cấu trỳc tự nhiờn, tần số formant cú liờn hệ chặt chẽ với hỡnh dạnh và kớch thước tuyến õm. Thụng thường trong phổ tần số của tớn hiệu cú khoảng 6 formant nhưng chỉ cú 3 formant đầu tiờn ảnh hưởng quan trọng đến cỏc đặc tớnh của cỏc õm vị, cũn cỏc formant cũn lại cũng cú ảnh hưởng song rất ớt. Cỏc formant cú giỏ trị tần số xờ dịch từ vài trăm đến vài nghỡn Hz.
Tần số formant đặc trưng cho cỏc nguyờn õm biến đổi tuỳ thuộc vào người núi trong điều kiện phỏt õm nhất định. Mặc dự phạm vi của cỏc tần số formant tương ứng với mỗi nguyờn õm cú thể trựng lờn nhau nhưng vị trớ giữa cỏc formant đú khụng đổi vỡ sự xờ dịch của cỏc formant là song song.
Ngoài formant, cỏc õm mũi cũn cú cỏc tần số bị suy giảm gọi là phản formant (anti-formant). Phản formant được tạo nờn khi luồng khớ đi qua khoang mũi. Cỏc formant tương ứng núi cỏc điểm cực của hàm truyền đạt vỡ tại lõn cận điểm cực giỏ trị hàm truyền đạt là rất lớn, tương tự vậy cỏc anti-formant tương ứng với cỏc điểm khụng của hàm truyền đạt.
Phõn loại đơn giản dạng súng tiếng núi:
Tiếng núi của con người tạo ra bao gồm cú hai thành phần đú là:
Phần gần tuần hoàn mà hầu như lặp lại cựng chu kỳ được gọi là tiếng núi hữu thanh (voiced speech). Chu kỳ lặp lại đú gọi là chu kỡ cơ bản T0 nghịch đảo của T0 là tần số cơ bản F0. Âm hữu thanh được phỏt ra bởi một luồng khớ cực mạnh từ thanh mụn thổi qua dõy thanh làm dung dõy thanh, sự dao động của dõy thanh tạo nờn nguồn tuần hoàn. Nguồn tuần hoàn kớch thớch tuyến õm tạo nờn õm hữu thanh. Vựng õm hữu thanh chiếm thành phần chủ yếu của súng tiếng núi, chứa đựng lượng tin nhiều nhất và thời gian lớn nhất trong quỏ trỡnh núi.
Phần tớn hiệu cú dạng giống như tập õm nhiễu cú biờn độ ngẫu nhiờn cũn được gọi là tiếng núi vụ thanh (unvoiced speech). Tiếng núi vụ thanh được tạo ra do sự co thắt theo một dạng nào đú của tuyến õm và luồng khớ chạy qua chỗ thắt với tộc độ lớn tạo nờn nhiễu loạn, vớ dụ như lỳc ta núi thỡ thào (cần phõn biệt thỡ thầm với thỡ thào, theo từ điển tiếng Việt thỡ thào là núi chuyện với nhau rất nhỏ tựa như giú thoảng qua tai cũn thỡ thầm là núi chuyện với nhau khụng để người ngoài nghe thấy). Năng lượng do nguồn nhiễu loạn tạo ra sẽ kớch thớch tuyến õm tạo nờn tiếng núi vụ thanh, năng lượng của tiếng núi vụ thanh nhỏ hơn so với tiếng núi hữu thanh.
Ta cú thể phỏt hiện ra tiếng núi hữu thanh là khi núi dõy thanh rung. Cũn õm vụ thanh khi núi dõy thanh khụng rung. Núi thỡ thào thỡ ở xa khụng nghe được do năng lượng của õm vụ thanh rất nhỏ và tiếng thỡ thào là do õm vụ thanh tạo nờn.
Bộ mỏy phỏt õm và cơ chế phỏt õm
Hốc mũi
Vũm miệng trờn
Ổ răng
Vũm miệng mềm
Đầu lưỡi
Thõn lưỡi
Lưỡi gà
Cơ miệng
Yết hầu
Nắp đúng của thanh quản
Dõy thanh giả
Dõy thanh
Thanh quản
Thực quản
Khớ quản
Bộ mỏy phỏt õm
Hỡnh 1.3 Bộ mỏy phỏt õm của con người
Cơ chế phỏt õm
Hỡnh 1.3 mụ tả bộ mỏy phỏt õm của con người. Nguồn năng lượng chớnh nằm ở thanh mụn, Tuyến õm sẽ được kớch thớch bởi nguồn năng lượng chớnh tại thanh mụn. Tiếng núi được tạo ra súng õm học do kớch thớch từ thanh mụn phỏt ra đẩy khụng khớ cú trong phổi lờn tạo thành dũng khớ va chạm vào hai dõy thanh trong tuyến õm. Hai dõy thanh dao động sẽ tạo ra cộng hưởng, dao động õm sẽ được lan truyền theo tuyến õm (tớnh từ tuyến õm đến khoang miệng) và sau khi đi qua khoang mũi, mụi sẽ tạo ra tiếng núi.
Thanh quản chứa hai dõy thanh cú thể dao động tạo ra sự cộng hưởng đầu tiờn của quỏ trỡnh tạo thành õm thanh.
Ống dẫn õm là một ống khụng đồng dạng bắt đầu từ mụi, kết thỳc bởi dõy thanh hoặc thanh quản. Ống cú độ dài khoảng 17cm đối với người bỡnh thường.
Khoang mũi cũng là ống khụng đồng dạng thuộc vựng cố định bắt đầu từ mũi, kết thục tại vũm miệng, đối với người bỡnh thường khoang mũi cú độ dài 12 cm.
Khoang miệng là cỏc nếp da chuyển động cú thể điều khiển sự ghộp õm thanh giữa khoang miệng và khoang mũi.
Hỡnh 1.4 Mụ tả dõy thanh õm
Trong quỏ trỡnh phỏt õm, nếu là õm mũi thỡ vũm miệng hạ thấp và dũng khớ chỉ đi qua đường mũi, nếu là õm thường thỡ vũm miệng mở, đường mũi khộp lại và dũng khớ đi theo khoang miệng ra mụi.
Một số kiến thức chung về xử lý tớn hiệu rời rạc
Mụ hỡnh hệ xử lý tớn hiệu rời rạc
Một hệ xử lý tớn hiệu sẽ xỏc lập mối quan hệ nhõn quả giữa tớn hiệu vào và tớn hiệu ra. Ta cú thể biểu diễn hệ xử lý bằng mụ hỡnh toỏn học thụng qua một phộp biến đổi hay một toỏn tử T nào đú. Tớn hiệu vào x(n) được gọi là tỏc động, cũn tớn hiệu ra y(n) được gọi là đỏp ứng của hệ xử lý. Mối quan hệ giữa tớn hiệu vào và tớn hiệu ra của hệ cú thể được biểu diễn như sau:
y(n)
y(n) = T[x(n)]
x(n)
T [ ]
Đỏp ứng
Tỏc động
Hỡnh 1.5 Mụ hỡnh hệ xử lý biến đổi tớn hiệu vào x(n) thành tớn hiệu ra y(n)
Cỏc hệ xử lý phõn thành 2 loại là hệ tuyến tớnh và hệ phi tuyến. Một hệ thống được gọi là tuyến tớnh nếu nú thoả món nguyờn lý xếp chồng, tức là thoả món 2 tớnh chất sau:
Tớnh tỷ lệ:
T[a.x(n)] = a.T[x(n)] = a.y(n)
Tớnh tổ hợp:
T[x1(n)+x2(n)] = T[x1(n)] + T[x2(n)] = y1(n) + y2(n)
Cỏc hệ tuyến tớnh cú một ý nghĩa đặc biệt trong phõn tớch và xử lý, vỡ nú giỳp ta đưa việc xử lý một hệ phức tạp về việc xử lý cỏc hệ đơn giản, sau đú ta chỉ việc tổng hợp lại kết quả. Vỡ thế ngay cả cỏc hệ phi tuyến nhiều khi cũng được xấp xỉ thành cỏc hệ tuyến tớnh để tiện cho việc xử lý.
Cỏc hệ tuyến tớnh cũng được phõn thành 2 loại là tuyến tớnh bất biến và tuyến tớnh thay đổi theo thời gian. Trong xử lý tớn hiệu thường chỳng ta chỉ quan tõm đến cỏc hệ tuyến tớnh bất biến. Một hệ tuyến tớnh được gọi là bất biến theo thời gian nếu đỏp ứng của hệ đối với tỏc động x(n) thỡ đỏp ứng của hệ đối với tỏc động x(n-k) sẽ là y(n-k).
Cỏc hệ tuyến tớnh bất biến được đặc trưng hoàn toàn bằng đỏp ứng xung h(n) (là đỏp ứng ra ứng với tỏc động vào là xung Dirac ). Nếu biết h(n) ta hoàn toàn cú thể tớnh được đỏp ứng y(n) của tớn hiệu vào x(n):
Trong xử lý tớn hiệu tiếng núi, cỏc hệ thống mà chỳng ta quan tõm đều là hệ tuyến tớnh bất biến, do đú chỳng ta cú thể ỏp dụng cỏc tớnh chất, kết quả của hệ tuyến tớnh bất biến để ỏp dụng vào việc khảo sỏt phõn tớch tớn hiệu tiếng núi.
Phộp biến đổi Z
Đối với tớn hiệu rời rạc, phộp biến đổi Z là một cụng cụ mạnh phục vụ cho việc phõn tớch và xử lý tớn hiệu. Phộp biến đổi Z của tớn hiệu rời rạc x(n) được định nghĩa như sau:
Trong đú hàm X(z) là hàm biến phức của biến phức z.
Điều kiện hội tụ:
hay
Một số tớnh chất của biến đổi Z:
Tớnh chất tuyến tớnh:
Z[a.x(n) + b.y(n)] = Z[a.x(n)] + Z[b.y(n)]
= a.Z[x(n)] + b.Z[y(n)]
= a.X(z) + b.Y(z)
Tớnh dịch chuyển theo thời gian:
Giả sử y(n) = x(n – n0) ( dịch chuyển 1 đoạn n0 mẫu)
Khi đú: Y(z) = Z[x(n-n0)] = z -n0 . X(z)
Đảo trục thời gian:
giả sử Z[x(n)] = X(z) , Rx- < |z| < Rx+
khi đú: Z[x(-n)] = X(1/z) ( với 1/Rx- > |z| > 1/Rx+ )
Thay đổi thang tỷ lệ:
giả sử Z[x(n)] = X(z) , Rx- < |z| < Rx+
Z[an . x(n)] = X(z/a) ( với |a|.Rx- < |z| < |a|.Rx+ )
Tổng chập của hai dóy:
Giả sử y(n) là tổng chập của hai dóy h(n) và x(n) tức là:
y(n) = h(n) * x(n)
Vậy thỡ: Y(z) = H(z) . X(z)
Hàm truyền đạt:
Tớn hiệu ra y(n) của một hệ tuyến tớnh bất biến là tổng chập của đỏp ứng xung h(n) và tỏc động vào là dóy x(n) : y(n) = h(n) * x(n).
Qua phộp biến đổi Z ta cú: Y(z) = H(z) . X(z)
hay:
và H(z) được gọi là hàm truyền đạt của hệ thống, nú cú một ý nghĩa đặc biệt bởi vỡ đú là hàm đặc trưng cho sự biến đổi của hệ thống.
Như vậy biến đổi Z của đỏp ứng xung h(n) là hàm truyền đạt H(z) của hệ thống.
Mụ hỡnh tạo tiếng núi
Tiếng núi là một loại õm thanh, nhưng ngược lại, khụng phải bất kỳ õm thanh nào cũng là tiếng núi. Tiếng núi được phõn biệt với cỏc õm thanh khỏc bởi cỏc đặc tớnh õm học cú nguồn gốc từ cơ chế tạo tiếng núi.
Trong quỏ trỡnh tạo tiếng núi cú 2 loại nguồn õm:
Nguồn tuần hoàn: là nguồn tương ứng với cỏc õm mà khi phỏt ra làm cho dõy thanh rung. Trong tiếng Việt nguồn tuần hoàn tương ứng với cỏc nguyờn õm và cỏc phụ õm hữu thanh
Nguồn khụng tuần hoàn (nguồn tạp õm): là nguồn tương ứng với cỏc õm mà khi phỏt ra khụng làm cho dõy thanh rung. Trong tiếng Việt cỏc nguồn khụng tuần hoàn tương ứng với cỏc phụ õm vụ thanh.
Với nguồn tuần hoàn thỡ vị trớ nguồn tại chớnh thanh mụn, cũn nguồn khụng tuần hoàn thỡ cú vị trớ trong tuyến õm tức là từ thanh mụn trở lờn cho đến dưới mụi.
Quỏ trỡnh tạo tiếng núi từ thanh mụn đến tuyến õm đó được Fant (1960) mụ hỡnh hoỏ qua mụ hỡnh sau:
x(n)
u(n)
T0
Lọc thụng thấp G(z)
Tuyến õm V(z)
Tải bức xạ R(z)
T0
Hỡnh 1.6 Mụ hỡnh tạo tiếng núi (Fant – 1960)
Trong mụ hỡnh trờn, tớn hiệu vào của hệ thống là một ch