tctuvan

New Member
Tải miễn phí
Xử lý tiếng nói là sự nghiên cứu tiếng nói của con người dưới dạng tín hiệu, và các phương pháp xử lý những tín hiệu này. Xử lý tiếng nói có nhiều lĩnh vực nghiên cứu: nhận dạng tiếng nói, nhận dạng người nói, mã hóa tiếng nói, tổng hợp tiếng nói, phân tích giọng nói,
Nhận dạng người nói là một lĩnh vực nghiên cứu của xử lý tiếng nói. Mục đích của nhận dạng người nói là để nhận ra người nói là ai hay là xác minh liệu người đang nói có đúng là người mà máy tính đã được biết trước hay không (tính xác thật của giọng nói). Nhận dạng người nói có nhiều ứng dụng: thanh toán thẻ tín dụng qua điện thoại; đăng nhập vào các hệ thống an ninh, máy tính bằng tiếng nói; giám định tư pháp tiếng nói Chính vì vậy hiện nay trên thế giới lĩnh vực nhận dạng người nói nhận được rất nhiều sự quan tâm, nghiên cứu. Tuy nhiên hiện nay ở Việt Nam mới có rất ít công trình nghiên cứu về vấn đề này.
Luận văn này tập trung nghiên cứu bài toán xác thực người nói không phụ thuộc vào từ khóa – một bài toán trong lĩnh vực nhận dạng người nói. Mục đích của bài toán xác thực người nói không phụ thuộc vào từ khóa là xác minh liệu người đang nói có đúng là người mà máy tính đã được biết trước hay không (tính xác thật của giọng nói) nhưng không phụ thuộc vào nội dung người nói.
Cấu trúc của luận văn gồm: phần mở đầu; chương 1, 2, 3, 4; phần kết luận và kiến nghị; tài liệu tham khảo; phụ lục.
Nội dung chính của luận văn:



Chương 1
TỔNG QUAN VỀ NHẬN DẠNG NGƯỜI NÓI
1.1. Các lĩnh vực của xử lý tiếng nói 4
1.2. Nhận dạng người nói 5
1.2.1. Cơ sở lý thuyết của nhận dạng người nói 5
1.2.2. Phân loại bài toán nhận dạng người nói 6
1.2.3. Các ứng dụng của bài toán nhận dạng người nói 9
1.3. Xác thực người nói không phụ thuộc vào từ khóa 11
1.3.1. Giới thiệu chung 11
1.3.2. Các thành phần của một hệ thống xác thực người nói không phụ vào từ khóa 11
1.3.3. Các giai đoạn xử lý của một hệ thống xác thực người nói không phụ thuộc vào từ khóa 12
Chương 2
TRÍCH CHỌN ĐẶC TRƯNG NGƯỜI NÓI
2.1. Đặc điểm vật lý, âm học của tiếng nói 14
2.1.1. Đặc điểm vật lý của tiếng nói 14
2.1.2. Đặc điểm âm học của tiếng nói 17
2.2. Tiền xử lý tín hiệu tiếng nói. 22
2.2.1. Chuyển từ tín hiệu tương tự sang tín hiệu số 22
2.2.2. Chuẩn hóa biên độ 25
2.2.3. Biến đổi Fourier 26
2.2.4. Lọc nhiễu 27
2.2.5. Làm rõ tín hiệu 27
2.3. Trích chọn đặc trưng người nói. 28
2.3.1. Mục đích của trích chọn đặc trưng 28
2.3.2. Phân loại đặc trưng 29
2.3.3. Trích chọn đặc trưng MFCC 30
Chương 3
CÁC MÔ HÌNH ỨNG DỤNG XÁC THỰC NGƯỜI NÓI KHÔNG PHỤ THUỘC VÀO TỪ KHÓA
3.1. Phân loại các mô hình 39
3.1.1. Mô hình mẫu (Template Modeling) 39
3.1.2. Mô hình thống kê (Statistical Modeling) 39
3.2. Mô hình lượng tử hóa vector (Vector Quantization- VQ) 40
3.2.1. Khái niệm phép lượng tử hóa 40
3.2.2. Độ biến dạng 42
3.2.3. Tính chất 42
3.2.4. Thiết kế codebook theo phương pháp LBG (Linde, Buzo, and Gray) 43
3.3. Mô hình hỗn hợp Gauss 46
3.3.1. Bài toán ước lượng mật độ 46
3.3.2. Thuật toán EM (Expectation Maximization) 48
3.4. Xây dựng mô hình người nói 49
3.4.1. Giới thiệu chung 49
3.4.2. Sử dụng mô hình VQ 49
3.4.3. Sử dụng GMM 51
3.5. So khớp 51
3.5.1. Giới thiệu chung 51
3.5.2. Phương pháp VQ 52
3.5.3. Phương pháp GMM 53
3.6. Tạo quyết định 53
Chương 4
CẤU HÌNH HỆ THỐNG VÀ KẾT QUẢ THỬ NGHỆM
4.1. Cấu trúc tổng quát của hệ thống 56
4.1.1. Module trích chọn đặc trưng MFCC 56
4.1.2. Module huấn luyện 57
4.1.3. Module xác thực 57
4.2. Dữ liệu tiếng nói 57
4.3. Tỷ lệ lỗi (Error rate) 58
4.4. Kết quả thực nghiệm 58
4.4.1. Số các hệ số MFCC 58
4.4.2. Mô hình VQ và GMM 59
4.4.3. Thời gian huấn luyện 59
4.4.4. Số các cụm của mô hình VQ 60
4.4.5. Số cụm của mô hình GMM 60
Kết luận và kiến nghị………………………………………………………...61
Tài liệu tham khảo…………………………………………………………...63


Link download cho ae ketnooi:


PHƯƠNG PHÁP NHẬN DẠNG TIẾNG NÓI VÀ XÂY DỰNG HỆ NHẬN DẠNG TIẾNG NÓI TRÊN MATLAB
Tìm hiểu về phương pháp LPC trong xử lý tiếng nói
Kỹ thuật trích chọn đặc trưng mfcc trong nhận dạng tiếng nói
 

tctuvan

New Member
Trích dẫn từ chanqua3ma:
mình tải k được, k biết server bị sao ấy, bạn gửi qua mail cho mình nha [email protected]
Thank bạn nhiều lắm

bạn dùng mạng viettel hay gì?
Up lại cho bạn link khác đây
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
D Ứng dụng mạng neuron cho vấn đề nhận dạng tiếng nói Luận văn Kinh tế 0
D Nghiên cứu các kỹ thuật xử lý ảnh phục vụ việc nâng cao chất lượng nhận dạng tiếng việt Công nghệ thông tin 0
B Nhận dạng và phân loại các thực thể có tên cho văn bản tiếng Việt Luận văn Sư phạm 4
T Nhận dạng tiếng Việt trên các thiết bị cầm tay (Báo cáo tổng hợp đề tài nghiên cứu khoa học cấp Đại học Quốc gia do Trường Đại học Công nghệ quản lý) Luận văn Sư phạm 0
F Nghiên cứu đặc trưng ngữ âm, từ vựng của thổ ngữ ở Hà Nội, ứng dụng trong việc giám định nhận dạng tiếng nói Văn hóa, Xã hội 0
D nghiên cứu xây dựng một chương trình nhận dạng tiếng nói tiếng Việt trong môi trường có nhiễu Công nghệ thông tin 0
D phương pháp nhận dạng tiếng nói và xây dựng hệ nhận dạng tiếng nói trên matlab Công nghệ thông tin 0
T Nghiên cứu ứng dụng mạng neuron và mô hình markov ẩn trong nhận dạng tiếng Việt Khoa học Tự nhiên 0
T Nhận dạng tiếng Việt sử dụng biến đổi Wavelet và mô hình Markov ẩn Công nghệ thông tin 0
A Nhận dạng tiếng nói trên cơ sở mạng Nơron nhân tạo Công nghệ thông tin 1

Các chủ đề có liên quan khác

Top