Tiến tới những chuẩn mở trong việc xử lý giọng nói

Chuyển đổi từ ngữ thành XML với Python

From the developerWorks archives

Colin Beckingham

Xuất bản lần đầu tiên vào ngày: 04 02 2013

Nhiều dự án nguồn mở đã bắt đầu trước khi có sự ra đời của các tiêu chuẩn phần mềm nguồn mở và miễn phí (FOSS), do đó, các tệp tài nguyên và cấu hình của chúng đều là các tệp flat-file đơn giản. Bằng cách chuyển đổi các tệp này sang tiêu chuẩn nguồn mở thích hợp, bạn có khả năng gia tăng tính tương thích, tính linh hoạt và độ tin cậy giữa các dự án. Từ ngữ trong việc nhận dạng giọng nói là một ví dụ thú vị. Trong bài này, hãy tìm hiểu cách sử dụng Python để chuyển đổi các từ ngữ hiện có sang định dạng XML được định nghĩa trong PLS (Pronunciation Lexicon Specification - Đặc tả từ ngữ phát âm) và cách chuyển đổi một tệp PLS mới trở lại một tệp flat-file. Hãy khám phá cách sử dụng định dạng XML để thêm thông tin bổ sung và sự chặt chẽ trong việc duy trì các từ vựng. Các vấn đề như Unicode và việc hợp nhất từ vựng mới với các tệp XML khác trong khi vẫn đang sử dụng dữ liệu trong việc tạo mô hình âm thanh, cũng được giải quyết.

This content is no longer being updated or maintained. The full article is provided "as is" in a PDF file. Given the rapid evolution of technology, some steps and illustrations may have changed.



static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Nguồn mở
ArticleID=857292
ArticleTitle=Tiến tới những chuẩn mở trong việc xử lý giọng nói
publish-date=02042013