توليد وتحليل المضلعات الصوتية للهجات سورية اعتماداً على قاعدة بيانات صوتية مُنجَزة

Authors

  • جعفر الخير
  • رنيم كناج

Abstract

تشكل قواعد البيانات الصوتية حجر الأساس في بناء نظم النطق الآلي والتعرف الآلي على الكلام وعلى المتكلم باختلاف اللغات واللهجات، وتكون عناصر قاعدة البيانات الصوتية عادةً ملفات صوتية سبق أن سجلت لأصوات أشخاص باللغة أو اللهجة المطلوبة، وكلما ذخرت قاعدة البيانات الصوتية بعناصر شاملة كلما أسهم ذلك في إنتاج أنظمة تخاطب مع الآلة ذات أداء متميز. ونظراً لعدم توفر قاعدة بيانات صوتية للهجات السورية؛ تمَّ في البحث بإنشاء قاعدة بيانات للصوتيات السورية، ضمت ستة عشر متطوع ومتطوعة من مناطق سورية مختلفة اللهجة سُجلت أصواتهم في ظروف تسجيل مختلفة؛ وذلك لدراسة تأثير تنوع اللهجات واختلاف الجنس وظروف التسجيل على مساحات المضلعات الصوتية. استثمر هذا البحث قاعدة البيانات الصوتية المُنجزة في مجال توليد وتحليل مضلعات الصوتيات السورية، وبالتالي تمَّ الحصول 64 مضلع صوتي تعود إلى 16 متحدث،حيث أن المضلع الصوتي هو مضلع هندسي رؤوسه تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه وتسمى النغمات ((Formants، ومساحة المضلع الصوتي الناتج تمثل مساحة المجال الصوتي. Speech databases form the main foundation in the construction of automatic utterance, speaker recognition and speech recognition systems in different languages and dialects. The elements of the speech database are audio files recorded for people's voices in the required language or dialect. The more the speech database is enriched with comprehensive elements the more it contributes to produce systems that communicate with the excellent performed machine. According to the lack of speech databases for the Syrian dialects, the research did one. The created database contained sixteen voluntaries from different Syrian dialects. Voluntaries' voices were recorded in different recording conditions that is for studying the effect of variety of dialects, gender and the conditions of recording on the vowel polygons. This research invested the created speech database in the field of generating and analyzing of vowel polygons, as the vowel polygon is a geometric polygon where its vertices represent the values of formant frequencies, and the area of the polygon represents the output acoustic space.

Downloads

Published

2016-12-04

How to Cite

1.
الخير ج, كناج ر. توليد وتحليل المضلعات الصوتية للهجات سورية اعتماداً على قاعدة بيانات صوتية مُنجَزة. Tuj-eng [Internet]. 2016Dec.4 [cited 2024Apr.26];37(6). Available from: https://journal.tishreen.edu.sy/index.php/engscnc/article/view/2252

Most read articles by the same author(s)

1 2 > >>