جدول المحتويات:
تعريف - ماذا يعني تركيب الكلام؟
توليف الكلام عبارة عن محاكاة اصطناعية للكلام البشري بواسطة جهاز كمبيوتر أو جهاز آخر. يستخدم نظير التعرف على الصوت وتوليف الكلام في الغالب لترجمة المعلومات النصية إلى معلومات صوتية وفي تطبيقات مثل الخدمات التي تدعم الصوت والتطبيقات المحمولة. بصرف النظر عن هذا ، يتم استخدامه أيضًا في التكنولوجيا المساعدة لمساعدة الأفراد ضعاف البصر في قراءة محتوى النص.
تيكوبيديا تشرح تركيب الكلام
يُعد VODER الخاص بـ Homer Dudley ، والذي كان يعتمد على مشفر الصوت من Bell Laboratories ، أول مُزج صوت كامل الوظائف. يُعرف الكمبيوتر المستخدم في توليف الكلام باسم توليف الكلام أو كمبيوتر الكلام. غالبًا ما يتم الحكم على جودة كمبيوتر الكلام من خلال تشابهه مع صوت الإنسان. لقد أدمجت معظم أنظمة تشغيل الكمبيوتر أجهزة توليف الكلام منذ أوائل التسعينيات. عادة ما يتم إنشاء الكلام المركب بمساعدة سلسلة متسلسلة من الكلام المسجل ، والذي يرد في قاعدة البيانات.
المرحلة الأولى في تركيب الكلام هي مرحلة ما قبل المعالجة ، مما يلغي الغموض المحيط بالطريقة التي تحتاج إلى قراءة الكلمة المحددة ، والتي تشمل أيضًا التعامل مع التماثلات. في المرحلة التالية من تخليق الكلام ، يساعد الكمبيوتر الأصوات الصوتية لتحويل النص إلى تسلسل من الأصوات. تتضمن المرحلة الأخيرة استخدام التسجيلات البشرية أو تقنيات توليد الصوت الأساسية لتقليد آلية الصوت البشري وقراءة النص بأكمله. أحد الفروع الشائعة لتوليف الكلام هو توليف الكلام السمعي البصري أو توليف الكلام المتعدد الوسائط الذي يستخدم الوجه المتحرك المتزامن بإحكام لاستكمال الكلام المركب. يتضمن توليف الكلام متعدد الوسائط أيضًا ميزات إضافية مثل الإشارات غير الكلامية للخطاب للمساعدة في توصيل كلمات المستخدم بمزيد من الدقة. تسمح العديد من أنظمة تركيب الكلام للمستخدمين باختيار نوع الصوت مثل الصوت الذكري أو الأنثوي.
معظم أنظمة تركيب الكلام قادرة على قراءة النصوص وإخراجها بطريقة ذكية للغاية على الرغم من أن الصوت يمكن أن يكون مملاً في بعض الأحيان. غير أن تخليق الكلام لم يطور بعد القدرة على تقليد الطيف الواسع من التجاوزات والإيقاعات البشرية.
