تقنية تمييز الصوت

[email protected]

بعض الموضوعات والتقنيات المتقدمة يصعب شرحها وتبسيطها للقارئ العربي. والسبب عدم تعودنا على بعض المفردات العلمية المترجمة، إضافة إلى أن بعض الجمل (أحياناً) يصعب فهمها لأنها لا تعطينا الصور البلاغية ولا الإحساس والذوق الذي تتمتع به اللغة العربية.
الإعلام المقروء والمسموع والمرئي قام بدور لا باس به في ترجمة بعض الموضوعات التقنية. ولكن هذا لا يرقى إلى أن يكون مصدرا أساسيا لتوطين التقنية، لأنه لا يشرح الأساسيات النظرية (Basic Theory) التي بُنيت عليها تقنية (ما). عصرنا هذا (عصر التقنية وثورة المعلومات)، فقد تجد كثيراً من الناس يُجِيدون اللغة الإنجليزية، وقد يكون أسهل عليهم فهم الموضوعات التقنية باللغة الإنجليزية منها لو كانت باللغة العربية. ولكن بالتأكيد سوف يجدون صعوبة (كبيرة) لشرح أساسيات التقنية باللغة العربية للفرد العادي، والذي عنده طموح وحب لفهم بعض العلوم, ولكن العقبة الوحيدة التي وقفت أمامه وحطمت طموحه عدم إجادته اللغة الإنجليزية. إضافةً إلى عدم وجود مراجع عربية تشرح أساسيات العلوم، وخصوصاً التقنيات الحديثة. وإن وجدت فقد يكون هناك صعوبة للحصول عليها.
اجتهاداً مني وبمساعدة جريدة الاقتصادية، حاولت الإسهام في مجال تعريب التقنية ولو بالنزر القليل لشرح بعض التقنيات المتقدمة والتي نستخدمها كثيراً في حياتنا العملية. قد يكون هناك تقصير في الشرح وطريقة العرض، ولكن السبب أن معظم التقنيات يصعب ترجمتها إلا من قبل دور نشر متخصصة.
هناك تقنية تسمى تمييز الصوتspeech recognition ، سوف أتطرق لشرحها وإلى بعض تطبيقاتها.
كيف تعمل تقنية تمييز الصوت؟
عندما نتحدث عبر الهاتف إلى كثير من المؤسسات الحكومية أو الشركات، فإنه (في الغالب) لا يرد عليك شخص. بدلا من ذلك، يرد عليك تسجيل صوت آلي يطلب منك ضغط الأزرار للتحرك خلال قوائم الخيارات. العديد من المؤسسات الحكومية والشركات تجاوزت مرحلة ضغط قوائم الأزرار إلى مراحل متقدمة عن طريق الكلام ( كلمات محددة للتحرك خلال القائمة والحصول على مبتغاك). ويعرف هذا النظام بالهاتف الآلي Automated Phone المعتمد على برامج تمييز الأصوات. هناك العديد من البرامج الحاسوبية التي بالإمكان شراؤها واستخدامها للأغراض الخاصة وللأعمال التجارية.
يمكن استخدام هذه البرامج لكتابة رسالة نصية عن طريق تحويل الكلام إلى نص مكتوب. فأنت تستطيع أن تتحدث عبر الميكروفون وتحوله برمجيات تمييز الصوت speech recognition إلى نص مكتوب على هيئة وثيقة أو رسالة أو بريد إلكتروني وبدون استخدام لوحة المفاتيح. تُدخل أوامر (تعليمات) صوتية على هيئة كلام (حديث) ويميزها الحاسوب: كأن تقول (اذهب إلى قائمة الملفات)، (افتح الملف)، بدون استخدام الفارة أو لوحة المفاتيح.
هناك برامج صممت لأغراض خاصة مثل التطبيقات الأمنية والقانونية والطبية.
تُستخدم أنظمة تمييز الصوت من قبل أولئك الذين لديهم عجز يمنعهم من الطباعة مثل عدم إمكانية استعمال اليدين أو لدى ضعيفي البصر والذين لا يستطيعون استعمال لوحة مفاتيح برايل. نظام تمييز الأصوات يمكن الشخص المعاق من التعامل مع الحاسوب بسهولة ويسر.
تنقسم البرامج الحالية إلى صنفين:
الصنف الأول: مفردات قليلة / عدد كبير من المستعملين. وهذه الأنظمة مثالية لاستخدامها للهاتف الآلي حيث إن المستعملين يستطيعون الكلام بكثير من الاختلاف في أنماط الخطاب واللهجة ويمكن تحسين النظام عن طريق حفظ المخاطبات لجميع المستخدمين لكي يسهل تمييز أصواتهم فيما بعد. على أية حال، النظام محدد بعدد قليل من الأوامر المُعرفة مُسبقاً مثل قائمة الخيارات الأساسية.
الصنف الثاني: مفردات كثيرة / عدد محدد من المستخدمين. هذا النظام يمكن استخدامه في الأماكن التي بها عدد قليل من المستخدمين. حيث أثبتت كفاءتها بدرجة عالية من الدقة تصل إلى 85 في المائة، ولكنها تحتاج إلى خبراء في مجال هذه التقنية. ويجب تدريب النظام على عدد كبير من المفردات المختلفة تصل إلى عشرات الآلاف ومن قبل عدد محدود من المستعملين للنظام. ويجب تحديد عدد من الأفراد للتعامل مع النظام، لكي يتمكن من التعرف على أصواتهم وحفظ نبرة الصوت لكل فرد. قد يستخدم هذا النظام في أمن المنشآت والمراكز الحساسة. لا يقبل النظام أي أوامر أو مُدخلات من أي فرد خارج النظام.
في البداية صممت برامج بسيطة تعتمد على الكلام المنفصل (كلمة واحدة أو كلمتين) مع وضع مهلة بسيطة بين الكلمات. المشكلة أن أكثر المستخدمين يفضل الكلام بسرعة المحادثة الطبيعية ولكن مع تقدم التقنية والبرمجيات، معظم الأنظمة الحديثة قادرة على التعامل مع الخطاب المستمر (المحادثة والكلام بشكل طبيعي). في المقال المقبل (إن شاء الله)، سوف نتحدث عن كيفية تحويل المحادثة أو الصوت إلى نص.

الأكثر قراءة

المزيد من مقالات الرأي