ماذا تعرف عن ضغط البيانات؟ 1/2
<a href="mailto:[email protected]">Prof.awad@alasmari.com</a>
كنا قد وعدنا القراء في مقالات سابقة بالحديث عن الطرائق المختلفة في مجال تخزين أو إرسال البيانات والتي تشكل هاجسا كبيرا لدى كثير من علماء التقنية. ولأنها ستكون ضمن المشكلات المستقبلية المتوقعة، حيث إنه سيكون هناك كم هائل من المعلومات المتبادلة (المرسلة) والمخزنة، خصوصاً عندما تكثر المواقع الخدمية والخاصة بالقطاعات الأهلية والحكومية في جميع مرافق الدولة ومنشآتها. وكذلك تطبيقات التجارة الإلكترونية المختلفة ستزيد من كميات المعلومات المراد تخزينها أو إرسالها.
سوف نورد وصفا مختصرا ومبسطا لتقنية متقدمة جداً في علم معالجة الإشارات والصور الرقمية. حيث إن هذا العلم يعتبر من العلوم الصعبة جداً. فهو يحتاج إلى علوم الرياضيات والإحصاء والاحتمالات ونظريات المعلومات. ولكن سوف أحاول جاهداً (إن شاء الله) عرضه بشكل مبسط ومفهوم. وعلى أية حال، فإني أقدم اعتذاري إلى القراء الكرام إذا كان هناك صعوبة في فهم بعض المقالات السابقة أو اللاحقة, ولكن لا خيار لي في هذا، فمعظم علوم التقنية الحديثة معقد جداً، والهدف شرح وتبسيط ما يمكن تبسيطه للفائدة.
مع زيادة مقدار المعلومات المطلوبة والمتوافرة تزداد الحاجة لطرق ووسائل أكثر فاعلية لتمثيل هذه المعلومات. الهدف هو تطوير طرق لاستغلال الأنواع المختلفة من التراكيب الممثلة في هذه البيانات. ويمكن أن تأتي المعلومات في أشكال مختلفة ومتنوعة مثل الحديث (الكلام) والصور والرسائل, وأشرطة الفيديو. سوف نبحث طرقاً متنوعة تستخدم أنواعاً مختلفة من التراكيب الموجودة في البيانات الآتية من مصادر مختلفة لتوفير التمثيل الكفء للبيانات.
ما ضغط البيانات؟ What is data compression?
ضغط البيانات هو اختزال مقدار مساحة الإشارة التي يجب تخصيصها لجهاز رسائل معين أو جهاز عينة بيانات. وقد تكون مساحة الإشارة على شكل حجم مادي, مثل وسيط تخزين البيانات في شريط ممغنط, أو فترة زمنية مثل الوقت اللازم لبث (إرسال) رسالة معينة, أو جزء من الطيف الكهرومغناطيسي مثل عرض النطاق اللازم لإرسال الموجة.
جميع أشكال مساحة الإشارة كالحجم (volume) ؛ والوقت (t) ؛ وعرض نطاق الموجة (B) يمكن ربطها مع بعضها البعض كما يلي: Volume = f(t,B)
حيث إن الدالة f معطاة بدلالة الزمن وعرض النطاق.
هكذا فإن الاختزال في الحجم يمكن ترجمته إلى اختزال في زمن البث (t) أو عرض نطاق الموجة (B). عادةً يحدد المعيار الذي يجب ضغطه أو اختزاله حيثما تتم عملية ضغط البيانات في النظام.
لماذا نستخدم ضغط البيانات؟ Why we use data compression?
تحتاج الوسائط غير المضغوطة, مثل الصور الجرافيكية, والبيانات السمعية أو البصرية ( بالفيديو) إلى سعة تخزين كبيرة, وعرض نطاق كبير لبث (إرسال) الموجات. على الرغم من التقدم السريع في كثافة التخزين الكمي(mass-storage density) , وسرعات جهاز المعالجة(Processor) , وأداء نظام الاتصال الرقمي, فإن الحاجة لسعة تخزين البيانات وعرض موجة بث البيانات، ما زالت تحتاج إلى تطوير التقنيات المتوافرة لاستيعاب هذا الكم الهائل من المعطيات. لم يحافظ التقدم الحالي لتطبيقات الإنترنت المبينة على أساس الوسائط المتعددة الكثيفة للبيانات على الحاجة لمزيد من الوسائل الأكثر فعالية لترميز البيانات والصور فحسب, ولكنها أيضا قد جعلت ضغط مثل هذه الإشارات أمرا ضروريا وذلك بالتركيز على تقنية التخزين والاتصال.
ضغط البيانات يمثل التحديات المستقبلية في مجال التقنية:
يوضح المثال التالي سعة التخزين أو معدَل الإرسال لبيانات الفيديو ذات الحركة الكاملة وما تحتاج إليه من مساحة على قرص التخزين أو عرض نطاق الإرسال وزمن البث اللازم لتخزين أو بث مثل هذه البيانات غير المضغوطة:
إشارة فيديو لمدة ثلاث ثوان (فقط) وبحجم صورة بمقدار 256x256 عنصر صورة (Pixels) سوف تحتاج إلى سعة تخزين مقدارها 47 ميجا بت (256x256x3x24). ولكي يتم إرسالها عن طريق الإنترنت عند سعة نطاق مقداره 128 كيلو بت في الثانية، نحتاج إلى فترة زمنية مقدارها ست دقائق.
يوضح المثال المذكور آنفاً بكل جلاء الحاجة لمساحة تخزين كافية وعرض موجة بث أكبر وزمن بث أطول للبيانات المصورة والمسموعة والمرئية. في مثل هذه الحالة, الحل الوحيد هو ضغط البيانات المتعددة الوسائط قبل تخزينها أو بثها وإزالة الضغط عنها عند جهاز الاستقبال لاسترجاعها. على سبيل المثال عند معدل ضغط مقداره 1:32 (كل 32 عنصرا نمثله بعنصر واحد), فإن المساحة وعرض نطاق الموجة ومتطلبات زمن البث يمكن اختزالها بواسطة عامل من 32 مع جودة مقبولة. سوف نحتاج إلى سعة تخزين مقدارها (1.5 ميجابت) أو سرعة إرسال مقدارها (11.25 ثانية).
يمكن تقسيم طرق ضغط البيانات إلى فئتين: طرق الضغط دون فقدان (Lossless Compression) وطرق الضغط المفقود (Lossy Compression). في المقال التالي سوف نتحدث عن تطبيقات واستخدامات هذين النوعين.