Author

البيانات الكبرى .. ومعطياتها المعرفية

|

أستاذ هندسة الحاسب في كلية علوم الحاسب والمعلومات بجامعة الملك سعود

ينقل عن إريك شميت Eric Schmidt المدير التنفيذي لشركة جوجل Google قوله عام 2010 "إن ما يتم توليده من معلومات، خلال يومين فقط، يكافئ، من حيث الحجم، كل ما تم توليده من معلومات منذ فجر التاريخ، مرورا بالحضارات المختلفة، حتى عام 2003". ويقدر حجم المعلومات هذا بنحو "5 إكسا - بايت (5Exa-Byte EB)". ولإعطاء فكرة نتلمس من خلالها مقدار هذا الحجم، نذكر أن الإكسا بالتعريف هي تعبير عن مضاعفة قدرها "مليار - مليار مرة"؛ أي 18(10) مرة للأعداد المعطاة بالوحدة الرئيسة، وهي هنا البايت Byte، التي تقيس حجم المعلومات. ولأن البايت Byte الواحدة تستوعب حرفا واحدا، فإن حجم المعلومات، الذي يقصده شميت، يعادل أكثر من "مليون - مليار صفحة"، يزيد متوسط عدد كلمات الصفحة الواحدة فيها على 500 كلمة.
يعبر ما سبق عن أننا، في هذا العصر، نولد ونخزن ونتبادل أحجاما كبرى من المعلومات؛ وهذه الأحجام مرشحة للتزايد أكثر فأكثر، مع نمو عدد سكان العالم، وتزايد توجههم نحو استخدام الإنترنت، وكذلك مع التوسع في التطبيقات والخدمات المعلوماتية والشبكات الاجتماعية، ومع بروز مبتكرات معلوماتية غير مسبوقة كإنترنت الأشياء، وغيرها. وعلى ذلك فما نقول عنه اليوم حجم كبير، قد يكون حجما عاديا غدا، أو حتى صغيرا في المستقبل.
ولعلنا نحاول ضبط معاني بعض المصطلحات قبل أن نطرح ما سيأتي بشأن البيانات الكبرى. والمصطلحات المقصودة هنا هي: بيانات؛ ومعلومات؛ ومعرفة. فالبيانات معلومات جرى التعبير عنها بالرموز، فرموز النصوص المعتادة المطروحة في الكتب هي الأحرف والكلمات؛ ورموز النصوص المتداولة في الأنظمة الحاسوبية هي الرموز الثنائية، "صفر، وواحد". وهناك بالطبع روابط اصطلاحية بين هذه الرموز الثنائية وأحرف النصوص المعتادة. ويحتاج استخراج المعلومات من البيانات إلى فك الرموز، بمعنى القدرة على قراءة النصوص المعتادة؛ أو بمعنى تحويل الرموز الثنائية إلى رموز النصوص المعتادة، ثم قراءتها، وصولا إلى المعلومات التي تطرحها. وكثيرا ما نجد خلطا بين مصطلح بيانات ومصطلح معلومات، ولعل السبب هو أن البيانات رموز تحمل المعلومات، وأن تداول المعلومات وتخزينها يحتاج إلى ترميزها وجعلها بيانات.
ونأتي إلى مصطلح "المعرفة"، وهي مستوى ثالث يأتي بعد البيانات، ثم بعد المعلومات أيضا. المعلومات بالطبع تحمل معرفة، لكن جوهر المعرفة لا يدرك إلا من خلال عقل الإنسان، وذلك بعد تحليل فكري لما تقدمه المعلومات يؤدي إلى استيعاب مضمونها. ويشمل مثل هذا التحليل إجراءات ذهنية مختلفة، مثل التعرف على مصدر المعلومات، واستقراء التغيرات في الماضي، وتصنيف المعطيات، ومقارنتها بما يماثلها، ومتابعتها، وصولا إلى المعرفة المنشودة. وهناك برمجيات ووسائل تقنية حديثة تحاكي عقل الإنسان في تنفيذ التحليل الفكري للمعلومات، واستنباط المعرفة منها.
يعبر مصطلح "البيانات الكبرى Big Data " أساسا عن البيانات ذات الأحجام الكبيرة، التي يجري توليدها وتداولها يوميا. تحمل هذه البيانات معلومات كثيرة، وتتضمن معارف مختلفة، فيها الغث وفيها السمين؛ والغث والسمين هنا يتبع المتلقي ومدى اهتمامه بهذه المعرفة أو تلك. على أي حال، فإن البيانات الكبرى بما تحمله من معلومات كبرى، تتمتع بقيمة معرفية كبرى. وبالطبع هناك بيانات كبرى تطرح موضوعات عامة في مجالات شتى، كما أن هناك بيانات كبرى تطرح موضوعات محددة، ولكل منهما أهمية كبرى لدى هذا القطاع من الأفراد والمؤسسات أو ذاك.
ولعله من المفيد الإشارة هنا إلى أن مصطلح البيانات الكبرى، لا يقتصر، في معناه المتداول، على وصف حجم البيانات وكثافة توليدها، بل يرتبط أيضا بتحليل المعلومات التي تحملها البيانات، واستنباط معرفة مفيدة منها تناسب متطلبات القائمين عليها؛ إضافة إلى الاستفادة من ذلك في اختيار التوجهات واتخاذ القرارات. وقد قامت منظمات دولية ووطنية متخصصة، ومعروفة على نطاق واسع، بتحديد المفهوم الذي تراه للبيانات الكبرى، وقدمت نتيجة لذلك أفكارا متشابهة. وتشمل هذه المنظمات كلا من: الاتحاد الدولي للاتصالات ITU؛ ومنظمة المعايير الدولية ISO؛ والمعهد الوطني الأمريكي للمعايير والتقنية NIST؛ والمعهد البريطاني للمعايير BSI.
ينظر الاتحاد الدولي للاتصالات ITU إلى مفهوم البيانات الكبرى Big Data بعيون أي مؤسسة تود استنباط معرفة مفيدة لها من بيانات متاحة أمامها؛ ويضع الاتحاد لذلك سلسلة من أربع مراحل. تشمل التالي:
(1) جمع البيانات الخام المتاحة من مصادرها، والحصول على بيانات مولدة من مصادر أخرى.
(2) دمج البيانات الخام مع البيانات الأخرى، وتصنيفها وتخزينها.
(3) تطبيق خوارزميات وأساليب تحليل باستخدام محرك ذكي بغاية فهم المعرفة المضمنة في البيانات.
(4) تحويل مخرجات المحرك الذكي إلى معطيات جديدة تتمثل في قيمة، أو فهم أعمق، وتوصيات.
ليس مفهوم البيانات الكبرى مفهوما نظريا في الوقت الحاضر، بل بات مفهوما عمليا يجري استخدامه من قبل مؤسسات مختلفة، بما في ذلك الشبكات الاجتماعية. فالبيانات التي يطلقها كل مستخدم على الشبكات الاجتماعية يجري تحليلها واستنباط المعرفة منها. فعلى سبيل المثال، يتلقى مستخدم "تويتر Twitter" عادة، بعض نتائج المعرفة المستنبطة متمثلة في رسائل تشمل عناوين مستخدمين آخرين يهتمون بمثل ما يهتم به؛ كما أن مستخدم "يوتيوب YouTube" كثيرا ما يجد أمامه على شاشة النظام مقترحات لرؤية موضوعات تم التعرف على اهتمامه بها عبر تحليل بياناته السابقة.
هناك استخدامات عديدة لمفهوم البيانات الكبرى، والمعرفة المستنبطة منها، بعض هذه الاستخدامات يصلح لمختلف المجالات، وبعضها الآخر يختص بمجالات محددة. وتشمل استخدامات المجالات المختلفة، على سبيل المثال، موضوعات مثل اتخاذ القرار؛ وتطوير الإجراءات؛ والتعامل مع الزبائن وأصحاب العلاقة. وتتضمن استخدامات المجالات المحددة، على سبيل المثال أيضا، موضوعات المتابعة الصحية، والأمن، وأداء الأجهزة والآلات، وغير ذلك.
نحتاج إلى إعطاء مفهوم البيانات الكبرى الاهتمام المتزايد الذي يستحق، فهو وسيلة استنباط أو استخراج معارف كثيرة ومفيدة من البيانات المتاحة لنا محليا ودوليا في مختلف المجالات. نحتاج إلى تحفيز التوعية بشأن هذا المفهوم، ونحتاج إلى تعزيز البحث العلمي في شؤونه المختلفة. كما نحتاج إلى تفعيل اهتمام المؤسسات به، والعمل على الاستفادة من معطياته، في شتى مجالات الحياة. نحتاج إلى التعاون، إلى عمل مشترك، بين جميع أصحاب العلاقة، لتكون جهود الجميع في خدمة الجميع.

إنشرها