الطرق الصحيحة لاستخدام محركات البحث للوصول إلى الهدف

الطرق الصحيحة لاستخدام محركات البحث للوصول إلى الهدف

عند الرجوع إلى بدايات الدخول إلى عالم الإنترنت، قد يصعب عليك معرفة كيفية الذهاب إلى المواقع الإلكترونية، نظرا لصعوبة العنوان الإلكتروني، أو لقلة شهرة المواقع، ولكن عند الوقوف حديثاً على محركات البحث، ستشاهد عدة أسلحة ومفاتيح تعتبر معبراً للدخول إلى البوابات الإلكترونية.
إذ أصبح بالإمكان من خلال نافذة ومفاتيح كلمات الحصول على كم هائل من المواقع والبحوث، وأخيرا الصور والفيديو المتعلق بمفاتيح الكلمات المراد البحث عنها، فقد وفرت تلك المحركات عناء البحث عن العناوين والصفحات والمواقع الإلكتروني، وأصبح بالإمكان البحث عن المحتويات العلمية دون الرجوع إلى المستندات الورقية وغيرها بالشكل الافتراضي.
ولكن .. يبقى السؤال المهم، وهو: ماذا تعني محركات البحث؟ وكيف تعمل تلك المحركات؟ وما الوسيلة الأسهل للاستخدام الأمثل؟.
تعتبر محركات البحث، وكما يحب أن يطلقه محبوه search engine برنامجا مصمما يتيح لمستخدميه البحث عن كلمات معنية من خلال الكم الهائل من المصادر المختلفة على الإنترنت، سواء كانت WEB أو FTP أو TelNet، إذ يساعد هذا البرنامج في العثور على المعلومات المخزنة في أجهزة الخوادم المرتبطة بالشبكة العالمية والأجهزة الشخصية وجميع أجهزة التخزين المختلفة، حيث يبدأ هذا البرنامج بإصدار أمر بحث عن الكلمة المراد البحث عنها في تلك الأجهزة ومن ثم إظهار الناتج للمستخدم على عدة صيغ.

تاريخ محركات البحث

يعد واندكسWandex  ، أول برنامج يصمم للبحث البدائي فيما بين الشبكات وأجهزة الحاسب الآلي. ويعتبر محرك بحث بدائي على الشبكات وأجهزة الحاسب الآلي، وهو الآن فهرس خردة World Wide Web Wanderer وفي الوقت نفسه زاحف عنكبوتي web crawler طوّره ماثيو جراي في معهد ماساشوستس للتكنولوجيا MIT في 1993، وفي العام نفسه تم تصميم محرك بحث آخر مبكر جدا، آليويب Aliweb ظهر أيضا في 1993 وما زال ساريا حتى اليوم.
أما أول محرك بحث فعلي للنصوص الكاملة فكان "وبكراولر  "WebCrawler، وظهر عام  1994. وعلى عكس سابقيه، ترك المستخدمين يبحثون عن أي كلمة على أي صفحة "ويب"، وأصبح القاعدة لكل محركات البحث الكبرى منذ ذلك الوقت. ثم  جاء "لايكوسLycos " الذي بدأ في جامعة "كارنيجي ميلون Carneigie Mellon University وصار مشروعا تجاريا كبيرا.
وبعد وعي المستخدم ومعرفته التامة في مدى حاجة المستخدمين إلى مثل تلك البرامج من محركات بحث، بدأت تظهر وتنتشر وتتزاحم محركات البحث في منتصف التسعينيات، وكان من ضمنها إكسايت Excit، إنفوسيك Infoseek، إنكتومي Inktomi، نورثرن لايت Northern Light، وألتافيستاAlta Vista. وفي بعض الحالات تنافست مع الأدلة ذات الشعبية مثل ياهوو Yahoo. ، وفيما بعد، أدمجت الأدلة أو أضافت إليها تقنية محرك البحث من أجل أداء أكبر للوظائف.

كيف تعمل محركات البحث؟

تعمل محركات البحث عن طريق تخزين المعلومات من عدد كبير من صفحات الويب، والتي تستعيدها من الشبكة العالمية World Wide Web نفسها. وتستعاد هذه الصفحات بواسطة زاحف ويب (يعرف أحيانا أيضا بـ "عنكبوت") وهو مستعرض ويب آلي يتبع كل رابط يراه. بعد ذلك يجري تحليل كل صفحة لتحديد كيف ينبغي فهرستها (على سبيل المثال، تستخلص الكلمات من العناوين، رؤوس الموضوعات، أو حقول خاصة تسمى محتويات محدِّدات Meta tags). تخزن البيانات عن صفحات الويب في قاعدة بيانات فهرسية للاستخدام في عمليات البحث طلبا للمعلومات لاحقا.
بعض محركات البحث مثل جوجل، تخزن كل أو بعض الصفحة المصدر (وتشير لها بنسخة مخبئة) وبالمثل معلومات عن صفحات الويب، بينما بعضها تخزن كل كلمة من كل صفحة تجدها، مثل ألتافيستا، فهذه الصفحة المخبئة تمسك بنص البحث الفعلي بما أنه هو الذي تمت فهرسته فعليا، لذا فقد تكون مفيدة جدا عندما يكون محتوى الصفحة الحالية قد جرى تحديثه ولم تعد ألفاظ البحث فيه. ربما تعتبر هذه المشكلة شكلا خفيفا من تردي الروابط، وتزيد معالجة جوجل لها من إمكانية الاستخدام بإرضاء توقعات المستخدم بأن ترد ألفاظ البحث في صفحات الويب العائدة في الرد. وهو ما يرضي ’مبدأ مفاجأة أخف من مفاجأة‘ بما أن المستخدم يتوقع بشكل طبيعي ألفاظ البحث في النتيجة العائدة له. وهذه الصلة بالبحث تجعل هذه الصفحات المخبئة مفيدة جدا، حتى أكثر من واقع أنها قد تحتوي على بيانات ربما لم تعد متاحة في موضع آخر.
عندما يتوجه مستخدم لمحرك البحث ويجري عملية بحث طلبا للمعلومات، كما هو سائد بإعطاء كلمات مفتاحية، يفتش المحرك في الفهرس ويقدم قائمة بصفحات الويب الأفضل توافقا تبعا لمعاييره، في المعتاد مع ملخص قصير يحتوي على عنوان الوثيقة وأحيانا أجزاء من النص.
ومعظم محركات البحث تدعم استخدام الاصطلاحات البولينية (نسبة للجبر البوليني وهو نوع من المتغيرات المنطقية): AND وOR وNOT. وهناك خدمة وظيفية متقدمة هي البحث بالتقارب، والتي تسمح لك بتحديد المسافة بين الكلمات المفتاحية، باستخدام ألفاظ مثل NEAR، NOT NEAR، FOLLOWED BY، NOT FOLLOWED BY، SENTENCE، FAR.
ويعتمد مدى فائدة محرك بحث على مدى صلة النتائج التي يرد بها. فبينما قد تكون هناك ملايين صفحات الوِب التي تحتوي على كلمة أو عبارة محددة، قد تكون بعض أوثق صلة، أو أروج، أو معتمدة أكثر من غيرها. معظم محركات البحث توظف أساليب لوضع مراتب النتائج لتقدم أفضل النتائج أولا. الكيفية التي يقرر بها محرك بحث أي الصفحات هي الأفضل توافقا، وما النظام الذي يجب أن تظهر به النتائج، تختلف بشكل شاسع من محرك لآخر. الأساليب أيضا تتغير عبر الزمن بتغير استخدام إنترنت والتقنيات الجديدة المتطورة.
معظم محركات البحث هي مضاربات تجارية يدعمها عائد إعلاني وبالنتيجة، يوظف البعض الممارسة المثيرة للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائمهم في مراتب نتائج البحث.
والأغلبية الكاسحة من محركات البحث تديرها شركات خاصة تستخدم خوارزميات ملكها وقواعد بيانات مغلقة، وأكثرها رواجا حاليا هي Google و MSN وyahoo. توجد تقنية محركات بحث مفتوحة المصدر مثل إتش ?تي ? ، نتش، سيناز، إيجوثور وأوبن? إف ?تي?إس، ولكن ليس هناك خادم بحث World Wide Web مشاع يستخدم هذه التقنية.
ولفهم طبيعة عمل المحرك سيكون من المناسب الإشارة إلى أن محرك البحث يتألف  من ثلاثة أجزاء أو برامج  رئيسية هي: برنامج العنكبوت  spider program وبرنامج المفهرسindexer program وأخيرا برنامج محرك البحث.
بالنسبة للبرنامج الأول (العنكبوت): فإن محركات البحث تستخدمه لإيجاد صفحات جديدة على الويب لإضافتها، ويسمى هذا البرنامج أيضاً الزاحف crawler لأنه يُبحر في الإنترنت بهدوء لزيارة صفحات الويب والاطلاع على محتوياتها، ويأخذ البرنامج مؤشرات المواقع من عنوان الصفحة title، والكلمات المفتاحية keywords التي تحويها، إضافة إلى محتويات محدِّدات الميتا Meta tags فيها. كما يتابع البرنامج تَعقُّبَ الروابطlinks الموجودة فيها لزيارة صفحات أخرى. وذلك لوضع النصوص المنتقاة في نظام الفهارس لمحرك البحث، حتى يتمكن المحرك من العودة إليها فيما بعد.
أما برنامج المُفهرس فيُمثل الكتالوج catalogue وهو قاعدة بيانات   database  ضخمة توصف صفحات الويب، وتعتمد في هذا التوصيف على المعلومات التي حصلت عليها من برنامج العنكبوتspider كما تعتمد على بعض المعايير مثل الكلمات الأكثر تكراراً من غيرها. والركن الثالث في الموضوع هو برنامج محرك البحث search engine program ويبدأ دوره عند كتابة كلمة مفتاحيه keyword في مربع البحث search boxحيث يأخذ الكلمة المفتاحية ويبحث عن صفحات الويب التي تحقق الاستعلام الذي كونه برنامج المُفهرس في قاعدة بيانات الفهرس index database، ثم تُعرَض نتيجة البحث المتمثلة بصفحات الويب التي طلبها المُستخدِم في نافذة المُستعرض. Browser window
ويلاحظ أن محركات البحث تختلف عن بعضها في أسلوب العمل، فمثلاً: تحتفظ قاعدة بيانات ألتافيستا AltaVista بكل تفاصيل صفحة الويب المخزنة، أما غيرها من آليات البحث الأخرى فقد يحتفظ بالعناوين الرئيسية للصفحة فقط، ما يؤدي إلى اختلاف نتائج شكل ودقة نتائج البحث الظاهرة للمُستخدم.
ويمثل البحث باللغة العربية إشكالية ترتبط بالمدى الذي تتيحه تقنيات البحث بلغة مختلف عن تلك التي يسير بها الموقع إذ تختلف طبيعة اللغة العربية عن الإنجليزية، فالعربية لغة صَرفية morphological، بينما الإنجليزية لغة لصقية affixational. وقد ظهر أثر ذلك في محركات البحث الموجودة التي انقسمت إلى مجموعتين:
المجموعة الأولى قلَّدت محركات البحث الإنجليزية فجاءت نتائجها ضعيفة لاعتمادها في البحث على المطابقة الحرفية string matchingلكلمات البحث، ما يتسبب في حجب الكثير من المعلومات التي تتوافق مع الكلمات المراد البحث عنها فقد تختلف بأحرف زائدة بسيطة.
أما المجموعة الثانية فاعتمدت على تقنيات متقدمة لمعالجة اللغة العربية، ومن أبرز الأمثلة عليها : google ,  أراب فيستا Arab vista arabvista. وتميزت تلك المجموعة الثانية بإمكانات إضافية مثل: البحث، باللواصق، والبحث بالمشتقات.

طريقة البحث الأفضل

وللبحث عن أفضل النتائج ينصح بأخذ معامل البحث في الاعتبار مثال AND أو OR بحيث تستخدم مع مجموعة من الكلمات للبحث عن كل من هذه الكلمات المفتاحية على حدة. فمثلا إذا بحثنا عن : Computer OR technology سيعرض الموقع المواقع التي تحوي كلمة computer بمفردها، والمواقع التي تحتوي كلمة technology بمفردها. لكن يجب  مراعاة ترك مسافة قبل OR وعدم ترك مسافة بعدها.
و يستخدم رمز النجمة للبحث عن كلمة علم أحد مقاطعها، ويسمى البحث باستخدام المحارف البديلة wildcard search. مثال Tech *وهنا تعرض المواقع التي تبدأ كلماتها بالمقطع  Tech  مثلtechnology
ويمكن استخدام مجموعة من هذه المعاملات مع بعضها لتشكيل جُمل بحث متقدمة. كما يمكن في تلك المحركات تحديد مجالات البحث للوصول إلى نتائج أكثر دقة.
وفي السياق ذاته يعد دليل الويب Web directory، أو المُرشد أو الكتالوج catalogue or guide، وسيلةً أخرى للبحث عن المعلومات في شبكة الويب العالمية، وخلافاً لمحركات البحث، يحوي دليل الويب، وهو موقع على شبكة الإنترنت، روابطَ مُنظمة ومُرتبة (تنظم عادة حسب مواضيع عامة وأخرى فرعية) تُؤدي إلى مصادر المعلومات، وتنشئ هذه الأدلة من قبل بعض الجهات أو المؤسسات، ثم يجري تحديد مصادر المعلومات التي ستشير الروابط إليها، وتُجمع، وتُراجع، وتُنظم، وتُصنف لتوضع في النهاية في أدلة الويب.

الأكثر قراءة