مرعيان المحبة
هل تريد التفاعل مع هذه المساهمة؟ كل ما عليك هو إنشاء حساب جديد ببضع خطوات أو تسجيل الدخول للمتابعة.

محركات البحث على الإنترنت (8)

اذهب الى الأسفل

محركات البحث على الإنترنت (8) Empty محركات البحث على الإنترنت (8)

مُساهمة من طرف deeb السبت أبريل 26, 2008 11:24 pm

د. زين عبد الهادى
مدير إدارة المعلومات بالمنظمة العربية للتنمية الإدارية
Zhady41@arado.org.eg
إنتهينا فى الحلقات السايقة إلى االتعريف بمحركات البحث على شبكة الإنترنت وأهميتها وبنيتها وتركيبها وطرق البحث المعتمده ، وقد أجرينا بعض التجارب المعملية على هذه المحركات لاختبار قوتها وسماتها، ومدى ملائمتها لمواقف بحثية معينة. وسوف نين فى هذا المقال نتائج هذه التجارب.
نتائج دراسة محركات البحث السالفة:
لوحظ من خلال التجربة المعملية التى أشرنا إليها أن هناك مجموعتين من النتائج، نتائج ذات طبيعة عامة خاصة بالمحركات كلها، ونتائج ذات طبيعة تتعلق بكل محرك على حدى، يمكننا الإشارة إليها فيما يلى.
1- النتائج العامة :
أ‌- يمكن القول بأن هناك مجموعة من العناصر التي تتحكم في نتائج البحث على أي محرك على شبكة الإنترنت، هذه العناصر بعضها يتعلق بالمحرك نفسه وقدراته وهي :
1- مدى دعم المحرك لصفحات الإطارات Frames وقدرته على تكشيفها.
2- مدى دعم المحرك لفقرات التعليقات Comments وقدرته على تكشيفها.
3- مدى قدرة المحرك على البحث في تركيبة Meta tag في صفحات المواقع وقدرته على استخلاص النتائج منها.
4- التكنولوجيا التي تم بناء المحرك بها وقدرتها على استخلاص النتائج المرجوة من صفحات المواقع أيا كان مكانها وموقعها.
5- مدى قيام المحرك بتنقيح الكشاف الذي يحتوي المواقع، وبالتالي إزالة المواقع (الميتة)، أو تحديث الروابط الموجودة بالفعل، أو إزالة الروابط المكسورة.
6- عدد الصفحات التي يقوم المحرك بتكشيفها في الموقع.
7- المدى الزمني الذي يقوم فيه المحرك (العنكبوت) بزيارة المواقع وتكشيفها.
8- الأهمية التي يوليها المحرك لتاريخ إنشاء الموقع وبالتالي ترتيبه بين نتائج البحث.
9- السياسة الإعلانية للشركة مالكة المحرك ومدى تأثيرها في ترتيب نتائج البحث.
10- استخدام نوع من التكشيف اليدوى فى المحرك، ممايعطى نتائج أدق من التكشيف الآلى.
11- استخدام أسلوب التعرف على نتائج البحث التى تمت من قبل، وقياس المواقع التى توجه إليها بالفعل المستفيدون من هذه النتائج.
وهناك مجموعة من العناصر تتعلق بالمواقع نفسها التي يقوم المحرك بتكشيفها مثل :
1- مدى ورود المصطلح من عدمه في تركيبة Meta tag.
2- عدد تكرارات المصطلح في تركيبة Meta tag.
3- عدد تكرارات المصطلح في الصفحة الأولى / أو الصفحات الأولى من الموقع.
4- عملية تصميم المواقع نفسها ومدى سماح المصمم للمحرك بتكشيف بعض الصفحات أو عدم تمكينه من تكشيفها.
وهناك مجموعة من العناصر المتعلقة بالأجهزة المستخدمة (العميل والخادم) وقدرات الاتصال وهي:
1- مواصفات الجهاز الخادم الذي سيتم الاتصال عن طريقه، فكلما كانت مواصفاته مرتفعة ومتقدمة كلما كان زمن البحث أسرع.
2- مواصفات الجهاز العميل الذي سيقوم بالاتصال، وينطبق عليه ما ينطبق على الجهاز الخادم.
3- خط الاتصال الذي يتم الاتصال عن طريقه، حيث تؤثر هذه القدرات على سرعة إنجاز البحث وهل يعمل الجهاز الخادم على خط مؤجر Leased Line ومعرف IP حقيقي أم من النوع البروكسي مما يساعد على ضعف أو قوة نقل البيانات وبالتالي سرعتها.
كذلك هناك مجموعة من العوامل المتعلقة بالمتصفح نفسه الذي سيستخدم في عرض البيانات. وكما هو معروف هناك متصفحان تجاريان يعملان على مستوى العالم في بيئة الحاسبات الشخصية هما متصفح إكسبلورر Explorerومتصفح نت سكيب Netscape، والعناصر المتعلقة بالمتصفح هنا هي :
1- مدى دعم المتصفح لعرض الصفحات الناتجة عن البحث.
2- مدى دعم المتصفح لعرض الإطارات Frames.
3- مدى دعم المتصفح لعرض محرر نصوص HTML وإمكاناته في قراءة هذه النصوص.
4- سرعة المتصفح نفسه في عرض نتائج البحث (أو العامل الزمني في البحث).
تشكل هذه المجموعة من العناصر مجتمعة المؤثر الأساسي على سرعة عرض النتائج وطريقة الحصول عليها وبالتالي عرضها.
وبالنسبة للنتائج المقارنة يمكن الإشارة إلى مايلى:
1. لوحظ أن محرك Alltheweb هو صاحب أقل زمن بحثي بين المحركات الستة, وعلى الرغم من أن محرك Google قام برصد الزمن الذي تم فيه البحث ,إلا أن تدخل العوامل التي ذكرها الباحث تؤثر على زمن عرض النتائج على الجهاز العميل لديه، إضافة إلى عوامل أخرى غائبة مثل المدى الزمنى الذى يتم فيه تنقيح كشاف المحرك، وتأثير ثصميم المواقع نفسها فى ظهورها كناتج للبحث ومدى قدرة المحرك على تكشيف صفحات الإطارات والتعليقات، ومدى الالتزام بتكشيف تركيبة Meta Tag إلى جانب العوامل الأخرى.
2. لوحظ أيضا أن المحركات الخمسة الباقية تأتي في الترتيب كالتالي:
1) محرك Lycos بمتوسط 4.3ث
2) محرك Altavista بمتوسط 6.33ث
3) محرك Excite بمتوسط 9.6ث
4) محرك Northernlight بمتوسط 10.7ث
3. لوحظ أيضا أن محرك Altavista هوصاحب أعلى نسبة نتائج لإجمالي الاستفسار يليه محرك Google ثم محرك Excite ثم محرك Alltheweb ثم محرك Northernlight ثم محرك Lycos.
4. بالنسبة للبحث بكلمة مفردة كان صاحب أعلى عدد من الواقعات محرك Altavista وكان هو أيضا صاحب أعلى عدد من الواقعات في البحث بكلمتين مفردتين أو بثلاث كلمات.
5. لوحظ أن المحرك Northernlight صاحب أقل عدد من الواقعات, وأن تبادل المركز مع محرك Lycos.
6. لوحظ هيمنة المواقع الأمريكية التي تظهر كنتائج للبحث وبنسبة تراوحت على المحركات الستة بالنسبة للأبحاث الثلاث بين 85% :96.6%.
7. لوحظ أيضا أنه بالنسبة لمجموع الاستفسارات الثلاثة علي المحركات الستة جاء مواقع المنظمات(.org) في المرتبة الأولى بعدد 51 موقعا، ثم المواقع التعليميـــة (.edu) بعدد 49 موقعا، ثم مواقع الشركات بعدد 43 موقعا، ثم المواقع الحكومية بعدد 24 موقعا، ثم المواقع الأخرى مثل (.net)، أو تلك التابعة لدول لا يمكن تحديد هويتها بعدد 11 موقعا.
8. يلاحظ أيضا أنه عند البحث بكلمة مفردة واحدة أتت مواقع الشركات في المرتبة الأولى (جدول 3), وربما يعود السبب في ذلك إلى اتساع استراتيجية البحث, بينما أتت مواقع المنظمات والمواقع التعليمية بأعلى نسبة نتائج عند البحث بجملة (جدول 7), وربما يعود السبب في ذلك إلى ضيق استراتيجية البحث، وهو ما قد يميز هذا النوع من الأبحاث.
النتائج الخاصة بكل محرك:
وهي مجموعة النتائج المتعلقة بكل محرك بحث على حدى.
1- محرك البحث All the web (Fast):
أ - عدد الصفحات الناتجة : يلاحظ على هذا المحرك أنه كلما تم تضييق استراتيجية البحث كلما قل عدد المواقع وبالتالي الصفحات الناتجة وفقاً للنسب التالية :


متوسط عدد المواقع التى يعرضها كل محرك البحث الأول البحث الثانى البحث بجملة
لكل 100 موقع ناتج 100 13 0.6
بمعنى أنه نسبة إلى كل 100 موقع في البحث بكلمة مفردة يتم عرض 13 موقعاً عند البحث بكلمتين، ويتم عرض 0.6 من الموقع عند البحث بجملة، وتتفق هذه النتيجة مع استراتيجيات البحث إجمالاً في أنه كلما ضاقت استراتيجية البحث كلها كان عدد النتائج أقل ومطابقاً إلى حد ما، عندما تم البحث عنه، ولكن لم يمكن دراسة الحشو Redundancy في الناتج المعروض – إلا فى أضيق الحدود- حيث يحتاج ذلك إلى بحث مواز يكشف عن مدى علاقة المواقع الناتجة بما تم البحث عنه، ويمكن القول بأن المواقع الناتجة احتوت على كلمات البحث التي تم البحث بها في الحالات الثلاث.
ب‌- حقق هذا المحرك أقل زمن بحثي بين المحركات الستة، مما يؤكد على أهمية استخدامه في الأبحاث التي تتطلب سرعة الإنجاز، حيث حصل على متوسط 2.7 ث بالنسبة لحالات البحث الثلاث. ويمكننا الزعم أيضاً بأنه يمكن استخدامه عند العمل على خطوط اتصال Dial up لبطء هذه الوسيلة في الاتصال، أو على خطوط مؤجرة ذات سرعات نقل ضعيفة لسرعته في عرض النتائج
جـ- فيما يتعلق بجنسية المواقع المعروضة أتت المواقع الأمريكية على رأس هذه المواقع من ناحية الجنسية، وبمتوسط عدد وصل إلى 9.33 مواقع أمريكية و 0.33 موقعاً بريطانياً و 0.33 موقعاً استرالياً. وتعود ظاهرة ارتفاع المواقع الأمريكية إلى سيطرة هذه المواقع على شبكة الإنترنت، إضافة إلى أن اللغة الإنجليزية هي لغة أغلب مواقع الإنترنت. كما أن المصطلح الذي تم البحث به هو مصطلح إنجليزي في الأساس، ولم يتم استخدام البحث بالمصطلح في كل اللغات، وهي إحدى خواص هذا المحرك.
د- فيما يتعلق بنوع المواقع أتت مواقع المنظمات في المرتبة الأولى بمتوسط 4.33 مواقع ثم مواقع الشركات بمتوسط 2.66 موقعاً لكل عشرة مواقع، ثم المواقع التعليمية بمتوسط 1.66 موقع لكل عشرة مواقع. وهذا المؤشر يعد مقبولاً - من وجهة نظر الباحث – لقياس مدى التنوع في عرض مواقع ذات فئة معينة.
وبصفة عامة يعد هذا المحرك مناسباً للأغراض البحثية والمهنية والتجارية إلى حد ما، ويمكن اللجوء إليه للأبحاث التي يجب إنجازها سريعاً خاصة في ظل استجابته السريعة للأسئلة والاستفسارات المرجعية، كما يناسب الباحثين باستخدام خطوط Dial up.
2- محرك البحث Altavista
أ‌- عدد الصفحات الناتجة : يلاحظ على هذا المحرك أنه صاحب أعلى النتائج، والغريب أنه عندما تم تطبيق استراتيجية البحث (البحث الثالث) كانت النتيجة مرتفعة عن البحث بمصطلح واحد، إذ وصل عدد الصفحات التي استرجعها إلى حوالي 59 مليون صفحة وموقع، مما يؤكد أنه استخدام المعامل البولياني (OR) وليس (And) وهذه النتيجة تؤكد على أهمية التعامل بحرص مع هذا المحرك وأهمية التأكيد على استخدام المعاملات البوليانية بشكل صحيح ووفقاً لرغبة المستفيد نفسه.
ب‌- حقق هذا المحرك زمناً بحثياً متوسطاً بلغ حوالي 6.33 ث وقد أتى في المرتبة الثالثة من حيث الزمن البحثي، على الرغم من النتائج الضخمة (عددياً) التي قدمها، ويمكن القول – بشكل نظري – أنه أسرع من محرك All the web قياساً إلى عدد نتائجه.
جـ- فيما يتعلق بجنسية المواقع فقد أتت المواقع الأمريكية في المركز الأول 9.33 مواقع لكل عشرة مواقع و 0.33 موقعاً بريطانياً لكل عشرة مواقع، و 0.33 موقعاً استرالياً لكل عشرة مواقع، ويصدق عليه نفس القول الذي سبق الإشارة إليه في محرك All the web.
د- فيما يتعلق بنوعية المواقع أتت مواقع الشركات في المرتبة الأولى بعدد 4 مواقع لكل عشرة مواقع وأتت المواقع الحكومية في المركز الثاني 2.66 موقع لكل عشرة مواقع، وتساوت المواقع التعليمية والمنظمات في نفس العدد 1.66 موقع لكل عشرة مواقع، وعلى ذلك يمكن استخدام هذا المحرك عند البحث في مواقع الشركات، حيث بلغت نسبة هذه المواقع حوالي 40% من نسبة المواقع التي يقدمها.
وبشكل عام يمكن القول بمناسبة هذا المحرك للأغراض ذات الطابع التجاري، وإن كانت ضخامة (عدد) نتائجه تؤكد أهميته في الأبحاث التي يندر أن تكون لها نتائج. وعلى ذلك يصدر – من وجهة نظر الباحث – باباً خلفياً للحصول على نتائج يمكن البحث فيها بعد ذلك خاصة للأكاديميين .
3- محرك البحث Excite
أ‌- عدد الصفحات الناتجة : بلغ متوسط عدد الصفحات الناتجة عن الأبحاث الثلاثة حوالي 6 مليون صفحة وموقع، وهو يعد – من وجهة نظرنا– عدداً كبيراً نسبياً، كما يلاحظ تقارب نتيجة البحث الثاني والثالث مما قد يشير أيضاً إلى استخدام المحرك للمعامل البولياني (Or) بديلاً عن المعامل (And) مما يشير أيضاً إلى أهمية التعامل بحرص عند بناء استراتيجيات البحث والتعامل مع هذا المحرك، خاصة مع المعاملات البوليانية وأساليب البحث الأخرى.
ب‌- زمن البحث : حقق هذا المحرك زمناً كبيراً قياساً إلى المحركات الأخرى – مع أهمية القول بأن هذه المساحة الزمنية نسبية.
2- جنسية المواقع : أتت المواقع الأميركية في قمة الهرم بنسبة عالية حيث احتلت 9.66 لكل عشرة مواقع، وأتت معها المواقع البريطانية بعدد 0.33 موقعاً لكل عشرة مواقع مما يعني أهمية هذا المحرك للباحثين عن المواقع الأمريكية بشكل عام.
3- نوعية المواقع : أتت مواقع الشركات على قمة المواقع بعدد 4.33 مواقع لكل عشرة مواقع، مما يجعله يسبق محرك الطافيستا، ويؤكد على استخدام المحرك للباحثين عن مواقع الشركات، خاصة في الاستفسارات التي تحمل الطابع التجاري.
وبصفة عامة يمكن القول بمناسبة هذا المحرك للأغراض ذات الطابع التجاري خاصة أن نوعية المواقع التي قدمها في أغلبها شركات .
4- محرك البحث Google
أ‌- عدد الصفحات الناتجة : بلغ متوسط الصفحات الناتجة عن الأبحاث الثلاثة حوالي 12.7 مليون صفحة وموقع، ولكن لاحظ أنه يستخدم المعامل البولياني (and) وليــس (or) بدليل أن البحث الثاني والثالث حقق نتائج قليلة للغاية قياساً إلى البحث الأول، مما يؤكد على أن استخدامه يتم بشكل صحيح خاصة بالنسبة للأكاديميين وراغبي البحث عن موضوعات محددة وحقيقة وسلامة نتائج البحث التي ستعرض.
ب‌- الزمن : حقق زمناً متوسطاً بلغ 7.8 ث بالنسبة للأبحاث الثلاثة وإن كان يلاحظ أن هناك تدرج زمني في نتائج كل من الأبحاث الثلاثة بلغ حوالي 1.5 ث بالزيادة بين كل بحث وآخر.
جـ- جنسية المواقع : أتت المواقع الأمريكية بعدد 8.66 موقعاً لكل 10 مواقع ثم المواقع البريطانية والنيوزيلاندية بنفس النسبة، ولم يتم التعرف على جنسية موقعين من المواقع الناتجة عن البحث الأول، ويلاحظ هنا نوعاً – ولو ضئيلاً – في التغطية المكانية للمواقع.
د- نوعية المواقع : أتت المواقع التعليمية ومواقع المنظمات في المركز الأول بنفس العدد وهو 3.66 صفحة، وموقع لكل عشرة مواقع، مما يؤكد أيضاً على مناسبة هذا المحرك للأغراض الأكاديمية والبحثية وللباحثين عن النصوص الكاملة.
وبصفة عامة فإن طريقة البحث وناتج البحث سواء من نوعية المواقع وإلى حد ما من جنسيتها يؤكد على أهمية المحرك للأغراض البحثية والأكاديمية .
5- محرك البحث Lycos
أ‌- عدد الصفحات الناتجة : بلغ متوسط عدد الصفحات والمواقع الناتجة عن الأبحاث الثلاثة حوالي 6 مليون صفحة وموقع، كما أنه يستخدم مباشرة المعامل البولياني (and) مما يؤكد أيضاً على عمق النتائج المستخلصة، حيث يمكن الإشارة أيضاً إلى أن نتيجة البحث الثالث وصلت إلى 256 ألف صفحة وموقع، مما يشير أيضاً إلى أهميته بالنسبة للأكاديميين والباحثين العلميين حيث يقدم نتائج دقيقة إلى حد معين بعد مراجعة الباحث للعديد من المواقع الناتجة عن الأبحاث التي قام بها بشكل تجريبي.
ب‌- الزمن : حقق هذا المحرك ثاني أفضل نتيجة من حيث سرعة زمن البحث، إذ وصل إلى متوسط 4.3 ثانية مما يؤكد أيضاً على أهمية استخدامه في الأبحاث التي تتطلب نوعاً من السرعة، أو للباحثين على خطوط من نوع Dial up، أو حتى الخطوط المؤجرة Lased Line المزدحمة أو الضعيفة.
جـ- جنسية الموقع: سيطرت المواقع الأميركية بشكل ساحق على نتائج هذا المحرك وبعدد 9.66 لكل عشرة مواقع، وأتت المواقع الاسترالية بعدد 0.33 لكل عشرة مواقع، مما يشير أيضاً بأن هذا المحرك يعكس الوجود والثقافة الأمريكية وهو يعتبر مناسباً للباحثين في هذا الاتجاه.
د- نوع المواقع: أتت المواقع التعليمية في المركز الأول بعدد 4 مواقع لكل عشرة مواقع، ثم مواقع الشركات، ثم مواقع المنظمات.
وعلى ذلك فهو مناسب للبحث في المؤسسات ذات الطابع التعليمي، خاصة من قبل الباحثين الأكاديميين، وفي ذات الوقت يناسب الباحثين في المؤسسات ذات الطابع التجاري.
وبشكل عام فهو صالح للباحثين الأكاديميين لدقة نتائجه وسرعته.
6- محرك البحث Northernlight :
أ‌- عدد الصفحات الناتجة : بلغ متوسط عدد الصفحات الناتجة عن الأبحاث الثلاثة 5 مليون صفحة، ويلاحظ أن البحث الثالث كانت نتيجته 305 ألف صفحة، مما يشير أيضاً إلى استخدام المحرك للمعامل (and). أيضا
ب‌- الزمن : حقق هذا المحرك متوسطاً زمنياً بلغ 10.7 ث للبحث الواحد وهو معدل زمني عال بالنسبة للمواقع الأخرى.
جـ- جنسية المواقع : يعد الموقع الوحيد الذي شهد تنوعاً كبيراً في جنسيات المواقع، وعلى الرغم من السيطرة الطبيعية للمواقع الأمريكية إلا أنه ظهرت فيه مواقع من كل من استراليا وألمانيا وهولندا ونيوزيلاندا وفرنسا، مما يؤكد على إيجابيته في استعراض جنسيات المواقع وما في ذلك من جاذبية للباحثين سواء الأفراد أو المؤسسات الراغبين في التنوع.
د- نوع المواقع : أتت المواقع التعليمية بأغلبية كبيرة وصلت إلى 4 مواقع لكل عشرة مواقع مما يؤكد مرة أخرى على مناسبته العالية للباحثين في المجال الأكاديمي.
وبصفة عامة ينفرد هذا المحرك بميزة قد لا توجد في أغلب المحركات الأخرى وهي أنه يقسم المواقع بالنسبة إلى الفئة المرجعية التي تنتمي إليها سواء كانت مراجع أو مصادر معلومات أخرى مثل المقالات والكتب وغيرها، مما يجعله أنسب محرك بين المحركات الستة للباحثين في مصادر معلومات محددة، أو في مواقع ذات نوعية محددة، حيث أنه يقدر هذه الأفضلية.



[b]

deeb
عضو ذهبي
عضو ذهبي

عدد الرسائل : 82
العمر : 41
تاريخ التسجيل : 24/04/2008

الرجوع الى أعلى الصفحة اذهب الى الأسفل

الرجوع الى أعلى الصفحة


 
صلاحيات هذا المنتدى:
لاتستطيع الرد على المواضيع في هذا المنتدى