• Home
  • /
  • Blog
  • /
  • सर्च इंजन कैसे काम करता है?

सर्च इंजन कैसे काम करता है?

सितम्बर 16, 2022

सर्च इंजन कैसे काम करता है

सर्च इंजन एक प्रकार की आंसर मशीन होती हैं। वे खोजकर्ताओं द्वारा पूछे जा रहे प्रश्नों के लिए सबसे प्रासंगिक परिणाम प्रदान करने के लिए इंटरनेट की सामग्री को खोजने, समझने और व्यवस्थित करने के लिए बनाई जाती हैं।

खोज परिणामों में दिखाई देने के लिए, आपकी सामग्री को पहले सर्च इंजिन्स के लिए दृश्यमान होना आवश्यक है। यकीनन यह SEO पहेली का सबसे महत्वपूर्ण हिस्सा है – यदि आपकी साइट नहीं मिल पाती है, तो आप SERPs (सर्च इंजन रिजल्ट्स पेज) में कभी भी दिखाई नहीं देंगे।

सर्च इंजन क्या होता है?

सर्च इंजन वेब सामग्री के खोज योग्य डेटाबेस हैं। वे दो मुख्य भागों से बने हैं:

  • खोज सूचकांक (सर्च इंडेक्स): वेब पेजों के बारे में जानकारी की एक डिजिटल लाइब्रेरी।
  • खोज एल्गोरिथम (सर्च अल्गोरिथम) कंप्यूटर प्रोग्राम जो खोज सूचकांक से मिलान परिणामों को रैंक करते हैं।

सर्च इंजन का उद्देश्य क्या है?

प्रत्येक सर्च इंजन का उद्देश्य उपयोगकर्ताओं को सर्वोत्तम, सर्वाधिक प्रासंगिक परिणाम प्रदान करना है। इस तरह आंशिक रूप से वे बाजार हिस्सेदारी हासिल करते हैं।

सर्च इंजन कैसे काम करता है?

सर्च इंजन तीन प्राथमिक कार्यों के माध्यम से काम करते हैं:

  • क्रॉलिंग: सामग्री के लिए इंटरनेट पर छानबीन करना, प्रत्येक URL के लिए कोड/सामग्री देखना।
  • अनुक्रमण(इंडेक्सिंग): क्रॉलिंग प्रक्रिया के दौरान मिली सामग्री को संग्रहीत और व्यवस्थित करना। एक बार जब कोई पृष्ठ अनुक्रमणिका में होता है, तो वह प्रासंगिक प्रश्नों के परिणामस्वरूप प्रदर्शित होने की दौड़ में होता है।
  • रैंकिंग: सामग्री के टुकड़े प्रदान करना जो एक खोजकर्ता की क्वेरी का सर्वोत्तम उत्तर देगा, जिसका अर्थ है कि परिणाम सबसे प्रासंगिक से कम से कम प्रासंगिक द्वारा अर्रेंज किए जाते हैं।

सर्च इंजन क्रॉलिंग क्या है?

क्रॉलिंग एक खोज प्रक्रिया है जिसमें खोज इंजन नई और अद्यतन सामग्री को खोजने के लिए रोबोट (क्रॉलर या स्पाइडर के रूप में जाना जाता है) की एक टीम भेजते हैं। सामग्री भिन्न हो सकती है – यह एक वेबपेज, एक छवि, एक वीडियो, एक पीडीएफ आदि हो सकती है – लेकिन प्रारूप की परवाह किए बिना, सामग्री लिंक द्वारा खोजी जाती है।

सर्च इंजन कैसे काम करता है

गूगलबोट कुछ वेब पेजों को लाकर शुरू करता है, और फिर नए URL खोजने के लिए उन वेबपेजों के लिंक का अनुसरण करता है। लिंक के इस पथ का अनुसरण करते हुए, क्रॉलर नई सामग्री ढूंढने में सक्षम होता है और इसे कैफीन नामक अपने इंडेक्स में जोड़ देता है – खोजे गए URL का एक विशाल डेटाबेस – बाद जब कोई खोजकर्ता जानकारी मांग रहा होता है तो इसे पुनर्प्राप्त किया जा सकता है।

सर्च इंजन इंडेक्स क्या है?

सर्च इंजन उन सूचनाओं को संसाधित और संग्रहीत करते हैं जो उन्हें एक अनुक्रमणिका (इंडेक्स) में मिलती हैं, जो उनके द्वारा खोजी गई सभी सामग्री का एक विशाल डेटाबेस होता है और खोजकर्ताओं की सेवा करने के लिए पर्याप्त है।

सर्च इंजन रैंकिंग

जब कोई किसी सामग्री की खोज करता है, तो सर्च  इंजन अत्यधिक प्रासंगिक सामग्री के लिए उनकी अनुक्रमणिका की छंटनी करते हैं और फिर खोजकर्ता की क्वेरी को हल करने की उम्मीद में उस सामग्री को ऑर्डर करते हैं। प्रासंगिकता के आधार पर खोज परिणामों के इस क्रम को रैंकिंग के रूप में जाना जाता है। सामान्य तौर पर, आप यह मान सकते हैं कि किसी वेबसाइट की रैंक जितनी अधिक होगी, सर्च इंजन उतना ही प्रासंगिक होगा उस साइट क्वेरी के लिए।

आपकी साइट के किसी हिस्से या पूरी साइट से सर्च इंजन क्रॉलर को अवरोधित करना संभव है, या सर्च इंजनों को उनकी अनुक्रमणिका में कुछ पृष्ठों को संग्रहीत करने से बचने का निर्देश देना भी संभव है। हालांकि ऐसा करने के कई कारण हो सकते हैं, यदि आप चाहते हैं कि आपकी सामग्री खोजकर्ताओं को मिले, तो आपको पहले यह सुनिश्चित करना होगा कि यह क्रॉलर के लिए वह सुलभ है और अनुक्रमित है। अन्यथा, वह सामग्री अदृश्य जैसी ही होती है।

क्रॉलिंग: सर्च इंजन आपके पेज को कैसे ढूंढते हैं?

जैसा कि आपने अभी सीखा, यह सुनिश्चित करना कि आपकी साइट क्रॉल और अनुक्रमित हो, SERPs में प्रदर्शित होने के लिए एक आवश्यक चीज़ है। यदि आपके पास पहले से ही एक वेबसाइट है, तो यह देखकर शुरू करना एक अच्छा विचार हो सकता है कि आपके कितने पृष्ठ अनुक्रमणिका में हैं। इससे कुछ अच्छी जानकारी मिलेगी कि क्या गूगल क्रॉल कर रहा है और उन सभी पेजों को ढूंढ रहा है जिन पर आप इसे चाहते हैं, और कोई भी जो आप नहीं चाहते हैं।

अपने अनुक्रमित पृष्ठों की जांच करने का एक तरीका “site:yourdomain.com” है, जो एक उन्नत खोज ऑपरेटर है। गूगल पर जाएं और सर्च बार में “site:yourdomain.com” टाइप करें। यह निर्दिष्ट साइट के लिए गूगल की अनुक्रमणिका में परिणाम लौटाएगा:

सर्च इंजन कैसे काम करता है

सर्च एल्गोरिदम क्या होता हैं?

सर्च एल्गोरिदम ऐसे सूत्र हैं जो इंडेक्स से प्रासंगिक परिणामों से मेल खाते हैं और रैंक करते हैं। गूगल अपने एल्गोरिदम में कई कारकों का उपयोग करता है, जैसे 

  • बैकलिंक्स
  • प्रासंगिकता
  • नयापन 
  • पेज स्पीड
  • मोबाइल के अनुकूल

बैकलिंक्स

किसी दिए गए वेब संसाधन के लिए एक बैकलिंक किसी अन्य वेबसाइट (संदर्भकर्ता) से उस वेब संसाधन (संदर्भ) का लिंक होता है। एक वेब संसाधन कोई वेबसाइट, वेब पेज या वेब निर्देशिका हो सकता है।

 बैकलिंक एक संदर्भ है जिसकी तुलना किसी उद्धरण से की जा सकती है। वेब पेज के लिए बैकलिंक्स की मात्रा, गुणवत्ता और प्रासंगिकता उन कारकों में से हैं जिनका मूल्यांकन गूगल जैसे सर्च इंजन यह अनुमान लगाने के लिए करते हैं कि पेज कितना महत्वपूर्ण है। पेजरैंक प्रत्येक वेब पेज के लिए स्कोर की गणना इस आधार पर करता है कि सभी वेब पेज आपस में कैसे जुड़े हैं, और यह उन चरों में से एक है जिसका उपयोग गूगल खोज यह निर्धारित करने के लिए करता है कि वेब पेज को खोज परिणामों में कितना ऊंचा जाना चाहिए। बैकलिंक्स का यह भार पुस्तकों, विद्वानों के पत्रों और अकादमिक पत्रिकाओं के उद्धरण विश्लेषण के अनुरूप है। 

बैकलिंक के लिए कुछ अन्य शब्द इनकमिंग लिंक, इनबाउंड लिंक, इनलिंक, इनवर्ड लिंक और साइटेशन हैं।

प्रासंगिकता

प्रासंगिकता खोजकर्ता के लिए दिए गए परिणाम की उपयोगिता है। इसे निर्धारित करने के लिए गूगल के पास कई तरीके हैं। सबसे बुनियादी स्तर पर, यह खोज क्वेरी के समान कीवर्ड वाले पृष्ठों की तलाश करता है। यह यह देखने के लिए इंटरैक्शन डेटा को भी देखता है कि क्या दूसरों को परिणाम उपयोगी लगता है।

नयापन

नयापन एक क्वेरी-निर्भर रैंकिंग कारक है। यह उन खोजों के लिए अधिक मजबूत है जो नए परिणामों की मांग करती हैं। यही कारण है कि आप “नई नेटफ्लिक्स श्रृंखला” के लिए हाल ही में प्रकाशित शीर्ष परिणाम देखते हैं, लेकिन “रूबिक क्यूब को कैसे हल करें” नहीं।

पेज स्पीड

पेज स्पीड डेस्कटॉप और मोबाइल पर एक रैंकिंग कारक है। परन्तु यह सकारात्मक से अधिक नकारात्मक रैंकिंग कारक है। ऐसा इसलिए है क्योंकि यह अच्छी पेज स्पीड वाले पृष्ठों को सकारात्मक रूप से प्रभावित करने के बजाय सबसे धीमे पृष्ठों को नकारात्मक रूप से प्रभावित करता है।

मोबाइल के अनुकूल

2019 में गूगल के मोबाइल-फर्स्ट इंडेक्सिंग पर स्विच करने के बाद से मोबाइल के अनुकूल होना मोबाइल और डेस्कटॉप पर एक रैंकिंग कारक बन गया है।

खोज परिणाम के करक

गूगल प्रत्येक उपयोगकर्ता के लिए खोज परिणाम तैयार करता है। ऐसा करने के लिए वे आपके स्थान, भाषा और खोज इतिहास जैसी जानकारी का उपयोग करते हैं। आइए इन बातों पर करीब से नज़र डालते हैं।

स्थान (लोकेशन)

गूगल आपके स्थान का उपयोग स्थानीय आशय से खोजों के परिणामों को वैयक्तिकृत करने के लिए करता है। इसलिए “इतालवी रेस्तरां” के सभी परिणाम स्थानीय रेस्तरां से या उसके बारे में हैं। गूगल जानता है कि आपके दोपहर के भोजन के लिए आधी दुनिया भर में उड़ान भरने की संभावना नहीं है।

भाषा

गूगल जानता है कि हिंदी उपयोगकर्ताओं को अंग्रेजी परिणाम दिखाने का कोई मतलब नहीं है। इसलिए यह विभिन्न भाषाएं बोलने वाले उपयोगकर्ताओं के लिए सामग्री के स्थानीयकृत संस्करणों (यदि उपलब्ध हो) को रैंक करता है।

सर्च हिस्ट्री

गूगल आपको अधिक वैयक्तिकृत खोज अनुभव देने के लिए आपके द्वारा की जाने वाली चीज़ों और आपके द्वारा जाने वाले स्थानों को सहेजता है।आप इससे बाहर निकल सकते हैं, लेकिन ज्यादातर लोग शायद नहीं करते हैं।

मुख्य बातें

  • सर्च इंजन में दो मुख्य भाग होते हैं: इंडेक्स और एल्गोरिदम।
  • अपनी अनुक्रमणिका बनाने के लिए, वे ज्ञात पृष्ठों को क्रॉल करते हैं और नए खोजने के लिए लिंक का अनुसरण करते हैं।
  • खोज एल्गोरिदम का उद्देश्य सर्वोत्तम, सबसे प्रासंगिक परिणाम लौटाना है।
  • बाजार हिस्सेदारी बढ़ाने के लिए खोज परिणाम की गुणवत्ता महत्वपूर्ण है।
  • ऑर्गेनिक परिणामों के लिए गूगल के सभी रैंकिंग कारकों को कोई नहीं जानता है।
  • प्रमुख रैंकिंग कारकों में बैकलिंक्स, प्रासंगिकता और ताजगी शामिल हैं।
  • गूगल आपके स्थान, भाषा और खोज इतिहास के आधार पर अपने परिणामों को वैयक्तिकृत करता है।

निष्कर्ष

सर्च इंजन एक सॉफ्टवेयर प्रणाली है जिसे वेब खोजों को करने के लिए डिज़ाइन किया गया है। वे टेक्स्ट वेब सर्च क्वेरी में निर्दिष्ट विशेष जानकारी के लिए वर्ल्ड वाइड वेब को व्यवस्थित तरीके से खोजते हैं। खोज परिणाम आम तौर पर परिणामों की एक पंक्ति में प्रस्तुत किए जाते हैं, जिन्हें अक्सर सर्च इंजन परिणाम पृष्ठ कहा जाता है।

अनुशंसित पठन

आमतौर पर पूछे जाने वाले प्रश्न

सर्च इंजन क्या है? कोई उदाहरण देकर समझाइये।

सर्च इंजन एक वेब-आधारित उपकरण है जो उपयोगकर्ताओं को वर्ल्ड वाइड वेब पर जानकारी का पता लगाने में सक्षम बनाता है। गूगल, याहू!, और एमएसएन सर्च सर्च इंजन के लोकप्रिय उदाहरण हैं।

सर्च इंजन का क्या महत्व है?

सर्च इंजन अनिवार्य रूप से इंटरनेट पर उपलब्ध सूचनाओं के भंडार के लिए फिल्टर के रूप में कार्य करते हैं। वे उपयोगकर्ताओं को कई अप्रासंगिक वेब पेजों के माध्यम से भटकने की आवश्यकता के बिना, वास्तविक रुचि या मूल्य की जानकारी को जल्दी और आसानी से खोजने में मदद करते हैं।

सर्च इंजन के फायदे और नुकसान क्या है?

सर्च इंजन वेब से उन सूचनाओं को पुनः प्राप्त करता है जो “वन साइट फिट ऑल” का अनुसरण करती हैं जो उपयोगकर्ताओं के अनुकूल नहीं है।

नुकसान: जब अलग-अलग उपयोगकर्ता एक ही क्वेरी देते हैं, तो एक ही परिणाम एक विशिष्ट खोज इंजन द्वारा वापस किया जाएगा। उपयोगकर्ता के लिए प्रासंगिक सामग्री प्राप्त करना मुश्किल हो जाता है।

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}
>