- अपना प्रश्न स्वीकार करें
- अपनी क्वेरी को पार्स करें
- शब्द क्रम का पता लगाएं
- इसके डेटाबेस में जानकारी देखें
- अपने बारे में जानने वाली हर चीज़ को ध्यान में रखकर अपने परिणामों को वैयक्तिकृत करें (जो एक बहुत है)
- परिणामों को रैंक करें
- अपने ब्राउज़र पर परिणाम भेजें
… और यह सब किया, 0.28 सेकंड में 3.44 मिलियन परिणाम लौटाया।

Google इतना तेज़ परिणाम कैसे लौटाता है?
पूरी तरह से ईमानदार होने के लिए, मुझे लगता है कि Google पर बहुत कम मुट्ठी भर लोग ही पूरी तरह जानते हैं कि यह कैसे किया गया है और यह संभव है कि कोई भी व्यक्ति इसके बारे में पूरी तरह से नहीं जानता या समझता है। हम में से बाकी लोगों को शिक्षित अनुमान लगाना पड़ता है जो हम यहां और वहां सीखी जाने वाली जानकारी के आधार पर करते हैं।
पहली बात हमें यह समझनी होगी कि जब आप बेसबॉल चमगादड़ों के लिए क्वेरी सबमिट करते हैं तो Google इंटरनेट पर खोज नहीं करता है। Google इंटरनेट के अपने सूचकांक को खोजता है। यह तुच्छ लग सकता है लेकिन यह एक महत्वपूर्ण अंतर है क्योंकि यह खोज को असीम रूप से तेज़ बनाता है।
इसे इस तरह से सोचें ... जब आप एक रसोई की किताब में देख रहे हों और यह जानने की कोशिश करें कि इस दो सप्ताह पुरानी रुतबागा के साथ क्या करना है जो आपको अपनी पुरानी चाची हैरियट की अंतिम यात्रा से मिली है, तो आप हर पृष्ठ के माध्यम से नहीं देखेंगे रुतबागा रेसिपी की तलाश में पुस्तक - आप पीछे इंडेक्स में फ्लिप करेंगे, रुतबागा के लिए "आर" के नीचे देखें, और इंडेक्स में सूचीबद्ध विशिष्ट पृष्ठों पर नज़र डालें।
यह वही है जो Google अपने सूचकांक को छोड़कर दुनिया की पूरी जानकारी के लिए संकेत करता है और आपकी रसोई की किताब में सूचकांक की तुलना में असीम रूप से बड़ा है। Google स्वीकार करता है कि इसका सूचकांक 100 मिलियन गीगाबाइट (100,000,000,000,000,000 बाइट्स) से अधिक है ... जिसका अर्थ है कि सूचकांक संभवतः उस आकार से कई गुना अधिक है।
बुनियादी के अलावा "खोज इंडेक्स नॉट द वेब" कॉन्सेप्ट, यह वही है जो इंटरनेट के हाइव दिमाग ने अधिभूत किया है यह उन प्रौद्योगिकियों का सबसे अधिक संभावित सेट है जो Google को इन गति को प्राप्त करने में मदद करते हैं।
एक वर्ल्डवाइड लोड बैलेंसिंग नेटवर्क के साथ कई डाटासेंटर
अपने आंतरिक कामकाज के कई घटकों की तरह, Google प्रसिद्ध रूप से संचालित किए जाने वाले डेटासेंटरों की संख्या और स्थान के बारे में तंग है। यह कहना पर्याप्त है कि यह बहुत कुछ है और वे पूरी दुनिया में हैं। 2012 के इस लेख से संकेत मिलता है कि संयुक्त राज्य में अकेले 21 डाटासेंटर हैं, अन्य देशों में 22 अन्य डाटासेंटर हैं। उन्होंने पिछले चार वर्षों में शायद अधिक निर्माण किया है, इसलिए मुझे यह मानते हुए सुरक्षित लगता है कि 43 वैश्विक डेटासेंटर शायद एक महत्वपूर्ण कमतर हैं।
भले ही, आप Google होमपेज पर "बेसबॉल बैट" के लिए एक क्वेरी सबमिट करते हैं, नेटवर्क उपकरण का एक स्मार्ट टुकड़ा आपकी खोज को आपके भौतिक स्थान के निकटतम डेटासेंटर तक निर्देशित करेगा। यदि वह डेटासेंटर किसी कारण से अभिभूत हो जाता है या ऑपरेशन से बाहर हो जाता है, तो आपको अगले निकटतम डेटासेंटर पर पुनर्निर्देशित किया जाएगा, और इसके बाद लाइन के नीचे।
इस मामले में दूरी मायने रखती है क्योंकि भले ही आपकी खोज प्रकाश की गति से नेटवर्क के माध्यम से यात्रा करती है, लेकिन लंबी दूरी का मतलब अब भी लंबा समय है।
डिस्ट्रीब्यूटेड लुकअप का उपयोग करके प्रत्येक डाटासेंटर में सैकड़ों कंप्यूटर
Google के कई दर्जन डेटाटेकर्स में से प्रत्येक में कई सैकड़ों व्यक्तिगत कंप्यूटर हैं। ये कंप्यूटर सभी नेटवर्क वाले हैं, ताकि वे डेटा का आदान-प्रदान कर सकें और एक साथ काम कर सकें। जब आपकी क्वेरी डेटासेंटर को मिल जाती है, तो उसे एक मास्टर सर्वर को सौंपा जाता है जो काम को अलग कर देता है और कई वर्कर सर्वर को लुकअप कार्य सौंपता है। ये कार्यकर्ता सर्वर Google के वेब इंडेक्स के अपने हिस्से के माध्यम से देखते हैं ताकि आपकी क्वेरी के लिए सर्वोत्तम परिणाम वापस आ सकें। परिणाम मास्टर सर्वर पर वापस आते हैं जो उन्हें व्यवस्थित और सॉर्ट करता है और फिर परिणाम आपके ब्राउज़र पर वापस भेजता है।
जब आप खोज करते हैं, तो आप एक दर्जन या यहां तक कि दो दर्जन सर्वरों की क्षमताओं का उपयोग कर सकते हैं ... और उन सर्वरों में एक साथ कई लुकअप को संभालने की क्षमता होती है ... और डेटासेंटर में सैकड़ों सर्वर होते हैं ... और कुछ दर्जन डेटासेटर्स दुनिया भर में। सभी संयुक्त और Google के पास अपने निपटान में कुछ गंभीर लुकअप हॉर्स पावर है।
कस्टम फाइल सिस्टम और कस्टम सॉफ्टवेयर
डेटासेटर्स में इन सर्वरों पर चल रहे अधिकांश महत्वपूर्ण सॉफ़्टवेयर Google इंजीनियरों द्वारा और विशेष रूप से Google के उपयोग के लिए कस्टम-लिखित हैं। यह सॉफ्टवेयर फाइलसिस्टम से ही है-जिसे जीएफएस या कोलोसस कहा जाता है- जो मकड़ियों को वेब क्रॉल करता है, डेटाबेस प्रबंधन प्रणालियों को, इन नए सॉफ्टवेयर पैकेजों के निर्माण और नियंत्रण के लिए विशेष प्रोग्रामिंग भाषाओं के लिए।
इस लेख में प्रयास करने और कवर करने का बहुत अधिक तरीका है, लेकिन आप Google के डेटासेंटर सॉफ़्टवेयर के बारे में और उनके नवीनतम क्लाउड सॉफ़्टवेयर के बारे में अधिक पढ़ सकते हैं। इस सॉफ़्टवेयर के प्रत्येक औंस को गति बढ़ाने और आपके खोज परिणामों को वापस करने में लगने वाले समय को कम करने के लिए डिज़ाइन किया गया है।
अधिक विशिष्ट तरीके
हालांकि मुझे इन विषयों के बारे में कोई विशेष जानकारी ऑनलाइन नहीं मिली, लेकिन मुझे आश्चर्य नहीं होगा कि खोज परिणामों की प्रक्रिया को तेज करने के लिए उनमें से कुछ या सभी का उपयोग किया गया था।
याद रखने वाली एक और बात यह है कि Google सबसे सटीक, सबसे सुसंगत या सबसे अद्यतित परिणाम प्रदान करने के लिए बाध्य नहीं है। यदि बेसबॉल चमगादड़ों की आपकी खोज पांच साल पहले व्यवसाय से बाहर हो चुकी कंपनी के लिए एक सूची देती है, तो आप अपने कंधों को सिकोड़ लेंगे, "यह अजीब है," एक अलग लिंक पर क्लिक करें या एक अलग खोज करें, और इसके बारे में सब भूल जाएं अगले दस सेकंड।
क्योंकि हम आम तौर पर खोज करते समय एक स्वीकार्य समय सीमा के भीतर परिणामों का एक स्वीकार्य सेट पाते हैं, एक निश्चित तरीके से, हम के रूप में उपयोगकर्ताओं को एक वेब खोज प्रक्रिया में एक अंधा विश्वास जगह है। हम सिर्फ अंकित मूल्य पर स्वीकार करते हैं कि हमारे द्वारा खोजे जाने वाले खोज परिणाम बहुत ही बेहतरीन खोज परिणाम हैं - भले ही अधिक सटीक परिणाम उपलब्ध हों। इसलिए जब तक हमें प्राप्त होने वाले परिणाम पर्याप्त नहीं होते हैं और हम अधिक खोज (और अधिक विज्ञापन विचारों) के लिए खोज इंजन पर लौटते हैं, Google के लिए यह काफी अच्छा है।
इसे इस तरह से सोचें ... जब आप एक रसोई की किताब में देख रहे हों और यह जानने की कोशिश करें कि इस दो सप्ताह पुरानी रुतबागा के साथ क्या करना है जो आपको अपनी पुरानी चाची हैरियट की अंतिम यात्रा से मिली है, तो आप हर पृष्ठ के माध्यम से नहीं देखेंगे रुतबागा रेसिपी की तलाश में पुस्तक - आप पीछे इंडेक्स में फ्लिप करेंगे, रुतबागा के लिए "आर" के नीचे देखें, और इंडेक्स में सूचीबद्ध विशिष्ट पृष्ठों पर नज़र डालें।
यह वही है जो Google अपने सूचकांक को छोड़कर दुनिया की पूरी जानकारी के लिए संकेत करता है और आपकी रसोई की किताब में सूचकांक की तुलना में असीम रूप से बड़ा है। Google स्वीकार करता है कि इसका सूचकांक 100 मिलियन गीगाबाइट (100,000,000,000,000,000 बाइट्स) से अधिक है ... जिसका अर्थ है कि सूचकांक संभवतः उस आकार से कई गुना अधिक है।
बुनियादी के अलावा "खोज इंडेक्स नॉट द वेब" कॉन्सेप्ट, यह वही है जो इंटरनेट के हाइव दिमाग ने अधिभूत किया है यह उन प्रौद्योगिकियों का सबसे अधिक संभावित सेट है जो Google को इन गति को प्राप्त करने में मदद करते हैं।
एक वर्ल्डवाइड लोड बैलेंसिंग नेटवर्क के साथ कई डाटासेंटर
अपने आंतरिक कामकाज के कई घटकों की तरह, Google प्रसिद्ध रूप से संचालित किए जाने वाले डेटासेंटरों की संख्या और स्थान के बारे में तंग है। यह कहना पर्याप्त है कि यह बहुत कुछ है और वे पूरी दुनिया में हैं। 2012 के इस लेख से संकेत मिलता है कि संयुक्त राज्य में अकेले 21 डाटासेंटर हैं, अन्य देशों में 22 अन्य डाटासेंटर हैं। उन्होंने पिछले चार वर्षों में शायद अधिक निर्माण किया है, इसलिए मुझे यह मानते हुए सुरक्षित लगता है कि 43 वैश्विक डेटासेंटर शायद एक महत्वपूर्ण कमतर हैं।
भले ही, आप Google होमपेज पर "बेसबॉल बैट" के लिए एक क्वेरी सबमिट करते हैं, नेटवर्क उपकरण का एक स्मार्ट टुकड़ा आपकी खोज को आपके भौतिक स्थान के निकटतम डेटासेंटर तक निर्देशित करेगा। यदि वह डेटासेंटर किसी कारण से अभिभूत हो जाता है या ऑपरेशन से बाहर हो जाता है, तो आपको अगले निकटतम डेटासेंटर पर पुनर्निर्देशित किया जाएगा, और इसके बाद लाइन के नीचे।
इस मामले में दूरी मायने रखती है क्योंकि भले ही आपकी खोज प्रकाश की गति से नेटवर्क के माध्यम से यात्रा करती है, लेकिन लंबी दूरी का मतलब अब भी लंबा समय है।
डिस्ट्रीब्यूटेड लुकअप का उपयोग करके प्रत्येक डाटासेंटर में सैकड़ों कंप्यूटर
Google के कई दर्जन डेटाटेकर्स में से प्रत्येक में कई सैकड़ों व्यक्तिगत कंप्यूटर हैं। ये कंप्यूटर सभी नेटवर्क वाले हैं, ताकि वे डेटा का आदान-प्रदान कर सकें और एक साथ काम कर सकें। जब आपकी क्वेरी डेटासेंटर को मिल जाती है, तो उसे एक मास्टर सर्वर को सौंपा जाता है जो काम को अलग कर देता है और कई वर्कर सर्वर को लुकअप कार्य सौंपता है। ये कार्यकर्ता सर्वर Google के वेब इंडेक्स के अपने हिस्से के माध्यम से देखते हैं ताकि आपकी क्वेरी के लिए सर्वोत्तम परिणाम वापस आ सकें। परिणाम मास्टर सर्वर पर वापस आते हैं जो उन्हें व्यवस्थित और सॉर्ट करता है और फिर परिणाम आपके ब्राउज़र पर वापस भेजता है।
जब आप खोज करते हैं, तो आप एक दर्जन या यहां तक कि दो दर्जन सर्वरों की क्षमताओं का उपयोग कर सकते हैं ... और उन सर्वरों में एक साथ कई लुकअप को संभालने की क्षमता होती है ... और डेटासेंटर में सैकड़ों सर्वर होते हैं ... और कुछ दर्जन डेटासेटर्स दुनिया भर में। सभी संयुक्त और Google के पास अपने निपटान में कुछ गंभीर लुकअप हॉर्स पावर है।
कस्टम फाइल सिस्टम और कस्टम सॉफ्टवेयर
डेटासेटर्स में इन सर्वरों पर चल रहे अधिकांश महत्वपूर्ण सॉफ़्टवेयर Google इंजीनियरों द्वारा और विशेष रूप से Google के उपयोग के लिए कस्टम-लिखित हैं। यह सॉफ्टवेयर फाइलसिस्टम से ही है-जिसे जीएफएस या कोलोसस कहा जाता है- जो मकड़ियों को वेब क्रॉल करता है, डेटाबेस प्रबंधन प्रणालियों को, इन नए सॉफ्टवेयर पैकेजों के निर्माण और नियंत्रण के लिए विशेष प्रोग्रामिंग भाषाओं के लिए।
इस लेख में प्रयास करने और कवर करने का बहुत अधिक तरीका है, लेकिन आप Google के डेटासेंटर सॉफ़्टवेयर के बारे में और उनके नवीनतम क्लाउड सॉफ़्टवेयर के बारे में अधिक पढ़ सकते हैं। इस सॉफ़्टवेयर के प्रत्येक औंस को गति बढ़ाने और आपके खोज परिणामों को वापस करने में लगने वाले समय को कम करने के लिए डिज़ाइन किया गया है।
अधिक विशिष्ट तरीके
हालांकि मुझे इन विषयों के बारे में कोई विशेष जानकारी ऑनलाइन नहीं मिली, लेकिन मुझे आश्चर्य नहीं होगा कि खोज परिणामों की प्रक्रिया को तेज करने के लिए उनमें से कुछ या सभी का उपयोग किया गया था।
- कैशिंग - मुझे यकीन है कि अक्सर ऐसे मामले होते हैं जब ऑनलाइन कई लोग एक ही जानकारी या एक ही समय के आसपास बहुत समान जानकारी खोज रहे होते हैं। उदाहरण के लिए, हाल ही में 2016 के राष्ट्रपति वाद-विवाद ऑनलाइन लाइव-स्ट्रीम किए गए थे। संभवतः "लाइव स्ट्रीम प्रेसिडेंशियल डिबेट" या इसके कुछ भिन्नता के लिए Google पर खोज करने वाले हजारों लोग थे। मैं यह शर्त लगाता हूं कि Google ने उस क्वेरी के परिणामों को एक शीर्ष-स्तरीय सर्वर में कैश्ड कर दिया है, ताकि हर बार यह खोज करने के लिए मशीनों को जानकारी देखनी न पड़े।
- रैम में अनुक्रमित स्टोरेज - हार्ड ड्राइव- यहां तक कि सॉलिड स्टेट हार्ड ड्राइव- रैम की तुलना में धीमे होते हैं। उच्चतम संभव गति के लिए, कार्यकर्ता सर्वर में सूचकांक संभवतः डिस्क पर बजाय रैम में संग्रहीत किया जाएगा।
- Google Pre-FetchPre-fetching Results - जब हम Google खोज बार में "बेसबॉल चमगादड़" टाइप करते हैं, तो खोज इंजन स्वचालित रूप से हम जो चाहते हैं, उसके लिए यह सबसे अच्छा अनुमान लगाता है। हालांकि यह हमारे लिए उपयोगी है क्योंकि उपयोगकर्ताओं को हमारे विचार को पूरी तरह से टाइप नहीं करना है, यह Google के लिए और भी अधिक उपयोगी है जो पहले से खोजे गए खोज शब्दों के पहले पाँच या दस या दर्जन तक देख सकते हैं और उन्हें लगभग तुरंत उपलब्ध कर सकते हैं "एंटर" कुंजी को दबाए जाने के बाद उपयोगकर्ता।
याद रखने वाली एक और बात यह है कि Google सबसे सटीक, सबसे सुसंगत या सबसे अद्यतित परिणाम प्रदान करने के लिए बाध्य नहीं है। यदि बेसबॉल चमगादड़ों की आपकी खोज पांच साल पहले व्यवसाय से बाहर हो चुकी कंपनी के लिए एक सूची देती है, तो आप अपने कंधों को सिकोड़ लेंगे, "यह अजीब है," एक अलग लिंक पर क्लिक करें या एक अलग खोज करें, और इसके बारे में सब भूल जाएं अगले दस सेकंड।
क्योंकि हम आम तौर पर खोज करते समय एक स्वीकार्य समय सीमा के भीतर परिणामों का एक स्वीकार्य सेट पाते हैं, एक निश्चित तरीके से, हम के रूप में उपयोगकर्ताओं को एक वेब खोज प्रक्रिया में एक अंधा विश्वास जगह है। हम सिर्फ अंकित मूल्य पर स्वीकार करते हैं कि हमारे द्वारा खोजे जाने वाले खोज परिणाम बहुत ही बेहतरीन खोज परिणाम हैं - भले ही अधिक सटीक परिणाम उपलब्ध हों। इसलिए जब तक हमें प्राप्त होने वाले परिणाम पर्याप्त नहीं होते हैं और हम अधिक खोज (और अधिक विज्ञापन विचारों) के लिए खोज इंजन पर लौटते हैं, Google के लिए यह काफी अच्छा है।
0 Comments