इन्टरनेट, ब्लग
कसरी गुगल सूचकांक बाट एउटा साइट वा यसको टुकडे हटाउन
गुगल द्वारा अपनाए अनुक्रमणिका अवधारणा अनुसार, पूर्णता को हिसाब जानकारी र परिणाम को जारी मा खोज प्रश्न गर्न यसको एकरूप को objectivity। सूचकांक स्पाम लागि अवैध सामग्री, वा स्रोत वेबसाइट पतन भने, यो साइट को पृष्ठ साधारण डेटाबेस खोज इन्जिन छैन मार्क गरिनेछ। हामीलाई यो जान्न महत्वपूर्ण छ कसरी एउटा साइट हटाउन खोज सर्भर को परिणाम जारी देखि।
शून्य अनुक्रमणिका गुगल को भिन्न
नयाँ स्रोतहरू बारेमा जानकारी संकलन गर्न एक कार्यक्रम - - खोज रोबोट एक पटक पृष्ठ द्वारा साइट पृष्ठ स्क्यान गर्नेछ, त्यसपछि, पार्सिङ लागि Google नीति आवश्यकताहरु अन्तर्गत, यो अनुक्रमित गर्दा गरिनेछ। तर हामी पनि देखाउन कसरी एक robots.txt मार्फत खोज इन्जिन लागि आफ्नो साइट वा टुकडे हटाउन - सूचकांक र एकै समयमा बिसौनीमा खोज।
एक सारा रूपमा स्रोत को जारी बाट निकाल्न भएको साइट स्थित छ सर्भर को मूल फोल्डर मा, एक निश्चित पाठ क्षेत्र सिर्जना - robots.txt बताए। यो क्षेत्र खोज इन्जिन संग उपचार र पढ्न निर्देशनहरू अनुसार कार्य भएको छ।
गुगल खोज इन्जिन प्रयोगकर्ता पहुँच छ भने पनि indexes पृष्ठ, प्रतिबन्धित हेर्न भनेर नबिर्सनुहोस्। ब्राउजर 401 वा 403 संग जवाफ "पहुँच अमान्य छ", यो केवल पर्यटकहरूलाई, बरु कार्यक्रम यो लागि भेला भन्दा लागू खोज इन्जिन।
बुझ्न कसरी हटाउन खोज इन्जिन अनुक्रमण देखि साइट, एउटा पाठ सूचक निम्न लाइनहरू प्रविष्ट गर्नुपर्छ:
प्रयोगकर्ता-एजेन्ट: Googlebot
अस्वीकार: /
यो साइटमा सबै सामग्री को निषेधाज्ञा सूचकांक गर्न क्रलर गर्न संकेत गर्छ। यहाँ कसरी एउटा साइट हटाउन उत्तरार्द्ध पत्ता सूचीमा स्रोत केस छैन भनेर, गुगल।
विभिन्न प्रोटोकल लागि स्क्यान को Embodiments
तपाईं जसको लागि तपाईं उदाहरणका लागि, Google अनुक्रमणिका लागि विशेष नियम लागू गर्न चाहनुहुन्छ व्यक्तिगत संचार स्तर, अलग हाइपरटेक्स्ट लागि सूची आवश्यक छ भने प्रोटोकल http / https, यसलाई निम्न तरिका (उदाहरण) मा robots.txt मा दर्ता गर्न पनि आवश्यक छ।
(Http://yourserver.com/robots.txt) - आफ्नो साइट को डोमेन नाम (कुनै पनि)
प्रयोगकर्ता-एजेन्ट: * - कुनै पनि खोज इन्जिन
अनुमति दिनुहोस्: / - पूर्ण indexation अनुमति
कसरी मुद्दा देखि पूर्ण https प्रोटोकल एउटा साइट हटाउन
(Https://yourserver.com/robots.txt):
प्रयोगकर्ता-एजेन्ट: *
अस्वीकार: अनुक्रमणिका मा / पूर्ण प्रतिबन्ध
गुगल SERPs देखि कार्यलाई तीब्रता हटाउने URL- स्रोत ठेगाना
तपाईं पुन indexation लागि प्रतीक्षा गर्न चाहन्न, यदि र साइट तपाईं जस्तै लुकाउन चाहन्छु, म सकेसम्म चाँडै सेवा http://services.google.com/urlconsole/controller प्रयोग गर्न सुझाव दिन्छौं। पूर्व robots.txt साइट सर्भर को मूल निर्देशिका मा राखिएको छ। यो उपयुक्त निर्देशन निर्धारित गर्नुपर्छ।
केही कारणले सूचक मूल निर्देशिका सम्पादन गर्न सक्नुहुन्न भने हुन, यो जसको लागि तपाईं खोज इन्जिन देखि लुकाउन चाहन्छु लक्ष्य संग फोल्डर मा पर्याप्त सिर्जना गर्नुहोस्। एक पटक तपाईं स्वतः हाइपरटेक्स्ट ठेगाना हटाउने सेवा गर्न यो र उल्लेख, Google बाहिर robots.txt मा एक दोष spelled फोल्डरहरू स्क्यान हुनेछ।
यो invisibility को अवधि 3 महिनाको लागि सेट गरिएको छ। यो अवधि पछि, मुद्दा अलग निर्देशिका, फेरि गुगल सर्भर द्वारा प्रशोधन गरिनेछ।
आंशिक स्क्यान गर्न एक साइट हटाउन एच ओउ
खोज बोट robots.txt सामग्रीहरू गर्दा पढिरहेको छ, कि केही निर्णय यसको सामग्रीको आधारमा गरिन्छ। तपाईँलाई anatom भनिन्छ सम्पूर्ण निर्देशिका देखाउन बाट निकाल्न चाहनुहुन्छ भन्न गरौं। यो यस्तो नियमहरू सल्लाह दिन्छन् पर्याप्त छ:
प्रयोगकर्ता-एजेन्ट: Googlebot
अस्वीकार: / anatom
वा, उदाहरणका लागि, तपाईं सूचकांक सबै छवि प्रकार .gif गर्न चाहन्छु। यो गर्न, निम्न सूची थप्न:
प्रयोगकर्ता-एजेन्ट: Googlebot
अस्वीकार: /*.gif$
यहाँ अर्को उदाहरण हो। सूचकांक प्रवेश प्रकार थप्दा तिनीहरूलाई, गतिशील रूप उत्पन्न पृष्ठहरूमा जानकारी पार्सिङ देखि मेटिने गरौं:
प्रयोगकर्ता-एजेन्ट: Googlebot
अस्वीकार: / *?
त्यो बारेमा, र खोज इन्जिन लागि नियम बाहिर spells। अर्को कुरा यो सिर्फ यो मेटा ट्याग प्रयोग गर्न धेरै सुविधाजनक छ भन्ने छ। र वेबमास्टरों अक्सर बस यस्तो खोज इन्जिन को सञ्चालन विनियमन मानक प्रयोग गर्नुहोस्। तर हामी भविष्यमा लेख यो छलफल गर्नेछौं।
Similar articles
Trending Now