गठन, माध्यमिक शिक्षा र विद्यालय
निकटतम छिमेकी विधि: काम उदाहरण
निकटतम छिमेकी विधि फरक वस्तुहरु को समानता को मूल्यांकन मा आधारित छ जो सजिलो मेट्रिक वर्गीकरण छ।
विश्लेषण वस्तु तिनीहरूले प्रशिक्षण नमूना प्रजा हौं जो कक्षा पर्छ। हामीलाई जो निकटतम छिमेकी को हो पत्ता गरौं। यस जटिल कुरा, विभिन्न तरिकाहरू उदाहरण बुझ्न प्रयास गर्नुहोस्।
परिकल्पना विधि
निकटतम छिमेकी विधि रूपमा वर्गीकरण लागि प्रयोग भन्दा साधारण अल्गोरिदम छलफल गर्न सकिन्छ। वर्गीकरण भइरहेको वस्तु जो घनिष्ठ वस्तु x_i नमूना सिक्ने गर्न वर्ग y_i पर्छ।
विधिहरू छिमेकी निकटतम को विशिष्टता
निकटतम छिमेकी विधि वर्गीकरण को शुद्धता सुधार गर्न सक्छन् k। विश्लेषण वस्तु, यसको छिमेकी को थोक जस्तै वर्ग पर्छ भनेर गरिएको छ, यो विश्लेषण नमूना x_i को वस्तुहरु नजिक k। छिमेकी को नै नम्बर फरक कक्षाहरू हौं भने छिमेकी संख्या दुई वर्गहरू समस्या सुलझाने मा, अस्पष्टता को अवस्थामा जोगिन अनौठो हुनेछ।
निलम्बित छिमेकी को प्रविधी
PostgreSQL-विश्लेषण विधि कक्षाहरू कम्तीमा तीन संख्या, र तपाईं एउटा अनौठो नम्बर प्रयोग गर्न सक्नुहुन्छ जब प्रयोग गरिन्छ tsvector निकटतम छिमेकी। तर अस्पष्टता पनि यी अवस्थामा उत्पन्न हुन्छ। त्यसपछि, म-औं छिमेकीलाई छिमेकीको दर्जा म संग घट्छ जो w_i वजन, हुन्छ। यसलाई बन्द छिमेकी बीच अधिकतम कुल वजन हुनेछ जो वस्तुको वर्ग, बुझाउँछ।
compactness को परिकल्पना
माथिको विधिहरू सबै को दिल मा compactness को परिकल्पना छ। यसलाई वस्तुहरु को समानता को उपाय र एउटै वर्ग आफ्नो स्वामित्वको बीचको जडान सुझाव। यो स्थितिमा, विभिन्न प्रकारका बीच सीमा एक सरल रुप हो, र ठाउँ संकुचित मोबाइल क्षेत्रमा वस्तुहरु को कक्षाहरू सिर्जना गर्नुहोस्। यस्तो क्षेत्रमा अन्तर्गत गणितीय विश्लेषण मा एक बन्द यसद्वारासीमाबद्ध सेट मतलब लगियो। यो परिकल्पना शब्द को दैनिक धारणा सम्बन्धित छैन।
आधारभूत सूत्र
हामीलाई थप निकटतम छिमेकी जाँचौं। यदि प्रस्तावित प्रशिक्षण नमूना प्रकार "वस्तु प्रतिक्रिया» एक्स ^ पु = \ {(x_1, y_1), \ डट्स, (x_m, y_m) \}; वस्तुहरु को एक अधिकता दूरी समारोह \ रो (एक्स, एक्स ') परिभाषित गर्न यदि समारोह को मूल्य वृद्धि गरी, वस्तुहरू को एक पर्याप्त मोडेल समानता को रूप मा प्रतिनिधित्व छ जो वस्तुहरु बीच एक्स, एक्स समानता घट्छ'।
कुनै पनि वस्तु को लागि, यू निर्माण हुनेछ एक प्रशिक्षण नमूना यू दूरी बढ्दै संग x_i ओब्जेक्ट:
\ Rho (यू, x_ {1; यू}) \ leq \ रो (यू, x_ {2; यू}) \ leq \ cdots \ leq \ रो (यू, x_ {पु; यू}),
जहाँ x_ {म; यू} हो जो म-औं छिमेकीलाई स्रोत वस्तु यू वस्तु सिक्ने नमूना, characterizes। यस्तो संकेतन र प्रयोग म-औं छिमेकीलाई जवाफ: y_ {म; यू}। फलस्वरूप, हामी कुनै पनि वस्तु यू आफ्नै नमूना renumbering provokes कि पाउन।
छिमेकी को संख्या K को संकल्प
निकटतम छिमेकी विधि गर्दा K = 1 वस्तुहरु-उत्सर्जन मा, तर पनि नजिकै छन् भन्ने अन्य कक्षाहरू लागि मात्र होइन, एक गलत वर्गीकरण दिने सक्षम छ।
हामी = पु k लिन भने, अल्गोरिदम रूपमा स्थिर हुनेछ र स्थिर मूल्य मा degenerate हुनेछ। किन विश्वसनीयता चरम सूचकांक k बच्न महत्त्वपूर्ण छ भन्ने छ।
व्यवहार मा प्रयोग रूपमा इष्टतम सूचकांक K मापदण्ड नियन्त्रण स्लाइड।
स्क्रीनिंग उत्सर्जन
अध्ययन को वस्तुहरु हदसम्म unequal छन्, तर तिनीहरूलाई बीच एक वर्ग को विशेषताहरु र स्तर रूपमा उल्लेख भएका ती छन्। यो वर्ग स्वामित्वको यसको उच्च सम्भावना को आदर्श मोडेल गर्न विषय को निकटता मा।
कसरी rezultativen निकटतम छिमेकी को विधि? एउटा उदाहरण वस्तुहरु को परिधीय र गैर-सूचनात्मक विभाग को आधार मा देख्न सकिन्छ। यो वर्ग को वस्तु अन्य प्रतिनिधिहरूलाई बाक्लो वातावरण कल्पित छ। जब तपाईं गुणस्तर ग्रस्त छैन नमूना को वर्गीकरण हटाउनुहोस्।
नमूनाहरू सक्छन् हल्ला bursts एक वर्ग को "भुइँमा" छन् कि एक निश्चित संख्या मा प्राप्त गर्नुहोस्। को वर्गीकरण गुणस्तर मा एकदम सकारात्मक प्रभाव हटाउने।
नमूना को uninformative र निर्मूल हल्ला वस्तुहरु बाट लिएको छ भने, तपाईं एकै समयमा केही सकारात्मक परिणाम मा गणना गर्न सक्नुहुन्छ।
पहिलो को अन्तर्वेशन विधि निकटतम छिमेकी वर्गीकरण गुणस्तर सुधार गर्न, भण्डारण डाटा को मात्रा कम, अर्को स्तर को विकल्प मा खर्च छ जो वर्गीकरण, समय कम गर्न अनुमति दिन्छ।
अति-ठूलो नमूनाहरू प्रयोग
निकटतम छिमेकी विधि सिक्ने वस्तुहरु को असली भण्डारण आधारित छ। प्राविधिक समस्या प्रयोग धेरै ठूलो मात्रा नमूनाहरू सिर्जना गर्न। उद्देश्य बस जानकारी को एक महत्वपूर्ण राशि सुरक्षित छैन, तर समय को न्यूनतम रकम पनि यू को घनिष्ठ छिमेकी बीच k कुनै पनि वस्तु फेला पार्न समय छ।
यो कार्य सामना गर्न, दुई विधिहरू प्रयोग गरिन्छ:
- एक छुट्टी गैर-डाटा वस्तुहरु मार्फत thinned नमूना;
- प्रभावकारी उपयोग विशेष डाटा संरचना र निकटतम छिमेकी को तत्काल खोज को लागि कोड।
चयन विधि को नियम
माथिको वर्गीकरण छलफल भएको थियो। निकटतम छिमेकी विधि अग्रिम ज्ञात छ जो दूरी समारोह \ रो व्यावहारिक समस्या, हल मा प्रयोग गरिएको छ (एक्स, एक्स ')। वर्णन वस्तुहरु मा संख्यात्मक vectors को एक Euclidean मेट्रिक प्रयोग गर्नुहोस्। यो विकल्प कुनै विशेष औचित्य छ, तर सबै संकेत को मापन समावेश "एउटै मात्रा मा।" यो कारक खातामा लिएको छैन भने, त्यसपछि मेट्रिक सुविधा उच्चतम संख्यात्मक मान भइरहेको प्रबल होना हुनेछ।
त्यहाँ एक पर्याप्त विशिष्ट लक्षण मा विचलन योगफल रूपमा दूरी गणना, सुविधाहरू रकम छ भने गम्भीर समस्या आयाम देखिन्छन्।
उच्च आयोमी ठाउँ एक अर्को हुनेछ सबै वस्तुहरु देखि टाढा मा। अन्ततः, कुनै पनि नमूना वस्तु अर्को K छिमेकी अध्ययन भइरहेको हुनेछ। यो समस्या हटाउन सूचनात्मक सुविधाहरू एउटा सानो नम्बर चयन गरियो। अनुमान गणना लागि अल्गोरिदम संकेत विभिन्न सेट आधारमा निर्माण गर्न, र प्रत्येक व्यक्ति को लागि आफ्नो निकटता समारोह निर्माण।
निष्कर्षमा
गणितीय गणना अक्सर आफ्नै विशिष्ट विशेषताहरु, लाभ र बेफाइदा छन् कि प्रविधी को एक किसिम को उपयोग शामिल छ। हेरिएको निकटतम छिमेकी विधि कारण गणितीय वस्तुहरु को विशेषताहरु गर्न, एकदम गम्भीर समस्या समाधान गर्न सकिन्छ। को विश्लेषण विधि आधारित प्रयोगात्मक अवधारणा, सक्रिय कृत्रिम बुद्धि प्रयोग भइरहेको छ।
विशेषज्ञ प्रणाली मा यो सिर्फ वस्तुहरु वर्गीकरण गर्न, तर पनि प्रयोगकर्ता प्रश्न मा वर्गीकरण को एक विवरण देखाउन आवश्यक छ। यो विधि मा, यो घटना एक विवरण एक विशेष वर्ग को वस्तु साथै प्रयोग नमूना आफ्नो स्थान सापेक्ष को सम्बन्ध मा व्यक्त गर्दै हुनुहुन्छ। कानुनी उद्योग विशेषज्ञहरु, geologists, चिकित्सकहरु, यो "नमुना" तर्क सक्रिय आफ्नो अनुसन्धान मा यसको प्रयोग लिन्छन्।
क्रममा विधि सबैभन्दा, विश्वसनीय कुशल, इच्छित परिणाम दिने, तपाईं एक न्यूनतम आंकडा K पनि विश्लेषण वस्तुहरु बीच उत्सर्जन जोगिन गर्दा लिनुपर्छ थियो विश्लेषण गर्न। छ किन स्तर को प्रयोग र चयन विधि, साथै अनुकूलन मापन।
Similar articles
Trending Now