വിദ്യാഭ്യാസം:, സെക്കണ്ടറി വിദ്യാഭ്യാസവും സ്കൂളും
അടുത്ത അയൽപക്ക രീതി: ഉദാഹരണത്തിന് ജോലി
അടുത്തുള്ള അയൽക്കാരന്റെ രീതി, വ്യത്യസ്ത വസ്തുക്കളുടെ സാമ്യം പരിശോധിക്കുന്നതിൽ അടിസ്ഥാനമാക്കിയുള്ള ലളിതമായ മെട്രിക് ക്ലാസിഫയർ ആണ്.
പഠന വസ്തുവിന്റെ വിഷയങ്ങൾ ഉൾപ്പെടുന്ന ക്ലാസിലേക്ക് വിശകലനം ചെയ്ത വസ്തുവിനെ പരാമർശിക്കുന്നു. അടുത്തുള്ള അയൽക്കാരന്റെ രീതി എന്താണെന്ന് നമുക്കു നോക്കാം. ഈ സങ്കീർണ്ണ പ്രശ്നം മനസിലാക്കാൻ നമുക്ക് ശ്രമിക്കാം, വ്യത്യസ്തമായ ടെക്നിക്കുകളുടെ ഉദാഹരണങ്ങൾ നൽകുക.
രീതിയുടെ സിദ്ധാന്തം
വർഗ്ഗീകരണത്തിന് ഉപയോഗിക്കുന്ന ഏറ്റവും സാധാരണ അൽഗൊരിതം ഏറ്റവും അടുത്തുള്ള സമീപന രീതിയാണ്. വർഗ്ഗീകരണത്തിന് വിധേയമായ ഒരു വസ്തു, y_i എന്ന ക്ലാസിക്കിൽ ഉൾപ്പെടുന്നതാണ്, അതിൽ x_i എന്ന പരിശീലന മാതൃകയുടെ ഏറ്റവും അടുത്ത വസ്തുവാണ്.
ഏറ്റവും അടുത്തുള്ള അയൽവാസികളുടെ പ്രവർത്തന രീതി
അടുത്തുള്ള അയൽക്കാരുടെ രീതി k വർഗീകരണത്തിന്റെ വിശ്വാസ്യത വർദ്ധിപ്പിക്കുന്നതിന് അനുവദിക്കുന്നു. വിശകലന വസ്തു, അയൽവാസികളുടെ പ്രധാന പിണ്ഡത്തിന്റെ അതേ വർഗ്ഗത്തിലാണു്, അതായതു്, വിശകലനം ചെയ്ത മാതൃകയുടെ x_i അടുത്തു്. രണ്ട് ക്ലാസുകളുമായി പ്രശ്നങ്ങൾ പരിഹരിക്കുമ്പോൾ, അയൽവാസികളുടെ എണ്ണം അനിയന്ത്രിതമായ അവസ്ഥയിൽ നിന്ന് വ്യത്യസ്ത വർഗങ്ങളുടേതായിരിക്കും.
ഭാരമുള്ള അയൽക്കാരുടെ സാങ്കേതികത
ക്ലാസുകളുടെ എണ്ണം മൂന്ന് ശതമാനത്തിൽ കുറയാത്തതും ഒറ്റയടിക്ക് ഉപയോഗിക്കാൻ കഴിയാത്തതുമാണ് ഏറ്റവും അടുത്തുള്ള അയൽവാസികളുടെ പോസ്റ്റ്ഗ്രേഴ്സ്ക്ൽ രീതി. എന്നാൽ ഇത്തരം കേസുകളിൽ വ്യക്തതയില്ല. അപ്പോൾ അയൽ അയൽക്കാരൻ ഭാരം w_i സ്വീകരിക്കുന്നു, അത് അയൽവാസികളുടെ റാങ്കിങ് കുറയുന്നു. അടുത്തുള്ള ഭിന്നതയിൽ പരമാവധി മൊത്തം ഭാരം ഉണ്ടാകും എന്നു സൂചിപ്പിക്കുന്ന ഒരു വർഗ്ഗത്തെ ഈ വസ്തു സൂചിപ്പിക്കുന്നു.
കോംപാക്ട്സിന്റെ സിദ്ധാന്തം
മുകളിൽ പറഞ്ഞ എല്ലാ രീതികളുടെയും ഹൃദയം കോംപാക്ട്സിന്റെ അനുമാനം ആണ്. അത് വസ്തുക്കളുടെ സാമ്യതയും ഒരു വർഗ്ഗത്തിൽ പെട്ടവയുമാണ്. ഈ സാഹചര്യത്തിൽ വ്യത്യസ്ത കാഴ്ചപ്പാടുകളുടെ തമ്മിലുള്ള അതിർ ഇങ്ങനെ ഒരു ലളിതമായ രൂപമാണ്. ക്ലാസുകൾ ഒബ്സർവേറ്ററിയിൽ മൊബൈൽ ഫോണുകൾ സൃഷ്ടിക്കുന്നു. ഗണിതശാസ്ത്ര വിശകലനത്തിൽ അത്തരം ഡൊമെയ്നുകീഴിൽ അടച്ച പരിധി നിശ്ചയിച്ചിട്ടുള്ള സംവിധാനങ്ങളാണ്. ഈ സിദ്ധാന്തത്തിന്റെ ദൈനംദിന ധാരണയുമായി ഈ സിദ്ധാന്തം ബന്ധപ്പെട്ടിട്ടില്ല.
അടിസ്ഥാനപരമായ ഫോർമുല
അടുത്തുള്ള അയൽവാസിയുടെ രീതി വിശദമായി വിശകലനം ചെയ്യാം. ഫോം "വസ്തു-പ്രതികരണ" ത്തിന്റെ പരിശീലന മാതൃക X ^ m = \ (x_1, y_1), \ dots, (x_m, y_m) \}; ഒരു കൂട്ടം വസ്തുക്കൾക്ക്, ഈ സംവിധാനത്തിന്റെ മൂല്യം വർദ്ധിക്കുന്നതോടെ, വസ്തുക്കളുടെ സമാനതകളില്ലാത്ത മാതൃകയായി, \ rho (x, x ') നൽകുമ്പോൾ, x, x' കുറയുന്ന വസ്തുക്കൾ തമ്മിലുള്ള സാമ്യം.
നിങ്ങൾ ഏതെങ്കിലും വസ്തുവിന് വേണ്ടി, ഞങ്ങൾ പരിശീലന മാതൃക വസ്തുക്കളാണ് x_i വികസിപ്പിക്കുന്നതിനുള്ള ദൂരം ഞങ്ങൾ നിർമ്മിക്കുന്നത്:
\ Ro (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}
എവിടെയാണ് x_ {i; U} യഥാർത്ഥ വസ്തുവിന്റെ i അയൽ അയൽക്കാരൻ ആയ പരിശീലന മാതൃക വസ്തുവിനെ വിവരിക്കുന്നു. I അയൽ അയൽവോടുള്ള പ്രതികരണത്തിനായുള്ള ഈ വിജ്ഞാപനം ഞങ്ങൾ ഉപയോഗിക്കുന്നു: y_ {i; U} ആണ്. തത്ഫലമായി, നമുക്ക് സ്വതസിദ്ധമായ ഒരു വസ്തുവിന്റെ മാതൃക അതിന്റെ നമ്പറുകളുടെ എണ്ണത്തിൽ മാറ്റം വരുത്തുന്നു.
അയൽവാസികളുടെ എണ്ണം നിർണ്ണയിക്കുക k
K = 1 ൽ ഏറ്റവും അടുത്തുള്ള അയൽവാസിയുടെ രീതി എമിഷൻ വസ്തുക്കളിൽ മാത്രമല്ല, സമീപത്തുള്ള മറ്റ് ക്ലാസുകളിലും ഒരു തെറ്റായ വർഗ്ഗീകരണം നടത്താൻ കഴിവുള്ളതാണ്.
നമ്മൾ k = m നെ എടുത്താൽ, അൽഗോരിതം ഒരു സ്ഥിരതയുള്ള മൂല്യത്തിലേക്ക് പരമാവധി സ്ഥിരതയോടെ കുറയുകയും ഡീജനറേറ്റ് ചെയ്യും. അതുകൊണ്ടാണ് കടുത്ത സൂചകങ്ങൾ അനുവദിക്കാത്തത് വിശ്വാസ്യതയ്ക്ക് അത്യാവശ്യമാണ്.
പ്രയോഗത്തിൽ സ്ലൈഡിംഗ് നിയന്ത്രണത്തിനുള്ള മാനദണ്ഡം ഒപ്റ്റിമൽ ഇൻഡിക്കേറ്റർ ആയി ഉപയോഗിക്കപ്പെടുന്നു k.
ഉദ്വമനം നിർത്തലാക്കൽ
പരിശീലനത്തിന്റെ ഒബ്ജക്റ്റുകൾ മിക്കവാറും അസമത്വമാണ്, എന്നാൽ അവയിൽ ക്ലാസുകളുടെ സ്വഭാവഗുണങ്ങൾ ഉള്ളതും മാനദണ്ഡങ്ങൾ എന്ന് വിളിക്കപ്പെടുന്നവയുമാണ് അവ. അനുയോജ്യമായ സാമ്പിളിലെ വിഷയം പരസ്പരബന്ധം കൊണ്ട്, ഒരു വിഭാഗത്തിൽ പെട്ട ആൾക്കുള്ള സാധ്യത വളരെ ഉയർന്നതാണ്.
ഏറ്റവും അടുത്ത അയൽക്കാരന്റെ രീതി എത്രത്തോളം ഫലപ്രദമാണ്? വസ്തുക്കളുടെ പെരിഫറൽ, നോൺഫിൻറേറ്റീവ് വിഭാഗങ്ങൾ അടിസ്ഥാനമാക്കിയാണ് ഒരു ഉദാഹരണം. വസ്തുവിന്റെ സാന്ദ്രമായ പരിസ്ഥിതി പരിഗണിച്ച് ഈ ക്ലാസിലെ മറ്റ് പ്രതിനിധികളായി കണക്കാക്കപ്പെടുന്നു. നിങ്ങൾ അവ സാമ്പിളിൽ നിന്ന് നീക്കംചെയ്യുകയാണെങ്കിൽ, വർഗ്ഗീകരണത്തിന്റെ ഗുണമേന്മയെ ബാധിക്കില്ല.
അത്തരമൊരു സാമ്പിളിനെ സമീപിക്കാൻ മറ്റൊരു പ്രത്യേക തരം ശബ്ദം ഉണ്ടാകുന്നു. നീക്കംചെയ്യൽ അടിസ്ഥാനപരമായി നടത്തിയ വർഗ്ഗീകരണത്തിന്റെ ഗുണനിലവാരത്തിൽ ഒരു നല്ല പ്രഭാവം ഉണ്ട്.
നോൺ-ഇൻഫോർമൻഷ്യൽ, നോയിസ് ഒബ്ജക്റ്റ് സാമ്പിളിൽ നിന്ന് ഒഴിവാക്കിയാൽ, ഒരേ സമയം പല നല്ല ഫലങ്ങൾ പ്രതീക്ഷിക്കാവുന്നതാണ്.
ഏറ്റവും അടുത്തുള്ള അയൽക്കാരന്റെ രീതിയിലൂടെ എല്ലാ ഇടവേളകളിലും , വർഗ്ഗീകരണത്തിന്റെ നിലവാരം മെച്ചപ്പെടുത്താൻ, ശേഖരിച്ച ഡാറ്റയുടെ അളവ് കുറയ്ക്കാൻ, ക്ലാസ്സിഫിക്കേഷന്റെ സമയം കുറയ്ക്കാൻ, അത് ഏറ്റവും അടുത്തുള്ള മാനദണ്ഡങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിന് ചെലവഴിക്കുന്നു.
അധിക വലിയ സാമ്പിളുകളുടെ ഉപയോഗം
പരിശീലന വസ്തുക്കളുടെ യഥാർത്ഥ സംഭരണത്തെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് അടുത്തിടെ അയൽ രീതി. വലിയ സാമ്പിളുകൾ സൃഷ്ടിക്കുന്നതിന് സാങ്കേതിക പ്രശ്നങ്ങൾ ഉപയോഗിക്കുക. വളരെ പ്രധാനപ്പെട്ട വിവരങ്ങൾ ശേഖരിക്കുന്നതിന് മാത്രമല്ല, ഏറ്റവും അടുത്ത കെ ലെ അയൽപക്കങ്ങളിൽ ഒരു ഏകപക്ഷീയ വസ്തു കണ്ടെത്തുന്നതിന് ചുരുങ്ങിയ സമയത്തിനുള്ളിൽ മാത്രമേ ഈ ടാസ്ക് പ്രവർത്തിക്കുകയുള്ളൂ.
ജോലി നേരിടുന്നതിന് രണ്ട് രീതികൾ ഉപയോഗിക്കുന്നു:
- ഇൻഫോർമേഷൻ അല്ലാത്ത വസ്തുക്കളെ വിന്യസിച്ചുകൊണ്ടാണ് സാമ്പിൾ പരിശോധിക്കുന്നത്.
- ഏറ്റവും അടുത്തുള്ള അയൽവാസികളുടെ തൽക്ഷണ തിരച്ചിൽ പ്രത്യേക ഫലപ്രദമായ ഘടനകളും ഡാറ്റാ ഇൻഡക്സുകളും പ്രയോഗിക്കുക.
രീതികൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള നിയമങ്ങൾ
വർഗ്ഗീകരണം മുകളിൽ പരിഗണിച്ചിരുന്നു. 'Rho (x, x') എന്ന പ്രക്രീയ മുൻപ് അറിയപ്പെടുന്ന പ്രായോഗിക പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ അടുത്തുള്ള അയൽക്കാരന്റെ രീതി ഉപയോഗിക്കുന്നു. വസ്തുക്കളെ വിവരിക്കുന്ന സമയത്ത്, ന്യൂക്ലിയർ വെക്റ്ററുകൾ യൂക്ലിഡിയൻ മെട്രിക് ഉപയോഗിക്കുന്നു. അത്തരം ഒരു തിരഞ്ഞെടുപ്പിന് പ്രത്യേക ഉത്തരവാദിത്തമില്ല, എന്നാൽ ഒരൊറ്റ ചിഹ്നത്തിലെ എല്ലാ അടയാളങ്ങളുടെയും അളവുകോൽ അത് സൂചിപ്പിക്കുന്നു. ഈ ഘടകം കണക്കിലെടുക്കുന്നില്ലെങ്കിൽ, വലിയ അളവ് മൂല്യമുള്ള അടയാളം മെട്രിക് ആധിപത്യത്തിലായിരിക്കും.
നിരവധി സവിശേഷതകളുള്ള സാന്നിദ്ധ്യത്തിൽ, പ്രത്യേക സവിശേഷതകളിൽ വ്യതിയാനങ്ങൾക്കുള്ള ദൂരം കണക്കുകൂട്ടുന്നത് ഗുരുതരമായ ഒരു മാനസിക പ്രശ്നമാണ്.
ഉയർന്ന അളവിലെ ഒരു സ്ഥലത്ത് എല്ലാ വസ്തുക്കളും പരസ്പരം അകലെ ആയിരിക്കും. അന്തിമ വിശകലനത്തിൽ, പഠനത്തിനായുള്ള വസ്തുവിന് ഏറ്റവും അടുത്ത അയൽവാസികളുടെ ഒരു ഏകാധിപത്യ സാമ്പിൾ ഏകപക്ഷീയമായിരിക്കും. ഈ പ്രശ്നം ഉന്മൂലനം ചെയ്യാനായി, ഒരു ചെറിയ എണ്ണം വിവരശേഖരങ്ങൾ തിരഞ്ഞെടുത്തിരിക്കുന്നു. കണക്കുകൂട്ടുന്ന കണക്കുകൂട്ടുന്നതിനുള്ള അൽഗൊരിതം വ്യത്യസ്ത സ്വഭാവസവിശേഷതകളുടെ അടിസ്ഥാനത്തിലാണ് നിർമിച്ചിരിക്കുന്നത്, ഓരോ വ്യക്തിക്കും അവരവരുടെ പ്രോക്സിമിറ്റി ഫംഗ്ഷൻ ഉണ്ടാക്കുന്നു.
ഉപസംഹാരം
ഗണിതശാസ്ത്രപരമായ കണക്കുകൂട്ടലുകൾ പലപ്പോഴും അവയുടെ തനതായ സവിശേഷതകളും ഗുണങ്ങളും ദോഷങ്ങളുമുണ്ടാക്കുന്ന വിവിധതരം സാങ്കേതിക വിദ്യകളുടെ ഉപയോഗത്തിൽ ഉൾപ്പെടുന്നു. അടുത്തുള്ള അയൽവാസികളുടെ കണക്കാക്കപ്പെടുന്ന രീതി ഗണിതശാസ്ത്ര വസ്തുക്കളുടെ സ്വഭാവ സവിശേഷതയുമായി ബന്ധപ്പെട്ട ഗുരുതരമായ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിന് അനുവദിക്കുന്നു. വിശകലന രീതിയെ അടിസ്ഥാനമാക്കിയുള്ള പരീക്ഷണ ആശയങ്ങൾ ഇപ്പോൾ കൃത്രിമ ബുദ്ധിജീവ ഉപകരണങ്ങളിൽ സജീവമായി ഉപയോഗിക്കുന്നു.
വിദഗ്ധ സംവിധാനങ്ങളിൽ, വസ്തുക്കളെ തരംതിരിക്കുന്നതിന് മാത്രമല്ല, ചോദ്യം ചെയ്യപ്പെട്ട വർഗ്ഗീകരണത്തിന്റെ ഒരു ഉപയോക്താവിനെക്കുറിച്ചുള്ള വിശദീകരണവും കാണിക്കേണ്ടത് ആവശ്യമാണ്. ഇത്തരത്തിലുള്ള ഒരു പ്രതിഭാസത്തിന് വിശദീകരണം ഒരു പ്രത്യേക വർഗത്തിനായുള്ള വസ്തുവിന്റെ ബന്ധത്തിനാണെന്നും അതിന്റെ ഉപയോഗത്തെ അടിസ്ഥാനമാക്കിയുള്ള സ്ഥാനത്താണെന്നും വിശദീകരിക്കുന്നു. നിയമ വ്യവസായം, ഭൌമശാസ്ത്രജ്ഞന്മാർ, ഡോക്ടർമാർ എന്നിവരുടെ വിദഗ്ധർ ഈ "മുൻകൂർ" യുക്തിയെ അംഗീകരിക്കുന്നു.
വിശകലന വിധേയമായ രീതിക്കനുസൃതമായി സാധ്യമായ, ഫലപ്രദമായ, ആവശ്യമുള്ള ഫലം ലഭ്യമാക്കുന്നതിന്, ഏറ്റവും കുറഞ്ഞ സൂചകമായി k ആവശ്യമാണ്, മാത്രമല്ല വിശകലന വസ്തുക്കളിൽ നിന്ന് ഉദ്വമനം അനുവദിക്കരുതെന്നതും. അതുകൊണ്ടാണ് മാനദണ്ഡങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള രീതിയും മെട്രിക് ഒപ്റ്റിമൈസേഷനും നടത്തപ്പെടുന്നു.
Similar articles
Trending Now