አሰላለፍ, ሁለተኛ ደረጃ ትምህርት እና ትምህርት ቤቶች
ቅርብ ጎረቤት ስልት: ሥራ ምሳሌ
ወደሚቀርበው ጎረቤት ስልት የተለያዩ ነገሮች መካከል ያለውን ተመሳሳይነት ያለውን ግምገማ ላይ የተመሠረተ ነው ቀላሉ ሜትሪክ ክላሲፋየር ነው.
መተንተን ነገር እነርሱ ስልጠና ናሙና ተገዢዎች የየትኛውም ወደ ክፍል ንብረት ነው. እስቲ ቅርብ ጎረቤት ነው ለማወቅ እንመልከት. ይህን ውስብስብ ጉዳይ, በተለያዩ ዘዴዎች መካከል ምሳሌዎች ለመረዳት ሞክር.
መላምት ስልት
ቅርብ ጎረቤት ስልት ምደባ ጥቅም ላይ በጣም የተለመደ ስልተ ሆኖ ሊቆጠር ይችላል. ምደባ እያገኘ ነገር x_i ናሙና መማር ያለውን የቅርብ ነገር ለማድረግ, ወደ ክፍል y_i ንብረት ነው.
ዘዴዎች ቅርብ ጎረቤቶች መካከል Specificity
ምደባ ትክክለኛነት ማሻሻል ይችላሉ ቅርብ ጎረቤት ዘዴ k. መተንተን ነገር ይህ መተንተን ናሙና x_i መገለጫዎች ወደ ያም ማለት, የቅርብ ኬ, በውስጡ ጎረቤቶቻቸው በጅምላ ተመሳሳይ ክፍል ላይ ነው. ጎረቤቶች ተመሳሳይ ቁጥር የተለያዩ ክፍሎች አባል ከሆነ ጎረቤቶች ቁጥር ሁለት ክፍሎች ጋር ችግሮችን በመፍታት ረገድ, አሻሚነት አንድ ሁኔታ ለማስቀረት ጎዶሎ ይሆናል.
ታግዷል ጎረቤቶቻቸው ቴክኒክ
ክፍሎች ቢያንስ ሦስት ቁጥር, እና አንድ ጎዶሎ ቁጥር መጠቀም አይችልም ጊዜ ጥቅም ላይ ነው ቅርብ tsvector ጎረቤቶች Postgresql-የተተነተነ ዘዴ. ነገር ግን አሻሚነት እንኳ በእነዚህ ሁኔታዎች ውስጥ ይነሳል. ከዚያም, በ i-ኛ ጎረቤት ጎረቤት ማዕረግ እኔ ጋር ይቀንሳል ይህም w_i ክብደት, ያገኛል. ይህ የቅርብ ጎረቤቶች መካከል ከፍተኛ ጠቅላላ ክብደት ይኖራቸዋል ይህም ነገር መካከል ያለውን ክፍል ያመለክታል.
compactness ያለው መላ ምት
ከላይ ዘዴዎች በሙሉ ልብ ላይ compactness ያለውን መላ ምት ነው. ይህም ነገሮች መካከል ያለውን ተመሳሳይነት መስፈሪያ እና ተመሳሳይ ክፍል አባል መካከል ግንኙነት ይጠቁማል. በዚህ ሁኔታ ውስጥ, የተለያዩ ዓይነቶች መካከል ያለውን ድንበር ቀላል መልክ ነው, እና ቦታ የታመቁ የሞባይል አካባቢ የነገሮች ክፍሎችን መፍጠር. እንዲህ ያሉ ቦታዎች በታች የሂሳብ ትንታኔ ውስጥ አንድ የተዘጋ ብተናው ስብስብ ማለት ይወሰዳሉ. ይህ መላ ምት ቃል የዕለት ተዕለት አመለካከት ጋር የተያያዘ አይደለም.
መሠረታዊ ቀመር
እኛን ይበልጥ ቅርብ ጎረቤት እንመርምር. ከሆነ የታቀደው ስልጠና ናሙና አይነት "የነገር-መልስ» x ^ ሜትር = \ {(x_1, y_1), \ ነጥቦች, (x_m, y_m) \}; የነገሮች አንድ የብዙ ርቀት ተግባር \ CHI-(x, x ') ለመግለጽ ከሆነ ተግባር እሴትን በመጨመር የነገሮች በቂ ሞዴል ተመሳሳይነት መልክ የተወከለው ነው, x, x ነገሮች መካከል ያለውን ተመሳሳይነት ይቀንሳል ».
ማንኛውም ነገር ለማግኘት U አንድ ስልጠና ናሙና u ወደ ርቀት እየጨመረ ጋር x_i ነገሮችን ክርስቲያኔን እሠራለሁ:
\ CHI-(ዩ, x_ {1; u}) \ leq \ CHI-(ዩ, x_ {2; u}) \ leq \ cdots \ leq \ CHI-(ዩ, x_ {ሜ; u}),
የት x_ {i; u} u i-ኛ ጎረቤት ምንጭ ዕቃ የሆነውን ነገር የመማር ናሙና, ባሕርይ. እንዲህ ምልክትን እና አጠቃቀም i-ኛ ጎረቤት ምላሽ መስጠት: y_ {i; u}. በዚህም ምክንያት, እኛ ማንኛውንም ነገር u የራሱን ናሙና renumbering የሚያበሳጭህን እናገኛለን.
ጎረቤቶች ቁጥር ተ መወሰኛ
ቅርብ ጎረቤት ስልት ጊዜ K = 1 ነገሮች-ልቀት ላይ, ግን ደግሞ ቅርብ የሆኑ ሌሎች ክፍሎች ለማግኘት ብቻ ሳይሆን, አንድ የተሳሳተ ምደባ መስጠት የሚችል ነው.
እኛም = ሜትር k መውሰድ ከሆነ, ስልተ እንደ የተረጋጋ ይሆናል እና በቋሚ ዋጋ ዘፋኝነትና ይሆናል. አስተማማኝነት ከፍተኛ የይዘቶቹ k ማስወገድ አስፈላጊ የሆነው ለዚህ ነው.
በተግባር, ከፍተኛውን ኢንዴክስ K ጥቅም ላይ እንደ መስፈርት ቁጥጥር ማንሸራተት.
የማጣሪያ ልቀት
ጥናት ነገሮች በአብዛኛው እኩል ናቸው, ነገር ግን በመካከላቸው ክፍል ባህርያት ያላቸው እና ደረጃዎች ተብለው ተጠቅሰዋል ሰዎች አሉ. በዚህ ክፍል ንብረት በከፍተኛ ይሁንታ ያለውን ተስማሚ ሞዴል ወደ ርዕሰ የቅርበት ላይ.
በአቅራቢያዎ ጎረቤቶቿ እንዴት rezultativen ዘዴ? አንድ ምሳሌ የነገሮች ዳርቻ የገፋና ያልሆኑ መረጃ ምድቦች መሠረት ላይ ሊታይ ይችላል. በዚህ ክፍል ውስጥ ያለውን ነገር በሌሎች ተወካዮች ጥቅጥቅ ያለ ሁኔታ ይታሰባል. መቼ ነው የማይፈቅድ ጥራትን ወሳደድ ያለውን ምደባ ጀምሮ እነሱን ማስወገድ.
ናሙናዎች አንድ ክፍል "መሬት ላይ" ናቸው ይችላል ጫጫታ መሮጥ መካከል የተወሰነ ቁጥር ወደ ያግኙ. የ ምደባ ጥራት ላይ በከፍተኛ አዎንታዊ ተጽዕኖ ማስወገድ.
ናሙና የ uninformative እና ለማስወገድ ጫጫታ ነገሮች የተወሰደ ከሆነ, በተመሳሳይ ጊዜ ጥቂት አዎንታዊ ውጤቶች ላይ መቁጠር እንችላለን.
የመጀመሪያው ልጅ interpolation ስልት በአቅራቢያዎ ጎረቤት ምደባ, ጥራት ለማሻሻል የተከማቸውን ውሂብ መጠን መቀነስ, በሚቀጥለው መሥፈርቶች ምርጫ ላይ የጠፋው ነው ምደባ, ጊዜ ለመቀነስ ያስችላል.
እጅግ-ትላልቅ ናሙናዎች መጠቀም
ቅርብ ጎረቤት ዘዴ የመማር የነገሮች እውነተኛ ማከማቻ ላይ የተመሠረተ ነው. አንድ ቴክኒካዊ ችግር በመጠቀም በጣም መጠነ ሰፊ ናሙናዎችን ለመፍጠር. ዓላማውም ብቻ መረጃ ጉልህ መጠን ለማዳን አይደለም: ነገር ግን ደግሞ የጊዜ አነስተኛውን መጠን ውስጥ u የቅርብ ጎረቤቶች መካከል k ማንኛውም ነገር ማግኘት ጊዜ እንዲኖራቸው.
ተግባር ለመቋቋም, ሁለት ዘዴዎች ላይ ይውላሉ:
- ፈሳሽ ያልሆነ ውሂብ ነገሮችን በኩል የሚነቀለውን ናሙና;
- ውጤታማ አጠቃቀም ልዩ ውሂብ መዋቅር እና በአቅራቢያዎ ጎረቤቶቿ የፈጣን ፍለጋ ኮዶችን.
ምርጫ ዘዴዎች ደንቦች
ከላይ ያለው ምደባ ተደርጎ ነበር. ቅርብ ባልንጀራችንን ስልት በቅድሚያ ርቀት ተግባር \ CHI-የታወቀ ነው ይህም ተግባራዊ ችግሮች መፍታት ውስጥ ጥቅም ላይ ውሏል (x, x '). የሚገልፅ ነገሮች ውስጥ የቁጥር የሚያዛምቱባቸው አንድ Euclidean መለኪያ ይጠቀማሉ. እንዲህ ዓይነቱ ምርጫ ምንም ልዩ ለማጽደቅ የለውም, ነገር ግን ሁሉም ምልክቶች መካከል መለካት ይጨምራል "ተመሳሳይ ደረጃ ላይ." በዚህ ምክንያት መለያ ደንታቸው አይደለም ከሆነ, ከዚያም ሜትሪክ ባህሪ ከፍተኛው ቁጥራዊ እሴቶች ያለው ጎልቶ ይሆናል.
የተወሰኑ ምልክቶች ላይ ልዩነቶች ድምር እንደ ርቀት በማስላት ባህሪያት መካከል ከፍተኛ መጠን, ካለ ከባድ ችግር ልኬት ይታያሉ.
እርስ በርሳቸው ፈቃድ ሁሉ ነገሮች ጀምሮ እስከ ሩቅ ከፍተኛ ልኬት ቦታ ላይ. በመጨረሻ, ማንኛውም ናሙና ነገር ቀጥሎ K ጎረቤቶቻችን እየተጠና ይሆናል. መረጃ ባህሪያት አነስተኛ ቁጥር የተመረጡ ይህን ችግር ለማስወገድ. ግምቶች ለማስላት ለ ስልተ ምልክቶች የተለያዩ ስብስቦች መሠረት ላይ ለመገንባት, እና እያንዳንዱ ግለሰብ ያላቸውን ቅርበት ተግባር ለመገንባት.
መደምደሚያ
የሒሳብ ስሌቶችን አብዛኛውን ጊዜ የራሳቸውን ልዩ ባህሪያት, ጥቅሞች እና ጉዳቶች ያላቸውን ዘዴዎች የተለያዩ መጠቀምን ያካትታል. የታዩ ቅርብ ጎረቤት ዘዴ ምክንያት የሂሳብ ነገሮች ባህርያት ጋር, በጣም ከባድ ችግር መፍታት ይችላሉ. በ መተንተን ስልት ላይ የተመሠረተ የሙከራ ጽንሰ, በንቃት አርቴፊሻል ኢንተለጀንስ ላይ ጥቅም ላይ እየዋለ ነው.
ኤክስፐርቱ ሥርዓቶች ላይ ብቻ ነገሮችን ለመከፋፈል, ነገር ግን ደግሞ ተጠቃሚው በጥያቄ ውስጥ ያለውን ምደባ ማብራሪያ ለማሳየት አይደለም አስፈላጊ ነው. በዚህ ዘዴ ላይ, ይህ ክስተት ማብራሪያ ወደ አንድ የተወሰነ ክፍል ዓላማ እንዲሁም ጥቅም ላይ ናሙና የፕሮክሲውን አድራሻ ዘመድ ጋር በተያያዘ የተገለጹ ናቸው. የህግ ኢንዱስትሪ ስፔሻሊስቶች, የሥነ, ሐኪሞች, በንቃት ያላቸውን ምርምር ውስጥ ይጠቀሙበት ይህ "ሊያገለግል" አመክንዮ ይወስዳል.
ቅደም ዘዴ ደግሞ መተንተን ነገሮች መካከል ልቀት ለማስቀረት ሳሉ የተፈለገውን ውጤት በመስጠት, ቀልጣፋ, በጣም አስተማማኝ, አንተም, ቢያንስ ምስል ተ መውሰድ አለበት ነበር መተንተን ይሆናል. ይህ ለምን ደረጃዎች አጠቃቀም እና የምርጫ ስልት, እንዲሁም ማመቻቸት ልኬቶች.
Similar articles
Trending Now