Kosinusna sličnost se općenito koristi kao metrika za mjerenje udaljenosti kada veličina vektora nije bitna. Ovo se dešava na primjer kada radite sa tekstualnim podacima predstavljenim brojem riječi.
Kada trebam koristiti kosinusnu sličnost?
Kosinusna sličnost mjeri sličnost između dva vektora unutarnjeg prostora proizvoda. Mjeri se kosinusom ugla između dva vektora i određuje da li su dva vektora usmjerena u približno istom smjeru. Često se koristi za mjerenje sličnosti dokumenata u analizi teksta.
Zašto koristiti kosinusnu sličnost umjesto Euklidske udaljenosti?
Kosinusna sličnost je korisna jer čak i ako su dva slična dokumenta udaljena na euklidskoj udaljenosti zbog veličine (kao, riječ 'cvrčak' se pojavila 50 puta u jednom dokumentu i 10 puta u drugom) mogli bi još uvijek imaju manji ugao između njih. Manji ugao, veća sličnost.
Koja je razlika između kosinusne sličnosti i Euklidske udaljenosti?
U ovom članku proučavali smo formalne definicije euklidske udaljenosti i kosinusne sličnosti. Euklidska udaljenost odgovara L2-normi razlike između vektora. Kosinusna sličnost je proporcionalna tačkastom proizvodu dva vektora i obrnuto proporcionalna proizvodu njihovih veličina.
Koja je razlika između kosinusne sličnosti i kosinusne udaljenosti?
Obično ljudi koriste kosinusnu sličnost kao metriku sličnosti između vektora. Sada, udaljenost se može definirati kao 1-cos_similarity. Intuicija iza ovoga je da ako su 2 vektora savršeno ista onda je sličnost 1 (ugao=0) i stoga je udaljenost 0 (1-1=0).