# 유클리디안 거리점수
: 그럼 제곱 제곱 제곱이 되는뎅.....
말이 안되는 알고리즘인뎅...? 2^ ==> 제곱으로 속도가 떨어지는거지????
... 유사도 계산 시 나타낼 수 있는 범위를 0~1로 잡고(정규화), 실수로 표현한다.
하.. 이게 왜. 효육적이지? 실수로 가면 속도가..........................................
제곱은 알고리즘에서..for로 처리하니깐.. ~~~
# 피어슨 상관점수
: 1, 0, -1
- 0이라는 기준을 잡는 조건은?
- 평균? 상관계수?
- 전체적인 상관관계를 나타낼 수 있찌만 두 객체간의 유사도는 측정할 수가 없다는 단점이 있다.
- 궂이 이 이론을 사용하는 이유는 ? 두 객체간 상관관계의 판별로만 사용한다.
# 유사도 계산을 할때는
1. 피어슨이 1위
2. 유클리디안이 2위
3. 3위는 기타 많은 것들이 있당...?
# 예를들어
1 : 객체간의 양의 상관관계가 나오면 함께 파는게 낫다.
0 : 객체간에 0의 상관관계가 나오면
-1: 객체간의 -1의 상관관계가 나오면 함께팔지않는게 낫다.
'Development > Data Science' 카테고리의 다른 글
[집단지성] 4.7 클릭학습 개념 (0) | 2015.05.14 |
---|---|
[집단지성] 군집화 (0) | 2015.05.09 |
[집단지성] 4. 검색과 랭킹 - 6. 유입 링크 사용하기 (0) | 2015.05.04 |
집단지성 (0) | 2015.04.21 |