상관 관계와 공분산의 차이점 - 2020 - 다른 사람

instagram viewer

변수 또는 메트릭 간의 관계를 표현하려면 공분산 또는 상관을 사용할 수 있습니다. 상당한 차이가 있기 때문에 둘 다 항상 적합한 것은 아닙니다. 전자의 크기는 표준화되지 않았으므로 다른 계산의 결과를 비교할 수 없습니다.

변수 간의 관계는 공분산으로 표현할 수 있습니다. 그러나 이것이 어떻게 나타나는지는 값이 어떻게 측정되었는지에 달려 있습니다. 따라서 다르게 기록되었거나 다른 값 범위를 가진 변수 간의 분산을 비교하려면 상관 관계가 필요합니다.

공분산이란 무엇입니까?

공분산은 두 변수 간의 관계를 나타냅니다(예: NS. 키와 몸무게 사이). 한 측정 단위의 낮은 값은 다른 단위의 낮은 값과 연관될 수도 있으며 값이 증가하면 두 변수 모두에 대해 비슷한 정도로 이 작업을 수행합니다.

  • 예를 들어, 키가 큰 사람들은 일반적으로 체중이 더 많이 나간다. 이 경우 양의 공분산이 있습니다.
  • 한편, 한 값의 높은 값이 다른 값의 낮은 값을 동반하는 경우에는 음의 관계가 있습니다. 예를 들어, 한 지역의 경찰서 수와 범죄 빈도가 그렇습니다(경찰이 많을수록 범죄가 줄어듭니다).
  • 그러나 때로는 전혀 연결되지 않습니다. 이것은 한 영역의 차이가 다른 측정 변수에 전혀 영향을 미치지 않을 때 적용됩니다. 그러나 관계의 크기를 정확히 지정하기 위해서는 상관 관계의 지정이 필요합니다. 이것은 매우 다른 측정 변수의 상관 관계를 서로 비교할 수 있도록 정규화를 나타냅니다.
  • 요인 로딩 - 정보 제공

    때로는 특성 간의 관계에 관심이 있습니다. 왜냐하면 이런 식으로 ...

상관 관계의 차이

  • 상관 관계도 관계를 나타내지만 이 측도는 공분산과 대조적으로 표준화됩니다. 상관 관계는 -1(음의 관계)과 1(양의 관계) 사이의 값만 가정할 수 있습니다.
  • 0의 값은 한 변수의 차이가 다른 변수에 거의 또는 전혀 영향을 미치지 않음을 나타냅니다. 여기에는 중요한 연결이 없으므로 공분산도 없습니다.
  • 또한 상관 관계가 유의미한지 테스트합니다. 즉, 측정된 값의 개수가 주어졌을 때 변수의 특성 간에 실제로 상관관계가 있는지 여부를 계산합니다.
click fraud protection