본문 바로가기
반응형

통계학 | 수학/Math for ML6

Eigendecomposition 어떤 벡터 $\vec{x}$ 를 행렬 A로 선형 변환했을 때, 방향은 변하지 않고 크기만 바뀌는 벡터 $\vec{x}$를 행렬 A의 Eigenvector라 하고, 크기가 얼만큼 변했는지를 나타내는 $\lambda$ 를 Eigenvalue라 한다. $$ \mathbf{A} \mathbf{v}=\lambda \mathbf{v} $$ 1. Finding Eigenvalues Eigenvalue $\lambda$ 를 찾아보자. $$ (A-\lambda I) \vec{x}=0 $$ 위의 식이 성립할 조건으로 아래 두 가지 경우가 있다. $\vec{x}=0$ $(A-\lambda I) = 0$ 만약 두번째 조건을 만족한다면, $\vec{x}=0$이므로 $\lambda$ 는 어떤 수도 올 수 있게 된다. 따라서 $(.. 2022. 1. 20.
Geometry and Linear Algebraic Operations 1. Geometry of vectors Vector is a list of numbers There are two types of vector: column vector, row vector data examples → column vectors Although column vector is default, for making tabular dataset we can treat data examples as row vector in the matrix conventionally weights used to form weighted sums → row vectors geometric interpretations of vectors points in space directions in space point.. 2022. 1. 12.
[베이즈 통계학] 베이즈 정리 베이즈정리는 베이지안주의(Bayesianism)에 기반을 두고 있으며 이는 기존의 빈도주의(frequentism) 통계학과 관점이 다르다. '주사위를 던졌을 때 짝수가 나올 확률'과 같이 확률 공간과 분포를 정의하고 확률을 계산하여 strict한 결과를 얻는 빈도주의와 달리, 베이지안주의는 불확실성을 가진 주장을 바탕으로 Evidence를 확보하여 점차 그 주장을 갱신하며 확률을 얻는다. 베이즈 정리를 한 마디로 정리하면 Evidence를 근거로 사전확률을 update하여 사후확률을 계산하는 것이다. P(H) H는 가설 혹은 어떤 사건이 발생했다는 주장이므로 P(H)는 가설에 대한 확률(신뢰도)이다. P(E) E는 Evidence로 데이터로부터 얻어진 증거이며 P(E)는 그 증거에 대한 확률이다. P(E.. 2021. 8. 16.
[통계학] 최대가능도추정법 (MLE) 1. 최대가능도추정법 통계적 모델링이란 적절한 가정위에서 확률분포를 추정하는 것이다. 데이터 생성 원리를 고려하며 히스토그램을 분석을 하는 등의 작업을 통해 확률분포를 가정했다면 모수를 추정해볼 수 있다. 모수란 모평균, 모분산과 같은 모집단 확률분포의 특성을 나타내는 대푯값이다. 그러나 전수조사를 하는 것은 거의 불가능하므로 표본을 뽑아서 표본평균, 표본분산과 같은 표본을 대표하는 통계량을 구하여 모수를 추정한다. 확률분포마다 사용하는 모수가 다른데, 데이터를 잘 설명할 가능성이 가장 높은 모수를 추정하는 방법이 최대우도법 또는 최대가능도추정법(Maximum Likelihood Estimation, MLE)이다. 최대우도법은 데이터가 고정되어 있고 특정 확률분포를 가정했을 때, 이 데이터들을 가장 잘 .. 2021. 8. 16.
728x90
반응형