본문 바로가기

반응형

인공지능

[머신러닝] 공분산과 왜 중요하지? joint probability distribution 케빈머피 머신러닝 통계뿐만 아니라 머신러닝 개념에서 정말 중요한 공분산에 대하여 알아보고자 합니다. 이 개념은 케빈머피 머신러닝 책에 joint probability distribution (결합확률 분포) 부분에 포함되어있습니다. 확률변수 X 와 Y 사이에 공분산은 X와 Y가 선형으로 연관되어 있는 정도를 측정하는데 공분산은 다음과 같이 정의된다. 공분산이라는 것은 두 확률 변수가 얼마나 함께 변하는지를 측정하는 통계적인 지표이다. 위의 정의에서 보다시피 X가 D 차원의 확률벡터 x 라면 공분산 행렬 Cov(x) 는 다음과 같이 대칭적인 행렬이다. (3.2) 그리고 (3.3) 에서 보이는 행렬은 확률벡터의 각 요소들 간의 쌍별 공분산을 나타내는데 공분산 행렬은 확률벡터의 다양한 구성요소들 간의 관계와 의존성을 확인할 수.. 더보기
[파이썬 기초] 하샤드 만들기 1. 자연수 입력 2. 예를 들면 18 을 입력 시, 1 과 8을 더한 값으로 9 로 18을 나누어 떨어지는 수 num=int(input("자연수 입력 하시오 :")) x = num // 10 y = num % 10 z = x+y if num % z == 0 : print (f"{num}는 하샤드 수 ") else : print (f"{num}는 하샤드 수 아님") 더보기
[머신러닝] Categorical distribution 범주형 다항분포 캐빈머피 다시금 캐빈머피의 머신러닝 공부를 시작하였습니다. 데이터 사이언티스트 직군의 특성상 공부를 게을리 하면 안되기 때문에 힘들다가도 살아있음을 느끼다가도 재밌다가도 다시 힘들기도 합니다. 그러나 이 과정을 이겨낸다면 뿌듯해지죠. 열심히 해봅시다. Categorical distribution은 이산확률 변수입니다. 위의 (2.88)의 수식이 다소 복잡하게 느껴질수 있으나, • y는 확률 변수, 1부터 C까지 카테고리를 나타냄. • Theta 는 각 클래스에 대한 매개변수 (확률) 이므로 theta c 는 클래스에 대한 확률 • I 는 Indicator function (지시함수) 요정도만 짚고 넘어갑니다. 그 다음 우리가 이제 범주형 분포로 사용하기 시작하는 것은 바로 softmax 함수입니다 여기서 a 는 .. 더보기

반응형