4학년/데이터 과학 ( Data Science )

[ 데이터 과학 ] 15. Linear Model 2

쫑알bot 2025. 5. 19. 15:37
728x90

 

시간이랑 P/F의 관계를 그린 그래프이다.

 

0 이나 1 의 값만 갖는 데이터들을

연속형 데이터처럼 다루고 싶다면 어떻게 해야할까?

 

→ 시간별로 P/F 확률을 연속형 데이터로 사용한다.

 


 

0과 1사이에 있는 데이터들을 가지고도 우리는 

Linear Model을 만들어서 그것을 Logistic식에 있는 z에 통째로 넣는다.

 

 

 

 

요약 :

0,1 인 데이터를 확률로 바꾸어 (Signmoid)

-> Regression 돌릴 수 있다.

-> Regression의 결과에서 확률이 0.5 이상이면 1 그렇지 않으면 0으로 취급한다.

 

 lm이 아니라 generalized lm이기 때문에 gml을 사용한다.

 

family 인자가 평소에 쓰던 lm이랑 다르다.

 

 

 


(출처)

한동대학교 김현정교수님 - 데이터과학