4학년/데이터 과학 ( Data Science )
[ 데이터 과학 ] 15. Linear Model 2
쫑알bot
2025. 5. 19. 15:37
728x90
시간이랑 P/F의 관계를 그린 그래프이다.
0 이나 1 의 값만 갖는 데이터들을
연속형 데이터처럼 다루고 싶다면 어떻게 해야할까?
→ 시간별로 P/F 확률을 연속형 데이터로 사용한다.
0과 1사이에 있는 데이터들을 가지고도 우리는
Linear Model을 만들어서 그것을 Logistic식에 있는 z에 통째로 넣는다.
요약 :
0,1 인 데이터를 확률로 바꾸어 (Signmoid)
-> Regression 돌릴 수 있다.
-> Regression의 결과에서 확률이 0.5 이상이면 1 그렇지 않으면 0으로 취급한다.
lm이 아니라 generalized lm이기 때문에 gml을 사용한다.
family 인자가 평소에 쓰던 lm이랑 다르다.
(출처)
한동대학교 김현정교수님 - 데이터과학