목록전체 글 (567)
오래 못 할 짓 하지 않기
보호되어 있는 글입니다.

FN 샘플들의 예측 확률 (fn$prob2):Min: 0.0012041st Qu: 0.115265Median: 0.174103Mean: 0.1662373rd Qu: 0.223605Max: 0.269730특징: 와, 이거 봐라? 실제로는 긍정인데, 모델이 예측한 긍정 확률이 엄청 낮네? 최댓값이 0.27도 안 돼. 이건 모델이 이 샘플들을 거의 확실하게 부정이라고 판단했다는 뜻이야.FP 샘플들의 예측 확률 (fp$prob2):Min: 0.27001st Qu: 0.2945Median: 0.3778Mean: 0.40553rd Qu: 0.4728Max: 0.9947특징: FN보다는 확률이 훨씬 높지만, 중앙값이나 평균이 0.5를 넘지 않네? (물론 최댓값은 거의 1에 가깝지만). 이건 모델이 이 샘플들을 긍정일..
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.

시간이랑 P/F의 관계를 그린 그래프이다. 0 이나 1 의 값만 갖는 데이터들을연속형 데이터처럼 다루고 싶다면 어떻게 해야할까? → 시간별로 P/F 확률을 연속형 데이터로 사용한다. 0과 1사이에 있는 데이터들을 가지고도 우리는 Linear Model을 만들어서 그것을 Logistic식에 있는 z에 통째로 넣는다. 요약 :0,1 인 데이터를 확률로 바꾸어 (Signmoid)-> Regression 돌릴 수 있다.-> Regression의 결과에서 확률이 0.5 이상이면 1 그렇지 않으면 0으로 취급한다. lm이 아니라 generalized lm이기 때문에 gml을 사용한다. family 인자가 평소에 쓰던 lm이랑 다르다. (출처)한동대학교 김현정교수님 - 데이터과학