Startik Startik
Guest
홈으로
로그아웃
브라우저에서 비디오를 지원하지 않습니다.
1 00:00:00,000 --> 00:00:12,400 안녕하세요 코리아 IT 아카데미 강남성 김영선 강사입니다. 2 00:00:12,400 --> 00:00:17,160 한 번에 이해하는 확률 두 번째 시간 시작할게요. 3 00:00:17,160 --> 00:00:23,760 오늘 배울 내용은 조건부 확률에 대한 내용과 베이지 정리에 대해서 배워보도록 하겠습니다. 4 00:00:23,760 --> 00:00:31,240 이 부분이 재미있는 부분은 아니지만 여러분들이 한 번쯤은 반드시 듣고 넘어가야 되는 부분이기 때문에 5 00:00:31,240 --> 00:00:36,959 집중해서 들어주시길 바랄게요. 먼저 조건부 확률이에요. 6 00:00:36,959 --> 00:00:48,720 조건부 확률은 특정 사건 B가 이미 발생했다는 전제 하에 다른 사건 A가 발생할 가능성을 계산하는 확률을 의미합니다. 7 00:00:48,720 --> 00:00:52,080 즉 어떤 사건이 이미 일어난 상태예요. 8 00:00:52,080 --> 00:00:59,200 그랬을 때 그 정보를 바탕으로 다른 사건이 발생할 확률을 다시 계산하는 것을 의미합니다. 9 00:00:59,200 --> 00:01:11,320 조건부 확률이라는 의미는 확률이라는 것은 모든 가능한 사건이 동일한 조건에서 발생할 가능성을 가정하고 계산이 된다 라고 했었죠. 10 00:01:11,320 --> 00:01:22,599 현실에서는 어떤 사건이 이미 발생했을 때 그 사건이 다른 사건의 가능성에 영향을 줄 수 있다라는 부분입니다. 11 00:01:22,599 --> 00:01:30,519 조건부 확률은 이러한 상황이 바뀐 후에 확률을 계산하는 도구로 봐주시면 되고요. 12 00:01:30,519 --> 00:01:34,959 조건부 확률의 계산 공식은 이것과 같습니다. 13 00:01:34,959 --> 00:01:41,160 한 사건이 발생했을 때 다른 사건이 발생할 가능성을 계산한다 라고 했죠. 14 00:01:41,160 --> 00:01:48,559 그래서 A와 B의 교집합을 B의 사건으로 나눠주는 거예요. 15 00:01:48,559 --> 00:02:02,800 이게 무슨 말이냐, 분자인은 B의 A, B로 쓰게 되면 A와 B가 동시에 발생하는 경우의 확률을 의미해요. 16 00:02:02,800 --> 00:02:07,160 예를 들어서 동전 던지기와 주사위 던지기가 있어요. 17 00:02:07,160 --> 00:02:15,000 동전 던지기에서는 앞면이 나오면서 주사위에서는 6이 나오는 경우의 확률, 이런 경우를 의미하는 거예요. 18 00:02:15,000 --> 00:02:22,119 분모에 있는 P, B라는 것은 B라는 사건이 발생할 확률을 의미합니다. 19 00:02:22,119 --> 00:02:27,039 주사위에서 숫자 6이 나올 확률, 이것을 의미하고요. 20 00:02:27,039 --> 00:02:36,360 조건부 확률은 B라는 조건 하에서 A가 일어나는 경우의 비율을 계산한다고 보시면 됩니다. 21 00:02:36,360 --> 00:02:55,199 제가 문제 하나 드릴게요. 주사위를 두 번을 던질 때 첫 번째 던진 값이 3이고, 두 번째 던진 값이 5일 확률, 즉 첫 번째 던질 것은 3이 나와야 돼요. 22 00:02:55,199 --> 00:03:02,960 두 번째 주사위를 던졌을 때는 5가 나와야 됩니다. 이거의 확률을 한번 계산해 보도록 할게요. 23 00:03:02,960 --> 00:03:15,320 그러기 위해서는 전체 경우의 수를 먼저 알아야겠죠. 저희가 주사위를 두 번 던지니까 한 번 던질 때 나올 수 있는 조합의 수는 몇이죠? 24 00:03:15,320 --> 00:03:28,320 6개의 눈이 있죠? 그렇기 때문에 6이 됩니다. 두 번째 던졌을 때도 6이 되죠. 두 개를 곱해서 36개, 전체 경우는 36개의 조합이 나올 수가 있게 돼요. 25 00:03:28,360 --> 00:03:37,919 조건부 확률을 계산하는 것을 보면 첫 번째 값이 3이고, 두 번째 값이 5인 경우는 단 하나밖에 없죠. 26 00:03:37,919 --> 00:03:54,600 3과 5가 나올 수 있는 경우는 3, 5 단 하나밖에 없기 때문에 두 개가 같이 나올 수 있는 건 전체 조합인 36에서 1, 한 번의 개수가 나올 수가 있습니다. 27 00:03:54,600 --> 00:04:02,320 그럼 첫 번째 값이 3으로 나올 수 있는 경우의 수는요? 두 번째에서는 6번이 나올 수가 있죠. 28 00:04:02,320 --> 00:04:16,880 6개의 눈의 수가 나올 수가 있기 때문에 첫 번째는 3, 두 번째는 1, 첫 번째는 3, 두 번째는 2, 이렇게 해서 첫 번째는 3이고, 두 번째는 6으로 총 6가지가 나올 수가 있어요. 29 00:04:16,880 --> 00:04:29,320 총 6가지가 나온다고 했죠? 그러면 이 6가지가 분자에 들어가고, 분모에는 총 조합 개수 36이 들어가게 돼요. 30 00:04:29,320 --> 00:04:37,320 그러면 6은 36을 6으로 나눌 수 있다. 그러니까 1분의 6이 됩니다. 31 00:04:37,359 --> 00:04:46,000 세 번째로, 즉 A와 B의 교집합을 B가 나올 확률로 나눠준 것. 32 00:04:46,000 --> 00:04:55,040 그렇게 되면 1분의 1을 1분의 6로 나눈 거죠. 이렇게 했을 때 결과는 1분의 6이 나오게 돼요. 33 00:04:55,040 --> 00:05:04,720 즉, 결론을 보면 첫 번째 값이 3일 때, 두 번째 값이 5일 확률은 1분의 6 확률입니다. 34 00:05:04,720 --> 00:05:19,320 퍼센트로 나타내면 대략 16.67%가 나오게 돼요. 조건부 확률의 벤 다이어그램을 사건 A와 사건 B가 있을 때 이런 형태로 그려볼 수가 있고요. 35 00:05:19,320 --> 00:05:28,760 파란색 영역은 사건 B가 발생한 경우를 의미해요. 녹색 영역은 사건 A만 발생한 경우를 의미합니다. 36 00:05:28,760 --> 00:05:36,519 사건 A만 발생한 경우가 무슨 뜻이냐? 사건 A는 이만큼이죠? 원래라면. 37 00:05:36,519 --> 00:05:46,959 여기에서 교집합 부분을 뺀 나머지 부분, 즉 이만큼의 부분이 녹색 영역인 거예요. 38 00:05:46,959 --> 00:05:59,880 사건 A만 발생한 경우를 의미하게 되고요. 중앙에 겹치는 영역 이만큼이죠? 이만큼은 사건 A와 B가 동시에 발생한 경우를 의미합니다. 39 00:05:59,880 --> 00:06:09,359 그러면 최종적으로 조건부 확률은 파란색 영역 안에서 겹치는 영역의 비율을 의미하게 돼요. 40 00:06:09,359 --> 00:06:19,839 파란색 영역은 이만큼을 의미하는 거죠. 여기서 이만큼을 겹치는 영역의 비율을 의미한다고 봐주시면 됩니다. 41 00:06:19,839 --> 00:06:34,119 두 번째로 베이지 정리에 대해서 알아보도록 하겠습니다. 베이지 정리라는 것은 기존 확률에 새로운 정보를 반영해서 확률을 업데이트하는 수학적 도구를 의미해요. 42 00:06:34,119 --> 00:06:44,160 조건부 확률을 계산할 때 매우 강력한 방법으로 새로운 증거가 주어졌을 때 확률을 조정하는 과정을 의미합니다. 43 00:06:44,160 --> 00:06:51,399 베이지 공식 정리를 보기 전에 저희 조건부 확률 공식만 쓰고 넘어가도록 하겠습니다. 44 00:06:51,399 --> 00:07:00,600 B가 발생할 전체 확률 그리고 위에서는 A와 B의 교집합 이렇게 있었죠? 45 00:07:00,600 --> 00:07:09,320 베이지 공식 정리는 먼저 이것을 의미해요. 결국에 알고 싶은 건 사후 확률을 알고 싶은 거예요. 46 00:07:09,320 --> 00:07:16,839 사건 B가 발생한 후에 A가 발생할 확률을 구하는 게 베이지 공식이라고 보시면 됩니다. 47 00:07:16,839 --> 00:07:25,480 P에 B, A 있죠? 이거는 사건 A가 발생했을 때 B가 발생한 확률을 의미해요. 48 00:07:25,480 --> 00:07:36,760 그리고 그 옆에 PA를 곱해 줬죠? PA는 사건 A가 발생할 확률을 의미하고요. 사전 확률이 됩니다. 49 00:07:36,799 --> 00:07:44,279 이 값을 P, B로 나눠주게 되어 사건 B가 발생할 전체 확률로 나눠주게 되는 거죠. 50 00:07:44,279 --> 00:07:50,640 이렇게 해서 사후 확률을 구한다 라고 생각을 해주시면 되고요. 51 00:07:51,399 --> 00:08:02,320 주사위 게임으로 한번 보도록 하겠습니다. 게임에서 주사위가 한번 굴려졌을 때 플레이어는 주사위가 6이 나왔다고 해요. 52 00:08:02,320 --> 00:08:06,839 하지만 플레이어가 항상 정직하게 말하지 않을 수도 있죠? 53 00:08:06,839 --> 00:08:14,519 던졌을 때 실제로는 1이 나왔는데 6이 나왔다고 할 수도 있고요. 3이 나왔는데 6이 나왔다고 말할 수도 있죠. 54 00:08:14,519 --> 00:08:20,480 그런데 6이 나와서 진짜 6이 나왔어 라고 말을 할 수도 있습니다. 55 00:08:20,760 --> 00:08:29,920 그래서 이 확률부터 계산을 합니다. 플레이어가 정직하게 말할 확률 80% 라고 볼게요. 56 00:08:29,920 --> 00:08:45,760 그러면 80%는 비율 0.8 정도가 되겠죠? 플레이어가 정직하게 말할 경우에 실제로 6이 나올 확률이 100% 라고 해 보겠습니다. 57 00:08:46,200 --> 00:08:54,200 그리고 플레이어가 거짓말할 경우 이미의 숫자를 말할 확률은 동일하고 58 00:08:55,200 --> 00:09:01,320 6일 확률을 한번 보면 1분의 1이 되는 거죠. 59 00:09:01,520 --> 00:09:14,080 베이지 정리를 적용해 보면 우리가 알고 싶은 것은 플레이어가 6을 실제로 말했을 때 실제 주사위가 6일 확률이 저희가 알고 싶은 거예요. 60 00:09:14,119 --> 00:09:20,359 그러면 6인 것과 말한 게 같은 것만 알면 되겠죠? 61 00:09:20,359 --> 00:09:27,000 그래서 공식을 적용해 보면 이런 형태로 만들어지게 됩니다. 62 00:09:27,359 --> 00:09:35,840 사전 확률부터 볼게요. 사전 확률, 아까 전에 있던 이 부분이죠. 정직하게 말할 확률. 63 00:09:35,840 --> 00:09:44,280 사전 확률을 봤을 때 정직한 경우는 0.8 이에요. 그리고 거짓말을 하는 경우는 0.2 가 되겠죠. 64 00:09:44,280 --> 00:09:55,400 이거의 총합은 1이 되어야 되니까. 정직한 경우가 1.0이고 거짓말을 한 경우가 1분의 1, 0.1667 이라고 한다면 65 00:09:55,400 --> 00:10:00,400 전체 확률은요. 계산이 들어가게 되면 66 00:10:00,400 --> 00:10:12,000 각각 곱하고 더하고 더하고 결국에 0.83332 라는 값이 나오게 돼요. 67 00:10:12,000 --> 00:10:18,080 자 얘가 전체 확률이 되는 거죠. 이것이 전체 확률이 되는 거고요. 68 00:10:18,080 --> 00:10:27,919 지금 잘 보시면 정직한 경우와 정직한 경우. 사전 확률과 조건부 확률의 정직한 경우를 두 개를 곱해 줬어요. 69 00:10:27,919 --> 00:10:34,880 그리고 더해 주죠. 어떤 값과 어떤 값을. 플레이어가 거짓말을 하는 경우에 사전 확률과 70 00:10:34,880 --> 00:10:41,000 거짓말한 경우에 실제 나온 조건부 확률 두 개를 더해 주게 됩니다. 71 00:10:41,000 --> 00:10:48,960 자 그랬을 때 최종 결과는 0.8333 이 나오게 되고요. 얘가 전체 확률이 되게돼요. 72 00:10:48,960 --> 00:10:57,200 여기까지 이해됐을까요? 네 그러면 이렇게 해서 계산을 할 수 있다는 거 기억을 해주시면 되고요. 73 00:10:57,200 --> 00:11:08,039 결과로 보도록 하겠습니다. 자 결과는 플레이어가 6이라고 말했을 때 실제로 주사위가 6일 확률은 약 96% 가 돼요. 74 00:11:08,039 --> 00:11:15,679 왜 높은 확률이 나왔을까요? 플레이어가 정직하게 말한 확률이 매우 높기 때문입니다. 75 00:11:15,679 --> 00:11:26,760 사전 확률이었죠. 베이징 정류는 이 정보를 반영해서 확률을 업데이트 하기 때문에 확률이 높게 나올 수밖에 없어요. 76 00:11:26,760 --> 00:11:34,280 이 주사위 게임을 그래프로 한번 보도록 하겠습니다. 플레이어가 6이라고 말할 확률이 있죠. 77 00:11:34,280 --> 00:11:43,559 파란색 경우가 정직한 경우에요. 정직한 경우는 80% 가 나오게 됩니다. 0.80으로 나왔죠. 78 00:11:43,559 --> 00:11:51,960 녹색이 거짓말한 경우를 의미하고요. 약 3.33% 가 된다고 하겠습니다. 79 00:11:51,960 --> 00:12:02,640 그러면 그 아래쪽에도 한번 볼게요. 위의 그래프는, 위의 확률이 나온 이 그래프는 플레이어가 6을 말할 확률이었어요. 80 00:12:02,640 --> 00:12:13,320 아래 나온 그래프는 플레이어가 6일 하고 있을 때의 실제 확률입니다. 파란색 이 부분이 실제 6일 확률이구요. 81 00:12:13,320 --> 00:12:24,080 빨간색인 이 부분이 실제 6이 아닐 확률이에요. 실제 6일 확률이 96% 로 높은 비율을 차지하고 있죠. 82 00:12:24,080 --> 00:12:31,960 6이 아닐 확률은 4% 가 나오게 됩니다. 이렇게 해서 그래프로 그려볼 수 있다는 거 확인했죠. 83 00:12:31,960 --> 00:12:41,760 저희 그러면 코드로 한번 확인해 보도록 하겠습니다. 코렉 가주시구요. 여기에는 7강 이라고 넣어 주도록 할게요. 84 00:12:41,760 --> 00:12:53,039 저희 실제 그래프를 확인해 볼 건데 플레이어가 6을 말할 확률과 플레이어가 6이라고 했을 때 실제 확률 85 00:12:53,039 --> 00:13:00,280 아까 ppt 에서 봤던 그 부분을 한번 같이 코드로 작성해 보도록 하겠습니다. 86 00:13:00,280 --> 00:13:05,840 먼저 테스트 코드 하나 추가해 주시구요. 87 00:13:06,039 --> 00:13:24,559 1 베이지 정리라고 작성하겠습니다. 시각화를 할 것이기 때문에 import matplotlib.pyplot as plt 라는 별칭을 넣어주시구요. 88 00:13:24,559 --> 00:13:33,760 먼저 데이터를 정리해 보도록 할게요. 저희 그래프를 하나에서 같이 그려서 보도록 하겠습니다. 89 00:13:33,760 --> 00:13:40,599 그래프 1이 될 거구요. 첫번째 그래프 6 이라고 말할 확률이에요. 90 00:13:41,280 --> 00:13:50,320 플레이어가 6 이라고 말할 확률. 카테고리를 설정해 줄 거구요. 카테고리 약자로 카테라고만 쓰겠습니다. 91 00:13:50,320 --> 00:14:00,000 여기에 정직한 경우와 리스트 타입으로 거짓말한 경우 넣어줄게요. 92 00:14:00,159 --> 00:14:14,960 그리고 values라는 변수의 리스트 변수를 만들 거구요. 0.8 이라는 값과 0.0333 이라는 값을 넣어줄게요. 93 00:14:14,960 --> 00:14:24,159 자 이게 바로 정직한 경우와 거짓말한 경우의 확률이 되요. 94 00:14:25,119 --> 00:14:35,039 자 그러면 이제 그래프 1에서 동일하게 그려볼 거구요. 6 이라고 말할 확률 써줄게요. 95 00:14:39,159 --> 00:14:48,000 자 여기에 먼저 그린 그려줄 도화지 만들어 줄게요. figure 라는 메소드 사용해서 피그 사이즈는 96 00:14:48,000 --> 00:15:00,719 8,6 정도의 사이즈로 설정을 해 줄 거구요. PLT점, 막대 그래프 그릴거죠? PLT점 바라는 메소드에 카테와 values를 각각 넣어줄게요. 97 00:15:00,719 --> 00:15:06,000 자 그리고 엣지 컬러는 98 00:15:06,000 --> 00:15:10,080 블랙으로 설정해 주도록 하겠습니다. 99 00:15:11,080 --> 00:15:21,400 자 PLT점 타이틀로 구분해서 보여주는게 조금 더 시각적으로 확인하기가 쉽겠죠? 그래서 타이틀을 설정해 줄게요. 100 00:15:21,400 --> 00:15:25,440 플레이어가 6을 말할 확률. 101 00:15:26,039 --> 00:15:33,520 자 이때 PLT점 Y라벨로 확률이라고 해 줄 거구요. 102 00:15:33,840 --> 00:15:44,000 자 여기에는 Y축의 범위도 설정을 해 주도록 하겠습니다. 그 이유가 0부터 1 사이의 값으로 나오게 되겠죠? 103 00:15:44,000 --> 00:15:54,799 그래서 Y림이라는 PLT점, Y림이라는거에 0,1로 Y축의 범위를 설정해 줄게요. 104 00:15:55,799 --> 00:16:02,880 자 이제 반복문을 돌려 줄 거구요. I와 V라는 변수를 만들어 줄 거구요. 105 00:16:02,880 --> 00:16:08,880 Enumerate를 사용해 줄게요. 여기에는 values를 넣어 주도록 하겠습니다. 106 00:16:08,880 --> 00:16:19,599 자 PLT점 텍스트로 I,V의 막대 그래프의 간격을 조금 벌려 줘야 되기 때문에 0.0 이라고 해 줄 거구요. 107 00:16:19,599 --> 00:16:29,760 자 여기서 F스트링 써 주도록 할게요. 여기에서는 V콜론.EF라고 해 줄 거구요. 108 00:16:29,760 --> 00:16:36,599 자 그리고 허도 설정해 주도록 하겠습니다. 하의는 센터라고 설정해 줄게요. 109 00:16:36,599 --> 00:16:47,599 자 이 폰트 사이즈도 조금 키워 주도록 하겠습니다. 폰트 사이즈는 12. 자 이 말은 막대 위에 확률을 표시하는 부분이에요. 110 00:16:47,599 --> 00:16:58,039 그리고 아래쪽에서 품은 밖에서 PLT점 쇼로 실행해 보시면 카테라고 제가 카테를 2로 썼죠. 111 00:16:58,039 --> 00:17:05,359 네 카테라고 써 주시구요. 이렇게 해서 확인해 보면 그래프는 잘 나오는데 한글이 깨져서 나오죠. 112 00:17:05,359 --> 00:17:16,800 자 지난 시간에 배웠습니다. 한글 깨짐 방지하는 거. 자 위쪽에다가 코드셀 하나 추가하고 한글 깨짐 방지 넣어 주도록 할게요. 113 00:17:16,800 --> 00:17:34,959 맵플로리베 파인 플로스로 에스 PLT는 수두 APT 계세 인스톨 마이너스 와이 폰트 나눔 이라고 해서 나눔바 나눔 폰트를 설치해 주고요. 114 00:17:34,959 --> 00:17:53,439 수두 FC는 캐시 한칸 띄고 마이너스 FV 그리고 느낌표 아래 물결에 캐시에 맵플로리베 마이너스 RF 자 예 실행해 주시구요. 115 00:17:53,439 --> 00:18:06,739 그리고 런타임에서 세션 다시 시작 예 눌러 주신 다음에 아래쪽에 PLT점 RC 넣어서 다시 한번 실행시켜 주셔야 되죠. 116 00:18:06,739 --> 00:18:36,699 세션 다시 시작 예. 다시 시작 되면 PLT점 RC에 폰트 그리고 패밀리 값에 패밀리에는 나눔 바른 고직으로 설정해 주시면 되요. 117 00:18:36,699 --> 00:18:48,380 실행하게 되면 설치가 되는 거 확인할 수가 있구요. 설치가 끝나고 나면 아래 그래프 다시 한번 실행해 줄게요. 118 00:18:48,380 --> 00:18:57,540 그러면 오류가 나지 않고 제대로 깨지지 않고 한글이 나오는 거 확인할 수가 있죠. 바로 하나 더 만들어 보도록 하겠습니다. 119 00:18:57,540 --> 00:19:10,060 자 이번에는 실제 주사위가 6일 확률을 구해야겠죠. 자 데이터부터 만들어 줄게요. 데이터 정리해 줄 거구요. 그래프 2로 가겠습니다. 120 00:19:10,060 --> 00:19:15,219 실제 주사위가 6일 확률 121 00:19:16,180 --> 00:19:31,260 저희 파이널 카테 라는 리스트 변수에 만들어 줄게요. 여기에는 실제 6일 확률과 실제 6일 아닐 확률을 넣어 줄 거구요. 122 00:19:31,260 --> 00:19:44,859 파이널 벨류즈에 0.96 이라는 값과 0.04라는 값을 넣어 줄게요. 123 00:19:44,859 --> 00:20:00,060 이 말뜻은 6세이드6 이라고 쓴 것과 그리고 피해 낮 6이 아닐 확률이죠. 124 00:20:00,060 --> 00:20:07,699 세이드 6으로 쓴 것과 이거 두 개를 의미한다라고 보시면 됩니다. 125 00:20:07,699 --> 00:20:17,060 자 그러면 이제 그래프를 그려주면 되겠네요. 그래프 두 번째 실제 주사위가 6일 확률이죠. 126 00:20:17,819 --> 00:20:27,060 자 이것도 영역부터 설정해 주도록 하겠습니다. 피규어의 피그 사이즈 넣어 줄 거구요. 127 00:20:27,060 --> 00:20:32,500 자 피그 사이즈는 동일하게 갈게요. 8,6으로 128 00:20:33,140 --> 00:20:47,099 ph.var 라는 메소드에 파이널 카테 라는 리스트 넣어 주시고요. 그리고 파이널 벨류즈 라는 리스트 두 개 넣어 주시면 되겠죠. 129 00:20:47,099 --> 00:20:54,500 자 여기에는 엣지 컬러에 블랙으로 설정해 주도록 하겠습니다. 130 00:20:54,500 --> 00:21:06,699 자 이제 타이틀 설정해 줄 거구요. 플레이어가 6이라고 했을 때 실제 확률 확인해 볼게요. 131 00:21:06,699 --> 00:21:17,140 plt.y라벨에는 확률이라는 값을 넣어 주고요. 그리고 이것도 확률이니까 0부터 1 사이에 갑시죠. 132 00:21:17,140 --> 00:21:24,339 자 plt.y라는 메소드 사용해서 0,1 이라고 넣어 줄게요. 133 00:21:24,339 --> 00:21:31,300 이것 또한 y축의 범위를 설정한 부분입니다. 자 여기도 반복문 돌려 줄 거구요. 134 00:21:31,300 --> 00:21:37,540 i,v라는 두 개의 변수, enumerate라는 함수를 써서 135 00:21:37,540 --> 00:21:44,939 final.var.values 값을 넣어 주시면 되겠네요. 136 00:21:44,939 --> 00:21:55,939 자 이제 plt.txt라는 메소드에 i,v 플러스 0.02 그리고 f 스트링으로 사용해 줄게요. 137 00:21:55,939 --> 00:22:04,540 v,f 실수로 나오게 할 거구요. 자 여기에는 하라는 값에 센터 넣어 주도록 할게요. 138 00:22:04,540 --> 00:22:11,979 센터에 출력되도록 그리고 폰트 사이즈 동일하게 12 폰트로 넣어 주도록 하겠습니다. 139 00:22:11,979 --> 00:22:22,260 자 이 부분이 막대위의 확률을 표시하는 부분이다 라고 했어요. 자 마지막에 이제 plt.show로 출력해 보면 140 00:22:22,260 --> 00:22:32,219 두 개의 그래프가 나타나는 거 확인할 수가 있죠. 실제 6일 확률과 6일 안일 확률 각각 나오는 걸 확인할 수가 있습니다. 141 00:22:32,219 --> 00:22:41,060 자 이렇게 해서 저희가 ppt에서 봤던 이 그래프 그대로 그려보았어요. 여러분들 코드 다시 한번 꼭 확인해 주시구요. 142 00:22:41,060 --> 00:22:49,900 그래프 부분은 저희 그래프 그려보는 시간 따로 있으니까 그 수업 때 좀 더 집중해서 설명 드리도록 하겠습니다. 143 00:22:49,900 --> 00:22:57,459 간단하게 복습하고 오늘 수업 마치도록 하겠습니다. 자 첫번째로 조건부 확률에 대해서 배웠죠? 144 00:22:57,459 --> 00:23:06,939 조건부 확률이라는 것은 어떤 사건이 이미 일어났을 때 그 정보를 바탕으로 다른 사건이 다시 발생할 확률을 계산하는 것을 145 00:23:06,939 --> 00:23:16,859 의미했구요. 자 두번째로 조건부 확률에서 b라는 조건화에서 a가 일어나는 경우의 비율을 146 00:23:16,859 --> 00:23:26,939 계산한다라고 했습니다. 저희가 배웠던 거 베이즈 정리에 대해서 배웠죠? 기존 확률에 새로운 정보를 반영해서 확률을 업데이트하는 147 00:23:26,939 --> 00:23:38,540 수학적 도구라고 했구요. 조건부 확률을 계산할 때 매우 강력한 방법으로 새로운 증거가 주어졌을 때 확률을 조정하는 과정이다 라고 했습니다. 148 00:23:38,540 --> 00:23:50,900 여러분들 오늘 배웠던 내용, 저희 코드 작성했던 것까지 다시 한번 잘 복습해 주시구요. 저희 수업은 여기서 마치도록 하고 다음 강의에서 뵙겠습니다. 149 00:23:50,900 --> 00:23:54,020 오늘도 고생하셨습니다.

04_파이썬으로 배우는 데이터 분석 기초


조건부 확률의 개념

  • 조건부 확률: 특정 사건 B가 이미 발생했다는 전제 하에, 다른 사건 A가 발생할 가능성을 의미
  • 기존 확률은 모든 사건이 동일 조건에서 발생한다고 가정하나, 현실에서는 이미 발생한 사건이 다른 사건의 가능성에 영향을 줌
  • 조건이 주어진 뒤(상황이 바뀐 뒤)의 새로운 확률을 계산하는 도구
  • 기본 공식: \( P(A \mid B) = \dfrac{P(A \cap B)}{P(B)} \)
  • \(P(A \cap B)\): A와 B가 동시에 발생하는 확률, \(P(B)\): B가 발생하는 확률
  • 벤 다이어그램 해석: B 영역 전체 중에서 A와 B가 겹치는 교집합 영역의 비율이 \(P(A \mid B)\)

조건부 확률 예시: 주사위 두 번 던지기

  • 상황: 주사위를 두 번 던질 때
    • 사건 A: 두 번째 던진 값이 5
    • 사건 B: 첫 번째 던진 값이 3
  • 전체 경우의 수: 각 6가지 눈 → \(6 \times 6 = 36\)
  • \(P(A \cap B)\): (3,5) 한 가지 경우 → \(\dfrac{1}{36}\)
  • \(P(B)\): 첫 번째가 3인 경우 (3,1)~(3,6) → 6가지 → \(\dfrac{6}{36} = \dfrac{1}{6}\)
  • 조건부 확률: \[ P(A \mid B) = \frac{P(A \cap B)}{P(B)} = \frac{\tfrac{1}{36}}{\tfrac{1}{6}} = \frac{1}{6} \approx 16.67\% \]
  • 해석: 첫 번째 값이 이미 3이라고 알 때, 두 번째 값이 5일 확률은 \(\dfrac{1}{6}\)

베이즈 정리의 개념과 공식

  • 정의: 기존 확률(사전 확률)에 새로운 정보(증거)를 반영해 확률을 업데이트하는 수학적 도구
  • 조건부 확률을 계산할 때, 새로운 증거가 주어졌을 때의 확률 조정에 사용
  • 관심 대상: 사건 B가 발생한 후, 사건 A가 발생했을 확률 \(P(A \mid B)\) 또는 그 반대
  • 베이즈 정리 기본 형태: \[ P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B)} \]
  • \(P(A)\): 사전 확률 (A가 일어날 선행 가능성)
  • \(P(B \mid A)\): A가 일어났다고 할 때 B가 관측될 조건부 확률
  • \(P(B)\): B가 발생할 전체 확률 (모든 원인 경우를 고려해 합산)
  • \(P(A \mid B)\): B가 관측된 후, A가 원인일 사후 확률

베이즈 정리 예시: 주사위와 거짓말

  • 상황 설정
    • 플레이어가 주사위를 굴리고 결과를 말함
    • 플레이어가 정직하게 말할 확률: 0.8
    • 거짓말할 확률: 0.2
    • 정직하게 말하면, 실제 6일 때 “6”이라고 말할 확률: 1 (100%)
    • 거짓말할 때는 6이 아닌 값에서 임의의 숫자를 균등하게 말한다고 가정 → “6”을 말할 확률: \(\dfrac{1}{6} \approx 0.1667\)
  • 우리가 알고 싶은 것: 플레이어가 “6”이라고 말했을 때, 실제로 6일 확률 \(P(\text{실제 6} \mid \text{6이라고 말함})\)
  • 전체 확률 \(P(\text{6이라고 말함})\) 계산:
    • 정직 + 실제6 경로: \(0.8 \times 1\)
    • 거짓말 + 실제6 아님 경로 중 “6이라고 말함”: \(0.2 \times \tfrac{1}{6}\)
    • 두 경로를 더해 전체: 약 \(0.8333\)
  • 베이즈 적용 후 결과:
    • 플레이어가 “6”이라고 말했을 때 실제 6일 사후 확률 ≈ 96%
    • 실제 6이 아닐 확률 ≈ 4%
    • 높은 이유: 사전 정보(정직할 확률 80%)가 강하게 작용해 결과를 끌어올렸기 때문

파이썬 코드와 시각화

  • 사용 라이브러리: matplotlib.pyplot을 plt 별칭으로 임포트
  • 그래프 1: “플레이어가 6을 말할 확률” 시각화
    • 카테고리: [정직한 경우, 거짓말한 경우]
    • 값: [0.8, 0.0333]
    • plt.bar()로 막대 그래프 작성, Y축 범위 0~1, 막대 위에 확률 텍스트 표시
  • 그래프 2: “플레이어가 6이라고 했을 때 실제 확률”
    • 카테고리: [실제 6일 확률, 실제 6이 아닐 확률]
    • 값: [0.96, 0.04]
    • 동일하게 plt.bar()로 그려 사후 확률 분포 표현
  • 한글 폰트 깨짐 방지:
    • 나눔 폰트 설치 및 캐시 삭제 후 런타임 재시작
    • plt.rc 설정으로 폰트 패밀리를 나눔 계열로 지정해 한글 제목·레이블 정상 표기

정리 및 복습 포인트

  • 조건부 확률
    • “이미 발생한 사건” 정보를 반영해 다른 사건의 확률을 다시 계산
    • \(P(A \mid B) = \dfrac{P(A \cap B)}{P(B)}\) 공식과 벤 다이어그램 비율 해석 숙지
  • 베이즈 정리
    • 사전 확률 + 새로운 증거(조건부 확률) → 사후 확률로 업데이트
    • 주사위·플레이어 정직성 예제에서 실제/보고값 관계를 수식으로 표현
  • 실습
    • 베이즈 정리 결과를 파이썬과 Matplotlib으로 막대그래프로 시각화
    • 코드 구조와 그래프 해석 과정을 통해 통계 개념과 구현 방법을 함께 연습
KEG
01_블렌더 입문자를 위한 SD 캐릭터 만들기
학습 01_블렌더 입문자를 위한 SD 캐릭터 만들기   완료 콘텐츠
영상 2025_blender3d_08.mp4
02_누구나 쉽게! 파이썬 베이직
학습 02_누구나 쉽게! 파이썬 베이직   완료 콘텐츠
영상 2024_PYTHON BASIC_10.mp4
03_기초부터 실무까지! 자바스크립트 (ES6) 마스터하기
학습 03_기초부터 실무까지! 자바스크립트 (ES6) 마스터하기   완료 콘텐츠
영상 2025_javascript_01.mp4
04_파이썬으로 배우는 데이터 분석 기초
학습 04_파이썬으로 배우는 데이터 분석 기초   현재 콘텐츠
영상 2024_DataAnalysis1_07.mp4
05_파이썬으로 배우는 데이터 분석 심화  AI & 머신러닝
학습 05_파이썬으로 배우는 데이터 분석 심화 AI & 머신러닝   완료 콘텐츠
영상 2024_DataAnalysis2_11.mp4
06_코딩이 처음이라도 괜찮아, 엔트리로 시작하자! part.1
학습 06_코딩이 처음이라도 괜찮아, 엔트리로 시작하자! part.1   완료 콘텐츠
영상 2024_Entry_6-5.mp4
07_코딩이 처음이라도 괜찮아, 엔트리로 시작하자! part.2
학습 07_코딩이 처음이라도 괜찮아, 엔트리로 시작하자! part.2   완료 콘텐츠
영상 2024_Entry_master_13_05.mp4
08_피부미용사 필기, 무조건 합격하는 완벽 로드맵!
학습 08_피부미용사 필기, 무조건 합격하는 완벽 로드맵!   완료 콘텐츠
영상 20250408_국가자격증_미용사(피부)_김효진_8회차_0428종편_unit3.mp4
09_Microsoft 공식 자격증 MCF AI-900
학습 09_Microsoft 공식 자격증 MCF AI-900
영상 MCF AI-900_1-1.mp4
10_Unity 공식 자격증 UCU Programmer
학습 10_Unity 공식 자격증 UCU Programmer   완료 콘텐츠
영상 UCU programmer_1-3.mp4
11_30일이면 비전공자도 합격하는 PCCE 완벽 코스!
학습 11_30일이면 비전공자도 합격하는 PCCE 완벽 코스!   완료 콘텐츠
영상 PCCE_06-4.mp4
12_Adobe 공식 자격증 ACP After Effects
학습 12_Adobe 공식 자격증 ACP After Effects
영상 ACP_After Effects_01.mp4
13_영상에 감정을 입히는 기술, 컬러그레이딩  다빈치 리졸브로 배우는 실무 클래스_입문 편
학습 13_영상에 감정을 입히는 기술, 컬러그레이딩 다빈치 리졸브로 배우는 실무 클래스_입문 편
영상 colorgrading 01.mp4
14_하루 20분! 왕초보도 성공하는 '아이패드 드로잉 X 굿즈 수익화'
학습 14_하루 20분! 왕초보도 성공하는 '아이패드 드로잉 X 굿즈 수익화'   완료 콘텐츠
영상 3-3_v2.mp4
15_왕초보도 따라하는 완성도 최강의 버츄얼캐릭터
학습 15_왕초보도 따라하는 완성도 최강의 버츄얼캐릭터   완료 콘텐츠
영상 004Vtuber 디자인 01.기획서 종편 FHD 0616.mp4
16_실무에 바로 쓰는 SketchUp & Enscape 건축 모델링
학습 16_실무에 바로 쓰는 SketchUp & Enscape 건축 모델링   완료 콘텐츠
영상 250701_KKJ_lecture_09_유닛_01_자막.mp4
01 ACP Illustrator CC2023
학습 01 ACP Illustrator CC2023   완료 콘텐츠
영상 01 ACP Illustrator CC2023.mp4
02 ACP Premiere pro CC2023
학습 02 ACP Premiere pro CC2023
영상 02 ACP Premiere pro CC2023.mp4
03 ACP Photoshop CC2023
학습 03 ACP Photoshop CC2023   완료 콘텐츠
영상 03 ACP Photoshop CC2023.mp4
04 ACP Indesign CC2023
학습 04 ACP Indesign CC2023   완료 콘텐츠
영상 04 ACP Indesign CC2023.mp4
05 멘토씨리즈 포토웍스
학습 05 멘토씨리즈 포토웍스   완료 콘텐츠
영상 05 멘토씨리즈 포토웍스.mp4
06 확실하게 마스터하자! 디테일 일러스트
학습 06 확실하게 마스터하자! 디테일 일러스트   완료 콘텐츠
영상 06 확실하게 마스터하자! 디테일 일러스트.mp4
07 인포그래픽, 정보가 한눈에 보이는 Visual thinking
학습 07 인포그래픽, 정보가 한눈에 보이는 Visual thinking
영상 07 인포그래픽, 정보가 한눈에 보이는 Visual thinking.MP4
08 웹툰제작
학습 08 웹툰제작   완료 콘텐츠
영상 08 웹툰제작.mp4
09 기초부터 다져보는 누크
학습 09 기초부터 다져보는 누크   완료 콘텐츠
영상 09 기초부터 다져보는 누크.mp4
10 누크의 3D Workflow
학습 10 누크의 3D Workflow
영상 10 누크의 3D Workflow.mp4
11 기초부터 시작하는 MAYA 렌더링
학습 11 기초부터 시작하는 MAYA 렌더링   완료 콘텐츠
영상 11 기초부터 시작하는 MAYA 렌더링.mp4
12 기초부터 시작하는 MAYA 모델링
학습 12 기초부터 시작하는 MAYA 모델링   완료 콘텐츠
영상 12 기초부터 시작하는 MAYA 모델링.mp4
13 기초부터 시작하는 MAYA 애니메이션
학습 13 기초부터 시작하는 MAYA 애니메이션
영상 13 기초부터 시작하는 MAYA 애니메이션.mp4
15 Blender로 인테리어 영상 제작하기
학습 15 Blender로 인테리어 영상 제작하기
영상 15 Blender로 인테리어 영상 제작하기.mp4
16 멘토씨리즈 자바
학습 16 멘토씨리즈 자바   완료 콘텐츠
영상 16 멘토씨리즈 자바.mp4
17 스크래치로 공부하는 프로그래밍 기초
학습 17 스크래치로 공부하는 프로그래밍 기초   완료 콘텐츠
영상 17 스크래치로 공부하는 프로그래밍 기초.mp4
20 누구나 쉽게! Git&GitHub
학습 20 누구나 쉽게! Git&GitHub   완료 콘텐츠
영상 20 누구나 쉽게! Git&GitHub.mp4
23 디지털 드로잉 기본기 완전판
학습 23 디지털 드로잉 기본기 완전판
영상 23 디지털 드로잉 기본기 완전판.mp4
24 그림스타일에 딱 맞는 인체 연구
학습 24 그림스타일에 딱 맞는 인체 연구   완료 콘텐츠
영상 24 그림스타일에 딱 맞는 인체 연구.mp4
25 뱀파이어 서바이벌로 배우는 언리얼 C++
학습 25 뱀파이어 서바이벌로 배우는 언리얼 C++
영상 25 뱀파이어 서바이벌로 배우는 언리얼 C++.mp4
26 하나하나 꼼꼼히! 웹툰 드로잉 네 걸음
학습 26 하나하나 꼼꼼히! 웹툰 드로잉 네 걸음   완료 콘텐츠
영상 26 하나하나 꼼꼼히! 웹툰 드로잉 네 걸음.mp4
27 하나하나 꼼꼼히! 웹툰 드로잉 세 걸음
학습 27 하나하나 꼼꼼히! 웹툰 드로잉 세 걸음   완료 콘텐츠
영상 27 하나하나 꼼꼼히! 웹툰 드로잉 세 걸음.mp4
28 하나하나 꼼꼼히! 웹툰 드로잉 두 걸음
학습 28 하나하나 꼼꼼히! 웹툰 드로잉 두 걸음   완료 콘텐츠
영상 28 하나하나 꼼꼼히! 웹툰 드로잉 두 걸음.mp4
29 하나하나 꼼꼼히! 웹툰 드로잉 첫걸음
학습 29 하나하나 꼼꼼히! 웹툰 드로잉 첫걸음
영상 29 하나하나 꼼꼼히! 웹툰 드로잉 첫걸음.mp4
30 쉽고 재밌게 배우는 모션그래픽_애프터이펙트1
학습 30 쉽고 재밌게 배우는 모션그래픽_애프터이펙트1   완료 콘텐츠
영상 30 쉽고 재밌게 배우는 모션그래픽_애프터이펙트1.mp4
31 쉽고 재밌게 배우는 모션그래픽_애프터이펙트2
학습 31 쉽고 재밌게 배우는 모션그래픽_애프터이펙트2   완료 콘텐츠
영상 31 쉽고 재밌게 배우는 모션그래픽_애프터이펙트2.mp4
32 기초부터 심화까지 한 번에 배우는 영상편집_프리미어 프로
학습 32 기초부터 심화까지 한 번에 배우는 영상편집_프리미어 프로   완료 콘텐츠
영상 32 기초부터 심화까지 한 번에 배우는 영상편집_프리미어 프로.mp4
33 웹소설 작가 도전하기
학습 33 웹소설 작가 도전하기
영상 33 웹소설 작가 도전하기.mp4
34 올인원 DBMS!! 설계부터 운영까지!!
학습 34 올인원 DBMS!! 설계부터 운영까지!!
영상 34 올인원 DBMS!! 설계부터 운영까지!!.mp4