1
00:00:00,000 --> 00:00:12,400
안녕하세요 코리아 IT 아카데미 강남성 김영선 강사입니다.
2
00:00:12,400 --> 00:00:17,160
한 번에 이해하는 확률 두 번째 시간 시작할게요.
3
00:00:17,160 --> 00:00:23,760
오늘 배울 내용은 조건부 확률에 대한 내용과 베이지 정리에 대해서 배워보도록 하겠습니다.
4
00:00:23,760 --> 00:00:31,240
이 부분이 재미있는 부분은 아니지만 여러분들이 한 번쯤은 반드시 듣고 넘어가야 되는 부분이기 때문에
5
00:00:31,240 --> 00:00:36,959
집중해서 들어주시길 바랄게요. 먼저 조건부 확률이에요.
6
00:00:36,959 --> 00:00:48,720
조건부 확률은 특정 사건 B가 이미 발생했다는 전제 하에 다른 사건 A가 발생할 가능성을 계산하는 확률을 의미합니다.
7
00:00:48,720 --> 00:00:52,080
즉 어떤 사건이 이미 일어난 상태예요.
8
00:00:52,080 --> 00:00:59,200
그랬을 때 그 정보를 바탕으로 다른 사건이 발생할 확률을 다시 계산하는 것을 의미합니다.
9
00:00:59,200 --> 00:01:11,320
조건부 확률이라는 의미는 확률이라는 것은 모든 가능한 사건이 동일한 조건에서 발생할 가능성을 가정하고 계산이 된다 라고 했었죠.
10
00:01:11,320 --> 00:01:22,599
현실에서는 어떤 사건이 이미 발생했을 때 그 사건이 다른 사건의 가능성에 영향을 줄 수 있다라는 부분입니다.
11
00:01:22,599 --> 00:01:30,519
조건부 확률은 이러한 상황이 바뀐 후에 확률을 계산하는 도구로 봐주시면 되고요.
12
00:01:30,519 --> 00:01:34,959
조건부 확률의 계산 공식은 이것과 같습니다.
13
00:01:34,959 --> 00:01:41,160
한 사건이 발생했을 때 다른 사건이 발생할 가능성을 계산한다 라고 했죠.
14
00:01:41,160 --> 00:01:48,559
그래서 A와 B의 교집합을 B의 사건으로 나눠주는 거예요.
15
00:01:48,559 --> 00:02:02,800
이게 무슨 말이냐, 분자인은 B의 A, B로 쓰게 되면 A와 B가 동시에 발생하는 경우의 확률을 의미해요.
16
00:02:02,800 --> 00:02:07,160
예를 들어서 동전 던지기와 주사위 던지기가 있어요.
17
00:02:07,160 --> 00:02:15,000
동전 던지기에서는 앞면이 나오면서 주사위에서는 6이 나오는 경우의 확률, 이런 경우를 의미하는 거예요.
18
00:02:15,000 --> 00:02:22,119
분모에 있는 P, B라는 것은 B라는 사건이 발생할 확률을 의미합니다.
19
00:02:22,119 --> 00:02:27,039
주사위에서 숫자 6이 나올 확률, 이것을 의미하고요.
20
00:02:27,039 --> 00:02:36,360
조건부 확률은 B라는 조건 하에서 A가 일어나는 경우의 비율을 계산한다고 보시면 됩니다.
21
00:02:36,360 --> 00:02:55,199
제가 문제 하나 드릴게요. 주사위를 두 번을 던질 때 첫 번째 던진 값이 3이고, 두 번째 던진 값이 5일 확률, 즉 첫 번째 던질 것은 3이 나와야 돼요.
22
00:02:55,199 --> 00:03:02,960
두 번째 주사위를 던졌을 때는 5가 나와야 됩니다. 이거의 확률을 한번 계산해 보도록 할게요.
23
00:03:02,960 --> 00:03:15,320
그러기 위해서는 전체 경우의 수를 먼저 알아야겠죠. 저희가 주사위를 두 번 던지니까 한 번 던질 때 나올 수 있는 조합의 수는 몇이죠?
24
00:03:15,320 --> 00:03:28,320
6개의 눈이 있죠? 그렇기 때문에 6이 됩니다. 두 번째 던졌을 때도 6이 되죠. 두 개를 곱해서 36개, 전체 경우는 36개의 조합이 나올 수가 있게 돼요.
25
00:03:28,360 --> 00:03:37,919
조건부 확률을 계산하는 것을 보면 첫 번째 값이 3이고, 두 번째 값이 5인 경우는 단 하나밖에 없죠.
26
00:03:37,919 --> 00:03:54,600
3과 5가 나올 수 있는 경우는 3, 5 단 하나밖에 없기 때문에 두 개가 같이 나올 수 있는 건 전체 조합인 36에서 1, 한 번의 개수가 나올 수가 있습니다.
27
00:03:54,600 --> 00:04:02,320
그럼 첫 번째 값이 3으로 나올 수 있는 경우의 수는요? 두 번째에서는 6번이 나올 수가 있죠.
28
00:04:02,320 --> 00:04:16,880
6개의 눈의 수가 나올 수가 있기 때문에 첫 번째는 3, 두 번째는 1, 첫 번째는 3, 두 번째는 2, 이렇게 해서 첫 번째는 3이고, 두 번째는 6으로 총 6가지가 나올 수가 있어요.
29
00:04:16,880 --> 00:04:29,320
총 6가지가 나온다고 했죠? 그러면 이 6가지가 분자에 들어가고, 분모에는 총 조합 개수 36이 들어가게 돼요.
30
00:04:29,320 --> 00:04:37,320
그러면 6은 36을 6으로 나눌 수 있다. 그러니까 1분의 6이 됩니다.
31
00:04:37,359 --> 00:04:46,000
세 번째로, 즉 A와 B의 교집합을 B가 나올 확률로 나눠준 것.
32
00:04:46,000 --> 00:04:55,040
그렇게 되면 1분의 1을 1분의 6로 나눈 거죠. 이렇게 했을 때 결과는 1분의 6이 나오게 돼요.
33
00:04:55,040 --> 00:05:04,720
즉, 결론을 보면 첫 번째 값이 3일 때, 두 번째 값이 5일 확률은 1분의 6 확률입니다.
34
00:05:04,720 --> 00:05:19,320
퍼센트로 나타내면 대략 16.67%가 나오게 돼요. 조건부 확률의 벤 다이어그램을 사건 A와 사건 B가 있을 때 이런 형태로 그려볼 수가 있고요.
35
00:05:19,320 --> 00:05:28,760
파란색 영역은 사건 B가 발생한 경우를 의미해요. 녹색 영역은 사건 A만 발생한 경우를 의미합니다.
36
00:05:28,760 --> 00:05:36,519
사건 A만 발생한 경우가 무슨 뜻이냐? 사건 A는 이만큼이죠? 원래라면.
37
00:05:36,519 --> 00:05:46,959
여기에서 교집합 부분을 뺀 나머지 부분, 즉 이만큼의 부분이 녹색 영역인 거예요.
38
00:05:46,959 --> 00:05:59,880
사건 A만 발생한 경우를 의미하게 되고요. 중앙에 겹치는 영역 이만큼이죠? 이만큼은 사건 A와 B가 동시에 발생한 경우를 의미합니다.
39
00:05:59,880 --> 00:06:09,359
그러면 최종적으로 조건부 확률은 파란색 영역 안에서 겹치는 영역의 비율을 의미하게 돼요.
40
00:06:09,359 --> 00:06:19,839
파란색 영역은 이만큼을 의미하는 거죠. 여기서 이만큼을 겹치는 영역의 비율을 의미한다고 봐주시면 됩니다.
41
00:06:19,839 --> 00:06:34,119
두 번째로 베이지 정리에 대해서 알아보도록 하겠습니다. 베이지 정리라는 것은 기존 확률에 새로운 정보를 반영해서 확률을 업데이트하는 수학적 도구를 의미해요.
42
00:06:34,119 --> 00:06:44,160
조건부 확률을 계산할 때 매우 강력한 방법으로 새로운 증거가 주어졌을 때 확률을 조정하는 과정을 의미합니다.
43
00:06:44,160 --> 00:06:51,399
베이지 공식 정리를 보기 전에 저희 조건부 확률 공식만 쓰고 넘어가도록 하겠습니다.
44
00:06:51,399 --> 00:07:00,600
B가 발생할 전체 확률 그리고 위에서는 A와 B의 교집합 이렇게 있었죠?
45
00:07:00,600 --> 00:07:09,320
베이지 공식 정리는 먼저 이것을 의미해요. 결국에 알고 싶은 건 사후 확률을 알고 싶은 거예요.
46
00:07:09,320 --> 00:07:16,839
사건 B가 발생한 후에 A가 발생할 확률을 구하는 게 베이지 공식이라고 보시면 됩니다.
47
00:07:16,839 --> 00:07:25,480
P에 B, A 있죠? 이거는 사건 A가 발생했을 때 B가 발생한 확률을 의미해요.
48
00:07:25,480 --> 00:07:36,760
그리고 그 옆에 PA를 곱해 줬죠? PA는 사건 A가 발생할 확률을 의미하고요. 사전 확률이 됩니다.
49
00:07:36,799 --> 00:07:44,279
이 값을 P, B로 나눠주게 되어 사건 B가 발생할 전체 확률로 나눠주게 되는 거죠.
50
00:07:44,279 --> 00:07:50,640
이렇게 해서 사후 확률을 구한다 라고 생각을 해주시면 되고요.
51
00:07:51,399 --> 00:08:02,320
주사위 게임으로 한번 보도록 하겠습니다. 게임에서 주사위가 한번 굴려졌을 때 플레이어는 주사위가 6이 나왔다고 해요.
52
00:08:02,320 --> 00:08:06,839
하지만 플레이어가 항상 정직하게 말하지 않을 수도 있죠?
53
00:08:06,839 --> 00:08:14,519
던졌을 때 실제로는 1이 나왔는데 6이 나왔다고 할 수도 있고요. 3이 나왔는데 6이 나왔다고 말할 수도 있죠.
54
00:08:14,519 --> 00:08:20,480
그런데 6이 나와서 진짜 6이 나왔어 라고 말을 할 수도 있습니다.
55
00:08:20,760 --> 00:08:29,920
그래서 이 확률부터 계산을 합니다. 플레이어가 정직하게 말할 확률 80% 라고 볼게요.
56
00:08:29,920 --> 00:08:45,760
그러면 80%는 비율 0.8 정도가 되겠죠? 플레이어가 정직하게 말할 경우에 실제로 6이 나올 확률이 100% 라고 해 보겠습니다.
57
00:08:46,200 --> 00:08:54,200
그리고 플레이어가 거짓말할 경우 이미의 숫자를 말할 확률은 동일하고
58
00:08:55,200 --> 00:09:01,320
6일 확률을 한번 보면 1분의 1이 되는 거죠.
59
00:09:01,520 --> 00:09:14,080
베이지 정리를 적용해 보면 우리가 알고 싶은 것은 플레이어가 6을 실제로 말했을 때 실제 주사위가 6일 확률이 저희가 알고 싶은 거예요.
60
00:09:14,119 --> 00:09:20,359
그러면 6인 것과 말한 게 같은 것만 알면 되겠죠?
61
00:09:20,359 --> 00:09:27,000
그래서 공식을 적용해 보면 이런 형태로 만들어지게 됩니다.
62
00:09:27,359 --> 00:09:35,840
사전 확률부터 볼게요. 사전 확률, 아까 전에 있던 이 부분이죠. 정직하게 말할 확률.
63
00:09:35,840 --> 00:09:44,280
사전 확률을 봤을 때 정직한 경우는 0.8 이에요. 그리고 거짓말을 하는 경우는 0.2 가 되겠죠.
64
00:09:44,280 --> 00:09:55,400
이거의 총합은 1이 되어야 되니까. 정직한 경우가 1.0이고 거짓말을 한 경우가 1분의 1, 0.1667 이라고 한다면
65
00:09:55,400 --> 00:10:00,400
전체 확률은요. 계산이 들어가게 되면
66
00:10:00,400 --> 00:10:12,000
각각 곱하고 더하고 더하고 결국에 0.83332 라는 값이 나오게 돼요.
67
00:10:12,000 --> 00:10:18,080
자 얘가 전체 확률이 되는 거죠. 이것이 전체 확률이 되는 거고요.
68
00:10:18,080 --> 00:10:27,919
지금 잘 보시면 정직한 경우와 정직한 경우. 사전 확률과 조건부 확률의 정직한 경우를 두 개를 곱해 줬어요.
69
00:10:27,919 --> 00:10:34,880
그리고 더해 주죠. 어떤 값과 어떤 값을. 플레이어가 거짓말을 하는 경우에 사전 확률과
70
00:10:34,880 --> 00:10:41,000
거짓말한 경우에 실제 나온 조건부 확률 두 개를 더해 주게 됩니다.
71
00:10:41,000 --> 00:10:48,960
자 그랬을 때 최종 결과는 0.8333 이 나오게 되고요. 얘가 전체 확률이 되게돼요.
72
00:10:48,960 --> 00:10:57,200
여기까지 이해됐을까요? 네 그러면 이렇게 해서 계산을 할 수 있다는 거 기억을 해주시면 되고요.
73
00:10:57,200 --> 00:11:08,039
결과로 보도록 하겠습니다. 자 결과는 플레이어가 6이라고 말했을 때 실제로 주사위가 6일 확률은 약 96% 가 돼요.
74
00:11:08,039 --> 00:11:15,679
왜 높은 확률이 나왔을까요? 플레이어가 정직하게 말한 확률이 매우 높기 때문입니다.
75
00:11:15,679 --> 00:11:26,760
사전 확률이었죠. 베이징 정류는 이 정보를 반영해서 확률을 업데이트 하기 때문에 확률이 높게 나올 수밖에 없어요.
76
00:11:26,760 --> 00:11:34,280
이 주사위 게임을 그래프로 한번 보도록 하겠습니다. 플레이어가 6이라고 말할 확률이 있죠.
77
00:11:34,280 --> 00:11:43,559
파란색 경우가 정직한 경우에요. 정직한 경우는 80% 가 나오게 됩니다. 0.80으로 나왔죠.
78
00:11:43,559 --> 00:11:51,960
녹색이 거짓말한 경우를 의미하고요. 약 3.33% 가 된다고 하겠습니다.
79
00:11:51,960 --> 00:12:02,640
그러면 그 아래쪽에도 한번 볼게요. 위의 그래프는, 위의 확률이 나온 이 그래프는 플레이어가 6을 말할 확률이었어요.
80
00:12:02,640 --> 00:12:13,320
아래 나온 그래프는 플레이어가 6일 하고 있을 때의 실제 확률입니다. 파란색 이 부분이 실제 6일 확률이구요.
81
00:12:13,320 --> 00:12:24,080
빨간색인 이 부분이 실제 6이 아닐 확률이에요. 실제 6일 확률이 96% 로 높은 비율을 차지하고 있죠.
82
00:12:24,080 --> 00:12:31,960
6이 아닐 확률은 4% 가 나오게 됩니다. 이렇게 해서 그래프로 그려볼 수 있다는 거 확인했죠.
83
00:12:31,960 --> 00:12:41,760
저희 그러면 코드로 한번 확인해 보도록 하겠습니다. 코렉 가주시구요. 여기에는 7강 이라고 넣어 주도록 할게요.
84
00:12:41,760 --> 00:12:53,039
저희 실제 그래프를 확인해 볼 건데 플레이어가 6을 말할 확률과 플레이어가 6이라고 했을 때 실제 확률
85
00:12:53,039 --> 00:13:00,280
아까 ppt 에서 봤던 그 부분을 한번 같이 코드로 작성해 보도록 하겠습니다.
86
00:13:00,280 --> 00:13:05,840
먼저 테스트 코드 하나 추가해 주시구요.
87
00:13:06,039 --> 00:13:24,559
1 베이지 정리라고 작성하겠습니다. 시각화를 할 것이기 때문에 import matplotlib.pyplot as plt 라는 별칭을 넣어주시구요.
88
00:13:24,559 --> 00:13:33,760
먼저 데이터를 정리해 보도록 할게요. 저희 그래프를 하나에서 같이 그려서 보도록 하겠습니다.
89
00:13:33,760 --> 00:13:40,599
그래프 1이 될 거구요. 첫번째 그래프 6 이라고 말할 확률이에요.
90
00:13:41,280 --> 00:13:50,320
플레이어가 6 이라고 말할 확률. 카테고리를 설정해 줄 거구요. 카테고리 약자로 카테라고만 쓰겠습니다.
91
00:13:50,320 --> 00:14:00,000
여기에 정직한 경우와 리스트 타입으로 거짓말한 경우 넣어줄게요.
92
00:14:00,159 --> 00:14:14,960
그리고 values라는 변수의 리스트 변수를 만들 거구요. 0.8 이라는 값과 0.0333 이라는 값을 넣어줄게요.
93
00:14:14,960 --> 00:14:24,159
자 이게 바로 정직한 경우와 거짓말한 경우의 확률이 되요.
94
00:14:25,119 --> 00:14:35,039
자 그러면 이제 그래프 1에서 동일하게 그려볼 거구요. 6 이라고 말할 확률 써줄게요.
95
00:14:39,159 --> 00:14:48,000
자 여기에 먼저 그린 그려줄 도화지 만들어 줄게요. figure 라는 메소드 사용해서 피그 사이즈는
96
00:14:48,000 --> 00:15:00,719
8,6 정도의 사이즈로 설정을 해 줄 거구요. PLT점, 막대 그래프 그릴거죠? PLT점 바라는 메소드에 카테와 values를 각각 넣어줄게요.
97
00:15:00,719 --> 00:15:06,000
자 그리고 엣지 컬러는
98
00:15:06,000 --> 00:15:10,080
블랙으로 설정해 주도록 하겠습니다.
99
00:15:11,080 --> 00:15:21,400
자 PLT점 타이틀로 구분해서 보여주는게 조금 더 시각적으로 확인하기가 쉽겠죠? 그래서 타이틀을 설정해 줄게요.
100
00:15:21,400 --> 00:15:25,440
플레이어가 6을 말할 확률.
101
00:15:26,039 --> 00:15:33,520
자 이때 PLT점 Y라벨로 확률이라고 해 줄 거구요.
102
00:15:33,840 --> 00:15:44,000
자 여기에는 Y축의 범위도 설정을 해 주도록 하겠습니다. 그 이유가 0부터 1 사이의 값으로 나오게 되겠죠?
103
00:15:44,000 --> 00:15:54,799
그래서 Y림이라는 PLT점, Y림이라는거에 0,1로 Y축의 범위를 설정해 줄게요.
104
00:15:55,799 --> 00:16:02,880
자 이제 반복문을 돌려 줄 거구요. I와 V라는 변수를 만들어 줄 거구요.
105
00:16:02,880 --> 00:16:08,880
Enumerate를 사용해 줄게요. 여기에는 values를 넣어 주도록 하겠습니다.
106
00:16:08,880 --> 00:16:19,599
자 PLT점 텍스트로 I,V의 막대 그래프의 간격을 조금 벌려 줘야 되기 때문에 0.0 이라고 해 줄 거구요.
107
00:16:19,599 --> 00:16:29,760
자 여기서 F스트링 써 주도록 할게요. 여기에서는 V콜론.EF라고 해 줄 거구요.
108
00:16:29,760 --> 00:16:36,599
자 그리고 허도 설정해 주도록 하겠습니다. 하의는 센터라고 설정해 줄게요.
109
00:16:36,599 --> 00:16:47,599
자 이 폰트 사이즈도 조금 키워 주도록 하겠습니다. 폰트 사이즈는 12. 자 이 말은 막대 위에 확률을 표시하는 부분이에요.
110
00:16:47,599 --> 00:16:58,039
그리고 아래쪽에서 품은 밖에서 PLT점 쇼로 실행해 보시면 카테라고 제가 카테를 2로 썼죠.
111
00:16:58,039 --> 00:17:05,359
네 카테라고 써 주시구요. 이렇게 해서 확인해 보면 그래프는 잘 나오는데 한글이 깨져서 나오죠.
112
00:17:05,359 --> 00:17:16,800
자 지난 시간에 배웠습니다. 한글 깨짐 방지하는 거. 자 위쪽에다가 코드셀 하나 추가하고 한글 깨짐 방지 넣어 주도록 할게요.
113
00:17:16,800 --> 00:17:34,959
맵플로리베 파인 플로스로 에스 PLT는 수두 APT 계세 인스톨 마이너스 와이 폰트 나눔 이라고 해서 나눔바 나눔 폰트를 설치해 주고요.
114
00:17:34,959 --> 00:17:53,439
수두 FC는 캐시 한칸 띄고 마이너스 FV 그리고 느낌표 아래 물결에 캐시에 맵플로리베 마이너스 RF 자 예 실행해 주시구요.
115
00:17:53,439 --> 00:18:06,739
그리고 런타임에서 세션 다시 시작 예 눌러 주신 다음에 아래쪽에 PLT점 RC 넣어서 다시 한번 실행시켜 주셔야 되죠.
116
00:18:06,739 --> 00:18:36,699
세션 다시 시작 예. 다시 시작 되면 PLT점 RC에 폰트 그리고 패밀리 값에 패밀리에는 나눔 바른 고직으로 설정해 주시면 되요.
117
00:18:36,699 --> 00:18:48,380
실행하게 되면 설치가 되는 거 확인할 수가 있구요. 설치가 끝나고 나면 아래 그래프 다시 한번 실행해 줄게요.
118
00:18:48,380 --> 00:18:57,540
그러면 오류가 나지 않고 제대로 깨지지 않고 한글이 나오는 거 확인할 수가 있죠. 바로 하나 더 만들어 보도록 하겠습니다.
119
00:18:57,540 --> 00:19:10,060
자 이번에는 실제 주사위가 6일 확률을 구해야겠죠. 자 데이터부터 만들어 줄게요. 데이터 정리해 줄 거구요. 그래프 2로 가겠습니다.
120
00:19:10,060 --> 00:19:15,219
실제 주사위가 6일 확률
121
00:19:16,180 --> 00:19:31,260
저희 파이널 카테 라는 리스트 변수에 만들어 줄게요. 여기에는 실제 6일 확률과 실제 6일 아닐 확률을 넣어 줄 거구요.
122
00:19:31,260 --> 00:19:44,859
파이널 벨류즈에 0.96 이라는 값과 0.04라는 값을 넣어 줄게요.
123
00:19:44,859 --> 00:20:00,060
이 말뜻은 6세이드6 이라고 쓴 것과 그리고 피해 낮 6이 아닐 확률이죠.
124
00:20:00,060 --> 00:20:07,699
세이드 6으로 쓴 것과 이거 두 개를 의미한다라고 보시면 됩니다.
125
00:20:07,699 --> 00:20:17,060
자 그러면 이제 그래프를 그려주면 되겠네요. 그래프 두 번째 실제 주사위가 6일 확률이죠.
126
00:20:17,819 --> 00:20:27,060
자 이것도 영역부터 설정해 주도록 하겠습니다. 피규어의 피그 사이즈 넣어 줄 거구요.
127
00:20:27,060 --> 00:20:32,500
자 피그 사이즈는 동일하게 갈게요. 8,6으로
128
00:20:33,140 --> 00:20:47,099
ph.var 라는 메소드에 파이널 카테 라는 리스트 넣어 주시고요. 그리고 파이널 벨류즈 라는 리스트 두 개 넣어 주시면 되겠죠.
129
00:20:47,099 --> 00:20:54,500
자 여기에는 엣지 컬러에 블랙으로 설정해 주도록 하겠습니다.
130
00:20:54,500 --> 00:21:06,699
자 이제 타이틀 설정해 줄 거구요. 플레이어가 6이라고 했을 때 실제 확률 확인해 볼게요.
131
00:21:06,699 --> 00:21:17,140
plt.y라벨에는 확률이라는 값을 넣어 주고요. 그리고 이것도 확률이니까 0부터 1 사이에 갑시죠.
132
00:21:17,140 --> 00:21:24,339
자 plt.y라는 메소드 사용해서 0,1 이라고 넣어 줄게요.
133
00:21:24,339 --> 00:21:31,300
이것 또한 y축의 범위를 설정한 부분입니다. 자 여기도 반복문 돌려 줄 거구요.
134
00:21:31,300 --> 00:21:37,540
i,v라는 두 개의 변수, enumerate라는 함수를 써서
135
00:21:37,540 --> 00:21:44,939
final.var.values 값을 넣어 주시면 되겠네요.
136
00:21:44,939 --> 00:21:55,939
자 이제 plt.txt라는 메소드에 i,v 플러스 0.02 그리고 f 스트링으로 사용해 줄게요.
137
00:21:55,939 --> 00:22:04,540
v,f 실수로 나오게 할 거구요. 자 여기에는 하라는 값에 센터 넣어 주도록 할게요.
138
00:22:04,540 --> 00:22:11,979
센터에 출력되도록 그리고 폰트 사이즈 동일하게 12 폰트로 넣어 주도록 하겠습니다.
139
00:22:11,979 --> 00:22:22,260
자 이 부분이 막대위의 확률을 표시하는 부분이다 라고 했어요. 자 마지막에 이제 plt.show로 출력해 보면
140
00:22:22,260 --> 00:22:32,219
두 개의 그래프가 나타나는 거 확인할 수가 있죠. 실제 6일 확률과 6일 안일 확률 각각 나오는 걸 확인할 수가 있습니다.
141
00:22:32,219 --> 00:22:41,060
자 이렇게 해서 저희가 ppt에서 봤던 이 그래프 그대로 그려보았어요. 여러분들 코드 다시 한번 꼭 확인해 주시구요.
142
00:22:41,060 --> 00:22:49,900
그래프 부분은 저희 그래프 그려보는 시간 따로 있으니까 그 수업 때 좀 더 집중해서 설명 드리도록 하겠습니다.
143
00:22:49,900 --> 00:22:57,459
간단하게 복습하고 오늘 수업 마치도록 하겠습니다. 자 첫번째로 조건부 확률에 대해서 배웠죠?
144
00:22:57,459 --> 00:23:06,939
조건부 확률이라는 것은 어떤 사건이 이미 일어났을 때 그 정보를 바탕으로 다른 사건이 다시 발생할 확률을 계산하는 것을
145
00:23:06,939 --> 00:23:16,859
의미했구요. 자 두번째로 조건부 확률에서 b라는 조건화에서 a가 일어나는 경우의 비율을
146
00:23:16,859 --> 00:23:26,939
계산한다라고 했습니다. 저희가 배웠던 거 베이즈 정리에 대해서 배웠죠? 기존 확률에 새로운 정보를 반영해서 확률을 업데이트하는
147
00:23:26,939 --> 00:23:38,540
수학적 도구라고 했구요. 조건부 확률을 계산할 때 매우 강력한 방법으로 새로운 증거가 주어졌을 때 확률을 조정하는 과정이다 라고 했습니다.
148
00:23:38,540 --> 00:23:50,900
여러분들 오늘 배웠던 내용, 저희 코드 작성했던 것까지 다시 한번 잘 복습해 주시구요. 저희 수업은 여기서 마치도록 하고 다음 강의에서 뵙겠습니다.
149
00:23:50,900 --> 00:23:54,020
오늘도 고생하셨습니다.
04_파이썬으로 배우는 데이터 분석 기초
조건부 확률의 개념
조건부 확률: 특정 사건 B가 이미 발생했다는 전제 하에, 다른 사건 A가 발생할 가능성을 의미
기존 확률은 모든 사건이 동일 조건에서 발생한다고 가정하나, 현실에서는 이미 발생한 사건이 다른 사건의 가능성에 영향을 줌
조건이 주어진 뒤(상황이 바뀐 뒤)의 새로운 확률을 계산하는 도구
기본 공식: \( P(A \mid B) = \dfrac{P(A \cap B)}{P(B)} \)
\(P(A \cap B)\): A와 B가 동시에 발생하는 확률, \(P(B)\): B가 발생하는 확률
벤 다이어그램 해석: B 영역 전체 중에서 A와 B가 겹치는 교집합 영역의 비율이 \(P(A \mid B)\)
조건부 확률 예시: 주사위 두 번 던지기
상황: 주사위를 두 번 던질 때
사건 A: 두 번째 던진 값이 5
사건 B: 첫 번째 던진 값이 3
전체 경우의 수: 각 6가지 눈 → \(6 \times 6 = 36\)
\(P(A \cap B)\): (3,5) 한 가지 경우 → \(\dfrac{1}{36}\)
\(P(B)\): 첫 번째가 3인 경우 (3,1)~(3,6) → 6가지 → \(\dfrac{6}{36} = \dfrac{1}{6}\)