دادههای شما دارای 4 ویژگی هستند:
فرض کنید میخواهیم یک نقطه داده جدید را طبقهبندی کنیم:
-
پیشبینی = آفتابی
-
دما = خنک
-
رطوبت = بالا
-
باد = درست
ما باید پوسترورهای پسین P(Yes|ویژگیها) و P(No|ویژگیها) را محاسبه کنیم و کلاسی را با احتمال بیشتر پیشبینی کنیم.
احتمالات قبلی، بر اساس دادهها هستند:
P(Yes) = 9/14 = 0.64
P(No) = 5/14 = 0.36
احتمالات میتوانند با شمارش رخدادهای هر مقدار ویژگی در هر کلاس محاسبه شوند:
P(Sunny|Yes) = 3/9 = 0.33
P(Cool|Yes) = 2/9 = 0.22
P(High|Yes) = 4/9 = 0.44
P(True|Yes) = 3/9 = 0.33
P(Sunny|No) = 2/5 = 0.4
P(Cool|No) = 1/5 = 0.2
P(High|No) = 1/5 = 0.2
P(True|No) = 1/5 = 0.2
با استفاده از معادله Naive Bayes:
P(Yes|Sunny,Cool,High,True) = (0.33 * 0.22 * 0.44 * 0.33 * 0.64) = 0.0106
P(No|Sunny,Cool,High,True) = (0.4 * 0.2 * 0.2 * 0.2 * 0.36) = 0.00288
از آنجایی که P(Yes|ویژگیها) > P(No|ویژگیها)، این نقطه داده جدید را به عنوان بازی گلف = بله طبقهبندی میکنیم.