پیاده سازی و تست درخت تصمیم در پایتون - هفت خط کد انجمن پرسش و پاسخ برنامه نویسی

پیاده سازی و تست درخت تصمیم در پایتون

0 امتیاز
سلام دوستان

سایت زیر یک نوع درخت تصمیم در پایتون پیاده کرده. می خواستم بدونم y چی هست؟ و چطور میشه تستش کرد؟

http://gabrielelanaro.github.io/blog/2016/03/03/decision-trees.html

در پایتون پیاده سازیش کردم اما نمی دونم چطور تستش کنم!!

لطفا کمک کنید
سوال شده آذر 1, 1397  بوسیله ی pilapila (امتیاز 232)   14 43 56

1 پاسخ

+1 امتیاز
 
بهترین پاسخ
در پیاده‌سازی درخت تصمیم در وب‌سایتی که ارائه کرده‌اید، «y» نشان‌دهنده متغیر هدف یا برچسب کلاسی است که درخت تصمیم سعی در پیش‌بینی آن دارد. در مثال ارائه شده در وب سایت، «y» یک متغیر باینری است که مقادیر 0 یا 1 را می گیرد و نشان می دهد که آیا مسافر کشتی تایتانیک زنده مانده است یا خیر.
 
برای آزمایش درخت تصمیم، می توانید از مجموعه ای جداگانه از داده ها استفاده کنید که مدل قبلاً ندیده است. این معمولاً به عنوان یک مجموعه اعتبار سنجی یا یک مجموعه آزمایشی نامیده می شود. شما می توانید از این مجموعه داده برای ارزیابی عملکرد درخت تصمیم با مقایسه مقادیر پیش بینی شده از مدل با مقادیر واقعی در مجموعه تست استفاده کنید.
 
در اینجا نمونه ای از نحوه آزمایش درخت تصمیم پیاده سازی شده در وب سایت آورده شده است:
 
1. داده های آزمون را آماده کنید: یک مجموعه داده با فرمت مشابه با داده های آموزشی مورد استفاده برای ساخت درخت تصمیم، اما با مشاهدات متفاوت آماده کنید.
 
2. بارگذاری درخت تصمیم: مدل درخت تصمیم را که آموزش داده اید با استفاده از داده های آموزشی بارگذاری کنید.
 
3. پیش بینی کنید: از تابع «predict()» مدل درخت تصمیم برای پیش بینی داده های آزمون استفاده کنید.
 
4. ارزیابی عملکرد: برای ارزیابی عملکرد درخت تصمیم، مقادیر پیش بینی شده را با مقادیر واقعی در مجموعه تست مقایسه کنید. برای ارزیابی عملکرد می توانید از معیارهایی مانند دقت، دقت، فراخوانی یا امتیاز F1 استفاده کنید.
 
در اینجا چند کد نمونه برای آزمایش درخت تصمیم آورده شده است:
 
# Load necessary libraries
import pandas as pd
fromsklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# Load the test data
test_data = pd.read_csv('test_data.csv')

# Load the decision tree model
tree = DecisionTreeClassifier()
tree.load('decision_tree_model.pkl')

# Make predictions on the test data
X_test = test_data.drop('y', axis=1)
y_test = test_data['y']
y_pred = tree.predict(X_test)

# Evaluate the performance of the decision tree
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)

 

 
 
در این کد مثال، داده‌های آزمایشی را از یک فایل CSV بارگیری می‌کنیم، مدل درخت تصمیم را که در یک فایل ذخیره شده است بارگذاری می‌کنیم، با استفاده از تابع «predict()» مدل درخت تصمیم، پیش‌بینی‌هایی را روی داده‌های آزمایشی انجام می‌دهیم و در نهایت عملکرد درخت تصمیم را با مقایسه مقادیر پیش‌بینی‌شده با مقادیر واقعی در مجموعه تست با استفاده از تابع «accuracy_score()» از scikit-learn ارزیابی کنید.
پاسخ داده شده خرداد 2, 1402 بوسیله ی عباس مولایی (امتیاز 2,754)   1 5 13
انتخاب شد شهریور 8, 1402 بوسیله ی farnoosh
...