در پیادهسازی درخت تصمیم در وبسایتی که ارائه کردهاید، «y» نشاندهنده متغیر هدف یا برچسب کلاسی است که درخت تصمیم سعی در پیشبینی آن دارد. در مثال ارائه شده در وب سایت، «y» یک متغیر باینری است که مقادیر 0 یا 1 را می گیرد و نشان می دهد که آیا مسافر کشتی تایتانیک زنده مانده است یا خیر.
برای آزمایش درخت تصمیم، می توانید از مجموعه ای جداگانه از داده ها استفاده کنید که مدل قبلاً ندیده است. این معمولاً به عنوان یک مجموعه اعتبار سنجی یا یک مجموعه آزمایشی نامیده می شود. شما می توانید از این مجموعه داده برای ارزیابی عملکرد درخت تصمیم با مقایسه مقادیر پیش بینی شده از مدل با مقادیر واقعی در مجموعه تست استفاده کنید.
در اینجا نمونه ای از نحوه آزمایش درخت تصمیم پیاده سازی شده در وب سایت آورده شده است:
1. داده های آزمون را آماده کنید: یک مجموعه داده با فرمت مشابه با داده های آموزشی مورد استفاده برای ساخت درخت تصمیم، اما با مشاهدات متفاوت آماده کنید.
2. بارگذاری درخت تصمیم: مدل درخت تصمیم را که آموزش داده اید با استفاده از داده های آموزشی بارگذاری کنید.
3. پیش بینی کنید: از تابع «predict()» مدل درخت تصمیم برای پیش بینی داده های آزمون استفاده کنید.
4. ارزیابی عملکرد: برای ارزیابی عملکرد درخت تصمیم، مقادیر پیش بینی شده را با مقادیر واقعی در مجموعه تست مقایسه کنید. برای ارزیابی عملکرد می توانید از معیارهایی مانند دقت، دقت، فراخوانی یا امتیاز F1 استفاده کنید.
در اینجا چند کد نمونه برای آزمایش درخت تصمیم آورده شده است:
# Load necessary libraries
import pandas as pd
fromsklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# Load the test data
test_data = pd.read_csv('test_data.csv')
# Load the decision tree model
tree = DecisionTreeClassifier()
tree.load('decision_tree_model.pkl')
# Make predictions on the test data
X_test = test_data.drop('y', axis=1)
y_test = test_data['y']
y_pred = tree.predict(X_test)
# Evaluate the performance of the decision tree
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
در این کد مثال، دادههای آزمایشی را از یک فایل CSV بارگیری میکنیم، مدل درخت تصمیم را که در یک فایل ذخیره شده است بارگذاری میکنیم، با استفاده از تابع «predict()» مدل درخت تصمیم، پیشبینیهایی را روی دادههای آزمایشی انجام میدهیم و در نهایت عملکرد درخت تصمیم را با مقایسه مقادیر پیشبینیشده با مقادیر واقعی در مجموعه تست با استفاده از تابع «accuracy_score()» از scikit-learn ارزیابی کنید.