سلام دوستان
می خوام این دیتاست دسته بندی کنم. اما نمی دونم چی کار کنم.
اینجا رو دیدم اما نمی دونم چطور داده ها رو تقسیم بندی کنم(تست و اموزش)
این که ستون ها نام نداره باید چطور بهش دسترسی پیدا کرد.
لطفا راهنمایی کنید.
from sklearn.linear_model.logistic import LogisticRegression
path_csv = Path('newsCorpora.csv').absolute()
data = pd.read_csv(path_csv)
X_train_raw, X_test_raw, y_train, y_test = train_test_split(data.iloc[0],data.iloc[1])
vec = TfidfVectorizer()
X_train = vec.fit_transform(X_train_raw)
classifier = LogisticRegression()
classifier.fit(X_train, y_train)
X_test = vectorizer.transform( ['URGENT! Your Mobile No 1234 was awarded a Prize', 'Hey honey, whats up?'] )
predictions = classifier.predict(X_test)
print(predictions)