دسته بندی داده های دیتاست - هفت خط کد انجمن پرسش و پاسخ برنامه نویسی

دسته بندی داده های دیتاست

0 امتیاز

سلام دوستان

می خوام این دیتاست دسته بندی کنم. اما نمی دونم چی کار کنم.

اینجا رو دیدم اما نمی دونم چطور داده ها رو تقسیم بندی کنم(تست و اموزش)

این که ستون ها نام نداره باید چطور بهش دسترسی پیدا کرد.

لطفا راهنمایی کنید.

from sklearn.linear_model.logistic import LogisticRegression
path_csv = Path('newsCorpora.csv').absolute()
data = pd.read_csv(path_csv)
X_train_raw, X_test_raw, y_train, y_test = train_test_split(data.iloc[0],data.iloc[1])
vec = TfidfVectorizer()
X_train = vec.fit_transform(X_train_raw)
classifier = LogisticRegression()
classifier.fit(X_train, y_train)

X_test = vectorizer.transform( ['URGENT! Your Mobile No 1234 was awarded a Prize', 'Hey honey, whats up?'] )
predictions = classifier.predict(X_test)
print(predictions)

 

سوال شده بهمن 9, 1397  بوسیله ی pilapila (امتیاز 232)   14 43 56
ویرایش شده بهمن 9, 1397 بوسیله ی pilapila
الان داده های شما به تست و آموزش دسته بندی شده مشکل کجاست؟
زمانیکه ستون ها نام ندارند از اندیس استفاده کنید.
داده های در هم هست به معنای دیگر id و متن و url و category وهمچنین ناشر می تونه در یک ستون باشه یا چند ستون یعنی جدا شده نیست که بشه راحت دسته بندی کرد من دسته بندی رو به  شکل بالا انجام دادم اما اشتباه هست. به نظر شما چی کار می تونم اجام بدم؟

پاسخ شما

اسم شما برای نمایش (دلخواه):
از ایمیل شما فقط برای ارسال اطلاعات بالا استفاده میشود.
تایید نامه ضد اسپم:

برای جلوگیری از این تایید در آینده, لطفا وارد شده یا ثبت نام کنید.
...