Written by
in
ข้อมูล Iris Dataset มักจะใช้ในการเริ่มต้นศึกษาการใช้งาน เครื่องมือทาง Data Science โดยเฉพาะ Classification เพราะไม่ซับซ้อน มี 4 ฟิลด์ ที่ใช้เป็น Features และมี 1 ฟิลด์ ที่จะเป็น Class (มี 3 Categories)
import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline
iris = pd.read_csv('../input/iris.data')
sns.pairplot(iris, hue='species')
หรือ จะดูเป็น scatterplot
plt.scatter(iris['sepal_length'], iris['sepal_width'], marker='.', color='r') plt.xlabel('Sepal Length') plt.ylabel('Sepal Width')
from sklearn.model_selection import train_test_split X = iris.drop(['species'], axis=1) Y = iris['species'] X_train, X_test, y_train, y_test = train_test_split(X,Y, test_size=0.3)
from sklearn.model_selection import train_test_split
X = iris.drop(['species'], axis=1)
Y = iris['species']
X_train, X_test, y_train, y_test = train_test_split(X,Y, test_size=0.3)
from sklearn.linear_model import LogisticRegression model = LogisticRegression() model.fit(X_train, y_train)
prediction = model.predict(X_test) from sklearn.metrics import confusion_matrix, classification_report, accuracy_score
ขั้นตอนไม่ยากครับ ส่วนว่าเราจะเลือกใช้ Model ไหน ทำอะไร อันนี้ต้องมาดูรายละเอียดกันต่อครับ
Your email address will not be published. Required fields are marked *
Comment *
Name *
Email *
Website
Save my name, email, and website in this browser for the next time I comment.
Δ
Leave a Reply