from sklearn import datasets
from sklearn.model_selection import train_test_split
加载数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)</pre><p>数据预处理完成后,接下来是选择合适的模型进行训练,对于分类问题,Sklearn提供了多种算法,如逻辑回归(Logistic Regression)、支持向量机(SVM)等,这里我们以逻辑回归为例:</p><pre class="brush:python;toolbar:false">
from sklearn.linear_model import LogisticRegression
初始化模型
model = LogisticRegression()
训练模型
model.fit(X_train, y_train)</pre><p>模型训练完毕后,我们需要对模型的性能进行评估,Sklearn提供了多种评估指标和方法,如准确率(accuracy)、召回率(recall)、F1分数等,这里我们使用准确率作为评估指标:</p><pre class="brush:python;toolbar:false">
from sklearn.metrics import accuracy_score
预测测试集结果
y_pred = model.predict(X_test)
计算准确率
acc = accuracy_score(y_test, y_pred)
print(f'Accuracy: {acc}')</pre><p>Sklearn提供了一个全面而灵活的框架,用于解决各种机器学习问题,通过上述步骤,我们可以看到,从数据预处理到模型选择、训练以及评估,每一步都可以通过Sklearn提供的API简单快捷地完成,无论是初学者还是经验丰富的开发者,都能在这个平台上找到适合自己的工具和方法,正如古人云:“工欲善其事,必先利其器”,掌握Sklearn的使用,无疑会在你的数据科学之旅上助你一臂之力。</p>
有话要说...