GridSearchCV.best_score not same as cross_val_score(GridSearchCV.best_estimator_)(GridSearchCV.Best_Score不同于CROSS_VAL_Score(GridSearchCV.Best_Estiator_))
问题描述
考虑以下网格搜索:
grid = GridSearchCV(clf, parameters, n_jobs =-1, iid=True, cv =5)
grid_fit = grid.fit(X_train1, y_train1)
根据SkLearning的资源,grid_fit.best_score_
返回Best_Estiator的交叉验证的平均分数。
对我来说,这意味着:
cross_val_score(grid_fit.best_estimator_, X_train1, y_train1, cv=5)
应与:
完全相同grid_fit.best_score_
。
然而,我得到了这两个数字之间的10%的差异。我错过了什么?
我正在对专有数据使用网格搜索,所以我希望有人在过去遇到过类似的东西,并且可以在没有完全可重现的示例的情况下指导我。如果它不够清楚,我会试着用虹膜数据集重现这一点。
推荐答案
当向GridSearchCV(..., cv=int_number)
参数传递整数时,StratifiedKFold
将用于交叉验证拆分。因此,数据集将被StratifiedKFold
随机拆分。这可能会影响准确度,从而影响最佳分数。
这篇关于GridSearchCV.Best_Score不同于CROSS_VAL_Score(GridSearchCV.Best_Estiator_)的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:GridSearchCV.Best_Score不同于CROSS_VAL_Score(GridSearchCV.


基础教程推荐
- GridSearchCV.Best_Score不同于CROSS_VAL_Score(GridSearchCV. 2022-09-21
- Socket.recv为空,但结果显示在Maya中 2022-09-21
- 跟在带量词的前瞻后面有什么作用? 2022-09-22
- 使用pyinstaller后,Python应用程序无法运行,但未显 2022-09-21
- 当按下按钮时,将动态创建的按钮信息传递给函 2022-09-21
- 在VBA中调用python代码:权限错误 2022-09-22
- 使用Python访问已在运行的进程 2022-09-21
- H5py:如何在HDF5组和数据集上使用key()循环 2022-09-21
- IBM Watson SpechtoTextV1错误-Python 2022-09-22
- 多索引数据帧删除每个组具有最大值的行 2022-09-22