三种方法实现手写数字识别（基于ics.ucioptdigits数据集）_随笔

三种方法实现手写数字识别（基于ics.uci/optdigits数据集）手写数字识别分别使用三种方法：

①朴素贝叶斯
②KNN
③SVM

数据集：
https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/

实验源码：
https://download.csdn.net/download/qq_46167911/60266812

实验步骤

核心代码及解释

数据读取以及数据预处理，统一使用get_data函数

模型评价：
评价时统一使用 confusion_matrix 来查看模型预测的结果

（一）朴素贝叶斯
（分别采用了调包的MultinomialNB，以及自行编写实现的朴素贝叶斯模型）

①：调包的MultinomialNB：

实验结果：

②自行编写实现的朴素贝叶斯模型
模型训练：

模型预测：

实验结果：

分析：
①使用sklearn库中的朴素贝叶斯模型明显比自行编写的模型要快得多
②估计是使用sklearn库模型参数设置的问题，使得虽然调用sklearn库程序运行快，但是准确率却有所下降

（二）KNN
（分别使用调用sklearn中的KNeighborsClassifier，以及自行编写实现的KNN模型进行实验）
①调包的KNeighborsClassifier

实验结果：

②自行编写实现的KNN模型

实验结果：

循环训练预测，选着最好的K 和距离计算方式
最终得最好的K为 1 ，距离计算方式选为 cosine

分析：
①使用sklearn中的KNN包训练，所需时间也是明显少于自行编写的KNN代码，结合两个自行编写的模型（朴素贝叶斯和KNN）得，进行模型训练和预测时，尽量使用sklearn库，可以极大提高训练效率
②KNN模型的难度在于寻找最适合的K，需要通过多次反复训练求得
③KNN中的距离计算方式有多种，同样需要多次训练对比，方可选取最好的

（三）SVM

实验结果：

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5659963.html

三种方法实现手写数字识别（基于ics.ucioptdigits数据集）

发表评论

评论列表（0条）