使用传统视觉方法(视觉词袋模型)完成图像分类
提取sift局部特征,进行KMeans聚类以获取视觉词汇(visual words),使用每个图像包含的视觉词汇的统计直方图特征训练SVM。
每个类别取前150个图像作为训练集,剩余的用于验证
- 增加特征提取器的
nOctiveLayers
有助于提取更丰富的局部特征表示,但代价是计算量也提升了,实验中取值为5 - KMeans聚类簇数
n_clusters
,也就是词汇表的大小,其数量越大可以提取更加细粒度和丰富的图像表示,也有助于提高准确率 - SVM模型的kernel,使用rbf径向基函数效果最佳
- SVM模型的C值:这里取10.0,也还不错
以上模型参数下,模型准确率可以达到60%