调整训练集占数据集的占比.docx
《调整训练集占数据集的占比.docx》由会员分享,可在线阅读,更多相关《调整训练集占数据集的占比.docx(2页珍藏版)》请在课桌文档上搜索。
1、调整训练集占数据集的占比;观时,即训练样本数为7;测试样本数为687;其中AB504,NB190个预测AB409;出错95个(即将AB中的95个错认为NB)预测NB163;出错27个(即将NB中的27个错认为AB)准确度:83.47%* 测试20次随机选取训练样本0.842,0,524,0,742,0,505,0,841,0,896,0.5,0.746,0,516,0.85,0.841,0.846,0.827,0.874,0.875,0.84,0.49,0,507,0.893,0,857平均准确度:74.6%可以明显观察到,在低样本数时,模型稳定性较差,有时选取的训练图片可能毫无代表性”,训练
2、预测结果将在50%附近,基本在乱猜;而有时可能随机选取的样本能够很好的代表整体,训练预测结果将接近90机2%时,即训练样本数为13;测试样本数为687;其中AB499,NB188个预测AB476;出错23个(即将AB中的23个错认为NB)预测NB161;出错27个(即将NB中的27个错认为AB)准确度:90.51%* 测试20次随机选取训练样本0.858,0,908,0,896,0.91,0,897,0,913,0,897,0.87,0,854,0,909,0,909,0,943,0.83,0.896,0.928,0,887,0.906,0.892,0,912,0,899平均准确度:89.57
3、%当训练集样本数为13时,不难发现,仅仅多增加了6个样本,就使得训练的模型稳定性大幅提高,也说明数据集多样性并不复杂,能够用很少的样本“代表”整体,得到较好的结论。5%时,即训练样本数为35;测试样本数为665;其中AB484,NB182个预测AB481;出错3个(即将AB中的3个错认为NB)预测NB149;出错33个(即将NB中的33个错认为AB)准确度:90.62%* 测试20次随机选取训练样本0.96,0,895,0,925,0.866,0.921,0.92,0.907,0.92,0.934,0.937,0,935,0,957,0.921,0.94,0.936,0,904,0.899,0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 调整 训练 数据
链接地址:https://www.desk33.com/p-1101945.html