训练集
用来训练,构建模型
验证集
在模型训练阶段,用来测试模型的好坏
测试集
等模型训练好后,用来评估模型的好坏
监督学习
有标签的数据
无监督学习
没有标签的数据
半监督学习
有监督学习、无监督学习相结合的一种学习形式,用来解决一小部分带标签的数据、一大部分无标签的数据进行训练和分类的问题
利用
回归
预测
分类
数据带有标签,属于有监督学习
1、图像识别
2、垃圾邮件的辨认
3、文本分类
聚类
数据无标签,属于无监督学习
1、回归:预测数据为连续型数值
2、分类:预测数据为类别型数据,并且类别已知
3、聚类:预测数据为类别型数据,并且类别未知