- 第四章:分类
第四章:分类
原文:http://guidetodatamining.com/chapter4
在上几章中我们使用用户对物品的评价来进行推荐,这一章我们将使用物品本身的特征来进行推荐。这也是潘多拉音乐站所使用的方法。
内容:
- 潘多拉推荐系统简介
- 特征值选择的重要性
- 示例:音乐特征值和邻域算法
- 数据标准化
- 修正的标准分数
- Python代码:音乐,特征,以及简单的邻域算法实现
- 一个和体育相关的示例
- 特征值抽取方式一览
数据集:
- athletesTrainingSet.txt
- athletesTestSet.txt
- irisTrainingSet.data
- irisTestSet.data
- mpgTrainingSet.txt
- mpgTestSet.txt