• 第四章:分类

    第四章:分类

    原文:http://guidetodatamining.com/chapter4

    在上几章中我们使用用户对物品的评价来进行推荐,这一章我们将使用物品本身的特征来进行推荐。这也是潘多拉音乐站所使用的方法。

    内容:

    • 潘多拉推荐系统简介
    • 特征值选择的重要性
    • 示例:音乐特征值和邻域算法
    • 数据标准化
    • 修正的标准分数
    • Python代码:音乐,特征,以及简单的邻域算法实现
    • 一个和体育相关的示例
    • 特征值抽取方式一览

    数据集:

    • athletesTrainingSet.txt
    • athletesTestSet.txt
    • irisTrainingSet.data
    • irisTestSet.data
    • mpgTrainingSet.txt
    • mpgTestSet.txt