• 第三章:隐式评价和基于物品的过滤算法

    第三章:隐式评价和基于物品的过滤算法

    原文:http://guidetodatamining.com/chapter3/

    本章会从用户的评价类型开始讨论,包括显式评价(赞一下、踩一脚、五星评价等等)和隐式评价(比如在亚马逊上购买了MP3,我们可以认为他喜欢这个产品)。

    内容:

    • 显式评价
    • 隐式评价
    • 哪种评价方式更准确?
    • 基于用户的协同过滤
    • 基于物品的协同过滤
    • 修正的余弦相似度
    • Slope One算法
    • Slope One的Python实现
    • MovieLens数据

    第二章中我们学习了协同过滤和推荐系统的基本知识,其中讲述的算法是比较通用的,可以适用于多种数据集。

    用户使用5到10分的标尺来对不同的物品进行打分,通过计算得到相似的用户。但是,也有迹象表明用户通常不会有效地使用这种度量方式,而更倾向于给出极好或极差的评价,这种做法会使推荐结果变得不可用。

    这一章我们将继续探讨这个问题,尝试使用高效的方法给出更精确的推荐。