博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
第三章:推荐系统冷启动与CB
阅读量:6117 次
发布时间:2019-06-21

本文共 815 字,大约阅读时间需要 2 分钟。

3.1冷启动问题简介:

冷启动问题(cold start)主要分三类:
•     用户冷启动
•     物品冷启动
•     系统冷启动
参考解决方案:
•     推热门
•     利用用户的信息。(如:性别、年龄、地域等)
•     利用登录帐号的社交网络信息
•     要求新用户登录时做一些反馈
3.2利用用户注册信息
下面介绍一种最简单的,基于用户信息的推荐算法。其核心问题就是计算每种特征的用户喜欢的物品。 也就是说,对于每种特征f, 计算具有这种特征的用户对各个物品的喜欢程度p(f,i)
p(f,i)可以简单定义为物品i在具有f的特征的用户中的热门程度:
N(i)是喜欢物品i的用户集合,U(f)表示具有特征f的用户集合。
可以看出具有比较高的N(i)就很可能有比较高的p(f,i), 所以推出的结果很可能就是热门结果。因此我们可以将p(f,i)定义为喜欢物品i的用户中具有特征f的比例:
在数据集做实验Last.fm
代码待写:
3.4 利用物品的内容信息
对于user-cf 来说,物品冷启动问题并不非常敏感。因为很多网站,给用户的内容不止有基于推荐的。
对于item-cf, 物品冷启动必须频繁更新物品相似度表,时间复杂度高。
基于物品内容的模型,没有冷启动问题,可适当解决冷启动。一般来说,物品内容可以通过向量空间模型(vector space model)表示。该模型会将物品表示成一个关键词向量。对于文本,可能会用到自然预言处理里面的分词技术。
向量空间模型在长文本可能会取得比较好的效果。(短文本不行,可以考虑word2vec,有待学习)
话题模型(Topic model)
代表性的LDA. LDA有三种元素,文档,话题,词语。每篇文档都会表现为词的集合,称为bag of words. 每个词在一篇文章中属于一个话题。
有待学习。。。。

转载于:https://www.cnblogs.com/Dzhouqi/p/3979893.html

你可能感兴趣的文章
SQL Server表分区详解
查看>>
使用FMDB最新v2.3版本教程
查看>>
SSIS从理论到实战,再到应用(3)----SSIS包的变量,约束,常用容器
查看>>
STM32启动过程--启动文件--分析
查看>>
垂死挣扎还是涅槃重生 -- Delphi XE5 公布会归来感想
查看>>
淘宝的几个架构图
查看>>
Android扩展 - 拍照篇(Camera)
查看>>
JAVA数组的定义及用法
查看>>
充分利用HTML标签元素 – 简单的xtyle前端框架
查看>>
设计模式(十一):FACADE外观模式 -- 结构型模式
查看>>
iOS xcodebuile 自动编译打包ipa
查看>>
程序员眼中的 SQL Server-执行计划教会我如何创建索引?
查看>>
【BZOJ】1624: [Usaco2008 Open] Clear And Present Danger 寻宝之路(floyd)
查看>>
cmake总结
查看>>
数据加密插件
查看>>
linux后台运行程序
查看>>
win7 vs2012/2013 编译boost 1.55
查看>>
IIS7如何显示详细错误信息
查看>>
ViewPager切换动画PageTransformer使用
查看>>
coco2d-x 基于视口的地图设计
查看>>