博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
推荐系统常用数据集
阅读量:4548 次
发布时间:2019-06-08

本文共 1508 字,大约阅读时间需要 5 分钟。

Book

· 1. Book Crossing

BookCrossing(BX)数据集由Cai-Nicolas花了的4周(2004年8月/ 9月)从Book-Crossing社区中爬取得到的。

· 下载链接:

电子商务

· 2. Amazon

 

该数据集包括自1996年5月至2014年7月,来自亚马逊上的1.428亿产品的评论和metadata。

· 下载链接:

 

· 3. Retailrocket推荐系统数据集

 

该数据集由三个文件组成:一个行为数据集(events.csv),一个属性数据集(item_properties.сsv)和一个类目树数据集(category_tree.сsv)。该数据来自现实世界的电子商务网站。

· 下载链接:

 

音乐

· 4. Amazon Music

 

该数字音乐数据集包含来自亚马逊的评论和元数据

· 下载链接:

 

· 5. Yahoo Music

 

该数据集是一个快照,收集了音乐社区对各种音乐艺术家的偏好。

· 下载链接:

 

· 6. LastFM(Implicit)

 

该数据集收集了Last.fm网站上2千名用户的社交网络、tagging和music artist listening信息。

· 下载链接:

 

· 7. Milion Song Dataset

 

Million Song数据集是一个免费的数据集,提供了一百万条当代流行音乐曲目相关的的audio features和metadata。

· 下载链接:

 

电影

· 8. MovieLens

 

GroupLens Research已经从他们的电影网站收集整理的rating数据集。

· 下载链接:

 

· 9. Yahoo Movies

 

该数据集包含从两个不同来源收集的歌曲的rating数据集。第一个来源是用户在与Yahoo上使用音乐服务是产生的rating数据。

· 下载链接:

 

· 10. CiaoDVD

 

CiaoDVD是2013年12月从网站上抓取的DVD类别数据集。

· 下载链接:

 

·11. FilmTrust

 

FilmTrust是2011年6月从整个FilmTrust网站上抓取的一个小型数据集。

· 下载链接:

 

· 12. Netflix

 

这是Netflix奖竞赛中使用的官方数据集。

· 下载链接:

 

游戏

· 13. Steam Video Games

 

这是一个用户行数据集,包含:user-id,game-title,behavior-name,value。包括“purchase”和“play”数据集。购买了,puchase的值为1,而“play”的值表示用户播放音乐的时长。

· 下载链接:

 

Jokes

· 14. Jester

 

该笑话数据集包含来自73,496个用户,关于100个笑话的410万连续rating数据(-10.00到+10.00)

· 下载链接:

 

餐饮

·15. Chicago Entree

 

该数据集包含用户与Entree Chicago餐厅推荐系统交互的记录数据。

· 下载链接:

 

动漫

·16. 动漫推荐数据库

 

该数据集包含来自12,294个动漫的73,516个用户的用户偏好数据。每个用户都可以将动画添加到已完成的列表中并为其评分,该数据集把这些评级整理起来。

· 下载链接:

 

其他数据集

· GroupLens数据集

 

· 下载链接:

 

· LibRec数据集

 

· 下载链接:

 

· Yahoo Research数据集

 

· 下载链接:

 

· 斯坦福大型网络数据集汇编

 

· 下载链接:

转载于:https://www.cnblogs.com/fjlcoding/p/10056854.html

你可能感兴趣的文章
在Visual Studio中开发一个C语言程序
查看>>
课程总结
查看>>
openstack新建虚机、网络、路由时候对应的ovs网桥的变化
查看>>
linux 编译运行c文件
查看>>
Scrapy的学习和使用
查看>>
7.内部类(一)之详解内部类
查看>>
1.messager消息提示框
查看>>
[PY]进制转换
查看>>
STL系列 list
查看>>
NAT穿透
查看>>
[VC] 枚举ActiveX控件的 CLSID 和 implemented/required CATIDs 的小工具
查看>>
匿名方法和Lambda表达式
查看>>
Spark编译的三种方式
查看>>
京东的核心业务
查看>>
读书笔记(六)--成交
查看>>
Secret Number hdu 2113
查看>>
软件架构(体系结构,Architecture)和软件框架
查看>>
阶梯博弈(没怎么搞懂)
查看>>
python request post请求body中有json数组
查看>>
IDT hook KiTrap03
查看>>