博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[转] 数据挖掘常见数据集
阅读量:6809 次
发布时间:2019-06-26

本文共 507 字,大约阅读时间需要 1 分钟。

原文网址:

1. Movielens 电影评分数据

    基本数据描述:包括以下三个数据集:

    a.943个用户对1682个电影的10万条评分
    b.6040个用户对3900个电影的1百万条评分
    c.71567个用户对10681个电影的1千万条评分
    

2. Book-Crossing 书籍评分数据

    基本数据描述:包含了278,858个用户对271,379本书籍的1,149,780条评分。该数据集由Cai-Nicolas Ziegler 在2004年8-9月用4周的时间从Book-Crossing社区用网络爬出。

    

3. Jester Joke Data Set 笑话评分集合 

    来自UC Berkeley的Ken Goldberg发布的一个推荐系统使用的数据集。包含关于100个笑话的73,496名用户评分的410万条连续评分。

    

4. Netflix 数据集

    也是电影评分数据集,480,189 个用户,17,770 部电影,100,480,507 条评分记录。与它相比,MovieLens 数据集少了 2 个数量级。它的位置相信会逐渐被 Netflix 数据所替代,这是时代进步的必然结果。

 说明:以上四个均为用户评分数据

转载地址:http://uvtwl.baihongyu.com/

你可能感兴趣的文章
企业如何培养新型员工队伍
查看>>
一道笔试题
查看>>
自定义一个序列化表单的方法2+提示语
查看>>
C#正则表达式获取html标签之间的内容
查看>>
Spring4新特性——泛型限定式依赖注入
查看>>
Tomcat(一):基础配置详解
查看>>
网页后门危害大 网站安全狗帮助查杀
查看>>
Docker存储驱动之总览
查看>>
java获取当前系统时间
查看>>
Hibernate上路_18-Hibernate查询方式
查看>>
Linux vi 命令大全
查看>>
使用border制作的css三角形
查看>>
【转帖】Java并发编程:volatile关键字解析
查看>>
Tomcat 下面使用软连接指向真实的上传文件夹
查看>>
CSS3 动画、变形效果
查看>>
设置vim默认显示行号
查看>>
Java 问答:终极父类(第一部分)
查看>>
Android性能全面分析与优化方案研究—几乎是史上最全最实用的
查看>>
Android技能树 — View小结
查看>>
C# EF6 更新对象
查看>>