基于Python的学术资源推荐系统论文

摘要

随着大数据时代到来,人们逐渐从信息缺乏的时代走向了信息过载的时代。如今,学术资源每年以亿数量级增长,这给用户(科研人员)的学术研究提供了宝贵的资源财富。但与此同时,大量的资源也使得如何使用户获取自己感兴趣的资源以及如何高效地获取这些资源成为目前亟待解决的一个问题。学术资源推荐系统是解决这一问题的最有效的方法之一,基于此,本文开发一个基于知识图谱的学术资源推荐系统。

传统的推荐系统方法分为协同过滤推荐、基于内容推荐,而本文所采用的基于知识图谱的学术资源推荐系统则是在传统推荐方法的基础上,将知识图谱作为辅助工具,以知识图谱的三元组信息使推荐系统更精确、更具解释性和多样性。

本文基于DBLP学术资源网站所提供的原始数据,完成了以下主要工作:

(1)对原始数据进行了解析并进行数据预处理,包括数据清洗等工作;

(2)导入neo4j图数据库,并通过neo4j实现了知识图谱的展示;

(3)使用推荐算法itemCF,UserCF以及Cypher语言实现了论文的推荐;

(4)使用python库py2neo实现了前后端交互;

(5)使用python库tkinter实现了用户界面可视化。

测试表明,本文最终实现的原型系统很好地完成了上述功能

关键词:推荐系统,知识图谱,neo4j,itemCF算法,UserCF算法

目录

摘要III

ABSTRACTV

1绪论

1.1课题的研究背景及意义1

1.2国内外研究现状2

1.3本文研究内容4

1.4本文组织结构4

2相关理论与技术

2.1数据获取7

2.2Neo4j数据库介绍7

2.3前后端交互python库py2neo介绍8

2.4前端界面python库Tkinter介绍8

2.5知识图谱8

2.6推荐算法8

2.7本章小结10

3系统分析

3.1系统任务概述11

3.2系统运行环境11

3.3系统开发环境11

3.3.1程序语言11

3.3.2数据库11

3.4数据来源12

3.5功能性需求描述13

3.6非功能性需求描述18

3.7本章小结18

4系统设计

4.1系统架构设计19

4.2数据库设计20

4.2.1概念设计20

4.2.2逻辑设计21

4.2.3物理设计21

4.3系统功能结构23

4.3.1数据获取模块24

4.3.2数据预处理模块24

4.3.3用户登录模块24

4.3.4用户功能模块24

4.3.5知识图谱构建模块24

4.3.6论文查询模块24

4.3.7论文推荐模块25

4.4本章小结25

5系统实现

5.1DBLP数据获取27

5.2数据预处理28

5.3知识图谱构建与展示30

5.4用户界面编写32

5.5用户功能实现34

5.6论文查询功能实现36

5.7论文推荐功能实现39

5.7.1用户端推荐功能实现39

5.7.2作者端推荐功能实现42

5.8本章小结43

6结论

6.1本文工作总结45

6.2进一步展望45

参考文献47

致谢49

完整资料评论区获取




转载请注明:http://www.aierlanlan.com/tzrz/2449.html