论文查重子系统的设计和实现毕业论文

 2021-04-12 04:04

摘 要

目前,互联网技术发展迅速,随着科技的进步,网络信息爆炸,越来越多的文章中存在相似的内容。自媒体的产生和发表文章的低成本使得文章质量的良莠不齐。如何准确管理文档以及找到相似的文档,是查重技术存在和发展的原因。论文查重防止论文抄袭的重要手段,可以防止论文重复度过高,防止学术不端的情况。本文将结合springboot技术和文本查重余弦相似度技术构建论文查重子系统,满足论文查重的需要。本文将结合lucene工具包和ikanalyzer中文分词器进行中文分词构建文本的解析,从而构建论文查重子系统。本文通过分析文档查重技术现状、springboot和文本查重余弦相似度学习环境及互联网的高速发展,通过lucene工具包进行信息检索,ikanalyzer中文分词器进行中文分词,提出论文查重子系统的研究目标和内容。

关键词:查重;springboot;余弦相似度;lucene工具包;ikanalyzer中文分词器。

Design and Implementation of Paper Duplication Checking Subsystem

ABSTRACT

Nowadays, with the rapid development of Internet technology, along with the progress of science and technology and the explosion of network information, more and more articles have similar content. The production of self-Media and the low cost of publishing articles make the quality of articles uneven. How to manage documents accurately and find similar documents is the reason why duplication technology exists and develops. Paper duplication checking is an important means to prevent paper plagiarism, which can prevent excessive repetition and academic misconduct. This paper will combine spring boot technology and text duplication cosine similarity technology to build a duplication subsystem to meet the need of duplication. This paper will analyze the text of Chinese word segmentation based on Lucene toolkit and ikanalyzer Chinese word segmenter, so as to construct the paper duplication checking subsystem. By analyzing the status quo of document duplication checking technology, springboot and cosine similarity learning environment, and the rapid development of the Internet, this paper carries out information retrieval through Lucene toolkit and Chinese word segmentation by ikanalyzer Chinese word segmentation, and puts forward the research objectives and contents of the duplication checking subsystem.

Key words:Duplicate Checking; Springboot; Cosine Similarity; Lucene ; ikanalyzer。

目 录

1 绪 论………………………………………………………………………………………1

1.1 背景及研究的目的及意义………………………………………………………………1

1.2 国内外研究现状………………………………………………………………1

1.2.1 国外研究现状………………………………………………………………………1

1.2.2 国内研究现状………………………………………………………………………2

1.1.3 基于词频计算………………………………………………………………………2

1.1.4 基于字符串的计算………………………………………………………………………2

1.1.5 基于相似度的计算………………………………………………………………………3

1.3 本文研究内容………………………………………………………………3

1.4 论文组织结构………………………………………………………………3

2 论文查重子系统关键技术……………………………………………………………………………4

2.1 lucene技术……………………………………………………………………4

2.2 POI操作word………………………………………………………………………5

2.3 空间向量模型…………………………………………………………………………6

2.4 文本相似度算法(余弦定理)……………………………………………………………6

2.5 ikanalyzer分词…………………………………………………………………………8

2.6 springboot…………………………………………………………………………………8

3 论文查重子系统的设计…………………………………………………………………………10

3.1 功能需求分析…………………………………………………………………………………10

3.2 数据库的设计与实现……………………………………………………………………10

3.2.1 数据库E-R图……………………………………………………………………10

3.2.2 数据库表设计……………………………………………………………………11

3.3 redis储存用户token权限…………………………………………………………………12

3.4 查重流程………………………………………………………………………………………13

3.5 用户登录注册页面……………………………………………………………………………14

4 查重子系统的实现与测试…………………………………………………………………………15

4.1 查重子系统的实现……………………………………………………………………………15

4.1.1 前端编程软件……………………………………………………………………………15

4.1.2 后端编程软件……………………………………………………………………………15

4.1.3 数据库……………………………………………………………………………………15

4.2 测试环境……………………………………………………………………………16

4.3 文档管理………………………………………………………………………………16

4.4 查重子系统…………………………………………………………………………………17

5总结与展望……………………………………………………………………18

5.1 论文总结……………………………………………………………………18

5.2 未来展望……………………………………………………………………19

致谢 ………………………………………………………………………………20

参考文献 (五号、宋体)………………………………………………………………21

1 绪论

1.1 背景及研究的目的及意义

目前,互联网技术发展迅速,生活中网络信息变多,抄袭现象也日益增多。自媒体的产生和发表文章的低成本使得文章质量的良莠不齐。互联网飞速的发展带来很多问题,越来越多的人写文章喜欢在网上进行抄袭,这是对学术的不尊重,容易产生学术不端,论文是学术界很重要的一个部分,为了避免学术不端的出现,论文查重子系统的开发与使用关乎极大。因此设计一个合理有效的论文查重系统十分有必要,本次毕业设计开发一款论文查重子系统,进而帮助大家方便进行论文查重,拒绝学术不端。进而帮助学术期刊更好的对论文进行管理,也便利学生进行论文查重。

进入21世纪以来,互联网技术飞速发展,论文信息化管理是发展的必然情况。目前,伴随着大学生的数量越来越多,毕业论文越来越多,为了防止论文抄袭重合度过高,论文查重子系统需要进一步优化与实现。毕业设计是一种带有研究性质的专题研究分析的设计报告,是培养合格人才的实践性教学环节。论文查重就是通过测试软件,检查论文和已发表的论文的重合度。重合度过高就会认定你的论文具有抄袭行为,考察一个人的学术道德问题。论文查重子系统的设计与实现的目的在于测试论文的重合度,防止抄袭,拒绝学术不端,营造优秀的学术态度。论文查重子系统提供了对科研服务平台的论文进行数据查重,检查新论文重合度是否过高。随着互联网的普及以及数字出版物的增多,复制检测也开始发展起来了。

您需要先支付 80元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,优先添加企业微信。