毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

文本相似度检测系统设计

时间:2020-07-15 20:33来源:毕业论文
通过比对源文档和目标文档相似性给出相似度结果的一种信息处理系统。 本系统自动将文档切割为多个50到200字(可自定义)的小文本,通过一定的算法将其与其它文献进行模糊匹配,

摘要: 近年来,学术造假、科研抄袭事件频发不止,大学生论文抄袭更是层不出穷,学术不端的问题不仅在中国,在世界范围内,都是一个令学界头痛不已的学界“肿瘤”。抄袭现象的普遍导致了学生诚信度受到质疑,甚至影响到真正做学术研究的学生的积极性,因此,查重软件应运而生。该系统是基于C#语言,采用了编辑距离算法即LD(Levenshtein Distance)算法,通过比对源文档和目标文档相似性给出相似度结果的一种信息处理系统。 本系统自动将文档切割为多个50到200字(可自定义)的小文本,通过一定的算法将其与其它文献进行模糊匹配,标示出每个文本块与文献库中的某些文献的最大相似度。该系统可以实现两个文档的检测、一个文档对多个文档检测以及多个文档对多个文档的检测。检测结果将会已百分比形式显示,以精确的数字直观的了解到文档的重复度。通过该系统,可以直观有效的检测学生论文等学术文献的抄袭行为。52410

毕业论文关键词: 相似度;距离编辑算法;检测;

Text similarity detection system

Abstract: In recent years, academic cheating and scientific plagiarism have been exposed to the society frequently, let alone the thesis plagiarism phenomenon among the college students. Academic misconducts contaminate the academic circle like tumors all over the world. As a result, students’ credibility is called in question. Besides, those who do academic wholeheartedly may lose their enthusiasm. Therefore, checking system-an information processing system based on the C# language and the Levenshtein Distance occurs. Such system contracts the similarity of the source document and the target document. The checking system that I have made pides a document into several small texts consisting of 50 to 200 words automatically and matches these texts with other documents through some algorithm to mark the degree of similarity. This system can check the similarity between 2 documents, that between one document and others and that between documents and documents. The checking result is a percent. This system helps to see whether students have plagiarized or not. 

Keywords: Similarity; Levenshtein Distance; testing; 

目录

摘要 i

Abstract i

目录 ii

1 绪论 1

1.1 课题介绍 1

1.2 可行性研究分析 1

1.2.1 本课题研究的意义 1

1.2.2 调研分析 3

1.2.3 研究结论 5

1.3 开发环境 6

1.3.1 开发硬件环境 6

1.3.2 开发系统环境 6

1.3.3 开发工具 6

2 软件需求分析 7

2.1 功能需求概述 7

2.2 设计思想 7

3 系统设计概述 8

3.1 系统功能需求概述 8

3.2 系统的三个功能模块 8

3.3 系统检测思路 9

3.4 系统核心算法 11

3.4.1 算法实现过程 文本相似度检测系统设计:http://www.751com.cn/jisuanji/lunwen_56288.html

------分隔线----------------------------
推荐内容