毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

文本相似度检测系统设计(6)

时间:2020-07-15 20:33来源:毕业论文
处理器: Intel(R) Core(TM)i7-3630QM CPU @ 2.40GHz 2.40GHz 内存(RAM): 8.00GB (7.90GB 可用) 系统类型: 64位操作系统,基于x64的处理器 显卡: GTX660m 硬盘:

处理器:       Intel(R) Core(TM)i7-3630QM CPU @ 2.40GHz  2.40GHz

内存(RAM):  8.00GB (7.90GB  可用)

系统类型:     64位操作系统,基于x64的处理器

显卡:         GTX660m

硬盘:         750GB

1.3.2 开发系统环境

Windows10 专业版是目前最新的系统,专业版用户可以获得加入域、群策略管理、BitLocker(全碟加密)、企业模式IE浏览器、Assigned Access 8.1、远程桌面、Hyper-V客户端(虚拟化)、加入Azure活动目录、浏览Windows 10商业应用商店、企业数据保护(计划于今年秋季推出)以及接收特别针对商业用户推出的更新功能。同时Windows具有很好的稳定性和兼容性,所以本系统开发使用此系统。

1.3.3 开发工具

本次使用的开发工具是visual studio 2013,visual studio 2013加入了大量的新功能,增强了稳定性,是一个很实用的版本。Visual Studio 2013 预览版进行了大量改进,可帮助您在编码时提高工作效率并集中精力。某些功能首先在 Visual Studio Power Tools 扩展中以试验性质出现,经过改进后才纳入到 Visual Studio 中。新版本中内置了多种提高工作效率的功能,如自动补全方括号、使用快捷键移动整行或整块的代码以及行内导航。此外,Visual Studio 2013 预览版的团队资源管理器增强了主页设计,可以更简便地导航到团队协作功能,并可取消停靠“挂起更改”和“生成”,使其显示在一个单独的窗口中。

在处理大型代码文件时,可能难以了解当前所处的位置。在 Visual Studio 2013 预览版中,可轻松地在两种模式之间切换滚动条的行为。在栏模式中,可更直接地查看脱字号位置等注释、更改所在位置和跟踪错误。在图模式下,滚动条显示源代码的实时预览,而将鼠标悬停在代码上即可在工具提示中更详细地预览这段代码。然后单击代码所在位置即可导航到该位置。还有其他许多实用的小功能,比如在VS2013中输入括号,在没有安装别的辅助工具的情况下,系统就会自动的完成括号的完整和匹配。这对于使用者来说是一个非常好用的功能,还有如鼠标悬停在某个函数上,系统就会出现这个函数的定义形式和参数列表等等。

2 软件需求分析

2.1 功能需求概述

文档相似性检测工具是通过比对源文档和目标文档相似性给出相似度结果的一种信息处 理系统。 本软件自动将文档切割为多个50到200字(可自定义)的小文本,通过一定的算法将其与其它文献进行模糊匹配,标示出每个文本块与文献库中的某些文献的最大相似度。

2.2 设计思想

本系统决定使用的是visual studio 2013上C#开发,直接做出程序界面,无需建立网站,可独立使用,数据文本直接存放于文件夹内,操作使用时更加方便,界面设计的比较简单易懂,容易上手,对反馈的结果以清晰精确的数字显示。该系统实现最大的难点是算法问题,所以对文本相似度计算算法进行了一次仔细的查阅,主要查阅了向量空间距离方面的余弦距离算法、编辑距离算法和jaccard距离算法,经过我仔细的参阅比较,最重选择了编辑距离算法。要求可以实现文档1对1对比查重,1对N查重并显示最高相似度的值,以及N对N并显示出最高相似度的值。源'自-751;文,论`文'网]www.751com.cn

3 系统设计概述

文本相似度检测系统设计(6):http://www.751com.cn/jisuanji/lunwen_56288.html
------分隔线----------------------------
推荐内容