当前位置:皇冠官网 > 社会科学 >

ROST反剽窃(学术不端行为检测系统)系统说明

发布时间:2017-12-03 阅读:

  ROST反剽窃(学术不端行为测试系统)系统描述

  ROST反剽窃(学术不端行为检测系统)系统说明我们目前已将此软件分配给有关的社会服务人员。网站:www.fanpq.com我们仍将关注反剽窃中的一些新技术问题近期研究:争取在近几个月内为学生推出免费的网上反剽窃服务,以积极的心态防止无意识的剽窃。最近更新! (2009.04.13)1.增加了中英文混用的第二次考试,减少了误判。 2.添加链接单元格,当点击测试表单切换到浏览器页面时,可以高亮抄袭抄袭文本文本3.增加自动升级功能由于服务器压力大,不会为学生提供测试服务,系统和其他系统覆盖80%以上的文献,系统通过混合动力引擎覆盖188亿页,490万篇论文,建议用户使用多套系统测试文件。背景反剽窃系统是一个信息处理系统,通过比较源文件和目标文件的相似性,给出相似的结果。武汉大学信息管理学院副教授(避免过于敏感或有时称为相关检测工具)开发的ROST文档相似度检测工具可以有效检测出类似于论文的剽窃,经过六年的研发(早期版本被称为克星的克星)终于推出了6.0版本,在设置过程中得到了武汉大学教授和专家的一些建议。目前已有约20个单位投入使用,反应良好,在一定程度上杜绝了剽窃论文的发表。剽窃论文,摘要论文,JCDL 2009.6“反剽窃制度与中华人民共和国抄袭法研究”,国际教育与计算机科学研讨会(IEEE ECS 2009),EI / ISTP,2009.3 ROST Anti-第二届国际数字时代产业发展与人才培养研讨会2008.11“信息指纹Hashtrie二次采集信息与研究系统”,EGTA 2008,EI,2008.9“反剽窃监测系统模型研究”( Wisa 2007)武汉大学自然科学学报Vol.12 NO.5,2007年9月,937-940 Springer出版剽窃与反剽窃对抗中国教育网2008.9系统基础:反剽窃软件将文档自动裁剪成多个小文本50到200字(可定制),与18.8亿个网页和4.9亿篇文章混合成Line模糊匹配,表明了ma每个文本块与库中某些文档的最大相似度。本软件统计相似度≥95%(基本完整抄袭)与相似度≥80%(略有改动抄袭)字数占总字数的比例。我们用这个比例来衡量剽窃(相似性)。系统需要XP系统,word2003环境。好处ü广泛的覆盖面,通过混合动力引擎覆盖约188亿个网页和490万篇散文。该系统使用自主开发的ROST WebSpider和ROST SEAT算法来实现Internet和一些周期性网络的广度。 ü模糊检测,灵活匹配,为防止抄袭取代部分字符,删除一些标点符号,由系统确定相似度。该系统采用自主开发的ROST相似算法实现高速相似度检测和测量。系统自主研发的青青算法提取指纹信息,P3,512MBPC,分词速度13MB / S,已经在互联网评测版上提供了行业评测。软件测试结果只能作为参考,您可以使用表格导出详细的检查结果,右键发送进行检查,软件不是剽窃结论,只是告诉您现有文件的文本相似度高于80%总数的比例是多少?相似度高于80%的文本需要注意。低于这个值可以完全忽略。 ü标准引用和参考删除,以减少误判的可能性。 ü自定义块检测机制,文章中的每个文本块与其他文档的相似度都准确地表示出来,每个文本块大概有50字到200字(可以自定义),在红色里非常相似(相似度大于80%),一目了然,清晰醒目。当设置为50个单词时,可以在较低的信息粒度下找到剽窃或类似的文档。 ü类似的文件模块跟踪技术,可以通过简单的操作直接找到类似的文件,抄袭或复制,直观,清晰。 ü结果分析功能,自动分析文件类似结果,给予意见。 ü多种文件格式支持,包括PDF,DOC,PPT,XLS,TXT等文件。 ü专有数据文件保存,无需反复测试,浪费时间。缺点ü反剽窃制度不能涵盖世界上所有的中英文文献。正在研究覆盖与召回之间的相关性问题。 ü测试时间稍长。软件每检测到200个字需要7秒钟。 8000字的文件至少需要5分钟,需要一点耐心。 ü软件测试结果有小错误。用较小的文件块进行测试可以减少错误,但所需的时间会相应增加。经过我们在一些编辑部门的试用后,块大小设置为200字更合适,那么错误率是可以接受的,文档相似度一般比实际低。在试用版中为了最大限度地检测不同学科最相关的文件,软件在某些情况下存在误判的可能性,此时用户可以通过调整两个参数的设置来获得不同的相似度指数结果。如果是正式使用,请联系我们调整参数,将系统调整到更严格的匹配,后面我们会进行软件升级和不同学科的分配。相关研究1993年,亚利桑那大学的Manber提出了近似指数来度量文档之间字符串相似性的概念,这个概念被许多后来的类似系统所采用。 1995年,斯坦福大学的Brin和Garcia-Molina在数字图书馆项目中提出了COPS系统及相应的算法,为反剽窃系统奠定了基础。香港理工大学的Si和Leong使用统计关键词建立了CHECK原型来测量文本相似度,并首次将文档结构信息引入到文本相似性度量中。 2000年,Monostori使用后缀向量在后缀树搜索字符串之间存储了最大的子字符串,并建立了MDR原型。目前,Turnitin在90多个国家提供反剽窃服务。网页数量超过66亿,拥有650万用户,支持全球四大电子学习平台 - 黑板,WebCT,Moodle,天使专利授权1,申请1ü电脑网络防重载或/和反剽窃监测方法(200610019074.5),2006.5.16ü加速反剽窃或复制文档检测速度(200610166577.5),2006.12.31,授权相关软件工具ROST WebSpider,ROST FulltextSearch,ROST SearchEngine分析工具,ROST WordParser ,ROST WordFrequency约20个小工具或软件,目前可从http://hi.baidu.com/whusoft/blog/ item / 76dcc28bab7e81dbfd1f10ea.html

关键词: 社会科学