如何规避论文查重软件工具的方法和例子分析

如何规避论文查重软件工具的方法和例子分析,第1张

以下以PaperRater论文查重系统查重为例:(PaperRater是跟知网查重检测结果接近的查重系统,并且查重要求是最为严格的而另外查重系统)

1、PaperRater反抄袭软件查重检测的是7个相同的字,就被视为是相似或者为抄袭,因此在文章中连续相同的,最红啊不要超过7个字;

2、尽量在文章中修改使用同义词来替代原文,比如:破坏=损坏;途径=渠道;基本思路=原理;隐藏=私密,个人=私人等等

3、还可以将现代文中个别的转换为古文的意思

4、 将文章的原文中的主动句转变为被动的意思,将句子变为倒装句等等方式。

5、还有在查重检测软件中文章中的图片以及表格是不参与查重检测的,一些数据内容可以通过图片代替,制作数据图等。

PaperRater现在又免费的查重领取 可以免费领取20000字

我个人为我们课程DIY过一个知网查重的软件工具,是基于数据流分析的,效果还不错,反正修改变量名,提取函数这些小伎俩是完全无用的,甚至可以做到一定的跨语言查重(只把c#代码copy到java里,然后改一改跑起来是会被发现的)。说明程序代码也会进行对比查重算抄袭重复率。下面具体说说程序代码进行知网查重的方法,具体如下:

以c为例,具体流程大概是,先调用预处理器把注释干掉,把macro展开,因include <>而弄进来的那波标准库头文件特殊标记一下,然后建立CFG(control flow graph)进行知网查重。因为CFG关心的是变量的值会怎么传播,所以在中间插入一大堆无副作用的语句是不会有任何效果的,把变量换个名或挪个位置(比如加多一层block)也没啥卵用。

c++的话就会麻烦很多,毕竟在c++里就算a + b这么个简单语句,因为operator+可以重载,所以指不定执行完这个语句就可以把地球都炸了呢,而且这个重载在不同namespace里还可能不同,比如namespace A是用地球,

namespace B是对整个地球播一段爱的供养神马的……在c++里建立CFG会是个噩梦……程序代码进行知网查重的方法比较复杂吧!!

程序代码被知网查重很复杂

不过说起来我们的课程比较特殊,因为作业用的是类ACM的提交系统,所以对运行环境有比较严格的限制,这保证了程序代码知网查重查重的准确率。如果是完全开放性的程序代码知网查重(即对语言和第三方lib等等都不做限制的话)恐怕会很困难。

=== 举个例子 ===

以下是前几天刚刚检测到的抄袭代码片段……下面两段java代码被检测出有高度匹配(右图里getARGBData函数只是把二维数组给复制4份凑成一个三维数组而已,没干其他事)……

知网查重时程序代码一样被算重复

另外一点,为了减少漏网之鱼,知网查重时一般都会用低阈值初筛,再人工介入复核。此外建立回溯机制,比如如果某人现场考试的成绩和作业排名差异较大的话,会触发重查,专门为他调低阈值重查一遍+人工复核。不过正因为有人工复核,所以思路相同一般是不至于误判的,毕竟只要代码行数一多,思路再相同,代码风格上也会有很大差异。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/8149446.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-13
下一篇2023-04-13

发表评论

登录后才能评论

评论列表(0条)

    保存