如何规避论文查重软件工具的方法和例子分析_软件运维

以下以PaperRater论文查重系统查重为例：（PaperRater是跟知网查重检测结果接近的查重系统，并且查重要求是最为严格的而另外查重系统）

1、PaperRater反抄袭软件查重检测的是7个相同的字，就被视为是相似或者为抄袭，因此在文章中连续相同的，最红啊不要超过7个字；

2、尽量在文章中修改使用同义词来替代原文，比如：破坏=损坏；途径=渠道；基本思路=原理；隐藏=私密，个人=私人等等

3、还可以将现代文中个别的转换为古文的意思

4、将文章的原文中的主动句转变为被动的意思，将句子变为倒装句等等方式。

5、还有在查重检测软件中文章中的图片以及表格是不参与查重检测的，一些数据内容可以通过图片代替，制作数据图等。

PaperRater现在又免费的查重领取可以免费领取20000字

我个人为我们课程DIY过一个知网查重的软件工具，是基于数据流分析的，效果还不错，反正修改变量名，提取函数这些小伎俩是完全无用的，甚至可以做到一定的跨语言查重（只把c#代码copy到java里，然后改一改跑起来是会被发现的）。说明程序代码也会进行对比查重算抄袭重复率。下面具体说说程序代码进行知网查重的方法，具体如下：

以c为例，具体流程大概是，先调用预处理器把注释干掉，把macro展开，因include <>而弄进来的那波标准库头文件特殊标记一下，然后建立CFG（control flow graph）进行知网查重。因为CFG关心的是变量的值会怎么传播，所以在中间插入一大堆无副作用的语句是不会有任何效果的，把变量换个名或挪个位置（比如加多一层block）也没啥卵用。

c++的话就会麻烦很多，毕竟在c++里就算a + b这么个简单语句，因为operator+可以重载，所以指不定执行完这个语句就可以把地球都炸了呢，而且这个重载在不同namespace里还可能不同，比如namespace A是用地球，

namespace B是对整个地球播一段爱的供养神马的……在c++里建立CFG会是个噩梦……程序代码进行知网查重的方法比较复杂吧！！

程序代码被知网查重很复杂

不过说起来我们的课程比较特殊，因为作业用的是类ACM的提交系统，所以对运行环境有比较严格的限制，这保证了程序代码知网查重查重的准确率。如果是完全开放性的程序代码知网查重（即对语言和第三方lib等等都不做限制的话）恐怕会很困难。

=== 举个例子 ===

以下是前几天刚刚检测到的抄袭代码片段……下面两段java代码被检测出有高度匹配（右图里getARGBData函数只是把二维数组给复制4份凑成一个三维数组而已，没干其他事）……

知网查重时程序代码一样被算重复

另外一点，为了减少漏网之鱼，知网查重时一般都会用低阈值初筛，再人工介入复核。此外建立回溯机制，比如如果某人现场考试的成绩和作业排名差异较大的话，会触发重查，专门为他调低阈值重查一遍+人工复核。不过正因为有人工复核，所以思路相同一般是不至于误判的，毕竟只要代码行数一多，思路再相同，代码风格上也会有很大差异。

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/yw/8149446.html

如何规避论文查重软件工具的方法和例子分析

发表评论

评论列表（0条）