总字数:有的同学会发现报告中的总字数与论文中的总字数出入较大,这是因为检测系统统计的是字符数,例如thesis,在word中是一个词(字),在检测系统中是6个字符。 重复字数:重复部分+引用重复部分的字数,一般改重是根据重复字数收费。 (报告中的重复字数实际上是重复字符数,文科二者基本接近,理工科重复字符数与实际重复字数相差较大,在跟商家沟通费用时需特别注意) 总段落数:知网检测时会根据文章的格式(如果格式(目录)没有正确调整,就根据内容)进行分段检测,分成几段,就是几个段落。 (需要注意的是内容发生变动时,知网检测会重新分段,有可能出现头一次检测正常的内容第二次变红,这属于正常现象) 指标:疑似剽窃观点、疑似剽窃文字表述、疑似自我剽窃、过度引用等。
知网检测论文的重复性是按照13个字的连续性作为判断的根据,若作者希望修改后的论文查重没有那么高,就可以先选择将论文13个字相连的地方做修改,修改后保证13个字与字之间的内容与抄袭的原作者文章内容不一致,这样过检测的概率会很高。 学术不端网 觉得,按照目前的论文检测系统来说,是非常容易的,只需要做简单的修改,等到以后会不会缩短字数进行查重检测就不得而知了。
大致上来说,知网查重算法采用的是一种根据语义模糊解析算法,用近似比对的方式进行重复率检测。 而不是简单地基于某个最小语句为单位(比如传说中的“13个字连续一样”),进行“循环比对”这么简单。