例如一篇论文的相似率超过了30%,也许会被认为有抄袭的嫌疑,但若仔细分析报告却发现每一处匹配来源的重复率均低于5%或更低,此时一般来说不会被指出抄袭,故作简单语言调整即可。 第二种情况:总体相似率很低,但仅包含一至两处的高重复率匹配来源。 例如一篇相似率12%(近似可忽略)的论文仅具有两处分别为11%和1%的相似来源。 那么这篇文章同样需要格外注意,11%重复的部分可能包含了几处大段的摘抄,必须有所警惕,以免在投稿后被期刊指出问题,从而引起不必要的麻烦。 总而言之,SCI论文查重标准并不固定,需要具体情况具体分析。 查重报告第一眼看到的相似率仅仅是一个参考,就算略微高于20%也不要太担心,主要还是要确定各个匹配来源的相似率合理即可。
整个查重报告的相似率是由每一个单独匹配来源的重复率累加所得,例如一篇相似率为20%的论文可能由20个不同匹配来源构成,且对每一组匹配文本都有1%的重复。 由Crosscheck数据库对SCI论文查重后给出的相似程度大致可分为三类: 第一类:相似率低于10% - Not Likely to Be an Issue (Disregard) 这类文章中所检出的相似率一般都是一些来源相对分散的匹配文本或常见短语,通常每一处匹配来源仅仅占据1%~3%的相似率,在期刊允许的合理范围内。
第一种情况:总体相似率高,但包含若干个低重复匹配来源。 例如一篇论文的相似率超过了30%,也许会被认为有抄袭的嫌疑,但若仔细分析报告却发现每一处匹配来源的重复率均低于5%或更低,此时一般来说不会被指出抄袭,故作简单语言调整即可。 第二种情况:总体相似率很低,但仅包含一至两处的高重复率匹配来源。