上图是知网查重系统的检测范围,也就是俗称的查重数据库,从中可以看到大部分是知网自己收录的文献,文章资料,比如硕博论文,学术期刊,会议,报纸,专利,图书资源等,同时也有互联网资源库,互联网文档资源,同时还涵盖了英文数据库,港澳台数据库等,数据库范围是非常的广泛。
知网本身就是数据商,都是自己建设的,通过高校、杂志社等途径购买。具体数据包括如下:
一般是各大期刊发表的论文,以及硕博士论文
8、所有大学生在写毕业论文时,必须经历的一步就是查重目前所有高校对毕业论文查重都有明确要求怎么查论文的重复率paperfree小编给大家讲解重复率是判断学生论文是否符合标准的依据论文重复率测试将直接影响学生能否顺利进入。
楼上所言连续30字可能是以前的标准了。。。。我上周用万方查过,连续5字都查出来了的,至于具体多少字,我不太清楚,但是不会超过12字。。。。而且它会自动去掉标点,像“的”“了”等词汇,它也很可能过滤出来,将前后连接检测出重复来。还有段落重复率检测等等。。。。百度上的很多东西其实网上论文里面可能都存在。。。。我就是百度上找的很多东西,各种乱改,结果跑去万方,发现有些本来不一样的都改得跟很多论文一样了。。。。第一次查出了40%的重复率(当然还没有加参考文献尾注,加了尾注的部分应该不算重复率)。。。。后来改了一遍,各种修改词汇,改语序,改内容顺序等等,最后降到了3%以内了。。。。不过据说知网会比万方高8%左右。。。。
万方和知网是根据你的论文和他数据库收录的论文进行比对的,若有连续30字一样就认定抄袭,不包括网上百度的。