关于SCI文章查重以及降重你应该知道的

作者:收集于网络

SCI论文查重结果不能超过多少呢? SCI论文查重标准又是什么呢?重复率过高如何降重呢?

一篇SCI文章相似率低于10% 这类文章中所检出的相似率一般都是一些来源相对分散的匹配文本或常见短语,通常每一处匹配来源仅仅占据1%~3%的相似率,在期刊允许的合理范围内。那么这类查重结果对鉴定论文是否抄袭影响不大,几乎是可以忽略的

权威查重软件

有很多的软件可以用来论文查重,但秉持着严谨的原则,Papergoing团队用科学研究的一贯方法,从一堆软件中对查重软件进行了深入的分析和调查(如Plagiarism Checker, PaperPass, iThenticate,turnitin),并为大家推荐国际上最为权威的查重软件。

在英文论文查重的软件中,国际上目前有以下两个最权威的查重系统:

  • iThenticate,也叫Crosscheck,俗称查重专业版。目前为止,其权威性在所有查重软件中是最高的,包含的数据库非常全面且更新及时,包括绝大部分数据库(爱思唯尔、斯普林格出版社等)的期刊论文,会议论文,博士论文,网页数据等,都是千万级乃至亿级的论文数据(如图3所示)。因此,想逃脱它的火眼金睛,除非有高超的改写技巧,否则几乎不可能。同时,它也是目前最受国际SCI期刊认可的查重软件。在Papergoing分析过的SCI论文审稿意见中,如果涉及到被查重,使用的软件都是iThenticate。它也是Dr. Wu在知乎live演讲案例中使用的查重软件。
图3 查重软件iThenticate包含的数据库
  • 第二个查重软件是跟iThenticate同属于一家公司的Turnitin。我们用两个系统对同一篇论文进行查重后并对比结果发现,二者的主要差别是数据库的范围。Turnitin由于主要用于国外大学在校生的作业和毕业论文检查,因此没有包含英文博士论文数据库ProQuest,而iThenticate则包括ProQuest。图4是利用iThenticate查重的某篇英文论文的查重结果,该结果显示论文中有38个单词与西澳大学的博士论文(7)重复。
图4 查重软件iThenticate包含博士论文数据库ProQuest

重复率过高如何才能有效降低重复率?或如何改写?

  • 理解句子意思并确保改写后意思相近或不变
  • 整体改变句子结构,方法有 a) 复杂句与简单句转换;b) 主动句与被动句变换等
  • 局部改动关键词,方法有a) 词组变换;b) 同义词变换;c) 单词形式变化(单复数变化等)

案例分析:

原文句子:However, little research has been carried out on the material properties of lean duplex stainless steel at elevated temperatures.

有效改写的句子:While the material property of lean duplex stainless steel during high temperature exposure has received little focused attention so far.

该案例中用到的主要技巧有:

  • 变换句子结构:被动(has been carried out)变主动(has received):
  • 同义词替换:however-while, elevated-high
  • 单复数变化:properties-property
  • 词组变换:at elevated temperatures- during high temperature exposure

此外,虽然目前图片重复不能被查重软件自动识别出来,但是一旦被人举报,SCI期刊编辑将有义务对图片进行查重,并且一经发现,后果很可能是被撤稿。案例请见往期文章

总之改写的最高境界是保持意思不变,灵活运用不同句子结构和单词形式。如果只是简单的分割段落、句子,插入空格,拼接句子,打乱句子顺序,在目前强大的查重算法面前,降重效果将会很苍白!

SCI论文查重常见问题

1.需要带参考文献进行全文检测查重吗?

答:不需要,因为参考文献肯定会有重复,SCI期刊编辑当然会意识到这个问题。因此他们在查重时,会在查重软件中关闭检查参考文献的选项。不过,在实际工作中,Papergoing查重老师发现有些期刊编辑连同参考文献进行了查重(如图6所示),有可能是忘记在软件中关闭参考文献选项。不过没有关系,大家可以联系期刊编辑进行更正说明。

图6 参考文献也进行查重的结果

2.如果在完全引用时,比如引用某个概念的定义,在两端加上双引号“”。这样也会认定为重复吗?

答:是的,即便有双引号,也会被认定为完全重复,因此建议大家尽量不要照搬定义。如果非得写定义,可转述或直接引用参考文献,比如The definition of xx can be found in xx Ref.

图7 方框中的淡蓝色部分是引用的定义,但是被认定为重复!

3.是不是引用很旧的文献,就有可能逃开查重?

答:有可能,只要不在查重软件的数据库中,就可以避开,不过目前的数据库已经非常全了,非常难以脱离检测范围。

4.为什么连简单词汇,例如of, a等都会被查出重复?

答:这需要理解查重原理。如果两个句子主干结构一致,那么其中的关键词如果是一样,就被认为是重复。比如:

  • 原文句子:However, little research has been carried out on the material properties of lean duplex stainless steel at elevated temperatures.
  • 重复句子:While most of the previous research has been focused on the material behaviour of carbon steel and stainless steel at elevated temperatures.

下划线部分的单词都被算作重复,重复率高达 12/22=55%。如果我们分析这两句的句子结构,我们发现两个句子结构是一样的:research has been xx on the material xx of xx at xx. 这就是导致重复的根本原因。句子结构一致基础上,如果关键词一样,比如句子中的of,也会被认定为重复。



Qq