首页>社情·民意>你言我语 你言我语

网络作品“伪原创”花样多:工具可自动生成文章

2017年05月09日 11:10 | 作者:张昊 | 来源:法制日报
分享到: 

在线自动生成“伪原创”

记者在调查中发现,除了刘思含提到的各种“伪原创”手法,还有一种模式——在线自动生成“伪原创”。

记者通过阅读多个“伪原创”工具的说明并试用,梳理出其制作过程和原理。“伪原创”的目标是通过同义词替换的方式,让搜索引擎认为是一篇原创文章,从而提高在搜索结果中的排名。“伪原创”工具或在线生成网站都有自己的同义词库,有的通过免费模式向用户开放一部分,另一部分更大的同义词库则要用户付费后才可以使用。

“用‘伪原创’工具可以把在互联网上复制的文章瞬间变成您自己的原创文章。”一个“伪原创”网站的说明这样写到。此类“伪原创”工具还可以在文章中随意植入想被读者看到的关键词或网址,以达到宣传作用。

记者把原创文章复制粘贴到这样的网站上,一键即可生成同义词替换过的文章,被替换的词通常用不同的字体和颜色标记出来。

在这个过程中,记者发现,专业类文章替换较少;生活类的文章替换掉的词较多;文章越长,替换率越高。在线“伪原创”工具还附带相似度检测、关键词排序、关键词统计、关键词组合工具等在线工具,文章整体替换的比例在10%左右。替换后的文章可读性降低,网站建议对文章进行人工修改提升可读性。一个“伪原创”网站在说明中称,“‘伪原创’文章最好将文章开头和结尾用自己的语言组织,这样的效果更好一些”。

记者使用相似度检测对原创和“伪原创”进行对比发现,机器识别出相似度在85%至98%之间。

记者在网站上看到一个生成记录,内容文本字符长度为734个字的文章,共替换了44个词长度为90个字符,替换比率为12.26%。原文和替换之后的文章相似度为92.6%,如此高的相似度怎么办?这些网站给出了进一步的“解决方案”。

“在线生成文章,将其粘贴入前两步已做好的‘伪原创’文章后一段即可”。记者点击“在线生成文章”发现,生成的并不是可读的文章,而是一段看似是中文的乱码。将这段乱码贴在文章最后,相似度降低到84.3%。

除了用乱码降低相似度,这些网站介绍称还可以在文章中插入图片,建议用户打乱文章顺序等方法。

此外,记者发现,网上还可以搜索到大量关于“如何制作‘伪原创’”的教程。

编辑:梁霄

01 02 03

关键词:网络 作品 文章 工具

更多

更多