摘要

作为网站管理员,在网站的日常操作中,经常需要写一些软文章,以提高网站的访问流量,但是作为潘军的笔肯定不是那么好,想写一些文章,可惜肚子里没有墨水,这时,我们必须考虑转载别人的抄袭文章,这样做实际上对seo优化没有好处,因为它不是原创的,所以对seo也不是太有用,那么怎么办呢?

当然,还有一些方法。网上有很多关于软伪原创的工具。我也读过其中一些。他们似乎都收费。唉,潘凯恩没钱...然而,潘康奈是贪婪的。你知道蟒蛇,……然后你开始.........

设计理念

首先,我想做的是:本地工具、阅读txt文件、分析词性(动词、名词、代词等)。),然后提出一种或多种词性,将其转换为同义词,根据同义词的相似性选择它们,然后将其组合成新的文章。

程序的整体操作:扫描txt文件夹->读取文件夹中的所有txt内容->部分语音过滤器同义词分析->将数据保存到新txt

在这里,我将选择结吧分词模块和同义词模块。当然,我们应该在编写程序之前安装这两个模块。jieba模块更容易安装,同义词模块更大,在cmd中直接安装可能更困难。我在pycharm完成了安装。

Python 文章为原创 python文本自动伪原创_Python 文章为原创

模块的安装模块安装

第一步是编写文件夹扫描和txt读取模块

文件夹的扫描,很容易通过操作系统模块扫描文件夹中的所有文件,返回列表,并将其传递给阅读模块进行文章阅读。文章阅读模块所做的是将txt文章的标题和内容返回给下一个模块。

我这边的每个txt文件都有相同的格式,所以我这边的文章阅读模块的规则是使用常规提取。如果您需要,您可以根据txt内容更改规则。

Python 文章为原创 python文本自动伪原创_python采集修改原创_02

txt文件的格式

Python 文章为原创 python文本自动伪原创_Python 文章为原创_03

扫描模块和读取模块扫描模块和读取模块

第二步:词性分析、同义词分析、句子重组模块写作

对于开发的这一部分,需要使用两个模块,即在开始时安装的两个模块。我将首先直接编写代码:

首先,通过口吃分割对输入句子进行分割,并返回分割信息和词性。然后我们根据一定的规则过滤词性,过滤特定词性的同义词,将它们的返回值添加到列表中,最后通过join()方法将列表组合成一个句子。在以后的阶段,我们只需要调用这个模块来导入每个句子来生成变形的句子。

步骤3: txt编写模块编写

这部分没有困难,也就是说,直接将txt写入另一个文件。

Python 文章为原创 python文本自动伪原创_git_04

txt写入模块Txt写模块

步骤4:写入逻辑操作条目

这个模块是整个程序的逻辑入口。我们首先使用扫描模块遍历其返回值,依次读取txt文件,将txt文件的内容传输到文章转换模块,最后调用txt编写模块生成一个新文件。当然,新文件的内容已经改变了。

Python 文章为原创 python文本自动伪原创_python采集修改原创_05

逻辑入口逻辑条目

总体代码

Python 文章为原创 python文本自动伪原创_git_06

代码一

Python 文章为原创 python文本自动伪原创_Python 文章为原创_07

代码二代码2

效果图:

Python 文章为原创 python文本自动伪原创_txt文件_08

运行图

Python 文章为原创 python文本自动伪原创_git_09

左边是生成的右边是原来的左边是生成的,右边是原始的

摘要

总的来说,效果仍然很明显。一个小工具已经完成。项目地址:https://gitee.com/Tony.bin/Pseudo_Article.git