继续打开,我昨天发给你那个词包啊,现在我们是流量才筛选,标点组合你已经会了,但实际上,等一下我们生成内容组合标题的时候还是有点步骤不一样,毕竟你这个组合出来的肯定是不能用的,就是结果是一样的,但是流程不一样。
现在我们打开我们我昨天发给你那个纸包,然后你随便挑选个2万个出来就可以了,指数直飞指数,妃子数值都无所谓啊,随便挑个几万个出来就可以了,给你演示一下。
比如我弄了2万个词,包啊,2万个词,首先这样的2万个词,我只是给你举个例子,实际上,有些时候你可能弄了几十万个词或者更多的词,但是你看这些词的话,它就有一个问题啊,什么样的一个问题呢?你看这些词的话,它有一个实际的问题,就是这么多的词,你怎么去筛选?哪些可以用,哪些不能用?那现在我们来操作第一步,叫做词的一个干净度处理。
1、词干净度处理
2、词筛选
你在做这个词筛选的前提,你肯定要把这个词的一些干净度处理好,不然有很多垃圾肯定不能用。
然后点击排序
排序以后得到这样的一个结果,你看这个结果是什么呢?就是以符号开头的一个字排树上面,然后就数字排完就排字母字母排完了,排排什么呢排汗字开头的字哦,汉字开头的词。
你仔细的看这些排序啊,最开始,如果我们不去处理这个词的干净度,你们前面有什么点啊?大括号啊对吧,这种词都乱七八糟的,你觉得可以用,很明显不能用吗?对不对?所以我们不去仔细的去看,对吧,很多人他不懂得去处理这种干净度,你看啦下,一个词包几十万个词随便搞一些,直接去发,你说这种点期货交易的本质是什么?你这种标题发上去肯定不会收录乱七八糟的对不对,所以我们选词也要把机,本来是有规范要做好。
然后我们就从那个429开始,就是那个以C结尾的一个最后一个C开头的一个词,到A1拳把选中删除掉,删除以后我们保留出来的,肯定就是这个以长以这个汉字开头的一个词,这样的词的话你看出了一遍,以后就干净度就会干净很多,但是还没有处理完成,这只是第一步的一个干净的处理。
好,现在我们要用到一个函数来进行第二步的一个词的一个处理吧,这个函数呢,叫做等于号RGHP。
=right(a1,1)
这里你一定要记住啊,以后你是放到B列的第一行,对应的是a列的第一行第一对A1吗?然后在B列输入等于号IGHT,然后大括号A1逗号,一在括号再回车就可以了。
同样的,我们只要双击一下,然后它就出来的,所有的一个以或结尾的一个词。
他不是以或结尾一个词啊,就是全部帮你得到每一个词的最后一个词,得到以后再进行一个排序。
排序完成以后,你仔细来看,你看就有很多乱七八糟的符号结尾的,对吧,数字结尾的对吧,字母结尾这种词,你看你如果不去处理这种干净度,你看这乱七八糟是不是又是一大堆对不对?所以你看我们做爱的时候其实就是做细节,如果这些东西你不去处理的话,得到这种词的干净度质量度是非常差的,肯定也是不能用的。
同样的,在把这个以字母,数字和汉字和符号结尾的词都删掉啊,最终是保留以数字开头的一个字或一个词。
现在你在来看,通过两个步骤把这个词的干净度处理以后,你会发现整个词包我们筛选出来就是这个处理以后的干净度的一个词,它质量度就高很多了,就不会有什么乱七八糟的一个符号数字在里面。
刚刚是这个词的一个单记录处理,现在呢,我们在进行第二个工作就是关于他的一个筛选。
筛选
筛选后就是处理后的词啊,你把比例这个里面的字都删掉,就保留a列就好了,这些是我们筛选使用,这里我们又要需要用的一个函数。
=len(a1)
然后你再根据这个词进行一个长度的一个排序排序,以后得到的结果就是这样的一个数据值。
但是我们可以看到这个词的一个长度啊,最短的有三个字,对吧,最长的话可能有好几十个字,当然我们看到这一列的话,最长的是18个字。
现在我们要进行一次筛选工作,不是所有的词都能够使用,有些词他不能够用,有些词它是可以用的,一般情况下,我们选择六到十个字或者六到八个字之间的词使用就可以。
6-10个字或者6-8个字
为什么选择这两个区间的一个词呢?因为我们要算一下,比如说六个字的词,他肯定是包含五个字,四个字,三个字,两个字,一个字的词在里面就不用想了对吧,那为什么不直接选择那种18个字的词?那是因为我们去组合标题是一个双标题,两个八个字就16个字了,两个十个字就20个字,所以不管是五个字就是六个字以下的词,还是说。十个字以上的时候,我们都可以一次性把它给画题给囊括住,这样的话,我们就可能尽可能把我们的一个流量区间给大家做好,因为前面我讲公开课也讲过一个东西,叫覆盖面,其实你知道覆盖面就知道在我们不知道哪些,只有流量之前,我们只能够用一个区间对吧,把尽可能的流量全部优化一些,因为我们的一个流量产生更大的一个流量数据出来。
然后我们先随便选取1000个只啊,实际上,你肯定在实际弄的时候可能有好几万个,我就给你做演示,我随机给你弄1000个纸了,把他放到另外一列当中去。
单双错开
然后再进行这样的一部工作,输入一个单双单,双双击选中,然后在那个右下角进行一个双击,它就出现了所有的单双。
然后再进行一个排序,这样的话你就会得到,上面500个是单,下面有500个是双。
为什么要这样做呢?咱们回过头来看上面这样的一组数据啊。
你仔细来看,因为我们前面是做了排序,所以说你看这个词,一号和二号词相对来说是比较相关的,三号,四号也相关,五号,六号也相关,如果你随机去组合的话,相关性不是很高了,你看用排列的方式去组合的话,比如你看股指期货空瓶,加上股指期货强平,你看这两个词就非常相关,组合成一个标题也非常好,同样的你看下面还有一些词,比如说像什么,比如说这个期货平台突破。以及期货真假突破,你看这种词绑定在一起相关性就非常强,所以我们通过这样的一个方法去把它给组合标题的话,它的标题的相关性就更强很多,不仅仅是都讲期货同时讲的这个词,它也有一定的关联。
然后再把这两类词把它单独放到一个列里面去,一边500个把它放好,这些词等一下就是我们可以使用的词。
所以这个知识点是关于讲解这个词的一个干净度的一个处理,筛选以后的话,你弄词的时候也可以按照这个方法就每一步都不能出错,保证它的相关性处理的干净度。