一、驱虫市场的潜力分析


### --- 驱虫市场的潜力分析

import glob
import os
import pandas as pd
import re
import numpy as np
import datetime as dt
from sklearn.linear_model import LinearRegression
import seaborn as sns
from matplotlib import pyplot as plt
import jieba
import jieba.analyse
import imageio
from wordcloud import WordCloud
#windows 中文编码
plt.rcParams['font.sans-serif']='simhei'
plt.rcParams['axes.unicode_minus']=False
sns.set_style("darkgrid",{"font.sans-serif":['simhei','Droid Sans Fallback']})
#mac 中文转码
#plt.rcParams['font.family'] = ['Arial Unicode MS'] #用来正常显示中文标签
#plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
#sns.set_style('whitegrid',{'font.sans-serif':['Arial Unicode MS','Arial']})
~~~     # 导入数据

os.chdir('/Users/xxs/Desktop/电商本文挖掘/data')
os.chdir('./驱虫剂市场')
### --- 分析目的&加载数据

~~~ # 分析目的:针对各个子类目市场近三年的交易额数据,
~~~ # 以及top100品牌数据(2017年11月到2018年10月),通过描述性分析,在年变化的维度上:
~~~ 分析整个市场的总体趋势
~~~ 分析各子类目市场占比及变化趋势
~~~ 分析市场集中度,即是否存在垄断
~~~ # 分析过程:
~~~ 读取各子类目市场近三年交易额数据
~~~ 依时间汇总成各子类目在时间线上的交易金额数据

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_子类

### --- 清洗&补全数据

~~~ # 由于其中的时间列是从2015年11月到2018年10月,
~~~ 而我们需要的是2016-2018年每月完整的数据(方便从年变化的角度分析产品)

~~~ # 这里我们假设:
~~~ 每年各月之间没有明显规律的周期性变化(近似认为月和月之间的相关性不大)
~~~ 每年对应月份的数据是线性变化的(一是因为数据少,
~~~ 二是认为随着年份的增长,交易额在大环境下是稳步变化的)

~~~ # 故这里我们可以简单的用线性回归预测即对于每个子类目市场,
~~~ 用15、16、17年的11/12月销售金额预测18年的对应月份

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_类目_02

### --- 整体市场

~~~ 按照年份查看驱虫市场的总体变化趋势
~~~ 所有子类目市场每年的交易金额总和;折线图表示变化
~~~ 可以看出:近三年呈增长趋势,整个市场倾向于成长期和成熟期

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_数据_03

### --- 各市场变化趋势

~~~ 查看各类目市场三年内销售额总和的变化趋势
~~~ 直观的看灭鼠杀虫剂和蚊香液都有较大的机会

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_子类_04

### --- 各市场占比
~~~ 查看各类目市场三年内销售额总和的占比

~~~ 可见灭鼠杀虫剂和蚊香液可进一步扩展,
~~~ 就需要与甲方业务人员进一步沟通假设沟通后我们重点关注的是灭鼠杀虫剂

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_类目_05

### --- 各市场年增幅

~~~ 进一步分析各类目市场16-17年17-18年增幅
~~~ 可见除了灭鼠杀虫剂和蚊香液增幅比较稳定,其它都有下降甚至变负

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_类目_06

### --- 垄断

~~~ 垄断程度,或者说市场势力的重要量化指标是行业集中度。
~~~ 常见的指标有行业集中率:CRn指数,赫芬达尔指数(Herfindahl-Hirschman Index,缩写HHI)。

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_数据_07

~~~     # 指数范围从1/N到1,
~~~ 指数的导数表示该行业中“等效”的公司数量,上例的市场结构等同于拥有1.55521加相同规模的公司。
~~~ # 范围:
~~~ [1/N,‘高度竞争行业’,0.01],(0.01,‘不集中的行业’,0.15],
~~~ (0.15,‘中等集中’,0.25], (0.25,‘高度集中’,1]

~~~ # HHI的局限性:
~~~ 行业细分:由于产品分类细化,类间差异大,销售量数据就不一定能准确判断行业集中度。
~~~ (例如某个大行业中各大公司市场份额相同,但业务不同,仍可能造成垄断)。
~~~ # 地理范围:
~~~ 从总的市场份额来看占比一致,但是各个公司可能在当地造成垄断。
~~~ # 长尾现象:
~~~ 无限小众市场抗衡大市场(看具体行业)。

~~~ # 分析流程:
~~~ 使用top100品牌数据,通过交易指数反映销售额从而得到市场占有率,
~~~ 描述各品牌市场份额,计算HHI指标:

~~~ # 计算得到:
~~~ 驱虫市场HHI指数:0.013546(或135.46),等效公司数:73.82。

|NO.Z.00025|——————————|BigDataEnd|——|Arithmetic&Machine.v25|——|Machine:项目实战.v02|驱虫市场的潜力分析|_数据_08

### --- 市场的潜力分析-结论

~~~ 整体驱虫市场处于快速增长阶段,趋向于成长期到成熟期
~~~ 灭鼠杀虫剂市场份额较大(大于60%),约是第二名蚊香液的二倍,市场增长率接近40%,
~~~ 可以认为是明星产品类目,需要持续投资和重点关注
~~~ 驱虫市场不存在垄断,结构不集中,竞争相对激烈,即没有明显的来自大公司的压力

                 


Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart

                                                                                                                                                   ——W.S.Landor