前几天朋友让我帮他挖掘一下数据,做好后请我吃好吃的🤩🤩虽然不会但是不能丢面呀!(绝不是为了好吃的)😎😎就尝试用Python做了一下。


🎈🎈大概要求:

1、数据库,是给定的原始数据集合;

2、挖掘数据库“关系详情”中的“夫妻/配偶、兄弟姐妹、父子、父女、母子、母女”具体信息;

3、挖掘后的信息整理成【示例】中的格式;

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_python

注意:

1)一个证券代码对应多个年份;

2)该证券代码下的公司存在某种类型的关系标记为1,不存在对应关系标记为0。

3)按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现-自由选择方式】。

👓👓数据:

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_html_02

我看了一下大概十几万条!😫😫😫 原本想简单用Python跑了一下,看看效果,但是几分钟也没出结果就放弃了!(原因自己技术不到家)

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_html_03

于是就用Excel表做数据挖掘。

🎡🎡方法:

🥇第一步:提取年份。

新建一个年份列,点击年份下的空格,输入函数

=YEAR(B2)

提取统计截止日期中的年份

下面的十字快速双击就行了,年份这一列就完成了!

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_python_04

🥈第二步,判断持股人之间的关系

在关系列下的空格中输入函数

=IF(OR(ISNUMBER(FIND({"哥","弟","兄","姐","妹"},J2))),1,0)

判断关系详情中是否包含哥或第或姐或妹等字符,如果包含就为1,不包含就为0

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_数据_05

其他的类似分别输入对应的函数

=IF(OR(ISNUMBER(FIND({"夫妻","丈夫","妻子"},J2))),1,0)

夫妻

=IF(AND(ISNUMBER(FIND({"父","子"},J2))),1,0)

父子

=IF(AND(ISNUMBER(FIND({"父","女"},J2))),1,0)

父女

=IF(AND(ISNUMBER(FIND({"母","子"},J2))),1,0)

母子

=IF(AND(ISNUMBER(FIND({"母","女"},J2))),1,0)

母女

因为数据量大,没有一一看,可能有些类似谁是谁的长子,谁是谁的女婿等未提取出

这样持股人之间的关系就提取出来了。

🥉第三步,制作统计表

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_html_06

同样我们也用函数! 按照年份统计每一年持股人不同的关系的总数 在每一列关系下的第一个空,分别输入以下函数

=SUMIF(C2:C199673,T2,L2:L199673)

=SUMIF(C2:C199673,T2,K2:K199673)

=SUMIF(C2:C199673,T2,M2:M199673)

=SUMIF(C2:C199673,T2,N2:N199673)

=SUMIF(C2:C199673,T2,O2:O199673)

=SUMIF(C2:C199673,T2,P2:P199673)

函数功能,判断年份列中的年份是否等于对应的年份,如果等于就将对应行中的关系相加求和

🏆🏆🏆结果:

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_数据_07

🏅第四步,制作图表

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_html_08

原本到这里就完成,不过觉得如果做成动态的会更加有趣! 但是用代码敲的话,有些麻烦,并需要一些编程基础。

🎯🎯推荐一个在线制作动图网站

​Flourish​

无需编程基础就可以做出漂亮的动态图表🎉🎉🎉

🚩🚩首先准备一个Excel表,输入统计表

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_数据_09

🗺🗺进入网站

​股权关系动态图表​

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_数据_10

上传数据即可! 也可以根据自己的喜好调整颜色,大小等🎆🎆 是不是很方便,我朋友觉得很酷!很满意! 并且可以发布!可以让别人下载和访问!

🎹🎹编辑一个HTML文件

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Document</title>
</head>
<body>
<div class="flourish-embed flourish-bar-chart-race" data-src="visualisation/9458106"><script src="https://public.flourish.studio/resources/embed.js"></script></div>
</body>
</html>

发给朋友,就可以远程访问了!😁😁😁

【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】_html_11

总结:

虽然没有用Python做出来,不过也掌握了Excel的方法!💯💯💯💯