d变成dd let d = { currentMonth: { "2022-11-01": 11, "2022-11-02": 43, "2022-11-03": 53, "2022-10-05": 23, }, lastMonth: { "2022-10-01": 4, "2022-10-04":
原创 4月前
34阅读
求平均值我们可以求某个字段所有行的平均值,例如: 运行结果如
原创 5月前
92阅读
在前面的章节中,我们已经学习了 R 中最常用到的对象类型和函数。掌握了如何创建和修改向量、列表和数据框,如何定义自己的函数,以及如何用恰当的表达式把脑中的逻辑转换成编辑器中的 R 语言代码。有了这些对象、函数和表达式,就可以开始处理数据了。本章将开始数据处理的旅程,主要包括以下几个主题: 读写数据
原创 2019-01-22 14:42:00
121阅读
const getdata = await getAccountList(redate as AccountParams).then((item) => { return item.items; }); export const Grouptype: any[] = (() => { const d ...
转载 2021-10-18 11:13:00
131阅读
2评论
数据分析的道路上越走越远阴差阳错的做了数据分析,而且一开始我还不知道自己在做的是数据分析,看了很多数据分析的书,也走了一些弯路,做了很多实践项目,突然很想把自己作为一个小白的数据分析之路的成长过程写下来。这个系列写一写从QC里面学到的数据分析方法。上一节,我们针对QC中的现状调查来简要说了数据分析的方法论,既然要进行现状调查,意思就是对现有的情况做分析,那必然得从现有的数据中找问题,当我们有了一
原创 2021-01-20 08:33:21
290阅读
1. 汇总数据函数1.AVG() -- 求平均值我们可以求某个字段所有行的平均值,例如:SELECT AVG(prod_price)FROM products;运行结果如下:我们可以给平均值起一个名字,例如:SELECT AVG(prod_price) avg_priceFROM products;运行结果如下:我们还可以对符合条件的行求平均值,例如:SELECT
原创 精选 5月前
459阅读
尝试学习Python,更主要还是为了解决工作中的困难。现在的工作,需要汇总和分析所有site的销量、费用和活动执行情况,由于工作量较为庞大,而实际上并不复杂,所以摸索尝试用python进行处理。当然,写到这里的时候,我还是个刚刚完成编程环境搭建的、刚开始接触列表的纯小白,由于工作并不涉及到编程,我决定跳跃发展,直接尝试通过在网上找到的代码来完成Excel数据处理工作,希望在这个过程中逐渐熟悉pyt
转载 2天前
4阅读
  1、选择建模数据      我们的数据集有太多的变量,很难处理,我们需要将这些海量的数据减少到我们能理解的程度。      我们肯定要选择变量的一列来进行分析,故我们需要查看数据集中所有列的列表名,这是通过数据框架的Columns属性完成的。    以之前的墨尔本房价为例import pandas as pd # 将文件路径保存到变量以便于访问 melbourne_file_path = '
转载 13小时前
0阅读
Python 字符串切割处理,file()方法读取、写入文件 近期碰到一个问题,两套系统之间数据同步出了差错,事后才发现的,又不能将业务流程倒退,但是这么多数据手工处理量也太大了,于是决定用Python偷个小懒。1、首先分析数据。两边数据库字段的值都是一样,先将这边数据库的数据查询导出,正好是2列120多行的数据。那么目标就是拼接成update from
转载 12天前
37阅读
1、XML 适合快速只进方式查询数据 book和医药项目都曾用到。   2、SQLite book项目中用到
原创 2010-02-24 16:50:00
672阅读
一、查找重复值既然我们这个系列是对比Excel,那么在Excel里是怎么查找重复值的呢?有很多种方法,这里就简单说一种:条件格式。在【开始】——【条件格式】里选择突出显示重复值,就将重复的值突出显示出来了:Pandas里如何查找重复值呢?1、查找所有列继之前用的短租数据集(后台回复:短租数据,即可获得),duplicated方法查找重复值,和isnull一样,得到的结果是布尔值,如果重复被标记为T
原创 2021-01-19 21:40:04
1688阅读
1 删除dataframe中有NAN的 这是使用字典创建DataFrame,key将作为表头 1.1 删除表中一行全为NAN的行 1.2 删除表中含有任何的NAN的行 1.3 删除表一列全为NAN的列 1.4 删除表中含有任何的NAN的列 删除表中某几列 直接用data.drop data.drop
转载 2021-07-02 10:56:00
903阅读
2评论
引入数据 结构化数据 A包含B使用LIBNAME,比如文件夹包含多个SAS table,Excel文件包含多个Sheet等 *BASE是仅读SAS table的engine; LIBNAME mylib engine=BASE "path"; ... *需要使用其他lib时; LIBNAME myl ...
转载 2021-10-04 14:00:00
259阅读
2评论
json数据处理
原创 2021-11-12 16:56:50
162阅读
CSV数据处理df.iteritems() 按列遍历,然后使用iloc函数修改指定单元格。学到的内容:输出文件时取消索引df.to_csv('result.csv',index=False)dict对于不存在的key 会输出None判断Noneif key is None:iloc的使用(基于整数位置)df.iloc[:,[0,1]] # 选取第0列和第1列的所有行df.iloc[0] # 选取第1行df.iloc[[0,1],[0,1]] # 选取第0,1行,第0,1列的
原创 2022-03-23 09:53:27
122阅读
化小)(3)常见的海量问题:1.海量数据中TopK问题;2...
我们已经进入了大数据处理时代,需要快速、简单的处理海量数据,海量数据处理的三个主要因素:大容量数据、多格式数据和速度, DMCTextFilter和HTMLFilter是由北京红樱枫软件有限公司​研制和开发的纯文本抽出和HTML转换通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,快速抽出纯文本数据信息和转换成HTML文件。便于用户实现对多种文档数据资源信息进行统一管理,编辑,检索和浏览。
原创 2014-06-13 18:30:03
630阅读
我们已经进入了大数据处理时代,需要快速、简单的处理海量数据,海量数据处理的三个主要因素:大容量数据、多格式数据和速度, DMCTextFilter和HTMLFilter是由北京红樱枫软件有限公司研制和开发的纯文本抽出和HTML转换通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,快速抽出纯文本数据信息和转换成HTML文件。便于用户实现对多种文档数据资源信息进行统一管理,编辑,检索和浏览。
原创 2014-06-25 17:17:56
651阅读
引用数组中的元素:数组切片:${ARRAY[@]:offset:number}offset:要跳过的元素个数number:要取出的元素个数取偏移量之后的所有元素${ARRAY[@]:offset}向数组中追加元素:ARRAY[${#ARRAY[*]}]=value注意:关联数组必须先声明再调用。
原创 2020-09-16 21:24:42
505阅读
  • 1
  • 2
  • 3
  • 4
  • 5