mob604756fc844f的博客

按发布时间
按阅读量
2020年05月 21篇

全部2462篇
2021年1055篇 11月4篇 10月124篇 09月181篇 08月142篇 07月46篇 06月10篇 05月144篇 04月343篇 03月30篇 02月18篇 01月13篇 2020年139篇 12月5篇 11月16篇 10月15篇 09月7篇 08月7篇 07月12篇 06月27篇 05月21篇 04月6篇 03月6篇 02月5篇 01月12篇 2019年126篇 12月21篇 11月11篇 10月5篇 09月4篇 08月18篇 07月16篇 06月4篇 05月11篇 04月18篇 03月6篇 02月5篇 01月7篇 2018年123篇 12月6篇 11月15篇 10月10篇 09月8篇 08月5篇 07月12篇 06月26篇 05月7篇 04月5篇 03月6篇 02月11篇 01月12篇 2017年197篇 12月10篇 11月8篇 10月15篇 09月6篇 08月15篇 07月42篇 06月18篇 05月36篇 04月6篇 03月5篇 02月15篇 01月21篇 2016年160篇 12月17篇 11月7篇 10月4篇 09月7篇 08月37篇 07月13篇 06月16篇 05月17篇 04月8篇 03月6篇 02月6篇 01月22篇 2015年121篇 12月19篇 11月6篇 10月7篇 09月9篇 08月29篇 07月15篇 06月17篇 05月3篇 04月4篇 03月4篇 02月2篇 01月6篇 2014年96篇 12月4篇 11月5篇 10月5篇 09月1篇 08月15篇 07月23篇 06月6篇 05月2篇 04月3篇 03月8篇 02月14篇 01月10篇 2013年191篇 12月26篇 11月9篇 10月13篇 09月15篇 08月18篇 07月48篇 06月22篇 05月8篇 04月10篇 03月8篇 02月11篇 01月3篇 2012年78篇 12月3篇 11月1篇 10月23篇 09月17篇 08月5篇 07月4篇 06月4篇 05月4篇 04月1篇 03月2篇 02月12篇 01月2篇 2011年47篇 12月3篇 10月6篇 09月2篇 08月4篇 07月4篇 06月13篇 05月1篇 04月4篇 03月5篇 02月4篇 01月1篇 2010年41篇 12月2篇 11月1篇 10月2篇 09月1篇 08月2篇 07月1篇 06月3篇 05月1篇 04月2篇 03月1篇 02月4篇 01月21篇 2009年35篇 12月3篇 10月2篇 09月10篇 08月6篇 07月1篇 06月3篇 05月3篇 03月4篇 02月1篇 01月2篇 2008年16篇 12月2篇 11月2篇 10月4篇 08月4篇 06月2篇 03月1篇 02月1篇 2007年26篇 12月9篇 11月1篇 08月5篇 07月8篇 05月1篇 03月2篇 2006年5篇 11月4篇 08月1篇 2005年5篇 12月1篇 11月1篇 10月1篇 05月2篇 2004年1篇 10月1篇
推荐/精选
全部

全部原创转载翻译

golang html/template

template包（html/template）实现了数据驱动的模板，用于生成可对抗代码注入的安全HTML输出。本包提供了和text/template包相同的接口，无论何时当输出是HTML的时候都应使用本包。 main.go package main import ( "html/template"

html

数据驱动

读文件

字符串

其他

转载 2020-05-27 11:55:00 319 阅读 2评论

1.aiohttp的简单使用(配合asyncio模块)

1.aiohttp的简单使用(配合asyncio模块)def test111(req): time.sleep(5) return HttpResponse('test111 success')def...

python

简单使用

转载 2020-05-26 11:27:00 33 阅读 2评论

【转】MySQL的安装与配置——详细教程

免安装版的Mysql MySQL关是一种关系数据库管理系统，所使用的 SQL 语言是用于访问数据库的最常用的标准化语言，其特点为体积小、速度快、总体拥有成本低，尤其是开放源码这一特点，在 Web应用方面 MySQL 是最好的 RDBMS(Relational Database Management System：关系数据库管理系统)应用软件之一。在本博文里，我主要以Mysq

mysql

免安装

初始化

命令行

官网

转载 2020-05-22 13:59:00 47 阅读

ＭongoDB（03）：概念解析

数据库

mongodb

时间戳

字符串

数据类型

转载 2020-05-21 16:44:00 30 阅读 2评论

airflow实战总结

airflow 介绍 airflow是一款开源的，分布式任务调度框架，它将一个具有上下级依赖关系的工作流，组装成一个有向无环图。特点: 分布式任务调度：允许一个工作流的task在多台worker上同时执行可构建任务依赖：以有向无环图的方式构建任务依赖关系 task原子性：工作流上每个task都是

docker

python

解决方案

反序列化

redis

转载 2020-05-20 14:44:00 393 阅读 2评论

Linux入门到实战之（1）使用手册

一、开关机 sync ：把内存中的数据写到磁盘中（关机、重启前都需先执行sync） shutdown -rnow或reboot ：立刻重启 shutdown -hnow ：立刻关机 shutdown -h 19:00 ：预定时间关闭系统（晚上7点关机，如果现在超过8点则第二天） shutdown -

rpm包

文件系统

sed

用户名

hive

转载 2020-05-20 14:24:00 37 阅读 2评论

Linux入门到实战之（2）常用命令全集

目录操作 mkdir: 创建目录 -p : 递归的创建目录也就是可以创建多层目录一次创建多个目录： mkdir {a,b,c,d,e,f} 一次创建 a b c d e f多个目录。 rmdir：删除一个空文件夹 cp：复制文件或者文件夹 -a =-pdr -p 同时复制文件属性，比如修改日期

文件名

rpm包

centos

包名

配置文件

转载 2020-05-20 14:22:00 36 阅读 2评论

spark机器学习从0到1利用机器算法RFM模型做用户价值分析（十七）

一、案例背景在产品迭代过程中，通常需要根据用户的属性进行归类，也就是通过分析数据，对用户进行归类，以便于在推送及转化过程中获得更大的收益。本案例是基于某互联网公司的实际用户购票数据为研究对象，对用户购票的时间，购买的金额进行了采集，每个用户用手机号来区别唯一性。数据分析人员根据用户购买的时间和金

数据

数据库

sql

标量

缺失值

转载 2020-05-20 09:46:00 175 阅读 2评论

spark机器学习从0到1特征变换-标签和索引的转化（十六）

一、原理在机器学习处理过程中,为了方便相关算法的实现,经常需要把标签数据(一般是字符串)转化成整数索引,或是在计算结束后将整数索引还原为相应的标签. Spark ML 包中提供了几个相关的转换器: StringIndexer,IndexToString,OneHotEncoder,VectorIn

spark

apache

字符串

sql

转载 2020-05-19 23:14:00 141 阅读 2评论

spark机器学习从0到1特征选择-卡方选择器（十五）

一、公式卡方检验的基本公式，也就是χ2的计算公式，即观察值和理论值之间的偏差卡方检验公式其中：A 为观察值，E为理论值，k为观察值的个数，最后一个式子实际上就是具体计算的方法了 n 为总的频数，p为理论频率，那么n*p自然就是理论频数（理论值）二、相关概念卡方分布：可以看出当观察值和理论值

spark

apache

卡方检验

sql

特征选择

转载 2020-05-19 23:11:00 151 阅读 2评论

spark机器学习从0到1特征抽取–Word2Vec（十四）

一、概念 Word2vec是一个Estimator，它采用一系列代表文档的词语来训练word2vecmodel。该模型将每个词语映射到一个固定大小的向量。word2vecmodel使用文档中每个词语的平均数来将文档转换为向量，然后这个向量可以作为预测的特征，来计算文档相似度计算等等。二、代码实现

spark

apache

sql

java

相似度计算

转载 2020-05-19 23:09:00 149 阅读 2评论

spark机器学习从0到1特征抽取–CountVectorizer（十三）

一、概念 CountVectorizer 旨在通过计数来将一个文档转换为向量。当不存在先验字典时，Countvectorizer作为Estimator提取词汇进行训练，并生成一个CountVectorizerModel用于存储相应的词汇向量空间。该模型产生文档关于词语的稀疏表示，其表示可以传递给其他

spark

apache

sql

java

稀疏表示

转载 2020-05-19 23:07:00 116 阅读 2评论

spark机器学习从0到1特征提取 TF-IDF(十二）

一、概念 “词频－逆向文件频率”（TF-IDF）是一种在文本挖掘中广泛使用的特征向量化方法，它可以体现一个文档中词语在语料库中的重要程度。词语由t表示，文档由d表示，语料库由D表示。词频TF(t,d)是词语t在文档d中出现的次数。文件频率DF(t,D)是包含词语的文档的个数。如果我们只使用词频来衡

spark

apache

java

特征向量

sql

转载 2020-05-19 18:41:00 275 阅读 2评论

spark机器学习从0到1机器学习工作流 (十一）

一、概念一个典型的机器学习过程从数据收集开始，要经历多个步骤，才能得到需要的输出。这非常类似于流水线式工作，即通常会包含源数据ETL（抽取、转化、加载），数据预处理，指标提取，模型训练与交叉验证，新数据预测等步骤。 MLlib标准化了用于机器学习算法的API，从而使将多种算法组合到单个管道或工作流

spark

apache

sql

数据

数据集

转载 2020-05-19 18:38:00 181 阅读 2评论

spark机器学习从0到1聚类算法 (十）

一、概念 1.1、定义按照某一个特定的标准（比如距离），把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大，同时不再同一个簇内的数据对象的差异性也尽可能的大。聚类属于典型的无监督学习（Unsupervised Learning）方法。与监督学习（如分类器）相比，无监督学习

聚类

spark

java

apache

数据

转载 2020-05-19 17:01:00 338 阅读 2评论

spark机器学习从0到1协同过滤算法 (九）

一、概念协同过滤算法主要分为基于用户的协同过滤算法和基于项目的协同过滤算法。基于用户的协同过滤算法和基于项目的协同过滤算法 1.1、以用户为基础（User-based）的协同过滤用相似统计的方法得到具有相似爱好或者兴趣的相邻用户，所以称之为以用户为基础（User-based）的协同过滤或基于邻

java

数据

spark

协同过滤

sed

转载 2020-05-19 16:52:00 375 阅读 2评论

spark机器学习从0到1主成分分析-PCA (八）

PCA 一、概念主成分分析（Principal Component Analysis）是指将多个变量通过线性变换以选出较少数重要变量的一种多元统计分析方法，又称为主成分分析。在实际应用场合中，为了全面分析问题，往往提出很多与此有关的变量（或因素），因为每个变量都在不同程度上反映这个应用场合的某些信

spark

apache

sed

java

主成分分析

转载 2020-05-19 16:47:00 296 阅读 2评论

spark机器学习从0到1奇异值分解-SVD (七）

降维（Dimensionality Reduction）是机器学习中的一种重要的特征处理手段，它可以减少计算过程中考虑到的随机变量（即特征）的个数，其被广泛应用于各种机器学习问题中，用于消除噪声、对抗数据稀疏问题。它在尽可能维持原始数据的内在结构的前提下，得到一组描述原数据的，低维度的隐式特征（或

spark

数据

apache

java

奇异值分解

转载 2020-05-19 16:44:00 517 阅读 2评论

APICloud重磅支持Atom编辑器，并建立开发工具核心库

APICloud技术再次升级，不仅支持Atom编辑器开发工具，并推出核心开发工具库，使开发者进行App开发更便捷高效。 APICloud支持Atom编辑器开发工具 APICloud始终坚持多开发工具支持策略，开发者无论使用Sublime Text3、Eclipse还是Webstorm，都可以在API

开发工具

开发者

linux

自动补全

自定义

转载 2020-05-19 16:10:00 70 阅读 2评论

过拟合（Overfitting)

过拟合一、定义在训练数据集上的准确率很⾼，但是在测试集上的准确率⽐较低二、过拟合的解决方案 2.1 DropOut假设有一个过拟合的神经网络如下： DropOut步骤：根据DropOut rate（这里假设为 1/3），在每组数据训练时，随机选择每一隐藏层的1/3的节点去除，并训练。如下图是三次训练的过程：2. 使用时，把神经网络还原成原来没有去除过节点的样子，如下图。但是系数（w，b）需

正则化

过拟合

损失函数

神经网络

解决方案

转载 2020-05-10 18:04:00 308 阅读 2评论

js压缩图片到2m以下

用的canvas。这个问题测试妹子反馈了好几次bug，解决了好多次，虽然用了比较僵硬的办法，但总算最终解决了。因为php的同事说，页面上的图片要直接调用七牛的接口上传到七牛，所以后端那边不能处理，必须前端这边把图片处理到2m以下。可是我感觉用之前的办法只是把宽高变小，并不能保证压缩后一定就小于2m

宽高

重置

绑定事件

自动加载

转载 2020-05-09 16:47:00 275 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

mob604756fc844f的博客