大数据博客_原创博文第146页

hadoop集群模式交通拥堵

1、MapReduce理论简介 1.1 MapReduce编程模型　　MapReduce采用"分而治之"的思想，把对大规模数据集的操作，分发给一个主节点管理下的各个分节点共同完成，然后通过整合各个节点的中间结果，得到最终结果。简单地说，MapReduce就是"任务的分解与结果的汇总"。　　在Hadoop中，用于执行MapReduce任务的机器角色有两个：一个是JobTracker；另一个

hadoop集群模式交通拥堵

java

操作系统

大数据

Text

岁月如歌甚好

5月前

17阅读

DataWorks中的函数如何开发？

在DataWorks中进行UDF（用户自定义函数）开发，需根据函数类型（Python或Java）选择对应流程，以下是完整操作指南：一、开发前准备环境配置确保已开通DataWorks工作空间并绑定MaxCompute计算引擎。主账号或RAM子账号需具备 “数据开发” 和 “资源管理” 权限。资源准备 Python UDF：准备.py脚本文件，

Python

json

Java

原创

lu952450497

5月前

110阅读

授权其他用户yarn队列权限

自定义用户授权和出站路由主要是为不同用户配置相应的电话拨出权限（就比如一般用户只能拨打本地的电话，而经理可以拨打长途）；位置配置文件：位置配置文件中包含一个（或多个）规范化规则。规范化规则：规范化规则是一个 .NET 正则表达式，用来定义电话号码模式。电话用法记录：电话用法记录指定组织中各个用户或用户组所能进行的呼叫类别（如内部、本地或长途）。策略：策略将一个或

授权其他用户yarn队列权限

前端

ViewUI

配置文件

服务器

岁月如歌甚好

5月前

23阅读

public Integer getValue() { return value; } public void setValue(Integer value) { this.value = value; } public void add(int addValue) { synchronized (value) { value += addValue; } } /** • 合并值缓冲区大小，这里是

hive聚合map类型

hive

学习

笔记

hadoop

码农小哥

5月前

53阅读

微信小程序云索引

项目介绍小贝校招项目是集校招资讯、内推、刷题、简历模板下载等功能于一体的小程序，基于微信原生+微信云开发+vant+colorui以及相关技术栈开发，自带图像云开发后台，不需要自己建网站。源代码全部开源，部署详细流程见下面介绍。** 代码不易，如果觉得项目不错的话可以给项目一个 Star ，谢谢各位的支持。**源码github地址：https://github.com/XiaokangLei/m

微信小程序云索引

小程序

云原生

微信小程序

数据库

技术博客领航者

5月前

23阅读

db2 加载数据截取

2004年笔者进入公司后就从事数据仓库的工作，伴随着中国移动经营分析系统的发展而成长，主导过多次数据仓库的重构建设，见证了数据仓库从ORACLE到DB2、从DB2到ASTER、从ASTER到一体机、从一体机到GBASE、从GBASE拓展到Hadoop、再从Hadoop演进到实时数据仓库的历程。这其中不仅仅有技术和认知，也有自己的故事，但时间就像一个沙漏，会让存封的记忆变成没有记忆，在沙子漏光之前，

db2 加载数据截取

db2 sql 截取+号前数据

数据仓库

SQL

数据库

墨舞天涯

5月前

21阅读

storm结合echarts

这篇文章主要是写自己用到的echarts图表配置，我们都知道，自己手动在ECharts配置文件去找一些自己想要的方法是很难找到的，这篇文章就是我把常用的配置整理出来，希望能帮到各位（此文章随时更新，建议收藏到标签） 1、饼状图/环形图 2、柱状图3、折线图4、矩形图5、中国地图6、世界地图（带航线）7、关系图legendlegend:{ 　　　　itemGap: 7, // 设置间距　　　　it

storm结合echarts

echarts

学习

前端

Powered by 金山文档

mob64ca14068b0b

5月前

48阅读

linux索引inode增加

1、相关概念1、索引节点inode(index node)：inode就是索引节点，它用来存放档案及目录的基本信息，包含时间、档名、使用者及群组等。 inode 是 UNIX/Linux 操作系统中的一种数据结构，其本质是结构体它包含了与文件系统中各个文件相关的一些重要信息。每一个索引节点都是一个表项，包含有关文件的信息(元数据)：文件类型，权限，UID，GID 链接数（指向这个文

linux索引inode增加

操作系统

linux

软链接

文件系统

mob64ca1409970a

5月前

41阅读

yarn和npm设置缓存目录

目录npm 的安装机制和背后思想npm 缓存机制npm link ：在本地调试验证包的可用性 npx 的作用搭建 npm 企业级部署私服npm 镜像问题配置参考文档：npm官方文档：https://docs.npmjs.com/cli/v7/commands/npm-init聊聊 NPM 镜像那些险象环生的坑： https://mp.weixin.qq.com/s/2ntKGI

yarn和npm设置缓存目录

javascript

缓存

json

二进制文件

mob64ca1418736f

5月前

56阅读

storm ui 详细介绍

一、配置开发环境storm有两种操作模式: 本地模式和远程模式。使用本地模式的时候，你可以在你的本地机器上开发测试你的topology，一切都在你的本地机器上模拟出来; 用远程模式的时候你提交的topology会在一个集群的机器上执行。建议使用maven，只需要加上storm的依赖就可以了。org.apache.storm storm-core 1.1.0 provided pom.xml 4.

storm ui 详细介绍

storm java classpath

apache

java

jar

字节墨海星

5月前

35阅读

solr通过命令创建索引

1.什么是solr？solr是基于lucene的全文检索服务器。2.Solr是如何实现全文检索的呢？全文检索大体分两个过程，索引创建(Indexing)和搜索索引(Search)。索引库：两部分组成：索引域，文档域（document）。文档域：即我们存入的数据（但必须按照存在的Field属性存入属性。）Field: 相当于属性名（相当于数据库字段名）索引创建：将现实世界中所

solr通过命令创建索引

solr

java

xml

analyzer

网络安全守护神

5月前

60阅读

响应人符合性审查索引表怎么填写

应急响应作为安全工作中最贴近用户实际需求的一环，对其的了解是每一位安全服务工作者应该具备的基本素养。本文将从应急响应的定义，常用的理论模型、linux和windows操作系统下一般的应急响应思路几个方面，为大家总结一下在应急响应中需要具备的一些基础理论和基本操作方法。1.应急响应的一些基础理论1.1 网络安全应急响应的概念网络安全是指网络系统的硬件、软件以及其系统中的数据受到保护、不因偶然的或者恶

响应人符合性审查索引表怎么填写

网络

自适应

IP

bash

梦断蓝桥魂

5月前

55阅读

doris 底层 hadoop

社区推荐是自己编译,官网在这里，过程相当简单，就一句话 sh build.sh，但是在编译过程中容易遇到各种失败，例如Failed to download DataTables.zip during the compilation of the third-party library就需要更改下载数据源，更改完这个可能还有其他问题，这里就用已编译版本了，如果坚持要自己编译可以看这个大神的博客。Do

doris 底层 hadoop

apache

mysql

bc

MySQL

imking

5月前

41阅读

Java 大视界 -- Java 大数据在智能建筑室内环境舒适度预测与调控中的应用（269）

本文深度解析 Java 与大数据技术在智能建筑室内环境调控中的应用，涵盖数据采集架构、机器学习模型、系统优化方案及国家级案例，提供从数据到应用的全链路技术指南。

Java

spark

大数据

智能建筑

环境调控

原创

青云交技术圈

5月前

73阅读

yyds干货盘点

Java 大视界 -- Java 大数据在智能建筑室内环境舒适度预测与调控中的应用（269）

指定索引的表空间

主要涉及几个类 NumericRangeQuery 数值型检索类，含(NumericRangeTermEnum)数值型词项迭代器NumericUtils 索引和检索时，数值型运算类NumericTokenStr

指定索引的表空间

integer

query

lucene

buffer

lemon

5月前

41阅读

Stormy Daniels磁力链接

The Beatles: Get Back2160P:The.Beatles.Get.Back.S01.2160p.DSNP.WEB-DL.x265.10bit.HDR.DDP5.1.Atmos-KOGi 大小：54.68GB 磁力链接：magnet:?xt=urn:btih:d0c95fd36749e62f0a2a194d92f6bc57e2efed9aThe.Beatles.Get.Back.

Stormy Daniels磁力链接

嵌套

Back

ci

互联网小墨风

5月前

2357阅读

GaussDB200 下载

导读 GaussDB(for Redis)采用云原生分布式架构，完全兼容Redis协议，支持丰富数据类型。提供数据实时持久化、多副本强一致保障，以及实时监控、弹性伸缩、自动备份等一站式服务。今天想和大家分享的内容是，从客户视角出发，GaussDB(for Redis)能带来哪些价值。GaussDB(for Redis)介绍1、GaussDB(for Redi

GaussDB200 下载

Redis

数据

数据库

mob64ca1413c518

5月前

23阅读

compressed archive版本还需要编译吗

我使用的环境是64位的 Red Hat Enterprise Linux Server release 6.4 (Santiago)1.compress与*.Z文件compress程序的作用是：Compress reduces the size of the named files using adaptive Lempel-Ziv coding即：使用自适应的Lempel-Ziv编码压缩文件如

操作系统

python

运维

7z

解压缩

人类新新

5月前

40阅读

k8s spark搭建

1、K8S部署常见的安装部署方式Minikubu 单节点微型k8s（仅供学习和预览使用）二进制安装部署（生产首选）使用kubeadmin进行部署，k8s的部署工具，跑在k8s里（相对简单，熟手推荐）使用官网提供的Minikube可以进行试验 https://kubernetes.io/docs/tutorials/hello-minikube/ 点击 Launch Terminal 命令查询关键组

k8s spark搭建

kubernetes

docker

运维

json

mob64ca140e0490

5月前

48阅读

yarn开启多线程打包

id="cproIframe_u1728839_3" width="120" height="240" src="http://pos.baidu.com/acom?adn=4&at=160&aurl=&cad=1&ccd=24&cec=GBK&cfv=0&ch=0&col=zh-CN&conOP=0&cpa=1&a

yarn开启多线程打包

spark

jar

h5

索姆拉

5月前

18阅读

seatunnel on spark运行

注：当前博客中的内容不是最新的内容，最新的博客内容请查看有道笔记中记录的内容：https://note.youdao.com/ynoteshare1/index.html?id=f2f88ed8e33ada01e8c44ed5d8b3ac5f&type=note因为内容比较多，确实不方便搬运，需要详细了解的，请移步。该项目的源代码也已经完全开源了，详情请查码云开源项目HASentinel：

Sentinel

限流

微服务治理

数据

spring

半夜未央好

5月前

28阅读

hispark是什么

LockSupport工具类线程阻塞的工具类，所有的方法都是静态方法，可以让线程在任意位置阻塞，阻塞之后也有唤醒的方法。park：停车，如果我们把thread看成一辆车的话，park就是让车停下。unpark：就是让车启动然后跑起来。park和unpark实现的是wait和notify的功能。区别：1、park不需要获取某个对象的锁2、因为中断park不会抛出InterruptedExceptio

hispark是什么

线程池

原子类

阻塞队列

mob64ca1416b5a8

5月前

9阅读

arcgis中多值提取到点warning000184空间索引不存在

文章目录前言一、操作步骤1.导入数据2.投影转换3.创建渔网4.裁剪渔网（两种方式）5.投影转换总结前言有时候处于某种研究目的我们需要将一些行政区的矢量数据划分为网格（渔网）数据，下面我们以陕西省为例，将其划分为10 km ×10 km 的网格，例子数据在这文章中：全国省市县区乡镇级别的矢量文件(百度网盘可下载）。一、操作步骤1.导入数据2.投影转换我们要创建10 km ×10 km 的网格，

arcgis

创建渔网

投影转换

数据

导入数据

mob64ca140ee96c

5月前

365阅读

spark DAG调优

Spark性能优化篇二：开发调优1、前言在大数据计算领域，Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作，应用范围与前景非常广泛。在美团•大众点评，已经有很多同学在各种项目中尝试使用Spark。大多数同学（包

spark DAG调优

数据

持久化

调优

mob64ca140a8e67

5月前

17阅读

CDHhadoop安装目录

CDH6.2离线安装流程1 安装准备1.1 cdh6.2下载方式一：官网下载 https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/RPMS/x86_64/都下载下来 https://archive.cloudera.com/cdh6/6.2.0/parcels/只要el7.parcel 和 el7.parcel.sha1 下载式二：百度网盘 h

CDHhadoop安装目录

cloudera

mysql

html

风之谷启航

5月前

37阅读

pg数据库建索引的时候会锁表吗

逻辑复制逻辑复制流复制是基于实例级别的复制，而逻辑复制是基于表级别的选择性复制，例如可以复制主库的一部分表到备库，这是一种粒度更细的复制，逻辑复制主要使用场景为：根据业务需求，将一个数据库中的一部分表同步到另一个数据库满足报表库取数需求，从多个数据库采集报表数据实现PostgreSQL跨大版本数据同步实现PostgreSQL大版本升级流复制是基于WAL日志的物理复制；而逻辑复制是基于逻辑解析（lo

pg数据库建索引的时候会锁表吗

数据库

postgresql

运维

linux

fjfdh

5月前

16阅读

查询条件限制为1条db2

linux epoll模型介绍和程序实例1. epoll是何方神圣？ epoll是当前在Linux下开发大规模并发网络程序的热门人选，epoll 在Linux2.6内核中正式引入，和select相似，其实都I/O多路复用技术而已，并没有什么神秘的。

查询条件限制为1条db2

Linux

epoll

#include

Processing

level

5月前

19阅读

安卓stormsniffer为什么安装不了

玩骑行的同伴都知道，长途骑行，第一需要好的硬件，如大腿发动机、车子、装备等；二是需要好的软件，如意志、有氧能力、骑行app等。骑行渣渣，踏上了开启国内软件国际化的艰难心酸适配路程（熬夜两晚）。而适配的对象，选择了在国内混得风生水起，口碑不错的行者app。要想行者在印尼可以正常使用，需要解决三个issues：1、国外离线地图的功能；2、骑行路书的制作功能；3

离线地图

百度地图

搜索

桃太郎

5月前

78阅读

hadoop secondary namenode是哪个版本

一、Hadoop基础1、分布式概念通过爬虫-->爬到网页存储-->查找关键字一台机器存储是有限的 Google采用多台机器，使用分布式的概念去存储处理 &n

hadoop

大数据

大数据开发

HDFS

hdfs

互联网小思悟

5月前

23阅读

kv数据库是非关系型数据库吗

Fabric 1.0源代码笔记之 LevelDB（KV数据库）1、LevelDB概述LevelDB是Google开源的持久化KV单机数据库，具有很高的随机写，顺序读/写性能，但是随机读的性能很一般，也就是说，LevelDB很适合应用在查询较少，而写很多的场景。LevelDB的特点：key和value都是任意长度的字节数组；entry（即一条K-V记录）默认是按照key的字典顺序存储的，当然开发者

kv数据库是非关系型数据库吗

数据库

区块链

ide

数据

云端小悟空

5月前

13阅读