一、概述日志是记录系统中各种问题信息的关键,也是一种常见的海量数据。日志平台为集团所有业务系统提供日志采集、消费、分析、存储、索引和查询的一站式日志服务。主要为了解决日志分散不方便查看、日志搜索操作复杂且效率低、业务异常无法及时发现等等问题。随着有赞业务的发展与增长,每天都会产生百亿级别的日志量(据统计,平均每秒产生 50 万条日志,峰值每秒可达 80 万条)。日志平台也随着业务的不断发展经历了多            
                
         
            
            
            
            Promtail 介绍Loki 是 Grafana Labs 团队最新的开源项目,是一个水平可扩展,高可用性,多租户的日志聚合系统。它的设计非常经济高效且易于操作,因为它不会为日志内容编制索引,而是为每个日志流编制一组标签,专门为 Prometheus 和 Kubernetes 用户做了相关优化。与传统日志收集系统(例ELK)相比,Loki的优势有哪些? 不对日志进行全文索引。通过存储压            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-17 23:42:32
                            
                                146阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            基于loki的日志聚合系统部署文档一,背景&目的目前HRO系统日志分散于各个服务中,查看不方便,且需要服务器权限。因此需要搭建一个统一的日志聚合系统目前热门方案有基于elasticsearch的ELK方案。Elastic Stack(ELK)
      
 ELK,即 Elasticsearch、Logstash 和 Kibana 简称,是最流行的开源日志聚合工具。它            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-06 22:51:07
                            
                                98阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、啥是日志, 为啥要聚合  面试初级同学常问的问题之一就是,一个在线运行的生产系统,如果出现了一些在测试环境复现不了的bug该如何处理啊?错误回答:“我们的系统从没有出过问题”,正确回答:“加日志”。  对于不能稳定复现,或者不方便调试的场景, 通过在程序的执行路径上增加一些文字的记录,输出为文件,供后续分析查看程序的执行过程,是谓之日志。日志可以24小时,无人值守的忠实记录程序的执行过程,是排            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-16 13:03:14
                            
                                70阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            日志聚合与分析在程序中正确的地方输出合适的日志消息,只是合理使用日志的第一步。日志记录的真正作用在于当有问题发生时,能够帮助开发人员很快的定位问题所在。不过一个实用的系统通常由很多个不同的部分组成。这其中包括所开发的程序本身,也包括所依赖的第三方应用程序。以一个典型的电子商务网站为例,除了程序本身,还包括所依赖的底层操作系统、应用服务器、数据库、HTTP 服务器和代理服务器和缓存等。当一个问题发生            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-22 07:01:22
                            
                                26阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Loki 是一个由Grafana Labs 开发的开源日志聚合系统,旨在为云原生架构提供高效的日志处理解决方案。Loki 通过使用类似 Prometheus 的标签索引机制来存储和查询日志数据,这使得它能够快速地进行分布式查询和聚合,而不需要将所有数据都从存储中加载到内存中。Loki还使用了压缩和切割日志数据的方法来减少存储空间的占用,从而更好地适应云原生环境下的高速增长的日志数据量。Loki的架            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-29 17:18:58
                            
                                21阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            0x0 背景Splunk是一个功能强大的机器数据分析平台,包括机器数据的收集、索引、搜索、监控、可视化和告警等。Splunk支持从任何IT设备和应用(服务器、路由交换、应用程序、数据库等)收集日志,支持对日志进行高效搜索、索引和可视化。可应用于:IT运营、安全合规、商业分析等。数据获取:Splunk支持各种格式(如XML、JSON)和非结构化机器数据的获取。数据索引:Splunk会自动索引从各方获            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-21 22:55:12
                            
                                26阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            开源日志工具 指标聚合与日志聚合有何不同? 日志不能包含指标吗? 日志聚合系统不能做与指标聚合系统相同的事情吗?  这些是我经常听到的问题。 我还看到供应商将其日志聚合系统作为解决所有可观察性问题的解决方案。 日志聚合是一个有价值的工具,但通常不是时序数据的好工具。  时序度量标准聚合系统中的几个重要功能是规则间隔和专门为时序数据定制的存储系统。 规则间隔允许用户一致地得出真实的数学结果。 如果日            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-14 21:39:14
                            
                                39阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            JDK Logging从jdk1.4起,JDK开始自带一套日志系统。JDK Logger最大的优点就是不需要任何类库的支持,只要有Java的运行环境就可以使用。相对于其他的日志框架,JDK自带的日志可谓是鸡肋,无论易用性,功能还是扩展性都要稍逊一筹,所以在商业系统中很少直接使用。Java标准库内置了日志包java.util.logging,我们可以直接用。JDK的Logging定义了7个日志级别,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-06 21:32:11
                            
                                113阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            简介对于日志管理当前网络上提供了大量的日志工具,今天就给大家分析总结一下这些常用工具的特点,希望对你们在选型时有所帮助,如果有用记得一键三连。1、FilebeatFilebeat是用于转发和集中日志数据的轻量级传送程序。作为服务器上的代理安装,Filebeat监视您指定的日志文件或位置,收集日志事件,并将它们转发到Elasticsearch或Logstash进行索引。Filebeat的工作方式如下            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-04 09:56:09
                            
                                125阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1、离线处理架构图:2、数据处理流程:数据采集:使用Flume采集web日志信息到HDFS中去数据清洗:将脏数据清理,使用Spark、hive、MapReduce等分布式计算框架数据处理:按照我们的需要进行相应业务的统计和分析,使用Spark、hive、MapReduce等分布式计算框架处理结果入库:调用API,将结果存放到RDBMS,NoSQL中去;数据可视化:通过图形化展示,Echarts或者            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-19 14:30:35
                            
                                33阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            背景           正常情况作业提交到 Yarn 集群时,作业完成或者失败后,每个 NM 节点都会对每个 app 作业进行日志聚合操作,存储到hdfs指定的目录下,但是最近发现越来越多的任务通过yarn logs命令无法查询,经过排查发现很多任务的日志聚合变慢了,需要半小时甚至更多时间才能聚合完成。通过阅读源码才发现需要调大yarn            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-17 08:59:56
                            
                                604阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、环境Spark、Hadoop环境搭建可参看之前文章。开发环境:
    系统:Win10
    开发工具:scala-eclipse-IDE
    项目管理工具:Maven 3.6.0
    JDK 1.8
    Scala 2.11.11
    Spark 2.4.3
Spark运行环境:
    系统:Linux CentOS7(两台机:主从节点)
        master            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-07 03:42:03
                            
                                62阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            
            通过Logstash收集java日志并输出到ES中因为我们现在需要用Logstash收集tomcat日志,所以我们暂时将tomcat安装到Logstash所在机器,也就是db03:10.0.0.53这台机器,收集tomcat访问日志以及tomcat错误日志进行实时统计,在企业中,tomcat机器肯定不是单台,而是一个集群的形式,那么我们每台tomcat上都需要安装一个Logstash,然后将收集到            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-05 19:40:36
                            
                                99阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # 如何实现Python日志聚合
## 概述
在软件开发过程中,日志记录是非常重要的一环,它可以帮助开发者追踪程序运行状态,查找问题所在。然而,当项目较大或涉及多个模块时,单个日志文件可能无法满足需求,这时就需要实现日志聚合,将多个日志文件合并成一个,便于查看和分析数据。本文将介绍如何使用Python实现日志聚合。
## 实现步骤
首先,我们来看一下整个实现日志聚合的流程。可以通过以下表格展示            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-04-12 06:26:59
                            
                                69阅读
                            
                                                                             
                 
                
                             
         
            
            
            
             
一、聚合日志介绍
日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container任务日志上传到HDFS上,从而减轻NodeManager负载,且提供一个中央化存储和分析机制。默认情况下,Container 任务日志存在在各个NodeManager上,保存在"yarn.nodemanager.log-dirs"配置的目录下,保存的时间由"yarn.nodemanager.            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-08-16 13:11:52
                            
                                1416阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Hadoop聚合日志实现指南
## 引言
在大规模数据处理中,Hadoop已经成为一个非常有用的工具。Hadoop可以将大量数据分配到多个计算节点上进行并行处理。在这个指南中,我们将教会你如何使用Hadoop框架来实现日志聚合。
## 流程概述
下面是实现“Hadoop聚合日志”的整个流程:
步骤 | 描述
-- | --
1 | 准备Hadoop集群环境
2 | 创建输入文件并将其上传            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-08-29 12:52:34
                            
                                92阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、聚合日志介绍 日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container任务日志上传到HDFS上,从而减轻NodeManager负载,且提供一个中央化存储和分析机制。默认情况下,Container 任务日志存在在各个NodeManager上,保存在"yarn.nodemana ...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-07-23 13:09:00
                            
                                359阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            # 如何实现 Yarn 日志聚合
在现代的全栈开发中,日志的聚合与管理变得愈发重要。一旦你的应用程序投入生产环境,监控日志不仅可以帮助你快速定位问题,还能提升整个系统的可维护性。在这篇文章中,我们将学习如何实现 Yarn 日志的聚合。
## 整体流程
我们可以将整个过程分为以下几个步骤:
| 步骤 | 说明                             |
| ---- | --            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-10-13 06:37:41
                            
                                35阅读