顶流的意思就是大部分开发者都在用MySQL。
列存四先驱和 MIT 知名教授 Samuel Madden 于 2013 年在某期刊上写的一篇当时列存相关技术的综述。文章还挺全面也很经典,通过剖析三个经典的现代列存的数据库 C-store、MonetDB、VectorWise,阐述了各项单独技术的来龙去脉和相辅相成的关系。
performance_schema 简介
最近一段时间,我重新梳理了一下目前市面上主流的数据分析引擎, 发现真是琳琅满目, 令人眼花缭乱。静下心来花了两周时间横向看了一下, 学习过程中, 记了一些笔记, 希望能够帮到大家。
近年来,全球开源生态迈向高速发展的崭新阶段,很多企业、社区和个人都将关注点聚焦在开源之上。其中,有些企业、社区和个人更是为开源成立专门的组织机构,抑或是给开源设定KPI指标,意在推动开源项目或开源社区的可持续发展。
MySQL 支持自然连接、等值连接(内连接)、左连接、右连接、交叉连接五种连接方式,不支持全外连接,全外连接可以通过 Union 并集操作实现。连接算法:简单嵌套循环、索引嵌套循环、块嵌套循环以及哈希连接。
各个工具类属于 Tianmu 引擎的核心组件,这些组件可以说是 Tianmu 的基石,由于工具类的范围广,在源码解读系列中会挑选主要的一些跟大家做分享,包括:日志系统、异常处理、堆栈跟踪、线程池、内存管理、数据压缩/解压缩等。本篇内容主要分享前面四点。
本文是 StoneDB 学术分享会专栏的第五篇,我们来分享一下 HTAP 学术界上比较经典的一篇论文《A Common Database Approach for OLTP and OLAP Using an In-Memory Column DataBase》。
深度学习等方法通过 “大” 数据来训练模型学习特征,使用的数据和算力都太大。虽然目前通过使用预训练模型的方式在很大程度上解决了这个问题。但是依然不够。能否通过小数据也训练出很好的模型呢?解决的方法是让小数据成为优质数据。许多学习方法都是监督学习的方式,需要对训练数据的特征进行标注。如果能挑选出有效的数据,并且进行准确的标注,通过优质数据训练出来的模型也有很好的泛化能力。设计一个有效甄别优质数据并能一致性标注的系统,以数据为中心的训练,这也就是 “以数据为中心” 的 AI 的理念转变。
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号