在本文中,我们将介绍Cassandra名字的含义、Cassandra的发展简史、Cassandra这项技术的特点及优势,以及对于这项技术的未来展望。本文将用浅显易懂的方式,帮助您将对Cassandra这项技术的前世今生有一个粗略的了解。 谁是Cassandra Apache Cassandra™是一种分布式的NoSQL数据库。它具有成功应用所需的持续可用性、高性能、可线性扩展等            
                
         
            
            
            
            浅谈向量数据库 文章目录浅谈向量数据库1. 背景2. 核心技术演进3. 常见的向量数据库4. 总结 1. 背景信息有多种形式。有些信息是非结构化的,例如文本文档、富媒体和音频,有些则是结构化的,例如应用程序日志、表格和图表。人工智能和机器学习(AI/ML)的创新使我们能够创建一种机器学习模型,即嵌入模型。向量数据库能够将向量存储为高维点并进行检索。这些数据库增加了额外的功能,可以高效、快速地查找            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-10-09 13:37:47
                            
                                91阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            文章目录数值类型数值精度待优化张量创建张量从数组、列表对象创建创建全 0 或全 1 张量创建自定义数值张量创建已知分布的张量创建序列文章来源  TensorFlow 中的基本数据类型,包含数值类型、 字符串类型和布尔类型。 数值类型数值类型的张量是 TensorFlow 的主要数据载体, 根据维度数来区分,可分为: 数值类型的张量是 TensorFlow 的主要数据载体, 根据维度数来区分,可分            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-02 19:26:36
                            
                                188阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            在上一篇文章中我们大致讲述了一下如何通过词嵌入向量的方式为大语言模型增加长期记忆,用于落地在私域场景的问题。其中涉及到使用openai的接口进行词嵌入向量的生成以及chat模型的调用由于众所周知的原因,国内调用openai接口并不友好,所以今天介绍两款开源平替实现分别替代词嵌入向量和文本生成。照例还是简单绘制一下拓扑图: 从拓扑上来看还是比较简单的,一个后端服务用于业务处理,两个AI模型            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-07 13:50:43
                            
                                215阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Linux环境对大多数SQL初学者还是比较陌生,今天给大家演示一下如何在Linux环境下安装MySQL数据库。测试环境CentOS 7.0创建用户我们进入到CentOS后,打开终端命令窗口,新建一个msql用户,并输入密码注意:这里提示新的密码必须不少于8个字符,只是警告而已,可以不用理会。下载MySQL我们去MySQL的官网下载我们需要的安装包,这里我们下载5.6.64版本的。地址:https:            
                
         
            
            
            
            作者:YAN左使本文基于openGauss在VLDB2021上最新发表的论文《openGauss: An Autonomous Database System》,从学术的角度来探究openGauss如何基于各种AI技术构建一个智能的自治数据库系统。论文作者是清华大学李国良教授,他同时也是openGauss的总架构师。1. 摘要虽然近年来基于学习的数据库优化技术在学术界得到了广泛的研究,但很多技术还            
                
         
            
            
            
            数据结构:数据项的结构化集合,数据项之间的相互联系及作用。数据结构大致划分为三大类:线性结构,半线性结构,非线性结构。最基本的线性结构统称为 序列(sequence),根据其中数据项的逻辑次序与物理存储地址的对应关系不同,又可进一步的将序列区分为 向量(vector)和 列表(list)。在向量中,所有数据项的物理存放位置与其逻辑次序完全吻合,此时的逻辑次序也称作 秩(rank);在列表            
                
         
            
            
            
             vector 称为向量,是一种类模板,其声明包含在头文件< vector>中,所以使用veto 时需要包含头文件< vector> 。 vector是一种支持高效地随机访问和高效地向尾部插入新元素的容器,它一般实现为一 个动态分配的数组,所以在程序开发过程中,使用vector作为动态数组是非常方便的 类 似于数组, vector分配连续的存储空间存储数据,个相邻            
                
         
            
            
            
                对于从sqlserver中导入、导出excel,虽然sqlserver已经给了较为简单的方式,通过交互式的对话框形式实现,但是有时这种方式存在的很多问题,比方说导入、导出数据不全。而且,对于一个项目而言,我们都不希望功能的实现离开该软件程序。因此,我们便想着用程序来实现sqlserver的导入导出。一、从sqlserver中导出excel表  &nb            
                
         
            
            
            
            使用elasticSearch的向量检索实现以图搜图 文章目录使用elasticSearch的向量检索实现以图搜图前言快速开始安装elasticsearch和kibana创建索引下载项目效果展示总结参考资料 前言项目地址:https://github.com/xjhqre/sis/tree/v1.0在搭建本地以图搜图服务文章中实现了以图搜图,但还是存在一些问题,程序启动时需要加载大量的特征文件到内            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-19 15:00:32
                            
                                206阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
              
      错过上篇的同学可以点击标题回顾   
       
      三、Milvus 是什么?   Milvus 是 一款开源的、针对海量特征向量的相似性搜索引擎。Milvus能够很好地应对海量向量数据,它集成了目前在向量相似性计算领域比较知名的几个开源库(Faiss, SPTAG等),通过对数据和硬件算力的合理调度,以获得最优的搜索性能。             
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-30 11:15:27
                            
                                681阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            词向量,英文名叫Word Embedding,按照字面意思,应该是词嵌入。说到词向量,不少读者应该会立马想到Google出品的Word2Vec,大牌效应就是不一样。另外,用Keras之类的框架还有一个Embedding层,也说是将词ID映射为向量。由于先入为主的意识,大家可能就会将词向量跟Word2Vec等同起来,而反过来问“Embedding是哪种词向量?”这类问题,尤其是对于初学者来说,应该是            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-29 12:30:36
                            
                                157阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Elasticsearch 从 2022 年 2 月发布的 8.0 版本开始,提供了基于向量的搜索和自然语言处理(NLP)功能。 下图清楚地展示            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-07-16 10:00:29
                            
                                2622阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            ?向量数据库-十步让你了解✅向量数据库专为处理向量嵌入而设计,通过近似最近邻(ANN)搜索,快速检索相似向量,支持文本、图像、音频等            
                
         
            
            
            
            (一)Milvus是什么? Milvus 是 一款开源的、针对海量特征向量的相似性搜索引擎。Milvus能够很好地应对海量向量数据,它集成了目前在向量相似性计算领域比较知名的几个开源库(Faiss, SPTAG等),通过对数据和硬件算力的合理调度,以获得最优的搜索性能。 用户只需要从docker hub上下载一个Milvus的最新镜像,一行命令即可启动,然后可以通过Python SDK或者Java            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-11 09:09:20
                            
                                164阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            什么是MilvusMilvus 是一款云原生向量数据库,它具备高可用、高性能、易拓展的特点,用于海量向量数据的实时召回。Milvus 基于 FAISS、Annoy、HNSW 等向量搜索库构建,核心是解决稠密向量相似度检索的问题。在向量检索库的基础上,Milvus 支持数据分区分片、数据持久化、增量数据摄取、标量向量混合查询、time travel 等功能,同时大幅优化了向量检索的性能,可满足任何向            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-27 14:52:20
                            
                                363阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录一.milvus是什么二.安装milvus三.使用milvus四.总结 一.milvus是什么milvus 是一款开源的向量相似度搜索引擎,支持针对 TB 级向量的增删改操作和近实时查询,具有高度灵活、稳定可靠以及高速查询等特点。milvus 还可以对标量数据进行过滤,进一步提高了召回率,增强了搜索的灵活性。在服务端,milvus 由 Milvus Core 和 Meta Store 两            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-26 12:29:55
                            
                                144阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            faiss包装与性能对比在NLP的应用中,经常需要用到对向量的搜索,如果向量的数量级非常大,比如1千万,甚至上亿条,普通的方式就满足不了生产需要了,falcebook开源的faiss框架能够解决“海量向量搜索”的问题。在网上也有很多faiss的相关文章,大多都是介绍安装以及对官方demo的运行测试。到底faiss的速度如何,使用内存情况如何,如何把faiss包装成服务与项目结合,带着这些问题,笔者            
                
         
            
            
            
            在《维基》的解释是:矢量(英语:Vector)是数学、物理学和工程科学等多个自然科学中的基本概念,指一个同时具有大小和方向的几何对象,因常常以箭头符号标示以区别于其它量而得名。直观上,矢量通常被标示为一个带箭头的线段(如右图)。线段的长度可以表示矢量的大小,而矢量的方向也就是箭头所指的方向。物理学中的位移、速度、力、动量、磁矩、电流密度等,都是矢量。与矢量概念相对的是只有大小而没有方向的标量。 在            
                
         
            
            
            
            word embedding:NLP语言模型中对单词处理的一种方式,这种技术会把单词或者短语映射到一个n维的数值化向量,核心就是一种映射关系,主要分为两种方式:1.one hot encoding:对语料库中的每个单词都用一个n维的one hot向量表示,其中n为语料库中不同单词的个数。这种方法的原理是把语料库中的不同单词排成一列,对于单词A,它在语料库中的位置为k,则它的向量表示为第k位为1,其            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-24 12:10:17
                            
                                154阅读
                            
                                                                             
                 
                
                                
                    