高维空间向量搜索—腾讯词向量相似检索实践最近工作上遇到一些语料OOV问题,想到可以使用同义词进行替换来弥补部分OOV带来的问题,于是就有了本篇博客的相关实验。 最简单的可以使用gemsim在语料库上训练一个word2vec,然后使用gemsim自带的相似度API直接进行计算,这种方法是最简单的(不考虑内存消耗,计算时间的情况下)。但是自己的语料本身就有OOV问题,训练后,估计效果也不行,于是想到使            
                
         
            
            
            
            这个题目有点儿无聊,跟茴香豆的“茴”字有几种写法一样无聊,又是一个无聊的老掉牙的话题——排序,问题依然是无聊至极——把输入的单词按顺序(我可没说是什么顺序)排列。当作是一个总结吧。按词典排好说,如果你用vector<string> words存储单词,只需用algorithm里的sort即可:sort(words.begin(),words.end())。这玩意儿我闭着眼也能敲出来。但            
                
         
            
            
            
             1、创建索引对于查询占主要的应用来说,索引显得尤为重要。很多时候性能问题很简单的就是因为我们忘了添加索引而造成的,或者说没有添加更为有效的索引导致。如果不加索引的话,那么查找任何哪怕只是一条特定的数据都会进行一次全表扫描,如果一张表的数据量很大而符合条件的结果又很少,那么不加索引会引起致命的性能下降。但是也不是什么情况都非得建索引不可,比如性别可能就只有两个值,建索引不仅没什么优势,还            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-06 11:04:18
                            
                                40阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            对复合索引,按照字段在查询条件中出现的频度建立索引。在复合索引中,记录首先按照第一个字段排序。对于在第一个字段上取值相同的记录,系统再按照第二个字段的取值排序,以此类推。因此只有复合索引的第一个字段出现在查询条件中,该索引才可能被使用,因此将应用频度高的字段,放置在复合索引的前面,会使系统最大可能地使用此索引,发挥索引的作用。二、多列索引适合的场景    &            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-19 22:49:18
                            
                                25阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            elasticsearch  索引过程            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2017-09-05 10:59:55
                            
                                3076阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            术语:Event :Events are records of activity in log files, stored in Splunk indexes. 简单说,处理的日志或话单中中一行记录就是一个Event;Source type: 来源类型,identifies the format of the data,简单说,一种特定格式的日志,可以定义为一种source type;Splunk            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-06-02 17:16:05
                            
                                237阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            IndexSearcher searcher = null;
        try {
            QueryParser parser            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2015-12-10 14:40:58
                            
                                448阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            我觉得数据库表的建立的优缺点如下:优点:第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。第二,可以大大加快 数据的检索速度,这也是创建索引的最主要的原因。第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。第四,在使用分组和排序 子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。第五,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-10 15:15:18
                            
                                24阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、一些常见的SQL实践(1)负向条件查询不能使用索引• select * from order where status!=0 and stauts!=1not in/not exists都不是好习惯 可以优化为in查询:• select * from order where status in(2,3)(2)前导模糊查询不能使用索引• select * from order wher            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-23 09:19:46
                            
                                26阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1.创建索引要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引 在经常需要进行检索的字段上创建索引,比如要按照表字段username进行检索,那么就应该在姓名字段上创建索引,如果经常要按照员工部门和员工岗位级别进行检索,那么就应该在员工部门和员工岗位级别这两个字段上创建索引。 创建索引给检索带来的性能提升往往是巨大的,因此在发现检索速度过慢的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-24 09:25:42
                            
                                14阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、MySQL1、索引概念:索引是一种数据结构。数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。索引的实现通常使用B树及其变种B+树。更通俗的说,索引就相当于目录。为了方便查找书中的内容,通过对内容建立索引形成目录。而且索引是一个文件,它是要占据物理空间的。索引的优点可以大大加快数据的检索速度,这也是创建索引的最主要的原因。树的高度就是IO次数。通过使用索引,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-03 12:36:06
                            
                                19阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            【Mysql优化01】优化分析-7种join和索引命令(1)认识7种join,学习索引命令(1.1)sql性能下降的原因(执行时间长、等待时间长)(1.1.1)排查性能下降的原因(1.1.2)分析性能下降的原因(1.1.3)Mysql常见瓶颈(1.1.4)Mysql逻辑架构(1.2)常见通用的join查询(1.2.1)sql执行顺序(1.2.2)常见的join查询图(七种)(1.2.3)建表sq            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-22 02:08:52
                            
                                53阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录:一、结构介绍       1)Historical Node       2)Broker Node       3)Coordina            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-12-28 15:02:30
                            
                                286阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.什么原因导致数据库性能瓶颈问题  1.数据库连接数  2.表数据量大(你可能会加索引,加索引后,命中索引还好;如果命不中索引,将会进行全表扫描,数据量越大,效率越低)(数据库索引,是硬盘级别的索引。基础B树实现,它是存储在硬盘里面 IO 操作。索引越多,树越大,查询效率也会降低)  3.硬件资源问题导致瓶颈(QPS/TPS) (每秒事务数/每秒查询数)2            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-18 12:44:50
                            
                                35阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            产生背景地理空间数据涉及各种海量且复杂的数据,找到合适的索引对空间数据的处理至关重要。 传统的B树索引针对字符、数字等一维属性数据的主关键字而设计,不适用于具有多维性的地理空间数据。 在GIS和CAD系统对空间索引需求的推动下,为满足二维及多维空间数据快速检索与分析, Guttman于1984年提出了R树索引结构。常用的空间数据查询方式窗口查询:给定一个查询窗口(通常是一个矩形),返回与查询窗口相            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-20 17:27:45
                            
                                31阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            创建索引的好处  –帮助用户提高查询速度  –利用索引的唯一性来控制记录的唯一性  –可以加速表与表之间的连接  –降低查询中分组和排序的时间  ?创建索引的坏处 –存储索引占用磁盘空间 –执行数据修改操作(INSERT、UPDATE、DELETE)产生索引维护   ----------------------------------------            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-23 12:02:43
                            
                                25阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            [b]问题场景1[/b]:新增收款也没,速度响应太慢。数据库服务器CPU占用持续飚到90%以上。 
运行环境:32位Win Server 2003企业版上装了SQL Server 2005 开发者版,AWE未成功开启。6G内存里,SQL Server只用到不到2G。 
原因:三张核心大表上索引过多(每张表几十条索引……),且表上索引碎片过多,之前添加的索引            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-24 12:23:55
                            
                                46阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            使用批量索引加快索引过程 为了执行批量请求,Elasticsearch提供了_bulk端点,形式可以是/_bulk,也可以是/index_ name/_bulk,甚至是/index_name/type_name/_bulk。第二种和第三种形式定义了索引名称 和类型名称的默认值。可以在请求的信息行中省            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2018-06-04 09:00:00
                            
                                113阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            1. InnoDB 中的索引InnoDB 中的索引自然也是按照 B+树来组织的,前面我们说过 B+树的叶子节 点用来放数据的,但是放什么数据呢?索引自然是要放的,因为 B+树的作用本 来就是就是为了快速检索数据而 出的一种数据结构,不放索引放什么呢?但是 数据库中的表,数据才是我们真正需要的数据,索引只是辅助数据,甚至于一个 表可以没有自定义索引。InnoDB 中的数据到底是如何组织的?1. 聚集            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-20 15:57:42
                            
                                32阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.索引的概念---索引是一种有效组合数据的方式,通过索引可以快速的查找到数据库对象表中的特定记录。一个索引会包含表中按照一定顺序排序的一列或多列字段。由表中的一个字段或多个字段生成的键组成,这些键存储在数据结构中(B-树或哈希表)。可将索引分为B型树索引和哈希索引。 MYSQL支持6种索引:普通索引、唯一索引、全文索引、单列索引、多列索引、空间索引。2.索引的基本操作---包括创建、查            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-24 10:36:50
                            
                                40阅读