Python 发展历史 python的创始人 吉多·范罗苏姆 1989年圣诞期间开发的一个新的脚本解释程序,作为ABC语言的继承 Python 是由 Guido van Rossum 在八十年代末和九十年代初,在荷兰国家数学和计算机科学研究所设计出来的。 Python 本身也是由诸多其他语言发展而来的,这包括 ABC、Modula-3、C、C++、Algol-68、SmallTalk、Unix
转载 2023-09-11 20:21:16
20阅读
Python annoy是一个用于快速近似最近邻搜索的Python库。它基于Spotify开发的Annoy库,旨在提供高效的相似向量搜索功能。Annoy库通过使用随机投影树(Random Projection Trees)构建索引,从而能够在大型数据集上快速查找最近邻。 ## 安装Python annoy 要安装Python annoy,可以使用pip工具进行安装: ```bash pip i
原创 2024-04-04 05:52:22
123阅读
###Today's topic ###THINGS THAT ANNOY US What makes you mad about your city? Discuss what bad habits people have and what annoys you the most. Sleep l ...
转载 2021-05-13 23:59:00
213阅读
2评论
1)数学对象1.1. 标量标量就是一个简单的数,比如241.2. 向量向量是一个有序数组,能够写成一行或者一列的形式。向量只包含一个索引,用来表示向量中的某个特定元素。比如v_2表示向量中的第二个元素,即上图中的-81.3. 矩阵矩阵是一个有序的二维数组,有两个索引。第一个索引表示行,第二个索引表示列。例如M_23表示的是第二行、第三列的元素,即上图中的91.4. 张量三维张量是按照一定规律排列在
1 索引建立常用原则 高离散度:表的某个字段值得离散度越高,该字段越适合选作索引的关键字。内存占用少:占用存储空间少的字段更适合选作索引的关键字最左前缀原则经常修改的不适合做索引2 索引失效1.如果条件中有or,即使其中有条件带索引也不会使用(这也是为什么尽量少用or的原因) 注意:要想使用or,又想让索引生效,只能将or条件中的每个列都加上索引2.对于多列索引,不满足最佳左前3.lik
转载 2024-03-20 21:37:12
52阅读
首先介绍annoy :Annoy是高维空间求近似最近邻的一个开源库。Annoy构建一棵二叉树,查询时间为O(logn)。Annoy通过随机挑选两个点,并使用垂直于这个点的等距离超平面将集合划分为两部分。如图所示,图中灰色线是连接两个点,超平面是加粗的黑线。按照这个方法在每个子集上迭代进行划分。依此类推,直到每个集合最多剩余k个点,下图是一个k = 10 的情况。  n_trees在构建时提供,并影
原创 2022-04-11 14:23:31
2098阅读
检查信息:# cat /etc/redhat-release CentOS Linux release 7.2.1511 (Core)# python -VPython 2.7.5安装
原创 2022-06-16 07:05:44
336阅读
许多读者都问我Python和Django怎么安装,虽然官网上有教程,但是都是英文的,而且也不知道他用的是什么操作系统,我在这里就简单地介绍一下这两个软件在Windows XP下的安装步骤吧。1.Python安装步骤  Python的安装感觉没什么好介绍的,就是下一步下一步,直到完成。然后在环境变量的Path中添加Python的安装路径,如  我的Python的安装路径是D:\Program Fil
Annoy是高维空间求近似最近邻的一个开源库。Annoy构建一棵二叉树,查询时间为O(logn)。Annoy通过随机挑选两个点,并使用垂直于这个点的等距离超平面将集合划分为两部分。如图所示,图中灰色线是连接两个点,超平面是加粗的黑线。按照这个方法在每个子集上迭代进行划分。依此类推,直到每个集合最多剩余k个点,下图是一个k = 10 的情况。相应的完整二叉树结构:随机投影森林。一个思想依据是:在原空
转载 2024-07-02 22:59:36
38阅读
annoy快速查询数百万级别的近似向量 需求:有800万的中文词向量,要查询其中任意一个词向量对应的k个与其最邻近的向量。通常情况下如果向量集比较小的话,几十万个向量(几个G这种),我们都可以用gensim的word2vec来查找,但是880万词向量有16个G,加到内存中就爆炸了,而且gensim中的查找属于暴力搜索,即全都遍历比较余弦相似度来进行查找,
转载 2024-05-19 08:04:44
77阅读
索引是经常用到的技术,但有些程序员对索引的原理了解不深,发现数据查询性能有问题立刻就想起建索引,但效果常常也不尽人意。那么到底什么时候该用索引以及该怎么用?我们来分析索引清理背后的技术原理就知道了。基本原理索引技术的初衷是为了快速从一个大数据集中找出某个字段等于确定值(比如按身份证号找出某个人)的记录。一个规模(行数)为N的数据集,用遍历查找则需要比较N次,而如果数据是按该字段值(在索引中称为键值
作者 | 郭人通 提到搜索引擎,大家首先想到的一般是ElasticSearch。在文本作为信息主要载体的阶段,ElasticSearch技术栈是文本搜索的最佳实践。然而目前搜索领域的数据基础发生了深刻的变化,远远超过文本的范畴。视频、语音、图像、文本、社交关系、时空数据等非结构化数据构筑了更加“立体”的语义基础。传统的文本搜索技术与实践方法很难套用到新兴的数据搜索场景上。主要的原因是,在非结构化数
上周《玩转腾讯词向量:词语相似度计算和在线查询》推出后,有同学提到了annoy,我其实并没有用annoy,不过对annoy很感兴趣,所以决定用annoy试一下腾讯 AI Lab 词向量。学习一个东西最直接的方法就是从官方文档走起:https://github.com/spotify/annoy , Annoy是Spotify开源的一个用于近似最近邻查询的C++/Python工具,对内存使用进行了优
原创 2021-03-31 19:31:58
699阅读
原创 · 作者 | Giant学校 | 浙江大学研究方向 | 对话系统、text2sql知乎专栏 | 大熊猫游乐园1、什么是K近邻算法K近邻算法(KNN)是一种常用的分类和回归方法,它的基本思想是从训练集中寻找和输入样本最相似的k个样本,如果这k个样本中的大多数属于某一个类别,则输入的样本也属于这个类别。关于KNN算法,一个核心问题是:如何快速从数据集中找到和目标样本最接近的K个样本?本文将从这个
原创 2021-03-28 23:00:20
1058阅读
 一、GitHub简介GitHub是一个面向开源及私有软件项目的托管平台,只支持 Git 作为唯一的版本库格式进行托管,故名 GitHub。。git是一个开源的分布式版本控制系统,用以有效、高速的处理从很小到非常大的项目版本管理。除了Git代码仓库托管及基本的Web管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱、代码片段分享等功能。。GitHub可以托管各种git
转载 2023-07-27 23:36:48
254阅读
6.5 GitHub - 脚本 GitHub版本说明版本作者日期备注0.1loon2019.3.29初稿目录文章目录6.5 GitHub - 脚本 GitHub版本说明目录脚本 GitHub1、钩子2、服务Figure 130. 服务与钩子配置区域Figure 131. 电子邮件服务配置3、钩子Figure 132. Web 钩子配置Figure 133...
转载 2022-07-12 17:10:35
760阅读
一、第一步 注册github账号 1.注册界面 https://github.com/,如下图: 2.下注册流程 3.上面简单的输入一下用户名、邮箱地址、密码点击创建即可,进入下一步,如下图: 如果勾选了“Help me set up an organization next” 就会进入创建organization的流程。(我注册的时候选了,创建了个组织,觉得个人用户创建这个没什么用,后面
转载 5月前
110阅读
什么是 Github ?github是一个基于git的代码托管平台,付费用户可以建私人仓库,我们一般的免费用户只能使用公共仓库,也就是代码要公开,算是一个开源平台吧。Github 注册打开访问:https://github.com/                       
转载 2024-02-07 10:47:04
228阅读
系列文章.Net 微服务实战之技术选型篇.Net 微服务实战之技术架构分层篇.Net 微服务实战之 DevOps 篇分布式?集群?负载均衡? 我曾经面试过一家企业,当时描述完我在老东家完成的微服务架构后,面试官问了我一个问题: 面试官:您有做过分布式系统吗? 我:有,刚刚我描述的微服务架构就是分布式的…… 面试官:不不不,我意思是你有没有尝试过把一个站点部署到多台服务器
简单说,只需要三步,就可以在 Github 搭建起一个博客:在 Github 上建一个名为 xxx.github.io 的库;把看中了的 Jekyll 模板 clone 到本地;把这个模板 push 到自己的库;下面为了从头展示如何用 Git + Github + Jekyll 搭建博客。  一、在 Github 创建名为 username.github.io 的库   按照 
转载 2024-05-21 14:32:15
111阅读
  • 1
  • 2
  • 3
  • 4
  • 5