Nmslib高维空间最近邻逼近搜索算法介绍

  • 时间:
  • 浏览:0
  • 来源:神彩UU直播现场_彩神UU直播现场官方

项目地址:https://github.com/nmslib/nmslib

非度量空间库(NMSLIB)是你这种高效的跨平台类事性搜索库和用于评估类事性搜索最好的最好的辦法 的工具包。核心库并越来越任何第三方依赖。

NMSLIB是有一个 可扩展的库,这是因为分析可以 加在新的搜索最好的最好的辦法 和距离函数。NMSLIB可以 直接在C ++和Python中使用。此外,还可以 构建有一个 查询服务器,可以 从Java(或Apache Thrift支持的有些语言)中使用。

这里介绍python的使用最好的最好的辦法 。

关于参数的设置可以 见

越来越等你算完,使用者的心就哇凉哇凉的,越来越耐心守候的,而使用淘宝拍立淘的以前,响应传输下行速率 非常快,用户体验很好!

你这种以前就必须考虑使用有些快速计算的最好的最好的辦法 ——ANN。

一看到ANN,第一反应应该是人工神经网络,这里是Approximate Nearest Neighbor,近似邻居算法。

关于这方面的算法有要是,比如Annoyscikit-learnhnswlib, nmslib等等。

几乎所有的ANN最好的最好的辦法 完整都是对全空间的划分,大多数使用的树模型,完整的介绍可以 上网查询一下,这里介绍当时人使用过的nmslib包讲解。

上一次介绍图像搜索的基本原理,现在记录下使用的数据包的问提。

查询图片先进行价值形式提取,使用有一个 向量来表示,以前使用该向量与数据库中所有的商品向量进行计算类事度指标,比如cos距离,欧式距离,汉明距离。

具体的取决于向量的形式,有的先用cnn提取价值形式向量,可以 计算其cos距离,有的提取以前对其进行哈希编码,先用汉明距离进行粗排,以前按照欧式距离进行重排。

这里就面临曾经的有一个 问提:

上述代码要是片段,完整讲解下各个参数的设置