Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search

Dai, Xinyan; Yan, Xiao; Ng, Kelvin K. W.; Liu, Jie; Cheng, James

Computer Science > Information Retrieval

arXiv:1911.04654 (cs)

[Submitted on 12 Nov 2019 (v1), last revised 20 Nov 2019 (this version, v2)]

Title:Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search

Authors:Xinyan Dai, Xiao Yan, Kelvin K. W. Ng, Jie Liu, James Cheng

View PDF

Abstract:Vector quantization (VQ) techniques are widely used in similarity search for data compression, fast metric computation and etc. Originally designed for Euclidean distance, existing VQ techniques (e.g., PQ, AQ) explicitly or implicitly minimize the quantization error. In this paper, we present a new angle to analyze the quantization error, which decomposes the quantization error into norm error and direction error. We show that quantization errors in norm have much higher influence on inner products than quantization errors in direction, and small quantization error does not necessarily lead to good performance in maximum inner product search (MIPS). Based on this observation, we propose norm-explicit quantization (NEQ) --- a general paradigm that improves existing VQ techniques for MIPS. NEQ quantizes the norms of items in a dataset explicitly to reduce errors in norm, which is crucial for MIPS. For the direction vectors, NEQ can simply reuse an existing VQ technique to quantize them without modification. We conducted extensive experiments on a variety of datasets and parameter configurations. The experimental results show that NEQ improves the performance of various VQ techniques for MIPS, including PQ, OPQ, RQ and AQ.

Subjects:	Information Retrieval (cs.IR); Machine Learning (cs.LG)
Cite as:	arXiv:1911.04654 [cs.IR]
	(or arXiv:1911.04654v2 [cs.IR] for this version)
	https://doi.org/10.48550/arXiv.1911.04654

Submission history

From: Xinyan Dai [view email]
[v1] Tue, 12 Nov 2019 03:35:17 UTC (2,347 KB)
[v2] Wed, 20 Nov 2019 05:56:21 UTC (984 KB)

Full-text links:

Access Paper:

view license

Current browse context:

cs.IR

< prev | next >

new | recent | 2019-11

Change to browse by:

cs
cs.LG

References & Citations

DBLP - CS Bibliography

listing | bibtex

Xinyan Dai
Xiao Yan
Kelvin Kai Wing Ng
Jie Liu
James Cheng

export BibTeX citation

Computer Science > Information Retrieval

Title:Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search

Submission history

Access Paper:

References & Citations

DBLP - CS Bibliography

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Information Retrieval

Title:Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search

Submission history

Access Paper:

References & Citations

DBLP - CS Bibliography

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators