eDCF: Estimating Intrinsic Dimension using Local Connectivity

Gupta, Dhruv; Nagarsekar, Aditya; Shah, Vraj; Thomas, Sujith

Computer Science > Machine Learning

arXiv:2510.16513 (cs)

[Submitted on 18 Oct 2025]

Title:eDCF: Estimating Intrinsic Dimension using Local Connectivity

Authors:Dhruv Gupta, Aditya Nagarsekar, Vraj Shah, Sujith Thomas

View PDF

Abstract:Modern datasets often contain high-dimensional features exhibiting complex dependencies. To effectively analyze such data, dimensionality reduction methods rely on estimating the dataset's intrinsic dimension (id) as a measure of its underlying complexity. However, estimating id is challenging due to its dependence on scale: at very fine scales, noise inflates id estimates, while at coarser scales, estimates stabilize to lower, scale-invariant values. This paper introduces a novel, scalable, and parallelizable method called eDCF, which is based on Connectivity Factor (CF), a local connectivity-based metric, to robustly estimate intrinsic dimension across varying scales. Our method consistently matches leading estimators, achieving comparable values of mean absolute error (MAE) on synthetic benchmarks with noisy samples. Moreover, our approach also attains higher exact intrinsic dimension match rates, reaching up to 25.0% compared to 16.7% for MLE and 12.5% for TWO-NN, particularly excelling under medium to high noise levels and large datasets. Further, we showcase our method's ability to accurately detect fractal geometries in decision boundaries, confirming its utility for analyzing realistic, structured data.

Comments:	58 pages (35 (main) + 23 (appendix)), 54 figures (27 (main) + 27 (appendix))
Subjects:	Machine Learning (cs.LG); Machine Learning (stat.ML)
Cite as:	arXiv:2510.16513 [cs.LG]
	(or arXiv:2510.16513v1 [cs.LG] for this version)
	https://doi.org/10.48550/arXiv.2510.16513

Submission history

From: Aditya Nagarsekar [view email]
[v1] Sat, 18 Oct 2025 14:00:39 UTC (4,703 KB)

Computer Science > Machine Learning

Title:eDCF: Estimating Intrinsic Dimension using Local Connectivity

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Machine Learning

Title:eDCF: Estimating Intrinsic Dimension using Local Connectivity

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators