On Evaluation of Vision Datasets and Models using Human Competency Frameworks

Ramachandran, Rahul; Kulkarni, Tejal; Sharma, Charchit; Vijaykeerthy, Deepak; Balasubramanian, Vineeth N

Computer Science > Computer Vision and Pattern Recognition

arXiv:2409.04041 (cs)

[Submitted on 6 Sep 2024]

Title:On Evaluation of Vision Datasets and Models using Human Competency Frameworks

Authors:Rahul Ramachandran, Tejal Kulkarni, Charchit Sharma, Deepak Vijaykeerthy, Vineeth N Balasubramanian

View PDF HTML (experimental)

Abstract:Evaluating models and datasets in computer vision remains a challenging task, with most leaderboards relying solely on accuracy. While accuracy is a popular metric for model evaluation, it provides only a coarse assessment by considering a single model's score on all dataset items. This paper explores Item Response Theory (IRT), a framework that infers interpretable latent parameters for an ensemble of models and each dataset item, enabling richer evaluation and analysis beyond the single accuracy number. Leveraging IRT, we assess model calibration, select informative data subsets, and demonstrate the usefulness of its latent parameters for analyzing and comparing models and datasets in computer vision.

Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2409.04041 [cs.CV]
	(or arXiv:2409.04041v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2409.04041

Submission history

From: Rahl Ramachandran [view email]
[v1] Fri, 6 Sep 2024 06:20:11 UTC (1,601 KB)

Full-text links:

Access Paper:

view license

Current browse context:

cs.CV

< prev | next >

new | recent | 2024-09

Change to browse by:

References & Citations

export BibTeX citation

Computer Science > Computer Vision and Pattern Recognition

Title:On Evaluation of Vision Datasets and Models using Human Competency Frameworks

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:On Evaluation of Vision Datasets and Models using Human Competency Frameworks

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators