Modeling Beyond MOS: Quality Assessment Models Must Integrate Context, Reasoning, and Multimodality

Kerkouri, Mohamed Amine; Tliba, Marouane; Chetouani, Aladine; Aburaed, Nour; Bruno, Alessandro

Computer Science > Computer Vision and Pattern Recognition

arXiv:2505.19696 (cs)

[Submitted on 26 May 2025]

Title:Modeling Beyond MOS: Quality Assessment Models Must Integrate Context, Reasoning, and Multimodality

Authors:Mohamed Amine Kerkouri, Marouane Tliba, Aladine Chetouani, Nour Aburaed, Alessandro Bruno

View PDF HTML (experimental)

Abstract:This position paper argues that Mean Opinion Score (MOS), while historically foundational, is no longer sufficient as the sole supervisory signal for multimedia quality assessment models. MOS reduces rich, context-sensitive human judgments to a single scalar, obscuring semantic failures, user intent, and the rationale behind quality decisions. We contend that modern quality assessment models must integrate three interdependent capabilities: (1) context-awareness, to adapt evaluations to task-specific goals and viewing conditions; (2) reasoning, to produce interpretable, evidence-grounded justifications for quality judgments; and (3) multimodality, to align perceptual and semantic cues using vision-language models. We critique the limitations of current MOS-centric benchmarks and propose a roadmap for reform: richer datasets with contextual metadata and expert rationales, and new evaluation metrics that assess semantic alignment, reasoning fidelity, and contextual sensitivity. By reframing quality assessment as a contextual, explainable, and multimodal modeling task, we aim to catalyze a shift toward more robust, human-aligned, and trustworthy evaluation systems.

Comments:	Under review
Subjects:	Computer Vision and Pattern Recognition (cs.CV); Multimedia (cs.MM); Image and Video Processing (eess.IV)
Cite as:	arXiv:2505.19696 [cs.CV]
	(or arXiv:2505.19696v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2505.19696

Submission history

From: Mohamed Amine Kerkouri [view email]
[v1] Mon, 26 May 2025 08:52:02 UTC (273 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:Modeling Beyond MOS: Quality Assessment Models Must Integrate Context, Reasoning, and Multimodality

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:Modeling Beyond MOS: Quality Assessment Models Must Integrate Context, Reasoning, and Multimodality

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators