Výsledky vyhledávání - "Sharma, Rajesh"

Report

Representation Loss Minimization with Randomized Selection Strategy for Efficient Environmental Fake Audio Detection

Autor: Phukan, Orchid Chetia, Girish, Akhtar, Mohd Mujtaba, Behera, Swarup Ranjan, Choudhury, Nitin, Buduru, Arun Balaji, Sharma, Rajesh, Prasanna, S. R Mahadeva

The adaptation of foundation models has significantly advanced environmental audio deepfake detection (EADD), a rapidly growing area of research. These models are typically fine-tuned or utilized in their frozen states for downstream tasks. However,

Externí odkaz: http://arxiv.org/abs/2409.15767

Zobrazit plný text záznamu

Report

Avengers Assemble: Amalgamation of Non-Semantic Features for Depression Detection

Autor: Phukan, Orchid Chetia, Behera, Swarup Ranjan, Singh, Shubham, Singh, Muskaan, Rajan, Vandana, Buduru, Arun Balaji, Sharma, Rajesh, Prasanna, S. R. Mahadeva

In this study, we address the challenge of depression detection from speech, focusing on the potential of non-semantic features (NSFs) to capture subtle markers of depression. While prior research has leveraged various features for this task, NSFs-ex

Externí odkaz: http://arxiv.org/abs/2409.14312

Zobrazit plný text záznamu

Report

Strong Alone, Stronger Together: Synergizing Modality-Binding Foundation Models with Optimal Transport for Non-Verbal Emotion Recognition

Autor: Phukan, Orchid Chetia, Akhtar, Mohd Mujtaba, Girish, Behera, Swarup Ranjan, Kalita, Sishir, Buduru, Arun Balaji, Sharma, Rajesh, Prasanna, S. R Mahadeva

In this study, we investigate multimodal foundation models (MFMs) for emotion recognition from non-verbal sounds. We hypothesize that MFMs, with their joint pre-training across multiple modalities, will be more effective in non-verbal sounds emotion

Externí odkaz: http://arxiv.org/abs/2409.14221

Zobrazit plný text záznamu

Report

Are Music Foundation Models Better at Singing Voice Deepfake Detection? Far-Better Fuse them with Speech Foundation Models

Autor: Phukan, Orchid Chetia, Jain, Sarthak, Behera, Swarup Ranjan, Buduru, Arun Balaji, Sharma, Rajesh, Prasanna, S. R Mahadeva

In this study, for the first time, we extensively investigate whether music foundation models (MFMs) or speech foundation models (SFMs) work better for singing voice deepfake detection (SVDD), which has recently attracted attention in the research co

Externí odkaz: http://arxiv.org/abs/2409.14131

Zobrazit plný text záznamu

Report

A Fine-grained Sentiment Analysis of App Reviews using Large Language Models: An Evaluation Study

Autor: Shah, Faiz Ali, Sabir, Ahmed, Sharma, Rajesh

Analyzing user reviews for sentiment towards app features can provide valuable insights into users' perceptions of app functionality and their evolving needs. Given the volume of user reviews received daily, an automated mechanism to generate feature

Externí odkaz: http://arxiv.org/abs/2409.07162

Zobrazit plný text záznamu

Report

Who Checks the Checkers? Exploring Source Credibility in Twitter's Community Notes

Autor: Kangur, Uku, Chakraborty, Roshni, Sharma, Rajesh

In recent years, the proliferation of misinformation on social media platforms has become a significant concern. Initially designed for sharing information and fostering social connections, platforms like Twitter (now rebranded as X) have also unfort

Externí odkaz: http://arxiv.org/abs/2406.12444

Zobrazit plný text záznamu

Report

AVR: Synergizing Foundation Models for Audio-Visual Humor Detection

Autor: Sharma, Sarthak, Phukan, Orchid Chetia, Singh, Drishti, Buduru, Arun Balaji, Sharma, Rajesh

In this work, we present, AVR application for audio-visual humor detection. While humor detection has traditionally centered around textual analysis, recent advancements have spotlighted multimodal approaches. However, these methods lean on textual c

Externí odkaz: http://arxiv.org/abs/2406.10448

Zobrazit plný text záznamu

Report

Towards Multilingual Audio-Visual Question Answering

Autor: Phukan, Orchid Chetia, Mallick, Priyabrata, Behera, Swarup Ranjan, Narayani, Aalekhya Satya, Buduru, Arun Balaji, Sharma, Rajesh

In this paper, we work towards extending Audio-Visual Question Answering (AVQA) to multilingual settings. Existing AVQA research has predominantly revolved around English and replicating it for addressing AVQA in other languages requires a substantia

Externí odkaz: http://arxiv.org/abs/2406.09156

Zobrazit plný text záznamu

Report

The Reasonable Effectiveness of Speaker Embeddings for Violence Detection

Autor: Jain, Sarthak, Phukan, Orchid Chetia, Buduru, Arun Balaji, Sharma, Rajesh

In this paper, we focus on audio violence detection (AVD). AVD is necessary for several reasons, especially in the context of maintaining safety, preventing harm, and ensuring security in various environments. This calls for accurate AVD systems. Lik

Externí odkaz: http://arxiv.org/abs/2406.06798

Zobrazit plný text záznamu

Report

PERSONA: An Application for Emotion Recognition, Gender Recognition and Age Estimation

Autor: Koshal, Devyani, Phukan, Orchid Chetia, Jain, Sarthak, Buduru, Arun Balaji, Sharma, Rajesh

Emotion Recognition (ER), Gender Recognition (GR), and Age Estimation (AE) constitute paralinguistic tasks that rely not on the spoken content but primarily on speech characteristics such as pitch and tone. While previous research has made significan

Externí odkaz: http://arxiv.org/abs/2406.06781

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání