Výsledky vyhledávání - "Peymanfard, Javad"

Report

Leveraging Visemes for Better Visual Speech Representation and Lip Reading

Autor: Peymanfard, Javad, Saeedi, Vahid, Mohammadi, Mohammad Reza, Zeinali, Hossein, Mozayani, Nasser

Lip reading is a challenging task that has many potential applications in speech recognition, human-computer interaction, and security systems. However, existing lip reading systems often suffer from low accuracy due to the limitations of video featu

Externí odkaz: http://arxiv.org/abs/2307.10157

Zobrazit plný text záznamu

Report

Word-level Persian Lipreading Dataset

Autor: Peymanfard, Javad, Lashini, Ali, Heydarian, Samin, Zeinali, Hossein, Mozayani, Nasser

Publikováno v: In 2022 12th International Conference on Computer and Knowledge Engineering (ICCKE) (pp. 225-230). IEEE

Lip-reading has made impressive progress in recent years, driven by advances in deep learning. Nonetheless, the prerequisite such advances is a suitable dataset. This paper provides a new in-the-wild dataset for Persian word-level lipreading containi

Externí odkaz: http://arxiv.org/abs/2304.04068

Zobrazit plný text záznamu

Report

ArmanTTS single-speaker Persian dataset

Autor: Shamgholi, Mohammd Hasan, Saeedi, Vahid, Peymanfard, Javad, Alhabib, Leila, Zeinali, Hossein

TTS, or text-to-speech, is a complicated process that can be accomplished through appropriate modeling using deep learning methods. In order to implement deep learning models, a suitable dataset is required. Since there is a scarce amount of work don

Externí odkaz: http://arxiv.org/abs/2304.03585

Zobrazit plný text záznamu

Report

A Multi-Purpose Audio-Visual Corpus for Multi-Modal Persian Speech Recognition: the Arman-AV Dataset

Autor: Peymanfard, Javad, Heydarian, Samin, Lashini, Ali, Zeinali, Hossein, Mohammadi, Mohammad Reza, Mozayani, Nasser

In recent years, significant progress has been made in automatic lip reading. But these methods require large-scale datasets that do not exist for many low-resource languages. In this paper, we have presented a new multipurpose audio-visual dataset f

Externí odkaz: http://arxiv.org/abs/2301.10180

Zobrazit plný text záznamu

Report

ArmanEmo: A Persian Dataset for Text-based Emotion Detection

Autor: Mirzaee, Hossein, Peymanfard, Javad, Moshtaghin, Hamid Habibzadeh, Zeinali, Hossein

With the recent proliferation of open textual data on social media platforms, Emotion Detection (ED) from Text has received more attention over the past years. It has many applications, especially for businesses and online service providers, where em

Externí odkaz: http://arxiv.org/abs/2207.11808

Zobrazit plný text záznamu

Akademický článek

A multi-purpose audio-visual corpus for multi-modal Persian speech recognition: The Arman-AV dataset

Autor: Peymanfard, Javad, Heydarian, Samin, Lashini, Ali, Zeinali, Hossein, Mohammadi, Mohammad Reza, Mozayani, Nasser

Publikováno v: In Expert Systems With Applications 15 March 2024 238 Part E

Zobrazit plný text záznamu

Report

Lip reading using external viseme decoding

Autor: Peymanfard, Javad, Mohammadi, Mohammad Reza, Zeinali, Hossein, Mozayani, Nasser

Lip-reading is the operation of recognizing speech from lip movements. This is a difficult task because the movements of the lips when pronouncing the words are similar for some of them. Viseme is used to describe lip movements during a conversation.

Externí odkaz: http://arxiv.org/abs/2104.04784

Zobrazit plný text záznamu

Lip reading using external viseme decoding

Autor: Peymanfard, Javad, Mohammadi, Mohammad Reza, Zeinali, Hossein, Mozayani, Nasser

Publikováno v: 2022 International Conference on Machine Vision and Image Processing (MVIP).

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::d4d3d149b5a89fbab65f2c15f4a73e2a
https://doi.org/10.1109/mvip53647.2022.9738749

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání