Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz
Autor: | Méndez Ortíz, Freddy, Vecino Pico, Hugo |
---|---|
Přispěvatelé: | Carrillo Zambrano, Eduardo, Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM), Grupo de Investigación Preservación e Intercambio Digital de Información y Conocimiento - Prisma |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2006 |
Předmět: |
Web architecture
Investigaciones Voice interaction Computational linguistics Investigations Speech recognition Ingeniería de sistemas Systems engineering Sistemas de almacenamiento de información Sistemas de recuperación de información Arquitectura web Information retrieval systems Reconocimiento de Voz Rules of inference Automatic speech recognition Interacción hombre-máquina Computer science Reconocimiento automático de voz Web semántica Ciencias computacionales Reglas de Inferencia Human-machine interaction Análisis Interacción por voz Lingüística computacional Information storage systems Analysis Semantic web |
Zdroj: | Repositorio UNAB Universidad Autónoma de Bucaramanga-UNAB instacron:Universidad Autónoma de Bucaramanga-UNAB |
Popis: | El objetivo principal de este trabajo es el desarrollo de una propuesta de arquitectura software para la implementación de portales Web semánticos basados en interacción por voz. Este trabajo plantea, los componentes software requeridos para el modelado de portales semánticos tomando como punto de partida la arquitectura genérica propuesta por Tim Berners-Lee, con la cual se identifican elementos con mayor granularidad de detalle. Por otra parte se hace una revisión de los componentes software y consideraciones requeridas para incluir una interface de interacción vocal con un portal Web semántico, para realizar búsquedas usando lenguaje hablado. Como aporte al proyecto se implementó reglas de inferencia usando, SWRL y JESS. Instituto Tecnológico y de Estudios Superiores de Monterrey RESUMEN.............................................................................................................16 1. INTRODUCCION...............................................................................................17 1.1 OBJETIVO GENERAL.....................................................................................19 1.2 OBJETIVOS ESPECÍFICOS............................................................................19 2. WEB SEMANTICA.............................................................................................21 2.1 ¿QUÉ ES UNICODE?......................................................................................22 2.2 URI, URL, URN................................................................................................24 2.2.2 URL Uniform Resource Locutor....................................................................25 2.2.3 URN Uniform Resource Names....................................................................26 2.3 XML (Extensive Markup Language).................................................................26 2.3.3 Documentos XML bien formados.................................................................27 2.3.4 Espacios de Nombres (NameSpaces)..........................................................27 2.3.5 XML Schema................................................................................................27 2.4 RDF (RESOURCE DESCRIPTION FRAMEWORK)........................................28 2.4.1 Rdf básico.....................................................................................................29 2.4.1.3 Sentencias.................................................................................................29 2.4.2 Metadatos.....................................................................................................30 2.4.3 Rdf Esquema (Rdf Schema).........................................................................30 2.5 CAPA DE ONTOLOGÍA...................................................................................31 2.6 Capa Lógica.....................................................................................................34 2.7 CAPAS PROOF Y TRUST...............................................................................37 2.7.1 Firmas Digitales y “redes de confianza”........................................................37 2.7.2 ¿Qué es la Seguridad?.................................................................................39 2.7.3 ¿Para qué sirve?...........................................................................................39 3. EL PROBLEMA DEL RECONOCIMIENTO DE VOZ.........................................41 3.1 CONCEPTOS FUNDAMENTALES..................................................................41 3.2 FACTORES PRINCIPALES EN LA PROBLEMÁTICA DEL RECONOCIMIENTO DEL HABLA.........................................................................42 3.2.1 El Locutor......................................................................................................42 3.2.2 La forma de hablar........................................................................................42 3.2.3 El Vocabulario...............................................................................................43 3.2.4 La Gramática................................................................................................43 3.2.5 EL Entorno Físico.........................................................................................44 3.3 MODOS FUNDAMENTALES DE HABLAR FRENTE A UN SISTEMA DE RECONOCIMIENTO..............................................................................................44 3.3.2 Habla Conectada..........................................................................................44 3.3.3 Habla Continua.............................................................................................45 3.4 LA CONVERSIÓN TEXTO-VOZ.....................................................................45 4. TECNOLOGIAS PARA EL RECONOCIMIENTO DE VOZ.................................47 4.1 Técnicas para el reconocimiento de fonemas y palabras................................47 4.1.1 Técnicas Topológicas...................................................................................47 4.1.2 Técnicas Probabilísticas...............................................................................48 4.1.3 Redes Neuronales........................................................................................49 4.2 APLICACIONES TECNOLÓGICAS PARA EL RECONOCIMIENTO DE VOZ.50 4.2.1 Motor SDK (Software Development Kit).......................................................50 4.2.3 Philips:..........................................................................................................52 4.2.4 Sistemas Telefónicos de AT&T:....................................................................52 4.2.5 IBM Vía Voice...............................................................................................52 4.2.6 Dragón Naturally Speaking:..........................................................................52 4.2.7 Java Speech API..........................................................................................5 4.2.7.1 Objetivos de Diseño...................................................................................5 4.2.7.2 El Paquete Javax.speech...........................................................................55 4.2.8 Microsoft Speech Api....................................................................................55 4.3 VOICE XML....................................................................................................57 4.3.1 Ejemplos VoiceXML......................................................................................58 4.3.2 Observación Tecnológica.............................................................................60 4.3.3 Objetivos de VoiceXML.................................................................................60 4.3.4 Principios de Diseño.....................................................................................60 4.3.5 Conceptos Fundamentales...........................................................................61 5. METADATOS PARA INFORMACIÓN AUDIBLE...............................................62 5.1 VOICE EXTENSIBLE MARKUP LANGUAGE (VOICEXML)............................63 5.1.1 Observación..................................................................................................65 5.1.2 Entrada del Usuario......................................................................................65 5.1.3 Elementos de XML para SGRS....................................................................66 5.1.4 Interpretación Semántica de la Entrada........................................................66 5.1.5 Información de Metadatos.............................................................................66 5.1.6 Elemento ..........................................................................................67 5.1.7 Elemento metadata.......................................................................................69 5.2 SPEECH RECOGNITION GRAMMAR SPECIFICATION (SRGS)....................71 5.2.1 Interpretación Semántica..............................................................................71 5.2.2 Meta Datos....................................................................................................73 5.2.3 Elementos Meta y HTTP-Equiv.....................................................................73 5.2.4 XML Metadata (XML Unicamente)................................................................74 5.3 SPEECH SYNTHESIS MARKUP LANGUAGE (SSML) Version 1.0...............76 5.3.1 Elemento meta..............................................................................................77 5.3.2 Elemento metadata.......................................................................................78 5.4 SEMANTIC INTERPRETATION FOR SPEECH RECOGNITION (SISR)........80 5.4.1 Principios Básicos.........................................................................................81 5.4.2 Reglas de Variables y Valores Semánticos..................................................82 5.6 CALL CONTROL EXTENSIBLE MARKUP LANGUAGE.................................84 5.6.1 Elementos META y METADATA...................................................................86 5.6.2 Elemento ...................................................................................87 6. DESCRIPCIÓN DE LA ARQUITECTURA PROPUESTA Y CASO DE ESTUDIO: LABORATORIO DE CÓMPUTO ESPECIALIZADO DE LA UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA.......................................................................89 6.1 CAPA DE USUARIO........................................................................................90 6.2 CAPA NAVEGADOR.......................................................................................90 6.3 ZONA INTERNET............................................................................................90 6.4 SERVIDOR WEB-VOZ....................................................................................91 6.5 CAPA SEMÁNTICA........................................................................................92 6.6 DESCRIPCIÓN DEL PROTOTIPO..................................................................93 6.6.1 Definición de la Base de conocimiento.........................................................93 6.6.2 Definición del manejador de la Ontología.....................................................94 6.6.3 Definición de las Reglas...............................................................................96 6.6.4 Inferencia de conocimiento por medio de las Reglas....................................97 6.6.5 Definición y Diseño de Interfaces..................................................................98 6.6.5.1 Interface Visual..........................................................................................98 6.6.5.2 Interface de Voz.......................................................................................105 7. Conclusiones Y Trabajo Futuro.......................................................................113 REFERENCIAS...................................................................................................116 Maestría In this article we describe the proposal for a software architecture to the semantic portal Web implementation based in voice interaction. This work shows the required software components for the semantic portal modeling, taking as the starting point the generic architecture proposed by Tim Berners-Lee, by which they identify elements with greater detail information. By the other side we make a re-examination of the software components and the required considerations to include a vocal interaction interface with a semantic portal Web, to realize searches using spoken language. As a contribution we applied inference rules using SWRL and JESS. |
Databáze: | OpenAIRE |
Externí odkaz: |