SIGLASEARCH: arcabouço de consulta de dados flexibilizada para workflows de múltiplos laboratórios de pesquisa

Autor: Cassia do Carmo Vieira
Přispěvatelé: Sergio Vale Aguiar Campos, Alessandra Conceição Faria Aguiar Campos, Francisco Pereira Lobo, Raquel Oliveira Prates
Jazyk: portugalština
Rok vydání: 2015
Předmět:
Zdroj: Repositório Institucional da UFMG
Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
Popis: A pesquisa biomédica sofreu um grande crescimento de dados gerado pela amplia ção da legislação sobre os processos de laboratórios, avanços na instrumentação automática, melhoria dos processos de controle de qualidade e aumento da demandapor análises estatísticas. Para gerenciar esse volume de informação, alguns laboratórios de pesquisa utilizam Sistemas de Gerenciamento de Informações de Laboratório (Laboratory Information Management System - LIMS), que propõem gerenciamento de gravação e acesso aos dados de forma segura e satisfatória. Devido aos laboratórios de pesquisa possuírem características e processos de trabalho bastante peculiares e à grande variedade de laboratórios, os LIMS são criados com a estrutura de dados customizada para cada um deles. Essa necessidade de adaptação do software provoca aumento do tempo de desenvolvimento e do custo nal da aplicação, o que torna a implantação de um LIMS inviável para pequenos laboratórios ou para laboratórios depesquisa. Muitas dessas pesquisas são aplicadas em problemas da bioinformática. Para exibilizar a disponibilização do LIMS para diferentes contextos, foi criado o Sistema Integrado de Gerência de Laboratórios (SIGLa), que permite ao laboratório adaptar o uxo de dados do sistema de acordo com as suas próprias necessidades de trabalho sem que o código fonte do sistema seja alterado. Para alterar os processos de trabalho de um laboratório informatizado, basta que o workow (uxo de trabalho) seja editado através de um editor de workows como o Together Workow Editor (TWE). O SIGLa atua como gerenciador de workows, fazendo o controle de transação, consistência e gravação dos dados. O SIGLa já é utilizado na Empresa Brasileira de Pesquisa Agropecuária(Embrapa) e no Instituto Nacional de Metrologia, Qualidade e Tecnologia(Inmetro). Embora a gravação de dados seja exível e não requeira customiza ções por mudanças dos uxos de trabalho, a consulta aos dados não é satisfatória. A consulta existente exibe os dados gravados, mas não exibe tais dados de forma relacionada. Tal problema não tem solução trivial, pois a modelagem do sistema foi feita em Banco de Dados Relacional em função dos conceitos do gerenciador de workow, como atividades, atributos, registros e instâncias. O antigo sistema de consulta do SIGLa fornece resultados com pouca signicância para análise das informações. As tabelas estão relacionadas pelos seus metadados. Portanto, não é possível, por exemplo, extrair os relacionamentos entre as atividades do workow e relacionamentos entre os atributos dessas atividades. As ferramentas existentes hoje para a consulta automática de Bancos de Dados Relacional não atendem ao problema de consulta no SIGLa, poisa extração das restrições do esquema relacional não é suciente para a geração dos resultados que o usuário necessita em suas análises. Esse projeto propõe a modelagem e a implementação do SiglaSearch, uma engenharia de consulta para dados de workow com interface customizada para os diferentes usuários do sistema. A consulta deve ser exibilizada para múltiplos uxos de trabalho e deve exibir as informações relacionadas entre si, sem a necessidade de conversão do modelo de dados orientado a workow para um modelo de banco de dados convencional. O novo sistema de consulta desenvolvidopara o SIGLa traz como melhoria a pesquisa em dados de workow, porque os sistemas de consulta existentes para workow só oferecem busca por palavras-chave. O SiglaSearch propõe a pesquisa através de subconjunto de informações de workow, com utilização dos dados estruturados para pesquisas mais avançadas. O SiglaSearchpermite a busca de subconjuntos de dados, ltragem e ordenação de qualquer uma das informações do workow e sumarização de resultados. Os relacionamentos são extraídos de forma automática sem especicações adicionais, com exibição das informa ções em formato tabular, para que os usuários possam focar em subconjuntos deinformações que facilitem a avaliação das informações para os mais diversos ns. O Sigla Search também fornece uma interface de consulta para os usuários de forma que eles possam buscar seus resultados em poucos passos de forma intuitiva e possam salvar essas consultas sob a forma de relatórios que podem ser executados por outros usuários que trabalhem em atividades mais isoladas do laboratório de pesquisa. Biomedical research has undergone strong growth of data generated by the expansion of the law governing laboratory procedures, advances in automated instrumentation, improved quality control processes and increased demand for statistical analysis. To control this volume of information, some research labs use Laboratory Information Management Systems (LIMS), which propose recording management and access to data safely and satisfactorily. Research labs have quite peculiar features and work processes. Therefore, the LIMS are created with custom data structure for each of them. This need for software adaptation increases development time and cost of the final application, which makes the implementation of a LIMS impractical for small laboratories. In order to increase availability of LIMS for the laboratory, the Integrated Laboratory Management System (Sistema Integrado de Gerência de Laboratórios - SIGLa) was created, which enables the laboratory to adapt the data flow of the system according to their business needs without changes in the source code of the system. To change the work processes of a lab, just the workflow is edited through a workflow editor such as the Together Workflow Editor (TWE). SIGLa acts as a workflow manager, making the transaction control, data consistency and data recording. SIGLa is already used in the Brazilian Agricultural Research Corporation (Empresa Brasileira de Pesquisa Agropecuária - Embrapa) and the National Institute of Metrology, Quality and Technology (Instituto Nacional de Metrologia, Qualidade e Tecnologia - Inmetro). Although data recording is flexible and does not require customizations for change of workflows, the query data is not satisfactory. The existing query displays the recorded data, but displays no such related form of data. This problem has a nontrivial solution since the system modeling has been made in Relational Database according to the concepts of workflow manager, such as activities, attributes, records and instances. This implies low value of the results of the old query system for information analysis. The tables are related by their metadata, so the user can not extract the relationships between the activities of the workflow, relationships between the attributes of these activities and relationships between records that make some types of workflow attributes and other attributes. Tools existing today for automatic query Relational Databases, do not solve the query problem in SIGLa, because the extraction of the constraints of relational schema is not enough to generate the results that the user needs in his analysis. This project proposes the modeling and implementation of SiglaSearch, a system to query workflow data with customized user interface to different users, more flexible for different workflows, to view the information related with each other without the need for conversion of data model-driven workflow to a model generated in terms of the relationships between the data. The new query system developed for SIGLa brings as improvement research in workflow data, because the existing reference systems for such data only offer keyword search while SiglaSearch proposes to search through a subset of workflow information. SiglaSearch allows the search of data subsets, filtering and sorting of any workflow information and summarization of results. Relationships are extracted automatically without additional specifications, with display of information in tabular format, so users can focus on subsets of information to facilitate the evaluation of information for various purposes. SiglaSearch also provides a query interface for users so that they can get their results in a few steps intuitively and can save these consultations in the form of reports that can be run by other users working in more specific activities of the laboratory search.
Databáze: OpenAIRE