Popis: |
Dissertação para obtenção do Grau de Mestre em Engenharia Eletrotécnica e de Computadores No decorrer dos últimos anos, a qualidade de imagens e vídeos em câmaras tem evoluído, tendo a estabilização digital de imagem vindo a desempenhar um papel importante para a obtenção de vídeos estáveis em variadas situações, nomeadamente, vídeos amadores (shaky movies) ou determinadas áreas de videovigilância. Neste tipo de processamento existem vários métodos de estabilização, desde a vertente 2D até à mais complexa em 3D. O trabalho que aqui se apresenta pretende aplicar modelos de estabilização em áreas de videovigilância, no entanto, mostra-se igualmente bastante eficaz para qualquer tipo de vídeo amador. O trabalho aqui desenvolvido demonstra um método construído em 2D baseado na estimação robusta de homografias abrangendo quatro modelos distintos de transformação de imagem: os modelos translacional, euclidiano, afim e projetivo, apresentados por ordem de complexidade. Estes quatro modelos distinguem-se sobretudo nos níveis de estabilização que se pretende aplicar a um vídeo. Ou seja, parte-se do princípio que quanto maior o número de parâmetros a estabilizar, mais complexo deverá ser o modelo aplicado. O modelo translacional pretende estabilizar apenas os movimentos indesejados nos eixos horizontal e vertical; o modelo euclidiano pretende estabilizar, para além destes, os movimentos rotacionais indesejados; o modelo afim introduz uma complexidade muito maior em termos de parâmetros relativamente aos anteriores, estabilizando, para além dos mencionados anteriormente, também os efeitos de escalamento, compressão e distorção de objetos; por último, o modelo projetivo pretende acrescentar aos anteriores a eliminação de perspetiva horizontal e/ou vertical existente nas imagens. O método desenvolvido extrai os keypoints frame a frame comparando a posição de cada um em frames consecutivas, calculando assim a homografia inversa aplicável às imagens em cada modelo. Tendo isto em conta, a estabilização digital de imagens pode tornar-se, na visão por computador, num dos processamentos mais lentos e exigentes a nível computacional quando se enfrentam qualidades de vídeo bastante elevadas. Desta forma, para além do método de estabilização desenvolvido, este trabalho vem apresentar uma forma eficaz de aceder aos descritores visuais dos vídeos comprimidos em H.264 e extrair a informação neles presentes, acelerando assim todo o processo de estabilização. |