O curso superior Bacharelado em Ciência da Computação do IFMG - Campus Formiga convida a todos para a apresentação pública e avaliação do Trabalho de Conclusão de Curso (TCC) que acontecerá conforme agenda a seguir:
Data | Hora e Local |
Projeto |
Resumo |
24/04/2025 |
Sala 35 - Bloco C - IFMG - Campus Formiga |
Protótipo de uma Aplicação Web para Extração de Dados Não Estruturados Aluno: Gabriel Fernandes Silva Gondim Orientador: Bruno Ferreira (orientador) Banca: Bruno Ferreira (orientador) |
Na era digital, a conversão de informações físicas em formatos estruturados é essencial para a automação e a análise eficiente. No entanto, muitos conteúdos relevantes ainda permanecem armazenados em documentos impressos ou em formatos não editáveis, como imagens. Essa realidade impõe desafios significativos à extração de informações, especialmente devido à falta de padronização em documentos como notas fiscais e contratos. Para enfrentar essas limitações, este trabalho propõe o desenvolvimento de um protótipo de aplicação web capaz de extrair e estruturar dados de documentos digitalizados de forma eficiente, convertendo-os para formatos padronizados, como JSON. O projeto utiliza três técnicas distintas para a extração de informações: ROI, Llama 3 e YOLO. O método ROI é responsável por reconhecer e converter trechos de texto presentes nas imagens, o Llama 3 analisa todo o texto disponível e identifica os dados requisitados, e o YOLO é utilizado para localizar e identificar informações específicas nos documentos. Nos testes realizados com um tipo de documento no formato de certificado criado para validação, os métodos ROI e YOLO apresentaram os melhores resultados, com taxas de acerto de 96,67% e 86,67%, respectivamente, enquanto o Llama 3 teve um desempenho inferior, alcançando uma precisão de apenas 80%. A aplicação desses conceitos de visão computacional, ciência da computação e frameworks modernos visa atender à crescente demanda por soluções que automatizem a extração de dados, reduzam custos operacionais e minimizem erros humanos. |