|
Normalização, Validação e Purificação de Moradas
PT,
2010
A Geoglobal desenvolveu para a Portugal Telecom uma solução específica para a temática de adress matching e limpeza de bases de dados com registos redundantes. Com base num conjunto de algoritmos de verosimilhança e numa estrutura aplicacional adequada, foi possível automatizar o processo de filtragem de registos duplicados de moradas, reduzindo ao máximo a intervenção humana. No sistema de validação e normalização de endereços, todos os dados foram comparados com a base de dados de endereços de referência, propriedade da Geoglobal. O resultado do conjunto total de endereços postais processados foi uma base de dados purificada, com um modelo que permitiu correlacionar os registos das bases de dados de origem com o seu espelho na base de dados purificada. Para que fosse possível efetuar essa ligação, prevenindo eventuais perdas de informação, foi utilizada uma chave comum (link) entre as diferentes bases de dados. No total foram tratados mais de 10 milhões de registos.
|
Normalização, Validação e Purificação de Moradas
|
|