to może działać, ale mogą występować fałszywe dopasowania, których nie można zapobiec, ponieważ masz tylko rozwiązanie algorytmu. Najlepszym rozwiązaniem jest utworzenie tabeli aliasów. Uwzględnij każdą znalezioną odmianę dla każdej nazwy firmy i FK do rzeczywistego identyfikatora firmy. Dołącz również wiersz z faktyczną nazwą.
AliasID CompanyID CompanyAlias
------- --------- ------------
1 1 Company X, Inc <<--actual real company name
2 1 Company X Inc
3 1 Company X
Jeśli podczas importowania danych w tej tabeli nie znaleziono dokładnego dopasowania nazwy, możesz skorzystać z zaproponowanego przez siebie algorytmu lub z danych wprowadzonych przez człowieka itp., aby znaleźć dopasowanie lub wygenerować nową firmę. W tym momencie wstaw do tabeli aliasów. Jeśli okaże się, że z jakiegoś powodu twoje dopasowanie było błędne, możesz zmienić tabelę aliasów, aby wykonać prawidłowe mapowanie. Jeśli pójdziesz tylko z algorytmem, będziesz musiał uwzględnić wyjątki, a twój algorytm będzie się rozrastał i powoli. Z tą tabelą i dobrym indeksem znalezienie dopasowań powinno być szybkie.