Dopasowywanie nazw jest trudne . Indeksowanie Oracle Text obsługuje rozmyte dopasowywanie i pochodzenie, co jest początkiem, ale rozważ następujące nazwy:
- Mikołaj Raleigh
- Nihcolas Raleigh
- Nico Raleigh
- Nik Raleigh
- Nicky Raleigh
- Nick Raleigh
- Nikolaus Raleigh
- Nicola Raleigh
- Nikki Raleigh
- Nikola Raleigh
- Nikolai Raleigh
- Nikolaj Raleigh
Próba dopasowania ich za pomocą abstrakcji, czy to Levenshtein Distance, czy Double Metaphone, będzie generować fałszywe alarmy i fałszywe negatywy. Taka jest natura abstrakcji. Najlepszym sposobem na uzyskanie skoncentrowanego i dokładnego zestawu wyników jest użycie tezaurusa (a nawet to nie jest idealne). Niestety, zebranie obszernego tezaurusa imion to gigantyczne przedsięwzięcie; aby zrozumieć zadanie, sprawdź statystyki na stronie NameX .
Aktualizacja:Oracle 11gR2 zawiera rozszerzenie Oracle Text dostosowane do wyszukiwania nazw. To jest bardzo schludne i zdecydowanie pierwsze miejsce, od którego należy zacząć. Dowiedz się więcej .