Nigdy tego nie próbowałem, ale powinieneś być w stanie stworzyć czeski trzon Snowballa, o ile jesteś gotowy do kompilacji PostgreSQL ze źródeł.
Wyjaśnienie znajduje się w src/backend/snowball/README
:
Teraz dostępny jest czeski trzon Snowball tutaj , został wniesiony do projektu. Nie ma dostępnego słownika słów przerywanych, ale jestem pewien, że możesz go znaleźć lub sam utworzyć.
Prawdziwa praca polegałaby na zainstalowaniu Snowballa i użyciu kompilatora Snowball-to-C do utworzenia plików C i plików nagłówkowych do dodania do źródła PostgreSQL. Pliki te powinny pozostać stabilne, więc aktualizacja do nowego nie powinna być trudna. Wersja PostgreSQL.
Jeśli chcesz wykonać pracę, ale nie chcesz łatać PostgreSQL i budować go za każdym razem ze źródeł, możesz również rozważyć przesłanie łaty do PostgreSQL. Dopóki stemmer działa dobrze, nie spodziewam się, że napotkasz tam duży opór (ale proces przesyłania łatek jest nadal żmudny).