Tak to jest poprawne. UTF-8 to kodowanie zestawu znaków Unicode, które obsługuje prawie każdy język na świecie.
Myślę, że jedyna różnica polega na sortowaniu wyników, różne litery mogą występować w innej kolejności w innych językach (akcenty, umlauty itp.). Również porównywanie a
do ä
może zachowywać się inaczej w innym zestawieniu.
_ci
przyrostek oznacza sortowanie i porównywanie c ase ja niewrażliwy.
http://www.collation-charts.org/ może Cię zainteresować.