PostgreSQL
 sql >> Baza danych >  >> RDS >> PostgreSQL

Tworzenie indeksów bez rozróżniania wielkości liter w tablicy ciągów Postgres

@Saurabh Nanda:Podobnie do tego, co napisałeś, możesz również utworzyć prostą funkcję konwertującą tablicę varchar na małe litery w następujący sposób:

CREATE OR REPLACE FUNCTION array_lowercase(varchar[]) RETURNS varchar[] AS
$BODY$
  SELECT array_agg(q.tag) FROM (
    SELECT btrim(lower(unnest($1)))::varchar AS tag
  ) AS q;
$BODY$
  language sql IMMUTABLE;

Zwróć uwagę, że przycinam również znaczniki spacji. To może nie być dla ciebie konieczne, ale zwykle robię to dla spójności.

Testowanie:

SELECT array_lowercase(array['Hello','WOrLD']);
 array_lowercase 
-----------------
 {hello,world}
(1 row)

Jak zauważył Saurabh, możesz następnie utworzyć indeks WZ:

CREATE INDEX ix_tags ON tagtable USING GIN(array_lowercase(tags));

I zapytanie:

SELECT * FROM tagtable WHERE ARRAY['mytag'::varchar] && array_lowercase(tags);

AKTUALIZACJA: Wydajność WHILE vs array_agg/unnest

Utworzyłem tabelę 100K 10 elementów text[] tablice (12 znaków losowych ciągów znaków o mieszanej wielkości liter) i przetestowano każdą funkcję.

Zwrócono funkcję array_agg/unnest:

EXPLAIN ANALYZE VERBOSE SELECT array_lowercase(data) FROM test;
                                                       QUERY PLAN                                                       
------------------------------------------------------------------------------------------------------------------------
 Seq Scan on public.test  (cost=0.00..28703.00 rows=100000 width=184) (actual time=0.320..3041.292 rows=100000 loops=1)
   Output: array_lowercase((data)::character varying[])
 Total runtime: 3174.690 ms
(3 rows)

Funkcja WHILE zwróciła:

EXPLAIN ANALYZE VERBOSE SELECT array_lowercase_while(data) FROM test;
                                                       QUERY PLAN                                                       
------------------------------------------------------------------------------------------------------------------------
 Seq Scan on public.test  (cost=0.00..28703.00 rows=100000 width=184) (actual time=5.128..4356.647 rows=100000 loops=1)
   Output: array_lowercase_while((data)::character varying[])
 Total runtime: 4485.226 ms
(3 rows)

AKTUALIZACJA 2: FOREACH a WHILE W ostatnim eksperymencie zmieniłem funkcję WHILE, aby używała FOREACH:

CREATE OR REPLACE FUNCTION array_lowercase_foreach(p_input varchar[]) RETURNS varchar[] AS $BODY$
DECLARE
    el text;
    r varchar[];
BEGIN
    FOREACH el IN ARRAY p_input LOOP
        r := r || btrim(lower(el))::varchar;
    END LOOP;
    RETURN r;
END;
$BODY$
  language 'plpgsql'

Wyniki wyglądały na podobne do WHILE :

EXPLAIN ANALYZE VERBOSE SELECT array_lowercase_foreach(data) FROM test;
                                                       QUERY PLAN                                                       
------------------------------------------------------------------------------------------------------------------------
 Seq Scan on public.test  (cost=0.00..28703.00 rows=100000 width=184) (actual time=0.707..4106.867 rows=100000 loops=1)
   Output: array_lowercase_foreach((data)::character varying[])
 Total runtime: 4239.958 ms
(3 rows)

Chociaż moje testy nie są w żaden sposób rygorystyczne, uruchomiłem każdą wersję kilka razy i stwierdziłem, że liczby są reprezentatywne, co sugeruje, że metoda SQL (array_agg/unnest) jest najszybsza.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Wstaw, jeśli nie istnieje, w przeciwnym razie zwróć identyfikator w postgresql

  2. Usuwanie przy użyciu CTE wolniej niż przy użyciu tabeli tymczasowej w Postgresie

  3. Wytnij ciąg po pierwszym wystąpieniu znaku

  4. Postgresql jsonb zapytanie bez uwzględniania wielkości liter

  5. Backup projektu bazy danych PostgreSQL - bez danych