PostgreSQL
 sql >> Baza danych >  >> RDS >> PostgreSQL

Liczba PostgreSQL ile razy podciąg występuje w tekście

Gorąco sugeruję zapoznanie się z odpowiedzią, którą wysłałem do „Jak zliczać wystąpienia zakotwiczonego ciągu znaków za pomocą PostgreSQL?” . Wybrana odpowiedź okazała się być znacznie wolniejsza niż dostosowana wersja regexp_replace() . Narzut związany z tworzeniem rzędów i uruchamianiem agregatu jest po prostu zbyt wysoki.

Najszybszy sposób, aby to zrobić, jest następujący...

SELECT
  (length(str) - length(replace(str, replacestr, '')) )::int
  / length(replacestr)
FROM ( VALUES
  ('foobarbaz', 'ba')
) AS t(str, replacestr);

Tutaj

  1. Weź długość ciągu, L1
  2. Odejmij od L1 długość ciągu z usuniętymi wszystkimi zamiennikami L2 aby uzyskać L3 różnica w długości łańcucha.
  3. Podziel L3 o długość zamiany, aby uzyskać wystąpienia

Dla porównania to około pięć razy szybciej niż metoda użycia regexp_matches() który wygląda tak.

SELECT count(*)
FROM ( VALUES
  ('foobarbaz', 'ba')
) AS t(str, replacestr)
CROSS JOIN LATERAL regexp_matches(str, replacestr, 'g');


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Wybierz kolumny z określonymi nazwami kolumn w PostgreSQL

  2. Znajdź rodzica rekurencyjnie za pomocą Query

  3. Błąd składni na końcu wprowadzania danych w PostgreSQL

  4. Klucz obcy PostgreSQL nie istnieje, problem dziedziczenia?

  5. Zgrupowane LIMIT w PostgreSQL:pokazać pierwsze N ​​wierszy dla każdej grupy?