Mysql
 sql >> Baza danych >  >> RDS >> Mysql

kompresja tekstu url (nie skracanie) i przechowywanie w mysql

Innym pomysłem do wypróbowania może być zidentyfikowanie wspólnych ciągów i przedstawienie ich za pomocą mapy bitowej. Na przykład dwa bity reprezentują protokół (http, https, ftp lub coś innego), inny bit wskazujący, czy domena zaczyna się od „wwww”, dwa bity wskazujące, czy domena kończy się na „.com”, „. org”, „.edu” lub coś innego. Musisz przeprowadzić analizę danych i sprawdzić, czy mają one sens i czy istnieją inne typowe ciągi, które możesz zidentyfikować.

Jeśli masz wiele adresów URL do tej samej witryny, możesz również rozważyć podzielenie tabeli na dwie różne, jedną zawierającą domenę, a drugą zawierającą ścieżkę względną domeny (oraz ciąg zapytania i identyfikator fragmentu, jeśli jest obecny). Otrzymasz tabelę linków zawierającą identyfikator adresu URL, identyfikator domeny i identyfikator ścieżki, a oryginalną tabelę adresów URL zastąpisz widokiem, który łączył te trzy tabele. Tabela domen nie musiałaby być ograniczona do domeny, możesz podać tyle adresu URL, ile zwykle (np. „http://stackoverflow.com/questions”). Zaimplementowanie tego nie wymagałoby zbyt wiele kodu i ma tę zaletę, że nadal jest czytelne. Twoje kodowanie numeryczne może być bardziej wydajne, gdy już to zrozumiesz, będziesz musiał przeanalizować swoje dane, aby zobaczyć, który z nich jest bardziej sensowny.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Dane są puste. Tej metody lub właściwości nie można wywołać na wartościach null. (przy użyciu pola kombi)

  2. MYSQL WSTAW lub AKTUALIZUJ JEŻELI

  3. docker mysqld:nie można odczytać katalogu '/etc/mysql/mysql.conf.d' (os errno 2 - brak takiego pliku lub katalogu)

  4. PHP MySQL – operacje raz w tygodniu

  5. Jak sprawdzić, czy data jest pomiędzy date1 a date2 za pomocą mysql?