Do tej pory wszyscy wiedzą, że dane są bardzo cenne. Duże korporacje wykorzystują dane do podejmowania decyzji, które, miejmy nadzieję, napędzają biznes i osiągają wyższy poziom rentowności. Jako administratorzy baz danych chronimy dane, w szczególności informacje umożliwiające identyfikację osób (PII). Systemy są hackowane w celu uzyskania danych. Dane mają dużą wartość i musiałbyś żyć pod przysłowiową skałą, aby się tego dzisiaj uczyć.
To, o czym rzadko czytam i o czym ten wpis na blogu, dotyczy zmian wartości danych w czasie. Wartość danych powinna być wykorzystywana do kierowania zasadami przechowywania.
Większość danych traci swoją wartość wraz z wiekiem. Ostatnio pracowałem nad projektem dotyczącym wydajności aplikacji i metrykami, które zbieramy do pomiaru tej wydajności. Niektóre osoby biorące udział w projekcie chciały zachować te wskaźniki przez ponad pięć lat. Odezwałem się i poinformowałem grupę, że wskaźniki wydajności pięciolatków mają zerową wartość. Nasza aplikacja zmienia się zbytnio na przestrzeni lat. Nie możemy porównywać wydajności aplikacji dzisiaj z wydajnością aplikacji sprzed pięciu lat. Nie będzie to porównanie jabłek do jabłek.
Nie wszystkie wartości danych spadają w tym samym tempie. W przykładzie, który podałem w poprzednim akapicie, dane metryczne dotyczące wydajności aplikacji są warte zero za pięć lat. Jednak sprzedawca detaliczny, który ma dane wskazujące, że klient kupił pieluchy pięć lat temu, teraz wie, że klient prawdopodobnie kupi dziś odzież dla pięcio- lub sześcioletniego dziecka. To dziecko jest najprawdopodobniej w szkole podstawowej i może potrzebować przyborów szkolnych. W tym przypadku dane o zakupach tego klienta sprzed pięciu lat wciąż mają pewną wartość. Dane nie są bezwartościowe. Biorąc to pod uwagę, nie potrzebujemy wszystkich punktów danych sprzed pięciu lat. Potrzebujemy jedynie podsumowania aktywności tego klienta, aby wyciągnąć sensowne wnioski na temat jego obecnych i przyszłych zakupów.
Zbyt często widzę, że ludzie traktują systemy bazodanowe jako wysypisko śmieci. Dane są tam po prostu wrzucane i bardzo niewiele osób zastanawia się, co zrobić z tymi danymi w dłuższej perspektywie. Bardzo niewiele osób zastanawia się, ile te dane są warte w dłuższej perspektywie. Z przechowywaniem tych danych wiąże się koszt. Jeśli dane mają niewielką lub zerową wartość ze względu na swój wiek, czy warto ponosić koszty utrzymania tych danych w bazie danych?
Istnieją strategie łagodzące, które można zastosować w przypadku starszych danych. Administrator bazy danych może przenieść starsze dane o mniejszej wartości na tańszą warstwę pamięci masowej. Jeśli dane mają wartość zerową, dane powinny zostać zniszczone. Wiele razy nie potrzebujemy już pełnych szczegółów tych starych danych, gdy wystarczą podsumowania, w którym to przypadku agregujemy dane i przechowujemy wyniki. Następnie pozbądź się szczegółów.
Jako administrator bazy danych jesteś odpowiedzialny za zarządzanie swoimi danymi i zasobami potrzebnymi do ich hostowania. Zawsze powinieneś prosić o odpowiednie kroki potrzebne do dbania o te dane, gdy się starzeją.