Istnieje wiele sposobów modelowania tego w HBase, od przechowywania wszystkiego w jednej kolumnie po posiadanie innej tabeli dla każdej jednostki podrzędnej z kilkoma innymi tabelami do "indeksowania".
Ogólnie rzecz biorąc, modelujesz dane w hbase na podstawie wzorców dostępu do odczytu i zapisu. na przykład rodziny kolumn są przechowywane w różnych plikach na dysku. Powodem dzielenia danych na dwie rodziny kolumn jest to, że istnieje wiele przypadków, w których potrzebne są dane z jednej, a nie z drugiej. itp.
Jest dobra prezentacja na temat projektowania schematu HBAse autorstwa Iana Varleya z HBaseCon 2012, można znaleźć slajdy tu i wideo tutaj