Jak mówisz, DBStorage
obsługuje tylko zapisywanie wyników w bazie danych.
Aby załadować dane z MySQL, możesz zajrzeć do projektu o nazwie sqoop (która kopiuje dane z bazy danych do HDFS) lub możesz wykonać zrzut mysql, a następnie skopiować plik do HDFS. Oba sposoby wymagały pewnej interakcji i nie mogą być używane bezpośrednio z wnętrza Pig.
Trzecią opcją byłoby przyjrzenie się napisaniu Pig LoadFunc (mówisz, że próbowałeś napisać UDF). Nie powinno to być zbyt trudne, będziesz musiał przekazać te same opcje, co DBStorage (sterownik, poświadczenia połączenia i zapytanie SQL do wykonania), a prawdopodobnie możesz również użyć inspekcji metadanych zestawu wyników, aby automatycznie wygenerować schemat.