Polecam trochę profilowania, aby zobaczyć, gdzie jest wąskie gardło. Moje niedoinformowane przypuszczenie jest takie, że przy tak dużych obiektach możesz być ograniczony przez połączenie między serwerem aplikacji a memcached, a zatem zobaczysz podobne wyniki z redis. Może się również zdarzyć, że Twoja aplikacja zajmuje dużo czasu na porządkowanie i odblokowywanie wielu obiektów. Jeśli jest to łatwe, warto wypróbować schemat buforowania, w którym buforujesz tylko żądanie wysyłane do klienta (który z pewnością jest znacznie mniejszy niż 128 MB).
Inną rzeczą do wypróbowania byłoby włączenie kompresji. Dałoby to dodatkowe kompresowanie/rozpakowywanie opóźnień, ale zmniejszyłoby opóźnienie sieci, jeśli rzeczywiście jest to problem.