Pobierz źródło z http://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip
Otwórz org.apache.nutch.crawl.Crawl
klasę w edytorze.
Zmienna wyszukiwania Path crawlDb = new Path(dir + "/crawldb");
Zmienna da wskazówkę, gdzie zastąpić kod, aby uzyskać własny CustomMySQLCrawl
klasa.
Trwałość ma miejsce podczas tego wywołania:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb
Więc jest tam, gdzie powinieneś go zapisać w bazie danych. W tym momencie możesz rozważyć zintegrowanie hibernacji.