所以我一直在做一个搜刮器,它可以在10K以上的网页上搜刮数据。
问题是,随着时间的推移,内存消耗急剧增加。因此,为了克服这个问题--不是在搜刮结束时才关闭驱动程序实例--搜刮器被更新,以便在每个页面被加载和数据被提取后关闭实例。
但由于某种原因,RAM内存仍然被填满。
我试着用PhantomJS,但由于某些原因,它不能正常加载数据。 我还试过用最初版本的搜刮器将Firefox中的缓存限制在100mb,但这也没有用。
注意:我同时用chromedriver和firefox进行测试,不幸的是我不能用request、 mechanize等库来代替selenium。
希望得到任何帮助,因为我已经尝试了一个星期来解决这个问题。谢谢。