我正在尝试使用python的 WARC library 为warc文件编写一个mapreduce作业。以下代码对我有效,但我需要将此代码用于hadoop mapreduce作业。
import warc f = warc.open("test.warc.gz") for record in f: