或许你闻过大雨之后“泥土的芬芳”吗?
那混合了湿气和淡淡霉味的特殊气味,产生于自然界中大量存在的真菌散发的有机化合物。其中最常见的包括土臭素 (Geosmin)和2-甲基异莰醇(2-MIB)。
这些嗅味物质即便以很低的浓度存在,也能带来明显气味。而当它们出现在饮用水和食物中,人们的感受就不会是“芬芳”而是“腥臭”,甚至可能引发恶心、反胃的不适感。
最近,3位GTSIers围绕饮用水中的污染物2-MIB,开展了两项创新研究项目,并在现有研究成果的基础上,初步提出基于机器学习的2-MIB预测机制,及其处理工艺选择中的环境影响评估模型。
今天,我们和他们聊一聊,看看一杯香甜的没有土臭味的饮用水,经历了什么才能来到人们手中。
臭臭的2-MIB
国标设限0.000001mg/L
2-甲基异莰醇(2-MIB)是地表水中蓝藻(蓝绿藻)和放线菌(细菌)的代谢产物,它们会在水中产生泥土发霉般的气味。这种气味不仅很难去除,过量饮入也会对人体造成危害。根据国家市场监督管理总局和国家标准化管理委员会发布的《生活饮用水卫生标准》(GB 5749-2022),饮用水中2-MIB的含量最高不可超过10纳克/升。要满足如此严格的限制,不仅需要建立完备的水质监测、预测机制,也需要开发高效的2-MIB去除技术。
GTSI的周建峰老师在与其他高校合作开展的水处理项目中,对2-MIB从来源、监测到去除的全过程产生了兴趣。同时,他认为这一研究领域包含了许多可供学生参与的具有创新性的切入点,能让他们在现有知识和技能范围内,独立完成一个研究项目并形成有意义的结论。
于是,周建峰老师设计了两个项目主题,面向GTSI在读学生。主题之一是利用机器学习模型预测2-MIB在水体内的爆发,第二是运用生命周期评估方法(LCA),评价两种主流2-MIB去除工艺对环境的影响。
3个GTSIers的跨学科研究
两个课题公开招募参与者,很快吸引到环境工程专业的王岑超,和计算机科学专业的李泊均。前者正在课堂上学习生命周期评估方法,参与项目能为她提供实际演练所学理论的宝贵机会;后者本科期间修读环境工程专业,来GTSI跨专业学习计算机科学主要是想学习更多技术知识和技能,寻找新的角度,更深入地研究环境问题。
两位同学的想法和兴趣与周建峰老师一拍即合。项目很快步入正轨,目前都已取得初步进展。
李泊均收集处理已有的水质数据,构建数据集,利用多种机器学习模型进行训练,发现当样本数在200-300的区间内,模型准确率有明显飞升。但因2-MIB为非常规测试指标,往往只能提供30-50范围内的小样本。为此他又尝试使用多个不同的机器学习交叉训练,对数据集的构建进行调整、优化,从而
提高基于小样本的机器学习准确率,有助于更好地预测水中的2-MIB浓度变化。
王岑超结合深圳某水厂在2-MIB去除过程中的实际做法及真实样本数据,运用LCA研究工具开展项目研究,发现
生物滤池去除法(Biological filter)总体上比活性炭吸附去除法(PAC)更环保
,前者在酸化、全球变暖、水生态毒性、海洋生态毒性等9个环境污染指标下的影响均小于后者,而两者在LCA维度下的敏感性测试,也为2-MIB去除工艺中不同吸附材料的投加量设置提供了参考。
“
同学们与其说是work for me不如说是work with me
,我们很多时候是在取长补短”,周建峰老师说,“这可能也是GTSI相比其他高校的特点和优势,
老师与同学之间,专业与专业之间,并没有很厚的‘壁’
,大家有很多机会建立紧密合作,实现学科交叉,互相学习,互相促进。”
Q:
2-MIB是一种普遍存在于饮水中的物质吗?为什么我们平时察觉不到它的存在?
王岑超:
2-MIB在自然水体中是普遍存在的,因此也会进入居民日常饮水用水的水库。我们把它称为嗅味物质,是因为它在水中的浓度只要达到一定的程度,人们就会闻到一股土臭味。我们之所以察觉不到它的存在,是因为新的国家标准的颁布,要求饮用水中2-MIB的浓度不得超过10ng/L。一旦超过这个限度,你可能就会闻到水中的异味。
周建峰:
1ng等于10^-9g。由此可见国标对于2-MIB的控制是很严格的,而且随着居民生活质量的提高,对饮用水的品质要求也日益增高。所以,围绕2-MIB的监测和去除,人们研究了很多方法,同时,它也成为了水处理研究领域的一个热点。
李泊均:
实际上,我们的项目初衷,也来自于水厂的真实需求。水样中的2-MIB需要送到专业的检测中心进行检测,耗费大量人力与实践成本,同时结果的获得也有滞后性,因此对水厂当下的运作来说,一个针对2-MIB浓度的预测机制是有必要的。
Q:
你们的项目相比其他围绕2-MIB开展的研究,有哪些创新之处?
李泊均:
周老师指导我在做的项目,关注的可以说是2-MIB的“上游”问题,即如何利用历史数据,预测水体中2-MIB的爆发。目前行业内主要通过水体取样送检来作判断,但是水厂一般没有实验室,所以通过取样、送检、实验室传回结果得到的数值虽然精确,但是严重滞后。所以现阶段水厂没有办法做到对2-MIB的实时监控,我们就想到,能不能运用机器学习的方法,通过已有的污染物样本实现预测,从而估算2-MIB浓度的变化,降低2-MIB监测的时间成本。
王岑超:
监测的2-MIB的浓度变化之后,随之而来的就是去除问题。这是周老师和我合作项目的关注点。目前水厂有两种主流的2-MIB去除方法,生物滤池法和PAC(活性炭)吸附法。人们对两种方法的评价通常采取成本效益维度,而我们通过引入生命周期评估的研究方式,新增了环境影响的评价维度。
Q:
项目推进过程中,哪些环节比较有挑战性?你们是如何应对的?
李泊均:
机器学习在环境领域的应用尚处于起步阶段,所以项目初期的数据集构建,中期的代码编辑,对我来说都很有挑战性。
首先,和机器学习通常使用的数据集不同,环境数据不仅不易得到,且本身往往是不规范的,需要预先做大量处理,才能构建出可用于训练的规范数据集。项目中所有洗数据,选数据,分训练集、验证集、测试集的过程,都非常耗费时间,需要我们从零开始,一步步搭建。
然后就是写代码。为了尝试不同的机器学习训练模型,我阅读了大量文献,学写了之前没接触过的代码,试着去运行,发现有问题,再想办法改,直到它可以跑起来。整个过程中除了有周老师指导我如何做原理分析,如何梳理研究思路,我也请教了学院其他专业的老师。大家都很乐于帮忙,共同解决问题。
王岑超:
对我来说,项目难点包括两种2-MIB去除方法的系统边界确定过程,以及所需数据的收集整理过程。
首先,我们以深圳某水厂的实际做法为依据,通过细化生物滤池法和PAC吸附法的每个流程,不断调整确定两套去除系统的边界。通过和周老师的多次讨论,反复调试边界,直至系统边界契合水厂的实际生产流程。
之后,我们从水厂那里获取了包括用水量、活性炭投放量等一部分真实数据。但在实际生产生活中,水厂做不到将每项指标都统计下来,所以这些数据无法完全满足生命周期评估法的需要。为此,我又做了大量的文献研究,寻找相似的可替代的数据,弥补空缺。
周建峰:
两个项目推进过程中,我与两位同学的关系不仅是指导/被指导,也是合作。大家针对项目中出现的具体问题一起讨论完善,也会一起学习新的方法和技能。
比如泊均同学在项目中用到了他计算机科学专业的机器学习方法,这并非我的专业范畴。所以这个项目为我们跨专业合作提供了契机,以此为基础,我们可以持续学习,相互促进,再尝试合作更多有意思的课题。
Q:
两个项目现在都已取得初步结论,接下来还有什么延伸性的想法吗?
李泊均:
我们现在做到了用机器学习的方法初步解决环境数据的小样本学习问题。但这只是第一步,接下来我们还想将训练出准确度的模型,运用于2-MIB等各类污染物的预测,最终进一步往污染物的控制和优化上努力。虽然这些目标对现阶段的我来说可能还有难度,但我相信它们是有意义的,希望可以循序渐进地实现。
王岑超:
我们的项目发现生物滤池法带来的环境污染总体上比PAC吸附法少,同时也通过敏感性分析,发现了两种方法中材料的投加量即使只有微小的不同,也可能带来差异巨大的环境污染。所以下一步,我们考虑开发app,让水厂等有需要的机构能够直接输入数据,得出环境影响性的评估。这将帮助他们在2-MIB去除工艺上做更合理的选择和优化,减少过程中可能造成的环境污染问题。