原文出处:拓端数据部落公众号

使用 ML 进行提升建模和因果推理。

Python 包提供了一套使用基于最近研究的 机器学习算法 的提升建模和因果推理方法。允许用户根据实验或观察数据估计条件平均处理效果 (CATE) 或个体处理效果 (ITE)。本质上,它估计了干预 对 具有观察特征的用户的 T 结果 的因果影响,而对模型形式没有强烈的假设。典型用例包括

广告活动定位优化 :在广告活动中提高投资回报率的一个重要手段是将广告定位到在给定 KPI(如参与度或销售量)中会有良好反应的客户群。通过根据 A/B 实验或历史观察数据在个人层面估计广告曝光的 KPI 影响来识别这些客户。

个性化参与 :公司有多种选择与客户互动,例如在追加销售或消息渠道中的不同产品选择。可以估计每个客户和处理选项组合的异质处理效果,以获得最佳的个性化推荐系统。

目前支持以下方法

基于树的算法

  • 欧几里得距离和卡方上的随机森林
  • 提升树/随机森林
  • 元学习算法

    工具变量算法

  • 2 阶段最小二乘法 (2SLS)
  • S、T、X 和 R 学习的平均处理效果估计

    xg = XGBTRrssor()nn = MLPTReesor(hidenlayer_izes=(10, 10))xl = BaeXegrsor(lernr=XGBeresor())rl = BaeRReresor(lerner=XRegrssor())
    

    可解释的因果机器学习

    提供了解释如下训练的处理效果模型的方法:

    元学习特征的重要性

    # 加载合成数据np.array(['treaet_A' if x==1 else 'cotol' for x in trtent]) # 处理/控制名称RnFostRgesor()  # 为model_tau_feature指定模# 在基础学习器中使用feature_importances_方法plot_ipornce()# 绘制shap值pot_shp_ues()# interaction_idx设置为'auto'ploshp_dpedece()
    

    提升树可视化

    uplit_del.fit(df[fars].values,                 trtnt=df['trtme_rop_ey'].values,                 y=df['cvesin'].values)
    

    最受欢迎的见解

    1.PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯模型和KMEANS聚类用户画像

    2.R语言基于树的方法:决策树,随机森林

    3.python中使用scikit-learn和pandas决策树

    4.机器学习:在SAS中运行随机森林数据分析报告

    5.R语言用随机森林和文本挖掘提高航空公司客户满意度

    6.机器学习助推快时尚精准销售时间序列

    7.用机器学习识别不断变化的股市状况——隐马尔可夫模型的应用

    8.python机器学习:推荐系统实现(以矩阵分解来协同过滤)

    9.python中用pytorch机器学习分类预测银行客户流失

  • 私信