使用Databricks Pyspark向Bigquery写入数据时出错

0 人关注

我每天使用Databricks Pyspark运行一项工作，向BigQuery写入数据。最近对Databricks的配置进行了更新（https://docs.databricks.com/data/data-sources/google/bigquery.html），导致工作失败。我遵循文档中的所有步骤。读取数据再次工作，但写入时出现了以下错误。 java.lang.RuntimeException: java.lang.ClassNotFoundException: Class com.google.cloud.hadoop.fs.gcs.GoogleHadoopFS not found

我试着在代码中也添加了配置（如Spark中类似错误的建议），但这没有帮助。

spark._jsc.hadoopConfiguration().set('fs.gs.impl', 'com.google.cloud.hadoop.fs.gcs.GoogleHadoopFileSystem')
spark._jsc.hadoopConfiguration().set('fs.gs.auth.service.account.enable', 'true')
spark._jsc.hadoopConfiguration().set('google.cloud.auth.service.account.json.keyfile', "<path-to-key.json>")
我的代码是。
upload_table_dataset = 'testing_dataset'
upload_table_name = 'testing_table'
upload_table = upload_table_dataset + '.' + upload_table_name
(import_df.write.format('bigquery') 
  .mode('overwrite') 
  .option('project', 'xxxxx-test-project')
  .option('parentProject', 'xxxxx-test-project')
  .option('temporaryGcsBucket', 'xxxxx-testing-bucket') 
  .option('table', upload_table) 
  .save()

推荐文章

帅气的领带 · 【Pyspark 】GroupBy分组排序_pyspark根据范围分组 groupby where

1 月前

时尚的蘑菇 · pyspark的窗口函数--Window、over_pyspark over

1 月前

爱笑的卡布奇诺 · python 鼠标画框打印坐标位置高宽_mb5fdb0fbba4f73的技术博客_51CTO博客

1 年前

豪气的马克杯 · 用命令创建MySQL数据库 - 知乎

1 年前

眉毛粗的跑步鞋 · Perl 换行打印_ankouyong2307的博客-CSDN博客

1 年前

聪明伶俐的长颈鹿 · strip_tags、htmlentities、htmlspecialchars的区别 - 昊晗远昂 - 博客园

1 年前

谦逊的石榴 · C#的通用DbHelper类(支持数据连接池)示例详解_C#教程_脚本之家

1 年前