本文涵蓋 Databricks 未提供或支援的 DBeaver。 若要連絡提供者,請參閱在 GitHub 上使用 dbeaver/dbeaver 存放庫的 [問題 ] 頁面。

DBeaver 是一種本機、多平臺資料庫工具,適用于開發人員、資料庫管理員、資料分析師、資料工程師,以及其他需要使用資料庫的人員。 DBeaver 支援 Azure Databricks 和其他熱門資料庫。

本文說明如何使用本機開發電腦來安裝、設定和使用免費的 DBeaver Community Edition 開放原始碼 (CE) ,以使用 Azure Databricks 中的資料庫。

本文已經過 macOS、 Databricks JDBC Driver 2.6.25 版和 DBeaver CE 22.1.0 版的測試。

安裝 DBeaver 之前,您的本機開發電腦必須符合下列需求:

  • Linux 64 位、macOS 或 Windows 64 位作業系統。 支援 (Linux 32 位,但不建議使用。)
  • Databricks JDBC Driver 到本機開發電腦,從下載 DatabricksJDBC42-<version>.zip 的檔案中擷取 DatabricksJDBC42.jar 檔案。
  • 您也必須擁有 Azure Databricks 叢集 SQL 倉儲 ,才能與 DBeaver 連線。

    步驟 1:安裝 DBeaver

    下載並安裝 DBeaver CE ,如下所示:

  • Linux :從 DBeaver 網站上的 [下載] 頁面 下載 並執行其中一個 Linux 安裝程式。 snap 此頁面也提供 和 flatpak 安裝選項。
  • macOS :使用 Homebrew 來執行 brew install --cask dbeaver-community ,或使用 MacPorts 執行 sudo port install dbeaver-community 。 您也可以從 DBeaver 網站上的 [下載 ] 頁面取得 macOS 安裝程式。
  • Windows :使用 Chocolatey 執行 choco install dbeaver 。 您也可以從 DBeaver 網站上的 [下載 ] 頁面取得 Windows 安裝程式。
  • 步驟 2:設定 Databricks JDBC Driver for DBeaver

    使用您稍早下載之 Databricks JDBC Driver 的相關資訊來設定 DBeaver。

  • 啟動 DBeaver。
  • 如果系統提示您建立新的資料庫,請按一下 [ ]。
  • 如果系統提示您連線或選取資料庫,請按一下 [ 取消 ]。
  • 按一下 [資料庫 > 驅動程式管理員 ]。
  • 在 [ 驅動程式管理員] 對話方塊中,按一下 [ 新增 ]。
  • 在 [ 建立新的驅動程式] 對話方塊中,按一下 [連結 庫] 索引卷 標。
  • 按一下 [加入檔案]。
  • 流覽至 DatabricksJDBC42.jar 您稍早擷取的檔案,然後按一下 [ 開啟 ]。
  • 按一下 [尋找類別 ]。
  • [驅動程式類別 ] 清單中,確認已選取 com.databricks.client.jdbc.Driver
  • 在 [ 設定] 索引標籤的 [驅動程式名稱] 中,輸入 Databricks
  • 在 [ 設定] 索引標籤的 [ 類別名稱 ] 中,輸入 com.databricks.client.jdbc.Driver
  • 按一下 [確定]。
  • 在 [ 驅動程式管理員] 對話方塊中,按一下 [ 關閉 ]。
  • 步驟 3:將 DBeaver 連線到您的 Azure Databricks 資料庫

    使用 DBeaver 連線到叢集或 SQL 倉儲,以存取 Azure Databricks 工作區中的資料庫。

  • 在 DBeaver 中,按一下 [ 資料庫 > 新增資料庫連接 ]。

  • 在 [ 連接到資料庫 ] 對話方塊的 [ 所有 ] 索引標籤上,按一下 [Databricks ],然後按 [ 下一步 ]。

  • 按一下 [ 主要] 索引標籤,然後在 Azure Databricks 資源的 [JDBC URL] 欄位中輸入值:

  • 在叢集 [ 進階選項 ] 區域中的 [JDBC/ODBC ] 索引標籤上尋找 JDBC URL 域值。 JDBC URL 看起來應該像這樣:

    jdbc:databricks://adb-1234567890123456.7.azuredatabricks.net:443/default;transportMode=http;ssl=1;httpPath=sql/protocolv1/o/1234567890123456/1234-567890-reef123;AuthMech=3;UID=token;PWD=<personal-access-token>

    如果 JDBC URL 開頭為 jdbc:spark: ,您必須將它變更為 jdbc:databricks: ,否則稍後會收到連線錯誤。

  • 將 取代 <personal-access-token> 為 Azure Databricks 工作區 的個人存取權杖

  • 取 [在本機儲存密碼 ]。

    如果您不想將個人存取權杖儲存在本機開發電腦上,請從 JDBC URL 省略 UID=token;PWD=<personal-access-token> ,然後取消核取 [ 在本機儲存密碼 ]。 每次嘗試連線時,系統會提示您 輸入使用者名稱 ( token ) 和 密碼 (您的個人存取權杖) 。

    Sql 倉儲

  • 在 SQL 倉儲的 [ 連線詳細資料 ] 索引標籤上尋找 [JDBC URL] 域值。 JDBC URL 看起來應該像這樣:

    jdbc:databricks://adb-1234567890123456.7.azuredatabricks.net:443/default;transportMode=http;ssl=1;AuthMech=3;httpPath=/sql/1.0/warehouses/a123456bcde7f890;
    

    如果 JDBC URL 開頭為 jdbc:spark: ,您必須將它變更為 jdbc:databricks: ,否則稍後會收到連線錯誤。

  • 針對 [使用者名稱],輸入 token

  • 針對 [密碼],輸入您的 個人存取權杖

  • 取 [在本機儲存密碼]。

    如果您不想將個人存取權杖儲存在本機開發電腦上,請將 [ 使用者 名稱] 和 [ 密碼 ] 保留空白,然後取消核取 [ 在本機儲存密碼]。 每次嘗試連線時,系統會提示您 輸入使用者名稱 () 和 token密碼 (您的個人存取權杖) 。

  • 按一下 [測試連接]

    測試連線之前,您應該先啟動 Azure Databricks 資源。 否則,測試可能需要幾分鐘的時間才能在資源啟動時完成。

  • 如果連線成功,請在 [ 連線測試 ] 對話方塊中,按一下 [ 確定]。

  • 在 [ 連接到資料庫 ] 對話方塊中,按一下 [ 完成]。

    在 [ 資料庫導覽器 ] 視窗中,會顯示 Databricks 專案。 若要變更連線的名稱,以便更輕鬆地識別:

  • 以滑鼠右鍵按一下 [Databricks],然後按一下 [ 編輯連線]。
  • 在 [ 連線組態 ] 對話方塊中,按一下 [ 一般]。
  • 針對 [連線名稱],將 取代 Databricks 為連接的不同名稱。
  • 按一下 [確定]。
  • 針對您想要 DBeaver 存取的每個資源,重複此步驟中的指示。

    步驟 4:使用 DBeaver 流覽資料物件

    使用 DBeaver 存取 Azure Databricks 工作區中的資料物件,例如資料表和資料表屬性、檢視、索引、資料類型和其他資料類型。

  • 在 DBeaver 的 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按一下您想要使用的連線。

  • 如果已啟用 Connect ,請按一下它。 (如果已停用 Connect ,表示您已經連線。)

    您應該先啟動您的資源,然後再嘗試連線到它。 否則,在資源啟動時,連線可能需要幾分鐘的時間才能完成。

  • 展開您剛才連接的連線。

  • 展開並流覽可用的資料物件。 按兩下資料物件以取得其詳細資訊。

    重複此步驟中的指示,以存取其他資料物件。

    步驟 5:使用 DBeaver 來執行 SQL 語句

    使用 DBeaver 將範例資料表從範例 diamonds資料集default 載入工作區中的資料庫,然後查詢資料表。 如需詳細資訊,請參閱 建立資料表。 如果您不想載入範例資料表,請直接跳到 後續步驟

  • 在 DBeaver 的 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按一下您想要使用的連線。

  • 如果已啟用 Connect ,請按一下它。 (如果已停用 Connect ,表示您已經連線。)

    您應該先啟動您的資源,然後再嘗試連線到該資源。 否則,當資源啟動時,連線可能需要幾分鐘的時間才能完成。

  • 按一下 [SQL 編輯器 > ] [新增 SQL 腳本]。

  • [ (connection-name) Script-1] 索引標籤上,輸入這些 SQL 語句,這會刪除名為 的資料表,然後根據 Databricks 檔案系統 (DBFS) 掛接點中的 CSV 檔案內容建立名為 diamonds 的資料表 diamonds

    DROP TABLE IF EXISTS diamonds;
    CREATE TABLE diamonds USING CSV OPTIONS (path "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header "true");
    
  • 按一下 [SQL 編輯器 > 執行 SQL 語句]。

  • 在 [ 資料庫導覽器 ] 視窗中,展開 預設 資料庫,然後按一下 [ 重新整理]。

  • 展開 [資料表],然後按兩下 形。

  • [菱形 ] 索引標籤內,按一下 [ 資料] 索引 標籤以查看資料表的資料。

    若要刪除 diamonds 資料表:

  • 按一下 [SQL 編輯器 > ] [新增 SQL 腳本]。

  • [ (connection-name) Script-2 ] 索引標籤上,輸入此 SQL 語句,以刪除 diamonds 資料表。

    DROP TABLE IF EXISTS diamonds;
    
  • 在 [ SQL 編輯器] 功能表上,按一下 [ 執行 SQL 語句]。

  • 在 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按一下 預設 資料庫,然後按一下 [ 重新整理]。 資料表 diamonds 會從資料表清單中消失。

  • 使用 Database 物件編輯器 來處理資料庫物件屬性、資料和實體關聯圖表。
  • 使用 資料編輯器 來檢視和編輯資料庫資料表或檢視表中的資料。
  • 使用 SQL 編輯器 來處理 SQL 腳本。
  • 使用 DBeaver 中的 實體關聯圖表 (ERD) 。
  • 從 DBeaver匯入和匯出資料
  • 使用 DBeaver遷移資料
  • 針對 DBeaver 的 JDBC 驅動程式問題進行疑難排解
  • DBeaver 檔
  • DBeaver 支援
  • DBeaver 版本
  • CloudBeaver
  •