本文涵蓋 Databricks 未提供或支援的 DBeaver。 若要連絡提供者,請參閱在 GitHub 上使用
dbeaver/dbeaver
存放庫的
[問題
] 頁面。
DBeaver
是一種本機、多平臺資料庫工具,適用于開發人員、資料庫管理員、資料分析師、資料工程師,以及其他需要使用資料庫的人員。 DBeaver 支援 Azure Databricks 和其他熱門資料庫。
本文說明如何使用本機開發電腦來安裝、設定和使用免費的 DBeaver Community Edition 開放原始碼 (CE) ,以使用 Azure Databricks 中的資料庫。
本文已經過 macOS、
Databricks JDBC Driver
2.6.25 版和
DBeaver CE
22.1.0 版的測試。
安裝 DBeaver 之前,您的本機開發電腦必須符合下列需求:
Linux 64 位、macOS 或 Windows 64 位作業系統。 支援 (Linux 32 位,但不建議使用。)
Databricks JDBC Driver
到本機開發電腦,從下載
DatabricksJDBC42-<version>.zip
的檔案中擷取
DatabricksJDBC42.jar
檔案。
您也必須擁有 Azure Databricks
叢集
或
SQL 倉儲
,才能與 DBeaver 連線。
步驟 1:安裝 DBeaver
下載並安裝
DBeaver CE
,如下所示:
Linux
:從 DBeaver 網站上的 [下載] 頁面
下載
並執行其中一個 Linux 安裝程式。
snap
此頁面也提供 和
flatpak
安裝選項。
macOS
:使用
Homebrew
來執行
brew install --cask dbeaver-community
,或使用
MacPorts
執行
sudo port install dbeaver-community
。 您也可以從 DBeaver 網站上的
[下載
] 頁面取得 macOS 安裝程式。
Windows
:使用
Chocolatey
執行
choco install dbeaver
。 您也可以從 DBeaver 網站上的
[下載
] 頁面取得 Windows 安裝程式。
使用您稍早下載之 Databricks JDBC Driver 的相關資訊來設定 DBeaver。
啟動 DBeaver。
如果系統提示您建立新的資料庫,請按一下 [
否
]。
如果系統提示您連線或選取資料庫,請按一下 [
取消
]。
按一下
[資料庫 > 驅動程式管理員
]。
在 [
驅動程式管理員]
對話方塊中,按一下 [
新增
]。
在 [
建立新的驅動程式]
對話方塊中,按一下 [連結
庫] 索引卷
標。
按一下 [加入檔案]。
流覽至
DatabricksJDBC42.jar
您稍早擷取的檔案,然後按一下 [
開啟
]。
按一下
[尋找類別
]。
在
[驅動程式類別
] 清單中,確認已選取
com.databricks.client.jdbc.Driver
。
在 [
設定]
索引標籤的
[驅動程式名稱]
中,輸入
Databricks
。
在 [
設定]
索引標籤的 [
類別名稱
] 中,輸入
com.databricks.client.jdbc.Driver
。
按一下 [確定]。
在 [
驅動程式管理員]
對話方塊中,按一下 [
關閉
]。
步驟 3:將 DBeaver 連線到您的 Azure Databricks 資料庫
使用 DBeaver 連線到叢集或 SQL 倉儲,以存取 Azure Databricks 工作區中的資料庫。
在 DBeaver 中,按一下 [
資料庫 > 新增資料庫連接
]。
在 [
連接到資料庫
] 對話方塊的 [
所有
] 索引標籤上,按一下
[Databricks
],然後按 [
下一步
]。
按一下 [
主要]
索引標籤,然後在 Azure Databricks 資源的
[JDBC URL]
欄位中輸入值:
在叢集 [
進階選項
] 區域中的
[JDBC/ODBC
] 索引標籤上尋找
JDBC URL
域值。 JDBC URL 看起來應該像這樣:
jdbc:databricks://adb-1234567890123456.7.azuredatabricks.net:443/default;transportMode=http;ssl=1;httpPath=sql/protocolv1/o/1234567890123456/1234-567890-reef123;AuthMech=3;UID=token;PWD=<personal-access-token>
如果 JDBC URL 開頭為
jdbc:spark:
,您必須將它變更為
jdbc:databricks:
,否則稍後會收到連線錯誤。
將 取代
<personal-access-token>
為 Azure Databricks 工作區
的個人存取權杖
。
核
取 [在本機儲存密碼
]。
如果您不想將個人存取權杖儲存在本機開發電腦上,請從 JDBC URL 省略
UID=token;PWD=<personal-access-token>
,然後取消核取 [
在本機儲存密碼
]。 每次嘗試連線時,系統會提示您
輸入使用者名稱
(
token
) 和
密碼
(您的個人存取權杖) 。
Sql 倉儲
在 SQL 倉儲的 [
連線詳細資料
] 索引標籤上尋找
[JDBC URL]
域值。 JDBC URL 看起來應該像這樣:
jdbc:databricks://adb-1234567890123456.7.azuredatabricks.net:443/default;transportMode=http;ssl=1;AuthMech=3;httpPath=/sql/1.0/warehouses/a123456bcde7f890;
如果 JDBC URL 開頭為 jdbc:spark:
,您必須將它變更為 jdbc:databricks:
,否則稍後會收到連線錯誤。
針對 [使用者名稱],輸入 token
。
針對 [密碼],輸入您的 個人存取權杖。
核 取 [在本機儲存密碼]。
如果您不想將個人存取權杖儲存在本機開發電腦上,請將 [ 使用者 名稱] 和 [ 密碼 ] 保留空白,然後取消核取 [ 在本機儲存密碼]。 每次嘗試連線時,系統會提示您 輸入使用者名稱 () 和 token
密碼 (您的個人存取權杖) 。
按一下 [測試連接] 。
測試連線之前,您應該先啟動 Azure Databricks 資源。 否則,測試可能需要幾分鐘的時間才能在資源啟動時完成。
如果連線成功,請在 [ 連線測試 ] 對話方塊中,按一下 [ 確定]。
在 [ 連接到資料庫 ] 對話方塊中,按一下 [ 完成]。
在 [ 資料庫導覽器 ] 視窗中,會顯示 Databricks 專案。 若要變更連線的名稱,以便更輕鬆地識別:
以滑鼠右鍵按一下 [Databricks],然後按一下 [ 編輯連線]。
在 [ 連線組態 ] 對話方塊中,按一下 [ 一般]。
針對 [連線名稱],將 取代 Databricks
為連接的不同名稱。
按一下 [確定]。
針對您想要 DBeaver 存取的每個資源,重複此步驟中的指示。
步驟 4:使用 DBeaver 流覽資料物件
使用 DBeaver 存取 Azure Databricks 工作區中的資料物件,例如資料表和資料表屬性、檢視、索引、資料類型和其他資料類型。
在 DBeaver 的 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按一下您想要使用的連線。
如果已啟用 Connect ,請按一下它。 (如果已停用 Connect ,表示您已經連線。)
您應該先啟動您的資源,然後再嘗試連線到它。 否則,在資源啟動時,連線可能需要幾分鐘的時間才能完成。
展開您剛才連接的連線。
展開並流覽可用的資料物件。 按兩下資料物件以取得其詳細資訊。
重複此步驟中的指示,以存取其他資料物件。
步驟 5:使用 DBeaver 來執行 SQL 語句
使用 DBeaver 將範例資料表從範例 diamonds
資料集default
載入工作區中的資料庫,然後查詢資料表。 如需詳細資訊,請參閱 建立資料表。 如果您不想載入範例資料表,請直接跳到 後續步驟。
在 DBeaver 的 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按一下您想要使用的連線。
如果已啟用 Connect ,請按一下它。 (如果已停用 Connect ,表示您已經連線。)
您應該先啟動您的資源,然後再嘗試連線到該資源。 否則,當資源啟動時,連線可能需要幾分鐘的時間才能完成。
按一下 [SQL 編輯器 > ] [新增 SQL 腳本]。
在[ (connection-name) Script-1] 索引標籤上,輸入這些 SQL 語句,這會刪除名為 的資料表,然後根據 Databricks 檔案系統 (DBFS) 掛接點中的 CSV 檔案內容建立名為 diamonds
的資料表 diamonds
:
DROP TABLE IF EXISTS diamonds;
CREATE TABLE diamonds USING CSV OPTIONS (path "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header "true");
按一下 [SQL 編輯器 > 執行 SQL 語句]。
在 [ 資料庫導覽器 ] 視窗中,展開 預設 資料庫,然後按一下 [ 重新整理]。
展開 [資料表],然後按兩下 菱形。
在 [菱形 ] 索引標籤內,按一下 [ 資料] 索引 標籤以查看資料表的資料。
若要刪除 diamonds
資料表:
按一下 [SQL 編輯器 > ] [新增 SQL 腳本]。
在 [ (connection-name) Script-2 ] 索引標籤上,輸入此 SQL 語句,以刪除 diamonds
資料表。
DROP TABLE IF EXISTS diamonds;
在 [ SQL 編輯器] 功能表上,按一下 [ 執行 SQL 語句]。
在 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按一下 預設 資料庫,然後按一下 [ 重新整理]。 資料表 diamonds
會從資料表清單中消失。
使用 Database 物件編輯器 來處理資料庫物件屬性、資料和實體關聯圖表。
使用 資料編輯器 來檢視和編輯資料庫資料表或檢視表中的資料。
使用 SQL 編輯器 來處理 SQL 腳本。
使用 DBeaver 中的 實體關聯圖表 (ERD) 。
從 DBeaver匯入和匯出資料。
使用 DBeaver遷移資料。
針對 DBeaver 的 JDBC 驅動程式問題進行疑難排解 。
DBeaver 檔
DBeaver 支援
DBeaver 版本
CloudBeaver