DatabricksとGitHubをリンク済みアカウントで簡単連携する方法

Databricksでは、GitHubアカウントをリンクし、ノートブックのバージョン管理やリモートリポジトリとの統合を簡単に行えます。さらに、GitHubにDatabricksアプリをインストールすることで、シームレスな連携を実現できます。本記事では、DatabricksとGitHubをリンク済みアカウント機能を使って連携する手順と、必要なGitHubアプリのインストール方法について解説します。

目次

はじめに

Databricksでは、GitHubアカウントをリンクし、ノートブックのバージョン管理やリモートリポジトリとの統合を簡単に行えます。さらに、GitHubにDatabricksアプリをインストールすることで、シームレスな連携を実現できます。本記事では、DatabricksとGitHubをリンク済みアカウント機能を使って連携する手順と、必要なGitHubアプリのインストール方法について解説します。

1. 必要な準備

  • Databricksアカウント:ワークスペースへのアクセス権限があること。
  • GitHubアカウント:リポジトリの管理権限があること。
  • Databricksアプリのインストール:GitHubリポジトリにDatabricksアプリをインストールする必要があります(後述)。

2. DatabricksとGitHubアカウントのリンク

2.1 DatabricksでGitHubアカウントをリンク

1.Databricksワークスペースにログインします。

2.サイドバーのプロフィールアイコンをクリックし、「ユーザ設定(User Settings)」を選択します。

3.「Git統合(Git Integration)」タブを開きます。

4.ドロップダウンから「GitHub」を選択します。

5.「Gitアカウントをリンク(Link Git Account)」ボタンをクリックします。

6.表示されるGitHubの認証画面で「Authorize Databricks」をクリックします。

3. GitHubにDatabricksアプリをインストール

DatabricksがGitHubリポジトリと完全に統合されるには、GitHubにDatabricksアプリをインストールする必要があります。

3.1 Databricksアプリをインストールする手順

1.GitHubにログインします。

2.DatabricksアプリのGitHubページ にアクセスします。

3.「Install App(アプリをインストール)」をクリックします。

4.インストール対象のリポジトリを選択します(すべてのリポジトリ、または特定のリポジトリを選択可能)。

5.「Install(インストール)」をクリックしてインストールを完了します。

これで、DatabricksアプリがGitHubリポジトリで動作するようになります。

4. ノートブックとリポジトリの統合

GitHubアカウントとDatabricksのリンク、およびアプリのインストールが完了したら、DatabricksノートブックをGitHubリポジトリと統合します。

4.1 Gitリポジトリを設定する

1.Databricksワークスペースで、ノートブックを開きます。

2.右上の「Git」アイコンをクリックします。

3.「Gitフォルダを作成」を選択します。

4.リモートリポジトリのURL(例:https://github.com/username/repository.git)を入力します。

5.Databricksが自動的にリポジトリをクローンし、ノートブックがGitで管理されます。


4.2 ノートブックの変更をGitHubにコミット

1.ノートブックの編集後、右上の「Git」アイコンをクリックします。

2.「変更を表示(View Changes)」を選択し、変更内容を確認します。

3.「コミット(Commit)」をクリックして変更をGitHubに反映します。

5. トラブルシューティング

Databricksアプリが動作しない場合
  • アプリのインストール対象リポジトリが正しいことを確認してください。
  • DatabricksワークスペースとGitHubアカウントが正しくリンクされているかを確認してください。
Gitリポジトリへのアクセスが拒否される場合
  • GitHubリポジトリのアクセス権限(プッシュ可能かどうか)を確認してください。
  • Databricksアプリに十分な権限があるかを確認してください。

おわり

DatabricksとGitHubの連携は、データプロジェクトのバージョン管理や共同作業をスムーズにする重要なステップです。リンク済みアカウントを使えば、トークンの管理が不要で、GitHubアプリをインストールすることでさらに簡単に統合が進みます。

CTA
  • URLをコピーしました!
  • URLをコピーしました!
この記事を書いた人
目次