コンテンツにスキップ
Tukun.ai A Semantic-first Data Agent
サイト ナビゲーション
サインイン

データを接続する

データ接続は、Tukun.ai における後続すべてのワークフローの基盤です。セットアップが速くても、ソース範囲が正しくなかったり、レビュー可能な分析を支えられなければ意味がありません。

Workbench から始めることも、データソース一覧から始めることもできます。

Workbench では、入力欄の横にある + メニューを開きます。

  • ファイルをアップロード は、ローカルの Excel または CSV に使います
  • データベースに接続 は、会話内でデータベース接続を設定するときに使います
  • データソースを選択 は、既存のソースを現在の会話に追加するときに使います

データベース接続フローは、新しい Workbench turn として表示されます。アシスタント返信には接続フォームが含まれるため、host、port、database、資格情報、関連設定を入力するために別の追加ページへ移動する必要はありません。接続を作成したら、広く使う前に小さな既知の質問で検証してください。

データソース一覧は、既存ソースの確認、詳細表示、不要ソースの整理、Workbench メニューに表示されないソースを完全な一覧から探す場合に使います。

まず次を集めてください。

  • 可能なら読み取り専用資格情報
  • 承認済みのデータベース、スキーマ、またはデータセット範囲
  • 検証用にすでに信頼しているテーブルを 1〜2 個
  • その接続のオーナー
  • アカウントが従うべき機微データ制約

どのテーブルが業務利用に承認されているか分からないなら、そこが明確になるまでセットアップを止めてください。

最初に接続するソースの考え方

Section titled “最初に接続するソースの考え方”

最初のソースは次の条件を満たすべきです。

  • 実際の質問に答えられるだけの代表性がある
  • 素早く検証できる程度に絞られている
  • スキーマについて答えられるオーナーがいる

最大のスキーマから始めないでください。ワークフローを証明できる最小のソースから始めます。

読み取り専用資格情報を使い、承認済みスキーマまたはデータセットにアクセス範囲を限定してください。

サービス主体の運用を優先する

Section titled “サービス主体の運用を優先する”

可能なら個人ユーザー資格情報ではなくサービスアカウントを使ってください。保守、監査、退職時の移管が安全になります。

1 つのソースに本番、サンドボックス、テストデータが混在するなら、意図的に分けるか、業務ユーザーがどう区別すべきかを明文化してください。

「接続成功」からすぐに「プロダクト利用準備完了」に進まないでください。

既知のテーブルや指標に対して、簡単な検証質問を行ってください。

過去 7 日間の日次注文数を表示してください。

確認する点:

  • そもそもデータが返るか
  • 件数感が妥当か
  • 期間の挙動が正しいか
  • ビジネス上の粒度が期待通りか

よくあるオンボーディングの失敗

Section titled “よくあるオンボーディングの失敗”
  • 1 つを検証する前に多数のソースを接続する
  • 後で使えなくなる個人資格情報を使う
  • 誰も保守したくないスキーマを公開する
  • UI 上で接続成功と出たから検証を省略する
  • 命名やガバナンスなしに本番データとテストデータを混在させる

ソースが広く使える状態になった目安

Section titled “ソースが広く使える状態になった目安”

通常、次を満たせばより広い利用に進めます。

  • 代表的な質問が 1 つ以上検証済みである
  • ソースオーナーが分かっている
  • 許可された範囲が理解されている
  • まだセマンティック定義が必要な指標がチームで把握されている

オンボーディング後は次を行ってください。

  • ポリシーに従って資格情報をローテーションする
  • デモ接続や不要接続を削除する
  • 分かりにくいソース名を変更する
  • 大きなスキーマ変更後に重要な質問を再検証する

ソース品質は答えの品質の一部です。ソースのオーナーシップが弱いと、分析への信頼も弱いままです。