データを接続する

データ接続は、Tukun.ai における後続すべてのワークフローの基盤です。セットアップが速くても、ソース範囲が正しくなかったり、レビュー可能な分析を支えられなければ意味がありません。

どこからデータを接続するか

Workbench から始めることも、データソース一覧から始めることもできます。

Workbench では、入力欄の横にある + メニューを開きます。

ファイルをアップロード は、ローカルの Excel または CSV に使います
データベースに接続 は、会話内でデータベース接続を設定するときに使います
データソースを選択 は、既存のソースを現在の会話に追加するときに使います

データベース接続フローは、新しい Workbench turn として表示されます。アシスタント返信には接続フォームが含まれるため、host、port、database、資格情報、関連設定を入力するために別の追加ページへ移動する必要はありません。接続を作成したら、広く使う前に小さな既知の質問で検証してください。

データソース一覧は、既存ソースの確認、詳細表示、不要ソースの整理、Workbench メニューに表示されないソースを完全な一覧から探す場合に使います。

接続前に準備するもの

まず次を集めてください。

可能なら読み取り専用資格情報
承認済みのデータベース、スキーマ、またはデータセット範囲
検証用にすでに信頼しているテーブルを 1〜2 個
その接続のオーナー
アカウントが従うべき機微データ制約

どのテーブルが業務利用に承認されているか分からないなら、そこが明確になるまでセットアップを止めてください。

最初に接続するソースの考え方

最初のソースは次の条件を満たすべきです。

実際の質問に答えられるだけの代表性がある
素早く検証できる程度に絞られている
スキーマについて答えられるオーナーがいる

最大のスキーマから始めないでください。ワークフローを証明できる最小のソースから始めます。

接続の原則

最小権限を優先する

読み取り専用資格情報を使い、承認済みスキーマまたはデータセットにアクセス範囲を限定してください。

サービス主体の運用を優先する

可能なら個人ユーザー資格情報ではなくサービスアカウントを使ってください。保守、監査、退職時の移管が安全になります。

明示的なスコープを優先する

1 つのソースに本番、サンドボックス、テストデータが混在するなら、意図的に分けるか、業務ユーザーがどう区別すべきかを明文化してください。

接続後の検証ステップ

「接続成功」からすぐに「プロダクト利用準備完了」に進まないでください。

既知のテーブルや指標に対して、簡単な検証質問を行ってください。

過去 7 日間の日次注文数を表示してください。

確認する点:

そもそもデータが返るか
件数感が妥当か
期間の挙動が正しいか
ビジネス上の粒度が期待通りか

よくあるオンボーディングの失敗

1 つを検証する前に多数のソースを接続する
後で使えなくなる個人資格情報を使う
誰も保守したくないスキーマを公開する
UI 上で接続成功と出たから検証を省略する
命名やガバナンスなしに本番データとテストデータを混在させる

ソースが広く使える状態になった目安

通常、次を満たせばより広い利用に進めます。

代表的な質問が 1 つ以上検証済みである
ソースオーナーが分かっている
許可された範囲が理解されている
まだセマンティック定義が必要な指標がチームで把握されている

継続運用時のソース衛生

オンボーディング後は次を行ってください。

ポリシーに従って資格情報をローテーションする
デモ接続や不要接続を削除する
分かりにくいソース名を変更する
大きなスキーマ変更後に重要な質問を再検証する

ソース品質は答えの品質の一部です。ソースのオーナーシップが弱いと、分析への信頼も弱いままです。