データを接続する
データ接続は、Tukun.ai における後続すべてのワークフローの基盤です。セットアップが速くても、ソース範囲が正しくなかったり、レビュー可能な分析を支えられなければ意味がありません。
どこからデータを接続するか
Section titled “どこからデータを接続するか”Workbench から始めることも、データソース一覧から始めることもできます。
Workbench では、入力欄の横にある + メニューを開きます。
- ファイルをアップロード は、ローカルの Excel または CSV に使います
- データベースに接続 は、会話内でデータベース接続を設定するときに使います
- データソースを選択 は、既存のソースを現在の会話に追加するときに使います
データベース接続フローは、新しい Workbench turn として表示されます。アシスタント返信には接続フォームが含まれるため、host、port、database、資格情報、関連設定を入力するために別の追加ページへ移動する必要はありません。接続を作成したら、広く使う前に小さな既知の質問で検証してください。
データソース一覧は、既存ソースの確認、詳細表示、不要ソースの整理、Workbench メニューに表示されないソースを完全な一覧から探す場合に使います。
接続前に準備するもの
Section titled “接続前に準備するもの”まず次を集めてください。
- 可能なら読み取り専用資格情報
- 承認済みのデータベース、スキーマ、またはデータセット範囲
- 検証用にすでに信頼しているテーブルを 1〜2 個
- その接続のオーナー
- アカウントが従うべき機微データ制約
どのテーブルが業務利用に承認されているか分からないなら、そこが明確になるまでセットアップを止めてください。
最初に接続するソースの考え方
Section titled “最初に接続するソースの考え方”最初のソースは次の条件を満たすべきです。
- 実際の質問に答えられるだけの代表性がある
- 素早く検証できる程度に絞られている
- スキーマについて答えられるオーナーがいる
最大のスキーマから始めないでください。ワークフローを証明できる最小のソースから始めます。
最小権限を優先する
Section titled “最小権限を優先する”読み取り専用資格情報を使い、承認済みスキーマまたはデータセットにアクセス範囲を限定してください。
サービス主体の運用を優先する
Section titled “サービス主体の運用を優先する”可能なら個人ユーザー資格情報ではなくサービスアカウントを使ってください。保守、監査、退職時の移管が安全になります。
明示的なスコープを優先する
Section titled “明示的なスコープを優先する”1 つのソースに本番、サンドボックス、テストデータが混在するなら、意図的に分けるか、業務ユーザーがどう区別すべきかを明文化してください。
接続後の検証ステップ
Section titled “接続後の検証ステップ”「接続成功」からすぐに「プロダクト利用準備完了」に進まないでください。
既知のテーブルや指標に対して、簡単な検証質問を行ってください。
過去 7 日間の日次注文数を表示してください。確認する点:
- そもそもデータが返るか
- 件数感が妥当か
- 期間の挙動が正しいか
- ビジネス上の粒度が期待通りか
よくあるオンボーディングの失敗
Section titled “よくあるオンボーディングの失敗”- 1 つを検証する前に多数のソースを接続する
- 後で使えなくなる個人資格情報を使う
- 誰も保守したくないスキーマを公開する
- UI 上で接続成功と出たから検証を省略する
- 命名やガバナンスなしに本番データとテストデータを混在させる
ソースが広く使える状態になった目安
Section titled “ソースが広く使える状態になった目安”通常、次を満たせばより広い利用に進めます。
- 代表的な質問が 1 つ以上検証済みである
- ソースオーナーが分かっている
- 許可された範囲が理解されている
- まだセマンティック定義が必要な指標がチームで把握されている
継続運用時のソース衛生
Section titled “継続運用時のソース衛生”オンボーディング後は次を行ってください。
- ポリシーに従って資格情報をローテーションする
- デモ接続や不要接続を削除する
- 分かりにくいソース名を変更する
- 大きなスキーマ変更後に重要な質問を再検証する
ソース品質は答えの品質の一部です。ソースのオーナーシップが弱いと、分析への信頼も弱いままです。