Der DataVault unterstützt verschiedene Arten von Datenquellen, die als Datenpools konfiguriert werden können. Jeder Datenpool wird durch einen eigenen Abschnitt in der data_pools-Liste der Vault-Konfiguration definiert.

Allgemeine Parameter

Alle Datenpool-Typen unterstützen folgende Parameter:

ParameterBeschreibungVerpflichtendStandard
idEindeutige ID des Datenpools (wird in meinGPT generiert)-
typeArt der Datenquelle (s3, drive, local)-
base_pathPfad innerhalb der Datenquelle""

Google Drive

Google Drive kann als Datenquelle verwendet werden, um Dokumente aus einem Google Drive-Account zu synchronisieren.

ParameterBeschreibungVerpflichtendStandard
refresh_tokenOAuth2 Refresh-Token für Google Drive-
scopeOAuth2-Scope für den Zugriff (drive, drive.readonly, drive.file, drive.appfolder, drive.metadata.readonly)drive.readonly
root_folder_idID eines spezifischen Ordners als Root-
team_driveID eines Shared Drives-
client_idClient-ID für eigenen Google Drive API-Client-
client_secretClient-Secret für eigenen Google Drive API-Client-
data_pools:
  - id: pool_123
    type: drive
    refresh_token: $GOOGLE_REFRESH_TOKEN
    base_path: "Dokumente/Wiki"
    root_folder_id: "1234567890abcdef"

S3-kompatible Speicher

Der DataVault kann Dokumente aus S3-kompatiblen Objektspeichern (AWS S3, MinIO, DigitalOcean Spaces, etc.) synchronisieren.

ParameterBeschreibungVerpflichtendStandard
endpointURL des S3-Endpunkts-
access_key_idAccess Key ID für S3-Authentifizierung-
secret_access_keySecret Access Key für S3-Authentifizierung-
providerName des S3-ProvidersOther
bucket_nameName des S3-Buckets-
data_pools:
  - id: pool_456
    type: s3
    endpoint: s3.eu-central-1.amazonaws.com
    access_key_id: $S3_ACCESS_KEY
    secret_access_key: $S3_SECRET_KEY
    bucket_name: my-bucket
    base_path: data/documents

Lokales Dateisystem

Für Tests oder kleine Deployments können auch Dateien aus dem lokalen Dateisystem synchronisiert werden.

ParameterBeschreibungVerpflichtendStandard
base_pathPfad zum Ordner im lokalen Dateisystem-
data_pools:
  - id: pool_789
    type: local
    base_path: /path/to/documents

Sensitive Daten wie Zugriffsschlüssel sollten nicht im Klartext in der Konfigurationsdatei gespeichert werden. Nutzen Sie stattdessen Umgebungsvariablen mit der $VARIABLE_NAME Syntax.