Overview
Überblick zu Data Pools, RAG und Quellenanbindung
Data Pools (RAG)
Data Pools sind die Basis für Retrieval-Augmented Generation (RAG) in meinGPT.
Dabei werden Inhalte aus angebundenen Quellen indexiert und Deinem Assistenten als Wissen zur Verfügung gestellt.
Für die meisten Teams (Standard)
Im Standardfall verbindest Du Deine Quellen direkt in meinGPT und nutzt Data Pools ohne eigene Infrastruktur.
- Quellen in meinGPT verbinden
- Data Pool auswählen
- Assistenten/Workflows darauf zugreifen lassen
Du musst dafür keinen eigenen Data Vault betreiben oder konfigurieren.
Advanced: Eigener Data Vault (On-Premise)
Wenn Du eine eigene On-Premise-Wissensinfrastruktur betreiben willst, kannst Du einen eigenen Data Vault deployen und selbst konfigurieren.
- Netzwerkmodell wählen: On-Premise Connections
- Vault-Betrieb & Konfiguration: /integrations/vault
Wann Data Pools sinnvoll sind
- Du willst viele Dokumente zentral verwalten
- Du brauchst wiederverwendbares Wissen für mehrere Assistenten
- Du willst Zugriffe über Quellen und Syncs steuern
Quellen (Sources)
Alle unterstützten Quellen findest Du hier:
Typische Quellen:
- SharePoint / OneDrive
- Google Drive
- Confluence
- Amazon S3
- SMB / WebDAV
- Lokale Filesysteme
Custom Data Preparation Pipelines
Ein eigenes Muster mit S3-Übergabepunkt für Drittsysteme findest Du hier: