Deep Research im Überblick
Deep Research beschreibt eine neue Art der KI-Recherche. Statt einer einzelnen Antwort liefert ein Agent eine mehrstufige Untersuchung mit Quellen. Er plant eigenständig, durchsucht viele Webseiten, prüft die Treffer und verdichtet alles zu einem belegten Bericht. Den größten Unterschied macht, wo dieser Prozess läuft und wer dabei die Kontrolle über Daten und Quellen behält.
Was Deep Research von einer einfachen Suche unterscheidet
Eine klassische Suchanfrage gibt Ergebnisse zurück, die Sie selbst sichten. Ein Deep Research Agent geht weiter und zerlegt eine komplexe Frage in Teilschritte. Er kombiniert Planung, wiederholte Recherche über mehrere Quellen und den Einsatz von Werkzeugen wie Websuche oder Datenbanken. Das Ergebnis ist keine Linkliste, sondern ein belegter Bericht.
Der Unterschied zu Retrieval-Augmented Generation (RAG) liegt in der Wiederholung. RAG holt einmal passende Textstellen und erzeugt daraus eine Antwort. Ein Deep Research Agent bewertet seine Zwischenergebnisse, stellt neue Teilfragen und sucht so lange weiter, bis die Recherche trägt. Genau diese Schleife macht ihn für anspruchsvolle Analysen tauglich.
Ein typischer Auftrag folgt diesen Schritten:
- Zielklärung: Der Agent präzisiert die Frage und das gewünschte Format.
- Planung: Er legt Teilfragen und eine Recherchestrategie fest.
- Recherche: Er durchsucht Quellen, liest Inhalte und sammelt Belege.
- Bewertung: Er erkennt Lücken sowie Widersprüche und plant nach.
- Synthese: Er fasst die Funde zu einem strukturierten, zitierten Bericht zusammen.
Ist Deep Research eine fertige Anwendung?
Deep Research ist keine einzelne App, die Sie herunterladen. Es ist eine Funktion, die Sie auf zwei Wegen bekommen.
Der erste Weg sind fertige Cloud-Dienste, etwa von OpenAI, Google oder Perplexity. Sie liefern Ergebnisse per Knopfdruck, verarbeiten Ihre Anfragen aber auf fremden Servern. Über Datenfluss, Quellen und Recherchetiefe entscheidet der Anbieter.
Der zweite Weg ist quelloffene Software auf dem eigenen Server. Werkzeuge wie Perplexica koppeln eine Websuche über SearXNG mit einem Sprachmodell und erzeugen daraus einen zitierten Bericht. Das Modell liefert wahlweise einen lokalen Ollama-Server oder eine externe API. Wer eigene Abläufe gestalten will, baut den Agenten als Automation mit n8n self-hosted.
Diese Tools sind quelloffen und kostenlos. Sie zahlen nur für den Server, auf dem sie laufen, und behalten die Datenhoheit im eigenen Haus.
In wenigen Schritten zum eigenen Deep Research Server
Vom gebuchten Server bis zur ersten Recherche ist der Weg vergleichsweise kurz, da die meisten Tools fertige Container liefern, die Sie mit wenigen Befehlen starten.
- Server mieten: Wählen Sie eine Linux-Maschine mit genügend RAM. Bei STRATO können Sie passend dazu einen Server mieten und in wenigen Minuten loslegen.
- System vorbereiten: Installieren Sie den Container-Dienst Docker, etwa unter Ubuntu Hosting.
- Recherche-Stack starten: Bringen Sie ein Tool wie Perplexica per Docker Compose zum Laufen. Websuche über SearXNG und die Weboberfläche starten dabei zusammen.
- Modell anbinden: Verbinden Sie ein kleines Modell über Ollama oder hinterlegen Sie einen API-Schlüssel. Über LLM-Hosting entscheiden Sie zwischen eigener Hardware und externer Schnittstelle.
- Erste Recherche starten: Öffnen Sie die Oberfläche im Browser, stellen Sie Ihre Frage und prüfen Sie den Bericht samt Quellen.
Wer einen Agenten nach eigenen Regeln benötigt, baut ihn selbst auf. Wie das gelingt, zeigt die Anleitung zum Thema KI-Agent erstellen. So binden Sie auch interne Datenquellen an, die kein Cloud-Dienst sehen soll.
Welche Serverleistung Deep Research verlangt
Die Rechenlast verteilt sich auf zwei Bereiche. Die Steuerung des Agenten, also Planung, Websuche, Datenhaltung und Bericht, läuft auf CPU und Arbeitsspeicher. Rechenintensiv ist allein das Sprachmodell. Ihre Wahl an dieser Stelle bestimmt die nötige Leistung.
Kleine Modelle mit rund sieben Milliarden Parametern laufen auf einem CPU-Server. Die Antwort dauert dann einige Sekunden länger, bleibt aber auf Ihrer Maschine. Für mehr Tempo und größere Modelle holen Sie die Antworten über eine API und nutzen den Server als Steuerzentrale.
Die passende Serverstufe richtet sich nach Recherchevolumen und Datenmenge:
Die Preise finden Sie auf der jeweiligen Produktseite.
Beginnen Sie mit einem externen Modell über API und einem kleinen Server. So prüfen Sie Ihren Agenten im echten Betrieb, bevor Sie in mehr Leistung investieren.
Deep Research im Arbeitsalltag
Konkrete Einsatzfelder zeigen, wofür sich der Aufwand lohnt. Eine Marktanalyse, die früher Tage gedauert hat, liefert der Agent in Minuten als Bericht mit Quellen. Eine Beratung beobachtet Wettbewerber laufend, eine Redaktion recherchiert Hintergründe, eine Forschungsgruppe sichtet aktuelle Studien. Der Server arbeitet rund um die Uhr, auch für geplante Recherchen über Nacht.
Der Vorteil bei STRATO liegt in der Verbindung aus Leistung und Datenschutz. STRATO hostet in zertifizierten Rechenzentren in Deutschland. Beim Linux V-Server lassen sich im Bestellprozess auch weitere EU-Standorte wählen. So bleibt vertrauliche Recherche im eigenen Haus.
Wählen Sie die passende Serverstufe und richten Sie Ihren eigenen Deep Research Agenten ein.
Passende Server-Angebote von STRATO