Perplexity kündigte ein Upgrade seines Deep Research-Tools an, das jetzt auf dem Claude Opus 4.5-Modell von Anthropic läuft. Das Update kombiniert die fortschrittliche Argumentation des Modells mit der proprietären Suchmaschine und Sandbox-Infrastruktur von Perplexity. Max-Abonnenten können sofort darauf zugreifen, die Einführung für Pro-Benutzer erfolgt in den kommenden Tagen.

Das Unternehmen veröffentlichte außerdem DRACO, einen Open-Source-Benchmark zur Bewertung von Deep-Research-Agenten. DRACO, das für Deep Research Accuracy, Completeness and Objectivity Benchmark steht, deckt 100 Aufgaben in 10 Bereichen ab: Akademik, Finanzen, Recht, Medizin, Technologie, Allgemeinwissen, UX-Design, persönlicher Assistent, Einkaufen und Nadel im Heuhaufen. Die Aufgaben werden anhand von etwa 40 von Experten definierten Kriterien in vier Bereichen bewertet: sachliche Genauigkeit, Breite und Tiefe der Analyse, Präsentationsqualität und Zitierqualität.

Deep Research von Perplexity erreichte auf DRACO normalisiert 67,15 %, vor Google Gemini Deep Research mit 58,97 % und OpenAI Deep Research mit dem o3-Modell mit 52,06 %. Die Ergebnisse blieben bei allen Richtermodellen GPT-5.2 und Sonnet-4.5 konsistent. In den Bereichen Medizin, Allgemeinwissen und Technologie liegt Ratlosigkeit mit 9–12 Prozentpunkten vor dem nächstbesten System. Mit 86,0 % erzielte das Unternehmen die besten Ergebnisse in den Bereichen Jura und 80,2 % im akademischen Bereich.

DRACO greift auf anonymisierte Perplexity Deep Research-Anfragen zurück, die zu komplexen, offenen Aufgaben erweitert werden, die den tatsächlichen Forschungsbedarf widerspiegeln. Der Benchmark bewertet neben der Qualität auch die Effizienz. Perplexity Deep Research lieferte die niedrigste durchschnittliche Latenz von 459,6 Sekunden und erreichte gleichzeitig die höchste Genauigkeit.

Das Upgrade baut auf dem Start von Deep Research im Februar 2025 auf, der Multi-Pass-Abfragen und quellenübergreifende Überprüfung hinzufügte. Im Januar 2025 unterzeichnete Perplexity einen Cloud-Vertrag über 750 Millionen US-Dollar mit Microsoft. CEO Aravind Srinivas erklärte: „Gerade im Finanzbereich ist die Datengenauigkeit ein Muss und ein hohes Risiko.“ Das Unternehmen positioniert Deep Research in der Lage, Analysen auf Forschungsniveau im Vergleich zu Wettbewerbern wie Google und OpenAI zu liefern.


Hervorgehobene Bildnachweise