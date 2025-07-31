Multi-Agent-PRD-Automatisierung mit MetaGPT, Ollama und DeepSeek

Erfahren Sie, wie Sie mit MetaGPT, DeepSeek und Ollama ein KI-gestütztes Tool aufbauen können, das Produktmanagern hilft, mithilfe eines Teams spezialisierter KI-Agenten schnell umfassende Produktanforderungsdokumente (PRDs) zu erstellen.

MetaGPT ist ein Multi-Agenten-Framework, das von DeepWisdom entwickelt wurde, einem Tech-Startup, das sich auf die Entwicklung von Open-Source-Tools konzentriert, die Arbeit mithilfe künstlicher Intelligenz, Multi-Agenten-Systemen und agentischer Workflows automatisieren.

Im Gegensatz zu einem Single-Agent-Ansatz, bei dem ein Modell versucht, alle Aspekte der Aufgabe zu erledigen, weist dieses Multi-Agent-System jedem Agenten eine bestimmte Rolle und klar definierte Verantwortlichkeiten zu. Durch die Befolgung strukturierter Workflows und die Überprüfung der jeweiligen Ausgaben der anderen erstellt das Team gemeinsam eine qualitativ hochwertige PRD, die besser auf die Stakeholder-Ziele abgestimmt ist, besser organisiert ist und weniger anfällig für Kontrolle ist.

Bevor wir beginnen, hier ein paar Begriffe, die Ihnen helfen, sich mit dem Tech-Stack der Anwendung vertraut zu machen:

MetaGPT: Ein Framework, das Agenten für große Sprachmodelle (Large Language Models ,LLM) in kollaborative Rollen strukturiert, sodass sie wie ein koordiniertes Team zusammenarbeiten.
Ollama: Eine lokale Laufzeitumgebung zum Ausführen und Verwalten von Open-Source-LLMs direkt auf Ihrem PC oder Ihrer Workstation.
DeepSeek: Ein Open-Source-Sprachmodell, das für Aufgaben wie Recherche, Argumentation und technisches Schreiben optimiert ist.

Automatisieren von PRDs durch Zusammenarbeit mit mehreren Agenten

Die Erstellung von PRDs kann zeitaufwendig sein, doch künstliche Intelligenz kann den Fertigstellungsprozess beschleunigen.

Multi-Agenten-Kollaboration wird in Frameworks wie MetaGPT implementiert. Dabei handelt es sich um ein KI-Tool, das die Koordination mehrerer Rollenspielagenten bei der Erledigung einer komplexen Aufgabe orchestriert. Eine komplexe Aufgabe erfordert in der Regel mehr als einen Schritt zur Fertigstellung.

Die Erstellung von KI-PRDs ist ein hervorragender Anwendungsfall für die Zusammenarbeit mit mehreren Agenten, da sie einen realen Produktentwicklungsprozess widerspiegelt, bei dem mehrere Stakeholder zu Phasen wie Forschung, Planung, Überprüfung und Verfeinerung beitragen. Um die Vorteile von KI-generierten Inhalten voll auszuschöpfen, sollte man die Verwendung eines Multi-Agent-Systems anstelle eines einzelnen Chatbots wie ChatGPT von OpenAI oder Copilot von Microsoft in Betracht ziehen.

Warum ein Multi-Agenten-System wie MetaGPT verwenden?

MetaGPT verwendet spezialisierte KI-Agenten mit unterschiedlichen Rollen, bei denen jede einzelne Rolle mit minimalem Codierungsaufwand an nahezu jeden Workflow angepasst werden kann. Diese Flexibilität ist möglich, weil das LLM die natürliche Sprache gut versteht. Die Benutzer definieren das Verhalten der Bearbeiter und die Workflows durch Prompt Engineering und schlanke Softwareentwicklung.

Das Ziel von MetaGPT ist es, eine effektive Zusammenarbeit mehrerer Agenten zu ermöglichen. Durch die Simulation eines strukturierten Teams wird rollenspezifisches Denken und Aufgabendelegation ermöglicht, was zu kontextbezogenen und konsistenten Ausgaben wie hochwertigen PRDs führt.

Später in diesem Tutorial werden wir zeigen, wie ein einzelner Agent einen ersten PRD-Entwurf erstellt – ähnlich wie bei der Verwendung eines eigenständigen Chatbots. Wir vergleichen diesen Entwurf dann mit dem endgültigen, genaueren PRD, der durch die Zusammenarbeit mehrerer Agenten entstanden ist. Diese Methode zeigt, wie Teamarbeit die Qualität über das hinaus verbessert, was ein Mitarbeiter allein erreichen kann.

Warum DeepSeek für die PRD-Automatisierung verwenden?

DeepSeek, entwickelt von DeepSeek-AI, ist eine Familie hochmoderner Open-Source-LLMs, die für Denkaufgaben, strukturierte Inhaltserstellung und effiziente KI-Entwicklungs-Workflows optimiert sind. In diesem Projekt verwenden wir deepseek-r1, ein leistungsstarkes Basismodell, das sich ideal für die Automatisierung der Produktdokumentation eignet.

Aus folgenden Gründen zeichnet sich DeepSeek durch die Erstellung von PRDs mit einem Multiagentensystem wie MetaGPT aus:

  • Strukturierte Ausgabe für die Automatisierung: DeepSeek-Modelle generieren eine konsistente Markdown-Ausgabe, die gut zu Workflows passt, die formale Dokumentenstrukturen wie PRDs oder technische Spezifikationen erfordern.
  • Fähigkeiten zur Argumentation: Das Modell unterstützt Multi-Agenten-Interaktionsschleifen, indem es sequentielle Schlussfolgerungen und Revisionsschritte verarbeitet.
  • Leistungsbenchmarks: Laut veröffentlichten Benchmarks schneiden die Modelle von DeepSeek mit anderen Open-Source-Modellen im Parameterbereich von 7 bis 13B ab, einschließlich derer von Mistral-, LLaMA- und IBM Granite-Modellen. Granite wurde von IBM Research entwickelt und ist für Anwendungsfälle auf Unternehmensniveau konzipiert, und der Schwerpunkt liegt auf Governance, Robustheit sowie strukturierten Geschäftsprozessen.
  • Lokale Inferenz: Die Ausführung von Deepseek-r1 durch Ollama auf lokalen GPUs ermöglicht Experimente mit geringerer Latenz, ohne dass Sie auf externe Programmierschnittstellen wie OpenAI oder Microsoft Azure angewiesen sind (kein API-Schlüssel erforderlich!). Dieser Ansatz kann für Workflows nützlich sein, die Datenschutz oder Offline-Entwicklung erfordern.
  • Sprachunterstützung und Kontextfenster: DeepSeek bietet starke mehrsprachige Unterstützung, einschließlich Chinesisch, und enthält ein angemessen langes Kontextfenster, das den erweiterten Speicher über Multiagenten-Sitzungen hinweg unterstützt.

Obwohl in diesem Tutorial DeepSeek verwendet wird, kann das gleiche Multi-Agenten-System mit anderen LLMs betrieben werden, die Ollama, Hugging Face oder die OpenAI-API unterstützen. Die Wahl des Modells hängt von Genauigkeit, Ausgabeformat, Ressourcen und geplanter Bereitstellung ab.

Wie funktioniert MetaGPT?

MetaGPT nutzt das Konzept von Standardarbeitsanweisungen (SOPs), um die Zusammenarbeit zwischen Mensch und KI aufeinander abzustimmen. Dabei werden Workflows auf der Grundlage realer Teams (d. h. eines Softwareunternehmens oder eines Produktentwicklungsteams) strukturiert.

Eine SOP enthält detaillierte, schrittweise Anleitungen für die Erledigung einer bestimmten Aufgabe oder eines bestimmten Prozesses. MetaGPT wendet dieses Konzept an, indem komplexe Aufgaben (wie die Erstellung einer PRD) in klare, umsetzbare Schritte zerlegt werden.

Jede Aktion wird einem bestimmten „Teammitglied“ oder einem Rollenspiel-KI-Agenten zugewiesen.

MetaGPT-Basisagent

MetaGPT-Agenten arbeiten in einem strukturierten, rollenbasierten System, das ihre Aufgaben durch kollaborative Workflows simuliert und koordiniert.

Jeder Agent folgt einem organisierten agentenbasierten Workflow, der auf vier Kernkonzepten basiert:

  1. Rolle: Eine spezialisierte Person, die einen bestimmten Zweck erreicht (Projektmanager, Designer, Analyst).
  2. Aktion: Die Fähigkeit, bestimmte Aufgaben auszuführen (Schreiben, Überprüfen, Recherchieren und mehr).
  3. Gedächtnis: Das individuelle Gedächtnis wird als Liste von Nachrichtenobjekten gespeichert, die frühere Interaktionen, Beobachtungen und Aktionen enthalten. Diese Nachrichten werden in einem gemeinsamen Nachrichtenpool veröffentlicht und informieren die Aktionen der Agenten. Erinnerungen unterstützen die Aktionen der Agenten.
  4. Umgebung: Ein gemeinsamer Bereich (der globale Nachrichtenpool), um ohne direkte Interaktion auf Informationen von anderen Agenten zuzugreifen. Dieser Bereich fungiert als gemeinsamer Kontext für alle Agenten.

Zusammen bilden diese Komponenten die Grundlage für die Autonomie der Agenten und die Aufgabenausführung in MetaGPT. Als Nächstes ergründen wir, wie diese Bearbeiter kommunizieren und zusammenarbeiten, um mehrstufige Aufgaben wie die Erstellung einer PRD zu erledigen.

Wie MetaGPT-Agenten zusammenarbeiten

MetaGPT-Agenten folgen einem koordinierten Prozess, in dem jeder Agent zu einem gemeinsamen Ziel beiträgt. Jeder Agent verarbeitet Informationen und Gründe auf der Grundlage seiner Rolle, ergreift Maßnahmen und teilt Ergebnisse mit anderen. Dieser Ansatz ermöglicht eine dynamische, schrittweise Zusammenarbeit, die auf das endgültige Output hinarbeitet

Workflow des MetaGPT-Agenten:

  1. Beobachten: Der Agent überprüft den aktuellen Stand (z. B. den neuesten PRD-Entwurf).
  2. Denken: Mithilfe des LLM entscheidet er auf der Grundlage seiner Rollen und der verfügbaren Informationen, was als nächstes zu tun ist.
  3. Handeln: Der Agent führt die ihm zugewiesene Aufgabe aus, z. B. das Schreiben, Überprüfen oder Recherchieren.
  4. Teilen: Der Agent protokolliert seine Ausgabe und sendet eine Nachricht an die freigegebene Umgebung, damit andere Agenten im Team darauf zugreifen können.
  5. Nächster Agent: Der Prozess wechselt zum nächsten Agenten, der dort weitermacht, wo der vorherige aufgehört hat, bis ein Konsens erreicht wird.

Die Bearbeiter durchlaufen diese strukturierte Schleife und bauen in jeder Runde auf den Arbeiten der anderen auf, bis sie eine endgültige, vollständigere und genauere Ausgabe erzielen.

Mit MetaGPT ist es möglich, ein vollautomatisches KI-Produktentwicklungsteam aufzubauen, indem Agentenrollen, SOPs, PRD-Vorlagen, Stakeholder-Prioritäten und Gesamtprojektziele angepasst werden. Das Framework ist erweiterbar, sodass Teams es an spezifische Workflows und Anforderungen anpassen können.

Da wir nun wissen, wie die einzelnen Agenten arbeiten und zusammenarbeiten, wollen wir uns ansehen, wie dieser Prozess auf der Anwendung im vollständigen Workflow orchestriert wird.

So funktioniert der PRD-Workflow mit mehreren Agenten

Dieser Abschnitt dient als Schritt-für-Schritt-Anleitung, um den Workflow des Teams von MetaGPT-Agenten dieser Multiagenten-PRD-Generierungsanwendung zu verstehen.

Festlegung der Standardarbeitsanweisungen (SOP)

Ein strukturierter agentischer Workflow wird durch die Erstellung einer SOP mit dem MetaGPT-Team definiert. Die SOP zerlegt die komplexe Aufgabe der PRD-Erstellung in klare, umsetzbare Schritte und weist jedem spezialisierten Agenten Aufgaben zu.

Rollen und Zuständigkeiten

Eine gut definierte SOP klärt die Rolle und die Maßnahmen jedes Agenten. Diese Struktur fördert die Verantwortlichkeit und die reibungslose Ausführung im gesamten PRD-Lebenszyklus: Entwurf, Anreicherung durch Forschungsergebnisse, Überprüfung und Überarbeitung.

Teamrollen:

  • Produktmanager (Teamleiter): Orchestriert den Workflow, entwirft die erste PRD, sammelt Forschungs- und Überprüfungs-Feedback, überarbeitet das Dokument und speichert alle Versionen. Der Projektmanager-(PM-)Agent leitet den Prozess und koordiniert die anderen Bearbeiter. 

  • Forscher: Bereichert die PRD mit relevanten Forschungsergebnissen und unterstützenden Daten.

  • Prüfer: Überprüft die PRD und gibt umsetzbares Feedback für Verbesserungen.

Workflow-Phasen

  1. Benutzeridee: Der Benutzer liefert eine Projektidee („Schreiben Sie eine PRD für eine Bankanwendung zur Vermögensverwaltung“) über die Befehlszeile.
  2. Team-Einrichtung: Die App erstellt ein Team und weist die Rollen zu: Produktmanager, Forscher, Prüfer.
  3. Entwurf: Der Produktmanager (als Teamleiter) erstellt und speichert die erste PRD als DraftPRD.md, in der die Ziele des Produkts, die Benutzer-Person, die Hauptmerkmale und die funktionalen Anforderungen beschrieben sind.
  4. Recherche: Der Forscher prüft den Entwurf und liefert unterstützende Recherchen.
  5. Überprüfung: Der Prüfer bewertet den Entwurf und gibt Feedback.
  6. Überarbeitung: Der PM sammelt das Forschungs- und Feedback, überarbeitet den PRD und speichert das endgültige Dokument als PRD.md.
  7. Ausgabe: Die endgültige PRD (mit Recherchen und Überarbeitungen) wird als Markdown-Datei im Projektverzeichnis gespeichert.

Diese SOP stellt sicher, dass der Projektmanager das Team leitet und alle Beiträge koordiniert, um eine forschungsgestützte und geprüfte PRD zu automatisieren.

Systemvoraussetzungen

Um dieses Tutorial effektiv ausführen zu können, müssen Benutzer die folgenden Voraussetzungen erfüllen:

  • Betriebssystem: macOS, Linux oder Windows
  • Arbeitsspeicher (RAM): >= 16 GB
  • Speicherplatz: >= 10 GB frei (für Python-Umgebung, Ollama-Modelle und generierte Dateien)
  • Ollama: Lokal installiert und ausgeführt (Standard-Port 11434)
  • Python-Version: 3.11.x

Hinweis: Die Ausführung größerer Modelle oder mehrerer Agenten erfordert möglicherweise mehr Speicher (über 32 GB für optimale Leistung empfohlen). Es können sporadisch auftretende Zeitüberschreitungsfehler auftreten. Sollten Zeitüberschreitungsfehler auftreten, versuchen Sie, den Prozess neu zu starten und sicherzustellen, dass Ihr System über ausreichende Ressourcen verfügt.

Schritte

Schritt 1. Erstellen eines venv

Diese Schritte können hier oder im entsprechenden Projektordner auf GitHub verfolgt werden. 

Zuerst sollte eine virtuelle Umgebung erstellt werden, um Python-Abhängigkeitsprobleme zu vermeiden. Dieses Projekt läuft am stabilsten mit Python 3.11.

python3.11 -m venv myvenv
source myvenv/bin/activate

Schritt 2. MetaGPT installieren

Installieren Sie die aktuelle Entwicklungsversion von MetaGPT.

pip install git+https://github.com/geekan/MetaGPT

Wichtig: Für dieses Tutorial müssen Sie MetaGPT mit dem obigen Befehl installieren. Installieren Sie MetaGPT nicht von PyPI oder anderen Quellen, da hier nur die neueste Entwicklungsversion unterstützt wird.

Schritt 3. Ollama installieren

Installieren Sie Ollama mit einer der folgenden Methoden, je nach Betriebssystem:

Für macOS (mit Homebrew)

brew install ollama

Download von der offiziellen Ollama-Website (macOS, Linux, Windows)

Schritt 4. Starten Sie den Ollama-Server und rufen Sie deepseek-r1:8b ab

Nach der Installation können Sie den Ollama-Server starten und ein Modell (deepseek-r1:8b) abrufen mit:

ollama serve
ollama pull deepseek-r1:8b

Schritt 5. Konfigurieren von MetaGPT für die Verwendung von Ollama

Um Ollama und Deepseek für die Verwendung mit MetaGPT zu konfigurieren, müssen wir eine Konfigurationsdatei erstellen und bearbeiten.

Initialisieren Sie die MetaGPT-Konfiguration:

metagpt --init-config

Diese Aktion erstellt eine Datei unter~/.metagpt/config2.yaml

Bearbeiten Sie die Datei, um Ihr LLM mit den folgenden Schritten zu konfigurieren:

1.        Führen Sie in einem Terminalfenster den folgenden Befehl aus, um die Konfigurationsdatei im Nano-Editor zu öffnen:

nano ~/.metagpt/config2.yaml

2.        Bearbeiten Sie die Datei so, dass sie mit dieser Ollama-Konfiguration übereinstimmt, die das Modell deepseek-r1:8b verwendet.

llm:
  api_type: 'ollama'
  base_url: 'http://127.0.0.1:11434/api'
  model: 'deepseek-r1:8b'

Anmerkung: Wenn das Feldapi_key: in der YAML-Datei steht, lassen Sie es nicht leer. Geben Sie entweder einen gültigen Schlüssel an oder entfernen Sie das Feld vollständig. Das Programm wird nicht ausgeführt, wennapi_key: das Feld existiert und leer ist.

  1. Nachdem Sie die vorherigen Änderungen vorgenommen haben, drücken Sie Ctrl + O  um zu speichern, drücken Sie dann Enter um zu bestätigen.
  2. Drücken SieCtrl + X um Nano zu verlassen

Ihre LLM-Konfigurationsänderungen sind jetzt gespeichert!

Weitere Konfigurationsbeispiele finden Sie in den beiden MetaGPT-Dokumenten hier und hier.

Schritt 6. Erfahren Sie, wie MetaGPT-Agenten funktionieren: Aktionen und Rollen

MetaGPT-Agenten bestehen aus zwei Hauptkomponenten:

  • Aktionen: Diskrete Aufgaben oder Operationen, die ein Agent ausführen kann (z. B. das Verfassen eines PRD, das Durchführen von Recherchen).
  • Rollen: Definiert die Verantwortlichkeiten des Agenten und die Maßnahmen, die er ergreifen kann (z. B. Projektmanager, Forscher).

Aktionen

EinAction ist eine Python-Klasse, die eine bestimmte Aufgabe für einen Agenten definiert.
Aktionen sagen jedem Agenten, was er tun und wie er mit dem Sprachmodell interagieren soll.

Jede dieser Aktionen umfasst typischerweise Folgendes:

  •  APROMPT_TEMPLATE : Die Anweisung oder Nachricht, die an das LLM gesendet wird (z. B. „Schreiben Sie eine PRD im Markdown-Format“).
  •  Arun()  Methode: Füllt die Prompt-Vorlage aus, sendet sie an das LLM und gibt die Antwort des Modells zurück.
  • Optional, aparse_text() Methode: Verarbeitet die Ausgabe des LLM, um die relevanten Informationen zu extrahieren (z. B. Markdown, Code oder JSON).

Importe für Aktionen erforderlich:

import re
import os
from metagpt.actions import Action
  • re ist für reguläre Ausdrücke (verwendet inparse_text )
  • os ist für Dateioperationen (verwendet inSavePRD )
  • Action ist die Basisklasse für alle Aktionen in MetaGPT

Rollen

Die Rollenklasse repräsentiert einen KI-Agenten oder ein Teammitglied im Workflow. Rollen weisen das Modell an, wie es sich verhalten soll, und definieren, welchen spezifischen Teil des Prozesses es folgen soll (z. B. Verwalten, Recherchieren oder reviews).

Jede Rolle umfasst in der Regel:

  • __init__ : Initialisiert die Rolle, richtet ihre Aktionen ein und definiert, auf welche Ereignisse oder Meldungen sie achten soll.

  •  _act : Führt eine oder mehrere zugewiesene Aktionen aus, wenn die Agenten am Zug sind. Diese Methode definiert das Verhalten des Bearbeiters im Workflow.

Erforderliche Importe für Rollen:

from metagpt.roles import Role
from metagpt.schema import Message
from metagpt.logs import logger
  • Role ist eine Basisklasse für alle Agentenrollen in MetaGPT.
  • Message wird verwendet, um Ergebnisse von Aktionen zurückzugeben.
  • logger wird für die Protokollierung von Ausgabe- und Debugging-Informationen verwendet.

Übersicht über den Workflow

MetaGPT organisiert den Workflow in Runden, also iterativen Zyklen, in denen die Agenten zusammenarbeiten, um die PRD zu verbessern. Jede Runde besteht aus den folgenden Schritten:

Runde 1: Erster Entwurf

  • Der Projektmanager erstellt und speichert den ersten PRD-Entwurf auf der Grundlage des Prompts des Benutzers.
  • Der Forscher und die Prüfer erhalten diesen Entwurf für ihre Aufgaben.

Runde 2 (und folgende): Überprüfung und Revision:

  • Der Forscher erstellt unterstützende Forschungsergebnisse für das PRD.
  • Der Prüfer gibt Feedback zum PRD-Entwurf.
  • Der Projektmanager überarbeitet die PRD anhand neuer Forschungsergebnisse und Feedback und speichert die aktualisierte Version.

Wiederholen

  • Der Prozess kann sich über mehrere Runden wiederholen, sodass die PRD mit jedem Zyklus schrittweise verbessert werden kann.

Workflow-Diagramm der Multiagenten-PRD-Generierung:

User prompt
   ↓
Team initialization
   ↓
PRD draft (Project Manager)
   ↓
Research and review (Researcher & Reviewer)
   ↓
Draft revision (Project Manager)
   ↓
Save final PRD

Im nächsten Schritt wird ein Team von Agenten für die KI-Automatisierung der PRD aufgebaut.Die Rollen jedes Agenten werden definiert und relevante Workflow-Aktionen verbunden.

Schritt 7. Bauen Sie mit MetaGPT ein Multiagenten-PRD-Team auf

In diesem Abschnitt lernen Sie, Agentenaktionen zu definieren, Agentenrollen zu erstellen und ein Team zusammenzustellen, um die PRD-Erstellung, Recherche und Überprüfung zu automatisieren.

Definieren von Agentenaktionen

Hier sind die Agentenaktionen, die das PRD-Team mithilfe derAction Klasse durchführt:

import re
import os
from metagpt.actions import Action

def clean_response(rsp):
    # Cleans LLM output, extracting markdown and removing extra tags
    rsp = re.sub(r"<think>.*?</think>", "", rsp, flags=re.DOTALL)
    pattern = r"```(?:markdown)?(.*?)```"
    match = re.search(pattern, rsp, re.DOTALL)
    text = match.group(1) if match else rsp
    return text.strip()

class WritePRD(Action):
    PROMPT_TEMPLATE: str = """
    Write a comprehensive product requirements document (PRD) for {instruction} and provide the output in markdown format.
    **Important:**
    - Do NOT include any code, programming language, or technical implementation details.
    - Only write markdown for a PRD document (sections like Introduction, Goals, User Stories, Requirements, etc.).
    - Do NOT include code blocks, scripts, or pseudocode.
    - Limit your response to a maximum of 1,500-3,000 words and no more than 7 unique sections.
    - Ensure that no sections are repeated.
    - Ensure that each section is ordered and formatted correctly with appropriate headings and subheadings.

    Return ```your markdown text here with NO other texts, your text:
    """

    name: str = "WritePRD"

    async def run(self, instruction: str):
        prompt = self.PROMPT_TEMPLATE.format(instruction=instruction)
        rsp = await self._aask(prompt)
        prd_text = self.parse_text(rsp)
        return prd_text

    @staticmethod
    def parse_text(rsp):
        return clean_response(rsp)
   
class SavePRD(Action):
    name: str = "SavePRD"

    async def run(self, content: str, filename: str = "PRD.md"):
        filepath = os.path.join(os.getcwd(), filename)
        with open(filepath, "w", encoding="utf-8") as f:
            f.write(content)
        return f"PRD saved to {filepath}"
   
class ConductResearch(Action):
    PROMPT_TEMPLATE: str = """
   Context: {context}
    You are a research assistant working with the Project Manager to ensure that
    the PRD includes information from a detailed research report for the given PRD.
    Use the {instruction} to generate a detailed research report on relevant details
    that should be included in the PRD and provide the output in markdown format.
    Include relevant data, statistics, and references to support the PRD.
    **Important**:
    1. Return only the markdown text.
    2. Do not include any other text or explanations.
    3. Limit your response to the content that is relevant to the PRD and a maximum of 500-1,500 words.
    Return ```your markdown text here``` with NO other texts, your text:
    """

    name: str = "ConductResearch"

    async def run(self, instruction: str, context: str = ""): 
        prompt = self.PROMPT_TEMPLATE.format(instruction=instruction, context=context)
        rsp = await self._aask(prompt)
        research_content = self.parse_text(rsp)
        return research_content    
   
    @staticmethod
    def parse_text(rsp):
        return clean_response(rsp)
   
class PerformReview(Action):
    PROMPT_TEMPLATE: str = """
    You are a product reviewer. The following is a Product Requirements Document
    (PRD) generated for a project.

    Please review the PRD below and provide critical, actionable feedback to improve
    its clarity, completeness, and effectiveness. Highlight any missing sections,
    unclear requirements, or potential risks. Ensure that no sections are repeated.

    **Important**:
    1.  Return only the markdown text.
    2. Do not include any other text or explanations.
    3. Limit your response to the content that is relevant to the PRD.
    4. Limit your response to a maximum of 500-1,000 words.

    Return your feedback in markdown format only.

    PRD to review:
    {context}
    """

    name: str = "PerformReview"
    async def run(self, context: str):
        prompt = self.PROMPT_TEMPLATE.format(context=context)
        rsp = await self._aask(prompt)
        review_content = self.parse_text(rsp)
        return review_content
      
    @staticmethod
    def parse_text(rsp):
        return clean_response(rsp)
   
class RevisePRD(Action):
    PROMPT_TEMPLATE: str = """
    Revise the Product Requirements Document (PRD) based on the following review feedback.
    Revise the PRD to address all reviewer suggestions, clarifying vague terms, adding
    measurable goals, expanding on integrations, including user stories, functional requirements, and adding
    any missing sections as suggested.
    **Important**:
    1. Return only the markdown text.
    2. Do not include any other text or explanations.
    3. Include a section at the end titled "Document revision notes" that summarizes the key revisions.
    4. Limit your response to a maximum of 1,500-4,000 words and no more than unique 12 sections.
    5. Ensure that no sections are repeated.
    6. Ensure that each section is ordered and formatted correctly with appropriate headings and subheadings.

    PRD:
    {prd}

    Review Feedback:
    {review}

    Return ```your markdown text here``` with NO other texts, your text:
    """

    name: str = "RevisePRD"

    async def run(self, prd: str, review: str):
        prompt = self.PROMPT_TEMPLATE.format(prd=prd, review=review)
        rsp = await self._aask(prompt)
        revised_prd = self.parse_text(rsp)
        return revised_prd

    @staticmethod
    def parse_text(rsp):
        return clean_response(rsp)

Kernaufgaben

Die folgenden 5 Aktionsklassen definieren die Kernaufgaben, die von den Agenten in diesem KI-gestützten Workflow zur PRD-Generierung ausgeführt werden:

  1. WritePRD erstellt die PRD.
  2. SavePRD speichert die PRD auf dem Datenträger.
  3. ConductResearch generiert unterstützende Recherchen.
  4. PerformReview überprüft die PRD.
  5. RevisePRD überarbeitet die PRD auf der Grundlage des Feedbacks.

Definieren von Agentenrollen

Hier sind die Agentenrollen, die das Multiagenten-PRD-Team darstellen. Im Folgenden finden Sie den Code, der angibt, welche Aktionen sie ausführen.

class ProjectManager(Role):
    name: str = "Pam"
    profile: str = "Project Manager"

    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self.write_action = WritePRD()
        self.save_action = SavePRD()
        self.revise_action = RevisePRD()
        self._watch([UserRequirement, ConductResearch, PerformReview])
        self.set_actions([self.write_action, self.save_action, self.revise_action])

    async def _act(self) -> Message:
        logger.info(f"{self.profile}: Starting PRD generation process.")
        memories = self.get_memories()
        # If this is the first round, generate and save the draft PRD
        if not any(m.role == "Researcher" or m.role == "Reviewer" for m in memories):
            msg = self.get_memories(k=1)[0]
            prd_content = await self.write_action.run(msg.content)
            draft_save_result = await self.save_action.run(prd_content, filename="DraftPRD.md")
            return Message(
                content=draft_save_result,
                role=self.profile,
                cause_by=type(self.write_action)
            )
        # If this is the second round, combine revised PRD and research, then save
        else:
            research_msgs = [m for m in memories if m.role == "Researcher"]
            review_msgs = [m for m in memories if m.role == "Reviewer"]
            research_content = research_msgs[-1].content if research_msgs else "No research found."
            review_content = review_msgs[-1].content if review_msgs else "No review found."
            # Load the draft PRD from file or memory
            with open("DraftPRD.md", "r", encoding="utf-8") as f:
                prd_content = f.read()
            # Only revise if review feedback exists and is not empty
            if review_msgs and review_content.strip() and review_content.strip() != "No PRD draft found.":
                revised_prd = await self.revise_action.run(prd_content, review_content)
            else:
                logger.info(f"{self.profile}: No review feedback found, skipping revision this round.")
                revised_prd = prd_content.strip()
            final_content = (
                f"{revised_prd}\n\n"
                f"---\n\n"
                f"## Research\n{research_content}\n"
            )
            await self.save_action.run(final_content, filename="PRD.md")
            return Message(
                content=final_content,  # Only the markdown document
                role=self.profile,
                cause_by=type(self.write_action)
            )

class Reviewer(Role):
    name: str = "Rico"
    profile: str = "Reviewer"

    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self.review_action = PerformReview()
        self.set_actions([self.review_action])   
        self._watch([WritePRD])

    async def _act(self) -> Message:
        try:
            with open("DraftPRD.md", "r", encoding="utf-8") as f:
                prd_content = f.read()
        except FileNotFoundError:
            prd_content = "No PRD draft found."
        logger.info(f"{self.profile}: Reviewing PRD...")
        review_content = await self.review_action.run(prd_content)
        return Message(content=review_content, role=self.profile, cause_by=type(self.review_action))

class Researcher(Role):
    name: str = "Rita"
    profile: str = "Researcher"

    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self.research_action = ConductResearch()
        self.set_actions([self.research_action])
        self._watch([UserRequirement, WritePRD])

    async def _act(self) -> Message:
        try:
            with open("DraftPRD.md", "r", encoding="utf-8") as f:
                prd_content = f.read()
        except FileNotFoundError:
            prd_content = "No PRD draft found."
        logger.info(f"{self.profile}: Researching for PRD...")
        research_content = await self.research_action.run(
            "Provide supporting research for the following PRD.", context=prd_content
        )
        return Message(content=research_content, role=self.profile, cause_by=type(self.research_action))

Kernworkflow und Rollendefinitionen

Die folgenden Agenten arbeiten zusammen, um jeden Schritt des PRD-Erstellungsprozesses zu automatisieren:

  • ProjectManager (Pam) erstellt, speichert und überarbeitet die PRD.
  • Reviewer (Rico) überprüft die PRD und gibt Feedback.
  • Researcher (Rita) erstellt unterstützende Forschung für die PRD.

Schritt 8. Stellen Sie das Team zusammen und leiten Sie es

Verwenden Sie die Team Klasse, um Agenten einzustellen und den Workflow auszuführen. Diese App verwendet Typer, um den Prozess interaktiv über die Befehlszeile auszuführen.

import typer
import asyncio
from metagpt.team import Team

app = typer.Typer()

@app.command()
def main(
    idea: str = typer.Argument(..., help="A PRD for a banking application for wealth management"),
    investment: float = typer.Option(3.0, "--investment", "-i", help="Dollar amount to invest in the project."),
    n_round: int = typer.Option(2, "--n-round", "-n", help="Number of rounds to run the simulation."),
):
    async def runner():
        team = Team(use_mgx=False)
        team.hire([
            ProjectManager(),
            Researcher(),
            Reviewer(),
        ])
        team.idea = idea
        team.invest(investment=investment)
        team.run_project(idea)
        await team.run(n_round=n_round)
    asyncio.run(runner())

if __name__ == "__main__":
    app()

Funktionsweise der CLI

  • @app.command() : Teilt Typer mit, dass die folgende Funktion (main ) ist ein Befehl, der vom Terminal aus ausgeführt werden kann.
  • main(...) : Die Hauptfunktion, die das Programm ausführt. Es braucht drei Argumente:
    • idea : Die Projektidee (z. B. „Eine PRD für eine Bankanwendung zur Vermögensverwaltung“).
    • investment : Ein optionaler Anlagebetrag (Standard:3.0 ). Diese Aktion simuliert das Budget des Teams und kann sich auf die Entscheidungsfindung und Planung der Agenten auswirken.
    • n_round : Optionales Argument, das angibt, wie viele Runden die Simulation ausführen soll (Standard:2 ).

Teamzusammenstellung und -durchführung

  • runner() : Eine asynchrone Funktion, die den Workflow ausführt:
    • team = Team(use_mgx=False) : Erstellt ein neuesTeam Objekt, das eine Gruppe von KI-Agenten darstellt. Dieuse_mgx=False Option deaktiviert den erweiterten MGX-Kommunikationsmodus durch Verwendung des Standard-Teamverhaltens.
    • team.hire([...]) : Stellt die Agenten ein (nimmt sie in das Team auf).
    • team.idea = idea : Legt die Projektidee des Teams aus der CLI-Eingabe fest.
    • team.invest(investment=investment) : Weist die „Finanzierung“ des Teams zu und beeinflusst, wie Agenten die Planung und Ressourcenzuweisung simulieren.
    • team.run_project(idea) : Startet das Projekt mit der gegebenen Idee.
    • await team.run(n_round=n_round) : Führt den Workflow für die angegebene Anzahl von Runden aus, sodass Agenten die PRD iterativ verbessern können.

Hinweis zur Ausgabevariabilität

Wichtiger Hinweis:
Die von diesem Tutorial generierten Dokumente und Outputs verwenden große Sprachmodelle (LLMs), die probabilistisch sind und gelegentlich zu unvollständigen, ungenauen oder inkonsistenten Ergebnissen führen können.
Überprüfen und validieren Sie alle generierten Inhalte immer selbst.
LLMs sind hilfreiche Tools, können aber das Fachwissen und Urteilsvermögen eines echten Produktentwicklungsteams nicht vollständig ersetzen.

Beispiel für einen Befehl

So führen Sie das Programm aus mit Standardwerten fürn_round undinvestment :

python metagpt_prd_generator.py "Write a PRD for a banking app for wealth managers."

Dieser Befehl startet das Agententeam, automatisiert den PRD-Erstellungsprozess und iteriert für die angegebene Anzahl von Runden.

Zusammenfassung des Teamerstellungsprozesses

  • Aktionen legen fest, was jeder Agent tun kann.
  • Rollen stellen Agenten dar und verbinden sie mit Aktionen.
  • Die Team-Klasse bringt Agenten zusammen, um den PRD-Workflow zu automatisieren.

Dieser modulare Ansatz bietet Raum für die Feinabstimmung des Prozesses der Automatisierung komplexer Produktentwicklungsaufgaben.

Beispiel für einen Ausgabeentwurf im Vergleich zum endgültigen PRD

Wenn Sie die Anwendung ausführen, arbeiten die Agenten zusammen, um eine PRD zu erstellen und zu optimieren.

  • PRD-Entwurf (DraftPRD.md ): Die ursprüngliche PRD, die vom Projektmanager-Agenten erstellt wurde.
  • Überprüfungsfeedback: Vorschläge und Kritik vom Überprüfungsagenten.
  • Forschungsbericht: Unterstützung von technischen und Marktforschungsanalysen des Forscheragenten.
  • Endgültige PRD (PRD.md ): Die überarbeitete PRD, die Prüfung und Forschung umfasst.

Entwurf der PRD (Auszug)

# Product Requirements Document: Wealth Manager Banking App

## 1. Introduction & Overview
*   **Product Name:** [Proposed Name - e.g., "WealthBank Pro", "Portfolio Navigator"]
*   **Version:** v0.1 (Initial Draft)
*   **Author:** [Your Team/Name]
*   **Date:** October 26, 2
*   **Status:** Draft

## 2. Purpose & Goals
The purpose of this app is to solve key pain points faced by wealth managers and
their clients with a seamless, integrated digital platform for managing assets,
monitoring portfolio performance, accessing banking services, and facilitating
communication within the financial advisory context.

... (see full draft (`example_DraftPRD.md`) for more sections)

Endgültige PRD (Auszug)

# Product Requirements Document: Wealth Manager Banking App

## 1. Introduction & Overview
*   **Product Name:** WealthBank Pro (or Portfolio Navigator - to be confirmed)
*   **Version:** v0.2
*   **Author:** [Your Team/Name]
*   **Date:** October 26, 2023
*   **Status:** Draft
*   **Document Revision Notes:** Addressed reviewer suggestions by clarifying
terms, adding measurable goals, expanding integrations, including user stories,
and added missing sections (User Roles, Data Flow).

## 2. Purpose & Goals
This app provides a secure digital platform for financial advisors to manage client
portfolios and offers clients an intuitive interface to monitor their investments
alongside core banking services.

### Measurable Key Goals:
1.  **Enhance Advisor Efficiency:** Reduce investment monitoring time by
[Specify %]%,decrease report generation time by [Specify %]%.
2.  **Improve Client Experience:** Achieve a Net Promoter Score (NPS) of
[Target NPS score], increase client engagement via app to [Target percentage]%.
3.  **Secure Collaboration:** Reduce email inquiries between advisor and clients
by [Target reduction %]%, ensure all messages are traceable within the platform.

## 3. User Roles
*   **Wealth Manager/Financial Advisor:** Full access to assigned portfolios,
    reporting, and communication.
*   **High-Net-Worth Client:** View-only access to their own portfolio and
    account information.
*   **Administrative Staff (Optional):** Read-only access for reporting/client onboarding.

... (see full final PRD (`example_PRD.md`)for more sections)

Von den Agenten vorgenommene Verbesserungen

Die endgültige PRD.md-Datei enthält einen Abschnitt mit der Überschrift Dokumentenüberarbeitungsnotizen, in dem die wichtigsten Änderungen zusammengefasst sind, die während des Überprüfungs- und Überarbeitungsprozesses vorgenommen wurden. Dieser Abschnitt hilft Stakeholdern, schnell zu verstehen, was in dem Dokument aktualisiert wurde.

Hier sind die wichtigsten Verbesserungen, die in der endgültigen PRD für die Vermögensverwalteranwendung enthalten sind:

  • Messbare Ziele hinzugefügt: Erfolgsmetriken wie klare KPIs, einschließlich NPS-Scores und Zeitersparnis, hinzugefügt, um MVP und Optimierung zu informieren.
  • Benutzerrollen: Definierte Rollen und Berechtigungen für Berater, Kunden und Mitarbeiter.
  • Integrationen: Spezifizierte APIs und Sicherheitsprotokolle für den Datenfluss.
  • Änderungsnotizen zum Dokument: Zusammenfassung der wichtigsten Änderungen zur einfachen Nachverfolgung.
  • Anwenderberichte: Erweiterte und präzisierte Szenarien für umsetzbare Anforderungen.
  • Forschung: Integrierte Strategien wie Preisgestaltung und technische Daten zur Unterstützung von Entscheidungen.

Beispiele für Ausgabedateien

  • DraftPRD.md : Erstes Anforderungsdokument.
  • PRD.md : Endgültiges, überarbeitetes Anforderungsdokument.
  • (Optional) Research.md : Marktforschung und technische Forschung zur Unterstützung der PRD.

Zusammenfassung

In diesem Tutorial haben Sie gelernt, wie Sie mithilfe von MetaGPT und Ollama die Erstellung und Verfeinerung eines Produktanforderungsdokuments (PRD) automatisieren können. Sie haben ein Team mit mehreren Agenten eingerichtet, benutzerdefinierte Aktionen und Rollen definiert und einen iterativen Workflow ausgeführt, der hochwertige, umsetzbare PRDs produziert. Dieser modulare Ansatz kann auf andere kollaborative KI-Aufgaben übertragen werden und ist somit ein leistungsfähiges Werkzeug zur Optimierung des KI-Produktmanagements.

Ressourcen

