Das Promt Engineering beschreibt das optimale Formulieren von Anweisungen für Chatbots, wie ChatGPT oder DALL-E. Gleich vorweg sei allerdings gesagt, dass es nicht das eine perfekte Schema als Anleitung gibt. Vielmehr ist der Austausch mit Chatbots oder anderer generativer Künstlichen Intelligenz (KI) als Lernprozess zu verstehen – für die Chatbots selbst und für uns als Anfragende.
Als ein Promt wird in der IT generell eine Aufforderung zur Eingabe verstanden. Im Fall von ChatGPT nutzen wir sogenannte text-to-text Promts zur Steuerung der Künstlicher Intelligenz. Wir erklären der KI also durch eine Texteingabe, was wir wollen oder brauchen und die KI versucht unserer Anweisung zu folgen. Im Fall von DALL-E sprechen wir auch von text-to-image Promts, denn auf Basis einer textlichen Beschreibung gibt das Tool ein Bild aus. Wie erfolgreich das Antworten gelingt, hängt von mehreren Faktoren ab. Je präziser die Frage, desto besser die Antwort oder je besser die Promts, umso besser die Ergebnisse. Dabei spielt auch korrekte Grammatik inklusive entsprechender Zeichensetzung eine Rolle.
Wie können wir nun durch unsere Eingabe Generative KI-Modelle befähigen gute Outputs zu liefern?
- Ziel: Welches Ziel verfolgst du mit deiner Anfrage, was soll am Ende das Ergebnis sein? Eine Analyse, ein Bericht, eine Rechnung, …? Promts werden wortwörtlich genommen. Die KI kann nicht wissen, was für dich eine gute Antwort wäre, du musst es ihr mitteilen und dabei klar und deutlich formulieren.
- Der Ton macht die Antwort: Im Ergebnis kann je nach Zielgruppe eine formale Formulierung, eine fachliche Formulierung oder eine umgangssprachliche Formulierung erforderlich sein, über den Ton entscheidet dein Promt. Frage also im richtigen Ton an und die Antwort wird ebenfalls im richtigen Ton sein. Oder befehle der KI gleich die richtige Perspektive: „Du bist ein Data Scientist. Formuliere eine …“.
- Mehr ist besser als weniger – Details machen den Unterschied: Was sind die wesentlichen Keywords und was sind Antworten auf die zentralen W-Fragen (wer, wie, was, wann und wo)? Durch die Angabe eines Kontextes kann die KI in eine bestimmte Richtung gelenkt werden oder einen Fokus setzen. Auch können Begrifflichkeiten ausgeschlossen werden, in dem sie explizit genannt werden.
Die erste Antwort muss nicht das finale Ergebnis sein. Steigt in einen iterativen Prozess mit der KI ein. Dazu könnt ihr auf Basis des ersten Austausches weiterführende Fragen stellen, um Umformulierung oder um eine detailliertere Ausgestaltung mit einem neuen Fokus bitten. In dieser Form kommt das Promt Engineering einem kreativen Brainstorming gleich. Fortgeschrittene steigen hier dann in das chain-of-thought Prompting ein. Ziel ist es, eine organische und zusammenhängende Kette von Gedanken zu generieren, die aufeinander aufbauen – wie bei einem tatsächlichen Gespräch unter Kolleg*innen. Eine passende Anweisung hierfür wäre: „Lass uns Schritt für Schritt gemeinsam nachdenken.“
Wer tatsächlich gänzliche neue Informationen sucht, einen Einblick in die weite Zukunft erhofft oder eine Idee für etwas noch nicht Existierendes braucht, wird auch mit chain-of-thought Promts nicht weiterkommen. Generative KI-Systeme können vorhandene Informationen scannen, kombinieren und manchmal auch neu zusammenführen, was aber nicht da ist, können sie nicht erschaffen.
Aktuelle KI-Modelle werden von uns allen trainiert und erfreuen sich großer Beliebtheit. Die vielen Unser*innen bilden branchenspezifische Communities, die ihre Erfahrungen teilen und erfolgreiche Promts auflisten. Diese können kopiert und adaptiert werden. Es muss also nicht jede*r zum Promt Engineer werden, man muss nur die passende Community finden. Auf Reddit und Discord gibt es derzeit die größte Auswahl an Communities. Wer die Next-Gen-Social-Media-Angebote noch nicht nutzt, wird auch über die klassische Google-Suche im Web fündig.