Wie funktioniert Prompten für KI richtig?

Prompten ist in aller Munde und nicht wenige hadern, da sich die gewünschten Ergebnisse nicht einstellen wollen. Im folgenden Beitrag werde ich in die vier Elemente des Promptens einführen und diese jeweils mit einer Vielzahl von Anwendungsmöglichkeite

Wie funktioniert Prompten für KI richtig?

Prompten sollte wohl mittlerweile auch für die meisten kein ganz so neuer Begriff mehr sein. Hätte ich das noch im November 2022 gefragt, hätten mir darauf wohl nicht viele Personen antworten können, doch dies hat sich schlagartig geändert.
Prompten ist in aller Munde und nicht wenige hadern, da sich die gewünschten Ergebnisse nicht einstellen wollen. Damit ist nun Schluss.

Im folgenden Beitrag werde ich in die vier Elemente des Promptens einführen und diese jeweils mit einer Vielzahl von Anwendungsmöglichkeiten präsentieren. Ziel ist es, die Grundlagen des Promptens zu verstehen und die Methoden kennenzulernen.

Und weil das ziemlich viel zum Merken ist, habe ich noch am Ende des Beitrags ein Cheat Sheet zum Download für euch vorbereitet. (Ungeduldige bitte ans Ende scrollen.)

In dem Artikel nutze ich wieder die Begriffe AI, LLM und auch AI-Model recht synonym. Diese Begriffe bedeuten streng genommen nicht das Gleiche, aber ich verwende sie im Kontext gleich.

Was ist Prompten?

Mit Prompten ist letztlich nicht mehr gemeint, als einem KI-Modell eine Anweisung zu geben, um eine Aufgabe auszuführen. Das unterscheidet sich auf den ersten Blick wenig von meinem Befehl an Alexa oder Siri, doch bei genauerem Hinschauen liegen hier Welten dazwischen. Der Prompt kann eine einfache Frage sein wie: „Was ist die Hauptstadt von Schweden?“, oder eine komplexe Kombination aus Fragen, Anweisungen, Beispielen und Formatvorgaben umfassen.

Wenn ihr mehr zur Funktionsweise von AI-Models wissen wollt, dann schaut euch gerne meinen Artikel hierzu an. Ein Verständnis der Grundlagen kann nicht schlecht sein.

Exkurs: Was ist eigentlich generative KI?

Gepromptet wird bei Generativer KI. Das sind solche KI-Modelle, welche etwas erstellen können, wie z. B. Texte, Bilder, Videos oder Grafiken. Das Gegenstück dazu ist die diskriminative KI, welche Daten verarbeitet und analysiert, wie z. B. Gesichter erkennen oder auch Fahrzeuge steuern.

Wie und was man prompten kann, hängt auch von der Art des Ergebnisses einer KI ab. Mein Beitrag bezieht sich im Kern auf das Prompten für Language Models, also dort, wo Texte herauskommen. ???? Ein paar Hinweise und nützliche Links für andere generative KI-Arten finden sich aber auch in dem Beitrag, wie bspw. für Midjourney (erstellt Bilder und Fotos).

Wie schwer ist Prompten?

Prompten kann eine wirklich komplexe Angelegenheit werden, weshalb es auch schon jetzt „Prompt-Engineering“ genannt wird. Ich hielt diesen Begriff am Anfang ein wenig für Aufschneiderei, aber habe mich mit Selbstversuchen und Recherchen dann eines Besseren belehren lassen. Es gibt viele Menschen, welche tagtäglich Ideen und Tricks finden, wie man das bestmögliche Ergebnis aus einem generativen KI-Modell herausbekommt.

Man kann bei manch komplexen Prompts sogar schon behaupten, dass sich eine neue Art der Programmiersprache hieraus entwickeln kann. Wobei ich davon ausgehe, dass diese dann nicht mehr nur in rein menschlicher Sprache stattfinden wird, um Wörter und Prompts einzusparen. Bereits jetzt gibt es Methoden, die Prompts erheblich einzukürzen, was zulasten der Verständlichkeit geht.

Grundlegendes zum Prompten …

Wie ich bereits in meinem anderen Artikel über KI schrieb, müssen wir uns beim Prompten ganz bewusst machen, dass zwar eine KI erhebliche Fähigkeiten hat, aber nicht in der Lage ist, uns zu lesen oder zu wissen, was wir wollen. Wobei ich davon ausgehe, dass dies eigentlich keiner will.

Versetzen wir uns in die Lage und gehen davon aus, dass die KI ein Mensch ist und wir uns wünschen, dass dieser Mensch eine Aufgabe erfüllt. Dann würden wir so viele Details zu unseren Anweisungen mitgeben, dass aus dem umgebenden Kontext klar wird, was wir uns wünschen. Einer Arbeitskollegin, mit der ich seit zehn Jahren zusammenarbeite, muss ich sicherlich nicht sonderlich viel erklären. Weise ich hingegen eine mir unbekannte Person an, bspw. meine Wohnung neu einzurichten, würde ich diese nicht nur mit einem Satz Erklärung anfangen lassen, auch wenn diese qualifiziert ist.

Gleiches muss man sich bei der AI bewusst machen. Diese kennt nicht den Kontext, kennt nicht uns und erst recht nicht unser Ziel. Daher sind wir gezwungen, eben diese Informationen mitzugeben, damit wir das Ergebnis bekommen, welches wir uns wünschen.

Testen, wiederholen und gute Prompts merken

Selten werden wir jedoch mit dem ersten Prompt bereits die perfekte Antwort bekommen. Daher erlauben uns verschiedene AIS auch, unseren Prompt zu verfeinern, bis wir das gewünschte Ergebnis gefunden haben. Natürlich können wir auch den Prozess neu starten, wobei dies meist teurer sein kann, da einige AI-Modelle je Prompt abrechnen.

Somit sollte man sich bei den ersten Fehlschlägen nicht aus der Ruhe bringen lassen und einfach weiterprobieren. Und sollte hier etwas gelingen, dann ist es immer ratsam, sich diesen Prompt inklusive der Antwort niederzuschreiben, um bei ähnlichen Aufgaben nicht wieder bei null anfangen zu müssen.

Dem Gedanken folgend ist es auch ratsam, sich zugleich Vorlagen für Prompts zu erstellen, welche dann nur noch mit den wechselnden Informationen befüllt werden müssen.

Die Elemente eines Prompts

Doch wie funktioniert nun das Prompten? Ein Prompt besteht aus den folgenden vier Elementen:

  1. Die Anweisung stellt den Kern des Prompts dar. Welche Aufgabe soll die KI erfüllen?
  2. Der Kontext bettet meine Anweisung in weitere Erklärungen ein und ermöglicht es, einen Zusammenhang herzustellen.
  3. Daten erweitern den Prompt um wichtige Informationen, welche beachtet werden müssen bzw. die Grundlage für die Antwort bereiten können.
  4. Das Format bestimmt die Art und Weise der Antwort, wie z. B. der Stil oder das Format.

Natürlich muss ein Prompt nicht immer alle diese Elemente aufweisen. Doch sind es diese vier, die ich geistig abhaken sollte, wenn ich meinen Prompt schreibe.

Die Anweisung – Kern des Prompts

Die Anweisung stellt die tatsächliche Aufgabe dar, welche die KI erfüllen soll. Diese kann so simpel sein wie „Die Katze macht …“ (Antwort: „Miau“) oder eben eine komplexe Anforderung, um etwa einen Vortrag zu erstellen.

Hier gilt es meist, die Anweisung so simpel und klar wie möglich zu gestalten. Sollte man mal keine Idee haben, wie man etwas beschreibt, kann man auch negative Anweisungen geben, also benennen, was man nicht möchte.

In jedem Fall sollte man sich ein klares Bild von dem gewünschten Ergebnis machen und dies dann mit so wenig Worten wie nötig und so detailliert wie möglich angeben. Übrigens, auch wenn alles mit einer KI schneller gehen kann, kann auch der Entwurf eines Prompts viel Zeit in Anspruch nehmen.

Bei generativer KI, welche bspw. Bilder erstellt, ist es zudem wichtig, gewisse Codes und Formulierungen zu kennen, um ein gewünschtes Ergebnis zu erzielen. Hier gibt es zum Glück einige Guides, die einem helfen können. Am Ende des Beitrages habe ich ein paar hierzu verlinkt.

Möglichkeiten für die Anweisung

Grundlegende Fähigkeiten

  • Frage – Soll die KI bestimmte Informationen geben? (Hier ist darauf zu achten, dass diese nicht stimmen müssen, da die KI dies aus ihrer „Erinnerung“ per Zufall generiert.)
  • Zusammenfassung – Die KI kann Texte oder andere Quellen übersichtlich zusammenfassen.
  • Analyse – Die KI analysiert Elemente auf eine bestimmte Frage hin.
  • Gedankenanstoß – jemals nicht weitergekommen bei einer Aufgabe? Die KI kann einem einen Denkanstoß geben.
  • Texte – eigentlich ganz klar und nur der Vollständigkeit halber. Die KI erstellt jegliche Texte vom Gedicht bis hin zur E-Mail.
  • Aufgaben – es sollte ein Vorschlag unterbreitet werden, welchen Schritt man als Nächstes gehen sollte. Dies kann man natürlich auch gleich auf einen ganzen Plan erweitern.

Erweiterte Anweisungen

  • Quellenangaben – können Quellen genannt werden, welche die Antwort belegen?
  • Zitate – können Zitate von relevanten Personen genannt werden, welche die Antwort unterstützen oder aufwerten?
  • Statistiken/Daten – Können Statistiken oder andere Daten genannt werden, welche die Antwort unterstützen?
  • Analogien/Vergleiche – soll die Antwort mit vergleichbaren Analogien untermauert werden?
  • Gegenargumente – sollen gleich Gegenargumente für die Antwort erstellt werden?
  • Perspektive – sollen mehrere Perspektiven und Meinungen oder auch nur eine bestimmte Teil der Antwort sein?
  • Keywords – sollen bestimmte Begriffe oder Ausdrücke in der Antwort erscheinen?

Der Kontext – Hintergrund des Prompts

Eine simple Anweisung kann schnell missverstanden werden, wenn der Hintergrund dieser nicht klar ist. Möchte ich eine Zusammenfassung aus einem Schriftsatz, ist es wichtig zu wissen, wofür diese genutzt werden soll. Geht es rein darum, einen Sachverhalt zusammenzufügen oder Argumente für eine Erwiderung zu sammeln? Beide Hintergründe werden zu völlig unterschiedlichen Ergebnissen führen.

So gesehen ist der Kontext das Licht, in dem der ganze Prompt gelesen werden soll, und führt im Falle anderer, nicht eindeutiger Informationen dazu, dass diese richtig eingeordnet werden können.

Möglichkeiten für den Kontext

  • Kontext – welchen Hintergrund umgibt der Prompt? Wie ist dieser zu lesen?
  • Zielgruppe – Auf welchen Personenkreis zielt die Antwort ab?
  • Sensible Angelegenheiten – gibt es besondere sensible Angelegenheiten, welche bestmöglich ausgelassen oder vermieden werden sollen?
  • Fachbereich – Welchem Fachbereich ist der Prompt zuzuordnen? (Bsp. Strafrecht, Jura, Medizin, Software)
  • Umfang/Tiefe – wie tief soll das Thema bearbeitet werden? (Schulvortrag 7. Klasse oder eine wissenschaftliche Abhandlung)

Daten – Informationen zum Prompt

Um die Antwort weiter zu präzisieren oder als Teil des Prompts selbst können weitere Informationen mitgegeben werden. Abhängig von der Aufgabe kann es sich um den Text handeln, welcher analysiert werden soll, oder um weitere wichtige Informationen, die eine Antwort in die richtige Richtung stoßen.

Möglichkeiten für Informationen

  • Beispiele – Als Teil des Prompts können Beispiele genannt werden, welche eine mögliche Variante der gesuchten Antwort darstellen.
  • Spezielle Terminologie – gibt es spezielle Terminologie oder Fachbegriffe, welche beachtet oder verwendet werden sollten?
  • Fristen, Zeiten – gibt es Fristen oder bestimmte Zeiten, welche bei der Antwort beachtet werden müssen?
  • Visuelle Elemente – Bilder, Grafiken, Tabellen oder andere visuelle Mittel, welche den Prompt aufwerten können.
  • Daten – Gibt es weitere Daten oder gesammelte Daten, welche im Prompt verarbeitet werden sollen?
  • Dokumente/Texte – sollen Texte im Prompt verarbeitet werden? (Hier ist auf die technischen Limits zu achten. Bei ChatGPT kann GPT-4 aktuell bspw. nur ca. 2400 Wörter (mehr Infos) verarbeiten.)

Format – Aussehen des Prompts

Schlussendlich sollte das Ausgabeformat des Prompts bestimmt werden. Wünsche ich mir einen Fließtext oder Stichpunkte? Soll es eine freundliche E-Mail für den Kollegen werden oder benötige ich ein Schriftstück für die Verwaltung? All diese Formate werden grundlegend unterschiedliche Ergebnisse liefern. Ein fehlendes Format für eine spezielle Art der Nutzung kann die ganze Antwort nutzlos machen.

Möglichkeiten für Formatangaben im Prompt

  • Ausgabeformat – in welchem Format soll die Ausgabe erfolgen? (Stichpunkte, Dialog, Anschreiben, E-Mail)
  • Ton/Ansprache – wie soll die Antwort formuliert werden? (freundlich, formell, streng, locker, Siezen usw.)
  • Rolle – In welcher Rolle soll sich die KI „denken“? Ein Anwalt nutzt juristische Termini, eine Ärztin wird aus medizinischer Sicht antworten usw. (Handle als Anwalt, Mandant, Experte, Fan.)
  • Ziel – Welches Ziel soll das Ergebnis allgemein liefern? (informieren, unterhalten, erklären)
  • Einschränkungen – wie viele Wörter, Zeichen oder Ähnliches soll die Antwort haben?
  • Sprache – Sofern gewollt, kann die Ausgabesprache von der Sprache des Prompts abweichen, z. B. um etwas zu übersetzen.

Was klappt nicht beim Prompten?

Bei all den vielen Möglichkeiten, die KI bietet, gibt es auch klare Restriktionen bzw. Ungenauigkeiten, denen eine KI unterliegt. Wer meinen anderen Artikel zu AI gelesen hat, weiß, dass Generative AI mehr oder weniger einem gewissen Zufallsmechanismus unterworfen ist und die Antworten „nur“ errät. Dieser Zufall und die besondere Form des Datenspeicherns, welche übrigens bis heute niemand so zu 100 % verstanden hat, sorgen für die folgenden Einschränkungen:

👉 Fehlende Quellen – auch wenn ich es oben als Methode angegeben habe, ist die KI meist nicht in der Lage, Quellen oder weitere Hilfsmittel anzugeben.

👉 Vorurteile/Einstellungen – Ein KI-Modell ist immer nur so gut wie die Daten, die es erhalten hat. Beim Training ist es schier unmöglich, dass die KI nicht einem bestimmten Wertekanon oder Vorurteilen unterliegt.

👉 Fehlinformationen/Halluzinationen – Informationen müssen nicht zwingend der Wahrheit entsprechen bzw. kann es so weit gehen, dass die KI Informationen erfindet. Bitte prüft Informationen immer nach oder gebt diese bestenfalls im Prompt selbst mit. KI-Modelle sind keine Suchmaschinen!

👉 Rechnen – ja, es ist eine Software, aber KI kann nicht wirklich gut rechnen. Auch hier wird geraten, was da kommen könnte, und diese Antwort unterliegt dem Zufall. Hier kann man entweder mit Tools oder Beispielen arbeiten, aber da geht der Taschenrechner schneller.

Techniken beim Prompten

Mittlerweile haben sich einige Techniken des Promptens durchgesetzt, welche ich gerne in der gebotenen Kürze vorstellen möchte. Im Grundsatz finden sich diese bereits in den genannten Elementen und ihren Beispielen. Es ist dennoch sinnvoll, diese nochmals zu sehen, um ein besseres Verständnis für das Prompten zu erlangen.

Zero-Shot-Prompting

Die einfachste Form eines Prompts. Das Wort „Shot“ einfach zum Beispiel. Und es handelt sich hierbei um einen Prompt ohne die Angabe von Beispielen.

Few-Shot-Prompting

„Few-Shot-Prompting“ ist das „Gegenteil“ von Zero-Shot-Prompting. Man gibt somit Beispiele beim Prompten an, um dem KI-Modell mitzuteilen, welches Ergebnis man sich wünscht.

Role-Prompting

Bereits in den oberen Beispielen benannt, geht es hier einfach darum, dass man eine bestimmte Rolle angibt, in die sich die AI geben soll. Ziel ist es, dass die KI mit dem kurzen Satz eine Kombination aus allen Elementen des Promptings annimmt, da einer Rolle zugleich Kontext, Format und Informationen zugrunde liegen. Der Prompt beginnt dann mit „Act as a lawyer/Handle als ein Anwalt“.

Chain of Thought

Die Chain-of-Thought-Methode zielt darauf ab, der KI einen Weg der Begründung vorzuzeigen, damit diese den Weg übernimmt und bestenfalls keine zufälligen Antworten gibt. Dies findet meist in Kombination mit Few-Shot-Prompting statt.

Zusammenfassung

Wie man wohl spätestens jetzt gemerkt hat, kann Prompten doch eine recht komplexe Angelegenheit werden. Im Grundsatz sollte man sich das Folgende merken:

4️⃣ Ein Prompt besteht aus den bis zu vier Elementen Anweisung, Kontext, Daten und Format und sollte immer so kurz wie nötig und so lang wie möglich sein. Präzision schlägt Masse!

👉 Die richtigen Ergebnisse zu finden, kann ein längerer Trial-and-Error-Prozess werden.

👉 Gute Prompts sollte man sich merken und bestenfalls als Template nutzen.

👉 Eine KI unterliegt vielen Ungenauigkeiten und man sollte das Ergebnis nie ungeprüft nutzen.

👉 Wer nicht mal nicht weiterweiß, kann immer gerne hier nachschauen. ????

Download Cheat Sheet – Prompten mit AI

Prompt-Engineering-Guides:

https://learnprompting.org/

https://www.promptingguide.ai/

Prompt-Sammlung

https://snackprompt.com/

Midjourney-Guide

https://www.notion.so/Midjourney-AI-Guide-41eca43809dd4d8fa676e648436fc29c?pvs=4

DALL-E-Guide

https://dallery.gallery/dall-e-ai-guide-faq/