Reuths KI-Werkzeugkiste für die historisch-politische Bildung
Spätestens seit dem Release von OpenAI’s Chat.GPT im November 2022 ist „Künstliche Intelligenz“, kurz KI, in aller Munde. In dieser Reihe werden jede Woche nützliche Tools, Technologien und Tipps für die historisch-politische Bildung präsentiert. Dabei sollen auch Grenzen und Probleme der Technologie angesprochen werden, um eben besagte Dystopien von unserer Gegenwart zu trennen.
Ideogram.ai bietet eine einfache Möglichkeit, direkt im Browser Bilder zu generieren. Eine Besonderheit dieser Plattform ist, dass man neben den üblichen Einstellungen wie Format, Negativprompt und Modell auch eine Farbpalette für den Prompt auswählen kann.
Große Sprachmodelle wie ChatGPT und ähnliche KI-Tools können nicht nur Texte schreiben und umformulieren, sondern auch genutzt werden, um größere Datenmengen oder Texte zu formatieren.
Das Generieren von Schriftzügen und Überschriften mit KI war bisher eine Herausforderung. Selbst mit der Premium-Version von ChatGPT sind die Ergebnisse oft unbefriedigend. OpenAI hat zwar Fortschritte bei der Textgenerierung in Bildern gemacht, doch je länger die Wörter werden, desto geringer sind die Erfolgsaussichten.
In dem zwölften Artikel dieser Reihe ging es darum, automatisierte Sitzungsprotokolle zu erstellen. Dafür wurde die OpenAI-Technologie Whisper vorgestellt, die komplett frei und Open Source verfügbar ist.
Farben spielen in der Geschichte eine große Rolle, sei es das sozialistische Rot oder die leuchtend grellen Farben der 1960er-Jahre. Farben vermitteln Emotionen, wecken Erinnerungen und Gefühle in den Menschen.
Präsentationen lassen sich nicht nur durch KI-generierte Bilder ansprechender gestalten! Warum nicht gleich ein Video aus Ihrer Präsentation erstellen, in dem ein künstlicher Avatar Ihre Inhalte mit Stichpunkten im Hintergrund präsentiert?
In den letzten Wochen sind die ersten videogenerierenden KIs erschienen, die man selbst ausprobieren kann. Dazu gehören LumaLabs Dream Machine und seit letzter Woche auch RunwayML Gen-3.
Vor einigen Monaten hat OpenAI seine videogenerierende KI namens Sora vorgestellt. Sora kann, ähnlich wie KI-Bildgeneratoren, aus Text Videos erstellen.
Über die Websuche wie der von Google läuft großer Teil der Navigation durchs Internet. Für die meisten Nutzer öffnet unser Browser nach dem Start das inzwischen schon ikonische Suchfenster verschiedenster Anbieter.
Wer mal mit den gängigen Bildgeneratoren wie Copilot, Adobe Firefly und Dall-E3 versucht hat, historische Bilder zu generieren, stößt hier schnell an die Content-Richtlinien. Selbst wenn man nur eine Karikatur von einer historischen Person erzeugen möchte.
Was Sie sich bewusst machen müssen, ist, dass hinter den textgenerierenden Tools, die in dieser Serie vorgestellt werden, verschiedene große Sprachmodelle stecken. Diese Large Language Models (LLM) werden mit riesigen Mengen von Daten gefüttert auf deren Grundlage sie dann ihre Antworten generieren.
Das faszinierende an musikgenerierenden KI-Tools ist, dass sie inzwischen nicht nur verschiedenste Genres generieren, sondern auch selbstentworfene Songtexte singen können. Vom Rap, über Schlager bis zur Klassik ist alles dabei. Und das klingt nicht einmal schlecht!
Die KI kann nicht alles! Generell muss man sich bewusst machen, dass diese großen Sprachmodelle nicht allwissend sind und uns so schnell nicht ablösen werden.
In jeder Firma, jedem Verein oder jeder Stiftung gibt es Meetings oder Besprechungen, bei denen es wichtig wäre, das Gesagte zu notieren. Doch das Erstellen von Sitzungsprotokollen ist eine zeitaufwendige Arbeit, die nur für die wichtigsten Meetings stattfindet. Dabei wäre es oft so hilfreich, nochmal in eine Unterhaltung schauen zu können. Hier kommt die KI ins Spiel, denn die kann erstaunlich gut transkribieren und zusammenfassen.
Wenn sich Bilder und Texte von einer Künstlichen Intelligenz erzeugen lassen, wieso nicht gleich ganze Präsentationen? Genau das bietet das KI-Tool Tome an.
Es gab eine kurze Zeit im vergangenen Jahr, da machten KI-Scanner die Runde. Überall gab es auf einmal Tools, die den Gebrauch von Künstlicher Intelligenz in Texten nachweisen wollten. Doch schon nach kurzer Zeit stellte sich heraus, dass diese Tools nicht treffsicher sind.
Wollte man früher ein großes Sprachmodell für eine bestimmte Aufgabe trainieren, brauchte man leistungsstarke Server und jemanden, der sich damit auskennt. Doch nun wurden am Developer Day von OpenAI Custom GPT’S vorgestellt.
Sie wollen ein gesprochenes Intro für ein Video oder ihre Ausstellung vertonen? Texte von einem professionellen Sprecher einsprechen zu lassen, kostet viel Geld. Tools wie Elevenlabs.io bieten die Möglichkeit kostengünstig, Texte von einer künstlich generierten Stimme sprechen zu lassen.
Je präziser große Sprachmodelle wie ChatGPT instruiert werden, desto brauchbarer sind die Antworten. Dies gilt auch für die Beschreibung von dem, was man nicht will.
Im Beitrag „Was sind Prompts und wie sollte man sie strukturieren?“ lernten wir, dass man seine Prompts mit Informationen zur Zielgruppe, seiner eigenen Rolle, Niveau und zum Schreibstil bestücken kann, um genauere Ergebnisse zu erhalten. Manche Informationen sind aber so allgemein, dass es mühsam ist, diese in jeden neuen Prompt zu schreiben. In ChatGPT gibt es die Funktion der „Custom Instructions“, zu Deutsch „Benutzerdefinierte Anweisungen“.
Sie wollen historische Gegenstände oder Persönlichkeiten in ganz neuem Licht erscheinen lassen? So kann man zum Beispiel mit dem Prompt „Das Auto Trabant, Karl Marx und Lenin vor der Berliner Mauer, Neon, Digital Painting“ die Drei im futuristischen Neon-Look präsentieren.
Prompts sind kurze, prägnante Anweisungen oder Fragen, mit denen man mit einem Modell wie Chat.GPT-3.5 kommuniziert. Dabei beeinflussen diese Prompts maßgeblich, was das Modell als Antwort generiert.
Oft ist es bei KI-Tools so, dass man die Aufgabe in der Zeit, die es braucht, um einen guten Prompt mit einem angemessenen Ergebnis zu formulieren, schon selbst erledigt haben könnte.