Einführung in die Methoden der Künstlichen Intelligenz

Einführung

  • Vorstellung der Dozenten: PD Dr. David Sabel, Prof. Dr. Manfred Schmidt-Schauß, Prof. Dr. Florian Buettner.

  • Semester: SoSe 2054.

  • Stand der Folien: 4. Mai 2025.

Themenübersicht

  • KI-Ziel.

  • Philosophische Aspekte der KI.

  • KI-Paradigmen.

  • KI-Geschichte.

  • Agenten.

  • Foundation Agents.

  • KI-Ansätze.

  • Chain-of-Thought (CoT).

  • Tool-Using-Fähigkeiten.

  • Multi-Agent-Systeme.

  • Interaktives Element: menti.com

Was ist Künstliche Intelligenz?

  • Ziel: Herstellung eines intelligenten Agenten.

  • Auch: Herstellung eines möglichst guten autonomen lernenden intelligenten automatischen Informationssystems.

Beispiele für KI-Systeme

  • Taschenrechner.

  • Schachspielende Computer (Deep Blue, Deep Thought, Deep Fritz).

  • Sprachübersetzer (GoogleTranslate, DeepL).

  • Large Language Models (LLMs) (chatGPT, perplexity.ai, langchain).

  • Text-to-Image Modelle (Stable diffusion).

  • Multimodale generative KI Systeme (Text/Bild/Video/Audio -¿ Text/Bild/Video/Audio).

  • Wissensbasierte Systeme (retrieval-augmented generation - RAG).

  • Roboter (Haushaltsroboter, Industrieroboter).

Roboter-Programmierung

  • 25 Gelenke mit Coreless-DC-Motoren und Getriebe.

  • Intel ATOM 1.6 GHz CPU.

  • Zwei Kameras.

  • WLAN.

  • Ultraschall.

  • Beschleunigungssensoren.

  • Gyroskope.

Fähigkeiten von Robotern

  • Bildverarbeitung: Farberkennung und Objekterkennung.

  • Lokalisierung: Positionsbestimmung via GPS, Bildverarbeitung und Kalman-Filter.

  • Bewegung: Algorithmen unter Nutzung der Sensorik und Aktorik.

  • Verhalten: Übergeordnete Planungs-Algorithmen.

  • Kommunikation: WLAN-basierte Kommunikation.

Beispiel: Go Spiel (2016)

  • AlphaGo (Google) schlägt Lee Sedol.

  • Go hat einen sehr großen Suchraum: 19 × 19 Feld, d.h. 361 Möglichkeiten für den ersten Zug.

  • Algorithmische Bewertung der Spielsituation ist schwierig.

  • Methoden von AlphaGo:

    • Durchmustern der Suchräume.

    • Zufälliges Ausprobieren (Monte Carlo Tree Search).

    • Künstliche neuronale Netze zum Bewerten der Stellungen.

    • Lernverfahren.

    • Massiv parallele Berechnungen.

  • Erfolgreich, weil es viele sehr gute Züge gibt.

  • Schach: man muss i.a. den einzigen richtigen Zug finden.

Beispiel: Das Proteinfaltungsproblem

  • Proteine sind Ketten aus Aminosäuren, die sich in komplexe 3D-Strukturen falten.

  • Die 3D-Struktur bestimmt die Funktion.

  • Das Problem: Wie faltet sich eine gegebene Sequenz?

  • Extrem großer Suchraum: 1030010^{300} mögliche Konfigurationen.

  • Levinthal-Paradoxon: Rein zufällige Suche würde länger als das Alter des Universums dauern.

AlphaFold als modernes Suchverfahren

  • Zentrale Elemente:

    • Kombination aus Suchverfahren und neuronalen Netzen.

    • Geführte Suche durch heuristische Bewertungsfunktionen.

    • Monte Carlo Tree Search (MCTS) zur Exploration des Suchraums.

  • Verbindung zu Vorlesungsthemen:

    • Informierte Suche: Heuristiken basierend auf physikalischen Prinzipien; Optimierung mit Bewertungsfunktion (A*).

    • Neuronale Netzte: Verarbeitung von Aminosäuresequenzen.

    • Evolutionäre Algorithmen: Iterative Verbesserung der Strukturvorhersagen.

Von klassischen Suchverfahren zu AlphaFold

  • Klassische Suchverfahren.

  • Heuristische Suche.

  • Monte Carlo Tree Search.

  • AlphaFold + Heuristiken + Stochastik + DL + Exploration.

  • AlphaFold verwendet Attention-Mechanismen, um wichtige Bereiche des Suchraums zu identifizieren (analog zu verbesserter Heuristik in A*-Suche).

  • Moderne KI-Systeme kombinieren klassische Algorithmen mit neuronalen Netzen.

Ergebnisse und Bedeutung von AlphaFold

  • Wissenschaftliche Durchbrüche.

  • AlphaFold 2 erreichte in CASP14 (2020) eine Genauigkeit nahe experimenteller Methoden.

  • Mehr als 200 Millionen Proteinstrukturen vorhergesagt.

  • Open-Source-Version verfügbar.

  • Anwendungen:

    • Medikamentenentwicklung.

    • Materialwissenschaften.

    • Grundlagenforschung in der Biologie.

  • “AI for science” ausgezeichnet mit Chemie Nobelpreis 2024.

Roboter und weitere Begriffe

  • Roboter = Intelligenter Agent, Computer im Kern, agiert mit der physikalischen Umwelt.

  • Softbot = Software-Roboter, Umwelt ist i.A. nicht physikalisch, hat Wissensbasis und gibt Antworten und Ratschläge.

  • Webbot = Web-Roboter, (inter-)agiert im WWW, z.B. um Suchdatenbanken zu erstellen.

  • Chatbot = Chat-Roboter, interagiert in einem Chat.

Agent, allgemein

  • Agent:

    • Vorwissen: Wissen über die Umgebung (z.B. Karte).

    • Erfahrungswissen: erlerntes Wissen, Testfälle.

    • Ziele: üblicherweise mit Prioritäten und Wichtigkeiten versehen.

    • Beobachtungen: über die Umgebung und über sich selbst.

    • Nächste Aktion als Ausgabe (aufgrund von Schlussfolgern, Lernen, …).

Fragestellungen der KI

  • Was ist Künstliche Intelligenz?

  • Was zeichnet eine Methode als KI-Methode aus?

  • Was ist ein intelligenter Agent?

  • Können Computer denken?

  • Es gibt keine allgemein richtige Antwort auf diese Fragen!

Klassifizierung der Ansätze nach Russel & Norvig

  • Menschlich vs. Rational.

  • Handeln vs. Denken.

  • menschliches Handeln, rationales Handeln, menschliches Denken, rationales Denken.

Menschliches Handeln

  • Fernziel: Systeme erschaffen, die analog zu Menschen handeln.

  • Entwickle Methoden, so dass der Computer Dinge tun kann, die momentan nur der Mensch kann in denen der Mensch noch den Computern überlegen ist.

  • Zum Nachweis, dass Ziel erreicht: Vergleich von Maschine und Mensch (z.B. Turing-Test, folgt noch).

Menschliches Denken (1)

  • Ziel: Computer ”denkt wie ein Mensch“.

  • Forschung: Wie denkt der Mensch: entwickle Modelle dafür.

  • Z.B. durch psychologische Experimente, Hirntomografie . . .

  • Stelle Theorie auf, setze danach in ein System um.

  • Ziel erreicht: Wenn Ein-/Ausgaben dem menschlichen Verhalten gleichen.

Menschliches Denken (2)

  • Ansatz ist eher interdisziplinär: Kognitionswissenschaft.

  • Beispiele: Wie erkennen wir Gesichter, Verständnis des Spracherwerbs, . . .

  • System ist kognitiv adäquat, wenn:

    • arbeitet strukturell und methodisch wie ein Mensch.

    • erzielt entsprechende Leistungen.

  • Achtung: Taschenrechner ist nicht kognitiv adäquat, da er anders addiert als der Mensch

  • Daher eher: kognitive Simulation != künstliche Intelligenz

  • Betonung eher: exakte Nachahmung des menschlichen Denkens.

Rationales Denken

  • Formalisierung von Denken durch Axiome und korrekte Schlussregeln.

  • Üblich: Verwendung einer Logik (”logischer Ansatz“).

  • Ziel: Implementiere Deduktionssystem, das sich intelligent verhält.

  • Vorteil: mathematisch eindeutig.

  • Hürden: Formalisierung des Problems & Wissens in einer Logik.

Rationales Handeln (1)

  • Agenten-Ansatz.

  • Agent = System, dass auf seine Umgebung (Eingaben) eine Reaktion (Ausgaben) durchführt.

  • Agent sollte autonom agieren, sich an Änderungen anpassen und ein Ziel verfolgen.

Rationales Handeln (2)

  • Rationaler Agent: Agent maximiert Ergebnis, bestmögliches Ergebnis.

  • Allgemeiner Ansatz, kann auch die anderen Ansätze miteinbeziehen:

  • z.B. Verwenden einer Logik kann menschlich denken / handeln, wenn dies auch rational ist, aber keine Vorbedingung (daher mehr Freiheit in der Methodik).

  • Rationalität kann mathematisch “sauber” definiert werden.

  • Begriffsklärung ”Intelligenz“: ist in mehrerer Hinsicht anders (eine Einschränkung).

Ausrichtungen der KI

  • Kognitionswissenschaft: Menschliches Handeln / Denken analysieren, modellieren, nachahmen.

  • Ingenieurmäßig ausgerichtete KI: Entwickle Methoden, Techniken, Werkzeuge zum (rationalen/ intelligenten) Lösen komplexer Anwendungsprobleme.

    • Z.B. Deduktionstechniken

    • KI-Programmiersprachen

    • neuronale Netze

    • Lernalgorithmen

    • wissensbasierte Systeme

Ausrichtung der Vorlesung

  • ingenieurmäßige Ausrichtung.

  • direkt programmierbare KI-Methoden.

  • insbesondere Systeme die auf Methoden maschinellen Lernens basieren.

Gebiete der Künstlichen Intelligenz (Auswahl)

  • Programmierung strategischer Spiele (Go, Minecraft, …).

  • Automatisches/Interaktives Problemlösen und Beweisen.

  • Natürlichsprachliche Systeme (Large Languange Models).

  • (Intelligente) Bildverarbeitung.

  • Robotik.

  • (medizinische) Expertensysteme (Diagnose, Therapieempfehlung,…).

  • AI for science: Hypothesengenerierung, Problemlösung und Mustererkennung in den Naturwissenschaften (AlphaFold2, Design neuer Werkstoffe…).

  • Ansätze: Maschinelles Lernen, Regeln/Logik, Suchverfahren.

Was bedeutet Denken in großen Sprachmodellen?

  • (Offene Frage)

Was sind Foundation Models?

  • Definition: Große, auf enormen Datenmengen trainierte neuronale Netze, die als Basis für zahlreiche Anwendungen dienen können.

  • Trainingsmethode: Self-supervised Learning auf umfangreichen Textkorpora (next token prediction).

  • Schlüsselmerkmal: Emergente Fähigkeiten, die nicht explizit trainiert wurden.

Chain-of-Thought Prompting: Einführung

  • Definition: Eine Prompting-Technik, bei der große Sprachmodelle angewiesen werden, ihren Denkprozess (Reasoning) schrittweise darzulegen, bevor sie zu einer finalen Antwort kommen.

  • Standardprompting: Direkte Frage → Direkte Antwort (“Black Box”-Verhalten, Keine Einsicht in den Lösungsweg).

  • CoT-Prompting: Expliziter Reasoning-Prozess (Zwischenschritte werden sichtbar gemacht, Nachvollziehbarer Lösungsweg).

  • Einführung durch Wei et al. (2022) - Paper “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models”.

Chain-of-Thought: Beispiel

  • Standard-Prompting:

    • Frage: Peter kauft 5 Äpfel für jeweils 2 Euro und 3 Orangen für jeweils 3 Euro. Wie viel Geld gibt er insgesamt aus?

    • Antwort: 19 Euro.

  • Chain-of-Thought Prompting:

    • Frage: Peter kauft 5 Äpfel für jeweils 2 Euro und 3 Orangen für jeweils 3 Euro. Wie viel Geld gibt er insgesamt aus?

    • Antwort:

      • Für 5 Äpfel a 2 Euro zahlt er: 5×2=105 \times 2 = 10 Euro

      • Für 3 Orangen a 3 Euro zahlt er: 3×3=93 \times 3 = 9 Euro

      • Insgesamt zahlt er: 10+9=1910 + 9 = 19 Euro

  • Erkenntnisse: Bei komplexen Aufgaben führt CoT zu genaueren Ergebnissen.

Methoden zur Induktion von CoT

  • Zero-Shot-CoT:

    • Einfache Aufforderung: Lass uns das Schritt für Schritt durchdenken.

    • Überraschend effektiv bei großen Modellen.

    • Funktioniert bei Modellen ab einer bestimmten Größe (Emergente Fähigkeit).

  • Few-Shot-CoT:

    • Demonstration von 2-8 Beispielen mit ausgeführten Gedankenschritten.

    • Das Modell übernimmt das Muster des schrittweisen Denkens.

    • Besonders effektiv bei komplexen Reasoning-Aufgaben.

Von “Human-like reasoning” zu Chain-of-Thought

  • Chain-of-Thought als Methode zur Annäherung an menschliche Denkprozesse.

  • Ermöglicht Einblick in das “Denken” des Modells.

  • Verbessert die Nachvollziehbarkeit (Explainable AI).

Was bedeutet “Denken” im Kontext von LLMs?

  • Traditionelles Verständnis von “Denken”:

    • Bewusstsein und Intentionalität.

    • Selbstreflexion.

    • Neuronale Prozesse im biologischen Gehirn.

    • Verbindung zu subjektiven Erfahrungen.

  • “Denken” in LLMs:

    • Prädiktionsmodell für nächste Tokens.

    • Statistische Muster in großen Datenmengen.

    • Kein Bewusstsein oder Intentionalität.

    • Keine intrinsische Bedeutungsverarbeitung.

  • Chain-of-Thought als simuliertes Denken - CoT produziert Texte, die menschlichen Gedankengängen ähneln, aber nicht auf denselben kognitiven Prozessen basieren.

Vergleich zwischen menschlichem Denken und LLM-Prozessen

  • Menschliches Denken:

    • Basiert auf Erfahrung.

    • Hat Zielorientiertheit.

    • Integriert diverse kognitive Prozesse (Wahrnehmung, Emotionen, Erinnerungen).

    • Introspektionsfähigkeit.

    • Versteht die Bedeutung der Konzepte.

  • LLM-“Denken”:

    • Basiert auf statistischen Mustern in Trainingsdaten.

    • Keine eigenen Ziele oder Intentionen.

    • Fokus auf Sprachmodellierung.

    • Keine echte Selbstreflexion (kann diese aber imitieren).

    • Verarbeitet Symbole ohne intrinsisches Verständnis.

  • Zentraler Unterschied: LLMs erzeugen plausible Fortsetzungen von Text und können Reasoning-Schritte überzeugend nachahmen.

Chain-of-Thought: Echtes oder simuliertes Denken?

  • Chain-of-Thought als Emergentes Phänomen (Emergierende Fähigkeit in Modellen ab einer bestimmten Größe, Übereinstimmung mit menschlichen Problemlösungsmustern).

  • Argumente für “Simuliertes Denken”:

    • Kein Bewusstsein oder Intentionalität.

    • Kein echtes Weltwissen.

    • Reproduktion menschlicher Denkmuster aus Trainingsdaten.

  • Argumente für “Neuartige Form des Denkens”:

    • Funktionale Äquivalenz zum Problemlösen.

    • Fähigkeit zur Abstraktion und Transfer.

    • Erzeugung von originellem, nicht-trivialem Output.

Vorteile von Chain-of-Thought in der Praxis

  • Erhöhte Genauigkeit (Bessere Ergebnisse bei arithmetischen Aufgaben, Verbesserte logische Schlussfolgerungen, Komplexere Probleme lösbar, Reduzierung von “Halluzinationen”).

  • Erhöhte Transparenz (Nachvollziehbare Entscheidungsprozesse, Debugging von Reasoning-Fehlern, Vertrauensbildung bei Nutzern - Wichtig für verantwortungsvolle KI).

  • Von symbolischer Verarbeitung zu Chain-of-Thought Chain-of-Thought verbindet den traditionellen symbolischen Ansatz der KI (schrittweise logische Inferenz) mit der neuronalen Leistungsfähigkeit moderner LLMs - ein “Best of Both Worlds”.

Chain-of-Thought als Brücke zwischen KI-Paradigmen

  • Symbolische KI + Neuronale KI --> Chain-of-Thought Integration (Explizites Reasoning + Implizites Wissen).

  • Neurosymbolische KI - CoT nutzt implizite Fähigkeiten neuronaler Netze für explizites symbolisches Reasoning - Wegbereiter für neurosymbolische KI-Systeme.

Zusammenfassung: “Denken” in LLM-basierten Systemen

  • Chain-of-Thought und das Konzept des Denkens (CoT macht interne Prozesse von LLMs explizit sichtbar).

  • LLM-basiertes “Denken” unterscheidet sich fundamental vom menschlichen Denken (Kein Bewusstsein oder Verstehen, aber funktional äquivalente Outputs).

  • Nützliches Werkzeug für komplexe Problemlösung.

  • Philosophische Perspektive (LLMs zeigen funktionales “Denken” ohne Verständnis - philosophische Aspekte?).

Philosophische Aspekte

  • Philosophische Richtungen: Materialismus, Behaviorismus, Funktionalismus.

Materialismus

  • Grundgedanke: Es gibt nichts außer Materie (Insbesondere auch Geist, Gedanken, Wille, … entsteht aus der Materie).

  • Prinzip: Alles was den Menschen ausmacht, kann durch Naturwissenschaft erforscht / analysiert werden.

  • Konsequenz: Alles ist grundsätzlich auch konstruierbar (Insbesondere: Prinzipiell ist auch der denkende, intelligente Mensch konstruierbar).

Behaviorismus

  • Grundprinzip: Nur das Beobachtbare ist Gegenstand der Wissenschaft.

  • Folgerung: Nur verifizierbare/falsifizierbare Fragen sind sinnvoll (Verifizieren benötigt evtl. unendlich viele Beobachtungen, Falsifizieren: Eine Beobachtung genügt).

  • Glauben, Ideen, Wissen nur indirekt beobachtbar (gibt es nicht).

  • Bewusstsein, Ideen, Furcht, … sind Umschreibungen für Verhaltensmuster.

  • Äquivalenz von Systemen (z.B. Mensch vs. Maschine) gegeben bei gleichem Ein-/Ausgabe-Verhalten.

Funktionalismus

  • Grundidee: Geistige Zustände (Ideen, Glauben, Furcht,…) sind interne Zustände eines komplexen Systems.

  • Einzig die Funktion definiert die Semantik eines Systems

  • Zustand S1 des Systems A ist funktional äquivalent zu Zustand S2 des Systems B, wenn:

    • A im Zustand S1 und B im Zustand S2 liefern bei gleicher Eingabe die gleiche Ausgabe

    • Nachfolgezustände von A und B sind funktional äquivalent

  • Z.B. DAB Radio (digital) und UKW Radio (analog) sind funktional äquivalent.

  • Aber: Streaming Dienst und Radio sind nicht äquivalent.

  • Konsequenz: Mensch ist im Prinzip ein endlicher Automat mit Ein-/Ausgabe, definiert durch interne Zustände.

Starke und schwache KI-Hypothese

  • Schwache KI-Hypothese: Maschinen (Computer, Roboter,…) können agieren, als ob sie intelligent wären.

  • Starke KI-Hypothese: Maschinen (Computer, Roboter,…) können wirklich denken und simulieren nicht nur das Denken. Sie haben ein Bewusstsein.

  • In der KI-Forschung:

    • Schwache KI-Hypothese wird als gegeben hingenommen.

    • Starke KI-Hypothese: Pragmatische Sichtweise: irrelevant, Hauptsache ist, dass das System funktioniert.

Turing-Test

  • Test zum Nachweis der starken KI-Hypothese, vorgeschlagen von Alan Turing:

    • menschlicher Fragesteller

    • Gegenstelle (Mensch oder Computer)

    • Kommunikationsleitung (Textübertragung)

  • Mensch stellt schriftliche Fragen an Computer / Mensch

  • Begrenzte Zeit

  • Test ist bestanden, wenn Fragesteller nicht unterscheiden kann, ob Gegenstelle Mensch oder Computer ist.

Turing-Test (2)

  • Kritik: Nicht objektiv, da der Test von den Fähigkeiten des Fragestellers abhängt (Auch z.B. vom Wissen des Fragestellers über Fähigkeiten eines Computers).

  • Abhilfe: Test mit mehreren Personen als Fragesteller wiederholen.

  • Totaler Turing-Test: Unterschied zum (normalen) Turing-Test: Zusätzlich Videoübertragung und Objekterkennung.

Turing-Test: Pro / Contra

  • Pro: Halbwegs einsichtiges Kriterium für “Intelligenz”.

  • Contra: System als riesige Datenbank mit vorgefertigten Antworten - Ist das System intelligent?

ELIZA

  • Von J. Weizenbaum entwickeltes Programm, das als Softbot einen Psychotherapeuten simuliert (Konnte manche Menschen täuschen).

  • Techniken:

    • Vorgefertigte Phrasen, falls das System nichts versteht (“Erzählen Sie mir aus Ihrer Jugend”).

    • Mustererkennung: in der Eingabe wird nach Schlüsselwörtern xyz gesucht; und danach in der nächsten Frage verwendet (“Erzählen Sie mir mehr über xyz”).

Alternative Tests für AGI

  • Ist ein KI System in der Lage, jede intellektuelle Aufgabe auszuführen, die ein Mensch bewältigen kann?

  • Kaffeezubereitungstest: KI-gesteuerter Roboter soll Kaffee in beliebiger Küche zubereiten.

  • IKEA-test: KI-gesteuerter Roboter soll ein in einem Paket verpacktes, zerlegtes IKEA-Möbel aufbauen.

  • Studierendentest: KI soll standardisierte Tests lösen (jurst. Staatsexamen, SAT, …).

Der ARC Prize als AGI-Benchmark

  • Was ist der ARC Prize?

    • 1.000.000+1.000.000+ dotierter, gemeinnütziger Wettbewerb.

    • Ziel: Lösung des ARC-AGI-Benchmarks mit Open-Source-Implementierung

  • Grundidee: Messung der Generalisierungsfähigkeit bei neuartigen Aufgaben

  • Bedeutung für AGI

    • Erfasst das Wesen der Intelligenz: Anpassung an neue Situationen

    • Test für Reasoning-Fähigkeiten jenseits des Trainingskontextes
      *Beispielaufgabe aus dem ARC-Benchmark (https://arcprize.org/)

ARC Prize: Technische Details und Entwicklung

  • Evolution des Benchmarks

    • ARC-AGI-1: Grundlegende fluide Intelligenz

    • ARC-AGI-2: Fokus auf Anpassungsfähigkeit und Effizienz

  • Menschliche Referenz: 98,7% aller ARC-Aufgaben von Menschen lösbar.

  • Diskrepanz zwischen menschlicher und künstlicher Intelligenz

  • ARC testet die Kernfähigkeit intelligenter Systeme: Lösung völlig neuartiger Probleme durch Abstraktion und Reasoning

Chinesischer Raum

  • Gedankenexperiment von John Searle als Gegenargument zur starken KI-Hypothese:

    • Jemand, der kein Chinesisch versteht, sitzt in einen Raum.

    • Im Raum: Stapel mit chinesischen Zetteln

    • Handbuch (in Muttersprache der Person im Raum) mit Regeln wie aus eingegebenen chinesischen Zetteln neue chinesische Zettel erzeugt werden können.

    • Ein chinesischer Zettel wird durch Schlitz reingereicht

    • Person erzeugt neue Zettel auf Stapel und gibt einen Zettel nach außen

Chinesischer Raum (2)

  • Fragen

    • Versteht die Person Chinesisch?

    • Versteht das Gesamtsystem etwas?

  • J. Searle: Kein Teil des System versteht irgendetwas

  • Gegenargument (Behaviorismus): Das Gesamtsystem versteht etwas, da das Verständnis beobachtbar ist.

Das Prothesenexperiment

  • Annahme: Neuronen können künstlich nachgebaut werden (elektronische Neuronen).

  • Experiment: Ersetze einzelne Neuronen durch elektronische Neuronen

  • Frage: Ab welcher Anzahl verwandelt sich das Prothesen-Gehirn in einen Computer, der nichts versteht?

  • Folgerungen:

    • Entweder: Starke KI-Hypothese gilt und nichts ändert sich

    • Oder: Es gibt etwas, das noch unbekannt ist (Geist,…)

Symbolverarbeitungshypothese

  • Physikalisches Symbolsystem:

    • Symbole, denen eine Bedeutung in der Realität zugeordnet werden kann

    • System erzeugt aus eingegebener Symbolstruktur (z.B. String von Symbolen) weitere Symbolstrukturen

  • Symbolverarbeitungshypothese (Alan Newell und Herbert Simon)

    • Es kann ein physikalisches Symbolsystem konstruiert werden, das intelligentes Verhalten zeigt (den Turingtest besteht).

  • Matt Ginsberg: Ziel der Künstlichen Intelligenz: Konstruktion eines physikalischen Symbolsystems, das zuverlässig den Turingtest besteht.

Konnektionismus

  • Hypothese des Konnektionismus

    • Man benötigt subsymbolische, verteilte, parallele Verarbeitung, um eine intelligente Maschine zu konstruieren

  • Implikation: Man benötigt künstliche neuronale Netze

  • Gegenargument: Man kann künstliche neuronale Netze auch (als Software) auf normaler Hardware programmieren

KI-Paradigmen

  • Zwei wesentliche Paradigmen

    • Physikalisches Symbolsystem

      • explizites Programmieren

      • verwenden von Logiken, Schlussregeln, Inferenzverfahren

      • Stärken: Ziehen von Schlüssen, Interpretierbarkeit, mathematische Garantien,…

    • Lernverfahren insbesondere durch künstliche neuronale Netze

      • Stärken: Bilderkennung, Musterverarbeitung, verrauschte Daten, maschinelles Lernen, adaptive Systeme

  • Komplexes KI-System benötigt i.A. alle Paradigmen

Wissensrepräsentationssysteme

  • Wissensrepräsentationshypothese (Brian Smith)

    • Die Verarbeitung von Wissen lässt sich trennen in:

      • Repräsentation von Wissen, wobei dieses Wissen eine Entsprechung in der realen Welt hat.

      • Inferenzmechanismus, der Schlüsse daraus zieht.

    • ⇒ Basis für Programme, deren innere Struktur als Modellierung von Fakten, Wissen, Beziehungen und als Operationen, Simulationen verstanden werden kann.

Repräsentations- und Inferenz-Systeme

  • Komponenten:

    • 1 Formale Sprache: Festlegung der gültigen syntaktischen Formen (Wissensbasis, Anfragen)

    • 2 Semantik: Bedeutung der Sätze der formalen Sprache (i.A. modular aufgebaut)

    • 3 Inferenz-Prozedur (operationale Semantik) Wie kann man Schlüsse ziehen? Diese Inferenzen müssen korrekt bzgl. der Semantik sein.

  • Implementierung:

    • Parser für die formale Sprache

    • Implementierung der Inferenzprozedur.

Wissensrepräsentation in Large Language Models

  • Repräsentation: Wissen wird in Form von statistischen Mustern in den Daten repräsentiert.

  • LLMs haben kein explizites Wissen im Sinne von Fakten oder Informationen.

  • Statistische Muster menschlicher Sprache werden imitiert.

  • Inferenz-Prozedur

    • Antworten und Schlüsse werden auf der Grundlage der gelernten Muster gezogen

    • Schlüsse können fehlerhaft und inkonsistent sein

  • Repräsentation von Wissen und Inferenzsystem als ein neuronales Netzwerk

Geschichte der KI (1)

  • 1950 A. Turing: Imitationsspiel

  • 1956 J. McCarthy Dartmouth Konferenz: Start des Gebietes “artificial intelligence“ und Formulierung der Ziele.

  • 1970-2005 Wissensverarbeitung als Technologie

    • medizinisches Expertensystem: MYCIN

    • Schach: Deep Blue

    • Computerlinguistik

    • neuronale Netze (LeNet)

Geschichte der KI (2)

  • 2006-2012 Fortschritte im maschinellen Lernen

    • Deep Learning mit mehrschichtigen neuronalen Netzen (ConvNets, LSTMs)

    • Anwendungen in Objekterkennung, Spracherkennung

    • Sieg von IBM Watson bei Jeopardy! gegen menschliche Champions (2011)

  • 2012-2016 Durchbruch von Deep Learning

    • AlexNet gewinnt ImageNet Wettbewerb (2012)

    • Fortschritte bei Bildverarbeitung, maschineller Übersetzung

    • Sieg von AlphaGo gegen Go-Weltmeister (2016)

Geschichte der KI (3)

  • 2017-2022 Zeitalter der großen Sprachmodelle

    • Transformer-Architektur ermöglicht vortrainierte Sprachmodelle

    • GPT-3 (2020) und andere große Modelle mit erstaunlichen Fähigkeiten

    • Modelle wie DALL-E für Bildgenerierung aus Text

  • 2023+ Generative KI und Weiterentwicklung

    • GPT-4, Claude, LLama3 und andere dialogfähige multimodale Sprachmodelle

    • Ethische Fragen und Regulierungsbedarf

    • Integration von KI(s) in immer mehr Anwendungsbereiche

Geschichte der KI (4)

  • Aktuelle Forschungsrichtungen

    • Allgemeine künstliche Intelligenz (AGI) (eine KI, die die Fähigkeit besitzt, jede intellektuelle Aufgabe zu verstehen oder zu lernen, die ein Mensch ausführen kann)

    • Technologie zur Ermöglichung von multi-modalen Mensch-Computer-Dialogen.

    • Robotik-Ansatz: (Embodied artificial intelligence, Sensorik und Motorik)

    • AI safety, trustworthiness and ethics (alignment)

    • physics-informed AI

    • AI for science, general medical AI

    • Retrieval-augmented generation (RAG)

Fazit der bisherigen Erfahrungen

  • Motivationen und Visionen der Allgemeinen KI sind in der Informatik verbreitet

  • Fernziel scheint (schien?) mit aktuellen Methoden, Techniken, Hardware und Software nicht erreichbar

  • Scaling Laws momentan vielversprechendster Ansatz

  • Mechanismen zur Verbesserung der kollektiven Intelligenz?

  • Offenes Lernen und Selbstverbesserung (open ended learning and self-play)?

  • Teilbereiche sind eigenständige Forschungsgebiete

Benchmarks für AGI

  • Herausvorderungen Wie können sinnvolle benchmarks definiert werden? (IQ test)

  • Overfitting auf benchmarks?

  • Chatbot Arena (kollaborativer Raum für die Entwicklung, Bewertung und Benchmarking von Chatbot-Modellen)

  • Spezifische Anwendungsfälle vs Generalisierung über Tasks

Intelligente Agenten

  • Agent = Oberbegriff für alle KI-Systeme.

  • Ein Agent hat Sensoren zum Beobachten seiner Umgebung und Aktuatoren (Aktoren; Effektoren) um die Umgebung zu manipulieren.

  • [Diagramm: Agent, Umgebung, Sensoren, Agentensteuerung, Aktuatoren, Beobachtungen, Aktionen]

Intelligente Agenten (2)

  • Agent macht Beobachtungen (Folge = Beobachtungssequenz)

  • Aktionen beeinflussen die Umgebung und evtl. ihn selbst (z.B. Position)

  • Agentenfunktion: {Beobachtungsfolgen} → {Aktionen}. Agentfunktion kann durch das Agentenprogramm implementiert werden

Beispiel: Staubsaugerwelt (Russel & Norvig)

  • Orte: A oder B

  • Jeder Ort: Dreckig / Sauber

  • Agent kann nur aktuellen Ort beobachten (Sauber/Dreckig)

  • Aktionen: InsAndereQuadrat, Saugen und NichtsTun.

Beispiel: Staubsaugerwelt (Russel & Norvig) (2)

  • Problem: Wann ist der Agent (das zugehörige Programm) gut / vernünftig bzw. intelligent ?

  • Notwendig: Performanzmaß, d.h. eine Leistungsbewertung des Agenten (Z.B. Alles immer maximal sauber, Möglichst sauber, aber wenig Stromverbrauch, Möglichst sauber, aber wenig störend …).

  • Der optimale agierende Agent ist der intelligente Agent.

Beispiel: Staubsaugerwelt, kommerziell

  • (Bild eines kommerziellen Staubsaugerroboters)

Intelligenter Agent

  • Definition: Ein vernünftiger (intelligenter, rationaler) Agent ist derjenige, der stets die optimale Aktion bzgl des Performanzmaßes wählt, aufgrund seiner Beobachtungsfolge und seines Vorwissens über die Umgebung.

  • Aufgabe: Wählen des Performanzmaßes ?

Lernen

  • Guter Agent: mittels der Sensoren Wissen über die Umgebung sammeln; lernfähig, bzw. fähig, sich adaptiv zu verhalten, aufgrund der Beobachtungssequenz

  • Agent wird als autonom bezeichnet, wenn der Agent eher aus seinen Beobachtungen lernt und nicht auf vorprogrammierte Aktionen angewiesen ist.

Umgebungen

  • Klassifikationen

    • Vollständig beobachtbar vs. teilweise beobachtbar (Der Staubsauger kann z.B. nur sein eigenes Quadrat beobachten).

    • Deterministisch vs. Stochastisch (Der Dreck erscheint zufällig in den Quadraten).