Die KI kann ja nicht nur spielerische Dinge wie nette Bildchen erzeugen oder Aufsätze schreiben. Sie ist bereits gut als erklärender Assistent brauchbar. Dieser Assistent kann nicht nur Texte lesen, sondern auch zunehmend gut komplexe Inhalte in Bildern erkennen und erklären.

Im folgenden einige Beispiele, wie die aktuelle, ausschließlich lokal auf meinem Laptop arbeitende KI (Gemma-3 27B Instruct) mit Bildinhalten umgehen kann. Die vollständig lokale Datenverarbeitung ist für viele wegen dem Datenschutz und für vertrauliche Dokumente wichtig. Mein Laptop ist dabei ein relativ schneller MacBook Pro mit M4 Pro Chip und 48GB RAM. Als Programm verwendete ich LM-Studio. Das KI-Modell und das Programm sind gratis verfügbar.
Beispiel – Erklärung einer komplexen Vortragsgrafik
Ich sehe mir gerne youtube Videos an, um zu lernen. Im Video vom exzellenten MIT Vortrag von Dave Blundin kommt eine relativ komplexe Grafik vor, die ich mir testweise von der lokalen KI erklären lassen wollte:
Frage: Bitte erkläre den Inhalt dieses Bildschirmfotos.
Assistant (gemma-3-27b-it):
Das Bildschirmfoto zeigt ein Diagramm mit dem Titel “Konvergierende Technologien erzeugen eine historische technologische Welle”. Es stellt die geschätzte wirtschaftliche Auswirkung allgemeiner Technologien dar und wie sie im Laufe der Zeit zum realen BIP-Wachstum und zur Konsumentenrente beitragen.
Die horizontale Achse zeigt den Zeitraum von 1820 bis 2040, aufgeteilt in Jahrzehnte. Die vertikale Achse stellt den geschätzten jährlichen prozentualen Beitrag zum realen BIP-Wachstum und zur Konsumentenrente dar (von -2% bis 18%).
Das Diagramm zeigt verschiedene Technologien, die durch farbige Bereiche repräsentiert werden, die ihren jeweiligen Einfluss über die Zeit darstellen. Einige der dargestellten Technologien sind:
- Frühe Technologien: Dampfmaschine, Telegrafie, Fotografie, Eisenbahnen, Fahrrad
- Technologien des 20. Jahrhunderts: Verbrennungsmotor, Elektrizität, Telefon, Radio, Kühlung, Klimaanlage, Chemikalien & synthetische Materialien, Automobilproduktion, Fernsehen, Düsenantrieb, integrierte Schaltkreise, Kernkraft, Containerisierung, PCs, Biotechnologie, Glasfaseroptik
- Neuere und aufkommende Technologien: Internet, Mobiltelefone, GPS, Web, E-Commerce, erneuerbare Energien, 3D-Druck, wiederverwendbare Raketen, adaptive Roboter, fortschrittliche Batterien, autonome Mobilität, Cloud Computing, KI, intelligente Geräte, Multimodale Technologie, Präzisionstherapien, programmierbare Biologie, digitale Geldbörsen und Kryptowährungen.
Das Diagramm zeigt, dass verschiedene Technologien im Laufe der Zeit unterschiedliche Auswirkungen auf das Wirtschaftswachstum hatten, wobei einige zu bedeutenden Steigerungen führten und andere einen geringeren oder sogar negativen Einfluss hatten. Es deutet darauf hin, dass wir uns derzeit in einer Phase beschleunigten technologischen Fortschritts befinden, da mehrere neue Technologien gleichzeitig entstehen und konvergieren.
Die KI hat hier ca. 10 Sekunden benötigt um das Bild zu analysieren, und dann mit 12 Token (d.h. Wortteilen) pro Sekunde geantwortet – schneller als ich mitlesen konnte.
Und OK, ich hab etwas dazugelernt, daß consumer surplus
auf Deutsch anscheinend wirklich Konsumentenrente heißt (zumindest auch lt. Wikipedia). Die KI generiert natürlich immer wieder neue Antwortversionen. Die etwas längere englische Erklärung der Grafik (zur Frage: Please explain the content of this image.
) ist für mich aber verständlicher und klarer:
Assistant (gemma-3-27b-it):
Here’s a breakdown of what the image depicts:
Overall Theme: The graphic illustrates the estimated economic impact of various “General Purpose Technologies” (GPTs) over time, suggesting that we are currently experiencing a significant wave of technological convergence and growth.
The Chart: It’s a line chart spanning from 1820 to 2020+. The Y-axis represents the “Estimated Economic Impact” measured as annual percentage point additions to real GDP growth and consumer surplus. The X-axis represents time (years). Each colored line represents a different technology or group of technologies.
Key Technologies & Their Timeline:
- Early Stage (1820s – 1920s):
- Steam Engine (Pink): Shows an early, significant impact that gradually declines.
- Railroads, Telegraph, Photography, Bicycle (Purple/Red): These technologies emerge and contribute to economic growth, peaking around the late 19th/early 20th century.
- Mid-Century Growth (1920s – 1980s):
- Internal Combustion Engine, Electricity, Radio, Refrigeration, Air Conditioning (Yellow/Gold): These technologies drive a substantial increase in economic impact.
- Chemicals & Synthetic Materials, Automobile Assembly Line, Television, Jet Engine (Orange): Continue the growth trend, peaking around mid-century.
- Digital Revolution (1980s – 2000s):
- PCs, Biotech, Fiber Optics, Integrated Circuit, Nuclear Power, Containerization (Green): These technologies mark a shift towards digital and scientific advancements.
- Recent & Future Growth (2000s – 2020+):
- Internet, Cell Phones, GPS, The Web, E-Commerce, Renewables (Blue): Show substantial and continuing growth in economic impact.
- AI, 3D Printing, Reusable Rockets, Adaptive Robots, Advanced Batteries, Autonomous Mobility, Cloud Computing, Intelligent Devices, Multiomic Technology, Precision Therapies, Programmable Biology, Digital Wallets, Cryptocurrencies (Teal/Dark Blue): Represent the current and projected wave of technologies with potentially massive economic impact.
Key Observations:
- The chart suggests that GPTs tend to have a rising impact initially, then plateau or decline as they mature and are widely adopted.
- There’s an apparent “convergence” happening in recent decades, where multiple technologies build upon each other (e.g., AI leveraging cloud computing and the internet).
- The chart implies that we are currently at the beginning of a new wave of potentially transformative technologies with significant economic promise.
In essence, the image is a visual argument for how technological innovation drives economic growth over time, and it highlights the potential impact of current and emerging technologies.
Beispiel Tutor für KI-Mathematik
Manchmal stehe ich bei der KI-Mathematik an, ich bin zu lange von Schule und Universität weg. Letztens bin ich auf die folgende Formel gestoßen:
Frage: Erkläre mir bitte die Formel und deren Bedeutung in der KI auf Gymnasium Niveau.
Assistant (gemma-3-27b-it):\
Absolut! Lass uns diese Formel, die Cosinus-Ähnlichkeit, aufschlüsseln und ihre Bedeutung im Kontext der künstlichen Intelligenz (KI) erklären – so verständlich wie möglich für ein Gymnasiumniveau.
Was ist die Cosinus-Ähnlichkeit?
Die Cosinus-Ähnlichkeit ist eine Metrik, um zu messen, wie ähnlich zwei Vektoren sind. Ein Vektor ist im Grunde eine Liste von Zahlen, die in einem bestimmten Raum (oft mehrdimensional) angeordnet sind. In der KI werden diese Vektoren oft verwendet, um verschiedene Arten von Daten darzustellen:
- Textdokumente: Jede Zahl im Vektor könnte die Häufigkeit eines bestimmten Wortes in dem Dokument darstellen.
- Benutzerprofile: Zahlen könnten Bewertungen für Filme, Produkte oder andere Elemente sein.
- Bilder: Pixelwerte können als Vektoren dargestellt werden.
Die Cosinus-Ähnlichkeit misst den Kosinus des Winkels zwischen diesen beiden Vektoren. Der Wert liegt immer zwischen -1 und 1:
- 1: Die Vektoren zeigen in die gleiche Richtung – sie sind sehr ähnlich.
- 0: Die Vektoren stehen senkrecht zueinander – sie haben keine Ähnlichkeit.
- -1: Die Vektoren zeigen in entgegengesetzte Richtungen – sie sind völlig unterschiedlich.
Die Formel im Detail
Lass uns die Formel Schritt für Schritt durchgehen:
- SC(A, B) = cos(θ)
- Dies sagt aus, dass die Cosinus-Ähnlichkeit zwischen zwei Vektoren A und B gleich dem Kosinus des Winkels θ (Theta) zwischen ihnen ist.
- A ⋅ B
- Dies ist das Skalarprodukt (auch Punktprodukt genannt) der beiden Vektoren A und B. Es wird berechnet, indem man die entsprechenden Elemente der Vektoren multipliziert und dann alle diese Produkte addiert:
- Wenn A = [a1, a2, …, an] und B = [b1, b2, …, bn], dann ist A ⋅ B = a1*b1 + a2*b2 + … + an*bn
- Dies ist das Skalarprodukt (auch Punktprodukt genannt) der beiden Vektoren A und B. Es wird berechnet, indem man die entsprechenden Elemente der Vektoren multipliziert und dann alle diese Produkte addiert:
- ||A|| ||B||
- Dies sind die Beträge (oder Längen) der Vektoren A und B. Der Betrag eines Vektors wird berechnet, indem man die Quadrate aller Elemente summiert und dann die Quadratwurzel zieht:
- ||A|| = √(a12 + a22 + … + an2)
- ||B|| = √(b12 + b22 + … + bn2)
- Dies sind die Beträge (oder Längen) der Vektoren A und B. Der Betrag eines Vektors wird berechnet, indem man die Quadrate aller Elemente summiert und dann die Quadratwurzel zieht:
- Die gesamte Formel:
- SC(A, B) = (A ⋅ B) / (||A|| ||B||)
- Dies berechnet also das Skalarprodukt der Vektoren geteilt durch das Produkt ihrer Beträge. Das Ergebnis ist der Kosinus des Winkels zwischen den Vektoren.
Warum ist die Cosinus-Ähnlichkeit in der KI wichtig?
Hier sind einige Beispiele, wie die Cosinus-Ähnlichkeit in verschiedenen Bereichen der KI verwendet wird:
- Empfehlungssysteme: Um ähnliche Benutzer oder Produkte zu finden. Wenn zwei Benutzer ähnliche Bewertungen für Filme haben (ihre Vektoren zeigen in eine ähnliche Richtung), ist es wahrscheinlich, dass sie auch andere Filme mögen.
- Text Mining und Information Retrieval: Um die Ähnlichkeit zwischen Dokumenten zu messen. Dies kann verwendet werden, um relevante Dokumente für eine Suchanfrage zu finden oder um Dokumente nach Themen zu gruppieren.
- Natural Language Processing (NLP): Um die semantische Ähnlichkeit zwischen Wörtern oder Sätzen zu bestimmen.
- Bilderkennung: Um ähnliche Bilder zu finden, indem man Merkmale wie Farbe und Textur als Vektoren darstellt.
Vorteile der Cosinus-Ähnlichkeit
- Unabhängigkeit von der Größe: Die Cosinus-Ähnlichkeit berücksichtigt nur die Richtung der Vektoren, nicht ihre Länge. Dies ist wichtig, da die Länge eines Vektors in einigen Fällen irrelevant sein kann (z. B. bei Textdokumenten unterschiedlicher Länge).
- Einfache Berechnung: Die Formel ist relativ einfach zu berechnen und effizient für große Datensätze.
Ich hoffe, diese Erklärung hilft dir weiter! Lass mich wissen, wenn du noch Fragen hast oder weitere Details zu bestimmten Aspekten wünschst.
OK, ich hab die Antwort – wieder nach 10s stückweise folgend, aber schneller als meine Lesegeschwindigkeit – erhalten, und besser als die Wikipedia-Erklärung verstanden.
Zusammenfassend: Ich bin von der Leistungsfähigkeit der aktuellen KI als Assistent, Tutor, usw. ziemlich begeistert. Ich hätte mir solche Antworten vom aktuellen chatGPT, aber nicht von einer vergleichsweise 100-fach kleineren, Laptop-fähigen KI erwartet.
- Über den Autor
- Artikel
Retired Techie/Consultant/Marketer/Manager/Photographer. I enjoyed combining my technical background with marketing, analytics-insights and leadership to drive for business results. It also seems, that I have an eye for the beauty in people and photographic language.