Autor: Michael Jentsch

So nutzt man „gemini-3-pro-preview“ in ollama und vermeidet „Error: 401 Unauthorized“

Veröffentlicht am 19. November 2025 von Michael Jentsch

So nutzt man „gemini-3-pro-preview“ in ollama und vermeidet „Error: 401 Unauthorized“

Ich habe gerade versucht, das brandneue Gemini 3 Pro Preview Modell über ollama zu starten, nur um von einer Fehlermeldung gestoppt zu werden. Hier beschriebe ich die Lösung für das kleine Probelm. Der Befehl ollama run gemini-3-pro-preview ist der Schlüssel zu enormer KI-Power direkt im Terminal. Doch in diesem Fall endet der erste Versuch mit einem frustrierenden Fehler: Error: 401 Unauthorized Warum bekomme ich einen „401 Unauthorized“ Fehler? Normalerweise bin ich es bei Ollama gewohnt, Modelle wie Qwen3 oder Mistral einfach herunterzuladen, ohne uns irgendwo anzumelden. Das liegt daran, dass diese Modelle öffentlich und frei zugänglich (Open Source) sind. Bei speziellen Cloud Modellen wie gemini-3-pro-preview sieht die Sache anders aus. Ein „401 Unauthorized“ bedeutet schlichtweg: „Ich weiß nicht, wer du…

Kommentare sind geschlossen

Analyse des Blinkfehlers: Synchrones Blinken blauer und orangefarbener LEDs auf Acer Notebooks

Veröffentlicht am 13. November 2025 von Michael Jentsch

Wenn ich meinen Acer Nitro 5 mit einer RTX 3080 Grafikkarte für intensive KI Aufgaben nutze, passiert es gelegentlich, dass die blaue und die orangene LED plötzlich gleichzeitig anfangen zu blinken und der Akku trotz eingestecktem Netzteil nicht mehr lädt. Das ist echt ätzend da man in der Situation das Ladegeräte abziehen und wieder einstecken muss bevor der Laptop wieder lädt. Ich habe dieses Problem mal zum Anlass genommen, das neue Qwen3-Max Deep Research Feature zu testen und mal zu checken, was Qwen3-Max Deep Research zu dem Problem herausfinden kann. https://chat.qwen.ai/?inputFeature=deep_research Hier also das Ergebnis von Qwen3-Max Deep Research, dass mir als Markdown und PDF zum Download angeboten wurde – ich finde das Ergebnis kann sich sehen lassen. Analyse des…

Kommentare sind geschlossen

LLM-Training im Auge behalten: Wie ich mit ntfy stündliche Updates auf mein Handy bekomme

Veröffentlicht am 8. November 2025 von Michael Jentsch

LLM-Training im Auge behalten: Wie ich mit ntfy stündliche Updates auf mein Handy bekomme

Das Trainieren oder Finetuning von großen Sprachmodellen (LLMs) ist oft ein langwieriger Prozess, der sich über viele Stunden oder sogar Tage erstrecken kann. Währenddessen ständig den Fortschritt im Auge zu behalten, kann mühsam sein. Man muss sich per SSH auf dem Trainingsserver einloggen, TensorBoard starten oder Log-Dateien durchsuchen. Das ist nicht nur umständlich, sondern auch leicht zu vergessen. Ich wollte eine einfachere Lösung: automatische, stündliche Updates direkt auf mein Handy, die mir auf einen Blick zeigen, wie das Training verläuft. Also habe ich mit dem einfachen Push-Benachrichtigungsdienst ntfy, einem Python-Skript und einem Cronjob genau das realisiert. Das Ziel: Ein visueller Überblick auf Abruf Jede Stunde erhalte ich nun eine Benachrichtigung auf meinem Smartphone, die so aussieht: Die Grafik selbst besteht aus…

Kommentare sind geschlossen

Speculative Decoding in llama.cpp – Warum das gleiche Modell in niedrigerer Quantisierung keinen Performancegewinn bringt

Veröffentlicht am 17. Oktober 2025 von Michael Jentsch

Speculative Decoding in llama.cpp – Warum das gleiche Modell in niedrigerer Quantisierung keinen Performancegewinn bringt

In einem aktuellen Test habe ich das Modell Qwen3-Coder-30B-A3B-Instruct mit llama.cpp auf seine Performance mit und ohne Speculative Decoding untersucht. Ziel war es, herauszufinden, ob sich durch den Einsatz einer niedriger quantisierten Version desselben Modells ein Geschwindigkeitsvorteil erzielen lässt – insbesondere, weil für dieses Modell kein kleineres, kompatibles Dense-Modell verfügbar ist. Testaufbau Verwendete Modelle: Beide Modelle basieren also auf der exakt gleichen Architektur und Gewichtsstruktur, unterscheiden sich aber nur in der Quantisierungstiefe – also der Anzahl der Bits, mit denen die Gewichtungen gespeichert werden. Die Tests wurden mit llama.cpp unter denselben Hardware- und Laufzeitbedingungen durchgeführt. Messergebnisse Setup Modell(e) Tokens/s Ohne Speculative Decoding Q6_K 54 Tokens/s Mit Speculative Decoding Q6_K (Target) + Q2_K (Draft) 25 Tokens/s Das Ergebnis ist eindeutig:Mit aktiviertem…

Kommentare sind geschlossen

So habe ich Kwaipilot/KAT-Dev-72B-Exp für die lokale Nutzung mit Ollama fit gemacht habe

Veröffentlicht am 12. Oktober 2025 von Michael Jentsch

So habe ich Kwaipilot/KAT-Dev-72B-Exp für die lokale Nutzung mit Ollama fit gemacht habe

Ein neues spannendes Modell für den Bereich der Softwareentwicklung ist Kwaipilot/KAT-Dev-72B-Exp. Mit einem SWE-Bench Verified von 74.6% ist es ein vermutlich das beste Open Source Modell für alles, was mit Code zu tun hat. Das Modell benötigt in seiner ursprünglichen Form erhebliche Rechenressourcen. Um es zugänglicher und auf lokaler Hardware lauffähig zu machen, habe ich es in das GGUF-Format konvertiert, quantisiert und anschließend sowohl auf Hugging Face als auch auf Ollama.com veröffentlicht. Schritt 1: Die Vorbereitung und Konvertierung nach GGUF Das GGUF-Format, entwickelt vom Team hinter llama.cpp, ist der Schlüssel, um große Modelle effizient auf Consumer-Hardware (sogar nur mit CPU) auszuführen. Der erste Schritt war also, das ursprüngliche Modell in dieses Format zu überführen. 1.1. llama.cpp einrichten Das Herzstück der…

Kommentare sind geschlossen

Buchrezension: Websites entwickeln mit KI: Konzeption, Umsetzung und Optimierung von Jens Jacobsen

Veröffentlicht am 26. Juli 2025 von Michael Jentsch

Buchrezension: Websites entwickeln mit KI: Konzeption, Umsetzung und Optimierung von Jens Jacobsen

Das Buch „Websites entwickeln mit KI: Konzeption, Umsetzung und Optimierung“ von Jens Jacobsen aus dem Rheinwerk Verlag, ist ein umfassender Leitfaden für alle, die moderne KI-Tools nutzen möchten, um professionelle Websites zu erstellen. Jens Jacobsen führt die Leser durch einen strukturierten 7-Schritte-Prozess, der von der Konzeption bis zur Vermarktung einer Website reicht. Dabei legt er besonderen Wert auf die praktische Anwendung von KI, ohne dass technische Vorkenntnisse erforderlich sind. Mit einer klaren Sprache, praxisnahen Beispielen und einer Vielzahl von praktischen Prompts bietet das Buch sowohl Anfängern als auch erfahrenen Webentwicklern wertvolle Einblicke in die Möglichkeiten der KI-gestützten Webentwicklung. Das Buch ist in sieben Hauptkapitel gegliedert, die jeweils einen Schritt im Prozess der Website-Erstellung abdecken. In diesen Kapiteln wird theoretisches Wissen…

Kommentare sind geschlossen

Alchemie 2.0: AGI als moderner Stein der Weisen – Fortschritt oder moderner Aberglaube?

Veröffentlicht am 26. Juli 2025 von Michael Jentsch

Alchemie 2.0: AGI als moderner Stein der Weisen – Fortschritt oder moderner Aberglaube?

Seit jeher strebt der Mensch danach, die Grenzen des Machbaren zu verschieben. In früheren Jahrhunderten versuchten Alchemisten, das Unmögliche zu erreichen: die Umwandlung von unedlen Metallen wie Blei in Gold oder die Entdeckung des Steins der Weisen – einer Substanz, die ewiges Leben und universelles Wissen versprach. Diese Forschung wirkt aus heutiger Sicht eher esoterisch, doch sie war Ausdruck eines tief verankerten menschlichen Drangs, die Kontrolle über grundlegende Prinzipien der Natur zu erlangen. In gewisser Weise zeigt sich dieser Drang heute erneut in der Forschung rund um allgemeine künstliche Intelligenz, kurz AGI. Die Idee, eine Maschine zu schaffen, die nicht nur spezifische Aufgaben erledigt, sondern über ein umfassendes Verständnis der Welt verfügt, wirkt in ihrer Tragweite vergleichbar mit dem alchemistischen…

Kommentare sind geschlossen

NVIDIA® Jetson AGX Thor™ Developer Kit – 2070 FP4 TFLOPS AI Perfromance

Veröffentlicht am 22. Juli 2025 von Michael Jentsch

NVIDIA® Jetson AGX Thor™ Developer Kit – 2070 FP4 TFLOPS AI Perfromance

NVIDIA hat mit dem Jetson AGX Thor Developer Kit eine Plattform angekändigt, die verspricht, die Entwicklung von humanoiden Robotern und physikalischer KI neu zu definieren. Das NVIDIA® Jetson AGX Thor™ Developer Kit ist ein gewaltiger Sprung nach vorne der das NVIDIA Jetson AGX Orin 64GB Developer Kit bei weitem übertrifft. Das Herzstück des Jetson AGX Thor hat eine unglaubliche KI-Leistung. Mit bis zu 2070 FP4 TFLOPS (Tera-Floating-Point-Operations-Per-Second) bietet das Kit eine Rechenleistung, die speziell für die neuesten generativen KI-Modelle ausgelegt ist. Diese enorme Leistung wird durch die neue NVIDIA Blackwell-Architektur ermöglicht, die im Jetson T5000-Modul mit 2560 Kernen und 96 Tensor Cores der fünften Generation zum Einsatz kommt. Im Vergleich zum bereits leistungsstarken Vorgänger, dem Jetson AGX Orin, liefert Thor…

Kommentare sind geschlossen

Zum Aus von Pocket und was jetzt kommt …

Veröffentlicht am 12. Juli 2025 von Michael Jentsch

Zum Aus von Pocket und was jetzt kommt …

Pocket – ursprünglich „Read It Later“ – wurde im August 2007 von Nate Weiner als Browser-Erweiterung gestartet, um gespeicherte Artikel später zu lesen. 2017 übernahm Mozilla den Dienst, mit dem Ziel, ihn als integralen Teil seiner Content-Empfehlungen weiterzuentwickeln. Über die Jahre wuchs Pocket zu einer Plattform mit Millionen Nutzern und wurde sowohl wegen seiner Reader-Funktion als auch seiner kuratierten Empfehlungen geschätzt. Doch nun ist der Dienst abgeschaltet und es bleibt nur eine Export Funktion mit der man die gespeicherten URLs als CSV Datei exportieren kann. Ich habe Read It Later und GetPocket eigentlich täglich genutzt und immer wieder Artikel mit der Browser-Erweiterung oder der Android App gespeichert und später offline gelesen. Meist in der Bahn auf dem Weg zur Arbeit…

Kommentare sind geschlossen

30 Tage scikit-learn – Tag 30: Eigenes kleines Projekt

Veröffentlicht am 19. Juni 2025 von Michael Jentsch

30 Tage scikit-learn – Tag 30: Eigenes kleines Projekt

Tag 30 ist erreicht! Die vergangenen Wochen waren eine spannende Reise durch die Welt des maschinellen Lernens mit scikit-learn. Die heutige Aufgabe ist es, möglichst viel von dem gelernten in einem eigenen Projekt zu bündeln. Für das Projekt greife ich auf einen alten Datensatz zurück. Dabei handelt es sich um die IMU-Daten (Inertial Measurement Unit) eines Projektes das leider nicht erfolgreich beendet wurde. Gemeinsam mit zwei Freunden haben wir versucht, mittels des 6-Achsen-Sensors von Google Wear-OS Watches verschiedene Fitnessübungen (Liegestützen, Bizeps Curls, etc.) in Echtzeit auf dem Handy zu erkennen, Wiederholungen zu zählen und Nutzern Tipps zur Erreichung der Trainingsziele zu geben. Auch wenn das Projekt leider nicht den erhofften Erfolg hatte, leben die Daten und die Idee weiter. Für das…

Kommentare sind geschlossen