MurMur — Audio Bridge / Transcribe / Translate

MurMur ist eine Desktop-App, die Systemaudio in Echtzeit weiterleitet, transkribiert, ins Englische übersetzt und aufnimmt – komplett lokal, ohne Cloud-Abhängigkeit.

Mit einer einfachen Zwei-Fenster-Oberfläche lassen sich Spracheingaben automatisch erkennen und nahezu live als Text anzeigen. Optional wird gleichzeitig eine englische Übersetzung erzeugt.

Besonders praktisch: MurMur kann Desktop-Audio über virtuelle Ausgabegeräte wie BlackHole oder Loopback weiterleiten, die Lautstärke per virtuellem Gain anpassen und Aufnahmen direkt als MP3 exportieren. Ein kreativer Bonus-Use-Case ist die Kombination mit Shazam für Mac, um Songs vom Rechner zuverlässig zu identifizieren – ganz ohne Umgebungsgeräusche.

Alle Prozesse laufen lokal auf dem Rechner, wodurch maximale Datensouveränität und geringe Latenz gewährleistet sind.

SRT Subtitle Translator


SRT Translator ist ein Desktop-Tool mit GUI und CLI zum präzisen Übersetzen von .srt-Untertiteln.

Es unterstützt drei Engines: NLLB (Meta “No Language Left Behind”) für geringe Systemanforderungen und solide Qualität, SeamlessM4T (Meta) für höhere Qualität bei moderatem Ressourcenbedarf, sowie einen experimentellen Modus über Ollama für lokal laufende LLMs (höchste Qualität, aber auch höchste Anforderungen).

Für den Ollama-Modus muss Ollama installiert und der Dienst gestartet sein; technisch Versierte können den Prompt direkt in der Python-Datei anpassen.

(NLLB: arXiv 2207.04672; SeamlessM4T: arXiv 2308.11596; Ollama: offizielles Repo.)

YouTube Summarizer

Mit diesem Desktop-Tool lassen sich YouTube-Videos in wenigen Klicks automatisiert transkribieren, zusammenfassen und in verschiedene Sprachen übersetzen – alles lokal und datenschutzkonform. Die Kernfunktionen sind:

Das Tool verbindet KI-gestützte Automatisierung mit nutzerfreundlichem Interface und bietet damit Mehrwert, um gezielt Informationen aus YouTube-Videos zu extrahieren und zu strukturieren.

Infinite Sound (Tavern Generator)

Infinite Sound ist ein Endlosmusikgenerierungstool, das mit Hilfe von Stable Audio Open beliebige Klänge auf Basis von Texteingaben erzeugt. Die Anwendung bietet eine minimalistische Benutzeroberfläche zur Eingabe von Stichworten, Steuerung der Lautstärke und Verwaltung von Aufnahmen. Audiosnippets werden konstant generiert und überblendet (Crossfade) und durch Aktivierung des “Record”-Modes lokal gespeichert.

Technisch basiert das Programm auf PyTorch, Stable Audio Tools und PyWebView und unterstützt sowohl CPU- als auch GPU-Beschleunigung (CUDA/MPS). Die für die Generierung notwendigen KI-Modelle werden beim ersten Start über Hugging Face heruntergeladen, wofür ein kostenloser Zugang und ein API-Token erforderlich sind.

SD 3D Model Generator


Der SD 3D Model Generator ist ein innovatives Kreativ-Tool, das die Lücke zwischen einfachen Texteingaben und vollständig ausgearbeiteten 3D-Assets für Game Development, Visualisierung und kreatives Prototyping schließt. Anders als klassische Stable Diffusion (SD) Frontends beschleunigt diese Anwendung den gesamten Workflow durch die Integration fortschrittlicher Large Language Models (LLMs):
Prompts werden automatisch optimiert, nahtlose (zum Thema passende) Environment-Maps generiert, Bilder der Objekte oder Charaktere werden generiert und in hochwertige 3D-Modelle umgewandelt – alles in einer intuitiven Oberfläche, in der man Bilder sowie 3D-Modelle mit Environment Map betrachten kann.

Was hebt das Tool hervor?


Features & User Experience



Technischer Überblick


Der SD 3D Model Generator vereinfacht den Weg von der Idee zum fertigen Asset radikal. Durch die Verbindung von LLMs, Stable Diffusion und automatisierten 3D-Workflows können Artists, Designer und Entwickler hochwertige Visuals schneller, flexibler und kreativer generieren, verwalten und weiterverarbeiten.

Auto-Git

Auto-Git ist eine plattformübergreifende Electron-App, die Git-Repos automatisch überwacht und verwaltet und mithilfe von LLMs Commit Messages und Dokumentationen / READMEs schreibt.

Alle Funktionen – von der kontinuierlichen, automatischen Commit-Erstellung bis hin zur vollautomatischen Push-und-Repo-Einrichtung auf Gitea – sind darauf ausgelegt, Entwicklern den Alltag zu erleichtern: Man fokussiert sich weiter auf Code, während Auto-Git im Hintergrund dafür sorgt, dass Commit-History, Dokumentation und Remote-Repositories stets auf dem neuesten Stand bleiben.

Künstliche Intelligenz (Studium)

Von 2016 bis 2019 beschäftigte ich mich während meines Studiums an der Hochschule der Bildenden Künste Saar in Saarbrücken intensiv mit Künstlicher Intelligenz, virtuellen Humanoiden, Mensch-Maschine-Interaktionen sowie den daraus resultierenden philosophischen und kulturellen Fragestellungen. Dabei setzte ich mich sowohl theoretisch als auch praktisch-künstlerisch mit den Grenzen und Missverständnissen im Umgang mit KI-Technologien auseinander.

In meiner Bachelorarbeit „Vergleich zwischen künstlicher und realer Intelligenz“ (2017, Abschlussnote 1.0) erforschte ich, wie digitale Avatare mittels genetischer Algorithmen Lernprozesse simulieren und verglich diese mit den realen Lern- und Schmerz-Erfahrungen eines menschlichen Performers. Die Performance „Learning“ nutzte dafür den optischen Pepper’s-Ghost-Effekt zur räumlichen Darstellung eines digitalen Charakters. Die Ergebnisse zeigten deutlich die emotionale Kluft zwischen technischer Simulation und menschlichem Erleben auf.

In meiner Masterarbeit erweiterte ich diesen Ansatz und beschäftigte mich vertieft mit der Wahrnehmung und Inszenierung von virtuellen Charakteren sowie deren Interaktionen mit Menschen. Unter anderem entstanden folgende Projekte:

Diese Projekte wurden begleitet von theoretischen Reflexionen zu Transparenz im Design, Black Box-Problematik, zufälligen und deterministischen Systemen sowie ethischen und philosophischen Dimensionen von KI. Inspiriert von Referenzen wie Frieder Nake, Andrew Glassner und Richard David Precht, setzte ich mich kritisch mit Begriffen und Missverständnissen rund um künstliche Intelligenz, künstliches Leben und Bewusstsein auseinander.

Aus meiner künstlerischen Forschung ergaben sich folgende zentrale Erkenntnisse:

Meine Arbeit zwischen 2015 und 2019 stellt somit eine vielseitige, kritische und innovative Auseinandersetzung mit Menschlichkeit, Technologie und ihren komplexen Beziehungen dar und möchte dazu beitragen, den öffentlichen Diskurs zu diesen Themen fundiert und reflektiert zu gestalten.

PS: Dieser Text wurde von einer KI generiert

Datenschutzerklärung Keks

Ein Keks wurde gespeichert. Sein Name ist "lang", er ist 6 Byte groß, drei Tage haltbar und technisch notwendig, da er sich merken kann, welche Sprache Sie wünschen. Tun Sie ihm nichts!