MurMur — Audio Bridge / Transcribe / Translate

MurMur ist eine Desktop-App, die Systemaudio in Echtzeit weiterleitet, transkribiert, ins Englische übersetzt und aufnimmt – komplett lokal, ohne Cloud-Abhängigkeit.

Mit einer einfachen Zwei-Fenster-Oberfläche lassen sich Spracheingaben automatisch erkennen und nahezu live als Text anzeigen. Optional wird gleichzeitig eine englische Übersetzung erzeugt.

Besonders praktisch: MurMur kann Desktop-Audio über virtuelle Ausgabegeräte wie BlackHole oder Loopback weiterleiten, die Lautstärke per virtuellem Gain anpassen und Aufnahmen direkt als MP3 exportieren. Ein kreativer Bonus-Use-Case ist die Kombination mit Shazam für Mac, um Songs vom Rechner zuverlässig zu identifizieren – ganz ohne Umgebungsgeräusche.

Alle Prozesse laufen lokal auf dem Rechner, wodurch maximale Datensouveränität und geringe Latenz gewährleistet sind.

Langsame Monduhr

Eine browserbasierte Uhr, die Jahr und Monat als Zifferblatt zeigt: außen alle Tage (Montage markiert), innen die zwölf Monate. Neumond (schwarz) und Vollmond (weiß) werden als kleine Kreise im aktuellen Monat eingezeichnet – gespeist aus einem 100-jährigen Datensatz.

Leichtgewichtiges HTML5-Canvas, kontinuierliche Tag-/Monatszeiger.

SRT Subtitle Translator


SRT Translator ist ein Desktop-Tool mit GUI und CLI zum präzisen Übersetzen von .srt-Untertiteln.

Es unterstützt drei Engines: NLLB (Meta “No Language Left Behind”) für geringe Systemanforderungen und solide Qualität, SeamlessM4T (Meta) für höhere Qualität bei moderatem Ressourcenbedarf, sowie einen experimentellen Modus über Ollama für lokal laufende LLMs (höchste Qualität, aber auch höchste Anforderungen).

Für den Ollama-Modus muss Ollama installiert und der Dienst gestartet sein; technisch Versierte können den Prompt direkt in der Python-Datei anpassen.

(NLLB: arXiv 2207.04672; SeamlessM4T: arXiv 2308.11596; Ollama: offizielles Repo.)

YouTube Summarizer

Mit diesem Desktop-Tool lassen sich YouTube-Videos in wenigen Klicks automatisiert transkribieren, zusammenfassen und in verschiedene Sprachen übersetzen – alles lokal und datenschutzkonform. Die Kernfunktionen sind:

Das Tool verbindet KI-gestützte Automatisierung mit nutzerfreundlichem Interface und bietet damit Mehrwert, um gezielt Informationen aus YouTube-Videos zu extrahieren und zu strukturieren.

Infinite Sound (Tavern Generator)

Infinite Sound ist ein Endlosmusikgenerierungstool, das mit Hilfe von Stable Audio Open beliebige Klänge auf Basis von Texteingaben erzeugt. Die Anwendung bietet eine minimalistische Benutzeroberfläche zur Eingabe von Stichworten, Steuerung der Lautstärke und Verwaltung von Aufnahmen. Audiosnippets werden konstant generiert und überblendet (Crossfade) und durch Aktivierung des “Record”-Modes lokal gespeichert.

Technisch basiert das Programm auf PyTorch, Stable Audio Tools und PyWebView und unterstützt sowohl CPU- als auch GPU-Beschleunigung (CUDA/MPS). Die für die Generierung notwendigen KI-Modelle werden beim ersten Start über Hugging Face heruntergeladen, wofür ein kostenloser Zugang und ein API-Token erforderlich sind.

SD 3D Model Generator


Der SD 3D Model Generator ist ein innovatives Kreativ-Tool, das die Lücke zwischen einfachen Texteingaben und vollständig ausgearbeiteten 3D-Assets für Game Development, Visualisierung und kreatives Prototyping schließt. Anders als klassische Stable Diffusion (SD) Frontends beschleunigt diese Anwendung den gesamten Workflow durch die Integration fortschrittlicher Large Language Models (LLMs):
Prompts werden automatisch optimiert, nahtlose (zum Thema passende) Environment-Maps generiert, Bilder der Objekte oder Charaktere werden generiert und in hochwertige 3D-Modelle umgewandelt – alles in einer intuitiven Oberfläche, in der man Bilder sowie 3D-Modelle mit Environment Map betrachten kann.

Was hebt das Tool hervor?


Features & User Experience



Technischer Überblick


Der SD 3D Model Generator vereinfacht den Weg von der Idee zum fertigen Asset radikal. Durch die Verbindung von LLMs, Stable Diffusion und automatisierten 3D-Workflows können Artists, Designer und Entwickler hochwertige Visuals schneller, flexibler und kreativer generieren, verwalten und weiterverarbeiten.

Auto-Git

Auto-Git ist eine plattformübergreifende Electron-App, die Git-Repos automatisch überwacht und verwaltet und mithilfe von LLMs Commit Messages und Dokumentationen / READMEs schreibt.

Alle Funktionen – von der kontinuierlichen, automatischen Commit-Erstellung bis hin zur vollautomatischen Push-und-Repo-Einrichtung auf Gitea – sind darauf ausgelegt, Entwicklern den Alltag zu erleichtern: Man fokussiert sich weiter auf Code, während Auto-Git im Hintergrund dafür sorgt, dass Commit-History, Dokumentation und Remote-Repositories stets auf dem neuesten Stand bleiben.

Virtuelles interdimensionales Geister-Teleportationsgerät

Das „Virtuelle Interdimensionale Geisterteleportationsgerät“ ist eine interaktive 3D-Webanwendung, die Figuren der japanischen Mythologie im Browser erscheinen lässt. Über eine digitale „Merkaba“ werden die Wesen in eine virtuelle Welt teleportiert, können betrachtet und per Klick in einem Infobox-Overlay erforscht werden.
Ein Portfolioprojekt, dessen Ziel ist es, über japanische Mythen auf deutsch lernen zu können und kulturelle Brücken zu schlagen.

Frontend: Three.js
Backend: Node.js, Express, Websocket
3D-Modelle: Hunyuan3D-2, Bearbeitung in Blender
Info-Texte: ChatGPT

Die 3D-Umgebung inklusive Models und Texturen, darunter eine 1200px x 900px Baumkronentextur und eine HDRI-Environment-Map, so wie der der Code sind insgesamt kleiner als 500 KiloByte.
Die 3D Modelle werden dynamisch geladen, der Client hat von ihnen keine Information bis der Server sie “pusht”. Die Kommunikation zum Server so wie die Funktion zum spawnen sind in den Spinner (Merkaba) integriert.
Mobile Darstellung ist weniger rechenintensiv als die Desktop-Version. Ein Adaptive-Fidelity-System wurde eingesetzt.

Script zur Buchdruckvorbereitung

Damit die Seiten eines Buches die korrekte Reihenfolge haben bedarf es ein wenig Mathematik. Um die “Signaturen” (Lagen) eines Buches richtig auszudrucken ist ansonsten Software notwendig, die man bezahlen kann – alternativ stelle ich ein Script zur Verfügung, welches genau das tut.

Es verarbeitet eine PDF, und erzeugt daraus eine neue PDF, welche man dann direkt per doppelseitigem Duplexdruck (vier Seiten pro Blatt – zwei vorne, zwei hinten) drucken kann.
Man kann einfach angeben wieviele Blätter man pro Lage binden möchte und das Script bereitet alles entsprechend vor.

Es verfügt auch über einen “Manga”-Modus, um Bücher, welche (nach westlichem Standard) “von hinten nach vorne” gelesen werden, für den Druck vorzubereiten, und über Parameter um Seitenränder zu trimmen.

スマートふりがな

Das Schriftzeichen 一日 kann gelesen werden als “いちにち” (“den ganzen Tag”), oder als ついたち (“der erste Tag des Monats”).
Je nach Kontext unterscheiden sich die Lesungen mancher Kanji.

Furigana sind eine japanische Lesehilfe. Es handelt sich dabei um Hiragana-Zeichen, die in der japanischen Schrift neben oder über einem Kanji geschrieben werden, um dessen Aussprache anzugeben.

Herkömmliche Furigana-Software erkennt die ganzheitliche Bedeutung, beziehungsweise den Kontext eines Textes nicht, und ist daher manchmal nicht in der Lage die Furigana so anzugeben, wie ein japanischer Leser den Text wirklich lesen würde.

Mit K.I. ist das nun allerdings möglich, weshalb ich diese Software programmiert habe.
“Smart-Furi” analysiert den Text auf Kontext, Umgangston, et cetera, um die passenden Lesungen dem Text als Furigana hinzuzufügen – damit man die Lesungen der Schriftzeichen nicht falsch lernt, sondern so, als ob eine japanische Person den Text (vor)lesen würde.

Datenschutzerklärung Keks

Ein Keks wurde gespeichert. Sein Name ist "lang", er ist 6 Byte groß, drei Tage haltbar und technisch notwendig, da er sich merken kann, welche Sprache Sie wünschen. Tun Sie ihm nichts!