Software | Project Categories |

MurMur — Audio Bridge / Transcribe / Translate

MurMur ist eine Desktop-App, die Systemaudio in Echtzeit weiterleitet, transkribiert, ins Englische übersetzt und aufnimmt – komplett lokal, ohne Cloud-Abhängigkeit.

Mit einer einfachen Zwei-Fenster-Oberfläche lassen sich Spracheingaben automatisch erkennen und nahezu live als Text anzeigen. Optional wird gleichzeitig eine englische Übersetzung erzeugt.

Besonders praktisch: MurMur kann Desktop-Audio über virtuelle Ausgabegeräte wie BlackHole oder Loopback weiterleiten, die Lautstärke per virtuellem Gain anpassen und Aufnahmen direkt als MP3 exportieren. Ein kreativer Bonus-Use-Case ist die Kombination mit Shazam für Mac, um Songs vom Rechner zuverlässig zu identifizieren – ganz ohne Umgebungsgeräusche.

Alle Prozesse laufen lokal auf dem Rechner, wodurch maximale Datensouveränität und geringe Latenz gewährleistet sind.

Langsame Monduhr

Eine browserbasierte Uhr, die Jahr und Monat als Zifferblatt zeigt: außen alle Tage (Montage markiert), innen die zwölf Monate. Neumond (schwarz) und Vollmond (weiß) werden als kleine Kreise im aktuellen Monat eingezeichnet – gespeist aus einem 100-jährigen Datensatz.

Leichtgewichtiges HTML5-Canvas, kontinuierliche Tag-/Monatszeiger.

SRT Subtitle Translator

SRT Translator ist ein Desktop-Tool mit GUI und CLI zum präzisen Übersetzen von .srt-Untertiteln.

Es unterstützt drei Engines: NLLB (Meta “No Language Left Behind”) für geringe Systemanforderungen und solide Qualität, SeamlessM4T (Meta) für höhere Qualität bei moderatem Ressourcenbedarf, sowie einen experimentellen Modus über Ollama für lokal laufende LLMs (höchste Qualität, aber auch höchste Anforderungen).

Für den Ollama-Modus muss Ollama installiert und der Dienst gestartet sein; technisch Versierte können den Prompt direkt in der Python-Datei anpassen.

(NLLB: arXiv 2207.04672; SeamlessM4T: arXiv 2308.11596; Ollama: offizielles Repo.)

YouTube Summarizer

Mit diesem Desktop-Tool lassen sich YouTube-Videos in wenigen Klicks automatisiert transkribieren, zusammenfassen und in verschiedene Sprachen übersetzen – alles lokal und datenschutzkonform. Die Kernfunktionen sind:

Schneller Überblick: Inhalte von YouTube-Videos werden mittels KI automatisch erfasst, verschriftlicht und kompakt zusammengefasst.
Flexible Übersetzung: Die wichtigsten Informationen sind direkt in der eigenen oder gewünschten Sprache verfügbar.
Wissensarchiv: Alle transkribierten und übersetzten Zusammenfassungen werden inklusive Metadaten, Audio und Text durchsuchbar archiviert (SQLite).
Lokale Verarbeitung: Keine Cloud, keine Datenweitergabe, keine Anmeldung – volle Kontrolle über die eigenen Inhalte.
Praktischer Workflow: Ideal für Recherche, Notizen, Zitatsammlungen oder um Wissen aus Videos dauerhaft festzuhalten.

Das Tool verbindet KI-gestützte Automatisierung mit nutzerfreundlichem Interface und bietet damit Mehrwert, um gezielt Informationen aus YouTube-Videos zu extrahieren und zu strukturieren.

Infinite Sound (Tavern Generator)

Infinite Sound ist ein Endlosmusikgenerierungstool, das mit Hilfe von Stable Audio Open beliebige Klänge auf Basis von Texteingaben erzeugt. Die Anwendung bietet eine minimalistische Benutzeroberfläche zur Eingabe von Stichworten, Steuerung der Lautstärke und Verwaltung von Aufnahmen. Audiosnippets werden konstant generiert und überblendet (Crossfade) und durch Aktivierung des “Record”-Modes lokal gespeichert.

Technisch basiert das Programm auf PyTorch, Stable Audio Tools und PyWebView und unterstützt sowohl CPU- als auch GPU-Beschleunigung (CUDA/MPS). Die für die Generierung notwendigen KI-Modelle werden beim ersten Start über Hugging Face heruntergeladen, wofür ein kostenloser Zugang und ein API-Token erforderlich sind.

SD 3D Model Generator

Der SD 3D Model Generator ist ein innovatives Kreativ-Tool, das die Lücke zwischen einfachen Texteingaben und vollständig ausgearbeiteten 3D-Assets für Game Development, Visualisierung und kreatives Prototyping schließt. Anders als klassische Stable Diffusion (SD) Frontends beschleunigt diese Anwendung den gesamten Workflow durch die Integration fortschrittlicher Large Language Models (LLMs):
Prompts werden automatisch optimiert, nahtlose (zum Thema passende) Environment-Maps generiert, Bilder der Objekte oder Charaktere werden generiert und in hochwertige 3D-Modelle umgewandelt – alles in einer intuitiven Oberfläche, in der man Bilder sowie 3D-Modelle mit Environment Map betrachten kann.

Was hebt das Tool hervor?

Prompt-to-Asset, End-to-End: Geben Sie lediglich einen Objektnamen oder ein Konzept ein – das System führt Sie durch den Prozess, optimiert Ihren Prompt für Stable Diffusion per LLM und sorgt so für stilistische Konsistenz, kreative Details und optimale Formatierung.
Vereinfachter 3D-Workflow: Generierte Bilder lassen sich mit einem Klick in 3D-Modelle (GLB) umwandeln. Für jedes Asset kann zudem eine individuelle Panorama-Umgebung (HDRI) erzeugt werden, direkt nutzbar in Blender oder Game Engines.
Keine Prompt-Erfahrung nötig: Die LLMs im Backend wandeln grobe Ideen automatisch in professionelle, detaillierte Prompts um – das spart Zeit und reduziert den kreativen Aufwand.
Integrierte Galerie & Batch-Generierung: Umfangreiche Bilder- und Modellsammlungen lassen sich durch Batch-Steuerung, Seitennavigation und Vergleichsansicht effizient verwalten.

Features & User Experience

Einfache Eingabe, professionelles Ergebnis: Ein einfacher Objekttitel („low poly farmer“) genügt – das System nutzt LLMs, um die Stable Diffusion Prompts automatisch zu optimieren und liefert stets bestmögliche Bildqualität, Komposition und Klarheit.
Echtzeit-Streaming: LLM- und Bildgenerierungs-Ergebnisse werden live ins Interface gestreamt – für Transparenz und schnelles Feedback.
Intuitive Galerien: Separate, tab-basierte Galerien für 2D-Bilder und 3D-Modelle – Assets lassen sich vergleichen, im Batch verwalten oder direkt bearbeiten. Kontextmenüs ermöglichen Sofort-Export, Weiterverwendung von Generationsergebnissen oder direkte Modell-/HDRI-Erstellung.
Automatische 3D-Modellerstellung: Jedes generierte Bild kann direkt per UI in ein 3D-GLB-Modell konvertiert werden (über externe Tools/Skripte, flexibel konfigurierbar).
Automatische Environment Map-Erstellung: Zu jedem Modell lässt sich eine maßgeschneiderte, equirektangulare HDRI-Umgebung generieren: LLMs beschreiben zunächst eine passende Umgebung, anschließend erzeugt SD ein fotorealistisches Panorama für Beleuchtung und Reflektionen.
Batch-Steuerung & Platzhalter: Unterstützung für die Batch-Bilderstellung, Platzhalterverwaltung und übersichtliche Neu-Generierung – so bleibt der aktuelle Fortschritt immer nachvollziehbar.
One-Click Export zu Blender: Modelle und HDRIs können direkt aus der Anwendung in Blender geöffnet und weiterbearbeitet werden.

Technischer Überblick

Frontend:
- Pure HTML/CSS/JavaScript, nahtlos integriert per PyWebview für direkten Zugriff auf das Python-Backend.
- Dynamische, responsive UI-Logik für Galerie, Tabs und Kontextmenüs.
- Live-Streaming der LLM-Ausgaben und Bildgenerierungs-Status per Python–JS-Bridge.
Backend:
- Python-Backend auf Basis von PyWebview und einer FastAPI-ähnlichen Schnittstelle.
- Integration von Ollama oder lokalen LLM-Servern (z. B. Mistral) zur automatischen Prompt-Optimierung und -Zusammenfassung.
- Bildgenerierung via Stable Diffusion (diffusers library), alle Parameter (Modell, VAE, Sampler etc.) sind nutzerseitig konfigurierbar oder werden automatisch gesetzt.
- Externe Tools/Skripte für die Konvertierung von Bildern zu 3D (GLB) und zur Erstellung von HDRI-Panoramen sind modular und einfach austauschbar.
- Automatisches Dateimanagement, Metadaten-Einbettung (JSON in PNG und Sidecars) und Überwachung der Asset-Ordner für Live-Updates in der Galerie.
Extensibility:
- Jeder Backend-Prozess ist entkoppelt und skriptbar: Die 3D-Konvertierung oder HDRI-Erstellung kann leicht durch eigene Pipelines ersetzt werden.
- Einfach adaptierbar für unterschiedliche LLMs, SD-Modelle oder 3D-Workflows.

Der SD 3D Model Generator vereinfacht den Weg von der Idee zum fertigen Asset radikal. Durch die Verbindung von LLMs, Stable Diffusion und automatisierten 3D-Workflows können Artists, Designer und Entwickler hochwertige Visuals schneller, flexibler und kreativer generieren, verwalten und weiterverarbeiten.

Auto-Git

Auto-Git ist eine plattformübergreifende Electron-App, die Git-Repos automatisch überwacht und verwaltet und mithilfe von LLMs Commit Messages und Dokumentationen / READMEs schreibt.

Überwachung & automatisches Commit
- – Beliebige Ordner als Git-Repositories hinzufügen: Auto-Git übernimmt bei Bedarf das Initial-Git-Setup.
- – Echtzeit-File-Watching (Chokidar): Sobald sich Dateien ändern, werden Änderungen in einem Debounce-Intervall erkannt und automatisch in Git committet.
- – Intelligente Commit-Nachrichten: Sobald eine definierte Zeilen- oder Zeit-Schwelle erreicht ist, sammelt Auto-Git alle neuen Commits, erstellt aus ihren Diffs ein promptoptimiertes Input für einen Ollama-LLM (qwen2.5-Coder) und ersetzt die Standard-Commit-Nachrichten durch semantisch prägnante Zusammenfassungen.
README-Generierung & Repositoriumsbeschreibung
- – Auf Knopfdruck oder bei initialem Hinzufügen: Auto-Git extrahiert relevante Code-Dateien (nach Größe, Relevanzscore, .gitignore-Regeln) und füttert sie in einen LLM-Prompt, um automatisch ein vollständiges, gut strukturiertes README.md zu erstellen bzw. zu aktualisieren.
- – LLM-gestützte Kurz-Beschreibung (≤ 255 Zeichen): Für jeden Ordner kann Auto-Git mit Hilfe des selben Ollama-Backends in Sekundenbruchteilen einen einzeiligen Projektdescription-Text erzeugen.
Robuste Ordnerverwaltung
- – Fehlende bzw. verschobene Ordner werden automatisch erkannt („Needs Relocation“), per Klick auf das Sidebar-Icon kann man den neuen Pfad zuweisen und den ursprünglichen Git-State wiederherstellen (Prüfung via Commit-Hash).
- – Einfache Drag-&-Drop-Unterstützung: Ordner via Drag direkt in die App ziehen, sofort ein Git-Repo initialisieren und in Überwachung setzen.
- – .gitignore-Management: Typische temporäre/Ide-/Build-Dateien werden automatisch erkannt (Micromatch + vordefinierte Patterns) und bei Bedarf in .gitignore eingetragen.
Gitea-Integration & Push-Workflow
- – In den Einstellungen lässt sich ein persönlicher Gitea-API-Token hinterlegen.
- – Beim Klick auf „Push to Gitea“ prüft Auto-Git, ob das Remote-Repo schon existiert:
  1. Nicht vorhanden → Repository erstellen (mit LLM-Generierter Kurzbeschreibung).
  2. Vorhanden → Aktuelle Beschreibung per PATCH aktualisieren.
- – Anschließend wird das lokale Remote-Origin neu konfiguriert und der aktuelle Branch inklusive Tags automatisiert gepusht.
Desktop-UI & Bedienkomfort
- – Electron & TailwindCSS: Responsive Oberfläche mit Sidebar (gefilterte Liste aller überwachten Ordner), zentraler Inhaltsbereich (paginiert alle Commits anzeigen, inklusive Diff-View, Snapshot-Export und „Jump Here“-Checkout).
- – Sky-Mode: Automatischer Tageszeit-abhängiger Hintergrund (sanftes Blau bei Tag, dunkles Blau bei Nacht).
- – Tray-Menü & Tray-Icon: App minimiert auf Tray, Rechte-Maustaste auf Tray-Icon ermöglicht schnelles Starten/Stoppen des Monitorings pro Ordner, Ordner hinzufügen/entfernen, „Quit“.
- – Settings-Dialog:
  - > Sky-Theme ein/aus
  - > „Close to Tray“: Versteckt Fenster beim Schließen, statt App wirklich zu beenden
  - > Automatisches Autostart-Verhalten
  - > Intelligente Commit-Thresholds (Zeilen und Minuten)
  - > Auswahl der verwendeten Ollama-Modelle (commit vs. README)
  - > Gitea-API-Token hinterlegen
- – Gamification & Live-Statistik: Tageszähler für Commits, farblich ansteigende Visualisierung („Commits today“), Live-Countdown bis zum nächsten automatischen LLM-Commit.
Technologie-Stack
- – Frontend: Electron + HTML/CSS + TailwindCSS + ein eigenes minimal-animiertes „Anime Cat“ (Klient-seitiges Cat-Streaming bei LLM-Antworten).
- – Backend/Node:
  - > chokidar für File-Watching
  - > simple-git für alle Git-Operationen (Init, Status, Commit, Diff, Rebase, Push, Remote-Config)
  - > micromatch & ignore zum Filtern von Dateien/Ordnern
  - > electron-store für Persistenz aller Einstellungen (inklusive Gitea-Token, Skymode, Thresholds, modell-Auswahl)
  - > Eigene LLM-Integration: Start/Stop von Ollama-Server, paralleles Stream-Handling über fetch(…).getReader().
  - > Tray/Menu-Integration mit nativen Electron-Menüs und Kontext-Menüs in Sidebar/Treeview.

Alle Funktionen – von der kontinuierlichen, automatischen Commit-Erstellung bis hin zur vollautomatischen Push-und-Repo-Einrichtung auf Gitea – sind darauf ausgelegt, Entwicklern den Alltag zu erleichtern: Man fokussiert sich weiter auf Code, während Auto-Git im Hintergrund dafür sorgt, dass Commit-History, Dokumentation und Remote-Repositories stets auf dem neuesten Stand bleiben.

Virtuelles interdimensionales Geister-Teleportationsgerät

Das „Virtuelle Interdimensionale Geisterteleportationsgerät“ ist eine interaktive 3D-Webanwendung, die Figuren der japanischen Mythologie im Browser erscheinen lässt. Über eine digitale „Merkaba“ werden die Wesen in eine virtuelle Welt teleportiert, können betrachtet und per Klick in einem Infobox-Overlay erforscht werden.
Ein Portfolioprojekt, dessen Ziel ist es, über japanische Mythen auf deutsch lernen zu können und kulturelle Brücken zu schlagen.

Frontend: Three.js
Backend: Node.js, Express, Websocket
3D-Modelle: Hunyuan3D-2, Bearbeitung in Blender
Info-Texte: ChatGPT

Die 3D-Umgebung inklusive Models und Texturen, darunter eine 1200px x 900px Baumkronentextur und eine HDRI-Environment-Map, so wie der der Code sind insgesamt kleiner als 500 KiloByte.
Die 3D Modelle werden dynamisch geladen, der Client hat von ihnen keine Information bis der Server sie “pusht”. Die Kommunikation zum Server so wie die Funktion zum spawnen sind in den Spinner (Merkaba) integriert.
Mobile Darstellung ist weniger rechenintensiv als die Desktop-Version. Ein Adaptive-Fidelity-System wurde eingesetzt.

Script zur Buchdruckvorbereitung

Damit die Seiten eines Buches die korrekte Reihenfolge haben bedarf es ein wenig Mathematik. Um die “Signaturen” (Lagen) eines Buches richtig auszudrucken ist ansonsten Software notwendig, die man bezahlen kann – alternativ stelle ich ein Script zur Verfügung, welches genau das tut.

Es verarbeitet eine PDF, und erzeugt daraus eine neue PDF, welche man dann direkt per doppelseitigem Duplexdruck (vier Seiten pro Blatt – zwei vorne, zwei hinten) drucken kann.
Man kann einfach angeben wieviele Blätter man pro Lage binden möchte und das Script bereitet alles entsprechend vor.

Es verfügt auch über einen “Manga”-Modus, um Bücher, welche (nach westlichem Standard) “von hinten nach vorne” gelesen werden, für den Druck vorzubereiten, und über Parameter um Seitenränder zu trimmen.

スマートふりがな

Das Schriftzeichen 一日 kann gelesen werden als “いちにち” (“den ganzen Tag”), oder als ついたち (“der erste Tag des Monats”).
Je nach Kontext unterscheiden sich die Lesungen mancher Kanji.

Furigana sind eine japanische Lesehilfe. Es handelt sich dabei um Hiragana-Zeichen, die in der japanischen Schrift neben oder über einem Kanji geschrieben werden, um dessen Aussprache anzugeben.

Herkömmliche Furigana-Software erkennt die ganzheitliche Bedeutung, beziehungsweise den Kontext eines Textes nicht, und ist daher manchmal nicht in der Lage die Furigana so anzugeben, wie ein japanischer Leser den Text wirklich lesen würde.

Mit K.I. ist das nun allerdings möglich, weshalb ich diese Software programmiert habe.
“Smart-Furi” analysiert den Text auf Kontext, Umgangston, et cetera, um die passenden Lesungen dem Text als Furigana hinzuzufügen – damit man die Lesungen der Schriftzeichen nicht falsch lernt, sondern so, als ob eine japanische Person den Text (vor)lesen würde.

Datenschutzerklärung

Ein Keks wurde gespeichert. Sein Name ist "lang", er ist 6 Byte groß, drei Tage haltbar und technisch notwendig, da er sich merken kann, welche Sprache Sie wünschen. Tun Sie ihm nichts!