MurMur(ムルムル)— オーディオブリッジ/文字起こし/翻訳

MurMur(ムルムル)は、システム音声をリアルタイムでルーティング・文字起こし・英語翻訳・録音できる軽量デスクトップアプリです。クラウドに依存せず、すべてローカルで処理されます。

シンプルな2ペインのUIで、音声入力を自動的に認識し、ほぼリアルタイムでテキストとして表示します。オプションで同時に英語翻訳も生成できます。

さらに、BlackHoleLoopbackなどの仮想デバイスを利用してデスクトップ音声を自在にルーティングし、バーチャルゲインで音量を調整し、録音をMP3として直接書き出すことが可能です。ユニークな活用例として、Shazam for Macと組み合わせることで、PC上で再生している楽曲を周囲の雑音なしで正確に特定できます。

すべての処理はローカルで実行されるため、データの安全性低遅延を両立します。

SRT字幕翻訳ツール

SRT Translator は、.srt 字幕を正確に翻訳するための GUI と CLI を備えたデスクトップツールです。

対応エンジンは3種類です。NLLB(Meta「No Language Left Behind」)は動作要件が低く品質は堅実。SeamlessM4T(Meta)は中程度のリソースでより高品質。さらに、Ollama 経由のローカルLLMを使う実験的モードもあり、最高レベルの品質を狙えますが、必要なハードウェア要件も最も高くなります。

Ollama モードを使うには、Ollama をインストールしてサービスを起動しておく必要があります。上級ユーザーは Python ファイル内のプロンプトを直接調整できます。

(NLLB: arXiv 2207.04672;SeamlessM4T: arXiv 2308.11596;Ollama: 公式リポジトリ) 

YouTubeサマライザー

このデスクトップツールを使えば、YouTube動画を数クリックで自動的に文字起こし・要約し、さまざまな言語に翻訳できます。すべてローカルで処理され、プライバシーも守られます。主な機能は以下の通りです。

このツールはAIによる自動化と使いやすいインターフェースを融合し、YouTube動画から効率的に情報を抽出・整理したい方に大きな価値を提供します。

無限の音 (タバーンジェネレーター)

無限の音は、Stable Audioを使用してテキスト入力に基づいて任意の音を生成する無限音楽生成ツールです。このアプリケーションは、キーワードの入力、音量の制御、録音の管理のためのミニマリストなユーザーインターフェースを提供します。オーディオスニペットは常に生成され、クロスフェードで重ね合わされ、「録音」モードを有効にすることでローカルに保存されます。

技術的には、このプログラムはPyTorch、Stable Audio Tools、PyWebViewに基づいており、CPUおよびGPUアクセラレーション(CUDA/MPS)をサポートしています。生成に必要なAIモデルは、初回起動時にHugging Faceからダウンロードされ、無料のアクセスとAPIトークンが必要です。

SD 3Dモデルジェネレーター


SD 3Dモデルジェネレーターは、シンプルなテキスト入力と完全に作成された3Dアセットの間のギャップを埋める革新的なクリエイティブツールです。従来のStable Diffusion(SD)フロントエンドとは異なり、このアプリケーションは、先進的な大規模言語モデル(LLM)の統合により、全体のワークフローを加速します:
プロンプトが自動的に最適化され、 シームレスな(テーマに適した)環境マップが生成され、オブジェクトやキャラクターの画像が生成され、高品質の3Dモデルに変換されます – すべてが直感的なインターフェース内で行われ、画像と3Dモデルを環境マップと共に表示できます。

このツールの特徴は何ですか?


機能とユーザーエクスペリエンス



技術的概要


SD 3Dモデルジェネレーターは、アイデアから完成したアセットへの道を根本的に簡素化します。LLM、Stable Diffusion、そして自動化された3Dワークフローを結びつけることで、アーティスト、デザイナー、開発者は高品質のビジュアルをより迅速、柔軟、創造的に生成、管理、再利用できます。

オートギット

オートギットは、Gitリポジトリを自動的に監視・管理し、LLMを使用してコミットメッセージやドキュメント/READMEを作成するクロスプラットフォームのElectronアプリです。

すべての機能 – 継続的な自動コミットの作成からGiteaへの完全自動プッシュおよびリポジトリ設定まで – は、開発者の日常を楽にするために設計されています: コードに集中し続ける一方で、オートギットはバックグラウンドでコミット履歴、ドキュメント、リモートリポジトリを常に最新の状態に保ちます。

人工知能に関する研究 (2016-2019)

2015年から2019年まで、ザールブリュッケンのザール美術大学での学びの中で、人工知能、バーチャルヒューマノイド、人間と機械の相互作用、そしてそれに伴う哲学的および文化的な問題に深く取り組みました。この過程で、私は理論的にも実践的にも、AI技術との関わりにおける限界や誤解について考察しました。

私の学士論文「人工知能と実際の知能の比較」(2017年、最終成績1.0)では、デジタルアバターが遺伝的アルゴリズムを用いて学習プロセスをシミュレートする方法を探求し、これを人間のパフォーマーの実際の学習や痛みの経験と比較しました。パフォーマンス「Learning」では、デジタルキャラクターの空間表現に光学的なペッパーズゴースト効果を使用しました。その結果は、技術的なシミュレーションと人間の体験との間に明確な感情的隔たりがあることを示しました。

修士論文では、このアプローチをさらに発展させ、バーチャルキャラクターの認識と演出、そしてそれらが人間とどのように相互作用するかに深く取り組みました。その中で、以下のプロジェクトが生まれました:

これらのプロジェクトは、デザインにおける透明性、ブラックボックス問題、偶然性と決定論的システム、そしてAIの倫理的および哲学的次元に関する理論的な考察に伴って進められました。フリーダー・ナケ、アンドリュー・グラスナー、リチャード・デイヴィッド・プレヒトなどの参考文献に触発され、私は人工知能、人工生命、意識に関する用語や誤解について批判的に考察しました。

私の芸術的研究から得られた中心的な知見は以下の通りです:

2015年から2019年までの私の活動は、人間性、技術、そしてそれらの複雑な関係に対する多面的で批判的かつ革新的な取り組みを示しており、これらのテーマに関する公共の議論を確かなものにし、反映させることを目指しています。

プライバシーポリシー Keks

クッキーが保存されました。名前は「lang」、サイズは6バイト、保存期間は3日間で、どの言語を希望するかを記憶するために技術的に必要です。優しくしてね!