MurMur(ムルムル)— オーディオブリッジ/文字起こし/翻訳

MurMur(ムルムル)は、システム音声をリアルタイムでルーティング・文字起こし・英語翻訳・録音できる軽量デスクトップアプリです。クラウドに依存せず、すべてローカルで処理されます。

シンプルな2ペインのUIで、音声入力を自動的に認識し、ほぼリアルタイムでテキストとして表示します。オプションで同時に英語翻訳も生成できます。

さらに、BlackHoleLoopbackなどの仮想デバイスを利用してデスクトップ音声を自在にルーティングし、バーチャルゲインで音量を調整し、録音をMP3として直接書き出すことが可能です。ユニークな活用例として、Shazam for Macと組み合わせることで、PC上で再生している楽曲を周囲の雑音なしで正確に特定できます。

すべての処理はローカルで実行されるため、データの安全性低遅延を両立します。

月めぐり時計

年と月を文字盤に見立てたブラウザ型の時計。外周にすべての日付(毎週月曜を強調)、内側に12か月を配置。新月(黒)と満月(白)を当月内に小さな円で表示し、100年分のデータセットに基づいています。

軽量な HTML5 Canvas 実装で、日針・月針が連続的に動きます。

YouTubeサマライザー

このデスクトップツールを使えば、YouTube動画を数クリックで自動的に文字起こし・要約し、さまざまな言語に翻訳できます。すべてローカルで処理され、プライバシーも守られます。主な機能は以下の通りです。

このツールはAIによる自動化と使いやすいインターフェースを融合し、YouTube動画から効率的に情報を抽出・整理したい方に大きな価値を提供します。

無限の音 (タバーンジェネレーター)

無限の音は、Stable Audioを使用してテキスト入力に基づいて任意の音を生成する無限音楽生成ツールです。このアプリケーションは、キーワードの入力、音量の制御、録音の管理のためのミニマリストなユーザーインターフェースを提供します。オーディオスニペットは常に生成され、クロスフェードで重ね合わされ、「録音」モードを有効にすることでローカルに保存されます。

技術的には、このプログラムはPyTorch、Stable Audio Tools、PyWebViewに基づいており、CPUおよびGPUアクセラレーション(CUDA/MPS)をサポートしています。生成に必要なAIモデルは、初回起動時にHugging Faceからダウンロードされ、無料のアクセスとAPIトークンが必要です。

SD 3Dモデルジェネレーター


SD 3Dモデルジェネレーターは、シンプルなテキスト入力と完全に作成された3Dアセットの間のギャップを埋める革新的なクリエイティブツールです。従来のStable Diffusion(SD)フロントエンドとは異なり、このアプリケーションは、先進的な大規模言語モデル(LLM)の統合により、全体のワークフローを加速します:
プロンプトが自動的に最適化され、 シームレスな(テーマに適した)環境マップが生成され、オブジェクトやキャラクターの画像が生成され、高品質の3Dモデルに変換されます – すべてが直感的なインターフェース内で行われ、画像と3Dモデルを環境マップと共に表示できます。

このツールの特徴は何ですか?


機能とユーザーエクスペリエンス



技術的概要


SD 3Dモデルジェネレーターは、アイデアから完成したアセットへの道を根本的に簡素化します。LLM、Stable Diffusion、そして自動化された3Dワークフローを結びつけることで、アーティスト、デザイナー、開発者は高品質のビジュアルをより迅速、柔軟、創造的に生成、管理、再利用できます。

オートギット

オートギットは、Gitリポジトリを自動的に監視・管理し、LLMを使用してコミットメッセージやドキュメント/READMEを作成するクロスプラットフォームのElectronアプリです。

すべての機能 – 継続的な自動コミットの作成からGiteaへの完全自動プッシュおよびリポジトリ設定まで – は、開発者の日常を楽にするために設計されています: コードに集中し続ける一方で、オートギットはバックグラウンドでコミット履歴、ドキュメント、リモートリポジトリを常に最新の状態に保ちます。

仮想次元間霊テレポーテーション装置

「仮想次元間霊テレポーテーション装置」は、日本の神話のキャラクターをブラウザ上に表示するインタラクティブな3Dウェブアプリケーションです。デジタル「メルカバ」を通じて、これらの存在が仮想世界にテレポートされ、観察され、クリックすることで情報ボックスオーバーレイで探求できます。
このポートフォリオプロジェクトの目的は、日本の神話についてドイツ語で学び、文化的な架け橋を築くことです。

フロントエンド: Three.js
バックエンド: Node.js, Express, Websocket
3Dモデル: Hunyuan3D-2, Blenderでの編集
情報テキスト: ChatGPT

すべての3D環境、モデル、テクスチャを含む、1200px x 900pxの樹冠テクスチャとHDRI環境マップを含め、全コードは500キロバイト未満です。3Dモデルは動的にロードされ、クライアントはサーバーが「プッシュ」するまでそれらに関する情報を持ちません。サーバーとの通信とスポーン機能はスピナー(メルカバ)に統合されています。
モバイル表示はデスクトップ版よりも計算負荷が少なく、アダプティブ・フィデリティ・システムも導入されています。

ユネスコの無形文化遺産リスト向けインターフェース

ユネスコプロジェクト「無形文化遺産」(ICH)は、無形文化遺産の印象的なコレクションと、効果的な保護措置の登録を提供しています。
これらはユネスコのウェブサイトで英語、フランス語、スペイン語で見つけることができ、世界の国々の個々の文化的特性を美しく説明しています。

オンライン民族学の友人として、私はインタラクティブな世界地図(JavaScript、OpenStreetMap & GeoJSON)という形で新しいインターフェースを設定しました。
国をクリックすると、ユネスコが登録したその国の文化にアクセスできます(ユネスコオープンアクセスデータベース)。
ChatGPT APIとPythonを使用して、私はデータベース全体を世界で最も話されている10の言語に翻訳しました。また、Topaz AIを使用してデータベース内のすべての画像を改善/拡大しました。

サイコロをクリックすると、ランダムな投稿が表示されます。
世界を発見しよう!

注意: モバイルビューには適していません

出典:

このプロジェクトは実験的な非商業ポートフォリオプロジェクトであり、デモンストレーション目的のみに使用されます。すべてのコンテンツ(画像、テキスト、タイトル)はユネスコの所有物です。翻訳はAI(ChatGPT)を使用して作成されました。地図タイルはOpenStreetMapから取得されています。ユネスコ、OpenStreetMap、または他の組織との関連はありません。完全なユネスコメタデータは英語でダウンロード可能です。

AI-翻訳

ページ、投稿、カスタムタイプの投稿、そのタイトルおよびカスタムフィールドを自動的に翻訳するためのWordpressプラグインです。
翻訳は投稿のメタデータに保存されます。
選択された言語に応じて、フロントエンドは同じURL / 投稿IDで言語を表示します。
グーテンベルクエディタには、言語を切り替えて個別の変更を行うための小さなドロップダウンメニューがあります。また、バックエンドでは、たとえばPolylangのように内容の不明瞭な複製はありません。
翻訳はChatGPTによって行われ、文脈に応じた翻訳が可能です – トーンがどのようであるべきか(例:丁寧またはカジュアル)、焦点を当てるべき内容(例:プロジェクトプレゼンテーション、マーケティングなど)を指定することで、より良い翻訳が得られます。

gitリポジトリには、コンテンツを選択して処理するためのコードが用意されています。

グリッチアート

意図的に引き起こされたデジタル画像のエラーによって生成される、色鮮やかで抽象的なテクスチャです。

2015年10月、Facebookの「Glitch Artist Collective」グループに参加し、そのサブグループ「Glitch//Request」で、主にセルフィーなどの人物写真がグリッチアートとして加工される様子を拝見しました。この活発な交流がきっかけとなり、私自身もグリッチ・アートに挑戦するようになりました。

以降、Processingを用いてフラグメントシェーダーやコントローラーをプログラミングし、画像のエラー(グリッチ)を人工的に生成する手法を開発しました。これにより、従来の画像編集とは一線を画した、全く新しい抽象的な画像が生み出されています。元画像はデータソースとして使用され、その過程で生まれる変化は、それぞれ独自のキャラクターを持っています。

私が自作したソフトウェアユニット「Manglr」は、2Dシェーダーのためのコンポジターとして機能します。(作業アーカイブへのリンクがあります)

このツールでは、画像や動画ファイルをドラッグ&ドロップで投入し、どのシェーダーがどのパラメーターで画像を変化させるかを指定できます。選択は自動またはランダムに行うことも可能で、シェーダーのパラメーターは時間経過とともにゆっくりと変化し、シェーダー自体がアニメーションします。

自動操縦モードを観察するか、またはコントローラーを手動で操作してお気に召すコンポジションができたところで、画像を保存します。解像度は自由に設定でき、最大では長辺20,000ピクセル(300DPIで約1.70m相当)まで可能です。シェーダーによっては、より多くの計算時間が必要となる場合もございます。小さい画像(最大20センチメートル)であれば、リアルタイムでアニメーション生成が可能(秒間24枚以上)です。また、一部の作品ではピクセル美学が際立ち、低解像度の画像を大きく拡大しても魅力が損なわれません。

その後、保存した画像群を再度吟味し、優れた作品を選別するプロセスを経ています。

各プリントはサイン入りで、限定版(1~4エディション)として提供しております。

高品質な合成紙は、シュヴァーベン・ギュムントのPrade社製で、100%プラスチック製です。使用される素材とインクは耐久性にも優れております。

表示価格には7%の消費税およびDHLの送料が含まれております。

プライバシーポリシー Keks

クッキーが保存されました。名前は「lang」、サイズは6バイト、保存期間は3日間で、どの言語を希望するかを記憶するために技術的に必要です。優しくしてね!