SD 3Dモデルジェネレーターは、シンプルなテキスト入力と完全に作成された3Dアセットの間のギャップを埋める革新的なクリエイティブツールです。従来のStable Diffusion(SD)フロントエンドとは異なり、このアプリケーションは、先進的な大規模言語モデル(LLM)の統合により、全体のワークフローを加速します:プロンプトが自動的に最適化され、 シームレスな(テーマに適した)環境マップが生成され、オブジェクトやキャラクターの画像が生成され、高品質の3Dモデルに変換されます – すべてが直感的なインターフェース内で行われ、画像と3Dモデルを環境マップと共に表示できます。
このツールの特徴は何ですか?
プロンプトからアセットへ、エンドツーエンド: オブジェクト名やコンセプトを入力するだけで – システムがプロセスを案内し、LLMを使用してStable Diffusionのプロンプトを最適化し、スタイルの一貫性、クリエイティブな詳細、最適なフォーマットを確保します。
簡素化された3Dワークフロー: 生成された画像は、ワンクリックで3Dモデル(GLB)に変換できます。各アセットには、Blenderやゲームエンジンで直接使用できる個別のパノラマ環境(HDRI)を生成できます。
プロンプトの経験は不要: バックエンドのLLMが粗いアイデアを自動的にプロフェッショナルで詳細なプロンプトに変換します – これにより、時間を節約し、クリエイティブな負担を軽減します。
統合されたギャラリー&バッチ生成: 広範な画像とモデルのコレクションを、バッチ制御、ページナビゲーション、比較ビューを通じて効率的に管理できます。
機能とユーザーエクスペリエンス
簡単な入力、プロフェッショナルな結果: シンプルなオブジェクトタイトル(「ローポリ農夫」)で十分です – システムはLLMを利用してStable Diffusionのプロンプトを自動的に最適化し、常に最高の画像品質、構図、明瞭さを提供します。
リアルタイムストリーミング: LLMと画像生成の結果がインターフェースにライブでストリーミングされます – 透明性と迅速なフィードバックのために。
直感的なギャラリー: 2D画像と3Dモデル用の別々のタブベースのギャラリー – アセットを比較したり、バッチで管理したり、直接編集したりできます。コンテキストメニューにより、即時エクスポート、生成結果の再利用、または直接モデル/HDRIの作成が可能です。
自動3Dモデル作成: 生成された画像は、UIを介して直接3D GLBモデルに変換できます(外部ツール/スクリプトを通じて、柔軟に構成可能)。
自動環境マップ作成: 各モデルに対してカスタマイズされた、等方的HDRI環境を生成できます:LLMがまず適切な環境を説明し、その後SDが照明と反射のためのフォトリアリスティックなパノラマを生成します。
バッチ制御&プレースホルダー: バッチ画像生成、プレースホルダー管理、わかりやすい再生成をサポート – 現在の進捗を常に追跡可能にします。
ワンクリックエクスポートからBlenderへ: モデルとHDRIは、アプリケーションから直接Blenderで開いて編集できます。
技術的概要
フロントエンド:
純粋なHTML/CSS/JavaScript、PyWebviewを介してシームレスに統合され、Pythonバックエンドへの直接アクセスを提供します。
ギャラリー、タブ、コンテキストメニュー用の動的でレスポンシブなUIロジック。
LLM出力と画像生成ステータスのライブストリーミングをPython–JSブリッジを介して実現。
バックエンド:
PyWebviewとFastAPIに似たインターフェースに基づくPythonバックエンド。
自動プロンプト最適化と要約のためのOllamaまたはローカルLLMサーバーの統合(例:Mistral)。
Stable Diffusion(diffusersライブラリ)を介した画像生成、すべてのパラメータ(モデル、VAE、サンプラーなど)はユーザー側で構成可能または自動的に設定されます。
画像を3D(GLB)に変換し、HDRIパノラマを作成するための外部ツール/スクリプトはモジュール式で簡単に交換可能です。
自動ファイル管理、メタデータの埋め込み(PNGおよびサイドカー内のJSON)およびギャラリー内のライブ更新のためのアセットフォルダーの監視。
拡張性:
すべてのバックエンドプロセスは分離されており、スクリプト可能です:3D変換やHDRI作成は独自のパイプラインに簡単に置き換えることができます。
異なるLLM、SDモデル、または3Dワークフローに簡単に適応可能です。
SD 3Dモデルジェネレーターは、アイデアから完成したアセットへの道を根本的に簡素化します。LLM、Stable Diffusion、そして自動化された3Dワークフローを結びつけることで、アーティスト、デザイナー、開発者は高品質のビジュアルをより迅速、柔軟、創造的に生成、管理、再利用できます。
オートギット は、Gitリポジトリを自動的に監視・管理し、LLMを使用してコミットメッセージやドキュメント/READMEを作成するクロスプラットフォームのElectronアプリです。
監視と自動コミット
– 任意のフォルダをGitリポジトリとして追加: オートギットは必要に応じて初期Gitセットアップを行います。
– リアルタイムファイル監視(Chokidar): ファイルが変更されると、変更がデバウンス間隔で検出され、自動的にGitにコミットされます。
– インテリジェントなコミットメッセージ: 定義された行数または時間の閾値に達すると、オートギットはすべての新しいコミットを集め、その差分からOllama-LLM(qwen2.5-Coder)用のプロンプト最適化された入力を作成し、標準のコミットメッセージを意味的に簡潔な要約に置き換えます。
README生成とリポジトリ説明
– ボタン一つでまたは初回追加時: オートギットは関連するコードファイル(サイズ、関連スコア、.gitignoreルールに基づく)を抽出し、それをLLMプロンプトに供給して自動的に完全で良く構造化されたREADME.mdを作成または更新します。
– LLM支援の短い説明(≤ 255文字): 各フォルダに対して、オートギットは同じOllamaバックエンドを使用して数秒で一行のプロジェクト説明テキストを生成できます。
堅牢なフォルダ管理
– 欠落または移動したフォルダは自動的に検出され(「移動が必要」)、サイドバーアイコンをクリックすることで新しいパスを割り当て、元のGit状態を復元できます(コミットハッシュによる確認)。
– 簡単なドラッグ&ドロップサポート: フォルダをドラッグしてアプリに直接引き込み、すぐにGitリポジトリを初期化し、監視を開始します。
– .gitignore管理: 一般的な一時的/IDE/ビルドファイルは自動的に検出され(Micromatch + 事前定義されたパターン)、必要に応じて.gitignoreに追加されます。
Gitea統合とプッシュワークフロー
– 設定で個人のGitea APIトークンを保存できます。
– 「Giteaにプッシュ」をクリックすると、オートギットはリモートリポジトリが既に存在するかどうかを確認します:
存在しない → リポジトリを作成(LLM生成の短い説明付き)。
存在する → 現在の説明をPATCHで更新します。
– その後、ローカルリモートオリジンが再構成され、現在のブランチとタグが自動的にプッシュされます。
デスクトップUIと操作性
– ElectronとTailwindCSS : サイドバー(監視されているすべてのフォルダのフィルタリングリスト)、中央コンテンツエリア(すべてのコミットをページネーション表示、差分ビュー、スナップショットエクスポート、「ここにジャンプ」チェックアウトを含む)を持つレスポンシブインターフェース。
– スカイモード : 自動的な時間依存の背景(昼は柔らかい青、夜は暗い青)。
– トレイメニューとトレイアイコン : アプリがトレイに最小化され、トレイアイコンを右クリックすると、フォルダごとの監視の開始/停止、フォルダの追加/削除、「終了」が迅速に行えます。
– 設定ダイアログ :
> スカイテーマのオン/オフ
> 「トレイに閉じる」: アプリを実際に終了するのではなく、閉じるとウィンドウを隠します
> 自動起動の動作
> インテリジェントなコミット閾値(行数と分数)
> 使用するOllamaモデルの選択(コミット対README)
> Gitea APIトークンを保存
– ゲーミフィケーションとライブ統計 : コミットのための日次カウンター、色分けされた視覚化(「今日のコミット」)、次の自動LLMコミットまでのライブカウントダウン。
テクノロジースタック
– フロントエンド : Electron + HTML/CSS + TailwindCSS + 自作のミニマルアニメーション「アニメキャット」(クライアントサイドのキャットストリーミングLLM応答時)。
– バックエンド/Node :
> chokidarによるファイル監視
> simple-gitによるすべてのGit操作(初期化、ステータス、コミット、差分、リベース、プッシュ、リモート設定)
> micromatchとignoreによるファイル/フォルダのフィルタリング
> electron-storeによるすべての設定の永続化(Giteaトークン、スカイモード、閾値、モデル選択を含む)
> 自作のLLM統合: Ollamaサーバーの開始/停止、fetch(…).getReader()による並行ストリーム処理。
> トレイ/メニュー統合: ネイティブElectronメニューとサイドバー/ツリービューのコンテキストメニュー。
すべての機能 – 継続的な自動コミットの作成からGiteaへの完全自動プッシュおよびリポジトリ設定まで – は、開発者の日常を楽にするために設計されています: コードに集中し続ける一方で、オートギットはバックグラウンドでコミット履歴、ドキュメント、リモートリポジトリを常に最新の状態に保ちます。
「仮想次元間霊テレポーテーション装置」は、日本の神話のキャラクターをブラウザ上に表示するインタラクティブな3Dウェブアプリケーションです。デジタル「メルカバ」を通じて、これらの存在が仮想世界にテレポートされ、観察され、クリックすることで情報ボックスオーバーレイで探求できます。 このポートフォリオプロジェクトの目的は、日本の神話についてドイツ語で学び、文化的な架け橋を築くことです。
フロントエンド: Three.js バックエンド: Node.js, Express, Websocket 3Dモデル: Hunyuan3D-2, Blenderでの編集 情報テキスト: ChatGPT
すべての3D環境、モデル、テクスチャを含む、1200px x 900pxの樹冠テクスチャとHDRI環境マップを含め、全コードは500キロバイト未満です。3Dモデルは動的にロードされ、クライアントはサーバーが「プッシュ」するまでそれらに関する情報を持ちません。サーバーとの通信とスポーン機能はスピナー(メルカバ)に統合されています。 モバイル表示はデスクトップ版よりも計算負荷が少なく、アダプティブ・フィデリティ・システムも導入されています。
本のページが正しい順序になるためには、少し数学が必要です。「サイン」(層)を正しく印刷するためには、通常は有料のソフトウェアが必要ですが、代わりにそれを行うスクリプトを提供します。
それはPDFを処理し、新しいPDFを生成します。これを使って、両面のデュプレックス印刷(1枚の用紙に4ページ – 表2ページ、裏2ページ)を直接印刷できます。 1層あたり何枚の用紙を束ねたいかを簡単に指定でき、スクリプトはすべてを適切に準備します。
また、「マンガ」モードも備えており、西洋の基準で「後ろから前へ」読む書籍を印刷のために準備し、ページの余白をトリミングするためのパラメータもあります。
漢字の一日は「いちにち」(「一日中」)または「ついたち」(「月の初日」)と読むことができます。 文脈によっては、いくつかの漢字の読み方が異なります。
振り仮名は日本の読み助け です。これは、漢字の横または上に書かれ、その発音を示すためのひらがな文字です。
従来の振り仮名ソフトウェアは、テキストの全体的な意味や文脈を認識できず、日本の読者が実際にテキストを読むように振り仮名を正しく表示できないことがあります。
しかし、AIを使えばそれが可能になったため、このソフトウェアをプログラムしました。 「スマート振り」は、文脈、口調などを分析して、テキストに適切な読みを振り仮名として追加します – 漢字の読み方を間違って学ぶのではなく、日本の人がテキストを(前)読むかのように学べるようにします。
ユネスコプロジェクト「無形文化遺産」(ICH)は、無形文化遺産の印象的なコレクションと、効果的な保護措置の登録を提供しています。 これらはユネスコのウェブサイトで英語、フランス語、スペイン語で見つけることができ、世界の国々の個々の文化的特性を美しく説明しています。
オンライン民族学の友人として、私はインタラクティブな世界地図(JavaScript、OpenStreetMap & GeoJSON)という形で新しいインターフェースを設定しました。 国をクリックすると、ユネスコが登録したその国の文化にアクセスできます(ユネスコオープンアクセスデータベース)。 ChatGPT APIとPythonを使用して、私はデータベース全体を世界で最も話されている10の言語に翻訳しました。また、Topaz AIを使用してデータベース内のすべての画像を改善/拡大しました。
サイコロをクリックすると、ランダムな投稿が表示されます。 世界を発見しよう!注意 : モバイルビューには適していません
出典 :
ユネスコオープンアクセスデータベース:メタデータ、説明、画像はこのプロジェクトに使用されました。
OpenStreetMap:地図表示はOpenStreetMapのタイルに基づいています。
GeoJSON世界地図:国境のベクターデータはオープンソースのGeoJSONプロジェクトから取得されました。
IPAPI (ipapi.co):自動位置情報はAPIサービスipapi.coを通じて行われます。
Topaz AI:ユネスコデータベースの画像はTopaz AIでアップスケールされました。
ChatGPT (OpenAI):ユネスコデータの10言語への翻訳はChatGPTを使用して作成されました。
このプロジェクトは実験的な非商業ポートフォリオプロジェクトであり、デモンストレーション目的のみに使用されます。すべてのコンテンツ(画像、テキスト、タイトル)はユネスコの所有物です。翻訳はAI(ChatGPT)を使用して作成されました。地図タイルはOpenStreetMapから取得されています。ユネスコ、OpenStreetMap、または他の組織との関連はありません。完全なユネスコメタデータは英語でダウンロード可能です。
ページ、投稿、カスタムタイプの投稿、そのタイトルおよびカスタムフィールドを自動的に翻訳するためのWordpressプラグインです。 翻訳は投稿のメタデータに保存されます。 選択された言語に応じて、フロントエンドは同じURL / 投稿IDで言語を表示します。 グーテンベルクエディタには、言語を切り替えて個別の変更を行うための小さなドロップダウンメニューがあります。また、バックエンドでは、たとえばPolylangのように内容の不明瞭な複製はありません。 翻訳はChatGPTによって行われ、文脈に応じた翻訳が可能です – トーンがどのようであるべきか(例:丁寧またはカジュアル)、焦点を当てるべき内容(例:プロジェクトプレゼンテーション、マーケティングなど)を指定することで、より良い翻訳が得られます。
gitリポジトリには、コンテンツを選択して処理するためのコードが用意されています。