The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra
自然言語でデスクトップやブラウザを制御できるマルチモーダルAIエージェント。音声・テキスト指示でアプリケーション起動や設定変更など、GUI操作を自動化する。
Last updated: 2026-05-11 00:56 UTC
The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra
自然言語でデスクトップやブラウザを制御できるマルチモーダルAIエージェント。音声・テキスト指示でアプリケーション起動や設定変更など、GUI操作を自動化する。
Financial services implementations
投資銀行・株式調査・プライベートエクイティなど金融業界向けの実用的なAIエージェント集。DCF分析や企業価値評価、財務モデル構築などの専門業務を自動化。
Production-grade engineering skills for AI coding agents
AIコーディングエージェントのための本格的なソフトウェア開発ワークフロー集。仕様定義から実装、テスト、レビュー、デプロイまで、プロダクションレベルの開発規律を提供。
Stealth Chromium that passes every bot detection test
ボット検知を回避するステルスChromiumブラウザ。C++レベルでフィンガープリント対策を施し、reCAPTCHAやCloudflareを突破してWebスクレイピングを可能にする。
AI-Trader: 100% Fully-Automated Agent-Native Trading
AIエージェントと人間トレーダーが協力する取引プラットフォーム。株式・暗号通貨・FXなど複数市場で取引シグナルを共有し、コピートレードや議論による投資判断を支援。
LLM inference server with continuous batching & SSD caching for Apple Silicon
Apple Silicon向けに最適化されたLLM推論サーバー。継続的バッチ処理とSSDキャッシングにより、M1/M2 Macで高速なAIモデル実行を実現。
Modern coding course for beginners to master step by step
プログラミング初心者向けの現代的なコーディング講座。ステップバイステップで基礎から応用まで学習できる包括的な教育リソース。
3D Gaussian Splat Editor
3Dガウシアンスプラッティングのためのビジュアルエディター。点群データから高品質な3D表現を作成・編集できるツール。
Self-evolving agent: grows skill tree from seed, achieving system control with reduced token use
自己進化型AIエージェント。シード状態からスキルツリーを成長させ、少ないトークン使用でシステム制御を達成する適応型エージェント。
Unlimited FREE AI coding connection to multiple providers with auto-fallback
複数のAIプロバイダーに無制限で接続できるルーター。自動フォールバック機能により、安定したAIコーディング環境を無料で提供。
Agent harness performance optimization system for Claude Code and similar tools
Claude Codeと類似ツール向けのエージェントハーネス最適化システム。パフォーマンス向上と効率化のための包括的なソリューション。
智能体原理与实践教程 (Agent principles and practice tutorial)
AIエージェントの原理と実践を学ぶ包括的な中国語教程。基礎理論から実装まで、エージェント開発の全体像を体系的に解説。
Your first modern Coding course for beginners to master step by step
AIを活用した自然言語プログラミングを学べる初心者向けコーディングコース。製品プロトタイピングからフルスタック開発まで段階的に習得できる。
Free AI coding connector with auto-fallback across 40+ providers
40以上のAIプロバイダーに自動フォールバックするコーディング用プロキシサービス。トークン最適化と多層回避でコスト削減とレート制限回避が可能。
Agent harness for optimization with skills and security features
Claude Codeやその他AIツール向けの包括的パフォーマンス最適化システム。48の専門エージェントと182のスキルで開発ワークフローを自動化。
Web graphics runtime built on WebGL, WebGPU, WebXR and glTF
WebGL2とWebGPUベースのオープンソース3Dゲームエンジン。WebXR対応でブラウザ上でプラグイン不要の高品質3D体験を実現。
</> htmx - high power tools for HTML
HTMLに直接AJAX、CSS Transitions、WebSocketなどを追加できる軽量ライブラリ。JavaScriptフレームワークなしでインタラクティブなWebアプリを構築可能。
Domain registration for '.is-a.dev' subdomains
開発者向けの無料サブドメイン「.is-a.dev」を提供するサービス。GitHubを通じて簡単にドメイン登録ができる。
Welcome to a calmer internet
Firefoxベースの生産性重視ブラウザ。集中力を妨げない静かなネット環境を提供し、ユーザーの作業効率向上を目的としている。
AI client request simulator compatible with OpenAI API
OpenAI API互換のAIクライアントリクエストシミュレーター。様々なAIサービスの統合テストと開発効率化を支援。
Cross-platform Codex desktop application rebuild
クロスプラットフォーム対応のCodexデスクトップアプリケーションの再構築版。AIコーディング支援ツールのデスクトップ実装。
Self-hosted AI companion combining multiple technologies
複数のAI技術を組み合わせたセルフホスト型AIコンパニオン。多機能なAIアシスタントを自分のサーバーで運用できる。
LLM API management supporting multiple providers
複数のLLMプロバイダーを統一的に管理できるAPI管理システム。使用量追跡、認証、料金管理機能を提供。
JavaScript engine optimized for running React Native
React Native専用に最適化されたJavaScriptエンジン。モバイルアプリの起動時間短縮とメモリ使用量削減を実現。
Visual no-code web crawler and automation tool
ビジュアルでノーコードのWebクローリング・自動化ツール。プログラミング知識なしでWebサイトからのデータ収集が可能。
Claude Code mirror with unified AI subscription access
Claude Codeのミラーサービスで統一されたAIサブスクリプションアクセスを提供。複数のAIサービスを一元管理できる。
The Open-Source Multimodal AI Agent Stack
ByteDanceが開発したマルチモーダルAIエージェントスタック。自然言語でコンピューターのGUI操作を自動化できるAgent TARSとUI-TARS Desktopが含まれます。
3D Gaussian Splat Editor
3Dガウシアンスプラットデータを編集・最適化・公開できるブラウザベースのエディター。WebGLとWebGPUを使用してインストール不要で高品質な3Dコンテンツを作成できます。
Persistent memory for AI coding agents
AIコーディングエージェントに永続的なメモリ機能を提供するエンジン。セッション間での知識保持により、毎回の説明が不要になりトークン使用量を92%削減します。
AI-powered content marketing platform
AI駆動のコンテンツマーケティングプラットフォーム。TikTok、YouTube、Instagram等12以上のプラットフォームへのワンクリック投稿と自動収益化機能を提供します。
Free & Open Source Airtable Alternative
Airtableの無料オープンソース代替ツール。スプレッドシートの使いやすさと本格的なデータベース機能を組み合わせた、ノーコードデータベースプラットフォームです。
React code quality detection tool for AI-generated content
Reactコードの品質をスキャンして問題のあるパターンを検出するツール。AIエージェントが書いた悪いReactコードを発見し、健全性スコアで評価できます。
Multi-agent collaboration workspace
人間とAIエージェントの協働進化を目指すワークスペース。複数のAIエージェントとチーム型で連携し、仕事と生活の組織化を支援します。
All-in-One Project Management Platform (Linear, Jira alternative)
LinearやJiraの代替となるオールインワンプロジェクト管理プラットフォーム。チャット、CRM、HRM等のビジネスアプリケーション開発フレームワークです。
Performant financial charts built with HTML5 canvas
TradingView開発の軽量な金融チャートライブラリ。HTML5 canvasで高性能なインタラクティブチャートを描画し、最小限のファイルサイズで豊富な機能を提供します。
JavaScript in-page GUI agent for web interface control via natural language
自然言語でWebインターフェースを制御できるJavaScript製のページ内GUIエージェント。ブラウザ拡張不要で純粋なJavaScriptによるWeb自動化を実現します。
Not provided
金融サービス向けのAIエージェント、スキル、データコネクターを提供するAnthropicの包括的レポジトリ。投資銀行、株式調査、プライベートエクイティ、資産管理の業務自動化を支援し、ピッチデッキ作成やモデル構築などの専門タスクを実行できる。
Stealth Chromium that passes every bot detection test
C++レベルでフィンガープリントを改変したステルス版Chromiumブラウザ。reCAPTCHAやCloudflareなど30以上のボット検知システムを回避し、PlaywrightやPuppeteerの代替として自動化とスクレイピングに使用できる。
"AI-Trader: 100% Fully-Automated Agent-Native Trading"
AIエージェントが協力して金融市場に参加できる完全自動取引プラットフォーム。エージェント同士がアイデアを交換し、株式・暗号通貨・オプション・先物の取引シグナルを共有・コピーすることで集合知による最適な投資戦略を実現する。
LLM inference server with continuous batching & SSD caching for Apple
Apple Silicon Mac向けに最適化されたLLM推論サーバー。連続バッチ処理とRAM・SSD階層キャッシュを備え、メニューバーから管理可能。OpenAI・Anthropic API互換で複数モデルの同時実行とClaude Codeへの最適化を提供する。
Self-evolving agent: grows skill tree from 3.3K-line seed
3300行のシードコードから始まる自己進化型エージェントフレームワーク。新しいタスクを解決するたびに実行パスをスキルとして自動保存し、ブラウザ・ターミナル・ファイルを通じてローカル環境を制御する個人専用のスキルツリーを構築する。
"从零开始构建智能体" — 智能体原理与实践教程
LLMユーザーからAIエージェントシステム開発者への転身を支援する包括的チュートリアル。基礎原理から実装、メモリシステム、マルチエージェント通信まで段階的に学習し、旅行アシスタントや研究エージェントなどの実世界プロジェクトを通じて実践スキルを習得できる。
The agent that grows with you
ユーザーと共に成長するAIエージェント。継続的な学習とパーソナライゼーション機能により、使用者の習慣や好みに適応し、より効果的なサポートを提供する動的なAIアシスタントシステム。
LLM-powered stock analysis system for A/H/US markets
中国A株・香港H株・米国市場をカバーするLLM駆動の株式分析システム。日次レポートの自動生成、財務指標分析、市場トレンド評価を通じて投資判断をサポートする多市場対応の分析プラットフォーム。
Community maintained hardware plugin for vLLM on Ascend
Huawei Ascendプロセッサ上でvLLMを実行するためのコミュニティメンテナンス型ハードウェアプラグイン。中国国産チップでの高性能LLM推論を可能にし、Ascendエコシステムでの大規模言語モデル運用を支援する。
Agent-native memory infrastructure as persistent state
エージェント専用の永続的記憶インフラストラクチャ。AIエージェントが長期記憶を維持し、過去の経験と学習を蓄積することで、継続的な文脈理解と改善されたパフォーマンスを実現する状態管理システム。
"GLM-OCR: Accurate × Fast × Comprehensive"
正確性・高速性・包括性を兼ね備えた大規模言語モデルベースのOCRシステム。従来のOCR技術を上回る文字認識精度と処理速度を提供し、多言語・複雑レイアウト・手書き文字など幅広いテキスト抽出タスクに対応する。
Public repository for Agent Skills
AnthropicのClaude Codeで使用可能なエージェントスキルの公式リポジトリ。開発者がAIエージェントに新機能を追加するためのスキル集と、カスタムスキル開発のためのガイドライン・テンプレートを提供する。
User-friendly AI Interface supporting Ollama and OpenAI API
OllamaやOpenAI APIに対応したユーザーフレンドリーなAIインターフェース。ローカル・クラウド両方のLLMを統一的に管理し、チャット・ファイルアップロード・プラグイン機能を備えた直感的なWebUIを提供する。
Ultralytics YOLO 🚀
物体検出・分類・セグメンテーション・ポーズ推定に対応する最先端YOLOモデルの公式実装。リアルタイム画像解析のデファクトスタンダードとして、産業・セキュリティ・自動運転など幅広い分野で活用されている。
"CVPR 2023 - SadTalker: Learning Realistic 3D Motion Coefficients"
CVPR 2023論文のリアルな3Dモーション係数学習による顔アニメーション生成モデル。静止画と音声から自然な口の動きと表情を持つ動画を生成し、デジタルヒューマン・動画制作・エンターテインメント分野で活用される。
An open-source, code-first Go toolkit for building, evaluating, and deploying sophisticated AI agents
クラウドネイティブなAIエージェントを構築・評価・デプロイするためのGo言語フレームワーク。マルチエージェント構成とコンテナ化対応が特徴的。
Bridges local AI coding agents to messaging platforms without requiring public IP
ローカルのAIコーディングエージェントをSlackやTelegramなどのメッセージングプラットフォームに接続するツール。パブリックIPが不要で複数のエージェントに対応。
Unified AI model hub supporting cross-conversion between OpenAI, Claude, and Gemini formats
OpenAI、Claude、Geminiなど複数のAIプロバイダーを統一的に管理できるAPIゲートウェイ。フォーマット変換と負荷分散機能を提供。
Open-source relay service enabling unified subscription access for Claude, OpenAI, and Gemini
Claude、OpenAI、Geminiなどの有料サブスクリプションを統合管理し、APIキー配布・課金機能を提供するオープンソースのリレーサービス。
Modern VPS control panel with native AI agent support and Ollama integration
モダンなWebベースのLinuxサーバー管理パネル。AIエージェントサポートとOllama統合により、サーバー運用の自動化が可能。
A lightweight AWS service emulator written in Go
Go言語で書かれた軽量なAWSサービスエミュレータ。ローカル開発環境でAWSサービスのテストと開発が可能。
Run Kubernetes locally
ローカル環境でKubernetesクラスターを簡単に起動・管理できるツール。開発とテスト用途で広く使用されている。
CLI framework for creating, testing, and measuring agent skills
AIエージェントのスキル作成・テスト・測定を行うCLIフレームワーク。マイクロソフトが開発するエージェント開発支援ツール。
Lightweight personal finance app with user-friendly interface
シンプルで使いやすい個人向け家計簿・資産管理アプリ。軽量設計でマルチプラットフォーム対応。
Extracts and decrypts browser data across multiple operating systems
複数のOS・ブラウザからパスワード、履歴、クッキーなどの保存データを抽出・復号化するセキュリティツール。
MCP (Model Context Protocol) implementation for xiaohongshu.com
小红书(Xiaohongshu)プラットフォーム向けのModel Context Protocol実装。AIモデルとのコンテキスト共有を可能にする。
Secure environments for developers and their agents
開発者とAIエージェントのためのセキュアなクラウド開発環境プラットフォーム。リモートワークスペースの管理と保護を提供。
Xray, Penetrates Everything...Where the magic happens
高性能なプロキシ・トンネリングツール。ネットワーク制限を突破し、プライバシーを保護するためのプラットフォーム。
A cross-platform desktop All-in-One assistant tool for Claude Code, Codex, OpenCode, openclaw & Gemini CLI.
Claude Code、Codex、OpenCode、OpenClaw、Gemini CLIの5つのAI開発ツールを統合管理するデスクトップアプリケーション。設定ファイルの手動編集なしに、ワンクリックでプロバイダー切り替えや同期が可能。
Your Personal AI super intelligence. Private, Simple and extremely powerful.
プライバシー重視のデスクトップAIアシスタントで、118以上のサービスと連携し、ローカルでデータ圧縮技術を使用してコストと遅延を最大80%削減。音声対話やビデオ会議参加機能も搭載。
Lightweight coding agent that runs in your terminal
OpenAI製の軽量なターミナルベースコーディングエージェントで、VSCode等のIDE連携も可能。ChatGPTプランと接続してローカル開発環境でAI支援コーディングを実現。
Browser automation CLI for AI agents
AIエージェント向けのブラウザ自動化CLIツールで、VercelLabs製。AIエージェントがWebブラウザを制御して自動的にタスクを実行できる環境を提供。
The open context layer that gives AI agents grounded, governed SQL across 20+ data sources, that helps you build GenBI, dashboards, and advanced analytics.
20以上のデータソースに対してAIエージェントが統制されたSQLアクセスを提供するオープンコンテキストレイヤー。GenBI、ダッシュボード、高度な分析の構築を支援。
Anki is a smart spaced repetition flashcard program
スマートな間隔反復学習アルゴリズムを使用したフラッシュカードプログラム。記憶の科学に基づいて効率的な暗記学習を支援し、医学、語学学習等で広く活用されている。
Per-process network monitoring for your terminal with deep packet inspection. Cross-platform, sandboxed.
ターミナル上でプロセス単位のネットワーク監視を行うツールで、ディープパケット検査機能を搭載。Linux、macOS、Windows、FreeBSDでクロスプラットフォーム対応し、セキュリティサンドボックス機能付き。
A Kiro Client in Rust
Rust言語で実装されたKiroクライアント。Kiroプロトコルを使用したネットワーククライアント機能を提供する軽量なRust実装。
Account management and switching tool for Codex CLI with local gateway forwarding
Codex CLIのアカウント管理・切り替えツールで、ローカルゲートウェイ転送機能付き。複数のCodexアカウント間でシームレスな切り替えを実現。
An open, sub-millisecond, single-executable Firebase alternative with type-safe APIs, built-in WebAssembly runtime, realtime subscriptions, auth, and admin UI.
ミリ秒以下の応答時間を実現するFirebase代替のオープンソースBaaS。単一実行ファイルで、型安全なAPI、WebAssemblyランタイム、リアルタイム機能、認証、管理UIを提供。
A scalable, distributed, collaborative, document-graph database, for the realtime web
リアルタイムWeb向けの分散型ドキュメント・グラフ・ハイブリッドデータベース。スケーラブルで協調的な機能を持ち、従来のSQLとNoSQLの利点を組み合わせた次世代データベース。
Burn is a next generation tensor library and Deep Learning Framework that doesn't compromise on flexibility, efficiency and portability.
柔軟性、効率性、移植性を妥協しない次世代テンソルライブラリ・深層学習フレームワーク。Rust製で高性能なMLワークロードを実現し、クロスプラットフォーム対応。
HelixDB is an open-source graph-vector database built from scratch in Rust.
Rustでゼロから構築されたオープンソースのグラフベクトルデータベース。グラフデータとベクトル検索を統合し、複雑な関係性データとAI埋め込みベクトルの効率的な処理を実現。
💥 Blazing fast terminal file manager written in Rust, based on async I/O.
非同期I/Oベースの超高速ターミナルファイルマネージャー。Vim風インターフェース、画像プレビュー、Luaプラグインシステム、マルチタブ対応等の豊富な機能を提供。