开源TTS模型,性能媲美ElevenLabs
多模态Resarcher,利用Gemini 2.5原生多模态能力,搜索、研究、生成报告和播客
AI自动生成播客,给出主题/关键词,自动网络研究、LLM 脚本编写和 TTS 音频合成
AI 量化交易系统,提供从数据收集到策略执行的完整流程
面向 AI Agent的开源虚拟桌面,只需几行代码即可在虚拟桌面上部署 AI 代理
基于AI的自主进化写作系统,利用AI通过迭代竞赛来生成、评估和进化创意故事
基于AI的自动视频剪辑系统,能够自动分析视频内容并根据用户需求生成编辑后的视频
开源Deep Research
开箱即用的基于企业私有知识库的LLM大语言模型的智能客服机器人问答系统
基于Claude的AI驱动的任务管理工具,可以放到Cursor, Lovable, Windsurf, Roo中进行管理
使用本地大型语言模型 (LLM) 将视频和音频任务的简单英语描述翻译成可执行的 ffmpeg 命令
阿里发布的信息检索 Agent,可自主上网查资料,GAIA 基准超越 GPT-4o
AI 驱动客户服务系统,支持 MCP 扩展和 AI 知识库系统
开源 AI 虚拟角色系统,支持实时语音聊天、玩 Minecraft 和 Factorio
面向事件驱动选股的多智能体交易框架
用于构建具有记忆、知识和推理能力的多智能体系统的全栈框架
Windows 自动化代理,可在 GUI 层直接与 Windows 交互
基于多引擎搜索结果的模型上下文协议(MCP)服务器
基于 LMM 的轻量级文档解析模型
AI自动化工具,Zapier的开源替代
Google开源的MCP数据库工具,不到10行Python代码即可让AI智能体访问数据库
腾讯开源的智能体框架,突出优势是自动化生成智能体及其配置的能力
拥有无限可能的3D AI桌面伴侣
开源版本 Claude for Chrome, 自动化浏览器操作
一体化多模态文档处理系统
阿里巴巴开源的手机上运行的3D数字人应用,本地运行、完全离线、支持多模态交互
开源 Deep Research,AI生成调研报告
Chrome插件的 MCP 服务器,将 Chrome 浏览器功能暴露给 Claude 等 AI 助手
用于构建诸如Deep Research、Manus、Claude Code 复杂Agent的通用框架
隐形AI桌面助手,可以实时捕捉屏幕活动和音频,能理解上下文,将其转化为结构化知识
腾讯开源的机器翻译模型,支持33种语言互译,五种少数民族语言
字节跳动开源的多模态文档图像解析模型
一体化攻击安全工具箱,集成 AI 代理和 MCP 架构
使用自定义知识库和任务管理作为 MCP 服务器来增强 AI 编码助手
用于 Computer-Use Agents 的 Docker
AI驱动的 MCP 网络安全自动化平台
IBM 开源的将 REST API 转换为 MCP 的服务
NSFW Jailbreaks for various LLMs
开源AI炒股平台,支持A股、美股
开源浏览器自动化框架
医学领域的 DeepResearch Agent 模型
Google NotebookLM 播客工具的开源替代
AI智能小说创作工具
模块化的交互数字人对话实现,能够在单台PC上运行完整功能
微软开源的Playwright MCP server,AI浏览器自动化
AI 数据集生成器
开源、可扩展的语音转文本应用程序,可完全离线运行
使用 Vision Framework 将iPhone 变成本地 OCR 服务器
专门为大规模文本翻译而设计的开源工具,能直接处理整本书籍和各种文档格式
使用多模态模型自动解决各种类型的 CAPTCHA
基于终端的AI编程Agent,Claude Code的开源平替
浸入式学语言助手,帮助在日常网页浏览中自然地学习语言
新加坡国立大学Show Lab开源的教育视频生成工具,生成3Blue1Brown风教学动画
在几秒钟内克隆并重新创建任何网站作为现代 React 应用程序
开源高质量文本转语音模型,专为轻量级部署和高质量语音合成而设计
生成同步字幕的高质量有声书,支持 EPUB、PDF 及纯文本一键转换
从0实现的多智能体系统,致力于打造简洁通用的舆情分析平台
一键生成爆款视频自动化工具
腾讯开源的基于大语言模型的文档理解与语义检索框架
一键生成产品营销与泛内容短视频,AI批量自动剪辑,高颜值跨平台桌面端工具