快速筛选

回家地址： judh.pages.dev | rentry.org/judh | judh.top

AI其他

AI Reading Coach

AI Reading Coach

微软推出的AI阅读教练，通过朗读识别英文发音准确性，免费的英文发音训练工具

Sugar Free: Food Scanner

Sugar Free: Food Scanner

免费戒糖工具，拍照用AI去分析食品标签中隐藏的糖（含代糖及工业糖分）

免费开源的屏幕实时翻译工具

使用AI 3D动画任何物品

识别文本是AI生成还是人类生成的快速算法

基于 MusicGen 的音乐改编工具

六爻游戏 + GPT 解读

一个语音生成模型，允许您仅使用3秒的音频片段克隆不同语言的声音

基于Whisper逆向开发的开源语音合成系统，在发音准确性和自然度方面都非常优秀

人生重来模拟器 LifeReloaded

人生重来模拟器 LifeReloaded

ChatGPT 驱动的AI电话呼叫中心API

结合了多个OCR引擎（EasyOCR, Tesseract）和LLM的开源OCR，实现对文本更准确的识别

面向SaaS产品的开源 AI Copilot

上传自己的照片生成你的数字孪生

用于高质量视频生成的开放式扩散模型

网易有道开源的语音合成TTS引擎，支持2000种语音，中英双语，能进行情感提示控制

Awesome AIGC Tutorials

Awesome AIGC Tutorials

收集了关于AIGC的各种精选教程和资源

LLM 应用开发平台，涵盖了构建生成式 AI 原生应用所需的核心技术栈

为网页自动化Agent提供视觉识别工具的开源库

一个平民版视频翻译工具，音频翻译，翻译校正，视频唇纹合成全流程解决方案

ChatGPT驱动的视频检索和流媒体工具，支持搜索视频内容的任意时刻

上传5到20张自己的半身照，生成一个你的AI数字孪生，类似妙鸭相机

完全可定制的 AI 聊天组件，轻松地将AI聊天机器人嵌入到任何网站中

开源聊天机器人创建平台

从单一图片，生成多张从不同角度看这个物体或场景的图像

Deforum-Kandinsky

Deforum-Kandinsky

模拟相机飞越生成动画视频

开源的基于GPT模型的文档助手，可和任意文档进行聊天

对圣经的内容语义搜索和总结

让视频中的人物的嘴型与输入的声音同步

视频翻译工具，可将一种语言的视频翻译为另一种语言和配音的视频

与 LLM 增强角色进行视频聊天

OpenAI GPTs的开源版本

按照人类指令进行高质量图像恢复

Stability AI 跟Tripo AI 联合推出的3D 生成模型，可以快速生成高质量的 3D 模型

开源copilot平台，支持让 AI根据使用者意图自动化控制网页

awesome-humanoid-learning

awesome-humanoid-learning

人形机器人相关资源汇总

AI程序员 Devin 的开源替代

AI读唇语

Awesome Hands - Control

Awesome Hands - Control

基于 Google MediaPipe模型识别手势，并实现手势操控电脑

开源文本生成音乐

开源Vision-Language (VL)模型，旨在实现真实世界的视觉语言理解

你的动漫女友，CharacterAI 的开源替代

与AI无缝语音对话（超低延迟）

根据用户的喜好创建个性化报纸，能够根据个人口味和兴趣来策划、撰写、设计和编辑内容

ChatGPT插件WebPilot作者开发的浏览器插件版本，能集成到浏览器基于当前网页完成各种任务

Diffusion-Client

Diffusion-Client

Android端Stable-diffusion-webui客户端

使用大数据模型逆向工程二进制文件

Clarity-Upscaler

Clarity-Upscaler

效果并肩Magnific AI 的开源的图片放大工具

开源 Sora AI 视频生成器模板，Sora API 发布后可快速替换上线

Video-subtitle-remover

Video-subtitle-remover

基于AI的视频硬字幕去除、水印去除，无损分辨率生成去字幕、去水印后的视频文件

使用GPT-3.5和GPT-4处理MIT开放式课程网站等公开课程，并将RAG技术应用于Wikipedia 生成的免费教材

将LLM编码能力转换为LLM图像生成（图像合成）能力

服务于群聊的LLM。支持飞书、微信（有风险）、企业微信

基于GPT等大语言模型的长篇小说生成器

Open TTS Tracker

Open TTS Tracker

开放TTS语音合成引擎大全

InternLM-XComposer

InternLM-XComposer

图文多模态大模型，能够在自由形式的输入下进行图文创作和理解

虚拟试衣

经过精心优化的终极语音克隆工具

基于 ChatTTS 的 Colab 项目，一键部署（含离线整合包）

Kaggle AI生成文本检测竞赛第一名方案

开源图像标注模型，对训练的内容和标签没有任何过滤和审查