微软推出的AI阅读教练,通过朗读识别英文发音准确性,免费的英文发音训练工具
免费戒糖工具,拍照用AI去分析食品标签中隐藏的糖(含代糖及工业糖分)
免费开源的屏幕实时翻译工具
使用AI 3D动画任何物品
识别文本是AI生成还是人类生成的快速算法
基于 MusicGen 的音乐改编工具
六爻游戏 + GPT 解读
一个语音生成模型,允许您仅使用3秒的音频片段克隆不同语言的声音
基于Whisper逆向开发的开源语音合成系统,在发音准确性和自然度方面都非常优秀
ChatGPT 驱动的AI电话呼叫中心API
结合了多个OCR引擎(EasyOCR, Tesseract)和LLM的开源OCR,实现对文本更准确的识别
面向SaaS产品的开源 AI Copilot
上传自己的照片生成你的数字孪生
用于高质量视频生成的开放式扩散模型
网易有道开源的语音合成TTS引擎,支持2000种语音,中英双语,能进行情感提示控制
收集了关于AIGC的各种精选教程和资源
LLM 应用开发平台,涵盖了构建生成式 AI 原生应用所需的核心技术栈
为网页自动化Agent提供视觉识别工具的开源库
一个平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案
ChatGPT驱动的视频检索和流媒体工具,支持搜索视频内容的任意时刻
上传5到20张自己的半身照,生成一个你的AI数字孪生,类似妙鸭相机
完全可定制的 AI 聊天组件,轻松地将AI聊天机器人嵌入到任何网站中
开源聊天机器人创建平台
从单一图片,生成多张从不同角度看这个物体或场景的图像
模拟相机飞越生成动画视频
开源的基于GPT模型的文档助手,可和任意文档进行聊天
对圣经的内容语义搜索和总结
让视频中的人物的嘴型与输入的声音同步
视频翻译工具,可将一种语言的视频翻译为另一种语言和配音的视频
与 LLM 增强角色进行视频聊天
OpenAI GPTs的开源版本
按照人类指令进行高质量图像恢复
Stability AI 跟Tripo AI 联合推出的3D 生成模型,可以快速生成高质量的 3D 模型
开源copilot平台,支持让 AI根据使用者意图自动化控制网页
人形机器人相关资源汇总
AI程序员 Devin 的开源替代
AI读唇语
基于 Google MediaPipe模型识别手势,并实现手势操控电脑
开源文本生成音乐
开源Vision-Language (VL)模型,旨在实现真实世界的视觉语言理解
你的动漫女友,CharacterAI 的开源替代
与AI无缝语音对话(超低延迟)
根据用户的喜好创建个性化报纸,能够根据个人口味和兴趣来策划、撰写、设计和编辑内容
ChatGPT插件WebPilot作者开发的浏览器插件版本,能集成到浏览器基于当前网页完成各种任务
Android端Stable-diffusion-webui客户端
使用大数据模型逆向工程二进制文件
效果并肩Magnific AI 的开源的图片放大工具
开源 Sora AI 视频生成器模板,Sora API 发布后可快速替换上线
基于AI的视频硬字幕去除、水印去除,无损分辨率生成去字幕、去水印后的视频文件
使用GPT-3.5和GPT-4处理MIT开放式课程网站等公开课程,并将RAG技术应用于Wikipedia 生成的免费教材
将LLM编码能力转换为LLM图像生成(图像合成)能力
服务于群聊的LLM。支持飞书、微信(有风险)、企业微信
基于GPT等大语言模型的长篇小说生成器
开放TTS语音合成引擎大全
图文多模态大模型,能够在自由形式的输入下进行图文创作和理解
虚拟试衣
经过精心优化的终极语音克隆工具
基于 ChatTTS 的 Colab 项目,一键部署(含离线整合包)
Kaggle AI生成文本检测竞赛第一名方案
开源图像标注模型,对训练的内容和标签没有任何过滤和审查