首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· WeChatpy:Python中优秀的微信开发库,与微信官方接口交互的工具
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· RAGFlow:开源的RAG引擎,专注于深入的文档理解,支持处理各种复杂格式的非结构化数据
· 7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 自动优化Prompt:Automatic Prompt Engineering的3种方法
· 测评了8个国产AI大模型,差点崩溃……
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
Langchain中改进RAG能力的3种常用的扩展查询方法
我们这里主要介绍在Langchain中常用的3种方法 查询扩展技术涉及对用户的原始查询进
行
细化,以生成更全面和信息丰富的搜索。
检索增强生成
Langchain
数字人
一款构建AI数字人项目开源了!自动实现音视频同步!
video-retalking/blob/main/quick_demo.ipynb 项目地址:https://github.com/OpenTalker/video-retalking 系统为实现这一目标,
分
解为三个连续的任务
AI数字人
音视频同步
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
Erwin_8.wav|Erwin|ZH|就必须像一个一流的诈骗犯一样 Erwin_9.wav|Erwin|ZH|对他们花言巧语一番 可以看到,除了语气特别强烈的素材,大部
分
都没有进
行
标点符号的标注
Whisper
语音优化
ChatGPT
ChatGPT提示工程 - 总结
ChatGPT提示工程的两个关键原则 - 吴恩达和OpenAI合作 编写Prompt的两个关键原则 原则一:编写清晰、具体的说明 策略1:使用
分
隔符清晰地标识出输入的各个部
分
策略2:提示模型以结构化格式输出结果
GPT
ChatGPT
AI 绘画新时代:ChatGPT + DALL-E 3
现有用户基础:ChatGPT 享有庞大的用户基础(1 亿用户),相较于 MidJourney(1600 万用户)
分
发优势显著。
文生图
图生图
chatGPT
DALL-E
Stable Diffusion
新手向,Stable Diffusion API 接口,在本地调用
如果结果是:{'detail': 'Not authenticated'} 那么你应该是用的一键启动包进
行
登录,或是在别的地方设置了用户名和密码,解决方法如下: &
SD
文生图
大模型
如何下载及使用通义千问7B开源大模型
studios/qwen/Qwen-7B-Chat-Demo/summary 环境配置与安装 本文在ModelScope的Notebook的环境(这里以PAI-DSW为例)配置下运
行
通义千问
ChatGLM
chatglm3基础模型多轮对话微调
/chatglm3-6b-base"的路径进
行
调用。
ChatGLM
微调
ComfyUI
ComfyUI安装及生成第一张图
双击运
行
下载的exe文件。
ComfyUI
文生图
Stable Diffusion
AnimateDiff:一篇文章教你学会用Stable Diffusion制作GIF动图
提示词相关性(CFG Scale):7.5 - 8 对于其余的配置,使用默认设置就
行
。
AnimateDiff
视频
训练
AI面部增强器-Remini
当然,要看画质增强还是得用彩色图片才
行
。
Remini
面部增强
修复
文生图
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
F5-TTS在公共的100K小时多语言数据集上进
行
训练,展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。
F5-TTS
音频克隆
大模型
最佳开源文生图大模型可图:安装与批量出图的完整教程
在机器测评上,Kolors 获得了最高的 MPS
分
数,这与人工评估的结果一致。
可图
kolors
Prompt
11个顶级的Prompts,用GPT学习的天花板
应用费曼技巧进
行
深入理解提示:“演示如何将费曼技巧应用于学习和记忆[某主题]的信息,通过简化复杂概念并向他人讲解它们。”
GPT
腾讯
腾讯的 PhotoMaker - 更快 更像 更可控的 AI Avatar
我们
分
别从文本编码器和图像编码器中获取文本嵌入和图像嵌入。
PhotoMaker
文生图
<
...
87
88
89
90
91
92
93
94
95
96
...
>
1
2
4
5
6
7
8
9
100