首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 大模型量化:什么是模型量化,如何进行模型量化
· AI开源 - LangChain UI 之 Flowise
· 检索增强生成(RAG)有什么好的优化方案?
· Dify:大模型创业开源工具,46,558 行代码,完全开源
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 使用python调用comfyui-api,实现出图自由
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
俄罗斯人开源了最大的文生图模型:参数量12B,比SDXL大了3倍多!
而且DALL-E 2比较难生成包含正确文本的图像,比如下面的"deep learning":最主要的原因还是CLIP image embedding本身,通过对比
学
习训练的CLIP image embedding
Kandinsky-3
文生图
开源模型
智谱AI静悄悄的上线了一大波新模型,过年了,真的
至于上线到智谱清言上面给普通消费者用,可能还得几天,我线上试了一下还都是老模型,毕竟模型太多了,这切换上去估
计
也费点时间。。。
智谱AI
大模型
ComfyUI
用ComfyUI整了一套照片转Q版手办的工作流
这次在弄ComfyUI的时候本来用原生的,后来跟着教程
学
的时候很多插件没有,于是又按照了秋叶的集成版,直接解决了插件找不到的问题。
comfyui
文生图
如何避免大语言模型绕过知识库乱答的情况?LlamaIndex 原理与应用简介
在索引构建过程中,LlamaIndex 不会生成 Embedding,而是在查询时生成,这种设
计
避免了在索引构建期间为所有文本块生成 Embeddings,这可能会导致大量数据的开销。
大语言模型
开源
[中文开源震撼首发]33B QLoRA大语言模型Anima真的太强大了!QLoRA技术可能是AI转折点!
chatbot评测集比较简单,真正比较考验模型能力的复杂逻辑推理及数
学
问题上小模型和大模型差距还是很明显的。
开源模型
耗时7天,终于把15种ControlNet模型搞明白了
的功能介绍,安装方法,模型采集方式,实操案例,以及下面几个目前很好玩的功能 1.动漫转真人 2.真人转动漫 3.控制人物姿势、表情 4.线稿AI上色 5.固定主角 大家只要跟着一步一步操作,一定能
学
会
文生图
语音
国内厂商语音识别与Whisper评测:现状与概况对比
一、语音识别现状 二、评测意义与预期成果 三、评测方案 四、评测结果 一、语音识别现状 得益于近年来深度
学
习技术的快速发展,人工智能的主要分支(图像、语音、自然语言处理等)都相继进入了大规模落地应用阶段
语音识别
Faster-Whisper
CodeGeeX:Tab一下,代码自动生成
我们对数据进行了去重和清洗,整个代码语料含有23种编程语言、总
计
1587亿个标识符(不含填充符)。
大模型
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
项目贡献开发者: o • 秦增一,麻省理工
学
院&MyShell o • 赵文亮,清华大
学
o •
tts
文本转语音
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
BERT的核心思想是通过在大规模文本语料上进行无监督预训练,
学
习到通用的语言表示,然后将这些表示用于下游任务的微调。
Bert-vits
语音
Stable Diffusion
Stable Diffusion|提示词高阶用法(二)双人同图
A4000显卡,SDWebUI原创生成 仅用提示词 - 绘制多人图 与上一篇分享一样,作者依旧将通过一个案例进行双人图撰写的说明,在这个案例中,作者将使用
统
一的SD参数配置,随机数种子,模型选择以及硬件环境
文生图
OCR
完全指南——使用python提取PDF中的文本信息(包括表格和图片OCR)
机器生成的pdf文件:这些pdf文件是在
计
算机上使用W3C技术(如HTML、CSS和Javascript)或其他软件(如Adobe Acrobat
大语言模型
python
9个范例带你入门langchain
ensp; 需要向LLM准确地传达我们的问题 1,短文本问答 # 概括来说,使用文档作为上下文进行QA系
统
的构建过程类似于
大模型
大模型
发现一个好东西,一键本地运行各种大模型!包括最新的Qwen1.5
软件目前完全免费,已经支持苹果的Mac M系列,微软的Windows系
统
,Linux系
统
。
Qwen1.5
大模型
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
而上传图片的限制,可能会让用户进行多次尝试——系
统
会校验图片像素大小、人脸清晰程度、非多人、版权风控、画风检测、不能有头部倾斜、露出手部等条件。
EMO
阿里
全民演唱
<
...
66
67
68
69
70
71
72
73
74
75
...
>
1
2
4
5
6
7
8
9
100