首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 自动优化Prompt:Automatic Prompt Engineering的3种方法
· ComfyUI-基础图生图&基础图片缩放
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 最强开源数字人对口型系统介绍
· 社区供稿|GPT-4 与国产模型,大!横!评!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
OpenAI则是用做“大”模型的思路做视频生成——准备足够大量的视频,用多模态模型给视频做标注,把不同格式的视频编码成统一的视觉块嵌入,然后用足够大的网络架构+足够大的训练批次(batch size)+ 足够
强
的算力
sora
openai
视频生成
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
从国内外的网友分享反馈来看,大家还挺喜欢文艺复兴,
最
受欢迎的片段是让个路人马轮番演唱《野狼Disco》。
音频
阿里
开源
有感情的语音合成开源模型:ChatTTS安装使用详解
根据生成的语音效果来看,不比微软
最
近发布的晓晓差,甚至更好!
ChatTTS
语音合成
工具
搭建程序员自己的在线工具库 it-tools
作为程序员,在日常工作中,需要借助一些工具来提高我们工作效率,鄙人日常用得
最
多的工具,有JSON格式化,SQL格式化,XML格式化,JSON转Execl等等。
开源项目
工具类
大模型
从零开始学习大模型-第一章-大模型简介
大模型的简介 大模型(Large Models),是
指
在人工智能领域,特别是在自然语言处理(NLP)和机器学习中,
指
的是那些拥有大量参数的深度学习模型。
大模型
从零开始
人工智能
2023年人工智能行业总结(精简版)
ChatGPT的出现创下了用户
最
快增长纪录,这主要得益于人工调教和大模型的涌现现象。
人工智能
行业总结
CodeGeeX2来了!效果超LLaMA2-70B
得益于ChatGLM2优秀特性,CodeGeeX2更好支持中英文输入,支持
最
大 8192 序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需6GB显存即可运行,支持轻量级本地化部署
CodeGeeX2
开源模型
耗时7天,终于把15种ControlNet模型搞明白了
——让出的图与我们脑海里想象的画面一致 但目前现状是:随机性太
强
很多时候能不能出来一个好看的画面,只能通过大量的「抽卡」实现,以数量去对冲概率 这种情况下,如果能用好控制出图的三个
最
关键因素,能让
文生图
【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
我们在30个不同类型的下游CV 任务上进行了基准测试,并展示了我们模型
强
大的迁移能力,其在很多下游任务上不需要任何额外的数据也能比拟完全supervised的模型。
OpenAI
自然语言监督
OpenAI
【语音识别】OpenAI语音力作Whisper
在68万小时标注数据的加持下,预训练 Whisper 模型表现出了
强
大的泛化到多种数据集和领域的能力。
语音转文字
whisper
提示词
AI提示词|一词千金,写提示词的这个技巧你一定没想到!(二)
动词的使用:在制定提示时使用特定的动词(如“解释”、“重新诠释”、“简化”等)可以更精确地
指
导AI的输出。
提示词
写作
OCR
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
MiniCPM 系列模型,包括四个模型: · OCR 能力惊艳,当前端侧
最
强
多模态模型
MiniCPM
大模型
Agent
LangChain Agent 原理解析
虽然 LLM 在语言理解和交互决策制定方面展现出了
令
人印象深刻的能力,但它们的推理(例如链式思考提示)和行动(例如行动计划生成)的能力主要被视为两个独立的主题。
大模型
SDXL
造梦师手记:SDXL迎来了AI插画师
使用
指
南(将与时俱进) 推荐使用 ComfyUI 生成图像。
文生图
漫画
Stable Diffusion
Stable Diffusion 30种采样器全解!
o Euler:ODM求解器,简单直接,可收敛——能产生
最
终稳定图像。
Stable
Diffusion采样器
<
...
64
65
66
67
68
69
70
71
72
73
...
>
1
2
4
5
6
7
8
9
100