首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 免配置、免翻墙,Stable Diffusion平替来了!
· 用上这10条神指令(prompt),让ChatGPT快速写出优质高分科研论文
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 解读OpenAI Sora文生视频技术原理
· AnimateDiff 生成补间动画
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
教程
保姆级教程:手把手教你创建GPTs角色应用
GPTs技术的出现,为个人开发者提供了快速创造多样小型产品的可能性,这在以往通常需要程序员、产品经
理
和设计师的协作才能实现。
GPTs
教程
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
,时长00:09 ,时长00:39 技术亮点 无限视频长度:MuseV采用了视觉条件并行去噪方案,支持生成
理
论上无限长度的视频
MuseV
视频
数字人
框架
ChatGPT
ChatGPT提示工程5篇合集 - 吴恩达和OpenAI出品
ChatGPT提示工程 - 总结 3.文本推
理
可以让模型来识别一段内容的情绪,或者抽取指定的内容。
ChatGPT
prompt
WSL2安装(详细过程)
使用自己的GNU/Linux发行包管
理
器安装其他软件。
虚拟化
docker
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
它的原
理
是,把输入的语音信号随机地掩盖一些部分,然后让模型尝试重建完整的语音信号。
Translatotron
语音识别
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
来进行计算机视觉方面的任务,比如对象检测,对象分类,对象分割等,这里毕竟著名的模型VIT,Swin便是成功的把transformer的注意力机制应用到了计算机视觉任务,那么基于transformer模型的OCR识别任务,便是
理
所当然的了
OCR
手写
文字识别
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
这个框架利用了 Stable Difusion 模型的文生图功能并结合人像风格化 LORA 模型训练及人脸相关感知
理
解模型,将输入的图片进行训练后推
理
输出生成为个人写真图像。
阿里云
视频
音频
大模型
如何下载及使用通义千问7B开源大模型
modelscope.cn/studios/qwen/Qwen-7B-Chat-Demo/summary 欢迎小伙伴们来创空间体验Qwen-7B-Chat的模型效果👏~ 模型推
理
通义千问
ChatGPT
模拟ChatGPT流式数据——SSE最佳实践(附可运行案例)
为什么要这样传输,从使用场景上来说,ChatGPT 是一个基于深度学习的大型语言模型,处
理
自然语言需要大量的计算资源和时间,响应速度肯定比普通的读数据库要慢 接口等待时间过长,显然不合适。
GPT
ChatGLM
手把手教你本地部署清华大学KEG的ChatGLM-6B模型——Windows+6GB显卡版本和CPU版本的本地部署
HuggingFace的transformers库,尽管官方说: 使用 pip 安装依赖:pip install -r requirements.txt,其中 transformers 库版本推荐为 4.27.1,但
理
论上不低于
提示词
prompt
chatgpt
开源
【开源项目】Flow Matching 语音合成
https://github.com/shivammehta25/Matcha-TTS 工程展示: https://shivammehta25.github.io/Matcha-TTS/ 在线推
理
:
音视频
Flow
Matching
ChatGPT
ChatGPT等大模型实用的提问技巧
用 {###} or {"""} 包裹住输入信息,用这种方法来和其他信息分割,避免 AI
理
解错误 输出要求 Output Indicator 指定输出的类型或格式
大模型
开源
新测试基准发布,最强开源Llama 3尴尬了
§ 复杂性:提示词是否有多层推
理
、组成部分或变量?
Llama
3
大模型
开源
开源
国内开源的低代码框架有哪些?
Appsmith Appsmith 是一款开源的低代码框架,其主要用于帮助用户及团队更快、更协调地完成构建管
理
面板、内部工具和仪表板等,且允许拖放UI 组件来构建页面,用户可以通过Appsmith连接到任何
大模型
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
输入推
理
文本格式: 说话人|情感样式内容|音素|说话内容 我们可以运行下面这个代码,自动生成推
理
文本音素(phonemes) python frontend.py data/my_text.txt
EmotiVoice
语音库
<
...
80
81
82
83
84
85
86
87
88
89
...
>
1
2
4
5
6
7
8
9
100