首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· AI声音克隆 | 最全最简教程(权威版)
· Suno音乐新手指南(手把手完整版教程)
· 微信搜狗爬虫WechatSogou - 从微信公众号获取文章的利器
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 【AI代理】扣子,开始探索多代理模式
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· 爆肝7天!AI艺术字终极攻略,光影、隐藏、嵌入、海报4种艺术字全拆解
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· SD入门教程二:文生图基础用法(提示词)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
OCR的终极解法——传统算法VS多模态大模型
传统算法 一般情况 OCR 识别商务名片会分为两步: · OCR 算法识别出文
字
和坐标
OCR
大模型
文字识别
借题发挥下最近几例声音克隆的应用案例
某父亲痛失爱子,因为儿子托梦告知人是可以复活的,于是这位父亲到处寻找让人复活的办法,于是他关注到了最新的人工智能技术,开始找人咨询和学习技术,通过摸索,他知道通过ChatGPT可以训练儿子的过去的说话,文
字
等语料
声音克隆
数字人
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是中英文的大段文
字
:
OCR
手写
文字识别
金融
金融行业中 Fintech 的应用场景
本
节
课开始,咱们要花几
节
课的时间来学习一下 Fintech 的数据分析。
Fintech
金融
大模型
全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万
字
论文理解力接近人类
再举个例子,要求Claude 3 Opus将难以阅读的手写
字
迹的照片转换为文本。
claude
大模型
Stable Diffusion
Stable Diffusion ComfyUI 入门感受
Clip文
字
编码器
节
点,正面和负面分成两个
节
点 · Unet阶段:ksampler
节
点,负责在潜空间生成图片
文生图
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
在当今数
字
化时代,文本转语音(TTS)技术的应用愈发广泛,从智能语音助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的语音合成。
OuteTTS-0.1-350M
音频
提示词
精通结构化提示词:如何精确操控指令的作用域与优先级
3 强化提示重点信息 通过加重
字
体或斜体
字
等手段,可向模型传递特定信息的重要性。
提示词
结构化
大模型
大模型套壳祛魅:质疑套壳,理解套壳
从年初到年末,从百度文心一言到零一万物,从
字
节
跳动到谷歌 Gemini,各种「涉嫌套壳」的事件屡次冲上热搜,随后又被相关方解释澄清。
大模型
套壳
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
本文将深入介绍一下wav2lip的技术原理和细
节
,了解它是如何实现语音驱动唇部运动的!
wav2lip
语音
大模型
国内AI大模型已近80个,哪个最有前途?
字
节
为啥觉得
字
节
可能是最有前途的呢?
大模型
企业
为什么说数智化可以帮助中小企业降本增效 ?
数智化是对「数
字
智慧化」的解释,是数
字
化和智能化的结合, 它强调运用数
字
技术和智能算法,将人的智慧与数
字
化相结合,实现更智能化的管理和决策。
大模型
Stable Diffusion
stable diffusion如何确保每张图的面部一致?
Compatible Image Prompt Adapter for Text-to-Image Diffusion Models,翻译成中文就是:用于文本到图像扩散模型的文本兼容图像提示适配器,名
字
很长很拗口
图生图
文生图
sd
教程
【万
字
长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
ChatTTS 文本转语音项目在github爆火出圈,引来大家极大的关注。短短2周左右的时间,在 GitHub 上已经斩获了23.5k的Star量。本文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
chattts
tts
文生语音
Prompt
一个让GPT重复自问自答的Prompt
以下prompt中,橙色为关键循环
节
· 输入 · ## Profile: - author: 田彬玏 - version: 1.0.4 
prompt
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100