首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 如何最简单、通俗地理解Transformer?
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· PPT又又有新突破了!智谱AI代码流造PPT
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· ComfyUI进阶前必备插件们续
· 收藏!万字长文聊聊LLM Agents的现状,问题与未来
· 为什么国产大模型都说超越ChatGPT而体验却很拉?警惕 Goodhart law 陷阱
· OCR的终极解法——传统算法VS多模态大模型
· Gpt写小说,常用的中文指令集「实操篇」
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
【2023.10】看目前巨头的AI原生产品布局
并不是狭义上理解的那种在具
体
场景给选择建议的类Github Copilot方式,而是更类似于之前吹的NLUI的感觉,只不过并不止于UI。
大模型
产品
被高估的Pika,被低估的多模态AI
这次 Pika 1.0 输出的视频结果大
体
相符要求,但细节依然有明显缺陷,角色的手部构图“惨不忍睹”。
大模型
多模态
提示词
45个 DALL-E 3 使用案例 (附提示词)
(Tall) 提示词: 为[特定类型或主题,如 "时尚 "或 "技术"]设计具有视觉冲击力的杂志封面,以[特定主
体
,如 "身着夏季
系
列服装的模特 "或 "未来主义小工具"]为特色,辅以暗示[特定主要文章或专题
DALL-E
提示词
文生图
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
TTS语音克隆项目 GPT-SoVITS模型介绍 GPT-SoVITS项目是TTS克隆领域内效果常年霸榜的模型之一,具有以下功能: 零样本文本到语音(TTS): 输入 5 秒的声音样本,即刻
体
验文本到语音转换
语音克隆
开源模型
Python
Python入门与语法速查
Python基本语法
标
识符 第一个字符必须是英文字母或下划线 _ 。
python
编程
人工智能
【AI科技大创意】2024年人工智能10大趋势
游戏是满足我们基本生物原语的模拟:收集(口袋妖怪)、捕食者/猎物(
标
签)、养育(收养我)、探索(我的世界)。
人工智能
趋势
ChatGPT
OpenAI官方ChatGPT提示工程 - 最佳实践11篇(大合集)
随后,OpenAI官方又正式的发布了一份"GPT 最佳实践"
指
南,可以说是期盼已久。
ChatGPT
大模型
解玄:共相、道、基类与战略
不同思维
体
系
下对同样的事物会有不同描述,比如共相属于狭义哲学或者佛学、道则更像大众和玄学用语、基类则属于程序员,但背后的话题都和名家的名实有点关
系
。
玄学
科学
下载
8个常用中文OCR数据集,附下载链接
对每个中文字符,数据集都
标
注了其真实字符、边界框和 6 个属性以
指
出其是否被遮挡、有复杂的背景、被扭曲、3D 凸出、艺术化,和手写
体
等。
OCR
比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
; 引导
系
数:设置为7,这是一个平衡值,既能保证提示词的引导作用,又不至于过度影响图像的自然生成。
IP-Adapter
文生图
爬虫
主流网络爬虫蜘蛛详解
必应集成了多个独特功能,包括每日首页美图,与 Windows 操作
系
统深度融合的超级搜索功能,以及崭新的搜索结果导航模式等。
爬虫蜘蛛
详解
大模型
大模型评测新思路:弱智吧精华问题大全
本文的贡献可以总结如下: 提出了一个高质量的中文
指
令调优数据集,专门用于与人类交互保持一致,并通过严格的过滤程序实现; 探讨了各种数据源(包括社交媒
体
、百科全书和传统 NLP 任务)对模型性能的影响
弱智吧
训练数据集
大模型
垂直领域大模型的一些思考及开源模型汇总
而对于ToB和ToG端来说,本地化部署、领域or行业内效果绝群、国产化无疑就成为了重要的考核
指
标
。
垂直领域
大模型
开源模型
汇总
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
而且由于生成过程中存在伪影,GAN判别器更容易关注视觉伪影,从而忽略音频和口型的对应关
系
。
wav2lip
语音
ChatGLM
完整ChatGLM3部署教程,支持手机和车载平台部署
ChatGLM3-6B 是 ChatGLM3
系
列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性: 更强大的基础模型:ChatGLM3
ChatGLM3
大模型
<
...
49
50
51
52
53
54
55
56
57
58
...
>
1
2
4
5
6
7
8
9
100