首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 划重点!全网最全AI数字人工具合集!
· 造梦师手记:SDXL迎来了AI插画师
· 提示词框架:Markdown结构法
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
了解Kimi必看的26个问题 | Kimi系列文(二)
清华学霸,成绩常年霸榜年级第一,博士就读卡内基梅
隆
大学。
Kimi
大语言模型
OpenAI
来自OpenAI应用研究主管关于Agent的万字长文-AI Agents介绍
该论文假设,任何生成一系列学习历史数据的算法都可以通过对动作执行
克
隆
行为来蒸馏成神经网络。
Agent
教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程 #1/2 使用模型
原始
声
音
处理 要使用模型进行推理的话你首先需要一段已经演唱好的
声
音
垫进去,然后使用模型把原来的
音
色换成你模型训练好的
音
色(类似AI画图的img2img垫图)。
生成式AI
Sora
中学生也能看懂的Sora视频生成原理解读
具体到Sora的实现,这个过程开始于一段与目标视频同样时长、但是内容完全是随机噪
声
的视频。
视频生成
sora
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
语
音
助理和远程语
音
助理:数字人可以作为语
音
助理,进行语
音
交互,提供信息查询、日程管理等辅助任务。
Fay
开源项目
数字人
人工智能
2023年人工智能行业总结(精简版)
年初的vits项目能完美模拟人的
声
音
特点,AI孙燕姿能唱周杰伦的歌。
人工智能
行业总结
Agent
【万字长文】全球AI Agent大盘点,大语言模型创业一定要参考的60个AI智能体
6月的一次全体员工会议上,扎
克
伯格宣布了一系列处于不同开发阶段的技术,其中一个就是将带来具有不同个性和能力的AI Agents为用户提供帮助或娱乐。
大语言模型
查理·芒格 :关于人生的13个忠告
对此,巴菲特发表
声
明称,“如果没有查理的灵感、智慧和参与,伯
克
希尔-哈撒韦就不可能发展到今天的地位。”
人生箴言
查理芒格
比尔盖茨最新预言:AI智能体颠覆计算机交互体验甚至软件行业
例如,Abridge、Nuance DAX和Nabla Copilot可以在预约期间捕获
音
频,然后写下笔记供医生查看。
AI智能体
《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
无论看还是不看这些短剧的,都是吐槽
声
一片,因为剧情过于反智雷人,但又让一部分人忍不住想看看后面到底还有啥剧情。
短剧
LLM
基于LLM+向量库的文档对话痛点及解决方案
痛点:文档切分粒度不好把控,既担心噪
声
太多又担心语义信息丢失 笔者之前采用了Longchain的文档切分工具,发现不能问题。
开源模型
目前大语言模型的评测基准有哪些?
ChatbotArena:借鉴游戏排位赛机制,让人类对模型两两评价 ChatbotArena是一个大型语言模型 (LLM) 的基准平台,该项目方LMSYS Org是由加州大学伯
克
利分校、加州大学圣地亚哥分校和卡内基梅
隆
大学合作创立的研究组织
人工智能评测
大模型
开源
3 分钟,把一篇 3000 字长文变成“脱口秀”——开源神器 Twocast 实战指南
复制粘贴就行,不用排版 内置 3 大 TTS 引擎 Fish
声
音
最自然
Twocast
开源
开源
搞了一个Dify开源知识库
Workflow:打造你的智能工作流 · 初衷:也是在机缘巧合下,感谢MAX和众多大佬的呼
声
支持下
Dify
大模型
知识库
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
多模态(Multi-Modal): 多模态主要是指让机器能够理解和处理自然界或人工定义的多种模态信息,如
声
音
、语言、视觉信息和表格、点云信息等。
开源
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100