首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
构建开源多模态RAG系统
亲爱的冒险家,请考虑一下:当你听到某人的声
音
时,你能认出这个人,而当你看到他们时,你也知道他们是谁。
RAG
大模型
全球生成式 AI 应用全景图
、
视
频
和3D模型等领域展现出了强大的能力。
大模型
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
LinkSoul.AI 开源的语
音
- 语言多模态模型和
视
觉 - 语言多模态模型统一采用下图所示框架。
开源模型
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置语速、添加停顿词、口头语、笑声!!
音
色一:男
音
色-铿锵有力效果展示 这是我经过挑选后男
音
对应的数据供768维。
chattts
tts
文生语音
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
3月,国内外模型公司动作
频
频
。
零一万物
YI
李开复
换脸
AI换脸:FaceFusion 3.5.0更新,解决老版本无法使用问题!
ensp; · 改善唇同步效果:从
音
频
中更清晰
FaceFusion
文生图
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、语
音
转文字
提示词
prompt
工具
掌握这10个AI 工具用1小时完成别人1周的工作
01 制作爆款内容:PredisAI Predis是一款适用于社交媒体的人工智能营销工具,可帮助制作引人入胜的
视
频
和图像内容,并获得人工智能驱动的内容分析。
AI
工具
【2023.10】看目前巨头的AI原生产品布局
在程序员输入时候,直接给出建议的方案,程序员可以快速选择采纳、切换方案或者无
视
。
大模型
产品
大模型
大模型落地“诸神之战”,场景玩家先杀出重围了
在短
视
频
时代,通过线上种草
视
频
/图文为线下门店引流,已经是重要营销手段之一。
大模型
文生图
ChatGPT
字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
和“即创”偏向于抖
音
生态内容制作不同,豆包更像chatgpt一样的大模型。
AI工具
文生图
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
音
频
频
谱图提供了
音
频
信号
频
谱随时间变化的直观表示。
大模型
大模型
AIGC大模型,潮水褪去之后
1、潮水褪去之后 这个公众号的活跃度将死未死,更新
频
率气若游丝。
大模型
大模型
大模型狂飙两年后,“六小龙”开始做减法
相比硅谷
频
繁上演的“AI大戏”相比,国内的大模型明星公司们似乎务实很多,最近的一次热议话题来自月之暗面的“仲裁风波”,但人们的关注很快又被其新模型的发布所吸引。
AI
大模型
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
24年的第一个月,智源就发布了新一代text embedding模型BGE M3-Embedding,该模型支持超过100种语言,能够接受不同形式的文本输入,文本最大输入长度扩展到4192,并且支持包括稠密检索,稀疏检索,多向量检索三种不同检索手段。从实验结果上看,在多语言跟跨语种检索任务上,BGE M3-Embedding的效果超过之前提及的微软E5-mistral-7b微软E5-mistral-7b-instruct: 站在LLM肩膀上的text embedding以及openai去年底刚发布的第三代text embedding模型,对于长文本检 ...
BGE
M3-Embedding
多语音检索
<
...
11
12
13
14
15
16
17
18
19
20
...
>
1
2
4
5
6
7
8
9
100