首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 大语言模型微调:定制自己的微调数据集
· [开源]面向中小团队的轻量化知识管理应用,构建知识库和知识社区
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· AIGC系列之一-一文理解什么是Embedding嵌入技术
· RAGFlow:开源的RAG引擎,专注于深入的文档理解,支持处理各种复杂格式的非结构化数据
· Stable Diffusion 30种采样器全解!
· 改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
· 【Stable Diffusion】高效率视频转AI动画!EbSynth插件全流程操作
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
使用transformers库,开发人员可以轻松地访问和使用各种预训练的NLP
模
型
,也可以使用该库进行
模
型
的
微
调
和训练。
Whisper
语音优化
开源
5个最佳开源RPA框架
这个AI
大
脑要实现的就是智能化;而RPA则是通过配置自动化软件
模
拟和人类在软件系统中交互的动作来执行业务流程;RPA软件机器人在应用程序界面上识别数据并像人类一样操纵应用程序;RPA软件根据规则与其他系统交互
开源模型
智能自动化
LLM
Byzer-LLM 快速体验智谱 GLM-4
Byzer-LLM 可以让用户用一套接口就可以部署和使用市面上主流的开源和SaaS版本
大
模
型
, 之前以Qwen 写过一篇,可以看这里:Byzer-LLM 支持同时开源和SaaS版通义千问 今天我们升级了一个
Byzer-LLM
GLM-4
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
这种技术使用深度神经网络
模
型
来合成语音,能够更自然地
模
拟人类的发音和语
调
,从而产生更加流畅和自然的语音输出。
TTS
Maker
语音
Sora
一文带你看懂OpenAI-Sora生成视频的原理
因此,Sora
模
型
需要非常精细地
调
整压缩参数,以确保最终的视频既清晰又流畅。
视频生成
sora
Midjourney
MidjourneyV6高级提示词技巧(人物篇)
该
模
板详细描述了V6提示词的各个
模
块以及每个
模
块的注意事项。
Midjourneyv6
文生图
提示词
京东
多智能体开发框架怎么选
型
?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
技术架构深度对决 光看表面还不够,我们得像拆解一个机器人一样,深入到它们的技术内核,看看两者的“心脏”(
调
度
模
型
)、“神经”(并发机制)、“四肢”(工具集成)和“记忆”(数据流)到底是怎么工作的
JoyAgent
langchain
LangGraph
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、
大
海捞针测试、降低幻觉、服务化API集成进业务!
它基本上就是通过一个巧妙的方法来让
大
型
语言
模
型
(LLM)生成更精准、更有用的回答。
OCR
RAG
开源
高效选择:Ollama与LM Studio深度对比
今天,我们就来深度对比这两个本地语言
模
型
(LLMs)工具,帮助你找到最适合你的那一款。
Ollama
LM
Studio
对比
开源
开源版妙鸭相机来了,无限出个人写真图(阿里达摩院出品)
FaceChain的
模
型
由ModelScope开源
模
型
社区提供支持。
妙鸭相机
Prompt
提升GPT Prompt效果最佳实践 - 拆解复杂任务
就像在软件工程中将复杂系统分解为一组
模
块化组件一样,在提交给GPT
模
型
的任务中也是如此。
GPT
prompt
提示词
AI提示词|一词千金,写提示词的这个技巧你一定没想到!(一)
AI
模
型
,如ChatGPT自己,依赖于用户提供的提示来理解和执行任务。
提示词
写作
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
代理与 LiveKit 服务器无缝集成,将作业排队和
调
度责任卸载给它。
voice
agent
开源
音视频
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
基础
模
型
。
OuteTTS-0.1-350M
音频
阿里
ReplaceAnything:阿里最新项目!重绘图片里的任何元素,商用价值极高!用最简单的部署创造最
大
的价值!
摘要 ReplaceAnything是阿里团队即将开源的项目,针对图像里的人物替换、服装替换、背景替换等方面做了极
大
的优化,使用户上传图片可以指定部分区域生成新内容,并且做到了严格保留遮挡区域,这对AIGC
ReplaceAnything
文生图
<
...
58
59
60
61
62
63
64
65
66
67
...
>
1
2
4
5
6
7
8
9
100