首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· GitHub上的RPA小工具,可以将重复、繁琐的任务自动化
· 免费的文本生成视频解决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
· 深度对比丨探索LLM(大模型)部署服务的七大框架差异
· GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
张嘴就能生图?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
Turbo
具
备了最新的快速扩散蒸馏技术(Adversarial Diffusion Distillation),这个技术可以在保持图像生成质量的同时大幅度降低采样步数(生成速度) 比较明显的比对就是
SDXL-Turbo
文生图
微软
微软、OpenAI大佬暗示LLM应用开发范式迁移:从Prompt Engineering到Flow Engineering
从某种意义上讲,大模型应用开发变得更加务实,从一个模型算法问题转变成为一个
工
程问题,如何将复杂问题拆解为多个子任务或者子agent执行,如何编排协调,如何处理数据,如何选择合适
工
具
,如何迭代优化
LLM
范式迁移
开源
GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
ScreenPipe 在你的计算机上 7*24小时 全天候记录你的电脑屏幕和麦克风,数据由用户自行掌控,确保隐私和安全,并且把记录的数据连接到大模型,这样就可以轻松的进行搜索、并且自动化的处理一些
工
作
AIPC
ScreenPipe
开源
我去华强北走了一圈,发现这里正被另一种 AI 包围
所谓的 AI,大概是搭载了和翻译功能不相关的AI对话助手们,场景是 AI 讲故事、 AI
写
作
业、AI 角色扮演等等,有些边角料般的凑合感。
华强北
AI
RVC和SVC声音模型难找?推荐这个网站
以下是以自己方式制
作
的思维导图,供学习参考 AI声音模型训练总流程 AI数据集筛选流程 二、SVC和RVC声音模型网站推荐 声音模型
工
坊 http
声音克隆
数字人
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
它可以精准地"指挥"虚拟形象的每一个细微动
作
,例如叹息等非语音动
作
、情绪驱动的眉毛和眼睛运动以及自然的头部运动。
Loopy
视频
开源
来个优秀的开源人脸识别项目!
掌纹识别技术
具
有准确性高、速度快等优点。
人脸识别
开源项目
大模型
性能超出预期!神秘的国产大模型 Kimi 开放 API
于是最近几天魔法哥一直在尝试他们的 API,这里聊聊感受,想到哪
写
到哪。
Kimi
Chat
大模型
API
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
SenseVoice模型
具
有的功能特点: 多语言语音识别:SenseVoice 支持包括中文、英文、粤语、日语和韩语在内的多语言识别。
asr
tts
声音
Sora
通俗易懂地解释OpenAI Sora视频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
在Sora之前,业界已经有了很多视频生成
工
具
和平台。
sora
视频生成
SQL
RLHF 在 Text2SQL 领域中的探索
01 定义 Text-to-SQL(简
写
为Text2SQL),顾名思义就是把文本转化为 SQL 语言,更学术一点的定义是:把数据库领域下的自然语言(Natural Language
Text2SQL
RLHF
Stable Diffusion
小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
使用频率:⭐️⭐️⭐️⭐️ 能做什么:After Detailer 是一款强大的图像编辑
工
具
SD
插件
文生图
ChatGLM
完整ChatGLM3部署教程,支持手机和车载平台部署
同时原生支持
工
具
调用(Function Call)、代码执行(Code Interpreter)和 Agent 任务等复杂场景。
ChatGLM3
大模型
QWen1.5: 卓越模型之路
我们相信多语言能力的提升,对于其整体通用能力也
具
有正向的
作
用。
Qwen1.5
开源模型
大模型
全量免费的EMO模型上架通义APP,外媒称之为Sora之后最受期待的大模型之一
在EMO之前,Talking Head领域的
工
作
都需针对人脸、人头或者身体部分做建模或者表征,耗时长且生成质量较低。
EMO
阿里
全民演唱
<
...
75
76
77
78
79
80
81
82
83
84
...
>
1
2
4
5
6
7
8
9
100