首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大语言模型应用中的文本分块策略
· 开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
· 发现一个好东西,一键本地运行各种大模型!包括最新的Qwen1.5
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 前半年,我看到的有趣的 AI 产品
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
6.
训
练
定制:PaddleOCR支持用户根
据
自己的需求进行模型
训
练
和定制,满足特定场景下的OCR需求。
PaddleOCR
文字识别
医疗
惊艳!2.77亿参
数
锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
2.77亿参
数
、1340万帧视频
训
练
数
据
,背后蕴含着怎样的技术秘密?
Agent+GPT-4V
大模型
不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
它能根
据
咱们输入的文字描述,很快就生成质量高、有创意的图像,不管是在啥场景下用都没问题。
Qwen3
开源
截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析
OPT模型本身并没有特意针对多语言进行
训
练
,不过他们的
数
据
集
很大,因此也能在简单的中英文翻译中获得不错的结果。
大模型
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
为此,我们提出了一种两阶段的
训
练
策略,以分离人体动作和外观(例如面部表情、肤色和着装),包括对同一
数
据
集
的人舞姿势的外观控制块的预
训
练
和对外观-姿势-联合控制块的精细调整。
MagicPose
视频
学会这招,一个头像变100种风格!
在 Mijdourney 里,如何根
据
一张图随意切换风格?
Remix
文生图
Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理能力,平均性能超越GPT-4
相比之前的ChatQA 1.0版本,其
训
练
方法和
数
据
集
都进行了优化,尤其增强了对表格
数
据
和算术计算的理解能力。
Llama3-ChatQA-1.5
对话问答模型
ChatGPT
清华智能体「XAgent」比ChatGPT4.0还好用!
数
据
分析:展示双环机制的有效性 我们将使用一个简单的
数
据
集
iris.zip上传到XAgent,然后让XAgent分析
数
据
集
并生成一个报告。
ChatGPT
智能体
Agent
语音
语音识别的未来已来:深入了解faster-whisper的突破性进展
faster-whisper的核心优势在于其能够在保持原有模型准确度的同时,大幅提升处理速度,这使得它在处理大规模语音
数
据
时更加高效。
语音识别
Faster-Whisper
教程
用so-vits-svc-4.1进行音色转换的极简教程!
主要是因为孙燕姿的音色独特,吐词清晰,网络上存在她的大量歌曲,非常便于
训
练
。
so-vits-svc
音色转换
教程
人工智能
生成式人工智能的“经济学”,The Economic Case for Generative AI
它可以根
据
输入的信息,生成出与之相关的文字、图片、甚至是音乐!
生成式人工智能
经济学
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
光
集
成的工具就有这么多,比如NLP、语音、视觉、多模态等多种模型,以及默认
集
成知识检索、API检索等方案。
大模型
大模型
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生
早在去年五月中旬,经过
数
十版模型
训
练
与优化,中国电信就完成了百亿参
数
星辰AI大模型稳定版本的
训
练
。
开源大模型
电信
开源
Embedding开源模型重磅玩家:北京智源人工智能研究院最新Embedding模型发布!登顶MTEB,免费商用授权!
BGE模型的
训
练
有2个阶段:分别是预
训
练
阶段和微调阶段。
开源模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速
训
练
并实现实时因素(RTF)0.15的推理速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
<
...
23
24
25
26
27
28
29
30
31
32
...
>
1
2
4
5
6
7
8
9
100