首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· PPT又又有新突破了!智谱AI代码流造PPT
· Suno音乐新手指南(手把手完整版教程)
· ComfyUI安装及生成第一张图
· 会“追问”的Agent,大模型知识库另类实践
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 聊聊我对AI Agents技术的一些看法
· Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
· 【工具书】文生图Midjourney最全prompt提示词分类对照表
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
人工智能
Gartner:2024年人工智能渗透的十大战略技术趋势
Gartner提供了对未来十年的IT前沿预测,同时探讨了生成式AI如何改
变
高管对每个主题的思维方式。
Gartner
人工智能
企业
初创企业必知的 30种商业模式(附实例)
如果没有好的商业模式,核心技术就没法
变
现,你的一切努力也会付之东流。
初创
商业模式
开源
Stability AI开源上新:3D生成引入视频扩散模型
这次带来的是图生3D方面的新进展: 基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质
量
3D网格。
sv3d
建模
OpenAI
OpenAI大动作:Whisper large-v3重塑语音识别技术
今天,我们就来深入了解这个技术突破,并探讨它如何改
变
我们与机器的交流方式。
Whisper
语音识别
GPTs
“How to make money with GPTs” 教你集成第三方url的Action+知识库的完整版GPTs
前几天随着Open AI DevDay 开发者大会GPTs的发布,一个新的话题瞬间
变
得火热!
GPTs
知识库
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
「MimicTalk」是由浙江大学和字节跳动联合研发的一个项目,它利用先进的NeRF(神经辐射场)技术,在「短时间内训练出高质
量
」的3D说话头像模型,极大地提高了个性化数字人视频的生成效率和质
量
。
MimicTalk
开源模型
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
该系列模型接受图像和文本输入,并提供高质
量
的文本输出。
minicpm
面壁
如何从零开始训练专属 LoRA 模型?4600字总结送给你!
确定好画风后,就需要准备用于训练的素材图片,素材图的质
量
直接决定了模型的质
量
,好的训练集有以下要求: 不少于 15 张的高质
量
图片,一般可以准备 20-50 张图; 图片主体内容清晰可辨
训练
大模型
真超越了GPT?国产大模型实用场景横评②
时至今日,这一基本需求仍未改
变
。
大模型
微调
大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
两者均是将输出乘上了服从伯努利分布的随机
变
量
m ~ Bernoulli(p),其中p是指定的确定的参数,表示取1的概率。
大模型
全球生成式 AI 应用全景图
、产品销售等,其中C 端应用以功能订阅和按
量
付费为主,商业化已经趋于成熟,而B 端应用则主要为功能订阅、解决方案和产品销售,即将进入全面商业化阶段。
大模型
【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
截至2022年3月,文章已有700+引用
量
,可见其影响力。
OpenAI
自然语言监督
一文带你认识ELMo
在NLP任务中表现出了很好的性能,已经是很多NLP任务不可或缺的一部分,论文作者认为一个好的word representation需要能建模以下两部分信息:单词的特征,如语义,语法;单词在不同语境下的
变
化
embedding
Stable Diffusion
硬核解读Stable Diffusion(系列一)
对比可以看出,autoencoder将图片压缩到latent后再重建其实是有损的,比如会出现文字和人脸的畸
变
,在256x256分辨率下是比较明显的,512x512下效果会好很多。
StableDiffusion
文生图
人工智能
2023年人工智能行业总结
这一年中,AI领域经历了众多的
变
革,仿佛将过去十几年的积累在一夜之间彻底释放。
人工智能
AGI
思考总结
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100