首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· PPT又又有新突破了!智谱AI代码流造PPT
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· SD入门教程七:ControlNet篇-Canny边缘检测预处理器
· 国产视频制作之光-可灵:提示词大全整理
· WeChatpy:Python中优秀的微信开发库,与微信官方接口交互的工具
· 学会这招,一个头像变100种风格!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
在当今数字化与智能化浪潮汹涌的时代,人工智能
技
术不断取得突破性进展,多模态模型作为其中的前沿领域,正日益成为研究和
应
用
的热点。
OmniVision
-
968M
多模态模型
Sora
OpenAI Sora视频生成模型
技
术报告中英全文+总结+影响分析
•
技
术细节写得比较泛(防止别人模仿)大概就是
用
视觉块编码(visual patch)的方式,把不同格式的视频统一编码成了
用
transformer架构能够训练的embeding,然后引入类似diffusion
sora
openai
视频生成
微调
四种微调
技
术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调
技
术时,我们进入了一个令人兴奋的领域。
大模型
开源
6个最佳开源TTS引擎
随着人工智能的普及以及数字设备
应
用
的增加,相关系统对语音识别以及文语转换
技
术日益依赖,TTS正在变得越来越重要。
TTS引擎
开源模型
Midjourney
【万字干货】掌握 Midjourney 提示词
技
巧成为 25 个流派的摄影大师
high-tech gadgets, modern and innovative atmosphere, 50mm lens (时尚的银色笔记本电脑放在简约的白色桌子上,环境照明避免屏幕眩光,配有高
科
技
小工具
文生图
训练
提示词
Midjourney
开源
开源大语言模型完整列表
基于盘古系列大模型提供大模型
应
用
落地
技
术帮助
用
户高效的落地超大预训练模型到实际场景。
开源模型
大语言模型
人工智能
人工智能大语言模型微调
技
术:SFT 、LoRA 、Freeze 监督微调方法
监督式微调在计算机视觉、自然语言处理等领域中得到了广泛
应
用
。
大模型
微调
Logo
如何
用
AI做LOGO?
不过,使
用
Stable Diffusion需要一点点门槛:要有一台显卡说得过去的电脑,会下载并安装相
应
的AI绘画大模型和微调模型(LoRA),模型下载详见文末。
Stable
Diffusion
文生图
大模型
AI Agent:大模型与场景间的价值之桥,但不适合当纯
技
术看
一文中曾经提到:大模型落地的方式是系统型超级
应
用
。
大模型
大模型
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
报道提到,GPT 开发速度放缓的部分原因是
用
于预训练的文本和数据供
应
减少(预训练有助于 LLM 理解概念之间的关系,从而解决起草内容或调试代码等任务)。
Scaling
Law
AI大模型
Agent
10个具有代表性的AI-Agents,将如何改变互联网/重塑Web3
科
学
技
术的发展从来不是割裂的,而是在辩证统一中走向跨学
科
的融通。
开源模型
微调
大语言模型综述<演进,
技
术路线,区别,微调,实践,潜在问题与讨论>
下面是一些基于ChatGLM衍生出来的大模型
应
用
: langchain-ChatGLM:基于 langchain 的 ChatGLM
应
用
,实现基于可扩展知识库的问答。
大模型
大模型
如何构建基于大模型的App
ChatGPT 的出现让大模型再一次成为业界的关注热点,然而,并不是每个组织都要去训练及生成大模型的,而且各个组织的
技
术积累和计算资源也不太允许这样去做。
构建
大模型App
开源
几款开源的OCR识别项目,收藏备
用
/github.com/tesseract-ocr/tesseract.git tesseract.js js版本的Tesseract OCR,支持一百多种语言,使
用
也是非常简单
OCR
开源
从声纹模型到语音合成:音频处理 AI
技
术前沿 | 开源专题 No.45
该项目还提供了其他功能: · MusicGen:一种最新
技
术实现的可控文本到音乐模型。
AudioCraft
音频
<
...
11
12
13
14
15
16
17
18
19
20
...
>
1
2
4
5
6
7
8
9
100