首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用ChatGPT润色出高品质文章!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 实操:基于 Ollama+AnythingLLM 的 AI 超级阅读法
· 从零开始了解AI大模型 - 概念篇:一文带你走进大模型世界
· 大模型量化:什么是模型量化,如何进行模型量化
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
中文LLaMA-2基座模型和Alpaca-2指令精调大模型-中文LLaMA-2以及Alpaca-2系列模型
这些模型在原版Llama-2的基础上扩充并优化了中文词表,使用了大规模中文数据进行增量预训练,进一步提升了中文基础语
义
和指令理解能力,相比一代相关模型获得了显著性能提升。
大模型
阿里
阿里出品自动化视频剪辑工具FunClip!
它依托于阿里巴巴
通
义
实验室的FunASR Paraformer系列模型,实现了视频中语音的自动识别。
FunClip
视频
阿里
开源
中文开源OCR框架对比及介绍
从严格定
义
来看,学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。
OCR
请以“续航”为题目,写一篇议论文
通
义
千问 “续航”一词,原指连续航行,今天在使用中被赋予了新的含
义
,如为青春续航、科技为经济发展续航等,都是指在长时间的持续中保持足够的能量,以完成自己的任务。
中文
训练
大模型
Stable Diffusion
Stable Diffusion基础:ControlNet之细节替换
如果提示词和区块内的对象匹配,它会在不改变对象定
义
的情况下,生成新的细节,替换之前的细节;如果提示词和区块内的对象不匹配,它会以对象为准,降低提示词的影响。
StableDiffusion
文生图
Stable Diffusion
Stable Diffusion高级教程 - 图生图(img2img)模式
顾名思
义
,除了根据正向和反向提示词之外,还需要基于一张图片生成图。
Stable
Diffusion
图生图
写作
提高写作能力的90个prompt大全
无论是创意写作、信息检索还是解决问题,任务定
义
的特异性都是至关重要的。
prompt
写作
LLM
基于LLM+向量库的文档对话痛点及解决方案
痛点:文档切分粒度不好把控,既担心噪声太多又担心语
义
信息丢失 笔者之前采用了Longchain的文档切分工具,发现不能问题。
开源模型
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
这不仅对于娱乐行业有着重要的意
义
,同时在教育、社交等领域也展现出巨大的潜力。
MimicTalk
开源模型
科大讯飞
哈工大科大讯飞联合推出中文LLaMA-2 & Alpaca-2大语言模型
这些模型在原版Llama-2的基础上扩充并优化了中文词表,使用了大规模中文数据进行增量预训练,进一步提升了中文基础语
义
和指令理解能力,相比一代相关模型获得了显著性能提升。
训练
新模型Cascade你真的用对了吗?!
§ § 其次是硬件要求降低,甚至与sd1.5相比,该架构比之前版本实现了16倍的成本降低; § 最后一大亮点是模型更加理解提示词语
义
。
Stable
Cascade
模型
开源
十大开源语音识别项目
Automatic Speech Recognition(ASR)是一项自动语音识别技术,其目标是
通
过计算机自动将人类口头语音转录为文本。
语音识别
开源项目
心理
万字长文,大语言模型如何宣告心理学的死亡?
通
过操作性定
义
,研究者将这些稳定的特质转化为可以观察和量化的行为数据或问卷得分1。
大语音模型
一位芯片投资人的十年复盘:谁是中国的英伟达|AI光年
2015年,杨光和前同事白宗
义
一起创立了耀途资本,布局半导体领域围绕消费电子、汽车电子、数据中心与云计算等应用场景,投资了壁仞科技、瀚博半导体、爱芯元智、云豹智能、Hailo、Vayyar和星宸科技(301536
AI光年
芯片投资
Github
我去,找到一个Github上非常优秀的AI项目,可控制鼠标、键盘,模拟人类操作,太丝滑,收藏~~~
Cradle 是由 BAAI‑Agents 团队开源的一款面向
通
用计算机控制(GCC) 的多模态 AI Agent 框架,可以让大型多模态模型,
通
过截图输入和键鼠输出
AI
Agent
开源项目
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100