首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 完全指南——使用python提取PDF中的文本信息(包括表格和图片OCR)
· 大模型微调方法总结
· 大模型评测新思路:弱智吧精华问题大全
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 6个最佳开源TTS引擎
· 划重点!全网最全AI数字人工具合集!
· 国内外开源大语言模型一览表
· 如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator,一键计算大模型显存需求
· ComfyUI初学者指南
· 开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里出品自动化视频剪辑工具FunClip!
· 热词定制化:利用集成的SeACo-Paraformer模型,用户可以自定义一些专业
术
语、品牌名称或人名等作为热词
FunClip
视频
阿里
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
这个用了tile vae,潜空间
分
块高度不能超过160, 4,线稿上色linert,这个和canny差不多,但目前看效果还不错  
Stable
Diffusion
文生图
controlnet
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
高性能:与 Whisper-small(已开源) 和 Whisper-large 相比,SenseVoice-Small 的性能
分
别快 5 倍和 15 倍以上。
asr
tts
声音
大模型
复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
这些数据的关键作用在于帮助模型学习医疗领域的知识,将其行为模式与人类偏好对齐,并确保与真实世界在线医疗对话的
分
布情况相符。
大模型
大模型
如何下载及使用通义千问7B开源大模型
此外,杭州还有许多古迹、 文化街区、美食和艺
术
空间等,值得一去。
通义千问
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
Erwin_8.wav|Erwin|ZH|就必须像一个一流的诈骗犯一样 Erwin_9.wav|Erwin|ZH|对他们花言巧语一番 可以看到,除了语气特别强烈的素材,大部
分
都没有进行标点符号的标注
Whisper
语音优化
LLM
LLM native策略的内部状态是否应该结构化 【2023Q3】
这个明确的标准是:对于绝大部
分
case,都可以人工标注出内部状态的真值,来供ML算法优化。
大模型
提示词
18种 DALL-E 3 炫酷的文字效果和提示词
投下阴影的文字 "谷仓 "十
分
醒目,与图片风格一致。
DALL-E
3
提示词
文生图
工具
动画制作工具AnimateDiff用法详解
model参数对应的是模型,这里我们需要连接AnimateDiff的加载器节点 o positive 和 negative参数指的是正反提示词(Prompt)我们需要
分
别连上
AnimateDiff
视频
训练
Stable Diffusion
Stable Diffusion高级教程 - 图生图(img2img)模式
然后就是相关参数,大部
分
在文生图里面已经见过,只有Resize mode、Denoising strength是新增的,我们挨个介绍: 1.Resize mode。
Stable
Diffusion
图生图
GTC大会黄仁勋发言稿
世界上没有哪个会议能汇聚来自如此多元科学领域的研究人员,从气候科
技
到无线电科学,大家都在探索如何使用 AI 来机器人化控制 MIMOS,用于下一代 6G 无线电,自动驾驶汽车,甚至是各方面的人工智能。
黄仁勋
nvidia
SQL
RLHF 在 Text2SQL 领域中的探索
01 定义 Text-to-SQL(简写为Text2SQL),顾名思义就是把文本转化为 SQL 语言,更学
术
一点的定义是:把数据库领域下的自然语言(Natural Language
Text2SQL
RLHF
ChatGPT
Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
李老板昨天说『以后没有程序员这个职业了』,人人都拥有程序员的
技
能,这几天英伟达的黄老板也说了类似的话,把编程这个活交给AI,你的后台支撑那里来,来学习『大模型』吧,我想组个『大模型交流群』。
ChatOllama
安装
Meta
深度 | Meta AI助手大测评,市值蒸发万亿都因它?
一些基本的琐事问题,比如谁在 1984 年奥运会上赢得了最多的奖牌,以及那一年发生了哪些值得注意的事件,都得到了充
分
的回答和引用。
Meta
AI
测评
开源
OpenAI真的开源了!这波「实时语音」操作,让万物开口说话,我爱了
ESP32-S3 音频开发板 esp32s3 ,学过单片机的小伙伴都比较清楚,是一款微控制器芯片,如图长这个样子: ESP32-S3 是一款由 Espressif Systems(乐鑫科
技
)
OpenAI
嵌入式实时语音
SDK
<
...
78
79
80
81
82
83
84
85
86
87
...
>
1
2
4
5
6
7
8
9
100