LOADING STUFF...

热门

FireRedASR

2个月前发布 7 00

FireRedASR是一款由FireRedTeam开发的开源工业级自动语音识别（ASR）模型，支持普通话、中文方言和英语。它在公开的普通话 ASR 基准测试中取得了新的最优结果，并且在歌词识别方面表现出色。

收录时间：

2025-02-18

AI大模型 AI工具 # FireRedASR下载 # 开源语音识别工具 # 自动语音识别模型

FireRedASR

FireRedASR

FireRedASR是一款由FireRedTeam开发的开源工业级自动语音识别（ASR）模型，支持普通话、中文方言和英语。它在公开的普通话 ASR 基准测试中取得了新的最优结果，并且在歌词识别方面表现出色。

主要特点

多模型支持：FireRedASR 包括两个变体：FireRedASR-LLM 和 FireRedASR-AED。FireRedASR-LLM 采用编码器-适配器-大型语言模型 (LLM) 架构，旨在实现端到端的语音互动。FireRedASR-AED 采用注意力机制的编码器-解码器 (AED) 架构，旨在平衡高性能和计算效率。
高性能：在公开的普通话基准测试中，FireRedASR-LLM (8.3B 参数) 的平均字符错误率 (CER) 为 3.05%，超过最新的最优结果。 FireRedASR-AED (1.1B 参数) 的平均 CER 为 3.18%，虽然略低于 FireRedASR-LLM，但仍优于最新的最优模型。
多语言和多任务能力： FireRedASR 在中文方言和英语的 ASR 测试中也表现出色，并在歌词识别方面表现突出。
开源与社区支持： FireRedASR 的模型和推理代码已经开源，用户可以在 GitHub 上获取和使用。

FireRedASR的应用场景

智能语音交互：FireRedASR可以应用于智能语音助手、语音输入法等场景，提供高精度的语音识别服务。
多媒体内容理解：FireRedASR在视频字幕生成、歌词识别等多媒体内容理解场景中表现出色。
日常场景应用：FireRedASR在短视频、直播、语音输入和智能助手等多种日常场景下表现出色，与业内领先的ASR服务提供商和Paraformer-Large相比，CER相对降低23.7%~40.0%。

FireRedASR相关链接：

项目地址：https://github.com/FireRedTeam/FireRedASR
论文地址：https://arxiv.org/abs/2501.14350

数据统计

相关导航

Seed-TTS

Seed-TTS是由字节跳动开发的一系列大规模自回归文本到语音（TTS）模型。它能够生成高度自然、与人类语音几乎无法区分的语音。这个模型特别擅长学习语音上下文、说话人相似度和自然度等方面的特征，从而产生质量极高的语音输出。

星火纪要

星火纪要是一款专业的会议交流总结与分析平台，利用领先的语音识别技术和大模型技术，帮助企业在销售、访谈、头脑风暴、工作坊等多场景中快速提炼讨论重点，并提供深度业务分析支持，显著提升企业效率和决策能力。

Midjourney翻译站点

Midjourney是一个人工智能AI绘画工具，只要输入一些关键词，就能通过AI算法生成相应的图片。它可以选择不同的画家的艺术风格，例如安迪华荷、达芬奇、达利和毕加索等，还能识别特定的镜头或摄影术语。它与谷歌的Imagen和OpenAI的DALL-E不同，它是第一个快速生成AI制图并开放给大众申请使用的平台。用户可以通过Discord的机器人指令进行操作。

JoyGen

JoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成，旨在实现精确的嘴唇-音频同步和高视觉质量。

DeepSwap

DeepSwap是一款功能强大、使用简单的在线AI换脸工具。它集成了AI视频生成器、照片编辑器和GIF制作工具，支持视频、照片和GIF格式的换脸操作。DeepSwap的使用非常简单，用户只需上传自己的照片或视频，选择需要替换的人脸，然后系统会自动进行人脸检测和替换。虽然DeepSwap是一款收费应用，但提供免费试用，试用期结束后用户需要购买套餐才能继续使用。

百度文库智能漫画

AI漫画创作工具

WooWell

What is WooWell? WooWell helps...

SEED-Story

SEED-Story是一个腾讯开源的基于大型语言模型（MLLM）的多模态长篇故事生成模型，它能够根据用户提供的图片和文本生成连贯的叙事文本和风格一致的图片。无论是小说创作、剧本编写还是视觉故事，SEED-Story都能提供高质量、多模态的内容，助力创意产业的发展。

暂无评论

您必须登录才能参与评论！

none

暂无评论...