文章 技术教程

AudioNotes_AI音频转文字工具_提取音视频内容并转成Markdown笔记

首页 > 技术教程 > 正文

AudioNotes 是一款 AI 音频转文字工具,基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统,能够快速提取音视频内容,并调用大模型进行整理,生成结构化的 Markdown 笔记,便于快速阅读。

核心功能是利用先进的自动语音识别(ASR)技术,能够精准提取音视频中的文本内容,通过大模型整理生成清晰易读的笔记,并支持用户与音视频内容进行交互式对话以获取更多信息。

目前AudioNotes有两种部署方式,一种是使用 Docker 部署,另一种是本地部署,推荐使用Docker部署。

音视频识别和整理

AudioNotes_AI音频转文字工具_提取音视频内容并转成Markdown笔记第3张插图

AudioNotes如何使用

1,安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download

2,拉取模型

以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

ollama pull qwen2:7b

3,部署服务

有两种部署方式,一种是使用 Docker 部署,另一种是本地部署

Docker部署(推荐)

curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.ymldocker-compose up

docker 启动后,访问 http://localhost:15433/

登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)

本地部署

需要有可访问的 postgresql 数据库

conda create -n AudioNotes python=3.10 -yconda activate AudioNotesgit clone https://github.com/harry0703/AudioNotes.gitcd AudioNotespip install -r requirements.txt

将 .env.example 重命名为 .env,修改相关配置信息

chainlit run main.py

服务启动后,访问 http://localhost:8000/

登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)

免责声明
本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集整理,如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!
迅雷加速器新用户领19天会员
« 上一篇 07月28日
植物大战僵尸融合版v1.3黑夜下载地址,比原版更有趣!!
下一篇 » 07月29日

还没有评论,快来抢沙发吧!