当前位置: 首页 > news >正文

企慕网站建设网络推广广州网站设计建设

企慕网站建设网络推广,广州网站设计建设,网站建设营销策划书,广东省做农业网站公司构建一个语音转文字的WebApi服务 简介 由于业务需要,我们需要提供一个语音输入功能,以便更方便用户的使用,所以我们需要提供语音转文本的功能,下面我们将讲解使用Whisper将语音转换文本,并且封装成WebApi提供web服务…

构建一个语音转文字的WebApi服务

简介

由于业务需要,我们需要提供一个语音输入功能,以便更方便用户的使用,所以我们需要提供语音转文本的功能,下面我们将讲解使用Whisper将语音转换文本,并且封装成WebApi提供web服务给前端调用。

创建项目

  1. 第一步打开Vscode,选择一个目录作为工作空间,然后打开控制台,输入以下指令创建一个WebApi的项目:
dotnet new webapi -n Whisper --no-openapi=true
  1. 添加依赖包的引用:
    1. Whisper.netWhisper.cpp的.NET封装
    2. Whisper.net.Runtime.Clblast则是使用GPU的包,当然也可以不使用GPU
<PackageReference Include="Whisper.net" Version="1.5.0" />
<PackageReference Include="Whisper.net.Runtime.Clblast" Version="1.5.0" />
  1. 下载一个模型:https://huggingface.co/ggerganov/whisper.cpp/tree/main ,找到ggml-base-q5_1.bin下载,请注意的是带en的是只识别英文的。其他的是全语言。

  2. 下载一个语音示例文件 https://github.com/sandrohanea/whisper.net/blob/main/examples/TestData/kennedy.wav

<ItemGroup><None Update="ggml-base-q5_1.bin"><CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory></None><None Update="kennedy.wav"><CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory></None></ItemGroup>

实现基本使用案例

将俩个文件复制到部署目录

创建WhisperService.cs并且读取音频文件然后返回识别结果

public class WhisperService
{/// <summary>/// 音频转文字/// </summary>/// <param name="processor">注入的对象</param>/// <returns></returns>public static async Task<string> SpeechRecognitionAsync(WhisperProcessor processor){var sw = Stopwatch.StartNew();var wavFileName = "kennedy.wav";await using var fileStream = File.OpenRead(wavFileName);var str = string.Empty;await foreach (var result in processor.ProcessAsync(fileStream)){Console.WriteLine($"{result.Start}->{result.End}: {result.Text}");str += result.Text;}sw.Stop();Console.WriteLine($"翻译耗时:{sw.ElapsedMilliseconds}ms 翻译结果:{str} 文件大小:{fileStream.Length}");return str;}}

修改Program.cs

var builder = WebApplication.CreateBuilder(args);builder.Services.AddEndpointsApiExplorer();
builder.Services.AddSwaggerGen();// 注册单例的WhisperFactory,并且使用ggml-base-q5_1.bin模型
builder.Services.AddSingleton<WhisperFactory>((services) => WhisperFactory.FromPath("ggml-base-q5_1.bin"));
builder.Services.AddSingleton((services)=>
{// 从构建的服务中获取WhisperFactoryvar whisperFactory = services.GetRequiredService<WhisperFactory>();return whisperFactory.CreateBuilder().WithLanguage("auto") // 自动识别语言.Build();
});var app = builder.Build();if (app.Environment.IsDevelopment())
{app.UseSwagger();app.UseSwaggerUI();
}// 使用MiniApis构建一个简单的API,使用WhisperService.SpeechRecognitionAsync方法
app.MapGet("/whisper/speech-recognition", WhisperService.SpeechRecognitionAsync).WithName("whisper").WithOpenApi().WithDescription("识别语音文件");await app.RunAsync();

服务构建完成,下面运行体验效果:

在控制台输入:

cd .\Whisper\
dotent run
  • 显卡:1050Ti

  • 耗时:3385ms

  • 显卡:4080
  • 耗时:800ms

总结:

在本次会议中,讨论了构建一个语音转文字的WebApi服务的流程和步骤。主要内容包括创建项目、添加依赖包的引用、下载模型和语音示例文件、实现基本使用案例以及服务构建完成后的运行体验。

行动项目:

  • 下载并添加依赖包Whisper.netWhisper.net.Runtime.Clblast
  • 下载模型ggml-base-q5_1.bin和语音示例文件kennedy.wav,并将其复制到部署目录。
  • 创建WhisperService.cs,实现音频转文字的功能。
  • 修改Program.cs,注册WhisperFactory并构建API,使用WhisperService.SpeechRecognitionAsync方法。
  • 运行服务,测试效果。

分享

技术交流群:737776595

http://www.ds6.com.cn/news/121732.html

相关文章:

  • 一站式网站建设供应商汕头seo推广优化
  • 设计本官方网站广告关键词自动优化
  • 南京网站制作公司怎么样站长工具站长
  • 景县做网站一键建站
  • 广东品牌网站建设一个完整的产品运营方案
  • 可以做电算化的网站郑州seo询搜点网络效果佳
  • 男人和男人做爰漫画网站上海网站建设方案
  • 做网站哈尔滨网站seo如何优化
  • 微网站建设加盟开发网站的公司
  • 网站设计的要素南山网站seo
  • 哪些企业喜欢做网站广告关键词排名怎样
  • 常州做网站咨询今天株洲最新消息
  • 网站挣钱网网络游戏排行榜百度风云榜
  • 做图片素材的网站有哪些网站设计与制作教程
  • 上海建设厅焊工证查询网站曹操博客seo
  • wordpress 底部菜单windows优化大师有哪些功能
  • 黄浦集团网站建设千万不要学网络营销
  • 购物网站含有哪些模块资讯门户类网站有哪些
  • 设计师网站哪个好长春疫情最新消息
  • 网络优化工程师有前途吗seo网站首页推广
  • 菲律宾bc网站总代理怎么做免费引流推广
  • 做司法亲子鉴定网站站长之家seo查询
  • 网站建设方案模板下载网络营销顾问
  • 成都网站设计关键词优化软件
  • 老师用什么网站做ppt天津百度seo排名优化
  • 肇庆网站快速排名优化免费模板素材网站
  • wordpress电影站主题网站一般需要怎么推广
  • 摇滚中国发展史日本人做的网站深圳网站建设推广方案
  • 江西赣州网络公司关键词优化seo外包
  • 网站改备案吗无锡网站建设方案优化