Golang 基于chrome浏览器语音识别web演示系统WebHTK开发之引擎篇_语言综合

概述要说引擎篇，也谈不上。底层语音识别的实现，是基于HTK开源语音识别工具：http://htk.eng.cam.ac.uk/# 前面用过这个工具，也用JNI转成java可调用的接口，所以还算比较熟悉。这次引擎，也只是用cgo来转。HMM模型都是用HTK的工具训练好的，只要有数据，baidu，google上教程还是很多的，自带的HTKBOOK就是最权威的教程。在实现阶段，主要就是用到三个

要说引擎篇，也谈不上。底层语音识别的实现，是基于HTK开源语音识别工具：http://htk.eng.cam.ac.uk/# 前面用过这个工具，也用JNI转成java可调用的接口，所以还算比较熟悉。这次引擎，也只是用cgo来转。HMM模型都是用HTK的工具训练好的，只要有数据，baIDu，Google上教程还是很多的，自带的HTKBOOK就是最权威的教程。

在实现阶段，主要就是用到三个工具：Hcopy(提取特征)，HVite(viterbi算法识别)，HParse(制作语法词网)。看看都需要哪些文件：

650) this.width=650;" src="http://img.jb51.cc/vcimg/static/loading.png" title="aa.png" width="700" height="236" border="0" hspace="0" vspace="0" alt="wKioL1MgX8WC7bXtAAHYI_12NLw965.jpg" src="http://s3.51cto.com/wyfs02/M02/22/98/wKioL1MgX8WC7bXtAAHYI_12NLw965.jpg">

这些文件中，只有上述三个Hcopy.c，HVite.c，HParse.c还有main主函数，所以只要把三个main函数重命名下，传参仍不变，并修改下这三个文件中一些相同命名的函数（比方Usage这类的），再写个asr.h的头文件，把上述重命名的三个main函数加进去就ok了,asr.h：

#ifndef ASR_Hint Hcopy(int argc,char *argv[]);int HVite(int argc,char *argv[]);int HParse(int argc,char *argv[]);#endif

再看下HTKengine.go：

package HTKengine                                                                                                                                                                                              //#include "asr.h"//#include "string.h"//#include "stdlib.h"import "C"import "unsafe"                                                                                                                                                                                              type cmd struct {    HcopY  string    HVITE  string    HPARSE string}                                                                                                                                                                                              var Command *cmd = &cmd{"Hcopy","HVite","HParse"}                                                                                                                                                                                              func Hcopy(args []string) {    arg := make([](*_Ctype_char),0)    l := len(args)    for i,_ := range args {        char := C.CString(args[i])        defer C.free(unsafe.Pointer(char))        strptr := (*_Ctype_char)(unsafe.Pointer(char))        arg = append(arg,strptr)    }                                                                                                                                                                                                  C.Hcopy(C.int(l),(**_Ctype_char)(unsafe.Pointer(&arg[0])))}                                                                                                                                                                                              func HVite(args []string) {    arg := make([](*_Ctype_char),0)    l := len(args)                                                                                                                                                                                                  for i,strptr)    }                                                                                                                                                                                                  C.HVite(C.int(l),(**_Ctype_char)(unsafe.Pointer(&arg[0])))}                                                                                                                                                                                              func HParse(args []string) {    arg := make([](*_Ctype_char),strptr)    }                                                                                                                                                                                                  C.HParse(C.int(l),(**_Ctype_char)(unsafe.Pointer(&arg[0])))}

原来的main都是要跟上args参数的，这里把他作为接口调用，所以还是需要传进args []string。在我前面的博客中，有提到cgo，可以参考下：

golang在window环境下用cgo编译c语言

Golang cgo编程 [] string 转 C语言 char**

在前面录音篇，有大概讲到在服务器保存wav文件，Hcopy就直接跟在wav保存的代码后，而HVite跟在Hcopy后。现在时间不允许，否则，可以改下Hcopy的代码，直接传byte[]数据。其实在pocketsphinx中就是这么实现的，有空也可以给pocketsphinx写几个cgo的接口来调用。

关于这个系列的博客，应该不会再写什么了，web到这，功能已经完成80%，后面也就是添加些，动态添加待识别语句到数据库的功能，说白了，就是你想识别哪些语句，你可以自己定义，提交给服务器，通过HParse重新制作词网来搞定的。也没有什么跟web开发有很大关系的，顶多是涉及到数据库，不过目前我对数据库了解不多，也只用到简单的CRUD *** 作，所以嘛，就不多写了。

上周接到网易游戏的面试电话，木有任何准备，被虐的狗一样啊。所以近阶段的博客，应该会写些java，golang数据结构方面的吧。

总结

以上是内存溢出为你收集整理的Golang 基于chrome浏览器语音识别web演示系统WebHTK开发之引擎篇全部内容，希望文章能够帮你解决Golang 基于chrome浏览器语音识别web演示系统WebHTK开发之引擎篇所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1291360.html

Golang 基于chrome浏览器语音识别web演示系统WebHTK开发之引擎篇

发表评论

评论列表（0条）

Golang 基于chrome浏览器语音识别web演示系统WebHTK开发之 引擎篇

发表评论

评论列表（0条）

Golang 基于chrome浏览器语音识别web演示系统WebHTK开发之引擎篇