在找BOSS聊了之后,终于放弃了文档指导灰常少的CMU SPHINX,开始研究HTK工具包,进行一系列的语音相关的工作。最近这几天一直都在看HTKBOOK,今天准备一边进行windows下安装和编译HTK库,一边把这其中的过程记录下来,跟大家一起分享。
HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做Hidden Markov Toolkit。官方网站:
下面让我们开始吧!
第一步:下载官方源代码:
这里可能需要注册,比较麻烦,也可以去网上搜索,已经有人从官网上下载好了。不过,要注意下载的是windows下,linux的也有,以后linux下的安装我也会写。下载之后,会有两个包:HTK Source code以及HTK sampls。我下载的版本是3.4.1。
第二步:解压文件,我在D盘中建立了一个文件夹HTK。将这两个包解压到里面。打开htk包里面有个README,里面有一些在windows下安装的要求:
* HTK has been verified to compile using Microsoft Visual Studio.
* For testing, you will require a Perl interpreter such as
ActivePerl.
* You will need a tool such as 7-zip or winzip (commercial) for unpacking
the HTK source code archive.
* It is helpful if you have some familiarity with using the DOS
command line interface, as you will need to interact with it in
order to compile, install and run HTK.
* Ensure that your PATH contains
C:\Program Files\Microsoft Visual Studio .NET 2003\Vc7\bin
Or if you are using older versions:
C:\Program Files\Microsoft Visual Studio\VC98\bin
进行一些准备工作ing.....LOADING...........
第三步:开始编译
1.打开CMD
2.进入到htk文件夹
3.创建一个文件夹bin.win32,这个文件夹用来存放各种.exe文件。
4.运行VCVARS32
4.1首先设置环境变量:
4.2输入VCVARS32