随着城市建设步伐的加快,城市公共交通也得到了迅速发展,公交线路越来越多,极大地方便了市民和外地游客。同时,公交公司也为人们提供了电话查询公交线路的服务热线。目前的服务热线是人工查询和自动查询2种方式。
在人工查询时,时间长、效果不好;在自动查询时,人们根据语音提示,采用按键 *** 作的方式,也要进行较长的时间才能查询完毕。例如:如果您要查询“105‘路公交车的运行情况,就需要将”1“, ”0“,”5“三个数字通过电话机进行按键选择;如果您要查询去某一个地方的所有公交车次,那只能通过人工查询了,因为通过按键是不能实现这种查询服务的。
伴随着计算机技术和数字电子技术的重大突破性发展,语音识别技术也趋于成熟,尤其是在大词汇量、非特定的连续语音识别方面,取得了重大进展,已经进入到实用阶段[1]。因此,我们提出了采用一种公共语音识别系统对原有的服务热线进行改造的方案。
1 公交线路智能查询系统的特点
该公交线路语音查询系统包括按键查询(只包含公交线路查询)和语音查询(含按公交线路查询和按城市地点查询)2部分,其中按键查询主要为了适应老客户,但系统主体是语音查询,其特点有:
(1)实现了交互问答式查询,用户只需按系统的提示作出相应的回答,便可得到自己所需的信息。
(2)作为系统本身来说,实现了语音识别的大众化,任何第一次使用本系统的用户,不需经过语音训练,便可满意的得到所需信息。
(3)可统计系统每天的话务量。
2 系统结构与软件方法
系统[1.2]主要由计算机网络、人工座席、语音处理及存储、系统管理(数据库管理十语音编辑)几部分组成,如图1所示。本系统使用了工业机,性能稳定,系统平台为Windows NT *** 作系统,其作用是利用计算机和数字语音卡来处理大量繁杂的电话业务,提供开放式的公交线路智能查询服务,具有速度快、全天候、高效率等特点。
2.1 系统软硬件平台配置和开发工具选择(按30线配置)
系统的硬件采用工控机,以实现较高的性能价格比,而且可以通过计算机集群系统大幅度提高整个系统的性能。具体是CPU为P4 2.4G以上,内存为1G以上,硬盘为60G以上。
系统的软件平台选择Windows NT。Windows NT具有良好的图形管理功能,而且提供了可靠的技术支持和开发环境。
语音卡采用D321/641语音卡,该卡在WindowsNT下的开发非常成熟,可以处理各种不同的需求。
D321/641[3]语音卡具有一下特点:
(1)集30/60路语音处理和El/2e1(PCM)数字中继接口于一体,同时支持一号信令(ssl)和数字一号信令(Dssl)。
(2)功能强大,性价比高,便于用户构建性能稳定、多功能的应用系统。
(3)采用全DSP结构,处理能力强大,可减轻主机负担,保证高密度、大容量的应用系统高效稳定地运行。同时,DSP技术便于软件升级。
数据库系统采用SQL Server。SQL Server是Windows NT环境下比较成熟的数据库产品,他具有大型数据库系统的所有特性,而且便于与NT集成管理。
开发工具选择Visual C++++,Visual Basic等。Visual C++功能强大、控制灵活,可以处理各种程序设计的需要;Visual Basic编制程序速度快,对程序设计人员要求不高,因此将两者结合起来使用。
2.2 软件设计
本系统界面由Visual Basic 6.0编程实现。以汉字和图标明确显示其功能, *** 作简单,一目了然,便于值班人员 *** 作和监控。
各功能程序由Visual C++编程实现,主要分为:检测振铃事件及接受用户语音实现相应的功能调用;确定进入系统后界面菜单的有效状态以及检测和初始化电话语音卡;登录数据库服务器。
2.3 数据库服务器的设计
客户/服务器结构[4]是基于数据库的应用程序广泛采用的一种结构。他利用了计算机系统硬件和软件分布的不平衡性,把数据服务集中在服务器端,而识别客户端则专门负责处理应用逻辑和界面。这使得程序开发的复杂性大大降低,同时识别客户端和识别服务器实时通信、协同工作,减少了时延,保证了较高的识别效率。客户/服务器结构包括了2个独立的实
体:识别客户端和识别服务器。前者上运行的应用程序称为”前端“或”前台“,后者的称为”后端“。也就是说,服务器增加了”后端数据库引擎“,电话接入时,识别客户端接管电话用户的语音输入,实时传送到识别服务器,并把识别服务器的识别结果向电话应用平台层返送,然后进行内部运算查找符合条件的数据,此时客户机还可以利用这些闲置时间处理其他的工作,等到服务器处理完毕,就会把所需的数据传递给前端应用程序。
由于客户/服务器结构的前端应用程序并不直接对数据库进行处理,因此利用ODBC作为一个桥梁帮我们打开前端应用程序与后端数据库管理系统的通道,并且由ODBC API提供制式化的控制函数来维护服务器的数据库数据。
语音合成的处理是通过边合成边播放的策略,避免了由于合成长文本带来的较大的延时。该系统在分段播放语音时,用户的任何打断都可以中止该次合成任务,免去了无谓的资源消耗。
3 系统的实现
本系统在启动时,首先会访问DataSource.ini文件,从中读出有关数据库信息,若数据库服务器的数据改动时,只需改动此文件便可。DataSource.ini文件内容如下:
[Source]
namc=flight
[DSN]
name=”ODBC ;DSN=flight;UID=flight;PWD=flight’其中:nAME=flight为数据源名称,DSN为数据源名称,UID为用户ID,PWD为用户密码。
图2为用户通过语音实现的自动查询系统流程图。
4 结 语
本系统是以通信系统为背景,满足实际需要为目的,采用现有成熟的硬件产品与软件开发相结合的方法设计的一种使用方便、功能完善的语音查询系统,集成语音识别和语音合成技术,改变旧的使用电话按键查询的使用方式,支持语音输入,人性化的语音界面使查询更便捷、更有亲和力,为公交系统的热线服务提供了可靠的技术支持。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)