英国谢菲尔德大学计算机科学硕士课程

英国谢菲尔德大学计算机科学硕士课程,第1张

课程说明:

可以尝试语音识别,语音合成,文本摘要,机器翻译,机器人学习和控制,计算生物学或虚拟现实。

除了学习编程和分析能力之外,还将鼓励你与团队合作并发展沟通技巧。

第三年,你将完成一个学位论文项目,为你提供创造性和智力投入的范围。

课程:

第一年宴猛颂

核心课程:

Foundations of Computer Science 计算机科学基础

Introduction to Software Engineering 软件工程概论

Java Programming Java程序设计

Machines and Intelligence 机器与智能

Introduction to Algorithms and Data Structures 算法和数据结构简介

Web and Internet Technology 网络和互联网技术

Global Engineering Challenge Week 全球工程挑战周

选修课程:

Devices and Networks 设备和网络

第二年

核心课程:

Automata, Computation and Complexity 自动机,计算和复杂性

Data Driven Computing 数据驱动计算

Robotics 机器人技术

Software Hut 软件小屋

Systems Design and Security 系统设计与安全

Functional Programming 功能编程

Logic in Computer Science 计算机科学中的逻辑

Engineering - You're Hired 工程-被雇用

第三年

核心课程:

Dissertation Project 论知族文项目

Finance and Law for Engineers 工程师财务与法律

选修课程:

3D Computer Graphics 3D计算晌郑机图形学

Adaptive Intelligence 自适应智能

Advanced Algorithms 高级算法

Bioinspired Computing 生物启发计算

Cognitive and Biomimetic Robotics 认知仿生机器人

Computer Security and Forensics 计算机安全与取证

Cyber Security Team Project 网络安全团队项目

Managing Engineering Projects and Teams 管理工程项目和团队

Modelling and Simulation of Natural Systems 自然系统的建模与仿真

Software Reengineering 软件再造

Software Testing and Analysis 软件测试与分析

Speech Processing 语音处理

Text Processing 文字处理

The Intelligent Web 智能网

The Internet of Things 物联网

Theory of Distributed Systems 分布式系统理论

第四年

核心课程:

Darwin Project 达尔文计划

TTS是指一项语音合成技术。

语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音简春合成器,而语音合成器可以用软/硬件所实现。

文字转语音系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。

扩展资料:

发展历史

1、17世纪法国人研发机械式的说话装置,直到19世轮咐高纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。

2、贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。

3、1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合腊尺成分析技术,并推动了日后的发展。

4、1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。

参考资料来源:百度百科-TTS

目前的语音技术能力主要包含了四个方面:语音唤醒、语音识别、语音理解和语音合成

语音唤醒

语音唤醒指在待机的状态下,用户说出特定指令(唤醒词)使设备进入工作状态或完成某一 *** 作;当前更多应用于手机、可穿戴设备、车载设备、智能家居等。

1、常见两种唤醒方式:“一呼一答”御喊和“唤醒词+命令词”;即多轮对话(一次唤醒、一个任务、多轮交互)和连续对话(一次唤醒、多个任务,无需唤醒)

2、唤醒词设计原则:易唤醒、低误唤醒 、品牌性、易记易读性

3、华为和苹果手机语言助手唤醒交互:

· 手机的语音助手都是基于特定的人识别,非用户本人无法用同样的唤醒词唤醒手机语音指令,

· 采取的唤醒方式均为“一呼一答”

· 唤醒词设计,华为的“我的荣耀”基于品牌调性,但易读性不强

· 在语音交互过程中,用问答的方式给到用户强反馈,单纯的铃声不足以引起用户触达,通常情况下用户使用语音是在不方便查看手机或者有其他干扰的情况下的。

语音识别

语音识别技术,也被称为 自动语音识别 Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

1、语音识别包括两个阶段 :训练和识别辩简。

训练阶段:收集大量的语音语料,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。

识别阶段:将输入语音的特征矢量参数和参考模型库中的参考模型 进行相似性度量比较,把相似性最高的输入特征矢量作为识别结果输出。

2、语音识别对象:特定人识别(手机语音助手,设定只识别手机用户个人的声音)、非特定人识别(语音搜索,识别搜索词)。

特定人识别是指识别对象为专门的人,非特定人识别是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,达到较高的识别率。

3、基于现有技术开发嵌入式语音交互系统,目前主要有两种方式:

一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大,计算复杂,需要占用大量的处理器资源,开发周期长;

第二种方法相对简单,只需要关注语音芯片的接口部分与微处理器相连,结构简单,搭建方便,微处理器的计算负担大大降低,增强了可靠性,缩短了开发周期。

语音理解

语义理解是指机器能够结合上下文,自然地理解用户的需求,并能给出正确以及人性化的反馈。

语音合成

语音合成是通过机械的,电子的方法产生人造语音技术。语音合成的关键点是真人音色模拟,一致性、流畅性、稳定和有情感。

语音合成,又称 文语转换(Text to Speech)技术 ,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、 数字信号处理携拆裤 、计算机科学等多个学科技术,是 中文信息处理 领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

TTS结构

语言处理

在文语转换系统中起着重要的作用,主要模拟人对自然语言的理解过程——文本规整、词的切分、 语法分析 和 语义分析 ,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。

韵律处理

为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然。

声学处理

根据前两部分处理结果的要求输出语音,即合成语音。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12562085.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-26
下一篇 2023-05-26

发表评论

登录后才能评论

评论列表(0条)

保存