声控自动化技术让你动口不动手_kaiyun体育官方网页_kaiyuntiyu-kaiyun体育官方网站-kaiyun体育官方网页

声控自动化技术让你动口不动手

时间: 2024-10-24 00:47:08 | 作者: kaiyun体育官方网页

旨在向全国广大群众，特别是具有中等文化程度的广大青年，普及科学技术知识，繁荣科普创作，启迪思想，开拓视野。

一艘由日本制造的新型自动化远洋货轮，正行驶在前往澳大利亚的航线上。这艘货轮的外形并不特别，但它却有着过人之处——货轮的船长贴身携带着一只无线话筒，无论在船上的哪个区域，只要他对着话筒发出操纵货轮航行的口令，船上的主控电脑就能接收信号并予以识别，然后由它发出相应的操作信号，自动操纵货轮航行。

以上情景就是靠近年来最新声控自动化技术实现的，这项技术随着近年来电脑技术、微电子技术的不断变革，正在突飞猛进。在国际电子科技类产品市场上，不断涌现出能“听”会“说”的新产品，使用者只需动口就能轻松操控它们，它们甚至还能和使用者沟通交流。那么究竟这些新产品是怎么长出“耳朵”和“嘴巴”的呢？

声控技术的关键是要让机器能够听懂人的口令，这是一个非常复杂的过程，要想了解其中的奥秘，首先得谈谈人类的语言。

语言是一种波形复杂、变化多端的声波。科学家利用一种叫做语图仪的专门仪器分析过人类语言的动态频谱，结果发现，每个语音的语图都是由几条“带子”组成的。当然，语音不同，“带子”的形状也不同。但只要说的是同一个字音，那么不管是谁发声，这几条“带子”的形状都会基本一致。也就是说，每个语音中都含有某种不变的特质，而这个特质就是人的听觉将会感受到的核心因素，语言学家把它称为口腔共鸣的特征频率。

这些特征频率为科学家研发声控技术提供了便利——如果能够制造一种机器“耳朵”，并在其中嵌入每个语音的特征频率的“样板”，那么当这只“耳朵”听到人类的口令后，不就能将其分解成不同的语音，再同存储的“样板”进行比较核对，随后借助自动控制电路，最终实现按照口令完成各种动作了吗？

道理虽然简单，实际开发却并不容易，科研人员需要解决复杂的数学运算过程，同时克服一系列技术上的难题。

随着科学技术的进步，电脑的问世让人类制造这样的机器“耳朵”成为可能。20世纪60年代，科学家开始在实验室里研究声控技术的核心—语言识别技术。20世纪70年代末，微电脑的出现更是让声控技术实现了飞跃式发展——微电脑处理与存贮信息的神奇功能，以及它低廉的价格、小巧的体积，为声控技术走出实验室创造了必要条件，人们由此开启了实际应用声控技术的新时期。

20世纪70年代中期，美国出现了一种叫做“小先生”的电子玩具，它能向儿童提出简单的算术题和拼读英文单词题,而儿童则可以用说话来回答。如果回答正确，屏幕上就会出现“Yes”的字样，同时发出赞许声；如果回答错误，屏幕上则会出现“No”，同时继续提问。这种有趣的幼儿学习工具一经推出，便大受欢迎。

随后，丰富多彩的具有声控功能的电子产品开始不断问世：声控电机能根据使用者发出的口令，自动开关、选择电视频道、调节亮度与色度；声控打字机会按照人的口授，自动打字、断句、起行，还能自动阅读，让使用者方便校核；声控翻译器能把口述的简单语句，进行自动翻译，并将最终结果显示在屏幕上；声控电梯则可以让残障人士尽享便利，轻松操控电梯上下、开关……

比如苹果手机用户非常熟悉的Siri，就是一种智能语音控制系统，它不仅可以支持自然语言输入，还可以调用系统自带的天气预报、日程安排、搜索资料等应用，更能够不断学习新的声音和语调，提供对话式的应答。

最近，在英国还出现了专门为丧失生活自理能力人士设计的声控房间，室内的一切器具都可以通过主人发令而自动运行。房间内的声控装置只有一本笔记本大小，而且只能识别主人的指令，残障人士可以通过它轻松地开关门窗、启动家电。

在国外某些重要的通讯、交通或情报部门，声控技术还得到了更为实际的应用——自动预定车辆、分拣行李、查阅文献资料等等，不一而足。

目前，这些声控装置按照其识别语言的状况大致分为两类：一类是限定单词的语音识别声控装置，另一类则是非限定单词的语音识别声控装置。第一类装置只能“听”懂规定范围内的单词口令，一般只有几百个，识别率在90%以上。第二类装置能够“听”懂的单词数量在几千个左右，还可以识别复杂的语句，其中的技术自然也比第一类装置更先进。

时至今日，能够“听”懂人类语言的机器已经不是什么新玩意儿了，现在机器装置的发展新趋势是借助“电子嘴巴”为机器增加“说”的功能，而“电子嘴巴”就是语言合成器。微电子技术的迅猛发展，已经可以把这种复杂的装置制造成微小的大规模集成电路，推广普及应用到各种声控装置中。

机器能够模仿人声发出合成语言的道理，恰恰是语言识别过程的逆转。把合成语言频带的一系列不同频率的振荡电压，按照语图的形状组合起来，再经过扬声器放音，就是语言合成器的工作过程。

其实，这种人造语言技术远比机器识别语言技术要成熟得多。早在1939年，在美国纽约世界博览会上就曾展出过一台形似钢琴的大型仪器，它就能模拟人声发音讲话。这台最早的人工语言合成装置曾经轰动一时，但由于体积过于庞大，一直未能走向市场。如今，语言合成器日臻成熟完善，体积也不断缩小，终于有机会来到你我身边。

机器合成语言的方法通常有三种，其中效果最好、效率最高的就是波形译码法。这种方法是用极高的频率连续测定每个音节的声波波形，将测定结果变为二进位数码输入到电脑中，使用时只需将数码取出并经过适当组合，就能转换为电信号发出声音。不过，这种方法每秒大约要处理5万个码，在单位时间内需要处理的信息量太大，因此只有超级计算机才能胜任。第二种方法是音素合成法，它能把语音信息压缩到每秒100个数码，同时将声母音进行提取，按照顺序排列，配以音调发生器与滤波器，发出缓慢的、勉强可懂的人工合成语言。但这种方法的准确度较低，只能在要求不高的场合使用。第三种方法是当前比较流行的线性预测编码法，它是在音素合成法的基础上进一步完善而成的。

语言合成器除了作为声控装置的一部分得到应用外，还被制成了文字语言转换装置，比如为盲人量身打造的、能够“读书看报”的阅读机。

最近，在美国新奥尔良市举行的一次电脑展览会上，出现了一款使用者能够通过日常口语直接向电脑提问，或是操控电脑的新程序，人们不必再像以往那样借助键盘或鼠标输入各类指令——传统使用电脑的方式发生了改变。

电脑固然可以代替人的部分脑力劳动，但是它要求人们必须为其编制好程序。所以，编制程序才是人们掌握电脑的最大障碍，这也是正版软件价格可能超出电脑硬件价格的一个重要原因。假如声控技术逐步完善，将来就有可能免除人工编制程序的繁琐过程——电脑将会按照口令自行编制工作程序。事实上，这个美好的愿望很快就将实现，美国、日本和欧盟正在大力研发的第五代人工智能电脑，都将具有这类神奇功能。

目前来看，声控自动化技术还算不上尽善尽美，但相信大家都有更美好的期待。如果要用一句诗词来形容这项技术，那便是“此时无声胜有声”，不对，应该是“此时有声胜无声”！

京ICP备11000850号京公网安备8号信息网络传播视听节目许可证0111611号国家科技基础条件平台

国家科技基础条件平台在国际电子商品市场上，不断涌现出能“听”会“说”的新产品，使用者只需动口就能轻松操控它们，它们甚至还能和使用者沟通交流。那么究竟这些新产品是怎么长出“耳朵”和“嘴巴”的呢？>

上一篇:不走寻常路CPU反装益德EDAC-Q270双极主板装机体验

下一篇:中端独显好挑选!盈通飞刃A870X主板评测

kaiyun体育官方网站

天津天发获得一种发电机组辅佐预警设备专利进步发电机主体作业效率

歌尔多项首创技术亮相中国汽车工程学会年会

歌尔股份多项创始技能露脸中国轿车工程学会年会

天津天发获得一种发电机组辅佐预警设备专利进步发电机主体作业效率

歌尔多项首创技术亮相中国汽车工程学会年会

歌尔股份多项创始技能露脸中国轿车工程学会年会

创新驱动高校优质教育发展

声控自动化技术让你动口不动手

网站导航

联系方式