终端装置和通信控制方法

发明专利有效专利

申请号：
CN02160253.0
IPC分类号：H04Q7/32;H04M1/247;H04M1/64
申请日期：
2002-10-30
申请人：
日本电气株式会社

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	终端装置和通信控制方法
申请号	CN02160253.0	申请日期	2002-10-30
法律状态	授权	申报国家	中国
公开/公告日	2003-06-04	公开/公告号	CN1422098
优先权	暂无	优先权号	暂无
主分类号	H04Q7/32 ? IPC结构图谱： H 电学 H9 电学 H04 电通信技术 H04Q 选择（开关、继电器、选择器入H01H；无线通信网络入H04W）〔1，2009.01〕 H04Q7/32 （转入H04W 88/02至H04W 88/06，H04W 92/08至H04W 92/10）	IPC分类号	H;0;4;Q;7;/;3;2;;;H;0;4;M;1;/;2;4;7;;;H;0;4;M;1;/;6;4查看分类表>
申请人	日本电气株式会社	申请人地址	日本东京都变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	日本电气株式会社	当前权利人	日本电气株式会社
发明人	疋岛直树
代理机构	中国专利代理（香港）有限公司	代理人	程天正;陈霁

摘要

作为第一通信方的终端的终端装置包括：声音识别装置，它在通信连接到第二通信方终端的期间内，当模式被设置为声音识别模式时，作为数字声音信号接收从第二通信方终端发送的第二通信方的声音，并执行声音识别以便把数字声音信号转换成文本数据；以及控制装置，用于以使得从输出装置输出通过声音识别装置转换了的文本数据的方式来执行控制。

1.一种作为第一通信方终端的终端装置，包括：
声音压缩装置，用于压缩通过声音输入装置输入并转换为数字信号的声音信号，并且用于输出该压缩了的信号；
调制装置，用于调制从声音压缩装置输出的压缩了的信号以产生输出的调制了的信号；
无线传输装置，用于接收和无线传输从调制装置输出的调制了的信号；
解调装置，用于解调在无线接收装置中接收到的信号以产生将输出的解调了的信号；
声音扩展装置，用于接收和扩展在解调装置中解调了的信号以产生将输出的扩展了的数字声音信号；
声音识别装置，用于使从声音扩展装置输出的数字声音信号接受声音识别来把数字声音信号转换成将输出的文本数据；
声音输出装置，用于接收和输出从声音扩展装置输出的数字声音信号所转换的模拟声音信号；以及
控制装置，用于以下述方式来执行控制，当模式被设置为声音识别模式时，把在声音扩展装置中扩展了的数字声音信号输入到声音识别装置中并接受声音识别，把从声音识别装置输出的文本数据发送给显示装置并在显示装置上显示。
2.根据权利要求1的终端装置，其中所述输出装置包括显示装置，文本数据被显示在所述输出装置上。
3.根据权利要求1或2的终端装置，其中所述输出装置包括用于把从声音识别装置输出的文本数据发送给第二通信方终端的装置。
4.根据权利要求1的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信号发送给第二通信方终端的装置。
5.根据权利要求1的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多路复用了的信号发送给第二通信方终端的装置。
6.根据权利要求1的终端装置，其中声音识别装置接收通过在解调装置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解调了的信号而得到的数字声音信号以作为输入数据，并对其执行声音识别。
7.根据权利要求1的终端装置，其中作为声音识别结果的文本数据在显示装置上显示。
8.根据权利要7的终端装置，进一步包括用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二通信方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信号的装置。
9.根据权利要求1的终端装置，进一步包括：
一个操作键，用于启动声音识别开始的指令；以及
用于依据操作键的预定操作，启动由声音识别装置执行由声音到文本数据的转换的装置。
10.根据权利要求1的终端装置，进一步包括：
用于当要监视的预定信号的状态满足预定要求时，启动由声音识别装置执行由声音到文本数据的转换的装置。
11.一种作为第一通信方终端的终端装置，包括：
声音识别装置，用于执行输入声音信号的声音识别以便把该声音信号转换成将输出的文本数据；
第一多路复用装置，用于允许作为从声音识别装置输出的声音识别的一个结果的文本数据和从图像输入装置输入并转换为数字信号的图像信息的输入，并且用于多路复用它们以便产生将被输出的多路复用了的信号；
图像压缩装置，用于接收和压缩从该第一多路复用装置输出的信号来产生将输出的压缩了的图像信号；
声音压缩装置，用于压缩经过声音输入装置输入并转换为数字信号的声音信号来产生将输出的压缩了的声音信号；
第二多路复用装置，用于允许从图像压缩装置输出的信号及从声音压缩装置输出的信号的输入，并多路复用它们来产生将输出的多路复用了的信号；
调制装置，用于调制从第二多路复用装置输出的信号来产生将输出的调制了的信号；
无线传输装置，用于接收并无线传输从调制装置输出的信号；
解调装置，用于解调在无线接收装置中接收到的信号来产生将输出的解调了的信号；
分离装置，用于允许在解调装置中解调了的信号的输入，并把输入信号分离成将输出的图像信号和声音信号；
图像扩展装置，用于接收和扩展在分离装置中分离出的图像信号来产生将输出的扩展了的数字图像信号；
声音扩展装置，用于接收和扩展在分离装置中分离出的声音信号来产生将输出的扩展了的数字声音信号；
显示装置，用于接收和显示从图像扩展装置输出的数字图像信号所转换的模拟信号；
声音输出装置，用于接收和输出从声音扩展装置输出的数字声音信号所转换的模拟声音信号；以及
控制装置，用于以下述方式来执行控制，当模式被设置为声音识别模式时，把在声音扩展装置中扩展了的数字声音信号输入到声音识别装置中并使其受到声音识别，把从声音识别装置输出的文本数据发送给第一多路复用装置。
12.根据权利要求11的终端装置，其中所述输出装置包括显示装置，文本数据被显示在所述输出装置上。
13.根据权利要求11或12的终端装置，其中所述输出装置包括用于把从声音识别装置输出的文本数据发送给第二通信方终端的装置。
14.根据权利要求11的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信号发送给第二通信方终端的装置。
15.根据权利要求11的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多路复用了的信号发送给第二通信方终端的装置。
16.根据权利要求11的终端装置，其中声音识别装置接收通过在解调装置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解调了的信号而得到的数字声音信号以作为输入数据，并对其执行声音识别。
17.根据权利要求11的终端装置，其中作为声音识别结果的文本数据在显示装置上显示。
18.根据权利要求17的终端装置，进一步包括用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二通信方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信号的装置。
19.根据权利要求11的终端装置，进一步包括：
一个操作键，用于启动声音识别开始的指令；以及
用于依据操作键的预定操作，启动由声音识别装置执行由声音到文本数据的转换的装置。
20.根据权利要求11的终端装置，进一步包括：
用于当要监视的预定信号的状态满足预定要求时，启动由声音识别装置执行由声音到文本数据的转换的装置。
21.根据权利要求11的终端装置，其中控制装置包括，用于以使得从声音识别装置输出的文本数据发送给显示装置并在显示装置上显示的方式来执行控制的装置。
22.一种作为第一通信方终端的终端装置，包括：
声音压缩装置，用于压缩通过声音输入装置输入并被转换为数字信号的声音信号，来产生将被输出压缩了的信号；
声音识别装置，用于执行通过声音输入装置输入和转换为数字信号的声音信号的声音识别来把声音信号转换成将输出的文本数据；
第一调制装置，用于调制从声音压缩装置输出的信号来产生将输出的调制了的声音信号；
第二调制装置，用于调制输入的文本数据来产生将输出的调制了的文本数据；
多路复用装置，用于接收从第一调制装置输出的信号和从第二调制装置输出的信号，并多路复用它们来产生将输出的多路复用了的信号；
无线传输装置，用于接收和无线传输从多路复用装置输出的信号；
分离装置，用于把在无线接收装置中接收的信号分离为将输出的文本信号和声音信号；
第一解调装置，用于接收和解调在分离装置中分离出的声音信号来产生将输出的声音信号；
第二解调装置，用于接收和解调在分离装置中分离出的文本信号来产生将输出的文本数据；
声音扩展装置，用于接收和扩展从第一解调装置输出的信号来产生将输出的数字声音信号；以及
声音输出装置，用于接收和输出从在声音扩展装置中扩展了的数字声音信号所转换的模拟声音信号；其中，
所述第二解调装置把解调了的文本数据传输给控制装置，
所述控制装置接收在第二解调装置中解调了的文本数据，在显示装置上显示该文本数据，并进一步把文本数据发送给第二调制装置，并且
所述控制装置从声音识别装置接收文本数据，并以使得文本数据发送给第二调制装置的方式来执行控制。
23.根据权利要求22的终端装置，其中所述输出装置包括显示装置，文本数据被显示在所述输出装置上。
24.根据权利要求22或23的终端装置，其中所述输出装置包括用于把从声音识别装置输出的文本数据发送给第二通信方终端的装置。
25.根据权利要求22的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信号发送给第二通信方终端的装置。
26.根据权利要求22的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多路复用了的信号发送给第二通信方终端的装置。
27.根据权利要求22的终端装置，其中声音识别装置接收通过在解调装置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解调了的信号而得到的数字声音信号以作为输入数据，并对其执行声音识别。
28.根据权利要求22的终端装置，其中作为声音识别结果的文本数据在显示装置上显示。
29.根据权利要求28的终端装置，进一步包括用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二通信方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信号的装置。
30.根据权利要求22的终端装置，进一步包括：
一个操作键，用于启动声音识别开始的指令；以及
用于依据操作键的预定操作，启动由声音识别装置执行由声音到文本数据的转换的装置。
31.根据权利要求22的终端装置，进一步包括：
用于当要监视的预定信号的状态满足预定要求时，启动由声音识别装置执行由声音到文本数据的转换的装置。
32.一种作为第一通信方终端的终端装置，包括：
声音压缩装置，用于压缩通过声音输入装置输入并转换为数字信号的声音信号，来产生将输出的压缩了的信号；
声音识别装置，用于执行通过声音输入装置输入并转换为数字信号的声音信号的声音识别来把声音信号转换成将输出的文本数据；
第一多路复用装置，用于允许输入文本数据通过图像输入装置输入并转换为数字信号的图像信息，并用于多路复用它们来产生将输出的多路复用信号；
图像压缩装置，用于接收和压缩从第一多路复用装置输出的信号，来产生将输出的压缩了的图像信号；
第二多路复用装置，用于允许输入从图像压缩从装置输出的信号和从声音压缩装置输出的信号，并用于多路复用它们来产生将输出的多路复用了的信号；
调制装置，用于调制从第二多路复用装置输出的信号来产生将输出的调制信号；
无线传输装置，用于接收和无线传输从调制装置输出的调制信号；
解调装置，用于解调在无线接收装置中接收到的信号来产生将输出的解调了的信号；
分离装置，用于允许输入在解调装置中解调了的信号，和用于把输入信号分离为将输出的图像信号和声音信号；
图像扩展装置，用于接收和扩展在分离装置中分离出的图像信号来产生将输出的扩展了的数字图像信号；
声音扩展装置，用于接收和扩展在分离装置中分离出的声音信号来产生将输出的扩展了的数字声音信号；
显示装置，用于接收和显示从在图像扩展装置中扩展了的数字图像信号所转换的模拟图像信号；
声音输出装置，用于接收和输出从在声音扩展装置中扩展了的数字声音信号所转换的模拟信号；以及
控制装置，用于以这样的方式来执行控制，以便当模式被设置为声音识别模式时，把作为在声音识别装置中声音识别结果输出的文本数据发送给第一多路复用装置。
33.根据权利要求32的终端装置，其中所述输出装置包括显示装置，文本数据被显示在所述输出装置上。
34.根据权利要求32或33的终端装置，其中所述输出装置包括用于把从声音识别装置输出的文本数据发送给第二通信方终端的装置。
35.根据权利要求32的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信号发送给第二通信方终端的装置。
36.根据权利要求32的终端装置，进一步包括，用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多路复用了的信号发送给第二通信方终端的装置。
37.根据权利要求32的终端装置，其中声音识别装置接收通过在解调装置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解调了的信号而得到的数字声音信号以作为输入数据，并对其执行声音识别。
38.根据权利要求32的终端装置，其中作为声音识别结果的文本数据在显示装置上显示。
39.根据权利要求38的终端装置，进一步包括用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二通信方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信号的装置。
40.根据权利要求32的终端装置，其中所述控制装置把文本数据发送给显示装置以在显示装置上显示文本数据。
41.根据权利要求32的终端装置，进一步包括：
一个操作键，用于启动声音识别开始的指令；以及
用于依据操作键的预定操作，启动由声音识别装置执行由声音到文本数据的转换的装置。
42.根据权利要求32的终端装置，进一步包括：
用于当要监视的预定信号的状态满足预定要求时，启动由声音识别装置执行由声音到文本数据的转换的装置。

技术领域\n本发明涉及一种移动通信系统，特别涉及例如在移动通信网络中具有执行另一方说话的声音识别功能的终端装置，以及一种通信控制方法。\n背景技术\n在使用诸如便携式电话机(也称为“MS(移动站)”或“移动电话”)的通信终端装置在嘈杂的环境下进行通话时，该电话机经交换中心、或通过无线线路连接到基站而构成的移动通信系统的电话网络等而被连接到另一方的电话终端上，有时候，环境噪声妨碍了另一方说话的内容，不能容易地被听到。便携式电话机的出现，增加了使用范围和便利性，该便携式电话机使得甚至在嘈杂的环境下也能够明白另一方说话的内容，从而能够在很难收听的环境下与另一方谈话。\n例如，日本专利公开No.168552/1999披露了一种备有声音识别装置的便携式电话机，该声音识别装置用于把声音信号转换成字符数据。特别是这种便携式电话机具有声音记录功能，也就是记录在通话期间谈话的内容等功能，并包括用于将声音数据转换到字符数据的声音识别装置。已经构成了这样的便携式电话机，使得能够通过在存储器中写入转换了的字符数据而显著减小记录每次呼叫的声音所需的数据规模。在日本专利公开No.168552/1999所描述的便携式电话机中，为了有效的使用存储器来记录声音，把声音数据转换成字符数据而将其存储到存储器中。这种便携式电话机缺少用于允许用户直接输出另一方的说话的装置。\n发明内容\n因此，本发明的目的是提供一种终端装置，例如甚至在难以收听的环境下；该装置也能够通过声音识别清楚地知道另一方说话的内容和能够与另一方谈话；以及本发明的目的是提供一种通信控制方法。\n通过本发明的下述特征，可达到以上目的。\n(1)作为第一通信方终端的终端装置包括：声音识别装置，它在通过连接到第二通信方终端的期间内，当模式被设置为声音识别模式时，作为数字声音信号接收从第二通信方的终端发送的第二通信方声音，并执行声音识别以便把数字声音信号转换成文本数据；以及控制装置，它执行这样一种控制功能，使得由声音识别装置转换的文本数据从输出装置输出。\n(2)根据上述项(1)的终端装置，其中输出装置包括显示装置，文本数据被显示在该显示装置上。\n(3)根据上述项(1)或(2)的终端装置，其中输出装置包括用于把从声音识别装置输出的文本数据发送给第二通信方终端的装置。\n(4)一个作为第一通信方终端的终端装置包括：用于执行来自第二通信方终端的声音信号的声音识别以便把声音信号转换成文本信号的声音识别装置；以及用于把文本数据作为声音识别结果发送给第二通信方终端的装置。\n(5)一种作第二通信方的终端装置的终端装置，它用于与根据上述第 (4)项的终端装置进行通信连接，所述第二通信方终端装置包括：用于接收从根据上述项(4)的终端装置发送的文本数据和用于以使接收到的文本数据在显示装置上显示的方式来执行控制的装置。\n(6)一个作为第一通信方终端的终端装置包括：用于执行来自第二通信方终端的声音信号的声音识别以便把该声音信号转换成文本数据的声音识别装置；用于把作为声音识别结果的文本数据发送给第二通信方终端的装置；以及用于从第二通信方终端发送的信号中提取文本数据和用于以使得在显示装置上显示该文本数据的方式来执行控制的装置。\n(7)根据上述项(6)的终端装置，进一步包括用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端的信号、并把多路复用了的信号发送给第二通信方终端的装置。\n(8)根据上述项(6)的终端装置，进一步包括用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把多路复用了的信号发送给第二通信方终端的装置。\n(9)根据上述项(1)，(4)和(6)的任一项的终端装置，其中声音识别装置接收通过在解调装置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解调了的信号而得到的数字声音信号以作为输入数据，并对其执行声音识别。\n(10)作为第一通信方终端的终端装置，包括：声音压缩装置，用于压缩通过声音输入装置输入并转换为数字信号的声音信号，并且用于输出该压缩了的信号；用于调制从声音压缩装置输出的压缩了的信号来产生将输出的调制了的信号的调制装置；用于接收和无线传输从调制装置输出的调制了的信号的无线传输装置；用于解调在无线接收装置中接收到的信号来产生将输出的解调了的信号的解调装置；用于接收和扩展在解调装置中解调了的信号来产生将输出的扩展了的数字声音信号的声音扩展装置；用于使声音扩展装置输出的数字声音信号受到声音识别来把数字声音信号转换成将输出的文本数据的声音识别装置；用于接收并输出从声音扩展装置输出的数字声音信号所转换的模拟声音信号的声音输出装置；以及用于以下述方式来执行控制的控制装置，当模式被设置为处于声音识别模式时，把在声音扩展装置中扩展了的数字声音信号输入到声音识别装置中并使其接受声音识别，把从声音识别装置输出的文本数据发送给显示装置并在显示装置上显示。\n(11)作为第一通信方终端的终端装置包括：用于执行输入声音信号的声音识别以便把该声音信号转换成将输出的文本数据的声音识别装置；用于允许作为从声音识别装置输出的声音识别的一个结果的文本数据和从图像输入装置输入并转换为数字信号的图像信息的输入，并且用于多路复用它们以便产生将输出的多路复用了的信号的第一多路复用装置；用于接收和压缩从该第一多路复用装置输出的信号来产生将输出的压缩了的图像信号的图像压缩装置；用于压缩经过声音输入装置输入并转换为数字信号的声音信号来产生将输出的压缩了的声音信号的声音压缩装置；用于允许从图像压缩装置输出的信号及从声音压缩装置输出的信号的输入并多路复用它们来产生将输出的多路复用了的信号的第二多路复用装置；用于调制从第二多路复用装置输出的信号来产生将输出的调制了的信号的调制装置；用于接收并无线传输从调制装置输出的信号的无线传输装置；用于解调在无线接收装置中接收到的信号来产生将输出的解调了的信号的解调装置；用于允许在解调装置中解调了的信号的输入并把输入信号分离成将输出的图像信号和声音信号的分离装置；用于接收和扩展在分离装置中分离出的图像信号来产生将输出的扩展了的数字图像信号的图像扩展装置；用于接收和扩展在分离装置中分离出的声音信号来产生将输出的扩展了的数字声音信号的声音扩展装置；用于接收和显示从图像扩展装置输出的数字图像信号所转换的模拟信号的显示装置；用于接收和输出从声音扩展装置输出的数字声音信号所转换的模拟声音信号的声音输出装置；以及用于以下述方式来执行控制的控制装置，当模式被设置为声音识别模式时，把在声音扩展装置中扩展了的数字声音信号输入到声音识别装置中并使其受到声音识别，把从声音识别装置输出的文本数据发送给第一多路复用装置。\n(12)根据上述项(11)的终端装置，其中控制装置包括用于以使得从声音识别装置输出的文本数据发送给显示装置并在显示装置上显示的方式来执行控制的装置。\n(13)作为第一通信方终端的终端装置包括：用于执行用户通过声音输入装置输入的声音的识别以便把该声音转换成文本数据的声音识别装置；以及用于把作为声音识别结果的文本数据发送给第二通信方终端装置的装置。\n(14)根据上述项(13)的终端装置，其中作为声音识别结果的文本数据在显示装置上显示。\n(15)作为用于通信连接到根据上述项(13)或(14)的终端装置的第二通信方终端装置的终端装置，所述第二通信方终端装置包括：用于以使得从根据上述项(13)或(14)的终端装置发送的信号中提取文本数据并在显示装置上显示的方式来执行控制的装置。\n(16)根据上述项(13)或(14)的终端装置，进一步包括用于多路复用作为声音识别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二通信方终端装置的图像信号，来产生将发送给第二通信方终端装置的多路复用信号的装置。\n(17)作为第一通信方终端的终端装置包括：用于压缩通过声音输入装置输入并转换为数字信号的声音信号来产生将输出的压缩了的信号的声音压缩装置；用于执行通过声音输入装置输入和转换为数字信号的声音信号的声音识别来把声音信号转换成将输出的文本数据的声音识别装置；用于调制从声音压缩装置输出的信号来产生将输出的调制了的声音信号的第一调制装置；用于调制输入的文本数据来产生将输出的调制了的文本数据的第二调制装置；用于接收从第一调制装置输出的信号和从第二调制装置输出的信号，多路复用它们来产生将输出的多路复用了的信号的多路复用装置；用于接收并无线传输从多路复用装置输出的信号的无线传输装置；用于把在无线接收装置中接收的信号分离成将输出的文本信号和声音信号的分离装置；用于接收和解调在分离装置中分离出的声音信号来产生将输出的声音信号的第一解调装置；用于接收和解调在分离出装置中分离的文本信号来产生将输出的文本数据的第二解调装置；用于接收和扩展从第一解调装置输出的信号来产生将输出的数字声音信号的声音扩展装置；以及声音输出装置，用于接收和输出从在声音中扩展装置中扩展了的数字声音信号所转换的模拟声音信号，其中所述第二解调装置把解调了的文本数据传输给控制装置，所述控制装置接收在第二解调装置中解调了的文本数据，在显示装置上显示该文本数据，并进一步把文本数据发送给第二解调装置，并且所述控制装置从声音识别装置接收文本数据，并且以使得文本数据发送给第二调制装置的方式来执行控制。\n(18)作为第一通信方终端的终端装置包括：用于压缩通过声音输入装置输入并转换为数字信号的声音信号来产生将输出的压缩了的信号的声音压缩装置；用于执行通过声音输入装置输入和转换为数字信号的声音信号的声音识别来把声音信号转换成将输出的文本数据的声音识别装置；用于允许文本数据和通过图像输入装置输入并转换为数字信号的图像信息的输入，和用于多路复用它们来产生将输出的多路复用信号的第一多路复用装置；用于接收和压缩从第一多路复用装置输出的信号来产生将输出的压缩了的图像信号的图像压缩装置；用于允许输入从图像压缩装置输出的信号和从声音压缩装置输出的信号，和用于多路复用它们来产生将输出的多路复用了的信号的第二多路复用装置；用于调制从第二多路复用装置输出的信号来产生将输出的调制信号的调制装置；用于接收和无线传输从调制装置输出的信号的无线传输装置；用于解调在无线接收装置中接收到的信号来产生将输出的解调了的信号的解调装置；用于允许输入在解调装置中解调了的信号，和用于把输入信号分离为将输出的图像信号和声音信号的分离装置；用于接收和扩展在分离装置中分离出的图像信号来产生将输出的扩展了的数字图像信号的图像扩展装置；用于接收和扩展在分离装置中分离出的声音信号来产生将输出的扩展了的数字声音信号的声音扩展装置；用于接收和显示从在图像扩展装置中扩展了的数字图像信号所转换的模拟图像信号的显示装置；用于接收和输出从在声音扩展装置中扩展了的数字声音信号所转换的模拟信号的声音输出装置；以及用于以这样的方式来执行控制的控制装置，当模式被设置为声音识别模式时，把作为在声音识别装置中声音识别结果输出的文本数据发送给第一多路复用装置。\n(19)根据上述项(18)的终端装置，其中控制装置把文本数据发送给显示装置，以便在显示装置上显示文本数据。\n(20)根据上述项(1)，(4)，(6)，(10)，(11)，(13)，(17)和(18) 任一项的终端装置，进一步包括：一个用于启动声音识别开始的指令的操作键；以及用于依据操作键的预定操作，启动声音识别装置执行的由声音到文本数据的转换的装置。\n(21)根据上述项(1)，(4)，(6)，(10)，(11)，(13)，(17)和(18) 任一项的终端装置，进一步包括：用于当要监视的预定信号的状态满足预定要求时，启动由声音识别装置执行由声音到文本数据的转换的装置。\n(22)一种包括用于传输一个终端发送给另一个终端、或从另一终端接收的声音信号的通信网络的通信系统，在所述通信网络上具有至少一个节点，该节点包括用于接收要传输的声音信号并执行声音识别以便把声音信号转换成文本数据的装置，所述转换了的文本数据从通信网络上的所述一个节点传输给声音信号接收者的终端、或声音信号接收者的终端和声音信号发射者的终端。\n(23)根据上述项(22)的通信系统，其中在声音信号接收者的终端、或在声音信号接收者的终端和声音信号发送者的终端中提供了用于执行声音信号的声音识别来把声音信号转换成文本数据的装置，根据声音信号接收者的终端和/或声音信号发送者的终端的负载状态，或根据来自声音信号接收者的终端和 /或声音信号发射者的终端的请求而在通信网络一侧执行所述声音识别。\n(24)根据上述项(1)，(4)，(10)，(11)，(13)，(17)和(18)任一项的终端装置，其中终端装置是用于与基站无线通信的移动站。\n(25)根据上述项(22)或(23)的通信系统，其中连接到通信网络的终端是与用于基站无线通信的移动站。\n(26)根据上述项(1)，(4)，(6)，(10)，(11)，(13)，(17)和(18) 任一项的终端装置，该装置可分离为：包括声音输入装置和声音输出装置的第一单元；以及包括显示装置的第二单元。\n(27)一种通信控制方法包括步骤：在多个互相通信连接的终端中的第一终端，接收通过解调和扩展从第二通信方终端发送的第二通信方的声音而得到的数字声音信号，并执行数字声音信号的声音识别以便把数字声音信号转换成文本数据；以及从所述第一终端中的输出装置输出文本数据。\n(28)根据上述项(27)的通信控制方法，其中文本数据在构成所述一个终端的输出装置的显示单元上显示。\n(29)根据上述项(27)或(28)的通信控制方法，包括从所述第一终端把文本数据传输给所述第二终端的步骤，其中把所述第二通信方说话的声音识别的结果返回给所述第二通信方。\n(30)根据上述项(27)或(28)的通信控制方法，包括在所述第二终端中的显示单元上显示从所述第一终端发送的文本数据的步骤。\n(31)根据上述项(27)的通信控制方法，其中以这样的方式来执行控制：依据在所述一个终端上的预定操作键的预定操作，或当要监视的预定信号满足预定要求时，在所述第一终端中，启动所述第二方说话的声音识别来把声音信号转换成文本数据。\n(32)一种通信控制方法包括步骤：在第一终端中执行从通信连接到所述第一终端的第二通信方终端发送的声音信号的声音识别，来把声音信号转换成文本数据；从所述第一终端把作为声音识别结果的文本数据发送给所述另一通信方终端；以及在所述第一终端中，以这样的方式来执行控制：使得作为从所述第二通信方终端发送的声音信号的声音识别结果的文本数据在显示装置上显示。\n(33)根据上述项(32)的通信控制方法，其中每个所述终端都是具有便携可视电话功能的终端，所述第一终端多路复用作为声音识别结果的文本数据与要发送给所述第二通信方终端的图像信息，并把多路复用了的信号发送给所述第二通信方终端。\n(34)一种通信控制方法包括步骤：执行由用户通过第一终端输入的声音的声音识别来把声音信号转换成文本数据；以及把作为声音识别结果的文本数据发送给第二通信方终端。\n(35)根据上述项(34)的通信控制方法，其中作为声音识别结果的文本数据在所述第一终端的显示单元上显示。\n(36)根据上述项(34)或(35)的通信控制方法，其中，在第二通信方终端中，使得从所述第一终端发送的文本数据在显示单元上被显示。\n(37)根据上述项(34)或(35)的通信控制方法，包括步骤：在所述第一终端中，多路复用作为声音识别结果的文本数据与要传输给第二通信方终端的声音信号或图像信号，并把多路复用了的信号传输给第二通信方终端。\n(38)一种通信控制方法包括步骤：在用于至少传输讲话者的声音信号的发送者的终端与接收者的终端之间的通信网络中提供的声音识别装置中，接收声音信号，并执行声音识别以便把声音信号转换成文本数据；以及把在通信网络上提供的声音识别装置中转换了的文本数据传输给接收者的终端、或接收者的终端和发送者的终端。\n附图简要描述\n下面将结合附图更详细地说明本发明，其中\n图1示出了本发明的第一优选实施例中的便携式电话机的结构；\n图2示出了本发明的第一优选实施例中的便携式电话机的外形；\n图3示出了本发明的第二优选实施例中的便携式电话机的结构；\n图4示出了本发明的第二优选实施例中的便携式电话机的外形；\n图5示出了本发明的第一优选实施例中的便携式电话机的操作的流程图；\n图6示出了本发明的第二优选实施例中的便携式电话机的操作的流程图；\n图7示出了本发明的第三优选实施例中的便携式电话机的结构；\n图8示出了本发明的第三优选实施例中的便携式电话机的外形；\n图9示出了本发明的第三优选实施例中的便携式电话机的操作的流程图；\n图10示出了本发明的第四优选实施例中的便携式电话机的结构；\n图11示出了本发明的第四优选实施例中的便携式电话机的外形；\n图12示出了本发明的第四优选实施例中的便携式电话机的操作的流程图；\n图13示出了本发明的第五优选实施例中的交换中心的结构；\n图14示出应用了本发明的3GPP核心网络的结构。\n优选实施例的描述\n下面将结合附图说明本发明的优选实施例。图1示出了根据本发明的终端装置的优选实施例。图1示出的终端装置包括：声音识别装置(15)，该装置在通信连接到另一通信方的终端(在下文中经常简称为“另一方终端”)时，接收通过分别在解调电路和扩展电路中解调和扩展接收单元所接收的另一方的声音信号而得到的数字声音信号，并执行声音识别来把声音数据转换成文本数据；控制装置(14)，该装置接收从声音识别装置(15)输出的文本数据并把文本数据发送给显示装置(16)，在那里显示文本数据。\n更具体地说，图1示出的根据本发明的终端装置的优选实施例包括：声音压缩装置(5)，用于压缩声音信号和输出压缩了的声音信号，这些声音信号从声音输入装置(图1中的7和28)接收和被转换为数字信号；调制装置(4)，用于调制从声音压缩装置(5)输出的信号和输出调制了的信号；无线传输装置(3、2、1)，用于接收从调制装置输出的信号和无线发送该信号；解调装置 (9)，用于解调在无线接收装置(1、2、8)中接收的信号并输出解调了的信号；声音扩展装置(10)，用于接收解调装置(9)解调的信号，扩展该接收信号，并输出数字声音信号；声音识别装置(15)，用于执行从声音扩展装置(10) 输出的数字声音信号的声音识别，把数字声音信号转换成文本数据，并输出该文本数据：声音输出装置(12、28)，用于接收通过把从声音扩展装置(10) 输出的数字声音信号转换成模拟信号而得到的信号和输出声音；控制装置 (14)，用于以这样的方式来执行控制：当设置的状态是声音识别模式时，在声音扩展装置(10)中扩展了的数字声音信号被输入到用于声音识别的声音识别装置(15)，从声音识别装置(15)输出的文本数据被发送到显示装置(16) 来显示该数据。\n本发明的这个优选实施例中的终端装置可以具有声音识别启动按钮(17) 作为操作键。依据声音识别启动按钮(17)的按下，控制装置(14)执行控制，这样，从当这个按钮按下的那个时候起，声音识别装置(15)执行另一方的说话的声音识别，开始把数字声音信号转换成文本数据。\n换句话说，在本发明的这个优选实施例中的终端装置中，可以采用一种结构，其中监视环境噪声的电平，当判断为噪声电平超过了预定阈值时，声音识别装置(15)的声音识别处理被自动触发。\n进而，在本发明的这个优选实施例中的终端装置可以具有图3示出的结构，其中提供用于执行另一方说话的声音识别和把声音信号转换成文本数据的声音识别装置(15)和用于作为文本数据把另一方说话的声音识别结果传输给另一方终端的装置(14、24)，并且在接收了文本数据的另一方终端中，文本数据显示在显示装置(16)上。当本发明的这个优选实施例中的终端装置具有便携式TV电话(电视电话)功能时，在与要发送给另一方终端的图像信息多路复用的状态下，把文本数据作为声音识别的结果发送给另一方终端。\n更具体地说，图3示出了根据本发明的终端装置的第二优选实施例。该终端装置包括：声音识别装置(15)，用于执行输入声音信号的声音识别，把声音信号转换成文本数据，并输出该文本数据；第一多路复用装置(24)，用于允许作为声音识别的结果的文本数据，和从图像输入装置(21)接收到的并已通过第一模拟—数字转换(A/D转换)装置(20)转换成数字信号的图像信息的输入，多路复用它们，并输出多路复用了的信号；图像压缩装置(19)，用于接收从第一多路复用装置(24)输出的多路复用了的数据和压缩该数据；声音压缩装置(5)，用于压缩从声音输入装置(7、28)接收和已在第二模拟— 数字转换(A/D转换)装置(6)中转换成数字信号的声音信号；第二多路复用装置(18)，用于允许从图像压缩装置(19)输出的压缩了的数据，和从声音压缩装置(5)输出的压缩了的数据的输入，多路复用它们，输出多路复用了的信号；调制装置(4)，用于调制从第二多路复用装置(18)输出的多路复用信号；无线传输装置(3、2、1)，用于接收从调制装置(4)输出的信号和无线传输该信号；解调装置(9)，用于解调在无线接收装置(1、2、8)中接收的信号；分离装置(22)，用于允许通过解调装置(9)解调了的信号的输入，把该信号分离成图像信号和声音信号，输出这些分离了的信号；图像扩展装置 (23)，用于接收在分离装置(22)中分离出的图像信号，扩展该图像信号，输出扩展了的信号；声音扩展装置(10)，用于接收在分离装置(22)中分离了的声音信号，扩展该声音信号，输出扩展了的信号；第一数字—模拟转换(D/A 转换)装置(25)，用于把在图像扩展装置(23)中扩展了的数字图象信号转换成模拟图象信号；显示装置(16)，用于显示来自第一D/A转换装置(25) 的模拟图象信号；第二数字—模拟转换(D/A转换)装置(11)，用于把在声音扩展装置(10)中扩展了的数字声音信号转换成模拟声音信号；声音输出装置(12、28)，用于把从第二D/A转换装置(11)接收的模拟声音信号输出；以及控制装置(14)，用于以这样的方式来执行控制，当设置的状态是声音识别方式时，把在声音扩展装置(10)中扩展了的数字声音信号输入给用于声音识别的声音识别装置(15)，把从声音识别装置(15)输出的文本数据发送给第一多路复用装置(24)。在这一优选实施例中，依据声音识别启动按钮(17) 的按下，声音识别装置(15)执行声音识别。\n图7示出了根据本发明的终端装置的第三优选实施例。该终端装置包括：声音压缩装置(5)，用于压缩声音信号并输出该压缩了的信号，这些声音信号从声音输入装置(7、28)接收并已在模拟—数字转换(A/D转换)装置(6) 中被转换为数字信号；声音识别装置(15)，用于执行在A/D转换装置(6)中转换为数字信号的声音信号的声音识别，把数字数据转换成文本数据，输出该文本数据；第一调制装置(4)，用于调制声音压缩装置(5)的输出；第二调制装置(31)，用于调制文本数据；多路复用装置(30)，用于接收从第一调制装置(4)输出的调制了的信号和从第二调制装置(31)输出的调制了的信号，多路复用这些调制了的信号；无线传输装置(3、2、1)，用于接收从多路复用装置(30)输出的多路复用了的信号，无线传输该多路复用了的信号；分离装置(33)，用于把在无线接收装置(1、2、8)中接收的信号分离成文本数据和声音信号；第一解调装置(9)，用于接收在分离装置(33)中分离出的声音信号，并解调该声音信号；第二解调装置(32)，用于接收在分离装置(33)中分离出的文本数据，并解调该文本数据；声音扩展装置(10)，用于扩展从第一解调装置输出的解调了的信号，并输出该扩展了的信号；数字-模拟转换(D/A 转换)装置(11)，用于把在声音扩展装置(10)中扩展了的数字声音信号转换成模拟信号；以及声音输出装置(12、28)，用于允许模拟信号的输入，输出模拟信号，其中第二解调装置(32)把解调了的文本数据传输给控制装置 (14)，控制装置(14)接收在第二解调装置(32)中解调了的文本数据，并以这样的方式来执行控制：文本数据被显示在显示装置(16)并被传输给第二调制装置(31)，来自声音识别装置(15)的文本数据被发送给第二调制装置 (31)。\n图10示出了根据本发明的终端装置的第四优选实施例。该终端装置包括：声音压缩装置(5)，用于压缩声音信号并输出该压缩了的信号，这些声音信号从声音输入装置(7、28)接收并在模拟—数字转换(A/D转换)装置(6)中被转换为数字信号；声音识别装置(15)，用于执行转换为数字信号的声音信号的声音识别，把数字信号转换成为文本数据，并输出该文本数据；第一多路复用装置(24)，用于执行文本数据和图象信息的输入，该图象信息从图象输入装置(21)接收和在模拟—数字转换(A/D转换)装置(20)中被转换为数字信号，多路复用文本数据和图象信息，并输出多路复用了的信号；图象压缩装置(19)，用于接收从第一多路复用装置(24)输出的多路复用了的信号，压缩该多路复用了的信号，并输出该压缩了的信号；第二多路复用装置(18)，用于允许图象压缩装置的输出和声音压缩装置输出的输入，多路复用这些输出，并输出该多路复用了的信号；调制装置(4)，用于调制从第二多路复用装置(18)输出的多路复用了的信号；无线传输装置(3、2、1)，用于接收从调制装置(4)输出的调制了的信号，并无线传输该调制了的信号；解调装置(9)，用于解调在无线接收装置(1、2、8)中接收的信号；分离装置(22)，用于允许在解调装置(9)中解调了的信号的输入，把该输入信号分离成图象信号和声音信号，并输出分离出的信号；图象扩展装置(23)，用于接收在分离装置 (22)中分离出的该图象信号，扩展的该图象信号，并输出扩展了的图象信号；声音扩展装置(10)，用于接收在分离装置(22)分离出的声音信号，扩展该声音信号，并输出扩展了的声音信号；数字—模拟转换(D/A转换)装置(25)，用于把在图象扩展装置(23)中扩展了的数字图象信号转换成模拟图象信号；显示装置(16)，用于允许模拟图象信号的输入，并显示该模拟图象信号；数字—模拟转换(D/A转换)装置(11)，用于把在声音扩展装置中扩展了的数字声音信号转换成模拟声音信号；声音输出装置(12)，用于允许模拟声音信号的输入，并输出该模拟声音信号；以及控制装置(14)，用于以这样的方式来执行控制：当设置的状态是声音识别方式时，被输入到用于声音识别的声音识别装置(15)的文本数据被输入并传输到第一多路复用装置(24)。控制装置(14)进一步把文本数据输出给显示装置(16)。\n图13示出了本发明的第五优选实施例中的交换中心(36)。交换中心(36) 构成通信网络上的一个节点，包括装置(42、43、38、39)，用于在话音通信连接期间内允许声音信号的输入，执行声音识别，多路复用作为声音识别结果的文本数据与声音信号，把该多路复用了的信号传输给声音信号接收者的终端和声音信号发送者的终端。换句话说，可以采用一种结构，其中交换控制以这样的方式来执行：在终端一侧执行声音识别，并且根据电池的剩余电量或终端负载的情况，或依据终端的请求，在通信网络上执行声音识别。\n下面说明根据本发明的通信控制方法的优选实施例。在一个优选实施例中，通信控制方法包括下列步骤。\n步骤1：用于通信的互相连接的多个终端中的一个(第一终端)，接收通过解调和扩展从第二方终端传输的通信的另一方(第二方)的声音而得到的数字声音信号，执行声音识别，并把声音信号转换成文本数据。\n步骤2：在一个终端中，文本数据被显示在显示单元上。\n以下的步骤3可以另外提供。\n步骤3：第一终端把文本数据传输给第二方终端，因此，第二方说话的声音识别结果被返回给第二方，第二方可以确认在终端上的说话内容。\n根据本发明的通信控制方法的另一个优选实施例包括以下步骤。\n步骤1：用户通过用户的终端(第一终端)输入的声音受到声音识别，并被转换为文本数据。\n步骤2：作为声音识别结果的文本数据被发送给连接到该用户的终端上的第二方终端。\n在本发明的通信控制方法的这个优选实施例中，作为声音识别结果的文本数据被显示在该用户的终端的显示单元上。另一方面，在第二方的终端上，从该用户的终端发送的文本数据显示在显示单元上。进而，作为声音识别结果的文本数据与要发送给第二方终端的声音信号或图象信号多路复用，接着传输给第二方终端。\n结合附图来更详细的说明本发明的优选实施例。在该优选实施例中，作为举例，把便携式电话机用作终端装置。图1示出了本发明第一优选实施例的结构。\n现在参考图1，作为本发明的第一优选实施例的便携式电话机包括：天线 1，用于发送和接收；天线转换器2，用于发送信号和接收信号的转换；话筒7，用于输入要发送的声音信号；A/D转换器6，用于把来自话筒7的模拟声音信号转换成数字声音信号；声音压缩电路5，用于从压缩A/D转换器6输出的数字声音信号；调制电路4，用于使从声音压缩电路5输出的发送信号受到QPSK (四相相移键控)调制；发射机3，用于把从调制电路4输出的发送信号转换到发送频率。本发明的第一优选实施例中的便携式电话机进一步包括：接收电路8，用于执行接收的无线波的放大和频率调谐检测；解调电路9，用于使来自接收电路8的信号受到QPSK解调；声音扩展电路10，用于扩展从解调电路9输出的压缩了的声音信号；D/A转换器11，用于把从声音扩展电路10输出的数字接收信号转换成模拟声音信号；扬声器12，用于接收从D/A转换器11 输出的模拟声音信号，并输出声音信号；声音识别电路15，用于允许来自声音扩展电路10的扩展了的信号(来自另一方的数字接收的声音信号)的输入，执行声音识别，并把扩展了的信号转换成文本数据；显示单元16，用于显示从控制单元14发送的字符或图象，例如LCD(液晶显示器)；控制单元14，用于执行整个控制；带有一个键、一个按钮等的操作部分13；声音识别启动按钮 17，用于启动声音识别；以及耳机话筒28，用于环境噪声较大时，用户戴上它来谈话。在以下的优选实施例中，声音识别电路15包括传统的声音识别器，该识别器提取声音特征值、把该声音特征值与代码表匹配起来、并具有能够应付特定讲话者或非特定讲话者的结构。\n图2示出了根据本发明的第一优选实施例的便携式电话机的外形的正视图。在图2中，便携式电话机例如是，在有噪声的环境中讲话的讲话者的便携式电话终端26。图2中参考字符对应于图1中的那些，数字1指示一个用于发送和接收的天线，数字7指话筒，数字12指扬声器，数字13指操作部分，数字16指显示单元，数字17指声音识别启动按钮，和数字28指耳机。在该终端中，另一方的声音信号通过声音识别装置转换为文本数据，该文本数据将显示在显示单元16如数字27指示的“SEE YOUAT THREE.”\n下面说明根据本发明的第一优选实施例的便携式电话机的操作。最初，下面说明根据本发明的第一优选实施例的便携式电话机的发送操作。假定通过基站和基站控制站在便携式电话机与移动交换中心之间建立起说话信道，而且在到连接目的地的通信连接中，还要通过更多个基站及基站控制站。在图1中，通过A/D转换器6，把来自话筒7和耳机话筒28的模拟声音信号转换成数字声音信号，在声音压缩电路5中受到频带压缩，在调制电路4中受到QPSK调制，在发送电路3中转换和放大为发送频率，通过天线开关2，通过天线部分 1无线发送。\n下面说明根据本发明的第一优选实施例的便携式电话机的接收操作。在天线1中接收的通信无线波通过天线开关2，并被输入到接收电路8，在那里，使接收的无线波受到放大和频率调谐，取自接收电路8的调制信号被发送到解调电路9。\n在解调电路9中受到QPSK解调的数字声音信号，在扩展电路10中被扩展，在D/A转换器11中被转换成模拟声音信号，并从扬声器12输出。\n图5示出了在使用根据本发明的第一优选实施例的便携式电话机执行声音识别的情况下，从开始谈话起的操作的流程图。根据本发明的第一优选实施例的便携式电话机中用于声音识别的处理，将结合图1和5进行说明。依据谈话的开始，讲话者作出关于是否周围环境很嘈杂的判断(步骤S1)。当周围环境不嘈杂，另一方的声音能够很清楚地听到，在这种情况下，讲话者继续谈话(步骤S3)。\n另一方面，当判断的结果是周围环境很嘈杂，讲话者戴上耳机话筒28(步骤S2)。在这种情况下，当讲话者能够很清楚的听到另一方的声音时，谈话继续(步骤S6)。\n另一方面，当甚至在戴上耳机话筒28的情况下，讲话者都不能清楚地听到另一方的声音时，讲话者按下声音识别启动按钮17(步骤S5)。在这种情况下，声音识别部分15启动另一方的声音的识别，并把识别的结果作为文本显示27，在便携式电话机的显示单元16的屏幕上显示(步骤S7)。\n这时，在接收电路8中接收另一方的说话数据，并在解调电路9中受到QPSK 解调，解调了的数据接着在扩展电路10中受到带宽扩展，扩展了的数字声音数据被输入到执行声音识别处理的声音识别部分15。通过控制单元14，作为图2中用数字27指示的文本数据在显示单元16的屏幕上显示声音识别的结果。\n替代人工操作，其中依据声音识别启动按钮17的按下，在声音识别部分15 中启动声音识别，可以采用一种结构，其中以这样的方式来执行自动控制，在便携式电话机的内部监视周围环境的噪声电平等，并与预定的阈值比较，当噪声电平超过该阈值时，在声音识别部分15中执行声音识别，并执行文本数据的显示。换句话说，可以采用一种结构，其中检测耳机话筒的佩戴，在声音识别部分15中执行声音识别，并执行文本数据的显示。\n可以用横向滚动的方式在显示单元16的一行上显示文本，或者换一种方式，可以用垂直滚动的方式在显示器屏幕的预定窗口上的多行上显示。\n进而，例如可以提供一种功能，其中把作为声音识别结果的文本数据存储在存储器中(未示出)，后来通过e-mail(电子邮件)发送。\n接下来，说明根据本发明的第二优选实施例的便携式电话机。在本发明的第二优选实施例中，实现了使用声音识别的、在嘈杂的环境下有用的便携式TV 电话。图3示出了根据本发明的第二优选实施例的便携式电话机结构，和图4 示出了该便携式电话机的外形的正视图。\n现在参考图3，作为本发明的第二优选实施例的便携式TV电话包括：天线1，用于发送和接收；天线开关2，用于发送信号和接收信号的转换；照相机21，用于拍摄要发送的图像；A/D转换器20，用于把从照相机21发送的模拟图象信号转换成数字信号；多路复用电路24，用于把作为声音识别结果产生的文本数据叠加到图像信号上(例如，用于在预定的时间(在屏幕上的位置和大小)把文本数据叠加到视频信号上)；图象压缩单元19，用于压缩从A/D转换器20输出的数字图象信号；话筒7，用于输入要发送的声音信号；A/D转换器6，用于把来自话筒7和耳机话筒28的模拟声音信号转换成数字声音信号；声音压缩电路5，用于压缩从A/D转换器6输出的数字声音信号；多路复用电路18，用于多路复用来自图象压缩电路19的图象信号与来自声音压缩电路5 的声音信号；调制电路4，用使从于多路复用电路18输出的发送信号受到QPSK 调制；以及发送电路3，用于把从调制电路4输出的发送信号转换成发送频率。\n本发明的第二优选实施例的便携式TV电话机还包括：接收电路8，用于执行接收到的无线波的放大和频率调谐检测；解调电路9，用于使来自接收电路8的信号受到QPSK解调；分离电路22，用于允许在解调电路9中解调了的信号的输入，并把信号分离成声音信号和图象信号；声音扩展电路10，用于扩展在分离电路22中分离出的压缩了的声音信号；D/A转换器11，用于把从声音扩展电路10输出的数字的接收到的声音信号转换成模拟声音信号；扬声器12，用于输出该声音信号；图象扩展电路23，用于扩展在分离电路22中分离出的压缩了的图象信号；D/A转换器25，用于把从图象扩展电路23输出的数字的接收到的图象信号转换成模拟图象信号；显示单元16，用于显示接收到的图象或从控制单元14发送的字符和图象；控制单元14，用于控制整个便携式TV电话机；一个用于便携式电话机的操作电路13；声音识别电路15，用于执行来自另一方的数字声音信号的声音识别来把数字声音信号转换成文本数据；声音识别启动按钮17，用于启动声音识别。\n图4示出了根据本发明的第二优选实施例，在嘈杂的环境下(见图4B)的讲话者的便携式TV电话机26A和另一方的便携式TV电话机26B(见图4A)。在便携式TV电话机26A中，另一方的声音信号通过声音识别转换成文本数据，该文本数据显示在显示单元16上，如数字27所指示的，同时，将其发送给另一方的便携式TV电话机26B，在这里该文本数据在另一方的便携式TV电话机26B中也显示在的显示单元16上，如数字29所指示的。\n结合附图3，说明根据本发明的第二优选实施例便携式TV电话机的操作。本发明的第二优选实施例中的便携式TV电话机发送的操作，如下所述来执行。来自话筒7或耳机话筒28的模拟声音信号通过A/D转换器6被转换成将在声音压缩电路5中受到频带压缩的数字信号。视频照相机21拍摄的模拟图象的信号通过A/D转换器20转换成将在图象压缩电路19中受到频带压缩的数字信号。在多路复用电路18中多路复用频带压缩了的图象信号与压缩了的声音信号，接下来通过与以上结合其中只使用了声音通信的上述优选实施例描述的相同的路径发送。\n下面说明本发明的第二优选实施例中的便携式TV电话机接收的操作。接收到的声音信号通过接收电路8，解调电路9，和分离电路22，并在分离电路 22中被分离成声音信号和图象信号。在分离电路22中分离出的声音信号在声音扩展电路10中扩展，在D/A转换器11中转换成从扬声器12输出的模拟声音信号。\n在发送时已被压缩并在分离电路22中已与声音信号分离的图象信号，在图象扩展电路23中扩展。\n在图象扩展电路23中扩展了的数字图象信号，在D/A转换器25中被转换成模拟图象信号，该模拟图象信号显示在显示单元16上。\n图6是表示本发明的第二优选实施例中的便携TV电话机从通信开始算起的操作流程图。本发明的第二优选实施例的操作将结合图3、4和6来说明。通信开始后，讲话者作出周围环境是否有噪声的判断(图6中的步骤S1)。当判断结果是周围环境没有噪声并且对方的声音能被清楚地听到时，谈话就在这个状态被继续(步骤S3)。另一方面，当判断结果是周围环境有噪声时，讲话者就戴上耳机话筒28(步骤S2)。当戴上耳机话筒28能使对方的声音被清楚听到，通话就在这个状态被继续(步骤S6)。\n即使在讲话者戴上耳机话筒28后仍不能清楚地听到对方的声音时(在步骤S4中转到NO)，则按下声音识别起动按钮17(步骤S5)。这就导致了对方声音识别的开始，声音识别的结果作为文本显示27被显示在便携电话机26的显示单元16上(步骤S7)。\n在接收电路8中接收另一方的通信数据，然后在解调电路9中受到QPSK 解调。解调了的信号接着在扩展电路10中受到带宽扩展，扩展了的数字声音数据在声音识别部分15中受到声音识别处理。结果如图4B中数字27标出的文本那样通过控制单元14显示在显示单元16上。\n在模式被设置为TV电话模式(在步骤S8中转到YES)以及文本被叠加在传输图像上(在步骤S9中转到YES)的情形下，图像通过控制单元14被视频相机21拍照。图像信号被A/D转换器20转换成数字信号，声音识别了的声音文本信号在文本多路复用电路24被叠加在数字化的图像信号上。\n被文本信号叠加在其上的图像信号，被发送给另一方的便携电话机并如图 4A中数字29表示的那样被显示(步骤S10)。当模式没有被设置为TV电话模式(在步骤S8中转到NO)或者当模式被设置为TV电话模式但是文本信号没有被叠加在传输图像上时(在步骤S9中转到NO)，不执行文本信号在图像信号上的叠加以及把叠加了的信号发送给另一方的便携式电话机(步骤S11)。\n在上面的优选实施例中，理所当然的是可以这样来执行控制：刚再次按下声音识别起动按钮17，声音识别功能就停止了。\n说明本发明的第一和第二优选实施例的功能和效果。\n在本发明的第一和第二优选实施例中，提供了声音识别装置，它把通过数字移动通信网发送的另一方的声音信号转换成文本数据。另一方的声音作为压缩了的和编码了的数字数据被发送。因此，不需要执行模拟到数字数据的转换，同时这样来压缩和编码了的数字数据可以受到声音识别并可将其转换成文本数据。\n通过声音识别装置从声音信号转换成文本数据的文本数据通过显示装置显示出来，这允许把显示出的数据作为辅助数据来使用、用于理解另一方说话的内容。即使是在有噪声的环境中，也能够实现谈话。\n提供了一种操作键，在谈话期间内依据操作键的控制，通过声音识别开始把另一方的说话转换成文本数据。依靠这一点，在有噪声的环境中在谈话期间内，当不能清楚地理解另一方的说话内容时，通过键控可以容易地启动声音识别。\n在上面的优选实施例中，当另一方的声音通过声音识别转换成将在显示单元上显示的文本数据时，在噪声环境中的谈话中很难理解的声音部分，可以作为声音识别了的文本的显示来观看。这能便于理解另一方说话的内容。这样的文本显示功能也可以改进听力丧失或听力困难的残疾人使用的便携电话机的便利性。\n在优选实施例中，结构就是，另一方的谈话通过声音识别转换成文本数据，然后也将其发送给另一方并能显示在另一方的终端显示单元上。在有噪声的环境中的讲话者，可以执行显示在讲话者的便携电话机上的另一方的说话的声音识别，可以在转换后把文本数据发送给另一方的电话，并且能在另一方的显示单元上显示文本数据，而另一方一侧能通过经转换得到的文本内容确认她或他自己说话内容。\n例如，在使用便携TV电话机的电话会议中，可以把文本数据作为另一方的声音识别的结果存储在存储器(未示出)中，而且，其后，被存储的数据可以用作为会议的官方记录的一部分。这一文本数据可以通过e-mail分发。\n把作为发送给另一通信方的声音识别的结果的文本数据与声音信息、图像信息等多路复用，把多路复用了的信号通过信息信道(TCH)传送。在作为声音识别结果的文本数据的情况下，例如，一个日文本符(例如，JIS)的数据容量(字节数)是小到2个字节，一个字母数字字符的数据容量是小到1个字节。也就是，数据容量太小以至于通过信息信道要照原样来传送信息就不可能压缩了。可以把通过声音识别产生的文本数据加到在基站与便携电话机之间的无线信道中的控制信道(CCH)等上并通过CCH而发送出去。\n接下来，说明本发明的第三个优选实施例。在第一和第二优选实施例中，在有噪声的环境中在便携电话机一侧执行接收到的声音的声音识别。另一方面，识别在发送者一侧通过讲话者的终端输入的声音，而且把作为声音识别结果而产生的文本数据通过控制信道、或者在与声音信号多路复用后发送给在有噪声环境中的便携电话机并加以显示。\n图7是表示本发明的第三优选实施例的结构图。现在参考图7，构成本发明的第三优选实施例的便携电话机包括：用于发送和接收的天线1；用于在发送信号和接收信号之间转换的天线开关2；用于允许要发送的声音信号输入的话筒7；用于把来自话筒7的模拟声音信号转换成数据声音信号的A/D转换装置6；用于压缩从A/D转换器6输出的数字声音信号的压缩电路5；用于使从声音压缩电路5输出的发送信号受到例如，QPSK调制的调制电路4；用于接收从控制单元14输出的文本数据并调制所接收到的文本数据的调制电路31；用于允许来自调制电路4的信号和从调制电路31输出的文本调制了的信号的输入以及多路复用和输出这些数据的多路复用电路30；以及用于把从多路复用电路30输出的发送信号转换成发送频率的发射机3。\n第三优选实施例中的便携电话机进一步包括：用于执行接收到的无线波的放大和频率调谐检测的接收电路8；用于把来自接收电路8的信号分离成声音调制了的信号和文本调制了的信号的分离电路33；用于使在分离电路33中分离出的声音调制了的信号受到QPSK解调的解调电路9；用于解调在分离电路 33中分离出的文本调制了的信号的解调电路32；用于扩展从解调电路9输出的压缩了的声音信号的扩展电路10；用于把从声音扩展电路10输出的被接收的数字声音信号转换成模拟声音信号的D/A转换器11；用于接收从D/A转换器11输出的模拟信号并输出声音信号的扬声器12；用于允许从A/D转换器6 输出的数字声音信号的输入并执行声音识别以便把数字声音信号转换成文本数据的声音识别电路15；显示单元16，如LCD(液晶显示器)，用于显示来自控制单元14的字符或图像；有键、按钮等的操作部分13；用于开始声音识别的声音识别起动按钮17；让用户戴上以和另一方谈话的耳机话筒28；以及用于控制整个电话机的控制单元14。控制单元14接收声音识别起动按钮17的输入和操作部分13的输入。控制单元14进而接收在解调单元32中解调了的文本数据并以在显示单元16上显示文本数据的方式来执行控制。控制单元14进而接收已在声音识别电路15中受到声音识别的文本数据，并将该数据发送给显示单元16。控制单元14进而把已经在声音识别电路15受到声音识别的文本数据发送给调制电路31。\n图8是表示在本发明的第三优选实施例中的便携电话机的外观的图。在图 8中，参考字符26C指出发送一侧的便携电话机，在那里通过话筒7引入的声音受到声音识别并被发送，参考字符26D，一个处于噪声环境下的便携电话机通过耳机话筒28处于谈话中，并在显示单元16上显示来自便携电话机26C的声音识别了的文本数据。在图8和5中所示的便携电话机中，类似的部分使用相同的参考数据标识。图9是详细说明本发明的第三优选实施例的操作的流程图。\n现在参考图7～9，当环境有噪声而且在戴上耳机话筒28这样的状态下还不能清楚地听到另一方的声音(图9中步骤S4是NO)时，讲话者使另一方按下另一方的便携电话机的声音识别起动按钮17(步骤S12)。\n依据在另一方的终端一侧按下声音识别起动按钮17，从话筒7引入的模拟声音信号在A/D转换器6中转换成数字信号，然后在声音识别部分15中受到声音识别。作为声音识别的结果而产生的文本数据通过控制单元14，并如图8A 中示出的，在终端26C中，如显示单元16上的数字29标出的那样被显示(步骤S13)。\n文本数据在调制电路31中被调制并在多路复用电路30中和调制了的声音信号被多路复用。把多路复用了的信号转换到发射频率并在发射电路3中放大，通过天线开关2，通过天线部分1发送出去。\n在有噪声环境下的终端中，天线1接收到的通信无线波通过天线开关2被输入到接收电路8，在那里接收到的无线波受到放大和频率调谐。调制了的信号从接收电路8中取出，然后在分离电路33中分离成声音调制了的信号和文本调制了的信号，在解调电路32中把分离出的文本调制了的信号解调为文本数据，同时如图8B中所示，在终端26D中，解调了的文本数据通过控制单元 14并如数字27标出的那样显示在显示单元16上。\n接下来，说明本发明的第四优选实施例。在第四优选实施例中，第三优选实施例的功能将被应用于便携TV电话。图10是表示本发明的第四优选实施例中的便携电话机的结构图，图11是图10中所示的便携电话机的外观的一个\n实施例的前视图。\n现在参考图10，构成本发明的第四优选实施例的便携电视电话机包括：用于发射和接收的天线1；用于在发射信号和接收信号之间转换的天线开关2；用于拍摄将发送的图像的视频相机21；用于把来自视频相机21的模拟图像信号转换成数字信号的A/D转换器20；用于允许要发送的声音信号的输入的话筒7；用于把来自话筒7或耳机话筒28的模拟声音信号转换成数字信号的A/D 转换器6；用于压缩从A/D转换器6输出的数字声音信号的声音压缩电路5；用于使从A/D转换器6输出的数字声音信号受到声音识别以便把数字声音信号转换成文本数据并用于把该文本数据发送给控制单元14的声音识别电路15；用于把从控制单元14发送的作为声音识别的结果的文本数据叠加到从A/D转换器20输出的数字图像信号上的文本多路复用电路24；用于压缩从文本多路复用电路24输出的数字图像信号的图像压缩电路19；用于多路复用来自图像压缩电路19的图像信号和来自声音压缩电路5的声音信号的多路复用电路18；用于使从多路复用电路18输出的发射信号受到QPSK调制的调制电路4；用于把从调制电路4输出的发射信号转换到发送频率的发送电路3。\n第四优选实施例中的便携电话机进而包括：用于对接收到的无线波执行放大和频率调谐检测的接收电路8；用于使来自接收电路8的信号受到QPSK解调的解调电路9；用于允许在解调电路9中解调了的信号的输入和用于把输入信号分离成声音信号和图像信号的分离电路22；用于扩展在分离电路22中分离出的压缩了的声音信号的声音扩展电路10；用于把从声音扩展电路10输出的接收到的数字化声音信号转换成模拟声音信号的D/A转换器11；用于输出声音信号的扬声器12；用于扩展在分离电路22中分离出的压缩了的图像信号的图像扩展电路23；用于把从图像扩展电路23输出的数字化的接收到的图像信号转换成模拟图像信号的D/A转换器25；用于显示接收到的图像和来自控制单元14的字符和图像的显示单元16；用于控制整个电话机的控制单元14；便携电话的操作电路13；以及用于开始声音识别的声音识别起动按钮17。\n图12是详细说明本发明的第四优选实施例的操作的流程图。结合图10～12 来说明本发明的第四优选实施例的操作。当在有噪声的周围环境下不能清楚地听到另一方的声音(在图12中步骤S4是NO)，同时，模式为TV电话模式(在步骤S14中，为YES)时，讲话者使另一方按下声音识别起动键17(步骤S15)。\n在另一方的终端中，在声音识别电路15中，使在A/D转换器6中把来自话筒7的模拟声音信号转换成数字声音信号而到的数字声音信号受到声音识别。\n在图11A中示出的电话机26E中，作为声音识别结果输出的文本数据通过控制单元14并如数字29表示的那样显示在显示单元16上(步骤S16)。作为声音识别结果输出的文本数据从控制单元14输入到文本叠加电路24，在那里文本数据被叠加在图像信号上，该图像信号是通过在A/D转换器20中把视频相机21拍摄的图像转换为数字信号而产生的。其后，文本信号已叠加在其上的图像信号，在图像压缩电路19中受到频带压缩。然后，压缩了的信号在多路复用电路18中与声音信号多路复用，把多路复用了的信号发送到另一方的终端。\n接下来，说明终端的操作，该终端接收在把文本数据、图像信号和声音信号互相多路复用起来的状态下正在被发送的信号。该多路复用了的信号通过接收电路8、解调电路9及把信号分离成数字图像信号和声音信号的分离电路22。在发送时已经压缩了的图像信号，在图像扩展电路23中被扩展。扩展了的图像信号在D/A转换器25中被转换成模拟图像信号并被显示在显示单元16上。已经被多路复用在图像信号上的文本数据，被如数字27指出的那样显示在图 11B中示出电话机26F中的显示单元16上(图12中的步骤S17)。\n在这个优选实施例中，结构就是，作为在讲话者一侧的声音识别的结果的文本数据被发送给另一方的终端一侧。依靠这种结构，在没有受到发送系统等中噪声影响的情况下文本数据能够被显示在另一方的终端上。\n接下来，说明本发明的第五优选实施例。在上面的优选实施例中，在通信终端一侧上进行声音识别。然而，理所当然的是，声音信号可以在终端之间的通信网络中受到声音识别。当声音识别的开始通过来自通信终端的一个指令来执行时，电信公司可以在通信网络中的所有时间上执行声音识别。换一种方式，可以把处理分配到通信终端与通信网络一侧来执行。\n图13示出本发明的第五优选实施例，它具有一种结构，使声音识别在交换中心36来执行。从连接到基站35这一侧开始，交换中心36包括：交换中心接口37；交换台40；以及和交换中心接口41。在从交换台40通到交换中心接口37的路径和从交换中心接口37通到交换台40的路径中，分别提供了多路复用电路38、39，用于多路复用通过在文本转换电路43中转换在声音识别电路42中声音识别的结果而得到的文本数据与声音信号。\n来自和处于有噪声环境下的终端26通信的终端26’的声音数据，在交换台 40中被交换，然后在声音识别电路42中受到声音识别，在文本转换电路43中转换成文本数据，在多路复用电路38中与从交换台40输出的声音信号多路复用。\n和文本数据多路复用了的声音信号通过交换中心接口37并被发送给处于噪声环境下的终端26，以与如在第一优选实施例中描述的同样的方式，文本数据被显示在终端26中的显示单元上。\n在交换中心36中，来自文本转换电路43的文本数据被叠加在来自处于噪声环境中的终端26的声音信号上，文本数据也被显示在终端26’的显示单元上。依靠这样，在终端26’一侧的讲话者也可以确认声音识别的结果。在这种连接中，可采用一种结构，其中处于噪声环境中的终端26是第一优选实施例的便携电话机，在交换中心36一侧，根据终端26的负载情况，或者根据来自终端 26的请求，声音识别在声音识别电路42中被执行，接着在文本转换电路43中转换成文本数据。\n目前的PDC移动分组通信系统(第二代)和下一代移动通信IMT-2000能提供一种易于接入因特网的性能。因而，在本发明中，在执行声音识别的通信网上的节点，不局限于上面的交换中心，可以采用一种结构，其中声音识别可以在如分组后发送声音信号等的网关或路由器中执行，声音识别的结果被插入分组，接着为另一方的终端和分组发送选择路径。例如，在3GPP(第三代合作方案)的核心网络系统中，如图14中所示，已知，一种线路交换功能(MSC (移动业务交换中心)/GMSC(网关MSC))和一种分组交换功能(PDSN(分组数据服务节点)/PDGN(分组数据网关节点))一起形成一个单独的节点，它能够实现来自声音通信的各种介质的综合的交换/发送。用户IP(因特网协议)分组受到通过基于节点ATM(异步传送模式)地址的ATM-SVC(交换虚拟连接)的隧道效应以提供QoS(业务质量)。也可以采用一种结构，其中声音识别在这一核心网络中执行，并且作为声音识别的结果的文本数据被加在声音数据上，该声音数据受到通过线路交换或分组交换的交换/发送，然后发送给目的终端。对于图14示出的核心网络，可参考Maruzen Co.，Ltd.于2001年6月 25日出版的Keiji Tachikawa(管理者)的“W-CDMA Ido Tsushin Hoshiki(W- CDMA移动通信系统)，”，第239页图4.2，或者电信协会(TTA)于2001年 5月10日出版的Kota Kinoshita，“Yasashii IMT-2000 Daisan Sedai Tdo Tsushin Hoshiki的“容易理解的IMT-2000第三代移动通信系统”，第81页图5.2。\n在上面的优选实施例中，依靠这样的结构，其中，在通信网络一侧把作为声音识别结果的文本数据发送给另一方的终端。可减小执行声音识别处理的 DSP(数字信号处理器)的处理负载，可防止电池驱动终端的消耗电流的增大。\n上面的优选实施例把便携电话机的结构作为例子来说明，以至于显示单元和声音通信部分被作为整体。换一种方式，可以采用一种结构，其中声音通信部分可从用于显示图像的显示单元拆离，声音通信部分可与显示单元中分离开来并可单独使用。一种便携电话机，其中声音通信部分已经被分离并独立于图像显示/照相部分来提供，例如可参考日本专利公开No.50223/2000，其发明人与本发明人相同。图像显示/照相部分可以通过红外线、蓝牙等与声音通信部分无线通信。在一种声音通信部分与显示单元分离并可单独提供使用的结构中，用户能看显示在显示单元上的文本而不戴耳机话筒。\n便携电话机当然也可以是PHS(个人手提电话系统)终端，PDA(个人数字助理)等。换一种方式，便携电话机可以是如有VoIP(声音IP)的个人计算机。\n如上面描述的，本发明有以下效果。\n根据本发明，提供用于把另一方的声音信号转换成文本数据的声音识别装置，可便于对另一方说话内容的理解，并能实现与另一通信方的谈话，比如，即使在有噪声的环境中。\n根据本发明，提供了便携电话机，有一个操作键，用于根据该键的操作在呼叫期间内通过声音识别开始把另一方的说话转换成文本数据。依靠这一点，在有噪声的环境中与另一通信方的谈话期间内，当不能清楚地理解另一方说话的内容时，声音识别可以通过按键方便容易地开始。\n进而，根据本发明，把另一方的说话通过被声音识别转换成文本数据，它也能被传送给另一通信方并显示在另一方终端的显示单元上。依靠这一点，另一通信方一侧也能通过由该转换得到的文本数据理解他或她自己说话的内容。这样可以提高便利性。\n根据本发明，在讲话者一侧上作为声音识别结果的文本数据被发送给另一方的终端。因而，即使在没有受到噪声影响等的发射系统中，数据也能显示在另一方的终端上。\n根据本发明，在通信网络一侧上作为声音识别结果的文本数据被发送给另一通信方的终端。依靠这一结构，可减小终端的处理负载并且，可防止或减小电池驱动终端的消耗电流的增大。\n本发明已经特别参考优选实施例详细描述了，但是可以理解，在附属的权利要求中所述的本发明的范围内可以实施各种变化和修改。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供