1.一种作为第一通信方终端的终端装置,包括:
声音压缩装置,用于压缩通过声音输入装置输入并转换为数字信号的声音 信号,并且用于输出该压缩了的信号;
调制装置,用于调制从声音压缩装置输出的压缩了的信号以产生输出的调 制了的信号;
无线传输装置,用于接收和无线传输从调制装置输出的调制了的信号;
解调装置,用于解调在无线接收装置中接收到的信号以产生将输出的解调 了的信号;
声音扩展装置,用于接收和扩展在解调装置中解调了的信号以产生将输出 的扩展了的数字声音信号;
声音识别装置,用于使从声音扩展装置输出的数字声音信号接受声音识别 来把数字声音信号转换成将输出的文本数据;
声音输出装置,用于接收和输出从声音扩展装置输出的数字声音信号所转 换的模拟声音信号;以及
控制装置,用于以下述方式来执行控制,当模式被设置为声音识别模式时, 把在声音扩展装置中扩展了的数字声音信号输入到声音识别装置中并接受声音 识别,把从声音识别装置输出的文本数据发送给显示装置并在显示装置上显 示。
2.根据权利要求1的终端装置,其中所述输出装置包括显示装置,文本 数据被显示在所述输出装置上。
3.根据权利要求1或2的终端装置,其中所述输出装置包括用于把从声 音识别装置输出的文本数据发送给第二通信方终端的装置。
4.根据权利要求1的终端装置,进一步包括,用于多路复用作为声音识 别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信号 发送给第二通信方终端的装置。
5.根据权利要求1的终端装置,进一步包括,用于多路复用作为声音识 别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多路 复用了的信号发送给第二通信方终端的装置。
6.根据权利要求1的终端装置,其中声音识别装置接收通过在解调装置 中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解调 了的信号而得到的数字声音信号以作为输入数据,并对其执行声音识别。
7.根据权利要求1的终端装置,其中作为声音识别结果的文本数据在显 示装置上显示。
8.根据权利要7的终端装置,进一步包括用于多路复用作为声音识别结 果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二通信 方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信号的 装置。
9.根据权利要求1的终端装置,进一步包括:
一个操作键,用于启动声音识别开始的指令;以及
用于依据操作键的预定操作,启动由声音识别装置执行由声音到文本数据 的转换的装置。
10.根据权利要求1的终端装置,进一步包括:
用于当要监视的预定信号的状态满足预定要求时,启动由声音识别装置执 行由声音到文本数据的转换的装置。
11.一种作为第一通信方终端的终端装置,包括:
声音识别装置,用于执行输入声音信号的声音识别以便把该声音信号转换 成将输出的文本数据;
第一多路复用装置,用于允许作为从声音识别装置输出的声音识别的一个 结果的文本数据和从图像输入装置输入并转换为数字信号的图像信息的输入, 并且用于多路复用它们以便产生将被输出的多路复用了的信号;
图像压缩装置,用于接收和压缩从该第一多路复用装置输出的信号来产生 将输出的压缩了的图像信号;
声音压缩装置,用于压缩经过声音输入装置输入并转换为数字信号的声音 信号来产生将输出的压缩了的声音信号;
第二多路复用装置,用于允许从图像压缩装置输出的信号及从声音压缩装 置输出的信号的输入,并多路复用它们来产生将输出的多路复用了的信号;
调制装置,用于调制从第二多路复用装置输出的信号来产生将输出的调制 了的信号;
无线传输装置,用于接收并无线传输从调制装置输出的信号;
解调装置,用于解调在无线接收装置中接收到的信号来产生将输出的解调 了的信号;
分离装置,用于允许在解调装置中解调了的信号的输入,并把输入信号分 离成将输出的图像信号和声音信号;
图像扩展装置,用于接收和扩展在分离装置中分离出的图像信号来产生将 输出的扩展了的数字图像信号;
声音扩展装置,用于接收和扩展在分离装置中分离出的声音信号来产生将 输出的扩展了的数字声音信号;
显示装置,用于接收和显示从图像扩展装置输出的数字图像信号所转换的 模拟信号;
声音输出装置,用于接收和输出从声音扩展装置输出的数字声音信号所转 换的模拟声音信号;以及
控制装置,用于以下述方式来执行控制,当模式被设置为声音识别模式时, 把在声音扩展装置中扩展了的数字声音信号输入到声音识别装置中并使其受到 声音识别,把从声音识别装置输出的文本数据发送给第一多路复用装置。
12.根据权利要求11的终端装置,其中所述输出装置包括显示装置,文 本数据被显示在所述输出装置上。
13.根据权利要求11或12的终端装置,其中所述输出装置包括用于把从 声音识别装置输出的文本数据发送给第二通信方终端的装置。
14.根据权利要求11的终端装置,进一步包括,用于多路复用作为声音 识别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信 号发送给第二通信方终端的装置。
15.根据权利要求11的终端装置,进一步包括,用于多路复用作为声音 识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多 路复用了的信号发送给第二通信方终端的装置。
16.根据权利要求11的终端装置,其中声音识别装置接收通过在解调装 置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解 调了的信号而得到的数字声音信号以作为输入数据,并对其执行声音识别。
17.根据权利要求11的终端装置,其中作为声音识别结果的文本数据在 显示装置上显示。
18.根据权利要求17的终端装置,进一步包括用于多路复用作为声音识 别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二 通信方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信 号的装置。
19.根据权利要求11的终端装置,进一步包括:
一个操作键,用于启动声音识别开始的指令;以及
用于依据操作键的预定操作,启动由声音识别装置执行由声音到文本数据 的转换的装置。
20.根据权利要求11的终端装置,进一步包括:
用于当要监视的预定信号的状态满足预定要求时,启动由声音识别装置执 行由声音到文本数据的转换的装置。
21.根据权利要求11的终端装置,其中控制装置包括,用于以使得从声 音识别装置输出的文本数据发送给显示装置并在显示装置上显示的方式来执行 控制的装置。
22.一种作为第一通信方终端的终端装置,包括:
声音压缩装置,用于压缩通过声音输入装置输入并被转换为数字信号的声 音信号,来产生将被输出压缩了的信号;
声音识别装置,用于执行通过声音输入装置输入和转换为数字信号的声音 信号的声音识别来把声音信号转换成将输出的文本数据;
第一调制装置,用于调制从声音压缩装置输出的信号来产生将输出的调制 了的声音信号;
第二调制装置,用于调制输入的文本数据来产生将输出的调制了的文本数 据;
多路复用装置,用于接收从第一调制装置输出的信号和从第二调制装置输 出的信号,并多路复用它们来产生将输出的多路复用了的信号;
无线传输装置,用于接收和无线传输从多路复用装置输出的信号;
分离装置,用于把在无线接收装置中接收的信号分离为将输出的文本信号 和声音信号;
第一解调装置,用于接收和解调在分离装置中分离出的声音信号来产生将 输出的声音信号;
第二解调装置,用于接收和解调在分离装置中分离出的文本信号来产生将 输出的文本数据;
声音扩展装置,用于接收和扩展从第一解调装置输出的信号来产生将输出 的数字声音信号;以及
声音输出装置,用于接收和输出从在声音扩展装置中扩展了的数字声音信 号所转换的模拟声音信号;其中,
所述第二解调装置把解调了的文本数据传输给控制装置,
所述控制装置接收在第二解调装置中解调了的文本数据,在显示装置上显 示该文本数据,并进一步把文本数据发送给第二调制装置,并且
所述控制装置从声音识别装置接收文本数据,并以使得文本数据发送给第 二调制装置的方式来执行控制。
23.根据权利要求22的终端装置,其中所述输出装置包括显示装置,文 本数据被显示在所述输出装置上。
24.根据权利要求22或23的终端装置,其中所述输出装置包括用于把从 声音识别装置输出的文本数据发送给第二通信方终端的装置。
25.根据权利要求22的终端装置,进一步包括,用于多路复用作为声音 识别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信 号发送给第二通信方终端的装置。
26.根据权利要求22的终端装置,进一步包括,用于多路复用作为声音 识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多 路复用了的信号发送给第二通信方终端的装置。
27.根据权利要求22的终端装置,其中声音识别装置接收通过在解调装 置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解 调了的信号而得到的数字声音信号以作为输入数据,并对其执行声音识别。
28.根据权利要求22的终端装置,其中作为声音识别结果的文本数据在 显示装置上显示。
29.根据权利要求28的终端装置,进一步包括用于多路复用作为声音识 别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二 通信方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信 号的装置。
30.根据权利要求22的终端装置,进一步包括:
一个操作键,用于启动声音识别开始的指令;以及
用于依据操作键的预定操作,启动由声音识别装置执行由声音到文本数据 的转换的装置。
31.根据权利要求22的终端装置,进一步包括:
用于当要监视的预定信号的状态满足预定要求时,启动由声音识别装置执 行由声音到文本数据的转换的装置。
32.一种作为第一通信方终端的终端装置,包括:
声音压缩装置,用于压缩通过声音输入装置输入并转换为数字信号的声音 信号,来产生将输出的压缩了的信号;
声音识别装置,用于执行通过声音输入装置输入并转换为数字信号的声音 信号的声音识别来把声音信号转换成将输出的文本数据;
第一多路复用装置,用于允许输入文本数据通过图像输入装置输入并转换 为数字信号的图像信息,并用于多路复用它们来产生将输出的多路复用信号;
图像压缩装置,用于接收和压缩从第一多路复用装置输出的信号,来产生 将输出的压缩了的图像信号;
第二多路复用装置,用于允许输入从图像压缩从装置输出的信号和从声音 压缩装置输出的信号,并用于多路复用它们来产生将输出的多路复用了的信 号;
调制装置,用于调制从第二多路复用装置输出的信号来产生将输出的调制 信号;
无线传输装置,用于接收和无线传输从调制装置输出的调制信号;
解调装置,用于解调在无线接收装置中接收到的信号来产生将输出的解调 了的信号;
分离装置,用于允许输入在解调装置中解调了的信号,和用于把输入信号 分离为将输出的图像信号和声音信号;
图像扩展装置,用于接收和扩展在分离装置中分离出的图像信号来产生将 输出的扩展了的数字图像信号;
声音扩展装置,用于接收和扩展在分离装置中分离出的声音信号来产生将 输出的扩展了的数字声音信号;
显示装置,用于接收和显示从在图像扩展装置中扩展了的数字图像信号所 转换的模拟图像信号;
声音输出装置,用于接收和输出从在声音扩展装置中扩展了的数字声音信 号所转换的模拟信号;以及
控制装置,用于以这样的方式来执行控制,以便当模式被设置为声音识别 模式时,把作为在声音识别装置中声音识别结果输出的文本数据发送给第一多 路复用装置。
33.根据权利要求32的终端装置,其中所述输出装置包括显示装置,文 本数据被显示在所述输出装置上。
34.根据权利要求32或33的终端装置,其中所述输出装置包括用于把从 声音识别装置输出的文本数据发送给第二通信方终端的装置。
35.根据权利要求32的终端装置,进一步包括,用于多路复用作为声音 识别结果的文本数据和要发送给第二通信方终端的信号、并把多路复用了的信 号发送给第二通信方终端的装置。
36.根据权利要求32的终端装置,进一步包括,用于多路复用作为声音 识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把所述多 路复用了的信号发送给第二通信方终端的装置。
37.根据权利要求32的终端装置,其中声音识别装置接收通过在解调装 置中解调从第二通信方终端发送的第二通信方的声音并在扩展装置中扩展该解 调了的信号而得到的数字声音信号以作为输入数据,并对其执行声音识别。
38.根据权利要求32的终端装置,其中作为声音识别结果的文本数据在 显示装置上显示。
39.根据权利要求38的终端装置,进一步包括用于多路复用作为声音识 别结果的文本数据与要发送给第二通信方终端装置的声音信号或要发送给第二 通信方终端装置的图像信号来产生将发送给第二通信方终端装置的多路复用信 号的装置。
40.根据权利要求32的终端装置,其中所述控制装置把文本数据发送给 显示装置以在显示装置上显示文本数据。
41.根据权利要求32的终端装置,进一步包括:
一个操作键,用于启动声音识别开始的指令;以及
用于依据操作键的预定操作,启动由声音识别装置执行由声音到文本数据 的转换的装置。
42.根据权利要求32的终端装置,进一步包括:
用于当要监视的预定信号的状态满足预定要求时,启动由声音识别装置执 行由声音到文本数据的转换的装置。
技术领域\n本发明涉及一种移动通信系统,特别涉及例如在移动通信网络中具有执行 另一方说话的声音识别功能的终端装置,以及一种通信控制方法。\n背景技术\n在使用诸如便携式电话机(也称为“MS(移动站)”或“移动电话”)的 通信终端装置在嘈杂的环境下进行通话时,该电话机经交换中心、或通过无线 线路连接到基站而构成的移动通信系统的电话网络等而被连接到另一方的电话 终端上,有时候,环境噪声妨碍了另一方说话的内容,不能容易地被听到。便 携式电话机的出现,增加了使用范围和便利性,该便携式电话机使得甚至在嘈 杂的环境下也能够明白另一方说话的内容,从而能够在很难收听的环境下与另 一方谈话。\n例如,日本专利公开No.168552/1999披露了一种备有声音识别装置的便携 式电话机,该声音识别装置用于把声音信号转换成字符数据。特别是这种便携 式电话机具有声音记录功能,也就是记录在通话期间谈话的内容等功能,并包 括用于将声音数据转换到字符数据的声音识别装置。已经构成了这样的便携式 电话机,使得能够通过在存储器中写入转换了的字符数据而显著减小记录每次 呼叫的声音所需的数据规模。在日本专利公开No.168552/1999所描述的便携式 电话机中,为了有效的使用存储器来记录声音,把声音数据转换成字符数据而 将其存储到存储器中。这种便携式电话机缺少用于允许用户直接输出另一方的 说话的装置。\n发明内容\n因此,本发明的目的是提供一种终端装置,例如甚至在难以收听的环境下; 该装置也能够通过声音识别清楚地知道另一方说话的内容和能够与另一方谈话; 以及本发明的目的是提供一种通信控制方法。\n通过本发明的下述特征,可达到以上目的。\n(1)作为第一通信方终端的终端装置包括:声音识别装置,它在通过连 接到第二通信方终端的期间内,当模式被设置为声音识别模式时,作为数字声 音信号接收从第二通信方的终端发送的第二通信方声音,并执行声音识别以便 把数字声音信号转换成文本数据;以及控制装置,它执行这样一种控制功能, 使得由声音识别装置转换的文本数据从输出装置输出。\n(2)根据上述项(1)的终端装置,其中输出装置包括显示装置,文本 数据被显示在该显示装置上。\n(3)根据上述项(1)或(2)的终端装置,其中输出装置包括用于把从 声音识别装置输出的文本数据发送给第二通信方终端的装置。\n(4)一个作为第一通信方终端的终端装置包括:用于执行来自第二通信 方终端的声音信号的声音识别以便把声音信号转换成文本信号的声音识别装 置;以及用于把文本数据作为声音识别结果发送给第二通信方终端的装置。\n(5)一种作第二通信方的终端装置的终端装置,它用于与根据上述第 (4)项的终端装置进行通信连接,所述第二通信方终端装置包括:用于接收 从根据上述项(4)的终端装置发送的文本数据和用于以使接收到的文本数据 在显示装置上显示的方式来执行控制的装置。\n(6)一个作为第一通信方终端的终端装置包括:用于执行来自第二通信 方终端的声音信号的声音识别以便把该声音信号转换成文本数据的声音识别装 置;用于把作为声音识别结果的文本数据发送给第二通信方终端的装置;以及 用于从第二通信方终端发送的信号中提取文本数据和用于以使得在显示装置上 显示该文本数据的方式来执行控制的装置。\n(7)根据上述项(6)的终端装置,进一步包括用于多路复用作为声音 识别结果的文本数据与要发送给第二通信方终端的信号、并把多路复用了的信 号发送给第二通信方终端的装置。\n(8)根据上述项(6)的终端装置,进一步包括用于多路复用作为声音 识别结果的文本数据与要发送给第二通信方终端的图像信息、并用于把多路复 用了的信号发送给第二通信方终端的装置。\n(9)根据上述项(1),(4)和(6)的任一项的终端装置,其中声音识 别装置接收通过在解调装置中解调从第二通信方终端发送的第二通信方的声音 并在扩展装置中扩展该解调了的信号而得到的数字声音信号以作为输入数据, 并对其执行声音识别。\n(10)作为第一通信方终端的终端装置,包括:声音压缩装置,用于压缩 通过声音输入装置输入并转换为数字信号的声音信号,并且用于输出该压缩了 的信号;用于调制从声音压缩装置输出的压缩了的信号来产生将输出的调制了 的信号的调制装置;用于接收和无线传输从调制装置输出的调制了的信号的无 线传输装置;用于解调在无线接收装置中接收到的信号来产生将输出的解调了 的信号的解调装置;用于接收和扩展在解调装置中解调了的信号来产生将输出 的扩展了的数字声音信号的声音扩展装置;用于使声音扩展装置输出的数字声 音信号受到声音识别来把数字声音信号转换成将输出的文本数据的声音识别装 置;用于接收并输出从声音扩展装置输出的数字声音信号所转换的模拟声音信 号的声音输出装置;以及用于以下述方式来执行控制的控制装置,当模式被设 置为处于声音识别模式时,把在声音扩展装置中扩展了的数字声音信号输入到 声音识别装置中并使其接受声音识别,把从声音识别装置输出的文本数据发送 给显示装置并在显示装置上显示。\n(11)作为第一通信方终端的终端装置包括:用于执行输入声音信号的声 音识别以便把该声音信号转换成将输出的文本数据的声音识别装置;用于允许 作为从声音识别装置输出的声音识别的一个结果的文本数据和从图像输入装置 输入并转换为数字信号的图像信息的输入,并且用于多路复用它们以便产生将 输出的多路复用了的信号的第一多路复用装置;用于接收和压缩从该第一多路 复用装置输出的信号来产生将输出的压缩了的图像信号的图像压缩装置;用于 压缩经过声音输入装置输入并转换为数字信号的声音信号来产生将输出的压缩 了的声音信号的声音压缩装置;用于允许从图像压缩装置输出的信号及从声音 压缩装置输出的信号的输入并多路复用它们来产生将输出的多路复用了的信号 的第二多路复用装置;用于调制从第二多路复用装置输出的信号来产生将输出 的调制了的信号的调制装置;用于接收并无线传输从调制装置输出的信号的无 线传输装置;用于解调在无线接收装置中接收到的信号来产生将输出的解调了 的信号的解调装置;用于允许在解调装置中解调了的信号的输入并把输入信号 分离成将输出的图像信号和声音信号的分离装置;用于接收和扩展在分离装置 中分离出的图像信号来产生将输出的扩展了的数字图像信号的图像扩展装置; 用于接收和扩展在分离装置中分离出的声音信号来产生将输出的扩展了的数字 声音信号的声音扩展装置;用于接收和显示从图像扩展装置输出的数字图像信 号所转换的模拟信号的显示装置;用于接收和输出从声音扩展装置输出的数字 声音信号所转换的模拟声音信号的声音输出装置;以及用于以下述方式来执行 控制的控制装置,当模式被设置为声音识别模式时,把在声音扩展装置中扩展 了的数字声音信号输入到声音识别装置中并使其受到声音识别,把从声音识别 装置输出的文本数据发送给第一多路复用装置。\n(12)根据上述项(11)的终端装置,其中控制装置包括用于以使得从声 音识别装置输出的文本数据发送给显示装置并在显示装置上显示的方式来执行 控制的装置。\n(13)作为第一通信方终端的终端装置包括:用于执行用户通过声音输入 装置输入的声音的识别以便把该声音转换成文本数据的声音识别装置;以及用 于把作为声音识别结果的文本数据发送给第二通信方终端装置的装置。\n(14)根据上述项(13)的终端装置,其中作为声音识别结果的文本数据 在显示装置上显示。\n(15)作为用于通信连接到根据上述项(13)或(14)的终端装置的第二 通信方终端装置的终端装置,所述第二通信方终端装置包括:用于以使得从根 据上述项(13)或(14)的终端装置发送的信号中提取文本数据并在显示装置 上显示的方式来执行控制的装置。\n(16)根据上述项(13)或(14)的终端装置,进一步包括用于多路复用 作为声音识别结果的文本数据与要发送给第二通信方终端装置的声音信号或要 发送给第二通信方终端装置的图像信号,来产生将发送给第二通信方终端装置 的多路复用信号的装置。\n(17)作为第一通信方终端的终端装置包括:用于压缩通过声音输入装置 输入并转换为数字信号的声音信号来产生将输出的压缩了的信号的声音压缩装 置;用于执行通过声音输入装置输入和转换为数字信号的声音信号的声音识别 来把声音信号转换成将输出的文本数据的声音识别装置;用于调制从声音压缩 装置输出的信号来产生将输出的调制了的声音信号的第一调制装置;用于调制 输入的文本数据来产生将输出的调制了的文本数据的第二调制装置;用于接收 从第一调制装置输出的信号和从第二调制装置输出的信号,多路复用它们来产 生将输出的多路复用了的信号的多路复用装置;用于接收并无线传输从多路复 用装置输出的信号的无线传输装置;用于把在无线接收装置中接收的信号分离 成将输出的文本信号和声音信号的分离装置;用于接收和解调在分离装置中分 离出的声音信号来产生将输出的声音信号的第一解调装置;用于接收和解调在 分离出装置中分离的文本信号来产生将输出的文本数据的第二解调装置;用于 接收和扩展从第一解调装置输出的信号来产生将输出的数字声音信号的声音扩 展装置;以及声音输出装置,用于接收和输出从在声音中扩展装置中扩展了的 数字声音信号所转换的模拟声音信号,其中所述第二解调装置把解调了的文本 数据传输给控制装置,所述控制装置接收在第二解调装置中解调了的文本数 据,在显示装置上显示该文本数据,并进一步把文本数据发送给第二解调装置, 并且所述控制装置从声音识别装置接收文本数据,并且以使得文本数据发送给 第二调制装置的方式来执行控制。\n(18)作为第一通信方终端的终端装置包括:用于压缩通过声音输入装置 输入并转换为数字信号的声音信号来产生将输出的压缩了的信号的声音压缩装 置;用于执行通过声音输入装置输入和转换为数字信号的声音信号的声音识别 来把声音信号转换成将输出的文本数据的声音识别装置;用于允许文本数据和 通过图像输入装置输入并转换为数字信号的图像信息的输入,和用于多路复用 它们来产生将输出的多路复用信号的第一多路复用装置;用于接收和压缩从第 一多路复用装置输出的信号来产生将输出的压缩了的图像信号的图像压缩装 置;用于允许输入从图像压缩装置输出的信号和从声音压缩装置输出的信号, 和用于多路复用它们来产生将输出的多路复用了的信号的第二多路复用装置; 用于调制从第二多路复用装置输出的信号来产生将输出的调制信号的调制装 置;用于接收和无线传输从调制装置输出的信号的无线传输装置;用于解调在 无线接收装置中接收到的信号来产生将输出的解调了的信号的解调装置;用于 允许输入在解调装置中解调了的信号,和用于把输入信号分离为将输出的图像 信号和声音信号的分离装置;用于接收和扩展在分离装置中分离出的图像信号 来产生将输出的扩展了的数字图像信号的图像扩展装置;用于接收和扩展在分 离装置中分离出的声音信号来产生将输出的扩展了的数字声音信号的声音扩展 装置;用于接收和显示从在图像扩展装置中扩展了的数字图像信号所转换的模 拟图像信号的显示装置;用于接收和输出从在声音扩展装置中扩展了的数字声 音信号所转换的模拟信号的声音输出装置;以及用于以这样的方式来执行控制 的控制装置,当模式被设置为声音识别模式时,把作为在声音识别装置中声音 识别结果输出的文本数据发送给第一多路复用装置。\n(19)根据上述项(18)的终端装置,其中控制装置把文本数据发送给显 示装置,以便在显示装置上显示文本数据。\n(20)根据上述项(1),(4),(6),(10),(11),(13),(17)和(18) 任一项的终端装置,进一步包括:一个用于启动声音识别开始的指令的操作键; 以及用于依据操作键的预定操作,启动声音识别装置执行的由声音到文本数据 的转换的装置。\n(21)根据上述项(1),(4),(6),(10),(11),(13),(17)和(18) 任一项的终端装置,进一步包括:用于当要监视的预定信号的状态满足预定要 求时,启动由声音识别装置执行由声音到文本数据的转换的装置。\n(22)一种包括用于传输一个终端发送给另一个终端、或从另一终端接收 的声音信号的通信网络的通信系统,在所述通信网络上具有至少一个节点,该 节点包括用于接收要传输的声音信号并执行声音识别以便把声音信号转换成文 本数据的装置,所述转换了的文本数据从通信网络上的所述一个节点传输给声 音信号接收者的终端、或声音信号接收者的终端和声音信号发射者的终端。\n(23)根据上述项(22)的通信系统,其中在声音信号接收者的终端、或 在声音信号接收者的终端和声音信号发送者的终端中提供了用于执行声音信号 的声音识别来把声音信号转换成文本数据的装置,根据声音信号接收者的终端 和/或声音信号发送者的终端的负载状态,或根据来自声音信号接收者的终端和 /或声音信号发射者的终端的请求而在通信网络一侧执行所述声音识别。\n(24)根据上述项(1),(4),(10),(11),(13),(17)和(18)任一项 的终端装置,其中终端装置是用于与基站无线通信的移动站。\n(25)根据上述项(22)或(23)的通信系统,其中连接到通信网络的终 端是与用于基站无线通信的移动站。\n(26)根据上述项(1),(4),(6),(10),(11),(13),(17)和(18) 任一项的终端装置,该装置可分离为:包括声音输入装置和声音输出装置的第 一单元;以及包括显示装置的第二单元。\n(27)一种通信控制方法包括步骤:在多个互相通信连接的终端中的第一 终端,接收通过解调和扩展从第二通信方终端发送的第二通信方的声音而得到 的数字声音信号,并执行数字声音信号的声音识别以便把数字声音信号转换成 文本数据;以及从所述第一终端中的输出装置输出文本数据。\n(28)根据上述项(27)的通信控制方法,其中文本数据在构成所述一个 终端的输出装置的显示单元上显示。\n(29)根据上述项(27)或(28)的通信控制方法,包括从所述第一终端 把文本数据传输给所述第二终端的步骤,其中把所述第二通信方说话的声音识 别的结果返回给所述第二通信方。\n(30)根据上述项(27)或(28)的通信控制方法,包括在所述第二终端 中的显示单元上显示从所述第一终端发送的文本数据的步骤。\n(31)根据上述项(27)的通信控制方法,其中以这样的方式来执行控制: 依据在所述一个终端上的预定操作键的预定操作,或当要监视的预定信号满足 预定要求时,在所述第一终端中,启动所述第二方说话的声音识别来把声音信 号转换成文本数据。\n(32)一种通信控制方法包括步骤:在第一终端中执行从通信连接到所述 第一终端的第二通信方终端发送的声音信号的声音识别,来把声音信号转换成 文本数据;从所述第一终端把作为声音识别结果的文本数据发送给所述另一通 信方终端;以及在所述第一终端中,以这样的方式来执行控制:使得作为从所 述第二通信方终端发送的声音信号的声音识别结果的文本数据在显示装置上显 示。\n(33)根据上述项(32)的通信控制方法,其中每个所述终端都是具有便 携可视电话功能的终端,所述第一终端多路复用作为声音识别结果的文本数据 与要发送给所述第二通信方终端的图像信息,并把多路复用了的信号发送给所 述第二通信方终端。\n(34)一种通信控制方法包括步骤:执行由用户通过第一终端输入的声音 的声音识别来把声音信号转换成文本数据;以及把作为声音识别结果的文本数 据发送给第二通信方终端。\n(35)根据上述项(34)的通信控制方法,其中作为声音识别结果的文本 数据在所述第一终端的显示单元上显示。\n(36)根据上述项(34)或(35)的通信控制方法,其中,在第二通信方 终端中,使得从所述第一终端发送的文本数据在显示单元上被显示。\n(37)根据上述项(34)或(35)的通信控制方法,包括步骤:在所述第 一终端中,多路复用作为声音识别结果的文本数据与要传输给第二通信方终端 的声音信号或图像信号,并把多路复用了的信号传输给第二通信方终端。\n(38)一种通信控制方法包括步骤:在用于至少传输讲话者的声音信号的 发送者的终端与接收者的终端之间的通信网络中提供的声音识别装置中,接收 声音信号,并执行声音识别以便把声音信号转换成文本数据;以及把在通信网 络上提供的声音识别装置中转换了的文本数据传输给接收者的终端、或接收者 的终端和发送者的终端。\n附图简要描述\n下面将结合附图更详细地说明本发明,其中\n图1示出了本发明的第一优选实施例中的便携式电话机的结构;\n图2示出了本发明的第一优选实施例中的便携式电话机的外形;\n图3示出了本发明的第二优选实施例中的便携式电话机的结构;\n图4示出了本发明的第二优选实施例中的便携式电话机的外形;\n图5示出了本发明的第一优选实施例中的便携式电话机的操作的流程图;\n图6示出了本发明的第二优选实施例中的便携式电话机的操作的流程图;\n图7示出了本发明的第三优选实施例中的便携式电话机的结构;\n图8示出了本发明的第三优选实施例中的便携式电话机的外形;\n图9示出了本发明的第三优选实施例中的便携式电话机的操作的流程图;\n图10示出了本发明的第四优选实施例中的便携式电话机的结构;\n图11示出了本发明的第四优选实施例中的便携式电话机的外形;\n图12示出了本发明的第四优选实施例中的便携式电话机的操作的流程图;\n图13示出了本发明的第五优选实施例中的交换中心的结构;\n图14示出应用了本发明的3GPP核心网络的结构。\n优选实施例的描述\n下面将结合附图说明本发明的优选实施例。图1示出了根据本发明的终端 装置的优选实施例。图1示出的终端装置包括:声音识别装置(15),该装置 在通信连接到另一通信方的终端(在下文中经常简称为“另一方终端”)时, 接收通过分别在解调电路和扩展电路中解调和扩展接收单元所接收的另一方的 声音信号而得到的数字声音信号,并执行声音识别来把声音数据转换成文本数 据;控制装置(14),该装置接收从声音识别装置(15)输出的文本数据并把 文本数据发送给显示装置(16),在那里显示文本数据。\n更具体地说,图1示出的根据本发明的终端装置的优选实施例包括:声音 压缩装置(5),用于压缩声音信号和输出压缩了的声音信号,这些声音信号从 声音输入装置(图1中的7和28)接收和被转换为数字信号;调制装置(4), 用于调制从声音压缩装置(5)输出的信号和输出调制了的信号;无线传输装 置(3、2、1),用于接收从调制装置输出的信号和无线发送该信号;解调装置 (9),用于解调在无线接收装置(1、2、8)中接收的信号并输出解调了的信 号;声音扩展装置(10),用于接收解调装置(9)解调的信号,扩展该接收信 号,并输出数字声音信号;声音识别装置(15),用于执行从声音扩展装置(10) 输出的数字声音信号的声音识别,把数字声音信号转换成文本数据,并输出该 文本数据:声音输出装置(12、28),用于接收通过把从声音扩展装置(10) 输出的数字声音信号转换成模拟信号而得到的信号和输出声音;控制装置 (14),用于以这样的方式来执行控制:当设置的状态是声音识别模式时,在 声音扩展装置(10)中扩展了的数字声音信号被输入到用于声音识别的声音识 别装置(15),从声音识别装置(15)输出的文本数据被发送到显示装置(16) 来显示该数据。\n本发明的这个优选实施例中的终端装置可以具有声音识别启动按钮(17) 作为操作键。依据声音识别启动按钮(17)的按下,控制装置(14)执行控制, 这样,从当这个按钮按下的那个时候起,声音识别装置(15)执行另一方的说 话的声音识别,开始把数字声音信号转换成文本数据。\n换句话说,在本发明的这个优选实施例中的终端装置中,可以采用一种结 构,其中监视环境噪声的电平,当判断为噪声电平超过了预定阈值时,声音识 别装置(15)的声音识别处理被自动触发。\n进而,在本发明的这个优选实施例中的终端装置可以具有图3示出的结构, 其中提供用于执行另一方说话的声音识别和把声音信号转换成文本数据的声音 识别装置(15)和用于作为文本数据把另一方说话的声音识别结果传输给另一 方终端的装置(14、24),并且在接收了文本数据的另一方终端中,文本数据 显示在显示装置(16)上。当本发明的这个优选实施例中的终端装置具有便携 式TV电话(电视电话)功能时,在与要发送给另一方终端的图像信息多路复 用的状态下,把文本数据作为声音识别的结果发送给另一方终端。\n更具体地说,图3示出了根据本发明的终端装置的第二优选实施例。该终 端装置包括:声音识别装置(15),用于执行输入声音信号的声音识别,把声 音信号转换成文本数据,并输出该文本数据;第一多路复用装置(24),用于 允许作为声音识别的结果的文本数据,和从图像输入装置(21)接收到的并已 通过第一模拟—数字转换(A/D转换)装置(20)转换成数字信号的图像信息 的输入,多路复用它们,并输出多路复用了的信号;图像压缩装置(19),用 于接收从第一多路复用装置(24)输出的多路复用了的数据和压缩该数据;声 音压缩装置(5),用于压缩从声音输入装置(7、28)接收和已在第二模拟— 数字转换(A/D转换)装置(6)中转换成数字信号的声音信号;第二多路复 用装置(18),用于允许从图像压缩装置(19)输出的压缩了的数据,和从声 音压缩装置(5)输出的压缩了的数据的输入,多路复用它们,输出多路复用 了的信号;调制装置(4),用于调制从第二多路复用装置(18)输出的多路复 用信号;无线传输装置(3、2、1),用于接收从调制装置(4)输出的信号和 无线传输该信号;解调装置(9),用于解调在无线接收装置(1、2、8)中接 收的信号;分离装置(22),用于允许通过解调装置(9)解调了的信号的输入, 把该信号分离成图像信号和声音信号,输出这些分离了的信号;图像扩展装置 (23),用于接收在分离装置(22)中分离出的图像信号,扩展该图像信号, 输出扩展了的信号;声音扩展装置(10),用于接收在分离装置(22)中分离 了的声音信号,扩展该声音信号,输出扩展了的信号;第一数字—模拟转换(D/A 转换)装置(25),用于把在图像扩展装置(23)中扩展了的数字图象信号转 换成模拟图象信号;显示装置(16),用于显示来自第一D/A转换装置(25) 的模拟图象信号;第二数字—模拟转换(D/A转换)装置(11),用于把在声 音扩展装置(10)中扩展了的数字声音信号转换成模拟声音信号;声音输出装 置(12、28),用于把从第二D/A转换装置(11)接收的模拟声音信号输出; 以及控制装置(14),用于以这样的方式来执行控制,当设置的状态是声音识 别方式时,把在声音扩展装置(10)中扩展了的数字声音信号输入给用于声音 识别的声音识别装置(15),把从声音识别装置(15)输出的文本数据发送给 第一多路复用装置(24)。在这一优选实施例中,依据声音识别启动按钮(17) 的按下,声音识别装置(15)执行声音识别。\n图7示出了根据本发明的终端装置的第三优选实施例。该终端装置包括: 声音压缩装置(5),用于压缩声音信号并输出该压缩了的信号,这些声音信号 从声音输入装置(7、28)接收并已在模拟—数字转换(A/D转换)装置(6) 中被转换为数字信号;声音识别装置(15),用于执行在A/D转换装置(6)中 转换为数字信号的声音信号的声音识别,把数字数据转换成文本数据,输出该 文本数据;第一调制装置(4),用于调制声音压缩装置(5)的输出;第二调 制装置(31),用于调制文本数据;多路复用装置(30),用于接收从第一调制 装置(4)输出的调制了的信号和从第二调制装置(31)输出的调制了的信号, 多路复用这些调制了的信号;无线传输装置(3、2、1),用于接收从多路复用 装置(30)输出的多路复用了的信号,无线传输该多路复用了的信号;分离装 置(33),用于把在无线接收装置(1、2、8)中接收的信号分离成文本数据和 声音信号;第一解调装置(9),用于接收在分离装置(33)中分离出的声音信 号,并解调该声音信号;第二解调装置(32),用于接收在分离装置(33)中 分离出的文本数据,并解调该文本数据;声音扩展装置(10),用于扩展从第 一解调装置输出的解调了的信号,并输出该扩展了的信号;数字-模拟转换(D/A 转换)装置(11),用于把在声音扩展装置(10)中扩展了的数字声音信号转 换成模拟信号;以及声音输出装置(12、28),用于允许模拟信号的输入,输 出模拟信号,其中第二解调装置(32)把解调了的文本数据传输给控制装置 (14),控制装置(14)接收在第二解调装置(32)中解调了的文本数据,并 以这样的方式来执行控制:文本数据被显示在显示装置(16)并被传输给第二 调制装置(31),来自声音识别装置(15)的文本数据被发送给第二调制装置 (31)。\n图10示出了根据本发明的终端装置的第四优选实施例。该终端装置包括: 声音压缩装置(5),用于压缩声音信号并输出该压缩了的信号,这些声音信号 从声音输入装置(7、28)接收并在模拟—数字转换(A/D转换)装置(6)中 被转换为数字信号;声音识别装置(15),用于执行转换为数字信号的声音信 号的声音识别,把数字信号转换成为文本数据,并输出该文本数据;第一多路 复用装置(24),用于执行文本数据和图象信息的输入,该图象信息从图象输 入装置(21)接收和在模拟—数字转换(A/D转换)装置(20)中被转换为数 字信号,多路复用文本数据和图象信息,并输出多路复用了的信号;图象压缩 装置(19),用于接收从第一多路复用装置(24)输出的多路复用了的信号, 压缩该多路复用了的信号,并输出该压缩了的信号;第二多路复用装置(18), 用于允许图象压缩装置的输出和声音压缩装置输出的输入,多路复用这些输 出,并输出该多路复用了的信号;调制装置(4),用于调制从第二多路复用装 置(18)输出的多路复用了的信号;无线传输装置(3、2、1),用于接收从调 制装置(4)输出的调制了的信号,并无线传输该调制了的信号;解调装置(9), 用于解调在无线接收装置(1、2、8)中接收的信号;分离装置(22),用于允 许在解调装置(9)中解调了的信号的输入,把该输入信号分离成图象信号和 声音信号,并输出分离出的信号;图象扩展装置(23),用于接收在分离装置 (22)中分离出的该图象信号,扩展的该图象信号,并输出扩展了的图象信号; 声音扩展装置(10),用于接收在分离装置(22)分离出的声音信号,扩展该 声音信号,并输出扩展了的声音信号;数字—模拟转换(D/A转换)装置(25), 用于把在图象扩展装置(23)中扩展了的数字图象信号转换成模拟图象信号; 显示装置(16),用于允许模拟图象信号的输入,并显示该模拟图象信号;数 字—模拟转换(D/A转换)装置(11),用于把在声音扩展装置中扩展了的数 字声音信号转换成模拟声音信号;声音输出装置(12),用于允许模拟声音信 号的输入,并输出该模拟声音信号;以及控制装置(14),用于以这样的方式 来执行控制:当设置的状态是声音识别方式时,被输入到用于声音识别的声音 识别装置(15)的文本数据被输入并传输到第一多路复用装置(24)。控制装 置(14)进一步把文本数据输出给显示装置(16)。\n图13示出了本发明的第五优选实施例中的交换中心(36)。交换中心(36) 构成通信网络上的一个节点,包括装置(42、43、38、39),用于在话音通信 连接期间内允许声音信号的输入,执行声音识别,多路复用作为声音识别结果 的文本数据与声音信号,把该多路复用了的信号传输给声音信号接收者的终端 和声音信号发送者的终端。换句话说,可以采用一种结构,其中交换控制以这 样的方式来执行:在终端一侧执行声音识别,并且根据电池的剩余电量或终端 负载的情况,或依据终端的请求,在通信网络上执行声音识别。\n下面说明根据本发明的通信控制方法的优选实施例。在一个优选实施例 中,通信控制方法包括下列步骤。\n步骤1:用于通信的互相连接的多个终端中的一个(第一终端),接收通过 解调和扩展从第二方终端传输的通信的另一方(第二方)的声音而得到的数字 声音信号,执行声音识别,并把声音信号转换成文本数据。\n步骤2:在一个终端中,文本数据被显示在显示单元上。\n以下的步骤3可以另外提供。\n步骤3:第一终端把文本数据传输给第二方终端,因此,第二方说话的声 音识别结果被返回给第二方,第二方可以确认在终端上的说话内容。\n根据本发明的通信控制方法的另一个优选实施例包括以下步骤。\n步骤1:用户通过用户的终端(第一终端)输入的声音受到声音识别,并 被转换为文本数据。\n步骤2:作为声音识别结果的文本数据被发送给连接到该用户的终端上的 第二方终端。\n在本发明的通信控制方法的这个优选实施例中,作为声音识别结果的文本 数据被显示在该用户的终端的显示单元上。另一方面,在第二方的终端上,从 该用户的终端发送的文本数据显示在显示单元上。进而,作为声音识别结果的 文本数据与要发送给第二方终端的声音信号或图象信号多路复用,接着传输给 第二方终端。\n结合附图来更详细的说明本发明的优选实施例。在该优选实施例中,作为 举例,把便携式电话机用作终端装置。图1示出了本发明第一优选实施例的结 构。\n现在参考图1,作为本发明的第一优选实施例的便携式电话机包括:天线 1,用于发送和接收;天线转换器2,用于发送信号和接收信号的转换;话筒7, 用于输入要发送的声音信号;A/D转换器6,用于把来自话筒7的模拟声音信 号转换成数字声音信号;声音压缩电路5,用于从压缩A/D转换器6输出的数 字声音信号;调制电路4,用于使从声音压缩电路5输出的发送信号受到QPSK (四相相移键控)调制;发射机3,用于把从调制电路4输出的发送信号转换 到发送频率。本发明的第一优选实施例中的便携式电话机进一步包括:接收电 路8,用于执行接收的无线波的放大和频率调谐检测;解调电路9,用于使来 自接收电路8的信号受到QPSK解调;声音扩展电路10,用于扩展从解调电 路9输出的压缩了的声音信号;D/A转换器11,用于把从声音扩展电路10输 出的数字接收信号转换成模拟声音信号;扬声器12,用于接收从D/A转换器11 输出的模拟声音信号,并输出声音信号;声音识别电路15,用于允许来自声音 扩展电路10的扩展了的信号(来自另一方的数字接收的声音信号)的输入, 执行声音识别,并把扩展了的信号转换成文本数据;显示单元16,用于显示从 控制单元14发送的字符或图象,例如LCD(液晶显示器);控制单元14,用 于执行整个控制;带有一个键、一个按钮等的操作部分13;声音识别启动按钮 17,用于启动声音识别;以及耳机话筒28,用于环境噪声较大时,用户戴上它 来谈话。在以下的优选实施例中,声音识别电路15包括传统的声音识别器, 该识别器提取声音特征值、把该声音特征值与代码表匹配起来、并具有能够应 付特定讲话者或非特定讲话者的结构。\n图2示出了根据本发明的第一优选实施例的便携式电话机的外形的正视 图。在图2中,便携式电话机例如是,在有噪声的环境中讲话的讲话者的便携 式电话终端26。图2中参考字符对应于图1中的那些,数字1指示一个用于发 送和接收的天线,数字7指话筒,数字12指扬声器,数字13指操作部分,数 字16指显示单元,数字17指声音识别启动按钮,和数字28指耳机。在该终 端中,另一方的声音信号通过声音识别装置转换为文本数据,该文本数据将显 示在显示单元16如数字27指示的“SEE YOUAT THREE.”\n下面说明根据本发明的第一优选实施例的便携式电话机的操作。最初,下 面说明根据本发明的第一优选实施例的便携式电话机的发送操作。假定通过基 站和基站控制站在便携式电话机与移动交换中心之间建立起说话信道,而且在 到连接目的地的通信连接中,还要通过更多个基站及基站控制站。在图1中, 通过A/D转换器6,把来自话筒7和耳机话筒28的模拟声音信号转换成数字 声音信号,在声音压缩电路5中受到频带压缩,在调制电路4中受到QPSK调 制,在发送电路3中转换和放大为发送频率,通过天线开关2,通过天线部分 1无线发送。\n下面说明根据本发明的第一优选实施例的便携式电话机的接收操作。在天 线1中接收的通信无线波通过天线开关2,并被输入到接收电路8,在那里, 使接收的无线波受到放大和频率调谐,取自接收电路8的调制信号被发送到解 调电路9。\n在解调电路9中受到QPSK解调的数字声音信号,在扩展电路10中被扩 展,在D/A转换器11中被转换成模拟声音信号,并从扬声器12输出。\n图5示出了在使用根据本发明的第一优选实施例的便携式电话机执行声音 识别的情况下,从开始谈话起的操作的流程图。根据本发明的第一优选实施例 的便携式电话机中用于声音识别的处理,将结合图1和5进行说明。依据谈话 的开始,讲话者作出关于是否周围环境很嘈杂的判断(步骤S1)。当周围环境 不嘈杂,另一方的声音能够很清楚地听到,在这种情况下,讲话者继续谈话(步 骤S3)。\n另一方面,当判断的结果是周围环境很嘈杂,讲话者戴上耳机话筒28(步 骤S2)。在这种情况下,当讲话者能够很清楚的听到另一方的声音时,谈话继 续(步骤S6)。\n另一方面,当甚至在戴上耳机话筒28的情况下,讲话者都不能清楚地听 到另一方的声音时,讲话者按下声音识别启动按钮17(步骤S5)。在这种情况 下,声音识别部分15启动另一方的声音的识别,并把识别的结果作为文本显 示27,在便携式电话机的显示单元16的屏幕上显示(步骤S7)。\n这时,在接收电路8中接收另一方的说话数据,并在解调电路9中受到QPSK 解调,解调了的数据接着在扩展电路10中受到带宽扩展,扩展了的数字声音 数据被输入到执行声音识别处理的声音识别部分15。通过控制单元14,作为 图2中用数字27指示的文本数据在显示单元16的屏幕上显示声音识别的结果。\n替代人工操作,其中依据声音识别启动按钮17的按下,在声音识别部分15 中启动声音识别,可以采用一种结构,其中以这样的方式来执行自动控制,在 便携式电话机的内部监视周围环境的噪声电平等,并与预定的阈值比较,当噪 声电平超过该阈值时,在声音识别部分15中执行声音识别,并执行文本数据 的显示。换句话说,可以采用一种结构,其中检测耳机话筒的佩戴,在声音识 别部分15中执行声音识别,并执行文本数据的显示。\n可以用横向滚动的方式在显示单元16的一行上显示文本,或者换一种方 式,可以用垂直滚动的方式在显示器屏幕的预定窗口上的多行上显示。\n进而,例如可以提供一种功能,其中把作为声音识别结果的文本数据存储 在存储器中(未示出),后来通过e-mail(电子邮件)发送。\n接下来,说明根据本发明的第二优选实施例的便携式电话机。在本发明的 第二优选实施例中,实现了使用声音识别的、在嘈杂的环境下有用的便携式TV 电话。图3示出了根据本发明的第二优选实施例的便携式电话机结构,和图4 示出了该便携式电话机的外形的正视图。\n现在参考图3,作为本发明的第二优选实施例的便携式TV电话包括:天 线1,用于发送和接收;天线开关2,用于发送信号和接收信号的转换;照相 机21,用于拍摄要发送的图像;A/D转换器20,用于把从照相机21发送的模 拟图象信号转换成数字信号;多路复用电路24,用于把作为声音识别结果产生 的文本数据叠加到图像信号上(例如,用于在预定的时间(在屏幕上的位置和 大小)把文本数据叠加到视频信号上);图象压缩单元19,用于压缩从A/D转 换器20输出的数字图象信号;话筒7,用于输入要发送的声音信号;A/D转换 器6,用于把来自话筒7和耳机话筒28的模拟声音信号转换成数字声音信号; 声音压缩电路5,用于压缩从A/D转换器6输出的数字声音信号;多路复用电 路18,用于多路复用来自图象压缩电路19的图象信号与来自声音压缩电路5 的声音信号;调制电路4,用使从于多路复用电路18输出的发送信号受到QPSK 调制;以及发送电路3,用于把从调制电路4输出的发送信号转换成发送频率。\n本发明的第二优选实施例的便携式TV电话机还包括:接收电路8,用于 执行接收到的无线波的放大和频率调谐检测;解调电路9,用于使来自接收电 路8的信号受到QPSK解调;分离电路22,用于允许在解调电路9中解调了 的信号的输入,并把信号分离成声音信号和图象信号;声音扩展电路10,用于 扩展在分离电路22中分离出的压缩了的声音信号;D/A转换器11,用于把从 声音扩展电路10输出的数字的接收到的声音信号转换成模拟声音信号;扬声 器12,用于输出该声音信号;图象扩展电路23,用于扩展在分离电路22中分 离出的压缩了的图象信号;D/A转换器25,用于把从图象扩展电路23输出的 数字的接收到的图象信号转换成模拟图象信号;显示单元16,用于显示接收到 的图象或从控制单元14发送的字符和图象;控制单元14,用于控制整个便携 式TV电话机;一个用于便携式电话机的操作电路13;声音识别电路15,用 于执行来自另一方的数字声音信号的声音识别来把数字声音信号转换成文本数 据;声音识别启动按钮17,用于启动声音识别。\n图4示出了根据本发明的第二优选实施例,在嘈杂的环境下(见图4B)的 讲话者的便携式TV电话机26A和另一方的便携式TV电话机26B(见图4A)。 在便携式TV电话机26A中,另一方的声音信号通过声音识别转换成文本数据, 该文本数据显示在显示单元16上,如数字27所指示的,同时,将其发送给另 一方的便携式TV电话机26B,在这里该文本数据在另一方的便携式TV电话 机26B中也显示在的显示单元16上,如数字29所指示的。\n结合附图3,说明根据本发明的第二优选实施例便携式TV电话机的操作。 本发明的第二优选实施例中的便携式TV电话机发送的操作,如下所述来执行。 来自话筒7或耳机话筒28的模拟声音信号通过A/D转换器6被转换成将在声 音压缩电路5中受到频带压缩的数字信号。视频照相机21拍摄的模拟图象的 信号通过A/D转换器20转换成将在图象压缩电路19中受到频带压缩的数字信 号。在多路复用电路18中多路复用频带压缩了的图象信号与压缩了的声音信 号,接下来通过与以上结合其中只使用了声音通信的上述优选实施例描述的相 同的路径发送。\n下面说明本发明的第二优选实施例中的便携式TV电话机接收的操作。接 收到的声音信号通过接收电路8,解调电路9,和分离电路22,并在分离电路 22中被分离成声音信号和图象信号。在分离电路22中分离出的声音信号在声 音扩展电路10中扩展,在D/A转换器11中转换成从扬声器12输出的模拟声 音信号。\n在发送时已被压缩并在分离电路22中已与声音信号分离的图象信号,在 图象扩展电路23中扩展。\n在图象扩展电路23中扩展了的数字图象信号,在D/A转换器25中被转换 成模拟图象信号,该模拟图象信号显示在显示单元16上。\n图6是表示本发明的第二优选实施例中的便携TV电话机从通信开始算起 的操作流程图。本发明的第二优选实施例的操作将结合图3、4和6来说明。 通信开始后,讲话者作出周围环境是否有噪声的判断(图6中的步骤S1)。当 判断结果是周围环境没有噪声并且对方的声音能被清楚地听到时,谈话就在这 个状态被继续(步骤S3)。另一方面,当判断结果是周围环境有噪声时,讲话 者就戴上耳机话筒28(步骤S2)。当戴上耳机话筒28能使对方的声音被清楚 听到,通话就在这个状态被继续(步骤S6)。\n即使在讲话者戴上耳机话筒28后仍不能清楚地听到对方的声音时(在步 骤S4中转到NO),则按下声音识别起动按钮17(步骤S5)。这就导致了对方 声音识别的开始,声音识别的结果作为文本显示27被显示在便携电话机26的 显示单元16上(步骤S7)。\n在接收电路8中接收另一方的通信数据,然后在解调电路9中受到QPSK 解调。解调了的信号接着在扩展电路10中受到带宽扩展,扩展了的数字声音 数据在声音识别部分15中受到声音识别处理。结果如图4B中数字27标出的 文本那样通过控制单元14显示在显示单元16上。\n在模式被设置为TV电话模式(在步骤S8中转到YES)以及文本被叠加 在传输图像上(在步骤S9中转到YES)的情形下,图像通过控制单元14被视 频相机21拍照。图像信号被A/D转换器20转换成数字信号,声音识别了的声 音文本信号在文本多路复用电路24被叠加在数字化的图像信号上。\n被文本信号叠加在其上的图像信号,被发送给另一方的便携电话机并如图 4A中数字29表示的那样被显示(步骤S10)。当模式没有被设置为TV电话模 式(在步骤S8中转到NO)或者当模式被设置为TV电话模式但是文本信号没 有被叠加在传输图像上时(在步骤S9中转到NO),不执行文本信号在图像信 号上的叠加以及把叠加了的信号发送给另一方的便携式电话机(步骤S11)。\n在上面的优选实施例中,理所当然的是可以这样来执行控制:刚再次按下 声音识别起动按钮17,声音识别功能就停止了。\n说明本发明的第一和第二优选实施例的功能和效果。\n在本发明的第一和第二优选实施例中,提供了声音识别装置,它把通过数 字移动通信网发送的另一方的声音信号转换成文本数据。另一方的声音作为压 缩了的和编码了的数字数据被发送。因此,不需要执行模拟到数字数据的转换, 同时这样来压缩和编码了的数字数据可以受到声音识别并可将其转换成文本数 据。\n通过声音识别装置从声音信号转换成文本数据的文本数据通过显示装置显 示出来,这允许把显示出的数据作为辅助数据来使用、用于理解另一方说话的 内容。即使是在有噪声的环境中,也能够实现谈话。\n提供了一种操作键,在谈话期间内依据操作键的控制,通过声音识别开始 把另一方的说话转换成文本数据。依靠这一点,在有噪声的环境中在谈话期间 内,当不能清楚地理解另一方的说话内容时,通过键控可以容易地启动声音识 别。\n在上面的优选实施例中,当另一方的声音通过声音识别转换成将在显示单 元上显示的文本数据时,在噪声环境中的谈话中很难理解的声音部分,可以作 为声音识别了的文本的显示来观看。这能便于理解另一方说话的内容。这样的 文本显示功能也可以改进听力丧失或听力困难的残疾人使用的便携电话机的便 利性。\n在优选实施例中,结构就是,另一方的谈话通过声音识别转换成文本数据, 然后也将其发送给另一方并能显示在另一方的终端显示单元上。在有噪声的环 境中的讲话者,可以执行显示在讲话者的便携电话机上的另一方的说话的声音 识别,可以在转换后把文本数据发送给另一方的电话,并且能在另一方的显示 单元上显示文本数据,而另一方一侧能通过经转换得到的文本内容确认她或他 自己说话内容。\n例如,在使用便携TV电话机的电话会议中,可以把文本数据作为另一方 的声音识别的结果存储在存储器(未示出)中,而且,其后,被存储的数据可 以用作为会议的官方记录的一部分。这一文本数据可以通过e-mail分发。\n把作为发送给另一通信方的声音识别的结果的文本数据与声音信息、图像 信息等多路复用,把多路复用了的信号通过信息信道(TCH)传送。在作为声 音识别结果的文本数据的情况下,例如,一个日文本符(例如,JIS)的数据容 量(字节数)是小到2个字节,一个字母数字字符的数据容量是小到1个字节。 也就是,数据容量太小以至于通过信息信道要照原样来传送信息就不可能压缩 了。可以把通过声音识别产生的文本数据加到在基站与便携电话机之间的无线 信道中的控制信道(CCH)等上并通过CCH而发送出去。\n接下来,说明本发明的第三个优选实施例。在第一和第二优选实施例中, 在有噪声的环境中在便携电话机一侧执行接收到的声音的声音识别。另一方 面,识别在发送者一侧通过讲话者的终端输入的声音,而且把作为声音识别结 果而产生的文本数据通过控制信道、或者在与声音信号多路复用后发送给在有 噪声环境中的便携电话机并加以显示。\n图7是表示本发明的第三优选实施例的结构图。现在参考图7,构成本发 明的第三优选实施例的便携电话机包括:用于发送和接收的天线1;用于在发 送信号和接收信号之间转换的天线开关2;用于允许要发送的声音信号输入的 话筒7;用于把来自话筒7的模拟声音信号转换成数据声音信号的A/D转换装 置6;用于压缩从A/D转换器6输出的数字声音信号的压缩电路5;用于使从 声音压缩电路5输出的发送信号受到例如,QPSK调制的调制电路4;用于接 收从控制单元14输出的文本数据并调制所接收到的文本数据的调制电路31; 用于允许来自调制电路4的信号和从调制电路31输出的文本调制了的信号的 输入以及多路复用和输出这些数据的多路复用电路30;以及用于把从多路复用 电路30输出的发送信号转换成发送频率的发射机3。\n第三优选实施例中的便携电话机进一步包括:用于执行接收到的无线波的 放大和频率调谐检测的接收电路8;用于把来自接收电路8的信号分离成声音 调制了的信号和文本调制了的信号的分离电路33;用于使在分离电路33中分 离出的声音调制了的信号受到QPSK解调的解调电路9;用于解调在分离电路 33中分离出的文本调制了的信号的解调电路32;用于扩展从解调电路9输出 的压缩了的声音信号的扩展电路10;用于把从声音扩展电路10输出的被接收 的数字声音信号转换成模拟声音信号的D/A转换器11;用于接收从D/A转换 器11输出的模拟信号并输出声音信号的扬声器12;用于允许从A/D转换器6 输出的数字声音信号的输入并执行声音识别以便把数字声音信号转换成文本数 据的声音识别电路15;显示单元16,如LCD(液晶显示器),用于显示来自控 制单元14的字符或图像;有键、按钮等的操作部分13;用于开始声音识别的 声音识别起动按钮17;让用户戴上以和另一方谈话的耳机话筒28;以及用于 控制整个电话机的控制单元14。控制单元14接收声音识别起动按钮17的输 入和操作部分13的输入。控制单元14进而接收在解调单元32中解调了的文 本数据并以在显示单元16上显示文本数据的方式来执行控制。控制单元14进 而接收已在声音识别电路15中受到声音识别的文本数据,并将该数据发送给 显示单元16。控制单元14进而把已经在声音识别电路15受到声音识别的文本 数据发送给调制电路31。\n图8是表示在本发明的第三优选实施例中的便携电话机的外观的图。在图 8中,参考字符26C指出发送一侧的便携电话机,在那里通过话筒7引入的声 音受到声音识别并被发送,参考字符26D,一个处于噪声环境下的便携电话机 通过耳机话筒28处于谈话中,并在显示单元16上显示来自便携电话机26C的 声音识别了的文本数据。在图8和5中所示的便携电话机中,类似的部分使用 相同的参考数据标识。图9是详细说明本发明的第三优选实施例的操作的流程 图。\n现在参考图7~9,当环境有噪声而且在戴上耳机话筒28这样的状态下还不 能清楚地听到另一方的声音(图9中步骤S4是NO)时,讲话者使另一方按下 另一方的便携电话机的声音识别起动按钮17(步骤S12)。\n依据在另一方的终端一侧按下声音识别起动按钮17,从话筒7引入的模拟 声音信号在A/D转换器6中转换成数字信号,然后在声音识别部分15中受到 声音识别。作为声音识别的结果而产生的文本数据通过控制单元14,并如图8A 中示出的,在终端26C中,如显示单元16上的数字29标出的那样被显示(步 骤S13)。\n文本数据在调制电路31中被调制并在多路复用电路30中和调制了的声音 信号被多路复用。把多路复用了的信号转换到发射频率并在发射电路3中放大, 通过天线开关2,通过天线部分1发送出去。\n在有噪声环境下的终端中,天线1接收到的通信无线波通过天线开关2被 输入到接收电路8,在那里接收到的无线波受到放大和频率调谐。调制了的信 号从接收电路8中取出,然后在分离电路33中分离成声音调制了的信号和文 本调制了的信号,在解调电路32中把分离出的文本调制了的信号解调为文本 数据,同时如图8B中所示,在终端26D中,解调了的文本数据通过控制单元 14并如数字27标出的那样显示在显示单元16上。\n接下来,说明本发明的第四优选实施例。在第四优选实施例中,第三优选 实施例的功能将被应用于便携TV电话。图10是表示本发明的第四优选实施 例中的便携电话机的结构图,图11是图10中所示的便携电话机的外观的一个\n实施例的前视图。\n现在参考图10,构成本发明的第四优选实施例的便携电视电话机包括:用 于发射和接收的天线1;用于在发射信号和接收信号之间转换的天线开关2; 用于拍摄将发送的图像的视频相机21;用于把来自视频相机21的模拟图像信 号转换成数字信号的A/D转换器20;用于允许要发送的声音信号的输入的话 筒7;用于把来自话筒7或耳机话筒28的模拟声音信号转换成数字信号的A/D 转换器6;用于压缩从A/D转换器6输出的数字声音信号的声音压缩电路5; 用于使从A/D转换器6输出的数字声音信号受到声音识别以便把数字声音信号 转换成文本数据并用于把该文本数据发送给控制单元14的声音识别电路15; 用于把从控制单元14发送的作为声音识别的结果的文本数据叠加到从A/D转 换器20输出的数字图像信号上的文本多路复用电路24;用于压缩从文本多路 复用电路24输出的数字图像信号的图像压缩电路19;用于多路复用来自图像 压缩电路19的图像信号和来自声音压缩电路5的声音信号的多路复用电路18; 用于使从多路复用电路18输出的发射信号受到QPSK调制的调制电路4;用 于把从调制电路4输出的发射信号转换到发送频率的发送电路3。\n第四优选实施例中的便携电话机进而包括:用于对接收到的无线波执行放 大和频率调谐检测的接收电路8;用于使来自接收电路8的信号受到QPSK解 调的解调电路9;用于允许在解调电路9中解调了的信号的输入和用于把输入 信号分离成声音信号和图像信号的分离电路22;用于扩展在分离电路22中分 离出的压缩了的声音信号的声音扩展电路10;用于把从声音扩展电路10输出 的接收到的数字化声音信号转换成模拟声音信号的D/A转换器11;用于输出 声音信号的扬声器12;用于扩展在分离电路22中分离出的压缩了的图像信号 的图像扩展电路23;用于把从图像扩展电路23输出的数字化的接收到的图像 信号转换成模拟图像信号的D/A转换器25;用于显示接收到的图像和来自控 制单元14的字符和图像的显示单元16;用于控制整个电话机的控制单元14; 便携电话的操作电路13;以及用于开始声音识别的声音识别起动按钮17。\n图12是详细说明本发明的第四优选实施例的操作的流程图。结合图10~12 来说明本发明的第四优选实施例的操作。当在有噪声的周围环境下不能清楚地 听到另一方的声音(在图12中步骤S4是NO),同时,模式为TV电话模式(在 步骤S14中,为YES)时,讲话者使另一方按下声音识别起动键17(步骤S15)。\n在另一方的终端中,在声音识别电路15中,使在A/D转换器6中把来自 话筒7的模拟声音信号转换成数字声音信号而到的数字声音信号受到声音识 别。\n在图11A中示出的电话机26E中,作为声音识别结果输出的文本数据通过 控制单元14并如数字29表示的那样显示在显示单元16上(步骤S16)。作为 声音识别结果输出的文本数据从控制单元14输入到文本叠加电路24,在那里 文本数据被叠加在图像信号上,该图像信号是通过在A/D转换器20中把视频 相机21拍摄的图像转换为数字信号而产生的。其后,文本信号已叠加在其上 的图像信号,在图像压缩电路19中受到频带压缩。然后,压缩了的信号在多 路复用电路18中与声音信号多路复用,把多路复用了的信号发送到另一方的 终端。\n接下来,说明终端的操作,该终端接收在把文本数据、图像信号和声音信 号互相多路复用起来的状态下正在被发送的信号。该多路复用了的信号通过接 收电路8、解调电路9及把信号分离成数字图像信号和声音信号的分离电路22。 在发送时已经压缩了的图像信号,在图像扩展电路23中被扩展。扩展了的图 像信号在D/A转换器25中被转换成模拟图像信号并被显示在显示单元16上。 已经被多路复用在图像信号上的文本数据,被如数字27指出的那样显示在图 11B中示出电话机26F中的显示单元16上(图12中的步骤S17)。\n在这个优选实施例中,结构就是,作为在讲话者一侧的声音识别的结果的 文本数据被发送给另一方的终端一侧。依靠这种结构,在没有受到发送系统等 中噪声影响的情况下文本数据能够被显示在另一方的终端上。\n接下来,说明本发明的第五优选实施例。在上面的优选实施例中,在通信 终端一侧上进行声音识别。然而,理所当然的是,声音信号可以在终端之间的 通信网络中受到声音识别。当声音识别的开始通过来自通信终端的一个指令来 执行时,电信公司可以在通信网络中的所有时间上执行声音识别。换一种方式, 可以把处理分配到通信终端与通信网络一侧来执行。\n图13示出本发明的第五优选实施例,它具有一种结构,使声音识别在交换 中心36来执行。从连接到基站35这一侧开始,交换中心36包括:交换中心 接口37;交换台40;以及和交换中心接口41。在从交换台40通到交换中心接 口37的路径和从交换中心接口37通到交换台40的路径中,分别提供了多路 复用电路38、39,用于多路复用通过在文本转换电路43中转换在声音识别电 路42中声音识别的结果而得到的文本数据与声音信号。\n来自和处于有噪声环境下的终端26通信的终端26’的声音数据,在交换台 40中被交换,然后在声音识别电路42中受到声音识别,在文本转换电路43中 转换成文本数据,在多路复用电路38中与从交换台40输出的声音信号多路复 用。\n和文本数据多路复用了的声音信号通过交换中心接口37并被发送给处于噪 声环境下的终端26,以与如在第一优选实施例中描述的同样的方式,文本数据 被显示在终端26中的显示单元上。\n在交换中心36中,来自文本转换电路43的文本数据被叠加在来自处于噪 声环境中的终端26的声音信号上,文本数据也被显示在终端26’的显示单元上。 依靠这样,在终端26’一侧的讲话者也可以确认声音识别的结果。在这种连接 中,可采用一种结构,其中处于噪声环境中的终端26是第一优选实施例的便 携电话机,在交换中心36一侧,根据终端26的负载情况,或者根据来自终端 26的请求,声音识别在声音识别电路42中被执行,接着在文本转换电路43中 转换成文本数据。\n目前的PDC移动分组通信系统(第二代)和下一代移动通信IMT-2000能 提供一种易于接入因特网的性能。因而,在本发明中,在执行声音识别的通信 网上的节点,不局限于上面的交换中心,可以采用一种结构,其中声音识别可 以在如分组后发送声音信号等的网关或路由器中执行,声音识别的结果被插入 分组,接着为另一方的终端和分组发送选择路径。例如,在3GPP(第三代合 作方案)的核心网络系统中,如图14中所示,已知,一种线路交换功能(MSC (移动业务交换中心)/GMSC(网关MSC))和一种分组交换功能(PDSN(分 组数据服务节点)/PDGN(分组数据网关节点))一起形成一个单独的节点, 它能够实现来自声音通信的各种介质的综合的交换/发送。用户IP(因特网协 议)分组受到通过基于节点ATM(异步传送模式)地址的ATM-SVC(交换虚 拟连接)的隧道效应以提供QoS(业务质量)。也可以采用一种结构,其中声 音识别在这一核心网络中执行,并且作为声音识别的结果的文本数据被加在声 音数据上,该声音数据受到通过线路交换或分组交换的交换/发送,然后发送给 目的终端。对于图14示出的核心网络,可参考Maruzen Co.,Ltd.于2001年6月 25日出版的Keiji Tachikawa(管理者)的“W-CDMA Ido Tsushin Hoshiki(W- CDMA移动通信系统),”,第239页图4.2,或者电信协会(TTA)于2001年 5月10日出版的Kota Kinoshita,“Yasashii IMT-2000 Daisan Sedai Tdo Tsushin Hoshiki的“容易理解的IMT-2000第三代移动通信系统”,第81页图5.2。\n在上面的优选实施例中,依靠这样的结构,其中,在通信网络一侧把作为 声音识别结果的文本数据发送给另一方的终端。可减小执行声音识别处理的 DSP(数字信号处理器)的处理负载,可防止电池驱动终端的消耗电流的增大。\n上面的优选实施例把便携电话机的结构作为例子来说明,以至于显示单元 和声音通信部分被作为整体。换一种方式,可以采用一种结构,其中声音通信 部分可从用于显示图像的显示单元拆离,声音通信部分可与显示单元中分离开 来并可单独使用。一种便携电话机,其中声音通信部分已经被分离并独立于图 像显示/照相部分来提供,例如可参考日本专利公开No.50223/2000,其发明人 与本发明人相同。图像显示/照相部分可以通过红外线、蓝牙等与声音通信部分 无线通信。在一种声音通信部分与显示单元分离并可单独提供使用的结构中, 用户能看显示在显示单元上的文本而不戴耳机话筒。\n便携电话机当然也可以是PHS(个人手提电话系统)终端,PDA(个人数 字助理)等。换一种方式,便携电话机可以是如有VoIP(声音IP)的个人计 算机。\n如上面描述的,本发明有以下效果。\n根据本发明,提供用于把另一方的声音信号转换成文本数据的声音识别装 置,可便于对另一方说话内容的理解,并能实现与另一通信方的谈话,比如, 即使在有噪声的环境中。\n根据本发明,提供了便携电话机,有一个操作键,用于根据该键的操作在 呼叫期间内通过声音识别开始把另一方的说话转换成文本数据。依靠这一点, 在有噪声的环境中与另一通信方的谈话期间内,当不能清楚地理解另一方说话 的内容时,声音识别可以通过按键方便容易地开始。\n进而,根据本发明,把另一方的说话通过被声音识别转换成文本数据,它 也能被传送给另一通信方并显示在另一方终端的显示单元上。依靠这一点,另 一通信方一侧也能通过由该转换得到的文本数据理解他或她自己说话的内容。 这样可以提高便利性。\n根据本发明,在讲话者一侧上作为声音识别结果的文本数据被发送给另一 方的终端。因而,即使在没有受到噪声影响等的发射系统中,数据也能显示在 另一方的终端上。\n根据本发明,在通信网络一侧上作为声音识别结果的文本数据被发送给另 一通信方的终端。依靠这一结构,可减小终端的处理负载并且,可防止或减小 电池驱动终端的消耗电流的增大。\n本发明已经特别参考优选实施例详细描述了,但是可以理解,在附属的权 利要求中所述的本发明的范围内可以实施各种变化和修改。
法律信息
- 2022-11-15
专利权有效期届满
IPC(主分类): H04Q 7/32
专利号: ZL 02160253.0
申请日: 2002.10.30
授权公告日: 2006.04.19
- 2006-04-19
- 2003-08-20
- 2003-06-04
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |