DE69232166T2 - Fehlerschutz für vielfachmodensprachkodierer - Google Patents
Fehlerschutz für vielfachmodensprachkodiererInfo
- Publication number
- DE69232166T2 DE69232166T2 DE69232166T DE69232166T DE69232166T2 DE 69232166 T2 DE69232166 T2 DE 69232166T2 DE 69232166 T DE69232166 T DE 69232166T DE 69232166 T DE69232166 T DE 69232166T DE 69232166 T2 DE69232166 T2 DE 69232166T2
- Authority
- DE
- Germany
- Prior art keywords
- bits
- speech
- arrangement
- encoder
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000008447 perception Effects 0.000 claims description 3
- 238000003491 array Methods 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 16
- 230000007774 longterm Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/35—Unequal or adaptive error protection, e.g. by providing a different level of protection according to significance of source information or by adapting the coding according to the change of transmission channel characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Communication Control (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
- Diese Erfindung betrifft im Allgemeinen die digitale Datenübertragung und insbesondere Sprachcodierer und bezieht sich insbesondere auf ein Verfahren zum Schaffen eines Fehlerschutzes für spezielle Bits.
- Die Zweiwege-Funkübertragung von Sprachsignalen ist eine wesentliche Errungenschaft der modernen Gesellschaft. Organisationen, die an der Polizeiarbeit, an der öffentlichen Sicherheit und am Transportwesen beteiligt sind, sind neben militärischen Anwendern die Hauptanwender der Sprachkommunikation. Bei dem steigenden Bedarf am verfügbaren Hochfrequenzspektrum ist eine umfassende Forschung durchgeführt worden, um die Effektivität des Spektrums zu maximieren. Ein Weg, um die Effektivität des Spektrums zu erhöhen, besteht darin, die Sprachsignale vor der Übertragung zu komprimieren. Diese Kompression, die in der Technik wohlbekannt ist, vermindert die Bandbreitenanforderung für die Übertragung von Sprachsignalen und ermöglicht die Zuweisung von einer größeren Anzahl von HF- (Hochfrequenz) Übertragungskanälen in einem vorgegebenen Frequenzbereich. Außerdem können in ähnlicher Weise Sprachkompressionsalgorithmen auf die Speichereinrichtung der digitalen Sprache angewendet werden.
- Mit der wachsenden Bedeutung der digitalen Kommunikation wird Kompressionsschemen insbesondere bei digitalen Systemen eine große Aufmerksamkeit gewidmet. Kompressionsschemen, die speziell für digitalisierte Sprache geeignet sind, werden gewöhnlich als Sprachcodierer bezeichnet. US-Patent Nr. 4.933.957 an Bottau u. a. beschreibt ein Verfahren und ein System zur Sprachcodierung bei geringer Bitrate, wobei diese für die gewöhnlich in der Technik bekannten Verfahren und Systeme beispielhaft sind.
- Die Codierung durch lineare Vorhersage oder LPC (linear predictive coding) ist ein Beispiel einer bekannten Technik zur Sprachcodierung, Bei LPC erfolgt ein Versuch, die menschliche Sprache nachzubilden, indem geeignete Modelle sowohl für das menschliche Klangbild als auch für Anregungen, die sich auf das Klangbild beziehen, abgeleitet werden. Da Sprache ein Signaltyp ist, der sich ständig wiederholt, kann der Umfang der Informationen, die es einem Decodierer ermöglichen, eine Sprachsignalform genau zu reproduzieren, sehr reduziert werden. In Abhängigkeit von der Natur der Sprache, die übertragen wird, können einige Bits für die Erkennung der rekonstruierten Sprache wesentlicher sein als andere.
- Wie bei jedem Typ eines digitalen Signals müssen am Decodierer Entscheidungen getroffen werden, ob ursprünglich ein logischer "1"-Pegel oder ein logischer "0"-Pegel übertragen wurde. Codierung mit Fehlersteuerung; die ein in der Technik wohlbekanntes Konzept darstellt, wird oft verwendet, um die Wahrscheinlichkeit zu erhöhen, dass der Decodierer richtige Entscheidungen trifft. Es verbietet sich natürlich von selbst, digitale Sprache für die Übertragung zu komprimieren, nur um eine große Anzahl von Fehlersteuerbits anzuhängen. Es muss ein Kompromiss erreicht werden, um die Effektivität eines vorgegebenen Algorithmus der Sprachkompression zu maximieren, während versucht wird, die Sprachqualität zu gewährleisten, indem der fehlerfreie Empfang kritischer Bits garantiert wird. Natürlich können für eine Vielzahl von Szenarios der Datenübertragung, die keine Anwendungen der Sprachcodierung enthalten, kritische Bits identifiziert werden.
- Es erwächst demzufolge eine Notwendigkeit an einem Verfahren zum Fehlerschutz für kritische Bits bei der Übertragung, wobei die speziellen Bits, die einen Schutz benötigen, von einer Untermenge von Eingabebits abhängen können, wie etwa beispielsweise die Menge der Bits, die den Typ der Sprachsignalform, die codiert wird, identifiziert. Die speziellen Bits, die einen Schutz benötigen, könnten außerdem durch die erwarteten Bedingungen des Kommunikationskanals bestimmt werden.
- Die britische Patentanmeldung GB-A-2 238 933 des Standes der Technik offenbart ein Verfahren und eine Vorrichtung für den Fehlerschutz von Mehrfachimpuls-Sprachcodierern.
- Gemäß GB-A-2 238 933 sollen Informationsbits des Sprachcodierers übertragen werden. Diese Bits werden vor der Übertragung in einer solchen Weise verarbeitet, dass der Schutz lediglich auf die Bits im übertragenen Rahmen angewendet wird, die für die Wahrnehmung wesentlich sind.
- Die Wahl der Bits für den Schutz erfolgt bei GB-A-2 238 933 durch einen zweistufigen Prozess. Dieser zweistufige Prozess erfordert eine erste Stufe der Computersimulation und anschließend eine Handabstimmungsstufe. Die Handabstimmungsstufe basiert auf den Simulationsergebnissen und auf persönlicher Sachkenntnis. Ein Faltungscode wird verwendet, um die ausgewählten Bits zu schützen. Somit verwendet GB-A-2 238 933 die Fehlersteuerungcodierung. Andere Bits werden nicht geschützt.
- Bei GB-A-2 238 933 enthalten die eingegebenen Datenbits Informationsbits des Sprachcodierers, die für verschiedene Sprachmoden unterschiedlich codiert sind. Von diesen Informationsbits des Sprachcodierers sind die für den Fehlerschutz ausgewählten Bits die Bits, die für die Wahrnehmung eine größere Wichtigkeit besitzen. Die Anordnung von GB-A-2 238 933 führt jedoch keine selektive Auswahl dieser Bits in Abhängigkeit vom Sprachmodus aus: die Auswahl, welche Bits zu schützen sind, ist für unterschiedliche Sprachmoden die gleiche.
- GB-A-2 238 933 ist so beschaffen, dass die codegeschützten Bits mit den ungeschützten Bits kombiniert werden, um einen Bitstrom zu bilden, siehe Fig. 3 von GB-A-2 238 933. Der Bitstrom wird zu einem Decodierer übertragen.
- Die kanadische Patentanmeldung CA-A-2 016 462 des Standes der Technik offenbart ein Verfahren und eine Vorrichtung für die Sprachcodierung.
- Bei CA-A-2 016 462 wird eine Hybrid-Architektur mit geschaltetem Mehrfachimpulscodierer geschaffen, bei der während stimmloser Sprache ein Modell der stochastischen Anregung verwendet wird und die außerdem in der Lage ist, stimmhafte Sprache zu modellieren. Die Codiererarchitektur umfasst eine Einrichtung zum Analysieren eines Eingangssprachsignals um zu bestimmen, ob das Signal stimmhaft oder stimmlos ist, eine Einrichtung zum Erzeugen der Mehrfachimpulsanregung zum Codieren des Eingangssignals, eine Einrichtung zum Erzeugen einer Anregung mit Zufallscodebuch zum Codieren des Eingangssignals und eine Einrichtung, die auf die Einrichtung zum Analysieren eines Eingangssignals reagiert, um entweder die Mehrfachimpulsanregung oder die Anregung mit Zufallscodebuch auszuwählen. CA-A-2 016 462 schafft ein analoges Verfahren.
- Diese sowie weitere Erfordernisse werden durch das Verfahren und die Vorrichtung der vorliegenden Erfindung zum Fehlerschutz von Informationsbits erfüllt. Das Verfahren umfasst das Bereitstellen von Eingangsdatenbits, von denen wenigstens einige zu schützen sind, das Sortieren der Eingangsdatenbits basierend auf Informationen, die aus einer Untermenge der Eingangsdatenbits bestimmt werden, und das Anwenden einer Technik der Fehlersteuerungcodierung auf wenigstens einige der sortierten Bits. Die Vorrichtung der vorliegenden Erfindung umfasst eine Einrichtung zum Ausführen dieses Verfahrens.
- Fig. 1 ist eine Darstellung einer typischen Sprachsignalform;
- Fig. 2A ist ein Blockschaltbild eines VSELP-Sprachcodierers;
- Fig. 2B stellt VSELP-Codebücher, die in der vorliegenden Erfindung verwendet werden, genauer dar;
- Fig. 3 ist ein Blockschaltbild eines Codierersystems, das verwendet werden kann, um das Verfahren der vorliegenden Erfindung zu implementieren;
- Fig. 4 ist eine grafische Darstellung der decodierten Bitfehlerrate gegenüber der Bitposition für einen Faltungsdecodierer mit variabler Rate; und
- Fig. 5 zeigt die Verwendung eines Vordecodierers, um den geeigneten Nachdecodierer auszuwählen.
- Fig. 1 erläutert eine typische Sprachsignalform. Die menschliche Sprache kann im Allgemeinen entweder als "stimmhaft" oder als "stimmlos" klassifiziert werden. Bei stimmhafter Sprache bezieht sich eine wahrnehmbare periodische Schwingung auf das Klangbild. Eine stimmhafte Sprache ist gewöhnlich mit der Bildung eines langen Vokalklangs verbunden, wie etwa die langen Klänge "a", "i" und "o" im Wort "radio". Konsonantklänge, die keine wesentliche periodische Schwingung enthalten, werden als stimmlos betrachtet.
- Fig. 1 stellt außerdem den Fakt dar, dass stimmhafte Sprache wahrnehmbare Periodizitäten aufweist. Es gibt Langzeit- Periodizitäten, wie jene, die im Segment 102 deutlich sind, und Kurzzeit-Korrelationen wie die des Segments 101. Vom Standpunkt der Wahrscheinlichkeitsanalyse haben diese Bestrebungen der Charakteristiken der Sprachsignalformen, sich selbst darzustellen, relativ starke Kurzzeit- und Langzelt-Korrelationen zu Folge, die die lineare Vorhersage zu einem durchführbaren Konzept der Sprachcodierung machen. Die Beziehung zwischen diesen Korrelationen und LPC-Techniken werden nachfolgend genauer erläutert.
- Fig. 2A stellt in Form eines Blockschaltbilds einen durch eine Vektorsumme angeregten Sprachcodierer mit linearer Vorhersage (VSELP) dar. Sprachsignale weisen, selbst wenn sie als stimmhaft charakterisiert werden können, stochastische (willkürliche) Eigenschaften sowie periodische Eigenschaften auf. In einem VSELP-System wird die Anregung des Klangbilds durch eine Kombination eines Vektors mit erster Signalform, der aus einer festgelegten Gruppe aus Anregungsvektoren, die ein Codebuch (201) genannt wird, und aus einem zweiten Vektor modelliert, der ausgewählt wird, indem ein Abschnitt einer Signalform basierend auf der Vergangenheit der Sprache, die codiert wird, extrahiert wird. Diese Vergangenheit ist in einem Speicher (202) der Vorrichtung zur Langzeitvorhersage gespeichert.
- Die Informationen der Langzeitvorhersage (202) sind beim Codieren von stimmhafter Sprache besonders nützlich, bei der Langzeitkorrelationen vorherrschend sind. Vom Codebuch abgeleitete Vektoren (201) unterstützen das Codieren von Sprachsignalformen, die entweder stimmhaft oder stimmlos sind. Um Sprachsignalformen an den wechselnden Grad der stimmhaften Charakteristiken anzupassen, werden sowohl die Codebuchvektoren (201) als auch Langzeitvorhersagevektoren (202) skaliert, indem multiplikative Verstärkungsfaktoren (204 bzw. 206) angewendet werden.
- Diese skalierten Faktoren werden summiert (207) und die resultierende Schwingung wird an ein LPC-Filter (208) angelegt. In der bevorzugten Ausführung ist das LPC-Filter ein IIR-Filter (IIR, Infinite Impulse Response, unbegrenztes Ansprechen auf einen Impuls), das in einem DSP (digitaler Signalprozessor) implementiert ist. Das LPC-Filter (208) ist hauptsächlich vorgesehen, um das Klangbild zu modellieren, für das die Schwingung Vorgesehen ist. Die Neuprogrammierung der Koeffizienten des LPC-Filters (208) kann periodisch ausgeführt werden, um den Ausgang des Sprachcodierers zu optimieren. Tatsächlich wird der Ausgang des Sprachcodierers mit digitalisierter Sprache (210) verglichen (209) und der resultierende Fehler wird minimiert (211), indem die Vektorauswahl sowohl vom Codebuch (201) als auch von der Langzeit-Vorhersageeinrichtung (202) geändert wird.
- In der bevorzugten Ausführung arbeitet der Sprachcodierer bei 5,9 Kilobit/Sekunde (kbps) bei einer Rahmenlänge von 20 Millisekunden (ms). Die Länge der Rahmen oder der Pakete nähert sich der Periode der Sprache an, während welcher normalerweise wenigstens einige Parameter relativ konstant bleiben. Beispiele dieser relativ konstanten Parameter enthalten die Koeffizienten des LPC-Filters und den Sprachmodus. In der bevorzugten Ausführung sind die Sprachmoden stimmlos, wenig stimmhaft, mäßig stimmhaft und stark stimmhaft. Der 20 ms-Rahmen wird in vier 5 ms- Unterrahmen unterteilt, um Parametern zu entsprechen, die sich in der Sprachsignalform häufiger ändern. Diese in stärkerem Maße flüchtigen Parameter enthalten die Information des Anregungsvektors und die multiplikativen Verstärkungswerte.
- In der tatsächlichen Praxis enthält ein Rahmen 118 Informationsbits. Wie zuvor erläutert wurde, besitzen jedoch nicht alle Bits die gleiche Wichtigkeit. Der Vektor der Langzeitvorhersage fügt bei der Codierung stimmloser Sprache nur wenig an, ist jedoch sehr wichtig bei der richtigen Rekonstruktion der Sprachsignalform im stark stimmhaften Sprachmodus. Wegen dieser Änderung der Signifikanz ermöglicht die vorliegende Erfindung, dass Sprachcodiererbits basierend auf dem Sprachmodus wahlweise fehlergeschützt werden, wodurch der benötigte Kompromiss zwischen der erwünschten Fehlersteuercodierung Von Informationsbits und der unerwünschten Bandbreitenerweiterung erreicht wird, die aus dem Zufügen von zu vielen Overheadbits resultieren würde.
- Fig. 2b zeigt die verschiedenen Codebücher der bevorzugten Ausführung genauer. Wie zuvor erläutert wurde, trägt der Vektor der Langzeitvorhersage beim Codieren von stimmloser Sprache wenig bei. Im stimmlosen Modus werden deswegen dafür Vektoren von den beiden VSELP-Codebüchern (214 und 215) gewählt. Wenn die Sprachsignalform, die sprachcodiert wird, wenig, mäßig oder stark stimmhaft ist, wird der wichtige Vektor (212) der Langzeitvorhersage gemeinsam mit einem einzelnen Vektor von einem VSELP-Codebuch (213) übertragen. Natürlich besitzt wie in dem oben verwendeten einfacheren Beispiel jeder Vektor einen zugehörigen multiplikativen Verstärkungswert (220, 221, 222, 223), der an einen geeigneten Multiplikator (216, 217, 218, 219) angelegt wird, um die Amplituden für eine optimale Sprachcodierung einzustellen. Wie zuvor werden die gewählten Vektoren, nachdem sie summiert wurden (224), an ein LPC-Filter angelegt.
- In der bevorzugten Ausführung wird die Faltungscodierung angewendet, um den Fehlerschutz zu gewährleisten. Faltungscodierer und -decodierer sind in der Technik wohlbekannt und sind außerdem sehr einfach zu implementieren, insbesondere bei der Leistung eines DSP, der dem Entwickler zur Verfügung steht. Dies vermeidet jedoch nicht die Verwendung der wohlbekannten Blockcodierer oder die Kombination dieser beiden, um den notwendigen Fehlerschutz zu gewährleisten.
- Fig. 3 zeigt in Form eines Blockschaltbilds das Codierersystem der vorliegenden Erfindung. Die 118 Bits der Rahmendaten werden an den Eingang eines Datenseparators (301) angelegt. In Abhängigkeit vom Sprachmodus platziert der Separator die Bits, die für den speziellen Sprachmodus als die wichtigsten betrachtet werden, in einer Speicheranordnung, die als Anordnung Klasse I- (302) bezeichnet wird. Die wichtigen Bits, die der Anordnung Klasse I (302) zugewiesen sind, werden in einer Reihenfolge vom höchstwertigen zum niederwertigsten Bit angeordnet. Die Datenbits, die für den speziellen Sprachmodus als unwichtig betrachtet werden, werden in einer Speicheranordnung platziert, die als Anordnung Klasse II (303) bezeichnet wird. Diese Bits werden keiner Fehlersteuercodierung unterzogen.
- Die Bits von der Anordnung Klasse I (302) werden in einen Faltungscodierer (304) eingegeben. Der Codierer (304) der bevorzugten Ausführung ist von einem Codierer der Rate 1/3 auf einen Codierer der Rate 1/2 umschaltbar. Dies wird oft als Vielfachraten-Codierer bezeichnet. Wie in der Technik wohlbekannt ist, weisen Daten, die unter Verwendung eines Faltungscodes der Rate 1/3 codiert wurden, eine geringere decodierte Bitfehlerrate auf als Daten, die bei einer Rate 1/2 codiert wurden. Die geringere Bitfehlerrate wird natürlich auf Kosten einer größeren Anzahl von Overheadbits erreicht. Fig. 4 erläutert eine wohlbekannte Besonderheit von Faltungscodes. Die beste wiederhergestellte Bitfehlerrate tritt bei Bits auf, die entweder nahe am ersten zu codierenden Bit oder nahe am letzten zu codierenden Bit liegen. Da die frühen Bits die am besten geschützten Bits sind, werden die Sprachmodusbits an dieser Position platziert.
- Da die Sprachmodusbits vorzugsweise immer an der gleichen Position sind und auf die gleiche Weise codiert sind, kann ein einziger Vordecodierer (501) verwendet werden, um diese Bits zu decodieren, wie in Fig. 5 dargestellt ist. Die resultierenden Informationen des decodierten Modus können verwendet werden, um den geeigneten Nachdecodierer (503, 504, 505, 506) zu wählen (502), damit sichergestellt ist, dass der geeignete modusbestimmte Algorithmus zum Anordnen und Codieren verwendet wird, um die geschützten Datenbits des Sprachcodierers zu decodieren.
- In digitalen Übertragungssystemen besitzen einige übertragene Bits prinzipiell wegen ihrer Position im Kanal eine höhere Wahrscheinlichkeit des decodierten Fehlers als andere Bits. Zum Beispiel kann in TDM- (Zeitmultiplex-) Systemen die Wahrscheinlichkeit eines decodierten Fehlers eines speziellen Bits auf die Nähe des Bits zu einer übertragenen Synchronisationssequenz bezogen werden.
- In Fig. 3 wird der Ausgang des Decodierers (304) wie auch der Ausgang der Anordnung der Klasse II (303) an den Eingang einer Verschachtelungseinrichtung (305) angelegt. Die Verschachtelungseinrichtung (305) kombiniert in einfacher Weise die codierten und die uncodierten Bits, sodass der resultierende Datenstrom übertragen werden kann.
Claims (10)
1. Verfahren zum Gewährleisten eines Fehlerschutzes für
Informationsbits eines Sprachcodierers, die übertragen
werden sollen, wobei das Verfahren umfasst:
a) Schaffen von Eingangsdaten, die Informationsbits eines
Sprachcodierers enthalten, die bei unterschiedlichen
Sprachmoden verschieden codiert sind;
b) Trennen (301) der Eingangsdatenbits basierend auf dem
Sprachmodus in erste (302) und zweite (303)
Anordnungen aus Bits;
sodass die erste Anordnung (302) die Bits enthält, die für
den speziellen Sprachmodus als die wichtigsten betrachtet
werden; und
die zweite Anordnung (303) die Bits enthält, die für den
speziellen Sprachmodus als unwichtig betrachtet und
keiner Fehlersteuercodierung unterzogen werden;
c) Anwenden (304) einer Technik der Fehlersteuercodierung
auf die Bits der ersten Anordnung, um codierte Bits zu
erzeugen;
d) Kombinieren (305) der codierten Bits mit den nicht
codierten Bits der zweiten Anordnung, um einen
Bitstrom zu bilden; und
e) Übertragen des Bitstroms.
2. Verfahren nach Anspruch 1, bei dem die Bits der ersten
Anordnung (302) in Abhängigkeit vom Sprachmodus so
angeordnet werden, dass die Bits mit einer beim
Rekonstruieren der Sprache für die Wahrnehmung größeren Signifikanz
so codiert werden (304), dass diese für die Wahrnehmung
signifikanteren Bits eine geringere Wahrscheinlichkeit
eines decodierten Fehlers besitzen.
3. Verfahren nach Anspruch 1, bei dem der Schritt c) des
Anwendens (304) einer Technik der Fehlersteuercodierung
das Anlegen der Bits der ersten Anordnung (302) als
Eingang an einen Codierer (304) umfasst, um codierte Bits
zu schaffen.
4. Verfahren nach Anspruch 3, bei dem der Codierer (304)
einen Faltungscodierer enthält.
5. Verfahren nach Anspruch 4, bei dem der Faltungscodierer
(304) wenigstens einige Bits bei einer ersten Rate und
wenigstens einige Bits bei einer zweiten Rate codiert.
6. Verfahren nach Anspruch 5, bei dem die erste Rate einer
Faltungscoderate 1/3 entspricht und die zweite Rate einer
Faltungscoderate 1/2 entspricht.
7. Verfahren nach Anspruch 1, bei dem die Bits der ersten
Anordnung (302) in der Reihenfolge der Wichtigkeit
angeordnet sind.
8. Verfahren nach Anspruch 7, bei dem die Reihenfolge der
Wichtigkeit, in der die Bits der ersten Anordnung (302)
angeordnet sind, durch den Sprachmodus bestimmt ist.
9. Verfahren nach Anspruch 1, bei dem der Schritt e) des
Übertragens des Bitstroms das Speichern und das
Wiedergewinnen des Bitstroms von einer Speichervorrichtung
enthält.
10. Vorrichtung zum Gewährleisten des Fehlerschutzes für
Informationsbits eines Sprachcodierers, umfassend:
- Mittel zum Bereitstellen von Eingangsdatenbits, die
Informationsbits eines Sprachcodierers enthalten, die
für unterschiedliche Sprachmoden verschieden codiert
sind;
- Mittel (301) zum Trennen der Eingangsdatenbits
basierend auf dem Sprachmodus in erste (302) und zweite
(303) Anordnungen von Bits, sodass die erste Anordnung
(302) die Bits enthält, die für den speziellen
Sprachmodus als die wichtigsten betrachtet werden, und die
zweite Anordnung (303) die Bits enthält, die für den
speziellen Sprachmodus als unwichtig betrachtet und
keiner Fehlersteuercodierung unterzogen werden;
- Mittel (304) zum Anwenden einer Technik der
Fehlersteuercodierung auf die Bits der ersten Anordnung
(302), um codierte Bits zu erzeugen; und
- Mittel (305) zum Kombinieren der codierten Bits mit den
nicht codierten Bits der zweiten Anordnung, um einen
Bitstrom zu bilden.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US75524191A | 1991-09-05 | 1991-09-05 | |
| PCT/US1992/006352 WO1993005502A1 (en) | 1991-09-05 | 1992-08-03 | Error protection for multimode speech coders |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE69232166D1 DE69232166D1 (de) | 2001-12-06 |
| DE69232166T2 true DE69232166T2 (de) | 2002-06-06 |
Family
ID=25038293
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE69232166T Expired - Lifetime DE69232166T2 (de) | 1991-09-05 | 1992-08-03 | Fehlerschutz für vielfachmodensprachkodierer |
| DE9218980U Expired - Lifetime DE9218980U1 (de) | 1991-09-05 | 1992-08-03 | Fehlerschutz für Mehrmoden-Sprachcoder |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE9218980U Expired - Lifetime DE9218980U1 (de) | 1991-09-05 | 1992-08-03 | Fehlerschutz für Mehrmoden-Sprachcoder |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US5642368A (de) |
| EP (2) | EP0556354B1 (de) |
| JP (1) | JP3396480B2 (de) |
| AT (1) | ATE208082T1 (de) |
| DE (2) | DE69232166T2 (de) |
| DK (1) | DK0556354T3 (de) |
| ES (1) | ES2167318T3 (de) |
| WO (1) | WO1993005502A1 (de) |
Families Citing this family (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
| FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
| FR2729244B1 (fr) * | 1995-01-06 | 1997-03-28 | Matra Communication | Procede de codage de parole a analyse par synthese |
| JP3616432B2 (ja) * | 1995-07-27 | 2005-02-02 | 日本電気株式会社 | 音声符号化装置 |
| GB9520445D0 (en) * | 1995-10-06 | 1995-12-06 | British Telecomm | Convolutional codes |
| WO1997015046A1 (en) | 1995-10-20 | 1997-04-24 | America Online, Inc. | Repetitive sound compression system |
| FI116181B (fi) | 1997-02-07 | 2005-09-30 | Nokia Corp | Virheenkorjausta ja virheentunnistusta hyödyntävä informaationkoodausm enetelmä ja laitteet |
| WO1999001941A1 (es) * | 1997-07-02 | 1999-01-14 | Alcatel Alsthom - Compagnie Generale D'electricite | Dispositivo de transmision de una señal de voz codificada adpcm |
| US6000054A (en) * | 1997-11-03 | 1999-12-07 | Motorola, Inc. | Method and apparatus for encoding and decoding binary information using restricted coded modulation and parallel concatenated convolution codes |
| US6141638A (en) * | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
| JP2000201132A (ja) * | 1998-11-06 | 2000-07-18 | Matsushita Electric Ind Co Ltd | 送受信装置 |
| US7337110B2 (en) * | 2002-08-26 | 2008-02-26 | Motorola, Inc. | Structured VSELP codebook for low complexity search |
| EP1815463A1 (de) * | 2004-11-05 | 2007-08-08 | Koninklijke Philips Electronics N.V. | Effiziente audiokodierung unter verwendung von signaleigenschaften |
| CN101578659B (zh) * | 2007-05-14 | 2012-01-18 | 松下电器产业株式会社 | 音质转换装置及音质转换方法 |
| EP2538388B1 (de) | 2011-06-20 | 2015-04-01 | Alcatel Lucent | Verfahren und Anordnung zur Bildmodellerstellung |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4802171A (en) * | 1987-06-04 | 1989-01-31 | Motorola, Inc. | Method for error correction in digitally encoded speech |
| US4831624A (en) * | 1987-06-04 | 1989-05-16 | Motorola, Inc. | Error detection method for sub-band coding |
| US5070503A (en) * | 1988-03-09 | 1991-12-03 | Canon Kabushiki Kaisha | Digital information transmitting and receiving system |
| US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
| US5073940A (en) * | 1989-11-24 | 1991-12-17 | General Electric Company | Method for protecting multi-pulse coders from fading and random pattern bit errors |
| US5097507A (en) * | 1989-12-22 | 1992-03-17 | General Electric Company | Fading bit error protection for digital cellular multi-pulse speech coder |
| DE9006717U1 (de) * | 1990-06-15 | 1991-10-10 | Philips Patentverwaltung GmbH, 22335 Hamburg | Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen |
| US5247579A (en) * | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
| US5255339A (en) * | 1991-07-19 | 1993-10-19 | Motorola, Inc. | Low bit rate vocoder means and method |
-
1992
- 1992-08-03 AT AT92917101T patent/ATE208082T1/de active
- 1992-08-03 DE DE69232166T patent/DE69232166T2/de not_active Expired - Lifetime
- 1992-08-03 ES ES92917101T patent/ES2167318T3/es not_active Expired - Lifetime
- 1992-08-03 EP EP92917101A patent/EP0556354B1/de not_active Expired - Lifetime
- 1992-08-03 WO PCT/US1992/006352 patent/WO1993005502A1/en active IP Right Grant
- 1992-08-03 EP EP20010102282 patent/EP1130576A1/de not_active Withdrawn
- 1992-08-03 DK DK92917101T patent/DK0556354T3/da active
- 1992-08-03 JP JP50517493A patent/JP3396480B2/ja not_active Expired - Lifetime
- 1992-08-03 DE DE9218980U patent/DE9218980U1/de not_active Expired - Lifetime
-
1995
- 1995-10-11 US US08/541,738 patent/US5642368A/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| EP0556354A1 (de) | 1993-08-25 |
| JPH06502930A (ja) | 1994-03-31 |
| EP1130576A1 (de) | 2001-09-05 |
| DE9218980U1 (de) | 1996-08-22 |
| ATE208082T1 (de) | 2001-11-15 |
| JP3396480B2 (ja) | 2003-04-14 |
| DE69232166D1 (de) | 2001-12-06 |
| EP0556354A4 (de) | 1995-07-26 |
| US5642368A (en) | 1997-06-24 |
| EP0556354B1 (de) | 2001-10-31 |
| WO1993005502A1 (en) | 1993-03-18 |
| DK0556354T3 (da) | 2001-12-17 |
| ES2167318T3 (es) | 2002-05-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69604729T2 (de) | Verfahren zur sprachkodierung mittels linearer prädiktion und anregung durch algebraische kodes | |
| DE69023402T2 (de) | Verfahren zur Sprachkodierung und -dekodierung. | |
| DE69232166T2 (de) | Fehlerschutz für vielfachmodensprachkodierer | |
| DE69836624T2 (de) | Audiokodierer und -dekodierer | |
| DE69900786T2 (de) | Sprachkodierung | |
| DE69029232T2 (de) | System und Methode zur Sprachkodierung | |
| DE69420431T2 (de) | Sprachkodierungssystem | |
| DE68911287T2 (de) | Codierer/decodierer. | |
| DE69331079T2 (de) | CELP-Vocoder | |
| DE69932460T2 (de) | Sprachkodierer/dekodierer | |
| DE69531471T2 (de) | Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung | |
| DE69309557T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
| DE69814517T2 (de) | Sprachkodierung | |
| DE69837822T2 (de) | Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen | |
| DE69524890T2 (de) | Parametrische Sprachkodierung | |
| DE69426860T2 (de) | Sprachcodierer und Verfahren zum Suchen von Codebüchern | |
| DE69033510T2 (de) | Numerischer sprachkodierer mit verbesserter langzeitvorhersage durch subabtastauflösung | |
| DE69615870T2 (de) | Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen | |
| DE69420682T2 (de) | Sprachdekodierer | |
| DE69827313T2 (de) | Verfahren zur Kodierung des Zufallskomponenten-Vektors in einem ACELP-Kodierer | |
| DE69425226T2 (de) | Sprachdekoder zur Erzeugung von Hintergrundgeräuschen | |
| WO1999063522A1 (de) | Verfahren und anordnung zur sprachcodierung | |
| DE60016305T2 (de) | Verfahren zum Betrieb eines Sprachkodierers | |
| DE69630177T2 (de) | Sprachkodierer mit der Fähigkeit zur wesentlichen Vergrösserung der Codebuchgrösse ohne aber die Zahl der übertragenen Bits zu vergrössern | |
| DE69617414T2 (de) | Verfahren zur bestimmung von anregungsimpulspositionen innerhalb eines sprachrahmens |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 8328 | Change in the person/name/address of the agent |
Free format text: SCHUMACHER & WILLSAU, PATENTANWALTSSOZIETAET, 80335 MUENCHEN |
|
| 8364 | No opposition during term of opposition | ||
| 8327 | Change in the person/name/address of the patent owner |
Owner name: MOTOROLA MOBILITY, INC. ( N.D. GES. D. STAATES, US |
|
| R071 | Expiry of right |
Ref document number: 556354 Country of ref document: EP |