Eine wichtige Aufgabe bei der Konfiguration von VoIP-Systemen ist die Sicherstellung einer ausreichenden Sprachqualität. Zwei Faktoren beeinflussen die Sprachqualität einer VoIP-Verbindung wesentlich: Die Verzögerung der Sprache auf dem Weg vom Sender zum Empfänger sowie der Verlust von Datenpaketen, die nicht oder nicht rechtzeitig beim Empfänger eintreffen. Die “International Telecommunication Union” (ITU) hat in umfangreichen Tests untersucht, was der Mensch als ausreichende Sprachqualität empfindet, und als Resultat die Empfehlung der ITU G.114 veröffentlicht.
Bei Geräten mit integrierter oder nachträglich über Software-Option freigeschalteter VoIP-Funktion werden die QoS-Einstellungen für SIP-Gespräche automatisch vorgenommen! |
Bei einer Verzögerung von nicht mehr als 100 ms und einem Paketverlust von weniger als 5% wird die Qualität wie bei einer “normalen” Telefonverbindung empfunden, bei nicht mehr als 150 ms Verzögerung und weniger als 10% Paketverlust empfindet der Telefonteilnehmer immer noch eine sehr gute Qualität. Bis zu 300 ms bei 20% schließlich empfinden manche Hörer die Qualität noch als brauchbar, darüber hinaus gilt die Verbindung als nicht mehr brauchbar für die Sprachübertragung.
Neben der mittleren Verzögerungszeit wird auch die Schwankung in dieser Verzögerung vom menschlichen Ohr wahrgenommen. Die Unterschiede in der Laufzeit der Sprachinformationen vom Sender zum Empfänger (Jitter) werden bis zu 10 ms noch toleriert, darüber hinaus als störend empfunden.
Die Konfiguration einer VoIP-Verbindung soll dementsprechend so erfolgen, dass die Randwerte für eine gute Sprachqualität eingehalten werden: Paketverlust bis 10%, Verzögerung bis 150 ms, Jitter bis 10ms.
- Der Jitter kann beim Empfänger durch einen entsprechenden Puffer ausgeglichen werden. In diesem Puffer (Jitter-Buffer) werden einige Pakete zwischengespeichert und mit konstantem Abstand an den Empfänger weitergegeben. Durch diese Zwischenspeicherung können die Schwankungen in der Übertragungszeit zwischen den einzelnen Pakete ausgeglichen werden.
- Die Verzögerung wird von mehren Komponenten beeinflusst:
- Zum fixen Anteil der Verzögerung tragen die Zeit der Verarbeitung (Processing: Paketierung, Kodierung und Kompression beim Absender sowie beim Empfänger), die Dauer für Übergabe des Pakets von der Anwendung an das Interface (Serialization) und die Zeit für die Übertragung über die WAN-Strecke (Propagation).
- Der variable Anteil wird vom Jitter bzw. dem eingestellen Jitter-Buffer bestimmt.
- Der Paketverlust schließlich wird neben dem allgemeinen Verlust durch die Netzübertragung maßgeblich durch den Jitter-Buffer beeinflusst. Wenn Pakete mit einer größeren Verzögerung ankommen als durch den Jitter-Buffer ausgeglichen werden kann, werden die Pakte verworfen und erhöhen den Paketverlust. Je größer also der Jitter-Buffer, desto kleiner der Verlust. Umgekehrt steigt mit dem Jitter-Buffer auch die gesamte Verzögerung, so dass bei der Konfiguration der Jitter-Buffer so klein gewählt werden sollte, dass die Qualität noch als ausreichend betrachtet werden kann.
Die Verzögerung wird im Detail vor allem durch den verwendeten Codec, die daraus resultierende Paketgröße und die verfügbare Bandbreite bestimmt:
- Die Zeit für die Verarbeitung wird durch den verwendeten Codec festgelegt. Bei einer Samplingzeit von 20 ms wird genau alle 20 ms ein neues Paket gebildet. Die Zeiten für die Komprimierung etc. können meistens vernachlässigt werden.
- Die Zeit für die Übergabe der Pakete an das Interface wird durch den Quotient aus Paketgröße und verfügbarer Bandbreite definiert:
Paketgröße in Byte | |||||||
---|---|---|---|---|---|---|---|
1 | 64 | 128 | 256 | 512 | 1024 | 1500 | |
56 Kbit/s | 0,14 | 9 | 18 | 36 | 73 | 146 | 215 |
64 Kbit/s | 0,13 | 8 | 16 | 32 | 64 | 128 | 187 |
128 Kbit/s | 0,06 | 4 | 8 | 16 | 32 | 64 | 93 |
256 Kbit/s | 0,03 | 2 | 4 | 8 | 16 | 32 | 47 |
512 Kbit/s | 0,016 | 1 | 2 | 4 | 8 | 16 | 23 |
768 Kbit/s | 0,010 | 0,6 | 1,3 | 2,6 | 5 | 11 | 16 |
1536 Kbit/s | 0,005 | 0,3 | 0,6 | 1,3 | 3 | 5 | 8 |
- Ein 512 Byte großes Paket einer FTP-Verbindung belegt auf einer 128 Kbit/s-Upstream-Leitung also für mindestens 32 ms die Leitung.
Die Pakete der VoIP-Verbindung selbst sind außerdem oft deutlich größer als die reine Nutzlast. Zu den Nutzdaten müssen die zusätzlichen IP-Header sowie ggf. die IPsec-Header addiert werden. Die Nutzlast ergibt sich aus dem Produkt von Nutzdatenrate und Samplingzeit des verwendeten Codecs. Dazu kommen für alle Codecs jeweils 40 Byte für IP-, RTP- und UDP-Header und mindestens 20 Byte für den IPsec-Header (RTP- und IPsec-Header können allerdings je nach Konfiguration auch größer sein).
ohne IPSEC Payload IP-Payload Ethernet/PPPoE ATMNetto Bit/s ATMBrutto Bit/s Code 20ms 20ms 20ms 20ms 20ms G711-64 160 200 222 96000,0 106000,0 G722-64 160 200 222 96000,0 106000,0 G726-40 100 140 162 76800,0 84800,0 G726-32 80 120 142 76800,0 84800,0 G726-24 60 100 122 57600,0 63600,0 G726-16 40 80 102 57600,0 63600,0 G729-8 20 60 82 57600,0 63600,0 ohne IPSEC Payload IP-Payload Ethernet/PPPoE ATMNetto Bit/s ATMBrutto Bit/s Code 30ms 30ms 30ms 30ms 30ms G711-64 240 280 302 89600,0 98933,3 G722-64 240 280 302 89600,0 98933,3 G726-40 150 190 212 64000,0 70666,7 G726-32 120 160 182 64000,0 70666,7 G726-24 90 130 152 51200,0 56533,3 G726-16 60 100 122 38400,0 42400,0 G729-8 30 70 92 38400,0 42400,0 G723-6,3 24 64 86 38400,0 42400,0 mit IPSEC Payload IP-Payload IPSEC-Payload Ethernet/PPPoE ATMNetto Bit/s ATMBrutto Bit/s Code 20ms 20ms 20ms 20ms 20ms 20ms G711-64 160 200 260 282 134400,0 148400,0 G722-64 160 200 260 282 134400,0 148400,0 G726-40 100 140 200 222 96000,0 106000,0 G726-32 80 120 180 202 96000,0 106000,0 G726-24 60 100 160 182 96000,0 106000,0 G726-16 40 80 140 162 76800,0 84800,0 G729-8 20 60 120 142 76800,0 84800,0 mit IPSEC Payload IP-Payload IPSEC-Payload Ethernet/PPPoE ATMNetto Bit/s ATMBrutto Bit/s Code 30ms 30ms 30ms 30ms 30ms 30ms G711-64 240 280 340 362 102400,0 113066,7 G722-64 240 280 340 362 102400,0 113066,7 G726-40 150 190 250 272 89600,0 98933,3 G726-32 120 160 220 242 76800,0 84800,0 G726-24 90 130 190 212 64000,0 70666,7 G726-16 60 100 160 182 64000,0 70666,7 G729-8 30 70 130 152 51200,0 56533,3 G723-6,3 24 64 124 146 51200,0 56533,3 - IP-Payload: Voice Payload + 40 Byte Header (12 Byte RTP; 8 Byte UDP; 20 Byte IP-Header)
- IPSec-Payload: IP-Paket + Padding + 2 Byte (Padding Length u. Next Header) = Vielfaches vom IPSec-Initialisierungsvektor
Anmerkung: Die Werte in der Tabelle gelten für die Verwendung von AES. Bei anderen Verschlüsselungsverfahren kann sich die resultierende Paketgröße in geringem Umfang ändern.Anmerkung: Weitere Informationen über die Bandbreiten beim Zusammenspiel von Voice over IP und IPSec entnehmen Sie bitte dem LANCOM-Techpaper Performance-Analyse der Router. - Die Zeit für die Übertragung über das Internet ist abhängig von der Entfernung (ca. 1 ms pro 200 km) und von den dabei passierten Routern (ca. 1 ms pro Hop). Diese Zeit kann als Hälfte des Mittelwertes einer Reihe von Ping-Zeiten auf die Gegenstelle angenähert werden.
- Der Jitter-Buffer kann an vielen IP-Telefonen direkt eingestellt werden, z. B. als feste Anzahl von Paketen, die für die Zwischenspeicherung verwendet werden sollen. Die Telefone laden dann bis zu 50% der eingestellten Pakete und beginnen dann mit der Wiedergabe. Der Jitter-Buffer entspricht damit der Hälfte der eingestellten Paketanzahl multipliziert mit der Samplingzeit des Codecs.
- Fazit: Die gesamte Verzögerung ergibt sich bei der entsprechenden Bandbreite, einer Ping-Zeit von 100 ms zur Gegenstelle und einem Jitter-Buffer von 4 Paketen für die beiden Codecs im Beispiel zu:
Codec | Processing | Serialization | Propagation | Jitter-Buffer | Summe |
---|---|---|---|---|---|
G.723.1 | 30 ms + 7,5 ms look ahead | 32 ms | 50 ms | 60 ms | 179,5 ms |
G.711 | 20 ms | 32 ms | 50 ms | 40 ms | 142 ms |
- Die Übertragungszeit der Pakete auf das Interface (Serialization) geht dabei von einer PMTU von 512 Byte für eine 128 Kbit-Verbindung aus. Für langsamere Interfaces oder andere Codecs müssen ggf. andere Jitter-Buffer und/oder PMTU-Werte eingestellt werden.
Anmerkung: Bitte beachten Sie, dass die benötigten Bandbreiten jeweils in Sende- und Empfangsrichtung sowie für eine einzelne Verbindung gelten.Anmerkung: Diese Erläuterungen beziehen sich auf Internet-Verbindungen mit sehr geringer Bandbreite. Wenn eine hohe Bandbreite zur Verfügung steht, bewirkt die Verkleinerung der PMTU nur noch kaum wahrnehmbare Leistungsunterschiede.