Steinbruch der Möglichkeiten Standard oder Sammelsurium:
Von Bernd Steinbrink
Digitales Fernsehen, Internet-Multimedia, synthetischer Content: Als die Internationale Organisation für Standardisierung (ISO) Ende der 80er Jahre eine Expertenkommission einsetzte, um einen Standard zur Kompression digitaler Bewegtbilder zu entwickeln, ahnte wohl niemand, wie weit sich die Arbeiten dieser Moving Pictures Experts Group (MPEG) in den Folgejahren entwickeln würden. Waren es anfangs nur 25 Personen, die die MPEG bildeten, so sind es mittlerweile etwa 200 Firmen, Universitätsinstitute und Organisationen aus 20 Ländern, die mehr als 350 Experten zu den dreimal im Jahr stattfindenden Treffen der MPEG anreisen lassen. Seit dem ersten MPEG-Meeting im Mai 1988 in Ottawa führten die folgenden 52 Treffen die Mitglieder mehrfach rund um den Globus -- weshalb schon hin und wieder von der Moving Experts Picture Group gesprochen wurde.
Anfangs konzentrierten sich die Arbeiten der MPEG ausschließlich auf den Bereich der Bewegtbildkompression mit dazugehörigem Audio. Dazu wurden die Standards MPEG-1 und MPEG-2 entwickelt. Genauer genommen handelt es sich dabei um eine Standardfamilie, die sowohl Video mit unterschiedlichen Datenübertragungsraten berücksichtigt als auch -- durch die Kombination unterschiedlicher Ebenen (Levels) und Profile (Profiles) beim MPEG-2 Standard -- auf eine Vielzahl von Anwendungen zielt: die Videodistribution durch CDs und DVDs, den Broadcast-Bereich und das digitale Fernsehen, die Videoaufzeichnung mit Camcordern und schließlich den Videoschnitt am PC und im Studio.
MPEG-2 erwies sich dabei als so flexibel, daß sogar der Bereich des hochauflösenden Fernsehens (HDTV), der eigentlich im MPEG-3-Standard hatte berücksichtigt werden sollen, mit abgedeckt wurde. Daher klafft hier nun eine Lücke in der Zählung, und nach MPEG-1 und -2 befaßten sich die rührigen Experten als drittes gleich mit MPEG-4.
Sinn und Zweck von MPEG-4
Zunächst wollte die Gruppe mit MPEG-4 einen Kompressionsstandard definieren, der besonders gut bei extrem niedrigen Datenraten greifen sollte, wie sie im Internet bei der Modem- oder ISDN-Übertragung üblich sind (ca. 14 bis 64 kBit/s). Es gab eine Vielzahl von Vorschlägen durch Firmen und Institute, die gern ihre Kompressionsverfahren als MPEG-4 Standard gesehen hätten -- schon allein aus lizenzrechtlichen Gründen. Leonardo Chiariglione, der Vorsitzende der MPEG, erwies sich als pragmatisch denkender Wissenschaftler: Es gebe gute Kompressionsverfahren für niedrige Datenraten, erklärte er damals, MPEG-1 und H.263 beispielsweise, da müsse man, wenn nicht eine wesentliche Verbesserung hinsichtlich der Kompressionseffizienz erreicht würde (zumindest 10 bis 15 Prozent), nicht eigens einen neuen Standard schaffen. Daher schwenkte Ende 1995 der Fokus von MPEG-4 auf die Verwendung digitaler AV-Medien in interaktiven Anwendungen über.
Die zunehmende Digitalisierung im Audio- und im Videobereich ermöglicht nicht nur eine praktisch verlustfreie Übertragung und Speicherung von Videosequenzen (von Rekompressionsverlusten einmal abgesehen), sondern sie erlaubt zudem einen veränderten Zugriff auf audiovisuelle Daten und verändert daher die Möglichkeiten von AV-Medien grundlegend: Manipulationen sind möglich; Animationen und "künstlich" erstellte Sequenzen lassen sich in Videos einbinden; und schließlich erlauben digitale AV-Sequenzen die Erstellung von Programmen mit interaktiven Zugriff. Wesentlich für die Neuausrichtung der Arbeiten am MPEG-4-Standard war natürlich seit Mitte der 90er Jahre die rasante Entwicklung des Internets.

Streaming in den Kinderschuhen
Zwar war die direkte Übertragung multimedialer Daten ohne Zeitverzögerung, besonders von Audio und Video, im Internet lange Zeit nicht recht möglich, und noch heute steckt die Technik in ihrer Anfangsphase. Immerhin weisen die neuen Streaming-Techniken, bei denen AV-Dateien ohne vorheriges Herunterladen direkt wiedergegeben werden können, aber die Richtung der zukünftigen Entwicklung (s.a. ComputerVideo 1/00 bis 4/00). Internet-Broadcasting soll nach eCommerce den nächsten Goldrausch im Internet auslösen: Auf Broadcast-Messen und Kongressen wird das künftige Internet, in dem die Beschränkungen der Übertragungsbandbreite aufgehoben sind, schon als großes "Electronic Movie" angesehen. Möglich wird damit zudem der interaktive Zugriff auf Videosequenzen über das Internet. Er muß sich nicht nur auf Video on Demand beschränken, sondern kann in realistisch gestaltetenen Videospielen, beim virtuellen Einkaufsbummel oder beim Computer-Based Training (CBT) viel differenzierter gestaltet werden. Daneben wird das zukünftige digitale Fernsehen neue Perspektiven hinsichtlich der Übertragungsmöglichkeiten und interaktiven Zugriffe bieten.
Anwendungen
MPEG-4 wird mittlerweile als eine Art Kommunikationsstandard verstanden, der -- wie es MPEG-Kommissions-Mitglied Rob Koenen ausdrückt -- "alle Möglichkeiten der digitalen Umgebung erforscht". Das allerdings ist ein äußerst weitgehender Anspruch: Während es recht einfach war, Verwendung und Nutzen der Kompressionsstandards MPEG-1 und 2 zu vermitteln, der eben vor allem in der Kompressionseffizienz liegt, sind die Anwendungs- und Nutzungsmöglichkeiten des Kommunikationsstandards MPEG-4 bedeutend vielschichtiger und weitgehender. Entsprechend erweitert sich die Arbeitsfelder der Expertengruppe während der Arbeit am MPEG-4-Standard. Zudem zieht derzeit die hohe Kompressionseffizienz bei extrem niedrigen Datenraten bis hin zum Streaming-Video und Audio im Internet wieder das Experteninteresse auf sich.
So soll der MPEG-4-Standard zunächst einmal dazu dienen, dem Durcheinander proprietärer Videoformate im Internet entgegenzuwirken. Wer heutzutage auch nur die wichtigen Streaming-Video-Formate im Internet auf seinem PC wiedergeben möchte, muß allein drei Decoder installieren: Real Networks RealVideo, Microsofts Media Player und Apples QuickTime. Bei Audio sieht es ähnlich aus. Es wäre für Informationsanbieter und PC-Nutzer sicherlich angenehmer, wenn es genau einen Encoder und Decoder gäbe.

RealVideo im MPEG-4-Standard?
Allerdings nimmt beim AV-Streaming RealVideo eine starke Stellung ein, denn das Kompressionsverfahren ist gut, effektiv und weit verbreitet. Deshalb wurde auf der letzten MPEG-Konferenz Ende Juli in Peking von Vertretern von RealNetworks und Intel vorgeschlagen, den RealCodec weiter zu prüfen und ihn in den MPEG-4-Standard aufzunehmen. Ein entsprechender Schritt wird innerhalb der MPEG diskutiert.
Doch die Kodiereffizienz von MPEG-4 selbst hat sich gegenüber MPEG-1 ebenfalls deutlich verbessert. Jene 10 bis 15 Prozent, die Leonardo Chiariglione als Schallmauer für einen neuen Standard ansah, sind selbst im sogenannten Main Profile des MPEG-4-Standards deutlich überschritten. Eine 30prozentige Verbesserung bei der Reduktion der Bitrate stellten die Experten bei Übertragungsraten zwischen 40 und 768 kbit/s fest. Doch nachdem MPEG-4 bereits 1998 in einer ersten Version vorlag und 1999 zum offiziellen ISO-Standard mit der Bezeichnung ISO/IEC 14496 erklärt wurde, arbeiteten die Experten weiter.

Anfang dieses Jahres wurde die Verabschiedung von MPEG-4 Version 2 bekannt gegeben. Darin sind Erweiterungen enthalten, die auch die Kodierung betreffen. Im sogenannten Advanced Coding Efficiency Profile (ACE) wird bei Datenraten von 218 bis 1000 kbit/s nochmals eine Verbesserung von 30 bis 50 Prozent gegenüber dem Main Profile erreicht. Nach wie vor bedient sich MPEG-4 (wie seine Vorgänger MPEG-1 und -2) bei der Videokodierung eines Verfahrens, das auf der sogenannten Diskreten Cosinus Transformation (DCT) basiert. Für die Übertragung bei niedrigen Datenraten wurden die Techniken bei der Bewegungskompensation verbessert. Für Standbilder und Texturen enthält MPEG-4 zudem ein effizientes Wavelet-basiertes Verfahren.

Auf der Empfängerseite müssen MPEG-4-Endgeräte
über eine gehörige Portion Intelligenz verfügen,
um die Szenen originalgetreu darstellen zu können.
Alles Objekt oder was?
MPEG-4 stellt den interaktiven Zugriff auf Medienobjekte und deren Kombination in den Mittelpunkt des Standards. Medienobjekte können sowohl Audio, Video und reale Bilder sein, also sogenannte "natürliche" Quellen, als auch um Text und Graphik sowie 2D- und 3D-Animationen, also mit dem Computer erzeugte "synthetische" Objekte. Die Medienobjekte beziehen sich auf Inhalte. So sind Videoobjekte nicht unbedingt an spezifische Bildformate gebunden, sondern beziehen sich beispielsweise auf eine Figur, wie einen sich bewegenden Sportler. Diese Figur wird durch ihre Umrisse beschrieben und komprimiert. Sie läßt sich nun mit anderen Objekten, natürlichen und synthetischen, kombinieren und zu Gruppen zusammenfügen. Durch eine solche Komposition ergibt sich eine sogenannte MPEG-4-Szene.
Zu einer MPEG-4-Szene können Audio-Objekte gehören, die wiederum mit Videoobjekten verbunden sind. Durch die mathematische Beschreibung der Objekte innerhalb von Szenen läßt sich die komplette Zusammenstellung leicht manipulieren. So kann beispielsweise ein 3-D-Objekt vom Nutzer mit dem Mauspfeil hin und her gewendet werden; ein Sound kann sich durch seine Bewegung im Raum verändern; oder unterschiedliche Sounds können, abhängig von einer Aktion des Nutzers, für ein Videoobjekt aktiviert werden. Die einzelnen Objekte werden gesondert beschrieben und in sogenannten Elementary Streams übertragen. Die Art der Übertragung selbst ist durch MPEG-4 nicht festgelegt: Genutzt werden kann etwa der sogenannte Transport Stream von MPEG-2, beispielsweise für Broadcaster beim zukünftigen digitalen Fernsehen, oder aber auch das Internet Protocol (IP), wenn die multimedialen Informationen von einzelnen Nutzern abgerufen werden.
Durch die Zusammenstellung verschiedener Objekte beim Nutzer ließe sich in einem einfachen Beispiel beim Video on Demand die Information individualisieren. So könnte das Bild von einer Sportübertragung beispielsweise einen Kommentar in einer von Nutzer gewählten Sprache haben. Zusätzliche Information könnten, je nach Wunsch des Nutzers, in Untertiteln geliefert werden.
MPEG-4 bietet dabei ein hohes Maß an Flexibilität und Skalierbarkeit. Die Übertragung läßt sich der aktuell zur Verfügung stehenden Datenrate und den Möglichkeiten des Empfangsgerätes anpassen. Diesen Voraussetzungen entsprechend verändert sich die Qualität: Steht eine höhere Datenrate zur Verfügung, so erhöht sich die Bild- und Klangqualität. Auf der anderen Seite werden beim Streaming Video und -Audio selbst unter schlechten Bedingungen ausreichend Daten für eine kontinuierliche Wiedergabe übertragen.

Beispiel für MPEG-4-Effizienz: Über dem Standbild liegt ein Maschengitter, mit dem es sich animieren läßt -- der Fisch schwimmt. Wird ein Logo auf den Fisch gemappt, so macht es dessen Bewegungen synchron mit.
Man spricht BIFS
Um eine MPEG-4-Szene mit mehreren Objekten zusammenzustellen und dafür zu sorgen, daß sie sich durch die Aktionen des Nutzers dynamisch verändern kann, ist eine Beschreibungssprache erforderlich. Diese Sprache nennt sich bei MPEG-4 "Binary Format for Scenes", kurz BIFS. Mit den BIFS-Befehlen wird die Szene beschrieben und kodiert. Der Nutzer braucht einen Dekoder, um mit den Objekten der Szene zu interagieren. Konzeptionell weist BIFS Ähnlichkeiten mit VRML auf, der Code ist allerdings, da es sich um Binärcode handelt, sehr viel kürzer und flexibler. So wird BIFS gleichfalls für das Realtime-Streaming benutzt. Um die interaktiven Möglichkeiten der Objekte noch zu erweitern, hat MPEG-4 auf eine Untermenge von Java zurückgegriffen: MPEG-J definiert Schnittstellen für einzelne oder verbundene Objekte, sorgt aber außerdem für die Kontrolle bei der Übertragung und der Wiedergabe beim Empfänger.

Die Building Blocks von MPEG-4-Audio unterstützen eine Vielzahl von Bitraten und Bandbreiten.
Audio wird gleichrangig
Bei MPEG-1 und -2 stand der Audio-Part als videobegleitender Sound noch im Hintergrund. Seit dem enormen Erfolg von MP3, das aus dem Audio-Teil von MPEG-1 (Layer 3) und MPEG-2 abgeleitet wurde, wird bei MPEG-4 die Audio-Komponente gleichrangig behandelt. MPEG-4 bietet eine effektive Soundkompression, die, so behaupten die Experten, mit Datenraten von 6 bis 128 kbit/s ausgezeichnete Qualitäten liefert, angefangen beim einfachen Monosignal bis hin zum transparenten Stereosignal. Zu steigern ist die Qualität noch durch das sogenannte Advanced Audio Coding (AAC), ein Verfahren, das MPEG-4 von MPEG-2 übernommen hat und das Mehrkanal-Audio bietet. Abgerundet wird der Standard durch spezielle Verfahren zur Sprachkodierung und eine Methode zur synthetischen Sounderzeugung ("Structured Audio", SA), die vergleichbar mit denen bei MIDI verwendeten ist. Unterstützt wird die Klangerzeugung durch zwei Sprachen, die "Structured Audio Orchestra Language" (SAOL), die zur Definition von Instrumenten, und die "Structured Audio Score Language" (SASL), die zur Kontrolle der Instumente dient.
Standard oder Steinbruch?
Die Möglichkeiten von MPEG-4 erscheinen nahezu unbegrenzt und sind nur schwer zu überschauen. Wenn die Experten tatsächlich alle Potentiale der digitalen Medien ausloten wollen, besteht allerdings die Gefahr, daß sich die Arbeit im Rahmen von MPEG-4 zu einem kontinuierlichen Forschungsprozeß entwickelt. Das Endergebnis wäre dann kein einheitlicher Standard, sondern ein Sammelsurium der unterschiedlichsten Verfahren und Werkzeuge: für die Herstellerfirmen eine Art Steinbruch, aus dem sie sich herausbrechen können, was immer sie gerade für ihre Zwecke benötigen.
So ist die Arbeit an MPEG-4 Version 2 noch immer nicht beendet. Es soll speziell für den Produktionsbereich in Zukunft eine Version 3 mit einem sogenannten "Studio Profile" geben, anshcließend noch eine Version 4 mit einem speziellen "Streamed Video Profile". Dabei wird mit hohen Datenraten bis 100 Mbit/s gearbeitet, um im Produktionsbereich hohe Bildqualitäten zu gewährleisten.

Die Verteilung künftiger Multimedia-Inhalte im MPEG-4-Standard soll die drei bisherigen Distributionsarten vereinen.
Doch damit nicht genug: In guter Tradition ihrer unkonventionellen Zählweise arbeiten die Experten zusätzlich an einem MPEG-7- und neuerdings auch an einem MPEG-21-Standard. MPEG-7 befaßt sich mit der Beschreibung multimedialer Inhalte durch sogenannte Deskriptoren und soll die Aufgabe erfüllen, diese Inhalte mit Suchmaschinen auffindbar zu machen. Damit ließen sich beispielsweise Videoobjekte finden, die bestimmten Kriterien entsprechen, indem diese in standardisierter Weise gekennzeichnet werden. MPEG-21 befindet sich noch ganz am Anfang seiner Entwicklung und wird als Rahmen für Multimedia ("Multimedia Framework") bezeichnet, der die Integration sämtlicher Technologien ermöglichen soll, die beim digitalen Fernsehen und im Internet zum Einsatz kommen.

Allein auf weiter Flur: Sharps Viewcam Vn-EZ1 ist derzeit das einzige MPEG-4-Consumergerät auf dem Markt.
Produkte: auf Sparflamme
Was gibt es schon an vorzeigbaren Produkten, die auf dem MPEG-4-Standard aufbauen? Microsoft nutzt in den "Windows Media Technologies" unterschiedliche MPEG-4-Codecs, die seit der Einführung vor etwa zwei Jahren weiterentwickelt wurden und für Streaming Video genutzt werden. Die Firma Sharp hat eine Internet-Kamera entwickelt (die ViewCam VN-EZ1), die auf MPEG-4 und Microsofts "Advanced Streaming Format" (ASF) aufsetzt. Die Sharp-Kamera nutzt die hohe Kodiereffizienz von MPEG-4 und reduziert die Daten kurzer Bewegtbildsequenzen so stark, daß die kleinen Videos sich sowohl als Attachment für Emails eignen als auch übers Internet oder andere Netzwerke übertragen werden können. Zunächst werden die Bilddaten auf SmartMedia Memory-Karten gespeichert und anschließend auf den Rechner übertragen. Sharp gibt an, auf einer Speicherkarte mit 32 MB Kapazität bis zu eine Stunde Bewegtbilddaten unterbringen zu können. Bei diesen beiden Produkten ist erkennbar, daß sich die ersten MPEG-4-Produkte offenbar an recht konventionellen Anwendungen orientieren, wobei die Kodiereffizienz und das Streaming im Mittelpunkt stehen.
Die Entwicklung weitergehender Anwendungen, beispielsweise von Multimedia-Autorensystemen auf MPEG-4-Basis gerade für interaktive Anwendungen, läßt noch auf sich warten. Zwar ist von Insidern immer wieder zu hören, daß gerade die großen Firmen, die in der MPEG vertreten sind, MPEG-4-Entwicklungen vorantreiben. Hinsichtlich öffentlicher Ankündigungen hält man sich dort freilich bedeckt. Das liegt nicht zuletzt daran, daß lange Zeit eine immense Unsicherheit hinsichtlich der Lizenzen für MPEG-4 existierte. Entsprechend der langen Liste von Unternehmen und Institutionen in der MPEG und der Komplexität und Vielfalt des Standards, ist die Liste unterschiedlicher Firmen-Patente, die Eingang in den Standard fanden, längst nicht so überschaubar wie bei MPEG-1 und -2. Mittlerweile wurde immerhin das MPEG-4 Industry Forum (M4IF) gegründet, das es sich bei seinem ersten Treffen Ende 1999 als Ziel gesetzt hat, MPEG-4 zu einem bei Anwendungsentwicklern, Service-Providern, Autoren und Nutzern allseits anerkannten Standard zu machen. Dazu gehört, daß der Lizenzerwerb für MPEG-4 überschaubar und einfach geregelt ist. Im Frühjahr dieses Jahres wurde deshalb die Einrichtung eines Lizenz-Pools beschlossen: Er soll den fairen und vernünftigen Erwerb jenes weltweiten Lizenzbündels regeln, das für die Entwicklung von Produkten auf MPEG-4-Basis notwendig ist. Bleibt zu hoffen, daß nun bald serienreife Produkte für die Nutzung der vielversprechenden Möglichkeiten von MPEG-4 auf den Markt kommen.
----------------------
Zurück zum Seitenbeginn