History & Formats
“There is no non-spatial hearing”
De uitvinder van immersieve muziek is … een Vlaming. Reeds in 1555 ging Adriaan Willaert aan de slag met dubbelkorigheid in de San Marco Basiliek in Venetië. Hij plaatste twee koren op de balkons links en rechts van de Hertog en experimenteerde zo voor de eerste keer in de muziekgeschiedenis met ruimte en plaatsing van zangers.
Geen chauvinistische uiting, vendel gezwaai of ongebreidelde trots die ik hier eventjes wil ten toon spreiden maar Braxton Boren schrijft in ‘Immersive sound the art and science of binaural an multi channel audio’ uitgebreid over Willaert. (p 44) Ook de Nederlander N.V. Fransen doet dit in Stereophonica uit 1962. Hij beschrijft hoe het richtingshoren van de mens eerst en vooral ontwikkeld wastot stand kwam voor het herkennen van gevaar en pas later een artistieke invulling kreeg met – jawel – Adriaan Willaert als schepper van dit idee. De geniale Willaert wordt hier voorgedragen als Nederlander wat helaas voor onze noorderburen onjuist is, de man komt uit Rumbeke in de buurt van Roeselare.
Toch een beetje chauvinisme omdat ik naar de kern van onze zaak wil komen namelijk “immersieve muziek” en daarmee ons onderzoek in PXL- Music in Hasselt wil kaderen. We zetten de traditie verder van onze landgenoot en hebben van creëren en onderzoeken naar muziek in drie dimensionale audio onze core business gemaakt.
Muziek start waar ruis eindigt.
Terwijl andere onderzoekscentra zich voornamelijk toeleggen op hoe een roze ruis of pieptoon zich beweegt in de ruimte vervangen wij die door natuurlijke klanken of instrumenten, en gaan en kijken we welke factoren belangrijk zijn om muziek zo mooi mogelijk te vertalen naar spatiale audio.
Ik wil hier op geen enkele manier afbreuk doen aan puur theoretisch en academisch onderzoek omdat dit inspireert en ons aan het experimenteren zet. Uiteindelijk komen ook wij uit op meer theoretische vraagstukken die we willen beantwoorden.
Immersive
Als je Willaert kan zien als de grondlegger van “immersieve muziek”, dan is de Fransman Clément Adler de grondlegger van de ruimtelijke muziekopnames. Hoewel, opnames heeft hij niet gemaakt over elektrische telefoonlijnen door naar een luistercabine op de internationale expositie van elektriciteit.
De aanwezige luisteraars hielden twee telefoonschelpen tegen hun oren en konden de ruimtelijke positie van geluidsbronnen waarnemen door de interaurale verschillen die over de lijnen werden uitgezonden. De meest eenvoudige manier van ruimtelijke overdracht.
Zijn mono en stereo ook immersive?
De term stereo komt voort uit het Grieks en betekent solide, vast, stevig. In wetenschappelijke teksten wordt het ook wel als ‘driedimensionale kubus’ vertaald (o.a. bij Plato, Aristoteles en Euclides). Het is deze tweede betekenis die duidelijk refereert naar ruimte.
(M. Philippa, F. Debrabandere, A. Quak, T. Schoonheim en N. van der Sijs (2003-2009) Etymologisch Woordenboek van het Nederlands, Amsterdam).
Stereo is een reproductiemethode om een ruimte weer te geven met twee kanalen. Zelfs mono heeft een ruimtelijk aspect: een verre bron klinkt stil en indirect, een nabijgelegen bron luid en concreet. Maar wat maakt iets immersive?
Dat is niet zo gemakkelijk en persoonlijk trek ik de lijn tussen mono, stereo en 3D-geluid als men kan spreken van een duidelijk verschil tussen voor, achter en hoogte. Het gaat dan niet alleen over ruimtelijkheid maar ook over stimuli, een wel omlijnde bron plaatsten en kunnen toewijzen in een ruimte. Bijvoorbeeld: een spreker die je kan waarnemen linksachter op 30° graden of een helikopter die overvliegt en waarvan je duidelijk kan horen dat hij zich boven jou verplaatst van rechtsachter naar linksvoor.
Historisch zijn er al sinds de jaren 1930 verschillende experimenten geweest om immersive te reproduceren en op te nemen. Graag herleid ik ze tot de volgende drie:
1/ Het reproduceren van spatiale audio met een multi-luidpreker setup via verscheidene kanalen.
2/ Ambisonic.
3/ Binaurale koptelefoon technologie.
Golfveldsynthese en transaurale reproductie zijn andere interessante methodes om immersieve content weer te geven via luidsprekers. Omdat ze weinig relevant zijn voor verspreiding van muziek komen ze hier verder niet voor.
1/ Channel & Object based
kanaalgerichte overdrachtmethodes
Door verschillende luidsprekers te plaatsten in een ruimte kunnen we auditieve cues en ruimtelijke informatie reproduceren. Dit doen we door signalen in luidheid te pannen tussen verschillende speakers en noemen we een ‘channel based’ systeem. Daarnaast heb je de ‘object based’ systemen waarbij geluiden via metadata dynamische informatie over hun positie toegekend krijgen bij de mix. Bij weergave gaat het systeem deze data verwerken (‘renderen’) en hiermee het geluid plaatsten in de ruimte, verdeeld over de beschikbare speakers. Het maakt niet uit of de weergave in stereo, koptelefoon of in een bioscoop is met 64 luidsprekers. Door de metadata weet een ‘object based’ systeem waar een geluid moet worden geplaatst en weergegeven.
Object based versus channel based? Er zijn uiteraard verschillende bedrijven die technologie op de markt gebracht hebben voor de creatie van immersief geluid, uiteraard is de gebruikte (vaak ook gepatenteerde) technologie verschillend per bedrijf. De eerste commercieel beschikbare technologie was Auro-3D, ook een Belgische uitvinding en in basis een ‘channel based’ systeem met focus op een zo natuurlijk mogelijk klinkende muziekweergave en bioscoopervaring.
Enkele jaren later volgde het Amerikaanse Dolby met Dolby Atmos en in basis het eerste ‘object based’ systeem, in eerste instantie ook gericht op de bioscoopervaring. Daarna kwam het Amerikaanse DTS met DTS:X en volgden nog een aantal andere bedrijven (waaronder Fraunhofer) over de hele wereld. Een logische vraag zou zijn: ‘wat is nu beter: object based of channel based audio’? Het (misschien) verrassende antwoord is: ‘de combinatie van beide – afhankelijk van de geluiden in jouw mix en of je duidelijk beweging wil horen’. Het is namelijk zo dat alle systemen die vandaag beschikbaar zijn het mogelijk maken objecten en channels te combineren: Auro-3D heeft de mogelijkheid van werken met objecten toegevoegd (AuroMax, Auro cX) aan de channel based technologie en bij Dolby Atmos is de zogenaamde ‘bed’ (een channel configuratie) standaard aanwezig in de Dolby Atmos Renderer. Je hoeft dus niet meer zelf een keuze te maken en dat is een goede zaak.
Eén van de eerste en meest eenvoudige vormen van een multi-luidsprekersysteem is een quad geluidsinstallatie waarbij vier luidsprekers in de hoeken van een kamer worden gezet. In 1968 werd het vroegste 'quad'-systeem voorgesteld door Peter Scheiber. Hij ontwikkelde een matrix om vier analoge kanalen te reduceren tot slechts twee. Via fasedraaiing werden er twee extra signalen meegestuurd in de standaard stereo-opname. De oorspronkelijke vier kanalen werden gereconstrueerd bij reproductie. Er waren echter bepaalde beperkingen van kanaalscheiding en fase-artefacten (Immersive sound the art and science of binaural and multi-channel audio (p52) – The Quadraphonic Story By realspin / March 13, 2015 - https://zstereo.co.uk/2015/03/13/the-quadraphonic-story). Ondanks de agressieve marketing van producenten van quad-formaten in de jaren zeventig, slaagde men er niet in om er een commercieel succes van te maken. Dat resulteerde in een wijdverbreid verlies van vertrouwen in de toekomst van 3D-geluidstechnologie. Pas in 1976, toen Dolby Laboratories naar buiten kwam met zijn 4-2-4 matrix, werd surround een succes in de bioscoop. Zonder er erg in te hebben gebruik ik de term surround. Wat is het verschil tussen immersive en surround? Ook hier moet er misschien ergens een onderscheid gemaakt worden? Maar etymologisch en technologisch zie ik geen noodzaak om deze termen te scheiden, surround of immersive betekenen voor mij hetzelfde. Surround is ons aangereikt door de filmwereld. Het was het achtervoegsel bij normen en producten zoals bijvoorbeeld Dolby-, DTS-, 5.1-, pro logic-, 7.1-surround, … die moesten duidelijk maken dat audio nu ook langs de achterzijde en zijkanten werd weergeven in een bioscoop en dat je zou worden omringd “surrounded by” geluid om een film dramatischer en emotioneel te versterken. Pas toen Auro-3D en NHK 22.2 begin 2000 ook een hoogte laag toevoegde hoorde ik voor het eerst de term immersive commercieel gebruiken. Dat lijkt mij dan ook het algemeen aanvaarde onderscheid. Tussen 3D en immersive is waarschijnlijk minder of geen verschil. Zeker is dat alle fabrikanten van immersieve technologie vandaag zowel horizontale als verticale auditieve informatie verspreiden. Luidsprekers worden rondom ons geplaatst op verschillende hoogtes om alle richtingen te bestrijken en weer te geven. Dolby Atmos is waarschijnlijk de bekendste en is commercieel het meest verspreid in bioscopen. Ook online verspreiden Apple, Music, Tidal, Deezer en Amazon hun immersieve muziek met de Dolby Atmos codec. Dolby Atmos is stilaan synoniem met immersive, zoals een “Kodak” een fototoestel en een “Frigo” een ijskast is. Dolby slaagt er op dezelfde manier in om hun producten te koppelen aan technologie. Nochtans zijn MPEG-H, NHK 22.2, Sony 360 en Auro-3D allemaal ook immersieve formaten zijn die niet zoveel verschillen. Toch wordt de merknaam ‘Dolby Atmos’ vaak gebruikt om aan te duiden dat het gaat over immersieve audio met hoogtelaag.
2/ Ambisonics
kanaalgerichte overdrachtmethodes
Ambisonic is een andere manier van opnemen en weergeven van een driedimensioneel geluid. Het is ontstaan in de jaren ‘60 en ‘70 en bedacht door de Engelse mathematicus Michael A. Gerzon en de fysicus Peter Fellgett.
Net zoals bij MS (mid-side technologie) werken we met een geluidsveldsynthese. We maken geen gebruik van kanaalgerichte overdrachtsmethode zoals bij Dolby Atmos of Auro-3D, maar verdelen de ruimte door middel van bi-directionele polaire-karakteristieken.
Bij Ambisonic in een eerste orde wordt de ruimte onderverdeeld in drie richtingen: van voor naar achter via een X-as, links naar rechts met een Y-as en boven naar onder door een Z-as.
Het proces heeft als doel om bij de luisteraar de geluidsrichting te reconstrueren.
Er is ook nog een vierde W-component, een bol van 360° of een omni-polaire karakteristiek.
De vier componenten W, X, Y, Z noemen we het B-formaat in first order Ambisonic.
Door optelling van W met één van de X, Y, Z componenten kan de gevoeligheid van de assen worden gewijzigd zoals je hieronder kan zien. Tel een omni bij een bi-directionele microfoon en dan krijg je een cardio. Dit is de basis van richtkarakteristieken van standaardmicrofoons.
Door de X, Y, Z assen op te tellen ten op zichten van elkaar kunnen we ook de draairichting veranderen.
Als we draairichting en de gevoeligheid zoals hierboven besproken combineren dan kan vanuit het B-formaat elke fysieke positionering in een bol worden bekomen door optelling en aftrekking van W, X, Y, Z.
Het principe van Ambisonics kan je zowel toepassen bij microfoons als bij mixen.
Net zoals je een stereomix kan converteren met een matrix naar MS kan je dat ook doen naar Ambisonics volgens dezelfde principes.
Het nadeel van een first order Ambisonic is zijn accuraatheid. Het onderverdelen van een ruimte in slechts drie richtingen is niet nauwkeurig. Daarom werd het noodzakelijk om een fijnmazigere verdeling van de ruimte te krijgen met meer bi-directionele componenten. Hierdoor is de plaatsing van objecten in Ambisonic veel nauwkeuriger is geworden. We spreken de laatste jaren over een higher order Ambisonic (HOA).
Bij een 2de orde HOA heb je dan bijvoorbeeld 9 kanalen, en bij een 3de orde HOA 16, in plaats van de 4 kanalen bij de first order Ambisonic.
We gaan al tot 15de orde Ambisonic vandaag.
A-formaat //
Bij opname in Ambisonic kan je gebruik maken van soundfield microfoons. Dit zijn micro’s die opnemen in het A - formaat. Het A - formaat is het RAW-formaat wat onbewerkt uit de capsules van de micro komt. De capsules zijn vier cardio’ s opgesteld in een tetraëder. De eenvoudigste soundfield microfoons nemen op in de eerste orde Ambisonic en het B-formaat wordt bekomen door de verschillende microfoon capsules zo op te tellen in een matrix (plugin) dat je het B- formaat krijgt met de componenten W, X, Y, Z.
First order soundfield micro’s zijn de RØDE' NT-SF1 en de AMBEO VR.
W = LF + LB + RF + RB
X = LF − LB + RF − RB
Y = LF + LB − RF − RB
Z = LF − LB − RF + RB
Door het gebruik van HOA zijn er nu ook micro’s die in dit formaat kunnen opnemen. Bekende voorbeelden zijn hier de Zylia Pro Have it all & Eigenmike met 32 microfoon capsules die tot een 4de HOA kan opnemen.
Toepassingen //
1/ Als 360° weergave systeem bij Facebook en YouTube.
2/ Het sound formaat bij Virtual Reality (VR).
3/ Het geluid bij gaming.
4/ Bij immersieve audio opnames zoals muziek of film.
Zowel voor gaming en VR als voor de immersieve video-inhoud van YouTube en Facebook gebruiken we Ambisonic. Bij videogames wordt zo een volledig head-tracked audio-ervaring mogelijk. Bij gaming zit je als luisteraar in het centrum van de actie. Dit is ideaal voor Ambisonic waar de ideale luisterpositie samenvalt met centrale as van het B-formaat. Dingen links van een gamer zullen links klinken, totdat ze hun hoofd draaien, waarna het geluid naar het midden zal verschuiven als ze ernaar kijken. Dit is allemaal mogelijk dankzij de real-time manipulatie van de B-formaat audiosignalen die in alle grote VR- en 360°-videoplatforms zijn ingebouwd.
Bij opnames heeft Ambisonic het voordeel doordat je RAW-audio opneemt dat alle manipulatie achteraf nog mogelijk zijn zoals bij MS. Via plugins kan je van een Ambisonic A - formaat gemakkelijk een stereo of immersieve weergave maken in Auro-3D, Dolby, Sony 360…
// Voorbeelden Ambisonics
Dit zijn voorbeelden van audiovisuele producties die gebruik maken van Ambisonics technologie voor de audio. Wanneer je deze video's bekijkt in en browser die Ambisonics ondersteunt (zoals Google Chrome), dan draait de audio mee als je rondkijkt in de video.
3/ Binaural
koptelefoonsystemen
In zijn meest basale vorm is het luisteren met onze twee oren naar systemen die twee kanaalsgeluid leveren een binaural systeem. Je kan dit al terugvinden in teksten van Bell (1880) en in het beroemde patent van Blumlein (1933) over stereo. Voor Bell was een stereo weergave binaural als het de registratie was van de ruimtelijkheid zoals wij die kunnen waarnemen met onze twee oren.
A. Bell: Experiments relating to binaural audition. Am. J. Otol. (1880).
A. Blumlein: Improvements in and relating to sound- transmission, soundrecording and sound-reproducing sys- tems. British Patent 394,325, 1933. application 1931 Dec. 14; granted 1933 June 14, partially reprinted in J. Audio Eng. Sec., vol. 6, pp. 91-98, 130 (1958 Apr.).
Helemaal niet zo gek dat de terminologie binaural werd gebruikt in deze context. Het woord is samengesteld uit twee Latijnse woorden “binarius” wat betekent bestaande uit twee, en “auris” of het oor.
In de context van deze website en als het gaat over de reproductie van 3D audio en muziek betekent Binaural iets anders en gaat het voornamelijk over het gebruik van kunsthoofd (dummy head) microfoon technologie. Fletcher was de eerste om in de jaren 30 bij Bell laboratories te gaan experimenteren. Hij gebruikte een kleermakerspop met de bijnaam 'Oscar'. De microfoons werden boven op de jukbeenderen bevestigd omdat ze te groot waren om in de gehoorgang te plaatsten. Dit was niet helemaal volgens de regels van de kunst omdat de gehoorgang en de plaatsing van de microfonen beter in het hoofd gebeuren.
Binaural Recording Technology: A Historical Review and Possible Future Developments
Het hele principe van kunsthoofd-microfoontechnologie is om zo dicht mogelijk de principes van het menselijk gehoor te benaderen en dat fysiek na te bouwen met een nep hoofd. Zo worden dezelfde omstandigheden gecreëerd die ervoor zorgen dat mensen kunnen richtingshoren. Het principe van een kunsthoofd of het mensenhoofd is gebaseerd op drie interaurale verschillen: luidheid of IID (Interaural Intensity Difference ), tijd of ITD (Interaural Time Difference ) en tot slot de frequentieafstraling van ons hoofd. Deze laatste zijn gefilterde cues die bij het geluid worden opgeteld alvorens op het trommelvlies toe te komen. De filtering doet zich vooral voor bij hogere frequenties met kleinere golflengtes waar de torso, het hoofd en de oorschelpen als een mechanisch reflector of filter kunnen worden aanzien. IID+ITD en deze gefilterde cues noemen we samen de HRTF of head related transfer function.
Het uiteindelijke doel van de reproductie van binaurale signalen is een akoestisch signaal tot bij de trommelvliezen van de luisteraar te brengen dat gelijkwaardig is aan het signaal dat een luisteraar onder natuurlijke omstandigheden zou horen. Er zijn veel voordelen verbonden aan de weergave van binaurale signalen via een hoofdtelefoon. Het meest significante voordeel is dat een hoofdtelefoon een gecontroleerde luisteromgeving biedt. De gecontroleerde omgeving is het gevolg van twee belangrijke factoren. De eerste is dat het linkerkanaalsignaal direct aan het linkeroor en het rechterkanaalsignaal direct aan het rechteroor wordt aangeboden. De signalen die bedoeld zijn om elk oor te bereiken worden dus in feite aan het juiste oor aangeboden. De weergave via een hoofdtelefoon wordt niet beïnvloed door factoren als de plaats of oriëntatie van de luisteraar.
Dit is anders bij het gebruik van een headtracker die de beweging van het hoofd registreert en en door extra berekeningen de plaatsing van de luisteraar zal compenseren, om zo signalen aan te bieden overeenkomstig met de positie van de oren. Zonder headtracking zal het aangeboden signaal onafhankelijk zijn van de plaats of oriëntatie van de luisteraar. Een ander voordeel van de directe overdracht van signalen via hoofdtelefoon is dat er geen overspraak (crosstalk) is tussen de oren. Als men een binaural signaal zou reproduceren via luidsprekers ontstaat er wel overspraak tussen het linkse en rechtse kanaal met daarbij horende positie verwarring en klankkleur veranderingen. Daarom is binaural niet geschikt voor weergave over luidsprekers. Daarnaast worden de signalen tweemaal beïnvloed door een aan het hoofd gerelateerde overdrachtsfunctie (HRTF): ten eerste tussen de oorspronkelijke bron en het kunsthoofd gebruikt voor de opname, en ten tweede tussen de virtuele bron (luidspreker) en het menselijke hoofd van de luisteraar. Deze dubbele overdrachtsfunctie (HRTF) kunnen we vermijden door te luisteren op een hoofdtelefoon.
Een paar bedenkingen //
Doordat elke mens uniek is en elk een zeer specifieke fysieke bouw heeft zijn de persoonlijke HRTFs voor iedereen verschillend. Iedereen heeft als het ware een auditieve vingerafdruk. Veel onderzoekers gaan er dan ook van uit dat dit heel belangrijke informatie is. Moesten we in theorie iedereen zijn HRTF kunnen opmeten met bijvoorbeeld microfoontjes in de oren en door testtonen af te spelen rondom een hoofd dan zouden we in staat zijn om van alle mensen een persoonlijke HRTF’s te maken en via binaurale technologie een exacte weergave van lokalisatie op koptelefoon te reproduceren.
Leckschat, Schmitz van het Instituut voor Technische Akoestiek van de Universiteit van Aken ging in de jaren '90 op zoek naar een pop waarbij de afmetingen van het kunsthoofd werden gekozen op basis van de beste lokalisatie. Om deze dimensies te bepalen werden tests gedaan met een grote groep mensen. De uiteindelijk HRTF die werd gekozen was diegene die de beste prestaties leverde voor lokalisatie of plaatsing van geluid bij een groot aantal personen.
Neumann gebruikte dezelfde werkwijze voor het maken van zijn beroemde KU 100 kunsthoofd of ook wel “Fritz” genaamd die tot de dag van vandaag als industrie standaard wordt gezien.
Op dit moment zijn heel wat universiteiten en bedrijven zoals Dolby, Sony, Genelec bezig met het maken van gepersonaliseerde HRTF’s en verlaten hiermee het idee van de gemiddelde HRTF bekomen uit lokalisatie tests.
Wij op PXL-Music Research gaan ervan uit dat gepersonaliseerde HRTF’s niet cruciaal zijn en je met een gemiddelde waarde van verschillende HRTF’s even ver geraakt voor de lokalisatie van bronnen. We willen nog verder gaan en beweren dat voor een immersieve muziekbeleving het exact kunnen plaatsen van geluid ondergeschikt is aan timbre en de klankkleur. Een auditieve cue van bijvoorbeeld een shaker rechts achter mag even goed op 45° of op 30° graden gebeuren. De klankkwaliteit is minstens even belangrijk. We geloven daarom in een HRTF die geoptimaliseerd is voor muziek (M-HRTF).
Voor de natuurlijke plaatsing geloven we ook dat andere cues zoals de hoofdbeweging of wat onze ogen zien veel meer bijdragen tot de positionering van een bron. Apple AirPods hebben een gyroscoop en de mogelijkheid om zo aan head-tracking te doen. Ze gebruiken dit al actief bij het beluisteren van immersieve muziek via spatcial audio en Apple Music. In ons onderzoek met onze eigen kiwi (linkals paper klaar is), een pseudo- kunsthoofd, zijn hier een paar significante zaken naar voor gekomen die deze stelling nog meer onderbouwen.
Een ander fenomeen bij binaural en koptelefoon weergave in het algemeen is dat een bron zich nooit mooi vooraan bevindt maar meestal in het hoofd tussen de oren. Inside-the-head-locatedness (IHL) is een probleem dat zich zeker voordoet wanneer een zanger centraal in een mix wordt geplaatst. Bij binaurale weergave hoor je de zanger in je hoofd tussen je twee oren. Ook dit is niet okee voor een ultieme muziek beleving. Er worden naar mijn gevoel weinig heel duidelijke oorzaken gegeven waarom IHL zich voordoet.
Iets wat we zelf ook hebben ondervonden is dat wanneer we headtracking koppelen aan een HRTF het probleem bijna onmiddellijk Ik neem hier eventjes wat vrijheid. Door minieme hoofdbewegingen scannen we constant voor en achter en geven we ons brein informatie van waar het geluid zich bevindt. Daarnaast ben ik ervan overtuigd dat een geluid dat we niet zien en gesteld dat we ons hoofd volledig stil kunnen houden, dit door onze hersenen geïnterpreteerd wordt alsof het geluid zich tussen onze oren bevindt (IHL). Onze hersenen doen dit omdat we geen ogen hebben op onze rug en standaard alles tussen de oren plaatst als een verdwijnt. potentieel gevaar dat langs achter komt. Een minimale hoofdbeweging of de visuele controle kan het gevaar uitsluiten. Hierin zie ik een verklaring voor IHL. Met een statische binaurale beluistering heb je geen visuele controle vanwaar het geluid komt en kan je ook niet met een hoofdbeweging onderscheid maken tussen voor en achter.
Binaural en een koptelefoon, ons geloof… amen
Op dit moment geloven we heel sterk dat de doorbraak van 3D audio staat of valt met een goede koptelefoon beluistering. Iedereen heeft een smartphone en kan via AirPods muziek beluisteren. Voorlopig is een hoofdtelefoon nog geen state of the art als het over een immersieve muziekbeleving gaat zoals hiervoor beschreven. Maar er is hoop:, we hebben bij ons in het lab een prototype van een hoofdtelefoon met HRTF en headtracker die in de buurt komt. Hiermee kan je nu reeds luisteren alsof je in een studio zit omringd door 22 luidsprekers, of werkelijk de dubbelkorigheid van Willaert ervaren zoals de Doge dat 470 jaar geleden in de San Marco Basiliek in Venetië deed.
Zoals gezegd gaat het om een prototype – maar wel eentje dat ons doet geloven dat we vroeg of laat stereo zullen vergeten en immersive als de gewoonste zaak van de wereld gaan beschouwen.