Title:
Verfahren und Vorrichtung zur Verarbeitung von Audiodaten
Kind Code:
A1


Abstract:

Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Verarbeitung von Audiodaten sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium, welche insbesondere einsetzbar sind auf dem Gebiet der Audioverarbeitung. Gemäß dem Verfahren zur Verarbeitung von Audiodaten werden M Benutzerparametern in ein Konversionsmodul (11) eingegeben, die M Benutzerparameter auf N technische Parameter mittels Künstlicher Intelligenz in dem Konversionsmodul (11) abgebildet, die N technischen Parameter an ein Audiogerät (12, 16) ausgegeben, Audiodaten in dem Audiogerät (12, 16) mit den N technischen Parameter zu einem Ausgangssignal (13, 17) verarbeitet, und das Ausgangssignal (13, 17) aus dem Audiogerät (12, 16) ausgegeben.




Inventors:
gleich Anmelder
Application Number:
DE102010009745
Publication Date:
09/01/2011
Filing Date:
03/01/2010
Assignee:
Eisenberg, Gunnar, Dr.-Ing., 14656 (DE)
International Classes:



Attorney, Agent or Firm:
Hernández, Yorck, Dipl.-Ing., 81379, München, DE
Claims:
1. Verfahren zur Verarbeitung von Audiodaten, gekennzeichnet durch die Schritte:
– Eingeben von M Benutzerparametern in ein Konversionsmodul (11),
– Abbilden der M Benutzerparameter auf N technische Parameter mittels Künstlicher Intelligenz in dem Konversionsmodul (11),
– Ausgeben der N technischen Parameter an ein Audiogerät (12, 16),
– Verarbeiten von Audiodaten in dem Audiogerät (12, 16) mit den N technischen Parameter zu einem Ausgangssignal (13, 17), und
– Ausgeben des Ausgangssignals (13, 17) aus dem Audiogerät (12, 16).

2. Verfahren nach Anspruch 1, wobei M < N ist.

3. Verfahren nach Anspruch 1 oder 2, wobei die Audiodaten und/oder Audiosteuerdaten in das Audiogerät (12) eingegeben werden.

4. Verfahren nach Anspruch 1 oder 2, wobei ein Eingangssignal (15) in ein Analysemodul (14) eingegeben wird, das Analysemodul (14) K Analyseparameter aus dem Eingangssignal (15) ermittelt und die K Analyseparameter in das Konversionsmodul (11) eingegeben werden.

5. Verfahren nach Anspruch 4, wobei das Konversionsmodul (11) die M Benutzerparameter und die K Analyseparameter auf die N technischen Parameter abbildet.

6. Verfahren nach Anspruch 5, wobei die N technischen Parameter Syntheseparameter sind und das Audiogerät (16) eine Synthese durchführt.

7. Verfahren nach Anspruch 5, wobei das Analysemodul (14) eine Transformation des Eingangssignals (15) durchführt, woraus sich K Analyseparameter ergeben, das Konversionsmodul (11) die K Analyseparameter basierend auf den M Benutzerparametern in N Resyntheseparameter überführt und das Audiogerät (16) ein Audiosignal (17) basierend auf den N Resyntheseparametern erzeugt.

8. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Konversionsmodul (11) in einem automatisierten Vorgang trainiert wird.

9. Computerprogramm, das es einer Datenverarbeitungseinrichtung ermöglicht, nachdem es in Speichermittel der Datenverarbeitungseinrichtung geladen worden ist, ein Verfahren nach einem der Ansprüche 1 bis 8 durchzuführen.

10. Computerlesbares Speichermedium, auf dem ein Programm gespeichert ist, das es einer Datenverarbeitungseinrichtung ermöglicht, nachdem es in Speichermittel der Datenverarbeitungseinrichtung geladen worden ist, ein Verfahren nach einem der Ansprüche 1 bis 8 durchzuführen.

11. Vorrichtung zur Verarbeitung von Audiodaten,
gekennzeichnet durch
– ein Benutzermodul (10), welches Benutzerparameter zur Auswahl bereitstellt,
– ein Konversionsmodul (11), welches M Benutzerparameter vom Benutzermodul (10) empfängt und eingerichtet ist, um die M Benutzerparameter mittels Künstlicher Intelligenz auf N technische Parameter abzubilden, und
– ein Audiogerät (12, 16), welches die N technischen Parameter vom Konversionsmodul (11) empfängt und eingerichtet ist, um Audiodaten mit den N technischen Parametern zu einem Ausgangssignal (13, 17) zu verarbeiten und das Ausgangssignal (13, 17) auszugeben.

12. Vorrichtung nach Anspruch 11, wobei M < N ist.

13. Vorrichtung nach Anspruch 11 oder 12, des Weiteren umfassend ein oder mehrere externe Geräte, welche dem Audiogerät (12) die Audiodaten und/oder Audiosteuerdaten bereitstellen.

14. Vorrichtung nach Anspruch 11 oder 12, umfassend ein Analysemodul (14) das eingerichtet ist, um aus einem Eingangssignal (15) K Analyseparameter zu ermitteln und die K Analyseparameter in das Konversionsmodul (11) einzugeben.

15. Vorrichtung nach einem der vorhergehenden Ansprüche, wobei das Konversionsmodul (11) auf Algorithmen aus dem Bereich der symbolischen, neuronalen oder statistischen Künstlichen Intelligenz basiert.

Description:

Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Verarbeitung von Audiodaten sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium, welche insbesondere einsetzbar sind auf dem Gebiet der Audioverarbeitung.

Bekannte Geräte der Tonstudiotechnik wie Synthesizer und Audioeffektgeräte haben eine Benutzerschnittstelle (User Interface), die abhängig vom Gerät individuell ausgestaltet ist. An solch einer Benutzerschnittstelle sind Parameter verwendeter Algorithmen zur Audioverarbeitung direkt als technische Parameter (Frequenzen, Amplituden, Spektren, Zeitspannen, Faktoren, Summanden, etc.) zugänglich. Dieses etablierte Konzept hat jedoch den Nachteil, dass ein Benutzer für die Bedienung ein hohes Maß an technischem Verständnis aufbringen muss, da er mit einer Vielzahl technischer Parameter (üblicherweise im Bereich von 50 bis 150) konfrontiert wird, deren Auswirkung oft nur mit vertieften technischen Kenntnissen vorhersagbar ist. Dabei ist zu beachten, dass Geräte der Tonstudiotechnik sehr häufig von Musikern und nicht nur von Technikern bedient werden sollen. Weiterhin muss sich der Benutzer aufgrund der individuellen Ausgestaltung von Benutzerschnittstellen jeweils in die Bedienung eines jeden Geräts neu einarbeiten, was sehr mühsam und zeitaufwändig sein kann.

Ein spezielles Gebiet der Tonstudiotechnologie ist beispielsweise die sogenannte Resynthese. Bei der Resynthese wird ein Eingangssignal (z. B. ein Klang oder Geräusch) über eine mathematische Transformationsvorschrift in einem Analyseschritt in eine gewichtete Summe von Basisfunktionen zerlegt. In einem sich anschließenden Resyntheseschritt kann das ursprüngliche Signal aus dieser gewichteten Summe wieder zusammengesetzt werden. Über die Manipulation der Analyseergebnisse können einzelne Signalaspekte gezielt verändert werden, was den Nutzen der Resynthese ausmacht.

Als Basisfunktionen können beispielsweise einfache Sinusschwingungen unterschiedlicher Frequenz gewählt werden, deren Amplituden gegebenenfalls manipuliert werden, um einzelne Frequenzen zu verstärken oder abzuschwächen.

Als Basisfunktionen können beispielsweise auch einfache Klangkörner (Grains/Wavelets) unterschiedlicher Ausdehnung und Struktur verwendet werden, um einzelne Ausprägungen im Frequenz- und Zeitbereich des Signals zu verstärken oder abzuschwächen.

Die Verfahren eignen sich in der Tonstudiotechnik zum Filtern aber auch für Equalizer oder zur Rauschunterdrückung. Die bestehende Technik zur Resynthese von Klängen beruht dabei entweder auf Filterbänken oder auf der FFT- beziehungsweise Wavelet-Transformation. Die Standardtechniken in diesem Zusammenhang sind der Vocoder, der Phasenvocoder sowie Sinusmodelle jeweils mit und ohne Transienten-/Rauschanteil.

All diesen Techniken für die Resynthese wohnt das Problem inne, dass nach der Analyse eines Klangs eine Vielzahl von Parametern (z. B. ca. 100 bis 9000) als zeitvariante Signalen vorliegen, die für die Resynthese benötigt werden. Diese Parametervielzahl kann manuell kaum noch sinnvoll editiert werden, was die meisten Resynthesesysteme zu geschlossenen Systemen macht. Dies ist auch einer der Gründe, warum die in der Forschung ausgiebig behandelten Algorithmen in der Praxis kaum Anwendung finden.

Die folgenden bekannten Systeme beschäftigen sich mit den oben genannten Gebieten der Tonstudiotechnik.

Das Programm Live® von Ableton® ist ein Musik-Sequenzer mit integrierten Synthesizern und Effektgeräten. Um die Benutzerschnittstelle einfach halten zu können gibt es die Möglichkeit jedem Audiogerät acht Makroparameter zuzuweisen, die markante technische Parameter abbilden. Die Verknüpfung von einzelnen Parametern zu Makroparametern ist nur in begrenztem Umfang möglich. Insbesondere erfolgt die gesamte Parameterkonversion rein manuell. Die im Programm vorhandene Funktionalität zur Resynthese geschieht in geschlossener Form, so dass der Benutzer keine Eingriffsmöglichkeiten hat.

Die Systeme Kore 1® und Kore 2® von Native Instruments® sind Synthesizer und Effektgeräte, deren technische Parameter ebenfalls über acht Makroparameter kontrolliert werden können. Hierzu können die internen technischen Parameter über beliebige Netzwerke manuell verknüpft werden. Auch diese Systeme verfügen über keine Automatisierung. Eine Möglichkeit zur Resynthese besteht nicht.

Das Programm Alchemy® von Camel Audio® ist ein Synthesizer und Effektgerät dessen technische Parameter prinzipiell genau so über Makroparameter verwaltet werden können wie bei den Kore® Systemen von Native Instruments®. Bei den umfangreichen Resynthesemöglichkeiten können die im Resyntheseprozess entstehenden technischen Analyse-Resyntheseparameter zwar editiert werden, jedoch nur manuell und direkt als technische Parameter.

Das Programm Spectral Delay® von Native Instruments® ist ein Effektgerät, das eine Resynthese über eine FFT durchführt. Im Resyntheseprozess entstehen hierdurch 6144 technische Analyse-Resyntheseparameter in Form von Spektraldaten, die über eine grafische Benutzerschnittstelle editiert werden können. Die Bearbeitung erfolgt hier jedoch für jeden Parameter einzeln und rein manuell.

Der Synthesizer Neuron® von Hartman Music® erlaubt eine Resynthese von Klängen mittels Neuronalen Netzen. Hierbei werden die Neuronalen Netze als Transformationsvorschrift verwendet um die Klänge zu speichern. Die einzelnen zur Resynthese benötigten Parameter werden direkt in der Benutzerschnittstelle abgebildet, so dass das System zwar von Spezialisten für Neuronale Netze bedient werden kann, kaum jedoch von Durchschnittsmusikern. Das System verfügt für die Bedienung der Kerntechnik über keine Makroparameter oder Automatisierung zur Unterstützung des Nutzers.

Somit besteht bei der Verarbeitung von Audiodaten, wie sie beispielsweise in der Tonstudiotechnik eingesetzt wird, sehr häufig das Problem, dass ein Benutzer mit einer Vielzahl von Parametern konfrontiert wird, die sich ihm nicht direkt erschließen, da hierzu spezifisches, technisches Fachwissen erforderlich ist. Weiterhin hemmt beim Benutzer oftmals allein schon die große Anzahl an Parametern ein effizientes, zielgerichtetes Arbeiten.

Der Erfindung liegt daher die Aufgabe zu Grunde, ein verbessertes Verfahren und eine verbesserte Vorrichtung zu schaffen.

Die der Erfindung zu Grunde liegende Aufgabe und weitere Aufgaben werden jeweils mit den Merkmalen der unabhängigen Patentansprüche gelöst. Bevorzugte Ausführungsformen der Erfindung sind in den abhängigen Patentansprüchen angegeben.

Erfindungsgemäß wird das Abbilden von M Benutzerparametern auf N technische Parameter mittels Künstlicher Intelligenz erreicht. Dazu ist ein auf Künstlicher Intelligenz basierendes Konversionsmodul zwischen der Benutzerschnittstelle, welche nachfolgend auch als Benutzermodul bezeichnet wird, und dem eigentlichen Audiogerät vorgesehen. Dadurch wird es möglich, Benutzer mit einer übersichtlichen Anzahl von Parametern zu konfrontieren.

Im Benutzermodul können beliebige Parameter, insbesondere aber technische Parameter, und/oder musikalische Parameter (Tonhöhen, Lautheiten, Klangfarben, Notenwerte, Harmonien, Transpositionen, etc.) und/oder subjektive Parameter (traurig/fröhlich, träge/lebhaft, klassisch/progressiv, etc.) als Benutzerparameter verwendet werden. Darüber hinaus können an der Benutzerschnittstelle bevorzugt nur musikalische und/oder subjektive Parameter zur Auswahl bereitgestellt werden, so dass die Bedienung für technisch weniger versierte Benutzer deutlich erleichtert wird. Für den Betrieb werden dann M Benutzerparameter ausgewählt und diese M Benutzerparameter durch die Parameterkonversion in die N technischen Parameter überführt.

Da im Benutzermodul prinzipiell beliebige Parameter gewählt werden können, können auch exotische Parameter gewählt werden, die nicht aus dem Bereich der Musik oder Tonstudiotechnik stammen. Beispiele in diesem Zusammenhang könnten Parameter aus der Biologie oder Farbwerte aus einem RGB-Farbraum sein. So könnte im Benutzermodul eine bestimmten biologischen Parametern entsprechende Pflanze dargestellt werden, oder eine Farbe über RGB-Parameter, die ein Synästhetiker einem bestimmten Klang zuordnet. Welcher spezifische Klang aus dem Audiogerät letztendlich diesen Parametern zugeordnet wird, kann der Künstlichen Intelligenz des Konversionsmoduls antrainiert werden.

Durch die Erfindung können beliebige Benutzerparameter in beliebiger Anzahl zur Bedienung beliebiger Geräte verwendet werden. Hierbei können vorzugsweise wenige, aussagekräftige Parameter (ca. 10 bis 20) gewählt werden, so dass der Benutzer nicht mit zu vielen technischen Parametern (ca. 50 bis 150) überfrachtet wird. Daher ist gemäß einer bevorzugten Ausführungsform der Erfindung M < N.

Die M Parameter des Benutzermoduls können vom Hersteller des Synthesizers oder Effektgeräts vorgegeben werden. Sind die an die Parameterkonversion anzuschließenden Geräte weiterhin vorgegeben, kann das Training der Künstlichen Intelligenz vollständig werksseitig erfolgen, so dass der Benutzer hiermit nicht konfrontiert werden muss. Sind die an die Parameterkonversion anzuschließenden Geräte frei wählbar, muss die Künstliche Intelligenz für jedes Gerät benutzerseitig trainiert werden.

Dies lässt sich allerdings automatisieren, so dass der Benutzer keine Fachkenntnisse über die internen Abläufe des Trainings haben muss. Hierzu wird der von den N technischen Parametern aufgespannte N-dimensionale Raum abgetastet, wobei jeder Punkt im Raum einem Parametersatz entspricht. Der durch jeden Parametersatz im Audiogerät erzeugte Klang wird nun über Verfahren der Geräuschklassifikation einer Geräuschklasse zugeordnet, die wiederum fest mit einem Satz der werksseitig vorgegebenen M Benutzerparameter verknüpft ist. Dieser Satz an M Benutzerparametern kann anschließend im Training der Künstlichen Intelligenz mit dem dazugehörigen Parametersatz der N technischen Parameter verknüpft werden.

Die M Parameter des Benutzermoduls können grundsätzlich auch vom Benutzer selbst in Anzahl und Art gewählt und bezeichnet werden, anschließend muss die Künstliche Intelligenz jedoch mit den neu definierten Parametern erneut trainiert werden.

Denkbar wäre auch eine Benutzerschnittstelle, die in ihren Parametern grundsätzlich vom Hersteller festgelegt ist, aus der aber beliebige Parameter vom Benutzer angezeigt oder ausgeblendet werden können. Somit wäre ein Training der Künstlichen Intelligenz durch den Hersteller möglich, der Benutzer könnte sich die Benutzerschnittstelle trotzdem in weiten Bereichen selbst konfigurieren, ohne die Künstlichen Intelligenz neu trainieren zu müssen.

Insbesondere ermöglicht die vorliegende Erfindung auch Benutzermodule für unterschiedliche Geräte einheitlich vorzusehen, da mittels der erfindungsgemäß eingesetzten Künstlichen Intelligenz eine vereinheitlichte Parameterkonversion erfolgen kann. Mit anderen Worten können die Benutzerparameter für alle verwendeten Geräte gleich sein, so dass beispielsweise ein einziges Benutzermodul für alle verfügbaren Synthesizer verwendet werden kann. Gleiches gilt beispielsweise auch für Effektgeräte und weitere Geräte der Tonstudiotechnik. Erfindungsgemäß wird dann ein auf Künstlicher Intelligenz basierendes Konversionsmodul zur vereinheitlichenden Parameterkonversion verwendet.

Im Falle der eingangs beschriebenen Resynthese ist das Konversionsmodul dann zwischen dem Analysemodul und einem Resynthesemodul vorgesehen, so dass Benutzerparameter und zeitvariante Analyseparameter in das Konversionsmodul eingegeben werden. Hierdurch kann der Resyntheseprozess auf einfache Art und Weise durch einige wenige M Benutzerparameter (z. B. ca. 10 bis 20) in einem Benutzermodul beeinflusst werden, indem die Künstliche Intelligenz die M Benutzerparameter mit K zeitvarianten Analyseparametern zu N Resyntheseparametern verknüpft, und diese hierdurch transformiert. Durch die Erfindung werden bestehende Resythesealgorithmen mit wenigen, prinzipiell frei wählbaren Parametern steuerbar.

Dies gilt auch für die Synthese völlig neuer Klänge, ohne dass ein bekanntes Zielsignal reproduziert, d. h. resynthetisiert wird. Als Analysesignal (Eingangssignal) könnte beispielsweise ein Gitarrenklang dienen, aus dem das Analysemodul K zeitvariante Syntheseparameter ermittelt. Das Konversionsmodul kann dann anhand der K Syntheseparameter und der M Benutzerparameter eine entsprechende Synthese durchführen, welche sich der Künstlichen Intelligenz bedient. Dies ermöglicht den ursprünglichen Gitarrenklang beispielsweise, so zu verfremden, dass er eine Mischung aus Klavier und Flöte wird.

In der Praxis nehmen Systeme der Künstlichen Intelligenz (KI) einen oder mehrere Eingangsparameter auf und geben als Antwort einen oder mehrere Ausgabeparameter aus. Die Ein- und Ausgabe erfolgt in der Regel in Form von Vektoren. Jedes KI-System muss vor dem sinnvollen Gebrauch trainiert werden. Hierzu müssen zu einem Satz von Eingangsvektoren die jeweils korrekten Ausgangsvektoren bekannt sein. Der genaue Trainingsalgorithmus richtet sich nach dem jeweiligen Aufbau des KI-Systems. Nach erfolgreichem Training ist das KI-System grundsätzlich in der Lage auch für unbekannte Eingabevektoren die korrekten Ausgabevektoren zu erzeugen.

Die folgenden Techniken finden für die Realisierung von KI-Systeme Verwendung.

Symbolische KI

  • • In einer Beschreibungssprache (z. B. Prädikatenlogik oder Aussagenlogik) werden bekannte Eigenschaften des Systems mit bindenden Regeln beschrieben.
  • • Die Regeln werden im Training manuell oder über eine prädikative Programmiersprache wie Prolog so umgeformt, dass explizite Aussagen über den Umgang mit den Eingangsdaten entstehen.

Statistische KI

  • • Anstelle von bindenden Regeln einer Beschreibungssprache werden statistische Modelle (z. B. Gaussian-Mixture-Model, Hidden-Markov-Model, k-Nearest-Neighbor) verwendet.
  • • Die diskreten Wahrheitswerte einer Beschreibungssprache werden durch Wahrscheinlichkeiten ersetzt. Diese werden in der Trainingsphase durch die Beobachtung der statistischen Eigenschaften der Eingangsvektoren ermittelt.

Neuronale KI

  • • Als Modell von biologischen Neuronen werden aus einfachen mathematischen Operatoren künstliche Neuronen aufgebaut, die zu sehr großen Netzen verknüpft werden.
  • • Der Umgang mit eingegebenen Parametern wird abgebildet über die Verbindungsstärke der einzelnen Neuronen untereinander.
  • • Die hier verwendeten Standardstrukturen sind Feed-Forward, Hopfield und Winner-Takes-All, die größtenteils über das Back-Propagation-Verfahren trainiert werden.

Baukastensysteme für Synthesizer und Effektgeräte wie z. B. Reaktor®, SynthMaker® oder Tassman® können in ihrer Bedienung erheblich vereinfacht werden, indem jedes individuell erstellte Audiogerät über die Parameterkonversion der Erfindung vereinheitlicht wird. Gleiches gilt für die Steuerdaten in Sequencerprogrammen wie z. B. Logic®, Cubase® oder Live®.

Beliebige Klänge können durch die KI gestützte Resynthese der Erfindung in Modelle zerlegt werden und über einheitliche, einfache Nutzerparameter editiert und transformiert werden. Dies eröffnet Musikern den Bereich der komplexen mathematischen Transformationen, da die Bedienung ähnlich zu bekannten Samplern wie z. B. Kontakt® oder Logic EXS24® erfolgt, die Klangergebnisse der Erfindung jedoch weit über die der bekannten Sampler hinausgehen.

Die Erfindung wird nachfolgend unter Bezugnahme auf die Figuren an unterschiedlichen Ausführungsbeispielen näher erläutert.

1 zeigt das erfindungsgemäße Prinzip der Parameterkonversion.

2 zeigt eine Resynthesevorrichtung, welche auf der Parameterkonversion der 1 basiert.

Anhand von 1 wird das der Erfindung zugrundeliegende Prinzip der Parameterkonversion beschrieben. 1 zeigt beispielhaft ein Gerät der Tonstudiotechnik, beziehungsweise einen Teil davon, das aus drei Modulen aufgebaut ist. Dabei können die drei Module in unterschiedlicher Hardware realisiert sein oder in einer Hardware, in der die drei Module dann logisch voneinander getrennt sind.

Ein Benutzermodul (User Interface) 10 stellt einem Benutzer Benutzerparameter zur Auswahl, wovon der Benutzer M Parameter auswählt. Diese M Benutzerparameter werden dann einem Konversionsmodul 11 zugeführt, welches die M Benutzerparameter mittels Künstlicher Intelligenz auf N technische Parameter abbildet. Diese N technischen Parameter, deren Anzahl gemäß einer bevorzugten Ausführungsform der Erfindung deutlich höher ist als die Anzahl der M Benutzerparameter, werden in ein Audiogerät 12 eingegeben. Das Audiogerät verarbeitet Audiodaten mit den N technischen Parametern zu einem Audiosignal 13 und gibt dieses aus.

Die Audiodaten können bereits im Audiogerät 12 gespeichert sein. Es ist auch möglich, dass Audiosteuerdaten wie z. B. MIDI-Daten von einem oder mehreren externen Geräten (nicht gezeigt) wie z. B. MIDI-Keyboards in das Audiogerät 12 eingegeben werden, um die darin gespeicherten Audiodaten zu manipulieren. Ferner ist es möglich, dass auch die Audiodaten oder ein Teil der Audiodaten von einem oder mehreren externen Geräten (nicht gezeigt) wie z. B. anderen Synthesizern in das Audiogerät 12 eingegeben werden. Die sogenannten externen Geräte können im Audiogerät selbst enthalten sein und als logisch getrennte Module realisiert sein, wie beispielsweise bei Keyboard-Workstations, oder als eigenständige Hardwaregeräte vom Audiogerät getrennt sein. Das Audiogerät kann beispielsweise ein eigenständiger Rack-Synthesizer oder ein Software-Plugin sein.

Anhand von 2 wird eine Resynthesevorrichtung beschrieben, welche auf dem erfindungsgemäßen Prinzip der Parameterkonversion basiert. Die Resynthesevorrichtung kann beispielsweise Teil eines Geräts der Tonstudiotechnik oder als eigenständiges Gerät ausgebildet sein.

Die Resynthesevorrichtung zeigt ein Analysemodul 14, in welches ein Eingangssignal 15 eingegeben wird. Dieses Eingangssignal kann einkanalig (Mono), zweikanalig (Stereo) oder mehrkanalig (z. B. Dolby Surround®, DTS®) sein. Das Eingangssignal 15 wird von dem Analysemodul 14 analysiert, um daraus K zeitvariante Analyseparameter zu ermitteln. Beispielsweise wird das Eingangssignal einer speziellen Transformation unterworfen, woraus sich die K zeitvarianten Analyseparameter ergeben. Diese K zeitvarianten Analyseparameter werden zusätzlich zu den M Benutzerparametern aus dem Benutzermodul 10 in das Konversionsmodul 11 eingegeben. Das Konversionsmodul 11 bildet dann die M Benutzerparameter und die K Analyseparameter mittels Künstlicher Intelligenz auf N technische Parameter ab, welche in diesem speziellen Fall der Resynthese auch als Resyntheseparameter bezeichnet werden können. Diese N Resyntheseparameter werden dann in einem Resynthesemodul 16 dazu verwendet, um ein Ausgangssignal 17 zu erzeugen.

In den beiden beschriebenen Ausführungsbeispielen der Parameterkonversion und Resynthese wird jeweils ein Audiosignal 13, 17 ausgegeben. Dieses Ausgangssignal kann einkanalig (Mono), zweikanalig (Stereo) oder mehrkanalig (z. B. Dolby Surround®, DTS®) sein.