Urteil des BPatG München 4. Senat vom 26.05.2021, AZ 4 Ni 3/21 (EP)

BPatG München 4. Senat, Urteil vom 26.05.2021, AZ 4 Ni 3/21 (EP), ECLI:DE:BPatG:2021:260521U4Ni3.21EP.0

Tenor

In der Patentnichtigkeitssache

…

betreffend das europäische Patent 2 447 941

(DE 60 2006 048 398)

hat der 4. Senat (Nichtigkeitssenat) des Bundespatentgerichts auf Grund der mündlichen Verhandlung vom 26. Mai 2021 durch die Vorsitzende Richterin Grote- Bittner und die Richter Dipl.-Phys. Univ. Dipl.-Wirtsch.-Phys. Arnoldi, Dipl.- Ing. Matter, Dr. Söchtig und Dipl.-Phys. Univ. Dr. Haupt

für Recht erkannt:

I. Die Klage wird abgewiesen.

II. Die Klägerin hat die Kosten des Rechtsstreits zu tragen.

III. Das Urteil ist im Kostenpunkt gegen Sicherheitsleistung in Höhe von 120 % des jeweils zu vollstreckenden Betrages vorläufig vollstreckbar.

Tatbestand

Die Beklagte ist eingetragene Inhaberin des u. a. für die Bundesrepublik Deutschland erteilten europäischen Patents 2 447 941, das am 1. Dezember 2006 unter Inanspruchnahme der Priorität der japanischen Patentanmeldung 2006001845 vom 6. Januar 2006 angemeldet und dessen Erteilung am 23. März 2016 veröffentlicht worden ist. Im Patentregister des Deutschen Patent- und Markenamts wird das Streitpatent, das die Bezeichnung „Speech recognition apparatus, display method and display processing program thereof“ („Spracherkennungsvorrichtung, Anzeigeverfahren und Anzeigeverarbeitungsprogram dazu“)“ trägt, unter dem Aktenzeichen 60 2006 048 398 geführt.

Das Streitpatent, das von der Klägerin in der Klagschrift im Umfang seiner Ansprüche 1, 3 und 4 und zuletzt mit Schriftsatz vom 29. Januar 2021 in vollem Umfang angegriffen wird, umfasst in seiner erteilten Fassung 4 Ansprüche mit dem unabhängigen Vorrichtungsanspruch 1, dem auf diesen rückbezogenen Unteranspruch 2, dem Verfahrensanspruch 3 und dem auf diesen rückbezogenen, auf ein Programm gerichteten Anspruch 4.

Die Klägerin macht geltend und begründet dies, der Gegenstand des Streitpatents sei unzulässig erweitert und nicht patentfähig, nämlich weder neu noch erfinderisch.

Die Beklagte verteidigt das Streitpatent in der erteilten Fassung sowie mit dem Hilfsantrag isoliert den Anspruch 2.

Der nach Merkmalen gegliederte Anspruch 1 lautet in der Verfahrenssprache Englisch bzw. in einer angepassten Übersetzung in die deutsche Sprache:

1 A speech recognition apparatus, comprising:

Spracherkennungsvorrichtung, die Folgendes umfasst:

1.1 recognition unit (114) for carrying out a speech recognition process of recognizing the speech of the user,

eine Erkennungseinheit (114) zum Ausführen eines Spracherkennungsprozesses des Erkennens der Sprache des Nutzers,

1.1.2 instruction means for receiving speech recognition start instructions from a user, and instructing the recognition unit (114) to start the speech recognition process,

ein Anweisungsmittel zum Empfangen von Spracherkennungs-Startanweisungen von einem Nutzer und zum Anweisen der Erkennungseinheit (114), den Spracherkennungsprozess zu beginnen,

1.1.3 display means (110) for displaying at least one of recognizable speeches of the recognition unit (114),

ein Anzeigemittel (110) zum Anzeigen mindestens eines von erkennbaren Sprachtexten der Erkennungseinheit (114),

1.1.4 and a sound processing unit (107),

und eine Tonverarbeitungseinheit (107),

1.2 wherein the speech recognition apparatus further comprises control means (112),

wobei die Spracherkennungsvorrichtung des Weiteren ein Steuerungsmittel (112) umfasst,

1.3 wherein a set-up period of time is necessary from a time when the recognition unit (114) receives instructions of start of the speech recognition process from the instruction means to a time when the recognition unit (114) is ready to carry out the speech recognition process,

wobei ein Einstellzeitraum ab einer Zeit, zu der die Erkennungseinheit (114) Anweisungen zum Beginnen des Spracherkennungsprozesses von dem Anweisungsmittel empfängt, bis zu einer Zeit, wo die Erkennungseinheit (114) zum Ausführen des Spracherkennungsprozesses bereit ist, notwendig ist,

1.3.1 wherein the speech recognition process is started after the set-up operation has been completed, and

wobei der Spracherkennungsprozess begonnen wird, nachdem der Einstellvorgang vollendet wurde, und

1.4 wherein the control means (112), is adapted

wobei das Steuerungsmittel (112) dafür eingerichtet ist,

1.4.1 to control the display means (110)

das Anzeigemittel (110) zu veranlassen,

1.4.1a to start the display of a prohibition mark (3) indicative of prohibition of speech

das Anzeigen eines Verbotszeichens (3) zu beginnen, welches das Verbot eines Sprachtextes anzeigt,

1.4.1b and the display of the at least one of recognizable speeches

und das Anzeigen des mindestens einen von erkennbaren Sprachtexten

1.4.1c and the display of a guidance message (4),

und das Anzeigen einer Anleitungsnachricht (4) zu beginnen,

1.4.2 and to control the sound processing unit (107) to output the same content as the guidance message (4) as sound during the set-up period of time,

und die Tonverarbeitungseinheit (107) zu veranlassen, den gleichen Inhalt wie die Anleitungsnachricht (4) während des Einstellzeitraums als Ton auszugeben,

1.4.3 wherein the prohibition mark (3) is erased from the display means (110) after the speech recognition process has started.

wobei das Verbotszeichen (3) von dem Anzeigemittel (110) gelöscht wird, nachdem der Spracherkennungsprozess gestartet wurde.

Wegen des Wortlauts des Ansprüche 2 bis 4 wird auf die Streitpatentschrift verwiesen.

Im Hinblick auf die geltend gemachte fehlende Patentfähigkeit stützt sich die Klägerin insbesondere auf folgende Dokumente

NK 5 US 6,505,159 B1

NK 6 US 5,864,815 A

NK 7 US 2003/0095212 A1

sowie auf den in der mündlichen Verhandlung vom 26. Mai 2021 eingereichten Auszug des Benutzerhandbuchs

NK 14 Dragon NaturallySpeaking 8, User`s Guide, ScanSoft, February 2005. Seiten iii bis vi, 1-24 und 209 bis 215

und meint, das Streitpatent sei schon nicht neu gegenüber der Druckschrift NK 5, jedenfalls beruhe es ausgehend vom Stand der Technik nach jeder der Schriften NK 5, NK 6 oder NK 7 nicht auf einer erfinderischen Tätigkeit.

Die Klägerin ist der Auffassung, dass die NK 5 alle Merkmale der unabhängigen Ansprüche des Streitpatents offenbare. Die NK 5 lehre, dass zuerst, nämlich im Schritt 104, das „Activation Signal“ an den Computer 12 gesendet werde. Anschließend werde in Schritt 106 das „Computer Waiting Signal“ gesendet. Hieraus folge, dass sich der Einstellungszeitraum vom Schritt 104 bis zum Schritt 14 des Ablaufdiagramms der Figur 4 erstrecke, so dass das „Computer Waiting Signal“ innerhalb des Einstellzeitraums gesendet werde. Die Anzeige des „Computer Waiting Signals“ als ein Icon stelle wiederum die Anzeige eines Verbotszeichens dar. Die NK 5 offenbare darüber hinaus, dass das „Computer Waiting Signal“ dem Nutzer auch graphisch als Text auf dem Bildschirm angezeigt werden könne, und dass als „Computer Waiting Signal“ zusätzlich oder alternativ auch Symbole verwendet werden könnten, die auf dem Bildschirm angezeigt werden könnten. Ferner offenbare die NK 5 auch das Merkmal, dass während des Einstellzeitraums ein Satz zulässiger Sprachbefehle bereitgestellt werde. Dass der Satz der zulässigen Sprachbefehle dem Nutzer auch auf dem Bildschirm angezeigt werde, entnehme der Fachmann jedenfalls der Offenbarung in Spalte 7, Zeile 30 ff. der NK 5, wonach sämtliche Signale zusätzlich oder alternativ auch auf dem Bildschirm der Eingabevorrichtung angezeigt werden könnten. Damit sei der Gegenstand der unabhängigen Ansprüche des Streitpatents nicht neu.

Selbst wenn man die Neuheitsschädlichkeit der NK 5 verneinen wollte, würde es dem Streitpatent zumindest aber an der erfinderischen Tätigkeit fehlen, denn die Lehre des Streitpatents sei ausgehend von der NK 5 jedenfalls nahegelegt. Die NK 5 unterscheide sich vom Anspruch 1 des Streitpatents allenfalls an zwei Stellen: (1) Das „Computer-Warte-Signal“ werde zwar als hörbarer Ton und Audionachrichtensignal „Bitte warten“ ausgegeben, es werde aber nicht explizit beschrieben, dass das „Computer-Warte-Signal“, auch über den von der NK 5 offenbarten Bildschirm ausgegeben werde, also etwa durch eine Anzeige von „Bitte warten“ auf dem Bildschirm, sowie (2), es werde zwar ein Satz zulässiger Sprachbefehle bereitgestellt, die NK 5 beschreibe aber nicht ausdrücklich, dass dieser auch dem Benutzer über den von der NK 5 offenbarten Bildschirm angezeigt würde.

Das Unterscheidungsmerkmal 1 betreffe lediglich den Inhalt der über den Bildschirm wiedergegebenen Informationen. Gemäß der ständigen Rechtsprechung des BGH seien bei der Prüfung der erfinderischen Tätigkeit jedoch nur diejenigen Anweisungen zu berücksichtigen, die die Lösung des technischen Problems mit technischen Mitteln bestimmten oder zumindest beeinflussten, was bei der bloßen Wiedergabe von Informationen – wie vorliegend – hingegen nicht der Fall sei. Daher könne das Unterscheidungsmerkmal 1 nach der Rechtsprechung des BGH gerade keine erfinderische Tätigkeit begründen, allenfalls sei Unterscheidungsmerkmal 2 bei der Beurteilung der erfinderischen Tätigkeit zu berücksichtigen. Die Anzeige zumindest eines der erkennbaren Sprachbefehle auf dem Display erlaube es dem Benutzer zu erkennen, welche Sprachbefehle er verwenden könne. Die Aufgabe sei daher, wie dem Benutzer vermittelt werden könne, welche Sprachbefehle er verwenden könne. Ausgehend von der NK 5 werde der Fachmann dabei auf die NK 6 stoßen.

Gegenstand der NK 6 seien Computersysteme und Spracherkennung in Computersystemen. Insbesondere lehre die NK 6, dass eine Liste erlaubter Sprachbefehle auf den Sprachbefehl „Was kann ich sagen“ hin angezeigt werde. In der Figur 12 der NK 6 werde eine beispielhafte Liste der Sprachbefehle gezeigt. Ausgehend von der NK 5 habe der Fachmann also eine klare Veranlassung, die NK 6 zur Lösung heranzuziehen. Denn die NK 6 betreffe insbesondere die Situation, in der der Benutzer sich frage, welche Sprachbefehle er sagen könne. In gerade dieser Situation biete die NK 6 eine praktische Lösung, die der Fachmann mit fachüblichen Mitteln in der Vorrichtung der NK 5 zu implementieren verstehe.

Auch der Umstand, dass das Streitpatent lehre, dass während des Einstellzeitraums sowohl ein Verbotszeichen, als auch mindestens eines von erkennungsfähigen (Sprach-)Wörtern angezeigt würden, vermöge eine erfinderische Tätigkeit nicht zu begründen. Hierbei handele es sich nicht um eine besondere unübliche, weil in gewisser Weise widersprüchliche, Darstellung – vielmehr sollte diese gemeinsame Darstellung es dem Benutzer lediglich ermöglichen, sich bereits während des Einstellzeitraums auf die nachfolgende Spracheingabe vorzubereiten, was nachfolgende Verzögerungen vermeiden würde. Entsprechende vergleichbare Darstellungen seien bereits vor dem Prioritätszeitpunkt des Streitpatents üblich gewesen, was beispielsweise die NK 14 (Seite 21 unten) belege.

Dem Streitpatent fehle es zudem an einer erfinderischen Tätigkeit ausgehend von der NK 6. Der Gegenstand des Anspruchs 1 des Streitpatents unterscheide sich von der Lehre der NK 6 lediglich dadurch, dass (1) das Computersystem der NK 6 nicht explizit eine Tonverarbeitungseinheit zur Ausgabe des gleichen Inhalts wie der Anleitungsnachricht aufweise sowie (2) der Nutzer zwar grafisch durch ein Symbol und eine Anleitungsnachricht in Textform über den Zustand des Computersystems informiert werde, jedoch letztere Information nicht auch noch zusätzlich als Ton ausgegeben werde. Das Unterscheidungsmerkmal 1 sei naheliegend. Wenn der Fachmann ausgehend von der NK 6 nach einer Lösung suche, um die Aufnahme der durch Symbol und Anleitungsnachricht ausgegebenen Zustandsinformation zu verbessern, so werde er sich fachüblicher Maßnahmen bedienen. Dazu gehöre zweifellos auch die Verwendung eines Lautsprechers zur Sprachausgabe. Das Unterscheidungsmerkmal 2 betreffe wiederum lediglich den Inhalt der über einen Lautsprecher wiedergegebenen Informationen. Dieser könne aber – wie bereits ausgeführt – nach der Rechtsprechung des Bundesgerichtshofs keine erfinderische Tätigkeit begründen.

Dem Streitpatent fehle es an einer erfinderischen Tätigkeit auch ausgehend von der NK 7. Der Gegenstand des Anspruchs 1 des Streitpatents unterscheide sich von der Lehre der NK 7 lediglich dadurch, dass der Benutzer zwar grafisch durch Zeichen und eine Anleitungsnachricht in Textform über den Zustand des Sprachfernbedienungssystems informiert werde, letztere Information werde aber nicht auch noch zusätzlich als Ton über den Fernseherlautsprecher ausgegeben. Allein dies könne keine erfinderische Tätigkeit begründen. Auch insoweit fehle es an der erforderlichen Technizität im oben ausgeführten Sinne.

Selbst wenn man das Unterscheidungsmerkmal als ein technisches Mittel ansehen sollte, so werde es jedenfalls durch die NK 7 selbst nahegelegt. Bei der technischen Wirkung handele es sich in diesem Fall um die verbesserte Aufnahme des Zustands des Sprachfernbedienungssystems durch den Nutzer. Hierauf basierend habe der Fachmann Veranlassung gehabt, die Anleitungsnachricht zusätzlich als Ton auszugeben, denn die NK 7 betreffe gerade die Aufgabe, die Bedienung für Benutzer gehobenen Alters zu vereinfachen.

Aus vorgenannten Gründen seien auch die Ansprüche 3 und 4 des Streitpatents nicht patentfähig.

Die Ansprüche des Streitpatents seien im Laufe des Erteilungsverfahrens aufgrund zahlreicher Mängel sehr umfangreich geändert worden. Der Gegenstand in der erteilten Form sei aber nicht in der Anmeldung und der früheren Anmeldung offenbart, weshalb das Streitpatent aufgrund unzulässiger Erweiterung nichtig sei. Hierbei weist die Klägerin auf folgende Dokumente hin:

NK 1b Anmeldeunterlagen der europäischen Teilanmeldung 12152804.6

NK 8 Schriftverkehr der ehemaligen Anmelderin mit dem Europäischen Patentamt im Anmeldeverfahren

NK 9 EP 1 970 896 A1 (Stammanmeldung)

NK 9a englischsprachige Übersetzung der früheren PCT-Anmeldung PCT/JP2006/324064

Das Merkmal 1.4.1 sei zum Großteil mit der Eingabe der Anmelderin vom 29. Oktober 2012 aus der Beschreibung in den Anspruch 1 aufgenommen worden. Die ehemalige Anmelderin habe bezüglich der Offenbarung auf die Absätze 0053 und 0055 der Veröffentlichung der Anmeldung (diese seien identisch mit den Absätzen 0055 und 0057 des Streitpatents) verwiesen (vgl. Anlage NK 8). Weder in den angeführten Stellen der Beschreibung noch an anderer Stelle der ursprünglichen Anmeldeunterlagen finde sich jedoch eine Offenbarung für ein Verbotszeichen, welches in beliebiger Position angezeigt werde.

Die ursprünglichen Anmeldeunterlagen stützten ferner auch an keiner Stelle ein Löschen oder ein Austauschen des Verbotszeichens während des Einstellzeitraums.

Bereits aus den Figuren 1A und 1B der ursprünglichen Anmeldeunterlagen ergebe sich eindeutig, dass während des gesamten Einstellzeitraums ein einziges Verbotszeichen angezeigt werden müsse. Dies ergebe sich ebenfalls aus dem Ablaufdiagramm in Figur 3 und der dazugehörigen Beschreibung. Die Anzeige des Verbotszeichens beginne mit der Spracherkennungs-Startanweisung durch den Nutzer. Nach Abschluss des Einstelleitraums werde das Verbotszeichen von der Anzeige gelöscht.

Das Streitpatent sei auch gegenüber der Stammanmeldung unzulässig erweitert. Die Beschreibung der Stammanmeldung sei im Wesentlichen identisch mit der Beschreibung der Ursprungsanmeldung. Das Streitpatent sei folglich auch gegenüber der Stammanmeldung unzulässig erweitert und daher für nichtig zu erklären.

Auch der Unteranspruch 2 des Streitpatents sei nicht patentfähig. Anspruch 2 lehre, dass nach Verstreichen des Einstellungszeitraums zwar das Verbotszeichen gelöscht werde, nicht aber der mindestens eine erkennbare Sprachtext. Dies ergebe sich jedoch in naheliegender Weise aus der NK 6. So lehre die NK 6 in Figur 12, dass die Anzeige der erkennbaren Sprachbefehle im Fenster „Was kann ich sagen?“ gleichzeitig mit dem Erkennungszeichen 78 angezeigt werde, das ein korrektes Erkennen anzeige. Da ein korrektes Erkennen voraussetzte, dass auch eine technisch bedingte Einstellung abgeschlossen sei, sei also das vom Anspruch 2 gezeigte Merkmal offenbart.

Der vormals zuständige 6. Senat hat den Parteien in einem qualifizierten Hinweis vom 9. Dezember 2020 seine vorläufige Auffassung zur Sach- und Rechtslage mitgeteilt und den Parteien eine abschließende Frist bis 12. März 2021 gesetzt. Im Termin am 26. Mai 2021 hat der Senat den Parteien einen weiteren rechtlichen Hinweis erteilt.

Die Klägerin beantragt,

das europäische Patent 2 447 941 mit Wirkung für das Hoheitsgebiet der Bundesrepublik Deutschland für nichtig zu erklären.

Die Beklagte beantragt,

die Klage abzuweisen,

hilfsweise die Klage mit der Maßgabe abzuweisen, dass das Streitpatent mit dem Anspruch 2 aufrecht erhalten bleibt.

Sie rügt Verspätung der NK 14, die daher zurückzuweisen sei, und tritt der Auffassung der Klägerin in allen Punkten entgegen und verteidigt das Streitpatent in der erteilten Fassung sowie hilfsweise allein den Anspruch 2.

Das Streitpatent sei neu gegenüber den NK 5. Bei der NK 5 werde das Computer Waiting Signal nicht ausgegeben, nachdem der Computer 12 das Activation Signal empfangen habe, sondern unabhängig von einem Empfang durch den Computer 12 oder davor. Darüber hinaus offenbare die NK 5 auch nicht die konkreten Ausgestaltungen der verschiedenen Ausgaben, z. B. kein Verbotszeichen und keine erkennbaren Sprachtexte.

Es fehle dem Streitpatent auch nicht an der erfinderischen Tätigkeit ausgehend von der NK 5. Die in der NK 5 beschriebene Spracherkennungsvorrichtung sei nämlich nicht derart eingerichtet, dass die Ausgabe des Computer Waiting Signals während des Einstellzeitraums begonnen werde. Entsprechendes gelte für die Ausgabe von erkennbaren Sprachtexten und/oder einer Anleitungsnachricht und/oder einer entsprechenden Tonausgabe. Diese Unterscheidungsmerkmale brächten konstruktive und technische Unterschiede zwischen der beanspruchten Erfindung und der NK 5 zum Ausdruck, die sich insbesondere im zeitlichen Ablauf der Ausgabevorgänge (Anzeige, Ton) widerspiegelten.

Die Unterscheidungsmerkmale erschöpften sich auch nicht in einer bloßen Wiedergabe einer Information und zielten auch nicht nur darauf ab, dem Benutzer einen bestimmten Inhalt zu vermitteln oder durch den Inhalt die Bedienbarkeit zu verbessern. Im Hinblick auf die technischen Unterscheidungsmerkmale sei es vielmehr Aufgabe des Streitpatents, den Benutzer in seiner Interaktion mit der Spracherkennungsvorrichtung derart zu führen, dass Eingabefehler und unnötige Verzögerungen wegen des notwendigen Einstellprozesses minimiert würden.

Ein Merkmal könne nicht bereits schon deswegen bei der Beurteilung der erfinderischen Tätigkeit außer Acht gelassen werden, weil es die Darstellung von Information betreffe. Diese Folgerung stimme insbesondere dann nicht, wenn ein derartiges Merkmal zur Lösung eines technischen Problems mit technischen Mitteln beitrage, wie dies vorliegend der Fall sei.

Die Unterscheidungsmerkmale bewirkten im vorliegenden Fall jedenfalls eine geführte Mensch-Maschine-Interaktion und bedienten sich der u. a. visuellen Anzeige der technischen Bedingungen der Maschine und trügen somit zu einer technischen Lösung eines technischen Problems bei.

Entgegen der Auffassung der Klägerin sei eine Darstellung dergestalt, dass neben einem Verbotszeichen zugleich weitere Informationen hinsichtlich eines Zeitraums nach Aufhebung des „Verbots“ angezeigt werden, zum Anmeldezeitpunkt nicht üblich gewesen. Entsprechendes folge insbesondere auch nicht aus der NK 14. Bei vorgenannter Darstellung handele es sich vielmehr um ein besonderes Charakteristikum des Streitpatents.

Ausgehend von der NK 5 sei der Gegenstand des Anspruchs 1 des Streitpatents aber auch nicht in Kombination mit der NK 6 nahegelegt.

Im Kontext der Figur 12 der NK 6 sei zwar beschrieben, dass ein Fenster 82 mit zulässigen Sprachanweisungen (global voice commands) angezeigt werden könne. Der Fachmann würde aber die in der NK 6 beschriebene Anzeige nicht auf die NK 5 übertragen, um die technische Aufgabe zu lösen, den Benutzer in seiner Interaktion mit der Spracherkennungsvorrichtung derart zu führen, dass Eingabefehler und unnötige Verzögerungen wegen des notwendigen Einstellprozesses minimiert würden.

Die NK 6 beschreibe nämlich keine mit Merkmal 1.4.1b vergleichbare Anzeige der erkennbaren Sprachtexte. Die NK 6 motiviere vielmehr dazu, das Fenster 82 vor einer erneuten Spracherkennung wieder zu schließen (um nicht andere Fenster zu verdecken). Das Fenster 82 würde also nicht während eines folgenden Einstellzeitraums (der bei NK 6 ohnehin nicht relevant sei) geöffnet bleiben.

Zudem spreche die NK 6 an keiner Stelle einen Einstellprozess bzw. Einstellzeitraum an. Sofern man annehme, dass beim Umschalten von dem „non-listening state“ auf den „listening state“ Verzögerungen aufträten, so erfolgten diese aus fachmännischer Sicht auf Zeitskalen, die für die vorliegende Erfindung irrelevant seien. Das genannte Problem, dass aufgrund des Einstellprozesses Eingabefehler oder Verzögerungen auftreten könnten, werde insofern von der NK 6 überhaupt nicht adressiert und der Fachmann würde die NK 6 daher nicht zur Lösung der gestellten Aufgabe in Betracht ziehen.

Da die NK 6 nicht die Unterscheidungsmerkmale zur NK 5 zeige, würde auch eine Kombination von NK 5 und NK 6 nicht zu einem Gegenstand mit den Merkmalen des Anspruchs 1 führen. Eine Kombination von NK 5 und NK 6 würde auch nicht die Aufgabe lösen, den Benutzer in seiner Interaktion mit der Spracherkennungsvorrichtung derart zu führen, dass Eingabefehler und unnötige Verzögerungen wegen des notwendigen Einstellprozesses minimiert würden. Der Gegenstand des Anspruchs 1 und entsprechend die Ansprüche 3 und 4 seien daher durch eine Kombination von NK 5 und NK 6 nicht nahegelegt.

Auch ausgehend von der NK 7 sei der Gegenstand des Anspruchs 1 nicht nahegelegt. Von der NK 7 unterscheide sich der Gegenstand des Anspruchs 1 durch die Merkmale 1.4.1.a bis 1.4.1.c, 1.4.2 und 1.4.3. Die Beurteilung der erfinderischen Tätigkeit führe daher zu einem ähnlichen Ergebnis, wie ausgehend von der NK 5.

Die vorgenannten Unterscheidungsmerkmale definierten technische Aspekte, wie insbesondere den zeitlichen Ablauf von Vorgängen (Anzeige während der „set-up period of time“ und Löschen des Verbotszeichens nach der „set-up period of time“) und lieferten schon allein deshalb einen Beitrag zur Lösung eines technischen Problems mit technischen Mitteln.

Der Gegenstand des Anspruchs 1 (und entsprechend die Gegenstände der Ansprüche 3 und 4) beruhe daher auf einer erfinderischen Tätigkeit im Hinblick auf die NK 7.

Da der Anspruch 2 von Anspruch 1 abhängig sei, werde die Patentfähigkeit von Anspruch 2 aus den vorstehend genannten Gründen ebenfalls nicht in Frage gestellt.

Entgegen der Auffassung der Klägerin sei der Anspruch 1 im Laufe des Erteilungsverfahrens auch nicht unzulässig geändert worden, insbesondere betreffend die Position des „prohibition mark“ und die Dauer der Anzeige des „prohibition mark“.

Die Anzeige gemäß Merkmal 1.4.1.a sei jedenfalls in Absatz 0052 i. A. 0053 der veröffentlichten Fassung der ursprünglichen Anmeldung unmittelbar und eindeutig offenbart. Dort gehe es darum, dass die Anzeige des „prohibition mark“ während der „set-up period of time“ begonnen werde, ohne dass die Position der Anzeige näher definiert werde. Bei der vorliegenden Stammanmeldung wiesen gerade nicht sämtliche Ausführungsbeispiele das Merkmal auf, dass die Position des Verbotszeichens festgelegt sei. So offenbare die Stammanmeldung eben auch Ausführungsformen, bei denen das Verbotszeichen die Liste 1 nicht überlagert.

Es sei auch gemäß der in der ursprünglichen Anmeldung dargestellten technischen Lehre nicht zwingend erforderlich, dass die Anzeige des „prohibition mark“ während der gesamten „set-up period of time“ erfolge. Unabhängig davon offenbarten die ursprünglichen Anmeldungsunterlagen sehr wohl, dass die Position des Verbotszeichens gewechselt werde, d. h. ein Löschen oder ein Austauschen des Verbotszeichens erfolgen könne, bevor die Spracherkennung ausgeführt werde.

Wegen der weiteren Einzelheiten des Vorbringens der Parteien wird auf die Schriftsätze der Parteien nebst Anlagen und den weiteren Inhalt der Akte Bezug genommen.

Entscheidungsgründe

Die auf unzulässige Erweiterung sowie mangelnde Patentfähigkeit (Art. 138 Abs. 1 Buchstaben a), c) i. V. m. Art. 54, 56 EPÜ i. V. m. Art. II § 6 Abs. 1 S. 1 Nr. 1, 3 IntPatÜG) des Streitpatents gestützte Klage ist zulässig aber unbegründet. Der Gegenstand des Streitpatents in der erteilten Fassung, der nicht unzulässig erweitert ist, erweist sich als neu und auf erfinderischer Tätigkeit beruhend, mithin auch als patentfähig und damit rechtsbeständig. Auf den Hilfsantrag kam es daher nicht mehr an.

Soweit die Klägerin die Nichtigkeitsklage bei gleichbleibendem Nichtigkeitsgrund mit Schriftsatz vom 29. Januar 2021 um den Anspruch 2 erweitert hat, handelt es sich hierbei um eine zulässige Klageerweiterung gemäß § 99 Abs. 1 PatG i. V. m. § 264 Nr. 2 ZPO. Klageerweiterungen sind bis zum rechtskräftigen Abschluss des Verfahrens möglich (vgl. MüKo ZPO, 6. Auflage, 2020, § 264, Rdnr. 15).

I.

1. Das Streitpatent betrifft eine Spracherkennungsvorrichtung, ein Anzeigeverfahren und ein Anzeigeverarbeitungsprogramm.

Nach den sinngemäßen Angaben in der Streitpatentschrift sei aus dem Stand der Technik eine Spracherkennungsvorrichtung bekannt, die abhängig vom Zustand der Vorrichtung eine Liste mit den jeweils erkennbaren Sprachtexten auf einem Display anzeige, so dass ein Nutzer problemlos einen der Texte aus der Liste auswählen und sprechen könne (Absatz 0004).

Um während einer normalen Unterhaltung eine Spracherkennung und dadurch unabsichtlich ausgelöste Befehle zu vermeiden, würden zudem einige Spracherkennungsvorrichtungen einen Spracherkennungsprozess nur dann ausführen, nachdem der Benutzer eine vorbestimmte Bedienungshandlung vorgenommen habe, etwa das Drücken einer Taste. Zwischen dem Tastendruck und der Bereitschaft zur Spracherkennung vergehe noch eine bestimmte Zeitspanne, in der Vorbereitungs- und Initialisierungsprozesse o. ä. stattfänden. Daher könne in nachteiliger Weise ein Teil der Sprache nicht richtig empfangen werden, wenn ein ungeübter Nutzer sofort nach dem Drücken der Sprechtaste zu sprechen beginne. Dementsprechend sei es in der Vergangenheit üblich gewesen, den Nutzer durch ein akustisches Signal über den Zeitpunkt zu informieren, zu dem mit der Spracheingabe begonnen werden solle (Absätze 0005-0007). Die Schrift JP 2003-177789 offenbare die Anzeige eines Bildes mit einer Bewegung in einem vorbestimmten Displaybereich, um den Nutzer intuitiv über den Zeitpunkt zu informieren, ab dem eine Spracheingabe möglich ist (Absätze 0008, 0009).

Ohne Hinweis auf konkreten Stand der Technik führt das Streitpatent aus, dass es einem ungeübten Benutzer bei Konzentration auf eine Spracheingabeliste schwerfalle, ein den Zeitpunkt der Spracheingabe signalisierendes Bewegtbild in einem bestimmten Displaybereich zu erkennen, um die Spracheingabe zum richtigen Zeitpunkt zu starten (Absatz 0010).

In Anbetracht dieses Problems sei es eine Aufgabe der Erfindung, eine Spracherkennungsvorrichtung, ein Anzeigeverfahren und ein Anzeigeverarbeitungsprogramm bereitzustellen, mittels derer der Nutzer leicht erkennen könne, wann eine Spracheingabe erfolgen soll, sogar während er eine auf einem Bildschirm des Geräts mit Spracherkennungsvorrichtung angezeigte Liste der möglichen Spracheingaben beobachte (Absatz 0011).

Diese Aufgabe soll u. a. mit einer Spracherkennungsvorrichtung nach Anspruch 1 gelöst werden

2. Als zuständigen Fachmann sieht der Senat einen Ingenieur der Elektrotechnik oder Informatik mit Erfahrung in der Entwicklung und Implementierung von Spracherkennungssystemen.

3. Mehrere Angaben im Anspruch 1 bedürfen näherer Betrachtung:

a) Die Spracherkennungseinheit ist nicht ständig einsatzbereit. Vielmehr benötigt sie einen
Einstellzeitraum (set-up period of time, Merkmal 1.3), um von einem ersten Zustand der Vorrichtung, dem Empfang von Anweisungen in der Erkennungseinheit zum Beginnen des Spracherkennungsprozesses, zu einem zweiten Zustand der Vorrichtung zu gelangen, in dem die Erkennungseinheit zum Ausführen des Spracherkennungsprozesses bereit ist. Der Anspruch 1 nennt zudem einen dritten Zustand der Vorrichtung, den Beginn bzw. Start des Spracherkennungsprozesses (Merkmale 1.3.1, 1.4.3), welcher unmittelbar nach dem Ende des Einstellzeitraums oder später erreicht wird.

100

Welche Verarbeitungsschritte die Erkennungseinheit während des Einstellzeitraums konkret ausführt, ist nicht vorgegeben. Der Einstellzeitraum ist insbesondere nicht durch die Verarbeitungsschritte beschränkt, die in der Streitpatentschrift als Stand der Technik angegeben werden (Absatz 0006):

101

– Auslesen eines Programms für einen Spracherkennungsprozess von einem Aufzeichnungsmedium oder dergleichen,

102

– Reservieren eines Bereichs, in dem eine empfangene Sprache als Sprachinformation gespeichert werden soll.

103

Das Streitpatent liefert keine konkreten Zahlenwerte für die
Dauer des Einstellzeitraums. Dieser ist zumindest so lang, dass eine verfrühte Spracheingabe des Benutzers zu besorgen ist. Zudem dürfte die Anzeige des Verbotszeichens nur dann sinnvoll sein, wenn es vom Benutzer wahrgenommen werden kann. Damit dürfte eine typische Dauer des Einstellzeitraums im Bereich einiger Sekunden liegen.

104

b) Die Spracherkennungsvorrichtung soll auf einem Anzeigemittel das
Anzeigen von drei verschiedenen Elementen
beginnen, eines Verbotszeichens, mindestens eines von erkennbaren Sprachtexten und einer Anleitungsnachricht (Merkmale 1.4.1 bis 1.4.1c).

105

Diese Anweisungen bezieht der Fachmann auf nicht näher bestimmte Zeitpunkte nachdem die Erkennungseinheit Anweisungen zum Beginnen des Spracherkennungsprozesses von dem Anweisungsmittel empfangen hat und auf nicht näher bestimmte Positionen auf dem Anzeigemittel, d. h. irgendwann nach dem Beginn des Einstellzeitraums ist das Anzeigen eines Verbotszeichens, des mindestens einen von erkennbaren Sprachtexten und einer Anleitungsnachricht an jeweils nicht näher bestimmten Positionen auf dem Anzeigemittel zu beginnen. Denn keine Stelle der Streitpatentschrift gibt Anlass zu der Annahme, dass mit diesen Anzeigen bereits begonnen werden soll, bevor der Nutzer Anweisungen zum Beginnen des Spracherkennungsprozesses gegeben hat (vgl. Merkmale 1.1.2, 1.3), auch nicht die in Absatz 0011 angegebene Aufgabe der Erfindung, so dass der Fachmann eine solche Ausgestaltung auch nicht mitliest. Auf Grund der Anweisungen im Anspruch 1, Merkmale 1.4.2 und 1.4.3, im Unteranspruch 2 und in der Beschreibung, Absatz 0016, Zeilen 9-14 schließt der Fachmann zudem aus, dass die genannten Anzeigen erst nach dem Einstellzeitraum beginnen.

106

Zumindest während eines Teils des Einstellzeitraums werden somit Verbotszeichen, erkennbarer Sprachtext und Anleitungsnachricht zugleich auf dem Anzeigemittel dargestellt.

107

Die Position des Verbotszeichens, des Sprachtextes und der Anleitungsnachricht auf dem Anzeigemittel lässt der Anspruch 1 offen. Er umfasst sowohl die Variante, bei der das Verbotszeichen den angezeigten Sprachtext zu einem bestimmten Zeitpunkt überlagert (Figur 1A), als auch die Variante, dass das Verbotszeichen den angezeigten Sprachtext nicht überlagert (Figur 4B). Die Streitpatentschrift beschreibt hierzu eine erste, nicht patentbeschränkende Ausführungsform (Absatz 0017 ff., Figuren 1A, 1B) und eine zweite, ebenfalls nicht patentbeschränkende Ausführungsform (Absatz 0064 ff., Figuren 4A, 4B, 5) der Anzeigen eines Navigationssystems (Absatz 0015:
a navigation apparatus which guides a car along a route). Bei beiden Ausführungsformen werden,
unmittelbar (immediately) nachdem ein Nutzer eine Sprachtaste gedrückt hat, eine Liste 1 von Sprachtexten, die von einem Verbotszeichen 3 überlagert ist, und eine Anleitungsnachricht 4 angezeigt (Absätze 0017, 0018 und Figur 1A bzw. Absatz 0070 und Figur 4A). In der zweiten Ausführungsform wird zudem, beispielsweise während des Einstellzeitraums, die Position des Verbotszeichens auf dem Bildschirm geändert (Absätze 0071, 0072, Figur 4A i. V. m. 4B).

Abbildung in Originalgröße in neuem Fenster öffnen

108

Streitpatentschrift, Figuren 1A und 4B mit Verbotszeichen 3, Anleitungsnachricht 4 und einer Liste 1 erkennbarer Sprachtexte

109

c) Ein
Verbotszeichen (prohibition mark, Merkmal 1.4.1a) ist ein grafisches Sinnbild, welches das Verbot eines Sprachtextes indiziert. Eine Textnachricht stellt kein Verbotszeichen im Sinne des Streitpatents dar. Denn das Streitpatent unterscheidet konsequent zwischen der Anzeige von Texten, insbesondere Nachrichtentexten, wie der „speech prohibition message 2a“, der „speech permission message 2b“ oder der „guidance message 4“ und der
Anzeige von Zeichen, insbesondere dem im Merkmal 1.4.1a genannten „prohibition mark 3“ beispielweise einem Verbotsbild (Absatz 0018:
prohibition image).

110

Das Verbotszeichen ist nach der Lehre des Anspruchs 1 von dem Anzeigemittel
zu löschen, nachdem der Spracherkennungsprozess gestartet wurde (Merkmal 1.4.3). In der Weiterbildung nach Unteranspruch 2 wird das Verbotszeichen zu einem früheren Zeitpunkt gelöscht: nach dem Verstreichen eines Einstellzeitraums wird das Verbotszeichen gelöscht und (weiterhin) der mindestens eine von erkennbaren Sprachtexten angezeigt.

111

d) Eine
Anleitungsnachricht (guidance message, Merkmal 1.4.1c) gibt dem Nutzer eine Handlungsanleitung. In den Ausführungsbeispielen lautet die Anleitungsnachricht in dem Navigationssystem „Bitte sprechen Sie, wenn Sie einen Piepton hören“ (Absatz 0023, Figuren 1A, 1B) bzw. „Bitte drücken Sie die Sprachtaste und sprechen Sie“ (Figur 4B).

112

e)
Erkennbare Sprachtexte (recognizable speeches, Merkmal 1.4.1b) sind Texte, die bei Spracheingabe des Nutzers von der Spracherkennungsvorrichtung erkennbar und in einen Maschinenbefehl umsetzbar sind.

113

Im Ausführungsbeispiel des Streitpatents sind die durch das Navigationssystem erkennbaren Sprachtexte situationsabhängig. In der Situation, in der ein Befehl erwartet wird, werden beispielsweise die Sprachtexte „Ziel suchen“, „Karte anzeigen“, „Route anzeigen“ o. ä. angezeigt. In der Situation, in der die Vorrichtung ein Navigationsziel erwartet, werden beispielsweise „Bahnhof“, „Baseballstadion“, „Vergnügungspark“ o. ä. angezeigt (Absatz 0019).

114

f) Bei der Anzeige eines Verbotszeichens, des mindestens einen von erkennbaren Sprachtexten und einer Anleitungsnachricht (Merkmale 1.4.1a bis 1.4.1c) handelt es sich nicht um die
Wiedergabe einer Information als solcher (Art. 52 Abs. 2 Buchst. d, Abs. 3, Art. 56 EPÜ), sondern um technische Mittel, die ein technisches Problem lösen (BGH, Urteil vom 25. August 2015 – X ZR 110/13 – Entsperrbild, Rn 18; BGH, Urteil vom 14. Januar 2020 – X ZR 144/17 – Rotierendes Menü, Rn 26). Denn durch die Merkmale 1.4.1a bis 1.4.1c wird die Mensch-Maschine-Schnittstelle so gestaltet, dass Eingabefehler und unnötige Eingabeverzögerungen minimiert werden. Ohne die Anzeige eines Verbotszeichens, des mindestens einen von erkennbaren Sprachtexten und einer Anleitungsnachricht würde sich der Spracheingabe- bzw. -erkennungsprozess regelmäßig verlängern oder wäre – etwa für einen ungeübten Benutzer ohne Bedienungsanleitung – überhaupt nicht durchführbar.

115

Die Darstellung mindestens einen von erkennbaren Sprachtexten auf dem Anzeigemittel erzielt die technische Wirkung, dass der beanspruchten Spracherkennungsvorrichtung ein erkennbarer Sprachtext durch den Benutzer zugeführt werden kann.

116

Die Darstellung mindestens eines von erkennbaren Sprachtexten, begleitet von einem Verbotszeichen, erzielt die technische Wirkung, dass der Spracherkennungsvorrichtung unmittelbar dann, wenn sie zur Spracherkennung bereit ist, und ohne Verzögerung ein erkennbarer Sprachtext durch den Benutzer zugeführt werden kann.

II.

117

1. Der Nichtigkeitsgrund der unzulässigen Erweiterung liegt nicht vor (Art. 138 Abs. 1 Buchstabe c) EPÜ, Art. II § 6 Abs. 1 Nr. 3 IntPatÜG).

118

Denn der Gegenstand des Streitpatents geht in zulässiger Weise auf den Inhalt der europäischen Patentanmeldung in ihrer ursprünglich eingereichten Fassung und auf den Inhalt der früheren europäischen Patentanmeldung in ihrer ursprünglich eingereichten Fassung zurück.

119

1.1 Die einzelnen Merkmale des erteilten Anspruchs 1 gehen in zulässiger Weise auf folgende Fundstellen der am 27. Januar 2012 beim Europäischen Patentamt eingegangenen Anmeldeunterlagen der Teilanmeldung 12152804.6 (=
NK 1b) zurück:

120

Merkmale 1, 1.1: Anspruch 1 und Absatz 0001;

121

Die Begriffe „
words“ und „
speech“ werden in der NK 1b synonym verwendet.

122

Merkmal 1.1.2: Anspruch 1 und Absätze 0048, 0049;

123

Das im erteilten Anspruch 1 beanspruchte Anweisungsmittel ist ursprungsoffenbart als Empfangsmittel zum Empfangen von Spracherkennungsstartanweisungen des Nutzers (Anspruch 1) und als Steuereinheit, die die Spracherkennungseinheit steuert, um einen Spracherkennungsprozess zu starten (Absätze 0048, 0049).

124

Merkmal 1.1.3: Anspruch 1;

125

Merkmal 1.1.4: Absatz 0013, Bezugszeichen 107;

126

Merkmal 1.2: Anspruch 1;

127

Merkmale 1.3, 1.3.1: Absatz 0039, Zeilen 2-8;

128

Merkmale 1.4 bis 1.4.1c: Anspruch 1, Zeilen 11-14, Absatz 0014, Zeilen 8-11;

129

Da nach Anspruch 1, Zeilen 11-14 das Steuerungsmittel das Anzeigemittel zum Anzeigen des mindestens einen erkennbaren Sprachtextes und eines Verbotsbilds nach einem ersten Zeitpunkt, nämlich nach dem Empfang der Spracherkennungs-Startanweisungen, und vor einem zweiten Zeitpunkt ansteuert, nämlich vor dem Zeitpunkt, zu dem das Erkennungsmittel zur Spracherkennung bereit ist, beginnt das Anzeigen dieser Elemente innerhalb des Einstellzeitraums.

130

Nach Absatz 14, Zeilen 8-11 kann das Anzeigen einer Nachricht und eines Verbotsbildes während des Einstellzeitraums beginnen, denn dort ist angegeben: Zu diesem Zeitpunkt werden während eines Zeitraums vom Drücken der Sprachtaste des Nutzers zum Anweisen des Starts des Spracherkennungsprozesses bis zum tatsächlichen Start des Spracherkennungsprozesses eine Nachricht und ein Verbotszeichen, das ein Sprachverbot bedeutet, auf einem Bildschirm angezeigt. Als Nachricht versteht der Fachmann insbesondere die Anleitungsnachricht (Absatz 0013, Bezugszeichen 4).

131

Merkmal 1.4.2: Absatz 0050;

132

Merkmal 1.4.3: Anspruch 2.

133

Es trifft zu, dass nicht alle Merkmale der Ausführungsbeispiele in den erteilten Anspruch 1 aufgenommen worden sind. Nicht aufgenommen wurde etwa die Position der Anzeigen gemäß Figur 1A. Diese Verallgemeinerung ist auf Grund der allgemeinen Lehre des ursprünglichen Anspruchs 1 und des Absatzes 0014 zulässig.

134

1.2 Der Gegenstand des erteilten Anspruchs 1 geht in zulässiger Weise auf die am 1. Dezember 2006 eingegangenen japanisch-sprachigen Anmeldeunterlagen der früheren PCT-Anmeldung PCT/JP2006/324064 zurück (genannt sind im Folgenden Fundstellen der am 23. Juli 2008 beim Eintritt in die europäische Phase, europäische Anmeldenummer 06823543.1, eingereichten englischsprachigen Übersetzung (=
NK 9a), Übersetzungsfehler oder -ungenauigkeiten wurden von der Klägerin nicht geltend gemacht und sind dem Senat auch nicht offenbar):

135

Merkmale 1, 1.1: Anspruch 1;

136

Merkmal 1.1.2: Anspruch 1 und Absätze 0050, 0051;

137

Das im erteilten Anspruch 1 beanspruchte Anweisungsmittel ist ursprungsoffenbart als Sprachtaste (Absatz 0050) und als Steuereinheit, die die Spracherkennungseinheit steuert, um einen Spracherkennungsprozess zu starten (Absätze 0050, 0051 oder auch Anspruch 1).

138

Merkmal 1.1.3: Anspruch 1;

139

Merkmal 1.1.4: Absatz 0015, Bezugszeichen 107;

140

Merkmal 1.2: Anspruch 1;

141

Merkmale 1.3, 1.3.1: Absatz 0041, Zeilen 2-8;

142

Merkmale 1.4, 1.4.1 Absatz 0011, Zeilen 10, 11

143

Merkmale 1.4.1a bis 1.4.1c: Absatz 0016, Zeilen 8-11, Anspruch 1, Zeilen 7, 8;

144

Absatz 0016, Zeilen 8-11 offenbart: Zu diesem Zeitpunkt werden während eines Zeitraums vom Drücken der Sprachtaste des Nutzers zum Anweisen des Starts des Spracherkennungsprozesses bis zum tatsächlichen Start des Spracherkennungsprozesses eine
Nachricht und ein Verbotszeichen, das ein Sprachverbot bedeutet, auf einem Bildschirm angezeigt. Demnach soll das Anzeigen dieser Elemente also während des Einstellzeitraums beginnen.

145

Unter den allgemeinen Begriff der Nachricht wird der Fachmann insbesondere die Anleitungsnachricht (Absatz 0015, Bezugszeichen 4) subsummieren. Die Anzeige des mindestens einen von erkennbaren Sprachtexten ist in den Absätzen 0051, 0052 oder Anspruch 1, Zeilen 7, 8 offenbart.

146

Merkmal 1.4.2: Absatz 0052;

147

Merkmal 1.4.3: Anspruch 1.

148

Es trifft ebenfalls zu, dass nicht alle Merkmale des ursprünglichen Anspruchs 1 oder der Ausführungsbeispiele in den erteilten Anspruch 1 aufgenommen worden sind. Nicht aufgenommen wurde etwa die Anweisung, das Verbotsbild in einer Position anzuzeigen, die mit mindestens einem Teil des erkennbaren Zeichens auf dem Anzeigemittel überlagert ist (NK 9a, Anspruch 1, Zeilen 15-17). Diese Verallgemeinerung ist jedoch auf Grund der allgemeinen Lehre des ursprünglichen Absatzes 0016 zulässig.

149

1.3 Der Gegenstand des erteilten Unteranspruchs 2 ist ursprungsoffenbart in NK 1b, Absätze 0051, 0052, Figur 1B bzw. in NK 9a, Absätze 0053, 0054 und Figur 1B. Hinsichtlich der übrigen erteilten Ansprüche ist dem Senat keine unzulässige Erweiterung offenbar.

150

2. Der Nichtigkeitsgrund der fehlenden Patentfähigkeit liegt nicht vor (Art. 138 Abs. 1 Buchstabe a) i. V. m. Art. 54, 56 EPÜ i. V. m. Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG).

151

2.1 Die Schrift US 6,505,159 B1 (=
NK 5) ist ein geeigneter Ausgangspunkt des Fachmanns, der vor der vorstehend genannten Aufgabe steht. Der Gegenstand des Anspruchs 1 des Streitpatents ist gegenüber diesem Stand der Technik neu.

152

a) Die Schrift NK 5 beschreibt eine Vorrichtung und ein Verfahren zur Bereitstellung von Spracheingabe für ein Spracherkennungssystem (Bezeichnung). Die Vorrichtung 10 umfasst einen Computer 12 u. a. mit einem Spracherkennungsmodul 98 und ein entfernt vom Computer 12 angeordnetes Eingabegerät 14, welches in einer ersten Ausgestaltung ein schnurloses Telefon umfasst, das aus einer Basisstation 16 und einem tragbaren Mobilteil 18 besteht (Figur 1 und Spalte 2, Zeilen 20-31; Spalte 5, Zeilen 30-35).

Abbildung in Originalgröße in neuem Fenster öffnen

153

NK 5, Figur 1 mit Ergänzungen durch den Senat

154

Eine Telefon/Computer-Schnittstelleneinheit und Steuerung 87 in der Basisstation 16 (Figur 2B) ist über eine geeignete Schnittstelleneinheit (nicht in Figur 2A gezeigt), die mit geeigneten Protokollen kommuniziert, mit dem Systembus 23 des Computers 12 verbunden (Figur 2A). In einer Ausführungsform entsprechen die Schnittstelleneinheit und das Protokoll dem USB-Standard (
universal serial bus). Der USB-Standard weist bestimmte Attribute auf, wie beispielsweise eine erhöhte Bandbreite gegenüber früheren seriellen Kommunikationsverbindungen, wodurch mehr Sprachdaten vom Eingabegerät 14 an den Computer 12 geliefert werden können (Spalte 4, Zeile 60 bis Spalte 5, Zeile 4).

155

Entgegen der Auffassung der Beklagten fällt diese in der NK 5 offenbarte räumlich verteilte Vorrichtung unter den Anspruch 1 des Streitpatents. Denn der Anspruch 1 ist nicht darauf beschränkt, dass die funktionalen Einheiten der Spracherkennungsvorrichtung innerhalb eines Gehäuses miteinander verbunden sind. Im Übrigen ist dem Fachmann bekannt, dass ein schnurloses Telefon, dessen Basisstation 16 über USB mit einem Computer 12 verbunden ist, regelmäßig auch in unmittelbarer Nähe des Computers 12 betrieben wird.

156

b) Die Schrift NK 5 zeigt in Figur 4 ein Flussdiagramm zum Betrieb der Vorrichtung 10, dessen einzelne Schritte ab Spalte 5, Zeile 52 bis Spalte 7, Zeile 29 beschrieben sind.

157

NK 5, Figur 4 mit Ergänzungen durch den Senat

158

Der Zeitraum zwischen den Schritten 104 und 114 stellt einen
Einstellzeitraum (
set-up period of time) gemäß Merkmal 1.3 des Streitpatents dar.

159

Denn im Schritt 102 betätigt der Nutzer den Spracherkennungsschalter 72 am Eingabegerät 14,
um dem Computer 12 anzuzeigen, dass eine Spracheingabe erfolgen soll. Im Schritt 104 wird daraufhin ein
Aktivierungssignal (
activation signal) von dem Eingabegerät 14 zum Computer 12 übertragen (Spalte 5, Zeilen 53-57). In der dargestellten Ausführungsform stammt das Aktivierungssignal vom Mobilteil 18 und wird an die Basisstation 16 übertragen. Die Basisstation 16 sendet dann das Aktivierungssignal über die Treiber 96 an das Programmmodul 37 des Computers 12, um anzuzeigen,
dass der Nutzer Sprachanweisungen eingeben möchte (Spalte 5, Zeilen 59-66). Nach dem Empfang des Aktivierungssignals unterbricht das Programmmodul 37 aktuelle Operationen, wie das Abspielen einer aufgezeichneten Nachricht, und
bereitet das Spracherkennungsmodul 98 auf den Empfang nachfolgender Sprachanweisungen in Schritt 112 vor. Die Vorbereitung des Spracherkennungsmoduls 98 kann das Bereitstellen eines Satzes zulässiger Sprachanweisungen basierend auf dem aktuellen Status des Programms umfassen (Spalte 6, Zeilen 22-39).

160

Mit dem auf den Schritt 104 folgenden Schritt 106 erzeugt die Basisstation 16 ein
Computer-Wartesignal (
computer waiting signal) und sendet es an das Mobilteil 18, das einen akustischen Ton auslöst, der dem Nutzer anzeigt, dass das Eingabegerät 14 versucht, eine Verbindung zum Computer 12 herzustellen. Beispielsweise kann sich der Computer 12 in einem „Schlaf“-Modus befinden, in dem ausgewählte Komponenten ausgeschaltet wurden, um Energie zu sparen. In einem solchen Fall kann das Computer-Wartesignal an den Nutzer übertragen werden,
bis der Computer 12 voll funktionsfähig geworden ist (Spalte 5, Zeile 64 bis Spalte 6, Zeile 8). Das Computer-Wartesignal kann auch als Audio-Nachricht „Bitte warten“ ausgegeben werden (Spalte 7, Zeilen 39-41).

161

Nach der Vorbereitung des Spracherkennungsmoduls 98 im Schritt 112 liefert das Programmmodul 37 im Schritt 114 über das Eingabegerät 14 ein
Spracherkennungs-Bereitschaftssignal (
speech recognition ready signal) an den Nutzer, das anzeigt, dass das System und insbesondere das Spracherkennungsmodul 98
bereit sind, Sprachanweisungen vom Nutzer anzunehmen. In der dargestellten Ausführungsform wird das Spracherkennungs-Bereitschaftssignal von der Basisstation 16 zum Mobilteil 18 übertragen und löst einen vom Nutzer hör- und erkennbaren Ton aus (Spalte 6, Zeilen 34-43).

162

c) Der Stand der Technik nach der Schrift NK 5 offenbart somit eine Spracherkennungsvorrichtung gemäß
Merkmal 1 (
apparatus 10) mit einer Erkennungseinheit gemäß
Merkmal 1.1 (
computer 12) zum Ausführen eines Spracherkennungsprozesses des Erkennens der Sprache des Nutzers (Spalte 2, Zeilen 18-23; Spalte 5, Zeilen 30-32), einem Anweisungsmittel gemäß
Merkmal 1.1.2 (umfassend u. a.
speech recognition switch 72) zum Empfangen von Spracherkennungs-Startanweisungen von einem Nutzer und zum Anweisen der Erkennungseinheit (
activation signal), den Spracherkennungsprozess zu beginnen (Spalte 5, Zeilen 53-57; Spalte 6, Zeilen 22-26), einem Anzeigemittel gemäß
Merkmal 1.1.3 (Spalte 7, Zeilen 30-39:
LCD), welches zum Anzeigen mindestens eines von erkennbaren Sprachtexten der Erkennungseinheit geeignet ist, einer Tonverarbeitungseinheit gemäß
Merkmal 1.1.4 (Spalte 4, Zeilen 24, 25:
audio processor unit 64) und einem Steuerungsmittel gemäß
Merkmal 1.2 (bestehend aus
CPU 21, telephone/computer interface unit and controller 87, RF controller 89, RF controller 68, vgl. Figuren 2A und 2B). Wobei auch dort ein Einstellzeitraum gemäß
Merkmal 1.3 ab einer Zeit (Figur 4 Schritt 104), zu der die Erkennungseinheit 12 Anweisungen zum Beginnen des Spracherkennungsprozesses von dem Anweisungsmittel 72 empfängt (Spalte 5, Zeilen 53-64) bis zu einer Zeit (Figur 4 Schritt 114), zu der die die Erkennungseinheit 12 zum Ausführen des Spracherkennungsprozesses bereit ist, notwendig ist (Spalte 6, Zeilen 33-38
), wobei der Spracherkennungsprozess gemäß
Merkmal 1.3.1 begonnen wird (Figur 4 Schritte 116-120), nachdem der Einstellvorgang vollendet wurde (Spalte 6, Zeile 44), und das Steuerungsmittel (21, 87, 89, 68) gemäß
Merkmal 1.4 dafür eingerichtet ist, die Tonverarbeitungseinheit (
audio processor unit 64) zu veranlassen, gemäß einem
Teil des Merkmals 1.4.2 eine Anleitungsnachricht (
please wait) während des Einstellzeitraums (Figur 4 Schritt 106) als Ton auszugeben (Spalte 5, Zeilen 64-67
; Spalte 6, Zeilen 6-8
; Spalte 7, Zeilen 39-47
).

163

Der Stand der Technik nach der Schrift NK 5 zeigt weder die Merkmale 1.4.1 bis 1.4.1c noch das Merkmal 1.4.3 sowie nur einen Teil des Merkmals 1.4.2 des Anspruchs 1.

164

d) Den zahlreichen von Klägerin bzw. Beklagter gegen die vorstehende Beurteilung des Offenbarungsgehalts der Schrift NK 5 vorgebrachten Einwänden folgt der Senat aus den folgenden Gründen nicht:

165

Entgegen der Auffassung der Klägerin ist in der Schrift NK 5 nicht offenbart, dass das Anzeigemittel zu veranlassen ist, das Anzeigen des mindestens einen von erkennbaren Sprachtexten (Merkmal 1.4.1b) und einer Anleitungsnachricht zu beginnen (Merkmal 1.4.1c). Denn das Computer-Wartesignal und erkennbare Sprachtexte sind weder in der Aufzählung in Spalte 7, Zeile 30 ff. der Schrift NK 5 genannt, noch lassen sich diese unmittelbar und eindeutig aus dem Unterschied zwischen den Angaben „
each of these signals“ und „
each of the signals“ in Spalte 7, Zeilen 35, 39 der NK 5 entnehmen. Die NK 5 offenbart zwar das Bereitstellen eines Satzes zulässiger Sprachanweisungen (
allowable voice instructions) bzw. einer gültigen Anweisung (
valid instruction)
im Spracherkennungsmodul 98 (Spalte 6, Zeile 26-33). Eine Anzeige dieser Sprachanweisungen auf einem Anzeigemittel ist jedoch weder dort noch an anderer Stelle der NK 5 mitzulesen. So betreffen die Ausführungen in NK 5 Spalte 7, Zeile 30ff. das Wiederholen einer
erkannten Sprachanweisung (
repeating the recognized instruction) durch eine Audio-Nachricht an Stelle oder in Ergänzung für das sogenannte Erkannt-Signal (
recognized signal). Die Anzeige eines erkannten Sprachtextes ist etwas Anderes als die im Merkmal 1.4.1b beanspruchte Anzeige eines erkennbaren, d. h. noch zu erkennenden Sprachtextes, denn ein erkannter Sprachtext kann erst nach einer Spracherkennung und somit nach dem Einstellzeitraum durch die Spracherkennungsvorrichtung angezeigt werden.

166

Der sinngemäße Einwand der Beklagten, das Computer-Wartesignal werde von der Basisstation 16 und nicht vom Computer 12 ausgegeben, zudem werde es nicht innerhalb des Einstellzeitraums ausgegeben, sondern bereits bevor das Aktivierungssignal vom Computer 12 empfangen worden sei, und insbesondere auch dann ausgegeben, falls das Aktivierungssignal im Fehlerfall den Computer 12 überhaupt nicht erreiche, führt zu keiner anderen Beurteilung als vorstehend gegeben. Denn der Anspruch 1 des Streitpatents fordert nicht, dass die Erkennungseinheit der Spracherkennungsvorrichtung die Anleitungsnachricht ausgibt, vielmehr sind Steuerungsmittel der Spracherkennungsvorrichtung dafür eingerichtet, die Tonverarbeitungseinheit zu veranlassen, den gleichen Inhalt wie die Anleitungsnachricht während des Einstellzeitraums als Ton auszugeben (Merkmale 1.4, 1.4.2). Die in der Schrift NK 5 offenbarte Basisstation 16 und die Audioprozessoreinheit 64 des Mobilteils 18 stellen ein solches Steuerungsmittel und eine Tonverarbeitungseinheit der Spracherkennungsvorrichtung dar. Zudem wird das Aktivierungssignal gemäß der Schrift NK 5 im Schritt 104 von dem Eingabegerät 14 zum Computer 12 übertragen (Spalte 5, Zeilen 56, 57) und erst im darauffolgenden Schritt 106 erzeugt die Basisstation 16 ein Computer-Wartesignal und sendet es an das Mobilteil 18 (Spalte 5, Zeilen 64-67). Mangels anderer Angaben geht der Fachmann davon aus, dass die Übertragung des Aktivierungssignals über die USB-Verbindung an den Computer 12 im Nicht-Fehlerfall regelmäßig mit dem Schritt 104 abgeschlossen ist, wenn im darauffolgenden Schritt 106 das Computer-Wartesignal am Eingabegerät 14 ausgegeben wird. Die Schrift NK 5 ist insbesondere nicht auf die Lehre reduziert, das Aktivierungssignal auszugeben, um einen Verbindungsaufbau zu dem Computer 12 zu versuchen. Vielmehr hat das Aktivierungssignal auch die Funktion, dem Computer anzuzeigen, dass der Nutzer Sprachanweisungen eingeben möchte (Spalte 5, Zeilen 59-66), und den Computer zu veranlassen, das Spracherkennungsmodul 98 auf den Empfang nachfolgender Sprachanweisungen vorzubereiten (Spalte 6, Zeilen 22-39). Dass die NK 5 auch den Fehlerfall beschreibt, in dem das Aktivierungssignal diese Funktion nicht erfüllen kann, und es bei dem Versuch eines Verbindungsaufbaus bleibt, ändert nichts an dem weiteren Offenbarungsgehalt der NK 5.

167

Zweifelsfrei gibt die Audionachricht „
Bitte warten“ dem Nutzer eine Handlungsanleitung, nämlich zu warten. Dass diese Handlungsanleitung auch im Fehlerfall ausgegeben wird, bevor sie durch ein Computer-Fehlersignal (
computer error signal) abgelöst wird, (Spalte 6, Zeilen 9-19) kann dahinstehen, denn das Computer-Wartesignal wird im Nicht-Fehlerfall solange an den Nutzer übertragen,
bis der Computer 12 voll funktionsfähig geworden ist (Spalte 6, Zeilen 6-8). Erst mit dem Verarbeitungsschritt 114 (Figur 4) ist der Computer 12 voll funktionsfähig, denn dann sind das System und insbesondere das Spracherkennungsmodul 98 des Computers 12 bereit, Sprachanweisungen vom Nutzer anzunehmen (Spalte 6, Zeilen 33-38).

168

2.2 Der Gegenstand des Anspruchs 1 ist gegenüber der Spracherkennungsvorrichtung gemäß der Druckschrift US 5,864,815 A (=
NK 6) neu.

169

a) Die NK 6 möchte visuelle Rückmeldungen eines, in einem Windows-95-Computersystem integrierten, Spracherkennungssystems liefern, ohne größere Teile des Bildschirms für längere Zeit zu blockieren (Spalte 1, Zeilen 17-37).

170

Hierzu wird der aktuelle Zustand bzw. Status (
listening, not listening, standing-by) des Spracherkennungssystems als Icon in einem bestimmten Bereich einer Taskleiste angezeigt (Figur 2). Zusätzlich wird für einige Sekunden ein Tooltipp („tool tip“;
MICROSOFT VOICE) angezeigt, wenn der Nutzer die Computermaus über dem Status-Icon platziert (Figur 3; Spalte 3, Zeilen 21 bis Spalte 4, Zeilen 45). Nach einem nutzerinitiierten Zustandswechsel des Spracherkennungssystems ändert sich das Status-Icon und ein entsprechender Tooltipp (
Not listening, listening, standing-by) wird angezeigt (Figuren 4A, 4B, 4C). Nach einer Spracheingabe im Zustand „
listening“ wird anstelle des Status-Icons ein Icon angezeigt, dass die Verarbeitung der Audio-Eingabe symbolisiert (Figur 8: Sanduhr 68) und ein Tooltipp eingeblendet, der dem Nutzer eine Rückmeldung über den erfolgreichen Sprachempfang liefert (Figur 8:
Heard 70). Im Falle einer misslungenen Spracheingabe werden ein entsprechendes Icon (Figur 9: Fragezeichen 72) und Tooltipp (Figur 9:
Not recognized) angezeigt, wie dies in den nachfolgend eingeblendeten Figuren 2, 3, 4A, 4B, 4C, 8 und 9 dargestellt ist:

171

NK 6, Figur 2, mit Kommentierung durch den Senat

Abbildung in Originalgröße in neuem Fenster öffnen

172

Wenn der Benutzer den Status des Spracherkennungssystems wechseln möchte, klickt er mit der Maus auf das Status-Icon, wählt in dem sich öffnenden Menü den Punkt Set Listening Mode und anschließend in einem Untermenü den gewünschten Zustand (
Start Listening, Standby, Stop Listening):

173

NK 6, Ausschnitt aus Figur 7

174

Wenn eine Sprachsignaleingabe erfolgreich verarbeitet wurde, erfolgt eine Rückmeldung an den Benutzer (Spalte 6, Zeilen 5-7). Die nachfolgend eingeblendete Figur 12 zeigt diese visuelle Rückmeldung für den Fall des erfolgreichen Erkennens der Spracheingabe „
What can I say?“, nämlich die Auflistung der möglichen Sprachbefehle:

Abbildung in Originalgröße in neuem Fenster öffnen

175

NK 6, Figur 12 mit Kommentierung durch den Senat

176

b) Die Schrift NK 6 zeigt somit eine Spracherkennungsvorrichtung (Figur 1:
computer system 10, voice facility 28, audio input device 24) gemäß
Merkmal 1, mit einer Erkennungseinheit gemäß
Merkmal 1.1 zum Ausführen eines Spracherkennungsprozesses des Erkennens der Sprache des Nutzers (Spalte 3, Zeilen 43-47:
speech recognition engine), einem Anweisungsmittel gemäß
Merkmal 1.1.2 zum Empfangen von Spracherkennungs-Startanweisungen von einem Nutzer und zum Anweisen der Erkennungseinheit, den Spracherkennungsprozess zu beginnen (Da der Benutzer, wie dargelegt, über das Eingabemittel Maus die Spracherkennungsvorrichtung in den
listening-Zustand schalten kann, stellt die Maus 22 und das Betriebssystem 26 ein Anweisungsmittel dar, welches Startanweisungen an die Spracherkennungseinheit liefert.), einem Anzeigemittel gemäß
Merkmal 1.1.3 (Figur 1:
video display 20) zum Anzeigen mindestens eines von erkennbaren Sprachtexten der Erkennungseinheit (Spalte 6, Zeilen 14, 15:
list of global voice commands; Figur 12) und einer Tonverarbeitungseinheit gemäß
Merkmal 1.1.4 (Figur 1:
audio input device 24; Spalte 3, Zeile 34:
sound board), wobei die Spracherkennungsvorrichtung gemäß
Merkmal 1.2 des Weiteren ein Steuerungsmittel umfasst (Figur 1:
CPU 12, operating system 26).

177

Der Fachmann kann der NK 6 keinen Einstellzeitraum im Sinne der Merkmale 1.3 und 1.3.1 entnehmen, während dem das Anzeigen eines Verbotszeichens, des mindestens einen von erkennbaren Sprachtexten und einer Anleitungsnachricht zu beginnen ist (Merkmale 1.4 bis 1.4.1c), bzw. gemäß Merkmal 1.4.3 das Verbotszeichen gelöscht wird. Die Schrift NK 6 offenbart auch nicht, dass die Tonverarbeitungseinheit zu veranlassen ist, den gleichen Inhalt wie eine Anleitungsnachricht während des Einstellzeitraums als Ton auszugeben (Merkmal 1.4.2).

178

c) Zwar mag der nutzerinitiierte Wechsel des Zustands der Spracherkennungsvorrichtung (Figur 7) von „
not listening“ zu „
listening“ mit einer technisch bedingten Verzögerung verbunden sein. Der NK 6 lässt sich jedoch nicht unmittelbar und eindeutig entnehmen, ob das Status-Icon, das den „
not listening“-Zustand anzeigt, zunächst im Sinne eines Verbotszeichens stehen bleibt oder sofort umgeschaltet wird und den „
listening“-Zustand anzeigt. Es spricht viel für die zweite Variante, denn anderenfalls würde der Nutzer – aufgrund der Nicht-Reaktion des Systems auf seine Bedienung – von einer Fehlbedienung und/oder Fehlfunktion ausgehen. Aufgrund dieses anderen Zeitablaufs sind die in NK 6 offenbarten Staus-Icons keine Verbotszeichen gemäß den Merkmalen 1.4.1a und 1.4.3.

179

Jedenfalls wird in dem Zeitraum der Umschaltung, unterstellt er wäre so lang, dass ein Nutzer ihn wahrnehmen könnte, weder ein erkennbarer Sprachtext noch eine Anleitungsnachricht angezeigt. Denn die Liste mit erkennbaren Sprachtexten erscheint nur dann, wenn sie – wie einleitend dargelegt – über den Sprachbefehl „
What can I say?“ angefordert wird (Figur 12). Zur Erkennung dieses Anforderungsbefehls muss sich die Spracherkennungseinheit jedoch schon im „
listening“-Zustand befinden, d. h. das Anzeigen des Textes beginnt entgegen der Auslegung der Forderung im Merkmal 1.4.1b nicht während des Einstellzeitraums. Die Angaben „
Not listening“ (dt. Übersetzung: „
Es wird nicht zugehört„), und „
Listening“ (dt. Übersetzung: „
Es wird zugehört„) sind Zustandsangaben des Systems und stellen keine Handlungsanleitung für den Benutzer dar (Merkmal 1.4.1c).

180

Den von der Klägerin skizzierten Ablauf „Listening – Anzeige der Liste durch den Sprachbefehl „
What can I say?“ – Umschaltung zu „Not Listening“ (Listenanzeige bliebe bestehen) – Umschaltung zu „
Listening“ (mit Einstellzeitraum, Listenanzeige bliebe weiterhin bestehen)“ kann der Fachmann der NK 6 nicht unmittelbar und eindeutig entnehmen. Insbesondere spricht viel dafür, dass das Fenster 82 mit der Liste (Figur 12) spätestens dann geschlossen wird, wenn der Nutzer mit der Maus einen Zustandswechsel einleitet (Figur 7), denn die NK 6 möchte – wie einleitend dargelegt – ein Spracherkennungssystem schaffen, dessen Anzeigen möglichst wenig Platz auf dem Bildschirm des Computersystems beanspruchen.

181

Zudem würden in diesem Szenario sowohl das „Verbotszeichen“, also das „
Not listening“-Icon, als auch die Liste mit den erkennbaren Sprachtexten schon vor Beginn des „Einstellzeitraums“ angezeigt, also nicht erst durch an die Spracherkennungseinheit gerichtete Anweisungen veranlasst, was nach der Auslegung des Senats nicht unter den Anspruchswortlaut fällt.

182

2.3 Der Gegenstand des Anspruchs 1 ist gegenüber der Spracherkennungsvorrichtung gemäß der Druckschrift US 2003/0095212 A1 (=
NK 7) neu.

183

a) Die Schrift NK 7 möchte tasten- und sprachgesteuerte Fernsteuerungen für Haushaltsgeräte, wie Fernseher oder Videorecorder, so weiterentwickeln, dass trotz eines einfachen Aufbaus der Fernsteuerung und des Haushaltsgeräts eine Vielzahl unterschiedlicher Befehle übertragen werden kann und der Nutzer über ein GUI (
graphical user interface) des ferngesteuerten Haushaltsgeräts eine optische Rückmeldung hinsichtlich seiner Sprachbefehle erhält (Absätze 0001-0023).

184

Als Lösung zeigt die NK 7 eine Infrarot-Fernbedienung (10), der sowohl über Tasten (1, 1a) als auch über Sprachbefehle (V) gesteuert wird. Die entsprechenden Infrarot-Sendesignale (RK, RV) werden von Infrarot-Empfängern (21, 31) eines Fernsehers (20) empfangen. Auf dessen Bildschirm (28A) werden dem Nutzer in einem Spracherkennungsfeld (A1) Texte (TX) und graphische Symbole (IM) angezeigt, die ihm insbesondere eine Rückmeldung über die eingegebenen Sprachbefehle geben, vgl. die nachfolgend eingeblendete Figur 1 i. V. m. den Absätzen 0077 und 0078:

Abbildung in Originalgröße in neuem Fenster öffnen

185

NK 7, Figur 1 mit Kommentierung und Kolorierung durch den Senat

186

Die Figur 3 der NK 7 zeigt ein Blockschaltbild der Empfänger- und Auswerteschaltungen in dem Fernseher (20):

Abbildung in Originalgröße in neuem Fenster öffnen

187

NK 7, Figur 3 mit Kommentierung und Kolorierung durch den Senat

188

b) Die Schrift NK 7 zeigt somit eine Spracherkennungsvorrichtung gemäß
Merkmal 1 (Figuren 1, 3, Absätze 0077, 0078:
remote control transmitter 10,
DTV 20) mit einer Erkennungseinheit gemäß
Merkmal 1.1 zum Ausführen eines Spracherkennungsprozesses des Erkennens der Sprache des Nutzers (
voice recognition section 34, dictionary 35), einem Anweisungsmittel gemäß
Merkmal 1.1.2 zum Empfangen von Spracherkennungs-Startanweisungen von einem Nutzer und zum Anweisen der Erkennungseinheit, den Spracherkennungsprozess zu beginnen (
talk button 8, FM detector 32, carrier detector 33), einem Anzeigemittel gemäß einem Teil des
Merkmals 1.1.3 (
TV screen 28A, voice recognition panel A1, microphone test screen A2) und einer Tonverarbeitungseinheit gemäß
Merkmal 1.1.4 (mitzulesen auf Grund Absatz 0002
: television (TV) sets), wobei die Spracherkennungsvorrichtung des Weiteren ein Steuerungsmittel (112) gemäß
Merkmal 1.2 umfasst (
device controller 25).

189

Der Fachmann kann der NK 7 zwar entnehmen, dass auf dem Bildschirm (28A) im Spracherkennungsfeld (A1) aus der erkannten Sprache des Benutzers abgeleitete Informationstexte sowie Anweisungen und Fehlermeldungen angezeigt werden (Figur 26, Schritt S26; Absätze 0138, 0175, Tabelle 2). Einen Überblick über die anzeigbaren Texte und Symbole (
pattern) liefern die Tabellen 1 bis 4 und die Figur 9, die nachfolgend vollständig bzw. ausschnittsweise wiedergegeben sind:

Abbildung in Originalgröße in neuem Fenster öffnen

190

NK 7, Absätze 0173, 0175, Tabelle 1 (Ausschnitt), Tabelle 2 mit Kolorierungen durch den Senat

Abbildung in Originalgröße in neuem Fenster öffnen

191

NK 7, Absätze 0178, 0181, Tabelle 3, 4 mit Kolorierungen durch den Senat

192

NK 7, Figur 9

193

Weder der „Normalbetrieb“ noch eine Fehlersituation oder der „Mikrofontest“ der in der Schrift NK 7 beschriebenen Vorrichtung offenbaren jedoch einen Einstellzeitraum im Sinne der Merkmale 1.3 und 1.3.1 während dem das Anzeigen eines Verbotszeichens, des mindestens einen von erkennbaren Sprachtexten und einer Anleitungsnachricht zu beginnen ist (Merkmale 1.4 bis 1.4.1c), bzw. gemäß Merkmal 1.4.3 das Verbotszeichen gelöscht wird. Die Schrift NK 7 offenbart auch nicht, dass die Tonverarbeitungseinheit zu veranlassen ist, den gleichen Inhalt wie eine Anleitungsnachricht während des Einstellzeitraums als Ton auszugeben (Merkmal 1.4.2).

194

c) Um eine Spracheingabe zu starten (und während der gesamten Spracheingabe), drückt der Benutzer die Sprechtaste 8 an der Fernbedienung 10, die daraufhin ein IR-Signal aussendet. Der IR-Empfänger 30 empfängt dieses Signal RV; seine Schaltungen 32, 33 weisen die Spracherkennungseinheit 34 an, die Spracherkennung zu starten. Zudem wird die Steuerungseinheit 25 angewiesen, die Anzeige des Textes „
Please Speak“ und eine bestimmte Symbolfolge (Figur 9: Pattern 1) zu veranlassen, die den Nutzer zum Sprechen auffordert (Figuren 1, 4, 6, 9; Absätze 0078, 0084-0088, 0093-0112, 0126-0145, 0171-0179). Damit entnimmt der Fachmann diesem „
Normalbetrieb“ der NK 7 zwar möglicherweise eine technisch bedingte Verzögerung, es ist jedoch fraglich, ob diese im Sinne der vorstehenden Auslegung des Einstellzeitraums gemäß Merkmal 1.3 überhaupt lange genug andauert. Jedenfalls wird während dieses Zeitraums weder ein Verbotszeichen noch eine Liste mit erkennungsfähigen Wörtern oder eine Anleitungsnachricht gemäß den Merkmalen 1.4.1a bis 1.4.1c angezeigt.

195

d) In der
Fehlersituation, in der die Sprach-Erkennungseinheit den Spracherkennungsprozess abbricht (Absatz 0181:
aborts the recognition process, Tabelle 4, Zeile:
Not ready to receive voices … Pattern 3 … Text 12) stellt weder der Text „
Please speak again“ (Absatz 0175, Tabelle 2:
Text 12) ein Verbotszeichen dar, noch wird in dieser Situation mindestens einer von erkennbaren Sprachtexten angezeigt. Damit zeigt diese Fehlersituation jedenfalls nicht die Merkmale 1.3 bis 1.4.3.

196

e) Der „
Mikrofontest“ (Absatz 0178, Tabelle 4, Zeile
microphone test; Absätze 0184-0186), der – bei einsatzbereiter Spracherkennungseinheit 34 – mittels des Sprachbefehls
Microphone test gestartet wird, dient der Anpassung der Spracherkennungseinheit 34 an die Spracheigenschaften des Benutzers. Während des Mikrofontests wird der Text
Now checking sound quality. Please Wait und das Pattern 4 (Figur 9) angezeigt. Nach erfolgreicher Durchführung heißt es
Adjustment is done und Pattern 5 (Figur 9) informiert den Benutzer über ggfs. veränderte Parameter (Absatz 0175, Tabelle 2: Texte 15, 16; Absatz 0184). Während des Abspeicherns der Parameter wird kein Text, sondern nur noch das Pattern 5 angezeigt (Absätze 0185 und 0173, Tabelle 1, Zeilen
Start/End parameter transfer … Pattern 5 None). Um nach abgeschlossenem Mikrofontest einen Sprachbefehl eingeben zu können, muss der Benutzer die Sprechtaste 8 erneut drücken und der bereits beschriebene „Normalbetrieb“ beginnt. Somit zeigt der Mikrofontest der NK 7 schon keinen Einstellzeitraum gemäß Merkmal 1.3, denn zum einen analysiert die Spracherkennungseinheit 34 während des Tests die vom Benutzer gesprochen Worte „
Microphone test“, führt also bereits eine Spracherkennung durch, zum anderen ist sie, wie dargelegt, nach Ablauf des Mikrofontests nicht bereit, den Spracherkennungsprozess auszuführen. Zudem werden während des Mikrofontests keine erkennungsfähigen Wörter gemäß Merkmal 1.4.1.b angezeigt, denn die Anzeige der Pattern 4 bzw. 5 mit den darin enthaltenen Texten „
Microphone Test“ und „
Formant Level“ (Figur 9) dient ersichtlich nicht dazu, den Benutzer über die erkennungsfähigen Sprachtexte zu informieren.

197

Ob der Fachmann aus den Absätzen 0055 und 0199 entnimmt, dass auch ein erkennbarer Sprachtext (
candidates for the objects of voice recognition;
the candidates) anzeigbar ist (Restmerkmal 1.3.1), kann somit dahinstehen, denn jedenfalls würde eine solche Anzeige nicht in einem Einstellzeitraum gemäß den Merkmalen 1.3 und 1.4.1b beginnen.

198

3. Der Gegenstand des Anspruchs 1 beruht auch auf einer erfinderischen Tätigkeit.

199

3.1 Ausgehend vom Stand der Technik nach der Schrift NK 5 kommt der Fachmann nicht in naheliegender Weise zum Gegenstand des Anspruchs 1.

200

a) Der Fachmann mag zwar Veranlassung haben, während des Einstellzeitraums auf dem Anzeigemittel mit dem Anzeigen eines Verbotszeichens und der Anleitungsnachricht zu beginnen (
Merkmale 1.4.1, 1.4.1a, 1.4.1c,
Restmerkmal 1.4.2).

201

Denn falls der Fachmann beim Nacharbeiten der Lehre aus der NK 5 eine Häufung von Fehlbedienungen durch den Nutzer feststellt, etwa weil der Nutzer mit Spracheingaben bereits zu einem Zeitpunkt beginnt, zu dem der Computer noch nicht zur Spracherkennung bereit ist, steht der Fachmann vor der Aufgabe, die dort beschriebene Mensch-Maschine-Schnittstelle zu verbessern. Zu den fachüblichen Maßnahmen zur Verringerung von Fehleingaben gehört, dass dem Nutzer über die vorhandenen Ausgabemittel des Eingabegeräts wie Lautsprecher 66 (Figur 2B) und Bildschirm (Spalte 7, Zeile 37) Anweisungen mit übereinstimmenden Bedeutungsinhalt und auch in Zeichensprache gegeben werden, etwa durch ein Sinnbild. So gibt bereits die Schrift NK 5 den Hinweis, dass zusätzlich oder anstelle eines akustischen Tons und der Audionachricht „Spracherkennung bereit“, die anzeigt, dass die Erkennungseinheit zur Spracherkennung bereit ist, andere Arten von Anzeigen verwendet werden, beispielsweise eine Flüssigkristallanzeige (LCD) an der Eingabevorrichtung 14, um Symbole oder Text anzuzeigen, die diesem Signal entsprechen (Spalte 7, Zeile 30-39). Nicht anderes wird der Fachmann für die Audionachricht „Bitte warten“ vorsehen.

202

b) Eine Veranlassung des Fachmanns, zusätzlich zur Anzeige des Verbotszeichens (
Merkmal 1.4.1a) bereits während des Einstellzeitraums mit dem Anzeigen des mindestens einen von erkennbaren Sprachtexten zu beginnen (
Merkmal 1.4.1b), kann der Senat jedoch nicht erkennen.

203

Wie zur Auslegung dargelegt, handelt es sich bei der Anzeige mindestens eines von erkennbaren Sprachtexten (Merkmal 1.4.1b), begleitet von einem Verbotszeichen (Merkmal 1.4.1a), um ein Mittel, das ein technisches Problem mit technischen Mitteln löst und daher bei der Prüfung auf Patentfähigkeit zu berücksichtigen ist.

204

Die Anzeige von erkennbaren Sprachtexten mag dann fachüblich sein, falls die Spracherkennungsvorrichtung zur Spracheingabe bereit ist (vgl. NK 6, Spalte 6, Zeilen 7-18:
FIG. 12 shows an example wherein the voice command „What can I say?“ is properly recognized. … a window 82 is opened that provides a list of global voice commands; NK 14, Seite 21, vorletzter Absatz:
displays a small selection of useful commands that Dragon NaturallySpeaking recognizes for the current context). Der Fachmann hat jedoch keine Veranlassung, mit dem Anzeigen von Sprachtexten bereits während des Einstellzeitraums zu beginnen (Merkmal 1.4.1b), wenn die Erkennungseinheit noch gar nicht zur Ausführung des Spracherkennungsprozesses bereit ist (Merkmal 1.3). Denn die NK 5 möchte mit der Anleitungsnachricht „
Bitte warten“ eine Spracheingabe des Benutzers gerade verhindern. Die Anzeige eines erst zu einem späteren Zeitpunkt erkennbaren Sprachtextes birgt jedoch die Gefahr, dass der Benutzer sich zum Sprechen animiert fühlt, d. h. die Anzeige der Sprachtexte als Aufforderung zum Sprechen versteht.

205

c) Auf das verbleibende Unterschiedsmerkmal 1.4.3 kommt es nicht mehr an.

206

d) Soweit das Streitpatent von dem Problem ausgeht, dass sich ein Benutzer auf eine Liste von Sprachtexten konzentriert, selbst wenn ein Bild mit einer Bewegung oder dergleichen in einem vorbestimmten Bereich des Bildschirms angezeigt wird, so dass es für den Benutzer schwierig ist, den Zeitpunkt zu erkennen, zu dem er eine Spracheingabe machen soll (Absatz 0010), so enthält diese Problembeschreibung offensichtlich bereits Lösungselemente, einen entsprechenden Stand der Technik hat die Klägerin jedenfalls nicht nachgewiesen.

207

3.2 Aus vergleichbaren Gründen kommt der Fachmann ausgehend vom Stand der Technik nach den Schriften NK 6 oder NK 7 nicht in naheliegender Weise zum Gegenstand des Anspruchs 1.

208

4. Die Gegenstände der Ansprüchen 2 bis 4 erweisen sich als neu und auf einer erfinderischen Tätigkeit beruhend. Die vorstehenden Überlegungen gelten sinngemäß.

III.

209

Die Kostenentscheidung basiert auf § 84 Abs. 2 PatG i. V. m. § 91 Abs. 1 ZPO.

210

Die Entscheidung über die vorläufige Vollstreckbarkeit folgt aus § 99 Abs. 1 PatG i. V. m. § 709 S. 1 und S. 2 ZPO.