BPatG München 4. Senat, Urteil vom 26.05.2021, AZ 4 Ni 4/21 (EP), ECLI:DE:BPatG:2021:26052021U4Ni4.21EP.0
Tenor
In der Patentnichtigkeitssache
…
betreffend das europäische Patent 2 447 942
(DE 60 2006 036 834)
hat der 4. Senat (Nichtigkeitssenat) des Bundespatentgerichts auf Grund der mündlichen Verhandlung vom 26. Mai 2021 durch die Vorsitzende Richterin Grote-Bittner und die Richter Dipl.-Phys. Univ. Dipl.-Wirtsch.-Phys. Arnoldi, Dipl.- Ing. Matter, Dr. Söchtig und Dipl.-Phys. Univ. Dr. Haupt
für Recht erkannt:
I. Die Klage wird abgewiesen.
II. Die Klägerin hat die Kosten des Rechtsstreits zu tragen.
III. Das Urteil ist im Kostenpunkt gegen Sicherheitsleistung in Höhe von 120 % des jeweils zu vollstreckenden Betrages vorläufig vollstreckbar.
Tatbestand
1
Die Beklagte ist eingetragene Inhaberin des u. a. für die Bundesrepublik Deutschland erteilten europäischen Patents 2 447 942, das am 1. Dezember 2006 unter Inanspruchnahme der Priorität der japanischen Patentanmeldung 2006001845 vom 6. Januar 2006 angemeldet und dessen Erteilung am 12. Juni 2013 veröffentlicht worden ist. Im Patentregister des Deutschen Patent- und Markenamts wird das Streitpatent, das die Bezeichnung „Speech recognition apparatus“ („Spracherkennungsvorrichtung“)“ trägt, unter dem Aktenzeichen 60 2006 036 834 geführt.
2
Das Streitpatent, das die Klägerin in der Klageschrift im Umfang seiner Ansprüche 1, 3 und 4 und zuletzt mit Schriftsatz vom 31. März 2021 in vollem Umfang angreift, umfasst in seiner erteilten Fassung 4 Ansprüche mit dem unabhängigen Vorrichtungsanspruch 1, dem auf diesen rückbezogenen Unteranspruch 2, dem Verfahrensanspruch 3 und dem auf diesen rückbezogenen, auf ein Programm gerichteten Anspruch 4.
3
Die Klägerin macht geltend und begründet dies, der Gegenstand des Streitpatents sei nicht patentfähig, nämlich weder neu noch erfinderisch.
4
Die Beklagte verteidigt das Streitpatent in der erteilten Fassung sowie mit dem Hilfsantrag isoliert den Anspruch 2.
5
Der nach Merkmalen gegliederte Anspruch 1 lautet in der Verfahrenssprache Englisch bzw. in einer angepassten Übersetzung in die deutsche Sprache:
6
1.1 A speech recognition apparatus, comprising:
7
Spracherkennungsvorrichtung, die Folgendes umfasst:
8
1.1.1 recognition unit (114) for carrying out a speech recognition process of recognizing the spoken words of a user,
9
eine Erkennungseinheit (114) zum Ausführen eines Spracherkennungsprozesses zum Erkennen der gesprochenen Wörter eines Benutzers,
10
1.1.2 instruction means (109) for receiving speech recognition start instructions from the user, and instructing the recognition means (114) to start the speech recognition process,
11
ein Anweisungsmittel (109) zum Empfangen von Spracherkennungs–Startanweisungen von dem Benutzer und zum Anweisen des Erkennungsmittels (114), den Spracherkennungsprozess zu beginnen,
12
1.1.3 display means (110) for displaying at least one of recognizable speech words of the recognition unit (114),
13
ein Anzeigemittel (110) zum Anzeigen mindestens eines von erkennungsfähigen (Sprach-)Wörtern der Erkennungseinheit (114),
14
1.2 wherein a set-up period of time is necessary from the time when the recognition means (114) receives instructions of start of the speech recognition process from the instruction means (109) to the time when the recognition means (114) is ready to carry out the speech recognition process;
15
wobei ein Einrichtungszeitraum ab dem Zeitpunkt, in dem das Erkennungsmittel (114) Anweisungen zum Beginnen des Spracherkennungsprozesses von dem Anweisungsmittel (109) empfängt, bis zu dem Zeitpunkt, in dem das Erkennungsmittel (114) bereit ist, den Spracherkennungsprozess auszuführen, erforderlich ist;
16
1.3 wherein the speech recognition apparatus further comprises control means (112),
17
wobei die Spracherkennungsvorrichtung des Weiteren ein Steuerungsmittel (112) umfasst,
18
1.3.1 the control means (112), during the set-up period of time, controls the display means (110) for displaying a prohibition character indicative of prohibition of speech and the at least one of recognizable speech words, and
19
wobei das Steuerungsmittel (112) während des Einrichtungszeitraums das Anzeigemittel (110) steuert, ein Verbotszeichen, das für ein Sprechverbot steht, und das mindestens eine der erkennungsfähigen (Sprach-)Wörter anzuzeigen, und
20
1.3.2 after a lapse of the set-up period of time, controls the display means (110) for displaying a permission character indicative of permission of speech to be displayed, in a position where the prohibition character was displayed.
21
nach einem Verstreichen des Einrichtungszeitraums das Anzeigemittel (110) steuert, ein Zulassungszeichen, das für eine Sprecherlaubnis steht, an einer Position anzuzeigen, an der das Verbotszeichen angezeigt wurde.
22
Wegen des Wortlauts des auf den Anspruch 1 rückbezogenen Unteranspruchs 2, des Verfahrensanspruchs 3 und des Vorrichtungsanspruchs 4 wird auf die Streitpatentschrift verwiesen.
23
Im Hinblick auf die geltend gemachte fehlende Patentfähigkeit stützt sich die Klägerin insbesondere auf folgende Dokumente
24
NK5 US 2003/0095212 A1
25
NK6 US 5,864,815 A
26
NK9 JP 2003-177 789 A
27
NK9a Übersetzung der NK9 in die deutsche Sprache
28
NK9b beglaubigte Übersetzung der NK9 in die deutsche Sprache
29
NK10 JP 2002-108 390 A
30
NK10a Übersetzung der NK10 in die deutsche Sprache
31
NK10b beglaubigte Übersetzung der NK10 in die deutsche Sprache
32
und meint, das Streitpatent sei schon nicht neu gegenüber den Druckschriften NK5 und NK6 sowie NK9 und NK10.
33
Die Klägerin ist der Auffassung, die Druckschrift NK5 nehme sämtliche Merkmale des Streitpatents neuheitsschädlich vorweg. Dies gelte insbesondere hinsichtlich der Merkmale 1.3.1 und 1.3.2 des Anspruchs 1. Beide Merkmale würden im Rahmen des Mikrofontests offenbart. Die NK5 offenbare zumindest im Rahmen des Mikrofontests eine Spracherkennungsvorrichtung gemäß den Merkmalen des Anspruchs 1, eine Anzeigeverfahren gemäß Anspruch 3 sowie ein Anzeigeverarbeitungsprogramm gemäß Anspruch 4.
34
Entsprechend verhalte es sich auch mit der Druckschrift NK6. Insbesondere offenbare die NK6 auch die Merkmale 1.2 und 1.3.1. Hinsichtlich des Merkmals 1.2 könne und solle das Streitpatent die Länge des Einrichtungszeitraums nicht festlegen. Selbst wenn man jedoch von einem hinreichend langen Einrichtungszeitraum ausgehen wollte, so habe das Problem einer technisch bedingten Verzögerung beim Start einer Spracherkennungsanwendung auch bereits zum prioritätsälteren Anmeldedatum der NK6 bestanden. Daher würde ein Fachmann unzweifelhaft einen technisch bedingten Einrichtungszeitraum zwanglos in der Offenbarung der NK6 mitlesen. Die NK6 offenbare auch die Anzeige von erkennungsfähigen gesprochenen Wörtern während des Einrichtungsreitraums. Da die NK6 auch ein mehrfaches Umschalten zwischen den verschiedenen Betriebsmodi vorsehe, denn der Zweck der Zustandsanzeige über Tooltipp und Icon sei es ja gerade, den Benutzer über den aktuellen Zustand visuell zu informieren, sei auch das weitere Merkmal 1.3.1 offenbart. Insoweit erfordere Merkmal 1.3.1 des Streitpatents nicht, dass das Verbotszeichen erst während des Einrichtungszeitraums angezeigt wird und nicht bereits zusätzlich auch schon vorher. Entsprechendes gelte analog für den Gegenstand der anderen unabhängigen Ansprüche.
35
Auch die NK 9 sei neuheitsschädlich. Die Druckschrift offenbare lediglich nicht das Merkmal „das mindestens eine der erkennungsfähigen gesprochenen Wörter während des Einrichtungszeitraums anzuzeigen“. Dieses Unterscheidungsmerkmal sei bei der Prüfung der Neuheit jedoch mangels Technizität nicht zu berücksichtigen, weil ihm gemäß der Rechtsprechung des BGH keine technische Wirkung zukomme und nicht zur Lösung der der Erfindung zugrundeliegende Aufgabe beitrage.
36
Zumindest fehle es dem Streitpatent aber an der erfinderischen Tätigkeit ausgehend von der NK9. Hier stellten die Spracheingabeeinheit 102 und die Spracherkennungseinheit 103 eine Einheit dar, die gemeinsam als „recognition unit“ bzw. „recognition means“ im Sinne des Anspruchs 1 des Streitpatents wirkten. Auch funktional stellten nach der Lehre der NK9 die Spracheingabeeinheit 102 und die Spracherkennungseinheit 103 eine Einheit dar, denn nur wenn sowohl die Spracheingabeeinheit als auch die Spracherkennungseinheit bereit seien, sei die Spracherkennung möglich. Daher sei eine Überwachung des Status der Spracheingabeeinheit 102 und/oder der Spracherkennungseinheit 103 notwendig, so dass der Nutzer den Zeitraum zwischen Betätigung des Eingabestart-Schalters 101 bis zum Zeitpunkt des tatsächlichen Starts der Spracheingabe visuell verfolgen könne. Aber selbst wenn man die Spracherkennungseinheit von der Spracheingabeeinheit getrennt betrachten würde und ausschließlich die Spracherkennungseinheit 103 als „recognition unit“ bzw. „recognition means“ betrachten würde, so befasse sich die NK9 zumindest in der oben genannten „oder Alternative“ mit der Überwachung von Verzögerungen beim Start der Spracherkennungseinheit.
37
Ausgehend von der NK9 habe der Fachmann Veranlassung, sich des allgemeinen Fachwissens zu bedienen, um die Aufgabe, die Fehleranfälligkeit der Spracherkennung zu reduzieren, zu lösen, indem ein „erkennungsfähiges gesprochenes Wort“ während des Einrichtungszeitraums angezeigt werde.
38
Die Anzeige mindestens eines von erkennungsfähigen gesprochenen Wörtern gehöre zum allgemeinen Fachwissen, wie es beispielsweise aus der NK5 und der NK6 hervorgehe.
39
Auch der Umstand, dass das Streitpatent lehre, dass während des Einrichtungszeitraums sowohl ein Verbotszeichen, als auch mindestens eines von erkennungsfähigen (Sprach-) Wörtern angezeigt würden, vermöge eine erfinderische Tätigkeit nicht zu begründen. Hierbei handele es sich nicht um eine besondere unübliche, weil in gewisser Weise widersprüchliche Darstellung – vielmehr sollte diese gemeinsame Darstellung es dem Benutzer lediglich ermöglichen, sich bereits während des Einrichtungszeitraums auf die nachfolgende Spracheingabe vorzubereiten, was nachfolgende Verzögerungen vermeiden würde. Entsprechende vergleichbare Darstellungen seien bereits vor dem Prioritätszeitpunkt des Streitpatents üblich gewesen.
40
Dies gelte gleichermaßen, wenn man von der NK10 ausgehe. Die NK 10 beschreibe sämtliche Merkmale der unabhängigen Ansprüche 1, 3 und 4 mit Ausnahme der Anzeige von „mindestens eines der erkennungsfähigen gesprochenen Wörter anzuzeigen während des Einrichtungszeitraums“ (Teil von Merkmal 1.3.1 – Unterscheidungsmerkmal 1) und dass die Icons der Figuren 4a und 4b an der gleichen Position angezeigt werden (Unterscheidungsmerkmal 2). Beide Merkmale begründeten jedoch keine erfinderische Tätigkeit. Das Unterscheidungsmerkmal 1 stelle schon kein technisches Mittel zur Lösung eines technischen Problems dar und könne daher keine erfinderische Tätigkeit begründen. Jedenfalls werde der Fachmann ausgehend von der NK10 die NK6 in Betracht ziehen. Eine Veranlassung dazu habe der Fachmann nicht nur, weil sich die NK6 mit Spracherkennung im Detail befasse. Die NK6 befasse sich insbesondere damit, wie man im Interesse der Benutzerfreundlichkeit Zustandsanzeigen besser ausgestalten könne, und lehre, dass im Nicht-Zuhörzustand „Not listening“ und im Zuhörzustand „Listening“, vgl. Figuren 4A und 4B, in einem Tooltipp angezeigt würden. Dabei ergebe sich aus dem Vergleich der Figuren 4A und 4B unmittelbar, dass das Verbotszeichen „Not listening“ im Tooltipp 42 an der gleichen Position rechts unten auf dem Bildschirm angezeigt werde, wie das Zulassungszeichen „Listening“ im Tooltipp 46. Auch das zweite Unterscheidungsmerkmal werde daher von der NK6 gezeigt bzw. zumindest nahegelegt, da die NK6 eine Anzeige in einem Tooltipp als Text offenbare.
41
Der Gegenstand des Unteranspruchs 2 werde von den Druckschriften NK6 und NK9 offenbart und sei schon deshalb nicht patentfähig. Hinzu komme, dass der Unteranspruch 2 eine Anweisung betreffe, die bei der Prüfung auf erfinderische Tätigkeit außer Acht zu bleiben habe. Selbst wenn der Unteranspruch 2 bei der Prüfung auf erfinderische Tätigkeit zu berücksichtigen wäre, so sei dessen Gegenstand jedenfalls nahegelegt.
42
Der Senat hat den Parteien in einem qualifizierten Hinweis vom 18. Februar 2021 seine vorläufige Auffassung zur Sach- und Rechtslage mitgeteilt und den Parteien eine abschließende Frist bis 30. April 2021 gesetzt. Im Termin am 26. Mai 2021 hat der Senat den Parteien einen weiteren rechtlichen Hinweis erteilt.
43
Die Klägerin beantragt,
44
das europäische Patent 2 447 942 mit Wirkung für das Hoheitsgebiet der Bundesrepublik Deutschland für nichtig zu erklären.
45
Die Beklagte beantragt,
46
die Klage abzuweisen,
47
hilfsweise die Klage mit der Maßgabe abzuweisen, dass das Streitpatent mit dem Anspruch 2 aufrecht erhalten bleibt.
48
Sie tritt der Auffassung der Klägerin in allen Punkten entgegen und verteidigt das Streitpatent in der erteilten Fassung und hilfsweise isoliert den Anspruch 2. Das Streitpatent hält sie für neu gegenüber der Druckschrift NK5. Die NK5 zeige schon nicht, dass während des Einrichtungszeitraums („set-up period of time“) ein Verbotszeichen („prohibition character“) angezeigt werde. Ferner offenbare die NK5 nicht, dass mindestens eines von erkennungsfähigen gesprochenen Wörtern („recognizable speech words“) während des Einrichtungszeitraums angezeigt werde.
49
Auch die Druckschrift NK6 nehme die Lehre des Streitpatents nicht neuheitsschädlich vorweg. Hier werde das Verbotszeichen schon vor Beginn des set-up-Prozesses angezeigt, also bevor der Benutzer den Betriebszustand „listening mode“ in dem Menü 66 auswähle. Unabhängig davon zeige die NK6 insbesondere nicht, dass während des Einrichtungszeitraums erkennungsfähige gesprochene Wörter („recognizable speech words“) angezeigt würden.
50
Dem Streitpatent fehle es auch nicht an der erfinderischen Tätigkeit im Hinblick auf die Druckschrift NK9. Die NK9 unterscheide die Spracherkennungseinheit 103 funktional klar von der Spracheingabeeinheit 102. Nach der Lehre der NK9 führe die Spracheingabeeinheit 102 die Spracheingabe aus und die Spracherkennungseinheit 103 erkenne die von der Spracheingabeeinheit 102 eingegebene Sprache. Die Erkennungseinheit gemäß Merkmal 1.1.1 werde daher nur von der Spracherkennungseinheit 103, nicht aber von der Spracheingabeeinheit 102 gebildet. Die NK9 spreche an keiner Stelle an, dass die Spracherkennungseinheit 103 eine Anweisung zum Beginnen des Spracherkennungsprozesses von dem Eingabestart-Schalter 101 erhalte. Folglich offenbare die NK9 auch keinen Einrichtungszeitraum im Sinne des Merkmals 1.2 des Streitpatents. Schließlich offenbare die NK9 auch nicht das Teilmerkmal, dass erkennungsfähige Wörter angezeigt werden.
51
Der Unterschied der beanspruchten Gegenstände zur NK9 betreffe auch nicht lediglich den Inhalt der auf der Anzeige wiedergegebenen Information. Die Unterscheidungsmerkmale brächten vielmehr technische und konstruktive Unterschiede zum Ausdruck und ermöglichten eine geführte Mensch-Maschine-Interaktion. Die Unterscheidungsmerkmale leisteten demnach einen Beitrag zur Lösung eines technischen Problems mit technischen Mitteln und müssten daher entgegen der Auffassung der Klägerin bei der Beurteilung der Neuheit und der erfinderischen Tätigkeit berücksichtigt werden.
52
Ausgehend von der NK9 sei der Gegenstand des Anspruchs 1 auch nicht naheliegend, da der Fachmann für eine Kombination der NK9 mit NK5 oder NK6 keine Veranlassung habe. Die NK5 offenbare in keinem der diskutierten Szenarien (Fehlersituation, Mikrofontest), dass die Anzeige eines Verbotszeichens und der erkennungsfähigen Wörter während des Einrichtungszeitraums veranlasst werden. Die NK6 wiederum zeige schon grundsätzlich keinen Einrichtungszeitraum, der dem Merkmal 1.2 bei fachmännischer Auslegung genüge. Die Dokumente NK5 und NK6 lieferten daher keine geeignete Information, mit welcher der Fachmann das oben genannte Problem lösen könne. Folglich würde der Fachmann die NK5 oder die NK6 zur Lösung der gestellten Aufgabe nicht in Betracht ziehen. Außerdem offenbarten diese Dokumente ohnehin nicht, dass ein Verbotszeichen und wenigstens ein erkennbares Wort während eines Einrichtungszeitraums angezeigt würden.
53
Entgegen der Auffassung der Klägerin sei eine Darstellung dergestalt, dass neben einem Verbotszeichen zugleich weitere Informationen hinsichtlich eines Zeitraums nach Aufhebung des „Verbots“ angezeigt werden, zum Anmeldezeitpunkt nicht üblich gewesen. Hierbei handele es sich vielmehr um ein besonderes Charakteristikum des Streitpatents.
54
Die Lehre des Streitpatents werde auch nicht durch die Druckschrift NK10 nahegelegt. Was die NK10 selbst betreffe, so fehle es aus fachmännischer Sicht an einer Veranlassung zur Umgestaltung im Sinne der Anspruchsmerkmale. Die NK10 beschäftige sich mit dem Problem, dass die Spracheingabeeinheit 1 wegen in Konflikt stehender Anwendungen oder Anfragen nicht oder noch nicht verwendbar sei. Insofern könne es hier zu Eingabefehlern durch vorzeitige Spracheingabe kommen. Zur Lösung dieser Probleme führe die NK10 den Fachmann allerdings in eine gänzlich andere Richtung als die beanspruchte Erfindung, es werde nämlich ein Buffering der vorzeitigen Spracheingabe vorgeschlagen. In Anbetracht dieses vorgezeigten Lösungswegs würde der Fachmann es schon grundsätzlich nicht in Betracht ziehen, die NK10 im Sinne der Merkmale 1.3.1 und 1.3.2 zu modifizieren. Auch die Realisierung der Merkmale 1.1.2 und 1.2 bei der NK10 sei nicht naheliegend, denn dies würde umfassende, technische Umgestaltungen erforderlich machen. Eine Kombination mit NK5 oder NK6 lege die beanspruchte Erfindung ebenfalls nicht nahe, da der Fachmann keine Veranlassung zu einer Kombination der NK10 mit NK5 oder NK6 habe und außerdem weder die NK5, noch die NK6 sämtliche Unterscheidungsmerkmale zeigten.
55
Aus den genannten Gründen erwiesen sich auch die weiteren unabhängigen Ansprüche 3 und 4 als rechtsbeständig.
56
Auch der Anspruch 2 trage zur Lösung eines technischen Problems mit technischen Mitteln bei. Ziel der Maßnahmen in Anspruch 2 sei es, den Wechsel von Verbotszeichen auf Zulassungszeichen zuverlässig und leicht erkennbar zu machen. Dadurch werde vermieden, dass der Benutzer den Moment der Bereitschaft zur Spracherkennung verpasse.
57
Ausgehend von NK9 oder NK10 habe der Fachmann keine erkennbare Veranlassung, nach Ablauf eines Einrichtungszeitraums (der weder in NK9, noch in NK10 offenbart sei) ein Zulassungszeichen in einem anderen Modus als ein Verbotszeichen darzustellen, um die oben genannte Aufgabe zu lösen. Der Gegenstand des Anspruchs 2 sei daher nicht naheliegend.
58
Wegen der weiteren Einzelheiten des Vorbringens der Parteien wird auf die Schriftsätze der Parteien nebst Anlagen und den weiteren Inhalt der Akte Bezug genommen.
Entscheidungsgründe
59
Die auf mangelnde Patentfähigkeit (Art. 138 Abs. 1 Buchstabe a) i. V. m. Art. 54, 56 EPÜ i. V. m. Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG) des Streitpatents gestützte Klage ist zulässig aber unbegründet. Der Gegenstand des Streitpatents in der erteilten Fassung erweist sich als neu und auf erfinderischer Tätigkeit beruhend, mithin als patentfähig und damit rechtsbeständig. Auf den Hilfsantrag kam es daher nicht mehr an.
60
Soweit die Klägerin die Nichtigkeitsklage bei gleichbleibendem Nichtigkeitsgrund mit Schriftsatz vom 31. März 2021 um den Anspruch 2 erweitert hat, handelt es sich hierbei um eine zulässige Klageerweiterung gemäß § 99 Abs. 1 PatG i. V. m. § 264 Nr. 2 ZPO. Klageerweiterungen sind bis zum rechtskräftigen Abschluss des Verfahrens möglich (vgl. MüKo ZPO, 6. Auflage, 2020, § 264, Rdnr. 15)
I.
61
1. Das Streitpatent betrifft eine Spracherkennungsvorrichtung, um Sprache eines Nutzers zu empfangen und zu erkennen, sowie ein Anzeigeverfahren und ein Anzeigeverarbeitungsprogramm in der Spracherkennungsvorrichtung (Streitpatentschrift Abs. 0001; Ansprüche 1, 3 und 4). Ein Navigationssystem mit einer solchen Vorrichtung führe eine Vielzahl von Prozessen entsprechend der erkannten Sprache durch, z. B. Suche des eingegebenen Ziels, Wechsel des Anzeigemodus oder Anzeige von Staumeldungen (Abs. 0002, 0003).
62
Unter den Spracherkennungsvorrichtungen gebe es eine, die situationsabhängig eine Liste mit den jeweils erkennungsfähigen Sprachtexten auf einem Display anzeige, so dass ein Nutzer problemlos eine entsprechende Spracheingabe vornehmen könne (Abs. 0004).
63
Um während einer normalen Unterhaltung eine Spracherkennung und dadurch unabsichtlich ausgelöste Prozesse zu vermeiden, gebe es unter den Spracherkennungsvorrichtungen einige, die einen Spracherkennungsprozess (nur) nutzergesteuert, etwa durch Drücken einer Taste, auslösten. Zwischen dem Tastendruck und dem Beginn der Fähigkeit zur Spracherkennung vergehe eine bestimmte Zeitspanne, in der Vorbereitungs- und Initialisierungsprozesse o. ä. stattfänden. Daher könne in nachteiliger Weise ein Teil der Sprache nicht richtig empfangen werden, wenn ein ungeübter Nutzer sofort nach dem Drücken der Sprechtaste zu reden beginne. Dementsprechend sei es in der Vergangenheit üblich gewesen, den Nutzer durch ein akustisches Signal über den Zeitpunkt zu informieren, ab dem mit der Spracheingabe begonnen werden darf (Abs. 0005 – 0007).
64
Die Druckschrift JP 2003-177789 (NK9) offenbare die Anzeige eines Bildes mit einer Bewegung in einem vorbestimmten Displaybereich, um den Nutzer intuitiv über den Zeitpunkt zu informieren, ab dem eine Spracheingabe möglich ist (Abs. 0008). Die Druckschrift US 2005/165609 A1 zeige eine Spracherkennungsvorrichtung mit einer Schnittstelle zur Anzeige der verstrichenen Antwortzeit, in der eine Spracheingabe des Nutzers erwartet werde (Abs. 0009).
65
Ohne Hinweis auf konkreten Stand der Technik führt das Streitpatent aus, dass es einem ungeübten Benutzer bei Konzentration auf eine Spracheingabeliste schwerfalle, ein den Zeitpunkt der Spracheingabe signalisierendes Bewegtbild in einem bestimmten Displaybereich zu erkennen, um die Spracheingabe zum richtigen Zeitpunkt zu starten (Abs. 0010).
66
In Anbetracht dieses Problems sei es eine Aufgabe der Erfindung, eine Spracherkennungsvorrichtung, ein Anzeigeverfahren und ein Anzeigeverarbeitungsprogramm bereitzustellen, mittels derer der Nutzer leicht erkennen könne, wann eine Spracheingabe erfolgen soll, sogar während er eine auf einem Bildschirm des Geräts mit Spracherkennungsvorrichtung angezeigte Liste der möglichen Spracheingaben beobachte (Abs. 0011).
67
Diese Aufgabe soll u. a. mit einer Spracherkennungsvorrichtung nach Anspruch 1 gelöst werden.
68
2. Als zuständigen Fachmann sieht der Senat einen Ingenieur der Elektrotechnik oder Informatik mit Erfahrung in der Entwicklung und Implementierung von Spracherkennungssystemen.
69
3. Die Ausführungsbeispiele zeigen eine, in ein Navigationssystem 100 integrierte, Spracherkennungsvorrichtung (Merkmal
1.1), die gemäß Patentanspruch 1 zumindest eine (Sprach-)Erkennungseinheit 114, Anzeigemittel 110, (Anzeige-)Steuerungsmittel 112 und Anweisungsmittel 109 umfasst. Die Audioausgabe 107, 108 hat keinen Eingang in die Patentansprüche gefunden:
Abbildung in Originalgröße in neuem Fenster öffnen
70
Streitpatentschrift Figur 2: Navigationssystem 100 mit kolorierter Spracherkennungsvorrichtung (gelb: im Anspruch 1 genannte Komponenten)
71
Einige Merkmale des Anspruchs 1 bedürfen der Erläuterung:
72
a) Das Mikrofon 113 überführt die Sprache des Nutzers in elektrische Signale und liefert diese an die (Sprach-)Erkennungseinheit 114. Dort werden die elektrischen Signale zunächst digitalisiert und gespeichert, bevor die Sprachanalyse und der eigentliche Spracherkennungsprozess stattfinden (Merkmal
1.1.1). Dabei werden die gespeicherten Sprachinformationen mit vorbekannten erkennungsfähigen Wörtern bzw. Wortfolgen (Merkmal
1.1.3) verglichen, die bestimmten Befehlen entsprechen. Im Falle eines erkannten Befehls liefert die Erkennungseinheit 114 ein entsprechendes Steuersignal an die Systemkontrolleinheit 116 (Abs. 0043, 0044).
73
Der Fachmann liest mit, dass die vom Mikrofon 113 gelieferten elektrischen Sprachsignale in der Spracherkennungseinheit 114 vor der in der Beschreibung explizit genannten Digitalisierung gefiltert und ggfs. verstärkt werden.
74
b) Die Spracherkennungseinheit 114 ist nicht ständig einsatzbereit. Vielmehr benötigt sie nach Empfang eines Startsignals eine gewisse Zeitspanne, den sogenannten Einrichtungszeitraum, bevor sie in der Lage ist, elektrische Signale von dem Mikrofon 113 zu empfangen und den Spracherkennungsprozess auszuführen (Abs. 0044, Merkmal
1.2).
75
Der Benutzer der Spracherkennungsvorrichtung signalisiert seinen Sprechwunsch durch Drücken einer Taste des als (Fern-)Bedieneinheit ausgebildeten Anweisungsmittels 109 (Merkmal
1.1.2), das daraufhin eine Spracherkennungsbeginn-Anweisung an die Systemkontrolleinheit 116 ausgibt (Abs. 0040, 0055), die ihrerseits das Startsignal an die Spracherkennungseinheit 114 liefert (Abs. 0044, 0055). Gemäß der nachfolgend eingeblendeten Figur 3 und der zugehörigen Beschreibung (Abs. 0060) durchläuft die Spracherkennungseinheit 114 den Einrichtungszeitraum nicht nur nach dem Drücken der Sprechtaste (S1), sondern ggfs. nach jedem erkannten Sprachbefehl erneut (die Abfrage S7 startet bei positiver Antwort einen neuen Einrichtungszeitraum S2, S3):
Abbildung in Originalgröße in neuem Fenster öffnen
76
Streitpatentschrift, Fig. 3 mit Kolorierung und Kommentierung durch den Senat
77
c) Auf dem Anzeigemittel 110 (Merkmal
1.1.3) werden während des Einrichtungszeitraums der Spracherkennungseinheit 114 ein oder mehrere erkennungsfähige Wörter (Merkmale
1.1.3,
1.3.1) und ein Verbotszeichen (Merkmal
1.3.1) angezeigt (Figur 3: S3). Das Verbotszeichen soll verhindern, dass der Benutzer zu sprechen beginnt, bevor die Erkennungseinheit 114 zur Spracherkennung fähig ist. In dem nicht einschränkenden Ausführungsbeispiel umfasst das Verbotszeichen eine Sprechverbotsnachricht 2a (Abs. 0020:
a speech prohibition message 2a (an example of prohibition character) is displayed) und ein Sprechverbotssymbol 3 (
speech prohibition mark 3 (an example of prohibition image)). Damit kann das Verbotszeichen nach Merkmal
1.3.1 als Text und/oder als Symbol ausgestaltet sein. Die in der nachfolgend eingeblendeten Figur 1A dargestellte Anleitungsnachricht 4 hat keinen Eingang in die Patentansprüche gefunden:
Abbildung in Originalgröße in neuem Fenster öffnen
78
Streitpatentschrift, Fig. 1A mit Kommentierung durch den Senat
79
Die Liste der erkennungsfähigen Wörter ändert sich in Abhängigkeit des Systemzustands (Abs. 0021). Im Ausführungsbeispiel gibt der Nutzer ein Navigationsziel mit drei Sprachbefehlen ein (Abs. 0060: „
command … „Search for Destination“ … „Station“ … final destination“), d. h. die in Figur 3 dargestellten Schritte S2 bis S7 werden dreimal hintereinander durchgeführt.
80
d) Nach dem Ablauf des Einrichtungszeitraums wird auf dem Anzeigemittel 110 ein Zulassungszeichen (Merkmal
1.3.2) an der Position angezeigt, an der während des Einrichtungszeitraums das Verbotszeichen angezeigt wurde. Auch das Zulassungszeichen kann als Text und/oder Symbol ausgestaltet sein Das Ausführungsbeispiel zeigt nur eine Zulassungs
nachricht (Abs. 0026:
a speech permissionmessage2b (anexampleof permission character) is displayed), wie aus der nachfolgend eingeblendeten Figur 1B ersichtlich, wobei gemäß Beschreibung auch ein Zulassungs
symbol möglich ist, welches das Verbotssymbol ersetzt (Abs. 0029):
Abbildung in Originalgröße in neuem Fenster öffnen
81
Streitpatentschrift, Fig. 1B mit Kommentierung durch den Senat
82
e) Das Streitpatent liefert keine konkreten Zahlenwerte für die
Dauer des Einrichtungszeitraums nach Merkmal 1.2. Dieser ist zumindest so lang, dass eine verfrühte Spracheingabe des Benutzers zu besorgen ist. Zudem dürfte die Anzeige des Verbotszeichens nur dann sinnvoll sein, wenn es vom Benutzer wahrgenommen werden kann. Damit dürfte eine typische Dauer des Einrichtungszeitraums im Bereich einiger Sekunden liegen.
83
f) Nach dem Wortlaut des Anspruchs 1 bleibt offen, ob das Verbotszeichen und die Liste der erkennungsfähigen Wörter auch vor dem Einrichtungszeitraum auf dem Anzeigemittel angezeigt werden. In der Beschreibung und den Zeichnungen gibt es keine Hinweise darauf, so dass der Fachmann eine solche Ausgestaltung auch nicht mitliest.
84
g) Bei der Anzeige der erkennungsfähigen Wörter handelt es sich – wie bei der Anzeige des Verbots- und Zulassungszeichens – nicht um die Wiedergabe einer Information als solcher (Art. 52 Abs. 2 Buchst. d, Abs. 3, Art. 56 EPÜ), sondern um technische Mittel, die ein technisches Problem lösen (BGH, Urteil vom 25. August 2015 – X ZR 110/13 – Entsperrbild, Rn 18; BGH, Urteil vom 14. Januar 2020 – X ZR 144/17 – Rotierendes Menü, Rn 26). Denn durch die Merkmale 1.3.1 und 1.3.2 wird die Mensch-Maschine-Schnittstelle so gestaltet, dass Eingabefehler und unnötige Eingabeverzögerungen minimiert werden. Ohne die Anzeige der Liste der erkennungsfähigen Wörter und ohne die Anzeige des Verbots- bzw. Zulassungszeichens würde sich der Spracheingabe- bzw. –erkennungsprozess regelmäßig verlängern oder wäre – etwa für einen ungeübten Benutzer ohne Bedienungsanleitung – überhaupt nicht durchführbar.
85
Die Darstellung des mindestens einen von erkennbaren Sprachtexten auf dem Anzeigemittel erzielt die technische Wirkung, dass der beanspruchten Spracherkennungsvorrichtung ein erkennbarer Sprachtext durch den Benutzer zugeführt werden kann.
86
Die Darstellung der erkennungsfähigen Wörter, begleitet von einem Verbotszeichen, erzielt die technische Wirkung, dass der Spracherkennungsvorrichtung unmittelbar dann, wenn sie zur Spracherkennung bereit ist, und ohne Verzögerung ein erkennbarer Sprachtext durch den Benutzer zugeführt werden kann.
II.
87
Der Nichtigkeitsgrund der fehlenden Patentfähigkeit liegt nicht vor (Art. 138 Abs. 1 Buchstabe a) i. V. m. Art. 54, 56 EPÜ i. V. m. Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG).
88
1. Der Gegenstand des Anspruchs 1 erweist sich als neu gegenüber der Spracherkennungsvorrichtung gemäß der Druckschrift US 2003/0095212 A1 (NK5).
89
Die NK5 möchte tasten- und sprachgesteuerte Fernsteuerungen für Haushaltsgeräte, wie Fernseher oder Videorecorder, so weiterentwickeln, dass trotz eines einfachen Aufbaus der Fernsteuerung und des Haushaltsgeräts eine Vielzahl unterschiedlicher Befehle übertragen werden kann und der Nutzer über ein GUI (
graphical user interface) des ferngesteuerten Haushaltsgeräts eine optische Rückmeldung hinsichtlich seiner Sprachbefehle erhält (Abs. 0001 – 0023).
90
Als Lösung zeigt die NK5 eine Infrarot-Fernbedienung (10), der sowohl über Tasten (1, 1a) als auch über Sprachbefehle (V) gesteuert wird. Die entsprechenden Infrarot-Sendesignale (RK, RV) werden von Infrarot-Empfängern (21, 31) eines Fernsehers (20) empfangen. Auf dessen Bildschirm (28A) werden dem Nutzer in einem Spracherkennungsfeld (A1) Texte (TX) und graphische Symbole (IM) angezeigt, die ihm insbesondere eine Rückmeldung über die eingegebenen Sprachbefehle geben, vgl. die nachfolgend eingeblendete Figur 1 i. V. m. den Absätzen 0077 und 0078:
91
NK5, Fig. 1 mit Kommentierung und Kolorierung durch den Senat
92
Die Figur 3 der NK5 zeigt ein Blockschaltbild der Empfänger- und Auswerteschaltungen in dem Fernseher (20):
Abbildung in Originalgröße in neuem Fenster öffnen
93
NK5, Fig. 3 mit Kommentierung und Kolorierung durch den Senat
94
a) Danach ist aus der NK5 eine Spracherkennungsvorrichtung (
remote control transmitter 10,
DTV 20) gemäß Merkmal 1.1 bekannt, die eine Spracherkennungseinheit (
voice recognition section 34, dictionary 35), ein Anweisungsmittel (
talk button 8, FM detector 32, carrier detector 33), ein Anzeigemittel (
TV screen 28A, voice recognition panel A1, microphone test screen A2) und ein zugehöriges Steuermittel (
device controller 25) nach den Merkmalen 1.1.1, 1.1.2, 1.1.3 (teilweise) und 1.3 umfasst (Fig. 1, 3, Abs. 0077, 0078).
95
Hinsichtlich des Merkmals 1.1.3 kann der Fachmann der NK5 unmittelbar und eindeutig nur entnehmen, dass auf dem Bildschirm (28A) im Spracherkennungsfeld (A1) aus der erkannten Sprache des Benutzers abgeleitete Informationstexte sowie Anweisungen und Fehlermeldungen angezeigt werden (Fig. 6, Schritt S26; Abs. 0138; Abs. 0175, Tab. 2). Ob der Fachmann aus den Absätzen 0055 und 0199 entnimmt, dass auch eine Liste mit erkennungsfähigen Wörtern (
candidates for the objects of voice recognition;
the candidates) anzeigbar ist (Rest von Merkmal 1.1.3) kann dahinstehen, denn jedenfalls würde sie nicht in einem Einrichtungszeitraum gemäß den Merkmalen 1.2 und 1.3.1 angezeigt, wie im Folgenden dargelegt wird.
96
Einen Überblick über die anzeigbaren Texte und Symbole (
pattern) liefern die Tabellen 1 bis 4 und die Figur 9, die nachfolgend vollständig bzw. ausschnittsweise wiedergegeben sind:
Abbildung in Originalgröße in neuem Fenster öffnen
97
NK5, Abs. 0173, 0175, Tab. 1 (Ausschnitt), Tab. 2 mit Kolorierungen durch den Senat
Abbildung in Originalgröße in neuem Fenster öffnen
98
NK5, Abs. 0178, 0181, Tab. 3, 4 mit Kolorierungen durch den Senat
99
NK5, Fig. 9
100
b) Um eine Spracheingabe zu starten (und während der gesamten Spracheingabe), drückt der Benutzer die Sprechtaste 8 an der Fernbedienung 10, die daraufhin ein IR-Signal aussendet. Der IR-Empfänger 30 empfängt dieses Signal RV; seine Schaltungen 32, 33 weisen die Spracherkennungseinheit 34 an, die Spracherkennung zu starten. Zudem wird die Steuerungseinheit 25 angewiesen, die Anzeige des Textes
Please Speak und eine bestimmte Symbolfolge (Fig. 9: Pattern 1) zu veranlassen, die den Nutzer zum Sprechen auffordert (Fig. 1, 4, 6, 9; Abs. 0078, 0084 – 0088, 0093 – 0112, 0126 – 0145, 0171 – 0179).
101
Damit entnimmt der Fachmann diesem „Normalbetrieb“ der NK5 zwar möglicherweise einen technisch bedingten Einrichtungszeitraum, es ist jedoch fraglich, ob dieser im Sinne der obigen Auslegung des Merkmals 1.2 lange genug andauert und ob das Zulassungszeichen (
Please Speak) erst nach dessen Ablauf angezeigt wird, wie von Merkmal 1.3.2 gefordert. Jedenfalls wird während des Einrichtungszeitraums weder ein Verbotszeichen noch eine Liste mit erkennungsfähigen Wörtern gemäß Merkmal 1.3.1 angezeigt.
102
c) In der Fehlersituation, in der die Sprach-Erkennungseinheit den Spracherkennungsprozess abbricht (Abs. 0181:
aborts the recognition process, Tab. 4, Zeile:
Not ready to receive voices … Pattern 3 … Text 12), stellt weder der Text
Please speak again (Abs. 0175, Tab. 2:
Text 12) ein Verbotszeichen dar, noch wird in dieser Situation eine Liste von erkennungsfähigen Wörtern angezeigt. Damit zeigt diese Fehlersituation jedenfalls nicht die Merkmale 1.2, 1.3.1 und 1.3.2.
103
d) Ein „Mikrofontest“ (Abs. 0178, Tab. 4, Zeile
microphone test; Abs. 0184 – 0186), der – bei einsatzbereiter Spracherkennungseinheit 34 – mittels des Sprachbefehls
Microphone test gestartet wird, dient der Anpassung der Spracherkennungseinheit 34 an die Spracheigenschaften des Benutzers. Während des Mikrofontests wird der Text
Now checking sound quality. Please Wait und das Pattern 4 (Fig. 9) angezeigt. Nach erfolgreicher Durchführung heißt es
Adjustment is done und Pattern 5 (Fig. 9) informiert den Benutzer über ggfs. veränderte Parameter (Abs. 0175, Tab. 2: Texte 15, 16; Abs. 0184). Während des Abspeicherns der Parameter wird kein Text, sondern nur noch das Pattern 5 angezeigt (Abs. 0185; Abs. 0173, Tab. 1, Zeilen
Start/End parameter transfer … Pattern 5 None). Um nach abgeschlossenem Mikrofontest einen Sprachbefehl eingeben zu können, muss der Benutzer die Sprechtaste 8 erneut drücken und der bereits beschriebene „Normalbetrieb“ beginnt.
104
Somit zeigt der Mikrofontest der NK5 schon keinen Einrichtungszeitraum gemäß Merkmal 1.2, denn zum einen analysiert die Spracherkennungseinheit 34 während des Tests die vom Benutzer gesprochen Worte „
Microphone test“, führt also bereits eine Spracherkennung durch, zum anderen ist sie, wie dargelegt, nach Ablauf des Mikrofontests nicht bereit, den Spracherkennungsprozess auszuführen. Zudem werden während des Mikrofontests keine erkennungsfähigen Wörter gemäß Merkmal 1.3.1 angezeigt, denn die Anzeige der Pattern 4 bzw. 5 mit den darin enthaltenen Wörter
Microphone Test und
Formant Level (Fig. 9) dient ersichtlich nicht dazu, den Benutzer über die erkennungsfähigen Wörter zu informieren. Darüber hinaus stellt die zwischenzeitliche Anzeige
Adjustment is done kein Zulassungszeichen im Sinne von Merkmal 1.3.2 dar, weil – wie ausgeführt – die Spracherkennungseinheit 34 während dieser Anzeige nicht einsatzbereit ist.
105
Nach alledem zeigt die NK5 keine Spracherkennungsvorrichtung gemäß Anspruch 1 des Streitpatents. Entsprechendes gilt für die Ansprüche 3 und 4.
106
2. Der Gegenstand des Anspruchs 1 ist auch neu gegenüber der Spracherkennungsvorrichtung gemäß der Druckschrift US 5,864,815 (NK6).
107
Die NK6 möchte visuelle Rückmeldungen eines, in einem Windows-95-Computersystem integrierten, Spracherkennungssystems liefern, ohne größere Teile des Bildschirms für längere Zeit zu blockieren (Sp. 1, Z. 17 – 37).
108
Hierzu wird der aktuelle Zustand bzw. Status (
listening, not listening, standing-by) des Spracherkennungssystems als Icon in einem bestimmten Bereich einer Taskleiste angezeigt (Fig. 2). Zusätzlich wird für einige Sekunden ein Tooltipp (
MICROSOFT VOICE) angezeigt, wenn der Nutzer die Computermaus über dem Status-Icon platziert (Fig. 3; Sp. 3, Z. 21 – Sp. 4, Z. 45). Nach einem nutzerinitiierten Zustandswechsel des Spracherkennungssystems ändert sich das Status-Icon und ein entsprechender Tooltipp (
Not listening, listening, standing-by) wird angezeigt (Fig. 4A, 4B, 4C). Nach einer Spracheingabe im Zustand
listening wird anstelle des Status-Icons ein Icon angezeigt, das die Verarbeitung der Audio-Eingabe symbolisiert (Fig. 8: Sanduhr 68) und ein Tooltipp eingeblendet, der dem Nutzer eine Rückmeldung über den erfolgreichen Sprachempfang liefert (Fig. 8:
Heard 70). Im Falle einer misslungenen Spracheingabe werden ein entsprechendes Icon (Fig. 9: Fragezeichen 72) und Tooltipp (Fig. 9:
Not recognized 74) angezeigt, wie dies in den nachfolgend eingeblendeten Figuren 2, 3, 4A, 4B, 4C, 8 und 9 dargestellt ist:
109
NK6, Fig. 2, mit Kommentierung durch den Senat
Abbildung in Originalgröße in neuem Fenster öffnen
110
NK5, Ausschnitte aus den Fig. 3, 4A, 4B, 4C, 8 und 9
111
Wenn der Benutzer den Status des Spracherkennungssystems wechseln möchte, klickt er mit der Maus auf das Status-Icon, wählt in dem sich öffnenden Menü den Punkt
Set Listening Mode und anschließend in einem Untermenü den gewünschten Zustand (
Start Listening, Standby, Stop Listening):
Abbildung in Originalgröße in neuem Fenster öffnen
112
NK6, Ausschnitt aus Fig. 7
113
Wenn eine Sprachsignaleingabe erfolgreich verarbeitet wurde, erfolgt eine Rückmeldung an den Benutzer (Sp. 6, Z. 5 – 7). Die nachfolgend eingeblendete Figur 12 zeigt diese visuelle Rückmeldung für den Fall des erfolgreichen Erkennens der Spracheingabe
What can I say?, nämlich die Auflistung der möglichen Sprachbefehle:
Abbildung in Originalgröße in neuem Fenster öffnen
114
NK6, Fig. 12 mit Kommentierung durch den Senat
115
a) Danach zeigt die NK6 eine Spracherkennungsvorrichtung (Fig. 1:
computer system 10, voice facility 28, audio input device 24) gemäß Merkmal 1.1, die ein Spracherkennungseinheit (
speech recognition engine) nach Merkmal 1.1.1 umfasst (Sp. 3, Z. 43 – 47). Da der Benutzer, wie dargelegt, über das Eingabemittel Maus die Spracherkennungsvorrichtung in den
listening-Zustand schalten kann, stellt die Maus 22 und das Betriebssystem 26 das Anweisungsmittel gemäß Merkmal 1.1.2 dar, welches Startanweisungen an die Spracherkennungseinheit liefert. Die aus der NK6 bekannte Spracherkennungsvorrichtung umfasst auch – in Übereinstimmung mit Merkmal 1.1.3 – ein Anzeigemittel (
video display 20) zum Anzeigen einer Liste von erkennungsfähigen Wörtern (Fig. 12). Die CPU 12 und das Betriebssystem 26 bilden das Steuermittel für das Anzeigemittel 20 gemäß Merkmal 1.3.
116
b) Der Fachmann kann der NK6 keinen Einrichtungszeitraum im Sinne des Merkmals 1.2 entnehmen, während dem ein Verbotszeichen und erkennungsfähige Wörter gemäß Merkmal 1.3.1 und nach dessen Ablauf ein Zulassungszeichen gemäß Merkmal 1.3.2 angezeigt würde.
117
Möglicherweise ist ein nutzerinitiierter Wechsel des Zustands der Spracherkennungsvorrichtung (Fig. 7) von
not listening zu
listening mit einer technisch bedingten Verzögerung verbunden. Der NK6 lässt sich jedoch nicht unmittelbar und eindeutig entnehmen, ob das Status-Icon, das den
not listening Zustand anzeigt, zunächst im Sinne eines Verbotszeichens stehen bleibt oder sofort umgeschaltet wird und den
listening Zustand anzeigt. Es spricht viel für die zweite Variante, denn anderenfalls würde der Nutzer – aufgrund der Nicht-Reaktion des Systems auf seine Bedienung – von einer Fehlbedienung und/oder Fehlfunktion ausgehen.
118
Aufgrund dieses anderen Zeitablaufs sind die Staus-Icons keine Verbots- bzw. Zulassungszeichen gemäß den Merkmalen 1.3.1 und 1.3.2.
119
Jedenfalls wird in dem Zeitraum der Umschaltung, unterstellt er wäre so lang, dass ein Nutzer ihn wahrnehmen kann, keine Liste mit erkennungsfähigen Wörtern angezeigt. Denn diese erscheint nur dann, wenn sie – wie einleitend dargelegt – über den Sprachbefehl
What can I say? angefordert wird (Fig. 12). Zur Erkennung dieses Anforderungsbefehls muss sich die Spracherkennungseinheit jedoch schon im
listening Zustand befinden, d. h. die Liste wird entgegen der Forderung nach Merkmal 1.3.1 nicht während eines Einrichtungszustands angezeigt.
120
Den von der Klägerin skizzierten Ablauf „
Listening – Anzeige der Liste durch den Sprachbefehl
What can I say? – Umschaltung zu
Not Listening (Listenanzeige bliebe bestehen) – Umschaltung zu
Listening (mit Einrichtungszeitraum, Listenanzeige bliebe weiterhin bestehen)“ kann der Fachmann der NK6 nicht unmittelbar und eindeutig entnehmen. Insbesondere spricht viel dafür, dass das Fenster 82 mit der Liste (Fig. 12) spätestens dann geschlossen wird, wenn der Nutzer mit der Maus einen Zustandswechsel einleitet (Fig. 7), denn die NK6 möchte – wie einleitend dargelegt – ein Spracherkennungssystem schaffen, dessen Anzeigen möglichst wenig Platz auf dem Bildschirm des Computersystems beanspruchen.
121
Zudem würden in diesem Szenario sowohl das „Verbotszeichen“, also das
not listening Icon, als auch die Liste mit den erkennungsfähigen Wörtern schon vor Beginn des „Einrichtungszeitraums“ angezeigt, also nicht erst durch an die Spracherkennungseinheit gerichtete Anweisungen veranlasst, was nach der Auslegung des Senats nicht unter den Anspruchswortlaut fällt.
122
Nach alledem ist der Gegenstand des Anspruchs 1 des Streitpatents nicht aus der Druckschrift NK6 bekannt. Entsprechendes gilt für die Ansprüche 3 und 4.
123
3. Der Gegenstand des Anspruchs 1 erweist sich als neu gegenüber der Spracherkennungsvorrichtung gemäß der Druckschrift JP 2003-177789 (NK9).
124
Im Folgenden wird auf die deutsche Übersetzung NK9a Bezug genommen (NK9b stimmt mit NK9a überein). Die JP 2003-177789 möchte – insofern übereinstimmend mit dem Streitpatent – vermeiden, dass der Benutzer einer Spracheingabevorrichtung unmittelbar nach Drücken eines Spracheingabestart-Schalters zu sprechen beginnt, obwohl die Vorrichtung noch nicht zur Spracherkennung bereit ist (NK9a, S. 5, Abs. 2).
125
Zur Lösung dieses Problems wird nach Drücken einer Sprechtaste auf einer Anzeige eine „Figur“ dynamisch von einem Anfangszustand, der ein Sprechverbot anzeigt, bis zu einem Endzustand, der die Verfügbarkeit der Spracheingabe symbolisiert, verändert. Dabei werden in der nachfolgend eingeblendeten Figur 5 der NK9a beispielhaft vier Bewegungsvarianten (gleitende Bewegung in den „Figuren“-Anzeigebereich, Änderung von transparent zu nichttransparent, vergrößern, umdrehen) der „Figur“ gezeigt, wobei noch weitere graphische Gestaltungen in der Beschreibung genannt werden (Abs. 0019 – 0023):
Abbildung in Originalgröße in neuem Fenster öffnen
126
NK9a, Fig. 5 mit Kommentierung und Kolorierung durch den Senat
127
Nach der Figur 3 umfasst die Spracherkennungsvorrichtung eine Fernbedienung (301) mit Sprechtaste (303) und Mikrofon (302), sowie eine Anzeigeeinheit (304) mit einem „Figuren“-Anzeigebereich (306) zur Darstellung der sich gemäß Figur 5 bewegenden „Figur“ (305):
128
NK9a, Figur 3 mit Kommentierung und Kolorierung durch den Senat
129
Die nachfolgend eingeblendete Figur 2 der NK9a zeigt das Blockschaltbild der Spracherkennungsvorrichtung:
Abbildung in Originalgröße in neuem Fenster öffnen
130
NK9a, Figur 2 mit Kommentierung und Kolorierung durch den Senat, Mikrofon ergänzt
131
Durch Drücken der Sprechtaste 101 wird die „Figuren“-Kontrolleinheit 104 veranlasst, auf der Anzeigeeinheit 106 die Bewegung der „Figur“ zu starten (S. 11, Abs. 0024:
104: „Figuren“-Kontrolleinheit, die gemäß dem Eingabestart-Signal vom Eingabestart-Schalter die Bewegung der „Figur“ steuert). Zudem erhält die Spracheingabeeinheit 102 von der Sprechtaste 101 ein Startsignal und beginnt darauf ihren Einrichtungsprozess (S. 12, Abs. 0026:
Die Spracheingabeeinheit 102 wird durch das Signal vom Eingabestart-Schalter 101 gestartet und bereitet sich auf den Beginn der Spracheingabe vor).
132
Die Zeitkontrolleinheit 105 überwacht den Zustand sowohl der Spracheingabeeinheit 102, als auch der Spracherkennungseinheit 103 (S. 12, Abs. 0026:
Die Zeitkontrolleinheit 105 überwacht von Zeit zu Zeit den Startstatus der Spracheingabeeinheit 102und/oder der Spracherkennungseinheit 103) und liefert entsprechende Signale an die „Figuren“-Kontrolleinheit 104.
133
Somit wird die Bewegung der „Figur“ auf der Anzeige 106, also der Übergang vom Verbots- zum Zulassungszeichen, in Abhängigkeit des Zustands der Spracheingabe- und Spracherkennungseinheit 102, 103 gesteuert (S. 12, Abs. 0026:
Dabei wird von der Zeitkontrolleinheit 105 der Startstatus der Spracheingabeeinheit (102) und/oder der Spracherkennungseinheit 103 überwacht und die „Figuren“-Kontrolleinheit (104) passt entsprechend dem Startstatus die Bewegungsgeschwindigkeit der „Figur“ an).
134
Da die Zeitkontrolleinheit 105 nicht nur den Zustand der Spracheingabeeinheit 102, sondern auch den der Spracherkennungseinheit 103 überwacht, liest der Fachmann mit, dass – auch wenn in dem Blockschaltbild der Figur 2 kein Pfeil zwischen dem Schalter 101 und der Spracherkennungseinheit 103 eingezeichnet ist – selbstverständlich beide Einheiten 102 und 103 ihren Einrichtungsprozess gleichzeitig oder nahezu gleichzeitig beginnen.
135
Der zeitliche Ablauf ist auch aus der Figur 4 der NK9 zu entnehmen:
136
NK9a, Figur 4
137
Der Einrichtungszeitraum (
Einstellzeit) der Spracherkennungseinheit 102, 103 beginnt (t = 0) mit dem Empfang der Anweisungen zum Beginnen des Spracherkennungsprozesses (
Startschalter drücken) von dem Anweisungsmittel (Startschalter 101, 303) und dauert bis zu dem Zeitpunkt (t = t1), in dem die Spracherkennungseinheit 102, 103 bereit ist, den Spracherkennungsprozess auszuführen (
Spracheingabe verfügbar).
138
Wie der Figur 4 und der zugehörigen Beschreibung zu entnehmen ist, wird während des Einrichtungszeitraums ein Sprechverbotszeichen angezeigt (
Zeitdauer für die „Figuren“-Anzeige), wobei diese Zeitdauer auch geringfügig kürzer oder länger (
dt) als der Einrichtungszeitraum sein kann.
139
Dem Fachmann ist bewusst, dass Signallaufzeiten sowie Signalverarbeitungszeiten der einzelnen Schaltungen, die zwischen dem Empfang eines Signals und dessen Auswertung vergehen (z. B. die Zeit zwischen dem Drücken des Schalters 101 bis zum Erkennen des entsprechenden Startsignals in den Schaltungen 102, 103), im Vergleich zu der Länge des Einrichtungszeitraums der Sprachverarbeitungseinheiten 102, 103, vernachlässigbar klein sind.
140
a) Nach alledem zeigt die Druckschrift NK9 eine Spracherkennungsvorrichtung (301, 304) gemäß Merkmal 1.1, die eine Spracherkennungseinheit (102, 103) nach Merkmal 1.1.1 umfasst. Dabei ist zu beachten, dass nach der Auslegung des Senats eine Spracherkennungseinheit nicht nur Hard- und/oder Software für die Sprachanalyse und –Erkennung, sondern auch vorgelagerte Schaltungen zum Empfang, zur Filterung, Verstärkung und Analog-/Digital-Wandlung der elektrischen Mikrofonsignale umfasst. Solche Schaltungen realisieren die Funktionen, die der Fachmann der Spracheingabeeinheit 102 der NK9 zuschreibt.
141
Die in den Merkmalen 1.1.2 und 1.1.3 genannten Anweisungs- bzw. Anzeigemittel sind in der NK9, wie dargelegt, durch den Spracheingabestartschalter 303 bzw. die Anzeigeeinheit 106, 304 realisiert (Fig. 2, 3). Letztere ist selbstverständlich nicht nur zur Anzeige von Grafik (den „Figuren“), sondern auch zur Anzeige von Text, wie den erkennungsfähigen Wörtern, geeignet.
142
Das Steuerungsmittel nach Merkmal 1.3 wird durch die Zeitkontrolleinheit 105 und die „Figuren“-Kontrolleinheit 104 gebildet (Fig. 2).
143
Jedenfalls die in der Figur 5C ersten drei (von links nach rechts betrachtet) „Figuren“ stellen ein (sich vergrößerndes) Sprechverbotszeichen dar, das gemäß Merkmal 1.3.1 während des Einrichtungszeitraums (Merkmal 1.2) der Spracherkennungseinheit 102, 103 auf dem Anzeigemittel 106, 304 angezeigt wird. Bei der vierten „Figur“ (ganz rechts in Fig. 5A, 5C, 5D) handelt es sich um ein Zulassungszeichen nach Merkmal 1.3.2, das für eine Sprecherlaubnis steht und an der Position 306 der Anzeigeeinheit 304 angezeigt wird, an der zuvor das Verbotszeichen angezeigt wurde.
144
b) Damit unterscheidet sich die aus der NK9 bekannte Spracherkennungsvorrichtung von dem Gegenstand des Anspruchs 1 des Streitpatents dadurch, dass keine erkennungsfähigen Wörter während des Einrichtungszeitraums angezeigt werden (Rest des Merkmals 1.3.1).
145
Der Gegenstand des Anspruchs 1 des Streitpatents ist somit nicht vollständig aus der Druckschrift NK9 bekannt. Entsprechendes gilt für die Ansprüche 3 und 4.
146
4. Der Gegenstand des Anspruchs 1 erweist sich als neu gegenüber der Spracherkennungsvorrichtung gemäß der Druckschrift JP 2002-108390 (NK10).
147
Im Folgenden wird auf die deutsche Übersetzung NK10b Bezug genommen. Die JP 2002-108390 geht – wie das Streitpatent – zwar von Spracherkennungsvorrichtungen aus, bei denen die Sprache des Nutzers nur bei gedrückter Sprechtaste empfangen und ausgewertet wird (S. 7, Abs. 0006). Im Gegensatz zum Streitpatent geht es der NK10 jedoch nicht um einen Einrichtungszeitraum einer Spracherkennungseinheit. Vielmehr wird thematisiert, dass durch Fehlbedienungen des Nutzers, z. B. Sprechbeginn vor Drücken der Sprechtaste bzw. Reden nach Loslassen der Sprechtaste, Anfangs- bzw. Endsegmente des auszuwertenden Sprachintervalls nicht erfasst werden (S. 8, Abs. 0007).
148
Zur Lösung dieses Problems wird dem Nutzer angezeigt, wann er sprechen darf. In der nachfolgend eingeblendeten Figur 6(a) ist das Ergebnis eines Versuchs mit einer Vielzahl von Personen dargestellt, nämlich wann diese – nach Drücken einer Sprechtaste, aber vor oder nach Anzeige eines Sprecherlaubniszeichens – jeweils mit dem Reden beginnen. Erwartungsgemäß ergibt sich annähernd eine Normal- oder Gauß-Verteilung, wobei einige wenige Nutzer schon vor dem angezeigten Zeichenwechsel ihre Spracheingabe starten:
Abbildung in Originalgröße in neuem Fenster öffnen
149
NK10b, Fig. 6(a) mit vom Senat hinzugefügten kolorierten Sprechverbots- bzw. Sprechzulassungszeichen (Icons) nach Fig. 4(a), 4(b)
150
Wegen dieser Nutzer wird durch das Drücken der Sprechtaste zwar die Spracherkennungseinheit umgehend aktiviert, jedoch die Sprecherlaubnis erst nach Ablauf der, wie dargelegt, empirisch ermittelten Verzögerungszeit t0 signalisiert (S. 9, 10, Abs. 0011). Dadurch wird erreicht, dass, selbst wenn der Nutzer nach dem Drücken der Sprechtaste, aber kurz vor dem Zeichenwechsel zu sprechen beginnt, eine Spracherkennung auch des Anfangssegments der Sprache durchgeführt werden kann (S. 11, Abs. 0016).
151
Die nachfolgend wiedergegebene Figur 5 der NK10b verdeutlicht das Timing der Tastenbetätigung (
Schalter Ein/Aus), des Sprachaufnahmeintervalls (
Sprachaufnahme-Intervall erfindungsgemäß) und des Zeichenwechsels (
Information über die Verfügbarkeit der Spracheingabe):
Abbildung in Originalgröße in neuem Fenster öffnen
152
NK9b, Fig. 5 mit Kolorierung durch den Senat
153
Die nachfolgend wiedergegebene Figur 1 zeigt das Blockschaltbild der Spracherkennungsvorrichtung:
154
NK10b, Figur 1
155
a) Danach zeigt die Druckschrift NK10 zwar eine Spracherkennungsvorrichtung (1 – 6) mit einer Spracherkennungseinheit (5), einem Anweisungsmittel (3, 4), einer Anzeigeeinheit (6) und einer Steuereinheit (2, 4) gemäß den Merkmalen 1.1, 1.1.1, 1.1.2, 1.1.3 und 1.3.
156
Möglicherweise liest der Fachmann bei der NK10 auch noch mit, dass die Spracherkennungseinheit (5) einen sehr kurzen „Einrichtungszeitraum“ aufweist, der sich von dem Empfang der Startanweisung der Einheit zu Detektion der Schalterstellung (4) bis zu dem Zeitpunkt der Bereitschaft zur Spracherkennung erstreckt, auch wenn ein solcher Einrichtungszeitraum in der Figur 5 nicht dargestellt ist. Weiter liest der Fachmann möglicherweise mit (Fig. 5), dass das Sprechverbotszeichen (auch) während dieses „Einrichtungszeitraums“ angezeigt wird.
157
Jedoch ist weder der „Einrichtungszeitraum“ der Spracherkennungsvorrichtung gemäß Merkmal 1.2 ausreichend lang, noch wird nach Ablauf dieses „Einrichtungszeitraums“ gemäß Merkmal 1.3.2 das Verbots- durch ein Zulassungszeichen ersetzt, denn dies vollzieht sich gemäß NK10 erst nach Ablauf der oben beschriebenen „Einstellzeit t0“, die nichts mit dem sehr kurzen Einrichtungszeitraum der Spracherkennungsvorrichtung zu tun hat.
158
Zudem wird weder während des kurzen „Einrichtungszeitraums“, noch während der „Einstellzeit t0“ eine Liste von erkennungsfähigen Wörtern gemäß Merkmal 1.3.1 angezeigt.
159
Danach ist der Gegenstand des Anspruchs 1 des Streitpatents nicht vollständig aus der Druckschrift NK10 bekannt. Für die Gegenstände der erteilten Ansprüche 3 und 4 gilt Entsprechendes.
160
5. Der Gegenstand des Anspruchs 1 beruht auf einer erfinderischen Tätigkeit gegenüber der Spracherkennungsvorrichtung gemäß der Druckschrift JP 2003-177789 (NK9).
161
a) Wie zur Neuheit dargelegt, unterscheidet sich die aus der NK9 bekannte Spracherkennungsvorrichtung von dem Gegenstand des Anspruchs 1 des Streitpatents dadurch, dass sie keine erkennungsfähigen Wörter während des Einrichtungszeitraums der Spracherkennungseinheit anzeigt (Teil des Merkmals 1.3.1).
162
b) Wie zur Auslegung dargelegt, handelt es sich bei der Anzeige der erkennungsfähigen Wörter während des Einrichtungszeitraums um ein Mittel, das ein technisches Problem mit technischen Mitteln löst und daher bei der Prüfung auf Patentfähigkeit zu berücksichtigen sind.
163
c) Der Fachmann mag bei der NK9 erkennen, dass die Spracherkennung durch einen ungeübten Benutzer, dem der Sprachschatz nicht vertraut ist, beeinträchtigt sein kann. Insofern steht er ausgehend von der NK9 vor der Aufgabe, die dortige Mensch-Maschine-Schnittstelle zu verbessern. Bei der Suche nach Lösungen stößt er auf die Druckschriften NK5 und NK6, die jeweils die Anzeige einer Liste mit erkennungsfähigen Wörtern auf der Anzeige einer Spracherkennungsvorrichtung offenbaren (NK5, Abs. 0055:
candidates for the objects of voice recognition; NK6, Fig. 12:
… a list of commands you can speak …).
164
Der Fachmann hat jedoch keine Veranlassung, ausgehend von der NK9 eine solche Liste bereits während des Einrichtungszeitraums der Spracherkennungseinheit anzuzeigen. Denn die NK9 möchte ein zu frühes Sprechen des Benutzers gerade verhindern und erreicht dies – wie das Streitpatent – durch das Anzeigen eines Verbotszeichens während des Einrichtungszeitraums und durch die Ersetzung des Verbotszeichens durch ein Zulassungszeichen nach Ablauf des Einrichtungszeitraums.
165
Die gleichzeitige Anzeige einer Liste mit erkennungsfähigen Wörter und des Verbotszeichens birgt jedoch die Gefahr, dass der Benutzer sich zum Sprechen animiert fühlt, d. h. die Liste als Aufforderung zum Sprechen versteht. Dabei ist zu berücksichtigen, dass gemäß der NK9 (Fig. 3) das Verbotszeichen nur in einem, insbesondere vergleichsweise kleinem, Teilbereich des Bildschirms angezeigt wird. Damit würde bei der Anzeige der Liste in dem übrigen, vergleichsweise größeren, Teilbereich des Bildschirms der Blick des Benutzers von dem Verbotszeichen in Richtung Liste gelenkt, was die Wahrscheinlichkeit eines unerwünschten Sprechbeginns während des Einrichtungszeitraums erhöhen würde.
166
Insofern würde der Fachmann ausgehend von der NK9 die Liste mit den erkennungsfähigen Wörtern erst nach Ablauf des Einrichtungszeitraums anzeigen.
167
Damit ergibt sich der Gegenstand des Anspruchs 1 nach Streitpatent nicht in naheliegender Weise aus dem Stand der Technik. Gleiches gilt für die Gegenstände der Ansprüche 3 und 4.
168
d) Soweit das Streitpatent von dem Problem ausgeht, dass sich ein Benutzer auf eine Liste von Sprachtexten konzentriert, selbst wenn ein Bild mit einer Bewegung oder dergleichen in einem vorbestimmten Bereich des Bildschirms angezeigt wird, so dass es für den Benutzer schwierig ist, den Zeitpunkt zu erkennen, zu dem er eine Spracheingabe machen soll (Absatz 0010), so enthält diese Problembeschreibung offensichtlich bereits Lösungselemente, einen entsprechenden Stand der Technik hat die Klägerin aber jedenfalls nicht nachgewiesen.
169
6. Auch ausgehend von der Druckschrift NK10 ergibt sich der Gegenstand des Anspruchs 1 des Streitpatents für den Fachmann nicht in naheliegender Weise. Hier gelten die vorstehenden Ausführungen zur NK9 bezüglich des Nicht-Naheliegens des Merkmals 1.3.1 in entsprechender Weise. Zudem weist die aus der NK10 bekannte Spracherkennungsvorrichtung, wie dargelegt, keinen hinreichend langen Einrichtungszeitraum gemäß Merkmal 1.2 auf, und die Zeitspanne zwischen dem Drücken der Sprechtaste und dem Icon-Wechsel beträgt nur wenige Hundert Millisekunden (NK10b, Abs. 0039), so dass der Fachmann keine Veranlassung hat, parallel zum Verbotszeichen eine Liste mit erkennungsfähigen Wörtern anzuzeigen.
170
Gleiches gilt für die Gegenstände der Ansprüche 3 und 4.
III.
171
Die Kostenentscheidung basiert auf § 84 Abs. 2 PatG i. V. m. § 91 Abs. 1 ZPO.
172
Die Entscheidung über die vorläufige Vollstreckbarkeit folgt aus § 99 Abs. 1 PatG i. V. m. § 709 S. 1 und S. 2 ZPO.