Originally Posted By: Harry Potter
Originally Posted By: Damocles_
Mustererkennung ist ein schönes Thema im Bereich der KI.

Ja, und es zeigt auch deutlich, was für eine unglaubliche Leistung unser Gehirn erbringt.

Wir können ein "E" erkennen, ganz egal welche Größe, Farbe oder Ausrichtung es hat. Auch die Form kann unterschiedlich sein, wir erkennen ein "E" in allen möglichen Schriftarten, und in (fast *g*) jeder Handschrift. Auch wenn wir die Schriftart zuvor noch nie gesehen haben. Trotzdem würden wir nie auf die Idee kommen, z.B. eine Krone mit 3 sichtbaren Zacken als ein um 90 Grad nach links gedrehtes "E" zu identifizieren. Oder einen Tisch mit 3 Beinen als ein um 90 Grad nach rechts gedrehtes "E".

Und das beste ist: wir erkennen ein "E" sogar dann, wenn wir nicht das komplette "E" sehen, sondern nur Teile davon. Auch wenn wir nicht so genau hinschauen, und es z.B. nur unscharf sehen, werden wir es erkennen.

Und diese Bilderkennung läuft bei uns sogar in Echtzeit ab. Ein Vogel, der nur einen Sekundenbruchteil durch unser Blickfeld fliegt, wird sofort als Vogel erkannt. Und wenn gleichzeitig auch noch eine Katze und ein Hund durchs Blickfeld laufen, werden wir die auch erkennen.

Da stellt sich mir die Frage, wie die Bilderkennung bei uns überhaupt funktioniert. Und vor allem, warum sie so schnell funktioniert, während wir oft sehr lange über andere vergangene Erinnerungen nachdenken müssen.

Und offensichtlich haben sogar so kleine Tiere wie z.B. Ameisen eine leistungsfähige Bilderkennung. Da frage ich mich, wieviel "Gehirn" überhaupt dafür notwendig ist, und ob überhaupt unser Gehirn all diese Leistungen erbringt.

Oder ob das, was unser "Bewusstsein" ausmacht, vielleicht so winzig klein ist, dass wir es bisher noch gar nicht entdeckt haben. So klein, dass es in den Kopf einer Ameise hineinpasst. Und vielleicht sogar in den Kopf der Samenzelle, aus der wir entstanden sind?! Vielleicht stammen unser Bewusstsein und unser Unterbewusstsein ja sogar aus den beiden Zellen (Samenzelle, Eizelle), aus der wir entstanden sind?! Vielleicht hatten wir ja schon vor unserer Geburt ein Bewusstsein, nur können wir uns nicht mehr daran erinnern. Weil zum Speichern von Erinnerungen ist das Gehirn zuständig, das vielleicht nichts anderes ist als nur ein riesiger Datenspeicher?!


Es gibt tatsächlich ein paar Algo. für die Erkennung von geometrischen formen in Rastergrafiken. Das ist für einen geübten tatsächlich nicht einmal schwierig:

Da kann als eine Geometrische Form zum Beispiel ein Buchstabe 'E' als Vektorgrafik dienen.

Das was in der Rastergrafik nun zu erkennen ist, dass ist, in was für einen bzw. welchen Winkel der Buchstabe gerade im Raum steht, oder was die einzelne Textzeile für einen Winkel hat. Dafür muss die Rastergrafik zunächst korrekt in ein 1-Bit-Bild umgewandelt werden. Also quasi in Komplett-Schwarz und Komplett-Weis.

Den Umweg über die Umwandlung der Rastergrafik in eine Vektorgrafik ist für das ermitteln des Winkels nicht nötig. Selbst das alte und betagte Picture Publisher von ~1998 beherrscht nach dem Bildscan eine sehr gute Auto-Winkelkorrektur. Damals war (glaub ich) Pentium III das höchste der Gefühle und trotzdem hatte der Vorgang damals schon nur ein paar Sekunden benötigt.

Jedenfalls gibt es spezielle Algos für das ermitteln eines Winkels einer Rastergrafik. Das heißt: Nach der Drehkorrektur an der Rastergrafik, kann direkt eine anderer Algo. eingesetzt werden, der Speziell darauf ausgelegt ist, vergleiche an Vektorgrafik und Rastergrafik durchzuführen. Das muss jetzt genau nur noch 4x gemacht werden. Und zwar in den folgenden Winkeln: 90°, 180°, 270° und 360° (hähä!).

Wenn jetzt aber jemand denkt, dass das drehen der Vektordaten in einer Matrix für einen derartigen Algo. schneller sei, der irrt sich.

Das ganze in Assembler (bzw. einer Maschinensprachen) umgesetzt, können direkt beim Auslesen der Pixel bereits die Drehungen beachtet werden. Blöde Umrechnungen an Vektordaten sind somit nicht nötig.

Ich habe das ganze zwar jetzt nicht Studiert, wohl aber selbst schon ein kleines OCR-Programm Programmiert.

Anbei.. nicht das wir uns alle nun missverstehen: Ich habe nur den Beitrag von "Harry Potter" und das darauf folgende Statement gelesen.

Es kann wirklich sein, dass ich mittlerweile unter anderem in der Programmierung (von Dingen ^^) zu viel Erfahrung habe um wirklich noch zwischen leicht, mittel und schwierig unterscheiden zu können.

Betrachtet man die Aussage von dir, Harry Potter, jetzt nicht allgemein, dann hast Du natürlich recht. Das heißt: Auf dich, Programm009, trifft die Aussage von Harry Potter zu.

Und jetzt Hex hex, lern! tongue

Edit2: Wollte man das menschliche Lesen imitieren, dann dürften nur die Winkel -90° bis 90° geprüft werden. Schließlich können wir Menschen keine Buchstaben und Sätze erkennen, die auf den Kopf stehen. Außer wir eignen uns die Buchstaben, auf den Kopfstehend (haha.. was für ein Wortwitz..) an.

Edit: Wenn jemand bemerkt, dass man meinen könnte, mein Text sei so, als ob darin ein paar Sätze zur Vollständigkeit fehlen würden, dann liegt dies daran, dass das auch so ist, weil ich mir die Worte für einen anderen, einen besseren Beitrag, gespart habe.

Last edited by Ocigam; 12/05/10 00:31.