Created by Lena Paisdzior
over 3 years ago
|
||
Copied by Lena Paisdzior
over 3 years ago
|
||
Question | Answer |
maschinelles Sehen | • Für Menschen ist das Sehen leicht und selbstverständlich • Für Maschinen gibt es zahlreiche Herausforderungen 1)Mehrdeutigkeit („Ambiguität“) 2)Okklusion (Teilverdeckung) 3)Zu viel oder zu wenig Information 4)Perspektivenvarianz |
inverses Projektionsproblem | • Die Projektion eines Objektes auf die Retina ist eindeutig und folgt den Gesetzen der Optik • Inverses Projektionsproblem: Das Bild auf der Retina kann durch eine unendliche Anzahl von Objekten erzeugt werden • Bsp.: Ein rechtwinkliges Dreieck hat die gleiche Abbildung auf der Retina wie ein nach hinten gekipptes Trapez, oder ein unregelmäßiges Objekt in der richtigen Perspektive • Bsp.: Herr der Ringe ->Größenunterschied zwischen Gandalf und Frodo kommt dadurch zustande, dass die Personen unterschiedlich weit weg sind |
Verdeckung („occlusion“) und amodale Vervollständigung | • Menschen haben kein Problem mit dem Erkennen teilverdeckter Objekte • Amodale Vervollständigung: Wir nehmen Objekte oft als vollständig wahr, obwohl nur Teile sichtbar sind • Für Maschinen ist das ein großes Problem |
Zu viel oder zu wenig Information Objektive und subjektive Perspektiveninvarianz | • Menschen können unscharfe Objekte erkennen • Perspektivenvarianz = Fähigkeit zu erkennen, dass es sich um gleiche Objekte aus verschiedenen Perspektiven handelt |
Wahrnehmungsorganisation -Segmentierung | -wichtigste Segmentierungsoperation: Unterscheiden von Figur (Objekt) und Grund (Hintergrund) - Figur-Grund Segmentierung/ perzeptuelle Segmentierung -Regeln zur Trennung von Objekten und Gründen ->Regel 1: Ein Objekt ist entweder Figur oder Grund, nicht aber beides zugleich ->Regel 2: Eine Figur ist vor dem Hintergrund ->Regel 3: Die Kanten scheinen zum Objekt zu gehören -Kontur, die die Figur vom Grund trennt, scheint zur Figur zu gehören (Figur hat Besitz der Kontur) ->Regel 4: Elemente, die a) symmetrisch oder b) klein sind, c) auf den Kardinalachsen liegen oder d) bedeutungsvoll sind, werden eher als Figur gesehen ->Regel 5: Die Figur lässt sich leichter merken als der Grund |
Wahrnehmungsorganisation -Gruppieren | -wichtigste Gruppierungsorganisation: Zuordnen von Teilen zu einem Objekt |
Prägnanz Ähnlichkeit | - „Gesetz der guten Gestalt“ oder „Gesetz der Einfachheit“ -Ein Reizmuster wird so gesehen, dass die resultierende Struktur so einfach wie möglich ist -Dinge die Ähnlich sind, werden als zusammengehörig wahrgenommen |
Nähe Gute Fortsetzung | -Dinge, die einander räumlich nahe sind werden als zusammengehörig angesehen -Prinzip der guten Fortsetzung/ des guten Verlaufs -Punkte, die als gerade oder sanft geschwungene Linie gesehen werden können, wenn man sie verbindet, werden als zusammengehörig wahrgenommen -Linien werden tendenziell so gesehen, als folgten sie dem einfachsten Weg ohne scharfe Kurven |
gemeinsame Region Bedeutungshaltigkeit | -Elemente, die innerhalb einer gemeinsamen Region liegen, werden zusammengruppiert -Vertrautheit -z.B. Gesichterwahrnehmung -Abbildung: Links erkennt man leicht als Silhouette einer Frau, die Somit die Figur auf weißem Grund ist. Rechts sind der schwarze und weiße Teil gleich-berechtigter als Figur |
Fortlaufende Verbundenheit Gleichzeitigkeit Gemeinsames Schicksal | -Verbundene Elemente mit gemeinsamen visuellen Charakteristiken wie Helligkeit, Farbe, Textur oder Bewegung werden zusammengruppiert -Dinge, die zugleich passieren, werden als zusammengehörig wahrgenommen -Dinge, die sich in die gleiche Richtung bewegen, werden als zusammengehörig wahrgenommen ->Bsp.: Vogelschwarm |
Bewertung der Gesaltungsprinzipien | • Grobe Richtlinien, keine Gesetze • Gestaltungsprinzipien und Aufmerksamkeit: -(Contra) Mack, Rock et al.: Ohne Aufmerksamkeit keine Gruppierung ->IB Experimente: Personen können keine Fragen über Gruppierung beantworten -(Pro) Driver et al.: Change Blindness ->Indirekte Maße zeigen, dass Gruppierung auch "außerhalb" der Aufmerksamkeit möglich ist -Palmer: "Gruppierungsprozesse sind später als du denkst" ->ammodale Vervollständigung findet vor Gruppierung statt ->Sie folgen etwa auf Mechanismen der Helligkeitskonstanz (oben) oder der amodalen Ergänzung (unten) |
biological motion |
-Lichtpunktläufer (Johansson, 1973, 1975)
-Bestimmte Bewegungen, insbesondere solche, die biologisch plausibel sind, werden besonders leicht
zu wahrgenommen Objekten integriert
-Menschen sind sehr gut darin, menschliche Bewegungen zu dekodieren
Image:
Image (binary/octet-stream)
|
Was ist eine Szene? | -„The place where an incident in real life or fiction occurs or occurred“ -Eine Szene ist eine Ansicht der Umgebung, die 1) Hintergrundelemente enthält und 2) vielfältige Objekte aufweist, die 3) untereinander und in Bezug auf den Hintergrund bedeutungshaltig organisiert sind -> (Epstein, 2005; Henderson & Hollingworth, 1999) -Eine Möglichkeit, Objekte und Szenen zu unterscheiden besteht darin, dass man an Objekten, aber in Szenen Handlungen ausführen kann -Bsp.: Wenn wir die Straße hinuntergehen und einen Brief einwerfen, führen wir in der Straße (der Szene) eine Handlung am Briefkasten (dem Objekt) aus |
Wahrnehmung der Bedeutung einer Szene -Paradoxon | -Paradoxon: Szenen sind einerseits häufig groß und komplex, wir können sie aber meist schon innerhalb von Sekundenbruchteilen erfassen ->Obwohl das Erkennen von Objekten mühsam und aufwändig ist, ist das Erkennen der Szenenkategorie ("Gist") erstaunlich effizient |
Wahrnehmung der Bedeutung einer Szene -Gist | -Bedeutung der Szene (Gist) = Das, was eine Szene im Wesentlichen inhaltlich beschreibt ->Bsp.: Zappen durch verschiedene TV-Kanäle, bei dem man schnell die Programme wechselt und sofort die Bedeutung der flimmernden Bilder erfasst |
Studie Potter (1976) | -VL zeigte VP Bild als Zielreiz und präsentierte ihnen dann eine Sequenz von 16 sehr kurz dargebotenen Bildern (RSVP = Rapid Serial Visual Presentation), für die angegeben werden sollte, ob das Ziel gezeigt wurde oder nicht ->Detektionsaufgabe ->Ergebnis: VP konnten die Aufgabe mit nahezu 100%iger Genauigkeit erfüllen |
Studie Fei Fei (2007) | -Nachweis, wie schnell Menschen Szenen wahrnehmen: Studie Fei Fei (2007) ->Präsentation von Bildern mit unterschiedlicher Dauer, VP sollte notieren, was sie sieht ->Fei-Fei verwendete zudem ein Maskierungsverfahren, um sicherzustellen, dass die Bilder exakt innerhalb des geplanten Zeitraums zu sehen waren ->Nach den Ergebnissen ist die VP nach ca. 67 ms in der Lage, wesentliche Inhalte der Szene zu erkennen ->Bei sehr kurzen Darbietungszeiten nahmen die Probanden nur helle und dunkle Flächen auf den Bildern wahr ->Demnach wird zuerst die Bedeutung einer Szene erfasst, und erst danach werden Details und kleinere innerhalb der Szene wahrgenommen |
Studie Aude Olivia und Antonio Torrabla (2001) | -Was befähigt einen Betrachter, den Inhalt einer Szene auf einen Blick zu erfassen? ->Studie Aude Olivia und Antonio Torrabla (2001): untersuchten, welche Hinweise vom Gehirn genutzt werden, um bestimmte Kategorisierungen zu treffen ->Information, die schnell wahrgenommen werden kann und mit bestimmten Typen von Szenen assoziiert ist, wird genutzt ->Globale Bildmerkmale: helfen dabei zu erklären, wie wir den Inhalt von kurz gesehenen Szenen erfassen |
globale Bildmerkmale -Natürlichkeit -Offenheit | -texturierte Areale -Undulierend: geschwundene Kanten ->natürliche Umgebungen wie Meeresküsten -sichtbarer Horizont -wenige Objekte ->Offene Szenen wie die an einem Meer ->Wald ist ein Beispiel für eine Szene mit geringer Offenheit |
globale Bildmerkmale -Rauheitsgrad -Expansionsgrad -Farbe | Rauheitsgrad: - viele kleine Elemente ->Szenen mit geringem Rauheitsgrad weisen wie das Meer weniger kleine Elemente auf als komplexe Szenen wie ein Wald, der eine höhere Rauigkeit hat Expansionsgrad: - konvergierende Linien ->Z.B. Eisenbahnschienen, die in der Ferne zusammenlaufen, weisen auf einen hohen Expansionsgrad hin Farbe: -Manche Szenen haben charakteristische Farben, wie Blau beim Meer oder Grün und Braun beim Wald |
Regelmäßigkeit in der Umgebung | • Wahrnehmung von Objekten wird von der Szene beeinflusst, in der sie eingebettet sind • Regelmäßigkeiten in der Umgebung = Merkmale, die in einer Umgebung häufig anzutreffen sind • Wir ziehen bei der Wahrnehmung unser Wissen über die Umgebung heran, ohne angeben zu können, welche spezifischen Informationen wir dazu nutzen |
Studie Oliva & Torrabla (2007) | -Demonstration des Einflusses von Kontext auf die Wahrnehmung -“die multiple Persönlichkeit eines Flecks“ -der Fleck wird, je nach Orientierung Bildkontext, als ein anderes Objekt wahrgenommen ->Der Blob ist in allen Bildern der gleiche und wird je nach Kontext als Kaffeepott, Schuh, Auto, oder Fußgänger wahrgenommen |
"unbewusster Schluss" | -Helmholtz: „Unbewusster Schluss“ ->Herrmann von Helmholtz (1866) vermutete, dass das Gehirn einen "unbewussten Schluss" tätigt, und dabei immer die "wahrscheinlichste" Interpretation bevorzugt -Die meisten Menschen sehen ein blaues Rechteck vor einem roten Rechteck ->Doch diese Darstellung könnte durch eine sechsseitige rote Form verursacht worden sein -Abduktion – Hypothesenbildung: Der Schluss von einer Wirkung auf eine Ursache |
"unbewusster Schluss" -ABB |
Image:
Image (binary/octet-stream)
|
physikalische und semantische Regelmäßigkeiten |
-Physikalische Regelmäßigkeiten:
->Licht-kommt-von-oben Heuristik
->implizite Annahme, dass Licht von oben kommt
->Dann ist bei einer Erhebung die dem Licht zugewandte Seite hell, bei einer Vertiefung aber dunkel (durch den Schatten
-Im-Zweifel-ist-es-etwas-beaknntes Heuristik
->Video: Rotating mask illusion
Image:
Image (binary/octet-stream)
|
Warum ist die Wahrnehmung von Szenen und Objekten so effizient? | -Bildstatistiken werden verwendet, um den Gist einer Kategorie zu erkennen (Offenheit, Rauhheit, Natürlichkeit ...) -Der Kontext wird verwendet, um einzelne Objekte zu erkennen und mit Information geringer Qualität klarzukommen. -Menschen ziehen einen unbewussten Schluss, wobei "wahrscheinliche" Interpretationen bevorzugt werden. -Hierbei werden physikalische und semantische Regularitäten verwendet, um Heuristiken zu generieren ->Im Zweifel ist es etwas Bekanntes ->Licht kommt von Oben ->Dinge, die zur Szene "passen" sind mit höherer Wahrscheinlichkeit in der Szene als andere |
Want to create your own Flashcards for free with GoConqr? Learn more.