Наиболее перспективный подход к созданию математической теории зрения основывается на физиологических моделях, описывающих процесс обнаружения и распознавания объектов человеком. Однако сложности, связанные с изучением этих процессов, пока не позволяют в ближайшие годы получить результаты, значимые для светотехники. Наиболее эффективный способ решения этой задачи — это максимально использовать уже имеющиеся знания о физиологии зрения и строении человеческого глаза. Также необходимо привлекать результаты, полученные в других областях науки, чтобы восполнить недостающую информацию. Физиология подробно описывает строение оптической системы человеческого глаза, включая сетчатку. Однако механизмы обработки зрительной информации на уровне сетчатки и особенно в высших отделах головного мозга находятся на начальной стадии изучения.
Из-за недостатка информации по этому вопросу можно предположить, что в ходе эволюции и естественного отбора человеческий мозг достиг наивысшего уровня развития в решении зрительных задач обнаружения и распознавания объектов. Это предположение основывается на том, что в процессе эволюции плотоядные, обладающие менее совершенным зрением, могли бы умереть от голода в борьбе с более развитыми хищниками, а травоядные с аналогичным зрением стали бы добычей первых. И те, и другие не смогли бы дать потомство, и их гены не участвовали бы в дальнейшем естественном отборе.
Эта гипотеза открывает возможность использовать один из выводов, сделанных в теории статистических решений. В частности, можно применить к зрительной системе алгоритм оптимального приёмника излучения, предложенный Шестовым в 1967 году. Среди множества алгоритмов, которые предназначены для выделения сигналов на фоне шумов, существует лишь один, который способен превзойти все остальные в решении задачи обнаружения объектов на фоне шумов. Этот алгоритм получил название «оптимального приёмника излучения», а для анализа двумерных полей яркости — «оптимального приёмника изображения» или просто «оптимального приёмника». Существует множество математических методов, которые описывают этот алгоритм. Однако, наиболее наглядным способом его представления является использование функции отношения правдоподобия. При этом мы не утверждаем, что человеческий мозг вычисляет именно эту функцию. Мы лишь предполагаем, что благодаря сложным нервным связям мозг человека реализует алгоритм, близкий к алгоритму оптимального приёмника. Функция отношения правдоподобия — это лишь удобный математический инструмент для описания этого алгоритма.
Структурная схема предлагаемой модели зрительной системы представлена ниже.
Хрусталик глаза и все его оптические элементы представлены в модели оптической системой (ОС). Сетчатка представлена в виде мозаики из N статистически независимых приемников излучения (ПИ). При этом под независимыми приемниками излучения понимаются либо отдельные приемники, либо группы приемников, подключенные через промежуточные нейроны к одному волокну зрительного нерва. Совокупность случайных сигналов в волокнах зрительного нерва mu_i поступает на устройство анализа (УА), содержащее в памяти априорную информацию о фоне и объекте. УА вычисляет одномерную функцию отношения правдоподобия Lambda, которая равна отношению вероятности возникновения в опыте по обнаружению случайной реализации Y (совокупности случайных сигналов mu_i) при условии наличия объекта в поле зрения человека (P[Y/S]) к вероятности возникновения той же реализации Y при условии его отсутствия, т.е., при условии наличия фона (P[Y/0]).
$$ \Lambda = \frac{P[Y/S]}{P[Y/0]} \quad (2.1) $$где p, q – априорные вероятности наличия и отсутствия объекта, p + q = 1.
По сути, отношение правдоподобия на вероятностном языке показывает, на что больше похож видимый человеком образ (распределение mu_i): на изображение фона с объектом (Lambda > 1) или на изображение фона без объекта (Lambda < 1).
Согласно алгоритму оптимального приемника, решение о наличии объекта в поле зрения должно приниматься при превышении Lambda над некоторым порогом Lambda_p, т.е. в соответствии с решающим правилом Lambda > Lambda_p.
Различные критерии характеризуются лишь различными численными значениями Lambda_p. Если предположить, что критерий, по которому человек принимает решение о наличии объекта, остаётся неизменным для разных задач, значение Lambda_p будет постоянным для различных типов объектов, фонов, уровней яркости и других параметров.