Модели искусственных иммунных систем и их применение в интелектуальной обработке текстов
Введение
Биологические исследования являются важным источником идей для появления новых моделей и методов в информатике. Широко известны исследования в области нейронных сетей и эволюционных алгоритмов. В этой работе будет рассмотрен довольно новый подход, основанный на иммунной системе и ее свойствах, кратко изложены ее основные модели и проблематика, а также предлагаются новые направления в исследованиях данной области.
Искусственные иммунные системы
Система иммунитета вызывает большой интерес вследствие ее важной роли в поддержании целостности организма. В упрощенном виде иммунитет представляет собой подсистему, существующую у позвоночных животных и объединяющую органы и ткани, которые защищают организм от заболеваний, идентифицируя и уничтожая опухолевые клетки и патогены. Основная роль иммунной системы заключается в распознавании всех клеток организма и классификации их как “своих” и “чужих”. Чужеродные клетки (антигены) подвергаются дальнейшей классификации с целью стимуляции защитного механизма соответствующего типа. Распознавание возбудителей усложняется их адаптацией и эволюционным развитием новых способов успешного инфицирования организма-хозяина. Попытки применить механизмы иммунной системы для решения прикладных задач породили новую область исследований - искусственные иммунные системы.
Искусственные иммунные системы (ИИС) - это адаптивные системы, построенные на основе наблюдаемых свойств и принципов функционирования естественных иммунных систем. ИИС представляют большой интерес, так как способны эффективно обрабатывать значительные объемы данных, их вычислительные возможности вытекают из свойств естественной иммунной системы. В современных исследованиях, в области ИИС, чаще всего авторы обращаются к отдельным функциям естественного иммунитета. Также распространен синтез свойств ИИС с алгоритмами из других направлений информатики.
Модели ИИС
Для объяснения иммунологических механизмов существуют различные теории и математические модели. Также имеется растущее число компьютерных моделей для имитации динамики различных компонентов иммунной системы и ее поведения в целом. Наиболее часто используются следующие три модели.
Форрест и др. предложили алгоритм отрицательного отбора для обнаружения изменений, построенный на основе принципов распознавания своего и чужого в системе иммунитета. Главное ограничение подхода состоит в вычислительной сложности создания детекторов, так как их количество растет экспоненциально по мере увеличения своего. Впоследствии Хелман и Форрест предложили более эффективный алгоритм генерации детекторов с линейной зависимостью от размерности своего.
Вторая модель основана на теории клональной селекции (отбора), которая описывает один из этапов иммунного ответа. Несмотря на сходство основных этапов данного алгоритма с генетическим алгоритмом, опишем существенные отличия данных подходов. Генетический алгоритм имеет тенденцию концентрировать целую популяцию индивидуумов к лучшему кандидату решения, а клональ-ный алгоритм позволяет получать разнообразное множество локальных решений, в том числе и глобальный оптимум. Что касается особенностей механизма работы клонального алгоритма, то следует заметить, что в данном алгоритме используется значение аффинности получаемого антитела (решения), для того, чтобы определить уровень мутации, который нужно применить к каждому члену популяции, в генетических же алгоритмах принимаемый уровень мутации обычно игнорирует пригодность индивидуального решения. Таким образом, клональный алгоритм предоставляет более адаптивные механизмы, чем генетические алгоритмы при поиске решений.
Ерне предложил гипотезу, согласно которой иммунная система представляет собой регулируемую сеть молекул и клеток, распознающих друг друга даже при отсутствии антигена. Такие структуры получили название идиотипиче-ских (иммунных) сетей. Они служат математической основой для изучения поведения иммунной системы. Теория Ерне основана на предположении, что различные клоны лимфоцитов друг от друга не изолированы, а поддерживают связь путем взаимодействия между своими рецепторами и антителами. В свою очередь антитела обладают набором специфических антигенных детерминант, называемых идиотопами. Следовательно, распознавание антигена осуществляется не единичным клоном клеток, а скорее на системном уровне, с участием различных клонов, взаимодействующих по типу антиген-антитело как единая сеть.
Актуальные проблемы
Обратим теперь внимание на проблемы связанные с исследованиями в области ИИС. Можно выделить три ключевых проблемы. Первая заключается в том, что в настоящее время существует лишь небольшое число вычислительных моделей, основанных на принципах работы иммунной системы. Это связывают с тем, что сохраняется неопределенность в основных положениях, предложенных для ее описания. Вторая проблема связана с самими исследователями - как утверждается в , некоторые исследователи лишь поверхностно изучают механизмы работы иммунной системы, что порождает публикации, ошибочно отнесенные к области ИИС. Это не означает, что подобные работы не заслуживают должного внимания, часто там изложены интересные идеи, но они имеют лишь косвенное отношение к ИИС. В качестве следующей проблемы обозначим сложность реализации механизмов иммунной системы, данная проблема существует во многих областях, где требуется моделирование сложных биологических процессов организма. Обозначив проблематику, перейдем к предполагаемым исследованиям.
Применение ИИС в задачах интеллектуальной обработки текстов
Работы по обработке текстов механизмами ИИС в основном затрагивают только классификацию текстов, не затрагивая другие обширные возможности по приложению ИИС в данной области. Например, механизм памяти, двойной пластичности и обучения в иммунной сети можно использовать для интеллектуальной обработки текста, а именно для автоматического аннотирования. Обученная сеть по шаблонным оборотам в предложениях и ключевым терминам будет выделять необходимые участки документа для последующей обработки. Во избежание проблем при обработке текстов схожих тематик, но из различных областей науки, предлагается изначально классифицировать текст и применять иммунную сеть, обученную на документах данного класса.
Другим примером может служить автоматическое определение автора текста. Данная задача решается основной функцией ИИС - распознаванием. Иммунная сеть в процессе обучения будет выстраивать связи, отвечающие за распознавание наиболее часто употребляемых автором терминов, при этом учитывать контекст, в котором они употребляются. Это достигается за счет выстраивания сложной иерархии взаимодействий между клетками-терминами в сети, которые оценивают правильность употребления выделенного термина в рассматриваемом контексте для текущего автора.
На этом возможности применения ИИС в обработке текстов не заканчиваются, и данная тематика требует более детального исследования.
Заключение
Данная работа дает представление о ИИС и возможностях, которые она открывает для ее практических применений. Уже сейчас ИИС находят свое применение во многих областях , и в дальнейшем количество областей их применения будет только увеличиваться. ИИС сравнительно новое направление среди работ по адаптации биологических процессов для решения прикладных задач, но уже очевидна важность исследований в данном направлении. Реализация, как отдельных механизмов иммунной системы, так и попытки смоделировать всю систему в различных областях науки и производства могут дать новые интересные результаты.
