Приглашаем к участию в проекте «300 ИнтелШкол-2011»

Подобие информационных объектов

Материал из Letopisi.Ru — «Время вернуться домой»

Перейти к: навигация, поиск

Сегодня в моделировании информационного пространства все чаще используется фрактальный подход, базирующийся на свойстве самоподобия информационного пространства, т.е. сохранение внутренней структуры множеств при изменениях их размеров или масштабов их рассмотрения извне.

Самоподобие информационного пространства выражается, прежде всего в том, что при его лавинообразном росте в последние десятилетия, частотные и ранговые распределения, получаемые в таких разрезах, как источники, авторы, тематика практически не меняют своей формы.

В информационном пространстве возникают, формируются, растут и размножаются кластеры – группы взаимосвязанных документов. Системы, основанные на кластерном анализе, самостоятельно выявляют новые признаки объектов и распределяют объекты по новым группам.

Как один из основных законов отражающих самоподобие информационного пространства можно назвать закон Зипфа. В 1949 году профессор филологии из Гарварда Дж. Зипф собрал достаточный статистический материал, и экспериментально показал, что распределение слов естественного языка подчиняется закону: “Если к какому-либо достаточно большому тексту составить список всех встретившихся в нем слов, а затем ранжировать эти слова, т.е. расположить их в порядке убывания частоты встречаемости в данном тексте и пронумеровать в возрастающем порядке, то для любого слова произведение его порядкового номера (ранга) этом списке и частоты его встречаемости в тексте будет величиной постоянной.

Теория фракталов тесно связана с кластерным анализом, решающим задачу выделения компактных групп объектов с близкими свойствами. Кластеризация сегодня применяется при реферировании больших документальных массивов, определении взаимосвязанных групп документов, для упрощения процесса просмотра при поиске необходимой информации, нахождения уникальных документов из коллекции, выявления дубликатов или близких по содержанию документов.

Фрактальный принцип самоподобия предполагает бесконечное дробление набора объектов с сохранением их свойств. В тематических информационных потоках, например, можно наблюдать подобие сюжетных цепочек, получаемых при уточнении запроса (конечно в определенных рамках). Вместе с тем, сегодня многими исследователями рассматривается не дробление, а естественный рост размеров информационного пространства.


Теория информационного поиска Лекция. Элементы фрактального анализа информационных потоков Дмитрий Ландэ

Инструменты
организаторы проекта
Компания ТрансТелеКом
Корпорация Intel
PH International
www.Iteach.ru
партнер проекта

Почта России

Классный Журнал

www.centersot.org


наши друзья



Жужа. Ежедневная сказка
мы поддерживаем

Образование



Установите «Letopisi NewsReader» на свой компьютер