Автор: Пользователь скрыл имя, 01 Февраля 2013 в 20:49, реферат
Для развития любого человеческого общества необходимы материальные, инструментальные, энергетические и информационные ресурсы. Настоящее время - это период, характеризующийся небывалым ростом объема информационных потоков. Это относится как к экономике, так и к социальной сфере. Наибольший рост объема информации наблюдается в промышленности, торговле, финансово-банковской и образовательной сфере. Например, в промышленности рост объема информации обусловлен увеличением объема производства, усложнением выпускаемой продукции, используемых материалов, технологического оборудования, расширением, в результате концентрации и специализации производства, внешних и внутренних связей экономических объектов.
Человек, сообразуясь с реальными условиями, на основе анализа внешней и внутренней информации, должен делать выбор, принимать массу решений относительно своей профессии, мета жительства, друзей, спутника жизни и т.п. У каждого специалиста соответственно возникают свои ситуации, связанные с необходимостью принятия решения.
Особенность современного динамичного информационного общества и новые приоритеты информационного развития могут быть вскрыты на основе анализа взаимодействия информационных потребностей и информационных ресурсов за последние столетие и десятилетие. В исследовании мы сравнили количественные данные, характеризующие динамику действующих, устаревающих и отменяемых информационных документов в течение последнего столетия и десятилетия. Для анализа взяты документы, регистрируемые в Министерстве юстиции, так как этот класс документов снабжен полной хронологической справкой об их издании, функционировании и отмене. Подробнее остановимся на особенностях последнего десятилетия.
Рисунок 5 − Динамика роста информационного потока в последнем десятилетии XX века
Сравнение данных, характеризующих динамику действующих, устаревающих и отменяемых информационных документов в течение последнего десятилетия с данными за все столетие позволяет сделать вывод не только о количественных, но и о качественных изменениях. Налицо резкая смена закона информационного развития. Действительно, количество документов в рамках каждого десятилетия до 90-х годов 20 века еще могут быть с достаточной степенью точности аппроксимированы линейной функцией. Однако далее для вновь принимаемых информационных документов такой возможности уже нет, любой, даже малый интервал времени требует аппроксимации сначала квадратичной и затем экспоненциальной функцией. Динамика обработки, отмены и снятия с учета определенных документов остается в рамках линейного закона. Такая частичная смена закона информационного развития указывает на необходимость перемен в общественных системах, связанных с производством, восприятием, и переработкой информации.
Человечество вступило в информационную эпоху и не склонно отказываться от порождаемой им информации в виде документов, бумаг, компьютерных файлов. Даже не действующие документы продолжают храниться в архивах и временами привлекаются к разнообразному учету и анализу. Люди создают новые документы, но не отменяют старые, то есть принимаемые решения не обретают завершенности. Если своевременный выбор не сделан, или сделан не некорректно, то лавинообразно нарастают информационные потоки, которые необходимо воспринимать и обрабатывать. Естественно, что неуправляемое, бесконтрольное нарастание информации вызывает тревогу.
2 Информационные задачи
Задачи, решение которых требует проведения поиска, отбора и анализа информации, будем называть информационными.
Любая конкретная информационная задача в общем случае включает в себя следующие ключевые этапы решения (рисунок 6):
Рисунок 6 − Этапы решения задачи
2.1 Формулировка задачи
Исходную постановку задачи формулирует заказчик (потребитель информации, пользователь). Часто пользователь смутно представляет себе, какая именно информация ему нужна. В силу этого он оказывается не способным четко и однозначно сформулировать существо вопроса. Для российских пользователей ситуация с формулировкой задачи усугубляется тем обстоятельством, что многие профессиональные БД являются англоязычными.
2.2 Выбор информационной системы
На этом этапе необходимо определить - какая онлайновая система вас больше всего устраивает. Выше были упомянуты наиболее известные системы - LEXIS-NEXIS, QUESTEL-ORBIT, STN. Более детальная информация содержится в справочнике Gale directory of databases. Его полная электронная версия доступна через QUESTEL-ORBIT.
К сожалению, все описания существующих информационных систем страдают серьезным недостатком: часто определить, есть ли в этой системе нужная информация можно лишь после того, как вы стали ее подписчиком и уже провели поиск в интересующей вас БД. Естественно, что при этом появляются определенные финансовые обязательства перед Вендором. Чтобы узнать, о чем рассказывает та или иная книга или статья, ее нужно прочитать. Аннотации бывает недостаточно. Поэтому, во избежание непроизводительных затрат, целесообразно обращаться к специалистам по информационному консультированию.
2.3 Разработка стратегии поиска
На этом этапе следует, прежде всего, выбрать БД или файлы (во всех крупных информационных системах база данных называется файлом), в которых целесообразно искать требуемую информацию и которые доступны в рамках применяемой онлайновой системы. Здесь помогают справочно-информационные материалы с описанием структуры файлов и их предметного наполнения. Их обычно предоставляет Вендор после заключения контракта.
Затем следует наметить основные шаги информационного исследования и последовательность их выполнения (т.е. разработать стратегию поиска). Это наиболее сложная задача, требующая знания структуры и содержания файлов, методов работы с документами или записями, из которых состоит файл, знания ценовых факторов (формы контракта с Вендором). Далее необходимо по каждому шагу составить задание на поиск (см. ниже), конкретизировать составленный стратегический план в командах поисковой системы, используемой на Host-компьютере для поиска информации. Фактически разработанная стратегия поиска позволяет сделать понятными поисковой системе вербализованные и алгоритмизированные информационные потребности пользователя.
Это своего рода информационный фильтр. Всю эту работу необходимо выполнить, не соединяясь с Host-компьютером. После этого можно приступать непосредственно к решению задачи. Чем тщательнее была проведена подготовительная работа, тем точнее будут полученные результаты и тем меньше времени и средств будет затрачено на ее решение.
Таблица 1 – Стандартный формат задания на поиск
Для |
LEXIS –NEXIS <имя библиотеки> <имя файла> <поисковый запрос> |
для |
QUESTEL-ORBIT
<имя файла> <поисковый запрос> |
В LEXIS -NEXIS библиотека - это несколько десятков или сотен файлов, объединенных по тематическому признаку. В файл включена информация или из одного информационного источника, например, газета "The New York Times" с 1982 года, или, как в случае файла PROMT, информация из полутора тысяч информационных источников. Границы между файлами или библиотеками размыты, что создает как некоторое неудобство, так и гибкость при работе с системой. Файлы состоят из документов, а те, в свою очередь, из сегментов или параграфов.
В QUESTEL-ORBIT нет разделения на библиотеки. Пользователь работает только с файлами. При этом файл в QUESTEL-ORBIT почти всегда содержит практически все информационные источники по проблеме. Например, файл CAS - Chemical Abstract Services включает в себя все статьи, доклады на конференциях, пресс-релизы компаний и тому подобную информацию, связанную с научными и коммерческими вопросами химии. Всего CAS обрабатывает более 9000 информационных источников. В QUESTEL-ORBIT файл состоит из записей.
Перечень библиотек, файлов, их полные и сокращенные имена, сведения о том, какого рода информация входит в тот или иной файл, содержатся в специальных справочных руководствах. Эти руководства пользователь получает от компании, с которой он заключил контракт на информационное обслуживание.
Рассмотрим теперь последний
компонент задания на поиск - поисковый
запрос. В поисковом запросе
Так, например, запись поискового
запроса в виде software инициирует поиск
всех документов, содержащих этот термин
(software-программное
Для того, чтобы составить задание на поиск, необходимо владеть английской терминологией, характерной для данной предметной области, знать точные английские эквиваленты ключевых слов и понятий, которые будут использоваться при поиске необходимой информации. Например, интересуясь такой темой как "запоминающие устройства для ЭВМ" вам надлежит применять термины, принятые в английском языке для этого понятия - "memory" и "storage". При этом следует определиться, какой из них подходит для вашего случая. Точный выбор ключевого слова - непростая задача. В большинство баз данных документы (записи) поступают из многих источников, а в разных регионах (странах) разными авторами публикаций для воспроизведения одного и того же понятия могут быть использованы отличные друг от друга термины. Для облегчения этой задачи в некоторых онлайновых системах (LEXIS-NEXIS) применяются встроенные вспомогательные словари и тезаурусы, в других (QUESTEL-ORBIT) - реализована возможность просмотра словаря файла.
Важным инструментом для формулирования поисковой концепции являются знаки логических операций "and" (и - логическое умножение) и "or" (или - логическое сложение), которые служат для соединения двух или нескольких ключевых слов или концепций. Поясним их использование на примерах.
Поисковый запрос "small business" (малый бизнес) and "investments" (инвестиции) вызовет поиск документов (записей), в которых упоминаются оба записанных слова.
Запрос "small business" and "Petersburg or Moscow" приведет к поиску документов, в которых наряду со словами "малый бизнес" будут также встречаться название городов "Санкт-Петербург" или "Москва". Таким образом, с помощью <and> можно уточнить поиск, сузить его область, а по операции <or> расширить ее.
Кроме вышеперечисленных операций <and> и <оr> в поисковых запросах используются и другие средства, например, операция контекстной близости W. Эти операции составляют ядро любой поисковой системы и знание их уже достаточно для решения широкого класса задач. По мере того, как приобретается опыт, можно использовать более сложные элементы поисковых систем, позволяющие различать единственное и множественное число, строчные и заглавные буквы, контролировать частоту появления ключевых слов в документе, проводить статистический анализ и перекрестный поиск.
Существуют различные формы поиска: в виде стандартного логического поиска, в режиме меню (ответы на предлагаемые системой вопросы), формулировки задачи на естественном языке (английском), в технике вербальной формулировки задачи (речевой интерфейс).
Отметим, что в LEXIS-NEXIS язык поисковой системы достаточно прост, так как большинство файлов являются полнотекстовыми, но требования к корректной формулировке стратегии поиска здесь строже. В QUESTEL-ORBIT большую часть информации составляют патенты, товарные знаки, структурные химические формулы. Файлы обладают более сложной структурой и в целом язык поисковой системы сложней, чем в LEXIS -NEXIS. С другой стороны, он предоставляет пользователю большие возможности (например, средства для статистического анализа найденной информации, перекрестного поиска и т.д.).
2.4 Решение задачи
Сеанс работы в онлайновом режиме начинается с соединения с узлом компьютерной сети, а затем с Host-компьютером выбранной информационной системы. После ввода своего пароля возможен доступ к информационным ресурсам системы. Методы решения задачи в онлайн режиме могут быть различными. Выбор метода зависит как от квалификации и опыта пользователя, так и формы контракта между пользователем и Вендором. Начинающему пользователю рекомендуется следующая простейшая схема. Прежде всего, надо позаботиться о сохранении на винчестере найденных в процессе решения задач документов. Это весьма просто и большинство коммуникационных программ, которые вы получаете при подписании контракта, имеют простые команды, позволяющие сохранять тексты, поступающие к вам на экран компьютера.
Затем следует шаг за шагом вводить задания на поиск, которые входят в предварительно составленный стратегический план. Введенное задание на поиск выполняется практически мгновенно. После каждого шага необходимо просмотреть полностью или частично найденные документы и сохранить их у себя на винчестере. Существует также форма сохранения найденных документов без их просмотра на экране компьютера. Это удобно при работе с большими отчетами, длина которых может составлять до нескольких сотен страниц.
Отметим, что при этом подходе минимизируется онлайновое время сеанса (иногда весьма дорогое), сама процедура поиска выполняется достаточно быстро. В итоге, после нескольких минут работы в онлайн режиме, можно получить солидную порцию информации, требующую для ее внимательного просмотра и анализа нескольких часов, или даже дней. Просмотрев полученные результаты, можно модифицировать свою стратегию, если она была не очень удачной, составить новый план и новые задания на поиск и повторить описанную выше процедуру в следующем онлайновом сеансе.
Как правило, только специалисты, хорошо знающие исследуемую предметную область и четко представляющие себе, какого рода информация им нужна и что является "лишним", могут себе позволить работу в полноценном интерактивном режиме по схеме типа: "запрос - ответ - беглый просмотр и анализ результатов - новый уточненный запрос и т.д.".