Автор: Пользователь скрыл имя, 16 Марта 2012 в 12:58, реферат
Растровая и векторная модели данных – растровые данные получаются как фотография, в виде отдельных точек, которыми манипулируют компьютерные программы. Растр применяется там, где пользователей не интересуют отдельные пространственные объекты, а интересует точка пространства как таковая с ее характеристиками (высотная отметка, глубина, влажность, тип почв и т.д.).
Ввод графической информации в ГИС
Растровая и векторная модели данных – растровые данные получаются как фотография, в виде отдельных точек, которыми манипулируют компьютерные программы. Растр применяется там, где пользователей не интересуют отдельные пространственные объекты, а интересует точка пространства как таковая с ее характеристиками (высотная отметка, глубина, влажность, тип почв и т.д.). Векторные данные используются для представления информации, которая имеет объектную природу и нуждается в анализе и манипулировании. Они хранятся в виде точек и линий, связанных геометрически и математически. Наличие атрибутов позволяет интерпретировать информацию. В большинстве ГИС данные хранятся в векторной модели, растр может использоваться в качестве «подложки» или атрибута или для представления информации о непрерывных полях (рельефе, температуре, давлении и т.п.). В общем случае растровые данные занимают много места, плохо сжимаются. Они занимают в системе подчас даже больше места, чем векторные данные со всей сопутствующей информацией. Часто для сжатия растровой информации используется метод "кодирования цвета".
Поскольку при хранении последовательности пикселей одного цвета достаточно знать только его номер и количество пикселей, то таким образом можно закодировать все изображение (pixel -Picture Element - отдельная точка, из последовательности которых строится изображение на экране монитора). При больших одноцветных площадях размер файла при таком сжатии может быть уменьшен в 5 раз.
Стандартные форматы
В растровых и в векторных цифровых моделях форма записи информации в файл в каждой конкретной системе неодинакова. Исторически сложилось так, что фирмы, специализирующиеся в области компьютерной графики, создавали каждая свои, казавшиеся им наиболее удачными, форматы графических данных. Форматом файла называется шаблон, по которому он создается. Шаблон описывает, какие именно данные (строки, одиночные символы, целые, дробные числа, символы-разделители) и в каком порядке должны быть занесены в файл. Если ГИС "знакома" с форматом, она может прочитать данные из файла этого формата и правильно их интерпретировать, и наоборот, записать свои данные в этом формате, что позволит передать их в другую систему. Различаются внутренние форматы системы и обменные форматы, используемые для обмена информацией между пользователями, работающими в разных системах. Стандартные форматы существуют как для растровой (PCX, TIFF, GIF, RLE, RLC), так и для векторной (DXF, DX90, PIC, DWG, GEN, MIF
Способы ввода графической информации в ГИС – цифрование (дигитализация) по точкам и потоком, цифрование растрового изображения на экране компьютера, или векторизация (ручная, интерактивная и автоматическая).
Дигитализация по точкам
Этот способ является самым старым из всех перечисленных. Оператор обводит курсором дигитайзера контура, нажимая при этом необходимые кнопки. При каждом нажатии в компьютер посылается код о координатах курсора. Этот метод не требует специальной аппаратуры, кроме дигитайзера и сложного программного обеспечения, однако, является очень трудоемким. При цифровании по точкам ошибки оператора неизбежны.
Дигитализация потоком
Этот метод практически ничем не отличается от предыдущего, это скорее другой режим работы дигитайзера, при котором с планшета дигитайзера, по сути представляющего собой проволочную сетку, сигнал в компьютер будет подаваться не при нажатии на клавишу курсора, а при пересечении курсором линий сетки, что избавляет от необходимости постоянно нажимать на клавишу. С этим методом связано неудобство хранения большого количества, возможно, лишних координат, получающихся при пересечении линий сетки.
Ручная и интеактивная векторизация по "подложке"
Эти методы требуют специальное программное обеспечение и мощную аппаратуру, т.к. требуют большого быстродействия компьютера и значительных объемов памяти. Отсканированное изображение из файла выводится на экран, и само цифрование осуществляется по этой "подложке" при помощи мыши. Здесь каждый объект, как и в традиционном цифровании, оператор должен обвести только не на планшете, а на экране. При ручной векторизации все операции выполняет сам оператор, а при интерактивной - часть операций производится автоматически. Например, при векторизации горизонталей достаточно задать начальную точку и направление отслеживания линий. Далее векторизатор сам отследит эту линию до тех пор, пока на его пути не встретятся неопределенные ситуации (разветвление или разрыв линии). Оператор помогает программе разрешить неопределенность, и векторизация продолжается до появления новой. В основе метода лежит умение программы распознать направление "обхода" объекта в его поточечном изображении. Большинство векторизаторов, работающих в интерактивном режиме, обладают возможностями настройки на преодоление некоторых неопределенных ситуаций, что позволяет векторизовать, например, штриховые и штрих-пунктирные линии, горизонтали с бергштрихами, бровки оврагов и т.п. Возможности интерактивной векторизации прямо связаны с качеством исходного материала и сложностью карты. Несмотря на трудоемкость, эти способы позволяют добиться гораздо большей точности, чем при обычно цифровании дигитайзером, поскольку линии проводятся прямо по сканированным линиям, а изображение на экране может быть увеличено до необходимых размеров.
Автоматическое цифрование - выбор способа ввода графической информации – при выборе следует учитывать цели работы, цену на программный продукт и трудовые затраты операторов, количество документов, которые надо обработать, уже имеющиеся программные и аппаратные средства. Следует иметь ввиду, что программные продукты для автоматического цифрования очень дороги, поэтому их следует приобретать и применять только при очень больших и постоянных объемах работ, например, при оцифровке планшетов почвенной съемки территории всей России или при каких-то других колоссальных объемах. Стоимость наиболее известных программ автоцифрования (GTX Pro.) составляет 38300 $, а (Scorpion SRV) - 16000 $ (на начало 1993 г.). При автоцифровании распределение времени следующее: 8-15% расходуется на предварительное редактирование, 3-5% - на собственно цифрование и 80-90% - на окончательное редактирование. Таким образом, автоматический перевод растровых форматов в векторные еще пока очень несовершенен.
Технология цифрования при помощи дигитайзера – классическое цифрование – ступенчатый процесс, включающий: подготовку исходной карты к цифрованию, выделение слоев и объектов, составление ведомостей на объекты, непосредственное цифрование, занесение атрибутивной информации в соответствующие файлы или таблицы. Цифрование - это перевод пространственной информации в цифровую форму. Точки, линии и площади представляются в виде последовательности пар координат.
Тематическая информация в ГИС
Возникновение баз данных
Впервые понятие «база данных» появилось в начале 60-х годов. Данные в то время обычно представлялись в виде простых последовательных файлов на магнитной ленте и зависели от программ обработки. Если менялись организация данных или тип запоминающего устройства, программисту приходилось заново переписывать программу. Существовали многочисленные версии одного и того же файла, большинство из них применялось только для одного программного продукта. Когда же появлялась необходимость в других программных продуктах, зачастую те же данные использовались в иной форме: создавался новый файл, содержащий аналогичную информацию. Это приводило к очень высокой степени дублирования данных, так называемой избыточности. Наличие огромного количества копий буквально пожирало память и порождало ряд специфических проблем, одной из которых являлось, например, одновременное обновление дублирующихся данных, без которого возникают различные версии одной и той же информации, приводящие к противоречиям в системе. С появлением БД эти проблемы были в основном сняты. БД можно определить как совокупность взаимосвязанных хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений; данные запоминаются так, чтобы они были независимы от программ, использующих эти данные; для добавления новых или модификации существующих данных, а также для поиска данных в БД применяется общий управляющий способ. Данные структурируются таким образом, чтобы была обеспечена возможность дальнейшего наращивания приложений.
Системы управления базами данных
СУБД предназначены для манипулирования текстовыми, графическими и числовыми данными с помощью ресурсов ЭВМ. Они выполняют функции формирования наборов данных (файлов), поиска, сортировки и корректировки данных. Основные принципы построения СУБД основаны на том, что для работы с текстовыми, числовыми и графическими данными достаточно реализовать ограниченное число часто используемых функций и определить последовательность их выполнения. Различают три типа моделей данных, используемых в СУБД: иерархические, сетевые и реляционные (или табличные). Появляются также СУБД, использующие гибридные модели данных. Иерархические модели получили широкое распространение в 60-х годах. Входящие в состав такой модели записи образуют древовидную структуру - каждая из них связана с одной записью, находящейся на более высоком уровне иерархии. Доступ к любой из записей осуществляется путем прохода по строго определенной цепочке узлов дерева с последующим просмотром соответствующих этим узлам записей. Эта система эффективна для достаточно простых задач, но она трудно модифицируется и поэтому не может обеспечить быстродействие, необходимое для работы в условиях одновременного модифицирования файлов несколькими прикладными системами. В сетевой модели каждый из узлов может иметь не один, а несколько узлов - родителей. Записи, входящие в состав сетевой структуры, содержат в себе указатели, определяющие местоположение других записей, связанных с ними. Такая модель позволила ускорить доступ к данным, но одна важная задача осталась нерешенной - изменение структуры базы по-прежнему требовало значительных усилий и времени. Операции модифицирования и удаления данных требовали перестановки указателей, а манипулирование данными осталось ориентированным на записи и описывалось языком процедурного типа. Для поиска отдельной записи в иерарх. или сетевой структуре программист должен вначале определить путь доступа, а затем просмотреть все записи, лежащие на этом пути. На каждом шагу приходится определять индивидуальные управляющие команды и условия, с помощью которых обрабатываются исключительные ситуации (например, обнаружение конца набора просматриваемых записей).
Реляционные СУБД
СУБД реляционного типа освобождают пользователя от всех ограничений, связанных с организацией хранения данных и спецификой аппаратуры. Изменение физической структуры базы данных не влияет на работоспособность прикладных программ, работающих с нею. Современные реляционные СУБД предоставляют мощные средства работы с данными и автоматически выполняют такие системные функции, как восстановление после сбоя и одновременный доступ нескольких пользователей к разделяемым данным. Такой подход избавляет пользователя от необходимости знать форматы хранения данных, методы доступа и методы управления памятью. Преимущества реляционных моделей данных заключаются в следующем:
В распоряжение пользователя предоставляется простая структура данных - они рассматриваются как таблицы;
Пользователь может не знать, каким образом его данные структурированы в базе - это обеспечивает независимость данных;
Возможно использование простых непроцедурных языков запросов.
В то же время у реляционной модели данных есть одно уязвимое место - организовать работу с такой БД достаточно сложно, поскольку не существует способов организации быстрого доступа пользователя к данным. Однако эта проблема решается путем применения в СУБД вспомогательных описаний путей доступа, т.е. организации индексации. При этом иногда приходится просматривать всю базу данных, но это не "смертельно" при наличии мощных ЭВМ. В реляционных БД имеется механизм блокировки, предотвращающий переход системы в противоречивое состояние в результате одновременного доступа двух или более запросов к одному и тому же элементу данных. В реляционных моделях данные собраны в унифицированные таблицы и позволяют работать с ними, не вдаваясь в подробности механизма их хранения. Пользователь может:
Заносить в базу новые данные,
Создавать и уничтожать таблицы, добавлять строки и столбцы к ранее созданным таблицам,
Создавать и уничтожать индексы,
Определять и отменять представления хранимых данных,
Изменять привилегии различных пользователей.
Табличная организация позволяет неопытному пользователю быстрее освоиться с системой. Каждая строка в таблице соответствует записи в файле, которую столбцы таблицы разбивают на поля.
Компоненты СУБД. Командный язык.
В состав большинства СУБД входит три основных компонента: командный язык, интерпретирующая система или компилятор для обработки команд и интерфейс пользователя. Командный язык служит для выполнения требуемых операций над данными. Он позволяет манипулировать данными, создавать прикладные программы, оформлять на экране и печатать формы ввода и вывода информации и т.п. Возможности СУБД в значительной степени определяются структурой и возможностями ее командного языка. Командный язык обладает следующими свойствами и характеристиками:
Средствами описания как хранимых данных, так и операций над ними (поиск и модификация);
Средствами работы с текстовыми, графическими и числовыми данными в различных представлениях;
Средствами защиты базы данных;
Возможностью определения нестандартных форматов и структур;