Различные классы баз данных по предметным областям использования
Различные классы баз данных по предметным областям использования
Вступление 2
1. РАЗЛИЧНЫЕ КЛАССЫ БАЗ ДАННЫХ ПО ПРЕДМЕТНЫМ ОБЛАСТЯМ ИСПОЛЬЗОВАНИЯ 3
1.1. Документальные и документографические БД 3
1.2. Система баз данных о продукции 6
1.3. Экономическая и конъюнктурная информация 10
1.4.Фактографические базы социальных данных 11
1.5.Базы данных транспортных систем страны 14
1.6. Справочные базы для населения и организаций. 16
1.7.Система ресурсных баз данных 17
1.8. Фактографические базы и банки научных данных 19
1.9. ФБД в области культуры и искусства 23
1.10. Лингвистические БД 24
Заключение 26
Список использованной литературы 27
Вступление
В данной работе я постарался классифицировать существующие базы данных,
а так же оценить перспективы их развития в нашей стране. Классификационным
признаком является предметная область использования. Целью данной работы
является так же анализ наиболее распространенных классов БД, получивших
распространение и применение как в нашей стране, так и за рубежом.
В данной работе не акцентируется проблема передачи данных между БД, а
лишь исследуется архитектура и общая организация самих БД.
1. РАЗЛИЧНЫЕ КЛАССЫ БАЗ ДАННЫХ ПО ПРЕДМЕТНЫМ ОБЛАСТЯМ ИСПОЛЬЗОВАНИЯ
Рассмотрим классы БД, получившие к настоящему времени наибольшее
развитие в нашей стране. Это:
- документографические и документальные БД, создаваемые в органах НТИ
и средствах массовой информации;
- БД по промышленной, строительной и сельскохозяйственной продукции;
- БД по экономической и конъюнктурной информации (статистическая,
кредитно-финансовая, внешнеторговая);
- фактографические базы социальных данных, включающие сведения о
населении и о социальной среде;
- БД транспортных систем;
- справочные данные для населения и учреждений (энциклопедии и
справочники, расписания самолетов и поездов, адреса и телефоны граждан и
организаций и др.);
- ресурсные БД , включающие фактографическую информацию о природных
ресурсах (земля, вода, недра, биоресурсы, гидрометеорология, вторичные
ресурсы и отходы, экологическая обстановка);
- фактографические базы и банки научных данных, обеспечивающие
фундаментальные научные исследования;
- фактографические БД в области культуры и искусства;
- лингвистические БД, т.е. машинные словари разного типа и
назначения.
1.1. Документальные и документографические БД
Документографические БД содержат описания документов. В зависимости
от содержания описания различают документографические БД типов БО (только
библиографическое описание документа), БК (библиографическое описание и
ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат
или аннотация). Появились также полнотекстовые БД, содержащие полные тексты
документов, которые являются собственно документальными.
Документографические системы, как правило, строятся по двуконтурной
схеме: первый контур содержит документографическую БД и используется для
автоматизированного поиска документов, второй контур в случае необходимости
обеспечивает выдачу полного текста документа в виде копии первоисточника на
бумаге, микрофильме или выводит текст на экран с оптического диска (в
некоторых случаях с жесткого магнитного диска большой емкости).
В составе данного класса выделены следующие виды БД:
- по публикуемым научно-техническим документам ;
- по публикуемым документам в области общественных наук;
- по патентным документам;
- по отчетам по НИР, ОКР, программным средствам ;
- по материалам межотраслевого обмена (научно-техническим достижениям,
ППТО, ИЛ, каталожная, выставочная информация и т.п.);
- по стандартам и другой нормативно-технической документации;
- библиографические БД, создаваемые в библиотеках, книгоиздательских и
книготорговых организациях;
- реферативные и полнотекстовые БД по общественно-политической
информации, создаваемые средствами массовой информации;
- БД законодательной и правовой информации;
- документографические документографические по специальным видам
документов ;
- БД по архивным документам. Анализ состояния дел с ДБД различных
видов в стране показывает, что в настоящее время наибольшее развитие
получили ДБД документографического типа, главным образом, по опубликованным
документам в области научнотехнической информации, общественных наук,
патентным документам, отчетам по НИР, ОКР и другим видам документов,
созданные в рамках системы научно-технической информации.
В системе НТИ создан распределенный автоматизированный банк данных
(РБнД) общим объемом более 20 млн. записей.
Порядка 30-40% записей относятся к отечественным первоисточникам,
остальные - к зарубежным. В рамках РБнД созданы абонентские сети удаленных
пользователей, охватывающие все столицы союзных республик и основные
областные центры.
Доступ к БД предоставляется частями по жесткому расписанию. Доля
одновременно доступных БД составляет 20% общего объема БнД системы НТИ.
РБнД поддержан вторым контуром, обеспечивающим выдачу пользователям
исходных текстов документов. Однако, функционирование второго контура
системы НТИ в настоящее время не соответствует современным требованиям, так
как не обеспечивает гарантированного получения копии любого первоисточника
в приемлемые сроки.
Не в полной мере соответствует современным требованиям и актуальность
записей в РБнД системы НТИ, так как сроки поступления первоисточников в
России, обработки их и ввода в БД в совокупности составляют несколько
месяцев.
К документографическим БД НТИ тесно примыкают библиографические БД,
создаваемые в библиотеках, книгоиздательских и книготорговых организациях.
Функции этих систем совпадают почти полностью, что делает целесообразным их
объединение.
Крупным недостатком сложившейся системы следует признать полное
отсутствие полнотекстовых БД научно-технической информации, в особенности,
полнотекстовых БД стандартов и нормативно-технической документов. Однако
широкое распространение полнотекстовых БД общенормативного и нормативно-
правового характера радует.
Средствами массовой информации (в основном центральны ми) создан и
ведется ряд БнД по общественно-политической информации. Основная проблема
БнД средств массовой информации заключается в полном отсутствии координации
их создания и ведения, откуда проистекает разнобой в технологии,
технических решениях, подходах к отбору и обработке информации.
Документографические БД по специальным видам документов функционируют
для документов следующих видов:
Картографические документы - в ГБЛ и ГУГК. Эти документографические БД
представляют собой, в сущности, обычные библиографические БД. В настоящее
время объем совокупного БнД картографических документов незначителен.
- Чертежно-конструкторские и проектные документы. Документографические
БД по документам этого вида существуют на отдальных предприятиях, где они
разрабатываются, как правило, самостоятельно с использованием имеющихся
программно-аппаратных средств. В результате полученные массивы, как
правило, не совместимы между собой. Кроме того, эти массивы создаются в
интересах управления деятельностью самого предприятия, и заинтересованность
предприятия-генератора в предоставлении доступа к ним внешних потребителей
обычно отсутствуют.
По-видимому, в настоящее время вопрос о включении этих документов в
систему БД и БнД не стоит.
- Аудиовизуальные документы. В телекомпаниях существует
документографическая БД по аудиовизуальным документам Центрального
телевидения , используемая в интересах этих организаций. Теледоступ внешних
потребителей к этой БД технически осуществим, но в настоящее время не
предусматривается руководством этой организации. Формирование
документографического БнД по архивным документам фактически только
началось. Основная проблема в этом виде БнД состоит в очень большом объеме
данных, подлежащих переработке и вводу в БнД, что потребует больших затрат
и длительного времени. Задача облегчается наличием четкой структуры
архивных органов и существованием координации этой работы между ними.
В целом можно отметить, что в стране существует несколько отдельных, не
связанных между собой систем документографических БнД и отдельных БД этого
класса, между которыми не всегда обеспечивается совместимость даже по
данным. Планомерное и скоординированное развитие таких систем можно
отметить только внутри следующих подсистем: документов научно-технической
информации; по общественным наукам; патентных документов; отчетных
документов; документов межотраслевого обмена; стандартов и нормативно-
технической документов; законодательных документов; архивных документов.
Между этими подсистемами координация слаба или отсутствует.
В других подсистемах нет и внутренней координации. Вместе с тем, и в
тех подсистемах, которые развиваются планомерно, имеет место совершенно
неоправданное дублирование функций, связанное с искусственным разделением
информационных потоков по отрасли-источнику на общие документальные потоки
и потоки группы отраслей промышленности. Применительно к открытой
информации такое разделение излишне (а другая информация не относится к
области рассмотрения настоящей концепции).
Сопоставление состояния дел в стране и за рубежом в области
документографических БнД позволяет также отметить отсутствие или слабое
развитие, неорганизованность и разрозненность в России некоторых видов
документографических и документальных БнД, в том числе:
-реферативных и полнотекстовых ДБнД по статьям из центральных и
региональных периодических изданий (имеются БД по статьям "Правды" и
"Известий", не доступные внешним пользователям, а так же интернет-БД,
касающиеся некоторых московских коммерческих изданий);
- ДБнД обзорной и прогнозной экономической информации;
- ДБнД по научным статьям с индексами цитирования ;
- ДБнД по правительственным документам незаконодательного характера
(заявлениям, сообщениям для прессы, выступлениям государственных деятелей и
т.п.);
- ДБнД по программному обеспечению;
- ДБнД деловой и коммерческой информации;
- ДБнД по зарегистрированным торговым маркам и другие.
1.2. Система баз данных о продукции
Информация о продукции является основным видом технико-экономической
информации. Данные о продукции характеризуются:
- огромной и зачастую неупорядоченной номенклатурой (от 10 млн. до 1
млрд. наименований ), только в ОКП содержится 25 млн. позиций, в системе
чертежного хозяйства насчитывается до 16 млн. крепежных изделий, имеются
сведения более чем о 6 млн. химических соединений и т.п.;
- разнородностью и многофункциональностью применения и описания
продукции на всех этапах ее жизненного цикла;
- обилием свойств (признаков), характеризующих отдельные группы
продукции(до 200 признаков);
- многообразием областей применения продукции, охватывающих все сферы
народнохозяйственной деятельности;
- многочисленными и разнообразными связями между продукцией и другими
видами информации (связь с предприятиями-разработчиками и изготовителями,
комплектующими изделиями, сырьем и ресурсами, технологическими процессами,
работами и услугами , состоянием окружающей среды и т.п.);
- большим количеством и разнообразием категорий групп пользователей;
- наличием большого числа различающихся и неувязанных между собой
систем классификации и кодирования продукции (ОКП, ЕСКД, ЕТНВТ,
гармонизированная система описания и кодирования товаров, система
штрихового кодирования, отраслевые и локальные системы и т.п.);
Число пользователей системы баз данных по продукции достигает десятков
тысяч (предприятий промышленности и сельского хозяйства свыше 100 тыс.,
управляющих и исполнительных органов - свыше 50 тыс., кооперативы, арендные
и индивидуальные предприятия и т.п.).
Все это обусловлено тем, что с созданием продукции связано большинство
работ и услуг в области материального производства.
Состав и объем действующих баз данных о продукции. Отдельные
информационные массивы (баз данных, файлов ) по продукции создаются и
функционируют практически в рамках любой автоматизированной системы
управления, которые разрабатывались в последние 20-25 лет на
общегосударственном, отраслевом и республиканском уровнях и на уровне
отдельных предприятий.
По мере роста числа решаемых АСУ задач и в процессе их объединения во
взаимосвязанные комплексы в большей степени обнаруживались недостатки
позадачного подхода, причем особые трудности возникали в стране с увязкой и
совместным применением различных баз данных о продукции.
Дело в том, что в настоящее время многие министерства и ведомства,
предприятия и организации страны осуществляют сбор, хранение и обработку
информации, характеризующей отдельные стороны продукции и ее производства
(данные о наличие запасов, остатках, об излишнем оборудовании, по
ресурсосбережению, коммерческая информация, сведения о продукции
реализуемой в порядке оптовой торговли, экономические показатели
производства и поставок продукции, основные характеристики продукции и цены
на нее, данные о рекламациях и конъюнктуре рынка товаров народного
потребления, сведения об экспорте и импорте продукции, рекламациях
инозаказчиков, основные характеристики продукции зарубежных фирм,
предлагаемой на мировом рынке, сведения об отечественных, международных и
зарубежных стандартах), а так же бухгалтерский ее учет.В связи с этим
построение системы баз данных на основе сложившихся в стране совокупности
АСОД требует решения проблемы их ин формационной совместимости, например, в
виде специальных, стандартизированных, интерфейсов.
Основные принцыпы создания СБД по продукции Целью СБД по продукции
является оперативное обеспечение ей достоверной и актуальной информацией о
продукции для решения их практических задач.
СБД по продукции - это совокупность территориально распределенных
БД, содержащих взаимоувязанную информацию о различных аспектах продукции на
всех стадиях ее жизненного цикла, объединенных в информационно-
вычислительную сеть и основанную на унифицированной информационной
технологии сбора и обработки информации и обшесистемных методах и
средствах описания данных.
Базы данных о продукции организуются по однородным
группам(видам)продукции и другим объектам (предриятиям, регионам) и
включают:
- номенклатуру, эксплуатационно-технические, экономические,
эргономические и другие характеристики(показатели) изделий, отражающих их
потребительские свойства, область и условия применения, влияние на человека
и окружающую среду, заменяемость и взаимозаменяемость и т.п.;
- сведения о предприятиях-разработчиках и изготовителях продукции;
- данные о ценах и условиях поставок;
- другие данные, представляющие интерес для участников
рынка продукции.
СБД о продукции создается в целях демонополизации информационного рынка
и контроля за ценами на информацию о продукции с учетом условий перехода к
рыночной экономике.
Система баз данных реализуется в виде 2 классов БД:
- государственных БД, строящихся на основе системы государственной
каталогизации продукции, создаваемых для целей планирование и
налогообложения;
- коммерческих БД.
Государственная система каталогизации включает продукцию, выпускаемую
государственными организациями и ведомствами (министерство обороны,
министерство энергетики, министерство транспорта и др.).
Поступление информации о продукции в системе каталогизации может
строится как на административной, так и на экономической основе.
Коммерческие БД создаются на базе товарных бирж, предприятий оптовой
торговли, центров НТИ и других негосударственных предприятий.
При создании БД о продукции необходимо выделить организации, которые
порождают информацию, т.е. являются генераторами информации. Эта информация
и должна собираться и поддерживаться в актуальном состоянии в системе БД.
В качестве таких организаций могут выступать предприятия-изготовители
продукции. В системе СБД по продукции целесообразно организовать БнД по
группам однородной продукции на основе наиболее оснащенных вычислительных
центров, как существующих в отраслях и регионах, так и в создаваемых
ассоциациях, центрах и т.п.
Информационное обслуживание БД по продукции могут осуществлять
непосредственно генераторы информации, хотя целесообразней осуществлять
обслуживание в специализированных интегрированных БнД, как правило
региональных, которые также нужно создавать в существующих вычислительных
центрах субъекта федерации, наиболее подготовленных для ведения БнД.
Необходимо обеспечить доступ к существующим БнД по потребляемой продукции
инистерства обороны (с учетом режимных ограничений).
Координацию создания СБД по продукции должен осуществлять
государственный центр каталогизации продукции, который выполняет следующие
функции:
- организационно-методическое и нормативно-техническое обеспечение
системы ;
- ведение банка метданных;
- издание и распространение каталогов, справочников, указателей и
других информационных материалов.
В целях обеспечения совместимости и облегчения выхода на зарубежный
рынок и облегчения экспортно-импортных операций в основу создания СБД по
продукции предлагается положить ин формационную технологию по каталогизации
и международные соглашения по информационному обмену данными (типа EDIFAKT
и системы обмена электронными документами).
Основным способом решения проблемы информационной совместимости
действующих баз и банков данных о продукции является комплексная унификация
и стандартизация средств описания данных (структур, форматов, лексики и
т.д.).
1.3. Экономическая и конъюнктурная информация
Создание баз и банков экономической и конъюнктурной информации является
важным фактором функционирования общества в условиях перехода к
регулируемой рыночной экономике.
В предшествующие годы базы экономических данных создавались и
функционировали в составе АСПР Госплана СССР, ЕСИС Госкомстата России, АСФР
Минфина России, АСУ Госснаба СССР, ОАСУ Госбанка, других министерств и
ведомств, территориальных органов управления предприятий и организаций.
Развитие информационного обеспечения регулируемой рыночной экономики
будет происходить с учетом 2 основных факторов:
1.Сокращение объема отчетных данных, представляемых предприятиями и
организациями органам управления и государственной статистики.
2.Существенное возрастание информационных потребностей Совета
федерации, предприятий, организаций, населения, органов территориального и
межотраслевого управления в социально-экономической информации .
Основным направлением развития БД социально-экономической и
конъюнктурной информации является создание следующих интегрированных БД:
1.Регистры и БД учетно-статистических единиц:
- паспорта социально-экономического развития административно-
территориальных единиц(субъектов федерации, властей самоуправления)
- структурных хозяйственных единиц по всем отраслям экономики
независимо от видов собственности, в частности, регистры
промышленных , сельскохозяйственных, строительных предприятий,
научных и проектных организаций, фермерских хозяйств и т.д.;
- регистры строек.
2.Интегрированные БД для комплексного анализа состояния и развития
отраслей экономики.
3.БД годовых балансов деятельности, предприятий, организаций и их
объединений, территорий и регионов.
4.БД массовых переписей, единовременных учетов и выборочных
обследований.
5. БД по банковским трансфертам.
6.БД по доходам и расходам населения, включая БД по семейным бюджетам.
Дальнейшее развитие должны получить работы по созданию БД,
обеспечивающих международное сопоставление социально-экономического и
научно-технического развития России, субъектов федерации, отдельных
регионов, международные валютно-финансовые сопоставления и планируемых
валютных курсов, изучение эффективности внешней торговли,
платежеспособности страны.
В этих целях предусмотрено создание следущих баз данных:
- по участникам внешнеэкономических связей;
- по лицензированию;
- грузовых таможенных деклараций;
- межправительственных соглашений и протоколов;
- конъюнктурно-коммерческой информации;
- нормативных документов, регулирующих внешнеэкономическую
деятельность;
- нормативно-справочная база. Создаваемые интегрированные БД должны
формироватся с учетом интересов органов управления различного уровня ,
включая законодательные и исполнительные органы, налоговые органы,
государственные и коммерческие банки, а также в целях информирования
общественных организаций и населения.
Методологической основой создания интегрированных БД социально-
экономической и конъюнктурной информации должна служить единая система
национальных счетов, сопряженная с международными номенклатурами и
стандартами.
Создание и функционирование баз экономических данных должно
осуществляться на основе развитой системы информации , включающей систему
классификации, кодирования и стандарты в области экономической информации.
Большинство БД социально-экономической информации должно создаватся
преимущественно на основе финансирования из государственного и местного
бюджетов, а конъюнктурной информации-с привлечением средств
заинтересованных коммерческих и некоммерческих организаций.
Политика в области цен и налогов на использование БД данного класса
должна включаться в число мер антимонопольного характера и должна
регулироваться Антимонопольным комитетом. При этом возможно и целесообразно
создание коммерческих БД и БнД, конкурирующих с уже сущенствующими.
1.4.Фактографические базы социальных данных
К социальным данным относятся данные о населении и социальной среде.
Сведения о населении включают половые, социальные, медицинские и любые
другие персональные данные об отдельных личностях, а также сводные данные
о населении страны в целом и ее отдельных территориях и об определенных
группах населения: пенсионерах, квартиросъемщиках, детях школьного
возраста, женщинах и др.
Сведения о социальной среде включают данные о вакансиях,
градостроительстве, городском хозяйстве, городском пассажирском транспорте,
законах , нарушениях общественного порядка и др.
К социальным фактографическим данным отнесены также другие данные
сферы здравоохранения : о заболеваниях и их последствиях, лекарственных
средствах, медицинском оборудовании и медицинских учреждениях и т.д.
Данные о градостроительстве включают сведения о зданиях и сооружениях
, дорогах, зеленых насаждениях и транспортных маршрутах города.
Данные о городском хозяйстве содержат сведения о жилом фонде, тепло и
энергосети, водопроводной сети, электро и автотранспорте, предприятиях,
занятых переработкой отходов, ремонтом дорог и другими функциями
коммунального хозяйства.
Подавляющее большинство баз социальных данных формируется в рамках
систем местных органов власти. Источниками таких данных являются, как
правило, формализованные документы.
Потребителями баз социальных данных являются население, органы
управления различных уровней и сфер, начиная от жилищно-эксплуатационных
контор и управлений и кончая Презитдентом и Федеральным Собранием, а также
научные работники.
Все данные о личностях имеют ограниченный доступ, их содержание
контролируется населением, о чем во многих государствах были изданы законы.
Базы данных о градостроительстве и городском хозяйстве создаются за
рубежом при городских муниципалитетах и службах. Сведения о жилом и нежилом
фонде используются налоговыми органами.
Информация о зданиях, дорогах, зеленых насаждениях и транспорте
предназначена для работников служб градостроительства и экологических
служб, информация о водо-, тепло-, энергосетях города - для работников
служб, управляющих этими сетями.
В нашей стране создание баз демографических и паспортных данных о
населении находится в начальной стадии.
Довольно успешно развивается создание баз данных в системах учета и
выплаты пенсий. В 130 центрах функционируют такие системы, обслуживающие до
70% пенсионеров страны. Системы в большинстве случаев обеспечивают прямой
экономический и социальный эффект, и он возрастает при решении задач по
расчету и перерасчету пенсий непосредственно в низовых звеньях системы
социального обеспечения. Для функционирования правоохранительных органов в
г.г. Москве, Красноярске созданы и функционируют базы данных о
криминогенном контингенте населения, о преступлениях (событиях) и о
похищенных ценностях. В г.Москве закончилась разработка системы "Патруль",
обеспечивающая оперативный доступ к этим базам данных по радиоканалу и
телефонным каналам. Наиболее крупной сетью баз социальных данных является
сеть баз данных о населении. Ее объем, включая медицинские и кадровые
данные , в перспективе составит для всей страны с учетом дублирования при
хранении 1, 8 тыс.Гбт. Объем баз основных
демографических и паспортных данных без учета дублирования составит
150 Гбт. Трудности создания сети БД "Население" заключаются в больших
начальных затратах по заполнению. За рубежом персональный учет населения
окупается за счет более полного сбора налогов. В будущем и у нас появится
этот эффект. Прямой экономический эффект от базы данных о населении на
современном этапе вряд ли будет достигнут. Вместе с тем социальный эффект
может быть значительным . Поэтому проблема создания такой базы может быть
решена только на государственном уровне. Эти же трудности возникают при
создании баз данных о вакансиях и жилом фон де, также достаточно крупных.
В ближайшие годы следует ожидать изменения отношения к БД о населении
в связи с появлением новых тенденций в налоговой политике и изменением
финансового положения территориальных органов управления.
На предприятиях на базе ПЭВМ создаются многочисленные системы по
учету кадров, имеющие базы кадровых данных. Их количество в нашей стране
нигде не фиксируется и работы не координируются. Экономическая
эффективность таких систем у нас часто не достигается вследствие высокой
этой координации.
В течение ряда лет в Минздраве России функционирует система баз
статистических медицинских данных. Создание баз персональных медицинских
данных в поликлиниках и больницах ведется в нашей стране в порядке
эксперимента в Москве, Екатеринбурге и других городах.
Закончено создание баз данных о свойствах лекарственных средств и о
наличии их в аптеках города в г.г.Москве, Санкт-Петербурге и Рязани.
Планируется создание баз данных о запросах донорской крови и органов
трансплантации. Создана база медицинских данных , финансируемая органами
здравоохранения на всех уровнях.
В городах Москве, Красноярске и других созданы базы данных о жилом
фонде. Наиболее удачным следует признать создание базы данных о жилом и
нежилом фондах на основе автоматизации функций бюро технической
инвентаризации.
Большое социальное значение приобретают базы данных о вакансиях,
используемые для задач трудоустройства. Такие базы созданы в ряде городов.
Опыт их создания показал, что в городе целесообразно иметь центральный
государственный городской банк вакансий.
Базы данных о городском хозяйстве и градостроивельстве. В последнее
время в связи с появлением персональных ЭВМ стали создаватся базы,
необходимые для работы служб, занятых учетом , ремонтом, оперативным
управлением в тепло- и энергосетях и др.
При создании баз социальных данных важны следующие принципы:
1.Генератором базы является, как правило, организация-владелец
документов-источников, которая может передавать функции распространения
информации другим БнД.
2.Создание баз социальных данных необходимо производить на основе
централизованного частичного финансирования при условии финансовой
поддержки этих работ федеральными и местными органами управления. В первую
очередь следует финансово поддержать эти работы в опорных зонах
информатизации.
3.Для обеспечения унификации записей в базах данных и запросов
целесообразно создать систему баз данных в социальной сфере, совмещенную с
системой словарно-справочных служб.
4.Основное внимание следует уделить созданию баз детальных данных об
элементарных объектах , таких как отдельный человек, конретное лекарство,
конкретная квартира. Эти базы следует создавать в местах их наиболее
интенсивного использования. Так, базы данных о населении следует создавать
в ДЭЗах или РЭУ, отделениях милиции, центральном адресном бюро. Базу данных
о квартирах и строениях следует создавать в бюро технической
инвентаризации и в ДЭЗах. Сводные данные о жителях и квартирах следует
хранить в базах данных районных и городских органов управления. Допускается
дублирование данных при хранении, если это оправдано экономически.
5.В фактографических базах социальных данных велика интенсивность их
обновления (15-25% в год).Вследствие этого каналы актуализации должны
тщательно отрабатываться до на чала загрузки базы данных.
1.5.Базы данных транспортных систем страны
Исходным пунктом проектирования сети баз данных является оценка ее
современного состояния.
В рамках отдельных видов транспорта и их АСУ созданы и функционируют
как отдельные базы и банки данных, так и мощные информационные системы.
На воздушном транспорте функционирует сеть ЭВМ "Сирена",
обеспечивающая автоматизацию продажи авиабилетов. Сеть развивается и должна
охватить всю территорию страны.
На железнодорожном транспорте создана система "Экспресс". В ее функции
входит не только резервирование и продажа железнодорожных билетов, но и
выдача справок о наличии мест.
На морском транспорте в рамках информационно-поисковых систем
"Пароходства", "Порты", "Судоремотные заводы". "Суда" функционируют базы
данных для планирования и регулирования работы флота и портов, базы данных
о техническом состоянии флота.
На автомобильном транспорте в рамках информационно-поисковых систем
функционируют как документографические базы данных АСНТИ, "Изобретения",
"Нормы", "Стандарты", "Директивы", так и фактографические-"Гаро",
"Автотранспорт", "Неликвиды", "Экономика", "Строительство".
Анализ существующей структуры управления функционированием
транспортной системы России, анализ взаимосвязи ее объектов показывает, что
тематическую сеть баз данных "Транспортная система РФ" целесообразно
создавать в виде двухуровневой системы. В следствие привязки многих
транспортных объектов к экономическим районам страны, закрепления их на
конкретных территориях в республиках, областях, районах и городах,
генерация сети баз данных на низших уровнях имеет ярко выраженный
региональный характер, а на верхнем уровне требует формирования
всероссийских банков данных.
Учитывая особенности транспорта, как отрасли экономики (охват всей
территории страны, технологическая связь), в качестве возможных центров
опорных зон предлагается рассмотреть пункты размещения Управлений железных
дорог РФ, т.к. железные дороги имеют специальную связь и большой опыт
использования ее для передачи информации на значительные расстояния.
Для каждого региона предлагается создать следующие основные базы
данных о транспортной системе РФ:
1."Перевозки" о фактических грузо и пассажиропотоках.
2."Транпортная сеть"- о составе и технической вооруженности
транспортной сети всех видов транспорта.
3."Транспортные предприятия" и "Транспортные средства" соответственно
о технико-экономических характеристиках транспортных предприятий и
транспортных средств.
4."Расписание движения"- о движении пассажирских поездов, самолетов,
судов, автобусов.
Перечисленные базы данных должны составить низший уровень тематической
сети базы данных "Транспортная система РФ". На федеральном уровне
предлагается создать следующие базы данных:
"Транспортные тарифы", "Перевозки", "Транспортная сеть".
На транспорте можно выделить порядка 100-120 тыс. ин формационных
объектов (железнодорожные и автобусные станции, морские и речные порты,
аэропорты, транспортные предприятия в городах и поселках).
На транспорте насчитывается около 20 тыс. железнодорожных станций,
аэропортов, морских и речных портов, автобусных станций. Имеется более 25
тыс. железнодорожных участков, морских и речных путей, автомобильных дорог
и авиалиний.
Около 60 тыс. насчитывается предприятий ведомственного транспорта и
транспорта общего пользования. Можно выделить порядка 5 тыс. наименований
перевозочных средств транспорта.
Доля федерального и местных бюджетов в общем финансировании сети БнД
должна составить около 40%.
1.6. Справочные базы для населения и организаций.
В развитых странах существует практика использования БнД для
информационно-справочного обслуживания населения и учреждений. Для этого
организуется доступ к БнД авиаперевозчиков с целью выдачи справок,
например, о расписании самолетов и поездов ; об адресах и телефонах граждан
и организаций; о программах радио и телевидения;о проведении выставок и
т.д. Кроме того, создаются специальные информационно-справочные БнД, в
числе которых можно выделить следующие виды:
- энциклопедии и справочники;
- указатели фирм, предприятий и организаций;
- биографические данные ("Кто есть кто");
- описания новых видов потребительских товаров;
- указатели правительственных контрактов, супсидий и др.
В нашей стране этот вид БнД в настоящее время развится крупные
справочные службы предоставляют подобные услуги, в основном с
использованием ручных или автоматизированных катротек. Некоторые виды
справочных БнД отсутствуют.
Развитие справочных БнД для населения и учреждений будет происходить в
основном на коммерческой основе, однако ряд видов таких БнД целесообразно
полностью или частично финансировать за счет государства. К таким БнД
относится, например, БнД энциклопедического характера, который можно
рассматривать как электронный вариант национальной энциклопедии. Кроме
того, целесообразно предусмотреть государственное финансирование или
субсидирование создания центров справочно-информационного обслуживания
населения , организующих доступ к БД, полученным от ведомственных служб.
1.7.Система ресурсных баз данных
Проблемы природных ресурсов занимают особое место в развитии любого
государства, определяя степень его независимости и процветания.
Полная, достоверная информированность в данном вопросе с целью
контроля, анализа и прогнозирования состояния ресурсов является одной из
приоритетных потребностей в интересах объективных , научно-обоснованных
оценок возможных путей развития общества.
Существующее положение с данными о ресурсах экономики РФ можно
охарактеризовать наличием разрозненных информационных массивов в отдельных
ведомственных и отраслевых системах (некоторые республик и отраслей), а
также в базах данных отдельных предприятий и организаций.
Большое количество фактографической информации о при родных ресурсах
сосредоточено в базах научно-технической информации.
Отсутствует централизованный учет этих информационных массивов и их
систематизация.
Можно утверждать, что сейчас в стране нет полных и достоверных данных
о земельных и водных ресурсах (полноценных централизованных кадастров), о
растительном и животном мире, о состоянии лесов; нет данных о
нетрадиционных энергоресурсах и вторичных ресурсах, крайне разрозненна и
неполна информация по экологической обстановке и т.п. Требует
систематизации и пополнения информации по топливно-энергетическим ресурсам,
необходимо обновление базы данных по гидроэнергетическим ресурсам.
Систему БД природных ресурсов отличает ряд особенностей , в том числе:
- разнообразие видов объектов ресурсов БД;
- взаимозависимость и взаимозаменяемость различных видов ресурсов, а
следовательно, необходимость обеспечения информационной взаимосвязи и
сопоставимости информации о них;
- существование большого числа как централизованных , так и
региональных и ведомственных источников информации;
- различные формы представления информации в информационных потоках
(цифровой, текстовой, графической, картографи ческой и т.д.);
- большой диапазон объемов и временных параметров ин формационных
потоков, получаемых как с помощью датчиков, так и ручным вводом;
- влияние состояния ресурсов и окружающей среды одного региона на
другие.
В соответствии с изложенным систему БД о ресурсах целесообразно
проектировать в виде распределенной сети БД как в разрезе регионов, так и
видов ресурсов и их совокупностей. При этом возникает необходимость
обеспечения взаимодействия БД в процессе их функционирования. При этом
должна учитываться многоаспектность классификаций как регионов, так и
вмдов ресурсов, а следовательно характер информационных взаимосвязей.
Необходимо определить ряд общесистемных требований для возможностей
интеграции и информационной целостности совокупности ресурсных БД во
времени.
Одним из системных требований является регламентирование процесса
актуализации информации во времени. Целесообразно выделить два режима:
регламентированный и нерегламентированный, обеспечивающий актуализацию БД в
реальном времени.
Для обеспечения взаимодействия и сопоставимости данных необходимо
создание и ведение баз данных , содержащих сведения о конкретных БД
системы и структурах и режимах данных.
Подводя итог изложенного можно сформулировать следующие основные
положения концепции построения ресурсных баз данных:
1.Ресурсные БД должны создаватьвся как территориально-распределенные с
интеграцией в общую сеть БД по признакам назначения, взаимозаменяемости,
взаимозависимости. Это обуславливает следующую группировку ресурсных данных
по направлениям:
- земли, воды и водные источники, атмосфера;
- биоресурсы (животный и растительный мир, биопродуктивность земли и
вод;
- гидрометеорология;
- полезные ископаемые и энергоресурсы;
- вторичные ресурсы и отходы;
- экологическая обстановка;
- технология производства (добыча) и использования ресурсов.
Приоритетность направлений определяется на местах в зависимости от
преобладающих видов ресурсов и технологий.
2.Формирование ресурсных БД целесообразно осуществлять силами
регионов, имея в виду развивающуюся заинтересован ность местных
мунициполитетов в определении имеющейся собственности. При этом на первой
стадии данные о ресурсах могут быть включены в более информационные
массивы, например, массивы паспортов территорий , городов, предприятий.
Финансирование работ по БД должно осуществлятся в основном за счет средств
местных органов власти (нецентрализованных источников).Финансирование работ
по интеграции БД в сеть должно осуществлятся в основном за счет
нецентрализованных источников (межрегиональные связи заинтересованных
регионов), так и за счет централизованных (связи регион-центр). При этом
ассигнования из центральных источников могут выделяться в рамках
соответствующей научно-технической программы и/или как плата за пользование
региональной информацией.
3.При формировании и развитии сети источников информации для ресурсных
БД необходимо использовать наряду с имеющимися источниками возможности
конверсии .При этом имеется в виду как создание и тиражирование первичных
средств сбора информации (датчики, сигнализаторы, другие средства
контроля), так и использование некоторых систем наблюдения
и связи и транспортных средств.
4.Интегрированные БД по регионам должны создаваться с максимально
возможным использованием сложившихся ведомственных информационных систем
ресурсных , экологических и других служб и организаций, но общую
ответственность за эти БД должны взять на себя региональные органы.
5.На общегосударственном уровне целесообразно создавать
специализированные БД, содержащие данные о проблемах и объектах, имеющих
международное, общероссийское, межрегиональное значение, а также об
уникальных объектах природы и ресурсов.
1.8. Фактографические базы и банки научных данных
Современный этап развития науки характеризуется переходом на
качественно новый уровень исследований, что определяется широким
использованием методов и средств информатики - науки о законах и методах
накопления , обработки и передачи информации. В науке применение методов и
средств информатики должно не только освободить исследователя от рутинной
работы по поиску и подготовке к использованию известной информации, но и
обеспечить реализацию единой линии математической технологии решения задач
- от формулировки математических моделей и их полного информационного
обеспечения всеми необходимыми данными до формирования программных
комплексов и проведения решения поставленных задач. Важно, чтобы эта линия
была непрерывной и оперативно действующей, без технологических разрывов в
обработке данных. По существу, это определяется решительным превращением
разрозненной информации, отдельных наборов данных и индивидуальных программ
в единый информационный и программный продукт, а также всесторонним
применением современных приемов манипулирования такими продуктами с
использованием средств вычислительной техники.
К середине 90-ых годов в РФ в области фактографических баз данных в
науке сложилась ситуация, характеризующая следующими особенностями:
1. Существует значительное количество практически не связанных друг с
другом информационно-решающих систем и банков фактографических данных.
Имеется дублирование в разработке БД и БнД, и в то же время появление БД в
таких областях знаний, где ими пользуется только узкий круг специалистов.
Эти банки данных создаются давно сложившимися научными коллективами и
поддерживаются ими прежде всего для информационного обеспечения
собственных нужд (новые технологии подготовки справочников, работы в рамках
между народного сотрудничества и т.д.). В отраслевых НИИ фактографические
БД создавались в интересах поддержания того или иного рабочего места (АРМ)
технолога, конструктора и т.п.
Такие БД имеют очень ограниченную доступность, использование их для
широкого круга пользователей проблематично, а их учет и регистрация
затруднены.
2. Развиваются как большие фактографические БД (например, по
структурам химических веществ, спектроскопии и т.д.), так и специальные
БД, например, по химии особо чистых веществ, физико-химической кинетике
газовых реакций и т.п.). Эта тенденция в полной мере отвечает и
зарубежному опыту.
3. Отсутствуют по большей части мотивы к кооперации и интеграции
разработчиков ФБнД. Расширение узкоспециальных ФБнД, приспособленных к
решению только одного класса за дач, на другую предметную область требует
заново решать проблему выбора программных средств, т.к. при этом меняются
структуры фактографических данных.
4. Фактографические БД формируются двумя способами:
1) на основенакопленных разработчиками больших массивов одно родной
информации; 2) на основе документальных потоков существующих
документографических БД.
5. Понижено доверие специалистов к фактографическим, прежде всего
численным данным, получаемым из БнД, вследствие большой вероятности ошибок
при вводе значений. Проблема проверки достоверности информации перед ее
загрузкой в БД является актуальной и за рубежом, и в РФ. Для отечественных
фактографических БнД она решена только в части единичных функционирующих
БД. Для большинства отечественных фактографических БнД эта проблема
остается актуальной в силу отсутствия финансирования и других ресурсов.
Представление научной информации в фактографических БД имеет
следующие особенности:
- трудная формализуемость многих типов данных;
- актуальность многих, прежде всего, экспериментальных данных в
течение длительного времени (часто многими десятилетиями);
- использование аналитических форм представления данных (уравнения
состояния, уравнения термодинамического подобия и другие зависимости),
необходимым компонентом ФБнД в науке, как правило, является модель
предметной области, вне связи с которой, данные теряют смысл;
- наличие нескольких видов данных, отличающихся способом обработки.
Несмотря на общность подходов к информации в науке, формируются
представлением непосредственно полученных или выявленных из литературных
источников численных и структурных данных, графической информации, тем не
менее наблюдаются и значительные отличия в различных областях знания:
степень систематизации данных, уровень достоверности данных и возможности
их экспертной проверки, традиционные способы представления информации,
степень вариабельности данных и т.д.
К настоящему времени выделились два подхода к созданию
фактографических БД. Условно их можно назвать "исследовательским" и
"библиотечным".
Наиболее характерная черта "исследовательских" БД – целенаправленный
отбор информации для решения заранее сформулированной исследовательской
задачи.
При "библиотечном" подходе сбор информации, как правило,
непосредственно не связан с ее использованием. БД формируются
преимущественно в ходе централизованной работы крупных научных и
информационных центров и пополняются новыми данными без изменения уже
существующей структуры информационного массива.
Свертывание научной информации, которое связано с функционированием
БД, позволяет пользователю в более сжатые сроки и в концентрированном виде
получить интересующие его сведения, в большинстве своем прошедшие
экспертную проверку на достоверность. Таким образом, разработка и
эксплуатация БД в той или иной области науки или техники позволяет
значительно увеличить доступную пользователю долю информационных ресурсов
и, в конечном итоге, приводит к по лучению нового знания.
С распостранением персональной техники с современным сервисным
обеспечением появляется возможность создания локальных баз данных,
необходимых для научных исследований.
Информация для таких баз заимствуется из обзоров, справочников,
отдельных оригинальных работ и других источников, и значительно реже - из
банков данных. Однако качество информации , предлагаемой пользователям
банками данных, существенно выше , поскольку эта информация проходит
экспертный анализ на достаточно высоком уровне - в среде специалистов по
данному вопросу , и оперативно обновляется.
Появление значительного числа проблемоориентированных локальных БД в
различных областях науки , реализованных как правило, на ПЭВМ, особенно
остро ставит задачу координации работ в области информационного
обеспечения научных исследований. За последние годы во многих странах
возникли специальные организации , деятельность которых направлена, с
одной стороны , на сбор, систематизацию и распространение информации о
функционирующих или только проектирующихся БД (объеме и содержании
информационного массива и комплексе информационных услуг), а, с другой
стороны, на стимулирование и финансирование проектов, связанных с
созданием БД, совершенствованием их программного и лингвистического
обеспечения, а также разработкой единых стандартов при переводе данных в
машиночитаемую форму.
При объединении локальных БД в информационную сеть одна из основных
задач - обеспечение прямой и надежной связи между банками данных и личными
локальными базами данных, оперативное наполнение таких локальных баз
информацией из банков данных. Такая связь и поддержка локальных баз
данных уже хорошо освоена в США (например, система STN) и Западной Европе.
Банки данных , не включенные в сети, имеют возможность оперативно
передавать данные по инетрнету . В связи с этим необходимо обеспечить
организацию современных методов передачи информации банков фактографических
данных по сетям. Помимо решения технических проблем это потребует от
системной организации банков данных обеспечения возможности формирования
передаваемых файлов данных независимо от конкретной СУБД и типа машинной
реализации , ведения гибких форматов и соответствующих интерфейсов средств
обмена данными в разных форматах.
База данных может быть централизованной или распределенной.
Централизованная база поддерживается одной ЭВМ. Распределенные базы можно
разделить на два типа. В од ном случае каждый пользователь имеет почти все
данные на своей ЭВМ, в другом случае каждый вид данных находится в каком-
то одном месте и центральная ЭВМ поддерживает только каталог всех данных с
указанием местонахождения конкретных данных. По-видимому, наиболее
перспективной является последняя система организации.
При проектировании в систему , помимо трдиционного хранилища
информации, могут входить также следущие подсистемы:
- библиотека научных программ для обработки данных (моделирование,
вычислительный эксперимент и др.);
- библиотека статистической обработки данных (регрессионный анализ,
сглаживание, оценка достоверности, получение значений коэффичиентов
эмпирических и теоретических зависимостей , графический пакет и т.д.);
- буфер получаемых данных для их предварительного анализа (возможно и
архив результатов);
- ряд служебных подсистем, таких , как вводи коррекция данных, обмен
данными между хост-машиной и локальными системами и др.
Форма вывода данных определяется потребностью конкретных
пользователей. БнД должен выполнять широкий спектр запросов от простейших
информационных до слжных, требующих расчетов по прикладным программам.
БнД может быть использован также как программная основа
автоматизированного рабочего места исследователя с правом доступа к
справочным данным и внесением собственных данных в имеющуюся БД.
Особое внимание следует обратить на открытость систем, особенно в
частности возможности включения программ математической обработки данных.
ФБнД в области науки должны обладать возможностью восполнения
недостающих данных при помощи баз моделей, алгоритмов и программ расчета и
т.п.
Пользователю БнД должна быть предоставлена возможность доступа к любым
имеющимся в нашей стране и за рубежом документографическим системам.
Интеграцию разнородных БД в общие мультидисциплинарные банки должны
обеспечивать мировые центры данных и БнД специальных проектов. При этом БД
верхнего уровня должны выполнять роль баз данных и содержать информацию о
наличии данных в банках нижнего уровня.
Одной из важнейших проблем , решаемых в ходе разработки ФБнД,
является создание экспертной службы (ЭС). ЭС выполняют три функции:
сигнальную , аналитическую и справочную. Типичными формами ЭИ являются:
- для сигнальной информации - экспертные рефераты;
- для аналитической информации - текущие и ретроспективные
аналитические обзоры;
- для справочной информации - таблицы фактографических данных.
Экономический механизм создания и развития ФБнД в науке механизмом
финансирования исследований, в результате которых формируется ФБнД (через
научные фонды, ассоциации и т.п.).В особых случаях ФБнД в науке могут
финансироваться государством. Обслуживание по таким ФБнД должно
производиться на бесприбыльной основе (например, в образовании).
ФБнД в науке представляют собой национальное достояние и подлежат
экспортному лицензированию.
1.9. ФБД в области культуры и искусства
Существующие и разрабатываемые в настоящее время базы
фактографических данных в области культуры и искусства могут быть разделены
на две группы:
- ФБД статистической и справочной информации, эксплуатируемые в рамках
отраслевой автоматизированной информационно-справочной системы ОАИСС-
КУЛЬТУРА;
- ФБД тематически ориентированных автоматизированных информационных
систем, создаваемых в рамках АИС "ПАМЯТ НИК".
В рамках ОАИСС-КУЛЬТУРА эксплуатируются следующие предметные базы
данных:
- БД учетно-статистической информации (деятельность театрально-
зрелищных предприятий, музеев, клубов, парков, библиотек);
- БД по репертуару театров и по концертной деятельности;
- БД по кадрам;
- БД о деятельности промышленных предприятий;
- БД о культурных связях с зарубежными странами;
Фактографические БД, работающие в рамках ОАИСС, используют стандартные
решения, характерные для применения в экономической сфере.
Существующие в настоящее время ФБД по памятникам культуры и исскуства
служат, как правило, целям инвентаризации, а не научного описания и
изучения.
Очевидно, что коммерческий эффект от информационно-справочной
деятельности по заказам российских и зарубежных организаций, связанных с
культурной, туристской, научной деятельностью может быть весьма
существенным.
1.10. Лингвистические БД
Лингвистические БД (ЛБД) содержат данные о языковых единицах
различных уровней (от морфемы до текста) и разно образную информацию об
этих единицах .
ЛБД имеют три основные сферы применения:
- обеспечение функционирования различных автоматизированных систем,
связанных с обработкой текста и речи (информационные, экспертные, обучающие
системы, системы анализа речи, машинного перевода и др.);
- автоматизация лексикографической деятельности массового и
специального назначения, то есть подготовка словарей различного типа
(учебных, переводческих, нормативных, толковых и др.);
- автоматизация труда исследователей: лингвистов, преподавателей
языков и других филологов.
Финансирование обеспечивающих ЛБД обычно осуществляется в рамках
соответствующих автоматизированных систем.
ЛБД для автоматизации лексикографии могут приносить значительный
экономический эффект в случае интеграции ЛБД с автоматизированными
издательскими системами, что имеет за рубежом массовое применение.
Следует иметь в виду, что ЛБД всех трех типов существенно пересекаются
между собой по составу данных, хотя и имеют многие специфические свойства.
В то же время многие ЛБД имеют достаточно большие объемы (до сотен тысяч и
даже миллионов записей), поэтому их создание и ведение требует
значительных средств и трудозатрат.
Заключение
Итак на основе вышеизложенного можно сделать следующие выводы.
Поскольку на данный момент перед нашим государством стоит проблема
более глубокого регулирования экономики, вновь вспомнили о необходимости
создания разнообразных баз данных, начиная от автоматизированных кадастров
и заканчивая персонифицированными базами данных финансовых потоков граждан.
Как говорилось выше, для обеспечения гарантированной конфиденциальности
этих БД необходимо финансировать, по крайней мере, 46% затрат на их
создание именно из федерального бюджета. Остальную часть (54%) следует
финансировать из бюджетов субъектов и местных бюджетов.
Кроме того, проблема передачи данных в рамках мультимашинных баз дынных
должна решаться именно на федеральном уровне, так как частные
(негосударственные) связисты не могут гарантировать бесперебойность и
конфиденциальность информации.
К счастью в нашей стране существует немало специалистов, занимавшихся
ранее САПР, организацией БД и СУБД, поэтому перспективы развития
информатизации в РФ целиком зависят от правового аспекта данной проблемы.
Список использованной литературы
1. Отчет Комитета по науке при Госдуме РФ от 16.02.98. «Перспективы
информатизации высшей школы» Тихонов А.Н., Шадриков В.Д. Иванников
А.Д.
2. Отчет отдела информатизации Министерства Общего и Профессионального
образования РФ «Информатизация региональных центров. Деятельность
центра Информика». от 17. 04.97
3. Отчет отдела баз данных Минобразования РФ «Перспективы внедрения
документографических баз данных для целей налогообложения. Ответ на
запрос ГНС РФ». Глубаковский А.М., Филлипов В.М. от 9.04.97
4. Бюллютень УДН им. Патриса Лумумбы № 48/16к «Базы данных.
Перспективы» автор ректор УДН В.М.Филлипов.
5. Отчет отдела информационных технологий Минобразования РФ. от
1.08.98. Иванников А.Д., Тихонов А.Н., Абромешин А.Е. «Сравнительная
характеристика баз данных. Анализ»
|