Информационные свойства документов.
Документная информация - информация, содержащаяся в документах.
Понятие «информация» произошло от латинского слова «informatio», что означает изложение, разъяснение какого-либо факта, события, явления. В широком смысле информация определяется как сведения о той или иной стороне материального мира и происходящих в нем процессах. При изучении информации учитываются закономерности ее создания, преобразования и использования в различных сферах человеческой деятельности.
Информацию как продукт производства и применения отличает, прежде всего, предметное содержание. Она очень разнообразна и подразделяется по виду обслуживаемой ею человеческой деятельности: научная, техническая, производственная, управленческая, экономическая, социальная, правовая и т.п. Каждый из видов информации имеет свои технологии обработки, смысловую ценность, формы представления и отображения на физическом носителе, требования к точности, достоверности, оперативности отражения фактов, явлений, процессов. Важнейшими свойствами управленческой и экономической информации являются: • достоверность и полнота; ценность и актуальность; ясность и понятность. Одним из важнейших внутренних свойств информации является объём, дающий возможность её количественного измерения. В н. в. отсутствует универсальная мера для измерения количества информации. Любой документ является многоуровневой информационной системой, где каждый уровень имеет свои количественные параметры. Есть физический уровень, синтаксический (знаковый), семантический (значимый), структурный, латентный и др. Документированная информация всегда содержится на каком-либо материальном носителе, постольку первое, самое общее представление о её количестве может дать физический уровень, т.е. натуральный (физический) объём, занимаемый информацией. Так, первоначальное представление о документах на бумажных носителях можно получить, измерив их в килограммах, в кубических метрах, а также по количеству единиц хранения (дел) и даже по длине полок в архивохранилищах. Для аудиовизуальных и машиночитаемых документов могут быть использованы такие единицы измерения как длина киноплёнки или магнитной ленты в метрах, количество фотографических кадров, видеокассет, магнитных или оптических дисков и т.п.
Информационный объём письменных документов можно выразить в печатных листах, условных печатных листах, в учётно-издательских и авторских листах, перейдя таким образом на синтаксический (знаковый) уровень. Печатный лист - это оттиск на одной стороне листа бумаги формата 60 ? 90 см. В условных печатных листах просчитываются оттиски на бумаге других форматов (например, 70 ? 90 см и др.) через специальный коэффициент. Учётно-издательский лист, также как и авторский лист, равен 40 тыс. печатных знаков, включая пробелы между словами, или 3000 см¦ графического материала (иллюстраций, карт и т.п.).
В информатике количество информации определяется с помощью такой единицы измерения как бит (двоичная цифра, используемая для кодирования любой информации). Восемь бит составляют 1 байт; 1 килобайт (Кбайт) = 1024 байт; 1 мегабайт (Мбайт) = 1024 Кбайт = 1048576 байт; 1 гигабайт (Гбайт) = около 1 млрд байт. Однако физический объём документа, также как и количество знаков в нём, т.е. синтаксический уровень, не дают представления о реальном количестве информации в документе. Подсчитать же это реальное количество весьма непросто. Не случайно отдельные авторы вообще считают подобный подсчёт невозможным. В поисках наиболее эффективных путей измерения реального количества документированной информации предлагаются различные способы, используются различные понятия. В частности, некоторые исследователи (Б.В.Бирюков, Г.Г.Воробьёв) предлагают так называемый тезаурусный подход. Для обозначения реального количества информации, вложенного в какой-либо информационный объём (в книгу, газету, официальный документ и т.п.), вводится понятие информационная ёмкость. Реальное же количество информации, извлекаемое конкретным потребителем, обозначается понятием информативность документа. Содержание всей информации в определённой информационной системе называется "тезаурус" (от греч. "thesauros" - запас). "С точки зрения информативности тезаурус каждого сообщения делится на три части: 1) основная информативность - то, что дано и что получено; 2) потери информативности - то, что дано, но не получено из-за рассеянности, спешки, незнания языка или предмета; 3) бесполезная информация - информационный шум"