вторник, 14 января 2014 г.

ЕЭК ООН: метаданные в Декларации тысячелетия

Метаданные – это данные, которые определяют или описывают другие данные. Это та информация, которая необходима для объяснения и понимания представляемых данных или значений. Уже сейчас имеется ряд прекрасных материалов, которые обеспечивают методологическую основу для подготовки и представления метаданных странами (OECD, 2007; UNECE, 2000a, 2009b; ЕЭК ООН, 2009a).

В них содержатся четкие рекомендации по минимальным метаданным, которые должны сопровождать каждое представление данных. Метаданные готовятся и используются на всех этапах процесса подготовки статистических данных. Эффективное управление метаданными в статистических организациях позволяет иметь в наличии эту информацию и применять ее повторно по мере необходимости.

Качественное управление метаданными позволяет: - высвобождать ресурсы, которые ранее тратились на ненужное восстановление метаданных, - подготавливать точные метаданные и данные, повышая таким образом качество статистики, - извлекать уроки из прежнего опыта по сбору данных и применять их для улучшения сбора данных в дальнейшем, - повысить мотивацию и производительность, так как персонал может хранить и извлекать необходимую информацию, - стимулировать использование данных за счет представления четкой информации, необходимой для понимания и интерпретации данных, - повышать прозрачность и доверие к официальной статистике.

Достаточные метаданные включают в себя: - Четкое название, которое описывает ряд данных, совокупность, охват и базисный период, - Обозначения для описания данных, такие как названия переменных и единицы измерения, с использованием общепонятных слов, - Сноски, которые включают информацию, необходимую для точного толкования данных, такую как определения, невключаемые совокупности и другие исключения, - Источники данных, такие как метод сбора, организация, проводившая сбор данных, и дата сбора (например, обследование рабочей силы 2006 г.).

Статистические организации должны иметь политику и руководства, содержащие инструкции для персонала по представлению статистических данных и метаданных в отчетах и другой публикуемой ими информации. В таких руководствах необходимо определить формат представления данных и метаданных, до того как информация будет опубликована, например, состав таблиц, диаграмм и карт, а также необходимые для включения метаданные. Наличие руководств по публикациям, шаблонов и процессов, обеспечивающих их соблюдение, позволяет иметь полные и последовательные метаданные во всех публикуемых статистических данных.

Обязательные метаданные
Данные, представляемые в таблицах, диаграммах и картах в отчетах по ЦРТ, онлайновых базах данных или других форматах, должны всегда сопровождаться следующими элементами метаданных: 1. Название, описывающее представляемые данные, включая следующее: а) Единица статистического учета: единица, по которой составлены статистические данные (например, люди, домохозяйства, события, предприятия). б) Базисная территория: страна или географический район, к которому относится измеряемое статистическое явление. в) Базисный период: период времени или момент времени, к которому относится измеряемое наблюдение. г) Единица измерения: единица, в которой измеряются значения данных.

2. Организация, предоставившая данные: организация, подготовившая данные. 3. Статистические понятия и определения: характеристики данных в соответствии с формулировкой, которая представляет сущность термина. Определения статистических понятий и терминов должны быть приведены либо в представляемых данных по ЦРТ, либо в ссылках (например, интернет-ссылках) на источник, где их можно найти. Знание точного определения, используемого организацией, предоставившей данные, является чрезвычайно важным для понимания данных. 

Условные метаданные
4. Сопоставимость: в случаях, когда различия между статистическими данными могут быть обусловлены различиями в действительных значениях статистических характеристик, необходимо в сноске представить объяснения. Вопросы сопоставимости можно разбить на: а) Сопоставимость географическая – степень сопоставимости между статистическими данными, измеряющими одно и то же явление в разных географических районах. б) Сопоставимость с течением времени – степень сопоставимости между двумя или более значениями данных временного ряда по одному и тому же явлению.

5. Исходные данные: характеристики и компоненты исходных статистических данных, использованных для составления статистических агрегированных показателей, т.е. тип первоисточника (например, обследование, перепись, административные данные) и другие соответствующие характеристики (например, объем выборки для данных обследования). 6. Символы или сокращения – любые символы или сокращения, используемые в представляемых данных, должны быть объяснены.

Необязательные метаданные 
Существует целый ряд других сведений, которые будут полезны для пользователей при интерпретации и использовании данных, относящихся к ЦРТ. Эти метаданные могут быть указаны в приложении или других разделах материала по ЦРТ. В случае нецелесообразности такого уровня детализацииданных в самом материале необходимо привести ссылки и указания, где эта информация может быть найдена.

7. Точность – близость расчетов или оценок к точным или действительным значениям, на измерение которых были направлены статистические данные. Сюда входит смещение (систематическая погрешность) и дисперсия (случайная погрешность). Она может быть описана в контексте основных источников погрешности (например, охват, выборка, отсутствие ответов) или мер точности. 8. Контактная информация – контактная информация с указанием лица или организации, в том числе информация о том, как можно с ними связаться (например, веб-сайт, почтовый адрес, телефон, адрес электронной почты). 9. Ссылки / Интернет-ссылки – дополнительная информация и материалы по методам сбора данных, соответствующие аналитические отчеты или общая информация, которая может быть полезна читателям.

Источник:
http://www.unece.org/fileadmin/DAM/stats/publications/2013/GettingFactsRightRussian.pdf
ECE/CES/29

Словарь метаданных см.:
http://sdmx.org/wp-content/uploads/2009/01/04_sdmx_cog_annex_4_mcv_2009.pdf

Комментариев нет:

Отправить комментарий