Наш Open Data не такой уж и Open. Готово ли государство делиться информацией?
На конкретном примере будет показано, почему концепция открытых данных в Казахстане за почти десятилетие развития так и остановилась в зачаточном состоянии
Чисто исторически годом зарождения концепции Open Data (открытые данные) в Казахстане принято считать год 2010-й, именно тогда был издан соответствующий указ Президента. В 2013 году был запущен портал data.gov.kz, причем доменное имя было схожим с проектами других стран (data.gov.uk, data.gov.ru и др.). Затем в адрес решили добавить литеру “e”, видимо, для схожести с уже известным населению понятием “eGov”. В итоге наш страновой проект находится теперь по адресу: https://data.egov.kz.
Среди множества различных определений можно для начала рассматривать такое: Open Data подразумевает открытость некоторого массива информации для публичного просмотра, обработки и использования. Например, таблица государственных закупок, выложенная на сайте акимата, является открытыми данными, а стенгазета, установленная в холле вашей компании - нет, так как ее невозможно найти ни в одном поисковике, и уж тем более, скопировать или распечатать на принтере.
Если смотреть шире, то за понятием открытых данных стоит целое международное движение, имеющие весьма сложную историю и цели, разбор которых, впрочем, не является целью моего поста.
Наши позиции в мировом Open Data
По степени «открытости данных» мы занимаем 59 место в рейтинге https://opendatabarometer.org/. Пройдя по гиперссылке, вы можете изучить анализ данных по отраслям:
Как видим, по каждой отрасли выставляется оценка в баллах и выводится общий страновой рейтинг. Вопросы для составления рейтинга указаны на изображении, они раскрывают информацию по степени открытости данных, обновлению, легкости нахождения информации, доступности для машиночитаемого формата и другие.
Если рассматривать данные по Казахстану согласно проставленным баллам по отраслям, то низшие оценки мы получили по следующим пунктам:
1. Детальная информация по государственным расходам (5)
2. Данные по землевладению (5)
3. Расписание общественного транспорта (0)
4. Картографические данные (5)
5. Данные по результатам национальных выборах (15)
6. Детальная информация по национальному бюджету (15)
7. Законодательство (15)
Что, собственно, и не удивительно - все эти отрасли наиболее красноречиво отражают нашу экономическую и социальную реальность. К примеру, данные по государственному бюджету где-то существуют, но где, никто не знает, а кто знает - показывать не собирается. Факты о землевладении у нас также не раскрываются, видимо, кому-то есть резон скрывать от общественности столь животрепещущие вопросы бытия.
Наши достижения в мировом Open Data
Что касается хороших оценок, то Казахстан их получил по данным реестра компаний. В отличие от конкретных гектаров земли, записанных на чей-то счет, здесь речь идет о понятиях более абстрактных, а потому и скрывать особо нечего:
- перепись населения (по качеству этих данных вообще можно отдельную статью написать);
- статистика преступности (у общества к ней большие вопросы);
- экологическая обстановка;
- показатели сектора здравоохранения.
Последний пункт я разберу более детально, по причине того, что мне это необходимо в профессиональной деятельности.
Откроем по ссылке следующий раздел. На фоне 18 стран Восточной Европы и Центральной Азии Казахстан занимает золотую середину по открытости данных:
Говоря о динамике развития в области открытых данных, некоторые страны развиваются лучше нас. Если мы заглянем сюда, то увидим, что упали в рейтинге на 3 позиции:
На ТОПовых же позициях располагаются британцы, США, Канада и другие страны.
Хостинг и управление Open Data
Портал открытых данных в Казахстане сделан по тому же принципу, как и аналогичные проекты в России, США, Великобритании. Информация на сайте представлена в виде единой базы государственных данных, которые можно свободно скачать в табличном формате Excel.
Владельцем портала является Министерство информации и коммуникации РК, сайт находится на сервере Nitec, домен зарегистрирован в 2007 году. Порталом пользуются довольно активно, если верить сервису pr-cy.ru, что меня немного удивило:
Счетчик, установленный на портале https://data.egov.kz показывает, что с 2015 года на сайте было 846 тыс. посетителей. Предположу, что бóльшая часть посетителей являются государственными служащими, работающими с данной базой, ведь данные “заливаются” сюда от практически всех государственных структур.
На первый взгляд база данных содержит достаточно много полезной информации. Но это только на первый взгляд.
Если же говорить о качестве предоставляемых данных и их наполняемости, то, мягко говоря, они оставляют желать лучшего. Я работаю в области здравоохранения и для моей профессиональной деятельности необходимы качественные данные для использования и обработки. Так вот, информация, которая меня интересует на сайте, не пригодна для работы, либо пригодна частично. Вроде бы данные разделены по областям, на портале их довольно легко найти, если постараться. База данных легко скачивается в удобный для вас формат, к примеру, в MS Excel, но на поверку - это все лишь красивая обёртка. Объясню на примере, почему я так считаю.
Скачав данные по медицинским учреждениям в Казахстане и, желая получить официальную информацию о количестве учреждений в Казахстане, я был неприятно удивлен тем фактом, что информация предоставлена только по 10 областям, что уже не дает полную картину по стране. С аптеками ситуация еще хуже. Мне не удалось найти консолидированный файл со всеми аптеками Казахстана, хотя есть подобные файлы по каждой области.
Первая область, на которую я наткнулся - Восточно-Казахстанская область, в которой, согласно базе, насчитывается всего 38 аптек (по всей области, включая Семей и Оскемен). Покопавшись в статистическом сборнике, я пришел к выводу, что здесь отражаются только государственные аптеки, доля которых в Казахстане составляет 4%. Получается, по аптекам всё верно, кроме одного - нет данных по частным аптекам, а без них никуда.
Правда, вскоре мелькнул луч надежды - на портале, оказывается, есть специальный сервис для поиска аптек. Но радость оказалась преждевременной - сервис только для Астаны. Мало того, поиск показал на карте только государственные аптеки ТОО “Гиппократ”, не выявив остальные.
В конце концов, портал иногда страдает от элементарных глюков: в фильтре выборки стоит “Здравоохранение”, в разделе открывается “Жилищный фонд” и “Достопримечательности”.
Несколько конкретных предложений
Завершая свой краткий экскурс по не очень пока большой площадке казахстанского Open Data, решил все-таки оставить несколько предложений. Да и администрация портала вроде как ждет от нас предложений по улучшению, если верить цитате: “Мы с нетерпением и интересом ждем Ваши идеи и комментарии о портале “Открытые данные”.
- Данные должны быть открытыми по умолчанию, то есть всегда. Государство должно интегрировать портал открытых данных со всеми государственными органами, создав единую информационную среду.
- Функционал должен быть тщательно отработан, все фильтры и кнопочки проверены на работоспособность.
- Рабочие приложения должны быть именно работающими. Или лучше не рекламировать их на сайте (я искал все 3 анонсированных приложения, их нет).
- Повысить качество данных. Есть много компаний на том же фармацевтическом рынке, которые предоставляют качественные полновесные данные, то есть технически всё давно реализуемо. Все данные, которые я искал, не были полными.
- Хотелось бы упомянуть и портал https://budget.egov.kz/. Портал есть, а данных практически нет. Нужно увеличить наполняемость данных.
- Подключить к работе над открытыми данными не только государственные учреждения, но и частные. Например, в моей деятельности есть хорошие оценки по данным реестра компаний, вполне можно наладить подключение.