Бот усе бачить. Як в Україні створюють «пошуковик по державі»

Бот все видит. Как в Украине создают «поисковик по государству»

Український проект Opendatabot з’ясовує, що держава знає про своїх громадян, і легально на цьому заробляє.

Щодня через державу проходять величезні обсяги інформації: про доходи різних галузей, про кількість випускників у школах, про розкриті й нерозкриті злочини, про судові позови. За фактом ця інформація є суспільним надбанням і, якщо її правильно використовувати, допоможе суспільству працювати ефективніше.

У 2015 р. Кабінет Міністрів України ухвалив постанову № 835, яка зобов’язує держоргани публікувати деякі дані у форматі, придатному для машинної обробки. Такі дані називаються відкритими.

За важливістю для людства відкриті дані порівнюють із нафтою. І які тільки перспективи їхнього використання не вимальовують: від громадського моніторингу та боротьби з корупцією до появи нових сервісів і цілих ринків.

Два роки тому IT-підприємці Андрій Хорсєв і Олексій Іванкін з компанії «908» вирішили перевірити, як відкриті дані можуть працювати в українському суспільстві. І створили бота, котрий аналізує державні реєстри, добувши з них корисну інформацію.

Конкурент Google

Першим реєстром, дані якого аналізував Opendatabot, став Єдиний державний реєстр юридичних осіб, фізичних осіб-підприємців та громадських формувань (ЄДР).

За назвою в цьому реєстрі можна знайти адресу компанії та її контакти. Дізнатися, якою діяльністю вона займається, хто її заснував і хто керує зараз. Кожен охочий може надіслати безкоштовний запит через сайт Мін’юсту.

Автори Opendatabot подивилися на можливості реєстру під іншим кутом. Зміна інформації про компанію без відома власника може свідчити про спробу захоплення бізнесу (рейдерську атаку). Відповідно, що раніше підприємець дізнається про таку спробу, то швидше зможе відреагувати. «Це було дуже просте рішення: ти додав у месенджер Opendatabot, підписався на свою компанію — і можеш відстежувати будь-які зміни по ній, якщо раптом хтось спробує їх внести», — пояснює директорка з комунікацій Opendatabot Дарина Даниленко.

Цей інструмент має попит і зараз. У нього 150 000 користувачів.

Крім ЄДР, Opendatabot індексує близько 20 основних реєстрів. «Ми йдемо до того, щоб можна було ввести ім’я, прізвище, по батькові та побачити все, що про вас знає держава», — каже Дарина Даниленко.

Бот допомагає підприємцям вчасно дізнатися та попередити рейдерські атаки

Олексій Іванкін розповідає, що Google та інші великі пошукові системи індексують державні дані як тексти, без аналізу якості й пов’язаності даних.

«Щоб отримати результат із реєстру, потрібно ввести призначену для користувача інформацію. Це так званий „глибокий інтернет“ (deep web). Пошуковик не може, скажімо, просто перебирати всі прізвища й адреси та індексувати відповідь», — додає екс-директор «Яндекс.Україна» Сергій Петренко.

Але що як пошуковики придумають, як це робити? Дарина Даниленко визнає, що такі перспективи вони не вивчали: «Питання в тому, наскільки Google готовий працювати з українськими даними. Тому що в Україні це окрема болюча тема, з даними ще доводиться повозитися».

Відкриті дані по-українськи

Те, що в Україні публікується як відкриті дані, не завжди таким є. Як розповідає Дарина Даниленко, їх доводиться «чистити», додатково аналізувати, знаходити зв’язки.

Наприклад, одна з популярних у підприємців послуг — повідомлення про податковий борг. Opendatabot вчасно сигналізує, щоби борг не накопичувався і не почали надходити штрафи.

Державна фіскальна служба викладає відомості про борг у форматі відкритих даних, але не зазначає при цьому ідентифікатор ЄДРПОУ підприємства. Щоб зрозуміти, хто має податковий борг, команді Opendatabot доводиться самостійно звіряти назву та адресу з бази ДФС із даними в єдиному реєстрі Мін’юсту. Якщо вони збігаються, тоді компанія отримує повідомлення про податковий борг. До 10% компаній у результаті «губиться». І подібні ситуації є по всіх реєстрах.

Як розказує юрист Opendatabot Микита Підгайний, деякі держоргани не публікують інформацію у форматі відкритих даних узагалі. Скажімо, Держслужбу інтелектуальної власності зобов’язали викласти цілу низку наборів (інформацію про патенти, торговельні марки тощо). Пізніше Держслужбу ліквідували, а її завдання і функції передали Мінекономрозвитку. При цьому набори даних так і почали публікувати.

Відкрита інформація, відкриті й публічні дані — яка різниця?

Відкрита інформація — це інформація, яка є у відкритому доступі. Наприклад, стаття на «Вікіпедії».

Публічні дані — це дані, якими володіє держава і які надаються громадянам за запитом.

Відкриті дані — це набори даних, які є суспільним надбанням. Вони публікуються у спеціальних форматах — наприклад, .csv, .json, так щоб їх можна було обробляти автоматично.

Закриті дані — це дані, які не можна публікувати. До них належать комерційна і військова таємниці, персональні дані.

Хитрощі для посадовців

«Разом з Микитою ми придумали геніальний алгоритм, як розмовляти з держорганами, щоб у вас щось вийшло, — розповідає Дарина Даниленко. І показує заплутану схему з безліччю стрілок, які спрямовують вас по колу. — Ти ніколи не знаєш, що із цього дасть результат».

bot-use-bachit-yak-v-ukraїnі-stvoryuyut-poshukovik-po-derzhavі

«І сміх, і сльози», – так в Opendatabot описують схему взаємодії з держорганами

Комунікація розпочинається із запиту, що згідно з постановою Кабміну № 835 такі-ось дані мають бути відкриті. Інколи доводиться написати 20 запитів, щоб отримати відповідь хоча б на один.

Буває таке, що на запити не відповідають узагалі. Тоді, за словами Дарини Даниленко, доводиться писати скарги до вищих органів. Використовуються будь-які законні методи: і виступи на телебаченні, і суди, і страйки, і навіть надання грамот. Інколи людині просто приємно, що її хтось похвалить. Також працюють порівняння: якщо, наприклад, на телебаченні сказати, що хтось «хороший», тому що відкрив дані, а хтось «поганий». Були кейси, коли вдавалося домовитися після активного обговорення питання у Facebook.

Бот як бізнес

Opendatabot — продукт IT-компанії «908» і спершу перебував на її фінансуванні.

Влітку 2016 р. бот став переможцем конкурсу EGAP Challenge, організованого швейцарсько-українською програмою EGAP, і здобув 250 000 грн. Цей приз команда Opendatabot називає «символічним», адже вкласти в проект довелося набагато більше.

Зараз Opendatabot почав заробляти. Основна монетизація відбувається за рахунок платних акаунтів. Безкоштовно можна шукати в реєстрах і отримувати щотижневі оновлення для п’ятьох компаній.

Якщо ви юрист і вам треба відстежувати з десяток фірм, тоді доведеться відкрити платний акаунт. Вартість передплати — 2 980 грн на рік. У пакет включено 100 запитів до Єдиного державного реєстру в режимі реального часу щодня, а також моніторинг десяти компаній і десяти судових справ за добу.

Кожен день користувачі Opendatabot надсилають 15 000 запитів.

Щодня бот моніторить 55 000 компаній, 20 000 ФОП, 35 000 судових справ.

Крім того, Opendatabot заробляє на доступі до свого API — інтерфейсу для розробників. Із цим інтерфейсом можна працювати по-різному. Наприклад, у юриста Opendatabot є своя компанія — Bot&Partners. І вона використовує API, щоб автоматично складати договори. Потрібно лише ввести код ЄДРПОУ, а всі інші дані підтягуються з Opendatabot. Така модель виключає купу помилок.

Як розповідає Олексій Іванкін, для стартапів, NGO (громадських організацій) і невеликих компаній використання API безкоштовне. Середній чек для великого бізнесу на доступ до всіх сервісів починається від $1 000 на місяць.

Щодня Opendatabot моніторить 55 000 компаній, 20 000 ФОП, 35 000 судових справ. Розсилає 2 000 сповіщень про зміну директорів і власників, про банкрутство, зміну статусу платника ПДВ, податкові борги, судові засідання, планові перевірки.

Київська школа економіки порахувала, що 2017 р. українська економіка отримала $700 млн від використання відкритих даних. Але якщо держоргани будуть активніше публікувати відкриті дані, до 2025 р. економія може зрости до $1,4 млрд на рік.