LvivCityHelper — це чатбот, який надає львів’янам інформацію щодо руху громадського транспорту, обслуговування будинків, запланованих ремонтів тощо. Ми використовуємо open data від органів місцевої влади та різних муніципальних установ. Ба більше, ми беремо безпосередню участь у відкритті даних і створенні датасетів, адже до складу команди входять фахівці з ЛКП «Міський центр інформаційних технологій».
Сьогодні ботом користується понад 3000 містян і ця цифра постійно зростає. Подібний результат — справжня перемога, якщо брати до уваги ту кількість підводних каменів, з якими зіштовхнувся наш проєкт. Ділимося викликами, до яких мають бути готові й інші команди, які планують будувати сервіс на базі міських чи державних відкритих даних — у новому циклі Open Data Challenge або самостійно.
Від PDF-файлів до машиночитних датасетів
Коли ми прийшли на Open Data Challenge, потрібних даних, з якими варто запускати чатбот, не було. Ми планували розпочати з кількох доступних датасетів і поступово втягувати в бота все нові й нові дані. І найскладнішим здавалось саме створення нових наборів.
Ми почали з титульних списків. Це перелік капітальних ремонтів муніципальних об’єктів, які заплановані на цей бюджетний рік з бюджету розвитку. Цих даних не було в машиночитному вигляді, і на першому етапі ми розшифровували PDF. Коли ми їх оцифрували, то думали, що нам вже нічого не страшно, але титульні списки впродовж року можуть мінятись.
Причому змінюються не лише дані, але і формати: пізніше ми отримали таблицю Excel, але вона все одно була не в тому форматі (в боті йде пошук за назвою вулиці, а там основною була назва роботи). З одного боку, з файлами Excel працювати простіше, ніж з PDF, а з іншого, ми мали вводити новий процес.Ще один приклад — території обслуговування шкіл. Це був звичайний додаток до рішення виконкому: перелік шкіл і до кожної — перелік вулиць.
Ми вручну перетворили цей документ на базу даних, а через півроку... вийшов новий додаток. Не документ з переліком змін, а новий список всіх шкіл з вулицями. Мало того, деякі школи ставали ліцеями, тобто звірити інформацію по назві вже було значно складніше. Довелось вручну порівнювати два додатки і порядково вносити зміни у нашу базу, створену на основі адресного реєстру (у нас вказана адреса і до якої школи чи ліцею вона відноситься, а не навпаки).
Сфера відкритих даних активно розвивається в Україні, проте треба розуміти, що не все в ній ідеально, і бути готовими до таких викликів. Окрім того, коли працюєш з державними чи міськими даними, тяжко передбачити і терміни оновлення. Наприклад, зараз є прийнятий бюджет на цей рік, але ми не маємо бази по запланованих ремонтах, і в чатботі певний час висять ремонти за попередній рік. Це неможливо змінити, поки що.
Є ситуації, коли зміни у даних міста стрімкі, а є такі, коли вони розтягнуті в часі. Наприклад, у нас є категорія «Обслуговування будинків». Здавалося б, що може піти не так? Але проблеми починаються, коли будинок знімається з експлуатації у комунальному підприємстві (КП). Після цього є якийсь період, коли жителі мають вирішити, чи у них буде самообслуговування, чи ОСББ, чи вони підпишуть договір з новим постачальником послуг. Приміром, у такий період людина винайняла квартиру, переїхала і одразу пішла дивитись в боті інформацію по своєму новому будинку. А там немає даних щодо обслуговування, ми їх не можемо нізвідки взяти, бо це питання домовленостей жителів. Разом з тим у сервісі є багато інших даних, які щодня полегшують життя тисячам користувачів, але і до таких складних випадків засновникам треба бути готовими.
Є і така інформація, яку наразі можна оновлювати лише вручну. Наприклад, у нас можна подивитись структуру мерії. Там постійно міняються керівники управлінь, з’являються і звільняються виконувачі обов’язків тощо. Щоб підтримувати актуальність даних, ми маємо всією командою стежити за змінами по посадах.
Для того, щоб державні та міські органи влади відкривали більше даних, потрібно докладати зусиль. І ми з командою, і наші колеги зі спільноти Open Data Challenge багато працювали, щоб нам надали доступ до певних даних. Пасивно чекати, коли з'являться потрібні дані у відкритому доступі та у зручному форматі, — не надто добра стратегія. При такому підході багато проєктів, що зараз існують та успішно розвиваються, могли б не з'явитися взагалі. Учасникам нового набору конкурсу у цьому плані буде трохи простіше, адже цьогорічний цикл проводиться за підтримки Міністерства цифрової трансформації і командам допомагатимуть дата-ангели — Chief Digital Transformation Officers з різних міністерств та місцевих органів влади.
Telegram vs. Facebook. Де краще робити чатбот
Після конкурсу Open Data Challenge були інші виклики. Наприклад, ми вирішили запустити бота не лише в Telegram, але і у Facebook Messenger. Коли все було готово, з’ясувалось, що треба ще пройти Facebook App Review. Причому там потрібна купа документів. Реєстраційні документи підприємства (і думаєш: українською підійдуть чи треба англійською?), статус розробника (для себе ми це робимо чи виконуємо задачу на аутсорсі?). Далі вони тестували бота. І теж було незрозуміло, чи ця Facebook Review Team #3 розуміє українську? Це дуже складно — бачити, що щось відбувається, але не мати жодного контролю над ситуацією.
Ми дуже зраділи, коли бота затвердили, але далі на нас чекала нова несподіванка. Telegram — ідеальна платформа для бота, а Facebook — ні, особливо коли у бота велика глибина по меню. Ми після запуску два тижні сиділи 24/7 в адмінці і відповідали людям, які натиснули «Розпочати» і після відповіді бота нічого не робили. Виявилось, що значна частина людей просто не розуміє, де меню. А меню там — це три рисочки внизу, його треба розкрити.
Мало того, меню виглядає по-різному з комп’ютера, з телефона, з іншої моделі телефона… Зрештою ми розробили Q&A: якщо людина не продовжує діалог, спершу треба спитати, з телефона вона чи з комп’ютера. Далі — сказати, що натиснути, чи спитати, що вона бачить. На якийсь час ми всією командою стали контакт-центром, і зрештою люди навчились.
Але проблема не лише в інтерфейсі, є ще звички користувачів. Будьте готовими до того, що люди не читають підказки в боті. Приміром, у нас є АРІ по прогнозуванню прибуття міського транспорту (одна з найчастіше використовуваних категорій), і там треба вказати код зупинки. Люди вказували номер маршруту, назву вулиці — що завгодно, тільки не те, що треба. Якщо ви можете давати інформацію лише в певному форматі, юзерів треба вчити формувати запит.
Для зручності користувачів ми розробили нейронну мережу, яка дозволяє не йти послідовно по категоріях меню, а одразу отримати потрібну інформацію. Приміром, людина може після натискання кнопки «Старт» одразу запитати: «Хто обслуговує мій будинок?» — і нейромережа визначить тут збіг з категорією «Обслуговування будинків». У Telegram нейромережа працює добре, а от Facebook її не сприймає. Але я не можу вирішити проблему з кодом. Я відповідаю за загальний розвиток продукту, customer care і комунікацію, код і алгоритм — зона відповідальності СТО. І це важливий урок командної роботи: робити тільки ту роботу, в якій ти найкращий і ніхто інший цього зробити не зможе, інші задачі віддавай колегам, а найголовніше — довіряй їм.
Про мотивацію перед викликами
Справлятись з викликами допомагає спочатку азарт, а потім — розуміння, як багато зусиль вже вкладено в продукт. Зрештою починаєш просто розуміти, що це не перша і не остання проблемна ситуація, і хто її має вирішити. Проходиш п’ять стадій прийняття — і робиш.
Мотивує і розуміння цінності, яку отримають користувачі. Наприклад, окрім прогнозування руху громадського транспорту у нас є ще розклад руху. Він створює додаткову цінність. По-перше, користувач може планувати поїздки, особливо в незнайомі райони міста. У нас одні з найпопулярніших запитів — про перший і останній рейс. Це питають, наприклад, люди, яким треба на 7-8 ранку приїхати в якесь незвичне для них місце. Розклад руху дозволяє планувати таку поїздку, дає розуміння, чи доїдете ви громадським транспортом, чи доведеться викликати таксі.
По-друге, графік дозволяє юзерам формулювати обґрунтовані скарги. Якщо людина бачить у прогнозі, що в найближчі 20 хвилин її автобуса чи трамвая не буде, вона дивиться у графік і бачить, що з кінцевої він мав вже виїхати. Тоді можна зателефонувати в управління транспорту чи на гарячу лінію міста, і там вже не зможуть відповісти «нам треба з’ясувати графік», «ми перескеруємо ваше звернення» тощо.
Також часто допомагає спілкування, ком’юніті. Саме так було з графіком руху. Управління транспорту надало нам розклад руху транспорту в PDF-форматі. Близько 80 маршрутів, по кожному графік на будні й на вихідні. Отже, маємо 160 документів. Оцифрування затягнулось на місяць: продумати структуру бази, отримати PDF і зрозуміти, що воно так не виходить, переробити структуру…
Потім ми згадали це в розмові з розробниками з Львівавтодору, які відповідають за АРІ прогнозування прибуття, і вони кажуть: так у нас же є Центр керування рухом, там інша система, але хоча б є «ексельки». Правда, «екселька» у них на кожен виїзд у будні та вихідні дні — 160 PDF перетворилось на 1300 Excel-файлів. Але структура таблиць однакова. Тут вже наш розробник написав програму, яка, використовуючи код кінцевої зупинки як ключ, генерує один файл з усіма графіками руху, який ми публікуємо на порталі відкритих даних і використовуємо у себе в чатботі.
Поради новачкам
Тим, хто планує проєкт на основі відкритих даних, радимо думати не тільки про те, де взяти набір чи як його створити, але і про те, як ви будете підтримувати актуальність даних. Що буде, якщо зміниться структура даних, формат або їх розпорядник. Також треба думати, що ви будете робити, якщо хтось з команди піде. І не забувати про кінцевих споживачів! Ви вирішуєте проблему юзерів, і бажано, щоб це була актуальна проблема, а не придумана.
Нас добре спрямовували та структурували ментори інкубаційного етапу Open Data Challenge. Наприклад, десь до середини інкубації ми були свято переконані, що кошти на розвиток проєкту нам не потрібні, а найважливіше в цьому процесі — знання і нетворкінг. Це все дійсно важить немало, але в якийсь момент один з менторів відкрив нам очі на всі складові бюджетування проєкту. Коректне бюджетування забезпечує стійкість проєкту та його умовну незалежність від мінливості ентузіазму команди. Після того, підрахувавши всі потреби, ми усвідомили масштабність розвитку проєкту та переглянули своє ставлення до нього.
Ми дуже вдячні за фідбеки засновнику RailwayBot Антону Біблі та співзасновнику Chatbots.Studio Ігорю Лужанському. Вони скеровували нас порадами, коли було не до кінця зрозуміло, як рухатись далі технічно. Також круто, коли користувачі пишуть у технічну підтримку та діляться своїми ідеями, або ж навіть просто допомагають верифікувати дані.
Не бійтесь говорити про себе. Не бійтесь просити про допомогу. Можливо, хтось має для вас рішення, про яке ви не знаєте. Люди хочуть допомагати. Розповідаючи про свій запланований проєкт ще до конкурсу, ми знайшли нового розробника, коли старий здався на пів дорозі. І вже у такому складі ми подались на Open Data Challenge — у правильний час, з правильними людьми і правильною ідеєю. І перемогли. У найближчих планах — доповнити чатбот новими категоріями: по безпеці, охороні здоров'я, різними типами моніторингів, а також розширити наявні категорії — для прикладу, «Дозволи».
Цього року в Україні проводиться заключний, четвертий цикл Open Data Challenge з рекордним призовим фондом у 3,5 млн гривень від проєкту міжнародної технічної допомоги USAID/UK aid «Прозорість та підзвітність у державному управлінні та послугах/TAPAS». Заявки нових учасників приймаються до 25 березня через сайт конкурсу.