Digital Whoigital

Ажиотаж и востребованность — это KOLESA Conf

Author: Zhan Qaiyr
12 апреля 2019
Первый день работы KOLESA Conf. Автор фото: Zhan Qaiyr для сайта bluescreen.kz

Друзья, блюскрин.кз будет по мере возможностей рассказывать вам о сегодняшней крупнейшей IT-конференции (если, конечно, автору не отдавят ноги в толкучке). В этом году организаторы обещают привезти на KOLESA Conf 40 спикеров от крупнейших IT-компаний Казахстана, Белоруссии и России. Место проведения — отель «Holiday Inn». Заявленные темы докладов: Data Science vs Data Analytics, управление продуктами и проектами, мобильная разработка и web-разработка. Вряд ли мы сможем хотя бы тезисно охватить все презентации, но попробуем рассказать о тех, в которых лично поприсутствовали.

Функциональное автоматическое веб-тестирование с помощью Codeception

Руководитель отдела автоматизации тестирования Kolesa Group Абылхайыр Ахет выступил с презентацией на тему функциональное автоматическое веб-тестирование с помощью Codeception. Было сказано о реализации тестов, паттернах, используемых Kolesa Group, о подготовке данных, оптимизации тестов, Best Practice.
Оказалось, что различные паттерны используют для «сокращения» кода и максимально удобной, быстрой загрузки. DI-Helpers помогает в нахождении данных. К примеру, в сценарии поиска жалобы нужно задать фэйковый IP и добавить «соль» — return данных.
Далее было показано само тестирование сайта. Ключевая мысль: 250-300 кейсов решают реализацию за 5-10 минут. Из интересного: в пятницу у тестировщиков Kolesa Group — творческий день, который посвящается автоматическим тестам.

Первый день работы KOLESA Conf. Автор фото: Zhan Qaiyr для сайта bluescreen.kz

Про Jaeger: как мы внедряли распределенную трассировку запросов

На конференции KOLESA Conf наблюдается полный аншлаг, если не сказать — давка. По означенной в заголовке теме выступает Амангелды Кадыл, Senior software engineer Kolesa Group. Интересно, что переход на микросервисы несет не только очевидные плюсы, но и скрытые вопросы. Одна из таких «заковык» – жизненный цикл запроса: трассировка запроса от балансировщика до микросервисов.
Выяснилось, что монолитная архитектура имеет следующие минусы:
1. сильная связанность;
2. сложность в изоляции компонента, а именно генерация фидов, что приводит к нерациональному расходу ресурсов;
3. трудность в понимании кода;
4. высокий порог входа;
А касательно трессировки используется структура span.
Сейчас у компании 50+ микросервисов, 15+ релизов в день.

О персонализации платных услуг с помощью DS и про предсказание покупательского поведения

Продолжаем бороться с волнами посетителей на конференции KOLESA Conf. Прошел доклад Дмитрия Казакова, Data Scientist и Дмитрия Комаровского, менеджера проекта Kolesa Group.
Для персонализированной работы с пользователями необходимо уметь правильно классифицировать и предсказывать их поведение. Если знать, что пользователь совершит в будущем, то можно показать максимально релевантное предложение, тем самым увеличив выгоду для всех сторон.
Итак, как же выбрать лучшую модель? По этой теме были представлены несколько следующих пунктов:
1. Accuracy — не лучший вариант,
2. не стоит привязываться к Threshold,
3. использовать PR AUC,
4. следить за полнотой (recall).
#kolesaconf

О персонализации платных услуг с помощью DS и про предсказание покупательского поведения. Автор фото: Zhan Qaiyr для сайта bluescreen.kz

Переиспользование бизнес-логики кросс-платформенно или кросс-продуктово…

На конференции KOLESA Conf нет ни одного признака того, что народ собирается расходиться, а ведь до 18:00 еще далеко…
От Strong Company выступает спикер Азамат Калмурзаев.

Strong создали собственную библиотеку Kelvin, который представляет из себя семейство подключаемых нативных библиотек для банковских мобильных приложений. Мотивом создания послужили риск больших финансовых и кадровых рисков, плюс кое-какие подводные камни в существующих «нативках». Процесс работы включал в себя альфа-стадию, нетривиальную часть и экспертизу. В основном, доклад был посвящен Kelvin Auth, который включает в себя модуль для авторизации в приложении 3 способами:
1. логин+пароль,
2. пасс-код,
3. биометрия (само собой).

Strong создали собственную библиотеку Kelvin. Автор фото: Zhan Qaiyr для сайта bluescreen.kz

Об архитектурах и технологиях, которые использует компания Kaspi.kz

Следующий доклад на конференции KOLESA Conf провел Утеев Фарид. Докладчик поделился опытом, как в целом справляться с проблемами в этом направлении. Были представлены шаблоны платежей, пользовательский интерфейс; как пример показан процесс оплаты коммунальных и мобильных услуг.

Сервис "Платежи" в приложении Kaspi.kz. Автор фото: Zhan Qaiyr для сайта bluescreen.kz
Сервис «Платежи» в приложении Kaspi.kz

О выводе продукта на соседний рынок на примере Avtoelon.kz

Виктор Кривенький, руководитель отделов интерфейсов и дизайна и Карина Быцина, руководитель Market.kz, рассказали о выводе продукта Avtoelon.kz на крупный соседний рынок ЦА. Международная экспансия Kolesa Group началась с запуска в Узбекистане с автоклассифайда Avtoelon.kz. Для этого были созданы и организованы:

  1. собственный CDN-сервер,
  2. административный офис в Ташкенте,
  3. местный приходящий бухгалтер + отдельная 1С
  4. локальное юрлицо ООО «Kolesa»,
  5. узбекоговорящие сотрудники для обслуживания клиентов.
О начале международной экспансии Kolesa Group, а точнее о выходе автоклассифайда в Узбекистан под названием Avtoelon.kz. Автор фото: Zhan Qaiyr для сайта bluescreen.kz

По словам докладчиков, компания уже достигла значительных показателей. В день, к примеру, подаётся около 500-600 заявок. Общая база объявлений в live-режиме достигает 12 000. Скачиваний на android — 165 000, на iOS — 20 000.
Спикеры отметили такую местную особенность как распространенность Telegram, в Узбекистане его используют даже как своеобразную визитку.

Коллаборативные фильтры

Алибек Малибаев, Machine Learning Engineer, выступил с докладом о сути коллаборативных фильтров и, в целом, других фильтраций. Например, контентная фильтрация, в которой, в основном излагается описание от продавца. Алибек рассказал и о векторных представлениях текста.

Были подняты такие темы, как получение вектора из текста, используя RNN модель, и использование косинусной или эвклидовой дистанции для поиска.

Рауан Курмет, Python-разработчик, объяснил, почему Kolesa Group используют TokuDB. Оказалось, что с его помощью достигается лучшая компрессия на быстрых, дорогих хранилищах, что конечно же, даёт возможность хранить больше данных на ограниченных ресурсах. А ещё он пишет в 2 раза меньше данных (продлевает жизнь SSD). Спикеры советуют всегда стремиться к поиску лучшего алгоритма, проводить при необходимости мозговой штурм, начинать с MVP (Минимальный жизнеспособный продукт — Прим. ред.), не забывать о ресурсах.

Алибек Малибаев, Machine Learning Engineer, выступил с докладом о сути коллаборативных фильтров. Автор фото: Zhan Qaiyr для сайта bluescreen.kz
Смотрите также