КАК МЫ ПРИШЛИ В НАУКУ О БОЛЬШИХ ДАННЫХ
Big Data
Data Science – это наука о данных. Big Data – те самые данные, с которыми она работает.
4 сентября 2008 года журнал Nature – один из самых авторитетных научных журналов мира – опубликовал спецвыпуск Science in the Petabyte Era. Выпуск затрагивал тему взрывного роста информации: как справиться с тем объемом данных, который генерируется ежедневно?
Вычислительных мощностей не хватает – понадобятся новые технологии для хранения и анализа. Так понятие Big Data закрепилось в массах.
С чего мы начинали
Мы в это время только-только стали Zuzex. Молодые, амбициозные, жадные до всего нового, мы активно собирали команду и зачитывались научными статьями. Мы не целились в классическую ИТ-разработку – хотелось чего-то по-настоящему экспериментального. Уже в то время Big Data в наших глазах выглядела перспективной. Хотя до популяризации Data Science как науки оставалось минимум 2 года, мы поняли: это будущее.
Обработка данных без практического применения – бесполезное занятие. Кому нужны бессмысленные закономерности? Нужно выстраивать взаимосвязи с бизнесом. Но как понять, что нужно бизнесу?
И как переводить его требования в математическую плоскость? Правильно: создать математическую модель.
МАЙ 2008
МАЙ 2009
ИЮНЬ 2010
ИЮНЬ 2011
ИЮЛЬ 2012
Математический отдел
Так у нас появился математический отдел. В него вошли выпускники федерального университета – мы отобрали восемь человек на конкурсной основе. Основными инструментами на тот момент были Matlab и R.
Мы сталкивались с самыми разными вопросами и вместе с командой их решали. Невозможно построить модель, пока не готовы данные? Подключили аналитиков для сбора. Какие данные будут самыми эффективными? Очистили и упорядочили, чтобы выявить пригодность. Как правильно их обрабатывать? Добавили программистов для работы с базами. Чуть позже добавили дизайнера – понадобился для визуализации… Отдел рос, процесс увлекал нас с головой.
Data Science-отдел
Через несколько лет наш математический отдел трансформировался в Data Science-отдел и стал главным стратегическим направлением. Мы продолжали оттачивать наше умение моделировать, обрабатывать, извлекать и наглядно представлять полезные данные. И постоянно аккумулировали знания.
Освоили самые разные инструменты
Matlab
Статистический пакет
Hadoop
Технологии больших данных
R
Java
Python
Языки разработки ML-моделей и прототипов
MySQL
PostgreSQL
Классические БД
MongoDB
DynamoDB
Нереляционные решения
Непрерывно обучаемся и совершенствуемся
Следим за техническим прогрессом
Для моделей потребовался Machine Learning. Мы добавили специалистов по Data Science: они умели не только анализировать данные, но и строить на их основе модели. Так мы научились выстраивать модель машинного обучения под каждую конкретную задачу и проверять правильность работы с помощью тестирований.
Сегодня мы используем как классические подходы, так и алгоритмы и модели собственной разработки – одно дополняет другое. С помощью Data Science мы решаем две конкретные проблемы любого бизнеса. На внутреннем уровне – обращать убытки в прибыль. На внешнем – разрабатывать приложения с ИИ, которые легко монетизировать. Особенно востребованным оказалось применение AI и ML в ритейле и медицине.
СЕГОДНЯ
Искусственный интеллект
ИИ умеет больше, чем решать одну бизнес-задачу по сценарию. Мы знаем, на что он способен при правильном подходе. В этом весь фокус: мы не просто разбираемся в технологии, но умеем ее «подчинить», научить принципиально новому.
Мы в Zuzex любим эксперименты и часто разрабатываем внутренние проекты с использованием ИИ. Например, сурдопереводчик SignLab, созданный из чистого любопытства и неожиданно для нас ставший востребованным, – за технологией к нам приходят аэропорты, вокзалы и социальные организации.
Мобильное приложение цифрового макияжа, разработанное для бьюти-индустрии. Благодаря внедрению ИИ мы добились высокоточного распознавания черт лица и сохранили реалистичность текстур. Эффекты и текстуры – от атласных до матовых – выглядят именно так, как если бы были нанесены в реальности и сфотографированы.
Что происходит дальше:
Мы получаем запрос, обрабатываем его в течение 24 часов и связываемся по указанным вами e‑mail или телефону для уточнения деталей.
Подключаем аналитиков и разработчиков. Совместно они составляют проектное предложение с указанием объемов работ, сроков, стоимости и размера команды.
Договариваемся с вами о следующей встрече, чтобы согласовать предложение.
Когда все детали улажены, мы подписываем договор и сразу же приступаем к работе.





