КАК МЫ ПРИШЛИ В НАУКУ О БОЛЬШИХ ДАННЫХ

Big Data

Data Science – это наука о данных. Big Data – те самые данные, с которыми она работает.

4 сентября 2008 года журнал Nature – один из самых авторитетных научных журналов мира – опубликовал спецвыпуск Science in the Petabyte Era. Выпуск затрагивал тему взрывного роста информации: как справиться с тем объемом данных, который генерируется ежедневно?

Вычислительных мощностей не хватает – понадобятся новые технологии для хранения и анализа. Так понятие Big Data закрепилось в массах.

Большие данные
Наука о данных
Искусственный интеллект
Машинное обучение

С чего мы начинали

Мы в это время только-только стали Zuzex. Молодые, амбициозные, жадные до всего нового, мы активно собирали команду и зачитывались научными статьями. Мы не целились в классическую ИТ-разработку – хотелось чего-то по-настоящему экспериментального. Уже в то время Big Data в наших глазах выглядела перспективной. Хотя до популяризации Data Science как науки оставалось минимум 2 года, мы поняли: это будущее.

Обработка данных без практического применения – бесполезное занятие. Кому нужны бессмысленные закономерности? Нужно выстраивать взаимосвязи с бизнесом. Но как понять, что нужно бизнесу?

И как переводить его требования в математическую плоскость? Правильно: создать математическую модель.

МАЙ 2008

МАЙ 2009

ИЮНЬ 2010

ИЮНЬ 2011

ИЮЛЬ 2012

Математический отдел

Так у нас появился математический отдел. В него вошли выпускники федерального университета – мы отобрали восемь человек на конкурсной основе. Основными инструментами на тот момент были Matlab и R.

Мы сталкивались с самыми разными вопросами и вместе с командой их решали. Невозможно построить модель, пока не готовы данные? Подключили аналитиков для сбора. Какие данные будут самыми эффективными? Очистили и упорядочили, чтобы выявить пригодность. Как правильно их обрабатывать? Добавили программистов для работы с базами. Чуть позже добавили дизайнера – понадобился для визуализации… Отдел рос, процесс увлекал нас с головой.

Data Science-отдел

Через несколько лет наш математический отдел трансформировался в Data Science-отдел и стал главным стратегическим направлением. Мы продолжали оттачивать наше умение моделировать, обрабатывать, извлекать и наглядно представлять полезные данные. И постоянно аккумулировали знания.

Освоили самые разные инструменты

Matlab

Статистический пакет

Hadoop

Технологии больших данных

R

Java

Python

Языки разработки ML-моделей и прототипов

MySQL

PostgreSQL

Классические БД

MongoDB

DynamoDB

Нереляционные решения

Непрерывно обучаемся и совершенствуемся

Следим за техническим прогрессом

Искусственный интеллект
Компьютерное зрение
NLP
Обработка видео- и аудиоданных
Построение моделей машинного обучения

Для моделей потребовался Machine Learning. Мы добавили специалистов по Data Science: они умели не только анализировать данные, но и строить на их основе модели. Так мы научились выстраивать модель машинного обучения под каждую конкретную задачу и проверять правильность работы с помощью тестирований.

Сегодня мы используем как классические подходы, так и алгоритмы и модели собственной разработки – одно дополняет другое. С помощью Data Science мы решаем две конкретные проблемы любого бизнеса. На внутреннем уровне – обращать убытки в прибыль. На внешнем – разрабатывать приложения с ИИ, которые легко монетизировать. Особенно востребованным оказалось применение AI и ML в ритейле и медицине.

СЕГОДНЯ

Искусственный интеллект

ИИ умеет больше, чем решать одну бизнес-задачу по сценарию. Мы знаем, на что он способен при правильном подходе. В этом весь фокус: мы не просто разбираемся в технологии, но умеем ее «подчинить», научить принципиально новому.

Мы в Zuzex любим эксперименты и часто разрабатываем внутренние проекты с использованием ИИ. Например, сурдопереводчик SignLab, созданный из чистого любопытства и неожиданно для нас ставший востребованным, – за технологией к нам приходят аэропорты, вокзалы и социальные организации.

Мобильное приложение цифрового макияжа, разработанное для бьюти-индустрии. Благодаря внедрению ИИ мы добились высокоточного распознавания черт лица и сохранили реалистичность текстур. Эффекты и текстуры – от атласных до матовых – выглядят именно так, как если бы были нанесены в реальности и сфотографированы.

Напишите нам

/ 5000

Что происходит дальше:

  • Мы получаем запрос, обрабатываем его в течение 24 часов и связываемся по указанным вами e‑mail или телефону для уточнения деталей.

  • Подключаем аналитиков и разработчиков. Совместно они составляют проектное предложение с указанием объемов работ, сроков, стоимости и размера команды.

  • Договариваемся с вами о следующей встрече, чтобы согласовать предложение.

  • Когда все детали улажены, мы подписываем договор и сразу же приступаем к работе.