В Калининграде прошла масштабная конференция об искусственном интеллекте и анализу данных в России AI Journey

Фото rugrad.eu

5 декабря в Калининграде, на площадке БФУ им. Канта прошла масштабная конференция – Artificial Intelligence Journey - Путешествие в мир искусственного интеллекта. По сути, это серия мероприятий, которые проходят в разных городах нашей страны по инициативе Сбербанка и компаний-партнеров и посвящены искусственному интеллекту и анализу данных в России. Открывая конференцию в Калининграде врио ректора БФУ им. Канта Александр Федоров обратился к присутствующим с просьбой: «Коллеги, придумайте уже что-то, чем можно пользоваться нам». Как оказалось, крупнейшие компании применяют модели AI с пользой для себя и для клиентов. RUGRAD.EU пересказывает несколько сюжетов Путешествия в мир искусственного интеллекта. 

 

Об AI по-русски сейчас говорят и пишут много, а будут – еще больше. В октябре президент России Владимир Путин утвердил национальную стратегию развития искусственного интеллекта, в ноябре этого года  был образован Консорциум по развитию искусственного интеллекта, куда вошли Сбербанк, Mail.Group, Газпромнефть, Яндекс и другие передовики цифровой трансформации. Ожидается, что в декабре правительство утвердит и перечень конкретных мероприятий по национальному проекту «Искусственный интеллект». 

d3e6054dd86b539d3e9fe59984f88165.jpg

Валерий Сохоров, заместитель министра цифровых технологий и связи Калининградской области на церемонии открытия AI Journey: «Искусственный интеллект очень важен, и его нужно внедрять в госсектор, чтобы сокращать количество ошибок».


Пока же конкретные примеры использования нейросетей в работе с персоналом, тысячами клиентов и при организации производства предоставляют крупнейшие российские компании. И решают они при этом задачи, соразмерные масштабу своего бизнеса. О некоторых из них рассказали эксперты, участники конференции AI Journey в Калининграде. 

«Нефтяная компания занимается сейчас всем: от анализа спутниковых снимков и данных из шахт для определения мест, где есть нефть, до обжарки кофейных зёрен на своих заправках. В компании работает 70 тыс. чел., и когда извне поступает предложение, к примеру, кто-то пишет, что произвел новый тип труб и было бы их интересно протестировать, то сложно найти эксперта, который мог бы оценить это предложение», – рассказал в своём выступлении представитель Научно-технического центра «Газпром нефти» Евгений Кирьянов. Чтобы соединить новые технологические документы с экспертами внутри корпорации, которые могли бы дать адекватную оценку новациям, НТЦ разработал систему когнитивного поиска. «Любая технология, которая поступает извне, падает в наш когнитивный поиск. И он понимает, про что это заявка, к какому направлению она относится, и ищет внутри компании тех людей, которые писали документы на эту тему, направляли поисковые запросы в нашу систему. И именно им эта платформа направляет запрос на проведение экспертизы. Наиболее квалифицированный эксперт уже дает результаты, финальный ответ партнерам. Это экономит огромное количество времени и делает процесс физически возможным», – рассказал Кирьянов.

Дмитрий Корнильцев, руководитель направления по исследованию данных Сбербанка, рассказал о модели, которая прогнозирует выручку всех зарегистрированных в России юридических лиц. Она позволяет банку понять масштаб бизнеса даже тех компаний и индивидуальных предпринимателей, которые вовсе никогда не сдавали отчетность. 


776c6499d0f8e584ae9740a20c46a33f.jpg


«Рынок описывается 8-10 млн компаниями, и только 20 % рынка сдает отчетность. Но невозможно планировать свою деятельность, не зная, сколько клиент может заработать. Нам интересно понимать весь рынок», – объяснил Корнильцев. Информация о масштабе бизнеса позволяет банку формировать «кошелек клиента», выявлять операционные и кредитные риски, в целом, стратегически планировать свою работу. Основным источником данных при этом становится собственная система работы с клиентами банка – корпоративный CRM. Это играет особенно важную роль, когда речь идёт о бизнесе из номинально серой зоны, то есть не предоставляющем отчетность. 

«И если вы спросите, как построить модель для них, я скажу – очень сложно. Потому что требовалось построить целевую модель для компаний, о которых в официальных источниках очень мало информации. Но – её много в CRM, вы видите цифру – 3 млрд трансакций, и эти данные о действиях клиентов собираются в системе. Мы взяли существующие компании, которые сдали отчетность, сделали их таргет и построили индивидуальные модели на основании транзакций, объемов из корпоративной СRM, и смогли предсказать выручку всех компаний рынка», – объяснил Дмитрий Корнильцев. 

На сессии вопросов и ответов калининградские участники дали понять, что скорее скептически относятся к достоверности оценки выручки отдельно взятой компании. Однако спикер заверил, что точность предсказания варьируется от размера компании, причем, если смотреть на сколь-либо обобщенные данные, то погрешность приближается к 1 %. 

7d34af15b04919a23c03511ad7624195.jpg


Для работы с большими массивами данных требуется соответствующая инфраструктура.  Причем чем сложнее модель, которую создают для решения конкретной задачи датасайентисты, тем сложнее процесс её обучения, тем больших ресурсов он требует. Одно из перспективных, как считают эксперты, направлений, является предоставление вычислительных мощностей в аренду российскому бизнесу, университетам и государственным институтам. 

«Мы проанализировали рынок и поняли, что в большинстве даже очень крупных компаний люди, которые занимаются DS, обучают свои модели на слабых вычислительных мощностях. И суть заключается в том, что есть большая гонка за данные в мире, за пресловутый Искусственный интеллект. И, к сожалению, Россия на данный момент отстает от западных и восточных коллег», – констатировал Отари Меликишвили, продукт менеджер AI Cloud и суперкомпьютера Christofari проекта SberCloud (кстати, сам – калининградец, в прошлом студент философского факультета калининградского университета).

Главный «актив» в этом процессе в России – суперкомпьютер Кристофари, о создании которого было заявлено в ноябре 2019 года. Как пояснил Меликишвили, в самом упрощенном виде суперкомьютер можно назвать огромным калькулятором, который способен выполнять около четырех квадриллионов операций в секунду. Такая мощность позволяет обучать модели искусственного интеллекта существенно быстрее, чем это происходит обычно в России. А значит, бизнес сможет быстрее зарабатывать на решениях, принятых с использованием моделей искусственного интеллекта. 

«Зачастую вычислительные мощности, которые использует бизнес, настолько малы, что обучение модели объемом 1 петабайт занимает месяц. А если ошибка?  Скорость проверки таких гипотез очень низкая. Мы разработали специальный сервис, который позволяет пройти мимо администрирования сервера, мимо сложных задач, связанных с развертыванием окружения и накаткой драйверов. Все что нужно будет сделать датасаейнтисту – загрузить данные в нашу хранилку, загрузить образ на своем ноутбуке и получить результат. В идеале мы стремимся к тому, чтобы модель можно было обучить в три клика», – презентовал Меликишвили сервис для обучения искусственного интеллекта. 

f0c27f6adcbe3d2de8e8129f06723397.jpg

По оценкам организаторов, конференция AI Journey в Калининграде собрала более 700 участников. 


Кроме того, на конференции рассказали о том, как в компании Mail.ru приблизились почти к стопроцентному распознаванию текста с помощью нейросети, но так и не научились правильно транскрибировать русскую речь, как в финансовых отделах крупных банков прогнозируют поведение конкурентов. Ознакомиться с видеоматериалами  Artificial Intelligence Journey можно на сайте конференции.


*Материал опубликован в рамках информационного партнерства