
Спикер: Петр Лукьянов

Интервьюер: Влад Киауне
Петр Лукьянов — сооснователь Silicon Valley Data Science company. В 2001-2008 гг. Петр был партнером Alloy Ventures.
Расскажите о себе и о своей компании.
В 2012 году я решил обсудить с исполнительными директорами и председателями компаний, связанных с данной сферой, все проблемы, с которыми они столкнулись. И я обнаружил шаблон. Снова и снова они повторяли мне о том, что Amazon убивает их, и что им необходимо найти способы конкурировать с ним: путем стратегических данных или иными способами. Компании не знали, что делать. Поэтому вместе с моими партнерами я основал компанию, которая помогает другим крупным предприятиям стать более зависимыми от данных, чтобы эти данные стали ядром их стратегии.
В основном, мы делаем две вещи: делаем так, что компании больше полагаются на информацию, и разрабатываем стратегические планы по е-консалтингу. Это почти продукт (двустороннее обслуживание). То, что мы им предоставляем, — это, во-первых, разработка данных (например, помогаем банку лучше понять его клиентов), затем мы переходим к следующему пункту, к проектировке данных. Другими словами, мы разрабатываем непосредственные алгоритмы для будущего информационного анализа. Ну, и заключающим шагом становится разработка компанией своего программного обеспечения. Мы и в этом им тоже помогаем.
За всю историю человечества, самое большое количество данных было собрано в течение последней пары лет
Что произошло в сфере больших данных за последние годы?
За всю историю человечества, самое большое количество данных было собрано в течение последней пары лет! Поэтому, по сути, в эти два года мы могли наблюдать переход от неструктурированной информации к структурированной. Примерами таких «упорядоченных данных» могут служить базы данных Excel или Oracle. Неструктурированные данные — это Twitter, Facebook, данные датчиков или видео. Мы обращаемся к этим новым технологиям и пытаемся понять, как их можно использовать для нужд компаний.

Это изображение было создано на языке визуального программирования Pure Data/ иллюстрация: hellocatfood / Flickr.com
Представителей каких профессий вы нанимаете в свою компанию?
У нас есть архитекторы ИТ-решений, технические специалисты и data scientists (они составляют очень обширную сферу — это и математика, и статистика).
Как вы оцениваете работу Яндекса в данной области?
Яндекс — одна из ведущих компаний в этой сфере. Но они создают продукт для самих себя.
Какие примеры использования больших данных вы находите наиболее впечатляющими или актуальными для нашего времени?
Мой первый пример — это сельское хозяйство, где, наряду со всеми другими вещам, используются и дроны для собирания данных. Анализ этой информации позволяет фермерам знать наверняка, какое количество пестицидов им потребуется, как много воды нужно для полива и нужно ли им увеличить или уменьшить свои запасы. Второй пример — выборы в США, когда Обама обошел Ромни. Кампания Барака Обамы использовала большие данные. После этого случая большие данные стали еще более интересными для мира.

Связи между пользователями твиттера, которые затвитили слово ‘occupywallstreet' до 15 ноября 2011 года. Связи формируются, когда пользователи отвечают, упоминают или подписываются друг на друга. Ответы и упоминания отмечены синим, подписки — серым. Все изображенные данные относятся к промежутку времени в 26 минут / Иллюстрация: marc_smith / Flickr.com
Кто наиболее успешен в этой области? Стартапы или большие компании?
Я думаю, что и те, и другие. Стартапы умеют воспользоваться удобным случаем, но если большие компании не будут прибегать к помощи больших данных, они проиграют. Поэтому они развивают это направление. Наступление эпохи больших данных так же важно, как появление Сети. Но большие данные будет иметь более глобальный эффект.
Наступление эпохи больших данных так же важно, как появление Интернета
Какие трудности вы наблюдаете в данной сфере на сегодняшний день?
Нехватка таланта. Мы наблюдаем эту картину и в США, и вообще во всем мире.
Даже в Силиконовой долине наблюдается резкая нехватка специалистов. Я бы сказал, что нам не хватает миллиона профессионалов. Именно поэтому у России большое преимущество.
Какими средствами вы пользуетесь, чтобы идти в ногу со временем?
Я много читаю. Также я сижу на LinkedIn, TechCrunch и читаю кучу блогов.
Как вам кажется, каково положение России в данной сфере?
Ну, мне кажется, ваша страна преуспевала бы гораздо сильнее, будь условия да и вся атмосфера более благоприятной. Я думаю, что вы упускаете свою возможность в каком-то смысле. Но так или иначе российские ученые — одни из лучших в анализе данных.