Почему управление данными жизненно важно для медиаиндустри. Читайте на Cossa.ru

07 февраля 2022, 14:05

Почему управление данными жизненно важно для медиаиндустри

Эффективное хранение и управление данными для медиакомпаний сегодня не менее важно, чем производство контента, причём уровень зависимости от качества IT-инфраструктуры будет только расти. Александр Малинин, глава представительства Seagate Technology в России, о перспективах и вызовах нового времени.

Почему управление данными жизненно важно для медиаиндустри

Объёмы данных, которые сегодня содержатся во всех мировых хранилищах, трудно себе представить. По оценке аналитического агентства IDC, к 2025 году количество информации достигнет 175 зеттабайтов (в каждом зеттабайте — 1 млрд терабайтов).

Что интересно, рост происходит нелинейно. У медиакомпаний он резко пошёл вверх ещё на заре «диджитализации» в 2010 году, когда перспективы перехода в цифровую среду стали предельно ясны. То же IDC оценивает ежегодное увеличение объёмов информации с 2010 по 2018 год в 43%. Сейчас рост замедлился, но всё равно цифры впечатляют: аналитики уверены, что в ближайшие несколько лет данных в медиасфере ежегодно будет становиться на 25% больше.

Эффективная и выгодная реклама с сервисом от МегаФона

Широкий выбор рекламных каналов, более 100 параметров по интересам, подробная аналитика и другие возможности уже ждут в Личном кабинете. А еще кешбэк 100% за запуск рекламы в первый месяц и еще 10% — каждый месяц.

Узнать больше >>

Реклама. ПАО «МегаФон». ИНН 7812014560. ОГРН 1027809169585. ERID LjN8K1P7y.

Откуда такие мощные потоки? Всё просто: растёт конкуренция, а вместе с ней и количество контента. Сегодня производить то же видео могут не только гиганты индустрии, но и блогеры или даже энтузиасты с несравнимо более скромными бюджетами. При этом разрешение продолжает увеличиваться.

Теперь даже смартфоны среднего класса позволяют снимать в 4К/60 fps, при этом одна минута занимает уже 720 Мб, а один час съёмки тянет на 43 Гб.

Как только станут доступнее устройства с 8К, медиа придётся снимать с ещё более высоким разрешением, и объёмы увеличатся вновь.

В крупных медиакомпаниях трафик не ограничивается объёмом контента

Практически каждый дистрибьютор медиа хочет знать максимум о своих клиентах, чтобы предвосхищать их ожидания и не вкладываться в заведомо неинтересные аудитории проекты. Здесь нет никакой магии — всего лишь система сбора и анализа статистических данных. Она же помогает создать рекомендации персонально для каждого клиента, при этом используя не теги или ранжирование по жанрам, актёрам и прочим объективным факторам, а так называемый userbased-подход. То есть вам будут рекомендовать фильмы, которые нравятся людям с аналогичными интересами и оценками просмотренных фильмов. Такие технологии работают лишь на основе больших данных, а большие данные — это снова место в хранилище.

Наконец, говоря о росте объёмов данных, нельзя не упомянуть перспективные форматы — дополненную и виртуальную реальность. Сейчас они находятся в зачаточном состоянии, но ещё пять лет назад найти контент в 4К было большой проблемой. С развитием метавселенных и прочих перспективных проектов в AR/VR медиакомпаниям придётся открывать для себя новый сегмент.

Иными словами, если медиакомпания планирует оставаться в трендах, количество генерируемой информации и дальше будет расти. Казалось бы, ну и что — нужно просто увеличить хранилище. Но это не совсем так.

С какими проблемами сталкиваются медиа сейчас

Многие известные медиа продолжают работать с инфраструктурой, которая долгое время оставалась актуальной, но сегодня практически не имеет будущего. Это разобщённые хранилища, локальное хранение отснятого материала и использование NAS-систем для безопасного создания резервных копий в центральном хранилище с последующей обработкой или архивацией.

Конечно, можно создать два одинаковых data-центра и дублировать информацию на них. Это минимизирует риски потери данных в случае форс-мажора, но потребуются значительные вложения денег в инфраструктуру. Причём уровень защищённости вряд ли изменится, да и новых возможностей в управлении данных тоже не появится.

Руководители таких медиа, разумеется, изучают опыт лидеров отрасли: Amazon, Netflix и других. Они прекрасно понимают разницу в подходе: компании, которые изначально были цифровыми, строили свою инфраструктуру на основе облачных решений. Соответственно сегодня они имеют возможность использовать самые современные способы управления данными, их защиты и дистрибуции.

Можно ли продолжать конкурировать с передовыми производителями контента, имея устаревшую инфраструктуру? Гипотетически да, но ваши позиции будут слабеть с каждым годом.

Что будет, если не менять классическую инфраструктуру

Появление (точнее, популяризация) потоковых сервисов изрядно перекроило всю систему потребления контента. Теперь не нужно ничего скачивать — быстрый мобильный интернет даёт возможность смотреть ролики, фильмы, стримы на смартфонах и планшетах. При использовании традиционной инфраструктуры проблема кодирования контента под разные платформы во время прямой трансляции будет довольно острой. Понадобятся мощный сервер и команда специалистов, способных настроить ПО. В противном случае вы просто не сможете гарантировать качественное, без сбоев и подвисаний, воспроизведение контента на мобильных устройствах.

Отдельно сто́ит выделить случаи резкого роста количества просмотров программ. Такие ключевые события, как открытие Олимпиады, горячая линия Президента или даже ЧП федерального масштаба вызывают резкий рост числа просмотров, с которым существующее «железо» может не справиться.

Как вариант можно иметь резервные мощности, но надо понимать, что по сути они бывают нужны в исключительных случаях, а это дополнительные вложения.

С виртуальными серверами все гораздо проще: здесь вы не выкупаете определённую мощность, а платите только за ту, что используете. Потребовалась дополнительная — подключили больше юнитов, прошёл пик — вернулись к базовому объёму ресурсов. Облака тем и хороши, что ресурсы легко масштабировать, а оплачивать нужно только тот объём, который вы реально используете.

Конечно, просто выделить бюджет и перенести все данные в облака — самое простое, но довольно дорогое и при этом не самое эффективное решение. Если говорить о больших объёмах данных, проблемы могут возникнуть уже на этапе их перемещения в облако. Например, перемещение всего 20 Тбайт данных со скоростью загрузки 100 Мбит/с займёт более 20 дней. Даже с гигабитной оптоволоконной услугой при условии, что средняя устойчивая скорость передачи данных составляет 800 Мбит/с, для загрузки тех же 20 Тбайт потребуется 2,5 дня.

Так что бездумно вкладываться в общедоступные облака тоже не стоит. Лучше всего для медиакомпаний подходят так называемые гибридные инфраструктуры, то есть комбинации частного и общедоступного облачных хранилищ. При этом для транспортировки информации можно использовать не сети, а физическое перемещение накопителей — например, со съёмочной площадки в data-центр. Многие протоколы подразумевают самошифрование накопителей. То есть, даже если диск будет утерян, доступа к имеющейся на нём информации посторонние не получат, следовательно, физическая транспортировка окажется вполне безопасной.

Как минимизировать риски и создать инфраструктуру, которая без проблем будет работать и в дальнейшем

В принципе схема действий более-менее понятна. Прежде всего следует осознать (и, если что, объяснить консервативному руководству), что от инвестиций в IT будет серьёзно зависеть доход. Если понимание есть, понадобятся план миграции в облако и выбор провайдера услуг.

«Переехать» в облако может оказаться непросто, так как расценки у сервис-провайдеров обычно сильно разнятся. У некоторых ценообразование настолько непрозрачное, что без подробных консультаций невозможно понять, во сколько обойдутся миграция и последующее использование хранилища. Ведь облачная инфраструктура на самом деле подразумевает большое количество услуг: администрирование, использование систем управления данными и так далее. Некоторые сервисы пропагандируют подход «хранение как услуга» — в этом случае подсчитать примерные расходы будет проще.

На выходе должна получиться гибкая структура, которая позволяет эффективно управлять данными, имеет высокий уровень защиты (как от вторжения извне, так и от банальных бытовых ЧП), поддерживает широкое использование статистики и персональных рекомендаций на её основе, а также легко масштабируется.

Производства качественного контента для успешной деятельности уже недостаточно. Современные технологии сделали его потребление гораздо удобнее, но в то же время они избаловали клиентов.

Если лет десять назад кто-то ещё довольно лояльно относился к фризам в фильмах и играх, сегодня это может стать причиной отказа от услуг дистрибьютора медиа. Аналогично и с системами рекомендаций: если персональные выдачи не будут максимально релевантны реальным интересам пользователя, интерес к контенту пропадёт, реальное время просмотра заметно снизится.

Источник фото на тизере: Guillaume Bourdages on Unsplash

Мнение редакции может не совпадать с мнением автора. Ваши статьи присылайте нам на 42@cossa.ru. А наши требования к ним — вот тут.

Телеграм Коссы — здесь самый быстрый диджитал и самые честные обсуждения: @cossaru

📬 Письма Коссы — рассылка о маркетинге и бизнесе в интернете. Раз в неделю, без инфошума: cossa.pulse.is

✉️✨
Письма Коссы — лаконичная рассылка для тех, кто ценит своё время: cossa.pulse.is