Лошадь "Тайфун" принесла своему владельцу на "Алтаргане" новый внедорожник
20:40
Знаменитый музей Арсеньева из Приморья пустил по рукам собственную библиотеку
19:50
В Улан-Удэ подростки взломали киоск, напились 15 литров пива и уснули на месте
18:53
Бурятский питомник поставляет саженцы в Монголию и Киргизию
18:20
Гранату времён Гражданской войны нашёл огородник в Бурятии
17:50
Ушёл из жизни ветеран бурятского здравоохранения Михаил Рябов
17:35
Бурятские огнеборцы — в числе лучших на Дальневосточном турнире
17:18
Водителей с опасными диагнозами лишили прав в Бурятии
17:00
Иркутяне бросились скупать бензин в Бурятии
16:43
Конь как драгоценность: мастера на "Алтаргане" представили шик конского убранства
16:41
Золотые медалисты олимпиады "Я — профессионал" получили стажировки в Сбере
16:20
В Бурятии завершают строительство Центра протезирования
16:00
Жители Бурятии могут проверить реальные выплаты страховой компании
15:54
В Бурятии раскрыта кража микроволновки из-за бытового конфликта
15:40
Смотреть обязательно: 28 фотографов из трёх стран показали душу Бурятии
15:38

Tele2 увеличила емкость платформы big data на 40% при помощи RT.DataLake

Благодаря расширению компания сократила зависимость от иностранного ПО
12 июля 2022, 11:05
Общество
Tele2 увеличила емкость платформы big data на 40% при помощи RT.DataLake предоставлено Tele2
Tele2 увеличила емкость платформы big data на 40% при помощи RT.DataLake
Фото: предоставлено Tele2
Нашли опечатку?
Ctrl+Enter

Tele2, российский оператор мобильной связи, успешно завершил расширение существующего кластера хранения и обработки больших данных за счет решения RT.DataLake. Общая емкость нового внедренного кластера Hadoop RT.DataLake составила 2,4 Пб. Это позволило на 40% нарастить полезную емкость платформы big data (6+) Tele2 и увеличить производительность для расчетов задач machine learning. Благодаря расширению компания сократила зависимость от иностранного ПО, получила возможность увеличивать вычислительные мощности и масштабировать текущее решение без ограничений.

Tele2 использует кластер Hadoop для хранения и аналитики данных с 2018 года. За это время в кластер интегрировано более 100 источников данных, а ежедневный объем интегрируемых данных достигает 100 Тб. Платформой big data ежедневно пользуются десятки бизнес— и технических команд, при этом основным внутренним клиентом является команда аналитики и монетизации данных. Нагрузка на кластер непрерывно росла, а свободное место уменьшалось. Сложные процессы интеграции данных затрудняли работу команды data scientists. В связи с этим компания решила разделить архитектуру платформы big data на сегмент обработки данных и сегмент data science.

Для расширения платформы big data Tele2 выбрала продукт RT.DataLake от "Ростелекома" на базе технологии Hadoop. Данное решение показало лучшие показатели по экономии бюджета и совокупной стоимости владения: расчет в рублях за лицензии исключает валютные и санкционные риски, а суммарная экономия за 5 лет составит более $3 млн. 

Сборка RT.DataLake является одним из самых современных коммерческих дистрибутивом Hadoop в мире — она состоит из самых "свежих" стабильных версий фреймворков и компонент. Это позволяет решить потребности инженеров данных и data scientists Tele2, которые крайне требовательно относятся к регулярному обновлению версий компонент в кластере. "Ростелеком" как вендор ПО показал готовность выполнить кастомизацию дистрибутива под нужды Tele2. Это дало возможность обеспечить необходимый набор используемых версий компонента Hadoop, реализовать добавление функционала в исходный код проекта и предоставить набор средств автоматизации развертывания и управления на базе технологии Ansible.

Tele2 надежно обеспечивает информационную безопасность и сохранность данных, постоянно проводя аудиты и совершенствуя методы их защиты. RT.DataLake не исключение. В решении реализовано разграничение доступа на базе технологии Ranger, внедрен протокол аутентификации Kerberos и выполнена интеграция с корпоративной службой Active Directory. Команда "Ростелекома" регулярно выпускает патчи обновления компонент и устранения угроз информационной безопасности.

Алексей Мартынов, директор по информационным технологиям Tele2:

"IT-cотрудники Tele2 расширяли кластер без привлечения подрядчиков. Большую помощь в этом процессе оказывала команда "Ростелекома", которая устраняла любые недостатки в дистрибутиве в считанные дни. Наша компания сократила зависимость от иностранного ПО, получила возможность масштабировать платформу big data Tele2 без ограничений и увеличивать вычислительные мощности". 

Антон Мерзляков, директор по аналитике больших данных Tele2:

"После расширения платформа big data Tele2 позволяет хранить 6,6 Пб данных, состоит из 126 вычислительных узлов суммарной мощностью 9000 ядер и 86 Тб оперативной памяти. Мощность расширенного кластера позволяет комфортно работать команде data scientists и решать самые высоконагруженные задачи. Мы уверенно смотрим в будущее и рассчитываем на полную реализацию наших планов по запуску продуктов на базе аналитики больших данных как для задач Tele2, так и обширного круга внешних клиентов и партнеров".

84655
48
5