Архитектура для непрерывного извлечения знаний из социальных сетей


Просмотры: 154 / Загрузок PDF: 184

Авторы

  • А.Б. Мусина Казахский национальный университет им. аль-Фараби
  • С.С. Аубакиров Казахский национальный университет имени аль-Фараби
  • П. Триго Высший инженерный институт Лиссабона

DOI:

https://doi.org/10.32523/2616-7182/bulmathenu.2022/3.3

Ключевые слова:

Высоконагруженные системы, отказоустойчивость, масштабируемая архитектура, краулинг данных, Telegram

Аннотация

Социальные сети уже давно играют неотъемлемую роль в повседневной жизни людей. Вся наша жизнь в реальном мире фиксируется и в цифровом пространстве. Cоциальные медиа и взаимодействующие с ними сети стали местом огромных возможностей для анализа данных. Их влияние на повседневную жизнь охватывает такие разные области, как цифровой маркетинг, анализ общественного мнения, мониторинг политической ситуации и уведомления о стихийных бедствиях. Любая задача обработки такого большого потока данных нуждается в целостной архитектуре, которая будет соответствовать анализируемому ресурсу. В представленной работе мы поставили перед собой задачу создать высоконагруженную, отказоустойчивую, масштабируемую систему для извлечения и обработки данных из различных социальных сетей и анализа данных в реальном времени. Решением выступает архитектура в виде комплекса модулей. Модули имеют свои особенности в зависимости от выполняемой работы, от сбора текстовых данных до непосредственной обработки и извлечения знаний.

Загрузки

Опубликован

2022-09-30

Как цитировать

Мусина, А., Аубакиров, С., & Триго, П. (2022). Архитектура для непрерывного извлечения знаний из социальных сетей. Вестник Евразийского национального университета имени Л.Н. Гумилева. Серия Математика. Компьютерные науки. Механика, 140(3), 23–32. https://doi.org/10.32523/2616-7182/bulmathenu.2022/3.3

Выпуск

Раздел

Статьи