Сообщения

Сообщения за май, 2023

Простой кластерный анализ ЗАДАНИЕ 1

Изображение
  Простой кластерный анализ Для задания я взяла новости, которые посвящены женской группе BABYMONSTER.  Новости были взяты из разных источников, такие как  https://www.yesasia.ru,  https://kg-portal.ru.   Тексты разделились на 2 группы, первая группа это о самой поп-группе, кто участники, будут ли они популярны, будут ли они популярнее BLACKPINK, а вторая группа это мнение фанатов и новость, что будет новая группа. Разделение на такие группы обосновано, так как в основном тексты были одинаковыми и это показывает нам сам анализ.    При изменении уровня кластеризации количество групп не меняется.  Я думаю, это из-за довольно малого количества текстов и из-за однозначного распределения текстов на группы (смысловое различие одно и то же).

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №8. NETWORK-АНАЛИЗ

Изображение
  ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №8. NETWORK-АНАЛИЗ 1. Наиболее важные связи это серые, голубые и зеленые. Они встречаются чаще, чем остальные. Хорошо видно это на MDS. Там же заметно что доминирующий тип контента серые звездочки, так как они встречаются чаще и вмещают в себя все жанры музыки, которые не попали в основные. 2. Центральным элементом в NE является rock, он отмечен зеленым цветом и кружком. Но в MDS также центральны и все серые обозначения - other.  3. Моему восприятию больше удобна MDS, так как от нее не разбегаются глаза, как от того же NE, а correlations оказалась наиболее непонятной

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №7. ГРАФИЧЕСКИЙ АНАЛИЗ С КЛАСТЕРИЗАЦИЕЙ

Изображение
  ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №7. ГРАФИЧЕСКИЙ АНАЛИЗ С КЛАСТЕРИЗАЦИЕЙ   1. Результаты кластеризации и Image Grid отличаются. На мой взгляд, Image Grid выполнен логичнее и точнее. Там более понятен смысл разделения, нежели в кластеризации (по тому, что изображено на картинках). 2. Для анализа я выбрала альбомы музыкального исполнителя Lida. В Image Grid раздление на группы произошло по тому, что изображено на картинках: количество объектов, их размер, тип. В кластеризации принцип разделения не понятен. Картинки будто были выбраны в хаотичном порядке: нет разделения ни по цветовой гамме, ни по объектам. С классификацией Image Grid я согласен на 100%, она логична, понятна. Можно выделить конкретные признаки, по которым программа разделила на группы эти картинки.

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №6. ОБЪЕКТНО-ОРИЕНТИРОВАННЫЙ ГРАФИЧЕСКИЙ АНАЛИЗ

Изображение
  ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №6. ОБЪЕКТНО-ОРИЕНТИРОВАННЫЙ ГРАФИЧЕСКИЙ АНАЛИЗ 1 Между указанными моделями есть разница, например, первая модель более точно определила схожесть фото и поставила между фото с ногтями линию, а вторая модель, в свою очередь, поставила еще и фото человека в маске рядом с ними. Я придерживаюсь мнения, что первая модель лучше справляется с поставленной задачей. 2. Я брала различные фото, от коллажей до простых фото ногтей. На мой взгляд они не совсем правильно разделились, потому что, как мы видим на последней фотографии, фото коллажа поставили рядом с рисунком, а не с точно таким же коллажем слева, фото девушки не поставили рядом с человеком с мешком на голове. Я не очень согласна с такой формой разделения.

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №5. КАЧЕСТВЕННО-КОЛИЧЕСТВЕННЫЙ КОНТЕНТ-АНАЛИЗ

Изображение
  ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №5. КАЧЕСТВЕННО-КОЛИЧЕСТВЕННЫЙ КОНТЕНТ-АНАЛИЗ Для анализа, я взяла тесты про певицы Джису, а так же участница группы Blackpink.   Вывод: Оба текста содержат одну тему- соло Джису.  В первом тексте более точные формулировки: имя артиста, название компании, в которой она работает, в каком году выйдет соло и в какой группе находится исполнительница. Во втором тексте не так понятно, когда именно выйдет соло или из какой она группы. Первый текст точный, а второй свободный. В первом тексте есть предыстория группы, как она стала популярной, а потом уже идет новость о соло. Во втором тексте рассказывается именно про артистку и ее соло. Следовательно, у каждого подача разная.

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №4. АВТОМАТИЗИРОВАННЫЙ КОНТЕНТ-АНАЛИЗ

Изображение
  ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №4. АВТОМАТИЗИРОВАННЫЙ КОНТЕНТ-АНАЛИЗ Для анализа я взяла два текста, посвященные сериалу "Король и Шут". Вывод: Имена и Названия - то, что встречается в текстах больше всего. В первом тексте больше негативной окраски, поэтому категорию выбрала Негатив и, также, Имена, потому что там говорится про солиста группы и про его жену, ныне вдову.  Можно сделать вывод, что во втором тексте Имен встречается гораздо больше, чем слов какой либо другой категории, потому что и текст большой, и посвящен он съемкам, актерам, режиссерам, костюмерам и продюсерам. Названий достаточно и в том, и другом тексте, но во втором тексте, все-таки, их больше. 

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №3. РУЧНОЙ КОНТЕНТ-АНАЛИЗ

Изображение
 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №3. РУЧНОЙ КОНТЕНТ-АНАЛИЗ Для ручного контент-анализа я выбрала статьи о мероприятии "Met Gala" который уже прошел.  Второй текст больше по объёму и по проведённому анализу видно, что имен в нём больше, чем в первом тексте. Оба текста повествуют о мероприятии, о теме о событиях, о нарядах. В первом тексте больше имён, во втором больше упоминания брендов.

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №2. КЛАСТЕРНЫЙ АНАЛИЗ ИЗ ВНЕШНЕЙ БАЗЫ ДАННЫХ

Изображение
  ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №2. КЛАСТЕРНЫЙ АНАЛИЗ ИЗ ВНЕШНЕЙ БАЗЫ ДАННЫХ Для анализа взяла слово en-ru а) По анализу можно заметить, что все тексты связаны между собой, при чем по всему миру, а это значит, что en-ru  - треш (мусор), объединяет все сферы жизни, все континенты. б) Большинство пересечений и линий в Америке, Австралии, в сфере музыки, лайф, фильмов. Ведь во всех этих сферах можно найти мусор)), в нашем случае конкретно треш.