Сохраняем и анализируем твиты с The Archivist
Как точно отметил Анатолий Вассерман "По плотности общения, по потоку информации, по ощущению близости Twitter – это пожалуй наилучшее сегодня приближение к телепатии". У многих из нас есть аккаунт в Twitter, мы чувствуем близость своих друзей, ловим потоки информации и порой запутываемся при действительно высокой плотности общения. Попробовать разобраться в динамике сообщений на конкретную тему, найти крупинки интересного из потока твитов, проанализировать упоминание бренда или имени поможет веб-сервис The Archivist – Save and analyze tweets.
Для работы с The Archivist с главной страницы вводим интересующий запрос и жмем кнопочку “Start Analysis”. Веб-сервис сообщает следующее: “Идет загрузка… Пожалуйста, проявите немного терпения. Мы ищем и индексируем подходящие по запросу твиты. Вы всегда можете наблюдать результы поиска войдя под своей учетной записью и сохранив запрос в своем профиле”.
Через несколько секунд перед нами появляется приборная доска со следующей информацией: количество твиттов в архиве (по вышеуказанному запросу было собрано 366 твиттов), время последнего обновления архива и визуализации данных, уровень доступа людей к архиву. В наличии имеются кнопки для сохранения данных и просмотра в Excel, загрузка файла формата ZIP и непонятная кнопка "Save this archive” (вроде бы все варианты сохранения уже перебрали). При этом в правом углу экрана сидит робот The Archivist с табличкой, напоминающей рекомендацию войти под своей учетной записью Twitter для сохранения и рекомендации результатов анализа своим друзьям.
Что же представляет собой анализ твитов от The Archivist? Это шесть методов визуализации данных, позволяющих осмыслить информацию “в личной манере и темпе осмысления, рассуждения и понимания. Визуально оформленные данные, в отличие от речи – это универсальный способ усваивать информацию, который позволяет читателю (или зрителю) легко контролировать этот процесс” (Эдвард Тафти, “Представление информации”, перевод Сергея Сурганова). В данном случае это линейный график, кольцевая, круговая и столбиковая диаграммы.
Линейный график отображает информацию о количестве твитов в день, кольцевая диаграмма повествует о пользователях, которые чаще всего пишут на интересующую нас тему. Круговая диаграмма показывает соотношение твитов и ретвитов или же клиенты для Twitter, которыми пользователи писали свои сообщения. В столбиковых диаграммах раскрывается информация о частоте употребления тех или иных слов в твитах нашего запроса.
Если уж вы последовали совету робота The Archivist и вошли под своей учетной записью, то теперь вам будет доступна возможность сохранения, а также сравнения нескольких запросов. Результаты можно сохранить в формат Excel. Сохранить в ZIP это получить тот же файл Excel, только в сжатом виде. "Save this archive” это сохранить полученные данные в рамках веб-сервиса. Видимо Архивист в дальнейшем позволит получать быстрый доступ к таким сохраненным результатам.
К недостатком The Archivist относится следующее: практически отсутствие в визуализациях интерактивности, неказистый вид и возможность сохранения всего лишь трех запросов по которым будут формироваться архивы и проводится анализ.
Надеюсь, вас заинтересовал The Archivist, а я пойду, добавлю в запрос название своего интернет-провайдера и через несколько дней расскажу какими словами кроют монополиста ЮТК какая получилась столбиковая диаграмма из ключевых слов. А какие запросы будете анализировать вы?
Собрать архив и провести анализ с The Archivist
Посмотреть архив и его анализ по запросу “LifeHacker.ru”
Источник:Lifehacker