Исследователи утверждают, что для определения в автоматическом режиме пола, возраста и целого набора психологических особенностей, характеризующих пользователя социальной сети, необходимым и достаточным будет доступ к истории его или её статусов, выставленных на страничке в Facebook.
Для чистоты выборки социологи предложили поучаствовать в исследовании тем из пользователей, чья история статусов насчитывает не менее тысячи печатных символов. Общеизвестно, что в качестве статуса пользователи соцсетей оставляют короткие сообщения, имеющие отношение к их настроению к определённый конкретный момент, описывающих планы на ближайшие отрезки времени либо же свои текущие дела. Причём экспертов интересовала скорее лексика, которая употреблялась в этих самых статусах, а не собственно содержание этих сообщений.
В итоге участие в проекте приняли около 135 тысяч пользователей Facebook, успевшие за отчётный период обновить свои статусы 10 миллионов раз. Всего в качестве данных для обработки, поступивших в датацентр, были использованы порядка 15 миллионов статусов.
Соотнеся данные, полученные по факту обработки лексики, превалирующей в собранных текстах, с анкетами, заполненными участниками исследования, специалисты пришли к выводу, что по одной только манере формулировать мысли в статус уже можно распознать не только пол, но и возраст человека.