Бортинженер летающей тарелки (prijutme4ty) wrote in psy_pro,
Бортинженер летающей тарелки
prijutme4ty
psy_pro

Categories:

Сбор статистических данных по психологическим тестам

Сразу оговорюсь, что не являюсь профессиональным психологом и взглядом немного со стороны пытаюсь понять, есть ли проблема сбора статистических данные по психологическим тестам, и если есть - то предложить решение. Хотелось бы услышать, актуален ли вопрос вообще, можно ли его решать таким способом, и если нельзя, то какие именно непреодолимые сложности вы видите? Если проблема актуальна, то можно попробовать в обсуждении выработать понимание того, каким требованиям должна удовлетворять такая система сбора и обработки статистических данных по тестам? Или может быть проблема уже решена, а я один такой не смог "подобрать ключик" к яндексу? Текст получился немаленьким, поэтому .

Достаточно немаленький кусок психологии, насколько я понимаю, происходит от слова "статистика". Когда мы ищем корреляцию чего-то с чем-то, нам нужна немаленькая выборка, чтобы погрешности в ответе не делали результаты бесполезными и не говорящими ни о чём - это раз. Как и в любом эксперименте нужна контрольная группа, чтобы определить уровень нормы или "фонового шума". Однако, даже если нужно провести измерения по стандартной методике в целевой и контрольной группах, статистику(тем более подробную) фиг найдёшь. Это при том, что контрольную группу приходится опрашивать едва ли не для каждого эксперимента. Сами понимаете, что а)всех ломает делать это б)даже сделав это, у любого нормального лентяя либо стоит двойка по статистике, либо лениво опрашивать лишнюю сотню человек - и как следствие получаются не очень надёжные результаты. По стандартным тестам, разумеется рассчитаны нормы, а по самодельным тестам и опросам - надо их считать самостоятельно, хотя наверняка каждый отдельный вопрос уже был в других тестах(но конечные результаты тестов не несут в себе памяти об ответах на каждый конкретный вопрос)
Следовательно идея такова, что здорово было бы иметь гигантскую базу заполненных анкет по всем стандартным тестам. Причём не результатов тестов, а исходных данных(заполненные анкеты, рисунки, перепечатки развёрнутых ответов) - там где это возможно(да, рисунки, аудио и видео материалы, если они важны для результата теста, сложно положить в такую базу; их придётся заменять только конечными результатами). Лучше даже, если анкеты будут прикреплены к человеку(анонимность сохранить при этом вполне возможно), чтобы можно было смотреть как соотносятся друг с другом результаты по разным тестам.
Разумеется, это огромный труд (впрочем, его и так уже проделывают только не систематично). Разумеется, лучше бы хранить изменение статистики во времени и ввести в анкеты такие данные, как пол, страна проживания, состав семьи итд - чтобы общую статистику можно было фильтровать по нужным параметрам.
Разумеется, если этот проект целиком будет жить в интернете - выборка будет неполной(будут неохвачены люди, не живущие в нём, и большую долю будут иметь люди, любящие проходить тесты). Но что мешает психологам, опрашивающим необынтернеченных людей, вбивать результаты своих исследований в общую БД.
Разумеется, кто-то из психологов может заливать фэйковые данные, неправильно проводить или интерпретировать тесты. Но они это делают и сейчас, а возможности поймать их на этом нет. Если получится сделать такую базу данных, то в работах можно будет просто ссылаться на конкретные результаты вопросов - статьи будут более проверяемы (это как если бы к математической статье прикреплялись черновики со всеми промежуточными выкладками, а к результатам физических экспериментов - таблица, где записаны результаты каждого конкретного измерения, а не только итоговая величина). А людей, пишущие "липу" можно было бы, уличив в этом забанить.
В итоге появится возможность не только вносить данные на сайт, но и загружать оттуда анкеты, и тем самым упрощать исследования. Я уж не говорю о том, что можно будет попытаться математическими методами автоматизировать поиски парных корелляций параметров, группировать отдельные признаки в кластеры в пространстве всех признаков итд...
Или всё это уже есть?
Или всё это никому не нужно, а проблемы такой нет / нужно только некоторым учёным, коих слишком мало, а практикующим психологам - не за чем?
(зеркало в моём журнале: http://prijutme4ty.livejournal.com/197562.html)

upd: Вынесу из комментариев пару уточнений и примеров:
Profit для исследователей в том, что им не надо самостоятельно собирать данные для того, чтобы проверить некоторую свою гипотезу. Они берут уже полученные данные, выделяют интересующие их параметры и исследуют свою проблему. Когда хотят проверить, действительно ли этот эффект неслучаен - берут оттуда же контрольную группу, считают показатели и сравнивают результаты.
Я употребляю термин "контрольная группа" в том смысле, что это группа менее ограниченная, чем в эксперименте. Так, если проводится исследование коэффициента IQ музыкантов-афроамериканцев, то прежде чем сказать, что он низок или высок, необходимо сравнить его с чем-то. А значит, следует взять музыкантов всех "цветов", померить среднее значение IQ у них - и взять это значение, как точку отсчёта. На основании этого можно будет делать вывод о том, влияет ли цвет кожи на IQ, или влияет то, что они музыканты, или не влияет ни то, ни другое. Без такого сравнения мы можем лишь констатировать что-то про связь совокупности параметров чёрный+музыкант. В более сложных экспериментах мы без такой контрольной группы будем получать данные, которые не значат совсем ничего: будет либо размытие ответов, либо, наоборот, слишком узкая группа граждан, не представляющая отдельного интереса(беременные мамаши, предпочитающие pepsi кока-коле с уровнем достатка 500-600 у.е. и любимым цветом - зелёным)

upd 2:Поступило предложение переформулировать задачу как база для "быстрого пилотажа" или для экспресс-анализа гипотез для будущих исследований.
Есть много сомнений о возможности создать базу достаточного объёма для того, чтобы она могла найти хоть какое-либо применение. Также есть мысли, что социологам проще использовать эту идею.


uupd: Что-то похожее нашлось: http://virtualexs.ru/cgi-bin/exsurveys/about.cgi?sct=stat Оно по-крайней мере позволяет делать выборки по нескольким параметрам из уже проведённого теста. Т.е. внутри одного теста можно отследить все ответы людей, восстановить результаты чужого исследования.
Tags: вопрос, интернет, исследования, опросники, поиск информации, помощь зала
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 32 comments