Итоги голосования для комментария:
Geometer
работая изначально с неверными данными, ты хоть тресни, но ты получишь неверный результат и неверные закономерности. твой метод — это всего-лишь математический (подозреваю даже статистический) метод и не более того.
(Медленно и печально). Хомяк, не статистический — не надо тыкать лапкой в бедное небо, оно грязное и так. Но ещё раз, аккуратно:
Когда мы проверяем конкретную гипотезу о наличии взаимосвязи между употреблением разных терминов нам, собственно, не нужна гарантия, что разные употребляющие будут одно и то же называть этим словом. То есть отдельно факт взаимосвязи употребления строго доказывается без общности явлений за ними.

На ролевом примере — например, можно доказать, что слова «рельсы» или «манчкин» чаще употребляются в отрицательном смысле — что тут, что на МРИ. При этом не надо чтобы за словами «рельсы» стояло одинаковое наполнение для всех участников (и по факту будет существенно разное, что уже не раз проверялось). Это будет частным фактом из области социальных наук, подтверждённым математически и надёжность которого можно оценить.

Эти данные не будут «неверными» от того, что у нас нет при этом строгой методики измерения «рельсовости» — она будет излишней для данной задачи. Это будут корректные данные — просто надо учитывать, что в этом случае будут ограничения у результата (корреляция не означает причинно-следственной связи и пр.), но на основании этого мы сможем делать подтверждённые выводы (например, что когда кто-то называет своего игрока «манчкином» на НРИ, он с хорошей надёжностью ругается).

Это всё ещё к тому же твоему примеру про «быстро» для тебя и бабушки. Что оно может означать физически разное, вовсе не мешает делать строгие выводы — просто в более узком спектре результатов. Если ты хочешь социальным наукам ставить принципиальную субъективность некоторых моментов (оценок) в вину — я хочу тебе показать, что в существенном числе способов твоя претензия мимо кассы, она вызвана во многом инерцией.
+ -