Итоги голосования для комментария:
Dusha Пример со Шварцем понятен, но не очень понятно, что он иллюстрирует.

Я бы не говорил про оптимизацию в плане «выработали максимально эффективную стратегию в первый раз», действительно, если цифры заранее известны, то это простая задачка из линейного программирования.
Я имел в виду «обучение в процессе», которое актуально если похожие ситуации повторяются и есть место для ошибок.
В примере с осадой: каждый день партия даёт заявки по правилам даунтайма (паладин проповедует, гном копает) — которые обсчитываются довольно быстро (например — скиллчеки). И тут они видят результаты своих усилий и могут понять, что паладину лучше лечить, а не проповедовать.
Раз в несколько дней партия может сделать какое-то более длительное (в реальном времени действие) — отправиться на вылазку против катапульт, в канализацию, на сложный социальный энкаунтер в гор.совет и т.д. (Это может быть их собственная идея или «situation alert» от мастера, в особых случаях может потребоваться ещё и выбирать из нескольких вариантов). Эти ситуации «штучные» — там оптимизация менее применима, но информирование всё равно полезно.
Когда вы готовитесь заряжать катапульту чумными трупами, фидбэк от окружающих (от «Это омерзительно!» до «В прошлую войну тоже так делали») намекнёт, насколько изменятся ваши эффективность и праведность по результатам.

И вот тут выясняется, что самый «эффективный» путь необязательно самый фановый и зрелищный.
Так в этом же и смысл стимулирования.
Если вы хотите зрелищных путей, то давайте маленькие награды за эффективные но скучные действия, и большие награды за личный героизм и креативность.
Как только игроки поймут, что «тренировать нормальную кавалерию» даёт +1, а «посадить матросов на зебр для психической атаки» — целых +10 — фонтан идей забьёт со страшной силой.
Пример утрированный, но соотношение креатива/здравого смысла можно регулировать ))
+