정책과 프로그램을 평가하기 위한 '전통적'인 연구 설계는 비교 가능한 두 집단-실험집단과 통제집단-을 이용하여 실험을 하는 것이다. 이때 두 집단은 실험집단에게만 정책 ․ 프로그램이 집행된다는 점을 제외한 모든 면에서 동질적이어야 한다. 여기서 '동질적'의 의미는 두 집단의 전체 구성원들이 평균적인 의미에서 같다는 것이다. 즉 두 집단을 구성하는 개개인이 모두 완전히 같을 수는 없지만 전체적으로 보아 평균적인 측면에서 같다는 것이다. 두 집단을 동질적으로 구성하기 위해서는 연구대상이 되는 개인들을 두 집단에 무작위로 배정하여야 한다. 무작위로 배정한다는 것은 어떤 한 개인이 실험집단이나 통제집단에 배정될 기회가 동일하도록 하는 조건하에 이들 두 집단 가운데 어느 하나에 배정한다는 것을 의미한다.
특정 정책을 실험집단에게만 적용하고 일정한 시간이 흐른 후 실험집단과 통제집단을 비교하여 두 집단 간에 차이가 있는지를 주의 깊게 측정하고, 만약 두 집단 간에 차이가 있다면 이 차이가 그 정책으로 인한 것인지를 확인하려는 것이 이 연구 설계의 의도이다. 여기서 정책은 독립변수가 되고 실험집단에서 발생한 변화는 종속변수가 되며, 정책이 대상에 미친 효과를 파악할 수 있게 된다. 물론 이때 측정된 차이가 그 정책으로 인한 것인지 아니면 다른 변수의 작용에 의한 것인지를 확실히 하여야 한다. 따라서, 완벽한 실험이 되기 위해서는 다른 변수들을 '통제'하고 오직 독립변수의 영향만을 관찰할 수 있는 실험실에서 연구가 수행되는 것이 바람직하다. 사회현상에서는 이러한 실험실적 상황을 조성하는 것이 사실상 불가능하기 때문에 '진'실험설계의 조건을 완화한 '준'실험설계'로 대체하는 경우가 많다. 그러나 이러한 한계에도 불구하고 위의 방법들에 비해 실험설계를 통해 정책의 효과를 측정할 수 있는 가능성이 상대적으로 높기 때문에 사회과학자들은 이 방법을 적용하기 위해 노력한다. 아래에서는 다양한 '진'실험설계 방법에 대해 설명하도록 한다.
'진'실험설계의 대표적 형태는 '등가집단 사전-사후조사비교 실험설계 pretest posttest control group design이다(아래의 그림 참조).
[그림] 등가집단 사전-사후조사비교 실험설계