そう、よく言われるのは
サンプルデータは統計的自由度が1つ少ない
という説明(なんかモヤモヤするやつ)

自分の理解としては
そもそも分散の定義式自体に起因するというもの
母集団{m_i |1≦i≦N}からサンプル{x_i |1≦i≦n}を抽出するとして
母集団の分散σ^2=Σ(m_i-(Σm_j)/N)^2/Nを変形すれば
(Σ(m_i)^2/(NC1)-Σ_(i<j)m_im_j)/(NC2))×((N-1)/N)…[母]
となる(ここでNCrは二項係数)
同じように、サンプルの(通常の)分散を変形すれば
(Σ(x_i)^2/(nC1)-Σ_(i<j)x_ix_j)/(nC2))×((n-1)/n)…[サ]
となる([母]と全く同じ形)
さてサンプルに
m_iが選ばれている確率は(nC1/NC1)
m_im_jが選ばれている確率は(nC2/NC2)
なので[サ]の期待値を取れば
「[サ]の((n-1)/n)以外の部分」から
「[母]の((N-1)/N)以外の部分」がキレイに復元される
しかし、
この困った部分(n-1)/n は(N-1)/Nへ変換されない
ここの調整を先にサンプルの分散にn/(n-1)×(N-1)/Nを掛けて行っていると思える
ただ、通常Nはとても大きい数なので(N-1)/N≒1となり、普通はn/(n-1)のみ掛けて調整される

つまり分散の式が
("スケール共変"な良い部分) × (困った部分(N-1)/N)
という形の定義になっているのが原因と思える