統計解析入門 with R: 負の二項分布

#負の二項分布（negative binomial distribution)
#負の二項分布はｎ回成功するまでに何回（x）失敗するかという確率です。
x<-0:20
y<-dnbinom(x,size=1,prob=0.5)
#成功する確率0.5で1回成功するまでに失敗した回数としてその回数が0回である確率、1回である確率、20回である確率までを計算して、それらをまとまてyに代入します。そして、xとyで作図します。
plot(x,y,ylim=c(0,0.5),xlim=c(0,20),type="o",col="gray50")
#ではこの図にnを増やした場合をかきたしていきます。
for(i in 1:6)
{points(x,dnbinom(x,size=1+i,prob=0.5),col=i)
lines(x,dnbinom(x,size=1+i,prob=0.5),col=i)}
#このように、負の二項分布は右側の裾野が大きく広がる左右非対称な分布です。
#けれども、ｎが大きくなるとだんだんと左右対称に近づきます。
plot(x,y,ylim=c(0,0.1),xlim=c(0,60),type="o",col="gray50")
for(i in 1:6)
{points(x,dnbinom(x,size=10+5*i,prob=0.5),col=i)
lines(x,dnbinom(x,size=10+5*i,prob=0.5),col=i)}
#今度はpの値が山の形にどのように影響を及ぼすかpの値を変えてみましょう。
x<-0:50
y<-dnbinom(x,size=5,prob=0.5)
plot(x,y,ylim=c(0,0.5),type="n")
for(i in 1:9)
{lines(x,dnbinom(x,size=5,prob=i*0.1),col=i)}
#このように、pが0に近いほど、左右対称に近づきます。
#また、nをおおきくしてみると
x<-0:500
y<-dnbinom(x,size=100,prob=0.5)
plot(x,y,ylim=c(0,0.15),type="n")
for(i in 1:9)
{lines(x,dnbinom(x,size=100,prob=i*0.1),col=i)}
#pに関わらず、nが大きいほど、左右対称であることもわかりますね。
#二項分布が二値に名義関数のデータで想定されることが多いのに対して負の二項分布やボアソン分布は個数や回数のデータで想定されることが多いです。
#比率や割合のようにデータが一つにまとめられることはありません。例えば、メスの産卵数のデータは50個のメスのデータで計算したら、50こあることになります。特に、データの右の裾野が大きい場合に、負の二項分布がよく想定されます。

Last modified: Thursday, 11 February 2021, 3:15 PM