ANOVA4 on the Web
Copyright (c) 2002 Kiriki Kenshi ANVファイルの形式について
ANOVA4のデータファイルは、通常のテキストファイルです。したがって、形式さえ守られていればデータをワープロやエディタで作成したり、あるいは表計算ソフトやデータベース・ソフトとデータを相互に交換することも可能です。以下では、ANVファイルの形式(ANV形式)について説明します。 ANV形式のファイルは、ヘッダー部(9行)と、それに続くデータ部から構成されます。
ヘッダー部には、分析についてのコメントと要因計画を記述します。これらは、
- コメント(第1行)
- 各要因の名前(第2行〜第5行)
- 要因数、被験者間要因の数、被験者内要因の数(第6行)
- 各要因の水準数(第7行)
- 被験者数が等しいかどうかを示すフラグ(第8行)
および各セルの被験者数(第9行)
となっています。
→ ANVファイルの記述方法
データ部には、分析に用いる数値を分離記号(カンマ)で区切って記述します。この際に、1ケース(1被験者分)が1行になるようにすると分かりやすいでしょう。
データは、縦方向に各被験者のケースを被験者間要因の配列にしたがって順に並べ、横方向には1被験者のデータを被験者内要因の配列にしたがって並べます。これらは、他の統計パッケージで一般に使用されている形式ですので、下の例をみれば簡単に理解できるでしょう。
データ部のデータ数が、要因計画で必要とする数より少なければ、分析の際にエラーが発生します(結果が表示されません)。逆に多すぎる場合には余分な数値は無視されます。
→ ANVファイルの記述方法
以下では、実際のANV形式ファイルの内容の例を示します。このデータは「データ解析テクニカルブック」(p.141)
より引用したもので、要因計画は次のようになっています。
- 要因数=3、そのうち被験者間要因=2、被験者内要因=1。
- 各要因の水準数は、要因A(被験者間)=2,要因B(被験者間)=2,
要因C(被験者内)=3。
- 各セルの被験者数は異なっており、それぞれ、[A1B1]=5, [A1B2]=4,
[A2B1]=3, [A2B2]=4となっている。
つまり、2×2×3の要因計画で、要因A、Bが被験者間要因、要因Cが被験者内要因となっています。これらのデータは以下のように記述されます。
→ 実際のANVファイル
|
〔ANVファイルの内容〕 |
〔説明〕 |
ヘッダー部 |
記憶方略の発達的研究(実験1) |
コメント |
年齢 |
要因Aの名前 |
性 |
要因Bの名前 |
課題 |
要因Cの名前 |
(改行のみ) |
要因Dの名前 |
3, 2, 1 |
全要因数,被験者間,被験者内 |
2, 2, 3 |
水準数
(A,B,C,D) |
0 |
被験者
(1:等しい、0:異なる) |
5, 4, 3, 4 |
各セルの被験者数 |
データ部 |
2, 5, 9 |
S1 |
[A1B1]セルのデータ |
6, 7, 10 |
S2 |
5, 9, 13 |
S3 |
7, 9, 14 |
S4 |
5, 7, 11 |
S5 |
6, 3, 6 |
S1 |
[A1B2]セルのデータ |
6, 6, 7 |
S2 |
8, 5, 5 |
S3 |
10, 8, 6 |
S4 |
1, 2, 1 |
S1 |
[A2B1]セルのデータ |
2, 1, 5 |
S2 |
5, 4, 3 |
S3 |
5, 5, 5 |
S1 |
[A2B2]セルのデータ |
3, 6, 5 |
S2 |
4, 6, 9 |
S3 |
6, 7, 7 |
S4 |
|
↑データはC1, C2, C3の順 |
|
- コメント:
分析についてのメモを書き込みます。内容は自由ですので、デー
タの名前や分析についての簡単な説明などを覚書として入力しておきます。半角文字で 126文字(全角63文字)まで有効です。半角文字と全角文字を混在させると表示が乱れることがあります(いずれ改善する予定です)。
- 要因の名前:
半角20字(全角10字)まで有効です。ただし、分散分析表に出力できるのは半角14字(全角7字)までとなります。必ず、要因Aから要因Dまでの4行分を確保しておかなければなりません。分析に使用しない要因は、改行のみを入れておきます。
要因の並びは、被験者間要因→被験者内要因の順に要因A、要因B、要因C、要因Dと解釈されます。被験者内要因を被験者間要因より前に置くことはできませんので注意してください。
- 要因の数:
全要因数,被験者間要因の数,被験者内要因の数を順にカンマで区切って記述します。当然、全要因数は[被験者間要因の数+被験者内要因の数]
でなければなりません。
- 水準数:
各要因の水準数を要因A,要因B,要因C,要因Dの順にカンマで区切って記述します。分析に使用しない要因の水準数は記述してはいけません。例えば、1要因(4水準)の場合は、4のみ、2要因(2×3水準)の場合は、2,
3と記述します。
- 被験者:
各セルの被験者数が「等しい」場合は1を、「異なる」場合は0を記述します。
- 各セルの被験者数:
被験者間要因を組合せたセルについて、それぞれの被験者数をカンマ区切りで記述します。被験者数が「等しい」場合にも、すべてのセルの被験者数を記述しなければなりません(10,
10, 10, 10のように)。
記述の順序は、要因A(1…p)→要因B(1…q)→要因C(1…r)→要因D(1…s)
の順に水準を1つずつ組合せていったものになります。例えば、
被験者間要因が2つで、要因A(2水準)、要因B(2水準)の場合は、
[A1B1],[A1B2],[A2B1],[A2B2]
の順になります。(例: 5, 4, 3, 4)
被験者間要因が3つで、要因A(2水準)、要因B(2水準)、要因C(3水準)の場合は、
[A1B1C1], [A1B1C2], [A1B1C3], [A1B2C1] , [A1B2C2], [A1B2C3], [A2B1C1], [A2B1C2], [A2B1C3], [A2B2C1], [A2B2C2], [A2B2C3]
の順になります。(例: 12, 13, 10, 8, 17, 15, 19, 20, 11, 14, 12,
20)
- データ:
1行に1被験者分のデータをカンマ区切りで記述します。つまり、被験者内要因の各水準のデータが横に並ぶことになります。例えば、要因C(3水準)が被験者内要因の場合は、[C1],
][C2], [C3]
の順にデータを記述します。また、要因C(2水準)、要因D(2水準)が被験者内要因の場合は、[C1D1],
[C1D2], [C2D1], [C2D2]
の順になります。被験者内要因を使用しない場合(すべて被験者間要因の場合)は、1行に1個のデータを記述することになります。
各被験者のデータは、被験者間要因の組合せの順に上から並べていきます。順序は「6.各セルの被験者数」の例と同一です。例えば、[A1B1]セルの被験者1〜n1、[A1B2]セルの被験者1〜n2、……
[A2B2]セルの被験者1〜n4
のようになります。
〔アドバイス〕
「ANVファイルの記述方法」のうちアンダーラインの部分には十分ご注意ください。誤って記述するとエラーとなる(結果が表示されない)場合もありますが、エラーとならず異なった結果が表示されるケースも生じます。ANVファイルを使って分析する場合には、分析結果を注意深く吟味されることをお勧めします。
上記以外に誤動作となりやすい事項をあげておきますので、参考にしてください。
- 行末にカンマをつけない
「要因数」「水準数」「各セルの被験者数」「データ」においてカンマ区切りの数値を記述する際に、行末にカンマをつけると(例:
2, 3, 4, )
その部分が0として解釈されてしまいます。
- 余分な改行を入れない
ヘッダー部、データ部ともに行の間に余分な改行を入れると、読み込みデータにズレが生じて正しく解釈されなくなります。
(例) |
5,6,7,9,5
(改行)
2,4,7,5,9 |
なお、ANOVA4 on the Webでは、要因計画の設定までをWeb上で行い、データだけを貼り付けて分析するモードを準備しました。初期画面から順に要因計画を設定していき、第3画面(design
3)で [ データを直接書き込む ]
にチェックを入れて次へ進むと、データを書き込むテキストボックスがでますので、そこにANV形式でカンマ区切りのデータを入力してください(コピーしたものを貼り付けることもできます)。
また、excel上で作成した表からデータを直接貼り付けることもできます。
→ Excelデータの貼り付け方
〔引用文献〕
桐木建始 1990 分散分析による平均値の差の検定法 森 敏昭・吉田寿夫(編) データ解析テクニカルブック 北大路書房,Pp.
85-175.
|
|