ANV形式のファイルについて

ANOVA4 on the Web
Copyright (c) 2002 Kiriki Kenshi

　ＡＮＶファイルの形式について

　ＡＮＯＶＡ４のデータファイルは、通常のテキストファイルです。したがって、形式さえ守られていればデータをワープロやエディタで作成したり、あるいは表計算ソフトやデータベース・ソフトとデータを相互に交換することも可能です。以下では、ＡＮＶファイルの形式（ＡＮＶ形式）について説明します。

　ＡＮＶ形式のファイルは、ヘッダー部（９行）と、それに続くデータ部から構成されます。

　

　〔ヘッダー部〕

　ヘッダー部には、分析についてのコメントと要因計画を記述します。これらは、

コメント（第１行）

各要因の名前（第２行～第５行）

要因数、被験者間要因の数、被験者内要因の数（第６行）

各要因の水準数（第７行）

被験者数が等しいかどうかを示すフラグ（第８行）
および各セルの被験者数（第９行）

　となっています。

　→ ANVファイルの記述方法

　〔データ部〕

　データ部には、分析に用いる数値を分離記号（カンマ）で区切って記述します。この際に、１ケース（１被験者分）が１行になるようにすると分かりやすいでしょう。
　データは、縦方向に各被験者のケースを被験者間要因の配列にしたがって順に並べ、横方向には１被験者のデータを被験者内要因の配列にしたがって並べます。これらは、他の統計パッケージで一般に使用されている形式ですので、下の例をみれば簡単に理解できるでしょう。
　データ部のデータ数が、要因計画で必要とする数より少なければ、分析の際にエラーが発生します（結果が表示されません）。逆に多すぎる場合には余分な数値は無視されます。

　→ ANVファイルの記述方法

　《ANVファイルの記述例》

　以下では、実際のＡＮＶ形式ファイルの内容の例を示します。このデータは「データ解析テクニカルブック」(p.141) より引用したもので、要因計画は次のようになっています。

要因数＝３、そのうち被験者間要因＝２、被験者内要因＝１。
各要因の水準数は、要因Ａ（被験者間）＝２，要因Ｂ（被験者間）＝２，
要因Ｃ（被験者内）＝３。
各セルの被験者数は異なっており、それぞれ、[A1B1]＝5, [A1B2]＝4,
[A2B1]＝3, [A2B2]＝4となっている。

　つまり、２×２×３の要因計画で、要因Ａ、Ｂが被験者間要因、要因Ｃが被験者内要因となっています。これらのデータは以下のように記述されます。

　→ 実際のＡＮＶファイル

	〔ANVファイルの内容〕	〔説明〕
ヘッダー部	記憶方略の発達的研究（実験１）	コメント
	年齢	要因Ａの名前
	性	要因Ｂの名前
	課題	要因Ｃの名前
	（改行のみ）	要因Ｄの名前
	3, 2, 1	全要因数，被験者間，被験者内
	2, 2, 3	水準数（Ａ，Ｂ，Ｃ，Ｄ）
	0	被験者（１：等しい、０：異なる）
	5, 4, 3, 4	各セルの被験者数
データ部	2, 5, 9	S1	[A1B1]セルのデータ
	6, 7, 10	S2
	5, 9, 13	S3
	7, 9, 14	S4
	5, 7, 11	S5
	6, 3, 6	S1	[A1B2]セルのデータ
	6, 6, 7	S2
	8, 5, 5	S3
	10, 8, 6	S4
	1, 2, 1	S1	[A2B1]セルのデータ
	2, 1, 5	S2
	5, 4, 3	S3
	5, 5, 5	S1	[A2B2]セルのデータ
	3, 6, 5	S2
	4, 6, 9	S3
	6, 7, 7	S4
	↑データはC1, C2, C3の順

　〔ANVファイルの記述方法〕

コメント：分析についてのメモを書き込みます。内容は自由ですので、データの名前や分析についての簡単な説明などを覚書として入力しておきます。半角文字で１２６文字（全角６３文字）まで有効です。半角文字と全角文字を混在させると表示が乱れることがあります（いずれ改善する予定です）。
要因の名前：半角２０字（全角１０字）まで有効です。ただし、分散分析表に出力できるのは半角１４字（全角７字）までとなります。必ず、要因Ａから要因Ｄまでの４行分を確保しておかなければなりません。分析に使用しない要因は、改行のみを入れておきます。

　要因の並びは、被験者間要因→被験者内要因の順に要因Ａ、要因Ｂ、要因Ｃ、要因Ｄと解釈されます。被験者内要因を被験者間要因より前に置くことはできませんので注意してください。
要因の数：全要因数，被験者間要因の数，被験者内要因の数を順にカンマで区切って記述します。当然、全要因数は［被験者間要因の数＋被験者内要因の数] でなければなりません。
水準数：各要因の水準数を要因Ａ，要因Ｂ，要因Ｃ，要因Ｄの順にカンマで区切って記述します。分析に使用しない要因の水準数は記述してはいけません。例えば、１要因（４水準）の場合は、4のみ、２要因（２×３水準）の場合は、2, 3と記述します。
被験者：各セルの被験者数が「等しい」場合は１を、「異なる」場合は０を記述します。
各セルの被験者数：被験者間要因を組合せたセルについて、それぞれの被験者数をカンマ区切りで記述します。被験者数が「等しい」場合にも、すべてのセルの被験者数を記述しなければなりません（10, 10, 10, 10のように）。
　記述の順序は、要因Ａ(1…p)→要因Ｂ(1…q)→要因Ｃ(1…r)→要因Ｄ(1…s) の順に水準を１つずつ組合せていったものになります。例えば、

被験者間要因が２つで、要因Ａ（２水準）、要因Ｂ（２水準）の場合は、

[A1B1]，[A1B2]，[A2B1]，[A2B2]

の順になります。（例： 5, 4, 3, 4）

被験者間要因が３つで、要因Ａ（２水準）、要因Ｂ（２水準）、要因Ｃ（３水準）の場合は、

[A1B1C1]， [A1B1C2]， [A1B1C3]， [A1B2C1] ， [A1B2C2]， [A1B2C3]， [A2B1C1]， [A2B1C2]， [A2B1C3]， [A2B2C1]， [A2B2C2]， [A2B2C3]

の順になります。（例： 12, 13, 10, 8, 17, 15, 19, 20, 11, 14, 12, 20）
データ：１行に１被験者分のデータをカンマ区切りで記述します。つまり、被験者内要因の各水準のデータが横に並ぶことになります。例えば、要因Ｃ（３水準）が被験者内要因の場合は、[C1], ][C2], [C3] の順にデータを記述します。また、要因Ｃ（２水準）、要因Ｄ（２水準）が被験者内要因の場合は、[C1D1], [C1D2], [C2D1], [C2D2] の順になります。被験者内要因を使用しない場合（すべて被験者間要因の場合）は、１行に１個のデータを記述することになります。

各被験者のデータは、被験者間要因の組合せの順に上から並べていきます。順序は「６．各セルの被験者数」の例と同一です。例えば、[A1B1]セルの被験者１～ｎ1、[A1B2]セルの被験者１～ｎ2、…… [A2B2]セルの被験者１～ｎ4 のようになります。

　〔アドバイス〕

　「ANVファイルの記述方法」のうちアンダーラインの部分には十分ご注意ください。誤って記述するとエラーとなる（結果が表示されない）場合もありますが、エラーとならず異なった結果が表示されるケースも生じます。ANVファイルを使って分析する場合には、分析結果を注意深く吟味されることをお勧めします。

　上記以外に誤動作となりやすい事項をあげておきますので、参考にしてください。

行末にカンマをつけない
「要因数」「水準数」「各セルの被験者数」「データ」においてカンマ区切りの数値を記述する際に、行末にカンマをつけると（例： 2, 3, 4, ) その部分が０として解釈されてしまいます。
余分な改行を入れない
ヘッダー部、データ部ともに行の間に余分な改行を入れると、読み込みデータにズレが生じて正しく解釈されなくなります。

（例）	5,6,7,9,5 (改行） 2,4,7,5,9

　なお、ANOVA4 on the Webでは、要因計画の設定までをWeb上で行い、データだけを貼り付けて分析するモードを準備しました。初期画面から順に要因計画を設定していき、第３画面（design 3）で［データを直接書き込む］にチェックを入れて次へ進むと、データを書き込むテキストボックスがでますので、そこにANV形式でカンマ区切りのデータを入力してください（コピーしたものを貼り付けることもできます）。

　また、excel上で作成した表からデータを直接貼り付けることもできます。

→ Excelデータの貼り付け方

〔引用文献〕

桐木建始　1990　分散分析による平均値の差の検定法　森　敏昭・吉田寿夫（編）　データ解析テクニカルブック　北大路書房，Pp. 85-175．