07月≪ 2017年08月 ≫09月

12345678910111213141516171819202122232425262728293031
2017.07/19(Wed)

SPSSのファイル結合2

SPSSのファイル結合で、同じIDを持つ2つのファイルを結合するとする。

2つのファイルが異なる変数でIDだけが同じなら、話は簡単でIDをソートしてから
「ファイル結合」「変数の追加」、キー変数は「ID」で終わり。

問題は、2つのファイルが同じ変数名を持っていたらどうなるか。

これは「ファイル結合」「変数の追加」、キー変数は「ID」と進んだときに
除外する変数と新しいアクティブファイルに入る変数が表示されるので
元の変数の内容を採用するなら(*)の変数をアクティブファイルの方に
いれ、追加するファイルの変数の内容を採用するなら(*)の変数を
アクティブファイルの方にいれればよい。
スポンサーサイト
17:02  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2017.07/06(Thu)

SPSSのファイル結合

SPSSにはファイル結合機能がある。

ケース結合と変数結合である。ケース結合はそのままケースが追加される。

問題は変数結合。もし、2つのファイルAとBが同じ変数をもっていて
その中身が違うとしたらどうなるだろう。

もともとのファイルAの中身が保存されるのか、結合するファイルBの中身が
上書きされるのか、あるいはファイルAとファイルBの中身が結合されて
しまうのか。

実験してみた。

結論から言えば、すでにある変数は警告表示が出て、後から結合できない。

いずれの変数内容を保存するか決めることができた。
16:23  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2016.07/19(Tue)

EZRとSPSS

ひさびさにRを更新してEZRをインストール。EZRはRコマンダーのようにRにGUIを
提供してくれる。

http://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/download.html

SPSSのファイルをインポートできるということで期待したのだが、ダメだった。
だが、SPSSファイルの変数名をすべて半角英数にして変数ラベルや値ラベルを
削除したら読み込めた。

STATAもSPSSファイルが読み込めることになっているが、果たして日本語に
どこまで対応しているだろうか。ともあれ、今日、発注。
18:23  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2016.07/15(Fri)

gretl

SPSSのクローンとしてGNUのPSPPがある。もうひとつ、やはりGNUのプロジェクトでSPSSクローンとして
gretlというのがあった。

こちらは主に経済分野に特化していて回帰分析などが優れているようだ。ダウンロードしてインストール
してみるが、全角対応していないのはPSPPと同じだった。残念。ただ、SPSSの拡張子「SAV」と互換
があるのはすばらしい。
16:36  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2016.07/15(Fri)

PSPPの翻訳エラー

PSPPはSPSSのクローンであり、GNUのフリーソフトである。最近、メニューの日本語化などが
進んで学生でも使いやすくなってきている。

しかし、おかしな翻訳もある。例えば、「変数ラベル」とすべきところが「ラベル」、「値ラベル」と
すべきところが「変数ラベル」になってしまっている。

一応、指摘するメールは送ったのだが、どこの誰に届いているのか届いていないのかも不明。
SPSSに慣れ親しんでいる人なら間違えない箇所とは思うのだが・・・。
16:33  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2016.07/15(Fri)

SPSSの変数一括変換

SPSSでは値ラベルや変数ラベル、欠損値はコピー、ペーストで一括設定できる。

しかし、変数名に関してはそれができない。

今回、PSPPでデータを扱うために変数名を変更する必要が生じた。PSPPはSPSSクローンだが、
メニューは日本語化されていても全角は基本扱えない。日本語を利用した変数名を英数字に
変えなくてはならない。

ところが変数の数が500を超えるとなると、手作業はやりたくない。

ネットで探して方法を見つけた。

まず、SPSSのメニュー「ファイル」から「データファイル情報の表示」を選んで、出力から変数名の
一覧を得ておく。

Excelで、1列目に「 ( 」を入力。これを500個下にコピーしておく。

次に得られた変数名の一覧を2列目に500個貼り付ける。

3列目に「 = Q」を500個作成。

4列目に1,2,,3・・・と連番の数字を作成。

5列目に「 ) 」を500個コピーして作成。

6列目の最初のセルに「 = A1 & B1 & C1 & D1 & E1」として文字列結合させる。それを数式コピーで下に500個作成。

こうして、
(日本語変数1 = Q1)
(日本語変数2 = Q2)
(日本語変数3 = Q3)
・・・
という文字列の列ができあがる。

あとはこれをコピーして、SPSSの「ファイル」「新規作成」「シンタックス」でシンタックスウインドウを開き、
RENAME VARIABLES
と入力。その後にコピーを貼り付け。最後にピリオド「 . 」を加えてシンタックスを実行。

完了。
16:29  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2015.07/27(Mon)

NAPとは

欠損値のコーディングで
DK=Don't know
NA=No answer
ではNAPは?

正解はNAP=Not applicable
これは回答者に質問がなされなかった項目のコーディング
16:57  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2014.11/21(Fri)

SPSS15.0とWindows7

Windows XPを長く利用していたが、さすがにそろそろまずいかと思い始めた。ちょうど電気店でWindows 7の最終販売のチラシもみて乗り換えすることにした。

いろいろ苦労や問題は多発したのだが、一番の問題はSPSS。Ver15.0でたくさんのオプションもつけていたので、簡単にバージョンアップというわけにはいかない。現在のSPSSはVer22.0でJavaで書き換えられた新版でWindows7はもちろんWindows8.1でも動く。何世代も前のSPSS Ver15.0はWindows7では動かない。なにぶん高価なソフトなので、すべてをXPの時のように揃えるとPC本体セットが何台も買える金額になってしまう。

他にも問題がある。新しいSPSSにすると香川大の堀啓造先生が作成したSPSS用のCATDAPマクロがエラーを出して動かないのだ。すでに亡くなられた堀先生が対応してくれるはずもなく、プログラムを直す能力もないので非常に便利な解析ソフトが使えなくなってしまう。

そこで何とかできないか検索したら、自分のこのブログに行き着いた。Windows 7でSPSS15.0を動かすという海外の書き込みを自分で書いているではないか。ずっとXPを使っていたので他人ごとで書いていたことが、今になって役立つとは。

それによればVista HOTFIXを当てるとよいらしい。ところが、これが見つからない。見つけても、そのWindowsでは適用できないというエラーが出る。

結局、このVista HOTFIXとはWindowsのパッチではなく、SPSSの方のパッチだと気がついた。探したところ、以下で発見。
http://www.strath.ac.uk/it/software/spss/spss-patches15/

SPSS 15 Vista HOTFIX (.exe)をダウンロードしてパッチを当てたら警告などがでたもののライセンス認証できて使えるようになった。まだすべての機能は試せていないが、とりあえず簡単な統計量で試すと問題なく動いている。

自分の書き込みに救われるのは、これが初めてではない。備忘録万歳といったところか。
18:31  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2013.05/08(Wed)

CATDAP Xのエラー

久々にSPSSのスクリプトでCATDAP Xを走らせたところエラーがでる。

データ数は1500程度なので,以前分析した数より少ない。心当たりがないので
メモリーエラーかとメモリ領域を増やしたりしたが効果なし。

最終的に,分かったことはCATDAPの方で使わない変数であってもSPSSのデータ
ファイルに文字列変数があるとエラーになるということ。

たぶん,最初に全データを行列化するのだろう。
01:51  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2011.09/11(Sun)

PrimMath

数値計算・グラフ Windows フリーソフト PrimMath

できることは作者のHPより以下に引用

取らぬタヌキのホームページ

複素数による四則演算と関数計算

乗算記号を省略でき、日本語の変数が使えます。特殊関数も豊富に用意してます。
線形/非線形方程式の解

方程式を満たす変数の値を求めます。連立方程式も解けます。
数式の最小化

数式の値を最小にする複数の変数の値を求めます。
微分、積分の計算

数式の微分値、積分値を計算します。
常微分方程式の解

陽関数として与えた常微分方程式を初期値からグラフとして描画します。
偏微分方程式の解

拡散方程式、波動方程式、ラプラス方程式を解き、データウィンドウに格納します。
行列、ベクトル計算

データウィンドウの値から行列計算、ベクトル計算を行います。
統計計算

データウィンドウの値から統計計算を行います。
重回帰分析

データウィンドウの値から線形/非線形の重回帰分析を行います。
クラスタリング

任意次元のデータウィンドウの値を指定個数に分類します。
2次元グラフ、3次元グラフの描画

陽関数として与えられた数式、あるいはデータウィンドウの値からグラフを描画します。
2次元グラフ、3次元グラフの解析

グラフの演算、計測、トレース、フィルタリング、微分、積分を実行します。
2次元領域グラフの描画

不等式で表した領域を2次元グラフに描画します。
2次元グラフのデータのモデル化

グラフの値から、任意の数式に最小二乗法で複数の変数の値を求めます。
2次元グラフのパワースペクトル

グラフの値からフーリエ変換を実行しパワースペクトルを描画します。
2次元グラフの相関

グラフの相関を計算して結果を描画します。
10億行、10億列の領域を持つ表計算

実際には、割当メモリ量から2000万個ほどのデータが限度です。
11:43  |  統計  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
 | BLOGTOP |  NEXT