07月≪ 2017年08月 ≫09月

12345678910111213141516171819202122232425262728293031
2016.08/04(Thu)

SPSSからSTATAへ変換

STATA Ver.14をインストール。

Ver.14からユニコード対応で日本語が表示できるという。
これでSPSSのデータセットをそのまま読めると喜んでいたら、世の中そんなに甘くなかった。

まず、SPSSは確かにSTATAファイルで保存できる。しかし、対応バージョンはVer.8まで。

保存してSTATAでみるとファイルができるが、日本語の変数名はVに数字付きに変更されており、
値ラベルは文字化けしている。

しかし、STATAにはSHIFT JISをUNI CODE変換できるらしい。

ということでSTATAのコマンドから
unicode encoding set "shift_JIS"
unicode translate ファイル名.dta
と入力。

ここではまりがちなミスは当該のファイルをSTATAに読み込んでいると変換できない。
ただ、STATAを立ち上げただけでファイルを開かずに上記のコマンドを入力しないといけない。

みてみると値ラベルは無事、日本語化されている。しかし、変数名はV付きの数字のまま。

変数が600個を超すと一つ一つ修正する気は起きない。そこで

1)STATAで変数一覧を出し、空白をタブに変換して、不要列を削除後Excelへ)

2)SPSSでファイル情報、変数一覧 コピーしてExcelへ。不要列削除

3)上記2つをExcelで対応するよう列に並べて確認

4)変換の必要のない変数(もともと英数半角文字)を削除

5)こうして、STATAのV番号とのSPSSの漢字変数名2列を作成

6)1列目に RENAME だけの列を作成

7)4列目に 「=A1 & B1 & C1」 の関数を作成して、下に関数貼り付けでコピーペースト
(必要なら半角空白" "を入れて変数名がくっつかないように)

8)4列目をSTATAのシンタックスに貼り付け(エディタにコピーしてからペーストが
安全か)

要は 「RENAME 元の変数名 新しい変数名」を必要分Excelで作成して
「RENAME V20 氏名」のような行を一気に実行しているだけ。

これでSPSSの日本語変数名のSTATAデータセットができた。
スポンサーサイト
17:41  |  STATA  |  TB(0)  |  CM(2)  |  EDIT  |  Top↑

●別の方法

CSVファイル経由での変換が簡単だと思います。
下記ブログに手順を書きました。参考にしてください。
http://trackback.blogsys.jp/livedoor/gha10771/1701482
のの | 2016.09.15(木) 11:38 | URL | コメント編集

ののさん。コメントありがとうございます。

ただ、ののさんの方法だと変数ラベル、値ラベル、欠損値などの情報がすべて失われてしまいます。変数が1000に近いデータを扱っているので、それらが揃ったSPSSファイルをすべてSTATAでやり直すのはとても労力を要します。

あと、利用しているのがSPSS V.15という古いバージョンなので
[SPSSでの作業] “エンコード(E):”からUnicode(UTF-8)を選択の
エンコードというのが見つけられませんでした。

何にせよ、SPSSでもSTATAでもよいのでもう少し簡単に変換する
方法を提供してくれるとよいですね。
 | 2016.09.15(木) 16:46 | URL | コメント編集

コメントを投稿する

URL
コメント
パスワード  編集・削除するのに必要
非公開  管理者だけにコメントを表示  (非公開コメント投稿可能)
 

▲PageTop

この記事のトラックバックURL

→http://derakun.blog74.fc2.com/tb.php/863-29ea3575
この記事にトラックバックする(FC2ブログユーザー)

この記事へのトラックバック

▲PageTop

 | BLOGTOP |