12月≪ 2007年01月 ≫02月

12345678910111213141516171819202122232425262728293031
2007.01/23(Tue)

Logovistaファイル翻訳の限界

LogoVistaのファイル翻訳で1万を超えるファイルを指定しても、やはり200数十個でエラーが生じるようだ。問題なのは、その後「中止」ボタンを押しても「エラー:出力ファイルが作成できませんでした」と表示されて、キーもマウスも受け付けなくなること。タスクマネージャーで殺すしかない。

マニュアルにはファイル数の制限は書いていないので、これはどうかと思う。少々がっくりきた。10000/200=50回もやるのでは省力化になっていない。
------

ここまで書いてから、LogoVistaにクレームを送ることを考える。エラーメッセージ確認のため途中からのファイルを再度、一括翻訳したら、今度は2000ファイルほどを処理して、今も続行中。

エラーの再現性がない。なぜだろう? エラーが生じたファイルは再度翻訳させるとうまくいくので個別のファイルに原因があるとも思えないのだが。あとは最後まで処理が続くのを期待するのみ。
------------

たぶん、解決。どうも添付ファイルがあるメールをテキスト化しているのが引っかかっているようだ。
スポンサーサイト
16:09  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/23(Tue)

デパーティッド

映画デパーティッドを鑑賞。

departedが死者の意味だと初めて知った。ランダムハウスによると宗教用語で天国へ行ったことを暗示するらしい。ネイティブにはそれなりの含みがあるタイトルなのかもしれない。

韓国映画のリメイクということだが、もとは観ていない。
12:05  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/23(Tue)

LogoVistaのファイル翻訳

知子ファイルに登録してあった英文メールを表題付きテキストとして出力して、Perlスクリプトで切り分けて、複数のファイルにした。

1万個以上のファイルが作られた。

あとはLogoVistaのファイル一括翻訳で自動的に翻訳してもらおう・・・のはず。1万個のファイルがあるフォルダを指定して、実行。しかし、200数十個を翻訳した後でエラー。

ファイル翻訳は数の制限なく本当に翻訳可能なのか、たまたまおかしなファイルでエラーが出て止まったのか。ちょっと不安。
11:59  |  英語  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/23(Tue)

知子ファイルの切り分けスクリプト

知子の表題付きテキストを切り分けるPerlスクリプトを作成してみる。うまくいかない。表題の「表」という字が認識できないようだ。仕方がないので「題:」でケース開始を認識させる。

英語のメールばかりなので、日本語の「表題:」の箇所で完全に1メールが認識できる。

以下がスクリプト。しかし、最後の1メールはファイルがつくられないし、最初に作られるメールは空。いいかげんだが、切り分け対象はメーリングリストのメールで1ケースを失っても全然問題ないので、プログラミングにかける時間を惜しんでこのままにする。

英文のメールでは主語の「I」を小文字の「i」ですます横着なネイティブが多いのでついでにそこも変換することにしてある。
#---------------------------------------------------------------
# 知子表題付き標準形式テキストを切り出すための Perl スクリプト
#--------------------------------------------------------------
# 下の$INFILEに読み込むファイルを
# $OUTFILEに書き出すファイルを指定すること
#------------以下の2行を自分用に書き換える-------
print "--------------------------------------------\n";
print " 知子 タイトル付き標準形式を切り出すための Perl スクリプト \n";
print "-----------------------------------------\n";
print "入力ログファイルを後で指定します。\n";
print "\n";
print " スクリプトで指定する場合には".'$INFILE'."に読み込むファイル\n";
print "ファイルを".'$OUTFILE'."に書き込みファイルを指定すること\n";
print "---------------------------------------------\n";
#require "jcode.pl";
$Name_File="";
$NumT=0;
$Num=0;

print "知子 タイトル付き標準形式テキストを指定してください。\n";
print "リターンキーを押したときのデフォルトはc:\\tomoko.txtになります。\n";

$Name_File=<>;

if ($Name_File eq "\n")
{
$Name_File="C:\\tomoko.txt";
}

$INFILE=$Name_File; # 読み込みファイル

#---------------------------------------------------------------
open (IN,"$INFILE") or die ("入力ファイルが見つからない!");

#---------- 1ケースを抽出 -------
while ()
{
if (/題:/)#表題の表の文字がトラブル
{
$NumT=$NumT+1; # テキスト数+1を数える
$Num=$NumT-1; # 表示テキスト数
$OUTFILE="C:\\NET\\SPSSMailList\\each\\OUT"."$Num".'.txt'; # 書き出しファイル
# $OUTFILE="C:\\OUT"."$Num".'.txt'; # 書き出しファイル
$TITLE=$_; #タイトルを保持
open (OUT,">$OUTFILE");# 出力ファイル
print $Num;
print $_."\n";
if ($Num>0) # 最初のテキストは空なので出力しない
{
print OUT $Num."\t\n".$LOG."\n"; # テキストのファイル出力
}
$LOG='';
}
else # テキスト読み込み途中
{
if ($TITLE ne '')
{
$LOG=$TITLE."\n".$LOG.$_; # タイトルとテキストを結びつけて1つに
$TITLE='';
}
else
{
if ((/^i\s/) or (/\si\s/)) {s/i/I/};# 主語 Iが iのときの変換
$LOG=$LOG.$_; # テキストを結びつけて1つに
}
}#if
} #while
close OUT;
#------------------------- #終了 ----------------------------
print "処理終了"."\n";
close IN;
#-----------------------------------------------------------------------
print "ケース数="."$Num\n";
#最後の1ケースは出力されない。最初の1ケースは空
11:55  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/23(Tue)

ファイル翻訳形式

ファイルの一括翻訳をLogoVistaで行う。

しかし、こちらが希望する出力が得られないようだ。希望するのは
----------
英文
英文
英文

eibun
eibun
eibun
----------
のような出力。訳文をざっとみて興味がなければ読み飛ばし。
興味があったり、訳が変なら下の原文をみるという形。

しかし、ファイル翻訳では別のファイルに翻訳だけとか、英文と翻訳文が交互になる文、あるいは特殊なLogoVistaの対訳形式だけらしい。このあたりは是非改善して欲しいところだ。
11:45  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/23(Tue)

LogoVistaPRO

ファイルの一括翻訳ができるということなので、LogoVistaPRO2007を購入した。

前に持っていたLogoVistaはVer.3ぐらいだったので大昔のこと。

新しいのは翻訳メモリとかいろいろ機能豊富になっている。しかし、その分操作が難しく、複雑な感じ。

とりあえず、翻訳の王様の辞書をEXCELに落として、USER辞書としてLogoVistaに読み込ませる。

Can I ・・・? のような疑問文で助動詞「Can」が「缶」になってしまった。以前のバージョンでも見かけたような気がする。これをどうすれば上手く訳すように学習させられるのか。まだ不明。
11:41  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/21(Sun)

不都合な真実

映画「不都合な真実」を観てきた。

ゴア前副大統領が、温暖化防止に向けてこんなに精力的に活動していることに驚く。世界中で1000回以上の講演会をこなしており、東京でも講演会が行われていたという。

この映画で知らなかったことを数多く知る。案外、中国は環境問題に注意を払っている一方、アメリカがいかにいいかげんかを知ることができる。京都議定書に調印していない先進国はアメリカとオーストラリアだけというのも初めて知った。

映画というのは講演会よりも多くの人に訴えかけるよい手段だ。問題はこのような映画の存在を多くの人が知らないこと、国内で上映される映画館が少ないということだろう。
17:16  |  未分類  |  TB(2)  |  CM(0)  |  EDIT  |  Top↑
2007.01/18(Thu)

水中毒

アメリカの水飲み大会で女性が死亡したという記事を見かけた。水中毒によるという。はじめて見た単語なので調べてみる。

水を飲みすぎると生じるらしく、統合失調症との関連も触れられている。といっても水を飲みすぎると統合失調症になるというわけでもなく、統合失調症のひとつの症状のような扱い。

モデルはダイエットのため、一日に多量の水を飲むと言うし、脂肪を流し出すには水がよいのだと思いこんでいたが、単なる水とはいえ、飲み過ぎは危険らしい。
11:18  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/11(Thu)

大量文書を一括翻訳

翻訳ソフトLogoVistaに「大量文書を一括翻訳「ファイル翻訳」
複数のファイルを一括して翻訳できます」という記述を発見。

これなら要求が満たされそう。購入を考えることにした。
13:43  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/08(Mon)

翻訳ソフトの機能

結局、翻訳の自動化ができるソフトを見つけることはできなかった。唯一可能なのは翻訳の王様Linux版。これはコマンドラインの入力が可能なので、自動化するシステムを組んでいる人もいるようだ。

私と同じような要求を持つ人はいるようで、指定のディレクトリの複数ファイルを一括して翻訳してくれる機能があるソフトを探していた。しかし、ネットでそれを示唆してくれる人は現れなかった。

やって欲しいのは、指定した拡張子なり、ディレクトリの複数ファイルを翻訳して、「翻訳した日本語文章」+「オリジナルの英語文章」というひとつのファイルを作成すること。

日本語訳をざっとみて、興味・関心があれば読み、おかしなところがあればすぐに下のオリジナル英文までスクロールして確認すればよい。

翻訳ソフトの機能比較などを見ると五十歩百歩の翻訳精度を比較しているだけで、上記のような基本的な機能の有無は問題にされていない(そもそもほとんどに備わっていないのだが)。

翻訳ソフトが使えるかどうかは辞書次第。それなりに育てた辞書なら意味がわかる程度の文章は出してくれる。斜め読みと割り切って大量複数文書の翻訳に使いたいという要求はあるはずなのだが、メーカーはユーザーの求めているものがわかっていないのだろうか。

13:04  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/04(Thu)

翻訳自動化

調べていくと、どうも翻訳の王様でコマンドラインが使えるのはLinux版のようだ。WindowsでDOSを起動してなんとか読み込ませようとするがうまくいかない。

実行ファイルがたくさんあるのでどれがどれだかわからない。いくつか試してみるがうまくいかない。そもそもWindows版のコマンドラインのことをマニュアルに見つけることができない。

一方、Thunderbirdのメールは知子の情報に連続登録するために分割するプログラムを半年ほど前に自作していた。こちらはなんとかなりそう。

ちょっと暗雲がたれ込めてきた感じ。

翻訳の王様はバージョンアップも止まっているし、コマンドラインから翻訳が自動化できそうな別な翻訳ソフトを探すのが正解な気もしてきた。
19:28  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/04(Thu)

簡易翻訳

メーラーThunderbirdの受信メールを、1つずつ翻訳ソフトに入力して、翻訳したい。

といっても、メールは数千あるので手作業ではやってられない。

翻訳ソフトはIBMの翻訳の王様。こちらのソフトはコマンドラインでも動くようなので自動化できるかもしれない。あとはメールを上手く分解していくような作業が必要か。こちらにはPerlやRubyが使えそう。Rubyを勉強しなくては。
18:35  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
2007.01/04(Thu)

フリーダムチェア

フリーダムチェアはヘッドレストがついているのでDVD鑑賞には楽だが、他のチェアに比べると背中にバネの反発力を強く感じる。しかも、この強さは変えられないようだ。

後ろの背もたれ部分や座面は位置を変更できるし、ヘッドレストも簡単に変更できる。肘部分も位置を変えられる。こちらは多少癖があり、先端を持って持ち上げるようにするとロックが外れたようになって調整可能となる。他のチェアと調整の仕方が異なるので最初は肘位置を変えられないのかと思っていた。

このあたりはストレスレスチェアのヘッド位置の変更も同様で教えてもらわないと(あるいは説明書を読まないと)、スイッチ位置がわからない。説明しても変更できない人も結構いたりする。

フリーダムチェアは座ってみると、やはり、ワーキングチェアとしてのアーロンの評価は揺るがない。ただ、Thinkチェアもかなりよい。こちらはヘッドレストもついているのが魅力。

フリーダムチェアの欠点は背の反発力にバネを強く感じることと、バネ(?!)の音がギシギシと気になることがあることだろうか。

しかし、長時間のDVD鑑賞にヘッドレストがあるととっても楽なことを実感する。
17:43  |  未分類  |  TB(0)  |  CM(0)  |  EDIT  |  Top↑
 | BLOGTOP |