こんばんは
HTML、テキストファイル、pdfファイルなどの英文のソースがあったときに、そこで使われている英単語を抽出してテキストファイルやExcelなどで英単語のリストを作りたいのですが、何かよい方法はあるでしょうか?少し調べてみたのですが、形態素解析などをすることになるのでしょうか?どなたか教えていただけると幸いです。
例えば、
「No other region has demonstrated the fragility of both human society and the international community more markedly than Africa.」
という英文があったとき、
Africa
and
demonstrate
has
other
region
…
のように単語を抽出してくれて、できればその意味も
Africa:アフリカ
and:そして
demonstrate:証明する
has:持つ
other:他の
region:地域
…
のようにできるととても助かります。
先ほども英作文の質問をしたばかりで大変恐縮なのですが、
もうひとつ質問があります。
入試問題で、空欄に共通の語を入れよという指示で、
Are you telling me just another ( )?
He doesn't look well. He should ( ) down.
という問題がありまして、ここはおそらくlie が入ると思うのですが、
このような問題に悩まされております。このように、同じつづりで、意味が複数あるものを教えていただけると助かります。
たとえば、
rest が「休憩」だったり、「残り」だったり、
mean が「意味する」だったり、「意地悪な」だったり、
rose が「バラの花」だったり、「あがる」の過去形だったり…
といった具合です。もしも、こういったものの例がまとまっているような本やサイトがありましたら、教えていただければと思います。あと、このような問題が出題される大学名がありましたら、練習を重ねたいので、教えていただければと思います。
NHKテレビ英会話講座より。接続詞・・・
It won't be long before you get well.
すぐに良くなられるでしょう。
(質問)
[before]は「~する前に」ですよね。私が直訳すると「あなたが良くなる前に長くはないでしょう。」何か変です。捕らえ方が間違っています。何故だか教えていただけませんか? 以上
「remain C」と「hold C」はどちらも「~のままである」という意味だと思いますが、
使い方やニュアンスに違いがあるのでしょうか?
TOEIC問題集で次のような空所補充問題がありました。
Although there was some trouble with the big budget for this project, it _______ the same.
選択肢に「held」と「remained」があるのですが、
正解は「remained」で、「held」は目的語が必要なので誤り と書かれていました。
何故、補語を取ってhold the same(同じ状態のままであった)としてはいけないのか、
お分かりの方いらっしゃいましたら教えてください。
オックスフォード大学の新聞記事から引用しました。以下の文章の「invented a joke Europanto, 」という部分が第4文型なのか第五文型なのかわかりません。私は「europanto」を目的語と考えて意味を捉えていましたが、はっきりしないのでわかる方教えてください。
A translation costs in the European Union spiral even higher, Diego Marani, a translator in the council of ministers, invented a joke Europanto, an amalgam of different European languages which is nevertheless comprehensible.
一応、私は以下のように訳してみました。
「ヨーロッパ連合議会の大臣通訳を務めるディエゴ・マルニは、ヨーロッパ連合における翻訳にかかる経費はさらに多く費やされているにもかかわらず、異なるヨーロッパ言語の混合でも理解可能な言語、ヨーロパント語というジョークを作り出した」